CN114047923A - 错误代码定位方法、装置、存储介质以及电子设备 - Google Patents

错误代码定位方法、装置、存储介质以及电子设备 Download PDF

Info

Publication number
CN114047923A
CN114047923A CN202111358194.9A CN202111358194A CN114047923A CN 114047923 A CN114047923 A CN 114047923A CN 202111358194 A CN202111358194 A CN 202111358194A CN 114047923 A CN114047923 A CN 114047923A
Authority
CN
China
Prior art keywords
code
error
source code
information
executable file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111358194.9A
Other languages
English (en)
Inventor
吴世伟
韦保山
刘真
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
Original Assignee
Beijing ByteDance Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd filed Critical Beijing ByteDance Network Technology Co Ltd
Priority to CN202111358194.9A priority Critical patent/CN114047923A/zh
Publication of CN114047923A publication Critical patent/CN114047923A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/40Transformation of program code
    • G06F8/41Compilation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/40Transformation of program code
    • G06F8/41Compilation
    • G06F8/42Syntactic analysis
    • G06F8/425Lexical analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/40Transformation of program code
    • G06F8/41Compilation
    • G06F8/44Encoding
    • G06F8/447Target code generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/448Execution paradigms, e.g. implementations of programming paradigms
    • G06F9/4488Object-oriented
    • G06F9/449Object-oriented method invocation or resolution

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Stored Programmes (AREA)

Abstract

本公开涉及一种错误代码定位方法、装置、存储介质以及电子设备,涉及计算机技术领域,该定位方法包括:将编程语言的源代码编译为机器语言的可执行文件;在可执行文件出现运行时错误时,通过报错函数输出异常信息;响应于异常信息,获取报错函数的调用栈;根据调用栈,确定源代码的错误代码的位置信息。由此,可以实现直接将源代码编译为二进制的可执行文件的编译器的跨语言解释错误的运行时报错机制,并且可以精准定位错误代码的位置。

Description

错误代码定位方法、装置、存储介质以及电子设备
技术领域
本公开涉及计算机技术领域,具体地,涉及一种错误代码定位方法、装置、存储介质以及电子设备。
背景技术
相关技术中,Python编译器会将源代码翻译成字节码,Python虚拟机解释执行该字节码,当遭遇执行错误,Python虚拟机会进行异常抛出,从而定位错误代码。但是,当不使用虚拟机去执行时,就无法利用虚拟机来进行异常抛出,从而无法定位到错误代码。
发明内容
提供该发明内容部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该发明内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
第一方面,本公开提供一种错误代码定位方法,包括:
将编程语言的源代码编译为机器语言的可执行文件;
在所述可执行文件出现运行时错误时,通过报错函数输出异常信息;
响应于所述异常信息,获取所述报错函数的调用栈;
根据所述调用栈,确定所述源代码的错误代码的位置信息。
第二方面,本公开提供一种错误代码定位装置,包括:
编译模块,配置为将编程语言的源代码编译为机器语言的可执行文件;
报错模块,配置为在所述可执行文件出现运行时错误时,通过报错函数输出异常信息;
获取模块,配置为响应于所述异常信息,获取所述报错函数的调用栈;
确定模块,配置为根据所述调用栈,确定所述源代码的错误代码的位置信息。
第三方面,本公开提供一种计算机可读介质,其上存储有计算机程序,该程序被处理装置执行时实现第一方面所述方法的步骤。
第四方面,本公开提供一种电子设备,包括:
存储装置,其上存储有计算机程序;
处理装置,用于执行所述存储装置中的所述计算机程序,以实现第一方面所述方法的步骤。
基于上述技术方案,通过在将编程语言的源代码编译为机器语言的可执行文件的编译器中利用报错函数输出运行时错误的异常信息,并根据该报错函数的调用栈来确定错误代码的位置信息,可以实现直接将源代码编译为二进制的可执行文件的编译器的跨语言解释错误的运行时报错机制,并且可以精准定位错误代码的位置。
本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。在附图中:
图1是根据一示例性实施例提出的错误代码定位方法的流程示意图;
图2是根据一示例性实施例提出的异常抛出的原理示意图;
图3是图1所示的步骤140的具体流程示意图;
图4是根据一示例性实施例提出的将源代码转换为可执行文件的流程示意图;
图5是根据一示例性实施例提出的编译器的架构流程示意图;
图6是根据一示例性实施例提供一种错误代码定位装置的模块连接示意图;
图7是根据一示例性实施例提供一种电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
图1是根据一示例性实施例提出的错误代码定位方法的流程示意图。本实施例公开的错误代码定位方法可以通过电子设备执行,具体可以通错误代码定位装置来执行,该装置可以有软件和/或硬件的方式实现,配置于电子设备中。请参考图1,本公开实施例提供的错误代码定位方法可以包括以下步骤。
在步骤110中,将编程语言的源代码编译为机器语言的可执行文件。
这里,编程语言是指能够实现人与机器之间的交流的编写代码的语言,例如,编程语言可以是Python、C/C++等语言。机器语言是指机器能够直接识别的程序语言或指令代码,无需经过翻译,每一操作码在计算机内部都有相应的电路来完成。例如,机器语言的可执行文件可以是二进制代码的可执行文件。
其中,通过编程语言编写的源代码并不能直接被机器识别,其可以通过编译器AOT来将编程语言的源代码编译为机器语言的可执行文件。例如,通过编译器AOT将Python的源代码编译为二进制的可执行文件。
在步骤120中,在所述可执行文件出现运行时错误时,通过报错函数输出异常信息。
这里,由于编译器AOT直接将源代码编译为机器语言的可执行文件,在运行时不再需要使用Python虚拟机,因此,在可执行文件出现运行时错误时,无法通过Python虚拟机抛出异常。在本公开中,所有的运行时错误均通过报错函数进行异常抛出。例如,IndexError、Typing Error等均由FATAL函数(报错函数)进行异常抛出。
图2是根据一示例性实施例提出的异常抛出的原理示意图,如图2所示,源代码在Runtimes(运行时模块)中被编译为二进制的可执行文件,如containers(容器)、operaters(运算符)、extensions(扩展程序)等。当可执行文件发生运行时错误时,同一通过FATAL函数输出异常信息。
在步骤130中,响应于所述异常信息,获取所述报错函数的调用栈。
这里,调用栈是指存储有关正在运行的子程序的消息的栈。当报错函数输出异常信息时,电子设备获取该报错函数的调用栈。在一些实施方式中,可以通过libbacktrace工具追溯报错函数的调用栈,并将该调用栈以文本格式向上抛出。应当理解的是,libbacktrace工具追溯报错函数的调用栈的原理可以是通过int backtrace()函数获取报错函数的调用栈。
在步骤140中,根据所述调用栈,确定所述源代码的错误代码的位置信息。
这里,当可执行文件出现运行时错误时,调用报错函数输出异常信息,在报错函数的调用栈中保存有返回地址,该返回地址指示发生错误的可执行文件的位置。然后,根据源代码与可执行文件之间的编译路径,可以确定到源代码中的错误代码的位置信息。
其中,错误代码的位置信息可以包括错误代码的存储位置和/或该错误代码在源代码中的行号。
由此,通过在将编程语言的源代码编译为机器语言的可执行文件的编译器中利用报错函数输出运行时错误的异常信息,并根据该报错函数的调用栈来确定错误代码的位置信息,可以实现直接将源代码编译为二进制的可执行文件的编译器的跨语言解释错误的运行时报错机制,并且可以精准定位错误代码的位置。
图3是图1所示的步骤140的具体流程示意图。如图3所示,在一些可以实现的实施方式中,步骤140可以包括以下步骤。
在步骤141中,根据所述调用栈中的调用返回地址,确定发生错误的编译代码,其中,所述编译代码为将所述源代码编译为所述可执行文件时的中间代码。
这里,编译代码是指将源代码编译为可执行文件时的中间代码,例如,源代码为Python,编译代码为C++。编译器AOT将Python编译为C++,然后再将C++编译为二进制的可执行文件。在可执行文件出现运行时错误时,调用报错函数输出异常信息,在报错函数的调用栈中保存有调用返回地址,该调用返回地址用于指示发生错误的编译代码的位置。
在步骤142中,基于所述发生错误的编译代码,确定所述源代码的错误代码的位置信息。
这里,在确定到发生错误的编译代码之后,可以通过与编译代码与源代码之间的映射关系确定到错误代码的位置信息。
在一些实施例中,编译器AOT在编译过程中,记录源代码的位置信息与该源代码之间的编译代码的位置信息之间的映射关系,当确定到发生错误的编译代码后,根据该映射关系,确定出源代码对应的错误代码的位置信息。
由此,通过调用栈中的调用返回地址定位发生错误的编译代码,进而根据编译代码与源代码之间的映射关系确定出错误代码,可以精准定位出源代码中的错误代码的位置信息。
下面通过一些示例对上述实施方式进行详细说明。
在本公开中,编译器AOT将Python的源代码编译为C++的编译代码,再将C++的编译代码编译为二进制的可执行文件。无论是List的Index error、Dict key error,或者是type的相关错误,都会通过FATAL函数进行异常抛出。通过在FATAL函数中使用libbacktrace工具,可以获得FATAL函数的调用栈。
例如,当发生运行时错误时,报错函数通过输出“ERROR:test_runtime_error_again(__main__.TestRuntimeErrorReport)”来抛出异常信息。然后,通过“Traceback(most recent call last)”来获取FATAL函数的调用栈。
通过FATAL函数的调用栈中保存的调用返回地址,可以追溯到该异常信息对应的C++的编译代码的位置信息。例如,可以通过“matx::runtime::JitOp::Process(matx::runtime::Pyargs)const at/data00/workspace/matx4/src/pipeline/jit_op.cc:103”的语句来确定发生错误的编译代码的位置。其中,“data00/workspace/matx4/src/pipeline/jit_op.cc”表示发生错误的C++格式的编译代码的存储位置,“103”表示该编译代码的行号。由此,可以以字符串的形式获得错误程序的报错栈以及行号。
由于编译器AOT在编译的过程中,记录了Python的源代码与C++的编译代码之间的映射关系,通过该映射关系即可回溯得到Python的源代码中的错误代码的位置信息。例如,通过语句“ErrorRunner.__call__at/data00/workspace/matx4/test/script/test_runtime_error_report.py:20”输出错误代码的位置信息。
其中,“data00/workspace/matx4/test/script/test_runtime_error_report.py”表示发生错误的Python格式的错误代码的存储位置,“20”表示该错误代码的行号。
图4是根据一示例性实施例提出的将源代码转换为可执行文件的流程示意图。如图4所示,可以包括以下步骤。
在步骤210中,获取第一编程语言的源代码。
其中,进行代码转换的源代码可以是一个或多个文件,在该源代码为多个文件时,则可以根据默认指定或用户指定确定其中的一个文件作为初始的源代码进行后续流程。示例地,第一编程语言可以是Python。
在步骤220中,对所述源代码进行解析,获得所述源代码对应的变量信息和依赖信息,其中,所述依赖信息中包含多个解析对象之间的依赖关系,所述解析对象包括函数和/或类。
示例地,在进行代码开发时,在该源代码中可以定义变量以对属性进行描述,该变量信息可以包含该变量的名称、数据类型以及作用域等,依赖信息用于表征该源代码中的类之间的依赖关系以及函数之间的依赖关系。
在步骤230中,根据所述变量信息和所述依赖信息,将所述依赖信息中各个解析对象对应的抽象语法树转换成中间表示,其中,所述中间表示包含所述抽象语法树中各节点的类型信息。
其中,中间表示(Intermediate Representation,IR)为源代码进行语法分析后到生成目标代码之间的源程序表现形式,抽象语法树(Abstract Syntax Tree,AST)是源代码的抽象语法结构的树状表示,该抽象语法树中的每个节点都表示源代码中的一种结构。抽象语法树可以通过词法分析器和语法分析器对源代码进行分析获得,其处理方式为本领域中的常用方式,如可以通过Parser工具进行分析获得,在此不再赘述。其中,图5是根据一示例性实施例提出的编译器的架构流程示意图,如图5所示,则可以根据上述语法分析流程AST Parser对源代码进行分析,获得上述抽象语法树。示例地,该抽象语法树、变量信息等可以存储至上下文文件ScriptContext中,以便于后续应用过程中对相关信息的快速读取。
在本公开实施例中,根据变量信息和依赖信息,可以针对每一解析对象及其依赖的对象进行代码转换,同时结合变量信息可以进一步确定该抽象语法树中每个节点的类型信息,获得该解析对象对应的统一结构表示,便于后续到第二编程语言的统一转换。
在步骤240中,根据所述中间表示生成第二编程语言的编译代码。
其中,在该实施例中可以将获得的中间表示作为代码转换的元数据,同时可以定义代码转换规则的模板文件,其中,该模板文件中可以定义转换至第二编程语言的语法结构。示例地,可以基于代码生成工具实现该中间表示至编译代码的转换,如可以基于生成流程CodeGen生成编译代码,其可以读取该中间表示并从代码转换规则的模板文件中读取转换规则,将该读取到的转换规则与中间表示进行合并以进行代码生成,以输出编译代码。如图5所示,则可以根据上述中间表示转换流程Parser对将中间表示转换为编译代码,然后进入中间表示模块IR module。示例性地,该编译代码可以为C++。
在步骤250中,根据所述编译代码生成所述机器语言的可执行文件。
这里,在一些实施方式中,可以通过调用所述第二编程语言对应的编译器对所述编译代码进行编译,获得所述编译代码对应的动态库;对所述动态库和所述编译代码对应的函数表进行封装,获得所述可执行文件,其中,所述可执行文件基于所述可执行文件对应的入口函数被调用。
应当理解的是,可执行文件是指计算机可以直接运行的二进制文件,在本公开实施例中,采用静态编译的动态类型语言将编译语言转换为可执行文件。通过动态库来模拟Python核心对象的行为,如容器(List,Dict)等。基于动态库来生成可执行文件,并不在链接是将需要的二进制代码都拷贝到可执行文件中,而且仅仅拷贝一些重定位和符号表信息,在程序运行时才完成真正的链接过程。
示例地,该第二编程语言为C++,则在该实施例中,可以进一步调用C++编译器对该编译代码进行编译,从而可以将该编译代码编译成动态库DSO的形式,如图5中可以通过C++编译器Compiler进行编译,获得动态库DSO。该过程中需要调用其他编程语言下的编译工具,可以通过编译工具链Toolchain实现。其中,该编译代码对应的函数表可以通过对源代码进行解析的过程获得,其中,针对于类中的成员函数,其可以结合类和函数名称添加至该函数表中,例如,MyClass.F5函数,表示类MyClass中的成员函数F5。若在源代码分析的过程中对其函数名称进行重命名,则该函数表中为重命名之后的名称。
作为示例,在调用C++编译器进行编译之后,则该编译器AOT可以加载该动态库DSO,并通过封装流程RTModule将该动态库和函数表进行封装,获得二进制的可执行文件(运行时模块Runtime Module)。其中,所述可执行文件基于所述可执行文件对应的入口函数被调用。示例地,可以调用GetFunction接口获取该可执行文件的入口函数的函数信息,从而基于该入口函数调用该可执行文件,以接入上层服务,如图5中流程所示。
由此,通过上述技术方案,在对源代码进行转换获得编译代码之后,可以进一步地调用第二编程语言对应的编译器对该编译代码进行编译,从而获得动态库,实现第二编程语言下的运行时以降低动态分配和调度,进一步提高该编译器AOT的流程自动化处理水平,降低技术人员的工作量,提升用户使用体验。
在上述技术方案中,对获取到的源代码进行解析,确定所述源代码对应的变量信息和依赖信息,根据所述变量信息和所述依赖信息,将所述依赖信息中各个解析对象对应的抽象语法树,转换成包含所述抽象语法树中各节点的类型信息的中间表示,之后根据所述中间表示生成第二编程语言下对应的编译代码。由此通过上述技术方案可以通过对源代码的解析,基于变量信息和依赖信息获得与源代码文件的抽象语法树等价且包含其节点类型信息的中间表示,通过生成该统一结构的中间表示以实现代码转换,可以降低代码转换的过程中第一编程语言和第二编程语言之间的关联,能够基于对源代码的一次分析实现多种第二编程语言下的代码转换,提高该代码转换方法的使用范围,并且可以在一定程度上保证代码转换的统一性和一致性,有效避免人工编写代码时的个人习惯性差异,便于后续的代码维护和漏洞检查,在降低技术人员工作量的同时,提高生成的编译代码的质量,并且可以在需求变更的同时快速且准确的实现代码转换适配,为基于编译代码的模型的使用提供可靠的技术支持,进一步提升用户使用体验。
在一些实施方式中,步骤220中,可以对所述源代码中的变量进行解析,获得所述源代码中的全局变量和局部变量,以获得所述变量信息;针对所述源代码中的每一解析对象,根据所述解析对象对应的抽象语法树,确定所述解析对象的依赖信息。
其中,可以通过提取源代码文件中的变量定义语句,确定该源代码文件中定义的各个变量,局部变量为定义在函数内部的变量,其的作用域范围为函数内,全局变量为定义在函数外的变量,其作用域范围为全局,由此,可以根据变量定义的位置确定该变量的作用域,以确定其为局部变量还是全局变量。同时针对第一编程语言中的语法,也可以基于变量定义的关键字确定,如在Python中,global定义的变量可以确定其为全局变量。同时在进行变量解析时,可以进一步获得定义该变量的变量类型和变量名称,以获得变量信息。作为示例,可以将获得的各个变量信息进行统一存储,以便于后续代码转换过程中的直接应用。其中,如图5所示,可以通过模块分析流程ModuleAnalysis确定该变量信息。
如上文所述,该解析对象可以是函数Function,也可以是类Class,以解析对象为类为例进行说明。示例地,若A类的变化引起了B类的变化,则说明B类依赖于A类,通常情况下依赖关系体现在某个类的函数使用另一个类的对象作为参数。在该实施例中,可以通过对每一类的函数进行分类,以确定是否存在依赖,从而确定该类的依赖信息。
由此,通过上述技术方案,可以对源代码中的变量信息和依赖信息进行分析,为确定该源代码文件的结构化表示提供数据支持,同时确定源代码文件的依赖关系也可以为后续生成编译代码提供支持,保证转换所得的编译代码与源代码的逻辑一致性和可用性。
在一些实施方式中,根据所述解析对象对应的抽象语法树,确定所述解析对象的依赖信息,可以是通过根据目标对象对应的抽象语法树,确定所述目标对象是否存在依赖的依赖对象,其中,所述目标对象初始为所述解析对象;若存在所述依赖对象,针对所述依赖对象,在获取到的所述依赖对象所属的目标代码文件不是所述源代码文件的情况下,对所述目标代码文件中的变量进行解析,获得所述目标代码文件中的全局变量和局部变量,以获得所述目标代码文件对应的变量信息,并将所述依赖对象作为新的目标对象,重新根据所述目标对象对应的抽象语法树,确定所述目标对象是否存在依赖的依赖对象的步骤,直至不存在目标对象对应的依赖对象;然后根据所述解析对象确定出的各个目标对象以及该目标对象的依赖对象,生成所述解析对象的依赖信息。
这里,以函数F1为例进行说明,初始时,将该函数F1作为目标对象,则可以根据该函数F1对应的抽象语法树,确定其中的节点中是否有引用其他函数的节点(即依赖对象),若有引用其他函数的节点则确定该函数F1存在依赖对象,例如,该依赖对象为函数F2和函数F3。
示例性地,若依赖对象为多个,则可以按照确定顺序依次对每一依赖对象进行上述分析。例如首先获取函数F2所属的目标代码文件,该目标代码文件不是该源代码,则对所述目标代码文件中的变量进行解析,获得所述目标代码文件中的全局变量和局部变量,以获得所述目标代码文件对应的变量信息。其中,获取变量信息的方式已在上文进行详述,在此不再赘述。分析完变量信息之后,则可以该函数F2确定为新的目标对象,即对函数F2进一步执行上述流程,以对函数F2进行分析,示例地,进一步分析所得该函数F2存在依赖对象为函数F4,函数F4不存在依赖对象。
针对函数F3,获取函数F3所属的目标代码文件,该目标代码文件是该源代码,由于此时已经对该源代码进行了变量信息分析,此时无需重新解析,可以直接将该函数F3作为新的目标对象,即对函数F3进一步执行上述流程,以对函数F3进行分析,示例地,进一步分析所得函数F3不存在依赖对象。由此,分析完成。
通过上述分析过程确定函数F1的依赖函数F2和函数F3,函数F2依赖函数F4,则可以根据该确定出的各个依赖关系生成函数F1的依赖关系,以表征该多个函数之间的依赖,如图5所示,可以通过该DAG分析流程生成该依赖信息,该依赖信息可以通过DAG(有向无环图,Directed acyclic graph)表示。其中在确定依赖关系之后可以基于本领域常用的方式生成有向无环图,本公开在此不再赘述。
由此,通过上述技术方案,可以对源代码中的各个函数和类之间的依赖关系进行分析,保证代码转换前后逻辑关系的一致性,为快速进行代码转换提供数据支持,同时也可以有效保证生成的编译代码的有效性和可用性,便于模型的快速部署和服务。
在一种可能的实施例中,所述方法还包括:基于第三方库和编译器中预设的签名表示,确定所述第三方库对应的包装库的库名称和库链接地址,其中,所述包装库中包含所述第三方库的链接地址。其中,该第三方库可以包括该动态库。预设的签名表示可以是预定义的、对库的抽象表示,通过生成包装库可以将各个第三方库的签名表示为统一格式,便于第三方库的注册以及编译器AOT对第三方库的识别。
根据所述库名称和所述库链接地址,生成映射关系并存储所述映射关系至映射表中;根据所述第三方库的所述库名称和所述映射表,生成所述第三方库在所述第一编程语言下对应的接口代码,并将所述接口代码添加至接口文件。其中,针对于新注册的第三方库,若要在第一编程语言下进行调用,则可以将该第三方库包装成第一编程语言下的一个的接口,基于该接口实现该第三方库的调用。在该实施例中,针对每一第三方库,都可以在第一编程语言下生成其对应的接口代码,例如,可以基于wrapper生成该第三方库对应的接口代码,以用于调用第三方库。该实施例中可以将第三方库对应的接口代码添加至接口文件中,从而使得编译器AOT在进行代码转换时可以通过导入该接口文件实现在第一编程语言下对新注册的第三方库的调用。
相应地,根据所述中间表示生成第二编程语言下对应的编译代码,可以是根据所述第二编程语言和所述接口文件对所述中间表示进行转换,以获得所述编译代码。
由此,可以在编译器AOT中基于包装库和映射表的方式注册第三方库,通过生成接口文件以使得编译器AOT对调用第三方库的源代码进行准确识别和代码转换,支持开发者在编译器AOT中扩展第三方库,提高第三方库的集成效率,同时提高该代码转换方法的使用范围和转换准确度。
在一种可能的实施例中,所述方法还包括:
在所述第一编程语言下,基于所述库名称和所述接口文件中的所述映射表确定所述库链接地址;
根据所述库链接地址路由至所述包装库,并根据所述包装库中的所述第三方库的链接地址路由至所述第三方库,根据第一编程语言下的调用参数调用所述第三方库。
其中,注册到编译器中的第三方库也可以在第一编程语言下被调用编译。在该情况下可以基于调用的库名称从该接口文件中的映射表中查询该库名称对应的库链接地址。示例地,可以以库名称MyClass作为key从映射表中进行查询,从而查询到该key对应的value,即该库名称MyClass对应的库链接地址,记为A1。
在该实施例中,可以基于返回的地址A1进行库调用,从而实现对包装库MyClass的调用。在调用该包装库时基于其中的第三方库的链接地址A2进一步调用第三方库,实现第一编程语言下对该第三方库的调用。其中,调用过程中不同编程语言下的参数类型的转换可以基于编译器中运行时层的FFI(Foreign Function Interface,语言交互接口)实现,在此不再赘述由此,通过上述技术方案,可以基于包装库和映射表在第一编程语言下将对包装库的调用分发路由至对应的第三方库的实际链接地址,从而实现对第三方库的调用,实现第一编程语言下对不同编程语言的第三方库的直接使用,进一步拓展编译器的使用范围,贴合实际应用场景。
在一种可能的实施例中,所述方法还包括:
对所述运行时模块和所述运行时模块的元信息进行封装,获得即时生成处理器(JitOp,Just In Time Operator)。
将所述即时生成处理器集成到处理流程,以在所述处理流程中基于所述即时生成处理器的接口使用所述即时生成处理器。
在该实施例中,在将源代码进行转换获得编译代码后,可以其他的判断逻辑等进行集成,为便于处理流程pipeline中的调用方进行使用,其可以对该运行时模块进行进一步地封装,其中,元信息是关于信息的信息,用于描述信息的结构、语义、用途和用法等。在该实施例中元信息的结构可以预先设置,从而可以根据该结构和该运行时模块确定该运行时模块的元信息,从而进行封装,具体的封装方式可以采用本领域中的常用方式,在此不再赘述。因此,通过上述技术方案,调用方可以基于封装即时生成处理器后的接口对该编译代码直接进行调用,使得对该编译代码中逻辑的调用与普通函数调用方式一致,为其他调用方提供更简便的调用方式,简化使用流程和调用方式,进一步提高编译代码应用的自动化水平,从而可以有效简化模型的部署的复杂化,提升用户使用体验。
应当理解的是,如图5所示,报错程序Error Reporter为上述报错函数FATAL函数,用于输出所有的运行时错误。
图6是根据一示例性实施例提供一种错误代码定位装置的模块连接示意图。如图6所示,本公开实施例提供一种错误代码定位装置,该装置400可以包括:
编译模块401,配置为将编程语言的源代码编译为机器语言的可执行文件;
报错模块402,配置为在所述可执行文件出现运行时错误时,通过报错函数输出异常信息;
获取模块403,配置为响应于所述异常信息,获取所述报错函数的调用栈;
确定模块404,配置为根据所述调用栈,确定所述源代码的错误代码的位置信息。
可选地,所述确定模块404包括:
定位子单元,配置为根据所述调用栈中的调用返回地址,确定发生错误的编译代码,其中,所述编译代码为将所述源代码编译为所述可执行文件时的中间代码;
确定子单元,配置为基于所述发生错误的编译代码,确定所述源代码的错误代码的位置信息。
可选地,所述确定子单元具体配置为:
基于所述发生错误的编译代码,结合映射关系,确定所述源代码对应的错误代码的位置信息;
其中,所述映射关系为在所述编译器的编译过程中记录到的所述源代码的位置信息与该源代码对应的编译代码的位置信息的对应关系。
可选地,所述编译模块401包括:
获取子单元,配置为获取第一编程语言的源代码;
解析子单元,配置为对所述源代码进行解析,获得所述源代码对应的变量信息和依赖信息,其中,所述依赖信息中包含多个解析对象之间的依赖关系,所述解析对象包括函数和/或类;
转换子单元,配置为根据所述变量信息和所述依赖信息,将所述依赖信息中各个解析对象对应的抽象语法树转换成中间表示,其中,所述中间表示包含所述抽象语法树中各节点的类型信息;
编译子单元,配置为根据所述中间表示生成第二编程语言的编译代码;
生成子单元,配置为根据所述编译代码生成所述机器语言的可执行文件。
可选地,所述生成子单元包括:
调用子单元,配置为调用所述第二编程语言对应的编译器对所述编译代码进行编译,获得所述编译代码对应的动态库;
封装子单元,配置为对所述动态库和所述编译代码对应的函数表进行封装,获得所述可执行文件,其中,所述可执行文件基于所述可执行文件对应的入口函数被调用。
可选地,所述解析子单元包括:
变量子单元,配置为对所述源代码中的变量进行解析,获得所述源代码中的全局变量和局部变量,以获得所述变量信息;
依赖解析子单元,配置为针对所述源代码中的每一解析对象,根据所述解析对象对应的抽象语法树,确定所述解析对象的依赖信息。
可选地,所述依赖解析子单元具体配置为:
根据目标对象对应的抽象语法树,确定所述目标对象是否存在依赖的依赖对象,其中,所述目标对象初始为所述解析对象;
若存在所述依赖对象,针对所述依赖对象,在获取到的所述依赖对象所属的目标代码文件不是所述源代码文件的情况下,对所述目标代码文件中的变量进行解析,获得所述目标代码文件中的全局变量和局部变量,以获得所述目标代码文件对应的变量信息,并将所述依赖对象作为新的目标对象,重新根据所述目标对象对应的抽象语法树,确定所述目标对象是否存在依赖的依赖对象的步骤,直至不存在目标对象对应的依赖对象;
根据所述解析对象确定出的各个目标对象以及该目标对象的依赖对象,生成所述解析对象的依赖信息。
关于上述实施例中的装置的各个功能模块的具体实施方式,已在关于方法的部分进行了详细说明,在此不再赘述。
下面参考图7,其示出了适于用来实现本公开实施例的电子设备600的结构示意图。本公开实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图7示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图7所示,电子设备600可以包括处理装置(例如中央处理器、图形处理器等)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储装置608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有电子设备600操作所需的各种程序和数据。处理装置601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
通常,以下装置可以连接至I/O接口605:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置606;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置607;包括例如磁带、硬盘等的存储装置608;以及通信装置609。通信装置609可以允许电子设备600与其他设备进行无线或有线通信以交换数据。虽然图7示出了具有各种装置的电子设备600,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置609从网络上被下载和安装,或者从存储装置608被安装,或者从ROM 602被安装。在该计算机程序被处理装置601执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,电子设备可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读存储介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:将编程语言的源代码编译为机器语言的可执行文件;在所述可执行文件出现运行时错误时,通过报错函数输出异常信息;响应于所述异常信息,获取所述报错函数的调用栈;根据所述调用栈,确定所述源代码的错误代码的位置信息。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言——诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,模块的名称在某种情况下并不构成对该模块本身的限定。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上***(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

Claims (10)

1.一种错误代码定位方法,其特征在于,包括:
将编程语言的源代码编译为机器语言的可执行文件;
在所述可执行文件出现运行时错误时,通过报错函数输出异常信息;
响应于所述异常信息,获取所述报错函数的调用栈;
根据所述调用栈,确定所述源代码的错误代码的位置信息。
2.根据权利要求1所述的错误代码定位方法,其特征在于,所述根据所述调用栈,确定所述源代码的错误代码的位置信息,包括:
根据所述调用栈中的调用返回地址,确定发生错误的编译代码,其中,所述编译代码为将所述源代码编译为所述可执行文件时的中间代码;
基于所述发生错误的编译代码,确定所述源代码的错误代码的位置信息。
3.根据权利要求2所述的错误代码定位方法,其特征在于,所述基于所述发生错误的编译代码,确定所述源代码的错误代码的位置信息,包括:
基于所述发生错误的编译代码,结合映射关系,确定所述源代码对应的错误代码的位置信息;
其中,所述映射关系为在所述编译器的编译过程中记录到的所述源代码的位置信息与该源代码对应的编译代码的位置信息的对应关系。
4.根据权利要求1所述的错误代码定位方法,其特征在于,所述将编程语言的源代码编译为机器语言的可执行文件,包括:
获取第一编程语言的源代码;
对所述源代码进行解析,获得所述源代码对应的变量信息和依赖信息,其中,所述依赖信息中包含多个解析对象之间的依赖关系,所述解析对象包括函数和/或类;
根据所述变量信息和所述依赖信息,将所述依赖信息中各个解析对象对应的抽象语法树转换成中间表示,其中,所述中间表示包含所述抽象语法树中各节点的类型信息;
根据所述中间表示生成第二编程语言的编译代码;
根据所述编译代码生成所述机器语言的可执行文件。
5.根据权利要求4所述的错误代码定位方法,其特征在于,所述根据所述编译代码生成所述机器语言的可执行文件,包括:
调用所述第二编程语言对应的编译器对所述编译代码进行编译,获得所述编译代码对应的动态库;
对所述动态库和所述编译代码对应的函数表进行封装,获得所述可执行文件,其中,所述可执行文件基于所述可执行文件对应的入口函数被调用。
6.根据权利要求4所述的错误代码定位方法,其特征在于,所述对所述源代码进行解析,确定所述源代码对应的变量信息和依赖信息,包括:
对所述源代码中的变量进行解析,获得所述源代码中的全局变量和局部变量,以获得所述变量信息;
针对所述源代码中的每一解析对象,根据所述解析对象对应的抽象语法树,确定所述解析对象的依赖信息。
7.根据权利要求6所述的错误代码定位方法,其特征在于,所述根据所述解析对象对应的抽象语法树,确定所述解析对象的依赖信息,包括:
根据目标对象对应的抽象语法树,确定所述目标对象是否存在依赖的依赖对象,其中,所述目标对象初始为所述解析对象;
若存在所述依赖对象,针对所述依赖对象,在获取到的所述依赖对象所属的目标代码文件不是所述源代码文件的情况下,对所述目标代码文件中的变量进行解析,获得所述目标代码文件中的全局变量和局部变量,以获得所述目标代码文件对应的变量信息,并将所述依赖对象作为新的目标对象,重新根据所述目标对象对应的抽象语法树,确定所述目标对象是否存在依赖的依赖对象的步骤,直至不存在目标对象对应的依赖对象;
根据所述解析对象确定出的各个目标对象以及该目标对象的依赖对象,生成所述解析对象的依赖信息。
8.一种错误代码定位装置,其特征在于,包括:
编译模块,配置为将编程语言的源代码编译为机器语言的可执行文件;
报错模块,配置为在所述可执行文件出现运行时错误时,通过报错函数输出异常信息;
获取模块,配置为响应于所述异常信息,获取所述报错函数的调用栈;
确定模块,配置为根据所述调用栈,确定所述源代码的错误代码的位置信息。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理装置执行时实现权利要求1-7中任一项所述方法的步骤。
10.一种电子设备,其特征在于,包括:
存储装置,其上存储有计算机程序;
处理装置,用于执行所述存储装置中的所述计算机程序,以实现权利要求1-7中任一项所述方法的步骤。
CN202111358194.9A 2021-11-16 2021-11-16 错误代码定位方法、装置、存储介质以及电子设备 Pending CN114047923A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111358194.9A CN114047923A (zh) 2021-11-16 2021-11-16 错误代码定位方法、装置、存储介质以及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111358194.9A CN114047923A (zh) 2021-11-16 2021-11-16 错误代码定位方法、装置、存储介质以及电子设备

Publications (1)

Publication Number Publication Date
CN114047923A true CN114047923A (zh) 2022-02-15

Family

ID=80209685

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111358194.9A Pending CN114047923A (zh) 2021-11-16 2021-11-16 错误代码定位方法、装置、存储介质以及电子设备

Country Status (1)

Country Link
CN (1) CN114047923A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115185525A (zh) * 2022-05-17 2022-10-14 贝壳找房(北京)科技有限公司 数据倾斜代码块定位方法、装置、设备、介质及程序产品

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115185525A (zh) * 2022-05-17 2022-10-14 贝壳找房(北京)科技有限公司 数据倾斜代码块定位方法、装置、设备、介质及程序产品

Similar Documents

Publication Publication Date Title
US11200143B2 (en) Software development framework for a cloud computing platform
US11151018B2 (en) Method and apparatus for testing a code file
CN109033843B (zh) 用于分布式静态检测***的Java文件依赖性分析方法及模块
US9928042B2 (en) Automatic classification of compilers
US20130014093A1 (en) Code inspection executing system for performing a code inspection of abap source codes
CN109564540B (zh) 用于jit编译器的调试的***、方法和设备
US9311077B2 (en) Identification of code changes using language syntax and changeset data
CN109284222B (zh) 软件单元、数据处理***中的项目测试方法、装置及设备
CN112527386B (zh) 应用程序发布方法及装置
CN115705250A (zh) 监测堆栈使用量以优化程序
US9672015B2 (en) Automatic determination of compiler configuration
CN114047923A (zh) 错误代码定位方法、装置、存储介质以及电子设备
CN111240987B (zh) 移植程序检测方法、装置、电子设备及计算机可读存储介质
CN112527302B (zh) 错误检测的方法及装置、终端和存储介质
CN115951916A (zh) 一种组件的处理方法、装置、电子设备及存储介质
CN113778451B (zh) 文件加载方法、装置、计算机***和计算机可读存储介质
CN115292178A (zh) 测试数据搜索方法、装置、存储介质以及终端
CN110297639B (zh) 用于检测代码的方法和装置
CN114035804A (zh) 代码转换方法、装置、介质和电子设备
CN114035805B (zh) 用于预编译器的代码转换方法、装置、介质及设备
CN115729797A (zh) 代码相似函数检测方法、装置、电子设备及存储介质
CN114035805A (zh) 用于预编译器的代码转换方法、装置、介质及设备
CN117075912B (zh) 用于程序语言转换的方法、编译方法及相关设备
US20230315412A1 (en) Scalable behavioral interface specification checking
CN117850787A (zh) 动态调用链获取方法、装置、电子设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination