CN105224463A

CN105224463A - 一种基于崩溃栈数据的软件缺陷代码定位方法

Info

Publication number: CN105224463A
Application number: CN201510714252.5A
Authority: CN
Inventors: 倪超; 姜承祥; 顾庆; 陈道蓄
Original assignee: Nanjing University
Current assignee: Nanjing University
Priority date: 2015-10-28
Filing date: 2015-10-28
Publication date: 2016-01-06
Anticipated expiration: 2035-10-28
Also published as: CN105224463B

Abstract

本发明涉及一种基于崩溃栈数据的软件缺陷代码定位方法，结合历史崩溃栈数据和历史代码维修记录，应用机器学习技术，构建缺陷代码预测模型，预测软件中包含缺陷的各个最终目标崩溃代码单元，从而快速定位软件中包含缺陷的代码单元，并且针对各个最终目标崩溃代码单元进行评价，有效提高软件代码修复的工作效率；并且本发明设计方法简单，适用于不同类型的编程语言，以及不同规模的计算机软件，具有扩展性和适应性，方便应用并行算法，能够快速有效地分析和处理大量的崩溃栈数据，提高软件缺陷定位的效能，可用于中到大型软件***的测试和维护工作。

Description

一种基于崩溃栈数据的软件缺陷代码定位方法

技术领域

本发明涉及一种基于崩溃栈数据的软件缺陷代码定位方法，属于软件测试维护技术领域。

背景技术

计算机软件在开发和维护过程中不可避免地产生软件缺陷，缺陷定位是软件调试过程中一件耗时耗力的工作，对大规模软件***更是如此。软件缺陷定位一直是软件工程研究领域中的热点问题之一。缺陷定位利用代码执行信息和缺陷(问题)报告，预测缺陷代码的可能范围，辅助开发人员找到缺陷位置。当前软件***规模越来越大，代码文件越来越多，根据缺陷报告内容，从海量的代码文件中定位到缺陷代码的过程可谓是大海捞针。此外，在软件开发周期中，庞大的软件规模和有限的开发和测试成本之间也形成反差。

目前缺陷代码定位仍然以人工定位和经验判定为主，多利用交互式的调试工具，需要大量人工干预，定位效率低，耗费大量时间和成本，且不可重复，难以满足和适应大规模软件***的调试需求。近年来，研究者提出一些自动缺陷代码定位方法，但是这些方法多需要获取软件执行过程的动态信息，如代码覆盖数据和执行轨迹等，适用于小范围语句级的软件缺陷定位；尚不能满足大规模软件***在函数和过程级的缺陷定位要求。

发明内容

针对上述技术问题，本发明所要解决的技术问题是提供一种基于崩溃栈数据的软件缺陷代码定位方法，应用机器学习技术，能够快速定位软件中包含缺陷的代码单元，有效提高软件代码修复的工作效率。

本发明为了解决上述技术问题采用以下技术方案：本发明设计了一种基于崩溃栈数据的软件缺陷代码定位方法，包括如下步骤：

步骤001.收集软件***的历史崩溃栈数据和历史代码维修记录，并分别针对各个历史崩溃栈数据，获得历史崩溃栈数据所对应的各个历史崩溃代码单元，构成所有历史崩溃栈数据所对应的历史崩溃代码单元集合，并进入步骤002；

步骤002.分别针对历史崩溃代码单元集合中的各个历史崩溃代码单元，获得历史崩溃代码单元的各个预设特征指标的特征值；然后分别针对各个历史崩溃代码单元，将历史崩溃代码单元转化为其所对应各个预设特征指标的特征值组成的特征向量，获得各个历史崩溃代码单元所分别对应的特征向量，并进入步骤003；

步骤003.根据历史代码维修记录，结合各个历史崩溃代码单元所分别对应的特征向量，分别判断各个历史崩溃代码单元是否包含缺陷；然后针对包含缺陷的各个历史崩溃代码单元，获得由该各个历史崩溃代码单元所对应特征向量组成的特征向量矩阵，构成训练集，并进入步骤004；

步骤004.应用训练集，针对预设分类器进行训练，获得经过训练的分类器，并进入步骤005；

步骤005.针对各个目标崩溃栈数据，获得各个目标崩溃栈数据分别所对应的各个目标崩溃代码单元，构成所有目标崩溃栈数据所对应的目标崩溃代码单元集合，并进入步骤006；

步骤006.分别针对目标崩溃代码单元集合中的各个目标崩溃代码单元，获得目标崩溃代码单元的各个预设特征指标的特征值；然后分别针对各个目标崩溃代码单元，将目标崩溃代码单元转化为其所对应各个预设特征指标的特征值组成的特征向量，获得各个目标崩溃代码单元所分别对应的特征向量，构成目标预测集，并进入步骤007；

步骤007.采用经过训练的分类器，针对目标预测集进行预测，预测各个目标崩溃代码单元是否包含缺陷，分别确定各个目标崩溃栈数据中包含缺陷的各个最终目标崩溃代码单元。

作为本发明的一种优选技术方案：所述步骤007之后还包括如下步骤008：

步骤008.根据历史代码维修记录，针对各个最终目标崩溃代码单元进行评价。

作为本发明的一种优选技术方案：所述步骤008具体包括如下步骤：

步骤00801.针对各个最终目标崩溃代码单元，分别获得最终目标崩溃代码单元的各个预设缺陷倾向指标的指标值x_i，并进入步骤00802；其中，1≤i≤I，I为预设缺陷倾向指标的个数；

步骤00802.根据如下公式，针对各个最终目标崩溃代码单元，分别获得各个最终目标崩溃代码单元的缺陷倾向评分Score，并进入步骤00803；

S c o r e = \frac{1}{1 + e^{- Σ_{i = 1}^{I} x_{i}}}

步骤00803.根据各个最终目标崩溃代码单元的缺陷倾向评分Score，针对各个最终目标崩溃代码单元进行排序。

作为本发明的一种优选技术方案：所述预设缺陷倾向指标的个数I＝5，所述步骤00701中，根据如下5个预设缺陷倾向指标，及其指标值x_i计算公式，针对各个最终目标崩溃代码单元，分别获得最终目标崩溃代码单元的各个预设缺陷倾向指标的指标值x_i；

x_{1} = \frac{10}{1 + F r a m e + D i s e}

x₁表示反向调用距离缺陷倾向指标，用于衡量最终目标崩溃代码单元距离崩溃点的调用距离；Frame表示最终目标崩溃代码单元位于对应目标崩溃栈数据的层数位置，其中，崩溃点所处的层数为0，若最终目标崩溃代码单元未出现在对应目标崩溃栈数据中时，则Frame等于对应目标崩溃栈数据最大层数加1；Dise表示最终目标崩溃代码单元的调用深度；

x₂＝log(LOC+1)

x₂表示最终目标崩溃代码单元单位长度缺陷倾向指标，用于衡量最终目标崩溃代码单元的相对长度，LOC表示最终目标崩溃代码单元包含的代码行总数；

x_{3} = \frac{10}{l o g (D a y + 1)}

x₃表示最终目标崩溃代码单元延续时间缺陷倾向指标，用于衡量最终目标崩溃代码单元同最近一次修复或更新的时间距离；Day表示最终目标崩溃代码单元距离最近一次修复或更新的天数；

x_{4} = \frac{10 \times N_{d e f e c t}}{N}

x₄表示最终目标崩溃代码单元缺陷比率倾向指标，用于衡量最终目标崩溃代码单元在预设分类器中被预测包含缺陷的比率；N表示预设分类器中基分类器的数量；N_defect表示预设分类器中预测最终目标崩溃代码单元包含缺陷的基分类器的数量；

x_{5} = \frac{100 \times {No}_{d e f e c t}}{N o}

x₅表示最终目标崩溃代码单元历史缺陷比率倾向指标，用于衡量最终目标崩溃代码单元在历史崩溃栈数据中被预测为包含缺陷的比率；No表示涉及到最终目标崩溃代码单元的历史崩溃栈数据的个数；No_defect表示根据历史代码维修记录确定最终目标崩溃代码单元包含缺陷的目标崩溃栈数据的数量。

作为本发明的一种优选技术方案：所述预设分类器为AdaBoost分类器

作为本发明的一种优选技术方案：所述步骤001中，分别针对各个历史崩溃栈数据，执行如下步骤a01至步骤a03，获得各个历史崩溃栈数据分别所对应的各个历史崩溃代码单元，构成所有历史崩溃栈数据所对应的历史崩溃代码单元集合；

步骤a01.应用调用链分析方法，针对历史崩溃栈数据中涉及到的代码单元进行分析扩展，获得该历史崩溃栈数据所涉及到的全部代码单元，并构建与之相对应的静态调用图，然后进入步骤a02；

步骤a02.应用控制流分析方法，基于软件控制流顺序，删除静态调用图中软件执行不可达的代码单元，并进入步骤a03；

步骤a03.应用反向切片技术，基于软件控制流顺序，删除静态调用图中与该历史崩溃栈数据中崩溃点变量引用无关的代码单元，最后，静态调用图中剩余的代码单元即为该历史崩溃栈数据所对应的各个历史崩溃代码单元。

作为本发明的一种优选技术方案：所述步骤005中，针对各个目标崩溃栈数据，分别执行如下步骤b01至步骤b03，获得各个目标崩溃栈数据分别所对应的各个目标崩溃代码单元，构成所有目标崩溃栈数据所对应的目标崩溃代码单元集合；

步骤b01.应用调用链分析方法，针对目标崩溃栈数据中涉及到的代码单元进行分析扩展，获得该目标崩溃栈数据所涉及到的全部代码单元，并构建与之相对应的静态调用图，然后进入步骤b02；

步骤b02.应用控制流分析方法，基于软件控制流顺序，删除静态调用图中软件执行不可达的代码单元，并进入步骤b03；

步骤b03.应用反向切片技术，基于软件控制流顺序，删除静态调用图中与该目标崩溃栈数据中崩溃点变量引用无关的代码单元，最后，静态调用图中剩余的代码单元即为该目标崩溃栈数据所对应的各个目标崩溃代码单元。

作为本发明的一种优选技术方案：所述步骤002和所述步骤006中各个预设特征指标的特征值分别为调用深度特征指标、代码行数特征指标、可执行代码行数特征指标、声明代码行数特征指标、注释代码行数特征指标、注释比例特征指标、空格比例特征指标、标点比例特征指标、代码路径数特征指标、圈复杂度特征指标、输入变量个数特征指标、输出变量个数特征指标。

本发明所述一种基于崩溃栈数据的软件缺陷代码定位方法采用以上技术方案与现有技术相比，具有以下技术效果：本发明设计的基于崩溃栈数据的软件缺陷代码定位方法，结合历史崩溃栈数据和历史代码维修记录，应用机器学习技术，构建缺陷代码预测模型，预测软件中包含缺陷的各个最终目标崩溃代码单元，从而快速定位软件中包含缺陷的代码单元，并且针对各个最终目标崩溃代码单元进行评价，有效提高软件代码修复的工作效率；并且本发明设计方法简单，适用于不同类型的编程语言，以及不同规模的计算机软件，具有扩展性和适应性，方便应用并行算法，能够快速有效地分析和处理大量的崩溃栈数据，提高软件缺陷定位的效能，可用于中到大型软件***的测试和维护工作。

附图说明

图1是本发明设计基于崩溃栈数据的软件缺陷代码定位方法的总体框架示意图；

图2是本发明设计基于崩溃栈数据的软件缺陷代码定位方法的流程示意图；

图3是软件崩溃栈数据示例；

图4a是本发明设计获得历史崩溃栈数据所对应各个历史崩溃代码单元中实施例的静态调用图；

图4b是本发明设计获得历史崩溃栈数据所对应各个历史崩溃代码单元中实施例的崩溃栈数据示意图；

图4c是本发明设计获得历史崩溃栈数据所对应各个历史崩溃代码单元中实施例的代码单元的深度示意图；

图4d是本发明设计获得历史崩溃栈数据所对应各个历史崩溃代码单元中实施例的源代码示意图。

具体实施方式

下面结合说明书附图针对本发明的具体实施方式作进一步详细的说明。

如图1和图2所示，本发明所设计基于崩溃栈数据的软件缺陷代码定位方法，在实际应用过程当中，包括如下步骤，其中，代码单元指软件程序中的函数、过程或者对象方法。

步骤001.软件开发商在软件***开发和维护过程中会搭建缺陷报告***，其中的维护代码缺陷历史库，包含与每个软件缺陷相关的崩溃栈数据、构件名称、版本号、操作***等；对于已经修复的代码缺陷，还会记录每个崩溃栈数据对应的缺陷代码、代码的修复记录等；因此，首先我们基于缺陷报告***，收集软件***的历史崩溃栈数据和历史代码维修记录。

如图3所示，该示例中软件的崩溃栈数据产生于FireFox浏览器的一次运行时错误(崩溃ID：f2f55573-e2cd-4ce9-92be-b16e72130904)；崩溃栈数据由多个层组成，每一层包含一个代码单元名称和对应的源文件位置(文件路径名和代码行号)；其中层0代表触发崩溃的代码执行位置。在多数软件***中，例如MicrosoftWindows，崩溃栈数据按照触发点被自动分成不同的组，如此分组是基于“同一个缺陷会在相同的代码位置触发崩溃”情况进行假设的。

然后，分别针对各个历史崩溃栈数据，如图4a-图4d所示，执行如下步骤a01至步骤a03，获得各个历史崩溃栈数据分别所对应的各个历史崩溃代码单元，构成所有历史崩溃栈数据所对应的历史崩溃代码单元集合，并进入步骤002。

对于步骤a01来说，如图4a所示，其中结点代表代码单元，边代表调用关系；CU11位置出现崩溃；例如“CU2→CU6”表示代码单元CU2调用了CU6；根据如图4b所示的崩溃栈数据示意图，调用链CU1→CU3→CU12→CU11并没有完全反应崩溃时的调用轨迹，需要基于静态调用图对调用轨迹进行扩展。例如，对于CU1，有两个调用对CU1→CU3和CU1→CU4；由于CU4可能在CU3之前被调用，CU4加入到调用轨迹中；一旦CU4被加入，那么CU9和CU13也被加入到调用轨迹中；同理，通过分析其他代码单元(CU3,CU12和CU11)，可以获得完整的调用轨迹。

由于在应用调用链分析方法，针对历史崩溃栈数据中涉及到的代码单元进行分析扩展的过程中，会导致代码单元数量呈指数级增长，需要减少代码单元的检索范围，因此在执行完步骤a01之后，需要进入如下步骤a02。

基于图4a和图4b所示的实施例，对于步骤a02来说，如图4c所示，分析代码单元CU11，使用基本的扩展方法，CU14,CU15,CU16和CU17都会被包含进去做进一步的扩展；但是，基于软件控制流顺序，分析表明CU14从崩溃点出发是不可达的，因此，删除静态调用图中软件执行不可达的代码单元CU14。

继续基于图4a、图4b、图4c所示的实施例，对于步骤a03来说，如图4d所示，按照崩溃点，可确定变量s和c同崩溃相关；以这两个变量为起点，通过反向切片技术，可进一步引入变量b；但是CU15没有影响到变量s、c和b，因此可以删除静态调用图中的s、c和b。

步骤002.分别针对历史崩溃代码单元集合中的各个历史崩溃代码单元，获得历史崩溃代码单元的各个预设特征指标的特征值；然后分别针对各个历史崩溃代码单元，将历史崩溃代码单元转化为其所对应各个预设特征指标的特征值组成的特征向量，获得各个历史崩溃代码单元所分别对应的特征向量，并进入步骤003。

其中，各个预设特征指标的特征值分别如下各个特征指标：

(1)调用深度特征指标，一个代码单元的调用深度特征指标表示从崩溃栈数据中出现的任何一个代码单元出发，到达该代码单元的最短调用链长度；如果该代码单元出现在崩溃栈数据中，则调用深度为0；

(2)代码行数特征指标，用于表示代码单元中所包含的代码行数，包括注释；

(3)可执行代码行数特征指标，用于表示代码单元中所包含的可执行代码的行数；

(4)声明代码行数特征指标，用于表示代码单元中用于定义变量和函数的代码行数；

(5)注释代码行数特征指标，用于表示代码单元中用于注释的代码行数；

(6)注释比例特征指标，用于表示代码单元中用于注释的字符个数占总字符个数的比例；

(7)空格比例特征指标，用于表示代码单元中空格符、Tab符、换行符个数占总字符个数的比例；

(8)标点比例特征指标，用于表示代码单元中分号、逗号、斜杠、引号、括弧等标点符号个数占总字符个数的比例；

(9)代码路径数特征指标，用于表示代码单元中可能的简单路径个数，其中简单路径指代码不重复出现，即循环体出现0或1次；

(10)圈复杂度特征指标，用于表示代码单元中分支判定(条件语句和循环语句)的个数再加1；

(11)输入变量个数特征指标，用于表示代码单元中输入参数的个数，以及引用的全局变量个数之和；

(12)输出变量个数特征指标，用于表示代码单元中输出参数的个数，以及修改的全局变量个数之和。

因此，基于上述12个特征指标，分别针对各个历史崩溃代码单元，将历史崩溃代码单元转化为其所对应12个特征指标的特征值组成的特征向量，即每一个历史崩溃代码单元被转化为一个由其对应12个特征指标的特征值组成的特征向量，进而获得各个历史崩溃代码单元所分别对应的特征向量。

步骤003.根据历史代码维修记录，结合各个历史崩溃代码单元所分别对应的特征向量，分别判断各个历史崩溃代码单元是否包含缺陷；然后针对包含缺陷的各个历史崩溃代码单元，获得由该各个历史崩溃代码单元所对应特征向量组成的特征向量矩阵，构成训练集如下表1所示，然后进入步骤004。

表1

其中，n表示所收集历史崩溃栈数据的个数，m表示基于第一个历史崩溃栈数据获得历史崩溃代码单元的个数；BugStack表示历史崩溃栈数据；CU表示历史崩溃代码单元。

步骤004.应用训练集，针对AdaBoost分类器进行训练，获得经过训练的AdaBoost分类器，作为缺陷代码预测模型，并进入步骤005，其中，AdaBoost分类器中基分类器的数量N＝100，基分类器采用决策树策略。

步骤005.基于上述步骤a01至步骤a03同样的原理，针对各个目标崩溃栈数据，同样基于上述12个特征指标，分别执行如下步骤b01至步骤b03，获得各个目标崩溃栈数据分别所对应的各个目标崩溃代码单元，构成所有目标崩溃栈数据所对应的目标崩溃代码单元集合，并进入步骤006。

步骤006.分别针对目标崩溃代码单元集合中的各个目标崩溃代码单元，获得目标崩溃代码单元的各个预设特征指标的特征值；然后分别针对各个目标崩溃代码单元，将目标崩溃代码单元转化为其所对应各个预设特征指标的特征值组成的特征向量，获得各个目标崩溃代码单元所分别对应的特征向量，构成目标预测集，并进入步骤007。

步骤007.采用缺陷代码预测模型，针对目标预测集进行预测，预测各个目标崩溃代码单元是否包含缺陷，分别确定各个目标崩溃栈数据中包含缺陷的各个最终目标崩溃代码单元，然后进入步骤008。

步骤008.根据历史代码维修记录，针对各个最终目标崩溃代码单元进行评价，具体包括如下步骤：

步骤00801.根据如下5个预设缺陷倾向指标，及其指标值x_i计算公式，针对各个最终目标崩溃代码单元，分别获得最终目标崩溃代码单元的各个预设缺陷倾向指标的指标值x_i，并进入步骤00802；其中，1≤i≤I，I为预设缺陷倾向指标的个数，I＝5，即1≤i≤5。

x_{1} = \frac{10}{1 + F r a m e + D i s e}

x₁表示反向调用距离缺陷倾向指标，用于衡量最终目标崩溃代码单元距离崩溃点的调用距离；Frame表示最终目标崩溃代码单元位于对应目标崩溃栈数据的层数位置，其中，崩溃点所处的层数为0，若最终目标崩溃代码单元未出现在对应目标崩溃栈数据中时，则Frame等于对应目标崩溃栈数据最大层数加1；Dise表示最终目标崩溃代码单元的调用深度，为上述各个预设特征指标之一，即调用深度特征指标。

x₂＝log(LOC+1)

x₂表示最终目标崩溃代码单元单位长度缺陷倾向指标，用于衡量最终目标崩溃代码单元的相对长度，LOC表示最终目标崩溃代码单元包含的代码行总数，为上述各个预设特征指标之一，即代码行数特征指标。

x_{3} = \frac{10}{l o g (D a y + 1)}

x₃表示最终目标崩溃代码单元延续时间缺陷倾向指标，用于衡量最终目标崩溃代码单元同最近一次修复或更新的时间距离；Day表示最终目标崩溃代码单元距离最近一次修复或更新的天数。

x_{4} = \frac{10 \times N_{d e f e c t}}{N}

x₄表示最终目标崩溃代码单元缺陷比率倾向指标，用于衡量最终目标崩溃代码单元在AdaBoost分类器中被预测包含缺陷的比率；N表示AdaBoost分类器中基分类器的数量；N_defect表示AdaBoost分类器中预测最终目标崩溃代码单元包含缺陷的基分类器的数量。

x_{5} = \frac{100 \times {No}_{d e f e c t}}{N o}

步骤00802.根据如下公式，针对各个最终目标崩溃代码单元，分别获得各个最终目标崩溃代码单元的缺陷倾向评分Score，并进入步骤00803。

S c o r e = \frac{1}{1 + e^{- Σ_{i = 1}^{I} x_{i}}}

步骤00803.根据各个最终目标崩溃代码单元的缺陷倾向评分Score，针对各个最终目标崩溃代码单元进行降序排序，并将最终降序排序结果提交给软件开发者和软件维护人员，辅助定位软件中包含缺陷的代码单元。

上述技术方案设计的基于崩溃栈数据的软件缺陷代码定位方法，结合历史崩溃栈数据和历史代码维修记录，应用机器学习技术，构建缺陷代码预测模型，预测软件中包含缺陷的各个最终目标崩溃代码单元，从而快速定位软件中包含缺陷的代码单元，并且针对各个最终目标崩溃代码单元进行评价，有效提高软件代码修复的工作效率；并且本发明设计方法简单，适用于不同类型的编程语言，以及不同规模的计算机软件，具有扩展性和适应性，方便应用并行算法，能够快速有效地分析和处理大量的崩溃栈数据，提高软件缺陷定位的效能，可用于中到大型软件***的测试和维护工作。

上面结合说明书附图针对本发明的实施方式作了详细说明，但是本发明并不限于上述实施方式，在本领域普通技术人员所具备的知识范围内，还可以在不脱离本发明宗旨的前提下做出各种变化。

Claims

1.一种基于崩溃栈数据的软件缺陷代码定位方法，其特征在于，包括如下步骤：

步骤004.应用训练集，针对预设分类器进行训练，获得经过训练的分类器，作为缺陷代码预测模型，并进入步骤005；

步骤007.采用缺陷代码预测模型，针对目标预测集进行预测，预测各个目标崩溃代码单元是否包含缺陷，分别确定各个目标崩溃栈数据中包含缺陷的各个最终目标崩溃代码单元。

2.根据权利要求1所述一种基于崩溃栈数据的软件缺陷代码定位方法，其特征在于：所述步骤007之后还包括如下步骤008：

3.根据权利要求2所述一种基于崩溃栈数据的软件缺陷代码定位方法，其特征在于：所述步骤008具体包括如下步骤：

4.根据权利要求3所述一种基于崩溃栈数据的软件缺陷代码定位方法，其特征在于：所述预设缺陷倾向指标的个数I＝5，所述步骤00701中，根据如下5个预设缺陷倾向指标，及其指标值x_i计算公式，针对各个最终目标崩溃代码单元，分别获得最终目标崩溃代码单元的各个预设缺陷倾向指标的指标值x_i；

x₂＝log(LOC+1)

5.根据权利要求1或4所述一种基于崩溃栈数据的软件缺陷代码定位方法，其特征在于：所述预设分类器为AdaBoost分类器。

6.根据权利要求1所述一种基于崩溃栈数据的软件缺陷代码定位方法，其特征在于：所述步骤001中，分别针对各个历史崩溃栈数据，执行如下步骤a01至步骤a03，获得各个历史崩溃栈数据分别所对应的各个历史崩溃代码单元，构成所有历史崩溃栈数据所对应的历史崩溃代码单元集合；

7.根据权利要求1所述一种基于崩溃栈数据的软件缺陷代码定位方法，其特征在于：所述步骤005中，针对各个目标崩溃栈数据，分别执行如下步骤b01至步骤b03，获得各个目标崩溃栈数据分别所对应的各个目标崩溃代码单元，构成所有目标崩溃栈数据所对应的目标崩溃代码单元集合；

8.根据权利要求1所述一种基于崩溃栈数据的软件缺陷代码定位方法，其特征在于：所述步骤002和所述步骤006中各个预设特征指标的特征值分别为调用深度特征指标、代码行数特征指标、可执行代码行数特征指标、声明代码行数特征指标、注释代码行数特征指标、注释比例特征指标、空格比例特征指标、标点比例特征指标、代码路径数特征指标、圈复杂度特征指标、输入变量个数特征指标、输出变量个数特征指标。