CN112328499A - 一种测试数据生成方法、装置、设备及介质 - Google Patents

一种测试数据生成方法、装置、设备及介质 Download PDF

Info

Publication number
CN112328499A
CN112328499A CN202011364238.4A CN202011364238A CN112328499A CN 112328499 A CN112328499 A CN 112328499A CN 202011364238 A CN202011364238 A CN 202011364238A CN 112328499 A CN112328499 A CN 112328499A
Authority
CN
China
Prior art keywords
data
field
data table
association
features
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011364238.4A
Other languages
English (en)
Inventor
李东明
范渊
黄进
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DBAPPSecurity Co Ltd
Hangzhou Dbappsecurity Technology Co Ltd
Original Assignee
Hangzhou Dbappsecurity Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dbappsecurity Technology Co Ltd filed Critical Hangzhou Dbappsecurity Technology Co Ltd
Priority to CN202011364238.4A priority Critical patent/CN112328499A/zh
Publication of CN112328499A publication Critical patent/CN112328499A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3668Software testing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请公开了一种测试数据生成方法、装置、设备、介质,该方法包括:对待测试***对应的数据库中预先选定的数据表进行查询并提取出所述数据表中的目标数据字段;对所述目标数据字段进行分析,确定数据表的外部关联特征、内部关联特征以及字段特征,其中,所述外部关联特征表示当前数据表与除当前数据表之外的其他表之间的关联特征,所述内部关联特征为当前数据表中目标数据字段之间的关联特征,所述字段特征为所述目标数据字段的特征;利用所述外部关联特征、所述内部关联特征以及所述字段特征生成测试数据,以便利用所述测试数据对所述待测试***进行测试。这样生成的测试数据与***实际运行生成的真实数据差异小,能够准确描述真实数据。

Description

一种测试数据生成方法、装置、设备及介质
技术领域
本申请涉及测试技术领域,特别涉及一种测试数据生成方法、装置、设备、介质。
背景技术
在***开发中,测试数据生成一直伴随其中,在***未完成时,构造测试数据验证方案的可行性;线上发现问题时,可以改造数据来重现问题,进而解决问题。无论是事前的验证,还是事中的解决,数据生成都扮演着一个重要的角色。
现有的数据生成方案中,主流的数据生成方案仅限于单元测试和集成测试,对***的可用性验证方面有所帮助,但无法为***的健壮性提供保证。且生成的测试数据存在着跟真实数据存在较大差异的问题,无法准确描述真实的数据,也就无法对***在大数据下的优化方向进行预测。因此,如何生成测试数据,以保证生成的测试数据既能准确描述真实数据又能对***的健壮性进行验证是本领域技术人员需要解决的问题。
发明内容
有鉴于此,本申请的目的在于提供一种测试数据生成方法、装置、设备、介质,能够对***的稳健性进行测试,且生成的测试数据与***实际运行生成的真实数据差异小,能够准确描述真实数据,以便对***在大数据下的优化方向进行预测。其具体方案如下:
第一方面,本申请公开了一种测试数据生成方法,包括:
对待测试***对应的数据库中预先选定的数据表进行查询并提取出所述数据表中的目标数据字段;
对所述目标数据字段进行分析,确定所述数据表的外部关联特征、内部关联特征以及字段特征,其中,所述外部关联特征表示当前数据表与除当前数据表之外的其他表之间的关联特征,所述内部关联特征为当前数据表中目标数据字段之间的关联特征,所述字段特征为所述目标数据字段的特征;
利用所述外部关联特征、所述内部关联特征以及所述字段特征生成测试数据,以便利用所述测试数据对所述待测试***进行测试。
可选地,所述对待测试***对应的数据库中预先选定的数据表进行查询并提取出所述数据表中的目标数据字段,包括:
获取用户设置的数据表信息以及预设数据字段信息;
对待测试***对应的数据库中与所述数据表信息对应的数据表进行查询并提取所述数据表中与所述预设数据字段信息对应的目标数据字段。
可选地,所述对待测试***对应的数据库中预先选定的数据表进行查询并提取出所述数据表中的目标数据字段之后,还包括:
获取数据字段删除信息;
将所述目标数据字段中与所述数据字段删除信息对应的数据字段删除。
可选地,所述利用所述外部关联特征、所述内部关联特征以及所述字段特征生成测试数据,包括:
获取待生成测试数据的数据量;
利用所述外部关联特征、所述内部关联特征以及所述字段特征生成数据量与所述待生成测试数据的数据量相同的测试数据。
可选地,所述对所述目标数据字段进行分析,确定所述数据表的外部关联特征、内部关联特征以及字段特征之后,还包括:
根据所述外部关联特征、所述内部关联特征以及所述字段特征对所述待测试***进行优化。
可选地,所述对所述目标数据字段进行分析,确定所述数据表的内部关联特征,包括:
利用线性判别分析法和前向搜索方法对所述目标数据字段进行分析,确定所述数据表的内部关联特征。
可选地,所述对所述目标数据字段进行分析,确定所述数据表的内部关联特征,包括:
利用线性判别分析法和后向搜索方法对所述目标数据字段进行分析,确定所述数据表的内部关联特征。
第二方面,本申请公开了一种测试数据生成装置,包括:
信息采集模块,用于对待测试***对应的数据库中预先选定的数据表进行查询并提取出所述数据表中的目标数据字段;
字段分析模块,用于对所述目标数据字段进行分析,确定所述数据表的外部关联特征、内部关联特征以及字段特征,其中,所述外部关联特征表示当前数据表与除当前数据表之外的其他表之间的关联特征,所述内部关联特征为当前数据表中目标数据字段之间的关联特征,所述字段特征为所述目标数据字段的特征;
数据生成模块,用于利用所述外部关联特征、所述内部关联特征以及所述字段特征生成测试数据,以便利用所述测试数据对所述待测试***进行测试。
第三方面,本申请公开了一种电子设备,包括:
存储器和处理器;
其中,所述存储器,用于存储计算机程序;
所述处理器,用于执行所述计算机程序,以实现前述公开的测试数据生成方法。
第四方面,本申请公开了一种计算机可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现前述公开的测试数据生成方法。
可见,本申请先对待测试***对应的数据库中预先选定的数据表进行查询并提取出所述数据表中的目标数据字段,然后对所述目标数据字段进行分析,确定所述数据表的外部关联特征、内部关联特征以及字段特征,其中,所述外部关联特征表示当前数据表与除当前数据表之外的其他表之间的关联特征,所述内部关联特征为当前数据表中目标数据字段之间的关联特征,所述字段特征为所述目标数据字段的特征,接着便可以利用所述外部关联特征、所述内部关联特征以及所述字段特征生成测试数据,以便利用所述测试数据对所述待测试***进行测试。由此可见,本申请是先对待测试***的数据库中的数据表进行目标数据字段的提取,然后对提取出来的目标数据字段进行分析,得到所述数据表的外部关联特征、内部关联特征以及字段特征,然后再根据所述外部关联特征、内部关联特征以及字段特征生成测试数据,这样测试数据是根据待测试***的已有的真实数据生成的,能够使得生成的测试数据与***实际运行生成的真实数据差异小,能够准确描述真实数据,以便对***在大数据下的优化方向进行预测,且能够生成大量的测试数据,对待测试***的健壮性进行测试。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请公开的一种测试数据生成方法流程图;
图2为本申请公开的一种具体的测试数据生成方法流程图;
图3为本申请公开的一种具体的测试数据生成方法流程图;
图4为本申请公开的一种测试数据生成装置结构示意图;
图5为本申请公开的一种电子设备结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
参见图1所示,本申请实施例公开了一种测试数据生成方法,该方法包括:
步骤S11:对待测试***对应的数据库中预先选定的数据表进行查询并提取出所述数据表中的目标数据字段。
在具体的实施过程中,当需要对待测试***进行测试时,可能会需要生成所述待测试***对应的测试数据,生成的测试***需要与所述待测试***实际运行过程中生成的数据比较接近,这样利用生成的测试数据对所述待测试***进行测试时,才能够测试出所述待测试***的真实情况。
所以具体的,需要先对所述待测试***对应的数据库中预选选定的数据表进行查询并提取出所述数据表中的目标数据字段。其中,所述数据表可以由测试人员预先选定。考虑到在实际应用中,不太可能对所述待测试***中所有模块进行全量的压力测试及稳定性测试,并且全量测试也可以拆分成各个子模块的测试,所以数据字段的收集范围为表级,不需要对整个数据库展开收集。
步骤S12:对所述目标数据字段进行分析,确定所述数据表的外部关联特征、内部关联特征以及字段特征,其中,所述外部关联特征表示当前数据表与除当前数据表之外的其他表之间的关联特征,所述内部关联特征为当前数据表中目标数据字段之间的关联特征,所述字段特征为所述目标数据字段的特征。
可以理解的是,在得到所述目标数据字段之后,还需要对所述目标数据字段进行分析,确定所述数据表的外部关联特征、内部关联特征以及字段特征,其中,所述外部关联特征表示当前数据表与除当前数据表之外的其他表之间的关联特征,所述内部关联特征为当前数据表中目标数据字段之间的关联特征,所述字段特征为所述目标数据字段的特征。
也即,通过对所述目标数据字段的分析,确定出与所述数据表存在关联的其他数据表的特征,以及所述数据表中不同的所述目标数据表之间的关联特征以及所述目标数据字段自身的特征。
其中,所述外部关联特征可以是关联表数量、单个关联表中的外键数量等。一般来说,同表的不同字段之间会存在逻辑上的关联,或者隐性上的关联。这种关联性是普遍存在的,也是构造测试数据时不可或缺的特征。例如,以订单表来说,订单的开始时间必定晚于结束时间,开始到结束的时间范围作为内部关联特征之一;订单状态和付款金额之间也有关系,状态为未付款时,付款金额为0,已付款时不为0,这个也是内部关联特征。所述字段特征是字段自身的特征,可以是字段的数值分布区间以及各区间数量占比,或是字段取值是连续或离散,或是数据长度情况等。
基于所述目标数据字段分析得到所述数据表中各条数据在不同维度上需要满足的特征,这样可以使得生成的测试数据更加接近待测试***生成的真实值,可以更可靠的测试到所述待测试***的健壮性和可行性等,使得测试结果可靠,且为所述待测试***的优化提供可靠的方向。
步骤S13:利用所述外部关联特征、所述内部关联特征以及所述字段特征生成测试数据,以便利用所述测试数据对所述待测试***进行测试。
得到所述外部关联特征、所述内部关联特征以及所述字段特征之后,便可以基于所述外部关联特征、所述内部关联特征以及所述字段特征生成测试数据,以便利用所述测试数据对所述待测试***进行测试。
可以把所述外部关联特征、所述内部关联特征以及所述字段特征导出成文本,该文本可以在预设测试数据生成***中导入,便可以生成指定数量、跟真实数据接近的测试数据。这样后续可以使用其他服务器,快速生成测试数据,做到“一处生成,到处运行”。一般作用于把数据放大,也即生成大批量的测试数据,在大批量真实数据的基础上,验证待测试***的健壮性和稳定性。
可见,本申请先对待测试***对应的数据库中预先选定的数据表进行查询并提取出所述数据表中的目标数据字段,然后对所述目标数据字段进行分析,确定所述数据表的外部关联特征、内部关联特征以及字段特征,其中,所述外部关联特征表示当前数据表与除当前数据表之外的其他表之间的关联特征,所述内部关联特征为当前数据表中目标数据字段之间的关联特征,所述字段特征为所述目标数据字段的特征,接着便可以利用所述外部关联特征、所述内部关联特征以及所述字段特征生成测试数据,以便利用所述测试数据对所述待测试***进行测试。由此可见,本申请是先对待测试***的数据库中的数据表进行目标数据字段的提取,然后对提取出来的目标数据字段进行分析,得到所述数据表的外部关联特征、内部关联特征以及字段特征,然后再根据所述外部关联特征、内部关联特征以及字段特征生成测试数据,这样测试数据是根据待测试***的已有的真实数据生成的,能够使得生成的测试数据与***实际运行生成的真实数据差异小,能够准确描述真实数据,以便对***在大数据下的优化方向进行预测,且能够生成大量的测试数据,对待测试***的健壮性进行测试。
参见图2所示,本申请实施例公开了一种具体的测试数据生成方法,该方法包括:
步骤S21:对待测试***对应的数据库中预先选定的数据表进行查询并提取出所述数据表中的目标数据字段。
首先需要对待测试***对应的数据库中预先选定的数据表进行查询并提取出所述数据表中的目标数据字段。具体的,可以获取用户设置的数据表信息以及预设数据字段信息;对待测试***对应的数据库中与所述数据表信息对应的数据表进行查询并提取所述数据表中与所述预设数据字段信息对应的目标数据字段。也即,具体需要对数据库中的哪些数据表进行查询和字段提取可以由人工指定。
步骤S22:获取数据字段删除信息,将所述目标数据字段中与所述数据字段删除信息对应的数据字段删除。
在实际应用中,提取出所述目标数据字段之后,还需要对提取出来的目标数据字段进行筛选等操作,所以需要获取数据字段删除信息,以便将所述目标数据字段中与所述数据字段删除信息对应的数据字段删除。
这样通过人工干预来提取数据字段,可以更准确的获取到数据字段,避免引入不必要的噪声,同时也是为了加快收集速度。
步骤S23:对所述目标数据字段进行分析,确定所述数据表的外部关联特征、内部关联特征以及字段特征,其中,所述外部关联特征表示当前数据表与除当前数据表之外的其他表之间的关联特征,所述内部关联特征为当前数据表中目标数据字段之间的关联特征,所述字段特征为所述目标数据字段的特征。
在具体的应用中,对所述目标数据字段进行分析,确定所述数据表的内部关联特征的过程中,具体可以利用线性判别分析法和前向搜索方法对所述目标数据字段进行分析,确定所述数据表的内部关联特征。或者,利用线性判别分析法和后向搜索方法对所述目标数据字段进行分析,确定所述数据表的内部关联特征。
也即,可以先利用线性判别分析法生成各个所述目标数据字段的特征,然后再利用前向搜索或后向搜索确定出各个特征之间的关系,以确定出所述内部关特征。
前向搜索,也即一开始只会选择一个数据字段,然后选择下一个数据字段,和上一步的数据字段共同计算特征,计算模型的交叉验证误差,依次选取其他数据字段计算特征,最后,选取交叉验证误差最小的特征,放到选择的数据字段之中,重复上一个步骤,直到遍历完所有数据字段。后向搜索,也即从所有数据字段开始,依次减少数据字段数量,计算交叉验证误差,重复这一过程,把误差最大的字段剔除候选列表中,重复上一步骤,直到只剩一个数据字段。
步骤S24:利用所述外部关联特征、所述内部关联特征以及所述字段特征生成测试数据,以便利用所述测试数据对所述待测试***进行测试。
在得到所述部关联特征、所述内部关联特征以及所述字段特征,便可以利用所述外部关联特征、所述内部关联特征以及所述字段特征生成测试数据,以便利用所述测试数据对所述待测试***进行测试。
具体的,就是获取待生成测试数据的数据量;利用所述外部关联特征、所述内部关联特征以及所述字段特征生成数据量与所述待生成测试数据的数据量相同的测试数据。
步骤S25:根据所述外部关联特征、所述内部关联特征以及所述字段特征对所述待测试***进行优化。
在实际实施过程中,确定出所述外部关联特征、所述内部关联特征以及所述字段特征之后,还可以根据所述外部关联特征、所述内部关联特征以及所述字段特征对所述待测试***进行优化。也即,得到所述外部关联特征、所述内部关联特征以及所述字段特征之后,便可以得到所述待测试***的运行情况,所以可以根据所述待测试***进行优化等操作。
在实际应用中,所述测试数据生成方法可以运用的场景包括:
某地公安态势感知平台线上运行了三年多,积累的大量真实数据,用上述测试数据生成跑出来的测试数据,可以作为基准数据做性能测试。
在重大活动期间(如G20),黑客活动比较频繁,产生了大量攻击数据。把短时间内有大量数据进入的场景,可以保留其特征,便于日后***的优化。
某网信平台举行督查工作,后台需要手动录入各类模拟数据,方便大屏的展示。针对演示场景的数据特征,本测试数据生成也能有突出表现。
在某地的公安项目中,隐患的查询页面异常的缓慢,一次业务查询需要6秒左右的时间,后台相关的表数据,数据量最大不超过70万条,显然不能满足性能的要求。需要对相关的查询做一次优化,过程如下:首先,场景提炼:查询一个月内未处理的隐患数据。然后提出数据字段并整理分析数据的外部关联特征、内部关联特征以及字段特征。然后便可以根据利用外部关联特征、内部关联特征以及字段特征生成测试数据。参见图3所示,为生成测试数据的具体过程。
整理分析数据的外部关联特征、内部关联特征以及字段特征具体如下:
外部关联特征:隐患关联了单位、网站、扫描任务等5张表。依次扫描任务,扫出了上万条隐患,单后台只看到了几百条。通过分析可知,在真实的环境中,数据删除不会真正的把数据清除,而是通过某个字段标识该数据已删除,称为软删。在本场景中,存在大量数据被软删,怀疑是人为操作或***性问题。
内部关联特征:时间和状态的关系:未处理、处理中状态大部分分布在近10天;10天前大部分数据状态为已完成。通过分析可知,近期开展了专项的***扫描工作,导致近期大量数据未处理,部分数据在处理中。网站的隐患扫描开始时间和结束时间:大部分网站会在2小时内扫描完成,少部分在2-5小时完成,还有个别网站没有结束时间。通过分析可知,扫描时间较长的网站,拥有的子域名较多,极少数没有扫描完成的网站,网站链接已经失效或转移。
自身特征:隐患开始时间:80%的数据在近一个月新增。通过分析可知,近期开展了专项的***扫描工作。隐患状态:状态可枚举:未处理,处理中,完成;各状态数据分布:未处理占不到1%,处理中占10%,完成占近90%。
通过以上特征,还可以得到如下优化建议:排查***是不是存在漏洞,同时建议把软删字段放到已有的索引中作为联合索引,加快连表速度。查询时指定时间和状态,加快查询效率。后台定期针对失效的网站进行处理。隐患状态只有3个,虽然区分度不高,但是根据数据分布情况,某些状态可以过滤大量数据,可以新加状态的索引。
参见图4所示,本申请实施例公开了一种测试数据生成装置,包括:
信息采集模块11,用于对待测试***对应的数据库中预先选定的数据表进行查询并提取出所述数据表中的目标数据字段;
字段分析模块12,用于对所述目标数据字段进行分析,确定所述数据表的外部关联特征、内部关联特征以及字段特征,其中,所述外部关联特征表示当前数据表与除当前数据表之外的其他表之间的关联特征,所述内部关联特征为当前数据表中目标数据字段之间的关联特征,所述字段特征为所述目标数据字段的特征;
数据生成模块13,用于利用所述外部关联特征、所述内部关联特征以及所述字段特征生成测试数据,以便利用所述测试数据对所述待测试***进行测试。
可见,本申请先对待测试***对应的数据库中预先选定的数据表进行查询并提取出所述数据表中的目标数据字段,然后对所述目标数据字段进行分析,确定所述数据表的外部关联特征、内部关联特征以及字段特征,其中,所述外部关联特征表示当前数据表与除当前数据表之外的其他表之间的关联特征,所述内部关联特征为当前数据表中目标数据字段之间的关联特征,所述字段特征为所述目标数据字段的特征,接着便可以利用所述外部关联特征、所述内部关联特征以及所述字段特征生成测试数据,以便利用所述测试数据对所述待测试***进行测试。由此可见,本申请是先对待测试***的数据库中的数据表进行目标数据字段的提取,然后对提取出来的目标数据字段进行分析,得到所述数据表的外部关联特征、内部关联特征以及字段特征,然后再根据所述外部关联特征、内部关联特征以及字段特征生成测试数据,这样测试数据是根据待测试***的已有的真实数据生成的,能够使得生成的测试数据与***实际运行生成的真实数据差异小,能够准确描述真实数据,以便对***在大数据下的优化方向进行预测,且能够生成大量的测试数据,对待测试***的健壮性进行测试。
在一些具体的实施过程中,所述信息采集模块11,用于:获取用户设置的数据表信息以及预设数据字段信息;对待测试***对应的数据库中与所述数据表信息对应的数据表进行查询并提取所述数据表中与所述预设数据字段信息对应的目标数据字段。
在一些具体的实施过程中,所述测试数据生成装置,还包括:
字段删除模块,用于获取数据字段删除信息;将所述目标数据字段中与所述数据字段删除信息对应的数据字段删除。
在一些具体的实施过程中,所述数据生成模块13,用于:获取待生成测试数据的数据量;利用所述外部关联特征、所述内部关联特征以及所述字段特征生成数据量与所述待生成测试数据的数据量相同的测试数据。
在一些具体的实施过程中,所述测试数据生成装置,还包括:
优化模块,用于根据所述外部关联特征、所述内部关联特征以及所述字段特征对所述待测试***进行优化。
在一些具体的实施过程中,所述字段分析模块12,用于:利用线性判别分析法和前向搜索方法对所述目标数据字段进行分析,确定所述数据表的内部关联特征。
在一些具体的实施过程中,所述字段分析模块12,用于:利用线性判别分析法和后向搜索方法对所述目标数据字段进行分析,确定所述数据表的内部关联特征。
图5所示,为本申请实施例提供的一种电子设备20的结构示意图,该电子设备20具体可以实现前述实施例中公开的测试数据生成方法步骤。
通常,本实施例中的电子设备20包括:处理器21和存储器22。
其中,处理器21可以包括一个或多个处理核心,比如四核心处理器、八核心处理器等。处理器21可以采用DSP(digital signal processing,数字信号处理)、FPGA(field-programmable gate array,现场可编程们阵列)、PLA(programmable logic array,可编程逻辑阵列)中的至少一种硬件来实现。处理器21也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(central processing unit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器21可以集成有GPU(graphics processing unit,图像处理器),GPU用于负责显示屏所需要显示的图像的渲染和绘制。一些实施例中,处理器21可以包括AI(artificialintelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器22可以包括一个或多个计算机可读存储介质,计算机可读存储介质可以是非暂态的。存储器22还可以包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。本实施例中,存储器22至少用于存储以下计算机程序221,其中,该计算机程序被处理器21加载并执行之后,能够实现前述任一实施例中公开的测试数据生成方法步骤。
在一些实施例中,电子设备20还可包括有显示屏23、输入输出接口24、通信接口25、传感器26、电源27以及通信总线28。
本技术领域人员可以理解,图5中示出的结构并不构成对电子设备20的限定,可以包括比图示更多或更少的组件。
进一步的,本申请实施例还公开了一种计算机可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现前述任一实施例中公开的测试数据生成方法。
其中,关于上述测试数据生成方法的具体过程可以参考前述实施例中公开的相应内容,在此不再进行赘述。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
最后,还需要说明的是,在本文中,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或者操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得一系列包含其他要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本申请所提供的一种测试数据生成方法、装置、设备、介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种测试数据生成方法,其特征在于,包括:
对待测试***对应的数据库中预先选定的数据表进行查询并提取出所述数据表中的目标数据字段;
对所述目标数据字段进行分析,确定所述数据表的外部关联特征、内部关联特征以及字段特征,其中,所述外部关联特征表示当前数据表与除当前数据表之外的其他表之间的关联特征,所述内部关联特征为当前数据表中目标数据字段之间的关联特征,所述字段特征为所述目标数据字段的特征;
利用所述外部关联特征、所述内部关联特征以及所述字段特征生成测试数据,以便利用所述测试数据对所述待测试***进行测试。
2.根据权利要求1所述的测试数据生成方法,其特征在于,所述对待测试***对应的数据库中预先选定的数据表进行查询并提取出所述数据表中的目标数据字段,包括:
获取用户设置的数据表信息以及预设数据字段信息;
对待测试***对应的数据库中与所述数据表信息对应的数据表进行查询并提取所述数据表中与所述预设数据字段信息对应的目标数据字段。
3.根据权利要求1所述的测试数据生成方法,其特征在于,所述对待测试***对应的数据库中预先选定的数据表进行查询并提取出所述数据表中的目标数据字段之后,还包括:
获取数据字段删除信息;
将所述目标数据字段中与所述数据字段删除信息对应的数据字段删除。
4.根据权利要求1所述的测试数据生成方法,其特征在于,所述利用所述外部关联特征、所述内部关联特征以及所述字段特征生成测试数据,包括:
获取待生成测试数据的数据量;
利用所述外部关联特征、所述内部关联特征以及所述字段特征生成数据量与所述待生成测试数据的数据量相同的测试数据。
5.根据权利要求1所述的测试数据生成方法,其特征在于,所述对所述目标数据字段进行分析,确定所述数据表的外部关联特征、内部关联特征以及字段特征之后,还包括:
根据所述外部关联特征、所述内部关联特征以及所述字段特征对所述待测试***进行优化。
6.根据权利要求1至5任一项所述的测试数据生成方法,其特征在于,所述对所述目标数据字段进行分析,确定所述数据表的内部关联特征,包括:
利用线性判别分析法和前向搜索方法对所述目标数据字段进行分析,确定所述数据表的内部关联特征。
7.根据权利要求1至5任一项所述的测试数据生成方法,其特征在于,所述对所述目标数据字段进行分析,确定所述数据表的内部关联特征,包括:
利用线性判别分析法和后向搜索方法对所述目标数据字段进行分析,确定所述数据表的内部关联特征。
8.一种测试数据生成装置,其特征在于,包括:
信息采集模块,用于对待测试***对应的数据库中预先选定的数据表进行查询并提取出所述数据表中的目标数据字段;
字段分析模块,用于对所述目标数据字段进行分析,确定所述数据表的外部关联特征、内部关联特征以及字段特征,其中,所述外部关联特征表示当前数据表与除当前数据表之外的其他表之间的关联特征,所述内部关联特征为当前数据表中目标数据字段之间的关联特征,所述字段特征为所述目标数据字段的特征;
数据生成模块,用于利用所述外部关联特征、所述内部关联特征以及所述字段特征生成测试数据,以便利用所述测试数据对所述待测试***进行测试。
9.一种电子设备,其特征在于,包括:
存储器和处理器;
其中,所述存储器,用于存储计算机程序;
所述处理器,用于执行所述计算机程序,以实现权利要求1至7任一项所述的测试数据生成方法。
10.一种计算机可读存储介质,其特征在于,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的测试数据生成方法。
CN202011364238.4A 2020-11-27 2020-11-27 一种测试数据生成方法、装置、设备及介质 Pending CN112328499A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011364238.4A CN112328499A (zh) 2020-11-27 2020-11-27 一种测试数据生成方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011364238.4A CN112328499A (zh) 2020-11-27 2020-11-27 一种测试数据生成方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN112328499A true CN112328499A (zh) 2021-02-05

Family

ID=74309514

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011364238.4A Pending CN112328499A (zh) 2020-11-27 2020-11-27 一种测试数据生成方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN112328499A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114116729A (zh) * 2022-01-18 2022-03-01 荣耀终端有限公司 一种测试数据的处理方法和设备
CN114138651A (zh) * 2021-12-03 2022-03-04 马上消费金融股份有限公司 测试数据的生成方法及装置
CN114490390A (zh) * 2022-01-25 2022-05-13 中国农业银行股份有限公司 测试数据生成方法、装置、设备及存储介质
CN116303102A (zh) * 2023-05-19 2023-06-23 建信金融科技有限责任公司 测试数据的生成方法、装置、电子设备和存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130347127A1 (en) * 2012-06-25 2013-12-26 Bank Of America Corporation Database management by analyzing usage of database fields
CN103870381A (zh) * 2012-12-10 2014-06-18 百度在线网络技术(北京)有限公司 一种测试数据生成方法及装置
CN109117377A (zh) * 2018-08-31 2019-01-01 杭州安恒信息技术股份有限公司 一种基于建表语句的测试数据自动生成方法、装置及设备
CN110471833A (zh) * 2019-06-27 2019-11-19 网宿科技股份有限公司 一种测试数据的获取方法、电子设备及存储介质
CN111290948A (zh) * 2020-01-19 2020-06-16 腾讯科技(深圳)有限公司 测试数据获取方法、装置、计算机设备及可读存储介质
CN111382083A (zh) * 2020-04-30 2020-07-07 中国银行股份有限公司 测试数据的生成方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130347127A1 (en) * 2012-06-25 2013-12-26 Bank Of America Corporation Database management by analyzing usage of database fields
CN103870381A (zh) * 2012-12-10 2014-06-18 百度在线网络技术(北京)有限公司 一种测试数据生成方法及装置
CN109117377A (zh) * 2018-08-31 2019-01-01 杭州安恒信息技术股份有限公司 一种基于建表语句的测试数据自动生成方法、装置及设备
CN110471833A (zh) * 2019-06-27 2019-11-19 网宿科技股份有限公司 一种测试数据的获取方法、电子设备及存储介质
CN111290948A (zh) * 2020-01-19 2020-06-16 腾讯科技(深圳)有限公司 测试数据获取方法、装置、计算机设备及可读存储介质
CN111382083A (zh) * 2020-04-30 2020-07-07 中国银行股份有限公司 测试数据的生成方法及装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114138651A (zh) * 2021-12-03 2022-03-04 马上消费金融股份有限公司 测试数据的生成方法及装置
CN114138651B (zh) * 2021-12-03 2024-06-11 马上消费金融股份有限公司 测试数据的生成方法及装置
CN114116729A (zh) * 2022-01-18 2022-03-01 荣耀终端有限公司 一种测试数据的处理方法和设备
CN114116729B (zh) * 2022-01-18 2022-06-17 荣耀终端有限公司 一种测试数据的处理方法和设备
CN114490390A (zh) * 2022-01-25 2022-05-13 中国农业银行股份有限公司 测试数据生成方法、装置、设备及存储介质
CN116303102A (zh) * 2023-05-19 2023-06-23 建信金融科技有限责任公司 测试数据的生成方法、装置、电子设备和存储介质
CN116303102B (zh) * 2023-05-19 2023-08-11 建信金融科技有限责任公司 测试数据的生成方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
CN112328499A (zh) 一种测试数据生成方法、装置、设备及介质
CN108090567B (zh) 电力通信***故障诊断方法及装置
AU2013329525B2 (en) System and method for recursively traversing the internet and other sources to identify, gather, curate, adjudicate, and qualify business identity and related data
CN107239392B (zh) 一种测试方法、装置、终端及存储介质
CN111382070B (zh) 兼容性测试方法、装置、存储介质和计算机设备
CN107797916B (zh) Ddl语句审核方法和装置
CN108874661B (zh) 测试映射关系库生成方法、装置、计算机设备和存储介质
CN110737594A (zh) 自动生成测试用例的数据库标准符合性测试方法及装置
JP6419667B2 (ja) テストdbデータ生成方法及び装置
CN113220588A (zh) 一种数据处理的自动化测试方法、装置、设备及存储介质
CN116881156A (zh) 一种自动化测试方法、装置、设备及存储介质
CN117495544A (zh) 一种基于沙箱的风控评估方法、***、终端及存储介质
CN116775488A (zh) 异常数据确定方法、装置、设备、介质及产品
CN111078671A (zh) 数据表字段的修改方法、装置、设备和介质
CN107273293B (zh) 大数据***性能测试方法、装置及电子设备
CN116069650A (zh) 一种测试用例的生成方法及装置
CN114519008A (zh) 一种回归测试用例的推荐方法、装置、介质及设备
CN114265780A (zh) 一种报表***的测试方法、***、设备及存储介质
CN113742208A (zh) 一种软件检测方法、装置、设备及计算机可读存储介质
CN112527757A (zh) 基于大规模芯片测试结果的快速检索方法
CN113568662B (zh) 一种基于调用关系的代码变更影响范围分析方法及***
CN114860549B (zh) 埋点数据校验方法、装置、设备和存储介质
CN116401177B (zh) 一种ddl正确性检测方法、设备及介质
CN115470149A (zh) 数据库预处理功能测试方法、装置、设备及存储介质
CN115543836A (zh) 脚本质量检测方法以及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination