CN117251320A - 多节点服务器测试方法及装置 - Google Patents
多节点服务器测试方法及装置 Download PDFInfo
- Publication number
- CN117251320A CN117251320A CN202311150427.5A CN202311150427A CN117251320A CN 117251320 A CN117251320 A CN 117251320A CN 202311150427 A CN202311150427 A CN 202311150427A CN 117251320 A CN117251320 A CN 117251320A
- Authority
- CN
- China
- Prior art keywords
- node
- abnormal
- node server
- test
- fault
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012360 testing method Methods 0.000 title claims abstract description 318
- 230000002159 abnormal effect Effects 0.000 claims abstract description 285
- 230000005856 abnormality Effects 0.000 claims abstract description 43
- 238000004458 analytical method Methods 0.000 claims description 138
- 238000000034 method Methods 0.000 claims description 55
- 238000001514 detection method Methods 0.000 claims description 38
- 238000000605 extraction Methods 0.000 claims description 25
- 230000008569 process Effects 0.000 claims description 24
- 238000012549 training Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 10
- 238000003860 storage Methods 0.000 claims description 9
- 238000010276 construction Methods 0.000 claims description 5
- 238000010998 test method Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 11
- 230000006870 function Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 238000011056 performance test Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000012827 research and development Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000005923 long-lasting effect Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000007334 memory performance Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/22—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
- G06F11/2273—Test methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/22—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
- G06F11/2268—Logging of test results
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Test And Diagnosis Of Digital Computers (AREA)
Abstract
本发明提供一种多节点服务器测试方法及装置,涉及测试和计算设备技术领域,其中,所述多节点服务器测试方法,包括:根据待测试的多节点服务器的应用场景,构建测试集;基于所述测试集对所述多节点服务器中的各节点进行测试,并记录各所述节点的运行数据;在各所述节点中存在异常节点的情况下,根据所述异常节点的所述运行数据进行节点异常检测,得到测试结果。本发明不仅能够自动对异常节点进行分析,得出故障原因,辅助测试人员发现问题,以便后续对问题进行解决,还能够模拟实际应用场景,进而提高测试效果。
Description
技术领域
本发明涉及测试和计算设备技术领域,尤其涉及一种多节点服务器测试方法及装置。
背景技术
随着经济社会的高速发展,多节点服务器产业迅速崛起,海量数据正以前所未有的增长趋势冲击着各个行业,对多节点服务器的可维护性也提出了更高的要求。多节点服务器在研发设计、生产过程和使用中均需要进行自动化测试,以此检验服务器的实际工作效能。
目前对多节点服务器进行测试时,测试内容单一,并不能有效模拟实际的应用场景,从而导致对多节点服务器的测试效果不理想。因此,亟需一种有效的方案以解决上述问题。
发明内容
针对相关技术存在的问题,本发明实施例提供一种多节点服务器测试方法及装置。
本发明提供一种多节点服务器测试方法,包括:
根据待测试的多节点服务器的应用场景,构建测试集;
基于所述测试集对所述多节点服务器中的各节点进行测试,并记录各所述节点的运行数据;
在各所述节点中存在异常节点的情况下,根据所述异常节点的所述运行数据进行节点异常检测,得到测试结果。
根据本发明提供的一种多节点服务器测试方法,所述根据所述异常节点的所述运行数据进行节点异常检测,得到测试结果,包括:
将所述异常节点的所述运行数据输入预训练的故障原因分析模型中进行节点异常检测,得到所述异常节点的故障原因分析结果;
根据所述异常节点的标识、异常状态和所述故障原因分析结果,生成测试结果。
根据本发明提供的一种多节点服务器测试方法,所述故障原因分析模型包括类别解析单元、特征提取单元、部件定位单元、特征定位单元和故障原因匹配单元;
相应地,所述将所述异常节点的所述运行数据输入预训练的故障原因分析模型中进行节点异常检测,得到所述异常节点的故障原因分析结果,包括:
将所述异常节点的所述运行数据输入至所述类别解析单元进行类别解析,得到所述异常节点对应的故障类别;将所述异常节点的所述运行数据输入至所述特征提取单元进行特征提取,得到初始异常特征,所述初始异常特征表征所述异常节点发生的故障现象;
将所述故障类别输入至所述部件定位单元进行定位处理,确定异常部件;
将所述异常部件对应的至少一个预设异常特征和所述初始异常特征输入至所述特征定位单元进行特征定位,得到目标异常特征,所述目标异常特征为所述初始异常特征相匹配的预设异常特征;
将所述目标异常特征输入至所述故障原因匹配单元进行故障原因匹配,得到所述异常节点的故障原因分析结果。
根据本发明提供的一种多节点服务器测试方法,所述将所述异常节点的所述运行数据输入预训练的故障原因分析模型中进行节点异常检测之前,还包括:
采集历史异常节点的历史运行数据和历史故障原因;
将所述历史运行数据输入至初始分析模型中进行节点异常检测,得到预测故障原因;
根据所述预测故障原因和所述历史故障原因计算损失值;
根据所述损失值调整所述初始分析模型的模型参数,继续执行所述采集历史异常节点的历史运行数据和历史故障原因的步骤,直至达到预设训练停止条件,得到训练好的故障原因分析模型。
根据本发明提供的一种多节点服务器测试方法,所述根据待测试的多节点服务器的应用场景,构建测试集之前,还包括:
获取待测试的多节点服务器的型号;
检索所述型号对应的应用数据;
根据所述应用数据,对所述多节点服务器进行解析,确定所述多节点服务器对应的工作应用范围;
对所述工作应用范围进行场景划分,得到所述多节点服务器的应用场景;
相应地,所述根据待测试的多节点服务器的应用场景,构建测试集,包括:
根据待测试的多节点服务器的应用场景,确定至少一个待测试任务;
收集各所述待测试任务对应的测试用例;
根据各所述测试用例构建测试集;
相应地,所述基于所述测试集对所述多节点服务器中的各节点进行测试,包括:
根据所述应用场景,确定各所述待测试任务的执行顺序;
根据所述执行顺序,加载所述测试集中的各所述测试用例对所述多节点服务器中的各节点进行测试。
根据本发明提供的一种多节点服务器测试方法,所述在各所述节点中存在异常节点的情况下,根据所述异常节点的所述运行数据进行节点异常检测,得到测试结果之前,还包括:
获取测试过程中产生的测试脚本;
对所述测试脚本中的返回值进行解析,确定各所述节点中是否存在异常节点。
根据本发明提供的一种多节点服务器测试方法,还包括:
在测试过程中,实时显示各所述节点的节点状态,所述节点状态包括正常状态和异常状态。
根据本发明提供的一种多节点服务器测试方法,所述记录各所述节点的运行数据之后,还包括:
根据各所述节点的运行数据,生成测试日志。
本发明还提供一种多节点服务器测试装置,包括:
构建模块,被配置为根据待测试的多节点服务器的应用场景,构建测试集;
测试模块,被配置为基于所述测试集对所述多节点服务器中的各节点进行测试,并记录各所述节点的运行数据;
检测模块,被配置为在各所述节点中存在异常节点的情况下,根据所述异常节点的所述运行数据进行节点异常检测,得到测试结果。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述多节点服务器测试方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述多节点服务器测试方法。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述多节点服务器测试方法。
本发明提供的多节点服务器测试方法及装置,通过根据待测试的多节点服务器的应用场景,构建测试集,不仅提高测试集与应用场景之间的关联性,进而保证测试时可以有效模拟实际应用场景,提高对多节点服务器的测试效果和测试可靠性;且通过测试集对多节点服务器中的各节点进行测试,并记录各节点的运行数据,并在各节点中存在异常节点的情况下,根据异常节点的运行数据进行节点异常检测,得到测试结果,能够自动对异常节点进行分析,得出故障原因,辅助测试人员发现问题,以便后续对问题进行解决。
附图说明
为了更清楚地说明本发明或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的多节点服务器测试方法的流程示意图之一;
图2是本发明提供的节点异常检测的流程示意图;
图3是本发明提供的显示节点状态的流程示意图;
图4是本发明提供的多节点服务器测试方法的流程示意图之二;
图5是本发明提供的多节点服务器测试装置的结构示意图;
图6是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了便于更加清晰地理解本发明各实施例,首先对一些相关的背景进行如下介绍。
随着经济社会的高速发展,服务器产业迅速崛起,海量数据正以前所未有的增长趋势冲击着各个行业,对服务器的可维护性也提出了更高的要求。服务器在研发设计、生产过程和使用中均需要进行自动化测试,以此检验服务器的实际工作效能。
服务器是计算机的一种,它比普通计算机运行更快、负载更高且价格更贵。服务器在网络中为其它客户机,如个人计算机(PC,Personal Computer)、智能手机、自动取款机(ATM,Automatic Teller Machine)等终端,甚至是火车***等大型设备,提供计算或者应用服务。服务器具有高速的核心处理器(CPU,Central Processing Unit)运算能力、长时间的可靠运行、强大的输入/输出(I/O,Input/Output)外部数据吞吐能力以及更好的扩展性。
服务器包括可扩展性、易使用性和可用性等特性。下面对服务器的可扩展性、易使用性和可用性进行简要说明。
服务器必须具有一定的可扩展性,这是因为企业网络不可能长久不变,特别是在当今信息时代,如果服务器没有一定的可扩展性,当用户一增多服务器就不能胜任的话,一台价值几万甚至几十万的服务器在短时间内就要遭到淘汰,这是任何企业都无法承受的。为了保持服务器的可扩展性,通常服务器上具备一定的可扩展空间和冗余件,如磁盘阵列架位、***器件互联(PCI,Peripheral Component Interconnect)和内存条插槽位等。可扩展性的具体体现在以下几个方面:硬盘是否可扩充、CPU是否可升级或扩展,以及***是否支持WindowsNT、Linux或UNIX等多种可选主流操作***等,只有这样才能保持前期投资的服务器在后期被充分利用。
服务器的功能相对于PC机来说复杂许多,不仅指其硬件配置,更多的是指其软件***配置。服务器要实现如此多的功能,没有全面的软件支持是无法想象的。但是软件***一多,又可能造成服务器的使用性能下降,管理人员无法有效操纵。所以许多服务器厂商在设计服务器时,除了要充分考虑服务器的可用性和稳定性等方面外,还必须在服务器的易使用性方面下足功夫。服务器的易使用性主要体现在以下几个方面:服务器是不是容易操作、用户导航***是不是完善、机箱设计是不是人性化、有没有关键恢复功能、是否有操作***备份,以及有没有足够的培训支持等。
对于服务器而言,一个非常重要的方面就是它的可用性,即所选的服务器能满足长期稳定工作的要求,不能经常出问题。
随着服务器的快速发展,高端机型服务器运用而生,如多节点服务器。多节点服务器中包含多个节点,每一个节点都是一个独立提供服务的子服务器。目前对多节点服务器的测试主要测试项包括服务器的健康功能检测、CPU性能测试、内存性能测试,硬盘性能测试、网络性能测试等,包括监测各输入输出口的温度是否在要求范围内,以及各关键部件要求监控的输入输出电压是否在标准范围内。若某一项测试值出现异常就会出现错误并提示对应的报错节点及报错代码,例如某一个节点的某个部件某一项的电压值出现异常、某个节点内存要求的数量与实际不符、某个节点内设备出现异常或者某个高速串行计算机扩展总线标准(PCIE,Peripheral Component Interconnect Express)链路出现错误,则提示对应的报错节点及报错代码。
目前对多节点服务器进行测试时,测试内容单一,并不能有效模拟实际应用场景,从而导致对多节点服务器的测试效果不理想。且相关技术中,对多节点服务器进行测试时,通常在运行的测试脚本报错时,根据测试脚本对故障进行初步定位,并输出对应报错内容。但该方法存在以下几点不足:对报错产生的原因无法准确清晰地定位,如无法准确清晰解析出具体是哪个部件内部的哪个值出现异常导致的测试报错;部分报错解析不清楚,需相关人员,如工程人员和/或生产人员,作大量的验证才能逐步定位找出报错的根因,耗费大量解析时间;且无法区分报错原因是软件问题还是硬件问题,需要相关人员一一进行排查确认,耗时耗力。
可见,相关技术虽然能将测试运行脚本报错的内容进行初步定位,并将报错内容进行截取输出,但无法进一步对报错内容的根因做进一步分析;对某个报错项,无法准确定位其是否是硬件问题、还是软件问题;无法确定部件的某个测试值出现异常时,是与该部件相连的部件出问题,还是间接相连的部件出异常导致;有一部分测试项,其测试脚本是由甲方或者第三方提供,碍于特殊情况,如保密需求,报错的解析不清楚,相关人员仅凭报错的内容,根本无法定位报错的根因,需要大量重复的沟通和验证,浪费相关人员大量的时间及精力,同时对生产维修工作也是一个巨大的挑战。
因此,本发明提供多节点服务器测试方法及装置以解决部分上述问题。具体地,通过根据待测试的多节点服务器的应用场景,构建测试集,不仅提高测试集与应用场景之间的关联性,进而保证测试时可以有效模拟实际应用场景,提高对多节点服务器的测试效果和测试可靠性;且通过测试集对多节点服务器中的各节点进行测试,并记录各节点的运行数据,并在各节点中存在异常节点的情况下,根据异常节点的运行数据进行节点异常检测,得到测试结果,能够自动对异常节点进行分析,得出故障原因,辅助测试人员发现问题,以便后续对问题进行解决。
下面结合图1-图5描述本发明的多节点服务器测试方法及装置。
图1是本发明提供的多节点服务器测试方法的流程示意图之一,参见图1所示,包括步骤101-步骤103,其中:
步骤101:根据待测试的多节点服务器的应用场景,构建测试集。
首先需要说明的是,本发明的执行主体可以是测试多节点服务器的任何电子设备,例如可以为智能手机、智能手表、台式电脑、手提电脑等任何一种。
具体地,应用场景是指多节点服务器进行服务的类型,如游戏场景、人工智能(Artificial Intelligence,AI)场景和会议服务场景等。测试集用于评估多节点服务器的性能,是对多节点服务器进行测试的测试用例(Test Case)的集合,其中,测试用例是指对一项特定的功能或节点进行测试任务的描述,体现测试方案、方法、技术和策略。
由于不同的多节点服务器所服务的内容不同,即对应的应用场景不同,因此,不同的多节点服务器进行测试时所采用的测试集也应该有所区别。为提高测试效果,可以根据多节点服务器的应用场景获取对应的测试集。
实际应用中,先确定待测试的多节点服务器,然后获取该多节点服务器的应用场景。
示例性地,可以对多节点服务器的服务内容进行解析,得到多节点服务器的应用场景。
示例性地,可以对多节点服务器关联的网页、软件和应用程度等中的至少一个进行场景分析,得到多节点服务器的应用场景。
进一步地,在获取到应用场景之后,根据该应用场景为该多节点服务器构建测试集。
示例性地,预先构建了测试库,测试库中包含针对不同的应用场景预先构建的测试集。在获取到待测试的多节点服务器的应用场景之后,根据该应用场景从测试库中查找对应的测试集即可。
示例性地,可以多节点服务器的应用场景,查找与该应用场景关联的测试用例,进而构成测试集。
步骤102:基于所述测试集对所述多节点服务器中的各节点进行测试,并记录各所述节点的运行数据。
具体地,运行数据是指节点在执行测试集指示的任务时,所产生的数据,如开始执行时间、执行结束时间、执行时长、执行所占用的存储空间和执行参数等。
实际应用中,在获取到测试集之后,对多节点服务器进行测试:加载测试集,通过测试集对多节点服务器中的各节点进行测试。并记录测试过程中各节点的运行数据。
步骤103:在各所述节点中存在异常节点的情况下,根据所述异常节点的所述运行数据进行节点异常检测,得到测试结果。
具体地,异常节点是指出现报错的节点。节点异常检测是指对异常节点报错的原因或故障进行检测。
实际应用中,若测试过程报错,即多节点服务器中存在异常节点。针对每个异常节点,根据该异常节点对应的运行数据进行节点异常检测,从而得到异常节点的故障原因或者异常原因。此时,测试结果可以包括异常节点及其对应的故障原因或者异常原因;测试结果还可以包括异常节点及其对应的故障原因或者异常原因,以及正常节点。
需要说明的是,若测试过程没有报错,则说明所有节点均正常,则测试结果为表征各节点均正常的信息。
本发明提供的多节点服务器测试方法,通过根据待测试的多节点服务器的应用场景,构建测试集,不仅提高测试集与应用场景之间的关联性,进而保证测试时可以有效模拟实际应用场景,提高对多节点服务器的测试效果和测试可靠性;且通过测试集对多节点服务器中的各节点进行测试,并记录各节点的运行数据,并在各节点中存在异常节点的情况下,根据异常节点的运行数据进行节点异常检测,得到测试结果,能够自动对异常节点进行分析,得出故障原因,辅助测试人员发现问题,以便后续对问题进行解决。
在本发明一个或更多个可选的实施例中,所述根据所述异常节点的所述运行数据进行节点异常检测,得到测试结果,具体实现过程可以如下:
将所述异常节点的所述运行数据输入预训练的故障原因分析模型中进行节点异常检测,得到所述异常节点的故障原因分析结果;
根据所述异常节点的标识、异常状态和所述故障原因分析结果,生成测试结果。故障原因分析结果是指造成节点出现异常的根因和/或故障。
具体地,故障原因分析模型用于分析故障原因和/或报错的根因。
实际应用中,参见图2,图2是本发明提供的节点异常检测的流程示意图:将所述异常节点的所述运行数据输入预训练的故障原因分析模型中进行节点异常检测,得到所述异常节点的故障原因分析结果,包括步骤201和步骤202:
步骤201:将异常节点的运行数据输入至故障原因分析模型进行节点异常检测;
步骤202:由故障原因分析模型输出异常节点的故障原因分析结果。
如此,采用预训练的故障原因分析结果进行节点异常检测,不仅能够提高节点异常检测的效率,节省大量人力物力,还可以避免人工进行节点异常检测存在主观臆断而造成的结果不准确的问题,即可以提高节点异常检测的准确率。
在本发明一个或更多个可选的实施例中,所述将所述异常节点的所述运行数据输入预训练的故障原因分析模型中进行节点异常检测,得到所述异常节点的故障原因分析结果之前,还包括:
提取所述异常节点的所述运行数据中的目标关键字;
将所述目标关键字与各预设关键字进行匹配;
相应地,所述将所述异常节点的运行数据输入预训练的故障原因分析模型中进行节点异常检测,得到所述异常节点的故障原因分析结果,包括:
在匹配失败的情况下,将所述异常节点的运行数据输入预训练的故障原因分析模型中进行节点异常检测,得到所述异常节点的故障原因分析结果。
在本发明一个或更多个可选的实施例中,所述将所述目标关键字与各预设关键字进行匹配之后,还包括:
在匹配成功的情况下,从预设故障原因分析结果库中查找所述目标关键对应的故障原因分析结果作为所述异常节点的故障原因分析结果。
如此,通过目标关键字与各预设关键字进行匹配,若匹配成功,可以从预设故障原因分析结果库中查找匹配成功的预设关键字或目标关键字对应的预设故障原因分析结果,其中预设故障原因分析结果库中预设故障原因分析结果与关键字关联存储。若比配失败,则利用故障原因分析模型确定故障原因分析结果。可以提高确定故障原因分析结果的效率。
在本发明一个或更多个可选的实施例中,所述故障原因分析模型包括类别解析单元、特征提取单元、部件定位单元、特征定位单元和故障原因匹配单元;相应地,所述将所述异常节点的所述运行数据输入预训练的故障原因分析模型中进行节点异常检测,得到所述异常节点的故障原因分析结果,具体实现过程可以如下:
将所述异常节点的所述运行数据输入至所述类别解析单元进行类别解析,得到所述异常节点对应的故障类别;将所述异常节点的所述运行数据输入至所述特征提取单元进行特征提取,得到初始异常特征,所述初始异常特征表征所述异常节点发生的故障现象;
将所述故障类别输入至所述部件定位单元进行定位处理,确定异常部件;
将所述异常部件对应的至少一个预设异常特征和所述初始异常特征输入至所述特征定位单元进行特征定位,得到目标异常特征,所述目标异常特征为所述初始异常特征相匹配的预设异常特征;
将所述目标异常特征输入至所述故障原因匹配单元进行故障原因匹配,得到所述异常节点的故障原因分析结果。
具体地,类别解析单元是指故障原因分析模型中进行故障类型预测的单元。特征提取单元是指故障原因分析模型中确定异常现象的单元。部件定位单元是指故障原因分析模型中确定异常部件的单元。预设异常特征是指针对不同部件,预先设置的可能会发生的异常现象所对应的特征。特征定位单元是指故障原因分析模型中确定目标异常特征的单元。故障原因匹配单元是指故障原因分析模型中确定目标故障原因的单元。
实际应用中,可以将异常节点的运行数据输入至类别解析单元,由类别解析单元对异常节点的运行数据进行类别解析,即故障类型预测,如识别是软体出现故障还是硬件出现故障,又如是软体中的固件(Firmware,FW)版本出现故障,还是软体中的***日志出现故障,亦或者软体中的部件日志或其他出现故障,再如是硬件中的核心处理器(CentralProcessing Unit,CPU)出现故障,还是硬件中的内存出现故障,亦或者硬件中的硬盘或其他出现故障。从而确定该异常节点发生异常所对应的故障类别,其中,故障类别包括软体故障类别和硬件故障类别,软体故障类别包括FW版本故障类别、***日志类别和部件日志故障类别等,硬件故障类别包括CPU故障类别、内存故障类别和硬盘故障类别等。
可以将异常节点的运行数据输入至特征提取单元,由特征提取单元对确定异常节点的运行数据进行分析,确定运行数据中保证异常现象的数据,从而得到初始异常特征。
可以将获取的故障类别输入至部件定位单元,由部件定位单元根据故障类别定位到发生故障的部件,即异常部件,例如故障类别为硬件故障类别中的硬盘故障类别,则将硬盘对应硬件部件确定为异常部件,又如故障类别为软体故障类别中的硬盘故障类别,则将硬盘对应软体部件(如硬盘程序)确定为异常部件。
进一步地,在确定了异常部件和初始异常特征的基础上,将异常部件和初始异常特征输入至特征定位单元,由特征定位单元获取异常部件对应的至少一个预设异常特征,并将初始异常特征与异常部件对应的至少一个预设异常特征进行特征匹配,即特征定位,将匹配成功的预设异常特征作为目标异常特征。或者,在确定了异常部件和初始异常特征的基础上,获取异常部件对应的至少一个预设异常特征,将获取异常部件对应的至少一个预设异常特征和初始异常特征输入至特征定位单元,由特征定位单元将初始异常特征与异常部件对应的至少一个预设异常特征进行特征匹配,将匹配成功的预设异常特征作为目标异常特征。
需要说明的是,获取异常部件对应的至少一个预设异常特征可以为:故障原因分析模型从故障原因分析模型所关联或自带的特征库中获取得到,如将异常部件与特征库中的各预设异常特征进行匹配,确定异常部件对应的至少一个预设异常特征;又如从特征库中提取标注有异常标识的预设异常特征,该异常标识为该异常部件的标识,如名称、ID、IP等。
此外,针对特征的匹配成功可以为:预设异常特征与初始异常特征之间的特征相似度大于设定阈值,或者其他可实现的方式。
进一步地,将目标异常特征输入至故障原因匹配单元,由故障原因匹配单元从故障原因分析模型所关联或自带的故障原因中获取目标异常特征所匹配的目标故障原因,所有目标故障原因构成异常节点的故障原因分析结果。
如此,通过故障原因分析结果中的类别解析单元、特征提取单元、部件定位单元、特征定位单元和故障原因匹配单元对异常节点的运行数据进行继承性处理,可以极大地提高节点异常检测的可靠性和故障原因分析结果的准确率。
需要说明的是,可以先将所述异常节点的所述运行数据输入至所述类别解析单元进行类别解析,得到所述异常节点对应的故障类别,然后将所述异常节点的所述运行数据输入至所述特征提取单元进行特征提取,得到初始异常特征;可以先将所述异常节点的所述运行数据输入至所述特征提取单元进行特征提取,得到初始异常特征,再将所述异常节点的所述运行数据输入至所述类别解析单元进行类别解析,得到所述异常节点对应的故障类别;还可以在将所述异常节点的所述运行数据输入至所述类别解析单元进行类别解析,得到所述异常节点对应的故障类别的同时,将所述异常节点的所述运行数据输入至所述特征提取单元进行特征提取,得到初始异常特征。本发明对此不做任何限定,保证将所述异常部件对应的至少一个预设异常特征和所述初始异常特征输入至所述特征定位单元进行特征定位之前,获取到初始异常特征,以及将所述故障类别输入至所述部件定位单元进行定位处理之前,获取到故障类别即可。
在本发明一个或更多个可选的实施例中,所述将所述异常节点的所述运行数据输入预训练的故障原因分析模型中进行节点异常检测之前,还包括:根据历史异常数据和历史故障原因对初始分析模型进行训练,得到故障原因分析模型。
具体地,历史异常数据是指历史异常节点对应的历史运行数据。历史故障原因是指历史异常节点出现故障的真实根因。初始分析模型是指具有故障分析功能且未训练的模型。
实际应用中,可以采用采集的多节点服务器历史异常数据以及历史故障原因作为样本集,对初始分析模型进行训练得到的故障原因分析模型。如此,可以提高故障原因分析模型的鲁棒性、分析效率和准确率。
可选地,所述根据历史异常数据和历史故障原因对初始分析模型进行训练,得到故障原因分析模型,具体实现过程可以如下:
采集历史异常节点的历史运行数据和历史故障原因;
将所述历史运行数据输入至初始分析模型中进行节点异常检测,得到预测故障原因;
根据所述预测故障原因和所述历史故障原因计算损失值;
根据所述损失值调整所述初始分析模型的模型参数,继续执行所述采集历史异常节点的历史运行数据和历史故障原因的步骤,直至达到预设训练停止条件,得到训练好的故障原因分析模型。
具体地,历史异常节点是指多节点服务之前出现过异常或报错的节点。预设训练停止条件可以是损失值小于损失阈值,可以是迭代次数达到次数阈值,可以是损失值的变化率低于变化率阈值,还可以是前面几种的组合。本发明对此不作任何限制。
实际应用中,可以采集待测试的多节点服务器和/或其他多节点服务器出现的多个报错,获取每个报错对应的历史异常节点,进而获取该历史异常节点的历史运行数据和历史故障原因。将每组历史运行数据和历史故障原因作为一个样本,构成样本集。其中,样本集中可以包括同一历史异常节点针对不同的报错,所对应的历史运行数据和历史故障原因,还可以包括不同的历史异常节点所对应的历史运行数据和历史故障原因。
进一步地,可以从样本集中获取任一样本,将该样本中的历史运行数据输入至未训练的初始分析模型中进行节点异常检测,得到预测故障原因,将该预测故障原因与该样本中的历史故障原因按照预设的损失计算策略进行计算,得到损失值。然后根据损失值对初始分析模型进行参数优化,如反向调整初始分析模型的模型参数。然后继续从样本集中获取任一样本对初始分析模型进行参数优化,直至达到预设训练停止条件,将训练好初始分析模型确定为故障原因分析模型。
如此,通过历史数据(历史运行数据和历史故障原因)对初始分析模型进行训练,有利于提高故障原因分析模型的进行异常节点检测的学习效率,从而提高故障原因分析模型的鲁棒性、分析效率和准确率。
在所述故障原因分析模型包括类别解析单元、特征提取单元、部件定位单元、特征定位单元和故障原因匹配单元的情况下,所述将所述历史运行数据输入至初始分析模型中进行节点异常检测,得到预测故障原因,包括:将所述历史运行数据输入至所述类别解析单元进行类别解析,得到所述异常节点对应的预测故障类别;将所述历史运行数据输入至所述特征提取单元进行特征提取,得到初始预测异常特征;将所述预测故障类别输入至所述部件定位单元进行定位处理,确定预测异常部件;将所述预测异常部件对应的至少一个预设异常特征和所述初始预测异常特征输入至所述特征定位单元进行特征定位,得到目标预测异常特征;将所述目标预测异常特征输入至所述故障原因匹配单元进行故障原因匹配,得到预测故障原因。如此,可以提高模型训练的鲁棒性
在本发明一个或更多个可选的实施例中,所述根据待测试的多节点服务器的应用场景,构建测试集之前,还包括获取待测试的多节点服务器的应用场景,具体实现过程可以如下:
获取待测试的多节点服务器的应用数据;
根据所述应用数据构建所述多节点服务器的应用场景。
具体地,应用数据是指多节点服务器进行服务的配置数据,如音乐配置数据、游戏性能配置数据、拍摄配置数据等等。
实际应用中,可以先获取多节点服务器的应用数据,然后对应用数据进行分析,确定多节点服务器各项服务功能,从而根据各项服务功能确定多节点服务器的应用场景。如此,通过多节点服务器的应用数据构建多节点服务器的应用场景,能够提高构建应用场景的效率和准确率,从而提高测试的准确率。
在本发明一个或更多个可选的实施例中,所述获取待测试的多节点服务器的应用数据,具体实现过程可以如下:
获取待测试的多节点服务器的型号;
检索所述型号对应的应用数据。
具体地,型号是指反映多节点服务器性质、性能、品质等一系列的指标,一般由一组字母和数字以一定的规律编号组成。
实际应用中,型号一般在物体表面或显眼的地方进行标注,因此,可以很方便地获取到待测试的多节点服务器的型号。然后多节点服务器的型号进行检索,可以快速准确地获取到多节点服务器的应用数据。如此,简单易行,简化了数据处理流程,还可以保证了应用数据的全面性和准确性,以及获取应用数据的快速性。
在本发明一个或更多个可选的实施例中,所述获取待测试的多节点服务器的应用数据,可以为:对多节点服务器进行解析,以获得多节点服务器的应用数据。
在本发明一个或更多个可选的实施例中,所述根据所述应用数据构建所述多节点服务器的应用场景,具体实现过程可以如下:
根据所述应用数据,对所述多节点服务器进行解析,确定所述多节点服务器对应的工作应用范围;
对所述工作应用范围进行场景划分,得到所述多节点服务器的应用场景。
具体地,工作应用范围是指多节点服务器的工作环境。
实际应用中,可以基于多节点服务器的应用数据进行解析,以确定多节点服务器对应的工作应用范围。进而对于工作应用范围进行场景划分,确定多节点服务器的应用场景。例如,将工作应用范围与场景库中的各应用场景匹配,将匹配成功的应用场景确定为多节点服务器的应用场景。如此,通过多节点服务器的工作应用范围,确定多节点服务器的应用场景,能够提高应用场景与工作应用范围的匹配度,能够保证多节点服务器进行测试的环境更加符合真实环境下多节点服务器的工作环境,从而提高测试的准确率。
在本发明一个或更多个可选的实施例中,所述根据待测试的多节点服务器的应用场景,构建测试集,具体实现过程可以如下:
对待测试的多节点服务器的应用场景进行解析,确定所述应用场景对应的至少一个测试用例;
根据各所述测试用例构建测试集。
实际应用中,可以对多节点服务器的应用场景进行解析,确定该应用场景所关联的至少一个测试用例。各获取到的测试用例构成了测试集。
如此,通过应用场景对应的测试用例来构建测试集,不仅可以保证测试集的完整性以及与多节点服务器契合度,还可以提高测试集与应用场景之间的关联性,进而保证测试时可以有效模拟实际应用场景,提高对多节点服务器的测试效果和测试可靠性。
可选地,预先构建了用例库,用例库中包含多个测试用例,每个测试用例标注有对应的应用场景。在获取到待测试的多节点服务器的应用场景之后,根据该应用场景从用例库中查找对应的测试用例即可。
可选地,所述对待测试的多节点服务器的应用场景进行解析,确定所述应用场景对应的至少一个测试用例,具体实现过程可以如下:
根据待测试的多节点服务器的应用场景,确定至少一个待测试任务;
收集各所述待测试任务对应的测试用例。
实际应用中,可以对多节点服务器的应用场景进行场景分析,确定该应用场景所需执行的各待测试任务。进而针对每个待测试任务,获取对应的测试用例,从而构成测试集。
如此,通过应用场景对应的待测试任务来获取测试用例,不仅可以提高获取测试用例的效率,还可以提高测试用例的全面性,在使用测试用例构成的测试集进行测试时,可以全方位地对多节点服务器进行测试,提高测试效果。
在本发明一个或更多个可选的实施例中,可以按照一定顺序加载测试用例。即基于所述测试集对所述多节点服务器中的各节点进行测试,具体实现过程可以如下:
根据所述应用场景,确定各所述待测试任务的执行顺序;
根据所述执行顺序,加载所述测试集中的各所述测试用例对所述多节点服务器中的各节点进行测试。
具体地,执行顺序是指执行待测试任务的顺序。
实际应用中,在获取到测试集之后,对应用场景进行解析,确定应用场景对应的各待测试任务的执行顺序。并确定每个待测试任务对应的各测试用例的执行优先级。将各待测试任务的执行顺序和各测试用例的执行优先级进行结合,确定测试集中的各所述测试用例的加载顺序。然后按照加载顺序,加载测试集中的各测试用例,以对多节点服务器中的各节点进行测试。
如此,通过确定待测试任务的执行顺序,并基于执行顺序加载测试用例对多节点服务器中的各节点进行测试,使测试更加符合真实环境下多节点服务器的工作状态,从而提高测试的准确率,能够提高测试的运行效率、可靠性和准确度。
在本发明一个或更多个可选的实施例中,还可以在测试过程中,获取测试脚本以确定是否存在异常节点。即在各所述节点中存在异常节点的情况下,根据所述异常节点的所述运行数据进行节点异常检测,得到测试结果之前,还包括:
获取测试过程中产生的测试脚本;
对所述测试脚本中的返回值进行解析,确定各所述节点中是否存在异常节点。
实际应用中,在根据测试集对多节点服务器中的各节点进行测试的过程中,会产生测试脚本,根据测试脚本中的返回值可以进行判断各节点是否异常,对于存在异常的节点,即异常节点,测试脚本会通过返回值进行报错。若测试脚本会通过返回值进行报错,则说明存在异常节点,若测试脚本未通过返回值进行报错,则说明不存在异常节点。如此,通过测试脚本及其携带的返回值进行异常节点的识别,可以提高识别效率和准确率。
在本发明一个或更多个可选的实施例中,还可以在测试过程中,对多节点服务器中的各节点进行状态显示,即:在测试过程中,实时显示各所述节点的节点状态,所述节点状态包括正常状态和异常状态。
具体地,异常状态是指节点出现故障或者报错的状态。正常状态是指节点正常运行的状态。
实际应用中,参见图3,图3是本发明提供的显示节点状态的流程示意图:在对多节点服务器的各个节点进行测试时,实时显示各所述节点的节点状态,包括步骤301和步骤302:
步骤301:获取多节点服务器的各个节点的节点状态进行实时显示;
步骤302:若出现异常,则对多节点服务器中出现异常的异常节点进行显示或突出显示。
如此,可以方便测试人员查看并监控测试过程,有利于提高测试效率和用户满意度。
在本发明一个或更多个可选的实施例中,所述记录各所述节点的运行数据之后,还包括:根据各所述节点的运行数据,生成测试日志,以便于对该测试过程进行记录和便于测试人员查找日志。
下面结合图4对本发明提供的多节点服务器测试方法进行进一步说明。参见图4,图4是本发明提供的多节点服务器测试方法的流程示意图之二,包括步骤401至步骤407:
步骤401:收集获取多节点服务器的应用数据。
具体地,确定待测试的多节点服务器的型号,根据多节点服务器的型号,检索该型号的应用数据,对该型号的多节点服务器进行测试。
步骤402:根据获取到的多节点服务器的应用数据构建多节点服务器的应用场景。
具体地,根据获取到的多节点服务器的应用数据构建多节点服务器的应用场景,包括:根据多节点服务器的应用数据构建多节点服务器的至少一个应用场景,能够保证多节点服务器进行测试的环境更加符合真实环境下多节点服务器的工作环境。
步骤403:根据构建的应用场景生成测试集。
步骤404:在对多节点服务器进行测试时,加载测试集,通过测试样本对多节点服务器的各个节点进行测试。
步骤405:在测试过程中,获取多节点服务器的各个节点的运行数据。
具体地,在测试过程中,获取多节点服务器的各个节点的运行数据并记录,生成测试日志,以便测试人员查找测试日志。还可以对获取多节点服务器的各个节点的节点状态进行实时显示;若出现异常,则对多节点服务器的异常节点进行显示和/或突出显示。
步骤406:根据获取的多节点服务器的各个节点的运行数据进行节点异常检测。
具体地,在存在异常节点的情况下,将多节点服务器中异常节点的运行数据输入至故障原因分析模型,其中故障原因分析模型通过采用采集的多节点服务器历史异常数据以及历史故障原因作为样本集进行训练得到的,从而能够使得故障原因分析模型能够自动对异常节点的故障原因进行分析,同时对异常节点的故障原因进行分析的准确度较好;进一步地,故障原因分析模型输出故障原因分析结果。
步骤407:最后输出测试结果,测试结果包含异常节点、异常状态。
具体地,根据节点异常检测生成测试结果并输出,测试结果包含异常节点、异常状态,输出测试结果的同时,若出现异常节点,则同步输出故障原因分析结果,帮助测试人员发现问题,以便后续对问题进行解决。
本实施例提供的多节点服务器测试方法,通过确定多节点服务器的型号,根据多节点服务器的型号,检索该型号的应用数据,根据获取到的多节点服务器的应用数据,确定服务器的工作应用范围,进行构建多节点服务器的应用场景,根据构建的应用场景生成测试集,在对多节点服务器进行测试时,加载测试集,通过测试集对多节点服务器的各个节点进行测试,能够有效模拟实际应用场景,使得测试效果较好。
此外,根据获取的多节点服务器的各个节点的运行数据进行节点异常检测,将节点判断为异常节点后,将异常节点的运行数据输入至故障原因分析模型,故障原因分析模型输出故障原因分析结果,最后输出测试结果,若检测出存在异常,则同步输出故障原因分析结果,能够自动对异常节点进行分析,得出故障原因,以辅助测试人员发现问题,以便后续对问题进行解决。
下面对本发明提供的多节点服务器测试装置进行描述,下文描述的多节点服务器测试装置与上文描述的多节点服务器测试方法可相互对应参照。
图5是本发明提供的多节点服务器测试装置的结构示意图,如图5所示,该多节点服务器测试装置500包括:构建模块501、测试模块502和检测模块503,其中:
构建模块501,被配置为根据待测试的多节点服务器的应用场景,构建测试集;
测试模块502,被配置为基于所述测试集对所述多节点服务器中的各节点进行测试,并记录各所述节点的运行数据;
检测模块503,被配置为在各所述节点中存在异常节点的情况下,根据所述异常节点的所述运行数据进行节点异常检测,得到测试结果。
本发明提供的多节点服务器测试方法及装置,通过根据待测试的多节点服务器的应用场景,构建测试集,不仅提高测试集与应用场景之间的关联性,进而保证测试时可以有效模拟实际应用场景,提高对多节点服务器的测试效果和测试可靠性;且通过测试集对多节点服务器中的各节点进行测试,并记录各节点的运行数据,并在各节点中存在异常节点的情况下,根据异常节点的运行数据进行节点异常检测,得到测试结果,能够自动对异常节点进行分析,得出故障原因,辅助测试人员发现问题,以便后续对问题进行解决。
在本发明一个或更多个可选的实施例中,所述检测模块503,进一步被配置为:
将所述异常节点的所述运行数据输入预训练的故障原因分析模型中进行节点异常检测,得到所述异常节点的故障原因分析结果;
根据所述异常节点的标识、异常状态和所述故障原因分析结果,生成测试结果。
在本发明一个或更多个可选的实施例中,所述故障原因分析模型包括类别解析单元、特征提取单元、部件定位单元、特征定位单元和故障原因匹配单元;
相应地,所述检测模块503,进一步被配置为:
将所述异常节点的所述运行数据输入至所述类别解析单元进行类别解析,得到所述异常节点对应的故障类别;将所述异常节点的所述运行数据输入至所述特征提取单元进行特征提取,得到初始异常特征,所述初始异常特征表征所述异常节点发生的故障现象;
将所述故障类别输入至所述部件定位单元进行定位处理,确定异常部件;
将所述异常部件对应的至少一个预设异常特征和所述初始异常特征输入至所述特征定位单元进行特征定位,得到目标异常特征,所述目标异常特征为所述初始异常特征相匹配的预设异常特征;
将所述目标异常特征输入至所述故障原因匹配单元进行故障原因匹配,得到所述异常节点的故障原因分析结果。
在本发明一个或更多个可选的实施例中,所述多节点服务器测试装置500还包括训练模块,被配置为:
采集历史异常节点的历史运行数据和历史故障原因;
将所述历史运行数据输入至初始分析模型中进行节点异常检测,得到预测故障原因;
根据所述预测故障原因和所述历史故障原因计算损失值;
根据所述损失值调整所述初始分析模型的模型参数,继续执行所述采集历史异常节点的历史运行数据和历史故障原因的步骤,直至达到预设训练停止条件,得到训练好的故障原因分析模型。
在本发明一个或更多个可选的实施例中,所述多节点服务器测试装置500还包括获取模块,被配置为:
获取待测试的多节点服务器的型号;
检索所述型号对应的应用数据;
根据所述应用数据,对所述多节点服务器进行解析,确定所述多节点服务器对应的工作应用范围;
对所述工作应用范围进行场景划分,得到所述多节点服务器的应用场景;
相应地,所述构建模块501,进一步被配置为:
根据待测试的多节点服务器的应用场景,确定至少一个待测试任务;
收集各所述待测试任务对应的测试用例;
根据各所述测试用例构建测试集;
相应地,所述测试模块502,进一步被配置为:
根据所述应用场景,确定各所述待测试任务的执行顺序;
根据所述执行顺序,加载所述测试集中的各所述测试用例对所述多节点服务器中的各节点进行测试。
在本发明一个或更多个可选的实施例中,所述多节点服务器测试装置500还包括确定模块,被配置为:
获取测试过程中产生的测试脚本;
对所述测试脚本中的返回值进行解析,确定各所述节点中是否存在异常节点。
在本发明一个或更多个可选的实施例中,所述多节点服务器测试装置500还包括显示模块,被配置为:
在测试过程中,实时显示各所述节点的节点状态,所述节点状态包括正常状态和异常状态。
在本发明一个或更多个可选的实施例中,所述多节点服务器测试装置500还包括生成模块,被配置为:
根据各所述节点的运行数据,生成测试日志。
在本发明一个或更多个可选的实施例中,所述构建模块501,进一步被配置为:
对待测试的多节点服务器的应用场景进行解析,确定所述应用场景对应的至少一个测试用例;
根据各所述测试用例构建测试集。
在本发明一个或更多个可选的实施例中,所述构建模块501,进一步被配置为:
根据待测试的多节点服务器的应用场景,确定至少一个待测试任务;
收集各所述待测试任务对应的测试用例。
图6示例了一种电子设备的实体结构示意图,如图6所示,该电子设备可以包括:处理器(processor)610、通信接口(Communications Interface)620、存储器(memory)630和通信总线640,其中,处理器610,通信接口620,存储器630通过通信总线640完成相互间的通信。处理器610可以调用存储器630中的逻辑指令,以执行多节点服务器测试方法,该方法包括:根据待测试的多节点服务器的应用场景,构建测试集;基于所述测试集对所述多节点服务器中的各节点进行测试,并记录各所述节点的运行数据;在各所述节点中存在异常节点的情况下,根据所述异常节点的所述运行数据进行节点异常检测,得到测试结果。
此外,上述的存储器630中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对相关技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的多节点服务器测试方法,该方法包括:根据待测试的多节点服务器的应用场景,构建测试集;基于所述测试集对所述多节点服务器中的各节点进行测试,并记录各所述节点的运行数据;在各所述节点中存在异常节点的情况下,根据所述异常节点的所述运行数据进行节点异常检测,得到测试结果。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的多节点服务器测试方法,该方法包括:根据待测试的多节点服务器的应用场景,构建测试集;基于所述测试集对所述多节点服务器中的各节点进行测试,并记录各所述节点的运行数据;在各所述节点中存在异常节点的情况下,根据所述异常节点的所述运行数据进行节点异常检测,得到测试结果。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (11)
1.一种多节点服务器测试方法,其特征在于,包括:
根据待测试的多节点服务器的应用场景,构建测试集;
基于所述测试集对所述多节点服务器中的各节点进行测试,并记录各所述节点的运行数据;
在各所述节点中存在异常节点的情况下,根据所述异常节点的所述运行数据进行节点异常检测,得到测试结果。
2.根据权利要求1所述的多节点服务器测试方法,其特征在于,所述根据所述异常节点的所述运行数据进行节点异常检测,得到测试结果,包括:
将所述异常节点的所述运行数据输入预训练的故障原因分析模型中进行节点异常检测,得到所述异常节点的故障原因分析结果;
根据所述异常节点的标识、异常状态和所述故障原因分析结果,生成测试结果。
3.根据权利要求2所述的多节点服务器测试方法,其特征在于,所述故障原因分析模型包括类别解析单元、特征提取单元、部件定位单元、特征定位单元和故障原因匹配单元;
相应地,所述将所述异常节点的所述运行数据输入预训练的故障原因分析模型中进行节点异常检测,得到所述异常节点的故障原因分析结果,包括:
将所述异常节点的所述运行数据输入至所述类别解析单元进行类别解析,得到所述异常节点对应的故障类别;将所述异常节点的所述运行数据输入至所述特征提取单元进行特征提取,得到初始异常特征,所述初始异常特征表征所述异常节点发生的故障现象;
将所述故障类别输入至所述部件定位单元进行定位处理,确定异常部件;
将所述异常部件对应的至少一个预设异常特征和所述初始异常特征输入至所述特征定位单元进行特征定位,得到目标异常特征,所述目标异常特征为所述初始异常特征相匹配的预设异常特征;
将所述目标异常特征输入至所述故障原因匹配单元进行故障原因匹配,得到所述异常节点的故障原因分析结果。
4.根据权利要求2所述的多节点服务器测试方法,其特征在于,所述将所述异常节点的所述运行数据输入预训练的故障原因分析模型中进行节点异常检测之前,还包括:
采集历史异常节点的历史运行数据和历史故障原因;
将所述历史运行数据输入至初始分析模型中进行节点异常检测,得到预测故障原因;
根据所述预测故障原因和所述历史故障原因计算损失值;
根据所述损失值调整所述初始分析模型的模型参数,继续执行所述采集历史异常节点的历史运行数据和历史故障原因的步骤,直至达到预设训练停止条件,得到训练好的故障原因分析模型。
5.根据权利要求1-4任一项所述的多节点服务器测试方法,其特征在于,所述根据待测试的多节点服务器的应用场景,构建测试集之前,还包括:
获取待测试的多节点服务器的型号;
检索所述型号对应的应用数据;
根据所述应用数据,对所述多节点服务器进行解析,确定所述多节点服务器对应的工作应用范围;
对所述工作应用范围进行场景划分,得到所述多节点服务器的应用场景;
相应地,所述根据待测试的多节点服务器的应用场景,构建测试集,包括:
根据待测试的多节点服务器的应用场景,确定至少一个待测试任务;
收集各所述待测试任务对应的测试用例;
根据各所述测试用例构建测试集;
相应地,所述基于所述测试集对所述多节点服务器中的各节点进行测试,包括:
根据所述应用场景,确定各所述待测试任务的执行顺序;
根据所述执行顺序,加载所述测试集中的各所述测试用例对所述多节点服务器中的各节点进行测试。
6.根据权利要求1-4任一项所述的多节点服务器测试方法,其特征在于,所述在各所述节点中存在异常节点的情况下,根据所述异常节点的所述运行数据进行节点异常检测,得到测试结果之前,还包括:
获取测试过程中产生的测试脚本;
对所述测试脚本中的返回值进行解析,确定各所述节点中是否存在异常节点。
7.根据权利要求1-4任一项所述的多节点服务器测试方法,其特征在于,还包括:
在测试过程中,实时显示各所述节点的节点状态,所述节点状态包括正常状态和异常状态。
8.根据权利要求1-4任一项所述的多节点服务器测试方法,其特征在于,所述记录各所述节点的运行数据之后,还包括:
根据各所述节点的运行数据,生成测试日志。
9.一种多节点服务器测试装置,其特征在于,包括:
构建模块,被配置为根据待测试的多节点服务器的应用场景,构建测试集;
测试模块,被配置为基于所述测试集对所述多节点服务器中的各节点进行测试,并记录各所述节点的运行数据;
检测模块,被配置为在各所述节点中存在异常节点的情况下,根据所述异常节点的所述运行数据进行节点异常检测,得到测试结果。
10.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至8任一项所述多节点服务器测试方法。
11.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至8任一项所述多节点服务器测试方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311150427.5A CN117251320A (zh) | 2023-09-07 | 2023-09-07 | 多节点服务器测试方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311150427.5A CN117251320A (zh) | 2023-09-07 | 2023-09-07 | 多节点服务器测试方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117251320A true CN117251320A (zh) | 2023-12-19 |
Family
ID=89130464
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311150427.5A Pending CN117251320A (zh) | 2023-09-07 | 2023-09-07 | 多节点服务器测试方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117251320A (zh) |
-
2023
- 2023-09-07 CN CN202311150427.5A patent/CN117251320A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111209131B (zh) | 一种基于机器学习确定异构***的故障的方法和*** | |
Lin et al. | Log clustering based problem identification for online service systems | |
Yuan et al. | Automated known problem diagnosis with event traces | |
US9971674B2 (en) | System and method for testing software in a multi-platform testing environment | |
US20110307742A1 (en) | Method and apparatus for cause analysis involving configuration changes | |
Yuan et al. | An approach to cloud execution failure diagnosis based on exception logs in openstack | |
US20180357143A1 (en) | Testing computing devices | |
CN112540887A (zh) | 故障演练方法、装置、电子设备及存储介质 | |
CN111913824B (zh) | 确定数据链路故障原因的方法及相关设备 | |
CN115114064A (zh) | 一种微服务故障分析方法、***、设备及存储介质 | |
CN113918438A (zh) | 服务器异常的检测方法、装置、服务器及存储介质 | |
CN111309584B (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN116230067A (zh) | 一种固态硬盘自动化测试方法、***、设备及介质 | |
Soualhia et al. | Automated traces-based anomaly detection and root cause analysis in cloud platforms | |
CN117251320A (zh) | 多节点服务器测试方法及装置 | |
CN115098401A (zh) | 一种html报告验证方法、装置、电子设备及存储介质 | |
CN115599621A (zh) | 微服务异常诊断方法、装置、设备及存储介质 | |
CN111459734A (zh) | 一种故障监控周期的测试方法、***及计算机存储介质 | |
Nieminen et al. | Adaptable design for root cause analysis of a model-based software testing process | |
ChuahM et al. | Failure diagnosis for cluster systems using partial correlations | |
Chen et al. | Proverr: System level statistical fault diagnosis using dependency model | |
CN117439899B (zh) | 一种基于大数据的通信机房巡检方法及*** | |
CN115640236B (zh) | 一种脚本质量的检测方法及计算设备 | |
CN117312175B (zh) | 数据处理方法、装置、计算机设备及存储介质 | |
CN111176916B (zh) | 数据存储故障诊断方法及*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |