CN108763039B - 一种业务故障模拟方法、装置及设备 - Google Patents

一种业务故障模拟方法、装置及设备 Download PDF

Info

Publication number
CN108763039B
CN108763039B CN201810285000.9A CN201810285000A CN108763039B CN 108763039 B CN108763039 B CN 108763039B CN 201810285000 A CN201810285000 A CN 201810285000A CN 108763039 B CN108763039 B CN 108763039B
Authority
CN
China
Prior art keywords
fault
data set
sending
simulation
simulation task
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810285000.9A
Other languages
English (en)
Other versions
CN108763039A (zh
Inventor
王少华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Advanced New Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Advanced New Technologies Co Ltd filed Critical Advanced New Technologies Co Ltd
Priority to CN201810285000.9A priority Critical patent/CN108763039B/zh
Publication of CN108763039A publication Critical patent/CN108763039A/zh
Application granted granted Critical
Publication of CN108763039B publication Critical patent/CN108763039B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3457Performance evaluation by simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本说明书实施例公开了一种业务故障模拟方法、装置及设备。通过将故障场景与模拟任务做一一映射,确定需要采用的基础数据集,从而对基础数据集进行编排的方式生成对应的模拟任务,实现对现实中故障场景的模拟,降低故障场景构建的成本,以更加简单灵活的方式组合出更复杂的故障场景,同时不影响相关的业务***。

Description

一种业务故障模拟方法、装置及设备
技术领域
本说明书涉及计算机技术领域,尤其涉及一种业务故障模拟方法、装置及设备。
背景技术
随着业务的快速发展,业务多样性和复杂性导致业务***运行中容易发生各种故障,需要对应的进行管控。
在当前技术中,对管控***进行测试和验证时,主要通过在业务***上完成故障的注入,以模拟真实的故障发生,从而管控***可以采集当前业务***的数据进行分析,发现问题以及验证管控***的检测能力。
基于此,需要一种更便利的业务故障模拟方案。
发明内容
本说明书实施例提供一种业务故障模拟方法、装置及设备,用于解决如下问题:以提供一种更便利的业务故障模拟方案。
基于此,本说明书实施例提供一种业务故障模拟方法,包括:
根据待模拟的故障场景,确定所需采用的基础数据集;
编排所述基础数据集,生成与所述待模拟的故障场景所对应的模拟任务;
发送所述模拟任务至管控***,以便管控***根据所述模拟任务所提供的故障数据进行故障测试;
其中,所述基础数据集通过预先收集得到,包括故障数据集和正常数据集。
同时,本说明书的实施例还提供一种业务故障模拟装置,包括:
确定模块,根据待模拟的故障场景,确定所需采用的基础数据集,其中,所述基础数据集通过预先收集得到,包括故障数据集和正常数据集;
编排模块,编排所述基础数据集,生成与所述待模拟的故障场景所对应的模拟任务;
发送模块,发送所述模拟任务至管控***,以便管控***根据所述模拟任务所提供的故障数据进行故障测试。
对应的,本说明书实施例还提供一种业务故障模拟设备,包括:
存储器,存储有业务故障模拟程序;
处理器,调用存储器中的业务故障模拟程序,并执行:
根据待模拟的故障场景,确定所需采用的基础数据集;
编排所述基础数据集,生成与所述待模拟的故障场景所对应的模拟任务;
发送所述模拟任务至管控***,以便管控***根据所述模拟任务所提供的故障数据进行故障测试;
其中,所述基础数据集通过预先收集得到,包括故障数据集和正常数据集。
对应的,本说明书的实施例还提供一种非易失性计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为:
根据待模拟的故障场景,确定所需采用的基础数据集;
编排所述基础数据集,生成与所述待模拟的故障场景所对应的模拟任务;
发送所述模拟任务至管控***,以便管控***根据所述模拟任务所提供的故障数据进行故障测试;
其中,所述基础数据集通过预先收集得到,包括故障数据集和正常数据集。
本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果:
本说明书实施例所提供的方案通过将故障场景与模拟任务做一一映射,确定需要采用的基础数据集,从而对基础数据集进行编排的方式生成对应的模拟任务,实现对现实中故障场景的模拟,降低故障场景构建的成本,以更加简单灵活的方式组合出更复杂的故障场景,同时不影响相关的业务***。此外,以管理任务的方式管理各个故障场景的发生,一次编辑多次可用,随时触发随时停止,为后续管控***的测试和验证,提供了更为方便的业务故障场景构建方式。
附图说明
图1为当前技术中进行故障演练的整体流程示意图;
图2为本说明书实施例所提供的业务故障模拟所涉及的***架构示意图;
图3为本说明书的实施例提供的业务故障模拟方法的流程示意图;
图4为本说明书实施例所提供的基于基础数据集构建故障场景的示意图;
图5为本说明书实施例所提供的执行模拟任务后的结果示意图;
图6为本说明书实施例所提供的业务故障模拟装置的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在当前技术中,对于管控***而言,传统的测试和验证方案是攻防演练的方式。即,攻方***通过故障注入的方式,在业务***上完成故障的注入模拟真实的故障发生,管控***(即防方)通过实时采集当前业务***的数据,分析业务***是否异常,来快速发现和定位故障问题。
如图1所示,图1为当前技术中进行故障演练的整体流程示意图。在该模式下,攻方每次做***真实故障的注入过程十分复杂,线上***亦不能经常的注入故障(重发流量会影响下游相关的其他业务***)。而同时,管控***需要大量异常数据来训练检测业务***异常的算法,以及进行相关算法的准确性测试。从而造成管控***每次测试或验证的判别算法,获取数据困难,成本也很高,需要大量的人员参与,整个数据流程比较长,必须保证每个流程正常顺序进行,否则功亏一篑;此外,在一些用户量很大的业务***中,频繁的进行故障注入将会显著降低用户体验。
基于此,本说明书实施例提供一种基于数据集构建业务故障的方式,以更加简单灵活的方式组合出更复杂的故障场景,降低故障场景构建的成本,同时不影响相关的业务***。
图2为本说明书实施例所提供的业务故障模拟所涉及的***架构示意图。在该架构中,用于收集和存储基础数据集的存数设备可以是业务***,但在实际应用中,出于便利、安全和不影响业务***等多方面因素,一般以非业务***的设备或者实体作为执行主体,例如,其可以是与业务***无关的独立的数据库、服务器或者管控***等等。
下面将基于图2所示的架构,详细说明本说明书的实施例提供的业务故障模拟过程,如图3所示,图3为本说明书的实施例提供的业务故障模拟方法的流程示意图,包括:
S301,根据待模拟的故障场景,确定所需采用的基础数据集。其中,所述基础数据集通过预先收集得到,包括故障数据集和正常数据集。
具体而言,业务***采集各式各样的故障数据(包括演练时的故障数据和平时***运行时发生的故障数据)收集沉淀下来,形成包含各种各样数据的基础数据集(其中,没有故障注入的数据也属于数据集的一种,即正常数据集)。
例如,业务故障的表现可以是业务请求流量在短时间内大幅下跌,其内在原因可以是诸如线路中断、线路丢包、时延过大、机房关闭等等原因。每一种造成业务故障的内在原因均有对应的故障数据集,其可以在日常业务处理或者日常的攻防演练中进行专门的收集和存储而得到。显然,当正常业务处理时,其也会有对应的正常数据集。
换言之,若需要测试管控***对任意的一种故障原因的检测能力,均可以通过事先收集对应的故障数据集,从而观察管控***是否能正确的检测出该故障数据集所对应的故障原因,用以测试和验证管控***故障检测能力。
S303,编排所述基础数据集,生成与所述待模拟的故障场景所对应的模拟任务。
所述的编排指创建一个指定顺序和格式的模拟任务。例如,为模拟线路短时间中断的故障场景,以连续5分钟的正常数据集、连续3分钟的线路中断数据集和连续3分钟的正常数据集的顺序编排成模拟任务。编排得到的模拟任务即为一连串被指定了发送方式的数据集。通过对基础数据集中的各种数据集进行编排,可以灵活的实现对各种故障原因进行模拟,从而为管控***提供各种故障场景的测试验证数据,测试和验证管控***的故障检测能力更为方便。
S305,发送所述模拟任务至管控***,以便管控***根据所述模拟任务所提供的故障数据进行故障测试。
本说明书实施例所提供的方案通过将故障场景与模拟任务做一一映射,确定需要采用的基础数据集,从而对基础数据集进行编排的方式生成对应的模拟任务,实现对现实中故障场景的模拟,降低故障场景构建的成本,以更加简单灵活的方式组合出更复杂的故障场景,同时不影响相关的业务***。此外,以管理任务的方式管理各个故障场景的发生,一次编辑多次可用,随时触发随时停止,为后续管控***的测试和验证,提供了更为方便的业务故障场景构建方式。
作为一种具体的实施方式,对于基础数据集,可以通过如下方式预先收集得到:
接收所注入的故障代码,获取所述故障代码所触发的故障数据,生成所述故障数据集,并保存;或者,获取实际业务处理中发生业务故障时所生成的故障数据,生成所述故障数据集,并保存;获取实际业务处理中没有业务故障发生时所生成的正常数据,生成所述正常数据集,并保存。
换言之,基础数据集的来源中包括在攻防演练时通过故障注入所生成的故障数据集、日常业务处理产生故障所生成的故障数据集以及正常数据集,通过不同的方式提供多样的基础数据集,便于根据实际测试的需要编排出不同的模拟任务进行测试。
在实际应用中,对于S303中的编排所述基础数据集,生成与所述待模拟的故障场景所对应的模拟任务,包括:针对任一故障数据集或正常数据集,确定其发送时长、发送频率和发送顺序,生成与所述待模拟的故障场景所对应的模拟任务。
换言之,进行故障场景编排时,将日常收集和存储的基础数据集中的已经确定要采用的和故障场景所对应的数据集,按照一定的发送顺序、发送频率以及发送时长组成重发数据的模拟任务,来模拟实际中故障发生的场景。
对于同一个故障场景,可以对应多种不同的模拟任务,即造成同一业务故障现象的其内在可能是由不同的原因,我们需要观察管控***是否能正确的检测出对应的原因。例如,对于同样是业务流量下降的现象,可以是线路中断、也可以是数据时延等等原因,从而,在故障场景编排的时候,可以通过编排对应的线路中断故障数据集和数据时延故障数据集生成模拟任务,进行发送即可。一般而言,在编排模拟任务中,应加入正常数据集,以实现较为真实的模拟。
进一步地,在编排完模拟任务后,进行发送时,还可以对模拟任务的发送方式进行管控,即,对于S305中的发送所述模拟任务至管控***,包括:
确定所述模拟任务的发送方式,其中,所述发送方式包括顺序发送、循环发送或者停止发送中的至少一种;根据所述已确定的发送方式发送所述多个模拟任务至管控***。
每个模拟任务对应一个故障场景,通过对模拟任务的控制(顺序执行、循环执行、停止执行等)来控制对应的故障场景,以灵活的控制方式实现对故障发生的模拟。其中的顺序执行即为按照编排好的顺序执行模拟任务中的数据发送;循环执行即为在一个模拟任务全部完成后重新执行该模拟任务;停止执行即为停止数据发送。
如图4所示,图4为本说明书实施例所提供的基于基础数据集构建故障场景的示意图。该图通过基础数据集构建故障场景,主要分为三层:
基础数据集,各种故障数据集和正常数据集的合集,依次收集各种故障注入(包含不注入故障)等方式构造各种场景的数据集,并保存到相应的存储设备中,汇合成整个故障场景构建的基础数据集。
构建模拟任务,根据要构造故障场景的需要,选择基础数据集中对应的一些数据集,然后按照一定顺序组合这些数据集,并设定每个数据集重发的发送频率/每秒查询率(Query Per Second,QPS)、重发持续时间,组合成一个重发任务,该模拟任务对应一个实际的故障场景。
模拟任务控制,每个模拟任务对应一个故障场景,通过对模拟任务的控制(顺序执行、循环执行、停止执行等)来控制对应的故障场景,以灵活的控制方式实现对故障发生的模拟。
以典型的故障场景业务流量下跌作为示例,编排模拟任务时确定模拟任务为:{[正常数据集,300QPS,3min],[线路中断数据集,30QPS,3min],[正常数据集,300QPS,3min]},对上述模拟任务进行顺序发送。从而得到典型故障场景的流量下跌结果示意图,如图5所示,图5为本说明书实施例所提供的执行模拟任务后的结果示意图(流量下跌3分钟)。管控***此时接收到相关数据,进行检测,从而工作人员观测管控***是否能正确的检测出流量下跌原因。
基于同样的思路,本说明书实施例还提供一种业务故障模拟装置,如图6所示,图6为本说明书实施例所提供的业务故障模拟装置的结构示意图,其包括:
确定模块601,根据待模拟的故障场景,确定所需采用的基础数据集,其中,所述基础数据集通过预先收集得到,包括故障数据集和正常数据集;
编排模块603,编排所述基础数据集,生成与所述待模拟的故障场景所对应的模拟任务;
发送模块605,发送所述模拟任务至管控***,以便管控***根据所述模拟任务所提供的故障数据进行故障测试。
进一步地,所述装置还包括基础数据收集模块607,接收所注入的故障代码,获取所述故障代码所触发的故障数据,生成所述故障数据集,并保存;或者,获取实际业务处理中发生业务故障时所生成的故障数据,生成所述故障数据集,并保存;获取实际业务处理中没有业务故障发生时所生成的正常数据,生成所述正常数据集,并保存。
进一步地,所述编排模块603,针对任一故障数据集或正常数据集,确定其发送时长、发送频率和发送顺序,生成与所述待模拟的故障场景所对应的模拟任务。
进一步地,所述发送模块605,确定所述模拟任务的发送方式,其中,所述发送方式包括顺序发送、循环发送或者停止发送中的至少一种;根据所述已确定的发送方式发送所述多个模拟任务至管控***。
对应的,本说明书实施例还提供一种业务故障模拟设备,包括:
存储器,存储有业务故障模拟程序;
处理器,调用存储器中的业务故障模拟程序,并执行:
根据待模拟的故障场景,确定所需采用的基础数据集;
编排所述基础数据集,生成与所述待模拟的故障场景所对应的模拟任务;
发送所述模拟任务至管控***,以便管控***根据所述模拟任务所提供的故障数据进行故障测试;
其中,所述基础数据集通过预先收集得到,包括故障数据集和正常数据集。
基于同样的发明思路,本申请实施例还提供了对应的一种非易失性计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为:
根据待模拟的故障场景,确定所需采用的基础数据集;
编排所述基础数据集,生成与所述待模拟的故障场景所对应的模拟任务;
发送所述模拟任务至管控***,以便管控***根据所述模拟任务所提供的故障数据进行故障测试;
其中,所述基础数据集通过预先收集得到,包括故障数据集和正常数据集。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、设备和介质类实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可,这里就不再一一赘述。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤或模块可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字***“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的***、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书的实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信编号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书中一个或多个的实施例可提供为方法、***或计算机程序产品。因此,本说明书的实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的形式。而且,本说明书的实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书的实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定事务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书的实施例,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行事务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

Claims (9)

1.一种业务故障模拟方法,包括:
根据待模拟的故障场景,确定所需采用的基础数据集;
编排所述基础数据集,生成与所述待模拟的故障场景所对应的模拟任务;编排得到的所述模拟任务为一连串被指定了发送顺序和格式的所述基础数据集中的各种数据集;
发送所述模拟任务至管控***,以便管控***根据所述模拟任务所提供的故障数据进行故障测试;
其中,所述基础数据集通过预先收集得到,包括故障数据集和正常数据集。
2.如权利要求1所述的方法,所述基础数据集通过预先收集得到,包括如下方式:
接收所注入的故障代码,获取所述故障代码所触发的故障数据,生成所述故障数据集,并保存;或者,
获取实际业务处理中发生业务故障时所生成的故障数据,生成所述故障数据集,并保存;或者,
获取实际业务处理中没有业务故障发生时所生成的正常数据,生成所述正常数据集,并保存。
3.如权利要求1所述的方法,编排所述基础数据集,生成与所述待模拟的故障场景所对应的模拟任务,包括:
针对任一故障数据集或正常数据集,确定其发送时长、发送频率和发送顺序,生成与所述待模拟的故障场景所对应的模拟任务。
4.如权利要求1所述的方法,发送所述模拟任务至管控***,包括:
确定所述模拟任务的发送方式,其中,所述发送方式包括顺序发送、循环发送或者停止发送中的至少一种;
根据已确定的发送方式发送多个模拟任务至管控***。
5.一种业务故障模拟装置,包括:
确定模块,根据待模拟的故障场景,确定所需采用的基础数据集,其中,所述基础数据集通过预先收集得到,包括故障数据集和正常数据集;
编排模块,编排所述基础数据集,生成与所述待模拟的故障场景所对应的模拟任务;编排得到的所述模拟任务为一连串被指定了发送顺序和格式的所述基础数据集中的各种数据集;
发送模块,发送所述模拟任务至管控***,以便管控***根据所述模拟任务所提供的故障数据进行故障测试。
6.如权利要求5所述的装置,还包括基础数据收集模块,接收所注入的故障代码,获取所述故障代码所触发的故障数据,生成所述故障数据集,并保存;或者,获取实际业务处理中发生业务故障时所生成的故障数据,生成所述故障数据集,并保存;或者,获取实际业务处理中没有业务故障发生时所生成的正常数据,生成所述正常数据集,并保存。
7.如权利要求5所述的装置,所述编排模块,针对任一故障数据集或正常数据集,确定其发送时长、发送频率和发送顺序,生成与所述待模拟的故障场景所对应的模拟任务。
8.如权利要求5所述的装置,所述发送模块,确定所述模拟任务的发送方式,其中,所述发送方式包括顺序发送、循环发送或者停止发送中的至少一种;根据已确定的发送方式发送多个模拟任务至管控***。
9.一种业务故障模拟设备,包括:
存储器,存储有业务故障模拟程序;
处理器,调用存储器中的业务故障模拟程序,并执行:
根据待模拟的故障场景,确定所需采用的基础数据集;
编排所述基础数据集,生成与所述待模拟的故障场景所对应的模拟任务;编排得到的所述模拟任务为一连串被指定了发送顺序和格式的所述基础数据集中的各种数据集;
发送所述模拟任务至管控***,以便管控***根据所述模拟任务所提供的故障数据进行故障测试;
其中,所述基础数据集通过预先收集得到,包括故障数据集和正常数据集。
CN201810285000.9A 2018-04-02 2018-04-02 一种业务故障模拟方法、装置及设备 Active CN108763039B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810285000.9A CN108763039B (zh) 2018-04-02 2018-04-02 一种业务故障模拟方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810285000.9A CN108763039B (zh) 2018-04-02 2018-04-02 一种业务故障模拟方法、装置及设备

Publications (2)

Publication Number Publication Date
CN108763039A CN108763039A (zh) 2018-11-06
CN108763039B true CN108763039B (zh) 2021-09-21

Family

ID=63980632

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810285000.9A Active CN108763039B (zh) 2018-04-02 2018-04-02 一种业务故障模拟方法、装置及设备

Country Status (1)

Country Link
CN (1) CN108763039B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109739680A (zh) * 2019-02-02 2019-05-10 广州视源电子科技股份有限公司 应用***的故障查找方法、装置、设备及介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103019921A (zh) * 2011-09-20 2013-04-03 中国人民解放军63928部队 一种基于故障注入的操作***容错性测试***及其方法
KR20140084698A (ko) * 2012-12-27 2014-07-07 주식회사 포스코 철강 공정용 소프트웨어 자동 테스트 시스템
CN103944778A (zh) * 2014-03-31 2014-07-23 哈尔滨工程大学 一种基于组合测试集的分布式事件注入装置
CN104344970A (zh) * 2014-10-13 2015-02-11 中国船舶重工集团公司第七二六研究所 一种装备***故障综合诊断方法及装置
CN105512343A (zh) * 2016-01-06 2016-04-20 北京京东尚科信息技术有限公司 网络异常模拟、数据库故障自动切换的测试方法和装置
CN105656684A (zh) * 2016-02-05 2016-06-08 北京润科通用技术有限公司 故障模拟方法及装置
CN106682160A (zh) * 2016-12-26 2017-05-17 中国航空工业集团公司西安飞机设计研究所 一种测试性试验可注入故障样本库建立方法
CN106950939A (zh) * 2017-03-07 2017-07-14 广西电网有限责任公司电力科学研究院 一种稳控***多功能检测终端
CN107645397A (zh) * 2016-07-21 2018-01-30 阿里巴巴集团控股有限公司 一种在分布式***进行故障模拟的***、装置及方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04130351A (ja) * 1990-09-21 1992-05-01 Mita Ind Co Ltd 画像形成装置のための自己診断および自己修復システム
DE602005004886T2 (de) * 2005-01-26 2009-02-19 Oce-Technologies B.V. Automatische Leistungsanalyse und Fehlerbeseitigung
US7467333B2 (en) * 2005-09-01 2008-12-16 Hewlett-Packard Development Company, L.P. System and method for interposition-based selective simulation of faults for access requests to a data storage system
CN100396030C (zh) * 2006-07-05 2008-06-18 华为技术有限公司 一种级联设备可靠性测试的方法及***
US7958495B2 (en) * 2007-03-08 2011-06-07 Systemware, Inc. Program test system
CN103336243B (zh) * 2013-07-01 2016-02-10 东南大学 基于分合闸线圈电流信号的断路器故障诊断方法
CN103472385A (zh) * 2013-09-29 2013-12-25 哈尔滨工业大学 一种带故障注入功能的通用型电路故障仿真***
CN105808420B (zh) * 2014-12-31 2018-12-28 阿里巴巴集团控股有限公司 健壮性测试过程的实现方法和装置
CN106341248B (zh) * 2015-07-09 2020-04-07 阿里巴巴集团控股有限公司 一种基于云平台的故障处理方法和装置
CN107179957B (zh) * 2016-03-10 2020-08-25 阿里巴巴集团控股有限公司 物理机故障分类处理方法、装置和虚拟机恢复方法、***
CN107229559B (zh) * 2016-03-23 2020-06-02 阿里巴巴集团控股有限公司 针对业务***的测试完整度的检测方法和装置
CN106095614A (zh) * 2016-05-27 2016-11-09 上海新炬网络信息技术有限公司 一种数据库容灾演练管控***
CN106874491A (zh) * 2017-02-22 2017-06-20 北京科技大学 一种基于动态关联规则的设备故障信息挖掘方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103019921A (zh) * 2011-09-20 2013-04-03 中国人民解放军63928部队 一种基于故障注入的操作***容错性测试***及其方法
KR20140084698A (ko) * 2012-12-27 2014-07-07 주식회사 포스코 철강 공정용 소프트웨어 자동 테스트 시스템
CN103944778A (zh) * 2014-03-31 2014-07-23 哈尔滨工程大学 一种基于组合测试集的分布式事件注入装置
CN104344970A (zh) * 2014-10-13 2015-02-11 中国船舶重工集团公司第七二六研究所 一种装备***故障综合诊断方法及装置
CN105512343A (zh) * 2016-01-06 2016-04-20 北京京东尚科信息技术有限公司 网络异常模拟、数据库故障自动切换的测试方法和装置
CN105656684A (zh) * 2016-02-05 2016-06-08 北京润科通用技术有限公司 故障模拟方法及装置
CN107645397A (zh) * 2016-07-21 2018-01-30 阿里巴巴集团控股有限公司 一种在分布式***进行故障模拟的***、装置及方法
CN106682160A (zh) * 2016-12-26 2017-05-17 中国航空工业集团公司西安飞机设计研究所 一种测试性试验可注入故障样本库建立方法
CN106950939A (zh) * 2017-03-07 2017-07-14 广西电网有限责任公司电力科学研究院 一种稳控***多功能检测终端

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于贝叶斯网络的Web服务组合故障诊断;付晓东 等;《计算机应用》;20080501;第28卷(第5期);1095-1097、1100页 *

Also Published As

Publication number Publication date
CN108763039A (zh) 2018-11-06

Similar Documents

Publication Publication Date Title
CN109032825B (zh) 一种故障注入方法、装置及设备
CN104699601A (zh) 用于执行状态机驱动的注入的方法和***
US11036507B2 (en) Processor testing using pairs of counter incrementing and branch instructions
US9355003B2 (en) Capturing trace information using annotated trace output
CN108694320B (zh) 一种多安全环境下敏感应用动态度量的方法及***
CN106664285B (zh) 用于高级应用的基于事件的记录和重放
CN109144515A (zh) Dcs图形化算法组态的离线仿真方法和装置
CN109101416A (zh) 一种内核故障注入方法及电子设备
CN109871312B (zh) 一种接口测试方法、装置、设备及可读存储介质
CN107710166A (zh) 利用符号快速错误检测的硅后验证和调试
CN105653946A (zh) 基于组合事件行为触发的Android恶意行为检测***及其检测方法
CN113590454A (zh) 测试方法、装置、计算机设备和存储介质
CN107729231A (zh) 一种基于操作***的故障注入方法及装置
CN106021049A (zh) 国产操作***验证平台及建立方法
CN110635962A (zh) 用于分布式***的异常分析方法及装置
Arcaini et al. Combining model-based testing and runtime monitoring for program testing in the presence of nondeterminism
Sun et al. Multi-objective test case prioritization for GUI applications
CN108763039B (zh) 一种业务故障模拟方法、装置及设备
CN113127331B (zh) 一种基于故障注入的测试方法、装置及计算机设备
CN109783837A (zh) 仿真设备、仿真***、仿真方法和仿真程序
CN107766230A (zh) 一种基于配置文件进行测试的方法与设备
Altisen et al. SASA: a SimulAtor of Self-stabilizing Algorithms
CN116009889A (zh) 深度学习模型的部署方法、装置、电子设备及存储介质
CN115470141A (zh) 一种故障模拟方法、装置及相关设备
CN111274143B (zh) 埋点测试方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20201021

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Innovative advanced technology Co.,Ltd.

Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20201021

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Advanced innovation technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Applicant before: Alibaba Group Holding Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant