CN112835780B - 一种业务检测方法及装置 - Google Patents
一种业务检测方法及装置 Download PDFInfo
- Publication number
- CN112835780B CN112835780B CN201911167460.2A CN201911167460A CN112835780B CN 112835780 B CN112835780 B CN 112835780B CN 201911167460 A CN201911167460 A CN 201911167460A CN 112835780 B CN112835780 B CN 112835780B
- Authority
- CN
- China
- Prior art keywords
- service
- component
- information
- detected
- parameter item
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 128
- 238000000034 method Methods 0.000 claims abstract description 99
- 230000008569 process Effects 0.000 claims abstract description 70
- 230000003993 interaction Effects 0.000 claims abstract description 38
- 238000004088 simulation Methods 0.000 claims abstract description 20
- 230000002159 abnormal effect Effects 0.000 claims description 34
- 238000004891 communication Methods 0.000 claims description 18
- 238000012545 processing Methods 0.000 claims description 13
- 238000012549 training Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 11
- 238000013145 classification model Methods 0.000 claims description 8
- 238000013500 data storage Methods 0.000 claims description 4
- 239000000758 substrate Substances 0.000 claims 2
- 230000004044 response Effects 0.000 description 10
- 238000013480 data collection Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000012544 monitoring process Methods 0.000 description 8
- 239000003795 chemical substances by application Substances 0.000 description 6
- 238000012546 transfer Methods 0.000 description 5
- 230000009471 action Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/36—Preventing errors by testing or debugging software
- G06F11/362—Software debugging
- G06F11/3636—Software debugging by tracing the execution of the program
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Computer Hardware Design (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明实施例提供了一种业务检测方法及装置,上述方法包括:确定待检测的组件业务的业务参数项,并获得数据采集参数和检测标准参数,所述组件业务为:组件提供的业务;在待运行组件运行、且提供所述待检测的组件业务过程中,向所述待运行组件发送模拟触发指令,触发所述待运行组件模拟与客户端进行数据交互的过程,所述待运行组件为:提供所述待检测的组件业务的组件;按照所述数据采集参数,采集所述待运行组件在模拟数据交互的过程中产生的所述业务参数项的信息;根据所述业务参数项的信息和检测标准参数,检测所述待检测的组件业务是否出现故障。应用本发明实施例提供的方案,能够及时检测业务***所提供的业务是否出现故障。
Description
技术领域
本发明涉及设备运维技术领域,特别是涉及一种业务检测方法及装置。
背景技术
金融行业的交易***、安防行业的监控***等业务***能够为用户提供各种业务。例如,上述交易***可以为用户提供金融交易等业务,上述监控***能够为用户提供监控视频回放、观看等业务。
然而,上述各种业务***向用户提供业务的过程中,可能会产生业务故障,从而导致用户在使用各种业务过程中出现业务中断等情况,无法继续使用业务,因此,亟需一种业务检测方案,以及时检测业务***所提供的业务是否出现故障。
发明内容
本发明实施例的目的在于提供一种业务检测方法及装置,能够及时检测业务***所提供的业务是否出现故障。具体技术方案如下:
第一方面,本发明实施例提供了一种业务检测方法,所述方法包括:
确定待检测的组件业务的业务参数项,并获得数据采集参数和检测标准参数,其中,所述组件业务为:组件提供的业务;
在待运行组件运行、且提供所述待检测的组件业务过程中,向所述待运行组件发送模拟触发指令,触发所述待运行组件模拟与客户端进行数据交互的过程,其中,所述待运行组件为:提供所述待检测的组件业务的组件;
按照所述数据采集参数,采集所述待运行组件在模拟数据交互的过程中产生的所述业务参数项的信息;
根据所述业务参数项的信息和检测标准参数,检测所述待检测的组件业务是否出现故障。
本发明的一个实施例中,上述数据采集参数包括数据采集方式、异常采集数据的处理方式中的至少一种。
本发明的一个实施例中,上述根据所述业务参数项的信息和检测标准参数,检测所述待检测的组件业务是否出现故障,包括:
判断所述业务参数项的信息是否位于由检测标准参数确定的异常范围内;
所述方法还包括:在所述业务参数项的信息位于由检测标准参数确定的异常范围内时,获得提供所述待检测的组件业务过程产生的数据,并保存所获得的数据。
本发明的一个实施例中,在所述根据所述业务参数项的信息和检测标准参数,检测所述待检测的组件业务是否出现故障之前,还包括:
确定所述待运行组件的软件参数项和所述待运行组件所运行于设备的硬件参数项,并按照所述数据采集参数,采集所述软件参数项的信息和所述硬件参数项的信息;
将所述软件参数项的信息和所述硬件参数项的信息,输入预先训练的业务预判模型,预判所述待检测的组件业务是否有出现故障的风险,其中,所述业务预判模型为:以样本组件的软件参数项信息和样本组件所运行于设备的硬件参数项信息作为输入参数,以表征样本组件业务是否存在故障的样本检测结果为训练基准、对预设的原始分类模型训练得到的、且用于检测组件业务是否有出现故障的风险。
第二方面,本发明实施例提供了一种业务检测装置,所述装置包括:
业务参数项确定模块,用于确定待检测的组件业务的业务参数项,并获得数据采集参数和检测标准参数,其中,所述组件业务为:组件提供的业务;
指令发送模块,用于在待运行组件运行、且提供所述待检测的组件业务过程中,向所述待运行组件发送模拟触发指令,触发所述待运行组件模拟与客户端进行数据交互的过程,其中,所述待运行组件为:提供所述待检测的组件业务的组件;
第一信息采集模块,用于按照所述数据采集参数,采集所述待运行组件在模拟数据交互的过程中产生的所述业务参数项的信息;
故障检测模块,用于根据所述业务参数项的信息和检测标准参数,检测所述待检测的组件业务是否出现故障。
本发明的一个实施例中,上述数据采集参数包括数据采集方式、异常采集数据的处理方式中的至少一种。
本发明的一个实施例中,上述故障检测模块,具体用于:
判断所述业务参数项的信息是否位于由检测标准参数确定的异常范围内;
所述装置还包括:数据保存模块,用于在所述业务参数项的信息位于由检测标准参数确定的异常范围内时,获得提供所述待检测的组件业务过程产生的数据,并保存所获得的数据。
本发明的一个实施例中,上述装置还包括:
第二信息采集模块,用于在所述故障检测模块检测所述待检测的组件业务是否出现故障之前,确定所述待运行组件的软件参数项和所述待运行组件所运行于设备的硬件参数项,并按照所述数据采集参数,采集所述软件参数项的信息和所述硬件参数项的信息;
故障预判模块,用于将所述软件参数项的信息和所述硬件参数项的信息,输入预先训练的业务预判模型,预判所述待检测的组件业务是否有出现故障的风险,其中,所述业务预判模型为:以样本组件的软件参数项信息和样本组件所运行于设备的硬件参数项信息作为输入参数,以表征样本组件业务是否存在故障的样本检测结果为训练基准、对预设的原始分类模型训练得到的、且用于检测组件业务是否有出现故障的风险。
第三方面,本发明实施例提供了一种终端设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述第一方面所述的方法步骤。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面所述的方法步骤。
由以上可见,应用本实施例提供的方案进行业务检测时,在确定待检测的组件业务的业务参数项,并获得数据采集参数和检测标准参数后,在待运行组件运行、且提供待检测的组件业务过程中,向所述待运行组件发送模拟触发指令,触发所述待运行组件模拟与客户端进行数据交互的过程,按照数据采集参数,采集所述待运行组件在模拟数据交互的过程中产生的所述业务参数项的信息,根据业务参数项的信息和检测标准参数,检测待检测的组件业务是否出现故障。因此,应用本实施例提供的方案能够及时检测业务***提供的业务是否出现故障。
另外,在应用本发明实施例提供的方案进行业务检测的过程中,是在待运行组件在模拟数据交互过程中产生的业务参数项的信息中进行数据采集,这样来看所采集的数据是由于待检测的组件业务执行而产生的数据,从而可以认为该检测过程无需对待运行组件本身进行改造,也就是,采用了非入侵组件的方式对待检测的组件业务进行检测。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种业务检测方法的流程示意图;
图2为本发明实施例提供的一种集群***的框架示意图;
图3为本发明实施例提供的一种单机***的框架示意图;
图4为本发明实施例提供的一种业务检测装置的结构示意图;
图5为本发明实施例提供的一种终端设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
首先,本发明实施例的执行主体可以为服务器。服务器上可以运行多个组件、且每个组件提供至少一种业务。
其次,对本发明实施例涉及的各种概念进行解释。
1、组件
组件可以理解为组装在一起形成一个功能单元的一组原件,是对数据和方法的简单封装。
本发明的一个实施例中,上述组件可以是应用于安防领域的通用组件,为便于描述,可以将上述组件称为安防通用组件。
例如,上述安防通用组件可以包括:TVMS(Tele-Video Monitoring System,电视墙组件)、NCG(Network Convergence Gateway,网络收敛网关)、VAG(Video AcceptionGateway,视频接入网关)、VTDU(Video Transfer&Distribute Unit,视频传送分发单元)等组件。
2、组件业务
组件业务可以理解为:组件提供的业务。其中,业务为向用户提供的业务。例如:业务可以为观看视频、回放视频等业务。
组件业务可以包括HTTP/HTTPS(Hyper Transfer Protocol,超文本传输协议/Hyper Transfer Protocol Secure,超文本传输安全协议)业务、SIP(Session InitiationProtocol,会话初始协议)业务、RTSP(Real Time Streaming Protocol,实时流协议l)业务、RTMP(Real Time Message Protocol,实时消息协议)业务、HLS(HTTP Live Streaming,HTTP渐进下载)业务、基于TCP(Transmission Control Protocol,传输控制协议)的全双工协议WebSocket业务、GB28181协议业务、二进制私有协议业务等。如:VAG组件可以提供RTSP、RTMP等各种取流业务。
以下对本发明实施例提供的一种业务检测方法进行说明。
参见图1,图1为本发明实施例提供的一种业务检测方法的流程示意图,上述方法包括S101-S104。
S101:确定待检测的组件业务的业务参数项,并获得数据采集参数和检测标准参数。
本发明的一个实施例中,上述待检测的组件业务的业务参数项可以包括以下参数中的至少一种:用于描述业务的参数、业务运行过程中的业务运行参数等。
例如,上述用于描述业务的参数可以是业务的名称、业务的标识、业务运行端口等。上述业务运行参数可以是业务运行状态等。
本发明的一个实施例中,上述数据采集参数可以包括以下参数中的至少一种:数据采集方式、异常采集数据的处理方式。
具体的,上述数据采集方式可以为周期性地采集数据,还可以为在预设时间段采集数据。例如:上述数据采集方式可以为每隔10s采集数据,还可以规定在上午十点到晚上十点这个时间段内采集数据。
具体的,上述异常采集数据的处理方式是当所采集到的数据异常时的处理方式。例如,上述异常采集数据的处理方式可以包括备份日志、保存dump/core文件、抓取报文、重启组件所运行在的电子设备等处理方式。
上述检测标准参数用于对所采集的数据进行对比的标准参数,以判断待检测的组件业务是否出现故障。
具体的,上述检测标准参数可以为预设的异常数据连续出现的次数,例如:检测标准参数为10时,表示当异常数据连续出现的次数超过10次时,待检测的组件业务出现故障。
具体的,确定待检测的组件业务的业务参数项,并获得数据采集参数和检测标准参数可以参见后续实施例,在此不再详述。
S102:在待运行组件运行、且提供待检测的组件业务过程中,向待运行组件发送模拟触发指令,触发待运行组件模拟与客户端进行数据交互的过程。
其中,上述待运行组件为:提供待检测的组件业务的组件。
由于是对待检测的组件业务进行故障检测,而上述待检测的组件业务是由上述待运行组件提供的,所以,为了能够实现故障检测,需要运行上述待运行组件,以使得上述待运行组件能够提供待检测的组件业务,从而能够采集待检测的组件业务在执行过程中产生的数据,并根据所采集的数据进行故障检测。
上述模拟触发指令用于触发待运行组件模拟与客户端进行数据交互的过程。例如:上述模拟触发指令可以为业务请求报文,服务器向待运行组件发送业务请求报文后,待运行组件根据接收到的业务请求报文生成响应报文,并向服务器发送,从而实现了模拟数据交互过程。
S103:按照数据采集参数,采集待运行组件在模拟数据交互的过程中产生的业务参数项的信息。
上述业务参数项的信息可以表示业务在运行时是否处于正常运行状态。
具体的,确定待运行组件在模拟数据交互的过程中产生的业务参数项的信息,可以按照以下两种方式进行确定。
第一种方式:根据待运行组件在模拟数据交互的过程中是否发送过响应报文来确定业务参数项的信息。若待运行组件未发送响应报文,表示当前业务参数项的信息为异常信息;若待运行组件发送响应报文,表示当前业务参数项的信息为正常信息。
例如:在预定时刻或者按照预设时间间隔向组件MGC发送业务请求报文时,若在预设时间内未接收到组件MGC生成的响应报文时,则认为当前业务处于异常状态,可以确定当前业务参数项的信息为异常信息;若在预设时间内接收到组件MGC生成的响应报文时,则认为当前业务处于正常状态,可以确定当前业务参数项的信息为正常信息。
第二种方式:根据待运行组件在模拟数据交互的过程中发送的响应报文,对响应报文携带的业务参数项信息进行解析,确定业务参数项的信息。
例如:在预定时刻或者按照预设时间间隔向组件VNSC发送获取业务参数项信息的请求报文,根据接收到组件VNSC发送的响应报文中携带的业务参数项信息,确定业务参数项的信息。
在确定上述业务参数项的信息后,可以将业务参数项的信息存入预设的数据库。按照数据采集参数,采集数据库中存储的业务参数项的信息。
S104:根据业务参数项的信息和检测标准参数,检测待检测的组件业务是否出现故障。
由于检测标准参数是用于对所采集的数据进行对比的标准参数,因此,将业务参数项的信息和检测标准参数进行比对,可以确定待检测的组件业务是否出现故障。
本发明的一个实施例中,根据业务参数项的信息和检测标准参数,检测待检测的组件业务是否出现故障,可以通过判断上述业务参数项的信息是否位于由检测标准参数确定的异常范围内。
若业务参数项的信息位于检测标准参数确定的异常范围内时,表示业务参数项的信息发生异常,待检测的组件业务发生故障;若业务参数项的信息不在检测标准参数确定的异常范围内时,表示业务参数项的信息未发生异常,待检测的组件业务未发生故障。当上述检测标准参数为预设的异常数据连续出现的次数时,那么异常范围为超过预设的异常数据连续出现的次数。
例如:当业务参数项为组件VAG提供的RTMP业务,检测标准参数为10,异常范围为连续超过10次采集的业务参数项的信息均为异常时认为组件VAG提供的RTMP业务出现故障。假设连续8次采集的业务参数项的信息为异常,那么可以认为组件VAG提供的RTMP业务未出现故障,当连续11次采集的业务参数项的信息为异常,那么可以认为组件VAG提供的RTMP业务出现故障。
这样,将业务参数项的信息与检测标准参数进行比对,能够较为准确检测待检测的组件业务是否出现故障。
由以上可见,应用本实施例提供的方案进行业务检测时,在确定待检测的组件业务的业务参数项,并获得数据采集参数和检测标准参数后,在待运行组件运行、且提供待检测的组件业务过程中,向所述待运行组件发送模拟触发指令,触发所述待运行组件模拟与客户端进行数据交互的过程,按照数据采集参数,采集所述待运行组件在模拟数据交互的过程中产生的所述业务参数项的信息,根据业务参数项的信息和检测标准参数,检测待检测的组件业务是否出现故障。因此,应用本实施例提供的方案能够及时检测业务***提供的业务是否出现故障。
另外,在应用本发明实施例提供的方案进行业务检测的过程中,是在待运行组件在模拟数据交互过程中产生的业务参数项的信息中进行数据采集,这样来看所采集的数据是由于待检测的组件业务执行而产生的数据,从而可以认为该检测过程无需对待运行组件本身进行改造,也就是,采用了非入侵组件的方式对待检测的组件业务进行检测。
本发明的一个实施例中,在S101中服务器获得上述待检测的组件业务的业务参数项、数据采集参数和检测标准参数可以有两种方式。
第一种方式:服务器接收到携带着上述业务参数项和参数的指令,并对指令进行解析,获得指令携带的上述业务参数项和参数。其中,上述指令中的业务参数项和参数可以是按照预设的排列顺序进行排列的。
上述预设的排列顺序可以为[组件标识,组件业务的标识,组件运行参数,数据采集方式,检测标准参数,异常采集数据的处理方式]。按照预设的排列顺序,指令可以为[MGC,RTMP,1935,20,10,“BackupLog;SaveDump”],MGC为组件标识、RTMP为组件业务的标识、1935为组件业务运行时的端口号;20表示数据采集方式,表示每个采集周期内相邻两个数据采集操作的间隔时间,单位为秒;10为检测标准参数,表示10次所采集的数据均为异常时认为检测的组件业务在运行时发生故障,“BackupLog;SaveDump”为异常采集数据的处理方式,表示保存日志、保存Dump文件。
服务器接收到[MGC,RTMP,1935,20,10,“BackupLog;SaveDump”]后,对该指令进行解析,可以获得各个业务参数项和参数。
第二种方式:工作人员将上述业务参数项和参数存储在一个配置文件中,将配置文件发送至服务器,并向服务器发送解析配置文件的指令,这样服务器根据指令能够对配置文件进行解析,获得配置文件中内的业务参数项和参数。
由于上述待检测的组件业务的业务参数项、数据采集参数和检测标准参数可以是工作人员在其使用的客户端上进行配置的,这样可以按照工作人员的检测需要有针对性进行检测,提升了业务检测的灵活性。
本发明的一个实施例中,在上述待检测的组件业务出现故障的情况下,获得提供待检测的组件业务过程产生的数据,并保存所获得的数据。
这样,应用本实施例提供的方案,能够在待检测的组件业务出现故障的情况下,服务器能够保存与故障相关的数据,这样可以为工作人员排查问题提供故障相关的数据,提高了对业务进行诊断和运维的效率。
本发明的一个实施例中,由于业务***有不同的类型,对不同类型的业务***提供的业务进行业务检测的具体情况也不同,可以包括以下两种情况。
第一种情况:在业务***为集群***的情况下,业务***包括多个服务器,每一服务器上可以运行多个组件,每一组件提供至少一种业务。由于上述业务***中包括多个服务器,所以可以基于Zabbix分布式监控***对上述业务***进行业务检测。
参见图2,图2为本发明实施例提供的一种集群***的框架示意图。下表1为图2中集群***中各个模块的名称及功能。
表1
由于集群***中服务器的数量较多,在对集群***提供的业务进行业务检测时,若只靠一台Zabbix Server进行检测会消耗大量时间,这时,通过引入Zabbix Proxy,对区域内的服务器进行业务检测,能够分担Zabbix Server的检测压力,从而提高了对集群***提供的业务进行检测的效率。
上述Zabbix Agent为Zabbix分布式监控***与服务器进行数据交互的方式。本申请的一个实施例中,上述进行数据交互的方式还可以包括:在服务器上配置Zabbix SNMP、Zabbix JMX等方式。
本实施例采用的是在服务器配置Zabbix Agent的方式,与各个服务器进行数据交互。
具体的,Zabbix web可以将配置信息发送至数据库,Zabbix Server定时从数据库中获取配置信息;同时,Zabbix Server可以将采集的信息保存至数据库,Zabbix web定时从数据库获取采集信息。
基于上述情况,对待检测的组件业务进行检测时可以按照以下方式:工作人员在Zabbix web界面上配置信息,具体包括:待检测的组件业务的业务参数项、数据采集参数和检测标准参数。Zabbix web将配置信息发送至Zabbix Server,Zabbix Server将配置信息发送至Zabbix Proxy,Zabbix Proxy将配置信息发送至各个服务器上的Zabbix Agent,Zabbix Agent将配置信息发送至SHCS,SHCS获取配置信息,根据配置信息,可以确定待检测的组件业务的业务参数项,并获得数据采集参数和检测标准参数。SHCS在检测到待运行组件运行、且提供待检测的组件业务后,向待运行组件发送模拟触发指令,触发待运行组件模拟与客户端进行数据交互的过程,按照数据采集参数,采集待运行组件在模拟数据交互的过程中产生的业务参数项的信息,根据业务参数项的信息和检测标准参数,检测待检测的组件业务是否出现故障。
SHCS检测到上述待检测的组件业务出现故障后,可以在预设的数据库中保存待检测的组件业务执行过程产生的数据。Zabbix Agent可以按照预设的时间间隔从上述预设的数据库中获得数据,Zabbix Agent将数据发送至Zabbix Proxy,Zabbix Proxy将数据发送至Zabbix Server,Zabbix Server将数据发送至Zabbix web,这样Zabbix web能够将数据显示在用户界面中,以使得工作人员及时根据显示的数据进行业务故障的诊断和运维,还可以采用设置阈值策略进行联动报警的方式,在SHCS检测到故障后,通过邮件、警报灯方式通知工作人员。
由于集群***中包括多台服务器,每台服务器上的操作***可能会不同。基于Zabbix分布式监控***对集群***提供的业务进行业务检测时,可以针对不同操作***的服务器进行业务检测,这样能够实现跨平台的业务检测。
由以上可见,应用本实施例提供的方案对集群***进行业务检测时,基于Zabbix分布式监控***,在集群***中各台服务器上配置对业务进行检测的检测程序,能够检测集群***提供的业务是否出现故障,并在出现故障的情况下,获得和保存业务故障时的数据,以使得能够对定位故障,及时恢复业务。
第二种情况:在业务***为对单机***的情况下,业务***包括单台服务器,可以在服务器上配置用于对服务器提供的业务进行检测的检测程序。
参见图3,图3为本发明实施例提供的一种单机***的框架示意图。表2为图3中单机***的各个模块的名称及功能。
表2
基于上述情况,对待检测的组件业务进行检测时可以按照以下方式可以按照以下方式进行:工作人员在SHCS web界面上配置信息,具体包括:待检测的组件业务的业务参数项、数据采集参数和检测标准参数。SHCS web向SHCS发送配置信息,SHCS根据配置信息,可以确定待检测的组件业务的业务参数项,并获得数据采集参数和检测标准参数。SHCS在检测到待运行组件运行、且提供待检测的组件业务后,向待运行组件发送模拟触发指令,触发待运行组件模拟与客户端进行数据交互的过程,按照数据采集参数,采集待运行组件在模拟数据交互的过程中产生的业务参数项的信息。根据业务参数项的信息和检测标准参数,检测待检测的组件业务是否出现故障。
SHCS检测到上述待检测的组件业务出现故障后,可以在预设的数据库中保存待检测的组件业务执行过程产生的数据。SHCS web可以按照预设的时间间隔从上述预设的数据库中获得数据,将数据显示在用户界面中,以使得工作人员及时根据显示的数据进行业务故障的诊断和运维,还可以以邮件、警报灯方式通知工作人员。
由以上可见,应用本实施例提供的方案对单机***进行业务检测时,在服务器上配置对业务进行检测的检测程序,能够检测服务器上待检测的组件业务是否出现故障,并在出现故障的情况下,获得和保存业务故障时的数据,以使得能够对定位故障,及时恢复业务。
本发明的一个实施例中,在上述S104之前,还包括以下步骤A-步骤B。
步骤A;确定待运行组件的软件参数项和待运行组件所运行于设备的硬件参数项,并按照数据采集参数,采集软件参数项的信息和硬件参数项的信息。
具体的,上述待运行组件的软件参数项可以包括以下参数中的至少一种:组件所运行时的句柄数、线程数等。
上述待运行组件所运行于设备的硬件参数项可以包括以下参数中的至少一种:用于描述组件的参数、组件运行时占用的内存资源、CPU占用率等。其中,上述用于描述组件的参数可以是组件的标识、组件的名称等。
本发明的一个实施例中,上述确定待运行组件的软件参数项和待运行组件所运行于设备的硬件参数项可以有两种方式。
第一种方式:服务器接收到携带着上述软件参数项或硬件参数项、数据采集参数的指令,并对指令进行解析,获得指令携带的上述参数项和参数。其中,上述指令中的参数项和参数可以是按照预设的排列顺序进行排列的。
例如:上述预设的排列顺序可以为[组件标识、硬件参数项、数据采集方式]。按照预设的排列顺序,指令可以为[VAG,CPU,20],VAG为组件标识,CPU为硬件参数项、20为数据采集方式,表示每个采集周期内相邻两个数据采集操作的间隔时间,单位为秒。
服务器接收到[VAG,CPU,20]后,对该指令进行解析,可以获得硬件参数项和数据采集方式。
第二种方式:工作人员将上述硬件参数项、软件参数项和数据采集参数存储在一个配置文件中,将配置文件发送至服务器,并向服务器发送解析配置文件的指令,这样服务器根据指令能够对配置文件进行解析,获得配置文件中内的硬件参数项、软件参数项和数据参数。
确定上述硬件参数项和软件参数项后,按照数据采集参数,采集硬件参数项的信息和软件参数项的信息。
步骤B:将软件参数项的信息和硬件参数项的信息,输入预先训练的业务预判模型,预测待检测的组件业务是否有出现故障的风险。
其中,上述业务预判模型为,以样本组件的软件参数项信息和样本组件所运行于设备的硬件参数项信息作为输入参数、以表征样本组件业务是否存在故障的样本检测结果为训练基准、对预设的原始分类模型训练得到的、且用于检测组件业务是否有出现故障的风险的模型。具体的,上述预设的原始分类模型可以为SVM(Support Vector Machine,支持向量机模型)。
上述表征样本组件业务是否存在故障的样本检测结果是根据多个组件的样本检测项的信息和检测标准参数进行业务检测的结果。
在对上述业务预判模型进行训练时,可以预先收集大量的组件的软件参数项信息和组件所运行于设备的硬件参数项信息,作为样本组件的软件参数项信息和样本组件所运行于设备的硬件参数项信息,然后根据大量的组件的样本检测项的信息和检测标准参数获得各个表征样本组件业务是否存在故障的样本检测结果。根据上述样本检测结果,能够对上述样本组件的软件参数项信息和样本组件所运行于设备的硬件参数项信息进行分类,分为表征组件业务未发生故障的软件参数项信息和硬件参数项信息、以及表征组件业务发生故障的软件参数项信息和硬件参数项信息。对上述分类结果进行统计,将统计结果作为样本业务预判结果,使得上述原始分类模型根据样本业务检测结果,得到业务预判模型。这样上述模型可以根据组件的软件参数项信息以及组件所运行于设备的硬件参数项信息中预判组件所运行的业务是否有出现故障的风险。
由以上可见,本实施例提供的方案中采用业务预判网络模型对样本组件的软件参数项信息、样本组件所运行于设备的硬件参数项信息判断业务***所提供的业务是否有发生故障的风险,能够在故障发生前进行预警。
与上述业务检测方法相对应,本发明实施例还提供了一种业务检测装置。
参见图4,图4为本发明实施例提供的一种业务检测装置的结构示意图,上述装置包括401-404。
业务参数项确定模块401,用于确定待检测的组件业务的业务参数项,并获得数据采集参数和检测标准参数,其中,所述组件业务为:组件提供的业务;
指令发送模块402,用于在待运行组件运行、且提供所述待检测的组件业务过程中,向所述待运行组件发送模拟触发指令,触发所述待运行组件模拟与客户端进行数据交互的过程,其中,所述待运行组件为:提供所述待检测的组件业务的组件;
第一信息采集模块403,用于按照所述数据采集参数,采集所述待运行组件在模拟数据交互的过程中产生的所述业务参数项的信息;
故障检测模块404,用于根据所述业务参数项的信息和检测标准参数,检测所述待检测的组件业务是否出现故障。
由以上可见,应用本实施例提供的装置进行业务检测时,在确定待检测的组件业务的业务参数项,并获得数据采集参数和检测标准参数后,在待运行组件运行、且提供待检测的组件业务过程中,向所述待运行组件发送模拟触发指令,触发所述待运行组件模拟与客户端进行数据交互的过程,按照数据采集参数,采集所述待运行组件在模拟数据交互的过程中产生的所述业务参数项的信息,根据业务参数项的信息和检测标准参数,检测待检测的组件业务是否出现故障。因此,应用本实施例提供的方案能够及时检测业务***提供的业务是否出现故障。
另外,在应用本发明实施例提供的方案进行业务检测的过程中,是在待运行组件在模拟数据交互过程中产生的业务参数项的信息中进行数据采集,这样来看所采集的数据是由于待检测的组件业务执行而产生的数据,从而可以认为该检测过程无需对待运行组件本身进行改造,也就是,采用了非入侵组件的方式对待检测的组件业务进行检测。
本发明的一个实施例中,上述数据采集参数包括数据采集方式、异常采集数据的处理方式中的至少一种。
本发明的一个实施例中,上述故障检测模块,具体用于:
判断所述业务参数项的信息是否位于由检测标准参数确定的异常范围内;
上述装置还包括:
数据保存模块,用于在所述业务参数项的信息位于由检测标准参数确定的异常范围内时,获得提供所述待检测的组件业务过程产生的数据,并保存所获得的数据。
这样,将业务参数项的信息与检测标准参数进行比对,能够较为准确检测待检测的组件业务是否出现故障。
本发明的一个实施例中,上述装置还包括:
第二信息采集模块,用于在上述故障检测模块404检测所述待检测的组件业务是否出现故障之前,确定所述待运行组件的软件参数项和所述待运行组件所运行于设备的硬件参数项,并按照所述数据采集参数,采集所述软件参数项的信息和所述硬件参数项的信息;
故障预判模块,用于将所述软件参数项的信息和所述硬件参数项的信息,输入预先训练的业务预判模型,预判所述待检测的组件业务是否有出现故障的风险,其中,所述业务预判模型为:以样本组件的软件参数项信息和样本组件所运行于设备的硬件参数项信息作为输入参数,以表征样本组件业务是否存在故障的样本检测结果为训练基准、对预设的原始分类模型训练得到的、且用于检测组件业务是否有出现故障的风险。
由以上可见,本实施例提供的方案中采用业务预判网络模型对样本组件的软件参数项信息、样本组件所运行于设备的硬件参数项信息判断业务***所提供的业务是否有发生故障的风险,能够在故障发生前进行预警。
与上述业务检测方法相对应,本发明实施例还提供了一种终端设备。
参见图5,图5为本发明实施例提供的一种终端设备的结构示意图,包括处理器501、通信接口502、存储器503和通信总线504,其中,处理器501,通信接口502,存储器503通过通信总线504完成相互间的通信,
存储器503,用于存放计算机程序;
处理器501,用于执行存储器503上所存放的程序时,实现本发明实施例提供的业务检测方法。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,计算机程序被处理器执行时实现本发明实施例提供的业务检测方法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行时实现本发明实施例提供的业务检测方法。
由以上可见,应用本实施例提供的方案进行业务检测时,在确定待检测的组件业务的业务参数项,并获得数据采集参数和检测标准参数后,在待运行组件运行、且提供待检测的组件业务过程中,向所述待运行组件发送模拟触发指令,触发所述待运行组件模拟与客户端进行数据交互的过程,按照数据采集参数,采集所述待运行组件在模拟数据交互的过程中产生的所述业务参数项的信息,根据业务参数项的信息和检测标准参数,检测待检测的组件业务是否出现故障。因此,应用本实施例提供的方案能够及时检测业务***提供的业务是否出现故障。
另外,在应用本发明实施例提供的方案进行业务检测的过程中,是在待运行组件在模拟数据交互过程中产生的业务参数项的信息中进行数据采集,这样来看所采集的数据是由于待检测的组件业务执行而产生的数据,从而可以认为该检测过程无需对待运行组件本身进行改造,也就是,采用了非入侵组件的方式对待检测的组件业务进行检测。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本发明实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、终端设备、计算机可读存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (8)
1.一种业务检测方法,其特征在于,所述方法包括:
确定待检测的组件业务的业务参数项,并获得数据采集参数和检测标准参数,其中,所述组件业务为:组件提供的业务;
在待运行组件运行、且提供所述待检测的组件业务过程中,向所述待运行组件发送模拟触发指令,触发所述待运行组件模拟与客户端进行数据交互的过程,其中,所述待运行组件为:提供所述待检测的组件业务的组件;
按照所述数据采集参数,采集所述待运行组件在模拟数据交互的过程中产生的所述业务参数项的信息;
确定所述待运行组件的软件参数项和所述待运行组件所运行于设备的硬件参数项,并按照所述数据采集参数,采集所述软件参数项的信息和所述硬件参数项的信息;
将所述软件参数项的信息和所述硬件参数项的信息,输入预先训练的业务预判模型,预判所述待检测的组件业务是否有出现故障的风险,其中,所述业务预判模型为:以样本组件的软件参数项信息和样本组件所运行于设备的硬件参数项信息作为输入参数,以表征样本组件业务是否存在故障的样本检测结果为训练基准、对预设的原始分类模型训练得到的、且用于检测组件业务是否有出现故障的风险;
根据所述业务参数项的信息和检测标准参数,检测所述待检测的组件业务是否出现故障。
2.根据权利要求1所述的方法,其特征在于,
所述数据采集参数包括数据采集方式、异常采集数据的处理方式中的至少一种。
3.根据权利要求1所述的方法,其特征在于,
所述根据所述业务参数项的信息和检测标准参数,检测所述待检测的组件业务是否出现故障,包括:
判断所述业务参数项的信息是否位于由检测标准参数确定的异常范围内;
所述方法还包括:
在所述业务参数项的信息位于由检测标准参数确定的异常范围内时,获得提供所述待检测的组件业务过程产生的数据,并保存所获得的数据。
4.一种业务检测装置,其特征在于,所述装置包括:
业务参数项确定模块,用于确定待检测的组件业务的业务参数项,并获得数据采集参数和检测标准参数,其中,所述组件业务为:组件提供的业务;
指令发送模块,用于在待运行组件运行、且提供所述待检测的组件业务过程中,向所述待运行组件发送模拟触发指令,触发所述待运行组件模拟与客户端进行数据交互的过程,其中,所述待运行组件为:提供所述待检测的组件业务的组件;
第一信息采集模块,用于按照所述数据采集参数,采集所述待运行组件在模拟数据交互的过程中产生的所述业务参数项的信息;
故障检测模块,用于根据所述业务参数项的信息和检测标准参数,检测所述待检测的组件业务是否出现故障;
第二信息采集模块,用于在所述故障检测模块检测所述待检测的组件业务是否出现故障之前,确定所述待运行组件的软件参数项和所述待运行组件所运行于设备的硬件参数项,并按照所述数据采集参数,采集所述软件参数项的信息和所述硬件参数项的信息;
故障预判模块,用于将所述软件参数项的信息和所述硬件参数项的信息,输入预先训练的业务预判模型,预判所述待检测的组件业务是否有出现故障的风险,其中,所述业务预判模型为:以样本组件的软件参数项信息和样本组件所运行于设备的硬件参数项信息作为输入参数,以表征样本组件业务是否存在故障的样本检测结果为训练基准、对预设的原始分类模型训练得到的、且用于检测组件业务是否有出现故障的风险。
5.根据权利要求4所述的装置,其特征在于,
所述数据采集参数包括数据采集方式、异常采集数据的处理方式中的至少一种。
6.根据权利要求4所述的装置,其特征在于,
所述故障检测模块,具体用于:
判断所述业务参数项的信息是否位于由检测标准参数确定的异常范围内;
所述装置还包括:
数据保存模块,用于在所述业务参数项的信息位于由检测标准参数确定的异常范围内时,获得提供所述待检测的组件业务过程产生的数据,并保存所获得的数据。
7.一种终端设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-3任一所述的方法步骤。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-3任一所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911167460.2A CN112835780B (zh) | 2019-11-25 | 2019-11-25 | 一种业务检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911167460.2A CN112835780B (zh) | 2019-11-25 | 2019-11-25 | 一种业务检测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112835780A CN112835780A (zh) | 2021-05-25 |
CN112835780B true CN112835780B (zh) | 2024-02-02 |
Family
ID=75922994
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911167460.2A Active CN112835780B (zh) | 2019-11-25 | 2019-11-25 | 一种业务检测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112835780B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115766554A (zh) * | 2022-11-07 | 2023-03-07 | 深圳复临科技有限公司 | 软件检测方法、装置、计算机设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106874183A (zh) * | 2016-07-05 | 2017-06-20 | 阿里巴巴集团控股有限公司 | 业务异常检测方法及装置 |
CN108200032A (zh) * | 2017-12-27 | 2018-06-22 | 北京奇艺世纪科技有限公司 | 一种数据检测方法、装置及电子设备 |
WO2019056499A1 (zh) * | 2017-09-20 | 2019-03-28 | 平安科技(深圳)有限公司 | 预测模型训练方法、数据监控方法、装置、设备及介质 |
-
2019
- 2019-11-25 CN CN201911167460.2A patent/CN112835780B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106874183A (zh) * | 2016-07-05 | 2017-06-20 | 阿里巴巴集团控股有限公司 | 业务异常检测方法及装置 |
WO2019056499A1 (zh) * | 2017-09-20 | 2019-03-28 | 平安科技(深圳)有限公司 | 预测模型训练方法、数据监控方法、装置、设备及介质 |
CN108200032A (zh) * | 2017-12-27 | 2018-06-22 | 北京奇艺世纪科技有限公司 | 一种数据检测方法、装置及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN112835780A (zh) | 2021-05-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11442803B2 (en) | Detecting and analyzing performance anomalies of client-server based applications | |
US10931730B2 (en) | Method and system for ISP network performance monitoring and fault detection | |
US9413597B2 (en) | Method and system for providing aggregated network alarms | |
JP6097889B2 (ja) | 監視システム、監視装置、および検査装置 | |
US9298525B2 (en) | Adaptive fault diagnosis | |
KR102076862B1 (ko) | 네트워크 성능지표를 시각화하는 방법 및 장치, 및 시스템 | |
US20040138858A1 (en) | System and method for providing composite variance analysis for network operation | |
CN110716842B (zh) | 集群故障检测方法和装置 | |
JP2019507454A (ja) | アプリケーションの実行中に観察される問題の根本原因を特定する方法 | |
CN111522711B (zh) | 一种数据监控处理***、方法、执行端、监控端及电子设备 | |
CN113746703B (zh) | 一种异常链路监控方法、***和装置 | |
CN110765189A (zh) | 互联网产品的异常管理方法和*** | |
CN111176941A (zh) | 一种数据处理的方法、装置和存储介质 | |
CN107168844B (zh) | 一种性能监控的方法及装置 | |
CN111611140A (zh) | 埋点数据的上报验证方法、装置、电子设备及存储介质 | |
CN108933693A (zh) | 一种域名服务***故障处理方法和*** | |
CN112835780B (zh) | 一种业务检测方法及装置 | |
CN103731315A (zh) | 一种服务器故障检测方法 | |
CN108880920B (zh) | 云服务管理方法、装置以及电子设备 | |
CN115643200A (zh) | 一种异常检测方法、装置、电子设备及介质 | |
AU2014200806B1 (en) | Adaptive fault diagnosis | |
CN110521233A (zh) | 网络故障发现 | |
CN110138634B (zh) | 一种重点数据的监控方法及终端 | |
CN110225543B (zh) | 基于网络请求数据的移动端软件质量态势感知***及方法 | |
JP5155986B2 (ja) | 監視システム、監視方法、監視用プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |