CN106850272B - 中央服务器、业务服务器及其异常检测方法和*** - Google Patents
中央服务器、业务服务器及其异常检测方法和*** Download PDFInfo
- Publication number
- CN106850272B CN106850272B CN201611269802.8A CN201611269802A CN106850272B CN 106850272 B CN106850272 B CN 106850272B CN 201611269802 A CN201611269802 A CN 201611269802A CN 106850272 B CN106850272 B CN 106850272B
- Authority
- CN
- China
- Prior art keywords
- service server
- information
- cluster
- server
- service
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0631—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/069—Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0805—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
- H04L43/0817—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/104—Peer-to-peer [P2P] networks
- H04L67/1044—Group management mechanisms
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Environmental & Geological Engineering (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Debugging And Monitoring (AREA)
Abstract
一种中央服务器、业务服务器及其异常检测方法和***,所述方法包括:提取自身的***特征信息并发送至预设的中央服务器,以使得所述中央服务器对集群中的业务服务器的***特征信息进行汇总得到总***特征信息;接收所述中央服务器发送的所述总***特征信息;基于接收所述中央服务器发送的所述总***特征信息中其他业务服务器的***特征信息与自身的***特征信息,计算得到对应的检测返回值;将计算得到的检测返回值发送至所述中央服务器,以使得所述中央服务器根据所有业务服务器发送的距离返回值确定存在异常的业务服务器的信息。上述的方案,可以在对集群中的业务服务器进行异常检测时节省成本,并提高效率。
Description
技术领域
本发明属于服务器技术领域,特别是涉及一种中央服务器、业务服务器及其异常检测方法和***。
背景技术
大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,需要经过处理模式的处理才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
集群一般由数量庞大的业务服务器组成,集群中的大数据的分析处理,如通过对集群中各业务服务器的***特征信息的分析处理,一般通过大数据平台进行,以得到集群中业务服务器的运行异常检测结果。
但是,现有的集群中业务服务器的运行异常检测方法,存在着成本高且效率低下的问题。
发明内容
本发明实施例解决的问题是如何在对集群中的业务服务器进行异常检测时节省成本,并提高效率。
为解决上述问题,本发明实施例提供了一种业务服务器异常检测方法,所述方法包括:提取自身的***特征信息并发送至预设的中央服务器,以使得所述中央服务器对集群中的业务服务器的***特征信息进行汇总得到总***特征信息;接收所述中央服务器发送的所述总***特征信息;基于接收所述中央服务器发送的所述总***特征信息中其他业务服务器的***特征信息与自身的***特征信息,计算得到对应的检测返回值;将计算得到的检测返回值发送至所述中央服务器,以使得所述中央服务器根据所有业务服务器发送的检测返回值确定存在异常的业务服务器的信息。
可选地,所述基于接收所述中央服务器发送的所述总***特征信息中其他业务服务器的***特征信息与自身的***特征信息,计算对应的检测返回值,包括:。基于所述总***特征信息中其他业务服务器的***特征信息与自身的***特征信息,计算自身所属的聚簇;基于自身所属的聚簇,计算自身的***特征信息与所属聚簇中其他业务服务器的***特征信息之间的距离;基于计算得到的自身的***特征信息与所属聚簇中其他业务服务器的***特征信息之间的距离,计算得到对应的检测返回值。
可选地,所述***特征信息包括***日志、应用日志、进程、流量、CPU用量和内存用量。
本发明实施例还提供了另一种业务服务器异常检测方法,包括:接收集群中各业务服务器发送的***特征信息;将所接收的集群中各业务服务器的***特征信息进行汇总,得到所述集群的总***特征信息;将所得到的总***特征信息分别发送至所述集群中的业务服务器,以使所述集群中的业务服务器基于接收的所述总***特征信息中其他业务服务器的***特征信息与自身的***特征信息,计算对应的检测返回值;基于所接收到的集群中的各业务服务器发送的检测返回值,确定存在异常的业务服务器的信息。
可选地,所述基于所接收到的集群中的各业务服务器发送的检测返回值,确定存在异常的业务服务器的信息,包括:将集群中的各业务服务器发送的检测返回值按照递减的排序进行排序,并将排列在头部的预设数量的检测返回值对应的业务服务器作为存在异常的业务服务器。
可选地,所述方法还包括:基于所确定的存在异常的业务服务器的信息,生成对应的告警信息并输出。
可选地,所述***特征信息包括***日志、应用日志、进程、流量、CPU用量和内存用量。
本发明实施例还提供了一种业务服务器,包括:提取单元,适于提取自身的***特征信息;第一发送单元,适于将所提取的自身的***特征信息发送至预设的中央服务器,以使得所述中央服务器对集群中的业务服务器的***特征信息进行汇总得到总***特征信息;第一接收单元,适于接收所述中央服务器发送的所述总***特征信息;计算单元,适于基于接收所述中央服务器发送的所述总***特征信息中其他业务服务器的***特征信息与自身的***特征信息,计算得到对应的检测返回值;第二发送单元,适于将计算得到的检测返回值发送至所述中央服务器,以使得所述中央服务器根据所有业务服务器发送的检测返回值确定存在异常的业务服务器的信息。
可选地,所述计算单元,适于基于所述总***特征信息中其他业务服务器的***特征信息与自身的***特征信息,计算自身所属的聚簇;基于自身所属的聚簇,计算自身的***特征信息与所属聚簇中其他业务服务器的***特征信息之间的距离;基于计算得到的自身的***特征信息与所属聚簇中其他业务服务器的***特征信息之间的距离,计算得到对应的检测返回值。
可选地,所述***特征信息包括***日志、应用日志、进程、流量、CPU用量和内存用量。
本发明实施例还提供了一种中央服务器,包括:第二接收单元,适于接收集群中各业务服务器发送的***特征信息;汇总单元,适于将所接收的集群中各业务服务器的***特征信息进行汇总,得到所述集群的总***特征信息;第三发送单元,适于将所得到的总***特征信息分别发送至所述集群中的业务服务器,以使所述集群中的业务服务器基于接收的所述总***特征信息中其他业务服务器的***特征信息与自身的***特征信息,计算对应的检测返回值;确定单元,适于基于所接收到的集群中的各业务服务器发送的检测返回值,确定存在异常的业务服务器的信息。
可选地,所述确定单元,适于将集群中的各业务服务器发送的检测返回值按照递减的排序进行排序,并将排列在头部的预设数量的检测返回值对应的业务服务器作为存在异常的业务服务器。
可选地,所述中央服务器还包括:告警单元,适于基于所确定的存在异常的业务服务器的信息,生成对应的告警信息并输出。
可选地,所述***特征信息包括***日志、应用日志、进程、流量、CPU用量和内存用量。
本发明实施例还提供了一种业务服务器异常检测***,包括多个上述的业务服务器和上述的中央服务器。
与现有技术相比,本发明的技术方案具有以下的优点:
上述的方案,通过集群中的各业务服务器将自身的***特征信息发送至预设的中央服务器,所述中央服务器对集群中所有业务服务器的***特征信息进行将汇总得到集群总特征信息并发送至集群中的各业务服务器,再由集群中的各业务服务器基于所接收的总***特征信息与自身的***特征信息,计算得到自身的异常检测结果,由于无需搭建专门的数据分析平台便可以对集群中的业务服务器进行异常检测,因而可以节省成本,并可以提高效率。
附图说明
图1是本发明实施例中一种的业务服务器异常检测方法的流程图;
图2是本发明实施例中另一种的业务服务器异常检测方法的流程图;
图3是本发明实施例中的一种业务服务器异常检测***的结构示意图;
图4是本发明实施例中的一种业务服务器异常检测方法对应的信令流程图;
图5是本发明实施例中的业务服务器的结构示意图;
图6是本发明实施例中的中央服务器的结构示意图。
具体实施方式
正如背景技术所言,现有的集群中业务服务器的运行异常检测方法,一般通过搭建专门的数据处理平台或者通过专门设置的一台服务器对集群中的所有业务服务器的***特征信息进行提取和分析,以得到集群中各业务服务器的运行异常检测结果。
但是,采用上述的方式,一方面,搭建专门的数据处理平台,需要消耗大量的资源,存在成本高的问题;另一方面,采用单台服务器对集群中数量庞大的业务服务器的***特征信息进行分析处理,存在着效率低下的问题。
为解决上述问题,本发明实施例中的技术方案通过集群中的各业务服务器将自身的***特征信息发送至预设的中央服务器,所述中央服务器对集群中所有业务服务器的***特征信息进行将汇总得到集群总特征信息并发送至集群中的各业务服务器,再由集群中的各业务服务器基于所接收的总***特征信息与自身的***特征信息,计算得到自身的异常检测结果,可以节省成本,并可以提高效率。
为使本发明的上述目的、特征和优点能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
图1是本发明实施例中的一种业务服务器异常检测方法的流程图。如图1所示的业务服务器异常检测方法,可以包括:
步骤S101:提取自身的***特征信息并发送至预设的中央服务器。
在具体实施中,集群中的业务服务器可以分别提取自身的***特征信息并发送至预设的中央服务器,从而可以使得所述中央服务器可以获取集群中所有业务服务器的***特征信息并进行汇总,以得到对应的总***特征信息。
在具体实施中,业务服务器所提取的自身的***特征信息可以业务服务器的异常检测的需要进行设置,如包括***日志、应用日志、进程、流量、CPU用量以及内存用量的信息等。
步骤S102:接收所述中央服务器发送的所述总***特征信息。
在具体实施中,所述中央服务器在接收到集群中的所有业务服务器发送的集群总特征信息时,可以将所接收的集群中的所有业务服务器的总***特征信息进行汇总,并分别发送至集群中的各业务服务器,以使得集群中的各业务服务器可以获取所述总***特征信息。
步骤S103:基于接收所述中央服务器发送的所述总***特征信息中其他业务服务器的***特征信息与自身的***特征信息,计算得到对应的检测返回值。
在具体实施中,业务服务器在接收到中央服务器发送的集群总特征信息时,便可以基于所接收的总***特征信息以及自身的***特征信息,计算得到对应的检测返回值并发送至中央服务器,使得中央服务器可以获取对应的检测返回值。
步骤S104:将计算得到的检测返回值发送至所述中央服务器,以使得所述中央服务器根据所有业务服务器发送的检测返回值确定存在异常的业务服务器的信息。
在具体实施中,各业务服务器在计算得到对应的检测返回值时,可以将对应的检测返回值发送至中央服务器,以使得中央服务器可以基于各业务服务器基于各业务服务器的检测返回值确定集群中存在异常的业务服务器的信息。
图2示出了本发明实施例中的另一种业务服务器异常检测方法的流程图。参见图2,本发明实施例中的业务服务器异常检测方法,可以具体采用如下的操作实现:
步骤S201:接收集群中各业务服务器发送的***特征信息。
在具体实施中,在进行集群中的业务服务器的异常检测时,可以首先接收集群中的各业务服务器发送的***特征信息。
步骤S202:将所接收的集群中各业务服务器的***特征信息进行汇总,得到所述集群的总***特征信息。
在具体实施中,中央服务器在接收到各业务服务器发送的各自的***特征信息时,可以将所接收的集群中的所有业务服务器的***特征信息进行汇总,从而得到集群的总***特征信息。例如,中央服务器可以生成对应的列表,在所述列表中包括集群中的各个业务服务器的标识以及该业务服务器的***特征信息。其中,各个业务服务器的标识可以为IP地址等。
步骤S203:将所得到的总***特征信息分别发送至所述集群中的业务服务器。
在具体实施中,中央服务器在汇总得到对应的总***特征信息时,可以将所述总***特征信息分别发送至集群中的各个业务服务器,以使所述集群中的业务服务器可以基于所接收的总***特征信息与自身的***特征信息,计算得到自身对应的检测返回值并发送。
步骤S204:基于所接收到的集群中的各业务服务器发送的检测返回值,确定存在异常的业务服务器的信息。
在具体实施中,中央服务器可以基于集群中各个业务服务器发送的检测返回值的信息,确定集群中存在异常的业务服务器的信息。
上述的方案,通过集群中的各业务服务器将自身的***特征信息发送至预设的中央服务器,以使得所述中央服务器对集群中所有业务服务器的***特征信息进行将汇总得到集群总特征信息并发送至集群中的各业务服务器,再由集群中的各业务服务器基于所接收的总***特征信息与自身的***特征信息,计算得到自身的异常检测结果,由于无需搭建专门的数据分析平台便可以是集群中业务服务器的异常检测,因而可以节省成本,并可以提高效率。
下面将对本发明实施例中的业务服务器异常检测方法进行详细的介绍。
为了便于理解,下面首先对本发明实施例中的业务服务器异常检测***的结构进行介绍。
参见图3,本发明实施例中的一种业务服务器异常检测***可以包括由多个业务服务器3011~301n组成的集群和中央服务器302。其中,集群中的业务服务器3011~301n分别与中央服务器302连接。
参见图4,本发明实施例中的一种业务服务器异常检测方法,用于对集群中的所有的业务服务器的运行异常状态进行检测,具体可以采用如下的操作实现:
步骤S401:集群中的业务服务器提取自身的***特征信息并发送至中央服务器。
在具体实施中,在进行业务服务器异常检测时,可以首先设定相应的检测周期,当达到对应的检测周期时,可以启动业务服务器的异常检测。此时,确定达到对应的检测周期时,集群中的各业务服务器可以分别按照对应的***特征信息的设置,从自身的***中提取对应的***特征信息,作为自身的***特征信息并发送至中央服务器。其中,所设置的检测周期可以根据需要,如客户的需求进行设置等。
步骤S402:所述中央服务器接收业务服务器的总***特征信息并进行汇总得到对应的总***特征信息。
步骤S403:所述中央服务器将所述总***特征信息发送至集群中的各个业务服务器。
在具体实施中,中央服务器在接收到集群中的所有业务服务器发送的集群总特征信息时,可以将所接收的集群中的所有业务服务器的总***特征信息进行汇总,并分别发送至集群中的各业务服务器,以使得集群中的各业务服务器可以获取所述总***特征信息。
步骤S404:所述业务服务器接收所述总***特征信息。
在具体实施中,集群中的各个业务服务器所接收的***总特征信息中不仅包括集群中其他业务服务器的***特征信息,还包括自身的***总特征信息。
步骤S405:各个业务服务器基于所接收到的***总特征信息与自身的***特征信息,确定自身所属的聚簇,并计算自身的***特征信息与所属聚簇中其他业务服务器的***特征信息之间的距离。
在具体实施中,集群中的各个业务服务器在接收到所述总***特征信息时,采用相应的聚类算法确定自身所属的聚簇,也即是确定与自身属于同一聚簇中的其他业务服务器的信息。
当确定自身所属聚簇中的其他业务服务器的信息时,各个业务服务器可以采用自身的***特征信息和聚簇中其他业务服务器的***特征信息以及自身的***特征信息,计算自身的***特征信息与聚簇中其他业务服务器的***特征信息之间的距离。
步骤S406:所述业务服务器基于计算自身的***特征信息与所属聚簇中其他业务服务器的***特征信息之间的距离,计算得到对应的检测返回值。
在具体实施中,当计算得到自身的***特征信息与所属聚簇中其他业务服务器的***特征信息之间的距离时,各个业务服务器可以采用计算得到自身的***特征信息与所属聚簇中其他业务服务器的***特征信息之间的距离,计算得到对应的检测返回值。
在具体实施中,各个业务服务器可以采用计算得到的自身的***特征信息与所属聚簇中其他业务服务器的***特征信息之间的距离,计算得到对应的检测返回值的方法可以根据实际的需要进行选取。例如,可以将计算得到的自身的***特征信息与所属聚簇中其他业务服务器的***特征信息之间的距离进行相加,得到对应的检测返回值等。
步骤S407:所述业务服务器将计算得到的对应的检测返回值发送至中央服务器。
在具体实施中,当计算得到对应的检测返回值时,集群中的各个业务服务器可以将对应的检测返回值发送至中央服务器。
步骤S408:所述中央服务器接收集群中各业务服务器发送的检测返回值的信息。
在具体实施中,中央服务器所接收的检测返回值与集群中的各个业务服务器一一对应。
步骤S409:所述中央服务器基于所接收的集群中各业务服务器的检测返回值确定存在异常的业务服务器的信息。
在具体实施中,当接收到集群中各业务服务器的检测返回值时,中央服务器可以基于集群中各业务服务器的检测返回值确定存在异常的业务服务器。其中,***特征信息与聚簇中其他业务服务器的***特征信息之间的距离越大时,也即聚簇中的离群点对应的检测返回值也较大。因此,可以将集群中各业务服务器的检测返回值进行排序,并将数值较大的预设数量的检测返回值对应的业务服务器,作为存在异常的业务服务器。
步骤S410:基于确定存在异常的业务服务器的信息,生成对应的告警信息并输出。
在具体实施中,中央服务器在确定集群中存在异常的离群点的信息时,便可以生成对应的告警信息并输出,从而可以使得用户获取存在异常的业务服务器的信息,以便客户可以采取相应的措施消除业务服务器的运行异常,从而可以提高集群的运行可靠性。
采用上述的方案对集群中业务服务器进行异常检测,可以显著提高异常检测的速度。以集群中包括20000台业务服务器为例,采用本发明实施例中异常检测方法时,最消耗计算资源的地方在于聚簇算法中需要计算每个业务服务器与其他业务服务器之间的距离。其中,当计算一台业务服务器与19999台其他业务服务器之间的距离分别需要0.4秒时,采用现有技术中的方法,需要消耗的时间为:0.4*20000=2.2小时。但是,采用本发明实施例中的服务器异常检测方法,每台业务服务器仅消耗0.4秒上传对应的检测返回值,中央服务器仅需做一个20000个数值的检测返回值的排序即可得到对应的异常检测结果,因而可以提高业务服务器的异常检测速度。
上述对本发明实施例中的业务服务器异常检测方法进行了详细的描述,下面将对上述的方法对应的装置进行介绍。
图5示出了本发明实施例中的一种业务服务器的结构。参见图5,本发明实施例中的一种业务服务器500可以包括提取单元501、第一发送单元502、第一接收单元503、计算单元504和第二发送单元505,其中:
提取单元501,适于提取自身的***特征信息。
第一发送单元502,适于将所提取的自身的***特征信息发送至预设的中央服务器,以使得所述中央服务器对集群中的业务服务器的***特征信息进行汇总得到总***特征信息。
第一接收单元503,适于接收所述中央服务器发送的所述总***特征信息。
计算单元504,适于基于接收所述中央服务器发送的所述总***特征信息中其他业务服务器的***特征信息与自身的***特征信息,计算得到对应的检测返回值。
第二发送单元505,适于将计算得到的检测返回值发送至所述中央服务器,以使得所述中央服务器根据所有业务服务器发送的检测返回值确定存在异常的业务服务器的信息。
在本发明一实施例中,所述计算单元504,适于基于所述总***特征信息中其他业务服务器的***特征信息与自身的***特征信息,计算自身所属的聚簇;基于自身所属的聚簇,计算自身的***特征信息与所属聚簇中其他业务服务器的***特征信息之间的距离;基于计算得到的自身的***特征信息与所属聚簇中其他业务服务器的***特征信息之间的距离,计算得到对应的检测返回值。
在具体实施中,所述***特征信息可以包括***日志、应用日志、进程、流量、CPU用量和内存用量。
图6示出了本发明实施例中的一种中央服务器的结构。参见图6,一种中央服务器600可以包括第二接收单元601、汇总单元602、第三发送单元603和确定单元604,其中:
第二接收单元601,适于接收集群中各业务服务器发送的***特征信息。
汇总单元602,适于将所接收的集群中各业务服务器的***特征信息进行汇总,得到所述集群的总***特征信息。
第三发送单元603,适于将所得到的总***特征信息分别发送至所述集群中的业务服务器,以使所述集群中的业务服务器基于接收的所述总***特征信息中其他业务服务器的***特征信息与自身的***特征信息,计算对应的检测返回值。
确定单元604,适于基于所接收到的集群中的各业务服务器发送的检测返回值,确定存在异常的业务服务器的信息。
在具体实施中,所述确定单元,适于将集群中的各业务服务器发送的检测返回值按照递减的排序进行排序,并将排列在头部的预设数量的检测返回值对应的业务服务器作为存在异常的业务服务器。
在本发明一实施例中,为了使得用户可以及时地获知业务服务器的异常信息,所述中央服务器600还可以包括告警单元605,其中:
告警单元605,适于基于所确定的存在异常的业务服务器的信息,生成对应的告警信息并输出。
在具体实施中,所述***特征信息包括***日志、应用日志、进程、流量、CPU用量和内存用量。
采用本发明实施例中的上述方案,通过集群中的各业务服务器将自身的***特征信息发送至预设的中央服务器,以使得所述中央服务器对集群中所有业务服务器的***特征信息进行将汇总得到集群总特征信息并发送至集群中的各业务服务器,再由集群中的各业务服务器基于所接收的总***特征信息与自身的***特征信息,计算得到自身的异常检测结果,由于无需搭建专门的数据分析平台便可以是集群中业务服务器的异常检测,因而可以节省成本,并可以提高效率。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。
以上对本发明实施例的方法及***做了详细的介绍,本发明并不限于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。
Claims (15)
1.一种业务服务器异常检测方法,其特征在于,集群中包括中央服务器和多个业务服务器,所述业务服务器异常检测方法包括:
业务服务器提取自身的***特征信息并发送至预设的中央服务器,以使得所述中央服务器对集群中的业务服务器的***特征信息进行汇总得到总***特征信息;
业务服务器接收所述中央服务器发送的所述总***特征信息;
业务服务器基于接收所述中央服务器发送的所述总***特征信息中其他业务服务器的***特征信息与自身的***特征信息,计算得到对应的检测返回值;
业务服务器将计算得到的检测返回值发送至所述中央服务器,以使得所述中央服务器根据所有业务服务器发送的检测返回值确定存在异常的业务服务器的信息。
2.根据权利要求1所述的业务服务器异常检测方法,其特征在于,所述基于接收所述中央服务器发送的所述总***特征信息中其他业务服务器的***特征信息与自身的***特征信息,计算对应的检测返回值,包括:
基于所述总***特征信息中其他业务服务器的***特征信息与自身的***特征信息,计算自身所属的聚簇;
基于自身所属的聚簇,计算自身的***特征信息与所属聚簇中其他业务服务器的***特征信息之间的距离;
基于计算得到的自身的***特征信息与所属聚簇中其他业务服务器的***特征信息之间的距离,计算得到对应的检测返回值。
3.根据权利要求1所述的业务服务器异常检测方法,其特征在于,所述***特征信息包括***日志、应用日志、进程、流量、CPU用量和内存用量。
4.一种业务服务器异常检测方法,其特征在于,集群中包括中央服务器和多个业务服务器,所述业务服务器异常检测方法包括:
中央服务器接收集群中各业务服务器发送的***特征信息;
中央服务器将所接收的集群中各业务服务器的***特征信息进行汇总,得到所述集群的总***特征信息;
中央服务器将所得到的总***特征信息分别发送至所述集群中的业务服务器,以使所述集群中的业务服务器基于接收的所述总***特征信息中其他业务服务器的***特征信息与自身的***特征信息,计算对应的检测返回值;
中央服务器基于所接收到的集群中的各业务服务器发送的检测返回值,确定存在异常的业务服务器的信息。
5.根据权利要求4所述的业务服务器异常检测方法,其特征在于,所述基于所接收到的集群中的各业务服务器发送的检测返回值,确定存在异常的业务服务器的信息,包括:
将集群中的各业务服务器发送的检测返回值按照递减的排序进行排序,并将排列在头部的预设数量的检测返回值对应的业务服务器作为存在异常的业务服务器。
6.根据权利要求5所述的业务服务器异常检测方法,其特征在于,还包括:基于所确定的存在异常的业务服务器的信息,生成对应的告警信息并输出。
7.根据权利要求5所述的业务服务器异常检测方法,其特征在于,所述***特征信息包括***日志、应用日志、进程、流量、CPU用量和内存用量。
8.一种业务服务器,其特征在于,包括:
提取单元,适于提取自身的***特征信息;
第一发送单元,适于将所提取的自身的***特征信息发送至预设的中央服务器,以使得所述中央服务器对集群中的业务服务器的***特征信息进行汇总得到总***特征信息;
第一接收单元,适于接收所述中央服务器发送的所述总***特征信息;
计算单元,适于基于接收所述中央服务器发送的所述总***特征信息中其他业务服务器的***特征信息与自身的***特征信息,计算得到对应的检测返回值;
第二发送单元,适于将计算得到的检测返回值发送至所述中央服务器,以使得所述中央服务器根据所有业务服务器发送的检测返回值确定存在异常的业务服务器的信息。
9.根据权利要求8所述的业务服务器,其特征在于,所述计算单元,适于基于所述总***特征信息中其他业务服务器的***特征信息与自身的***特征信息,计算自身所属的聚簇;基于自身所属的聚簇,计算自身的***特征信息与所属聚簇中其他业务服务器的***特征信息之间的距离;基于计算得到的自身的***特征信息与所属聚簇中其他业务服务器的***特征信息之间的距离,计算得到对应的检测返回值。
10.根据权利要求8所述的业务服务器,其特征在于,所述***特征信息包括***日志、应用日志、进程、流量、CPU用量和内存用量。
11.一种中央服务器,其特征在于,包括:
第二接收单元,适于接收集群中各业务服务器发送的***特征信息;
汇总单元,适于将所接收的集群中各业务服务器的***特征信息进行汇总,得到所述集群的总***特征信息;
第三发送单元,适于将所得到的总***特征信息分别发送至所述集群中的业务服务器,以使所述集群中的业务服务器基于接收的所述总***特征信息中其他业务服务器的***特征信息与自身的***特征信息,计算对应的检测返回值;
确定单元,适于基于所接收到的集群中的各业务服务器发送的检测返回值,确定存在异常的业务服务器的信息。
12.根据权利要求11所述的中央服务器,其特征在于,所述确定单元,适于将集群中的各业务服务器发送的检测返回值按照递减的排序进行排序,并将排列在头部的预设数量的检测返回值对应的业务服务器作为存在异常的业务服务器。
13.根据权利要求12所述的中央服务器,其特征在于,还包括:告警单元,适于基于所确定的存在异常的业务服务器的信息,生成对应的告警信息并输出。
14.根据权利要求12所述的中央服务器,其特征在于,所述***特征信息包括***日志、应用日志、进程、流量、CPU用量和内存用量。
15.一种业务服务器异常检测***,其特征在于,包括多个权利要求8-10任一项所述的业务服务器和权利要求11-14任一项所述的中央服务器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611269802.8A CN106850272B (zh) | 2016-12-30 | 2016-12-30 | 中央服务器、业务服务器及其异常检测方法和*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611269802.8A CN106850272B (zh) | 2016-12-30 | 2016-12-30 | 中央服务器、业务服务器及其异常检测方法和*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106850272A CN106850272A (zh) | 2017-06-13 |
CN106850272B true CN106850272B (zh) | 2019-10-22 |
Family
ID=59118578
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611269802.8A Active CN106850272B (zh) | 2016-12-30 | 2016-12-30 | 中央服务器、业务服务器及其异常检测方法和*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106850272B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107786544B (zh) * | 2017-09-29 | 2018-08-17 | 贵州白山云科技有限公司 | 一种消息的任务状态处理方法及*** |
CN108337232A (zh) * | 2017-12-26 | 2018-07-27 | 努比亚技术有限公司 | 网络异常检测方法、网络安全设备及计算机可读存储介质 |
CN113377627B (zh) * | 2021-06-10 | 2023-12-05 | 广州朗国电子科技股份有限公司 | 一种业务服务器异常检测方法、***、设备、存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101505243A (zh) * | 2009-03-10 | 2009-08-12 | 中国科学院软件研究所 | 一种Web应用性能异常侦测方法 |
CN102325036A (zh) * | 2011-05-17 | 2012-01-18 | 中兴通讯股份有限公司 | 一种网络***的故障诊断方法、***及装置 |
CN103428035A (zh) * | 2013-08-26 | 2013-12-04 | 福建省视通光电网络有限公司 | 一种基于tcp/ip协议的大型网络通信***与方法 |
CN103580903A (zh) * | 2012-08-02 | 2014-02-12 | 人人游戏网络科技发展(上海)有限公司 | 识别服务器***中的热点和可能故障的方法、设备和*** |
CN104579823A (zh) * | 2014-12-12 | 2015-04-29 | 国家电网公司 | 一种基于大数据流的网络流量异常检测***及方法 |
CN105306252A (zh) * | 2015-09-19 | 2016-02-03 | 北京暴风科技股份有限公司 | 一种自动判别服务器故障的方法 |
-
2016
- 2016-12-30 CN CN201611269802.8A patent/CN106850272B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101505243A (zh) * | 2009-03-10 | 2009-08-12 | 中国科学院软件研究所 | 一种Web应用性能异常侦测方法 |
CN102325036A (zh) * | 2011-05-17 | 2012-01-18 | 中兴通讯股份有限公司 | 一种网络***的故障诊断方法、***及装置 |
CN103580903A (zh) * | 2012-08-02 | 2014-02-12 | 人人游戏网络科技发展(上海)有限公司 | 识别服务器***中的热点和可能故障的方法、设备和*** |
CN103428035A (zh) * | 2013-08-26 | 2013-12-04 | 福建省视通光电网络有限公司 | 一种基于tcp/ip协议的大型网络通信***与方法 |
CN104579823A (zh) * | 2014-12-12 | 2015-04-29 | 国家电网公司 | 一种基于大数据流的网络流量异常检测***及方法 |
CN105306252A (zh) * | 2015-09-19 | 2016-02-03 | 北京暴风科技股份有限公司 | 一种自动判别服务器故障的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN106850272A (zh) | 2017-06-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105376260B (zh) | 一种基于密度峰值聚类的网络异常流量监测*** | |
US8661283B2 (en) | Power distribution unit-device correlation | |
CN106548402B (zh) | 资源转移监控方法及装置 | |
CN106850272B (zh) | 中央服务器、业务服务器及其异常检测方法和*** | |
CN111144435B (zh) | 基于lof和验证过滤框架的电能量异常数据监测方法 | |
CN106645934B (zh) | 基于动态网格离群点的用电行为反窃电诊断方法和装置 | |
CN110381126A (zh) | 基于边缘计算的用电设备识别方法、***、设备及介质 | |
CN103475544A (zh) | 一种基于云资源监控平台的业务监控方法 | |
CN105323107A (zh) | 网络接口卡信息管理方法及网络接口卡信息管理*** | |
Song et al. | Real-time anomaly traffic monitoring based on dynamic k-NN cumulative-distance abnormal detection algorithm | |
CN112769612A (zh) | 一种告警事件去误报方法及装置 | |
CN112328688B (zh) | 数据存储方法、装置、计算机设备及存储介质 | |
WO2018033052A1 (zh) | 一种评估用户画像数据的方法及*** | |
CN103675513A (zh) | 电器设备识别***及方法 | |
Bharti et al. | Intrusion detection using clustering | |
CN109145109B (zh) | 基于社交网络的用户群体消息传播异常分析方法及装置 | |
CN113098912B (zh) | 用户账户异常的识别方法、装置、电子设备及存储介质 | |
CN110738415A (zh) | 基于用电采集***和离群点算法的窃电用户分析方法 | |
CN109388512A (zh) | 针对大规模计算机集群异常程度的评估与分析*** | |
CN103902798A (zh) | 数据预处理方法 | |
CN108898190A (zh) | 一种基于环保大数据的环境监测预警方法及*** | |
KR101831959B1 (ko) | 빅데이터 분석 클라우드 서비스 시스템 | |
CN102855394A (zh) | 一种基于概率分布的检测建筑用能异常的方法 | |
CN112241615A (zh) | 一种数据平衡性时序的检测方法、***及电子设备 | |
CN109474593A (zh) | 一种识别c&c周期性回连行为的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |