CN102404160B - 智能监控实现方法和*** - Google Patents

智能监控实现方法和*** Download PDF

Info

Publication number
CN102404160B
CN102404160B CN201010281379.XA CN201010281379A CN102404160B CN 102404160 B CN102404160 B CN 102404160B CN 201010281379 A CN201010281379 A CN 201010281379A CN 102404160 B CN102404160 B CN 102404160B
Authority
CN
China
Prior art keywords
server
business
load
balancing device
control center
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201010281379.XA
Other languages
English (en)
Other versions
CN102404160A (zh
Inventor
彭家华
林志云
赵智勇
陈翔宇
刘良军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Group Fujian Co Ltd
Original Assignee
China Mobile Group Fujian Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Group Fujian Co Ltd filed Critical China Mobile Group Fujian Co Ltd
Priority to CN201010281379.XA priority Critical patent/CN102404160B/zh
Publication of CN102404160A publication Critical patent/CN102404160A/zh
Application granted granted Critical
Publication of CN102404160B publication Critical patent/CN102404160B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明提供了智能监控实现方法和***,其中,将服务器群和负载均衡设备群连接形成服务器池;该方法包括:A,智能监控中心扫描所述服务器池中在用服务器的运行情况和该在用服务器上业务的运行情况;B,如果在用服务器的运行情况或者该在用服务器上业务的运行情况显示异常,则智能监控中心调整与该在用服务器连接的负载均衡设备的连接状态。采用本发明,能够在监测到业务性能和可用性的同时,实现大范围资源间的灵活调用。

Description

智能监控实现方法和***
技术领域
本发明涉及监控技术,特别涉及智能监控实现方法和***。
背景技术
目前,业务支撑网已从一个概念逐步发展成一个真正的实体网络,呈现越来越明显的“网络化”特征。在业务支撑网中,可实现的高可用方式和并发处理能力主要为负载均衡器技术。
负载均衡器技术建立在现有网络结构之上,其需要在服务器和外部网络间安装负载均衡设备,并由专有设备即负载均衡器实现负载均衡策略与智能化的流量管理。具体为:负载均衡器将大量的并发访问或数据流量分担到多台节点比如服务器上分别处理,通过网络端口比如TCP/IP端口的活动性与各个节点设备上自定义的监控脚本进行实时监测,判断后端节点的可用性,以便实现节点间的无缝切换。
可以看出,现有的负载均衡器技术主要基于网络端口的活动性与节点上自定义的监控脚本进行监测,这无法监测业务内部的性能以及业务的可用性。并且,现有的负载均衡器技术无法基于后端节点的整体运行情况给出综合的负载均衡判断,不能实现大范围资源间的灵活调用。
发明内容
本发明提供了智能监控实现方法和***,以便在监测到业务性能和可用性的同时,实现大范围资源间的灵活调用。
本发明提供的技术方案包括:
一种智能监控实现方法,将服务器群和负载均衡设备群连接形成服务器池;该方法包括:
A,智能监控中心扫描所述服务器池中在用服务器的运行情况和该在用服务器上业务的运行情况;
B,如果在用服务器的运行情况或者该在用服务器上业务的运行情况显示异常,则智能监控中心调整与该在用服务器连接的负载均衡设备的连接状态。
优选地,所述步骤B中,如果所有在用服务器的运行情况和该所有在用服务器上业务的运行情况均正常,则进一步包括:在扫描的时间到达时,返回执行步骤A。
优选地,所述步骤A中,智能监控中心实时或者每隔设定时间扫描所述服务器池中在用服务器的运行情况和该在用服务器上业务的运行情况。
优选地,所述在用服务器的运行情况包括该在用服务器的告警指标和性能指标中的至少一个;
优选地,所述步骤B中的调整包括:
B1,智能监控中心为服务器池中各个服务器设置标记,并通过HTTP页面显示;
B2,所述负载均衡设备通过运行设定的外部监控程序调用智能监控中心的HTTP页面,以使所述外部监控程序根据所述HTTP页面上每一服务器的标记输出相应的关键字给所述负载均衡设备,其中,如果一服务器的标记为第一标识,外部监控程序则输出关键字UP,如果一服务器的标记为第二标识,外部监控程序则输出关键字down;
B3,所述负载均衡设备在所述外部监控程序根据服务器的标记输出关键字UP时,和该服务器连接,标识该服务器为在用服务器,在输出关键字为down时,不和该服务器连接,标识该服务器为备用服务器。
优选地,所述在用服务器的运行情况包括该在用服务器的告警指标和性能指标中的至少一个;
其中,在用服务器的告警指标显示异常包括:该在用服务器宕机和该在用服务器网络不可达中的至少一个;在用服务器的性能指标显示异常包括:该在用服务器的CPU利用率超过第一设定值和该在用服务器的内存利用率超过第二设定值中的至少一个。
优选地,所述步骤B1中的设置包括:
B11,如果在用服务器的告警指标显示异常,则智能监控中心按照备用服务器的优先级大小顺序轮询到用于接替该在用服务器工作的服务器;如果在用服务器的性能指标显示异常,则智能监控中心按照备用服务器的优先级大小顺序轮询到用于和该在用服务器实现负载均衡的服务器;
B12,如果在用服务器的告警指标显示异常,则确定用于接替该在用服务器工作的服务器为所述负载均衡设备需要连接的服务器,如果在用服务器的性能指标显示异常,则确定该在用服务器、以及用于和该在用服务器实现负载均衡的服务器为所述负载均衡设备需要连接的服务器;
B13,智能监控中心将所述负载均衡设备需要连接的每一服务器标记为第一标识,以及将所述服务器池中其他服务器标记为第二标识。
优选地,所述业务的运行情况包括:该业务的告警指标和性能指标中的至少一个;
其中,业务的告警指标显示异常包括:运行该业务的应用程序不正常和该应用程序的可用性低于第三设定值中的至少一个;业务的性能指标显示异常包括:该业务的积压量高于第四设定值和所述应用程序的处理能力超过第五设定值中的至少一个。
优选地,所述步骤B1中的设置包括:
B21,如果在用服务器上业务的告警指标显示异常,则智能监控中心按照备用服务器的优先级大小顺序轮询到用于运行该业务的服务器;如果在用服务器上业务的性能指标显示异常,则智能监控中心按照备用服务器的优先级大小顺序轮询到用于和该在用服务器均衡分担该业务的服务器;
B22,如果在用服务器上业务的告警指标显示异常,则确定该在用服务器和用于运行所述业务的服务器为所述负载均衡设备需要连接的服务器,如果在用服务器上业务的性能指标显示异常,则确定该在用服务器、以及用于和所述在用服务器均衡分担所述业务的服务器为所述负载均衡设备需要连接的服务器;
B23,智能监控中心将所述负载均衡设备需要连接的每一服务器标记为第一标识,以及将所述服务器池中其他服务器标记为第二标识。
一种智能监控实现***,包括服务器群、负载均衡设备群和智能监控中心,其中,
所述服务器群和所述负载均衡设备群连接形成服务器池;
所述智能监控中心用于扫描所述服务器池中在用服务器的运行情况和该在用服务器上业务的运行情况,如果在用服务器的运行情况或者该在用服务器上业务的运行情况显示异常,则调整与该在用服务器连接的负载均衡设备的连接状态。
优选地,所述智能监控中心实时或者每隔设定时间扫描所述服务器池中在用服务器的运行情况和该在用服务器上业务的运行情况。
优选地,所述智能监控中心还用于为服务器池中各个服务器设置标记,并通过HTTP页面显示;
与所述在用服务器连接的每一负载均衡设备包括:
调用单元,用于通过运行设定的外部监控程序调用智能监控中心的HTTP页面,以使所述外部监控程序根据所述HTTP页面上每一服务器的标记输出相应的关键字给所述负载均衡设备;其中,如果一服务器的标记为第一标识,外部监控程序则输出关键字UP,如果一服务器的标记为第二标识,外部监控程序则输出关键字down;
连接调整单元,用于在所述外部监控程序根据服务器的标记输出关键字UP时,和该服务器连接,标识该服务器为在用服务器,在输出关键字为down时,不和该服务器连接,标识该服务器为备用服务器。
优选地,所述在用服务器的运行情况包括该在用服务器的告警指标和性能指标中的至少一个;其中,在用服务器的告警指标显示异常包括:该在用服务器宕机和该在用服务器网络不可达中的至少一个;在用服务器的性能指标显示异常包括:该在用服务器的CPU利用率超过第一设定值和该在用服务器的内存利用率超过第二设定值中的至少一个;
所述智能监控中心包括:
第一轮询单元,用于当在用服务器的告警指标显示异常时,按照备用服务器的优先级大小顺序轮询到用于接替该在用服务器工作的服务器;以及当在用服务器的性能指标显示异常时,按照备用服务器的优先级大小顺序轮询到用于和该在用服务器实现负载均衡的服务器;
第一确定单元,用于当在用服务器的告警指标显示异常时,确定用于接替该在用服务器工作的服务器为所述负载均衡设备需要连接的服务器,当在用服务器的性能指标显示异常时,确定该在用服务器、以及用于和该在用服务器实现负载均衡的服务器为所述负载均衡设备需要连接的服务器;
调整单元,用于将所述负载均衡设备需要连接的每一服务器标记为第一标识,以及将所述服务器池中其他服务器标记为第二标识。
优选地,所述业务的运行情况包括:该业务的告警指标和性能指标中的至少一个;
其中,业务的告警指标显示异常包括:运行该业务的应用程序不正常和该应用程序的可用性低于第三设定值中的至少一个;业务的性能指标显示异常包括:该业务的积压量高于第四设定值和所述应用程序的处理能力超过第五设定值中的至少一个;
所述智能监控中心包括:
第二轮询单元,用于当在用服务器上业务的告警指标显示异常时,按照备用服务器的优先级大小顺序轮询到用于运行该业务的服务器;以及当在用服务器上业务的性能指标显示异常时,按照备用服务器的优先级大小顺序轮询到用于和该在用服务器均衡分担该业务的服务器;
第二确定单元,用于当在用服务器上业务的告警指标显示异常时,确定该在用服务器和用于运行所述业务的服务器为所述负载均衡设备需要连接的服务器,以及当在用服务器上业务的性能指标显示异常时,确定该在用服务器、以及用于和所述在用服务器均衡分担所述业务的服务器为所述负载均衡设备需要连接的服务器;
调整单元,用于将所述负载均衡设备需要连接的每一服务器标记为第一标识,以及将所述服务器池中其他服务器标记为第二标识;根据各个服务器的标记调整所述负载均衡设备的连接状态。
由以上技术方案可以看出,本发明中,通过扫描在用服务器的运行情况,以及该在用服务器上业务的运行情况,能够实现有效收集业务内部的性能以及业务的可用性信息;
进一步地,本发明通过调整与该在用服务器连接的负载均衡设备连接状态,从整体上把全网的服务器群纳入统一管理,实现较大范围资源间的无缝、灵活调用;
更进一步地,本发明继承了原有负载均衡器技术的所有功能,在调整连接状态时,无需中断业务,同时也实现了资源间的负载均衡。
附图说明
图1为本发明实施例提供的基本流程图;
图2为本发明实施例提供的智能监控中心与负载均衡设备通信的流程图;
图3为本发明实施例提供的***结构图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
本发明实施例中以网络化的思维构建业务支撑网,并在此基础上建立智能监控中心。该智能监控中心是基于云计算开发的,其可以将服务器群与负载均衡设备通过网络连接起来,组成服务器池。之后,执行图1所示的流程。
参见图1,图1为本发明实施例提供的基本流程图。如图1所示,该智能监控中心执行的操作可包括:
步骤101,智能监控中心扫描服务器池中在用服务器的运行情况、以及该在用服务器上业务的运行情况。
本步骤101中,能监控中心可以实时或者每隔设定时间比如3秒扫描服务器池中在用服务器的运行情况和该在用服务器上业务的运行情况。
另外,本步骤101中的在用服务器可为运营管理域或者网管***中的服务器,其可包含业务探测***中的服务器、运营管理***中的服务器等,本发明实施例并不具体限定。
步骤102,如果在用服务器的运行情况或者该在用服务器上业务的运行情况显示异常,则智能监控中心调整与该在用服务器连接的负载均衡设备的连接状态。
步骤102中,在用服务器的运行情况主要包括在用服务器的告警指标和性能指标,其中,在用服务器的告警指标可包括:在用服务器是否宕机,在用服务器网络不可达中的至少一个;在用服务器的性能指标可包括:在用服务器的CPU利用率、在用服务器的内存利用率中的至少一个。其中,如果在用服务器的告警指标显示异常,则表示该在用服务器宕机和在用服务器网络不可达中的至少一个;如果在用服务器的性能指标显示异常,则表示该在用服务器的CPU利用率超过第一设定值比如90%和该在用服务器的内存利用率超过第二设定值比如80%中的至少一个。优选地,本实施例中,第一设定值也可与第二设定值相同,比如都为90%。
步骤102中,在用服务器上业务的运行情况包括:业务的告警指标和性能指标中的至少一个;其中,业务的告警指标包括:运行业务的应用程序是否正常和该应用程序的可用性中的至少一个;业务的性能指标包括:业务的积压量和运行该业务的应用程序的处理能力中的至少一个。其中,如果业务的告警指标显示异常,则表示运行该业务的应用程序不正常和该应用程序的可用性低于第三设定值中的至少一个;如果业务的性能指标显示异常,则表示业务的积压量高于第四设定值,和运行该业务的应用程序的处理能力超过第五设定值中的至少一个。
优选地,本实施例中,如果扫描的所有在用服务器的运行情况和该所有在用服务器上业务的运行情况均显示异常,则在扫描时间到达时,返回执行步骤101。
为使本发明提供的技术方案更加清楚,下面举两个具体实施例对本发明进行描述。
实施例一:
本实施例一以在用服务器的运行情况显示异常为例进行描述。假如智能监控中心在上述步骤101中扫描到在用服务器比如服务器1的运行情况显示异常,则需要调整与该服务器1连接的负载均衡设备比如设备1的连接状态。至于智能监控中心如何调整设备1的连接状态,下面对其进行描述。
当服务器1的告警指标显示异常时,智能监控中心先按照备用服务器的优先级大小顺序轮询备用服务器(备用服务器的优先级由用户预先根据实际情况设置),以便轮询到用于接替该服务器1工作的服务器。当然,如果轮询完所有的备用服务器,仍没有找到接替该服务器1工作的备用服务器,则可新增加服务器,将该新增加的服务器确定为用于接替该服务器1工作的服务器。
而当服务器1的性能指标显示异常时,智能监控中心先按照备用服务器的优先级大小顺序轮询备用服务器,以便轮询到用于和服务器1实现负载均衡的服务器。当然,如果轮询完所有的备用服务器,仍没有找到和服务器1实现负载均衡的备用服务器,则可新增加服务器,将该新增加的服务器确定为用于和服务器1实现负载均衡的服务器。
之后,该智能监控中心与设备1通过HTTP的方式进行通信,以便调整设备1的连接状态,具体如图2所示。
参见图2,图2为本发明实施例提供的智能监控中心与负载均衡设备通信的流程图。如图2所示,该流程可包括以下步骤:
步骤201,智能监控中心确定设备1需要连接的服务器,标记该确定的服务器为第一标识,以及标记服务器池中其他服务器为第二标识,并通过HTTP页面显示服务器池中各个服务器的标记。
如果服务器1的告警指标显示异常,则本步骤201将用于接替服务器1工作的服务器确定为设备1需要连接的服务器,标记该确定出的服务器为第一标识,并标记其他服务器为第二标识。
如果服务器1的性能指标显示异常,则本步骤201将服务器1和确定出的用于和服务器1实现负载均衡的服务器确定为设备1需要连接的服务器,标记该确定出的服务器为第一标识,并标记其他服务器为第二标识。
本实施例中,第一标识具体实现时可为1,如果一服务器的标记为第一标识比如1,则表示该服务器为与设备1通信的在用服务器,而第二标识具体实现时可为0,如果一服务器的标记为第二标识比如0,则表示该服务器为备用服务器,不处于在用状态。
步骤202,设备1通过运行设定的外部监控程序调用智能监控中心的HTTP页面。
本步骤201中,外部监控程序通过curl命令调用智能管控中心的HTTP页面。
步骤203,针对HTTP页面上每一服务器,外部监控程序根据服务器的标记输出相应的关键字给设备1。
本步骤203中,如果服务器的标记为第一标识,则外部监控程序输出的关键字为UP,表示设备1可以和该服务器进行通信。如果服务器的标记为第二标识,则外部监控程序输出的关键字为down,表示设备1不和该服务器进行通信。
步骤204,如果输出的关键字为UP,则设备1和该服务器连接,即设备1和该服务器进行通信,如果输出的关键字为down,则设备1不和该服务器连接,即设备1不和该服务器通信。
这里,设备1和服务器通信具体为:设备1向该服务器发送数据包,此时,该服务器为在用服务器;而设备1不和服务器通信,则为设备1不发数据包给该服务器,此时,该服务器为备用服务器。
至此,通过上述步骤,实现了智能监控中心调度与负载均衡设备通信的服务器的流程。可以看出,该流程中,无需用户直接和负载均衡设备交互,而是由智能监控中心完成与负载通信设备的服务器切换、加载等操作,实现故障处理无缝切换。
以上对实施例一进行了描述,下面对实施例二进行描述。
实施例二:
本实施例二以在用服务器上业务的运行情况显示异常为例进行描述。假如智能监控中心在上述步骤101中扫描到在用服务器比如服务器1上业务比如业务1的运行情况显示异常,则需要调整与该服务器1连接的负载均衡设备比如设备1的连接状态。至于智能监控中心如何调整设备1的连接状态,下面对其进行描述。
当服务器1上业务1的告警指标显示异常时,智能监控中心先按照备用服务器的优先级大小顺序轮询备用服务器,以便轮询到能够运行业务1的服务器。当然,如果轮询完所有的备用服务器,仍没有找到能够运行业务1的服务器,则可新增加服务器,将该新增加的服务器确定为用于运行业务1的服务器。
而当服务器1上业务1的性能指标显示异常时,智能监控中心先按照备用服务器的优先级大小顺序轮询备用服务器,以便轮询到用于和服务器1均衡分担该业务1的服务器。当然,如果轮询完所有的备用服务器,仍没有找到和服务器1均衡分担该业务1的服务器,则可新增加服务器,将该新增加的服务器确定为用于和服务器1均衡分担该业务1的服务器。
之后,该智能监控中心与设备1通过HTTP的方式进行通信,以便调整设备1的连接状态,具体如图2所示的流程。
需要说明的是,在上述步骤201中,如果服务器1上业务1的告警指标显示异常,则上述步骤201将服务器1和用于运行业务1的服务器确定为设备1需要连接的服务器,标记该确定出的服务器为第一标识,并标记其他服务器为第二标识。这里之所以还将服务器1确定为设备1需要连接的服务器,主要是因为:服务器1只是不能正常运行业务1,其还可能正常运行设备1提供的其他业务,因此,为避免业务中断,这里还将服务器1作为设备1需要连接的服务器。
如果服务器1上业务1的性能指标显示异常,则上述步骤201将服务器1和确定出的用于和服务器1均衡分担该业务1的服务器确定为设备1需要连接的服务器,标记该确定出的服务器为第一标识,并标记其他服务器为第二标识。
以上对本发明实施例提供的方法进行了描述,下面对本发明实施例提供的***进行描述。
本发明实施例提供了智能监控实现***,具体参见图3。如图3所示,该***可包括服务器群301、负载均衡设备群302和智能监控中心303,其中,
服务器群301至少包含2个服务器,负载均衡设备群至少包含1个负载均衡设备。本实施例中,服务器群301和负载均衡设备群302连接形成服务器池;
智能监控中心303用于扫描所述服务器池中在用服务器的运行情况和该在用服务器上业务的运行情况,如果在用服务器的运行情况或者该在用服务器上业务的运行情况显示异常,则调整与该在用服务器连接的负载均衡设备的连接状态。
本实施例中,智能监控中心303可实时或者每隔设定时间扫描所述服务器池中在用服务器的运行情况和该在用服务器上业务的运行情况。
本实施例中服务器池还包含不用于处理业务的备用服务器。优选地,本实施例中的智能监控中心303还用于为服务器池中各个服务器设置标记,并通过HTTP页面显示;
而与所述在用服务器连接的每一负载均衡设备包括:调用单元和连接调整单元(这两个单元未在图3中示出)。
其中,调用单元,用于通过运行设定的外部监控程序调用智能监控中心的HTTP页面,以使所述外部监控程序根据所述HTTP页面上每一服务器的标记输出相应的关键字给所述负载均衡设备;其中,如果一服务器的标记为第一标识,外部监控程序则输出关键字UP,如果一服务器的标记为第二标识,外部监控程序则输出关键字down;
连接调整单元,用于在所述外部监控程序根据服务器的标记输出关键字UP时,和该服务器连接,标识该服务器为在用服务器,在输出关键字为down时,不和该服务器连接,标识该服务器为备用服务器。
至于智能监控中心303如何设置服务器池中各个服务器设置标记,具体实现时可包括两种结构,这两种结构与出现异常的情况有关。
如果在用服务器的运行情况出现异常,这里,在用服务器的运行情况包括该在用服务器的告警指标和性能指标中的至少一个;其中,在用服务器的告警指标显示异常包括:该在用服务器宕机和该在用服务器网络不可达中的至少一个;在用服务器的性能指标显示异常包括:该在用服务器的CPU利用率超过第一设定值和该在用服务器的内存利用率超过第二设定值中的至少一个。基于此,如图3所示,本发明实施例提供了智能监控中心303的一种结构。具体可包括:
第一轮询单元3031,用于当在用服务器的告警指标显示异常时,按照备用服务器的优先级大小顺序轮询到用于接替该在用服务器工作的服务器;以及当在用服务器的性能指标显示异常时,按照备用服务器的优先级大小顺序轮询到用于和该在用服务器实现负载均衡的服务器;
第一确定单元3032,用于当在用服务器的告警指标显示异常时,确定用于接替该在用服务器工作的服务器为所述负载均衡设备需要连接的服务器,当在用服务器的性能指标显示异常时,确定该在用服务器、以及用于和该在用服务器实现负载均衡的服务器为所述负载均衡设备需要连接的服务器;
调整单元3033,用于将所述负载均衡设备需要连接的每一服务器标记为第一标识,以及将所述服务器池中其他服务器标记为第二标识。
优选地,本实施例中,如果在用服务器上业务的运行情况出现异常,这里,业务的运行情况包括:该业务的告警指标和性能指标中的至少一个;其中,业务的告警指标显示异常包括:运行该业务的应用程序不正常和该应用程序的可用性低于第三设定值中的至少一个;业务的性能指标显示异常包括:该业务的积压量高于第四设定值和所述应用程序的处理能力超过第五设定值中的至少一个,则如图3所示,本发明实施例还公开了智能监控中心303的另一种结构。具体可包括:
第二轮询单元3034,用于当在用服务器上业务的告警指标显示异常时,按照备用服务器的优先级大小顺序轮询到用于运行该业务的服务器;以及当在用服务器上业务的性能指标显示异常时,按照备用服务器的优先级大小顺序轮询到用于和该在用服务器均衡分担该业务的服务器;
第二确定单元3035,用于当在用服务器上业务的告警指标显示异常时,确定该在用服务器和用于运行所述业务的服务器为所述负载均衡设备需要连接的服务器,以及当在用服务器上业务的性能指标显示异常时,确定该在用服务器、以及用于和所述在用服务器均衡分担所述业务的服务器为所述负载均衡设备需要连接的服务器;
调整单元3036,用于将所述负载均衡设备需要连接的每一服务器标记为第一标识,以及将所述服务器池中其他服务器标记为第二标识。
至此,对本发明实施例提供的装置进行了描述。
由以上技术方案可以看出,本发明中,通过扫描在用服务器的运行情况,以及该在用服务器上业务的运行情况,能够实现有效收集业务内部的性能以及业务的可用性信息;
进一步地,本发明通过调整与该在用服务器连接的负载均衡设备连接状态,从整体上把全网的服务器群纳入统一管理,实现较大范围资源间的无缝、灵活调用;
更进一步第,本发明继承了原有负载均衡器技术的所有功能,在调整连接状态时,无需中断业务,同时也实现了资源间的负载均衡。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (11)

1.一种智能监控实现方法,其特征在于,将服务器群和负载均衡设备群连接形成服务器池;该方法包括:
A,智能监控中心扫描所述服务器池中在用服务器的运行情况和该在用服务器上业务的运行情况;
B,如果在用服务器的运行情况或者该在用服务器上业务的运行情况显示异常,则智能监控中心调整与该在用服务器连接的负载均衡设备的连接状态;
其中,所述步骤B中的调整包括:
B1,智能监控中心为服务器池中各个服务器设置标记,并通过HTTP页面显示;
B2,所述负载均衡设备通过运行设定的外部监控程序调用智能监控中心的HTTP页面,以使所述外部监控程序根据所述HTTP页面上每一服务器的标记输出相应的关键字给所述负载均衡设备,其中,如果一服务器的标记为第一标识,外部监控程序则输出关键字UP,如果一服务器的标记为第二标识,外部监控程序则输出关键字down;
B3,所述负载均衡设备在所述外部监控程序根据服务器的标记输出关键字UP时,和该服务器连接,标识该服务器为在用服务器,在输出关键字为down时,不和该服务器连接,标识该服务器为备用服务器。
2.根据权利要求1所述的方法,其特征在于,所述步骤B中,如果所有在用服务器的运行情况和该所有在用服务器上业务的运行情况均正常,则进一步包括:在扫描的时间到达时,返回执行步骤A。
3.根据权利要求1或2所述的方法,其特征在于,所述步骤A中,智能监控中心实时或者每隔设定时间扫描所述服务器池中在用服务器的运行情况和该在用服务器上业务的运行情况。
4.根据权利要求1所述的方法,其特征在于,所述在用服务器的运行情况包括该在用服务器的告警指标和性能指标中的至少一个;
其中,在用服务器的告警指标显示异常包括:该在用服务器宕机和该在用服务器网络不可达中的至少一个;在用服务器的性能指标显示异常包括:该在用服务器的CPU利用率超过第一设定值和该在用服务器的内存利用率超过第二设定值中的至少一个。
5.根据权利要求4所述的方法,其特征在于,所述步骤B1中的设置包括:
B11,如果在用服务器的告警指标显示异常,则智能监控中心按照备用服务器的优先级大小顺序轮询到用于接替该在用服务器工作的服务器;如果在用服务器的性能指标显示异常,则智能监控中心按照备用服务器的优先级大小顺序轮询到用于和该在用服务器实现负载均衡的服务器;
B12,如果在用服务器的告警指标显示异常,则确定用于接替该在用服务器工作的服务器为所述负载均衡设备需要连接的服务器,如果在用服务器的性能指标显示异常,则确定该在用服务器、以及用于和该在用服务器实现负载均衡的服务器为所述负载均衡设备需要连接的服务器;
B13,智能监控中心将所述负载均衡设备需要连接的每一服务器标记为第一标识,以及将所述服务器池中其他服务器标记为第二标识。
6.根据权利要求1所述的方法,其特征在于,所述业务的运行情况包括:该业务的告警指标和性能指标中的至少一个;
其中,业务的告警指标显示异常包括:运行该业务的应用程序不正常和该应用程序的可用性低于第三设定值中的至少一个;业务的性能指标显示异常包括:该业务的积压量高于第四设定值和所述应用程序的处理能力超过第五设定值中的至少一个。
7.根据权利要求6所述的方法,其特征在于,所述步骤B1中的设置包括:
B21,如果在用服务器上业务的告警指标显示异常,则智能监控中心按照备用服务器的优先级大小顺序轮询到用于运行该业务的服务器;如果在用服务器上业务的性能指标显示异常,则智能监控中心按照备用服务器的优先级大小顺序轮询到用于和该在用服务器均衡分担该业务的服务器;
B22,如果在用服务器上业务的告警指标显示异常,则确定该在用服务器和用于运行所述业务的服务器为所述负载均衡设备需要连接的服务器,如果在用服务器上业务的性能指标显示异常,则确定该在用服务器、以及用于和所述在用服务器均衡分担所述业务的服务器为所述负载均衡设备需要连接的服务器;
B23,智能监控中心将所述负载均衡设备需要连接的每一服务器标记为第一标识,以及将所述服务器池中其他服务器标记为第二标识。
8.一种智能监控实现***,其特征在于,该***包括服务器群、负载均衡设备群和智能监控中心,其中,
所述服务器群和所述负载均衡设备群连接形成服务器池;
所述智能监控中心用于扫描所述服务器池中在用服务器的运行情况和该在用服务器上业务的运行情况,如果在用服务器的运行情况或者该在用服务器上业务的运行情况显示异常,则调整与该在用服务器连接的负载均衡设备的连接状态;
所述智能监控中心还用于为服务器池中各个服务器设置标记,并通过HTTP页面显示;
与所述在用服务器连接的每一负载均衡设备包括:
调用单元,用于通过运行设定的外部监控程序调用智能监控中心的HTTP页面,以使所述外部监控程序根据所述HTTP页面上每一服务器的标记输出相应的关键字给所述负载均衡设备;其中,如果一服务器的标记为第一标识,外部监控程序则输出关键字UP,如果一服务器的标记为第二标识,外部监控程序则输出关键字down;
连接调整单元,用于在所述外部监控程序根据服务器的标记输出关键字UP时,和该服务器连接,标识该服务器为在用服务器,在输出关键字为down时,不和该服务器连接,标识该服务器为备用服务器。
9.根据权利要求8所述的***,其特征在于,所述智能监控中心实时或者每隔设定时间扫描所述服务器池中在用服务器的运行情况和该在用服务器上业务的运行情况。
10.根据权利要求8所述的***,其特征在于,所述在用服务器的运行情况包括该在用服务器的告警指标和性能指标中的至少一个;其中,在用服务器的告警指标显示异常包括:该在用服务器宕机和该在用服务器网络不可达中的至少一个;在用服务器的性能指标显示异常包括:该在用服务器的CPU利用率超过第一设定值和该在用服务器的内存利用率超过第二设定值中的至少一个;
所述智能监控中心包括:
第一轮询单元,用于当在用服务器的告警指标显示异常时,按照备用服务器的优先级大小顺序轮询到用于接替该在用服务器工作的服务器;以及当在用服务器的性能指标显示异常时,按照备用服务器的优先级大小顺序轮询到用于和该在用服务器实现负载均衡的服务器;
第一确定单元,用于当在用服务器的告警指标显示异常时,确定用于接替该在用服务器工作的服务器为所述负载均衡设备需要连接的服务器,当在用服务器的性能指标显示异常时,确定该在用服务器、以及用于和该在用服务器实现负载均衡的服务器为所述负载均衡设备需要连接的服务器;
调整单元,用于将所述负载均衡设备需要连接的每一服务器标记为第一标识,以及将所述服务器池中其他服务器标记为第二标识。
11.根据权利要求8所述的***,其特征在于,所述业务的运行情况包括:该业务的告警指标和性能指标中的至少一个;
其中,业务的告警指标显示异常包括:运行该业务的应用程序不正常和该应用程序的可用性低于第三设定值中的至少一个;业务的性能指标显示异常包括:该业务的积压量高于第四设定值和所述应用程序的处理能力超过第五设定值中的至少一个;
所述智能监控中心包括:
第二轮询单元,用于当在用服务器上业务的告警指标显示异常时,按照备用服务器的优先级大小顺序轮询到用于运行该业务的服务器;以及当在用服务器上业务的性能指标显示异常时,按照备用服务器的优先级大小顺序轮询到用于和该在用服务器均衡分担该业务的服务器;
第二确定单元,用于当在用服务器上业务的告警指标显示异常时,确定该在用服务器和用于运行所述业务的服务器为所述负载均衡设备需要连接的服务器,以及当在用服务器上业务的性能指标显示异常时,确定该在用服务器、以及用于和所述在用服务器均衡分担所述业务的服务器为所述负载均衡设备需要连接的服务器;
调整单元,用于将所述负载均衡设备需要连接的每一服务器标记为第一标识,以及将所述服务器池中其他服务器标记为第二标识;根据各个服务器的标记调整所述负载均衡设备的连接状态。
CN201010281379.XA 2010-09-13 2010-09-13 智能监控实现方法和*** Active CN102404160B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010281379.XA CN102404160B (zh) 2010-09-13 2010-09-13 智能监控实现方法和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010281379.XA CN102404160B (zh) 2010-09-13 2010-09-13 智能监控实现方法和***

Publications (2)

Publication Number Publication Date
CN102404160A CN102404160A (zh) 2012-04-04
CN102404160B true CN102404160B (zh) 2014-04-09

Family

ID=45885975

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010281379.XA Active CN102404160B (zh) 2010-09-13 2010-09-13 智能监控实现方法和***

Country Status (1)

Country Link
CN (1) CN102404160B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103118055A (zh) * 2012-10-10 2013-05-22 中兴通讯股份有限公司 一种多媒体接入的方法和设备
CN102946468A (zh) * 2012-10-18 2013-02-27 广东欧珀移动通信有限公司 一种手机运行程序异常自动报警的方法及***
CN103716253A (zh) * 2013-12-27 2014-04-09 广州华多网络科技有限公司 一种请求数据的方法及装置
CN109800120B (zh) * 2017-11-17 2020-12-08 鹰硕(韶关)信息产业集团有限公司 一种远程教育***的服务器群的监测***
CN112821843B (zh) * 2020-12-31 2023-07-14 哈尔滨宇龙自动化有限公司 一种变频调速多负载***的智能切换控制方法及***
CN113242283B (zh) * 2021-04-29 2022-11-29 西安点告网络科技有限公司 一种服务器动态负载均衡方法、***、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1495634A (zh) * 2002-06-27 2004-05-12 上海汉唐科技有限公司 服务器集群负载均衡方法及***
CN101296176A (zh) * 2007-04-25 2008-10-29 阿里巴巴集团控股有限公司 一种基于群集的数据处理方法和装置
CN101741850A (zh) * 2009-12-25 2010-06-16 北京邮电大学 面向混合网络服务的多任务并发执行***及方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1495634A (zh) * 2002-06-27 2004-05-12 上海汉唐科技有限公司 服务器集群负载均衡方法及***
CN101296176A (zh) * 2007-04-25 2008-10-29 阿里巴巴集团控股有限公司 一种基于群集的数据处理方法和装置
CN101741850A (zh) * 2009-12-25 2010-06-16 北京邮电大学 面向混合网络服务的多任务并发执行***及方法

Also Published As

Publication number Publication date
CN102404160A (zh) 2012-04-04

Similar Documents

Publication Publication Date Title
CN102404160B (zh) 智能监控实现方法和***
CN112073265B (zh) 一种基于分布式边缘计算的物联网监控方法和***
US9838483B2 (en) Methods, systems, and computer readable media for a network function virtualization information concentrator
US10942786B2 (en) Network management
US10708121B2 (en) Intelligent network
CN103873279B (zh) 一种服务器管理方法,及装置
EP3361703B1 (en) Load balancing method, related device and system
CN105450757A (zh) 一种服务管理方法及***
CN108667870A (zh) 一种IoT数据上报的方法、装置和***
CN102394925B (zh) 远程监测诊断中心与地区调度中心的通讯方法及装置
CN103856963A (zh) 一种创建智能通信通道的方法
CN108282540A (zh) 一种地铁监控***及其监控方法
CN108667742A (zh) 一种综合监控***网络负载均衡网关通信方法
CN102437933A (zh) 一种服务器故障容错***及方法
CN107070744A (zh) 服务器监控方法
CN104038390A (zh) 一种基于netlink的linux服务器集群统一外设事件监听方法
CN105024860A (zh) 一种远程通信控制方法及***
CN102571383B (zh) 一种接入控制方法及***
CN101127635A (zh) 综合网管***
CN1832297A (zh) 低压配电现场的通信方法及通信管理设备
CN114124662A (zh) 一种基于跨网环境下的资源智能化运维***
CN115426274A (zh) 资源预警方法、装置、电子设备及存储介质
CN102856980A (zh) 一种配电网通信综合网管理方法
CN113535402A (zh) 基于5g mec的负载均衡处理方法、装置及电子设备
CN216852004U (zh) 一种新型负载均衡监控设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant