CN103345439A - 一种信息***全链路健康状态监控方法及装置 - Google Patents

一种信息***全链路健康状态监控方法及装置 Download PDF

Info

Publication number
CN103345439A
CN103345439A CN2013102996370A CN201310299637A CN103345439A CN 103345439 A CN103345439 A CN 103345439A CN 2013102996370 A CN2013102996370 A CN 2013102996370A CN 201310299637 A CN201310299637 A CN 201310299637A CN 103345439 A CN103345439 A CN 103345439A
Authority
CN
China
Prior art keywords
service
application service
database
health status
application
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013102996370A
Other languages
English (en)
Other versions
CN103345439B (zh
Inventor
余铮
廖荣涛
王逸兮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HUBEI ELECTRIC POWER COMPANY INFORMATION AND COMMUNICATION BRANCH
State Grid Corp of China SGCC
Original Assignee
HUBEI ELECTRIC POWER COMPANY INFORMATION AND COMMUNICATION BRANCH
State Grid Corp of China SGCC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by HUBEI ELECTRIC POWER COMPANY INFORMATION AND COMMUNICATION BRANCH, State Grid Corp of China SGCC filed Critical HUBEI ELECTRIC POWER COMPANY INFORMATION AND COMMUNICATION BRANCH
Priority to CN201310299637.0A priority Critical patent/CN103345439B/zh
Publication of CN103345439A publication Critical patent/CN103345439A/zh
Application granted granted Critical
Publication of CN103345439B publication Critical patent/CN103345439B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明适用于计算机信息处理与***集成技术领域,提供一种信息***全链路健康状态监控方法及装置,所述方法包括所述方法包括应用服务健康状态监控方法和/或数据库服务健康状态监控方法,其中,所述应用服务监控状态监控方法包括:从其中的一个应用服务节点开始对每一个应用服务节点进行应用服务健康状态验证,得到对应的应用服务验证结果,所述应用服务验证结果包括正常、异常和超时三种状态;根据所有的应用服务验证结果中正常的数量判定信息***的应用服务健康状态为健康、亚健康或异常。本发明技术方案中,最后判定的健康状态只有健康、亚健康和异常这三种结果,这种健康状态判定方法更为简单,运行效率更高。

Description

一种信息***全链路健康状态监控方法及装置
技术领域
本发明属于计算机信息处理与***集成技术领域,尤其涉及一种信息***全链路健康状态监控方法及装置。 
背景技术
信息***是由计算机硬件、网络和通讯设备、计算机软件、信息资源、信息用户和规章制度组成的以处理信息流为目的的人机一体化***。信息***中各个链路的健康状态决定了***工作可靠性,特别是针对B/S模式的信息***中,包括多个应用服务节点和多个数据库服务节点,若应用服务节点之间的链路和/或数据库服务节点之间的链路出现了异常,会影响到信息***的可靠性,需要开发者对信息***进一步优化和改进,因此监控信息***全链路健康状态势在必行。 
现有技术中存在一种服务器***健康状态检测方法,通过在服务器***内的设置多个传感器,这些传感器分别检测***的不同部位的健康状态,需要获取当前健康状态值、上一时刻健康状态值、当前最差健康状态值及上一循环最差健康状态值,并通过这些传感器的检测结果与各种判断机制来更新服务器***的健康状态,这种检测方法健康判断过程复杂,运算效率低。 
发明内容
鉴于上述问题,本发明的目的在于提供一种信息***全链路健康状态监控方法及装置,旨在解决现有服务器***健康状态检测方法健康判断过程复杂,运算效率低的技术问题。 
在本发明方案中,所述信息***包括应用服务模块和数据库服务模块,所述应用服务模块包括至少二个应用服务节点,所述数据库服模块包括至少二个数据库服务节点。 
一方面,所述信息***全链路健康状态监控方法包括应用服务健康状态监控方法和/或数据库服务健康状态监控方法, 
其中,所述应用服务监控状态监控方法包括: 
从其中的一个应用服务节点开始对每一个应用服务节点进行应用服务健康状态验证,得到对应的应用服务验证结果,所述应用服务验证结果包括正常、异常和超时三种状态; 
根据所有的应用服务验证结果中正常的数量判定信息***的应用服务健康状态为健康、亚健康或异常; 
其中,所述数据库服务健康状态监控方法包括: 
从其中的一个数据库服务节点开始对每一个数据库服务节点进行数据库服务健康状态验证,得到对应的数据库服务验证结果,所述数据库服务验证结果包括正常、异常和超时三种状态; 
根据所有的数据库服务验证结果中正常的数量判定信息***的数据库服务健康状态为健康、亚健康或异常。 
另一方面,所述装置包括应用服务健康状态监控装置和/或数据库服务健康状态监控装置, 
其中,所述应用服务健康状态监控装置包括: 
应用服务健康状态验证单元,用于从其中的一个应用服务节点开始对每一个应用服务节点进行应用服务健康状态验证,得到对应的应用服务验证结果,所述应用服务验证结果包括正常、异常和超时三种状态; 
***应用健康判定单元,用于根据所有的应用服务验证结果中正常的数量判定信息***的应用服务健康状态为健康、亚健康或异常; 
其中,所述数据库服务健康状态监控装置包括: 
数据库服务健康状态验证单元,从其中的一个数据库服务节点开始对每一个数据库服务节点进行数据库服务健康状态验证,得到对应的数据库服务验证结果,所述数据库服务验证结果包括正常、异常和超时三种状态; 
***数据库健康判定单元,根据所有的数据库服务验证结果中正常的数量判定信息***的数据库服务健康状态为健康、亚健康或异常。 
本发明的有益效果是:本发明技术方案中,通过对应用服务节点之间的链路健康状态验证(即应用服务健康状态验证)和/或对数据库服务节点间的链路健康状态验证(即数据库服务健康状态验证),验证结果均包括正常、异常和超时三种状态,然后根据验证结果判定信息***的应用服务健康状态和/或数据库服务健康状态,并且所述健康状态只有健康、亚健康和异常这三种结果,使得健康状态判定方法更为简单,运行效率更高。 
附图说明
图1是本发明第一实施例提供的信息***全链路健康状态监控方法中应用服务健康状态监控方法的流程图; 
图2是本发明第一实施例提供的信息***全链路健康状态监控方法中数据库服务健康状态监控方法的流程图; 
图3是本发明第二实施例提供的信息***全链路健康状态监控方法中应用服务健康状态监控方法的流程图; 
图4是本发明第二实施例提供的信息***全链路健康状态监控方法中数据库服务健康状态监控方法的流程图; 
图5是本发明第三实施例提供的信息***全链路健康状态监控装置中应用服务健康状态监控装置的结构方框图; 
图6是本发明第三实施例提供的信息***全链路健康状态监控装置中数据库服务健康状态监控装置的结构方框图; 
图7是本发明第四实施例提供的信息***全链路健康状态监控装置中应用 服务健康状态监控装置的结构方框图; 
图8是本发明第四实施例提供的信息***全链路健康状态监控装置中数据库服务健康状态监控装置的结构方框图。 
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。 
本发明实施例中,信息***包括应用服务模块和数据库服务模块,所述应用服务模块包括至少二个应用服务节点,所述数据库服模块包括至少二个数据库服务节点,为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。 
实施例一: 
本实施例提供的信息***全链路健康状态监控方法包括应用服务健康状态监控方法和/或数据库服务健康状态监控方法,图1和图2分别示出了其中应用服务健康状态监控方法和数据库服务健康状态监控方法的流程,为了便于说明仅示出了与本发明实施例相关的部分。 
所述应用服务健康状态监控方法包括步骤S101和步骤S102。 
步骤S101,从其中的一个应用服务节点开始对每一个应用服务节点进行应用服务健康状态验证,得到对应的应用服务验证结果,所述应用服务验证结果包括“正常”、“异常”和“超时”三种。 
假设应用服务模块中包含m个应用服务节点,依次为Server1,Server2,…,Serverm,从其中选取一个应用服务节点,比如Server1,然后从该应用服务节点开始对所有的应用服务节点进行应用服务健康状态验证,得到m个对应的应用服务验证结果,分别为ServerValue1,ServerValue2,…,ServerValuem,包括“正常”、“异常”和“超 时”三种,应用服务验证结果表示了对应的应用服务节点所在的应用服务链路的健康状态。 
步骤S102,根据所有的应用服务验证结果中“正常”的数量判定信息***的应用服务健康状态为“健康”、“亚健康”或“异常”。 
根据m个应用服务验证结果来判定信息***的应用服务健康状态,包括“健康”、“亚健康”和“异常”这三种健康状态。本实施例不限定具体的健康状态分类判定方式,比如可以按照如下方式进行设定:当应用服务验证结果中“正常”的数量大于一预定数量时,即可认定当前信息***的应用服务健康状态为“健康”;当应用服务验证结果中“正常”的数量小于另一预定数量时,即可认定当前信息***的应用服务健康状态为“异常”;其他情况下,即可认定当前信息***的应用服务健康状态为“亚健康”。 
所述数据库服务健康状态监控方法包括步骤S201和步骤S202。 
步骤S201,从其中的一个数据库服务节点开始对每一个数据库服务节点进行数据库服务健康状态验证,得到对应的数据库服务验证结果,所述数据库服务验证结果包括“正常”、“异常”和“超时”三种。 
假设数据库服务模块中包含n个数据库服务节点,依次为DB1,DB2,…,DBn,从其中选取一个数据库服务节点,比如DB1,然后从该数据库服务节点开始对所有的数据库服务节点进行数据库服务健康状态验证,得到n个对应的数据库服务验证结果,分别为DBValue1,DBValue2,…,DBValuen,包括“正常”、“异常”和“超时”三种状态,数据库服务验证结果表示了数据库服务链路的健康状态。 
步骤S202,根据所有的数据库服务验证结果中正常的数量判定信息***的数据库服务健康状态为“健康”、“亚健康”或“异常”。 
本步骤与步骤S102类似,根据得到的n个数据库服务验证结果来判定信息***的数据库服务健康状态,包括“健康”、“亚健康”和“异常”这三种健康状态。这里同样不限定具体的健康状态分类判定方式,比如可以按照如下方式进行设定:当数据库服务验证结果中“正常”的数量大于一预定数量时,即 可认定当前信息***的数据库服务健康状态为“健康”;当数据库服务验证结果中“正常”的数量小于另一预定数量时,即可认定当前信息***的数据库服务健康状态为“异常”:其他情况下,即可认定当前信息***的数据库服务健康状态为“亚健康”。 
本实施例既可以对信息***的应用服务健康状态进行监控,也可以对数据库服务健康状态进行监控,还可以同时对两者进行监控,本实施例中最后得到的应用服务健康状态以及数据库服务健康状态只有三种,包括“健康”、“亚健康”或“异常”,判断方式简单,无需实时循环获取当前健康状态值、上一时刻健康状态值、当前最差健康状态值等,***运行效率更高。 
实施例二: 
本实施例提供的信息***全链路健康状态监控方法包括应用服务健康状态监控方法和/或数据库服务健康状态监控方法,图3和图4分别示出了其中应用服务健康状态监控方法和数据库服务健康状态监控方法的流程,为了便于说明仅示出了与本发明实施例相关的部分。 
其中所述服务健康状态监控方法包括步骤S301-步骤S310。 
步骤S301,模拟IE浏览器获取并访问当前选择的应用服务节点对应的对外应用服务地址。 
每个应用服务节点存在一个对外应用服务地址,假设有m个应用服务节点,其对外应用服务地址分别为ServerURL1,ServerURL2,…,ServerURLm,本实施例需要对所有的应用服务节点进行应用服务健康状态验证,具体实现时,需要顺次选择各个应用服务节点,当选择好一个应用服务节点后,然后利用Visual C++中的CDHtmlDialog类模拟IE浏览器来访问当前选择的应用服务节点对应的对外应用服务地址,假设当前选择的应用服务节点为Server1,对应的对外应用服务地址为ServerURL1。本步骤通过模拟IE浏览器来访问对外应用服务地址,此方法提供了图形显示界面,无需开发者进入***进行实时查询,更具有实用性。 
步骤S302,判断在预设的应用服务节点的最大响应时长内是否得到服务响应; 
步骤S303,若否,则记录所述当前应用服务节点的应用服务验证结果为超时。 
在实现本步骤之前,开发者可以灵活设定应用服务节点的最大响应时长Tserver,在访问对外应用服务地址后,在所述预设的应用服务节点的最大响应时长内还没得到服务响应,将对应的应用服务验证结果记录为超时,然后选择下一应用服务节点进行健康验证。本实施例设置了应用服务节点的最大响应时长Tserver,防止出现死锁现象,技术上更具有容错性,不会出现由于长时间得不到响应可能导致的服务挂起的现象。 
步骤S304、若是,则捕获当前响应页面信息并搜索是否存在服务正常关键字。 
当在所述预设的应用服务节点的最大响应时长内得到服务响应,还是以Server1为例,在访问ServerURL1后,在Tserver内并未得到服务响应,则记录ServerValue1为“超时”,否则捕获当前响应页面信息并记录为Body1,然后在Body1中搜寻信息***的服务正常关键字KeySucceed1。 
步骤S305,当存在时,记录所述当前应用服务节点的应用服务验证结果为正常; 
步骤S306,当不存在时,记录所述当前应用服务节点的应用服务验证结果为异常。 
若在Body1中搜索到KeySucceed1,则记录所述当前应用服务节点的应用服务验证结果为“正常”,即记录ServerValue1为“正常”,并选择下一应用服务节点进行应用服务健康验证。否则,记录ServerValue1为“异常”。 
另外,作为优选的实施方式,当在当前响应页面信息Body1中并未搜索到服务正常关键字KeySucceed1时,在Body1中还可以进一步依次搜寻信息***应用 服务异常知识库中的报错关键字ServerFail1,ServerFail2,…,ServerFailv(v为信息***应用服务异常知识库中的关键字编号)。若成功搜索到报错关键字ServerFaili,则记录应用服务验证结果为“异常”,同时还备注所述搜索到的报错关键字ServerFaili,即记录ServerValue1为“异常”且代码为ServerFaili。然后,选择下一应用服务节点进行应用服务健康验证。 
步骤S307,判断所述所有应用服务节点的应用服务健康状态是否验证完毕。 
步骤S308,当未验证完毕时选择下一应用服务节点。 
在记录完当前选择的应用服务节点的应用服务验证结果后,判断所有应用服务节点的应用服务健康状态是否验证完毕,若没有验证完毕则选择下一应用服务节点进行应用服务健康状态验证。比如,对于Server1而言,在得到ServerValue1后,选择Server2进行下一轮应用服务健康状态验证,直至得到所有的应用服务验证结果ServerValue1~ServerValuem。优选的,本实施例中,每次选择应用服务节点的时间间隔也可以设定。 
步骤S309,统计所有应用服务验证结果中应用服务验证结果为“正常”的个数; 
步骤S310,当所有的应用服务验证结果为“正常”时,信息***的当前应用服务健康状态为健康;当所有的应用服务验证结果没有一个“正常”时,信息***的当前应用服务健康状态为“异常”;其他情况下,信息***的当前应用服务健康状态为“亚健康”。 
上述步骤S301-S308是实施例一中步骤
Figure BDA00003523716700081
S101的一种具体优选实施方式,上述步骤S309、S310是实施例一中步骤S102的一种具体优选实施方式,在得到所有的应用服务验证结果后,统计应用服务验证结果中应用服务验证结果为“正常”的个数。若应用服务验证结果全为“正常”时,即可认定当前应用服务健康状态为“健康”;当所有的应用服务验证结果没有一个“正常”时,即可认定信息***的当前应用服务健康状态为“异常”;其他情况时,即可认定信息 ***的当前应用服务健康状态为“亚健康”。 
其中所述数据库服务健康状态监控方法包括步骤S401-步骤S406。 
步骤S401,获取当前选择的数据库服务节点的连接字符串并进行数据库连接; 
步骤S402,判断在预设的数据库服务节点的最大响应时长内是否得到服务响应; 
步骤S403,若否,则记录所述当前数据库服务节点的数据库服务验证结果为“超时”; 
步骤S404,若是,当所述返回的服务响应为连接成功时,记录当前数据库服务节点的数据库服务验证结果为“正常”,服务响应为其他时,记录当前数据库服务节点的数据库服务验证结果为“异常”; 
步骤S405,判断所有数据库服务节点的数据库服务健康状态是否验证完毕; 
步骤S406,当未验证完毕时选择下一数据库服务节点。 
上述步骤S401-S406是实施例一中步骤S201的一种具体优选实施方式,每个数据库服务节点具有一个连接字符串,假设有n个数据库服务节点,连接字符串分别为DBStr1,DBStr2,…,DBStrn,本实施例需要对所有的数据库服务节点进行应用服务健康状态验证,具体实现时,需要顺次选择各个数据库服务节点,假设当前选择的应用服务节点为DB1,其连接字符串为DBStr1,同样在实现本实施例之前开发者可以灵活设定数据库服务节点的最大响应时长TDB,利用连接字符串DBStr1进行数据库连接,若在所述预设的数据库服务节点的最大响应时长TDB内还没得到服务响应,将对应的应用服务验证结果记录为“超时”,即记录DBValue1为“超时”,然后选择下一应用服务节点进行健康验证。本实施例设置了数据库服务节点的最大响应时长TDB,同样可以防止出现死锁现象。 
若在所述预设的数据库服务节点的最大响应时长TDB内得到服务响应,且所述服务响应为连接成功时,记录当前数据库服务节点的数据库服务验证结果为 “正常”,即记录DBValue1为“正常”。当服务响应为其他时,记录当前数据库服务节点的数据库服务验证结果为“异常”,即记录DBValue1为“异常”。 
在记录完当前选择的数据库服务节点的数据库服务验证结果后,判断所有数据库服务节点的应用服务健康状态是否验证完毕,若没有验证完毕则选择下一数据库服务节点进行数据库服务健康状态验证。比如,对于DB1而言,在得到DBValue1后,选择DB2进行下一轮数据库服务健康状态验证,直至得到所有的数据库服务验证结果。优选的,本实施例中,每次选择数据库服务节点的时间间隔也可以设定。 
步骤S407,统计所有数据库服务验证结果中数据库服务验证结果为“正常”的个数。 
步骤S408,当所有的数据库服务验证结果为“正常”时,信息***的当前数据库服务健康状态为“健康”;当所有的数据库服务验证结果没有一个正常时,信息***的当前数据库服务健康状态为“异常”;其他情况下,信息***的当前数据库服务健康状态为“亚健康”。 
上述步骤S407、S408是实施例一中步骤S202的一种具体优选实施方式,在得到所有的数据库服务验证结果后,统计数据库服务验证结果中数据库服务验证结果为“正常”的个数。若数据库服务验证结果全为“正常”时,即可认定当前数据库服务健康状态为“健康”;当所有的数据库服务验证结果没有一个“正常”时,即可认定信息***的当前数据库服务健康状态为“异常”;其他情况时,即可认定信息***的当前数据库服务健康状态为“亚健康”。 
本实施例在实施例一的基础上提供了各个步骤的具体优选实施方式,本实施方案可以防止出现死锁现象,而且利用应用服务正常关键字查询方式,减少了遍历搜索时间,提高运算效率。 
实施例三: 
本实施例提供的信息***全链路健康状态监控装置包括应用服务健康状态 监控装置和/或数据库服务健康状态监控装置,图5和图6分别示出了其中应用服务健康状态监控装置和数据库服务健康状态监控装置的结构,为了便于说明仅示出了与本发明实施例相关的部分。 
其中,所述应用服务健康状态监控装置包括应用服务健康状态验证单元501和***应用健康判定单元502。 
应用服务健康状态验证单元501,用于从其中的一个应用服务节点开始对每一个应用服务节点进行应用服务健康状态验证,得到对应的应用服务验证结果,所述应用服务验证结果包括“正常”、“异常”和“超时”三种状态。 
***应用健康判定单元502,用于根据所有的应用服务验证结果中“正常”的数量判定信息***的应用服务健康状态为“健康”、“亚健康”或“异常”。 
其中,所述数据库服务健康状态监控装置包括数据库服务健康状态验证单元601和***数据库健康判定单元602。 
数据库服务健康状态验证单元601,用于从其中的一个数据库服务节点开始对每一个数据库服务节点进行数据库服务健康状态验证,得到对应的数据库服务验证结果,所述数据库服务验证结果包括“正常”、“异常”和“超时”三种状态。 
***数据库健康判定单元602,根据所有的数据库服务验证结果中正常的数量判定信息***的数据库服务健康状态为“健康”、“亚健康”或“异常”。 
本实施例提供的应用服务健康状态验证单元501和***应用健康判定单元502对应实现了实施例一中步骤S101、S102,根据所有的应用服务验证结果中“正常”的数量,***应用健康判定单元502就可以判定信息***的应用服务健康状态,比如“健康”、“亚健康”或“异常”。另外,本实施例提供的数据库服务健康状态验证单元601和***数据库健康判定单元602对应实现了实施例一中步骤S201、S202,根据所有的数据库服务验证结果中“正常”的数量,***数据库健康判定单元602就可以判定信息***的数据库服务健康状态,比如“健康”、“亚健康”或“异常”。本实施例只需简单的判断出信息***的 应用服务健康状态和/或数据库服务健康状态,判断方式简单,***运行效率更高。 
实施例四: 
本实施例提供的信息***全链路健康状态监控装置包括应用服务健康状态监控装置和/或数据库服务健康状态监控装置,图7和图8分别示出了其中应用服务健康状态监控装置和数据库服务健康状态监控装置的结构,为了便于说明仅示出了与本发明实施例相关的部分。 
其中,所述服务健康状态监控装置包括应用服务健康状态验证单元71和***应用健康判定单元72。 
应用服务健康状态验证单元71,用于从其中的一个应用服务节点开始对每一个应用服务节点进行应用服务健康状态验证,得到对应的应用服务验证结果,所述应用服务验证结果包括“正常”、“异常”和“超时”三种状态。 
***应用健康判定单元72,用于根据所有的应用服务验证结果中正常的数量判定信息***的应用服务健康状态为“健康”、“亚健康”或“异常”。 
所述应用服务健康状态验证单元71包括地址获取访问模块711、应用响应判断模块712、第一应用记录模块713、关键字搜索模块714、第二应用记录模块715、第三应用记录模块716、应用验证判断模块717和应用服务节点选择模块718。 
地址获取访问模块711,用于模拟IE浏览器获取并访问当前选择的应用服务节点对应的对外应用服务地址。 
应用响应判断模块712,用于判断在预设的应用响应最大时长内是否得到服务响应。 
第一应用记录模块713,用于在应用响应判断模块判断为否时,记录所述当前应用服务节点的应用服务验证结果为“超时”。 
关键字搜索模块714,用于在应用响应判断模块判断是时,捕获当前响应 页面信息并搜索是否存在服务正常关键字。 
第二应用记录模块715,用于当存在服务正常关键字时,记录所述当前应用服务节点的应用服务验证结果为“正常”。 
第三应用记录模块716,用于当不存在服务正常关键字时,记录所述当前应用服务节点的应用服务验证结果为“异常”。 
应用验证判断模块717,用于判断所述所有应用服务节点的应用服务健康状态是否验证完毕。 
应用服务节点选择模块718,用于当未验证完毕时选择下一应用服务节点。 
优选的,所述第三记录模块716在记录所述当前应用服务节点的应用服务验证结果为“异常”的同时,如果当前响应页面信息存在报错关键字,则同时备注所述报错关键字。 
所述***应用健康判定单元72包括应用服务验证结果统计模块721和***应用健康判定模块722。 
应用服务验证结果统计模块721,用于统计所有应用服务验证结果中应用服务验证结果为“正常”的个数。 
***应用健康判定模块722,用于根据统计的应用服务验证结果中“正常”的个数进行健康判定。健康判定的方式如下:当所有的应用服务验证结果为“正常”时,信息***的当前应用服务健康状态为“健康”;当所有的应用服务验证结果没有一个“正常”时,信息***的当前应用服务健康状态为“异常”;其他情况下,信息***的当前应用服务健康状态为“亚健康”。 
其中,所述数据库服务健康状态监控装置包括数据库服务健康状态验证单元81和***数据库健康判定单元82。 
数据库服务健康状态验证单元81,从其中的一个数据库服务节点开始对每一个数据库服务节点进行数据库服务健康状态验证,得到对应的数据库服务验证结果,所述数据库服务验证结果包括“正常”、“异常”和“超时”三种状 态。 
***数据库健康判定单元82,根据所有的数据库服务验证结果中“正常”的数量判定信息***的数据库服务健康状态为“健康”、“亚健康”或“异常”。 
所述数据库服务健康状态验证单元81包括字符串获取连接模块811、数据库响应判断模块812、第一数据库记录模块813、第二数据库记录模块814、数据库验证判断模块815和数据库服务节点选择模块816。 
字符串获取连接模块811,用于获取当前选择的数据库服务节点的连接字符串并进行数据库连接。 
数据库响应判断模块812,用于判断在预设的数据库服务节点的最大响应时长内是否得到服务响应。 
第一数据库记录模块813,用于在数据库响应判断模块判断为否时,记录所述当前数据库服务节点的数据库服务验证结果为“超时”。 
第二数据库记录模块814,用于在数据库响应判断模块判断为是时,当所述返回的服务响应为连接成功时记录当前数据库服务节点的数据库服务验证结果为“正常”,服务响应为其他时记录当前数据库服务节点的数据库服务验证结果为“异常”。 
数据库验证判断模块815,用于判断所有数据库服务节点的数据库服务健康状态是否验证完毕。 
数据库服务节点选择模块816,用于当未验证完毕时选择下一数据库服务节点。 
所述***数据库健康判定单元82包括数据库服务验证结果统计模块821和***数据库健康判定模块822。 
数据库服务验证结果统计模块821,用于统计所有数据库服务验证结果中数据库服务验证结果为“正常”的个数。 
***数据库健康判定模块822,用于根据统计的数据库服务验证结果中“正常”的个数进行健康判定。健康判定的方式如下:当所有的数据库服务验证结 果为“正常”时,信息***的当前数据库服务健康状态为“健康”;当所有的数据库服务验证结果没有一个正常时,信息***的当前数据库服务健康状态为异常;其他情况下,信息***的当前数据库服务健康状态为亚健康。 
本实施例提供的功能模块711-718、721-722对应实现了实施例二中的步骤S301-310,功能模块811-816、821-822对应实现了实施例二中的步骤S401-S408,另一方面,本实施例在实施例三的基础上进一步公开了应用服务健康状态验证单元、***应用健康判定单元、数据库服务健康状态验证单元和***数据库健康判定单元的优选结构,通过这些于优选结构,本实施例可以防止出现死锁现象,而且利用应用服务正常关键字查询方式,减少了遍历搜索时间,提高运算效率。 
本领域普通技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以在存储于一计算机可读取存储介质中,所述的存储介质,如ROM/RAM、磁盘、光盘等。 
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。 

Claims (10)

1.一种信息***全链路健康状态监控方法,所述信息***包括应用服务模块和数据库服务模块,所述应用服务模块包括至少二个应用服务节点,所述数据库服模块包括至少二个数据库服务节点,其特征在于,所述方法包括应用服务健康状态监控方法和/或数据库服务健康状态监控方法,
其中,所述应用服务监控状态监控方法包括:
从其中的一个应用服务节点开始对每一个应用服务节点进行应用服务健康状态验证,得到对应的应用服务验证结果,所述应用服务验证结果包括正常、异常和超时;
根据所有的应用服务验证结果中正常的数量判定信息***的应用服务健康状态为健康、亚健康或异常;
其中,所述数据库服务健康状态监控方法包括:
从其中的一个数据库服务节点开始对每一个数据库服务节点进行数据库服务健康状态验证,得到对应的数据库服务验证结果,所述数据库服务验证结果包括正常、异常和超时;
根据所有的数据库服务验证结果中正常的数量判定信息***的数据库服务健康状态为健康、亚健康或异常。
2.如权利要求1所述方法,其特征在于,所述从其中的一个应用服务节点开始对每一个应用服务节点进行应用服务健康状态验证,得到对应的应用服务验证结果,具体包括:
模拟IE浏览器获取并访问当前选择的应用服务节点对应的对外应用服务地址;
判断在预设的应用服务节点的最大响应时长内是否得到服务响应;
若否,则记录所述当前应用服务节点的应用服务验证结果为超时;
若是,则捕获当前响应页面信息并搜索是否存在服务正常关键字;
当存在时,记录所述当前应用服务节点的应用服务验证结果为正常;
当不存在时,记录所述当前应用服务节点的应用服务验证结果为异常;
判断所述所有应用服务节点的应用服务健康状态是否验证完毕;
当未验证完毕时选择下一应用服务节点。
3.如权利要求2所述方法,其特征在于,在记录所述当前应用服务节点的应用服务验证结果为异常的同时,如果当前响应页面信息存在报错关键字,则同时备注所述报错关键字。
4.如权利要求1所述方法,其特征在于,所述从其中的一个数据库服务节点开始对每一个数据库服务节点进行数据库服务健康状态验证,得到对应的数据库服务验证结果,具体包括:
获取当前选择的数据库服务节点的连接字符串并进行数据库连接;
判断在预设的数据库服务节点的最大响应时长内是否得到服务响应;
若否,则记录所述当前数据库服务节点的数据库服务验证结果为超时;
若是,当所述返回的服务响应为连接成功时,记录当前数据库服务节点的数据库服务验证结果为正常,服务响应为其他时,记录当前数据库服务节点的数据库服务验证结果为异常;
判断所有数据库服务节点的数据库服务健康状态是否验证完毕;
当未验证完毕时选择下一数据库服务节点。
5.如权利要求1-4任一项所述方法,其特征在于,
所述根据所有的应用服务验证结果中正常的数量判定信息***的应用服务健康状态为健康、亚健康或异常,具体包括:
统计所有应用服务节点的应用服务验证结果中正常的个数;
当所有的应用服务验证结果为正常时判定信息***的当前应用服务健康状态为健康,当所有的应用服务验证结果没有一个正常时判定信息***的当前应用服务健康状态为异常,其他情况下,判定信息***的当前应用服务健康状态为亚健康;
所述根据所有的数据库服务验证结果中正常的数量判定信息***的数据库服务健康状态为健康、亚健康或异常,具体包括:
统计所有数据库服务节点的数据库服务验证结果中正常的个数;
当所有的数据库服务验证结果为正常时判定信息***的当前数据库服务健康状态为健康,当所有的数据库服务验证结果没有一个正常时判定信息***的当前数据库服务健康状态为异常,其他情况下判定信息***的当前数据库服务健康状态为亚健康。
6.一种信息***全链路健康状态监控装置,其特征在于,所述装置包括应用服务健康状态监控装置和/或数据库服务健康状态监控装置,
其中,所述应用服务健康状态监控装置包括:
应用服务健康状态验证单元,用于从其中的一个应用服务节点开始对每一个应用服务节点进行应用服务健康状态验证,得到对应的应用服务验证结果,所述应用服务验证结果包括正常、异常和超时;
***应用健康判定单元,用于根据所有的应用服务节点的应用服务验证结果中正常的数量判定信息***的应用服务健康状态为健康、亚健康或异常;
其中,所述数据库服务健康状态监控装置包括:
数据库服务健康状态验证单元,从其中的一个数据库服务节点开始对每一个数据库服务节点进行数据库服务健康状态验证,得到对应的数据库服务验证结果,所述数据库服务验证结果包括正常、异常和超时;
***数据库健康判定单元,根据所有的数据库服务验证结果中正常的数量判定信息***的数据库服务健康状态为健康、亚健康或异常。
7.如权利要求6所述装置,其特征在于,所述应用服务健康状态验证单元包括:
地址获取访问模块,用于模拟IE浏览器获取并访问当前选择的应用服务节点对应的对外应用服务地址;
应用响应判断模块,用于判断在预设的应用服务的最大响应时长内是否得到服务响应;
第一应用记录模块,用于在所述应用响应判断模块判断为否时记录所述当前应用服务节点的应用服务验证结果为超时;
关键字搜索模块,用于在所述应用响应判断模块判断为是时捕获当前响应页面信息并搜索是否存在服务正常关键字;
第二应用记录模块,用于当存在服务正常关键字时记录所述当前应用服务节点的应用服务验证结果为正常;
第三应用记录模块,用于当不存在服务正常关键字时记录所述当前应用服务节点的应用服务验证结果为异常;
应用验证判断模块,用于判断所述所有应用服务节点的应用服务健康状态是否验证完毕;
应用服务节点选择模块,用于当所有应用服务节点的应用服务健康状态未验证完毕时选择下一应用服务节点。
8.如权利要求7所述装置,其特征在于,所述第三记录模块在记录所述当前应用服务节点的应用服务验证结果为异常的同时,如果当前响应页面信息存在报错关键字,则同时备注所述报错关键字。
9.如权利要求6所述装置,其特征在于,所述***应用健康判定单元包括:
字符串获取连接模块,用于获取当前选择的数据库服务节点的连接字符串并进行数据库连接;
数据库响应判断模块,用于判断在预设的数据库服务节点的最大响应时长内是否得到服务响应;
第一数据库记录模块,用于在数据库响应判断模块判断为否时记录所述当前数据库服务节点的数据库服务验证结果为超时;
第二数据库记录模块,用于在数据库响应判断模块判断为是时,并且当所述返回的服务响应为连接成功时记录当前数据库服务节点的数据库服务验证结果为正常,服务响应为其他时记录当前数据库服务节点的数据库服务验证结果为异常;
数据库验证判断模块,用于判断所有数据库服务节点的数据库服务健康状态是否验证完毕;
数据库服务节点选择模块,用于当未验证完毕时选择下一数据库服务节点。
10.如权利要求6-9任一项所述装置,其特征在于,
所述***应用健康判定单元包括:
应用服务验证结果统计模块,用于统计所有应用服务节点的应用服务验证结果中正常的个数;
***应用健康判定模块,用于当所有的应用服务验证结果为正常时判定信息***的当前应用服务健康状态为健康,当所有的应用服务验证结果没有一个正常时判定信息***的当前应用服务健康状态为异常,其他情况下判定信息***的当前应用服务健康状态为亚健康;
所述***数据库健康判定单元包括:
数据库服务验证结果统计模块,用于统计所有数据库服务节点的数据库服务验证结果中正常的个数;
***数据库健康判定模块,用于当所有的数据库服务验证结果为正常时判定信息***的当前数据库服务健康状态为健康,当所有的数据库服务验证结果没有一个正常时判定信息***的当前数据库服务健康状态为异常,其他情况下,判定信息***的当前数据库服务健康状态为亚健康。
CN201310299637.0A 2013-07-17 2013-07-17 一种信息***全链路健康状态监控方法及装置 Expired - Fee Related CN103345439B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310299637.0A CN103345439B (zh) 2013-07-17 2013-07-17 一种信息***全链路健康状态监控方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310299637.0A CN103345439B (zh) 2013-07-17 2013-07-17 一种信息***全链路健康状态监控方法及装置

Publications (2)

Publication Number Publication Date
CN103345439A true CN103345439A (zh) 2013-10-09
CN103345439B CN103345439B (zh) 2016-05-11

Family

ID=49280237

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310299637.0A Expired - Fee Related CN103345439B (zh) 2013-07-17 2013-07-17 一种信息***全链路健康状态监控方法及装置

Country Status (1)

Country Link
CN (1) CN103345439B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106572011A (zh) * 2016-11-08 2017-04-19 新华三技术有限公司 数据流转发方法和装置
CN106656604A (zh) * 2016-12-23 2017-05-10 郑州云海信息技术有限公司 微服务请求管理方法、微服务控制器及高并发微服务架构
CN107493208A (zh) * 2017-08-30 2017-12-19 苏州朗动网络科技有限公司 一种中大型业务***的全链路性能监控方法及***
CN108804393A (zh) * 2018-04-20 2018-11-13 天津重电气自动化有限公司 一种先进的大***多状态统计算法
CN109145574A (zh) * 2018-07-26 2019-01-04 深圳市买买提信息科技有限公司 身份认证方法、装置、服务器及存储介质
CN105262633B (zh) * 2015-11-27 2019-03-12 中国建设银行股份有限公司 一种应用级容灾方法及应用级容灾***
CN111464389A (zh) * 2020-03-31 2020-07-28 云知声智能科技股份有限公司 一种高可用节点故障检测方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102957567A (zh) * 2012-11-09 2013-03-06 北京百度网讯科技有限公司 服务器信息管理方法及服务器管理装置
CN103001809A (zh) * 2012-12-25 2013-03-27 曙光信息产业(北京)有限公司 用于云存储***的服务节点状态监控方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102957567A (zh) * 2012-11-09 2013-03-06 北京百度网讯科技有限公司 服务器信息管理方法及服务器管理装置
CN103001809A (zh) * 2012-12-25 2013-03-27 曙光信息产业(北京)有限公司 用于云存储***的服务节点状态监控方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105262633B (zh) * 2015-11-27 2019-03-12 中国建设银行股份有限公司 一种应用级容灾方法及应用级容灾***
CN106572011A (zh) * 2016-11-08 2017-04-19 新华三技术有限公司 数据流转发方法和装置
CN106656604A (zh) * 2016-12-23 2017-05-10 郑州云海信息技术有限公司 微服务请求管理方法、微服务控制器及高并发微服务架构
CN107493208A (zh) * 2017-08-30 2017-12-19 苏州朗动网络科技有限公司 一种中大型业务***的全链路性能监控方法及***
CN108804393A (zh) * 2018-04-20 2018-11-13 天津重电气自动化有限公司 一种先进的大***多状态统计算法
CN109145574A (zh) * 2018-07-26 2019-01-04 深圳市买买提信息科技有限公司 身份认证方法、装置、服务器及存储介质
CN111464389A (zh) * 2020-03-31 2020-07-28 云知声智能科技股份有限公司 一种高可用节点故障检测方法及装置
CN111464389B (zh) * 2020-03-31 2021-09-14 云知声智能科技股份有限公司 一种高可用节点故障检测方法及装置

Also Published As

Publication number Publication date
CN103345439B (zh) 2016-05-11

Similar Documents

Publication Publication Date Title
CN103345439A (zh) 一种信息***全链路健康状态监控方法及装置
CN104426885B (zh) 异常账号提供方法及装置
US9374380B2 (en) Non-harmful insertion of data mimicking computer network attacks
CN102694696B (zh) Dns服务器异常检测的方法及装置
CN107958456A (zh) 点胶检测方法、装置及电子设备
CN107239397A (zh) 一种web自动化测试方法及电子设备
JP2006331425A (ja) ニューラルネットワークを介してグリッドエグゼキュータを選択する方法およびプログラム
CN106487603A (zh) 一种响应测试方法及装置
CN106502814A (zh) 一种记录pcie设备错误信息的方法及装置
CN104836777B (zh) 身份验证方法和***
CN107729231A (zh) 一种基于操作***的故障注入方法及装置
CN104468399A (zh) 数据传输方法、装置和服务器
CN107689941A (zh) 一种防止同一用户重复登录的装置和方法
CN106302412A (zh) 一种针对信息***抗压性测试的智能检测***和检测方法
CN107679423A (zh) 分区完整性检查方法及装置
CN104618336A (zh) 一种账号管理方法、设备及***
CN106155826A (zh) 用于在总线结构中检测及处理错误的方法和***
CN103995901A (zh) 一种确定数据节点失效的方法
CN106708445B (zh) 链路选择方法及装置
CN110247823A (zh) 一种故障检测方法、装置及相关设备
CN117076330A (zh) 一种访存验证方法、***、电子设备及可读存储介质
CN106502887A (zh) 一种稳定性测试方法、测试控制器及***
CN105430052A (zh) 一种用于集群***的仲裁方法和装置
CN107018039B (zh) 测试服务器集群性能瓶颈的方法和装置
CN109102083B (zh) 一种维修设备的数量配置方法及相关设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 100031 Xicheng District West Chang'an Avenue, No. 86, Beijing

Applicant after: State Grid Corporation of China

Applicant after: State Grid Hubei Electric Power Company Information & Telecommunication Company

Address before: 100031 Xicheng District West Chang'an Avenue, No. 86, Beijing

Applicant before: State Grid Corporation of China

Applicant before: Hubei Electric Power Company, Information and Communication Branch

CB03 Change of inventor or designer information

Inventor after: Yu Zheng

Inventor after: Xiao Zhihua

Inventor after: Liao Rongtao

Inventor after: Wang Yixi

Inventor after: Zhu Xiaojun

Inventor after: Cao Bo

Inventor after: Deng Guoru

Inventor before: Yu Zheng

Inventor before: Liao Rongtao

Inventor before: Wang Yixi

COR Change of bibliographic data
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160511

Termination date: 20180717