CN114048098A - 异常服务实例的监控方法及其装置 - Google Patents
异常服务实例的监控方法及其装置 Download PDFInfo
- Publication number
- CN114048098A CN114048098A CN202111346824.0A CN202111346824A CN114048098A CN 114048098 A CN114048098 A CN 114048098A CN 202111346824 A CN202111346824 A CN 202111346824A CN 114048098 A CN114048098 A CN 114048098A
- Authority
- CN
- China
- Prior art keywords
- service instance
- real
- data
- time
- operation state
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 50
- 238000012544 monitoring process Methods 0.000 title claims abstract description 23
- 238000013439 planning Methods 0.000 claims abstract description 201
- 230000004044 response Effects 0.000 claims abstract description 7
- 230000003993 interaction Effects 0.000 claims description 19
- 238000007689 inspection Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 6
- 230000005856 abnormality Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 3
- 238000013024 troubleshooting Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/302—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3055—Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3065—Monitoring arrangements determined by the means or processing involved in reporting the monitored data
- G06F11/3072—Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Mathematical Physics (AREA)
- Debugging And Monitoring (AREA)
Abstract
本申请实施例提供了一种异常服务实例的监控方法及其装置,用于对应用程序关联的多个服务实例进行监控,确定方法包括:获取每个服务实例的第一运行状态规划数据和/或第二运行状态规划数据;获取每个服务实例的第一实时运行状态数据和/或第二实时运行状态数据;响应于第一运行状态规划数据与第一实时运行状态数据不一致和/或第二运行状态规划数据与第二实时运行状态数据不一致,则确定对应的服务实例属于异常服务实例并生成服务实例异常的报警通知消息,从而实现了对服务实例异常的及时监控,并基于报警通知消息及时进行故障排除,保证了应用程序的正常运行。
Description
技术领域
本申请涉及数据处理技术领域,具体涉及一种异常服务实例的监控方法及其装置。
背景技术
应用程序上线之后,其功能实现依赖于多个服务实例的正常运行。但是,现有技术中,通常会出现服务实例异常的情形,如果不能及时监控到,会导致应用程序出现了异常,而无法及时发现并进行故障排除,以使得所述应用程序重新进入正常运行的状态。
因此,亟待提供一种对异常服务实例进行确定的方案。
发明内容
本申请实施例提供一种异常服务实例的监控方法及其装置、计算机存储介质、电子设备,用以克服或者缓解现有技术中存在的上述技术问题。
本申请采用的技术方案为:
一种异常服务实例的确定方法,其用于对应用程序关联的多个服务实例进行监控,所述确定方法包括:
获取每个服务实例的第一运行状态规划数据和/或第二运行状态规划数据,所述第一运行状态规划数据用于表征服务实例与电子设备之间的规划运行关系,所述第二运行状态规划数据用于表征在同一电子设备上实时运行多个服务实例时每个服务实例与电子设备进行交互所使用的规划端口;
获取每个服务实例的第一实时运行状态数据和/或第二实时运行状态数据,所述第一实时运行状态数据用于表征服务实例与电子设备之间的实时运行关系,所述第二实时运行状态数据用于表征在同一电子设备上实时运行多个服务实例时每个服务实例与电子设备进行交互所使用的实际端口;
响应于所述第一运行状态规划数据与所述第一实时运行状态数据不一致和/或所述第二运行状态规划数据与所述第二实时运行状态数据不一致,则确定对应的服务实例属于异常服务实例并生成服务实例异常的报警通知消息。
可选地,一实施例中,所述确定方法还包括:构建表征所述服务实例与第一运行状态规划数据和/或第二运行状态规划数据之间对应关系的键值对,并将所述服务实例的标识作为所述键值对的键,将所述服务实例对应的第一运行状态规划数据和/或第二运行状态规划数据作为所述键值对的值;
所述获取每个服务实例的第一运行状态规划数据和/或第二运行状态规划数据,包括:基于所述键值对,获取每个服务实例的第一运行状态规划数据和/或第二运行状态规划数据。
可选地,一实施例中,所述第一运行状态规划数据包括服务实例的标识、规划运行所述服务实例的电子设备的标识,通过所述服务实例的标识与所述电子设备的标识之间的对应关系,表征服务实例与电子设备之间的规划运行关系;
所述第二运行状态规划数据与所述第一运行状态规划数据共享所述服务实例的标识,且包括:所述规划端口的标识,通过所述服务实例的标识与所述规划端口的标识之间的对应关系,表征在同一电子设备上实时运行多个服务实例时每个服务实例与电子设备进行交互所使用的规划端口。
可选地,一实施例中,所述确定方法还包括:获取报警接收配置数据;
所述生成报警通知消息之后,包括:对所述报警接收配置数据进行解析以从中确定所述报警通知消息的接收方的标识,根据所述接收方的标识,将所述报警通知消息传输给所述接收方。
可选地,一实施例中,所述获取每个服务实例的第一实时运行状态数据和/或第二实时运行状态数据之前,包括:判断是否存在表征有服务实例在实时运行的服务实例注册列表;若存在,则判断所述服务实例注册列表中是否注册有实时运行的服务实例;若注册有服务实例,则执行获取每个服务实例的第一实时运行状态数据和/或第二实时运行状态数据的步骤。
可选地,一实施例中,若不存在所述服务实例注册列表,则判定无服务实例在实时运行,并生成所述应用程序异常的报警通知消息;若所述服务实例注册列表中未注册有实时运行的服务实例,则判定服务实施例未成功启动,并生成服务实例未成功启动的报警通知消息,并重新启动服务实例。
可选地,一实施例中,所述获取每个服务实例的第一实时运行状态数据和/或第二实时运行状态数据,包括:根据设定的巡检任务,针对所述服务实例注册列表中注册的每个服务实例,获取所述每个服务实例的第一实时运行状态数据和/或第二实时运行状态数据;
所述获取每个服务实例的第一实时运行状态数据之后,包括:根据所述每个服务实例的第一实时运行状态数据,确定实时运行所述每个服务实例的电子设备,并将实时运行所述每个服务实例的电子设备的标识添加到预先声明的电子设备集合中,以与所述第一实时运行状态数据进行匹配,判断所述第一运行状态规划数据与所述第一实时运行状态数据中的电子设备的标识是否相同,如果不同,则判定所述第一运行状态规划数据与所述第一实时运行状态数据不一致。
可选地,一实施例中,所述确定方法还包括:若所述第一运行状态规划数据中的电子设备标识并非为所有服务实例对应的所有所述第一实时运行状态数据中的任一电子设备的标识,则暂停对应的电子设备上实时运行的服务实例。
可选地,一实施例中,所述获取每个服务实例的第二实时运行状态数据之后,包括:判断所述第二实时运行状态数据的实际端口与所述第二运行状态规划数据的规划端口是否为同一端口,如果不是,则判定所述第二运行状态规划数据与所述第二实时运行状态数据不一致。
可选地,一实施例中,所述生成服务实例异常的报警通知消息之后,还包括:
判断未判定为异常服务实例的其他服务实例是否正常运行;
针对未正常运行的服务实例,生成服务实例未正常运行的报警通知消息;
重启未正常运行的服务实例。
一种异常服务实例的确定装置,其用于对应用程序关联的多个服务实例进行监控,所述确定装置包括:
配置数据获取单元,用于获取每个服务实例的第一运行状态规划数据和/或第二运行状态规划数据,所述第一运行状态规划数据用于表征服务实例与电子设备之间的规划运行关系,所述第二运行状态规划数据用于表征在同一电子设备上实时运行多个服务实例时每个服务实例与电子设备进行交互所使用的规划端口;
实时运行数据获取单元,用于获取每个服务实例的第一实时运行状态数据和/或第二实时运行状态数据,所述第一实时运行状态数据用于表征服务实例与电子设备之间的实时运行关系,所述第二实时运行状态数据用于表征在同一电子设备上实时运行多个服务实例时每个服务实例与电子设备进行交互所使用的实际端口;
异常监控单元,用于响应于所述第一运行状态规划数据与所述第一实时运行状态数据不一致和/或所述第二运行状态规划数据与所述第二实时运行状态数据不一致,确定对应的服务实例属于异常服务实例并生成服务实例异常的报警通知消息。
一种计算机存储介质,所述计算机存储介质上存储有计算机可执行程序,所述计算机可执行程序被运行以实施本申请实施例任一所述的方法。
一种电子设备,所述电子设备包括存储器以及处理器,所述存储器上用于存储计算机可执行程序,所述处理器用于运行所述计算机可执行程序以实施本申请实施例任一所述确定方法。
本申请实施例,获取每个服务实例的第一运行状态规划数据和/或第二运行状态规划数据,所述第一运行状态规划数据用于表征服务实例与电子设备之间的规划运行关系,所述第二运行状态规划数据用于表征在同一电子设备上实时运行多个服务实例时每个服务实例与电子设备进行交互所使用的规划端口;获取每个服务实例的第一实时运行状态数据和/或第二实时运行状态数据,所述第一实时运行状态数据用于表征服务实例与电子设备之间的实时运行关系,所述第二实时运行状态数据用于表征在同一电子设备上实时运行多个服务实例时每个服务实例与电子设备进行交互所使用的实际端口;响应于所述第一运行状态规划数据与所述第一实时运行状态数据不一致和/或所述第二运行状态规划数据与所述第二实时运行状态数据不一致,则确定对应的服务实例属于异常服务实例并生成服务实例异常的报警通知消息,从而实现了对服务实例异常的及时监控,并基于报警通知消息及时进行故障排除,保证了应用程序的正常运行。
附图说明
图1为本申请实施例应用场景的示意图;
图2为本申请实施例一种异常服务实例的确定方法流程示意图;
图3为本申请实施例一种异常服务实例的确定装置的结构示意图;
图4为本申请实施例中电子设备的结构示意图。
具体实施方式
为使本申请要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
本申请实施例,获取每个服务实例的第一运行状态规划数据和/或第二运行状态规划数据,所述第一运行状态规划数据用于表征服务实例与电子设备之间的规划运行关系,所述第二运行状态规划数据用于表征在同一电子设备上实时运行多个服务实例时每个服务实例与电子设备进行交互所使用的规划端口;获取每个服务实例的第一实时运行状态数据和/或第二实时运行状态数据,所述第一实时运行状态数据用于表征服务实例与电子设备之间的实时运行关系,所述第二实时运行状态数据用于表征在同一电子设备上实时运行多个服务实例时每个服务实例与电子设备进行交互所使用的实际端口;响应于所述第一运行状态规划数据与所述第一实时运行状态数据不一致和/或所述第二运行状态规划数据与所述第二实时运行状态数据不一致,则确定对应的服务实例属于异常服务实例并生成服务实例异常的报警通知消息,从而实现了对服务实例异常的及时监控,并基于报警通知消息及时进行故障排除,保证了应用程序的正常运行。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、装置、步骤等。在其它情况下,不详细示出或描述公知结构、方法、装置、实现或者操作以避免喧宾夺主而使得本公开的各方面变得模糊。
此外,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本公开的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。符号“/”一般表示前后关联对象是一种“或”的关系。
在本公开中,除非另有明确的规定和限定,“连接”等术语应做广义理解,例如,可以是电连接或可以互相通讯;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本公开中的具体含义。
图1为本申请实施例应用场景的示意图;如图1所示,一应用程序的功能实现依赖于多个服务实例的正常运行,所述多个服务实例配置到后台的多个电子设备上进行运行,一个电子设备上可能分配有一个要运行的服务实例,也有可能分配有多个要运行的服务实例,所有服务实例的正常运行才能保证应用程序功能的实现,或者又可以称之为应用程序的正常运行。当某一个服务实例出现异常,就会导致应用程序无法正常运行。为此,本申请中提供了如下解决方案,及时对异常服务实例进行监控并生成服务实例异常的报警通知消息,并基于报警通知消息及时进行故障排除,保证了应用程序的正常运行。比如,报警通知消息传输给指定的消息接收方,从而通知相关人员进行故障排除。
为实现本申请实施例的方案,可以设置监控服务器来执行下述方案,此处,需要说明的是,监控服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式***,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。
图2为本申请实施例一种异常服务实例的确定方法流程示意图;所述确定方法用于对应用程序关联的多个服务实例进行监控,如图2所示,所述确定方法包括:
S201、获取每个服务实例的第一运行状态规划数据和/或第二运行状态规划数据;
所述第一运行状态规划数据用于表征服务实例与电子设备之间的规划运行关系,所述第二运行状态规划数据用于表征在同一电子设备上实时运行多个服务实例时每个服务实例与电子设备进行交互所使用的规划端口;
本实施例中,在步骤S201之前设置了规划数据配置库,在该规划配置数据库中,构建表征所述服务实例与第一运行状态规划数据和/或第二运行状态规划数据之间对应关系的键值对,并将所述服务实例的标识作为所述键值对的键(又称之为key),将所述服务实例对应的第一运行状态规划数据和/或第二运行状态规划数据作为所述键值对的值(又称之为value),通过第一运行状态规划数据相当于实现了电子设备和服务实例之间运行关系配置,即那些服务实例需要运行在那个或者那些电子设备上。另外,通过多第二运行状态数据相当于实现了在同一个电子设备上规划运行的多个服务实例分别与该同一个电子设备进行交互时使用的规划端口,从而便捷快速地实现了上述第一运行状态规划数据和/或第二运行状态规划数据的配置。
可选地,在上述配置时,还可以将应用程序关联的多个服务实例添加到一服务实例管理列表中,以便于进行管理。
本实施例中,所述规划数据配置库的体现形式不做特别限定,比如,较为简单地,直接以列表形式体现。
示例性地,一个服务实施例可以对应一个键值对,当然为了对所有服务实例对应的键值对进行管理,可以形成一个键值对类表,这些键值对列表中的行用来记录服务实例的标识,而列用来记录对应的所述第一运行状态规划数据和/或第二运行状态规划数据。
为此,示例性地,本实施例中,所述获取每个服务实例的第一运行状态规划数据和/或第二运行状态规划数据,包括:基于所述键值对,获取每个服务实例的第一运行状态规划数据和/或第二运行状态规划数据。即通过对所述键值对进行解析,从而获取每个服务实例的第一运行状态规划数据和/或第二运行状态规划数据。
示例性地,本实施例中,所述第一运行状态规划数据包括服务实例的标识、规划运行所述服务实例的电子设备的标识,通过所述服务实例的标识与所述电子设备的标识之间的对应关系,表征服务实例与电子设备之间的规划运行关系。
进一步地,本实施例中,所述第二运行状态规划数据与所述第一运行状态规划数据共享所述服务实例的标识,且包括:所述规划端口的标识,通过所述服务实例的标识与所述规划端口的标识之间的对应关系,表征在同一电子设备上实时运行多个服务实例时每个服务实例与电子设备进行交互所使用的规划端口。
示例性地,如果基于上述键值对的形式实现所述第二运行状态规划数据与所述第一运行状态规划数据的配置,将所述服务实例的标识作为所述键值对的键(又称之为key),将所述服务实例对应的第一运行状态规划数据和/或第二运行状态规划数据作为所述键值对的值(又称之为value)时,将所述电子设备的标识之间和所述规划端口的标识组合在一起,在具体组合式,可以通过分割符(比如:或者,#等)将所述电子设备的标识之间和所述规划端口的标识组合在一起,比如,在该组合中,所述电子设备的标识在前,中间是分隔符,所述规划端口的标识在后。
本实施例中,所述服务实例的标识具体比如为服务实例的名称,电子设备的标识比如为电子设备名称或者IP地址,所述规划端口的标识比如为规划端口号。当然,此处对这些标识的说明仅仅是举例,并非唯一性限定。
此处,需要说明的是,键值对仅仅是举例,并未唯一性限定,对于本领域普通技术人员来说,也可以通过其他方式来配置上述第一运行状态规划数据和/或第二运行状态规划数据。
另外,需要说明的是,配置第一运行状态规划数据和/或第二运行状态规划数据可以根据应用场景的需求来定,比如,在一些应用场景下,比如监控的要求较低,或者服务实例发生异常的概率较低,只配置第一运行状态规划数据或第二运行状态规划数据,而在另一些应用场景下,比如监控的要求较高,或者服务实例发生异常的概率较高,则即配置第一运行状态规划数据,又配置第二运行状态规划数据。
另外,由于不同的服务实例对应用程序的正常运行影响程度不同,因此,在上述配置时还以在第一运行状态规划数据或者第二运行状态规划数据中配置报警通知消息的级别,服务实例对应用程序的正常运行影响程度的越高,级别越高,反之,则级别越低。
S202、获取每个服务实例的第一实时运行状态数据和/或第二实时运行状态数据;
可选地,本实施例中,所述第一实时运行状态数据用于表征服务实例与电子设备之间的实时运行关系,所述第二实时运行状态数据用于表征在同一电子设备上实时运行多个服务实例时每个服务实例与电子设备进行交互所使用的实际端口;
可选地,本实施例中,在所述获取每个服务实例的第一实时运行状态数据和/或第二实时运行状态数据之前,包括:判断是否存在表征有服务实例在实时运行的服务实例注册列表;若存在,则判断所述服务实例注册列表中是否注册有实时运行的服务实例;若注册有服务实例,则执行获取每个服务实例的第一实时运行状态数据和/或第二实时运行状态数据的步骤。
进一步地,若不存在所述服务实例注册列表,则判定无服务实例在实时运行,并生成所述应用程序异常的报警通知消息;若所述服务实例注册列表中未注册有实时运行的服务实例,则判定服务实施例未成功启动,并生成服务实例未成功启动的报警通知消息,并重新启动服务实例。
通过上述判断是否存在表征有服务实例在实时运行的服务实例注册列表,从而可以快速判断出应用程序整体运行是否存在异常,如果存在表征有服务实例在实时运行的服务实例注册列表,则表明所有的服务实例均没有执行,则进一步所述应用程序的运行整体出现了异常。所述应用程序异常的报警通知消息比如为“[应用为空]获取到的application为空”。
再进一步判断所述服务实例注册列表中是否注册有实时运行的服务实例,若注册有服务实例,则表明所述应用程序在运行,同时,当确定出所述服务实例注册列表中未注册有实时运行的服务实例,则判定服务实施例未成功启动,并生成服务实例未成功启动的报警通知消息,并重新启动服务实例(比如通过脚本来重新启动服务实例),从而保证了上述步骤S201不会被误触发。报警通知消息比如为:[服务为空]需要监控的service列表为空"。
示例性地,本实施例中,每个服务实例的第一实时运行状态数据和/或第二实时运行状态数据可以存储在运行日志数据中,通过对日志数据进行解析,从而获取到获取每个服务实例的第一实时运行状态数据和/或第二实时运行状态数据。
当然,此处从日志数据中获取第一实时运行状态数据和/或第二实时运行状态数据仅仅是示例,并非唯一性限定。
可选地,本实施例中,所述获取每个服务实例的第一实时运行状态数据和/或第二实时运行状态数据,包括:根据设定的巡检任务,针对所述服务实例注册列表中注册的每个服务实例,获取所述每个服务实例的第一实时运行状态数据和/或第二实时运行状态数据,从而可以对服务实例进行实时监控,确保一旦有服务实例出现异常,即可及时地监控到。
可选地,所述巡检任务可以在上述配置第一运行状态规划数据或者第二运行状态规划数据中时,一并配置。比如,配置巡检任务的总次数,以及巡检任务的时间间隔,总次数和时间间隔的具体数值不做特别限定,其可以根据应用场景确定。
可选地,本实施例中,所述获取每个服务实例的第一实时运行状态数据之后,包括:根据所述每个服务实例的第一实时运行状态数据,确定实时运行所述每个服务实例的电子设备,并将实时运行所述每个服务实例的电子设备的标识添加到预先声明的电子设备集合中,以与所述第一实时运行状态数据进行匹配,判断所述第一运行状态规划数据与所述第一实时运行状态数据中的电子设备的标识是否相同,如果不同,则判定所述第一运行状态规划数据与所述第一实时运行状态数据不一致。
此处,通过声明电子设备集合方式,可以快速地进行上述电子设备的标识的是否相同的判断,提高了数据的处理效率和判断结果的准确性。
示例性地,如果电子设备的标识为电子设备的名称,则将实时运行所述每个服务实例的电子设备的标识添加到预先声明的电子设备集合中,以与所述第一实时运行状态数据进行匹配时,首先基于电子设备的名称进行匹配,当第一运行状态规划数据与所述第一实时运行状态数据中的电子设备的标识不同时,为了避免误判断,进一步基于电子设备的IP进行匹配,如果当第一运行状态规划数据与所述第一实时运行状态数据中的电子设备的IP不同时,则最终判定所述第一运行状态规划数据与所述第一实时运行状态数据不一致,否则,则判定一致。
可选地,本实施例中,在声明上述电子设备集合时,以服务实例为单位进行声明,即一个服务实例,对应一个电子设备集合,从而可以快速地与对应的所述第一实时运行状态数据进行匹配,判断出所述第一运行状态规划数据与所述第一实时运行状态数据中的电子设备的标识是否相同。
在上述进行判断出所述第一运行状态规划数据与所述第一实时运行状态数据是否一致的处理过程中,若对于每个服务实例,其对应的所述第一运行状态规划数据中的电子设备标识并非为所有服务实例对应的所有所述第一实时运行状态数据中的任一电子设备的标识,则暂停对应的电子设备上实时运行的服务实例,通过这种方式,可以对异常的电子设备进行监控,为了保证数据安全,暂停对应的电子设备上实时运行的服务实例。与此同时,生成电子设备异常的报警通知信息,比如【"电子设备未配置"】。
另外,上述进行判断出所述第一运行状态规划数据与所述第一实时运行状态数据是否一致的处理过程中,若对于每个电子设备,其对应的所述第一实时运行状态数据中的服务实例的标识并非为所有服务实例对应的所述第一运行状态规划数据中的服务实例的标识任一,则暂停对应的服务实例,从而保证数据的安全。与此同时,生成服务实例暂停的报警消息。
可选地,本实施例中,所述获取每个服务实例的第二实时运行状态数据之后,包括:判断所述第二实时运行状态数据的实际端口与所述第二运行状态规划数据的规划端口是否为同一端口,如果不是,则判定所述第二运行状态规划数据与所述第二实时运行状态数据不一致。
具体地,第二实时运行状态数据的实际端口号与所述第二运行状态规划数据的规划端口号进行比对,从而快速地判断所述第二实时运行状态数据的实际端口与所述第二运行状态规划数据的规划端口是否为同一端口。
本实施例中,通过所述第一运行状态规划数据与所述第一实时运行状态数据进行匹配,和/或所述第二运行状态规划数据与所述第二实时运行状态数据进行匹配,可以准确且快速地生产个所述第一运行状态规划数据与所述第一实时运行状态数据不一致和/或所述第二运行状态规划数据与所述第二实时运行状态数据不一致的结果。
S203、响应于所述第一运行状态规划数据与所述第一实时运行状态数据不一致和/或所述第二运行状态规划数据与所述第二实时运行状态数据不一致,则确定对应的服务实例属于异常服务实例并生成服务实例异常的报警通知消息。
可选地,本实施例中,所述第一运行状态规划数据与所述第一实时运行状态数据不一致,则表明实际运行时,电子设备和服务实例之间的对应关系不符合配置的对应关系,所述第二运行状态规划数据与所述第二实时运行状态数据不一致,则表明服务实例和端口之间的对应关系不符合配置的对应关系,从而可准确地判断出异常服务实例。
在上述实施例的基础上,所述方法还可以包括:获取报警接收配置数据;该步骤可以在步骤S203之前执行即可,以在所述生成报警通知消息之后,包括:对所述报警接收配置数据进行解析以从中确定所述报警通知消息的接收方的标识,根据所述接收方的标识,将所述报警通知消息传输给所述接收方。所述接收方可以研发部门,技术支持部门,测试部门中的具体责任人的联系方式,比如归属部门、姓名、邮箱、电话等,以将本申请实施例中生成的任意报警消息传输给所述接收方,便于及时进行故障排除。
可选地,一实施例中,可以以键值对的方式,在步骤S201之前生成报警接收配置数据,服务实例的标识作为键值对中键(key),而接收方的联系方式作为键值对中键(key)。
进一步地,在所述生成服务实例异常的报警通知消息之后,还包括:
判断未判定为异常服务实例的其他服务实例是否正常运行;
针对未正常运行的服务实例,生成服务实例未正常运行的报警通知消息;
重启未正常运行的服务实例。
图3为本申请实施例一种异常服务实例的确定装置的结构示意图;所述确定装置用于对应用程序关联的多个服务实例进行监控,所述确定装置包括:
配置数据获取单元301,用于获取每个服务实例的第一运行状态规划数据和/或第二运行状态规划数据,所述第一运行状态规划数据用于表征服务实例与电子设备之间的规划运行关系,所述第二运行状态规划数据用于表征在同一电子设备上实时运行多个服务实例时每个服务实例与电子设备进行交互所使用的规划端口;
实时运行数据获取单元302,用于获取每个服务实例的第一实时运行状态数据和/或第二实时运行状态数据,所述第一实时运行状态数据用于表征服务实例与电子设备之间的实时运行关系,所述第二实时运行状态数据用于表征在同一电子设备上实时运行多个服务实例时每个服务实例与电子设备进行交互所使用的实际端口;
异常监控单元303,用于响应于所述第一运行状态规划数据与所述第一实时运行状态数据不一致和/或所述第二运行状态规划数据与所述第二实时运行状态数据不一致,确定对应的服务实例属于异常服务实例并生成服务实例异常的报警通知消息。
可选地,一实施例中,所述确定装置还包括:规划数据构建单元,用于构建表征所述服务实例与第一运行状态规划数据和/或第二运行状态规划数据之间对应关系的键值对,并将所述服务实例的标识作为所述键值对的键,将所述服务实例对应的第一运行状态规划数据和/或第二运行状态规划数据作为所述键值对的值;
配置数据获取单元301具体用于:基于所述键值对,获取每个服务实例的第一运行状态规划数据和/或第二运行状态规划数据。
可选地,一实施例中,所述第一运行状态规划数据包括服务实例的标识、规划运行所述服务实例的电子设备的标识,通过所述服务实例的标识与所述电子设备的标识之间的对应关系,表征服务实例与电子设备之间的规划运行关系;
所述第二运行状态规划数据与所述第一运行状态规划数据共享所述服务实例的标识,且包括:所述规划端口的标识,通过所述服务实例的标识与所述规划端口的标识之间的对应关系,表征在同一电子设备上实时运行多个服务实例时每个服务实例与电子设备进行交互所使用的规划端口。
可选地,一实施例中,所述配置数据获取单元301还用于:获取报警接收配置数据;
所述确定装置包括:消息发送单元,用于在生成报警通知消息之后,对所述报警接收配置数据进行解析以从中确定所述报警通知消息的接收方的标识,根据所述接收方的标识,将所述报警通知消息传输给所述接收方。
可选地,一实施例中,所述确定装置还包括:预处理单元,用于在获取每个服务实例的第一实时运行状态数据和/或第二实时运行状态数据之前,判断是否存在表征有服务实例在实时运行的服务实例注册列表;若存在,则判断所述服务实例注册列表中是否注册有实时运行的服务实例;若注册有服务实例,则执行获取每个服务实例的第一实时运行状态数据和/或第二实时运行状态数据的步骤。
可选地,一实施例中,若不存在所述服务实例注册列表,所述预处理单元还用于判定无服务实例在实时运行,并生成所述应用程序异常的报警通知消息;若所述服务实例注册列表中未注册有实时运行的服务实例,所述预处理单元还用于判定服务实施例未成功启动,并生成服务实例未成功启动的报警通知消息,并重新启动服务实例。
可选地,一实施例中,所述配置数据获取单元301具体用于:根据设定的巡检任务,针对所述服务实例注册列表中注册的每个服务实例,获取所述每个服务实例的第一实时运行状态数据和/或第二实时运行状态数据;
所述配置数据获取单元301还具体用于:根据所述每个服务实例的第一实时运行状态数据,确定实时运行所述每个服务实例的电子设备,并将实时运行所述每个服务实例的电子设备的标识添加到预先声明的电子设备集合中;异常监控单元303具体用于将所述电子设备集合与所述第一实时运行状态数据进行匹配,判断所述第一运行状态规划数据与所述第一实时运行状态数据中的电子设备的标识是否相同,如果不同,则判定所述第一运行状态规划数据与所述第一实时运行状态数据不一致。
可选地,一实施例中,若所述第一运行状态规划数据中的电子设备标识并非为所有服务实例对应的所有所述第一实时运行状态数据中的任一电子设备的标识,则异常监控单元303还用于暂停对应的电子设备上实时运行的服务实例。
可选地,一实施例中,所述异常监控单元303具体用于判断所述第二实时运行状态数据的实际端口与所述第二运行状态规划数据的规划端口是否为同一端口,如果不是,则判定所述第二运行状态规划数据与所述第二实时运行状态数据不一致。
可选地,一实施例中,所述异常监控单元303还用于:
判断未判定为异常服务实例的其他服务实例是否正常运行;
针对未正常运行的服务实例,生成服务实例未正常运行的报警通知消息;
重启未正常运行的服务实例。
本申请实施例提供一种计算机存储介质,所述计算机存储介质上存储有计算机可执行程序,所述计算机可执行程序被运行以实施本申请实施例任一所述的方法。
图4为本申请实施例中电子设备的结构示意图;如图4所示,电子设备包括:存储器401以及处理器402,所述存储器上存储有计算机可执行程序,所述处理器用于运行所述计算机可执行程序以实施本申请任一实施例中的数据处理方法。
所述电子设备可以作为执行上述方法的监控服务器。
以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。
Claims (13)
1.一种异常服务实例的确定方法,其特征在于,用于对应用程序关联的多个服务实例进行监控,所述确定方法包括:
获取每个服务实例的第一运行状态规划数据和/或第二运行状态规划数据,所述第一运行状态规划数据用于表征服务实例与电子设备之间的规划运行关系,所述第二运行状态规划数据用于表征在同一电子设备上实时运行多个服务实例时每个服务实例与电子设备进行交互所使用的规划端口;
获取每个服务实例的第一实时运行状态数据和/或第二实时运行状态数据,所述第一实时运行状态数据用于表征服务实例与电子设备之间的实时运行关系,所述第二实时运行状态数据用于表征在同一电子设备上实时运行多个服务实例时每个服务实例与电子设备进行交互所使用的实际端口;
响应于所述第一运行状态规划数据与所述第一实时运行状态数据不一致和/或所述第二运行状态规划数据与所述第二实时运行状态数据不一致,则确定对应的服务实例属于异常服务实例并生成服务实例异常的报警通知消息。
2.根据权利要求1所述的方法,其特征在于,所述确定方法还包括:构建表征所述服务实例与第一运行状态规划数据和/或第二运行状态规划数据之间对应关系的键值对,并将所述服务实例的标识作为所述键值对的键,将所述服务实例对应的第一运行状态规划数据和/或第二运行状态规划数据作为所述键值对的值;
所述获取每个服务实例的第一运行状态规划数据和/或第二运行状态规划数据,包括:基于所述键值对,获取每个服务实例的第一运行状态规划数据和/或第二运行状态规划数据。
3.根据权利要求1所述的方法,其特征在于,所述第一运行状态规划数据包括服务实例的标识、规划运行所述服务实例的电子设备的标识,通过所述服务实例的标识与所述电子设备的标识之间的对应关系,表征服务实例与电子设备之间的规划运行关系;
所述第二运行状态规划数据与所述第一运行状态规划数据共享所述服务实例的标识,且包括:所述规划端口的标识,通过所述服务实例的标识与所述规划端口的标识之间的对应关系,表征在同一电子设备上实时运行多个服务实例时每个服务实例与电子设备进行交互所使用的规划端口。
4.根据权利要求1所述的方法,其特征在于,还包括:获取报警接收配置数据;
所述生成报警通知消息之后,包括:对所述报警接收配置数据进行解析以从中确定所述报警通知消息的接收方的标识,根据所述接收方的标识,将所述报警通知消息传输给所述接收方。
5.根据权利要求1所述的方法,其特征在于,所述获取每个服务实例的第一实时运行状态数据和/或第二实时运行状态数据之前,包括:判断是否存在表征有服务实例在实时运行的服务实例注册列表;若存在,则判断所述服务实例注册列表中是否注册有实时运行的服务实例;若注册有服务实例,则执行获取每个服务实例的第一实时运行状态数据和/或第二实时运行状态数据的步骤。
6.根据权利要求5所述的方法,其特征在于,若不存在所述服务实例注册列表,则判定无服务实例在实时运行,并生成所述应用程序异常的报警通知消息;若所述服务实例注册列表中未注册有实时运行的服务实例,则判定服务实施例未成功启动,并生成服务实例未成功启动的报警通知消息,并重新启动服务实例。
7.根据权利要求5所述的方法,其特征在于,所述获取每个服务实例的第一实时运行状态数据和/或第二实时运行状态数据,包括:根据设定的巡检任务,针对所述服务实例注册列表中注册的每个服务实例,获取所述每个服务实例的第一实时运行状态数据和/或第二实时运行状态数据;
所述获取每个服务实例的第一实时运行状态数据之后,包括:根据所述每个服务实例的第一实时运行状态数据,确定实时运行所述每个服务实例的电子设备,并将实时运行所述每个服务实例的电子设备的标识添加到预先声明的电子设备集合中,以与所述第一实时运行状态数据进行匹配,判断所述第一运行状态规划数据与所述第一实时运行状态数据中的电子设备的标识是否相同,如果不同,则判定所述第一运行状态规划数据与所述第一实时运行状态数据不一致。
8.根据权利要求7所述的方法,其特征在于,所述确定方法还包括:若所述第一运行状态规划数据中的电子设备标识并非为所有服务实例对应的所有所述第一实时运行状态数据中的任一电子设备的标识,则暂停对应的电子设备上实时运行的服务实例。
9.根据权利要求1-8任一项所述的方法,其特征在于,所述获取每个服务实例的第二实时运行状态数据之后,包括:判断所述第二实时运行状态数据的实际端口与所述第二运行状态规划数据的规划端口是否为同一端口,如果不是,则判定所述第二运行状态规划数据与所述第二实时运行状态数据不一致。
10.根据权利要求9所述的方法,其特征在于,所述生成服务实例异常的报警通知消息之后,还包括:
判断未判定为异常服务实例的其他服务实例是否正常运行;
针对未正常运行的服务实例,生成服务实例未正常运行的报警通知消息;
重启未正常运行的服务实例。
11.一种异常服务实例的确定装置,其特征在于,用于对应用程序关联的多个服务实例进行监控,所述确定装置包括:
配置数据获取单元,用于获取每个服务实例的第一运行状态规划数据和/或第二运行状态规划数据,所述第一运行状态规划数据用于表征服务实例与电子设备之间的规划运行关系,所述第二运行状态规划数据用于表征在同一电子设备上实时运行多个服务实例时每个服务实例与电子设备进行交互所使用的规划端口;
实时运行数据获取单元,用于获取每个服务实例的第一实时运行状态数据和/或第二实时运行状态数据,所述第一实时运行状态数据用于表征服务实例与电子设备之间的实时运行关系,所述第二实时运行状态数据用于表征在同一电子设备上实时运行多个服务实例时每个服务实例与电子设备进行交互所使用的实际端口;
异常监控单元,用于响应于所述第一运行状态规划数据与所述第一实时运行状态数据不一致和/或所述第二运行状态规划数据与所述第二实时运行状态数据不一致,确定对应的服务实例属于异常服务实例并生成服务实例异常的报警通知消息。
12.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有计算机可执行程序,所述计算机可执行程序被运行以实施权利要求1-10任一所述的方法。
13.一种电子设备,其特征在于,所述电子设备包括存储器以及处理器,所述存储器上用于存储计算机可执行程序,所述处理器用于运行所述计算机可执行程序以实施权利要求1-10任一所述确定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111346824.0A CN114048098B (zh) | 2021-11-15 | 2021-11-15 | 异常服务实例的监控方法及其装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111346824.0A CN114048098B (zh) | 2021-11-15 | 2021-11-15 | 异常服务实例的监控方法及其装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114048098A true CN114048098A (zh) | 2022-02-15 |
CN114048098B CN114048098B (zh) | 2024-07-16 |
Family
ID=80209050
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111346824.0A Active CN114048098B (zh) | 2021-11-15 | 2021-11-15 | 异常服务实例的监控方法及其装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114048098B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108282368A (zh) * | 2018-01-24 | 2018-07-13 | 云宏信息科技股份有限公司 | 一种微服务管理***、方法及计算机存储介质 |
CN108900386A (zh) * | 2018-08-10 | 2018-11-27 | 北京金山云网络技术有限公司 | 告警信息的产生方法、装置及电子设备 |
US20200159592A1 (en) * | 2018-11-16 | 2020-05-21 | International Business Machines Corporation | Selection of ranked service instances in a service infrastructure |
CN111475372A (zh) * | 2020-03-10 | 2020-07-31 | 中国平安人寿保险股份有限公司 | 微服务的服务实例监控方法、装置、设备及存储介质 |
US20200344135A1 (en) * | 2019-04-26 | 2020-10-29 | EMC IP Holding Company LLC | Method, device and computer program product for configuring service instance |
WO2020252902A1 (zh) * | 2019-06-18 | 2020-12-24 | 平安科技(深圳)有限公司 | 云服务器自检方法、装置、设备及计算机可读存储介质 |
-
2021
- 2021-11-15 CN CN202111346824.0A patent/CN114048098B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108282368A (zh) * | 2018-01-24 | 2018-07-13 | 云宏信息科技股份有限公司 | 一种微服务管理***、方法及计算机存储介质 |
CN108900386A (zh) * | 2018-08-10 | 2018-11-27 | 北京金山云网络技术有限公司 | 告警信息的产生方法、装置及电子设备 |
US20200159592A1 (en) * | 2018-11-16 | 2020-05-21 | International Business Machines Corporation | Selection of ranked service instances in a service infrastructure |
US20200344135A1 (en) * | 2019-04-26 | 2020-10-29 | EMC IP Holding Company LLC | Method, device and computer program product for configuring service instance |
WO2020252902A1 (zh) * | 2019-06-18 | 2020-12-24 | 平安科技(深圳)有限公司 | 云服务器自检方法、装置、设备及计算机可读存储介质 |
CN111475372A (zh) * | 2020-03-10 | 2020-07-31 | 中国平安人寿保险股份有限公司 | 微服务的服务实例监控方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN114048098B (zh) | 2024-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10789118B2 (en) | Information processing device and error detection method | |
CN107995049B (zh) | 电力安全区跨区同步故障监测方法、装置和*** | |
CN113328872B (zh) | 故障修复方法、装置和存储介质 | |
CN109361548B (zh) | 一种基于主动安全的ims网络行为诊断预警方法及装置 | |
CN113687969A (zh) | 告警信息生成方法、装置、电子设备及可读存储介质 | |
CN108259202A (zh) | 一种ca监测预警方法和ca监测预警*** | |
US11582255B2 (en) | Dysfunctional device detection tool | |
CN112636979B (zh) | 一种集群告警方法及相关装置 | |
CN103378991A (zh) | 一种在线服务异常监测方法及其监测*** | |
CN112966056B (zh) | 一种信息处理方法、装置、设备、***及可读存储介质 | |
CN106385343B (zh) | 一种分布式***下监控客户端的方法及装置、分布式*** | |
CN110474821B (zh) | 节点故障检测方法及装置 | |
CN112000504A (zh) | 计算节点的故障处理方法及装置、电子设备 | |
CN103634166A (zh) | 一种设备存活检测方法及装置 | |
CN112615848B (zh) | 漏洞修复状态检测方法及*** | |
CN112713996B (zh) | 基于区块链的故障验证方法、服务器和终端 | |
CN114143225A (zh) | 基于网络探测技术的动态监测异常活跃地址的方法及装置 | |
CN112699369A (zh) | 一种通过栈回溯检测异常登录的方法及装置 | |
CN114048098B (zh) | 异常服务实例的监控方法及其装置 | |
US11153769B2 (en) | Network fault discovery | |
CN116074029A (zh) | 风险预测信息确定方法、装置、电子设备及存储介质 | |
CN113835954A (zh) | 一种动态网络安全监测方法、装置及设备 | |
CN107864057B (zh) | 一种基于联网状态的联机自动检查及告警方法 | |
CN113704049A (zh) | 服务器电源故障监控方法、装置及电子设备 | |
CN111506446B (zh) | 接口故障检测方法及服务器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20230731 Address after: Room 404-405, 504, Building B-17-1, Big data Industrial Park, Kecheng Street, Yannan High tech Zone, Yancheng, Jiangsu Province, 224000 Applicant after: Yancheng Tianyanchawei Technology Co.,Ltd. Address before: 224000 room 501-503, building b-17-1, Xuehai road big data Industrial Park, Kecheng street, Yannan high tech Zone, Yancheng City, Jiangsu Province (CNK) Applicant before: Yancheng Jindi Technology Co.,Ltd. |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant |