CN112491584A - 服务运行安全状况判定方法、装置、电子介质及存储介质 - Google Patents

服务运行安全状况判定方法、装置、电子介质及存储介质 Download PDF

Info

Publication number
CN112491584A
CN112491584A CN202011218311.7A CN202011218311A CN112491584A CN 112491584 A CN112491584 A CN 112491584A CN 202011218311 A CN202011218311 A CN 202011218311A CN 112491584 A CN112491584 A CN 112491584A
Authority
CN
China
Prior art keywords
service
log
level
determining
monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011218311.7A
Other languages
English (en)
Other versions
CN112491584B (zh
Inventor
陈元
聂心原
代静平
夏京
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beike Technology Co Ltd
Original Assignee
Beike Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beike Technology Co Ltd filed Critical Beike Technology Co Ltd
Priority to CN202011218311.7A priority Critical patent/CN112491584B/zh
Publication of CN112491584A publication Critical patent/CN112491584A/zh
Application granted granted Critical
Publication of CN112491584B publication Critical patent/CN112491584B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明实施例提供了一种服务运行安全状况判定方法、装置、电子设备及存储介质,包括:获取服务的日志数据,确定服务的日志记录的规范等级、确定服务的日志监控定位等级、确定服务的日志报警等级;根据所述服务的日志记录的规范等级、所述服务的日志监控定位等级和所述服务的日志报警等级中的一种或多种,进行服务的运行安全状况等级的判定。本实施例能够通过日志记录是否规范、监控以及定位能力接入是否完整、报警能力是否精准,从而及时精准的发现问题、快速定位问题以及解决问题,进而确定服务的运行安全状况。

Description

服务运行安全状况判定方法、装置、电子介质及存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种服务运行安全状况判定方法、装置、电子设备及存储介质。
背景技术
随着现代互联网行业的高速发展,大型互联网公司内部的***架构也越来越复杂,整体呈一个复杂的网状结构,随着微服务化、中台化等的推进,大的互联网企业往往有成千、甚至上万个微服务,这样规模的复杂***对于监控、定位等评估服务运行安全状况的手段要求很高,然而由于基础设施侧和业务侧之间存在信息不对称,即无法判定互联网公司企业级的服务运行安全状况,从而进行问题的发现和解决。
发明内容
针对现有技术中存在的问题,本发明实施例提供一种服务运行安全状况判定方法、装置、电子设备及存储介质。
第一方面,本发明实施例提供一种服务运行安全状况判定方法,包括:
获取服务的日志数据,确定所述服务的日志记录的规范等级;
获取服务的日志数据,确定所述服务的日志监控定位等级;
获取服务的日志数据,确定所述服务的日志报警等级;
根据所述服务的日志记录的规范等级、所述服务的日志监控定位等级和所述服务的日志报警等级中的一种或多种,进行所述服务的运行安全状况等级的判定。
进一步地,所述获取服务的日志数据,确定所述服务的日志记录的规范等级,包括:
根据所述服务的日志数据中是否有预设字段,确定所述服务的日志记录的规范等级;其中,所述预设字段为traceID字段、segmentID字段、logLevel字段和bltag字段中的一种或多种。
进一步地,所述获取服务的日志数据,确定所述服务的日志监控定位等级,包括:
根据所述服务的日志数据是否接入预设监控定位***,确定服务的日志监控定位等级;其中,所述预设监控定位***为天眼日志***、metric监控和ketrace监控中的一种或多种。
进一步地,所述获取服务的日志数据,确定所述服务的日志报警等级,包括:
根据所述服务的日志数据是否接入预设报警***,确定所述服务的日志报警等级;其中,所述预设报警***为CPS报警***和/或CMDB报警***。
进一步地,所述根据所述服务的日志数据中是否有预设字段,确定所述服务的日志记录的规范等级,包括:
根据所述服务的日志数据中是否有traceID字段、segmentID字段、logLevel字段和bltag字段中的一种或多种,按照第一关系模型确定所述服务的日志记录规范的量化参数值;
根据所述服务的日志记录规范的量化参数值,确定所述服务的日志记录的规范等级;
其中,所述第一关系模型为:
Q1=n1*g1+n2*g2+n3*g3+n4*g4
其中,Q1表示所述服务的日志记录规范的量化参数值,n1表示traceID字段对应的权重系数,g1表示traceID字段占日志数据的比例,n2表示segmentID字段对应的权重系数,g2表示segmentID字段占日志数据的比例,n3表示logLevel字段对应的权重系数,g3表示logLevel字段占日志数据的比例,n4表示bltag字段对应的权重系数,g4表示bltag字段占日志数据的比例。
进一步地,所述根据所述服务的日志数据是否接入预设监控定位***,确定所述服务的日志监控定位等级,包括:
根据所述服务的日志数据是否接入天眼日志***、metric监控和ketrace监控中的一种或多种,按照第二关系模型确定所述服务的日志监控定位的量化参数值;
根据所述服务的日志监控定位的量化参数值,确定所述服务的日志监控定位等级;
其中,所述第二关系模型为:
Q2=(m1+m11)+m2+m3
其中,Q2表示所述服务的日志监控定位的量化参数值,m1表示接入天眼日志***对应的量化参数值,m11表示接入天眼日志***并配置了查询任务及事件的量化参数值,m2表示接入metric监控对应的量化参数值,m3表示接入ketrace监控对应的量化参数值。
进一步地,所述根据所述服务的日志数据是否接入预设报警***,确定所述服务的日志报警等级,包括:
根据所述服务的日志数据是否接入CPS报警***和/或CMDB报警***,按照第三关系模型确定所述服务的日志报警的量化参数值;
根据所述服务的日志报警的量化参数值,确定所述服务的日志报警等级;
其中,所述第三关系模型为:
Q3=R1*E1+R2*E2
其中,Q3表示所述服务的日志报警的量化参数值,R1表示接入CPS报警***对应的量化参数值,E1表示接入CPS报警***并配置的处理人数,R2表示接入CMDB报警***对应的量化参数值,E2表示接入CMDB报警***并配置的处理人数。
第二方面,本发明实施例提供了一种服务运行安全状况判定装置,包括:
第一获取模块,用于获取服务的日志数据,确定所述服务的日志记录的规范等级;
第二获取模块,用于获取服务的日志数据,确定所述服务的日志监控定位等级;
第三获取模块,用于获取服务的日志数据,确定所述服务的日志报警等级;
判断模块,用于根据所述服务的日志记录的规范等级、所述服务的日志监控定位等级和所述服务的日志报警等级中的一种或多种,进行所述服务的运行安全状况等级的判定。
第三方面,本发明实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上第一方面所述的服务运行安全状况判定方法的步骤。
第四方面,本发明实施例还提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上第一方面所述的服务运行安全状况判定方法的步骤。
由上述技术方案可知,本发明实施例提供的服务运行安全状况判定方法、装置、电子设备及存储介质,能够获取服务的日志数据,进行服务的日志记录的规范等级的确定、能够获取服务的日志数据,进行服务的日志监控定位等级的确定、能够获取服务的日志数据,进行服务的日志报警等级的确定;根据所述服务的日志记录的规范等级、所述服务的日志监控定位等级和所述服务的日志报警等级中的一种或多种,进行服务的运行安全状况等级的判定,通过对日志记录是否规范、监控以及定位能力接入是否完整、报警能力是否精准进行判断,从而及时精准的发现问题、快速定位问题以及解决问题,进而确定服务的运行安全状况。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的服务运行安全状况判定方法的流程示意图;
图2为本发明一实施例提供的服务运行安全状况判定装置的结构示意图;
图3为本发明一实施例中电子设备的实体结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。在本实施例中,需要说明的是随着现代互联网行业的高速发展,大型互联网公司内部的***架构也越来越复杂,整体呈一个复杂的网状结构,随着微服务化、中台化等的推进,大的互联网企业往往有成千、甚至上万个微服务,这样规模的复杂***对于监控、定位等评估服务运行安全状况的手段要求很高,然而由于基础设施侧和业务侧之间存在信息不对称,即无法判定互联网公司企业级的服务运行安全状况,从而进行问题的发现和解决。比如说基础设施的团队已经有了很多很好的能力和实践,且对于业务监控定位的提效是有很大帮助的,但是推动起来非常困难,经常被怀疑;基础设施侧和业务侧之间存在信息不对称,业务同步不知道有哪些使用能力,同时基础设施也不知道业务侧同学用的是否合理,是否已经是最佳实践了。下面将通过具体的实施例对本发明提供的服务运行安全状况判定方法进行详细解释和说明。
在生产环境上,日志扮演着很重要的角色,排查异常需要日志,性能优化需要日志,业务监控以及定位需要日志,业务报警需要日志等等。然而生产上跑着成千上万个服务,每个服务都只会简单的本地存储,当需要日志排查问题时,很难找到日志所在的节点,也很难挖掘业务日志的数据价值。
图1为本发明一实施例提供的服务运行安全状况判定方法的流程示意图;如图1所示,该方法包括:
步骤101:获取服务的日志数据,确定服务的日志记录的规范等级。
在本步骤中,需要说明的是,在每个服务节点上埋点,实时采集相关日志数据,日志文件采集端可以使用filebeat,获取服务的日志数据后可以按照统一规则进行数据过滤、清洗,同时可以将清洗维度设为服务加时间,然后按照服务加时间的维度存入数据库。
在本步骤中,需要说明的是,通过日志数据能够确定日志记录的规范化程度,即日志记录的规范等级。举例来说,读取日志数据,根据日志数据中是否有预设字段,确定日志记录的规范等级,如规定三个预设字段,若日志数据V1中包含一个预设字段,则可以判定日志记录的规范等级为一级,若日志数据V2中包含两个预设字段,则可以判定日志记录的规范等级为二级,若日志数据V1中包含三个预设字段,则可以判定日志记录的规范等级为三级。
步骤102:获取服务的日志数据,确定服务的日志监控定位等级。
在本步骤中,需要说明的是,通过日志数据能够确定日志监控定位能力接入是否完整,即日志监控定位等级。举例来说,读取日志数据,根据日志数据中是否接入预设监控定位***,确定日志监控定位等级,如规定三个预设监控定位***,若项目Z1的日志数据V1中接入一个预设监控定位***,则可以判定日志监控定位等级为一级,若项目Z2的日志数据V2中接入两个预设监控定位***,则可以判定日志监控定位等级为二级,若项目Z3的日志数据V3中接入三个预设监控定位***,则可以判定日志监控定位等级为三级。
步骤103:获取服务的日志数据,确定服务的日志报警等级。
在本步骤中,需要说明的是,通过日志数据能够确定日志报警能力是否精准,即日志报警等级。举例来说,读取日志数据,根据日志数据中是否接入预设报警***,确定日志报警等级,如规定三个预设报警***,若项目P1的日志数据V1中接入一个预设报警***,则可以判定日志报警等级为一级,若项目P2的日志数据V2中接入两个预设报警***,则可以判定日志报警等级为二级,若项目P3的日志数据V3中接入三个预设报警***,则可以判定日志报警等级为三级。
步骤104:根据服务的日志记录的规范等级、服务的日志监控定位等级和服务的日志报警等级中的一种或多种,进行服务的运行安全状况等级的判定。
在本步骤中,可以理解的是,根据服务的日志记录的规范等级、服务的日志监控定位等级和服务的日志报警等级中的一种或多种,进行服务的运行安全状况等级的判定。可以采用日志记录的规范等级、日志监控定位等级和日志报警等级相加求和的方式确定服务的运行安全状况等级,也可以采用设置相应权重的方式确定服务的运行安全状况等级,还可以通过采用日志记录的规范等级、日志监控定位等级和日志报警等级相加求和,然后计算所落入的与服务的运行安全状况等级对应的范围来确定服务的运行安全状况等级,在本实施例中不作限定,如设定0~3为一级(服务的运行安全状况等级)、3~6为二级(服务的运行安全状况等级)、6~9为三级(服务的运行安全状况等级),一级(日志记录的规范等级)+一级(日志监控定位等级)+一级(日志报警等级)=3。
由上面技术方案可知,本发明实施例提供的服务运行安全状况判定方法,能够获取服务的日志数据,进行服务的日志记录的规范等级的确定、能够获取服务的日志数据,进行服务的日志监控定位等级的确定、能够获取服务的日志数据,进行服务的日志报警等级的确定;根据服务的日志记录的规范等级、服务的日志监控定位等级和服务的日志报警等级中的一种或多种,进行服务的运行安全状况等级的判定,通过对日志记录是否规范、监控以及定位能力接入是否完整、报警能力是否精准进行判断,从而及时精准的发现问题、快速定位问题以及解决问题,进而确定服务的运行安全状况。同时,由于本发明实施例提供的服务运行安全状况判定方法能够及时精准的发现问题、快速定位问题,使得无论是基础设施侧的负责人还是业务侧的负责人都可以及时确定出现问题的服务的归属,根据服务的归属进行该问题的解决,从而不会出现由于基础设施侧和业务侧之间存在信息不对称,导致问题得不到发现和解决的情况。
在上述实施例的基础上,在本实施例中,获取服务的日志数据,确定服务的日志记录的规范等级,包括:
根据服务的日志数据中是否有预设字段,确定服务的日志记录的规范等级;其中,预设字段为traceID字段、segmentID字段、logLevel字段和bltag字段中的一种或多种。
在本实施例中,举例来说,检查日志中有是否有traceID字段,可以根据项目在Fast中配置的所有事件,每个事件取最新的10000条日志,模糊匹配索引字段,如trace_id、traceId、traceid、xxx_traceId都算符合,即有traceID字段。
在本实施例中,举例来说,检查日志中有是否有segmentID字段,可以根据项目在Fast中配置的所有事件,每个事件取最新的10000条日志,模糊匹配索引字段,如segemtn_id、segmentId、segmentid、xxx_segmentId都算符合(日志采样规则同上),即有segmentID字段。
在本实施例中,举例来说,检查日志中有是否有logLevel字段,可以根据项目在Fast中配置的所有事件,每个事件取最新的10000条日志,模糊匹配索引字段,如log_level、logLevel、xxx_logLevel都算符合(日志采样规则同上),即有logLevel字段。
在本实施例中,举例来说,检查日志中有是否有bltag字段,可以根据项目在Fast中配置的所有事件,每个事件取最新的10000条日志,模糊匹配索引字段,如bltag、xxx_bltag都算符合(日志采样规则同上),即有bltag字段。
由上面技术方案可知,本发明实施例提供的服务运行安全状况判定方法,根据服务的日志数据中是否有预设字段,确定服务的日志记录的规范等级,能够更为准确的确定日志记录的规范等级。
在上述实施例的基础上,在本实施例中,获取服务的日志数据,确定服务的日志监控定位等级,包括:
根据服务的日志数据是否接入预设监控定位***,确定服务的日志监控定位等级;其中,预设监控定位***为天眼日志***、metric监控和ketrace监控中的一种或多种。
在本实施例中,举例来说,检查是否接入了FAST即天眼日志***,可以以至少将一个日志文件以数据流的形式接入天眼日志***下为标准。
在本实施例中,举例来说,检查是否接入了metric监控,可以以使用Hawk客户端上报metric,并且在Kemonitor的应用监控中存在该项目的应监控数据为标准。
在本实施例中,举例来说,检查是否接入了ketrace监控,可以以使用KeTrace客户端将链路信息上报KeTrace,在KeTrace中可以查询到该项目的链路为标准。
由上面技术方案可知,本发明实施例提供的服务运行安全状况判定方法,根据服务的日志数据是否接入预设监控定位***,确定服务的日志监控定位等级,能够更为准确的确定日志监控定位等级。
在上述实施例的基础上,在本实施例中,获取服务的日志数据,确定服务的日志报警等级,包括:
根据服务的日志数据是否接入预设报警***,确定服务的日志报警等级;其中,预设报警***为CPS报警***和/或CMDB报警***。
在本实施例中,举例来说,检查是否接入CPS报警***和/或CMDB报警***。进一步地可以检查是否接入预设报警***,并配置具体的RD(处理人),优选RD人员需要两人以上。
在本实施例中,还可以配置接入预设报警***外,还是否自行配置了报警规则数量,鼓励根据业务场景配置更丰富的报警规则,不鼓励将代码规范性的报警遗留至上线后再进行修复。规则可以为根据代码行数,不同的代码行数对应的报警规则条数不同,报警规则数量=天眼报警+metric报警。
在本实施例,基础上还可以检查代码规范,如不应该出现空指针,数组越界这样的报警,检查报警数量,设定预设报警数量阈值,防止报警风暴埋没有效报警。
由上面技术方案可知,本发明实施例提供的服务运行安全状况判定方法,根据服务的日志数据是否接入预设报警***,确定服务的日志报警等级,能够更为准确的确定日志报警等级。
在上述实施例的基础上,在本实施例中,根据服务的日志数据中是否有预设字段,确定服务的日志记录的规范等级,包括:
根据服务的日志数据中是否有traceID字段、segmentID字段、logLevel字段和bltag字段中的一种或多种,按照第一关系模型确定服务的日志记录规范的量化参数值;
根据服务的日志记录规范的量化参数值,确定服务的日志记录的规范等级;
其中,第一关系模型为:
Q1=n1*g1+n2*g2+n3*g3+n4*g4
其中,Q1表示服务的日志记录规范的量化参数值,n1表示traceID字段对应的权重系数,g1表示traceID字段占日志数据的比例,n2表示segmentID字段对应的权重系数,g2表示segmentID字段占日志数据的比例,n3表示logLevel字段对应的权重系数,g3表示logLevel字段占日志数据的比例,n4表示bltag字段对应的权重系数,g4表示bltag字段占日志数据的比例。
在本实施例中,针对bltag字段需要说明的是:
①、日志中打印bltag(日志类型),bltag中有request_out类型并且有errorno和errormsg字段,主要是在使用request_out规则的基础上强化状态码及说明字段,(日志采样规则同上)存在bltag字段,且bltag里有request_out类型,且存在request_out类型的日志里有errorno和errormsg字段的时候。
②、bltag中有http_fail类型并且有errorno和errormsg字段,主要是在使用http_fail规则的基础上强化状态码及说明字段,(日志采样规则同上)存在bltag字段,且bltag里有http_fail类型,且存在http_fail类型的日志里有errorno和errormsg字段的时候。
③、bltag中有dubbo_fail类型并且有errorno和errormsg字段,主要是在使用dubbo_fail规则的基础上强化状态码及说明字段,(日志采样规则同上)存在bltag字段,且bltag里有dubbo_fail类型,且存在http_fail类型的日志里有errorno和errormsg字段的时候。
在本实例中,需要说明的是,设置服务的日志记录的规范等级对应的服务的日志记录规范的量化参数值范围,从而根据第一关系模型计算得到的服务的日志记录规范的量化参数值,确定落在哪个范围内,然后确定服务的日志记录的规范等级。
在本实施例中,举例来说,检查日志中有是否有traceID字段,可以根据项目在Fast中配置的所有事件,每个事件取最新的10000条日志,模糊匹配索引字段,如trace_id、traceId、traceid、xxx_traceId都算符合,统计符合条件的索引字段占全部日志的比例,如检查结果:符合条件的索引字段占全部日志的比例为25%,配置traceID字段对应的权重系数0.4。
检查日志中有是否有segmentID字段,可以根据项目在Fast中配置的所有事件,每个事件取最新的10000条日志,模糊匹配索引字段,如segemtn_id、segmentId、segmentid、xxx_segmentId都算符合,统计符合条件的索引字段占全部日志的比例,如检查结果:符合条件的索引字段占全部日志的比例为25%,配置traceID字段对应的权重系数0.2。
检查日志中有是否有logLevel字段,可以根据项目在Fast中配置的所有事件,每个事件取最新的10000条日志,模糊匹配索引字段,如log_level、logLevel、xxx_logLevel都算符合,统计符合条件的索引字段占全部日志的比例,如检查结果:符合条件的索引字段占全部日志的比例为25%,配置traceID字段对应的权重系数0.2。
检查日志中有是否有bltag字段,可以根据项目在Fast中配置的所有事件,每个事件取最新的10000条日志,模糊匹配索引字段,如bltag、xxx_bltag都算符合,统计符合条件的索引字段占全部日志的比例,如检查结果:符合条件的索引字段占全部日志的比例为25%,配置traceID字段对应的权重系数0.2。
按第一关系模型计算:Q1=0.4*0.25+0.2*0.25+0.2*0.25+0.2*0.25=0.25,即服务的日志记录规范的量化参数值为0.25,确定落在哪个范围内,若0.25落在三级(日志记录的规范等级),然后确定服务的日志记录的规范等级为三级。
由上面技术方案可知,本发明实施例提供的服务运行安全状况判定方法,能够更为准确的确定服务的日志记录的规范等级。
在上述实施例的基础上,在本实施例中,根据服务的日志数据是否接入预设监控定位***,确定服务的日志监控定位等级,包括:
根据服务的日志数据是否接入天眼日志***、metric监控和ketrace监控中的一种或多种,按照第二关系模型确定服务的日志监控定位的量化参数值;
根据服务的日志监控定位的量化参数值,确定服务的日志监控定位等级;
其中,第二关系模型为:
Q2=(m1+m11)+m2+m3
其中,Q2表示服务的日志监控定位的量化参数值,m1表示接入天眼日志***对应的量化参数值,m11表示接入天眼日志***并配置了查询任务及事件的量化参数值,m2表示接入metric监控对应的量化参数值,m3表示接入ketrace监控对应的量化参数值。
在本实例中,需要说明的是,设置服务的日志监控定位等级对应的服务的日志监控定位的量化参数值,从而根据第二关系模型计算得到的服务的日志监控定位的量化参数值,确定落在哪个范围内,然后确定服务的日志监控定位等级。
在本实施例中,需要说明的是,接入天眼日志***后,考察是否配置了相应的任务及事件,是否具备日志查询条件,可以以该项目在天眼日志***中配置至少一个任务和一个事件为标准。
在本实施例中,举例来说,若服务J1的日志数据接入天眼日志***对应的量化参数值25,服务J1的日志数据接入天眼日志***并配置了一个任务和一个事件的量化参数值25,服务J1的日志数据接入metric监控对应的量化参数值25,服务J1的日志数据接入ketrace监控对应的量化参数值25,则按第二关系模型计算:Q2=(25+25)+25+25=100,即服务的日志记录规范的量化参数值为100,确定落在哪个范围内,若100落在二级(日志监控定位等级),然后确定服务的日志记录的规范等级为二级。
由上面技术方案可知,本发明实施例提供的服务运行安全状况判定方法,能够更为准确的确定服务的日志监控定位等级。
在上述实施例的基础上,在本实施例中,根据服务的日志数据是否接入预设报警***,确定服务的日志报警等级,包括:
根据服务的日志数据是否接入CPS报警***和/或CMDB报警***,按照第三关系模型确定服务的日志报警的量化参数值;
根据服务的日志报警的量化参数值,确定服务的日志报警等级;
其中,第三关系模型为:
Q3=R1*E1+R2*E2
其中,Q3表示服务的日志报警的量化参数值,R1表示接入CPS报警***对应的量化参数值,E1表示接入CPS报警***并配置的处理人数,R2表示接入CMDB报警***对应的量化参数值,E2表示接入CMDB报警***并配置的处理人数。
在本实例中,需要说明的是,设置服务的日志监控定位等级对应的服务的日志监控定位的量化参数值,从而根据第三关系模型计算得到的服务的日志监控定位的量化参数值,确定落在哪个范围内,然后确定服务的日志报警等级。
在本实施例中,举例来说,若服务J2的日志数据接入CPS报警***对应的量化参数值25,服务J2的日志数据接入CPS报警***并配置的处理人数2,服务J2的日志数据未接入CMDB报警***,对应的量化参数值0,则按第三关系模型计算:Q3=25*2+0*0=50,即服务的日志记录规范的量化参数值为50,确定落在哪个范围内,若50落在一级(日志报警等级),然后确定服务的日志记录的规范等级为一级。
由上面技术方案可知,本发明实施例提供的服务运行安全状况判定方法,能够更为准确的确定服务的日志报警等级。
图2为本发明一实施例提供的服务运行安全状况判定装置的结构示意图,如图2所示,该装置包括:第一获取模块201、第二获取模块202、第三获取模块203和判断模块204,其中:
其中,第一获取模块201,用于获取服务的日志数据,确定服务的日志记录的规范等级;
第二获取模块202,用于获取服务的日志数据,确定服务的日志监控定位等级;
第三获取模块203,用于获取服务的日志数据,确定服务的日志报警等级;
判断模块204,用于用于根据服务的日志记录的规范等级、服务的日志监控定位等级和服务的日志报警等级中的一种或多种,进行服务的运行安全状况等级的判定。
进一步地,第一获取模块201,具体用于:
根据服务的日志数据中是否有预设字段,确定服务的日志记录的规范等级;其中,预设字段为traceID字段、segmentID字段、logLevel字段和bltag字段中的一种或多种。
进一步地,第二获取模块202,具体用于:
根据服务的日志数据是否接入预设监控定位***,确定服务的日志监控定位等级;其中,预设监控定位***为天眼日志***、metric监控和ketrace监控中的一种或多种。
进一步地,第三获取模块203,具体用于:
根据服务的日志数据是否接入预设报警***,确定服务的日志报警等级;其中,预设报警***为CPS报警***和/或CMDB报警***。
进一步地,第一获取模块201在根据服务的日志数据中是否有预设字段,确定服务的日志记录的规范等级时,具体用于:
根据服务的日志数据中是否有traceID字段、segmentID字段、logLevel字段和bltag字段中的一种或多种,按照第一关系模型确定服务的日志记录规范的量化参数值;
根据服务的日志记录规范的量化参数值,确定服务的日志记录的规范等级;
其中,第一关系模型为:
Q1=n1*g1+n2*g2+n3*g3+n4*g4
其中,Q1表示服务的日志记录规范的量化参数值,n1表示traceID字段对应的权重系数,g1表示traceID字段占日志数据的比例,n2表示segmentID字段对应的权重系数,g2表示segmentID字段占日志数据的比例,n3表示logLevel字段对应的权重系数,g3表示logLevel字段占日志数据的比例,n4表示bltag字段对应的权重系数,g4表示bltag字段占日志数据的比例。
进一步地,第二获取模块202在根据服务的日志数据是否接入预设监控定位***,确定服务的日志监控定位等级时,具体用于:
根据服务的日志数据是否接入天眼日志***、metric监控和ketrace监控中的一种或多种,按照第二关系模型确定服务的日志监控定位的量化参数值;
根据服务的日志监控定位的量化参数值,确定服务的日志监控定位等级;
其中,第二关系模型为:
Q2=(m1+m11)+m2+m3
其中,Q2表示服务的日志监控定位的量化参数值,m1表示接入天眼日志***对应的量化参数值,m11表示接入天眼日志***并配置了查询任务及事件的量化参数值,m2表示接入metric监控对应的量化参数值,m3表示接入ketrace监控对应的量化参数值。
进一步地,第三获取模块203在根据服务的日志数据是否接入预设报警***,确定服务的日志报警等级时,具体用于:
根据服务的日志数据是否接入CPS报警***和/或CMDB报警***,按照第三关系模型确定服务的日志报警的量化参数值;
根据服务的日志报警的量化参数值,确定服务的日志报警等级;
其中,第三关系模型为:
Q3=R1*E1+R2*E2
其中,Q3表示服务的日志报警的量化参数值,R1表示接入CPS报警***对应的量化参数值,E1表示接入CPS报警***并配置的处理人数,R2表示接入CMDB报警***对应的量化参数值,E2表示接入CMDB报警***并配置的处理人数。
本发明实施例提供的服务运行安全状况判定装置具体可以用于执行上述实施例的服务运行安全状况判定方法,其技术原理和有益效果类似,具体可参见上述实施例,此处不再赘述。
基于相同的发明构思,本发明实施例提供一种电子设备,参见图3,电子设备具体包括如下内容:处理器301、通信接口303、存储器302和通信总线304;
其中,处理器301、通信接口303、存储器302通过通信总线304完成相互间的通信;通信接口303用于实现各建模软件及智能制造装备模块库等相关设备之间的信息传输;处理器301用于调用存储器302中的计算机程序,处理器执行计算机程序时实现上述各方法实施例所提供的方法,例如,处理器执行计算机程序时实现下述步骤:获取服务的日志数据,确定服务的日志记录的规范等级;获取服务的日志数据,确定服务的日志监控定位等级;获取服务的日志数据,确定服务的日志报警等级;根据服务的日志记录的规范等级、服务的日志监控定位等级和服务的日志报警等级中的一种或多种,进行服务的运行安全状况等级的判定。
基于相同的发明构思,本发明又一实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法实施例提供的方法,例如,获取服务的日志数据,确定服务的日志记录的规范等级;获取服务的日志数据,确定服务的日志监控定位等级;获取服务的日志数据,确定服务的日志报警等级;根据服务的日志记录的规范等级、服务的日志监控定位等级和服务的日志报警等级中的一种或多种,进行服务的运行安全状况等级的判定。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分的方法。
此外,在本发明中,诸如“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
此外,在本发明中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
此外,在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种服务运行安全状况判定方法,其特征在于,包括:
获取服务的日志数据,确定所述服务的日志记录的规范等级;
获取服务的日志数据,确定所述服务的日志监控定位等级;
获取服务的日志数据,确定所述服务的日志报警等级;
根据所述服务的日志记录的规范等级、所述服务的日志监控定位等级和所述服务的日志报警等级中的一种或多种,进行所述服务的运行安全状况等级的判定。
2.根据权利要求1所述的方法,其特征在于,所述获取服务的日志数据,确定所述服务的日志记录的规范等级,包括:
根据所述服务的日志数据中是否有预设字段,确定所述服务的日志记录的规范等级;其中,所述预设字段为traceID字段、segmentID字段、logLevel字段和bltag字段中的一种或多种。
3.根据权利要求1所述的方法,其特征在于,所述获取服务的日志数据,确定所述服务的日志监控定位等级,包括:
根据所述服务的日志数据是否接入预设监控定位***,确定服务的日志监控定位等级;其中,所述预设监控定位***为天眼日志***、metric监控和ketrace监控中的一种或多种。
4.根据权利要求1所述的方法,其特征在于,所述获取服务的日志数据,确定所述服务的日志报警等级,包括:
根据所述服务的日志数据是否接入预设报警***,确定所述服务的日志报警等级;其中,所述预设报警***为CPS报警***和/或CMDB报警***。
5.根据权利要求2所述的方法,其特征在于,所述根据所述服务的日志数据中是否有预设字段,确定所述服务的日志记录的规范等级,包括:
根据所述服务的日志数据中是否有traceID字段、segmentID字段、logLevel字段和bltag字段中的一种或多种,按照第一关系模型确定所述服务的日志记录规范的量化参数值;
根据所述服务的日志记录规范的量化参数值,确定所述服务的日志记录的规范等级;
其中,所述第一关系模型为:
Q1=n1*g1+n2*g2+n3*g3+n4*g4
其中,Q1表示所述服务的日志记录规范的量化参数值,n1表示traceID字段对应的权重系数,g1表示traceID字段占日志数据的比例,n2表示segmentID字段对应的权重系数,g2表示segmentID字段占日志数据的比例,n3表示logLevel字段对应的权重系数,g3表示logLevel字段占日志数据的比例,n4表示bltag字段对应的权重系数,g4表示bltag字段占日志数据的比例。
6.根据权利要求3所述的方法,其特征在于,所述根据所述服务的日志数据是否接入预设监控定位***,确定所述服务的日志监控定位等级,包括:
根据所述服务的日志数据是否接入天眼日志***、metric监控和ketrace监控中的一种或多种,按照第二关系模型确定所述服务的日志监控定位的量化参数值;
根据所述服务的日志监控定位的量化参数值,确定所述服务的日志监控定位等级;
其中,所述第二关系模型为:
Q2=(m1+m11)+m2+m3
其中,Q2表示所述服务的日志监控定位的量化参数值,m1表示接入天眼日志***对应的量化参数值,m11表示接入天眼日志***并配置了查询任务及事件的量化参数值,m2表示接入metric监控对应的量化参数值,m3表示接入ketrace监控对应的量化参数值。
7.根据权利要求4所述的方法,其特征在于,所述根据所述服务的日志数据是否接入预设报警***,确定所述服务的日志报警等级,包括:
根据所述服务的日志数据是否接入CPS报警***和/或CMDB报警***,按照第三关系模型确定所述服务的日志报警的量化参数值;
根据所述服务的日志报警的量化参数值,确定所述服务的日志报警等级;
其中,所述第三关系模型为:
Q3=R1*E1+R2*E2
其中,Q3表示所述服务的日志报警的量化参数值,R1表示接入CPS报警***对应的量化参数值,E1表示接入CPS报警***并配置的处理人数,R2表示接入CMDB报警***对应的量化参数值,E2表示接入CMDB报警***并配置的处理人数。
8.一种服务运行安全状况判定装置,其特征在于,包括:
第一获取模块,用于获取服务的日志数据,确定所述服务的日志记录的规范等级;
第二获取模块,用于获取服务的日志数据,确定所述服务的日志监控定位等级;
第三获取模块,用于获取服务的日志数据,确定所述服务的日志报警等级;
判断模块,用于根据所述服务的日志记录的规范等级、所述服务的日志监控定位等级和所述服务的日志报警等级中的一种或多种,进行所述服务的运行安全状况等级的判定。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述的服务运行安全状况判定方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至7任一项所述的服务运行安全状况判定方法的步骤。
CN202011218311.7A 2020-11-04 2020-11-04 服务运行安全状况判定方法、装置、电子介质及存储介质 Active CN112491584B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011218311.7A CN112491584B (zh) 2020-11-04 2020-11-04 服务运行安全状况判定方法、装置、电子介质及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011218311.7A CN112491584B (zh) 2020-11-04 2020-11-04 服务运行安全状况判定方法、装置、电子介质及存储介质

Publications (2)

Publication Number Publication Date
CN112491584A true CN112491584A (zh) 2021-03-12
CN112491584B CN112491584B (zh) 2022-05-20

Family

ID=74928052

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011218311.7A Active CN112491584B (zh) 2020-11-04 2020-11-04 服务运行安全状况判定方法、装置、电子介质及存储介质

Country Status (1)

Country Link
CN (1) CN112491584B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114915488A (zh) * 2022-06-15 2022-08-16 中国联合网络通信集团有限公司 流计算监控方法和设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100235494A1 (en) * 2009-03-16 2010-09-16 Microsoft Corporation Flexible logging, such as for a web server
CN107678908A (zh) * 2017-06-23 2018-02-09 平安科技(深圳)有限公司 日志记录方法、装置、计算机设备及存储介质
CN110535722A (zh) * 2019-08-27 2019-12-03 江苏瑞中数据股份有限公司 一种跨安全区域的微服务全链路运行监控方法
CN110851396A (zh) * 2019-11-07 2020-02-28 北京集奥聚合科技有限公司 一种基于建模平台微服务架构统一日志设计方法
CN110912757A (zh) * 2019-12-24 2020-03-24 聚好看科技股份有限公司 业务的监控方法和服务器

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100235494A1 (en) * 2009-03-16 2010-09-16 Microsoft Corporation Flexible logging, such as for a web server
CN107678908A (zh) * 2017-06-23 2018-02-09 平安科技(深圳)有限公司 日志记录方法、装置、计算机设备及存储介质
CN110535722A (zh) * 2019-08-27 2019-12-03 江苏瑞中数据股份有限公司 一种跨安全区域的微服务全链路运行监控方法
CN110851396A (zh) * 2019-11-07 2020-02-28 北京集奥聚合科技有限公司 一种基于建模平台微服务架构统一日志设计方法
CN110912757A (zh) * 2019-12-24 2020-03-24 聚好看科技股份有限公司 业务的监控方法和服务器

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114915488A (zh) * 2022-06-15 2022-08-16 中国联合网络通信集团有限公司 流计算监控方法和设备

Also Published As

Publication number Publication date
CN112491584B (zh) 2022-05-20

Similar Documents

Publication Publication Date Title
CN110166264B (zh) 一种故障定位方法、装置及电子设备
US10031829B2 (en) Method and system for it resources performance analysis
CN107239458B (zh) 基于大数据推算开发对象关系的方法及装置
CN112162878A (zh) 数据库故障发现方法、装置、电子设备及存储介质
CN108197261A (zh) 一种智慧交通操作***
CN105516130A (zh) 一种数据处理方法和装置
CN110825757A (zh) 一种设备行为风险分析方法及***
CN110457175B (zh) 业务数据处理方法、装置、电子设备及介质
CN111125056A (zh) 一种信息***数据库自动化运维***及其运维方法
CN105468765A (zh) 一种多节点web服务异常检测方法和***
CN114338372B (zh) 网络信息安全监控方法及***
CN112491584B (zh) 服务运行安全状况判定方法、装置、电子介质及存储介质
CN116663747B (zh) 一种基于数据中心基础设施的智能预警方法及***
CN106951360B (zh) 数据统计完整度计算方法和***
CN117312290A (zh) 一种提高异构***数据质量的方法
CN116436659A (zh) 一种网络安全威胁的量化分析方法及装置
CN114116391A (zh) Redis实例的健康检测方法、装置、设备及存储介质
CN114331055A (zh) 企业安全生产风险预警方法、装置、设备和存储介质
CN117349502A (zh) 一种基于互联网数据中心的运维数据查询分析方法及***
CN116380228A (zh) 衡器运行监测方法、***、终端及存储介质
CN114531338A (zh) 一种基于调用链数据的监控告警和溯源方法及***
CN115480997A (zh) 一种指标异常的告警方法、装置、电子设备及存储介质
CN112765553A (zh) 一种基于大数据的工程项目管理***
US20240036963A1 (en) Multi-contextual anomaly detection
Teggi et al. AIOPS Prediction for server stability based on ARIMA model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant