CN114500306B - 一种基于维度的监控服务自动采样验证方法 - Google Patents

一种基于维度的监控服务自动采样验证方法 Download PDF

Info

Publication number
CN114500306B
CN114500306B CN202111569120.XA CN202111569120A CN114500306B CN 114500306 B CN114500306 B CN 114500306B CN 202111569120 A CN202111569120 A CN 202111569120A CN 114500306 B CN114500306 B CN 114500306B
Authority
CN
China
Prior art keywords
service
gateway
alarm
view angle
monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111569120.XA
Other languages
English (en)
Other versions
CN114500306A (zh
Inventor
陈冬君
赵亮
赵刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Secco Travel Technology Service Co ltd
Original Assignee
Shanghai Secco Travel Technology Service Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Secco Travel Technology Service Co ltd filed Critical Shanghai Secco Travel Technology Service Co ltd
Priority to CN202111569120.XA priority Critical patent/CN114500306B/zh
Publication of CN114500306A publication Critical patent/CN114500306A/zh
Application granted granted Critical
Publication of CN114500306B publication Critical patent/CN114500306B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/02Capturing of monitoring data
    • H04L43/022Capturing of monitoring data by sampling
    • H04L43/024Capturing of monitoring data by sampling by adaptive sampling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/04Processing captured monitoring data, e.g. for logfile generation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/22Parsing or analysis of headers

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Security & Cryptography (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明属于服务监控技术领域,具体公开了一种基于维度的监控服务自动采样验证方法,包括以下步骤:S1:对rpc服务号、消息号进行唯一编码;S2:对每个rpc服务按采样周期上传采样数据;S3:数据接收网关把rpc调用状态信息、***信息转发到性能数据接收服务器,根据类别视角解析rpc调用状态信息;S4:数据接收网关把主动报警信息转到报警接收服务;S5:报警接收服务收到主动报警信息,解析保存到报警数据库中;S6:监控大盘访问监控网关服务,监控网关服务调用性能服务,返回不同视角的性能曲线;S7:健康探测服务探测报警接收服务是否可用,健康探测服务通过http方式调用每个服务提供的health接口,对探测失败的服务调用报警接收服务接口进行报警。

Description

一种基于维度的监控服务自动采样验证方法
技术领域
本发明涉及服务监控技术领域,具体为一种基于维度的监控服务自动采样验证方法。
背景技术
随着微服务的快速普及,服务在线上部署的规模不断扩大,同时,暴露的问题也越来越多,需要对应用服务采集数据进行***的监控。目前业界对于服务监控的模型方法,对监控服务维度没有分类,不能快速排查出问题出在哪个环节,因此,提出一种基于维度的监控服务自动采样验证方法。
发明内容
本发明的目的在于提供一种基于维度的监控服务自动采样验证方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种基于维度的监控服务自动采样验证方法,包括以下步骤:
S1:对rpc服务号、消息号进行唯一编码;
S2:对每个rpc服务按采样周期上传采样数据;
S3:数据接收网关把rpc调用状态信息、***信息转发到性能数据接收服务器,性能数据接收服务器根据类别视角解析rpc调用状态信息,解析处理完成后数据保存到性能统计数据库;性能服务处理性能统计数据库中新增数据,根据统计数据,上报报警接收服务;
S4:数据接收网关把主动报警信息转到报警接收服务;
S5:报警接收服务收到主动报警信息,解析处理后数据保存到报警数据库中;报警服务发现报警数据库有新的主动报警信息,进行报警通知;
S6:监控大盘通过传递不同参数访问监控网关服务,监控网关服务调用性能服务,返回不同视角的性能曲线;可以快速排查问题是出在对应的哪个环节;
S7:健康探测服务每隔1分钟去探测报警接收服务是否可用,健康探测服务通过http方式调用每个服务提供的health接口,对探测失败的服务调用报警接收服务接口进行报警。
作为本发明一种优选的技术方案,所述S2中采样周期为1分钟。
作为本发明一种优选的技术方案,所述S2中上传采样数据格式为顶层结构、二层结构消息数组以及三层结构错误码的数量;其中,所述顶层结构包括时间戳、ip、服务号、服务名称以及消息数组;所述二层结构消息数组包括类别、统计时间戳、服务号、消息号、成功数量、失败数量、超时数量、耗时时间段的数量数组、错误码的数量数组、最小耗时、最大耗时以及平均耗时;所述三层结构错误码的数量包括错误码以及数组。
作为本发明一种优选的技术方案,所述类别包括服务端、调用端以及网关。
作为本发明一种优选的技术方案,所述S6中的视角包括服务方视角、调用方视角以及网关视角;
所述服务方视角即从服务端统计服务对外接口情况,有服务业务量曲线、服务耗时曲线、服务平均耗时曲线;
所述调用方视角即从调用端统计服务对外接口的情况,调用业务量曲线、调用耗时曲线、调用平均耗时曲线;
所述网关视角即从网关统计对外接口的调用情况,网关业务量曲线、网关耗时曲线、网关平均耗时曲线。
与现有技术相比,本发明的有益效果是:
本发明中监控服务维度分为网关、服务端以及调用端三类,服务提供方对网关、服务端以及调用端进行分别统计,可以快速排查问题是出在对应的哪个环节,且能够为业务线提供***的性能指标、健康状况以及监控告警。
附图说明
图1为本发明一种基于维度的监控服务自动采样验证方法的流程图;
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,本发明提供一种技术方案:一种基于维度的监控服务自动采样验证方法,包括以下步骤:
S1:对rpc服务号、消息号进行唯一编码;
S2:对每个rpc服务按采样周期上传采样数据;
S3:数据接收网关把rpc调用状态信息、***信息转发到性能数据接收服务器,性能数据接收服务器根据类别视角解析rpc调用状态信息,解析处理完成后数据保存到性能统计数据库;性能服务处理性能统计数据库中新增数据,根据统计数据,上报报警接收服务;
S4:数据接收网关把主动报警信息转到报警接收服务;
S5:报警接收服务收到主动报警信息,解析处理后数据保存到报警数据库中;报警服务发现报警数据库有新的主动报警信息,进行报警通知;
S6:监控大盘通过传递不同参数访问监控网关服务,监控网关服务调用性能服务,返回不同视角的性能曲线;可以快速排查问题是出在对应的哪个环节;
S7:健康探测服务每隔1分钟去探测报警接收服务是否可用,健康探测服务通过http方式调用每个服务提供的health接口,对探测失败的服务调用报警接收服务接口进行报警。
进一步的,所述S2中采样周期为1分钟。
进一步的,所述S2中上传采样数据格式为顶层结构、二层结构消息数组以及三层结构错误码的数量;其中,所述顶层结构包括时间戳、ip、服务号、服务名称以及消息数组;所述二层结构消息数组包括类别、统计时间戳、服务号、消息号、成功数量、失败数量、超时数量、耗时时间段的数量数组、错误码的数量数组、最小耗时、最大耗时以及平均耗时;所述三层结构错误码的数量包括错误码以及数组。
进一步的,所述类别包括服务端、调用端以及网关。
进一步的,所述S6中的视角包括服务方视角、调用方视角以及网关视角;
所述服务方视角即从服务端统计服务对外接口情况,有服务业务量曲线、服务耗时曲线、服务平均耗时曲线;
所述调用方视角即从调用端统计服务对外接口的情况,调用业务量曲线、调用耗时曲线、调用平均耗时曲线;
所述网关视角即从网关统计对外接口的调用情况,网关业务量曲线、网关耗时曲线、网关平均耗时曲线。
本发明中监控服务维度分为网关、服务端以及调用端三类,服务提供方对网关、服务端以及调用端进行分别统计,可以快速排查问题是出在对应的哪个环节,且能够为业务线提供***的性能指标、健康状况以及监控告警。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (5)

1.一种基于维度的监控服务自动采样验证方法,其特征在于,包括以下步骤:
S1:对rpc服务号、消息号进行唯一编码;
S2:对每个rpc服务按采样周期上传采样数据;
S3:数据接收网关把rpc调用状态信息、***信息转发到性能数据接收服务器,性能数据接收服务器根据类别视角解析rpc调用状态信息,解析处理完成后数据保存到性能统计数据库;性能服务处理性能统计数据库中新增数据,根据统计数据,上报报警接收服务;
S4:数据接收网关把主动报警信息转到报警接收服务;
S5:报警接收服务收到主动报警信息,解析处理后数据保存到报警数据库中;报警服务发现报警数据库有新的主动报警信息,进行报警通知;
S6:监控大盘通过传递不同参数访问监控网关服务,监控网关服务调用性能服务,返回不同视角的性能曲线;可以快速排查问题是出在对应的哪个环节;
S7:健康探测服务每隔1分钟去探测报警接收服务是否可用,健康探测服务通过http方式调用每个服务提供的health接口,对探测失败的服务调用报警接收服务接口进行报警。
2.根据权利要求1所述的一种基于维度的监控服务自动采样验证方法,其特征在于:所述S2中采样周期为1分钟。
3.根据权利要求1所述的一种基于维度的监控服务自动采样验证方法,其特征在于:所述S2中上传采样数据格式为顶层结构、二层结构消息数组以及三层结构错误码的数量;其中,所述顶层结构包括时间戳、ip、服务号、服务名称以及消息数组;所述二层结构消息数组包括类别、统计时间戳、服务号、消息号、成功数量、失败数量、超时数量、耗时时间段的数量数组、错误码的数量数组、最小耗时、最大耗时以及平均耗时;所述三层结构错误码的数量包括错误码以及数组。
4.根据权利要求3所述的一种基于维度的监控服务自动采样验证方法,其特征在于:所述类别包括服务端、调用端以及网关。
5.根据权利要求1所述的一种基于维度的监控服务自动采样验证方法,其特征在于:所述S6中的视角包括服务方视角、调用方视角以及网关视角;
所述服务方视角即从服务端统计服务对外接口情况,有服务业务量曲线、服务耗时曲线、服务平均耗时曲线;
所述调用方视角即从调用端统计服务对外接口的情况,调用业务量曲线、调用耗时曲线、调用平均耗时曲线;
所述网关视角即从网关统计对外接口的调用情况,网关业务量曲线、网关耗时曲线、网关平均耗时曲线。
CN202111569120.XA 2021-12-21 2021-12-21 一种基于维度的监控服务自动采样验证方法 Active CN114500306B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111569120.XA CN114500306B (zh) 2021-12-21 2021-12-21 一种基于维度的监控服务自动采样验证方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111569120.XA CN114500306B (zh) 2021-12-21 2021-12-21 一种基于维度的监控服务自动采样验证方法

Publications (2)

Publication Number Publication Date
CN114500306A CN114500306A (zh) 2022-05-13
CN114500306B true CN114500306B (zh) 2024-01-09

Family

ID=81494768

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111569120.XA Active CN114500306B (zh) 2021-12-21 2021-12-21 一种基于维度的监控服务自动采样验证方法

Country Status (1)

Country Link
CN (1) CN114500306B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103248511A (zh) * 2012-02-14 2013-08-14 金蝶软件(中国)有限公司 一种单点业务性能的分析方法、装置和***
CN109903175A (zh) * 2019-03-26 2019-06-18 众安在线财产保险股份有限公司 一种保险核心***监控平台
CN110581773A (zh) * 2018-06-07 2019-12-17 北京怡合春天科技有限公司 一种自动化服务监控与报警管理***
CN110635938A (zh) * 2019-08-19 2019-12-31 腾讯科技(深圳)有限公司 一种监控方法、***、设备及介质
CN111324538A (zh) * 2020-02-20 2020-06-23 上海赛可出行科技服务有限公司 一种基于动态路由的微服务并行测试环境管理方法
CN112769622A (zh) * 2021-01-18 2021-05-07 孙冬英 一种基于rpc服务监控的集群服务故障预警***
CN113160024A (zh) * 2021-04-30 2021-07-23 中国银行股份有限公司 基于微服务架构的业务管理***及方法
CN113778985A (zh) * 2021-08-19 2021-12-10 上海东普信息科技有限公司 微服务架构监控方法、装置、计算机设备和存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10585682B2 (en) * 2016-08-05 2020-03-10 Oracle International Corporation Tenant self-service troubleshooting for a multi-tenant identity and data security management cloud service

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103248511A (zh) * 2012-02-14 2013-08-14 金蝶软件(中国)有限公司 一种单点业务性能的分析方法、装置和***
CN110581773A (zh) * 2018-06-07 2019-12-17 北京怡合春天科技有限公司 一种自动化服务监控与报警管理***
CN109903175A (zh) * 2019-03-26 2019-06-18 众安在线财产保险股份有限公司 一种保险核心***监控平台
CN110635938A (zh) * 2019-08-19 2019-12-31 腾讯科技(深圳)有限公司 一种监控方法、***、设备及介质
CN111324538A (zh) * 2020-02-20 2020-06-23 上海赛可出行科技服务有限公司 一种基于动态路由的微服务并行测试环境管理方法
CN112769622A (zh) * 2021-01-18 2021-05-07 孙冬英 一种基于rpc服务监控的集群服务故障预警***
CN113160024A (zh) * 2021-04-30 2021-07-23 中国银行股份有限公司 基于微服务架构的业务管理***及方法
CN113778985A (zh) * 2021-08-19 2021-12-10 上海东普信息科技有限公司 微服务架构监控方法、装置、计算机设备和存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
一种基于执行轨迹监测的微服务故障诊断方法;王子勇;王焘;张文博;陈宁江;左春;;《软件学报》(2017年第06期);第1435-1454页 *
基于微服务架构的应用性能监控平台研究;田兵;王玮;苏琦;刘荫;殷齐林;郭爽爽;;《信息技术与信息化》(2018年第01期);第125-128页 *
面向PDM***的微服务架构研究;彭建巍;《中国优秀硕士学位论文全文数据库(信息科技辑)》(第2020年第03期);I138-351 *

Also Published As

Publication number Publication date
CN114500306A (zh) 2022-05-13

Similar Documents

Publication Publication Date Title
CN111176879A (zh) 设备的故障修复方法及装置
US20130005363A1 (en) Predictive Notification System for Emergency Services
US20060026467A1 (en) Method and apparatus for automatically discovering of application errors as a predictive metric for the functional health of enterprise applications
CN103490917B (zh) 故障处理情况的检测方法及装置
CN107864063A (zh) 一种异常监控方法、装置及电子设备
CN1972494B (zh) 信令跟踪的处理方法
CN110674021A (zh) 一种移动应用登录日志的检测方法及***
CN110929896A (zh) 一种***设备的安全分析方法及装置
CN103440190A (zh) 设备故障报警方法,装置与cim***
EP2801084B1 (en) Released offender geospatial location information clearinghouse
CN114173370A (zh) 一种故障定位方法、装置、设备及存储介质
CN114500306B (zh) 一种基于维度的监控服务自动采样验证方法
CN1988709A (zh) 信令跟踪装置
CN101841541B (zh) 一种基于多播网络监控集群的方法及***
CN102932194B (zh) 基于贝叶斯方法的互联网应用服务监控***及方法
CN110011872B (zh) 一种基于诊断消息的流式计算平台状态监控方法和装置
CN1571373A (zh) 监测调整移动网络运行状况的方法
CN102195824B (zh) 数据业务***退服告警的方法、装置及***
KR100269337B1 (ko) 지식 기반 기지국 감시 방법
CN101695174A (zh) 一种监控短信中心的***及方法
CN1988480A (zh) 信令跟踪处理方法
CN115499288A (zh) 业务监控方法、装置、设备及介质
US7159148B2 (en) Method for performance and fault management in a telecommunication network
KR100807893B1 (ko) 서비스 데이터 네트워크 관리 시스템 및 그 운용 방법
CN104038369B (zh) 7号信令网络消息采集预警***及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant