CN103617038B - 一种分布式应用***的服务监控方法及装置 - Google Patents

一种分布式应用***的服务监控方法及装置 Download PDF

Info

Publication number
CN103617038B
CN103617038B CN201310625603.6A CN201310625603A CN103617038B CN 103617038 B CN103617038 B CN 103617038B CN 201310625603 A CN201310625603 A CN 201310625603A CN 103617038 B CN103617038 B CN 103617038B
Authority
CN
China
Prior art keywords
calling
service
acquisition
calling data
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310625603.6A
Other languages
English (en)
Other versions
CN103617038A (zh
Inventor
陈鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong three hundred and sixty degree e-commerce Co., Ltd.
Original Assignee
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Shangke Information Technology Co Ltd
Priority to CN201310625603.6A priority Critical patent/CN103617038B/zh
Publication of CN103617038A publication Critical patent/CN103617038A/zh
Application granted granted Critical
Publication of CN103617038B publication Critical patent/CN103617038B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种分布式应用***的服务监控方法及装置,所述方法包括:采集被监控的服务的调用数据,所述被监控的服务为基于分布式应用***的服务,分布在多台服务器上,所述调用数据为所述被监控的服务在预设时间段内在所有服务器上被调用的次数;判断采集的所述调用数据是否异常;当采集的所述调用数据异常时,进行报警。本发明实施例提供的一种分布式应用***的服务监控方法及装置,通过在正常运行的分布式应用***中,采集来自多台服务器上被监控的服务的调用数据,并集中分析采集到的调用数据,当采集到的调用数据异常时,进行报警,实现了对分布式应用***中服务的实时监控,提高了应用***的服务质量。

Description

一种分布式应用***的服务监控方法及装置
技术领域
本发明涉及互联网技术,尤其涉及一种分布式应用***的服务监控方法及装置。
背景技术
分布式应用***是指在不同计算机上的分布相同的应用程序,这些不同的计算机通过网络来共同完成一项相同的任务。这些不同的计算机即构成了一个分布式应用***。外部应用可以通过某种网络通讯协议,如TCP(Transmission Control Protocol,传输控制协议)、HTTP(Hyper Text Transfer Protocol,超文本传输协议)等来访问分布式应用***,从而实现数据交换。为确保分布式应用***对外服务发生问题时能及时处理,需要对应用***进行监控。
现有技术中,通常对分布式应用***的监控集中在对分布式应用***所属服务器的硬件层面的监控(如服务器是否宕机,各种硬件组件,如网卡、磁盘、负载均衡设备等是否损坏)和分布式应用***本身是否正常运行(如进程在操作***内是否存活,对外服务是否能正常监听)。这些监控方式都只能确保在分布式应用***无法正常提供服务时,发出报警或其它提示。但是,当分布式应用***能正常向外界提供服务,而在分布式应用***所属的服务器与用户之间发生故障时,如用户使用的路由设备出现故障,分布式应用***遭受恶意攻击但仍然能向外提供服务等,传统方法并不会提示服务器,从而影响了服务质量。
发明内容
有鉴于此,本发明实施例提供了一种分布式应用***的服务监控方法及装置,以提高应用***的服务质量。
一方面,本发明实施例提供了一种分布式应用***的服务监控方法,所述方法包括:
采集被监控的服务的调用数据,所述被监控的服务为基于分布式应用***的服务,分布在多台服务器上,所述调用数据为所述被监控的服务在预设时间段内在所有服务器上被调用的次数;
判断采集的所述调用数据是否异常;
当采集的所述调用数据异常时,进行报警。
进一步的,采集被监控的服务的调用数据,包括:
采集被监控的服务的调用日志,所述调用日志为所述被监控的服务在所有服务器上的调用信息;
解析所述调用日志,获取解析结果;
统计所述解析结果,获得所述被监控的服务的调用数据。
进一步的,采集被监控的服务的调用日志,包括:
通过添加代码或面向方面编程AOP的方式,采集所述被监控的服务的调用日志。
进一步的,判断采集的所述调用数据是否异常,包括:
将采集的所述调用数据与预设的门限值或所述被监控的服务在所述预设时间段内的历史调用数据进行比较;
当所述比较的结果满足预设的报警条件时,采集的所述调用数据异常;当所述比较的结果不满足预设的报警条件时,采集的所述调用数据非异常。
进一步的,所述预设的报警条件为:采集的所述调用数据与所述预设的门限值的差值超出第一预设范围,或者
采集的所述调用数据与所述被监控的服务在所述预设时间段内的历史调用数据的差值超出第二预设范围。
另一方面,本发明实施例还提供了一种分布式应用***的服务监控装置,所述装置包括:
采集单元,用于采集被监控的服务的调用数据,所述被监控的服务为基于分布式应用***的服务,分布在多台服务器上,所述调用数据为所述被监控的服务在预设时间段内在所有服务器上被调用的次数;
判断单元,用于判断所述采集段元采集的所述调用数据是否异常;
报警单元,用于当所述判单元判断得到采集的所述调用数据异常时,进行报警。
进一步的,采集单元包括:
采集子单元,用于采集被监控的服务的调用日志,所述调用日志为所述被监控的服务在所有服务器上的调用信息;
解析子单元,用于解析所述采集子单元采集到的调用日志,获取解析结果;
获取子单元,用于统计所述解析子单元的解析结果,获取所述被监控的服务的调用数据。
进一步的,所述采集子单元具体用于:
通过添加代码或面向方面编程AOP的方式,采集所述被监控的服务的调用日志。
进一步的,判断单元包括:
比较子单元,用于将所述采集单元采集的所述调用数据与预设的门限值或所述被监控的服务在所述预设时间段内的历史调用数据进行比较;
判断子单元,用于判断所述采集单元采集的所述调用数据是否异常,当所述比较子单元比较的结果满足预设的报警条件时,判断所述采集单元采集的所述调用数据异常;当所述比较子单元比较的结果不满足预设的报警条件时,判断所述采集单元采集的所述调用数据非异常。
进一步的,所述预设的报警条件为:采集的所述调用数据与所述预设的门限值的差值超出第一预设范围,或者
采集的所述调用数据与所述被监控的服务在所述预设时间段内的历史调用数据的差值超出第二预设范围。
本发明实施例提供的分布式应用***的服务监控方法及装置,通过在正常运行的分布式应用***中,采集来自多台服务器上被监控的服务的调用数据,并集中分析采集到的调用数据,当采集到的调用数据异常时,进行报警,实现了对分布式应用***中服务的实时监控,提高了应用***的服务质量。
附图说明
图1是本发明第一实施例提供的分布式应用***的服务监控方法的流程图;
图2是本发明第一实施例提供的分布式应用***的服务监控方法中采集被监控的服务的调用数据的流程图;
图3是本发明第一实施例提供的分布式应用***的服务监控方法中判断采集的所述调用数据是否异常的流程图;
图4是本发明第二实施例提供的分布式应用***的服务监控装置的示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。
实施例一
图1是本发明第一实施例提供的分布式应用***的服务监控方法的流程图,本实施例的执行主体可以为一***立的服务器,本实施例提供的方法具体包括如下步骤:
步骤101、采集被监控的服务的调用数据,所述被监控的服务为基于分布式应用***的服务,分布在多台服务器上,所述调用数据为所述被监控的服务在预设时间段内在所有服务器上被调用的次数。
分布式应用***中,分布在不同服务器上的应用程序或同一服务器上的不同进程,通过网络来共同完成一项相同的任务。所述分布式应用***提供的服务通常会通过负载均衡的方式对外提供一个统一的访问入口,而外部应用对分布式应用***提供的服务的请求也会通过负载均衡的方式分发到各个独立的应用上执行。监控***中的服务器采集分布式应用***中多台服务器上被监控的服务的调用数据,所述调用数据可以为所述被监控的服务在预设时间段内在所有服务器上被调用的次数,例如采集到的调用数据可以为服务A在2013年10月25日13:00-2013年10月25日14:00内在所有服务器上被调用的次数。
步骤102、判断采集的所述调用数据是否异常。
分布式应用***对外提供服务时,由于受业务模式的影响,在不同时间段会有不同的访问量,比如对外服务的网站,通常白天的访问量会非常大,到了凌晨会减少很多,并且服务的访问量从长时间来观察,变化一般也是呈线性的趋势,不会有急剧的波动。但是当分布式应用***本身运行正常,对外的网络发生异常、硬件设备(如路由设备)损坏、或者分布式应用***遭受恶意攻击时,分布式应用***中服务的访问量则会在短时间内发生很大的变化,极大可能会导致分布式***的对外服务不能被远程用户正常访问或访问性能大大下降,从而影响到业务的正常开展。因此在分布式应用***对外提供的服务正常的情况下,通过调用数据来判断外部网络对所述分布式应用***中的服务的访问是否正常。
步骤103、当采集的所述调用数据异常时,进行报警。
当监控***中的服务器采集到的调用数据异常时,可以进行报警提示,如点亮指示灯、发出特定的声音等。
本实施例提供的分布式应用***的服务监控方法,通过在正常运行的分布式应用***中,采集来自多台服务器上被监控的服务的调用数据,并集中分析采集到的调用数据,当采集到的调用数据异常时,进行报警,实现了对分布式应用***中服务的实时监控,提高了应用***的服务质量。
示例性的,采集被监控的服务的调用数据,可包括如图2所示的步骤:
步骤201、采集被监控的服务的调用日志,所述调用日志为所述被监控的服务在所有服务器上的调用信息。
监控***中的服务器采集被监控的服务的调用日志,优选的,所述服务器可以通过在所述被监控的服务前和/或后添加代码或者AOP(Aspect Oriented Pro gramming,面向方面编程)的方式采集所述被监控的服务的调用日志。所述调用日志为所述被监控的服务每被调用一次,其所属的服务器为其记录的一条日志,所述调用日志的内容可以包括所述被监控的服务本次调用开始的时间、本次调用结束的时间、所述被监控的服务的名称等信息,所述调用日志的格式在此不作具体限定。例如,被监控的服务本次调用的开始时间start=20130731093022123,本次调用的结束时间end=20130731093022321,所述开始时间和结束时间通常精确到毫秒,所述被监控的服务的名称为makeOrder,则调用日志的格式可以为:{"start":"20121120114422123","end":"20121120114422321","key":"makeOrder"},这样我们就可以采集到所有服务器上被监控的服务的所有调用日志。
步骤202、解析所述调用日志,获取解析结果。
监控***中的服务器采集被监控的服务在所有服务器上的调用日志后,按照相同的规则解析所述调用日志,例如,设定时间间隔为1分钟,那么把每条被监控的服务的调用日志中记录的开始时间按每小时的1分钟整点(如0分、1分、2分、3分……58分、59分)进行归类,也可以按所述日志记录的结束时间进行归类,在此不作具体限定。步骤203、统计所述解析结果,获得所述被监控的服务的调用数据。
本步骤中,监控***中的服务器统计上述的解析结果,例如,在步骤202中对所述调用日志归类后,可以统计所述被监控的服务在每个1分钟整点内的调用次数之和,这样被监控的服务在各个服务器上的调用情况汇总数据就可以被统计出来(按1分钟粒度)。同理,也可以按照5分钟粒度,15分钟粒度来统计。所述被监控的服务的调用日志被解析后,可以将解析结果存储到统一的集中存储中,如数据库、集中缓存(如redis),存储方式可以为表1所示的方式,在此不作具体限定。
表1
本步骤中,所述调用数据可以为所述被监控的服务在预设时间段内,如2013年07月13日09:30-2013年07月13日09:31分钟内,服务A被调用的次数。
在上述实施方案的基础上,所述步骤102判断采集的所述调用数据是否异常,优选的,可包括如图3所示的步骤:
步骤301、将采集的所述调用数据与预设的门限值或所述被监控的服务在所述预设时间段内的历史调用数据进行比较。
步骤302、当所述比较的结果满足预设的报警条件时,采集的所述调用数据异常;当所述比较的结果不满足预设的报警条件时,采集的所述调用数据非异常。
所述预设的报警条件可以为采集的所述调用数据与所述预设的门限值的差值超出第一预设范围,或者采集的所述调用数据与所述被监控的服务在所述预设时间段内的历史调用数据的差值超出第二预设范围。
将采集的所述调用数据与预设的门限值进行比较,例如,业务方根据业务情况会对应用***中的每一种服务设定一个阀值,比如从实际情况分析,服务A通常在08:00-22:00正常运行,平均每分钟调用次数稳定在1000左右,波动幅度最大上下300(也就是通常最小700,可能出现在中午;最大1300,可能出现在晚上下班后),那么可以设定所述服务A在一分钟内被调用阈值为1000,波动阈值为300,当所述服务A在1分钟内被调用次数与***预设的被调用阈值的差值超过***预设的波动阈值时,***发出报警,所述报警也可以有不同的级别,如初级报警、高级报警等,报警级别可以根据服务A在1分钟内被调用次数与***预设的被调用阈值的差值超过***预设的波动阈值的程度来决定。
将采集的所述调用数据与所述被监控的服务在所述预设时间段内的历史调用数据进行比较,例如,***运行服务A的当前时间是星期一的13:00-14:00,***会自动与上个星期一同时间段的调用次数进行对比;或者与前面连续3天相同时间段的平均值进行对比。假设***设定的异常比例阀值为10%,即采集到的调用数据与所述被监控的服务在所述预设时间段内的历史调用数据的差值的绝对值超过所述历史调用数据的10%,则表明采集到的所述调用数据异常。对于服务A,过去连续3天相同时间段平均值为900,但当前汇总计算的次数为800,以900为基数那么10%就是90,也就是说在大于等于810和小于等于990的范围内属于正常业务波动,否则需要报警。按这样的规律,当前汇总计算800次就属于业务调用异常情况,需要报警通知。
本实施方案通过对分布式应用***的服务调用数据进行本地保存,然后集中汇总,统计出固定时间间隔内该服务总的调用数据,然后与历史相同时间段的次数或业务方设定的服务调用次数阀值进行对比,如变化情况达到预设的异常报警策略则进行报警,从而实现从业务层面对服务的监控。
第二实施例
图4是本发明第二实施例提供的分布式应用***的服务的监控装置,用于实现图1所示的方法,所述装置包括:采集单元401、判断单元402和报警单元403,其中,所述采集单元401用于采集被监控的服务的调用数据,所述被监控的服务为基于分布式应用***的服务,分布在多台服务器上,所述调用数据为所述被监控的服务在预设时间段内在所有服务器上被调用的次数;所述判断单元402用于判断所述采集单元采集的所述调用数据是否异常;所述报警单元403用于当所述判单元判断得到采集的所述调用数据异常时,进行报警。
示例性的,所述采集单元401可包括:采集子单元4011、解析子单元4012和获取子单元4013,其中,所述采集子单元4011用于采集被监控的服务的调用日志,所述调用日志为所述被监控的服务在所有服务器上的调用信息;所述解析子单元4012用于解析所述采集子单元采集到的调用日志,获取解析结果;所述获取子单元4013用于统计所述解析子单元的解析结果,获取所述被监控的服务的调用数据。
示例性的,所述采集子单元4011可具体用于:通过添加代码或面向方面编程AOP的方式,采集所述被监控的服务的调用日志。
示例性的,所述判断单元402可包括:比较子单元4021和判断子单元4022,其中,所述比较子单元4021用于将所述采集单元采集的所述调用数据与预设的门限值或所述被监控的服务在所述预设时间段内的历史调用数据进行比较;所述判断子单元4022用于判断所述采集单元采集的所述调用数据是否异常,当所述比较子单元比较的结果满足预设的报警条件时,判断所述采集单元采集的所述调用数据异常;当所述比较子单元比较的结果不满足预设的报警条件时,判断所述采集单元采集的所述调用数据非异常。
示例性的,所述预设的报警条件可为:采集的所述调用数据与所述预设的门限值的差值超出第一预设范围,或者采集的所述调用数据与所述被监控的服务在所述预设时间段内的历史调用数据的差值超出第二预设范围。
本发明实施例提供的分布式应用***的服务监控装置用于执行本发明任意实施例提供的分布式应用***的服务监控方法,具备相应的功能模块,可达到与所述方法相似的技术效果,此处不再赘述。
显然,本领域技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个计算装置上,或者分布在多个计算装置所组成的网络上,可选地,他们可以用计算机装置可执行的程序代码来实现,从而可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件的结合。
以上所述仅为本发明的优选实施例,并不用于限制本发明,对于本领域技术人员而言,本发明可以有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种分布式应用***的服务监控方法,其特征在于,所述方法包括:
采集被监控的服务的调用数据,所述被监控的服务为基于分布式应用***的服务,分布在多台服务器上,所述调用数据为所述被监控的服务在预设时间段内在所有服务器上被调用的次数;
判断采集的所述调用数据是否异常;
当采集的所述调用数据异常时,进行报警。
2.根据权利要求1所述的方法,其特征在于,采集被监控的服务的调用数据,包括:
采集被监控的服务的调用日志,所述调用日志为所述被监控的服务在所有服务器上的调用信息;
解析所述调用日志,获取解析结果;
统计所述解析结果,获得所述被监控的服务的调用数据。
3.根据权利要求2所述的方法,其特征在于,采集被监控的服务的调用日志,包括:
通过添加代码或面向方面编程AOP的方式,采集所述被监控的服务的调用日志。
4.根据权利要求1-3任一项所述的方法,其特征在于,判断采集的所述调用数据是否异常,包括:
将采集的所述调用数据与预设的门限值或所述被监控的服务在所述预设时间段内的历史调用数据进行比较;
当所述比较的结果满足预设的报警条件时,采集的所述调用数据异常;当所述比较的结果不满足预设的报警条件时,采集的所述调用数据非异常。
5.根据权利要求4所述的方法,其特征在于,所述预设的报警条件为:采集的所述调用数据与所述预设的门限值的差值超出第一预设范围,或者
采集的所述调用数据与所述被监控的服务在所述预设时间段内的历史调用数据的差值超出第二预设范围。
6.一种分布式应用***的服务监控装置,其特征在于,所述装置包括:
采集单元,用于采集被监控的服务的调用数据,所述被监控的服务为基于分布式应用***的服务,分布在多台服务器上,所述调用数据为所述被监控的服务在预设时间段内在所有服务器上被调用的次数;
判断单元,用于判断所述采集单元采集的所述调用数据是否异常;
报警单元,用于当所述判断单元判断得到采集的所述调用数据异常时,进行报警。
7.根据权利要求6所述的装置,其特征在于,所述采集单元包括:
采集子单元,用于采集被监控的服务的调用日志,所述调用日志为所述被监控的服务在所有服务器上的调用信息;
解析子单元,用于解析所述采集子单元采集到的调用日志,获取解析结果;
获取子单元,用于统计所述解析子单元的解析结果,获取所述被监控的服务的调用数据。
8.根据权利要求7所述的装置,其特征在于,所述采集子单元具体用于:
通过添加代码或面向方面编程AOP的方式,采集所述被监控的服务的调用日志。
9.根据权利要求6-8任一项所述的装置,其特征在于,所述判断单元包括:
比较子单元,用于将所述采集单元采集的所述调用数据与预设的门限值或所述被监控的服务在所述预设时间段内的历史调用数据进行比较;
判断子单元,用于判断所述采集单元采集的所述调用数据是否异常,当所述比较子单元比较的结果满足预设的报警条件时,判断所述采集单元采集的所述调用数据异常;当所述比较子单元比较的结果不满足预设的报警条件时,判断所述采集单元采集的所述调用数据非异常。
10.根据权利要求9所述的装置,其特征在于,
所述预设的报警条件为:采集的所述调用数据与所述预设的门限值的差值超出第一预设范围,或者
采集的所述调用数据与所述被监控的服务在所述预设时间段内的历史调用数据的差值超出第二预设范围。
CN201310625603.6A 2013-11-28 2013-11-28 一种分布式应用***的服务监控方法及装置 Active CN103617038B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310625603.6A CN103617038B (zh) 2013-11-28 2013-11-28 一种分布式应用***的服务监控方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310625603.6A CN103617038B (zh) 2013-11-28 2013-11-28 一种分布式应用***的服务监控方法及装置

Publications (2)

Publication Number Publication Date
CN103617038A CN103617038A (zh) 2014-03-05
CN103617038B true CN103617038B (zh) 2018-10-02

Family

ID=50167741

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310625603.6A Active CN103617038B (zh) 2013-11-28 2013-11-28 一种分布式应用***的服务监控方法及装置

Country Status (1)

Country Link
CN (1) CN103617038B (zh)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105306507B (zh) * 2014-07-18 2019-09-20 阿里巴巴集团控股有限公司 分布式架构中的容灾处理方法及容灾处理装置
CN104410550B (zh) * 2014-12-10 2018-05-01 深圳中兴网信科技有限公司 Web服务监控方法和Web服务监控装置
CN105677540A (zh) * 2016-01-29 2016-06-15 四川航天***工程研究所 对远程不可达软件***的运行状态进行远程监控的方法
CN107545187A (zh) * 2016-06-24 2018-01-05 阿里巴巴集团控股有限公司 一种服务数据的处理方法及装置
CN106371983A (zh) * 2016-08-31 2017-02-01 五八同城信息技术有限公司 基于数据开发的报警方法和装置
CN106550010A (zh) * 2016-09-21 2017-03-29 南京途牛科技有限公司 一种实时控制分布式***调用外***服务频次的方法及***
CN106528664A (zh) * 2016-10-21 2017-03-22 广东亿迅科技有限公司 基于分布式的关系数据库的事务数据监控方法及其***
CN106411659A (zh) * 2016-11-29 2017-02-15 福建中金在线信息科技有限公司 一种业务数据监测方法及装置
CN108234152B (zh) * 2016-12-12 2021-08-10 北京京东尚科信息技术有限公司 远程接口调用的网络监控的方法和***
CN107169084A (zh) * 2017-05-11 2017-09-15 深圳市茁壮网络股份有限公司 一种数据处理方法、分布式文件***及数据服务器
CN108933802B (zh) * 2017-05-26 2022-03-01 北京京东尚科信息技术有限公司 用于监控操作的方法和装置
CN108984376B (zh) * 2018-05-31 2021-11-19 创新先进技术有限公司 一种***异常检测方法、装置及设备
CN108845912B (zh) * 2018-06-11 2019-08-06 掌阅科技股份有限公司 服务接口调用故障的报警方法及计算设备
CN110912720B (zh) * 2018-09-14 2023-05-30 北京微播视界科技有限公司 信息生成方法和装置
CN109656792A (zh) * 2018-11-02 2019-04-19 深圳市快付通金融网络科技服务有限公司 基于网络调用日志的应用性能分析方法、装置、计算机设备及存储介质
CN109542725B (zh) * 2018-11-15 2022-04-05 北京金山云网络技术有限公司 一种分布式***的服务质量监控方法、装置及监控服务器
CN109684170A (zh) * 2018-12-14 2019-04-26 新博卓畅技术(北京)有限公司 一种api服务智能监控***及方法
CN109684280A (zh) * 2018-12-19 2019-04-26 泰康保险集团股份有限公司 日志文件处理方法、装置及***
CN111475393A (zh) * 2020-04-08 2020-07-31 拉扎斯网络科技(上海)有限公司 服务性能预测方法、装置、电子设备及可读存储介质
CN113888311A (zh) * 2021-10-14 2022-01-04 中国工商银行股份有限公司 风险预警方法、装置、计算机设备和计算机可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101075919A (zh) * 2006-06-22 2007-11-21 腾讯科技(深圳)有限公司 一种互联网业务的监控***和监控方法
CN102694696A (zh) * 2012-05-14 2012-09-26 中国科学院计算机网络信息中心 Dns服务器异常检测的方法及装置
CN102882745A (zh) * 2012-09-29 2013-01-16 摩卡软件(天津)有限公司 一种用于监控业务服务器的方法和装置
CN103123602A (zh) * 2011-11-18 2013-05-29 阿里巴巴集团控股有限公司 基于java的异常报警监控方法及其装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050060372A1 (en) * 2003-08-27 2005-03-17 Debettencourt Jason Techniques for filtering data from a data stream of a web services application
CN101674293B (zh) * 2008-09-11 2013-04-03 阿里巴巴集团控股有限公司 一种分布式应用中处理非正常请求的方法及***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101075919A (zh) * 2006-06-22 2007-11-21 腾讯科技(深圳)有限公司 一种互联网业务的监控***和监控方法
CN103123602A (zh) * 2011-11-18 2013-05-29 阿里巴巴集团控股有限公司 基于java的异常报警监控方法及其装置
CN102694696A (zh) * 2012-05-14 2012-09-26 中国科学院计算机网络信息中心 Dns服务器异常检测的方法及装置
CN102882745A (zh) * 2012-09-29 2013-01-16 摩卡软件(天津)有限公司 一种用于监控业务服务器的方法和装置

Also Published As

Publication number Publication date
CN103617038A (zh) 2014-03-05

Similar Documents

Publication Publication Date Title
CN103617038B (zh) 一种分布式应用***的服务监控方法及装置
KR102346131B1 (ko) 데이터 스트림의 실시간 처리를 위한 시스템 및 방법
CN107992398B (zh) 一种业务***的监控方法和监控***
US11334543B1 (en) Scalable bucket merging for a data intake and query system
US11275733B1 (en) Mapping search nodes to a search head using a tenant identifier
CN105224445B (zh) 分布式跟踪***
US10048996B1 (en) Predicting infrastructure failures in a data center for hosted service mitigation actions
US11157497B1 (en) Dynamically assigning a search head and search nodes for a query
US10270668B1 (en) Identifying correlated events in a distributed system according to operational metrics
US8566527B2 (en) System and method for usage analyzer of subscriber access to communications network
US8195931B1 (en) Application change control
CN109684370A (zh) 日志数据处理方法、***、设备及存储介质
CN110223146B (zh) 客户购电服务全过程监控***及方法
US20070168915A1 (en) Methods and systems to detect business disruptions, determine potential causes of those business disruptions, or both
CN106953758A (zh) 一种基于Nginx服务器的动态配置管理方法及***
CN108197233A (zh) 一种数据管理方法、中间件及数据管理***
EP2324406B1 (en) Method and apparatus for monitoring the performance of a power delivery control system
US20220229657A1 (en) Extensible resource compliance management
US7711518B2 (en) Methods, systems and computer program products for providing system operational status information
CN105069029B (zh) 一种实时etl***及方法
CN110363381B (zh) 一种信息处理方法和装置
Ravindra et al. Latency aware elastic switching-based stream processing over compressed data streams
CN112395357A (zh) 一种数据收集方法、装置和电子设备
US10769218B2 (en) Display for network time series data with adaptable zoom intervals
CN113590604B (zh) 业务数据的处理方法、装置和服务器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20191126

Address after: 100176 room 222, 2f, building C, No. 18, Kechuang 11th Street, Beijing Economic and Technological Development Zone, Daxing District, Beijing

Patentee after: Beijing Jingdong three hundred and sixty degree e-commerce Co., Ltd.

Address before: 100080, Beijing, Suzhou Street, No. 20, building 2, No. 2, Haidian District

Patentee before: Beijing Jingdong Shangke Information Technology Co., Ltd.

TR01 Transfer of patent right