CN105490864A - 基于osgi的业务模块监控方法 - Google Patents

基于osgi的业务模块监控方法 Download PDF

Info

Publication number
CN105490864A
CN105490864A CN201410472655.9A CN201410472655A CN105490864A CN 105490864 A CN105490864 A CN 105490864A CN 201410472655 A CN201410472655 A CN 201410472655A CN 105490864 A CN105490864 A CN 105490864A
Authority
CN
China
Prior art keywords
cluster
index
operational approach
assembly
interface
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410472655.9A
Other languages
English (en)
Other versions
CN105490864B (zh
Inventor
欧阳亚
袁兴海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Taima Information Network Technology Co Ltd
Original Assignee
Taima Information Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Taima Information Network Technology Co Ltd filed Critical Taima Information Network Technology Co Ltd
Priority to CN201410472655.9A priority Critical patent/CN105490864B/zh
Publication of CN105490864A publication Critical patent/CN105490864A/zh
Application granted granted Critical
Publication of CN105490864B publication Critical patent/CN105490864B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Telephonic Communication Services (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明揭示了一种基于OSGI的业务模块监控方法,包括:客户端请求调用ZooKeeper集群,ZooKeeper集群检查SP是否还在集群中,若在集群中,则返回SP服务器给客户端;客户端调用SP组件的方法被SP服务器的业务方法***捕获;业务方法***调用OSGI容器中的SP组件方法,方法返回结果或发送异常至所述业务方法***;指标采集开始需要获取SP组件的业务方法列表;通过监控模块从业务方法***获取;循环每个业务方法条目;一次业务方法的指标采集完;采集程序通过控制接口,向ZooKeeper集群发送脱离SP组件指令;业务指标的分析及报警步骤。本发明可以准确定位业务方法的瓶颈,进而改进***,促进版本升级。

Description

基于OSGI的业务模块监控方法
技术领域
本发明属于软件监控技术领域,涉及一种业务模块监控方法,尤其涉及一种基于OSGI的业务模块监控方法。
背景技术
OSGi亦称做Java语言的动态模块***,它为模块化应用的开发定义了一个基础架构。
OSGi规范和Servlet规范及EJB规范类似,该规范定义了两种对象,一是容器对外提供的服务对象,另一个是容器和您的应用程序之间必须遵守的契约,其中,服务对象是容器要实现的。您如果想要在OSGi平台上进行开发,首先,您必须要使用OSGiAPI来创建您的应用,然后将之部署到OSGi容器中。从开发者的角度看,OSGi具有以下优点:(1)可以在不重启容器的情况下,动态地安装、卸载、启动和停止您的应用程序中的不同模块;(2)对于您应用程序中的某一特定模块,容器可以同时运行该模块的多个版本;(3)OSGi为开发嵌入式应用、移动应用、富互联网应用(RIA)提供了非常优秀的基础架构。
JMX(JavaManagementExtensions,即Java管理扩展)是一个为应用程序、设备、***等植入管理功能的框架。JMX可以跨越一系列异构操作***平台、***体系结构和网络传输协议,灵活的开发无缝集成的***、网络和服务管理应用。
JMX体系结构分为以下四个层次:设备层、代理层、分布服务层、附加管理协议API。
设备层(InstrumentationLevel):主要定义了信息模型。在JMX中,各种管理对象以管理构件的形式存在,需要管理时,向MBean服务器进行注册。该层还定义了通知机制以及一些辅助元数据类。
代理层(AgentLevel):主要定义了各种服务以及通信模型。该层的核心是一个MBean服务器,所有的管理构件都需要向它注册,才能被管理。注册在MBean服务器上管理构件并不直接和远程应用程序进行通信,它们通过协议适配器和连接器进行通信。而协议适配器和连接器也以管理构件的形式向MBean服务器注册才能提供相应的服务。
分布服务层(DistributedServiceLevel):主要定义了能对代理层进行操作的管理接口和构件,这样管理者就可以操作代理。然而,当前的JMX规范并没有给出这一层的具体规范。
定义的API主要用来支持当前已经存在的网络管理协议,如SNMP、TMN、CIM/WBEM等。
开源监控***OpenTSDB,用hbase存储所有的时序(无需采样)来构建一个分布式、可伸缩的时间序列数据库。它支持秒级数据采集所有metrics,支持永久存储,可以做容量规划,并很容易的接入到现有的报警***里。OpenTSDB可以从大规模的集群(包括集群中的网络设备、操作***、应用程序)中获取相应的metrics并进行存储、索引以及服务,从而使得这些数据更容易让人理解,如web化,图形化等。
对于运维工程师而言,OpenTSDB可以获取基础设施和服务的实时状态信息,展示集群的各种软硬件错误,性能变化以及性能瓶颈。对于管理者而言,OpenTSDB可以衡量***的SLA,理解复杂***间的相互作用,展示资源消耗情况。集群的整体作业情况,可以用以辅助预算和集群资源协调。对于开发者而言,OpenTSDB可以展示集群的主要性能瓶颈,经常出现的错误,从而可以着力重点解决重要问题。
发明内容
本发明所要解决的技术问题是:提供一种基于OSGI的业务模块监控方法,可准确定位业务方法的瓶颈,进而改进***,促进版本升级。
如今需要一个支持模块化、分布式、大数据操作的开发平台的车联网框架。由于***的庞大复杂,为保证***的稳定运行和快速定位***瓶颈,为研发和改进***提供依据;需要对***、平台、服务模块、服务模块业务方法进行监控数据采集和数据分析。通过本发明监控方法,可以:
定时采集操作***层面指标:CPU使用率、内存使用率、存储使用率、网络流量等。
定时采集集群层面指标:集群规模、成员服务器有效状态等。
定时采集成员服务器JVM指标:堆使用情况、线程情况等。
定时采集业务模块指标:接口数量、接口列表等。
定时采集每个接口指标:请求次数、错误次数、合计处理时间、最大一次处理时间、平均处理时间等。
使用时间序列数据库(TSDB)保存各时间点的指标数据,形成监控大数据。
通过大数据分析工具,分析业务的忙/闲情况,各业务接口的处理情况,以及相同时间点下各依赖环境、支撑环境的指标情况,从而综合分析***的性能瓶颈。
为解决上述技术问题,本发明采用如下技术方案:
一种基于OSGI的业务模块监控方法,所述监控方法包括如下步骤:
步骤S1、客户端请求调用ZooKeeper集群,ZooKeeper集群检查业务模块对应服务容器SP是否还在集群中,若在集群中,则返回业务模块服务容器SP的访问接口给客户端;
步骤S2、客户端调用SP组件的方法被服务容器SP的业务方法***捕获,***进行如下操作:将方法调用计数器做加1操作,记录开始调用时间;
步骤S3、业务方法***调用OSGI容器中的SP组件方法,方法返回结果或发送异常至所述业务方法***;业务方法***进行如下操作:计算处理时间;如果有错误,将错误次数做加1操作;如果当前最大处理时间和前一个最大处理时间变量进行比较,若当前最大处理时间更大,则将最大处理时间修改为当前最大处理时间;
步骤S4、指标采集开始需要获取服务容器SP组件的业务方法列表;通过监控模块从业务方法***获取;
监控模块是基于JMX开发的管理组件,运行在SP-Server中,用于汇总各种指标数据同时向指标采取器提供接口;监控模块向采集器提供:业务方法列表接口、指标获取接口、指标重置接口、业务组件控制接口;
步骤S5、循环每个业务方法条目,根据方法的标识发起指标获取请求,一个业务方法包含:处理次数、处理时间合计、最大一次处理事情、错误次数;
步骤S6、一次业务方法的指标采集完,调用重置接口,把上次所有指标清零;各项指标保存到时间序列数据库tsdb中后,表现为一定时间间隔的指标数值;
步骤S7、采集程序通过控制接口,向ZooKeeper集群发送脱离SP组件指令,SP组件集群后,业务调用将不会分发给SP组件集群;
步骤S8、业务指标的分析及报警步骤;
步骤S9、信息展示步骤:有配置关系的支撑数据,展示在某时间点上,包括业务方法请求数量、集群规模、JVM的线程数量、JVM堆内存大小、服务器的会话数量、服务器连接数量、CPU利用率、内存使用率、进程数量、网络带宽情况;通过综合环境参数的展示运维人员准确及时的协调资源,满足***峰值需求;同时在***闲时削减资源,节约运营成本;
其中,步骤S8具体包括:
步骤S81、提取各报警对象的的报警指标,包括集群本身的指标、集群各类型节点的指标、JVM的指标;
步骤S82、根据集群-服务器关系提取各集群的成员服务器;
步骤S83、循环各集群服务器,从时间序列数据库tsdb中获取各指标的值;
步骤S84、对每项指标逐一检查配置的报警阀值;
步骤S85、报警分为两种:中断性报警,tsdb中没有取出记录;指标超阀值类报警,超出了报警阀值的范围;
步骤S86、报警成员的提取:Sp集群的报警根据主机、集群、渠道提取相关的报警组成员;Hadoop、Hbase、Mysql、Zookeeper集群提取集群和主机管理员;
步骤S87、报警的重复提醒问题:如果10分钟后没有人处理继续产生同样的报警信息;
步骤S88、获取报警的邮件发送列表,发送报警邮件。
一种基于OSGI的业务模块监控方法,所述监控方法包括如下步骤:
步骤S1、客户端请求调用ZooKeeper集群,ZooKeeper集群检查业务模块对应服务容器SP是否还在集群中,若在集群中,则返回业务模块服务容器SP访问接口给客户端;
步骤S2、客户端调用SP组件的方法被服务容器SP的业务方法***捕获,***进行如下操作:将方法调用计数器做加1操作,记录开始调用时间;
步骤S3、业务方法***调用OSGI容器中的SP组件方法,方法返回结果或发送异常至所述业务方法***;
步骤S4、指标采集开始需要获取服务容器SP组件的业务方法列表;通过监控模块从业务方法***获取;
步骤S5、循环每个业务方法条目,根据方法的标识发起指标获取请求,一个业务方法包含:处理次数、处理时间合计、最大一次处理事情、错误次数;
步骤S6、一次业务方法的指标采集完,调用重置接口,把上次所有指标清零;各项指标保存到时间序列数据库tsdb中后,表现为一定时间间隔的指标数值;
步骤S7、采集程序通过控制接口,向ZooKeeper集群发送脱离SP组件指令,SP组件集群后,业务调用将不会分发给SP组件集群;
步骤S8、业务指标的分析及报警步骤。
作为本发明的一种优选方式,其中,步骤S8具体包括:
步骤S81、提取各报警对象的的报警指标,包括集群本身的指标、集群各类型节点的指标、JVM的指标;
步骤S82、根据集群-服务器关系提取各集群的成员服务器;
步骤S83、循环各集群服务器,从时间序列数据库tsdb中获取各指标的值;
步骤S84、对每项指标逐一检查配置的报警阀值;
步骤S85、报警分为两种:中断性报警,tsdb中没有取出记录;指标超阀值类报警,超出了报警阀值的范围;
步骤S86、报警成员的提取:Sp集群的报警根据主机、集群、渠道提取相关的报警组成员;Hadoop、Hbase、Mysql、Zookeeper集群提取集群和主机管理员;
步骤S87、报警的重复提醒问题:如果10分钟后没有人处理继续产生同样的报警信息;
步骤S88、获取报警的邮件发送列表,发送报警邮件。
作为本发明的一种优选方式,所述方法还包括步骤S9、信息展示步骤:有配置关系的支撑数据,展示在某时间点上,包括业务方法请求数量、集群规模、JVM的线程数量、JVM堆内存大小、服务器的会话数量、服务器连接数量、CPU利用率、内存使用率、进程数量、网络带宽情况;通过综合环境参数的展示运维人员准确及时的协调资源,满足***峰值需求;同时在***闲时削减资源,节约运营成本。
作为本发明的一种优选方式,所述步骤S3中,业务方法***进行如下操作:计算处理时间;如果有错误,将错误次数做加1操作;如果当前最大处理时间和前一个最大处理时间变量进行比较,若当前最大处理时间更大,则将最大处理时间修改为当前最大处理时间。
作为本发明的一种优选方式,所述步骤S4中,监控模块是基于JMX开发的管理组件,运行在SP-Server中,用于汇总各种指标数据同时向指标采取器提供接口;监控模块向采集器提供:业务方法列表接口、指标获取接口、指标重置接口、业务组件控制接口。
本发明的有益效果在于:本发明提出的基于OSGI的业务模块监控方法,***开发人员通过本发明分析监控数据,可以准确定位业务方法的瓶颈,进而改进***,促进版本升级。通过查阅相应的出错日志和运行时环境参数,了解故障发生的原因。修正不易发现的Bug。
附图说明
图1为本发明业务组件模型的示意图。
图2为本发明数据采集模型图。
图3为本发明方法业务方法指标采集的流程图。
具体实施方式
下面结合附图详细说明本发明的优选实施例。
实施例一
请参阅图3,本发明揭示了一种基于OSGI的业务模块监控方法,所述监控方法包括如下步骤:
【步骤S1】客户端请求调用分布式协调组件ZooKeeper集群,ZooKeeper集群检查业务模块服务容器SP是否还在集群中,若在集群中,则返回业务模块服务容器SP访问接口给客户端。如图1所示,图1为业务组件模型的示意图。
【步骤S2】客户端调用业务组件的方法被服务容器SP的业务方法***捕获,***进行如下操作:将方法调用计数器做加1操作,记录开始调用时间;
【步骤S3】业务方法***调用OSGI-容器中的SP组件方法,方法返回结果或发送异常至所述业务方法***;业务方法***进行如下操作:计算处理时间;如果有错误,将错误次数做加1操作;如果当前最大处理时间和前一个最大处理时间变量进行比较,若当前最大处理时间更大,则将最大处理时间修改为当前最大处理时间;
【步骤S4】指标采集开始需要获取服务容器SP组件的业务方法列表;通过MBean监控模块从业务方法***获取。如图2所示,图2揭示了数据采集的方式及过程。
MBEAN监控模块是基于JMX开发的管理组件,运行在SP-Server中,用于汇总各种指标数据同时向指标采取器提供接口;MBean监控模块向采集器提供:业务方法列表接口、指标获取接口、指标重置接口、业务组件控制接口。
【步骤S5】循环每个业务方法条目,根据方法的标识发起指标获取请求,一个业务方法包含:处理次数、处理时间合计、最大一次处理事情、错误次数;
【步骤S6】一次业务方法的指标采集完,调用重置接口,把上次所有指标清零;各项指标保存到时间序列数据库tsdb中后,表现为一定时间间隔的指标数值;
【步骤S7】采集程序通过控制接口,向ZooKeeper集群发送脱离SP组件指令,SP组件集群后,业务调用将不会分发给SP组件集群;
【步骤S8】业务指标的分析及报警步骤。具体包括:
步骤S81、提取各报警对象的的报警指标,包括集群本身的指标、集群各类型节点的指标、JVM的指标;
步骤S82、根据集群-服务器关系提取各集群的成员服务器;
步骤S83、循环各集群服务器,从时间序列数据库tsdb中获取各指标的值;
步骤S84、对每项指标逐一检查配置的报警阀值;
步骤S85、报警分为两种:中断性报警,tsdb中没有取出记录;指标超阀值类报警,超出了报警阀值的范围;
步骤S86、报警成员的提取:Sp集群的报警根据主机、集群、渠道提取相关的报警组成员;Hadoop、Hbase、Mysql、Zookeeper集群提取集群和主机管理员;
步骤S87、报警的重复提醒问题:如果10分钟后没有人处理继续产生同样的报警信息;
步骤S88、获取报警的邮件发送列表,发送报警邮件。
【步骤S9】信息展示步骤:有配置关系的支撑数据,展示在某时间点上,包括业务方法请求数量、集群规模、JVM的线程数量、JVM堆内存大小、服务器的会话数量、服务器连接数量、CPU利用率、内存使用率、进程数量、网络带宽情况;通过综合环境参数的展示运维人员准确及时的协调资源,满足***峰值需求;同时在***闲时削减资源,节约运营成本。
实施例二
业务***的开发都是建筑在基于OSGI的应用服务平台上,开发人员只关注具体的业务实现,在***运行过程中自动拦截方法调用,计算请求数指标;运行过程计算处理时间、错误次数等指标,调用结束判断是否为最长一次处理等指标。这些计算逻辑,对业务***是透明的,无需显式继承、调用任何代码。
各业务***需要的指标不尽相同,有些指标是公共的,比如请求次数、处理时间等。有些指标是业务***独有的,比如带车机应用的业务***中客户端掉线次数等。
***采用OSGI的模块化思想来解决这个问题,把指标计算做成不同的Bundle插件,在各业务***中进行插拔。满足不同业务***采集和计算不同指标的要求。
业务方法的各项指标计算结果保存在服务器内存中,通过暴露采集API的方式提供给指标采集程序;采集程序可通过JMX、Http、SNMP的方式进行读取。
操作***层面的指标采集采用本地运行的python脚本进行采集,数据汇集到tsdb。JVM层面的采集,通过JMX客户端远程采集,数据汇集到tsdb。服务层面的采集,通过在业务框架上开发MBEAN,暴露相关指标,采集器通过JMX客户端远程采集。支持可扩展的采集适配器,SNMP方式、Http方式等。
请参阅图3,本发明基于OSGI的业务模块监控方法具体包括如下步骤:
客户端程序(Client)通过3.1请求ZooKeeper集群,ZooKeeper集群通过3.2检查SP是否还在集群中,返回一个的服务容器SP给Client。
Client调用SP组件的方法(1.1)被服务容器SP的业务方法***捕获,***进行如下操作:方法调用计数器+1、记录开始调用时间
业务方法***调用OSGI-容器中的SP组件方法(1.2),方法返回结果或抛出异常给***(1.3)。***进行如下操作:计算处理时间(process.time)、错误次数+1(如果有错误,error.count)、替换最大处理时间(max.process)
监控MBEAN是基于JMX开发的管理组件,运行在SP-Server中,用于汇总各种指标数据同时向指标采取器提供接口。
MBean向采集器提供:业务方法列表接口、指标获取接口、指标重置接口、业务组件控制接口。
指标采集开始需要获取SP组件的业务方法列表。MBean通过2.1向业务方法***获取。
循环每个业务方法条目,根据方法的标识发起指标获取请求(2.1),一个方法包含:处理次数、处理时间合计、最大一次处理事情、错误次数
一次业务方法的指标采集完,调用重置接口,把上次所有指标清零。各项指标保存到tsdb数据库中后,表现为一定时间间隔的指标数值。
采集程序可以通过控制接口,向ZooKeeper集群发送脱离SP组件指令,SP组件集群后,业务调用讲不会分发给它。
业务方法指标的分析和报警步骤。报警定位准确;基于配置关系和时间序列两个维度的数据,可以精确定位问题发生的位置和时间点,可以分析***的性能瓶颈在哪些点。具体到如下几个层面:
渠道:使用业务***的供应商或事业部;
集群:承载业务***的集群,业务模块(SP)集群、接入服务模块(AP)集群、ZooKeeper集群、HBase集群、Mysql集群等;
服务器:SP服务器(服务容器SP)、Tomcat服务器、HBaseMaster/RegionServer服务器、MysqlMaster/Slave服务器;
服务:基于OSGI的模块Bundle;
业务方法:暴露给客户顶端调用的方法。
综上所述,本发明提出的基于OSGI的业务模块监控方法,***开发人员通过本发明分析监控数据,可以准确定位业务方法的瓶颈,进而改进***,促进版本升级。通过查阅相应的出错日志和运行时环境参数,了解故障发生的原因。修正不易发现的Bug。
这里本发明的描述和应用是说明性的,并非想将本发明的范围限制在上述实施例中。这里所披露的实施例的变形和改变是可能的,对于那些本领域的普通技术人员来说实施例的替换和等效的各种部件是公知的。本领域技术人员应该清楚的是,在不脱离本发明的精神或本质特征的情况下,本发明可以以其它形式、结构、布置、比例,以及用其它组件、材料和部件来实现。在不脱离本发明范围和精神的情况下,可以对这里所披露的实施例进行其它变形和改变。

Claims (6)

1.一种基于OSGI的业务模块监控方法,其特征在于,所述监控方法包括如下步骤:
步骤S1、客户端请求调用分布式协调组件ZooKeeper集群,ZooKeeper集群检查业务模块的服务容器SP是否还在集群中,若在集群中,则返回业务模块服务容器SP的访问接口给客户端;
步骤S2、客户端调用SP组件的方法被服务容器SP的业务方法***捕获,***进行如下操作:将方法调用计数器做加1操作,记录开始调用时间;
步骤S3、业务方法***调用OSGI容器中的SP组件方法,方法返回结果或发送异常至所述业务方法***;业务方法***进行如下操作:计算处理时间;如果有错误,将错误次数做加1操作;如果当前最大处理时间和前一个最大处理时间变量进行比较,若当前最大处理时间更大,则将最大处理时间修改为当前最大处理时间;
步骤S4、指标采集开始需要获取服务容器SP组件的业务方法列表;通过监控模块从业务方法***获取;
监控模块是基于JMX开发的管理组件,运行在服务容器SP中,用于汇总各种指标数据同时向指标采取器提供接口;监控模块向采集器提供:业务方法列表接口、指标获取接口、指标重置接口、业务组件控制接口;
步骤S5、循环每个业务方法条目,根据方法的标识发起指标获取请求,一个业务方法包含:处理次数、处理时间合计、最大一次处理事情、错误次数;
步骤S6、一次业务方法的指标采集完,调用重置接口,把上次所有指标清零;各项指标保存到时间序列数据库tsdb中后,表现为一定时间间隔的指标数值;
步骤S7、采集程序通过控制接口,向ZooKeeper集群发送脱离服务容器SP组件指令,服务容器SP组件集群后,业务调用将不会分发给服务容器SP组件集群;
步骤S8、业务指标的分析及报警步骤;
步骤S9、信息展示步骤:有配置关系的支撑数据,展示在某时间点上,包括业务方法请求数量、集群规模、JVM的线程数量、JVM堆内存大小、服务器的会话数量、服务器连接数量、CPU利用率、内存使用率、进程数量、网络带宽情况;通过综合环境参数的展示运维人员准确及时的协调资源,满足***峰值需求;同时在***闲时削减资源,节约运营成本;
其中,步骤S8具体包括:
步骤S81、提取各报警对象的的报警指标,包括集群本身的指标、集群各类型节点的指标、JVM的指标;
步骤S82、根据集群-服务器关系提取各集群的成员服务器;
步骤S83、循环各集群服务器,从时间序列数据库tsdb中获取各指标的值;
步骤S84、对每项指标逐一检查配置的报警阀值;
步骤S85、报警分为两种:中断性报警,tsdb中没有取出记录;指标超阀值类报警,超出了报警阀值的范围;
步骤S86、报警成员的提取:Sp集群的报警根据主机、集群、渠道提取相关的报警组成员;Hadoop、Hbase、Mysql、Zookeeper集群提取集群和主机管理员;
步骤S87、报警的重复提醒问题:如果10分钟后没有人处理继续产生同样的报警信息;
步骤S88、获取报警的邮件发送列表,发送报警邮件。
2.一种基于OSGI的业务模块监控方法,其特征在于,所述监控方法包括如下步骤:
步骤S1、客户端请求调用分布式协调组件ZooKeeper集群,ZooKeeper集群检查业务模块服务容器SP是否还在集群中,若在集群中,则返回业务模块服务容器SP访问接口给客户端;
步骤S2、客户端调用SP组件的方法被服务容器SP的业务方法***捕获,***进行如下操作:将方法调用计数器做加1操作,记录开始调用时间;
步骤S3、业务方法***调用OSGI容器中的服务容器SP组件方法,方法返回结果或发送异常至所述业务方法***;
步骤S4、指标采集开始需要获取服务容器SP组件的业务方法列表;通过监控模块从业务方法***获取;
步骤S5、循环每个业务方法条目,根据方法的标识发起指标获取请求,一个业务方法包含:处理次数、处理时间合计、最大一次处理事情、错误次数;
步骤S6、一次业务方法的指标采集完,调用重置接口,把上次所有指标清零;各项指标保存到时间序列数据库tsdb中后,表现为一定时间间隔的指标数值;
步骤S7、采集程序通过控制接口,向ZooKeeper集群发送脱离SP组件指令,SP组件集群后,业务调用将不会分发给SP组件集群;
步骤S8、业务指标的分析及报警步骤。
3.根据权利要求2所述的基于OSGI的业务模块监控***,其特征在于:
其中,步骤S8具体包括:
步骤S81、提取各报警对象的的报警指标,包括集群本身的指标、集群各类型节点的指标、JVM的指标;
步骤S82、根据集群-服务器关系提取各集群的成员服务器;
步骤S83、循环各集群服务器,从时间序列数据库tsdb中获取各指标的值;
步骤S84、对每项指标逐一检查配置的报警阀值;
步骤S85、报警分为两种:中断性报警,tsdb中没有取出记录;指标超阀值类报警,超出了报警阀值的范围;
步骤S86、报警成员的提取:Sp集群的报警根据主机、集群、渠道提取相关的报警组成员;Hadoop、Hbase、Mysql、Zookeeper集群提取集群和主机管理员;
步骤S87、报警的重复提醒问题:如果10分钟后没有人处理继续产生同样的报警信息;
步骤S88、获取报警的邮件发送列表,发送报警邮件。
4.根据权利要求2所述的基于OSGI的业务模块监控***,其特征在于:
所述方法还包括步骤S9、信息展示步骤:有配置关系的支撑数据,展示在某时间点上,包括业务方法请求数量、集群规模、JVM的线程数量、JVM堆内存大小、服务器的会话数量、服务器连接数量、CPU利用率、内存使用率、进程数量、网络带宽情况;通过综合环境参数的展示运维人员准确及时的协调资源,满足***峰值需求;同时在***闲时削减资源,节约运营成本。
5.根据权利要求2所述的基于OSGI的业务模块监控***,其特征在于:
所述步骤S3中,业务方法***进行如下操作:计算处理时间;如果有错误,将错误次数做加1操作;如果当前最大处理时间和前一个最大处理时间变量进行比较,若当前最大处理时间更大,则将最大处理时间修改为当前最大处理时间。
6.根据权利要求2所述的基于OSGI的业务模块监控***,其特征在于:
所述步骤S4中,监控模块是基于JMX开发的管理组件,运行在SP-Server中,用于汇总各种指标数据同时向指标采取器提供接口;监控模块向采集器提供:业务方法列表接口、指标获取接口、指标重置接口、业务组件控制接口。
CN201410472655.9A 2014-09-16 2014-09-16 基于osgi的业务模块监控方法 Active CN105490864B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410472655.9A CN105490864B (zh) 2014-09-16 2014-09-16 基于osgi的业务模块监控方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410472655.9A CN105490864B (zh) 2014-09-16 2014-09-16 基于osgi的业务模块监控方法

Publications (2)

Publication Number Publication Date
CN105490864A true CN105490864A (zh) 2016-04-13
CN105490864B CN105490864B (zh) 2018-12-07

Family

ID=55677607

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410472655.9A Active CN105490864B (zh) 2014-09-16 2014-09-16 基于osgi的业务模块监控方法

Country Status (1)

Country Link
CN (1) CN105490864B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106547888A (zh) * 2016-11-04 2017-03-29 北京集奥聚合科技有限公司 一种时间序列数据库的构造方法及***
CN108616395A (zh) * 2018-05-02 2018-10-02 济南浪潮高新科技投资发展有限公司 一种基于平台的业务软件监控***及方法
CN108769112A (zh) * 2018-04-18 2018-11-06 江苏物联网研究发展中心 一种非侵入式rpc接口监控方法及***
CN108897748A (zh) * 2018-04-18 2018-11-27 顺丰科技有限公司 一种HBase***监控方法及HBase***
CN109660402A (zh) * 2018-12-25 2019-04-19 钛马信息网络技术有限公司 业务***实时运营监控平台及方法
CN112230987A (zh) * 2020-10-29 2021-01-15 电信科学技术第五研究所有限公司 一种分布式模块化插件框架实现***及方法
CN112685256A (zh) * 2020-12-30 2021-04-20 上海掌门科技有限公司 服务端监控方法、设备和介质
CN112764990A (zh) * 2021-01-12 2021-05-07 北京自如信息科技有限公司 一种目标进程的监控方法、装置及计算机设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050050184A1 (en) * 2003-08-29 2005-03-03 International Business Machines Corporation Method, system, and storage medium for providing life-cycle management of grid services
CN103401704A (zh) * 2013-07-24 2013-11-20 佳都新太科技股份有限公司 一种分布式日志采集服务器的实现方案
CN103761235A (zh) * 2013-11-18 2014-04-30 芜湖大学科技园发展有限公司 通用电力数据平台的分布化方法和应用

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050050184A1 (en) * 2003-08-29 2005-03-03 International Business Machines Corporation Method, system, and storage medium for providing life-cycle management of grid services
CN103401704A (zh) * 2013-07-24 2013-11-20 佳都新太科技股份有限公司 一种分布式日志采集服务器的实现方案
CN103761235A (zh) * 2013-11-18 2014-04-30 芜湖大学科技园发展有限公司 通用电力数据平台的分布化方法和应用

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李顺 等: "面向OSGi框架的软件构件监控方法的设计与实现", 《计算机应用与软件》 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106547888A (zh) * 2016-11-04 2017-03-29 北京集奥聚合科技有限公司 一种时间序列数据库的构造方法及***
CN108769112A (zh) * 2018-04-18 2018-11-06 江苏物联网研究发展中心 一种非侵入式rpc接口监控方法及***
CN108897748A (zh) * 2018-04-18 2018-11-27 顺丰科技有限公司 一种HBase***监控方法及HBase***
CN108769112B (zh) * 2018-04-18 2021-11-12 江苏物联网研究发展中心 一种非侵入式rpc接口监控方法及***
CN108616395A (zh) * 2018-05-02 2018-10-02 济南浪潮高新科技投资发展有限公司 一种基于平台的业务软件监控***及方法
CN109660402B (zh) * 2018-12-25 2021-11-30 钛马信息网络技术有限公司 业务***实时运营监控平台及方法
CN109660402A (zh) * 2018-12-25 2019-04-19 钛马信息网络技术有限公司 业务***实时运营监控平台及方法
CN112230987A (zh) * 2020-10-29 2021-01-15 电信科学技术第五研究所有限公司 一种分布式模块化插件框架实现***及方法
CN112230987B (zh) * 2020-10-29 2023-12-01 电信科学技术第五研究所有限公司 一种分布式模块化插件框架实现***及方法
CN112685256A (zh) * 2020-12-30 2021-04-20 上海掌门科技有限公司 服务端监控方法、设备和介质
CN112685256B (zh) * 2020-12-30 2023-05-09 上海掌门科技有限公司 服务端监控方法、设备和介质
CN112764990B (zh) * 2021-01-12 2021-11-16 北京自如信息科技有限公司 一种目标进程的监控方法、装置及计算机设备
CN112764990A (zh) * 2021-01-12 2021-05-07 北京自如信息科技有限公司 一种目标进程的监控方法、装置及计算机设备

Also Published As

Publication number Publication date
CN105490864B (zh) 2018-12-07

Similar Documents

Publication Publication Date Title
CN105490864A (zh) 基于osgi的业务模块监控方法
CN108776934B (zh) 分布式数据计算方法、装置、计算机设备及可读存储介质
CN101799751B (zh) 一种构建主机监控代理软件的方法
WO2019006654A1 (zh) 金融自助设备维修派单生成方法、手持终端及电子设备
CN109214704A (zh) 一种分布式智能化运维平台、方法、装置及可读存储介质
CN103516802A (zh) 一种实现跨异构虚拟交换机无缝迁移的方法和装置
US10372572B1 (en) Prediction model testing framework
CN108777637A (zh) 一种支持服务器异构的数据中心综合管理***和方法
CN105430030A (zh) 基于osgi技术的可平行扩展的应用服务器
CN109962792A (zh) 一种基于大数据的全链路监控***
CN110750592A (zh) 数据同步的方法、装置和终端设备
CN115248826A (zh) 一种大规模分布式图数据库集群运维管理的方法和***
US11516033B1 (en) System and method for metering consumption
CN114422386A (zh) 一种微服务网关的监测方法及装置
US10474509B1 (en) Computing resource monitoring and alerting system
US9218205B2 (en) Resource management in ephemeral environments
US10785102B2 (en) Modifying distributed application based on cloud diagnostic data
EP4024761A1 (en) Communication method and apparatus for multiple management domains
CN106354723B (zh) 一种在线数据采集***
CN103078764A (zh) 基于虚拟计算任务的运行监测***及方法
CN105446707B (zh) 一种数据转换方法
CN116136801B (zh) 云平台的数据处理方法、装置、电子设备及存储介质
CN115525392A (zh) 容器监控方法、装置、电子设备及存储介质
CN115202973A (zh) 应用运行状态的确定方法、装置、电子设备和介质
CN114756301A (zh) 日志处理方法、装置和***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Monitoring Method of Business Module Based on OSGI

Effective date of registration: 20221021

Granted publication date: 20181207

Pledgee: Industrial Bank Co.,Ltd. Shanghai West sub branch

Pledgor: TAIMA INFORMATION NETWORK TECHNOLOGY Co.,Ltd.

Registration number: Y2022310000291

PE01 Entry into force of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right

Date of cancellation: 20230926

Granted publication date: 20181207

Pledgee: Industrial Bank Co.,Ltd. Shanghai West sub branch

Pledgor: TAIMA INFORMATION NETWORK TECHNOLOGY Co.,Ltd.

Registration number: Y2022310000291

PC01 Cancellation of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Business Module Monitoring Method Based on OSGI

Effective date of registration: 20231016

Granted publication date: 20181207

Pledgee: Industrial Bank Co.,Ltd. Shanghai West sub branch

Pledgor: TAIMA INFORMATION NETWORK TECHNOLOGY Co.,Ltd.

Registration number: Y2023310000647

PE01 Entry into force of the registration of the contract for pledge of patent right