CN101296115B - 电信网络多维监控方法 - Google Patents

电信网络多维监控方法 Download PDF

Info

Publication number
CN101296115B
CN101296115B CN2007101146119A CN200710114611A CN101296115B CN 101296115 B CN101296115 B CN 101296115B CN 2007101146119 A CN2007101146119 A CN 2007101146119A CN 200710114611 A CN200710114611 A CN 200710114611A CN 101296115 B CN101296115 B CN 101296115B
Authority
CN
China
Prior art keywords
data
alarm
network element
responsible
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2007101146119A
Other languages
English (en)
Other versions
CN101296115A (zh
Inventor
宫钦
陈刚
韩建友
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Group Shandong Co Ltd
Original Assignee
China Mobile Group Shandong Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Group Shandong Co Ltd filed Critical China Mobile Group Shandong Co Ltd
Priority to CN2007101146119A priority Critical patent/CN101296115B/zh
Publication of CN101296115A publication Critical patent/CN101296115A/zh
Application granted granted Critical
Publication of CN101296115B publication Critical patent/CN101296115B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

一种电信网络多维监控方法,包括前台显示步骤,负责完成用户交互,数据呈现的功能;后台TUXEDO中间件进程,负责完成数据向前台模块的传递;后台采集步骤,负责完成数据的采集;后台集中代理步骤,后台负责完成和网元的命令交互;后台TUXEDO中间件传递步骤,负责完成数据的实时传递和消息、数据服务;后台数据库存储步骤,用于汇总网元监控数据(15分钟数据)、用于计算网元的得分、用于得到统计开始和结束时间。从设备自身告警、设备外部告警、设备性能告警等多个维度对网络进行实时监控,该方法不仅能够解决单纯通过设备告警发现不到的网络问题,而且能在故障之前提前预警故障隐患,从而可以及时采取措施规避故障的发生。

Description

电信网络多维监控方法
技术领域
本发明涉及电信网管领域,尤其涉及一种电信网络多维监控方法。
背景技术
电信网络的管理***基本上是遵照电信管理网TMN标准建立的,TMN对网络的管理划分为五个大的功能域,即性能管理、故障管理、配置管理、安全管理和帐务管理,以TMN为基础构造的网管***基本上分为性能管理子***、故障管理子***、配置管理子***、安全管理子***等主要的几个***,各子***分别专注于各自领域的管理功能;如性能管理子***主要用于对网络的性能进行管理;故障管理子***主要用于对网络的告警进行管理;配置管理子***主要用于对网络的配置信息进行管理。目前对电信网络的监控主要通过故障管理子***进行,性能管理子***主要用于对网络运行质量的事后分析和网络规划。现有的网络监控***是以设备告警监控技术构架而成的,在现代化的网络运维管理体制下,这种技术架构的弊端日益凸显,主要表现在以下几个方面:
1、以设备告警为主的监控模式不能提前发现设备故障隐患,当设备产生告警时,往往网络已经发生了故障,对设备告警实施监控是一种被动的监控方式,与通信行业、IT行业倡导的预防性维护、主动性维护,防患于未然的监控模式存在较大差距。
2、设备发生故障时,往往不能通过设备告警的形式提前表征出来,当客服前台收到大量用户投诉并通知网络部门时,监控人员才知道网络发生了故障,这与以客户为中心、先于客户投诉发现问题的管理要求相去甚远。
3、虽然网络性能统计能够反映网络的故障情况,但是传统性能管理子***1小时的统计粒度难以对网络事件进行实时监控,不能满足对网络实时监控的要求。
随着运维管理体制向着集中化的目标演进和发展,随着网络管理向以客户为中心的方向发展,随着网络监控向以预防性监控的目标演进,传统的网管***体系架构和管理模式已经逐步显现出弊端,各子***之间的信息交互越来越多,网络监控人员对跨***、跨专业之间的信息需求日益迫切,迫切需要对各专业网络的性能、故障、配置信息进行综合分析和呈现,从多个角度对各专业网络的运行情况进行全方位的监控,以便及时发现网络隐患;需要对不同专业网络的性能、故障、配置信息进行专业间的综合分析和呈现,以便从全程全网的角度分析故障的根源、影响范围,以便各专业监控人员快速、高效地进行协同进行故障处理。而现有的技术方案,存在监控方式单一,不利于及时发现网络故障的问题,无法满足现代网络运维的要求,因此需要通过新的技术方案解决这个问题。
在现有的技术条件下,对网络的实时监控只能通过设备告警的方式实现,通过设备告警进行网络监控具有两个弊端:一是当设备产生告警时,设备已经发生了故障,并不能起到预防性监控的作用;二是设备在发生某些故障的情况下,并没有相关告警产生,监控人员单纯依赖告警监控无从发现网络故障。
发明内容
本发明主要解决现有技术条件下,监控方式单一,监控效率低下,不能提前发现网络故障、不能及时发现网络故障的问题。本发明的目的是构建集性能、故障、配置于一体的、多领域的、综合的多维管理***,从通信网络的多个维度来及时发现网络隐患。
一种电信网络多维监控方法,包括:
后台集中代理步骤,后台负责完成和网元的命令交互;
后台采集步骤,负责完成数据的采集;
后台数据库存储步骤,用于汇总网元监控数据,从告警数据库和性能数据库汇总采集的告警数据和性能指标数据,根据所述告警数据和性能指标数据计算网元的得分、用于得到统计开始和结束时间;
后台TUXEDO中间件传递步骤,负责完成所述网元得分向前台模块的传递;
前台显示步骤,负责完成用户交互,网元得分呈现的功能。
所述汇总性能指标数据是根据当前时间计算得到最新数据的采集时间段和网元显示粒度,依次从指标对应的表中计算指标值,然后***到用于显示的stat_dim_ne表中。汇总告警数据是根据告警标题、告警级别和汇总性能指标数据时得到的采集时间段,计算当前时间段内各网元对应的各种告警的数量,并且此数据作为指标值***到用于显示的stat_dim_ne表中;同时把各告警的详细信息保存到表stat_dim_ne_detail中。
一种电信网络多维监控***,包括:
后台集中代理模块,后台负责完成和网元的命令交互;
后台数据采集模块,负责完成数据的采集;
后台数据库存储模块,用于汇总网元监控数据,从告警数据库和性能数据库汇总采集的告警数据和性能指标数据,根据所述告警数据和性能指标数据计算网元的得分、用于得到统计开始和结束时间;
后台TUXEDO中间件传递模块,负责完成所述网元得分向前台模块的传递;
前台显示模块,负责完成用户交互,网元得分呈现的功能。
电信网络多维监控***包括的模块如下:
MDMonitor.exe    前台显示模块,负责完成用户交互,数据呈现的功能。
Dimmgr           后台TUXEDO中间件传递模块,负责完成数据向前台模块的传递。
RoundTrip.sh     后台数据采集模块,负责完成数据的采集。
后台集中代理模块  后台模块,负责完成和网元的命令交互。
后台TUXEDO中间件传递模块  负责完成数据的实时传递和消息、数据服务。
在后台,用到的数据库存储过程如下:
(1)ap_stat_dim.sql
用于汇总网元监控数据(15分钟数据)
(2)score.sql
(3)ap_get_start_endtime.sql
用于得到统计开始和结束时间。
Dimmgr是一个后台TUXEDO中间件进程,具体包括的各服务模块如下:
Figure DEST_PATH_GSB00000046040700021
本发明构建的多维监控***,从设备自身告警、设备外部告警、设备性能告警等多个维度对网络进行实时监控,不仅能够解决单纯通过设备告警发现不到的网络问题,而且能在故障之前提前预警故障隐患,从而可以采取措施避免故障的发生。
在电信管理网TMN的基础上,将传统的告警监控扩展为集设备告警、动环告警、设备性能为一体的多维监控,以便从通信网络的多个角度来发现问题。
设备发生故障之前,往往表现为设备性能的降低或者劣化,设备性能监控具有提前发现设备劣化趋势、提前发现设备服务质量降低的特点,通过对设备性能的实时监控,可以提前发现通过设备告警发现不到的问题。实时性能监控不仅能提前发现设备隐患,而且能实时反映网络的运行情况,从而对网络做出快速调整。
附图说明
图1:MSC多维监控界面;
图2:***架构图;
图3:***处理流程图;
图4:告警处理流程图;
图5:15分钟性能数据采集处理流程图;
图6:人机命令性能采集处理流程图;
图7:网元消息性能采集处理流程图。
具体实施方式
电信网络的管理***结构如图2所示,分为呈现层、数据处理层、数据采集层。
数据采集层:数据服务层主要完成接入协议转换、接入服务和数据采集的功能,数据采集层根据不同的数据采集要求,自动采集数据,存放在指定目录下。采集失败时,写相应的采集失败记录。
数据处理层:完成数据的汇总、分析,并通过DIMMGR进程把数据呈现到呈现层。
应用呈现层:根据用户所要求的不同的功能,进行相应的处理。处理完成后,由应用服务层把处理结果反映到客户端。利用TUXEDO中间件,对用户所要求的操作进行反馈,把操作结果及时、准确地反映到MDMonitor.exe终端。
以移动交换机(MSC)的多维监控为例,从MSC设备告警、MSC所在机房动力环境告警、MSC性能预警三个维度进行监控,监控界面如图1所示。当MSC即将发生问题时,故障隐患可能从不同的方面表现出来,多个维度的综合监控,可以确保不漏过来自任何方面的故障隐患。
设备告警从严重告警、主要告警、普通告警和次要告警四个方面进行监控;
机房动力环境告警从为MSC提供服务的UPS、开关电源、蓄电池等方面的告警进行监控;
MSC性能预警从处理器负荷、***接通率、位置更新成功率、寻呼成功率等关键指标进行监控预警。
对于每个性能指标,设定了三级预警门限,分为一般告警、主要告警和严重告警,当达到一级预警门限时,用黄色提醒,当达到二级预警门限时,用橙色提醒,当达到三级预警门限时,用红色提醒。
为了达到更好的监控效果,对所监控的MSC采用了自动排序算法,根据MSC各种告警的数量和性能指标的数值算出每个MSC的得分,按照得分自动进行排序,性能最差的网元排在最前面,从而保证有故障隐患的网元总是呈现在监控人员的视野之内。自动排序算法如下:
MSC得分=(MSC严重告警数量/所有MSC严重告警数量)×(MSC主要告警数量/所有MSC主要告警数量)×(MSC次要告警数量/所有MSC次要告警数量)×(MSC普通告警数量/所有MSC普通告警数量)×(MSC开关电源直流输出电压异常告警数量/所有MSC开关电源直流输出电压异常告警数量)×(MSC开关电源电池总电压低告警数量/所有MSC开关电源电池总电压低告警数量)×(MSC机房温度异常告警数量/所有MSC机房温度异常告警数量)×CP负荷×(MSC话务量/所有MSC话务量)×(MSC登记用户数/所有MSC登记用户数)×(1-位置更新成功率)×(1-寻呼成功率)
除了自动排序功能外,***还提供了手工排序的功能,即能够对任一个监控项目进行手工排序,以便监控人员随心所欲、有针对性地进行监控和分析。
本发明主要实现对电信设备故障告警、设备外部动力环境告警和设备性能数据的多维度综合监控。***处理流程如图3所示。电信设备的告警数据和性能数据在经过采集、分析处理后进行入库操作,由于性能数据和告警数据的格式和内容存在较大差异,为了便于数据的处理和显示,本发明对其进行了归一化处理,定义了归一化的数据库表结构stat_dim_ne,表结构如下:
 字段 类型
 Starttime  datet ime year to second
 Endtime  datetime year to second
 City_id  Smallint
 Object_rdn  varchar(30)
 Object_class  Smallint
 字段 类型
 Object_score  float
 Itemclass  Varchar(30)
 Itemcode  varchar(30)
 Itemvname  varchar(60)
 Itemvalue  decimal(12,4)
本发明定义了一个后台守护进程,目的是每15分钟从告警数据库和性能数据库汇总告警数据和性能指标数据。汇总性能数据时,根据当前时间计算得到最新数据的采集时间和网元显示粒度,依次从指标对应的表中计算指标值,然后***到stat_dim_ ne表中。汇总告警数据时,根据告警标题、告警级别和汇总性能数据时得到的采集时间段,计算当前时间段内各网元对应的各种告警的数量,并且此数据作为指标值***到stat_dim_ne表中。同时把各告警的详细信息保存到表stat_dim_ne_detail中。数据汇总结束后,由ap_get_start_endtime.sql得到统计的时间段,根据发明内容中说明的网元得分计算公式,由score.sql依次计算各个网元的得分,并更新表stat_dim_ne,这样这个守护进程就执行结束了。
当客户端进行数据请求时,服务器就可以把守护进程得到的数据传送给客户端,客户端得到数据后,根据网元得分的高低,依次显示。其中显示时,对于每一个指标值,如果得到的此指标值超过了对应的门限,就把显示此数据的方格背景色置为相应的告警色。告警监控下显示的是各告警对应的告警数量,如果告警数量大于0,就提供一个链接,当点击这个方格时,就弹出一个列表框显示此网元此告警的详细告警信息。这样网络监控人员就可以根据每个网元的告警数据和性能数据分析此网元的工作状态。
多维监控***中设备故障告警和设备外部动力环境告警都属于告警数据,告警数据通过告警队列上报到网管服务器,服务器实时接收队列中的消息就可以得到告警数据。对告警数据的采集、处理和呈现的具体流程如图4所示。告警采集到以后,首先要进行告警数据进行格式转换,转换成统一的格式,如表所示:
字段 类型
告警号 Long
地市 char
网元 char
告警对象 char
告警内容 char
告警标题 char
格式转换完成后,根据告警内容,判断是活动告警还是清除告警。如果是活动告警,由Dimmgr分析告警内容,入到活动告警表中,活动告警表如下所示:
字段 类型
告警号 Long
地市 char
网元 char
告警对象 char
告警内容 char
字段 类型
告警标题 char
告警产生时间 datet ime
然后通过TUXEDO中间件,实时上报告警消息到MDMonitor.exe。由MDMonitor.exe完成数据的呈现。
如果是清除告警,由Dimmgr提取出告警清除信息,信息格式如下:
告警号 告警对象 清除时间
然后入到清除告警表中,表结构如下:
字段 类型
告警号 Long
[0068]
地市 char
网元 char
告警对象 char
告警内容 char
告警标题 char
告警清除时间 datetime
清除告警通过TUXEDO中间件,实时上报告警消息到MDMonitor.exe。由MDMonitot.exe完成界面上呈现的告警的清除。
在性能实时监控的实现手段上,根据设备性能指标的不同特点,分别采用了以下三个模块来实现:
(1)通过ap_stat_dim.sql模块,完成15分钟粒度性能统计:通过在OMC上开启15分钟粒度统计实现,15分钟粒度统计比传统的1小时为周期的性能统计缩短了监控周期,提高了性能劣化事件的反应速度。如图5所示,从OMC上提取出15分钟的数据后,形成入库文件,入到性能数据库中,由ap_stat_dim.sql完成数据的统计、汇总。
(2)通过集中代理模块,完成人机命令数据采集:通过对网元下发人机命令实现,人机命令方式具有监控周期可以随意调整、延迟时间短的优点。如图6所示,首先连接到集中代理模块,通过该模块登录到网元,发数据采集命令。数据采集到后,进行分析入库,然后通过MDMonitor.exe模块把数据呈现出来。
(3)通过TUXEO中间件的实时队列,完成数据的自动上报:部分设备厂商的网元具有消息自动上报通道,即当网元的性能指标超过门限时能自动向上级网管发送消息,这种主动通知方式具有对网元侧和网管侧开销小,实时性强的特点,特别适用于对设备的性能预警。如图7所示,TUXEO中间件收到告警消息后,由Dimmgr对告警内容进行分析、提取,然后通过TUXEO中间件的实时消息队列,把数据传递到MDMonitot.exe模块,通过MDMonitor.exe模块把数据呈现出来。

Claims (4)

1.一种电信网络多维监控方法,包括:
后台集中代理步骤,后台负责完成和网元的命令交互;
后台采集步骤,负责完成数据的采集;
后台数据库存储步骤,用于汇总网元监控数据,从告警数据库和性能数据库汇总采集的告警数据和性能指标数据,根据所述告警数据和性能指标数据计算网元的得分、用于得到统计开始和结束时间;
后台TUXEDO中间件传递步骤,负责完成所述网元得分向前台模块的传递;
前台显示步骤,负责完成用户交互,网元得分呈现的功能。
2.根据权利要求1所述的电信网络多维监控方法,其特征是所述汇总性能指标数据是根据当前时间计算得到最新数据的采集时间段和网元显示粒度,依次从指标对应的表中计算指标值,然后***到用于显示的stat_dim_ne表中。
3.根据权利要求1所述的电信网络多维监控方法,其特征是汇总告警数据是根据告警标题、告警级别和汇总性能指标数据时得到的采集时间段,计算当前时间段内各网元对应的各种告警的数量,并且此数据作为指标值***到用于显示的stat_dim_ne表中;同时把各告警的详细信息保存到表stat_dim_ne_detail中。
4.一种电信网络多维监控***,包括:
后台集中代理模块,后台负责完成和网元的命令交互;
后台数据采集模块,负责完成数据的采集;
后台数据库存储模块,用于汇总网元监控数据,从告警数据库和性能数据库汇总采集的告警数据和性能指标数据,根据所述告警数据和性能指标数据计算网元的得分、用于得到统计开始和结束时间;
后台TUXEDO中间件传递模块,负责完成所述网元得分向前台模块的传递;
前台显示模块,负责完成用户交互,网元得分呈现的功能。
CN2007101146119A 2007-11-22 2007-11-22 电信网络多维监控方法 Active CN101296115B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2007101146119A CN101296115B (zh) 2007-11-22 2007-11-22 电信网络多维监控方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2007101146119A CN101296115B (zh) 2007-11-22 2007-11-22 电信网络多维监控方法

Publications (2)

Publication Number Publication Date
CN101296115A CN101296115A (zh) 2008-10-29
CN101296115B true CN101296115B (zh) 2010-08-18

Family

ID=40066145

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007101146119A Active CN101296115B (zh) 2007-11-22 2007-11-22 电信网络多维监控方法

Country Status (1)

Country Link
CN (1) CN101296115B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102118276B (zh) * 2009-12-31 2014-01-15 亿阳信通股份有限公司 提供性能告警服务的方法和装置
CN102546216B (zh) * 2010-12-30 2015-03-11 ***通信集团山东有限公司 网络管理***中的告警消息处理方法及网络管理***
CN102098176A (zh) * 2011-01-28 2011-06-15 浪潮通信信息***有限公司 一种通信网管***中的告警模拟器
CN102769535A (zh) * 2011-05-06 2012-11-07 中兴通讯股份有限公司 一种呈现告警数据统计结果的方法及***
CN102217232A (zh) * 2011-05-13 2011-10-12 华为技术有限公司 确定网元运行状态方法以及相关设备和***
CN102360323A (zh) * 2011-10-28 2012-02-22 东莞市正欣科技有限公司 一种网络服务器宕机自修复的方法及***
CN102497284B (zh) * 2011-12-06 2015-05-27 摩卡软件(天津)有限公司 一种整合监控软件告警的方法和***
CN102970165B (zh) * 2012-11-20 2015-07-08 北京思特奇信息技术股份有限公司 一种网络设备联合分析告警***
CN104113872B (zh) * 2013-04-22 2018-06-26 ***通信集团湖北有限公司 一种数据业务监控方法及***
CN103259682A (zh) * 2013-05-16 2013-08-21 浪潮通信信息***有限公司 一种基于多维数据聚合的通信网网元安全评估方法
CN105407011B (zh) * 2015-10-26 2018-10-19 贵州电网公司信息通信分公司 一种it基础平台监控指标采集***及采集方法
CN107665214A (zh) * 2016-07-28 2018-02-06 ***通信集团内蒙古有限公司 一种信息获取方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1154030A (zh) * 1996-10-22 1997-07-09 北京市电话局 程控交换机集中操作维护***
CN1536829A (zh) * 2003-04-09 2004-10-13 华为技术有限公司 一种通讯网络设备蓄电池在线监测方法
CN1882149A (zh) * 2005-06-13 2006-12-20 中兴通讯股份有限公司 应用于宽带无线接入***中的调试***及调试方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1154030A (zh) * 1996-10-22 1997-07-09 北京市电话局 程控交换机集中操作维护***
CN1536829A (zh) * 2003-04-09 2004-10-13 华为技术有限公司 一种通讯网络设备蓄电池在线监测方法
CN1882149A (zh) * 2005-06-13 2006-12-20 中兴通讯股份有限公司 应用于宽带无线接入***中的调试***及调试方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
袁俊佳等.移动综合网管监控数据采集.应用科技33 10.2006,33(10),32-41. *

Also Published As

Publication number Publication date
CN101296115A (zh) 2008-10-29

Similar Documents

Publication Publication Date Title
CN101296115B (zh) 电信网络多维监控方法
CN107302466B (zh) 一种动环监控***大数据分析平台及方法
CN110493348A (zh) 一种基于物联网的智能监控报警***
CN102998577B (zh) 检测和定位电网中的异常状况和电力故障的***和方法
US6792269B2 (en) System, method and apparatus for tracking deployment of cellular telephone network sites
CN107707029B (zh) 中低压配电网一体化监控与管理***
US11012461B2 (en) Network device vulnerability prediction
CN105871605A (zh) 一种基于电力营销大数据的运维监控平台
CN109783322A (zh) 一种企业信息***运行状态的监控分析***及其方法
US11258855B2 (en) System and method for analyzing and monitoring smart meter network communications
US20110119517A1 (en) Systems and Methods for Classifying Power Network Failures
CN102624554B (zh) 一种结合了设备管理和业务管理的综合网络管理方法
CN104317603A (zh) 一种基于scada***的智能报警***
CN104753178A (zh) 一种电网故障处理***
CN105262210A (zh) 一种变电站网络安全性分析预警***和方法
CN106960292A (zh) 一种应用于电力公司的业务流程监测***及方法
CN108667666A (zh) 一种基于可视化技术的智能运维方法及其***
CN104052634B (zh) 信息安全监控***及方法
CN112688819A (zh) 一种用于网络运维综合管理***
US7099660B2 (en) System, method and apparatus for a network-organized repository of data
CN112865311B (zh) 一种电力***消息总线监视方法和装置
CN101404803A (zh) 一种网管***的多维监控方法
CN110908325A (zh) 一种高铁站信息机房电源设备运维监控***
CN113076229B (zh) 一种通用的企业级信息技术监控***
EP1622310B1 (en) Administration method and system for network management systems

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant