CN103200046B - 监控网元设备性能的方法及*** - Google Patents
监控网元设备性能的方法及*** Download PDFInfo
- Publication number
- CN103200046B CN103200046B CN201310104796.0A CN201310104796A CN103200046B CN 103200046 B CN103200046 B CN 103200046B CN 201310104796 A CN201310104796 A CN 201310104796A CN 103200046 B CN103200046 B CN 103200046B
- Authority
- CN
- China
- Prior art keywords
- network element
- log data
- information
- performance
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 49
- 238000000034 method Methods 0.000 title claims abstract description 41
- 230000005540 biological transmission Effects 0.000 claims abstract description 32
- 238000004458 analytical method Methods 0.000 claims description 105
- 238000005070 sampling Methods 0.000 claims description 22
- 238000013500 data storage Methods 0.000 claims description 10
- 230000002776 aggregation Effects 0.000 claims description 6
- 238000004220 aggregation Methods 0.000 claims description 6
- 238000004806 packaging method and process Methods 0.000 claims description 5
- 238000007405 data analysis Methods 0.000 abstract description 4
- 238000012546 transfer Methods 0.000 abstract description 4
- 238000011156 evaluation Methods 0.000 abstract 1
- 230000006399 behavior Effects 0.000 description 70
- 230000006870 function Effects 0.000 description 36
- 238000012545 processing Methods 0.000 description 13
- 230000009471 action Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 8
- 230000002085 persistent effect Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 230000002688 persistence Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明公开了一种监控网元设备性能的方法及***。该方法包括:在所述网元设备中,预先设置用于性能监控的数据格式以及数据传输方式;采集性能信息,按照预先设置的数据格式将性能信息封装为日志数据,根据预先设置的数据传输方式传输日志数据;接收发送的日志数据,按照预先设置的性能信息采集周期,对日志数据进行聚类;按照预先设置的日志数据合并周期,对聚类的日志数据进行合并,根据合并处理得到的日志数据,进行网元设备性能分析。应用本发明,可以提高日志数据分析结果的可靠性。
Description
技术领域
本发明涉及通信监控技术,尤其涉及一种监控网元设备性能的方法及***。
背景技术
随着通信技术的发展,通信***服务的用户数量日益增大,为了提高通信***中数据传输的效率,提升用户的业务体验,在通信***中,各网元设备一般采用并发的数据传输方式向用户提供服务。以智能电视***为例,由于数字电视技术的广泛应用,用户数量众多,导致智能电视***中各网元设备的并发处理量(性能)日益增大。因而,为了提升用户体验,对智能电视***中各网元设备的并行处理性能的要求也日益增强。
为了保障智能电视***的并行处理能力,维护智能电视***的正常运行,需要对智能电视***中各网元设备的性能进行监控,例如,负载信息、CPU占用率等,以确保接入用户的数据传输速率,例如,需要确保网元设备能够向接入用户提供10K/S以上的并发传输量。现有技术中,一般通过在智能电视***中设置日志监控器,日志监控器实时获取智能电视***中的网元设备的性能信息,对获取的性能信息进行抽样,并将抽样得到的性能信息以日志数据方式写入硬盘,根据日志数据进行网元性能分析;如果性能分析结果表明该网元的并发速率低于10K/S,则对接入的用户数进行控制,以保障接入用户的数字电视业务体验。
由上述可见,现有监控网元设备性能的方法,通过周期性的抽样方式采集性能信息(日志数据)并进行分析,导致进行分析的日志数据不能涵盖智能电视***中该网元设备性能的源数据,使得对于网元设备的性能的分析结果可靠性较低;进一步地,由于该分析结果不能反映网元设备的真实性能状况,如果根据该分析结果进行控制,则控制效果较差。另一方面,如果不对网元设备的性能信息进行抽样处理,则对于智能电视***的网元设备这种规模生成的日志数据,不仅日志监控器的存储空间难以满足,而且日志监控器对日志数据的分析,所需数据处理的资源耗费极大,日志数据分析难以实现。
现有技术中,尽管对性能信息进行抽样并进行分析,减少传输的日志数据量和后台计算量,但是由于对性能信息的处理方式不能保持涵盖网元设备性能的源数据,因此,现有技术无法很好地监控对网元设备性能。换言之,现有技术中存在对一种能够减少传输的日志数据量和后台计算量,并且同时可以涵盖网元设备性能的源数据的监控网元设备性能的技术的需要。
发明内容
本发明的实施例提供一种监控网元设备性能的方法,提高日志数据分析结果的可靠性。
本发明的实施例还提供一种监控网元设备性能的***,提高日志数据分析结果的可靠性。
为达到上述目的,本发明实施例提供的一种监控网元设备性能的方法,在所述网元设备中,预先设置用于性能监控的数据格式以及数据传输方式,该方法包括:
采集性能信息,按照预先设置的数据格式将性能信息封装为日志数据,根据预先设置的数据传输方式传输日志数据;
接收发送的日志数据,按照预先设置的性能信息采集周期,对日志数据进行聚类;
按照预先设置的日志数据合并周期,对聚类的日志数据进行合并,根据合并处理得到的日志数据,进行网元设备性能分析。
其中,所述数据格式包括:网元设备识别码、功能编号、行为标识、数据时间点以及附加数据等信息;
所述数据传输方式为用户数据报协议传输。
其中,所述行为标识为触发行为标识、持续行为标识或错误行为标识。
其中,所述对日志数据进行聚类包括:
A11,在预先设置的性能信息采集周期内,解析接收的日志数据,获取日志数据中包含的网元设备识别码信息、网元设备编号信息、功能编号信息以及行为标识信息;
A12,判断解析得到的行为标识信息是否为持续行为标识信息,如果是,执行步骤A13,否则,执行步骤A15;
A13,记录日志数据中持续行为开始对应的数据时间点信息,将该日志数据放入临时缓存中;
A14,在监测到该持续行为结束后,将临时缓存中该持续行为的日志数据合并为一条包含持续时长的日志数据,执行步骤A15;
A15,统计接收的具有相同网元设备识别码信息、网元设备编号信息、功能编号信息以及行为标识信息的日志数据总次数、均值、极大值以及极小值;
A16,根据统计得到的总次数、均值、极大值以及极小值,构建聚类的日志数据。
其中,所述方法进一步包括:
从接收的具有相同网元设备识别码信息、网元设备编号信息、功能编号信息以及行为标识信息的日志数据中,抽取预设阈值的日志数据,记录抽取的日志数据的数据时间点信息以及持续时间信息,生成抽样集合。
其中,所述构建聚类的日志数据包括:
判断接收的日志数据中行为标识信息是否为错误行为信息,如果是,构建聚类的错误行为日志数据,否则,构建聚类的功能日志数据。
其中,所述聚类的功能日志数据包括:网元设备识别码信息、网元设备编号信息、功能编号信息、性能信息采集时间段信息、总次数信息、均值信息、极大值信息、极小值信息以及{抽样集合(时间,值)}信息。
其中,所述聚类的错误行为日志数据包括:网元设备识别码信息、网元设备编号信息、功能编号信息、性能信息采集时间段信息以及错误信息。
其中,所述对聚类的日志数据进行合并包括:
在预先设置的日志数据合并周期内,根据接收的聚类的日志数据,合并包含相同网元设备识别码信息、网元设备编号信息以及功能编号信息的日志数据,得到合并的日志数据。
其中,所述方法进一步包括:
展示合并的日志数据或展示进行网元设备性能分析的结果。
其中,所述方法进一步包括:
在网元设备性能分析结果表明并发速率低于预先设置的速率阈值时,对接入智能电视***的用户数进行控制。
一种监控网元设备性能的***,该***包括:网元设备、代理服务器、汇聚服务器以及性能分析服务器,其中,
网元设备,存储预先设置的用于性能监控的数据格式以及数据传输方式;采集性能信息,按照预先设置的数据格式将性能信息封装为日志数据,根据预先设置的数据传输方式向代理服务器传输日志数据;
代理服务器,用于接收网元设备发送的日志数据,按照预先设置的性能信息采集周期,对日志数据进行聚类,输出至汇聚服务器;
汇聚服务器,用于按照预先设置的日志数据合并周期,对接收的聚类的日志数据进行合并,输出至性能分析服务器;
性能分析服务器,用于根据合并处理得到的日志数据,进行网元设备性能分析。
较佳地,所述性能分析服务器进一步用于展示合并的日志数据或进行网元设备性能分析的结果。
较佳地,所述性能分析服务器包括:日志数据存储单元、分析单元、分析结果存储单元以及分析结果展示单元,其中,
日志数据存储单元,用于存储汇聚服务器输出的传输控制协议数据包;
分析单元,用于读取日志数据存储单元存储的传输控制协议数据包,进行分析,将分析结果输出至分析结果存储单元;
分析结果存储单元,用于存储分析单元输出的分析结果;
分析结果展示单元,用于从分析结果存储单元中读取分析结果并展示。
较佳地,所述代理服务器部署在所述网元设备上,所述网元设备通过用户数据报协议方式,将日志数据传输给部署在所述网元设备上的所述代理服务器。
较佳地,所述***进一步包括:
配置服务器,用于配置包含设置数据格式、数据传输方式以及网元设备属性的配置信息,并将配置信息下发至网元设备;监控代理服务器的状态,当监测到代理服务器宕机时,通过远程控制修复并启动宕机的代理服务器。
较佳地,所述***进一步包括:
控制服务器,用于读取性能分析服务器分析得到的网元设备性能分析结果,如果网元设备性能分析结果表明并发速率低于预先设置的速率阈值,对接入智能电视***的用户数进行控制。
由上述技术方案可见,本发明实施例提供的一种监控网元设备性能的方法及***,是在业务层面监控网元设备性能。由于实时采集性能信息,按照预先设置的数据格式将采集的性能信息封装为日志数据,根据预先设置的数据传输方式传输日志数据,因此本发明不是针对每一日志数据进行性能分析。接着,接收发送的日志数据,按照预先设置的性能信息采集周期,对日志数据进行诸如总次数、均值、极大值以及极小值的聚类,可以有效减少传输的日志数据量和后台计算量。最后,按照预先设置的日志数据合并周期,对聚类的日志数据进行合并,根据合并处理得到的日志数据,进行网元设备性能分析。这样,进行聚类处理的日志数据能够涵盖智能电视***中该网元设备性能的源数据,提升了分析结果的可靠性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,以下将对实施例或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,以下描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员而言,还可以根据这些附图所示实施例得到其它的实施例及其附图。
图1为本发明实施例监控网元设备性能的方法流程示意图。
图2为本发明实施例监控网元设备性能的***结构示意图。
图3为本发明实施例网元设备输出的日志数据结构示意图。
图4为本发明实施例聚类的功能日志数据结构示意图。
图5为本发明实施例合并的功能日志数据结构示意图。
图6为本发明实施例展示的分析结果结构示意图。
具体实施方式
以下将结合附图对本发明各实施例的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施例,都属于本发明所保护的范围。
现有监控网元设备性能的方法,通过抽样方式采集性能信息,生成日志数据进行分析,导致进行分析的日志数据不能涵盖智能电视***中该网元设备实时性能的源数据,使得分析的结果可靠性较低。
用户数据报协议(UDP,UserDatagramProtocol)是开放***互连(OSI,OpenSystemsInterconnection)参考模型中一种无连接的传输层协议,UDP不提供数据包分组、组装以及排序服务,只能提供面向事务的简单不可靠信息传送服务。通过UDP协议,可以将网络数据流量压缩成UDP数据包的形式,由于UDP不属于连接型协议,因而具有资源消耗小、处理速度快的优点,可用于需要在计算机之间传输数据的网络应用。例如,网络视频会议、音频、视频和普通数据传送(ICQ和QQ)应用,该类应用在传输时,即使丢失少量UDP数据包,也不会对接收结果产生太大影响。
本发明实施例中,提出一种监控网元设备性能的方法,在智能电视***的网元设备中,设置通过UDP数据包方式输出反映性能状态的日志数据。这样,由于UDP数据包方式的资源消耗小,对网元设备的并发性能几乎不会有影响;本发明实施例的监控网元设备性能的***在接收到UDP数据包后,采用流计数的方式归并UDP数据包中的日志数据,即采用计算归并计数、均值、归并、极大极小值、抽样等方式归并日志数据,然后进行传输。这样,不仅可以极大地减少传输的数据量,而且,归并的日志数据可以涵盖智能电视***中该网元设备的源数据,从很大程度上保持了日志数据的原貌,从而实现网元设备集中式性能实时监控的要求。
图1为本发明实施例监控网元设备性能的方法流程示意图。参见图1,该流程包括:
步骤101,在网元设备中,预先设置用于性能监控的数据格式以及数据传输方式;
本步骤中,数据格式以及数据传输方式可以是在配置服务器上设置好后,再下发至各网元设备,也可以是直接在各网元设备上设置数据格式以及数据传输方式。其中,
数据格式包括:网元设备识别码、功能编号、行为标识、数据时间点以及附加数据等信息。其中,
网元设备识别码为网元设备标识,用于区分智能电视***中各网元设备,网元设备识别码与网元设备为一一对应关系;
功能编号用于标识性能信息在网元设备中所属的功能,即性能信息是网元设备内的哪个具体功能数据,例如,音频、视频等;
行为标识用于标识性能信息在网元设备中的行为。可以为触发行为、持续行为或错误行为。其中,
触发行为表示当事件发生时,例如,当功能被使用时,则记录一条相应的日志数据。持续行为表示事件持续的时间,包括:开始行为信息和结束行为信息。错误行为则表示当前运行出现错误,记录错误数据和原因。其中,触发行为只需统计触发次数,而对于持续行为,不仅统计触发次数,还统计处理该行为的时间。实际应用中,需要上报哪种行为,可以由数据统计需求来决定。举例来说,如果一个功能A被触发了,则记录功能A有一次,为触发行为;如果需要记录功能A持续的时间,例如,完成该功能需要1毫秒,则在功能A开始时申报一条持续行为开始,在功能A结束时再申报一条持续行为结束,代理服务器自动将持续行为开始以及持续行为结束进行归并。
数据时间点为记录性能信息的时间点信息;
附加数据为具体的性能信息。例如,当发生错误行为时,附加数据为发生错误的详细信息;而触发行为发生时,附加数据为调试信息等。
较佳地,数据格式还可以进一步包括网元设备编号,用于标识智能电视***中部署的网元设备,网元设备与网元设备编号可以为一对多关系,即一个网元设备可以具有多个网元设备编号。
数据传输方式为UDP传输。
步骤102,网元设备采集性能信息,按照预先设置的数据格式将性能信息封装为日志数据,根据预先设置的数据传输方式向代理服务器传输日志数据;
本步骤中,日志数据包括:网元设备识别码信息、网元设备编号信息、功能编号信息、行为标识信息、数据时间点信息以及附加数据信息等。
网元设备通过UDP方式传输日志数据,资源消耗小,对网元设备的并发性能几乎不会有影响。
步骤103,代理服务器接收网元设备发送的日志数据,按照预先设置的性能信息采集周期,对日志数据进行聚类,输出至汇聚服务器;
本步骤中,性能信息采集周期可以根据实际需要确定。
对日志数据进行聚类包括:
A11,在预先设置的性能信息采集周期内,解析接收的日志数据,获取日志数据中包含的网元设备识别码信息、网元设备编号信息、功能编号信息以及行为标识信息;
A12,判断解析得到的行为标识信息是否为持续行为标识信息,如果是,执行步骤A13,否则,执行步骤A15;
A13,记录日志数据中持续行为开始对应的数据时间点信息,将该日志数据放入临时缓存中;
A14,在监测到该持续行为结束后,将临时缓存中该持续行为的日志数据合并为一条包含持续时长的日志数据,执行步骤A15;
本步骤中,对于持续行为的日志数据,将持续行为开始至持续行为结束时的日志数据合并为一条包含持续时长的日志数据,可以有效降低待传输的日志数据量。实际应用中,当结束行为等待超时时,可以合并成一条超时的持续行为数据(日志数据)。当对持续行为进行合并后,同一持续行为,对应一条日志数据。
A15,统计接收的具有相同网元设备识别码信息、网元设备编号信息、功能编号信息以及行为标识信息的日志数据总次数、均值、极大值以及极小值;
本步骤中,在预先设置的性能信息采集周期内,统计来自同一网元设备中相同功能以及相同行为的日志数据,从而可以对网元设备中各功能的性能情况进行监控。
本发明实施例中,根据行为标识进行日志数据均值、极大值、极小值的统计,统计粒度较大,为了细化统计粒度,还可以对日志数据进行抽样集合处理,用以保留一些详细的性能信息作为进行网元设备性能分析的参考。例如,如果一秒种发生一万条包含同一行为的日志数据,全部记录该日志数据是比较困难的,但可以通过抽样集合处理,例如,通过每隔固定时间的抽样方式,记录其中的20条日志数据,可以反映网元设备的一部分细节。因而,较佳地,该方法还可以进一步包括:
从接收的具有相同网元设备识别码信息、网元设备编号信息、功能编号信息以及行为标识信息的日志数据中,抽取预设阈值的日志数据,记录抽取的日志数据的数据时间点信息以及持续时间信息,生成抽样集合。
本步骤中,抽样集合以{抽样集合(时间,值)}表示,例如,{抽样集合(时间,值)}格式可以是{2013-1-1018:10:20,20ms;2013-1-1018:10:22,21ms;2013-1-1018:10:22,28ms},其中,值为持续时间,例如,20ms。
A16,根据统计得到的总次数、均值、极大值以及极小值,构建聚类的日志数据。
本步骤中,构建聚类的日志数据包括:
判断接收的日志数据中行为标识信息是否为错误行为信息,如果是,构建聚类的错误行为日志数据,否则,构建聚类的功能日志数据。
本步骤中,对于聚类的功能日志数据,包括:网元设备识别码信息、网元设备编号信息、功能编号信息、性能信息采集时间段信息、总次数信息、均值信息、极大值信息、极小值信息以及{抽样集合(时间,值)}信息等。其中,
性能信息采集时间段为行为开始时间至结束时间,结束时间与开始时间的差为预先设置的性能信息采集周期。例如,预先设置的性能信息采集周期为60秒,则性能信息采集时间段可以为2013-1-1018:10:20至2013-1-1018:11:20。
对于聚类的错误行为日志数据,包括:网元设备识别码信息、网元设备编号信息、功能编号信息、性能信息采集时间段信息以及错误信息。
当然,实际应用中,功能日志数据以及错误行为日志数据中,还可以包括代理服务器识别码信息。
本发明实施例中,对日志数据进行聚类后,封装为TCP数据包,通过TCP方式输出至汇聚服务器。这样,通过实时采集日志数据,对采集的日志数据进行封装以及聚类处理,例如,根据采集的日志数据,进行总次数、均值、极大值以及极小值的聚类处理,然后,基于聚类处理得到的日志数据总次数、均值、极大值以及极小值进行性能分析,无需针对每一日志数据进行性能分析,即与现有技术中,通过周期性采集日志数据,对抽样采集的每一日志数据进行性能分析是完全不同的。本发明实施例的监控网元设备性能的方法,能够使得进行聚类处理后的日志数据涵盖智能电视***中网元设备性能的所有源数据,提升了分析结果的可靠性;而且,只传输聚类处理的结果(总次数、均值、极大值以及极小值)周期性采集,可以有效减少传输的日志数据量和后台计算量;进一步地,还可以通过周期性采集日志数据,用以保留一些详细的性能信息作为进行网元设备性能分析的参考。
步骤104,汇聚服务器按照预先设置的日志数据合并周期,对接收的聚类的日志数据进行合并,性能分析服务器根据合并处理得到的日志数据,进行网元设备性能分析。
本步骤中,日志数据合并周期可以根据实际需要确定。较佳地,日志数据合并周期为性能信息采集周期的整数倍数。
对聚类的日志数据进行合并包括:
在预先设置的日志数据合并周期内,根据接收的聚类的日志数据,合并包含相同网元设备识别码信息、网元设备编号信息以及功能编号信息的日志数据,得到合并的日志数据。
合并的日志数据包括:合并的错误行为日志数据以及合并的功能日志数据,其中,
合并的功能日志数据包括:代理服务器识别码信息、网元设备识别码信息、网元设备编号信息、功能编号信息、日志数据合并时间段信息、合并总次数信息、合并均值信息、合并极大值信息、合并极小值信息以及合并{抽样集合(时间,值)}信息。其中,
日志数据合并时间段为合并开始时间至合并结束时间,合并结束时间与合并开始时间的差为预先设置的日志数据合并周期。
合并总次数为在日志数据合并周期内,对包含的各性能信息采集周期内的次数进行累计,合并均值为对包含的各性能信息采集周期内的均值进行平均,合并极大值为包含的各性能信息采集周期内的极大值,合并抽样集合为所有数据抽样集合的汇总。
合并的错误行为日志数据包括:代理服务器识别码信息、网元设备识别码信息、网元设备编号信息、功能编号信息、日志数据合并时间段信息以及错误信息。
较佳地,汇聚服务器接收聚类的日志数据,对聚类的日志数据进行合并处理后,将合并的日志数据存储至第一MySQL数据库。这样,性能分析服务器从第一MySQL数据库读取合并处理得到的日志数据,进行网元设备性能分析。
较佳地,性能分析服务器在获取网元设备性能分析结果后,将网元设备性能分析结果存储至第二MySQL数据库。
关于根据合并处理得到的日志数据,进行网元设备性能分析的详细流程,具体可参见相关技术文献,在此不再赘述。
较佳地,该方法还可以进一步包括:
步骤105,展示合并的日志数据或进行网元设备性能分析的结果。
本步骤中,展示合并的日志数据时,可以对合并的日志数据中的一些信息进行过滤,即无需展示合并的日志数据中包含的所有信息。例如,对于合并的功能日志数据,其展示的信息可以包括:网元设备识别码信息、日志数据合并时间段信息、合并总次数信息、合并均值信息、合并极大值信息、合并极小值信息以及合并{抽样集合(时间,值)}信息。
当然,实际应用中,该方法还可以进一步包括:
如果网元设备性能分析结果表明并发速率低于预先设置的速率阈值,对接入智能电视***的用户数进行控制。
本步骤中,对接入智能电视***的用户数进行控制的详细流程,具体可参见相关技术文献,在此不再赘述。
图2为本发明实施例监控网元设备性能的***结构示意图。参见图2,该***包括:网元设备、代理服务器、汇聚服务器以及性能分析服务器,其中,
网元设备,存储预先设置的用于性能监控的数据格式以及数据传输方式;采集性能信息,按照预先设置的数据格式将性能信息封装为日志数据,根据预先设置的数据传输方式向代理服务器传输日志数据;
图3为本发明实施例网元设备输出的日志数据结构示意图。参见图3,本发明实施例中,日志数据包括:网元设备识别码信息、网元设备编号信息、功能编号信息、行为标识信息、数据时间点信息以及附加数据信息等。
实际应用中,网元设备针对每个持续行为,可以自动生成一个随机标识。后续中,代理服务器根据功能和随机标识排序,由于持续行为成对出现,当发现只有结束行为时,丢弃该日志数据;当发现只有开始行为时,判断该开始行为是否超时,如果超时就丢弃;否则,合并成一条日志数据。
较佳地,网元设备通过UDP方式传输日志数据。
代理服务器,用于接收网元设备发送的日志数据,按照预先设置的性能信息采集周期,对日志数据进行聚类,输出至汇聚服务器;
本发明实施例中,代理服务器接收网元设备发送的日志数据(UDP数据),对接收的UDP数据按照预先设置的性能信息采集周期进行聚类,例如,对接收的UDP数据进行分类、汇总、归并、过滤、抽样等处理,得到总次数信息、均值信息、极大值信息、极小值信息以及抽样集合信息等。将各网元设备发送的日志数据进行上述处理,生成聚类的日志数据,即传输控制协议(TCP,TransferControlProtocol)数据包,输出至汇聚服务器。
聚类的日志数据包括:聚类的错误行为日志数据以及聚类的功能日志数据。
图4为本发明实施例聚类的功能日志数据结构示意图。参见图4,聚类的功能日志数据,包括:网元设备识别码信息、网元设备编号信息、功能编号信息、性能信息采集时间段信息、总次数信息、均值信息、极大值信息、极小值信息以及{抽样集合(时间,值)}信息。
对于抽样结合,本发明实施例中,采用平均抽样,在预先设置的性能信息采集周期内,抽取预设阈值的采样点,例如,M个点,根据性能信息采集周期内的计数,计算平均抽取间隔。具体来说,在预先设置的性能信息采集周期内,均匀抽取M个点,举例来说,如果在预先设置的性能信息采集周期内有10000个点,现在需要抽取20(M)个点,则每隔10000/20=500抽取一个采样点即可。这样,代理服务器的计算量相对较小,所需的计算资源不大,但通过代理服务器的计算,可以将高并发的日志数据汇总为预先设置的性能信息采集周期内的统计数据,使得对网元设备的集中监控成为可能。
代理服务器在预先设置的性能信息采集周期到时,对计数进行清零处理。
较佳地,代理服务器部署在网元设备上。网元设备通过UDP方式,将日志数据传输给部署在该网元设备上的代理服务器,资源消耗小,对网元设备的并发性能几乎不会有影响。
汇聚服务器,用于按照预先设置的日志数据合并周期,对接收的聚类的日志数据进行合并,输出至性能分析服务器;
本发明实施例中,汇聚服务器接收代理服务器输出的TCP数据包,进行汇聚处理后输出至性能分析服务器。
较佳地,该***还可以进一步包括:
配置服务器(ConfigServer),用于配置包含设置数据格式、数据传输方式以及网元设备属性的配置信息,并将配置信息下发至网元设备;监控代理服务器的状态,当监测到代理服务器宕机时,通过远程控制修复并启动宕机的代理服务器。
本发明实施例中,配置服务器监测到代理服务器宕机时,可以远程将代理服务器拉起,即对代理服务器进行远程控制。具体来说,通过计算机网络异地接入因特网,连通被控制的代理服务器,使用安全壳(SSH,SecureShell)方式登录代理服务器,将被控代理服务器的桌面环境显示到配置服务器上,通过配置服务器对异地的发生故障的代理服务器进行配置、软件安装程序、修改等,以排除发生故障的代理服务器的故障,并通过远程唤醒方式启动排除故障的代理服务器。
网元设备属性可以包括:网元设备识别码、网元设备编号、功能编号、性能信息采集周期以及抽样M值等参数。
本发明实施例中,配置服务器可以是主从配置,以确保高可用性(HA,HighAvailable)。
性能分析服务器,用于根据合并处理得到的日志数据,进行网元设备性能分析。
本发明实施例中,性能分析服务器接收到汇聚服务器输出的TCP数据包,将TCP数据包存入临时存储中,临时存储可以是建立在临时文件***(TMPFS,TemporaryFileSystem)的MySQL数据库。由于高并发数据已经被代理服务器按照预先设置的性能信息采集周期进行聚类,因此,汇聚服务器进行聚类所需的资源开销以及性能分析服务器存储所需的资源开销较小。
本发明实施例中,性能分析服务器可以使用数据库的查询功能,将功能日志数据按照预先设置的日志数据合并周期进行合并。
合并的日志数据包括:合并的错误行为日志数据以及合并的功能日志数据。
图5为本发明实施例合并的功能日志数据结构示意图。参见图5,合并的功能日志数据包括:代理服务器识别码信息、网元设备识别码信息、网元设备编号信息、功能编号信息、日志数据合并时间段信息、合并总次数信息、合并均值信息、合并极大值信息、合并极小值信息以及合并{抽样集合(时间,值)}信息。
较佳地,性能分析服务器可以进一步用于展示合并的日志数据或进行网元设备性能分析的结果。
当然,实际应用中,该***还可以进一步包括:
控制服务器,用于读取性能分析服务器分析得到的网元设备性能分析结果,如果网元设备性能分析结果表明并发速率低于预先设置的速率阈值,对接入智能电视***的用户数进行控制。
本发明实施例中,性能分析服务器包括日志数据存储单元、分析单元、分析结果存储单元以及分析结果展示单元(图中未示出),其中,
日志数据存储单元,用于存储汇聚服务器输出的TCP数据包;
分析单元,用于读取日志数据存储单元存储的TCP数据包,进行分析,将分析结果输出至分析结果存储单元;
分析结果存储单元,用于存储分析单元输出的分析结果;
本发明实施例中,分析结果存储单元采用持久化数据库存储分析结果。例如,采用关系型数据库管理***MySQL服务器持久化存储分析结果。当然,实际应用中,日志数据存储单元也可以采用构建在内存上的MySql服务器存储日志数据。
分析结果展示单元,用于从分析结果存储单元中读取分析结果并展示。
本发明实施例中,分析结果展示单元查询分析结果存储单元(结果数据库)中的分析结果,实时刷新预先设置的分析时间周期内各数据的变化,并可以对数据作进一步的查询操作。
图6为本发明实施例展示的分析结果结构示意图。参见图6,展示的功能日志数据包括:网元设备识别码信息、日志数据合并时间段信息、合并总次数信息、合并均值信息、合并极大值信息、合并极小值信息以及合并{抽样集合(时间,值)}信息。
由上述可见,本发明实施例的监控网元设备性能的方法及***,通过预先设置网元设备用于性能监控的数据格式以及UDP的数据传输方式,网元设备采集性能信息,按照预先设置的数据格式将性能信息封装为日志数据,采用UDP传输日志数据,从而在业务层面监控网元设备性能,对网元设备的并发性能影响较小;代理服务器接收网元设备发送的日志数据,按照预先设置的性能信息采集周期,对日志数据进行聚类,可以有效减少传输的日志数据量和后台计算量、且进行聚类处理的日志数据能够涵盖智能电视***中该网元设备性能的源数据,提升了分析结果的可靠性,分析结果能反映网元设备的真实性能状况,根据该分析结果进行控制,控制效果好;对聚类的日志数据再进行合并处理,针对合并的日志数据进行分析,进行分析所需的资源开销小,易于进行网元设备性能监控。
显然,本领域技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若对本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也包含这些改动和变型在内。
Claims (14)
1.一种监控网元设备性能的方法,在所述网元设备中,预先设置用于性能监控的数据格式以及数据传输方式,所述数据格式包括:网元设备识别码、功能编号、行为标识、数据时间点以及附加数据信息,所述行为标识为触发行为标识、持续行为标识或错误行为标识;该方法包括:
采集性能信息,按照预先设置的数据格式将采集的性能信息封装为日志数据,根据预先设置的数据传输方式传输所述日志数据;
接收发送的日志数据,按照预先设置的性能信息采集周期,对所述日志数据进行聚类;
按照预先设置的日志数据合并周期,对聚类的日志数据进行合并,根据合并处理得到的日志数据,进行网元设备性能分析;
其中,对所述日志数据进行聚类包括:
A11,在预先设置的性能信息采集周期内,解析接收的日志数据,获取日志数据中包含的网元设备识别码信息、网元设备编号信息、功能编号信息以及行为标识信息;
A12,判断解析得到的行为标识信息是否为持续行为标识信息,如果是,执行步骤A13,否则,执行步骤A15;
A13,记录日志数据中持续行为开始对应的数据时间点信息,将该日志数据放入临时缓存中;
A14,在监测到该持续行为结束后,将临时缓存中该持续行为的日志数据合并为一条包含持续时长的日志数据,执行步骤A15;
A15,统计接收的具有相同网元设备识别码信息、网元设备编号信息、功能编号信息以及行为标识信息的日志数据总次数、均值、极大值以及极小值;
A16,根据统计得到的总次数、均值、极大值以及极小值,构建聚类的日志数据。
2.根据权利要求1所述的监控网元设备性能的方法,其中,所述方法进一步包括:
从接收的具有相同网元设备识别码信息、网元设备编号信息、功能编号信息以及行为标识信息的日志数据中,抽取预设阈值的日志数据,记录抽取的日志数据的数据时间点信息以及持续时间信息,生成抽样集合。
3.根据权利要求2所述的监控网元设备性能的方法,其中,所述构建聚类的日志数据包括:
判断接收的日志数据中行为标识信息是否为错误行为信息,如果是,构建聚类的错误行为日志数据,否则,构建聚类的功能日志数据。
4.根据权利要求3所述的监控网元设备性能的方法,其中,所述聚类的功能日志数据包括:网元设备识别码信息、网元设备编号信息、功能编号信息、性能信息采集时间段信息、总次数信息、均值信息、极大值信息、极小值信息以及{抽样集合(时间,值)}信息。
5.根据权利要求3所述的监控网元设备性能的方法,其中,所述聚类的错误行为日志数据包括:网元设备识别码信息、网元设备编号信息、功能编号信息、性能信息采集时间段信息以及错误信息。
6.根据权利要求1所述的监控网元设备性能的方法,其中,所述对聚类的日志数据进行合并包括:
在预先设置的日志数据合并周期内,根据接收的聚类的日志数据,合并包含相同网元设备识别码信息、网元设备编号信息以及功能编号信息的日志数据,得到合并的日志数据。
7.根据权利要求1至6任一项所述的监控网元设备性能的方法,其中,所述方法进一步包括:
展示合并的日志数据或展示进行网元设备性能分析的结果。
8.根据权利要求1至6任一项所述的监控网元设备性能的方法,其中,所述方法进一步包括:
在网元设备性能分析结果表明并发速率低于预先设置的速率阈值时,对接入智能电视***的用户数进行控制。
9.一种监控网元设备性能的***,其特征在于,该***包括:网元设备、代理服务器、汇聚服务器以及性能分析服务器,其中,
网元设备,存储预先设置的用于性能监控的数据格式以及数据传输方式;采集性能信息,按照预先设置的数据格式将性能信息封装为日志数据,根据预先设置的数据传输方式向代理服务器传输日志数据;其中,所述数据格式包括:网元设备识别码、功能编号、行为标识、数据时间点以及附加数据信息,所述行为标识为触发行为标识、持续行为标识或错误行为标识;
代理服务器,用于接收网元设备发送的日志数据,按照预先设置的性能信息采集周期,对日志数据进行聚类,输出至汇聚服务器;
汇聚服务器,用于按照预先设置的日志数据合并周期,对接收的聚类的日志数据进行合并,输出至性能分析服务器;
性能分析服务器,用于根据合并处理得到的日志数据,进行网元设备性能分析;
其中,对所述日志数据进行聚类包括:
在预先设置的性能信息采集周期内,解析接收的日志数据,获取日志数据中包含的网元设备识别码信息、网元设备编号信息、功能编号信息以及行为标识信息;
判断解析得到的行为标识信息是否为持续行为标识信息,
如果是,记录日志数据中持续行为开始对应的数据时间点信息,将该日志数据放入临时缓存中,在监测到该持续行为结束后,将临时缓存中该持续行为的日志数据合并为一条包含持续时长的日志数据;统计接收的具有相同网元设备识别码信息、网元设备编号信息、功能编号信息以及行为标识信息的日志数据总次数、均值、极大值以及极小值;
否则,统计接收的具有相同网元设备识别码信息、网元设备编号信息、功能编号信息以及行为标识信息的日志数据总次数、均值、极大值以及极小值;
根据统计得到的总次数、均值、极大值以及极小值,构建聚类的日志数据。
10.根据权利要求9所述的监控网元设备性能的***,其特征在于,所述性能分析服务器进一步用于展示合并的日志数据或进行网元设备性能分析的结果。
11.根据权利要求10所述的监控网元设备性能的***,其特征在于,所述性能分析服务器包括:日志数据存储单元、分析单元、分析结果存储单元以及分析结果展示单元,其中,
日志数据存储单元,用于存储汇聚服务器输出的传输控制协议数据包;
分析单元,用于读取日志数据存储单元存储的传输控制协议数据包,进行分析,将分析结果输出至分析结果存储单元;
分析结果存储单元,用于存储分析单元输出的分析结果;
分析结果展示单元,用于从分析结果存储单元中读取分析结果并展示。
12.根据权利要求9所述的监控网元设备性能的***,其特征在于,所述代理服务器部署在所述网元设备上,所述网元设备通过用户数据报协议方式,将日志数据传输给部署在所述网元设备上的所述代理服务器。
13.根据权利要求9至12任一项所述的监控网元设备性能的***,其特征在于,所述***进一步包括:
配置服务器,用于配置包含设置数据格式、数据传输方式以及网元设备属性的配置信息,并将配置信息下发至网元设备;监控代理服务器的状态,当监测到代理服务器宕机时,通过远程控制修复并启动宕机的代理服务器。
14.根据权利要求9至12任一项所述的监控网元设备性能的***,其特征在于,所述***进一步包括:
控制服务器,用于读取性能分析服务器分析得到的网元设备性能分析结果,如果网元设备性能分析结果表明并发速率低于预先设置的速率阈值,对接入智能电视***的用户数进行控制。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310104796.0A CN103200046B (zh) | 2013-03-28 | 2013-03-28 | 监控网元设备性能的方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310104796.0A CN103200046B (zh) | 2013-03-28 | 2013-03-28 | 监控网元设备性能的方法及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103200046A CN103200046A (zh) | 2013-07-10 |
CN103200046B true CN103200046B (zh) | 2016-01-20 |
Family
ID=48722412
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310104796.0A Active CN103200046B (zh) | 2013-03-28 | 2013-03-28 | 监控网元设备性能的方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103200046B (zh) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103500071B (zh) * | 2013-09-18 | 2017-01-25 | 湖南蚁坊软件有限公司 | 一种定量存储性能指标数据的方法及其装置 |
CN105101281A (zh) * | 2014-05-16 | 2015-11-25 | 中兴通讯股份有限公司 | 性能数据处理方法及装置 |
CN104579767B (zh) * | 2014-12-29 | 2018-01-02 | 山石网科通信技术有限公司 | 网关日志信息的发送方法和*** |
CN105071946A (zh) * | 2015-07-03 | 2015-11-18 | 北京奇虎科技有限公司 | 一种***监控方法和装置 |
CN105357584B (zh) * | 2015-12-11 | 2020-09-22 | Tcl科技集团股份有限公司 | 一种基于智能电视的用户行为日志分类上传方法及*** |
CN105791049B (zh) * | 2016-03-08 | 2018-12-25 | 成都广达新网科技股份有限公司 | 一种利用网管***监控eoc局端设备历史流量的方法 |
CN107515807B (zh) * | 2016-06-17 | 2021-05-07 | 阿里巴巴集团控股有限公司 | 一种存储监控数据的方法及装置 |
CN106453223B (zh) * | 2016-07-15 | 2020-03-31 | 珠海金山网络游戏科技有限公司 | 一种无缝世界游戏服务器*** |
CN106452867A (zh) * | 2016-08-10 | 2017-02-22 | 贵阳朗玛信息技术股份有限公司 | 日志报文处理方法及*** |
CN106294866B (zh) * | 2016-08-23 | 2020-02-11 | 北京奇虎科技有限公司 | 一种日志处理方法和装置 |
CN108259255B (zh) * | 2016-12-29 | 2020-05-15 | 大唐移动通信设备有限公司 | 一种网元数据分析方法及装置 |
CN107196879B (zh) * | 2017-05-18 | 2020-10-09 | 杭州敦崇科技股份有限公司 | Udp报文的处理方法、装置以及网络转发装置 |
CN107493315B (zh) * | 2017-06-28 | 2021-04-23 | 武汉斗鱼网络科技有限公司 | 一种行为数据的收集方法、资源服务器及存储介质 |
CN107888445B (zh) * | 2017-10-18 | 2020-08-18 | 金蝶软件(中国)有限公司 | 性能状态分析的方法、装置、计算机设备及存储介质 |
CN108460161B (zh) * | 2018-03-30 | 2021-11-19 | 腾讯科技(深圳)有限公司 | 分层抽样方法、装置和计算机设备 |
CN109492008A (zh) * | 2018-11-13 | 2019-03-19 | 上海理想信息产业(集团)有限公司 | 一种基于HBase的网络大数据模型设计方法及*** |
CN109861843B (zh) * | 2018-11-28 | 2021-11-23 | 阿里巴巴集团控股有限公司 | 日志文件的完整采集确认方法、装置及设备 |
CN111159129A (zh) * | 2019-12-31 | 2020-05-15 | 北京神州绿盟信息安全科技股份有限公司 | 一种日志报表的统计方法及装置 |
CN112256653B (zh) * | 2020-11-06 | 2024-02-02 | 网易(杭州)网络有限公司 | 一种数据采样方法和装置 |
CN112685248B (zh) * | 2020-12-24 | 2024-07-05 | 北京浪潮数据技术有限公司 | 智能网卡监控日志获取方法、装置、电子设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101174972A (zh) * | 2006-11-03 | 2008-05-07 | 盛趣信息技术(上海)有限公司 | 一种采集和统计分析数据的***和方法 |
CN101291399A (zh) * | 2007-09-25 | 2008-10-22 | 深圳市同洲电子股份有限公司 | 数字电视接收机及其日志***和日志管理方法 |
CN102902752A (zh) * | 2012-09-20 | 2013-01-30 | 新浪网技术(中国)有限公司 | 一种日志监控方法及*** |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070066297A1 (en) * | 2005-09-20 | 2007-03-22 | Ghobad Heidari-Bateni | Network monitoring system and method |
CN102231130B (zh) * | 2010-01-11 | 2015-06-17 | 国际商业机器公司 | 计算机***性能分析方法和装置 |
-
2013
- 2013-03-28 CN CN201310104796.0A patent/CN103200046B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101174972A (zh) * | 2006-11-03 | 2008-05-07 | 盛趣信息技术(上海)有限公司 | 一种采集和统计分析数据的***和方法 |
CN101291399A (zh) * | 2007-09-25 | 2008-10-22 | 深圳市同洲电子股份有限公司 | 数字电视接收机及其日志***和日志管理方法 |
CN102902752A (zh) * | 2012-09-20 | 2013-01-30 | 新浪网技术(中国)有限公司 | 一种日志监控方法及*** |
Also Published As
Publication number | Publication date |
---|---|
CN103200046A (zh) | 2013-07-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103200046B (zh) | 监控网元设备性能的方法及*** | |
CN108156006B (zh) | 一种埋点数据上报方法、装置及电子设备 | |
CN112671560B (zh) | 一种高可用的分布式实时告警处理方法及*** | |
CN109271412A (zh) | 智慧城市的实时流数据处理方法及*** | |
EP2852097B1 (en) | Efficient data center monitoring | |
CN105376335B (zh) | 一种采集数据上传方法和装置 | |
CN105610648B (zh) | 一种运维监控数据的采集方法及服务器 | |
CN101997925A (zh) | 具有预警功能的服务器监控方法及其*** | |
CN108471366A (zh) | 一种面向云原生应用的立体监控*** | |
CN109684052B (zh) | 事务分析方法、装置、设备及存储介质 | |
CN112311617A (zh) | 一种配置化数据监控告警方法及*** | |
CN109977089A (zh) | 日志管理方法、装置、计算机设备及计算机可读存储介质 | |
CN109560989B (zh) | 一种链路监控*** | |
CN110320891A (zh) | 轨道车辆制动***can总线报文维护监控***及监控方法 | |
CN108737549A (zh) | 一种大数据量的日志分析方法及装置 | |
CN110858192A (zh) | 一种日志查询方法和***、日志排查***和查询终端 | |
CN110620699A (zh) | 消息到达率确定方法、装置、设备和计算机可读存储介质 | |
CN103517292A (zh) | 一种移动终端信息上报方法和装置 | |
CN103916463B (zh) | 一种网络访问统计分析方法及*** | |
CN108334429A (zh) | 用于排查前端页面问题的方法、装置及*** | |
CN111817865A (zh) | 一种监控网管设备的方法及监控*** | |
CN106161339B (zh) | 获取ip访问关系的方法及装置 | |
CN106933718B (zh) | 性能监控方法及装置 | |
CN114189480B (zh) | 一种流量采样方法、装置、电子设备及介质 | |
CN114189455B (zh) | 基于ebpf技术的容器网络流量监控统计方法及*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C41 | Transfer of patent application or patent right or utility model | ||
TR01 | Transfer of patent right |
Effective date of registration: 20170213 Address after: 266100 Shandong Province, Qingdao city Laoshan District Songling Road No. 399 Patentee after: Poly Polytron Technologies Inc Address before: 266061 Laoshan, Qingdao province Hongkong District No. East Road, room 248, room 131 Patentee before: Qingdao Hisense Media Networks Co., Ltd. |