CN111478815B - 网络性能监控方法及装置 - Google Patents

网络性能监控方法及装置 Download PDF

Info

Publication number
CN111478815B
CN111478815B CN202010284701.8A CN202010284701A CN111478815B CN 111478815 B CN111478815 B CN 111478815B CN 202010284701 A CN202010284701 A CN 202010284701A CN 111478815 B CN111478815 B CN 111478815B
Authority
CN
China
Prior art keywords
monitoring
state data
instance
level
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010284701.8A
Other languages
English (en)
Other versions
CN111478815A (zh
Inventor
张风军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing China Index Shizheng Information Ltd
Original Assignee
Beijing China Index Shizheng Information Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing China Index Shizheng Information Ltd filed Critical Beijing China Index Shizheng Information Ltd
Priority to CN202010284701.8A priority Critical patent/CN111478815B/zh
Publication of CN111478815A publication Critical patent/CN111478815A/zh
Application granted granted Critical
Publication of CN111478815B publication Critical patent/CN111478815B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/04Network management architectures or arrangements
    • H04L41/046Network management architectures or arrangements comprising network management agents or mobile agents therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0604Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0681Configuration of triggering conditions

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • Fuzzy Systems (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供一种网络性能监控方法及装置,该方法包括:将从网络服务器中确定的各个监控实例发送至监控配置管理***;触发监控配置管理***将每个监控实例分配至其所属的监控代理,使得每个所述监控代理依据配置的监控策略采集属于该监控代理的每个监控实例的状态数据;对于每个监控实例,在采集到监控实例的状态数据时,依据状态数据确定监控实例的报警级别,判断报警级别是否满足入库级别;若满足,则将状态数据保存至时序数据库;若未满足,则使规则库对状态数据进行处理,得到处理数据以及生成通知信息,将处理数据保存至时序数据库,将通知信息反馈至预设的设备。应该本发明,可自动采集状态数据,实现对网络性能的监控,减少人工成本的投入。

Description

网络性能监控方法及装置
技术领域
本发明涉及互联网技术领域,特别涉及一种网络性能监控方法及装置。
背景技术
随着网络技术的发展,网络为人们提供了多种多样的服务,人们可以通过网络进购物、在线学习、在线办公以及***在线业务等服务,网络提供的这些服务为人们的生活带来了极大的便利。而网络的性能往往决定了人们在使用这些网络服务时的用网体验,因此为了保障人们的用网体验,对网络性能的监控必不可少。
目前对网络的性能进行监控的方式,通常是通过监控网络服务器的数据来实现对网络性能的监控,而网络服务器的数据多且繁杂,需要工作人员不断对网络服务器的数据进行筛选,才能得到相应的数据以实现对网络性能的监控,由此加大了人工成本的投入,增加了网络性能监控的应用成本。
发明内容
有鉴于此,本发明提供一种网络性能监控方法及装置,应用本发明,可自动采集监控实例的状态数据,实现对网络性能的监控,该过程无需工作人员干预,可减少人工成本的投入。
为实现上述目的,本发明提供如下技术方案:
一种网络性能监控方法,包括:
确定网络服务器中的各个监控实例,并将各个所述监控实例发送至预设的监控配置管理***;
触发所述监控配置管理***将每个所述监控实例分配至其所属的监控代理,并为每个所述监控代理配置对应的监控策略,使得每个所述监控代理依据所述监控策略定时采集属于该监控代理的每个监控实例的状态数据;
对于每个所述监控实例,在每次采集到所述监控实例的状态数据时,依据所述监控实例的状态数据确定所述监控实例的报警级别,并判断所述监控实例的报警级别是否满足预设的入库级别;
若所述监控实例的报警级别满足所述入库级别,则将所述监控实例的状态数据保存至预设的时序数据库;
若所述监控实例的报警级别未满足所述入库级别,则将所述监控实例的状态数据发送至预设的规则库,使得所述规则库依据预设的处理规则对所述状态数据进行处理,得到对应的处理数据,并生成与所述监控实例对应的通知信息,将所述处理数据保存至所述时序数据库,以及将所述通知信息反馈至预设的设备。
上述的方法,可选的,所述为每个所述监控代理配置对应的监控策略,包括:
确定每个所述监控代理对应的性能指标,并依据每个所述监控代理对应的性能指标,为每个所述监控代理发送监控策略。
上述的方法,可选的,所述依据所述监控实例的状态数据确定所述监控实例的报警级别,包括:
对所述状态数据进行解析,以获得所述状态数据中的响应时长;
确定所述监控实例所属的监控代理的监控策略中的级别确定规则;
依据所述响应时长以及所述级别确定规则,确定所述监控实例的报警级别。
上述的方法,可选的,所述使得所述规则库依据预设的处理规则对所述状态数据进行处理,得到对应的处理数据,包括:
判断所述状态数据是否满足预设的收敛规则,若所述状态数据满足所述收敛规则,则生成与所述状态数据对应的报警信息,并依据预设的聚合规则将所述状态数据进行聚合,得到聚合数据,依据所述报警信息和所述聚合数据,得到与所述状态数据对应的处理数据;
若所述状态数据未满足所述收敛规则,则将所述状态数据直接确定为处理数据。
上述的方法,可选的,还包括:
当接收到分析指令时,对所述时序数据库中的状态数据以及处理数据进行分析,得到数据分析文件,并将所述数据分析文件反馈至预设的展示设备进行展示。
一种网络性能监控装置,包括:
确定单元,用于确定网络服务器中的各个监控实例,并将各个所述监控实例发送至预设的监控配置管理***;
触发单元,用于触发所述监控配置管理***将每个所述监控实例分配至其所属的监控代理,并为每个所述监控代理配置对应的监控策略,使得每个所述监控代理依据所述监控策略定时采集属于该监控代理的每个监控实例的状态数据;
判断单元,用于对于每个所述监控实例,在每次采集到所述监控实例的状态数据时,依据所述监控实例的状态数据确定所述监控实例的报警级别,并判断所述监控实例的报警级别是否满足预设的入库级别;
保存单元,用于若所述监控实例的报警级别满足所述入库级别,则将所述监控实例的状态数据保存至预设的时序数据库;
反馈单元,用于若所述监控实例的报警级别未满足所述入库级别,则将所述监控实例的状态数据发送至预设的规则库,使得所述规则库依据预设的处理规则对所述状态数据进行处理,得到对应的处理数据,并生成与所述监控实例对应的通知信息,将所述处理数据保存至所述时序数据库,以及将所述通知信息反馈至预设的设备。
上述的装置,可选的,所述触发单元,包括:
发送子单元,用于确定每个所述监控代理对应的性能指标,并依据每个所述监控代理对应的性能指标,为每个所述监控代理发送监控策略。
上述的装置,可选的,所述判断单元,包括:
解析子单元,用于对所述状态数据进行解析,以获得所述状态数据中的响应时长;
第一确定子单元,用于确定所述监控实例所属的监控代理的监控策略中的级别确定规则;
第二确定子单元,用于依据所述响应时长以及所述级别确定规则,确定所述监控实例的报警级别。
上述的装置,可选的,所述反馈单元,包括:
判断子单元,用于判断所述状态数据是否满足预设的收敛规则,若所述状态数据满足所述收敛规则,则生成与所述状态数据对应的报警信息,并依据预设的聚合规则将所述状态数据进行聚合,得到聚合数据,依据所述报警信息和所述聚合数据,得到与所述状态数据对应的处理数据;
第三确定子单元,用于若所述状态数据未满足所述收敛规则,则将所述状态数据直接确定为处理数据。
上述的装置,可选的,还包括:
分析单元,用于当接收到分析指令时,对所述时序数据库中的状态数据以及处理数据进行分析,得到数据分析文件,并将所述数据分析文件反馈至预设的展示设备进行展示。
与现有技术相比,本发明具有以下优点:
本发明提供一种网络性能监控方法,该方法包括:确定网络服务器中的各个监控实例,并将各个所述监控实例发送至预设的监控配置管理***;触发所述监控配置管理***将每个所述监控实例分配至其所属的监控代理,并为每个所述监控代理配置对应的监控策略,使得每个所述监控代理依据所述监控策略定时采集属于该监控代理的每个监控实例的状态数据;对于每个所述监控实例,在每次采集到所述监控实例的状态数据时,依据所述监控实例的状态数据确定所述监控实例的报警级别,并判断所述监控实例的报警级别是否满足预设的入库级别;若所述监控实例的报警级别满足所述入库级别,则将所述监控实例的状态数据保存至预设的时序数据库;若所述监控实例的报警级别未满足所述入库级别,则将所述监控实例的状态数据发送至预设的规则库,使得所述规则库依据预设的处理规则对所述状态数据进行处理,得到对应的处理数据,并生成与所述监控实例对应的通知信息,将所述处理数据保存至所述时序数据库,以及将所述通知信息反馈至预设的设备。应用本发明,监控代理依据配置的监控策略采集属于该监控代理中的监控实例的状态数据,依据监控实例的报警级别对状态数据做进一步处理,无需工作人员进行干预,减少人工成本的投入,并且采集到的状态数据范围很广,可全面监控网络的性能。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种网络监控方法的方法流程图;
图2为本发明实施例提供的一种网络监控方法的另一方法流程图;
图3为本发明实施例提供的一种网络监控装置的结构示意图;
图4为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本申请中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本发明可用于众多通用或专用的计算装置环境或配置中。例如:个人计算机、服务计算机、手持设备或便携式设备、平板型设备、多处理器装置、包括以上任何装置或设备的分布式计算环境等。
本发明实施例提供了一种网络性能监控方法,该方法可以用于监控各种网络***的网络性能,执行主体为计算机终端的处理器,所述方法的方法流程图如图1所示,具体说明如下所述:
S101、确定网络服务器中的各个监控实例,并将各个所述监控实例发送至预设的监控配置管理***。
本发明实施例提供的方法中,使用部署在网络服务器上的采集客户端采集网络服务器中的各个监控实例,其中,采集客户端用于采集网络服务器中的各个监控实例,监控实例为网络服务器中针对的网络性能进行连通性测试的实例。将采集到的网络服务器中的各个监控实例通过中转接口发送至预设的监控配置管理***,其中,所述监控配置管理***用于为监控代理分配监控实例和配置监控策略。优选的,本发明实施例提供的方法可获取多个网络服务器中的各个监控实例,由此可覆盖网络***中的每个网络服务器,使得监控得到的数据更加全面,其中,网络***至少由一个网络服务器搭建而成。
S102、触发所述监控配置管理***将每个所述监控实例分配至其所属的监控代理,并为每个所述监控代理配置对应的监控策略,使得每个所述监控代理依据所述监控策略定时采集属于该监控代理的每个监控实例的状态数据。
本发明实施例提供的方法中,将采集到的各个监控实例发送至监控配置管理***后,触发监控配置管理***将接收到的每个监控实例分配其所属的监控代理,进行分配的过程如所述:
确定每个所述监控实例的性能指标,将每个所述监控实例发送至与该监控实例的性能指标对应的监控代理。
本发明实施例提供的方法中,网络有多种性能指标,不同的性能指标表征网络在不同方面的性能;不同的性能指标对应不同的监控实例,每种性能指标对应多个监控实例。本发明实施例提供的方法中,性能指标有3种,分别为:net.icmp、net.port以及net.url,其中,net.icmp表示网络IP连通性,net.port表示网络端口连通性,net.url表示URL地址的连通性;监控代理与性能指标的种类一一对应,换句话说,有多少种性能指标就有多少个监控代理,每个监控代理对应一种性能指标。本发明实施例提供的方法中,通过确定监控实例的性能指标,依据监控实例的性能指标确定其所属的监控代理。
本发明实施例提供的方法,监控配置管理***分配监控实例的过程中,还可将性能指标相同的监控实例归为同一集合,由此可得到与每个性能指标对应的集合,将集合中的各个监控实例分配至与该集合的性能指标对应的监控代理,可完成对监控实例的分配。
本发明实施例提供的方法中,为每个监控代理配置对应的监控策略,使得每个所述监控代理依据所述监控策略定时采集属于该监控代理的每个监控实例的状态数据。本发明实施例提供的方法中,监控策略中包含了多个采集时间节点,在达到对应的采集时间节点时,监控代理即采集属于该监控代理的各个监控实例的状态数据,其中,不同的监控策略中设置的时间节点可根据实际需求进行设置,监控实例的状态数据中包含该实例的网络状态数据。
S103、对于每个所述监控实例,在每次采集到所述监控实例的状态数据时,依据所述监控实例的状态数据确定所述监控实例的报警级别,并判断所述监控实例的报警级别是否满足预设的入库级别;若所述监控实例的报警级别满足所述入库级别,则执行S104;若所述监控实例的报警级别未满足所述入库级别,则执行S105。
本发明实施例提供的方法中,每个监控代理均根据监控策略定时采集所属的每个监控实例的状态数据,对于每个监控代理中的每个监控实例,在监控代理每次采集到监控实例的状态数据时,依据所述监控实例的状态数据确定该监控实例的报警级别,在确定监控实例的报警级别的过程中,可根据该监控实例所属的监控代理的监控策略中的内容进行确定,根据监控实例的报警级别对其状态数据进行对应的处理;判断监控实例的报警级别是否满足预设的入库级别,可将监控实例的报警级别与入库级别进行比对,若监控实例的报警级别与入库级别相同,则所述监控实例的报警级别满足入库级别,执行S104;若所述监控实例的报警级别与入库级别不相同,则所述监控实例的报警级别不满足入库级别,执行S105。本发明实施例提供的方法中,在每次采集到监控实例的状态数据时,可调用报警模块依据监控实例的状态数据确定监控实例的报警级别,以及判断所述监控实例的报警级别是否满足预设的入库级别。
S104、将所述监控实例的状态数据保存至预设的时序数据库。
本发明实施例提供的方法中,若监控实例的报警级别满足入库级别,则通过中转接口将监控实例的状态数据保存至预设的时序数据库,本发明的时序数据库为开源时序数据库,用于保存监控实例的数据。
S105、将所述监控实例的状态数据发送至预设的规则库,使得所述规则库依据预设的处理规则对所述状态数据进行处理,得到对应的处理数据,并生成与所述监控实例对应的通知信息,将所述处理数据保存至所述时序数据库,以及将所述通知信息反馈至预设的设备。
本发明实施例提供的方法中,若监控实例的报警级别不满足入库级别,则将监控实例的状态数据发送至预设的规则库,使得所述规则库依据预设的处理规则对所述状态数据进行处理,得到与监控实例对应的处理数据,并生成与所述监控实例对应的通知信息,将所述处理数据保存至所述时序数据库,以确保监控实例的数据在时序数据库中的完整性,将通知信息反馈至预设的设备,以通知工作人员监控实例的报警级别未满足入库条件,并已对监控实例的状态数据进行处理。
本发明实施例提供的方法中,确定网络服务器中的各个监控实例,并将各个监控实例发送至预设的监控配置管理***,触发所述监控配置管理***将每个所述监控实例分配至其所属的监控代理,并为每个所述监控代理配置对应的监控策略,使得每个所述监控代理依据所述监控策略定时采集属于该监控代理的每个监控实例的状态数据;对与每个所述监控实例,在每次采集到所述监控实例的状态数据时,依据所述监控实例的状态数据确定所述监控实例的报警级别,并判断所述监控实例的报警级别是否满足预设的入库级别;若所述监控实例的报警级别满足所述入库级别,则将所述监控实例的状态数据保存至预设的时序数据库;若所述监控实例的报警级别未满足所述入库级别,则将所述监控实例的状态数据发送至预设的规则库,使得所述规则库依据预设的处理规则对所述状态数据进行处理,得到对应的处理数据,并生成与所述监控实例对应的通信信息,将所述处理数据保存至所述时序数据库,以及将所述通知信息反馈至预设的设备。应用本发明,可以覆盖网络***中的每个网络服务器,将得到的网络服务器中的各个监控实例分配至其所属的监控代理,并为监控代理配置对应的监控策略,使得每个监控代理依据监控策略采集属于该监控代理的每个监控实例的状态数据,采集监控实例的状态数据时自动进行采集,无需工作人员进行干预,有效减少人工成本的投入,并且采集到所有监控实例的状态数据,可全面监控网络的性能;通过不满足入库条件的监控实例的状态数据进行处理,可保证网络的稳定性。
本发明实施例提供的方法中,监控配置管理***在为监控代理分配监控实例的同时,也为监控代理分配监控策略,具体过程如下所述:
确定每个所述监控代理对应的性能指标,并依据每个所述监控代理对应的性能指标,为每个所述监控代理发送监控策略。
本发明实施例提供的方法中,确定每个监控代理对应的性能指标,依据性能指标为每个监控代理发送对应的监控策略;其中,不同的性能指标对应不同的监控策略。
本发明实施例提供的方法中,通过为监控代理分配监控策略,以使监控代理依据监控策略采集属于监控代理的各个监控实例的状态数据,可自动化采集监控实例的状态数据,无需人工进行干预,有效减少人工成本的投入。
本发明实施例提供的方法中,监控代理依据监控策略采集属于该监控代理的监控实例的状态数据时,需要依据状态数据确定监控实例的报警级别,具体的过程如下所述:
S201、对所述状态数据进行解析,以获得所述状态数据中的响应时长。
本发明实施例提供的方法中,对于每个监控实例,在监控代理每次采集到所述监控实例的状态数据时,对所述状态数据进行解析,以获取状态数据中的响应时长,需要说明的是,所述响应时长为该监控实例的响应时长。
S202、确定所述监控实例所属的监控代理的监控策略中的级别确定规则。
S203、依据所述响应时长以及所述级别确定规则,确定所述监控实例的报警级别。
本发明实施例提供的方法中,确定监控实例所输的监控代理的监控策略中的级别确定规则,依据响应时长以及所述级别确定规则,确定所述监控实例的报警级别。需要说明的是,监控实例的报警级别分为第一级别、第二级别以及第三级别,其中,第一级别可为OK级别,第二级别可为CRITICAL级别,第三级别可为WARNING级别;可依据监控策略中的级别确定规则和响应时长确定监控实例的报警级别;其中,不同的监控策略中的级别确定规则的内容不同,对不同监控策略中的级别确定规则的内容进行说明:
(1)性能指标为net.icmp的监控策略可称为TCP监控策略,其中的级别确定规则的内容为:当响应时间小于或等于第一时间阈值时,监控实例的报警级别为第一级别,即OK级别;当响应时间大于第一时间阈值,并小于或等于第二时间阈值时,监控实例的报警级别为第二级别,即CRITICAL级别;当响应时间大于第二时间阈值时,监控实例的报警级别为第三级别,即WARNING级别;需要说明的是,第一时间阈值小于第二时间阈值;第一时间阈值可设定为5000毫秒,第二时间阈值可设定为10000毫秒;
(2)性能指标为net.port的监控策略可称为PING监控策略,其中的级别确定规则的内容为:当响应时间小于或等于第三时间阈值时,监控实例的报警级别为第一级别,即OK级别;当响应时间大于第三时间阈值,并小于或等于第四时间阈值时,监控实例的报警级别为第二级别,即CRITICAL级别;当响应时间大于第四时间阈值时,监控实例的报警级别为第三级别,即WARNING级别;需要说明的是,第三时间阈值小于第四时间阈值;第三时间阈值可设定为300毫秒,第四时间阈值可设定为500毫秒;
(3)性能指标为net.url的监控策略可称为URL监控策略,其中的级别确定规则的内容为:当响应时间小于或等于第五时间阈值时,监控实例的报警级别为第一级别,即OK级别;当响应时间大于第五时间阈值,并小于或等于第六时间阈值时,监控实例的报警级别为第二级别,即CRITICAL级别;当响应时间大于第六时间阈值时,监控实例的报警级别为第三级别,即WARNING级别;需要说明的是,第五时间阈值小于第六时间阈值;第五时间阈值可设定为10000毫秒,第六时间阈值可设定为20000毫秒;
其中,第一时间阈值、第二时间阈值、第三时间阈值、第四时间阈值、第五时间阈值以及第六时间阈值可根据实际需求进行设置。
本发明实施例提供的方法中,对监控实例的状态数据进行解析,获得状态数据中的响应时长,确定监控实例所属的监控代理的监控策略中的级别确定规则,将响应时长与级别确定规则中设置的时间阈值进行比对,即可确定监控实例的报警级别。例如监控实例所属的监控代理所对应的性能指标为net.port,则监控代理对应的监控策略为PING监控策略,监控实例的状态数据中的响应时长为350毫秒,大于300毫秒且小于500毫秒,则可确定监控实例的报警级别为CRITICAL级别。
本发明实施例提供的方法中,依据监控实例的响应时长和该监控实例所属的监控代理的监控策略中的级别确定规则,确定该监控实例的报警级别,应用本发明提供的方法,通过响应时长和监控策略中的级别确定规则,准确确定监控实例的报警级别,为处理监控实例的状态数据提供了有效的依据。
本发明实施例提供的方法中,判断监控实例的报警级别是否满足预设的入库级别,其中,入库级别为第一级别,即OK级别;若监控实例的报警级别为第一级别,则满足入库级别,将监控实例的状态数据发送至时序数据库进行保存;若监控实例的报警级别为第二级别或第三级别时,则不满足入库级别,将监控实例的状态数据发送至规则库,使得规则库依据预设的处理规则对所述状态数据进行处理,以得到对应的处理数据。
本发明实施例提供的方法中,规则库对状态数据的处理过程如下所述:
判断所述状态数据是否满足预设的收敛规则,若所述状态数据满足所述收敛规则,则生成与所述状态数据对应的报警信息,并依据预设的聚合规则将所述状态数据进行聚合,得到聚合数据,依据所述报警信息和所述聚合数据,得到与所述状态数据对应的处理数据;
若所述状态数据未满足所述收敛规则,则将所述状态数据直接确定为处理数据。
本发明实施例提供的方法中,所述规则库的基础是一个小型的key/value cache***,规则库中的value数据结构为hash表,hash表的结构如下所示;
Metric string//指标
AlertCount int//报警计数器
NoticeCount int//通知计数器
FirstNotice int//第一次通知时间
LatestNotice int64//最新通知时间
FirstAlert int64//第一次报警时间
LatestAlert int64//最新报警时间
Interval int//报警间隔,定时器通过这个指标来判断报警是否恢复;
Tags string//tags,
本发明实施例提供的方法中,从状态数据中提取出hash表结构中的数值,并根据提取出的报警间隔和报警计数器中的报警次数是否判断状态数据是否满足预设的收敛条件,若报警次数大于或等于收敛条件中的报警次数阈值或报警间隔小于收敛条件中的报警间隔阈值时,则状态数据满足预设的收敛条件,则生成与所述状态数据对应的报警信息,并依据预设的聚合规则将所述状态数据进行聚合,得到聚合数据,依据所述报警信息和所述聚合数据,得到与所述状态数据对应的处理数据,其中,报警信息用于提示工作人员该监控实例出现的报警次数增多,可能存在异常;若报警次数小于收敛条件中的报警次数阈值且报警间隔大于或等于收敛条件中的报警间隔阈值时,则状态数据不满足预设的收敛条件,可将该状态数据直接确定为处理数据。
本发明实施例提供的方法中,预设的聚合规则的具体内容为依据监控实例的状态数据中的主机名、IP以及IDC的等级信息进行聚合,若状态数据中的主机名的等级最高,则将该监控实例的状态数据依据主机名进行聚合;若状态数据中的IP的等级最高,则将该监控实例的状态数据依据IP进行聚合;若状态数据中的IDC的等级最高,则将该监控实例的状态数据依据IDC进行聚合。
本发明实施例体用的方法中,规则库中有多个配置参数,还有配置规则,配置规则包括配置最大报警次数、统计时间间隔、是否抄送领导、忽略第一次net报警、恢复时是否通知、通知时段、通知时间递增、递增系数、主机聚合以及IDC聚合等内容的参数;配置参数的数据结构如上所述hash表,规则库中还配置了对状态数据的处理规则,处理规则包含收敛规则和聚合规则。规则库中的处理规则还包括了恢复规则,恢复规则的具体内容为接收到监控实例的状态数据后,在预设的时间长度内未再次接收到该监控实例的状态数据,则生成该监控实例的恢复通知,该恢复通知可表征规则库已在预设的时间长度内未接收到该监控实例的状态数据,从侧面表示在预设的时间长度内该监控实例满足入库级别,并将在预设的时间长度内对该监控实例采集到的状态数据发送至时序数据库进行保存。
本发明实施例提供的方法中,通过采集监控实例的状态数据监控网络性能的过程中,当接收到分析指令时,调用时序数据库中的状态数据和处理数据,对状态数据和处理数据进行分析,以得到数据分析文件,将所述分析文件反馈至预设的展示设备进行展示;所述数据分析文件包括报警数据聚合收敛后的展示查询数据、性能指标的数据曲线图、当天未处理的报警信息以及生成通知信息的次数等数据。
本发明实施例提供的方法中,在接收到分析指令时,通过将时序数据库中的状态数据和处理数据进行汇总分析,可及时掌控网络性能的监控情况,及时汇总监控网络性能中的报警信息以及通知信息,避免出现报警风暴的情况,可保证网络的稳定性。
本发明实施例提供的方法中,应用配置在网络服务器上的采集客户端采集网络服务器中的各个监控实例,通过中转接口将各个监控实例发送至监控配置管理***,触发监控配置管理***将每个监控实例分配至其所属的监控代理,并为每个监控代理配置对应的监控策略,使得每个监控代理依据监控策略定时采集属于该监控代理的每个监控实例的状态数据;对于每个监控实例,在每次采集到所述监控实例的状态数据时,调用报警模块依据监控实例的状态数据确定监控实例的报警级别,并判断监控实例的报警级别是否满足预设的入库条件,若满足入库条件,则通过中转接口将监控实例的状态数据发送至时序数据库中保存,若未满足入库条件,则发送至规则库进行处理,得到处理数据和生成通知信息,将所述处理数据保存至时序数据库,并通知信息发送至预设的设备。
应用本发明,为监控代理分配监控实例,并配置对应的监控策略,全面覆盖网络服务器中的监控实例,监控代理依据监控策略自动采集监控实例的状态数据,可全面监控网络的性能,可采集多个网络节点的监控信息,其中网络节点可为网络服务器,无需工作人员进行干预可得到网络性能的监控数据,减少人工成本的投入。并且,为监控代理分配监控实例和监控策略后便可进行监控,可即配即用,方便快捷。
与图1所述的方法相对应,本发明实施例还提供了一种网络性能监控装置,用于对图1中方法的具体实现,本发明实施例提供的网络性能监控装置可以应用于计算机终端中,其结构示意图如图3所示,具体包括:
确定单元301,用于确定网络服务器中的各个监控实例,并将各个所述监控实例发送至预设的监控配置管理***;
触发单元302,用于触发所述监控配置管理***将每个所述监控实例分配至其所属的监控代理,并为每个所述监控代理配置对应的监控策略,使得每个所述监控代理依据所述监控策略定时采集属于该监控代理的每个监控实例的状态数据;
判断单元303,用于对于每个所述监控实例,在每次采集到所述监控实例的状态数据时,依据所述监控实例的状态数据确定所述监控实例的报警级别,并判断所述监控实例的报警级别是否满足预设的入库级别;
保存单元304,用于若所述监控实例的报警级别满足所述入库级别,则将所述监控实例的状态数据保存至预设的时序数据库;
反馈单元305,用于若所述监控实例的报警级别未满足所述入库级别,则将所述监控实例的状态数据发送至预设的规则库,使得所述规则库依据预设的处理规则对所述状态数据进行处理,得到对应的处理数据,并生成与所述监控实例对应的通知信息,将所述处理数据保存至所述时序数据库,以及将所述通知信息反馈至预设的设备。
本发明实施例提供的装置中,确定网络服务器中的各个监控实例,并将各个所述监控实例发送至预设的监控配置管理***,触发所述监控配置管理***将每个所述监控实例分配至其所属的监控代理,并为每个监控代理对应的监控策略,使得每个监控代理依据所述监控策略定时采集属于该监控代理的每个监控实例的状态数据,对与每个所述监控实例,在每个采集到所述监控实例的状态数据时,依据所述监控实例的状态数据确定所述监控实例的报警级别,并判断所述监控实例的报警级别是否满足预设的入库级别;若所述监控实例的报警级别满足所述入库级别,则将所述监控实例的状态数据保存至预设的时序数据库;若所述监控实例的报警级别未满足所述入库级别,则将所述监控实例的状态数据发送至预设的规则库,使得所述规则库依据预设的处理规则对所述状态数据进行处理,得到对应的处理数据,并生成与所述监控实例对应的通知信息,将所述处理数据保存至所述时序数据库,以及将所述通知信息反馈至预设的设备。应用本发明提供的装置,将确定的各个监控实例分配至其所属的监控代理,以及为监控代理分配对应的监控策略,使得监控代理依据监控策略定时采集监控实例的状态数据,无需人工干预即可获取监控实例的状态数据,减少人工成本的投入,且可全面采集监控实例的状态数据,采集到的状态数据覆盖的范围广,数据库中的数据可参考性极强。
基于上述方案,本发明实施例提供的装置,所述触发单元302可以配置为:
发送子单元,用于确定每个所述监控代理对应的性能指标,并依据每个所述监控代理对应的性能指标,为每个所述监控代理发送监控策略。
基于上述方案,本发明实施例提供的装置,所述判断单元303可以配置为:
解析子单元,用于对所述状态数据进行解析,以获得所述状态数据中的响应时长;
第一确定子单元,用于确定所述监控实例所属的监控代理的监控策略中的级别确定规则;
第二确定子单元,用于依据所述响应时长以及所述级别确定规则,确定所述监控实例的报警级别。
基于上述方案,本发明实施例提供的装置,所述反馈单元305可以配置为:
判断子单元,用于判断所述状态数据是否满足预设的收敛规则,若所述状态数据满足所述收敛规则,则生成与所述状态数据对应的报警信息,并依据预设的聚合规则将所述状态数据进行聚合,得到聚合数据,依据所述报警信息和所述聚合数据,得到与所述状态数据对应的处理数据;
第三确定子单元,用于若所述状态数据未满足所述收敛规则,则将所述状态数据直接确定为处理数据。
基于上述方案,本发明实施例提供的装置,还可以配置为:
分析单元,用于当接收到分析指令时,对所述时序数据库中的状态数据以及处理数据进行分析,得到数据分析文件,并将所述数据分析文件反馈至预设的展示设备进行展示。
本发明实施例还提供了一种存储介质,所述存储介质包括存储的指令,其中,在所述指令运行时控制所述存储介质所在的设备执行下述网络性能监控方法,所述方法具体包括:
确定网络服务器中的各个监控实例,并将各个所述监控实例发送至预设的监控配置管理***;
触发所述监控配置管理***将每个所述监控实例分配至其所属的监控代理,并为每个所述监控代理配置对应的监控策略,使得每个所述监控代理依据所述监控策略定时采集属于该监控代理的每个监控实例的状态数据;
对于每个所述监控实例,在每次采集到所述监控实例的状态数据时,依据所述监控实例的状态数据确定所述监控实例的报警级别,并判断所述监控实例的报警级别是否满足预设的入库级别;
若所述监控实例的报警级别满足所述入库级别,则将所述监控实例的状态数据保存至预设的时序数据库;
若所述监控实例的报警级别未满足所述入库级别,则将所述监控实例的状态数据发送至预设的规则库,使得所述规则库依据预设的处理规则对所述状态数据进行处理,得到对应的处理数据,并生成与所述监控实例对应的通知信息,将所述处理数据保存至所述时序数据库,以及将所述通知信息反馈至预设的设备。
本发明实施例还提供了一种电子设备,其结构示意图如图4所示,具体包括存储器401,以及一个或者一个以上的指令402,其中一个或者一个以上指令402存储于存储器401中,且经配置以由一个或者一个以上处理器403执行所述一个或者一个以上指令402进行以下操作:
确定网络服务器中的各个监控实例,并将各个所述监控实例发送至预设的监控配置管理***;
触发所述监控配置管理***将每个所述监控实例分配至其所属的监控代理,并为每个所述监控代理配置对应的监控策略,使得每个所述监控代理依据所述监控策略定时采集属于该监控代理的每个监控实例的状态数据;
对于每个所述监控实例,在每次采集到所述监控实例的状态数据时,依据所述监控实例的状态数据确定所述监控实例的报警级别,并判断所述监控实例的报警级别是否满足预设的入库级别;
若所述监控实例的报警级别满足所述入库级别,则将所述监控实例的状态数据保存至预设的时序数据库;
若所述监控实例的报警级别未满足所述入库级别,则将所述监控实例的状态数据发送至预设的规则库,使得所述规则库依据预设的处理规则对所述状态数据进行处理,得到对应的处理数据,并生成与所述监控实例对应的通知信息,将所述处理数据保存至所述时序数据库,以及将所述通知信息反馈至预设的设备。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于***或***实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的***及***实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (8)

1.一种网络性能监控方法,其特征在于,包括:
确定网络服务器中的各个监控实例,并将各个所述监控实例发送至预设的监控配置管理***;
触发所述监控配置管理***将每个所述监控实例分配至其所属的监控代理,并为每个所述监控代理配置对应的监控策略,使得每个所述监控代理依据所述监控策略定时采集属于该监控代理的每个监控实例的状态数据;所述监控代理与网络性能指标的种类一一对应,每个所述监控代理对应一种所述网络性能指标,每个所述监控代理对应的网络性能指标不同;
对于每个所述监控实例,在每次采集到所述监控实例的状态数据时,依据所述监控实例的状态数据确定所述监控实例的报警级别,并判断所述监控实例的报警级别是否满足预设的入库级别;
若所述监控实例的报警级别满足所述入库级别,则将所述监控实例的状态数据保存至预设的时序数据库;
若所述监控实例的报警级别未满足所述入库级别,则将所述监控实例的状态数据发送至预设的规则库,使得所述规则库依据预设的处理规则对所述状态数据进行处理,得到对应的处理数据,并生成与所述监控实例对应的通知信息,将所述处理数据保存至所述时序数据库,以及将所述通知信息反馈至预设的设备;所述处理规则包括恢复规则,所述恢复规则用于生成所述监控实例的恢复通知,所述恢复通知用于表征所述规则库在预设的时间长度内未再次接收到所述监控实例的状态数据;
所述为每个所述监控代理配置对应的监控策略,包括:
确定每个所述监控代理对应的性能指标,并依据每个所述监控代理对应的性能指标,为每个所述监控代理发送监控策略。
2.根据权利要求1所述的方法,其特征在于,所述依据所述监控实例的状态数据确定所述监控实例的报警级别,包括:
对所述状态数据进行解析,以获得所述状态数据中的响应时长;
确定所述监控实例所属的监控代理的监控策略中的级别确定规则;
依据所述响应时长以及所述级别确定规则,确定所述监控实例的报警级别。
3.根据权利要求1所述的方法,其特征在于,所述使得所述规则库依据预设的处理规则对所述状态数据进行处理,得到对应的处理数据,包括:
判断所述状态数据是否满足预设的收敛规则,若所述状态数据满足所述收敛规则,则生成与所述状态数据对应的报警信息,并依据预设的聚合规则将所述状态数据进行聚合,得到聚合数据,依据所述报警信息和所述聚合数据,得到与所述状态数据对应的处理数据;
若所述状态数据未满足所述收敛规则,则将所述状态数据直接确定为处理数据。
4.根据权利要求1所述的方法,其特征在于,还包括:
当接收到分析指令时,对所述时序数据库中的状态数据以及处理数据进行分析,得到数据分析文件,并将所述数据分析文件反馈至预设的展示设备进行展示。
5.一种网络性能监控装置,其特征在于,包括:
确定单元,用于确定网络服务器中的各个监控实例,并将各个所述监控实例发送至预设的监控配置管理***;
触发单元,用于触发所述监控配置管理***将每个所述监控实例分配至其所属的监控代理,并为每个所述监控代理配置对应的监控策略,使得每个所述监控代理依据所述监控策略定时采集属于该监控代理的每个监控实例的状态数据;所述监控代理与网络性能指标的种类一一对应,每个所述监控代理对应一种所述网络性能指标,每个所述监控代理对应的网络性能指标不同;
判断单元,用于对于每个所述监控实例,在每次采集到所述监控实例的状态数据时,依据所述监控实例的状态数据确定所述监控实例的报警级别,并判断所述监控实例的报警级别是否满足预设的入库级别;
保存单元,用于若所述监控实例的报警级别满足所述入库级别,则将所述监控实例的状态数据保存至预设的时序数据库;
反馈单元,用于若所述监控实例的报警级别未满足所述入库级别,则将所述监控实例的状态数据发送至预设的规则库,使得所述规则库依据预设的处理规则对所述状态数据进行处理,得到对应的处理数据,并生成与所述监控实例对应的通知信息,将所述处理数据保存至所述时序数据库,以及将所述通知信息反馈至预设的设备;所述处理规则包括恢复规则,所述恢复规则用于生成所述监控实例的恢复通知,所述恢复通知用于表征所述规则库在预设的时间长度内未再次接收到所述监控实例的状态数据;
所述触发单元,包括:
发送子单元,用于确定每个所述监控代理对应的性能指标,并依据每个所述监控代理对应的性能指标,为每个所述监控代理发送监控策略。
6.根据权利要求5所述的装置,其特征在于,所述判断单元,包括:
解析子单元,用于对所述状态数据进行解析,以获得所述状态数据中的响应时长;
第一确定子单元,用于确定所述监控实例所属的监控代理的监控策略中的级别确定规则;
第二确定子单元,用于依据所述响应时长以及所述级别确定规则,确定所述监控实例的报警级别。
7.根据权利要求5所述的装置,其特征在于,所述反馈单元,包括:
判断子单元,用于判断所述状态数据是否满足预设的收敛规则,若所述状态数据满足所述收敛规则,则生成与所述状态数据对应的报警信息,并依据预设的聚合规则将所述状态数据进行聚合,得到聚合数据,依据所述报警信息和所述聚合数据,得到与所述状态数据对应的处理数据;
第三确定子单元,用于若所述状态数据未满足所述收敛规则,则将所述状态数据直接确定为处理数据。
8.根据权利要求5所述的装置,其特征在于,还包括:
分析单元,用于当接收到分析指令时,对所述时序数据库中的状态数据以及处理数据进行分析,得到数据分析文件,并将所述数据分析文件反馈至预设的展示设备进行展示。
CN202010284701.8A 2020-04-13 2020-04-13 网络性能监控方法及装置 Active CN111478815B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010284701.8A CN111478815B (zh) 2020-04-13 2020-04-13 网络性能监控方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010284701.8A CN111478815B (zh) 2020-04-13 2020-04-13 网络性能监控方法及装置

Publications (2)

Publication Number Publication Date
CN111478815A CN111478815A (zh) 2020-07-31
CN111478815B true CN111478815B (zh) 2023-04-28

Family

ID=71752217

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010284701.8A Active CN111478815B (zh) 2020-04-13 2020-04-13 网络性能监控方法及装置

Country Status (1)

Country Link
CN (1) CN111478815B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112711514A (zh) * 2020-12-30 2021-04-27 北京珞安科技有限责任公司 一种终端设备的监控***、方法及装置
CN112699008A (zh) * 2021-01-05 2021-04-23 上海中通吉网络技术有限公司 匹配多维度规则自动化处理告警方法和引擎
CN114615165A (zh) * 2022-03-11 2022-06-10 浪潮商用机器有限公司 一种服务器网络监控方法及装置、可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005101740A1 (en) * 2004-04-16 2005-10-27 Apparent Networks, Inc. Method and apparatus for automating and scaling active probing-based ip network performance monitoring and diagnosis
CN105426544A (zh) * 2015-12-25 2016-03-23 北京奇虎科技有限公司 监控数据库状态的方法及装置
CN107395382A (zh) * 2016-05-16 2017-11-24 中兴通讯股份有限公司 一种网络质量性能展示方法及装置、***
CN110413486A (zh) * 2018-04-28 2019-11-05 北京京东尚科信息技术有限公司 监控***内部调用链路的方法、装置及介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005101740A1 (en) * 2004-04-16 2005-10-27 Apparent Networks, Inc. Method and apparatus for automating and scaling active probing-based ip network performance monitoring and diagnosis
CN105426544A (zh) * 2015-12-25 2016-03-23 北京奇虎科技有限公司 监控数据库状态的方法及装置
CN107395382A (zh) * 2016-05-16 2017-11-24 中兴通讯股份有限公司 一种网络质量性能展示方法及装置、***
CN110413486A (zh) * 2018-04-28 2019-11-05 北京京东尚科信息技术有限公司 监控***内部调用链路的方法、装置及介质

Also Published As

Publication number Publication date
CN111478815A (zh) 2020-07-31

Similar Documents

Publication Publication Date Title
CN111478815B (zh) 网络性能监控方法及装置
CN109412870B (zh) 告警监控方法及平台、服务器、存储介质
CN108365985A (zh) 一种集群管理方法、装置、终端设备及存储介质
US7467067B2 (en) Self-learning integrity management system and related methods
US9058259B2 (en) System and method for dynamic problem determination using aggregate anomaly analysis
CN107832200A (zh) 告警处理方法、装置、计算机设备及存储介质
CN101212367B (zh) 一种告警信息的处理方法及装置
US20150133076A1 (en) Mobile device application monitoring software
US20170242773A1 (en) Identifying the root cause of an issue observed during application execution
WO2016188100A1 (zh) 信息***故障场景信息收集方法及***
CN103236948A (zh) 一种电信网告警方法及***
CN109787850B (zh) 监控***、监控方法及计算节点
CN112596975A (zh) 对网络设备进行监控处理的方法、***、设备和存储介质
CN113271224A (zh) 节点的定位方法、装置、存储介质及电子装置
CN108989463A (zh) 一种数据处理方法和装置
CN105119761B (zh) 运维监控及解决方案一体化管理***及方法
CN115629933A (zh) 业务***监控方法、装置、设备及存储介质
CN115248826A (zh) 一种大规模分布式图数据库集群运维管理的方法和***
CN105897492A (zh) 一种云数据中心监控***
CN115202958A (zh) 一种电力异常监控方法、装置、电子设备及存储介质
CN110677271B (zh) 基于elk的大数据告警方法、装置、设备及存储介质
CN117370053A (zh) 一种面向信息***业务运行全景监测方法及***
Efimov et al. Integration data model for continuous service delivery in cloud computing system
CN111258870A (zh) 分布式存储***的性能分析方法、装置、设备及存储介质
US11758021B2 (en) System for processing coherent data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant