CN113132160A - 一种客户端节点的网络亚健康状态的检测方法和*** - Google Patents

一种客户端节点的网络亚健康状态的检测方法和*** Download PDF

Info

Publication number
CN113132160A
CN113132160A CN202110375922.0A CN202110375922A CN113132160A CN 113132160 A CN113132160 A CN 113132160A CN 202110375922 A CN202110375922 A CN 202110375922A CN 113132160 A CN113132160 A CN 113132160A
Authority
CN
China
Prior art keywords
client node
message
client
node
sub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110375922.0A
Other languages
English (en)
Other versions
CN113132160B (zh
Inventor
张烨
贺计文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Yingxin Computer Technology Co Ltd
Original Assignee
Shandong Yingxin Computer Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Yingxin Computer Technology Co Ltd filed Critical Shandong Yingxin Computer Technology Co Ltd
Priority to CN202110375922.0A priority Critical patent/CN113132160B/zh
Publication of CN113132160A publication Critical patent/CN113132160A/zh
Application granted granted Critical
Publication of CN113132160B publication Critical patent/CN113132160B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/02Capturing of monitoring data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开一种客户端节点的网络亚健康状态的检测方法和***,其中,网络亚健康状态的检测方法包括:客户端节点向任一服务端节点发送状态检测报文,状态检测报文用于使服务端节点反馈报文回复消息;客户端节点根据报文回复消息判断客户端节点自身是否出现网络亚健康状态;若客户端节点自身出现网络亚健康状态,则客户端节点向所有服务端节点发送报文复测消息;所有服务端节点根据报文复测消息判断客户端节点是否存在网络亚健康状态;若所有服务端节点中预定数量及以上的服务端节点判定客户端节点存在网络亚健康状态则上报客户端节点的亚健康告警信息。本发明的技术方案能解决现有技术中网络亚健康状态的检测方法,检测不准,容易造成误报的问题。

Description

一种客户端节点的网络亚健康状态的检测方法和***
技术领域
本发明涉及存储集群技术领域,尤其涉及一种客户端节点的网络亚健康状态的检测方法和***。
背景技术
通常情况下,能够让网络正常运行并且在网络遭受外界冲击后可以迅速恢复的状态称为“健康”状态;网络陷入瘫痪而不能正常运行的状态叫做“非健康”状态。然而,许多大中型企业的网络都处于"亚健康"状态,处于这种“亚健康”状态的网络平时可以正常运行,但是抵御风险的能力极其低下,在受到突发性网络风险的情况下很容易陷入瘫痪,很长时间都难以恢复。
存储集群的网络处于亚健康状态,会导致存储集群的业务能力快速下降。当存储集群中,客户端网口(即客户端节点)存在个位数的丢包率或者100ms以上的时延时,存储集群的存储业务的性能会下降70%以上,严重影响存储集群的整体性能。
网络亚健康状态的检测方式,绝大多数都是采用基于CS架构的检测方式,即由单个服务端检测客户端节点的网络状态,从而确定存储集群整体是否处于网络亚健康状态。这种检测方式误报概率高,因为一旦服务端出现问题,同样会影响到客户端的检测结果,使得客户端认为自身存在问题,出现误报。
发明内容
本发明提供了一种客户端节点的网络亚健康状态的检测方法和***,旨在解决现有技术中现有的网络亚健康状态的检测方法,误报概率高,一旦服务端出现问题,会影响到客户端的检测结果,造成误报的问题。
为实现上述目的,根据本发明的第一方面,本发明提供了一种客户端节点的网络亚健康状态的检测方法,包括:
客户端节点向任一服务端节点发送状态检测报文,状态检测报文用于使服务端节点反馈报文回复消息;
客户端节点根据报文回复消息,判断客户端节点自身是否出现网络亚健康状态;
若判定客户端节点自身出现网络亚健康状态,则客户端节点向所有服务端节点发送报文复测消息;
所有服务端节点根据报文复测消息,判断客户端节点是否存在网络亚健康状态;
若所有服务端节点中预定数量及以上的服务端节点判定客户端节点存在网络亚健康状态,则所述服务端节点上报客户端节点的亚健康告警信息。
优选地,所述客户端节点根据报文回复消息,判断客户端节点自身是否出现网络亚健康状态的步骤,包括:
客户端节点根据报文回复消息反馈的数据包数量,计算客户端节点的丢包率;
客户端节点根据报文回复消息反馈的时间标签,计算客户端节点的时延;
客户端节点判断丢包率是否大于或等于预设丢包率阈值,以及判断时延是否大于或等于预设时延阈值;
若客户端节点判定丢包率大于或等于预设丢包率阈值或时延大于或等于预设时延阈值,则客户端节点判定客户端节点自身出现网络亚健康状态。
优选地,所述所有服务端节点根据报文复测消息,判断客户端节点是否存在网络亚健康状态的步骤,包括:
每一服务端节点根据报文复测消息包含的时间标签和数据包数量,分别计算客户端节点的丢包率和时延;
每一服务端节点判断丢包率是否大于或等于预设丢包率阈值,以及判断时延是否大于或等于预设时延阈值。
优选地,所述客户端节点判定客户端节点自身出现网络亚健康状态的步骤之后,所述方法还包括:
客户端节点向除客户端节点外的其他所有客户端节点发送报文复测消息;
其他所有客户端节点根据报文复测消息判断客户端节点是否存在网络亚健康状态;
若其他所有客户端节点中预定数量及以上的节点判定客户端节点存在网络亚健康状态,则向客户端节点发送亚健康告警信息。
优选地,在上报客户端节点的步骤之后,所述网络亚健康状态的检测方法还包括:
每一判定客户端节点存在网络亚健康状态的服务端节点将亚健康告警信息发送至客户端节点;
当客户端节点接收到亚健康告警信息的数量大于或等于预定告警数阈值时,客户端节点关闭客户端节点自身的客户端网口。
根据本发明的第二方面,本发明还提供了一种客户端节点的网络亚健康状态的检测***,包括至少一个客户端节点和多个服务端节点,其中,
客户端节点,用于向任一服务端节点发送状态检测报文,状态检测报文用于使服务端节点反馈报文回复消息;
客户端节点,还用于根据报文回复消息,判断客户端节点自身是否出现网络亚健康状态;
客户端节点还用于若客户端节点判定客户端节点自身出现网络亚健康状态时,向所有服务端节点发送报文复测消息;
所有服务端节点,用于根据报文复测消息,判断客户端节点是否存在网络亚健康状态;
服务端节点,还用于若所有服务端节点中预定数量及以上的服务端节点判定客户端节点存在网络亚健康状态时,上报客户端节点的亚健康告警信息。
优选地,上述网络亚健康状态的检测***中,客户端节点具体还用于根据报文回复消息反馈的数据包数量,计算客户端节点的丢包率;
客户端节点,具体还用于根据报文回复消息反馈的时间标签,计算客户端节点的时延;
客户端节点,具体还用于判断丢包率是否大于或等于预设丢包率阈值,以及判断时延是否大于或等于预设时延阈值;
客户端节点,具体还用于若客户端节点判定丢包率大于或等于预设丢包率阈值或时延大于或等于预设时延阈值时,判定客户端节点自身出现网络亚健康状态。
优选地,上述网络亚健康状态的检测***中,每一服务端节点,具体还用于根据报文复测消息包含的时间标签和数据包数量,分别计算客户端节点的丢包率和时延;
每一服务端节点,具体还用于判断丢包率是否大于或等于预设丢包率阈值,以及判断时延是否大于或等于预设时延阈值。
优选地,上述***中,客户端节点,具体还用于向除客户端节点外的其他所有客户端节点发送报文复测消息;
其他所有客户端节点,具体还用于根据报文复测消息判断客户端节点是否存在网络亚健康状态;
客户端节点,具体还用于若其他所有客户端节点中预定数量及以上的节点判定客户端节点存在网络亚健康状态,则向客户端节点发送亚健康告警信息。
优选地,上述网络亚健康状态的检测***还包括:服务端节点,具体还用于将亚健康告警信息发送至客户端节点;客户端节点,具体还用于当客户端节点接收到亚健康告警信息的数量大于或等于预定告警数阈值时,关闭客户端节点对应的客户端网口。
综上,本申请提供的客户端节点的网络亚健康状态的检测方案,通过客户端节点首先向任一服务端节点发送状态检测报文,再接收服务端节点反馈的报文回复消息;然后客户端节点根据报文回复消息判断客户端节点自身是否出现网络亚健康状态,让判定客户端节点自身出现网络亚健康状态时客户端节点向所有服务器节点发送报文复测消息,当所有服务端节点中预定数量及以上的服务端节点判定客户端存在网络亚健康状态时,说明该客户端节点的确存在网络亚健康状态,此时上报客户端节点的亚健康告警信息,从而实现,综上本申请提供的技术方案相比于背景技术中提到的单个服务端检测客户端节点网络状态的方式,因为在客户端节点自检网络状态,确定自身出现网络亚健康状态后再通过所有服务端节点检测该客户端节点的网络状态,能够更加准确地判断该客户端节点是否存在网络亚健康的情况,从而提高检测的准确率,减少网络亚健康状态的误报率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
图1是本发明实施例提供的一种应用场景示意图;
图2是本发明实施例提供的第一种客户端节点的网络亚健康状态的检测方法的流程示意图;
图3是图2所示实施例提供的第一种网络亚健康状态的判断方法的流程示意图;
图4是图2所示实施例提供的第二种网络亚健康状态的判断方法的流程示意图;
图5是本发明实施例提供的第二种客户端节点的网络亚健康状态的检测方法的流程示意图;
图6是本发明实施例提供的第三种客户端节点的网络亚健康状态的检测方法的流程示意图;
图7是本发明实施例提供的第一种客户端节点的网络亚健康状态的检测***的结构示意图;
图8是本发明实施例提供的第二种客户端节点的网络亚健康状态的检测***的结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例的主要技术问题如下:
现有的客户端节点的网络亚健康状态的检测方案,绝大多数都是采用基于CS架构的检测方式,即由单个服务端检测客户端节点的网络状态,从而确定存储集群整体是否处于网络亚健康状态。这种检测方式误报概率高,因为一旦服务端出现问题,同样会影响到客户端的检测结果,使得客户端认为自身存在问题,出现误报。
为了解决上述问题,参见图1,图1为本发明实施例提供的一种应用场景示意图。如图1所示,在该应用场景中,客户端节点1向任一服务端节点2发送状态检测报文,等待接收服务器节点反馈的报文回复消息;客户端接待你根据报文回复消息判断客户端节点1自身是否出现网络亚健康状态,当出现时客户端节点1向所有服务端节点2发送报文复测消息,然后所有服务端节点2根据报文复测消息判断客户端节点1是否存在网络亚健康状态,当服务端节点2中预定数量及以上,例如一半以上,服务端节点2判定客户端节点1存在网络亚健康状态时,则服务端节点2上报客户端节点1的亚健康告警信息。本发明的技术方案首先通过客户端节点1自检自身的网络状态,然后在确定自身存在网络亚健康状态时,通过所有服务端节点2判断该客户端节点1是否存在网络亚健康状态,从而提高客户端节点1处网络亚健康状态检测的准确率,减少网络亚健康状态的误报率。
具体参见图2,图2为本发明提供的一种客户端节点的网络亚健康状态的检测方法的流程示意图。如图2所示,该客户端节点的网络亚健康状态的检测方法,包括:
S110:客户端节点向任一服务端节点发送状态检测报文,状态检测报文用于使服务端节点反馈报文回复消息。其中状态检测报文包括一定数量的数据包,若网络状态正常,则服务端节点反馈的报文回复消息中反馈的数据包数量相同,并且客户端节点在发送状态检测报文时会设置时间标签,通过该时间标签计算延时情况。
S120:客户端节点根据报文回复消息,判断客户端节点自身是否出现网络亚健康状态。若是,则执行步骤S130;若否,则客户端节点停止发送状态检测报文。该报文回复消息包括一定数量的数据包,当该数据包的数量与状态检测报文包含的数据包的数量相同,则确定客户端节点未出现网络状态健康;若报文回复消息包含的数据包数量少于状态检测报文的数据包数量,或者未返回报文回复消息,则确定客户端节点处于网络亚健康状态。
作为一种优选的实施例,如图3所示,该客户端节点根据报文回复消息,判断客户端节点自身是否出现网络亚健康状态的步骤具体如下:
S121:客户端节点根据报文回复消息反馈的数据包数量,计算客户端节点的丢包率;
S122:客户端节点根据报文回复消息反馈的时间标签,计算客户端节点的时延;
S123:客户端节点判断丢包率是否大于或等于预设丢包率阈值,以及判断时延是否大于或等于预设时延阈值;
S124:若客户端节点判定丢包率大于或等于预设丢包率阈值或时延大于或等于预设时延阈值,则客户端节点判定客户端节点自身出现网络亚健康状态。
本申请实施例提供的技术方案,通过客户端节点根据报文回复消息反馈的数据包数量计算客户端节点的丢包率,并且根据报文回复消息反馈的时间标签计算客户端节点的时延,这样在丢包率大于或等于预设丢包率阈值或实验大于或等于预设时延阈值时,客户端节点即可判定客户端节点自身出现网络亚健康状态,此时需要通过其他节点进一步对该客户端节点的丢包率进行判断。
S130:客户端节点向所有服务端节点发送报文复测消息。通过发送报文复测消息,该复测消息包含数据包和时间标签等信息,这样就能够使用上述所有服务端节点判断客户端节点是否存在网络亚健康状态。
S140:所有服务端节点根据报文复测消息,判断客户端节点是否存在网络亚健康状态。
作为一种优选的实施例,如图4所示,该所有服务端节点根据报文复测消息,判断客户端节点是否存在网络亚健康状态的步骤具体包括:
S141:每一服务端节点根据报文复测消息包含的时间标签和数据包数量,分别计算客户端节点的丢包率和时延。
S142:每一服务端节点判断丢包率是否大于或等于预设丢包率阈值,以及判断时延是否大于或等于预设时延阈值。
本申请实施例提供的技术方案,通过所有服务端节点中的每一服务端节点判断时延和丢包率,能够根据该时延和丢包率的情况确定客户端节点是否存在网络亚健康状态,从而实现对客户端节点网络亚健康状态的准确判断。
S150:若所有服务端节点中预定数量及以上的服务端节点判定客户端节点存在网络亚健康状态,则所述服务端节点上报客户端节点的亚健康告警信息。
综上,本申请实施例提供的客户端节点的网络亚健康状态的检测方法,通过客户端节点首先向任一服务端节点发送状态检测报文,再接收服务端节点反馈的报文回复消息;然后客户端节点根据报文回复消息判断客户端节点自身是否出现网络亚健康状态,让判定客户端节点自身出现网络亚健康状态时客户端节点向所有服务器节点发送报文复测消息,当所有服务端节点中预定数量及以上的服务端节点判定客户端存在网络亚健康状态时,说明该客户端节点的确存在网络亚健康状态,此时上报客户端节点的亚健康告警信息,从而实现,综上本申请提供的技术方案相比于背景技术中提到的单个服务端检测客户端节点网络状态的方式,因为在客户端节点自检网络状态,确定自身出现网络亚健康状态后再通过其他所有服务端节点检测该客户端节点的网络状态,能够更加准确地判断该客户端节点是否存在网络亚健康的情况,从而提高检测的准确率,减少网络亚健康状态的误报率。
另外,为了进一步对客户端节点的网络亚健康状态进行准确预警,本申请还能够使用其他客户端节点对该客户端节点进行网络亚健康状态的判断。具体地,作为一种优选的实施例,如图5所示,在客户端节点判定客户端节点自身出现网络亚健康状态的步骤之后,所述方法还包括:
S210:客户端节点向除客户端节点外的其他所有客户端节点发送报文复测消息;
S220:其他所有客户端节点根据报文复测消息判断客户端节点是否存在网络亚健康状态;
S230:若其他所有客户端节点中预定数量及以上的节点判定客户端节点存在网络亚健康状态,则向客户端节点发送亚健康告警信息。
本申请实施例提供的技术方案,通过其他客户端节点判断该客户端节点是否存在网络亚健康状态,然后在确定该客户端节点存在网络亚健康状态时向客户端节点发送亚健康状态告警信息,能够进一步对客户端节点的网络状态进行准确判断,从而确定该客户端节点是否存在网络亚健康状态。
作为一种优选的实施例,如图6所示,在上报客户端节点的步骤之后,所述网络亚健康状态的检测方法还包括:
S310:每一判定客户端节点存在网络亚健康状态的服务端节点将亚健康告警信息发送至客户端节点。
S320:当客户端节点接收到亚健康告警信息的数量大于或等于预定告警数阈值时,客户端节点关闭客户端节点自身的客户端网口。
本申请实施例提供的技术方案,通过每一判定客户端节点存在网络亚健康状态的服务端节点,将亚健康状态告警信息发送至客户端节点,然后客户端节点能够统计收到的亚健康告警信息的数量,该数据记对应着判定存在网络亚健康状态的服务端节点的数量,然后客户端节点关闭自身的网口,避免客户端节点通过该网口进行信息的传输。
另外,基于上述方法实施例的同一构思,本发明实施例还提供了一种客户端节点的网络亚健康状态的检测***,用于实现本发明的上述方法,由于该***实施例解决问题的原理与上述方法相似,因此至少具有上述实施例的技术方案所带来的所有有益效果,在此不再一一赘述。
参见图7和图8,图7和图8分别为本发明实施例提供的一种客户端节点的网络亚健康状态的检测***的结构示意图。如图7和图8所示,该网络亚健康状态的检测***包括至少一个客户端节点1和多个服务端节点2,其中,
客户端节点1,用于向任一服务端节点2发送状态检测报文,状态检测报文用于使服务端节点2反馈报文回复消息。
客户端节点1,还用于根据报文回复消息,判断客户端节点1自身是否出现网络亚健康状态。
客户端节点1还用于若客户端节点1判定客户端节点1自身出现网络亚健康状态时,向所有服务端节点2发送报文复测消息。
所有服务端节点2,用于根据报文复测消息,判断客户端节点1是否存在网络亚健康状态。
服务端节点2,还用于若所有服务端节点2中预定数量及以上的服务端节点2判定客户端节点1存在网络亚健康状态时,上报客户端节点1的亚健康告警信息。
其中,参见图7和图8,该检测***分为两层逻辑,分别为底层逻辑和上层逻辑。在底层逻辑依然采用CS架构,即客户端Client节点向服务端Server节点发送状态检测报文,Server节点接收到消息后立即返回,Client节点根据返回的消息分析自己的丢包率和时延。
具体地,通过底层逻辑的问题客户端节点1检测自身是否存在网络亚健康状态,即存在丢包率或时延大于或等于各自阈值的情况,此时将自己处于网络亚健康状态的提议发送至全部服务端节点2。服务端节点2接收到该提议后,分别向问题客户端节点1发送报文复测消息。其他节点根据复测结果给出对上述提议的意见,赞成或否决;当所有服务端节点2中半数及以上赞成时,则认为问题客户端节点1的确存在网络亚健康状态,此时向操作***3上报亚健康告警信息,并关闭问题客户端节点1对应的网口;否则不向操作***3上报亚健康告警信息。
综上,本申请实施例提供的客户端节点1的网络亚健康状态的检测***,通过客户端节点1首先向任一服务端节点2发送状态检测报文,再接收服务端节点2反馈的报文回复消息;然后客户端节点1根据报文回复消息判断客户端节点1自身是否出现网络亚健康状态,让判定客户端节点1自身出现网络亚健康状态时客户端节点1向所有服务器节点发送报文复测消息,当所有服务端节点2中预定数量及以上的服务端节点2判定客户端存在网络亚健康状态时,说明该客户端节点1的确存在网络亚健康状态,此时上报客户端节点1的亚健康告警信息,从而实现,综上本申请提供的技术方案相比于背景技术中提到的单个服务端检测客户端节点1网络状态的方式,因为在客户端节点1自检网络状态,确定自身出现网络亚健康状态后再通过其他所有服务端节点2检测该客户端节点1的网络状态,能够更加准确地判断该客户端节点1是否存在网络亚健康的情况,从而提高检测的准确率,减少网络亚健康状态的误报率。
作为一种优选的实施例,如图8所示,上述网络亚健康状态的检测***中,客户端节点1具体还用于根据报文回复消息反馈的数据包数量,计算客户端节点1的丢包率;
客户端节点1,具体还用于根据报文回复消息反馈的时间标签,计算客户端节点1的时延;
客户端节点1,具体还用于判断丢包率是否大于或等于预设丢包率阈值,以及判断时延是否大于或等于预设时延阈值;
客户端节点1,具体还用于若客户端节点1判定丢包率大于或等于预设丢包率阈值或时延大于或等于预设时延阈值时,判定客户端节点1自身出现网络亚健康状态。
作为一种优选的实施例,如图8所示,上述网络亚健康状态的检测***中,每一服务端节点2,具体还用于根据报文复测消息包含的时间标签和数据包数量,分别计算客户端节点1的丢包率和时延;
每一服务端节点2,具体还用于判断丢包率是否大于或等于预设丢包率阈值,以及判断时延是否大于或等于预设时延阈值。
优选地,上述***中,客户端节点1,具体还用于向除客户端节点1外的其他所有客户端节点1发送报文复测消息;
其他所有客户端节点1,具体还用于根据报文复测消息判断客户端节点1是否存在网络亚健康状态;
客户端节点1,具体还用于若其他所有客户端节点1中预定数量及以上的节点判定客户端节点1存在网络亚健康状态,则向客户端节点1发送亚健康告警信息。
作为一种优选的实施例,如图8所示,上述网络亚健康状态的检测***还包括:服务端节点2,具体还用于将亚健康告警信息发送至客户端节点1;客户端节点1,具体还用于当客户端节点1接收到亚健康告警信息的数量大于或等于预定告警数阈值时,关闭客户端节点1对应的客户端网口。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
应当注意的是,在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的部件或步骤。位于部件之前的单词“一”或“一个”不排除存在多个这样的部件。本发明可以借助于包括有若干不同部件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种客户端节点的网络亚健康状态的检测方法,其特征在于,包括:
客户端节点向任一服务端节点发送状态检测报文,所述状态检测报文用于使所述服务端节点反馈报文回复消息;
所述客户端节点根据所述报文回复消息,判断所述客户端节点自身是否出现网络亚健康状态;
若判定所述客户端节点自身出现网络亚健康状态,则所述客户端节点向所有所述服务端节点发送报文复测消息;
所述所有服务端节点根据所述报文复测消息,判断所述客户端节点是否存在所述网络亚健康状态;
若所述所有服务端节点中预定数量及以上的服务端节点判定所述客户端节点存在网络亚健康状态,则所述服务端节点上报所述客户端节点的亚健康告警信息。
2.根据权利要求1所述的网络亚健康状态的检测方法,其特征在于,所述客户端节点根据所述报文回复消息,判断所述客户端节点自身是否出现网络亚健康状态的步骤,包括:
所述客户端节点根据所述报文回复消息反馈的数据包数量,计算所述客户端节点的丢包率;
所述客户端节点根据所述报文回复消息反馈的时间标签,计算所述客户端节点的时延;
所述客户端节点判断所述丢包率是否大于或等于预设丢包率阈值,以及判断所述时延是否大于或等于预设时延阈值;
若所述客户端节点判定所述丢包率大于或等于预设丢包率阈值,或者所述时延大于或等于预设时延阈值,则所述客户端节点判定所述客户端节点自身出现网络亚健康状态。
3.根据权利要求1所述的网络亚健康状态的检测方法,其特征在于,所述所有服务端节点根据所述报文复测消息,判断所述客户端节点是否存在所述网络亚健康状态的步骤,包括:
每一所述服务端节点根据所述报文复测消息包含的时间标签和数据包数量,分别计算所述客户端节点的丢包率和时延;
每一所述服务端节点判断所述丢包率是否大于或等于预设丢包率阈值,以及判断所述时延是否大于或等于预设时延阈值。
4.根据权利要求1所述的网络亚健康状态的检测方法,其特征在于,所述客户端节点判定所述客户端节点自身出现网络亚健康状态的步骤之后,所述方法还包括:
所述客户端节点向除所述客户端节点外的其他所有客户端节点发送报文复测消息;
其他所有客户端节点根据所述报文复测消息判断所述客户端节点是否存在所述网络亚健康状态;
若所述其他所有客户端节点中预定数量及以上的节点判定所述客户端节点存在网络亚健康状态,则向所述客户端节点发送亚健康告警信息。
5.根据权利要求1所述的网络亚健康状态的检测方法,其特征在于,在上报所述客户端节点的步骤之后,所述方法还包括:
每一判定客户端节点存在网络亚健康状态的所述服务端节点将所述亚健康告警信息发送至所述客户端节点;
当所述客户端节点接收到所述亚健康告警信息的数量大于或等于预定告警数阈值时,则所述客户端节点关闭所述客户端节点自身的客户端网口。
6.一种客户端节点的网络亚健康状态的检测***,其特征在于,包括至少一个客户端节点和多个服务端节点,其中,
所述客户端节点,用于向任一服务端节点发送状态检测报文,所述状态检测报文用于使所述服务端节点反馈报文回复消息;
所述客户端节点,还用于根据所述报文回复消息,判断所述客户端节点自身是否出现网络亚健康状态;
所述客户端节点,还用于若所述客户端节点判定所述客户端节点自身出现网络亚健康状态时,向所有服务端节点发送报文复测消息;
所述所有服务端节点,用于根据所述报文复测消息,判断所述客户端节点是否存在所述网络亚健康状态;
所述服务端节点,还用于若所述所有服务端节点中预定数量及以上的服务端节点判定所述客户端节点存在网络亚健康状态时,上报所述客户端节点的亚健康告警信息。
7.根据权利要求6所述的网络亚健康状态的检测***,其特征在于,所述客户端节点,具体还用于根据所述报文回复消息反馈的数据包数量,计算所述客户端节点的丢包率;
所述客户端节点,具体还用于根据所述报文回复消息反馈的时间标签,计算所述客户端节点的时延;
所述客户端节点,具体还用于判断所述丢包率是否大于或等于预设丢包率阈值,以及判断所述时延是否大于或等于预设时延阈值;
所述客户端节点,具体还用于若所述客户端节点判定所述丢包率大于或等于预设丢包率阈值或所述时延大于或等于预设时延阈值时,判定所述客户端节点自身出现网络亚健康状态。
8.根据权利要求6所述的网络亚健康状态的检测***,其特征在于,
每一所述服务端节点,具体还用于根据所述报文复测消息包含的时间标签和数据包数量,分别计算所述客户端节点的丢包率和时延;
每一所述服务端节点,具体还用于判断所述丢包率是否大于或等于预设丢包率阈值,以及判断所述时延是否大于或等于预设时延阈值。
9.根据权利要求6所述的网络亚健康状态的检测***,其特征在于,
所述客户端节点,具体还用于向除所述客户端节点外的其他所有客户端节点发送报文复测消息;
其他所有客户端节点,具体还用于根据所述报文复测消息判断所述客户端节点是否存在所述网络亚健康状态;
所述客户端节点,具体还用于若所述其他所有客户端节点中预定数量及以上的节点判定所述客户端节点存在网络亚健康状态,则向所述所述客户端节点发送亚健康告警信息。
10.根据权利要求6所述的网络亚健康状态的检测***,其特征在于,
所述服务端节点,具体还用于将所述亚健康告警信息发送至所述客户端节点;
所述客户端节点,具体还用于当所述客户端节点接收到所述亚健康告警信息的数量大于或等于预定告警数阈值时,关闭所述客户端节点对应的客户端网口。
CN202110375922.0A 2021-04-08 2021-04-08 一种客户端节点的网络亚健康状态的检测方法和*** Active CN113132160B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110375922.0A CN113132160B (zh) 2021-04-08 2021-04-08 一种客户端节点的网络亚健康状态的检测方法和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110375922.0A CN113132160B (zh) 2021-04-08 2021-04-08 一种客户端节点的网络亚健康状态的检测方法和***

Publications (2)

Publication Number Publication Date
CN113132160A true CN113132160A (zh) 2021-07-16
CN113132160B CN113132160B (zh) 2023-02-28

Family

ID=76775365

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110375922.0A Active CN113132160B (zh) 2021-04-08 2021-04-08 一种客户端节点的网络亚健康状态的检测方法和***

Country Status (1)

Country Link
CN (1) CN113132160B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113890816A (zh) * 2021-11-19 2022-01-04 深信服科技股份有限公司 网络健康状态分析方法、装置、计算机设备和存储介质
CN115118635A (zh) * 2022-06-29 2022-09-27 济南浪潮数据技术有限公司 一种时延检测方法、装置、设备及存储介质
WO2024116136A1 (en) * 2022-12-01 2024-06-06 Jio Platforms Limited System and method for generating a customer health card

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105872118A (zh) * 2015-11-25 2016-08-17 乐视云计算有限公司 Dns网络中节点服务器的检测方法及设备
CN110620703A (zh) * 2019-09-29 2019-12-27 北京首汽智行科技有限公司 一种基于http的服务节点状态确定方法
CN110677480A (zh) * 2019-09-29 2020-01-10 北京浪潮数据技术有限公司 一种节点健康管理方法、装置和计算机可读存储介质
CN111142801A (zh) * 2019-12-26 2020-05-12 星辰天合(北京)数据科技有限公司 分布式存储***网络亚健康检测方法及装置
CN111510338A (zh) * 2020-03-09 2020-08-07 苏州浪潮智能科技有限公司 一种分布式块存储网络亚健康测试方法、装置及存储介质
CN111585845A (zh) * 2020-05-15 2020-08-25 苏州浪潮智能科技有限公司 一种网卡节点性能的检测方法、装置、设备及可读介质
CN111884870A (zh) * 2020-06-28 2020-11-03 苏州浪潮智能科技有限公司 一种预测网络亚健康状态的方法、装置、终端及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105872118A (zh) * 2015-11-25 2016-08-17 乐视云计算有限公司 Dns网络中节点服务器的检测方法及设备
CN110620703A (zh) * 2019-09-29 2019-12-27 北京首汽智行科技有限公司 一种基于http的服务节点状态确定方法
CN110677480A (zh) * 2019-09-29 2020-01-10 北京浪潮数据技术有限公司 一种节点健康管理方法、装置和计算机可读存储介质
CN111142801A (zh) * 2019-12-26 2020-05-12 星辰天合(北京)数据科技有限公司 分布式存储***网络亚健康检测方法及装置
CN111510338A (zh) * 2020-03-09 2020-08-07 苏州浪潮智能科技有限公司 一种分布式块存储网络亚健康测试方法、装置及存储介质
CN111585845A (zh) * 2020-05-15 2020-08-25 苏州浪潮智能科技有限公司 一种网卡节点性能的检测方法、装置、设备及可读介质
CN111884870A (zh) * 2020-06-28 2020-11-03 苏州浪潮智能科技有限公司 一种预测网络亚健康状态的方法、装置、终端及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113890816A (zh) * 2021-11-19 2022-01-04 深信服科技股份有限公司 网络健康状态分析方法、装置、计算机设备和存储介质
CN115118635A (zh) * 2022-06-29 2022-09-27 济南浪潮数据技术有限公司 一种时延检测方法、装置、设备及存储介质
WO2024116136A1 (en) * 2022-12-01 2024-06-06 Jio Platforms Limited System and method for generating a customer health card

Also Published As

Publication number Publication date
CN113132160B (zh) 2023-02-28

Similar Documents

Publication Publication Date Title
CN113132160B (zh) 一种客户端节点的网络亚健康状态的检测方法和***
US10862786B2 (en) Method and device for fingerprint based status detection in a distributed processing system
CN114064333A (zh) 一种内存故障处理方法和装置
CN111988191B (zh) 一种分布式通信网络的故障检测方法及装置
US10831579B2 (en) Error detecting device and error detecting method for detecting failure of hierarchical system, computer readable recording medium, and computer program product
CN106330588B (zh) 一种bfd检测方法与装置
CN111142801B (zh) 分布式存储***网络亚健康检测方法及装置
CN111427694A (zh) 任务执行方法、装置、***和服务器
CN110601945A (zh) 一种双冗余can总线通信***和通信方法
CN112039723A (zh) 微服务网络状态检测方法、装置及电子设备
CN105933176A (zh) 一种检测主机状态的方法及装置
CN105490837B (zh) 一种网络监控处理方法以及装置
CN107786390B (zh) 组网节点修正方法及装置
US8582444B2 (en) Method for detecting hardware faults by determining a ratio of released connections
CN106161058B (zh) 一种告警分级方法及装置
CN115150253B (zh) 一种故障根因确定方法、装置及电子设备
CN112363893B (zh) 时序指标异常检测方法、设备及装置
CN113835961B (zh) 告警信息监控方法、装置、服务器及存储介质
CN114697196A (zh) 数据中心中网络路径切换方法、数据中心网络***及设备
CN109117294B (zh) 适用于证券交易***的故障检测方法及装置
Li Anomaly detection in wireless sensor networks based on time factor
CN116016265B (zh) 消息全链路监控方法、装置、***、设备和存储介质
CN109831342A (zh) 一种基于分布式***的故障恢复方法
CN111447118B (zh) 基于数据传输流的数据传输方法及装置
CN114567471B (zh) 一种基于5g的电力通信网络安全检测***及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant