CN113328885B - 网络健康度评估方法、装置、电子设备、介质和程序产品 - Google Patents
网络健康度评估方法、装置、电子设备、介质和程序产品 Download PDFInfo
- Publication number
- CN113328885B CN113328885B CN202110587864.8A CN202110587864A CN113328885B CN 113328885 B CN113328885 B CN 113328885B CN 202110587864 A CN202110587864 A CN 202110587864A CN 113328885 B CN113328885 B CN 113328885B
- Authority
- CN
- China
- Prior art keywords
- network
- determining
- monitoring
- module
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3006—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3409—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0677—Localisation of faults
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/069—Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/04—Processing captured monitoring data, e.g. for logfile generation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/60—Scheduling or organising the servicing of application requests, e.g. requests for application data transmissions using the analysis and optimisation of the required network resources
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Quality & Reliability (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本公开提供一种网络健康度评估方法,包括:响应于目标数据的传输请求,确定待评估网络的网络传输路径,网络传输路径用于表征目标数据依次流经待评估网络的多个网络层级,多个网络层级包括硬件层、网卡驱动层、内核协议栈层、以及套接字层。获取与每个网络层级对应的网络监控指标,网络监控指标用于作为对其所对应的网络层级进行健康度评估的评估依据。基于监控得到的与网络监控指标对应的指标监控数据,确定与每个网络层级对应的健康度评估结果。基于与每个网络层级对应的健康度评估结果,确定待评估网络的健康度评估结果。本公开还提供一种网络健康度评估装置、电子设备、介质和程序产品。本公开提供的方法和装置可以应用于金融领域或其他领域。
Description
技术领域
本公开涉及网络技术领域,特别是涉及一种网络健康度评估方法、装置、电子设备、介质和程序产品。
背景技术
本部分旨在为权利要求书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
在盛行的网络应用的需求驱动下,数据中心在全球范围内以前所未有的速度和规模发展建立起来。数据中心是一整套复杂的设施,不仅仅包括计算机***和其它与之配套的设备,还包括冗余的数据通信连接、环境控制设备、监控设备以及各种安全装置。数据中心的规模越来越大,承载的业务越来越多,维持正常的网络传输对数据中心的正常运行至关重要。目前,数据中心在网络故障检测领域一般涉及网络设备、线路等方面,通过监控网络设备的一些关键KPI,例如端口、光模块、单板等对全网的网络设备进行异常检测。
然而,在实现本公开构思的过程中,发明人发现相关技术虽然可以实现对网络设备的异常检测,但是对于数据从网络传输介质进入服务器之后所发生的网络传输异常情况来说,一般都是在故障发生之后,通过人工逐项排查日志的方式进行故障定位,无法预知并检测到故障的详细情况,时效性不佳。
发明内容
有鉴于此,为了克服相关技术中所存在的上述技术问题,以期在数据从网络传输介质流入服务器之后,可以及时地、准确地发现在网络传输过程中所产生的网络传输异常情况,本公开提供了一种网络健康度评估方法、可以应用该网络健康度评估方法的网络健康度评估装置、电子设备、介质和程序产品。
为了实现上述目标,本公开的一个方面提供了一种网络健康度评估方法,该方法可以包括:响应于目标数据的传输请求,确定待评估网络的网络传输路径,其中,上述网络传输路径用于表征上述目标数据依次流经上述待评估网络的多个网络层级,上述多个网络层级包括硬件层、网卡驱动层、内核协议栈层、以及套接字层;获取与每个网络层级对应的网络监控指标,其中,上述网络监控指标用于作为对其所对应的网络层级进行健康度评估的评估依据;基于监控得到的与上述网络监控指标对应的指标监控数据,确定与上述每个网络层级对应的健康度评估结果;以及基于上述与上述每个网络层级对应的健康度评估结果,确定上述待评估网络的健康度评估结果。
根据本公开的实施例,上述基于监控得到的与上述网络监控指标对应的指标监控数据,确定与上述每个网络层级对应的健康度评估结果可以包括:确定与上述网络监控指标对应的第一阈值和第二阈值,其中,上述第一阈值用于表征上述网络监控指标处于异常状态的临界值,上述第二阈值用于表征上述网络监控指标处于故障状态的临界值;以及基于监控得到的与上述网络监控指标对应的指标监控数据、上述第一阈值和上述第二阈值,确定与上述每个网络层级对应的健康度评估结果。
根据本公开的实施例,上述基于监控得到的与上述网络监控指标对应的指标监控数据、上述第一阈值和上述第二阈值,确定与上述每个网络层级对应的健康度评估结果可以包括以下至少之一:在上述监控得到的与上述网络监控指标对应的指标监控数据未超过上述第一阈值的情况下,确定与上述每个网络层级对应的健康度评估结果为健康状态;在上述监控得到的与上述网络监控指标对应的指标监控数据超过上述第一阈值、未超过上述第二阈值的情况下,确定与上述每个网络层级对应的健康度评估结果为异常状态;在上述监控得到的与上述网络监控指标对应的指标监控数据未超过上述第二阈值的情况下,确定与上述每个网络层级对应的健康度评估结果为故障状态。
根据本公开的实施例,上述基于上述与上述每个网络层级对应的健康度评估结果,确定上述待评估网络的健康度评估结果可以包括以下至少之一:在上述与上述每个网络层级对应的健康度评估结果为健康状态的情况下,确定上述待评估网络的健康度评估结果为健康状态;在至少一个网络层级对应的健康度评估结果为异常状态的情况下,确定上述待评估网络的健康度评估结果为异常状态;在至少一个网络层级对应的健康度评估结果为故障状态的情况下,确定上述待评估网络的健康度评估结果为故障状态。
根据本公开的实施例,上述硬件层可以包括光模块,上述与上述硬件层对应的网络监控指标可以包括以下至少之一:上述光模块的接收光功率;上述光模块的发送光功率;上述光模块的模块温度;上述光模块的模块电压;上述光模块的偏置电流。
根据本公开的实施例,上述网卡驱动层可以包括网卡缓存区,上述与上述网卡驱动层对应的网络监控指标可以包括以下至少之一:上述网卡缓存区的数据包的溢出数量;上述网卡缓存区的数据包的丢弃数量;上述网卡缓存区的数据包的错误数量。
根据本公开的实施例,上述与上述内核协议栈层对应的网络监控指标可以包括以下至少之一:与传输控制协议相关的网络监控指标;与网际协议相关的网络监控指标。
根据本公开的实施例,上述套接字层可以包括套接字缓存区,与上述套接字层对应的网络监控指标可以包括以下至少之一:上述套接字缓存区的数据包的溢出数量;上述套接字缓存区的数据包的丢弃数量;上述套接字缓存区的数据包的无效数量。
为了实现上述目标,本公开的另一个方面提供了一种网络健康度评估装置,该装置可以包括:第一确定模块,用于响应于目标数据的传输请求,确定待评估网络的网络传输路径,其中,上述网络传输路径用于表征上述目标数据依次流经上述待评估网络的多个网络层级,上述多个网络层级包括硬件层、网卡驱动层、内核协议栈层、以及套接字层;获取模块,用于获取与每个网络层级对应的网络监控指标,其中,上述网络监控指标用于作为对其所对应的网络层级进行健康度评估的评估依据;第二确定模块,用于基于监控得到的与上述网络监控指标对应的指标监控数据,确定与上述每个网络层级对应的健康度评估结果;以及第三确定模块,用于基于上述与上述每个网络层级对应的健康度评估结果,确定上述待评估网络的健康度评估结果。
根据本公开的实施例,上述第二确定模块可以包括:第一确定子模块,用于确定与上述网络监控指标对应的第一阈值和第二阈值,其中,上述第一阈值用于表征上述网络监控指标处于异常状态的临界值,上述第二阈值用于表征上述网络监控指标处于故障状态的临界值;以及第二确定子模块,用于基于监控得到的与上述网络监控指标对应的指标监控数据、上述第一阈值和上述第二阈值,确定与上述每个网络层级对应的健康度评估结果。
根据本公开的实施例,上述第二确定子模块可以包括以下至少之一:第一确定单元,用于在上述监控得到的与上述网络监控指标对应的指标监控数据未超过上述第一阈值的情况下,确定与上述每个网络层级对应的健康度评估结果为健康状态;第二确定单元,用于在上述监控得到的与上述网络监控指标对应的指标监控数据超过上述第一阈值、未超过上述第二阈值的情况下,确定与上述每个网络层级对应的健康度评估结果为异常状态;第三确定单元,用于在上述监控得到的与上述网络监控指标对应的指标监控数据未超过上述第二阈值的情况下,确定与上述每个网络层级对应的健康度评估结果为故障状态。
根据本公开的实施例,上述第三确定模块可以包括以下至少之一:第三确定子模块,用于在上述与上述每个网络层级对应的健康度评估结果为健康状态的情况下,确定上述待评估网络的健康度评估结果为健康状态;第四确定子模块,用于在至少一个网络层级对应的健康度评估结果为异常状态的情况下,确定上述待评估网络的健康度评估结果为异常状态;第五确定子模块,用于在至少一个网络层级对应的健康度评估结果为故障状态的情况下,确定上述待评估网络的健康度评估结果为故障状态。
根据本公开的实施例,上述硬件层可以包括光模块,上述与上述硬件层对应的网络监控指标可以包括以下至少之一:上述光模块的接收光功率;上述光模块的发送光功率;上述光模块的模块温度;上述光模块的模块电压;上述光模块的偏置电流。
根据本公开的实施例,上述网卡驱动层可以包括网卡缓存区,上述与上述网卡驱动层对应的网络监控指标可以包括以下至少之一:上述网卡缓存区的数据包的溢出数量;上述网卡缓存区的数据包的丢弃数量;上述网卡缓存区的数据包的错误数量。
根据本公开的实施例,上述与上述内核协议栈层对应的网络监控指标可以包括以下至少之一:与传输控制协议相关的网络监控指标;与网际协议相关的网络监控指标。
根据本公开的实施例,上述套接字层可以包括套接字缓存区,与上述套接字层对应的网络监控指标可以包括以下至少之一:上述套接字缓存区的数据包的溢出数量;上述套接字缓存区的数据包的丢弃数量;上述套接字缓存区的数据包的无效数量。
为了实现上述目标,本公开的另一方面提供了一种电子设备,包括:一个或多个处理器,存储器,用于存储一个或多个程序,其中,当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器实现如上所述的网络健康度评估方法。
为了实现上述目标,本公开的另一方面提供了一种计算机可读存储介质,存储有计算机可执行指令,上述指令在被执行时用于实现如上所述的网络健康度评估方法。
为了实现上述目标,本公开的另一方面提供了一种计算机程序,上述计算机程序包括计算机可执行指令,上述指令在被执行时用于实现如上所述的网络健康度评估方法。
本公开提供的基于网络监控指标的网络健康度评估方法,将目标数据流入服务器的待评估网络后的网络传输路径按照所在的网络层级进行逐层监控,可以至少部分地解决相关技术中在服务器侧发生网络传输异常时通过人工排查日志、逐项检测等方式定位故障的不足,并因此可以实现通过对每个网络层级的网络监控指标进行监控,根据异常指标所在的网络层级可以进行异常情况的定位,还可以在定位到发生故障的网络层后结合具体情况进行故障分析的技术效果。
附图说明
通过参考附图阅读下文的详细描述,本公开示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本公开的若干实施方式,其中:
图1示意性示出了适用于本公开实施例的网络健康度评估方法、装置、电子设备、介质和程序产品的***架构;
图2示意性示出了适用于本公开实施例的网络传输路径;
图3示意性示出了根据本公开实施例的网络健康度评估方法的流程图;
图4示意性示出了根据本公开实施例的网络健康度评估装置的框图;
图5示意性示出了根据本公开实施例的适于实现上文描述的网络健康度评估方法的计算机可读存储介质产品的示意图;以及
图6示意性示出了根据本公开实施例的适于实现上文描述的网络健康度评估方法的电子设备的框图。
在附图中,相同或对应的标号表示相同或对应的部分。
应该注意的是,附图并未按比例绘制,并且出于说明目的,在整个附图中类似结构或功能的元素通常用类似的附图标记来表示。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了上述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的***”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的***等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的***”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的***等)。
附图中示出了一些方框图和/或流程图。应理解,方框图和/或流程图中的一些方框或其组合可以由计算机程序指令来实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其他可编程的网络健康度评估装置的处理器,从而这些指令在由该处理器执行时可以创建用于实现这些方框图和/或流程图中所说明的功能/操作的装置。本公开所提供的技术可以硬件和/或软件(包括固件、微代码等)的形式来实现。另外,本公开所提供的技术可以采取存储有指令的计算机可读存储介质上的计算机程序产品的形式,该计算机程序产品可供指令执行***使用或者结合指令执行***使用。
对于用来传输数据的网络来说,其健康程度对数据传输的成败以及传输效率显得至关重要,在相关技术中,若在服务器侧发生的网络传输异常,一般都是在故障发生之后,通过人工排查日志、逐项检测等方式进行故障的定位,但是无法在故障发生之前预先获知可能发生故障的位置并检测到故障的详细情况,导致在对网络传输故障进行排查时的时效性不佳,排查结果明显滞后。
为了提高对网络传输故障排查的失效性,在故障发生之前就可以预先获知可能发生故障的位置,本公开的实施例提供了一种网络健康度评估方法,包括网络传输路径确定过程以及网络健康度评估过程。其中在网络传输路径确定过程,首先,响应于目标数据的传输请求,确定待评估网络的网络传输路径,网络传输路径用于表征目标数据依次流经待评估网络的多个网络层级,多个网络层级可以包括硬件层、网卡驱动层、内核协议栈层、以及套接字层。然后,获取与每个网络层级对应的网络监控指标,网络监控指标用于作为对其所对应的网络层级进行健康度评估的评估依据。在网络传输路径确定过程完成之后,进入网络健康度评估。首先,基于监控得到的与网络监控指标对应的指标监控数据,确定与每个网络层级对应的健康度评估结果。最后,基于与每个网络层级对应的健康度评估结果,确定待评估网络的健康度评估结果。
通过本公开提供的基于网络监控指标的服务器网络传输的健康度评价方法,可以基于服务器侧对数据流入服务器后的网络传输过程而确定出的网络传输路径进行分层级的监控,获得每个网络层级的健康度评估结果,并可以根据多个网络层级中出现异常数据的网络监控指标对服务器的网络健康度进行异常分析及故障定位,具有较佳的时效性。
需要说明的是,本公开所提供的网络健康度评估方法、可以应用该网络健康度评估方法的网络健康度评估装置、电子设备、介质和程序产品可用于金融领域中,也可用于除金融领域之外的任意领域中。因此,对本公开所提供的网络健康度评估方法、可以应用该网络健康度评估方法的网络健康度评估装置、电子设备、介质和程序产品的应用领域不做具体限定。
图1示意性示出了适用于本公开实施例的网络健康度评估方法、装置、电子设备、介质和程序产品的***架构100。需要注意的是,图1所示仅为可应用本公开实施例的***架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、***、环境或场景。
如图1所示,根据该实施例的***架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。
需要说明的是,本公开实施例所提供的网络健康度评估方法一般可以由服务器105执行。相应地,本公开实施例所提供的网络健康度评估装置一般可以设置于服务器105中。本公开实施例所提供的网络健康度评估方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地本公开实施例所提供的网络健康度评估装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
图2示意性示出了适用于本公开实施例的网络传输路径。
如图2所示,数据在流入服务器200之后,到达应用250之前依次流经多个网络层级,以形成数据从网络传输介质进入服务器200后的网络传输路径。在本公开中,服务器200可以是用来进行业务处理应用的Linux服务器,在网络和计算机***当中有广泛的应用,可以提供数据库管理和网络服务等内容,Linux服务器是一种性能非常高的开源的服务器。Linux操作***嵌入了TCP/IP协议栈,协议软件具有路由转发功能。路由转发依赖作为路由器的主机中安装多块网卡,当某一块网卡接收到数据包后,***内核会根据数据包的目的IP地址,查询路由表,然后根据查询结果将数据包发送到另外一块网卡,最后通过此网卡把数据包发送出去。此主机的处理过程就是路由器完成的核心功能。
根据本公开的实施例,多个网络层级从下到上依次可以描述为硬件层210、网卡驱动层220、内核协议栈层230以及套接字层240。在本公开中硬件层210为数据帧经传输介质流入服务器的接收装置,硬件层210的监控对象可以是物理网卡。网卡驱动层220的监控对象可以是网卡的环形队列(也称为环形缓冲区,Ring Buffer),环形缓冲区也称作圆形队列(Circular Queue),循环缓冲区(Cyclic Buffer),圆形缓冲区(Circula Buffer),是一种用于表示一个固定尺寸、头尾相连的缓冲区的数据结构,适合缓存数据流。内核协议栈层230的监控对象可以是传输控制协议(TCP,Transmission Control Protoc0l)和网际协议(IP,Internet Protocol)。套接字层240的监控对象可以是套接字队列(Socket Buffer)。其中网卡驱动层220、内核协议栈层230、以及套接字层240组成内核。
需要注意的是,图2中网络传输路径所流经的多个网络层级仅仅是示例,以帮助本领域技术人员理解本公开的技术内容,并不是对网络层级的限定。
图3示意性示出了根据本公开实施例的网络健康度评估方法的流程图。如图3所示,该评估方法300可以包括操作S310~操作S340。
在操作S310,响应于目标数据的传输请求,确定待评估网络的网络传输路径,该网络传输路径用于表征目标数据依次流经待评估网络的多个网络层级,多个网络层级包括硬件层、网卡驱动层、内核协议栈层、以及套接字层。
根据本公开的实施例,目标数据可以是通过待评估网络传输的任意数据,可以根据网络体系结构、以及服务器Linux操作***的内核协议栈的层次结构,将数据流入服务器后的网络传输路径划分为多个网络层级。其中网络体系结构意为开放性的通信***互联参考模型(Open Systems Interconnection,OSI),是一个协议规范,用于定义计算机网络的分层、各层协议和层间接口的集合。将网络通信的工作层划分为7个层级,从低到高分别为物理层、数据链路层、网络层、传输层、会话层、表示层、应用层。内核协议栈的层次结构可以包括***调用接口、协议无关接口、网络协议、驱动无关接口、以及设备驱动程序。
在操作S320,获取与每个网络层级对应的网络监控指标,该网络监控指标用于作为对其所对应的网络层级进行健康度评估的评估依据。
根据本公开的实施例,与每个网络层级对应的网络监控指标均可通过Linux操作***的命令行获取,例如CMD命令行。例如硬件层的网络监控指标可以通过“ethtool-meth1”命令来获得,网卡驱动层的网络监控指标可以通过“ifconfig;ethtool-meth1;cat/proc/net/softnet_stat”命令来获得,套接字层的网络监控指标可以通过“cat/proc/net/netstat”命令来获得。需要说明的是,本公开对网络监控指标的获取方法不做限定,本领域技术人员可以根据实际情况自行选择。
在操作S330,基于监控得到的与网络监控指标对应的指标监控数据,确定与每个网络层级对应的健康度评估结果。
根据本公开的实施例,针对不同的网络层级对应不同的网络监控指标,每个健康指标可以对应各自的指标监控数据。与每个网络层级对应的健康度评估结果,按照健康度从高到低的顺序依次可以包括正常状态、异常状态和故障状态。其中正常状态指的是该网络层级的整体或局部没有缺陷,或虽有缺陷但其性能仍在允许的限度以内。异常状态指的是该网络层级的缺陷已有一定程度的扩展,使该网络层级的网络监控指标发生一定程度的变化,网络性能已劣化,但仍能维持工作,此时应特别注意网络性能的发展趋势,即网络在监控下运行。故障状态指的是该网络层级的网络监控指标已经存在大幅度的下降,该网络层级无法维持正常工作,较异常状态较为严重。网络层级的故障状态,可视其严重程度分为:已有故障萌生,并有进一步发展趋势的早期故障;程度尚不严重,网络尚可勉强“带病”运行的一般功能性故障;已发展到网络不能运行且必须停机的严重故障;已导致灾难性事故的破坏性故障;由于某种原因而瞬时发生的突发性紧急故障。
在操作S340,基于与每个网络层级对应的健康度评估结果,确定待评估网络的健康度评估结果。
根据本公开的实施例,待评估网络的健康度评估结果可以包括正常状态、异常状态和故障状态。
在相关技术中,对于数据从网络传输介质进入服务器后发生的异常情况,通常是在故障发生后通过人工逐项排查日志等方式进行故障定位,时效性不佳,而通过本公开的实施例所提供的基于网络监控指标的网络健康度评估方法,将目标数据流入服务器的待评估网络后的网络传输路径按照所在的网络层级进行逐层监控,可以至少部分地解决相关技术中在服务器侧发生网络传输异常时通过人工排查日志、逐项检测等方式定位故障的不足,并因此可以实现通过对每个网络层级的网络监控指标进行监控,根据异常指标所在的网络层级可以进行异常情况的定位,还可以在定位到发生故障的网络层后结合具体情况进行故障分析的技术效果。
作为一种可选的实施例,基于监控得到的与网络监控指标对应的指标监控数据,确定与每个网络层级对应的健康度评估结果可以包括:确定与网络监控指标对应的第一阈值和第二阈值,其中,第一阈值用于表征网络监控指标处于异常状态的临界值,第二阈值用于表征网络监控指标处于故障状态的临界值;以及基于监控得到的与网络监控指标对应的指标监控数据、第一阈值和第二阈值,确定与每个网络层级对应的健康度评估结果。
根据本公开的实施例,第一阈值也称为异常阈值,第二阈值也称为故障阈值,一般情况下第一阈值通常小于第二阈值。
通过本公开的实施例,对以上层级的指标进行监控,并通过设定阈值及警戒值可以实现对服务器的网络传输健康度进行划分。阈值以外警戒值内为异常情况,超出警戒值判断为故障情况。
作为一种可选的实施例,基于监控得到的与网络监控指标对应的指标监控数据、第一阈值和第二阈值,确定与每个网络层级对应的健康度评估结果可以包括以下至少之一:在监控得到的与网络监控指标对应的指标监控数据未超过第一阈值的情况下,确定与每个网络层级对应的健康度评估结果为健康状态;在监控得到的与网络监控指标对应的指标监控数据超过第一阈值、未超过第二阈值的情况下,确定与每个网络层级对应的健康度评估结果为异常状态;在监控得到的与网络监控指标对应的指标监控数据未超过第二阈值的情况下,确定与每个网络层级对应的健康度评估结果为故障状态。
通过本公开的实施例,通过对每个网络层级所对应的网络监控指标进行监控,可以根据指标监控数据异常的网络监控指标所在的网络层级进行异常情况的定位,还可以根据指标监控数据故障的网络监控指标所在的网络层级进行异常情况的定位,并在定位到发生故障的网络层级之后结合具体情况进行故障分析。
作为一种可选的实施例,基于与每个网络层级对应的健康度评估结果,确定待评估网络的健康度评估结果可以包括以下至少之一:在与每个网络层级对应的健康度评估结果为健康状态的情况下,确定待评估网络的健康度评估结果为健康状态;在至少一个网络层级对应的健康度评估结果为异常状态的情况下,确定待评估网络的健康度评估结果为异常状态;在至少一个网络层级对应的健康度评估结果为故障状态的情况下,确定待评估网络的健康度评估结果为故障状态。
在具体实施时,在硬件层、网卡驱动层、内核协议栈层、以及套接字层均为健康状态的情况下,待评估网络为健康状态。在硬件层、网卡驱动层、内核协议栈层、以及套接字层中有一个网络层级为异常状态的情况下,待评估网络为异常状态。在硬件层、网卡驱动层、内核协议栈层、以及套接字层中有一个网络层级为故障状态的情况下,待评估网络为故障状态。
通过本公开的实施例,根据网络传输路径所包括的多个网络层级的健康度评估结果,可以确定待评估网络的健康度评估结果,还可以对出现异常的网络层级进行异常定位,对出现故障的网络层级进行故障定位。
作为一种可选的实施例,硬件层可以包括光模块,与硬件层对应的网络监控指标可以包括以下至少之一:光模块的接收光功率;光模块的发送光功率;光模块的模块温度;光模块的模块电压;光模块的偏置电流。
根据本公开的实施例,硬件层为数据帧经网络传输介质流入服务器的接收装置。可选地,硬件层可以包括光模块,光模块由光电子器件、功能电路以及光接口组成,光电子器件包括发射和接收两部分。光模块是进行光电和电光转换的光学器件,用于交换机与设备之间传输的载体,其作用是发送端将电信号转换成光信号,通过光纤传送后,接收端再将光信号转换成电信号,相比收发器更具效率性、安全性。
根据本公开的实施例,光模块的相关的监控指标包括但不限于发光功率、温度、电压。具体地网络监控指标可以包括但不限于接收/发送光功率(Laser rx/tx power)、模块温度(Module temperature)、模块电压(Module voltage)、偏置电流(Laser biascurrent)。具体实施时,可以为接收/发送光功率这一网络监控指标设置故障阈值-11.9dBm~1dBm,可以为模块温度这一网络监控指标设置故障阈值14degrees F~176degrees F,可以为模块电压这一网络监控指标设置故障阈值2.97V~3.63V,可以为偏置电流这一网络监控指标设置故障阈值1mA~20mA。
作为一种可选的实施例,网卡驱动层可以包括网卡缓存区,与网卡驱动层对应的网络监控指标可以包括以下至少之一:网卡缓存区的数据包的溢出数量;网卡缓存区的数据包的丢弃数量;网卡缓存区的数据包的错误数量。
根据本公开的实施例,网卡接收到数据后到达Ring Buffer缓存区,排队等待***内核上层处理。监控指标如overrun、dropped、error(由于缓冲区参数设置小而导致的丢包等)。指标数据正常情况下维持为0,异常情况将导致指标数据增加为非0。
在本公开中,网卡驱动层的网络监控指标可以包括传输或接受数据失败(RX/TXerror),该指标用于表征收包错误数量,包括too-long-frame\ring buffer溢出、循环冗余校验错误(crc,Cyclic Redundancy Check)、帧同步错误、fifo overrun错误。网卡驱动层的网络监控指标可以包括RX/TX dropped,该指标用于表征数据包已进入ring buffer,但内存不足等***原因导致在拷贝到内存过程中被丢弃。网卡驱动层的网络监控指标可以包括softnet stat(CPU backlog),该指标用于表征内核从NIC收到包后交由协议栈处理前缓冲队列溢出。网卡驱动层的网络监控指标可以包括rx_missed_errors,该指标用于表征DMA传送完硬中断发送之前,网卡fifo缓存满导致数据丢弃。网卡驱动层的网络监控指标可以包括fifo_error,该指标用于表征由于网卡队列设置太小溢出丢包。网卡驱动层的网络监控指标可以包括qdisc_dropped,该指标用于表征丢弃报文数。网卡驱动层的网络监控指标可以包括qdisc_overlimits,该指标用于表征超出fifo qdisc队列大小的溢出量。
作为一种可选的实施例,与内核协议栈层对应的网络监控指标可以包括以下至少之一:与传输控制协议相关的网络监控指标;与网际协议相关的网络监控指标。
作为一种可选的实施例,套接字层可以包括套接字缓存区,与套接字层对应的网络监控指标可以包括以下至少之一:套接字缓存区的数据包的溢出数量;套接字缓存区的数据包的丢弃数量;套接字缓存区的数据包的无效数量。
根据本公开的实施例,Socket Buffer可以包含半连接队列和全连接队列两个队列。数据在建立TCP连接后需排队等待***调用完成与服务端的请求连接。由于队列有长度限制,参数设置过小等情况会引发队列溢出造成丢包。监控指标如ListenOverflows(全连接队列溢出造成的丢包)。指标数据正常情况下维持为0,异常情况将导致指标数据增加为非0。与套接字层对应的网络监控指标可以是accept queue丢包(ListenDrops),可以是accept queue溢出(ListenOverflows),还可以是接收的无效syn cookies数量(SyncookiesFailed)。
通过对服务器网络传输过程进行分层监控,可根据每层出现异常数据的网络指标对服务器网络传输进行异常分析及故障定位,相较于传统方式下通过在发生故障后人工逐项排查日志等方式,可通过指标的异常情况获知当前服务器网络传输的健康状况及故障发生的可能位置,效率及排障的精准度得到极大提升。
需要说明的是,服务器侧的网络传输故障通常情况下发生在硬件层、网卡驱动层、以及套接字层,而内核协议栈层中的TCP/IP栈层发生故障概率较小,因此在具体实施时可以将该三层对应的网络监控指标作为重点监控的指标加以关注。
图4示意性示出了根据本公开实施例的网络健康度评估装置的框图。
如图4所示,该网络健康度评估装置400可以包括第一确定模块410、获取模块420、第二确定模块430、以及第三确定模块440。
第一确定模块410,用于响应于目标数据的传输请求,确定待评估网络的网络传输路径,其中,网络传输路径用于表征目标数据依次流经待评估网络的多个网络层级,多个网络层级包括硬件层、网卡驱动层、内核协议栈层、以及套接字层。可选地,第一确定模块410例如可以用于执行图3描述的操作S310,在此不再赘述。
获取模块420,用于获取与每个网络层级对应的网络监控指标,其中,网络监控指标用于作为对其所对应的网络层级进行健康度评估的评估依据。可选地,获取模块420例如可以用于执行图3描述的操作S320,在此不再赘述。
第二确定模块430,用于基于监控得到的与网络监控指标对应的指标监控数据,确定与每个网络层级对应的健康度评估结果。可选地,第二确定模块430例如可以用于执行图3描述的操作S330,在此不再赘述。
第三确定模块440,用于基于与每个网络层级对应的健康度评估结果,确定待评估网络的健康度评估结果。可选地,第三确定模块440例如可以用于执行图3描述的操作S340,在此不再赘述。
作为一种可选的实施例,第二确定模块可以包括:第一确定子模块,用于确定与网络监控指标对应的第一阈值和第二阈值,其中,第一阈值用于表征网络监控指标处于异常状态的临界值,第二阈值用于表征网络监控指标处于故障状态的临界值;以及第二确定子模块,用于基于监控得到的与网络监控指标对应的指标监控数据、第一阈值和第二阈值,确定与每个网络层级对应的健康度评估结果。
作为一种可选的实施例,第二确定子模块可以包括以下至少之一:第一确定单元,用于在监控得到的与网络监控指标对应的指标监控数据未超过第一阈值的情况下,确定与每个网络层级对应的健康度评估结果为健康状态;第二确定单元,用于在监控得到的与网络监控指标对应的指标监控数据超过第一阈值、未超过第二阈值的情况下,确定与每个网络层级对应的健康度评估结果为异常状态;第三确定单元,用于在监控得到的与网络监控指标对应的指标监控数据未超过第二阈值的情况下,确定与每个网络层级对应的健康度评估结果为故障状态。
作为一种可选的实施例,第三确定模块可以包括以下至少之一:第三确定子模块,用于在与每个网络层级对应的健康度评估结果为健康状态的情况下,确定待评估网络的健康度评估结果为健康状态;第四确定子模块,用于在至少一个网络层级对应的健康度评估结果为异常状态的情况下,确定待评估网络的健康度评估结果为异常状态;第五确定子模块,用于在至少一个网络层级对应的健康度评估结果为故障状态的情况下,确定待评估网络的健康度评估结果为故障状态。
作为一种可选的实施例,硬件层可以包括光模块,与硬件层对应的网络监控指标可以包括以下至少之一:光模块的接收光功率;光模块的发送光功率;光模块的模块温度;光模块的模块电压;光模块的偏置电流。
作为一种可选的实施例,网卡驱动层可以包括网卡缓存区,与网卡驱动层对应的网络监控指标可以包括以下至少之一:网卡缓存区的数据包的溢出数量;网卡缓存区的数据包的丢弃数量;网卡缓存区的数据包的错误数量。
作为一种可选的实施例,与内核协议栈层对应的网络监控指标可以包括以下至少之一:与传输控制协议相关的网络监控指标;与网际协议相关的网络监控指标。
作为一种可选的实施例,套接字层可以包括套接字缓存区,与套接字层对应的网络监控指标可以包括以下至少之一:套接字缓存区的数据包的溢出数量;套接字缓存区的数据包的丢弃数量;套接字缓存区的数据包的无效数量。
需要说明的是,网络健康度评估装置部分实施例中各模块的实施方式、解决的技术问题、实现的功能、以及达到的技术效果分别与网络健康度评估方法部分实施例中各对应的步骤的实施方式、解决的技术问题、实现的功能、以及达到的技术效果相同或类似,在此不再赘述。
根据本公开的实施例的模块、子模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FNGA)、可编程逻辑阵列(NLA)、片上***、基板上的***、封装上的***、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
例如,第一确定模块、获取模块、第二确定模块、第三确定模块、第一确定子模块、第二确定子模块、第一确定单元、第二确定单元、第三确定单元、第三确定子模块、第四确定子模块、以及第五确定子模块可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,第一确定模块、获取模块、第二确定模块、第三确定模块、第一确定子模块、第二确定子模块、第一确定单元、第二确定单元、第三确定单元、第三确定子模块、第四确定子模块、以及第五确定子模块中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FNGA)、可编程逻辑阵列(NLA)、片上***、基板上的***、封装上的***、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,第一确定模块、获取模块、第二确定模块、第三确定模块、第一确定子模块、第二确定子模块、第一确定单元、第二确定单元、第三确定单元、第三确定子模块、第四确定子模块、以及第五确定子模块中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
图5示意性示出了根据本公开实施例的适于实现上文描述的网络健康度评估方法的计算机可读存储介质产品的示意图。
在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在设备上运行时,程序代码用于使设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施例的网络健康度评估方法中的前述各项操作(或步骤),例如,电子设备可以执行如图3中所示的操作S310~操作S340。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、***或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(ENROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
如图5所示,描述了根据本发明的实施方式的网络健康度评估的程序产品500,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、***或者器件使用或者与其结合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行***、***或者器件使用或者与其结合使用的程序。可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、有线、光缆,RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,程序设计语言包括面向对象的程序设计语言-诸如Java,C++等,还包括常规的过程式程序设计语言-诸如“C”,语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络——包括局域网(LAA)或广域网(WAA)一连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
图6示意性示出了根据本公开实施例的适于实现上文描述的网络健康度评估方法的电子设备的框图。图6示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图6所示,根据本公开实施例的电子设备600包括处理器601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。处理器601例如可以包括通用微处理器(例如CNU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器601还可以包括用于缓存用途的板载存储器。处理器601可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 603中,存储有电子设备600操作所需的各种程序和数据。处理器601、ROM602以及RAM 603通过总线604彼此相连。处理器601通过执行ROM602和/或RAM 603中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除ROM602和RAM 603以外的一个或多个存储器中。处理器601也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例图3中所示的操作S310~操作S340。
根据本公开的实施例,电子设备600还可以包括输入/输出(I/O)接口605,输入/输出(I/O)接口605也连接至总线604。***600还可以包括连接至I/O接口605的以下部件中的一项或多项:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAA卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
根据本公开的实施例,根据本公开实施例的方法流程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被处理器601执行时,执行本公开实施例的***中限定的上述功能。根据本公开的实施例,上文描述的***、设备、装置、模块、单元等可以通过计算机程序模块来实现。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/***中所包含的;也可以是单独存在,而未装配入该设备/装置/***中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的网络健康度评估方法,包括图3中所示的操作S310~操作S340。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(ENROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的ROM 602和/或RAM 603和/或ROM 602和RAM 603以外的一个或多个存储器。
附图中的流程图和框图,图示了按照本公开各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目标,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。
Claims (7)
1.一种网络健康度评估方法,包括:
响应于目标数据的传输请求,确定待评估网络的网络传输路径,其中,所述网络传输路径用于表征所述目标数据依次流经所述待评估网络的多个网络层级,所述多个网络层级包括硬件层、网卡驱动层、内核协议栈层、以及套接字层;
获取与每个网络层级对应的网络监控指标,其中,所述网络监控指标用于作为对其所对应的网络层级进行健康度评估的评估依据;
基于监控得到的与所述网络监控指标对应的指标监控数据,确定与所述每个网络层级对应的健康度评估结果;
基于与所述每个网络层级对应的健康度评估结果,确定所述待评估网络的健康度评估结果,
其中,所述硬件层包括光模块,与所述硬件层对应的网络监控指标包括以下至少之一:
所述光模块的接收光功率;
所述光模块的发送光功率;
所述光模块的模块温度;
所述光模块的模块电压;
所述光模块的偏置电流,
其中,所述网卡驱动层包括网卡缓存区,与所述网卡驱动层对应的网络监控指标包括以下至少之一:
所述网卡缓存区的数据包的溢出数量;
所述网卡缓存区的数据包的丢弃数量;
所述网卡缓存区的数据包的错误数量,
其中,与所述内核协议栈层对应的网络监控指标包括以下至少之一:
与传输控制协议相关的网络监控指标;
与网际协议相关的网络监控指标,
其中,所述套接字层包括套接字缓存区,与所述套接字层对应的网络监控指标包括以下至少之一:
所述套接字缓存区的数据包的溢出数量;
所述套接字缓存区的数据包的丢弃数量;
所述套接字缓存区的数据包的无效数量。
2.根据权利要求1的方法,其中,所述基于监控得到的与所述网络监控指标对应的指标监控数据,确定与所述每个网络层级对应的健康度评估结果包括:
确定与所述网络监控指标对应的第一阈值和第二阈值,其中,所述第一阈值用于表征所述网络监控指标处于异常状态的临界值,所述第二阈值用于表征所述网络监控指标处于故障状态的临界值;
基于监控得到的与所述网络监控指标对应的指标监控数据、所述第一阈值和所述第二阈值,确定与所述每个网络层级对应的健康度评估结果。
3.根据权利要求2所述的方法,其中,所述基于监控得到的与所述网络监控指标对应的指标监控数据、所述第一阈值和所述第二阈值,确定与所述每个网络层级对应的健康度评估结果包括以下至少之一:
在所述监控得到的与所述网络监控指标对应的指标监控数据未超过所述第一阈值的情况下,确定与所述每个网络层级对应的健康度评估结果为健康状态;
在所述监控得到的与所述网络监控指标对应的指标监控数据超过所述第一阈值、未超过所述第二阈值的情况下,确定与所述每个网络层级对应的健康度评估结果为异常状态;
在所述监控得到的与所述网络监控指标对应的指标监控数据未超过所述第二阈值的情况下,确定与所述每个网络层级对应的健康度评估结果为故障状态。
4.根据权利要求3的方法,其中,所述基于与所述每个网络层级对应的健康度评估结果,确定所述待评估网络的健康度评估结果包括以下至少之一:
在与所述每个网络层级对应的健康度评估结果为健康状态的情况下,确定所述待评估网络的健康度评估结果为健康状态;
在至少一个网络层级对应的健康度评估结果为异常状态的情况下,确定所述待评估网络的健康度评估结果为异常状态;
在至少一个网络层级对应的健康度评估结果为故障状态的情况下,确定所述待评估网络的健康度评估结果为故障状态。
5.一种网络健康度评估装置,包括:
第一确定模块,用于响应于目标数据的传输请求,确定待评估网络的网络传输路径,其中,所述网络传输路径用于表征所述目标数据依次流经所述待评估网络的多个网络层级,所述多个网络层级包括硬件层、网卡驱动层、内核协议栈层、以及套接字层;
获取模块,用于获取与每个网络层级对应的网络监控指标,其中,所述网络监控指标用于作为对其所对应的网络层级进行健康度评估的评估依据;
第二确定模块,用于基于监控得到的与所述网络监控指标对应的指标监控数据,确定与所述每个网络层级对应的健康度评估结果;
第三确定模块,用于基于与所述每个网络层级对应的健康度评估结果,确定所述待评估网络的健康度评估结果,
其中,所述硬件层包括光模块,与所述硬件层对应的网络监控指标包括以下至少之一:
所述光模块的接收光功率;
所述光模块的发送光功率;
所述光模块的模块温度;
所述光模块的模块电压;
所述光模块的偏置电流,
其中,所述网卡驱动层包括网卡缓存区,与所述网卡驱动层对应的网络监控指标包括以下至少之一:
所述网卡缓存区的数据包的溢出数量;
所述网卡缓存区的数据包的丢弃数量;
所述网卡缓存区的数据包的错误数量,
其中,与所述内核协议栈层对应的网络监控指标包括以下至少之一:
与传输控制协议相关的网络监控指标;
与网际协议相关的网络监控指标,
其中,所述套接字层包括套接字缓存区,与所述套接字层对应的网络监控指标包括以下至少之一:
所述套接字缓存区的数据包的溢出数量;
所述套接字缓存区的数据包的丢弃数量;
所述套接字缓存区的数据包的无效数量。
6.一种电子设备,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行根据权利要求1至4中任一项所述的方法。
7.一种计算机可读存储介质,存储有计算机可执行指令,所述指令在被执行时使处理器执行根据权利要求1至4中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110587864.8A CN113328885B (zh) | 2021-05-27 | 2021-05-27 | 网络健康度评估方法、装置、电子设备、介质和程序产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110587864.8A CN113328885B (zh) | 2021-05-27 | 2021-05-27 | 网络健康度评估方法、装置、电子设备、介质和程序产品 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113328885A CN113328885A (zh) | 2021-08-31 |
CN113328885B true CN113328885B (zh) | 2022-09-27 |
Family
ID=77421873
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110587864.8A Active CN113328885B (zh) | 2021-05-27 | 2021-05-27 | 网络健康度评估方法、装置、电子设备、介质和程序产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113328885B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115834437A (zh) * | 2021-09-15 | 2023-03-21 | ***通信集团山东有限公司 | 一种网络异常的评估方法、装置、电子设备及存储介质 |
CN114900421A (zh) * | 2022-04-08 | 2022-08-12 | 深圳绿米联创科技有限公司 | 故障检测方法、装置、电子设备及可读存储介质 |
CN116248545B (zh) * | 2022-12-28 | 2024-05-14 | 中国电信股份有限公司 | 网络传输链路的故障分析方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106776214A (zh) * | 2016-12-12 | 2017-05-31 | 广州市申迪计算机***有限公司 | 一种服务器健康度评估方法 |
CN109246495A (zh) * | 2018-11-19 | 2019-01-18 | 国网河南省电力公司 | 一种面向多层次、多指标的光网络业务质量评估方法 |
CN112187575A (zh) * | 2020-09-25 | 2021-01-05 | 杭州迪普科技股份有限公司 | 一种服务器健康状态的监测方法和装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7689702B1 (en) * | 2003-10-31 | 2010-03-30 | Sun Microsystems, Inc. | Methods and apparatus for coordinating processing of network connections between two network protocol stacks |
CN102035667B (zh) * | 2009-09-27 | 2012-08-29 | 华为技术有限公司 | 网络可靠性评估方法、装置和*** |
CN102904780B (zh) * | 2012-10-29 | 2015-12-16 | 山石网科通信技术有限公司 | 检测网络健康度的方法及装置 |
CN110890972B (zh) * | 2018-09-07 | 2022-06-28 | ***通信集团浙江有限公司 | 一种业务***的健康度评估方法及装置 |
-
2021
- 2021-05-27 CN CN202110587864.8A patent/CN113328885B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106776214A (zh) * | 2016-12-12 | 2017-05-31 | 广州市申迪计算机***有限公司 | 一种服务器健康度评估方法 |
CN109246495A (zh) * | 2018-11-19 | 2019-01-18 | 国网河南省电力公司 | 一种面向多层次、多指标的光网络业务质量评估方法 |
CN112187575A (zh) * | 2020-09-25 | 2021-01-05 | 杭州迪普科技股份有限公司 | 一种服务器健康状态的监测方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN113328885A (zh) | 2021-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113328885B (zh) | 网络健康度评估方法、装置、电子设备、介质和程序产品 | |
US10284444B2 (en) | Visual representation of end user response time in a multi-tiered network application | |
CN107426022B (zh) | 安全事件监测方法及装置、电子设备、存储介质 | |
US20220050902A1 (en) | Opentelemetry security extensions | |
US10289522B2 (en) | Autonomous information technology diagnostic checks | |
CN111884866B (zh) | 网络优化方法、网络优化***、计算机***和存储介质 | |
CN111600759B (zh) | 拓扑结构中死锁故障的定位方法和装置 | |
CN110620688A (zh) | 一种业务综合监控方法、***及装置 | |
CN110896362B (zh) | 一种故障检测方法和装置 | |
US11271798B2 (en) | Automated network link repair | |
CN110928940B (zh) | 基于kafka集群的数据写入方法、装置、电子设备、存储介质 | |
CN110875832B (zh) | 异常业务监控方法、装置、***及计算机可读存储介质 | |
WO2019241199A1 (en) | System and method for predictive maintenance of networked devices | |
CN115202973A (zh) | 应用运行状态的确定方法、装置、电子设备和介质 | |
CN114710400B (zh) | 故障设备定位方法、装置、电子设备和介质 | |
US20200267054A1 (en) | Determining the importance of network devices based on discovered topology, managed endpoints, and activity | |
CN112953783A (zh) | 卫星链路状态检测方法、装置、服务器及存储介质 | |
CN110852537A (zh) | 服务质量检测方法和装置 | |
CN115525362B (zh) | 基于操作***内核参数调整平台的参数变更方法和装置 | |
CN115344330A (zh) | 数据传输方法及装置、应用处理方法及装置、电子设备 | |
US20230049252A1 (en) | Method for network transmission, device, and storage medium | |
CN117992264A (zh) | 宿主机故障修复方法及装置、***、电子设备和存储介质 | |
CN117424818A (zh) | 一种can配置的检测方法、装置、设备及介质 | |
CN115190008A (zh) | 故障处理方法、故障处理装置、电子设备及存储介质 | |
CN116136818A (zh) | 用于消息队列的健康巡检方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |