CN107566036A - 自动检测通信中的错误并且自动确定该错误的源 - Google Patents

自动检测通信中的错误并且自动确定该错误的源 Download PDF

Info

Publication number
CN107566036A
CN107566036A CN201610900611.0A CN201610900611A CN107566036A CN 107566036 A CN107566036 A CN 107566036A CN 201610900611 A CN201610900611 A CN 201610900611A CN 107566036 A CN107566036 A CN 107566036A
Authority
CN
China
Prior art keywords
equipment
wrong
network equipment
mistake
source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610900611.0A
Other languages
English (en)
Other versions
CN107566036B (zh
Inventor
A·博赫拉
R·Y·库尔卡尼
K·A·安萨里
K·拉加玛尼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Juniper Networks Inc
Peribit Networks Inc
Original Assignee
Peribit Networks Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peribit Networks Inc filed Critical Peribit Networks Inc
Publication of CN107566036A publication Critical patent/CN107566036A/zh
Application granted granted Critical
Publication of CN107566036B publication Critical patent/CN107566036B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B10/00Transmission systems employing electromagnetic waves other than radio-waves, e.g. infrared, visible or ultraviolet light, or employing corpuscular radiation, e.g. quantum communication
    • H04B10/07Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems
    • H04B10/075Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems using an in-service signal
    • H04B10/077Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems using an in-service signal using a supervisory or additional signal
    • H04B10/0773Network aspects, e.g. central monitoring of transmission parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/0645Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis by additionally acting on or stimulating the network after receiving notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0823Errors, e.g. transmission errors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/16Threshold monitoring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/50Testing arrangements
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S40/00Systems for electrical power generation, transmission, distribution or end-user application management characterised by the use of communication or information technologies, or communication or information technology specific aspects supporting them

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Physics & Mathematics (AREA)
  • Electromagnetism (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明的实施方式涉及自动检测通信中的错误并且自动确定该错误的源。一种设备可以针对与网络设备之间的通信相关联的错误而监视该通信。该设备可以检测与网络设备之间的通信相关联的错误。该设备可以执行错误度量与阈值错误度量的比较。该错误度量可以与该错误相关联。该设备可以确定该比较是否指示该错误度量满足该阈值错误度量。该设备可以基于确定该比较是否指示该错误度量满足该阈值错误度量而使用环回测试来标识该错误的源。该设备可以基于标识该错误的源而提供错误源信息。该错误源信息可以标识该错误的源。

Description

自动检测通信中的错误并且自动确定该错误的源
背景技术
环回测试可以包括将电子信号、数字数据流或项目流程路由回该电子信号的源。在一些情况下,该电子信号可以在不进行有意处理或修改的情况下被路由。环回测试可以被用来测试传输或输送基础设施。当使用环回测试来测试连接问题时,设备可以在端口上发送具体数据模式并且可以检测在与用来发送该具体数据模式的端口相同的端口上对该具体数据模式的接收。
发明内容
根据一些可能的实现,一种设备可以包括一个或多个处理器以针对与网络设备之间的通信相关联的错误而监视该通信。该一个或多个处理器可以检测与网络设备之间的通信相关联的错误。该一个或多个处理器可以执行错误度量与阈值错误度量的比较。该错误度量可以与该错误相关联。该一个或多个处理器可以确定该比较是否指示该错误度量满足该阈值错误度量。该一个或多个处理器可以基于确定该比较是否指示该错误度量满足该阈值错误度量而使用环回测试来标识该错误的源。该一个或多个处理器可以基于标识该错误的源而提供错误源信息。该错误源信息可以标识该错误的源。
根据一些可能的实现,一种非瞬态计算机可读介质可以存储一个或多个指令,当被一个或多个处理器所执行时,该一个或多个指令使得该一个或多个处理器针对错误而监视多个设备之间的通信。该错误可以与该多个设备的一个或多个网络接口控制器(NIC)、该多个设备的一个或多个收发器组件或者该多个设备之间的一个或多个传输线路中的至少一个相关联。该一个或多个指令可以使得该一个或多个处理器检测与该多个设备之间的通信相关联的错误。该一个或多个指令可以使得该一个或多个处理器确定错误度量是否满足阈值错误度量。该一个或多个指令可以使得该一个或多个处理器使用环回测试基于确定该错误度量是否满足该阈值错误度量来标识该错误的源。该环回测试可以被应用于该一个或多个NIC或该一个或多个收发器组件。该一个或多个指令可以使得该一个或多个处理器基于标识该错误的源而提供错误源信息。
根据一些可能的实现,一种方法可以包括由第一设备监视该第一设备和第二设备之间的通信。该方法可以包括由该第一设备检测与该第一设备和第二设备之间的通信相关联的错误。该错误可以由该第一设备、该第二设备或者该第一设备和第二设备用来进行通信的传输线路所导致。该方法可以包括由该第一设备执行错误度量和阈值错误度量的比较。该错误度量可以根据该错误来确定。该方法可以包括由该第一设备确定该比较的结果指示该错误度量满足该阈值错误度量。该方法可以包括由该第一设备使用环回测试、基于确定该错误度量满足该阈值错误度量来标识该错误的源。该方法可以包括由该第一设备基于标识该错误的源而执行动作。该动作可以与该错误的源相关联。
本发明的实施方式涉及一种设备,包括:一个或多个处理器,用于:针对与网络设备之间的通信相关联的错误而监视所述通信;检测与所述网络设备之间的所述通信相关联的所述错误;执行错误度量与阈值错误度量的比较,所述错误度量与所述错误相关联;确定所述比较是否指示所述错误度量满足所述阈值错误度量;基于确定所述比较是否指示所述错误度量满足所述阈值错误度量而使用环回测试来标识所述错误的源;以及基于标识所述错误的所述源而提供错误源信息,所述错误源信息标识所述错误的所述源。
根据本发明的进一步实施方式,其中所述一个或多个处理器进一步用于:对所述网络设备中的第一网络设备应用第一环回测试,或者对所述网络设备中的第二网络设备应用第二环回测试;以及确定所述第一环回测试或所述第二环回测试是否包括所述错误;并且其中在标识所述错误的所述源时所述一个或多个处理器用于:基于确定所述第一环回测试或所述第二环回测试包括所述错误而标识所述错误的所述源。
根据本发明的进一步实施方式,其中在对所述第一网络设备应用所述第一环回测试时所述一个或多个处理器用于:对所述第一网络设备的收发器组件应用所述第一环回测试,或者对所述第一网络设备的网络接口控制器(NIC)应用所述第一环回测试。
根据本发明的进一步实施方式,其中在对所述第二网络设备应用所述第二环回测试时所述一个或多个处理器用于:对所述第二网络设备的收发器组件应用所述第二环回测试,或者对所述第二网络设备的网络接口控制器(NIC)应用所述第二环回测试。
根据本发明的进一步实施方式,其中在标识所述错误的所述源时所述一个或多个处理器用于:确定所述错误度量满足所述阈值错误度量;以及基于确定所述错误度量满足所述阈值错误度量而标识所述错误的所述源。
根据本发明的进一步实施方式,其中所述环回测试是与确定所述错误的所述源是否为以下之一相关联的本地环回测试:本地网络接口控制器(NIC),或本地收发器组件。
根据本发明的进一步实施方式,其中该环回测试是与确定所述错误的所述源是否为以下之一相关联的远程环回测试:远程网络接口控制器(NIC),或远程收发器组件。
本发明的实施方式还涉及一种存储指令的非瞬态计算机可读介质,所述指令包括:一个或多个指令,所述一个或多个指令当被一个或多个处理器执行时使得所述一个或多个处理器:针对与以下至少一个相关联的错误而监视多个设备之间的通信:所述多个设备的一个或多个网络接口控制器(NIC),所述多个设备的一个或多个收发器组件,或所述多个设备之间的一个或多个传输线路;检测与所述多个设备之间的所述通信相关联的所述错误;确定错误度量是否满足阈值错误度量;基于确定所述错误度量是否满足所述阈值错误度量而使用环回测试来标识所述错误的源,所述环回测试被应用于所述一个或多个NIC或所述一个或多个收发器组件;以及基于标识所述错误的所述源而提供错误源信息。
根据本发明的进一步实施方式,其中使得所述一个或多个处理器标识所述错误的所述源的所述一个或多个指令使得所述一个或多个处理器:对本地NIC应用第一本地环回测试;对本地收发器组件应用第二本地环回测试;与应用所述第一本地环回测试相关联或与应用所述第二本地环回测试相关联地检测所述错误;以及基于检测所述错误而标识所述错误的所述源。
根据本发明的进一步实施方式,其中使得所述一个或多个处理器标识所述错误的所述源的一个或多个指令使得所述一个或多个处理器:对远程NIC应用第一远程环回测试;对远程收发器组件应用第二远程环回测试;与应用所述第一远程环回测试相关联或与应用所述第二远程环回测试相关联地检测所述错误;以及基于检测所述错误而标识所述错误的所述源。
根据本发明的进一步实施方式,其中使得所述一个或多个处理器标识所述错误的所述源的所述一个或多个指令使得所述一个或多个处理器:使用所述环回测试检测所述一个或多个传输线路中的传输线路上的所述错误;与使用所述环回测试检测所述传输线路上的所述错误相关联地检测所述错误;以及基于检测所述错误而标识所述错误的所述源。
根据本发明的进一步实施方式,其中使得所述一个或多个处理器确定所述错误度量是否满足所述阈值错误度量的所述一个或多个指令使得所述一个或多个处理器:执行所述错误度量和所述阈值错误度量的比较;以及基于执行所述比较而确定所述错误度量是否满足所述阈值错误度量。
根据本发明的进一步实施方式,其中使得所述一个或多个处理器标识所述错误的所述源的所述一个或多个指令使得所述一个或多个处理器:对所述多个设备中的设备应用所述环回测试;基于应用所述环回测试而未能检测所述错误;作为所述错误的所述源而消除所述设备;以及基于作为所述错误的所述源而消除所述设备来标识所述错误的所述源。
根据本发明的进一步实施方式,其中所述错误度量是:由所述多个设备中的第一设备所计算的错误度量,或者由第一设备从第二设备接收的错误度量。
本发明的实施方式还涉及一种方法,包括:由第一设备监视所述第一设备和第二设备之间的通信;由所述第一设备检测与所述第一设备和所述第二设备之间的所述通信相关联的错误,所述错误由所述第一设备、所述第二设备或者所述第一设备和所述第二设备用来进行通信的传输线路所导致;由所述第一设备执行错误度量和阈值错误度量的比较,所述错误度量根据所述错误而被确定;由所述第一设备确定所述比较结果指示所述错误度量满足所述阈值错误度量;由所述第一设备基于确定所述错误度量满足所述阈值错误度量而使用环回测试来标识所述错误的源;以及由所述第一设备基于标识所述错误的所述源而执行动作,所述动作与所述错误的所述源相关联。
根据本发明的进一步实施方式,其中标识所述错误的所述源包括:标识多个通信组件中导致所述错误的通信组件,所述多个通信组件包括:所述第一设备的第一网络接口控制器(NIC);所述第一设备的第一收发器组件;所述第二设备的第二NIC;所述第二设备的第二收发器组件;或所述传输线路;以及基于标识导致该错误的通信组件而标识该错误的源。
根据本发明的进一步实施方式,其中标识正导致所述错误的所述通信组件包括:对所述多个通信组件应用所述环回测试;确定所述环回测试是否导致已经经历了所述错误的信号;以及基于确定所述环回测试是否导致已经经历了所述错误的所述信号而标识所述多个通信组件中导致所述错误的所述通信组件。
根据本发明的进一步实施方式,其中标识所述错误的所述源包括:对所述第一设备的多个通信组件应用本地环回测试;以及基于对所述第一设备的所述多个通信组件应用所述本地环回测试而标识所述错误的所述源。
根据本发明的进一步实施方式,其中标识所述错误的所述源包括:对所述第二设备的多个通信组件应用远程环回测试;以及基于对所述第二设备的所述多个通信组件应用所述远程环回测试而标识所述错误的所述源。
根据本发明的进一步实施方式,其中标识所述错误的所述源包括:对所述第一设备或所述第二设备应用所述环回测试;针对以下中的二者而确定所述环回测试未能导致已经经历了所述错误的信号:所述第一设备,所述第二设备,或所述传输线路;并且基于确定所述环回测试未能导致已经经历了所述错误的所述信号而标识所述错误的所述源。
附图说明
图1A-图1D是这里所描述的示例实现的概况的示图;
图2是这里所描述的***和/或方法可以在其中实现的示例环境的示图;
图3是图2的一个或多个设备的示例组件的示图;并且
图4是用于自动检测通信中的错误并且自动确定错误的源的示例过程的流程图。
具体实施方式
以下对示例实现的详细描述参考附图。不同附图中的相同附图标记可以标识相同或相似的要素。
网络设备可以使用一个或多个通信组件进行通信,一个或多个通信组件诸如网络设备的网络接口卡(NIC)、网络设备的收发器组件和/或连接网络设备的传输线路。该通信组件可能随时间而退化,这在网络设备之间的通信中导致错误。
为了标识通信组件中的哪些通信组件正在导致错误,网络管理员可能必须对每个通信组件进行手工测试。例如,网络管理员可以每次手工更换一个通信组件直至消除了错误,这可能是劳动密集的和/或低效的。作为另一个示例,网络管理员可以对通信组件手工应用环回测试(例如,通过手写诸如可执行代码之类的多行程序代码以应用环回测试)。手工应用环回测试可能要求哪些类型的环回测试应用于通信组件的技术知识以及手写应用环回测试的程序代码行的技术技能。
可替换地,网络管理员可以使用链路监视来自动检测通信链路上(例如,通信链路的物理编码子层(PCS)上)的错误并且停用(take down)整个通信链路。尽管使得网络管理员能够标识出正经历错误的通信链路,但是该技术仍然要求网络管理员的手工工作来标识出哪些通信组件正在导致该错误。
这里所描述的实现支持自动检测与网络设备之间的通信相关联的错误,并且支持自动标识导致该错误的特定通信组件。这支持更快且更为准确地标识错误的源(例如,相对于用于标识源的手工测试),由此减少了网络停用时间。此外,错误源的自动标识节省了网络设备中原本被用来尝试执行非可执行程序或错误写入的手写程序代码和/或在手工测试期间执行重复或多余手写代码的硬件资源。另外,这减少或消除了对网络管理员进行手工测试来标识错误源的需求,由此提高了标识错误源的效率。
图1A-图1D是这里所描述的示例实现100的概况的图。如图1A所示,网络设备ND1和网络设备ND2可以经由光纤线缆进行连接并通信。如附图标记105所示,网络设备ND1可以针对错误而监视网络设备ND1和网络设备ND2之间的通信。例如,网络设备ND1可以针对比特错误、路线/链路摆动(link flapping)、信号损失错误和/或帧校验序列(FCS)错误而监视通信。如附图标记110所示,针对图1A-图1D假设光纤线缆正在经历比特错误。如附图标记115所示,假设网络设备ND2经历路线/链路摆动。
如图1B中以及附图标记120所示,网络设备ND1可以检测到该错误并且确定与该错误相关联的错误度量是否满足阈值。例如,网络设备ND1可以检测到与光纤线缆相关联的比特错误,并且确定与该比特错误相关联的比特错误率是否满足阈值比特错误率。作为另一个示例,网络设备ND1可以检测到与网络设备ND2相关联的路线/链路摆动,并且确定路线/链路摆动率是否满足阈值线路/链路摆动率。
针对图1B-图1D假设由网络设备ND1所检测到的与比特错误和路线/链路摆动相关联的错误度量均满足阈值。如附图标记125所示,网络设备ND1可以使用环回测试来标识错误的源。例如,网络设备ND1可以对网络设备ND1应用本地环回测试来确定网络设备ND1的光学收发器组件和/或NIC是否是错误的源。作为另一个示例,网络设备ND1可以对网络设备ND2应用远程环回测试来确定网络设备ND2的NIC和/或光学收发器组件是否是错误的源。
如图1C中以及附图标记130所示,网络设备ND1可以使用一组规则来基于向光学收发器组件和/或NIC应用环回测试来确定错误的源(或者错误的可能源)。如附图标记135所示,网络设备ND1可以对网络设备ND1的光学收发器组件和/或网络设备ND1的NIC应用本地环回测试以确定错误的源。
例如,网络设备ND1可以在位置L1处应用本地环回测试而使得传送(Tx)方向中的信号在经由光纤线缆输送之前在接收(Rx)方向被返回(例如,如与位置L1相关联的虚线箭头所指示的)。在这种情况下,如果该信号未损坏地被返回或者带有并不满足阈值的错误地被返回(例如,如附图标记130所示的“通过”),则网络设备ND1可以将该光纤线缆标识为错误的源。相反地,如果该信号被损坏而返回或者带有满足阈值的错误被返回(例如,如附图标记130所示的“失败”),则网络设备ND1可以将网络设备ND1的光学收发器组件或网络设备ND1的NIC标识为错误的可能源,并且可以在位置L2应用本地环回测试来确定该光学收发器组件和/或NIC是否是该错误的源。
作为另一个示例,网络设备ND1可以在位置L2应用本地环回测试而使得Tx方向的信号在经由光学收发器组件的物理编码子层(PCS)/物理介质附属(PMA)输送之前在Rx方向被返回(例如,如与位置L2相关联的虚线箭头所指示的)。在这种情况下,如果该信号未损坏地被返回或者带有并不满足阈值的错误而被返回(例如,如附图标记130所示的“通过”),则网络设备ND1可以将该光学收发器组件标识为错误的源。相反地,如果该信号被损坏而返回或者带有满足阈值的错误被返回(例如,如附图标记130所示的“失败”),则网络设备ND1可以将网络设备ND1的NIC标识为错误的可能源,并且可以在位置L3应用本地环回测试来确定该NIC是否是该错误的源。
网络设备ND1可以以类似于关于位置L1和L2所描述的方式在位置L3和L4对网络设备ND1的NIC应用本地环回测试以确定该错误的源。例如,网络设备ND1可以对位置L3应用本地环回测试来确定已经经由该NIC而并未经由该光学收发器组件所输送的信号被损坏还是未被损坏。作为另一个示例,网络设备ND1可以对位置L4应用本地环回测试以确定并未经由该NIC所输送的信号被损坏还是未被损坏。网络设备ND1可以以类似于以上关于应用于网络设备ND1的本地环回测试所描述的方式对网络设备ND2的光学收发器组件和/或NIC应用远程环回测试,以确定网络设备ND2的光学收发器组件和/或NIC是否是错误的源。
例如,假设网络设备ND1基于应用一个或多个环回测试而将光纤线缆标识为比特错误的源。例如,进一步假设网络设备ND1基于应用一个或多个环回测试而将网络设备ND2的NIC标识为路线/链路摆动的源。例如,进一步假设网络设备ND1基于应用一个或多个环回测试而确定网络设备ND1和ND2的光学收发器组件并不是错误的源。
如图1D并且由附图标记140所示,网络设备ND1可以向客户端设备提供错误源信息。例如,网络设备ND1可以提供将网络设备ND2的NIC标识为路线/链路摆动的源并且将光纤线缆标识为比特错误的错误源信息。如附图标记145所示,客户端设备可以提供该错误源信息以便进行显示(例如,经由该客户端设备的显示器)。例如,如附图标记150所示,该客户端设备的显示器可以显示比特错误出现在该光纤线缆上并且路线/链路摆动出现在网络设备ND2的NIC上的错误源信息。
以这种方式,网络设备可以自动检测与多个网络设备之间的通信相关联的错误,并且可以自动标识该错误的源。这支持更快地标识错误的源(例如,相对于手工标识错误的源)并且更快地纠正错误,由此减少网络停用时间。此外,自动标识错误的源节省了网络设备中原本被用来在手工测试期间尝试执行非可执行程序或错误手写的程序代码的处理器资源。另外,这减少或消除了网络管理员用来标识错误源的手工工作,由此提高了标识错误源的效率。
如以上所指出的,图1A-图1D仅作为示例而被提供。其它示例是可能的并且可以与关于图1A-图1D所描述的有所不同。
图2是这里所描述的***和/或方法可以在其中实施的示例环境200的示图。如图2所示,环境200可以包括一个或多个网络设备210-1至210-N(N≥1)(这里被统称为“网络设备210”并且被单独地称作“网络设备210”)、客户端设备220和网络230。环境200中的设备可以经由有线连接、无线连接或者有线和无线连接的组合进行互连。
网络设备210包括一个或多个能够接收、存储、生成和/或处理信息的设备,上述信息诸如与检测通信中的错误相关联的信息。例如,网络设备210可以包括路由器、交换机、网关、集线器、桥接器、逆向代理、服务器(例如,代理服务器、web服务器、主机服务器、存储服务器,或者数据中心或云计算环境中的服务器)、防火墙、安全设备、入侵检测设备、负载平衡器或类似设备。在一些实现中,如这里其它地方更为详细描述的,网络设备210可以监视两个网络设备210之间的通信以自动检测与该通信相关联的错误。除此之外或可替换地,如以下更为详细描述的,网络设备210可以自动标识错误的源。
客户端设备220包括一个或多个能够接收、生成、存储、处理和/或提供与通信中的错误相关联的信息的设备。例如,客户端设备220可以包括通信和/或计算设备,诸如台式计算机、膝上计算机、平板计算机、服务器、移动电话(例如,智能电话或无线电话)、可佩戴通信设备(例如,智能手表或智能眼镜),或者类似类型的设备。在一些实现中,如这里其它地方详细描述的,客户端设备220可以接收标识错误源的信息。除此之外或可替换地,如这里其它地方详细描述的,客户端设备220可以提供该信息以便进行显示(例如,经由客户端设备220的显示器)。
网络230可以包括一个或多个有线和/或无线网络。例如,网络230可以包括蜂窝网络(长期演进(LTE)网络、3G网络、码分多址(CDMA)网络等)、公众陆地移动网络(PLMN)、局域网(LAN)、广域网(WAN)、城域网(MAN)、电话网络(例如,公共交换电话网络(PSTN))、私人网络、自组网络、内联网、互联网、基于光纤的网络、云计算网络等,和/或这些或其它类型的网络的组合。
图2所示的设备和网络的数量和布置是作为示例而提供。实际上,可能存在另外的设备和/或网络,更少的设备和/或网络,不同的设备和/或网络,或者以不同于图2所示的那些的方式进行布置的设备和/或网络。此外,图2所示的两个或更多设备可以在单个设备内实现,或者图2所示的单个设备可以被实施为多个分布式的设备。除此之外或可替换地,环境200的设备集合(例如,一个或多个设备)可以执行被描述为由环境200的另一个设备集合所执行的一种或多种功能。
图3是设备300的示例组件的示图。设备300可以对应于网络设备210和/或客户端设备220。在一些实现中,网络设备210和/或客户端设备220可以包括一个或多个设备300和/或设备300的一个或多个组件。如图3所示,设备300可以包括一个或多个输入组件305-1至305-B(B≥1)(此后统称为输入组件305并且被单独称作输入组件305)、交换组件310、一个或多个输出组件315-1至305-C(C≥1)(此后统称为输出组件315并且被单独称作输出组件315)和控制器320。
输入组件305可以是物理链路的附接点并且可以是诸如分组的传入业务的进入点。输入组件305诸如可以通过执行数据链路层封装或拆封而处理传入业务。在一些实现中,输入组件305可以发送和/或接收分组。在一些实现中,输入组件305可以包括输入线路卡,该输入线路卡包括(例如,处于集成电路的形式的)一个或多个分组处理组件,诸如一个或多个接口卡(IFC),分组转发组件、线路卡控制器组件、输入端口、处理器、存储器和/或输入队列。在一些实现中,设备300可以包括一个或多个输入组件305。
交换组件310可以将输入组件305与输出组件315进行互连。在一些实现中,交换组件310可以经由一个或多个交叉开关、经由总线和/或利用共享存储器来实施。共享存储器可以用作临时缓冲器以在分组最终被调度以便传递至输出组件315之前存储来自输入组件305的分组。在一些实现中,交换组件310可以使得输入组件305、输出组件315和/或控制器320能够进行通信。
输出组件315可以存储分组并且可以对分组进行调度以便在输出物理链路上进行传输。输出组件315可以支持数据链路层封装或拆封,和/或多种更高级协议。在一些实现中,输出组件315可以发送分组和/或接收分组。在一些实现中,输出组件315可以包括输出线路卡,该输出线路卡包括(例如,处于集成电路的形式的)一个或多个分组处理组件,诸如一个或多个IFC、分组转发组件、线路卡控制器组件、输出端口、处理器、存储器和/或输出队列。在一些实现中,设备300可以包括一个或多个输出组件315。在一些实现中,输入组件305和输出组件315可以由相同组件集合来实现(例如,并且输入/输出组件可以是输入组件305和输出组件315的组合)。
控制器320以硬件、固件或者硬件和软件的组合来实现。控制器320包括处理器,其形式例如为中央处理单元(CPU)、图形处理单元(GPU)、加速处理单元(APU)、微处理器、微控制器、现场可编程门阵列(FPGA)、专用集成电路(ASIC),和/或能够解释和/或执行指令的另一种类型的处理器。在一些实现中,控制器320可以包括能够被编程为执行功能的一个或多个处理器。
在一些实现中,控制器320可以包括随机访问存储器(RAM)、只读存储器(ROM),和/或存储供控制器320使用的信息和/或指令的另一种类型的动态或静态存储设备(例如,闪存、磁性存储器、光学存储器等)。
在一些实现中,控制器320可以与连接至设备300的其它设备、网络和/或***进行通信从而交换有关网络拓扑的信息。控制器320可以基于该网络拓扑信息创建路由表,可以基于该路由表创建转发表,并且可以将该转发表转发至输入组件305和/或输出组件315。输入组件305和/或输出组件315可以使用该转发表针对传入和/或传出的分组执行路线查找。
控制器320可以执行这里所描述的一种或多种过程。控制器320可以响应于执行非瞬态计算机可读介质所存储的软件指令来执行这些过程。计算机可读介质在这里被定义为非瞬态存储器设备。存储器设备包括单个物理存储设备内的存储器空间或者跨多个物理存储设备分布的存储器空间。
软件指令可以经由通信接口从另一个计算机可读介质或者从另一个设备被读入与控制器320相关联的存储器和/或存储组件。在被执行时,被存储在与控制器320相关联的存储器和/或存储组件中的软件指令可以使得控制器320执行这里所描述的一个或多个过程。除此之外或可替换地,可以替代或接合软件指令使用硬线电路来执行这里所描述的一个或多个处理。因此,这里所描述的实施方式并不局限于硬件电路和软件的任何具体组合。
图3所示的设备和网络的数量和布置是作为示例而提供。实际上,设备300可以包括另外的组件、更少的组件、不同的组件,或者以不同于图3所示的那些的方式进行布置的组件。除此之外或可替换地,设备300的组件集合(例如,一个或多个组件)可以执行被描述为由设备300的另一个组件集合所执行的一种或多种功能。
图4是用于自动检测通信中的错误并且自动检测错误的源的示例过程400的流程图。在一些实现中,图4中的一个或多个处理框可以由网络设备210执行。在一些实现中,图4的一个或多个处理框可以由另一个设备或者与网络设备210分离或包括网络设备210的设备群组—诸如客户端设备220—来执行。
如图4所示,过程400可以包括针对与通信相关联的错误监视网络设备之间的通信(框410)并且检测与网络设备之间的通信相关联的错误(框420)。例如,第一网络设备210和第二网络设备229可以经由传输线路(例如,光纤线缆或同轴线缆)进行通信。在一些实现中,第一网络设备210可以监视第一和第二网络设备210之间的通信。在一些实现中,第二网络设备210可以监视第一和第二网络设备210之间的通信。在一些实现中,第一网络设备210和第二网络设备210二者可以监视第一和第二网络设备210之间的通信。
在一些实现中,网络设备210可以监视网络设备210和另一个网络设备210之间的通信。例如,第一网络设备210可以监视第一网络设备210和第二网络设备210之间的通信。除此之外或可替换地,网络设备210可以监视两个其它网络设备210之间的通信。例如,第一网络设备210可以监视第二网络设备210和第三网络设备210之间的通信。
在一些实现中,网络设备210可以在网络设备210开机或启动时监视通信。除此之外或可替换地,网络设备210可以基于客户端设备220的用户所进行的输入来监视通信。除此之外或可替换地,网络设备210可以基于从另一个设备(例如,另一个网络设备210、网络管理网络等)所接收的指令来监视通信。除此之外或可替换地,网络设备210可以基于调度(例如,每天从5AM至12AM;每小时15分钟;每隔30秒钟;等等)来监视通信。
在一些实现中,网络设备210可以监视通信以检测与网络设备210之间的通信相关联的错误。例如,网络设备210可以监视通信以检测比特错误、路线/链路摆动、信号错误损失、帧校验序列(FCS)错误或者另一种类型的通信错误。
在一些实现中,网络设备210可以基于监视该通信而检测错误。例如,网络设备210可以通过检测到通信的比特已经被改变来检测比特错误,诸如通过使用散列函数针对所接收通信的比特来生成散列并且将该散列与针对所传送通信的比特所生成的另一个散列进行比较。在一些实现中,网络设备210可以在与所接收和所传送通信相关联的散列的比较并不匹配时检测到比特错误。作为另一个示例,网络设备210可以通过检测到两个网络设备210之间的通信已经由于网络设备210之一在高状态和低状态之间发生交替而中断来检测到路线/链路摆动。在一些实现中,网络设备210可以通过监视另一个网络设备210的状态(例如,高/低、可用/不可用等)而检测路线/链路摆动。
作为另一个示例,网络设备210可以通过检测到两个网络设备210之间的通信已经由于信号损失而中断而检测到信号损失错误。在一些实现中,网络设备210可以通过监视网络设备210和另一个网络设备210之间的连接来检测信号损失错误,例如通过由于未能从另一个网络设备210接收到预期响应。作为另一个示例,网络设备210可以通过检测到针对所接收到的通信计算的FCS数量与通信的分组中所包括的FCS数量(例如,由进行发送的网络设备210所计算的FCS数量)并不匹配而检测到FCS错误。
在一些实现中,该错误可能由网络设备210所导致。例如,该错误可能由网络设备210的收发器组件(例如,光学收发器组件或同轴收发器组件)所导致。作为另一个示例,该错误可能由网络设备210的网络接口控制器(NIC)或线路卡所导致。除此之外或可替换地,该错误可能由传输线路所导致。例如,该错误可能由网络设备210之间的光纤线缆或同轴线缆所导致。
如图4中进一步示出的,过程400可以包括将与该错误相关联的错误度量与阈值错误度量进行比较(框430),并且确定该错误度量是否满足阈值错误度量(框440)。例如,网络设备210可以确定错误度量,诸如比特错误率、路线/链路摆动率、指示网络设备210之间是否出现信号的二进制度量、指示所计算的FCS数量是否与所接收的FCS数量相匹配的二进制度量,等等。在一些实现中,网络设备210可以计算错误度量(例如,基于检测到该错误)。例如,网络设备210可以计算通信中的比特错误的数量以确定通信的比特错误率。除此之外或可替换地,网络设备210可以从诸如另一个网络设备210的另一个设备接收错误度量。
在一些实现中,网络设备210可以确定要在比较错误度量和阈值错误度量时使用的阈值错误度量。例如,网络设备210可以基于所检测到的错误来标识阈值错误率(例如,通过使用数据结构来标识与所检测到的错误相关联的阈值错误率)。在一些实现中,网络设备210可以将该错误度量与阈值错误度量进行比较(例如,通过执行比较)。例如,网络设备210可以将错误度量与预先配置的阈值错误度量、缺省的阈值错误度量或者网络管理员经由客户端设备220所配置的阈值错误度量进行比较。
在一些实现中,网络设备210可以将错误度量和阈值错误度量进行比较以确定该错误度量是否满足该阈值错误度量。在一些实现中,如以下所描述的,网络设备210可以基于确定该错误度量是否满足该阈值错误度量而执行动作。
如图4中进一步示出的,如果该错误度量并不满足该阈值错误度量(框440-否),则过程400可以包括返回框410。例如,如果该错误度量并不满足该阈值错误度量,则网络设备210可以继续针对错误来监视网络设备210之间的通信。在一些实现中,网络设备210可以在网络设备210之前已经停止监视通信的情况下重新开始通信监视。
如图4中进一步示出的,如果该错误度量满足该阈值错误度量(框440-是),则过程400可以包括使用环回测试来标识该错误的源(框450)。例如,网络设备210可以确定该错误是否由网络设备210、另一个网络设备210和/或传输线路所导致。在一些实现中,网络设备210可以使用环回测试来将特定通信组件标识为错误的源。
例如,网络设备210可以使用环回测试将传输线路标识为错误的源。作为另一个示例,第一网络设备210可以使用环回测试将第一网络设备210的第一NIC或第二网络设备210的第二NIC标识为错误的源。作为另一个示例,第一网络设备210可以使用环回测试将第一网络设备210的第一收发器组件或第二网络设备210的第二收发器组件标识为错误的源。
在一些实现中,网络设备210可以对网络设备210的通信组件应用环回测试。例如,网络设备210可以通过监视收发器组件或NIC是否改变了信号而对诸如光学收发器或同轴收发器的收发器组件或NIC应用环回测试。在一些实现中,网络设备210可以对通信组件应用环回测试来确定该通信组件是否正导致与通信相关联的错误。
在一些实现中,网络设备210可以对网络设备210的收发器组件应用环回测试来确定该收发器组件是否是该错误的源。例如,网络设备210可以将网络设备210的收发器组件传送信号。在一些实现中,当网络设备210确定应用于该收发器组件的环回测试导致已经经历了错误的信号,则网络设备210可以确定该错误是由网络设备210的收发器组件所导致并且该收发器组件是该错误的源。相反地,在一些实现中,当网络设备210确定应用于该收发器组件的环回测试并未导致已经经历了错误的信号,则网络设备210可以确定该错误并非由该收发器组件所导致并且该收发器组件并不是该错误的源。
在一些实现中,网络设备210可以对网络设备210的NIC应用环回测试来确定该NIC是否是该错误的源。例如,网络设备210可以向网络设备210的NIC传送信号。在一些实现中,当网络设备210确定应用于该NIC的环回测试导致已经经历了错误的信号,则网络设备210可以确定该错误是由该NIC所导致并且该NIC是该错误的源。相反地,在一些实现中,当网络设备210确定应用于该NIC的环回测试并未导致已经经历了错误的信号,则网络设备210可以确定该错误并非由该NIC所导致并且该NIC并不是该错误的源。
在一些实现中,网络设备210可以对网络设备210的通信组件应用本地环回测试以确定该错误的源是否是网络设备210的通信组件。例如,第一网络设备210可以通过向第一网络设备210的收发器组件和/或NIC传送信号而对该第一网络设备的收发器组件(例如,本地收发器组件)和/或第一网络设备210的NIC(例如,本地NIC)应用本地环回测试。
在一些实现中,第一网络设备210可以应用本地环回测试来确定第一网络设备210的收发器组件和/或NIC是否是错误的源。在一些实现中,当该本地环回测试导致已经经历了错误的信号时,第一网络设备210可以确定该错误的源是第一网络设备210的收发器组件和/或NIC(例如,并且不是第二网络设备210的收发器组件和/或NIC)。
除此之外或可替换地,网络设备210可以对另一个网络设备210的通信组件应用远程环回测试以确定该错误的源是否是其它网络设备210的通信组件。例如,第一网络设备210可以通过向第二网络设备210的收发器组件和/或NIC传送信号而向第二网络设备210的收发器组件(例如,远程收发器组件)和/或NIC(例如,远程NIC)应用远程环回测试。
在一些实现中,第一网络设备210可以应用远程环回测试来确定第二网络设备210的收发器组件和/或NIC是否是该错误的源。在一些实现中,当该远程环回测试导致已经经历了错误的信号时,第一网络设备210可以确定该错误的源是第二网络设备210的收发器组件和/或NIC(例如,并且不是第一网络设备210的收发器组件和/或NIC)。
在一些实现中,网络设备210可以应用多于一种类型的环回测试以检查错误。例如,网络设备210可以应用预先时钟(pre-clock)和数据恢复(pre-CDR)环回测试、post-CDR环回测试和/或串行环回测试。在一些实现中,网络设备210可以根据所测试的通信组件而应用不同类型的环回测试。例如,网络设备210可以对NIC或收发器组件应用第一类型的环回测试,诸如pre-CDR环回测试(例如,其中信号在进行接收的网络设备210的收发器组件执行时钟和数据恢复之前返回的环回测试)。作为另一个示例,网络设备210可以对收发器组件应用第二类型的环回测试,诸如post-CDR环回测试(例如,其中信号在进行接收的网络设备210的收发器组件执行时钟和数据恢复之后返回的环回测试)。
如这里其它地方所描述的,作为另一个示例,网络设备210可以对本地NIC(例如,与网络设备210相关联的NIC)应用本地环回测试,并且对远程NIC(例如,与另一个网络设备210相关联的NIC)应用远程环回测试。在一些实现中,网络设备210可以基于待测试通信组件而确定所要应用的环回测试的类型(例如,通过使用数据结构来标识与待测试通信组件相关联的环回测试的类型)。
在一些实现中,网络设备210可以应用多种环回测试来确定错误的源。例如,网络设备210可以将应用第一环回测试和第二环回测试所得到的结果进行组合来确定错误的源(例如,通过使用排除处理来排除作为错误源的通信组件)。在一些实现中,网络设备210可以以某一顺序应用多个环回测试。例如,网络设备210可以在对NIC应用环回测试之前对收发器组件应用环回测试。以某一顺序应用环回测试可以使得网络设备210能够通过消除过程来确定错误的源。这使得网络设备210能够通过减少网络设备210为了标识错误源所必须应用的环回测试的数量而节省处理器资源。
在一些实现中,网络设备210可以基于第一环回测试的结果而应用第二环回测试。例如,网络设备210可以在第一环回测试通过时应用第二环回测试。作为另一个示例,网络设备210可以在第一环回测试失败时应用第二环回测试。
在一些实现中,网络设备210可以在使用环回测试时标识多个错误。例如,网络设备210可以标识相同类型的多个错误,诸如多个比特错误或多个FCS错误。作为另一个示例,网络设备210可以标识不同类型的多个错误,诸如比特错误和FCS错误。
在一些实现中,网络设备210可以针对多个错误而确定多个源。例如,网络设备210可以将诸如传输线路的第一通信组件和诸如收发器组件的第二通信组件标识为多个第一错误—诸如多个比特错误—的源。作为另一个示例,网络设备210可以将第一通信组件(例如,传输线路)标识为诸如比特错误的第一错误的源,并且将第二通信组件(例如,NIC)标识为诸如路线/链路摆动的第二错误的源。
以这种方式,网络设备210可以自动标识错误的源,由此通过减少或消除网络管理员人工标识错误源的需求而提高确定错误源的效率。此外,这提高了标识错误源的准确性(例如,通过标识网络设备210中导致错误的特定通信组件),由此改进了错误的确定。另外,这使得能够更快地标识错误的源(例如,相对于人工标识而言),由此在标识错误源时减少了网络停用时间。
如图4中进一步示出的,过程400可以包括基于标识错误的源而提供标识错误的源的错误源信息(框460)。例如,网络设备210可以向客户端设备220提供该错误源信息以便进行显示。作为另一个示例,网络设备210可以向客户端设备220传送包括该错误源信息的消息(例如,文本消息或电子邮件消息)。
作为另一个示例,网络设备210可以提供该错误源信息以使得诸如汽笛的听觉警报在标识出错误的源时得以被触发。使用听觉警报使得网络设备210能够使用声音向网络管理员通知对错误的源的标识。作为另一个示例,网络设备210可以提供该错误源信息而使得诸如闪烁灯光的视觉警报在标识出错误的源时得以被触发。使用视觉警报使得网络设备210能够以视觉方式通知网络管理员对错误的源的标识。
作为另一个示例,网络设备210可以提供错误源信息以在错误源信息的日志中记录该错误源信息,由此使得网络管理员后续能够访问该错误源信息。作为另一个示例,网络设备210可以提供该错误源信息以生成简单网络管理协议(SNMP)陷阱(trap)以通知网络管理***对错误的源的标识。向网络管理***提供SNMP陷阱可以使得能够对网络设备210进行性能分析和/或健康诊断。
在一些实现中,网络设备210可以执行动作以修复该错误。例如,网络设备210可以重新配置多个网络设备210之间的通信以对错误的源附近的业务进行重新路由。这通过使得网络设备210能够保持多个网络设备210之间的通信而又避开错误的源来改善多个网络设备210之间的通信。
在一些实现中,网络设备210可以重新配置多个网络设备210之间的通信以将备份或备选通信组件用于故障的通信组件。例如,网络设备210可以重新配置通信以使用备份NIC或备份收发器组件。作为另一个示例,网络设备210可以重新配置通信以使用多个网络设备210之间的备份传输线路。这通过避开错误的源而改进了多个网络设备210之间的通信。此外,这通过减少或消除了网络管理员人工更换通信组件以修复错误的需求而提高了修复错误的效率。
在一些实现中,网络设备210可以使得网络设备210或另一个网络设备210被下线。这通过移除错误源而改善了多个网络设备210之间的通信。
除此之外或可替换地,网络设备210可以使得另一个网络设备210得以联机(例如,关联于使得网络设备210或另一个网络设备210离线)。这通过使得网络设备210能够使得适当网络设备210联机而改善了多个网络设备210之间的通信。
在一些实现中,网络设备210可以安排技术人员或网络管理员来修复错误(例如,在日历上进行安排)。例如,网络设备210可以安排技术人员或网络管理员对故障通信组件进行故障排除或维修。这通过自动安排错误修复而提高修复错误的效率。
在一些实现中,网络设备210可以自动下令更换通信组件(例如,由技术人员或网络管理员进行安装)。这通过针对技术人员或网络管理员自动获得更换通信组件而提高修复错误的效率。
在一些实现中,网络设备210可以重启网络设备210或另一个网络设备210。例如,网络设备210可以重启网络设备210以尝试修复该错误。这通过在通知网络管理员人工修复错误之前尝试使用自动动作来修复错误而提高修复错误的效率。
以这种方式,网络设备210诸如可以向网络管理员提供错误源信息。这使得网络管理员能够快速且有效地标识错误的源并且更换导致该错误的通信组件(例如,传输线路、收发器组件或NIC),由此提高校正错误源的效率。此外,网络设备210可以执行动作来修复错误。这通过减少或消除了网络人员进行人工修复的需求而提高了修复错误的效率。
虽然关于环回测试对图4进行了描述,但是其它实现是可能的。例如,网络设备210可以单独或结合环回测试而使用ping测试或路由跟踪测试来标识错误的源。
虽然图4示出了过程400的示例框,但是在一些实现中,过程400可以包括另外的框、更少的框、不同的框,或者以与图4中所描绘的那些相比以不同方式进行布置的框。除此之外或可替换地,过程400的两个或更多的框可以并行执行。
这里所描述的实现使得网络设备能够自动检测与网络设备之间的通信相关联的错误。此外,网络设备可以自动标识错误的源。自动检测错误并且自动标识错误的源使得能够更快且更为准确地标识错误的源,由此减少网络停用时间。此外,这减少或消除了手工标识错误的源的需要,由此提高了标识错误的源的效率。另外,这通过减少或消除与手工标识错误的源相关联的误差—诸如与手写程序代码相关联的错误—而节省了标识期间的处理器资源。
以上公开内容提供了图示和描述,但是并非意在是穷举的或者将实现局限于所公开的确切形式。鉴于以上公开,修改和变化是可能的或者可以通过实施方式的实践而获得。
如这里所使用的,术语组件意在宽泛地被解读为硬件、固件和/或硬件和软件的组合。
这里结合阈值对一些实现进行了描述。如这里所使用的,满足阈值可以是指数值大于阈值、多于阈值、高于阈值、大于或等于阈值、小于阈值、少于阈值、低于阈值、小于或等于阈值、等于阈值,等等。
将会显而易见的是,这里所描述的***和/或方法可以以不同形式的硬件、固件或者硬件和软件的组合来实施。用来实施这些***和/或方法的实际专用控制硬件或软件并非是实现的限制。因此,***和/或方法的操作和行为在这里并未参看具体软件代码进行描述—所要理解的是,软件和硬件能够被设计为实施基于这里的描述的***和/或方法。
即使在权利要求中记载和/或在说明书中公开了特定特征组合,但是这些组合并非意在对可能实现的公开进行限制。实际上,这些特征中的许多特征可以以并未在权利要求中特别记载和/或在说明书中特别公开的方式进行组合。虽然以下所列出的每项从属权利要求仅可以直接引用一项权利要求,但是可能实施方式的公开包括与权利要求集合中的每项其它权利要求进行组合的每项从属权利要求。
除非明确如此描述,否则这里所使用的部件、动作或指令都不应当被理解为是关键或必要的。而且,如这里所使用的,冠词“一”意在包括一个或多个事项,并且可以与“一个或多个”互换使用。此外,如这里所使用的,术语“集合”意在包括一个或多个事项(例如,相关事项、非相关事项、相关和非相关事项的组合,等等),并且可以与“一个或多个”互换使用。在意在表示仅一个事项的情况下,使用术语“一个”或类似语言。而且,如这里所使用的,术语“具有”、“拥有”、“带有”等意在是开放端点的术语。此外,除非以其它方式明确指出,否则短语“基于”意在表示“至少部分基于”。

Claims (13)

1.一种设备,包括:
用于针对与网络设备之间的通信相关联的错误而监视所述通信的装置;
用于检测与所述网络设备之间的所述通信相关联的所述错误的装置;
用于执行错误度量与阈值错误度量的比较的装置,
所述错误度量与所述错误相关联;
用于确定所述比较是否指示所述错误度量满足所述阈值错误度量的装置;
用于基于确定所述比较是否指示所述错误度量满足所述阈值错误度量而使用环回测试来标识所述错误的源的装置;以及
用于基于标识所述错误的所述源而提供错误源信息的装置,
所述错误源信息标识所述错误的所述源。
2.根据权利要求1所述的设备,进一步包括:
用于对所述网络设备中的第一网络设备应用第一环回测试或者对所述网络设备中的第二网络设备应用第二环回测试的装置;以及
用于确定所述第一环回测试或所述第二环回测试是否包括所述错误的装置;并且
其中所述用于标识所述错误的所述源的装置包括:
用于基于确定所述第一环回测试或所述第二环回测试包括所述错误而标识所述错误的所述源的装置。
3.根据权利要求2所述的设备,其中所述用于对所述第一网络设备应用所述第一环回测试的装置包括:
用于对所述第一网络设备的收发器组件应用所述第一环回测试的装置,或者
用于对所述第一网络设备的网络接口控制器(NIC)应用所述第一环回测试的装置。
4.根据权利要求2所述的设备,其中所述用于对所述第二网络设备应用所述第二环回测试的装置包括:
用于对所述第二网络设备的收发器组件应用所述第二环回测试的装置,或者
用于对所述第二网络设备的网络接口控制器(NIC)应用所述第二环回测试的装置。
5.根据权利要求1所述的设备,其中所述用于标识所述错误的所述源的装置包括:
用于确定所述错误度量满足所述阈值错误度量的装置;以及
用于基于确定所述错误度量满足所述阈值错误度量而标识所述错误的所述源的装置。
6.根据权利要求1所述的设备,其中所述环回测试是与确定所述错误的所述源是否为以下之一相关联的本地环回测试:
本地网络接口控制器(NIC),或
本地收发器组件。
7.根据权利要求1所述的设备,其中所述环回测试是与确定所述错误的源是否为以下之一相关联的远程环回测试:
远程网络接口控制器(NIC),或
远程收发器组件。
8.一种方法,包括:
由第一设备监视所述第一设备和第二设备之间的通信;
由所述第一设备检测与所述第一设备和所述第二设备之间的所述通信相关联的错误,
所述错误由所述第一设备、所述第二设备或者所述第一设备和所述第二设备用来进行通信的传输线路所导致;
由所述第一设备执行错误度量和阈值错误度量的比较,
所述错误度量根据所述错误而被确定;
由所述第一设备确定所述比较结果指示所述错误度量满足所述阈值错误度量;
由所述第一设备基于确定所述错误度量满足所述阈值错误度量而使用环回测试来标识所述错误的源;以及
由所述第一设备基于标识所述错误的所述源而执行动作,
所述动作与所述错误的所述源相关联。
9.根据权利要求8所述的方法,其中标识所述错误的所述源包括:
标识多个通信组件中导致所述错误的通信组件,
所述多个通信组件包括:
所述第一设备的第一网络接口控制器(NIC);
所述第一设备的第一收发器组件;
所述第二设备的第二NIC;
所述第二设备的第二收发器组件;或
所述传输线路;以及
基于标识导致所述错误的通信组件而标识所述错误的所述源。
10.根据权利要求9所述的方法,其中标识正导致所述错误的所述通信组件包括:
对所述多个通信组件应用所述环回测试;
确定所述环回测试是否导致已经经历了所述错误的信号;以及
基于确定所述环回测试是否导致已经经历了所述错误的所述信号而标识所述多个通信组件中导致所述错误的所述通信组件。
11.根据权利要求8所述的方法,其中标识所述错误的所述源包括:
对所述第一设备的多个通信组件应用本地环回测试;以及
基于对所述第一设备的所述多个通信组件应用所述本地环回测试而标识所述错误的所述源。
12.根据权利要求8所述的方法,其中标识所述错误的所述源包括:
对所述第二设备的多个通信组件应用远程环回测试;以及
基于对所述第二设备的所述多个通信组件应用所述远程环回测试而标识所述错误的所述源。
13.根据权利要求8所述的方法,其中标识所述错误的所述源包括:
对所述第一设备或所述第二设备应用所述环回测试;
针对以下中的二者而确定所述环回测试未能导致已经经历了所述错误的信号:
所述第一设备,
所述第二设备,或
所述传输线路;并且
基于确定所述环回测试未能导致已经经历了所述错误的所述信号而标识所述错误的所述源。
CN201610900611.0A 2016-06-30 2016-10-14 自动检测通信中的错误并且自动确定该错误的源 Active CN107566036B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US15/198,250 US10404570B2 (en) 2016-06-30 2016-06-30 Automatically detecting an error in a communication and automatically determining a source of the error
US15/198,250 2016-06-30

Publications (2)

Publication Number Publication Date
CN107566036A true CN107566036A (zh) 2018-01-09
CN107566036B CN107566036B (zh) 2020-08-04

Family

ID=57178266

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610900611.0A Active CN107566036B (zh) 2016-06-30 2016-10-14 自动检测通信中的错误并且自动确定该错误的源

Country Status (3)

Country Link
US (1) US10404570B2 (zh)
EP (1) EP3264634B1 (zh)
CN (1) CN107566036B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10554478B2 (en) * 2016-08-03 2020-02-04 At&T Intellectual Property I, L.P. Method and apparatus for providing trouble isolation via a network
US10999376B2 (en) * 2018-01-24 2021-05-04 Walmart Apollo, Llc Simulating parallel mock rest services with single server
US10623090B2 (en) * 2018-05-24 2020-04-14 At&T Intellectual Property I, L.P. Multi-lane optical transport network recovery
US11271798B2 (en) * 2020-06-25 2022-03-08 Salesforce.Com, Inc. Automated network link repair
JP7417773B1 (ja) 2023-01-31 2024-01-18 Necプラットフォームズ株式会社 ネットワークインターフェースカード、および送信性能監視方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101106424A (zh) * 2006-07-11 2008-01-16 阿尔卡特朗讯公司 用于监视传输光网络的光连接通道的方法和设备
CN101378577A (zh) * 2008-09-27 2009-03-04 华为技术有限公司 一种链路故障检测的方法和***
CN102752125A (zh) * 2011-04-20 2012-10-24 华为数字技术有限公司 一种数据链路的故障定位方法及装置
CN103229516A (zh) * 2012-12-12 2013-07-31 华为技术有限公司 链路检测方法及装置
US20160182275A1 (en) * 2014-12-23 2016-06-23 Infinera Corporation Circuit diagnostic manager

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7477847B2 (en) * 2002-09-13 2009-01-13 Finisar Corporation Optical and electrical channel feedback in optical transceiver module
US8085675B2 (en) 2006-04-20 2011-12-27 Cisco Technology, Inc. Method and apparatus to test a data path in a network
US8576722B2 (en) 2006-08-22 2013-11-05 Centurylink Intellectual Property Llc System and method for modifying connectivity fault management packets

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101106424A (zh) * 2006-07-11 2008-01-16 阿尔卡特朗讯公司 用于监视传输光网络的光连接通道的方法和设备
CN101378577A (zh) * 2008-09-27 2009-03-04 华为技术有限公司 一种链路故障检测的方法和***
CN102752125A (zh) * 2011-04-20 2012-10-24 华为数字技术有限公司 一种数据链路的故障定位方法及装置
CN103229516A (zh) * 2012-12-12 2013-07-31 华为技术有限公司 链路检测方法及装置
US20160182275A1 (en) * 2014-12-23 2016-06-23 Infinera Corporation Circuit diagnostic manager

Also Published As

Publication number Publication date
US10404570B2 (en) 2019-09-03
US20180006925A1 (en) 2018-01-04
EP3264634B1 (en) 2021-06-02
EP3264634A1 (en) 2018-01-03
CN107566036B (zh) 2020-08-04

Similar Documents

Publication Publication Date Title
US10541891B2 (en) Network configuration predictive analytics engine
CN107566036A (zh) 自动检测通信中的错误并且自动确定该错误的源
KR102496403B1 (ko) 네트워크 분석을 위한 방법들, 장치들, 및 시스템들
CN113328872B (zh) 故障修复方法、装置和存储介质
JP5767617B2 (ja) ネットワーク障害検出システムおよびネットワーク障害検出装置
US9413597B2 (en) Method and system for providing aggregated network alarms
US20110270957A1 (en) Method and system for logging trace events of a network device
US11349703B2 (en) Method and system for root cause analysis of network issues
CN106776243B (zh) 一种针对监控软件的监控方法及装置
US10289522B2 (en) Autonomous information technology diagnostic checks
JP4612525B2 (ja) ネットワーク障害部位特定装置および方法
Gheorghe et al. SDN-RADAR: Network troubleshooting combining user experience and SDN capabilities
US9722863B2 (en) Isolating the sources of faults/potential faults within computing networks
CN103634166B (zh) 一种设备存活检测方法及装置
US11271798B2 (en) Automated network link repair
Zhang et al. Service failure diagnosis in service function chain
CN106899655A (zh) 使用对应于文件传输事件的反馈文件来跟踪文件传输的状态
US20210194752A1 (en) Alarm prioritization in a 5g telco network
EP3063633B1 (en) Monitoring printers
JP2013046250A (ja) 障害リンク特定システムおよびその監視経路設定方法
JP6310405B2 (ja) サービス影響原因推定装置、サービス影響原因推定プログラム、及びサービス影響原因推定方法
JP6513001B2 (ja) 故障検知装置、故障検知方法、及びプログラム
CN105634790B (zh) 被管理对象的修改方法、网管***和设备
US9311210B1 (en) Methods and apparatus for fault detection
US11356317B2 (en) Alarm prioritization in a 5G telco network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant