CN103532763B - 一种故障定位方法及装置 - Google Patents

一种故障定位方法及装置 Download PDF

Info

Publication number
CN103532763B
CN103532763B CN201310495968.1A CN201310495968A CN103532763B CN 103532763 B CN103532763 B CN 103532763B CN 201310495968 A CN201310495968 A CN 201310495968A CN 103532763 B CN103532763 B CN 103532763B
Authority
CN
China
Prior art keywords
message
abnormal
forwarding
information
occurs
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310495968.1A
Other languages
English (en)
Other versions
CN103532763A (zh
Inventor
吴焕政
刁塑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Maipu Communication Technology Co Ltd
Original Assignee
Maipu Communication Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Maipu Communication Technology Co Ltd filed Critical Maipu Communication Technology Co Ltd
Priority to CN201310495968.1A priority Critical patent/CN103532763B/zh
Publication of CN103532763A publication Critical patent/CN103532763A/zh
Application granted granted Critical
Publication of CN103532763B publication Critical patent/CN103532763B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种故障定位方法及装置,涉及网络通信技术领域,在报文转发出现异常时,能够快速获取到出现转发异常的位置,提高了故障定位的准确率。本发明的具体实施例包括:在***出现报文转发异常时,在出现异常的报文被释放到缓冲区之前抓取预设数目的报文,并获取已记录的报文的断点信息,进而根据该断点信息确定报文出现转发异常的位置。本发明技术方案主要应用于报文转发流程中。

Description

一种故障定位方法及装置
技术领域
本发明涉及网络通信技术领域,尤其涉及一种故障定位方法及装置。
背景技术
当前,数据通信设备在进行报文转发时会出现多种异常,比如,缓冲区buffer泄露,协议报文丢包,业务不通等,当这些异常出现时,就需要定位出现这些异常的位置,进而才能够分析并排除异常。在现有技术手段中,通过数据通信设备内部的各个模块中的可维护性信息,来对出现的异常定位。具体的,将数据通信设备中的报文转发处理可以看作是一个流水线过程,该流水线过程包括驱动处理、链路处理、IP处理等子过程,这些子过程也就是指该数据通信设备中的各个模块。
在实际报文转发过程中,数据通信设备中会同时存在TCP和UDP等业务报文,也可能会同时运行OSPF、RIP、BGP等多种协议报文,在该数据通信设备出现异常时,可能是某一协议或者某一业务报文转发不通,在通过现有技术手段确定出现转发异常的位置时,只能粗略地在各个模块中确定出现异常的位置,从而导致故障定位的准确率低。
发明内容
本发明的实施例提供一种故障定位方法及装置,在报文转发出现异常时,能够快速获取到出现转发异常的位置,提高了故障定位的准确率。
为达到上述目的,本发明的实施例采用如下技术方案:
一种故障定位方法,包括:
当***出现报文转发异常时,在出现异常的报文被释放到缓冲区之前抓取预设数目的所述报文,获取已记录的所述报文的断点信息,所述断点信息至少包括所述报文在转发路径中的位置信息;
根据所述断点信息确定所述报文出现所述转发异常的位置。
一种故障定位装置,包括:
异常判断模块,用于判断***是否出现报文转发异常,在确定***出现报文转发异常时,通知报文抓取模块;
报文抓取模块,用于在收到异常判断模块的通知时,在出现异常的报文被释放到缓冲区之前抓取预设数目的所述报文,获取已记录的所述报文的断点信息,所述断点信息至少包括所述报文在转发路径中的位置信息;
异常定位模块,用于根据所述报文抓取模块获取的所述断点信息确定所述报文出现所述转发异常的位置。
本发明实施例提供的一种故障定位方法及装置,在***出现报文转发异常时,获取已记录的该报文的断点信息,进而根据该断点信息确定该报文出现转发异常的位置。与现有技术中,仅仅根据报文转发过程的各个模块的可维护性信息来确定报文转发异常相比,本发明实施例提供的技术方案,通过断点信息能够获取到报文在整个转发过程的位置信息,从而在报文转发异常时,能够快速、准确地获取出现转发异常的位置,提高了报文转发时故障定位的准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的一种故障定位方法的流程图;
图2为本发明另一实施例提供的一种故障定位方法的流程图;
图3为本发明另一实施例提供的一种故障定位装置的组成示意图;
图4为本发明另一实施例提供的另一种故障定位装置的组成示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
值得说明的是,buffer是具有一定格式的内存,用于承载报文,贯穿整个报文的转发流程。在该buffer上,可以记录报文转发过程中与该报文处理相关的信息,本发明实施例提供的故障定位方法是基于buffer的。
本发明一实施例提供了一种故障定位方法,如图1所示,该方法包括:
101、当***出现报文转发异常时,在出现异常的报文被释放到缓冲区之前抓取预设数目的报文。
102、获取已记录的报文的断点信息。
其中,断点信息至少包括报文在转发路径中的位置信息。
可选的,该断点信息可以存储在报文描述符中。
103、根据断点信息确定报文出现转发异常的位置。
本发明实施例提供的一种故障定位方法,在***出现报文转发异常时,获取已记录的该报文的断点信息,进而根据该断点信息确定该报文出现转发异常的位置。与现有技术中,仅仅根据报文转发过程的各个模块的可维护性信息来确定报文转发异常相比,本发明实施例提供的技术方案,通过断点信息能够获取到报文在整个转发过程的位置信息,从而在报文转发异常时,能够快速、准确地获取出现转发异常的位置,提高了报文转发时故障定位的准确率。
本发明另一实施例提供了一种故障定位方法,如图2所示,该方法包括:
201、在报文被***接收时,对报文进行识别,并记录该报文的类型信息。
可选的,该报文识别可以在buffer的在驱动接收流程中实现,这样就能够确定接收的报文为广域网报文还是以太报文;进一步的,根据报文的协议字段或者报文的协议字段和端口号,确定报文的类型;更进一步的,在确定报文的类型之后,记录该报文的类型信息,该报文类型信息可以记录在报文描述符的预设字段中,该预设字段可以是以使得后续抓取的报文能够与该报文描述符中存储的报文的类型进行匹配,如果匹配结果为类型信息一致则抓取该报文。
值得说明的是,多种类型的报文可能会同时运行,为了定位不同类型的报文的转发异常,可以对报文进行分类来识别报文。报文识别只是对报文进行粗粒度的区分,这样就能降低对报文转发性能的影响。
202、在报文转发过程中,在报文经过预设断点处理后记录断点信息。
可选的,将报文转发的关键流程设置为预设断点,每个预设断点用于表示该报文转发流程中所经历的一个处理过程。其中,该关键流程指在报文转发过程中出现异常概率高于预设值的流程,该预设值可由用户或***设定。
可选的,该故障定位方法可应用于数据通信设备中,且在该数据通信设备中可以同时处理一个或多个报文的转发。
可选的,断点信息以位图(bitMap)的形式记录,且该位图信息可以存储于报文描述符中,在该位图中,每一个bit代表一个断点信息。这样在报文转发异常时,就可以通过报文描述符获取断点信息,进而根据该断点信息可以定位报文转发异常的位置。
值得说明的是,该断点信息至少包括报文在转发路径中的位置信息。
203、当***出现报文转发异常时,在出现异常的报文被释放到缓冲区之前抓取预设数目的报文,并获取已记录的报文的断点信息。
其中,该转发异常包括但不限定为报文转发不通、报文丢包等。
进一步的,当报文出现丢包时,该丢包的报文会被释放到预设存储空间中,该预设存储空间包括buffer池,在本实施例中以该预设存储空间为buffer池为例进行说明。进一步的,在buffer释放时,也就是报文处理结束的时刻,这时抓取到的buffer就包含了完整的报文,buffer中报文描述符中的断点信息也是完整的,其中的buffer至少包括报文信息和报文描述符信息。结合上述流程,由于在报文丢包时,就获取了该报文,也就是说不必等到报文转发到接口时,再去获取该报文,这样在转发异常时也能获取到完整的报文信息。
可选的,该报文的抓取在转发平面完成。
具体的,在出现异常的报文被释放到缓冲区之前抓取预设数目的报文时,执行下述流程:
a、判断发生转发异常的报文类型。
b、从即将被释放到缓冲区的报文中抓取与出现转发异常的报文类型相同的报文。
可选的,其中的报文类型信息记录在报文描述符中;预设数目可以是用户或者***自行设定的,本发明实施例对该预设数目的具体值不进行限制。
204、根据该断点信息确定报文出现转发异常的位置。
优选的,在本实施例中,报文的断点信息以位图的形式记录在报文描述符中。
本发明实施例提供的一种故障定位方法,在***出现报文转发异常时,获取已记录的该报文的断点信息,进而根据该断点信息确定该报文出现转发异常的位置。与现有技术中,仅仅根据报文转发过程的各个模块的可维护性信息来确定报文转发异常相比,本发明实施例提供的技术方案,通过断点信息能够获取到报文在整个转发过程的位置信息,从而在报文转发异常时,能够快速、准确地获取出现转发异常的位置,提高了报文转发时故障定位的准确率。
本发明另一实施例提供了一种故障定位装置,如图3所示,该装置包括:异常判断模块31、报文抓取模块32、异常定位模块33。
异常判断模块31,用于判断***是否出现报文转发异常,在确定***出现报文转发异常时,通知报文抓取模块32。
报文抓取模块32,用于在收到异常判断模块31的通知时,在出现异常的报文被释放到缓冲区之前抓取预设数目的报文,获取已记录的报文的断点信息。
其中,断点信息至少包括报文在转发路径中的位置信息。
异常定位模块33,用于根据报文抓取模块32获取的断点信息确定报文出现转发异常的位置。
可选的,如图4所示,该装置还包括:信息记录模块34、报文识别模块35。
信息记录模块34,用于在报文的转发过程中,在报文经过预设断点处理后记录断点信息。
报文识别模块35,还用于在***接收到报文时,对报文进行识别,并记录报文的类型信息。
可选的,异常判断模块31,还用于当***出现转发异常时,判断发生转发异常的报文类型,并通知报文抓取模块32。
报文抓取模块32,还用于在出现异常的报文被释放到缓冲区之前抓取预设数目的报文,抓取与判断转发出现异常的报文类型相同的报文。
其中,报文识别模块35,记录的报文的类型信息记录在报文描述符中;信息记录模块34,记录的报文的断点信息以位图的形式记录在报文描述符中。
本发明实施例提供的一种故障定位装置,在通过异常判断模块确定***出现报文发生转发异常时,报文抓取模块会在出现异常的报文被释放到缓冲区之前换取预设数目的报文,并获取记录的报文的断点信息,进而异常定位模块根据获取到的断点信息确定报文出现转发异常的位置。与现有技术中,仅仅根据报文转发过程的各个模块的可维护性信息来确定报文转发异常相比,本发明实施例提供的技术方案,通过断点信息能够获取到报文在整个转发过程的位置信息,从而在报文转发异常时,能够快速、准确地获取出现转发异常的位置,提高了报文转发时故障定位的准确率。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在可读取的存储介质中,如计算机的软盘,硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (4)

1.一种故障定位方法,其特征在于,包括:
A、当***出现报文转发异常时,在出现异常的报文被释放到缓冲区之前抓取预设数目的所述报文,获取已记录的所述报文的断点信息,所述断点信息至少包括所述报文在转发路径中的位置信息;
B、根据所述断点信息确定所述报文出现所述转发异常的位置;
在步骤A之前,所述方法还包括:
A0、在报文的转发过程中,在所述报文经过预设断点处理后记录所述断点信息,所述预设断点用于表示报文转发的关键流程,所述关键流程用于表示在报文的转发过程中,出现异常概率高于预设值的流程;
在所述步骤A0之前,所述方法还包括:
在所述报文被***接收时,对所述报文进行识别,并记录所述报文的类型信息;
所述步骤A中,所述当***出现报文转发异常时,在出现异常的报文被释放到缓冲区之前抓取预设数目的所述报文,包括:
当***出现报文转发异常时,判断发生转发异常的报文类型,从即将被释放到缓冲区的报文中抓取与出现转发异常的报文类型相同的报文;所述报文的类型信息记录在报文描述符中。
2.根据权利要求1所述的故障定位方法,其特征在于,所述报文的断点信息以位图的形式记录在所述报文描述符中。
3.一种故障定位装置,其特征在于,包括:
异常判断模块,用于判断***是否出现报文转发异常,在确定***出现报文转发异常时,通知报文抓取模块;
报文抓取模块,用于在收到异常判断模块的通知时,在出现异常的报文被释放到缓冲区之前抓取预设数目的所述报文,获取已记录的所述报文的断点信息,所述断点信息至少包括所述报文在转发路径中的位置信息;
异常定位模块,用于根据所述报文抓取模块获取的所述断点信息确定所述报文出现所述转发异常的位置;
所述装置还包括:
信息记录模块,用于在报文的转发过程中,在所述报文经过预设断点处理后记录所述断点信息,所述预设断点用于表示报文转发的关键流程,所述关键流程用于表示在报文的转发过程中,出现异常概率高于预设值的流程;
所述装置还包括:
报文识别模块,还用于在***接收报文时,对所述报文进行识别,并记录所述报文的类型信息;
所述异常判断模块,还用于当***出现转发异常时,判断发生转发异常的报文类型,并通知报文抓取模块;
所述报文抓取模块,还用于在出现异常的报文被释放到缓冲区之前抓取预设数目的所述报文,抓取与判断转发出现异常的报文类型相同的报文。
4.根据权利要求3所述的故障定位装置,其特征在于,
所述报文的类型信息记录在报文描述符中;
所述报文的断点信息以位图的形式记录在报文描述符中。
CN201310495968.1A 2013-10-21 2013-10-21 一种故障定位方法及装置 Active CN103532763B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310495968.1A CN103532763B (zh) 2013-10-21 2013-10-21 一种故障定位方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310495968.1A CN103532763B (zh) 2013-10-21 2013-10-21 一种故障定位方法及装置

Publications (2)

Publication Number Publication Date
CN103532763A CN103532763A (zh) 2014-01-22
CN103532763B true CN103532763B (zh) 2017-11-17

Family

ID=49934464

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310495968.1A Active CN103532763B (zh) 2013-10-21 2013-10-21 一种故障定位方法及装置

Country Status (1)

Country Link
CN (1) CN103532763B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102924851B (zh) * 2012-11-21 2015-05-13 山东高信化学股份有限公司 一种耐高温、耐候、防火、低导热率的氯化聚氯乙烯瓦楞板及其制备方法
CN106529226B (zh) * 2016-10-27 2019-04-12 东软集团股份有限公司 数据跟踪方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1531633A1 (en) * 2003-11-13 2005-05-18 Alcatel Method for restoring a connection in a telecommunication network
CN101291194A (zh) * 2008-05-20 2008-10-22 华为技术有限公司 报文保序的方法和***
CN101488921A (zh) * 2009-02-24 2009-07-22 华为技术有限公司 报文轨迹记录方法及报文轨迹记录装置
CN102255749A (zh) * 2011-06-27 2011-11-23 中兴通讯股份有限公司 一种引发网络设备故障的异常报文捕获方法及装置
CN102427423A (zh) * 2011-11-07 2012-04-25 北京星网锐捷网络技术有限公司 一种网络流量跟踪及故障定位的方法、装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1531633A1 (en) * 2003-11-13 2005-05-18 Alcatel Method for restoring a connection in a telecommunication network
CN101291194A (zh) * 2008-05-20 2008-10-22 华为技术有限公司 报文保序的方法和***
CN101488921A (zh) * 2009-02-24 2009-07-22 华为技术有限公司 报文轨迹记录方法及报文轨迹记录装置
CN102255749A (zh) * 2011-06-27 2011-11-23 中兴通讯股份有限公司 一种引发网络设备故障的异常报文捕获方法及装置
CN102427423A (zh) * 2011-11-07 2012-04-25 北京星网锐捷网络技术有限公司 一种网络流量跟踪及故障定位的方法、装置

Also Published As

Publication number Publication date
CN103532763A (zh) 2014-01-22

Similar Documents

Publication Publication Date Title
US11902096B2 (en) Collection of error packet information for network policy enforcement
CN112468488A (zh) 工业异常监测方法、装置、计算机设备及可读存储介质
CN113708995B (zh) 一种网络故障诊断方法、***、电子设备及存储介质
CN107800663B (zh) 流量离线文件的检测方法及装置
CN109347892B (zh) 一种互联网工业资产扫描处理方法及装置
CN104679596A (zh) 一种提高服务器端并发性能的消息处理方法及其***
CN109005082A (zh) 一种利用crc校验字段捕获以太网报文的方法及装置
CN111555936B (zh) 一种工控资产探测方法、装置和设备
CN103532763B (zh) 一种故障定位方法及装置
CN114172731A (zh) IPv6地址的快速验证溯源方法、装置、设备及介质
EP3944582B1 (en) Monitoring of abnormal host
CN110971540A (zh) 一种数据信息的传输方法、装置、交换机及控制器
CN111131180B (zh) 一种大规模云环境中分布式部署的http协议post拦截方法
CN102655476B (zh) 一种互联网协议流转发方法,及设备
CN107612848B (zh) 一种调试方法及装置、以及计算机可读存储介质
CN106656656A (zh) 一种网络设备抓包方法及装置
CN109495311A (zh) 一种网络故障检测方法及装置
CN110896545B (zh) 在线计费漫游故障定位方法及相关装置、存储介质
CN103095529A (zh) 检测引擎装置、防火墙、检测网络传输文件的方法及装置
CN112769650A (zh) 一种多vlan的环路检测方法及***
CN112640392A (zh) 一种木马检测方法、装置和设备
CN114285652B (zh) 工业协议检测方法、装置及计算机设备、存储介质
CN112969194B (zh) 一种基于反向包处理的urr统计方法
CN115426245B (zh) 云平台网络故障自动检测方法、设备及计算机可读介质
CN111193722B (zh) 基于Linux内核加速转发的方法、装置、设备及介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP02 Change in the address of a patent holder

Address after: 610041 15-24 floor, 1 1 Tianfu street, Chengdu high tech Zone, Sichuan

Patentee after: MAIPU COMMUNICATION TECHNOLOGY Co.,Ltd.

Address before: 610041 16 Hing Hing Road, Chengdu high tech Development Zone, Sichuan, China 16

Patentee before: MAIPU COMMUNICATION TECHNOLOGY Co.,Ltd.

CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: 610041 nine Xing Xing Road 16, hi tech Zone, Sichuan, Chengdu

Patentee after: MAIPU COMMUNICATION TECHNOLOGY Co.,Ltd.

Address before: 610041 15-24 floor, 1 1 Tianfu street, Chengdu high tech Zone, Sichuan

Patentee before: MAIPU COMMUNICATION TECHNOLOGY Co.,Ltd.

CP02 Change in the address of a patent holder
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A Fault Location Method and Device

Granted publication date: 20171117

Pledgee: Chengdu SME financing Company Limited by Guarantee

Pledgor: MAIPU COMMUNICATION TECHNOLOGY Co.,Ltd.

Registration number: Y2024990000183