CN105589764A - Cpu异常处理方法及装置 - Google Patents

Cpu异常处理方法及装置 Download PDF

Info

Publication number
CN105589764A
CN105589764A CN201510916234.5A CN201510916234A CN105589764A CN 105589764 A CN105589764 A CN 105589764A CN 201510916234 A CN201510916234 A CN 201510916234A CN 105589764 A CN105589764 A CN 105589764A
Authority
CN
China
Prior art keywords
message
cpu
business
information
global variable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510916234.5A
Other languages
English (en)
Other versions
CN105589764B (zh
Inventor
宋海宾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou H3C Technologies Co Ltd
Original Assignee
Hangzhou H3C Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou H3C Technologies Co Ltd filed Critical Hangzhou H3C Technologies Co Ltd
Priority to CN201510916234.5A priority Critical patent/CN105589764B/zh
Publication of CN105589764A publication Critical patent/CN105589764A/zh
Application granted granted Critical
Publication of CN105589764B publication Critical patent/CN105589764B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)
  • Retry When Errors Occur (AREA)

Abstract

本申请提出CPU异常处理方法及装置。方法包括:CPU接收到任一报文,将该报文放入缓存中,将报文的缓存首地址和报文长度记录到预设的第一全局变量中;当CPU将报文从缓存中取出并成功发送出去时,CPU删除第一全局变量中保存的该报文的缓存首地址和报文长度信息;当CPU异常时,CPU根据第一全局变量中存储的所有报文的缓存首地址和报文长度信息,从缓存中读取对应的原始报文内容,将读取的原始报文内容保存到预设高端存储区域中,所述高端存储区域存储的信息在设备重启过程中不改变;当设备重启后,CPU从高端存储区域中读取所有原始报文内容,将读取的所有原始报文内容复制到磁盘中。本申请提高了CPU异常定位精度。

Description

CPU异常处理方法及装置
技术领域
本申请涉及设备异常处理技术领域,尤其涉及CPU异常处理方法及装置。
背景技术
当前网络安全设备需要针对过往的报文进行很多复杂的处理、分析、计算等,因为网络上的报文千奇百怪,设计上或者编码稍有差错,一个畸形报文就足以导致整个设备重启、CPU异常。例如目前的ALG(ApplicationLayerGateway,应用层网关)处理、DPI(DeepPacketInspection,深度包检测)等处理过程,经常出现异常死机,而又不容易找到引起异常的报文,定位非常困难。
设备进入异常后,***记录异常时各个CPU的寄存器信息及堆栈信息就重启恢复现场了。
但是,通过查看堆栈信息,只能初步定位出最后是哪个函数异常了,具体是什么原因引起CPU异常则无法得知。需要重新编译版本,增加调试信息,在现场进行复现,同时需要在设备的接口处抓报文,通过分析这些报文,逐个回放报文来分析具体哪个报文引起CPU异常。可见,通过这种方式定位问题复杂、耗时,且很多时候畸形报文出现的频率很低,因此当CPU异常后,若后续长时间畸形报文不出现,就会导致问题无法定位。
发明内容
本申请实施例提供CPU异常处理方法及装置。
本申请的技术方案是这样实现的:
一种CPU异常处理方法,该方法包括:
CPU接收到任一报文,将该报文放入缓存中,将报文的缓存首地址和报文长度记录到预设的第一全局变量中;
当CPU将报文从缓存中取出并成功发送出去时,CPU删除第一全局变量中保存的该报文的缓存首地址和报文长度信息;
当CPU异常时,CPU根据第一全局变量中存储的所有报文的缓存首地址和报文长度信息,从缓存中读取对应的原始报文内容,将读取的原始报文内容保存到预设高端存储区域中,所述高端存储区域存储的信息在设备重启过程中不改变;
当设备重启后,CPU从高端存储区域中读取所有原始报文内容,将读取的所有原始报文内容复制到磁盘中。
一种CPU异常处理方法,该方法包括:
CPU的任一核接收到任一报文,将该报文放入缓存中,将报文的缓存首地址和报文长度记录到预设的针对该核的第一全局变量中;
当CPU将报文从缓存中取出并成功发送出去时,CPU删除第一全局变量中保存的该报文的缓存首地址和报文长度信息;
当CPU异常时,CPU根据针对各核的第一全局变量中存储的所有报文的缓存首地址和报文长度,从缓存中读取对应的原始报文内容,将读取的所有原始报文内容保存到预设高端存储区域中,所述高端存储区域存储的信息在设备重启过程中不改变;
当设备重启后,CPU从高端存储区域中读取针对各核的所有原始报文内容,将读取的所有原始报文内容复制到磁盘中。
一种CPU异常处理装置,该装置包括:
记录模块:接收到任一报文,将该报文放入缓存中,将报文的缓存首地址和报文长度记录到预设的第一全局变量中;当将报文从缓存中取出并成功发送出去时,CPU删除第一全局变量中保存的该报文的缓存首地址和报文长度信息;
异常处理模块:当CPU异常时,根据第一全局变量中存储的所有报文的缓存首地址和报文长度信息,从缓存中读取对应的原始报文内容,将读取的原始报文内容保存到预设高端存储区域中,所述高端存储区域存储的信息在设备重启过程中不改变;
重启处理模块:当设备重启后,从高端存储区域中读取所有原始报文内容,将读取的所有原始报文内容复制到磁盘中。
一种CPU异常处理装置,该装置包括:
记录模块:当任一核接收到任一报文时,将该报文放入缓存中,将报文的缓存首地址和报文长度记录到预设的针对该核的第一全局变量中;当将报文从缓存中取出并成功发送出去时,删除第一全局变量中保存的该报文的缓存首地址和报文长度信息;
异常处理模块:当CPU异常时,根据针对各核的第一全局变量中存储的所有报文的缓存首地址和报文长度,从缓存中读取对应的原始报文内容,将读取的所有原始报文内容保存到预设高端存储区域中,所述高端存储区域存储的信息在设备重启过程中不改变;
重启处理模块:当设备重启后,从高端存储区域中读取针对各核的所有原始报文内容,将读取的所有原始报文内容复制到磁盘中。
可见,本申请实施例中,当报文(例如:畸形报文)未发送成功时,保存该未发送成功的报文的内容,当CPU异常后,将未发送成功的报文的内容保存到高端存储区域,当设备重启后,将高端存储区域中的信息复制到磁盘,这样就可从磁盘中读取到未发送成功地报文(例如:畸形报文)的内容,对该报文的内容进行针对性分析,就可提高异常定位精度。
附图说明
图1为本申请一实施例提供的CPU异常处理方法流程图;
图2为本申请另一实施例提供的多核CPU异常处理方法流程图;
图3为本申请一实施例提供的CPU异常处理装置的组成图;
图4为本申请另一实施例提供的CPU异常处理装置的组成图。
具体实施方式
下面结合附图及具体实施例对本发明再作进一步详细的说明。
为方便理解本申请实施例,首先给出以下说明:
中断和异常是使处理转向的***事件,硬件或者软件都可以检测到。
内核是这样区分中断和异常的:
1)中断是任何时刻都可能发生的与处理器当前执行无关的异步事件,主要由I/O(Input/Output,输入/输出)设备、处理器时钟或计时器产生,并且处理器能够打开或关闭对中断的响应。
2)异常是特定指令执行中产生的,使用同样的数据在相同条件下重新运行程序会再次产生异常。异常包括内存访问越界、部分调试指令和除零错误等。内核也将***服务调用视为异常。
图1为本申请一实施例提供的CPU异常处理方法流程图,其具体步骤如下:
步骤101:CPU接收到任一报文,将该报文放入缓存中,将报文的缓存首地址和报文长度记录到预设的第一全局变量中。
步骤102:CPU对报文进行业务处理,将报文的业务状态信息记录到预设的第二全局变量中,同时将报文的业务统计信息记录到预设的第三全局变量中。
业务状态信息包括:CPU对报文执行的业务的状态信息。例如:对于会话业务,可以根据报文的标识信息(如:五元组)找到对应的会话控制块,将会话控制块中的如下业务状态信息记录到第二全局变量中:
1)老化时间:多长时间该会话老化;
2)协议类型:TCP(TransmissionControlProtocol,传输控制协议)、UDP(UserDatagramProtocol,用户数据报协议)、ICMP(InternetControlMessageProtocol,因特网控制信息协议)等;
3)应用类型:FTP(FileTransferProtocol,文件传输协议)、HTTP(HyperTextTransferProtocol,超文本传输协议)、微信、QQ等;
4)ALG类型:H323、FTP、SIP(SessionInitiationProtocol,会话发起协议)、telnet、DNS(DomainNameSystem,域名***)等;
5)当前状态:具体地,
UDP类型状态有:OPEN(打开)、ESTABLISH(建立)、CLOSE(关闭)等;
TCP类型状态有:SYN_SEND(同步发送)、SYN_ACK(同步确认)、ESTABLISH(建立)、FIN_SEND(结束发送)、FIN_ACK(结束确认)、CLOSE(关闭);
6)CPU占用率:当前CPU占用率;
7)内存占用率:当前内存占用率;
8)连接数:当前会话总的数目;
9)TCP连接数:TCP连接的数目;
10)UDP连接数:当前UDP的连接数。
业务统计信息分为公共统计信息和本报文对应的控制块统计信息。例如:对于会话业务,会话的公共统计信息可包括:
1)新建速率:当前每秒钟建立会话的个数;
2)吞吐量:当前每秒钟转发报文的个数;
3)转发报文数:总的转发报文个数;
4)丢失报文数:总的丢弃报文数。
本报文对应的控制块统计信息可包括:该会话当前:发送的报文数、接收的报文数、发送的字节数、接收的字节数、丢弃的报文数。
步骤103:当CPU将报文从缓存中取出并成功发送出去时,CPU删除第一全局变量中保存的该报文的缓存首地址和报文长度信息。
当报文未被成功发送时,第一全局变量中保存的该报文的缓存首地址和报文长度信息不删除,继续保留。
步骤104:当CPU异常时,CPU从第一全局变量中读取各报文的缓存首地址和报文长度信息,根据读取的信息在缓存中查找到原始报文内容,将原始报文内容保存到预设高端存储区域中;同时,CPU从第二全局变量中读取所有业务状态信息,从第三全局变量中读取所有业务统计信息,将读取的信息保存到预设高端存储区域中。
高端存储区域中存储的信息在设备重启过程中不会改变。
步骤105:当设备重启后,CPU从高端存储区域中读取所有原始报文内容、所有业务状态信息以及所有业务统计信息,将读取的所有信息复制到磁盘中。
磁盘如:闪存(flash)等。
这样,开发人员就可以从磁盘中读取原始报文内容、业务状态信息和业务统计信息,对读取的这些信息进行分析,从而对CPU异常进行定位。
图2为本申请另一实施例提供的多核CPU异常处理方法流程图,其具体步骤如下:
步骤201:CPU的任一核接收到任一报文,将该报文放入缓存中,将报文的缓存首地址和报文长度记录到预设的针对该核的第一全局变量中。
在实际应用中,可以为所有核设一个第一全局变量数组,数组中的每个变量对应一个核。即:若有n个核,则设置一个包含n个变量的第一全局变量数组。
步骤202:CPU对报文进行业务处理,将报文的业务状态信息记录到预设的针对该核的第二全局变量中,同时将报文的业务统计信息记录到预设的针对该核的第三全局变量中。
同样地,在实际应用中,可以为所有核设一个第二全局变量数组,数组中的每个变量对应一个核。即:若有n个核,则设置一个包含n个变量的第二全局变量数组。
可以为所有核设一个第三全局变量数组,数组中的每个变量对应一个核。即:若有n个核,则设置一个包含n个变量的第三全局变量数组。
步骤203:当CPU将报文从缓存中取出并成功发送出去时,CPU删除第一全局变量中保存的该报文的缓存首地址和报文长度信息。
步骤204:当CPU异常时,CPU从针对各核的第一全局变量中读取所有报文的缓存首地址和报文长度信息,根据读取的信息在缓存中查找到原始报文内容,将原始报文内容保存到预设高端存储区域中;同时,CPU从针对各核的第二全局变量中读取所有业务状态信息,从针对各核的第三全局变量中读取所有业务统计信息,将读取的信息保存到预设高端存储区域中。
高端存储区域中存储的信息在设备重启过程中不会改变。
步骤205:当设备重启后,CPU从高端存储区域中读取所有原始报文内容、所有业务状态信息以及所有业务统计信息,将读取的所有信息复制到磁盘中。
磁盘如:闪存(flash)等。
本申请实施例的有益技术效果如下:
1)CPU保存未发送成功的报文,例如:畸形报文的内容,当CPU异常后,将未发送成功的报文,例如:畸形报文的内容保存到高端存储区域,当设备重启后,将高端存储区域中的未发送成功的报文的内容复制到磁盘,这样就可以从磁盘中读取到未发送成功的报文,例如:畸形报文的内容,对这些报文的内容进行针对性分析,就可提高异常定位精度。
2)进一步地,CPU记录报文的业务状态信息和业务统计信息,当CPU异常后,将报文的业务状态信息和业务统计信息保存到预设高端存储区域,当设备重启后,将报文的业务状态信息、业务统计信息连同未发送成功的报文的内容一起复制到磁盘,这样就可以从磁盘中读取到报文的业务状态信息、业务统计信息连同未发送成功的报文的内容,对读取的所有信息一起进行分析,就可进一步提高异常定位精度。
图3为本申请一实施例提供的CPU异常处理装置的组成示意图,该装置主要包括:记录模块、异常处理模块和重启处理模块,其中:
记录模块:接收到任一报文,将该报文放入缓存中,将报文的缓存首地址和报文长度记录到预设的第一全局变量中;当将报文从缓存中取出并成功发送出去时,CPU删除第一全局变量中保存的该报文的缓存首地址和报文长度信息。
异常处理模块:当CPU异常时,根据第一全局变量中存储的所有报文的缓存首地址和报文长度信息,从缓存中读取对应的原始报文内容,将读取的原始报文内容保存到预设高端存储区域中,所述高端存储区域存储的信息在设备重启过程中不改变。
重启处理模块:当设备重启后,从高端存储区域中读取所有原始报文内容,将读取的所有原始报文内容复制到磁盘中。
一种实施例中,记录模块接收到任一报文之后进一步用于
将报文的业务状态信息记录到预设的第二全局变量中,同时将报文的业务统计信息记录到预设的第三全局变量中;
且,异常处理模块在CPU异常之后进一步用于:
将第二全局变量中存储的所有业务状态信息和第三全局变量中存储的所有业务统计信息复制到预设高端存储区域中;
且,重启处理模块在设备重启之后进一步用于:
从高端存储区域中读取所有业务状态信息以及所有业务统计信息,将读取的所有信息复制到磁盘中。
一种实施例中,当所述业务为会话业务时,所述业务状态信息包括如下之一或任意组合:
老化时间,协议类型,应用类型,ALG类型,UDP类型状态,TCP类型状态,CPU占用率,内存占用率,会话连接数,TCP连接数,UDP连接数;
所述业务统计信息包括如下之一或任意组合:
新建速率,吞吐量,转发报文数,丢失报文数,该会话当前发送的报文数,该会话当前接收的报文数,该会话当前发送的字节数,该会话当前接收的字节数,该会话当前丢弃的报文数。
图4为本申请另一实施例提供的CPU异常处理装置的组成示意图,该装置主要包括:记录模块、异常处理模块和重启处理模块,其中:
记录模块:当任一核接收到任一报文时,将该报文放入缓存中,将报文的缓存首地址和报文长度记录到预设的针对该核的第一全局变量中;当将报文从缓存中取出并成功发送出去时,删除第一全局变量中保存的该报文的缓存首地址和报文长度信息。
异常处理模块:当CPU异常时,根据针对各核的第一全局变量中存储的所有报文的缓存首地址和报文长度,从缓存中读取对应的原始报文内容,将读取的所有原始报文内容保存到预设高端存储区域中,所述高端存储区域存储的信息在设备重启过程中不改变。
重启处理模块:当设备重启后,从高端存储区域中读取针对各核的所有原始报文内容,将读取的所有原始报文内容复制到磁盘中。
一种实施例中,记录模块在任一核接收到任一报文之后进一步用于:
将报文的业务状态信息记录到预设的针对该核的第二全局变量中,同时将报文的业务统计信息记录到预设的针对该核的第三全局变量中;
且,异常处理模块在CPU异常之后进一步用于:
将针对各核的第二全局变量中存储的所有业务状态信息和针对各核的第三全局变量中存储的所有业务统计信息复制到预设高端存储区域中;
且,重启处理模块在设备重启之后进一步用于:
从高端存储区域中读取针对各核的所有业务状态信息以及所有业务统计信息,将读取的所有信息复制到磁盘中。
一种实施例中,当所述业务为会话业务时,所述业务状态信息包括如下之一或任意组合:
老化时间,协议类型,应用类型,ALG类型,UDP类型状态,TCP类型状态,CPU占用率,内存占用率,会话连接数,TCP连接数,UDP连接数;
所述业务统计信息包括如下之一或任意组合:
新建速率,吞吐量,转发报文数,丢失报文数,该会话当前发送的报文数,该会话当前接收的报文数,该会话当前发送的字节数,该会话当前接收的字节数,该会话当前丢弃的报文数。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。

Claims (12)

1.一种CPU异常处理方法,其特征在于,该方法包括:
CPU接收到任一报文,将该报文放入缓存中,将报文的缓存首地址和报文长度记录到预设的第一全局变量中;
当CPU将报文从缓存中取出并成功发送出去时,CPU删除第一全局变量中保存的该报文的缓存首地址和报文长度信息;
当CPU异常时,CPU根据第一全局变量中存储的所有报文的缓存首地址和报文长度信息,从缓存中读取对应的原始报文内容,将读取的原始报文内容保存到预设高端存储区域中,所述高端存储区域存储的信息在设备重启过程中不改变;
当设备重启后,CPU从高端存储区域中读取所有原始报文内容,将读取的所有原始报文内容复制到磁盘中。
2.根据权利要求1所述的方法,其特征在于,所述CPU接收到任一报文之后进一步包括:
CPU对报文进行业务处理,将报文的业务状态信息记录到预设的第二全局变量中,同时将报文的业务统计信息记录到预设的第三全局变量中;
且,所述CPU异常之后进一步包括:
CPU读取第二全局变量中存储的所有业务状态信息和第三全局变量中存储的所有业务统计信息,将读取的所有信息保存到预设高端存储区域中;
且,所述设备重启之后进一步包括:
CPU从高端存储区域中读取所有业务状态信息以及所有业务统计信息,将读取的所有信息复制到磁盘中。
3.根据权利要求2所述的方法,其特征在于,当所述业务为会话业务时,所述业务状态信息包括如下之一或任意组合:
老化时间,协议类型,应用类型,应用层网关ALG类型,用户数据报协议UDP类型状态,传输控制协议TCP类型状态,CPU占用率,内存占用率,会话连接数,TCP连接数,UDP连接数;
所述业务统计信息包括如下之一或任意组合:
新建速率,吞吐量,转发报文数,丢失报文数,该会话当前发送的报文数,该会话当前接收的报文数,该会话当前发送的字节数,该会话当前接收的字节数,该会话当前丢弃的报文数。
4.一种CPU异常处理方法,其特征在于,该方法包括:
CPU的任一核接收到任一报文,将该报文放入缓存中,将报文的缓存首地址和报文长度记录到预设的针对该核的第一全局变量中;
当CPU将报文从缓存中取出并成功发送出去时,CPU删除第一全局变量中保存的该报文的缓存首地址和报文长度信息;
当CPU异常时,CPU根据针对各核的第一全局变量中存储的所有报文的缓存首地址和报文长度,从缓存中读取对应的原始报文内容,将读取的所有原始报文内容保存到预设高端存储区域中,所述高端存储区域存储的信息在设备重启过程中不改变;
当设备重启后,CPU从高端存储区域中读取针对各核的所有原始报文内容,将读取的所有原始报文内容复制到磁盘中。
5.根据权利要求4所述的方法,其特征在于,所述任一核接收到任一报文之后进一步包括:
CPU对报文进行业务处理,将报文的业务状态信息记录到预设的针对该核的第二全局变量中,同时将报文的业务统计信息记录到预设的针对该核的第三全局变量中;
且,所述CPU异常之后进一步包括:
CPU读取针对各核的第二全局变量中存储的所有业务状态信息和针对各核的第三全局变量中存储的所有业务统计信息,将读取的所有信息保存到预设高端存储区域中;
且,所述设备重启之后进一步包括:
CPU从高端存储区域中读取针对各核的所有业务状态信息以及所有业务统计信息,将读取的所有信息复制到磁盘中。
6.根据权利要求5所述的方法,其特征在于,当所述业务为会话业务时,所述业务状态信息包括如下之一或任意组合:
老化时间,协议类型,应用类型,应用层网关ALG类型,用户数据报协议UDP类型状态,传输控制协议TCP类型状态,CPU占用率,内存占用率,会话连接数,TCP连接数,UDP连接数;
所述业务统计信息包括如下之一或任意组合:
新建速率,吞吐量,转发报文数,丢失报文数,该会话当前发送的报文数,该会话当前接收的报文数,该会话当前发送的字节数,该会话当前接收的字节数,该会话当前丢弃的报文数。
7.一种CPU异常处理装置,其特征在于,该装置包括:
记录模块:接收到任一报文,将该报文放入缓存中,将报文的缓存首地址和报文长度记录到预设的第一全局变量中;当将报文从缓存中取出并成功发送出去时,CPU删除第一全局变量中保存的该报文的缓存首地址和报文长度信息;
异常处理模块:当CPU异常时,根据第一全局变量中存储的所有报文的缓存首地址和报文长度信息,从缓存中读取对应的原始报文内容,将读取的原始报文内容保存到预设高端存储区域中,所述高端存储区域存储的信息在设备重启过程中不改变;
重启处理模块:当设备重启后,从高端存储区域中读取所有原始报文内容,将读取的所有原始报文内容复制到磁盘中。
8.根据权利要求7所述的装置,其特征在于,所述记录模块接收到任一报文之后进一步用于
将报文的业务状态信息记录到预设的第二全局变量中,同时将报文的业务统计信息记录到预设的第三全局变量中;
且,所述异常处理模块在CPU异常之后进一步用于:
将第二全局变量中存储的所有业务状态信息和第三全局变量中存储的所有业务统计信息复制到预设高端存储区域中;
且,所述重启处理模块在设备重启之后进一步用于:
从高端存储区域中读取所有业务状态信息以及所有业务统计信息,将读取的所有信息复制到磁盘中。
9.根据权利要求8所述的装置,其特征在于,当所述业务为会话业务时,所述业务状态信息包括如下之一或任意组合:
老化时间,协议类型,应用类型,应用层网关ALG类型,用户数据报协议UDP类型状态,传输控制协议TCP类型状态,CPU占用率,内存占用率,会话连接数,TCP连接数,UDP连接数;
所述业务统计信息包括如下之一或任意组合:
新建速率,吞吐量,转发报文数,丢失报文数,该会话当前发送的报文数,该会话当前接收的报文数,该会话当前发送的字节数,该会话当前接收的字节数,该会话当前丢弃的报文数。
10.一种CPU异常处理装置,其特征在于,该装置包括:
记录模块:当任一核接收到任一报文时,将该报文放入缓存中,将报文的缓存首地址和报文长度记录到预设的针对该核的第一全局变量中;当将报文从缓存中取出并成功发送出去时,删除第一全局变量中保存的该报文的缓存首地址和报文长度信息;
异常处理模块:当CPU异常时,根据针对各核的第一全局变量中存储的所有报文的缓存首地址和报文长度,从缓存中读取对应的原始报文内容,将读取的所有原始报文内容保存到预设高端存储区域中,所述高端存储区域存储的信息在设备重启过程中不改变;
重启处理模块:当设备重启后,从高端存储区域中读取针对各核的所有原始报文内容,将读取的所有原始报文内容复制到磁盘中。
11.根据权利要求10所述的装置,其特征在于,所述记录模块在任一核接收到任一报文之后进一步用于:
将报文的业务状态信息记录到预设的针对该核的第二全局变量中,同时将报文的业务统计信息记录到预设的针对该核的第三全局变量中;
且,所述异常处理模块在CPU异常之后进一步用于:
将针对各核的第二全局变量中存储的所有业务状态信息和针对各核的第三全局变量中存储的所有业务统计信息复制到预设高端存储区域中;
且,所述重启处理模块在设备重启之后进一步用于:
从高端存储区域中读取针对各核的所有业务状态信息以及所有业务统计信息,将读取的所有信息复制到磁盘中。
12.根据权利要求11所述的装置,其特征在于,当所述业务为会话业务时,所述业务状态信息包括如下之一或任意组合:
老化时间,协议类型,应用类型,应用层网关ALG类型,用户数据报协议UDP类型状态,传输控制协议TCP类型状态,CPU占用率,内存占用率,会话连接数,TCP连接数,UDP连接数;
所述业务统计信息包括如下之一或任意组合:
新建速率,吞吐量,转发报文数,丢失报文数,该会话当前发送的报文数,该会话当前接收的报文数,该会话当前发送的字节数,该会话当前接收的字节数,该会话当前丢弃的报文数。
CN201510916234.5A 2015-12-10 2015-12-10 Cpu异常处理方法及装置 Active CN105589764B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510916234.5A CN105589764B (zh) 2015-12-10 2015-12-10 Cpu异常处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510916234.5A CN105589764B (zh) 2015-12-10 2015-12-10 Cpu异常处理方法及装置

Publications (2)

Publication Number Publication Date
CN105589764A true CN105589764A (zh) 2016-05-18
CN105589764B CN105589764B (zh) 2018-10-09

Family

ID=55929363

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510916234.5A Active CN105589764B (zh) 2015-12-10 2015-12-10 Cpu异常处理方法及装置

Country Status (1)

Country Link
CN (1) CN105589764B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108415729A (zh) * 2017-12-29 2018-08-17 北京智芯微电子科技有限公司 一种cpu指令异常的处理方法及装置
CN110109772A (zh) * 2018-02-01 2019-08-09 中兴通讯股份有限公司 一种cpu的重启方法、通信设备及可读存储介质
CN111159075A (zh) * 2019-12-31 2020-05-15 成都海光微电子技术有限公司 数据传输方法和数据传输装置
CN112799884A (zh) * 2021-04-14 2021-05-14 北京八角科技有限责任公司 网络数据处理***异常退出后的自动恢复方法、装置和存储介质
CN113055196A (zh) * 2019-12-28 2021-06-29 华为技术有限公司 报文处理方法、网络设备及计算机可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060224567A1 (en) * 2005-03-31 2006-10-05 Inventec Corporation Stereographic network monitoring system and method thereof
CN101150525A (zh) * 2007-11-20 2008-03-26 杭州华三通信技术有限公司 缓存地址释放方法、***及逻辑模块
CN101277224A (zh) * 2008-05-26 2008-10-01 杭州华三通信技术有限公司 异常报文接入点的定位方法和装置
CN104394099A (zh) * 2014-12-08 2015-03-04 福建星网锐捷网络有限公司 一种报文传输方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060224567A1 (en) * 2005-03-31 2006-10-05 Inventec Corporation Stereographic network monitoring system and method thereof
CN101150525A (zh) * 2007-11-20 2008-03-26 杭州华三通信技术有限公司 缓存地址释放方法、***及逻辑模块
CN101277224A (zh) * 2008-05-26 2008-10-01 杭州华三通信技术有限公司 异常报文接入点的定位方法和装置
CN104394099A (zh) * 2014-12-08 2015-03-04 福建星网锐捷网络有限公司 一种报文传输方法及装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108415729A (zh) * 2017-12-29 2018-08-17 北京智芯微电子科技有限公司 一种cpu指令异常的处理方法及装置
CN110109772A (zh) * 2018-02-01 2019-08-09 中兴通讯股份有限公司 一种cpu的重启方法、通信设备及可读存储介质
CN110109772B (zh) * 2018-02-01 2024-06-11 中兴通讯股份有限公司 一种cpu的重启方法、通信设备及可读存储介质
CN113055196A (zh) * 2019-12-28 2021-06-29 华为技术有限公司 报文处理方法、网络设备及计算机可读存储介质
CN111159075A (zh) * 2019-12-31 2020-05-15 成都海光微电子技术有限公司 数据传输方法和数据传输装置
CN111159075B (zh) * 2019-12-31 2021-11-05 成都海光微电子技术有限公司 数据传输方法和数据传输装置
CN112799884A (zh) * 2021-04-14 2021-05-14 北京八角科技有限责任公司 网络数据处理***异常退出后的自动恢复方法、装置和存储介质
CN112799884B (zh) * 2021-04-14 2021-08-03 北京八角科技有限责任公司 网络数据处理***异常退出后的自动恢复方法、装置和存储介质

Also Published As

Publication number Publication date
CN105589764B (zh) 2018-10-09

Similar Documents

Publication Publication Date Title
CN105589764A (zh) Cpu异常处理方法及装置
US10509585B2 (en) Data synchronization method, apparatus, and system
US9129058B2 (en) Application monitoring through continuous record and replay
US9237164B2 (en) Systems and methods for capturing, replaying, or analyzing time-series data
CN109479013B (zh) 计算机网络中的业务的日志记录
CN109976973B (zh) 一种小程序线上异常监控方法及电子设备
CN111800490B (zh) 获取网络行为数据的方法、装置及终端设备
US9218266B2 (en) Systems and methods for replication of test results in a network environment
US10031948B1 (en) Idempotence service
US11917023B2 (en) Fast session restoration for latency sensitive middleboxes
US9626328B1 (en) Method and system for on-demand aggregated logging for distributed systems
US20170187731A1 (en) Information processing system, information processing method and program
CN110688245B (zh) 信息获取方法、装置、存储介质及设备
CN111949511A (zh) 应用程序的卡顿处理方法、装置、终端及存储介质
CN110879773A (zh) 一种基于CGroup的内存监控方法和装置
WO2017197982A1 (zh) 报文处理方法、装置及***和计算机存储介质
US8880957B2 (en) Facilitating processing in a communications environment using stop signaling
CN117093325A (zh) 虚拟机高可用实现方法、设备及计算机可读介质
US8171345B2 (en) Disablement of an exception generating operation of a client system
CN105610639A (zh) 全量日志抓取方法及装置
CN103746860A (zh) 一种虚拟化环境下的网络监控***及其方法
US11665262B2 (en) Analyzing network data for debugging, performance, and identifying protocol violations using parallel multi-threaded processing
JP6303913B2 (ja) 通信装置
KR102156600B1 (ko) 네트워크에서 수집된 패킷과 엔드포인트 컴퓨팅 장치의 프로세스 간의 연관관계를 생성하는 시스템 및 방법
Bharkad et al. Optimizing root cause analysis time using smart logging framework for unix and gnu/linux based operating system

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 310052 Binjiang District Changhe Road, Zhejiang, China, No. 466, No.

Applicant after: Xinhua three Technology Co., Ltd.

Address before: 310052 Binjiang District Changhe Road, Zhejiang, China, No. 466, No.

Applicant before: Huasan Communication Technology Co., Ltd.

GR01 Patent grant
GR01 Patent grant