CN102904685A - 一种硬件表项校验错误的处理方法及装置 - Google Patents

一种硬件表项校验错误的处理方法及装置 Download PDF

Info

Publication number
CN102904685A
CN102904685A CN2012103748157A CN201210374815A CN102904685A CN 102904685 A CN102904685 A CN 102904685A CN 2012103748157 A CN2012103748157 A CN 2012103748157A CN 201210374815 A CN201210374815 A CN 201210374815A CN 102904685 A CN102904685 A CN 102904685A
Authority
CN
China
Prior art keywords
hardware table
error
table entry
check
hardware
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012103748157A
Other languages
English (en)
Other versions
CN102904685B (zh
Inventor
刘如冰
许诚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New H3C Information Technologies Co Ltd
Original Assignee
Hangzhou H3C Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou H3C Technologies Co Ltd filed Critical Hangzhou H3C Technologies Co Ltd
Priority to CN201210374815.7A priority Critical patent/CN102904685B/zh
Publication of CN102904685A publication Critical patent/CN102904685A/zh
Application granted granted Critical
Publication of CN102904685B publication Critical patent/CN102904685B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种硬件表项校验错误的处理方法,该方法包括:从器件的校验信息寄存器中获取该器件的硬件表项校验错误信息;根据所述硬件表项检验错误信息,判断预设时间长度内所述硬件表项校验错误信息中地址出错的次数是否超过门限值;当判断为是时,确定所述器件出现故障,否则,确定所述器件未出现故障;当确定所述器件出现故障时,根据所述硬件表项校验错误信息确定出错硬件表项的索引;根据所述出错硬件表项的索引查询对应的软件表项,并根据查询到的软件表项刷新所述出错硬件表项,确定在第二预设时间内所述器件的校验信息寄存器未记录新的硬件表项校验错误信息,则保持所述器件工作状态。在本发明中,提高了***的可靠性和可维护性。

Description

一种硬件表项校验错误的处理方法及装置
技术领域
本发明涉及通信领域,尤其涉及一种硬件表项校验错误的处理方法及装置。
背景技术
ECC(Error Correcting Code,错误检查和纠正)内存是指应用了EEC技术的内存,一般多应用于服务器及图形工作站上,以使整个电脑工作***在工作时更趋于安全稳定。
在EEC技术出现之前,内存中应用最多的技术为Parity(奇偶校验)技术。在数字电路中,最小的数据单位为比特(bit),也叫数据“位”,比特也是内存中的最小单位,它是通过“1”和“0”来表示数据高、低电平信号的。在数字电路中8个连续的比特是一个字节(byte)。在不带“奇偶校验”的内存中每个字节只有8位,若它的某一位存储出现了错误,就会使其中存储的相应数据发生改变而导致应用程序发生错误。而带有“奇偶校验”的内存在每一字节(8位)之外又额外增加了一位用来进行错误检测。比如一个字节中存储了某一数值(1、0、1、0、1、0、1、1),把每一位相加起来(1+0+1+0+1+0+1+1=5)。若其结果为奇数,对于偶校验,校验位就定义为1,反之则定位为0;对于奇校验,则相反。当CPU返回读取存储的数据时,它会再次相加前8位中存储的数据,计算结果是否与校验位相一致。当CPU发现二者不一致时就会尝试纠正这些错误。但Parity的不足是:当内存查到某个数据位有错误时,却并不一定能确定在哪一个位,也就不一定能修正错误。所以带有奇偶校验的内存的主要功能仅仅是“发现错误”,并能纠正部分简单的错误。
通过上面的分析我们知道,Parity内存是通过在原来数据位的基础上增加一个数据位来检查当前8位数据的正确性,但随着数据位的增加Parity用来检验的数据位也成倍增加,就是说当数据位为16位时它需要增加2位用于检查,当数据位为32位时则需增加4位,依此类推。特别是当数据量非常大时,数据出错的几率也就越大,对于只能纠正简单错误的奇偶检验的方法就显得无法满足需求了,正是基于这样一种情况,一种新的内存技术应运而生了,这就是ECC内存,这种内存技术也是在原来的数据位上外加校验位来实现的。不同的是两者增加的方法不一样,这也就导致了两者的主要功能不太一样。它与Parity不同的是如果数据位是8位,则需要增加5位来进行错误检查和纠正,数据位每增加一倍,ECC只增加一位检验位,也就是说当数据位为16位时ECC位为6位,32位时ECC位为7位,数据位为64位时ECC位为8位,依此类推,数据位每增加一倍,ECC位只增加一位。总之,在内存中ECC能够容许错误,并可以将错误更正,使***得以持续正常的操作,不致因错误而中断,且ECC具有比Parity更先进的自动识别、更正的能力,可以将Parity无法检查出来的错误位查出并将错误修正,但ECC仅能纠正单个比特的错误,当错误位超过一个比特,则无法进行纠正。
硬件表项可以保存在转发芯片内部的寄存器中,也可以保存在转发芯片内部或外挂RAM(Random Access Memory,随机存取存储器)中,且可以占用32bits,或多个32bits,其作用为指导报文的转发。
硬件表项下发到硬件过程中会产生奇偶校验或ECC值下发到器件中,不同器件可以使用不同的硬件表项校验错误方法。在报文转发过程中,读取此表项并对比校验值是否与原来的值相同。如果不相同,则确定数据发生错误。
当前硬件表项校验方法已经广泛应用到各个器件中,但是由于Parity不能纠正错误,而ECC也仅能纠正单个比特的错误,现有技术中,并没有提供一种检测到硬件表项校验错误后的恢复机制,导致检测到硬件表项校验错误后必须更换整个转发板卡。
发明内容
本发明提供一种硬件表项校验错误的处理方法及装置,以提高***的可靠性和可维护性。
为了达到以上目的,本发明实施例提供了一种硬件表项校验错误的处理方法,包括:
获取器件的校验信息寄存器记录的该器件的硬件表项校验错误信息;其中,所述硬件表项校验错误信息包括出错硬件表项的地址和出错次数;
确定第一预设时间内所述硬件表项校验错误信息中出错硬件表项的出错次数超过门限值,则根据该出错硬件表项的地址确定该出错硬件表项的索引;
根据所述出错硬件表项的索引查询对应的软件表项,并根据查询到的软件表项刷新所述出错硬件表项;
确定在第二预设时间内所述器件的校验信息寄存器未记录新的硬件表项校验错误信息,则保持所述器件工作状态。
其中,所述根据所述硬件表项校验错误信息确定出错硬件表项的索引,具体通过以下公式实现:
Figure BDA00002215452600031
其中,
Figure BDA00002215452600032
为对(*)进行向下取整,i为出错硬件表项的索引,AD0为硬件表项在内存中的起始地址,AD1为出错次数超过阈值的出错硬件表项的地址,S为硬件表项的大小,单位为字节。
其中,当所述出现故障的器件具有复位功能时,该方法还包括:
确定所述第二预设时间内所述器件的校验信息寄存器记录了新的硬件表项校验错误信息,则触发所述出现故障的器件进行复位;或,
确定所述第二预设时间内所述器件的校验信息寄存器记录了新的硬件表项校验错误信息,则对所述出现故障的器件进行下电处理,并重新上电。
其中,当所述出现故障的器件具有复位功能时,该方法还包括:
确定所述第二预设时间内所述器件的校验信息寄存器记录了新的硬件表项校验错误信息,则触发所述出现故障的器件进行复位;
当所述故障仍未被修复时,对所述出现故障的器件进行下电处理,并重新上电。
其中,该方法还包括:
确定所述第二预设时间内所述器件的校验信息寄存器记录了新的硬件表项校验错误信息,则提示用户所述器件故障。
本发明实施例还提供了一种硬件表项校验错误的处理装置,包括:
获取模块,用于获取器件的校验信息寄存器记录的该器件的硬件表项校验错误信息;其中,所述硬件表项校验错误信息包括出错硬件表项的地址和出错次数;
故障检测模块,确定第一预设时间长度内所述硬件表项校验错误信息中出错硬件表项的出错次数是否超过门限值;
故障修复模块,用于当所述故障检测模块确定第一预设时间长度内所述硬件表项校验错误信息中出错硬件表项的出错次数超过门限值时,根据该出错硬件表项的地址确定该出错硬件表项的索引;根据所述出错硬件表项的索引查询对应的软件表项,并根据查询到的软件表项刷新所述出错硬件表项;确定在第二预设时间内所述器件的校验信息寄存器未记录新的硬件表项校验错误信息,则保持所述器件工作状态。
其中,所述故障修复模块具体用于,通过以下公式实现根据所述硬件表项校验错误信息确定出错硬件表项的索引:
Figure BDA00002215452600041
其中,
Figure BDA00002215452600042
为对(*)进行向下取整,i为出错硬件表项的索引,AD0为硬件表项在内存中的起始地址,AD1为出错次数超过阈值的出错硬件表项的地址,S为硬件表项的大小,单位为字节。
其中,当所述出现故障的器件具有复位功能时,
所述故障修复模块还用于,确定所述器件的校验信息寄存器记录了新的硬件表项校验错误信息,则触发所述出现故障的器件进行复位;或,确定所述第二预设时间内所述器件的校验信息寄存器记录了新的硬件表项校验错误信息,则对所述出现故障的器件进行下电处理,并重新上电。
其中,当所述出现故障的器件具有复位功能时,
所述故障修复模块还用于,确定所述第二预设时间内所述器件的校验信息寄存器记录了新的硬件表项校验错误信息,则触发所述出现故障的器件进行复位;当所述故障仍未被修复时,对所述出现故障的器件进行下电处理,并重新上电。
其中,所述故障修复模块还用于,确定所述第二预设时间内所述器件的校验信息寄存器记录了新的硬件表项校验错误信息,则提示用户所述器件故障。
本发明上述实施例中,通过获取器件的校验信息寄存器记录的该器件的硬件表项校验错误信息,确定第一预设时间长度内所述硬件表项校验错误信息中出错硬件表项的出错次数超过门限值;则根据该出错硬件表项的地址确定该出错硬件表项的索引;根据所述出错硬件表项的索引查询对应的软件表项,并根据查询到的软件表项刷新所述出错硬件表项,保持所述器件工作状态,以提高***的可靠性和可维护性。
附图说明
图1为本发明实施例提供的一种硬件表项校验错误的处理方法的流程示意图;
图2为本发明实施例提供的一种硬件表项出错地址示意图;
图3为本发明实施例提供的一种硬件表项校验错误的处理装置的结构示意图。
具体实施方式
针对现有技术中存在的上述问题,本发明实施例提供了一种硬件表项校验错误的处理的技术方案。在该技术方案中,通过获取器件的校验信息寄存器记录的该器件的硬件表项校验错误信息,确定第一预设时间长度内所述硬件表项校验错误信息中出错硬件表项的出错次数超过门限值,则根据该出错硬件表项的地址确定该出错硬件表项的索引;根据所述出错硬件表项的索引查询对应的软件表项,并根据查询到的软件表项刷新所述出错硬件表项,确定在第二预设时间内所述器件的校验信息寄存器未记录新的硬件表项校验错误信息,则保持所述器件工作状态,保持所述器件工作状态,以提高***的可靠性和可维护性。
下面将结合本发明的实施例中的附图,对本发明的实施例中的技术方案进行清楚、完整的描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明的实施例保护的范围。
如图1所示,为本发明实施例提供的一种硬件表项校验错误的处理方法的流程示意图,可以包括以下步骤:
步骤101、获取硬件表项校验错误信息,并根据获取到的硬件表项校验错误信息确定对应器件是否出现故障。
具体的,由于支持硬件错误校验功能的器件通常均设置有对应的校验错误寄存器,用于存储对应器件的硬件表项校验错误信息,因此,在本发明实施例中,可以从各器件的校验错误寄存器中获取相应器件的硬件表项校验错误信息,并根据获取到的硬件表项校验错误信息确定对应的器件是否出现故障。其中,校验错误寄存器中记录的硬件表项校验错误信息可以包括出错硬件表项的的地址以及出错次数等信息。
在实际应用中,可以每隔一定的时间(周期性地)从器件的校验错误寄存器中获取对应器件的硬件表项校验错误信息,以一定的查询次数为一个轮询周期,当一个轮询周期中,出错硬件表项的出错次数超过门限值后,则确定器件出现故障。
其中,对于影响转发的故障器件(以转发芯片为例),可以增加丢包率的计算。通过当前错包平均速率(PPS(Packet per Second,数据包每秒))与转发芯片的转发平均速率(PPS),得到丢包率。以一定时间(如1S)为一个检测周期,统计检测周期内的丢包率,若连续N个检测周期中丢包率均高于预设门限,则确定转发芯片故障。其中,N为正整数。
例如,在一个检测周期(1S)内错包平均速率为1100PSS,而转发芯片的转发平均速率为10000PSS,则该检测周期内丢包率为11%(1100/10000=11%)。若丢包率门限值为10%,则该检测周期内丢包率高于门限值。若定义连续检测周期为8S,且该连续检测周期中每次检测得到的丢包率均大于10%,则确定转发芯片出现故障。
步骤102、当确定器件出现故障时,对该器件进行故障修复,并当所述故障修复成功后,保持所述器件工作状态。
具体的,在现有技术中,当检测到硬件表项校验错误时,通常的处理方式为直接更换器件。但是,实际情况中,除了由硬件故障导致的硬件表项校验错误有必要更换器件之外,许多由其它因素(如宇宙射线)导致的硬件表项校验错误是可以通过一定方法实现故障修复的。
为了提高***可靠性和可维护性,在本发明实施例提供的技术方案中,当确定器件出现故障后,可以通过以方法对其进行故障修复:
方法1、硬件表项刷新机制
由于硬件表项一般是由对应的软件表项复制而来,因此当检测到硬件表项校验错误,且确定器件出现故障时,可以根据出错硬件表项的地址确定出错硬件表项的索引,进而根据该索引查询对应的软件表项,并根据查询到的软件表项对该硬件表项进行刷新。
具体的,在本发明实施例中,当确定器件出现故障后,可以根据获取到的硬件表项校验错误信息中包括的出错硬件表项的地址确定出错表项的索引,进而根据该索引查询对应的软件表项,并以查询到的软件表项的内容刷新硬件表项,以纠正硬件表项的校验错误。
其中,根据出错硬件表项的地址确定出错硬件表项的索引,可以具体通过以下公式实现:
Figure BDA00002215452600081
其中,
Figure BDA00002215452600082
为对(*)进行向下取整,i为出错硬件表项的索引,AD0为硬件表项在内存中的起始地址,AD1为出错次数超过阈值出错硬件表项的地址,S为硬件表项的大小,单位为字节。
例如,以一个硬件表项在内存中占用4个32bits的空间(即一个硬件表项为16Byte(字节))为例。如图2所示,该硬件表项的内存基址(即硬件表项在内存中的起始地址)为0x40000000,0x40080000为表项的结尾,即内存中这一段给硬件表项使用(硬件表项的索引依次为0、1、2...)。若硬件表项校验错误信息确定地址0x40000008的出错次数超过阈值,则出错硬件表项的索引为:
Figure BDA00002215452600083
则0为出错硬件表项的索引,根据该索引找到对应的软件表项,并根据该软件表项中的内容刷新该出错硬件表项。
方法2、器件复位机制
由于器件复位可以使该器件的部分寄存器或全部寄存器重新初始化,所有软件表项重新下发。因此,当检测到硬件表项校验错误时,可以通过器件复位对器件的硬件表项进行刷新,以对器件进行故障修复。
具体的,在本发明实施例中,若器件提供复位功能,则当确定器件出现故障后,可以触发器件复位,以使该器件的部分寄存器或全部寄存器重新初始化,所有软件表项重新下发,以修复硬件表项的校验错误。
方法3、掉电复位(冷复位)机制
由于当器件经历掉电以及重新上电后,器件的全部寄存器均会重新初始化,所有的软件表项重新下发。因此,当检测到硬件表项校验错误时,可以通过掉电复位对器件的硬件表项进行刷新,以对器件进行故障修复。
其中,本发明实施例提供的上述三种器件故障修复方法中,由于硬件表项刷新机制仅对所确定出的出错的硬件表项进行刷新,器件复位机制则通过器件复位对部分或全部寄存器中的硬件表项均进行刷新,掉电复位则对故障器件(以及与故障器件共用电源的其他器件)的全部寄存器中的硬件表项均进行刷新。因此,这三种故障修复方法修复器件故障的成功的可能性依次增加,但对业务可用性的影响也逐渐增加。
在本发明实施例中,当检测到硬件表项校验错误,并确定器件出现故障后,可以依次使用上述三种方法进行故障修复,直至故障修复成功。即当出现器件故障时,可以首先使用硬件表项刷新机制进行故障修复,并当硬件表项刷新机制失败时,使用器件复位机制进行故障修复,当器件复位机制也失败时,使用掉电复位机制进行故障修复。若进行掉电复位后,器件故障仍未修复,则可以提示用户器件故障,更换相关器件。其中,在本发明实施例中,可以通过预设时间长度内,器件的校验信息寄存器是否记录了新的硬件表项校验错误信息确定故障修复是否成功;当预设时间长度内,器件的校验信息寄存器记录了新的硬件表项校验错误信息时,确定故障修复未成功;当预设时间长度内,器件的校验信息寄存器未记录新的硬件表项校验错误信息时,确定故障修复未成功。
应该认识到,依次执行上述三种故障修复方法的实施方式仅仅是本发明实施例提供的技术方案的一种具体实例,而并不是对本发明保护范围的限定。即在本发明实施例提供的技术方案中,也可以在确定器件故障后,直接使用第二种方法(器件复位机制)或第三种方法(掉电复位机制)进行故障修复,或者,先使用第二种方法进行故障修复,并在失败后,使用第三种方法进行故障修复。本领域技术人员在本发明实施例提供的故障修复方法的基础上,在不付出创造性劳动前提下进行的变型,以及对各方法使用顺序的改变均应属于本发明的保护范围。
进一步地,在本发明实施例中,为了尽可能保证业务的可用性,若依次使用了上述三种修复方法进行故障修复,且故障仍未被修复,则在一定时间内(该时间可以根据业务运行情况确定)不再进行对该故障的修复流程。
通过以上描述可以看出,在本发明实施例中,通过获取硬件表项校验错误确定相应器件是否出现故障,并当器件出现故障时,对该器件进行故障修复,提高了***的可靠性和可维护性。
基于上述方法实施例相同的技术构思,本发明实施例还提供了一种硬件表项校验错误的处理装置,可以应用于上述方法流程。
如图3所示,为本发明实施例提供的一种硬件表项校验错误的处理装置的结构示意图,可以包括:
获取模块31,用于获取器件的校验信息寄存器记录的该器件的硬件表项校验错误信息;其中,所述硬件表项校验错误信息包括出错硬件表项的地址和出错次数;
故障检测模块32,确定第一预设时间长度内所述硬件表项校验错误信息中出错硬件表项的出错次数是否超过门限值;
故障修复模块33,用于当所述故障检测模块32确定第一预设时间长度内所述硬件表项校验错误信息中出错硬件表项的出错次数超过门限值时,根据该出错硬件表项的地址确定该出错硬件表项的索引;根据所述出错硬件表项的索引查询对应的软件表项,并根据查询到的软件表项刷新所述出错硬件表项;确定在第二预设时间内所述器件的校验信息寄存器未记录新的硬件表项校验错误信息,则保持所述器件工作状态。
其中,所述故障修复模块33具体用于,通过以下公式实现根据所述硬件表项校验错误信息确定出错硬件表项的索引:
Figure BDA00002215452600101
其中,
Figure BDA00002215452600102
为对(*)进行向下取整,i为出错硬件表项的索引,AD0为硬件表项在内存中的起始地址,AD1为出错次数超过阈值的出错硬件表项的地址,S为硬件表项的大小,单位为字节。
其中,当所述出现故障的器件具有复位功能时,
所述故障修复模块33还用于,确定所述器件的校验信息寄存器记录了新的硬件表项校验错误信息,则触发所述出现故障的器件进行复位;或,确定所述第二预设时间内所述器件的校验信息寄存器记录了新的硬件表项校验错误信息,则对所述出现故障的器件进行下电处理,并重新上电。
其中,当所述出现故障的器件具有复位功能时,
所述故障修复模块还用于,确定所述第二预设时间内所述器件的校验信息寄存器记录了新的硬件表项校验错误信息,则触发所述出现故障的器件进行复位;当所述故障仍未被修复时,对所述出现故障的器件进行下电处理,并重新上电。
其中,所述故障修复模块33还用于,确定所述第二预设时间内所述器件的校验信息寄存器记录了新的硬件表项校验错误信息,则提示用户所述器件故障。
本领域技术人员可以理解实施例中的装置中的模块可以按照实施例描述进行分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台终端设备(可以是手机,个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视本发明的保护范围。

Claims (10)

1.一种硬件表项校验错误的处理方法,其特征在于,包括:
获取器件的校验信息寄存器记录的该器件的硬件表项校验错误信息;其中,所述硬件表项校验错误信息包括出错硬件表项的地址和出错次数;
确定第一预设时间内所述硬件表项校验错误信息中出错硬件表项的出错次数超过门限值,则根据该出错硬件表项的地址确定该出错硬件表项的索引;
根据所述出错硬件表项的索引查询对应的软件表项,并根据查询到的软件表项刷新所述出错硬件表项;
确定在第二预设时间内所述器件的校验信息寄存器未记录新的硬件表项校验错误信息,则保持所述器件工作状态。
2.如权利要求1所述的方法,其特征在于,所述根据所述硬件表项校验错误信息确定出错硬件表项的索引,具体通过以下公式实现:
其中,
Figure FDA00002215452500012
为对(*)进行向下取整,i为出错硬件表项的索引,AD0为硬件表项在内存中的起始地址,AD1为出错次数超过阈值的出错硬件表项的地址,S为硬件表项的大小,单位为字节。
3.如权利要求1所述的方法,其特征在于,当所述出现故障的器件具有复位功能时,该方法还包括:
确定所述第二预设时间内所述器件的校验信息寄存器记录了新的硬件表项校验错误信息,则触发所述出现故障的器件进行复位;或,
确定所述第二预设时间内所述器件的校验信息寄存器记录了新的硬件表项校验错误信息,则对所述出现故障的器件进行下电处理,并重新上电。
4.如权利要求1所述的方法,其特征在于,当所述出现故障的器件具有复位功能时,该方法还包括:
确定所述第二预设时间内所述器件的校验信息寄存器记录了新的硬件表项校验错误信息,则触发所述出现故障的器件进行复位;
当所述故障仍未被修复时,对所述出现故障的器件进行下电处理,并重新上电。
5.如权利要求1所述的方法,其特征在于,该方法还包括:
确定所述第二预设时间内所述器件的校验信息寄存器记录了新的硬件表项校验错误信息,则提示用户所述器件故障。
6.一种硬件表项校验错误的处理装置,其特征在于,包括:
获取模块,用于获取器件的校验信息寄存器记录的该器件的硬件表项校验错误信息;其中,所述硬件表项校验错误信息包括出错硬件表项的地址和出错次数;
故障检测模块,确定第一预设时间长度内所述硬件表项校验错误信息中出错硬件表项的出错次数是否超过门限值;
故障修复模块,用于当所述故障检测模块确定第一预设时间长度内所述硬件表项校验错误信息中出错硬件表项的出错次数超过门限值时,根据该出错硬件表项的地址确定该出错硬件表项的索引;根据所述出错硬件表项的索引查询对应的软件表项,并根据查询到的软件表项刷新所述出错硬件表项;确定在第二预设时间内所述器件的校验信息寄存器未记录新的硬件表项校验错误信息,则保持所述器件工作状态。
7.如权利要求6所述的装置,其特征在于,所述故障修复模块具体用于,通过以下公式实现根据所述硬件表项校验错误信息确定出错硬件表项的索引:
其中,为对(*)进行向下取整,i为出错硬件表项的索引,AD0为硬件表项在内存中的起始地址,AD1为出错次数超过阈值的出错硬件表项的地址,S为硬件表项的大小,单位为字节。
8.如权利要求6所述的装置,其特征在于,当所述出现故障的器件具有复位功能时,
所述故障修复模块还用于,确定所述器件的校验信息寄存器记录了新的硬件表项校验错误信息,则触发所述出现故障的器件进行复位;或,确定所述第二预设时间内所述器件的校验信息寄存器记录了新的硬件表项校验错误信息,则对所述出现故障的器件进行下电处理,并重新上电。
9.如权利要求6所述的装置,其特征在于,当所述出现故障的器件具有复位功能时,
所述故障修复模块还用于,确定所述第二预设时间内所述器件的校验信息寄存器记录了新的硬件表项校验错误信息,则触发所述出现故障的器件进行复位;当所述故障仍未被修复时,对所述出现故障的器件进行下电处理,并重新上电。
10.如权利要求6所述的装置,其特征在于,
所述故障修复模块还用于,确定所述第二预设时间内所述器件的校验信息寄存器记录了新的硬件表项校验错误信息,则提示用户所述器件故障。
CN201210374815.7A 2012-09-29 2012-09-29 一种硬件表项校验错误的处理方法及装置 Active CN102904685B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210374815.7A CN102904685B (zh) 2012-09-29 2012-09-29 一种硬件表项校验错误的处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210374815.7A CN102904685B (zh) 2012-09-29 2012-09-29 一种硬件表项校验错误的处理方法及装置

Publications (2)

Publication Number Publication Date
CN102904685A true CN102904685A (zh) 2013-01-30
CN102904685B CN102904685B (zh) 2016-04-27

Family

ID=47576743

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210374815.7A Active CN102904685B (zh) 2012-09-29 2012-09-29 一种硬件表项校验错误的处理方法及装置

Country Status (1)

Country Link
CN (1) CN102904685B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106776107A (zh) * 2016-11-30 2017-05-31 迈普通信技术股份有限公司 一种奇偶校验纠错方法及网络设备
CN107040391A (zh) * 2015-07-28 2017-08-11 北京华为数字技术有限公司 一种故障检测方法及转发设备
CN107317755A (zh) * 2017-08-23 2017-11-03 普联技术有限公司 一种硬件转发表项纠错方法、装置及计算机可读存储介质
CN108121632A (zh) * 2016-11-30 2018-06-05 中兴通讯股份有限公司 一种单板电源的保护方法及装置
CN108227671A (zh) * 2017-12-06 2018-06-29 珠海格力电器股份有限公司 一种设备控制参数的更新方法、装置、存储介质及终端
CN109086160A (zh) * 2018-07-18 2018-12-25 天津芯海创科技有限公司 表项校验装置
CN113037539A (zh) * 2021-02-05 2021-06-25 新华三信息安全技术有限公司 一种故障定位方法及装置
CN113625696A (zh) * 2021-08-31 2021-11-09 东风商用车有限公司 车载控制器过流保护的安全处理方法及***
CN115061852A (zh) * 2022-08-15 2022-09-16 广东科伺智能科技有限公司 功能板卡、功能板卡的生产***及伺服***的使用方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1494279A (zh) * 2002-11-02 2004-05-05 华为技术有限公司 一种快速计算ip报文头校验和的方法
CN1501645A (zh) * 2002-11-19 2004-06-02 ��Ϊ�������޹�˾ 提高网络带宽利用率的方法
CN1794695A (zh) * 2005-12-28 2006-06-28 杭州华为三康技术有限公司 一种刷新硬件表项的方法
CN101155123A (zh) * 2006-09-26 2008-04-02 华为技术有限公司 一种保证转发表项可靠性的方法及装置、及一种转发设备
CN101883038A (zh) * 2010-06-30 2010-11-10 中兴通讯股份有限公司 Eaps环网保护倒换的方法及eaps环网中的主节点

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1494279A (zh) * 2002-11-02 2004-05-05 华为技术有限公司 一种快速计算ip报文头校验和的方法
CN1501645A (zh) * 2002-11-19 2004-06-02 ��Ϊ�������޹�˾ 提高网络带宽利用率的方法
CN1794695A (zh) * 2005-12-28 2006-06-28 杭州华为三康技术有限公司 一种刷新硬件表项的方法
CN101155123A (zh) * 2006-09-26 2008-04-02 华为技术有限公司 一种保证转发表项可靠性的方法及装置、及一种转发设备
CN101883038A (zh) * 2010-06-30 2010-11-10 中兴通讯股份有限公司 Eaps环网保护倒换的方法及eaps环网中的主节点

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107040391A (zh) * 2015-07-28 2017-08-11 北京华为数字技术有限公司 一种故障检测方法及转发设备
CN106776107A (zh) * 2016-11-30 2017-05-31 迈普通信技术股份有限公司 一种奇偶校验纠错方法及网络设备
CN108121632A (zh) * 2016-11-30 2018-06-05 中兴通讯股份有限公司 一种单板电源的保护方法及装置
CN106776107B (zh) * 2016-11-30 2019-07-16 迈普通信技术股份有限公司 一种奇偶校验纠错方法及网络设备
CN107317755A (zh) * 2017-08-23 2017-11-03 普联技术有限公司 一种硬件转发表项纠错方法、装置及计算机可读存储介质
CN108227671A (zh) * 2017-12-06 2018-06-29 珠海格力电器股份有限公司 一种设备控制参数的更新方法、装置、存储介质及终端
CN109086160A (zh) * 2018-07-18 2018-12-25 天津芯海创科技有限公司 表项校验装置
CN109086160B (zh) * 2018-07-18 2021-11-05 天津芯海创科技有限公司 表项校验装置
CN113037539A (zh) * 2021-02-05 2021-06-25 新华三信息安全技术有限公司 一种故障定位方法及装置
CN113625696A (zh) * 2021-08-31 2021-11-09 东风商用车有限公司 车载控制器过流保护的安全处理方法及***
CN115061852A (zh) * 2022-08-15 2022-09-16 广东科伺智能科技有限公司 功能板卡、功能板卡的生产***及伺服***的使用方法

Also Published As

Publication number Publication date
CN102904685B (zh) 2016-04-27

Similar Documents

Publication Publication Date Title
CN102904685B (zh) 一种硬件表项校验错误的处理方法及装置
US9747148B2 (en) Error monitoring of a memory device containing embedded error correction
CN115629905B (zh) 一种内存故障预警方法、装置、电子设备及可读介质
US8707122B1 (en) Nonvolatile memory controller with two-stage error correction technique for enhanced reliability
US9940457B2 (en) Detecting a cryogenic attack on a memory device with embedded error correction
CN102567134B (zh) 存储器模块的错误检查与校正***以及方法
EP2857971B1 (en) Method and device for repairing error data
KR102143353B1 (ko) 메모리 소자로부터 액세스된 데이터의 오류를 정정하는 장치 및 방법
CN205881469U (zh) 电子设备和用于具有经受瞬态故障和永久故障的多个存储器位置的存储器的故障检测设备
US20120173936A1 (en) Channel marking for chip mark overflow and calibration errors
US8181094B2 (en) System to improve error correction using variable latency and associated methods
US20150067437A1 (en) Apparatus, method and system for reporting dynamic random access memory error information
US9208027B2 (en) Address error detection
CN103703447B (zh) Mram场的干扰检测和恢复
US9189330B2 (en) Stale data detection in marked channel for scrub
CN112579327B (zh) 一种故障检测方法、装置及设备
US9626242B2 (en) Memory device error history bit
CN112506730A (zh) 适用于网络交换芯片ecc功能验证的验证平台及验证方法
US20070260962A1 (en) Methods and apparatus for a memory device with self-healing reference bits
US6519736B1 (en) Generating special uncorrectable error codes for failure isolation
US9280301B2 (en) Method and device for recovering erroneous data
CN111857603A (zh) 数据处理方法及相关装置
US9354970B2 (en) Method and apparatus for encoding erroneous data in an error correction code protected memory
CN105575439B (zh) 一种存储单元失效纠错的方法及存储器
CN116893923A (zh) 内存报错导致宕机的问题处理方法、装置、设备及介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP03 Change of name, title or address

Address after: 310052 Binjiang District Changhe Road, Zhejiang, China, No. 466, No.

Patentee after: NEW H3C TECHNOLOGIES Co.,Ltd.

Address before: 310053 Hangzhou hi tech Industrial Development Zone, Zhejiang province science and Technology Industrial Park, No. 310 and No. six road, HUAWEI, Hangzhou production base

Patentee before: HANGZHOU H3C TECHNOLOGIES Co.,Ltd.

CP03 Change of name, title or address
TR01 Transfer of patent right

Effective date of registration: 20230620

Address after: 310052 11th Floor, 466 Changhe Road, Binjiang District, Hangzhou City, Zhejiang Province

Patentee after: H3C INFORMATION TECHNOLOGY Co.,Ltd.

Address before: 310052 Changhe Road, Binjiang District, Hangzhou, Zhejiang Province, No. 466

Patentee before: NEW H3C TECHNOLOGIES Co.,Ltd.

TR01 Transfer of patent right