CN102375775B - 一种具有检测***不可恢复错误指示信号的计算机*** - Google Patents

一种具有检测***不可恢复错误指示信号的计算机*** Download PDF

Info

Publication number
CN102375775B
CN102375775B CN201010253254.6A CN201010253254A CN102375775B CN 102375775 B CN102375775 B CN 102375775B CN 201010253254 A CN201010253254 A CN 201010253254A CN 102375775 B CN102375775 B CN 102375775B
Authority
CN
China
Prior art keywords
indication signal
unrecoverable error
error indication
computer system
programmable logic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201010253254.6A
Other languages
English (en)
Other versions
CN102375775A (zh
Inventor
蔡育生
范文纲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
Hangzhou Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Tonglu Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Original Assignee
Inventec Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inventec Corp filed Critical Inventec Corp
Priority to CN201010253254.6A priority Critical patent/CN102375775B/zh
Publication of CN102375775A publication Critical patent/CN102375775A/zh
Application granted granted Critical
Publication of CN102375775B publication Critical patent/CN102375775B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明揭示了一种具有检测***不可恢复错误指示信号的计算机***,包括:多个中央处理器单元,当该计算机***出现不可恢复错误时,至少一个中央处理器单元输出一不可恢复错误指示信号;一复杂可编程逻辑器件,电性耦接至所述中央处理器单元;一南桥,电性耦接至所述复杂可编程逻辑器件;以及一基板管理控制器,电性耦接至所述复杂可编程逻辑器件;当所述不可恢复错误指示信号分别为单个脉冲信号和多个连续脉冲信号时,该复杂可编程逻辑器件将其对应地传送至南桥或基板管理控制器,以重启该计算机***。采用本发明的检测电路,可根据指示信号的类别将其传送至南桥或基板管理控制器,以通过南桥或基板管理控制器输出重启命令并重启***。

Description

一种具有检测***不可恢复错误指示信号的计算机***
技术领域
本发明涉及一种计算机***,尤其涉及一种具有检测***不可恢复错误指示信号的计算机***。
背景技术
当前,服务器***在正常运行时,有时会经历一些运行过程中的***错误,按照这些错误是否可恢复来划分,大致包括可恢复错误和不可恢复的错误。当出现可恢复错误时,为了提高服务器***的可靠性,它通常配置为在产生可恢复错误时,捕捉这些可恢复或可修正的错误并将其写入错误日志,利用捕捉和日志记录的处理程序给服务器***用户一个机会,以便在整个***崩溃前,替换掉有缺陷的存储器单元,让***恢复正常运行。然而,当出现不可恢复错误时,表明服务器***已经不能继续运行而必须重新启动。
有鉴于此,如何设计出一种检测电路,在***出现不可恢复错误时既可以发出重启命令来重启***,又可以记录与CPU有关的具体信息,是业内技术人员亟待解决的一项课题。
发明内容
针对现有技术中计算机***在检测不可恢复错误时所存在的上述缺陷,本发明提供了一种新型的具有检测***不可恢复错误指示信号的计算机***。
根据本发明的一个方面,提供了一种具有检测***不可恢复错误指示信号的计算机***,用于计算机***中,该计算机***包括:
多个中央处理器单元,当该计算机***出现不可恢复错误时,至少一个中央处理器单元输出一不可恢复错误指示信号;
一复杂可编程逻辑器件,电性耦接至所述中央处理器单元,并接收该不可恢复错误指示信号;
一南桥,电性耦接至所述复杂可编程逻辑器件;以及
一基板管理控制器,电性耦接至所述复杂可编程逻辑器件;
其中,当所述不可恢复错误指示信号为单个脉冲信号时,该复杂可编程逻辑器件将所述不可恢复错误指示信号传送至该南桥,并由该南桥输出重启命令,以重启该计算机***;当所述不可恢复错误指示信号为两个以上的连续脉冲信号时,该复杂可编程逻辑器件将所述不可恢复错误指示信号传送至该基板管理控制器,并由该基板管理控制器输出重启命令,以重启该计算机***。
优选地,所述复杂可编程逻辑器件将所接收的不可恢复错误指示信号传送至所述南桥或基板管理控制器,并且由所述基板管理控制器生成错误日志。此外,所述错误日志包括与该不可恢复错误指示信号相关的中央处理器单元的编号。
优选地,所述具有检测***不可恢复错误指示信号的计算机***还包括多个电压转换模块,并且每一电压转换模块电性耦接至对应的中央处理器单元,各该电压转换模块接收该中央处理器单元输出的不可恢复错误指示信号并且放大该不可恢复错误指示信号的强度。依据本发明一实施例,电压转换模块包括一NPN晶体管,其发射极耦接至所述中央处理器单元,其集电极耦接至所述复杂可编程逻辑器件。依据本发明另一实施例,电压转换模块包括一CMOS晶体管,其源极耦接至所述中央处理器单元,其漏极耦接至所述复杂可编程逻辑器件。
优选地,当计算机***发生不可恢复的严重错误时,来自相应的中央处理器单元的不可恢复错误指示信号为低电平有效。
优选地,基板管理控制器通过多个通用输入输出端口的一通用输入输出端口来记录所述多个中央处理器单元的一中央处理器单元所发出的所述***不可恢复错误指示信号。
优选地,该计算机***是一服务器。
采用本发明的具有检测***不可恢复错误指示信号的计算机***,当复杂可编程逻辑器件接收到不可恢复错误指示信号时,可以根据指示信号的类别将其传送至南桥或基板管理控制器,以通过南桥或基板管理控制器来重启***。此外,复杂可编程逻辑器件接收到不可恢复错误指示信号时,基板管理控制器可以生成错误日志,以明确记录不可恢复错误指示信号来自于哪一中央处理器单元。
附图说明
读者在参照附图阅读了本发明的具体实施方式以后,将会更清楚地了解本发明的各个方面。其中,
图1示出依据本发明的一实施例,在计算机***中用于检测***不可恢复错误指示信号的检测电路的整体架构图;以及
图2进一步说明图1所示的***不可恢复错误指示信号检测电路中的电压转换模块的电路原理图。
具体实施方式
下面参照附图,对本发明的具体实施方式作进一步的详细描述。
图1示出依据本发明的一实施例,具有检测***不可恢复错误指示信号的计算机***的整体架构图。例如,这里的计算机***可以是服务器。参照图1,具有检测***不可恢复错误指示信号的计算机***包括中央处理器单元(CPU,Central Processor Unit)101和103、复杂可编程逻辑器件109、南桥111和基板管理控制器113。当计算机***出现不可恢复错误时,由中央处理器单元101或者中央处理器单元103输出一不可恢复错误指示信号。复杂可编程逻辑器件109电性耦接至中央处理器单元101和103,并接收来自中央处理器单元101和103的***不可恢复错误指示信号。
此外,南桥111电性耦接至复杂可编程逻辑器件109,以及基板管理控制器113电性耦接至复杂可编程逻辑器件109,如此一来,当来自中央处理器单元的不可恢复错误指示信号为单个脉冲信号时,复杂可编程逻辑器件109将该不可恢复错误指示信号传送至南桥111,并由南桥111输出重启命令,从而重启计算机***。而当来自中央处理器单元的不可恢复错误指示信号为两个以上的连续脉冲信号时,复杂可编程逻辑器件109将该不可恢复错误指示信号传送至基板管理控制器113,并由基板管理控制器113输出重启命令,从而重启计算机***。需要指出的是,在该计算机***中,之所以由南桥111和基板管理控制器113分别输出重启命令以重启***,是因为当不可恢复错误指示信号为多个连续的脉冲信号时,南桥会死机,故而在此情形下转由基板管理控制器113来控制***重新启动。
本领域的普通技术人员应当理解,若是对于单个CPU的计算机***来说,当发生不可恢复的严重错误时,会由该CPU自动校核此不可恢复的严重错误,并在随后通知南桥发出重启命令。显然,在这种情形下,不可恢复错误指示信号的CPU来源是明确的和清楚的,并不会造成混淆或无法确定的现象。可是,对于具有两个或两个以上CPU的计算机***来说,现有技术中采用多路不可恢复错误指示信号一起传送给控制单元,并由控制单元向南桥发送请求,通过南桥来输出重启命令。这样,具体由哪一个CPU发出不可恢复错误的指示信号并不能确定,而且当不可恢复错误指示信号是连续的脉冲信号时,南桥会死机而无法及时重新启动。
依据本发明的一实施例,计算机***还包括电压转换模块105和电压转换模块107,其中电压转换模块105电性连接中央处理器单元101和复杂可编程逻辑器件109,电压转换模块107电性连接中央处理器单元103和复杂可编程逻辑器件111。本领域的普通技术人员应当理解,该实施例中的电压转换模块105和107并不是本发明的计算机***所必需的,它们仅仅是为了放大或增强不可恢复错误指示信号的强度,而且本发明也并不只局限于此。
由上述可知,正是通过本发明的计算机***来完成不可恢复错误指示信号的检测,才能非常明晰地辨别出与不可恢复错误指示信号密切相关的中央处理器单元的编号。较佳地,电压转换模块105和107是电子元件配置完全相同的转换电路。
应当指出,不论所接收的不可恢复错误指示信号为单个脉冲还是连续的多个脉冲,复杂可编程逻辑器件109均向基板管理控制器113发出识别信息,并且由基板管理控制器113生成错误日志。例如,该错误日志包括与该不可恢复错误指示信号相关的中央处理器单元的编号。举例来说,当中央处理器单元101或103发出指示信号时,基板管理控制器113会记录相关日志条目,日志条目可以记录是由中央处理器单元101还是中央处理器单元103发送的不可恢复错误指示信号。
图2进一步说明图1所示的具有检测***不可恢复错误指示信号的计算机***的电压转换模块的电路原理图。不难看出,对应于中央处理器单元101的电压转换模块105同对应于中央处理器单元103的电压转换模块107可设置成完全相同。下文中以任一电压转换模块进行详细说明。
为便于描述起见,预先设定不可恢复错误指示信号为低电平有效。也就是说,当不可恢复错误指示信号呈现低电平时,说明***出现不可恢复的严重错误;相反,当不可恢复错误指示信号呈现高电平时,说明***处于正常运行状态。应当理解的是,也可预设不可恢复错误指示信号为高电平有效,并相应地更改电压转换模块中的电子元件配置型号和参数。
以低电平有效为例,当来自中央处理器单元101的不可恢复错误指示信号为高电平,且电性耦接至NPN晶体管Q1的发射极时,Q1因不符合开启条件而处于截止状态,此时,Q1的集电极呈现高电平。由于Q1的集电极电性连接至复杂可编程逻辑器件109,则对应于Q1集电极的通用输入端口接收的也为高电平信号,复杂可编程逻辑器件109并不会传送信息以通知南桥或基板管理控制器发出重启命令。另一方面,当来自中央处理器单元101的不可恢复错误指示信号为低电平时,Q1的基极与发射极间的电压处于正偏,Q1处于导通状态,此时,Q1的集电极与发射极形成电性通路而呈现低电平。由于Q1的集电极电性连接至复杂可编程逻辑器件109,则对应于Q1集电极的通用输入端口接收的也为低电平信号,复杂可编程逻辑器件109将传送信息并让基板管理控制器113记录当前的错误日志。较佳地,基板管理控制器通过多个通用输入输出端口的一通用输入输出端口来记录多个中央处理器单元的一中央处理器单元所发出的***不可恢复错误指示信号。例如,通过错误日志就可以知晓中央处理器单元101在***出现严重错误时发出了不可恢复错误指示信号。
本领域的普通技术人员应当理解,虽然图2中的电压转换模块主要通过NPN晶体管完成了电平之间的转换(如,从1.1V的电平信号转换成3.3V的电平信号),但是本发明并不只局限于此。例如,还可以采用CMOS晶体管替代NPN晶体管,同样可以完成电平转换功能。
采用本发明的具有检测***不可恢复错误指示信号的计算机***,当检测电路中的复杂可编程逻辑器件接收到不可恢复错误指示信号时,可以根据指示信号的类别将其传送至南桥或基板管理控制器,以通过南桥或基板管理控制器来重启***。此外,复杂可编程逻辑器件接收到不可恢复错误指示信号时,基板管理控制器可以生成错误日志,以明确记录不可恢复错误指示信号来自于哪一中央处理器单元。
上文中,参照附图描述了本发明的具体实施方式。但是,本领域中的普通技术人员能够理解,在不偏离本发明的精神和范围的情况下,还可以对本发明的具体实施方式作各种变更和替换。这些变更和替换都落在本发明权利要求书所限定的范围内。

Claims (7)

1.一种具有检测***不可恢复错误指示信号的计算机***,其特征在于,该计算机***包括:
多个中央处理器单元,当该计算机***出现不可恢复错误时,至少一个中央处理器单元输出一不可恢复错误指示信号;
一复杂可编程逻辑器件,电性耦接至所述中央处理器单元,并接收该不可恢复错误指示信号;
一南桥,电性耦接至所述复杂可编程逻辑器件;以及
一基板管理控制器,电性耦接至所述复杂可编程逻辑器件;
其中,当所述不可恢复错误指示信号为单个脉冲信号时,该复杂可编程逻辑器件将所述不可恢复错误指示信号传送至该南桥,并由该南桥输出重启命令,以重启该计算机***;当所述不可恢复错误指示信号为两个以上的连续脉冲信号时,该复杂可编程逻辑器件将所述不可恢复错误指示信号传送至该基板管理控制器,并由该基板管理控制器输出重启命令,以重启该计算机***,
其中,所述复杂可编程逻辑器件将所接收的不可恢复错误指示信号传送至所述南桥或基板管理控制器,并且由所述基板管理控制器生成错误日志,所述错误日志包括与该不可恢复错误指示信号相关的中央处理器单元的编号。
2.如权利要求1所述的具有检测***不可恢复错误指示信号的计算机***,其特征在于,所述***不可恢复错误指示信号检测电路还包括多个电压转换模块,并且每一电压转换模块电性耦接至对应的中央处理器单元,各该电压转换模块接收该中央处理器单元输出的不可恢复错误指示信号并且放大该不可恢复错误指示信号的强度。
3.如权利要求2所述的具有检测***不可恢复错误指示信号的计算机***,其特征在于,所述电压转换模块包括一NPN晶体管,其发射极耦接至所述中央处理器单元,其集电极耦接至所述复杂可编程逻辑器件。
4.如权利要求2所述的具有检测***不可恢复错误指示信号的计算机***,其特征在于,所述电压转换模块包括一CMOS晶体管,其源极耦接至所述中央处理器单元,其漏极耦接至所述复杂可编程逻辑器件。
5.如权利要求1所述的具有检测***不可恢复错误指示信号的计算机***,其特征在于,当所述计算机***发生不可恢复的严重错误时,来自相应的中央处理器单元的不可恢复错误指示信号为低电平有效。
6.如权利要求1所述的具有检测***不可恢复错误指示信号的计算机***,其特征在于,所述基板管理控制器通过多个通用输入输出端口的一通用输入输出端口来记录所述多个中央处理器单元的一中央处理器单元所发出的所述***不可恢复错误指示信号。
7.如权利要求1所述的具有检测***不可恢复错误指示信号的计算机***,其特征在于,所述计算机***是一服务器。
CN201010253254.6A 2010-08-11 2010-08-11 一种具有检测***不可恢复错误指示信号的计算机*** Active CN102375775B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010253254.6A CN102375775B (zh) 2010-08-11 2010-08-11 一种具有检测***不可恢复错误指示信号的计算机***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010253254.6A CN102375775B (zh) 2010-08-11 2010-08-11 一种具有检测***不可恢复错误指示信号的计算机***

Publications (2)

Publication Number Publication Date
CN102375775A CN102375775A (zh) 2012-03-14
CN102375775B true CN102375775B (zh) 2014-08-20

Family

ID=45794409

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010253254.6A Active CN102375775B (zh) 2010-08-11 2010-08-11 一种具有检测***不可恢复错误指示信号的计算机***

Country Status (1)

Country Link
CN (1) CN102375775B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5908171B2 (ja) * 2014-04-25 2016-04-26 三菱電機株式会社 プログラマブルロジックコントローラ
JP6333410B2 (ja) 2014-06-24 2018-05-30 華為技術有限公司Huawei Technologies Co.,Ltd. 障害処理方法、関連装置、およびコンピュータ
CN108345562B (zh) * 2014-12-16 2022-03-29 超聚变数字技术有限公司 多路服务器及其信号处理方法
CN106201961B (zh) * 2016-07-01 2019-05-07 英业达科技有限公司 控制处理器工作频率的计算器***与方法
CN106919490A (zh) * 2017-02-19 2017-07-04 郑州云海信息技术有限公司 服务器故障检测方法及装置
CN109932995B (zh) * 2017-12-18 2021-06-15 鸿富锦精密电子(天津)有限公司 电子装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1949182A (zh) * 2005-10-14 2007-04-18 戴尔产品有限公司 用于将可恢复的错误记入日志的***和方法
CN101630278A (zh) * 2008-07-18 2010-01-20 深圳富泰宏精密工业有限公司 记录电子装置当机异常信息的方法及其电子装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1949182A (zh) * 2005-10-14 2007-04-18 戴尔产品有限公司 用于将可恢复的错误记入日志的***和方法
CN101630278A (zh) * 2008-07-18 2010-01-20 深圳富泰宏精密工业有限公司 记录电子装置当机异常信息的方法及其电子装置

Also Published As

Publication number Publication date
CN102375775A (zh) 2012-03-14

Similar Documents

Publication Publication Date Title
CN102375775B (zh) 一种具有检测***不可恢复错误指示信号的计算机***
WO2021169260A1 (zh) 一种***板卡电源检测方法、装置、设备及存储介质
TWI337707B (en) System and method for logging recoverable errors
US8479049B2 (en) Electronic device and method for detecting power failure type
US8615685B2 (en) System and method for detecting errors occurring in computing device
US8549277B2 (en) Server system including diplexer
US9026685B2 (en) Memory module communication control
CN104320308A (zh) 一种服务器异常检测的方法及装置
JP2011043957A (ja) 障害監視回路、半導体集積回路及び故障個所特定方法
US9626241B2 (en) Watchdogable register-based I/O
CN101901170A (zh) 数据处理装置和用于误差检测与误差校正的方法
US20140143597A1 (en) Computer system and operating method thereof
US20130151746A1 (en) Electronic device with general purpose input output expander and signal detection method
US8843800B2 (en) Semiconductor integrated circuit
US9158646B2 (en) Abnormal information output system for a computer system
US20120144245A1 (en) Computing device and method for detecting pci system errors in the computing device
CN102681928A (zh) 计算机***的异常信息输出***
JP2011145208A (ja) 基板
US8726102B2 (en) System and method for handling system failure
TWI324304B (en) Method for reading data of input/output port
US9256504B2 (en) Semiconductor integrated circuit including a state machine
TW201706844A (zh) 電源失效偵測系統與其方法
JP2005135063A (ja) 情報処理装置及び情報処理装置の時計異常検出プログラム
JP6285123B2 (ja) 電源監視装置、電源装置、情報処理システム及び電源監視方法
JP5561790B2 (ja) ハードウェア障害被疑特定装置、ハードウェア障害被疑特定方法、及びプログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: HANGZHOU POWER SUPPLY COMPANY,STATE GRID ZHEJIANG

Effective date: 20141127

Owner name: STATE GRID CORPORATION OF CHINA

Free format text: FORMER OWNER: YINGYEDA CO., LTD., TAIWAN

Effective date: 20141127

C41 Transfer of patent application or patent right or utility model
C53 Correction of patent for invention or patent application
CB03 Change of inventor or designer information

Inventor after: Xu Rongyong

Inventor after: Zhang Wei

Inventor after: Hua Chengjun

Inventor after: Hong Jie

Inventor after: Zhan Lei

Inventor after: Wu Xiaohui

Inventor after: Zheng Jianjun

Inventor after: Nie Haitao

Inventor after: Liu Lei

Inventor after: Wei Yu

Inventor before: Cai Yusheng

Inventor before: Fan Wengang

COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: TAIWAN, CHINA TO: 100031 XICHENG, BEIJING

Free format text: CORRECT: INVENTOR; FROM: CAI YUSHENG FAN WENGANG TO: XU RONGYONG HUA CHENGJUN HONG JIE ZHAN LEI YU XIAOHUI ZHENG JIANJUN NIE HAITAO LIU LEI WEI YU ZHANG WEI

TR01 Transfer of patent right

Effective date of registration: 20141127

Address after: 100031 Xicheng District West Chang'an Avenue, No. 86, Beijing

Patentee after: State Grid Corporation of China

Patentee after: Hangzhou Power Supply Company, State Grid Zhejiang Electric Power Company

Patentee after: STATE GRID ZHEJIANG TONGLU POWER SUPPLY COMPANY

Address before: Taipei City, Taiwan Chinese Shilin District Hougang Street No. sixty-six

Patentee before: Inventec Corporation