CN1294488C - 多处理器计算机***的开机切换方法 - Google Patents

多处理器计算机***的开机切换方法 Download PDF

Info

Publication number
CN1294488C
CN1294488C CNB200310124031XA CN200310124031A CN1294488C CN 1294488 C CN1294488 C CN 1294488C CN B200310124031X A CNB200310124031X A CN B200310124031XA CN 200310124031 A CN200310124031 A CN 200310124031A CN 1294488 C CN1294488 C CN 1294488C
Authority
CN
China
Prior art keywords
cpu
rom
bios
changeover program
computer system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB200310124031XA
Other languages
English (en)
Other versions
CN1635472A (zh
Inventor
李俊良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inventec Corp
Original Assignee
Inventec Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inventec Corp filed Critical Inventec Corp
Priority to CNB200310124031XA priority Critical patent/CN1294488C/zh
Publication of CN1635472A publication Critical patent/CN1635472A/zh
Application granted granted Critical
Publication of CN1294488C publication Critical patent/CN1294488C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Stored Programmes (AREA)

Abstract

一种多处理器计算机***的开机切换方法,利用一基板管理控制器BMC管理多处理器计算机***的开机异常问题,其根据计算机***的中央处理单元(CPU)或储存于只读存储器(ROM)中的基本输入输出***(BIOS)的使用状态,通过一CPU切换程序或一ROM切换程序,可切换到可用的CPU与BIOS进行开机,该CPU切换程序通过该BMC于一开机CPU与至少一应用CPU之间切换,将执行开机程序的BIOS由储存于一开机ROM的一开机BIOS,切换至储存于至少一备份ROM的一备份BIOS;当通过该CPU切换程序仍无法开机时,还包含进行一ROM切换程序并重新开机的步骤。该方法可有效提升***的稳定性。

Description

多处理器计算机***的开机切换方法
技术领域
本发明涉及一种多处理器计算机***的开机异常管理方法,特别是指一种由BMC(基板管理控制器)进行CPU或ROM切换程序,以管理开机异常问题的方法。
背景技术
在计算机***中,基于高可用性(High Available)***的设计理念,为了可以维持***继续运行,而不需任何人为操作将故障排除,就有备份***存在的必要,此是多处理器(multiple processor)***产生的原因之一。多处理器计算机***如服务器(sever),由于具有多个中央处理单元(CPU),因此可以提高整体处理效能,并于指定CPU发生错误时作为替代之用。
一般而言,对于多处理器计算机***的开机程序,是指定单一的开机CPU(Boot strap Processor)提供运算功能,负责处理开机时基本输入输出***(BIOS)的指令,以进行计算机***初始化作业并加载操作***(OS);其中,开机BIOS是储存于基本输入输出***的只读存储器(BIOS ROM)上,而开机时其它的CPU被定义为应用CPU(application processors),并被设定处于等待状态(wait state)。
当使用开机CPU无法开机时,既有的作法是于BIOS中编写开机时切换CPU的程序,由开机CPU切换到其它的应用CPU,其切换机制如图1所示。
另一个可能发生的问题,是BIOS已经切换到所有的CPU尝试,但仍然无法开机;此状况可能是BIOS ROM出了问题。为了解决BIOS异常的问题,一个甚至多个备份只读存储器(backup ROM)被用来作为替代方案;将开机BIOS切换到储存在备份ROM上的备份BIOS,继续进行开机程序,其切换机制如图2所示。
然而,前述作法的缺点是必须使用特殊的BIOS来切换CPU,或者作只读存储器开机切换(ROM Boot Swap)设计,进行BIOS ROM的切换,其电子线路是比较复杂的,所以其过于麻烦且不符合成本效益。
发明内容
本发明所要解决的技术问题,在于常用技术中是以改写BIOS、设计ROM切换开机等方式进行开机异常的切换处理,不符合成本效益与工作需求。
鉴于以上公知技术的问题,本发明提供一种多处理器计算机***的开机切换方法,利用基板管理控制器BMC来管理开机异常时CPU与BIOS切换的判断与执行作业,其中包含以下步骤:通过一基板管理控制器确认开机异常;进行一CPU切换程序并重新开机;当CPU切换程序失败时,还包含进行一ROM切换程序并重新开机的步骤;其中,CPU切换程序通过基板管理控制器于一开机CPU与至少一应用CPU之间切换,其中,该CPU切换程序包含:改变各CPU的***管理中断状态,将前一次开机的该CPU与一CPU总线隔绝;以及通过该基板管理控制器产生一CPU切换信号与一重开机信号至储存于一开机ROM的一开机BIOS或储存于至少一备份ROM的一备份BIOS;而且,ROM切换程序通过基板管理控制器,将执行开机程序的BIOS由该开机BIOS切换至该备份BIOS。
本发明达到的功效,在于可以BMC管理开机异常问题,***BIOS和ROM均不必作额外的设计,而可进一步提高***稳定性。
附图说明
图1、图2是说明先前技术中多处理器***的开机切换机制;
图3是说明本发明以BMC管理多处理器***的开机切换机制;
图4是说明本发明以BMC进行多处理器***开机的CPU切换流程;及
图5是说明本发明以BMC进行多处理器***开机的ROM切换流程。
其中,附图标记说明如下:
步骤110 BMC未接获开机BIOS的一已开机信息
步骤120 ***正常开机运行
步骤130 未完成CPU切换程序与ROM切换程序
步骤140 ***无法开机运行
步骤150 确认未完成CPU切换程序
步骤160 进行CPU切换程序
步骤161 改变所有CPU的SMI状态以将BSP CPU与CPU总线隔绝
步骤162 BMC产生一CPU切换信号与一重开机信号至开机BIOS或备份BIOS
步骤170 ROM切换程序
CPU  中央处理单元
BIOS 基本输入输出***
ROM  只读存储器
BMC  基板管理控制器
BSP CPU  预设开机的CPU SMI1、SMI2 ***管理中断
SWAP状态 切换状态
STBY_PGD 待命开机状态
ROM_SWAP ROM 切换状态
STATE_CHANGE 状态转换
SYS_PGD  ***重开机状态
CPU_SWAP CPU切换状态
LOW  低位
HIGH 高位
BACKUPROM 备份ROM状态
ROMswitch ROM切换状态
具体实施方式
本发明涉及一种多处理器计算机***的开机切换方法,主要是利用基板管理控制器BMC(Baseboard Management Controller)来管理开机异常时CPU与BIOS切换的判断与执行作业。
BMC原本是应用于智能平台管理接口(IPMI),控制***的管理软件和平台管理硬件之间的接口,提供自主监视、事件记录和恢复控制功能,并可作为***管理软件和智能平台管理总线IPMB(Intelligent Platform Management Bus)与智能机箱管理总线ICMB(Intelligent Chassis Management Bus)接口间的网络网关使用。
之所以可以通过BMC来管理***异常问题,是因为***可以通过低接脚数LPC(Low Pin Count)接口,从BMC得到***的状况信息。
本发明即为BMC的另一全新的应用领域,以下根据图3说明通过BMC管理开机异常状况的处理方式。执行优先级,基本是先作CPU切换、重开机,若不行再做ROM切换、重开机。
首先,在***电源激活后,确认BMC未接获开机BIOS的一已开机信息(步骤110);如接获已开机信息,表示***正常开机操作(步骤120)。BMC以***备用电源供电,因此***电源激活前,BMC即已备妥,如此才能在***电源一激活,就接收BIOS传来的开机程序运行状态。
接着,确认未完成CPU切换程序与ROM切换程序(步骤130);如***已完成CPU、ROM切换程序却无法开机,代表所有CPU均发生错误,***无法开机运行(步骤140),只能人工排除故障,例如更换CPU。
其次,确认未完成CPU切换程序(步骤150),随即进行CPU切换程序(步骤160)。
步骤160的CPU切换程序,还包括两个详细流程;其一为改变所有CPU的SMI状态以将BSP CPU(所谓BSP CPU是指boot strap processor,是指一开始开机时,先开始动作开机的CPU,也就是预设用以开机的CPU;于第二次以后的CPU切换程序中,则为前一次开机的CPU)与CPU总线隔绝(步骤161),然后BMC产生一CPU切换信号与一重开机信号至开机BIOS或备份BIOS(步骤162)。重开机之后,即回到步骤110确认开机状态。
步骤150的判断后,如已进行过CPU切换,即进行ROM切换程序(步骤170)。此程序即在将执行开机程序的BIOS,由BIOS ROM中的开机BIOS,切换到备份ROM中的备份BIOS,并以备份BIOS重开机;详而言之,由BMC产生ROM切换信号至一复杂可编程逻辑器件CPLD(Complex ProgrammableLogic Device)以切换至备份ROM,并产生***重开机信号至备份BIOS。重开机之后,也回到步骤110确认开机状态。
请参阅图4,说明在执行CPU切换时,BMC中的执行流程,可用以证明本发明的可行性。SMI1与SMI2为BMC上的两个***管理中断SMI(SystemManagement Interrupt),SWAP状态表示切换状态,STBY_PGD、ROM_SWAP、STATE_CHANGE、SYS_PGD、CPU_SWAP等为BMC中控制程序的功能参数;STBY_PGD为待命开机状态,ROM_SWAP为ROM切换状态,STATE_CHANGE为状态转换,SYS_PGD为***重开机状态,CPU_SWAP为CPU切换状态。图中CPU的切换包含四个状态,可让BMC知道切换到第几个CPU,各状态下的执行内容分述如下:
第1状态的执行内容包括:a.设定SMI1为LOW(低位);
b.设定SMI2为HIGH(高位);
c.设定SWAP状态至第2状态;
d.设定STATE_CHANGE为CHANGE(转换)。
第2状态的执行内容包括:
a.设定SMI1为HIGH;
b.设定SMI2为LOW;
c.设定SWAP状态至第3状态;
d.设定STATE_CHANGE为CHANGE。
第3状态的执行内容包括:
a.设定SMI1为LOW;
b.设定SMI2为LOW;
c.设定SWAP状态至第4状态;
d.设定STATE_CHANGE为CHANGE。
第4状态的执行内容包括:
a.设定SWAP状态至第4状态;
b.设定STATE_CHANGE为CHANGE。
图5可说明本发明在利用BMC进行ROM切换(ROM SWAP)时的详细流程,也可用以验证本发明的可行性。其中BACKUPROM代表备份ROM状态,于本发明中,备份ROM可处于正常状态(normal state)或备用状态(backupstate);ROMswitch则代表ROM切换状态的功能参数。
根据图4、图5的CPU及ROM流程,BMC可依据图3的流程,于开机异常时先进行图4的CPU切换,未成功开机时再进行图5ROM切换,证实以BMC管理开机异常状况确实可行。
以上所述,仅为本发明较佳的实施例,并非用以限定本发明实施的范围,熟悉此技术人员经本发明的揭示后,据此所作的改变及调整,均属于本发明技术思想的范围内。
因此,在不脱离本发明的精神和范围内所作的均等变化与修饰,均应属于本发明的权利要求书所要求保护的申请专利范围内。

Claims (5)

1.一种多处理器计算机***的开机切换方法,其中包含以下步骤:
通过一基板管理控制器确认开机异常;及
进行一CPU切换程序并重新开机;
该CPU切换程序通过该基板管理控制器于一开机CPU与至少一应用CPU之间切换,其中,该CPU切换程序包含:
改变各CPU的***管理中断状态,将前一次开机的该CPU与一CPU总线隔绝;以及
通过该基板管理控制器产生一CPU切换信号与一重开机信号至储存于一开机ROM的一开机BIOS或储存于至少一备份ROM的一备份BIOS;
当通过该CPU切换程序仍无法开机时,还包含进行一ROM切换程序并重新开机的步骤;
该ROM切换程序通过该基板管理控制器,将执行开机程序的BIOS由该开机BIOS切换至该备份BIOS。
2.如权利要求1所述的多处理器计算机***的开机切换方法,其中该ROM切换程序是由该基板管理控制器产生一ROM切换信号至一复杂可编程逻辑器件以切换至该备份ROM,并产生一***重开机信号至该备份BIOS。
3.如权利要求1所述的多处理器计算机***的开机切换方法,其中开机异常是指该基板管理控制器未收到来自该开机BIOS或该备份BIOS的一已开机信息。
4.如权利要求1所述的多处理器计算机***的开机切换方法,其中在确认开机异常之后,还包含一确认未完成该CPU切换程序与该ROM切换程序的步骤。
5.如权利要求4所述的多处理器计算机***的开机切换方法,其中在进行该CPU切换程序前,还包含一确认未完成该CPU切换程序的步骤。
CNB200310124031XA 2003-12-31 2003-12-31 多处理器计算机***的开机切换方法 Expired - Fee Related CN1294488C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB200310124031XA CN1294488C (zh) 2003-12-31 2003-12-31 多处理器计算机***的开机切换方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB200310124031XA CN1294488C (zh) 2003-12-31 2003-12-31 多处理器计算机***的开机切换方法

Publications (2)

Publication Number Publication Date
CN1635472A CN1635472A (zh) 2005-07-06
CN1294488C true CN1294488C (zh) 2007-01-10

Family

ID=34844924

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB200310124031XA Expired - Fee Related CN1294488C (zh) 2003-12-31 2003-12-31 多处理器计算机***的开机切换方法

Country Status (1)

Country Link
CN (1) CN1294488C (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101847043B (zh) * 2009-03-25 2012-11-21 联想(北京)有限公司 共用存储设备的方法及移动终端

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100418059C (zh) * 2006-01-25 2008-09-10 英业达股份有限公司 切换失效的检测方法
CN100442231C (zh) * 2006-09-20 2008-12-10 威盛电子股份有限公司 计算机***的开机装置及方法
CN100501679C (zh) * 2007-02-27 2009-06-17 华为技术有限公司 一种电子设备
CN101132314B (zh) * 2007-09-21 2010-09-29 中兴通讯股份有限公司 实现冗余备份的方法
CN101582036B (zh) * 2008-05-14 2013-01-02 英业达股份有限公司 共享式基本输入输出***的伺服装置及方法
CN102722423A (zh) * 2011-03-29 2012-10-10 比亚迪股份有限公司 一种便携式终端及其自行修复的方法
CN103077060A (zh) * 2013-01-10 2013-05-01 中兴通讯股份有限公司 主备用bios的切换方法及装置、***
CN105100179B (zh) * 2014-05-23 2018-10-19 杭州华为数字技术有限公司 服务器集群***
CN104618121A (zh) * 2015-01-29 2015-05-13 曙光云计算技术有限公司 交换器及服务器***
CN105022629B (zh) * 2015-06-29 2018-02-23 浪潮电子信息产业股份有限公司 开机控制方法、装置和服务器
CN108153648B (zh) * 2017-12-27 2021-04-20 西安奇维科技有限公司 一种实现灵活调度的多冗余计算机的方法
CN112486742B (zh) * 2019-09-12 2024-04-12 环达电脑(上海)有限公司 远端查看服务器开机状态的方法与服务器

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1255211A (zh) * 1997-05-07 2000-05-31 通用动力信息***公司 用于计算机***的非侵入性电源控制
US20020099974A1 (en) * 1999-05-05 2002-07-25 Hou-Yuan Lin Dual basic input/output system for a computer
US20030005367A1 (en) * 2001-06-29 2003-01-02 Lam Son H. Reporting hard disk drive failure

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1255211A (zh) * 1997-05-07 2000-05-31 通用动力信息***公司 用于计算机***的非侵入性电源控制
US20020099974A1 (en) * 1999-05-05 2002-07-25 Hou-Yuan Lin Dual basic input/output system for a computer
US20030005367A1 (en) * 2001-06-29 2003-01-02 Lam Son H. Reporting hard disk drive failure

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101847043B (zh) * 2009-03-25 2012-11-21 联想(北京)有限公司 共用存储设备的方法及移动终端

Also Published As

Publication number Publication date
CN1635472A (zh) 2005-07-06

Similar Documents

Publication Publication Date Title
CN1294488C (zh) 多处理器计算机***的开机切换方法
US9798556B2 (en) Method, system, and apparatus for dynamic reconfiguration of resources
CN1191528C (zh) 透明的基于时间的选择软件再生的方法和***
US8782317B1 (en) Computer system, method for accessing peripheral component interconnect express endpoint device, and apparatus
CN1147788C (zh) 双重化计算机***
US6996745B1 (en) Process for shutting down a CPU in a SMP configuration
US20140082413A1 (en) System and method for using redundancy of controller operation
CN1495611A (zh) 容错计算机***及其再同步方法和再同步程序
CN1892612A (zh) 集群可用性管理方法和***
US7194614B2 (en) Boot swap method for multiple processor computer systems
CN108874549B (zh) 资源复用方法、装置、终端和计算机可读存储介质
CN101056205A (zh) 一种基于atca架构服务器管理方法、***及其装置
US20040177242A1 (en) Dynamic computer system reset architecture
WO2023061172A1 (zh) 应用升级方法、装置、计算设备和芯片***
CN1295903C (zh) 一种***安全启动方法
JP4957765B2 (ja) ソフトウェアプログラム実行装置、ソフトウェアプログラム実行方法、及びプログラム
CN1908911A (zh) 在可修复的故障后使群集器***自动投入运行
WO2002097622A2 (en) A resource management method
CN105677606B (zh) 总线设备的热插拔方法及总线装置
CN1722628A (zh) 通信***中设备的倒换方法及其***
CN1093661C (zh) 反向恢复型输入输出控制装置和输入输出控制方法
CN1278204C (zh) 电源管理状态控制方法
TWI244031B (en) Booting switch method for computer system having multiple processors
CN114115703A (zh) 裸金属服务器在线迁移方法以及***
CN100340976C (zh) 一种实现计算机多线程控制的方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Assignee: Inventec Technology Co., Ltd.

Assignor: Inventec Corporation

Contract fulfillment period: 2007.2.1 to 2013.1.31 contract change

Contract record no.: 2008990000343

Denomination of invention: Starting-up switching method of multi-processor computer system

Granted publication date: 20070110

License type: Exclusive license

Record date: 2008.9.2

LIC Patent licence contract for exploitation submitted for record

Free format text: EXCLUSIVE LICENCE; TIME LIMIT OF IMPLEMENTING CONTACT: 2007.2.1 TO 2013.1.31

Name of requester: SINO-BRITISH TRADE AMOUNTED TECHNOLOGY CO.

Effective date: 20080902

C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20070110

Termination date: 20101231