CN104657166A - 服务器***与节点替换方法 - Google Patents

服务器***与节点替换方法 Download PDF

Info

Publication number
CN104657166A
CN104657166A CN201310597425.0A CN201310597425A CN104657166A CN 104657166 A CN104657166 A CN 104657166A CN 201310597425 A CN201310597425 A CN 201310597425A CN 104657166 A CN104657166 A CN 104657166A
Authority
CN
China
Prior art keywords
node
server system
hardware
preset time
judge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310597425.0A
Other languages
English (en)
Other versions
CN104657166B (zh
Inventor
卢盈志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inventec Pudong Technology Corp
Inventec Corp
Original Assignee
Inventec Pudong Technology Corp
Inventec Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inventec Pudong Technology Corp, Inventec Corp filed Critical Inventec Pudong Technology Corp
Priority to CN201310597425.0A priority Critical patent/CN104657166B/zh
Publication of CN104657166A publication Critical patent/CN104657166A/zh
Application granted granted Critical
Publication of CN104657166B publication Critical patent/CN104657166B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

一种节点替换方法,适用于服务器***。该节点替换方法的步骤流程如下:检测节点是否***服务器***,并于检测到节点***服务器***时产生提示信号,提示信号用以指示节点不能拔离服务器***。检测节点的第一识别码与节点中的硬件的第一硬件配置信息。依据第一识别码与硬件配置信息以及节点***服务器***之前的第二识别码与硬件配置信息,判断节点或硬件是否已被替换。若判断为否,则关闭节点的电源,以执行节点替换程序。若判断为是,则对节点安装操作***、软件包数据与固件包数据至少其中之一。

Description

服务器***与节点替换方法
技术领域
本发明涉及一种服务器***(例如机柜式的数据中心)与节点替换方法,特别是一种可快速进行节点替换程序的服务器***与节点替换方法。
背景技术
随着科技的发展,通过互联网能够使得世界各地的电脑进行连结。一台电脑通过网络连线便能够与另一台电脑进行数据的交换、存取等动作。在客户端与服务器***架构上,客户端与服务器便是通过网络来进行沟通。
一般来说,服务器***可配置有多个节点,且每一个节点同时运行多个虚拟机器(virtual machine,VM),藉以提供给每一使用者独立的运作环境。并且,每个节点可视为各自独立的计算机,亦即各节点具有存储器、储存空间、运算能力与网络连结功能。因此,各节点可以运行独自的操作***,且各节点之间也可以通过网络设备进行沟通与数据传输。
在服务器***架构完毕后,必须对其内的节点完成部署,亦即安装各节点所需的操作***、软件包数据与固件包数据,以使服务器***运作并提供服务给使用者使用。然而,当服务器***中的任意一组节点的硬件产生损坏时,将会导致对应于此硬件的节点无法正常运作,此时检测人员由于无法精确得知是哪一节点中的特定硬件发生损坏,而仅能依序将节点拔离与***服务器***来进行检测,造成检测时间上的浪费。
发明内容
本发明所要解决的技术问题是提供一种服务器***与节点替换方法,其可自动地依据节点的识别码与节点中的硬件的硬件配置信息来判断特定节点或此节点中的特定硬件是否需要被替换,以让检测人员可快速方便地对节点进行替换。
为了实现上述目的,本发明提供了一种节点替换方法,此节点替换方法适用于服务器***。此节点替换方法的步骤流程如下所述。检测节点是否***服务器***,并于检测到节点***服务器***时产生第一提示信号,其中此第一提示信号用以指示节点不能拔离服务器***。检测节点的第一识别码与节点中的硬件的第一硬件配置信息。依据第一识别码与第一硬件配置信息以及节点***服务器***之前的第二识别码与第二硬件配置信息,判断节点或节点中的硬件是否已被替换。若判断出节点与节点中的硬件皆未被替换,则关闭节点的电源,以执行节点替换程序。若判断出节点或节点中的硬件被替换,则对节点安装操作***、软件包数据与固件包数据至少其中之一。
在一实施例中,于对节点安装操作***、软件包数据与固件包数据至少其中之一的步骤之后,还包括以下所述的步骤流程。持续检测节点中的硬件的状况,以判断硬件是否发生错误。若判断出硬件产生不可修复的错误,则关闭此节点的电源,以执行节点替换程序。若判断出硬件产生可修复的错误次数达到预设的门槛值,则对此节点进行正常关机程序,并据以执行节点替换程序。
在一实施例中,节点替换程序包括以下所述的步骤流程。将节点设定为初始模式。产生第二提示信号,其中此第二提示信号用以指示节点能拔离服务器***。检测节点是否拔离服务器***。检测节点或另一节点是否***服务器***。若检测到节点或另一节点***服务器***,则产生第一提示信号,并且接续检测节点的第一识别码与节点中的硬件的第一硬件配置信息之后的步骤。
承接上述的实施例,于检测节点是否拔离服务器***的步骤中,还包括以下所述的步骤流程。设定第一预设时间并开始计时。判断节点是否已拔离服务器***。若判断出节点尚未拔离服务器***,则重置第一预设时间并重新计时。若判断出节点拔离服务器***且已经过第一预设时间,则执行检测节点或另一节点是否***服务器***之后的步骤。
承接上述的实施例,于检测节点或另一节点是否***服务器***的步骤中,还包括以下所述的步骤流程。设定第一预设时间与第二预设时间并开始计时,其中第二预设时间接续于第一预设时间后。判断节点是否***服务器***。若判断出节点尚未***服务器***,则重置第一预设时间并重新计时。若判断出节点***服务器***且已经过第一预设时间,则接着判断节点于第二预设时间中是否仍持续***服务器***。若判断出节点于第二预设时间中拔离服务器***,则接续将节点设定为初始模式之后的步骤。若判断出节点于经过第二预设时间后仍未拔离服务器***,则产生第一提示信号,并且接续检测节点的第一识别码与节点中的硬件的第一硬件配置信息之后的步骤。
为了更好地实现上述目的,本发明还提供了一种服务器***,此服务器***包括节点、检测模块、提示模块以及处理模块。节点具有硬件。检测模块通讯连接节点,此检测模块用以检测节点是否***或拔离服务器***,以及用以检测节点的第一识别码与硬件的第一硬件配置信息。提示模块通讯连接检测模块,此提示模块用以于检测模块检测到节点***服务器***时产生第一指示信号。其中,此第一指示信号用以指示节点不能拔离服务器***。处理模块通讯连接于检测模块与节点之间,此处理模块用以依据第一识别码与第一硬件配置信息以及节点***服务器***之前的第二识别码与第二硬件配置信息来判断节点或硬件是否已被替换。其中,若处理模块判断出节点与硬件皆未被替换,则关闭节点的电源,以执行节点替换程序,若处理模块判断出节点或硬件被替换,则对节点安装操作***、软件包数据与固件包数据至少其中之一。
在一实施例中,于处理模块对节点安装操作***、软件包数据与固件包数据至少其中之一之后,处理模块还持续判断硬件是否发生错误。若处理模块判断出硬件产生不可修复的错误,则关闭节点的电源,以执行节点替换程序。若处理模块判断出硬件产生可修复的错误次数达到预设的门槛值,则对节点进行正常关机程序,并据以执行节点替换程序。
在一实施例中,于服务器***执行节点替换程序时,处理模块将节点设定为初始模式。接着,提示模块产生第二提示信号,此第二提示信号用以指示节点能拔离服务器***。另外,检测模块检测节点是否拔离服务器***,并于检测到节点拔离服务器***后接续检测节点或另一节点是否***服务器***。若检测模块检测到节点或另一节点***服务器***,则提示模块产生第一提示信号,并且检测模块接续检测节点的第一识别码与硬件的第一硬件配置信息之后的处理程序。
承接上述的实施例,服务器***还包括计时模块,此计时模块通讯连接检测模块。于检测模块检测节点是否拔离服务器***时,计时模块会设定第一预设时间并开始计时。若检测模块检测出节点于第一预设时间内仍未拔离服务器***,则计时模块将重置第一预设时间并重新计时。若检测模块检测出节点拔离服务器***且已经过第一预设时间,则接续检测节点或另一节点是否***服务器***之后的处理程序。
承接上述的实施例,服务器***还包括计时模块,此计时模块通讯连接检测模块。于检测模块检测节点或另一节点是否***服务器***时,计时模块会设定第一预设时间与第二预设时间并开始计时,其中第二预设时间接续于第一预设时间后。若检测模块检测出节点于第一预设时间内尚未***服务器***,则计时模块重置第一预设时间并重新计时。若检测模块检测出节点***服务器***且已经过第一预设时间,则接续检测节点于第二预设时间中是否仍持续***服务器***。若检测模块检测出节点于第二预设时间中拔离服务器***,则接续处理模块将节点设定为初始模式的处理程序。若检测模块检测出节点于经过第二预设时间后仍未拔离服务器***,则提示模块产生第一提示信号,并且检测模块接续检测节点的第一识别码与硬件的第一硬件配置信息之后的处理程序。
本发明的技术效果在于:
本发明的服务器***与节点替换方法,其通过检测节点的识别码与节点中的硬件的硬件配置信息,来判断节点或节点中的硬件的硬件是否已被替换,进而选择性地执行节点替换程序或对此节点安装操作***、软件包数据或固件包数据。此外,本发明的服务器***与节点替换方法还可于节点安装操作***、软件包数据或固件包数据后,持续地检测节点中的硬件状况,并于节点中的硬件产生错误时通过提示信号来让检测人员得知可以进行节点替换程序。
以下结合附图和具体实施例对本发明进行详细描述,但不作为对本发明的限定。
附图说明
图1为根据本发明一实施例的服务器***的功能框图;
图2A为根据本发明一实施例的服务器***的节点替换方法的步骤流程图;
图2B为根据本发明另一实施例的服务器***的节点替换方法的步骤流程图;
图3为根据本发明一实施例的节点替换程序的步骤流程图;
图4为根据图3中的步骤S304的详细步骤流程图;
图5为根据图3中的步骤S306的详细步骤流程图。
其中,附图标记
1服务器***
10节点
12检测模块
14提示模块
16处理模块
18计时模块
S200~S214、S300~S308、S400~S404、S500~S506步骤
具体实施方式
下面结合附图对本发明的结构原理和工作原理作具体的描述:
请参照图1,图1为根据本发明一实施例的服务器***的功能框图。如图1所示,服务器***1包括节点10、检测模块12、提示模块14、处理模块16与计时模块18,其中检测模块12通讯连接于节点10提示模块14、处理模块16与计时模块18之间,且节点10又与处理模块16通讯连接。本发明所述的通讯连接可以是以实体线路连接而实现,或是以无线通讯连接而实现,本发明在此不加以限制。于实务上,服务器***1可以为一种机柜式的数据中心(container data center),但不以此为限。以下将分别就服务器***1中的各部功能模块作详细的说明。
节点10具有至少一硬件,所述的硬件可以包括有基板管理控制器(baseboard management controller,BMC)、网络界面控制器(network interfacecontroller,NIC,亦称网络卡)、硬盘(hard disk drive,HDD)、DIMM(Dual In-lineMemory Module)与中央处理器(CPU)等,但不以此为限。此外,虽然图1仅绘示有一组节点,然而本发明的服务器***在此不加以限制节点的个数。
检测模块12用以检测节点10是否有***或拔离服务器***1,以及用以检测节点10的第一识别码与节点10中硬件的第一硬件配置信息(hardwareconfiguration information)。于实务上,节点10的识别码可以为一种通用唯一识别码(universally unique identifier,UUID),但不以此为限。一般来说,此种通用唯一识别码是由一串16位元组(亦称128位元)的16进位数字所构成,用以让每一个节点10都能有唯一的辨识信息,再者,此UUID能由SMBIOS(System Management BIOS)Type1数据结构的UUID栏位取得;节点10的硬件配置信息能被计算而得其唯一4位元组的硬件签字(HardwareSignature),BIOS(Basic Input Output System)将于其POST(Power On Self Test)时取得硬件配置信息并进得将硬件签字存于ACPI(Advanced ConfigurationPower Management Interface)FACS(Firmware ACPI Control Structure)表的Hardware Signature栏位,此Hardware Signature栏位可用来快速决定是否硬件配置信息不同;再者,可通过ping节点10上BMC的NIC来检测节点10是否***或拔除。
提示模块14用以于检测模块12检测到节点10***服务器***1时产生一组第一指示信号,此第一指示信号用以指示节点10不能拔离服务器***1。此外,在某些情况中,提示模块14产生一组第二指示信号,此第二指示信号用以指示节点10能拔离服务器***1。于实务上,提示模块14可以为一种显示模块(例如发光二极体、显示面板、七段显示器等电子显示元件)或是发声模块(例如喇叭、蜂鸣器等电子发声元件),本发明在此不加以限制。若提示模块14为显示模块的话,则提示信号以影像或是光线的形式呈现给使用者;若提示模块14为发声模块的话,则提示信号以声音的型式呈现给使用者。
处理模块16用以依据节点10的识别码与节点10中硬件的硬件配置信息以及节点10***服务器***1之前的第二识别码与第二硬件配置信息来判断节点10或节点10中的硬件是否已被替换;需知,“节点10***服务器***1之前的第二识别码与第二硬件配置信息”是“节点10之前次***服务器***1时的其识别码与硬件配置信息”,再者,要是新的节点10***服务器***,则其第二识别码与第二硬件配置信息皆是空的。计时模块18用以设定至少一组预设时间,并且开始计时。于某些情况中,计时模块18会在计时的过程中将计时归零,以重新开始计时。
为了更加清楚说明本发明的服务器***1与节点替换方法的实际运作方式,请一并参照图1与图2A,图2A为根据本发明一实施例的服务器***的节点替换方法的步骤流程图。如图2A所示,在步骤S200中,检测模块12会检测节点10是否***服务器***1,并于检测到节点10***服务器***时,提示模块14会产生一组第一指示信号,并进入步骤S202。若检测模块12未检测到节点10***服务器***1,则继续重复执行步骤S200,直至检测模块12检测到节点10***服务器***1为止。
在步骤S202中,检测模块12会接着检测节点10的第一识别码与此节点10中的其中一硬件的第一硬件配置信息。在步骤S204中,处理模块16会依据第一识别码与第一硬件配置信息以及节点10***服务器***1之前的第二识别码与第二硬件配置信息,判断节点10或节点10中的硬件是否已被替换。若处理模块16判断出节点10或节点10中的硬件已被替换,则执行步骤S206;若处理模块16判断出节点10与节点10中的硬件皆未被替换,则执行步骤S208。需知,在节点10或其硬件没被替换下,也可强制重新对此节点10安装操作***、软件包数据或固件包数据(图未示),其可应用于实际的情境如下﹕当节点10只是因其上的硬件因接触不良而产生硬件错误,此时可将节点10拔除,然后使其硬件接触良好,然后再将节点10重新插回服务器***1。
在步骤S206中,处理模块16会对节点10安装操作***(operating system,OS)、软件包数据(software package data)与固件包数据(firmware package data)至少其中之一。在步骤S208中,处理模块16会关闭(power off)节点10的电源,以执行节点替换程序。
请参照图2B,图2B为根据本发明另一实施例的服务器***的节点替换方法的步骤流程图。如图2B所示,在对节点安装操作***、软件包数据与固件包数据至少其中之一的步骤(即步骤S206)之后,检测模块12或是另一组监控模块(图未示)可以持续地检测节点中的硬件的状况,以使处理模块16判断硬件是否发生错误(即步骤S210)。若检测模块12或是另一组监控模块检测出节点10当中的硬件产生不可修复的错误(un-correct error),则执行步骤S212;若检测模块12或是另一组监控模块检测出节点10当中的硬件产生可修复的错误(correct error)次数达到预设的门槛值(default threshold value),则执行步骤S214。
在步骤S212中,由于节点10当中的硬件产生不可修复的错误,亦即此时节点10已经损坏而无法正常运作,则处理模块16会关闭节点10的电源,以执行节点替换程序。在步骤S214中,由于节点10当中的硬件产生可修复的错误次数达到预设的门槛值(例如,一小时内产生10次以上的可修复的错误次数),亦即此时节点10快要损坏而即将无法正常运作,则处理模块16会对节点10进行正常关机(shutdown)程序,并据以执行节点替换程序。
请参照图3,图3为根据本发明一实施例的节点替换程序的步骤流程图。如图3所示,在步骤S300中,处理模块16会将节点10设定为初始模式。于本实施例中,初始模式为动态主机配置协议(dynamic host configurationprotocol,DHCP)模式。在实际的操作中,当处理模块16判断出节点10能拔离服务器***1时,会自动地将节点10的基板管理控制器设定回DHCP模式,以取得新的一组基板管理控制器的互联网协议位址(internet protocol address,IPaddress)。
在步骤S302中,提示模块14会产生一组第二指示信号,此第二指示信号用以指示节点10能拔离服务器***1。在步骤S304中,检测模块12会检测节点10是否拔离服务器***1。若检测模块12检测出节点10仍未拔离服务器***1,则继续执行步骤S304;若检测模块12检测出节点10拔离服务器***1,则执行步骤S306。在步骤S306中,检测模块12会接续检测节点10或另一组节点是否***服务器***1。若检测模块12检测出有一组节点(节点10或另一组节点)***服务器***1,则执行步骤S308;若检测模块12检测出仍未有节点***服务器***1,则继续执行步骤S306。在步骤S308中,提示模块14会产生第一指示信号,并接续执行步骤S202。
请参照图4,图4为根据图3中的步骤S304的详细步骤流程图。如图4所示,在提示模块14产生第二指示信号(即步骤S302)之后,计时模块18会设定一组第一预设时间(例如一分钟)并且开始计时。在步骤S402中,会判断节点10是否已拔离服务器***1。若判断出节点10于第一预设时间内仍未拔离服务器***1,则执行步骤S404;若判断出节点10拔离服务器***1且已经过第一预设时间,则执行步骤S306。在步骤S404中,计时模块18会重置第一预设时间并重新计时,并接续步骤S402的判断程序。
此外,步骤S402中所执行的判断节点10是否已拔离服务器***1的步骤可以通过检测模块12、处理模块16或节点10的网络界面控制器来达成,本发明在此不加以限制,例如可通过ping节点10上BMC的NIC来检测节点10是否拔离。藉此,通过图4的判断机制可以避免因网络不稳或接触不良所造成的误判节点10已拔离服务器***1的情况,换句话说,图4的判断机制为一种de-bounce机制。
请参照图5,图5为根据图3中的步骤S306的详细步骤流程图。如图5所示,于检测模块12检测节点10是否拔离服务器***1的步骤(即步骤S304)之后,计时模块18会设定一组第一预设时间与一组第二预设时间并开始计时,其中第二预设时间接续于第一预设时间之后。举例来说,第一预设时间为计时模块18开始计时的第一分钟(即第0~60秒),而第二预设时间则为计时模块18开始计时的第二分钟(即第61~120秒),需知,第一预设时间与第二预设时间是可不同的。
在步骤S502中,会判断节点10是否***服务器***1。若判断出节点10仍未***服务器***1,则执行步骤S504;若判断出节点10***服务器***1,则执行步骤S506。在步骤S504中,计时模块18会重置第一预设时间并重新计时,并接续步骤S502的判断程序,所以步骤S502及步骤S504的判断机制为一种de-bounce机制。此外,步骤S502所执行的判断程序可以系通过检测模块12、处理模块16或节点10的网络界面控制器来达成,本发明在此不加以限制,例如可通过ping节点10上BMC的NIC来检测节点10是否***。
在步骤S506中,若判断出节点10***服务器***1且已经过第一预设时间,则接着判断节点10于第二预设时间中是否仍持续***服务器***1。若判断节点10于第二预设时间中仍持续***服务器***1,表示节点10与所***服务器***1中的位置皆正确无误,则执行步骤S308之后的步骤;若判断节点10于第二预设时间中拔离服务器***1,表示节点10与所***服务器***1中的位置可能有错误或插错节点10而被拔离,则执行步骤S300之后的步骤,以将正确的节点10***至服务器***1中的正确位置,所以步骤S506的判断机制为一种人为防呆(fool-proofing)机制。
此外,步骤S506中所执行的判断程序可以通过检测模块12、处理模块16或节点10的网络界面控制器来达成,本发明在此不加以限制,例如可通过ping节点10上BMC的NIC来检测节点10是否持续***。藉此,通过图5的判断机制除了可以避免因网络不稳或接触不良所造成的误判节点10已***服务器***1的情况之外,还能让使用者有机会当误差节点时,有机会将此节点拔除并***正确的节点,换句话说,图5的判断机制为一种de-bounce机制与防呆(fool-proofing)机制的组合。
综合以上所述,本发明实施例提供的服务器***与节点替换方法,其通过检测节点的识别码与节点中的硬件的硬件配置信息,来判断节点或节点中的硬件是否已被替换或新的节点是否被加入,进而选择性地执行节点替换程序或对此节点安装操作***、软件包数据或固件包数据,甚至在节点或硬件没被替换下,也可强制重新对此节点安装操作***、软件包数据或固件包数据。此外,本发明的服务器***与节点替换方法还可于节点安装操作***、软件包数据或固件包数据后,持续地检测节点中的硬件状况,并于节点中的硬件产生错误时通过提示信号来让使用者得知可以进行节点替换程序。藉此,本发明的服务器***与节点替换方法可以自动地执行节点是否需要换置的处理程序,使用者仅需依据提示信号来将节点***或拔离服务器***,而不需要去做其他的检测程序,十分具有实用性。
当然,本发明还可有其它多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

Claims (10)

1.一种节点替换方法,适用于一服务器***,其特征在于,该节点替换方法包括:
检测一节点是否***该服务器***,并于检测到该节点***该服务器***时产生一第一提示信号,该第一提示信号用以指示该节点不能拔离该服务器***;
检测该节点的一第一识别码与该节点中的一硬件的一第一硬件配置信息;
依据该第一识别码与该第一硬件配置信息以及该节点***该服务器***之前的一第二识别码与一第二硬件配置信息,判断该节点或该节点中的该硬件是否已被替换;
若判断出该节点与该节点中的该硬件皆未被替换,则关闭该节点的电源,以执行一节点替换程序;以及
若判断出该节点或该节点中的该硬件被替换,则对该节点安装一操作***、一软件包数据与一固件包数据至少其中之一。
2.如权利要求1所述的节点替换方法,其特征在于,于对该节点安装该操作***、该软件包数据与该固件包数据至少其中之一的步骤之后,还包括:
持续检测该节点中的该硬件的状况,以判断该硬件是否发生错误;
若判断出该硬件产生不可修复的错误,则关闭该节点的电源,以执行该节点替换程序;以及
若判断出该硬件产生可修复的错误次数达到预设的门槛值,则对该节点进行正常关机程序,并据以执行该节点替换程序。
3.如权利要求1所述的节点替换方法,其特征在于,该节点替换程序包括:
将该节点设定为一初始模式;
产生一第二提示信号,该第二提示信号用以指示该节点能拔离该服务器***;
检测该节点是否拔离该服务器***;
检测该节点或另一该节点是否***该服务器***;以及
若检测到该节点或另一该节点***该服务器***,则产生该第一提示信号,并且接续检测该节点的该第一识别码与该节点中的该硬件的该第一硬件配置信息之后的步骤。
4.如权利要求3所述的节点替换方法,其特征在于,于检测该节点是否拔离该服务器***的步骤中,还包括:
设定一第一预设时间并开始计时;
判断该节点是否已拔离该服务器***;
若判断出该节点尚未拔离该服务器***,则重置该第一预设时间并重新计时;以及
若判断出该节点拔离该服务器***且已经过该第一预设时间,则执行检测该节点或另一该节点是否***该服务器***之后的步骤。
5.如权利要求3所述的节点替换方法,其特征在于,于检测该节点或另一该节点是否***该服务器***的步骤中,还包括:
设定一第一预设时间与一第二预设时间并开始计时,其中该第二预设时间接续于该第一预设时间后;
判断该节点是否***该服务器***;
若判断出该节点尚未***该服务器***,则重置该第一预设时间并重新计时;
若判断出该节点***该服务器***且已经过该第一预设时间,则接着判断该节点于该第二预设时间中是否仍持续***该服务器***;
若判断出该节点于该第二预设时间中拔离该服务器***,则接续将该节点设定为该初始模式之后的步骤;以及
若判断出该节点于经过该第二预设时间后仍未拔离该服务器***,则产生该第一提示信号,并且接续检测该节点的该第一识别码与该节点中的该硬件的该第一硬件配置信息之后的步骤。
6.一种服务器***,其特征在于,包括:
一节点,具有一硬件;
一检测模块,通讯连接该节点,用以检测该节点是否***或拔离该服务器***,以及用以检测该节点的一第一识别码与该硬件的一第一硬件配置信息;
一提示模块,通讯连接该检测模块,用以于该检测模块检测到该节点***该服务器***时产生一第一指示信号,该第一指示信号用以指示该节点不能拔离该服务器***;以及
一处理模块,通讯连接于该检测模块与该节点之间,用以依据该第一识别码与该第一硬件配置信息以及该节点***该服务器***之前的一第二识别码与一第二硬件配置信息来判断该节点或该硬件是否已被替换;
其中,若该处理模块判断出该节点与该硬件皆未被替换,则关闭该节点的电源,以执行一节点替换程序,若该处理模块判断出该节点或该硬件被替换,则对该节点安装一操作***、一软件包数据与一固件包数据至少其中之一。
7.如权利要求6所述的服务器***,其特征在于,于该处理模块对该节点安装该操作***、该软件包数据与该固件包数据至少其中之一之后,该处理模块还持续判断该硬件是否发生错误,若判断出该硬件产生不可修复的错误,则关闭该节点的电源,以执行该节点替换程序,若判断出该硬件产生可修复的错误次数达到预设的门槛值,则对该节点进行正常关机程序,并据以执行该节点替换程序。
8.如权利要求6所述的服务器***,其特征在于,于该服务器***执行该节点替换程序时,该处理模块将该节点设定为一初始模式,接着该提示模块产生一第二提示信号,该第二提示信号用以指示该节点能拔离该服务器***,再来该检测模块检测该节点是否拔离该服务器***,并于检测到该节点拔离该服务器***后接续检测该节点或另一该节点是否***该服务器***,若该检测模块检测到该节点或另一该节点***该服务器***,则该提示模块产生该第一提示信号,并且该检测模块接续检测该节点的该第一识别码与该硬件的该第一硬件配置信息之后的处理程序。
9.如权利要求8所述的服务器***,其特征在于,该服务器***还包括一计时模块,该计时模块通讯连接该检测模块,于该检测模块检测该节点是否拔离该服务器***时,该计时模块设定一第一预设时间并开始计时,若该检测模块检测出该节点于该第一预设时间内仍未拔离该服务器***,则该计时模块重置该第一预设时间并重新计时,若该检测模块检测出该节点拔离该服务器***且已经过该第一预设时间,则接续检测该节点或另一该节点是否***该服务器***之后的处理程序。
10.如权利要求8所述的服务器***,其特征在于,该服务器***还包括:
一计时模块,该计时模块通讯连接该检测模块,于该检测模块检测该节点或另一该节点是否***该服务器***时,该计时模块设定一第一预设时间与一第二预设时间并开始计时,其中该第二预设时间接续于该第一预设时间后,若该检测模块检测出该节点于该第一预设时间内尚未***该服务器***,则该计时模块重置该第一预设时间并重新计时,若该检测模块检测出该节点***该服务器***且已经过该第一预设时间,则接续检测该节点于该第二预设时间中是否仍持续***该服务器***,若该检测模块检测出该节点于该第二预设时间中拔离该服务器***,则接续该处理模块将该节点设定为该初始模式的处理程序,若该检测模块检测出该节点于经过该第二预设时间后仍未拔离该服务器***,则该提示模块产生该第一提示信号,并且该检测模块接续检测该节点的该第一识别码与该硬件的该第一硬件配置信息之后的处理程序。
CN201310597425.0A 2013-11-22 2013-11-22 服务器***与节点替换方法 Active CN104657166B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310597425.0A CN104657166B (zh) 2013-11-22 2013-11-22 服务器***与节点替换方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310597425.0A CN104657166B (zh) 2013-11-22 2013-11-22 服务器***与节点替换方法

Publications (2)

Publication Number Publication Date
CN104657166A true CN104657166A (zh) 2015-05-27
CN104657166B CN104657166B (zh) 2018-03-20

Family

ID=53248348

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310597425.0A Active CN104657166B (zh) 2013-11-22 2013-11-22 服务器***与节点替换方法

Country Status (1)

Country Link
CN (1) CN104657166B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110457074A (zh) * 2019-07-26 2019-11-15 新华三技术有限公司成都分公司 计算节点的配置方法、装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001082678A2 (en) * 2000-05-02 2001-11-08 Sun Microsystems, Inc. Cluster membership monitor
CN102135932A (zh) * 2011-03-08 2011-07-27 浪潮(北京)电子信息产业有限公司 一种监控***及监控方法
CN102769673A (zh) * 2012-07-25 2012-11-07 楚云汉智武汉网络存储***有限公司 一种适应于大规模存储集群的失效检测方法
CN103186403A (zh) * 2011-12-28 2013-07-03 英业达股份有限公司 节点置换处理方法与使用该方法的服务器***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001082678A2 (en) * 2000-05-02 2001-11-08 Sun Microsystems, Inc. Cluster membership monitor
CN102135932A (zh) * 2011-03-08 2011-07-27 浪潮(北京)电子信息产业有限公司 一种监控***及监控方法
CN103186403A (zh) * 2011-12-28 2013-07-03 英业达股份有限公司 节点置换处理方法与使用该方法的服务器***
CN102769673A (zh) * 2012-07-25 2012-11-07 楚云汉智武汉网络存储***有限公司 一种适应于大规模存储集群的失效检测方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110457074A (zh) * 2019-07-26 2019-11-15 新华三技术有限公司成都分公司 计算节点的配置方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN104657166B (zh) 2018-03-20

Similar Documents

Publication Publication Date Title
CN106648958B (zh) 基本输入输出***回复管理***及其方法以及程序产品
US6976197B2 (en) Apparatus and method for error logging on a memory module
CN106445577A (zh) 更新方法、服务器***以及非瞬态计算机可读取介质
CN103399254A (zh) 板卡在位的检测方法及装置
US20190042753A1 (en) Validating an image using an embedded hash in an information handling system
TWI576706B (zh) 用於早期啟動階段之方法及相關裝置
CN109983735B (zh) 用于监测网络拓扑的方法、设备和存储设备
US20080270827A1 (en) Recovering diagnostic data after out-of-band data capture failure
KR101938203B1 (ko) 컴퓨터 시스템의 하드웨어 및 소프트웨어의 에러 발생 여부를 통합적으로 관리하는 장치
CN102710740B (zh) 一种设备标识符确定方法
TWI677250B (zh) 網路系統及認證方法
CN116662091A (zh) 服务器高速线缆检测方法、装置、设备和存储介质
US20070294430A1 (en) Generating a device address persistent across different instantiations of an electronic device
US8391162B2 (en) Apparatus and method for testing SMNP cards
CN103957130B (zh) 故障检测及恢复方法和***
CN107179972A (zh) 用于测试计算机的方法、微控制器、测试设备和测试***
CN104657166A (zh) 服务器***与节点替换方法
CN116450391A (zh) 一种故障定位方法、装置、设备及介质
CN115934446A (zh) 一种自检方法、服务器、设备和存储介质
JP5683354B2 (ja) 監視装置、及び監視方法
JP6217086B2 (ja) 情報処理装置、エラー検出機能診断方法およびコンピュータプログラム
CN112596983A (zh) 一种服务器内连接器的监测方法
JP2018110345A (ja) 設定プログラム、設定方法、及び設定装置
TWI518519B (zh) 伺服器系統與節點替換方法
KR101938202B1 (ko) 컴퓨터 시스템에 포함된 하드웨어의 에러 발생 여부를 통합적으로 관리하여 백업 및 복구를 수행하여 외부 단말에 알리는 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant