CN107526665B - 机箱管理***及机箱管理方法 - Google Patents

机箱管理***及机箱管理方法 Download PDF

Info

Publication number
CN107526665B
CN107526665B CN201610864545.6A CN201610864545A CN107526665B CN 107526665 B CN107526665 B CN 107526665B CN 201610864545 A CN201610864545 A CN 201610864545A CN 107526665 B CN107526665 B CN 107526665B
Authority
CN
China
Prior art keywords
chassis
management
management controller
controllers
virtual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610864545.6A
Other languages
English (en)
Other versions
CN107526665A (zh
Inventor
古凯帆
蔡锦富
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Quanta Computer Inc
Original Assignee
Quanta Computer Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Quanta Computer Inc filed Critical Quanta Computer Inc
Publication of CN107526665A publication Critical patent/CN107526665A/zh
Application granted granted Critical
Publication of CN107526665B publication Critical patent/CN107526665B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/445Program loading or initiating
    • G06F9/44505Configuring for program initiating, e.g. using registry, configuration files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3031Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a motherboard or an expansion card
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K7/00Constructional details common to different types of electric apparatus
    • H05K7/14Mounting supporting structure in casing or on frame or rack
    • H05K7/1485Servers; Data center rooms, e.g. 19-inch computer racks
    • H05K7/1498Resource management, Optimisation arrangements, e.g. configuration, identification, tracking, physical location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3027Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a bus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3048Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the topology of the computing system or computing system component explicitly influences the monitoring activity, e.g. serial, hierarchical systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/14Handling requests for interconnection or transfer
    • G06F13/36Handling requests for interconnection or transfer for access to common bus or bus system
    • G06F13/362Handling requests for interconnection or transfer for access to common bus or bus system with centralised access control
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/40Bus structure
    • G06F13/4004Coupling between buses
    • G06F13/4027Coupling between buses using bus bridges

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Debugging And Monitoring (AREA)
  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)

Abstract

机箱管理***及机箱管理方法。该机箱管理***包括:多个主机板,设置于一机箱中;多个基板管理控制器,上述基板管理控制器的每一个与上述主机板的一个有关;以及至少一机箱等级元件,其中上述基板管理控制器通过一第一通信总线互相连接,上述基板管理控制器与上述至少一机箱等级元件通过一第二通信总线互相连接,上述基板管理控制器中的一个用以操作为上述机箱的一虚拟机箱管理控制器,上述虚拟机箱管理控制器用以通过上述第一通信总线与上述基板管理控制器中的其他的基板管理控制器交换数据且通过上述第二通信总线管理上述至少一机箱等级元件。

Description

机箱管理***及机箱管理方法
技术领域
本发明涉及计算机***,特别涉及一种用以管理一服务器机箱的***及方法。
背景技术
计算机设备通常被存储或安装于数据中心中的服务器机架(server rack)上。每个机架可以有组织配置的方式来容纳多个元件,此有组织配置的方式有效率地利用空间,且使计算机设备及相关的基础设施设置于***管理者可轻易到达的范围内。数据中心中的许多计算机设备以服务器的形式呈现,此等服务器被存储于标准化的服务器机架(诸如:19英寸的机架机柜)中所堆迭的外壳中。
服务器机架安装许多计算模块(诸如:托盘(tray)、机箱(chassis)、滑槽式计算机服务器(sled)等),此等计算模块被设置且堆迭于此服务器机架中。服务器机架允许计算机模块的垂直配置,以有效率地使用空间。服务器机架中的机箱通常包括一或多个服务器,每个服务器由基板管理控制器(BMC)来予以管理。基板管理控制器可管理在***管理软件与平台硬件间的接口。内建于服务器中的不同型式的传感器可回报参数(诸如:温度、冷却风扇速度、功率状态、操作***的状态等)给基板管理控制器。若任何参数没有在预设的范围(preset limit)内,基板管理控制器可监控传感器及拥有可藉由网络接口传送警告讯息(alert)给***管理员的能力,并指出***的潜在错误(failure)。
每个机箱还包括安装于机架中的风扇,多个电源供应单元(PSUs),多个传感器,多个网络卡,以及其他诸如此类的硬件元件。与每个服务器如何包括用以管理各种服务器功能的基板管理控制器类似的是,机箱典型上包括用以管理各种机箱功能(诸如:风扇控制、电源管理、传感器管理、和/或允许通过网络进行远端管理)的机箱管理控制器。
发明内容
下列段落提供本发明一或多个实施例中的简单摘要以提供本发明技术的基本理解。此摘要并非本发明技术的所有考虑的实施例的扩展概观,且不是用以分辨所有例子的关键或重要元件也不是描述本发明中任何或所有方面的范围。其目的是以一简单形式呈现一或多个实施例中的一些概念以做为本发明后述详细说明部分的前言。
一种机箱管理***包括一机箱中的多个主机板、多个基板管理控制器以及至少一机箱等级元件。上述基板管理控制器的每一个与上述主机板的一个有关。上述基板管理控制器通过一第一通信总线互相连接。上述基板管理控制器与上述至少一机箱等级元件通过一第二通信总线互相连接。上述基板管理控制器中的一个用以操作为上述机箱的一虚拟机箱管理控制器。上述虚拟机箱管理控制器用以通过上述第一通信总线与上述基板管理控制器中的其他的基板管理控制器交换数据且通过上述第二通信总线管理上述至少一机箱等级元件。
在某些实施例中,机箱管理***还包括一机箱管理控制器,其中当上述机箱管理控制器故障时,上述基板管理控制器中的上述一个***作为上述虚拟机箱管理控制器。在某些实施例中,上述基板管理控制器的上述一个被用以作为一预设的虚拟机箱管理控制器。在某些实施例中,上述基板管理控制器中的上述一个是根据一管理者选择***作为上述虚拟机箱管理控制器。
在某些实施例中,当判断出上述基板管理控制器中的上述一个不可***作为上述虚拟机箱管理控制器时,上述基板管理控制器中的另一个***作为上述虚拟机箱管理控制器。在某些实施例中,用以机箱管理的上述***还包括用以将上述虚拟机箱管理控制器连接至一或多个机箱等级元件的一通用目的基本输入输出扩展器。
在某些实施例中,上述第一通信总线为一智能平台管理总线。在某些实施例中,上述第二通信总线为一内部集成电路(Inter-Integrated Circuit,简称I2C)总线。在某些实施例中,上述至少一机箱等级元件包括一传感器、一风扇或一电源供应单元中的至少一个。
另一机箱管理***包括一机箱交换器、多个主机板、多个基板管理控制器以及至少一机箱等级元件。上述基板管理控制器的每一个与上述主机板的一个有关且耦接至上述机箱交换器。上述基板管理控制器通过一第一通信总线互相连接。上述基板管理控制器与上述至少一机箱等级元件通过一第二通信总线互相连接。上述至少一机箱等级元件通过上述第二通信总线耦接至上述机箱交换器。上述机箱交换器用以与上述机板管理控制器中的上述基板管理控制器交换数据且选择性地将上述至少一机箱等级元件的每一个连接至上述基板管理控制器的一个。
在某些实施例中,上述机箱交换器用以判断出上述基板管理控制器的哪一个连接于上述至少一机箱等级元件的每一个。在某些实施例中,上述机箱交换器用以根据一优先图表判断出上述基板管理控制器的哪一个连接于上述至少一机箱等级元件的每一个。在某些实施例中,上述机箱交换器用以根据上述至少一机箱等级元件的每一个的分类类型判断出上述基板管理控制器的哪一个连接于上述至少一机箱等级元件的每一个。
附图说明
本发明的实施例将可参考附图与后续的详细说明而得知,其中:
图1是描绘出现有技术中包括一机箱管理控制器的一***的方块图;
图2是描绘出用以机箱管理的一第一范例***的一方块图;
图3是描绘出用以机箱管理的一第二范例***的一方块图;
图4是根据图2的***描绘出用以机箱管理的一实施方法;以及
图5为计算机***的一实施例的方块图。
【符号说明】
100~***;
110、210、310~基板管理控制器;
120、220、320~主机板;
130、230、330~机箱等级元件;
150~机箱管理控制器;
200~第一范例***;
240、340~通用目的输入输出扩展器;
300~第二范例***;
350~机箱交换器;
400~方法;
410、420、430、440、450~步骤;
500~计算机***;
510~基本输入输出***;
520~存储器;
530~存储单元;
540~处理器;
550~网络接口;
560~北桥;
570~南桥;
580~管理控制器。
具体实施方式
本发明提供一种用以管理一服务器机箱的技术。本技术的各个方面将参照图中所示进行说明。在以下描述中,出于解释的目的,许多具体细节被阐述以便提供一或多个方面的彻底理解。然而,可以显而易见的是,本技术可以在没有这些具体细节的情况下实施。在其他实施例中,为了便于描述这些面貌,已知结构以及设备以方块图的形式展示。
本发明公开一种服务器机箱的管理***及管理方法。服务器机箱可包括一具有一单一主机板(例如:刀锋服务器或微软服务器)的单一服务器,或可包括具有多个主机板的多个服务器。服务器机箱中的每个服务器可被与服务器中的主机板相关的一基板管理控制器所管理。本发明提供一虚拟机箱管理控制器用以缩减(eliminate)使用一分离的(separate)物理机箱管理控制器管理服务器等级元件的需求。
图1是描绘出现有技术中包括一机箱管理控制器150的一***100的方块图。***100包括多个主机板120、与每个主机板120有关的一控制器(基板管理控制器)110、机箱管理控制器150以及至少一机箱等级元件(chassis level component)130。
机箱等级元件130可包括像是风扇、电源供应单元、多种传感器(例如:电压传感器、电流传感器或温度传感器)、现场可更换单元(field replaceable unit;FRU)、发光二极管,诸如此类的装置。
在某些实施例中,控制器为一基板管理控制器110或可实现本发明所描述功能的其他控制器。基板管理控制器110为用以管理***管理软件及平台硬件间的接口的一控制器。在某些实施例中,每个基板管理控制器110可管理服务器内的硬件元件(例如:处理器、存储器、存储装置、电源供应单元、风扇、机板(boards),诸如此类的硬件元件)。
机箱管理控制器150为用以与每个基板管理控制器110进行通信及用以管理机箱等级元件130的一微控制器。机箱管理控制器150监控且确保***100内装置的健康度。每个基板管理控制器110使用一智能平台管理总线连接至机箱管理控制器150。机箱管理控制器150通过一内部集成电路(Inter-Intergated Circuit,简称I2C)总线和/或一通用目的输入输出(GPIO)接口连接至多个机箱等级元件。
基板管理控制器为一智能平台管理接口子***的一部分,智能平台管理接口子***还包括一非易失性存储装置以及其他分配至不同***模块的卫星控制器。甚至当服务器断电或关机时,智能平台管理接口子***可独立操作于一服务器之外且可以工作。当服务器当机时,智能平台管理接口子***及一网络接口控制器甚至可操作于待机模式或一低功耗模式。
基板管理控制器使用智能平台管理接口(IPMI)协议与多个服务器元件进行通信。智能平台管理接口用在一独立的计算机子***的一组规范,该组规范用以管理且监控一计算机***的中央处理单元(CPU)、固件以及操作***,并且由多个管理者进行***频外管理(out-of-band management)及监控。基板管理控制器可使用任何总线接口(例如:***管理总线、RS-232串行总线、IIC协议、以太、智能平台管理接口协议,LPC总线,诸如此类的总线接口)连接至多个服务器元件(例如:南桥或网络接口控制器)。IIC协议的特色为使用一7位或一10位地址空间(address space)的一串行数据线(Serial Data Line)及一串行时钟线(Serial Clock Line)的一多主控(multi-master)、多从控(multi-slave)、单端式(single-ended)、串行计算机(serial computer)的总线。***管理总线(SMBus)协议的特征为衍生自IIC协议的一单端式、双线式(two-wire)总线,且使用IIC硬件及IIC定址(addressing)。智能平台管理接口总线为一基于IIC串行总线用以连接服务器内的多个机板。
每个通用目的输入输出针脚为的在一集成电路上没有具有预先设定目的且没有被预设使用的一通用针脚。通用目的输入输出针脚可被设定为输入或输出、致能或禁用。通用目的输入输出接口可用以连接多种装置。
***100需要一物理装置(例如:一微处理器)以作为机箱管理控制器150。这样一个物理装置增加***100的总设备开销、维持开销以及复杂度。物理装置也导致管理机箱等级元件130的一延迟。
图2是描绘出用以机箱管理的一第一范例***200的一方块图。第一范例***200包括多个主机板220、多个控制器(基板管理控制器)210,其中每个基板管理控制器210与主机板220中的一个有关,以及至少一机箱等级元件230。
机箱等级元件230可包括像是风扇、电源供应单元、多种传感器(例如:电压传感器、电流传感器或温度传感器)、现场可更换单元、发光二极管,诸如此类的装置。
举例而言,每个控制器为一基板管理控制器210或可实现本发明所描述功能的其他控制器。基板管理控制器210为用以管理***管理软件及平台硬件间的接口的一控制器。在某些实施例中,每个基板管理控制器210可管理服务器内的硬件元件(例如:处理器、存储器、存储装置、电源供应单元、风扇、板,诸如此类的硬件元件)。
基板管理控制器210通过一第一通信总线互相通信。基板管理控制器210与机箱等级元件230通过一第二通信总线互相通信。在某些实施例中,第一通信总线为一智能平台管理总线,第二通信总线为一内部集成电路总线。
与图1的***100不同之处在于第一范例***200不需要一机箱管理控制器150。相反地,第一范例***200利用(leverage)每个基板管理控制器210具有足够计算能力的这个事实以进行同图1的机箱管理控制器150的操作。因此,除了基板管理控制器210的标准功能之外,第一范例***200的基板管理控制器210中的一个用以操作为一虚拟机箱管理控制器以进行如图1所示的机箱管理控制器150的一或多个功能。
在某些实施例中,第一范例***200包括一机箱管理控制器。然而,在机箱管理控制器故障时,基板管理控制器210中的一个可做为虚拟机箱管理控制器。
在某些实施例中,一***管理者(例如:通过频内网络或是频外网络的一命令)选择基板管理控制器210中的一个作为虚拟机箱管理控制器。在某些实施例中,基板管理控制器210中的一个被预选(pre-selected)为一预设的虚拟机箱管理控制器。在某些实施例中,若基板管理控制器210中的一个不可作为虚拟机箱管理控制器,基板管理控制器210中的另一个用以作为虚拟机箱管理控制器。
虚拟机箱管理控制器用以通过第一通信总线与其他基板管理控制器210进行通信。虚拟机箱管理控制器通过第二通信总线管理机箱等级元件230。虚拟机箱管理控制器监控且确保第一范例***200内装置的健康度。在某些实施例中,基板管理控制器210于制造时就预先被设置具有一机箱管理控制器的功能。在某些实施例中,一***管理者安装允许基板管理控制器210包括传统的机箱管理控制器的功能的固件至基板管理控制器210。
在某些实施例中,机箱等级元件230包括一通用目的输入输出扩展器240。通用目的输入输出扩展器240致使虚拟机箱管理控制器使用通用目的输入输出接口。虚拟机箱管理控制器可通过内部集成电路总线连接至通用目的输入输出接口连接至通用目的输入输出扩展器240。
图3是描绘出用以机箱管理的一第二范例***300的一方块图。第二范例***300包括一机箱交换器350、多个主机板320、多个控制器(基板管理控制器)310、其中每个基板管理控制器310与主机板320中的一个有关,以及至少一机箱等级元件330。
机箱等级元件330可包括像是风扇、电源供应单元、多种传感器(例如:电压传感器、电流传感器或温度传感器)、现场可更换单元、发光二极管,诸如此类的装置。
举例而言,每个控制器为一基板管理控制器310或可实现本发明所描述功能的其他控制器。基板管理控制器310为用以管理***管理软件及平台硬件间的接口的一控制器。在某些实施例中,每个基板管理控制器310可管理服务器内的硬件元件(例如:处理器、存储器、存储装置、电源供应单元、风扇、板,诸如此类的硬件元件)。
基板管理控制器310通过一第一通信总线互相通信。基板管理控制器310与机箱等级元件330通过一第二通信总线互相通信。在某些实施例中,第一通信总线为一智能平台管理总线,第二通信总线为一内部集成电路总线。
与图1的***100不同之处在于第二范例***300不包括一机箱管理控制器150。相反地,除了基板管理控制器310的标准功能之外,第二范例***300设置每个基板管理控制器310以进行图1的机箱管理控制器150的一或多个功能。机箱交换器350用以与多个基板管理控制器交换数据且将机箱等级元件330中的每一个选择性地连接至基板管理控制器中的一个。
在某些实施例中,机箱交换器350用以判断基板管理控制器310中的哪一个连接至每个机箱等级元件。举例而言,每个基板管理控制器310被指派以连接至机箱等级元件330中的不同组的元件。
在某些实施例中,机箱交换器350用以根据一优先图表(priority table)判断出基板管理控制器310的哪一个连接于至少一机箱等级元件的每一个。
在某些实施例中,机箱交换器350用以根据机箱等级元件330的每一个的分类类型(classification type)判断出基板管理控制器310的哪一个连接于至少一机箱等级元件的每一个。
在某些实施例中,机箱等级元件330包括致使一BMC使用通用目的输入输出接口的一通用目的输入输出扩展器340。通用目的输入输出扩展器340致使虚拟机箱管理控制器使用通用目的输入输出接口。通用目的输入输出扩展器340可使用通用目的输入输出针脚将基板管理控制器310连接至多种装置。
图4是根据图2的***描绘出用以机箱管理的一实施方法400。在步骤410中,开启一机箱的电源。
在步骤420中,判断机箱管理控制器是否可用于管理机箱。举例而言,一基板管理控制器可判断机箱管理控制器是否可用。
在步骤430中,当判断出机箱管理控制器不可用时,多个基板管理控制器中的一个用以操作为一虚拟机箱管理控制器,其中每个基板管理控制器与机箱中多个主机板中的一个有关。
在步骤440中,第一虚拟机箱管理控制器通过一第一通信总线与多个基板管理控制器的其他基板管理控制器交换数据。
在步骤450中,第一虚拟机箱管理控制器通过一第二通信总线管理至少一机箱等级元件的第一组机箱等级元件。
在某些实施例中,方法400判断出每个基板管理控制器是否具有虚拟机箱管理控制器的功能。方法400判断出每个基板管理控制器是否可管理至少一机箱等级元件的第一组机箱等级元件。方法400根据基板管理控制器是否具有虚拟机箱管理控制器的功能以及基板管理控制器是否可管理至少一机箱等级元件的第一组机箱等级元件,从多个基板管理控制器中选择多个基板管理控制器的一个以作为虚拟机箱管理控制器。
在某些实施例中,方法400判断出一机箱交换器是否可用。当判断出机箱交换器为可用时,方法400通过机箱交换器选择性地将机箱等级元件的第一组机箱等级元件连接至虚拟机箱管理控制器。方法400通过机箱交换器选择性地将机箱等级元件的第二组机箱等级元件连接至第二虚拟机箱管理控制器。
在某些实施例中,机箱交换器通过第二通信总线连接至至少一机箱等级元件的第一组机箱等级元件、至少一机箱等级元件的第二组机箱等级元件以及多个基板管理控制器。
在某些实施例中,方法400藉由第二虚拟机箱管理控制器通过第一通信总线与多个基板管理控制器中的其他基板管理控制器交换数据。方法400藉由第二虚拟机箱管理控制器通过第二通信总线管理至少一机箱等级元件的第二组机箱等级元件。
图5为计算机***500的一实施例的方块图。计算机***500可包括一处理器540、一网络接口550、一管理控制器580、一存储器520、一存储单元530、一基本输入输出***510、一北桥560以及一南桥570。
举例而言,计算机***500可为一服务器(例如:一数据中心之一服务器机箱中的一个)或一个人计算机。处理器(例如:中央处理单元)540为一主机板上的一芯片(chip)以读取和执行存储于存储器520上的程序指令。处理器540可为具有单处理内核的单一CPU、具有多处理内核的单一CPU,或多个CPU。一或多个总线(未图示)在多个计算机元件(例如:处理器540、存储器520、存储单元530和网络接口550)间传送指令和应用程序数据。
存储器520包括用以暂时性地或永久性地存储数据或程序的任意物理装置(例如:各种形式的随机存取存储器(RAM))。存储单元530包括用在非易失性数据存储的任意物理装置(例如:一硬盘(HDD)或一随身碟)。存储单元530具有比存储器520更大的容量且更经济的每单位存储,但存储单元530具有比存储器520更低的传送速率。
基本输入输出***510包括一基本输入输出***(BIOS)或其后继者(successors)或等效元件(equivalents),例如一扩展可扩展固件接口(EFI)或一统一扩展可扩展固件接口(UEFI)。基本输入输出***510包括位于一计算机***500的主机板(mother board)上的一基本输入输出***芯片,用以存储一基本输入输出***软件程序。基本输入输出***510存储一固件,此固件搭配着为基本输入输出***510所指定的一组配置于计算机***第一次开机时被执行。基本输入输出***固件和基本输入输出***配置可被存储于一非易失性存储器(例如:非易失性随机存取存储器)或一只读存储器(例如:快闪存储器)中。快闪存储器是可被电性抹除(erased)且重新编程(reprogram)的一非易失性计算机存储介质(non-volatile computer storage medium)。
每次计算机***500被启动时,基本输入输出***510可当作一串程序被读取与执行。基本输入输出***510可根据一组配置去辨识、初始化与测试存在于计算机***中的硬件。基本输入输出***510可进行在计算机***500上的自我检测(self-test),例如开机自我检测(Power-on-Self-Test,POST)。自我检测可测试多种硬件元件(例如:硬盘、光学读取装置、冷却装置、存储器模块、扩展卡等等)的功能。基本输入输出***可定址和分配存储器520中的一个区域用以存储一操作***。然后,基本输入输出***510就可以把计算机***的控制权交给操作***。
计算机***500中的基本输入输出***510可包括一基本输入输出***配置,上述基本输入输出***配置定义基本输入输出***510如何控制在计算机***500中的多种硬件单元。基本输入输出***配置可判断计算机***500中多种硬件单元启动的顺序。基本输入输出***510可提供一个允许设定许多不同参数的接口,并且这些参数不同于基本输入输出***的预设配置。举例来说,一使用者(例如:***管理者)可使用基本输入输出***510指定(specify)时刻和总线速度,指定那些***设备连接至计算机***,指定监控健康(monitoring of health)(例如:风扇速度和CPU温度限制)和指定多种其他可影响计算机***整体效能和使用功率的参数。
管理控制器580可为设置于计算机***(更广泛来说为一服务器)的主机板的一专用微控制器(specialized microcontroller)。管理控制器580可管理在***管理软件与平台硬件间的接口。设置于计算机***中的不同型式的传感器可回报参数(例如:温度、冷却风扇速度、功率状态、操作***的状态等等)给管理控制器580。管理控制器580可以监控传感器,若任何参数没有在预设的范围内,管理控制器580拥有可藉由网络接口550传送警告讯息给***管理者的能力,并指出***的潜在错误(failure)。***管理者也可远端地与管理控制器580通信,进行校正的动作(例如:***的重新设定(resetting)或冷开机(powercycling))用以回复***的功能。
北桥560可为设置于主机板上可直接连接至处理器540或可整合至处理器540的一芯片。举例而言,北桥560与南桥570可组合成一单一的芯片(single die)。北桥560与南桥570管理处理器540与主机板上其他部分之间的通信。北桥560管理比南桥570的更高效能的工作。北桥560也管理多个处理器540、存储器520以及图像控制器(未图示)间的通信。举例而言,北桥560包括一图像控制器。
南桥570可为设置于主机板上连接至北桥560的一芯片,但与北桥560不同的地方在于南桥570无直接连接至处理器540。南桥管理多个输入/输出功能(例如:计算机***500的通用串行总线、音频、串行、基本输入输出***、串行ATA(SATA)、互连总线(PeripheralComponent Interconnect bus)、互连扩展总线(PCI eXtended(PCI-X)bus)、快速***组件互连总线(PCI Express bus)、工业标准结构总线(ISA bus)、串行***接口总线(SPIbus)、e-串行***接口总线(eSPI bus)、***管理总线(SMBus))。南桥570可连接至管理控制器、直接存储器存取(DMAs)控制器、可编程中断控制器(PICs)、及即时时钟;或管理控制器、直接存储器存取(DMAs)控制器、可编程中断控制器(PICs)、及即时时钟可包括于南桥570内。在某些实施例中,在北桥560集成至处理器540时,南桥570直接连接至处理器540。
多种各种说明性的逻辑区块、模块、及电路以及在此所公开的各种情况可实施在或执行于一般用途处理器、数字信号处理器(digital signal processor,DSP)、特定应用集成电路(application specific integrated circuit,ASIC)、现场可编程门阵列(fieldprogrammable gate array,FPGA)或其他可编程逻辑装置、离散门(discrete gate)或晶体管逻辑(transistor logic)、离散硬件元件、或任何以上的组合的设计以完成在此文内描述的功能。一般用途处理器可能是微处理器,但也可能是任何常规处理器、控制器、微控制器、或状态机。处理器可由计算机设备的组合所构成,例如:数字信号处理器(DSP)及一微计算机的组合、多组微计算机、一组至多组微计算机以及一数字信号处理器内核、或任何其他类似的配置。
本发明的说明书所公开的方法和算法的步骤,可以直接通过执行一处理器直接应用在硬件以及软件模块或两者的结合上。软件模块存储在随机存取存储器(Random AccessMemory,RAM)、快闪存储器(flash memory)、只读存储器(Read-Only Memory,ROM)、可抹除可编程只读存储器(EPROM)、电子抹除式可复写只读存储器(Electrically-ErasableProgrammable Read-Only Memory,EEPROM)、暂存器、硬盘、便携式应碟、光盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)或在此领域已知的技术中任何其它计算机可读取的存储介质格式中。存储介质可耦接至一处理器,例如可存储介质读取信息且写入信息至存储介质的处理器。在某些实施例中,存储介质可与处理器整合在一起。处理器与存储介质可设置于一特殊应用集成电路(ASIC)之中。特殊应用集成电路(ASIC)可设置于一使用者端(user terminal)中。在某些实施例中,存储介质可与处理器整合在一起。处理器与存储介质可设置成一使用者端(user terminal)中的分离的元件。
在某些设计中,前述的功能可以硬件、软件、固件或其组合的方式加以实现。若以软件的方式实现,前述的功能可存储于一非易失性计算机可读取介质上的一个或多个指令或编码,或存储于一非易失性计算机可读取介质上的一个或多个指令或编码。非易失性计算机可读取介质包含任何有助于将一计算机程序由一地方传送至另一地方的介质。存储介质可为被通用型或专用型计算机所存取的任何可能的介质。举例而言,此计算机可读取介质包括动态存取存储器(RAM)、只读存储器(ROM)、电子抹除式可编程只读存储器(EEPROM)、只读光盘CDROM或其它光学存储盘、磁盘存储装置或其它其他磁性存储装置,或任何可承载或存储指令型式或数据结构型式的所需程序代码并且可由通用或专用计算机或通用或专用处理器所存取的其它介质。举例而言,前述的碟片可为光盘(CD)、激光盘、光学盘、数字影音光盘(DVD)、软盘(floppy disk)或蓝光光盘,这些盘片藉由激光来重制(reproduce)数据,而磁盘则利用磁性来重制(reproduce)数据。前面公开的组合亦属于非易失性计算机可读取介质的范围。
然而以上所述仅为本公开的优选实施例而已,当不能以此限定本公开实施的范围,即大凡依本公开权利要求书及发明说明内容所作的简单的等效变化与修饰,皆仍属本公开专利涵盖的范围内。另外,本公开的任一实施例或权利要求书不须达成本公开所公开的全部目的或优点或特点。此外,摘要部分和标题仅是用来辅助专利文件搜寻之用,并非用来限制本公开的权利范围。

Claims (9)

1.一种机箱管理***,包括:
多个主机板,设置于机箱中;
多个基板管理控制器,上述基板管理控制器中的每一个与上述主机板中的一个有关;以及
至少一耦接到机箱交换器的机箱等级元件,其中上述基板管理控制器通过第一通信总线互相连接,上述基板管理控制器与上述至少一机箱等级元件通过第二通信总线互相连接,上述基板管理控制器中的一个用以操作为上述机箱的第一虚拟机箱管理控制器,上述基板管理控制器中的另一个用以操作为上述机箱的第二虚拟机箱管理控制器,其中上述至少一机箱等级元件中的第一组机箱等级元件通过第二通信总线被连接到所述第一虚拟机箱管理控制器,并且上述至少一机箱等级元件中的第二组机箱等级元件通过第二通信总线被连接到所述第二虚拟机箱管理控制器,上述虚拟机箱管理控制器用以通过上述第一通信总线与上述基板管理控制器中的其他的基板管理控制器交换数据且通过上述第二通信总线管理上述至少一机箱等级元件。
2.如权利要求1所述的机箱管理***,还包括机箱管理控制器,其中当上述机箱管理控制器故障时,上述基板管理控制器中的一个***作为上述虚拟机箱管理控制器。
3.如权利要求1所述的机箱管理***,其中当判断出上述基板管理控制器中的一个不可***作为上述虚拟机箱管理控制器时,上述基板管理控制器中的另一个***作为上述虚拟机箱管理控制器。
4.一种机箱管理***,包括:
机箱交换器;
多个主机板;
多个基板管理控制器,上述基板管理控制器中的每一个与上述主机板中的一个有关且耦接至上述机箱交换器,其中上述基板管理控制器通过第一通信总线互相连接,上述基板管理控制器与至少一机箱等级元件通过第二通信总线互相连接;以及
至少一机箱等级元件,通过上述第二通信总线耦接至上述机箱交换器,其中上述机箱交换器用以与上述基板管理控制器交换数据,上述基板管理控制器中的一个用以操作为上述机箱的第一虚拟机箱管理控制器,上述基板管理控制器中的另一个用以操作为上述机箱的第二虚拟机箱管理控制器,其中上述至少一机箱等级元件中的第一组机箱等级元件通过第二通信总线被连接到所述第一虚拟机箱管理控制器,并且上述至少一机箱等级元件中的第二组机箱等级元件通过第二通信总线被连接到所述第二虚拟机箱管理控制器。
5.一种机箱管理方法,包括:
启动机箱;
判断机箱管理控制器是否可用于管理上述机箱;
当判断出上述机箱管理控制器不可用于管理上述机箱时,将多个基板管理控制器中的一个操作为上述机箱的第一虚拟机箱管理控制器,将多个基板管理控制器中的另一个操作为上述机箱的第二虚拟机箱管理控制器,其中上述基板管理控制器中的每一个与上述机箱的多个主机板中的每一个有关;上述第一虚拟机箱管理控制器藉由第一通信总线与上述基板管理控制器中的其他的基板管理控制器交换数据;以及
上述第一虚拟机箱管理控制器藉由第二通信总线管理至少一机箱等级元件中的第一组机箱等级元件,
上述第二虚拟机箱管理控制器藉由第二通信总线管理至少一机箱等级元件中的第二组机箱等级元件。
6.如权利要求5所述的机箱管理方法,还包括:
判断上述基板管理控制器中的每一个是否具有虚拟机箱管理控制器功能;
判断上述基板管理控制器中的每一个是否可用以管理上述至少一机箱等级元件中的上述第一组机箱等级元件;以及
根据上述基板管理控制器中的一个是否具有上述虚拟机箱管理控制器功能以及上述基板管理控制器中的一个是否可用以管理上述至少一机箱等级元件中的上述第一组机箱等级元件,从上述基板管理控制器中选出一个作为上述第一虚拟机箱管理控制器。
7.如权利要求5所述的机箱管理方法,还包括:
判断机箱交换器是否可用;
当判断出上述机箱交换器为可用时,上述机箱交换器选择性地将上述至少一机箱等级元件的上述第一组机箱等级元件连接至上述第一虚拟机箱管理控制器;
上述机箱交换器选择性地将上述至少一机箱等级元件的一第二组机箱等级元件连接至一第二虚拟机箱管理控制器。
8.如权利要求7所述的机箱管理方法,其中上述机箱交换器通过上述第二通信总线与上述至少一机箱等级元件的上述第一组机箱等级元件、上述至少一机箱等级元件的上述第二组机箱等级元件以及上述基板管理控制器连接。
9.如权利要求7所述的机箱管理方法,还包括:
上述第二虚拟机箱管理控制器藉由上述第一通信总线与上述基板管理控制器中的其他的基板管理控制器交换数据。
CN201610864545.6A 2016-06-16 2016-09-30 机箱管理***及机箱管理方法 Active CN107526665B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US15/184,587 US10402207B2 (en) 2016-06-16 2016-06-16 Virtual chassis management controller
US15/184,587 2016-06-16

Publications (2)

Publication Number Publication Date
CN107526665A CN107526665A (zh) 2017-12-29
CN107526665B true CN107526665B (zh) 2021-04-20

Family

ID=58699065

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610864545.6A Active CN107526665B (zh) 2016-06-16 2016-09-30 机箱管理***及机箱管理方法

Country Status (5)

Country Link
US (1) US10402207B2 (zh)
EP (1) EP3261420A1 (zh)
JP (1) JP6515132B2 (zh)
CN (1) CN107526665B (zh)
TW (1) TWI631466B (zh)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI604304B (zh) * 2016-03-28 2017-11-01 緯創資通股份有限公司 電子裝置及其檢測方法
CN106250339B (zh) * 2016-07-26 2019-05-07 英业达科技有限公司 控制电路板、微服务器、控制***及其控制方法
US10298447B2 (en) * 2016-08-08 2019-05-21 American Megatrends, Inc. System and method for accessing real sensors for virtual service processor stack
US10083146B2 (en) * 2016-11-22 2018-09-25 Hewlett Packard Enterprise Development Lp Shared USB ports
US10810085B2 (en) 2017-06-30 2020-10-20 Western Digital Technologies, Inc. Baseboard management controllers for server chassis
US10805264B2 (en) * 2017-06-30 2020-10-13 Western Digital Technologies, Inc. Automatic hostname assignment for microservers
US10613950B2 (en) * 2018-01-05 2020-04-07 Quanta Computer Inc. CMC failover for two-stick canisters in rack design
CN108306964A (zh) * 2018-01-31 2018-07-20 郑州云海信息技术有限公司 服务器节点信息集中显示方法、***、设备及存储介质
US20190286590A1 (en) * 2018-03-14 2019-09-19 Quanta Computer Inc. Cpld cache application in a multi-master topology system
CN108491307A (zh) * 2018-03-14 2018-09-04 郑州云海信息技术有限公司 一种集中管理各节点信息的方法及***
CN109032979A (zh) * 2018-06-04 2018-12-18 郑州云海信息技术有限公司 一种bmc间的文件传输方法、装置、设备及存储介质
US10592462B2 (en) * 2018-06-19 2020-03-17 Quanta Computer Inc. Cable detection
US10782754B2 (en) 2018-09-21 2020-09-22 Quanta Computer Inc. Thermal management via virtual BMC manager
CN109634879A (zh) * 2018-12-17 2019-04-16 郑州云海信息技术有限公司 一种pcie转接板和服务器监控***
JP6697102B1 (ja) * 2019-01-23 2020-05-20 Necプラットフォームズ株式会社 情報処理装置、情報処理装置の制御方法、及び、情報処理装置の制御プログラム
TWI704463B (zh) * 2019-03-29 2020-09-11 英業達股份有限公司 伺服器系統與管理方法
TWI750726B (zh) * 2020-07-09 2021-12-21 緯穎科技服務股份有限公司 伺服器裝置及其伺服模組連接辨識方法
US11895181B2 (en) * 2020-12-04 2024-02-06 Schneider Electric It Corporation Power optimization of microserver loads
CN117742935A (zh) * 2022-10-21 2024-03-22 超聚变数字技术有限公司 一种服务器中处理器信息的带外查询/配置方法及服务器
TWI830573B (zh) * 2023-01-09 2024-01-21 信驊科技股份有限公司 基板管理控制裝置及其控制方法

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050080887A1 (en) * 2003-10-08 2005-04-14 Chun-Liang Lee Redundant management control arbitration system
JP5459593B2 (ja) 2009-08-17 2014-04-02 日本電気株式会社 サーバ監視システム及びサーバ監視方法
TW201222274A (en) * 2010-11-30 2012-06-01 Inventec Corp Computer chassis system
TW201222208A (en) 2010-11-30 2012-06-01 Inventec Corp Server integrate system
JP5441875B2 (ja) 2010-12-07 2014-03-12 株式会社日立製作所 計算機システム
US8842664B2 (en) 2011-09-27 2014-09-23 Znyx Networks, Inc. Chassis management modules for advanced telecom computing architecture shelves, and methods for using the same
US9935901B2 (en) 2011-12-30 2018-04-03 Dell Products, Lp System and method of enabling a multi-chassis virtual switch for virtual server network provisioning
CN103324495A (zh) 2012-03-23 2013-09-25 鸿富锦精密工业(深圳)有限公司 数据中心服务器开机管理方法及***
TWI528134B (zh) 2012-12-17 2016-04-01 鴻海精密工業股份有限公司 擋板控制裝置及具有該擋板控制裝置的伺服器機架
US9367419B2 (en) 2013-01-08 2016-06-14 American Megatrends, Inc. Implementation on baseboard management controller of single out-of-band communication access to multiple managed computer nodes
US9990221B2 (en) 2013-03-15 2018-06-05 Oracle International Corporation System and method for providing an infiniband SR-IOV vSwitch architecture for a high performance cloud computing environment
TW201445936A (zh) * 2013-05-17 2014-12-01 Hon Hai Prec Ind Co Ltd 可動態切換主節點的伺服器系統及動態切換主節點的方法
US9257300B2 (en) * 2013-07-09 2016-02-09 Lam Research Corporation Fluorocarbon based aspect-ratio independent etching
US9804980B2 (en) 2013-07-25 2017-10-31 Dell Products, Lp System management through direct communication between system management controllers
CN104375930A (zh) 2013-08-13 2015-02-25 鸿富锦精密工业(深圳)有限公司 固件检测***及方法
US9619243B2 (en) * 2013-12-19 2017-04-11 American Megatrends, Inc. Synchronous BMC configuration and operation within cluster of BMC
US10097409B2 (en) * 2014-03-01 2018-10-09 Dell Products, Lp System and method for managing multi-tenant chassis environment using virtual private chassis management controllers
JP2015230720A (ja) 2014-06-09 2015-12-21 株式会社日立製作所 計算機システム
US10136558B2 (en) 2014-07-30 2018-11-20 Dell Products L.P. Information handling system thermal management enhanced by estimated energy states
US9804937B2 (en) 2014-09-08 2017-10-31 Quanta Computer Inc. Backup backplane management control in a server rack system
CN104615506A (zh) 2015-02-13 2015-05-13 浪潮电子信息产业股份有限公司 一种基于逻辑控制的bios和bmc备份方法

Also Published As

Publication number Publication date
TW201800952A (zh) 2018-01-01
TWI631466B (zh) 2018-08-01
EP3261420A1 (en) 2017-12-27
JP6515132B2 (ja) 2019-05-15
US20170364375A1 (en) 2017-12-21
CN107526665A (zh) 2017-12-29
JP2017224285A (ja) 2017-12-21
US10402207B2 (en) 2019-09-03

Similar Documents

Publication Publication Date Title
CN107526665B (zh) 机箱管理***及机箱管理方法
US10031736B2 (en) Automatic system software installation on boot
TWI631470B (zh) 透過一管理控制器動態重新配置一系統之至少一週邊匯流排交換器之方法及系統
US9122501B1 (en) System and method for managing multiple bios default configurations
US9954727B2 (en) Automatic debug information collection
US9804937B2 (en) Backup backplane management control in a server rack system
US10587935B2 (en) System and method for automatically determining server rack weight
CN106814826B (zh) 控制服务器机柜中气流的***及方法
US9542201B2 (en) Network bios management
TWI735279B (zh) 自動偵測及警示計算裝置組件變更的方法和系統
US10372639B2 (en) System and method to avoid SMBus address conflicts via a baseboard management controller
JP6678929B2 (ja) 高スタンバイ電力システムのためのスマートな電源管理
TW201610849A (zh) 自動地配置電腦系統中之基本輸入輸出系統效能設定檔的裝置、方法及非暫態電腦可讀取記錄媒體
TWI608357B (zh) 共用匯流排埠之系統及共用匯流排埠之方法
KR20060047693A (ko) 스카시 및 사스 하드웨어 검증시스템 및 방법
US10437477B2 (en) System and method to detect storage controller workloads and to dynamically split a backplane
US10489328B2 (en) Universal sleds server architecture

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant