CN110554943B - 一种基于i3c的多节点服务器cmc管理***及方法 - Google Patents
一种基于i3c的多节点服务器cmc管理***及方法 Download PDFInfo
- Publication number
- CN110554943B CN110554943B CN201910734393.1A CN201910734393A CN110554943B CN 110554943 B CN110554943 B CN 110554943B CN 201910734393 A CN201910734393 A CN 201910734393A CN 110554943 B CN110554943 B CN 110554943B
- Authority
- CN
- China
- Prior art keywords
- management controller
- bmc
- cmc
- baseboard management
- chassis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 238000007726 management method Methods 0.000 claims description 290
- 238000013507 mapping Methods 0.000 claims description 23
- 230000017525 heat dissipation Effects 0.000 claims description 21
- 239000012634 fragment Substances 0.000 claims description 18
- 238000004891 communication Methods 0.000 claims description 12
- 238000012795 verification Methods 0.000 claims description 6
- 230000001360 synchronised effect Effects 0.000 claims description 4
- 239000000758 substrate Substances 0.000 claims description 3
- 230000005540 biological transmission Effects 0.000 description 8
- 230000015654 memory Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000013021 overheating Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3058—Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3089—Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/38—Information transfer, e.g. on bus
- G06F13/42—Bus transfer protocol, e.g. handshake; Synchronisation
- G06F13/4282—Bus transfer protocol, e.g. handshake; Synchronisation on a serial bus, e.g. I2C bus, SPI bus
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Computing Systems (AREA)
- Small-Scale Networks (AREA)
Abstract
本发明提供一种基于I3C的多节点服务器CMC管理***及方法,***包括机箱管理控制器CMC、服务器节点以及基板管理控制器BMC,每个服务器节点上设置有一个基板管理控制器BMC,每个服务器机箱内设置有一个机箱管理控制器CMC;机箱管理控制器CMC与每个基板管理控制器BMC之间通过I3C总线连接;方法包括如下步骤:S1.每个服务器节点上的基板管理控制器BMC管理本服务器节点;S2.机箱管理控制器CMC通过I3C总线与每个服务器节点上的基板管理控制器BMC进行通信,实现机箱内所有服务器节点管理。
Description
技术领域
本发明属于服务器监控管理技术领域,具体涉及一种基于I3C的多节点服务器CMC管理***及方法。
背景技术
BMC(Baseboard Management Controller)基板管理控制器,可以在机器未开机的状态下,对机器进行固件升级、查看机器设备等一些操作。
CMC(Chassis Management Controller)机箱管理控制器,功能和BMC类似,在刀片等多节点服务器中对整机进行管理控制,可以对各节点BMC发送命令进行管理。
CPLD(Complex Programmable Logic Device)复杂可编程逻辑器件,用户根据各自需要而自行构造逻辑功能的数字集成电路,服务器中多用于控制硬件开关机等时序控制。
GPIO(General Purpose Input Output)通用输入/输出,简称为GPIO,利用物理引脚的高低电平进行信号通信。
I2C(Inter-Integrated Circuit)是内部整合电路的称呼,是一种串行通讯总线,使用多主从架构,是一种简单、双向二线制同步串行总线。
I3C是一种融合了I2C和SPI总线关键属性的两线串行通讯总线,兼容I2C协议,具有多master、slave软中断,动态分配slave地址、支持热插拔等新特性,速度高达33Mbps,用于将传感器连接到应用处理器。
随着AI、云计算技术和互联网行业的高速发展,多节点服务器在实际应用中尤其在大型数据中心、云计算基地等场合应用越来越广泛,在多节点服务器中,节点、风扇、电源等硬件的管理是由CMC(Chassis Management Controller)来完成。CMC一般是通过I2C接口从节点BMC(Board Management Controller)获取CPU温度、内存温度、硬盘温度等信息,根据散热策略调整对应的风扇转速。但I2C通信本身速率较慢,并且抗干扰能力很差,而多节点服务器需要CMC本身能快速采集到节点温度信息,在某一节点服务器压力突然增大,CPU温度快速上升时,由于通信速率慢,新的温度信息从BMC到CMC需要时间较长,不能很好的满足整机***散热时效性的高要求,造成散热效果不理想。
CMC和节点BMC使用I2C通信的方式加大了信息传输的时延,不利于节点信息快速传输和调速策略快速响应。另一方面,在I2C链路发生故障时,CMC无法从节点BMC获取到信息,影响多节点服务器的正常工作。例如,无法获取温度的变化信息使得风扇转速不变,造成散热策略的失效,进而引发多节点服务器***过热甚至宕机。
另外随着机房的扩大,节点数量的增加,传统逐个节点登录管理的方式,对整个机房的管理也带来巨大的挑战,用户希望能够只需登录CMC就能查看和管理整个机箱/机柜中的所有节点,而不需要逐个节点登录。I2C的低速根本无法完成大数据量的传输,目前的解决方案只能依靠I2C+LAN的模式来实现。当LAN出现问题或网线故障时,CMC对该节点失去控制能力。
多节点服务器中,CMC负责管理整个机箱/机柜的管理工作。CMC和多个节点服务器位于同一机箱中,每个节点服务器中存在一个BMC,CMC通过I2C总线连接多个节点服务器的BMC,CMC负责整个机箱的各个节点之间的管理工作,也包括电源管理和散热管理等。CMC从各个节点上获取各种信息,用于总体管理,也可以配置各个节点信息。
目前CMC与各个节点上的BMC连接方式为I2C拓扑连接,另外还有LAN通过交换机拓扑。受限于I2C总线的400Kbps的速率,I2C总线上很难传输较大的数据包,因此目前方案中I2C链路上主要传输一些简单的状态信号,较大的数据,需要借助LAN来传输数据。
因此,CMC如何实现稳定可靠获取节点CPU、内存、温度、各种管理等信息的方法,成为设计和开发人员亟需解决的问题。
此为现有技术的不足,因此,针对现有技术中的上述缺陷,提供一种基于I3C的多节点服务器CMC管理***及方法,是非常有必要的。
发明内容
针对现有技术的上述CMC如何实现稳定可靠获取节点CPU、内存、温度、各种管理等信息的方法,成为设计和开发人员亟需解决的问题的缺陷,本发明提供一种基于I3C的多节点服务器CMC管理***及方法,以解决上述技术问题。
第一方面,本发明提供一种基于I3C的多节点服务器CMC管理***,包括机箱管理控制器CMC、服务器节点以及基板管理控制器BMC,每个服务器节点上设置有一个基板管理控制器BMC,每个服务器机箱内设置有一个机箱管理控制器CMC;
机箱管理控制器CMC与每个基板管理控制器BMC之间通过I3C总线连接;
机箱管理控制器CMC通过I3C总线与每个服务器节点上的基板管理控制器BMC进行通信,每个服务器节点上的基板管理控制器BMC管理本服务器节点。I3C总线数据传输快,速度高达33Mbps,不必受限于局域网LAN连接。
进一步地,还包括交换机,交换机与机箱管理控制器CMC以及每个基板管理控制器BMC之间均通过局域网LAN连接。机箱管理控制器CMC以及每个基板管理控制器BMC之间采用I3C连接的同时,也支持局域网LAN连接,数据传输灵活性高,一旦某个节点局域网LAN故障或者网线断开,不会影响CMC的管理。
进一步地,机箱管理控制器CMC和基板管理控制器BMC均采用AST2600芯片。AST2600芯片带有8个I3C通道,支持I3C总线技术,本发明不限于该芯片,其它拥有I3C总线的芯片或者PSOC也可采用。
第二方面,本发明提供一种基于I3C的多节点服务器CMC管理方法,包括如下步骤:
S1.每个服务器节点上的基板管理控制器BMC管理本服务器节点;
S2.机箱管理控制器CMC通过I3C总线与每个服务器节点上的基板管理控制器BMC进行通信,实现机箱内所有服务器节点管理。
进一步地,步骤S2具体步骤如下:
S21.设置机箱管理控制器CMC为I3C主控端,设置每个基板管理控制器BMC为I3C从控端;
S22.当机箱管理控制器CMC需向某个基板管理控制器BMC通信时,机箱管理控制器CMC直接向对应基板管理控制器BMC发送数据;
S23.当某个基板管理控制器BMC需向机箱管理控制器CMC通信时,该基板管理控制器BMC向机箱管理控制器CMC发出通信请求,机箱管理控制器CMC响应基板管理控制器BMC的请求后,基板管理控制器BMC向机箱管理控制器CMC发送数据。设置机箱管理控制器CMC拥有I3C总线控制权,与基板管理控制器BMC之间的通讯均由机箱管理控制器CMC发起,但是I3C总线拥有“软中断”(或叫带内中断)功能,因此,板管理控制器BMC可以随时请求与机箱管理控制器CMC之间的通讯,无需在额外连接IO中断信号线。
进一步地,步骤S2还包括如下步骤:
S2A.设置每个基板管理控制器BMC的数据与机箱管理控制器CMC的数据同步;具体步骤如下:
S2A1.每个基板管理控制器BMC将本服务器节点的BMC***状态参数发送到机箱管理控制器CMC;
S2A2.机箱管理控制器CMC根据服务器节点序列号,生成所有服务器节点的BMC***状态参数映射数据库;
S2A3.当某个基板管理控制器BMC的BMC***状态参数发生变化时,该基板管理控制器BMC向机箱管理控制器CMC发送同步更新BMC***状态参数映射数据库请求;机箱管理控制器CMC响应基板管理控制器BMC的请求后,机箱管理控制器CMC同步更新BMC***状态参数映射数据库中对应BMC的***状态参数;
S2A4.当用户通过机箱管理控制器CMC对某个基板管理控制器BMC进行配置时,机箱管理控制器CMC验证参数合法后,与对应基板管理控制器BMC通信,对该基板管理控制器BMC进行参数配置,同时更新BMC***状态参数映射数据库对应的BMC***状态参数。机箱管理控制器CMC使用2G内存32GFlash,用于存放BMC***状态参数映射数据库。机箱管理控制器CMC将所有服务器节点的BMC***状态参数都映射一份到机箱管理控制器CMC上。这样客户只需要访问机箱管理控制器CMC就可以获取到所有服务器节点的基板管理控制器BMC的数据,避免客户查询时机箱管理控制器CMC需要挨个服务器节点读取BMC***状态参数,加快响应客户的速度。
进一步地,步骤S2A中还包括如下步骤:
S2A5.机箱管理控制器CMC定时轮询各个基板管理控制器BMC的BMC***状态参数;
若某个BMC***状态参数发生变化,则机箱管理控制器CMC更新BMC***状态参数映射数据库中对应的BMC***状态参数。机箱管理控制器CMC依然会定时轮询各个服务器节点的BMC***状态参数情况,确保参数的一致性,但是机箱管理控制器CMC定时轮询的时间间隔会比较长,不用在像现有技术那么高的频率进行检测。
进一步地,步骤S2还包括如下步骤:
S2B.设置机箱管理控制器CMC管理每个服务器节点的BMC、BIOS以及CPLD的固件升级;具体步骤如下:
S2B1.机箱管理控制器CMC选择服务器节点进行固件升级,并根据BMC***状态参数映射数据库获取该服务器节点的型号以及可升级固件;
S2B2.机箱管理控制器CMC接收固件升级包,并根据服务器节点型号对固件升级包的兼容性进行判断;
若版本型号不符,则终止升级操作;
若版本型号相符,则进入下一步;
S2B3.机箱管理控制器CMC判断LAN总线链路是否连通;
若是,进入步骤S2B4;
若否,进入步骤S2B5;
S2B4.机箱管理控制器CMC通过LAN总线将固件升级包发送到对应服务器节点的基板管理控制器BMC,进行固件升级;
S2B5.机箱管理控制器CMC通过I3C总线将固件升级包发送到对应服务器节点的基板管理控制器BMC,进行固件升级。现有技术中由于I2C总线速率过低,机箱管理控制器CMC无法通过内部I2C总线给服务器节点上的固件进行升级操作,必须依赖局域网LAN进行,当某服务器节点的局域网LAN出现问题时,则无法给该服务器节点进行升级操作。本发明中由于I3C总线的高速率通信使得通过内部I3C总线进行固件升级成为现实,即使当某服务器节点局域网LAN出现故障时,客户始终没有连接局域网LAN,机箱管理控制器CMC依然可以对该服务器节点的固件进行升级操作。
进一步地,步骤S2B5具体步骤如下:
S2B51.机箱管理控制器CMC将固件升级包进行分片,并设置每个分片数据含有编号和校验码;
S2B52.机箱管理控制器CMC将固件升级包的每个分片数据通过I3C总线进行间隔传输;
S2B53.基板管理控制器BMC对每个分片数据进行校验和解包存储;
当校验失败时,基板管理控制器BMC通知机箱管理控制器CMC重新发送该分片数据;返回步骤S2B52;
当校验成功时,基板管理控制器BMC将分片数据进行组合,恢复完整固件升级包,进入下一步;
S2B54.机箱管理控制器CMC通知基板管理控制器BMC进行固件升级操作;
S2B55.基板管理控制器BMC判断固件升级包是否符合本服务器节点升级要求;
若是,则基板管理控制器BMC进行固件升级;进入步骤S2B56;
若否,则终止升级操作;进入步骤S2B56;
S2B56.基板管理控制器BMC向机箱管理控制器CMC返回固件升级进度。为防止几十兆的固件升级包传输占用总线时间过长,影响机箱管理控制器CMC和基板管理控制器BMC的数据及时同步,本发明中机箱管理控制器CMC会将固件升级包进行分片,分成若干小片,每个小片都带有编号和校验码,然后通过I3C总线进行间隔传输的方式进行。
进一步地,步骤S2还包括如下步骤:
S2C.设置机箱管理控制器CMC每个服务器节点进行散热控制;具体步骤如下:
S2C1.机箱管理控制器CMC从BMC***状态参数映射数据库获取每个服务器节点的散热策略、实时温度以及风扇控制参数;
S2C2.机箱管理控制器CMC根据每个服务器节点的散热策略、实时温度以及风扇控制参数进行散热调整;
S2C3.机箱管理控制器CMC将调整后散热策略以及风扇控制参数发送到基板管理控制器BMC。现有技术中机箱管理控制器CMC每次调整前需要从各个服务器节点的基板管理控制器BMC获取参数,而本发明中由于机箱管理控制器CMC中采用了BMC参数映射和BMC参数主动上报机制,机箱管理控制器CMC直接从自身数据获取数据即可进散热调整,无需再逐个服务器节点的基板管理控制器BMC获取数据。
本发明的有益效果在于,
本发明提供的基于I3C的多节点服务器CMC管理***及方法,针对当前多节点服务器机箱CMC管理中存在的问题,利用I3C总线代替原来的I2C总线+LAN+IO中断的复杂拓扑,解决了当前方案中存在的问题和不足,降低了多节点服务器的拓扑复杂性,提高了管理***的稳定性,提高了节点的可扩展性。CMC集中化的管理模式,一站式管理所有服务器节点的基板管理控制器BMC,使得客户无需在逐个登录服务器节点节点的基板管理控制器BMC进行管理,减少了维护和管理的工作量,提高了用户效率和体验。
此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
由此可见,本发明与现有技术相比,具有突出的实质性特点和显著的进步,其实施的有益效果也是显而易见的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的***连接示意图一;
图2是本发明的***连接示意图二;
图3是本发明的方法流程示意图一;
图4是本发明的方法流程示意图二;
图5是本发明的方法流程示意图三;
图6是本发明的方法流程示意图四;
图7是本发明的方法流程示意图五;
图中,1-第一BMC;2-第二BMC;3-第三BMC;4-第四BMC;5-第五BMC;N1-第一节点;N2-第二节点;N3-第三节点;N4-第四节点;N5-第五节点;6-CMC;7-交换机。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
实施例1:
如图1所示,本发明提供一种基于I3C的多节点服务器CMC管理***,包括机箱管理控制器CMC 6、服务器节点以及基板管理控制器BMC;
服务器节点包括第一节点N1、第二节点N2、第三节点N3、第四节点N4以及第五节点N5,第一节点N1上设置第一BMC 1,第二节点N2上设置第二BMC 2,第三节点N3上设置第三BMC 3,第四节点N4上设置第四BMC 4,第五节点N5上设置有第五BMC 5,而服务器机箱内设置有一个机箱管理控制器CMC 6;
机箱管理控制器CMC 6与每个基板管理控制器BMC之间通过I3C总线连接;
机箱管理控制器CMC 6通过I3C总线与每个服务器节点上的基板管理控制器BMC进行通信,每个服务器节点上的基板管理控制器BMC管理本服务器节点;机箱管理控制器CMC6和第一BMC 1、第二BMC 2、第三BMC 3、第四BMC 4以及第五BMC 5均采用AST2600芯片。
实施例2:
如图2所示,本发明提供一种基于I3C的多节点服务器CMC管理***,包括机箱管理控制器CMC 6、服务器节点、基板管理控制器BMC以及交换机7;
服务器节点包括第一节点N1、第二节点N2、第三节点N3以及第四节点N4,第一节点N1上设置第一BMC 1,第二节点N2上设置第二BMC 2,第三节点N3上设置第三BMC 3,第四节点N4上设置第四BMC 4,而服务器机箱内设置有一个机箱管理控制器CMC 6;
机箱管理控制器CMC 6与每个基板管理控制器BMC之间通过I3C总线连接;
机箱管理控制器CMC 6通过I3C总线与每个服务器节点上的基板管理控制器BMC进行通信,每个服务器节点上的基板管理控制器BMC管理本服务器节点;交换机7与机箱管理控制器CMC 6以及每个基板管理控制器BMC之间均通过局域网LAN连接,机箱管理控制器CMC6和第一BMC 1、第二BMC 2、第三BMC 3以及第四BMC 4均采用AST2600芯片。
实施例3:
如图3所示,本发明提供一种基于I3C的多节点服务器CMC管理方法,包括如下步骤:
S1.每个服务器节点上的基板管理控制器BMC管理本服务器节点;
S2.机箱管理控制器CMC通过I3C总线与每个服务器节点上的基板管理控制器BMC进行通信,实现机箱内所有服务器节点管理;具体步骤如下:
S21.设置机箱管理控制器CMC为I3C主控端,设置每个基板管理控制器BMC为I3C从控端;
S22.当机箱管理控制器CMC需向某个基板管理控制器BMC通信时,机箱管理控制器CMC直接向对应基板管理控制器BMC发送数据;
S23.当某个基板管理控制器BMC需向机箱管理控制器CMC通信时,该基板管理控制器BMC向机箱管理控制器CMC发出通信请求,机箱管理控制器CMC响应基板管理控制器BMC的请求后,基板管理控制器BMC向机箱管理控制器CMC发送数据。
实施例4:
如图4所示,与实施例3不同的是:步骤S2还包括如下步骤:
S2A.设置每个基板管理控制器BMC的数据与机箱管理控制器CMC的数据同步;具体步骤如下:
S2A1.每个基板管理控制器BMC将本服务器节点的BMC***状态参数发送到机箱管理控制器CMC;
S2A2.机箱管理控制器CMC根据服务器节点序列号,生成所有服务器节点的BMC***状态参数映射数据库;
S2A3.当某个基板管理控制器BMC的BMC***状态参数发生变化时,该基板管理控制器BMC向机箱管理控制器CMC发送同步更新BMC***状态参数映射数据库请求;机箱管理控制器CMC响应基板管理控制器BMC的请求后,机箱管理控制器CMC同步更新BMC***状态参数映射数据库中对应BMC的***状态参数;
S2A4.当用户通过机箱管理控制器CMC对某个基板管理控制器BMC进行配置时,机箱管理控制器CMC验证参数合法后,与对应基板管理控制器BMC通信,对该基板管理控制器BMC进行参数配置,同时更新BMC***状态参数映射数据库对应的BMC***状态参数;
S2A5.机箱管理控制器CMC定时轮询各个基板管理控制器BMC的BMC***状态参数;
若某个BMC***状态参数发生变化,则机箱管理控制器CMC更新BMC***状态参数映射数据库中对应的BMC***状态参数。
实施例5:
如图5所示,与实施例4不同的是,步骤S2还包括如下步骤:
S2B.设置机箱管理控制器CMC管理每个服务器节点的BMC、BIOS以及CPLD的固件升级;具体步骤如下:
S2B1.机箱管理控制器CMC选择服务器节点进行固件升级,并根据BMC***状态参数映射数据库获取该服务器节点的型号以及可升级固件;
S2B2.机箱管理控制器CMC接收固件升级包,并根据服务器节点型号对固件升级包的兼容性进行判断;
若版本型号不符,则终止升级操作;
若版本型号相符,则进入下一步;
S2B3.机箱管理控制器CMC判断LAN总线链路是否连通;
若是,进入步骤S2B4;
若否,进入步骤S2B5;
S2B4.机箱管理控制器CMC通过LAN总线将固件升级包发送到对应服务器节点的基板管理控制器BMC,进行固件升级;
S2B5.机箱管理控制器CMC通过I3C总线将固件升级包发送到对应服务器节点的基板管理控制器BMC,进行固件升级。
实施例6:
如图6所示,与实施例5不同的是:
步骤S2B5具体步骤如下:
S2B51.机箱管理控制器CMC将固件升级包进行分片,并设置每个分片数据含有编号和校验码;
S2B52.机箱管理控制器CMC将固件升级包的每个分片数据通过I3C总线进行间隔传输;
S2B53.基板管理控制器BMC对每个分片数据进行校验和解包存储;
当校验失败时,基板管理控制器BMC通知机箱管理控制器CMC重新发送该分片数据;返回步骤S2B52;
当校验成功时,基板管理控制器BMC将分片数据进行组合,恢复完整固件升级包,进入下一步;
S2B54.机箱管理控制器CMC通知基板管理控制器BMC进行固件升级操作;
S2B55.基板管理控制器BMC判断固件升级包是否符合本服务器节点升级要求;
若是,则基板管理控制器BMC进行固件升级;进入步骤S2B56;
若否,则终止升级操作;进入步骤S2B56;
S2B56.基板管理控制器BMC向机箱管理控制器CMC返回固件升级进度。
实施例7:
如图7所示,与实施例4不同的是:
步骤S2还包括如下步骤:
S2C.设置机箱管理控制器CMC每个服务器节点进行散热控制;具体步骤如下:
S2C1.机箱管理控制器CMC从BMC***状态参数映射数据库获取每个服务器节点的散热策略、实时温度以及风扇控制参数;
S2C2.机箱管理控制器CMC根据每个服务器节点的散热策略、实时温度以及风扇控制参数进行散热调整;
S2C3.机箱管理控制器CMC将调整后散热策略以及风扇控制参数发送到基板管理控制器BMC。
I3C总线跟I2C总线一样由SDA、SCL两根线组成,且支持I3C从控端和I2C从控端混合组网,因此所有的支撑I2C总线的从控端也适用本发明的内容,均在本发明的保护范围之内,例如基本管理控制器BMC连接温度传感器。
尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (4)
1.一种基于I3C的多节点服务器CMC管理方法,其特征在于,包括如下步骤:
S1.每个服务器节点上的基板管理控制器BMC管理本服务器节点;
S2.机箱管理控制器CMC通过I3C总线与每个服务器节点上的基板管理控制器BMC进行通信,实现机箱内所有服务器节点管理;具体步骤如下:
S21.设置机箱管理控制器CMC为I3C主控端,设置每个基板管理控制器BMC为I3C从控端;
S22.当机箱管理控制器CMC需向某个基板管理控制器BMC通信时,机箱管理控制器CMC直接向对应基板管理控制器BMC发送数据;
S23.当某个基板管理控制器BMC需向机箱管理控制器CMC通信时,该基板管理控制器BMC向机箱管理控制器CMC发出通信请求,机箱管理控制器CMC响应基板管理控制器BMC的请求后,基板管理控制器BMC向机箱管理控制器CMC发送数据;
S2A.设置每个基板管理控制器BMC的数据与机箱管理控制器CMC的数据同步;具体步骤如下:
S2A1.每个基板管理控制器BMC将本服务器节点的BMC***状态参数发送到机箱管理控制器CMC;
S2A2.机箱管理控制器CMC根据服务器节点序列号,生成所有服务器节点的BMC***状态参数映射数据库;
S2A3.当某个基板管理控制器BMC的BMC***状态参数发生变化时,该基板管理控制器BMC向机箱管理控制器CMC发送同步更新BMC***状态参数映射数据库请求;机箱管理控制器CMC响应基板管理控制器BMC的请求后,机箱管理控制器CMC同步更新BMC***状态参数映射数据库中对应BMC的***状态参数;
S2A4.当用户通过机箱管理控制器CMC对某个基板管理控制器BMC进行配置时,机箱管理控制器CMC验证参数合法后,与对应基板管理控制器BMC通信,对该基板管理控制器BMC进行参数配置,同时更新BMC***状态参数映射数据库对应的BMC***状态参数;
S2B.设置机箱管理控制器CMC管理每个服务器节点的BMC、BIOS以及CPLD的固件升级;具体步骤如下:
S2B1.机箱管理控制器CMC选择服务器节点进行固件升级,并根据BMC***状态参数映射数据库获取该服务器节点的型号以及可升级固件;
S2B2.机箱管理控制器CMC接收固件升级包,并根据服务器节点型号对固件升级包的兼容性进行判断;
若版本型号不符,则终止升级操作;
若版本型号相符,则进入下一步;
S2B3.机箱管理控制器CMC判断LAN总线链路是否连通;
若是,进入步骤S2B4;
若否,进入步骤S2B5;
S2B4.机箱管理控制器CMC通过LAN总线将固件升级包发送到对应服务器节点的基板管理控制器BMC,进行固件升级;
S2B5.机箱管理控制器CMC通过I3C总线将固件升级包发送到对应服务器节点的基板管理控制器BMC,进行固件升级。
2.如权利要求1所述的基于I3C的多节点服务器CMC管理方法,其特征在于,步骤S2A中还包括如下步骤:
S2A5.机箱管理控制器CMC定时轮询各个基板管理控制器BMC的BMC***状态参数;
若某个BMC***状态参数发生变化,则机箱管理控制器CMC更新BMC***状态参数映射数据库中对应的BMC***状态参数。
3.如权利要求1所述的基于I3C的多节点服务器CMC管理方法,其特征在于,步骤S2B5具体步骤如下:
S2B51.机箱管理控制器CMC将固件升级包进行分片,并设置每个分片数据含有编号和校验码;
S2B52.机箱管理控制器CMC将固件升级包的每个分片数据通过I3C总线进行间隔传输;
S2B53.基板管理控制器BMC对每个分片数据进行校验和解包存储;
当校验失败时,基板管理控制器BMC通知机箱管理控制器CMC重新发送该分片数据;返回步骤S2B52;
当校验成功时,基板管理控制器BMC将分片数据进行组合,恢复完整固件升级包,进入下一步;
S2B54.机箱管理控制器CMC通知基板管理控制器BMC进行固件升级操作;
S2B55.基板管理控制器BMC判断固件升级包是否符合本服务器节点升级要求;
若是,则基板管理控制器BMC进行固件升级;进入步骤S2B56;
若否,则终止升级操作;进入步骤S2B56;
S2B56.基板管理控制器BMC向机箱管理控制器CMC返回固件升级进度。
4.如权利要求1所述的基于I3C的多节点服务器CMC管理方法,其特征在于,步骤S2还包括如下步骤:
S2C.设置机箱管理控制器CMC每个服务器节点进行散热控制;具体步骤如下:
S2C1.机箱管理控制器CMC从BMC***状态参数映射数据库获取每个服务器节点的散热策略、实时温度以及风扇控制参数;
S2C2.机箱管理控制器CMC根据每个服务器节点的散热策略、实时温度以及风扇控制参数进行散热调整;
S2C3.机箱管理控制器CMC将调整后散热策略以及风扇控制参数发送到基板管理控制器BMC。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910734393.1A CN110554943B (zh) | 2019-08-09 | 2019-08-09 | 一种基于i3c的多节点服务器cmc管理***及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910734393.1A CN110554943B (zh) | 2019-08-09 | 2019-08-09 | 一种基于i3c的多节点服务器cmc管理***及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110554943A CN110554943A (zh) | 2019-12-10 |
CN110554943B true CN110554943B (zh) | 2022-07-08 |
Family
ID=68737369
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910734393.1A Active CN110554943B (zh) | 2019-08-09 | 2019-08-09 | 一种基于i3c的多节点服务器cmc管理***及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110554943B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111064643B (zh) * | 2019-12-29 | 2022-08-02 | 苏州浪潮智能科技有限公司 | 一种节点服务器及其数据交互方法和相关装置 |
CN111459863B (zh) * | 2020-03-08 | 2021-09-28 | 苏州浪潮智能科技有限公司 | 一种基于nvme-mi的机箱管理***及方法 |
CN111465265B (zh) * | 2020-04-03 | 2022-04-22 | 中国工商银行股份有限公司 | 温度调节方法和装置、电子设备和存储介质 |
CN113220614B (zh) * | 2021-04-30 | 2022-11-29 | 山东英信计算机技术有限公司 | 一种自适应管理i2c和i3c设备的方法、***及介质 |
CN113778667B (zh) * | 2021-08-17 | 2024-01-23 | 华东计算技术研究所(中国电子科技集团公司第三十二研究所) | 服务器节点信息管理***和方法、可读介质 |
CN113872796B (zh) * | 2021-08-26 | 2024-04-23 | 浪潮电子信息产业股份有限公司 | 服务器及其节点设备信息获取方法、装置、设备、介质 |
CN115904426A (zh) * | 2022-09-28 | 2023-04-04 | 超聚变数字技术有限公司 | 一种固件升级方法及装置 |
CN115883362A (zh) * | 2022-12-21 | 2023-03-31 | 硅基大陆(成都)科技有限公司 | 基于cmc和bmc的服务器管理***、方法以及服务器 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102779057A (zh) * | 2012-06-29 | 2012-11-14 | 浪潮(北京)电子信息产业有限公司 | 一种基板管理控制器及其自动升级***和方法 |
CN105099776A (zh) * | 2015-07-21 | 2015-11-25 | 曙光云计算技术有限公司 | 云服务器的管理*** |
CN107943253A (zh) * | 2017-12-13 | 2018-04-20 | 郑州云海信息技术有限公司 | 一种高密度多节点服务器***散热架构 |
-
2019
- 2019-08-09 CN CN201910734393.1A patent/CN110554943B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102779057A (zh) * | 2012-06-29 | 2012-11-14 | 浪潮(北京)电子信息产业有限公司 | 一种基板管理控制器及其自动升级***和方法 |
CN105099776A (zh) * | 2015-07-21 | 2015-11-25 | 曙光云计算技术有限公司 | 云服务器的管理*** |
CN107943253A (zh) * | 2017-12-13 | 2018-04-20 | 郑州云海信息技术有限公司 | 一种高密度多节点服务器***散热架构 |
Also Published As
Publication number | Publication date |
---|---|
CN110554943A (zh) | 2019-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110554943B (zh) | 一种基于i3c的多节点服务器cmc管理***及方法 | |
US11792271B2 (en) | Remote management for a computing device | |
TWI618380B (zh) | 管理方法、服務控制器裝置以及非暫態電腦可讀取媒體 | |
US8930725B2 (en) | Server rack system for managing power supply | |
US8725893B2 (en) | Method and system for configuring a plurality of network interfaces that share a physical interface | |
US7444455B2 (en) | Integrated gigabit ethernet PCI-X controller | |
US20080043769A1 (en) | Clustering system and system management architecture thereof | |
US20150178095A1 (en) | Synchronous bmc configuration and operation within cluster of bmc | |
CN106685735B (zh) | Epa片上***、epa通信***及通信方法 | |
US20140337496A1 (en) | Embedded Management Controller for High-Density Servers | |
EP2529313A1 (en) | Methods and systems for an interposer board | |
CN105159851A (zh) | 多控存储*** | |
US20140317267A1 (en) | High-Density Server Management Controller | |
CN111324503B (zh) | 机框管理装置、方法和计算机可读存储介质 | |
CN100508468C (zh) | 分布式节点动态管理数据自适应交换方法 | |
CN112653516B (zh) | 一种服务器中访问dimm的方法、***、设备及介质 | |
CN113645088B (zh) | 网卡ncsi信号的自动调节方法、***、装置及介质 | |
CN211787062U (zh) | Mctp设备测试装置 | |
CN214042304U (zh) | 一种基于服务器的bios芯片远程在线更新的主板线路 | |
US20220247830A1 (en) | Proxy management controller system | |
WO2024066857A1 (zh) | 一种电子设备、处理器、数据传输方法及装置 | |
CN219960598U (zh) | 远程管理设备 | |
TWI830573B (zh) | 基板管理控制裝置及其控制方法 | |
CN111949477B (zh) | 一种大型设备的管理方案 | |
TWI654524B (zh) | 伺服器機櫃系統及其訊號傳輸頻率調整方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |