CN112653516B - 一种服务器中访问dimm的方法、***、设备及介质 - Google Patents
一种服务器中访问dimm的方法、***、设备及介质 Download PDFInfo
- Publication number
- CN112653516B CN112653516B CN202011404233.XA CN202011404233A CN112653516B CN 112653516 B CN112653516 B CN 112653516B CN 202011404233 A CN202011404233 A CN 202011404233A CN 112653516 B CN112653516 B CN 112653516B
- Authority
- CN
- China
- Prior art keywords
- bmc
- dimm
- information
- server
- slave
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 230000005540 biological transmission Effects 0.000 claims abstract description 37
- 230000008859 change Effects 0.000 claims abstract description 37
- 239000013307 optical fiber Substances 0.000 claims abstract description 28
- 230000004044 response Effects 0.000 claims abstract description 18
- 238000004891 communication Methods 0.000 claims abstract description 15
- 230000002159 abnormal effect Effects 0.000 claims abstract description 9
- 238000004590 computer program Methods 0.000 claims description 6
- 238000013461 design Methods 0.000 abstract description 5
- 238000010586 diagram Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B10/00—Transmission systems employing electromagnetic waves other than radio-waves, e.g. infrared, visible or ultraviolet light, or employing corpuscular radiation, e.g. quantum communication
- H04B10/25—Arrangements specific to fibre transmission
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01K—MEASURING TEMPERATURE; MEASURING QUANTITY OF HEAT; THERMALLY-SENSITIVE ELEMENTS NOT OTHERWISE PROVIDED FOR
- G01K1/00—Details of thermometers not specially adapted for particular types of thermometer
- G01K1/02—Means for indicating or recording specially adapted for thermometers
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01K—MEASURING TEMPERATURE; MEASURING QUANTITY OF HEAT; THERMALLY-SENSITIVE ELEMENTS NOT OTHERWISE PROVIDED FOR
- G01K3/00—Thermometers giving results other than momentary value of temperature
- G01K3/08—Thermometers giving results other than momentary value of temperature giving differences of values; giving differentiated values
- G01K3/10—Thermometers giving results other than momentary value of temperature giving differences of values; giving differentiated values in respect of time, e.g. reacting only to a quick change of temperature
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Electromagnetism (AREA)
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Optical Communication System (AREA)
Abstract
本发明公开了一种服务器中访问DIMM的方法、***、设备和存储介质,方法包括:获取服务器中DIMM的数量,根据DIMM的数量定义光纤通信的协议帧;服务器中每个主板的BMC通过光纤与其他主板的BMC进行通信,确定主BMC和从BMC,并根据主BMC确定信息流向;从BMC每隔预定时间通过I3C获取对应主板上的DIMM的温度信息,并判断两次温度信息之间的变化是否超过阈值;响应于两次温度信息之间的变化超过阈值,从BMC按照定义好的协议帧以及信息流向将含DIMM信息的传输请求发送给主BMC;以及主BMC根据传输请求获取DIMM信息,并对温度信息异常的DIMM进行告警。本发明使用光纤传输的形式,将不同节点的DIMM的信息进行传输,规避I3C跨板连接的漏电和重复上拉及信号质量问题,以达到高可靠的设计。
Description
技术领域
本发明涉及服务器领域,更具体地,特别是指一种服务器中访问DIMM的方法、***、计算机设备及可读介质。
背景技术
随着信息技术的发展,服务器的应用越来越广泛。在政府、金融、能源等行业中,对于大型核心数据库、虚拟化整合、内存计算、高性能计算的需求越来越高,8路服务器的优点得以广泛应用。I3C规范结合了I2C和串行***接口SPI的多种特性,提供了统一的标准和可扩展接口,能够将多个传感器与SoC(System On Chip,片上***)相连。它提供了低的引线数和低功耗解决方案,可为集成了大量传感器的***提供所需的吞吐率,从而降低成本。随着越来越多的设备被应用在服务器中,Intel新一代服务器Eagle stream平台将I3C通信应用在其中,BMC(Base Management Controller,基板管理控制器)需要通过I3C总线访问DDR5的DIMM(Dual Inline Memory Module,双列直插内存模块)。
在一个8路服务器中,每块主板上有4个CPU,共两个主板,分别是节点0(NODE0)和节点1(NODE1)。在这样的环境配置中,一个8路服务器可通过硬件设置组成一个8路***或两个4路***。实际的配置共三种情况,1.两个节点都在位;2.只有NODE1在位;3.只有NODE2在位。每个节点上都有一个BMC芯片,为了方便观察所有DIMM的状态以及DEBUG操作,BMC芯片需要支持通过I3C通信访问本节点和另外一个节点的DIMM设备(***所有DIMM),以获取温度,日志等信息。
如图1所示,为现有方案中I3C读取DIMM信息的拓扑示意图。首先需要通过中背板从NODE0连接到NODE1,需要跨板,并且对于DIMM,有两个BMC要读取他内部的信息,这就涉及到多个主设备仲裁的问题。
另外,在现有设计中,还有以下三个缺点:
1.漏电。I3C信号类似I2C,线路上需要上拉,但是两个节点上电先后顺序不一样,会存在漏电,先上电的NODE的I3C链路向另一端漏电。
2.重复上拉。由于同一个DIMM需要被两个节点的BMC获取I3C信息,所以需要引入I3C仲裁芯片,决定作为MASTER的节点。由于BMC所在的主板端I3C需要上拉(因为开漏输出),并且为了保持稳定另一个节点的仲裁芯片输入也不能悬空,需要上拉,因此会引入重复上拉,重复上拉使得链路的信号完整性评估更复杂。
3.由于I3C信号速率高,最高26.7Mbps,跨板传输会让链路过长,通过背板传输可能引入阻抗不连续,影响信号质量。
发明内容
有鉴于此,本发明实施例的目的在于提出一种服务器中访问DIMM的方法、***、计算机设备及计算机可读存储介质,BMC之间通过光纤传输实现各自所在节点的DIMM上的信息的互通,来规避I3C跨板连接的漏电和重复上拉及信号质量问题,以达到高可靠的设计;设置温度变化阈值,保证温度变化较大时才请求上传数据,当其温度变化不大,且在正常范围内,则不主动上报,以节省计算资源和带宽。
基于上述目的,本发明实施例的一方面提供了一种服务器中访问DIMM的方法,包括如下步骤:获取服务器中DIMM的数量,根据所述DIMM的数量定义光纤通信的协议帧;所述服务器中每个主板的BMC通过光纤与其他主板的BMC进行通信,确定主BMC和从BMC,并根据所述主BMC确定信息流向;所述从BMC每隔预定时间通过I3C获取对应主板上的DIMM的温度信息,并判断两次温度信息之间的变化是否超过阈值;响应于两次温度信息之间的变化超过阈值,所述从BMC按照定义好的协议帧以及信息流向将包含DIMM信息的传输请求发送给所述主BMC;以及所述主BMC根据所述传输请求获取所述DIMM信息,并对温度信息异常的DIMM进行告警。
在一些实施方式中,方法还包括:所述服务器的每个主板的BMC从PCH获取所在主板的内存的在位情况,并记录到协议帧中。
在一些实施方式中,方法还包括:响应于两次温度信息之间的变化不超过阈值,所述从BMC暂停发送DIMM信息。
在一些实施方式中,方法还包括:响应于所述主BMC在第二预定时间内未检测到传输请求,向所述从BMC发送读取请求以获取所述从BMC对应主板上DIMM信息。
本发明实施例的另一方面,还提供了一种服务器中访问DIMM***,包括:定义模块,配置用于获取服务器中DIMM的数量,根据所述DIMM的数量定义光纤通信的协议帧;主从模块,配置用于使所述服务器中每个主板的BMC通过光纤与其他主板的BMC进行通信,确定主BMC和从BMC,并根据所述主BMC确定信息流向;判断模块,配置用于使所述从BMC每隔预定时间通过I3C获取对应主板上的DIMM的温度信息,并判断两次温度信息之间的变化是否超过阈值;传输模块,配置用于响应于两次温度信息之间的变化超过阈值,使所述从BMC按照定义好的协议帧以及信息流向将包含DIMM信息的传输请求发送给所述主BMC;以及获取模块,配置用于使所述主BMC根据所述传输请求获取所述DIMM信息,并对温度信息异常的DIMM进行告警。
在一些实施方式中,***还包括:在位模块,配置用于使所述服务器的每个主板的BMC从PCH获取所在主板的内存的在位情况,并记录到协议帧中。
在一些实施方式中,***还包括:暂停模块,配置用于响应于两次温度信息之间的变化不超过阈值,使所述从BMC暂停发送DIMM信息。
在一些实施方式中,***还包括:读取模块,配置用于响应于所述主BMC在第二预定时间内未检测到传输请求,向所述从BMC发送读取请求以获取所述从BMC对应主板上DIMM信息。
本发明实施例的又一方面,还提供了一种计算机设备,包括:至少一个处理器;以及存储器,所述存储器存储有可在所述处理器上运行的计算机指令,所述指令由所述处理器执行时实现如上方法的步骤。
本发明实施例的再一方面,还提供了一种计算机可读存储介质,计算机可读存储介质存储有被处理器执行时实现如上方法步骤的计算机程序。
本发明具有以下有益技术效果:BMC之间通过光纤传输实现各自所在节点的DIMM上的信息的互通,来规避I3C跨板连接的漏电和重复上拉及信号质量问题,以达到高可靠的设计;设置温度变化阈值,保证温度变化较大时才请求上传数据,当其温度变化不大,且在正常范围内,则不主动上报,以节省计算资源和带宽。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
图1为现有技术中通过I3C访问DIMM的拓扑图;
图2为本发明提供的服务器中访问DIMM的方法的实施例的示意图;
图3为本发明提供的服务器中访问DIMM的方法的实施例的拓扑图;
图4为本发明提供的服务器中访问DIMM的计算机设备的实施例的硬件结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明实施例进一步详细说明。
需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。
基于上述目的,本发明实施例的第一个方面,提出了一种服务器中访问DIMM的方法的实施例。图2示出的是本发明提供的服务器中访问DIMM的方法的实施例的示意图。如图2所示,本发明实施例包括如下步骤:
S1、获取服务器中DIMM的数量,根据DIMM的数量定义光纤通信的协议帧;
S2、服务器中每个主板的BMC通过光纤与其他主板的BMC进行通信,确定主BMC和从BMC,并根据主BMC确定信息流向;
S3、从BMC每隔预定时间通过I3C获取对应主板上的DIMM的温度信息,并判断两次温度信息之间的变化是否超过阈值;
S4、响应于两次温度信息之间的变化超过阈值,从BMC按照定义好的协议帧以及信息流向将包含DIMM信息的传输请求发送给主BMC;以及
S5、主BMC根据传输请求获取DIMM信息,并对温度信息异常的DIMM进行告警。
图3示出的是本发明提供的服务器中访问DIMM的方法的实施例的拓扑图。如图3所示,BMC仅与所在节点的DIMM通过I3C总线通信,不跨板访问另一个节点的DIMM,这样能够保证信号质量。BMC通过RGMII信号与以太网芯片VSC8211连接。BMC芯片有四个MAC口,MAC口与VSC8211互联。以太网芯片(VSC8211)以SERDES(SERializer(串行器)/DESerializer(解串器)的简称,它是一种主流的时分多路复用(TDM)、点对点(P2P)的串行通信技术)信号与光纤口相连。VSC8211支持千兆网口通过RJ45输出,也支持SERDES信号通过光纤口输出,考虑到八路服务器中保证链路的质量,SERDES信号比通过RJ45传输的距离要长,信号质量好。因此选用以SERDES信号与光纤口相连。NODE0与NODE1的光纤口通过光纤相连,进行光通信。光通信是无源的,因此没有漏电。
获取服务器中DIMM的数量,根据DIMM的数量定义光纤通信的协议帧。定义协议包前先评估DIMM的数量,单CPU有16个DIMM,一个NODE有4个CPU,共64个DIMM。定义两个VSC8211芯片SERDES互传的协议包,包含DIMM的厂家、温度、BMC主从情况等信息。
定义帧头后的64字节为其他带内的信号预留,每16个字节代表一类,其中16个字节中的第一个字节代表边带信号种类。定义一个字节决定BMC的主从关系,00000000为主,00000001为从。定义每个DIMM需要1字节表示在不在位,故前面8个字节共64位二进制,表示其在位情况。定义64个DIMM的协议包,每16个字节代表DIMM的温度厂家信息,前8字节表示温度,后8字节表示厂家信息。
在一些实施方式中,方法还包括:所述服务器的每个主板的BMC从PCH获取所在主板的内存的在位情况,并记录到协议帧中。CPU可获取DIMM在位信息,BIOS下PCH获取该信息,BMC从PCH获取所在板卡的内存的在位情况,并记录到协议帧中。
服务器中每个主板的BMC通过光纤与其他主板的BMC进行通信,确定主BMC和从BMC,并根据主BMC确定信息流向。
从BMC每隔预定时间通过I3C获取对应主板上的DIMM的温度信息,并判断两次温度信息之间的变化是否超过阈值。
在一些实施方式中,方法还包括:响应于两次温度信息之间的变化不超过阈值,所述从BMC暂停发送DIMM信息。从BMC判断DIMM温度变化是否超过阈值,例如5度,如果温度变化不超过5度,代表周围环境温度变化小,或不超过正常温度,则不主动上传DIMM信息,以节省资源。
响应于两次温度信息之间的变化超过阈值,从BMC按照定义好的协议帧以及信息流向将传输请求发送给主BMC。如果两次温度信息之间的变化超过阈值,从BMC向主BMC发送传输请求,将其信息按照设置好的协议帧上传。
主BMC根据传输请求获取DIMM信息,并对温度信息异常的DIMM进行告警。主BMC按照帧格式解析从BMC发来的DIMM信息,对温度有问题的DIMM,进行告警,必要情况,BMC控制风扇进行散热。
在一些实施方式中,方法还包括:响应于所述主BMC在第二预定时间内未检测到传输请求,向所述从BMC发送读取请求以获取所述从BMC对应主板上DIMM信息。当主BMC长时间未接收到DIMM信息时,可以主动向从BMC发送读取请求。
本发明实施例通过设计不同节点上BMC之间通过无源的光纤通信链路,BMC之间通过光纤传输实现各自所在节点的DIMM上的信息的互通,来规避I3C跨板连接的漏电和重复上拉及信号质量问题,以达到高可靠的设计,同时光纤传输拥有高带宽,能够传输所有DIMM的I3C数据,并且给八路服务器中的其他边带信号的传输提供通路。针对新拓扑,设计了八路服务器中多节点的BMC模块之间互传I3C读取的DIMM信号的协议包的格式。包括帧头帧尾、边带信号预留、每个DIMM的厂家信息、温度信息、BMC主从判断、DIMM信息在位。针对温度信息的上传,设置阈值,保证从节点温度上升过大,或超出温度阈值时才请求上传数据,当其温度变化不大,且在正常范围内,则不主动上报,以节省计算资源和带宽。
需要特别指出的是,上述服务器中访问DIMM的方法的各个实施例中的各个步骤均可以相互交叉、替换、增加、删减,因此,这些合理的排列组合变换之于服务器中访问DIMM的方法也应当属于本发明的保护范围,并且不应将本发明的保护范围局限在实施例之上。
基于上述目的,本发明实施例的第二个方面,提出了一种服务器中访问DIMM的***,包括:定义模块,配置用于获取服务器中DIMM的数量,根据所述DIMM的数量定义光纤通信的协议帧;主从模块,配置用于使所述服务器中每个主板的BMC通过光纤与其他主板的BMC进行通信,确定主BMC和从BMC,并根据所述主BMC确定信息流向;判断模块,配置用于使所述从BMC每隔预定时间通过I3C获取对应主板上的DIMM的温度信息,并判断两次温度信息之间的变化是否超过阈值;传输模块,配置用于响应于两次温度信息之间的变化超过阈值,使所述从BMC按照定义好的协议帧以及信息流向将包含DIMM信息的传输请求发送给所述主BMC;以及获取模块,配置用于使所述主BMC根据所述传输请求获取所述DIMM信息,并对温度信息异常的DIMM进行告警。
在一些实施方式中,***还包括:在位模块,配置用于使所述服务器的每个主板的BMC从PCH获取所在主板的内存的在位情况,并记录到协议帧中。
在一些实施方式中,***还包括:暂停模块,配置用于响应于两次温度信息之间的变化不超过阈值,使所述从BMC暂停发送DIMM信息。
在一些实施方式中,***还包括:读取模块,配置用于响应于所述主BMC在第二预定时间内未检测到传输请求,向所述从BMC发送读取请求以获取所述从BMC对应主板上DIMM信息。
基于上述目的,本发明实施例的第三个方面,提出了一种计算机设备,包括:至少一个处理器;以及存储器,存储器存储有可在处理器上运行的计算机指令,指令由处理器执行以实现如下步骤:S1、获取服务器中DIMM的数量,根据DIMM的数量定义光纤通信的协议帧;S2、服务器中每个主板的BMC通过光纤与其他主板的BMC进行通信,确定主BMC和从BMC,并根据主BMC确定信息流向;S3、从BMC每隔预定时间通过I3C获取对应主板上的DIMM的温度信息,并判断两次温度信息之间的变化是否超过阈值;S4、响应于两次温度信息之间的变化超过阈值,从BMC按照定义好的协议帧以及信息流向将包含DIMM信息的传输请求发送给主BMC;以及S5、主BMC根据传输请求获取DIMM信息,并对温度信息异常的DIMM进行告警。
在一些实施方式中,步骤还包括:所述服务器的每个主板的BMC从PCH获取所在主板的内存的在位情况,并记录到协议帧中。
在一些实施方式中,步骤还包括:响应于两次温度信息之间的变化不超过阈值,所述从BMC暂停发送DIMM信息。
在一些实施方式中,步骤还包括:响应于所述主BMC在第二预定时间内未检测到传输请求,向所述从BMC发送读取请求以获取所述从BMC对应主板上DIMM信息。
如图4所示,为本发明提供的上述服务器中访问DIMM的计算机设备的一个实施例的硬件结构示意图。
以如图4所示的装置为例,在该装置中包括一个处理器301以及一个存储器302,并还可以包括:输入装置303和输出装置304。
处理器301、存储器302、输入装置303和输出装置304可以通过总线或者其他方式连接,图4中以通过总线连接为例。
存储器302作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本申请实施例中的服务器中访问DIMM的方法对应的程序指令/模块。处理器301通过运行存储在存储器302中的非易失性软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例的服务器中访问DIMM的方法。
存储器302可以包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需要的应用程序;存储数据区可存储根据服务器中访问DIMM的方法的使用所创建的数据等。此外,存储器302可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器302可选包括相对于处理器301远程设置的存储器,这些远程存储器可以通过网络连接至本地模块。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置303可接收输入的用户名和密码等信息。输出装置304可包括显示屏等显示设备。
一个或者多个服务器中访问DIMM的方法对应的程序指令/模块存储在存储器302中,当被处理器301执行时,执行上述任意方法实施例中的服务器中访问DIMM的方法。
执行上述服务器中访问DIMM的方法的计算机设备的任何一个实施例,可以达到与之对应的前述任意方法实施例相同或者相类似的效果。
本发明还提供了一种计算机可读存储介质,计算机可读存储介质存储有被处理器执行时执行如上方法的计算机程序。
最后需要说明的是,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关硬件来完成,服务器中访问DIMM的方法的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,程序的存储介质可为磁碟、光盘、只读存储记忆体(ROM)或随机存储记忆体(RAM)等。上述计算机程序的实施例,可以达到与之对应的前述任意方法实施例相同或者相类似的效果。
以上是本发明公开的示例性实施例,但是应当注意,在不背离权利要求限定的本发明实施例公开的范围的前提下,可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。此外,尽管本发明实施例公开的元素可以以个体形式描述或要求,但除非明确限制为单数,也可以理解为多个。
应当理解的是,在本文中使用的,除非上下文清楚地支持例外情况,单数形式“一个”旨在也包括复数形式。还应当理解的是,在本文中使用的“和/或”是指包括一个或者一个以上相关联地列出的项目的任意和所有可能组合。
上述本发明实施例公开实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明实施例公开的范围(包括权利要求)被限于这些例子;在本发明实施例的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上的本发明实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。
Claims (10)
1.一种服务器中访问DIMM的方法,其特征在于,包括以下步骤:
获取服务器中DIMM的数量,根据所述DIMM的数量定义光纤通信的协议帧;
所述服务器中每个主板的BMC通过光纤与其他主板的BMC进行通信,确定主BMC和从BMC,并根据所述主BMC确定信息流向;
所述从BMC每隔预定时间通过I3C获取对应主板上的DIMM的温度信息,并判断两次温度信息之间的变化是否超过阈值;
响应于两次温度信息之间的变化超过阈值,所述从BMC按照定义好的协议帧以及信息流向将包含DIMM信息的传输请求发送给所述主BMC;以及
所述主BMC根据所述传输请求获取所述DIMM信息,并对温度信息异常的DIMM进行告警。
2.根据权利要求1所述的方法,其特征在于,方法还包括:
所述服务器的每个主板的BMC从PCH获取所在主板的内存的在位情况,并记录到协议帧中。
3.根据权利要求1所述的方法,其特征在于,方法还包括:
响应于两次温度信息之间的变化不超过阈值,所述从BMC暂停发送DIMM信息。
4.根据权利要求3所述的方法,其特征在于,方法还包括:
响应于所述主BMC在第二预定时间内未检测到传输请求,向所述从BMC发送读取请求以获取所述从BMC对应主板上DIMM信息。
5.一种服务器中访问DIMM的***,其特征在于,包括:
定义模块,配置用于获取服务器中DIMM的数量,根据所述DIMM的数量定义光纤通信的协议帧;
主从模块,配置用于使所述服务器中每个主板的BMC通过光纤与其他主板的BMC进行通信,确定主BMC和从BMC,并根据所述主BMC确定信息流向;
判断模块,配置用于使所述从BMC每隔预定时间通过I3C获取对应主板上的DIMM的温度信息,并判断两次温度信息之间的变化是否超过阈值;
传输模块,配置用于响应于两次温度信息之间的变化超过阈值,使所述从BMC按照定义好的协议帧以及信息流向将包含DIMM信息的传输请求发送给所述主BMC;以及
获取模块,配置用于使所述主BMC根据所述传输请求获取所述DIMM信息,并对温度信息异常的DIMM进行告警。
6.根据权利要求5所述的***,其特征在于,***还包括:
在位模块,配置用于使所述服务器的每个主板的BMC从PCH获取所在主板的内存的在位情况,并记录到协议帧中。
7.根据权利要求5所述的***,其特征在于,***还包括:
暂停模块,配置用于响应于两次温度信息之间的变化不超过阈值,使所述从BMC暂停发送DIMM信息。
8.根据权利要求7所述的***,其特征在于,***还包括:
读取模块,配置用于响应于所述主BMC在第二预定时间内未检测到传输请求,向所述从BMC发送读取请求以获取所述从BMC对应主板上DIMM信息。
9.一种计算机设备,其特征在于,包括:
至少一个处理器;以及
存储器,所述存储器存储有可在所述处理器上运行的计算机指令,所述指令由所述处理器执行时实现权利要求1-4任意一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-4任意一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011404233.XA CN112653516B (zh) | 2020-12-04 | 2020-12-04 | 一种服务器中访问dimm的方法、***、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011404233.XA CN112653516B (zh) | 2020-12-04 | 2020-12-04 | 一种服务器中访问dimm的方法、***、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112653516A CN112653516A (zh) | 2021-04-13 |
CN112653516B true CN112653516B (zh) | 2022-05-13 |
Family
ID=75350172
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011404233.XA Active CN112653516B (zh) | 2020-12-04 | 2020-12-04 | 一种服务器中访问dimm的方法、***、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112653516B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113868161B (zh) * | 2021-09-29 | 2023-08-25 | 苏州浪潮智能科技有限公司 | 一种基于i3c的设备管理方法、装置、设备及可读介质 |
CN115904888A (zh) * | 2022-09-27 | 2023-04-04 | 超聚变数字技术有限公司 | 一种告警方法、计算设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108540551A (zh) * | 2018-04-04 | 2018-09-14 | 郑州云海信息技术有限公司 | 一种服务器节点信息的获取方法和获取*** |
CN109144913A (zh) * | 2018-09-29 | 2019-01-04 | 联想(北京)有限公司 | 一种数据处理方法、***及电子设备 |
CN109783262A (zh) * | 2018-12-24 | 2019-05-21 | 新华三技术有限公司 | 故障数据处理方法、装置、服务器及计算机可读存储介质 |
CN110049380A (zh) * | 2019-04-24 | 2019-07-23 | 苏州浪潮智能科技有限公司 | 一种基于bmc的交换机的温度控制方法、***及可读介质 |
CN111198795A (zh) * | 2019-12-23 | 2020-05-26 | 曙光信息产业股份有限公司 | 基板控制器获取内存温度的方法以及装置 |
-
2020
- 2020-12-04 CN CN202011404233.XA patent/CN112653516B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108540551A (zh) * | 2018-04-04 | 2018-09-14 | 郑州云海信息技术有限公司 | 一种服务器节点信息的获取方法和获取*** |
CN109144913A (zh) * | 2018-09-29 | 2019-01-04 | 联想(北京)有限公司 | 一种数据处理方法、***及电子设备 |
CN109783262A (zh) * | 2018-12-24 | 2019-05-21 | 新华三技术有限公司 | 故障数据处理方法、装置、服务器及计算机可读存储介质 |
CN110049380A (zh) * | 2019-04-24 | 2019-07-23 | 苏州浪潮智能科技有限公司 | 一种基于bmc的交换机的温度控制方法、***及可读介质 |
CN111198795A (zh) * | 2019-12-23 | 2020-05-26 | 曙光信息产业股份有限公司 | 基板控制器获取内存温度的方法以及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112653516A (zh) | 2021-04-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI618380B (zh) | 管理方法、服務控制器裝置以及非暫態電腦可讀取媒體 | |
EP1871040B1 (en) | Management system and method based on intelligent platform management interface | |
US8452863B2 (en) | Server system and operation method thereof | |
CN112653516B (zh) | 一种服务器中访问dimm的方法、***、设备及介质 | |
CN110554943B (zh) | 一种基于i3c的多节点服务器cmc管理***及方法 | |
CN116501681B (zh) | Cxl数据传输板卡及控制数据传输的方法 | |
CN111581050B (zh) | 机箱、机箱监控***及监控方法 | |
US7596650B1 (en) | Increasing availability of input/output (I/O) interconnections in a system | |
WO2024146157A1 (zh) | 服务器***和网卡集成设备 | |
US20240045751A1 (en) | Lighting Method and Apparatus Based on AMD Platform, Device and Readable Medium | |
CN115695089B (zh) | 一种实现数据转发的方法、***及桥接设备 | |
CN113868161B (zh) | 一种基于i3c的设备管理方法、装置、设备及可读介质 | |
CN105549696A (zh) | 具有机箱管理功能的机架式服务器*** | |
US20200351121A1 (en) | Ethernet interconnection circuit and apparatus | |
US11954056B2 (en) | PECI signal interconnection method and system for server, device, and medium | |
CN114138354B (zh) | 一种支持multihost的板载OCP网卡***及服务器 | |
US7228338B2 (en) | Multi-service platform module | |
CA2419676A1 (en) | Method of operating a storage device | |
CN107122268B (zh) | 一种基于numa多物理层分区处理*** | |
CN205193686U (zh) | 计算设备 | |
CN217428141U (zh) | 网卡、通信设备及网络安全*** | |
US10938636B2 (en) | Apparatus and method for physical layer transceiver configuration | |
WO2023160691A1 (zh) | 一种基于连接器的端口管理方法及相关设备 | |
CN214069959U (zh) | 一种数据传输***及内置该数据传输***的交换机 | |
CN107483290B (zh) | 基于交换机的主引擎选举方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |