CN116719700A - 服务器主机***的硬件分区的监测方法及装置 - Google Patents

服务器主机***的硬件分区的监测方法及装置 Download PDF

Info

Publication number
CN116719700A
CN116719700A CN202310997627.8A CN202310997627A CN116719700A CN 116719700 A CN116719700 A CN 116719700A CN 202310997627 A CN202310997627 A CN 202310997627A CN 116719700 A CN116719700 A CN 116719700A
Authority
CN
China
Prior art keywords
target
partition
hardware
management system
link unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310997627.8A
Other languages
English (en)
Other versions
CN116719700B (zh
Inventor
陈超凡
刘宝阳
黄家明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202310997627.8A priority Critical patent/CN116719700B/zh
Publication of CN116719700A publication Critical patent/CN116719700A/zh
Application granted granted Critical
Publication of CN116719700B publication Critical patent/CN116719700B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3024Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a central processing unit [CPU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3027Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a bus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computer And Data Communications (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请实施例提供了一种服务器主机***的硬件分区的监测方法及装置,其中,该方法包括:在基板管理控制器上确定目标分区管理***,其中,目标分区管理***是基板管理控制器上划分的多个分区管理***中的任一分区管理***;为目标分区管理***选择复杂可编程逻辑器件上划分的多个链路单元中的目标链路单元,其中,目标链路单元用于连接目标分区管理***和服务器主机***上划分的多个硬件分区中的目标硬件分区;通过目标分区管理***和目标链路单元对目标硬件分区的运行进行监测。通过本申请,解决了相关技术中对服务器的运行监测效率低的问题,达到提高对服务器的运行监测效率的效果。

Description

服务器主机***的硬件分区的监测方法及装置
技术领域
本申请实施例涉及计算机领域,具体而言,涉及一种服务器主机***的硬件分区的监测方法及装置。
背景技术
在服务器行业领域,通用主机***CPU等计算资源硬件分区的技术应运而生,一台服务器被分区成两个甚至更多个物理主机***,单独承载业务提供服务,这给硬件分区BMC的***设计带来了难度和挑战。为了保障服务器长期稳定高效运行,服务器***必须具备功能强大的故障监控管理功能。由于传统服务器通常通过南桥PCH(Platform ControllerHub)中的ME(Management Engine)管理引擎实现对CPU温度的获取及关键寄存器信息收集,然后将这些数据发给BMC进行下一步处理。但是ME本身承担着服务器管理的多项复杂任务,经常发生CPU温度获取及寄存器收集被其他任务打断的情况;同时,当服务器出现***宕机时,ME同样会大概率受到影响而无法工作。因此,现有技术获取服务器中的运行数据(例如,CPU的温度及寄存器数据等)的效率比较低,导致对服务器的运行监测效率低的问题。
发明内容
本申请实施例提供了一种服务器主机***的硬件分区的监测方法及装置,以至少解决相关技术中对服务器的运行监测效率低的问题。
根据本申请的一个实施例,提供了一种服务器监测组件服务器主机***的硬件分区的监测方法,包括:在上述基板管理控制器上确定目标分区管理***,其中,上述目标分区管理***是上述基板管理控制器上划分的多个分区管理***中的任一分区管理***;为上述目标分区管理***选择复杂可编程逻辑器件上划分的多个链路单元中的目标链路单元,其中,上述目标链路单元用于连接上述目标分区管理***和服务器主机***上划分的多个硬件分区中的目标硬件分区;通过上述目标分区管理***和上述目标链路单元对上述目标硬件分区的运行进行监测。
根据本申请的一个实施例,还提供了一种基板管理控制器,包括:多个分区管理***,其中,多个上述分区管理***中的目标分区管理***与复杂可编程逻辑器件上的目标链路单元连接,其中,上述目标分区管理***是多个上述分区管理***中的任一分区管理***,上述目标链路单元是上述复杂可编程逻辑器件上划分的多个链路单元中的任一链路管理单元;上述目标链路单元与服务器主机***上划分的多个硬件分区中的目标硬件分区连接,其中,上述目标硬件分区是多个上述硬件分区中的任一硬件分区,上述目标分区管理***用于通过上述目标链路单元对上述目标硬件分区的运行进行监测。
在一个示例性实施例中,上述目标分区管理***中包括目标操作***和目标硬件接口,其中,上述目标硬件接口,用于连接上述目标分区管理和上述目标链路单元,并用于从上述目标链路单元中读取上述目标硬件分区的运行数据;上述目标操作***,用于利用上述运行数据监测上述目标硬件分区的运行。
在一个示例性实施例中,上述目标分区管理***中包括中断接口,其中,上述中断接口,用于传输上述目标链路单元发送至上述目标分区管理***的中断信号,上述中断信号用于表示上述目标硬件分区的运行数据已发送至上述目标链路单元。
根据本申请的一个实施例,还提供了一种复杂可编程逻辑器件,包括:多个链路单元,其中,多个链路单元中的目标链路单元与服务器主机***上划分的多个硬件分区中的目标硬件分区连接,其中,上述目标链路单元是多个上述链路单元中的任一链路单元,上述目标硬件分区是多个上述硬件分区中的任一硬件分区;上述目标链路单元还与基板管理控制器上划分的多个分区管理***中的目标分区管理***连接,其中,上述目标分区管理***是多个上述分区管理***中的任一分区管理***,上述目标分区管理***用于通过上述目标链路单元对上述目标硬件分区的运行进行监测。
在一个示例性实施例中,上述目标链路单元通过上述目标分区管理***中的目标硬件接口与上述目标分区管理***连接,并通过上述目标硬件接口向上述目标分区管理***传输上述目标硬件分区的运行数据。
在一个示例性实施例中,上述目标链路单元上还包括目标控制器,其中,上述目标控制器,用于转换上述目标硬件分区和上述目标分区管理***之间传输的数据,上述目标控制器是支持上述PECI传输协议的控制器,上述目标控制器通过目标控制接口与上述目标硬件分区链接。
根据本申请的一个实施例,还提供了一种服务器主机***,包括:多个硬件分区,其中,多个硬件分区中的目标硬件分区与目标链路单元连接,其中,上述目标链路单元是复杂可编程逻辑器件上划分的多个上述链路单元中的任一链路单元;上述目标链路单元与目标分区管理***连接,其中,上述目标分区管理***是基板管理控制器上划分的多个上述分区管理***中的任一分区管理***,上述目标分区管理***用于通过上述目标链路单元对上述目标硬件分区的运行进行监测。
根据本申请的一个实施例,还提供了一种服务器,包括:上述的基板管理控制器,上述的复杂可编程逻辑器件,以及上述的服务器主机***。
根据本申请的一个实施例,还提供了一种服务器主机***的硬件分区的监测装置,包括:确定模块,用于在上述基板管理控制器上确定目标分区管理***,其中,上述目标分区管理***是上述基板管理控制器上划分的多个分区管理***中的任一分区管理***;选择模块,用于为上述目标分区管理***选择复杂可编程逻辑器件上划分的多个链路单元中的目标链路单元,其中,上述目标链路单元用于连接上述目标分区管理***和服务器主机***上划分的多个硬件分区中的目标硬件分区;监测模块,用于通过上述目标分区管理***和上述目标链路单元对上述目标硬件分区的运行进行监测。
根据本申请的又一个实施例,还提供了一种计算机可读存储介质,上述计算机可读存储介质中存储有计算机程序,其中,上述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
根据本申请的又一个实施例,还提供了一种电子设备,包括存储器和处理器,上述存储器中存储有计算机程序,上述处理器被设置为运行上述计算机程序以执行上述任一项方法实施例中的步骤。
通过本申请,由于在基板管理控制器上划分了多个分区管理***,每个目标分区管理***对应一个复杂可编程逻辑器件中划分的目标链路单元,目标链路单元与服务器中划分的多个硬件分区中的目标硬件分区连接。使得目标分区管理***可以通过目标链路单元独立的管理目标硬件分区。从而形成了PECI链路的互连拓扑,实现了构建分区管理***与服务器之间独立的PECI链路的目的,提高了BMC获取服务器的运行数据的效率。因此,可以解决相关技术中对服务器的运行监测效率低的问题,达到提高对服务器的运行监测效率的效果。
附图说明
图1是本申请实施例的一种服务器主机***的硬件分区的监测方法的移动终端的硬件结构框图;
图2是根据本申请实施例的服务器主机***的硬件分区的监测方法的流程图;
图3是根据本申请实施例的服务器监测***的具体实施例的结构示意图;
图4是根据本申请实施例的请求数据的数据格式示意图;
图5是根据本申请实施例的PECI数据格式示意图;
图6是根据本申请实施例的目标响应数据的格式示意图;
图7是根据本申请实施例的命令发送流程图;
图8是根据本申请实施例的命令接收流程图;
图9是根据本申请实施例的服务器主机***的硬件分区的监测装置的结构框图;
图10是根据本申请实施例的一种可选的电子设备的示意图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本申请的实施例。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
下面对本申请中的相关技术进行解释:
BMC:Baseboard Management Controller,基板管理控制器,硬件分区;
CPU:Central Processing Unit,中央处理器,作为的运算和控制核心,是信息处理、程序运行的最终执行单元;
PECI:Platform Environment Control Interface, 平台环境控制接口,用于服务器BMC与Intel架构CPU间进行信息交互;
FCS:Frame Check Sequence,帧校验序列,用于PECI总线中Client设备响应Host设备的校验信息;
Host***:主机***;
Linux***:全称GNU/Linux,是一套***和自由传播的类Unix操作***,是一个基于POSIX的多用户、多任务、支持多线程和多的操作***;
CPLD(Complex Programmable Logic Device)复杂
PECI是用于监测CPU及芯片组温度的一线总线(one-wire bus),全称是PlatformEnvironment Control Interface。它最主要的应用是监测CPU温度;
FPGA(Field Programmable Gate Array)现场可编程逻辑门阵列。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
本申请实施例中所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在移动终端上为例,图1是本申请实施例的一种服务器主机***的硬件分区的监测方法的移动终端的硬件结构框图。如图1所示,移动终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,其中,上述移动终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述移动终端的结构造成限定。例如,移动终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本申请实施例中的服务器主机***的硬件分区的监测方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至移动终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输设备106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端的通信供应商提供的无线网络。在一个实例中,传输设备106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输设备106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
在本实施例中提供了一种服务器主机***的硬件分区的监测方法,图2是根据本申请实施例的服务器主机***的硬件分区的监测方法的流程图,如图2所示,该流程包括如下步骤:
步骤S202,在基板管理控制器上确定目标分区管理***,其中,目标分区管理***是基板管理控制器上划分的多个分区管理***中的任一分区管理***;
步骤S204,为目标分区管理***选择复杂可编程逻辑器件上划分的多个链路单元中的目标链路单元,其中,目标链路单元用于连接目标分区管理***和服务器主机***上划分的多个硬件分区中的目标硬件分区;
步骤S206,通过目标分区管理***和目标链路单元对目标硬件分区的运行进行监测。
其中,上述步骤的执行主体可以为处理器,或者与终端或者服务器相对独立设置的处理器或者处理设备等,但不限于此。
本实施例可以应用于需要对主机进行分区管理的场景中,例如,一台服务器被分区成多个硬件分区***,每个硬件分区***单独承载业务提供服务,需要对每个物理主机***进行单独的监测。
通过上述步骤,由于在基板管理控制器上划分了多个分区管理***,每个目标分区管理***对应一个复杂可编程逻辑器件中划分的目标链路单元,目标链路单元与服务器中划分的多个硬件分区中的目标硬件分区连接。使得目标分区管理***可以通过目标链路单元独立的管理目标硬件分区。从而形成了PECI链路的互连拓扑,实现了构建分区管理***与服务器之间独立的PECI链路的目的,提高了BMC获取服务器的运行数据的效率。因此,可以解决相关技术中对服务器的运行监测效率低的问题,达到提高对服务器的运行监测效率的效果。
可选地,在本实施例中,上述基板管理控制器可以但不限于是一个基于IPMI技术设计规范下,对主机板提供智能管理的用于监控和管理服务器的专用控制器,如BMC。BMC可以有独立的运算器,其次是控制器,以及存储器和输入输出设备,还可以有独立的软件***,包括基本开机***,操作***和运行在BMC***上的各种应用程序。在主机板上,BMC可以是独立***板块亦可以设计为集成在主机板上的一个部件,常被设计在服务器或者计算机的主机板上。
可选地,在本实施例中,复杂可编程逻辑器件包括但不限于具有链路功能的器件,并具有数据转换功能。例如,CPLD。CPLD可以有独立的运算器,其次是控制器,以及存储器和输入输出设备,还可以有独立的软件***,包括基本开机***,操作***和运行在BMC***上的各种应用程序。在主机板上,CPLD可以是独立***板块亦可以设计为集成在主机板上的一个部件,常被设计在服务器或者计算机的主机板上。CPLD逻辑单元和FPGA逻辑单元是服务器***中固有的器件,不需要额外增加硬件结构,可以充分利用服务器***中的硬件资源。需要说明的是,也可以根据实际需要增加硬件设备,以满足PECI链路的转换功能。
可选的,在本实施例中,服务器主机***可以但不限于是搭载多个CPU处理器的安装在计算机主机上的操作***,通常是Windows、Mac、OS等***,它们管理计算机的硬件和软件资源,并提供服务和接口供用户或应用程序使用。
可选的,在本实施例中,可以但不限于以CPU处理器为分区单位对服务器主机***的硬件资源进行分区,得到多个硬件分区。多个硬件分区中的每个硬件分区都各自对应一个独立的操作***,也即每个硬件分区均包含自身***运行所需的计算、存储、网络和IO等硬件资源。
可选的,在本实施例中,在软件层面,每个硬件分区能够分别运行不同的操作***或者相同操作***的不同版本,且用于管理每个硬件分区的对应的操作***各自独立运行。
在一个示例性实施例中,为目标分区管理***选择复杂可编程逻辑器件上划分的多个链路单元中的目标链路单元,包括:获取复杂可编程逻辑器件上的多个链路单元;为多个链路单元中每个目标链路单元分配基板管理控制器上的目标操作***,其中,目标链路单元至少满足目标操作***的链路需求;为目标链路单元分配基板管理控制器上的硬件接口得到目标硬件接口,其中,目标硬件接口至少满足目标操作***的硬件连接需求;将与目标操作***和目标硬件接口存在对应关系的目标链路单元与目标分区管理***建立对应关系,得到具有对应关系的链路单元和分区管理***。在本实施例中,目标操作***可以但不限于是在基板管理控制器上运行的任何一个操作***,可以是部署在嵌入式***的处理器上的多个操作***中的任何一个操作***,即嵌入式操作***,嵌入式操作***根据对响应时间的敏感程度可分为实时性操作***(RTOS)和非实时性操作***,实时性操作***可以但不限于包括FreeRTOS和RTLinux(AReal-Time Linux,亦称作实时Linux,是Linux中的一种实时操作***)等,非实时操作***可以但不限于包括contiki(一个小型、开源、极易移植的多任务电脑操作***)、HeliOS(使用Ruby开发的一套可扩展的移动后端框架)和Linux等。Linux***独立运行在分区管理***中。实现了对各个服务器进行独立监测的目的。
可选的,在本实施例中,上述多个操作***可以但不限于是多个异构的或者同构的用于管理BMC的操作***,即每个操作***的类型可以相同也可以不同。
可选的,在本实施例中,嵌入式***是用于控制、监视或者辅助操作机器和设备的装置,是一种专用的计算机***。嵌入式***是以应用为中心,以计算机技术为基础,软硬件可裁剪,适应应用***对功能、可靠性、成本、体积、功耗等严格要求的专用计算机***。从应用对象上加以定义来说,嵌入式***是软件和硬件的综合体,还可以涵盖机械等附属装置。
可选的,在本实施例中,嵌入式***从硬件角度可以但不限于包括处理器,存储器和***电路等硬件设备,上述目标操作***可以但不限于基于嵌入式***的处理器运行。从软件角度可以但不限于包括底层驱动,操作***和应用程序等,上述目标操作***即为嵌入式***中的操作***。
在一个示例性实施例中,将与目标操作***和目标硬件接口存在对应关系的目标链路单元与目标分区管理***建立对应关系之前,方法还包括:获取基板管理控制器上的多个分区管理***;为多个分区管理***中每个目标分区管理***分配基板管理控制器上的操作***,得到目标操作***;为每个目标分区管理***分配基板管理控制器上的硬件接口,得到目标硬件接口;建立目标分区管理***与目标操作***、目标硬件接口之间的对应关系,得到具有对应关系的分区管理***、操作***链路以及硬件接口。在本实施例中,一个分区管理***中对应一个操作***,操作***用于对分区管理***中接收或者需要发出的数据进行处理。并在分区管理***中设置有一个或多个目标硬件接口。目标硬件接口时具备数据传输能力的接口,对应连接至链路管理单元中,包括但不限于是I2C接口。例如,BMC中的目标分区管理***和目标链路单元之间通过I2C连接。
在一个示例性实施例中,将与目标操作***和目标硬件接口存在对应关系的目标链路单元与目标分区管理***建立对应关系之后,方法还包括:获取主机***的多个硬件分区;为多个硬件分区中每个目标硬件分区分配复杂可编程逻辑器件上的控制器,得到目标控制器,其中,目标控制器至少满足对目标硬件分区的控制运行需求;为目标硬件分区分配复杂可编程逻辑器件上的控制接口,得到目标控制接口,其中,目标控制接口至少满足目标硬件分区的连接需求;建立目标硬件分区与目标控制器、目标控制接口之间的对应关系,得到具有对应关系的硬件分区和链路单元。在本实施例中,目标控制器包括但不限于是处理器,或者其他具备控制能力的设备,例如,PECI控制器。硬件分区中也可以设置控制器,与目标控制器之间通过目标控制接口连接。例如,目标链路单元中的PECI控制器通过PECI接口与目标硬件分区中的PECI控制器连接,进行数据的传输。
在一个示例性实施例中,通过目标分区管理***和目标链路单元对目标硬件分区的运行进行监测,包括:通过目标分区管理***向目标链路单元发送请求数据,其中,请求数据用于请求目标硬件分区的运行数据;通过目标链路单元将请求数据转换为支持PECI传输协议的数据,得到目标请求数据,并将目标请求数据发送至目标硬件分区;在目标硬件分区响应目标请求数据的情况下,获取目标硬件分区产生的包括运行数据的响应数据;通过目标链路单元接收目标硬件分区发送的响应数据,并将响应数据转换为支持I2C传输协议的数据,得到目标响应数据,其中,响应数据是支持PECI传输协议的数据;通过目标分区管理***从目标链路单元获取目标响应数据,并从目标响应数据中提取目标硬件分区产生的运行数据,利用运行数据对目标硬件分区的运行进行监测。在本实施例中,请求数据中包括以下至少之一:目标硬件分区的地址,目标硬件分区的探测信息,请求数据的数据格式,请求获取目标硬件分区的运行数据的参数信息,其中,探测信息用于请求探测目标硬件分区中是否设置支持传输PECI数据的链路。对请求数据的转换主要是为了加快请求数据的传输,例如,将请求数据转换为PECI数据,可以通过目标链路单元快速的传输值目标硬件分区中。响应数据中包括目标硬件分区的运行数据(例如,温度、运行速度等信息)。对响应数据的转换也是为了加快响应数据的传输。服务器的运行数据包括服务器中的CPU的温度、CPU功耗、关键寄存器的信息、UPI链路、内存控制器、PCIe链路等的故障状态信息。本实施例中的分区管理***与链路单元之间通过I2C接口传输数据,并不需要在分区管理***中再设置PECI控制器,通过链路单元的转换就可以实现分区管理***与硬件分区之间的PECI传输。从而可以节省BMC和主机***的设计成本,提高计算性能。
例如,请求数据的格式如图4所示,请求数据中包括服务器的地址(图4中的PECI目标地址),服务器探测信息,数据格式信息(图4中的命令码),请求服务器的运行数据的参数信息(图4所示的参数1-参数N),其中,服务器探测信息用于请求探测服务器中是否设置PECI链路,数据格式信息中包括请求数据支持的数据传输格式,参数信息中包括请求服务器运行数据的参数。请求数据具有检测PECI链路状态的Ping命令,还有获取温度和寄存器的命令。在链路单元是CPLD中的分区的情况下,请求数据中还包括CPLD地址,按照CPLD地址将请求数据发送至对应的链路单元中,在CPLD中通过转换模块将请求数据转换为PECI格式的数据,得到目标请求数据,目标请求数据是PECI格式的数据。PECI数据格式包括目标地址(即Host侧的PECI控制器地址,该地址的范围为0x30~0x37),写长度、读长度、命令码等字段。例如,在PECI数据格式是Ping命令时,PECI数据格式包括的字段如图5所示。其中,地址速率协商位与消息速率协商位为固定格式,分别为两个比特0和一个比特0,写长度与读长度均为0x00。由于Ping命令由长度均为0x00的写长度及读长度唯一标识,故无需命令码字段。FCS字段为Host侧硬件分区的响应数据,采用CRC校验形式。
可选地,通过目标分区管理***向目标链路单元发送请求数据,包括:通过目标分区管理***对应的目标操作***生成请求数据;通过目标分区管理***对应的目标硬件接口将请求数据发送至目标链路单元,其中,目标硬件接口允许传输支持I2C传输协议的请求数据。
可选地,通过目标链路单元将请求数据转换为支持PECI传输协议的数据,得到目标请求数据,并将目标请求数据并发送至目标硬件分区,包括:通过与目标链路单元对应的目标控制器将请求数据转换为目标请求数据,其中,目标控制器是支持PECI传输协议的控制器,目标控制器与目标链路单元中的寄存器连接,寄存器用于存储目标请求数据;通过与目标链路单元对应的目标控制接口将目标请求数据从寄存器中发送至目标硬件分区。
可选地,通过目标链路单元接收目标硬件分区发送的响应数据,并将响应数据转换为支持I2C传输协议的数据,得到目标响应数据包括:通过与目标链路单元对应的目标控制器将响应数据转换为目标响应数据,其中,目标控制器是支持PECI传输协议的控制器,目标控制器与目标链路单元中的寄存器连接,寄存器用于存储目标响应数据。在本实施例中,目标控制器主要是用于对请求数据进行格式转换。从分区管理***中获取的请求数据是I2C格式的数据,需要将请求数据转换为PECI格式的目标请求数据。PECI格式的数据包括多种格式,例如,ping命令的消息格式,其中包括目标地址字段、写长度字段、读长度字段等。需要说明的是,对数据的转换仅仅是数据格式的转换,主要是为了在不同设备之间的传输,具体请求的内容不变。此外,在本实施例中,不同类型的请求数据对应于不同的寄存器,寄存器主要按照PECI传输协议对数据进行PECI协议逻辑控制,转换为波形信号传输,寄存器可以是读写寄存器。
可选地,目标控制器是PECI协议实现的实体,目标控制器中的PECI接口连接至硬件分区中的CPU的PECI引脚;硬件分区则通过硬件分区包括的第二PECI控制器中的第二PECI接口与第一PECI接口相连,从而实现硬件分区与链路单元的PECI请求数据与响应数据的传输。
可选地,通过目标分区管理***从目标链路单元获取目标响应数据之前,方法还包括:通过与目标链路单元向目标分区管理***发送中断信号,其中,中断信号用于表示响应数据已发送至目标链路单元。在本实施例中,分区管理***是服务器监测组件中的主设备,链路单元是服务器监测组件中的从设备。分区管理***与链路单元之间的交互需要分区管理***主动发起,链路单元进行响应。链路单元在接收到响应消息后并不会主动向分区管理***发送响应消息,而是通过中断信号告知分区管理***已经接收到了响应消息,提示分区管理***主动发起获取响应数据的获取指令,以从链路单元中的寄存器中读取响应数据。本实施例链路单元通过向分区管理***发送中断信号,可以使得分区管理***第一时间获取响应数据,提高了对服务器的监测效率。
可选地,响应消息的处理和请求数据的处理过程类似,均需要格式转换,以及传输至寄存器中。以实现快速获取服务器的运行数据的目的。
可选地,通过目标分区管理***从目标链路单元获取目标响应数据,并从目标响应数据中提取目标硬件分区产生的运行数据,利用运行数据对目标硬件分区的运行进行监测,包括:通过与目标分区管理***对应的目标操作***生成读取指令,并通过目标分区管理***对应的目标硬件接口将读取指令发送至目标链路单元,其中,目标硬件接口允许传输支持I2C传输协议的请求数据;通过目标硬件接口从目标链路单元对应的寄存器中读取目标响应数据;通过目标操作***解析目标响应数据,获取运行数据,并按照运行数据对目标硬件分区的运行进行监测。在本实施例中,BMC上的硬件接口的物理地址采用统一编址方式,即LPC0、LPC1、I2C0~I2C5、LAN0、LAN1、PCIE等资源在BMC***中具有互斥的地址空间,这样BMC上不同管理分区中只要保证其所定义的硬件资源不同,就可以保证各管理分区在进行硬件资源访问时不会影响其他管理分区。
在一个可选的实施方式中,以基板管理控制器为BMC为例,BMC划分为3个分区管理***,每个分区管理***中的操作***为Linux***。如图3所示,每一个硬件分区相当于Host分区***中的一个独立服务器***,Host分区***根据CPU单元个数分为N个硬件分区,每个硬件分区对应一个服务器中的CPU处理器,相当于整个主机***被拆分为N路独立的服务器***。为了实现对每一路独立服务器***的独立监控与管理,BMC多核处理器以核心为单元划分为N个分区管理***,分别对应Core1,Core2,…,CoreN。一个Core相当于一个分区管理***。对应的,CPLD逻辑单元划分了N个分区,一个分区相当于一个链路单元。
可选地,Host分区***中一个独立服务器***中包括一个PECI控制器接口,如图3所示,硬件分区1中设置了控制接口PECI1。BMC中每个Core分区中对应设置1个I2C硬件连接接口和1个GPIO接口。CPLD逻辑单元中的N个分区中包括N路并行的链路单元,每一路对应Host侧一个硬件分区的PECI链路的具体转换功能。
可选地,如图3所示,Core1中的I2C接口与CPLD逻辑单元中的链路单元中的I2C接口连接,链路单元与分区管理***之间的I2C链路负责BMC与CPLD间进行PECI请求与响应时数据的互传,请求包括请求数据,响应包括响应数据。分区管理***的GPIO接口则用于接收从链路单元发来的中断信号,该中断信号表明链路单元已准备好向分区管理***发送PECI响应数据。链路单元除了上述I2C接口和GPIO接口,还包括1个PECI控制器模块和与之对应的PECI对外接口,PECI控制器模块是PECI协议实现的实体,PECI接口则用于与Host侧硬件分区的PECI接口连接。该PECI接口连接至硬件分区的CPU的PECI引脚。Host侧则通过硬件分区***的PECI接口与CPLD逻辑单元的PECI接口相连,实现Host硬件分区单元与CPLD逻辑单元单的PECI请求与响应数据传输。
可选地,响应数据是通过PECI链路传输的数据,响应数据的数据格式和目标请求数据的数据格式相同。在链路单元中的转换模块将其转换为PECI格式的目标响应数据,目标响应数据是I2C格式的数据。例如,如图6所示,目标响应数据中包括CPLD地址、命令码、PECI目标地址,响应的字节(即服务器的运行数据)。
可选地,本实施例以硬件分区***下CPLD实现PECI通信链路的***结构为例对服务器监测***进行说明:将Host侧及BMC划分为不同的硬件分区。每个分区管理***的Core分区对应一个Host硬件分区,负责对Host硬件分区的独立管控。并将BMC与CPLD逻辑单元通过I2C(及GPIO)接口互连,Host侧的硬件分区***与CPLD逻辑单元通过PECI接口互连,从而形成BMC-CPLD-Host分区***的PECI链路互连拓扑。并基于特定I2C数据格式的PECI数据交互方法及全***PECI数据处理流程,实现了硬件分区***下Host与BMC间独立PECI链路的构建。不需要额外的硬件投入,无需对BMC的架构进行升级,节省了硬件成本的同时,提高了CPLD的资源利用率,并避免了开发全新架构BMC所消耗的时间成本。
可选地,在一个具体的实施例中,以BMC、CPLD以及Host之间的链路拓扑为例进行说明,主要包括命令发送流程和命令接收流程。如图7所示,本实施例中的命令发送流程包括以下步骤:
S702,BMC发起PECI请求命令;
S703,BMC将PECI请求命令转换为I2C协议格式;
S704,BMC通过I2C接口发送进行格式转换后的请求数据;
S705,CPLD通过I2C接口接收来自BMC的支持I2C协议的请求数据,并对请求数据进行解析,解析出请求内容;
S706,CPLD根据解析后的数据操作PEC控制器的寄存器,对请求数据进行格式转换,转换成PECI格式的目标请求数据;
S707,CPLD通过PECI接口发送目标请求数据的PECI波形给Host的硬件分区。
可选地,如图8所示,本实施例中的命令接收流程包括以下步骤:
S802,CPLD通过PECI接口发送目标请求数据的PECI波形给Host的硬件分区;
S803,Host的硬件分区通过PECI接口接收来自CPLD的PECI数据(即目标请求数据的波形);
S804,Host分区对目标地址字段进行校验,如果目标地址与自身地址匹配,则响应该请求数据;
S805,Host分区通过Host侧的PECI接口发送响应数据至CPLD逻辑单元的PECI接口;
S806,CPLD逻辑单元通过PECI接口接收来自Host***分区的响应数据;
S807,CPLD解析响应数据,由PECI控制器缓存于寄存器中;
S808,BMC通过I2C接口向CPLD发送PECI响应数据读取命令(即读取命令);
S809,CPLD通过I2C接口发送目标响应数据给BMC;
S810,BMC接收来自CPLD的目标响应数据并解析出有效数据(例如,服务器的运行数据)。
综上,本实施例通过PECI链路能够实现各硬件分区***下分区管理***到Host侧的独立PECI链路构建,达到单一分区管理***对Host多硬件分区***的独立监控的目的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例上述的方法。
在本实施例中提供了一种基板管理控制器,包括:多个分区管理***,其中,多个分区管理***中的目标分区管理***与复杂可编程逻辑器件上的目标链路单元连接,其中,目标分区管理***是多个分区管理***中的任一分区管理***,目标链路单元是复杂可编程逻辑器件上划分的多个链路单元中的任一链路管理单元;目标链路单元与服务器主机***上划分的多个硬件分区中的目标硬件分区连接,其中,目标硬件分区是多个硬件分区中的任一硬件分区,目标分区管理***用于通过目标链路单元对目标硬件分区的运行进行监测。
通过上述基板管理控制器,由于在基板管理控制器上划分了多个分区管理***,每个目标分区管理***对应一个复杂可编程逻辑器件中划分的目标链路单元,目标链路单元与服务器中划分的多个硬件分区中的目标硬件分区连接。使得目标分区管理***可以通过目标链路单元独立的管理目标硬件分区。从而形成了PECI链路的互连拓扑,实现了构建分区管理***与服务器之间独立的PECI链路的目的,提高了BMC获取服务器的运行数据的效率。因此,可以解决相关技术中对服务器的运行监测效率低的问题,达到提高对服务器的运行监测效率的效果。
可选地,在本实施例中,上述基板管理控制器可以但不限于是一个基于IPMI技术设计规范下,对主机板提供智能管理的用于监控和管理服务器的专用控制器,如BMC。BMC可以有独立的运算器,其次是控制器,以及存储器和输入输出设备,还可以有独立的软件***,包括基本开机***,操作***和运行在BMC***上的各种应用程序。在主机板上,BMC可以是独立***板块亦可以设计为集成在主机板上的一个部件,常被设计在服务器或者计算机的主机板上。
在一个示例性实施例中,目标分区管理***中包括目标操作***和目标硬件接口,其中,目标硬件接口,用于连接目标分区管理和目标链路单元,并用于从目标链路单元中读取目标硬件分区的运行数据;目标操作***,用于利用运行数据监测目标硬件分区的运行。
在一个示例性实施例中,目标分区管理***中包括中断接口,其中,中断接口,用于传输目标链路单元发送至目标分区管理***的中断信号,中断信号用于表示目标硬件分区的运行数据已发送至目标链路单元。
在本实施例中提供了一种复杂可编程逻辑器件,包括:多个链路单元,其中,多个链路单元中的目标链路单元与服务器主机***上划分的多个硬件分区中的目标硬件分区连接,其中,目标链路单元是多个链路单元中的任一链路单元,目标硬件分区是多个硬件分区中的任一硬件分区;目标链路单元还与基板管理控制器上划分的多个分区管理***中的目标分区管理***连接,其中,目标分区管理***是多个分区管理***中的任一分区管理***,目标分区管理***用于通过目标链路单元对目标硬件分区的运行进行监测。
通过上述复杂可编程逻辑器件,由于每个目标分区管理***对应一个复杂可编程逻辑器件中划分的目标链路单元,目标链路单元与服务器中划分的多个硬件分区中的目标硬件分区连接。使得目标分区管理***可以通过目标链路单元独立的管理目标硬件分区。从而形成了PECI链路的互连拓扑,实现了构建分区管理***与服务器之间独立的PECI链路的目的,提高了BMC获取服务器的运行数据的效率。因此,可以解决相关技术中对服务器的运行监测效率低的问题,达到提高对服务器的运行监测效率的效果。
可选地,在本实施例中,复杂可编程逻辑器件包括但不限于具有链路功能的器件,并具有数据转换功能。例如,CPLD。CPLD可以有独立的运算器,其次是控制器,以及存储器和输入输出设备,还可以有独立的软件***,包括基本开机***,操作***和运行在BMC***上的各种应用程序。在主机板上,CPLD可以是独立***板块亦可以设计为集成在主机板上的一个部件,常被设计在服务器或者计算机的主机板上。CPLD逻辑单元和FPGA逻辑单元是服务器***中固有的器件,不需要额外增加硬件结构,可以充分利用服务器***中的硬件资源。需要说明的是,也可以根据实际需要增加硬件设备,以满足PECI链路的转换功能。
在一个示例性实施例中,目标链路单元通过目标分区管理***中的目标硬件接口与目标分区管理***连接,并通过目标硬件接口向目标分区管理***传输目标硬件分区的运行数据。
在一个示例性实施例中,目标链路单元上还包括目标控制器,其中,目标控制器,用于转换目标硬件分区和目标分区管理***之间传输的数据,目标控制器是支持PECI传输协议的控制器,目标控制器通过目标控制接口与目标硬件分区链接。
在本实施例中提供了一种服务器主机***,包括:多个硬件分区,其中,多个硬件分区中的目标硬件分区与目标链路单元连接,其中,目标链路单元是复杂可编程逻辑器件上划分的多个链路单元中的任一链路单元;目标链路单元与目标分区管理***连接,其中,目标分区管理***是基板管理控制器上划分的多个分区管理***中的任一分区管理***,目标分区管理***用于通过目标链路单元对目标硬件分区的运行进行监测。
通过上述服务器主机***,由于服务器主机***包括多个硬件分区,每个硬件分区对应一个基板管理控制器上的目标分区管理***,并对应一个复杂可编程逻辑器件中划分的目标链路单元。使得目标分区管理***可以通过目标链路单元独立的管理目标硬件分区。从而形成了PECI链路的互连拓扑,实现了构建分区管理***与服务器之间独立的PECI链路的目的,提高了BMC获取服务器的运行数据的效率。因此,可以解决相关技术中对服务器的运行监测效率低的问题,达到提高对服务器的运行监测效率的效果。
可选的,在本实施例中,服务器主机***可以但不限于是搭载多个CPU处理器的安装在计算机主机上的操作***,通常是Windows、Mac、OS等***,它们管理计算机的硬件和软件资源,并提供服务和接口供用户或应用程序使用。
可选的,在本实施例中,可以但不限于以CPU处理器为分区单位对服务器主机***的硬件资源进行分区,得到多个硬件分区。多个硬件分区中的每个硬件分区都各自对应一个独立的操作***,也即每个硬件分区均包含自身***运行所需的计算、存储、网络和IO等硬件资源。
可选的,在本实施例中,在软件层面,每个硬件分区能够分别运行不同的操作***或者相同操作***的不同版本,且用于管理每个硬件分区的对应的操作***各自独立运行。
在本实施例中提供了一种服务器,包括:的基板管理控制器,的复杂可编程逻辑器件,以及的服务器主机***。
在本实施例中提供了一种服务器主机***的硬件分区的监测装置,如图9所示,是本实施例服务器主机***的硬件分区的监测装置的结构框图,包括:
确定模块92,用于在基板管理控制器上确定目标分区管理***,其中,目标分区管理***是基板管理控制器上划分的多个分区管理***中的任一分区管理***;
选择模块94,用于为上述目标分区管理***选择复杂可编程逻辑器件上划分的多个链路单元中的目标链路单元,其中,上述目标链路单元用于连接上述目标分区管理***和服务器主机***上划分的多个硬件分区中的目标硬件分区;
监测模块96,用于通过上述目标分区管理***和上述目标链路单元对上述目标硬件分区的运行进行监测。
在一个示例性实施例中,上述选择模块94,包括:
第一获取单元,用于获取上述复杂可编程逻辑器件上的上述多个链路单元;
第一分配单元,用于为上述多个链路单元中每个上述目标链路单元分配上述基板管理控制器上的目标操作***,其中,上述目标链路单元至少满足上述目标操作***的链路需求;
第二分配单元,用于为上述目标链路单元分配上述基板管理控制器上的硬件接口得到目标硬件接口,其中,上述目标硬件接口至少满足上述目标操作***的硬件连接需求;
第一建立单元,用于将与上述目标操作***和上述目标硬件接口存在对应关系的上述目标链路单元与上述目标分区管理***建立对应关系,得到具有对应关系的链路单元和分区管理***。
在一个示例性实施例中,上述装置还包括:第一获取模块,用于将与上述目标操作***和上述目标硬件接口存在对应关系的上述目标链路单元与上述目标分区管理***建立对应关系之前,获取上述基板管理控制器上的多个分区管理***;
第一分配模块,用于为上述多个分区管理***中每个目标分区管理***分配上述基板管理控制器上的操作***,得到上述目标操作***;
第二分配模块,用于为每个上述目标分区管理***分配上述基板管理控制器上的硬件接口,得到上述目标硬件接口;
第一建立模块,用于建立上述目标分区管理***与上述目标操作***、上述目标硬件接口之间的对应关系,得到具有对应关系的分区管理***、操作***链路以及硬件接口。
在一个示例性实施例中,上述装置还包括:
第二获取模块,用于将与上述目标操作***和上述目标硬件接口存在对应关系的上述目标链路单元与上述目标分区管理***建立对应关系之后,获取上述主机***的上述多个硬件分区;
第三分配模块,用于为上述多个硬件分区中每个上述目标硬件分区分配上述复杂可编程逻辑器件上的控制器,得到目标控制器,其中,上述目标控制器至少满足对上述目标硬件分区的控制运行需求;
第四分配模块,用于为上述目标硬件分区分配上述复杂可编程逻辑器件上的控制接口,得到上述目标控制接口,其中,上述目标控制接口至少满足上述目标硬件分区的连接需求;
第二建立模块,用于建立上述目标硬件分区与上述目标控制器、上述目标控制接口之间的对应关系,得到具有对应关系的硬件分区和链路单元。
在一个示例性实施例中,上述监测模块96,包括:
第一发送单元,用于通过上述目标分区管理***向上述目标链路单元发送请求数据,其中,上述请求数据用于请求上述目标硬件分区的运行数据;
第一转换单元,用于通过上述目标链路单元将上述请求数据转换为支持PECI传输协议的数据,得到目标请求数据,并将上述目标请求数据发送至上述目标硬件分区;
第二获取单元,用于在上述目标硬件分区响应上述目标请求数据的情况下,获取上述目标硬件分区产生的包括运行数据的响应数据;
第一接收单元,用于通过上述目标链路单元接收上述目标硬件分区发送的上述响应数据,并将上述响应数据转换为支持I2C传输协议的数据,得到目标响应数据,其中,上述响应数据是支持PECI传输协议的数据;
第三获取单元,用于通过上述目标分区管理***从上述目标链路单元获取上述目标响应数据,并从上述目标响应数据中提取上述目标硬件分区产生的上述运行数据,利用上述运行数据对上述目标硬件分区的运行进行监测。
在一个示例性实施例中,上述第一发送单元,包括:
第一生成子单元,用于通过上述目标分区管理***对应的目标操作***生成上述请求数据;
第一发送子单元,用于通过上述目标分区管理***对应的目标硬件接口将上述请求数据发送至上述目标链路单元,其中,上述目标硬件接口允许传输支持I2C传输协议的上述请求数据。
在一个示例性实施例中,第一转换单元,包括:
第一转换子单元,用于通过与上述目标链路单元对应的目标控制器将上述请求数据转换为上述目标请求数据,其中,上述目标控制器是支持上述PECI传输协议的控制器,上述目标控制器与上述目标链路单元中的寄存器连接,上述寄存器用于存储上述目标请求数据;
第二发送子单元,用于通过与上述目标链路单元对应的目标控制接口将上述目标请求数据从寄存器中发送至上述目标硬件分区。
在一个示例性实施例中,第一接收单元,包括:
第二转换子单元,用于通过与上述目标链路单元对应的目标控制器将上述响应数据转换为上述目标响应数据,其中,上述目标控制器是支持上述PECI传输协议的控制器,上述目标控制器与上述目标链路单元中的寄存器连接,上述寄存器用于存储上述目标响应数据。
在一个示例性实施例中,上述装置还包括:
第一发送模块,用于通过上述目标分区管理***从上述目标链路单元获取上述目标响应数据之前,通过与上述目标链路单元向上述目标分区管理***发送中断信号,其中,上述中断信号用于表示上述响应数据已发送至上述目标链路单元。
在一个示例性实施例中,第三获取单元,包括:
第一生成单元,用于通过与上述目标分区管理***对应的目标操作***生成读取指令,并通过上述目标分区管理***对应的目标硬件接口将上述读取指令发送至上述目标链路单元,其中,上述目标硬件接口允许传输支持I2C传输协议的上述请求数据;
第一读取单元,用于通过上述目标硬件接口从上述目标链路单元对应的寄存器中读取上述目标响应数据;
第四读取单元,用于通过上述目标操作***解析上述目标响应数据,获取上述运行数据,并按照上述运行数据对上述目标硬件分区的运行进行监测。
在一个示例性实施例中,上述请求数据中包括以下至少之一:上述目标硬件分区的地址,上述目标硬件分区的探测信息,上述请求数据的数据格式,请求获取上述目标硬件分区的运行数据的参数信息,其中,上述探测信息用于请求探测上述目标硬件分区中是否设置支持传输PECI数据的链路。
本申请的实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
在一个示例性实施例中,上述计算机可读存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
本申请的实施例还提供了一种电子设备,其中,图10是根据本申请实施例的一种可选的电子设备的示意图,如图10所示,电子设备包括一个或多个处理器;存储器,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器实现用于运行程序,其中,程序被设置为运行时执行上述的基板管理控制器的***运行方法。
在一个示例性实施例中,上述电子设备还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
本实施例中的具体示例可以参考上述实施例及示例性实施方式中所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本申请的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。
以上上述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (22)

1.一种服务器主机***的硬件分区的监测方法,其特征在于,包括:
在基板管理控制器上确定目标分区管理***,其中,所述目标分区管理***是所述基板管理控制器上划分的多个分区管理***中的任一分区管理***;
为所述目标分区管理***选择复杂可编程逻辑器件上划分的多个链路单元中的目标链路单元,其中,所述目标链路单元用于连接所述目标分区管理***和服务器主机***上划分的多个硬件分区中的目标硬件分区;
通过所述目标分区管理***和所述目标链路单元对所述目标硬件分区的运行进行监测。
2.根据权利要求1所述的方法,其特征在于,为所述目标分区管理***选择复杂可编程逻辑器件上划分的多个链路单元中的目标链路单元,包括:
获取所述复杂可编程逻辑器件上的所述多个链路单元;
为所述多个链路单元中每个所述目标链路单元分配所述基板管理控制器上的目标操作***,其中,所述目标链路单元至少满足所述目标操作***的链路需求;
为所述目标链路单元分配所述基板管理控制器上的硬件接口得到目标硬件接口,其中,所述目标硬件接口至少满足所述目标操作***的硬件连接需求;
将与所述目标操作***和所述目标硬件接口存在对应关系的所述目标链路单元与所述目标分区管理***建立对应关系,得到具有对应关系的链路单元和分区管理***。
3.根据权利要求2所述的方法,其特征在于,将与所述目标操作***和所述目标硬件接口存在对应关系的所述目标链路单元与所述目标分区管理***建立对应关系之前,所述方法还包括:
获取所述基板管理控制器上的多个分区管理***;
为所述多个分区管理***中每个目标分区管理***分配所述基板管理控制器上的操作***,得到所述目标操作***;
为每个所述目标分区管理***分配所述基板管理控制器上的硬件接口,得到所述目标硬件接口;
建立所述目标分区管理***与所述目标操作***、所述目标硬件接口之间的对应关系,得到具有对应关系的分区管理***、操作***链路以及硬件接口。
4.根据权利要求2所述的方法,其特征在于,将与所述目标操作***和所述目标硬件接口存在对应关系的所述目标链路单元与所述目标分区管理***建立对应关系之后,所述方法还包括:
获取所述主机***的所述多个硬件分区;
为所述多个硬件分区中每个所述目标硬件分区分配所述复杂可编程逻辑器件上的控制器,得到目标控制器,其中,所述目标控制器至少满足对所述目标硬件分区的控制运行需求;
为所述目标硬件分区分配所述复杂可编程逻辑器件上的控制接口,得到目标控制接口,其中,所述目标控制接口至少满足所述目标硬件分区的连接需求;
建立所述目标硬件分区与所述目标控制器、所述目标控制接口之间的对应关系,得到具有对应关系的硬件分区和链路单元。
5.根据权利要求1所述的方法,其特征在于,通过所述目标分区管理***和所述目标链路单元对所述目标硬件分区的运行进行监测,包括:
通过所述目标分区管理***向所述目标链路单元发送请求数据,其中,所述请求数据用于请求所述目标硬件分区的运行数据;
通过所述目标链路单元将所述请求数据转换为支持PECI传输协议的数据,得到目标请求数据,并将所述目标请求数据发送至所述目标硬件分区;
在所述目标硬件分区响应所述目标请求数据的情况下,获取所述目标硬件分区产生的包括运行数据的响应数据;
通过所述目标链路单元接收所述目标硬件分区发送的所述响应数据,并将所述响应数据转换为支持I2C传输协议的数据,得到目标响应数据,其中,所述响应数据是支持PECI传输协议的数据;
通过所述目标分区管理***从所述目标链路单元获取所述目标响应数据,并从所述目标响应数据中提取所述目标硬件分区产生的所述运行数据,利用所述运行数据对所述目标硬件分区的运行进行监测。
6.根据权利要求5所述的方法,其特征在于,通过所述目标分区管理***向所述目标链路单元发送请求数据,包括:
通过所述目标分区管理***对应的目标操作***生成所述请求数据;
通过所述目标分区管理***对应的目标硬件接口将所述请求数据发送至所述目标链路单元,其中,所述目标硬件接口允许传输支持I2C传输协议的所述请求数据。
7.根据权利要求5所述的方法,其特征在于,通过所述目标链路单元将所述请求数据转换为支持PECI传输协议的数据,得到目标请求数据,并将所述目标请求数据并发送至所述目标硬件分区,包括:
通过与所述目标链路单元对应的目标控制器将所述请求数据转换为所述目标请求数据,其中,所述目标控制器是支持所述PECI传输协议的控制器,所述目标控制器与所述目标链路单元中的寄存器连接,所述寄存器用于存储所述目标请求数据;
通过与所述目标链路单元对应的目标控制接口将所述目标请求数据从寄存器中发送至所述目标硬件分区。
8.根据权利要求5所述的方法,其特征在于,通过所述目标链路单元接收所述目标硬件分区发送的所述响应数据,并将所述响应数据转换为支持I2C传输协议的数据,得到目标响应数据包括:
通过与所述目标链路单元对应的目标控制器将所述响应数据转换为所述目标响应数据,其中,所述目标控制器是支持所述PECI传输协议的控制器,所述目标控制器与所述目标链路单元中的寄存器连接,所述寄存器用于存储所述目标响应数据。
9.根据权利要求5所述的方法,其特征在于,通过所述目标分区管理***从所述目标链路单元获取所述目标响应数据之前,所述方法还包括:
通过与所述目标链路单元向所述目标分区管理***发送中断信号,其中,所述中断信号用于表示所述响应数据已发送至所述目标链路单元。
10.根据权利要求5或9所述的方法,其特征在于,通过所述目标分区管理***从所述目标链路单元获取所述目标响应数据,并从所述目标响应数据中提取所述目标硬件分区产生的所述运行数据,利用所述运行数据对所述目标硬件分区的运行进行监测,包括:
通过与所述目标分区管理***对应的目标操作***生成读取指令,并通过所述目标分区管理***对应的目标硬件接口将所述读取指令发送至所述目标链路单元,其中,所述目标硬件接口允许传输支持I2C传输协议的所述请求数据;
通过所述目标硬件接口从所述目标链路单元对应的寄存器中读取所述目标响应数据;
通过所述目标操作***解析所述目标响应数据,获取所述运行数据,并按照所述运行数据对所述目标硬件分区的运行进行监测。
11.根据权利要求5所述的方法,其特征在于,所述请求数据中包括以下至少之一:所述目标硬件分区的地址,所述目标硬件分区的探测信息,所述请求数据的数据格式,请求获取所述目标硬件分区的运行数据的参数信息,其中,所述探测信息用于请求探测所述目标硬件分区中是否设置支持传输PECI数据的链路。
12.一种基板管理控制器,其特征在于,包括:多个分区管理***,其中,
多个所述分区管理***中的目标分区管理***与复杂可编程逻辑器件上的目标链路单元连接,其中,所述目标分区管理***是多个所述分区管理***中的任一分区管理***,所述目标链路单元是所述复杂可编程逻辑器件上划分的多个链路单元中的任一链路管理单元;
所述目标链路单元与服务器主机***上划分的多个硬件分区中的目标硬件分区连接,其中,所述目标硬件分区是多个所述硬件分区中的任一硬件分区,所述目标分区管理***用于通过所述目标链路单元对所述目标硬件分区的运行进行监测。
13.根据权利要求12所述的基板管理控制器,其特征在于,所述目标分区管理***中包括目标操作***和目标硬件接口,其中,
所述目标硬件接口,用于连接所述目标分区管理和所述目标链路单元,并用于从所述目标链路单元中读取所述目标硬件分区的运行数据;
所述目标操作***,用于利用所述运行数据监测所述目标硬件分区的运行。
14.根据权利要求12所述的基板管理控制器,其特征在于,所述目标分区管理***中包括中断接口,其中,
所述中断接口,用于传输所述目标链路单元发送至所述目标分区管理***的中断信号,所述中断信号用于表示所述目标硬件分区的运行数据已发送至所述目标链路单元。
15.一种复杂可编程逻辑器件,其特征在于,包括:多个链路单元,其中,
多个链路单元中的目标链路单元与服务器主机***上划分的多个硬件分区中的目标硬件分区连接,其中,所述目标链路单元是多个所述链路单元中的任一链路单元,所述目标硬件分区是多个所述硬件分区中的任一硬件分区;
所述目标链路单元还与基板管理控制器上划分的多个分区管理***中的目标分区管理***连接,其中,所述目标分区管理***是多个所述分区管理***中的任一分区管理***,所述目标分区管理***用于通过所述目标链路单元对所述目标硬件分区的运行进行监测。
16.根据权利要求15所述的复杂可编程逻辑器件,其特征在于,所述目标链路单元通过所述目标分区管理***中的目标硬件接口与所述目标分区管理***连接,并通过所述目标硬件接口向所述目标分区管理***传输所述目标硬件分区的运行数据。
17.根据权利要求15所述的复杂可编程逻辑器件,其特征在于,所述目标链路单元上还包括目标控制器,其中,
所述目标控制器,用于转换所述目标硬件分区和所述目标分区管理***之间传输的数据,所述目标控制器是支持PECI传输协议的控制器,所述目标控制器通过目标控制接口与所述目标硬件分区链接。
18.一种服务器主机***,其特征在于,包括:多个硬件分区,其中,
多个硬件分区中的目标硬件分区与目标链路单元连接,其中,所述目标链路单元是复杂可编程逻辑器件上划分的多个所述链路单元中的任一链路单元;
所述目标链路单元与目标分区管理***连接,其中,所述目标分区管理***是基板管理控制器上划分的多个所述分区管理***中的任一分区管理***,所述目标分区管理***用于通过所述目标链路单元对所述目标硬件分区的运行进行监测。
19.一种服务器,其特征在于,包括:所述权利要求12至14任一项所述的基板管理控制器,所述权利要求15至17任一项所述的复杂可编程逻辑器件,以及所述权利要求18所述的服务器主机***。
20.一种服务器主机***的硬件分区的监测装置,其特征在于,包括:
确定模块,用于在基板管理控制器上确定目标分区管理***,其中,所述目标分区管理***是所述基板管理控制器上划分的多个分区管理***中的任一分区管理***;
选择模块,用于为所述目标分区管理***选择复杂可编程逻辑器件上划分的多个链路单元中的目标链路单元,其中,所述目标链路单元用于连接所述目标分区管理***和服务器主机***上划分的多个硬件分区中的目标硬件分区;
监测模块,用于通过所述目标分区管理***和所述目标链路单元对所述目标硬件分区的运行进行监测。
21.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被处理器执行时实现所述权利要求1至11任一项中所述的方法的步骤。
22.一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现所述权利要求1至11任一项中所述的方法的步骤。
CN202310997627.8A 2023-08-09 2023-08-09 服务器主机***的硬件分区的监测方法及装置 Active CN116719700B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310997627.8A CN116719700B (zh) 2023-08-09 2023-08-09 服务器主机***的硬件分区的监测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310997627.8A CN116719700B (zh) 2023-08-09 2023-08-09 服务器主机***的硬件分区的监测方法及装置

Publications (2)

Publication Number Publication Date
CN116719700A true CN116719700A (zh) 2023-09-08
CN116719700B CN116719700B (zh) 2023-11-03

Family

ID=87870111

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310997627.8A Active CN116719700B (zh) 2023-08-09 2023-08-09 服务器主机***的硬件分区的监测方法及装置

Country Status (1)

Country Link
CN (1) CN116719700B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117032812A (zh) * 2023-10-09 2023-11-10 苏州元脑智能科技有限公司 服务器的管理方法、设备、装置、存储介质和电子设备
CN117056275A (zh) * 2023-10-10 2023-11-14 苏州元脑智能科技有限公司 基于硬件分区***的通信控制方法、装置及服务器

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100017735A1 (en) * 2008-07-15 2010-01-21 Unisys Corporation Decentralized hardware partitioning within a multiprocessing computing system
US20100125655A1 (en) * 2008-11-19 2010-05-20 Uri Elzur Method and system for centralized logic for centrally managed machines
CN112000501A (zh) * 2020-08-07 2020-11-27 苏州浪潮智能科技有限公司 一种多节点分区服务器访问i2c设备的管理***
CN113204375A (zh) * 2021-04-25 2021-08-03 山东英信计算机技术有限公司 一种多路服务器分区方法、***及设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100017735A1 (en) * 2008-07-15 2010-01-21 Unisys Corporation Decentralized hardware partitioning within a multiprocessing computing system
US20100125655A1 (en) * 2008-11-19 2010-05-20 Uri Elzur Method and system for centralized logic for centrally managed machines
CN112000501A (zh) * 2020-08-07 2020-11-27 苏州浪潮智能科技有限公司 一种多节点分区服务器访问i2c设备的管理***
CN113204375A (zh) * 2021-04-25 2021-08-03 山东英信计算机技术有限公司 一种多路服务器分区方法、***及设备

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117032812A (zh) * 2023-10-09 2023-11-10 苏州元脑智能科技有限公司 服务器的管理方法、设备、装置、存储介质和电子设备
CN117032812B (zh) * 2023-10-09 2024-02-02 苏州元脑智能科技有限公司 服务器的管理方法、设备、装置、存储介质和电子设备
CN117056275A (zh) * 2023-10-10 2023-11-14 苏州元脑智能科技有限公司 基于硬件分区***的通信控制方法、装置及服务器
CN117056275B (zh) * 2023-10-10 2024-02-09 苏州元脑智能科技有限公司 基于硬件分区***的通信控制方法、装置及服务器

Also Published As

Publication number Publication date
CN116719700B (zh) 2023-11-03

Similar Documents

Publication Publication Date Title
CN116719700B (zh) 服务器主机***的硬件分区的监测方法及装置
US10127170B2 (en) High density serial over LAN management system
US20040228063A1 (en) IPMI dual-domain controller
US20190087182A1 (en) Management protocol adapter
CN103414579A (zh) 一种适用于云计算的跨平台监控***及其监控方法
CN116541227B (zh) 故障诊断方法、装置、存储介质、电子装置及bmc芯片
EP2832039B1 (en) Platform independent management controller
US9170976B2 (en) Network efficiency and power savings
CN117032812B (zh) 服务器的管理方法、设备、装置、存储介质和电子设备
CN116244229B (zh) 硬件控制器的访问方法、装置、存储介质和电子设备
CN116723198A (zh) 一种多节点服务器主机控制方法、装置、设备、存储介质
US11805338B2 (en) Systems and methods for enabling smart network interface card as an advanced telemetry appliance
CN116521378B (zh) 服务器的传感器访问方法、装置和基板管理控制器
CN115543872A (zh) 一种设备管理方法、装置及计算机存储介质
CN116192626B (zh) 设备访问方法及装置、计算机可读存储介质、电子设备
CN105528199B (zh) 一种节点的处理方法及装置
CN113032054B (zh) 一种服务执行方法、装置、存储介质及电子装置
US11496595B2 (en) Proxy management controller system
CN116389357B (zh) 基于片上网络的空洞地址处理方法、装置、设备及介质
CN117056275B (zh) 基于硬件分区***的通信控制方法、装置及服务器
CN113900715B (zh) 一种信息管理***、方法、装置及存储介质
CN117032040B (zh) 传感器数据获取方法、装置、设备及可读存储介质
US10803008B2 (en) Flexible coupling of processor modules
CN117319255A (zh) 网卡带外管理功能的测试方法、装置、介质以及终端
CN118227277A (zh) 芯片上操作的执行方法、装置、存储介质和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant