CN116723198A - 一种多节点服务器主机控制方法、装置、设备、存储介质 - Google Patents

一种多节点服务器主机控制方法、装置、设备、存储介质 Download PDF

Info

Publication number
CN116723198A
CN116723198A CN202310500390.8A CN202310500390A CN116723198A CN 116723198 A CN116723198 A CN 116723198A CN 202310500390 A CN202310500390 A CN 202310500390A CN 116723198 A CN116723198 A CN 116723198A
Authority
CN
China
Prior art keywords
node server
host
field programmable
programmable gate
server host
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310500390.8A
Other languages
English (en)
Inventor
张贞雷
李拓
邹晓峰
满宏涛
刘凯
刘刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Yunhai Guochuang Cloud Computing Equipment Industry Innovation Center Co Ltd
Original Assignee
Shandong Yunhai Guochuang Cloud Computing Equipment Industry Innovation Center Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Yunhai Guochuang Cloud Computing Equipment Industry Innovation Center Co Ltd filed Critical Shandong Yunhai Guochuang Cloud Computing Equipment Industry Innovation Center Co Ltd
Priority to CN202310500390.8A priority Critical patent/CN116723198A/zh
Publication of CN116723198A publication Critical patent/CN116723198A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks
    • H04L67/1044Group management mechanisms 
    • H04L67/1051Group master selection mechanisms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks
    • H04L67/1087Peer-to-peer [P2P] networks using cross-functional networking aspects
    • H04L67/1091Interfacing with client-server systems or between P2P systems
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Stored Programmes (AREA)

Abstract

本申请公开了一种多节点服务器主机控制方法、装置、设备、存储介质,涉及服务器技术领域,包括:当接收用户端选择的待管理节点服务器主机的控制指令后,将控制指令发送至现场可编程门阵列;通过现场可编程门阵列解析控制指令,并从所有节点服务器主机与现场可编程门阵列的对应关系中确定出待管理节点服务器主机与现场可编程门阵列的目标对应关系;根据目标对应关系将与待管理节点服务器主机对应的主机信号转接至基板管理控制器,以便对待管理节点服务器主机进行控制。实现了一个基板管理控制器去管理控制多节点中的多个服务器主机,以提高基板管理控制器的利用率,降低多节点服务器的成本。

Description

一种多节点服务器主机控制方法、装置、设备、存储介质
技术领域
本发明涉及服务器技术领域,特别涉及一种多节点服务器主机控制方法、装置、设备、存储介质。
背景技术
传统的多节点服务器中,每一个节点都有单独的BMC(Baseboard ManagementController,基板管理控制器)芯片进行管理控制,例如:大部分是刀片服务器。但同时因为多个节点在一个服务器机箱中,因此用一个中背板将各个结点进行连接,同时这些节点共用服务器机箱的风扇和VGA(Video Graphics Array,模拟信号传输标准)接口,因此,每个节点需要将控制风扇以及VGA输出信号,传递到中背板,利用中背板上的FPGA芯片进行处理,简单来说就是进行MUX选择,最终决定风扇的转速和VGA的输出通路,连接示意图如图1所示。目前,每一个节点都有一个单独的BMC芯片,但是用户应用的时候,其实并不会在一个时间点同时登陆所有的BMC***去查看对应的服务器的状态以及对对应的服务器进行管理和控制,这就是说,此时用户不操作的那些服务器,其对应的BMC芯片其实是无效的,因为其输出的信息用户看不到,而用户也不会去管理那些服务器。也就是说,用户对多节点服务器中BMC芯片的使用其实是分时的。因此传统方案中对BMC芯片的利用率比较低下,整个多节点服务器的成本也偏高。
综上,如何实现多节点服务器主机的同时在线控制管理,提升对基板管理控制器的利用率,降低企业成本是本领域有待解决的技术问题。
发明内容
有鉴于此,本发明的目的在于提供一种多节点服务器主机控制方法、装置、设备、存储介质,能够实现多节点服务器主机的同时在线控制管理,提升对基板管理控制器的利用率,降低企业成本,具体方案如下:
第一方面,本申请公开了一种多节点服务器主机控制方法,应用于基板管理控制器,包括:
当接收用户端选择的待管理节点服务器主机的控制指令后,将所述控制指令发送至现场可编程门阵列;
通过所述现场可编程门阵列解析所述控制指令,并从所有节点服务器主机与所述现场可编程门阵列的对应关系中确定出所述待管理节点服务器主机与所述现场可编程门阵列的目标对应关系;
根据所述目标对应关系将与所述待管理节点服务器主机对应的主机信号转接至所述基板管理控制器,以便对所述待管理节点服务器主机进行控制。
可选的,所述从所有节点服务器主机与所述现场可编程门阵列的对应关系中确定出所述待管理节点服务器主机与所述现场可编程门阵列的目标对应关系之前,还包括:
分别构建现场可编程门阵列与各个节点服务器主机之间的对应关系,以便所述现场可编程门阵列接收各个节点服务器主机对应的主机信号。
可选的,所述分别构建现场可编程门阵列与各个节点服务器主机之间的对应关系之后,还包括:
利用所述现场可编程门阵列运行的预监测软件监测各个节点服务器主机的控制状态,并将表征为异常控制状态对应的节点服务器主机异常信息上报至所述现场可编程阵列。
可选的,所述将表征为异常控制状态对应的节点服务器主机信息上报至所述现场可编程阵列之后,还包括:
通过所述现场可编程阵列发送突发中断信号至所述基板管理控制器。
可选的,所述将表征为异常控制状态对应的节点服务器主机信息上报至所述现场可编程阵列之后,还包括:
获取所述节点服务器主机异常信息,并通过人机交互界面显示所述节点服务器主机异常信息。
可选的,所述根据所述目标对应关系将与所述待管理节点服务器主机对应的主机信号转接至所述基板管理控制器,以便对所述待管理节点服务器主机进行控制,包括:
根据所述目标对应关系获取与所述待管理节点服务器主机对应的主机信号,并通过所述现场可编程门阵列将所述主机信号转接至所述基板管理控制器;
输入所述主机信号并通过模拟信号接口产生的相应模拟信号对待管理节点服务器主机进行对应控制。
可选的,所述的多节点服务器主机控制方法,还包括:
分别将各个节点服务器主机、主板与基板管理控制器之间的总线接口转换为预设主机信号接口,以便通过所述预设主机接口输出主机信号。
第二方面,本申请公开了一种多节点服务器主机控制装置,应用于基板管理控制器,包括:
指令发送模块,用于当接收用户端选择的待管理节点服务器主机的控制指令后,将所述控制指令发送至现场可编程门阵列;
关系确定模块,用于通过所述现场可编程门阵列解析所述控制指令,并从所有节点服务器主机与所述现场可编程门阵列的对应关系中确定出所述待管理节点服务器主机与所述现场可编程门阵列的目标对应关系;
主机控制模块,用于根据所述目标对应关系将与所述待管理节点服务器主机对应的主机信号转接至所述基板管理控制器,以便对所述待管理节点服务器主机进行控制。
第三方面,本申请公开了一种电子设备,包括:
存储器,用于保存计算机程序;
处理器,用于执行所述计算机程序,以实现前述公开的多节点服务器主机控制方法的步骤。
第四方面,本申请公开了一种计算机可读存储介质,用于存储计算机程序;其中,所述计算机程序被处理器执行时实现前述公开的多节点服务器主机控制方法的步骤。
由此可见,本申请公开了一种多节点服务器主机控制方法,应用于基板管理控制器,包括:当接收用户端选择的待管理节点服务器主机的控制指令后,将所述控制指令发送至现场可编程门阵列;通过所述现场可编程门阵列解析所述控制指令,并从所有节点服务器主机与所述现场可编程门阵列的对应关系中确定出所述待管理节点服务器主机与所述现场可编程门阵列的目标对应关系;根据所述目标对应关系将与所述待管理节点服务器主机对应的主机信号转接至所述基板管理控制器,以便对所述待管理节点服务器主机进行控制。可见,通过优化现场可编程门阵列的逻辑,使现场可编程门阵列能够同时接收多个节点服务器主机发送的主机信号,然后通过现场可编程门阵列与基板管理控制器的连接关系,进而能够让基板管理控制器控制多个节点服务器主机,实现了一个基板管理控制器去管理控制多节点中的多个服务器主机,以提高基板管理控制器的利用率,降低多节点服务器的成本。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请公开的一种传统方案中多节点服务器架构框图;
图2为本申请公开的一种多节点服务器主机控制方法流程图;
图3为本申请公开的一种具体的多节点服务器主机控制方法流程图;
图4为本申请公开的一种多节点服务器中各个部件连接控制框图;
图5为本申请公开的一种多节点服务器主机控制装置结构示意图;
图6为本申请公开的一种电子设备结构图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
传统的多节点服务器中,每一个节点都有单独的BMC芯片进行管理控制,例如:大部分是刀片服务器。但同时因为多个节点在一个服务器机箱中,因此用一个中背板将各个结点进行连接,同时这些节点共用服务器机箱的风扇和VGA接口,因此,每个节点需要将控制风扇以及VGA输出信号,传递到中背板,利用中背板上的FPGA芯片进行处理,简单来说就是进行MUX选择,最终决定风扇的转速和VGA的输出通路,连接示意图如图1所示。目前,每一个节点都有一个单独的BMC芯片,但是用户应用的时候,其实并不会在一个时间点同时登陆所有的BMC***去查看对应的服务器的状态以及对对应的服务器进行管理和控制,这就是说,此时用户不操作的那些服务器,其对应的BMC芯片其实是无效的,因为其输出的信息用户看不到,而用户也不会去管理那些服务器。也就是说,用户对多节点服务器中BMC芯片的使用其实是分时的。因此传统方案中对BMC芯片的利用率比较低下,整个多节点服务器的成本也偏高。
为此,本申请公开了一种多节点服务器主机控制方案,能够实现多节点服务器主机的同时在线控制管理,提升对基板管理控制器的利用率,降低企业成本。
参照图2所示,本发明实施例公开了一种多节点服务器主机控制方法,应用于基板管理控制器,包括:
步骤S11:当接收用户端选择的待管理节点服务器主机的控制指令后,将所述控制指令发送至现场可编程门阵列。
本实施例中,由于在多节点服务器的机箱中可插装多个服务器单元,也即服务器主机,每个服务器主机存在自己的操作***,具体的,例如刀片服务器,指在标准高度的机架式机箱内可插装多个卡式的服务器单元,实现高可用和高密度。是一种HAHD(HighAvailability High Density,高可用高密度)的低成本服务器平台,是专门为特殊应用行业和高密度计算机环境设计的,其主要结构为一大型主体机箱,内部可插上许多刀片,其中每一块刀片实际上就是一块***主板。它们可以通过板载硬盘启动自己的操作***,如Windows NT/2000、Linux等,类似于一个个独立的服务器,在这种模式下,每一块母板运行自己的***,服务于指定的不同用户群,相互之间没有关联。不过,管理员可以使用***软件将这些母板集合成一个服务器集群。在集群模式下,所有的母板可以连接起来提供高速的网络环境,并同时共享资源,为相同的用户群服务。在集群中***新的刀片,就可以提高整体性能。而由于每块刀片都是热插拔的,所以,***可以轻松地进行替换,并且将维护时间减少到最小。但由于该多节点服务器中的各个服务器主机均是独立存在的,因此,为了启动各个服务器主机,需要登录各个服务器主机的各自***,也即,通过基板管理控制器控制自身的主机进行相应的启动等执行动作。因此,为了提升对于多节点服务器主机的整体控制与管理,通过交互界面或者人机指令输入接口获取用户端选择的待管理节点服务器主机的控制指令,然后将该控制指令直接发送至现场可编程门阵列,例如:当前存在一台刀片服务器,当前的刀片服务器中存在40个服务器主机,当接收到从人机指令输入接口发送的用户端已选择的待管理节点服务器主机的控制指令后,直接将该控制指令通过预设主机信号接口传递至现场可编程门阵列FPGA芯片中。
步骤S12:通过所述现场可编程门阵列解析所述控制指令,并从所有节点服务器主机与所述现场可编程门阵列的对应关系中确定出所述待管理节点服务器主机与所述现场可编程门阵列的目标对应关系。
本实施例中,利用现场可编程门阵列解析该控制指令,具体的,通过现场可编程门阵列FPGA内部进行MUX逻辑,将控制指令解析,获取控制指令中包含的关于待管理节点服务器主机的相关主机信息,并根据相关主机信息从多节点服务器的所有服务器主机中确定出待管理节点服务器主机,同时确定出该待管理节点服务器主机和现场可编程门阵列的目标对应关系,所述目标对应关系具体为待管理节点服务器主机的各个总线与现场可编辑门阵列的接口之间的对应关系,具体为,一个待管理节点服务器主机的对应在现场可编程门阵列的多个总线端口,转换为一个端口进行控制,例如:将I2C总线、PCIe总线、PECI总线与现场可编程门阵列FPGA的原来端口直接转换为同一个NEW_INTF接口。
步骤S13:根据所述目标对应关系将与所述待管理节点服务器主机对应的主机信号转接至所述基板管理控制器,以便对所述待管理节点服务器主机进行控制。
本实施例中,通过根据目标对应关系确定的待管理节点服务器对应的现场可编程门阵列的NEW_INTF接口将对应的主机信号转接至基板管理控制器,以便基板管理控制器根据主机信号对待管理节点服务器主机进行控制。
本实施例中,根据所述目标对应关系获取与所述待管理节点服务器主机对应的主机信号,并通过所述现场可编程门阵列将所述主机信号转接至所述基板管理控制器;输入所述主机信号并通过模拟信号接口产生的相应模拟信号对待管理节点服务器主机进行对应控制。可以理解的是,通过目标对应关系来获取待管理节点服务器的主机信号,并将该主机信号通过现场可编程门阵列转接至多节点服务器集群中通用的基板管理控制器中,以便该基板管理控制器根据主机信号并通过背板的VGA接口对待管理节点服务器主机进行相应控制管理,并且相应产生对应的模拟信号显示于交互界面中。
其中,分别将各个节点服务器主机、主板与基板管理控制器之间的总线接口转换为预设主机信号接口,以便通过所述预设主机接口输出主机信号。可以理解的是,预先将各个节点服务器主机接口与现场可编程门阵列的接口之间进行逻辑编辑,将同一个节点服务器主机的多接口转换为同一个新接口,并连接到中背板,将主板,也即背板重新增加与基板管理控制器之间的VGA接口,用于模拟信号的输出。
由此可见,本申请公开了一种多节点服务器主机控制方法,应用于基板管理控制器,包括:当接收用户端选择的待管理节点服务器主机的控制指令后,将所述控制指令发送至现场可编程门阵列;通过所述现场可编程门阵列解析所述控制指令,并从所有节点服务器主机与所述现场可编程门阵列的对应关系中确定出所述待管理节点服务器主机与所述现场可编程门阵列的目标对应关系;根据所述目标对应关系将与所述待管理节点服务器主机对应的主机信号转接至所述基板管理控制器,以便对所述待管理节点服务器主机进行控制。可见,通过优化现场可编程门阵列的逻辑,使现场可编程门阵列能够同时接收多个节点服务器主机发送的主机信号,然后通过现场可编程门阵列与基板管理控制器的连接关系,进而能够让基板管理控制器控制多个节点服务器主机,实现了一个基板管理控制器去管理控制多节点中的多个服务器主机,以提高基板管理控制器的利用率,降低多节点服务器的成本。
参照图3所示,本发明实施例公开了一种具体的多节点服务器主机控制方法,相对于上一实施例,本实施例对技术方案作了进一步的说明和优化。具体的:
步骤S21:当接收用户端选择的待管理节点服务器主机的控制指令后,将所述控制指令发送至现场可编程门阵列。
步骤S22:分别构建现场可编程门阵列与各个节点服务器主机之间的对应关系,以便所述现场可编程门阵列接收各个节点服务器主机对应的主机信号。
本实施例中,预先对现场可编程门阵列与各个节点服务器主机之间的端口关系进行调整,也即将现有的多节点服务器中的内部部件连接关系进行修改,具体如图4所示,在多节点服务器中,都是独立的主板,其每个节点都有独立的主机HOST/CPU,内存,硬盘,操作***,主板、BMC芯片等,每个节点独立工作,在原有的多节点服务器中各个部件与各个部件的连接关系中包括:输出一组包含风扇控制的I2C接口,一组VGA信号控制接口到INTF(0-3,这里以多节点服务器中存在四个节点为例的情况),汇集到中背板上的FPGA芯片,FPGA芯片内部对接收到的4路信号作MUX选择,然后输出控制服务器机箱公用的风扇,VGA显示器等,具体的,首先多节点服务器主机中的节点服务器主机为:节点0、节点1、节点2和节点3,在原有的多节点服务器中,节点服务器主机中分别包含各自的BMC0、BMC1、BMC2、BMC3,而在本实施例中,将原先各自节点服务器主机中的BMC芯片统一去掉,无需各自的BMC芯片对各自的节点服务器主机进行动作执行控制,并且将原多节点服务器中的原节点0、节点1、节点2、节点3与现场可编程门阵列之间的分别对应的各个接口进行逻辑修改,例如:以节点0为例,节点0与现场可编程门阵列之间的接口中包含PCIe总线对应的接口、I2C总线对应的接口、PECI总线对应的接口,这样一来,若节点0一个节点服务器主机所需要的现场可编程门阵列中的接口为3个,则四个节点所需要的接口为12个,而本实施例中,通过对现场可编程门阵列进行逻辑修改,节点0多个总线可修改为占用1个现场可编程门阵列的接口NEW_INTF,这样一来,四个节点最少可占用4个现场可编程门阵列的接口,同时,优化FPGA逻辑,同时接收多节点服务器主机的主机信息,而不是等待各个节点服务器启动各自的服务器主机之后,才接收相应的主机信息。例外,利用一个BMC与现场可编程门阵列进行连接,并将BMC输出端与一个模拟信号接口进行连接,便于直接输出相应的VGA信号。修改BMC芯片逻辑,BMC芯片与FPGA芯片相连。BMC芯片上运行的软件,首先由用户端决定要查看哪个节点的信息,然后将该信息传递给FPGA芯片,FPGA内部做MUX逻辑,将对应节点的信号转接到BMC芯片。
步骤S23:利用所述现场可编程门阵列运行的预监测软件监测各个节点服务器主机的控制状态,并将表征为异常控制状态对应的节点服务器主机异常信息上报至所述现场可编程阵列。
本实施例中,利用FPGA上的处理器运行响应的软件,该软件相当于是offload BMC功能,该软件的功能是局部预处理,对接收到的4个节点的信息进行预分析,尤其是CPU温度,电压等敏感信息,当这些敏感信息的值高于设置的阈值时,将其判定为异常信息,并准备通知BMC芯片,以便BMC芯片及时查看,处理。
步骤S24:通过所述现场可编程阵列发送突发中断信号至所述基板管理控制器,并且通过所述现场可编程门阵列解析所述控制指令,并从所有节点服务器主机与所述现场可编程门阵列的对应关系中确定出所述待管理节点服务器主机与所述现场可编程门阵列的目标对应关系。
本实施例中,当现场可编程门阵列FPGA中判定敏感信息中存在异常信息时,立即向基板管理控制器BMC发送突发中断信号,此时,FPGA还可能同时执行解析用户端发送的控制指令这一步骤,但是二者互不影响。
步骤S25:获取所述节点服务器主机异常信息,并通过人机交互界面显示所述节点服务器主机异常信息,并根据所述目标对应关系将与所述待管理节点服务器主机对应的主机信号转接至所述基板管理控制器,以便对所述待管理节点服务器主机进行控制。
本实施例中,基板管理控制器除了接收FPGA解析指令后的主机信号,还可同时接收FGGA发送的突发中断信号和主机异常信息。例如:此时用户端在查看节点1的信息,但是节点2此时CPU温度突然过高,这个由FPGA的软件进行预分析得知,通过FPGA芯片通知BMC芯片,此时BMC芯片接收到该信号后,BMC软件需要及时的在用户的查看管理界面上,及时的弹出相应的提醒界面,提醒用户去查看出现异常的节点信息,并进行响应的处理,这也是对BMC芯片和BMC软件需要进行的修改和优化。实现了多节点对应1个BMC芯片,因此对于远程端用户来说,只有1个BMC芯片的网络IP。在登陆到该网络IP后,相当于登陆进BMC的管理界面,值得注意的是,通过修改传统的BMC软件,不仅有选择查看哪个节点的选项,由用户选择后,进行查看和管理,还能及时接收FPGA芯片上报的异常信息,
由此可见,通过对FPGA芯片进行编程,基于增加了对多节点服务器主机的同时监测等实际需求进行逻辑更改处理,使FPGA进行更多功能优化,同时未增加额外的FPGA芯片数量,提升了FPGA的资源利用效率,修改传统方案中FPGA内部的硬件逻辑、增加FPGA软件的预处理功能,同时修改BMC芯片与FPGA芯片的硬件连接,修改完善BMC芯片的软件功能,使得用户在查看当前节点信息的时候,可以接收到异常节点的警告信息,从而做到BMC芯片的分时复用且保证了用一个BMC芯片管理控制多个节点的安全性。
参照图5所示,本发明实施例还相应公开了一种多节点服务器主机控制装置,应用于基板管理控制器,包括:
指令发送模块11,用于当接收用户端选择的待管理节点服务器主机的控制指令后,将所述控制指令发送至现场可编程门阵列;
关系确定模块12,用于通过所述现场可编程门阵列解析所述控制指令,并从所有节点服务器主机与所述现场可编程门阵列的对应关系中确定出所述待管理节点服务器主机与所述现场可编程门阵列的目标对应关系;
主机控制模块13,用于根据所述目标对应关系将与所述待管理节点服务器主机对应的主机信号转接至所述基板管理控制器,以便对所述待管理节点服务器主机进行控制。
由此可见,本申请公开了当接收用户端选择的待管理节点服务器主机的控制指令后,将所述控制指令发送至现场可编程门阵列;通过所述现场可编程门阵列解析所述控制指令,并从所有节点服务器主机与所述现场可编程门阵列的对应关系中确定出所述待管理节点服务器主机与所述现场可编程门阵列的目标对应关系;根据所述目标对应关系将与所述待管理节点服务器主机对应的主机信号转接至所述基板管理控制器,以便对所述待管理节点服务器主机进行控制。可见,通过优化现场可编程门阵列的逻辑,使现场可编程门阵列能够同时接收多个节点服务器主机发送的主机信号,然后通过现场可编程门阵列与基板管理控制器的连接关系,进而能够让基板管理控制器控制多个节点服务器主机,实现了一个基板管理控制器去管理控制多节点中的多个服务器主机,以提高基板管理控制器的利用率,降低多节点服务器的成本。
在一些具体实施方式中,所述多节点服务器主机控制装置,具体还包括:
信号接收单元,用于分别构建现场可编程门阵列与各个节点服务器主机之间的对应关系,以便所述现场可编程门阵列接收各个节点服务器主机对应的主机信号。
在一些具体实施方式中,所述多节点服务器主机控制装置,具体还包括:
状态监测单元,用于利用所述现场可编程门阵列运行的预监测软件监测各个节点服务器主机的控制状态,并将表征为异常控制状态对应的节点服务器主机异常信息上报至所述现场可编程阵列。
在一些具体实施方式中,所述多节点服务器主机控制装置,具体还包括:
信号发送单元,用于通过所述现场可编程阵列发送突发中断信号至所述基板管理控制器。
在一些具体实施方式中,所述多节点服务器主机控制装置,具体还包括:
信息显示单元,用于获取所述节点服务器主机异常信息,并通过人机交互界面显示所述节点服务器主机异常信息。
在一些具体实施方式中,所述主机控制模块13,具体包括:
主机控制单元,用于根据所述目标对应关系获取与所述待管理节点服务器主机对应的主机信号,并通过所述现场可编程门阵列将所述主机信号转接至所述基板管理控制器;
输入所述主机信号并通过模拟信号接口产生的相应模拟信号对待管理节点服务器主机进行对应控制。
在一些具体实施方式中,所述多节点服务器主机控制装置,具体还包括:
接口转换单元,用于分别将各个节点服务器主机、主板与基板管理控制器之间的总线接口转换为预设主机信号接口,以便通过所述预设主机接口输出主机信号。
进一步的,本申请实施例还公开了一种电子设备,图6是根据一示例性实施例示出的电子设备20结构图,图中的内容不能认为是对本申请的使用范围的任何限制。
图6为本申请实施例提供的一种电子设备20的结构示意图。该电子设备20,具体可以包括:至少一个处理器21、至少一个存储器22、电源23、通信接口24、输入输出接口25和通信总线26。其中,所述存储器22用于存储计算机程序,所述计算机程序由所述处理器21加载并执行,以实现前述任一实施例公开的多节点服务器主机控制方法中的相关步骤。另外,本实施例中的电子设备20具体可以为电子计算机。
本实施例中,电源23用于为电子设备20上的各硬件设备提供工作电压;通信接口24能够为电子设备20创建与外界设备之间的数据传输通道,其所遵循的通信协议是能够适用于本申请技术方案的任意通信协议,在此不对其进行具体限定;输入输出接口25,用于获取外界输入数据或向外界输出数据,其具体的接口类型可以根据具体应用需要进行选取,在此不进行具体限定。
其中,处理器21可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器21可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器21也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器21可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器21还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
另外,存储器22作为资源存储的载体,可以是只读存储器、随机存储器、磁盘或者光盘等,其上所存储的资源可以包括操作***221、计算机程序222等,存储方式可以是短暂存储或者永久存储。
其中,操作***221用于管理与控制电子设备20上的各硬件设备以及计算机程序222,以实现处理器21对存储器22中海量数据223的运算与处理,其可以是Windows Server、Netware、Unix、Linux等。计算机程序222除了包括能够用于完成前述任一实施例公开的由电子设备20执行的多节点服务器主机控制方法的计算机程序之外,还可以进一步包括能够用于完成其他特定工作的计算机程序。数据223除了可以包括电子设备接收到的由外部设备传输进来的数据,也可以包括由自身输入输出接口25采集到的数据等。
进一步的,本申请还公开了一种计算机可读存储介质,用于存储计算机程序;其中,所述计算机程序被处理器执行时实现前述公开的多节点服务器主机控制方法。关于该方法的具体步骤可以参考前述实施例中公开的相应内容,在此不再进行赘述。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本发明所提供的一种多节点服务器主机控制方法、装置、设备、存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种多节点服务器主机控制方法,其特征在于,应用于基板管理控制器,包括:
当接收用户端选择的待管理节点服务器主机的控制指令后,将所述控制指令发送至现场可编程门阵列;
通过所述现场可编程门阵列解析所述控制指令,并从所有节点服务器主机与所述现场可编程门阵列的对应关系中确定出所述待管理节点服务器主机与所述现场可编程门阵列的目标对应关系;
根据所述目标对应关系将与所述待管理节点服务器主机对应的主机信号转接至所述基板管理控制器,以便对所述待管理节点服务器主机进行控制。
2.根据权利要求1所述的多节点服务器主机控制方法,其特征在于,所述从所有节点服务器主机与所述现场可编程门阵列的对应关系中确定出所述待管理节点服务器主机与所述现场可编程门阵列的目标对应关系之前,还包括:
分别构建现场可编程门阵列与各个节点服务器主机之间的对应关系,以便所述现场可编程门阵列接收各个节点服务器主机对应的主机信号。
3.根据权利要求2所述的多节点服务器主机控制方法,其特征在于,所述分别构建现场可编程门阵列与各个节点服务器主机之间的对应关系之后,还包括:
利用所述现场可编程门阵列运行的预监测软件监测各个节点服务器主机的控制状态,并将表征为异常控制状态对应的节点服务器主机异常信息上报至所述现场可编程阵列。
4.根据权利要求3所述的多节点服务器主机控制方法,其特征在于,所述将表征为异常控制状态对应的节点服务器主机信息上报至所述现场可编程阵列之后,还包括:
通过所述现场可编程阵列发送突发中断信号至所述基板管理控制器。
5.根据权利要求3所述的多节点服务器主机控制方法,其特征在于,所述将表征为异常控制状态对应的节点服务器主机信息上报至所述现场可编程阵列之后,还包括:
获取所述节点服务器主机异常信息,并通过人机交互界面显示所述节点服务器主机异常信息。
6.根据权利要求1所述的多节点服务器主机控制方法,其特征在于,所述根据所述目标对应关系将与所述待管理节点服务器主机对应的主机信号转接至所述基板管理控制器,以便对所述待管理节点服务器主机进行控制,包括:
根据所述目标对应关系获取与所述待管理节点服务器主机对应的主机信号,并通过所述现场可编程门阵列将所述主机信号转接至所述基板管理控制器;
输入所述主机信号并通过模拟信号接口产生的相应模拟信号对待管理节点服务器主机进行对应控制。
7.根据权利要求1至6任一项所述的多节点服务器主机控制方法,其特征在于,还包括:
分别将各个节点服务器主机、主板与基板管理控制器之间的总线接口转换为预设主机信号接口,以便通过所述预设主机接口输出主机信号。
8.一种多节点服务器主机控制装置,其特征在于,应用于基板管理控制器,包括:
指令发送模块,用于当接收用户端选择的待管理节点服务器主机的控制指令后,将所述控制指令发送至现场可编程门阵列;
关系确定模块,用于通过所述现场可编程门阵列解析所述控制指令,并从所有节点服务器主机与所述现场可编程门阵列的对应关系中确定出所述待管理节点服务器主机与所述现场可编程门阵列的目标对应关系;
主机控制模块,用于根据所述目标对应关系将与所述待管理节点服务器主机对应的主机信号转接至所述基板管理控制器,以便对所述待管理节点服务器主机进行控制。
9.一种电子设备,其特征在于,包括:
存储器,用于保存计算机程序;
处理器,用于执行所述计算机程序,以实现如权利要求1至7任一项所述的节点服务器主机控制方法的步骤。
10.一种计算机可读存储介质,其特征在于,用于存储计算机程序;其中,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的节点服务器主机控制方法的步骤。
CN202310500390.8A 2023-04-28 2023-04-28 一种多节点服务器主机控制方法、装置、设备、存储介质 Pending CN116723198A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310500390.8A CN116723198A (zh) 2023-04-28 2023-04-28 一种多节点服务器主机控制方法、装置、设备、存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310500390.8A CN116723198A (zh) 2023-04-28 2023-04-28 一种多节点服务器主机控制方法、装置、设备、存储介质

Publications (1)

Publication Number Publication Date
CN116723198A true CN116723198A (zh) 2023-09-08

Family

ID=87874179

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310500390.8A Pending CN116723198A (zh) 2023-04-28 2023-04-28 一种多节点服务器主机控制方法、装置、设备、存储介质

Country Status (1)

Country Link
CN (1) CN116723198A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117591378A (zh) * 2024-01-17 2024-02-23 苏州元脑智能科技有限公司 一种服务器的温度控制方法、***、设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117591378A (zh) * 2024-01-17 2024-02-23 苏州元脑智能科技有限公司 一种服务器的温度控制方法、***、设备及存储介质
CN117591378B (zh) * 2024-01-17 2024-04-05 苏州元脑智能科技有限公司 一种服务器的温度控制方法、***、设备及存储介质

Similar Documents

Publication Publication Date Title
US9619243B2 (en) Synchronous BMC configuration and operation within cluster of BMC
US9471126B2 (en) Power management for PCIE switches and devices in a multi-root input-output virtualization blade chassis
CN104503932B (zh) 多主板服务器主基板管理控制器仲裁方法及***
CN107040407A (zh) 一种高性能计算集群动态节点作业方法
US20140344431A1 (en) Baseboard management system architecture
US20160080210A1 (en) High density serial over lan managment system
EP2832039B1 (en) Platform independent management controller
CN101771565B (zh) 单一服务器实现大批量或不同种基板管理控制器模拟方法
US8819779B2 (en) Methods and systems for managing multiple information handling systems with a virtual keyboard-video-mouse interface
CN116541227B (zh) 故障诊断方法、装置、存储介质、电子装置及bmc芯片
WO2021190659A1 (zh) ***的数据获取方法、装置、介质及电子设备
CN116723198A (zh) 一种多节点服务器主机控制方法、装置、设备、存储介质
CN108009010B (zh) 瘦客户端的管理装置、***、方法、电子设备、存储介质
CN114356725B (zh) 机箱管理***
CN111418187A (zh) 云网络中的可伸缩统计和分析机制
US11308002B2 (en) Systems and methods for detecting expected user intervention across multiple blades during a keyboard, video, and mouse (KVM) session
CN113658351B (zh) 一种产品生产的方法、装置、电子设备及存储介质
US8935555B2 (en) Wake-on-local-area-network operations in a modular chassis using a virtualized input-output-virtualization environment
CN116260738B (zh) 设备监控方法及相关设备
US20170336855A1 (en) Systems and methods for chassis-level view of information handling system power capping
US20220413931A1 (en) Intelligent resource management
US10402357B1 (en) Systems and methods for group manager based peer communication
US10129082B2 (en) System and method for determining a master remote access controller in an information handling system
CN109976478B (zh) 多cpu散热控制***和散热控制方法
CN113254201A (zh) 超算云计算平台化管理方法和管理平台

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination