CN104317677A - 一种基于Brickland的冗余监控管理***及方法 - Google Patents

一种基于Brickland的冗余监控管理***及方法 Download PDF

Info

Publication number
CN104317677A
CN104317677A CN201410511238.0A CN201410511238A CN104317677A CN 104317677 A CN104317677 A CN 104317677A CN 201410511238 A CN201410511238 A CN 201410511238A CN 104317677 A CN104317677 A CN 104317677A
Authority
CN
China
Prior art keywords
bmc
server system
monitoring
smbus
monitoring management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410511238.0A
Other languages
English (en)
Inventor
牟茜
王守昊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN201410511238.0A priority Critical patent/CN104317677A/zh
Publication of CN104317677A publication Critical patent/CN104317677A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)

Abstract

本发明公开了一种基于Brickland的冗余监控管理***及方法,搭配两套监控管理***,针对不同的配置,在其中一套监控管理***不在位或出现故障时,备用监控管理***启用,对整个服务器***的实时监控;在正常状态下,主BMC实时监控服务器***状态,从BMC通过SMBUS和UART读到服务器***状态;当主BMC不在位或出现故障时,从BMC对服务器***进行实时监控。通过本发明,能够提高服务器***监控管理的稳定性,保证监控管理的可靠性,且***设置新颖、操作简单,因此具有较好的使用前景。

Description

一种基于Brickland的冗余监控管理***及方法
技术领域
本发明涉及计算机管理技术,具体地说是一种基于Brickland的冗余监控管理***及方法。
背景技术
现今随着服务器技术的发展,***架构越来越复杂,对服务器的状态监控要求也越来越高,通常状况下,一个服务器***搭配一套管理***,当管理***出现故障之后,无法完成对服务器***的实时监控,无法检测到服务器的健康状况,不能对服务器进行有效维护。
发明内容
本方明针对现有技术存在的不足之处,提供一种基于Brickland的冗余监控管理***及方法。
本发明所述一种基于Brickland的冗余监控管理***,其解决所述技术问题采用的技术方案是:所述基于Brickland的冗余监控管理***及方法, 是在Brickland平台8路服务器***中,搭配两套监控管理***,针对不同的配置,在其中一套监控管理***不在位或出现故障时,备用监控管理***启用,实现对整个***的实时监控,以此来提高服务器***的稳定性。
本发明所述基于Brickland的冗余监控管理***,其组成部分主要包括服务器***、Switch和两个独立的BMC管理***(主BMC及从BMC),其中,服务器***的SYSSMBUS通过Switch分别连接到这两个BMC管理***上,并且这两个管理***通过单独的一组SMBUS和一组UART做心跳,实时通信。
优选的,所述服务器***通过SYSSMBUS与Switch连接,Switch通过Master SMBUS与主BMC连接,Switch通过Slave SMBUS与从BMC连接。
优选的,所述主BMC和从 BMC两个管理***通过 SYNC SMBUS和SYNC UART做心跳同步。
本发明所述基于Brickland的冗余监控管理方法,搭配两套监控管理***,针对不同的配置,在其中一套监控管理***不在位或出现故障时,备用监控管理***启用,对整个服务器***的实时监控;在正常状态下,主BMC实时监控服务器***状态,从BMC通过SMBUS和UART读到服务器***状态;当主BMC不在位或出现故障时,服务器***的SMBUS切换到从BMC,从BMC对服务器***进行实时监控。
 本发明的一种基于Brickland的冗余监控管理***及方法和现有技术相比具有的有益效果是:通过本发明,在整个服务器***中配置两套相对独立的监控管理***,其中一套监控管理***出现故障时,可以自动及时切换到备用监控管理***,可以提高服务器***监控管理的稳定性,保证监控管理的可靠性。并且该冗余监控管理***设计新颖、结构简单、容易实现,因此本发明提高了服务器***的监控管理水平,提高了服务器***的稳定性,具有较好的推广使用价值。
附图说明
附图1为所述冗余监控管理***的结构框图;
      附图2为主BMC正常工作时连接示意图;
      附图3 为主BMC故障时连接示意图。
具体实施方式
下面结合具体实施例和附图,对本发明所述一种基于Brickland的冗余监控管理***及方法的特点和设计内容,作进一步详细说明。
本发明所述基于Brickland的冗余监控管理***及方法, 是在Brickland平台8路服务器***中,搭配两套监控管理***,针对不同的配置,在其中一套监控管理***不在位或出现故障时,备用监控管理***启用,实现对整个***的实时监控,提高服务器***的稳定性。本发明设计中所基于的Brickland:即‘Brickland’的服务器平台,是由Intel Xeon系列的Ivy Bridge制品处理器与C602J服务器芯片组组成平台代号‘Brickland’的服务器平台。
本发明所述基于Brickland的冗余监控管理***,其组成部分主要包括服务器***(System)、Switch和两个独立的BMC管理***(主BMC及从BMC),其中,服务器***的SYSSMBUS通过Switch分别连接到这两个BMC管理***上,并且这两个管理***通过单独的一组SMBUS和一组UART做心跳,实时通信;在正常状态下,主BMC实时监控服务器状态,从BMC可以通过SMBUS和UART读到服务器状态,主BMC及从BMC均能实时监控到服务器健康状况,当主BMC不在位或出现故障时,服务器***的SMBUS切换到从BMC,通过从BMC来实现对服务器***的实时监控。
实施例:
本实施例所述基于Brickland的冗余监控管理***,如附图1所示,该冗余监控管理***的组成部分主要包括服务器***(System)、Switch(转换器,一种物理电子开关)、主BMC(Master BMC)和从BMC(Slave BMC),其中,服务器***通过SYSSMBUS与Switch连接,Switch通过Master SMBUS与主BMC连接,Switch通过Slave SMBUS与从BMC连接,即服务器***的SYSSMBUS通过 Switch分别连接到主BMC和从 BMC两个管理***,两个管理***通过 SYNC SMBUS和SYNC UART做心跳同步。其中,SYSSMBUS表示指服务器***的***管理总线,Master SMBUS表示对应主BMC的***管理总线,Slave SMBUS表示对应从BMC的***管理总线,SYNC SMBUS表示时钟同步***管理总线,SYNC UART表示时钟同步异步串行通信口。
正常状态下,服务器***的SYS SMBUS连接到Master SBMUS,通过主BMC来监控服务器***,即主BMC实时监控服务器状态,从 BMC可以通过SYNC SMBUS和SYNC UART从主BMC读到服务器***监控信息,如图2。这样在正常状态下,通过本实施例所述基于Brickland的冗余监控管理方法,主从BMC两个管理***均能实时监控到服务器健康状况。
当主BMC不在位或出现故障时,从BMC发现主BMC出现故障向Switch发送CTRL信号,服务器***的SYS SMBUS通过Switch切换连接到Slave SMBUS,从BMC对服务器***进行实时监控,如图3;即当主BMC不能监控服务器***状态时,从 BMC通过CTRL信号将SYS SMBUS切换到Slave SMBUS,进而主BMC与服务器***交互通信,由从BMC来监控服务器***。可见,通过本实施例所述基于Brickland的冗余监控管理方法,搭配两套监控管理***,针对不同的配置,在其中一套监控管理***不在位或出现故障时,备用管理***启用,实现对整个服务器***的实时监控,提高了服务器***的稳定性。
上述具体实施方式仅是本发明的具体个案,本发明的专利保护范围包括但不限于上述具体实施方式,任何符合本发明的权利要求书的且任何所属技术领域的普通技术人员对其所做的适当变化或替换,皆应落入本发明的专利保护范围。

Claims (6)

1.一种基于Brickland的冗余监控管理***,其特征在于,其组成部分包括服务器***、Switch、主BMC及从BMC,其中,服务器***的SYSSMBUS通过Switch分别连接到主BMC及从BMC上,并且主BMC及从BMC之间通过单独的一组SMBUS和一组UART做心跳实时通信。
2.根据权利要求1所述的一种基于Brickland的冗余监控管理***,其特征在于,所述服务器***通过SYSSMBUS与Switch连接,Switch通过Master SMBUS与主BMC连接,Switch通过Slave SMBUS与从BMC连接。
3.根据权利要求2所述的一种基于Brickland的冗余监控管理***,其特征在于,所述主BMC和从 BMC两个管理***通过 SYNC SMBUS和SYNC UART做心跳同步。
4.一种基于Brickland的冗余监控管理方法,其特征在于,搭配两套监控管理***,针对不同的配置,在其中一套监控管理***不在位或出现故障时,备用监控管理***启用,对整个服务器***的实时监控;在正常状态下,主BMC实时监控服务器***状态,从BMC通过SMBUS和UART读到服务器***状态;当主BMC不在位或出现故障时,服务器***的SMBUS切换到从BMC,从BMC对服务器***进行实时监控。
5.根据权利要求4所述的一种基于Brickland的冗余监控管理方法,其特征在于,正常状态下,服务器***的SYS SMBUS连接到主SBMUS,通过主BMC来监控服务器***,从 BMC通过SYNC SMBUS和SYNC UART从主BMC读到服务器***监控信息。
6.根据权利要求5所述的一种基于Brickland的冗余监控管理方法,其特征在于,当主BMC不在位或出现故障时,从BMC发现主BMC出现故障向Switch发送CTRL信号,服务器***的SYSSMBUS通过Switch切换连接到从SMBUS,从BMC对服务器***进行实时监控。
CN201410511238.0A 2014-09-29 2014-09-29 一种基于Brickland的冗余监控管理***及方法 Pending CN104317677A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410511238.0A CN104317677A (zh) 2014-09-29 2014-09-29 一种基于Brickland的冗余监控管理***及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410511238.0A CN104317677A (zh) 2014-09-29 2014-09-29 一种基于Brickland的冗余监控管理***及方法

Publications (1)

Publication Number Publication Date
CN104317677A true CN104317677A (zh) 2015-01-28

Family

ID=52372912

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410511238.0A Pending CN104317677A (zh) 2014-09-29 2014-09-29 一种基于Brickland的冗余监控管理***及方法

Country Status (1)

Country Link
CN (1) CN104317677A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107315369A (zh) * 2017-07-12 2017-11-03 郑州云海信息技术有限公司 一种bmc芯片智能协处理装置及处理方法
CN107632907A (zh) * 2017-08-07 2018-01-26 郑州云海信息技术有限公司 一种bmc芯片托管***及其控制方法
CN107943623A (zh) * 2017-12-13 2018-04-20 郑州云海信息技术有限公司 一种存储***
CN110321265A (zh) * 2019-05-09 2019-10-11 苏州浪潮智能科技有限公司 一种服务器监控管理装置、方法及***
CN111737037A (zh) * 2020-06-12 2020-10-02 浪潮(北京)电子信息产业有限公司 基板管理控制方法、主从异构bmc控制***及存储介质
CN112380083A (zh) * 2020-10-23 2021-02-19 浪潮电子信息产业股份有限公司 一种bmc主备切换稳定性测试方法和***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN201153943Y (zh) * 2008-02-19 2008-11-26 浪潮电子信息产业股份有限公司 一种多心跳信号双控存储控制器
WO2009097729A1 (zh) * 2008-02-04 2009-08-13 Nanjing University Of Science And Technology 高可靠性分布式以太网测控***
CN202004776U (zh) * 2011-01-07 2011-10-05 北京捷世伟业电子科技有限公司 冗余热切换***
CN103885860A (zh) * 2014-03-21 2014-06-25 浪潮集团有限公司 一种应用ipmi命令实现bmc双管理热冗余的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009097729A1 (zh) * 2008-02-04 2009-08-13 Nanjing University Of Science And Technology 高可靠性分布式以太网测控***
CN201153943Y (zh) * 2008-02-19 2008-11-26 浪潮电子信息产业股份有限公司 一种多心跳信号双控存储控制器
CN202004776U (zh) * 2011-01-07 2011-10-05 北京捷世伟业电子科技有限公司 冗余热切换***
CN103885860A (zh) * 2014-03-21 2014-06-25 浪潮集团有限公司 一种应用ipmi命令实现bmc双管理热冗余的方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107315369A (zh) * 2017-07-12 2017-11-03 郑州云海信息技术有限公司 一种bmc芯片智能协处理装置及处理方法
CN107315369B (zh) * 2017-07-12 2019-12-17 苏州浪潮智能科技有限公司 一种bmc芯片智能协处理装置
CN107632907A (zh) * 2017-08-07 2018-01-26 郑州云海信息技术有限公司 一种bmc芯片托管***及其控制方法
CN107943623A (zh) * 2017-12-13 2018-04-20 郑州云海信息技术有限公司 一种存储***
CN110321265A (zh) * 2019-05-09 2019-10-11 苏州浪潮智能科技有限公司 一种服务器监控管理装置、方法及***
CN111737037A (zh) * 2020-06-12 2020-10-02 浪潮(北京)电子信息产业有限公司 基板管理控制方法、主从异构bmc控制***及存储介质
CN112380083A (zh) * 2020-10-23 2021-02-19 浪潮电子信息产业股份有限公司 一种bmc主备切换稳定性测试方法和***
CN112380083B (zh) * 2020-10-23 2023-01-06 浪潮电子信息产业股份有限公司 一种bmc主备切换稳定性测试方法和***

Similar Documents

Publication Publication Date Title
CN104317677A (zh) 一种基于Brickland的冗余监控管理***及方法
CN102622279B (zh) 冗余控制***、方法及管理控制器
CN103488551B (zh) 冗余路径功率子***及其操作方法
CN104102559B (zh) 一种基于冗余心跳链路和对端重启链路的双控制器存储***
CN104890701A (zh) 铁路车站的通信联锁***
CN103678031B (zh) 二乘二取二冗余***及方法
CN104424048A (zh) 用于数据存储的方法和装置
CN103441863A (zh) 一种空管自动化***中的双服务器热备***及控制方法
CN102331959A (zh) 伺服器***
CN204713110U (zh) 铁路车站的通信联锁***
CN102768561B (zh) 一种双桥片主板冗余的设计方法
CN104503947B (zh) 多路服务器及其信号处理方法
CN104104725A (zh) 一种应用于云计算的分层异构结构的服务器管理***
US20220129601A1 (en) Techniques for generating a configuration for electrically isolating fault domains in a data center
US20150318719A1 (en) Charging method and electronic device
CN205485799U (zh) 一种可复用sas、sata信号的硬盘背板
CN203930813U (zh) 一种基于龙芯平台的can总线冗余通信***
CN102638369B (zh) 一种主备倒换的仲裁方法、装置和***
CN203876779U (zh) 一种基于dtmf通信的64d闭塞机
CN105652780B (zh) 一种智能立体车库控制***及方法
CN104391546A (zh) 一种弹性架构配置可变云服务器***架构
CN204832891U (zh) 高性能多用途处理器卡
CN202838091U (zh) 一种支持sr5690冗余设计的双桥片主板
CN103051407A (zh) 时钟保护方法、***和相关普通时钟设备
CN202711239U (zh) 一种计算机***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20150128