CN100409590C - 实现***高可用性的装置 - Google Patents

实现***高可用性的装置 Download PDF

Info

Publication number
CN100409590C
CN100409590C CNB2004100649348A CN200410064934A CN100409590C CN 100409590 C CN100409590 C CN 100409590C CN B2004100649348 A CNB2004100649348 A CN B2004100649348A CN 200410064934 A CN200410064934 A CN 200410064934A CN 100409590 C CN100409590 C CN 100409590C
Authority
CN
China
Prior art keywords
veneer
master control
control borad
hot plug
circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2004100649348A
Other languages
English (en)
Other versions
CN1761167A (zh
Inventor
刘培章
李光年
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CNB2004100649348A priority Critical patent/CN100409590C/zh
Publication of CN1761167A publication Critical patent/CN1761167A/zh
Application granted granted Critical
Publication of CN100409590C publication Critical patent/CN100409590C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Hardware Redundancy (AREA)
  • Small-Scale Networks (AREA)

Abstract

本发明提供一种实现***高可用性的装置,用于通讯领域和工业自动化领域,包括:至少一对主控板,至少一对电源模块,若干单板;其中,各单板全部采用热插拔和缓启动设计,可以独立***机箱并上电;主控板、电源模块采用主备冗余设计。本发明装置操作简单,维护方便,能大大提高***的可用性,可以作为电信级设备使用。

Description

实现***高可用性的装置
技术领域
本发明涉及一种实现***高可用性的装置,尤其涉及通讯领域和工业自动化领域的实现***高可用性的装置。
背景技术
随着通讯技术、计算机技术及电子技术的不断发展,以及通讯设备的复杂化和小型化趋势,人们对通信***的要求越来越高,因此提高通信设备的可用性也变得越来越重要。高可用性设计已广泛应用于通讯***设备中,高可用性是指在用户需要使用设备的任何时候,***都是可用的。它包括两方面的含义,即可靠性(通常用平均无故障工作时间来衡量,即MTBF)和可维护性(故障后的平均维护时间,即MTTR)。可用性通常被定义为在规定的时间段内,***正常运行的时间占整个时间段的比例,常用百分比表示。通信***需要一天24小时、一年365天连续不间断运转,一个可用性为99.9%的通信***一年的平均故障时间为8.76小时(525分钟),而一个可用性为99.999%的通信***一年的平均故障时间只有5分钟。
在现有技术中,通信***实现***高可用性的装置最常见的是采用符合COMPACT PCI规范的热插拔设计,该类装置包括一对主控板,若干业务板或I/O接口板,各单板在PCI总线上实现热插拔。在现有的热插拔***中,由于背板和单板相连的接插件中的信号大多是PCI总线,导致背板和单板上PCI总线走线太多太长,降低了***的可靠性。另外单板在产生热插拔中断时,***需要查询产生中断的单板,此时如果该单板的PCI接口芯片产生主接口闭锁,将不对PCI的地址周期产生响应,但会对配置周期产生目标重试,由于主控板是通过PCI配置周期来查询各单板的中断状态,这样就有可能会加重***查询产生中断的单板的负担,甚至会将***挂死。详情请参考PICMG 2.0 D3.0版本有关COMPACT PCI中断的定义。符合COMPACT PCI规范的热插拔设计,只有当主控板正常工作时,其它业务板和接口板才能正常上电并工作,也就是说,业务板和接口板的上电和工作完全依赖于主控板,没有主控板或主控板工作不正常,其它单板将无法实现热插拔。因此现有的热插拔设计很难实现***的高可用性。
发明内容
本发明要解决的问题是克服现有技术中***高可用性不易达标的缺陷,提供一种能实现***高可用性的装置。
本发明技术方案为:一种实现***高可用性的装置,包括:一块背板,至少一对主控板,至少一对电源模块,若干单板;其中,所述主控板、电源模块和单板都插在所述背板上,各单板全部采用热插拔和缓启动设计,独立***机箱并上电;主控板、电源模块采用主备冗余设计。
进一步地,部分完成重要功能的单板采用主备冗余设计。
进一步地,各单板的热插拔和缓启动电路采用双通道热插拔控制芯片设计,单板后端的上电和断电依靠板选控制信号来控制。
进一步地,板选控制信号为高时,双通道热插拔控制芯片禁止工作;板选控制信号为低时,双通道热插拔控制芯片允许工作。
进一步地,板选控制信号通过背板接插件连到单板内,并在背板上接地。
进一步地,各单板都包括热插拔状态转换电路,热插拔状态包括:初始状态,指单板***机箱,单板的扳手还没有合拢,热插拔状态指示灯亮;单板的扳手合拢状态,指单板的扳手合拢,此时单板的检测电路会检测到扳手状态变化,产生一个热插拔中断送给主控板;正常工作状态,指主控板收到热插拔中断后,发现有新单板***,开始初始化单板,分配资源,加载业务程序,并清除单板插拔状态和热插拔中断,热插拔状态指示灯灭;扳手打开状态,指当需要拔出某块正在工作的单板时,首先要打开单板的扳手,此时单板的检测电路检测到扳手状态变化,产生热插拔中断送给主控板;停止状态,指主控板收到热插拔中断后,发现有单板要拔出,开始卸载资源,卸载业务程序后,主控板清除单板插拔状态和热插拔中断,对单板后端进行断电,热插拔状态指示灯亮,此时可以拔出单板。
进一步地,主控板与其它单板通信采用主备冗余设计,正常工作时采用以太网通信,RS485总线作为备用通信通道。
进一步地,主控板包含监控电路,用于监控单板和电源模块,监控电路包括电源模块监测电路、单板心跳监测电路、单板后端上电和断电控制电路以及单板复位控制电路。
进一步地,主控板通过监控电路检测到单板上电后,开始计时,在规定时间内主控板和单板通信不成功,则主控板通过监控电路复位该单板。
进一步地,主控板通过监控电路对单板进行电源上电和断电控制,若发现单板有故障,可以复位该单板,也可以对该单板后端断电。
相较于现有技术,本发明的单板与背板相连的信号没有PCI总线,而是采用以太网信号和其它接口信号等,每块单板都单独采用热插拔和缓启动设计,上电时不依赖于主控板。本发明装置操作简单,维护方便,能大大提高***的可用性,可以作为电信级设备使用,真正达到99.999%的高可用性。
附图说明
图1为本发明装置的实施例结构框图;
图2为本发明装置的热插拔和缓启动电路框图;
图3为本发明装置的热插拔状态转换电路框图;
图4为本发明装置的主控板监控电路框图。
具体实施方式
下面结合附图对技术方案的实施作进一步的详细描述:
如图1所示,本发明实现***高可用性的装置的实施例包括:机箱,用于置入主控板、单板和电源模块;互为主备用的一对主控板,用于监控功能单板,并提供后台操作接口;互为主备用的一对电源模块,用于为装置内各单板集中供电;若干块可以独立***机箱并上电的功能单板,即实现特定业务的单板或I/O接口板,本实施例以15块功能单板为例。根据实际需要,其中部分完成重要功能的单板可采用主备冗余设计。主控板与其它单板通信采用主备冗余设计,正常工作时采用以太网通信,RS485总线作为备用通信通道。
图2为功能单板实现热插拔和缓启动的电路原理,本发明所有单板均支持热插拔和缓启动,热插拔和缓启动电路采用5V和3.3V双通道热插拔芯片设计,单板后端的上电和断电依靠板选控制信号来控制,板选控制信号为高时,双通道热插拔控制芯片禁止工作;板选控制信号为低时,双通道热插拔控制芯片允许工作。
板选控制信号通过背板接插件连到单板内,并在机箱背板上接地。背板和各单板均采用符合COMPACT PCI热插拔规范的接插件,机箱背板与单板相连的接插件插针按长度分为3种:长针,为电源引脚,***单板时长针最早接触单板,拔出单板时,最晚离开单板;中等长度针,为普通信号引脚;最短针为单板上电控制信号,也叫板选控制信号,每块单板对应的背板槽位最短针只有一根,在背板上接地,***单板时最短针最晚接触单板,拔出单板时,最早离开单板。板选控制信号为高时,双通道热插拔控制芯片禁止工作;板选控制信号为低时,双通道热插拔控制芯片允许工作。
双通道热插拔控制芯片控制N沟道MOS管的工作,当板选控制信号为低且输入电压正常时,N沟道MOS管可以正常工作,双通道热插拔控制芯片的心跳信号为低,说明单板后端已经正常上电。图2中的复位信号输入为主控板来的复位信号,经过双通道热插拔控制芯片后输出。
图3所示为本发明中实现热插拔的基本操作,即插拔单板的状态转换:初始状态为单板刚插上机箱,单板的扳手还没有合拢,此时还没有产生热插拔中断,热插拔状态指示灯亮。单板的扳手合拢后,单板的检测电路检测到扳手状态变化,单板工作状态转变为扳手合拢状态,单板插拔状态改变,并产生一个热插拔中断送给主控板。主控板收到热插拔中断后,检查热插拔寄存器状态,发现有新单板***,开始初始化单板,分配资源,加载业务程序,并清除单板插拔状态和热插拔中断,此时单板工作状态转变为正常工作状态,热插拔状态指示灯灭。当需要拔出某块正在工作的单板时,首先要打开单板的扳手,此时单板的检测电路检测到扳手状态变化,单板工作状态由正常工作状态转变到扳手打开状态,单板插拔状态改变,并产生热插拔中断送给主控板。主控板收到热插拔中断后,检查热插拔寄存器状态,发现有单板要拔出,开始卸载资源,卸载业务程序以使本板拔出不影响***正常工作。卸载完业务程序后,主控板清除单板插拔状态和热插拔中断,单板工作状态转变到停止状态,***点亮热插拔状态指示灯,并断开单板后端电源,此时可以拔出单板。各单板都含有热插拔状态转换电路,热插拔状态转换电路采用可编程器件实现。
如图4所示,本发明装置的主控板包含***监控电路,用于主控板对电源模块和其它单板进行监控,本实施例以主控板对15块单板和2个电源模块监控为例。监控电路包括:电源模块监测电路、单板心跳监测电路、单板后端上电和断电控制电路以及单板复位控制电路等。
电源监测电路主要是监测电源的电压是否正常,机箱风扇是否正常工作。***正常工作时,有主备两套电源,主用电源正常供电,备用电源随时准备供电。当***监测到主用电源故障,如电压不正常或风扇停转,以及电源检修需要可以随时中断主用电源供电,同时备用电源自动启用。
单板心跳监测电路主要是监测单板是否正常上电。主控板通过单板心跳监测电路检测到单板上电后,开始计时,在规定时间内主控板和单板通信不成功,则主控板通过单板复位控制电路复位该单板。
单板后端上电和断电控制电路可以对单板进行上电和断电控制,即控制双通道热插拔芯片的工作。主控板若发现单板有故障,可以复位该单板,也可以对该单板后端断电。
单板复位控制电路可以对单板进行复位。
以上主控板的监控电路用可编程器件实现。主控板的监控功能可以使***随时隔离和恢复故障单板,大大提高***维护的方便性和可用性。
以上描述的实施例是说明性的而不是限制性的,本发明的保护范围以权利要求所记载的内容为准,任何在不脱离本发明的精神和范围的情况下所作出的变化和修改,都在本发明的保护范围之内。

Claims (10)

1. 一种实现***高可用性的装置,包括:一块背板,至少一对用于监控单板,并提供后台操作接口的主控板,一对用于为装置内各单板集中供电的电源模块,若干用于实现特定业务的单板;其特征在于,所述主控板、电源模块和单板都插在所述背板上,各单板全部采用热插拔和缓启动设计,独立***机箱并上电;主控板、电源模块采用主备冗余设计。
2. 根据权利要求1所述的实现***高可用性的装置,其特征在于,部分完成重要功能的单板采用主备冗余设计。
3. 根据权利要求1或2所述的实现***高可用性的装置,其特征在于,各单板的热插拔和缓启动电路采用双通道热插拔控制芯片设计,单板后端的上电和断电依靠背板接插件产生的板选控制信号来控制。
4. 根据权利要求3所述的实现***高可用性的装置,其特征在于,板选控制信号为高时,双通道热插拔控制芯片禁止工作;板选控制信号为低时,双通道热插拔控制芯片允许工作。
5. 根据权利要求4所述的实现***高可用性的装置,其特征在于,板选控制信号通过所述背板接插件连到单板内,并在所述背板上接地。
6. 根据权利要求1所述的实现***高可用性的装置,其特征在于,各单板都包括热插拔状态转换电路,热插拔状态包括:初始状态,指单板***机箱,单板的扳手还没有合拢,热插拔状态指示灯亮;单板的扳手合拢状态,指单板的扳手合拢,此时单板的检测电路会检测到扳手状态变化,产生一个热插拔中断送给主控板;正常工作状态,指主控板收到热插拔中断后,发现有新单板***,开始初始化单板,分配资源,加载业务程序,并清除单板插拔状态和热插拔中断,热插拔状态指示灯灭;扳手打开状态,指当需要拔出某块正在工作的单板时,首先要打开单板的扳手,此时单板的检测电路检测到扳手状态变化,产生热插拔中断送给主控板;停止状态,指主控板收到热插拔中断后,发现有单板要拔出,开始卸载资源,卸载业务程序后,主控板清除单板插拔状态和热插拔中断,对单板后端进行断电,热插拔状态指示灯亮,此时拔出单板。
7. 根据权利要求1所述的实现***高可用性的装置,其特征在于,主控板与其它单板通信采用主备冗余设计,正常工作时采用以太网通信,RS485总线作为备用通信通道。
8. 根据权利要求1所述的实现***高可用性的装置,其特征在于,主控板包含监控电路,用于监控单板和电源模块,监控电路包括电源模块监测电路、单板心跳监测电路、单板后端上电和断电控制电路以及单板复位控制电路。
9. 根据权利要求8所述的实现***高可用性的装置,其特征在于,主控板通过监控电路检测到单板上电后,开始计时,在规定时间内主控板和单板通信不成功,则主控板通过监控电路复位该单板。
10. 根据权利要求8或9所述的实现***高可用性的装置,其特征在于,主控板通过监控电路对单板进行电源上电和断电控制,若发现单板有故障,复位该单板或者对该单板后端断电。
CNB2004100649348A 2004-10-13 2004-10-13 实现***高可用性的装置 Expired - Fee Related CN100409590C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2004100649348A CN100409590C (zh) 2004-10-13 2004-10-13 实现***高可用性的装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2004100649348A CN100409590C (zh) 2004-10-13 2004-10-13 实现***高可用性的装置

Publications (2)

Publication Number Publication Date
CN1761167A CN1761167A (zh) 2006-04-19
CN100409590C true CN100409590C (zh) 2008-08-06

Family

ID=36707133

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004100649348A Expired - Fee Related CN100409590C (zh) 2004-10-13 2004-10-13 实现***高可用性的装置

Country Status (1)

Country Link
CN (1) CN100409590C (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101867221B (zh) * 2010-06-28 2014-02-05 中兴通讯股份有限公司 一种单板及板内实现电源监控的方法
CN102170751A (zh) * 2011-02-24 2011-08-31 华为技术有限公司 单板及通信设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11341547A (ja) * 1998-05-25 1999-12-10 Kokusai Electric Co Ltd 無線基地局制御装置
CN1297312A (zh) * 1999-11-18 2001-05-30 深圳市华为技术有限公司 可实现交换机单板热插拔的单板及其背板
CN1379330A (zh) * 2001-04-06 2002-11-13 华为技术有限公司 一种检测单板在位的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11341547A (ja) * 1998-05-25 1999-12-10 Kokusai Electric Co Ltd 無線基地局制御装置
CN1297312A (zh) * 1999-11-18 2001-05-30 深圳市华为技术有限公司 可实现交换机单板热插拔的单板及其背板
CN1379330A (zh) * 2001-04-06 2002-11-13 华为技术有限公司 一种检测单板在位的方法

Also Published As

Publication number Publication date
CN1761167A (zh) 2006-04-19

Similar Documents

Publication Publication Date Title
CN111831488B (zh) 具有安全等级设计的tcms-mpu控制单元
CN101494564B (zh) 一种电源监控装置及单板热备份的实现方法
CN105095142A (zh) 控制扩展卡的***及方法
CN102354261A (zh) 机房服务器电源开关远程控制***
US20240220385A1 (en) Power source consumption management apparatus for four-way server
CN211505789U (zh) 一种pcie板卡测试装置
CN108415866B (zh) 智能平台管理控制器
CN111726563A (zh) 一种用于列车视频监控***的视频存储装置
CN207869116U (zh) 一种主备设备的切换控制***
CN100409590C (zh) 实现***高可用性的装置
CN206460446U (zh) 一种针对加固计算机主板的监控装置
CN111273742B (zh) 一种基于正交构架的高密度服务模块化***
CN117111693A (zh) 一种服务器机箱***、服务器机箱***设计方法及设备
CN1983977A (zh) 实现远程加载单板固件的方法和***
US20220113787A1 (en) Master-slave interchangeable power supply device and host thereof, master-slave interchangeable power supply method and computer-readable storage medium thereof
CN114047803A (zh) 计算机主板、双路处理器计算机及四路处理器计算机
CN113419618A (zh) 服务器解码卡下电控制方法、***、终端及存储介质
CN113849355A (zh) I2c速率自适应调整方法、***、终端及存储介质
CN102325040A (zh) 一种基于MicroTCA***的电源管理方法
CN102385518A (zh) 计算机***及计算机***的使用方法
CN110647435A (zh) 服务器、硬盘远程控制方法及控制组件
CN117251330B (zh) 一种监测配件拔出***的装置及应用产品
CN204087119U (zh) 高可用性的防水耐震键盘
CN214151684U (zh) 带有监控功能的主板组件及其***
CN216286644U (zh) 一种双机切换***、双机切换装置及处理器

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20080806

Termination date: 20141013

EXPY Termination of patent right or utility model