WO2009052741A1 - Système de microarchitecture informatique pour les télécommunications et procédé pour sa gestion de fiabilité - Google Patents

Système de microarchitecture informatique pour les télécommunications et procédé pour sa gestion de fiabilité Download PDF

Info

Publication number
WO2009052741A1
WO2009052741A1 PCT/CN2008/072689 CN2008072689W WO2009052741A1 WO 2009052741 A1 WO2009052741 A1 WO 2009052741A1 CN 2008072689 W CN2008072689 W CN 2008072689W WO 2009052741 A1 WO2009052741 A1 WO 2009052741A1
Authority
WO
WIPO (PCT)
Prior art keywords
fru
information device
data
fru information
carrier board
Prior art date
Application number
PCT/CN2008/072689
Other languages
English (en)
French (fr)
Inventor
Qingyin Fang
Qiangzhi Xia
Original Assignee
Huawei Technologies Co., Ltd.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co., Ltd. filed Critical Huawei Technologies Co., Ltd.
Publication of WO2009052741A1 publication Critical patent/WO2009052741A1/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0668Management of faults, events, alarms or notifications using network fault recovery by dynamic selection of recovery network elements, e.g. replacement by the most appropriate element after failure

Definitions

  • the present invention relates to the field of communication technologies, and in particular to a small telecommunications and computing hardware platform architecture (Micro Teacommunica t ions Computing Archi tecture, MicroTCA) system and a reliability management method.
  • a small telecommunications and computing hardware platform architecture Micro Teacommunica t ions Computing Archi tecture, MicroTCA
  • MicroTCA is a small telecom and computing common hardware platform architecture developed by the PCI Indus tr ia l Computer Manufacturers Group (PICMG). MicroTCA uses the Advanced Mezzanine Card (AMC) to build the system. The hot-swappable AMC can be plugged directly into the MicroTCA's backplane. MicroTCA is primarily targeted at low-end, cost-sensitive, telecommunications or computing applications that require small physical size. The main applications include wireless base stations, routers, media gateways, and more.
  • the MicroTCA base specification name is MicroTCA. 0, in which the frame structure, management, power supply, heat dissipation, interconnection, etc. of the Mi croTCA are defined.
  • AMC is a universal mezzanine card defined by the PICMG organization that supports hot swapping.
  • the specific types include digital signal processing (DSP) AMC, central processing unit (CPU) AMC, network processor (NP) AMC, interface AMC, storage AMC, etc. .
  • DSP digital signal processing
  • CPU central processing unit
  • NP network processor
  • interface AMC storage AMC
  • storage AMC storage AMC
  • the AMC module can be directly plugged into the backplane of the MicroTCA for application to form the MicroTCA system.
  • the AMC specification includes the AMC. X-series standard specification, which defines the AMC's architecture, management, power, cooling, interconnection, and switching network recommendations.
  • IPMI Inte ll igent Platform Management Interface
  • IPMB Intelligent Platform Management Bus
  • MMC MicroTCA bearer management controller
  • EMMC enhanced management controller
  • MCH MicroTCA switch control module
  • a basic MicroTCA system supports a maximum of 12 AMCs and a maximum of 2 MCHs.
  • the two supported MCHs can be redundant backup relationships.
  • FIG. 1 is a schematic diagram of the connection of the FRU information device of the MicroTCA.0 specification carrier board.
  • each MCMC accesses a bearer FRU information device through an independent I 2 C, and configures the system device by using the FRU data of the FRU information device of the bearer.
  • the system device may include an MCH, an AMC, a power supply unit, and a fan unit.
  • the bearer FRU information device can be implemented as a separate physical entity by a non-volatile memory fixed to the MicroTCA backplane.
  • MCMC1 accesses its corresponding carrier FRU information device 1 through its dedicated channel I 2 C1
  • MCMC 2 accesses its corresponding 7-carrier FRU information device 2 through its dedicated channel 1 2 C 2 .
  • the FRU storage information describes the capacity of each port in the AMC slot, and the information stored in the FRU information device of the bearer board describes the capability of each port on the backplane.
  • the MCH slot is described in the FRU storage information of the MCMC. Bit per port capability. By comparing the port capabilities of these resource information, the carrier board manager determines whether the AMC or MCH star port is enabled. The bearer manager and the MMC on the AMC or the MCMC on the MCH pass the corresponding port capability information to ensure that only compatible ports can be enabled.
  • the FRU data stored by the carrier board FRU information device includes Mi croTCA carrier board attributes, such as the backplane connection, AMC power-on sequence, and the storage information reflects the ability of the MicroTCA carrier board to manage the AMC board.
  • the carrier FRU information device is external to the MCMC and is connected to the MCMC through a dedicated bus.
  • the Mi croTCA chassis takes into account that each FMC information device with the MCMC and the carrier board is connected through the I 2 C bus.
  • FIG. 1 is a schematic diagram of the failure of the FRU information device of the MCH access carrier board of the MicroTCA. 0 specification.
  • the MCH 1 cannot manage the bearer FRU information device 1 .
  • the system will face two problems: First, the system turnover is frequently risky. If the MicroTCA system needs to work normally, MCH2 must start the active/standby switchover action, activate MCH2, and MCH2 to take over the work of MCH1. MCH2 accesses the FRU information device 2 through the dedicated I 2 C bus to take over the management work, and control the AMC board to be normal. Powering on and off and performing E-Keying management. This switching trigger increases the frequency and risk of active/standby switching.
  • the system has long-term faulty operation risks.
  • the MCH1 cannot use the valid data of the FRU information device 2 corresponding to the MCH2 in time to synchronize the content of the FRU information device 1 corresponding to the MCH1, and the FRU information device FRU.
  • the information device 1 failure cannot be repaired in time, and the system is at risk of running with a fault.
  • the failure occurs between the carrier FRU information device 2 and the MCMC 2, the above problem also exists.
  • the MCH and the FRU information device of the bearer board are connected through only one dedicated I 2 C interface. Therefore, the FRU management bus architecture defined by the MicroTCA specification may be inconsistent with the information of the FRU information device of the bearer board.
  • the problem of over-loading is too heavy.
  • the information synchronization failure will cause the MCH to lose control of the AMC management, and the system cannot properly configure and manage the AMC.
  • the switching of the MCH depends on the corresponding FRU information equipment of the carrier board, which reduces the reliability of the system.
  • the embodiments of the present invention provide a small-scale telecommunications and computing general hardware platform architecture system and a reliability management method to ensure normal configuration and management of system equipment due to information synchronization failure.
  • a method for reliability management of a MiTC system is provided in the embodiment of the present invention, where the MiTC system includes a MiTCTC bearer management controller, a main bearer FRU information device, and a backup carrier FRU information device, where the method includes :
  • the FRU information device of the primary carrier board Determining that the FRU information device of the primary carrier board is not in a position or is faulty, the FRU information device of the standby carrier board is in place, and the FRU data of the FRU information device of the standby carrier board is successfully verified, and the standby carrier board FRU is utilized.
  • the FRU data of the information device is configured and processed.
  • the system of the present invention provides a MicroTCA system, which includes: an MCMC, a main carrier FRU information device, and a backup carrier FRU information device, where the MCMC is connected to the FRU information device of the primary carrier board and the FRU information device of the backup carrier board, respectively.
  • the primary carrier FRU information device is configured to provide FRU data to the MCMC when the primary carrier FRU information device is operating normally;
  • the standby carrier FRU information device is configured to provide FRU data to the MCMC when the primary carrier board FRU information device is not in place or fails;
  • the MCMC is configured to acquire FRU data, and perform configuration processing by using the acquired FRU data.
  • a Mi croTCA bearer management controller includes:
  • a data acquisition unit configured to acquire FRU data from the primary carrier FRU information device when the primary carrier FRU information device is running normally; when the primary carrier FRU information device is absent or fails, the data acquisition unit is configured to: The FRU information device of the carrier board acquires FRU data;
  • a configuration unit is configured to perform configuration processing by using the acquired FRU data.
  • the MCH corresponding to the FRU information device of the primary carrier board fails, the MCH does not need to start a complex active/standby switching process, but only needs to access the FRU information device of the standby carrier board to obtain the correct FRU data, and then Realize the normal configuration and management of system equipment.
  • FIG. 1 is a schematic diagram of a FRU information device connection of a Mi croTCA. 0 specification bearer board in the prior art
  • FIG. 2 is a schematic diagram of a FRU information device fault of the MCH access bearer board for the MicroTCA. 0 specification shown in FIG. 1;
  • FIG. 3 is a schematic structural diagram of a Mi croTCA. 0 system according to an embodiment of the present invention.
  • FIG. 4 is a schematic diagram of an MCMC according to an embodiment of the present invention.
  • FIG. 5 is a schematic flowchart of a method for implementing reliability according to an embodiment of the present invention.
  • the system equipment when it is determined that the primary carrier FRU information device is not in place or fails, the system equipment is configured by using the FRU data of the standby carrier FRU information device.
  • the system device may include an MCH, an AMC, a power supply unit, and a fan unit.
  • determining whether the primary carrier FRU information device is faulty may be implemented as follows: when the primary carrier FRU information device is in place, but the FRU data of the primary carrier FRU information device cannot be read, or the primary carrier FRU is When the information saved by the information device is unsuccessful, it is determined that the FRU information device of the primary carrier board is faulty.
  • the FRU data saved by the primary carrier FRU information device is updated by using the data of the standby carrier FRU information device, it may be further determined whether the standby FRU storage device is in place. . When the standby FRU storage device is in place, and the read data is successful and the read data is successfully verified, the FRU data saved by the standby carrier FRU information device is obtained. Thereafter, the FRU data saved by the primary bearer FRU information device is updated by using the data of the standby carrier FRU information device.
  • the system device can be directly configured by using the FRU data of the primary carrier FRU information device.
  • the user system may be prompted to fail.
  • the FRU data saved by the primary bearer FRU information device may be updated by using FRU data of the standby carrier FRU information device.
  • the system of the embodiment of the present invention includes: an MCMC, a main carrier FRU information device, and a backup carrier FRU information device, such as a FRU information device 1 as a primary carrier FRU information device, and a carrier FRU information device.
  • a FRU information device 1 as a primary carrier FRU information device
  • a carrier FRU information device such as a carrier FRU information device 1 as a primary carrier FRU information device, and a carrier FRU information device.
  • 2 is a FRU information device of the standby carrier board
  • the MCMC is respectively connected to the FRU information device of the primary carrier board and the FRU information device of the backup carrier board.
  • the primary carrier FRU information device is configured to store FRU data, and provide FRU data to the MCMC during normal operation;
  • the backup carrier FRU information device is configured to store FRU data, where the primary carrier board FRU data is provided to the MCMC when the FRU information device is not in place or fails;
  • the MCMC is configured to acquire FRU data, and perform configuration processing by using the acquired FRU data.
  • I 2 C1 is MCMC1 FRU information to the carrier plate apparatus 1 dedicated I 2 C-channel
  • I 2 C4 is MCMC2 FRU information to the carrier plate 2 apparatus dedicated I 2 C-channel.
  • the MC2 is added to the I 2 C channel I 2 C2 of the FRU information device 2 of the bearer board, and the I 2 C2 shown by the dashed line in FIG. 3 is used as an access channel for the MCMC1 to access the FRU information device 2 of the bearer.
  • the MCMC2 is added to the I 2 C channel I 2 C3 of the FRU information device 1 of the bearer board, and the I 2 C3 shown by the dashed line in FIG. 3 serves as an access channel for the MCMC 2 to access the FRU information device 1 of the bearer board.
  • the MCMC1 accesses its corresponding FRU device carrier FRU information device 1 through the dedicated channel I 2 C1, and accesses its corresponding carrier FRU device carrier FRU information device 2 through the dedicated channel I 2 C2; likewise, the MCMC 2 passes the dedicated channel.
  • I 2 C3 access its corresponding carrier plate FRU device carrier plate FRU information equipment 1
  • I 2 C4 access its corresponding carrier plate carrier plate apparatus FRU FRU information device 2 through a dedicated channel.
  • the MCMC1 on the left side of Figure 3 is the main board, and the FRU information equipment 1 corresponding to the dedicated I 2 C channel I 2 C1 is the main FRU storage device.
  • the side MCMC2 is a standby board, and the carrier board FRU information device 2 corresponding to the dedicated I 2 C channel I 2 C4 is a standby FRU storage device.
  • the MCMC shown in FIG. 3 is connected to the FRU information device of the carrier board through the I 2 C bus, and can also be connected.
  • the MCMC may include: a data acquisition unit 42 and a configuration unit 43.
  • the data obtaining unit 42 is configured to acquire FRU data from the primary carrier FRU information device when the primary carrier FRU information device is running normally; when the primary carrier FRU information device is not in place or fails,
  • the FRU information device of the standby carrier board acquires FRU data;
  • the configuration unit 43 is configured to perform configuration processing by using the acquired FRU data.
  • the MCMC may include: a first detecting unit 41, configured to detect whether the FRU information device of the primary carrier board is operating normally.
  • the MCMC may further include: a second detecting unit 44, configured to detect, when the primary carrier FRU information device is absent or fails, detecting whether the standby carrier FRU information device is in place or fails, When the standby carrier FRU information device is in or out of failure, the data acquiring unit 42 is instructed to acquire FRU data from the standby carrier FRU information device. Therefore, the data acquisition unit 42 acquires FRU data from the standby carrier FRU information device when the standby carrier FRU information device is in place or has not failed.
  • the MCMC may further include: a synchronization update unit 45, configured to: when the primary carrier FRU information device is not in place or fails, use the FRU data of the standby carrier FRU information device to update the primary carrier FRU information device to save FRU data.
  • a synchronization update unit 45 configured to: when the primary carrier FRU information device is not in place or fails, use the FRU data of the standby carrier FRU information device to update the primary carrier FRU information device to save FRU data.
  • the MCMC may further include: an alarm unit, configured to prompt the user system to malfunction when the FRU information device of the standby carrier board is not in place or fails.
  • the MCMC can separately take different measures according to different states of the FRU information equipment of the active and standby carrier boards:
  • the MCMC1 When the primary FRU storage device is in place, the MCMC1 reads the primary FRU data successfully through the primary FRU dedicated channel I 2 C1. When the data verification is correct, the MCMC1 accepts the storage data of the primary FRU storage device, and configures the MicroTCA system by using the configuration file. Configure ports on the AMC board in the system to implement power-on and power-off management.
  • the MCMC1 fails to read the primary FRU storage device data through the primary FRU dedicated channel I 2 C1.
  • the MCMC1 passes the standby FRU storage device.
  • the dedicated channel I 2 C2 reads data from the alternate FRU storage device and verifies the stored information. If the verification is successful, the alternate FRU storage device data is used. If the backup data fails to be obtained, the MCMC board gives a severe alarm indication, and the self-test fails. The error message is output: "The carrier board FRU data is invalid.”
  • the MCMC1 When the primary FRU storage device is in place, the MCMC1 reads the data successfully through the primary FRU dedicated channel I 2 C1, but the parity data does not pass. When the standby FRU storage device is in place, the MCMC1 reads the data from the standby FRU storage device through the I 2 C2. And check it out. If the MCMC1 is successful, the MCMC1 accepts the storage data of the standby FRU storage device.
  • the configuration file is used to configure the MicroTCA system to configure the ports on the AMC board in the system to implement power-on and power-off management.
  • the primary FRU data is overwritten by the primary FRU dedicated channel I 2 C1 using the alternate data. If the backup data fails to be obtained, the MCMC board gives a severe alarm indication, and the self-test fails.
  • the error message is output: "The carrier board FRU data is invalid.”
  • MCMC1 When the primary FRU storage device is in place, MCMC1 fails to read data through the primary FRU dedicated channel I 2 C1. When the standby FRU storage device is in place, MCMC1 reads data from the standby FRU storage device through I 2 C2 and performs verification. If the MCMC1 is successful, the MCMC1 accepts the storage data of the standby FRU storage device.
  • the configuration file is used to configure the MicroTCA system to configure the ports on the AMC board in the system to implement power-on and power-off management. If the backup data fails to be obtained, the MCMC board gives a severe alarm indication, and the self-test fails. The error message is output: "The carrier board FRU data is invalid.”
  • the MCMC1 When the primary FRU storage device is not in place and the standby FRU storage device is in place, the MCMC1 reads data from the alternate FRU storage device through I 2 C2 and performs verification. If successful, use alternate FRU storage device data. If the backup data fails to be obtained, the MCMC board gives a severe alarm indication, and the self-test fails. The error message is output: "The carrier board FRU data is invalid.”
  • the MCMC board gives a severe alarm indication, and the self-test fails.
  • the error message is output: "The carrier board FRU data is invalid.”
  • Step 501 Determine whether the primary carrier FRU information device is in place. If it is in place, execute step 502. Otherwise, go to step 504.
  • Step 502 MCMC1 reads the primary carrier FRU information device through the primary FRU dedicated channel I 2 C 1 If the reading is successful, step 503 is performed; otherwise, step 504 is performed.
  • Step 503 The MCMC1 checks the read FRU data. If the verification is correct, the MCMC1 accepts the FRU data, and performs step 509. Otherwise, step 504 is performed.
  • Step 504 Determine whether the FRU information device is in place on the standby carrier board. If yes, execute step 505. Otherwise, go to step 508.
  • Step 505 The MCMC1 reads the FRU data of the FRU information device of the bearer board through the standby FRU dedicated channel I 2 C. If the reading is successful, step 506 is performed; otherwise, step 508 is performed.
  • Step 506 The MCMC1 checks the FRU data of the read FRU information device of the standby carrier board. If the verification is correct, the MCMC1 accepts the FRU data of the FRU information device of the standby carrier board, and performs step 509. Otherwise, step 508 is performed.
  • Step 507 Determine whether the FRU data of the FRU information device of the read carrier board is successful. If successful, the MCMC1 accepts the FRU data of the FRU information device of the standby carrier board, and performs step 509. If not, the MCMC1 accepts the FRU information device of the primary bearer board. The FRU data of the FRU information device of the primary carrier board is synchronized with the FRU information device of the standby carrier board, and step 509 is performed.
  • the carrier board FRU information device data synchronization is realized by IPMB_L, CAN, serial port and other buses.
  • Step 508 Determine that the FRU information device of the standby carrier board is not in place or fails, and return to step 501.
  • the MCH does not need to start a complex active/standby switchover process, which increases the system switching load, but only needs to be added to the dedicated I 2 C channel of the board to access the board carrier board FRU information device. It reduces the risk of system switching load and switching, and improves the reliability of the MicroTCA system.
  • the MCMC After the FMC data stored in the FRU information device of the bearer board is verified by the MCMC, the MCMC first analyzes the FRU record of the bearer board in the FRU information device of the bearer board. From the composite record (Mul ti Record) The "Activity Activation and Power Management Record" is extracted, and according to the configuration parameter of "FRU Act ivat ion and Power Descriptor", whether to activate the bearer is determined. Board FRU information device. If the configuration parameter is to allow activation, the MCMC sends a Set FRU Activation (Activate FRU) command to activate the bearer FRU information device by using the IPMB command, and the bearer FRU information device enters an active state.
  • Activate FRU Set FRU Activation
  • the MCMC compares the capabilities of each port in the FRU resource information in the MCH and AMC boards, and determines whether the AMC or MCH star port is enabled.
  • the bearer board manager communicates the corresponding port capability information with the MMC module on the AMC or the MCMC module on the MCH. Ensure that only compatible ports are enabled to open.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Hardware Redundancy (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Description

小型电信和计算通用硬件平台架构***及可靠性管理方法 本申请要求于 2007年 10月 16 日提交的, 申请号为 200710163195. 1 ,发 明名称为 "小型电信和计算通用硬件平台架构***及可靠性管理方法" 的中 国申请优先权, 其全部内容通过引用结合在本申请中。 技术领域
本发明涉及通信技术领域, 特别是指一种小型电信和计算通用硬件平台 架构 ( Micro Te lecommunica t ions Comput ing Archi tecture , MicroTCA ) 系 统及可靠性管理方法。
背景技术
MicroTCA 是 PCI 工业计算机厂家协会 ( PCI Indus tr ia l Computer Manufacturers Group , PICMG )组织制定的小型电信和计算通用硬件平台架 构。 MicroTCA利用先进夹层卡(Advanced Mezzanine Card, AMC )来构筑系 统, 支持热插拔的 AMC可以直接插到 Mi croTCA的背板。 MicroTCA主要定位中 低端、 对成本比较敏感、 要求小物理尺寸的电信或计算应用。 主要的应用包 括无线基站、 路由器、 媒体网关等。 MicroTCA基本规范名称是 MicroTCA. 0, 在该规范中定义了 Mi croTCA的机框结构、 管理、 电源、 散热、 互连等内容。
AMC是 PICMG组织定义的可以支持热插拔的通用夹层卡,具体类型包括数 字信号处理(DSP ) AMC、 中央处理器(CPU ) AMC、 网络处理器( NP ) AMC、 接 口 AMC、 存储 AMC等类型。 AMC模块可以直接插到 MicroTCA的背板上来应用, 构成 MicroTCA***。 AMC规范包括 AMC. X系列标准规范, 其定义了 AMC的结 构、 管理、 电源、 散热、 互连及交换网建议等内容。
智 能 平 台 管 理 接 口 ( Inte l l igent Pla tform Management Interface , IPMI )是为提高服务器的可用性指标而推出的智能化平台管理接 口标准, 它的最初目的是为服务器提供设备管理、 传感器 /事件管理、 用户管 理、 风扇框 /电源框管理、 远程维护等功能。 MicroTCA规范和 AMC规范均将 IPMI规范定义为需要遵循的管理规范。
智能平台管理总线(Intelligent Platform Management Bus, IPMB )是 基于 IPMI规范的管理总线的统称。 在 MicroTCA中 IPMB总线又分为两种, IPMB-0和本地智能平台管理总线 1( Local Intelligent Platform Management Bus, IPMB- L)。 其中 IPMB-O连接 MicroTCA***中的 MicroTCA承载管理控制 器 (MicroTCA 承载板 Manager Controller, MCMC )和增强模块管理控制器 ( Enhanced Management Controller, EMMC ), 实现 MicroTCA 的交换控制模 块(MicroTCA承载板 Hub, MCH )对电源模块和风扇单元的管理。 而 IPMB-L 连接 MicroTCA***中的 MCMC和模块管理控制器 (Management Controller, MMC), 实现 MCH对各 AMC模块的管理。
根据 MicroTCA的规范, 一个基本的 MicroTCA***支持的 AMC数量最大 为 12, 支持的 MCH数量最大为 2, 所支持的两个 MCH可以互为冗余备份关系。
图 1为 MicroTCA.0规范承载板 FRU信息设备连接示意图。参见图 1所示, 每块 MCMC通过独立的 I2C访问一个承载板 FRU信息设备, 利用承载板 FRU信 息设备的 FRU数据配置***设备。 所述***设备可以包括 MCH、 AMC、 电源单 元以及风扇单元。 考虑到 MCH的通用性, 承载板 FRU信息设备作为独立的物 理实体, 可以由固定于 MicroTCA背板的非易失性存储器实现。 图 1中示出, MCMC1通过其专用通道 I2C1访问其对应的承载板 FRU信息设备 1,同样, MCMC 2 通过其专用通道 12C 2访问其对应的 7 载板 FRU信息设备 2。
基于 AMC规范设计的任何 AMC单板, 其 FRU存储信息描述 AMC槽位每个 端口能力, 同时承载板 FRU信息设备存储的信息中描述背板每个端口能力, MCMC的 FRU存储信息中描述 MCH槽位每个端口能力。 通过比较这些资源信息 中各端口能力, 承载板管理器决定 AMC或 MCH星型端口是否使能。 承载板管 理器与 AMC上的 MMC或者 MCH上的 MCMC传递各自对应端口能力信息, 保证只 有兼容的端口才能使能打开。 承载板 FRU 信息设备存储的 FRU 数据包括 Mi croTCA 承载板属性, 如背板联接, AMC 上下电顺序, 其存储信息反映 Mi croTCA承载板管理 AMC单板能力。 承载板 FRU信息设备在 MCMC外部, 通 过专用总线与 MCMC连接。 Mi croTCA机框考虑到每个与 MCMC与承载板 FRU信 息设备通过 I2C总线连接。 一旦承载板 FRU信息设备被 MCMC发现, 首先检查 器件有效性。 在冗余 MCMC***中, 两块 MCMC之间会实时传达承载板 FRU信 息设备状态。 MCMC之间协商两个承载板 FRU信息设备的主备关系。
图 1为 Mi croTCA. 0规范 MCH 访问承载板 FRU信息设备故障示意图。 如 图 1所示, 当 MCMC1与承载板 FRU信息设备 1间专用 I2C总线发生故障时, MCH1无法对承载板 FRU信息设备 1进行管理。 此时, ***会面临两个问题: 一、 ***倒换频繁风险。 如果 Mi croTCA***需要正常工作, MCH2必须启 动主备倒换动作, 激活 MCH2 , 由 MCH2来接替 MCH1的工作, MCH2通过专用 I2C 总线访问承载板 FRU信息设备 2接替管理工作, 控制 AMC单板正常上下电及 进行 E-Keying管理, 该倒换触发增加了主备倒换频率和风险。
二、 ***存在长期带故障运行风险。 当 MCH1对应的承载板 FRU信息设备 1器件数据异常但可访问时, MCH1无法及时用 MCH2对应的承载板 FRU信息设 备 2有效数据及时同步 MCH1对应的故障承载板 FRU信息设备 1内容, 承载板 FRU信息设备 1 故障不能及时得到修复, ***存在带故障运行风险。 同样, 当故障发生在承载板 FRU信息设备 2与 MCMC2间时, 同样存在上述问题。
因此, 在实现本发明的过程中, 发明人发现:
在 Mi croTCA规范中, MCH与承载板 FRU信息设备只通过一个专用的 I2C 接口连接, 因此, 可以导致 Mi croTCA规范定义的承载板 FRU管理总线架构存 在承载板 FRU信息设备信息同步不一致及主备倒换负担过重问题。 信息同步 故障将导致 MCH对 AMC管理失去控制, ***无法对 AMC进行正常的配置和管 理。 同时 MCH的倒换依赖其对应的承载板 FRU信息设备好坏, 降低了***的 可靠性。
发明内容 有鉴于此, 本发明实施例的提供一种小型电信和计算通用硬件平台架构 ***及可靠性管理方法, 以保证由于发生信息同步故障时, 实现对***设备 进行正常的配置和管理。 本发明实施例提供的一种 Mi croTCA***的可靠性管理的方法, 其中, 所 述 Mi croTCA***包括 Mi croTCA承载管理控制器、 主承载板 FRU信息设备以 及备承载板 FRU信息设备, 该方法包括:
确定所述主承载板 FRU信息设备不在位或发生故障, 所述备承载板 FRU 信息设备在位, 并对所述备承载板 FRU信息设备的 FRU数据校验成功, 利用 所述备承载板 FRU信息设备的 FRU数据进行配置处理。
本发明实施例提供的一种 Mi croTCA***, 包括: MCMC、 主承载板 FRU信 息设备以及备承载板 FRU信息设备, 所述 MCMC与主承载板 FRU信息设备以及 备承载板 FRU信息设备分别相连,
所述主承载板 FRU信息设备, 用于在所述主承载板 FRU信息设备正常运 行时, 向所述 MCMC提供 FRU数据;
所述备承载板 FRU信息设备, 用于所述主承载板 FRU信息设备不在位或 发生故障时, 向所述 MCMC提供 FRU数据;
所述 MCMC , 用于获取 FRU数据, 并利用获取的 FRU数据进行配置处理。 本发明实施例提供的一种 Mi croTCA承载管理控制器, 包括:
数据获取单元, 用于在主承载板 FRU信息设备运行正常时, 从所述主承 载板 FRU信息设备获取 FRU数据; 在所述主承载板 FRU信息设备不在位或发 生故障时, 从所述备承载板 FRU信息设备获取 FRU数据;
配置单元, 用于利用获取的 FRU数据进行配置处理。
在本发明实施例中, 当 MCH对应主承载板 FRU信息设备发生故障时, MCH 不需要启动复杂的主备倒换流程, 而只需要通过访问备用承载板 FRU信息设 备获取正确的 FRU数据, 进而可以实现对***设备进行正常的配置和管理。 附图说明
图 1为现有技术中 Mi croTCA. 0规范承载板 FRU信息设备连接示意图; 图 2为针对图 1所示的 Mi croTCA. 0规范 MCH访问承载板 FRU信息设备 故障示意图;
图 3为本发明实施例的 Mi croTCA. 0***结构示意图;
图 4为本发明实施例的 MCMC的示意图;
图 5为本发明实施例实现可靠性的方法流程示意图。
具体实施方式
在本发明实施例中, 在 Mi croTCA***中, 当确定主承载板 FRU信息设备 不在位或发生故障时, 利用所述备承载板 FRU信息设备的 FRU数据配置*** 设备。 所述***设备可以包括 MCH、 AMC、 电源单元以及风扇单元。
这里, 确定主承载板 FRU信息设备是否发生故障可以这样实现: 在主承 载板 FRU信息设备在位时, 但无法读取主承载板 FRU信息设备的 FRU数据, 或, 对所述主承载板 FRU信息设备所保存的信息校验不成功时, 确定主承载 板 FRU信息设备发生故障。
进一步地, 为了使***更可靠的进行配置, 在利用所述备承载板 FRU信 息设备的数据更新所述主承载板 FRU信息设备所保存的 FRU数据之前, 可以 进一步判断备用 FRU存储设备是否在位。 在所述备用 FRU存储设备在位, 且 读数据成功并对读取的数据校验成功时, 获得所述备承载板 FRU信息设备所 保存的 FRU数据。 此后, 再利用所述备承载板 FRU信息设备的数据更新所述 主承载板 FRU信息设备所保存的 FRU数据。
当确定主承载板 FRU信息设备运行正常时, 可以直接利用所述主承载板 FRU信息设备的 FRU数据配置***设备。
当然, 当主承载板 FRU信息设备不在位或发生故障时, 且所述备承载板 FRU信息设备不在位或发生故障时, 可以提示用户***发生故障。
为了实现数据同步, 当确定主承载板 FRU信息设备不在位或发生故障时, 可以利用所述备承载板 FRU信息设备的 FRU数据更新所述主承载板 FRU信息 设备所保存的 FRU数据。
参见图 3所示, 本发明实施例的***包括: MCMC、 主承载板 FRU信息设 备以及备承载板 FRU信息设备, 如承载板 FRU信息设备 1为主承载板 FRU信 息设备, 承载板 FRU信息设备 2为备承载板 FRU信息设备, 所述 MCMC与主承 载板 FRU信息设备以及备承载板 FRU信息设备分别相连。
所述主承载板 FRU信息设备, 用于存储 FRU数据, 并在正常运行时, 向 所述 MCMC提供 FRU数据; 所述备承载板 FRU信息设备, 用于存储 FRU数据, 在所述主承载板 FRU信息设备不在位或发生故障时, 向所述 MCMC提供 FRU数 据;
所述 MCMC , 用于获取 FRU数据, 并利用获取的 FRU数据进行配置处理。 在图 3中, I2C1是 MCMC1到承载板 FRU信息设备 1专用 I2C通道, I2C4 是 MCMC2到承载板 FRU信息设备 2专用 I2C通道。 在现有方案基础上, 增加 MCMC1到承载板 FRU信息设备 2的 I2C通道 I2C2 , 如图 3虚线所示的 I2C2 , 作为 MCMC1访问承载板 FRU信息设备 2的访问通道。增加 MCMC2到承载板 FRU 信息设备 1的 I2C通道 I2C3 , 如图 3虚线所示的 I2C3 , 作为 MCMC2访问承载 板 FRU信息设备 1的访问通道。 MCMC1通过专用通道 I2C1访问其对应的承载 板 FRU设备承载板 FRU信息设备 1 , 通过专用通道 I2C2访问其对应的承载板 FRU设备承载板 FRU信息设备 2 ; 同样, MCMC 2通过专用通道 I2C3访问其对 应的承载板 FRU设备承载板 FRU信息设备 1 , 通过专用通道 I2C4访问其对应 的承载板 FRU设备承载板 FRU信息设备 2。
考虑单板上电随机性, 这里假定图 3中左侧 MCMC1为主用单板, 其专用 I2C通道 I2C1对应的承载板 FRU信息设备 1为主用 FRU存储设备, 图 3中右 侧 MCMC2为备用单板, 其专用 I2C通道 I2C4对应的承载板 FRU信息设备 2为 备用 FRU存储设备。
图 3中示出的 MCMC与承载板 FRU信息设备通过 I2C总线相连, 也可以通 过 IPMB-L管理总线、 CAN、 串口以及其它总线实现。
参见图 4所示, 所述 MCMC可以包括: 数据获取单元 42以及配置单元 43。 数据获取单元 42 , 用于在主承载板 FRU信息设备运行正常时, 从所述主承载 板 FRU信息设备获取 FRU数据; 在所述主承载板 FRU信息设备不在位或发生 故障时, 从所述备承载板 FRU信息设备获取 FRU数据; 配置单元 43 , 用于利 用获取的 FRU数据进行配置处理。
所述 MCMC可以包括: 第一检测单元 41 , 用于检测所述主承载板 FRU信息 设备运行是否正常。 所述 MCMC还可以包括: 第二检测单元 44 , 用于在所述主 承载板 FRU信息设备不在位或发生故障时, 检测所述备承载板 FRU信息设备 是否在位或发生故障, 在所述备承载板 FRU信息设备在位或没有发生故障时, 指示所述数据获取单元 42从所述备承载板 FRU信息设备获取 FRU数据。因此, 数据获取单元 42在所述备承载板 FRU信息设备在位或没有发生故障时, 从所 述备承载板 FRU信息设备获取 FRU数据。
所述 MCMC还可以包括: 同步更新单元 45 , 用于当主承载板 FRU信息设备 不在位或发生故障时, 利用所述备承载板 FRU信息设备的 FRU数据更新所述 主承载板 FRU信息设备所保存的 FRU数据。
所述 MCMC还可以包括: 告警单元, 用于在所述备承载板 FRU信息设备不 在位或发生故障时, 提示用户***发生故障。
在本发明实施例中, 根据主备承载板 FRU信息设备的不同状态, MCMC可 以分别釆取不同的措施:
当主用 FRU存储设备在位, MCMC1通过主用 FRU专用通道 I2C1读主用 FRU 数据成功, 数据校验正确时, MCMC1接受主用 FRU存储设备的存储数据, 利用 该配置文件配置 Mi croTCA***, 对***内 AMC单板进行端口配置, 实现上下 电管理等功能。
当主用 FRU存储设备在位, MCMC1通过主用 FRU专用通道 I2C1读主用 FRU 存储设备数据失败,备用 FRU存储设备在位时, MCMC1通过备用 FRU存储设备 专用通道 I2C2从备用 FRU存储设备读数据, 并对存储信息进行校验。 如果校 验成功, 则釆用备用 FRU存储设备数据。 如果备用数据获取失败, 则 MCMC板 给出严重告警指示, 启动自检失败, 输出错误信息: "承载板 FRU数据无效"。
当主用 FRU存储设备在位, MCMC1通过主用 FRU专用通道 I2C1读数据成 功, 但是校验数据不通过, 备用 FRU存储设备在位时, MCMC1通过 I2C2从备 用 FRU存储设备读数据, 并进行校验。 如果成功, MCMC1接受备用 FRU存储设 备的存储数据, 利用该配置文件配置 Mi croTCA***, 对***内 AMC单板进行 端口配置, 实现上下电管理等功能。 并使用备用数据通过主用 FRU 专用通道 I2C1覆盖主用 FRU数据。 如果备用数据获取失败, 则 MCMC板给出严重告警指 示, 启动自检失败, 输出错误信息: "承载板 FRU数据无效"。
当主用 FRU存储设备在位, MCMC1通过主用 FRU专用通道 I2C1读数据不 成功, 备用 FRU存储设备在位时, MCMC1通过 I2C2从备用 FRU存储设备读数 据, 并进行校验。 如果成功, MCMC1接受备用 FRU存储设备的存储数据, 利用 该配置文件配置 Mi croTCA***, 对***内 AMC单板进行端口配置, 实现上下 电管理等功能。 如果备用数据获取失败, 则 MCMC板给出严重告警指示, 启动 自检失败, 输出错误信息: "承载板 FRU数据无效"。
当主用 FRU存储设备不在位,备用 FRU存储设备在位时, MCMC1通过 I2C2 从备用 FRU存储设备读数据, 并进行校验。 如果成功, 釆用备用 FRU存储设 备数据。 如果备用数据获取失败, 则 MCMC板给出严重告警指示, 启动自检失 败, 输出错误信息: "承载板 FRU数据无效"。
当主备用 FRU存储设备都不在位时, MCMC板给出严重告警指示, 启动自 检失败, 输出错误信息: "承载板 FRU数据无效"。
如图 5所示, 本发明实施例实现可靠性管理的具体过程如下:
步骤 501 : 判断主用承载板 FRU信息设备是否在位, 如果在位, 则执行步 骤 502 , 否则, 执行步骤 504。
步骤 502 : MCMC1通过主用 FRU专用通道 I2C 1读主承载板 FRU信息设备 的 FRU数据, 如果读取成功, 则执行步骤 503 , 否则, 执行步骤 504。
步骤 503: MCMC1对读取的 FRU数据进行校验, 如果校验正确, MCMC1接 受该 FRU数据, 执行步骤 509 , 否则, 执行步骤 504。
步骤 504 : 判断备承载板 FRU信息设备是否在位, 如果在位, 则执行步骤 505 , 否则, 执行步骤 508。
步骤 505 : MCMC1通过备用 FRU专用通道 I2C读备承载板 FRU信息设备的 FRU数据, 如果读取成功, 则执行步骤 506 , 否则, 执行步骤 508。
步骤 506 : MCMC1对读取的备承载板 FRU信息设备的 FRU数据进行校验, 如果校验正确, MCMC1接受备承载板 FRU信息设备的 FRU数据,执行步骤 509 , 否则, 执行步骤 508。
步骤 507 :判断读备承载板 FRU信息设备的 FRU数据是否成功,如果成功, 则 MCMC1接受备承载板 FRU信息设备的 FRU数据,执行步骤 509 ,如果不成功, 则 MCMC1接受主承载板 FRU信息设备的 FRU数据, 且利用备承载板 FRU信息 设备同步主承载板 FRU信息设备的 FRU数据, 执行步骤 509。
这里, 承载板 FRU信息设备数据同步通过 IPMB_L , CAN, 串口及其他总 线实现。
步骤 508 :确定备承载板 FRU信息设备不在位或发生故障,返回步骤 501。 步骤 509 : MCMC按照备承载板 FRU信息设备的 FRU数据配置***设备。 同样, 当 MCMC1和 MCMC2发生主备倒换或者 MCMC2主用时, 从 MCMC2开 始启动, MCMC1为备用, 按照图 5示意流程, 进行倒换控制。 承载板 FRU信 息设备的冗余配置保证了主备 FRU存储设备数据的同步一致性。 同时在主用 承载板 FRU信息设备发生故障时, MCH 不需要启动复杂的主备倒换流程, 增 加***倒换负担,而只需要增加到对板的专用 I2C通道访问对板承载板 FRU信 息设备,降低了***倒换负担及倒换引起的风险,提高 Mi croTCA***可靠性。
当 MCMC校验承载板 FRU信息设备存储的 FRU数据通过后, MCMC首先分析 承载板 FRU信息设备中的承载板 FRU记录。从其中的复合记录( Mul t i Record ) 中提取出 "承载板激活与电源管理记录 ( Activation and Power Management Record)", 根据其中的 "FRU激活与电源控制描述记录( FRU Act ivat ion and Power Descriptor )" 的配置参数, 决定是否激活该承载板 FRU信息设备。 如 果配置参数为允许激活, 则 MCMC通过 IPMB命令发送 Set FRU Activation (Activate FRU)命令激活承载板 FRU信息设备, 该承载板 FRU信息设备进 入激活状态。然后, MCMC比较 MCH、 AMC单板中的 FRU资源信息中各端口能力, 决定 AMC或 MCH星型端口是否使能。 承载板管理器与 AMC上的 MMC模块或者 MCH上的 MCMC模块传递各自对应端口能力信息。 保证只有兼容的端口才能使 能打开。
综上所示, 本发明实施例具有如下优点:
( 1 )提供 MCH通过串行总线对本板及对板 MCH对应的承载板 FRU信息设 备可靠管理方案, 提高***可靠性。
( 2 )提供承载板 FRU信息设备冗余备份同步的过程和方法, 保证承载板 FRU信息设备信息同步。
( 3) 当 MCH对应承载板 FRU信息设备发生故障时, MCH不需要启动复杂 的主备倒换流程, 而只需要通过访问备用承载板 FRU信息设备获取正确的系 统启动信息。 发明的精神和范围。 这样, 倘若本发明的这些修改和变型属于本发明权利要 求及其等同技术的范围之内, 则本发明也意图包含这些改动和变型在内。

Claims

权 利 要求 书
1、 一种小型电信和计算通用硬件平台架构 Mi croTCA ***的可靠性管理的 方法, 所述 M i c r oTCA***包括 Mi croTCA承载管理控制器、 主承载板 FRU信息 设备以及备承载板 FRU信息设备, 其特征在于, 所述方法包括:
确定所述主承载板 FRU信息设备不在位或发生故障, 所述备承载板 FRU信 息设备在位, 并对所述备承载板 FRU信息设备的 FRU数据校验成功, 利用所述 备承载板 FRU信息设备的 FRU数据进行配置处理。
2、 根据权利要求 1所述的方法, 其特征在于, 确定所述主承载板 FRU信息 设备是否发生故障包括:
在主承载板 FRU信息设备在位, 但无法读取主承载板 FRU信息设备的 FRU 数据, 或对所述主承载板 FRU信息设备所保存的信息校验不成功时, 确定主承 载板 FRU信息设备发生故障。
3、 根据权利要求 1所述的方法, 其特征在于, 确定所述主承载板 FRU信息 设备不在位或发生故障, 备承载板 FRU信息设备在位, 并对所述备承载板 FRU 信息设备的 FRU数据校验成功, 利用所述备承载板 FRU信息设备的 FRU数据进 行配置处理后, 该方法进一步包括:
利用所述备承载板 FRU信息设备的 FRU数据更新所述主承载板 FRU信息设 备所保存的 FRU数据。
4、 根据权利要求 1所述的方法, 其特征在于, 所述方法还包括:
当主承载板 FRU信息设备不在位或发生故障时, 所述备承载板 FRU信息设 备不在位或发生故障时, 提示用户***发生故障。
5、 根据权利要求 1所述的方法, 其特征在于, 所述方法还包括: 确定主承 载板 FRU信息设备运行正常时, 利用所述主承载板 FRU信息设备的 FRU数据进 行配置处理。
6、 一种 Mi croTCA***, 包括: Mi croTCA承载管理控制器、 主承载板 FRU 信息设备以及备承载板 FRU信息设备, 其特征在于, 所述 Mi croTCA承载管理控 制器与主承载板 FRU信息设备以及备承载板 FRU信息设备分别相连;
所述主承载板 FRU信息设备, 用于在正常运行时, 向所述 MCMC提供 FRU数 据;
所述备承载板 FRU信息设备, 用于在所述主承载板 FRU信息设备不在位或 发生故障时, 向所述 MCMC提供 FRU数据;
所述 Mi croTCA承载管理控制器, 用于获取 FRU数据, 并利用获取的 FRU数 据进行配置处理。
7、 根据权利要求 6所述的***, 其特征在于, 所述 Mi croTCA承载管理控 制器包括:
数据获取单元(42 ), 用于在主承载板 FRU信息设备运行正常时, 从所述主 承载板 FRU信息设备获取 FRU数据; 在所述主承载板 FRU信息设备不在位或发 生故障时, 从所述备承载板 FRU信息设备获取 FRU数据;
配置单元(43 ), 用于利用获取的 FRU数据进行配置处理。
8、 根据权利要求 7所述的***, 其特征在于, 所述 Mi croTCA承载管理控 制器还包括:
第一检测单元( 41 ), 用于检测所述主承载板 FRU信息设备运行是否正常。
9、 根据权利要求 8所述的***, 其特征在于, 所述 Mi croTCA承载管理控 制器还包括:
第二检测单元(44 ), 用于在所述主承载板 FRU信息设备不在位或发生故障 时, 检测所述备承载板 FRU信息设备是否在位或发生故障;
所述数据获取单元(42 ), 用于在所述备承载板 FRU信息设备在位或没有发 生故障时, 从所述备承载板 FRU信息设备获取 FRU数据。
10、 根据权利要求 9所述的***, 其特征在于, 所述 Mi croTCA承载管理控 制器还包括:
告警单元, 用于在所述备承载板 FRU信息设备不在位或发生故障时, 提示 用户***发生故障。
11、 根据权利要求 6所述的***, 其特征在于, 所述 Mi croTCA承载管理控 制器与备承载板 FRU信息设备通过 I2C总线、 IPMB-L管理总线、 CAN或串口相连。
12、 根据权利要求 6所述的***, 其特征在于, 所述 Mi croTCA承载管理控 制器还包括:
同步更新单元(45 ), 用于当主承载板 FRU信息设备不在位或发生故障时, 利用所述备承载板 FRU信息设备的 FRU数据更新所述主承载板 FRU信息设备所 保存的 FRU数据。
1 3、 一种 Mi croTCA承载管理控制器, 其特征在于, 包括:
数据获取单元(42 ), 用于在主承载板 FRU信息设备运行正常时, 从所述主 承载板 FRU信息设备获取 FRU数据; 在所述主承载板 FRU信息设备不在位或发 生故障时, 从所述备承载板 FRU信息设备获取 FRU数据;
配置单元(43 ), 用于利用获取的 FRU数据进行配置处理。
14、 根据权利要求 1 3所述的控制器, 其特征在于, 所述控制器还包括: 第一检测单元( 41 ), 用于检测所述主承载板 FRU信息设备运行是否正常。
15、 根据权利要求 14所述的控制器, 其特征在于, 所述控制器还包括: 第二检测单元(44 ), 用于在所述主承载板 FRU信息设备不在位或发生故障 时, 检测所述备承载板 FRU信息设备是否在位或发生故障;
所述数据获取单元(42 ), 用于在所述备承载板 FRU信息设备在位或没有发 生故障时, 从所述备承载板 FRU信息设备获取 FRU数据。
16、 根据权利要求 1 3所述的控制器, 其特征在于, 所述控制器还包括: 同步更新单元(45 ), 用于当主承载板 FRU信息设备不在位或发生故障时, 利用所述备承载板 FRU信息设备的 FRU数据更新所述主承载板 FRU信息设备所 保存的 FRU数据。
17、 一种 Mi croTCA***, 包括: Mi croTCA承载管理控制器、 主承载板 FRU 信息设备以及备承载板 FRU信息设备, 其特征在于, 所述 Mi croTCA承载管理控 制器与主承载板 FRU信息设备以及备承载板 FRU信息设备分别相连; 所述主承载板 FRU信息设备, 用于在所述主承载板 FRU信息设备正常运行 时, 向所述 Mi croTCA承载管理控制器提供 FRU数据;
所述备承载板 FRU信息设备, 用于在所述主承载板 FRU信息设备不在位或 发生故障时, 所述备承载板 FRU信息设备在位, 所述备承载板 FRU信息设备的
FRU数据校验成功, 向所述 Mi croTCA承载管理控制器提供 FRU数据;
所述 Mi croTCA承载管理控制器, 用于获取 FRU数据, 并利用获取的 FRU数 据进行配置处理。
18、 根据权利要求 17所述的***, 其特征在于, 所述 Mi croTCA承载管理 控制器包括:
数据获取单元(42 ), 用于在主承载板 FRU信息设备运行正常时, 从所述主 承载板 FRU信息设备获取 FRU数据; 在所述主承载板 FRU信息设备不在位或发 生故障时, 所述备承载板 FRU信息设备在位, 并对所述备承载板 FRU信息设备 的 FRU数据校验成功, 从所述备承载板 FRU信息设备获取 FRU数据;
配置单元(43 ), 用于利用获取的 FRU数据进行配置处理。
19、 根据权利要求 18所述的***, 其特征在于, 所述 Mi croTCA承载管理 控制器还包括:
第一检测单元( 41 ), 用于检测所述主承载板 FRU信息设备运行是否正常。
20、 根据权利要求 19所述的***, 其特征在于, 所述 Mi croTCA承载管理 控制器还包括:
第二检测单元(44 ), 用于在所述主承载板 FRU信息设备不在位或发生故障 时, 检测所述备承载板 FRU信息设备是否在位或发生故障;
所述数据获取单元(42 ), 用于在所述备承载板 FRU信息设备在位或没有发 生故障时, 所述备承载板 FRU信息设备的 FRU数据校验成功, 从所述备承载板 FRU信息设备获取 FRU数据。
21、 根据权利要求 20所述的***, 其特征在于, 所述 Mi croTCA承载管理 控制器还包括:
告警单元, 用于在所述备承载板 FRU信息设备不在位或发生故障时, 提示 用户***发生故障。
22、 根据权利要求 17所述的***, 其特征在于, 所述 Mi croTCA承载管理 控制器与备承载板 FRU信息设备通过 I2C总线或 IPMB-L管理总线或 CAN或串口 相连。
23、 根据权利要求 17所述的***, 其特征在于, 所述 Mi croTCA承载管理 控制器还包括:
同步更新单元, 用于当主承载板 FRU信息设备不在位或发生故障时, 所述 备承载板 FRU信息设备在位, 并对所述备承载板 FRU信息设备的 FRU数据校验 成功, 利用所述备承载板 FRU信息设备的 FRU数据更新所述主承载板 FRU信息 设备所保存的 FRU数据。
24、 一种 Mi croTCA承载管理控制器, 其特征在于, 包括:
数据获取单元(42 ), 用于在主承载板 FRU信息设备运行正常时, 从所述主 承载板 FRU信息设备获取 FRU数据; 在所述主承载板 FRU信息设备不在位或发 生故障时,备承载板 FRU信息设备在位, 并对所述备承载板 FRU信息设备的 FRU 数据校验成功, 从所述备承载板 FRU信息设备获取 FRU数据;
配置单元(43 ), 用于利用获取的 FRU数据进行配置处理。
25、 根据权利要求 24所述的控制器, 其特征在于, 所述控制器还包括: 第一检测单元( 41 ), 用于检测所述主承载板 FRU信息设备运行是否正常。
26、 根据权利要求 25所述的控制器, 其特征在于, 所述控制器还包括: 第二检测单元(44 ), 用于在所述主承载板 FRU信息设备不在位或发生故障 时, 检测所述备承载板 FRU信息设备是否在位或发生故障;
所述数据获取单元(42 ), 用于在所述备承载板 FRU信息设备在位或没有发 生故障, 并对所述备承载板 FRU信息设备的 FRU数据校验成功, 从所述备承载 板 FRU信息设备获取 FRU数据。
27、 根据权利要求 24所述的控制器, 其特征在于, 所述控制器还包括: 同步更新单元(45 ), 用于当主承载板 FRU信息设备不在位或发生故障时, 所述备承载板 FRU信息设备在位, 并对所述备承载板 FRU信息设备的 FRU数据 校验成功, 利用所述备承载板 FRU信息设备的 FRU数据更新所述主承载板 FRU 信息设备所保存的 FRU数据。
PCT/CN2008/072689 2007-10-16 2008-10-15 Système de microarchitecture informatique pour les télécommunications et procédé pour sa gestion de fiabilité WO2009052741A1 (fr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2007101631951A CN101415127B (zh) 2007-10-16 2007-10-16 小型电信和计算通用硬件平台架构***及可靠性管理方法
CN200710163195.1 2007-10-16

Publications (1)

Publication Number Publication Date
WO2009052741A1 true WO2009052741A1 (fr) 2009-04-30

Family

ID=40579083

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2008/072689 WO2009052741A1 (fr) 2007-10-16 2008-10-15 Système de microarchitecture informatique pour les télécommunications et procédé pour sa gestion de fiabilité

Country Status (2)

Country Link
CN (1) CN101415127B (zh)
WO (1) WO2009052741A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108462529A (zh) * 2018-04-27 2018-08-28 上海欣诺通信技术股份有限公司 主备板卡切换方法、光传送网络设备及存储介质

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102385566B (zh) * 2010-09-01 2016-05-04 研祥智能科技股份有限公司 一种基于mtca平台的热插拔方法及mtca平台
CN101958806A (zh) * 2010-10-12 2011-01-26 艾诺通信***(苏州)有限责任公司 一种实现MicroTCA***MCH网口备份的模块及其方法
CN102325040A (zh) * 2011-06-27 2012-01-18 艾诺通信***(苏州)有限责任公司 一种基于MicroTCA***的电源管理方法
CN103838639B (zh) * 2012-11-23 2018-04-27 华为技术有限公司 一种恢复虚拟磁盘元数据的方法、装置及***
CN105511921A (zh) * 2015-12-09 2016-04-20 浪潮电子信息产业股份有限公司 一种保障fru中写入资产编码为大写的方法
CN111177043B (zh) * 2019-12-26 2021-07-06 苏州浪潮智能科技有限公司 加快读取现场可更换单元信息的方法、***、设备及介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1393748A (zh) * 2001-06-22 2003-01-29 华为技术有限公司 主备电路倒换设备及其方法
CN1756107A (zh) * 2004-09-28 2006-04-05 华为技术有限公司 一种实现单板倒换的方法
WO2007089993A2 (en) * 2006-01-31 2007-08-09 Emerson Network Power - Embedded Computing, Inc. Method of latent fault checking a management network

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1393748A (zh) * 2001-06-22 2003-01-29 华为技术有限公司 主备电路倒换设备及其方法
CN1756107A (zh) * 2004-09-28 2006-04-05 华为技术有限公司 一种实现单板倒换的方法
WO2007089993A2 (en) * 2006-01-31 2007-08-09 Emerson Network Power - Embedded Computing, Inc. Method of latent fault checking a management network

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
PICMG@ MTCA.0 R1.0 MICRO TELECOMMUNICATIONS COMPUTING ARCHITECTURE SHORT FORM SPECIFICATION, 21 September 2006 (2006-09-21), pages 8 - 10, 21-2 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108462529A (zh) * 2018-04-27 2018-08-28 上海欣诺通信技术股份有限公司 主备板卡切换方法、光传送网络设备及存储介质
CN108462529B (zh) * 2018-04-27 2023-12-19 上海欣诺通信技术股份有限公司 主备板卡切换方法、光传送网络设备及存储介质

Also Published As

Publication number Publication date
CN101415127A (zh) 2009-04-22
CN101415127B (zh) 2011-07-27

Similar Documents

Publication Publication Date Title
US9734093B2 (en) Management of secured storage devices in an information handling system
WO2009052741A1 (fr) Système de microarchitecture informatique pour les télécommunications et procédé pour sa gestion de fiabilité
US8707290B2 (en) Firmware update in an information handling system employing redundant management modules
US9189349B2 (en) Distributed blade server system, management server and switching method
TW202041061A (zh) 用於組態漂移偵測及補救之系統及方法
US20070220301A1 (en) Remote access control management module
CN104598329A (zh) 一种基于rmc管理的自动bmc故障解决方法
CN101483540A (zh) 一种高端数据通信设备中的主备倒换方法
US10862900B2 (en) System and method for detecting rogue devices on a device management bus
JP5515766B2 (ja) 情報処理装置、情報処理装置のハードウェア設定方法及びそのプログラム
CN106936616A (zh) 备份通信方法和装置
CN114116280B (zh) 交互式bmc自恢复方法、***、终端及存储介质
CN111585835B (zh) 一种带外管理***的控制方法、装置和存储介质
CN105549696B (zh) 具有机箱管理功能的机架式服务器***
CN112868013B (zh) 经由边带接口恢复场域可程序门阵列固件的***及方法
TW200301418A (en) Computer system with dedicated system management buses
CN116483613B (zh) 故障内存条的处理方法及装置、电子设备及存储介质
US8522075B2 (en) Storage system having storage devices for storing data and control devices for controlling the storage devices
CN113076210A (zh) 服务器故障诊断结果通知方法、***、终端及存储介质
CN111352662A (zh) 一种服务器启动顺序控制方法、***、终端及存储介质
WO2021238579A1 (zh) 存储***管理sata硬盘的方法及存储***
CN114124803B (zh) 设备管理方法、装置、电子设备及存储介质
CN115309577A (zh) 一种嵌入式装置及其启动及恢复方法
WO2021159897A1 (zh) 故障通知方法及相关设备
US8775695B2 (en) Specific identification information management device, information processing device, and specific identification information setting method

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 08843276

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 08843276

Country of ref document: EP

Kind code of ref document: A1