CN108616428A - 一种远程管理rack机房的移动app实施方法 - Google Patents

一种远程管理rack机房的移动app实施方法 Download PDF

Info

Publication number
CN108616428A
CN108616428A CN201810455648.6A CN201810455648A CN108616428A CN 108616428 A CN108616428 A CN 108616428A CN 201810455648 A CN201810455648 A CN 201810455648A CN 108616428 A CN108616428 A CN 108616428A
Authority
CN
China
Prior art keywords
mobile app
host
cabinet
rmc
error
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810455648.6A
Other languages
English (en)
Inventor
刘东伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201810455648.6A priority Critical patent/CN108616428A/zh
Publication of CN108616428A publication Critical patent/CN108616428A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/02Details
    • H04L12/12Arrangements for remote connection or disconnection of substations or of equipment thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/02Standardisation; Integration
    • H04L41/0246Exchanging or transporting network management information using the Internet; Embedding network management web servers in network elements; Web-services-based protocols
    • H04L41/0266Exchanging or transporting network management information using the Internet; Embedding network management web servers in network elements; Web-services-based protocols using meta-data, objects or commands for formatting management information, e.g. using eXtensible markup language [XML]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/22Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks comprising specially adapted graphical user interfaces [GUI]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种远程管理RACK机房的移动APP实施方法,通过移动APP实现对RACK机房中各RACK机柜进行运行状态监控和故障定位,并针对故障通过移动APP进行应急操作的方法。本发明的一种远程管理RACK机房的移动APP实施方法和现有技术相比,为客户提供一种移动APP监控机房实时状态并进行一定操作的便捷方案,提高了机房业务运行稳定性以及对突发状况的响应速度。

Description

一种远程管理RACK机房的移动APP实施方法
技术领域
本发明涉及机柜技术领域,具体地说是一种远程管理RACK机房的移动APP实施方法。
背景技术
一个机房中的RACK 整机众多,每个机柜中RACK 节点数量也较多,在客户正常使用过程中,某些机柜和节点可能出现各种各样的问题,如何能够实时并方便的监控整机以及各节点的运行状态变显得尤为重要。随着智能手机的不断普及,各种APP 应运而生。借助移动APP 相关架构的不断完善,开发一个实时高效快捷方便的移动APP对机房进行实时监控便成为了一种可能。
发明内容
本发明的技术任务是针对以上不足之处,提供一种能够实时监控机柜运行状态、及时发现机柜故障并能采取应急操作的一种远程管理RACK机房的移动APP实施方法。
本发明解决其技术问题所采用的技术方案是: 一种远程管理RACK机房的移动APP实施方法,通过移动APP实现对RACK机房中各RACK机柜进行运行状态监控和故障定位,并针对故障通过移动APP进行应急操作的方法。
进一步,优选的方法为,步骤如下:
环境配置,搭建一个Host主机,以使得Host主机实现与移动APP进行数据交互,并实现接收RMC与BMC的***日志;
Host主机实时接收RMC与BMC的***日志,并判断***日志内是否有报错;
若无报错,则持续实时监控;
若有报错,则把报错信息传递至移动APP;
在移动APP上进行对相关机柜进行应急操作。
进一步,优选的方法为,详细的操作步骤如下:
S110、搭建一个Host主机,将各机柜的RMC及节点的BMC IP导入Host主机程序;
S120、将Host主机与外部网络连通,并在Host主机内搭建和移动APP互通的网络架构;
S130、将各机柜的RMC及节点的BMC的***日志IP设置为Host主机的IP;
S210、Host主机实时接收RMC与BMC的***日志,并判断***日志内是否有报错;
S220、若无报错,则持续实时监控;
S230、若出现报错,则利用通讯软件将报错信息传递到移动APP;
S240、移动APP实时出现故障信息提示;
S310、在移动APP上对相关机柜进行应急操作;
S320、Host主机响应移动APP命令,通过IPMI 命令对相关机柜的RMC和节点的BMC进行操作;
S330、相关机柜的RMC和节点的BMC响应命令,执行操作;
S340、移动APP获取相关机柜和节点的相应的状态,并在移动APP页面显示。
进一步,优选的方法为,所述的应急操作包括关掉节点、关掉电源、重启节点、调整风扇转速。
一种远程管理RACK机房的移动APP,包括运行状态监控单元、故障报错单元及应急操作单元;
所述的运行状态监控单元,用于实时监控各机柜的运行状态;
所述的故障报错单元,用于接收故障提示,并对故障进行定位;
所述的应急操作单元,用于对故障机柜进行应急操作。
进一步,优选的结构为,所述的移动APP通过IPMI命令从RMC获取各机柜状态,并将各机柜状态实时显示在移动APP应用界面上。
进一步,优选的结构为,所述的各机柜状态包括整机电源状态、节点状态、风扇运行状态。
本发明的一种远程管理RACK机房的移动APP实施方法和现有技术相比,有益效果如下:
1、实现随时随地通过移动设备监控机房RACK机柜的运行状态;
2、当机房内的RACK机柜或者节点出现故障时,移动APP会立刻进行故障信息提示;
3、当机房内的RACK机柜或者节点出现故障时,移动APP能够实现迅速定位;
4、移动APP能够根据故障信息,进行相应的应急操作;
5、通过移动APP方式实现对RACK机房的远程管理,操作简单,使用方便。
附图说明
下面结合附图对本发明进一步说明。
附图1为一种远程管理RACK机房的移动APP实施方法的原理框图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明。
本发明为一种远程管理RACK机房的移动APP实施方法,利用一个实时高效快捷方便的移动APP对机房进行实时监控。为客户提供一种移动APP监控机房实时状态并进行一定操作的便捷方案。提高了机房业务运行稳定性以及对突发状况的响应速度。
其中,RMC(Rack Management Controller)Rack机柜管理模块;BMC(BaseboardManagement Controller)主板监控管理模块;IPMI(Intelligent Platform ManagementInterface)智能平台管理接口;PSU (power supply unit)服务器的电源装置组件。
实施例1:
一、环境配置:
搭建一个Host 主机,确保Host主机和机房内各RMC以及各个节点的BMC IP 能够连通。
Host 主机连接外部网络,Host主机内搭建和移动APP 互通的网络架构,确保能够和移动APP 进行数据交互。
将所有机柜RMC以及所有节点的syslog server (***日志)IP 设置为Host主机的IP,配置Host主机syslog (***日志)服务器,确保Host主机能够接收到RMC以及BMC下的log(***日志)。将所有机柜的RMC、BMC IP 配置到Host主机相关程序中,当接收到某个机柜出问题后能够通过syslog server 的接收到的异常log的IP迅速找到到对应机柜和节点的位置.通过IP 能够通过RMC IPMI 命令获取机柜Location:
例如:当收到如下rmc的log的时候:
Apr 22 14:40:14 192.168.1.251 212111001: crtical FCB 5 fan control modechange to manual
通过如下命令获取到RMC 的IP :192.168.1.251
RMC_IP=`cat ip.txt |awk -F " " '{print $4}'|tr -d "\r"" ""\n"`
然后通过IPMI命令.获取到RMC 的location确定机柜的位置:
机柜location 获取命令:ipmitool -I lan -H 192.168.1.251 -U admin -P adminraw 0x3e 0x01 0x01 0x00
通常情况下,在机柜运行过程中,一旦RMC和BMC在log中出现error、fail等报错就表明机柜或节点存在问题,那么实时上报测试fail信息就显得很有必要。 Host 主机不间断的cat /var/log/messages 下接收到的RMC和BMC 日志,一旦log中出现报错,立即将报错信息打包并通过实时通讯工具iptux传递到移动APP,移动APP 会出现提示信息。
移动APP通过IPMI 命令,可以看到机柜位置,然后点击进入机柜布局图,App端可以生动显示出现问题的部件,APP 上会有红灯闪烁提示。
根据APP 收到的locaiton 信息,定位机柜位置,通过IPMI命令实时刷新机柜health 状态,更具状态显示,通过APP上的按钮进行相关操作。例如当收到机柜Node10AFail 的消息,可以通过APP 上的按钮临时重启node10A,APP上重启node10A具体实施方法是通过让Host 主机执行如下IPMI带外命令:
ipmitool -I lanplus -H 10.65.11.22 chassis power reset
在APP 上进行可以触摸进行相关功能的操作,比如开关机PSU、调整FAN(风扇)转速、开关机节点、Reset(重启) 节点BMC 等应急操作。保证机房遇到问题能够做临时紧急处理,提高业务稳定性。
APP 可以通过Host主机,通过带外IPMI命令从RMC 获取整机电源、节点、风扇状态,并实时显示在APP 应用界面上。Host端通过IPMI命令获取到对应机柜和节点的健康状态,根据具体的返回值确定部件状态是Ok还是Fail。
本发明为一种远程管理RACK机房的移动APP实施方法,提供了一种更加高效、更加方便、实时不间断地对RACK机房各机柜进行长时间监控以及操作的移动APP实施方法。
本发明还包括一种远程管理RACK机房的移动APP,包括运行状态监控单元、故障报错单元及应急操作单元;
所述的运行状态监控单元,用于实时监控各机柜的运行状态;
所述的故障报错单元,用于接收故障提示,并对故障进行定位;
所述的应急操作单元,用于对故障机柜进行应急操作。
所述的移动APP通过IPMI命令从RMC获取各机柜状态,并将各机柜状态实时显示在移动APP应用界面上。所述的各机柜状态包括整机电源状态、节点状态、风扇运行状态。
通过上面具体实施方式,所述技术领域的技术人员可容易的实现本发明。但是应当理解,本发明并不限于上述的几种具体实施方式。在公开的实施方式的基础上,所述技术领域的技术人员可任意组合不同的技术特征,从而实现不同的技术方案。

Claims (7)

1.一种远程管理RACK机房的移动APP实施方法,其特征在于,通过移动APP实现对RACK机房中各RACK机柜进行运行状态监控和故障定位,并针对故障通过移动APP进行应急操作的方法。
2.根据权利要求1所述的一种远程管理RACK机房的移动APP实施方法,其特征在于,步骤如下:
环境配置,搭建一个Host主机,以使得Host主机实现与移动APP进行数据交互,并实现接收RMC与BMC的***日志;
Host主机实时接收RMC与BMC的***日志,并判断***日志内是否有报错;
若无报错,则持续实时监控;
若有报错,则把报错信息传递至移动APP;
在移动APP上进行对相关机柜进行应急操作。
3.根据权利要求2所述的一种远程管理RACK机房的移动APP实施方法,其特征在于,详细的操作步骤如下:
S110、搭建一个Host主机,将各机柜的RMC及节点的BMC IP导入Host主机程序;
S120、将Host主机与外部网络连通,并在Host主机内搭建和移动APP互通的网络架构;
S130、将各机柜的RMC及节点的BMC的***日志IP设置为Host主机的IP;
S210、Host主机实时接收RMC与BMC的***日志,并判断***日志内是否有报错;
S220、若无报错,则持续实时监控;
S230、若出现报错,则利用通讯软件将报错信息传递到移动APP;
S240、移动APP实时出现故障信息提示;
S310、在移动APP上对相关机柜进行应急操作;
S320、Host主机响应移动APP命令,通过IPMI 命令对相关机柜的RMC和节点的BMC进行操作;
S330、相关机柜的RMC和节点的BMC响应命令,执行操作;
S340、移动APP获取相关机柜和节点的相应的状态,并在移动APP页面显示。
4.根据权利要求1或3所述的一种远程管理RACK机房的移动APP实施方法,其特征在于,所述的应急操作包括关掉节点、关掉电源、重启节点、调整风扇转速。
5.一种远程管理RACK机房的移动APP,其特征在于,包括运行状态监控单元、故障报错单元及应急操作单元;
所述的运行状态监控单元,用于实时监控各机柜的运行状态;
所述的故障报错单元,用于接收故障提示,并对故障进行定位;
所述的应急操作单元,用于对故障机柜进行应急操作。
6.根据权利要求5所述的一种远程管理RACK机房的移动APP,其特征在于,所述的移动APP通过IPMI命令从RMC获取各机柜状态,并将各机柜状态实时显示在移动APP应用界面上。
7.根据权利要求6所述的一种远程管理RACK机房的移动APP,其特征在于,所述的各机柜状态包括整机电源状态、节点状态、风扇运行状态。
CN201810455648.6A 2018-05-14 2018-05-14 一种远程管理rack机房的移动app实施方法 Pending CN108616428A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810455648.6A CN108616428A (zh) 2018-05-14 2018-05-14 一种远程管理rack机房的移动app实施方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810455648.6A CN108616428A (zh) 2018-05-14 2018-05-14 一种远程管理rack机房的移动app实施方法

Publications (1)

Publication Number Publication Date
CN108616428A true CN108616428A (zh) 2018-10-02

Family

ID=63663108

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810455648.6A Pending CN108616428A (zh) 2018-05-14 2018-05-14 一种远程管理rack机房的移动app实施方法

Country Status (1)

Country Link
CN (1) CN108616428A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109587282A (zh) * 2018-11-12 2019-04-05 郑州云海信息技术有限公司 一种面向sr整机柜自动化配置节点ip的方法和***
CN109597475A (zh) * 2018-12-03 2019-04-09 郑州云海信息技术有限公司 一种服务器电源信息处理方法、装置及***
TWI698741B (zh) * 2019-01-02 2020-07-11 營邦企業股份有限公司 運用於資料中心的機櫃異常狀態的遠端排除方法
CN111416721A (zh) * 2019-01-04 2020-07-14 营邦企业股份有限公司 运用于数据中心的机柜异常状态的远端排除方法
CN111414274A (zh) * 2019-01-04 2020-07-14 营邦企业股份有限公司 运用于数据中心的机柜异常状态的远端排除方法
US10754722B1 (en) 2019-03-22 2020-08-25 Aic Inc. Method for remotely clearing abnormal status of racks applied in data center

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104618193A (zh) * 2015-02-15 2015-05-13 浪潮电子信息产业股份有限公司 一种服务器监控管理方法
CN105023334A (zh) * 2015-08-10 2015-11-04 广东文城科技发展有限公司 一种基于云平台与手机app的控制开关锁方法
CN105357064A (zh) * 2015-12-15 2016-02-24 山东海量信息技术研究院 一种高端容错服务器的节点故障记录方法
CN105577430A (zh) * 2015-12-15 2016-05-11 山东海量信息技术研究院 一种高端容错服务器的节点管理方法
CN107907762A (zh) * 2017-11-09 2018-04-13 郑州云海信息技术有限公司 一种检验bbu对整机柜稳定性影响的测试方法和***
CN107958337A (zh) * 2017-12-07 2018-04-24 国网江西省电力有限公司信息通信分公司 一种信息资源可视化移动管理***

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104618193A (zh) * 2015-02-15 2015-05-13 浪潮电子信息产业股份有限公司 一种服务器监控管理方法
CN105023334A (zh) * 2015-08-10 2015-11-04 广东文城科技发展有限公司 一种基于云平台与手机app的控制开关锁方法
CN105357064A (zh) * 2015-12-15 2016-02-24 山东海量信息技术研究院 一种高端容错服务器的节点故障记录方法
CN105577430A (zh) * 2015-12-15 2016-05-11 山东海量信息技术研究院 一种高端容错服务器的节点管理方法
CN107907762A (zh) * 2017-11-09 2018-04-13 郑州云海信息技术有限公司 一种检验bbu对整机柜稳定性影响的测试方法和***
CN107958337A (zh) * 2017-12-07 2018-04-24 国网江西省电力有限公司信息通信分公司 一种信息资源可视化移动管理***

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109587282A (zh) * 2018-11-12 2019-04-05 郑州云海信息技术有限公司 一种面向sr整机柜自动化配置节点ip的方法和***
CN109587282B (zh) * 2018-11-12 2022-02-18 郑州云海信息技术有限公司 一种面向sr整机柜自动化配置节点ip的方法和***
CN109597475A (zh) * 2018-12-03 2019-04-09 郑州云海信息技术有限公司 一种服务器电源信息处理方法、装置及***
TWI698741B (zh) * 2019-01-02 2020-07-11 營邦企業股份有限公司 運用於資料中心的機櫃異常狀態的遠端排除方法
CN111416721A (zh) * 2019-01-04 2020-07-14 营邦企业股份有限公司 运用于数据中心的机柜异常状态的远端排除方法
CN111414274A (zh) * 2019-01-04 2020-07-14 营邦企业股份有限公司 运用于数据中心的机柜异常状态的远端排除方法
US10754722B1 (en) 2019-03-22 2020-08-25 Aic Inc. Method for remotely clearing abnormal status of racks applied in data center

Similar Documents

Publication Publication Date Title
CN108616428A (zh) 一种远程管理rack机房的移动app实施方法
CN104104543B (zh) 一种基于snmp和ipmi协议的服务器管理***及方法
CN104363117A (zh) 一种基于ipmi实现串口重定向的方法
US20070220301A1 (en) Remote access control management module
US20030158933A1 (en) Failover clustering based on input/output processors
EP2853962B1 (en) Identification method for pan-tilt apparatus, pan-tilt apparatus, camera and control system for pan-tilt apparatus
WO2015184866A1 (zh) 一种监控方法、装置及电源***中的第一监控单元
US11792098B2 (en) Link detection method and system
US20140189103A1 (en) System for monitoring servers and method thereof
US9535482B2 (en) Methods, systems, and computer readable media for controlling processor card power consumption in a network test equipment chassis that includes a plurality of processor cards
CN109240851A (zh) 一种自主式实现批量bmc自恢复的方法及***
CN110691398A (zh) 智能设备的网络交互方法、***、设备及存储介质
CN109840186A (zh) 一种数据中心健康管理***及方法
CN106407081B (zh) 一种机箱管理***及服务器
CN109766110A (zh) 一种控制方法、基板管理控制器及控制***
CN113176982A (zh) 一种基于vpx架构机箱管理***的实现装置及方法
CN115599617B (zh) 总线检测方法、装置、服务器及电子设备
CN115190046B (zh) 一种服务器集群的检测方法、检测装置及计算设备
CN104980495B (zh) 通用化设备综合管理器
TWI698741B (zh) 運用於資料中心的機櫃異常狀態的遠端排除方法
CN115220974A (zh) 一种操作***网络信息动态检查***、方法、装置及介质
TWI685740B (zh) 運用於資料中心的機櫃異常狀態的遠端排除方法(一)
CN114095343A (zh) 基于双活***的容灾方法、装置、设备及存储介质
CN107273272A (zh) 一种热插拔设备的监控方法及装置
CN108363378B (zh) 显示装置的控制板工作状态智能检测***及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181002