CN105743707A - 一种基于Redhat***测试BMC日志解析功能的方法 - Google Patents

一种基于Redhat***测试BMC日志解析功能的方法 Download PDF

Info

Publication number
CN105743707A
CN105743707A CN201610199799.0A CN201610199799A CN105743707A CN 105743707 A CN105743707 A CN 105743707A CN 201610199799 A CN201610199799 A CN 201610199799A CN 105743707 A CN105743707 A CN 105743707A
Authority
CN
China
Prior art keywords
bmc
daily record
ipmitool
server
main frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610199799.0A
Other languages
English (en)
Inventor
李萌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN201610199799.0A priority Critical patent/CN105743707A/zh
Publication of CN105743707A publication Critical patent/CN105743707A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0823Errors, e.g. transmission errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2205Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/26Functional testing
    • G06F11/263Generation of test inputs, e.g. test vectors, patterns or sequences ; with adaptation of the tested hardware for testability with external testers
    • G06F11/2635Generation of test inputs, e.g. test vectors, patterns or sequences ; with adaptation of the tested hardware for testability with external testers using a storage for the test inputs, e.g. test ROM, script files
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0695Management of faults, events, alarms or notifications the faulty arrangement being the maintenance, administration or management system
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Environmental & Geological Engineering (AREA)
  • Debugging And Monitoring (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明公开一种基于Redhat***测试BMC日志解析功能的方法,属于***测试管理领域;本发明测试方法可以验证BMC解析memory,QPI,PCIE错误是否正常,BMC解析日志功能需要BIOS支持,本发明利用ipmitool模拟BIOS输出错误信息到BMC,BMC可以详细解析错误内容,通过判断解析结果是否与期望结果相同,来判定BMC日志错误解析功能是否正常,提高服务器的可用性以及易用性并且提高用户满意度。为进一步对服务器在运行过程中出现的问题进行准确定位。从测试服务器稳定性方面,可以更快更准确更直观的定位问题,节省大量问题定位分析时间。

Description

一种基于Redhat***测试BMC日志解析功能的方法
技术领域
本发明公开一种基于Redhat***测试BMC日志解析功能的方法,属于***测试管理领域。
背景技术
基板管理控制器BMC,是IPMI的核心,即一个专用控制器,这个控制器一般安装在***主板或刀片上,IPMI与BMC一起构成子管理***,对不论***,处理器,BIOS,操作***等的状态如何,都能提供可管理性和监测功能。
通过BMC,不仅已经实现温度、电压、风扇、电源等状态的监控,内存,PCIE,QPI报错也已经能够通过BMC解析。服务器发展到现在已经十分稳定,但是在长时间运行过程中,难免会出现硬件老化,损坏等故障,当某些硬件设备出现故障时,可以通过BMC查看到相关故障日志,更快的定位问题,分析原因,更换部件等。但是实际应用中,由于机器老化,环境等因素,会有极小概率出现,当这些错误出现时,需要准确定位问题十分困难,因此有必要对BMC日志解析功能进行测试,查看BMC此功能是否完善。本发明提供一种基于Redhat***测试BMC日志解析功能的方法,测试BMC对内存,PCIE,QPI报错的日志解析功能是否正常,并且能够实现测试BMC支持日志容量。
发明内容
本发明提供一种基于Redhat***测试BMC日志解析功能的方法,测试BMC是否能够正确解析相关日志报错,若该功能正常,可以大幅提高服务器的可用性以及易用性并且提高用户满意度。
本发明提出的具体方案是:
一种基于Redhat***测试BMC日志解析功能的方法,测试主机在Redhat***下,利用ipmitool模拟BIOS输出错误信息到服务器BMC,由BMC进行解析,通过判断解析结果是否与期望结果相同,来判定BMC日志错误解析功能是否正常,具体步骤为:
测试主机安装Redhat操作***及网卡;
进入操作***,使用root用户登录;
打开终端,执行serviceipmistart命令;
连接测试主机与服务器BMC管理接口,配置测试主机的IP地址,与BMC通信;
修改测试脚本中BMCIP地址,保存并执行脚本;
查看BMC日志,判断BMC解析结果是否与期望结果相同。
对BMC日志量设置最大容量,达到最大容量后,若日志数量继续增加,则最初日志被覆盖。
ipmitool通过相应的interface访问BMC,命令包含的接口有open、lan,open是指OpenIPMI与BMC通信,Lan通过EthernetLAN网与BMC通信。
ipmitool与BMC通信中ipmi命令基本格式为:
ipmitool-HIP-U***-P***-Ilanraw
其中-H为BMC接收IPMI命令的IP地址,-U***为登陆BMC的用户名,-P***为登陆BMC的用户密码,lan配置网络信道,raw发送一个原始的IPMI请求。
本发明的有益之处是:
本发明测试方法可以验证BMC解析memory,QPI,PCIE错误是否正常,BMC解析日志功能需要BIOS支持,本发明利用ipmitool模拟BIOS输出错误信息到BMC,BMC可以详细解析错误内容,通过判断解析结果是否与期望结果相同,来判定BMC日志错误解析功能是否正常,提高服务器的可用性以及易用性并且提高用户满意度。为进一步对服务器在运行过程中出现的问题进行准确定位。从测试服务器稳定性方面,可以更快更准确更直观的定位问题,节省大量问题定位分析时间。
附图说明
图1本发明方法流程示意图。
具体实施方式
一种基于Redhat***测试BMC日志解析功能的方法,测试主机在Redhat***下,利用ipmitool模拟BIOS输出错误信息到服务器BMC,由BMC进行解析,通过判断解析结果是否与期望结果相同,来判定BMC日志错误解析功能是否正常,具体步骤为:
测试主机安装Redhat操作***及网卡;
进入操作***,使用root用户登录;
打开终端,执行serviceipmistart命令;
连接测试主机与服务器BMC管理接口,配置测试主机的IP地址,与BMC通信;
修改测试脚本中BMCIP地址,保存并执行脚本;
查看BMC日志,判断BMC解析结果是否与期望结果相同。
根据上述方法及发明内容,结合附图对本发明做进一步说明。
一种基于Redhat***测试BMC日志解析功能的方法,测试主机在Redhat***下,利用ipmitool模拟BIOS输出错误信息到服务器BMC,由BMC进行解析,通过判断解析结果是否与期望结果相同,来判定BMC日志错误解析功能是否正常,具体步骤为:
(1)测试主机安装Redhat6.4操作***及网卡;
(2)进入操作***,使用root用户登录;
(3)打开终端,执行serviceipmistart命令:
Startingipmidrivers:[OK]
或者启动模块:
modprobeipmi_msghandler
modprobeipmi_devintf
modprobeipmi_si
modprobeipmi_poweroff
modprobeipmi_watchdog;
(4)连接测试主机与服务器BMC管理接口,配置测试主机的IP地址,与BMC通信;
其中ipmitool通过相应的interface访问BMC,命令包含的主要接口有open、lan,open是指OpenIPMI与BMC通信,Lan通过EthernetLAN网用IPV4的udp协议与BMC通信,具体地UDP的数据段包含了IPMIrequest/resoponse消息,消息具有一个IPMIsession头和RMCP头,RMCP把把数据发送到UDP的623端口,从而实现通信;
(5)修改测试脚本中BMCIP地址,保存并执行脚本;
Localhost#./add_sel1
Localhost#sendingtheeventlog1
0100
0200
0300
(6)查看BMC日志,判断BMC解析结果是否与期望结果相同,可以登陆BMCweb界面,查看eventlog选项,若解析正常则eventlog中会有如下日志:
SystemMemorySOCKET:1MEMcontroller:1DDRchannel:2DIMM:3-Asserted
(7)可对BMC日志量设置最大容量,达到最大容量后,若日志数量继续增加,则最初日志被覆盖,如执行./add_sel1000,该命令实现1000次memory,PCIE以及QPI错误解析,即执行完毕后,会产生3000条日志,当查看日志记录,是否达到最大容量,若没有达到最大容量,则继续执行./add_sel,直至达到最大日志容量,进行覆盖。当然,也可以对BMC日志量设置最大容量,达到最大容量后,日志不再记录,则日志数量固定在最大容量,不再更新。

Claims (4)

1.一种基于Redhat***测试BMC日志解析功能的方法,其特征是测试主机在Redhat***下,利用ipmitool模拟BIOS输出错误信息到服务器BMC,由BMC进行解析,通过判断解析结果是否与期望结果相同,来判定BMC日志错误解析功能是否正常,具体步骤为:
测试主机安装Redhat操作***及网卡;
进入操作***,使用root用户登录;
打开终端,执行serviceipmistart命令;
连接测试主机与服务器BMC管理接口,配置测试主机的IP地址,与BMC通信;
修改测试脚本中BMCIP地址,保存并执行脚本;
查看BMC日志,判断BMC解析结果是否与期望结果相同。
2.根据权利要求1所述的方法,其特征是对BMC日志量设置最大容量,达到最大容量后,若日志数量继续增加,则最初日志被覆盖。
3.根据权利要求1或2所述的方法,其特征是ipmitool通过相应的interface访问BMC,命令包含的接口有open、lan,open是指OpenIPMI与BMC通信,Lan通过EthernetLAN网与BMC通信。
4.根据权利要求3所述的方法,其特征是ipmitool与BMC通信中ipmi命令基本格式为:
ipmitool-HIP-U***-P***-Ilanraw
其中-H为BMC接收IPMI命令的IP地址,-U***为登陆BMC的用户名,-P***为登陆BMC的用户密码,lan配置网络信道,raw发送一个原始的IPMI请求。
CN201610199799.0A 2016-04-01 2016-04-01 一种基于Redhat***测试BMC日志解析功能的方法 Pending CN105743707A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610199799.0A CN105743707A (zh) 2016-04-01 2016-04-01 一种基于Redhat***测试BMC日志解析功能的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610199799.0A CN105743707A (zh) 2016-04-01 2016-04-01 一种基于Redhat***测试BMC日志解析功能的方法

Publications (1)

Publication Number Publication Date
CN105743707A true CN105743707A (zh) 2016-07-06

Family

ID=56252582

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610199799.0A Pending CN105743707A (zh) 2016-04-01 2016-04-01 一种基于Redhat***测试BMC日志解析功能的方法

Country Status (1)

Country Link
CN (1) CN105743707A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107656848A (zh) * 2017-09-22 2018-02-02 郑州云海信息技术有限公司 一种验证bmc可存储sel条目数量和sel覆盖功能的方法
CN109257186A (zh) * 2018-08-23 2019-01-22 郑州云海信息技术有限公司 一种使服务器自动从pxe网络启动的方法及***
CN109510742A (zh) * 2019-01-25 2019-03-22 郑州云海信息技术有限公司 一种服务器网卡远程测试方法、装置、终端及存储介质
CN109558327A (zh) * 2018-12-04 2019-04-02 浪潮电子信息产业股份有限公司 一种bmc日志的写入方法、***及相关组件
CN110008048A (zh) * 2019-03-28 2019-07-12 联想(北京)有限公司 信息处理方法和电子设备
CN111061597A (zh) * 2019-10-18 2020-04-24 苏州浪潮智能科技有限公司 一种测试kcs通信稳定性的方法
CN114268569A (zh) * 2020-09-16 2022-04-01 中盈优创资讯科技有限公司 一种可配置的网络运维验收测试方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101989220A (zh) * 2009-08-05 2011-03-23 英业达股份有限公司 压力测试方法
CN104360922A (zh) * 2014-10-20 2015-02-18 浪潮电子信息产业股份有限公司 一种基于ipmitool的自动监测BMC工作状态的方法
CN105119772A (zh) * 2015-07-23 2015-12-02 浪潮电子信息产业股份有限公司 一种c/s架构ipmi功能测试方法
CN105404813A (zh) * 2015-10-26 2016-03-16 浪潮电子信息产业股份有限公司 一种基于主机防御***的日志生成方法、装置及***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101989220A (zh) * 2009-08-05 2011-03-23 英业达股份有限公司 压力测试方法
CN104360922A (zh) * 2014-10-20 2015-02-18 浪潮电子信息产业股份有限公司 一种基于ipmitool的自动监测BMC工作状态的方法
CN105119772A (zh) * 2015-07-23 2015-12-02 浪潮电子信息产业股份有限公司 一种c/s架构ipmi功能测试方法
CN105404813A (zh) * 2015-10-26 2016-03-16 浪潮电子信息产业股份有限公司 一种基于主机防御***的日志生成方法、装置及***

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
乐晨: ""ipmitool对linux服务器进行IPMI管理"", 《HTTPS://MY.OSCHINA.NET/DAVEHE/BLOG/88801》 *
崔涛: ""使用ipmi实现Linux***下对服务器的ipmi管理"", 《HTTPS://WWW.IBM.COM/DEVELOPERWORKS/CN/LINUX/L-IPMI/》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107656848A (zh) * 2017-09-22 2018-02-02 郑州云海信息技术有限公司 一种验证bmc可存储sel条目数量和sel覆盖功能的方法
CN109257186A (zh) * 2018-08-23 2019-01-22 郑州云海信息技术有限公司 一种使服务器自动从pxe网络启动的方法及***
CN109558327A (zh) * 2018-12-04 2019-04-02 浪潮电子信息产业股份有限公司 一种bmc日志的写入方法、***及相关组件
CN109510742A (zh) * 2019-01-25 2019-03-22 郑州云海信息技术有限公司 一种服务器网卡远程测试方法、装置、终端及存储介质
CN109510742B (zh) * 2019-01-25 2022-02-18 郑州云海信息技术有限公司 一种服务器网卡远程测试方法、装置、终端及存储介质
CN110008048A (zh) * 2019-03-28 2019-07-12 联想(北京)有限公司 信息处理方法和电子设备
CN111061597A (zh) * 2019-10-18 2020-04-24 苏州浪潮智能科技有限公司 一种测试kcs通信稳定性的方法
CN111061597B (zh) * 2019-10-18 2022-08-12 苏州浪潮智能科技有限公司 一种测试kcs通信稳定性的方法
CN114268569A (zh) * 2020-09-16 2022-04-01 中盈优创资讯科技有限公司 一种可配置的网络运维验收测试方法及装置
CN114268569B (zh) * 2020-09-16 2023-10-31 中盈优创资讯科技有限公司 一种可配置的网络运维验收测试方法及装置

Similar Documents

Publication Publication Date Title
CN105743707A (zh) 一种基于Redhat***测试BMC日志解析功能的方法
CN109361562B (zh) 一种基于关联网络设备接入的自动化测试方法
CN111459794A (zh) 通信网络测试方法、装置、计算机设备和存储介质
CN104268076A (zh) 一种适用各处理器平台的自动测试内存带宽的测试方法
CN106919485B (zh) 一种基于服务器上配置硬件测试工具的***
CN107193699A (zh) 一种通过rdma方式自动测试hca卡带宽延时方法
CN111786854B (zh) 网卡测试方法、装置、电子设备及可读存储介质
CN109683997B (zh) 通过沙箱访问应用程序接口的方法、沙箱及沙箱设备
CN107277193B (zh) 一种基板管理控制器地址管理方法、装置和***
CN106776346B (zh) Ccmts设备的测试方法和装置
WO2017017691A1 (en) Testing computing devices
CN112269697B (zh) 一种设备存储性能测试方法、***及相关装置
CN112256505A (zh) 一种服务器稳定性测试方法、装置及相关组件
CN115061885A (zh) 一种整机老化自动测试方法、装置、电子设备及存储介质
CN103984613A (zh) 一种自动测试cpu浮点运算性能测试方法
WO2020087956A1 (zh) 抓取NVME硬盘trace的方法、装置、设备及***
CN112947964A (zh) 一种芯片的固件更新方法、装置、设备及存储介质
CN111078476B (zh) 一种网卡驱动固件稳定性测试方法、***、终端及存储介质
CN107222586B (zh) 一种自动识别局域网内bmc ip的方法
CN110134559B (zh) 一种bmc故障检测方法、***及相关组件
CN116545891A (zh) 一种基于智能设备的自动化配网测试方法
CN107995059B (zh) 一种iOS网络测试策略
CN116483416A (zh) 固件在线升级方法、服务器及存储介质
CN116302738A (zh) 一种测试芯片的方法、***、设备和存储介质
CN114003419B (zh) 一种基于oses实现内存ras特性自动测试的方法、***及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160706