CN111651321A - ***事件记录解析的方法、装置、存储介质和计算机设备 - Google Patents

***事件记录解析的方法、装置、存储介质和计算机设备 Download PDF

Info

Publication number
CN111651321A
CN111651321A CN202010457511.1A CN202010457511A CN111651321A CN 111651321 A CN111651321 A CN 111651321A CN 202010457511 A CN202010457511 A CN 202010457511A CN 111651321 A CN111651321 A CN 111651321A
Authority
CN
China
Prior art keywords
system event
event record
physical
mapping relation
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010457511.1A
Other languages
English (en)
Inventor
赵美玉
唐斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Tongtaiyi Information Technology Co ltd
Original Assignee
Shenzhen Tongtaiyi Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Tongtaiyi Information Technology Co ltd filed Critical Shenzhen Tongtaiyi Information Technology Co ltd
Priority to CN202010457511.1A priority Critical patent/CN111651321A/zh
Publication of CN111651321A publication Critical patent/CN111651321A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

本发明提供一种***事件记录解析的方法、装置、存储介质和计算机设备,所述方法,应用于服务器,包括:BIOS开机自检并初始化;启动***事件检测机制;建立服务器中各物理设备与逻辑设备的映射关系,并将映射关系保存于BIOS中,其中,逻辑设备应用于***事件检测机制;各物理设备完成初始化;BMC解析***事件记录,根据映射关系,将显示内容从原有的逻辑设备信息改为物理设备信息。与现有技术相比,本方案将***事件记录数据中的内容由逻辑设备信息显示转换为物理设备信息显示增加可读性,减少维护分析的难度,从而降低用户SEL解析的学习成本,提升服务器定位异常设备的效率。

Description

***事件记录解析的方法、装置、存储介质和计算机设备
技术领域
本发明涉及到服务器领域,特别是涉及一种***事件记录解析的方法、装置、存储介质和计算机设备。
背景技术
随着信息技术的发展,服务器作为网络***和计算平台的核心,其工作状态影响网络***和计算平台的正常工作。BMC(Baseboard Management Controller,基板管理控制器)是服务器最重要的管理模块。管理人员通过查看解析BMC中记录的SEL(System EventLog,***事件记录)获取服务器中各设备的异常问题。由于在现有技术中,SEL是按照***中设备的逻辑位置和地址按特定格式记录。在服务器***中各设备数量比较多,SEL的记录是以逻辑设备为标准,用户需要根据机器的详细配置信息解析对应的***事件记录。这就造成了***事件记录对用户并不友好,如图2所示,用户需要知道机器详细配置并且熟悉内部逻辑架构才能定位异常的设备。
发明内容
本发明的主要目的为提供一种***事件记录解析的方法,旨在解决降低用户SEL解析的学习成本,提升服务器定位异常设备的效率。
本发明提供一种***事件记录解析的方法,应用于服务器,包括:
BIOS开机自检并初始化;
启动***事件检测机制;
建立服务器中各物理设备与逻辑设备的映射关系,并将映射关系保存于BIOS中,其中,逻辑设备应用于***事件检测机制;
各物理设备完成初始化;
BMC解析***事件记录,根据映射关系,将显示内容从原有的逻辑设备信息改为物理设备信息。
优选的,BMC解析***事件记录,根据映射关系,将显示内容从原有的逻辑设备信息改为物理设备信息的步骤,包括:
读取***事件记录;
接收BIOS发送的映射关系;
依据映射关系,将逻辑设备位置信息解读为物理设备信息呈现给用户,其中,逻辑设备信息为十六进制数据。
优选的,启动***事件检测机制的步骤,包括:
判断服务器中各逻辑设备是否异常;
若是,则记录异常的逻辑设备地址,生成***事件记录并发送至BMC。
本发明还提供一种***事件记录解析的装置,包括:
自检模块,用于BIOS开机自检并初始化;
检测模块,用于启动***事件检测机制;
映射模块,用于建立服务器中各物理设备与逻辑设备的映射关系,并将映射关系保存于BIOS中,其中,逻辑设备应用于***事件检测机制;
初始化模块,用于各物理设备完成初始化;
解析模块,用于BMC解析***事件记录,根据映射关系,将显示内容从原有的逻辑设备信息改为物理设备信息。
优选的,解析模块包括:
第一执行子模块,用于读取***事件记录;
第二执行子模块,用于接收BIOS发送的映射关系;
解析子模块,用于依据映射关系,将逻辑设备位置信息解读为物理设备信息呈现给用户,其中,逻辑设备信息为十六进制数据。
优选的,检测模块包括:
判断子模块,用于判断服务器中各逻辑设备是否异常;
报警子模块,用于若是,则记录异常的逻辑设备地址,生成***事件记录并发送至BMC。
本发明还提供一种存储介质,其为计算机可读的存储介质,其上存储有计算机程序,计算机程序被执行时实现如上述的***事件记录解析的方法。
本发明还提供一种计算机设备,其包括处理器、存储器及存储于存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述的***事件记录解析的方法。
本发明的有益效果在于:在BIOS开机自检阶段收集相关的设备和资源分配信息,将逻辑设备与物理设备设建立对应关系。在***事件记录解析中结合BIOS提供的对应管理,将***事件记录数据中的内容由逻辑设备信息显示转换为物理设备信息显示增加可读性,减少维护分析的难度,从而降低用户SEL解析的学习成本,提升服务器定位异常设备的效率。
附图说明
图1为本发明一种***事件记录解析的方法的第一实施例的流程图;
图2为现有技术中***事件记录的解读页面示意图;
图3为本发明一种***事件记录解析的装置的第一结构示意图;
图4为本申请提供的存储介质一实施例的结构框图;
图5为本申请提供的计算机设备一实施例的结构框图。
标号说明:
1、自检模块;2、检测模块;3、映射模块;4、初始化模块;5、解析模块;
100、存储介质;200、计算机程序;300、计算机设备;400、处理器。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参照图1,本发明提供一种***事件记录解析的方法,应用于服务器,包括:
S1:BIOS开机自检并初始化;
S2:启动***事件检测机制;
S3:建立服务器中各物理设备与逻辑设备的映射关系,并将映射关系保存于BIOS中,其中,逻辑设备应用于***事件检测机制;
S4:各物理设备完成初始化;
S5:BMC解析***事件记录,根据映射关系,将显示内容从原有的逻辑设备信息改为物理设备信息。
在本发明实施例中,BIOS(Basic Input Output System,基本输入输出***)开机自检并初始化,完成了IPMI(Intelligent Platform Management Interface,智能平台管理接口)功能初始化。然后启动***事件检测机制。在BIOS初始化阶段,建立服务器中各物理设备与逻辑设备的映射关系。服务器中各物理设备完成初始化,服务器开始运行。通过***事件检测机制实时判断服务器中各物理设备是否出现异常。若是,则生成SEL(SystemEvent Log,***事件记录)。BMC(Baseboard Management Controller,基板管理控制器)解析SEL,根据BIOS提供的映射数据将逻辑设备位置转化为实际对应的物理设备信息,比如某位置CPU、某位置DIMM、某位置PCIE设备,某个存储设备等输出给用户。
举例的,以图2的日志为例。用户在不了解芯片规格和整机设计的情况下,除去文字性的描述则无法理解“a50503”这样的数据是什么概念。若采用本方案的解析方法,则在SEL日志文件中Event Data一栏将“a50503”解析为CPU1。CPU模块发生了Fatal Error,类型属于未知。这样用户就知道是CPU1的哪些模块发生了什么异常。
综上,通过上述设置,在BIOS开机自检阶段收集相关的设备和资源分配信息,将逻辑设备与物理设备设建立对应关系。在***事件记录解析中结合此前BIOS提供的对应管理,将***事件记录数据中的内容由逻辑设备信息显示转换为物理设备信息显示增加可读性,减少维护分析的难度,从而降低用户SEL解析的学习成本,提升服务器定位异常设备的效率。
进一步地,BMC解析***事件记录,根据映射关系,将显示内容从原有的逻辑设备信息改为物理设备信息的步骤S5,包括:
S51:读取***事件记录;
S52:接收BIOS发送的映射关系;
S53:依据映射关系,将逻辑设备位置信息解读为物理设备信息呈现给用户,其中,逻辑设备信息为十六进制数据。
在本发明实施例中,BIOS记录CPU资源分配与服务器物理设备对应关系,并根据硬件设计将其与物理设备对应,将相关数据(OEMData1)发送到BMC。BMC一端读取BIOS记录的相关数据(OEMData1)结合SEL数据,将SEL以可读方式呈现在SEL日志文件中。
进一步地,启动***事件检测机制的步骤S2,包括:
S21:判断服务器中各逻辑设备是否异常;
S22:若是,则记录异常的逻辑设备地址,生成***事件记录并发送至BMC。
在本发明实施例中,通过实时判断服务器中各逻辑设备是否异常,当发现异常时能第一时间报警,以提醒用户尽快处理。
参照图3,本发明提供一种***事件记录解析的装置,包括:
自检模块1,用于BIOS开机自检并初始化;
检测模块2,用于启动***事件检测机制;
映射模块3,用于建立服务器中各物理设备与逻辑设备的映射关系,并将映射关系保存于BIOS中,其中,逻辑设备应用于***事件检测机制;
初始化模块4,用于各物理设备完成初始化;
解析模块5,用于BMC解析***事件记录,根据映射关系,将显示内容从原有的逻辑设备信息改为物理设备信息。
在本发明实施例中,BIOS(Basic Input Output System,基本输入输出***)开机自检并初始化,完成了IPMI(Intelligent Platform Management Interface,智能平台管理接口)功能初始化。然后启动***事件检测机制。在BIOS初始化阶段,建立服务器中各物理设备与逻辑设备的映射关系。服务器中各物理设备完成初始化,服务器开始运行。通过***事件检测机制实时判断服务器中各物理设备是否出现异常。若是,则生成SEL(SystemEvent Log,***事件记录)。BMC(Baseboard Management Controller,基板管理控制器)解析SEL,根据BIOS提供的映射数据将逻辑设备位置转化为实际对应的物理设备信息,比如某位置CPU、某位置DIMM、某位置PCIE设备,某个存储设备等输出给用户。
举例的,以图2的日志为例。用户在不了解芯片规格和整机设计的情况下,除去文字性的描述则无法理解“a50503”这样的数据是什么概念。若采用本方案的解析方法,则在SEL日志文件中Event Data一栏将“a50503”解析为CPU1。CPU模块发生了Fatal Error,类型属于未知。这样用户就知道是CPU1的哪些模块发生了什么异常。
综上,通过上述设置,在BIOS开机自检阶段收集相关的设备和资源分配信息,将逻辑设备与物理设备设建立对应关系。在***事件记录解析中结合此前BIOS提供的对应管理,将***事件记录数据中的内容由逻辑设备信息显示转换为物理设备信息显示增加可读性,减少维护分析的难度,从而降低用户SEL解析的学习成本,提升服务器定位异常设备的效率。
进一步地,解析模块5包括:
第一执行子模块,用于读取***事件记录;
第二执行子模块,用于接收BIOS发送的映射关系;
解析子模块,用于依据映射关系,将逻辑设备位置信息解读为物理设备信息呈现给用户,其中,逻辑设备信息为十六进制数据。
在本发明实施例中,BIOS记录CPU资源分配与服务器物理设备对应关系,并根据硬件设计将其与物理设备对应,将相关数据(OEMData1)发送到BMC。BMC一端读取BIOS记录的相关数据(OEMData1)结合SEL数据,将SEL以可读方式呈现在SEL日志文件中。
进一步地,检测模块2包括:
判断子模块,用于判断服务器中各逻辑设备是否异常;
报警子模块,用于若是,则记录异常的逻辑设备地址,生成***事件记录并发送至BMC。
在本发明实施例中,通过实时判断服务器中各逻辑设备是否异常,当发现异常时能第一时间报警,以提醒用户尽快处理。
参考图4,本申请还提供了一种存储介质100,存储介质100中存储有计算机程序200,当其在计算机上运行时,使得计算机执行以上实施例所描述的***事件记录解析的方法。
参考图5,本申请还提供了一种包含指令的计算机设备300,当其在计算机设备300上运行时,使得计算机设备300通过其内部设置的处理器400执行以上实施例所描述的一种***事件记录解析的方法。
本领域技术人员可以理解,本发明所述的***事件记录解析的方法和上述所涉及用于执行本申请中所述方法中的一项或多项的设备。这些设备可以为所需的目的而专门设计和制造,或者也可以包括通用计算机中的已知设备。这些设备具有存储在其内的计算机程序或应用程序,这些计算机程序选择性地激活或重构。这样的计算机程序可以被存储在设备(例如,计算机)可读介质中或者存储在适于存储电子指令并分别耦联到总线的任何类型的介质中,所述计算机可读介质包括但不限于任何类型的盘(包括软盘、硬盘、光盘、CD-ROM、和磁光盘)、ROM(Read-Only Memory,只读存储器)、RAM(Random Access Memory,随机存储器)、EPROM(Erasable Programmable Read-Only Memory,可擦写可编程只读存储器)、EEPROM(Electrically Erasable Programmable Read-Only Memory,电可擦可编程只读存储器)、闪存、磁性卡片或光线卡片。也就是,可读介质包括由设备(例如,计算机)以能够读的形式存储或传输信息的任何介质。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (8)

1.一种***事件记录解析的方法,其特征在于,应用于服务器,包括:
BIOS开机自检并初始化;
启动***事件检测机制;
建立所述服务器中各物理设备与逻辑设备的映射关系,并将所述映射关系保存于所述BIOS中,其中,所述逻辑设备应用于所述***事件检测机制;
各物理设备完成初始化;
所述BMC解析***事件记录,根据所述映射关系,将显示内容从原有的逻辑设备信息改为物理设备信息。
2.根据权利要求1所述的***事件记录解析的方法,其特征在于,所述所述BMC解析***事件记录,根据所述映射关系,将显示内容从原有的逻辑设备信息改为物理设备信息的步骤,包括:
读取***事件记录;
接收所述BIOS发送的映射关系;
依据所述映射关系,将逻辑设备位置信息解读为物理设备信息呈现给用户,其中,所述逻辑设备信息为十六进制数据。
3.根据权利要求1所述的***事件记录解析的方法,其特征在于,所述启动***事件检测机制的步骤,包括:
判断所述服务器中各逻辑设备是否异常;
若是,则记录异常的逻辑设备地址,生成***事件记录并发送至BMC。
4.一种***事件记录解析的装置,其特征在于,包括:
自检模块,用于BIOS开机自检并初始化;
检测模块,用于启动***事件检测机制;
映射模块,用于建立所述服务器中各物理设备与逻辑设备的映射关系,并将所述映射关系保存于所述BIOS中,其中,所述逻辑设备应用于所述***事件检测机制;
初始化模块,用于各物理设备完成初始化;
解析模块,用于所述BMC解析***事件记录,根据所述映射关系,将显示内容从原有的逻辑设备信息改为物理设备信息。
5.根据权利要求1所述的***事件记录解析的装置,其特征在于,所述解析模块包括:
第一执行子模块,用于读取***事件记录;
第二执行子模块,用于接收所述BIOS发送的映射关系;
解析子模块,用于依据所述映射关系,将逻辑设备位置信息解读为物理设备信息呈现给用户,其中,所述逻辑设备信息为十六进制数据。
6.根据权利要求1所述的***事件记录解析的装置,其特征在于,所述检测模块包括:
判断子模块,用于判断所述服务器中各逻辑设备是否异常;
报警子模块,用于若是,则记录异常的逻辑设备地址,生成***事件记录并发送至BMC。
7.一种存储介质,其特征在于,其为计算机可读的存储介质,其上存储有计算机程序,所述计算机程序被执行时实现如权利要求1~3任一项所述的***事件记录解析的方法。
8.一种计算机设备,其特征在于,其包括处理器、存储器及存储于所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1~3任一项所述的***事件记录解析的方法。
CN202010457511.1A 2020-05-26 2020-05-26 ***事件记录解析的方法、装置、存储介质和计算机设备 Pending CN111651321A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010457511.1A CN111651321A (zh) 2020-05-26 2020-05-26 ***事件记录解析的方法、装置、存储介质和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010457511.1A CN111651321A (zh) 2020-05-26 2020-05-26 ***事件记录解析的方法、装置、存储介质和计算机设备

Publications (1)

Publication Number Publication Date
CN111651321A true CN111651321A (zh) 2020-09-11

Family

ID=72344766

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010457511.1A Pending CN111651321A (zh) 2020-05-26 2020-05-26 ***事件记录解析的方法、装置、存储介质和计算机设备

Country Status (1)

Country Link
CN (1) CN111651321A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104424084A (zh) * 2013-08-27 2015-03-18 鸿富锦精密电子(天津)有限公司 服务器的***错误信息侦测***及方法
TW201516665A (zh) * 2013-08-30 2015-05-01 Hon Hai Prec Ind Co Ltd 伺服器之系統錯誤資訊偵測系統及方法
CN107203456A (zh) * 2016-03-17 2017-09-26 昆达电脑科技(昆山)有限公司 服务器故障的远程报警***及方法
CN107357694A (zh) * 2016-05-10 2017-11-17 佛山市顺德区顺达电脑厂有限公司 开机自检过程中错误事件汇报***及其方法
CN108182138A (zh) * 2018-01-24 2018-06-19 郑州云海信息技术有限公司 Bmc sel日志的获取方法、***、装置及存储介质
CN110018949A (zh) * 2019-03-22 2019-07-16 烽火通信科技股份有限公司 一种基于ipmi协议的通用日志管理方法及***

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104424084A (zh) * 2013-08-27 2015-03-18 鸿富锦精密电子(天津)有限公司 服务器的***错误信息侦测***及方法
TW201516665A (zh) * 2013-08-30 2015-05-01 Hon Hai Prec Ind Co Ltd 伺服器之系統錯誤資訊偵測系統及方法
CN107203456A (zh) * 2016-03-17 2017-09-26 昆达电脑科技(昆山)有限公司 服务器故障的远程报警***及方法
CN107357694A (zh) * 2016-05-10 2017-11-17 佛山市顺德区顺达电脑厂有限公司 开机自检过程中错误事件汇报***及其方法
CN108182138A (zh) * 2018-01-24 2018-06-19 郑州云海信息技术有限公司 Bmc sel日志的获取方法、***、装置及存储介质
CN110018949A (zh) * 2019-03-22 2019-07-16 烽火通信科技股份有限公司 一种基于ipmi协议的通用日志管理方法及***

Similar Documents

Publication Publication Date Title
US7565579B2 (en) Post (power on self test) debug system and method
US9262283B2 (en) Method for reading kernel log upon kernel panic in operating system
Wang et al. Fault detection for cloud computing systems with correlation analysis
US10606677B2 (en) Method of retrieving debugging data in UEFI and computer system thereof
JP6363152B2 (ja) データフロー分析のための装置、方法、コンピュータプログラム及び記憶媒体
US6725396B2 (en) Identifying field replaceable units responsible for faults detected with processor timeouts utilizing IPL boot progress indicator status
US10552280B2 (en) In-band monitor in system management mode context for improved cloud platform availability
CA2811617C (en) Commit sensitive tests
CN111831466A (zh) 一种***设备报错的方法、装置、存储介质和计算机设备
CN114765051A (zh) 内存测试方法及装置、可读存储介质、电子设备
CN114446381B (zh) eMMC故障分析方法、装置、可读存储介质及电子设备
TWI393003B (zh) 遠距硬體檢測系統及方法
JP2005149501A (ja) Dmaを使用して拡張カードでメモリをテストするためのシステムおよび方法
CN110955566B (zh) 侦错方法
CN111651321A (zh) ***事件记录解析的方法、装置、存储介质和计算机设备
US10684896B2 (en) Method for processing asynchronous event by checking device and checking device
CN1797360A (zh) 内存可靠性检测***以及方法
CN115292113A (zh) 对服务器的内存进行故障检测方法、装置及电子设备
US11593209B2 (en) Targeted repair of hardware components in a computing device
JP2005149503A (ja) Dmaを使用してメモリをテストするためのシステムおよび方法
JPH1165898A (ja) 電子計算機の保守方式
EP3557422A1 (en) Method for accessing code sram, and electronic device
US11900150B2 (en) Methods and systems for collection of system management interrupt data
US11663064B1 (en) System and method for generating a guest operating system crash dump
CN115640236B (zh) 一种脚本质量的检测方法及计算设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200911