CN115562950A - 一种数据采集方法、装置和计算机设备 - Google Patents

一种数据采集方法、装置和计算机设备 Download PDF

Info

Publication number
CN115562950A
CN115562950A CN202211551278.9A CN202211551278A CN115562950A CN 115562950 A CN115562950 A CN 115562950A CN 202211551278 A CN202211551278 A CN 202211551278A CN 115562950 A CN115562950 A CN 115562950A
Authority
CN
China
Prior art keywords
management controller
data acquisition
data
substrate management
error
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211551278.9A
Other languages
English (en)
Other versions
CN115562950B (zh
Inventor
候志立
张秀波
王相宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202211551278.9A priority Critical patent/CN115562950B/zh
Publication of CN115562950A publication Critical patent/CN115562950A/zh
Application granted granted Critical
Publication of CN115562950B publication Critical patent/CN115562950B/zh
Priority to PCT/CN2023/108929 priority patent/WO2024119843A1/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/1805Append-only file systems, e.g. using logs or journals to store data
    • G06F16/1815Journaling file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems
    • G06F16/1824Distributed file systems implemented using Network-attached Storage [NAS] architecture
    • G06F16/183Provision of network file services by network file servers, e.g. by using NFS, CIFS
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/02Details
    • H04L12/16Arrangements for providing special services to substations
    • H04L12/18Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/14Session management
    • H04L67/141Setup of application sessions
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Quality & Reliability (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Computer And Data Communications (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请涉及一种数据采集方法、装置和计算机设备。所述方法包括:配置服务器集群和网络文件***服务器至目标广域网,所述服务器集群的数量至少为一;任一所述服务器的基板管理控制器作为目标基板管理控制器广播链路层发现协议数据帧至所述目标广域网,所述目标广域网内除所述目标基板管理控制器外的基板管理控制器作为预设基板管理控制器接收所述目标基板管理控制器广播的链路层发现协议数据帧,以实现任两个所述服务器成功握手通信;当任一所述服务器的基板管理控制器报错时,获取所述基板管理控制器预设的数据采集规则;基于所述预设的数据采集规则,通过所述网络文件***服务器,采集所述基板管理控制器的数据。

Description

一种数据采集方法、装置和计算机设备
技术领域
本申请涉及数据采集技术领域,特别是涉及一种数据采集方法、装置和计算机设备。
背景技术
基板管理控制器(简称:BMC)作为服务器中的基础管理部件,承担着服务器散热、部件监控和管理、异常状态上报、传感器数据监控和分析、服务器故障诊断、IPMI服务等重要功能。因此,可以这样说,一个服务器中的BMC出现故障,则意味着失去了针对整个服务器的管理和控制功能,无法对服务器实现人工有效管理和相关的故障监测,因此,BMC的稳定性显得尤为重要。但是,在整个服务器领域,BMC的用户定制化又是最多的,这就导致BMC的固件程序中会持续增加各种各样的功能,功能增加的越多,对整个BMC的稳定性就是一个极大的考验。
当现场出现问题的时候需要及时定位解决,定位解决的一个前提是需要收集抓取到BMC故障时刻的相关串口打印信息,日志记录信息,寄存器信息等,目前收集BMC故障诊断数据的相关方案主要包括以下几种:1.通过互联网界面提供一键日志下载功能,通过互联网界面将基板管理控制器的文件***中的相关日志文件收集并下载;2.当基板管理控制器发出运行异常信号时,在基板管理控制器所属的服务器现场接基板管理控制器的串口进行相关日志的收集;3.通过安全外壳协议远程登录基板管理控制器***,针对BMC文件***中的相关文件进行查看和执行相关命令进行调试或者通过串口重定向功能将串口数据重定向至安全外壳协议进行查看。
虽然上述相关方案能够有效收集基板管理控制器故障诊断数据,但是上述方案均存在一定的弊端;
其中,通过互联网界面提供一键日志下载功能,通过互联网界面将基板管理控制器的文件***中的相关日志文件收集并下载,存在以下弊端:1. BMC的Flash存储空间相对较小,无法存储时间长、数据量大的串口数据,有很多重要的调试信息是需要借助串口数据进行分析和解决的;2. Web界面依赖于BMC中用户认证***、restful接口的稳定性,而这两个关键性的模块又是定制和改动比较频繁的模块,极容易造成web界面无法正常登录的情况,如果web界面无法正常登录,则无法正常下载一键日志数据,无法为调试提供相关信息;3. 一键日志收集功能依靠的是BMC的一键日志收集功能的实现,如果某个文件比较重要但是运行版本的BMC的一键日志功能中不具备下载这个文件或收集相关信息的能力,则无法获取到关键信息,即这种实现方式无法实现开发人员的定制化下载和执行相关命令的能力;4. Web界面下载一键日志的功能,无法实现大批量集群管理功能,即只能收集单台服务器上BMC中的调试信息,当一个局域网中的批量机器出现类似问题存在收集多台机器日志的时候,操作的复杂度会成倍增加;5. 当网络故障的时候无法实现现场自动收集;6.无法实现BMC调试日志的持续性收集。
在基板管理控制器所属的服务器现场接基板管理控制器的串口进行相关日志的收集,存在以下弊端:这种方式只能现场操作,无法远程操作,而且很多机器的串口接口的位置设计的比较隐蔽,很多时候需要打开机箱盖或移动服务器才能***串口线,如果在这个操作过程中如果触发断电,会存在故障问题无法复现的问题,就会错过抓取日志的最佳时机;并且涉及到机箱开盖等操作,需要用户现场执行相关的流程,延长了问题解决的时间,且增加了安全风险。
通过安全外壳协议远程登录基板管理控制器***,针对BMC文件***中的相关文件进行查看和执行相关命令进行调试或者通过串口重定向功能将串口数据重定向至安全外壳协议进行查看,存在以下弊端:这种方式存在一定的局限性,因为很多用户为了安全因素,都会将ssh(英文: Secure Shell;中文:安全外壳协议)禁用,在这种情况下就无法实现调试信息的收集。
因此,急需提出一种能够解决上述技术问题的数据采集方法、装置和计算机设备。
发明内容
基于此,有必要针对上述技术问题,提供一种能够确保数据采集稳定性、提升数据采集效率的数据采集方法、装置和计算机设备。
一方面,提供一种数据采集方法,所述方法包括:
配置服务器集群和网络文件***服务器至目标广域网,所述服务器集群的数量至少为一,所述服务器集群包括业务服务器;
任一所述业务服务器的基板管理控制器作为目标基板管理控制器广播链路层发现协议数据帧至所述目标广域网,所述目标广域网内除所述目标基板管理控制器外的基板管理控制器作为预设基板管理控制器接收所述目标基板管理控制器广播的链路层发现协议数据帧,以实现任两个所述业务服务器成功握手通信;
当任一所述业务服务器的基板管理控制器报错时,获取所述报错的基板管理控制器预设的数据采集规则;
基于所述预设的数据采集规则,通过所述网络文件***服务器,采集所述报错的基板管理控制器的数据。
在其中一个实施例中,配置服务器集群至目标广域网前,所述方法还包括:配置业务服务器至目标局域网,生成服务器集群,所述业务服务器的数量至少为一;所述业务服务器的基板管理控制器作为目标基板管理控制器广播链路层发现协议数据帧至所述目标局域网,以实现任两个业务服务器成功握手通信。
在其中一个实施例中,所述业务服务器的基板管理控制器作为目标基板管理控制器广播链路层发现协议数据帧至所述目标广域网后,所述方法包括:所述基板管理控制器解析所述目标基板管理控制器广播的链路层发现协议数据帧,获取所述目标基板管理控制器的属性信息,所述属性信息包括:IP地址、链路层发现协议数据帧生存周期和最近一次接收所述目标基板管理控制器的链路层发现协议数据帧的时间;基于所述目标基板管理控制器的属性信息,生成目标基板管理控制器属性信息表,并存储所述目标基板管理控制器属性信息表至预设的内存文件。
在其中一个实施例中,基于所述目标基板管理控制器的属性信息,生成目标基板管理控制器属性信息表前,所述方法还包括:基于所述目标基板管理控制器的属性信息中的IP地址,判断所述基板管理控制器预设的内存文件中是否存在与所述IP地址一致的IP地址;若所述预设的内存文件中存在与所述IP地址一致的IP地址,则更新所述最近一次接收所述目标基板管理控制器的链路层发现协议数据帧的时间至所述IP地址;若所述预设的内存文件中不存在与所述IP地址一致的IP地址,则增加所述目标基板管理控制器的属性信息至预设的内存文件。
在其中一个实施例中,基于所述目标基板管理控制器的属性信息,生成目标基板管理控制器属性信息表后,所述方法还包括:所述基板管理控制器基于预设的内存文件中的IP地址,获取与所述IP地址对应的最近一次接收所述目标基板管理控制器的链路层发现协议数据帧的时间;获取当前时间与所述最近一次接收所述目标基板管理控制器的链路层发现协议数据帧的时间的时间差,判断所述时间差是否超过与所述IP地址对应的链路层发现协议数据帧生存周期;若所述时间差超过与所述IP地址对应的链路层发现协议数据帧生存周期,则删除所述目标基板管理控制器属性信息表。
在其中一个实施例中,当所述目标广域网内任一所述业务服务器的基板管理控制器报错时,获取所述报错的基板管理控制器预设的数据采集规则,包括:所述报错的基板管理控制器通过所述目标广域网和所述目标局域网发送报错信息至任一业务服务器的基板管理控制器;所述基板管理控制器接收到所述报错信息后,启动诊断数据远端收集进程,获取所述报错的基板管理控制器预设的数据采集规则。
在其中一个实施例中,基于所述预设的数据采集规则,通过所述网络文件***服务器,采集所述报错的基板管理控制器的数据,包括:从所述报错的基板管理控制器的带电可擦可编程只读存储器中读取所述报错的基板管理控制器的预设的数据采集规则;读取配置至所述报错的基板管理控制器的网络文件***服务器的网络文件***参数;基于所述预设的数据采集规则与所述网络文件***服务器的网络文件***参数,通过所述网络文件***服务器,采集所述报错的基板管理控制器的数据。
在其中一个实施例中,所述数据采集规则,包括:数据采集主体、数据采集方式和数据采集模式;所述数据采集主体包括:本机和集群;所述数据采集方式包括:远端和本地;所述数据采集模式包括:手动数据采集模式、持续数据采集模式、智能数据采集模式和控制数据采集模式。
在其中一个实施例中,若所述带电可擦可编程只读存储器中预设的数据采集规则有效,则基于预设的数据采集规则,通过所述网络文件***服务器,采集所述报错的基板管理控制器的数据,包括:判断所述目标广域网的网络状态是否正常;若所述目标广域网的网络状态正常,则采用预设的数据采集规则,通过所述网络文件***服务器,采集所述报错的基板管理控制器的数据;若所述目标广域网的网络状态异常,则外接存储设备至所述报错的基板管理控制器,并判断所述数据采集方式是否为本地。
在其中一个实施例中,判断所述数据采集方式是否为本地,所述方法包括:若所述数据采集方式为本地,则判断所述数据采集主体是否为本机;若所述数据采集方式不为本地,则采用数据采集主体为本机,数据采集方式为本地,数据采集模式为手动数据采集模式的数据采集规则采集所述报错的基板管理控制器的数据。
在其中一个实施例中,判断所述数据采集主体是否为本机,包括:若所述数据采集主体为本机,则采用预设的数据采集模式采集所述报错的基板管理控制器的数据;若所述数据采集主体不为本机,则判断所述目标局域网的网络状态是否正常。
在其中一个实施例中,判断所述目标局域网的网络状态是否正常,包括:若所述目标局域网的网络状态正常,则采用预设的数据采集模式采集所述报错的基板管理控制器的数据;若所述目标局域网的网络状态异常,则获取所述预设的数据采集模式,采用数据采集主体为本机,数据采集方式为本地,数据采集模式为预设的数据采集模式的数据采集规则采集所述报错的基板管理控制器的数据。
在其中一个实施例中,当预设的数据采集方式为远端时,所述方法还包括:当所述数据采集主体为本机时,则所述报错的基板管理控制器按照所述预设的数据采集模式,采集所述报错的基板管理控制器的数据,并写入所述网络文件***服务器;当所述数据采集主体为集群时,则由预先设定的预设基板管理控制器按照所述预设的数据采集模式,采集所述报错的基板管理控制器的数据,并写入所述网络文件***服务器。
在其中一个实施例中,当预设的数据采集方式为本地时,所述方法还包括:当所述数据采集主体为集群时,则由预先设定的预设基板管理控制器按照所述预设的数据采集模式采集所述报错的基板管理控制器的数据,并写入所述存储设备;当所述数据采集主体为本机时,则所述报错的基板管理控制器按照所述预设的数据采集模式采集所述报错的基板管理控制器的数据,并写入所述存储设备。
在其中一个实施例中,当所述预设的数据采集模式为手动数据采集模式时,所述方法包括以下步骤:步骤A1、获取报错的基板管理控制器的数据采集执行信号;步骤A2、待获取到所述报错的基板管理控制器的数据采集执行信号后,获取所述报错的基板管理控制器的网络文件***参数,基于所述报错的基板管理控制器的网络文件***参数将所述网络文件***服务器的路径挂载至所述报错的基板管理控制器;步骤A3、将所述报错的基板管理控制器的串口数据输出至异步收发传输端;步骤A4、基于所述异步收发传输端获取所述报错的基板管理控制器串口数据,并将所述串口数据写入至所述网络文件***服务器。
在其中一个实施例中,当预设的数据采集模式为持续数据采集模式时,所述方法包括:重复执行所述步骤A1~A4,采集所述报错的基板管理控制器的数据。
在其中一个实施例中,当所述预设的数据采集模式为控制数据采集模式时,所述方法包括以下步骤:步骤B1、获取报错的基板管理控制器的网络文件***配置参数;步骤B2、基于所述网络文件***的配置参数将所述网络文件***服务器挂载至所述报错的基板管理控制器;步骤B3、判断是否成功接收数据采集执行指令,所述执行指令包括IPM1发送的数据采集执行指令和挂载至所述报错的基板管理控制器的网络文件***服务器中存储的数据采集执行指令;步骤B4、若成功接收所述数据采集执行指令,则执行所述数据采集执行指令生成执行结果,并将所述执行结果写入网络文件***服务器,所述执行结果包括执行成功和执行失败。
在其中一个实施例中,当所述预设的数据采集模式为智能数据采集模式时,所述方法包括:步骤C1、读取报错的基板管理控制器的网络文件***配置参数;步骤C2、基于所述报错的基板管理控制器的网络文件***配置参数,将所述网络文件***服务器对应目录挂载至所述报错的基板管理控制器步骤C3、收集所述报错的基板管理控制器的串口数据,解析所述报错的基板管理控制器的串口数据;步骤C4、判断所述报错的基板管理控制器的运行异常状态是否为真,若所述报错的基板管理控制器的运行异常状态为真,则执行步骤C5;步骤C5、将所述报错的基板管理控制器的串口数据存入网络文件***配置挂载目录对应文件中。
在其中一个实施例中,判断所述报错的基板管理控制器的运行异常状态是否为真,包括:若所述报错的基板管理控制器的运行异常状态为假,则执行步骤C6;步骤C6、判断所述报错的基板管理控制器是否存在有数据收集需求的进程线程。
在其中一个实施例中,判断所述报错的基板管理控制器是否存在有数据收集需求的进程线程,包括:若所述报错的基板管理控制器中不存在有数据收集需求的进程线程,则执行步骤C7;反之,则执行步骤C5;步骤C7、丢弃所述报错的基板管理控制器的串口数据。
在其中一个实施例中,所述方法包括:预先生成预设基板管理控制器列表;预先生成预设基板管理控制器列表,包括:基于任一所述目标基板管理控制器,生成预设基板管理控制器集,所述预设基板管理控制器集中包括所述目标广域网内除所述目标基板管理控制器外的至少一个基板管理控制器,定义所述基板管理控制器为预设基板管理控制器;对所述预设基板管理控制器集中的预设基板管理控制器进行优先级排序,按照优先级从高到低的顺序生成预设基板管理控制器列表。
在其中一个实施例中,基于所述预设的数据采集规则,通过所述网络文件***服务器,采集所述报错的基板管理控制器的数据,包括:遍历所述预设基板管理控制器列表,按照所述预设基板管理控制器优先级顺序,选定其中一个预设基板管理控制器基于所述报错的基板管理控制器预设的数据采集规则,通过所述网络文件***服务器,采集所述报错的基板管理控制器的数据。
在其中一个实施例中,基于所述预设的数据采集规则,通过所述网络文件***服务器,采集所述报错的基板管理控制器的数据,还包括:当所述数据采集主体为集群,所述数据采集模式为持续数据采集模式时,所述预设基板管理控制器集中的预设基板管理控制器获取所述目标广域网内除所述报错的基板管理控制器外的任一预设基板管理控制器的串口资源占用率;选择串口资源占用率最低的预设基板管理控制器按照所述持续数据采集模式,采集所述报错的基板管理控制器的数据。
在其中一个实施例中,所述报错的基板管理控制器的串口数据包括:配置分区、日志分区、内存分区、网络路由参数、内核资源参数、资源占用信息和进程线程运行信息。
另一方面,提供了一种数据采集装置,所述装置包括:
配置单元,以用于配置服务器集群和网络文件***服务器至目标广域网,所述服务器集群的数量至少为一,所述服务器集群包括业务服务器;还用于任一所述业务服务器的基板管理控制器作为目标基板管理控制器广播链路层发现协议数据帧至所述目标广域网,所述目标广域网内除所述目标基板管理控制器外的基板管理控制器作为预设基板管理控制器接收所述目标基板管理控制器广播的链路层发现协议数据帧,以实现任两个所述业务服务器成功握手通信;
获取单元,以用于当任一所述业务服务器的基板管理控制器报错时,获取所述报错的基板管理控制器预设的数据采集规则;
采集单元,以用于基于所述预设的数据采集规则,通过所述网络文件***服务器,采集所述报错的基板管理控制器的数据。
再一方面,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
配置服务器集群和网络文件***服务器至目标广域网,所述服务器集群的数量至少为一,所述服务器集群包括业务服务器;
任一所述业务服务器的基板管理控制器作为目标基板管理控制器广播链路层发现协议数据帧至所述目标广域网,所述目标广域网内除所述目标基板管理控制器外的基板管理控制器作为预设基板管理控制器接收所述目标基板管理控制器广播的链路层发现协议数据帧,以实现任两个所述业务服务器成功握手通信;
当任一所述业务服务器的基板管理控制器报错时,获取所述报错的基板管理控制器预设的数据采集规则;
基于所述预设的数据采集规则,通过所述网络文件***服务器,采集所述报错的基板管理控制器的数据。
又一方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
配置服务器集群和网络文件***服务器至目标广域网,所述服务器集群的数量至少为一,所述服务器集群包括业务服务器;
任一所述业务服务器的基板管理控制器作为目标基板管理控制器广播链路层发现协议数据帧至所述目标广域网,所述目标广域网内除所述目标基板管理控制器外的基板管理控制器作为预设基板管理控制器接收所述目标基板管理控制器广播的链路层发现协议数据帧,以实现任两个所述业务服务器成功握手通信;
当任一所述业务服务器的基板管理控制器报错时,获取所述报错的基板管理控制器预设的数据采集规则;
基于所述预设的数据采集规则,通过所述网络文件***服务器,采集所述报错的基板管理控制器的数据。
上述数据采集方法、装置和计算机设备,所述数据采集方法包括:配置服务器集群和网络文件***服务器至目标广域网,所述服务器集群的数量至少为一,所述服务器集群包括业务服务器;任一所述业务服务器的基板管理控制器作为目标基板管理控制器广播链路层发现协议数据帧至所述目标广域网,所述目标广域网内除所述目标基板管理控制器外的基板管理控制器作为预设基板管理控制器接收所述目标基板管理控制器广播的链路层发现协议数据帧,以实现任两个所述业务服务器成功握手通信;当任一所述业务服务器的基板管理控制器报错时,获取所述报错的基板管理控制器预设的数据采集规则;基于所述预设的数据采集规则,通过所述网络文件***服务器,采集所述报错的基板管理控制器的数据;基于上述数据采集方法对报错的基板管理控制器的数据进行采集,具有以下有益效果:
1.数据存储空间大;通过网络文件***远程挂在和外接存储设备的方式收集业务服务器的数据,能够有效解决现有技术中存在的因数据存储空间不足而出现的数据无法持续收集的技术问题;
2.安全性高;整个数据采集流程和逻辑在基板管理控制器的代码逻辑下执行,并且通过网络文件***协议也在一定程度上对数据进行了加密,解决了现有技术中使用安全外壳协议采集数据存在的安全性差的技术问题;
3.适用场景广;本申请提出的远端和本地的数据采集方法,本机和集群的数据采集主体能够满足基板管理控制器在调试过程中的多种数据采集需求;
4.稳定性高;本申请所述的数据采集方法并不涉及底层代码逻辑,并且还能满足用户的定制化需求;
5.不消耗额外的硬件资源;基于本申请所述的数据采集方法,可以实现串口数据的持续收集,可以持续跟踪需要长久测试复现特定串口数据,而无需额外配置如上位机等硬件资源;
6.数据采集效率高;当目标广域网或目标局域网内的基板管理控制器报错时,预设基板管理控制器能够及时获取所述报错的基板管理控制器的数据。
附图说明
图1为一个实施例中数据采集方法的流程示意图;
图2为一个实施例中基于手动数据采集模式进行数据采集的流程示意图;
图3为一个实施例中基于控制数据采集模式进行数据采集的流程示意图;
图4为另一个实施例中基于智能数据采集模式进行数据采集的流程示意图;
图5为一个实施例中数据采集装置的结构框图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
实施例一
本申请提供的数据采集方法,所述方法包括以下步骤:
配置服务器集群和网络文件***服务器至目标广域网,所述服务器集群的数量至少为一,所述服务器集群包括业务服务器;
任一所述业务服务器的基板管理控制器作为目标基板管理控制器广播链路层发现协议数据帧至所述目标广域网,所述目标广域网内除所述目标基板管理控制器外的基板管理控制器作为预设基板管理控制器接收所述目标基板管理控制器广播的链路层发现协议数据帧,以实现任两个所述业务服务器成功握手通信;
当任一所述业务服务器的基板管理控制器报错时,获取所述基板管理控制器预设的数据采集规则;
基于所述预设的数据采集规则,通过所述网络文件***服务器,采集所述报错的基板管理控制器的数据。
具体地,所述数据采集方法包括:业务服务器上电后,所述业务服务器的基板管理控制器加载Uboot(全称: Universal Boot Loader;中文:引导加载程序)和Kernel(中文:操作***内核)及文件***,然后所述业务服务器的基板管理控制器作为目标基板管理控制器发起链路层发现协议服务和诊断数据远端收集进程;基板管理控制器的链路层发现协议业务服务器接收到目标广域网内其他业务服务器的基板管理控制器发送的链路层发现协议数据帧,获取目标基板管理控制器的属性信息;基于所述目标基板管理控制器的属性信息,生成目标基板管理控制器属性信息表,并存储所述目标基板管理控制器属性信息表至预设的内存文件。其中,所述链路层发现协议数据帧中携带有目标基板管理控制器的属性信息,所述属性信息包括:IP地址、链路层发现协议数据帧生存周期和最近一次接收所述目标基板管理控制器的链路层发现协议数据帧的时间。
在其中一个实施例中,基于所述目标基板管理控制器的属性信息,生成目标基板管理控制器属性信息表前,所述方法还包括:基于所述目标基板管理控制器的属性信息中的IP地址,判断所述基板管理控制器预设的内存文件中是否存在与所述IP地址一致的IP地址;若所述预设的内存文件中存在与所述IP地址一致的IP地址,则更新所述最近一次接收所述目标基板管理控制器的链路层发现协议数据帧的时间至所述IP地址;若所述预设的内存文件中不存在与所述IP地址一致的IP地址,则增加所述目标基板管理控制器的属性信息至预设的内存文件。
在其中一个实施例中,基于所述目标基板管理控制器的属性信息,生成目标基板管理控制器属性信息表后,所述方法还包括:所述基板管理控制器基于预设的内存文件中的IP地址,获取与所述IP地址对应的最近一次接收所述目标基板管理控制器的链路层发现协议数据帧的时间;获取当前时间与所述最近一次接收所述目标基板管理控制器的链路层发现协议数据帧的时间的时间差,判断所述时间差是否超过与所述IP地址对应的链路层发现协议数据帧生存周期;若所述时间差超过与所述IP地址对应的链路层发现协议数据帧生存周期,则删除所述目标基板管理控制器属性信息表。
在其中一个实施例中,当任一业务服务器的基板管理控制器报错时,则获取所述报错的基板管理控制器预设的数据采集规则,基于所述预设的数据采集规则,通过所述网络文件***服务器,采集所述报错的基板管理控制器的数据。
具体地,所述数据采集规则包括数据采集主体、数据采集方式和数据采集模式;其中,所述数据采集主体包括:本机和集群;所述数据采集方式包括:远端和本地;所述数据采集模式包括:手动数据采集模式、持续数据采集模式、智能数据采集模式和控制数据采集模式。即所述数据采集规则一共分为两大类,分别为远端数据采集方式和本地数据采集方式;其中,远端数据采集方式又可以分为两类,分别为基于本机的远端数据方法和基于集群的远端数据采集方式;本地数据采集方式又可以分为两类,分别为基于本机的本地数据采集方式和基于集群的本地数据采集方式;所述基于本机的远端数据采集方式又可以分为四类,分别为:基于本机的远端手动数据采集模式、基于本机的远端持续数据采集模式、基于本机的远端智能数据采集模式、基于本机的远端控制数据采集模式;所述基于集群的远端数据采集方式又可以分为四类,分别为:基于集群的远端手动数据采集模式、基于集群的远端持续数据采集模式、基于集群的远端智能数据采集模式、基于集群的远端控制数据采集模式;所述基于本机的本地数据采集方式又可以分为四类,分别为:基于本机的本地手动数据采集模式、基于本机的本地持续数据采集模式、基于本机的本地智能数据采集模式、基于本机的本地控制数据采集模式;所述基于集群的本地数据采集方式又可以分为四类,分别为:基于集群的本地手动数据采集模式、基于集群的本地持续数据采集模式、基于集群的本地智能数据采集模式、基于集群的本地控制数据采集模式。综上所述,数据采集规则一共有十六种,分别为:基于本机的远端手动数据采集模式、基于本机的远端持续数据采集模式、基于本机的远端智能数据采集模式、基于本机的远端控制数据采集模式、基于集群的远端手动数据采集模式、基于集群的远端持续数据采集模式、基于集群的远端智能数据采集模式、基于集群的远端控制数据采集模式、基于本机的本地手动数据采集模式、基于本机的本地持续数据采集模式、基于本机的本地智能数据采集模式、基于本机的本地控制数据采集模式、基于集群的本地手动数据采集模式、基于集群的本地持续数据采集模式、基于集群的本地智能数据采集模式、基于集群的本地控制数据采集模式。
其中,本地数据采集方式是远端数据采集方式的一种扩展的数据采集方式,主要是为了解决当目标广域网的网络运行状态异常时,实现对报错的基板管理控制器的数据的收集。
其中,所述手动数据采集模式,即为常态化空闲采集数据,只有本机业务服务器下发命令后才执行数据采集作业,数据收集完毕后生成数据收集状态日志并将收集的数据更新到网络文件***服务器;所述控制数据采集模式,即为常态化空闲采集数据,只有当远端(即网络文件***服务器)下发数据采集命令时才会执行数据采集作业,然后将数据采集命令的执行情况和返回信息写入网络文件***服务器;所述持续数据收集模式,即为常态化持续采集数据,远端持续收集基板管理控制器的数据,包括串口数据、日志数据、***内存数据等,并将上述数据持续更新到网络文件***服务器;所述智能数据收集模式,即为常态化持续采集数据,但是只有当任一业务服务器的基板管理控制器报错或预设的某种故障触发时,才会收集在故障发生或报错的前后一段时间内的数据,并将所述数据更新到网络文件***服务器,反之,则会将采集的数据丢弃。需要理解的是,当数据采集方式为远端时,即目标广域网或目标局域网内除目标基板管理控制器外的基板管理控制器按照预设的数据采集模式收集所述报错的基板管理控制器的数据。
在其中一个实施例中,获取所述报错的基板管理控制器预设的数据采集规则,包括:数据远端收集进程启动后,从报错的基板管理控制器的带电可擦可编程只读存储器中读取所述报错的基板管理控制器的预设的数据采集规则;当所述带电可擦可编程只读存储器中的数据采集规则为0xFF模式,且目标广域网的网络状态正常时,则默认采用基于本机的远端手动数据采集模式,然后读取配置到所述报错的基板管理控制器的网络文件***服务器的IP地址、存储路径等参数,如果这些参数没有配置,则间隔查查询对应的参数是否已经配置,如果已经配置了对应的网络文件***参数,则读取对应的网络文件***参数,根据预设的不同的数据采集规则采集所述报错的基板管理控制器的数据。
在其中一个实施例中,当采用本地数据采集方式时,所述方法还包括:基于数据采集的不同阶段点亮对应的状态灯;具体地,当未开始进行数据采集时,设置状态灯为熄灭状态,当存在数据收集需求但还未进行数据采集时,设置状态灯的闪烁频次为1Hz,当开始进行数据采集时,设置状态灯的闪烁频次为10Hz,当数据采集过程出现故障时,则设置所述状态灯的颜色为红色,闪烁频次为常亮,当数据采集结束时,则熄灭所述状态灯。
实施例二
在一个实施例中,如图1所示,本申请提供一种数据采集方法,所述方法包括以下步骤:
配置服务器集群和网络文件***服务器至目标广域网,所述服务器集群的数量至少为一,所述服务器集群包括业务服务器;
任一所述业务服务器的基板管理控制器作为目标基板管理控制器广播链路层发现协议数据帧至所述目标广域网,所述目标广域网内除所述目标基板管理控制器外的基板管理控制器作为预设基板管理控制器接收所述目标基板管理控制器广播的链路层发现协议数据帧,以实现任两个所述业务服务器成功握手通信;
当任一所述业务服务器的基板管理控制器报错时,获取所述报错的基板管理控制器预设的数据采集规则;
基于所述预设的数据采集规则,通过所述网络文件***服务器,采集所述报错的基板管理控制器的数据。
在其中一个实施例中,配置服务器集群至目标广域网前,所述方法还包括:配置业务服务器至目标局域网,生成服务器集群,所述业务服务器的数量至少为一;所述业务服务器的基板管理控制器作为目标基板管理控制器广播链路层发现协议数据帧至所述目标局域网,以实现任两个业务服务器成功握手通信。
在其中一个实施例中,所述业务服务器的基板管理控制器作为目标基板管理控制器广播链路层发现协议数据帧至所述目标广域网后,所述方法包括:所述基板管理控制器解析所述目标基板管理控制器广播的链路层发现协议数据帧,获取所述目标基板管理控制器的属性信息,所述属性信息包括:IP地址、链路层发现协议数据帧生存周期和最近一次接收所述目标基板管理控制器的链路层发现协议数据帧的时间;基于所述目标基板管理控制器的属性信息,生成目标基板管理控制器属性信息表,并存储所述目标基板管理控制器属性信息表至预设的内存文件。
在其中一个实施例中,基于所述目标基板管理控制器的属性信息,生成目标基板管理控制器属性信息表前,所述方法还包括:基于所述目标基板管理控制器的属性信息中的IP地址,判断所述基板管理控制器预设的内存文件中是否存在与所述IP地址一致的IP地址;若所述预设的内存文件中存在与所述IP地址一致的IP地址,则更新所述最近一次接收所述目标基板管理控制器的链路层发现协议数据帧的时间至所述IP地址;若所述预设的内存文件中不存在与所述IP地址一致的IP地址,则增加所述目标基板管理控制器的属性信息至预设的内存文件。
在其中一个实施例中,基于所述目标基板管理控制器的属性信息,生成目标基板管理控制器属性信息表后,所述方法还包括:所述基板管理控制器基于预设的内存文件中的IP地址,获取与所述IP地址对应的最近一次接收所述目标基板管理控制器的链路层发现协议数据帧的时间;获取当前时间与所述最近一次接收所述目标基板管理控制器的链路层发现协议数据帧的时间的时间差,判断所述时间差是否超过与所述IP地址对应的链路层发现协议数据帧生存周期;若所述时间差超过与所述IP地址对应的链路层发现协议数据帧生存周期,则删除所述目标基板管理控制器属性信息表。
在其中一个实施例中,当所述目标广域网内任一所述业务服务器的基板管理控制器报错时,获取所述报错的基板管理控制器预设的数据采集规则,包括:所述报错的基板管理控制器通过所述目标广域网和所述目标局域网发送报错信息至任一业务服务器的基板管理控制器;所述基板管理控制器接收到所述报错信息后,启动诊断数据远端收集进程,获取所述报错的基板管理控制器预设的数据采集规则。
在其中一个实施例中,基于所述预设的数据采集规则,通过所述网络文件***服务器,采集所述报错的基板管理控制器的数据,包括:从所述报错的基板管理控制器的带电可擦可编程只读存储器中读取所述报错的基板管理控制器的预设的数据采集规则;读取配置至所述报错的基板管理控制器的网络文件***服务器的网络文件***参数;基于所述预设的数据采集规则与所述网络文件***服务器的网络文件***参数,通过所述网络文件***服务器,采集所述报错的基板管理控制器的数据。
在其中一个实施例中,所述数据采集规则,包括:数据采集主体、数据采集方式和数据采集模式;所述数据采集主体包括:本机和集群;所述数据采集方式包括:远端和本地;所述数据采集模式包括:手动数据采集模式、持续数据采集模式、智能数据采集模式和控制数据采集模式。
在其中一个实施例中,若所述带电可擦可编程只读存储器中预设的数据采集规则有效,则基于预设的数据采集规则,通过所述网络文件***服务器,采集所述报错的基板管理控制器的数据,包括:判断所述目标广域网的网络状态是否正常;若所述目标广域网的网络状态正常,则采用预设的数据采集规则,通过所述网络文件***服务器,采集所述报错的基板管理控制器的数据;若所述目标广域网的网络状态异常,则外接存储设备至所述报错的基板管理控制器,并判断所述数据采集方式是否为本地。
在其中一个实施例中,判断所述数据采集方式是否为本地,所述方法包括:若所述数据采集方式为本地,则判断所述数据采集主体是否为本机;若所述数据采集方式不为本地,则采用数据采集主体为本机,数据采集方式为本地,数据采集模式为手动数据采集模式的数据采集规则采集所述报错的基板管理控制器的数据。
在其中一个实施例中,判断所述数据采集主体是否为本机,包括:若所述数据采集主体为本机,则采用预设的数据采集模式采集所述报错的基板管理控制器的数据;若所述数据采集主体不为本机,则判断所述目标局域网的网络状态是否正常。
在其中一个实施例中,判断所述目标局域网的网络状态是否正常,包括:若所述目标局域网的网络状态正常,则采用预设的数据采集模式采集所述报错的基板管理控制器的数据;若所述目标局域网的网络状态异常,则获取所述预设的数据采集模式,采用数据采集主体为本机,数据采集方式为本地,数据采集模式为预设的数据采集模式的数据采集规则采集所述报错的基板管理控制器的数据。
在其中一个实施例中,当预设的数据采集方式为远端时,所述方法还包括:当所述数据采集主体为本机时,则所述报错的基板管理控制器按照所述预设的数据采集模式,采集所述报错的基板管理控制器的数据,并写入所述网络文件***服务器;当所述数据采集主体为集群时,则由预先设定的预设基板管理控制器按照所述预设的数据采集模式,采集所述报错的基板管理控制器的数据,并写入所述网络文件***服务器。
在其中一个实施例中,当预设的数据采集方式为本地时,所述方法还包括:当所述数据采集主体为集群时,则由预先设定的预设基板管理控制器按照所述预设的数据采集模式采集所述报错的基板管理控制器的数据,并写入所述存储设备;当所述数据采集主体为本机时,则所述报错的基板管理控制器按照所述预设的数据采集模式采集所述报错的基板管理控制器的数据,并写入所述存储设备。
在其中一个实施例中,如图2所示,当所述预设的数据采集模式为手动数据采集模式时,所述方法包括以下步骤:步骤A1、获取报错的基板管理控制器的数据采集执行信号;步骤A2、待获取到所述报错的基板管理控制器的数据采集执行信号后,获取所述报错的基板管理控制器的网络文件***参数,基于所述报错的基板管理控制器的网络文件***参数将所述网络文件***服务器的路径挂载至所述报错的基板管理控制器;步骤A3、将所述报错的基板管理控制器的串口数据输出至异步收发传输端;步骤A4、基于所述异步收发传输端获取所述报错的基板管理控制器串口数据,并将所述串口数据写入至所述网络文件***服务器。
在其中一个实施例中,当预设的数据采集模式为持续数据采集模式时,所述方法包括:重复执行所述步骤A1~A4,采集所述报错的基板管理控制器的数据。
在其中一个实施例中,如图3所示,当所述预设的数据采集模式为控制数据采集模式时,所述方法包括以下步骤:步骤B1、获取报错的基板管理控制器的网络文件***配置参数;步骤B2、基于所述网络文件***的配置参数将所述网络文件***服务器挂载至所述报错的基板管理控制器;步骤B3、判断是否成功接收数据采集执行指令,所述执行指令包括IPM1发送的数据采集执行指令和挂载至所述报错的基板管理控制器的网络文件***服务器中存储的数据采集执行指令;步骤B4、若成功接收所述数据采集执行指令,则执行所述数据采集执行指令生成执行结果,并将所述执行结果写入网络文件***服务器,所述执行结果包括执行成功和执行失败。
在其中一个实施例中,如图4所示,当所述预设的数据采集模式为智能数据采集模式时,所述方法包括:步骤C1、读取报错的基板管理控制器的网络文件***配置参数;步骤C2、基于所述报错的基板管理控制器的网络文件***配置参数,将所述网络文件***服务器对应目录挂载至所述报错的基板管理控制器步骤C3、收集所述报错的基板管理控制器的串口数据,解析所述报错的基板管理控制器的串口数据;步骤C4、判断所述报错的基板管理控制器的运行异常状态是否为真,若所述报错的基板管理控制器的运行异常状态为真,则执行步骤C5;步骤C5、将所述报错的基板管理控制器的串口数据存入网络文件***配置挂载目录对应文件中。
在其中一个实施例中,判断所述报错的基板管理控制器的运行异常状态是否为真,包括:若所述报错的基板管理控制器的运行异常状态为假,则执行步骤C6;步骤C6、判断所述报错的基板管理控制器是否存在有数据收集需求的进程线程。
在其中一个实施例中,判断所述报错的基板管理控制器是否存在有数据收集需求的进程线程,包括:若所述报错的基板管理控制器中不存在有数据收集需求的进程线程,则执行步骤C7;反之,则执行步骤C5;步骤C7、丢弃所述报错的基板管理控制器的串口数据。
在其中一个实施例中,所述方法包括:预先生成预设基板管理控制器列表;预先生成预设基板管理控制器列表,包括:基于任一所述目标基板管理控制器,生成预设基板管理控制器集,所述预设基板管理控制器集中包括所述目标广域网内除所述目标基板管理控制器外的至少一个基板管理控制器,定义所述基板管理控制器为预设基板管理控制器;对所述预设基板管理控制器集中的预设基板管理控制器进行优先级排序,按照优先级从高到低的顺序生成预设基板管理控制器列表。
在其中一个实施例中,基于所述预设的数据采集规则,通过所述网络文件***服务器,采集所述报错的基板管理控制器的数据,包括:遍历所述预设基板管理控制器列表,按照所述预设基板管理控制器优先级顺序,选定其中一个预设基板管理控制器基于所述报错的基板管理控制器预设的数据采集规则,通过所述网络文件***服务器,采集所述报错的基板管理控制器的数据。
在其中一个实施例中,基于所述预设的数据采集规则,通过所述网络文件***服务器,采集所述报错的基板管理控制器的数据,还包括:当所述数据采集主体为集群,所述数据采集模式为持续数据采集模式时,所述预设基板管理控制器集中的预设基板管理控制器获取所述目标广域网内除所述报错的基板管理控制器外的任一预设基板管理控制器的串口资源占用率;选择串口资源占用率最低的预设基板管理控制器按照所述持续数据采集模式,采集所述报错的基板管理控制器的数据。
在其中一个实施例中,所述报错的基板管理控制器的串口数据包括:配置分区、日志分区、内存分区、网络路由参数、内核资源参数、资源占用信息和进程线程运行信息。
实施例三
在一个实施例中,如图5所示,本申请提供一种数据采集装置,所述装置包括:
配置单元,以用于配置服务器集群和网络文件***服务器至目标广域网,所述服务器集群的数量至少为一,所述服务器集群包括业务服务器;还用于任一所述业务服务器的基板管理控制器作为目标基板管理控制器广播链路层发现协议数据帧至所述目标广域网,所述目标广域网内除所述目标基板管理控制器外的基板管理控制器作为预设基板管理控制器接收所述目标基板管理控制器广播的链路层发现协议数据帧,以实现任两个所述业务服务器成功握手通信;
获取单元,以用于当任一所述业务服务器的基板管理控制器报错时,获取所述报错的基板管理控制器预设的数据采集规则;
采集单元,以用于基于所述预设的数据采集规则,通过所述网络文件***服务器,采集所述报错的基板管理控制器的数据。
在其中一个实施例中,所述配置单元,还用于配置业务服务器至目标局域网,生成服务器集群,所述业务服务器的数量至少为一;所述业务服务器的基板管理控制器作为目标基板管理控制器广播链路层发现协议数据帧至所述目标局域网,以实现任两个业务服务器成功握手通信。
在其中一个实施例中,所述获取单元,还用于所述基板管理控制器解析所述目标基板管理控制器广播的链路层发现协议数据帧,获取所述目标基板管理控制器的属性信息,所述属性信息包括:IP地址、链路层发现协议数据帧生存周期和最近一次接收所述目标基板管理控制器的链路层发现协议数据帧的时间;基于所述目标基板管理控制器的属性信息,生成目标基板管理控制器属性信息表,并存储所述目标基板管理控制器属性信息表至预设的内存文件。
在其中一个实施例中,所述装置还包括更新单元,所述更新单元以用于基于所述目标基板管理控制器的属性信息中的IP地址,判断所述基板管理控制器预设的内存文件中是否存在与所述IP地址一致的IP地址;若所述预设的内存文件中存在与所述IP地址一致的IP地址,则更新所述最近一次接收所述目标基板管理控制器的链路层发现协议数据帧的时间至所述IP地址;若所述预设的内存文件中不存在与所述IP地址一致的IP地址,则增加所述目标基板管理控制器的属性信息至预设的内存文件。
在其中一个实施例中,所述装置还包括判断单元,所述获取单元还用于所述基板管理控制器基于预设的内存文件中的IP地址,获取与所述IP地址对应的最近一次接收所述目标基板管理控制器的链路层发现协议数据帧的时间;获取当前时间与所述最近一次接收所述目标基板管理控制器的链路层发现协议数据帧的时间的时间差,所述判断单元以用于判断所述时间差是否超过与所述IP地址对应的链路层发现协议数据帧生存周期;若所述时间差超过与所述IP地址对应的链路层发现协议数据帧生存周期,所述更新单元还用于删除所述目标基板管理控制器属性信息表。
在其中一个实施例中,所述获取单元,还用于从所述报错的基板管理控制器的带电可擦可编程只读存储器中读取所述报错的基板管理控制器的预设的数据采集规则;读取配置至所述报错的基板管理控制器的网络文件***服务器的网络文件***参数;基于所述预设的数据采集规则,通过所述网络文件***服务器,采集所述报错的基板管理控制器的数据;其中,所述数据采集规则,包括:数据采集主体、数据采集方式和数据采集模式;所述数据采集主体包括:本机和集群;所述数据采集方式包括:远端和本地;所述数据采集模式包括:手动数据采集模式、持续数据采集模式、智能数据采集模式和控制数据采集模式。
在其中一个实施例中,所述判断单元,还用于判断所述目标广域网的网络状态是否正常;若所述目标广域网的网络状态正常,则所述采集单元还用于采用预设的数据采集规则,通过所述网络文件***服务器,采集所述报错的基板管理控制器的数据;若所述目标广域网的网络状态异常,则外接存储设备至所述报错的基板管理控制器,并基于所述判断单元判断所述数据采集方式是否为本地。
在其中一个实施例中,若所述判断单元判断所述数据采集方式为本地,则基于所述判断单元判断所述数据采集主体是否为本机;若所述数据采集方式不为本地,则采用数据采集主体为本机,数据采集方式为本地,数据采集模式为手动数据采集模式的数据采集规则采集所述报错的基板管理控制器的数据。
在其中一个实施例中,所述采集单元,还用于若所述数据采集主体为本机,则采用预设的数据采集模式采集所述报错的基板管理控制器的数据;若所述数据采集主体不为本机,则基于所述判断单元判断所述目标局域网的网络状态是否正常。
在其中一个实施例中,所述采集单元,还用于若所述目标局域网的网络状态正常,则采用预设的数据采集模式采集所述报错的基板管理控制器的数据;若所述目标局域网的网络状态异常,则获取所述预设的数据采集模式,采用数据采集主体为本机,数据采集方式为本地,数据采集模式为预设的数据采集模式的数据采集规则采集所述报错的基板管理控制器的数据。
在其中一个实施例中,所述采集单元,还用于当所述数据采集主体为本机时,则所述报错的基板管理控制器按照所述预设的数据采集模式,采集所述报错的基板管理控制器的数据,并写入所述网络文件***服务器;当所述数据采集主体为集群时,则由预先设定的预设基板管理控制器按照所述预设的数据采集模式,采集所述报错的基板管理控制器的数据,并写入所述网络文件***服务器。
在其中一个实施例中,所述采集单元,还用于当所述数据采集主体为集群时,则由预先设定的预设基板管理控制器按照所述预设的数据采集模式采集所述报错的基板管理控制器的数据,并写入所述存储设备;当所述数据采集主体为本机时,则所述报错的基板管理控制器按照所述预设的数据采集模式采集所述报错的基板管理控制器的数据,并写入所述存储设备。
在其中一个实施例中,所述采集单元,还用于执行以下步骤: 步骤A1、获取报错的基板管理控制器的数据采集执行信号;步骤A2、待获取到所述报错的基板管理控制器的数据采集执行信号后,获取所述报错的基板管理控制器的网络文件***参数,基于所述报错的基板管理控制器的网络文件***参数将所述网络文件***服务器的路径挂载至所述报错的基板管理控制器;步骤A3、将所述报错的基板管理控制器的串口数据输出至异步收发传输端;步骤A4、基于所述异步收发传输端获取所述报错的基板管理控制器串口数据,并将所述串口数据写入至所述网络文件***服务器。
在其中一个实施例中,所述采集单元,还用于重复执行所述步骤A1~A4,采集所述报错的基板管理控制器的数据。
在其中一个实施例中,所述采集单元,还用于执行以下步骤:步骤B1、获取报错的基板管理控制器的网络文件***配置参数;步骤B2、基于所述网络文件***的配置参数将所述网络文件***服务器挂载至所述报错的基板管理控制器;步骤B3、判断是否成功接收数据采集执行指令,所述执行指令包括IPM1发送的数据采集执行指令和挂载至所述报错的基板管理控制器的网络文件***服务器中存储的数据采集执行指令;步骤B4、若成功接收所述数据采集执行指令,则执行所述数据采集执行指令生成执行结果,并将所述执行结果写入网络文件***服务器,所述执行结果包括执行成功和执行失败。
在其中一个实施例中,所述采集单元,还用于执行以下步骤:步骤C1、读取报错的基板管理控制器的网络文件***配置参数;步骤C2、基于所述报错的基板管理控制器的网络文件***配置参数,将所述网络文件***服务器对应目录挂载至所述报错的基板管理控制器步骤C3、收集所述报错的基板管理控制器的串口数据,解析所述报错的基板管理控制器的串口数据;步骤C4、判断所述报错的基板管理控制器的运行异常状态是否为真,若所述报错的基板管理控制器的运行异常状态为真,则执行步骤C5;步骤C5、将所述报错的基板管理控制器的串口数据存入网络文件***配置挂载目录对应文件中。
在其中一个实施例中,所述采集单元,还用于执行以下步骤:若所述报错的基板管理控制器的运行异常状态为假,则执行步骤C6;步骤C6、判断所述报错的基板管理控制器是否存在有数据收集需求的进程线程。
在其中一个实施例中,所述采集单元,还用于若所述报错的基板管理控制器中不存在有数据收集需求的进程线程,则执行步骤C7;反之,则执行步骤C5;步骤C7、丢弃所述报错的基板管理控制器的串口数据。
在其中一个实施例中,所述配置单元,还用于基于任一所述目标基板管理控制器,生成预设基板管理控制器集,所述预设基板管理控制器集中包括所述目标广域网内除所述目标基板管理控制器外的至少一个基板管理控制器,定义所述基板管理控制器为预设基板管理控制器;对所述预设基板管理控制器集中的预设基板管理控制器进行优先级排序,按照优先级从高到低的顺序生成预设基板管理控制器列表。
在其中一个实施例中,所述采集单元,还用于遍历所述预设基板管理控制器列表,按照所述预设基板管理控制器优先级顺序,选定其中一个预设基板管理控制器基于所述报错的基板管理控制器预设的数据采集规则,通过所述网络文件***服务器,采集所述报错的基板管理控制器的数据。
在其中一个实施例中,所述获取单元,还用于当所述数据采集主体为集群,所述数据采集模式为持续数据采集模式时,所述预设基板管理控制器集中的预设基板管理控制器获取所述目标广域网内除所述报错的基板管理控制器外的任一预设基板管理控制器的串口资源占用率;选择串口资源占用率最低的预设基板管理控制器按照所述持续数据采集模式,采集所述报错的基板管理控制器的数据;其中,所述报错的基板管理控制器的串口数据包括:配置分区、日志分区、内存分区、网络路由参数、内核资源参数、资源占用信息和进程线程运行信息。
关于数据采集装置的具体限定可以参见上文中对于数据采集方法的限定,在此不再赘述。上述数据采集装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
实施例四
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图6所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***和计算机程序。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种数据采集方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
配置服务器集群和网络文件***服务器至目标广域网,所述服务器集群的数量至少为一,所述服务器集群包括业务服务器;
任一所述业务服务器的基板管理控制器作为目标基板管理控制器广播链路层发现协议数据帧至所述目标广域网,所述目标广域网内除所述目标基板管理控制器外的基板管理控制器作为预设基板管理控制器接收所述目标基板管理控制器广播的链路层发现协议数据帧,以实现任两个所述业务服务器成功握手通信;
当任一所述业务服务器的基板管理控制器报错时,获取所述报错的基板管理控制器预设的数据采集规则;
基于所述预设的数据采集规则,通过所述网络文件***服务器,采集所述报错的基板管理控制器的数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:配置业务服务器至目标局域网,生成服务器集群,所述业务服务器的数量至少为一;所述业务服务器的基板管理控制器作为目标基板管理控制器广播链路层发现协议数据帧至所述目标局域网,以实现任两个业务服务器成功握手通信。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:所述基板管理控制器解析所述目标基板管理控制器广播的链路层发现协议数据帧,获取所述目标基板管理控制器的属性信息,所述属性信息包括:IP地址、链路层发现协议数据帧生存周期和最近一次接收所述目标基板管理控制器的链路层发现协议数据帧的时间;基于所述目标基板管理控制器的属性信息,生成目标基板管理控制器属性信息表,并存储所述目标基板管理控制器属性信息表至预设的内存文件。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:基于所述目标基板管理控制器的属性信息中的IP地址,判断所述基板管理控制器预设的内存文件中是否存在与所述IP地址一致的IP地址;若所述预设的内存文件中存在与所述IP地址一致的IP地址,则更新所述最近一次接收所述目标基板管理控制器的链路层发现协议数据帧的时间至所述IP地址;若所述预设的内存文件中不存在与所述IP地址一致的IP地址,则增加所述目标基板管理控制器的属性信息至预设的内存文件。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:所述基板管理控制器基于预设的内存文件中的IP地址,获取与所述IP地址对应的最近一次接收所述目标基板管理控制器的链路层发现协议数据帧的时间;获取当前时间与所述最近一次接收所述目标基板管理控制器的链路层发现协议数据帧的时间的时间差,判断所述时间差是否超过与所述IP地址对应的链路层发现协议数据帧生存周期;若所述时间差超过与所述IP地址对应的链路层发现协议数据帧生存周期,则删除所述目标基板管理控制器属性信息表。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:所述报错的基板管理控制器通过所述目标广域网和所述目标局域网发送报错信息至任一业务服务器的基板管理控制器;所述基板管理控制器接收到所述报错信息后,启动诊断数据远端收集进程,获取所述报错的基板管理控制器预设的数据采集规则。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:从所述报错的基板管理控制器的带电可擦可编程只读存储器中读取所述报错的基板管理控制器的预设的数据采集规则;读取配置至所述报错的基板管理控制器的网络文件***服务器的网络文件***参数;基于所述预设的数据采集规则,通过所述网络文件***服务器,采集所述报错的基板管理控制器的数据;其中,所述数据采集规则,包括:数据采集主体、数据采集方式和数据采集模式;所述数据采集主体包括:本机和集群;所述数据采集方式包括:远端和本地;所述数据采集模式包括:手动数据采集模式、持续数据采集模式、智能数据采集模式和控制数据采集模式。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:判断所述目标广域网的网络状态是否正常;若所述目标广域网的网络状态正常,则采用预设的数据采集规则,通过所述网络文件***服务器,采集所述报错的基板管理控制器的数据;若所述目标广域网的网络状态异常,则外接存储设备至所述报错的基板管理控制器,并判断所述数据采集方式是否为本地。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:若所述数据采集方式为本地,则判断所述数据采集主体是否为本机;若所述数据采集方式不为本地,则采用数据采集主体为本机,数据采集方式为本地,数据采集模式为手动数据采集模式的数据采集规则采集所述报错的基板管理控制器的数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:若所述数据采集主体为本机,则采用预设的数据采集模式采集所述报错的基板管理控制器的数据;若所述数据采集主体不为本机,则判断所述目标局域网的网络状态是否正常。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:若所述目标局域网的网络状态正常,则采用预设的数据采集模式采集所述报错的基板管理控制器的数据;若所述目标局域网的网络状态异常,则获取所述预设的数据采集模式,采用数据采集主体为本机,数据采集方式为本地,数据采集模式为预设的数据采集模式的数据采集规则采集所述报错的基板管理控制器的数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:当所述数据采集主体为本机时,则所述报错的基板管理控制器按照所述预设的数据采集模式,采集所述报错的基板管理控制器的数据,并写入所述网络文件***服务器;当所述数据采集主体为集群时,则由预先设定的预设基板管理控制器按照所述预设的数据采集模式,采集所述报错的基板管理控制器的数据,并写入所述网络文件***服务器。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:当所述数据采集主体为集群时,则由预先设定的预设基板管理控制器按照所述预设的数据采集模式采集所述报错的基板管理控制器的数据,并写入所述存储设备;当所述数据采集主体为本机时,则所述报错的基板管理控制器按照所述预设的数据采集模式采集所述报错的基板管理控制器的数据,并写入所述存储设备。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:步骤A1、获取报错的基板管理控制器的数据采集执行信号;步骤A2、待获取到所述报错的基板管理控制器的数据采集执行信号后,获取所述报错的基板管理控制器的网络文件***参数,基于所述报错的基板管理控制器的网络文件***参数将所述网络文件***服务器的路径挂载至所述报错的基板管理控制器;步骤A3、将所述报错的基板管理控制器的串口数据输出至异步收发传输端;步骤A4、基于所述异步收发传输端获取所述报错的基板管理控制器串口数据,并将所述串口数据写入至所述网络文件***服务器。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:步骤B1、获取报错的基板管理控制器的网络文件***配置参数;步骤B2、基于所述网络文件***的配置参数将所述网络文件***服务器挂载至所述报错的基板管理控制器;步骤B3、判断是否成功接收数据采集执行指令,所述执行指令包括IPM1发送的数据采集执行指令和挂载至所述报错的基板管理控制器的网络文件***服务器中存储的数据采集执行指令;步骤B4、若成功接收所述数据采集执行指令,则执行所述数据采集执行指令生成执行结果,并将所述执行结果写入网络文件***服务器,所述执行结果包括执行成功和执行失败。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:步骤C1、读取报错的基板管理控制器的网络文件***配置参数;步骤C2、基于所述报错的基板管理控制器的网络文件***配置参数,将所述网络文件***服务器对应目录挂载至所述报错的基板管理控制器步骤C3、收集所述报错的基板管理控制器的串口数据,解析所述报错的基板管理控制器的串口数据;步骤C4、判断所述报错的基板管理控制器的运行异常状态是否为真,若所述报错的基板管理控制器的运行异常状态为真,则执行步骤C5;步骤C5、将所述报错的基板管理控制器的串口数据存入网络文件***配置挂载目录对应文件中。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:若所述报错的基板管理控制器的运行异常状态为假,则执行步骤C6;步骤C6、判断所述报错的基板管理控制器是否存在有数据收集需求的进程线程。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:若所述报错的基板管理控制器中不存在有数据收集需求的进程线程,则执行步骤C7;反之,则执行步骤C5;步骤C7、丢弃所述报错的基板管理控制器的串口数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:基于任一所述目标基板管理控制器,生成预设基板管理控制器集,所述预设基板管理控制器集中包括所述目标广域网内除所述目标基板管理控制器外的至少一个基板管理控制器,定义所述基板管理控制器为预设基板管理控制器;对所述预设基板管理控制器集中的预设基板管理控制器进行优先级排序,按照优先级从高到低的顺序生成预设基板管理控制器列表。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:遍历所述预设基板管理控制器列表,按照所述预设基板管理控制器优先级顺序,选定其中一个预设基板管理控制器基于所述报错的基板管理控制器预设的数据采集规则,通过所述网络文件***服务器,采集所述报错的基板管理控制器的数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:当所述数据采集主体为集群,所述数据采集模式为持续数据采集模式时,所述预设基板管理控制器集中的预设基板管理控制器获取所述目标广域网内除所述报错的基板管理控制器外的任一预设基板管理控制器的串口资源占用率;选择串口资源占用率最低的预设基板管理控制器按照所述持续数据采集模式,采集所述报错的基板管理控制器的数据;其中,所述报错的基板管理控制器的串口数据包括:配置分区、日志分区、内存分区、网络路由参数、内核资源参数、资源占用信息和进程线程运行信息。
实施例五
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如实施例一和实施例二所述的数据采集方法。
在其中一个实施例中,计算机程序被处理器执行时实现如下步骤:
配置服务器集群和网络文件***服务器至目标广域网,所述服务器集群的数量至少为一,所述服务器集群包括业务服务器;
任一所述业务服务器的基板管理控制器作为目标基板管理控制器广播链路层发现协议数据帧至所述目标广域网,所述目标广域网内除所述目标基板管理控制器外的基板管理控制器作为预设基板管理控制器接收所述目标基板管理控制器广播的链路层发现协议数据帧,以实现任两个所述业务服务器成功握手通信;
当任一所述业务服务器的基板管理控制器报错时,获取所述报错的基板管理控制器预设的数据采集规则;
基于所述预设的数据采集规则,通过所述网络文件***服务器,采集所述报错的基板管理控制器的数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (26)

1.一种数据采集方法,其特征在于,所述方法包括:
配置服务器集群和网络文件***服务器至目标广域网,所述服务器集群的数量至少为一,所述服务器集群包括业务服务器;
任一所述业务服务器的基板管理控制器作为目标基板管理控制器广播链路层发现协议数据帧至所述目标广域网,所述目标广域网内除所述目标基板管理控制器外的基板管理控制器作为预设基板管理控制器接收所述目标基板管理控制器广播的链路层发现协议数据帧,以实现任两个所述业务服务器成功握手通信;
当任一所述业务服务器的基板管理控制器报错时,获取所述报错的基板管理控制器预设的数据采集规则;
基于所述预设的数据采集规则,通过所述网络文件***服务器,采集所述报错的基板管理控制器的数据。
2.根据权利要求1所述的数据采集方法,其特征在于,配置服务器集群至目标广域网前,所述方法还包括:
配置业务服务器至目标局域网,生成服务器集群,所述业务服务器的数量至少为一;
所述业务服务器的基板管理控制器作为目标基板管理控制器广播链路层发现协议数据帧至所述目标局域网,以实现任两个业务服务器成功握手通信。
3.根据权利要求2所述的数据采集方法,其特征在于,所述数据采集规则,包括:数据采集主体、数据采集方式和数据采集模式;
所述数据采集主体包括:本机和集群;
所述数据采集方式包括:远端和本地;
所述数据采集模式包括:手动数据采集模式、持续数据采集模式、智能数据采集模式和控制数据采集模式。
4.根据权利要求3所述的数据采集方法,其特征在于,当所述目标广域网内任一所述业务服务器的基板管理控制器报错时,获取所述报错的基板管理控制器预设的数据采集规则,包括:
所述报错的基板管理控制器通过所述目标广域网和所述目标局域网发送报错信息至任一业务服务器的基板管理控制器;
所述基板管理控制器接收到所述报错信息后,启动诊断数据远端收集进程,获取所述报错的基板管理控制器预设的数据采集规则。
5.根据权利要求4所述的数据采集方法,其特征在于,基于所述预设的数据采集规则,通过所述网络文件***服务器,采集所述报错的基板管理控制器的数据,包括:
从所述报错的基板管理控制器的带电可擦可编程只读存储器中读取所述报错的基板管理控制器的预设的数据采集规则;
读取配置至所述报错的基板管理控制器的网络文件***服务器的网络文件***参数;
基于所述预设的数据采集规则与所述网络文件***服务器的网络文件***参数,通过所述网络文件***服务器,采集所述报错的基板管理控制器的数据。
6.根据权利要求5所述的数据采集方法,其特征在于,若所述带电可擦可编程只读存储器中预设的数据采集规则有效,则基于预设的数据采集规则,通过所述网络文件***服务器,采集所述报错的基板管理控制器的数据,包括:
判断所述目标广域网的网络状态是否正常;
若所述目标广域网的网络状态正常,则采用预设的数据采集规则,通过所述网络文件***服务器,采集所述报错的基板管理控制器的数据;
若所述目标广域网的网络状态异常,则外接存储设备至所述报错的基板管理控制器,并判断所述数据采集方式是否为本地。
7.根据权利要求6所述的数据采集方法,其特征在于,判断所述数据采集方式是否为本地,所述方法包括:
若所述数据采集方式为本地,则判断所述数据采集主体是否为本机;
若所述数据采集方式不为本地,则采用数据采集主体为本机,数据采集方式为本地,数据采集模式为手动数据采集模式的数据采集规则采集所述报错的基板管理控制器的数据。
8.根据权利要求7所述的数据采集方法,其特征在于,判断所述数据采集主体是否为本机,包括:
若所述数据采集主体为本机,则采用预设的数据采集模式采集所述报错的基板管理控制器的数据;
若所述数据采集主体不为本机,则判断所述目标局域网的网络状态是否正常。
9.根据权利要求8所述的数据采集方法,其特征在于,判断所述目标局域网的网络状态是否正常,包括:
若所述目标局域网的网络状态正常,则采用预设的数据采集模式采集所述报错的基板管理控制器的数据;
若所述目标局域网的网络状态异常,则获取所述预设的数据采集模式,采用数据采集主体为本机,数据采集方式为本地,数据采集模式为预设的数据采集模式的数据采集规则采集所述报错的基板管理控制器的数据。
10.根据权利要求5所述的数据采集方法,其特征在于,当预设的数据采集方式为远端时,所述方法还包括:
当所述数据采集主体为本机时,则所述报错的基板管理控制器按照所述预设的数据采集模式,采集所述报错的基板管理控制器的数据,并写入所述网络文件***服务器;
当所述数据采集主体为集群时,则由预先设定的预设基板管理控制器按照所述预设的数据采集模式,采集所述报错的基板管理控制器的数据,并写入所述网络文件***服务器。
11.根据权利要求6所述的数据采集方法,其特征在于,当预设的数据采集方式为本地时,所述方法还包括:
当所述数据采集主体为集群时,则由预先设定的预设基板管理控制器按照所述预设的数据采集模式采集所述报错的基板管理控制器的数据,并写入所述存储设备;
当所述数据采集主体为本机时,则所述报错的基板管理控制器按照所述预设的数据采集模式采集所述报错的基板管理控制器的数据,并写入所述存储设备。
12.根据权利要求10所述的数据采集方法,其特征在于,当所述预设的数据采集模式为手动数据采集模式时,所述方法包括以下步骤:
步骤A1、获取报错的基板管理控制器的数据采集执行信号;
步骤A2、待获取到所述报错的基板管理控制器的数据采集执行信号后,获取所述报错的基板管理控制器的网络文件***参数,基于所述报错的基板管理控制器的网络文件***参数将所述网络文件***服务器的路径挂载至所述报错的基板管理控制器;
步骤A3、将所述报错的基板管理控制器的串口数据输出至异步收发传输端;
步骤A4、基于所述异步收发传输端获取所述报错的基板管理控制器串口数据,并将所述串口数据写入至所述网络文件***服务器。
13.根据权利要求12所述的数据采集方法,其特征在于,当预设的数据采集模式为持续数据采集模式时,所述方法包括:重复执行所述步骤A1~A4,采集所述报错的基板管理控制器的数据。
14.根据权利要求10所述的数据采集方法,其特征在于,当所述预设的数据采集模式为控制数据采集模式时,所述方法包括以下步骤:
步骤B1、获取报错的基板管理控制器的网络文件***配置参数;
步骤B2、基于所述网络文件***的配置参数将所述网络文件***服务器挂载至所述报错的基板管理控制器;
步骤B3、判断是否成功接收数据采集执行指令,所述执行指令包括IPM1发送的数据采集执行指令和挂载至所述报错的基板管理控制器的网络文件***服务器中存储的数据采集执行指令;
步骤B4、若成功接收所述数据采集执行指令,则执行所述数据采集执行指令生成执行结果,并将所述执行结果写入网络文件***服务器,所述执行结果包括执行成功和执行失败。
15.根据权利要求10所述的数据采集方法,其特征在于,当所述预设的数据采集模式为智能数据采集模式时,所述方法包括:
步骤C1、读取报错的基板管理控制器的网络文件***配置参数;
步骤C2、基于所述报错的基板管理控制器的网络文件***配置参数,将所述网络文件***服务器对应目录挂载至所述报错的基板管理控制器;
步骤C3、收集所述报错的基板管理控制器的串口数据,解析所述报错的基板管理控制器的串口数据;
步骤C4、判断所述报错的基板管理控制器的运行异常状态是否为真,若所述报错的基板管理控制器的运行异常状态为真,则执行步骤C5;
步骤C5、将所述报错的基板管理控制器的串口数据存入网络文件***配置挂载目录对应文件中。
16.根据权利要求15所述的数据采集方法,其特征在于,判断所述报错的基板管理控制器的运行异常状态是否为真,包括:
若所述报错的基板管理控制器的运行异常状态为假,则执行步骤C6;
步骤C6、判断所述报错的基板管理控制器是否存在有数据收集需求的进程线程。
17.根据权利要求16所述的数据采集方法,其特征在于,判断所述报错的基板管理控制器是否存在有数据收集需求的进程线程,包括:
若所述报错的基板管理控制器中不存在有数据收集需求的进程线程,则执行步骤C7;反之,则执行步骤C5;
步骤C7、丢弃所述报错的基板管理控制器的串口数据。
18.根据权利要求10或11所述的数据采集方法,其特征在于,所述方法包括:预先生成预设基板管理控制器列表;
预先生成预设基板管理控制器列表,包括:
基于任一所述目标基板管理控制器,生成预设基板管理控制器集,所述预设基板管理控制器集中包括所述目标广域网内除所述目标基板管理控制器外的至少一个基板管理控制器,定义所述基板管理控制器为预设基板管理控制器;
对所述预设基板管理控制器集中的预设基板管理控制器进行优先级排序,按照优先级从高到低的顺序生成预设基板管理控制器列表。
19.根据权利要求18所述的数据采集方法,其特征在于,基于所述预设的数据采集规则,通过所述网络文件***服务器,采集所述报错的基板管理控制器的数据,包括:
遍历所述预设基板管理控制器列表,按照所述预设基板管理控制器优先级顺序,选定其中一个预设基板管理控制器基于所述报错的基板管理控制器预设的数据采集规则,通过所述网络文件***服务器,采集所述报错的基板管理控制器的数据。
20.根据权利要求17所述的数据采集方法,其特征在于,基于所述预设的数据采集规则,通过所述网络文件***服务器,采集所述报错的基板管理控制器的数据,还包括:
当所述数据采集主体为集群,所述数据采集模式为持续数据采集模式时,所述预设基板管理控制器集中的预设基板管理控制器获取所述目标广域网内除所述报错的基板管理控制器外的任一预设基板管理控制器的串口资源占用率;
选择串口资源占用率最低的预设基板管理控制器按照所述持续数据采集模式,采集所述报错的基板管理控制器的数据。
21.根据权利要求12~17任一项所述的数据采集方法,其特征在于,所述报错的基板管理控制器的串口数据包括:配置分区、日志分区、内存分区、网络路由参数、内核资源参数、资源占用信息和进程线程运行信息。
22.根据权利要求1~4中任一项或6~17中任一项或19~20中任一项所述的数据采集方法,其特征在于,所述业务服务器的基板管理控制器作为目标基板管理控制器广播链路层发现协议数据帧至所述目标广域网后,所述方法包括:
所述基板管理控制器解析所述目标基板管理控制器广播的链路层发现协议数据帧,获取所述目标基板管理控制器的属性信息,所述属性信息包括:IP地址、链路层发现协议数据帧生存周期和最近一次接收所述目标基板管理控制器的链路层发现协议数据帧的时间;
基于所述目标基板管理控制器的属性信息,生成目标基板管理控制器属性信息表,并存储所述目标基板管理控制器属性信息表至预设的内存文件。
23.根据权利要求22所述的数据采集方法,其特征在于,基于所述目标基板管理控制器的属性信息,生成目标基板管理控制器属性信息表前,所述方法还包括:
基于所述目标基板管理控制器的属性信息中的IP地址,判断所述基板管理控制器预设的内存文件中是否存在与所述IP地址一致的IP地址;
若所述预设的内存文件中存在与所述IP地址一致的IP地址,则更新所述最近一次接收所述目标基板管理控制器的链路层发现协议数据帧的时间至所述IP地址;
若所述预设的内存文件中不存在与所述IP地址一致的IP地址,则增加所述目标基板管理控制器的属性信息至预设的内存文件。
24.根据权利要求22所述的数据采集方法,其特征在于,基于所述目标基板管理控制器的属性信息,生成目标基板管理控制器属性信息表后,所述方法还包括:
所述基板管理控制器基于预设的内存文件中的IP地址,获取与所述IP地址对应的最近一次接收所述目标基板管理控制器的链路层发现协议数据帧的时间;
获取当前时间与所述最近一次接收所述目标基板管理控制器的链路层发现协议数据帧的时间的时间差,判断所述时间差是否超过与所述IP地址对应的链路层发现协议数据帧生存周期;
若所述时间差超过与所述IP地址对应的链路层发现协议数据帧生存周期,则删除所述目标基板管理控制器属性信息表。
25.一种数据采集装置,其特征在于,所述装置包括:
配置单元,以用于配置服务器集群和网络文件***服务器至目标广域网,所述服务器集群的数量至少为一,所述服务器集群包括业务服务器;还用于任一所述业务服务器的基板管理控制器作为目标基板管理控制器广播链路层发现协议数据帧至所述目标广域网,所述目标广域网内除所述目标基板管理控制器外的基板管理控制器作为预设基板管理控制器接收所述目标基板管理控制器广播的链路层发现协议数据帧,以实现任两个所述业务服务器成功握手通信;
获取单元,以用于当任一所述业务服务器的基板管理控制器报错时,获取所述报错的基板管理控制器预设的数据采集规则;
采集单元,以用于基于所述预设的数据采集规则,通过所述网络文件***服务器,采集所述报错的基板管理控制器的数据。
26.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至24中任一项所述方法的步骤。
CN202211551278.9A 2022-12-05 2022-12-05 一种数据采集方法、装置和计算机设备 Active CN115562950B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202211551278.9A CN115562950B (zh) 2022-12-05 2022-12-05 一种数据采集方法、装置和计算机设备
PCT/CN2023/108929 WO2024119843A1 (zh) 2022-12-05 2023-07-24 一种数据采集方法、装置和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211551278.9A CN115562950B (zh) 2022-12-05 2022-12-05 一种数据采集方法、装置和计算机设备

Publications (2)

Publication Number Publication Date
CN115562950A true CN115562950A (zh) 2023-01-03
CN115562950B CN115562950B (zh) 2023-03-17

Family

ID=84770635

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211551278.9A Active CN115562950B (zh) 2022-12-05 2022-12-05 一种数据采集方法、装置和计算机设备

Country Status (2)

Country Link
CN (1) CN115562950B (zh)
WO (1) WO2024119843A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024119843A1 (zh) * 2022-12-05 2024-06-13 苏州元脑智能科技有限公司 一种数据采集方法、装置和计算机设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104202195A (zh) * 2014-09-10 2014-12-10 华为技术有限公司 服务器统一通信的方法、基板管理控制器和服务器
US20150074385A1 (en) * 2013-09-06 2015-03-12 Hong Fu Jin Precision Industry (Shenzhen) Co., Ltd. Server system
US20150127814A1 (en) * 2013-11-07 2015-05-07 Inventec Corporation Monitoring Server Method
CN114442765A (zh) * 2021-12-17 2022-05-06 苏州浪潮智能科技有限公司 计算机设备的风扇控制方法、基板管理控制器及存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111984498A (zh) * 2020-07-24 2020-11-24 华东计算技术研究所(中国电子科技集团公司第三十二研究所) 服务器集群监控和管理***
US10986174B1 (en) * 2020-09-18 2021-04-20 EMC IP Holding Company LLC Automatic discovery and configuration of server nodes
CN113608908B (zh) * 2021-07-28 2023-12-22 烽火超微信息科技有限公司 服务器故障处理方法、***、设备及可读存储介质
CN114138524A (zh) * 2021-10-29 2022-03-04 苏州浪潮智能科技有限公司 一种服务器中bmc的故障处理方法、***及相关装置
CN115185675A (zh) * 2022-06-14 2022-10-14 统信软件技术有限公司 服务器集群的部署方法、***、计算设备及可读存储介质
CN114866424B (zh) * 2022-07-08 2022-11-18 苏州浪潮智能科技有限公司 服务器管理方法、装置、***、电子设备及可读存储介质
CN115562950B (zh) * 2022-12-05 2023-03-17 苏州浪潮智能科技有限公司 一种数据采集方法、装置和计算机设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150074385A1 (en) * 2013-09-06 2015-03-12 Hong Fu Jin Precision Industry (Shenzhen) Co., Ltd. Server system
US20150127814A1 (en) * 2013-11-07 2015-05-07 Inventec Corporation Monitoring Server Method
CN104202195A (zh) * 2014-09-10 2014-12-10 华为技术有限公司 服务器统一通信的方法、基板管理控制器和服务器
CN114442765A (zh) * 2021-12-17 2022-05-06 苏州浪潮智能科技有限公司 计算机设备的风扇控制方法、基板管理控制器及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024119843A1 (zh) * 2022-12-05 2024-06-13 苏州元脑智能科技有限公司 一种数据采集方法、装置和计算机设备

Also Published As

Publication number Publication date
CN115562950B (zh) 2023-03-17
WO2024119843A1 (zh) 2024-06-13

Similar Documents

Publication Publication Date Title
US10965580B2 (en) Systems and methods for automated determination of network device transiting data attributes
US6167358A (en) System and method for remotely monitoring a plurality of computer-based systems
US7890613B2 (en) Program deployment apparatus and method
CN109361562B (zh) 一种基于关联网络设备接入的自动化测试方法
CN109660426B (zh) 监控方法及***、计算机可读介质和电子设备
CN112989330B (zh) 容器的入侵检测方法、装置、电子设备及存储介质
CN109960634B (zh) 一种应用程序监控方法、装置及***
CN114884838B (zh) Kubernetes组件的监控方法及服务器
CN115562950B (zh) 一种数据采集方法、装置和计算机设备
CN111611021A (zh) 日志数据传输方法、装置、计算机设备和存储介质
CN111258591A (zh) 程序部署任务执行方法、装置、计算机设备和存储介质
CN110063042A (zh) 一种数据库故障的响应方法及其终端
CN111431749B (zh) 一种fpga云服务器管理平台及其使用方法
CN107453888B (zh) 高可用性的虚拟机集群的管理方法及装置
CN106708727B (zh) 一种分布式病毒特征样本验证方法及***
CN113590595A (zh) 一种数据库多写方法、装置及相关设备
CN112306871A (zh) 数据处理方法、装置、设备及存储介质
CN111045616A (zh) 耗时打印方法、装置、设备及存储介质
CN111901143B (zh) 一种pxe环境下异常问题诊断的方法及***
CN111708348B (zh) 一种诊断服务的测试方法、装置、设备及存储介质
CN115687036A (zh) 日志采集方法、装置及日志***
CN112667512A (zh) 数据驱动测试方法、装置、设备和计算机可读存储介质
CN116820686B (zh) 物理机的部署方法、虚拟机和容器统一监控的方法及装置
CN111858199A (zh) 一种自适配硬盘日志采集方法、***、终端及存储介质
CN117251273A (zh) 基于Kubernetes的计算任务管理方法、***及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant