CN115952096A - 数据中心软件***的故障检测方法、装置、设备、介质 - Google Patents

数据中心软件***的故障检测方法、装置、设备、介质 Download PDF

Info

Publication number
CN115952096A
CN115952096A CN202211730329.4A CN202211730329A CN115952096A CN 115952096 A CN115952096 A CN 115952096A CN 202211730329 A CN202211730329 A CN 202211730329A CN 115952096 A CN115952096 A CN 115952096A
Authority
CN
China
Prior art keywords
fault
target
data
operation log
software system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211730329.4A
Other languages
English (en)
Inventor
肖维
董坤磊
郑毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Resources Digital Technology Co Ltd
Original Assignee
China Resources Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Resources Digital Technology Co Ltd filed Critical China Resources Digital Technology Co Ltd
Priority to CN202211730329.4A priority Critical patent/CN115952096A/zh
Publication of CN115952096A publication Critical patent/CN115952096A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本申请提供了一种数据中心软件***的故障检测方法、装置、设备、介质,方法包括:获取数据中心软件***的多个历史操作日志,各个历史操作日志包括多个对应有权重值的故障属性数据;根据权重值对各个故障属性数据进行线性处理得到目标操作日志,并输入预设的异常检测模块进行数据检测,得到目标操作日志的异常判定标签;根据预设条件从多个异常判定标签中确定目标标签;将目标标签对应的目标操作日志输入故障诊断模块进行数据识别,得到目标故障类型信息。本申请基于历史操作日志,结合异常检测模块以及故障诊断模块实现对数据中心软件***进行实时自动故障检测,能够解决当前***的故障检测效率低的问题,保证***的稳定运行。

Description

数据中心软件***的故障检测方法、装置、设备、介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种数据中心软件***的故障检测方法、装置、设备、介质。
背景技术
随着企业数字化转型进程的不断推进,越来越多的企业选择将内部以及外部的业务上云。对于大型多业态集团型企业而言,云端需要部署多种业务模块以支持企业各个业态的业务。由于多业态企业丰富的业务范围,云平台需要具有快速提供算力、网络、数据存储资源、软件等服务资源的能力,以数据中心为核心的数据中心软件***能够快速提供上述服务。为了确保数据中心软件***支持的服务能正常运行,需要对***的主机、网络、存储和多种软件服务进行日常运维。但是,由于数据中心软件***的计算机数量较大,因此在发生***故障,例如计算机的操作人员引起的故障、计算机***补丁引起的故障、软件环境故障等情况下,运维人员难以及时发现并解决,通常在该***故障引起较难处理的问题之后才会被运维人员发现,从而难以保证数据中心软件***的稳定运行。
发明内容
以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
本发明实施例提供了一种数据中心软件***的故障检测方法、装置、设备、介质,能够提升数据中心软件***的故障检测效率,从而有效保证数据中心软件***的稳定运行。
第一方面,本发明实施例提供了一种数据中心软件***的故障检测方法,包括:
获取待检测数据,所述待检测数据包括所述数据中心软件***的多个历史操作日志,各个所述历史操作日志包括多个故障属性数据,不同的所述故障属性数据对应有不同的权重值;
根据所述权重值对各个历史操作日志中的各个故障属性数据进行线性处理得到目标操作日志;
将多个所述目标操作日志输入至预设的异常检测模块进行数据检测,得到所述目标操作日志的异常判定标签;
根据预设条件从多个所述异常判定标签中确定目标标签;
将所述目标标签对应的目标操作日志输入至预设的故障诊断模块进行数据识别处理,得到所述目标操作日志对应的目标故障类型信息。
在一些实施例中,所述将多个所述目标操作日志输入至预设的异常检测模块进行数据检测,得到所述目标操作日志的异常判定标签,包括:
计算第一相关性参数,所述第一相关性参数表征各个所述目标操作日志与故障参考信息之间的相关性;
根据所述第一相关性参数与预设的相关性阈值确定所述异常判定标签。
在一些实施例中,所述从多个所述异常判定标签中确定目标标签,包括:
当所述异常判定标签表征所述第一相关性参数的数值大于所述相关性阈值,将所述异常判定标签确定为所述目标标签。
在一些实施例中,所述故障诊断模块预设有多个历史故障类型信息,各个所述历史故障类型信息对应的故障类型互不相同,所述将所述目标标签对应的目标操作日志输入至预设的故障诊断模块进行数据识别处理,得到所述目标操作日志对应的目标故障类型信息,包括:
计算多个第二相关性参数,各个所述第二相关性参数表征所述目标操作日志与各个所述历史故障类型信息之间的相关性;
将多个所述第二相关性参数中数值最高的相关性参数对应的历史故障类型信息确定为所述目标故障类型信息。
在一些实施例中,所述计算第一相关性参数,所述计算第一相关性参数,所述第一相关性参数表征各个所述目标操作日志与故障参考信息之间的相关性,根据以下公式得到:
Figure BDA0004031340490000021
其中,li(ω,b)为所述第一相关性参数,
Figure BDA0004031340490000022
为所述目标操作日志,y(i)为所述故障参考信息,n为所述历史操作日志的数量,
Figure BDA0004031340490000023
根据以下公式得到:
Figure BDA0004031340490000024
其中,
Figure BDA0004031340490000025
为各个所述历史操作日志中各个故障属性数据对应的所述权重值的期望值,
Figure BDA0004031340490000026
b为预设的噪音值,Xi的表达式如下:
Xi=[xi (1),xi (2)xi (d)]T
其中,d表征所述历史操作日志中所述故障属性数据的数量。
在一些实施例中,所述计算多个第二相关性参数,根据以下公式得到:
Figure BDA0004031340490000031
其中,p(m(i)=j|z(i);θ)为所述第二相关性参数,z(i)为所述目标操作日志,
Figure BDA0004031340490000032
θ为所述故障诊断模块预设的回归曲线的斜率,m(i)为所述历史故障类型信息,j为所述故障诊断模块预设的所述历史故障类型信息的数量,j∈{0,1,…,k}。
在一些实施例中,在所述将所述目标标签对应的目标操作日志输入至预设的故障诊断模块进行数据识别处理,得到所述目标操作日志对应的目标故障类型信息之后,所述方法还包括:
获取修复映射表,所述修复映射表表征故障类型信息与修复操作信息之间的映射关系,所述目标故障类型信息归属于所述故障类型信息;
将所述修复映射表中与所述目标故障类型信息对应的所述修复操作信息确定为目标修复操作信息;
根据所述目标修复操作信息执行故障修复操作。
第二方面,本发明实施例还提供了一种数据中心软件***的故障检测装置,包括:
数据获取模块,所述数据获取模块用于获取待检测数据集,所述待检测数据集包括所述数据中心软件***的多个历史操作日志;
异常检测模块,所述异常检测模块用于将多个所述历史操作日志输入至预设的异常检测模块进行数据检测,得到异常检测结果,所述异常检测结果包括多个携带有异常判定标签的历史操作日志;
目标标签确定模块,所述目标标签确定模块用于从多个所述异常判定标签中确定目标标签;
目标故障类型信息确定模块,所述目标故障类型信息确定模块用于将所述目标标签对应的历史操作日志输入至预设的故障诊断模块进行数据识别处理,得到所述目标标签对应的历史操作日志对应的目标故障类型信息。
第三方面,本发明实施例提供了一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述的数据中心软件***的故障检测方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序用于执行如第一方面所述的数据中心软件***的故障检测方法。
本申请提供了一种数据中心软件***的故障检测方法、装置、设备、介质,其中,方法包括:获取待检测数据,所述待检测数据包括所述数据中心软件***的多个历史操作日志,各个所述历史操作日志包括多个故障属性数据,不同的所述故障属性数据对应有不同的权重值;根据所述权重值对各个历史操作日志中的各个故障属性数据进行线性处理得到目标操作日志;将多个所述目标操作日志输入至预设的异常检测模块进行数据检测,得到所述目标操作日志的异常判定标签;根据预设条件从多个所述异常判定标签中确定目标标签;将所述目标标签对应的目标操作日志输入至预设的故障诊断模块进行数据识别处理,得到所述目标操作日志对应的目标故障类型信息。根据本实施例的技术方案,能够基于历史操作日志,结合异常检测模块以及故障诊断模块实现对数据中心软件***进行实时的自动故障检测,从而能够有效解决当前数据中心软件***的故障检测效率低的问题,从而有效保证数据中心软件***的稳定运行。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。
图1是本发明一个实施例提供的数据中心软件***的故障检测方法的步骤流程图;
图2是本发明另一个实施例提供的得到异常检测结果的步骤流程图;
图3是本发明另一个实施例提供的确定目标标签的步骤流程图;
图4是本发明另一个实施例提供的得到目标操作日志对应的目标故障类型信息的步骤流程图;
图5是本发明另一个实施例提供的获取目标修复操作信息并根据目标修复操作信息执行故障修复操作的步骤流程图;
图6是本发明另一个实施例提供的数据中心软件***的故障检测装置的结构图;
图7是本发明另一个实施例提供的电子设备的装置图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
需要说明的是,虽然在装置示意图中进行了功能模块划分,在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于装置中的模块划分,或流程图中的顺序执行所示出或描述的步骤。说明书、权利要求书或上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
本申请提供了一种数据中心软件***的故障检测方法、装置、设备、介质,其中,方法包括:获取待检测数据,所述待检测数据包括所述数据中心软件***的多个历史操作日志,各个所述历史操作日志包括多个故障属性数据,不同的所述故障属性数据对应有不同的权重值;根据所述权重值对各个历史操作日志中的各个故障属性数据进行线性处理得到目标操作日志;将多个所述目标操作日志输入至预设的异常检测模块进行数据检测,得到所述目标操作日志的异常判定标签;根据预设条件从多个所述异常判定标签中确定目标标签;将所述目标标签对应的目标操作日志输入至预设的故障诊断模块进行数据识别处理,得到所述目标操作日志对应的目标故障类型信息。根据本实施例的技术方案,能够基于历史操作日志,结合异常检测模块以及故障诊断模块实现对数据中心软件***进行实时的自动故障检测,从而能够有效解决当前数据中心软件***的故障检测效率低的问题,从而有效保证数据中心软件***的稳定运行。
本发明实施例所提及的终端可以是智能手机、平板电脑、笔记本电脑、台式电脑、车载计算机、智能家居、可穿戴电子设备、VR(Virtual Reality,虚拟现实)/AR(AugmentedReality,增强现实)设备等等;服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式***,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content DeliveryNetwork,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器,等等。
需要说明的是,本发明实施例的数据可以保存在服务器中,服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
如图1所示,图1是本发明一个实施例提供的一种数据中心软件***的故障检测方法的流程图,该数据中心软件***的故障检测方法包括但不限于有以下步骤:
步骤S110,获取待检测数据,待检测数据包括数据中心软件***的多个历史操作日志,各个历史操作日志包括多个故障属性数据,不同的故障属性数据对应有不同的权重值;
步骤S120,根据权重值对各个历史操作日志中的各个故障属性数据进行线性处理得到目标操作日志;
步骤S130,将多个目标操作日志输入至预设的异常检测模块进行数据检测,得到目标操作日志的异常判定标签;
步骤S140,根据预设条件从多个异常判定标签中确定目标标签;
步骤S150,将目标标签对应的目标操作日志输入至预设的故障诊断模块进行数据识别处理,得到目标操作日志对应的目标故障类型信息。
需要说明的是,历史操作日志可以包括数据中心软件***中计算机的操作记录和***日志,由于数据中心软件***故障一般由计算机的误操作、计算机***补丁引起,这类问题会通常记录在计算机的操作记录和***日志,因此获取历史操作日志能够为检测数据中心软件***故障提供有效的数据基础。
需要说明的是,各个历史操作日志所包括的具体内容基于***的具体操作而决定,本申请实施例在此不多做限制,本申请实施例的历史操作日志包括多个故障属性数据,故障属性数据指的是容易引起***故障的操作信息,例如计算机补丁运行故障对应的日志信息、软件运行环境故障对应的日志信息、运维人员操作不当或误操作导致***文件丢失等故障对应的日志信息以及软件运行不兼容导致***故障对应的日志信息、病毒破坏等等,不同类型的故障属性数据对应不同的权重值,具体权重值可以由运维人员根据不同类型故障属性数据对数据中心软件***的危害程度而确定,在此不多做限制。
需要说明的是,本申请实施例并不限制历史操作日志的具体时间范围,本领域技术人员根据实际情况确定即可。
可以理解的是,随着企业数字化转型进程的不断推进,越来越多的企业选择将内部以及外部的业务上云。对于大型多业态集团型企业而言,云端需要部署多种业务模块以支持企业各个业态的业务。由于多业态企业丰富的业务范围,云平台需要具有快速提供算力、网络、数据存储资源、软件等服务资源的能力,以数据中心为核心的数据中心软件***能够快速提供上述服务。为了确保数据中心软件***支持的服务能正常运行,需要对***的主机、网络、存储和多种软件服务进行日常运维。但是,由于数据中心软件***的计算机数量较大,因此在发生***故障,例如计算机的操作人员引起的故障、计算机***补丁引起的故障、软件环境故障等情况下,运维人员难以及时发现并解决,通常在该***故障引起较难处理的问题之后才会被运维人员发现,从而难以保证数据中心软件***的稳定运行。基于此,本申请实施例提供的数据中心软件***的故障检测方法包括:获取待检测数据,待检测数据包括数据中心软件***的多个历史操作日志,各个历史操作日志包括多个故障属性数据,不同的故障属性数据对应有不同的权重值;根据权重值对各个历史操作日志中的各个故障属性数据进行线性处理得到目标操作日志;将多个目标操作日志输入至预设的异常检测模块进行数据检测,得到目标操作日志的异常判定标签;根据预设条件从多个异常判定标签中确定目标标签;将目标标签对应的目标操作日志输入至预设的故障诊断模块进行数据识别处理,得到目标操作日志对应的目标故障类型信息。根据本实施例的技术方案,能够基于历史操作日志,结合异常检测模块以及故障诊断模块实现对数据中心软件***进行实时的自动故障检测,从而能够有效解决当前数据中心软件***的故障检测效率低的问题,从而有效保证数据中心软件***的稳定运行。
另外,参照图2,在一实施例中,图1所示实施例的步骤S130还包括但不限于有以下步骤:
步骤S210,计算第一相关性参数,第一相关性参数表征各个目标操作日志与故障参考信息之间的相关性;
步骤S220,根据第一相关性参数与预设的相关性阈值确定异常判定标签。
另外,参照图3,在一实施例中,图1所示实施例的步骤S140还包括但不限于有以下步骤:
步骤S310,当异常判定标签表征第一相关性参数的数值大于相关性阈值,将异常判定标签确定为目标标签。
可以理解的是,故障参考信息可以是数据中心软件***中预先设置的会导致***故障的信息,能够用于判断上述实施例中目标操作日志导致***故障的可能性大小,通过计算表征各个目标操作日志与故障参考信息之间的相关性,即第一相关性参数,并基于第一相关性参数与预设的相关性阈值确定异常判定标签,能够进一步为检测数据中心软件***故障提供有效的数据基础。
可以理解的是,当异常判定标签表征第一相关性参数的数值大于相关性阈值,则表征该异常判定标签对应的目标操作日志导致***故障的可能性较大,将第一相关性参数的数值大于相关性阈值对应的异常判定标签确定为目标标签,能够使得后续将目标标签对应的目标操作日志输入至故障诊断模块进行进一步的故障类型判断。
另外,本申请实施例并不限制计算第一相关性参数的具体方式,可以由如下公式得到:
Figure BDA0004031340490000081
其中,li(ω,b)为所述第一相关性参数,
Figure BDA0004031340490000082
为所述目标操作日志,y(i)为所述故障参考信息,n为所述历史操作日志的数量,
Figure BDA0004031340490000083
根据以下公式得到:
Figure BDA0004031340490000084
其中,
Figure BDA0004031340490000085
为各个所述历史操作日志中各个故障属性数据对应的所述权重值的期望值,
Figure BDA0004031340490000086
b为预设的噪音值,Xi的表达式如下:
Xi=[Xi (1),Xi (2)...Xi (d)]T
其中,d表征所述历史操作日志中所述故障属性数据的数量。
另外,参照图4,在一实施例中,故障诊断模块预设有多个历史故障类型信息,各个历史故障类型信息对应的故障类型互不相同,图1所示实施例的步骤S150还包括但不限于有以下步骤:
步骤S410,计算多个第二相关性参数,各个第二相关性参数表征目标操作日志与各个历史故障类型信息之间的相关性;
步骤S420,将多个第二相关性参数中数值最高的相关性参数对应的历史故障类型信息确定为目标故障类型信息。
可以理解的是,通过计算目标操作日志与各个历史故障类型信息之间的相关性,即第二相关性参数,能够为确定出目标操作日志对应的目标故障类型信息提供有效的数据基础,第二相关性参数中数值最高的相关性参数对应的历史故障类型信息,可以确定为该目标操作日志对应的可能性最高的故障类型,即目标故障类型信息,从而为后续基于该目标故障类型信息和目标操作日志进行***故障修复提供有效的数据基础。
另外,本申请实施例并不限制计算第二相关性参数的具体方式,可以由如下公式得到:
Figure BDA0004031340490000091
其中,p(m(i)=j|z(i);θ)为第二相关性参数,θ为故障诊断模块预设的回归曲线的斜率,z(i)为目标操作日志,z∈Rn+1,m(i)为历史故障类型信息,j为故障诊断模块预设的历史故障类型信息的数量,j∈{0,1,…,k}。
另外,参照图5,在一实施例中,在执行图1所示实施例的步骤S150之后,本申请实施例提供的数据中心软件***的故障检测方法还包括但不限于有以下步骤:
步骤S510,获取修复映射表,修复映射表表征故障类型信息与修复操作信息之间的映射关系,目标故障类型信息归属于故障类型信息;
步骤S520,将修复映射表中与目标故障类型信息对应的修复操作信息确定为目标修复操作信息;
步骤S530,根据目标修复操作信息执行故障修复操作。
可以理解的是,由于修复映射表表征故障类型信息与修复操作信息之间的映射关系,目标故障类型信息归属于故障类型信息,在将目标标签对应的目标操作日志输入至预设的故障诊断模块进行数据识别处理,得到目标操作日志对应的目标故障类型信息之后,通过获取***预设的修复映射表,并将修复映射表中与目标故障类型信息对应的修复操作信息确定为目标修复操作信息,从而根据目标修复操作信息执行故障修复操作,完成基于数据中心软件***的智能运维操作,从而能够有效解决当前数据中心软件***的故障检测效率低,无法及时处理故障的问题,从而有效保证数据中心软件***的稳定运行。
另外,参照图6,本发明实施例提供了一种数据中心软件***的故障检测装置600,数据中心软件***的故障检测装置600包括:
数据获取模块610,该数据获取模块610用于获取待检测数据集,待检测数据包括数据中心软件***的多个历史操作日志,各个历史操作日志包括多个故障属性数据,不同的故障属性数据对应有不同的权重值;
数据处理模块620,该数据处理模块620用于根据权重值对各个历史操作日志中的各个故障属性数据进行线性处理得到目标操作日志;
异常检测模块630,该异常检测模块630用于将多个目标操作日志输入至预设的异常检测模块进行数据检测,得到目标操作日志的异常判定标签;
目标标签确定模块640,该目标标签确定模块640用于根据预设条件从多个异常判定标签中确定目标标签;
目标故障类型信息确定模块650,该目标故障类型信息确定模块650用于将目标标签对应的目标操作日志输入至预设的故障诊断模块进行数据识别处理,得到目标操作日志对应的目标故障类型信息。
需要说明的是,该数据中心软件***的故障检测装置600的具体实施方式与上述数据中心软件***的故障检测方法的具体实施例的技术原理基本相同,在此不再赘述。
另外,参照图7,本发明的一个实施例还提供了一种电子设备700,该电子设备700包括:存储器710、处理器720及存储在存储器710上并可在处理器720上运行的计算机程序。
处理器720和存储器710可以通过总线或者其他方式连接。
实现上述实施例的数据中心软件***的故障检测方法所需的非暂态软件程序以及指令存储在存储器710中,当被处理器720执行时,执行上述实施例中的数据中心软件***的故障检测方法,例如,执行以上描述的图1中的方法步骤S110至步骤S150、图2中的方法步骤S210至步骤S220、图3中的方法步骤S310、图4中的方法步骤S410至步骤S420和图5中的方法步骤S510至步骤S530。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
此外,本发明的一个实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被一个处理器或控制器执行,例如,被上述电子设备实施例中的一个处理器执行,可使得上述处理器执行上述实施例中的数据中心软件***的故障检测方法,例如,执行以上描述的图1中的方法步骤S110至步骤S140、图2中的方法步骤S210至步骤S220、图3中的方法步骤S310、图4中的方法步骤S410至步骤S420和图5中的方法步骤S510至步骤S530。本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、装置可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读存储介质上,计算机可读存储介质可以包括计算机存储介质(或非暂时性存储介质)和通信存储介质(或暂时性存储介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除存储介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的存储介质。此外,本领域普通技术人员公知的是,通信存储介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送存储介质。
本实施例可用于众多通用或专用的计算机装置环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器装置、基于微处理器的装置、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何装置或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机程序的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
附图中的流程图和框图,图示了按照本申请各种实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。其中,流程图或框图中的各个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的程序。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的各个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的装置来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本申请实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本申请实施方式的方法。
本实施例的终端可以包括:射频(Radio Frequency,简称RF)电路、存储器、输入单元、显示单元、传感器、音频电路、无线保真(wireless fidelity,简称WiFi)模块、处理器、以及电源等部件。RF电路可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,给处理器处理;另外,将设计上行的数据发送给基站。通常,RF电路包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(Low NoiseAmplifier,简称LNA)、双工器等。此外,RF电路还可以通过无线通信与网络和其他装置通信。上述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯***(GlobalSystem of Mobile communication,简称GSM)、通用分组无线服务(General Packet RadioService,简称GPRS)、码分多址(Code Division Multiple Access,简称CDMA)、宽带码分多址(Wideband Code Division Multiple Access,简称WCDMA)、长期演进(Long TermEvolution,简称LTE)、电子邮件、短消息服务(Short Messaging Service,简称SMS)等。存储器可用于存储软件程序以及模块,处理器通过运行存储在存储器的软件程序以及模块,从而执行终端的各种功能应用以及数据处理。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据终端的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。输入单元可用于接收输入的数字或字符信息,以及产生与终端的设置以及功能控制有关的键信号输入。具体地,输入单元可包括触控面板以及其他输入装置。触控面板,也称为触摸屏,可收集在其上或附近的触摸操作(比如使用手指、触笔等任何适合的物体或附件在触控面板上或在触控面板附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触控面板可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器,并能接收处理器发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类别实现触控面板。除了触控面板,输入单元还可以包括其他输入装置。具体地,其他输入装置可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。显示单元可用于显示输入的信息或提供的信息以及终端的各种菜单。显示单元可包括显示面板,可选的,可以采用液晶显示器(Liquid Crystal Display,简称LCD)、有机发光二极管(Organic Light-Emitting Diode,简称OLED)等形式来配置显示面板。进一步的,触控面板可覆盖显示面板,当触控面板检测到在其上或附近的触摸操作后,传送给处理器以确定触摸事件的类别,随后处理器根据触摸事件的类别在显示面板上提供相应的视觉输出。触控面板与显示面板是作为两个独立的部件来实现终端的输入和输入功能,但是在某些实施例中,可以将触控面板与显示面板集成而实现终端的输入和输出功能。终端还可包括至少一种传感器,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板的亮度,接近传感器可在终端移动到耳边时,关闭显示面板和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别终端姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于终端还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。音频电路、扬声器、传声器可提供音频接口。音频电路可将接收到的音频数据转换后的电信号,传输到扬声器,由扬声器转换为声音信号输出;另一方面,传声器将收集的声音信号转换为电信号,由音频电路接收后转换为音频数据,再将音频数据输出处理器处理后,经RF电路以发送给比如另一终端,或者将音频数据输出至存储器以便进一步处理。
本领域技术人员在考虑说明书及实践这里公开的实施方式后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。
以上是对本发明的较佳实施进行了具体说明,但本发明并不局限于上述实施方式,熟悉本领域的技术人员在不违背本发明精神的前提下还可作出种种的等同变形或替换,这些等同的变形或替换均包含在本发明权利要求所限定的范围内。

Claims (10)

1.一种数据中心软件***的故障检测方法,其特征在于,包括:
获取待检测数据,所述待检测数据包括所述数据中心软件***的多个历史操作日志,各个所述历史操作日志包括多个故障属性数据,不同的所述故障属性数据对应有不同的权重值;
根据所述权重值对各个历史操作日志中的各个故障属性数据进行线性处理得到目标操作日志;
将多个所述目标操作日志输入至预设的异常检测模块进行数据检测,得到所述目标操作日志的异常判定标签;
根据预设条件从多个所述异常判定标签中确定目标标签;
将所述目标标签对应的目标操作日志输入至预设的故障诊断模块进行数据识别处理,得到所述目标操作日志对应的目标故障类型信息。
2.根据权利要求1所述的数据中心软件***的故障检测方法,其特征在于,所述将多个所述目标操作日志输入至预设的异常检测模块进行数据检测,得到所述目标操作日志的异常判定标签,包括:
计算第一相关性参数,所述第一相关性参数表征各个所述目标操作日志与故障参考信息之间的相关性;
根据所述第一相关性参数与预设的相关性阈值确定所述异常判定标签。
3.根据权利要求2所述的数据中心软件***的故障检测方法,其特征在于,所述根据预设条件从多个所述异常判定标签中确定目标标签,包括:
当所述异常判定标签表征所述第一相关性参数的数值大于所述相关性阈值,将所述异常判定标签确定为所述目标标签。
4.根据权利要求1所述的数据中心软件***的故障检测方法,其特征在于,所述故障诊断模块预设有多个历史故障类型信息,各个所述历史故障类型信息对应的故障类型互不相同,所述将所述目标标签对应的目标操作日志输入至预设的故障诊断模块进行数据识别处理,得到所述目标操作日志对应的目标故障类型信息,包括:
计算多个第二相关性参数,各个所述第二相关性参数表征所述目标操作日志与各个所述历史故障类型信息之间的相关性;
将多个所述第二相关性参数中数值最高的相关性参数对应的历史故障类型信息确定为所述目标故障类型信息。
5.根据权利要求2所述的数据中心软件***的故障检测方法,其特征在于,所述计算第一相关性参数,所述第一相关性参数表征各个所述目标操作日志与故障参考信息之间的相关性,根据以下公式得到:
Figure FDA0004031340480000021
其中,li(ω,b)为所述第一相关性参数,
Figure FDA0004031340480000022
为所述目标操作日志,
Figure FDA0004031340480000023
为所述故障参考信息,n为所述历史操作日志的数量,
Figure FDA0004031340480000024
根据以下公式得到:
Figure FDA0004031340480000025
其中,
Figure FDA0004031340480000026
为各个所述历史操作日志中各个故障属性数据对应的所述权重值的期望值,
Figure FDA0004031340480000027
b为预设的噪音值,Xi的表达式如下:
Figure FDA0004031340480000028
其中,d表征所述历史操作日志中所述故障属性数据的数量。
6.根据权利要求4所述的数据中心软件***的故障检测方法,其特征在于,所述计算多个第二相关性参数,根据以下公式得到:
Figure FDA0004031340480000029
其中,p(m(i)=j|z(i);θ)为所述第二相关性参数,z(i)为所述目标操作日志,
Figure FDA00040313404800000210
θ为所述故障诊断模块预设的回归曲线的斜率,m(i)为所述历史故障类型信息,j为所述故障诊断模块预设的所述历史故障类型信息的数量,
j∈{0,1,…,k}。
7.根据权利要求1所述的数据中心软件***的故障检测方法,其特征在于,在所述将所述目标标签对应的目标操作日志输入至预设的故障诊断模块进行数据识别处理,得到所述目标操作日志对应的目标故障类型信息之后,所述方法还包括:
获取修复映射表,所述修复映射表表征故障类型信息与修复操作信息之间的映射关系,所述目标故障类型信息归属于所述故障类型信息;
将所述修复映射表中与所述目标故障类型信息对应的所述修复操作信息确定为目标修复操作信息;
根据所述目标修复操作信息执行故障修复操作。
8.一种数据中心软件***的故障检测装置,其特征在于,包括:
数据获取模块,所述数据获取模块用于获取待检测数据集,所述待检测数据包括所述数据中心软件***的多个历史操作日志,各个所述历史操作日志包括多个故障属性数据,不同的所述故障属性数据对应有不同的权重值;
数据处理模块,所述数据处理模块用于根据所述权重值对各个历史操作日志中的各个故障属性数据进行线性处理得到目标操作日志;
异常检测模块,所述异常检测模块用于将多个所述目标操作日志输入至预设的异常检测模块进行数据检测,得到所述目标操作日志的异常判定标签;
目标标签确定模块,所述目标标签确定模块用于根据预设条件从多个所述异常判定标签中确定目标标签;
目标故障类型信息确定模块,所述目标故障类型信息确定模块用于将所述目标标签对应的目标操作日志输入至预设的故障诊断模块进行数据识别处理,得到所述目标操作日志对应的目标故障类型信息。
9.一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任意一项所述的数据中心软件***的故障检测方法。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序用于执行如权利要求1至7中任意一项所述的数据中心软件***的故障检测方法。
CN202211730329.4A 2022-12-30 2022-12-30 数据中心软件***的故障检测方法、装置、设备、介质 Pending CN115952096A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211730329.4A CN115952096A (zh) 2022-12-30 2022-12-30 数据中心软件***的故障检测方法、装置、设备、介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211730329.4A CN115952096A (zh) 2022-12-30 2022-12-30 数据中心软件***的故障检测方法、装置、设备、介质

Publications (1)

Publication Number Publication Date
CN115952096A true CN115952096A (zh) 2023-04-11

Family

ID=87287507

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211730329.4A Pending CN115952096A (zh) 2022-12-30 2022-12-30 数据中心软件***的故障检测方法、装置、设备、介质

Country Status (1)

Country Link
CN (1) CN115952096A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116466689A (zh) * 2023-06-19 2023-07-21 广汽埃安新能源汽车股份有限公司 故障诊断方法及装置
CN117240700A (zh) * 2023-11-10 2023-12-15 浙江九州未来信息科技有限公司 一种基于贝叶斯分类器的网络故障诊断方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116466689A (zh) * 2023-06-19 2023-07-21 广汽埃安新能源汽车股份有限公司 故障诊断方法及装置
CN116466689B (zh) * 2023-06-19 2023-09-05 广汽埃安新能源汽车股份有限公司 故障诊断方法及装置
CN117240700A (zh) * 2023-11-10 2023-12-15 浙江九州未来信息科技有限公司 一种基于贝叶斯分类器的网络故障诊断方法及装置
CN117240700B (zh) * 2023-11-10 2024-02-06 浙江九州未来信息科技有限公司 一种基于贝叶斯分类器的网络故障诊断方法及装置

Similar Documents

Publication Publication Date Title
US10187855B2 (en) Message processing method and apparatus
US10853437B2 (en) Method and apparatus for invoking application programming interface
CN105429775B (zh) 一种上报日志的方法及装置
US20160241589A1 (en) Method and apparatus for identifying malicious website
CN115952096A (zh) 数据中心软件***的故障检测方法、装置、设备、介质
CN108039963B (zh) 一种容器配置方法、装置及存储介质
EP3429176B1 (en) Scenario-based sound effect control method and electronic device
WO2020030108A1 (zh) 告警信息的产生方法、装置及电子设备
CN105227598B (zh) 一种基于云存储的资源分享方法、装置和***
CN112231144A (zh) 一种数据处理方法、装置及电子设备
CN112749074A (zh) 一种测试用例推荐方法以及装置
CN110196662B (zh) 一种展示同步状态的方法、装置、终端及存储介质
CN103729283A (zh) 一种***日志输出方法、装置及终端设备
US11567822B2 (en) Method of monitoring closed system, apparatus thereof and monitoring device
CN109451295A (zh) 一种获取虚拟信息的方法和***
US10853412B2 (en) Scenario-based sound effect control method and electronic device
CN107463697A (zh) 图像尺寸的调整方法、装置及计算机存储介质
US9633227B2 (en) Method, apparatus, and system of detecting unauthorized data modification
CN110442361B (zh) 一种灰度发布方法、装置及电子设备
CN112667868A (zh) 一种数据检测方法以及装置
WO2015014153A1 (en) Method,apparatus,and system of detectingdata security
CN104834639B (zh) 一种数据交互方法、终端、服务器及数据交互***
CN112328304B (zh) 一种脚本适配方法、***、设备及计算机存储介质
CN113705722B (zh) 一种操作***版本识别的方法、装置、设备和介质
CN115543841A (zh) 数据更新测试方法、装置、介质及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination