CN115659244A - 故障预测方法、装置及存储介质 - Google Patents

故障预测方法、装置及存储介质 Download PDF

Info

Publication number
CN115659244A
CN115659244A CN202211262511.1A CN202211262511A CN115659244A CN 115659244 A CN115659244 A CN 115659244A CN 202211262511 A CN202211262511 A CN 202211262511A CN 115659244 A CN115659244 A CN 115659244A
Authority
CN
China
Prior art keywords
log data
recognized
prediction model
fault prediction
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211262511.1A
Other languages
English (en)
Inventor
刘默涵
封博卿
隋秀玉
赵兴强
王英杰
魏小娟
汤晓明
舒心
郑浩森
陈现明
于子轩
刘阳学
潘佩芬
杨峰雁
秦健
王虎
李聪旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Railway Network Co ltd
China Academy of Railway Sciences Corp Ltd CARS
Institute of Computing Technologies of CARS
Beijing Jingwei Information Technology Co Ltd
Original Assignee
China Railway Network Co ltd
China Academy of Railway Sciences Corp Ltd CARS
Institute of Computing Technologies of CARS
Beijing Jingwei Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Railway Network Co ltd, China Academy of Railway Sciences Corp Ltd CARS, Institute of Computing Technologies of CARS, Beijing Jingwei Information Technology Co Ltd filed Critical China Railway Network Co ltd
Priority to CN202211262511.1A priority Critical patent/CN115659244A/zh
Publication of CN115659244A publication Critical patent/CN115659244A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种故障预测方法、装置及存储介质,所述方法包括:获取车载设备的待识别日志数据;输入所述待识别日志数据至目标故障预测模型,获得所述目标故障预测模型输出的故障类型;其中,所述输入所述待识别日志数据至目标故障预测模型,获得所述目标故障预测模型输出的故障类型,进一步包括:基于所述待识别日志数据,进行数据处理,获得所述待识别日志数据对应的词向量;基于所述词向量,进行特征提取,获得所述词向量对应的全局特征向量;基于所述全局特征向量,进行分类处理,获得所述故障类型。本发明实施例提供的故障预测方法,可以快速实时地根据车载设备的日志数据对故障进行准确预测和智能分类。

Description

故障预测方法、装置及存储介质
技术领域
本发明涉及信息与通信技术领域,尤其涉及一种故障预测方法、装置及存储介质。
背景技术
车载设备是高速铁路列控***的大脑中枢,是保证其运行安全和运营效率的核心要素。车载设备结构复杂,维修时间紧迫,对其进行快速、准确的故障定位,关系着列车运行效率和安全。车载设备运行过程中会产生应用事件日志,该日志以文本形式记录了车载各个模块正常或故障时的运行状态语句,技术人员通过分析车载日志掌握车载设备每一时刻的状态信息。
目前铁路现场对车载设备的故障诊断仍依赖人工经验,诊断难度大、故障处理效率低。如何对车载日志进行文本信息挖掘,实现车载设备故障的智能诊断是当前亟待解决的问题。
发明内容
本发明提供一种故障预测方法、装置及存储介质,用以解决现有技术中对车载设备的故障诊断效率低的缺陷,实现快速实时地根据数据对故障进行准确预测和智能分类。
本发明提供一种故障预测方法,包括:
获取车载设备的待识别日志数据;
输入所述待识别日志数据至目标故障预测模型,获得所述目标故障预测模型输出的故障类型;
其中,所述输入所述待识别日志数据至目标故障预测模型,获得所述目标故障预测模型输出的故障类型,进一步包括:
基于所述待识别日志数据,进行数据处理,获得所述待识别日志数据对应的词向量;
基于所述词向量,进行特征提取,获得所述词向量对应的全局特征向量;
基于所述全局特征向量,进行分类处理,获得所述故障类型。
在一些实施例中,所述基于所述待识别日志数据,进行数据处理,获得所述待识别日志数据对应的文本向量,包括:
对所述待识别日志数据进行分词处理;
基于CBOW算法,确定分词处理后的待识别日志数据对应的词向量。
在一些实施例中,所述基于所述词向量,进行特征提取,获得所述词向量对应的全局特征向量,包括:
基于所述词向量在所述待识别日志数据中出现的顺序,进行拼接,获取所述待识别日志数据对应的文本矩阵向量;
对所述文本矩阵向量进行卷积处理,确定所述文本矩阵向量对应的局部特征向量;
基于所述局部特征向量,确定所述全局特征向量。
在一些实施例中,所述基于所述全局特征向量,进行分类处理,获得所述故障类型之前,还包括:
基于粒子群优化方法,对SVM算法的参数进行优化;
所述参数包括:惩罚因子和高斯核函数参数。
在一些实施例中,所述基于所述全局特征向量,进行分类处理,获得所述故障类型,包括:
基于优化后的SVM算法,对所述全局特征向量进行分类处理,确定所述故障类型。
在一些实施例中,还包括:
基于F1-measure,对所述目标故障预测模型的性能进行评估;
所述F1-measure的计算公式如下:
Figure BDA0003891743300000031
其中,Precison为所述目标故障预测模型的精确率;Recall为所述目标故障预测模型的召回率。
本发明还提供一种故障预测方法装置,包括:
获取模块,用于获取车载设备的待识别日志数据;
预测模块,用于输入所述待识别日志数据至目标故障预测模型,获得所述目标故障预测模型输出的故障类型;
其中,所述输入所述待识别日志数据至目标故障预测模型,获得所述目标故障预测模型输出的故障类型,进一步包括:
基于所述待识别日志数据,进行数据处理,获得所述待识别日志数据对应的词向量;
基于所述词向量,进行特征提取,获得所述词向量对应的全局特征向量;
基于所述全局特征向量,进行分类处理,获得所述故障类型。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述故障预测方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述故障预测方法。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述故障预测方法。
本发明提供的故障预测方法、装置及存储介质,通过结合CBOW算法、CNN算法和SVM分类器,可以提高目标故障预测模型的准确性和实用性,从而目标故障预测模型对车载设备的待识别日志数据进行预测,实现快速实时地根据数据对故障进行准确预测和智能分类。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的故障预测方法的流程示意图;
图2是本发明实施例提供的目标故障预测模型的结构示意图;
图3是本发明实施例提供的基于粒子群优化算法优化SVM参数的方法的流程示意图;
图4是本发明实施例提供的故障预测装置的结构示意图;
图5是本发明实施例提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是本发明实施例提供的故障预测方法的流程示意图,参考图1,本发明实施例提供的故障预测方法,可以包括:
步骤101、获取车载设备的待识别日志数据;
步骤102、输入所述待识别日志数据至目标故障预测模型,获得所述目标故障预测模型输出的故障类型;
其中,所述输入所述待识别日志数据至目标故障预测模型,获得所述目标故障预测模型输出的故障类型,进一步包括:
基于所述待识别日志数据,进行数据处理,获得所述待识别日志数据对应的词向量;
基于所述词向量,进行特征提取,获得所述词向量对应的全局特征向量;
基于所述全局特征向量,进行分类处理,获得所述故障类型。
需要说明的是,本发明提供的故障预测方法的执行主体可以是电子设备、电子设备中的部件、集成电路、或芯片。该电子设备可以是移动电子设备,也可以为非移动电子设备。示例性的,移动电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本或者个人数字助理(personal digital assistant,PDA)等,非移动电子设备可以为服务器、网络附属存储器(Network Attached Storage,NAS)、个人计算机(personal computer,PC)、电视机(television,TV)、柜员机或者自助机等,本发明不作具体限定。
可选地,在步骤101中,获取车载设备的待识别日志数据。
车载设备是铁路安全运行的重要保障,高速铁路的车载设备会实时、连续地产生海量运行数据,形成车载设备的日志数据。日志数据以文本形式记录了车载各个模块正常或故障时的运行状态语句,通过分析日志数据可以掌握车载设备每一时刻的状态信息。
在步骤102中,输入所述待识别日志数据至目标故障预测模型,获得所述目标故障预测模型输出的故障类型。
其中,所述输入所述待识别日志数据至目标故障预测模型,获得所述目标故障预测模型输出的故障类型,进一步包括:
将待识别日志数据输入至目标故障预测模型中,获得目标故障预测模型输出的待识别日志数据对应的故障类型。
可选地,图2是本发明实施例提供的目标故障预测模型的结构示意图,如图2所示,本申请实施例提供的目标故障预测模型可以包括三部分,分别是:数据处理部分、特征提取部分和故障诊断部分。
数据处理部分是将运行状态语句进行结构化处理,将文本转换为计算机可识别的向量形式。
可选地,获取车载设备的待识别日志数据后,可以对文本进行预处理,例如:
对车载日志统一数据模式,按顺序依次提取运行状态语句。将每段语句作为一组样本,以词为单位对样本进行分词处理。
采用Word2vec中的连续词袋(Continuous Bag-of-Words,CBOW)模型,对经过预处理的日志数据作为训练语料,通过当前任意词的上下文预测当前词来构造语言模型。
通过训练好的CBOW模型,对预处理后的待识别日志数据,进行数据处理,获得待识别日志数据对应的词向量。
特征提取部分利用数据处理后所得到的待识别日志数据的词向量对卷积神经网络(Convolutional Neural Networks,CNN)进行训练,提取特征向量。
故障预测部分将样本特征向量送入优化后支持向量机(Support VectorMachine,SVM)分类器实现故障的精确分类。
可选地,目标故障预测模型可以是通过车载设备的历史日志数据,以及历史日志数据对应的故障类型进行训练得到的。
本发明实施例提供的故障预测方法,通过结合CBOW算法、CNN算法和SVM分类器,可以提高目标故障预测模型的准确性和实用性,从而目标故障预测模型对车载设备的待识别日志数据进行预测,实现快速实时地根据数据对故障进行准确预测和智能分类。
在一些实施例中,所述基于所述待识别日志数据,进行数据处理,获得所述待识别日志数据对应的文本向量,包括:
对所述待识别日志数据进行分词处理;
基于CBOW算法,确定分词处理后的待识别日志数据对应的词向量。
可选地,获取车载设备的待识别日志数据后,可以对文本进行预处理,例如:
对车载日志统一数据模式,按顺序依次提取运行状态语句。将每段语句作为一组样本,以词为单位对样本进行分词处理。为减少文本噪声,过滤停用词和符号。停用词主要包括英文字符、数字、数学字符、标点符号及使用频率特高的单汉字等,按照需求人工定义生成停用词表。
采用Word2vec中的连续词袋(Continuous Bag-of-Words,CBOW)模型,对经过预处理的日志数据作为训练语料,通过当前任意词的上下文预测当前词来构造语言模型。
例如:输入当前词的上下文词向量,经特征映射,在输出层结合HierarchicalSoftmax算法利用哈夫曼(Huffman)树实现目标优化。Huffman树以语料库中所有词作叶子节点,以词频作其相应权值,用二进制编码表示根节点到该词的路径,将路径中的每个分支看成一次二分类,每次分类产生一个概率,目标是使预测词二进制编码概率最大。模型优化函数为:
Figure BDA0003891743300000071
其中,C为语料库;Context(w)为当前词上下文;w为当前词;P为概率函数。
可选地,可利用随机梯度上升法对CBOW模型进行优化。通过该模型,可训练出车载日志数据中每个词语固定长度的向量表示,且日志数据中词语语义相似度与所得词向量表示的余弦距离成正比,能最大程度保留车载日志的语义特征,减少语义信息损失。
本发明实施例提供的故障预测方法,通过CBOW算法,将待识别的日志数据转化为词向量,能最大程度保留车载设备日志数据的语义特征,减少语义信息损失。
在一些实施例中,所述基于所述词向量,进行特征提取,获得所述词向量对应的全局特征向量,包括:
基于所述词向量在所述待识别日志数据中出现的顺序,进行拼接,获取所述待识别日志数据对应的文本矩阵向量;
对所述文本矩阵向量进行卷积处理,确定所述文本矩阵向量对应的局部特征向量;
基于所述局部特征向量,确定所述全局特征向量。
CNN是在人工神经网络的基础上引入了由卷积层和池化层构成的特征提取器,经卷积操作自动提取更具差异性的特征,经池化、局部感受野和权值共享等操作减少网络复杂度和参数量。
通过CNN算法对经CBOW算法得到的词向量,进行特征提取,得到全局特征向量的具体过程如下:
(1)输入层:令xi∈Rd为经CBOW模型训练所得车载设备的日志数据中第i个词的d维向量表示;
将一段运行状态语句中所有的词语按词出现的顺序依次拼接,组成一组样本的文本矩阵A∈Rn×d,n为样本集中运行状态语句段的最长长度,不足长度n的语句用0补齐。
(2)卷积层:对文本矩阵A经卷积核w∈Rh×d进行卷积操作
ci=f(w·xi:i+h-1+bi)
其中,ci为卷积操作所提取的局部特征;f为非线性激活函数ReLU;xi:i+h-1为矩阵A由第i个词到i+h-1个词组成的向量矩阵,h为卷积核宽度;bi为偏置项。
当用卷积核w对一组样本完成卷积后,将ci依次排列,即可生成特征集合C∈Rn-h+1
由于每组样本词语数量不同,为更全面提取特征,采用多种不同宽度的卷积核以获取不同词数级别的语义特征。
(3)池化层:对卷积后的特征集合进行最大池化操作,获得局部特征中最重要的特征,同时减少网络权值数量,降低计算复杂度,即:
tj=max{C}
其中,tj为各不同宽度卷积核提取的特征值;j=1,2,…m,m为卷积核总数。
将所得tj依次排列可构成全局特征向量T∈Rm
(4)全连接和输出层:将全局特征向量作为全连接层的输入,利用softmax函数输出属于各故障类别的概率分布:
Figure BDA0003891743300000091
其中,Pk为属于第k类故障的概率;W和B分别为全连接层的权重矩阵和偏置项;Y为故障类别数量。
本申请实施例可以采用反向传播算法通过最小化交叉熵损失函数训练CNN,根据随机梯度下降法计算梯度,使用Adadelta更新准则来更新学习率。并且在模型的卷积运算之后以及全连接层的激活函数之前加入批归一化处理。
CNN训练好后,可利用卷积层和池化层从输入的车载日志数据中自动提取特征向量。
本发明实施例提供的故障预测方法,通过CNN算法提取车载日志数据的全局特征向量,通过共享卷积核,可以有效处理高维数据,自动进行特征提取,进一步提高了目标故障预测模型的效率。
在一些实施例中,所述基于所述全局特征向量,进行分类处理,获得所述故障类型之前,还包括:
基于粒子群优化方法,对SVM算法的参数进行优化;
所述参数包括:惩罚因子和高斯核函数参数。
可选地,直接采取Softmax分类器获取故障概率,无法保障对于不均衡故障信息的准确分类,因此将经过CNN提取的全局特征向量T∈Rm通过粒子群优化后的SVM分类器参数进行分类,从而获取铁路设备各类故障的预测概率。
SVM将实例映射为空间中的点,能够有效地以明显的间隔将不同类别的实例区分出来。SVM不仅能够有效处理线性分类问题,也可以引入核函数方便地进行非线性分类。
其中,分类决策函数为:
f(x)=wTx+b
其中,x为输入样本向量,wT为权重矩阵的转置,b为偏置。
为了优化分类效果,可依据最大化分类间隔得到最优分类平面。
Figure BDA0003891743300000101
yi(wTxi+b)≥1i=1,…,n
其中,输入n个样本,编号i从1到n,yi为输入样本xi经过分类决策函数的输入值。
为了求解上式,引入拉格朗日对偶性:
Figure BDA0003891743300000102
其中,ai为第i个样本的权重参数。
由于在实际情况中,存在一些偏离决策平面的数据点,引入松弛变量ξi和松弛变量权重γi
因此上式可变换为:
Figure BDA0003891743300000103
其中,C为惩罚因子,用于约束松弛变量。
对上式求偏导,整理后得到
Figure BDA0003891743300000111
为了获取向量a的值,引入序列最小最优化算法SMO(Sequential MinimalOptimization),已知a可求得ω的值。根据下式求出b:
Figure BDA0003891743300000112
其中k为正定核,s为训练样本数。
将数据点映射到高纬度空间,能够解决非线性不可分的情况,从而实现数据分类。但是,非线性映射会使得计算量大幅度增加。而在支持向量机中引入核函数的概念,则能够有效减少计算量。采用高斯核函数将其输入隐式映射到高纬度空间中,有效地进行非线性分类。
上述算法描述是针对二分类的情况,在铁路故障情形中,数据点的类别多于两个,按照实际情况分类。目前,SVM算法实现多分类方法的方式主要有两种:一对多方式和一对一方式。
铁路样本数据的分布具有明显的不均衡性。为了使样本数据的这一特点尽可能小地影响分类器的精度,一般可以从数据处理层面和算法改进层面解决这一问题。数据层面一般采用过采样、欠采样的方式进行处理;算法层面则采用引入代价敏感矩阵,构建集成分类器等方式进行处理。
本申请实施例以SVM为基分类器,采用粒子群优化算法(Particle SwarmOptimization,PSO)优化分类参数的方式完成对不均衡数据的诊断分类。
PSO利用群体中个体之间的信息交互与合作,使得群体能够以更快收敛速度移动到最优区域。
PSO将每个个体视为一个“粒子”,该粒子无体积且认为所有的粒子均在同一个D维搜索空间中进行搜索。在每一次的迭代过程中,粒子通过追踪两个最优解来更新自身。其中一个是粒子本身寻得的最优解Pbest,另一个就是这个群体中目前搜索到的最优gbest
这些粒子以一定的速度飞行,此速度决定了粒子飞行的距离和方向。粒子速度的值不但取决于自身的飞行经验,还受同伴飞行经验的影响,粒子在飞行过程中的速度根据实际情况实时更新。粒子i的速度用Vi=[vi1 vi2…vin]表示。
粒子群优化算法的迭代公式如下:
速度向量中第i个分量的迭代公式为:
Figure BDA0003891743300000121
位置向量中第i个分量的迭代公式为:
xk+1,i=xk,i+vk,i
其中,q为惯性权重;c1和c2是加速常数;r1和r2在[0,1]区间内随机取值。
通过改进的PSO算法对SVM参数进行优化后将所提取的特征用于分类识别,由于支持向量机的分类准确率在一定程度上会受到惩罚因子与高斯核函数参数的作用,因此把惩罚因子与高斯核函数参数作为粒子,通过改进的PSO算法对参数惩罚因子与高斯核函数参数进行优化,来增强支持向量机对于故障类型识别的准确程度。
图3是本发明实施例提供的基于粒子群优化算法优化SVM参数的方法的流程示意图,参考图3,可以基于粒子群优化算法对SVM的惩罚因子和高斯核函数参数进行优化。
在一些实施例中,所述基于所述全局特征向量,进行分类处理,获得所述故障类型,包括:
基于优化后的SVM算法,对所述全局特征向量进行分类处理,确定所述故障类型。
基于优化后的SVM算法,对全局特征向量进行分类处理,从而可以获得准确的故障类型。
本发明实施例提供的故障预测方法,通过粒子群优化的支持向量机算法,可以降低故障数据分布不均衡带来的误差,进一步提高模型预测的准确性。
在一些实施例中,还包括:
基于F1-measure,对所述目标故障预测模型的性能进行评估;
所述F1-measure的计算公式如下:
Figure BDA0003891743300000131
其中,Precison为所述目标故障预测模型的精确率;Recall为所述目标故障预测模型的召回率。
可选地,在分类器的设计过程中,一个好的评价分类器性能的指标,既利于对模型的优化又可以直观说明分类器分类效果的优劣。混淆矩阵能够以可视化的形式展现分类的好坏程度。矩阵中的每一行代表了预测类别,每一列代表数据的真实归属类别。
准确率这一指标常被用来评价分类器的性能。准确率代表正确预测的样本数占预测总样本数的百分比。但是,当样本数据不同类别的比例存在较大差异时,准确率并不能全面反映分类器分类效果的好坏。这是因为小比例类别的样本易被误归类为大类别样本,但由于小比例样本数据较少,即使小类别样本的分类效果较差,分类器整体的准确率依然会很高。为了弥补准确率这一指标的缺陷,特引入F-measure作为评估指标,从而更加全面地评价分类器的优劣。
已知精确率(Precison)和召回率(Recall)可以计算出F-measure。精确率是指正确识别的个体总数占据识别出的个体总数的百分比。精确率能够直观表示预测类别中准确预测样本所占的比例。
精确率的计算公式如下:
P=Precision=TP/(TP+FP)
其中,TP为实际故障被预测为实际故障的个数;FP为错误故障被预测为实际正确故障的个数。
召回率是指正确识别故障类型的个体总数占据测试集中存在个体总数的百分比。
召回率的计算公式如下:
R=Recall=TP/(TP+FN)
其中,TP为实际故障被预测为实际故障的个数;FN为实际故障被预测为错误故障的个数。
单独考虑每一故障类别的分类效果时,Precision和Recall有时会出现矛盾的情况。
F-measure是Precision和Recall的加权调和平均,能够有效解决这一矛盾。
F-measure的计算公式如下:
Figure BDA0003891743300000141
其中,当参数μ=1时,即为F1-measure,计算公式如下:
Figure BDA0003891743300000142
铁路运行数据样本差异较大,故障数据占全部运行状态数据的比例非常小。故障不同类别的比例存在较大差异,准确率并不能全面反映分类器分类效果的好坏。衡量铁路设备故障预测分类器的性能时,可采用F1-measure模型来评估。
本发明实施例提供的故障预测方法,通过F1-measure模型对目标故障预测模型的性能进行评估,提高了目标故障预测模型的准确性,从而可以更快速、实时和准确地对车载设备故障进行排除、定位及诊断。
下面对本发明提供的故障预测装置进行描述,下文描述的故障预测装置与上文描述的故障预测方法可相互对应参照。
图4是本发明实施例提供的故障预测装置的结构示意图,参照图4,本发明实施例提供的故障预测装置,可以包括:
获取模块410,用于获取车载设备的待识别日志数据;
预测模块420,用于输入所述待识别日志数据至目标故障预测模型,获得所述目标故障预测模型输出的故障类型;
其中,所述输入所述待识别日志数据至目标故障预测模型,获得所述目标故障预测模型输出的故障类型,进一步包括:
基于所述待识别日志数据,进行数据处理,获得所述待识别日志数据对应的词向量;
基于所述词向量,进行特征提取,获得所述词向量对应的全局特征向量;
基于所述全局特征向量,进行分类处理,获得所述故障类型。
本发明实施例提供的故障预测装置,通过结合CBOW算法、CNN算法和SVM分类器,可以提高目标故障预测模型的准确性和实用性,从而目标故障预测模型对车载设备的待识别日志数据进行预测,实现快速实时地根据数据对故障进行准确预测和智能分类。
可选地,所述基于所述待识别日志数据,进行数据处理,获得所述待识别日志数据对应的文本向量,包括:
对所述待识别日志数据进行分词处理;
基于CBOW算法,确定分词处理后的待识别日志数据对应的词向量。
可选地,所述基于所述词向量,进行特征提取,获得所述词向量对应的全局特征向量,包括:
基于所述词向量在所述待识别日志数据中出现的顺序,进行拼接,获取所述待识别日志数据对应的文本矩阵向量;
对所述文本矩阵向量进行卷积处理,确定所述文本矩阵向量对应的局部特征向量;
基于所述局部特征向量,确定所述全局特征向量。
可选地,所述基于所述全局特征向量,进行分类处理,获得所述故障类型之前,还包括:
基于粒子群优化方法,对SVM算法的参数进行优化;
所述参数包括:惩罚因子和高斯核函数参数。
可选地,所述基于所述全局特征向量,进行分类处理,获得所述故障类型,包括:
基于优化后的SVM算法,对所述全局特征向量进行分类处理,确定所述故障类型。
可选地,还包括:
基于F1-measure,对所述目标故障预测模型的性能进行评估;
所述F1-measure的计算公式如下:
Figure BDA0003891743300000161
其中,Precison为所述目标故障预测模型的精确率;Recall为所述目标故障预测模型的召回率。
图5示例了一种电子设备的实体结构示意图,如图5所示,该电子设备可以包括:处理器(processor)510、通信接口(Communications Interface)520、存储器(memory)530和通信总线540,其中,处理器510,通信接口520,存储器530通过通信总线540完成相互间的通信。处理器510可以调用存储器530中的逻辑指令,以执行故障预测方法,该方法包括:
获取车载设备的待识别日志数据;
输入所述待识别日志数据至目标故障预测模型,获得所述目标故障预测模型输出的故障类型;
其中,所述输入所述待识别日志数据至目标故障预测模型,获得所述目标故障预测模型输出的故障类型,进一步包括:
基于所述待识别日志数据,进行数据处理,获得所述待识别日志数据对应的词向量;
基于所述词向量,进行特征提取,获得所述词向量对应的全局特征向量;
基于所述全局特征向量,进行分类处理,获得所述故障类型。
此外,上述的存储器530中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的故障预测方法,该方法包括:
获取车载设备的待识别日志数据;
输入所述待识别日志数据至目标故障预测模型,获得所述目标故障预测模型输出的故障类型;
其中,所述输入所述待识别日志数据至目标故障预测模型,获得所述目标故障预测模型输出的故障类型,进一步包括:
基于所述待识别日志数据,进行数据处理,获得所述待识别日志数据对应的词向量;
基于所述词向量,进行特征提取,获得所述词向量对应的全局特征向量;
基于所述全局特征向量,进行分类处理,获得所述故障类型。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的故障预测方法,该方法包括:
获取车载设备的待识别日志数据;
输入所述待识别日志数据至目标故障预测模型,获得所述目标故障预测模型输出的故障类型;
其中,所述输入所述待识别日志数据至目标故障预测模型,获得所述目标故障预测模型输出的故障类型,进一步包括:
基于所述待识别日志数据,进行数据处理,获得所述待识别日志数据对应的词向量;
基于所述词向量,进行特征提取,获得所述词向量对应的全局特征向量;
基于所述全局特征向量,进行分类处理,获得所述故障类型。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种故障预测方法,其特征在于,包括:
获取车载设备的待识别日志数据;
输入所述待识别日志数据至目标故障预测模型,获得所述目标故障预测模型输出的故障类型;
其中,所述输入所述待识别日志数据至目标故障预测模型,获得所述目标故障预测模型输出的故障类型,进一步包括:
基于所述待识别日志数据,进行数据处理,获得所述待识别日志数据对应的词向量;
基于所述词向量,进行特征提取,获得所述词向量对应的全局特征向量;
基于所述全局特征向量,进行分类处理,获得所述故障类型。
2.根据权利要求1所述的故障预测方法,其特征在于,所述基于所述待识别日志数据,进行数据处理,获得所述待识别日志数据对应的文本向量,包括:
对所述待识别日志数据进行分词处理;
基于CBOW算法,确定分词处理后的待识别日志数据对应的词向量。
3.根据权利要求1所述的故障预测方法,其特征在于,所述基于所述词向量,进行特征提取,获得所述词向量对应的全局特征向量,包括:
基于所述词向量在所述待识别日志数据中出现的顺序,进行拼接,获取所述待识别日志数据对应的文本矩阵向量;
对所述文本矩阵向量进行卷积处理,确定所述文本矩阵向量对应的局部特征向量;
基于所述局部特征向量,确定所述全局特征向量。
4.根据权利要求1所述的故障预测方法,其特征在于,所述基于所述全局特征向量,进行分类处理,获得所述故障类型之前,还包括:
基于粒子群优化方法,对SVM算法的参数进行优化;
所述参数包括:惩罚因子和高斯核函数参数。
5.根据权利要求4所述的故障预测方法,其特征在于,所述基于所述全局特征向量,进行分类处理,获得所述故障类型,包括:
基于优化后的SVM算法,对所述全局特征向量进行分类处理,确定所述故障类型。
6.根据权利要求1至5任一项所述的故障预测方法,其特征在于,还包括:
基于F1-measure,对所述目标故障预测模型的性能进行评估;
所述F1-measure的计算公式如下:
Figure FDA0003891743290000021
其中,Precison为所述目标故障预测模型的精确率;Recall为所述目标故障预测模型的召回率。
7.一种故障预测装置,其特征在于,包括:
获取模块,用于获取车载设备的待识别日志数据;
预测模块,用于输入所述待识别日志数据至目标故障预测模型,获得所述目标故障预测模型输出的故障类型;
其中,所述输入所述待识别日志数据至目标故障预测模型,获得所述目标故障预测模型输出的故障类型,进一步包括:
基于所述待识别日志数据,进行数据处理,获得所述待识别日志数据对应的词向量;
基于所述词向量,进行特征提取,获得所述词向量对应的全局特征向量;
基于所述全局特征向量,进行分类处理,获得所述故障类型。
8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述故障预测方法。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述故障预测方法。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述故障预测方法。
CN202211262511.1A 2022-10-14 2022-10-14 故障预测方法、装置及存储介质 Pending CN115659244A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211262511.1A CN115659244A (zh) 2022-10-14 2022-10-14 故障预测方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211262511.1A CN115659244A (zh) 2022-10-14 2022-10-14 故障预测方法、装置及存储介质

Publications (1)

Publication Number Publication Date
CN115659244A true CN115659244A (zh) 2023-01-31

Family

ID=84987329

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211262511.1A Pending CN115659244A (zh) 2022-10-14 2022-10-14 故障预测方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN115659244A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117074628A (zh) * 2023-10-17 2023-11-17 山东鑫建检测技术有限公司 一种多传感器空气质量检测设备故障定位方法
CN117667497A (zh) * 2024-01-31 2024-03-08 中国铁道科学研究院集团有限公司通信信号研究所 一种调度集中***的自动化故障分析方法及***

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117074628A (zh) * 2023-10-17 2023-11-17 山东鑫建检测技术有限公司 一种多传感器空气质量检测设备故障定位方法
CN117074628B (zh) * 2023-10-17 2024-01-09 山东鑫建检测技术有限公司 一种多传感器空气质量检测设备故障定位方法
CN117667497A (zh) * 2024-01-31 2024-03-08 中国铁道科学研究院集团有限公司通信信号研究所 一种调度集中***的自动化故障分析方法及***
CN117667497B (zh) * 2024-01-31 2024-04-16 中国铁道科学研究院集团有限公司通信信号研究所 一种调度集中***的自动化故障分析方法及***

Similar Documents

Publication Publication Date Title
CN108737406B (zh) 一种异常流量数据的检测方法及***
CN110347835B (zh) 文本聚类方法、电子装置及存储介质
CN115659244A (zh) 故障预测方法、装置及存储介质
CN108073568A (zh) 关键词提取方法和装置
CN111966812B (zh) 一种基于动态词向量的自动问答方法和存储介质
CN112016313B (zh) 口语化要素识别方法及装置、警情分析***
CN113392209A (zh) 一种基于人工智能的文本聚类方法、相关设备及存储介质
US20210209447A1 (en) Information processing apparatus, control method, and program
CN112559741B (zh) 核电设备缺陷记录文本分类方法、***、介质及电子设备
CN113642727A (zh) 神经网络模型的训练方法和多媒体信息的处理方法、装置
CN113535906A (zh) 一种电力领域隐患事件文本分类方法及其相关装置
CN111859979A (zh) 讽刺文本协同识别方法、装置、设备及计算机可读介质
CN114119191A (zh) 风控方法、逾期预测方法、模型训练方法及相关设备
CN112698977B (zh) 服务器故障定位方法方法、装置、设备及介质
CN113919544B (zh) 犯罪预警方法、装置、计算机设备及存储介质
CN113722477B (zh) 基于多任务学习的网民情绪识别方法、***及电子设备
CN114881172A (zh) 一种基于加权词向量和神经网络的软件漏洞自动分类方法
CN114036289A (zh) 一种意图识别方法、装置、设备及介质
CN113761123A (zh) 关键词获取的方法、装置、计算设备和存储介质
Wang et al. A driver abnormal behavior warning method based on isolated forest algorithm.
CN113094504A (zh) 基于自动机器学习的自适应文本分类方法及装置
CN112488146A (zh) 基于深度学习的飞机危险识别与趋势预测方法
CN112507912A (zh) 一种识别违规图片的方法及装置
CN116738323B (zh) 铁路信号设备的故障诊断方法、装置、设备及介质
CN114818659B (zh) 一种文本情感来源分析方法、***及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination