CN110647539B - 一种用于车辆故障的预测方法和*** - Google Patents

一种用于车辆故障的预测方法和*** Download PDF

Info

Publication number
CN110647539B
CN110647539B CN201910919451.8A CN201910919451A CN110647539B CN 110647539 B CN110647539 B CN 110647539B CN 201910919451 A CN201910919451 A CN 201910919451A CN 110647539 B CN110647539 B CN 110647539B
Authority
CN
China
Prior art keywords
early warning
vehicle
fault information
information
platform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910919451.8A
Other languages
English (en)
Other versions
CN110647539A (zh
Inventor
杜超坎
蔡素贤
王皓桦
贺晓凤
巫朝星
陈旺明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honorsun Xiamen Data Co ltd
Original Assignee
Honorsun Xiamen Data Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honorsun Xiamen Data Co ltd filed Critical Honorsun Xiamen Data Co ltd
Priority to CN201910919451.8A priority Critical patent/CN110647539B/zh
Publication of CN110647539A publication Critical patent/CN110647539A/zh
Application granted granted Critical
Publication of CN110647539B publication Critical patent/CN110647539B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Traffic Control Systems (AREA)

Abstract

本申请公开了一种用于车辆故障的预测方法和***。其中,包括基于提取到平台预警故障信息、车辆指标信息、车辆档案信息和车辆维修保养记录信息的车辆数据,进行缺失值、设定阈值和统计特征量处理;统计固定时间间隔内车辆故障信息发生的次数和频率,分析平台预警故障信息与车辆指标信息的相关性和分析不同类型的平台预警故障信息之间存在的关联性,获取用于车辆故障预测的多个特征数据;将其中类别特征数据转化为数据标识,通过第一SVM分类器,预测车辆发生故障的概率,通过第二SVM分类器,进一步预测车辆对应故障类型的发生概率。该方案有助于实现对车辆健康状态和故障发生概率实时预测监督。

Description

一种用于车辆故障的预测方法和***
技术领域
本申请涉及车辆技术领域,具体涉及一种用于车辆故障的预测方法和***。
背景技术
随着车辆工业的发展和人民生活水平的提高,车辆越来越多地进入普通家庭。伴随着车辆的持续增加,道路交通事故急剧增加。其中由于车辆部件本身的问题造成的交通事故,占据了交通事故的30%以上。车辆故障预警***作为车辆主动安全的主要手段,在车联网服务中的重要性与日俱增。
另一方面,社会中绝大部分车主对于车辆的故障现象辨识经验尚有所欠缺,不能准确详细地描述车辆可能出现的故障,无法为车队维修部门提供准确的故障信息。对于目前的车辆故障检测***,现有车辆在线故障预警***主要基于单一的车辆数据的参考阀值进行预测,其预测周期较短,准确性较差,其可靠性不能满足车辆主动安全的用户需求。因此如何提高预测车辆可能发生故障的准确性,预测车辆可能哪些部位发生故障,成为本领域技术入员亟需解决的问题。
发明内容
本申请的目的在于提出了一种用于车辆故障的预测方法和***,以便更好预测车辆发生故障的准确性,预测车辆部件发生故障概率大小的技术问题。
第一方面,本申请实施例提供了一种用于车辆故障的预测方法,该方法包括:
S1:基于提取到包括平台预警故障信息、车辆指标信息、车辆档案信息和车辆维修保养记录信息的车辆数据,进行缺失值处理、设定阈值处理和统计特征量处理。
S2:响应于统计固定时间间隔内车辆故障信息发生的次数和频率,分析平台预警故障信息与车辆指标信息的相关性和分析不同类型的平台预警故障信息之间存在的关联性,获取用于车辆故障预测的多个特征数据,其中,车辆故障信息包括实际已发生的故障信息和平台预警故障信息;以及。
S3:将其中类别特征数据转化为数据标识,通过第一SVM分类器,预测发生故障的概率,通过第二SVM分类器,进一步预测车辆对应故障类型的发生概率。
在该方法中,提取出不同维度的车辆信息数据,进行缺失值、异常值和设置阈值处理,统计车辆故障信息,分析故障信息和车辆指标信息的关联性;分析不同类型的平台预警故障信息之间的关联性,提取多个车辆故障特征数据进行第一SVM分类器和第二SVM分类器训练构建一种车辆发生故障概率和车辆部件发生故障概率的预测模型。
在一些具体实施例中,平台预警故障信息包括气压传感器预警信息、气压预警信息、机油压力预警信息水温预警信息、机油预警信息和刹车蹄片磨损预警信息;车辆指标信息包括车速、转速和进气温度;车辆档案信息包括车辆购置日期、品牌和车型;车辆维修保养记录信息包括维修时间、保养时间、故障类型、保养类型、故障描述和保养项目。平台预警故障信息和车辆指标信息可以辅助机务人员检查车辆的健康状态,引入车辆档案信息和车辆维修保养记录信息提高对车辆真实故障预测的准确性。
在一些具体实施例中,S1步骤具体包括将车辆数据中的缺失值和异常值进行记录删除、零值替换和均值替换处理,基于处理后的平台预警故障信息数据进一步进行设定阈值处理,基于处理后的车辆指标信息进一步计算平均值p1、标准差p2、平均变化率p3和极差p4四个统计特征量处理,具体计算公式如下:
Figure BDA0002217090560000031
Figure BDA0002217090560000032
Figure BDA0002217090560000033
p4=xmax-xmin
其中,n表示固定间隔时间内一组车辆指标数据的个数,xi表示固定时间间隔内该组第i个车辆指标数据,xmax表示固定时间间隔内该组车辆指标数据的最大数据值,xmin表示固定时间间隔内该组车辆指标数据的最小数据值。车辆各部分部件ECU会进行不停检测,检测到超过设定参数,会发送预警信息,但是预警信息可能存在误报或者短时间自动修复的情况,针对进而需要对提取的数据进行前期的预处理过程,以便后续获取准确的多个特征数据。
在一些具体实施例中,该方法还包括在步骤S2中的相关性采用皮尔逊相关系数计算,具体计算公式如下:
Figure BDA0002217090560000034
其中,X表示车辆指标数据,Y表示平台预警故障信息,ρXY表示变量X和Y的相关系数,Cov(X,Y)代表变量X和Y的协方差,D(X)和D(Y)分别代表变量X和Y的方差,设定发生平台预警故障信息用数值1表示,不发生平台预警故障信息用数值0表示,ρXY值越接近1,则平台预警故障信息与车辆指标数据的相关性越大,反之则越小。利用车辆指标数据和平台预警故障信息的之间的相关性,挑选出影响车辆平台预警故障信息相关度大的车辆指标数据作为特征数据。
在一些具体实施例中,该方法还包括S2步骤中的关联性是利用权重关联规则算法,计算车辆平台预警故障信息A和B之间的关联数据集和关联值,具体运算步骤如下:
S21:扫描平台预警故障信息的事务数据库D,设置最小支持度min sup,利用普通关联规则生成1-项候选集C1,比较平台预警故障信息A和B的支持度
Figure BDA0002217090560000041
和最小支持度min sup生成1-项频繁集L1
S22:基于1-项频繁集L1生成2-项候选集C2,结合平台预警故障信息A和B的权重平均值W(A∪B),计算平台预警故障信息A和B的加权支持度
Figure BDA0002217090560000042
以min sup为最小支持度生成加权频繁集LW2
S23:设置最小关联度,基于加权频繁集LW2中的基础上利用最小关联度生成平台预警故障信息A和B之间的关联数据集和关联值。
在S21步骤中,计算平台预警故障信息A和B的支持度
Figure BDA0002217090560000043
为:
Figure BDA0002217090560000044
在S22步骤中:计算平台预警故障信息A和B的加权支持度
Figure BDA0002217090560000045
为:
Figure BDA0002217090560000046
在S23步骤中:计算平台预警故障信息A和B的关联度
Figure BDA0002217090560000047
为:
Figure BDA0002217090560000048
其中,D表示平台预警故障信息的事务数据库,count(D)为所有事物的个数,
Figure BDA0002217090560000049
表示平台预警故障信息A和B的关联关系,sup-count(A∪B)表示一定时间范围内平台预警故障信息A和B同时发生事务的个数,W(A∪B)表示车辆平台预警故障信息A和B的权重平均值,min sup表示最小支持度,sup表示支持度,w sup表示加权支持度。
在该方法中,不同类型的平台预警故障信息之间存在一定的关联性,对于这种关联信息可以通过关联规则算法进行挖掘,结合不同类型的平台预警故障信息时间间隔转化的权重值,通过以上运算获得固定时间间隔内不同类型的平台预警故障信息之间的关联数据集和关联值。
在一些具体实施例中,该方法还包括:
权重关联规则算法中的权重通过一定时间范围内不同类型的平台预警故障信息发生的时间间隔表示,时间间隔与权重成反比,具体计算公式如下:
Wti=(max(T)-ti)/(max(T)-min(T))
Wn=(Wt1+Wt2+…Wtn)/n
其中,Wti表示第i个时间间隔内两个不同类型的平台预警故障信息的权重值,ti表示第i个时间间隔内两个不同类型的平台预警故障信息之间的最小时间间隔,min(T)表示一定时间范围内两个不同类型的平台预警故障信息之间最短的间隔时间,max(T)表示一定时间范围内两个不同类型的平台预警故障信息之间最长的间隔时间,Wn表示一定时间范围内n对不同类型的两个平台预警故障信息的权重平均值(如其中车辆平台预警故障信息A和B的权重平均值表示W(A∪B))。车辆发生故障原本就是小概率事件,先计算固定时间段内两个不同类型的平台预警故障信息的权重值后,对一定时间范围内n对不同类型的两个平台预警故障信息的权重平均值,反映数据的真实性。
在一些具体实施例中,S3步骤中的第一SVM分类器和第二SVM分类器中采用粒子群优化算法确定惩罚参数和核函数参数,第一SVM分类器和第二SVM分类器中的目标函数分别定义为:
Figure BDA0002217090560000051
s.t.|yi-ω*k-b|<ζi
其中,ω表示可调权值向量,即超平面中每个向量的可调权值,ζ≥0表示松弛变量,C表示惩罚参数,b表示偏置量,即超平面相对原点的偏移,k=K(xi,xj)表示核函数参数,i=1,2,...,n,j=1,2,...,n,第一SVM分类器中的yi设置为0或1两个取值,第二SVM分类器中yi取值由车辆故障类别组成,设置为yi=1,2,...,n。惩罚参数和核函数参数一般都是凭经验确定,采用粒子群优化算法可以有效提高两个参数精准度。
在一些具体实施例中,车辆故障信息数据包括实际已发生故障的正类样本数据和实际未发生故障负类样本数据,在训练阶段前利用欧氏距离得到每个正类样本的k近邻基于采样倍率构建新的样本,获得数据均衡的车辆故障信息数据。车辆发生故障属于小概率时间,在实际情况下行正类样本数据在数量上远少于负类样本数据,为了提高SVM分类器模型的准确性,需要对训练样本中的正类样本数据和负类样本数据进行数据均衡化处理。
另一方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述实施例的方法。
第三方面,本申请实施例提供了一种用于车辆故障的预测***,该***包括:
车辆数据提取单元:配置用于基于提取到包括平台预警故障信息、车辆指标信息、车辆档案信息和车辆维修保养记录信息的车辆数据,进行缺失值处理、设定阈值处理和统计特征量处理。
特征数据提取单元:配置用于响应于统计固定时间间隔内车辆故障信息发生的次数和频率,分析平台预警故障信息与车辆指标信息的相关性和分析不同类型的平台预警故障信息之间存在的关联性,获取用于车辆故障预测的多个特征数据,其中,车辆故障信息包括实际已发生的故障信息和平台预警故障信息;以及。
第一和第二SVM分类器单元:配置用于将其中类别特征数据转化为数据标识,通过第一SVM分类器,预测发生故障的概率,通过第二SVM分类器,进一步预测车辆对应故障类型的发生概率。
本申请实施例提供的一种用于车辆故障的预测方法和***。其中,包括提取到平台预警故障信息、车辆指标信息、车辆档案信息和车辆维修保养记录信息的车辆数据,进行缺失值、设定阈值和统计特征量处理;统计固定时间间隔内车辆故障信息发生的次数和频率,分析平台预警故障信息与车辆指标信息的相关性和分析不同类型的平台预警故障信息之间存在的关联性,获取用于车辆故障预测的多个特征数据;将其中类别特征数据转化为数据标识,通过第一SVM分类器,预测发生故障的概率,通过第二SVM分类器,进一步预测车辆对应故障类型的发生概率。该方案有助于实现对车辆健康状态和故障发生概率实时预测监督。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是根据本申请实施例中的一种用于车辆故障的预测方法的流程图;
图2是根据本申请的一个具体实施例的用于车辆故障的预测方法的流程示意图;
图3是根据本申请的一个具体示例的SVM分类器训练步骤流程图;
图4是根据本申请的一个具体示例的SVM分类器模拟训练流程图;
图5是根据本申请的一个具体示例的SVM分类器模拟预测流程图;
图6是根据本申请实施例的一种用于车辆故障的预测***的示意性结构框图;
图7是适于用来实现本申请实施例的电子设备的计算机***的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了根据本申请实施例中的一种用于车辆故障的预测方法的流程图。如图1所示,该方法包括提取车辆数据,车辆故障特征提取和机器学习训练。
在步骤S1中:基于提取到包括平台预警故障信息、车辆指标信息、车辆档案信息和车辆维修保养记录信息的车辆数据,进行缺失值处理、设定阈值处理和统计特征量处理。
在该步骤中的车辆数据包括平台预警故障信息、车辆指标信息、车辆档案信息和车辆维修保养记录四类不同维度的车辆数据。平台预警故障信息和车辆指标信息是通过车辆电子控制单元(Electronic Control Unit,ECU)监控,可以在一定程度上辅助机务人员检查车辆正常状态,但是由于车辆各部件的指标需要人工调取查看,目前监测设备无法自动监测检查到车辆指标是否正常,此外车辆故障信息存在误报或者短时间内发生预警后自动修复的情况,所以在提取车辆数据环节引入车辆基础档案信息、车辆维修保养记录等数据,对提取的车辆数据先进行缺失值和异常值处理,可以采用记录删除、零值替换和均值替换等方式处理,以便提高对车辆真实故障预测的准确度。将处理后的平台预警故障信息进行设置阈值处理,如设置10秒为过滤阈值,只保留修复时间超过10秒的平台预警故障信息。统计某段时间内发生故障的车型、车辆发生故障的次数和车辆发生故障的频率作为实际已发生的车辆故障信息,将处理后的车辆指标信息进行固定时间间隔内均匀采集n次计算各车辆指标的平均值p1、标准差p2、平均变化率p3和极差p4四个统计特征量便于S2步骤中相关性的运算。
在步骤S2中:响应于统计固定时间间隔内车辆故障信息发生的次数和频率,分析平台预警故障信息与车辆指标信息的相关性和分析不同类型的平台预警故障信息之间存在的关联性,获取用于车辆故障预测的多个特征数据,其中,车辆故障信息包括实际已发生的故障信息和平台预警故障信息。
在该步骤中通过采用皮尔逊相关系数计算分析平台预警故障信息与车辆指标信息的相关性。通过加权关联规则算法分析不同类型的平台预警故障信息之间存在的关联性,获得用于车辆故障预测的多个特征数据。
在步骤S3中:将其中类别特征数据转化为数据标识,通过第一SVM分类器,预测发生故障的概率,通过第二SVM分类器,进一步预测车辆对应故障类型的发生概率。
在进行SVM分类器模型训练之前先构建特征向量,利用S2步骤获得多个特征数据做进一步的处理,将其中的类别数据转换为数据标识(如车辆维修保养记录信息中的拆换继电器、拆换三通接头等16种类别维修保养记录,按类别依次转化按整数0-15表示),通过第一SVM分类器训练获得车辆发生故障概率的预测模型,通过第二SVM分类器训练进一步获得车辆部件发生故障概率的预测模型,基于构建的第一和第二SVM分类器模型,可以预测实际车辆发生故障的概率和车辆部件发生故障的概率。
在一些优选实施例中,平台预警故障信息包括气压传感器预警信息、气压预警信息、机油压力预警信息、水温预警信息、机油预警信息和刹车蹄片磨损预警信息等多种预警信息;车辆指标信息包括车速、转速和进气温度等;车辆档案信息包括车辆购置日期、品牌和车型等;车辆维修保养记录信息包括维修时间、保养时间、故障类型、保养类型、故障描述和保养项目等。平台预警故障信息和车辆指标信息可以辅助机务人员检查车辆的健康状态,引入车辆档案信息和车辆维修保养记录信息提高对车辆真实故障预测的准确性。
在一些具体实施例中,S1步骤具体包括将车辆数据中的缺失值和异常值进行记录删除、零值替换和均值替换处理,基于处理后的平台预警故障信息数据进一步进行设定阈值处理,基于处理后的车辆指标信息进一步计算平均值p1、标准差p2、平均变化率p3和极差p4四个统计特征量处理,具体计算公式如下:
Figure BDA0002217090560000091
Figure BDA0002217090560000092
Figure BDA0002217090560000093
p4=xmax-xmin
其中,n表示固定间隔时间内一组车辆指标数据的个数,xi表示固定时间间隔内该组第i个车辆指标数据,xmax表示固定时间间隔内该组车辆指标数据的最大数据值,xmin表示固定时间间隔内该组车辆指标数据的最小数据值。车辆各部分部件ECU会进行不停检测,检测到超过设定参数,会发送预警信息,但是预警信息可能存在误报或者短时间自动修复的情况,针对进而需要对提取的数据进行前期的预处理过程,以便后续获取准确的多个特征数据。
在一些优选实施例中,S2步骤中的相关性采用皮尔逊相关系数计算,具体计算公式如下:
Figure BDA0002217090560000101
其中,X表示车辆指标数据,Y表示平台预警故障信息,ρXY表示变量X和Y的相关系数,Cov(X,Y)代表变量X和Y的协方差,D(X)和D(Y)分别代表变量X和Y的方差,设定发生平台预警故障信息用数值1表示,不发生平台预警故障信息用数值0表示,ρXY值越接近1,则平台预警故障信息与车辆指标数据的相关性越大,反之则越小。利用车辆指标数据和平台预警故障信息的之间的相关性,挑选出与平台预警故障信息相关度大的车辆指标数据作为特征数据。
在一些优选实施例中,S2步骤中的关联性利用权重关联规则算法,输出平台预警故障信息A和B之间的关联数据集和关联值,具体运算步骤如下:
步骤S21:扫描平台预警故障信息的数据库D,设置最小支持度min sup,利用普通关联规则生成1-项候选集C1,比较平台预警故障信息A和B的支持度
Figure BDA0002217090560000102
和最小支持度min sup生成1-项频繁集L1,平台预警故障信息A和B的支持度
Figure BDA0002217090560000103
计算公式如下:
Figure BDA0002217090560000104
步骤S22:基于1-项频繁集L1生成2-项候选集C2,结合平台预警故障信息A和B的权重平均值W(A∪B),计算平台预警故障信息A和B的加权支持度
Figure BDA0002217090560000105
以min sup为最小支持度生成加权频繁集LW2,平台预警故障信息A和B的加权支持度
Figure BDA0002217090560000106
具体计算公式如下:
Figure BDA0002217090560000107
步骤S23:设置最小关联度,基于加权频繁集LW2的基础上利用最小关联度生成平台预警故障信息A和B之间的关联数据集和关联值,平台预警故障信息A和B的关联度
Figure BDA0002217090560000111
计算公式如下:
Figure BDA0002217090560000112
其中,表示平台预警故障信息的事务数据库,count(D)为所有事物的个数,
Figure BDA0002217090560000113
表示平台预警故障信息A和B的关联关系,A和B表示为固定时间间隔内的任意两个不同类型平台预警故障信息,sup-count(A∪B)表示一定时间范围内平台预警故障信息A和B同时发生的事务个数,W(A∪B)表示平台预警故障信息A和B的权重平均值,min sup表示最小支持度,sup表示支持度,w sup表示加权支持度。
在该方法中,不同类型的平台预警故障信息之间存在一定的关联性,对于这种关联信息可以通过关联规则算法进行挖掘,结合不同类型的平台预警故障信息时间间隔转化的权重值,通过以上运算获得不同类型的车辆故障信息之间的关联数据集和关联值。值得注意的是,A、B表示任意不同类型的平台预警信息,经过步骤S21-步骤S23,获得在一定时间范围内,任意两种不同类型的平台预警故障信息的关联数据集和关联值。
在一些优选实施例中,权重关联规则算法中的权重通过一定时间范围内不同类型的平台预警故障信息发生的时间间隔表示,时间间隔与权重成反比,具体计算公式如下:
Wti=(max(T)-ti)/(max(T)-min(T))
Wn=(Wt1+Wt2+…Wtn)/n
其中,Wti表示第i个时间间隔内两个不同类型的平台预警故障信息的权重值,ti表示第i个时间间隔内两个不同类型的平台预警故障信息之间的最小时间间隔,min(T)表示一定时间范围内两个不同类型的平台预警故障信息之间最短的间隔时间,max(T)表示一定时间范围内两个不同类型的平台预警故障信息之间最长的间隔时间,Wn表示一定时间范围内n对不同类型的两个平台预警故障信息的权重平均值(如车辆平台预警故障信息A和B的权重平均值表示W(A∪B))。车辆发生故障原本就是小概率事件,计算固定时间段内两个不同类型车辆故障的权重值后,对多个固定时间段内每个权重值取均值作为一定时间范围内两个不同类型车辆故障的权重平均值,反映数据的真实性。
在一些优选实施例中,在S3步骤中的第一SVM分类器和第二SVM分类器采用粒子群优化算法确定惩罚参数和核函数参数,其中第一SVM分类器和第二SVM分类器中的目标函数分别定义为:
Figure BDA0002217090560000121
s.t.|yi-ω*k-b|<ζi
其中,ω表示可调权值向量,即超平面中每个向量的可调权值,ζ≥0表示松弛变量,C表示惩罚参数,b表示偏置量,即超平面相对原点的偏移,k=K(xi,xj)表示核函数参数,i=1,2,...,n,j=1,2,...,n,第一SVM分类器中的yi设置为0或1两个取值,第二SVM分类器中yi取值由车辆故障类别组成,设置为yi=1,2,...,n。惩罚参数和核函数参数一般都是凭经验确定,采用粒子群优化算法可以有效提高两个参数精准度。
在一些具体实施例中,车辆故障信息数据包括实际已发生故障的正类样本数据和实际未发生故障的负类样本数据,在训练阶段前利用欧氏距离得到每个正类样本的k近邻基于采样倍率构建新的样本,获得数据均衡的车辆故障信息数据。车辆发生故障属于小概率时间,在实际情况下行正类样本数据在数量上远少于负类样本数据,为了提高SVM分类器模型的准确性,需要对训练样本中的正类样本数据和负类样本数据进行数据均衡化处理。
继续参考图2,其示出了根据本申请的一个具体实施例的用于车辆故障的预测方法的流程示意图。该方法包括提取车辆数据、数据处理、故障特征提取、机器学习训练和真实故障概率预测等步骤。
步骤201-204:提取车辆数据。提取平台预警故障信息、车辆指标信息、车辆档案信息和车辆维修保养记录信息的车辆数据,其中平台预警故障信息包括气压传感器预警信息、气压预警信息、机油压力预警信息、水温预警信息、机油预警信息和刹车蹄片磨损预警信息等多种预警信息;车辆指标信息包括车速、转速和进气温度等;车辆档案信息包括车辆购置日期、品牌和车型等;车辆维修保养记录信息包括维修时间、保养时间、故障类型、保养类型、故障描述和保养项目等车辆数据。。
步骤205:数据处理。对提取到的车辆数据先进行缺失值和异常值处理,可以采用记录删除、零值替换和均值替换等方式处理,将处理后的平台预警故障信息进行设置阈值处理,如设置10秒为过滤阈值,只保留修复时间超过10秒的平台预警故障信息。对处理后车辆指标信息进行统计特征处理计算平均值p1、标准差p2、平均变化率p3和极差p4四个统计特征值。
步骤206:故障特征提取。统计某段时间内发生故障的车型、车辆发生故障的次数和车辆发生故障的频率的车辆故障信息,通过皮尔逊相关系数计算平台预警故障信息和车辆指标信息之间的相关性,通过权重关联规则算法获得不同类型的平台预警故障信息之间的关联性。
步骤207:机器学习训练。采用第一SVM分类器构建车辆发生故障概率的预测模型,通过第二SVM分类器进一步构建车辆部件发生故障概率的预测模型。
步骤208:真实故障概率预测。基于步骤207构建第一SVM分类器和第二SVM分类器的预测模型,可以预测实际车辆是否发生故障的概率和车辆部件发生故障的概率。
在一些优选实施例中,步骤205中对车辆指标信息进行统计特征处理计算平均值p1、标准差p2、平均变化率p3和极差p4四个统计特征值具体计算公式如下:
Figure BDA0002217090560000131
Figure BDA0002217090560000132
Figure BDA0002217090560000133
p4=xmax-xmin
其中,n表示固定间隔时间内一组车辆指标数据的个数,xi表示固定时间间隔内该组第i个车辆指标数据i=1,2,3...,n,xmax表示固定时间间隔内该组车辆指标数据的最大数据值,xmin表示固定时间间隔内该组车辆指标数据的最小数据值。ECU会不停检测车辆各部件,当检测到超过设定参数,会自动发送预警信息,但是预警信息可能存在误报或者短时间自动修复的情况,针对进而需要对提取的数据进行前期的预处理过程,以便后续获取准确的多个特征数据。(如在30分钟的时间段内均匀采集n次车辆指标信息,即为公式中的n,相当于30/n分钟采集一次车辆指标信息,车辆指标信息包括车速、发动机转速、进气温度、机油压力等。以车速为例,xi表示30分钟内第i次采集的车速,xmax和xmin表示30分钟内车速的最大值和最小值)。
在一些优选实施例中,步骤206中的平台预警故障信息与车辆指标信息的相关性采用皮尔逊相关系数计算,具体计算公式如下:
Figure BDA0002217090560000141
其中,X表示车辆指标数据,Y表示车辆平台预警故障信息,ρXY表示变量X和Y的相关系数,Cov(X,Y)代表变量X和Y的协方差,D(X)和D(Y)分别代表变量X和Y的方差,设定发生平台预警故障信息用数值1表示,不发生平台预警故障信息用数值0表示,ρXY值越接近1,则车辆平台预警故障信息与车辆指标数据的相关性越大,反之则越小。利用车辆指标数据和平台预警故障信息的之间的相关性,挑选出影响平台预警故障信息相关度大的车辆指标数据作为特征数据。
在一些具体实施例中,步骤206中的不同类型的平台预警故障信息之间关联性采用权重关联规则算法,如平台预警故障信息A和B之间的关联数据集和关联值,具体运算步骤如下:
步骤S21:扫描平台预警故障信息的数据库D,设置最小支持度min sup,利用普通关联规则生成1-项候选集C1,比较平台预警故障信息A和B的支持度
Figure BDA0002217090560000142
和最小支持度min sup生成1-项频繁集L1,平台预警故障信息A和B的支持度
Figure BDA0002217090560000151
计算公式如下:
Figure BDA0002217090560000152
步骤S22:基于1-项频繁集L1生成2-项候选集C2,结合平台预警故障信息A和B的权重平均值W(A∪B),计算平台预警故障信息A和B的加权支持度
Figure BDA0002217090560000153
以min sup为最小支持度生成加权频繁集LW2,平台预警故障信息A和B的加权支持度
Figure BDA0002217090560000154
具体计算公式如下:
Figure BDA0002217090560000155
步骤S23:设置最小关联度,基于加权频繁集LW2中的基础上利用最小关联度生成平台预警故障信息A和B之间的关联数据集和关联值,平台预警故障信息A和B的关联度
Figure BDA0002217090560000156
计算公式如下:
Figure BDA0002217090560000157
其中,表示平台预警故障信息的事务数据库,count(D)为所有事物的个数,
Figure BDA0002217090560000158
表示平台预警故障信息A和B的关联关系,A和B表示为固定时间间隔内的任意两个不同类型平台预警故障信息,sup-count(A∪B)表示一定时间范围内平台预警故障信息A和B同时发生的事务个数,W(A∪B)表示平台预警故障信息A和B的权重平均值,min sup表示最小支持度,sup表示支持度,w sup表示加权支持度。
在该方法中,不同类型的平台预警故障信息之间存在一定的关联性,对于这种关联信息可以通过关联规则算法进行挖掘,结合不同类型的平台预警故障信息时间间隔转化的权重值,通过以上运算获得关联数据集和关联值。值得注意的是,A、B表示任意不同类型的平台预警信息,经过步骤S21-步骤S23,获得在一定时间范围内,任意两种不同类型的平台预警故障信息的关联数据集和关联值。
在一些优选实施例中,D为平台预警故障信息的事务数据库,I={i1,i2,...,im}为所一定时间范围内不同类型的平台预警故障信息间的2-项候选集C2,W={W1,W2,...,Wm,}为I对应的权重集,为使计算方便,数值更直观,可以将权重集的数值缩放为平均值为1,即权重集的总和为m。
在一些优选实施例中,假设在20天内,车辆平台预警故障信息事务有200条,最小支持度0.025,计算平台预警故障信息A和B的关联为例,平台预警故障信息A在15条事务中出现,平台预警故障信息B在20条事务中出现,满足最小支持度,平台预警故障信息A和B同时出现的事务有10条,则支持度为0.006,乘上平台预警故障信息A和B的权重平均值,假设为1.2,加权支持度为0.006,同时满足最小支持度,平台预警故障信息A和B的关联度为0.06/0.075=0.8,表示为F(A∪B)={(A,B):0.8}。
在一些优选实施例中,不同车辆故障信息之间可能存在一定的关联性,例如平台预警故障信息A发生时,平台预警故障信息B也经常出现,对于这种关联信息可以通过关联规则算法进行挖掘。在分析不同类型的平台预警故障信息之间的关联性中存在一个问题,不同类型车辆故障信息大部分不是同时发生,且时间间隔有长有短,当两个不同类型的平台预警故障信息之间发生时间越短说明其对应的关联度越大。正常情况下以秒为单位,计算在一定时间范围内(如20天)每台车辆所有平台预警故障信息发生的时间间隔,将时间间隔值转换为权重,间隔越长权重越小,反之对应的权重越大。以平台预警故障信息第一次发生的时间为起点,每隔2小时(时间长度可根据实际情况自行选取)为一段时间间隔进行时间划分,过滤其中2小时内发生的平台预警故障信息少于2种不同类型的固定时间间隔,将过滤后时间间隔内的平台预警故障信息记录称为事务。执行以下权重值计算公式:
Wti=(max(T)-t)/(max(T)-min(T))
Wn=(Wt1+Wt2+…Wtn)/n
其中,Wti表示第i个时间间隔内(20天内的第i个2小时)两个不同类型的平台预警故障信息的权重值,ti表示第i个时间间隔内(20天内的第i个2小时)两个不同类型的平台预警故障信息之间的最小时间间隔,min(T)表示一定时间范围内(20天内)两个不同类型的平台预警故障信息之间最短的间隔时间,max(T)表示一定时间范围内(20天内)两个不同类型的平台预警故障信息之间最长的间隔时间,Wn表示一定时间范围内(20天内)n对不同类型的两个平台预警故障信息的权重平均值(如车辆平台预警故障信息A和B的权重平均值表示W(A∪B))。车辆发生故障原本就是小概率事件,先计算固定时间段内两个不同类型车辆故障的权重值后,对多个固定时间段内每个权重值取均值作为为两个不同类型车辆故障的权重值,反映数据的真实性。需要特别说明,当在一个固定时间间隔内(2小时内)存在相同类型的车辆故障,则设置该固定时间间隔的权重值为0。
如图3示出了根据本申请的一个具体实施例的SVM分类器训练步骤流程图。该训练具体包括特征参数提取、选定训练集和测试集、数据归一化处理、SVM分类器、判断分类要求、优化SVM参数、输入测试数据和判断分类准确率。:
步骤301:开始。
步骤302:特征参数提取。统计固定时间间隔内车辆故障信息发生的次数和频率,分析平台预警故障信息与车辆指标信息的相关性和分析不同类型的平台预警故障信息之间存在的关联性,获取用于车辆故障预测的多个特征数据并转化为数据标识。
步骤303:选定训练集和测试集。将实际已发生的有故障的数据样本定义为正类样本,实际未发生的预警故障的数据样本定义为负类样本,在故障检测过程包括训练和测试两个阶段。将数据集根据相应的比例分割成训练集和测试集两组数据(如按80%/20%分割,其中测试数据占20%)。
步骤304:数据归一化处理。训练阶段采用训练样本,其中正类样本的在数量上远少于负类样本数量,在进行训练的前,需进行训练样本中对正类样本和负类样本进行均衡化处理。
步骤305:SVM分类器。按照结构风险最小化原则,定义目标函数,选取惩罚参数和核函数参数。
步骤306:是否满足分类要求。通过步骤305测试构建的预测车辆故障的模型,判断是否满足分类要求,如“是”满足分类要求执行步骤308,如“否”不满足分类要求则执行步骤307。
步骤307:优化SVM参数。采用粒子群优化算法选择最优的惩罚参数和核函数参数,继续执行步骤306。
步骤308:输入测试数据。测试阶段则是运用训练后的模型对测试样本中车辆是否有故障的状态进行识别,预测车辆发生故障的概率或者测试对车辆具体存在的故障类型进行识别,预测具体车辆发生故障的类型概率。
步骤309-310:分类准确率。结合测试样品中正类样品和负类样品的实际的分布情况结合SVM分类器训练模型,判定SVM分类器训练模型的分类准确率,便于实际运算中的预测车辆有无故障分类和预测车辆部件发生故障的概率。
步骤310:结束。
在一些优选实施例中,步骤304的数据归一化处理,为了增强SVM分类器的分类性能,对训练样本先实现正类样本和负类样本数据的均衡化,对少数正类样本进行SMOTE重采样,确定每个少数正类样本的K个最近邻,依次选取其中一个样本,将该样本与其K最近邻组合,如此重复,直至少数正类样本的数量足够多为止,人工合成新样本添加到对应的训练数据样本集,具体如下:
在步骤304-1中假设少数正类样本中每一个样本用X表示,利用欧氏距离作为标准,计算X到其他少数正类样本的距离,得到X的K个最近邻。
在步骤304-2中对训练样本中不平衡比例设置一个采样比例N,N表示为采样倍率N,即每一个样本用X变成原来的N倍,对于每一个少数类样本X,从X的K个最近邻中随机选择若干个样本。
在步骤304-2中假设选择的近邻为Xn,对于每一个随机选出的近邻Xn,分别与原样本X构建新的样本,具体运算公式如下:
Figure BDA0002217090560000181
其中,Xn表示合成的新的正类样本,
Figure BDA0002217090560000182
表示为正类样本内部的中心值,rand(0,1)为随机生成的在0到1范围内的某个值。
在一些优选实施例中,步骤305中的SVM分类器和第二SVM分类器中采用粒子群优化算法确定惩罚参数和核函数参数,第一SVM分类器和第二SVM分类器中的目标函数分别定义为:
Figure BDA0002217090560000191
s.t.|yi-ω*k-b|<ζi
其中,ω表示可调权值向量,即超平面中每个向量的可调权值,ζ≥0表示松弛变量,C表示惩罚参数,b表示偏置量,即超平面相对原点的偏移,k=K(xi,xj)表示核函数参数,i=1,2,...,n,j=1,2,...,n,第一SVM分类器中的yi设置为0或1两个取值,第二SVM分类器中yi取值由车辆故障类别组成,设置为yi=1,2,...,n。惩罚参数和核函数参数一般都是凭经验确定,采用粒子群优化算法可以有效提高两个参数精准度。
在一些优选实施例中,步骤307中优化SVM参数采用粒子群优化算法具体运算如下:
在步骤307-1中初步确定惩罚参数C和核函数参数k的取值范围。实际操作中设置不同的SVM算法参数,进行多次重复训练,选择预测准确率高的参数。惩罚参数C和核函数参数k通常凭经验给定,但往往难以取得最优值,故采用粒子群优化算法(Particle Swarmoptimization,PS0)来寻优。
在步骤307-2中初步确定PSO算法中的参数,确定筛选区间和步长。对预设的参数自动组合遍历计算。在具体迭代过程中,通过改变惯性权重解决PSO过早收敛的问题,由于算法开始时设定较大的惯性权重,使得PSO能够很好的在全局中寻优;随着迭代次数增加,逐渐减小惯性权重,能够很好的在局部寻优,大幅提升PSO的性能。挑选出准确率最高的参数组合构成SVM模型。当准确率相近时,选择惩罚参数C最小的组合来避免过拟合。
继续参考图4,其示出了根据本申请的一个具体实施例的SVM分类器模拟训练流程图,具体模拟训练包括无故障特征数据训练和有故障特征数训练。
模型401:无故障特征数据。针对平台预警故障信息,进行第一SVM分类器(有/无故障)训练。
模型402:有故障特征数据。针对实际已发生的故障信息和平台预警故障信息,先进行第一SVM分类器(有/无故障)训练后,再进行第二SVM分类器(车辆故障类别)。
继续参考图5,其示出了根据本申请的一个具体实施例的SVM分类器模拟预测流程图,该方法包括以下步骤:
步骤501:车辆特征数据。提取不同维度车辆数据,进行数据处理获得故障特征数据;
步骤502:第一SVM分类器(有/无故障)。将步骤501中获得的故障特征数据转化成数字标识对图3训练出来的第一SVM分类器先进行有/无故障预测;
步骤503:输出预测结果(无故障:40%)。当无故障发生的预测概率高于50%,继续执行步骤501-502的车辆特征数据提取和第一SVM分类器(有/无故障)步骤;
步骤504:输出预测结果(有故障:60%)。输出预测结果,当有故障发生的预测概率高于50%,执行步骤505第二SVM分类器(车辆故障类别);
步骤505:第二SVM分类器(车辆故障类别)。将步骤501中获得的故障特征数据转化成数字标识对图3训练出来的第二SVM分类器进一步预测车辆发生故障的车辆故障类型的概率;
步骤506:输出预测结果:如后门电磁阀漏风:50%,干燥瓶漏风:45%,HCU故障:13%,表示后门电磁阀漏风发生故障概率为50%,干燥瓶漏风发生故障概率为45%,HCU发生故障概率13%。
此外,本申请还提出了一种用于车辆故障的预测***。其中如图6所示,包括:车辆数据提取单元601、特征数据提取单元602和第一和第二SVM分类器单元603。其中,当车辆数据提取单元601提取到不同维度的车辆数据进行预处理,通过特征数据提取单元602对车辆数据提取单元601提取的数据进行统计固定时间间隔内车辆故障信息发生的次数和频率,分析平台预警故障信息与车辆指标信息的相关性和分析不同类型的平台预警故障信息之间存在的关联性,通过特征数据提取单元602提取特征数据结合第一和第二SVM分类器单元603,预测车辆发生故障的概率和预测车辆部件发生故障的概率。
在具体的实施例中,车辆数据提取单元601:配置用于基于提取到包括平台预警故障信息、车辆指标信息、车辆档案信息和车辆维修保养记录信息的车辆数据,进行缺失值处理、设定阈值处理和统计特征量处理。
特征数据提取单元602:配置用于响应于统计固定时间间隔内车辆故障信息发生的次数和频率,分析平台预警故障信息与车辆指标信息的相关性和分析不同类型的平台预警故障信息之间存在的关联性,获取用于车辆故障预测的多个特征数据,其中,车辆故障信息包括实际已发生的故障信息和平台预警故障信息。
第一和第二SVM分类器单元603:配置用于将其中类别特征数据转化为数据标识,通过第一SVM分类器,预测发生故障的概率,通过第二SVM分类器,进一步预测车辆对应故障类型的发生概率。
下面参考图7,其示出了适于用来实现本申请实施例的电子设备的计算机***700的结构示意图。图7示出的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图7所示,计算机***700包括中央处理单元(CPU)701,其可以根据存储在只读存储器(ROM)702中的程序或者从存储部分708加载到随机访问存储器(RAM)703中的程序而执行各种适当的动作和处理。在RAM 703中,还存储有***700操作所需的各种程序和数据。CPU 701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。
以下部件连接至I/O接口705:包括键盘、鼠标等的输入部分706;包括诸如、液晶显示器(LCD)等以及扬声器等的输出部分707;包括硬盘等的存储部分708;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也可以根据需要连接至I/O接口705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出的计算机程序根据需要被安装入存储部分708。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分709从网络上被下载和安装,和/或从可拆卸介质711被安装。在该计算机程序被中央处理单元(CPU)701执行时,执行本申请的方法中限定的上述功能。
需要说明的是,本申请的计算机可读介质可以是计算机可读信号介质或者计算机可读介质或者是上述两者的任意组合。计算机可读介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言-诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言-诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)-连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本申请各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括车辆数据提取单元、特征数据提取单元和第一和第二SVM分类器单元。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,车辆数据提取单元还可以被描述为“基于提取到包括平台预警故障信息、车辆指标信息、车辆档案信息和车辆维修保养记录信息的车辆数据,进行缺失值处理、设定阈值处理和统计特征量处理的单元”。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:车辆数据提取单元、特征数据提取单元和第一和第二SVM分类器单元。其中,车辆数据提取单元:配置用于基于提取到包括平台预警故障信息、车辆指标信息、车辆档案信息和车辆维修保养记录信息的车辆数据,进行缺失值处理、设定阈值处理和统计特征量处理;特征数据提取单元:配置用于响应于统计固定时间间隔内车辆故障信息发生的次数和频率,分析平台预警故障信息与车辆指标信息的相关性和分析不同类型的平台预警故障信息之间存在的关联性,获取用于车辆故障预测的多个特征数据,其中,车辆故障信息包括实际已发生的故障信息和平台预警故障信息;第一和第二SVM分类器单元:配置用于将其中类别特征数据转化为数据标识,通过第一SVM分类器,预测发生故障的概率,通过第二SVM分类器,进一步预测车辆对应故障类型的发生概率。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (9)

1.一种用于车辆故障的预测方法,其特征在于,所述方法包括:
S1:基于提取到包括平台预警故障信息、车辆指标信息、车辆档案信息和车辆维修保养记录信息的车辆数据,进行缺失值处理、设定阈值处理和统计特征量处理,所述统计特征量处理包括计算平均值p1、标准差p2、平均变化率p3和极差p4
S2:响应于统计固定时间间隔内车辆故障信息发生的次数和频率,分析所述平台预警故障信息与所述车辆指标信息的相关性和分析不同类型的所述平台预警故障信息之间存在的关联性,获取用于车辆故障预测的多个特征数据,其中,所述车辆故障信息包括实际已发生的故障信息和所述平台预警故障信息;以及
S3:将其中所述特征数据按类别转化为数据标识,通过第一SVM分类器,预测发生故障的概率,通过第二SVM分类器,进一步预测车辆对应故障类型的发生概率;
其中,所述S2步骤中的所述关联性利用权重关联规则算法,输出平台预警故障信息A和B之间的关联数据集和关联值,具体运算步骤如下:
S21:扫描所述平台预警故障信息的数据库D,设置最小支持度min sup,利用普通关联规则生成1-项候选集C1,比较所述平台预警故障信息A和B的支持度
Figure FDA0003573697070000011
和最小支持度min sup生成1-项频繁集L1
S22:基于所述1-项频繁集L1生成2-项候选集C2,结合所述平台预警故障信息A和B的权重平均值
Figure FDA0003573697070000012
计算所述平台预警故障信息A和B的加权支持度
Figure FDA0003573697070000013
以minsup为最小支持度生成加权频繁集LW2
S23:设置最小关联度,在所述加权频繁集LW2中的基础上利用所述最小关联度生成所述平台预警故障信息A和B之间的关联数据集和关联值。
在所述S21步骤中,计算所述平台预警故障信息A和B的支持度
Figure FDA0003573697070000014
为:
Figure FDA0003573697070000015
在所述S22步骤中:计算所述平台预警故障信息A和B的加权支持度
Figure FDA0003573697070000021
为:
Figure FDA0003573697070000022
在所述S23步骤中:计算所述平台预警故障信息A和B的关联度
Figure FDA0003573697070000023
为:
Figure FDA0003573697070000024
其中,D表示所述平台预警故障信息的事务数据库,count(D)为所有事物的个数,
Figure FDA0003573697070000025
表示所述平台预警故障信息A和B的关联关系,A和B表示为固定时间间隔内的任意两个不同类型平台预警故障信息,sup_count(A∪B)表示一定时间范围内所述平台预警故障信息A和B同时发生的事务个数,W(A∪B)表示所述平台预警故障信息A和B的权重平均值,min sup表示最小支持度,sup表示支持度,w sup表示加权支持度。
2.根据权利要求1所述的一种用于车辆故障的预测方法,其特征在于,所述平台预警故障信息包括气压传感器预警信息、气压预警信息、机油压力预警信息、水温预警信息、机油预警信息和刹车蹄片磨损预警信息;所述车辆指标信息包括车速、转速和进气温度;所述车辆档案信息包括车辆购置日期、品牌和车型;所述车辆维修保养记录信息包括维修时间、保养时间、故障类型、保养类型、故障描述和保养项目。
3.根据权利要求1所述的一种用于车辆故障的预测方法,其特征在于,所述S1步骤具体包括:将所述车辆数据中的缺失值和异常值进行记录删除、零值替换和均值替换处理,基于处理后的所述平台预警故障信息数据进一步进行所述设定阈值处理,基于处理后的所述车辆指标信息进一步计算所述平均值p1、所述标准差p2、所述平均变化率p3和所述极差p4四个所述统计特征量处理,具体计算公式如下:
Figure FDA0003573697070000026
Figure FDA0003573697070000027
Figure FDA0003573697070000031
p4=xmax-xmin
其中,n表示固定间隔时间内一组车辆指标数据的个数,xi表示固定时间间隔内该组第i个车辆指标数据,xmax表示固定时间间隔内该组车辆指标数据的最大数据值,xmin表示固定时间间隔内该组车辆指标数据的最小数据值,t表示时间。
4.根据权利要求1所述的一种用于车辆故障的预测方法,其特征在于,所述S2步骤中的所述相关性采用皮尔逊相关系数计算,具体计算公式如下:
Figure FDA0003573697070000032
其中,X表示所述车辆指标数据,Y表示所述平台预警故障信息,ρXY表示变量X和Y的相关系数,Cov(X,Y)代表变量X和Y的协方差,D(X)和D(Y)分别代表变量X和Y的方差,设定发生所述平台预警故障信息用数值1表示,不发生所述平台预警故障信息用数值0表示,ρXY值越接近1,则所述平台预警故障信息与所述车辆指标数据的相关性越大,反之则越小。
5.根据权利要求1所述的一种用于车辆故障的预测方法,其特征在于,所述权重关联规则算法中的权重表示为一定时间范围内不同类型的所述平台预警故障信息发生的时间间隔,所述时间间隔与所述权重成反比,具体计算公式如下:
Wti=(max(T)-ti)/(max(T)-min(T))
Wm=(Wt1+Wt2+…Wtn)/n
其中,Wti表示第i个时间间隔内两个不同类型的所述平台预警故障信息的权重值,ti表示第i个时间间隔内两个不同类型的所述平台预警故障信息之间的最小时间间隔,min(T)表示所述一定时间范围内两个不同类型的所述平台预警故障信息之间最短的间隔时间,max(T)表示所述一定时间范围内两个不同类型的所述平台预警故障信息之间最长的间隔时间,Wn表示所述一定时间范围内n对不同类型的两个所述平台预警故障信息的权重平均值。
6.根据权利要求1所述的一种用于车辆故障的预测方法,其特征在于,所述S3步骤中的所述第一SVM分类器和所述第二SVM分类器中采用粒子群优化算法确定惩罚参数和核函数参数,所述第一SVM分类器和所述第二SVM分类器中的目标函数分别定义为:
Figure FDA0003573697070000041
s.t.|yi-ω*k-b|<ζi
其中,ω表示可调权值向量,即超平面中每个向量的可调权值,ζ≥0表示松弛变量,C表示所述惩罚参数,b表示偏置量,即超平面相对原点的偏移,k=K(xi,xj)表示所述核函数参数,i=1,2,...,n,j=1,2,...,n,所述第一SVM分类器中的yi设置为0或1,所述第二SVM分类器中yi取值由车辆故障类别组成,设置为yi=1,2,...,n。
7.根据权利要求6所述的一种用于车辆故障的预测方法,其特征在于,所述车辆故障信息数据包括实际已发生故障的正类样本数据和实际未发生故障负类样本数据,在训练阶段前利用欧氏距离得到每个正类样本的k近邻基于采样倍率构建新的样本,获得数据均衡的车辆故障信息数据。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的方法。
9.一种用于车辆故障的预测***,其特征在于,所述***包括:
车辆数据提取单元:配置用于基于提取到包括平台预警故障信息、车辆指标信息、车辆档案信息和车辆维修保养记录信息的车辆数据,进行缺失值处理、设定阈值处理和统计特征量处理,所述统计特征量处理包括计算平均值p1、标准差p2、平均变化率p3和极差p4
特征数据提取单元:配置用于响应于统计固定时间间隔内车辆故障信息发生的次数和频率,分析所述平台预警故障信息与所述车辆指标信息的相关性和分析不同类型的所述平台预警故障信息之间存在的关联性,获取用于车辆故障预测的多个特征数据,其中,所述车辆故障信息包括实际已发生的故障信息和所述平台预警故障信息,所述关联性利用权重关联规则算法,输出平台预警故障信息A和B之间的关联数据集和关联值,具体运算步骤如下:
S21:扫描所述平台预警故障信息的数据库D,设置最小支持度min sup,利用普通关联规则生成1-项候选集C1,比较所述平台预警故障信息A和B的支持度
Figure FDA0003573697070000051
和最小支持度min sup生成1-项频繁集L1
S22:基于所述1-项频繁集L1生成2-项候选集C2,结合所述平台预警故障信息A和B的权重平均值
Figure FDA0003573697070000052
计算所述平台预警故障信息A和B的加权支持度
Figure FDA0003573697070000053
以minsup为最小支持度生成加权频繁集LW2
S23:设置最小关联度,在所述加权频繁集LW2中的基础上利用所述最小关联度生成所述平台预警故障信息A和B之间的关联数据集和关联值。
在所述S21步骤中,计算所述平台预警故障信息A和B的支持度
Figure FDA0003573697070000054
为:
Figure FDA0003573697070000055
在所述S22步骤中:计算所述平台预警故障信息A和B的加权支持度
Figure FDA0003573697070000056
为:
Figure FDA0003573697070000057
在所述S23步骤中:计算所述平台预警故障信息A和B的关联度
Figure FDA0003573697070000058
为:
Figure FDA0003573697070000059
其中,D表示所述平台预警故障信息的事务数据库,count(D)为所有事物的个数,
Figure FDA00035736970700000510
表示所述平台预警故障信息A和B的关联关系,A和B表示为固定时间间隔内的任意两个不同类型平台预警故障信息,sup_count(A∪B)表示一定时间范围内所述平台预警故障信息A和B同时发生的事务个数,W(A∪B)表示所述平台预警故障信息A和B的权重平均值,min sup表示最小支持度,sup表示支持度,w sup表示加权支持度;
第一和第二SVM分类器单元:配置用于将其中所述特征数据按类别转化为数据标识,通过第一SVM分类器,预测发生故障的概率,通过第二SVM分类器,进一步预测车辆对应故障类型的发生概率。
CN201910919451.8A 2019-09-26 2019-09-26 一种用于车辆故障的预测方法和*** Active CN110647539B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910919451.8A CN110647539B (zh) 2019-09-26 2019-09-26 一种用于车辆故障的预测方法和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910919451.8A CN110647539B (zh) 2019-09-26 2019-09-26 一种用于车辆故障的预测方法和***

Publications (2)

Publication Number Publication Date
CN110647539A CN110647539A (zh) 2020-01-03
CN110647539B true CN110647539B (zh) 2022-06-24

Family

ID=68992921

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910919451.8A Active CN110647539B (zh) 2019-09-26 2019-09-26 一种用于车辆故障的预测方法和***

Country Status (1)

Country Link
CN (1) CN110647539B (zh)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111176262A (zh) * 2020-01-20 2020-05-19 东风小康汽车有限公司重庆分公司 一种车辆故障的检测方法和***
CN111650501B (zh) * 2020-03-04 2022-08-16 苏州热工研究院有限公司 一种无损在线评估继电器老化状态的试验装置
CN111383662A (zh) * 2020-03-18 2020-07-07 斑马网络技术有限公司 Ecu报警音验证方法及***
CN111458630B (zh) * 2020-04-09 2022-09-06 广东电网有限责任公司 一种高压断路器故障诊断方法
CN111381170A (zh) * 2020-05-15 2020-07-07 上海工程技术大学 基于大数据的电动汽车电池包健康状态预测方法及***
CN111860935B (zh) * 2020-05-21 2024-06-21 北京骑胜科技有限公司 一种交通工具的故障预测方法、装置、设备及存储介质
CN113888775A (zh) * 2020-06-19 2022-01-04 比亚迪股份有限公司 车辆预警方法、服务器、存储介质、车辆预警***和车辆
CN113965427B (zh) * 2020-07-20 2023-05-02 中国电信股份有限公司 宽带拨号故障监控及修复的方法和***
CN111861043B (zh) * 2020-08-04 2022-06-24 上海钧正网络科技有限公司 一种车辆失联预测方法、装置、计算机设备和存储介质
CN112365066B (zh) * 2020-11-17 2023-05-02 日立楼宇技术(广州)有限公司 电梯故障预测方法、***、装置、计算机设备和存储介质
CN112153566B (zh) * 2020-11-26 2021-02-12 博泰车联网(南京)有限公司 用于客服的方法、计算设备和计算机存储介质
CN112465237B (zh) * 2020-12-02 2023-04-07 浙江正泰电器股份有限公司 基于大数据分析的故障预测方法、装置、设备和存储介质
CN112363488A (zh) * 2020-12-07 2021-02-12 东风柳州汽车有限公司 车辆故障处理***及方法
CN112862233A (zh) * 2020-12-25 2021-05-28 石家庄开发区天远科技有限公司 一种基于车联网数据的故障关联性分析***及方法
CN112558592B (zh) * 2020-12-25 2022-04-08 浙江吉利控股集团有限公司 车辆故障预测方法、预测***及车辆
CN112699171A (zh) * 2020-12-31 2021-04-23 东软睿驰汽车技术(沈阳)有限公司 一种车辆报警数据知识图谱构建方法及相关装置
CN112820111B (zh) * 2021-02-03 2022-11-01 腾讯科技(深圳)有限公司 一种异常车辆识别方法、装置和电子设备
CN113865879B (zh) * 2021-08-12 2024-05-14 浙江车速达软件科技有限公司 一种汽车检测的引导***
CN113807547A (zh) * 2021-08-12 2021-12-17 江铃汽车股份有限公司 车辆故障预警方法、***、可读存储介质及计算机设备
CN113761728B (zh) * 2021-08-24 2022-06-03 威海广泰空港设备股份有限公司 基于车联网平台的机场电动特种车辆故障预警方法
CN114279718B (zh) * 2021-11-30 2023-02-28 重庆长安汽车股份有限公司 一种基于实时车况的可配置故障诊断方法及故障诊断***
CN114779747A (zh) * 2022-05-11 2022-07-22 中国第一汽车股份有限公司 车辆故障原因确定***及方法
CN115359585A (zh) * 2022-08-24 2022-11-18 奇瑞汽车股份有限公司 车辆提前排查故障的方法、装置、车辆及存储介质
CN115700593B (zh) * 2022-09-07 2024-01-16 中国人民解放军陆军装甲兵学院 一种基于机器学习的车载网络故障诊断方法
CN115271685B (zh) * 2022-09-27 2023-04-18 卡斯柯信号(北京)有限公司 一种用于铁路行业高精度设备维修周期的监控方法及装置
CN115817178A (zh) * 2022-11-14 2023-03-21 宁德时代新能源科技股份有限公司 故障预警方法、装置、电池、车辆及存储介质
CN116449762B (zh) * 2023-06-15 2023-08-18 贵州大学 基于物联网实现智能设备的安全预警方法及装置
CN116627847B (zh) * 2023-07-21 2023-10-10 山东云科汉威软件有限公司 一种浏览器兼容性测试方法及***
CN117369392B (zh) * 2023-11-17 2024-04-16 岳阳长炼机电工程技术有限公司 一种基于多参数逻辑关系的设备故障智能预警方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103760901A (zh) * 2013-12-31 2014-04-30 北京泰乐德信息技术有限公司 一种基于关联规则分类器的轨道交通故障识别方法
CN104200288A (zh) * 2014-09-18 2014-12-10 山东大学 一种基于因素与事件间相关关系识别的设备故障预测方法
CN105677759A (zh) * 2015-12-30 2016-06-15 国家电网公司 一种信息通信网络中的告警关联性分析方法
CN108693868A (zh) * 2018-05-25 2018-10-23 深圳市轱辘车联数据技术有限公司 故障预测模型训练的方法、车辆故障预测的方法及装置
US10216558B1 (en) * 2016-09-30 2019-02-26 EMC IP Holding Company LLC Predicting drive failures
CN109460004A (zh) * 2018-10-26 2019-03-12 国网天津市电力公司 基于大数据的配电网故障预测方法及***
CN109886328A (zh) * 2019-02-14 2019-06-14 国网浙江省电力有限公司电力科学研究院 一种电动汽车充电设施故障预测方法与***
WO2019141411A1 (en) * 2018-01-19 2019-07-25 Robert Bosch Gmbh Vehicle failure warning system and corresponding vehicle failure warning method
CN110263944A (zh) * 2019-05-21 2019-09-20 中国石油大学(华东) 一种多变量故障预测方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11042128B2 (en) * 2015-03-18 2021-06-22 Accenture Global Services Limited Method and system for predicting equipment failure

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103760901A (zh) * 2013-12-31 2014-04-30 北京泰乐德信息技术有限公司 一种基于关联规则分类器的轨道交通故障识别方法
CN104200288A (zh) * 2014-09-18 2014-12-10 山东大学 一种基于因素与事件间相关关系识别的设备故障预测方法
CN105677759A (zh) * 2015-12-30 2016-06-15 国家电网公司 一种信息通信网络中的告警关联性分析方法
US10216558B1 (en) * 2016-09-30 2019-02-26 EMC IP Holding Company LLC Predicting drive failures
WO2019141411A1 (en) * 2018-01-19 2019-07-25 Robert Bosch Gmbh Vehicle failure warning system and corresponding vehicle failure warning method
CN108693868A (zh) * 2018-05-25 2018-10-23 深圳市轱辘车联数据技术有限公司 故障预测模型训练的方法、车辆故障预测的方法及装置
CN109460004A (zh) * 2018-10-26 2019-03-12 国网天津市电力公司 基于大数据的配电网故障预测方法及***
CN109886328A (zh) * 2019-02-14 2019-06-14 国网浙江省电力有限公司电力科学研究院 一种电动汽车充电设施故障预测方法与***
CN110263944A (zh) * 2019-05-21 2019-09-20 中国石油大学(华东) 一种多变量故障预测方法和装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Forecasting fault events for predictive maintenance using data-driven techniques and ARMA modeling;Marcia Baptista et al.;《Computers & Industrial Engineering》;20171102;第41-53页 *
基于比例风险模型的转辙机状态-机会维修时机研究;吴雄升 等;《机床与液压》;20190430;第47卷(第8期);第193-197,201页 *
高速铁路牵引供电***健康管理及故障预警体系研究;何正友等;《电网技术》;20121031;第36卷(第10期);第259-264页 *

Also Published As

Publication number Publication date
CN110647539A (zh) 2020-01-03

Similar Documents

Publication Publication Date Title
CN110647539B (zh) 一种用于车辆故障的预测方法和***
CN109186813A (zh) 一种温度传感器自检装置及方法
CN106600115A (zh) 一种企业信息***运维智能分析方法
JP3651693B2 (ja) プラント監視診断装置および方法
CN103150900A (zh) 一种基于视频的交通拥堵事件自动检测方法
CN105930629B (zh) 一种基于海量运行数据的在线故障诊断方法
CN116625438A (zh) 燃气管网安全在线监测***及其方法
CN110636066B (zh) 基于无监督生成推理的网络安全威胁态势评估方法
CN111538311B (zh) 一种基于数据挖掘的机械设备柔性多状态自适应预警方法及装置
CN113837596B (zh) 一种故障确定方法、装置、电子设备及存储介质
CN109491339B (zh) 一种基于大数据的变电站设备运行状态预警***
CN109711664B (zh) 一种基于大数据的输变电设备健康评估***
CN108763966B (zh) 一种尾气检测作弊监管***及方法
CN115358155A (zh) 一种电力大数据异常预警方法、装置、设备及可读存储介质
CN114611372A (zh) 一种基于物联网边缘计算的工业设备健康预测方法
CN111666978A (zh) 一种it***运维大数据的智能故障预警***
CN114912678A (zh) 电网调控异常操作在线自动检测预警方法及***
CN117007977B (zh) 一种储能电池健康状态诊断方法
CN117150298B (zh) 基于深度学习的地铁fas火灾报警***的调试方法
CN116953395B (zh) 充电桩偷电检测方法、装置、设备及存储介质
CN116346405A (zh) 基于数据统计的网络安全运维能力评估***及方法
US20230024104A1 (en) Identification of false transformer humming using machine learning
CN114066288B (zh) 一种基于智慧数据中心的营运道路应急检测方法及***
Aftabi et al. A Variational Autoencoder Framework for Robust, Physics-Informed Cyberattack Recognition in Industrial Cyber-Physical Systems
CN117688464B (zh) 一种基于多源传感器数据的隐患分析方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant