CN106482967B - 一种代价敏感支持向量机机车车轮检测***及方法 - Google Patents

一种代价敏感支持向量机机车车轮检测***及方法 Download PDF

Info

Publication number
CN106482967B
CN106482967B CN201610880518.8A CN201610880518A CN106482967B CN 106482967 B CN106482967 B CN 106482967B CN 201610880518 A CN201610880518 A CN 201610880518A CN 106482967 B CN106482967 B CN 106482967B
Authority
CN
China
Prior art keywords
support vector
sensitive support
vector machines
module
cost sensitive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610880518.8A
Other languages
English (en)
Other versions
CN106482967A (zh
Inventor
何静
刘林凡
张昌凡
谭海湖
赵凯辉
孙健
豆兵兵
刘光伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan University of Technology
Original Assignee
Hunan University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan University of Technology filed Critical Hunan University of Technology
Priority to CN201610880518.8A priority Critical patent/CN106482967B/zh
Publication of CN106482967A publication Critical patent/CN106482967A/zh
Application granted granted Critical
Publication of CN106482967B publication Critical patent/CN106482967B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01MTESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
    • G01M17/00Testing of vehicles
    • G01M17/007Wheeled or endless-tracked vehicles
    • G01M17/013Wheels
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种代价敏感支持向量机机车车轮状态检测***及方法,所述***包括数据预处理模块、代价敏感支持向量机训练模块、参数寻优模块、最优代价敏感支持向量机分类模块、判别模块和车轮状态输出模块;所述检测方法包括共八个步骤,所述参数寻优步骤采用自适应变异粒子群算法,该算法是一种变异粒子群算法,具有很强的鲁棒性和全局搜索特性等优点,拓展了在迭代中不断缩小的空间,在更大空间中开展搜索,同时保持了种群多样性,提高算法寻找到最优值的可能性。

Description

一种代价敏感支持向量机机车车轮检测***及方法
技术领域
本发明属于测量工程技术领域,更具体地,涉及一种代价敏感支持向量机模型机车车轮检测***及方法。
背景技术
支持向量机是在统计学理论发展起来的一种实用方法,是专门研究小样本情况下机器学***衡的模糊支持向量机,泛化性较差。
为了保障重载机车安全运行,对车轮状态进行检测非常有必要,机车车轮状态检测***要求轨面发生变化时能够准确实时检测机车车轮状态,当轨面发生较大变化时,有可能产生机车打滑或空转的现象,若没有及时检测并处理会造成较大安全问题。
而实际应用中,车轮正常运行的样本往往远多于故障状态的样本,类别不平衡的数据集往往存在着误分类和代价不等的问题,代价敏感支持向量机作为一种新兴的学习机器,虽然能够对数据样本进行分类输出,但是仍存在有待完善的地方,其参数选取便是亟待解决的问题之一,惩罚因子、核函数以及核函数参数取值的好坏直接影响分类器的识别精度和效率。
发明内容
为了克服传统的代价敏感支持向量机存在的数据样本误分类及代价不等的问题,进而考虑到自适应变异粒子群算法是一种基于群体的智能寻优算法,具有很强鲁棒性,种群多样性和全局搜索特性等优点。根据重载机车车轮状态采集数据具有小样本的特点,且机车粘着系数和蠕滑速度的关系呈现高度非线性的特点,可利用代价敏感支持向量机来对车轮状态建立分类模型。由此,本发明提出了自适应变异粒子群算法优化参数的代价敏感支持向量机对重载机车车轮状态进行分类的方法。针对重载机车在实际运行中正常状态远多于故障状态而形成的数据不均衡问题,采用代价敏感支持向量机建立机车车轮状态分类模型,并采用自适应变异粒子群算法优化相关参数,实现重载机车车轮状态分类检测。
具体的,本发明提供了一种利用自适应变异粒子群算法搜索出的最优代价敏感支持向量机模型,避免了参数选择的盲目性和不准确性,同时提高了检测分类率,代价敏感支持向量机对类别不均衡样本二分类具有卓越的分类性能,。
本发明的技术方案如下:
一种代价敏感支持向量机机车车轮状态检测***,所述***包括数据预处理模块、代价敏感支持向量机训练模块、参数寻优模块、最优代价敏感支持向量机分类模块、判别模块和车轮状态输出模块;
所述数据预处理模块输出端与训练模块输入端连接,所述代价敏感支持向量机训练模块输出端与参数寻优模块输入端相连接,所述参数寻优模块输出端与最优代价敏感支持向量机分类模块输出端连接,所述最优代价敏感支持向量机分类模块输出端与判别模块输入端连接,所述判别模块输出端与参数寻优模块输入端和车轮状态输出模块输入端连接。
进一步地,所述预处理模块将机车车轮状态分为安全区和故障区两种类型;选取数据源,对数据源进行特征提取,提取到的特征变量作为实时样本数据集,实时样本数据集分为训练集和测试集,对训练集样本和测试集样本进行归一化处理。
进一步地,所述参数寻优模块采用自适应变异粒子群算法,寻找代价敏感支持向量的两个惩罚因子和核函数。
更进一步地,自适应变异粒子群算法是求解此类问题的一种有效方法,其程序实现异常简单,需要调整的参数极少,无需任何梯度信息,在函数优化、组合优化以及许多工程领域均得到了广泛的应用。
粒子群算法是一种模拟鸟群运动规律的启发式算法,其更新公式为:
式中,第i个粒子的位置可用矢量表示为xi=(xi1,xi2,…,xid,…,xiD),xid∈[xmin,d,xmax,d],其中d=1,2,…D,D为解空间的维数,xmin,d和xmax,x分别是第d维空间的限制边界;粒子的速度可表示为vi=(vi1,vi2,…,vid,…,viD),其速度最大限制为vi=(vmax,1,vmax,2,…,vmax,d,…,vmax,D)。第i个粒子的最优空间位置记为局部最优pi=(pi1,pi2,…,pid,…,piD),同样种群中位置最优的粒子记为全局最优pg;ω为惯性权重,k为当前迭代次数;c1和c2称加速度系数,r1和r2为分布于[0,1]之间的随机数。
粒子群算法收敛快,具有很强的通用性,但同时存在着容易早熟收敛、搜索精度较低、后期迭代效率不高等缺点,为了提高粒子群算法的性能,引入一种自适应变异操作,以求解决粒子群算法早熟收敛以及搜索能力随代数增加而逐渐下降的特点,其算法描述为:
其中,v为重新初始化的速度,r3表示在[0,1]区间内均匀分布的随机数。若r3>0.5,则k=-1,若r3≤0.5,则k=1。
在不改变等式(1)和(2)的性质下,为了描述方便将其简化为:
vk+1=k0vk+c1r1(p1-xk)+c2r2(p2-xk) (5)
xk+1=xk+vk+1 (6)
选取
采取如下的简化措施:
那么方程(5)和(6)可以简化为:
vk+1=k0vk+k1(p-xk) (10)
xk+1=xk+vk+1 (11)
方程(10)和(11)可以写成yk+1=Myk+Np形式其中
自适应变异粒子群寻优过程中,将会收敛到如下式:
yi=[xi vi]T (13)
其中xi=p,vi=0。
粒子的寻参时间取决于矩阵M的特征根λ12,矩阵M的特征方程如下:
λ2-(k0-k1+1)λ+k0=0 (14)
式(13)存在的充分必要条件是矩阵M的特征根λ12都小于1,则可以通过求解式(14)得到如下条件:
k0<1,k1>0,2k0-k1+2>0 (15)
表示在[0,1]区间内均匀分布的随机数,可知本发明提出的自适应变异粒子群算法满足(15)的约束条件。
进一步地,所述代价敏感支持向量机的训练模块对训练集样本进行处理;所述代价敏感支持向量机分类模块存贮代价敏感支持向量机对样本进行训练后得到的支持向量库;所述判别模块对代价敏感支持向量机的训练器性能进行评估,若达到合格的分类准确率,则输出到车轮状态输出模块。
更进一步地,一种所述的参数优化的代价敏感支持向量机机车车轮状态检测***的检测方法,包括以下步骤:
第一步,将机车车轮状态分为安全区和故障区两种类型;
第二步,选取数据源,对数据源进行特征提取,提取到的特征变量作为实时样本数据集,将实时样本数据集分为训练集和测试集两个子集;
第三步,数据预处理模块对实时样本数据集预处理,并对训练集和测试集样本进行归一化处理,使其范围仅在0~1之间的数值,然后将归一化后的训练集作为代价敏感支持向量机训练模块的输入向量进行处理;
第四步,训练模块对归一化后的训练集进行处理,经过代价敏感支持向量机的训练,将会得到一组支持向量,然后存入数据库中;
第五步,参数寻优模块对代价敏感支持向量机的核参数和两个惩罚因子运用自适应变异粒子群算法进行全局寻优;得到最优代价敏感支持向量机;
第六步,分类模块对测试集中的实时样本数据进行分类;并存贮代价敏感支持向量机对实时样本数据集进行训练后得到的支持向量库;
第七步,数据准确率判别,将测试集内的特征变量输入至最优代价敏感支持向量机模型内进行测试,最优代价敏感支持向量机模型输出识别结果,识别结果为安全或故障状态;将输出的识别结果与机车实际车轮状态进行比较,计算识别的准确率;
第八步,车轮状态输出;若识别的准确率满足要求则输出车轮状态,否则重新进行。
进一步地,由于采集到的重载机车数据样本中各变量差异较大,在建立代价敏感支持向量机分类模型前对训练集和预测集样本归一化到[0,1]区间,所述归一化算法过程为:
其中x和x′分别为归一化前和后的值。
进一步地,第六步中采用高斯径向基核函数、线性核函数、多项式核函数或两层感知机核函数对样本数据进行分类。
更进一步地,第五步中参数寻优包括以下步骤:
1.初始化自适应变异粒子群参数;
2.适应度计算;
3.寻找个体极值和群体极值;
4.粒子速度更新和位置更新;
5.粒子每次更新后,用一定概率重新初始化粒子;
6.重新进行粒子适应度计算;
7.对每个粒子,将其适应值与其经历过的最好的位置作比较,如果较好则将其最为当前最好的位置,完成个体极值和群体极值的更新;
8.终止条件检查,如果不满足终止标准,则转到步骤4,否则转至下一步;所述终止标准包括预定义的迭代次数或自适应变异粒子群算法预设精度;
9.输出终止迭代次数时粒子中的两个惩罚因子和核函数。
更进一步地,利用自适应变异粒子群算法寻找最优代价敏感支持向量机参数,经过训练集和测试集预处理和适应度评估操作,粒子速度更新后用自适应变异粒子群算法重新初始化粒子,判断是否满足终止精度或当前迭代次数是否等于最大迭代次数,若满足则输出最优误分类代价参数C1,C2和最优核参数宽度值σ;否则重新进行自适应变异粒子群算法;
更进一步地,自适应变异粒子群算法更新公式为:
其中,v为重新初始化的速度,r3表示在[0,1]区间内均匀分布的随机数。若r3>0.5,则k=-1,若r3≤0.5,则k=1。
附图说明
图1为代价敏感支持向量机机车车轮状态检测***示意图;
图2为代价敏感支持向量机机车车轮状态检测方法步骤示意图;
图3为自适应变异粒子群算法步骤示意图;
图4不均衡数据分类示意图;
图5为自适应变异粒子群算法SVM分类可视化图;
图6为测试集的分类结果图;
图7为自适应变异粒子群算法寻参的适应度曲线图;
图8为自适应变异粒子群算法CS-SVM分类可视化图;
图9为测试集分类结果图;
图10为遗传算法寻找最佳参数的适应度曲线图;
图11为遗传算法CS-SVM分类可视化图;
图12为测试集分类结果图;
图13为SVM和CS-SVM的ROC曲线对比图。
具体实施方式
下面结合具体实施方式对本实用新型作进一步的说明。其中,附图仅用于示例性说明,表示的仅是示意图,而非实物图,不能理解为对本专利的限制;为了更好地说明本实用新型的实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
实施例1
如图1所示,一种代价敏感支持向量机机车车轮状态检测***,包括数据预处理模块1、代价敏感支持向量机训练模块2、参数寻优模块3、最优代价敏感支持向量机分类模块4、判别模块5和车轮状态输出模块6;
数据预处理模块1输出端与训练模块2输入端连接,所述代价敏感支持向量机训练模块2输出端与参数寻优模块3输入端相连接,所述参数寻优3模块输出端与最优代价敏感支持向量机分类模块4输出端连接,所述最优代价敏感支持向量机分类模块4输出端与判别模块5输入端连接,所述判别模块5输出端与参数寻优3模块输入端和车轮状态输出模块6输入端连接。
如图2所示,一种代价敏感支持向量机机车车轮状态检测***的检测方法,包括以下步骤:
第一步,将机车车轮状态分为安全区和故障区两种类型;
第二步,选取数据源,对数据源进行特征提取,提取到的特征变量作为实时样本数据集,将实时样本数据集分为训练集和测试集两个子集;
第三步,数据预处理模块对实时样本数据集预处理,并对训练集和测试集样本进行归一化处理,使其范围仅在0~1之间的数值,然后将归一化后的训练集作为代价敏感支持向量机训练模块的输入向量进行处理;
第四步,训练模块对归一化后的训练集进行处理,经过代价敏感支持向量机的训练,将会得到一组支持向量,然后存入数据库中;
第五步,参数寻优模块对代价敏感支持向量机的核参数和两个惩罚因子运用自适应变异粒子群算法进行全局寻优;得到最优代价敏感支持向量机;
第六步,分类模块对测试集中的实时样本数据进行分类;并存贮代价敏感支持向量机对实时样本数据集进行训练后得到的支持向量库;
第七步,数据准确率判别,将测试集内的特征变量输入至最优代价敏感支持向量机模型内进行测试,最优代价敏感支持向量机模型输出识别结果,识别结果为安全或故障状态;将输出的识别结果与机车实际车轮状态进行比较,计算识别的准确率;
第八步,车轮状态输出;若识别的准确率满足要求则输出车轮状态,否则重新进行。
实施例2
数据不均衡是指参与分类的两个类别样本数量差异很大,会引起分类超平面偏斜问题。
图4中圆形的点代表正类,方形的点代表负类。H、H1和H2是根据给定样本集计算出来的分类面,由于负类的样本很少,所以有部分本来是负类的样本点没有提供,如图4中H4上两个的方形点,若提供了这两个点,则对应的分类面应该是H1、H3和H4,显然和之前的结果差别很大。现在由于偏斜的现象存在,使得数量多的正类可以把分类面向负类的方向“推”,因而影响了结果的准确性。用标准支持向量机解决不均衡数据样本分类问题时,易导致划分超分类平面发生偏移,因此引入具有惩罚参数不同的代价敏感支持向量机,对样本集较多的一类采用较小的惩罚参数,而对样本集较少的另一类采用较大的惩罚参数。
将粘着系数μ和蠕滑速度vs作为代价敏感支持向量机模型的输入量xi=[μ,vs]i,机车车轮状态标签作为模型的输出量yi∈{+1,-1},因此训练样本集为代价敏感支持向量机通过非线性映射函数将输入空间的样本x映射到高维特征空间H中,并在高维特征空间H中利用结构风险最小化原则建立分类函数
式中,ω为权值向量,ω∈H;b为偏置,b∈R;y′为预测值。
对于代价敏感支持向量机,不同类样本误分时被赋予不同的误分类代价C1,C2,利用结构风险最小化原则,代价敏感支持向量机优化问题为:
s.t.yi(wTφ(xi)+b)≥1-ξi i=1,2,…,n
ξi≥0 i=1,2,…,n
Ci≥0 i=1,2
式中,C1,C2是误分类代价参数,w用于表征模型复杂度,为误差yi∈{+1,-1},I+={i:yi=+1},I-={i:yi=-1}。
求解式(2)时,通过引入非负的lagrange乘子构造lagrange函数,则问题转化为求lagrange式的鞍点,分别对式中各变量求偏导数并令其为零,利用对偶原理,转化为求解对偶问题。
s.t.0≤αi≤C1 i∈I+
0≤αi≤C2 i∈I-
式中,为lagrange乘子,C1,C2是误分类代价参数,K(xi,xj)为核函数,yi∈{+1,-1}I+={i:yi=+1},I-={i:yi=-1}。
由此可以通过选取适当参数C1,C2和核函数K(xi,xj),求解此对偶问题。
在本发明中,代价敏感支持向量机分类模型需要确定的参数为误分类代价参数C1,C2和核参数δ,其选取原则和取值直接对模型分类精确程度有很大的影响。为了使代价敏感支持向量机有最优的性能,本发明采用自适应变异粒子群算法对代价敏感支持向量机模型的误分代价参数C1,C2和核参数δ进行寻优,避免人为选择参数的盲目性。自适应变异粒子群优化算法是求解此类问题的一种有效方法,其程序实现异常简单,需要调整的参数极少,无需任何梯度信息,在函数优化、组合优化以及许多工程领域均得到了广泛的应用。粒子群算法是一种模拟鸟群运动规律的启发式算法,其更新公式为:
式中,第i个粒子的位置可用矢量表示为xi=(xi1,xi2,…,xid,…,xiD),xid∈[xmin,d,xmax,d],其中d=1,2,…D,D为解空间的维数,xmin,d和xmax,d分别是第d维空间的限制边界;粒子的速度可表示为vi=(vi1,vi2,…,vid,…,viD),其速度最大限制为vi=(vmax,1,vmax,2,…,vmax,d,…,vmax,D)。第i个粒子的最优空间位置记为局部最优pi=(pi1,pi2,…,pid,…,piD),同样种群中位置最优的粒子记为全局最优pg;ω为惯性权重,k为当前迭代次数;c1和c2称加速度系数,r1和r2为分布于[0,1]之间的随机数。
粒子群算法收敛快,具有很强的通用性,但同时存在着容易早熟收敛、搜索精度较低、后期迭代效率不高等缺点。为了提高PSO算法的性能,引入一种变异操作,以求解决粒子群算法早熟收敛以及搜索能力随代数增加而逐渐下降的特点,其算法描述为:
其中,v为重新初始化的速度,r3表示在[0,1]区间内均匀分布的随机数。若r3>0.5,则k=-1,若r3≤0.5,则k=1。
在不改变等式(4)和(5)的性质下,为了描述方便将其简化为:
vk+1=k0vk+c1r1(p1-xk)+c2r2(p2-xk) (8)
xk+1=xk+vk+1 (9)
选取
采取以下措施将方程简化:
那么方程(8)和(9))可以简化为:
vk+1=k0vk+k1(p-xk) (13)
xk+1=xk+vk+1 (14)
方程(13)和(14)可以写成yk+1=Myk+Np形式其中
自适应变异粒子群寻优过程中,将会收敛到如下式:
yi=[xi vi]T (16)
其中xi=p,vi=0
粒子的寻参时间取决于矩阵M的特征根λ12,矩阵M的特征方程如下:
λ2-(k0-k1+1)λ+k0=0 (17)
式(16)存在的充分必要条件是矩阵M的特征根λ12都小于1,则可以通过求解式(17)得到如下条件:
k0<1,k1>0,2k0-k1+2>0 (18)
表示在[0,1]区间内均匀分布的随机数,可知本文提出的自适应变异粒子群算法满足(18)的约束条件。
终上所述,采用代价敏感支持向量机分类方法与自适应变异粒子群算法相结合的重载机车车轮状态检测步骤如下:
(1)数据样本归一化。由于采集到的重载机车数据样本中各变量差异较大,在建立CS-SVM分类模型前对训练集和预测集样本归一化到[0,1]区间,计算公式为
式中x、x′分别为归一化前、后的值。
(2)自适应变异粒子群寻优代价敏感支持向量机模型参数。训练集和测试集预处理,适应度评估,进行选择,粒子速度更新后用自适应变异粒子群算法重新初始化粒子,判断是否满足终止精度或当前迭代次数是否等于最大迭代次数,若满足则输出最优误分类代价参数C1,C2和最优核参数宽度值σ;否则重新进行自适应变异粒子群算法。
(3)建立代价敏感支持向量机模型及分类。根据第(2)步得到最佳参数,采用高斯径向基核函数训练代价敏感支持向量机分类模型,把训练集得到模型对测试集样本进行分类并对数据反归一化处理。
(4)评价分类模型性能指标分类准确率和耗时,如不符合要求则转至第(2)步,重新设定自适应变异粒子群算法参数。
(5)比较真实值和预测值,得到模型对应的分类准确率。
具体参数寻优步骤如图3所示:
1.初始化自适应变异粒子群参数;
2.适应度计算;
3.寻找个体极值和群体极值;
4.粒子速度更新和位置更新;
5.粒子每次更新后,用一定概率重新初始化粒子;
6.重新进行粒子适应度计算;
7.对每个粒子,将其适应值与其经历过的最好的位置作比较,如果较好则将其最为当前最好的位置,完成个体极值和群体极值的更新;
8.终止条件检查,如果不满足终止标准,则转到步骤4,否则转至下一步;所述终止标准包括预定义的迭代次数或自适应变异粒子群算法预设精度;
9.输出终止迭代次数时粒子中的两个惩罚因子和核函数。
实施例3
为了验证该方法的有效性,本发明选取了重载机车车轮状态数据集进行了实验,论证本方法的有效性和可靠性。实验中首先需要进行核函数的选择,确认该核函数在处理数据不均衡的二分类问题有效性,从而确定自适应变异粒子群算法能够较好地对代价敏感支持向量机分类模型的参数进行优化。
1.核函数的选择
目前在工程实践中,SVM常用的核函数种类主要有如下4种:
1)线性核函数
K(x,xi)=xTxi
2)多项式核函数:
K(x,xi)=(δxTxi+r)d,δ>0;
3)高斯径向基核函数:
K(x,xi)=exp(-||x-xi||2/(2δ2)),δ>0;
4)两层感知机核函数:
K(x,xi)=tanh(δxTxi+r)。
式中,δ,r和d都是核参数,K为核函数。
在试验中采取不同的核函数,测试集预测分类准确率的对比(统一采用[0,1]归一化)如表1所示:
表1不同核函数训练得到的准确率
表中svmtrain是LIBSVM工具箱中主要函数。
从表1分析可以发现,在解决重载机车车轮状态检测分类的问题中,采用高斯径向基函数的支持向量机能够获得较高的分类准确率,因此在解决数据不均衡问题时也同样采用高斯径向基函数作为代价敏感支持向量机的核函数。
2.标准支持向量机分类结果对比
为比较本发明提出自适应变异粒子群算法优化CS-SVM模型的性能,采用自适应变异粒子群算法、遗传算法和网格搜索分别优化标准支持向量机的参数。其中,自适应变异粒子群算法优化参数的SVM分类可视化图和分类结果图,如图5和图6所示。
图5表明,采用参数优化的标准支持向量机在解决重载机车车轮状态检测分类问题的过程中,蠕滑区和故障区分类不均衡,会使分类超平面向故障区偏移,从而造成了如图6所示的结果,故障区分类准确率远低于蠕滑区的分类准确率。
采用上述三种算法优化标准支持向量机参数,并进行分类,得到结果如表2所示:
表2参数优化的支持向量机分类结果
表2表明利用自适应变异粒子群算法获得的分类准确率高于遗传算法和网格算法,并且耗时最短。蠕滑区准确率和故障区准确率的对比表明,蠕滑区具有较高的分类准确率,而故障区分类准确率不高。由于机车运行过程中,蠕滑区样本远多于故障区的样本,在使用标准支持向量机训练过程中,故障区数据过少,支持向量机训练不足,从而误判的情况增多。
3.代价敏感支持向量机模型分类结果对比
针对此问题,选用RBF核函数作为支持向量机的核函数,同时采用代价敏感的支持向量机解决类别不均衡,误分代价不等的问题。代价敏感的支持向量机需要优化惩罚参数C1,C2和高斯径向基函数的宽度σ。
图7表明,粒子群进化代数为100代时终止进化,此时平均适应度值为97.80%接近理想最优值。
由图10知,在20代左右,遗传算法的平均适应度达到稳定,进化代数为100代时终止进化,此时平均适应度值为99.58%。
图8和11表明,采用代价敏感的支持向量机可以有效解决由于数据不均衡造成的误分代价不等的问题。
分别采用不同算法得到代价敏感支持向量机的相关参数和分类准确率如表3和表4所示:
表3参数优化的代价敏感支持向量机的相关参数
表4参数优化的代价敏感支持向量机的分类准确率
表3和表4结果表明,自适应变异粒子群算法优化参数的代价敏感支持向量机对机车车轮状态检测有较高的分类准确率,在数据不均衡的两个区,有比较接近的准确率,相比于标准的遗传算法耗时要短。网格搜索法耗时最长,准确率最低,在数据不均衡的情况下,得到两个区准确率差别较大。自适应变异粒子群算法优化参数的CS-SVM采用结构风险最小化原则和VC维理论,提高了模型的推广能力和精度,减少了依赖经验的程度。
图13表明采用自适应变异粒子群算法优化参数的CS-SVM的ROC曲线越接近左上角,说明比自适应变异粒子群算法优化参数的标准支持向量机具有更好的分类性能。
表5SVM和CS-SVM的准确率和AUC的值比较
AUC(Area Under Curve)定义的是ROC曲线下的面积,对应的数值越大,代表分类器的性能越好。表5表明自适应变异粒子群算法优化参数的CS-SVM的AUC值为0.9947大于自适应变异粒子群算法优化参数的SVM的值。并且自适应变异粒子群算法优化参数的CS-SVM的分类准确率明显优于自适应变异粒子群算法优化参数的SVM,表明了自适应变异粒子群算法优化参数的CS-SVM模型的优越性。
显然,上述实施例仅仅是为清楚地说明本发明的技术方案所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护之内。

Claims (7)

1.一种代价敏感支持向量机机车车轮状态检测方法,机车车轮状态分为安全状态及故障状态,其特征在于,方法包括以下步骤:
步骤1:对机车车轮运行数据进行实时采样获得数据源,并将数据源进行特征提取采样时刻i的粘着系数μ和蠕滑速度vs为代价敏感支持向量机模型的输入量xi=[μ,vs]i,机车车轮状态为代价敏感支持向量机模型的输出量yi∈{+1,-1},将样本数据集分为训练样本集与预测样本集两个子集;
步骤2:对样本数据集预处理,并进行归一化处理将样本数据归一化到[0,1]区间内,归一化公式为:其中x与x′分别为归一化前和后的值;
步骤3:采用自适应变异粒子群寻优代价敏感支持向量机模型参数:粒子速度更新后应用变异操作重新初始化粒子,判断是否满足终止精度或当前迭代次数是否等于最大迭代次数,若满足则输出最优误分类代价参数C1,C2和最优核参数宽度值σ;否则重新进行自适应变异粒子群算法;所述自适应变异粒子群更新公式为:同时变异操作具体为其中v为重新初始化的速度,r3表示在[0,1]区间内均匀分布的随机数;
步骤4:根据步骤2中得到代价敏感支持向量机模型的最佳参数,采用高斯径向基核函数训练代价敏感支持向量机分类模型,把训练集得到模型对测试集样本进行分类并对数据反归一化处理;
步骤5:根据步骤3得到的机车车轮状态与实际机车车轮状态比较,得到代价敏感支持向量机模型对应的分类准确率。
2.根据权利要求1所述的一种代价敏感支持向量机机车车轮状态检测方法,其特征在于,还包括评价代价敏感支持向量机模型的分类准确率和耗时,如果超出设定范围则重新返回步骤3中设定自适应变异粒子群算法参数。
3.根据权利要求1所述的一种代价敏感支持向量机机车车轮状态检测方法,其特征在于,所述自适应变异粒子群算法具体包括以下步骤:
S81.初始化自适应变异粒子群参数;
S82.适应度计算;
S83.寻找个体极值和群体极值;S84.粒子速度更新和位置更新;
S85.粒子每次更新后,用一定概率重新初始化粒子;S86.重新进行粒子适应度计算;
S87.对每个粒子,将其适应值与其经历过的最好的位置作比较,如果较好则将其最为当前最好的位置,完成个体极值和群体极值的更新;
S88.终止条件检查,如果不满足终止标准,则转到步骤S84,否则转至下一步;所述终止标准包括预定义的迭代次数或自适应变异粒子群算法预设精度;
S89.输出终止迭代次数时粒子中的两个惩罚因子和核函数。
4.一种代价敏感支持向量机机车车轮状态检测***,其特征在于,应用权利要求1-3任一项所述的检测方法,包括数据预处理模块、代价敏感支持向量机训练模块、参数寻优模块、最优代价敏感支持向量机分类模块、判别模块和车轮状态输出模块;所述数据预处理模块输出端与训练模块输入端连接;所述代价敏感支持向量机训练模块输出端与参数寻优模块输入端相连接,所述参数寻优模块输出端与最优代价敏感支持向量机分类模块输出端连接,所述最优代价敏感支持向量机分类模块输出端与判别模块输入端连接,所述判别模块输出端与参数寻优模块输入端和车轮状态输出模块输入端连接。
5.根据权利要求4所述的代价敏感支持向量机机车车轮状态检测***,其特征在于,所述预处理模块将机车车轮状态分为安全区和故障区两种类型;选取数据源,对数据源进行特征提取,提取到的特征变量作为样本数据集,样本数据集分为训练集和测试集,对训练集样本和测试集样本进行归一化处理。
6.根据权利要求4所述的代价敏感支持向量机机车车轮状态检测***,其特征在于:所述参数寻优模块采用自适应变异粒子群算法,寻找代价敏感支持向量的两个惩罚因子和核函数。
7.根据权利要求4所述的代价敏感支持向量机机车车轮状态检测***,其特征在于:所述代价敏感支持向量机的训练模块对训练集样本进行处理;所述代价敏感支持向量机分类模块存贮代价敏感支持向量机对样本进行训练后得到的支持向量库;所述判别模块对代价敏感支持向量机的训练器性能进行评估,若达到合格的分类准确率,则输出到车轮状态输出模块。
CN201610880518.8A 2016-10-09 2016-10-09 一种代价敏感支持向量机机车车轮检测***及方法 Active CN106482967B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610880518.8A CN106482967B (zh) 2016-10-09 2016-10-09 一种代价敏感支持向量机机车车轮检测***及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610880518.8A CN106482967B (zh) 2016-10-09 2016-10-09 一种代价敏感支持向量机机车车轮检测***及方法

Publications (2)

Publication Number Publication Date
CN106482967A CN106482967A (zh) 2017-03-08
CN106482967B true CN106482967B (zh) 2019-10-29

Family

ID=58269413

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610880518.8A Active CN106482967B (zh) 2016-10-09 2016-10-09 一种代价敏感支持向量机机车车轮检测***及方法

Country Status (1)

Country Link
CN (1) CN106482967B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107240097B (zh) * 2017-06-27 2020-12-29 长春工业大学 基于mkl-svm-pso算法的肺结节图像处理方法
CN107862763B (zh) * 2017-11-06 2020-12-29 中国人民解放军国防科技大学 列车安全预警评估模型训练方法、模块及监测评估***
CN107833311A (zh) * 2017-11-15 2018-03-23 中国联合网络通信集团有限公司 一种共享单车的故障检测方法及平台
CN107918379B (zh) * 2017-11-29 2020-03-31 东北大学 基于图半监督代价敏感的工业大数据早期故障检测方法
CN111353515B (zh) * 2018-12-21 2024-01-26 湖南工业大学 一种基于多尺度分级的列车轮对踏面损伤分类识别方法
CN110766175A (zh) * 2019-10-25 2020-02-07 长沙理工大学 一种基于最优间隔分布机的变桨***故障检测方法及装置
CN111582510B (zh) * 2020-05-13 2021-08-31 中国民用航空飞行学院 基于支持向量机的智能识别方法、识别***及民航发动机
CN111654874B (zh) * 2020-06-03 2023-02-24 枣庄学院 一种无线传感网异常检测方法
CN113866684B (zh) * 2021-11-14 2024-05-31 广东电网有限责任公司江门供电局 一种基于混合采样和代价敏感的配电变压器故障诊断方法
CN116295620A (zh) * 2023-02-17 2023-06-23 南通科瑞环境科技有限公司 一种环境监测采集检测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101464964A (zh) * 2007-12-18 2009-06-24 同济大学 一种设备故障诊断的支持向量机模式识别方法
CN102750551A (zh) * 2012-06-18 2012-10-24 杭州电子科技大学 一种粒子寻优下基于支持向量机的高光谱遥感分类方法
CN103020434A (zh) * 2012-11-30 2013-04-03 南京航空航天大学 一种基于粒子群优化的最小二乘支持向量机组合预测方法
CN103218625A (zh) * 2013-05-10 2013-07-24 陆嘉恒 一种基于代价敏感支持向量机的遥感图像自动解译方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AUPQ684400A0 (en) * 2000-04-11 2000-05-11 Telstra R & D Management Pty Ltd A gradient based training method for a support vector machine
US7490071B2 (en) * 2003-08-29 2009-02-10 Oracle Corporation Support vector machines processing system

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101464964A (zh) * 2007-12-18 2009-06-24 同济大学 一种设备故障诊断的支持向量机模式识别方法
CN102750551A (zh) * 2012-06-18 2012-10-24 杭州电子科技大学 一种粒子寻优下基于支持向量机的高光谱遥感分类方法
CN103020434A (zh) * 2012-11-30 2013-04-03 南京航空航天大学 一种基于粒子群优化的最小二乘支持向量机组合预测方法
CN103218625A (zh) * 2013-05-10 2013-07-24 陆嘉恒 一种基于代价敏感支持向量机的遥感图像自动解译方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
类别不平衡和误分类代价不等的数据集分类方法及应用;唐明珠;《中国博士学位论文全文数据库 信息科技辑》;20130215;第58-59,75-77页 *
重载机车粘着控制方法的研究与设计;任强;《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》;20140915;第6-8页 *

Also Published As

Publication number Publication date
CN106482967A (zh) 2017-03-08

Similar Documents

Publication Publication Date Title
CN106482967B (zh) 一种代价敏感支持向量机机车车轮检测***及方法
CN113256066B (zh) 基于PCA-XGBoost-IRF的作业车间实时调度方法
CN106371427B (zh) 基于层次分析法和模糊融合的工业过程故障分类方法
CN105160444B (zh) 电力设备故障率确定方法及***
CN102903007B (zh) 一种采用遗传算法优化二分类模型参数的方法
CN108520272A (zh) 一种改进苍狼算法的半监督入侵检测方法
CN109800875A (zh) 基于粒子群优化和降噪稀疏编码机的化工故障检测方法
CN109685366A (zh) 基于异变数据的装备健康状态评估方法
CN106355030A (zh) 一种基于层次分析法和加权投票决策融合的故障检测方法
CN111753985A (zh) 基于神经元覆盖率的图像深度学习模型测试方法与装置
CN109886284B (zh) 基于层次化聚类的欺诈检测方法及***
CN110737976B (zh) 一种基于多维度信息融合的机械设备健康评估方法
CN106778832A (zh) 基于多目标优化的高维数据半监督集成分类方法
Zhang et al. Fast covariance matching with fuzzy genetic algorithm
CN110581840B (zh) 基于双层异质集成学习器的入侵检测方法
CN110794360A (zh) 一种基于机器学习预测智能电能表故障的方法及***
CN101738998A (zh) 一种基于局部判别分析的工业过程监测***及方法
CN115112372A (zh) 轴承故障诊断方法、装置、电子设备及存储介质
CN106570537A (zh) 一种基于混淆矩阵的随机森林模型选择方法
CN116805051A (zh) 基于注意力机制的双卷积动态域适应设备故障诊断方法
CN113486926B (zh) 一种自动化码头设备异常检测***
CN108763926A (zh) 一种具有安全免疫能力的工业控制***入侵检测方法
CN113935413A (zh) 一种基于卷积神经网的配网录波文件波形识别方法
CN115294674B (zh) 一种无人艇航行状态的监测评估方法
CN114528906A (zh) 一种旋转机械的故障诊断方法、装置、设备和介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant