CN105809196A - 基于先验主题模型的列控***车载设备智能化故障诊断方法 - Google Patents

基于先验主题模型的列控***车载设备智能化故障诊断方法 Download PDF

Info

Publication number
CN105809196A
CN105809196A CN201610134412.3A CN201610134412A CN105809196A CN 105809196 A CN105809196 A CN 105809196A CN 201610134412 A CN201610134412 A CN 201610134412A CN 105809196 A CN105809196 A CN 105809196A
Authority
CN
China
Prior art keywords
theme
priori
fault
lexical item
lda
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610134412.3A
Other languages
English (en)
Inventor
徐田华
郭进
杨扬
王小敏
王海峰
王峰
张路
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southwest Jiaotong University
Beijing Jiaotong University
China Railway Corp
Original Assignee
Southwest Jiaotong University
Beijing Jiaotong University
China Railway Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southwest Jiaotong University, Beijing Jiaotong University, China Railway Corp filed Critical Southwest Jiaotong University
Priority to CN201610134412.3A priority Critical patent/CN105809196A/zh
Publication of CN105809196A publication Critical patent/CN105809196A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于先验主题模型的列控***车载设备智能化故障诊断方法,所述方法主要包括特征提取和智能诊断两个主要步骤。

Description

基于先验主题模型的列控***车载设备智能化故障诊断方法
技术领域
本发明属于轨道交通运行控制技术领域,涉及基于先验主题模型的列控***车载设备智能化故障诊断方法。
背景技术
在现有技术中,对车载设备的故障诊断与维护,现场使用的主要诊断措施有:
(1)人工检验,这是一种传统的诊断和维护方式,因其劳动强度大,诊断效率低下等原因,已越来越不适应现代化的发展要求。
(2)数据监测***,该***通过特定的数据采集装置实时采集车载设备的运行参数,并汇集到数据监测中心,设备维护人员综合分析采集到的数据来进行故障诊断和维护。数据监测***实现了车载设备的实时采集并具备一定的故障诊断能力,是当前电务部门日常维护和故障分析的重要手段。然而,该***在实际应用中仍存在误诊率高、故障定位不精确的问题,同时其数据分析需要大量人工参与,这无疑给维护人员带来繁重的负担。
(3)铁路数据的标准化:一些学者基于本体的方法解决铁路领域数据与信息不统一的问题。利用XML、XSL建立欧洲铁路数据的标准化文档。但是仍然无法分析和处理目前现存的故障数据。
发明内容
本发明的目的是为了解决上述问题,提供基于先验主题模型的列控***车载设备智能化故障诊断方法,解决了现有技术中存在的问题。
解决现场车载设备故障诊断的人工检验效率低下以及数据监测***误诊率较高的现状。
一种基于先验主题模型的列控***车载设备智能化故障诊断方法,所述方法主要包括特征提取和智能诊断两个主要步骤。
所述特征提取是指基于先验主题模型的车载设备故障特征提取,通过先验LDA将车载设备的故障现象描述文档从词项空间变换到主题特征空间。
故障案例库文本中的先验知识提取,先验主题模型为LDA模型的主题更新概率可表达为公式(2):
P ( z i = j | z - i , w , α , β ) = ( n - i , j w i + β Σ w ′ W n - i , j w ′ + W β ) ( n - i , j d i + α Σ j T n - i , j d i + T α ) - - - ( 2 )
其中,zi=j代表文档中第i个词项分配到主题j下,z-i代表出第i个词之外的所有其他词的主题分配;是词w’分配到主题j下的次数;是文档di下词i分配到主题j的个数;α和β分别是文档主题和主题词项的Dirichlet(狄利克雷)分布超参数。
先验LDA的主要思想是通过整合先验知识DMij,来修正主题更新概率,在主题更新过程中,我们将对公式(2)乘以一个额外的因子函数,如公式(3):
对于先验LDA模型,首先需要设定主题个数x,根据故障数据集可以获得出现故障现象的先验个数t,假定x满足原始词项空间词项数目>x≥min(t,T),其次,我们将词项文档矩阵输入先验LDA进行主题特征提取,进而得到主题特征空间和主题文档矩阵。
基于分层策略故障诊断方法,选用基于SVM的分类器进行智能诊断,一方面基于SVM的分类器具有普遍较好的泛化能力,另一方面,可以应对车载设备故障诊断过程故障现象作为特征表现出的复杂性。
对于车载设备两级故障模式,采取分步诊断策略,首先,在提取的主题特征空间上构建SVM分类器A,进行一级故障模式(FFP)故障诊断;然后,我们将一级故障模式的诊断结果作为新的特征和主题特征空间融合构成新的特征空间,在此特征空间上构建SVM分类器B,进行二级故障模式(SFP)故障诊断。
有益效果
本专利采用现场采集的高速铁路车载ATP故障记录,共1046条数据进行验证试验。数据由现场积累的列控车载设备故障的详细记录,包括故障时间,列车编号,运行区段,故障现象描述,是否影响停车,故障分析,故障类别,故障处理情况。待诊断数据为故障记录中的故障现象描述,诊断结果为故障类别。
(1)列控车载设备故障特征提取:传统的特征提取方法未考虑先验知识,对于高速铁路车载设备故障诊断领域适应性较差。本发明采用主题挖掘的基本思想,将领域先验知识整合到主题特征挖掘过程中,以提取适合车载设备故障诊断的特征。
(2)列控车载设备故障诊断:对于车载设备两级故障模式进行诊断,复杂性较高,严重影响了诊断效果。本发明提出分级故障诊断策略,将一级故障诊断结果融合到词项特征空间,进而对二级故障模式进行诊断。
附图说明
图1是基于先验主题模型的特征提取流程图图;
图2是基于SVM的故障诊断流程图图。
具体实施方式
实施例1
本发明提出的智能化故障诊断方案主要包括特征提取和智能诊断两个主要步骤。
1基于先验主题模型的车载设备故障特征提取
LDA模型由D.M.Blei等人在2003年提出,是目前应用最广泛的一种概率主题模型,它具有比其他模型更全面的文本生成假设。然而,它是一种无监督的模型,在主题挖掘过程中存在一定的盲目性。因此,本专利通过将车载设备领域先验知识整合到LDA模型主题挖掘过程,提高故障主题特征的挖掘的准确率和效率。核心思想是通过先验LDA将车载设备的故障现象描述文档从词项空间变换到主题特征空间。具体特征提取步骤,详见附图1。
1.1车载设备领域先验知识提取
首先引入三个概念:
“主题相关词”:在某语料库下,某主题中出现频率较高,而在其他主题中出现频率不高的词。
“公用词项”:在某语料库下,在多个主题(≥2)下出现次数均较高的词项。
“弱相关词项”:在某语料库下,与主题共现率较高的词项。
一方面,基于词共现的主题模型,仅仅依据词频(TF)对词聚类,无法避免公用词带来的影响。比如,“BTM故障”和“DMI故障”主题类别中,“故障”一词出现的次数都比较多,即为公用词。而主题相关词“BTM”,“DMI”分别在两个主题中出现的次数要多,然而依据词共现的主题模型,无法分辨该词为主题相关词还是公用词。因此,词“BTM”和“DMI”都与“故障”一词共现率较高,从而误将“BTM”,“故障”,“DMI”三个词分到一个主题下,而导致主题挖掘的混乱。然而,我们可以采用降低公用词的权重,而解决共用词带来的不利影响,来提高LDA主题挖掘准确性。
另一方面,与某个主题相关程度较高的词显然应该赋予较高的权重,以提升词项分配到该主题的可能性。对于弱相关的词项,不应分配到该主题下,应该赋予一个很低的权重。在自然语言处理中,PMI算法经常用来计算两个词项的相关性,它被定义公式(1):
PMI ( t , z ) = log 2 P t & z P t P z - - - ( 1 )
其中,Pt&z是主题词z和词项w在文本集合中共现的联合分布概率,Pt是词项在文本集合中出现的概率,Pz是主题词z在文本集合中出现的概率。
经过上述步骤得到的相关性为连续值,理论上也可作为先验知识直接整合到主题模型中的进行主题特征的挖掘。但为了提高主题模型的主题挖掘效率,本专利将对相关性PMI进行离散化处理。根据相关性大小,将相关的程度分为三个等级:强相关SR、一般相关GR、弱相关WR。
本专利采用基于聚类(K-means)的离散化方法,设定聚类个数K(即离散区间数)为5。具体的操作步骤见算法1:
专家进行故障诊断的过程往往根据现象或几种现象的组合来进行故障定位和故障类别判断。对于车载设备故障诊断领域,故障现象描述中所描述的主题正是故障后所发生的“现象”,而一种故障现象描述往往一定会出现几个相互关联词汇,我们可以用这些必然出现词汇的来代表描述中所出现的主题,我们称这种必然的关系为Strong-Link。从而可以实现PMI算法来发掘主题相关词和公用词并计算它们的权重。
通过车载设备领域专家知识和现场工程师的经验总结,高速铁路车载ATP经常出现的故障现象,也就是出现的大部分主题,归结起来有T=44类,现象列表1如下:
表1.每个故障现象(主题)的主题相关词项表
1.2先验主题模型
LDA模型的主题更新概率可表达为公式(2):
P ( z i = j | z - i , w , α , β ) = ( n - i , j w i + β Σ w ′ W , n - i , j w ′ + W β ) ( n - i , j d i + α Σ j T n - i , j d i + T α ) - - - ( 2 )
其中,zi=j代表文档中第i个词项分配到主题j下,z-i代表出第i个词之外的所有其他词的主题分配;是词w’分配到主题j下的次数;是文档di下词i分配到主题j的个数;α和β分别是文档主题和主题词项的Dirichlet分布超参数。
然而,LDA模型是无监督的主题挖掘模型。在主题挖掘过程中存在一定的盲目性,主题挖掘准确率较低。通过上述的先验知识提取得到先验知识矩阵DM。通过将这些先验知识DMij∈DM整合到LDA模型的主题挖掘过程,显然会改善模型的主题挖掘过程,试验结果也证明了这一点。先验LDA的主要思想是通过整合先验知识DMij,来修正主题更新概率。这就意味着,在主题更新过程中,我们将对公式(2)乘以一个额外的因子函数,如公式(3):
P ( z i = j | z - i , w , α , β ) = DM i j * ( n - i , j w i + β Σ w ′ W n - i , j w ′ + W β ) ( n - i , j d i + α Σ j T n - i , j d i + T α ) - - - ( 3 )
正如公式(2)和公式(3)所示,DMij在主题挖掘过程中起着很重要的作用,代表先验知识对主题特征提取过程的有着关键影响。对于先验LDA模型,首先需要设定主题个数x,根据故障数据集可以获得出现故障现象的先验个数t。假定x满足原始词项空间词项数目>x≥min(t,T)。其次,我们将词项文档矩阵输入先验LDA进行主题特征提取,进而得到主题特征空间和主题文档矩阵。
2基于分层策略故障诊断方法
选用基于SVM的分类器进行智能诊断。一方面基于SVM的分类器具有普遍较好的泛化能力,另一方面,可以应对车载设备故障诊断过程故障现象作为特征表现出的复杂性。
对于车载设备两级故障模式,采取分步诊断策略,详见附图2。首先,在提取的主题特征空间上构建SVM分类器A,进行一级故障模式(FFP)故障诊断;然后,我们将一级故障模式的诊断结果作为新的特征和主题特征空间融合构成新的特征空间,在此特征空间上构建SVM分类器B,进行二级故障模式(SFP)故障诊断。
试验结果
针对RBFSVM分类器,通过它和其他三种传统的特征提取的方法的比较,来观察先验主题模型的分类表现。其中,特征空间包括VSM初级特征空间,即原始词项空间;TFIDF特征空间;不加先验知识的LDA特征空间,即BLDA特征空间。
针对先验的LDA特征空间,我们通过它和其他三种经典分类器的比较,来综合验证我们提出的故障诊断方法可行性。包括基于BP神经网络的分类器,基于KNN分类器(KNN),基于贝叶斯网络分类器(BN),来观察基于RBFSVM的分类器的分类表现;以此,在我们试验中,通过F-measures来进行诊断效果的综合评估。
基于SVM分类器在不同特征空间上的分类效果
分类器的分类结果需要通过设定置信区间被分为正类和负类。我们检验诊断效果是采用整体类别的F1为主要指标,精度和召回率两个辅助指标进行验证。表2和表3分别描述了以SVM构造的分类器作为诊断工具时,在不同的特征空间上对一级故障类别和二级故障类别的诊断效果。
表2:基于SVM分类器在不同特征空间上的一级故障模式分类效果
表3:基于SVM分类器在不同特征空间上的二级故障模式分类效果
从上表我们可以得出:
(1)PLDA特征空间下,分类器的分类效果最好,一级故障模式F1-measure值可以达到81.22%,二级故障模式F1-measure值可以达到69.43%。它在保证精度稳定的情况下,提高了召回率。
(2)通过比较BLDA特征空间和PLDA特征空间,可以看出加入先验知识后先验LDA模型提取的特征空间对分类效果有很大的改善。
7.3PLDA主题空间下各分类器的诊断效果
表4表明,通过比较其他三个主流分类器,即K-NearestNeighbor(KNN)分类器,基于BP神经网络的分类器,基于贝叶斯网络的分类器,来评估我们的分类器对一级故障模式在PLDA主题特征空间下的诊断的效果。表5表明,通过比较其他四个主流分类器,即K-NearestNeighbor(KNN)分类器,基于BP神经网络的分类器,基于贝叶斯网络的分类器,以及未考虑融合策略的SVM分类器(SVMOFF),来评估我们的分类器对二级故障模式在PLDA主题特征空间下的诊断的效果。
表4:一级故障模式在PLDA主题空间下各分类器的诊断效果
表5:二级故障模式在PLDA主题空间下各分类器的诊断效果
表4表明:对于一级故障模式,基于SVM的分类器表现优于其他分类器,达到F1-measure值为81.22%,精度为82.02%召回率74.18%的良好分类效果。
其次,表5表明:
(1)虽然SVM分类器的精度不是最好的,但是它有能力权衡精度和召回率而达到整体效果最优
(2)由于我们考虑了VOBE自身的特征,并采取特征融合的策略,从而提高了二级故障模式的诊断效果。
因此,我们可以得出基于SVM的分类器对于VOBE故障诊断具有更高的可靠性和效率。
最后应说明的是:显然,上述实施例仅仅是为清楚地说明本发明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明的保护范围之中。

Claims (6)

1.一种基于先验主题模型的列控***车载设备智能化故障诊断方法,其特征在于,所述方法主要包括特征提取和智能诊断两个主要步骤。
2.根据权利要求1所述的诊断方法,其特征在于,所述特征提取是指基于先验主题模型的车载设备故障特征提取,通过先验LDA将车载设备的故障现象描述文档从词项空间变换到主题特征空间。
3.根据权利要求2所述的诊断方法,其特征在于,故障案例库文本中的先验知识提取,先验主题模型为LDA模型的主题更新概率可表达为公式(2):
P ( z i = j | z - i , w , α , β ) = ( n - i , j w i + β Σ w ′ W n - i , j w ′ + W β ) ( n - i , j d i + α Σ j T n - i , j d i + T α ) - - - ( 2 )
其中,zi=j代表文档中第i个词项分配到主题j下,z-i代表出第i个词之外的所有其他词的主题分配;是词w’分配到主题j下的次数;是文档di下词i分配到主题j的个数;α和β分别是文档主题和主题词项的Dirichlet(狄利克雷)分布超参数。
4.根据权利要求3所述的诊断方法,其特征在于,先验LDA的主要思想是通过整合先验知识DMij,来修正主题更新概率,在主题更新过程中,我们将对公式(2)乘以一个额外的因子函数,如公式(3):对于先验LDA模型,首先需要设定主题个数x,根据故障数据集可以获得出现故障现象的先验个数t,假定x满足原始词项空间词项数目>x≥min(t,T),其次,我们将词项文档矩阵输入先验LDA进行主题特征提取,进而得到主题特征空间和主题文档矩阵。
5.根据权利要求4所述的诊断方法,其特征在于,基于分层策略故障诊断方法,选用基于SVM的分类器进行智能诊断,一方面基于SVM的分类器具有普遍较好的泛化能力,另一方面,可以应对车载设备故障诊断过程故障现象作为特征表现出的复杂性。
6.根据权利要求5所述的诊断方法,其特征在于,对于车载设备两级故障模式,采取分步诊断策略,首先,在提取的主题特征空间上构建SVM分类器A,进行一级故障模式(FFP)故障诊断;然后,我们将一级故障模式的诊断结果作为新的特征和主题特征空间融合构成新的特征空间,在此特征空间上构建SVM分类器B,进行二级故障模式(SFP)故障诊断。
CN201610134412.3A 2016-03-09 2016-03-09 基于先验主题模型的列控***车载设备智能化故障诊断方法 Pending CN105809196A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610134412.3A CN105809196A (zh) 2016-03-09 2016-03-09 基于先验主题模型的列控***车载设备智能化故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610134412.3A CN105809196A (zh) 2016-03-09 2016-03-09 基于先验主题模型的列控***车载设备智能化故障诊断方法

Publications (1)

Publication Number Publication Date
CN105809196A true CN105809196A (zh) 2016-07-27

Family

ID=56468007

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610134412.3A Pending CN105809196A (zh) 2016-03-09 2016-03-09 基于先验主题模型的列控***车载设备智能化故障诊断方法

Country Status (1)

Country Link
CN (1) CN105809196A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106570167A (zh) * 2016-11-08 2017-04-19 南京理工大学 基于融合知识的主题模型的微博话题发现方法
CN107067129A (zh) * 2016-12-12 2017-08-18 北京交通大学 基于网格的铁路工务设备风险事件可能性获取方法及***

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101750210A (zh) * 2009-12-24 2010-06-23 重庆大学 基于正交局部保持映射(olpp)特征约简的故障诊断方法
CN104777827A (zh) * 2015-01-21 2015-07-15 中国铁路总公司 高速铁路信号***车载设备故障诊断方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101750210A (zh) * 2009-12-24 2010-06-23 重庆大学 基于正交局部保持映射(olpp)特征约简的故障诊断方法
CN104777827A (zh) * 2015-01-21 2015-07-15 中国铁路总公司 高速铁路信号***车载设备故障诊断方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
WANG FENG等: "Prior LDA and SVM Based Fault Diagnosis of Vehicle On-board Equipment for High Speed Railway", 《2015 IEEE 18TH INTERNATIONAL CONFERENCE ON INTELLIGENT TRANSPORTATION SYSTEMS》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106570167A (zh) * 2016-11-08 2017-04-19 南京理工大学 基于融合知识的主题模型的微博话题发现方法
CN107067129A (zh) * 2016-12-12 2017-08-18 北京交通大学 基于网格的铁路工务设备风险事件可能性获取方法及***

Similar Documents

Publication Publication Date Title
CN106202886A (zh) 基于模糊粗糙集与决策树的轨道电路红光带故障定位方法
CN104077552B (zh) 一种基于云计算的轨道交通信号综合运维方法及***
DE102012102770B9 (de) System und Verfahren zur Fehlereingrenzung und Fehlerabschwächung basierend auf einer Netzwerkmodellierung
CN110262463B (zh) 一种基于深度学习的轨道交通站台门故障诊断***
CN105676842B (zh) 一种高铁列控车载设备故障诊断方法
CN103699698B (zh) 一种基于改进贝叶斯的轨道交通故障识别方法及***
CN104777827A (zh) 高速铁路信号***车载设备故障诊断方法
CN110490433A (zh) 一种列控***风险评估方法
CN104134010B (zh) 一种基于朴素贝叶斯算法面向离散型数据的卫星故障诊断方法
CN102208028A (zh) 一种适用于动态复杂***的故障预测和诊断方法
CN108537259A (zh) 基于粗糙集-神经网络模型的列控车载设备故障分类与识别方法
CN104463696A (zh) 电网运行风险识防方法及***
CN113359664B (zh) 故障诊断与维护***、方法、设备及存储介质
CN107124325A (zh) 一种电力通信网运行安全评估方法及***
CN104991549A (zh) 基于fta与多层次模糊神经子网络的轨道电路红光带故障诊断方法
CN105574328B (zh) 一种机载诊断模型的集成方法
KR102078654B1 (ko) 전동차의 고장을 예측하는 시스템 및 방법
CN111798162A (zh) 基于神经网络的风险监测方法及装置
CN115938124A (zh) 一种城市轨道交通突发事件影响预测方法、***及产品
CN105809196A (zh) 基于先验主题模型的列控***车载设备智能化故障诊断方法
CN111806516A (zh) 一种用于智能列车监测与运维的健康管理装置及方法
CN112446232A (zh) 一种持续自学习的图像识别方法及***
Pidgeon et al. Management of safety through lessons from case histories
CN112732787A (zh) 面向动车组重要部件的设备画像与个性化运维服务方法
Gao et al. A dynamic fault tree based CBTC onboard ATP system safety analysis method

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160727

RJ01 Rejection of invention patent application after publication