CN109034028B - 一种基于符号化与tf-idf的机械设备故障特征提取方法 - Google Patents

一种基于符号化与tf-idf的机械设备故障特征提取方法 Download PDF

Info

Publication number
CN109034028B
CN109034028B CN201810779843.4A CN201810779843A CN109034028B CN 109034028 B CN109034028 B CN 109034028B CN 201810779843 A CN201810779843 A CN 201810779843A CN 109034028 B CN109034028 B CN 109034028B
Authority
CN
China
Prior art keywords
vibration time
idf
vibration
subsequence
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810779843.4A
Other languages
English (en)
Other versions
CN109034028A (zh
Inventor
丁承君
冯玉伯
朱雪宏
王鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Taihua Hongye Tianjin Robot Technology Research Institute Co ltd
Hebei University of Technology
Original Assignee
Taihua Hongye Tianjin Robot Technology Research Institute Co ltd
Hebei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Taihua Hongye Tianjin Robot Technology Research Institute Co ltd, Hebei University of Technology filed Critical Taihua Hongye Tianjin Robot Technology Research Institute Co ltd
Priority to CN201810779843.4A priority Critical patent/CN109034028B/zh
Publication of CN109034028A publication Critical patent/CN109034028A/zh
Application granted granted Critical
Publication of CN109034028B publication Critical patent/CN109034028B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01HMEASUREMENT OF MECHANICAL VIBRATIONS OR ULTRASONIC, SONIC OR INFRASONIC WAVES
    • G01H17/00Measuring mechanical vibrations or ultrasonic, sonic or infrasonic waves, not provided for in the preceding groups
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Signal Processing (AREA)
  • Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

一种基于符号化与TF‑IDF的机械设备故障特征提取方法,包括:将采集的待诊断振动信号转为时间序列,并对所述时间序列进行截取,得到所述振动时间序列的子序列;将所述振动时间子序列加载至正常振动子序列集合中,将加载后的振动子序列集合进行符号化;将符号化的上述振动子序列集合采用TF‑IDF方法进行差异化特征提取。本发明技术方案中将符号化与TF‑IDF方法相结合,进行机械设备故障特征提取,提高了机械设备故障诊断中振动信号特征提取的准确性和有效性,有很好的分类能力,能够更好更快的提取机械设备特征。

Description

一种基于符号化与TF-IDF的机械设备故障特征提取方法
技术领域
本发明涉及机械设备故障提取技术领域,尤其涉及一种基于符号化与TF-IDF的机械设备故障特征提取方法。
背景技术
机械设备的复杂化、大型化使得***一旦发生故障,将会造成巨大的经济损失乃至人员伤亡,故而机械设备的故障诊断和异常检测是保证设备安全、可靠和高效运行的有效手段。机械设备中重要的组件是否发生故障直接影响整台机器的健康状况,因此对机械设备的故障监测与检测能够及时发现设备中零件的损伤,避免零件失效和机器损坏。而设备中零件的故障检测可以通过振动信号特征的有效提取与分析加以实现,设备中零件的振动信号中常常混有很大的噪声,具有非平稳性特征,因此对零件故障特征信息准确而有效的提取是机械设备故障诊断中的重点和难点。
中国专利公开号:CN105738722A公开了一种航空机电作动器故障诊断方法,
其涉及一种基于符号动力学信息熵理论和改进Parks聚类算法的航空机电作动器故障诊断方法,通过对机电作动器逆变器侧母线电流的幅值时间序列进行符号化处理,将计算得到的信息熵值以及母线电流时间序列的最大幅值作为机电作动器故障诊断的两个特征量,然后建立基于训练样本的标准故障特征矩阵,采用改进Parks聚类算法通过计算待测样本与故障特征矩阵的距离来判断待测样本归属的故障类型。由此可见,所述诊断方法存在以下问题:
第一,所述诊断方法需要对机电作动器的6种状态下分别采样,且在各运行状态下需要采集至少50组母线电流时间,对所述母线电流时间测量完成后还需要分别对其提取故障诊断特征量,采样工程量大,耗费时间多。
第二,所述诊断方法使用母线电流时间序列的最大幅值以及符号动力学信息熵值座位故障诊断的特征量,计算量大,降低了所述诊断方法的数据提取效率。
第三,所述诊断方法在采样时会改变所述机电作动器的本质特征,使其的各项参数发生改变,导致所采集的数据不属于同种状况,故障数据提取效率低。
发明内容
为此,本发明提供一种基于符号化与TF-IDF的机械设备故障特征提取方法,用以克服现有技术中零件故障特征提取效率低的问题。
为实现上述目的,本发明提供一种基于符号化与TF-IDF的机械设备故障特征提取方法,其特征在于,包括:
将采集的待诊断振动信号转为振动时间序列,并对所述振动时间序列进行截取,截取后得到振动时间子序列;
将所述振动时间子序列加载至正常振动时间子序列集合中,将加载后的振动时间子序列集合进行符号化;
将符号化的上述振动时间子序列集合采用TF-IDF方法进行差异化特征提取。
进一步地,在将待诊断振动信号转为振动时间序列时,先将所述待诊断振动信号中的振动位移,速度,加速度通过相应的传感器,并按照时间顺序进行采集得到振动时间序列S;采集完成后选择固定大小的滑动窗口对所述振动时间序列S进行截取,以此形成振动时间子序列
Figure BDA0001732289940000022
进一步地,所述振动时间序列S为:在测量所述振动信号相应物理量时,按照时间先后顺序排列而成的数列,S=(s1,s2,…,sn)(1),其中n是所述振动时间序列S的长度,且n为正整数;所述振动时间序列子序列
Figure BDA0001732289940000023
为:所述振动时间序列S中长度为k的子序列,
Figure BDA0001732289940000021
其中1≤j≤n-k+1。
进一步地,所述滑动窗口的长度为k,步长为m,其中k,m均为正整数。
进一步地,在对所述振动时间序列进行符号化时,包括:
将所述振动时间序列中的数据离散化,形成少量数值;
离散化后,使用颗粒法对非线性非平稳***进行描述,并在描述的同时使所述***中的周期性、相关性等本质特征保持稳定;
描述完成后,利用等区间法对所述振动时间序列进行符号化,并将每个符号称为一个单词。
进一步地,在使用等区间法对所述振动时间序列进行符号化时,先计算出长度为n的振动时间序列S=(s1,s2,…,sn)中最小值Smin和最大值Smax,并计算出原始振动时间序列的值域[Smin,Smax];
计算完成后,按照公式(3)将所述值域划分为k个大小相等的区间,
Figure BDA0001732289940000031
其中Ci为所述振动时间序列的一个“单词”;
经过公式(3)处理后,所述振动时间序列中的每个值都对应一个“单词”,从而将所述振动时间序列转换为符号时间序列。
进一步地,所述TF-IDF是在咨讯检索中常用的加权技术;根据所述TF-IDF法的思想提出振动时间序列TF-IDF方法为:当所述振动时间子序列集合中的某些符号化数值在一个振动时间子序列中出现的频率高(TF值高),而在其它的振动时间子序列中很少出现(IDF值低),则认为此符号化数值是代表该序列的典型特征,并以此将各符号化振动时间序列进行分类。
进一步地,所述振动时间序列的词频TF为一个上述给定的“单词”在符号化子序列中的次数,一个符号化子序列中某个单词Ci的重要性可以表示为:
Figure BDA0001732289940000032
其中ni,j是单词Ci在子序列dj中的出现次数,而分母表示子序列dj中所有字词的出现次数之和;
所述振动时间序列的逆向文件频率IDF为一个单词Ci普遍重要性的度量,某一特定单词的IDF,可以由符号化子序列总数除以包含该单词的子序列数目,再把结果取对数得到:
Figure BDA0001732289940000033
其中|D|为时间序列中的子序列总数。
进一步地,在采用TF-IDF方法进行差异化特征提取后,对提取的特征采用欧式距离进行序列特征相似性比较,若待诊断的故障子序列与正常振动时间子序列TF-IDF特征值的欧式距离数值具有分离性,则说明TF-IDF所提取的特征有效。
进一步地,在采用TF-IDF方法进行差异化特征提取后,对提取的特征采用PCA主成分提取并使用KMeans方法进行聚类处理,若待诊断不同故障子序列中类内样本距离相对较小,类间样本距离较大,且正常振动数据相对于故障数据更加紧凑,则证明TF-IDF提取的特征有效。
与现有技术相比,本发明的有益效果在于,本发明技术方案中将符号化与TF-IDF结合,进行机械设备故障特征提取,提高了机械设备故障诊断中振动信号特征提取的准确性和有效性,有很好的分类能力,能够更好更快的提取机械设备故障特征;且所述方法使用无监督学习方法解决了有监督学习方法中带有标签的故障数据难以获取的问题。
进一步地,本发明利用相应传感器,对所述振动信号进行采集,并按照顺序得到时间序列S,将复杂的信号转化为数据,能够为后续的符号化做准备,提高了所述提取方法对零件故障特征的提取效率。
进一步地,本发明在所述振动时间序列S中提取出多个振动时间子序列
Figure BDA0001732289940000041
通过提取多个所述振动时间子序列,为后续的符号化以及故障特征的提取做准备,进一步提高了所述提取方法对零件故障特征的提取效率。
进一步地,所述截取振动时间子序列的滑动窗口采用固定尺寸,这样,截取的振动时间子序列均为同样的长度及步长,在符号化后能够保证所述符号的统一性,在后续的单词提取中也能使所述数据更加直观的表现出来,进一步提高了所述提取方法对零件故障特征的提取效率。
进一步地,在利用TF-IDF法对所述符号化时间子序列进行单词提取时,先对所述时间子序列中的数据离散化,在使用颗粒法对所述***进行描述,在描述时所述***中的周期性、相关性等本质特征不会发生改变,这样,在描述所述***时不会因为进行操作而使所述***中的本质特征发生改变,描述完成后的时间子序列也为同一特征下的数据,维持了所述***和数据的稳定性,进一步提高了所述提取方法对零件故障特征的提取效率。
进一步地,本发明通过计算振动时间序列的值域,并将其划分为多个大小相等的区间,以此将所述振动时间序列转换为符号时间序列,这样,可对所述符号时间序列使用TF-IDF的方法来进行故障特征提取,进一步提高了所述提取方法对零件故障特征的提取效率。
进一步地,本发明利用相应公式分别计算所述符号化振动时间序列的TF值和IDF值,并根据所述两个参数提取出所述符号化振动时间子序列中典型特征的符号化数值,并根据所述符号化数值对所述振动时间序列进行故障分类,进一步提高了所述提取方法对零件故障特征提取效率。
附图说明
图1为本发明所述基于符号化与TF-IDF的机械设备故障在线监测流程图;
图2为本发明所述基于符号化与TF-IDF的机械设备故障诊断流程图;
图3为本发明实施例提供的滚动轴承实验装置示意图;
图4为本发明实施例所述实验装置中原始振动子序列与符号化振动子序列图;
图5为本发明实施例所述实验装置中符号化振动序列部分子序列TF-IDF分布图;
图6为本发明实施例所述实验装置中不同位置故障子序列与基准子序列特征的欧式距离;
图7为本发明实施例所述实验装置中符号化子序列聚类分析。
具体实施方式
为了使本发明的目的和优点更加清楚明白,下面结合实施例对本发明作进一步描述;本领域的技术人员可以理解的是,此处所描述的具体实施例仅用于解释本发明,并不用于限定本发明。
请参阅图1所示,其为本发明所述机械设备故障在线监测流程,其中,序列1为待诊断振动序列,序列2为正常振动序列集合。在诊断时,先将待诊断振动子序列(通常是振动传感器监测到的振动信号片段)加入到正常振动子序列集合中,将这些振动子序列集合进行符号化,并通过振动序列TF-IDF方法进行差异化特征提取,对提取的特征采用欧式距离进行序列特征相似性比较,若待诊断不同故障子序列与正常振动子序列TF-IDF特征值的欧式距离数值具有分离性,则说明TF-IDF所提取的特征有效。该方法主要用于在线判定机械设备是否发生故障,对于故障序列,将其加入到不同种类故障的振动子序列集合中,并启动故障诊断流程。
请参阅图2所示,其为本发明所述机械设备故障诊断流程图,其中,序列3为待诊断振动序列,序列4为不同种类振动序列集合。将待诊断故障子序列加入到不同种类故障振动子序列集合中,将这些振动子序列集合通过符号化,TF-IDF方法进行特征提取,最后使用PCA主成分和Kmeans聚类方法进行类别归属以验证特征提取的有效性。若聚类方法能够通过TF-IDF特征进行很好的聚类,则说明所提取的特征能够区分不同类别的轴承故障。
实施例1
请参阅图3所示,其为本发明实施例所述滚动轴承实验装置的结构示意图,包括感应电机1、电机风扇端2、电机驱动端3、振动传感器4、驱动端轴承5、联轴器6、扭矩传感器7和负载测力计8。本实施例中基准振动子序列集合选用美国凯斯西储大学提供的轴承振动测试开放数据集;所述数据集是测试和验证设备状态、故障新方法的一个基准数据集,且所述数据集基于图2所示流程采集获得。
具体而言,所述实验装置包括一个三向感应电动机1,所述电动机1右侧是能够产生额定负载的测力计8,两者分别通过联轴器6与扭矩传感器7连接,电机驱动端3安装待测试轴承5,振动传感器4安装在电机驱动端3上方。实验采用SKF6205-2RSJEM型轴承,使用电火花加工方式分别在内轴承、外轴承和滚动体上制造单点缺陷,缺陷尺寸为1.75×10-4m。负载0kw,采集频率12kHz。将上述3类故障数据和1类正常数据进行分割,划分为长度为4096的子序列,每类数据取25个子序列,得到的原始振动子序列与符号化振动子序列如图4所示。
可以理解的是,在实际的应用中,需要根据设备的计算能力确定子序列长度和个数,但这两个数值一般倾向于比较大的数值,以满足大数定理,使得统计特征具有稳定性。
请参阅图4所示,其为本发明实施例所述实验装置中轴承正常状态及出现缺陷时的振动子序列与符号化振动子序列图表。针对缺陷尺寸为1.75×10-4m,选择正常振动数据,内轴承、滚动体、外轴承缺陷振动数据。对四种振动时间序列进行符号化处理,设定符号种类64个,结果如图4所示。图中左侧是原始振动时间子序列图,右侧是符号化振动子序列图。与原始振动子序列相比,符号化子振动序列更具有颗粒化性,同时过滤掉了原序列的中的微小变化,并且保持了原始序列中的周期性与相关性等特征。
可以理解的是,在实际使用中,各符号化振动时间序列中的符号种类需要根据经验或者算法结果调试得出。
请参阅图5所示,其为本发明实施例所述实验装置符号化振动序列中部分子序列的TF-IDF分布图。对符号化的振动子序列集合通过TF-IDF算法进行处理,并对每种故障类型的子序列抽取其中一种显示其TF-IDF值的分布情况;
具体而言,图中横坐标为符号种类,每个种类对应一个数值,纵坐标为各符号的TF-IDF值。根据图表可以得出,四种状态的所述TF-IDF值近似服从正态分布,其中滚动轴承的正常状态A和滚动体故障C的TF-IDF分布区分度不是很明显,但在0-20的符号区间内,表现出相对明显的差异;而内轴承故障B和外轴承故障D的TF-IDF分布的峰值以及中心点位置出现明显不同。
请参阅图6所示,其为本发明实施例所述实验装置中不同位置故障子序列与基准子序列特征的欧式距离。将所述轴承出现缺陷时的振动子序列按照故障监测处理流程方法进行处理后,以任一正常状态振动子序列为基准,使用欧式距离测定其与基准子序列的距离,结果图6所示;从图中可以看出,同一类别缺陷的振动子序列与基准子序列特征的距离基本成直线状态,且不同故障位置的振动子序列与基准子序列特征互不相交且保持一定的距离间隔。
根据上述方法,对上述四类数据做统计处理,由此可以得出所提取的TF-IDF特征可以用于轴承故障的在线监测;在实际的轴承故障在线监测中,可以依据上述原则,设定相应阈值,并对轴承是否发生故障做出判定。
可以理解的是,在图6中所述正常状态normal第一个点是基准状态本身,故其欧式距离为零,在分析中不做考虑。
请参阅图7所示,其为本发明实施例所述实验装置中符号化子序列的聚类分析。针对上述测试数据,对其做符号化处理,TF-IDF特征提取以及PCA主成分提取(本实施例中PCA仅提取2个维度的主成分)并使用KMeans方法对所述数据进行聚类处理。从图中可以看出使用故障诊断流程可以对所述四类数据进行很好的聚类,且类内样本距离相对较小,类间样本距离较大,正常振动数据相对于故障数据更加紧凑。根据所述聚类分析的结果可以得出,所述TF-IDF特征提取方法能够有效应用于所述实验装置的故障检测中。
实施例2
本实施例中实验装置为连杆机构,其中短杆与长杆通过连接杆相连接,且所述连接杆分别与所述长杆和短杆铰接,所述短杆与所述连接件的连接处设有皮带,所述皮带与电机相连。
在实验前,先使所述连杆机构运作,并利用相应传感器对其进行数据采集,得出振动时间序列及振动时间子序列,对所述子序列符号化并进行计算,得到初始符号化振动时间子序列。
在实验时,使用电火花加工方式分别在所述短杆的皮带连接处,短杆主体和短杆与连接杆的交界处制造单点缺陷,缺陷尺寸为1.3×10-4m。负载0kw,采集频率12kHz。将上述3类故障数据和1类正常数据进行分割,划分为长度为6144的子序列,每类数据取40个子序列,得到的原始振动子序列与符号化振动子序列.
针对缺陷尺寸为1.3×10-4m,选择正常振动数据,皮带端、杆体、铰接端缺陷振动数据。对四种振动时间序列进行符号化处理,设定符号种类80个。与原始振动子序列相比,符号化子振动序列更具有颗粒化性,同时过滤掉了原序列的中的微小变化,并且保持了原始序列中的周期性与相关性等特征。
对所述符号化的振动子序列集合通过TF-IDF算法进行处理,并对每种故障类型的子序列抽取其中一种显示其TF-IDF值的分布情况;可以得出,四种状态下的所述TF-IDF值近似服从正态分布,且皮带端和铰接端故障的TF-IDF分布的峰值以及中心点位置出现明显不同。
将所述短杆出现缺陷时的振动子序列按照故障监测处理流程方法进行处理后,以任一正常状态振动子序列为基准,使用欧式距离测定其与基准子序列的距离;同一类别缺陷的振动子序列与基准子序列特征的距离基本成直线状态,且不同故障位置的振动子序列与基准子序列特征互不相交且保持一定的距离间隔。
根据上述方法,对上述四类数据做统计处理,由此可以得出所提取的TF-IDF特征可以用于连杆机构故障的在线监测;在实际的故障在线监测中,可以依据上述原则,设定相应阈值,并对两杆机构中各杆是否发生故障做出判定。
针对上述测试数据,对其做符号化处理,TF-IDF特征提取以及PCA主成分提取(本实施例中PCA仅提取2个维度的主成分)并使用KMeans方法对所述数据进行聚类处理。所述故障诊断流程可以对所述四类数据进行很好的聚类,且正常振动数据相对于故障数据更加紧凑。根据所述聚类分析的结果可以得出,所述TF-IDF特征提取方法能够有效应用于所述连杆机构的故障检测中。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征作出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

Claims (8)

1.一种基于符号化与TF-IDF的机械设备故障特征提取方法,其特征在于,包括:
将采集的待诊断振动信号转为振动时间序列,并对所述振动时间序列进行截取,截取后得到振动时间子序列;
将所述振动时间子序列加载至正常振动时间子序列集合中,将加载后的振动时间子序列集合进行符号化;
将符号化的上述振动时间子序列集合采用TF-IDF方法进行差异化特征提取;
在对所述振动时间序列进行符号化时,包括以下步骤:
将所述振动时间序列中的数据离散化,形成少量数值;
离散化后,使用颗粒法对非线性非平稳***进行描述,并在描述的同时使所述***中的周期性、相关性的本质特征保持稳定;
描述完成后,利用等区间法对所述振动时间序列进行符号化,并将每个符号称为一个单词;
在使用等区间法对所述振动时间序列进行符号化时,先计算出长度为n的振动时间序列S=(s1,s2,…,sn)中最小值Smin和最大值Smax,并计算出原始振动时间序列的值域[Smin,Smax];
计算完成后,按照公式(3)将所述值域划分为k个大小相等的区间,
Figure FDA0003070276750000011
其中Ci为所述振动时间序列的一个“单词”;
经过公式(3)处理后,所述振动时间序列中的每个值都对应一个“单词”,从而将所述振动时间序列转换为符号时间序列。
2.根据权利要求1所述的基于符号化与TF-IDF的机械设备故障特征提取方法,其特征在于,在将待诊断振动信号转为振动时间序列时,先将所述待诊断振动信号中的振动位移,速度,加速度通过相应的传感器,并按照时间顺序进行采集得到振动时间序列S;采集完成后选择固定大小的滑动窗口对所述振动时间序列S进行截取,以此形成振动时间子序列
Figure FDA0003070276750000012
3.根据权利要求2所述的基于符号化与TF-IDF的机械设备故障特征提取方法,其特征在于,所述振动时间序列S为:在测量所述振动信号相应物理量时,按照时间先后顺序排列而成的数列,S=(s1,s2,…,sn) (1),其中n是所述振动时间序列S的长度,且n为正整数;所述振动时间序列子序列
Figure FDA0003070276750000021
为:所述振动时间序列S中长度为k的子序列,
Figure FDA0003070276750000022
其中1≤j≤n-k+1。
4.根据权利要求2所述的基于符号化与TF-IDF的机械设备故障特征提取方法,其特征在于,所述滑动窗口的长度为k,步长为m,其中k,m均为正整数。
5.根据权利要求1所述的基于符号化与TF-IDF的机械设备故障特征提取方法,其特征在于,所述TF-IDF是在咨讯检索中常用的加权技术;根据所述TF-IDF法的思想提出振动时间序列TF-IDF方法为:当所述振动时间子序列集合中的某些符号化数值在一个振动时间子序列中出现的频率高,而在其它的振动时间子序列中很少出现,则认为此符号化数值是代表该序列的典型特征,并以此将各符号化振动时间序列进行分类。
6.根据权利要求5所述的基于符号化与TF-IDF的机械设备故障特征提取方法,其特征在于,所述振动时间序列的词频TF为一个上述给定的“单词”在符号化子序列中的次数,一个符号化子序列中某个单词Ci的重要性可以表示为:
Figure FDA0003070276750000023
其中ni,j是单词Ci在子序列dj中的出现次数,而分母表示子序列dj中所有字词的出现次数之和;
所述振动时间序列的逆向文件频率IDF为一个单词Ci普遍重要性的度量,某一特定单词的IDF,可以由符号化子序列总数除以包含该单词的子序列数目,再把结果取对数得到:
Figure FDA0003070276750000024
其中|D|为时间序列中的子序列总数。
7.根据权利要求6所述的基于符号化与TF-IDF的机械设备故障特征提取方法,其特征在于,在采用TF-IDF方法进行差异化特征提取后,对提取的特征采用欧式距离进行序列特征相似性比较,若待诊断的故障子序列与正常振动时间子序列TF-IDF特征值的欧式距离数值具有分离性,则说明TF-IDF所提取的特征有效。
8.根据权利要求6所述的基于符号化与TF-IDF的机械设备故障特征提取方法,其特征在于,在采用TF-IDF方法进行差异化特征提取后,对提取的特征采用PCA主成分提取并使用KMeans方法进行聚类处理。
CN201810779843.4A 2018-07-16 2018-07-16 一种基于符号化与tf-idf的机械设备故障特征提取方法 Active CN109034028B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810779843.4A CN109034028B (zh) 2018-07-16 2018-07-16 一种基于符号化与tf-idf的机械设备故障特征提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810779843.4A CN109034028B (zh) 2018-07-16 2018-07-16 一种基于符号化与tf-idf的机械设备故障特征提取方法

Publications (2)

Publication Number Publication Date
CN109034028A CN109034028A (zh) 2018-12-18
CN109034028B true CN109034028B (zh) 2021-09-24

Family

ID=64643283

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810779843.4A Active CN109034028B (zh) 2018-07-16 2018-07-16 一种基于符号化与tf-idf的机械设备故障特征提取方法

Country Status (1)

Country Link
CN (1) CN109034028B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113959555B (zh) * 2020-07-20 2024-03-26 中国石油天然气股份有限公司 截取振动信号的方法及装置
CN116975545A (zh) * 2023-07-31 2023-10-31 长沙穗城轨道交通有限公司 一种站台门异常检测方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103528836A (zh) * 2013-09-22 2014-01-22 重庆科技学院 基于符号动力学禁字模式的旋转机械故障诊断方法
CN104931263A (zh) * 2015-06-18 2015-09-23 东南大学 一种基于符号化概率有限状态机的轴承故障诊断方法
CN105004523A (zh) * 2015-08-04 2015-10-28 潍坊学院 基于加权相似性测度的滚动轴承状态监测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130297256A1 (en) * 2012-05-04 2013-11-07 Jun Yang Method and System for Predictive and Conditional Fault Detection

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103528836A (zh) * 2013-09-22 2014-01-22 重庆科技学院 基于符号动力学禁字模式的旋转机械故障诊断方法
CN104931263A (zh) * 2015-06-18 2015-09-23 东南大学 一种基于符号化概率有限状态机的轴承故障诊断方法
CN105004523A (zh) * 2015-08-04 2015-10-28 潍坊学院 基于加权相似性测度的滚动轴承状态监测方法

Also Published As

Publication number Publication date
CN109034028A (zh) 2018-12-18

Similar Documents

Publication Publication Date Title
CN111562108A (zh) 一种基于cnn和fcmc的滚动轴承智能故障诊断方法
CN110823576B (zh) 基于生成对抗网络的机械异常检测方法
CN108956111B (zh) 一种机械部件的异常状态检测方法及检测***
CN116756595B (zh) 一种导电滑环故障数据采集监测方法
CN111678699B (zh) 一种面向滚动轴承早期故障监测与诊断方法及***
CN108106846B (zh) 一种滚动轴承故障损伤程度识别方法
GB2476246A (en) Diagnosing an operation mode of a machine
CN109034028B (zh) 一种基于符号化与tf-idf的机械设备故障特征提取方法
CN106597160B (zh) 一种电子设备故障检测方法和装置
CN103389430A (zh) 一种基于贝叶斯判别理论的油浸式变压器故障检测方法
CN111964909A (zh) 滚动轴承运行状态检测方法、故障诊断方法及***
Yuan et al. Early stage internal short circuit fault diagnosis for lithium-ion batteries based on local-outlier detection
CN116685967A (zh) 用于识别机械装置或机械部件中的异常的方法及装置
CN108982106B (zh) 一种快速检测复杂***动力学突变的有效方法
Ginart et al. Automated feature selection for embeddable prognostic and health monitoring (PHM) architectures
CN113051092B (zh) 一种基于优化核密度估计和js散度的故障诊断方法
CN114739671A (zh) 一种基于改进广义s变换的轴承故障诊断方法
CN113933054A (zh) 一种滚动轴承故障监测诊断方法、设备、介质及处理器
CN117491813A (zh) 新能源汽车动力电池***绝缘异常检测方法
Zhang et al. Applied sensor fault detection and validation using transposed input data PCA and ANNs
CN112352165B (zh) 用于监测断路器的方法以及使用该方法的装置和物联网
CN113609964A (zh) 一种电机异常振动预警方法及***
Xiao et al. Fault state identification of rolling bearings based on deep transfer convolutional autoencoder and a new health indicator
Priva et al. Bearing health condition monitoring using time-domain acoustic signal features
Lim et al. Motor fault detection method for vibration signal using FFT residuals

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CB03 Change of inventor or designer information

Inventor after: Ding Chengjun

Inventor after: Zhu Xuehong

Inventor after: Feng Yubo

Inventor after: Wang Xin

Inventor before: Ding Chengjun

Inventor before: Feng Yubo

Inventor before: Zhu Xuehong

Inventor before: Wang Xin

CB03 Change of inventor or designer information