CN113627544B - 一种基于多源异构数据融合的机床铣刀状态识别方法 - Google Patents

一种基于多源异构数据融合的机床铣刀状态识别方法 Download PDF

Info

Publication number
CN113627544B
CN113627544B CN202110935063.6A CN202110935063A CN113627544B CN 113627544 B CN113627544 B CN 113627544B CN 202110935063 A CN202110935063 A CN 202110935063A CN 113627544 B CN113627544 B CN 113627544B
Authority
CN
China
Prior art keywords
machine tool
data
source heterogeneous
training
term
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110935063.6A
Other languages
English (en)
Other versions
CN113627544A (zh
Inventor
姜兴宇
索英祁
田志强
徐思迪
邓建超
杨国哲
刘伟军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenyang University of Technology
Original Assignee
Shenyang University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenyang University of Technology filed Critical Shenyang University of Technology
Priority to CN202110935063.6A priority Critical patent/CN113627544B/zh
Publication of CN113627544A publication Critical patent/CN113627544A/zh
Application granted granted Critical
Publication of CN113627544B publication Critical patent/CN113627544B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • General Factory Administration (AREA)
  • Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)

Abstract

本发明涉及一种基于多源异构数据融合的机床铣刀状态识别方法,属于数控机床刀具磨损监测技术领域。其包括以下步骤:基于压缩感知与加噪处理的数据预处理方法;基于Dropout方法的堆栈稀疏自编码器;基于改进D‑S证据理论的数据融合算法;基于SSAE与改进D‑S证据理论的刀具状态监测模型;验证本发明所提方法的实用性,在生产线的自动化监控平台中获取生产线状态数据进行试验验证。本发明解决深度学习网络的过拟合与小样本多源异构数据的识别精度低的问题。与人工特征提取方法和SSAE方法对比,本发明具有更好的识别精度与泛化性能。识别结果表明,该模型与方法能够准确反映多品种小批量航天企业生产线机床铣刀状态。

Description

一种基于多源异构数据融合的机床铣刀状态识别方法
技术领域
本发明涉及一种基于多源异构数据融合的机床铣刀状态识别方法,属于数控机床刀具磨损监测技术领域。
背景技术
航天企业生产线机床加工产品种类多、批量小、工艺与环境复杂,致使其信息和突发情况变得复杂不确定,导致应用单源信号进行的刀具监测的结果不可靠。现在的研究尽管解决了单源信号监测不可靠的问题,但深度学***衡,从而导致训练的模型对刀具的状态识别精度低。
在进行数据融合的过程中,尽管D-S(Dempster-Shafer)证据理论在决策融合部分的表现良好,但传统的D-S证据理论无法解决证据的严重与完全冲突、融合结果对证据变化过于敏感的问题,并且在样本少且类别不平衡的情况下易导致某一证据或新增证据对某事件的合成结果无法影响的问题。
发明内容
本发明提出一种基于多源异构数据融合的刀具状态识别方法,利用压缩感知技术提高样本的稀疏性并平衡样本,并用加噪处理的方法增加训练样本数量从而提高网络的鲁棒性,提出基于Dropout(丢弃法)方法的堆栈稀疏自编码器进行识别分类解决小样本的过拟合问题,并通过改进D-S证据理论进行决策融合以弥补传统D-S证据理论的不足,以某航天企业生产线为例进行刀具状态识别,试验结果表明该方法可以有效识别刀具磨损状态。
针对现有技术中存在的问题,本发明提出一种基于多源异构数据融合的刀具状态识别方法,来有效识别刀具磨损状态。
本发明的目的通过以下技术方案实现。
基于多源异构数据融合的机床铣刀状态识别方法,步骤包括:S1、基于压缩感知与加噪处理的数据预处理方法;S2、基于Dropout方法的堆栈稀疏自编码器;S3、基于改进D-S证据理论的数据融合算法;S4、建立基于SSAE(堆叠稀疏自编码器)与改进D-S证据理论的刀具状态监测模型;S5、试验验证。本发明所提出的模型与算法能够准确反映多品种小批量航天企业生产线机床刀具状态。
根据本发明:步骤S1包括如下子步骤:
建立机床刀具磨损多源信号压缩感知模型,
对数据进行加噪处理:
根据本发明:步骤S2包括如下子步骤:
建立稀疏自编码器的总体代价函数模型,计算公式:
建立softmax分类器输出概率模型:
根据本发明:步骤S5包括如下子步骤:
数据采集,
参数确定,
对试验结果进行分析,
将试验方法与其他方法进行对比。
具体来说,本发明提供一种基于多源异构数据融合的机床铣刀状态识别方法,包括以下步骤:
S1:基于压缩感知与加噪处理的数据预处理方法;
S2:基于Dropout方法的堆栈稀疏自编码器;
S3:基于改进D-S证据理论的数据融合算法;
S4:基于SSAE与改进D-S证据理论的刀具状态监测模型;
S5:验证本发明所提方法的实用性,在生产线的自动化监控平台中获取生产线状态数据进行试验验证。
进一步,上述基于多源异构数据融合的机床铣刀状态识别方法中,步骤S1包括以下子步骤:
S11:建立机床刀具磨损多源信号压缩感知模型;
S12:对每组刀具磨损数据训练样本中加入不同程度的随机高斯噪声。
进一步,上述基于多源异构数据融合的机床铣刀状态识别方法中,步骤S2包括下子步骤:
S21:计算稀疏自编码器的总体代价函数;
S22:基于Dropout方法通过随机减少隐藏层的部分连接权值,有效地减少网络训练过程中的过拟合问题,迫使网络学习更鲁棒的特征;
S23:通过无监督学习结合有监督学习的方法,有效地提取数据深层特征;
S24:通过优化算法求得最优的参数得到softmax分类模型。
进一步,上述基于多源异构数据融合的机床铣刀状态识别方法中,步骤S3包括以下子步骤:
S31:确定其满足条件:
m(φ)=0
S32:建立在同一个辨识框架Θ下事件A的合成概率及其平均支持度q(A)的数学模型:
S33:在步骤S32的基础上建立事件A的组合BPA模型:
m(A)=p(A)+k×ε×q(A),A≠φ,X
将k定义为:
进一步,上述基于多源异构数据融合的机床铣刀状态识别方法中,步骤S4包括以下子步骤:
S41:从某航天企业多品种小批量生产线的自动化监控平台中获取包含刀具状态信息的多源异构数据,如切削力信号、振动信号、声信号等;
S42:对原始的多源异构数据进行简单预处理,包括缺失值处理、无用特征删除、平衡化处理;
S43:对经过简单预处理的数据进行压缩感知处理;之后,随机取80%样本作为训练样本并进行加噪处理,增加训练样本数量,剩余的20%样本作为测试样本;最后将所有数据归一化到[0,1]范围内;
S44:初始化深度神经网络的参数及Dropout参数,设置最低加工产品质量合格率阈值,输入训练样本,逐层训练,最小化代价函数,得到最优权重和偏置,提取低维特征,然后不断更新Dropout参数,继续训练稀疏自编码器和softmax分类器,完成初步训练;
S45:基于得到的最优权重和偏置利用反向传播算法反向微调整个网络,得到最优权重和偏置并保存;
S46:将测试样本数据输入训练好的网络,得到识别结果;
S47:基于网络的识别结果利用改进D-S证据理论方法进行决策层的融合,合成最终的识别结果。
进一步,上述基于多源异构数据融合的机床铣刀状态识别方法中,步骤S5包括以下子步骤:
S51:数据采集;
S52:通过实验获取参数并确定;
S53:试验结果分析;
S54:将试验方法与人工提取特征方法、SSAE、CNN和RNN进行对比。
进一步,上述基于多源异构数据融合的机床铣刀状态识别方法中,步骤S11包括以下子步骤:
步骤1:建立非欠采样刀具磨损信号xN×1的数学模型,计算公式:
xN×1=ψN×N·SN×1
步骤2:将采样过程转化为矩阵乘积形式:
cM×1=ΦM×N·xN×1
式中,ΦM×N=[φ1,φ2,…,φN]是M×N的观测矩阵
步骤3:根据步骤1和步骤2求解在正交基矩阵下的机床刀具磨损信号的稀疏表示方程组:
s.t.cM×1=ΦM×N·ψN×N·sN×1
式中,由于M<<N,则可知式子求解问题为一个欠定问题,即拥有无穷多个解的NP-hard问题,无法重构出原信号,
步骤4:通过→求解最优l1范数得到重构后的稀疏信号的解为:
式中,前一项为误差项,用于控制求解结果的幅值精度,其占比越高精度越高,后一项为正则化项,用于控制求解结果稀疏度,λ为正则化参数,主要是用来平衡误差和稀疏度的因子。
进一步,上述基于多源异构数据融合的机床铣刀状态识别方法中,步骤S12具体方法如下:对每组刀具磨损数据训练样本c1(t)中加入R种不同程度的随机高斯噪声:
进一步,上述基于多源异构数据融合的机床铣刀状态识别方法中,步骤S21包括以下子步骤:
步骤1:假设存在一个无标签的刀具状态的多源异构样本集x={x1,x2,x3,…,xn},编码器利用编码函数fθ将多源异构的样本集x转换为编码矢量a:
a=f(W1x+b1)
步骤2:利用解码函数gθ将特征向量a进行反向的变换为y={y1,y2,y3,…,yn}:
y=g(W2a+b2)
步骤3:对隐藏节点施加稀疏性约束:
其中,为n个训练样本下第j个隐藏层神经元的平均激活度,/>代表了样本x(i)输入时第j个隐藏层神经元的激活程度;
步骤4:对于训练集,为了避免学***均激活量设置为0或接近0,因此,增加了一个额外的惩罚项:
式中,s2为隐藏层的神经元个数,ρ为稀疏性参数,由公式可知,隐藏层的每一个神经元以稀疏性参数ρ与平均激活度的相对熵来衡量两个分布的差异,当ρ与/>之间的差异越大,其值越大,两个分布的差异越大;
步骤5:综合步骤1、2、3、4,稀疏自编码器的总体代价函数为:
式中,第一项为自编码器的代价损失函数,第二项为稀疏惩罚因子项,β为稀疏惩罚因子的权重系数,用于控制重构项和惩罚项之间的相对性,
式中第一项为整个数据集的重构误差,第二项为正则化权重惩罚项,其目的是减小权重幅度来防止过拟合,λ表示权重衰减参数,ml表示网络层数,sl、sl+1表示第l层、第l+1层的神经元节点个数,是第l层的第j个神经元与第l+1层的第i个神经元之间的权重。
进一步,上述基于多源异构数据融合的机床铣刀状态识别方法中,步骤S24具体方法如下:对k种分类的m个训练样本构成的训练数据集,其分类器输出概率为:
进一步,上述基于多源异构数据融合的机床铣刀状态识别方法中,步骤S31的具体步骤为:
步骤1:确定证据可信度的数学模型:
步骤2:在步骤1的基础上,建立未知事件X的组合BPA数学模型:
m(X)=p(X)+k×ε×q(X)+k×(1-ε)。
有益效果:
针对多品种小批量航天企业工艺复杂不确定、产品结构复杂不确定、信息复杂不确定和突发情况复杂不确定导致刀具利用率低、生产稳定性较差等问题,提出一种基于多源异构数据融合的机床刀具状态识别方法,利用压缩感知方法对多源数据进行压缩以平衡样本和提高样本稀疏性,并对压缩数据添加随机高斯噪声以提高网络的鲁棒性;构建基于改进D-S证据理论与Dropout方法的堆栈稀疏自编码器网络,利用无监督学习结合有监督学习同时引入Dropout的方法训练网络,解决深度学习网络的过拟合与小样本多源异构数据的识别精度问题。
本发明针对多品种小批量生产线柔性混流加工、多工艺交叉并行导致刀具磨损数据集样本小、多源异构、欠采样,进而导致刀具状态识别难、精度低问题,提出一种基于多源异构数据融合的机床铣刀状态识别方法,利用压缩感知方法对多源数据进行压缩以平衡样本和提高样本稀疏性,并对压缩数据添加随机高斯噪声以提高网络的鲁棒性;在此基础上,构建基于改进D-S证据理论与Dropout方法的堆栈稀疏自编码器网络,利用无监督学习结合有监督学习同时引入Dropout的方法训练网络,解决深度学习网络的过拟合与小样本多源异构数据的识别精度低的问题。最后,以某航天企业生产线为例进行生产线机床刀具状态识别,与人工特征提取方法和SSAE方法对比,具有更好的识别精度与泛化性能。识别结果表明,该模型与方法能够准确反映多品种小批量航天企业生产线机床铣刀状态。
附图说明
图1为本发明原始信号的压缩感知线性测量过程图。
图2为本发明自编码器结构图。
图3为本发明标准网络和带Dropout网络比较图。
图4为本发明2层堆栈稀疏自编码器结构图。
图5为本发明生产线状态识别整体框架图。
图6为本发明车间生产线零件、生产车间现场、生产线上的部分设备图。
图7为本发明生产车间的自动化监控平台图。
图8(a)-图8(c)分别为本发明新刀功率、切削力与振动信号信号图。
图9为本发明不同测量长度下的误差图。
图10(a)-10(f)为本发明网络各参数对识别准确率的影响图。
图11(a)和11(b)为本发明深度神经网络的训练与测试的识别准确率与损失函数值图。
图12(a)-12(c)为本发明提取特征的散点图。
具体实施方式
下面结合附图及实施例,对本发明进行进一步详细说明,但应当理解实施例用以解释本发明,并不用于限制本发明。
非欠采样刀具磨损信号可以表示为:
xN×1=ψN×N·sN×1
将采样过程转化为矩阵乘积形式:
cM×1=ΦM×N·xN×1
求解在正交基矩阵下的机床刀具磨损信号的稀疏表示方程组:
s.t.cM×1=ΦM×N·ψN×N·sN×1
在某个正交基矩阵ψN×N上xN×1是稀疏的条件下,若ΦM×N满足约束等距条件,可通过求解最优l1范数得到重构后的稀疏信号的解为:
如图1为原始信号的压缩感知线性测量过程,求得生产线欠采样状态信号的稀疏表示后,将其代入式中即可实现生产线非欠采样状态信号的重构。
为了提高网络的鲁棒性,降低网络对刀具磨损数据干扰的敏感性,需要提前对每组刀具磨损数据训练样本c1(t)中加入R种不同程度的随机高斯噪声:
添加噪声后,将每组机床刀具磨损数据的样本数量展开为R+1组样本
自编码器基本网络结构如图2所示。自编码器是通过网络重构输入数据,实现无监督特征提取和参数学习的网络。从输入层到隐藏层的转换过程是编码过程,作用为从输入数据中提取特征信息。从隐藏层到输出层的转换过程是解码过程,作用为将特征信息重构为输入数据。
假设存在一个无标签的刀具状态的多源异构样本集x={x1,x2,x3,…,xn},编码器利用编码函数fθ将多源异构的样本集x转换为编码矢量a。
a=f(W1x+b1)
解码器利用解码函数gθ将特征向量a进行反向的变换为y={y1,y2,y3,…,yn}。
y=g(W2a+b2)
对隐藏节点施加稀疏性约束,计算公式:
对于训练集,为了避免学***均激活量设置为0或接近0。因此,增加了一个额外的惩罚项:
稀疏自编码器的总体代价函数为:
如图3随机迫使一部分隐藏层神经元停止工作,整个网络的结构已然不同,Dropout方法通过随机减少隐藏层的部分连接权值,可以有效地减少网络训练过程中的过拟合问题,迫使网络学习更鲁棒的特征。
堆栈稀疏自编码器是将稀疏自编码器的输出层去掉,仅保留编码部分,以该编码部分提取的特征数据作为下一个稀疏自编码器的输入,利用同样的方法连接多个稀疏自编码器,从而提取更高维的特征信息,图4为2层堆栈稀疏自编码器结构图。
假设训练集为{(x(1),y(1)),(x(2),y(2)),…,(x(n),y(n))},x(i)为样本数据,y(i)为样本标签,则对k种分类的m个训练样本构成的训练数据集,其分类器输出概率为:
基于通过改进Yager对D-S证据理论进行改进的改进D-S证据理论。设事件A的辨识框架Θ,其对应的证据体为F,若函数m,2Θ→[0,1],其满足条件:
m(φ)=0
在同一个辨识框架Θ下事件A的合成概率及其平均支持度q(A)为:
在此基础上,事件A的组合BPA为
m(A)=p(A)+k×ε×q(A),A≠φ,X
k为归一化常数,即冲突因子,表示各证据之间的冲突程度,定义为
证据可信度ε,即证据的可信程度,可表示为:
n为证据的个数,kij代表证据Fi和证据Fj之间的冲突,可表示为:
考虑到冲突无法判定,引入未知事件X,将冲突赋给未知事件X,则未知事件X的组合BPA为:
m(X)=p(X)+k×ε×q(X)+k×(1-ε)
本发明充分发挥深度学习的优势,结合压缩感知技术与改进D-S证据理论,提出一套有效的多品种小批量航天企业生产线机床刀具状态监测方法,该方法的整体框架如图5所示,具体算法步骤如下:
步骤1:从某航天企业多品种小批量生产线的自动化监控平台中获取包含刀具状态信息的多源异构数据,如切削力信号、振动信号、声信号等。
步骤2:对原始的多源异构数据进行简单预处理,包括缺失值处理、无用特征删除、平衡化处理。
步骤3:对经过简单预处理的数据进行压缩感知处理;之后,随机取80%样本作为训练样本并进行加噪处理,增加训练样本数量,剩余的20%样本作为测试样本;最后将所有数据归一化到[0,1]范围内。
步骤4:初始化深度神经网络的参数及Dropout参数,设置最低加工产品质量合格率阈值,输入训练样本,逐层训练,最小化代价函数,得到最优权重和偏置,提取低维特征。然后不断更新Dropout参数,继续训练稀疏自编码器和softmax分类器,完成初步训练。
步骤5:基于得到的最优权重和偏置利用反向传播算法反向微调整个网络,得到最优权重和偏置并保存。
将测试样本数据输入训练好的网络,得到识别结果。
基于网络的识别结果利用改进D-S证据理论方法进行决策层的融合,合成最终的识别结果。
如图6所示,某航天企业主要生产固定架、外壳类、引信座、伺服机构旋转框架、通道体类、油缸体类、天线主腔体类、机座等8种复杂航天构件,零件精密复杂,加工工艺复杂,涉及的加工设备种类多,作业繁琐,生产状况复杂。生产线由立式加工中心、数控立式铣加工中心、钻铣加工中心、数控车削中心、数控车床、精密数控车床、卧式数控车床、坐标镗铣加工中心等76个设备组成
如图7为该多品种小批量航天企业生产线采用国内某公司的自动化监控平台,该自动化监控平台提供了很全面的车间监控功能,可以有效的对生产线及设备的状态监控,且有效的信息可视化生产线现行状态。该监控平台具有车间级与单位级的信息化监控,可进行自动与手动切换的控制生产线上的任意单位设备,并且对刀具有良好的管理。
如图8(a)-图8(c)本发明获取了加工中利用德国马豪1600S双加工立卧加工中心应用球头硬质合金铣刀(三刀)加工蠕墨铸铁部分的数据,获取的数据为恒定的铣削过程时,采集机床主轴功率信号、产品加工合格率、切削力信号、振动信号、声发射信号等多源异构数据,共获得400个样本。
如图9所示,根据重构误差趋势图,取测量长度为M=500。在所有样本经过压缩感知重采样之后,每个样本的数据点数均压缩至500点,随机取50%样本作为训练数据,并对训练数据添加3中不同的随机高斯噪声,噪声强度系数k=0.1,训练样本数量扩充3倍。
SSAE通过不断增加隐藏层层数来增加网络的深度,从而提取更深层的特征,在其它条件保持不变的情况下,不同层数的SSAE对信号识别准确率也不同(如图10(a)所示)。同理,学习率、稀疏参数、权值惩罚参数、稀疏权重惩罚参数和Dropout参数在其它条件保持不变的情况下的实验结果如图10(b)、10(c)、10(d)、10(e)、10(f)所示。
其他网络参数设置如表1所示
表1其他网络参数设置
网络超参数设置完毕,并设定重构误差稳定时程序提前停止运行,将训练集输入到深度神经网络中进行训练,训练完毕保存最优权重和偏置,输入测试集验证稀疏自编码器的性能。经过反复试验,所得到的实验结果如图11(a)、11(b)所示。
设生产线状态空间为辨识框架:Θ={刀具初期磨损且机床正常A1,刀具中期磨损且机床正常A2,刀具严重磨损且机床正常A3,刀具破损且机床正常A4,机床异常A5},证据体为各种数据的识别结果,求解各证据体的基本概率分配函数并根据改进D-S证据理论融合规则得到融合后的信任度,最后根据最大信任函数的规则进行最终决策,最终决策结果如表2所示。
表2基于D-S证据理论的生产线状态识别方法决策层融合结果
通过改进D-S证据理论的决策层融合后5种状态下的800个训练样本的识别准确率达到94.87%,200个测试样本的识别准确率也达到了99%,充分验证了基于改进D-S证据理论的深度学习识别模型在融合多源数据对生产线状态决策方面的有效性,其有效率利用多源信号中包含的不同形式下的生产线状态信息,充分发挥各信号的的优点,互相互补,实现多源信号的有效融合,达到对生产线状态监测的预期目标。
为了验证本发明提出方法的有效性,将其与人工提取特征方法、SSAE、CNN和RNN进行对比。人工特征提取方法共提取10个特征,包括最大值、均方根值、歪度值、峭度值、波形指标、脉冲指标、歪度指标、峰值指标、裕度指标、峭度指标。将10个特征输入SVM中,惩罚因子设置为3,核函数采用RBF,核函数参数设置为1;CNN与RNN方法设置学***均值作为比较的指标。各方法的识别效果如表3所示。
表3不同算法的训练测试识别精度与训练用时
为了验证所提方法的特征提取能力,利用主成分分析(PCA)分别对本发明所提方法、人工特征提取方法和SSAE方法提取前三个主成分分量,并进行可视化,如图12(a)-12(b)所示。从图中可以看出,利用人工提取特征方法和SSAE方法很难将5种状态的特征区分开,且所提取的特征交叉到了一起,无法识别。而本发明所提出的方法很好的将同一状态的特征聚集在一起,且不同的状态都很有效的分开,充分体现了本发明所提方法的特征提取能力。
综上所述,本发明提出的基于多源异构数据融合的航天企业生产线状态识别方法,与直接使用堆栈稀疏自编码器的识别方法相比,本发明所提的方法识别精度更高。对比人工特征提取方法与堆栈稀疏自编码器,本发明所提方法特征提取能力更强。与传统的生产线状态识别方法相比,本发明所提方法更加智能,能够自适应的提取生产线状态信号中蕴含的有效信息,摆脱了对大量数据处理知识与先验知识的依赖,并提高了生产线状态识别的精度与可靠性,并具有更好的泛化能力与可靠性。
以上所述为本发明的优选实施例,并不用于限制本发明,本发明所属领域的技术人员依然可以对上述技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。

Claims (7)

1.一种基于多源异构数据融合的机床铣刀状态识别方法,其特征在于,包括以下步骤:
S1:基于压缩感知与加噪处理进行数据预处理,
步骤S1包括以下子步骤:
S11:建立机床刀具磨损多源信号压缩感知模型;
S12:对每组刀具磨损数据训练样本中加入不同程度的随机高斯噪声,
步骤S11包括以下子步骤:
步骤1:建立非欠采样刀具磨损信号xN×1的数学模型,计算公式:
xN×1=ψN×N·SN×1
步骤2:将采样过程转化为矩阵乘积形式:
cM×1=ΦM×N·xN×1
式中,ΦM×N=[φ1,φ2,…,φN]是M×N的观测矩阵,
步骤3:根据步骤1和步骤2求解在正交基矩阵下的机床刀具磨损信号的稀疏表示方程组:
式中,由于M<<N,则可知式子求解问题为一个欠定问题,即拥有无穷多个解的NP-hard问题,无法重构出原信号,
步骤4:通过求解最优l1范数得到重构后的稀疏信号的解为:
式中,前一项为误差项,用于控制求解结果的幅值精度,其占比越高精度越高,后一项为正则化项,用于控制求解结果稀疏度,λ为正则化参数,用来平衡误差和稀疏度的因子;
S2:构建基于Dropout方法的堆栈稀疏自编码器;
S3:建立基于改进D-S证据理论的数据融合算法,
步骤S3包括以下子步骤:
S31:确定函数m满足条件:
m(φ)=0
S32:建立在同一个辨识框架Θ下事件A的合成概率及其平均支持度q(A)的数学模型:
S33:在步骤S32的基础上建立事件A的组合BPA模型:
m(A)=p(A)+k×ε×q(A),A≠φ,ε为证据可信度,表示为:
其中:
S4:构建基于堆栈稀疏自编码器与改进D-S证据理论的刀具状态监测模型,
步骤S4包括以下子步骤:
S41:从某航天企业多品种小批量生产线的自动化监控平台中获取包含刀具状态信息的多源异构数据,包括切削力信号、振动信号、声信号;
S42:对原始的多源异构数据进行简单预处理,包括缺失值处理、无用特征删除、平衡化处理;
S43:对经过简单预处理的数据进行压缩感知处理;之后,随机取80%样本作为训练样本并进行加噪处理,增加训练样本数量,剩余的20%样本作为测试样本;最后将所有数据归一化到[0,1]范围内;
S44:初始化深度神经网络的参数及Dropout参数,设置最低加工产品质量合格率阈值,输入训练样本,逐层训练,最小化代价函数,得到最优权重和偏置,提取低维特征,然后不断更新Dropout参数,继续训练稀疏自编码器和softmax分类器,完成初步训练;
S45:基于得到的最优权重和偏置利用反向传播算法反向微调整个网络,得到最优权重和偏置并保存;
S46:将测试样本数据输入训练好的网络,得到识别结果;
S47:基于网络的识别结果利用改进D-S证据理论方法进行决策层的融合,合成最终的识别结果;
S5:在生产线的自动化监控平台中获取生产线状态数据进行试验验证。
2.如权利要求1所述的基于多源异构数据融合的机床铣刀状态识别方法,其特征在于,步骤S2包括以下子步骤:
S21:计算稀疏自编码器的总体代价函数;
S22:基于Dropout方法通过随机减少隐藏层的部分连接权值,有效地减少网络训练过程中的过拟合问题,迫使网络学习更鲁棒的特征;
S23:通过无监督学习结合有监督学习的方法,有效地提取数据深层特征;
S24:通过优化算法求得最优的参数得到softmax分类模型。
3.如权利要求1所述的基于多源异构数据融合的机床铣刀状态识别方法,其特征在于,步骤S5包括以下子步骤:
S51:数据采集;
S52:通过实验获取参数并确定;
S53:试验结果分析;
S54:将试验方法与人工提取特征方法、SSAE、CNN和RNN进行对比。
4.如权利要求1所述的基于多源异构数据融合的机床铣刀状态识别方法,其特征在于,步骤S12具体方法如下:对每组刀具磨损数据训练样本c1(t)中加入R种不同程度的随机高斯噪声:
5.如权利要求2所述的基于多源异构数据融合的机床铣刀状态识别方法,其特征在于,步骤S21包括以下子步骤:
步骤1:假设存在一个无标签的刀具状态的多源异构样本集x={x1,x2,x3,…,xn},编码器利用编码函数fθ将多源异构的样本集x转换为编码矢量a:
a=fθ(W1x+b1)
步骤2:利用解码函数gθ将特征向量a进行反向的变换为y={y1,y2,y3,…,yn}:
y=gθ(W2a+b2)
步骤3:对隐藏节点施加稀疏性约束:
其中,为m个训练样本下第j个隐藏层神经元的平均激活度,/>代表了样本x(i)输入时第j个隐藏层神经元的激活程度;
步骤4:对于训练集,为了避免学***均激活量设置为0或接近0,因此,增加了一个额外的惩罚项:
式中,s2为隐藏层的神经元个数,ρ为稀疏性参数,由公式可知,隐藏层的每一个神经元以稀疏性参数ρ与平均激活度的相对熵来衡量两个分布的差异,当ρ与/>之间的差异越大,其值越大,两个分布的差异越大;
步骤5:综合步骤1、2、3、4,稀疏自编码器的总体代价函数为:
式中,第一项为自编码器的代价损失函数,第二项为稀疏惩罚因子项,β为稀疏惩罚因子的权重系数,用于控制重构项和惩罚项之间的相对性,
式中第一项为整个数据集的重构误差,第二项为正则化权重惩罚项,其目的是减小权重幅度来防止过拟合,λ表示权重衰减参数,mi表示网络层数,sl、sl+1表示第l层、第l+1层的神经元节点个数,是第l层的第j个神经元与第l+1层的第i个神经元之间的权重。
6.如权利要求2所述的基于多源异构数据融合的机床铣刀状态识别方法,其特征在于,步骤S24具体方法如下:对k种分类的m个训练样本构成的训练数据集,其分类器输出概率为:
7.如权利要求1所述的基于多源异构数据融合的机床铣刀状态识别方法,其特征在于,步骤S31的具体步骤为:
步骤1:确定证据可信度的数学模型:
步骤2:在步骤1的基础上,建立未知事件X的组合BPA数学模型:
m(X)=p(X)+k×ε×q(X)+k×(1-ε)。
CN202110935063.6A 2021-08-16 2021-08-16 一种基于多源异构数据融合的机床铣刀状态识别方法 Active CN113627544B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110935063.6A CN113627544B (zh) 2021-08-16 2021-08-16 一种基于多源异构数据融合的机床铣刀状态识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110935063.6A CN113627544B (zh) 2021-08-16 2021-08-16 一种基于多源异构数据融合的机床铣刀状态识别方法

Publications (2)

Publication Number Publication Date
CN113627544A CN113627544A (zh) 2021-11-09
CN113627544B true CN113627544B (zh) 2024-03-08

Family

ID=78385498

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110935063.6A Active CN113627544B (zh) 2021-08-16 2021-08-16 一种基于多源异构数据融合的机床铣刀状态识别方法

Country Status (1)

Country Link
CN (1) CN113627544B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116204850B (zh) * 2023-03-14 2023-11-03 匀熵智能科技(无锡)有限公司 基于动态梯度和多视图协同注意力的多模态情感分析方法
CN117226600A (zh) * 2023-11-14 2023-12-15 四川工程职业技术学院 一种合金铣削中刀具磨损预测方法、装置、介质及设备
CN117961645B (zh) * 2024-03-29 2024-05-28 中国矿业大学 一种面向小样本噪声数据的刀具磨损软测量方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106559744A (zh) * 2016-11-24 2017-04-05 湖北文理学院 一种基于稀疏识别与压缩感知的体域网节能方法
CN107016241A (zh) * 2017-04-05 2017-08-04 重庆交通大学 基于加噪样本增强深度自编码学习网络的旋转机械寿命阶段识别方法
CN108764064A (zh) * 2018-05-07 2018-11-06 西北工业大学 基于导向滤波器与自编码器的sar目标识别算法
CN110070118A (zh) * 2019-04-10 2019-07-30 广东电网有限责任公司 一种多时空数据融合方法
CN112329855A (zh) * 2020-11-05 2021-02-05 华侨大学 基于自适应字典的欠定工作模态参数识别方法及检测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210197335A1 (en) * 2019-12-26 2021-07-01 Dalian University Of Technology Data Augmentation Method Based On Generative Adversarial Networks In Tool Condition Monitoring

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106559744A (zh) * 2016-11-24 2017-04-05 湖北文理学院 一种基于稀疏识别与压缩感知的体域网节能方法
CN107016241A (zh) * 2017-04-05 2017-08-04 重庆交通大学 基于加噪样本增强深度自编码学习网络的旋转机械寿命阶段识别方法
CN108764064A (zh) * 2018-05-07 2018-11-06 西北工业大学 基于导向滤波器与自编码器的sar目标识别算法
CN110070118A (zh) * 2019-04-10 2019-07-30 广东电网有限责任公司 一种多时空数据融合方法
CN112329855A (zh) * 2020-11-05 2021-02-05 华侨大学 基于自适应字典的欠定工作模态参数识别方法及检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Multi-source Log Comprehensive Feature Extraction Method Based on Restricted Boltzmann Machine in Power Information System;Donglan Liu 等;《2019 IEEE 11th International Conference on Communication Software and Networks》;20191231;第503-508页 *
基于深度学习的融合多源异构数据的推荐模型;冀振燕 等;《北京邮电大学学报》;20191231;第42卷(第6期);第35-42页 *

Also Published As

Publication number Publication date
CN113627544A (zh) 2021-11-09

Similar Documents

Publication Publication Date Title
CN113627544B (zh) 一种基于多源异构数据融合的机床铣刀状态识别方法
CN107877262B (zh) 一种基于深度学习的数控机床刀具磨损监测方法
CN113255848B (zh) 基于大数据学习的水轮机空化声信号辨识方法
Yang et al. Combined wireless network intrusion detection model based on deep learning
CN113664612A (zh) 一种基于深度卷积神经网络的数控机床铣削刀具磨损实时监测方法
CN110297469B (zh) 基于重采样的集成特征选择算法的生产线故障判断方法
CN112529341A (zh) 一种基于朴素贝叶斯算法的钻井漏失机率预测方法
DE112020003909T5 (de) Verfahren zum multimodalen abrufen bzw. wiedergewinnen und clustern unter verwendung einer tiefen cca und aktiver paarweiser abfragen
CN111126255A (zh) 基于深度学习回归算法的数控机床刀具磨损值预测方法
CN113798920A (zh) 一种基于变分自动编码器与极限学习机的刀具磨损状态监测方法
CN115062272A (zh) 一种水质监测数据异常识别及预警方法
CN113485244A (zh) 一种基于刀具磨损预测的数控机床控制***及其方法
CN113052271A (zh) 基于深度神经网络的生物发酵数据预测方法
Oberle et al. A use case to implement machine learning for life time prediction of manufacturing tools
Xie et al. Tool condition prognostic model based on digital twin system
CN115718861A (zh) 高耗能行业中用电用户的分类与异常行为监测方法及***
CN116398418A (zh) 核电循环水泵在线异常监测及辨识方法
CN113988178A (zh) 一种低压配电网窃电用户检测方法和装置
CN117131425A (zh) 一种基于反馈数据的数控机床加工状态监测方法及***
CN117236698A (zh) 基于图神经网络的产业链风险评估模型、方法及介质
CN115660221B (zh) 基于混合神经网络的油气藏经济可采储量评估方法及***
CN111275109A (zh) 基于自编码器的电力设备状态数据特征选优方法及***
Xiao et al. Deep learning based modeling for cutting energy consumed in CNC turning process
CN112884027B (zh) 一种基于模式识别的切削过程实时状态监测方法及装置
CN114926702A (zh) 一种基于深度注意力度量的小样本图像分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant