CN115238804A - 基于生成对抗网络的点焊数据填补方法、装置及存储介质 - Google Patents

基于生成对抗网络的点焊数据填补方法、装置及存储介质 Download PDF

Info

Publication number
CN115238804A
CN115238804A CN202210905128.7A CN202210905128A CN115238804A CN 115238804 A CN115238804 A CN 115238804A CN 202210905128 A CN202210905128 A CN 202210905128A CN 115238804 A CN115238804 A CN 115238804A
Authority
CN
China
Prior art keywords
data
spot welding
standard
probability
welding data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210905128.7A
Other languages
English (en)
Inventor
陶志宏
何锡焕
刘祝托
郑世卿
庄树祥
邹见效
凡时财
苌洋
曾诚
李玥峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Higher Research Institute Of University Of Electronic Science And Technology Shenzhen
GAC Honda Automobile Co Ltd
Original Assignee
Higher Research Institute Of University Of Electronic Science And Technology Shenzhen
GAC Honda Automobile Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Higher Research Institute Of University Of Electronic Science And Technology Shenzhen, GAC Honda Automobile Co Ltd filed Critical Higher Research Institute Of University Of Electronic Science And Technology Shenzhen
Priority to CN202210905128.7A priority Critical patent/CN115238804A/zh
Publication of CN115238804A publication Critical patent/CN115238804A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于生成对抗网络的点焊数据填补方法、装置及存储介质,方法包括获取标准点焊数据;计算与标准点焊数据对应的前向时间间隔矩阵和后向时间间隔矩阵;将标准点焊数据、前向时间间隔矩阵和后向时间间隔矩阵输入到生成对抗网络的生成器中,生成完整时序数据;根据生成对抗网络的判别器进行判别,得到数据真实概率;基于数据真实概率分别构建与生成器和判别器对应的损失函数,并进行迭代训练直至损失函数收敛,得到训练完成的生成器生成的最终点焊数据;根据最终点焊数据对标准点焊数据的缺失值进行填补得到完整标准数据,并对完整标准数据进行逆标准化,得到完整的点焊时序数据。本方法能提高点焊数据缺失值填补的准确率。

Description

基于生成对抗网络的点焊数据填补方法、装置及存储介质
技术领域
本发明涉及焊接技术领域,尤其涉及一种基于生成对抗网络的点焊数据填补方法、装置及存储介质。
背景技术
目前,对于点焊时序数据的缺失值,一般采用直接丢弃缺失样本的方法,或者采用均值填补、上一次的观测值填补等基于统计学的缺失值填补方法,或者采用基于机器学习的缺失值填补方法,直接对缺失数据进行填补。
但是,直接丢弃的方法减少了样本数量,带来了巨大的信息损失,不仅不利于对点焊工艺数据的监控,更不利于建立点焊质量评估模型。而基于统计学的填补方法计算量小,仅考虑数据的整体统计情况,没有考虑每个数据样本的个体情况,填补准确度较低。此外,基于机器学习的缺失值填补方法通常不能在考虑时序数据的时间规律的前提下,直接对缺失数据进行填补,而考虑了时间规律的直接填补方法也只利用了缺失值之前时刻的数据进行填补,没有考虑之后时刻的时序特征和缺失规律,数据利用不完全,填补准确度较低。
综上,现有技术中的点焊时序数据的缺失值填补方法对数据的利用不完全,导致填补准确度较低,不利于对点焊工艺数据的监控和建立点焊质量评估模型。
发明内容
本发明提供了一种基于生成对抗网络的点焊数据填补方法、装置及存储介质,以实现充分利用数据的时序信息和缺失特点,提高点焊数据缺失值填补的准确率,有利于对点焊工艺数据的监控和建立点焊质量评估模型。
第一方面,为了解决上述技术问题,本发明提供了一种基于生成对抗网络的点焊数据填补方法,包括:
获取点焊过程中的点焊时序数据,并对所述点焊时序数据进行标准化,得到标准点焊数据;
计算与所述标准点焊数据对应的前向时间间隔矩阵和后向时间间隔矩阵;
将所述标准点焊数据、所述前向时间间隔矩阵和所述后向时间间隔矩阵输入到生成对抗网络的生成器中,生成完整时序数据;
根据生成对抗网络的判别器进行判别,得到数据真实概率;
基于所述数据真实概率分别构建与所述生成器和所述判别器对应的损失函数,并进行迭代训练直至所述损失函数收敛,得到训练完成的生成器生成的最终点焊数据;
根据所述最终点焊数据对所述标准点焊数据的缺失值进行填补得到完整标准数据,并对所述完整标准数据进行逆标准化,得到完整的点焊时序数据。
优选地,所述计算与所述标准点焊数据对应的前向时间间隔矩阵和后向时间间隔矩阵,包括:
根据所述标准点焊数据计算掩膜矩阵中的各元素;
根据所述掩膜矩阵中的各元素计算得到所述前向时间间隔矩阵、所述后向时间间隔矩阵中的各元素;其中,所述后向时间间隔矩阵为所述前向时间间隔矩阵的转置矩阵。
优选地,所述将所述标准点焊数据、所述前向时间间隔矩阵和所述后向时间间隔矩阵输入到生成对抗网络的生成器中,生成完整时序数据,包括:
将所述标准点焊数据输入到所述生成器中的双向门控填充循环单元进行正向和后向传播,得到tN-1时刻的正向记忆向量和后向记忆向量;
将所述正向记忆向量和所述后向记忆向量拼接为tN-1时刻的双向记忆向量,并基于全连接神经网络将所述双向记忆向量映射为与所述标准点焊数据维度相同的中间向量;
将所述中间向量作为所述生成器中的单向门控填充循环单元的初始输入向量,并通过循环得到N个与所述标准点焊数据维度相同的输出向量;
将N个所述输出向量按照时间顺序拼接得到所述完整时序数据。
优选地,所述根据生成对抗网络的判别器进行判别,得到数据真实概率,包括:
计算所述完整时序数据与所述标准点焊数据之间的随机取样值;
将所述标准点焊数据、所述完整时序数据、所述随机取样值输入到生成对抗网络的判别器中,得到第一概率、第二概率和第三概率;其中,所述第一概率、所述第二概率、所述第三概率分别为所述标准点焊数据、所述完整时序数据、所述随机取样值对应的数据真实概率。
优选地,所述将所述标准点焊数据、所述完整时序数据、所述随机取样值输入到生成对抗网络的判别器中,得到第一概率、第二概率和第三概率,包括:
将所述标准点焊数据、所述完整时序数据、所述随机取样值输入到所述判别器中的双向门控填充循环单元进行正向和后向传播,分别得到tN-1时刻的正向判别记忆向量和后向判别记忆向量;
将所述正向判别记忆向量和所述后向判别记忆向量拼接为tN-1时刻的双向判别记忆向量;
基于全连接神经网络将所述双向判别记忆向量映射为一维向量,并采用sigma函数将所述一维向量限定为0到1,得到第一概率、第二概率和第三概率。
优选地,所述进行正向和后向传播的传播公式包括:
Figure BDA0003772036010000031
式中,
Figure BDA0003772036010000032
为衰减后的之前时刻的记忆向量;
Figure BDA0003772036010000033
为当前时刻的衰减因子;“·”代表矩阵点乘操作;
Figure BDA0003772036010000034
为之前时刻的记忆向量;
Figure BDA0003772036010000035
为更新门;σ是sigmoid函数;Wxz、Whz、Wxr、Whr、Wxh、Whh为权重参数;
Figure BDA0003772036010000036
为当前时刻输入;bz、br、bh为偏差参数;
Figure BDA0003772036010000041
为重置门;
Figure BDA0003772036010000042
为候选记忆向量;tanh为双曲正切函数;
Figure BDA0003772036010000043
为当前时刻的记忆向量。
优选地,所述损失函数包括判别器损失函数和生成器损失函数;其中,
所述判别器损失函数包括:
Figure BDA0003772036010000044
式中,λ为惩罚因子,x、
Figure BDA0003772036010000045
分别为所述标准点焊数据、所述完整时序数据、所述随机取样值,D(x)、
Figure BDA0003772036010000046
分别为所述第一概率、所述第二概率、所述第三概率;
所述生成器损失函数包括:
Figure BDA0003772036010000047
式中,ρ为重构损失函数的系数。
优选地,所述随机取样值的计算公式为:
Figure BDA0003772036010000048
其中,∈~U(0,1);x、
Figure BDA0003772036010000049
分别为所述标准点焊数据、所述完整时序数据、所述随机取样值。
第二方面,本发明提供了一种基于生成对抗网络的点焊数据填补装置,包括:
数据处理模块,用于获取点焊过程中的点焊时序数据,并对所述点焊时序数据进行标准化,得到标准点焊数据;
矩阵计算模块,用于计算与所述标准点焊数据对应的前向时间间隔矩阵和后向时间间隔矩阵;
数据生成模块,用于将所述标准点焊数据、所述前向时间间隔矩阵和所述后向时间间隔矩阵输入到生成对抗网络的生成器中,生成完整时序数据;
概率计算模块,用于根据生成对抗网络的判别器进行判别,得到数据真实概率;
迭代训练模块,用于基于所述数据真实概率分别构建与所述生成器和所述判别器对应的损失函数,并进行迭代训练直至所述损失函数收敛,得到训练完成的生成器生成的最终点焊数据;
数据填补模块,用于根据所述最终点焊数据对所述标准点焊数据的缺失值进行填补得到完整标准数据,并对所述完整标准数据进行逆标准化,得到完整的点焊时序数据。
第三方面,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行上述中任意一项所述的基于生成对抗网络的点焊数据填补方法。
相比于现有技术,本发明具有如下有益效果:
本发明提供的基于生成对抗网络的点焊数据填补方法,通过获取点焊过程中的点焊时序数据,并对所述点焊时序数据进行标准化,得到标准点焊数据;计算与所述标准点焊数据对应的前向时间间隔矩阵和后向时间间隔矩阵;将所述标准点焊数据、所述前向时间间隔矩阵和所述后向时间间隔矩阵输入到生成对抗网络的生成器中,生成完整时序数据;根据生成对抗网络的判别器对所述完整时序数据进行判别,得到数据真实概率;基于所述数据真实概率分别构建与所述生成器和所述判别器对应的损失函数,并进行迭代训练直至所述损失函数收敛,得到训练完成的生成器生成的最终点焊数据;根据所述最终点焊数据对所述标准点焊数据的缺失值进行填补得到完整标准数据,并对所述完整标准数据进行逆标准化,最终得到完整的点焊时序数据。
在本发明中,采用生成对抗网络的思想,生成器生成以假乱真的数据,判别器判别数据是生成器生成的还是原始数据,生成器和判别器相互对抗并共同增强,使得生成器生成符合原始数据分布的完整数据,并将其用于填补缺失值。相比于现有的缺失值填补方法,本发明充分利用了数据的时序信息和缺失特点,提高了点焊数据缺失值填补的准确率,有利于对点焊工艺数据的监控和建立点焊质量评估模型。
附图说明
图1是本发明第一实施例提供的基于生成对抗网络的点焊数据填补方法流程示意图;
图2是基于生成对抗网络的点焊数据填补方法的结构示意图;
图3是基于生成对抗网络的点焊数据填补方法的一种具体实施方式流程图;
图4是本发明第二实施例提供的基于生成对抗网络的点焊数据填补装置结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参照图1,本发明第一实施例提供了一种基于生成对抗网络的点焊数据填补方法,包括以下步骤:
S11,获取点焊过程中的点焊时序数据,并对所述点焊时序数据进行标准化,得到标准点焊数据;
S12,计算与所述标准点焊数据对应的前向时间间隔矩阵和后向时间间隔矩阵;
S13,将所述标准点焊数据、所述前向时间间隔矩阵和所述后向时间间隔矩阵输入到生成对抗网络的生成器中,生成完整时序数据;
S14,根据生成对抗网络的判别器进行判别,得到数据真实概率;
S15,基于所述数据真实概率分别构建与所述生成器和所述判别器对应的损失函数,并进行迭代训练直至所述损失函数收敛,得到训练完成的生成器生成的最终点焊数据;
S16,根据所述最终点焊数据对所述标准点焊数据的缺失值进行填补得到完整标准数据,并对所述完整标准数据进行逆标准化,得到完整的点焊时序数据。
在步骤S11中,首先获取点焊过程中的点焊时序数据。在具体实施中,采集点焊工作台中的d种点焊工艺数据,并根据时间排序得到点焊时序数据,一条被观测了N次的d维点焊时序数据y的表达式为:
Figure BDA0003772036010000071
其中,
Figure BDA0003772036010000072
为d维向量,ti为观测数据
Figure BDA0003772036010000073
的时间,
Figure BDA0003772036010000074
在时间yi观测到的第j个特征的点焊数据值。
然后,对点焊时序数据y中的缺失值先采用0值替代,并对点焊时序数据y进行标准化得到标准点焊数据x,标准化公式为:
Figure BDA0003772036010000075
其中,μ为y的平均值,σ为y的标准差。
在步骤S12中,计算与所述标准点焊数据对应的前向时间间隔矩阵和后向时间间隔矩阵,包括:
根据所述标准点焊数据计算掩膜矩阵中的各元素;
根据所述掩膜矩阵中的各元素计算得到所述前向时间间隔矩阵、所述后向时间间隔矩阵中的各元素;其中,所述后向时间间隔矩阵为所述前向时间间隔矩阵的转置矩阵。
具体地,先计算掩膜矩阵m中的各元素,计算式为:
Figure BDA0003772036010000076
式中,ti为观测数据
Figure BDA0003772036010000077
的时间,
Figure BDA0003772036010000078
表示标准点焊数据中的在时间ti观测到的第j个特征的点焊数据值;
再计算前向时间间隔矩阵δfor中的各元素,计算式为:
Figure BDA0003772036010000079
然后,计算后向时间间隔矩阵δback,计算式为:
Figure BDA0003772036010000081
在步骤S13中,将所述标准点焊数据、所述前向时间间隔矩阵和所述后向时间间隔矩阵输入到生成对抗网络的生成器中,生成完整时序数据,包括:
将所述标准点焊数据输入到所述生成器中的双向门控填充循环单元进行正向和后向传播,得到tN-1时刻的正向记忆向量和后向记忆向量;
将所述正向记忆向量和所述后向记忆向量拼接为tN-1时刻的双向记忆向量,并基于全连接神经网络将所述双向记忆向量映射为与所述标准点焊数据维度相同的中间向量;
将所述中间向量作为所述生成器中的单向门控填充循环单元的初始输入向量,并通过循环得到N个与所述标准点焊数据维度相同的输出向量;
将N个所述输出向量按照时间顺序拼接得到所述完整时序数据。
需要说明的是,生成器基于降噪自编码器的思想,由降噪编码器和降噪解码器组成,利用双向时间间隔矩阵对标准点焊数据进行编码映射为低维向量,再对低维向量进行解码,重构出完整时序数据。降噪编码器由单层双向的门控填充循环单元和一个全连接神经网络组成,降噪解码器由一个全连接神经网络和单层的门控填充循环单元组成,门控填充循环单元负责利用标准点焊数据的时间规律,对数据分布进行学习,全连接神经网络负责变换数据的维度,方便对数据进行操作。
生成器的降噪编码器中的双向的门控填充循环单元将加了噪声的有缺失的标准点焊数据分别进行正向和逆向的传播,通过门控对前一时刻和后一时刻的数据进行遗忘和选择记忆,记住需要长时间记忆的,忘记不重要的信息,记住时序数据信息的先后关系,同时利用双向时间间隔矩阵对有长时间缺失的维度的信息利用程度进行相应的衰减,缺失时间越长则利用程度越低,充分利用时序数据的正向和逆向的时间信息和缺失规律。
具体地,首先将标准点焊数据x添加噪声,将加了噪声的有缺失的标准点焊数据x,前向时间间隔矩阵δfor和后向时间间隔矩阵δback输入到生成器的双向门控填充循环单元进行正向和后向传播,传播更新的公式为:
Figure BDA0003772036010000091
式中,
Figure BDA0003772036010000092
为衰减后的之前时刻的记忆向量;
Figure BDA0003772036010000093
为当前时刻的衰减因子;“·”代表矩阵点乘操作;
Figure BDA0003772036010000094
为之前时刻的记忆向量;
Figure BDA0003772036010000095
为更新门;σ是sigmoid函数;Wxz、Whz、Wxr、Whr、Wxh、Whh为权重参数;
Figure BDA0003772036010000096
为当前时刻输入;bz、br、bh为偏差参数;
Figure BDA0003772036010000097
为重置门;
Figure BDA0003772036010000098
为候选记忆向量;tanh为双曲正切函数;
Figure BDA0003772036010000099
为当前时刻的记忆向量。
然后,得到
Figure BDA00037720360100000910
时刻的正向记忆向量和后向记忆向量,并将所述正向记忆向量和所述后向记忆向量拼接为tN-1时刻的双向记忆向量
Figure BDA00037720360100000911
接着,生成器中采用全连接神经网络将记忆向量
Figure BDA00037720360100000912
映射为低维向量z,采用全连接神经网络将低维向量z映射为与标准点焊数据维度相同的中间向量z’。
最后,循环阶段包括:生成器中的单向门控填充循环单元将中间向量z’作为其初始的输入,将得到的记忆向量输入到全连接神经网络中,得到与标准点焊数据维度相同的向量,并将其作为下一个门控填充单元的输入,最终得到N个与标准点焊数据维度相同的输出向量,将N个所述输出向量按照时间顺序拼接起来得到完整时序数据
Figure BDA00037720360100000913
在步骤S14中,根据生成对抗网络的判别器进行判别,得到数据真实概率,包括:
计算所述完整时序数据与所述标准点焊数据之间的随机取样值;
将所述标准点焊数据、所述完整时序数据、所述随机取样值输入到生成对抗网络的判别器中,得到第一概率、第二概率和第三概率;其中,所述第一概率、所述第二概率、所述第三概率分别为所述标准点焊数据、所述完整时序数据、所述随机取样值对应的数据真实概率。
其中,所述随机取样值的计算公式为:
Figure BDA0003772036010000101
式中,∈~U(0,1);x、
Figure BDA0003772036010000102
分别为所述标准点焊数据、所述完整时序数据、所述随机取样值。
具体地,将所述标准点焊数据、所述完整时序数据、所述随机取样值输入到所述判别器中的双向门控填充循环单元进行正向和后向传播,分别得到tN-1时刻的正向判别记忆向量和后向判别记忆向量;
将所述正向判别记忆向量和所述后向判别记忆向量拼接为tN-1时刻的双向判别记忆向量;
基于全连接神经网络将所述双向判别记忆向量映射为一维向量,并采用sigma函数将所述一维向量限定为0到1,得到第一概率、第二概率和第三概率。
需要说明的是,判别器由单层双向的门控填充循环单元和一个全连接神经网络组成,双向的门控填充循环单元充分利用缺失值前后的数据对数据分布进行学习,全连接神经网络负责将双向的门控填充循环单元的输出映射为一个概率值,判别器分别对标准点焊数据x、完整时序数据
Figure BDA0003772036010000103
随机取样值
Figure BDA0003772036010000104
进行判别,输出每个数据是真实数据的概率,概率值反应了数据是真实数据的可能程度。
在本实施例中,判别器中同样采用了双向的门控填充循环单元学习数据的正向和逆向的信息,进行正向和后向传播的传播公式与步骤S13中的相同,在此不再赘述。判别器充分利用数据过去和未来时刻的信息,学习上下文信息对数据分布进行学习,同时利用双向时间间隔矩阵对有长时间缺失的维度的信息利用程度进行相应的衰减,缺失时间越长则利用程度越低。判别器最终输出D(x)、
Figure BDA0003772036010000105
分别为所述第一概率、所述第二概率、所述第三概率。
在步骤S15中,基于所述数据真实概率分别构建与所述生成器和所述判别器对应的损失函数,并进行迭代训练直至所述损失函数收敛,得到训练完成的生成器生成的最终点焊数据,包括:
根据所述第一概率、所述第二概率和所述第三概率构建判别器的损失函数;
根据所述第二概率构建生成器的损失函数;
采用Adman优化梯度下降算法更新判别器和生成器中的网络参数直至所述损失函数收敛,采用训练完成的生成器生成最终点焊数据。
具体地,所述损失函数包括判别器损失函数和生成器损失函数。
其中,所述判别器损失函数包括:
Figure BDA0003772036010000111
式中,λ为惩罚因子,x、
Figure BDA0003772036010000112
分别为所述标准点焊数据、所述完整时序数据、所述随机取样值,D(x)、
Figure BDA0003772036010000113
分别为所述第一概率、所述第二概率、所述第三概率;
所述生成器损失函数包括:
Figure BDA0003772036010000114
式中,ρ为重构损失函数的系数。
需要说明的是,λ为惩罚因子,其根据梯度下降速度进行动态调整。当梯度下降较慢时,λ增大,确保训练效率,当梯度下降较快时,λ减小,确保训练效果,动态调整惩罚因子的梯度惩罚生成对抗网络确保了训练效果和效率,避免了梯度消失或者***等情况,保证了最终生成器的生成质量较高。
在迭代训练时,可以通过设置迭代次数或者损失阈值来判断损失函数是否收敛。例如,当损失函数的损失值小于预设的损失阈值时,判定损失函数收敛,生成器的训练完成,最后通过训练完成的生成器生成最终点焊数据。
在步骤S16中,根据所述最终点焊数据对所述标准点焊数据的缺失值进行填补得到完整标准数据,并对所述完整标准数据进行逆标准化,得到完整的点焊时序数据。
具体地,采用生成器中生成的最终点焊数据对缺失值进行填补得到完整标准数据,完整标准数据的填补公式为:
Figure BDA0003772036010000121
再对完整标准数据ximputed进行逆标准化,得到原始的完整的点焊时序数据yimputed,逆标准化公式为:
yimputed=ximputed·σ+μ
其中,μ为y的平均值,σ为y的标准差。
为了便于对本发明的理解,下面将对本发明的具体实施例做更进一步的描述。
示例性地,点焊过程中采集到了1762个焊点工艺参数数据,其中有1074个焊点都具有缺失值,每个焊点都采集到了其焊接过程中的动态电阻值、动态电流值与焊枪能量值,共3维数据,每维工艺数据都是42次观测次数。
本实施例采用直接对比方法和间接对比方法,将本方法与其他方法对比填补准确度。
其中,直接对比方法对完整的点焊数据进行人为缺失,并采用平均相对误差(MAPE)和均方误差(MSE)作为填补准确度的标准。
Figure BDA0003772036010000122
Figure BDA0003772036010000123
其中,yi代表原始的有缺失的数据,
Figure BDA0003772036010000125
代表填补后的完整的时序数据。
表1不同方法对不同缺失率下的缺失值填补后的MAPE结果表
Figure BDA0003772036010000124
Figure BDA0003772036010000131
表2不同方法对不同缺失率下的缺失值填补后的MSE结果表
Figure BDA0003772036010000132
如表1和表2所示,采用本发明的基于生成对抗网络的点焊时序数据缺失值填补方法对点焊时序数据的缺失值进行填补,MAPE和MSE都低于其他方法,取得了最优的填补效果。
其中,间接对比方法对有缺失的时序数据直接进行填补,通过分类器进行分类,采用AUC指标评价分类器的分类效果,间接评价缺失值填补准确率。AUC指标是ROC曲线下的面积。ROC曲线的横坐标是伪阳性率,是分类器判定为正样本却不是正样本的概率,即正负样本中判为正样本的概率;ROC曲线的纵坐标是真阳性率,是分类器判定为正样本也是正样本的概率,即正样本中判为正样本的概率。
表3不同方法对数据缺失值填补后采用不同分类器分类的AUC结果表
Figure BDA0003772036010000133
如表3所示,本发明提出的方法对点焊时序数据的缺失值进行填补后,在所有分类器下都取得了最高的AUC值,间接表明了本发明的点焊时序数据缺失值填补方法取得了最优填补效果。
综上,本发明提供的基于生成对抗网络的点焊数据填补方法,通过获取点焊过程中的点焊时序数据,并对所述点焊时序数据进行标准化,得到标准点焊数据;计算与所述标准点焊数据对应的前向时间间隔矩阵和后向时间间隔矩阵;将所述标准点焊数据、所述前向时间间隔矩阵和所述后向时间间隔矩阵输入到生成对抗网络的生成器中,生成完整时序数据;根据生成对抗网络的判别器对所述完整时序数据进行判别,得到数据真实概率;基于所述数据真实概率分别构建与所述生成器和所述判别器对应的损失函数,并进行迭代训练直至所述损失函数收敛,得到训练完成的生成器生成的最终点焊数据;根据所述最终点焊数据对所述标准点焊数据的缺失值进行填补得到完整标准数据,并对所述完整标准数据进行逆标准化,最终得到完整的点焊时序数据。
在本发明中,采用生成对抗网络的思想,生成器生成以假乱真的数据,判别器判别数据是生成器生成的还是原始数据,生成器和判别器相互对抗并共同增强,使得生成器生成符合原始数据分布的完整数据,并将其用于填补缺失值。相比于现有的缺失值填补方法,本发明充分利用了数据的时序信息和缺失特点,提高了点焊数据缺失值填补的准确率,有利于对点焊工艺数据的监控和建立点焊质量评估模型。
同时,本发明为构建焊点质量检测的人工智能***的提供了数据填补方法,可以降低员工作业的劳动强度、改善员工的作业环境,还可以改变汽车行业焊点质量检测完全依靠人工检查方式的技术格局,填补行业内的空白。
参照图4,本发明第二实施例提供了一种基于生成对抗网络的点焊数据填补装置,包括:
数据处理模块,用于获取点焊过程中的点焊时序数据,并对所述点焊时序数据进行标准化,得到标准点焊数据;
矩阵计算模块,用于计算与所述标准点焊数据对应的前向时间间隔矩阵和后向时间间隔矩阵;
数据生成模块,用于将所述标准点焊数据、所述前向时间间隔矩阵和所述后向时间间隔矩阵输入到生成对抗网络的生成器中,生成完整时序数据;
概率计算模块,用于根据生成对抗网络的判别器进行判别,得到数据真实概率;
迭代训练模块,用于基于所述数据真实概率分别构建与所述生成器和所述判别器对应的损失函数,并进行迭代训练直至所述损失函数收敛,得到训练完成的生成器生成的最终点焊数据;
数据填补模块,用于根据所述最终点焊数据对所述标准点焊数据的缺失值进行填补得到完整标准数据,并对所述完整标准数据进行逆标准化,得到完整的点焊时序数据。
优选地,所述矩阵计算模块包括:
元素计算单元,用于根据所述标准点焊数据计算掩膜矩阵中的各元素;
矩阵计算单元,用于根据所述掩膜矩阵中的各元素计算得到所述前向时间间隔矩阵、所述后向时间间隔矩阵中的各元素;其中,所述后向时间间隔矩阵为所述前向时间间隔矩阵的转置矩阵。
优选地,所述数据生成模块包括:
记忆向量单元,用于将所述标准点焊数据输入到所述生成器中的双向门控填充循环单元进行正向和后向传播,得到tN-1时刻的正向记忆向量和后向记忆向量;
中间向量单元,用于将所述正向记忆向量和所述后向记忆向量拼接为tN-1时刻的双向记忆向量,并基于全连接神经网络将所述双向记忆向量映射为与所述标准点焊数据维度相同的中间向量;
输出向量单元,用于将所述中间向量作为所述生成器中的单向门控填充循环单元的初始输入向量,并通过循环得到N个与所述标准点焊数据维度相同的输出向量;
数据生成单元,用于将N个所述输出向量按照时间顺序拼接得到所述完整时序数据。
优选地,所述概率计算模块包括:
取样值计算单元,用于计算所述完整时序数据与所述标准点焊数据之间的随机取样值;
概率计算单元,用于将所述标准点焊数据、所述完整时序数据、所述随机取样值输入到生成对抗网络的判别器中,得到第一概率、第二概率和第三概率;其中,所述第一概率、所述第二概率、所述第三概率分别为所述标准点焊数据、所述完整时序数据、所述随机取样值对应的数据真实概率。
优选地,所述概率计算单元包括:
记忆向量单元,用于将所述标准点焊数据、所述完整时序数据、所述随机取样值输入到所述判别器中的双向门控填充循环单元进行正向和后向传播,分别得到tN-1时刻的正向判别记忆向量和后向判别记忆向量;
双向向量单元,用于将所述正向判别记忆向量和所述后向判别记忆向量拼接为tN-1时刻的双向判别记忆向量;
概率输出单元,用于基于全连接神经网络将所述双向判别记忆向量映射为一维向量,并采用sigma函数将所述一维向量限定为0到1,得到第一概率、第二概率和第三概率。
需要说明的是,本发明实施例提供的一种基于生成对抗网络的点焊数据填补装置用于执行上述实施例的一种基于生成对抗网络的点焊数据填补方法的所有流程步骤,两者的工作原理和有益效果一一对应,因而不再赘述。
本发明实施例还提供了一种终端设备。该终端设备包括:处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,例如基于生成对抗网络的点焊数据填补程序。所述处理器执行所述计算机程序时实现上述各个基于生成对抗网络的点焊数据填补方法实施例中的步骤,例如图1所示的步骤S11。或者,所述处理器执行所述计算机程序时实现上述各装置实施例中各模块/单元的功能,例如数据填补模块。
示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器中,并由所述处理器执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述终端设备中的执行过程。
所述终端设备可以是桌上型计算机、笔记本、掌上电脑及智能平板等计算设备。所述终端设备可包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,上述部件仅仅是终端设备的示例,并不构成对终端设备的限定,可以包括比上述更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述终端设备的控制中心,利用各种接口和线路连接整个终端设备的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述终端设备的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
其中,所述终端设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步的详细说明,应当理解,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围。特别指出,对于本领域技术人员来说,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于生成对抗网络的点焊数据填补方法,其特征在于,包括:
获取点焊过程中的点焊时序数据,并对所述点焊时序数据进行标准化,得到标准点焊数据;
计算与所述标准点焊数据对应的前向时间间隔矩阵和后向时间间隔矩阵;
将所述标准点焊数据、所述前向时间间隔矩阵和所述后向时间间隔矩阵输入到生成对抗网络的生成器中,生成完整时序数据;
根据生成对抗网络的判别器进行判别,得到数据真实概率;
基于所述数据真实概率分别构建与所述生成器和所述判别器对应的损失函数,并进行迭代训练直至所述损失函数收敛,得到训练完成的生成器生成的最终点焊数据;
根据所述最终点焊数据对所述标准点焊数据的缺失值进行填补得到完整标准数据,并对所述完整标准数据进行逆标准化,得到完整的点焊时序数据。
2.根据权利要求1所述的基于生成对抗网络的点焊数据填补方法,其特征在于,所述计算与所述标准点焊数据对应的前向时间间隔矩阵和后向时间间隔矩阵,包括:
根据所述标准点焊数据计算掩膜矩阵中的各元素;
根据所述掩膜矩阵中的各元素计算得到所述前向时间间隔矩阵、所述后向时间间隔矩阵中的各元素;其中,所述后向时间间隔矩阵为所述前向时间间隔矩阵的转置矩阵。
3.根据权利要求1所述的基于生成对抗网络的点焊数据填补方法,其特征在于,所述将所述标准点焊数据、所述前向时间间隔矩阵和所述后向时间间隔矩阵输入到生成对抗网络的生成器中,生成完整时序数据,包括:
将所述标准点焊数据输入到所述生成器中的双向门控填充循环单元进行正向和后向传播,得到tN-1时刻的正向记忆向量和后向记忆向量;
将所述正向记忆向量和所述后向记忆向量拼接为tN-1时刻的双向记忆向量,并基于全连接神经网络将所述双向记忆向量映射为与所述标准点焊数据维度相同的中间向量;
将所述中间向量作为所述生成器中的单向门控填充循环单元的初始输入向量,并通过循环得到N个与所述标准点焊数据维度相同的输出向量;
将N个所述输出向量按照时间顺序拼接得到所述完整时序数据。
4.根据权利要求1所述的基于生成对抗网络的点焊数据填补方法,其特征在于,所述根据生成对抗网络的判别器进行判别,得到数据真实概率,包括:
计算所述完整时序数据与所述标准点焊数据之间的随机取样值;
将所述标准点焊数据、所述完整时序数据、所述随机取样值输入到生成对抗网络的判别器中,得到第一概率、第二概率和第三概率;其中,所述第一概率、所述第二概率、所述第三概率分别为所述标准点焊数据、所述完整时序数据、所述随机取样值对应的数据真实概率。
5.根据权利要求4所述的基于生成对抗网络的点焊数据填补方法,其特征在于,所述将所述标准点焊数据、所述完整时序数据、所述随机取样值输入到生成对抗网络的判别器中,得到第一概率、第二概率和第三概率,包括:
将所述标准点焊数据、所述完整时序数据、所述随机取样值输入到所述判别器中的双向门控填充循环单元进行正向和后向传播,分别得到tN-1时刻的正向判别记忆向量和后向判别记忆向量;
将所述正向判别记忆向量和所述后向判别记忆向量拼接为tN-1时刻的双向判别记忆向量;
基于全连接神经网络将所述双向判别记忆向量映射为一维向量,并采用sigma函数将所述一维向量限定为0到1,得到第一概率、第二概率和第三概率。
6.根据权利要求3或5所述的基于生成对抗网络的点焊数据填补方法,其特征在于,所述进行正向和后向传播的传播公式包括:
Figure FDA0003772033000000031
式中,
Figure FDA0003772033000000032
为衰减后的之前时刻的记忆向量;
Figure FDA0003772033000000033
为当前时刻的衰减因子;“·”代表矩阵点乘操作;
Figure FDA0003772033000000034
为之前时刻的记忆向量;
Figure FDA0003772033000000035
为更新门;σ是sigmoid函数;Wxz、Whz、Wxr、Whr、Wxh、Whh为权重参数;
Figure FDA0003772033000000036
为当前时刻输入;bz、br、bh为偏差参数;
Figure FDA0003772033000000037
为重置门;
Figure FDA0003772033000000038
为候选记忆向量;tanh为双曲正切函数;
Figure FDA0003772033000000039
为当前时刻的记忆向量。
7.根据权利要求4所述的基于生成对抗网络的点焊数据填补方法,其特征在于,所述损失函数包括判别器损失函数和生成器损失函数;其中,
所述判别器损失函数包括:
Figure FDA00037720330000000310
式中,λ为惩罚因子,x、
Figure FDA00037720330000000311
分别为所述标准点焊数据、所述完整时序数据、所述随机取样值,D(x)、
Figure FDA00037720330000000312
分别为所述第一概率、所述第二概率、所述第三概率;
所述生成器损失函数包括:
Figure FDA00037720330000000313
式中,ρ为重构损失函数的系数。
8.根据权利要求4所述的基于生成对抗网络的点焊数据填补方法,其特征在于,所述随机取样值的计算公式为:
Figure FDA00037720330000000314
其中,∈~U(0,1);x、
Figure FDA00037720330000000315
分别为所述标准点焊数据、所述完整时序数据、所述随机取样值。
9.一种基于生成对抗网络的点焊数据填补装置,其特征在于,包括:
数据处理模块,用于获取点焊过程中的点焊时序数据,并对所述点焊时序数据进行标准化,得到标准点焊数据;
矩阵计算模块,用于计算与所述标准点焊数据对应的前向时间间隔矩阵和后向时间间隔矩阵;
数据生成模块,用于将所述标准点焊数据、所述前向时间间隔矩阵和所述后向时间间隔矩阵输入到生成对抗网络的生成器中,生成完整时序数据;
概率计算模块,用于根据生成对抗网络的判别器进行判别,得到数据真实概率;
迭代训练模块,用于基于所述数据真实概率分别构建与所述生成器和所述判别器对应的损失函数,并进行迭代训练直至所述损失函数收敛,得到训练完成的生成器生成的最终点焊数据;
数据填补模块,用于根据所述最终点焊数据对所述标准点焊数据的缺失值进行填补得到完整标准数据,并对所述完整标准数据进行逆标准化,得到完整的点焊时序数据。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如权利要求1至8中任意一项所述的基于生成对抗网络的点焊数据填补方法。
CN202210905128.7A 2022-07-29 2022-07-29 基于生成对抗网络的点焊数据填补方法、装置及存储介质 Pending CN115238804A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210905128.7A CN115238804A (zh) 2022-07-29 2022-07-29 基于生成对抗网络的点焊数据填补方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210905128.7A CN115238804A (zh) 2022-07-29 2022-07-29 基于生成对抗网络的点焊数据填补方法、装置及存储介质

Publications (1)

Publication Number Publication Date
CN115238804A true CN115238804A (zh) 2022-10-25

Family

ID=83677429

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210905128.7A Pending CN115238804A (zh) 2022-07-29 2022-07-29 基于生成对抗网络的点焊数据填补方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN115238804A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115796235A (zh) * 2022-11-04 2023-03-14 上海艾莎医学科技有限公司 补充缺失数据的生成器模型训练方法和***
CN115952859A (zh) * 2023-03-01 2023-04-11 支付宝(杭州)信息技术有限公司 数据处理方法、装置及设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115796235A (zh) * 2022-11-04 2023-03-14 上海艾莎医学科技有限公司 补充缺失数据的生成器模型训练方法和***
CN115796235B (zh) * 2022-11-04 2023-06-06 上海艾莎医学科技有限公司 补充缺失数据的生成器模型训练方法和***
CN115952859A (zh) * 2023-03-01 2023-04-11 支付宝(杭州)信息技术有限公司 数据处理方法、装置及设备

Similar Documents

Publication Publication Date Title
CN106570464B (zh) 一种快速处理人脸遮挡的人脸识别方法及装置
CN115238804A (zh) 基于生成对抗网络的点焊数据填补方法、装置及存储介质
CN111352965B (zh) 序列挖掘模型的训练方法、序列数据的处理方法及设备
CN112529146B (zh) 神经网络模型训练的方法和装置
CN111027576B (zh) 基于协同显著性生成式对抗网络的协同显著性检测方法
CN110532880B (zh) 样本筛选及表情识别方法、神经网络、设备及存储介质
CN114120041B (zh) 一种基于双对抗变分自编码器的小样本分类方法
CN111310918B (zh) 一种数据处理方法、装置、计算机设备及存储介质
CN113128671B (zh) 一种基于多模态机器学习的服务需求动态预测方法及***
CN113704082A (zh) 模型评测方法、装置、电子设备及存储介质
CN114048468A (zh) 入侵检测的方法、入侵检测模型训练的方法、装置及介质
CN111488810A (zh) 人脸识别方法、装置、终端设备及计算机可读介质
CN116596095A (zh) 基于机器学习的碳排放量预测模型的训练方法及装置
WO2023019899A1 (zh) 神经网络实时剪枝方法、***及神经网络加速器
CN116758379B (zh) 一种图像处理方法、装置、设备及存储介质
CN112818774A (zh) 一种活体检测方法及装置
CN110855474B (zh) Kqi数据的网络特征提取方法、装置、设备及存储介质
CN114387524B (zh) 基于多层级二阶表征的小样本学习的图像识别方法和***
CN115954019A (zh) 一种融合自注意力和卷积操作的环境噪声识别方法及***
CN114519520A (zh) 模型评估方法、装置及存储介质
CN114116456A (zh) 测试用例生成方法、***及计算机可读存储介质
CN116959489B (zh) 语音模型的量化方法、装置、服务器及存储介质
CN116402116B (zh) 神经网络的剪枝方法、***、设备、介质及图像处理方法
CN116015787B (zh) 基于混合持续变分量子神经网络的网络入侵检测方法
CN115329968B (zh) 确定量子机器学***性的方法、***和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination