CN117972619A

CN117972619A - 一种基于联邦学习的钻孔数据故障诊断方法

Info

Publication number: CN117972619A
Application number: CN202410390477.9A
Authority: CN
Inventors: 焦新峰; 孔凡丽; 高鹏
Original assignee: Nanjing Taliang Technology Co ltd
Current assignee: Nanjing Taliang Technology Co ltd
Priority date: 2024-04-02
Filing date: 2024-04-02
Publication date: 2024-05-03

Abstract

本发明涉及数据故障诊断技术领域，具体涉及一种基于联邦学习的钻孔数据故障诊断方法；步骤一：进行故障诊断数据预处理，利用历史数据进行建模，并将数据进行分类；步骤二：基于域自适应网络，建立本地模型；步骤三：采用联邦迁移学习；通过上述方式解决不同类型的芯片、PCB板钻孔加工时数据不共享、数据内容较少问题，实现了能够保护数据、提供全面的数据诊断内容。

Description

一种基于联邦学习的钻孔数据故障诊断方法

技术领域

本发明涉及数据故障诊断技术领域，尤其涉及一种基于联邦学习的钻孔数据故障诊断方法。

背景技术

目前的芯片加工主要是机器自动化加工，对于芯片的排线、印刷、芯片钻孔等流程都需要定位精确和操作稳定，针对芯片加工钻孔过程中出现数据故障可能会导致产品质量下降或生产效率降低，因而需要对于钻孔数据进行故障的诊断。为了有效诊断和解决这些问题，应当注意数据的采集和监测，确保在加工钻孔过程中充分采集和监测数据。这些数据可以包括钻孔机器的工作参数、传感器数据、钻孔质量指标等。通过收集大量的数据，可以更好地分析和诊断故障。对于不同的芯片类型或者是同一芯片的不同钻孔，故障的指标定义存在不同。一般需要明确定义钻孔数据故障的指标和标准。这些指标可以是钻孔直径、深度、位置偏差、钻孔表面质量等方面的参数。根据产品要求和制造标准，设定合理的指标范围，以便及时发现异常情况。与此同时，还需要对于设备的维护和校准也一样重要，定期对钻孔设备进行维护和校准，确保其正常运行和准确性。故障可能源于设备问题，如传感器失效、机械部件磨损等。及时维护和校准可以减少故障发生的可能性。现如今技术的发展，因而不断改进钻孔数据故障诊断方法和技术。随着技术的发展和经验的积累，可以引入更先进的算法和工具来提高诊断的准确性和效率。

现有的故障诊断方法存在：传统的故障诊断方法基于原始数据出现异常进行判断，在数据时代各个企业的芯片是强有力的竞争品，不愿意将数据泄露出，对于代加工厂需要做好数据的保护；存在数据不足、数据诊断内容不全面的问题。

综上所述，提出一种能够保护数据、数据诊断内容全面的基于联邦学习的钻孔数据故障诊断方法是十分有必要的。

发明内容

本发明的目的在于提供一种基于联邦学习的钻孔数据故障诊断方法，实现能够保护数据、提供全面的数据诊断内容。

为实现上述目的，本发明采用的一种基于联邦学习的钻孔数据故障诊断方法，包括如下步骤：

步骤一：进行故障诊断数据预处理，利用历史数据进行建模，并将数据进行分类；

步骤二：基于域自适应网络，建立本地模型；

步骤三：采用联邦迁移学习。

其中，在步骤一：进行故障诊断数据预处理，利用历史数据进行建模，并将数据进行分类的步骤中：

对激光钻孔设置的参数进行预处理，划分为训练集、测试集和验证集三个组成部分，将数据集作为训练序列，/>数据集作为测试序列，/>数据集作为验证集，根据钻孔加工需要的数据，将数据分为动态数据和静态数据两部分特征参数，参数映射为向量形式：

；

其中为光刻胶涂胶时间，/>为前烘时间，/>为曝光时间，/>为显影时间，/>为坚膜时间，/>为显影时间，/>为涂胶转速，/>为烘干转速，/>为激光波长，/>为激光模式，/>为激光最小光斑，/>为激光扫描宽度，/>为激光钻孔深度，/>为激光钻孔宽度，/>为激光钻孔形状，每个特征参数对应一个特征标签。

定义训练集，训练集/>由m个特征/>组成，其中/>是n维特征空间X的一个特征，/>是/>相关联的类别标签，定义/>少数类特征数即待加工的芯片固有硬件参数信息/>~/>，/>为多数类特征数即激光钻孔加工芯片参数/>~/>，则/>，且/>；

计算数据类别不平衡率d：

；

若，/>为所设置的最大不平衡率，则计算需要合成的少数类特征数量G：

；

参数表示处理后的数据集所求的平衡程度，/>表示生成了完全平衡的数据集；

对于存在的任意少数类特征，根据n维空间的欧几里得距离找到K个最近邻点，并计算出比例/>：

；

式中是K个最近邻点中属于多数类的特征数量，/>；其中/>表示第i个特征距离K个最近邻点的比例；

对进行归一化之后/>：

；

计算需要为每个少数类特征生成的新特征数量/>：

；

在每个少数类特征的K个最近邻点中选择一个少数类特征/>，根据如下规则生成新特征/>：

；

其中为/>的系数，将/>生成新的数据向量/>，每一个特征表示为/>；

为了加快神经网络的收敛速度，需要将各个特征参数进行归一化处理。当输入端数据为0平均值时，对于收集的数据采用最大值最小值标准化，将数据映射到之间，标准化函数为：

；

其中是t时刻的收集到的激光钻孔加工参数，/>是收集到的特征参数中的最大值，/>是收集到的特征参数中的最小值，/>是t时刻收集到的激光钻孔加工参数的相关特征参数标准化结果。

其中，在步骤二：基于域自适应网络，建立本地模型的步骤中：

采用CMMD方法，计算源域和目标域直接的偏差值，偏差值越小，领域之间的数据越接近，模型的建立效果越好。

采用条件最大均值差异异作为域适应损失项来度量源域和目标域的分布距离，计算公式为：

；

其中，定义包含个有标签特征的源域特征集合/>和一个包含/>个无标签特征的目标域/>，/>是与第i个源域特征相对应的one-hot标签；其中/>、/>表示属于源域、目标域中第c类的特征个数；/>就表示对应的特征隶属于源域第c类；/>代表第j个无标签目标域特征属于目标域第c类；H是一种具有特征核的再生希尔伯特空间；/>表示一种能够将原始的特征数据映射到H的特征映射；

将深层神经网络的输出可以等价成概率分布：

；

其中表示网络输入/>表示各个类别的概率。

其中，在采用联邦迁移学习的步骤中：

采用均方误差作损失函数作为指标，即：

；

其中表示网络输入/>表示标签，带入后得到待优化的代价函数为：

；

设定一个误差值，确定联合建模的故障诊断的准确率，对激光钻孔动态参数进行调整。

本发明的一种基于联邦学习的钻孔数据故障诊断方法，通过进行故障诊断数据预处理，利用历史数据进行建模，并将数据进行分类；基于域自适应网络，建立本地模型；采用联邦迁移学习，用于解决不同类型的芯片、PCB板钻孔加工时数据不共享、数据内容较少问题，实现了能够保护数据、提供全面的数据诊断内容。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明的联邦学习模型图。

图2是本发明的基于联邦学习的钻孔数据故障诊断方法的流程图。

图3是本发明的本地模型多表示域自适应网络结构图。

图4是本发明的联邦迁移学习模型图。

图5是本发明的基于联邦学习的钻孔数据故障诊断方法的步骤流程图。

具体实施方式

请参阅图1~图5，本发明提供了一种基于联邦学习的钻孔数据故障诊断方法，包括如下步骤：

步骤二：基于域自适应网络，建立本地模型；

步骤三：采用联邦迁移学习。

在本实施方式中，首先进行故障诊断数据预处理，利用历史数据进行建模，并将数据进行分类；然后基于域自适应网络，建立本地模型；采用联邦迁移学习，用于解决不同类型的芯片、PCB板钻孔加工时数据不共享、数据内容较少问题，实现了能够保护数据、提供全面的数据诊断内容。

进一步地，在步骤一：进行故障诊断数据预处理，利用历史数据进行建模，并将数据进行分类的步骤中：

；

计算数据类别不平衡率d：

；

对进行归一化之后/>：

；

计算需要为每个少数类特征生成的新特征数量/>：

；

在本实施方式中，对激光钻孔设置的参数进行预处理，划分为训练集、测试集和验证集三个组成部分，将数据集作为训练序列，/>数据集作为测试序列，/>数据集作为验证集，根据钻孔加工需要的数据，将数据分为动态数据和静态数据两部分特征参数，参数映射为向量形式：

；

其中为光刻胶涂胶时间，/>为前烘时间，/>为曝光时间，/>为显影时间，/>为坚膜时间，/>为显影时间，/>为涂胶转速，/>为烘干转速，/>为激光波长，/>为激光模式，/>为激光最小光斑，/>为激光扫描宽度，/>为激光钻孔深度，/>为激光钻孔宽度，/>为激光钻孔形状，每个特征参数对应一个特征标签；其中/>、/>、/>、/>这四个为待加工的芯片孔的参数，每个芯片类型的芯片空参数为固定值，与前面/>到/>这十一个动态参数不同。动态参数较多，这就会照成特征不平衡。动态参数是主要的调整对象，芯片钻孔的孔的参数为固定值，用来诊断，加工出来的新的芯片对比，是否数据故障需要调整。例如钻孔深度不够，钻孔宽度不够，或是涂胶不均匀等，导致的芯片加工失败，因而需要对与这些动态数据进行调整。为了保证数据的充分性，减少数据数据不平衡带来的不良影响，因而需要数据特征不平衡处理；特征不平衡是指数据集中不同类别的特征数量差异较大，数据类别分布不均衡的情况。就芯片钻孔数据故障诊断而言，相对于动态数据，芯片的固有数据数量较少，但是激光加工芯片的钻孔参数角度，在一定程度上造成了数据特征的不平衡性，或者说芯片类型相比较加工的芯片数量要少的多。本发明从算法层面来解决数据不平衡的问题，改进常见的ADASYN算法，此算法根据数据特征分布自适应生成少数类新特征，对各种不同分布类型的数据都具有较好的适用性。主要过程包括以下几个步骤：定义训练集/>，训练集/>由m个特征/>组成，其中/>是n维特征空间X的一个特征，是/>相关联的类别标签，定义/>少数类特征数即待加工的芯片固有硬件参数信息/>~/>，/>为多数类特征数即激光钻孔加工芯片参数~/>，则/>，且/>；

计算数据类别不平衡率d：

；

式中是K个最近邻点中属于多数类的特征数量，/>；其中/>表示第i个特征距离K个最近邻点的比例。

对进行归一化之后/>：

；

计算需要为每个少数类特征生成的新特征数量/>：

；

当输入端数据为0平均值时，对于收集的数据采用最大值最小值标准化，将数据映射到之间，标准化函数为：

；

进一步地，在步骤二：基于域自适应网络，建立本地模型的步骤中：

；

将深层神经网络的输出可以等价成概率分布：

；

其中表示网络输入/>表示各个类别的概率。

在本实施方式中，基于域自适应网络，建立本地模型，其中使用残差网络与多表示域适应网络；卷积神经网络（CNN）是一种含有多个隐藏层的人工深层神经网络，有很强的特征提取能力和模式识别的能力，由输入层、卷积层、池化层、全连接层和输出层组成。ResNet是由传统CNN网络发展而来。ResNet保留传统CNN网络主干结构的同时，增加了更深的网络层并且引入长短时记忆网络中的门控机制，在CNN的各个网络层之间加入恒等映射单元，将网络层输入的恒等映射与其非线性变换进行叠加运算。残差网络的基本单元为残差块，残差块的输入为z，输出为，残差指的是输出值/>与输入值z的差值，即

；

由于新增了残差块结构，残差网络的训练过程中，只需要学习多个残差块输入输出之间的差别，从而解决了随着CNN模型层数增加而出现的网络退化现象。模型在反向传播过程中，输入通过恒等映射，直接将信息从残差块的输入端传递到输出端，保证了信息在传递过程中的完整性。ResNet的输出可简单由三部分表示，分别为/>，/>和/>。能够将高像素的输入图像转化为低像素图像；/>用于从低像素中提取特征；/>用于将特征表示映射到特征标记空间，作为分类器。因此，ResNet输出/>可表示为：

；

其中表示复合函数，例如/>，X为网络的输入数据x的集合。多表示域适应网络利用多表示域特征提取结构代替ResNet的全局池化层来提取数据的多表示特征，多表示域适应网络的结构如图3所示。

由附图3可以看出，多表示域适应网络使用具有多个子结构的多表示特征提取结构提取数据多表示下的特征：

；

式中：代表子结构数量。此时，ResNet的输出/>可被重新表示为：

；

与单一表示下的特征相比，多表示域适应网络提取的特征可以覆盖更多的信息。将源域和目标域的多表示下的特征对齐，理论上可以获得更好的分类效果。网络的特征对齐任务可以通过最小化域适应损失来实现，基于多表示特征的域适应损失：

；/>

其中：表示求最小函数，/>表示源域和目标域特征分布之间差异的估计量；/>和/>分别代表源域输入数据/>和目标域输入数据/>的集合，说明/>为共有数据集，起参考作用。可以将多表示域适应网络的整体损失函数表示为分类损失与域适应损失之和，多表示域适应网络损失函数：

；

其中：表示求最小函数，/>表示源域特征数量；/>代表交叉熵损失函数（分类损失）；/>是域自适应衰减项。

本发明专利使用条件最大均值差异异（CMMD）作为域适应损失项来度量源域和目标域的分布距离。CMMD的计算公式：

；

其中，给定一个包含个有标签特征的源域特征集合/>，和一个包含/>个无标签特征的目标域/>；

是与第i个源域特征/>相对应的one-hot标签。/>、/>表示属于源域、目标域中第c类的特征个数；/>就表示对应的特征隶属于源域第ｃ类；/>代表第j个无标签目标域特征属于目标域第c类；H是一种具有特征核的再生希尔伯特空间；表示一种能够将原始的特征数据映射到H的特征映射。

由于目标域不包含有标签特征，模型对于目标域数据预测得到的标签（硬标签）又可能存在错误，将深层神经网络的输出等价成一个概率分布：

；

其中表示网络输入/>表示各个类别的概率。

为了能够在目标域计算CMMD的同时降低硬标签预测可能导致的误差，目标域特征在模型训练过程中使用概率预测。通过概率分布来缩小多表示下源域特征和目标域特征之间的差异，至此联邦学习的本地模型搭建完成。

进一步地，在采用联邦迁移学习的步骤中：

采用均方误差作损失函数作为指标，即：

；

在本实施方式中，联邦平均算法，参数服务器收集所有梯度，同时根据数据量应用加权平均的方法来更新参数：

；

其中，为学习率，/>为第k个客户端在当前时刻参与方的本地梯度更新，为第k个参与方的客户端的本地数据量，/>为当前时刻第k个参与方的客户端的本地模型参数，/>为当前时刻聚合后的全局模型参数。FedAvg算法如图1所示。

联邦学习在理论上打破了传统机器学习的数据孤岛、数据隐私安全等僵局，多方客户端数据分布差异较大时，直接采用联邦学习框架建模可能会产生比单独训练更差的模型。迁移学习能够将在某个领域或任务上学习到的知识应用到不同但相关的领域或问题中。因此，联邦迁移学习将迁移学习思想与联邦学习框架融合：

；

其中、/>和/>、/>分别表示客户端i和客户端j的特征空间和特征空间；/>、为客户端i和客户端j拥有的孤岛隐私数据集。联邦迁移学习框架能够联合多客户端不同分布下的孤岛隐私数据知识建立全局模型，完成“大数据领域向小数据领域的迁移”，最终对目标域中的特征进行标签预测。

进行了域自适应网络的搭建，构建本地网络模型。采用常见的均方误差（MSE）作损失函数作为指标，即：

；/>

其中表示网络输入/>表示标签，带入后得到待优化的代价函数为公式：

；

最终设定一个误差值，来确定联合建模的故障诊断的准确率，以便于及时对激光钻孔动态参数进行调整。

实施例1，如图2所示：

数据集的构建：选取某工况下公开且已知标签的钻孔数据构建源域公共数据集，客户端 1、2利用各自本地无标签的钻孔数据分别构建目标域1和2数据集，若存在新客户端3，其数据也作为目标域数据。构成源域、目标域数据集的钻孔数据工况互不相同。

本地模型构建：以客户端1为例，利用多表示域适应网络提取目标域1和源域数据的多表示下特征，在多个特征空间内同时进行特征对齐。最后，本地模型1的目标函数设置为交叉熵分类损失以及不同表示下的CMMD损失之和。经过一定次数的迭代训练，目标函数收敛，完成本地客户端模型1的构建。其他客户端模型的构建过程同理。

联邦全局故障诊断模型构建：客户端本地模型构建完成后，将压缩处理后的模型参数上传至中央服务器，服务器端聚合模型参数并下发给各个客户端，客户端利用聚合后模型参数更新本地模型。上述过程称为一次联邦迭代，经过预定次数的联邦迭代，在服务器端得到最终可用于不同工况下钻孔数据故障诊断的联邦全局模型。

模型测试：将客户端1和2的测试数据集分别输入联邦全局模型，把模型对测试数据的标签预测结果与真实标签作对比，得出各自的分类准确率。

故障诊断：客户端的工况Ⅰ或Ⅱ钻孔数据待诊断数据可直接输入现有联邦全局故障诊断模型，得出诊断结果；客户端的其他工况钻孔数据待诊断数据，可直接利用现有联邦全局故障诊断模型得出初步诊断结果。若有新的其他工况的待诊断数据，可重新参与到联邦迁移过程中，建立新的全局故障诊断模型后再进行诊断。

以上所揭露的仅为本发明一种较佳实施例而已，当然不能以此来限定本发明之权利范围，本领域普通技术人员可以理解实现上述实施例的全部或部分流程，并依本发明权利要求所作的等同变化，仍属于发明所涵盖的范围。

Claims

1.一种基于联邦学习的钻孔数据故障诊断方法，其特征在于，包括如下步骤：

步骤二：基于域自适应网络，建立本地模型；

步骤三：采用联邦迁移学习。

2.如权利要求1所述的基于联邦学习的钻孔数据故障诊断方法，其特征在于，在步骤一：进行故障诊断数据预处理，利用历史数据进行建模，并将数据进行分类的步骤中：

；

其中为光刻胶涂胶时间，/>为前烘时间，/>为曝光时间，/>为显影时间，为坚膜时间，/>为显影时间，/>为涂胶转速，/>为烘干转速，/>为激光波长，为激光模式，/>为激光最小光斑，/>为激光扫描宽度，/>为激光钻孔深度，/>为激光钻孔宽度，/>为激光钻孔形状，每个特征参数对应一个特征标签。

3.如权利要求2所述的基于联邦学习的钻孔数据故障诊断方法，其特征在于，在步骤一：进行故障诊断数据预处理，利用历史数据进行建模，并将数据进行分类的步骤中：

定义训练集，训练集/>由m个特征/>组成，其中是n维特征空间X的一个特征，/>是/>相关联的类别标签，定义/>少数类特征数即待加工的芯片固有硬件参数信息/>~/>，/>为多数类特征数即激光钻孔加工芯片参数/>~/>，则/>，且/>；

计算数据类别不平衡率d：

；

对进行归一化之后/>：

；

计算需要为每个少数类特征生成的新特征数量/>：

；

4.如权利要求1所述的基于联邦学习的钻孔数据故障诊断方法，其特征在于，在步骤二：基于域自适应网络，建立本地模型的步骤中：

5.如权利要求4所述的基于联邦学习的钻孔数据故障诊断方法，其特征在于，在步骤二：基于域自适应网络，建立本地模型的步骤中：

；

将深层神经网络的输出可以等价成概率分布：

；

其中表示网络输入/>表示各个类别的概率。

6.如权利要求1所述的基于联邦学习的钻孔数据故障诊断方法，其特征在于，在采用联邦迁移学习的步骤中：

采用均方误差作损失函数作为指标，即：

；