CN117252237B

CN117252237B - 一种高速电主轴小样本热误差建模的弱监督域对抗网络

Info

Publication number: CN117252237B
Application number: CN202311087693.8A
Authority: CN
Inventors: 刘强; 马帅; 陈祝云; 冷杰武; 张定; 赵荣丽
Original assignee: Guangdong University of Technology
Current assignee: Guangdong University of Technology
Priority date: 2023-08-25
Filing date: 2023-08-25
Publication date: 2024-03-01
Anticipated expiration: 2043-08-25
Also published as: CN117252237A

Abstract

本发明公开了一种高速电主轴小样本热误差建模的弱监督域对抗网络，包括多源异构数据模块、输入模块、域对抗模块和弱监督模块；所述多源异构数据模块用于采集电主轴在不同工况下的多个关键位置的温度数据、功率和电流数据以及热误差数据；所述输入模块用于根据不同工况划分源域和目标域，并在分源域和目标域两域的数据集内，分别划分训练集和测试集；所述域对抗模块包括特征提取器，域判别器和热误差预测器；所述弱监督模块包括目标域热误差预测器；本发明旨在提供一种高速电主轴小样本热误差建模的弱监督域对抗网络，能够有效解决变工况下的域迁移和小样本建模问题，具有技术路线逻辑清晰，通用性强，易于推广等优点。

Description

一种高速电主轴小样本热误差建模的弱监督域对抗网络

技术领域

本发明涉及高速电主轴误差控制技术领域，尤其涉及一种高速电主轴小样本热误差建模的弱监督域对抗网络。

背景技术

高速电主轴能够实现高精度和高效率加工，被广泛应用在航空航天、汽车零部件、电子芯片等精密加工场合。由于高速电主轴结构紧凑，缺乏水冷装置，导致其散热性能较差，加工过程中产生的热量会造成不同位置的温升变化，引起内部部件的热变形，并最终导致主轴前端的定位误差，从而降低加工精度。

由热变形引起的热误差是影响加工精度的主要因素。相关研究表明：在精密加工过程中，热误差占总加工精度误差的60％-80％。为了减轻热误差的影响，热误差解决方案已经成为高速电主轴领域的一个重要研究方向。

热误差解决方案主要有两种：主动抑制法和误差补偿法。主动抑制法是指通过恒温车间、冷却装置和油耗概念设计等减少热量，从根本上抑制热变形。误差补偿法使用数学模型来预测和补偿主轴运行过程中出现的热误差。主动抑制法技术壁垒和成本较高，该方法的应用受到限制，而误差补偿法由于其经济性和实用性受到了广泛推广。

目前，随着数据和计算能力的不断提高，基于数据驱动的技术已经成为高速主轴复杂、非线性热行为建模的一种有效方法。在这种背景下，基于深度学习方法的预测性能甚至超过了传统建模方法，为此，专家学者开展了一系列研究。然而，基于深度学习的热误差模型存在几个缺陷：(1)数据可用性：深度学习方法需要大量的数据来训练有效的模型，然而，从高速电主轴中获得大量的热误差数据是具有挑战性的，特别是在现实环境中，通常只能采集到小样本的热误差数据；(2)缺乏泛化性：深度学习模型通常要求输入数据服从独立同分布假设，然而，变工况环境下，收集的训练和测试数据之间通常存在很大的分布差异。因此，训练好的模型容易出现过拟合，不能很好地适配到变工况下的热误差预测任务中；(3)单维度传感器信息：热误差具有耦合性，受温度、功率和电流等多个因素的共同影响。目前，大多数研究只使用温度特征来建立模型，难以全面描述热误差耦合特性。为了准确建立电主轴热误差模型，必须考虑所有相关因素的影响及其相互作用。

发明内容

本发明的目的在于提出一种高速电主轴小样本热误差建模的弱监督域对抗网络，能够有效解决变工况下的域迁移和小样本建模问题，具有技术路线逻辑清晰，通用性强，易于推广等优点。

为达此目的，本发明采用以下技术方案：一种高速电主轴小样本热误差建模的弱监督域对抗网络，包括多源异构数据模块、输入模块、域对抗模块和弱监督模块；

所述多源异构数据模块用于采集电主轴在不同工况下的多个关键位置的温度数据、功率和电流数据以及热误差数据；

所述输入模块用于根据不同工况划分源域和目标域，并在分源域和目标域两域的数据集内，分别划分训练集和测试集；

所述域对抗模块包括特征提取器G_f，用于提取源域和目标域的自变量的输入特征；域判别器G_d，用于根据提取的源域和目标域特征，采用min-max规则和梯度反转层，混淆源域和目标域特征；热误差预测器G_p，用于输出源域热误差预测值；

所述弱监督模块包括目标域热误差预测器用于输出目标域热误差预测值目标域的小样本热误差数据/>以及计算弱监督损失函数Loss_weakly，并加入到总的损失函数中，进行反向传播。

优选的，所述目标域热误差预测器的定义为：

其中g⁽ⁱ⁾为第i层的权重，h⁽ⁱ⁾为第i层的偏置，x⁽ⁱ⁾为第i个样本；

目标域热误差预测器的误差的定义为：

其中是目标域小样本实际热误差数据，/>是目标域小样本预测热误差数据，/>为目标域热误差预测器的数学表达式，/>为目标域热误差预测器的误差的数学定义。

优选的，所述计算弱监督损失函数Loss_weakly的计算公式为：

其中MAE为损失函数平均绝对误差，N为样本总数；是目标域小样本实际热误差数据，/>是目标域小样本预测热误差数据。

优选的，所述多源异构数据模块采集电主轴的步骤中，选取高速电主轴多个关键位置，采用磁吸或贴片式温度传感器采集温度数据；电主轴工作时的电流和功率数据由数控***实时记录，通过对数控***二次开发采集电流和功率数据；电主轴工作时的热误差数据通过高精度位移传感器测量。

优选的，所述输入模块用于根据不同工况划分源域和目标域，用作源域的数据集包含完备的自变量数据和因变量数据；用作目标域的数据集包含完备的自变量数据，以及小样本因变量数据；输入模块用于划分训练集和测试集。

优选的，所述特征提取器G_f采用多尺度卷积神经网络，特征提取器G_f定义为：

其中x⁽ⁱ⁾为第i个样本，w⁽ⁱ⁾为第i层的权重，b⁽ⁱ⁾为第i层的偏置。

优选的，所述域判别器G_d采用min-max规则，给来自源域的数据集打上标签“0”，目标域数据集打上标签“1”，采用二分类交叉熵损失函数计算域对抗分类误差损失函数Loss_Domain，引入梯度反转层，在反向传播过程中对梯度自动取反，当域判别器G_d误差最大时，无法区分源域和目标域，成功欺骗域判别器G_d，使源域和目标域混淆；

域判别器G_d的定义为：

其中u⁽ⁱ⁾为第i层的权重，z⁽ⁱ⁾为第i层的偏置；

域判别器的误差的数学定义为：

其中n_s为源域样本总数，为源域特征数据，n_t为目标域样本总数，/>为目标域样本。

优选的，所述热误差预测器G_p用于输出源域的预测值以及与热误差真实值计算损失函数Loss_source，热误差预测器G_p的定义为：

其中v⁽ⁱ⁾为第i层的权重，c⁽ⁱ⁾为第i层的偏置，x⁽ⁱ⁾为第i个样本；

所述热误差预测器的误差的定义为：

其中n_s为源域样本总数，L_p()为预测器预测损失函数，为目标域标签热误差数据。

优选的，所述总的损失函数的公式为：

其中θ_f是特征提取器G_f的参数，θ_d是域判别器G_d的参数，θ_p是热误差预测器G_p的参数。

本发明的一个技术方案的有益效果：通过多源异构数据模块采集电主轴多个关键位置的温度数据，获取电主轴工作时的功率和电流数据，测量电主轴热误差，构建符合域对抗模块要求的输入矩阵；通过域对抗模块提取自变量的输入特征，源域和目标域特征并混淆源域和目标域特征；通过弱监督模块使用目标域小样本热误差数据计算损失函数，并加入模型总的损失函数。通过多源异构数据模块使采集的数据更具有可用性，通过域对抗模块混淆源域和目标域特征使数据具有泛化性，防止训练模型出现过拟合，多源异构数据模块采集的数据具有多个维度，使建立的模型更加丰富，能够更加全面描述热误差耦合特性。

附图说明

图1是本发明一个实施例小样本建模问题描述示意图；

图2是本发明一个实施例域迁移问题描述示意图；

图3是本发明一个实施例技术路线示意图；

图4是本发明一个实施例网络具体参数设置表格；

图5是本发明一个实施例的测试结果示意图。

具体实施方式

下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。

下面详细描述本发明的实施例。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。

参阅图1至图5所示，一种高速电主轴小样本热误差建模的弱监督域对抗网络，包括多源异构数据模块、输入模块、域对抗模块和弱监督模块；

通过多源异构数据模块采集电主轴多个关键位置的温度数据，获取电主轴工作时的功率和电流数据，测量电主轴热误差，构建符合域对抗模块要求的输入矩阵；通过域对抗模块提取自变量的输入特征，源域和目标域特征并混淆源域和目标域特征；通过弱监督模块使用目标域小样本热误差数据计算损失函数，并加入模型总的损失函数。通过多源异构数据模块使采集的数据更具有可用性，通过域对抗模块混淆源域和目标域特征使数据具有泛化性，防止训练模型出现过拟合，多源异构数据模块采集的数据具有多个维度，使建立的模型更加丰富，能够更加全面描述热误差耦合特性。

优选的，所述目标域热误差预测器的定义为：

目标域热误差预测器的误差的定义为：

其中是目标域小样本实际热误差数据，/>是目标域小样本预测热误差数据，为目标域热误差预测器的数学表达式，/>为目标域热误差预测器的误差的数学定义。

弱监督模块根据具体需求设置隐藏层和节点数，并使用relu激活函数来输出预测值，弱监督策略可以充分利用目标域的小样本热误差数据，以目标域弱监督损失函数形式，约束网络向正向迁移的方向训练。

具体地，所述计算弱监督损失函数Loss_weakly的计算公式为：

所述输入模块用于根据不同工况划分源域和目标域，用作源域的数据集包含完备的自变量数据和因变量数据；用作目标域的数据集包含完备的自变量数据，以及小样本因变量数据；输入模块用于划分训练集和测试集。

输入；模块只用于划分训练集和测试集，不划分验证集。自变量数据指的是表征热误差变化情况的温度、电流、电压和功率数据，因变量指的是热误差数据。小样本因变量数据相对于完整的自变量数据集而言，数目稀少，一般来说，小样本所占比例不超过自变量数据集总数的20％。

具体地，所述特征提取器G_f采用多尺度卷积神经网络，特征提取器G_f定义为：

多维度温度数据导致高度的共线性问题，温度变量之间存在极大的关联性，除了温度数据的主成分外，其他的温度数据均视为噪声。传统卷积神经网络通过设置不同参数卷积核，处理多维温度数据的高度共线性问题，但由于不同的温度数据在空间尺度上可能存在差异性，传统CNN在尺度问题上适应性较差。为了使传统CNN模型在一定范围内具有尺度可变性，按照尺度的不同将卷积操作分成多个组，某层卷积组内嵌入多层不同参数的子卷积层，保证该卷积组具有不同尺度，多个尺度的卷积相互配合，自适应地处理不同尺度的输入数据，从多个尺度中提取重要的特征，保证对关键信息具有较高的识别度，从而降低模型对噪声或变形的敏感性。通过MSCNN从源域和目标域的原始输入中学习非线性、高维特征表示，消除输入数据噪声，提高网络的稳定性和预测精度。

域判别器G_d的定义为：

其中u⁽ⁱ⁾为第i层的权重，z⁽ⁱ⁾为第i层的偏置；

域判别器的误差的数学定义为：

具体地，所述热误差预测器G_p用于输出源域的预测值以及与热误差真实值计算损失函数Loss_source，热误差预测器G_p的定义为：

所述热误差预测器的误差的定义为：

优选的，所述总的损失函数的公式为：

G_f、G_d和G_p的参数(θ_f,θ_p,θ_d)通过随机梯度下降算法进行迭代更新，仅用于计算目标域小样本的弱监督损失函数，不参与对抗性训练过程。

参照图1所示，为本发明的小样本建模问题示意图，电主轴空转时，位移传感器不受加工运动限制，电主轴热误差易于测量，能够采集大量数据集，基于深度学习技术的热误差模型，无论在训练集或是测试集均具备较高的预测精度；而电主轴带刀具加工时，受刀具切削和工件进给运动限制，位移传感器无法连续采集大量热误差数据，在该种状态下，深度学习模型通常会出现过拟合现象，模型在训练集上取得较好的预测精度，而在测试集上性能较差。

参照图2所示，为本发明的域迁移问题示意图，高速电主轴在不同转速下的数据分布存在差异性，在一种转速数据集下建立的预测模型无法在另一种转速数据集下精准预测。高速电主轴不同转速下的数据分布不同，但彼此存在相似性。

参照图3所示，为本发明的技术路线图，多源异构数据模块内，通过多源传感器采集高速电主轴在不同工况下的多维温度数据、电流和功率数据以及热误差数据，来自不同工况下的数据集均可被视作源域或目标域，但为了验证本专利的技术可行性，用作源域的数据集中，温度、电流、功率和热误差数据样本数目一致。用作目标域的数据集中，温度、电流和功率数据保持与源域数据集一致的样本数目，而热误差只具备小样本数据，本专利中假设目标域热误差具备4种不同比例的小样本数据集(0％，10％，15％，20％)，并以此开展实验验证。在输入层根据不同工况数据集划分源域和目标域，并在两域数据集中分别按照70％，30％的比例划分训练集和测试集。源域和目标域数据集预处理后，构建输入矩阵。采用多尺度卷积神经网络(MSCNN)充当域对抗网络特征提取器G_f，MSCNN第一层卷积组内构建三个不同尺度的子卷积层，提取输入数据不同的尺度信息，减少多维温度数据高度共线性问题对模型的影响，三个子卷积层进行拼接，随后传人第二、三层，MSCNN共有三层卷积层，从不同空间尺度处理输入信息，以空间尺度的可变性解决温度数据的共线性问题，代替传统聚类算法筛选温度敏感点的步骤，以算法简化步骤，提升热误差建模效率。源域和目标域输入信息，经特征提取器G_f提取特征，两域的特征被集中输入到域判别器G_d中，在域判别器G_d中，给源域数据特征打上标签“0”，目标域数据特征打上标签“1”，采用二分类交叉熵损失函数计算域对抗损失函数Loss_Domain，引入梯度反转层，对域对抗损失函数Loss_Domain乘以-1，两域特征对抗生成，执行min-max规则，直到域对抗损失函数误差最大化，此时域判别器G_d无法区分两域特征。引入梯度反转层和min-max规则训练的最终目的是混淆两域特征，成功欺骗域判别器G_d，以此减小源域和目标域特征分布差异。源域经特征提取器G_f提取特征后，另一分支连接源域的热误差预测器G_p，预测器G_p用于输出源域的热误差预测值并与源域热误差的真实值计算损失函数Loss_source。目标域特征经特征提取器G_f提取特征后，另一分支连接目标域热误差预测器预测器/>用于输出目标域的小样本热误差预测值，并与目标域小样本热误差的真实值计算弱监督损失函数Loss_weakly。总的损失函数Loss＝Loss_Domain+Loss_source+Loss_weakly，损失函数反向传播，监督模型训练，模型训练的最终目标是使两域特征判别最大化、源域预测误差最小化、目标域预测误差最小化。相比于仅使用域判别器进行领域适配的单一性，弱监督模块的加入，最大化利用了目标域存在的小样本热误差数据，以损失函数的形式加入网络训练，极大地促进了模型的正向迁移性能，让模型从源域适配至目标域有理可依。

参照图4所示，为网络特征提取器G_f、域判别器G_d、源域预测器G_p以及目标域预测器的具体参数设置。特征提取器G_f包含三层卷积层，其中第一层卷积层内由三个子卷积层组合拼接。域判别器G_d由两层全连接层组成，由于域判别器计算的是二分类交叉熵损失函数，所以使用softmax激活函数输出概率分布。预测器G_p和/>参数设置一致，首先以0.2的比例丢掉部分网络节点，防止模型过拟合，随后连接一层全连接层，再使用ReLU激活函数输出预测值。

参照图5所示，为本发明的实施例测试结果，三种工况数据集A，B，C，样本数目均为240个，目标域四种不同比例的小样本数据(0％，10％，15％，20％)，构建24组迁移任务。图5展示了四种迁移任务下的具体预测性能，迁移任务A→C(10％)表示：一种工况下的数据集A作为源域，另一种工况下的数据集B作为目标域，在目标域数据集B中，热误差数据仅占总样本数的10％。按照70％比例划分训练集，30％比例划分测试集，模型训练完成后在源域和目标域测试集上，分别输出72个预测值。每组迁移任务的第一张图为弱监督域对抗网络(Weakly Supervised Adversarial Network,WSAN)在源域的预测性能，第二张图为WSAN在目标域上的预测性能，第三张柱状图表示：源域和目标域各自的预测值与真实值的误差。4组迁移任务作为本专利的实施例，验证了模型方法的可行性。

在本说明书的描述中，参考术语“实施例”、“示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

以上结合具体实施例描述了本发明的技术原理。这些描述只是为了解释本发明的原理，而不能以任何方式解释为对本发明保护范围的限制。基于此处的解释，本领域的技术人员不需要付出创造性的劳动即可联想到本发明的其它具体实施方式，这些方式都将落入本发明的保护范围之内。

Claims

1.一种高速电主轴小样本热误差建模的弱监督域对抗网络，其特征在于，包括多源异构数据模块、输入模块、域对抗模块和弱监督模块；

所述弱监督模块包括目标域热误差预测器用于输出目标域热误差预测值/>目标域的小样本热误差数据/>以及计算弱监督损失函数Loss_weakly，并加入到总的损失函数中，进行反向传播。

2.根据权利要求1所述的一种高速电主轴小样本热误差建模的弱监督域对抗网络，其特征在于，所述目标域热误差预测器的定义为：

目标域热误差预测器的误差的定义为：

3.根据权利要求1所述的一种高速电主轴小样本热误差建模的弱监督域对抗网络，其特征在于，所述计算弱监督损失函数Loss_weakly的计算公式为：

4.根据权利要求1所述的一种高速电主轴小样本热误差建模的弱监督域对抗网络，其特征在于，所述多源异构数据模块采集电主轴的步骤中，选取高速电主轴多个关键位置，采用磁吸或贴片式温度传感器采集温度数据；电主轴工作时的电流和功率数据由数控***实时记录，通过对数控***二次开发采集电流和功率数据；电主轴工作时的热误差数据通过高精度位移传感器测量。

5.根据权利要求1所述的一种高速电主轴小样本热误差建模的弱监督域对抗网络，其特征在于，所述输入模块用于根据不同工况划分源域和目标域，用作源域的数据集包含完备的自变量数据和因变量数据；用作目标域的数据集包含完备的自变量数据，以及小样本因变量数据；输入模块用于划分训练集和测试集。

6.根据权利要求1所述的一种高速电主轴小样本热误差建模的弱监督域对抗网络，其特征在于，所述特征提取器G_f采用多尺度卷积神经网络，特征提取器G_f定义为：

7.根据权利要求1所述的一种高速电主轴小样本热误差建模的弱监督域对抗网络，其特征在于，所述域判别器G_d采用min-max规则，给来自源域的数据集打上标签“0”，目标域数据集打上标签“1”，采用二分类交叉熵损失函数计算域对抗分类误差损失函数Loss_Domain，引入梯度反转层，在反向传播过程中对梯度自动取反，当域判别器G_d误差最大时，无法区分源域和目标域，成功欺骗域判别器G_d，使源域和目标域混淆；

域判别器G_d的定义为：

其中u⁽ⁱ⁾为第i层的权重，z⁽ⁱ⁾为第i层的偏置；

域判别器的误差的数学定义为：

其中n_s为源域样本总数，为源域特征数据，n_t为目标域样本总数，/>为目标域特征数据。

8.根据权利要求1所述的一种高速电主轴小样本热误差建模的弱监督域对抗网络，其特征在于，所述热误差预测器G_p用于输出源域的预测值以及与热误差真实值计算损失函数Loss_source，热误差预测器G_p的定义为：

所述热误差预测器的误差的定义为：

9.根据权利要求1所述的一种高速电主轴小样本热误差建模的弱监督域对抗网络，其特征在于，所述总的损失函数的公式为：