CN111062406B

CN111062406B - 一种面向异构领域适应的半监督最优传输方法

Info

Publication number: CN111062406B
Application number: CN201910826004.8A
Authority: CN
Inventors: 吴庆耀; 闫玉光; 毕朝阳
Original assignee: South China University of Technology SCUT
Current assignee: South China University of Technology SCUT
Priority date: 2019-03-09
Filing date: 2019-09-03
Publication date: 2023-11-28
Anticipated expiration: 2039-09-03
Also published as: CN111062406A

Abstract

本发明公开了一种面向异构领域适应的半监督最优传输方法。本方法首先根据半监督优化的Gromov‑Wasserstein差异（SGW）度量两个领域分布的差异程度;然后采用基于相对熵的投影梯度下降法迭代求解直到传输矩阵的参数值更新小于一定限度，收敛的传输矩阵能将源域的数据分布有效转移至目标域分布当中;最后根据转移后的源域数据对未标注的目标域数据进行预测。该方法考虑了最优传输在特征空间不同的异构数据中的应用并对半监督场景作了适应性优化，在实际应用中在多种领域数据的信息迁移学习场景展现出良好的性能。

Description

一种面向异构领域适应的半监督最优传输方法

技术领域

本发明涉及迁移学习和半监督学习领域,具体涉及一种面向异构领域适应的半监督最优传输方法。

背景技术

通过对海量有标注样本的共性提取，机器学习算法可以对未来的同类样本进行准确的预测。但是对部分领域来说，数据的标注需要耗费大量时间和财力，如医学图像等领域甚至无法得到大量的有标注数据。考虑到不同领域之间往往包含有共同的信息，如何利用已知的、标注数据量大的领域提升未知的、标注数据量小的领域的学习效果是一个重要课题，这种情况称为半监督迁移学习。最优传输方法刻画了两个领域之间的差异程度，可以利用其来将源域的数据向目标域的分布逼近已提升迁移学习效果。同时，迁移学习分为同构迁移和异构迁移两种情况，本专利考虑更复杂的异构迁移学习问题，这种问题的设定较为困难，但是却具有很强的实际应用价值。

发明内容

本发明的目的是提供一种面向异构领域适应的半监督最优传输方法，克服现有技术存在的不足。

本发明的目的可以采取以下技术方案实现。

一种面向异构领域适应的半监督最优传输方法，包括以下步骤：

S1：从数据库中得到具有多种类别的、不同领域的异构数据，并根据半监督优化的Gromov-Wasserstein差异(SGW)度量两个领域分布的差异程度；

S2：采用基于相对熵的投影梯度下降法迭代求解传输矩阵，重复迭代算法直到算法收敛到一定范围；

S3：利用传输矩阵进行源域数据转移，后根据转移后的数据对未标记的目标域数据数据进行预测。

作为一种具体的实施方案，步骤S1中，数据及构建相应的目标函数的步骤为：

S21：源域数据表示为有标注信息和无标注信息的目标域数据表示为/>这里X表示数据特征，上下标s、l、u分别数据表示来自于源域、有标注目标域和无标注目标域，n为样本数量，d为数据特征维度，下标t代表整个目标域，是领域l、u的并集。

S22：采用核函数计算两个领域数据的度量矩阵M_s,M_t。以传输矩阵T为变量，基于最优传输的基本思想构建熵Gromov-Wasserstein差异度量函数如下式：

其中，搜索空间是源域和目标域的联合分布，是源域和目标域的经验分布；M_s,M_t是采用核函数计算的源域和目标域的度量矩阵，如线性核函数：/>ε是平衡超参数，用于控制传输矩阵T的熵损失，下标i、i'、j、j'用于指代所指矩阵M、T中的元素。

S23：对于含有相同标注信息，即类别相同的领域数据，它们在传输后的分布应当更加接近。基于该思想，利用有标注的目标域数据X_l及其相应类标，构建对传输矩阵T的正则化项Ω_l(T)，如下式：

其中，是属于第k类的源域以及目标域样本数，/>是属于第k类的样本，上标K代表总的类别数。矩阵/>是源域和目标域的标签指示矩阵：

S24：基于的同类别的数据转移的概率应当更高的思想，对无标注的目标域数据的概率转移作出类别限制，构建对传输矩阵T的正则化项Ω_u(T)，如下式：

其中,I_k是类别为k的源域样本的索引；是类别为k的源域样本传输至第j 个目标域样本的概率之和。

S25：加权组合Ω_l(T)和Ω_u(T)，得到半监督最优传输方法的最终目标函数/>如下式：

这里λ，γ为平衡超参数，用于限制正则化项Ω_l(T)和Ω_u(T)的作用强度。

作为一种具体的实施方案，步骤S2包括：

S31：采用指数梯度法，计算第τ轮的传输矩阵T_τ的指数梯度如下式：

其中步长α＞0，exp(·)指数操作是对矩阵的每个元素进行相应操作。

S32：采用相对熵，即KL距离将指数梯度投影至传输矩阵的定义空间，得到关于第τ+1 轮的转移矩阵T_τ+1的正则化最优传输问题。如下式：

其中是S31中得到的第τ轮指数梯度，T'∈Γ是搜索空间内所有可能的传输矩阵，搜索空间如前S22所述，是源域和目标域的联合分布，下标i、j代表所指矩阵的第i行第j列元素。

S33：采用Sinkhorn固定点法，令εα＝1，解该最优传输问题，得到第τ+1轮的传输矩阵 T_τ+1。如下式：

T_τ+1＝diag(u_τ+1)Θ_τ+1diag(v_τ+1)

其中ε，λ，γ为S22及S25所述平衡超参数，p_s,p_t是S22所述源域和目标域的经验分布。矩阵Θ、u以及v用于使所述公式更便于表达，没有具体物理意义。exp(·)指数操作以及除法操作是对矩阵或向量的每个元素进行相应操作。

S34：重复迭代S31至S33，直到传输矩阵的改变与前一轮相比小于预设的常值，则认为传输矩阵收敛，停止迭代，得到最优传输矩阵T^*。

作为一种具体的实施方案，步骤S3中，所述传输后源域数据的计算和后续训练方法如下：

S41：通过Gromov-Wasserstein重心法，利用计算出的最优转移矩阵得到源域数据转移如下式：

S42：将转移后的源域样本以及有标注的目标域作为训练样本，使用一般分类方法，如支持向量机、神经网络等训练模型，用于对未知标签的待预测目标域样本作出预测。

本发明从数据库中得到具有多种类别的、不同领域的异构数据，采用最优传输方法将源域数据的分布转移至目标域数据的分布当中。具体而言，本方法首先根据半监督优化的 Gromov-Wasserstein差异(SGW)度量两个领域分布的差异程度；然后采用基于相对熵的投影梯度下降法迭代求解直到传输矩阵的参数值更新小于一定限度，收敛的传输矩阵能将源域的数据分布有效转移至目标域分布当中；最后根据转移后的源域数据对未标注的目标域数据进行预测。该方法考虑了最优传输在特征空间不同的异构数据中的应用并对半监督场景作了适应性优化，在实际应用中在多种领域数据的信息迁移学习场景展现出良好的性能。

与现有技术相比，本发明具有如下优点和技术效果：

本发明是利用最优传输的思想，通过最小化两个相关领域的分布差异达成源域对目标域的辅助训练，并加入了有类标样本对传输后源域数据的关系以及无类标样本对传输类别概率的关系作为正则化项，能够对目标域数据产生质量良好的类标标记，提升了在异构迁移学习问题上的预测准确率。

附图说明

图1为本发明实施例1的一种面向异构领域适应的半监督最优传输方法的流程图。

图2为本发明实施例1的一种面向异构领域适应的半监督最优传输方法中源域和目标域数据分布转移的示意图。

图3为本发明实施例1中采用发明专利方法进行预测和现有其他方法进行预测的准确率对比图。

具体实施方式

下面结合实施例及附图对本发明做进一步详细的描述，但本发明的实施方式不限于此，需指出的是，以下若有未特别详细说明之过程或符号，均是本领域技术人员可参照现有技术实现或理解的。

实施例1：

如图1所示的流程，本实施例1的一种面向异构领域适应的半监督最优传输方法，包括以下步骤：

S1：从数据库中得到具有多种类别的、不同领域的异构数据，并根据半监督优化的Gromov-Wasserstein差异(SGW)度量两个领域分布的差异程度；该数据可以是实际中以不同的维度存在的文本或者图像特征。具体的，在本实施例中，源域采用图像数据，并用传统的尺度不变特征(SIFT)进行表示，而目标域以图像数据用卷积神经网络如VGG进行特征提取。如图2的第一附图所示，为了方便展示，源域和目标域分别降维成两维和三维异构数据，并用坐标系表示，源域数据和目标域数据均有三种类别。

如图2所示，所述数据读取及相应的目标函数的构建步骤为：

S23：对于含有相同标注信息，即类别相同的领域数据，它们在传输后的分布应当更加接近。基于该思想，利用有标注的目标域数据X_l及其相应类标，构建对正则化项Ω_l(T)，如下式：

所述优化传输矩阵的具体方法为：

T_τ+1＝diag(u_τ+1)Θ_τ+1diag(v_τ+1)

S34：重复迭代S31至S33，直到传输矩阵的改变与前一轮相比小于预设的常值，则认为传输矩阵收敛，停止迭代，得到最优传输矩阵T^*。在本实施例中，所计算得到的最优传输矩阵T^*如图2第二附图所示。可以看到，转移矩阵中存在转移值的部分粗略分布在三个方框以内，最优传输矩阵T^*有效学得了源域样本与目标域样本中同类别样本间的传输关系。

如图2所示，所述传输后源域数据的计算和目标域分类器训练方法如下：

如图2第三附图所示，在本实施例中，源域数据转移将三维源域数据转移至二维目标域当中。而且转移后的源域数据与同类别的(在附图中表示为透明度相同)目标域数据样本能够聚合在相近位置。转移后的源域样本能够有效作为目标域的训练样本。

通过本发明专利的方法后，目标域图像的分类准确率如图3所示。可以发现，本发明专利提供的方法在图片的识别中，在提供少量有标签目标域图片的情况下，对未知标签的待预测目标域图片的预测效果能够有效超过现有的图片分类方案，展示了该发明专利的实用性。

以上所述，仅为本发明专利优选的实施例，但本发明专利的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明专利所公开的范围内，根据本发明专利的技术方法及其发明专利构思加以等同替换或改变，都属于本发明专利的保护范围。

Claims

1.一种面向异构领域适应的图像数据半监督最优预测方法，其特征在于包括以下步骤：

S1：从数据库中得到具有多种类别的、不同领域的异构数据，所述异构数据是以不同的维度存在的文本或者图像特征，并根据半监督优化的Gromov-Wasserstein差异度量两个领域分布的差异程度；源域采用图像数据，并用传统的尺度不变特征进行表示，而目标域以图像数据用卷积神经网络VGG进行特征提取；源域和目标域分别降维成两维和三维异构数据，并用坐标系表示，源域数据和目标域数据均有三种类别；具体包括：

S21：源域数据表示为有标注信息和无标注信息的目标域数据表示为/>这里X表示数据特征，上下标s、l、u分别数据表示来自于源域、有标注目标域和无标注目标域，n为数据数量，d为数据特征维度；下标t代表整个目标域，是领域l、u的并集；

S22：采用核函数计算两个领域数据的度量矩阵M_s,M_t；以传输矩阵T为变量，基于最优传输的基本思想构建熵Gromov-Wasserstein差异度量函数

S23：对于含有相同标注信息，即类别相同的领域数据，它们在传输后的分布接近；利用有标注的目标域数据X_l及其相应类标，构建正则化项Ω_l(T)；

S24：对无标注的目标域数据的概率转移作出类别限制，构建正则化项Ω_u(T)；

S25：加权组合Ω_l(T)和Ω_u(T)，得到半监督最优传输方法的最终目标函数/>

S2：采用基于相对熵的投影梯度下降法迭代求解传输矩阵，重复迭代算法直到算法收敛到设定范围；

S3：利用传输矩阵进行源域数据转移，后根据转移后的数据对未标记的目标域数据进行预测，目标域图像的分类，在图片的识别中，在提供少量有标签目标域图片的情况下，对未知标签的待预测目标域图片的预测效果能够有效超过现有的图片分类方案。

2.根据权利要求1所述的一种面向异构领域适应的图像数据半监督最优预测方法，其特征在于步骤S2中，训练最优传输模型的具体方法为：

S31：采用指数梯度法，计算第τ轮的传输矩阵T_τ的指数梯度

S32：采用相对熵，即KL距离将指数梯度投影至传输矩阵的定义空间，得到关于第τ+1轮的转移矩阵T_τ+1的正则化最优传输问题；

S33：采用Sinkhorn固定点法解该最优传输问题，得到第τ+1轮的传输矩阵T_τ+1；

S34：重复迭代直到传输矩阵收敛。

3.根据权利要求1所述的一种面向异构领域适应的半监督最优传输方法，其特征在于步骤S3具体包括：

S41：通过Gromov-Wasserstein重心法，利用计算出的最优转移矩阵得到源域数据转移；

S42：将转移后的源域样本以及有标注的目标域作为训练样本，对未知标签的待预测目标域样本作出预测。