CN113221902A

CN113221902A - 基于数据分布扩充的跨域自适应语义分割方法及***

Info

Publication number: CN113221902A
Application number: CN202110511220.0A
Authority: CN
Inventors: 张兆翔; 宋纯锋; 王玉玺
Original assignee: Institute of Automation of Chinese Academy of Science
Current assignee: Institute of Automation of Chinese Academy of Science
Priority date: 2021-05-11
Filing date: 2021-05-11
Publication date: 2021-08-06
Anticipated expiration: 2041-05-11
Also published as: CN113221902B

Abstract

本发明涉及一种基于数据分布扩充的跨域自适应语义分割方法及***，所述跨域自适应语义分割方法包括：获取不同域训练数据集；分别对源域图像及目标域图像进行傅里叶变换，得到对应的源频域图像及目标频域图像；对源频域图像进行高频滤波，得到高频信息；对目标频域图像进行低频率波，得到低频信息；根据高频信息及低频信息，通过傅里叶反变换，得到转换图像；基于转换图像，对源域图像及目标域图像进行数据增强，得到源域扩充图像及目标域扩充图像；确定第一语义分割损失模型、第一对抗损失函数、第二对抗损失函数、语义一致性损失函数；确定第二语义分割损失模型；基于第二语义分割损失模型，可对待处理图像进行准确的语义分割，提高分割精度。

Description

基于数据分布扩充的跨域自适应语义分割方法及***

技术领域

本发明涉及计算机视觉及模式识别技术领域，特别涉及一种基于数据分布扩充的跨域自适应语义分割方法及***。

背景技术

领域自适应作为迁移学习的一种，是机器学习领域一个重要且具有挑战性的任务，在图像识别，目标检测以及图像语义分割等领域具有广泛应用。在大数据时代，每天都会有海量的数据产生，但能够用于机器学习的标注数据却很难获取，因为这些数据的标注有些需要耗时的精细标注，比如像素级别的语义分割标注，有些需要标注者有足够的主业知识及经验，比如医学影像的标注，还有些由于数据量极大，标注困难，精度较低。所以如何利用现有的标注样本，把这部分数据学到的知识迁移到新数据中去，是一个非常具有实际意义的任务。

发明内容

为了解决现有技术中的上述问题，即为了提高语义分割精度，本发明的目的在于提供一种基于数据分布扩充的跨域自适应语义分割方法及***。

为解决上述技术问题，本发明提供了如下方案：

一种基于数据分布扩充的跨域自适应语义分割方法，所述跨域自适应语义分割方法包括：

获取不同域训练数据集，所述训练数据集包括多个有标签的源域图像和多个无标签的目标域图像；

针对每一源域图像及目标域图像，分别对源域图像及目标域图像进行傅里叶变换，得到对应的源频域图像及目标频域图像；

对源频域图像进行高频滤波，得到高频信息；对目标频域图像进行低频率波，得到低频信息；

根据高频信息及低频信息，通过傅里叶反变换，得到转换图像；

基于转换图像，对源域图像及目标域图像进行数据增强，得到源域扩充图像及目标域扩充图像；

根据各源域图像及对应的标签，确定源域的第一语义分割损失模型；

基于领域判别器，根据各对源域图像和目标域图像，构造第一对抗损失函数；根据各对源域扩充图像及目标域扩充图像，构造第二对抗损失函数；

根据各目标域图像及对应的目标域扩充图像，构造语义一致性损失函数；

基于所述第一对抗损失函数、第二对抗损失函数、语义一致性损失函数及源域的第一语义分割损失模型，确定目标域的第二语义分割损失模型；

基于所述目标域的第二语义分割损失模型，对待处理图像进行语义分割。

可选地，所述根据高频信息及低频信息，通过傅里叶反变换，得到转换图像，具体包括：

将高频信息与低频信息结合，得到结合信息；

对所述结合信息，进行傅里叶反变换，得到转换图像。

可选地，所述基于转换图像，对源域图像及目标域图像进行数据增强，得到源域扩充图像及目标域扩充图像，具体包括：

根据设定幅值，通过所述转换图像，确定数据增强序列；

通过所述数据增强序列，分别对源域图像及目标域图像进行扩充，得到对应的源域扩充图像及目标域扩充图像。

可选地，根据以下公式，确定源域的第一语义分割损失模型L_seg(x_s，y_s)：

其中，H表示源域图像的长，W表示源域图像的宽，C表示源域图像的类别；h,w表示像素位置，c表示该像素类别，x_s表示源域图像，y_s表示源域图像x_s对应的标签数据，

表示在位置(h，w)处类别c的值，

表示位置(h，w)处的预测结果。

可选地，根据以下公式，确定第一对抗损失函数L_adv(x_s，x_t)：

其中，D表示领域判别器函数，x_s表示源域图像，x_t表示目标域图像，

表示在源域图像x_s上的期望、

表示在目标域图像x_t上的期望，

表示针对源域图像x_s的预测结果，

表示针对目标域图像x_t的预测结果。

可选地，根据以下公式，确定第二对抗损失函数

其中，D表示领域判别器函数，

表示源域扩充图像，

表示目标域扩充图像，

表示在源域扩充图像

上的期望、

表示在目标域扩充图像

上的期望，

表示针对源域扩充图像

的预测结果，

表示针对目标域扩充图像

的预测结果。

可选地，根据以下公式，确定语义一致性损失函数

其中，x_t表示目标域图像，

表示目标域扩充图像，

表示针对目标域图像x_t的预测结果，

表示针对目标域扩充图像

的预测结果，D_KL(.)表示KL散度。

为解决上述技术问题，本发明还提供了如下方案：

一种基于数据分布扩充的跨域自适应语义分割***，所述跨域自适应语义分割***包括：

获取单元，用于获取不同域训练数据集，所述训练数据集包括多个有标签的源域图像和多个无标签的目标域图像；

频域变换单元，用于针对每一源域图像及目标域图像，分别对源域图像及目标域图像进行傅里叶变换，得到对应的源频域图像及目标频域图像；

高斯滤波单元，用于对源频域图像进行高频滤波，得到高频信息；对目标频域图像进行低频率波，得到低频信息；

空域变换单元，用于根据高频信息及低频信息，通过傅里叶反变换，得到转换图像；

数据增强单元，用于基于转换图像，对源域图像及目标域图像进行数据增强，得到源域扩充图像及目标域扩充图像；

第一建模单元，用于根据各源域图像及对应的标签，确定源域的第一语义分割损失模型；

对抗函数建立单元，用于基于领域判别器，根据各对源域图像和目标域图像，构造第一对抗损失函数；根据各对源域扩充图像及目标域扩充图像，构造第二对抗损失函数；

语义一致性损失函数建立单元，用于根据各目标域图像及对应的目标域扩充图像，构造语义一致性损失函数；

第二建模单元，用于基于所述第一对抗损失函数、第二对抗损失函数、语义一致性损失函数及源域的第一语义分割损失模型，确定目标域的第二语义分割损失模型；

语义分割单元，用于基于所述目标域的第二语义分割损失模型，对待处理图像进行语义分割。

为解决上述技术问题，本发明还提供了如下方案：

一种基于数据分布扩充的跨域自适应语义分割***，包括：

处理器；以及

被安排成存储计算机可执行指令的存储器，所述可执行指令在被执行时使所述处理器执行以下操作：

为解决上述技术问题，本发明还提供了如下方案：

一种计算机可读存储介质，所述计算机可读存储介质存储一个或多个程序，所述一个或多个程序当被包括多个应用程序的电子设备执行时，使得所述电子设备执行以下操作：

根据本发明的实施例，本发明公开了以下技术效果：

本发明对源域和目标域图像进行分布扩充，并在对抗学习中建立第一对抗损失函数和第二对抗损失函数；针对无标签的目标域数据，采用一种语义一致性损失，通过无监督的方法更好的学到目标域的特征。该发明从数据分布扩充角度解决源域和目标域之间的领域不一致问题，从而提高对无标签待处理图像的语义分割精度。

附图说明

图1是本发明基于数据分布扩充的跨域自适应语义分割方法的流程图；

图2是基于数据分布扩充的跨域自适应语义分割***的模块结构示意图；

符号说明：

获取单元—1，频域变换单元—2，高斯滤波单元—3，空域变换单元—4，数据增强单元—5，第一建模单元—6，对抗函数建立单元—7，语义一致性损失函数建立单元—8，第二建模单元—9，语义分割单元—10。

具体实施方式

下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是，这些实施方式仅仅用于解释本发明的技术原理，并非旨在限制本发明的保护范围。

本发明的目的是提供一种基于数据分布扩充的跨域自适应语义分割方法，对源域和目标域图像进行分布扩充，并在对抗学习中建立第一对抗损失函数和第二对抗损失函数；针对无标签的目标域数据，采用一种语义一致性损失，通过无监督的方法更好的学到目标域的特征。该发明从数据分布扩充角度解决源域和目标域之间的领域不一致问题，从而提高对无标签待处理图像的语义分割精度。

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

如图1所示，本发明基于数据分布扩充的跨域自适应语义分割方法包括：

步骤100：获取不同域训练数据集，所述训练数据集包括多个有标签的源域图像和多个无标签的目标域图像；

步骤200：针对每一源域图像及目标域图像，分别对源域图像及目标域图像进行傅里叶变换，得到对应的源频域图像及目标频域图像；

步骤300：对源频域图像进行高频滤波，得到高频信息；对目标频域图像进行低频率波，得到低频信息；

步骤400：根据高频信息及低频信息，通过傅里叶反变换，得到转换图像；

步骤500：基于转换图像，对源域图像及目标域图像进行数据增强，得到源域扩充图像及目标域扩充图像；

步骤600：根据各源域图像及对应的标签，确定源域的第一语义分割损失模型；

步骤700：基于领域判别器，根据各对源域图像和目标域图像，构造第一对抗损失函数；根据各对源域扩充图像及目标域扩充图像，构造第二对抗损失函数；

步骤800：根据各目标域图像及对应的目标域扩充图像，构造语义一致性损失函数；

步骤900：基于所述第一对抗损失函数、第二对抗损失函数、语义一致性损失函数及源域的第一语义分割损失模型，确定目标域的第二语义分割损失模型；

步骤1000：基于所述目标域的第二语义分割损失模型，对待处理图像进行语义分割。

其中，在步骤100与步骤200之前，本发明基于数据分布扩充的跨域自适应语义分割方法还包括：对训练数据集进行归一化处理，得到统一大小的训练数据集。

例如，在本实施例中，归一化处理得到512×1024×3像素的图像数据。

在本发明中，在数据输入阶段，对源域图像和目标域图像数据分布进行扩充，具体方法包括首先将源域数据分布向目标域分布方向平移(如步骤400所述)，其次是在平移后的分布上进行随机的数据扩充，扩大源域和目标域的数据分布空间，从而使得源于数据和目标域数据的分布能够更好的对齐(如步骤500所述)。

其中，在步骤400中，所述根据高频信息及低频信息，通过傅里叶反变换，得到转换图像，具体包括：

步骤410：将高频信息与低频信息结合，得到结合信息；

步骤420：对所述结合信息，进行傅里叶反变换，得到转换图像。

具体地，根据以下公式，得到转换图像x′_st：

x′_st＝F^-1([g^l(σ₁).F(x_t)+g^h(σ₂).F(x_s)])；

其中，F(.)表示傅里叶变换，F^-1(.)表示傅里叶反变换，g^l(σ₁)表示低频滤波函数，σ₁表示低频滤波参考系数，g^h(σ₂)表示高频滤波函数，σ₂表示高频滤波参考系数，x_s表示源域图像，x_t表示目标域图像。

转换图像x′_st图像保持有源域的内容信息并且具有目标域的风格信息，从而使得源域图像分布向目标域迁移，为进一步对齐源域和目标域分布做准备。

在步骤500中，所述基于转换图像，对源域图像及目标域图像进行数据增强，得到源域扩充图像及目标域扩充图像，具体包括：

步骤510：根据设定幅值，通过所述转换图像，确定数据增强序列。

其中，数据增强序列T为：

T＝{o₁(λ₁；p)，o₂(λ₂；p)，...，o_N(λ_N；p)}；

其中，N表示维度，o₁(.)表示数据增强操作、λ₁表示操作o₁(.)中参数、p表示操作o₁(.)的幅值。

步骤520：通过所述数据增强序列，分别对源域图像及目标域图像进行扩充，得到对应的源域扩充图像及目标域扩充图像。

进一步地，在步骤600中，可根据以下公式，确定源域的第一语义分割损失模型L_seg(x_s，y_s)：

其中，H表示源域图像的长，W表示源域图像的宽，C表示源域图像的类别；h，w表示像素位置，c表示该像素类别，x_s表示源域图像，y_s表示源域图像x_s对应的标签数据，

表示在位置(h，w)处类别c的值，

表示位置(h，w)处的预测结果。

本发明基于对抗学习的框架，对源域图像和目标域图像在输出层面进行判别学习，使得源域和目标域分布更加一致，并且针对增强之后的源域扩充图像和目标域扩充图像图像，同时进行对抗学习，从而可更好的学到领域不变性特征。

具体地，在步骤700中，可根据以下公式，确定第一对抗损失函数L_adv(x_s，x_t)：

表示在源域图像x_s上的期望、

表示在目标域图像x_t上的期望，

表示针对源域图像x_s的预测结果，

表示针对目标域图像x_t的预测结果。

根据以下公式，确定第二对抗损失函数

其中，D表示领域判别器函数，

表示源域扩充图像，

表示目标域扩充图像，

表示在源域扩充图像

上的期望、

表示在目标域扩充图像

上的期望，

表示针对源域扩充图像

的预测结果，

表示针对目标域扩充图像

的预测结果。

针对无监督的目标域数据，由于所采用的数据增强策略只会扩充数据分布的空间，并不会改变数据内容的分布，以此变换后目标域扩充图像和目标域图像之间保持语义的一致性，通过无监督的方法更好的学到目标域的特征。

具体地，在步骤800中，可根据以下公式，确定语义一致性损失函数

其中，x_t表示目标域图像，

表示目标域扩充图像，

表示针对目标域图像x_t的预测结果，

表示针对目标域扩充图像

的预测结果，D_KL(.)表示KL散度。

优选地，本发明可通过梯度反传算法训练模型，利用训练好的目标域的第二语义分割损失模型在目标域数据集进行测试。首先将目标域测试数据归一化为统一的大小(如512×1024×3像素)，输入训练好的语义分割模型，得到目标域数据的分割结果，并与测试数据标签进行对比，确定本发明中目标域的第二语义分割损失模型的性能。

本发明在数据输入阶段对源域和目标域数据进行分布扩充，主要包括两个方面，一是通过分布平移将源域数据分布向目标域移动，减小两个域的分布差异，二是通过定义好的有约束的数据增强空间，随机生成数据增强序列，扩大源域和目标域数据分布空间，从而更好的对齐源域和目标域的分布；另一方面，本发明通过对抗学习的策略，在输出层面进一步对齐源域和目标域，具体方法包含原图像的对齐和增强后的图像之间的对齐，最后，针对无标签的目标域数据，本发明采用一种语义一致性损失，通过无监督的方法更好的学到目标域的特征。该发明从数据分布扩充角度解决源域和目标域之间的领域不一致问题，通过分布迁移和数据增强两个方面，在输入层对齐两个域的分布，并在基于对抗的学习框架下，取得了优秀的适应性能。

此外，本发明还提供一种基于数据分布扩充的跨域自适应语义分割***，可提高语义分割精度。

如图2所示，本发明基于数据分布扩充的跨域自适应语义分割***包括获取单元1、频域变换单元2、高斯滤波单元3、空域变换单元4、数据增强单元5、第一建模单元6、对抗函数建立单元7、语义一致性损失函数建立单元8、第二建模单元9及语义分割单元10。

具体地，所述获取单元1用于获取不同域训练数据集，所述训练数据集包括多个有标签的源域图像和多个无标签的目标域图像；

所述频域变换单元2用于针对每一源域图像及目标域图像，分别对源域图像及目标域图像进行傅里叶变换，得到对应的源频域图像及目标频域图像；

所述高斯滤波单元3用于对源频域图像进行高频滤波，得到高频信息；对目标频域图像进行低频率波，得到低频信息；

所述空域变换单元4用于根据高频信息及低频信息，通过傅里叶反变换，得到转换图像；

所述数据增强单元5用于基于转换图像，对源域图像及目标域图像进行数据增强，得到源域扩充图像及目标域扩充图像；

所述第一建模单元6用于根据各源域图像及对应的标签，确定源域的第一语义分割损失模型；

所述对抗函数建立单元7用于基于领域判别器，根据各对源域图像和目标域图像，构造第一对抗损失函数；根据各对源域扩充图像及目标域扩充图像，构造第二对抗损失函数；

所述语义一致性损失函数建立单元8用于根据各目标域图像及对应的目标域扩充图像，构造语义一致性损失函数；

所述第二建模单元9用于基于所述第一对抗损失函数、第二对抗损失函数、语义一致性损失函数及源域的第一语义分割损失模型，确定目标域的第二语义分割损失模型；

所述语义分割单元10用于基于所述目标域的第二语义分割损失模型，对待处理图像进行语义分割。

此外，本发明还提供了如下方案：

一种基于数据分布扩充的跨域自适应语义分割***，包括：

处理器；以及

进一步地，本发明还提供了如下方案：

相对于现有技术，本发明基于数据分布扩充的跨域自适应语义分割***、计算机可读存储介质与上述基于数据分布扩充的跨域自适应语义分割方法的有益效果相同，在此不再赘述。

至此，已经结合附图所示的优选实施方式描述了本发明的技术方案，但是，本领域技术人员容易理解的是，本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下，本领域技术人员可以对相关技术特征作出等同的更改或替换，这些更改或替换之后的技术方案都将落入本发明的保护范围之内。