CN112419324A

CN112419324A - 一种基于半监督任务驱动的医学图像数据扩充方法

Info

Publication number: CN112419324A
Application number: CN202011329403.2A
Authority: CN
Inventors: 潘晓光; 王小华; 尚方信; 令狐彬; 张娜
Original assignee: Shanxi Sanyouhe Smart Information Technology Co Ltd
Current assignee: Shanxi Sanyouhe Smart Information Technology Co Ltd
Priority date: 2020-11-24
Filing date: 2020-11-24
Publication date: 2021-02-26
Anticipated expiration: 2040-11-24
Also published as: CN112419324B

Abstract

本发明属于图像数据扩充领域，具体涉及一种基于半监督任务驱动的医学图像数据扩充方法，包括下列步骤：数据采集：获取相关的医学图像数据集，对其类别进行标注；数据扩充：使用任务驱动的数据扩充方法实现医学图像的数据扩充；构建方法：构建数据扩充方法用于医学图像的数据集扩充；数据集保存：将扩充后的数据集与原数据集结合，保存数据集。本发明通过使用一种半监督任务驱动的数据扩充方法，解决了在有限的训练数据设置中获得鲁棒分割的问题，并使得生成的增强图像提高了医学图像的分割性。本发明用于医学图像数据的扩充。

Description

一种基于半监督任务驱动的医学图像数据扩充方法

技术领域

本发明属于图像数据扩充领域，具体涉及一种基于半监督任务驱动的医学图像数据扩充方法。

背景技术

数据扩充是一种基于生成合成图像-标签对来扩大训练集的简单技术，其思想是以一种标签保持不变的方式转换图像，或者对图像和标签都定义了转换，但由于随机仿射变换，随机弹性变换和随机对比变换等扩充方法未能显著提升医学图像的分割性能，通过一种新的任务驱动的数据扩充方法，以学习有限的标记数据，其中合成数据生成器，能为分割任务提高优化性能。

准确的医学图像分割对于当前的临床应用至关重要，但获取大量的标注示例对于医学图像来说是很困难的，导致医学图像的分割准确效果不佳。目前医学图像的数据扩充是通过随机仿射变换，随机弹性变换和随机对比变换等方法进行，但实验结果表明当前方法生成的数据在本质上是不真实的，且效果不太理想。

发明内容

针对上述目前医学图像的数据扩充的数据不真实的技术问题，本发明提供了一种效率高、分割准确率高、成本低的一种基于半监督任务驱动的医学图像数据扩充方法。

为了解决上述技术问题，本发明采用的技术方案为：

一种基于半监督任务驱动的医学图像数据扩充方法，包括下列步骤：

S1、数据采集：获取相关的医学图像数据集，对其类别进行标注；

S2、数据扩充：使用任务驱动的数据扩充方法实现医学图像的数据扩充；

S3、构建方法：构建数据扩充方法用于医学图像的数据集扩充；

S4、数据集保存：将扩充后的数据集与原数据集结合，保存数据集。

所述S1中的数据采集通过获取相关的医学图像公共数据集，对数据集进行筛选、划分操作，构建医学图像数据集。

所述S3中，所述构建方法用于生成扩充数据集，(X_G,Y_G)＝G((X_L,Y_L),z；w_G)，其中G(·，·；w_G)为数据扩充的变换方法，z为变换的随机分量，w_G为变换的参数，其中数据扩充方法G，通过定义两个条件生成器，分别为变形场生成器和强度场生成器列构建形状和强度变化，通过该变换方法，对输入图像进行图像变换，获得扩充数据集，其中，训练变形场发生器G_v用于输出变形场的变换信息，G_v的变换参数为w_Gv，通过练数据集图像X_L和随机抽取的z向量作为输入，用于生成稠密的逐像素变形场

根据生成的变形场v对输入图像及对应的标签进行双线性插值，获得扩充数据集X_Gv和相对应的标签集Y_Gv，其表达方式为：

训练强度场生成器G_I用于输出加性强度掩码变换，G_I的变换参数为w_GI，输入训练数据集图像X_L和随机抽取的单位高斯分布的z向量作为输入，输入加性强度掩码

然后将ΔI添加到X_L中，获得扩充图像集X_GI和相对应的标签集Y_GI，其表达方式为：

通过变形场发生器和强度场生成器方法用于数据扩充：

所述S4中数据结合的方法为：将扩充后的数据集与原数据集结合，设X_L为训练数据集，Y_L为对应的标签数据集，(X_N,Y_N)＝(X_L∪X_G,Y_L∪Y_G)，所述X_G、Y_G表示扩充的数据集和相对应的标签数据集。

本发明与现有技术相比，具有的有益效果是：

本发明通过使用一种半监督任务驱动的数据扩充方法，解决了在有限的训练数据设置中获得鲁棒分割的问题，并使得生成的增强图像提高了医学图像的分割性。

附图说明

图1为本发明的流程示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

一种基于半监督任务驱动的医学图像数据扩充方法，如图1所示，包括下列步骤：

步骤1、数据采集：获取相关的医学图像数据集，对其类别进行标注。

步骤2、数据扩充：使用任务驱动的数据扩充方法实现医学图像的数据扩充。

步骤3、构建方法：构建数据扩充方法用于医学图像的数据集扩充。

步骤4、数据集保存：将扩充后的数据集与原数据集结合，保存数据集。

进一步，步骤1中的数据采集通过获取相关的医学图像公共数据集，对数据集进行筛选、划分操作，构建医学图像数据集。

进一步，步骤3中，构建方法用于生成扩充数据集，(X_G,Y_G)＝G((X_L,Y_L),z；w_G)，其中G(·，·。w_G)为数据扩充的变换方法，z为变换的随机分量，w_G为变换的参数，其中数据扩充方法G，通过定义两个条件生成器，分别为变形场生成器和强度场生成器列构建形状和强度变化，通过该变换方法，对输入图像进行图像变换，获得扩充数据集，其中，训练变形场发生器G_v用于输出变形场的变换信息，G_v的变换参数为w_Gv，通过练数据集图像X_L和随机抽取的z向量作为输入，用于生成稠密的逐像素变形场

通过变形场发生器和强度场生成器方法用于数据扩充：

进一步，步骤4中数据结合的方法为：将扩充后的数据集与原数据集结合，设X_L为训练数据集，Y_L为对应的标签数据集，(X_N,Y_N)＝(X_L∪X_G,Y_L∪Y_G)，X_G、Y_G表示扩充的数据集和相对应的标签数据集。

上面仅对本发明的较佳实施例作了详细说明，但是本发明并不限于上述实施例，在本领域普通技术人员所具备的知识范围内，还可以在不脱离本发明宗旨的前提下作出各种变化，各种变化均应包含在本发明的保护范围之内。

Claims

1.一种基于半监督任务驱动的医学图像数据扩充方法，其特征在于：包括下列步骤：

2.根据权利要求1所述的一种基于半监督任务驱动的医学图像数据扩充方法，其特征在于：所述S1中的数据采集通过获取相关的医学图像公共数据集，对数据集进行筛选、划分操作，构建医学图像数据集。

3.根据权利要求1所述的一种基于半监督任务驱动的医学图像数据扩充方法，其特征在于：所述S3中，所述构建方法用于生成扩充数据集，(X_G,Y_G)＝G((X_L,Y_L),z；w_G)，其中G(·，·；w_G)为数据扩充的变换方法，z为变换的随机分量，w_G为变换的参数，其中数据扩充方法G，通过定义两个条件生成器，分别为变形场生成器和强度场生成器列构建形状和强度变化，通过该变换方法，对输入图像进行图像变换，获得扩充数据集，其中，训练变形场发生器G_v用于输出变形场的变换信息，G_v的变换参数为w_Gv，通过练数据集图像X_L和随机抽取的z向量作为输入，用于生成稠密的逐像素变形场

通过变形场发生器和强度场生成器方法用于数据扩充：

4.根据权利要求1所述的一种基于半监督任务驱动的医学图像数据扩充方法，其特征在于：所述S4中数据结合的方法为：将扩充后的数据集与原数据集结合，设X_L为训练数据集，Y_L为对应的标签数据集，(X_N,Y_N)＝(X_L∪X_G,Y_L∪Y_G)，所述X_G、Y_G表示扩充的数据集和相对应的标签数据集。