CN114663318A

CN114663318A - 基于生成对抗网络的眼底图像生成方法与***

Info

Publication number: CN114663318A
Application number: CN202210574154.6A
Authority: CN
Inventors: 夏雪; 蔡超; 方玉明; 姜文晖; 左一帆; 陈强
Original assignee: Jiangxi University of Finance and Economics
Current assignee: Jiangxi University of Finance and Economics
Priority date: 2022-05-25
Filing date: 2022-05-25
Publication date: 2022-06-24
Anticipated expiration: 2042-05-25
Also published as: CN114663318B

Abstract

本发明提出一种基于生成对抗网络的眼底图像生成方法与***，所述方法包括：获取健康视网膜眼底彩照数据集，对健康视网膜眼底彩照数据集中的原始图像进行医学图像预处理；构建基于注意力机制的图像生成器；构建得到视网膜眼底图像结构与纹理模块，以及引入眼底图片血管生成辅助模块，其中视网膜眼底图像结构与纹理模块与眼底图片血管生成辅助模块用于辅助图像生成器；输入用于生成眼底图像的随机高斯噪声，根据基于注意力机制的图像生成器，利用视网膜眼底图像结构与纹理模块以及眼底图片血管生成辅助模块，以最终生成眼底图像。本发明可为自动眼病诊断算法提供良好质量的眼底图像，提高自动眼病诊断算法准确度。

Description

基于生成对抗网络的眼底图像生成方法与***

技术领域

本发明涉及计算机图像技术领域，特别涉及一种基于生成对抗网络的眼底图像生成方法与***。

背景技术

目前，通过分析视网膜眼底图像可为眼科疾病提供诊断。例如，老年性黄斑变性(AMD)、糖尿病视网膜病变 (DR)、青光眼以及心血管疾病。因此，常态化大规模的眼病筛查十分必要。然而，当前仍缺少经验丰富的读图医生，阻碍了眼底疾病的大规模筛查。

近年来，研究人员开始关注机器学习辅助眼科疾病的自动辅助诊断技术，尤其是在病灶分割与眼病分级方面，这些工作都需要专业的眼科医生标注的眼底照片数据。然而，目前公开可用的高质量视网膜眼底数据集非常少，而自动眼病诊断算法需要大量的高质量且标记好的眼底图像。此外，由于眼底照片拍摄时的设备不同、拍摄环境以及拍摄者的操作不同，会导致拍摄到的眼底图像质量差异很大。

基于此，有必要提出一种能够生成高质量的视网膜眼底图像的方法，以减轻专业的眼科医生眼底图片标注的精力耗费，并推动人工智能在眼科临床领域的发展。

发明内容

鉴于上述状况，本发明的主要目的是为了提出一种基于生成对抗网络的眼底图像生成方法与***，以解决上述技术问题。

本发明实施例提出一种基于生成对抗网络的眼底图像生成方法，其中，所述方法包括如下步骤：

步骤一：获取健康视网膜眼底彩照数据集，对所述健康视网膜眼底彩照数据集中的原始图像进行医学图像预处理，其中进行医学图像预处理用于引导眼底图像的生成；

步骤二：构建基于注意力机制的图像生成器；

步骤三：构建得到视网膜眼底图像结构与纹理模块，以及引入眼底图片血管生成辅助模块，其中所述视网膜眼底图像结构与纹理模块与所述眼底图片血管生成辅助模块用于辅助所述图像生成器；

步骤四：输入用于得到生成眼底图像的随机高斯噪声，根据所述基于注意力机制的图像生成器，利用所述视网膜眼底图像结构与纹理模块以及所述眼底图片血管生成辅助模块，以最终得到生成眼底图像。

本发明为一阶段端对端的用于生成视网膜眼底图像的生成对抗网络模型；具体的，首先获取健康视网膜眼底彩照数据集，然后构建基于注意力机制的图像生成器，用于更好地获得图像的全局特征；利用视网膜眼底图像结构与纹理模块，测算生成眼底图像与真实眼底图像之间的差异大小，用于引导生成器生成的图像在图像结构与纹理上与真实眼底图像更接近；并在此基础上，引入眼底图片血管生成辅助模块，使用训练好的眼底图像血管分割网络，提取血管特征信息，用于辅助生成器生成血管信息。经对比试验验证：本发明在生成图像的视觉质量上以及结构上都有很好的表现。

所述基于生成对抗网络的眼底图像生成方法，其中，在所述步骤一中，对所述健康视网膜眼底彩照数据集中的原始图像进行医学图像预处理的方法包括如下步骤：

去除原始图像中的黑色背景区域，保留彩色眼底图像区域；

将所述健康视网膜眼底彩照数据集中的所有原始图像均裁剪成128×128的固定尺寸；

将所述原始图像中的左眼图像进行水平翻转以得到水平翻转后的左眼图像以备用；

将所有的所述原始图像进行标准化处理，以使像素值分布在

区间，以加快模型训练速度。

所述基于生成对抗网络的眼底图像生成方法，其中，在所述步骤三中，所述视网膜眼底图像结构与纹理模块对应有一视网膜眼底图像结构与纹理损失函数，所述视网膜眼底图像结构与纹理损失函数用于测算生成图片与真实图片之间的差异；

其中所述视网膜眼底图像结构与纹理损失函数的计算方法包括如下步骤：

计算生成眼底图像与真实眼底图像之间的纹理相似度；

计算生成眼底图像与真实眼底图像之间的结构相似度；

根据所述纹理相似度以及所述结构相似度，计算得到深度图像纹理和结构相似度；

根据所述深度图像纹理和结构相似度，计算得到所述视网膜眼底图像结构与纹理损失函数。

所述基于生成对抗网络的眼底图像生成方法，其中，所述纹理相似度的计算公式为：

其中，

表示所述纹理相似度，

表示生成眼底图像

的第

层卷积层的第

个特征图，

表示真实眼底图像

的第

层卷积层的第

个特征图，

表示生成眼底图像

的第

层卷积层的第

个特征图的均值，

表示真实眼底图像

的第

层卷积层的第

个特征图的均值，

为大于零的第一常数，

表示卷积层的索引，

表示特征图的索引。

所述基于生成对抗网络的眼底图像生成方法，其中，所述结构相似度的计算公式为：

其中，

表示所述结构相似度，

表示生成眼底图像

的第

层卷积层的第

个特征图的方差，

表示真实眼底图像

的第

层卷积层的第

个特征图的方差，

表示真实眼底图像

与生成眼底图像

之间的协方差，

为大于零的第二常数。

所述基于生成对抗网络的眼底图像生成方法，其中，所述深度图像纹理和结构相似度的计算公式表示为：

其中，

表示所述深度图像纹理和结构相似度，

表示第

个卷积层第

个特征图对应的第一学习权重，

表示第

个卷积层第

个特征图对应的第二权重，

表示大于零的第一学习权重，

表示大于零的第二学习权重；

所述视网膜眼底图像结构与纹理损失函数表示为：

其中，

表示所述视网膜眼底图像结构与纹理损失函数。

所述基于生成对抗网络的眼底图像生成方法，其中，在所述步骤三中，所述眼底图片血管生成辅助模块对应有一结构相似度损失函数，所述结构相似度损失函数表示为：

其中，

表示所述结构相似度损失函数，

表示结构相似度指标。

所述基于生成对抗网络的眼底图像生成方法，其中，

其中，

表示生成眼底图像

的均值，

表示真实眼底图像

的均值，

均为大于零的常数，

表示生成眼底图像

的方差，

表示真实眼底图像

的方差。

所述基于生成对抗网络的眼底图像生成方法，其中，在所述步骤四中，通过组合损失函数构建的生成对抗网络进行训练，以得到所述生成眼底图像，其中，所述组合损失函数表示为：

其中，

表示所述组合损失函数，

表示第一函数权重，

表示第二函数权重，

表示第三函数权重，

表示第四函数权重，

为第一GAN基础损失函数，

为第二GAN基础损失函数。

本发明还提出一种基于生成对抗网络的眼底图像生成***，其中，所述***包括：

预处理模块，用于获取健康视网膜眼底彩照数据集，对所述健康视网膜眼底彩照数据集中的原始图像进行医学图像预处理，其中进行医学图像预处理用于引导眼底图像的生成；

第一构建模块，用于构建基于注意力机制的图像生成器；

第二构建模块，用于构建得到视网膜眼底图像结构与纹理模块，以及引入眼底图片血管生成辅助模块，其中所述视网膜眼底图像结构与纹理模块与所述眼底图片血管生成辅助模块用于辅助所述图像生成器；

图像生成模块，用于输入用于得到生成眼底图像的随机高斯噪声，根据所述基于注意力机制的图像生成器，利用所述视网膜眼底图像结构与纹理模块以及所述眼底图片血管生成辅助模块，以最终得到生成眼底图像。

本发明的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实施例了解到。

附图说明

图1为本发明提出的基于生成对抗网络的眼底图像生成方法的流程图；

图2为本发明中生成对抗网络模型的结构示意图；

图3为本发明提出的基于生成对抗网络的眼底图像生成***的结构示意图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。

参照下面的描述和附图，将清楚本发明的实施例的这些和其他方面。在这些描述和附图中，具体公开了本发明的实施例中的一些特定实施方式，来表示实施本发明的实施例的原理的一些方式，但是应当理解，本发明的实施例的范围不受此限制。相反，本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。

请参阅图1与图2，本发明提出一种基于生成对抗网络的眼底图像生成方法，其中，所述方法包括如下步骤：

S101，获取健康视网膜眼底彩照数据集，对所述健康视网膜眼底彩照数据集中的原始图像进行医学图像预处理。

其中，进行医学图像预处理用于引导眼底图像的生成。

在本步骤中，从公开的眼底数据集DDR、Messidor和ODIR-5K中，人工挑选正常且质量高的眼底彩照，形成新的数据集；与眼科医院合作的数据集中挑选正常且质量高的眼底彩照，形成健康视网膜眼底彩照数据集。在得到了健康视网膜眼底彩照数据集之后，对健康视网膜眼底彩照数据集中的原始图像进行预处理。

具体的，对健康视网膜眼底彩照数据集中的原始图像进行医学图像预处理的方法包括如下步骤：

S1011，去除原始图像中的黑色背景区域，保留彩色眼底图像区域；

S1012，将健康视网膜眼底彩照数据集中的所有原始图像均裁剪成128×128的固定尺寸；

S1013，将原始图像中的左眼图像进行水平翻转以得到水平翻转后的左眼图像以备用；

S1014，将所有的原始图像进行标准化处理，以使像素值分布在

区间，以加快模型训练速度。

S102，构建基于注意力机制的图像生成器。

在本步骤中，采用Wasserstein GAN作为模型主干网，在图像生成器中嵌入Transformer Encoder模块，该Transformer Encoder模块由自注意力、标准化以及前向MLP操作组成。

S103，构建得到视网膜眼底图像结构与纹理模块，以及引入眼底图片血管生成辅助模块，其中所述视网膜眼底图像结构与纹理模块与所述眼底图片血管生成辅助模块用于辅助所述图像生成器。

在本步骤中，视网膜眼底图像结构与纹理模块对应有一视网膜眼底图像结构与纹理损失函数。其中，视网膜眼底图像结构与纹理损失函数用于测算生成图片与真实图片之间的差异。

具体的，视网膜眼底图像结构与纹理损失函数的计算方法包括如下步骤：

S1031，计算生成眼底图像与真实眼底图像之间的纹理相似度。

其中，纹理相似度的计算公式为：

其中，

表示所述纹理相似度，

表示生成眼底图像

的第

层卷积层的第

个特征图，

表示真实眼底图像

的第

层卷积层的第

个特征图，

表示生成眼底图像

的第

层卷积层的第

个特征图的均值，

表示真实眼底图像

的第

层卷积层的第

个特征图的均值，

为大于零的第一常数，

表示卷积层的索引，

表示特征图的索引。

在此需要补充说明的是，

的作用是为了避免分母为零。特征图是有一个经过修改后的VGG模型提取得到的。

S1032，计算生成眼底图像与真实眼底图像之间的结构相似度。

结构相似度的计算公式为：

其中，

表示所述结构相似度，

表示生成眼底图像

的第

层卷积层的第

个特征图的方差，

表示真实眼底图像

的第

层卷积层的第

个特征图的方差，

表示真实眼底图像

与生成眼底图像

之间的协方差，

为大于零的第二常数，

的作用也是为了避免分母为零。

S1033，根据纹理相似度以及结构相似度，计算得到深度图像纹理和结构相似度。

其中，深度图像纹理和结构相似度的计算公式表示为：

其中，

表示所述深度图像纹理和结构相似度，

表示第

个卷积层第

个特征图对应的第一学习权重，

表示第

个卷积层第

个特征图对应的第二权重，

表示大于零的第一学习权重，

表示大于零的第二学习权重。

S1034，根据深度图像纹理和结构相似度，计算得到视网膜眼底图像结构与纹理损失函数。

在本实施例中，视网膜眼底图像结构与纹理损失函数表示为：

其中，

表示所述视网膜眼底图像结构与纹理损失函数。在本发明中，最终目标是为了将上述的视网膜眼底图像结构与纹理损失函数最小化。

进一步的，使用训练好的眼底图片血管生成辅助模块，提取真实眼底图像与生成眼底图像的血管特征信息，比较两张图片提取血管特征的SSIM（结构相似度损失）损失情况，来引导图像生成器生成更好的血管结构信息，使得图像生成器的生成眼底图像与真实眼底图像更接近（请参见图2中的生成对抗网络模型）。

其中，上述的眼底图片血管生成辅助模块对应有一结构相似度损失函数。结构相似度损失函数表示为：

其中，

表示所述结构相似度损失函数，

表示结构相似度指标。

其中，

表示生成眼底图像

的均值，

表示真实眼底图像

的均值，

均为大于零的常数，

表示生成眼底图像

的方差，

表示真实眼底图像

的方差。

S104，输入用于得到生成眼底图像的随机高斯噪声，根据所述基于注意力机制的图像生成器，利用所述视网膜眼底图像结构与纹理模块以及所述眼底图片血管生成辅助模块，以最终得到生成眼底图像。

其中，生成对抗网络的训练过程中，使用RMSprop优化器，图像生成器和判别器的学习率设置为固定值，分别为

和

，一次送入生成对抗网络模型的批次大小设置为8。图像生成器采用组合损失函数：包括GAN生成器的损失函数、最小绝对值误差损失函数、视网膜眼底图像结构与纹理损失函数以及真实眼底图像和生成眼底图像之间的结构相似度损失函数。

具体的，通过组合损失函数构建的生成对抗网络进行训练，以得到所述生成眼底图像。其中，组合损失函数表示为：

其中，

表示所述组合损失函数，

表示第一函数权重，

表示第二函数权重，

表示第三函数权重，

表示第四函数权重，

为第一GAN基础损失函数，

为第二GAN基础损失函数。

一般的，在经验上设置

。

请参阅图3，本发明还提出一种基于生成对抗网络的眼底图像生成***，其中，所述***包括：

第一构建模块，用于构建基于注意力机制的图像生成器；

应当理解的，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列（PGA），现场可编程门阵列（FPGA）等。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、 “示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。