CN115205300B

CN115205300B - 基于空洞卷积和语义融合的眼底血管图像分割方法与***

Info

Publication number: CN115205300B
Application number: CN202211134660.XA
Authority: CN
Inventors: 张红斌; 钟翔; 李志杰; 胡朗; 袁梦; 李广丽
Original assignee: East China Jiaotong University
Current assignee: East China Jiaotong University
Priority date: 2022-09-19
Filing date: 2022-09-19
Publication date: 2022-12-09
Anticipated expiration: 2042-09-19
Also published as: CN115205300A

Abstract

本发明提出一种基于空洞卷积和语义融合的眼底血管图像分割方法与***，包括：获取眼底血管图像数据集，从眼底血管图像数据集中获取眼底血管图像并进行预处理；基于U‑Net模型进行改进以得到改进神经网络；在改进神经网络的跳跃连接部分设计一个多层多尺度空洞卷积结构；在改进神经网络的解码部分设计一个语义融合结构；执行连续三次卷积操作以得到待分割图像，对待分割图像中的像素进行二分类判别，以对眼底血管图像进行分割，并得到一个改进的神经网络模型；根据第一损失函数，对改进的神经网络模型进行辅助训练与测试。本发明能准确有效地对眼底血管图像进行分割，辅助医生的临床诊断工作进而实现高质量的医疗服务。

Description

基于空洞卷积和语义融合的眼底血管图像分割方法与***

技术领域

本发明涉及计算机图像技术领域，特别涉及一种基于空洞卷积和语义融合的眼底血管图像分割方法与***。

背景技术

对人体而言，眼睛是全身唯一能在直视下窥见血管和神经的器官，并且视网膜的循环与脑部及冠脉循环有着相同的解剖生理特征。因此，眼底已成为观察心脑血管、眼球等相关疾病非常重要的窗口。然而，由于人工诊断耗时耗力且效率低，因此借助计算机辅助诊断（Computer-aided Diagnosis，CAD）是提高医生工作效率与诊断精度的重要手段。精细、准确的眼底血管图像分割能辅助医生更好地观察上述疾病，进而做出正确的诊断决策。因此，眼底血管图像分割技术具有较强的临床应用价值，能切实提高医疗服务水平，推动医工深度融合。

现有眼底血管图像分割方法大多基于U-Net网络，取得了较好的分割性能，有力地推动了基于CAD的智能诊断发展，但现有工作存在如下弊端：（1）图像特征受限于有限感受野，眼底血管图像中局部特征提取不充分；（2）由于仅采用卷积操作，眼底血管图像中上下文信息偏少，导致不能准确、完整地分割目标血管；（3）解码器中连续上采样不可避免地丢失了一些血管细节信息。为应对上述问题，应尽可能保留图像中血管细节，从而向医生提供直观的临床诊断信息。

基于此，有必要设计出一种先进高效的眼底血管图像分割方法，以实现兼顾全局上下文信息和来自不同感受野的局部特征，同时尽可能减少细节信息丢失，最终提升眼底血管分割精度，向医生提供更为准确完整的分割结果。

发明内容

鉴于上述状况，本发明的主要目的是为了提出一种基于空洞卷积和语义融合的眼底血管图像分割方法与***，以解决上述技术问题。

本发明实施例提出一种基于空洞卷积和语义融合的眼底血管图像分割方法，其中，所述方法包括如下步骤：

步骤一，获取眼底血管图像数据集，从所述眼底血管图像数据集中获取眼底血管图像，并对所述眼底血管图像进行预处理；

步骤二，基于U-Net模型进行改进设计，以得到改进神经网络；

步骤三，在进行改进设计时，在所述改进神经网络的跳跃连接部分设计一个多层多尺度空洞卷积结构，所述多层多尺度空洞卷积结构用于跨越所述改进神经网络的编码部分与解码部分，以保护眼底血管中的细节信息；

步骤四，在所述改进神经网络的解码部分设计一个语义融合结构，所述语义融合结构用于对解码后的多尺度图像特征进行拼接，并构建成对挤压激励模块，根据所述挤压激励模块对拼接后的多尺度图像特征进行关键信息筛选以最终得到多尺度图像特征融合结果；

步骤五，对所述多尺度图像特征融合结果执行连续三次卷积操作以得到待分割图像，对所述待分割图像中的像素进行二分类判别，以对眼底血管图像进行分割，并得到一个改进的神经网络模型；

步骤六，根据第一损失函数，对所述改进的神经网络模型进行辅助训练，以对训练后的神经网络模型进行测试，从而最终完成眼底血管图像的分割与验证；

所述第一损失函数的表达式为：

其中，

表示第一损失函数，

表示数据总类别数量，

表示类别k的真阳值，

表示类别k的假阴值，

表示像素属于类别k的数量，

，

表示类别k的几何平均置信度，

表示类别k的召回率，

表示输入的训练数据在所有类别上的预测最大值分布，

表示标签为类别k的样本集，

表示训练数据的标签数据，

表示训练数据的序号。

所述基于空洞卷积和语义融合的眼底血管图像分割方法，其中，在所述步骤一中，所述眼底血管图像数据集包括STARE数据集、DRIVE数据集以及CHASEDB1数据集；

对所述眼底血管图像进行预处理的方法包括如下步骤：

将所述眼底血管图像的尺寸统一裁剪至512×512，然后进行图像翻转、图像旋转以及图像高斯模糊操作完成预处理。

所述基于空洞卷积和语义融合的眼底血管图像分割方法，其中，在所述步骤三中，所述多层多尺度空洞卷积结构包括上层图像特征、中层图像特征以及下层图像特征；

其中，对上层图像特征、中层图像特征以及下层图像特征执行包含不同尺度卷积率的级联式空洞卷积。

所述基于空洞卷积和语义融合的眼底血管图像分割方法，其中，对上层图像特征、中层图像特征以及下层图像特征执行包含不同尺度卷积率的级联式空洞卷积的方法包括如下步骤：

对所述上层图像特征执行感受野逐步扩张的级联式空洞卷积，经卷积得到上层图像特征对应的空洞卷积特征，再对空洞卷积特征执行最大池化操作，以获得大尺寸图像的局部特征；

将所述中层图像特征对应的眼底血管图像分割成固定大小的图像块，通过扁平化操作对图像块进行矢量化，执行线性映射将矢量化的图像块转换成低维线性嵌入特征；将所述低维线性嵌入特征输入至Transformer模块中连续12个Transformer层中继续执行线性映射，并进行自注意力加权；对所述低维线性嵌入特征添加位置编码，以建模得到眼底血管图像中的长距离依赖关系，并提取得到图像全局特征；

对所述下层图像特征执行感受野逐步扩张的级联式空洞卷积，然后执行双线性插值将所述下层图像特征提升至与所述中层图像特征相同的尺寸，以获得小尺寸图像的局部特征；

将所述大尺寸图像的局部特征、所述图像全局特征以及所述小尺寸图像的局部特征进行相加以完成特征融合。

所述基于空洞卷积和语义融合的眼底血管图像分割方法，其中，对所述中层图像特征进行处理的步骤中，存在如下公式：

其中，

表示低维线性嵌入特征，

表示执行线性映射的矩阵，

表示位置编码，

表示第

个图像块，

；

所述Transformer层包括规范化层、多头自注意力以及多层感知器，第

个Transformer层的特征变换对应的公式表示为：

其中，

表示经过第

个Transformer层编码后得到的图像特征，

表示经多头注意力加权得到的图像特征，

表示输入图像序列的线性嵌入特征，

表示多层感知器操作，

表示多头自注意力操作，

表示规范化层操作。

所述基于空洞卷积和语义融合的眼底血管图像分割方法，其中，在所述步骤四中，所述语义融合结构对解码后的多尺度图像特征进行拼接的方法包括如下步骤：

语义融合结构对所述改进神经网络的解码部分输出的各层图像特征进行上采样，并恢复为与原始输入图像大小一致，以得到第一上采样特征图

、第二上采样特征图

、第三上采样特征图

以及第四上采样特征图

；

结合所述改进神经网络的编码部分的特征图

，与上述第一上采样特征图

、第二上采样特征图

、第三上采样特征图

以及第四上采样特征图

进行拼接得到新特征图

；

其中，新特征图

。

所述基于空洞卷积和语义融合的眼底血管图像分割方法，其中，在得到了所述新特征图

之后，所述方法还包括：

将所述新特征图

输入至挤压激励模块中，连续执行两个SE操作，以层次化方式筛选所述新特征图

中的关键信息；

其中，所述SE操作包括全局平均池化操作、非线性激活操作以及特征通道加权操作；

所述全局平均池化操作包括如下步骤：

对所述新特征图

的每个通道进行全局平均池化运算以得到特征向量m，其中所述新特征图

的属性为

；

进行全局平均池化运算以得到特征向量m的公式表示为：

其中，

表示新特征图

的高度，

表示新特征图

的宽度，

表示新特征图

的通道数，

表示新特征图

中第

个通道的全局信息的压缩表示，

表示针对新特征图

的高度的取值，

表示针对新特征图

的宽度的取值，

。

所述基于空洞卷积和语义融合的眼底血管图像分割方法，其中，所述非线性激活操作包括如下步骤：

利用两个全连接层对不同通道之间新特征图的相关性进行建模；其中，第一个全连接层在非线性激活后将特征向量m的维度降低到原来的1/r，第二个全连接层将特征向量m维度增加到原始维度，通过sigmoid函数将特征向量m的特征权值归一化为[0,1]；

非线性激活操作的公式表示为：

其中，

表示特征权值向量，

表示 sigmoid函数，

表示第一个全连接层的参数，

表示第二个全连接层的参数，

表示经过全局池化后的特征向量，

表示ReLU非线性激活函数。

所述基于空洞卷积和语义融合的眼底血管图像分割方法，其中，所述特征通道加权操作包括如下步骤：

采用特征权值向量

对所述新特征图

中的每个特征通道分别执行乘法加权，对应的公式表示为：

其中，

表示加权后得到的特征通道，

表示新特征图

中第

个通道对应的特征权值向量。

本发明还提出一种基于空洞卷积和语义融合的眼底血管图像分割***，其中，所述***包括：

图像获取模块，用于：

获取眼底血管图像数据集，从所述眼底血管图像数据集中获取眼底血管图像，并对所述眼底血管图像进行预处理；

模型改进模块，用于：

基于U-Net模型进行改进设计，以得到改进神经网络；

第一设计模块，用于：

在进行改进设计时，在所述改进神经网络的跳跃连接部分设计一个多层多尺度空洞卷积结构，所述多层多尺度空洞卷积结构用于跨越所述改进神经网络的编码部分与解码部分，以保护眼底血管中的细节信息；

第二设计模块，用于：

在所述改进神经网络的解码部分设计一个语义融合结构，所述语义融合结构用于对解码后的多尺度图像特征进行拼接，并构建成对挤压激励模块，根据所述挤压激励模块对拼接后的多尺度图像特征进行关键信息筛选以最终得到多尺度图像特征融合结果；

图像分割模块，用于：

对所述多尺度图像特征融合结果执行连续三次卷积操作以得到待分割图像，对所述待分割图像中的像素进行二分类判别，以对眼底血管图像进行分割，并得到一个改进的神经网络模型；

辅助训练模块，用于根据第一损失函数，对所述改进的神经网络模型进行辅助训练，以对训练后的神经网络模型进行测试，从而最终完成眼底血管图像的分割与验证；

其中，所述第一损失函数的表达式为：

其中，

表示第一损失函数，

表示数据总类别数量，

表示类别k的真阳值，

表示类别k的假阴值，

表示像素属于类别k的数量，

，

表示类别k的几何平均置信度，

表示类别k的召回率，

表示输入的训练数据在所有类别上的预测最大值分布，

表示标签为类别k的样本集，

表示训练数据的标签数据，

表示训练数据的序号。

本发明提出一种基于空洞卷积和语义融合的眼底血管图像分割方法，具有如下有益效果：

（1）、本发明能准确有效地对眼底血管图像进行分割，辅助医生的临床诊断工作进而实现高质量的医疗服务；

（2）、本发明提出的融合Transformer模块的多层多尺度空洞卷积结构具备高效、轻便以及可移植性强等优点，可将该多层多尺度空洞卷积结构迁移到其它需要逐步扩张图像感受野或需联合全局特征和局部特征的视觉分析任务，如目标检测、区域定位等，以发挥更大作用；

（3）、本发明提出的语义融合结构，具备高效、轻便以及可移植性强等优点，可将该语义融合结构迁移到其它需要进行多尺度图像特征融合或特征精选的视觉分析任务中，如肿瘤图像识别与图像情感分析等，以发挥更大作用；

（4）、从患者角度而言，精准的医学诊疗可缩短患者就诊时间，为提高病症的治愈率创造有利的时间条件，有助于改善人们的生活质量，创造良好的社会效益。

本发明的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实施例了解到。

附图说明

图1为本发明提出的一种基于空洞卷积和语义融合的眼底血管图像分割方法的流程图；

图2为本发明提出的一种基于空洞卷积和语义融合的眼底血管图像分割方法中各模块细化的结构图；

图3是本发明提出的一种基于空洞卷积和语义融合的眼底血管图像分割方法的模型图；

图4为本发明提出的一种基于空洞卷积和语义融合的眼底血管图像分割***的结构示意图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。

参照下面的描述和附图，将清楚本发明的实施例的这些和其他方面。在这些描述和附图中，具体公开了本发明的实施例中的一些特定实施方式，来表示实施本发明的实施例的原理的一些方式，但是应当理解，本发明的实施例的范围不受此限制。相反，本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。

请参阅图1至图3，本发明提出一种基于空洞卷积和语义融合的眼底血管图像分割方法，所述方法包括如下步骤：

S101，获取眼底血管图像数据集，从所述眼底血管图像数据集中获取眼底血管图像，并对所述眼底血管图像进行预处理。

在步骤S101中，眼底血管图像数据集包括STARE数据集、DRIVE数据集以及CHASEDB1数据集。

具体的，对眼底血管图像进行预处理的方法包括如下步骤：

将眼底血管图像的尺寸统一裁剪至512×512，然后进行图像翻转、图像旋转以及图像高斯模糊操作完成预处理，以最终将原眼底血管图像数据集扩充至原数据集的18倍。

S102，基于U-Net模型进行改进设计，以得到改进神经网络。

在具体实施中，应用U-Net模型，编码部分保留其原型，它包括四层连续的下采样操作，每层下采样操作执行连续两次3×3卷积。本发明对U-Net模型的其它部分进行重新改进设计，具体如步骤S103、步骤S104以及步骤S105所述。

S103，在进行改进设计时，在所述改进神经网络的跳跃连接部分设计一个多层多尺度空洞卷积结构，所述多层多尺度空洞卷积结构用于跨越所述改进神经网络的编码部分与解码部分，以保护眼底血管中的细节信息。

在步骤S103中，多层多尺度空洞卷积结构包括上层图像特征、中层图像特征以及下层图像特征。其中，对上层图像特征、中层图像特征以及下层图像特征执行包含不同尺度卷积率的级联式空洞卷积。

具体的，对上层图像特征、中层图像特征以及下层图像特征执行包含不同尺度卷积率的级联式空洞卷积的方法包括如下步骤：

S1031，对上层图像特征执行感受野逐步扩张的级联式空洞卷积，经卷积得到上层图像特征对应的空洞卷积特征，再对空洞卷积特征执行最大池化操作，以获得大尺寸图像的局部特征。

如图2中（a）部分所示，上层图像特征执行级联式空洞卷积的过程，上层图像特征经过3个不同尺度的3×3空洞卷积，空洞卷积率分别为1、（1，3）和（1，3，5）。采用空洞率为1、3、5的空洞卷积逐步级联以获取空洞率为3、9、19的感受野。因此，上层图像的感受野在不断扩大，为准确完整地分割目标血管奠定重要基础。此外，执行级联式空洞卷积得到3个能展示不同感受野的图像特征，将每个图像特征分别与自身进行1×1卷积，再融合相加1×1卷积结果，得到上层图像特征对应的空洞卷积特征。最后，对空洞卷积特征执行最大池化操作，将其缩减至与中层图像特征相同的尺寸，从而获取来自大尺寸图像的局部特征。

S1032，将中层图像特征对应的眼底血管图像分割成固定大小的图像块，通过扁平化操作对图像块进行矢量化，执行线性映射将矢量化的图像块转换成低维线性嵌入特征；将低维线性嵌入特征输入至Transformer模块中连续12个Transformer层中继续执行线性映射，并进行自注意力加权；对低维线性嵌入特征添加位置编码，以建模得到眼底血管图像中的长距离依赖关系，并提取得到图像全局特征。

对所述中层图像特征进行处理的步骤中，存在如下公式：

其中，

表示低维线性嵌入特征，

表示执行线性映射的矩阵，

表示位置编码，

表示第

个图像块，

。

如图2中（b）部分所示，所述Transformer层包括规范化层、多头自注意力以及多层感知器，第

个Transformer层的特征变换对应的公式表示为：

其中，

表示经过第

个Transformer层编码后得到的图像特征，

表示经多头注意力加权得到的图像特征，

表示输入图像序列的线性嵌入特征，

表示多层感知器操作，

表示多头自注意力操作，

表示规范化层操作。

可以理解的，由于MSA和MLP的使用，Transformer模块可建模眼底血管图像中的长距离依赖关系，进一步提取图像细节并捕获图像全局特征，更好地用于眼底血管分割。最后，经过图像恢复层中的3×3卷积操作将图像特征重塑为其原始大小。

S1033，对所述下层图像特征执行感受野逐步扩张的级联式空洞卷积，然后执行双线性插值将所述下层图像特征提升至与所述中层图像特征相同的尺寸，以获得小尺寸图像的局部特征。

如图2中的（a）部分所示，下层图像特征执行级联式空洞卷积的过程，下层图像特征经过3个不同尺度的3×3空洞卷积，空洞卷积率分别为1、（1，3）和（1，3，5）。采用空洞率为1、3、5的空洞卷积逐步级联以获取空洞率为3 、9、19的感受野。因此，下层图像的感受野在不断扩大，为准确完整地分割目标血管奠定重要基础。

此外，执行级联式空洞卷积得到3个能展示不同感受野的图像特征，将每个图像特征分别与自身进行1×1卷积，再融合相加1×1卷积结果，得到下层图像特征对应的空洞卷积特征。最后，对空洞卷积特征执行双线性插值操作，将其提升至与中层图像特征相同的尺寸，从而获取小尺寸图像的局部特征。

S1034，将大尺寸图像的局部特征、图像全局特征以及小尺寸图像的局部特征进行相加以完成特征融合。

在本步骤中，上层图像特征、中层图像特征以及下层图像特征进行融合的物理含义为：既考虑来自Transformer模块输出的图像全局特征，又考虑来自级联式空洞卷积模块输出的图像局部特征，全局特征与局部特征形成互补，能更全面地刻画眼底血管细节。融合后图像特征的尺寸与原始图像尺寸相同，即跳跃连接两端的输入和输出尺寸相同。

S104，在所述改进神经网络的解码部分设计一个语义融合结构，所述语义融合结构用于对解码后的多尺度图像特征进行拼接，并构建成对挤压激励模块，根据所述挤压激励模块对拼接后的多尺度图像特征进行关键信息筛选以最终得到多尺度图像特征融合结果。

在步骤S104中，所述语义融合结构对解码后的多尺度图像特征进行拼接的方法包括如下步骤：

、第二上采样特征图

、第三上采样特征图

以及第四上采样特征图

；

结合所述改进神经网络的编码部分的特征图

，与上述第一上采样特征图

、第二上采样特征图

、第三上采样特征图

以及第四上采样特征图

进行拼接得到新特征图

；

其中，新特征图

。

在得到了新特征图

之后，新特征图

考虑了来自不同层图像特征之间的互补信息，有助于更全面地刻画图像中的血管细节。

进一步的，将新特征图

中的关键信息。其中，所述SE操作包括全局平均池化操作、非线性激活操作以及特征通道加权操作。

其中，包含320个特征通道的新特征图

在执行第一次SE操作后，可筛选出新特征图

中关键的通道信息，初步抑制图像特征中噪声并恢复重要的细节信息；新特征图

在执行第二次SE操作后，对特征通道做进一步关键信息筛选，更准确地刻画眼底血管图像中细节信息，以用于后续分割任务。

S1041，全局平均池化操作包括如下步骤：

对新特征图

的属性为

；

进行全局平均池化运算以得到特征向量m的公式表示为：

其中，

表示新特征图

的高度，

表示新特征图

的宽度，

表示新特征图

的通道数，

表示新特征图

中第

个通道的全局信息的压缩表示，

表示针对新特征图

的高度的取值，

表示针对新特征图

的宽度的取值，

。

S1042，非线性激活操作包括如下步骤：

利用两个全连接层对不同通道之间新特征图的相关性进行建模；其中，第一个全连接层在非线性激活后将特征向量m的维度降低到原来的1/r，第二个全连接层将特征向量m法人维度增加到原始维度，通过sigmoid函数将特征向量m的特征权值归一化为[0,1]；

非线性激活操作的公式表示为：

其中，

表示特征权值向量，

表示 sigmoid函数，

表示第一个全连接层的参数，

表示第二个全连接层的参数，

表示经过全局池化后的特征向量，

表示ReLU非线性激活函数。

S1043，特征通道加权操作包括如下步骤：

采用特征权值向量

对所述新特征图

中的每个特征通道分别执行乘法加权，对应的公式表示为：

其中，

表示加权后得到的特征通道，

表示新特征图

中第

个通道对应的特征权值向量。

人类对外部世界的认知是一种层次化结构，即通过不断过滤、筛选以保留最关键信息，且新特征图X中权重非0的通道数较多并包含大量噪声。因此，在DSE模块（挤压激励模块）中设计层次化结构对新特征图

进行筛选。如图2中的(c)部分DSE 模块所示：

包含320个通道的新特征图

执行第一次SE操作后，根据各通道信息重要性，特征通道被赋予一定权重，权重为0表示相关特征通道对于分割无任何贡献，新特征图

中的噪声信息得到一定抑制；继续对经过筛选的特征执行第二次SE操作，原本权重为0的特征通道权重保持不变，而原本权重非0的特征通道被赋予新权重，即包含重要信息的通道权重变得更大，以突出其重要性，而包含次要信息的通道权重变得更小，以降低其重要性，权重非0的通道数变得更少，新特征图

中的噪声得到进一步抑制，有利于之后的卷积操作及图像像素二分类判别，为高质量的眼底血管图像分割奠定重要基础。

综上，将高进神经网络解码部分拼接后的多尺度图像特征依次通过包含全局平均池化、非线性激活以及特征通道加权三大操作的DSE模块，以层次化方式实现对特征中关键信息的筛选，并完成多尺度图像特征融合，为眼底图像分割做好准备。

S105，对所述多尺度图像特征融合结果执行连续三次卷积操作以得到待分割图像，对所述待分割图像中的像素进行二分类判别，以对眼底血管图像进行分割，并得到一个改进的神经网络模型。

在具体实施中，将语义融合结构输出的包含320个特征通道的新特征图经过连续的三个卷积层和64个滤波器，提取血管和背景关键特征并生成分割图像，分割图像中每个像素均有一个概率值。使用一个二分类判别器区分分割图像中的血管和背景。其中，三个卷积层分别是1×1、3×3和1×1卷积。

二分类判别器将分割图像中概率值大于0.5的像素看作眼底血管像素，并标记像素值为1，将分割图像中概率值小于0.5的像素看作背景，并标记像素值为0，所有像素值为1的像素设置为白色，所有像素值为0 的像素设置为黑色，完成眼底血管图像分割，血管和背景被鲜明地区分，向医生直观地展示分割效果，准确、高效地辅助其临床诊断工作。

S106，根据第一损失函数，对所述改进的神经网络模型进行辅助训练，以对训练后的神经网络模型进行测试，从而最终完成眼底血管图像的分割与验证。

其中，所述第一损失函数的表达式为：

其中，

表示第一损失函数，

表示数据总类别数量，

表示类别k的真阳值，

表示类别k的假阴值，

表示像素属于类别k的数量，

，

表示类别k的几何平均置信度，

表示类别k的召回率，

表示输入的训练数据在所有类别上的预测最大值分布，

表示标签为类别k的样本集，

表示训练数据的标签数据，

表示训练数据的序号。

请参阅图4，本发明还提出一种基于空洞卷积和语义融合的眼底血管图像分割***，其中，所述***包括：

图像获取模块，用于：

模型改进模块，用于：

基于U-Net模型进行改进设计，以得到改进神经网络；

第一设计模块，用于：

第二设计模块，用于：

图像分割模块，用于：

其中，所述第一损失函数的表达式为：

其中，

表示第一损失函数，

表示数据总类别数量，

表示类别k的真阳值，

表示类别k的假阴值，

表示像素属于类别k的数量，

，

表示类别k的几何平均置信度，

表示类别k的召回率，

表示输入的训练数据在所有类别上的预测最大值分布，

表示标签为类别k的样本集，

表示训练数据的标签数据，

表示训练数据的序号。

应当理解的，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列（PGA），现场可编程门阵列（FPGA）等。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、 “示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。