CN106910184B

CN106910184B - 基于深度卷积神经网络的内窥镜图像肠道出血检测方法

Info

Publication number: CN106910184B
Application number: CN201710023643.1A
Authority: CN
Inventors: 俞俊; 高飞; 李攀鹏
Original assignee: Hangzhou Dianzi University
Current assignee: Hangzhou Dianzi University
Priority date: 2017-01-12
Filing date: 2017-01-12
Publication date: 2020-10-09
Anticipated expiration: 2037-01-12
Also published as: CN106910184A

Abstract

本发明公开了一种基于深度卷积神经网络的内窥镜图像肠道出血检测方法。本发明步骤如下：在训练网络的过程中，首先将出血图像和不出血图像分别进行旋转、亮度调节、高斯模糊、加泊松噪声四种变换，然后变换后的图像和原始图像一起构成新数据集；其次在训练网络的过程中，复制所有出血图像，使得出血图像和不出血图像数量相等，从而得到扩增数据集；然后训练三个深度卷积神经网络，得到三个非线性映射关系；最后依据得到的三个深度卷积神经网络做内窥镜图像肠道出血检测，得到三个检测结果，然后根据多数投票规则，得到最终的检测结果。本发明不仅提高了内窥镜肠道出血检测的准确率，同时能够检测不理想环境下得到的图像,能够达到实时要求。

Description

基于深度卷积神经网络的内窥镜图像肠道出血检测方法

技术领域

本发明涉及医学图像处理领域，尤其涉及一种基于深度卷积神经网络的内窥镜图像肠道出血检测方法。

背景技术

如今，无线胶囊内窥镜由于其易于吞服和全程无痛的特点，在医学方面已越来越普及。而且由其得到的内窥镜图像也使得医生对病人的诊断更加准确。但由于在做胃窥镜的整个过程中，内窥镜会传输出上千幅胃肠道图片，而只有少部分的图片显示胃肠道有疾病(比如胃出血)，所以很有可能会被医生遗漏掉。因此，开发出一个检测胃肠道图片是否正常的算法来减轻医生的负担就变得尤为重要。

在目前的内窥镜图像检测研究中，Liu和Yuan研究了像素值、颜色通道和不同颜色的像素比例这三种特征，并使用SVM来预测胃肠道图片是否表示出血。Pan和Sainju则用神经网络基于图片的像素值和他们的统计数据(比如平均值，标准差和交叉熵)来预测胃肠道的出血区域。Li等人利用图片的彩色纹理特征和LBPs(uniform local binary patterns)特征来表示胃肠道图片，然后用多层感知神经网络来探测出血区域。最近，Hassan和Haque提取图像的离散傅里叶变换系数特征，然后用SVM训练得到一个分类器。然而，受肠道内部环境的影响，无线胶囊内窥镜在肠道内移动时，其所获取的图像在内容、纹理和亮度等方面都有较大的差别。现有方法采用的底层视觉特征受图像内容、光照等因素的影响较大，无法对存在遮挡或光线过暗的图像进行精确判别。此外，异常图像和正常图像的比例严重不平衡，导致学习自动预测胃肠道图像是否正常的模型变得十分复杂和困难。

发明内容

本发明的目的在于针对现有技术的不足，提供了一种基于深度卷积神经网络的内窥镜图像肠道出血检测方法。

本发明解决其技术问题所采用的技术方案包括以下步骤：

步骤1、在训练深度网络的过程中，首先将出血图像和不出血图像分别进行旋转、亮度调节、高斯模糊、加泊松噪声四种变换，然后将变换后的图像和原始图像一起构成新的数据集；

步骤2、在训练深度网络的过程中，复制所有的出血图像，使得出血图像和不出血图像数量一样多，从而得到扩增数据集；

步骤3、对步骤2得到的扩增数据集，训练VGGNet、GoogLeNet、AlexNet这三个深度卷积神经网络，得到三个非线性映射关系；

步骤4、依据得到的三个深度卷积神经网络做内窥镜图像肠道出血检测，以内窥镜图像作为输入，得到三个卷积神经网络的检测结果，然后根据多数投票规则，得到最终的检测结果。

步骤1所述的将出血图像和不出血图像进行旋转、亮度、高斯模糊、加噪四种变换，具体如下：

1-1.将原始图像分别旋转60度、120度、180度、240度、300度，每张原始图像将得到5张经过旋转变换的图像。

1-2.随机产生5个0-1均匀分布的随机数作为5个亮度因子，记为λ₁,λ₂,λ₃,λ₄,λ₅，将原始图像由RGB颜色空间转到YCbCr空间，将Y通道分别乘以5个亮度因子，得到5张经过亮度变换的图片。

1-3.对原始图像进行高斯模糊，计算公式为：

G(x,y)＝exp(-(x²+y²)/2σ²)/2πσ²，

设置高斯滤波器的大小和参数，即([x,y],σ)分别为([3,3],1)，([5,5],3)，([7,7],5)，([9,9],7)，([11,11],9)。根据这五种高斯滤波器，对原始图像做5种高斯模糊,每张原始图像将得到5张经过高斯模糊变换的图像。

1-4.给原始图像添加符合泊松分布模型的噪声，泊松分布公式：

P(x＝k)＝exp(-λ)·λ^k/k！，

每张原始图像将得到1张添加泊松噪声的图像。

步骤2所述的基于步骤1得到的图像复制所有出血图像，使得出血图像和不出血图像一样多，具体如下：

2-1.经过步骤1，每张原始图像都会得到由自身经过变换的16张图像。在原始图像中，由于不出血图像数量是出血图像数量的30倍，将每张原始出血图像及其经过变换的所有图像复制30倍，使得出血图像和不出血图像在数量上达到一致，从而得到扩增数据集；

步骤3中所述的对步骤2得到的扩增数据集，训练VGGNet、GoogLeNet、AlexNet这三个深度卷积神经网络，得到三个非线性映射关系，具体如下：

3-1.使用原始图像的80％及其对应的变换图像作为训练集，其余的20％及其变换图像作为测试集。

3-2.使用训练集训练VGGNet、GoogLeNet、AlexNet三个深度卷积神经网络。采用Softmax损失函数作为目标函数，利用反向传播算法优化目标函数。

3-3.训练结束后，将测试图像库中的任意一幅内窥镜图像作为三个深度卷积神经网络的输入，然后基于得到的三个检测结果，根据多数投票原则，得到最终的检测结果。

本发明具有的有益的效果是：

通过学习不同质量的图像的特征和学习不同质量的图像的特征到检测结果的非线性映射关系，指导内窥镜图像肠道出血检测过程，不仅能够提高检测结果的准确率，而且还能够检测不理想环境下得到的图像，基本能够达到实时的要求。

附图说明

图1是本发明流程图；

图2是本发明基于深度卷积神经网络的内窥镜图像肠道出血检测方法的训练过程框架示意图；

图3是本发明中基于深度卷积神经网络的内窥镜图像肠道出血检测方法的检测过程框架示意图；

具体实施方式

下面结合附图对本发明作进一步说明。

如图1-3所示，基于深度卷积神经网络的内窥镜图像肠道出血检测方法，具体步骤参看图1：

如图2所示，步骤1所述的将出血图像和不出血图像进行旋转、亮度、高斯模糊、加噪四种变换，具体如下：

1-5.将原始图像分别旋转60度、120度、180度、240度、300度，每张原始图像将得到5张经过旋转变换的图像。

1-6.随机产生5个0-1均匀分布的随机数作为5个亮度因子，记为λ₁,λ₂,λ₃,λ₄,λ₅，将原始图像由RGB颜色空间转到YCbCr空间，将Y通道分别乘以5个亮度因子，得到5张经过亮度变换的图片。

1-7.对原始图像进行高斯模糊，计算公式为：

G(x,y)＝exp(-(x²+y²)/2σ²)/2πσ²，

1-8.给原始图像添加符合泊松分布模型的噪声，泊松分布公式：

P(x＝k)＝exp(-λ)·λ^k/k！，

每张原始图像将得到1张添加泊松噪声的图像。

如图3所示，步骤3中所述的对步骤2得到的扩增数据集，训练VGGNet、GoogLeNet、AlexNet这三个深度卷积神经网络，得到三个非线性映射关系，具体如下：

Claims

1.基于深度卷积神经网络的内窥镜图像肠道出血检测方法，其特征在于包括以下步骤：

步骤2、在训练深度网络的过程中，复制新的数据集中所有的出血图像，使得出血图像和不出血图像数量一样多，从而得到扩增数据集；

2.根据权利要求1所述的基于深度卷积神经网络的内窥镜图像肠道出血检测方法，其特征在于步骤1所述的将出血图像和不出血图像进行旋转、亮度、高斯模糊、加噪四种变换，具体如下：

1-1.将原始图像分别旋转60度、120度、180度、240度、300度，每张原始图像将得到5张经过旋转变换的图像；

1-2.随机产生5个0-1均匀分布的随机数作为5个亮度因子，记为λ₁,λ₂,λ₃,λ₄,λ₅，将原始图像由RGB颜色空间转到YCbCr空间，将Y通道分别乘以5个亮度因子，得到5张经过亮度变换的图片；

1-3.对原始图像进行高斯模糊，计算公式为：

G(x,y)＝exp(-(x²+y²)/2σ²)/2πσ²，

设置高斯滤波器的大小w×w和参数σ，即([w,w],σ)分别为([3,3],1)，([5,5],3)，([7,7],5)，([9,9],7)，([11,11],9)；根据这五种高斯滤波器，对原始图像做5种高斯模糊，每张原始图像将得到5张经过高斯模糊变换的图像；

P(x＝k)＝exp(-λ)·λ^k/k！，

每张原始图像将得到1张添加泊松噪声的图像。

3.根据权利要求1所述的基于深度卷积神经网络的内窥镜图像肠道出血检测方法，其特征在于步骤2所述的复制新的数据集中所有的出血图像，使得出血图像和不出血图像一样多，具体如下：

2-1.经过步骤1，每张原始图像都会得到由自身经过变换的16张图像；在原始图像中，由于不出血图像数量是出血图像数量的30倍，将每张原始出血图像及其经过变换的所有图像复制30倍，使得出血图像和不出血图像在数量上达到一致，从而得到扩增数据集。

4.根据权利要求1所述的基于深度卷积神经网络的内窥镜图像肠道出血检测方法，其特征在于步骤3中所述的对步骤2得到的扩增数据集，训练VGGNet、GoogLeNet、AlexNet这三个深度卷积神经网络，得到三个非线性映射关系，具体如下：

3-1.使用扩增数据集中原始图像的80％及其对应的变换图像作为训练集，其余的20％及其变换图像作为测试集；

3-2.使用训练集训练VGGNet、GoogLeNet、AlexNet三个深度卷积神经网络；采用Softmax损失函数作为目标函数，利用反向传播算法优化目标函数；

3-3.训练结束后，将测试集中的任意一幅内窥镜图像作为三个深度卷积神经网络的输入，然后基于得到的三个检测结果，根据多数投票原则，得到最终的检测结果。