WO2023001190A1

WO2023001190A1 - 结直肠息肉图像的识别方法、装置及存储介质

Info

Publication number: WO2023001190A1
Application number: PCT/CN2022/106764
Authority: WO
Inventors: 李佳昕; 王玉峰
Original assignee: 天津御锦人工智能医疗科技有限公司
Priority date: 2021-07-23
Filing date: 2022-07-20
Publication date: 2023-01-26
Also published as: EP4350617A1; CN113284146A; CN113284146B

Abstract

本申请涉及一种结直肠息肉图像的识别方法、装置及存储介质。所述结直肠息肉图像的识别方法包括：对结直肠部位图像进行色彩均衡化处理和边缘特征图融合，得到所述结直肠部位图像的梯度特征融合图；调用预先构建的基于注意力拆分模块ResNeSt Block的结直肠息肉分型的分类模型，对所述结直肠部位图像的梯度特征融合图进行识别。本申请通过对结直肠部位图像进行色彩均衡化处理和边缘特征图融合处理构建识别样本，可有效的统一及加强图像特征，并通过基于ResNeSt Block构建的特征提取网络进行特征提取，能更准确预测结直肠息肉分型结果，辅助医生完成对结直肠息肉的病理性质推断。

Description

结直肠息肉图像的识别方法、装置及存储介质

交叉引用说明

本申请要求于2021年7月23日提交中国专利局、申请号为202110833639.8，发明名称为“结直肠息肉图像的识别方法、装置及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及医疗技术领域，尤其涉及一种结直肠息肉图像的识别方法、装置及存储介质。

背景技术

结直肠息肉是指突出于肠腔内的***性病变，是肠道常见的疾病之一，包括腺瘤性息肉和非腺瘤性息肉(错构瘤性息肉、化生性息肉和炎症性息肉)，其中腺瘤性息肉属于癌前病变。中国结直肠癌发病率和死亡率逐年上升，多数患者被发现时已属于中晚期，5年生存率不到50％。结肠镜是发现病变最直观有效的方法，可以提高肠道早期癌的发现从而降低死亡率。电子染色内镜是近年来消化内镜检查领域的重要进展，如窄带成像(NBI)、内镜智能分光比色技术(FICE)、高清智能电子染色内镜(i-scan)等已经广泛用于改善结直肠腺瘤的可检测性。有研究表明，在鉴别结直肠息肉样病变肿瘤和非肿瘤性方面，电子染色光技术有着相似且较高的灵敏度、特异性和准确性，电子染色分型在结直肠病变诊治方面具有良好应用价值。但目前尚依赖于医生凭经验及肉眼观察判断分型的结果，存在主观差异性。

发明内容

为了解决上述技术问题或者至少部分地解决上述技术问题，本申请提供了一种结直肠息肉图像的识别方法、装置及存储介质。

第一方面，本申请提供了一种结直肠息肉图像的识别方法，所述结直肠息肉图像的识别方法包括：

对结直肠部位图像进行色彩均衡化处理和边缘特征图融合，得到所述结直肠部位图像的梯度特征融合图；

调用预先构建的基于注意力拆分模块ResNeSt Block的结直肠息肉分型的分类模型，对所述结直肠部位图像的梯度特征融合图进行识别。

进一步地，为了预测或判断结直肠息肉的分型，在上述识别方法后还可以包括：根据识别结果，评估结直肠部位的结直肠息肉分型。

可选地，所述结直肠息肉图像的识别方法还包括：

对预先获取的结直肠息肉样本图像进行色彩均衡化处理和边缘特征图融合，得到结直肠息肉样本图像的梯度特征融合图；

利用所述结直肠息肉样本图像的梯度特征融合图和预先构建的基于ResNeSt Block的特征提取网络，训练所述分类模型；并在训练所述分类模型的过程中，根据损失函数优化所述分类模型；

在所述分类模型训练完成后，得到所述基于ResNeSt Block的结直肠息肉分型的分类模型。

可选地，所述根据所述结直肠息肉样本图像的梯度特征融合图和预先构建的基于ResNeSt Block的特征提取网络，训练分类模型，包括：

在基于构建的所述ResNeSt Block特征提取网络中，对所述结直肠息肉样本图像的梯度特征融合图进行训练；

将ResNeSt Block的输出通过Mish函数激活。

可选地，所述Mish函数为：

f(x)＝x*tanh(ln(1+e ^x))；

式中，x为ResNeSt Block的输出特征图的每个像素值。

可选地，所述在所述ResNeSt Block特征提取网络中，对所述结直肠息肉样本图像的梯度特征融合图进行训练，包括：

对所述结直肠息肉样本图像的梯度特征融合图拆分，得到k个分组卷积；

将每个分组卷积拆分得到r个第一特征图；

对k*r个第一特征图先进行1*1和3*3两次卷积运算后，每组分组卷积中将重新得到r个第二特征图，将r个第二特征图进行融合，输入至Split Attention层通过注意力机制加强特征，得到k个结果；

将k个结果继续进行融合后输入至一个1*1的卷积层进行卷积计算，得到ResNeSt Block的输出；k和r均为超参数。

可选地，所述在训练所述分类模型过程中，通过所述损失函数优化所述分类模型还包括：

根据所述结直肠息肉样本图像的正负样本的数量配比，对正样本进行加权计算损失值。

可选地，所述色彩均衡化处理包括：

根据图像的色彩均值，确定图像的RGB通道权重值；

根据图像的RGB通道权重值，对所述图像的RGB通道加权；所述图像为结直肠部位图像或者结直肠息肉样本图像。

可选地，所述边缘特征图融合包括：

对RGB通道加权后的图像进行缩放，得到缩放图像；

将所述缩放图像进行边缘提取，得到边缘特征图；

将所述缩放图像与所述边缘特征图融合成梯度特征融合图。

第二方面，本申请提供了一种结直肠息肉分型结果预测装置，所述结直肠息肉分型结果预测装置包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序；

所述计算机程序被所述处理器执行时，实现包括如上任一项所述的结直肠息肉图像的识别方法的步骤。

第三方面，本申请提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有结直肠息肉分型结果预测程序，所述结直肠息肉NICE分型结果预测程序被处理器执行时，实现包括如上任一项所述的结直肠息肉图像的识别方法的步骤。

第四方面，本申请提供了一种对受试者进行结直肠镜检查的方法，所述方法中包括利用如上任意一项所述的结直肠息肉图像的识别方法，或如上所述的结直肠息肉分型结果预测装置对受试者镜下结直肠息肉的分型进行实时预测或判断。

在本说明书中，所述结直肠息肉分型是指针对非肿瘤性息肉、肿瘤性息肉或腺癌等在形态学上的分型。

所述分型的标准可以为传统内窥镜下的分型标准或放大镜结合窄带成像(ME-NBI)内窥镜下的分型标准。所述ME-NBI内窥镜下的分型标准包括，例如，NICE分型标准、Sano分型标准、Pit分型标准、Hiroshima分型标准、Showa分型标准、Jikei分型标准、JNET分型标准。优选为NICE分型标准。

所述结直肠息肉图像可以为内窥镜下实时获取的图像，也可以为存储的图像。

本申请实施例提供的上述技术方案与现有技术相比具有如下优点：

本申请各实施例通过对结直肠部位图像进行色彩均衡化处理和边缘特征图融合处理构建识别样本，可有效的统一及加强图像特征，并通过ResNeSt Block进行特征提取，能更准确预测结直肠息肉分型结果，辅助医生完成对结直肠息肉的病理性质推断。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本申请各个实施例提供的结直肠息肉NICE分型结果预测方法的流程图；

图2为本申请各个实施例提供的基于一个ResNeSt Block的特征提取网络示意图；

图3为本申请各个实施例的改进的Mish函数的曲线图。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

在后续的描述中，使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明，其本身没有特定的意义。因此，“模块”、“部件”或“单元”可以混合地使用。

在本说明书中，术语“结直肠息肉分型”是指针对非肿瘤性息肉、肿瘤性息肉或腺癌等在形态学上的分型；分型的标准可以为，例如，NICE分型标准、Sano分型标准、Pit分型标准、Hiroshima分型标准、Showa分型标准、Jikei分型标准、JNET分型标准。

实施例一

本发明实施例提供一种结直肠息肉NICE分型结果预测方法，如图1所示，所述结直肠息肉NICE分型结果预测方法包括：

S101，对结直肠部位图像进行色彩均衡化处理和边缘特征图融合，得到所述结直肠部位图像的梯度特征融合图；

S102，调用预先构建的基于注意力拆分模块ResNeSt Block的NICE分型分类模型，对所述结直肠部位图像的梯度特征融合图进行识别；

S103，根据识别结果，评估结直肠部位的结直肠息肉NICE分型类型。

本发明实施例通过对结直肠部位图像进行色彩均衡化处理和边缘特征图融合处理构建识别样本，可有效的统一及加强图像特征，并通过ResNeSt Block进行特征提取，从而可以构建出基于深度学习的计算机辅助NICE分型***，能更准确预测结直肠息肉NICE分型结果，辅助医生完成对结直肠息肉的病理性质推断。

在具体实现过程中，通过白光、NBI、FICE、BLI、LCI、I-SCAN等模式下获取结直肠息肉图像。NICE分型结果包括一型、二型、三型、正常肠道。

在一些实施例中，所述调用预先构建的基于注意力拆分模块ResNeSt Block的NICE分型分类模型之前，包括：

根据所述结直肠息肉样本图像的梯度特征融合图和预先构建的基于ResNeSt Block的特征提取网络，训练分类模型；并在训练分类模型过程中，根据损失函数优化所述分类模型；损失函数优化所述分类模型；所述损失函数公式如下：

在所述分类模型训练完成后，得到所述基于ResNeSt Block的NICE分型的分类模型；式中L代表损失值，n代表总类别数量，i代表当前数据的真实类别，t代表经过所述特征提取网络得到的类别概率分布的1D张量，t[i]代表所述分类模型在i类别下的预测概率值，w(i)代表对i类别预测损失值的加权系数，

代表对t的所有数值进行exp再加和。

本发明实施例通过对结直肠部位图像进行色彩均衡化处理和边缘特征图融合处理构建训练样本，可有效的统一及加强图像特征，进而提高结直肠息肉NICE分型结果的预测准确性；根据所述损失函数优化所述分类模型，有效提高模型的训练速度。

在一些实施例中，所述根据所述结直肠息肉样本图像的梯度特征融合图和预先构建的基于ResNeSt Block的特征提取网络，训练分类模型，包括：

在所述ResNeSt Block特征提取网络中，对所述结直肠息肉样本图像的梯度特征融合图进行训练；

将ResNeSt Block的输出与所述结直肠息肉样本图像的梯度特征融合图相加，并通过改进的Mish函数激活。

可选地，所述改进的Mish函数为：

f(x)＝x*tanh(ln(1+e ^x))；

式中，x为ResNeSt Block的输出特征图的像素值。

本发明实施例基于上述改进的Mish函数有效提高了网络的特征拟合能力。

将每个分组卷积拆分得到r个第一特征图；

详细地，如图2所示，ResNeSt Block的处理流程包括：

a)将input(输入梯度特征融合图)进行拆分，得到Cardinal 1-Cardinal k，共计k个分组卷积；

b)每个分组卷积中继续拆分图像，得到Split 1–Split r，共计r个第一特征图；

c)之后对k*r个第一特征图先进行1*1的卷积计算，再进行3*3的卷积计算，两次卷积运算后，每组分组卷积中将重新得到r个特征图，将其进行融合，输入至Split Attention层通过注意力机制加强特征，最终得到k个结果；

d)将k个结果继续进行融合，结果输入至一个1*1的卷积层进行卷积计算，得到输出output

e)ResNeSt Block的输出与input相加，进行激活函数激活，得到最终特征图。

其中，激活函数选择更加平滑的Mish函数，提升了网络的特征拟合能力，曲线图如图3所示。

ResNeSt Block特征提取网络中共有16组ResNeSt Block，每组Block中又由三层卷积构成，所以其网络连接结构为：

Input→Conv*1→ResNeSt Block(Conv*2+Attention+Conv*1)*16→全连接层。

ResNet中最有效果的部分为残差模块，本发明实施例中其原本的残差结构修改为了ResNeSt Block(注意力拆分模块)，所述特征提取网络可由任意数量的ResNeSt Block组成，但其Block数量与训练/预测速度成反比；与预测准确率成正比；但当Block数量过多时可能会出现网络拟合能力退化、准确率下降的情况，本发明实施例中采用16组ResNeSt Block，不仅有效提高预测准确性，并保证了训练速度。

可选地，所述在训练分类模型过程中，通过所述损失函数优化所述分类模型还包括：

进一步地，训练分类模型过程中，使用了ImageNet上的数据集上进行模型预训练，保证起始参数具有较优的特征提取能力及泛化能力。模型训练的初始学习率均为0.0001，采用固定步长衰减的方式减小学习率，基于此，损失函数同时基于正负样本的数量配比，对正样本进行加权计算损失值，具体公式为：

(式中L代表损失值，n代表总类别数量，i代表当前数据的真实类别，t代表经过所述特征提取网络得到的类别概率分布的1D张量，t[i]代表所述分类模型在i类别下的预测概率值，w(i)代表对i类别预测损失值的加权系数，

代表对x的所有数值进行exp再加和。)。

优化器均采用AdamW优化器算法，该优化器包含了权重衰减及L2正则化功能，可以有效提高训练速度及模型准确度，本模型在迭代约300轮之后达到最优解。

在一些实施例中，所述色彩均衡化处理包括：

根据图像的色彩均值，确定图像的RGB通道权重值；

其中，所述边缘特征图融合包括：

对RGB通道加权后的图像进行缩放，得到缩放图像；

将所述缩放图像进行边缘提取，得到边缘特征图；

将所述缩放图像与所述边缘特征图融合成梯度特征融合图。

本发明实施例在原有的图片样本数据基础上，又叠加采用了色彩均衡化处理及梯度特征图融合的方式构建训练样本，通过上述两方式可有效的统一及加强图像特征。

其中，色彩均衡化：

1.首先将图像所有像素的R、G、B三个通道的值，分别进行加总并除以像素点个数，得到RGB各通道均值，即v(r)、v(g)、v(b)；

2.求出总均值K，K＝(v(r)+v(g)+v(b))/3；

3.计算出各通道权重值，即Kb＝K/v(b)；Kg＝K/v(g)；Kr＝K/v(r)；

4.对图像的R、G、B三通道的值分别与Kr、Kg、Kb完成加权相乘，例如使用python-opencv的addWeighted函数。

使用色彩均衡化处理可以减少光线及病人本身原因造成的肠道颜色差异，让数据集色调更统一，提升特征提取网络的学习及检测效率。

梯度特征图融合：

1.将数据集统一缩放成m像素*n像素，得到缩放图像H；例如，430像素*368像素；

2.将缩放图像转为灰度图后使用边缘提取算子(例如Scharr、Canny、Sobel、Laplace等)进行边缘提取，得到边缘特征图J；

将缩放图像H及边缘特征图J融合成4通道的数据，即为梯度特征融合图。

本发明各个实施例可以构建出基于深度学习的计算机辅助NICE分型***，能更准确预测结直肠息肉NICE分型结果，辅助医生完成对结直肠息肉的病理性质推断。

实施例二

本发明实施例提供一种结直肠息肉NICE分型结果预测装置，所述结直肠息肉NICE分型结果预测装置包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序；

所述计算机程序被所述处理器执行时，实现如实施例一中任一项所述的结直肠息肉NICE分型结果预测方法的步骤。

其中，结直肠息肉NICE分型结果预测装置可以是内窥镜检测设备，存储器可以是云存储器。

实施例三

本发明实施例提供一种计算机可读存储介质，所述计算机可读存储介质上存储有结直肠息肉NICE分型结果预测程序，所述结直肠息肉NICE分型结果预测程序被处理器执行时，实现如实施例一中任一项所述的结直肠息肉NICE分型结果预测方法的步骤。

实施例四

本发明实施例提供一种对受试者进行结直肠镜的方法，所述方法中包括利用实施例一所述的结直肠息肉NICE分型结果预测方法，或实施例二所述的结直肠息肉NICE分型结果预测装置对受试者镜下结直肠息肉的NICE分型的类型进行实时预测或判断。

实施例二、实施例三和实施例四的具体实现可以参阅实施例一，具有相应的技术效果。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

上面结合附图对本发明的实施例进行了描述，但是本发明并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本发明的启示下，在不脱离本发明宗旨和权利要求所保护的范围情况下，还可做出很多形式，这些均属于本发明的保护之内。

Claims

一种结直肠息肉图像的识别方法，其特征在于，所述结直肠息肉图像的识别方法包括：

对结直肠部位图像进行色彩均衡化处理和边缘特征图融合，得到所述结直肠部位图像的梯度特征融合图；

调用预先构建的基于注意力拆分模块ResNeSt Block的结直肠息肉分型的分类模型，对所述结直肠部位图像的梯度特征融合图进行识别。
根据权利要求1所述的结直肠息肉图像的识别方法，其特征在于，所述结直肠息肉图像的识别方法还包括：

对预先获取的结直肠息肉样本图像进行色彩均衡化处理和边缘特征图融合，得到结直肠息肉样本图像的梯度特征融合图；

利用所述结直肠息肉样本图像的梯度特征融合图和预先构建的基于ResNeSt Block的特征提取网络，训练所述分类模型；并在训练所述分类模型的过程中，通过损失函数优化所述分类模型；所述损失函数公式如下：

在所述分类模型训练完成后，得到所述基于ResNeSt Block的结直肠息肉分型的分类模型；式中L代表损失值，n代表总类别数量，i代表当前数据的真实类别，t代表经过所述特征提取网络得到的类别概率分布的1D张量，t[i]代表所述分类模型在i类别下的预测概率值，w(i)代表对i类别预测损失值的加权系数，
代表对t的所有数值进行exp再加和。
根据权利要求2所述的结直肠息肉图像的识别方法，其特征在于，所述利用所述结直肠息肉样本图像的梯度特征融合图和预先构建的基于ResNeSt Block的特征提取网络，训练所述分类模型，包括：

在所述预先构建的基于ResNeSt Block特征提取网络中，对所述结直肠息肉样本图像的梯度特征融合图进行训练；

将ResNeSt Block的输出通过Mish函数激活。
根据权利要求3所述的结直肠息肉图像的识别方法，其特征在于，所述Mish函数为：

f(x)＝x*tanh(ln(1+e ^x))；

式中，x为ResNeSt Block的输出特征图的像素值。
根据权利要求3所述的结直肠息肉图像的识别方法，其特征在于，所述在所述预先构建的基于ResNeSt Block特征提取网络中，对所述结直肠息肉样本图像的梯度特征融合图进行训练，包括：

对所述结直肠息肉样本图像的梯度特征融合图拆分，得到k个分组卷积；

将每个分组卷积拆分得到r个第一特征图；

对k*r个第一特征图先进行1*1和3*3两次卷积运算后，每组分组卷积中将重新得到r个第二特征图，将r个第二特征图进行融合，输入至Split Attention层通过注意力机制加强特征，得到k个结果；

将k个结果继续进行融合后输入至一个1*1的卷积层进行卷积计算，得到ResNeSt Block的输出；k和r均为超参数。
根据权利要求2所述的结直肠息肉图像的识别方法，其特征在于，所述在训练所述分类模型过程中，通过损失函数优化所述分类模型还包括：

根据所述结直肠息肉样本图像的正负样本的数量配比，对正样本进行加权计算损失值。
根据权利要求1所述的结直肠息肉图像的识别方法，其特征在于，所述色彩均衡化处理包括：

根据图像的色彩均值，确定图像的RGB通道权重值；

根据图像的RGB通道权重值，对所述图像的RGB通道加权；所述图像为结直肠部位图像或者结直肠息肉样本图像。
根据权利要求7所述的结直肠息肉图像的识别方法，其特征在于，所述边缘特征图融合包括：

对RGB通道加权后的图像进行缩放，得到缩放图像；

将所述缩放图像进行边缘提取，得到边缘特征图；

将所述缩放图像与所述边缘特征图融合成梯度特征融合图。
根据权利要求1所述的结直肠息肉图像的识别方法，其特征在于，所述结直肠息肉分型的标准为NICE分型标准、Sano分型标准、Pit分型标准、Hiroshima分型标准、Showa分型标准、Jikei分型标准或JNET分型标准。
根据权利要求9所述的结直肠息肉图像的识别方法，其特征在于，所述结直肠息肉分型的标准为NICE分型标准。
一种结直肠息肉分型结果预测装置，其特征在于，所述结直肠息肉分型结果预测装置包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序；

所述计算机程序被所述处理器执行时，实现包括如权利要求1所述的结直肠息肉图像的识别方法的步骤。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有结直肠息肉分型结果预测程序，所述结直肠息肉分型结果预测程序被处理器执行时，实现包括如权利要求1所述的结直肠息肉图像的识别方法的步骤。
一种对受试者进行结直肠镜检查的方法，其特征在于，所述方法中包括利用如权利要求1所述的结直肠息肉图像的识别方法，或如权利要求11所述的结直肠息肉分型结果预测装置对受试者镜下结直肠息肉的分型进行实时预测或判断。