CN113160151B

CN113160151B - 基于深度学习及注意力机制的全景片龋齿深度识别方法

Info

Publication number: CN113160151B
Application number: CN202110360226.2A
Authority: CN
Inventors: 叶冠琛; 曹政; 朱海华; 朱赴东; 陈谦明
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2021-04-02
Filing date: 2021-04-02
Publication date: 2023-07-25
Anticipated expiration: 2041-04-02
Also published as: CN113160151A

Abstract

本发明公开了基于深度学习及注意力机制的全景片龋齿深度识别方法，使用包含注意力机制的深度学习模型实现了口腔全景片中的龋齿不同病变时期的分级。整个龋齿分级***由三个模块组成：分割网络模块，注意力提取模块和分类模块。通过实现口腔全景片中龋齿区域的自动识别以及龋齿不同病变时期的结果导出，有助于辅助精准分级，为预防龋病的发生发展提供依据，对于口腔健康的维护具有重要的临床和社会意义。

Description

基于深度学习及注意力机制的全景片龋齿深度识别方法

技术领域

本发明属于医疗领域，涉及一种基于深度学习及注意力机制的全景片龋齿深度识别方法，主要利用包含注意力机制的深度学习模型实现了口腔全景片中的龋齿不同病变时期的分级。

背景技术

龋齿是一种由口腔中多种因素复合作用所导致的牙齿硬组织进行性病损，是口腔主要的常见病，也是人类最普遍的疾病之一。临床上可见龋齿有色、形、质的变化，而以质变为主，色、形变化是质变的结果，随着病程的发展，病变由釉质进入牙本质，组织不断被破坏、崩解而逐渐形成龋洞，临床上常根据龋坏程度分为浅、中、深龋三个阶段。由于目前大众对口腔健康的需求日益增长，越来越多人到医院或诊所进行口腔方面的咨询或治疗。而由于病患多，诊疗时间有限，有时医生不得已只能优先关注有症状的牙齿，而忽略了其他潜在的程度较轻的龋齿，龋病的进一步发展，提高了治疗难度和治疗费用。全景片是口腔临床上最常见的辅助检查手段，全景片包括了口内所有牙齿，且费用低，辐射量小。随着现代医疗水平的提高，如何利用电子信息技术实现基于口腔全景片的自动化检测和分级成为一个热门的研究课题。

作为人工智能的重要组成部分，深度学习技术在辅助医疗诊断领域取得了很好的效果。与传统的方法相比，深度学习通过使用更多的数据量学习特征，能取得更好的泛化性能。深度学习中的深度神经网络可以在网络中自动提取特征，而不需要人为的特征选择，提取过的特征又可以根据网络的全连接层进行分类，从而使得特征提取和分类结合在了一起，获得比传统方法更出色的结果。

然而现有的深度学习方法大多使用经过简单数据增强的图像进行龋齿识别。首先，把训练数据中的输入图像传入由一系列卷积结构，全连接结构组成的神经网络，然后保存训练好的神经网络参数，最后用已训练好的神经网络对测试数据进行预测，得到龋齿分级的预测结果。由于神经网络的黑箱特性，此类深度学习方法可能会丢失掉一些较细小的特征信息，只突出了主要特征，在用于龋齿分级方面，对于一些表现范围小的龋齿区域无法准确识别。

因此，开发一种改进的深度学习算法准确进行龋齿的自动化识别方法是本领域亟需解决的问题。

发明内容

本发明的目的是在已有的使用深度学习方法对龋坏程度分级的基础上，提供一种基于深度学习及注意力机制的全景片龋齿深度识别方法，是提出了使用注意力机制以及特征融合来辅助龋齿分类的创新性算法。在保证运行速度，泛化性的同时，提高了分级***的评价指标。

本发明使用口腔全景片作为数据输入进入分割网络，而在分割网络的各层特征输出中计算其对应的注意力特征，并在最后将注意力特征和原始卷积特征进行融合，使得在分割过程中网络注意力集中在有助于分类的部分细微特征区域，从而提升对细微区域的龋齿病变准确分割，再使用分类网络对分割网络的特征进行特征提取分类，能够有效的提高龋齿分级准确率。整个龋齿分级***由三个模块组成：分割网络模块，注意力提取模块和分类模块。

为实现上述目的，本发明提供以下技术步骤实现：

1.数据预处理：利用资料库中的口腔全景片进行数据标注及标准化预处理，准备训练集；具体为(1)从放射检查资料库中收集图像清晰的口腔全景片，统一调节亮度与对比度；(2)人工标注出口腔全景片中患龋牙齿的患龋部位。

2.龋齿区域分割：在分割网络模块中，使用U-Net分割网络，分割口腔全景片图像中的正常牙齿及龋齿部分，分离口腔背景区域和目标区域，提取对应的特征图；其中对收集到的口腔全景片进行图像数字化采样，然后经过分割网络模块实现背景和目标区域的分割提取。

3.注意力计算：使用注意力提取模块计算对应U-Net分割网络中对应龋齿位置神经网络所捕捉的注意力特征图；具体：(1)以分割网络产生的特征图作为输入，通过注意力提取模块后，得到一个带有权值的特征图，即深度学习中表示注意力的特征图；(2)与注意力特征图所对应的原图的标签通过损失函数可以得到一个损失值，这个损失值作为总损失值的一部分。

4.龋齿病变程度分级：在分类模块中，结合物体分割网络输出的特征图及其注意力模块输出的特征图，使用ResNet分类网络对龋齿病变程度进行分级；

具体：(1)通过提取分割网络模块和注意力提取模块的中间层特征，作为模块的输入数据，通过卷积神经网络的作用，得到输入数据的注意力权值；(2)对两个输入数据分别施以不同的注意力得到注意力特征图；(3)把两个注意力特征图融合起来得到新的特征图，再对新生成的特征图进行简单的分类，得到最终预测结果。

其中注意力提取模块以分割网络产生的特征图作为输入，通过特征图分类网络后，会得到一个3个类别的概率向量，它与注意力特征图所对应的原图的标签通过损失函数可以得到一个损失值，这个损失值作为总损失值的一部分。原始图像分类网络模块以原始图像作为输入，通过原始图像分类网络后，会得到一个3个类别的概率向量，它与原始图像的标签通过损失函数可以得到一个损失值，这个损失值作为同样总损失值的一部分。

步骤四的分类模块通过提取分割网络模块和注意力提取模块的中间层特征，作为模块的输入数据，通过卷积神经网络的作用，得到输入数据的注意力权值，然后对两个输入数据分别施以不同的注意力得到注意力特征图，最后把两个注意力特征图融合起来得到新的特征图，再对新生成的特征图进行简单的分类，得到最终预测结果。

本发明的优点：

1.与以往的简单使用深度学习来直接进行龋齿分级预测不同，本发明在简单的深度学习预测***的基础上，引入了注意力机制，与分割网络结合，将龋齿区域分割出来，再对龋齿区域使用分类网络进行龋齿分级，使得***的稳定性更佳。

2.由于使用了注意力机制，***对于特征比较细小难以分级的龋齿区域可以很好识别并分级，从而使得本发明***性能整体得到了很大的提升。

3.本发明使用过程中不需要人工参与，属于基于注意力机制及特征融合的全自动的分级***。

附图说明

图1为整体工作流程图。

图2为分割网络模块图。

图3为注意力提取模块图。

图4为分类网络模块图。

具体实施方式

下面将结合附图和实施例来说明整个基于深度学习及注意力机制的全景片龋齿深度识别方法的过程。

在整个方法中，将龋齿分级拆解为三个相互关联的模块，最终实现基于注意力机制的龋齿分级***。

实施例1

参见图1，展示了整个识别方法的工作流程：首先，把原始口腔全景图像尺寸统一转化为572*572，作为输入数据加载到分割网络模块。再将分割网络模块输出的特征图输入到注意力提取模块中，获取对应的注意力特征图。最后将分割网络模块输出的特征图和注意力机制模块输出的特征图输入到分类网络模块中，获取最终的龋齿分级结果。

结合图2-4分别说明本发明中各个模块的工作方法。

图2介绍了分割网络模块，该网络的输入是一张572*572的图片，网络的左侧是由卷积和最大池化构成的一系列降采样操作，每个操作由4个区块组成，每个区块使用了3个有效卷积和1个最大池化降采样，每次降采样之后特征图的个数乘2。最终得到了尺寸为32*32的特征图。网络的右侧部分同样由4个区块组成，每个区块开始之前通过反卷积将特征图的尺寸乘2，同时将其个数减半，然后和左侧对称的压缩路径的特征图合并，最终得到尺寸是388*388的特征图，即为该网络分割的结果。

图3展示了注意力机制模块。输入的特征图分别经过最大池化和平均池化的操作，再使用卷积层进行图像的7x7卷积操作，卷积层输出对应的特征向量，之后通过sigmoid激活函数，得到一个权值图Ms，接着把权值图Ms和输入的特征图做一个加权平均操作，得到最终的特征图。模块输出的权值图反映了对于输入特征图不同位置的重要性，权值大的地方，表明这个地方更重要，网络对这些地方投入更多的注意力，这就是注意力机制在***中的应用。

图4中介绍了分类网络模块，考虑到***速度与精度的平衡，本发明中使用的是41层的残差网络。第1阶段、第2阶段、…、第5阶段为Resnet网络的5个阶段。2X、4X为模块重复次数。Conv(64,256,k＝(1,1),s＝1,p＝0)中，k为卷积核尺寸，s为滑动步长，p为填充像素，256为卷积核通道数，64为上一层卷积层输出的通道数，其余卷积层类似。主干网络由残差学习模块堆叠而成，残差学习模块首端和末端为1×1卷积核，中间为3×3卷积核。在网络每个阶段的第一个学习模块，除了3个卷积层的串联，输入和输出之间还通过一个卷积层旁路相连，以增加输入特征图的通道数，便于和输出特征图融合，而后面接的残差学习模块输入和输出特征图的通道数一致，故可以不通过卷积层升高维度而直接进行加操作。这种结构可以有效降低特征损耗，提升模型训练效果。

Claims

1.基于深度学习及注意力机制的全景片龋齿深度识别方法，其特征在于，通过以下步骤实现：

（1）数据预处理：利用资料库中的口腔全景片进行数据标注及标准化预处理，准备训练集；具体为：

（a）从放射检查资料库中收集图像清晰的口腔全景片，统一调节亮度与对比度；

（b）人工标注出口腔全景片中患龋牙齿的患龋部位；

（2）龋齿区域分割：使用U-Net物体分割网络，分割口腔全景片图像中的正常牙齿及龋齿部分，分离口腔背景区域和目标区域，提取对应的特征图；其中对收集到的口腔全景片进行图像数字化采样，然后经过分割网络模块实现背景和目标区域的分割提取；

（3）注意力计算：使用注意力提取模块计算对应U-Net分割网络中对应龋齿位置神经网络所捕捉的注意力特征图；具体为：

（a）以分割网络产生的特征图作为输入，通过注意力提取模块后，得到一个带有权值的特征图，即深度学习中表示注意力的特征图；

（b）与注意力特征图所对应的原图的标签通过损失函数可以得到一个损失值，这个损失值作为总损失值的一部分；

（4）龋齿病变程度分级：结合物体分割网络输出的特征图及其注意力提取模块输出的特征图，使用ResNet分类网络对龋齿病变程度进行分级；具体为：

（a）通过提取分割网络模块和注意力提取模块的中间层特征，作为模块的输入数据，通过卷积神经网络的作用，得到输入数据的注意力权值；

（b）对两个输入数据分别施以不同的注意力得到注意力特征图；

（c）把两个注意力特征图融合起来得到新的特征图，再对新生成的特征图进行简单的分类，得到最终预测结果。