CN108986889A - 一种病变识别模型训练方法、装置及存储设备 - Google Patents
一种病变识别模型训练方法、装置及存储设备 Download PDFInfo
- Publication number
- CN108986889A CN108986889A CN201810643600.8A CN201810643600A CN108986889A CN 108986889 A CN108986889 A CN 108986889A CN 201810643600 A CN201810643600 A CN 201810643600A CN 108986889 A CN108986889 A CN 108986889A
- Authority
- CN
- China
- Prior art keywords
- training
- identification model
- collection
- enhancing
- lesion identification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H30/00—ICT specially adapted for the handling or processing of medical images
- G16H30/20—ICT specially adapted for the handling or processing of medical images for handling medical images, e.g. DICOM, HL7 or PACS
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/29—Graphical models, e.g. Bayesian networks
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种病变识别模型训练方法、装置及存储设备,其中方法包括:获取初始训练集;对所述初始训练集进行增广操作得到增强训练集;利用所述增强训练集训练深度残差网络,通过超参数搜索,得到测试精度最高的训练模型作为病变识别模型。利用所述方法训练得到的病变识别模型精确度高,识别能力强,泛化能力优越,有利于降低医生误诊漏诊率,也有利于降低对医生的业务能力要求。
Description
技术领域
本发明涉及深度学习领域,尤其是病变识别模型训练方法、装置及存储设备。
背景技术
深度学习这一概念最早于2006年被提出,近年来微软、谷歌、百度等公司都推出了各自的深度学习***,深度学习本质上是一种计算机模拟人脑神经网络的的算法,目前常见的有卷积神经网络(CNN)、循环神经网络(RNN)、深度神经网络(DNN)。图像识别技术是人工智能领域目前应用相对广泛且技术相对最为成熟的应用之一,图像识别技术中应用较多的是卷积神经网络(CNN)和深度神经网络(DNN)。
某些疾病比如消化道疾病,通常需要通过内镜治疗仪来获取相关影像和图片来为医生提供检查和诊断的依据。在获得医疗影像和图片之后,医生通过实际观察做出对应的诊疗结果,这对医生的经验和业务能力均有非常高的要求。如果医生的临床经验较少、业务能力不强或者对应的影像资料存在部分瑕疵,都可能导致医生诊疗结果的失误,对患者造成极大的损失和伤害。
发明内容
基于现有技术的上述缺陷,本发明实施例提供一种将人工智能图像识别技术应用于病变诊断的模型训练方法、设备及存储介质。
本发明能够以多种方式实现,包括方法、***、设备、装置或计算机可读介质,在下面论述本发明的几个实施例。
一种病变识别模型训练方法,包括:
获取初始训练集;
对所述初始训练集进行增广操作得到增强训练集;
利用所述增强训练集训练深度残差网络,通过超参数搜索,得到测试精度最高的训练模型作为病变识别模型。
进一步地,所述增广操作包括对所述初始训练集进行旋转和镜像操作。
进一步地,利用所述增强训练集训练深度残差网络,具体包括:以概率p舍弃神经元,并让其它神经元以概率1-p保留,每个神经元被关闭的概率相同。
进一步地,利用所述增强训练集训练深度残差网络,具体包括:训练过程中使用基于梯度的损失优化方法,梯度更新值产生震荡,梯度值减小,否则梯度值增加。
进一步地,,所述深度残差网络包括18层卷积层,第1至第17层卷积层舍弃神经元的概率依次为0.9、0.9、0.8、0.8、0.7、0.7、0.7、0.7、0.7、0.7、0.7、0.7、0.7、0.7、0.7、0.7和0.6。
进一步地,对所述初始训练集进行旋转操作,具体包括,对初始训练集的原始图像进行n*30°的旋转,n=1、2、3、4、5、6、7、8、9、10、11。
进一步地,对初始训练集的原始图像进行左右、上下镜像操作。
进一步地,还设置有测试集,利用所述测试集验证训练模型,并利用验证结果对所述训练模型进行参数调优。
一种病变识别模型训练装置,包括处理器,适于实现各指令;以及存储设备,适于存储多条指令,所述指令适于由处理器加载并执行权利要求1至8任一项所述的提取方法。
一种存储设备,其中存储多条指令,所述指令适用于由处理器加载并执行如权利要求1至8任一项所述的提取方法的步骤。
本发明可实现的积极有益技术效果包括:通过对初始训练集进行增广操作得到增强训练集,实现同一内容图片的不同角度训练,通过超参数搜索,得到测试精度最高的训练模型作为病变识别模型,病变识别模型精确度高,识别能力强,泛化能力优越;利用所述病变识别模型协助医生进行影像、图片相关病历的分析和诊断,有利于降低医生误诊、漏诊率,尤其适用于医疗资源相对落后、医生业务能力相对较低的基层和偏远地区卫生院所。
本发明的其他方面和优点根据下面结合附图的详细的描述而变得明显,所述附图通过示例说明本发明的原理。
附图说明
本发明将通过例子并参照附图的方式说明,其中:
图1为本发明实施例提供的病变识别模型训练方法流程图。
具体实施方式
本说明书中公开的所有特征,或公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合。
本说明书中公开的任一特征,除非特别叙述,均可被其他等效或具有类似目的的替代特征加以替换。即,除非特别叙述,每个特征只是一系列等效或类似特征中的一个例子而已。
图1为本发明实施例提供的病变识别模型训练方法流程图,如图1所示,包括步骤:
获取初始训练集;
对所述初始训练集进行增广操作得到增强训练集;
利用所述增强训练集训练深度残差网络,通过超参数搜索,得到测试精度最高的训练模型作为病变识别模型。
获取初始训练集步骤中,首先搜集大量患者病历样本,将病历样本中的图片信息人工提取出来,将正常无病变的病历图片归类为一类样本,将存在病变的病历图片按照息肉、新生物、静脉曲张等具体病种细分归类为N类样本。对病变数据分类完成后,按病变类别随机将80%的病变图像及其对应的标签图像用作初始训练集,剩余的20%病变图像及其对应的标签图像用作测试集。训练集用于训练识别模型,测试集用于验证病别模型,并利用验证结果对所述识别模型进行参数调优。
对初始训练集进行增广操作得到增强训练集步骤中,所述增广操作包括对初始训练集进行旋转和镜像操作。旋转操作为对初始训练集的原始图像进行n*30°的旋转,n=1、2、3、4、5、6、7、8、9、10、11;镜像操作为对初始训练集的原始图像进行左右、上下镜像操作。增广操作可实现初始训练集原始图像的13倍扩充,原始图像经扩充后,可得到同一内容图片的不同角度图片副本,进而可实现同一内容图片的不同角度训练,训练出的结果更加精确,识别能力更强,训练得到的识别模型的泛化能力也就越强。
利用增强训练集训练深度残差网络步骤中,以概率p舍弃神经元,并让其它神经元以概率1-p保留,每个神经元被关闭的概率相同。过拟合是深度神经网络(DNN)的一个常见问题,针对过拟合的解决方案中,Dropout具有简单性并取得了良好的结果,Dropout的思想是训练整体DNN,并平均整个集合结果,而非训练单个DNN,DNNs是以概率p舍弃部分神经元,其他神经元以概率1-p保留,舍去的神经元输出置为0,由于Dropout在训练阶段阻止了神经元的共适应,因此其在实践中能够良好地工作。
训练过程利用的深度残差网络包括18层卷积层,其结构为:
层1:输入图像像素为116×116,填充值是2,卷积核为6×6,步幅为2,膨胀值为1,经过ReLU(Rectified Linear Units,修正线性单元)单元激活后的输出像素为58×58×32,可调参数个数1184;
层2:输入图像像素58×58×32,填充值是1,卷积核为3×3,步幅为1,膨胀值为1,经过ReLU单元激活后的输出像素为58×58×32,可调参数个数9248;
层3:输入图像像素58×58×32,填充值是1,卷积核为3×3,步幅为2,膨胀值为1,经过ReLU单元激活后的输出像素为29×29×64,可调参数个数18496;
层4:输入图像像素29×29×64,填充值是1,卷积核为3×3,步幅为1,膨胀值为1,经过ReLU单元激活后的输出像素为29×29×64,可调参数个数36928;
层5:输入图像像素29×29×64,填充值是2,卷积核为3×3,步幅为1,膨胀值为2,经过ReLU单元激活后的输出像素为29×29×128,可调参数个数73856;
层6:输入图像像素29×29×128,填充值是2,卷积核为3×3,步幅为1,膨胀值为2,经过ReLU单元激活后的输出像素为29×29×128,可调参数个数147584;
层7:输入图像像素29×29×128,填充值是2,卷积核为3×3,步幅为1,膨胀值为2,经过ReLU单元激活后的输出像素为29×29×128,可调参数个数147584;
层8:输入图像像素29×29×128,填充值是2,卷积核为3×3,步幅为1,膨胀值为2,经过ReLU单元激活后的输出像素为29×29×128,可调参数个数147584;
层9:输入图像像素29×29×128,填充值是2,卷积核为3×3,步幅为1,膨胀值为2,经过ReLU单元激活后的输出像素为29×29×128,可调参数个数147584;
层10:输入图像像素29×29×128,填充值是2,卷积核为3×3,步幅为1,膨胀值为2,经过ReLU单元激活后的输出像素为29×29×128,可调参数个数147584;
层11:输入图像像素29×29×128,填充值是2,卷积核为3×3,步幅为1,膨胀值为2,经过ReLU单元激活后的输出像素为29×29×128,可调参数个数147584;
层12:输入图像像素29×29×128,填充值是2,卷积核为3×3,步幅为1,膨胀值为2,经过ReLU单元激活后的输出像素为29×29×128,可调参数个数147584;
层13:输入图像像素29×29×128,填充值是2,卷积核为3×3,步幅为1,膨胀值为2,经过ReLU单元激活后的输出像素为29×29×128,可调参数个数147584;
层14:输入图像像素29×29×128,填充值是2,卷积核为3×3,步幅为1,膨胀值为2,经过ReLU单元激活后的输出像素为29×29×128,可调参数个数147584;
层15:输入图像像素29×29×128,填充值是2,卷积核为3×3,步幅为1,膨胀值为2,经过ReLU单元激活后的输出像素为29×29×128,可调参数个数147584;
层16:输入图像像素29×29×128,填充值是2,卷积核为3×3,步幅为1,膨胀值为2,经过ReLU单元激活后的输出像素为29×29×128,可调参数个数147584;
层17:输入图像像素29×29×128,填充值是4,卷积核为3×3,步幅为1,膨胀值为4,经过ReLU单元激活后的输出像素为29×29×256,可调参数个数295168;
层18:输入图像像素29×29×256,填充值是14,卷积核为8×8,步幅为1,膨胀值为4,的输出像素为29×29×1,可调参数个数16385。
其中,第1至第17层卷积层舍弃神经元的概率依次为0.9、0.9、0.8、0.8、0.7、0.7、0.7、0.7、0.7、0.7、0.7、0.7、0.7、0.7、0.7、0.7和0.6。
模型配置统称为模型超参数,超参数的选择是无限的,有限时间内,除验证人工预设的几种超参数组合外,还可通过启发式搜索方法对超参数组合进行调优。利用所述增强训练集训练深度残差网络过程中,使用基于梯度的损失优化方法,梯度更新值产生震荡,梯度值减小,否则梯度值增加。具体地,训练过程中用于计算损失的优化算法为RMSprop,RMSprop是一种基于梯度的损失优化方法,更新方程如下:
(Wt+1)i=(Wt)i-α(vt)i
其中,v表示动量,δ表示数值稳定量,W表示权重,L表示全局学习率,α表示衰减速率,i表示迭代次数,t为变量角标,无实际含义。
梯度更新值发生震荡,梯度值减小(乘以1-δ),否则梯度值增加(增加δ),训练中δ值取为0.02。深度残差网络训练使用30个epoch,第29个epoch时的测试准确率取得最大值99.2%,对应的损失值为0.7036,得到最终部署内镜影像判定仪使用的深度残差网络模型。
一种病变识别模型训练装置,包括处理器,适于实现各指令;以及存储设备,适于存储多条指令,所述指令适于由处理器加载并执行权利要求1至8任一项所述的提取方法。
一种存储设备,其中存储多条指令,所述指令适用于由处理器加载并执行如权利要求1至8任一项所述的提取方法的步骤。
本发明的不同方面、实施例、实施方式或特征能够单独使用或任意组合使用。
本发明优选由软件实现,但是也能够以硬件或硬件和软件的组合实现。本发明也能够被实施为计算机可读介质上的计算机可读代码。计算机可读介质是能够存储之后可由计算机***读取的数据的任何数据存储设备。计算机可读介质的示例包括:只读存储器、随机存储存储器、CD-ROM、DVD、磁带、光学数据存储设备和载波。计算机可读介质也可分布在网络连接的计算机***上,从而以分布式方式存储和执行计算机可读代码。
本发明并不局限于前述的具体实施方式。本发明扩展到任何在本说明书中披露的新特征或任何新的组合,以及披露的任一新的方法或过程的步骤或任何新的组合。
Claims (10)
1.一种病变识别模型训练方法,其特征在于,包括:
获取初始训练集;
对所述初始训练集进行增广操作得到增强训练集;
利用所述增强训练集训练深度残差网络,通过超参数搜索,得到测试精度最高的训练模型作为病变识别模型。
2.根据权利要求1所述的方法,其特征在于,所述增广操作包括对所述初始训练集进行旋转和镜像操作。
3.根据权利要求1所述的方法,其特征在于,利用所述增强训练集训练深度残差网络,具体包括:以概率p舍弃神经元,并让其它神经元以概率1-p保留,每个神经元被关闭的概率相同。
4.根据权利要求1所述的方法,其特征在于,利用所述增强训练集训练深度残差网络,具体包括:训练过程中使用基于梯度的损失优化方法,梯度更新值产生震荡,梯度值减小,否则梯度值增加。
5.根据权利要求1所述的方法,其特征在于,所述深度残差网络包括18层卷积层,第1至第17层卷积层舍弃神经元的概率依次为0.9、0.9、0.8、0.8、0.7、0.7、0.7、0.7、0.7、0.7、0.7、0.7、0.7、0.7、0.7、0.7和0.6。
6.根据权利要求2所述的方法,其特征在于,对所述初始训练集进行旋转操作,具体包括,对初始训练集的原始图像进行n*30°的旋转,n=1、2、3、4、5、6、7、8、9、10、11。
7.根据权利要求2所述的方法,其特征在于,对所述初始训练集进行镜像操作,具体包括,对初始训练集的原始图像进行左右、上下镜像操作。
8.根据权利要求1所述的方法,其特征在于,还设置有测试集,利用所述测试集验证识别模型,并利用验证结果对所述识别模型进行参数调优。
9.一种病变识别模型训练装置,其特征在于包括处理器,适于实现各指令;以及存储设备,适于存储多条指令,所述指令适于由处理器加载并执行权利要求1至8任一项所述的提取方法。
10.一种存储设备,其中存储多条指令,所述指令适用于由处理器加载并执行如权利要求1至8任一项所述的提取方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810643600.8A CN108986889A (zh) | 2018-06-21 | 2018-06-21 | 一种病变识别模型训练方法、装置及存储设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810643600.8A CN108986889A (zh) | 2018-06-21 | 2018-06-21 | 一种病变识别模型训练方法、装置及存储设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108986889A true CN108986889A (zh) | 2018-12-11 |
Family
ID=64541650
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810643600.8A Withdrawn CN108986889A (zh) | 2018-06-21 | 2018-06-21 | 一种病变识别模型训练方法、装置及存储设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108986889A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110033019A (zh) * | 2019-03-06 | 2019-07-19 | 腾讯科技(深圳)有限公司 | 人体部位的异常检测方法、装置和存储介质 |
CN113065646A (zh) * | 2021-05-14 | 2021-07-02 | 杭州迪英加科技有限公司 | 一种能够实现ki67病理图像神经网络模型泛化性能的方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160071010A1 (en) * | 2014-05-31 | 2016-03-10 | Huawei Technologies Co., Ltd. | Data Category Identification Method and Apparatus Based on Deep Neural Network |
CN107886514A (zh) * | 2017-11-22 | 2018-04-06 | 浙江中医药大学 | 基于深度残差网络的乳腺钼靶图像肿块语义分割方法 |
CN107945870A (zh) * | 2017-12-13 | 2018-04-20 | 四川大学 | 基于深度神经网络的早产儿视网膜病变检测方法及装置 |
-
2018
- 2018-06-21 CN CN201810643600.8A patent/CN108986889A/zh not_active Withdrawn
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160071010A1 (en) * | 2014-05-31 | 2016-03-10 | Huawei Technologies Co., Ltd. | Data Category Identification Method and Apparatus Based on Deep Neural Network |
CN107886514A (zh) * | 2017-11-22 | 2018-04-06 | 浙江中医药大学 | 基于深度残差网络的乳腺钼靶图像肿块语义分割方法 |
CN107945870A (zh) * | 2017-12-13 | 2018-04-20 | 四川大学 | 基于深度神经网络的早产儿视网膜病变检测方法及装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110033019A (zh) * | 2019-03-06 | 2019-07-19 | 腾讯科技(深圳)有限公司 | 人体部位的异常检测方法、装置和存储介质 |
CN110033019B (zh) * | 2019-03-06 | 2021-07-27 | 腾讯科技(深圳)有限公司 | 人体部位的异常检测方法、装置和存储介质 |
CN113065646A (zh) * | 2021-05-14 | 2021-07-02 | 杭州迪英加科技有限公司 | 一种能够实现ki67病理图像神经网络模型泛化性能的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Rath et al. | Heart disease detection using deep learning methods from imbalanced ECG samples | |
Dissanayake et al. | A robust interpretable deep learning classifier for heart anomaly detection without segmentation | |
Račić et al. | Pneumonia detection using deep learning based on convolutional neural network | |
CN108806792B (zh) | 深度学习面诊*** | |
CN111728609B (zh) | 脑电信号的分类方法、分类模型的训练方法、装置及介质 | |
CN111340819A (zh) | 图像分割方法、装置和存储介质 | |
Niu et al. | Pathological evidence exploration in deep retinal image diagnosis | |
KR20170061222A (ko) | 건강데이터 패턴의 일반화를 통한 건강수치 예측 방법 및 그 장치 | |
CN110996785A (zh) | 生物电磁场中异常的机器判别 | |
Dabowsa et al. | A hybrid intelligent system for skin disease diagnosis | |
Musa et al. | A systematic review and Meta-data analysis on the applications of Deep Learning in Electrocardiogram | |
Di Biasi et al. | A cloud approach for melanoma detection based on deep learning networks | |
Puneet et al. | Optical coherence tomography image based eye disease detection using deep convolutional neural network | |
Xie et al. | Optic disc and cup image segmentation utilizing contour-based transformation and sequence labeling networks | |
CN111462082A (zh) | 一种病灶图片识别装置、方法、设备及可读存储介质 | |
CN108986889A (zh) | 一种病变识别模型训练方法、装置及存储设备 | |
Mohaidat et al. | Instrument detection for the intracorporeal suturing task in the laparoscopic box trainer using single-stage object detectors | |
Kim et al. | Artificial intelligence-based patient monitoring system for medical support | |
CN116645346A (zh) | 肩袖扫描图像的处理方法、电子设备及存储介质 | |
Ciaccio et al. | Biosignal pattern recognition and interpretation systems | |
KR20210102098A (ko) | 칼슘 스코어 및 질환을 예측하는 방법 | |
Singh et al. | Classification of arrhythmia using transfer learning and its applications in smart wearables | |
Alsalamah et al. | Detection of obstructive sleep apnea using deep neural network | |
Ogiela et al. | Towards new classes of cognitive vision systems | |
Dileep et al. | IGHOA Based Modified Convolutional Neural Network for Prediction of Cardiovascular Disease |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20181211 |
|
WW01 | Invention patent application withdrawn after publication |