CN110610472A - 实现肺结节图像分类检测的计算机装置及方法 - Google Patents
实现肺结节图像分类检测的计算机装置及方法 Download PDFInfo
- Publication number
- CN110610472A CN110610472A CN201810624285.4A CN201810624285A CN110610472A CN 110610472 A CN110610472 A CN 110610472A CN 201810624285 A CN201810624285 A CN 201810624285A CN 110610472 A CN110610472 A CN 110610472A
- Authority
- CN
- China
- Prior art keywords
- image
- lung
- lung nodule
- nodule
- images
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 206010056342 Pulmonary mass Diseases 0.000 title claims abstract description 222
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000001514 detection method Methods 0.000 title claims abstract description 33
- 238000009826 distribution Methods 0.000 claims abstract description 76
- 210000004072 lung Anatomy 0.000 claims abstract description 69
- 230000002685 pulmonary effect Effects 0.000 claims abstract description 43
- 238000012549 training Methods 0.000 claims abstract description 29
- 230000011218 segmentation Effects 0.000 claims abstract description 27
- 238000010801 machine learning Methods 0.000 claims abstract description 24
- 239000011159 matrix material Substances 0.000 claims abstract description 15
- 230000000877 morphologic effect Effects 0.000 claims abstract description 13
- 239000013598 vector Substances 0.000 claims description 21
- 238000012360 testing method Methods 0.000 claims description 20
- 238000004891 communication Methods 0.000 claims description 16
- 238000003860 storage Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 11
- 210000004204 blood vessel Anatomy 0.000 claims description 10
- 210000004224 pleura Anatomy 0.000 claims description 10
- 230000003044 adaptive effect Effects 0.000 claims description 6
- 238000005520 cutting process Methods 0.000 claims description 5
- 238000003384 imaging method Methods 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 5
- 238000005457 optimization Methods 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000004195 computer-aided diagnosis Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000035479 physiological effects, processes and functions Effects 0.000 description 2
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 210000001370 mediastinum Anatomy 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10072—Tomographic images
- G06T2207/10081—Computed x-ray tomography [CT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30061—Lung
- G06T2207/30064—Lung nodule
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Radiology & Medical Imaging (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Quality & Reliability (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Apparatus For Radiation Diagnosis (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种实现肺结节图像分类检测的计算机装置及方法,该方法包括步骤:通过CT扫描仪扫描患者的肺部CT图像,对肺部CT图像进行自适应形态分割得到肺结节图像;将肺结节图像标记成不同类别,并将标记的肺结节图像存储至图像数据库中;基于图像数据库中肺结节图像建立肺结节图像单元库;计算肺结节图像单元库中两两图像单元之间的距离得到距离矩阵;对距离矩阵进行聚类;计算每个肺结节图像单元的肺结节CT值密度分布特征;基于有监督机器学习模型使用CT值密度分布特征实现肺结节危险程度的训练和分类;根据每个肺结节图像的CT值密度分布剔除假阳性的肺结节图像。本发明提高了肺结节图像分类检测的准确性,具有广泛的应用范围。
Description
技术领域
本发明涉及肺结节图像处理的技术领域,尤其涉及一种实现肺结节图像分类检测的计算机装置及方法。
背景技术
近年来,肺结节临床诊断过程中肺部CT图像的应用越来越广泛,通过肺部CT图像分析肺结节的危险程度具有非常大的意义,尤其对早期肺结节的研究,研制一种高精度、临床意义大、鲁棒性强的肺结节图像分类检测***变得越来越重要。由于肺结节的复杂性,目前基于肺部CT图像处理的肺结节分类检测技术缺乏完备性。现有的技术对肺结节的分类不具备实用性,影响对肺结节分类检测精度不高,在实际应用中缺乏实用性。
发明内容
本发明的主要目的在于提供一种实现肺结节图像分类检测的计算机装置及方法,旨在解决现有基于肺部CT图像处理的肺结节分类检测技术缺乏完备性而影响对肺结节分类检测精度不高的问题。
为实现上述目的,本发明提供一种实现肺结节图像分类检测的计算机装置,一种实现肺结节图像分类检测的计算机装置,该计算机装置通过通信网络远程连接有CT扫描仪,并通过数据库连接与图像数据库连接,该计算机装置包括适于实现各种计算机程序指令的处理器以及适于存储多条计算机程序指令的存储器,所述计算机程序指令由处理器加载并执行如下步骤:通过CT扫描仪扫描患者的肺部CT图像,对肺部CT图像进行自适应形态分割得到肺结节图像;按照危险程度将肺结节图像标记成不同的类别,并将标记类别的肺结节图像存储至图像数据库中;基于图像数据库中肺结节图像建立肺结节图像单元库;计算肺结节图像单元库中两两图像单元之间的距离得到距离矩阵;对距离矩阵进行聚类并确定聚类数量来获得每个聚类的肺结节图像单元;计算每个肺结节图像单元的肺结节CT值密度分布特征;基于有监督机器学习模型使用肺结节CT值密度分布特征实现肺结节危险程度的训练和分类;根据每个肺结节图像的肺结节CT值密度分布剔除假阳性的肺结节图像保留疑似肺结节图像。
进一步地,所述对肺部CT图像进行自适应形态分割得到肺结节图像的步骤包括如下步骤:对肺部CT图像进行预处理确定双肺的边界进行肺实质分割;根据肺部CT图像的影像学和解剖学特征对肺部CT图像进行粗分割;应用FCM方法对粗分割后的肺部CT图像中每个候选结节进行精细分割,获得候选肺结节的基本图像;判断候选肺结节是否与胸膜和血管相连;分别与胸膜和血管相连的候选结节应用圆切法进行分割得到肺结节图像。
进一步地,所述基于图像数据库中肺结节图像建立肺结节图像单元库的步骤包括如下步骤:步骤A,判断肺结节图像的各图像单元像素点的CT值是否都大于预定的最小灰度值,如果是,则保存至暂存数据集;否则,遍历整个肺结节图像;步骤B,重复步骤A直到所有图像单元像素点都筛选完毕;步骤C,随机挑选所述的暂存数据集中的若干图像单元,并保存至肺结节图像单元库。
进一步地,所述计算每个聚类的肺结节图像单元的肺结节CT值密度分布特征的步骤包括如下步骤:逐个计算每个肺结节图像中CT值非零像素的密度分布级别,以该CT值非零像素为中心提取大小为b×b的小方块图像,其中b为小方块图像的边长;匹配所述小块图像与肺结节图像单元库中每一个肺结节图像单元,匹配到的肺结节图像单元的类别将作为测试像素的密度分布级别;遍历地匹配整个肺结节图像,得到其CT值密度分布图像;对密度分布图像中进行类别点数统计并归一化得到一个多维CT值密度分布特征向量,所述的CT值密度分布特征向量的维度数等于聚类数量。
进一步地,所述基于有监督机器学习模型使用肺结节CT值密度分布特征实现肺结节危险程度的训练和分类的步骤包括如下步骤:计算图像数据库中的所有肺结节图像得到CT值密度分布特征向量生成特征集,并将该特征集分割为训练集和测试集;从特征集中随机提取不少于预定比例的特征数据作为训练的特征集输入有监督机器学习模型进行训练,并进行参数优化;将特征集中除训练集外的其余特征数据作为测试特征集,将测试特征向量输入所述有监督机器学习模型进行肺结节危险程度分类识别。
另一方面,本发明还提供一种实现肺结节图像分类检测的方法,应用于计算机装置中,该计算机装置通过通信网络远程连接有CT扫描仪,并通过数据库连接与图像数据库连接,该方法包括如下步骤:通过CT扫描仪扫描患者的肺部CT图像,对肺部CT图像进行自适应形态分割得到肺结节图像;按照危险程度将肺结节图像标记成不同的类别,并将标记类别的肺结节图像存储至图像数据库中;基于图像数据库中肺结节图像建立肺结节图像单元库;计算肺结节图像单元库中两两图像单元之间的距离得到距离矩阵;对距离矩阵进行聚类并确定聚类数量来获得每个聚类的肺结节图像单元;计算每个肺结节图像单元的肺结节CT值密度分布特征;基于有监督机器学习模型使用肺结节CT值密度分布特征实现肺结节危险程度的训练和分类;根据每个肺结节图像的肺结节CT值密度分布剔除假阳性的肺结节图像保留疑似肺结节图像。
进一步地,所述对肺部CT图像进行自适应形态分割得到肺结节图像的步骤包括如下步骤:对肺部CT图像进行预处理确定双肺的边界进行肺实质分割;根据肺部CT图像的影像学和解剖学特征对肺部CT图像进行粗分割;应用FCM方法对粗分割后的肺部CT图像中每个候选结节进行精细分割,获得候选肺结节的基本图像;判断候选肺结节是否与胸膜和血管相连;分别与胸膜和血管相连的候选结节应用圆切法进行分割得到肺结节图像。
进一步地,所述基于图像数据库中肺结节图像建立肺结节图像单元库的步骤包括如下步骤:步骤A,判断肺结节图像的各图像单元像素点的CT值是否都大于预定的最小灰度值,如果是,则保存至暂存数据集;否则,遍历整个肺结节图像;步骤B,重复步骤A直到所有图像单元像素点都筛选完毕;步骤C,随机挑选所述的暂存数据集中的若干图像单元,并保存至肺结节图像单元库。
进一步地,进一步地,所述计算每个聚类的肺结节图像单元的肺结节CT值密度分布特征的步骤包括如下步骤:逐个计算每个肺结节图像中CT值非零像素的密度分布级别,以该CT值非零像素为中心提取大小为b×b的小方块图像,其中b为小方块图像的边长;匹配所述小块图像与肺结节图像单元库中每一个肺结节图像单元,匹配到的肺结节图像单元的类别将作为测试像素的密度分布级别;遍历地匹配整个肺结节图像,得到其CT值密度分布图像;对密度分布图像中进行类别点数统计并归一化得到一个多维CT值密度分布特征向量,所述的CT值密度分布特征向量的维度数等于聚类数量。
进一步地,所述基于有监督机器学习模型使用肺结节CT值密度分布特征实现肺结节危险程度的训练和分类的步骤包括如下步骤:计算图像数据库中的所有肺结节图像得到CT值密度分布特征向量生成特征集,并将该特征集分割为训练集和测试集;从特征集中随机提取不少于预定比例的特征数据作为训练的特征集输入有监督机器学习模型进行训练,并进行参数优化;将特征集中除训练集外的其余特征数据作为测试特征集,将测试特征向量输入所述有监督机器学习模型进行肺结节危险程度分类识别。
相较于现有技术,本发明所述实现肺结节图像分类检测的计算机装置及方法能够基于无监督聚类计算肺结节图像的CT值密度分布并提取该图像的密度分布特征,使用常用的聚类方法对肺结节数据进行分析,并利用轮廓指数的聚类评价参数评估聚类效果,提升处理效率、自适应程度以及方法的鲁棒性。本发明使用CT值密度分布计算方式计算肺结节图像的CT值密度分布特征,该特征用于表征肺结节CT值的稠密度,从而将肺结节的生理性转换为信息领域中的图像密度分布特征;本发明还能够基于有监督机器学习模型对不同肺结节类别密度分布特征的差异进行学习、分类,从而提高肺结节图像分类检测的准确性,具有广泛的应用范围。
附图说明
图1是本发明实现肺结节图像分类检测的计算机装置的优选实施例的方框示意图;
图2是本发明实现肺结节图像分类检测的方法优选实施例的流程图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对本发明的具体实施方式、结构、特征及其功效,详细说明如下。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参照图1所示,图1是本发明实现肺结节图像分类检测的计算机装置的优选实施例的方框示意图。在本实施例中,所述计算机装置1安装有肺结节图像分类检测***10,该计算机装置1通过通信网络3与CT扫描仪2进行远程信息通讯,例如计算机装置1从CT扫描仪2获取患者的肺部CT图像。所述计算机装置1可以为个人计算机、大型计算机、工作站计算机、服务器、云平台服务器等具有数据处理和通信功能的计算装置。
所述CT扫描仪2设置在健康检查机构、大型医院等医疗机构中,能够扫描患者的肺部CT图像。所述通信网络3可以为无线网路(例如GPRS、WIFI、Bluetooth等通信网路)或互联网际网络(例如Internet等网络)。所述计算机装置1还通过数据库连接5与图像数据库4连接,所述图像数据库4用于存储每一个患者的肺结节图像,所述数据库连接5可以为开放数据库连接(Open Database Connectivity,ODBC)以及Java数据库连接(Java Data BaseConnectivity,JDBC)。
在本实例中,所述实现肺结节图像分类检测的计算机装置1包括,但不仅限于,肺结节图像分类检测***10、适于存储多条计算机程序指令的存储器11、执行各种计算机程序指令的处理器12以及通信单元13。所述存储器11可以为一种只读存储器ROM,随机存储器RAM、电可擦写存储器EEPROM、快闪存储器FLASH、磁盘或光盘等。所述处理器12为一种中央处理器(CPU)、微控制器(MCU)、数据处理芯片、或者具有数据处理功能的信息处理单元。所述通信单元13为一种具有远程通讯功能的有线或无线通讯接口,例如,支持GSM、GPRS、WCDMA、CDMA、WIFI、蓝牙(Bluetooth)等通讯技术的通讯接口。
在本实施例中,所述肺结节图像分类检测***10由各种计算机程序指令组成的程序模块组成,包括但不局限于,肺结节图像获取模块101、肺结节图元聚类模块102、肺结节特征提取模块103、以及肺结节危险程度分类模块104。本发明所称的模块是指一种能够被计算机装置1的处理器12执行并且能够完成固定功能的一系列计算机程序指令段,其存储在计算机装置1的存储器11中,以下结合图2具体说明每一个模块的具体功能。
参考图2所示,是本发明实现肺结节图像分类检测的方法优选实施例的流程图。在本实施例中,所述实现肺结节图像分类检测的方法的各种方法步骤通过计算机软件程序来实现,该计算机软件程序以计算机程序指令的形式存储于计算机可读存储介质(例如存储器11)中,计算机可读存储介质可以包括:只读存储器、随机存储器、磁盘或光盘等,所述计算机程序指令能够被处理器(例如处理器12)加载并执行如下步骤S21至步骤S28。
步骤S21,通过CT扫描仪扫描患者的肺部CT图像,对肺部CT图像进行自适应形态分割得到肺结节图像;在本实施例中,CT扫描仪2扫描患者的肺部区域获取肺部CT图像,肺结节图像获取模块101通过通信单元13从CT扫描仪2获取肺部CT图像,并对肺部CT图像进行自适应形态分割得到肺结节图像。在本实施例中,肺结节图像获取模块101对肺部CT图像进行自适应形态分割之前还包括如下步骤:步骤1,利用肺部CAD(Computer Aided Diagnosis)方法对肺部CT图像进行预处理,确定双肺的边界进行肺实质分割(Lung Segmentation);在肺实质分割的过程中,由于左、右肺前内侧之间的纵隔区比较窄,当存在部分容积效应现象时,这个区域与肺区的对比度往往很低,造成左右肺区不能被成功分割。步骤2,根据肺部CT图像的影像学和解剖学特征对肺部CT图像进行粗分割,针对分割后出现左右肺未完全分离的情况,采用自适应形态分割得到肺结节图像。本发明采用自适应形态分割肺结节的主要分割依据是:肺结节中心具有较高CT值,而肺结节的边界是不规则的闭合或半闭合曲线;步骤3,应用FCM(Fuzzy C-Means)方法对粗分割后的肺部CT图像中每个候选结节进行精细分割,获得候选肺结节的基本图像;步骤4,判断候选结节是否与胸膜和血管相连;步骤5,分别与胸膜和血管相连的候选结节应用圆切法进行分割得到肺结节图像,实现结节图像的自适应形态的优质分割。
步骤S22,按照危险程度将肺结节图像标记成不同的类别,并将标记类别的肺结节图像存储至图像数据库4中;在本实施例中,肺结节图像获取模块101按照危险程度将肺结节图像标记成不同的类别,并将标记类别的肺结节图像存储至图像数据库4中,所述标记类别包括肺实质标记和疑似肺结节标记两种标记。
步骤S23,基于图像数据库中肺结节图像建立肺结节图像单元库;在本实施例中,肺结节图元聚类模块102基于图像数据库中肺结节图像建立肺结节图像单元库,包括如下步骤:步骤A,判断肺结节图像的各图像单元像素点的CT值是否都大于预定的最小灰度值,如果是,则保存至暂存数据集,否则,遍历整个肺结节图像;步骤B,重复执行步骤A直到所有图像单元像素点都筛选完毕;步骤C,随机挑选所述的暂存数据集中的若干图像单元,并保存至肺结节图像单元库。
步骤S24,计算肺结节图像单元库中两两图像单元之间的距离得到距离矩阵;在本实施例中,肺结节图元聚类模块102计算肺结节图像单元库中两两图像单元之间的距离得到距离矩阵。在较佳的实施方式中,所述的步骤S24包括以下步骤:设u、v为肺结节图像单元库中任意两个图像单元,依次将u、v由大小为a×a转换为1×2a的一维向量,分别为u={ui|i=0,1,2,…,2a}、和v={vi|i=0,1,2,…,2a},其中a为图像单元的边长;计算5组两个图像单元之间的距离为d得到五个距离矩阵Dj,j=1、2、3、4、5,设max,min分别为Dj中的最大值和最小值,目标选择的距离矩阵为Di;其中:Di=Dj,i=max-min的最大值。
步骤S25,对距离矩阵进行聚类并确定聚类数量来获得每个聚类的肺结节图像单元;在本实施例中,肺结节图元聚类模块102使用无监督聚类算法对距离矩阵进行聚类并确定聚类数量来获得每个聚类的肺结节图像单元。所述无监督聚类算法是现有机器学习技术中的一种聚类算法,包括K-Means聚类、分层聚类、t-SNE聚类、DBSCAN聚类等聚类算法。
步骤S26,计算每个聚类的肺结节图像单元的肺结节CT值密度分布特征。在本实施例中,所述CT值密度分布特征包括肺结节的危险程度,不同的肺结节类别具有不同的图像特征。肺结节特征提取模块103逐个计算每个肺结节图像中CT值非零像素的密度分布级别,以该CT值非零像素为中心提取大小为b×b的小方块图像,其中b为小方块图像的边长;匹配所述小块图像与肺结节图像单元库中每一个肺结节图像单元,匹配到的肺结节图像单元的类别将作为测试像素的密度分布级别;遍历地匹配整个肺结节图像,得到其CT值密度分布图像;对密度分布图像中进行类别点数统计并归一化得到一个多维CT值密度分布特征向量,所述CT值密度分布特征向量的维度数等于聚类数量。
步骤S27,基于有监督机器学习模型使用肺结节CT值密度分布特征实现肺结节危险程度的训练和分类;具体地,肺结节危险程度分类模块104基于有监督机器学习模型使用肺结节CT值密度分布特征实现肺结节危险程度的训练和分类,包括如下步骤:将图像数据库4中的所有肺结节图像都得到CT值密度分布特征向量,生成特征集,并将该特征集分割为训练集和测试集;从特征集中随机提取不少于预定比例(例如70%、80%或其他合适百分比)的特征数据作为训练的特征集输入有监督机器学习模型进行训练,并进行参数优化;将特征集中除训练集外的其余特征数据作为测试特征集,将测试特征向量输入上述的机器学习模型进行肺结节危险程度分类识别。
步骤S28,根据每个肺结节图像的肺结节CT值密度分布剔除假阳性的肺结节图像保留疑似肺结节图像;本实施例中,肺结节危险程度分类模块104根据每个肺结节图像的肺结节CT值密度分布剔除假阳性的肺结节图像保留疑似肺结节图像,以供医生对患者的肺部是否发生病变作为辅助参考依据,从而提高肺癌筛查、检测、诊断的准确率。
本发明实现肺结节图像分类检测的计算机装置及方法能够基于无监督聚类计算肺结节图像的CT值密度分布并提取该图像的密度分布特征,使用常用的聚类方法对肺结节数据进行分析,并利用轮廓指数的聚类评价参数评估聚类效果,提升处理效率、自适应程度以及方法的鲁棒性。本发明使用CT值密度分布计算方式计算肺结节图像的CT值密度分布特征,该特征用于表征肺结节CT值的稠密度,从而将肺结节的生理性转换为信息领域中的图像密度分布特征;本发明还基于有监督机器学习模型对不同肺结节类别密度分布特征的差异进行学习、分类,从而提高肺结节图像分类检测的准确性,具有广泛的应用范围。
本领域技术人员可以理解,上述实施方式中各种方法的全部或部分步骤可以通过相关程序指令完成,该程序可以存储于计算机可读存储介质中,存储介质可以包括:只读存储器、随机存储器、磁盘或光盘等。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种实现肺结节图像分类检测的计算机装置,该计算机装置通过通信网络远程连接有CT扫描仪,并通过数据库连接与图像数据库连接,其特征在于,该计算机装置包括适于实现各种计算机程序指令的处理器以及适于存储多条计算机程序指令的存储器,所述计算机程序指令由处理器加载并执行如下步骤:
通过CT扫描仪扫描患者的肺部CT图像,对肺部CT图像进行自适应形态分割得到肺结节图像;
按照危险程度将肺结节图像标记成不同的类别,并将标记类别的肺结节图像存储至图像数据库中;
基于图像数据库中肺结节图像建立肺结节图像单元库;
计算肺结节图像单元库中两两图像单元之间的距离得到距离矩阵;
对距离矩阵进行聚类并确定聚类数量来获得每个聚类的肺结节图像单元;
计算每个聚类的肺结节图像单元的肺结节CT值密度分布特征;
基于有监督机器学习模型使用肺结节CT值密度分布特征实现肺结节危险程度的训练和分类;
根据每个肺结节图像的肺结节CT值密度分布剔除假阳性的肺结节图像保留疑似肺结节图像。
2.如权利要求1所述的实现肺结节图像分类检测的计算机装置,其特征在于,所述对肺部CT图像进行自适应形态分割得到肺结节图像的步骤包括如下步骤:
对肺部CT图像进行预处理确定双肺的边界进行肺实质分割;
根据肺部CT图像的影像学和解剖学特征对肺部CT图像进行粗分割;
应用FCM方法对粗分割后的肺部CT图像中每个候选结节进行精细分割,获得候选肺结节的基本图像;
判断候选肺结节是否与胸膜和血管相连;
分别与胸膜和血管相连的候选结节应用圆切法进行分割得到肺结节图像。
3.如权利要求1所述的实现肺结节图像分类检测的计算机装置,其特征在于,所述基于图像数据库中肺结节图像建立肺结节图像单元库的步骤包括如下步骤:
步骤A,判断肺结节图像的各图像单元像素点的CT值是否都大于预定的最小灰度值,如果是,则保存至暂存数据集;否则,遍历整个肺结节图像;
步骤B,重复步骤A直到所有图像单元像素点都筛选完毕;
步骤C,随机挑选所述的暂存数据集中的若干图像单元,并保存至肺结节图像单元库。
4.如权利要求1所述的实现肺结节图像分类检测的计算机装置,其特征在于,所述计算每个聚类的肺结节图像单元的肺结节CT值密度分布特征的步骤包括如下步骤:
逐个计算每个肺结节图像中CT值非零像素的密度分布级别,以该CT值非零像素为中心提取大小为b×b的小方块图像,其中b为小方块图像的边长;
匹配所述小块图像与肺结节图像单元库中每一个肺结节图像单元,匹配到的肺结节图像单元的类别将作为测试像素的密度分布级别;
遍历地匹配整个肺结节图像,得到其CT值密度分布图像;
对密度分布图像中进行类别点数统计并归一化得到一个多维CT值密度分布特征向量,所述的CT值密度分布特征向量的维度数等于聚类数量。
5.如权利要求1所述的实现肺结节图像分类检测的计算机装置,其特征在于,所述基于有监督机器学习模型使用肺结节CT值密度分布特征实现肺结节危险程度的训练和分类的步骤包括如下步骤:
计算图像数据库中的所有肺结节图像得到CT值密度分布特征向量生成特征集,并将该特征集分割为训练集和测试集;
从特征集中随机提取不少于预定比例的特征数据作为训练的特征集输入有监督机器学习模型进行训练,并进行参数优化;
将特征集中除训练集外的其余特征数据作为测试特征集,将测试特征向量输入所述有监督机器学习模型进行肺结节危险程度分类识别。
6.一种实现肺结节图像分类检测的方法,应用于计算机装置中,该计算机装置通过通信网络远程连接有CT扫描仪,并通过数据库连接与图像数据库连接,其特征在于,该方法包括如下步骤:
通过CT扫描仪扫描患者的肺部CT图像,对肺部CT图像进行自适应形态分割得到肺结节图像;
按照危险程度将肺结节图像标记成不同的类别,并将标记类别的肺结节图像存储至图像数据库中;
基于图像数据库中肺结节图像建立肺结节图像单元库;
计算肺结节图像单元库中两两图像单元之间的距离得到距离矩阵;
对距离矩阵进行聚类并确定聚类数量来获得每个聚类的肺结节图像单元;
计算每个聚类的肺结节图像单元的肺结节CT值密度分布特征;
基于有监督机器学习模型使用肺结节CT值密度分布特征实现肺结节危险程度的训练和分类;
根据每个肺结节图像的肺结节CT值密度分布剔除假阳性的肺结节图像保留疑似肺结节图像。
7.如权利要求6所述的实现肺结节图像分类检测的方法,其特征在于,所述对肺部CT图像进行自适应形态分割得到肺结节图像的步骤包括如下步骤:
对肺部CT图像进行预处理确定双肺的边界进行肺实质分割;
根据肺部CT图像的影像学和解剖学特征对肺部CT图像进行粗分割;
应用FCM方法对粗分割后的肺部CT图像中每个候选结节进行精细分割,获得候选肺结节的基本图像;
判断候选肺结节是否与胸膜和血管相连;
分别与胸膜和血管相连的候选结节应用圆切法进行分割得到肺结节图像。
8.如权利要求6所述的实现肺结节图像分类检测的方法,其特征在于,所述基于图像数据库中肺结节图像建立肺结节图像单元库的步骤包括如下步骤:
步骤A,判断肺结节图像的各图像单元像素点的CT值是否都大于预定的最小灰度值,如果是,则保存至暂存数据集;否则,遍历整个肺结节图像;
步骤B,重复步骤A直到所有图像单元像素点都筛选完毕;
步骤C,随机挑选所述的暂存数据集中的若干图像单元,并保存至肺结节图像单元库。
9.如权利要求6所述的实现肺结节图像分类检测的方法,其特征在于,所述计算每个聚类的肺结节图像单元的肺结节CT值密度分布特征的步骤包括如下步骤:
逐个计算每个肺结节图像中CT值非零像素的密度分布级别,以该CT值非零像素为中心提取大小为b×b的小方块图像,其中b为小方块图像的边长;
匹配所述小块图像与肺结节图像单元库中每一个肺结节图像单元,匹配到的肺结节图像单元的类别将作为测试像素的密度分布级别;
遍历地匹配整个肺结节图像,得到其CT值密度分布图像;
对密度分布图像中进行类别点数统计并归一化得到一个多维CT值密度分布特征向量,所述的CT值密度分布特征向量的维度数等于聚类数量。
10.如权利要求6所述的实现肺结节图像分类检测的方法,其特征在于,所述基于有监督机器学习模型使用肺结节CT值密度分布特征实现肺结节危险程度的训练和分类的步骤包括如下步骤:
计算图像数据库中的所有肺结节图像得到CT值密度分布特征向量生成特征集,并将该特征集分割为训练集和测试集;
从特征集中随机提取不少于预定比例的特征数据作为训练的特征集输入有监督机器学习模型进行训练,并进行参数优化;
将特征集中除训练集外的其余特征数据作为测试特征集,将测试特征向量输入所述有监督机器学习模型进行肺结节危险程度分类识别。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810624285.4A CN110610472A (zh) | 2018-06-16 | 2018-06-16 | 实现肺结节图像分类检测的计算机装置及方法 |
PCT/CN2019/091190 WO2019238104A1 (zh) | 2018-06-16 | 2019-06-14 | 实现肺结节图像分类检测的计算机装置及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810624285.4A CN110610472A (zh) | 2018-06-16 | 2018-06-16 | 实现肺结节图像分类检测的计算机装置及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110610472A true CN110610472A (zh) | 2019-12-24 |
Family
ID=68842718
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810624285.4A Pending CN110610472A (zh) | 2018-06-16 | 2018-06-16 | 实现肺结节图像分类检测的计算机装置及方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN110610472A (zh) |
WO (1) | WO2019238104A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113808090A (zh) * | 2021-09-08 | 2021-12-17 | 中国科学院深圳先进技术研究院 | 一种磁共振图像处理方法、终端设备及计算机存储介质 |
CN115294401A (zh) * | 2022-08-23 | 2022-11-04 | 北京医准智能科技有限公司 | 一种基于ct图像的分类方法、装置、设备及存储介质 |
CN116934757A (zh) * | 2023-09-18 | 2023-10-24 | 电子科技大学 | 一种用于肺结节假阳性删减的方法、设备及存储介质 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111815591B (zh) * | 2020-06-29 | 2024-02-27 | 郑州大学 | 基于ct图像的肺结节检测方法 |
CN112116603A (zh) * | 2020-09-14 | 2020-12-22 | 中国科学院大学宁波华美医院 | 一种基于多任务学习的肺结节假阳性筛查方法 |
CN112686898B (zh) * | 2021-03-15 | 2021-08-13 | 四川大学 | 一种基于自监督学习的放疗靶区自动分割方法 |
CN116883996B (zh) * | 2023-09-01 | 2023-12-08 | 武汉互创联合科技有限公司 | 基于旋转等变网络的胚胎发育阶段预测与质量评估*** |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106250701B (zh) * | 2016-08-10 | 2019-02-01 | 华东理工大学 | 计算机软件***中实现肺结节危险程度分类的***和方法 |
CN108010013A (zh) * | 2017-11-03 | 2018-05-08 | 天津大学 | 一种肺ct图像肺结节检测方法 |
-
2018
- 2018-06-16 CN CN201810624285.4A patent/CN110610472A/zh active Pending
-
2019
- 2019-06-14 WO PCT/CN2019/091190 patent/WO2019238104A1/zh active Application Filing
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113808090A (zh) * | 2021-09-08 | 2021-12-17 | 中国科学院深圳先进技术研究院 | 一种磁共振图像处理方法、终端设备及计算机存储介质 |
CN115294401A (zh) * | 2022-08-23 | 2022-11-04 | 北京医准智能科技有限公司 | 一种基于ct图像的分类方法、装置、设备及存储介质 |
CN116934757A (zh) * | 2023-09-18 | 2023-10-24 | 电子科技大学 | 一种用于肺结节假阳性删减的方法、设备及存储介质 |
CN116934757B (zh) * | 2023-09-18 | 2023-11-21 | 电子科技大学 | 一种用于肺结节假阳性删减的方法、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2019238104A1 (zh) | 2019-12-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110610472A (zh) | 实现肺结节图像分类检测的计算机装置及方法 | |
US10467757B2 (en) | System and method for computer aided diagnosis | |
Ahirwar | Study of techniques used for medical image segmentation and computation of statistical test for region classification of brain MRI | |
US9256941B2 (en) | Microcalcification detection and classification in radiographic images | |
CN108133476B (zh) | 一种肺结节自动检测方法及*** | |
CN110766051A (zh) | 一种基于神经网络的肺结节形态学分类方法 | |
CN108062749B (zh) | 肛提肌裂孔的识别方法、装置和电子设备 | |
CN109635846A (zh) | 一种多类医学图像判断方法和*** | |
CN108426994A (zh) | 分析数字全息显微术数据以用于血液学应用 | |
CN108027970A (zh) | 用于分析血管的医学图像的方法、装置和*** | |
EP3657433B1 (en) | Medical image data | |
US10706534B2 (en) | Method and apparatus for classifying a data point in imaging data | |
Naresh et al. | Early detection of lung cancer using neural network techniques | |
Liu et al. | A fully automatic segmentation algorithm for CT lung images based on random forest | |
CN110349168B (zh) | 一种股骨头ct影像的分割方法 | |
Jaffar et al. | An ensemble shape gradient features descriptor based nodule detection paradigm: a novel model to augment complex diagnostic decisions assistance | |
CN112183237A (zh) | 基于颜色空间自适应阈值分割的白细胞自动分类方法 | |
Farhangi et al. | Automatic lung nodule detection in thoracic CT scans using dilated slice‐wise convolutions | |
Purnama et al. | Follicle detection on the usg images to support determination of polycystic ovary syndrome | |
Rathore et al. | CBISC: a novel approach for colon biopsy image segmentation and classification | |
Xie et al. | Automatic neuron tracing in volumetric microscopy images with anisotropic path searching | |
Herwanto et al. | Association technique based on classification for classifying microcalcification and mass in mammogram | |
de Brito Silva et al. | Classification of breast masses in mammograms using geometric and topological feature maps and shape distribution | |
Santamaria-Pang et al. | Cell segmentation and classification via unsupervised shape ranking | |
Vijayadeep et al. | A hybrid feature extraction based optimized random forest learning model for brain stroke prediction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20191224 |