CN111028223A - 一种微卫星不稳定肠癌能谱ct碘水图影像组学特征处理方法 - Google Patents
一种微卫星不稳定肠癌能谱ct碘水图影像组学特征处理方法 Download PDFInfo
- Publication number
- CN111028223A CN111028223A CN201911269293.2A CN201911269293A CN111028223A CN 111028223 A CN111028223 A CN 111028223A CN 201911269293 A CN201911269293 A CN 201911269293A CN 111028223 A CN111028223 A CN 111028223A
- Authority
- CN
- China
- Prior art keywords
- intestinal cancer
- value
- image
- energy spectrum
- omics
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 208000005016 Intestinal Neoplasms Diseases 0.000 title claims abstract description 85
- 201000002313 intestinal cancer Diseases 0.000 title claims abstract description 85
- ZCYVEMRRCGMTRW-UHFFFAOYSA-N 7553-56-2 Chemical compound [I] ZCYVEMRRCGMTRW-UHFFFAOYSA-N 0.000 title claims abstract description 49
- 229910052740 iodine Inorganic materials 0.000 title claims abstract description 49
- 239000011630 iodine Substances 0.000 title claims abstract description 49
- 238000001228 spectrum Methods 0.000 title claims abstract description 49
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 title claims abstract description 47
- 108091092878 Microsatellite Proteins 0.000 title claims abstract description 15
- 238000003672 processing method Methods 0.000 title claims abstract description 10
- 238000000034 method Methods 0.000 claims abstract description 36
- 238000007477 logistic regression Methods 0.000 claims abstract description 27
- 238000012545 processing Methods 0.000 claims abstract description 26
- 230000009467 reduction Effects 0.000 claims abstract description 13
- 238000010219 correlation analysis Methods 0.000 claims abstract description 8
- 238000000546 chi-square test Methods 0.000 claims abstract description 7
- 238000002790 cross-validation Methods 0.000 claims abstract description 7
- 238000005516 engineering process Methods 0.000 claims abstract description 7
- 238000001914 filtration Methods 0.000 claims abstract description 7
- 238000010276 construction Methods 0.000 claims abstract description 5
- 238000010801 machine learning Methods 0.000 claims abstract description 4
- 238000005457 optimization Methods 0.000 claims abstract description 4
- 239000011159 matrix material Substances 0.000 claims description 27
- 230000035945 sensitivity Effects 0.000 claims description 24
- 230000006870 function Effects 0.000 claims description 12
- 238000012360 testing method Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 8
- 238000003384 imaging method Methods 0.000 claims description 5
- 238000012795 verification Methods 0.000 claims description 5
- 230000001427 coherent effect Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 claims description 3
- 239000000126 substance Substances 0.000 abstract 1
- 238000010998 test method Methods 0.000 abstract 1
- 208000032818 Microsatellite Instability Diseases 0.000 description 31
- 206010028980 Neoplasm Diseases 0.000 description 8
- 238000001514 detection method Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 206010009944 Colon cancer Diseases 0.000 description 3
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000004393 prognosis Methods 0.000 description 3
- 239000003814 drug Substances 0.000 description 2
- 230000001575 pathological effect Effects 0.000 description 2
- 238000001356 surgical procedure Methods 0.000 description 2
- 238000007794 visualization technique Methods 0.000 description 2
- 206010014733 Endometrial cancer Diseases 0.000 description 1
- 206010014759 Endometrial neoplasm Diseases 0.000 description 1
- GHASVSINZRGABV-UHFFFAOYSA-N Fluorouracil Chemical compound FC1=CNC(=O)NC1=O GHASVSINZRGABV-UHFFFAOYSA-N 0.000 description 1
- 208000005718 Stomach Neoplasms Diseases 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 230000036770 blood supply Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 230000002357 endometrial effect Effects 0.000 description 1
- 229960002949 fluorouracil Drugs 0.000 description 1
- 206010017758 gastric cancer Diseases 0.000 description 1
- 238000009169 immunotherapy Methods 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 230000000968 intestinal effect Effects 0.000 description 1
- 230000036210 malignancy Effects 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012633 nuclear imaging Methods 0.000 description 1
- 238000009206 nuclear medicine Methods 0.000 description 1
- JMANVNJQNLATNU-UHFFFAOYSA-N oxalonitrile Chemical compound N#CC#N JMANVNJQNLATNU-UHFFFAOYSA-N 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000002980 postoperative effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 201000011549 stomach cancer Diseases 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000008733 trauma Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10072—Tomographic images
- G06T2207/10081—Computed x-ray tomography [CT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20092—Interactive image processing based on input by user
- G06T2207/20104—Interactive definition of region of interest [ROI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30028—Colon; Small intestine
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30096—Tumor; Lesion
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明提供一种微卫星不稳定肠癌能谱CT碘水图影像组学特征处理方法,包括:收集肠癌样本图像;对肠癌样本图像进行感兴趣区域勾画,提取感兴趣区域的图像特征;对提取的图像特征进行哑变量处理,生成一个取值为0或1的哑变量特征;引用卡方检验,对经过哑变量处理后的图像特征采用假设检验法过滤出具有统计学意义的组学特征;采用相关性分析方法对组学特征之间的冗余性进行过滤,引用Kendall相关性分析,计算相关性系数,得到过滤后的组学特征;基于模型层面,引入LASSO算法,对组学特征进行降维处理;基于机器学习方法的最优化理论,引入5折交叉验证技术,通过L2正则化模型构建思想,最优化得到L2正则化Logistic回归模型,采用ROC方法对L2正则化Logistic回归模型进行评价。
Description
技术领域
本发明涉及影像医学与核医学、影像组学技术领域,具体而言,尤其涉及一种微卫星不稳定肠癌能谱CT碘水图影像组学特征处理方法。
背景技术
肠癌是全球第三大常见的恶性肿瘤,其微卫星不稳定(microsatelliteinstability,MSI)状态与预后和治疗密切相关。2017年NCCN指南指出,MSI结直肠癌患者往往预后更好,更易获益于免疫治疗,并对氟尿嘧啶药物不敏感。目前对MSI的判断依赖于术后病理组织检测,但考虑到医疗设备的限制以及手术对患者造成的创伤,术前寻找无创方法获取MSI状态是十分必要的。已经有学者尝试基于影像特征评估子宫内膜癌、肠癌及胃癌MSI状态,但这些研究的诊断价值尚不明确,且更多定量的影像特征尚未被充分挖掘。
能谱CT作为临床常用的影像检查手段,能够通过碘水浓度图反映组织的血供状态。本团队前期研究发现,与微卫星稳定(microsatellite stability,MSS)结直肠癌组织相比,MSI结直肠癌的血供更少,平均碘浓度更低,但该研究忽略了碘浓度分布的空间异质性。影像组学分析是基于像素强度和空间分布特点,定量描述了组织异质性,一定程度上可作为肿瘤分子状态的潜在影像学标记物。
肠癌的MSI状态与其疗效及预后密切相关,目前,MSI已经成为肠癌组织标本的常规检测手段。但MSI的检测依赖于侵入性手术或活组织检查所获取的组织样本,而肿瘤异质性限制了该样本的有效性,因为小组织样本不可能代表整个肿瘤。此外,虽然MSI的检测已经被纳入临床实践中,但受到其成本、检测周期和技术复杂性的限制,大规模肿瘤分子检测难以在临床得到推广。影像检查能够直观地涵盖整个肿块的信息,避免了因肿瘤异质性造成的差异。它还可以观察肿瘤外周区域,而这些区域通常不能通过外科手术切除,很难获取其病理信息。
发明内容
根据上述提出的技术问题,而提供一种微卫星不稳定肠癌能谱CT碘水图影像组学特征处理方法。本发明将高通量的影像组学特征与MSI信息相关联,为MSI肠癌提供一种基于放射影像组学特征的非侵袭性的可视化方法。
本发明采用的技术手段如下:
一种微卫星不稳定肠癌能谱CT碘水图影像组学特征处理方法,包括如下步骤:
S1、收集肠癌样本图像,所述样本图像为MSI肠癌能谱CT碘水图像和MSS肠癌能谱CT碘水图像;
S2、对所述肠癌样本图像进行感兴趣区域勾画,提取感兴趣区域的图像特征;
S3、对所述步骤S2中提取的图像特征进行哑变量处理,生成一个取值为0或1的哑变量特征;
S4、引用卡方检验,对经过哑变量处理后的图像特征采用假设检验法过滤出具有统计学意义的组学特征;
S5、采用相关性分析方法对所述组学特征之间的冗余性进行过滤,引用Kendall相关性分析,计算相关性系数corxy,得到过滤后的组学特征;
S6、基于模型层面,引入LASSO算法,对所述步骤S5中过滤后的组学特征进行降维处理;通过5折交叉验证技术,构建L1正则化Logistic回归模型,得到L1正则化Logistic回归模型的损失函数,当所述损失函数最小时,由于是L1正则化,则部分过滤后的组学特征的权重将降至0值,将其剔除得出特征降维结果;
S7、基于机器学习方法的最优化理论,引入5折交叉验证技术,通过L2正则化模型构建思想,最优化得到L2正则化Logistic回归模型,并采用ROC方法对L2正则化Logistic回归模型进行评价。
进一步地,所述步骤S3中的哑变量处理过程具体为:
S31、假设所述肠癌样本图像的数量为n,所述MSI肠癌能谱CT碘水图像的数量为n1,MSS肠癌能谱CT碘水图像的数量为n2,提取的图像特征为p;
S32、对p中的n个取值p1,...,pn进行由小至大排序,得到q1,...,qn;
S33、设置普通阈值cutoffi,且令cutoffi=qi;对qi进行离散化,令大于cutoffi的取值为1;反之,小于cutoffi的取值为0,得到新特征p’;
S34、将所述肠癌样本图像的类别与新特征相匹配,得到混淆矩阵Ti;其中,MSI肠癌能谱CT碘水图像的类别为1类,MSS肠癌能谱CT碘水图像的类别为0类;
S35、根据混淆矩阵Ti,计算出与其对应的敏感度sensitivityi、特异度specificityi以及和值senspei,且令:和值=敏感度+特异度;
S36、计算所有和值中的最大值,即senspek=maxsenspei,得出对应的k值、混合矩阵Tk、cutoffk、sensitivityk、specificityk以及取值为0或1的哑变量特征qk。
进一步地,所述步骤S4的具体过程如下:
S41、设置Q为离散化后的新特性,分别对步骤S3中经过哑变量处理后的图像特征,寻找出与所述步骤S36中对应的混合矩阵Tk,通过四个表卡方检验得出卡方值x2;
S42、将所述卡方值x2与卡方界值表匹配,得到卡方检验p值;
S43、将p值大于0.05的图像特征剔除,保留p值小于0.05的图像特征,即为所述具有统计学意义的组学特征。
进一步地,所述步骤S5中还包括当|corxy|≥0.9时,剔除卡方检验p值较大特征的步骤;所述计算相关性系数corxy的公式如下:
其中,number of concordant pairs表示在混淆矩阵Tk中主对角线的和;numberof disconcordant pairs表示在混淆矩阵Tk中副对角线的和。
进一步地,所述L1正则化Logistic回归模型的损失函数具体为:
其中,n为肠癌样本图像的个数,β为具有统计学意义的组学特征的权重,||β||1为其L1范数,即||β||1=|β1|+|β2|+...+|βp|,lnl为对数似然函数,|β1|为第i个肠癌样本图像的特征组,y(i)为第i个肠癌样本图像的肠癌类别,λ为联系惩罚项与损失数的权重参数,λ的不同取值将产生不同的损失值。
进一步地,所述采用ROC方法对L2正则化Logistic回归模型进行评价的具体过程如下:
S71、假设所述肠癌样本图像的数量为n,所述MSI肠癌能谱CT碘水图像的数量为n1,MSS肠癌能谱CT碘水图像的数量为n2,降维处理后的组学特征数量为m;
S72、根据m个降维处理后的组学特征,构建L2正则化Logistic回归模型并对其进行内部验证,得到每个肠癌样本图像中属于MSI肠癌能谱CT碘水图像的概率P;
S73、对P中的n个取值p1’,...,pn’进行由小至大排序,得到q1’,...,qn’;
S74、设置普通阈值cutoffi’,且令cutoffi'=q'i;令大于cutoffi’的取值为1;小于cutoffi’的取值为0,得到新特征p”;
S75、将所述肠癌样本图像的类别与新特征p”相匹配,得到混淆矩阵Ti’;其中,MSI肠癌能谱CT碘水图像的类别为1类,MSS肠癌能谱CT碘水图像的类别为0类;
S76、根据混淆矩阵Ti’,计算出与其对应的敏感度sensitivityi’、特异度specificityi’以及和值senspei’,且令:和值=敏感度+特异度,同时得到n个敏感度与特异度的组合点(sensitivityi’,specificityi’);
S77、根据所述的n个敏感度与特异度的组合点,以1-specificityi’为横坐标,sensitivityi’为纵坐标,勾画散点图;
S78、将n个敏感度与特异度的组合点与端点(0,0)、(1,1)依次连接,得到ROC曲线,进而得出ROC曲线下面积AUC值;
S79、计算所有和值中的最大值,即senspek'=maxsenspei',得出对应的k值、混合矩阵Tk'、cutoffk'、sensitivityk'、specificityk'以及取值为0或1的哑变量特征qk'。
较现有技术相比,本发明具有以下优点:
1、本发明提供的微卫星不稳定肠癌能谱CT碘水图影像组学特征处理方法,将高通量的影像组学特征与MSI信息相关联,为MSI肠癌提供一种基于放射影像组学特征的非侵袭性的可视化方法。
2、本发明提供的微卫星不稳定肠癌能谱CT碘水图影像组学特征处理方法,对影像组学特征进行哑变量处理后模型的效果较优,具有较高的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做以简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明方法流程图。
图2为本发明实施例提供的ROC曲线图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例
如图1所示,本发明提供了一种微卫星不稳定肠癌能谱CT碘水图影像组学特征处理方法,
包括如下步骤:
S1、收集肠癌样本图像,所述样本图像为MSI肠癌能谱CT碘水图像和MSS肠癌能谱CT碘水图像;
S2、对所述肠癌样本图像进行感兴趣区域勾画,提取感兴趣区域的图像特征;
S3、对所述步骤S2中提取的图像特征进行哑变量处理,生成一个取值为0或1的哑变量特征;
步骤S3中的哑变量处理过程具体为:
S31、假设所述肠癌样本图像的数量为n,所述MSI肠癌能谱CT碘水图像的数量为n1,MSS肠癌能谱CT碘水图像的数量为n2,提取的图像特征为p;
S32、对p中的n个取值p1,...,pn进行由小至大排序,得到q1,...,qn;
S33、设置普通阈值cutoffi,且令cutoffi=qi;对qi进行离散化,令大于cutoffi的取值为1;反之,小于cutoffi的取值为0,得到新特征p’;
S34、将所述肠癌样本图像的类别与新特征相匹配,得到混淆矩阵Ti;其中,MSI肠癌能谱CT碘水图像的类别为1类,MSS肠癌能谱CT碘水图像的类别为0类;
S35、根据混淆矩阵Ti,计算出与其对应的敏感度sensitivityi、特异度specificityi以及和值senspei,且令:和值=敏感度+特异度;
S36、计算所有和值中的最大值,即senspek=maxsenspei,得出对应的k值、混合矩阵Tk、cutoffk、sensitivityk、specificityk以及取值为0或1的哑变量特征qk。
S4、引用卡方检验,对经过哑变量处理后的图像特征采用假设检验法过滤出具有统计学意义的组学特征;
步骤S4的具体过程如下:
S41、设置Q为离散化后的新特性,分别对步骤S3中经过哑变量处理后的图像特征,寻找出与所述步骤S36中对应的混合矩阵Tk,通过四个表卡方检验得出卡方值x2;
S42、将所述卡方值x2与卡方界值表匹配,得到卡方检验p值;
S43、将p值大于0.05的图像特征剔除,保留p值小于0.05的图像特征,即为所述具有统计学意义的组学特征。
S5、采用相关性分析方法对所述组学特征之间的冗余性进行过滤,引用Kendall相关性分析,计算相关性系数corxy,得到过滤后的组学特征;具体的,当|corxy|≥0.9时,剔除卡方检验p值较大特征,相关性系数corxy的计算公式如下:
其中,number of concordant pairs表示在混淆矩阵Tk中主对角线的和;numberof disconcordant pairs表示在混淆矩阵Tk中副对角线的和。
S6、基于模型层面,引入LASSO算法,对所述步骤S5中过滤后的组学特征进行降维处理;通过5折交叉验证技术,构建L1正则化Logistic回归模型,得到L1正则化Logistic回归模型的损失函数,当所述损失函数最小时,由于是L1正则化,则部分过滤后的组学特征的权重将降至0值,将其剔除得出特征降维结果;具体的,Logistic回归模型的损失函数为:
其中,n为肠癌样本图像的个数,β为具有统计学意义的组学特征的权重,||β||1为其L1范数,即||β||1=|β1|+|β2|+...+|βp|,lnl为对数似然函数,|β1|为第i个肠癌样本图像的特征组,y(i)为第i个肠癌样本图像的肠癌类别,λ为联系惩罚项与损失数的权重参数,λ的不同取值将产生不同的损失值。
S7、基于机器学习方法的最优化理论,引入5折交叉验证技术,通过L1、L2正则化模型构建思想,最优化得到L2正则化Logistic回归模型,并采用ROC方法对L2正则化Logistic回归模型进行评价。
所述采用ROC方法对L2正则化Logistic回归模型进行评价的具体过程如下:
S71、假设所述肠癌样本图像的数量为n,所述MSI肠癌能谱CT碘水图像的数量为n1,MSS肠癌能谱CT碘水图像的数量为n2,降维处理后的组学特征数量为m;
S72、根据m个降维处理后的组学特征,构建L2正则化Logistic回归模型并对其进行内部验证,得到每个肠癌样本图像中属于MSI肠癌能谱CT碘水图像的概率P;
S73、对P中的n个取值p1’,...,pn’进行由小至大排序,得到q1’,...,qn’;
S74、设置普通阈值cutoffi’,且令cutoffi'=q'i;令大于cutoffi’的取值为1;小于cutoffi’的取值为0,得到新特征p”;
S75、将所述肠癌样本图像的类别与新特征p”相匹配,得到混淆矩阵Ti’;其中,MSI肠癌能谱CT碘水图像的类别为1类,MSS肠癌能谱CT碘水图像的类别为0类;
S76、根据混淆矩阵Ti’,计算出与其对应的敏感度sensitivityi’、特异度specificityi’以及和值senspei’,且令:和值=敏感度+特异度,同时得到n个敏感度与特异度的组合点(sensitivityi’,specificityi’);
S77、根据所述的n个敏感度与特异度的组合点,以1-specificityi’为横坐标,sensitivityi’为纵坐标,勾画散点图;
S78、将n个敏感度与特异度的组合点与端点(0,0)、(1,1)依次连接,得到ROC曲线,如图2所示,为本实施例提供的ROC曲线图,进而得出ROC曲线下面积AUC值;与表1ROC曲线下AUC值及其诊断效果做对比。
S79、计算所有和值中的最大值,即senspek'=maxsenspei',得出对应的k值、混合矩阵Tk'、cutoffk'、sensitivityk'、specificityk'以及取值为0或1的哑变量特征qk'。
本实施例中,分别对训练数据集、验证集、HD750数据集进行模型构建、内部验证、外部测试。采用ROC方法对上述模型进行评价,得出AUC值,随后采用DeLong’s test对ROC进行显著性检验以评价AUC统计学意义。
表1 ROC曲线下AUC值及其诊断效果
研究的结论为对影像组学特征进行哑变量化后模型的效果较优,具有较高的准确性。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的范围。
Claims (6)
1.一种微卫星不稳定肠癌能谱CT碘水图影像组学特征处理方法,其特征在于,包括如下步骤:
S1、收集肠癌样本图像,所述样本图像为MSI肠癌能谱CT碘水图像和MSS肠癌能谱CT碘水图像;
S2、对所述肠癌样本图像进行感兴趣区域勾画,提取感兴趣区域的图像特征;
S3、对所述步骤S2中提取的图像特征进行哑变量处理,生成一个取值为0或1的哑变量特征;
S4、引用卡方检验,对经过哑变量处理后的图像特征采用假设检验法过滤出具有统计学意义的组学特征;
S5、采用相关性分析方法对所述组学特征之间的冗余性进行过滤,引用Kendall相关性分析,计算相关性系数corxy,得到过滤后的组学特征;
S6、基于模型层面,引入LASSO算法,对所述步骤S5中过滤后的组学特征进行降维处理;通过5折交叉验证技术,构建L1正则化Logistic回归模型,得到L1正则化Logistic回归模型的损失函数,当所述损失函数最小时,由于是L1正则化,则部分过滤后的组学特征的权重将降至0值,将其剔除得出特征降维结果;
S7、基于机器学习方法的最优化理论,引入5折交叉验证技术,通过L2正则化模型构建思想,最优化得到L2正则化Logistic回归模型,并采用ROC方法对L2正则化Logistic回归模型进行评价。
2.根据权利要求1所述的微卫星不稳定肠癌能谱CT碘水图影像组学特征处理方法,其特征在于,所述步骤S3中的哑变量处理过程具体为:
S31、假设所述肠癌样本图像的数量为n,所述MSI肠癌能谱CT碘水图像的数量为n1,MSS肠癌能谱CT碘水图像的数量为n2,提取的图像特征为p;
S32、对p中的n个取值p1,...,pn进行由小至大排序,得到q1,...,qn;
S33、设置普通阈值cutoffi,且令cutoffi=qi;对qi进行离散化,令大于cutoffi的取值为1;反之,小于cutoffi的取值为0,得到新特征p’;
S34、将所述肠癌样本图像的类别与新特征相匹配,得到混淆矩阵Ti;其中,MSI肠癌能谱CT碘水图像的类别为1类,MSS肠癌能谱CT碘水图像的类别为0类;
S35、根据混淆矩阵Ti,计算出与其对应的敏感度sensitivityi、特异度specificityi以及和值senspei,且令:和值=敏感度+特异度;
S36、计算所有和值中的最大值,即senspek=max senspei,得出对应的k值、混合矩阵Tk、cutoffk、sensitivityk、specificityk以及取值为0或1的哑变量特征qk。
3.根据权利要求1或2所述的微卫星不稳定肠癌能谱CT碘水图影像组学特征处理方法,其特征在于,所述步骤S4的具体过程如下:
S41、设置Q为离散化后的新特性,分别对步骤S3中经过哑变量处理后的图像特征,寻找出与所述步骤S36中对应的混合矩阵Tk,通过四个表卡方检验得出卡方值x2;
S42、将所述卡方值x2与卡方界值表匹配,得到卡方检验p值;
S43、将p值大于0.05的图像特征剔除,保留p值小于0.05的图像特征,即为所述具有统计学意义的组学特征。
6.根据权利要求1所述的微卫星不稳定肠癌能谱CT碘水图影像组学特征处理方法,其特征在于,所述采用ROC方法对L2正则化Logistic回归模型进行评价的具体过程如下:
S71、假设所述肠癌样本图像的数量为n,所述MSI肠癌能谱CT碘水图像的数量为n1,MSS肠癌能谱CT碘水图像的数量为n2,降维处理后的组学特征数量为m;
S72、根据m个降维处理后的组学特征,构建L2正则化Logistic回归模型并对其进行内部验证,得到每个肠癌样本图像中属于MSI肠癌能谱CT碘水图像的概率P;
S73、对P中的n个取值p1’,...,pn’进行由小至大排序,得到q1’,...,qn’;
S74、设置普通阈值cutoffi’,且令cutoffi'=q'i;令大于cutoffi’的取值为1;小于cutoffi’的取值为0,得到新特征p”;
S75、将所述肠癌样本图像的类别与新特征p”相匹配,得到混淆矩阵Ti’;其中,MSI肠癌能谱CT碘水图像的类别为1类,MSS肠癌能谱CT碘水图像的类别为0类;
S76、根据混淆矩阵Ti’,计算出与其对应的敏感度sensitivityi’、特异度specificityi’以及和值senspei’,且令:和值=敏感度+特异度,同时得到n个敏感度与特异度的组合点(sensitivityi’,specificityi’);
S77、根据所述的n个敏感度与特异度的组合点,以1-specificityi’为横坐标,sensitivityi’为纵坐标,勾画散点图;
S78、将n个敏感度与特异度的组合点与端点(0,0)、(1,1)依次连接,得到ROC曲线,进而得出ROC曲线下面积AUC值;
S79、计算所有和值中的最大值,即senspek'=maxsenspei',得出对应的k值、混合矩阵Tk'、cutoffk'、sensitivityk'、specificityk'以及取值为0或1的哑变量特征qk'。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911269293.2A CN111028223B (zh) | 2019-12-11 | 2019-12-11 | 一种微卫星不稳定肠癌能谱ct碘水图影像组学特征处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911269293.2A CN111028223B (zh) | 2019-12-11 | 2019-12-11 | 一种微卫星不稳定肠癌能谱ct碘水图影像组学特征处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111028223A true CN111028223A (zh) | 2020-04-17 |
CN111028223B CN111028223B (zh) | 2023-11-07 |
Family
ID=70206052
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911269293.2A Active CN111028223B (zh) | 2019-12-11 | 2019-12-11 | 一种微卫星不稳定肠癌能谱ct碘水图影像组学特征处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111028223B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112183557A (zh) * | 2020-09-29 | 2021-01-05 | 山西医科大学 | 基于胃癌组织病理图像纹理特征的msi预测模型构建方法 |
CN112651955A (zh) * | 2020-12-30 | 2021-04-13 | 深圳大学 | 一种肠道图像的识别方法及终端设备 |
CN113362932A (zh) * | 2021-06-24 | 2021-09-07 | 河北大学 | 一种基于cc-注意力机制的影像组学特征筛选方法 |
CN113921079A (zh) * | 2021-12-06 | 2022-01-11 | 四川省肿瘤医院 | 基于免疫相关基因的msi预测模型构建方法 |
CN115132327A (zh) * | 2022-05-25 | 2022-09-30 | 中国医学科学院肿瘤医院 | 微卫星不稳定预测***及其构建方法、终端设备及介质 |
CN117540346A (zh) * | 2024-01-09 | 2024-02-09 | 四川国蓝中天环境科技集团有限公司 | 大气污染数据高维回归建模的秩序类别变量冗余去除方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107220966A (zh) * | 2017-05-05 | 2017-09-29 | 郑州大学 | 一种基于影像组学的脑胶质瘤分级预测方法 |
US20170329912A1 (en) * | 2016-05-10 | 2017-11-16 | Macau University Of Science And Technology | Method and system for determining an association of biological features with a medical condition |
CN108460809A (zh) * | 2017-02-22 | 2018-08-28 | 西门子保健有限责任公司 | 用于***癌检测和分类的深度卷积编码器-解码器 |
US20190254611A1 (en) * | 2018-02-21 | 2019-08-22 | Case Western Reserve University | Predicting disease recurrence following trimodality therapy in non-small cell lung cancer using computed tomography derived radiomic features and clinico-patholigic features |
WO2019172621A1 (ko) * | 2018-03-09 | 2019-09-12 | 연세대학교 산학협력단 | 질환 예측 방법 및 이를 이용한 질환 예측 디바이스 |
CN110472629A (zh) * | 2019-08-14 | 2019-11-19 | 青岛大学附属医院 | 一种基于深度学习的病理图像自动识别***及其训练方法 |
-
2019
- 2019-12-11 CN CN201911269293.2A patent/CN111028223B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170329912A1 (en) * | 2016-05-10 | 2017-11-16 | Macau University Of Science And Technology | Method and system for determining an association of biological features with a medical condition |
CN108460809A (zh) * | 2017-02-22 | 2018-08-28 | 西门子保健有限责任公司 | 用于***癌检测和分类的深度卷积编码器-解码器 |
CN107220966A (zh) * | 2017-05-05 | 2017-09-29 | 郑州大学 | 一种基于影像组学的脑胶质瘤分级预测方法 |
US20190254611A1 (en) * | 2018-02-21 | 2019-08-22 | Case Western Reserve University | Predicting disease recurrence following trimodality therapy in non-small cell lung cancer using computed tomography derived radiomic features and clinico-patholigic features |
WO2019172621A1 (ko) * | 2018-03-09 | 2019-09-12 | 연세대학교 산학협력단 | 질환 예측 방법 및 이를 이용한 질환 예측 디바이스 |
CN110472629A (zh) * | 2019-08-14 | 2019-11-19 | 青岛大学附属医院 | 一种基于深度学习的病理图像自动识别***及其训练方法 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112183557A (zh) * | 2020-09-29 | 2021-01-05 | 山西医科大学 | 基于胃癌组织病理图像纹理特征的msi预测模型构建方法 |
CN112651955A (zh) * | 2020-12-30 | 2021-04-13 | 深圳大学 | 一种肠道图像的识别方法及终端设备 |
CN113362932A (zh) * | 2021-06-24 | 2021-09-07 | 河北大学 | 一种基于cc-注意力机制的影像组学特征筛选方法 |
CN113362932B (zh) * | 2021-06-24 | 2023-02-17 | 河北大学 | 一种基于cc-注意力机制的影像组学特征筛选方法 |
CN113921079A (zh) * | 2021-12-06 | 2022-01-11 | 四川省肿瘤医院 | 基于免疫相关基因的msi预测模型构建方法 |
CN115132327A (zh) * | 2022-05-25 | 2022-09-30 | 中国医学科学院肿瘤医院 | 微卫星不稳定预测***及其构建方法、终端设备及介质 |
WO2023226217A1 (zh) * | 2022-05-25 | 2023-11-30 | 中国医学科学院肿瘤医院 | 微卫星不稳定预测***及其构建方法、终端设备及介质 |
US12027255B2 (en) | 2022-05-25 | 2024-07-02 | Cancer Hospital, Chinese Academy Of Medical Sciences | System for predicting microsatellite instability and construction method thereof, terminal device and medium |
CN117540346A (zh) * | 2024-01-09 | 2024-02-09 | 四川国蓝中天环境科技集团有限公司 | 大气污染数据高维回归建模的秩序类别变量冗余去除方法 |
CN117540346B (zh) * | 2024-01-09 | 2024-03-19 | 四川国蓝中天环境科技集团有限公司 | 大气污染数据高维回归建模的秩序类别变量冗余去除方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111028223B (zh) | 2023-11-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111028223B (zh) | 一种微卫星不稳定肠癌能谱ct碘水图影像组学特征处理方法 | |
Xiao et al. | Development and validation of a deep learning-based model using computed tomography imaging for predicting disease severity of coronavirus disease 2019 | |
CN109670510B (zh) | 一种基于深度学习的胃镜活检病理数据筛查*** | |
CN110916666B (zh) | 一种预测手术切除肝细胞癌复发的影像组学特征处理方法 | |
Du et al. | Identification of COPD from multi-view snapshots of 3D lung airway tree via deep CNN | |
CN115345819A (zh) | 一种胃癌图像识别***、装置及其应用 | |
Attanasio et al. | Artificial intelligence, radiomics and other horizons in body composition assessment | |
CN114332132A (zh) | 图像分割方法、装置和计算机设备 | |
Raju et al. | Intelligent recognition of colorectal cancer combining application of computer-assisted diagnosis with deep learning approaches | |
CN110930402A (zh) | 一种基于子宫内膜癌的dki序列mk图的影像组学特征处理方法 | |
yahia Ibrahim et al. | An enhancement technique to diagnose colon and lung cancer by using double CLAHE and deep learning | |
Kumar et al. | A Novel Approach for Breast Cancer Detection by Mammograms | |
Mudeng et al. | Domain and histopathology adaptations–based classification for Malignancy Grading System | |
CN115132275B (zh) | 基于端到端三维卷积神经网络预测egfr基因突变状态方法 | |
CN110992312A (zh) | 医学图像处理方法、装置、存储介质及计算机设备 | |
Mohammed et al. | Esophageal Cancer Detection Using Feed-Forward Neural Network | |
Sharma et al. | Generous approach for diagnosis and detection of gastrointestinal tract disease with application of deep neural network | |
CN114445374A (zh) | 一种基于扩散峰度成像mk图的图像特征处理方法及*** | |
US20140107936A1 (en) | Cross-modal application of combination signatures indicative of a phenotype | |
Patra et al. | Two-layer deep feature fusion for detection of breast cancer using thermography images | |
CN114092427A (zh) | 一种基于多序列mri图像的克罗病与肠结核分类方法 | |
Roy Medhi | Lung Cancer Classification from Histologic Images using Capsule Networks | |
Ramkumar | Identification and Classification of Breast Cancer using Multilayer Perceptron Techniques for Histopathological Image | |
Zargar et al. | Using VGG16 Algorithms for classification of lung cancer in CT scans Image | |
Abinaya et al. | A systematic review: Intellectual detection and prediction of cancer using dl techniques |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |