CN117275744B - 一种综合基因突变特征与mIF图像特征的肺癌预后多模态预测模型构建方法 - Google Patents

一种综合基因突变特征与mIF图像特征的肺癌预后多模态预测模型构建方法 Download PDF

Info

Publication number
CN117275744B
CN117275744B CN202311559146.5A CN202311559146A CN117275744B CN 117275744 B CN117275744 B CN 117275744B CN 202311559146 A CN202311559146 A CN 202311559146A CN 117275744 B CN117275744 B CN 117275744B
Authority
CN
China
Prior art keywords
macromage
distmin
lung cancer
prognosis
gene mutation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311559146.5A
Other languages
English (en)
Other versions
CN117275744A (zh
Inventor
李�浩
王俊
杨帆
李运
盛剑鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University Peoples Hospital
Original Assignee
Peking University Peoples Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University Peoples Hospital filed Critical Peking University Peoples Hospital
Priority to CN202311559146.5A priority Critical patent/CN117275744B/zh
Publication of CN117275744A publication Critical patent/CN117275744A/zh
Application granted granted Critical
Publication of CN117275744B publication Critical patent/CN117275744B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/50Mutagenesis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/30Unsupervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Abstract

本发明属于疾病诊断和风险预测领域,具体涉及一种综合基因突变特征与多重免疫荧光染色mIF图像特征的肺癌预后多模态预测模型构建方法和预测模型***。与基于基因突变特征的单模态预后模型相比,本发明开发的综合基因突变特征和mIF图像特征所构建的肺癌预后的多模态预测模型***具有更高的准确性、特异性、敏感性和稳健性,很好地解决了目前临床上对于肺癌预后预测结果不准确或者敏感性不足,无法适用于大部分人群的问题。

Description

一种综合基因突变特征与mIF图像特征的肺癌预后多模态预 测模型构建方法
技术领域
本发明属于疾病诊断和风险预测领域,具体涉及一种综合基因突变特征与mIF图像特征的肺癌预后多模态预测模型构建方法和预测模型***。
背景技术
肺癌是我国发病率和死亡率最高的癌症,其中85%的病理亚型为非小细胞肺癌。根据WHO推出的肿瘤分期***可将肺癌分为四期,其中早期肺癌包括I期、II期以及III期疾病的一个亚组。目前早期非小细胞肺癌的标准治疗是根治性切除术,在肺癌手术后,要对患者的手术后生存率进行预测,以辅助临床决策是否追加辅助治疗,例如辅助化放疗、辅助靶向治疗等。
目前最常见的预后判断方案是TNM病理分期,即将已经被切除的肿瘤制备病理切片,由病理科医生判读肿瘤的大小和浸润以及***受累的程度,并结合是否发生肿瘤的远隔转移对患者进行TNM病理分期,推测患者的预后情况。然而,用TNM分期预测肺癌手术后无病生存率欠缺精准,同一分期的不同患者无病生存率差异很大,对手术后无病生存率的预测非常不准确。
针对临床上采用的TNM病理分期存在的缺陷,中国专利(CN113517073B)提出了一种基于临床特征预测患者预后的模型,该方法主要通过采集患者年龄、肿瘤大小、手术方式、基因突变分型和***转移等数据,对患者进行危险分层,从而构建了一种肺癌手术后生存率预测方法和***。然而,这种仅基于临床特征和部分基因突变特征的患者预后模型也存在一定缺陷。因此,该模型可能存在特异性较低和敏感性较差的问题,即使在肺癌中,基因突变的发生频率依然较低,对于大部分人的检测敏感性不足,且肺癌内部的异质性较大,患者的临床特征较为粗略,仅仅依靠临床特征无法反应肺癌内部的复杂性。
目前主流观点认为基因突变是造成肿瘤发生的主要原因,检测肺癌中的基因突变有利于提示患者的预后情况。其次,肿瘤免疫微环境(Tumor Immune Micro-environment,TIME)也是影响肿瘤生长的重要因素,是肿瘤异质性的部分体现,对于肿瘤免疫微环境的评估有利于预测患者的预后。因此,如果能将对肺癌中基因突变的检测和肿瘤免疫微环境的检测结合在一起,则可能会极大地改进对肺癌生存率的预测。
有鉴于此,本发明人联合下一代测序(Next Generation Sequencing,NGS)和多重免疫荧光(Multiple Immunofluence,mIF)两种技术分别检测基因突变和肿瘤免疫微环境,从而构建了一种肺癌预后的多模态预测模型。
现有技术中尚无相关研究成果的报道。
发明内容
本发明的目的是为了填补现有技术的空白,解决目前临床上使用的以及处于研发阶段的肺癌预后预测模型存在的缺陷,提供了一种综合基因突变特征与mIF图像特征的肺癌预后多模态预测模型构建方法和预测模型***。
为了达到本发明的目的,本发明采用了如下技术方案:
在第一个方面中,本发明提供了一种综合基因突变特征与多重免疫荧光染色(mIF)图像特征的肺癌预后多模态预测模型构建方法,所述预测模型构建方法包括以下步骤:
步骤1:获取基因突变特征:获得一种或多种与肺癌患者的预后不良显著相关的基因突变特征;
步骤2:获取mIF图像特征:
步骤2.1:使用一种或多种肺癌细胞表面抗原的相应抗体对患者的肺癌组织切片进行mIF;
步骤2.2:对染色后的组织切片拍摄详细的图像,使用软件进行分析,通过聚类分析得到多种不同的单细胞在切片上的分布;
步骤2.3:获得肿瘤免疫微环境特征与患者预后之间的关系;
步骤2.4:获得对于患者预后具有主导地位的mIF图像特征;
步骤3:预测模型的验证:验证预测模型的准确性、特异性、敏感性和稳健性。
作为可选的方式,在上述预测模型构建方法中,
在步骤1中,***性分析肺癌患者的基因突变谱,将基因突变谱中基因突变的发生与患者预后情况做Cox单因素回归分析,获得一种或多种与肺癌患者的预后不良显著相关的基因突变特征;
在步骤2.2中,对染色后的组织切片拍摄详细的图像,使用图像分析软件,利用每个抗原的单抗染色组织图像构建的光谱库对多光谱图像进行解混,拼接每个视野的图像以获得切片的完整视图,使用软件对图像进行分割,生成mask文件,使用软件进行分析,通过聚类分析得到多种不同的单细胞在切片上的分布;
在步骤2.3中,根据细胞核间最近距离(distMin)、细胞核间最远距离(distMax)、细胞核间平均距离(distMean)以及细胞属性四种维度定义患者的肿瘤免疫微环境特征;
在步骤2.4中,使用Cox单因素回归分析上述步骤2.3中获得的所述肿瘤免疫微环境特征与患者预后之间的关系,获得对于患者预后具有主导地位的mIF图像特征;
在步骤3中,采用步骤1中获得的基因突变特征和步骤2中获得的mIF图像特征进行多模态的Kaplan-Meier曲线拟合,以验证所述预测模型的准确性、特异性、敏感性和稳健性。
作为一个更优选的实施方式,所述预测模型构建方法包括以下步骤:
步骤1:获取基因突变特征:
***性分析肺癌患者的基因突变谱,将基因突变谱中基因突变的发生与患者预后情况做Cox单因素回归分析,获得一种或多种与肺癌患者的预后不良显著相关的基因突变特征;
步骤2:获取mIF图像特征:
步骤2.1:使用一种或多种肺癌细胞表面抗原的相应抗体对患者的肺癌组织切片进行mIF;
步骤2.2:对染色后的组织切片拍摄详细的图像,使用图像分析软件,利用每个抗原的单抗染色组织图像构建的光谱库对多光谱图像进行解混,拼接每个视野的图像以获得切片的完整视图,使用软件对图像进行分割,生成mask文件,使用软件进行分析,通过聚类分析得到多种不同的单细胞在切片上的分布;
步骤2.3:根据细胞核间最近距离(distMin)、细胞核间最远距离(distMax)、细胞核间平均距离(distMean)以及细胞属性四种维度定义患者的肿瘤免疫微环境特征,对每一维特征,统计所有患者在该特征上的9个十分位数,这9个十分位数将每一维特征都分成了10个区间,即,对于特征A,根据所有患者的总体情况,将其分为10个区间:,如对于某个患者的特征A,统计其落在这10个区间的比例,将1维特征扩散为10维,记为A_0,A_1,⋯A_9;
步骤2.4:使用Cox单因素回归分析上述步骤2.3中获得的所述肿瘤免疫微环境特征与患者预后之间的关系,获得对于患者预后具有主导地位的mIF图像特征;
步骤3:预测模型的验证:
采用步骤1中获得的基因突变特征和步骤2中获得的mIF图像特征进行多模态的Kaplan-Meier曲线拟合,以验证所述预测模型的准确性、特异性、敏感性和稳健性。
作为可选的方式,在上述预测模型构建方法中,所述肺癌为肺癌I-IIIA期。
作为可选的方式,在上述预测模型构建方法中,在步骤2.1中,使用的肺癌细胞表面抗原选自以下一种或多种:PANCK、CD4、CD8、FOXP3、CD68、CD86、MPO、CD11c、CD11b、CD206、PD-1、CD19、CD3、aSMA、CD31、Collagen I、CD94或PD-L1。
优选地,在步骤2.1中,使用的肺癌细胞表面抗原选自PANCK、CD4、CD8、FOXP3、CD68和PD-L1。
作为可选的方式,在上述预测模型构建方法中,在步骤2.2中,所述图像的分辨率为4028×3012像素,使用的图像分析软件为inform高级图像分析软件,使用CellProfiler软件对图像进行分割,使用histoCAT软件对mask文件进行分析,使用的聚类方法为监督的谱系归属方法。
作为可选的方式,在上述预测模型构建方法中,在步骤2.2中,通过监督的谱系归属方法聚类得到多种不同的单细胞在切片上的分布,所述单细胞选自以下两种或更多种:巨噬细胞&CD8 T、巨噬细胞&T、CD4T:CD4+FOXP3-PDL1-、CD8T:CD8+PDL1-、巨噬细胞:CD68+PDL1-、其他、Treg:CD4+FOXP3+、PD-L1+上皮细胞:PANCK+PDL1+、上皮细胞:PANCK+PDL1-。
优选地,所述单细胞选自巨噬细胞&CD8 T、巨噬细胞&T、CD4T:CD4+FOXP3-PDL1-、CD8T:CD8+PDL1-、巨噬细胞:CD68+PDL1-、其他、Treg:CD4+FOXP3+、PD-L1+上皮细胞:PANCK+PDL1+和上皮细胞:PANCK+PDL1-。
作为可选的方式,在上述预测模型构建方法中,在步骤2.3中,所述细胞属性为细胞核面积、长径、短径以及长短径之比4个维度,每一张切片中的细胞间距离参数共有(C2 9+9)3=135个维度,每一张切片共有139个特征维度,对于每一位患者而言,基于mIF切片图像的肿瘤免疫微环境特征维数为139/>10=1390维。
作为可选的方式,在上述预测模型构建方法中,在步骤1中,与肺癌患者的预后不良显著相关的基因突变特征包括以下一种或多种:FLT3、AR、AXIN1、GABRA6、KRAS、BRD4、PTEN、IL7R、PBRM1。
优选地,肺癌患者的预后不良显著相关的基因突变特征为FLT3、AR、AXIN1、GABRA6、KRAS、BRD4、PTEN、IL7R、PBRM1。
作为可选的方式,在上述预测模型构建方法中,在步骤2.4中,对于患者预后具有主导地位的mIF图像特征包括以下一种或多种:distMin_Macrophage&CD8T_Macrophage&T_4、distMin_CD4T_Macrophage_9、distMin_Macrophage_Macrophage_5、distMin_CD4T_Macrophage_2、distMin_CD4T_Macrophage_3、distMin_Macrophage&CD8T_Macrophage&T_5、distMin_Macrophage_Macrophage_4、distMin_Macrophage_Treg_2、distMin_Macrophage&CD8T_Macrophage&T_3、distMin_CD4T_PD-L1+Epithelial_6。
优选地,对于患者预后具有主导地位的mIF图像特征为distMin_Macrophage&CD8T_Macrophage&T_4、distMin_CD4T_Macrophage_9、distMin_Macrophage_Macrophage_5、distMin_CD4T_Macrophage_2、distMin_CD4T_Macrophage_3、distMin_Macrophage&CD8T_Macrophage&T_5、distMin_Macrophage_Macrophage_4、distMin_Macrophage_Treg_2、distMin_Macrophage&CD8T_Macrophage&T_3、distMin_CD4T_PD-L1+Epithelial_6。
在第二个方面中,本发明提供了采用上述第一个方面所述的预测模型构建方法构建的肺癌预后的预测模型***。
作为可选的方式在所述预测模型***中,与肺癌患者的预后不良显著相关的基因突变特征包括以下一种或多种:FLT3、AR、AXIN1、GABRA6、KRAS、BRD4、PTEN、IL7R、PBRM1。
优选地,肺癌患者的预后不良显著相关的基因突变特征为FLT3、AR、AXIN1、GABRA6、KRAS、BRD4、PTEN、IL7R、PBRM1。
对于患者预后具有主导地位的mIF图像特征包括以下一种或多种:distMin_Macrophage&CD8T_Macrophage&T_4、distMin_CD4T_Macrophage_9、distMin_Macrophage_Macrophage_5、distMin_CD4T_Macrophage_2、distMin_CD4T_Macrophage_3、distMin_Macrophage&CD8T_Macrophage&T_5、distMin_Macrophage_Macrophage_4、distMin_Macrophage_Treg_2、distMin_Macrophage&CD8T_Macrophage&T_3、distMin_CD4T_PD-L1+Epithelial_6。
优选地,对于患者预后具有主导地位的mIF图像特征为distMin_Macrophage&CD8T_Macrophage&T_4、distMin_CD4T_Macrophage_9、distMin_Macrophage_Macrophage_5、distMin_CD4T_Macrophage_2、distMin_CD4T_Macrophage_3、distMin_Macrophage&CD8T_Macrophage&T_5、distMin_Macrophage_Macrophage_4、distMin_Macrophage_Treg_2、distMin_Macrophage&CD8T_Macrophage&T_3、distMin_CD4T_PD-L1+Epithelial_6。
本发明相对于现有技术,具有以下有益效果:
与基于基因突变特征的单模态预后模型相比,本发明开发的综合基因突变特征和mIF图像特征所构建的肺癌预后多模态预测模型***具有更高的准确性、特异性、敏感性和稳健性,很好地解决了目前临床上对于肺癌预后预测结果不准确或者敏感性不足,无法适用于大部分人群的问题。
附图说明
结合附图,通过以下非限制性实施方式的详细描述,本公开内容的其他特征、目的和优点将变得更加明显。在附图中:
图1:本发明综合基因突变特征与mIF图像特征的肺癌预后多模态预测模型示意图。
图2:肺癌患者的主要基因突变特征与患者生存率之间的关系。
图3:通过监督的谱系归属方法聚类得到的9种不同的单细胞的标记物表达热图。
图4:通过监督的谱系归属方法聚类得到的9种不同的单细胞在切片上的分布的代表性照片。其中,放大倍数20倍。
图5:肺癌患者巨噬细胞相关的distMin特征与患者生存率之间的关系。其中:(a):distMin_Macrophage&CD8T_Macrophage&T_4;(b):distMin_Macrophage_Macrophage_4;(c):distMin_Macrophage_Treg_2;(d):distMin_Macrophage&CD8T_Macrophage&T_3;(e):distMin_CD4T_PD-L1+Epithelial_6;(f):distMin_CD4T_Macrophage_3。
图6:采用基因突变特征和/或mIF图像特征进行单模态、多模态的Kaplan-Meier曲线的拟合结果。
具体实施方式
下面参照具体的实施例对本发明做进一步说明。应当理解,此处所描述的具体实施例仅用于解释本发明,并不用于限定本发明的范围。
在本公开内容中,应理解,诸如“包括”或“具有”等的术语旨在指示本说明书中所公开的标签、数字、步骤、行为、部件、部分或其组合的存在,并且不欲排除一个或多个其他标签、数字、步骤、行为、部件、部分或其组合存在或被添加的可能性。
实施例中未注明具体技术或条件者,按照本领域内的文献所描述的技术或条件,或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可通过正规渠道购买得到的常规产品。
下面实施例中的实验方法,如无特殊说明,均为常规方法。下述实施例中所用的试验材料,如无特殊说明,均为市售产品。
实施例
在基因突变检测方面,本发明人基于257例肺腺癌患者(来自北京大学人民医院的临床试验数据,IRB NO.2021PHB182-001)的NGS数据***性分析了肿瘤组织的基因突变图谱,并将基因突变的发生与患者预后情况做Cox单因素回归分析,发现包括FLT3、AR、AXIN1、GABRA6、KRAS、BRD4、PTEN、IL7R、PBRM1在内的9种基因突变特征与肺癌患者的预后不良相关性最为显著。
具体结果见表1,其中HR是这9种基因突变特征对于预后情况的风险比,HR>1即为预后不良的危险因素,P<0.05表示这种相关性具有统计学的显著意义,表1说明这9种基因突变特征均为预后不良的危险因素。
表1:肺癌患者的主要基因突变特征与肺癌患者预后不良之间的相关性
另外,通过Kaplan-Meier曲线显示了上述基因突变特征的患者生存率随时间下降得更快,进一步验证了这些基因突变特征与预后不良显著相关(见图2)。
在肿瘤免疫微环境方面,本发明使用包括PANCK、CD4、CD8、FOXP3、CD68和PD-L1在内的6种细胞表面抗原的相应抗体对肺癌组织切片进行多重免疫荧光染色(mIF)。
为了分析组织切片,采用PerkinElmer Vectra(Vectra 3.0.5),利用4×显微镜物镜透镜预览整个切片,并用20×显微镜物镜透镜拍摄详细的图像。所得图像的分辨率高达4028×3012像素,有利于准确检测。然后,使用inform高级图像分析软件(版本2.3.0)、利用每个抗原的单抗染色组织图像构建的光谱库对多光谱图像进行解混。接着,拼接每个视野的图像以获得切片的完整视图。最后,我们使用CellProfiler软件对图像进行分割,生成mask文件,并使用histoCAT软件进行分析,通过监督的谱系归属方法聚类得到9种不同的单细胞在切片上的分布(分别见图3和图4)。如图3中所示,这9种不同的单细胞分别是巨噬细胞&CD8 T、巨噬细胞&T、CD4T:CD4+FOXP3-PDL1-、CD8T:CD8+PDL1-、巨噬细胞:CD68+PDL1-、其他、Treg:CD4+FOXP3+、PD-L1+上皮细胞:PANCK+PDL1+、上皮细胞:PANCK+PDL1-。
为了进一步通过mIF切片图像特征来评估肿瘤免疫微环境,根据细胞核间最近距离(distMin)、细胞核间最远距离(distMax)、细胞核间平均距离(distMean)以及细胞属性四种维度定义每一名患者的肿瘤免疫微环境特征。distMin包括每一个细胞的细胞核分别与同种细胞、其他8种细胞的细胞核之间的9个最近距离,如巨噬细胞(Macrophage)与同种巨噬细胞之间的最近距离参数记为distMin_Macrophage_Macrophage,而CD4+T细胞(CD4T)与巨噬细胞之间的最近距离记为distMin_CD4T_Macrophage,distMax和distMean与之同理,因此一张切片中的细胞间距离参数共有(C2 9+9)3=135个维度;而细胞属性包括细胞核面积、长径、短径以及长短径之比4个维度。故对于每一张切片共有135+4=139个特征维度。
为了充分表征不同患者肿瘤间的异质性,对每一维特征,统计所有患者在该特征上的9个十分位数,这9个十分位数将每一维特征都分成了10个区间,即,对于特征A,根据所有患者的总体情况,将其分为10个区间:。如对于某个患者的特征A,统计其落在这10个区间的比例,将1维特征扩散为10维,记为A_0,A_1,⋯A_9。因此对于每一位患者而言,基于mIF切片图像的肿瘤免疫微环境特征维数扩展为139*10=1390维。
为了评估肿瘤免疫微环境对于肺癌患者预后的影响,使用Cox单因素回归分析上述mIF切片所反映的1390维特征与患者预后之间的关系,发现distMin特征与患者预后高度相关,且Cox单因素分析表明巨噬细胞相关的distMin特征(包括distMin_Macrophage&CD8T_Macrophage&T_4、distMin_CD4T_Macrophage_9、distMin_Macrophage_Macrophage_5、distMin_CD4T_Macrophage_2、distMin_CD4T_Macrophage_3、distMin_Macrophage&CD8T_Macrophage&T_5、distMin_Macrophage_Macrophage_4、distMin_Macrophage_Treg_2、distMin_Macrophage&CD8T_Macrophage&T_3)对于预后的影响具有主导地位(见表2)。目前认为细胞之间的距离越近,越容易发生相互作用,因此distMin代表了细胞之间相互作用的强度,而巨噬细胞在抗原呈递、调节免疫等方面的重要作用奠定了其作为生物标志物构建肺癌预后模型的理论基础。
表2:肺癌患者巨噬细胞相关的distMin特征与肺癌患者预后不良之间的相关性
为了进一步明确distMin特征与患者预后不良的关系,使用Kaplan-Meier法对包括distMin_Macrophage&CD8T_Macrophage&T_4、distMin_Macrophage_Macrophage_4、distMin_Macrophage_Treg_2、distMin_Macrophage&CD8T_Macrophage&T_3、distMin_CD4T_PD-L1+Epithelial_6、distMin_CD4T_Macrophage_3在内的六种distMin特征进行生存分析,验证了对于预后的显著影响(见图5)。
为了综合考虑各种基因突变及mIF图像特征对于预后的预测作用,根据这些特征分别对患者进行单模态、多模态的Kaplan-Meier曲线拟合。首先,分别根据10种筛选出来的mIF图像特征(distMin_Macrophage&CD8T_Macrophage&T_4、distMin_CD4T_Macrophage_9、distMin_Macrophage_Macrophage_5、distMin_CD4T_Macrophage_2、distMin_CD4T_Macrophage_3、distMin_Macrophage&CD8T_Macrophage&T_5、distMin_Macrophage_Macrophage_4、distMin_Macrophage_Treg_2、distMin_Macrophage&CD8T_Macrophage&T_3、distMin_CD4T_PD-L1+Epithelial_6)和9种基因突变特征(FLT3、AR、AXIN1、GABRA6、KRAS、BRD4、PTEN、IL7R、PBRM1)通过聚类分析将患者分为高风险组和低风险组,并分别进行单模态的Kaplan-Meier曲线拟合,发现无论是mIF图像特征还是基因突变特征都与预后有着显著的关系(见图6)。但是基因突变特征的Kaplan-Meier曲线陡峭,说明人群的突变频率较低,基因突变特征不能反映大部分人群的预后特征;而mIF图像特征的Kaplan-Meier曲线变化趋势较平缓,说明mIF图像特征可以辅助补充基因突变特征所不能代表的预后情况。因此进一步结合基因突变与mIF图像特征进行多模态的Kaplan-Meier曲线拟合,根据上述特征进行聚类分析,将患者分为高风险组和低风险组,发现此时所得的Kaplan-Meier曲线更加平缓,且P值更小(见图6),说明综合考虑基因突变和mIF图像特征的多模态预测模型对于预后的预测效果更加准确且稳健。
与基于基因突变特征的单模态预后模型相比,本发明开发的综合基因突变特征和mIF图像特征所构建的肺癌预后的多模态预测模型***具有更高的准确性、特异性、敏感性和稳健性,很好地解决了目前临床上对于肺癌预后预测结果不准确或者敏感性不足,无法适用于大部分人群的问题。
以上描述仅为本公开内容的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开内容中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其他技术方案。例如上述特征与本公开内容中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (9)

1.一种综合基因突变特征与多重免疫荧光染色mIF图像特征的肺癌预后多模态预测模型构建方法,其特征在于:所述预测模型构建方法包括以下步骤:
步骤1:获取基因突变特征:***性分析肺癌患者的基因突变谱,将基因突变谱中基因突变的发生与患者预后情况做Cox单因素回归分析,获得一种或多种与肺癌患者的预后不良显著相关的基因突变特征;
步骤2:获取mIF图像特征:
步骤2.1:使用一种或多种肺癌细胞表面抗原的相应抗体对患者的肺癌组织切片进行mIF;
步骤2.2:对染色后的组织切片拍摄详细的图像,使用图像分析软件,利用每个抗原的单抗染色组织图像构建的光谱库对多光谱图像进行解混,拼接每个视野的图像以获得切片的完整视图,使用软件对图像进行分割,生成mask文件,使用软件进行分析,通过聚类分析得到多种不同的单细胞在切片上的分布;
步骤2.3:根据细胞核间最近距离、细胞核间最远距离、细胞核间平均距离以及细胞属性四种维度定义患者的肿瘤免疫微环境特征,获得肿瘤免疫微环境特征与患者预后之间的关系;
步骤2.4:使用Cox单因素回归分析上述步骤2.3中获得的所述肿瘤免疫微环境特征与患者预后之间的关系,获得对于患者预后具有主导地位的mIF图像特征;
步骤3:预测模型的验证:采用步骤1中获得的基因突变特征和步骤2中获得的mIF图像特征进行多模态的Kaplan-Meier曲线拟合,以验证所述预测模型的准确性、特异性、敏感性和稳健性。
2.根据权利要求1所述的预测模型构建方法,其特征在于:所述肺癌为肺癌I-IIIA期。
3. 根据权利要求1所述的预测模型构建方法,其特征在于:在步骤2.1中,使用的肺癌细胞表面抗原选自以下一种或多种:PANCK、CD4、CD8、FOXP3、CD68、CD86、MPO、CD11c、CD11b、CD206、PD-1、CD19、CD3、aSMA、CD31、Collagen I、CD94或PD-L1。
4. 根据权利要求1所述的预测模型构建方法,其特征在于:在步骤2.2中,通过监督的谱系归属方法聚类得到多种不同的单细胞在切片上的分布,所述单细胞选自以下两种或更多种:巨噬细胞&CD8 T、巨噬细胞&T、CD4T:CD4+FOXP3-PDL1-、CD8T:CD8+PDL1-、巨噬细胞:CD68+PDL1-、其他、Treg:CD4+FOXP3+、PD-L1+上皮细胞:PANCK+PDL1+、上皮细胞:PANCK+PDL1-。
5.根据权利要求1所述的预测模型构建方法,其特征在于:在步骤2.3中,所述细胞属性为细胞核面积、长径、短径以及长短径之比4个维度,每一张切片中的细胞间距离参数共有(C2 9+9)3=135个维度,每一张切片共有139个特征维度,对于每一位患者而言,基于mIF切片图像的肿瘤免疫微环境特征维数为139/>10=1390维。
6.根据权利要求1所述的预测模型构建方法,其特征在于:在步骤1中,与肺癌患者的预后不良显著相关的基因突变特征包括以下一种或多种:FLT3、AR、AXIN1、GABRA6、KRAS、BRD4、PTEN、IL7R、PBRM1。
7.根据权利要求1所述的预测模型构建方法,其特征在于:在步骤2.4中,对于患者预后具有主导地位的mIF图像特征包括以下一种或多种:distMin_Macrophage&CD8T_Macrophage&T_4、distMin_CD4T_Macrophage_9、distMin_Macrophage_Macrophage_5、distMin_CD4T_Macrophage_2、distMin_CD4T_Macrophage_3、distMin_Macrophage&CD8T_Macrophage&T_5、distMin_Macrophage_Macrophage_4、distMin_Macrophage_Treg_2、distMin_Macrophage&CD8T_Macrophage&T_3、distMin_CD4T_PD-L1+Epithelial_6。
8.采用权利要求1至7中任一项所述的预测模型构建方法构建的肺癌预后的预测模型***。
9.根据权利要求8所述的预测模型***,其特征在于:在所述预测模型***中,与肺癌患者的预后不良显著相关的基因突变特征包括以下一种或多种:FLT3、AR、AXIN1、GABRA6、KRAS、BRD4、PTEN、IL7R、PBRM1;对于患者预后具有主导地位的mIF图像特征包括以下一种或多种:distMin_Macrophage&CD8T_Macrophage&T_4、distMin_CD4T_Macrophage_9、distMin_Macrophage_Macrophage_5、distMin_CD4T_Macrophage_2、distMin_CD4T_Macrophage_3、distMin_Macrophage&CD8T_Macrophage&T_5、distMin_Macrophage_Macrophage_4、distMin_Macrophage_Treg_2、distMin_Macrophage&CD8T_Macrophage&T_3、distMin_CD4T_PD-L1+Epithelial_6。
CN202311559146.5A 2023-11-22 2023-11-22 一种综合基因突变特征与mIF图像特征的肺癌预后多模态预测模型构建方法 Active CN117275744B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311559146.5A CN117275744B (zh) 2023-11-22 2023-11-22 一种综合基因突变特征与mIF图像特征的肺癌预后多模态预测模型构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311559146.5A CN117275744B (zh) 2023-11-22 2023-11-22 一种综合基因突变特征与mIF图像特征的肺癌预后多模态预测模型构建方法

Publications (2)

Publication Number Publication Date
CN117275744A CN117275744A (zh) 2023-12-22
CN117275744B true CN117275744B (zh) 2024-02-13

Family

ID=89218194

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311559146.5A Active CN117275744B (zh) 2023-11-22 2023-11-22 一种综合基因突变特征与mIF图像特征的肺癌预后多模态预测模型构建方法

Country Status (1)

Country Link
CN (1) CN117275744B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101689220A (zh) * 2007-04-05 2010-03-31 奥利安实验室有限公司 用于治疗、诊断和预测医学病症发生的***和方法
CN105074469A (zh) * 2013-04-01 2015-11-18 免疫医疗公司 用于胰腺癌早期检测和治疗的抗粘蛋白抗体
CN108474723A (zh) * 2015-12-02 2018-08-31 克莱尔莱特诊断有限责任公司 制备和分析肿瘤组织样品用于检测和监测癌症的方法
CN116189880A (zh) * 2023-01-21 2023-05-30 中国医学科学院北京协和医院 一种肺腺癌脑转移的预测指标及预测方法和应用
CN117059166A (zh) * 2023-07-25 2023-11-14 复旦大学附属华山医院 用于评估总生存期和表征肿瘤免疫微环境的基因特征及其研究方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11929171B2 (en) * 2018-10-18 2024-03-12 The Board Of Trustees Of The Leland Stanford Junior University Methods for evaluation and treatment of glycemic dysregulation and atherosclerotic cardiovascular disease and applications thereof
WO2020102043A1 (en) * 2018-11-15 2020-05-22 Ampel Biosolutions, Llc Machine learning disease prediction and treatment prioritization
CA3136976A1 (en) * 2019-04-18 2020-10-22 Shelley Boyd Detection, prediction, and classification for ocular disease

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101689220A (zh) * 2007-04-05 2010-03-31 奥利安实验室有限公司 用于治疗、诊断和预测医学病症发生的***和方法
CN105074469A (zh) * 2013-04-01 2015-11-18 免疫医疗公司 用于胰腺癌早期检测和治疗的抗粘蛋白抗体
CN108474723A (zh) * 2015-12-02 2018-08-31 克莱尔莱特诊断有限责任公司 制备和分析肿瘤组织样品用于检测和监测癌症的方法
CN116189880A (zh) * 2023-01-21 2023-05-30 中国医学科学院北京协和医院 一种肺腺癌脑转移的预测指标及预测方法和应用
CN117059166A (zh) * 2023-07-25 2023-11-14 复旦大学附属华山医院 用于评估总生存期和表征肿瘤免疫微环境的基因特征及其研究方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Functional disruption of macrophage migration inhibitory factor (MIF) suppresses proliferation of human H460 lung cancer cells by caspase-dependent apoptosis;Yubiao Guo;《CANCER CELL INTERNATIONAL》;正文1-9页 *
The expression aad signifighit of mif and fhit in cervical carcinomas;Li, Yan Chuan;《ProQuest ™ Dissertations & Theses Citation Index》;20230531;全文 *
基因突变与转移性肾透明细胞癌患者VEGF靶向治疗预后的关系;刘睿;《精准医学杂志》;第36卷(第3期);第239-242页 *

Also Published As

Publication number Publication date
CN117275744A (zh) 2023-12-22

Similar Documents

Publication Publication Date Title
Kather et al. Topography of cancer-associated immune cells in human solid tumors
Smedley et al. Using deep neural networks and interpretability methods to identify gene expression patterns that predict radiomic features and histology in non-small cell lung cancer
Chen et al. Identification and validation of CYBB, CD86, and C3AR1 as the key genes related to macrophage infiltration of gastric cancer
Chen et al. Histopathological images and multi-omics integration predict molecular characteristics and survival in lung adenocarcinoma
CN113355411B (zh) 一种基于lncRNA标记物的肿瘤免疫分型方法
CN117275744B (zh) 一种综合基因突变特征与mIF图像特征的肺癌预后多模态预测模型构建方法
Wen et al. Deep learning in digital pathology for personalized treatment plans of cancer patients
Solorzano et al. Machine learning for cell classification and neighborhood analysis in glioma tissue
Yuan et al. Self-organizing maps for cellular in silico staining and cell substate classification
CN110942808A (zh) 一种基于基因大数据的预后预测方法及预测***
CN117275578B (zh) 一种肺癌***转移多模态预测模型构建方法
Chen et al. Coexpression network analysis-based identification of critical genes differentiating between latent and active tuberculosis
CN115579064A (zh) 一种宫颈鳞状细胞癌的预后模型构建方法
CN114373548A (zh) 一种基于代谢基因建立的胰腺癌预后风险预测方法和装置
CN116206681A (zh) 一种免疫浸润细胞模型的预后基因对价值评价方法
Santamaria-Pang et al. Robust single cell quantification of immune cell subtypes in histological samples
Hu et al. Learning predictive models of tissue cellular neighborhoods from cell phenotypes with graph pooling
CN116825206B (zh) 探究fh-缺陷型肾癌关键细胞亚群的方法、装置和设备
Paul A feature weighting-assisted approach for cancer subtypes identification from paired expression profiles
Zhao et al. A radiopathomics model for prognosis prediction in patients with gastric cancer
CN115862876B (zh) 基于免疫微环境基因群预测肺腺癌患者预后的装置
Aqeel et al. Computer extracted features of tumor-infiltrating lymphocytes (TILs) architecture are prognostic of progression-free survival in stage III colon cancer
EP4307315A1 (en) Machine learning predictive models of treatment response
EP4287212A1 (en) Machine learning predictive models of treatment response
Patel Santhoshi Navaneetha Krishnan

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant