CN115862876A - 基于免疫微环境基因群预测肺腺癌患者预后和用药指导的装置及计算机可读存储介质 - Google Patents

基于免疫微环境基因群预测肺腺癌患者预后和用药指导的装置及计算机可读存储介质 Download PDF

Info

Publication number
CN115862876A
CN115862876A CN202310186412.8A CN202310186412A CN115862876A CN 115862876 A CN115862876 A CN 115862876A CN 202310186412 A CN202310186412 A CN 202310186412A CN 115862876 A CN115862876 A CN 115862876A
Authority
CN
China
Prior art keywords
lung adenocarcinoma
immune
subtype
patient
genes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310186412.8A
Other languages
English (en)
Other versions
CN115862876B (zh
Inventor
樊小龙
朱明瑾
李玖一
张韵秋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Tongcheng Rongxin Technology Co.,Ltd.
Original Assignee
Beijing Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Normal University filed Critical Beijing Normal University
Priority to CN202310186412.8A priority Critical patent/CN115862876B/zh
Publication of CN115862876A publication Critical patent/CN115862876A/zh
Application granted granted Critical
Publication of CN115862876B publication Critical patent/CN115862876B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了诊断领域中基于免疫微环境基因群预测肺腺癌患者预后和用药指导的装置及计算机可读存储介质。本发明所要解决的技术问题是如何预测肺癌患者的预后或对其进行指导用药。本发明所保护的一个技术方案为预测待测肺腺癌患者预后的装置,所述装置可包括免疫分型模型构建模块、免疫分型模块和预后预测模块,通过基于免疫微环境基因群75个基因对待测患者进行免疫亚型分型,并根据免疫分型亚型预测待测肺腺癌患者的预后或指导待测患者的临床用药。使用本发明所提供的装置可有效预测肺腺癌患者的预后;并可以避免过渡使用化疗,一方面能使患者避免承受化疗带来的严重副作用,另一方面也将减轻患者和社会的经济负担。

Description

基于免疫微环境基因群预测肺腺癌患者预后和用药指导的装 置及计算机可读存储介质
技术领域
本发明涉及诊断领域中基于免疫微环境基因群预测肺腺癌患者预后和用药指导的装置及计算机可读存储介质。
背景技术
肺癌中非小细胞肺癌占到了所有肺癌的80%。50-60%的非小细胞肺癌为肺腺癌,约30%的初诊非小细胞肺癌为早中期(I-IIIB)腺癌。并且由于人口老龄化和空气污染,各亚型肺癌的发病率仍然处于上升阶段,严重危害人群健康。肺腺癌起源于支气管黏膜上皮细胞,少数起源于大支气管的粘液腺,好发于老年人群。
由于二代测序技术的普及,结合对肺腺癌发病机制的深入探索,DNA水平上的基因组变异检测在晚期肺腺癌的诊断治疗中得到广泛应用,目前已建立相对归一化的治疗策略。对于携带EGFR突变、ALK融合、ROS1融合、MET突变、BRAF/RAS/MEK1突变等遗传学变异的肺癌患者可开展靶向治疗,而针对无法应用靶向治疗的晚期肺癌患者,主要开展铂类药物为基础的化疗,但其治疗效果有限,5年生存期仅提升5%,而且副作用大,常导致严重的骨髓抑制,并发中性粒细胞的减少和严重感染。而近年来开展的免疫检查点抑制剂的治疗,虽然为肺癌患者带来了福音,但也存在很大个体差异,仅有<25%的病人能够获益。
肺癌的早期发现、早期诊断将能显著提升患者的生存期。从群体层面看,I期肺癌手术后的5年生存率在58%至73%之间。由于体检、早筛的普及,近年来被诊断的肺癌患者越来越多趋向于早中期肺癌。但是,现有的常规诊断和分子病理检测,尚无法对早中期肺癌开展客观、精准的个体化风险评估,也不能预测其对化疗的应答。现有分子分型研究,尽管发现了基于细胞增殖、细胞外基质及直接与预后相关的基因网络,但均未能有效应用于早中期肺腺癌的个体化风险评估和化疗应答的预测。
发明内容
本发明所要解决的技术问题是如何对肺癌患者进行分型和/或如何对肺癌患者进行指导用药和/或如何预测肺癌患者的预后和/或如何对肺癌患者进行风险评估。
为了解决上述技术问题,本发明首先提供了预测待测肺腺癌患者预后的装置,所述装置可包括如下模块:
M1)免疫分型模型构建模块:用于基于已知肺腺癌样本集的75个基因的表达谱数据、层级聚类和SVM算法获得预测单样本肺腺癌患者免疫亚型的免疫分型模型;
M2)免疫分型模块:用于基于待测肺腺癌患者的所述75个基因的表达谱数据使用所述免疫分型模型预测待测肺腺癌患者的免疫分型亚型;
M3)预后预测模块:用于基于所述免疫分型亚型预测待测肺腺癌患者的预后。
所述75个基因可为如下所示的基因:
ACKR1、AIF1、ALOX5、C1QB、CAPG、CCL5、CD14、CD2、CD247、CD37、CD3D、CD72、CD8A、CFD、CORO1A、CST7、CTSW、CYBA、DENND3、FCER1G、GMFG、GZMA、GZMB、HCK、IL21R、IL2RG、LCK、LDLRAP1、LST1、LTB、MAFB、MZB1、NCF1、NCF4、NKG7、PILRA、PSMB10、PTPN7、PYCARD、RAC2、RRAS、SH3BGRL3、SIGLEC7、SLAMF8、STARD5、THEMIS2、TNFRSF1B、TYROBP、BRIX1、BZW2、CABYR、CKS1B、CTBP2、DARS2、DDX1、ECT2、EEF1E1、EIF3J、EIF5B、HSPD1、HSPE1、MRPL19、MRPS16、MTFR1、MTMR2、NDUFS1、NOL7、NOLC1、NUDT15、SLC7A11、SNRPE、SRPK1、TFB2M、UGDH和YWHAE。
所述免疫亚型分型可包括高免疫亚型(Immune High)和低免疫亚型(ImmuneLow)。所述Immune High亚型可为高免疫活性的免疫分型亚型;所述Immune Low亚型可为低免疫活性的免疫分型亚型。
所述免疫分型亚型为Immune High亚型的待测肺腺癌患者的预后可好于所述免疫分型亚型为Immune Low亚型的待测肺腺癌患者。
所述75个基因具体可为如下所示的基因:ACKR1(GenBank号:2532,update date:2022-12-5)、AIF1(GenBankGenBank号:199,update date:2022-12-4)、ALOX5(GenBankGenBank号:240,update date:2022-12-8)、BRIX1(GenBank号:55299,updatedate:2022-12-4)、BZW2(GenBank号:28969,update date:2022-8-12)、C1QB(GenBank号:713,update date:2022-12-13)、CABYR(GenBank号:26256,update date:2022-8-12)、CAPG(GenBank号:822,update date:2022-12-8)、CCL5(GenBank号:6352,update date:2022-12-13)、CD14(GenBank号:929,update date:2022-12-8)、CD2(GenBank号:914,updatedate:2022-12-8)、CD247(GenBank号:919,update date:2022-12-21)、CD37(GenBank号:951,update date:2022-9-22)、CD3D(GenBank号:915,update date:2022-12-8)、CD72(GenBank号:971,update date:2022-11-13)、CD8A(GenBank号:925,update date:2022-12-14)、CFD(GenBank号:1675,update date:2022-12-8)、CKS1B(GenBank号:1163,updatedate:2022-12-8)、CORO1A(GenBank号:11151,update date:2022-11-6)、CST7(GenBank号:8530,update date:2022-8-5)、CTBP2(GenBank号:1488,update date:2022-12-4)、CTSW(GenBank号:1521,update date:2022-9-18)、CYBA(GenBank号:1535,update date:2022-12-13)、DARS2(GenBank号:55157,update date:2022-11-6)、DDX1(GenBank号:1653,update date:2022-12-8)、DENND3(GenBank号:22898,update date:2022-12-8)、ECT2(GenBank号:1894,update date:2022-12-13)、EEF1E1(GenBank号:9521,update date:2022-12-4)、EIF3J(GenBank号:8669,update date:2022-12-8)、EIF5B(GenBank号:9669,update date:2022-12-8)、FCER1G(GenBank号:2207,update date:2022-9-22)、GMFG(GenBank号:9535,update date:2022-12-8)、GZMA(GenBank号:3001,update date:2022-9-9)、GZMB(GenBank号:3002,update date:2022-12-13)、HCK(GenBank号:3055,updatedate:2022-12-8)、HSPD1(GenBank号:3329,update date:2022-12-8)、HSPE1(GenBank号:3336,update date:2022-12-4)、IL21R(GenBank号:50615,update date:2022-10-9)、IL2RG(GenBank号:3561,update date:2022-11-4)、LCK(GenBank号:3932,update date:2022-12-21)、LDLRAP1(GenBank号:26119,update date:2022-11-5)、LST1(GenBank号:7940,update date:2022-9-22)、LTB(GenBank号:4050,update date:2022-12-9)、MAFB(GenBank号:9935,update date:2022-12-8)、MRPL19(GenBank号:9801,update date:2022-12-8)、MRPS16(GenBank号:51021,update date:2022-12-21)、MTFR1(GenBank号:9650,update date:2022-12-17)、MTMR2(GenBank号:8898,update date:2022-12-8)、MZB1(GenBank号:51237,update date:2022-8-12)、NCF1(GenBank号:653361,update date:2022-12-8)、NCF4(GenBank号:4689,update date:2022-12-8)、NDUFS1(GenBank号:4719,update date:2022-12-8)、NKG7(GenBank号:4818,update date:2022-9-22)、NOL7(GenBank号:51406,update date:2022-12-8)、NOLC1(GenBank号:9221,update date:2022-12-4)、NUDT15(GenBank号:55270,update date:2022-11-27)、PILRA(GenBank号:29992,update date:2022-9-22)、PSMB10(GenBank号:5699,update date:2022-12-8)、PTPN7(GenBank号:5778,update date:2022-12-8)、PYCARD(GenBank号:29108,updatedate:2022-12-8)、RAC2(GenBank号:5880,update date:2022-12-8)、RRAS(GenBank号:6237,update date:2022-12-8)、SH3BGRL3(GenBank号:83442,update date:2022-12-4)、SIGLEC7(GenBank号:27036,update date:2022-8-18)、SLAMF8(GenBank号:56833,updatedate:2022-9-22)、SLC7A11(GenBank号:23657,update date:2022-12-13)、SNRPE(GenBank号:6635,update date:2022-12-8)、SRPK1(GenBank号:6732,update date:2022-12-8)、STARD5(GenBank号:80765,update date:2022-12-8)、TFB2M(GenBank号:64216,updatedate:2022-12-8)、THEMIS2(GenBank号:9473,update date:2022-12-8)、TNFRSF1B(GenBank号:7133,update date:2022-11-6)、TYROBP(GenBank号:7305,update date:2022-10-9)、UGDH(GenBank号:7358,update date:2022-12-4)和YWHAE(GenBank号:7531,update date:2022-12-8)。
M1)所述免疫分型模型构建模块可通过包括如下步骤的方法建立:
M1-1)基于已知肺腺癌样本集的75个基因的表达谱数据进行层级聚类获得所述已知肺腺癌样本的免疫分型结果;
M1-2)基于已知肺腺癌样本集的75个基因的表达谱数据和所述免疫分型结果,使用SVM算法获得预测单样本肺腺癌患者免疫亚型的免疫分型模型。
所述SVM算法可来源于python语言中机器学习包sklearn包。所述已知肺腺癌样本集中的样本数量可大于100个。
上述装置中,所述肺腺癌患者可为早中期肺腺癌患者。
所述预后可为总生存率,如5年以上的总生存率。
上述装置中,所述肺腺癌患者可为肺腺癌吸烟患者。
所述肺腺癌吸烟患者可为I期、II期或者III期A肺腺癌患者。
为了解决上述技术问题,本发明还提供了预测待测肺腺癌患者指导用药的装置,所述装置可包括如下模块:
N1)免疫分型模型构建模块:用于基于已知肺腺癌样本集的75个基因的表达谱数据、层级聚类和SVM算法获得预测单样本肺腺癌患者免疫亚型的免疫分型模型;
N2)免疫分型模块:用于基于待测肺腺癌患者的75个基因的表达谱数据使用所述免疫分型模型预测待测肺腺癌患者的免疫分型亚型;
N3)指导用药输出模块:用于基于所述免疫分型亚型确定待测肺腺癌患者是否受益于顺铂联合长春瑞宾进行化疗。
上述装置中,所述免疫分型亚型可包括Immune High亚型和Immune Low亚型。所述Immune High亚型可为高免疫活性的免疫分型亚型;所述Immune Low亚型可为低免疫活性的免疫分型亚型。
N3)中所述免疫分型亚型为Immune Low亚型的待测肺腺癌患者的指导用药可为受益于使用顺铂联合长春瑞宾进行化疗。所述免疫分型亚型为Immune High亚型的待测肺腺癌患者的指导用药可为不受益于顺铂联合长春瑞宾进行化疗。
所述75个基因可为如下所示的基因:
ACKR1、AIF1、ALOX5、C1QB、CAPG、CCL5、CD14、CD2、CD247、CD37、CD3D、CD72、CD8A、CFD、CORO1A、CST7、CTSW、CYBA、DENND3、FCER1G、GMFG、GZMA、GZMB、HCK、IL21R、IL2RG、LCK、LDLRAP1、LST1、LTB、MAFB、MZB1、NCF1、NCF4、NKG7、PILRA、PSMB10、PTPN7、PYCARD、RAC2、RRAS、SH3BGRL3、SIGLEC7、SLAMF8、STARD5、THEMIS2、TNFRSF1B、TYROBP、BRIX1、BZW2、CABYR、CKS1B、CTBP2、DARS2、DDX1、ECT2、EEF1E1、EIF3J、EIF5B、HSPD1、HSPE1、MRPL19、MRPS16、MTFR1、MTMR2、NDUFS1、NOL7、NOLC1、NUDT15、SLC7A11、SNRPE、SRPK1、TFB2M、UGDH和YWHAE。
所述75个基因具体可为如下所示的基因:
ACKR1(GenBank号:2532,update date:2022-12-5)、AIF1(GenBank号:199,updatedate:2022-12-4)、ALOX5(GenBank号:240,update date:2022-12-8)、BRIX1(GenBank号:55299,update date:2022-12-4)、BZW2(GenBank号:28969,update date:2022-8-12)、C1QB(GenBank号:713,update date:2022-12-13)、CABYR(GenBank号:26256,update date:2022-8-12)、CAPG(GenBank号:822,update date:2022-12-8)、CCL5(GenBank号:6352,update date:2022-12-13)、CD14(GenBank号:929,update date:2022-12-8)、CD2(GenBank号:914,update date:2022-12-8)、CD247(GenBank号:919,update date:2022-12-21)、CD37(GenBank号:951,update date:2022-9-22)、CD3D(GenBank号:915,update date:2022-12-8)、CD72(GenBank号:971,update date:2022-11-13)、CD8A(GenBank号:925,update date:2022-12-14)、CFD(GenBank号:1675,update date:2022-12-8)、CKS1B(GenBank号:1163,update date:2022-12-8)、CORO1A(GenBank号:11151,update date:2022-11-6)、CST7(GenBank号:8530,update date:2022-8-5)、CTBP2(GenBank号:1488,update date:2022-12-4)、CTSW(GenBank号:1521,update date:2022-9-18)、CYBA(GenBank号:1535,update date:2022-12-13)、DARS2(GenBank号:55157,update date:2022-11-6)、DDX1(GenBank号:1653,update date:2022-12-8)、DENND3(GenBank号:22898,update date:2022-12-8)、ECT2(GenBank号:1894,update date:2022-12-13)、EEF1E1(GenBank号:9521,update date:2022-12-4)、EIF3J(GenBank号:8669,update date:2022-12-8)、EIF5B(GenBank号:9669,update date:2022-12-8)、FCER1G(GenBank号:2207,update date:2022-9-22)、GMFG(GenBank号:9535,update date:2022-12-8)、GZMA(GenBank号:3001,update date:2022-9-9)、GZMB(GenBank号:3002,update date:2022-12-13)、HCK(GenBank号:3055,update date:2022-12-8)、HSPD1(GenBank号:3329,updatedate:2022-12-8)、HSPE1(GenBank号:3336,update date:2022-12-4)、IL21R(GenBank号:50615,update date:2022-10-9)、IL2RG(GenBank号:3561,update date:2022-11-4)、LCK(GenBank号:3932,update date:2022-12-21)、LDLRAP1(GenBank号:26119,update date:2022-11-5)、LST1(GenBank号:7940,update date:2022-9-22)、LTB(GenBank号:4050,update date:2022-12-9)、MAFB(GenBank号:9935,update date:2022-12-8)、MRPL19(GenBank号:9801,update date:2022-12-8)、MRPS16(GenBank号:51021,update date:2022-12-21)、MTFR1(GenBank号:9650,update date:2022-12-17)、MTMR2(GenBank号:8898,update date:2022-12-8)、MZB1(GenBank号:51237,update date:2022-8-12)、NCF1(GenBank号:653361,update date:2022-12-8)、NCF4(GenBank号:4689,update date:2022-12-8)、NDUFS1(GenBank号:4719,update date:2022-12-8)、NKG7(GenBank号:4818,update date:2022-9-22)、NOL7(GenBank号:51406,update date:2022-12-8)、NOLC1(GenBank号:9221,update date:2022-12-4)、NUDT15(GenBank号:55270,update date:2022-11-27)、PILRA(GenBank号:29992,update date:2022-9-22)、PSMB10(GenBank号:5699,update date:2022-12-8)、PTPN7(GenBank号:5778,update date:2022-12-8)、PYCARD(GenBank号:29108,update date:2022-12-8)、RAC2(GenBank号:5880,updatedate:2022-12-8)、RRAS(GenBank号:6237,update date:2022-12-8)、SH3BGRL3(GenBank号:83442,update date:2022-12-4)、SIGLEC7(GenBank号:27036,update date:2022-8-18)、SLAMF8(GenBank号:56833,update date:2022-9-22)、SLC7A11(GenBank号:23657,update date:2022-12-13)、SNRPE(GenBank号:6635,update date:2022-12-8)、SRPK1(GenBank号:6732,update date:2022-12-8)、STARD5(GenBank号:80765,update date:2022-12-8)、TFB2M(GenBank号:64216,update date:2022-12-8)、THEMIS2(GenBank号:9473,update date:2022-12-8)、TNFRSF1B(GenBank号:7133,update date:2022-11-6)、TYROBP(GenBank号:7305,update date:2022-10-9)、UGDH(GenBank号:7358,update date:2022-12-4)和YWHAE(GenBank号:7531,update date:2022-12-8)。
N1)所述免疫分型模型构建模块可通过包括如下步骤的方法建立:
N1-1)基于已知肺腺癌样本集的75个基因的表达谱数据进行层级聚类获得所述已知肺腺癌样本的免疫分型结果;
N1-2)基于已知肺腺癌样本集的75个基因的表达谱数据和所述免疫分型结果,使用SVM算法获得预测单样本肺腺癌患者免疫亚型的免疫分型模型。
所述SVM算法可来源于python语言中机器学习包sklearn包。所述已知肺腺癌样本集中的样本数量可大于100个。
为了解决上述技术问题,本发明还提供了预测待测肺腺癌患者预后的计算机可读存储介质,所述计算机可读存储介质可使计算机运行如下步骤:
C1)基于已知肺腺癌样本集的75个基因的表达谱数据、层级聚类和SVM算法获得预测单样本肺腺癌患者免疫亚型的免疫分型模型;
C2)基于待测肺腺癌患者的75个基因的表达谱数据使用所述免疫分型模型预测待测肺腺癌患者的免疫分型亚型;
C3)基于所述免疫分型亚型预测待测肺腺癌患者的预后。
所述75个基因可为如下所示的基因:
ACKR1、AIF1、ALOX5、C1QB、CAPG、CCL5、CD14、CD2、CD247、CD37、CD3D、CD72、CD8A、CFD、CORO1A、CST7、CTSW、CYBA、DENND3、FCER1G、GMFG、GZMA、GZMB、HCK、IL21R、IL2RG、LCK、LDLRAP1、LST1、LTB、MAFB、MZB1、NCF1、NCF4、NKG7、PILRA、PSMB10、PTPN7、PYCARD、RAC2、RRAS、SH3BGRL3、SIGLEC7、SLAMF8、STARD5、THEMIS2、TNFRSF1B、TYROBP、BRIX1、BZW2、CABYR、CKS1B、CTBP2、DARS2、DDX1、ECT2、EEF1E1、EIF3J、EIF5B、HSPD1、HSPE1、MRPL19、MRPS16、MTFR1、MTMR2、NDUFS1、NOL7、NOLC1、NUDT15、SLC7A11、SNRPE、SRPK1、TFB2M、UGDH和YWHAE。
所述免疫分型可包括Immune High亚型和Immune Low亚型。所述Immune High亚型可为高免疫活性的免疫分型亚型;所述Immune Low亚型可为低免疫活性的免疫分型亚型。
所述免疫分型亚型为Immune High亚型的待测肺腺癌患者的预后可好于所述免疫分型亚型为Immune Low亚型的待测肺腺癌患者。
上述计算机可读存储介质中,所述肺腺癌患者可为早中期肺腺癌患者。所述预后可为5年以上的总生存率。
所述肺腺癌患者可为肺腺癌吸烟患者。所述肺腺癌吸烟患者可为I期、II期或者III期A肺腺癌患者。
C1)所述免疫分型模型构建可通过包括如下步骤的方法建立:
C1-1)基于已知肺腺癌样本集的75个基因的表达谱数据进行层级聚类获得所述已知肺腺癌样本的免疫分型结果;
C1-2)基于已知肺腺癌样本集的75个基因的表达谱数据和所述免疫分型结果,使用SVM算法获得预测单样本肺腺癌患者免疫亚型的免疫分型模型。
所述免疫分型可包括Immune High亚型和Immune Low亚型。所述Immune High亚型可为高免疫活性的免疫分型亚型;所述Immune Low亚型可为低免疫活性的免疫分型亚型。
所述免疫分型亚型为Immune High亚型的待测肺腺癌患者的预后可好于所述免疫分型亚型为Immune Low亚型的待测肺腺癌患者。
为了解决上述技术问题,本发明还提供了预测待测肺腺癌患者指导用药的计算机可读存储介质,所述计算机可读存储介质使计算机运行如下步骤:
D1)免疫分型模型构建模块:用于基于已知肺腺癌样本集的75个基因的表达谱数据、层级聚类和SVM算法获得预测单样本肺腺癌患者免疫亚型的免疫分型模型;
D2)免疫分型模块:用于基于待测肺腺癌患者的75个基因的表达谱数据使用所述免疫分型模型预测待测肺腺癌患者的免疫分型亚型;
D3)指导用药输出模块:用于基于所述免疫分型亚型确定待测肺腺癌患者是否受益于顺铂联合长春瑞宾进行化疗。
所述75个基因可为如下所示的基因:
ACKR1、AIF1、ALOX5、C1QB、CAPG、CCL5、CD14、CD2、CD247、CD37、CD3D、CD72、CD8A、CFD、CORO1A、CST7、CTSW、CYBA、DENND3、FCER1G、GMFG、GZMA、GZMB、HCK、IL21R、IL2RG、LCK、LDLRAP1、LST1、LTB、MAFB、MZB1、NCF1、NCF4、NKG7、PILRA、PSMB10、PTPN7、PYCARD、RAC2、RRAS、SH3BGRL3、SIGLEC7、SLAMF8、STARD5、THEMIS2、TNFRSF1B、TYROBP、BRIX1、BZW2、CABYR、CKS1B、CTBP2、DARS2、DDX1、ECT2、EEF1E1、EIF3J、EIF5B、HSPD1、HSPE1、MRPL19、MRPS16、MTFR1、MTMR2、NDUFS1、NOL7、NOLC1、NUDT15、SLC7A11、SNRPE、SRPK1、TFB2M、UGDH和YWHAE。
上述计算机可读存储介质中,所述免疫分型可包括Immune High亚型和ImmuneLow亚型。所述Immune High亚型可为高免疫活性的免疫分型亚型;所述Immune Low亚型可为低免疫活性的免疫分型亚型。
D3)中,所述免疫分型亚型为Immune Low亚型的待测肺腺癌患者的指导用药可为受益于使用顺铂联合长春瑞宾进行化疗;所述免疫分型亚型为Immune High亚型的待测肺腺癌患者的指导用药可为不受益于顺铂联合长春瑞宾进行化疗。
上文所述75个基因具体可为如下所示的基因:
ACKR1(GenBank号:2532,update date:2022-12-5)、AIF1(GenBank号:199,updatedate:2022-12-4)、ALOX5(GenBank号:240,update date:2022-12-8)、BRIX1(GenBank号:55299,update date:2022-12-4)、BZW2(GenBank号:28969,update date:2022-8-12)、C1QB(GenBank号:713,update date:2022-12-13)、CABYR(GenBank号:26256,update date:2022-8-12)、CAPG(GenBank号:822,update date:2022-12-8)、CCL5(GenBank号:6352,update date:2022-12-13)、CD14(GenBank号:929,update date:2022-12-8)、CD2(GenBank号:914,update date:2022-12-8)、CD247(GenBank号:919,update date:2022-12-21)、CD37(GenBank号:951,update date:2022-9-22)、CD3D(GenBank号:915,update date:2022-12-8)、CD72(GenBank号:971,update date:2022-11-13)、CD8A(GenBank号:925,update date:2022-12-14)、CFD(GenBank号:1675,update date:2022-12-8)、CKS1B(GenBank号:1163,update date:2022-12-8)、CORO1A(GenBank号:11151,update date:2022-11-6)、CST7(GenBank号:8530,update date:2022-8-5)、CTBP2(GenBank号:1488,update date:2022-12-4)、CTSW(GenBank号:1521,update date:2022-9-18)、CYBA(GenBank号:1535,update date:2022-12-13)、DARS2(GenBank号:55157,update date:2022-11-6)、DDX1(GenBank号:1653,update date:2022-12-8)、DENND3(GenBank号:22898,update date:2022-12-8)、ECT2(GenBank号:1894,update date:2022-12-13)、EEF1E1(GenBank号:9521,update date:2022-12-4)、EIF3J(GenBank号:8669,update date:2022-12-8)、EIF5B(GenBank号:9669,update date:2022-12-8)、FCER1G(GenBank号:2207,update date:2022-9-22)、GMFG(GenBank号:9535,update date:2022-12-8)、GZMA(GenBank号:3001,update date:2022-9-9)、GZMB(GenBank号:3002,update date:2022-12-13)、HCK(GenBank号:3055,update date:2022-12-8)、HSPD1(GenBank号:3329,updatedate:2022-12-8)、HSPE1(GenBank号:3336,update date:2022-12-4)、IL21R(GenBank号:50615,update date:2022-10-9)、IL2RG(GenBank号:3561,update date:2022-11-4)、LCK(GenBank号:3932,update date:2022-12-21)、LDLRAP1(GenBank号:26119,update date:2022-11-5)、LST1(GenBank号:7940,update date:2022-9-22)、LTB(GenBank号:4050,update date:2022-12-9)、MAFB(GenBank号:9935,update date:2022-12-8)、MRPL19(GenBank号:9801,update date:2022-12-8)、MRPS16(GenBank号:51021,update date:2022-12-21)、MTFR1(GenBank号:9650,update date:2022-12-17)、MTMR2(GenBank号:8898,update date:2022-12-8)、MZB1(GenBank号:51237,update date:2022-8-12)、NCF1(GenBank号:653361,update date:2022-12-8)、NCF4(GenBank号:4689,update date:2022-12-8)、NDUFS1(GenBank号:4719,update date:2022-12-8)、NKG7(GenBank号:4818,update date:2022-9-22)、NOL7(GenBank号:51406,update date:2022-12-8)、NOLC1(GenBank号:9221,update date:2022-12-4)、NUDT15(GenBank号:55270,update date:2022-11-27)、PILRA(GenBank号:29992,update date:2022-9-22)、PSMB10(GenBank号:5699,update date:2022-12-8)、PTPN7(GenBank号:5778,update date:2022-12-8)、PYCARD(GenBank号:29108,update date:2022-12-8)、RAC2(GenBank号:5880,updatedate:2022-12-8)、RRAS(GenBank号:6237,update date:2022-12-8)、SH3BGRL3(GenBank号:83442,update date:2022-12-4)、SIGLEC7(GenBank号:27036,update date:2022-8-18)、SLAMF8(GenBank号:56833,update date:2022-9-22)、SLC7A11(GenBank号:23657,update date:2022-12-13)、SNRPE(GenBank号:6635,update date:2022-12-8)、SRPK1(GenBank号:6732,update date:2022-12-8)、STARD5(GenBank号:80765,update date:2022-12-8)、TFB2M(GenBank号:64216,update date:2022-12-8)、THEMIS2(GenBank号:9473,update date:2022-12-8)、TNFRSF1B(GenBank号:7133,update date:2022-11-6)、TYROBP(GenBank号:7305,update date:2022-10-9)、UGDH(GenBank号:7358,update date:2022-12-4)和YWHAE(GenBank号:7531,update date:2022-12-8)。
D1)所述免疫分型模型构建可通过包括如下步骤的方法建立:
D1-1)基于已知肺腺癌样本集的75个基因的表达谱数据进行层级聚类获得所述已知肺腺癌样本的免疫分型结果;
D1-2)基于已知肺腺癌样本集的75个基因的表达谱数据和所述免疫分型结果,使用SVM算法获得预测单样本肺腺癌患者免疫亚型的免疫分型模型。
检测人基因组75个基因的表达谱的物质或装置在制备预测待测肺腺癌患者预后和/或指导用药的产品中的应用也属于本发明的保护范围。
所述75个基因可为如下所示的基因:
ACKR1、AIF1、ALOX5、C1QB、CAPG、CCL5、CD14、CD2、CD247、CD37、CD3D、CD72、CD8A、CFD、CORO1A、CST7、CTSW、CYBA、DENND3、FCER1G、GMFG、GZMA、GZMB、HCK、IL21R、IL2RG、LCK、LDLRAP1、LST1、LTB、MAFB、MZB1、NCF1、NCF4、NKG7、PILRA、PSMB10、PTPN7、PYCARD、RAC2、RRAS、SH3BGRL3、SIGLEC7、SLAMF8、STARD5、THEMIS2、TNFRSF1B、TYROBP、BRIX1、BZW2、CABYR、CKS1B、CTBP2、DARS2、DDX1、ECT2、EEF1E1、EIF3J、EIF5B、HSPD1、HSPE1、MRPL19、MRPS16、MTFR1、MTMR2、NDUFS1、NOL7、NOLC1、NUDT15、SLC7A11、SNRPE、SRPK1、TFB2M、UGDH和YWHAE。
所述75个基因具体可为如下所示的基因:
ACKR1(GenBank号:2532,update date:2022-12-5)、AIF1(GenBank号:199,updatedate:2022-12-4)、ALOX5(GenBank号:240,update date:2022-12-8)、BRIX1(GenBank号:55299,update date:2022-12-4)、BZW2(GenBank号:28969,update date:2022-8-12)、C1QB(GenBank号:713,update date:2022-12-13)、CABYR(GenBank号:26256,update date:2022-8-12)、CAPG(GenBank号:822,update date:2022-12-8)、CCL5(GenBank号:6352,update date:2022-12-13)、CD14(GenBank号:929,update date:2022-12-8)、CD2(GenBank号:914,update date:2022-12-8)、CD247(GenBank号:919,update date:2022-12-21)、CD37(GenBank号:951,update date:2022-9-22)、CD3D(GenBank号:915,update date:2022-12-8)、CD72(GenBank号:971,update date:2022-11-13)、CD8A(GenBank号:925,update date:2022-12-14)、CFD(GenBank号:1675,update date:2022-12-8)、CKS1B(GenBank号:1163,update date:2022-12-8)、CORO1A(GenBank号:11151,update date:2022-11-6)、CST7(GenBank号:8530,update date:2022-8-5)、CTBP2(GenBank号:1488,update date:2022-12-4)、CTSW(GenBank号:1521,update date:2022-9-18)、CYBA(GenBank号:1535,update date:2022-12-13)、DARS2(GenBank号:55157,update date:2022-11-6)、DDX1(GenBank号:1653,update date:2022-12-8)、DENND3(GenBank号:22898,update date:2022-12-8)、ECT2(GenBank号:1894,update date:2022-12-13)、EEF1E1(GenBank号:9521,update date:2022-12-4)、EIF3J(GenBank号:8669,update date:2022-12-8)、EIF5B(GenBank号:9669,update date:2022-12-8)、FCER1G(GenBank号:2207,update date:2022-9-22)、GMFG(GenBank号:9535,update date:2022-12-8)、GZMA(GenBank号:3001,update date:2022-9-9)、GZMB(GenBank号:3002,update date:2022-12-13)、HCK(GenBank号:3055,update date:2022-12-8)、HSPD1(GenBank号:3329,updatedate:2022-12-8)、HSPE1(GenBank号:3336,update date:2022-12-4)、IL21R(GenBank号:50615,update date:2022-10-9)、IL2RG(GenBank号:3561,update date:2022-11-4)、LCK(GenBank号:3932,update date:2022-12-21)、LDLRAP1(GenBank号:26119,update date:2022-11-5)、LST1(GenBank号:7940,update date:2022-9-22)、LTB(GenBank号:4050,update date:2022-12-9)、MAFB(GenBank号:9935,update date:2022-12-8)、MRPL19(GenBank号:9801,update date:2022-12-8)、MRPS16(GenBank号:51021,update date:2022-12-21)、MTFR1(GenBank号:9650,update date:2022-12-17)、MTMR2(GenBank号:8898,update date:2022-12-8)、MZB1(GenBank号:51237,update date:2022-8-12)、NCF1(GenBank号:653361,update date:2022-12-8)、NCF4(GenBank号:4689,update date:2022-12-8)、NDUFS1(GenBank号:4719,update date:2022-12-8)、NKG7(GenBank号:4818,update date:2022-9-22)、NOL7(GenBank号:51406,update date:2022-12-8)、NOLC1(GenBank号:9221,update date:2022-12-4)、NUDT15(GenBank号:55270,update date:2022-11-27)、PILRA(GenBank号:29992,update date:2022-9-22)、PSMB10(GenBank号:5699,update date:2022-12-8)、PTPN7(GenBank号:5778,update date:2022-12-8)、PYCARD(GenBank号:29108,update date:2022-12-8)、RAC2(GenBank号:5880,updatedate:2022-12-8)、RRAS(GenBank号:6237,update date:2022-12-8)、SH3BGRL3(GenBank号:83442,update date:2022-12-4)、SIGLEC7(GenBank号:27036,update date:2022-8-18)、SLAMF8(GenBank号:56833,update date:2022-9-22)、SLC7A11(GenBank号:23657,update date:2022-12-13)、SNRPE(GenBank号:6635,update date:2022-12-8)、SRPK1(GenBank号:6732,update date:2022-12-8)、STARD5(GenBank号:80765,update date:2022-12-8)、TFB2M(GenBank号:64216,update date:2022-12-8)、THEMIS2(GenBank号:9473,update date:2022-12-8)、TNFRSF1B(GenBank号:7133,update date:2022-11-6)、TYROBP(GenBank号:7305,update date:2022-10-9)、UGDH(GenBank号:7358,update date:2022-12-4)和YWHAE(GenBank号:7531,update date:2022-12-8)。
上文所述应用中,所述肺腺癌患者可为早中期肺腺癌患者。所述预后可为5年以上的总生存率。
所述肺腺癌患者可为肺腺癌吸烟患者。所述肺腺癌吸烟患者可为I期、II期或者III期A肺腺癌患者。
上文所述的装置或上文所述的计算机可读存储介质在开发和/或制备预防和/或治疗肺腺癌的产品中的应用也属于本发明的保护范围。
吸烟等环境因素是驱动肺癌起源的核心因素,为更好地提升具有吸烟史的早中期肺腺癌患者的精准治疗水平,对早中期肺腺癌患者进行有效的风险评估以及治疗应答预测,本发明提供了基于早中期肺腺癌患者免疫微环境基因群75个基因的表达谱建立的SVM单样本亚型预测模型对早中期肺腺癌患者进行免疫亚型分子分型可以预测患者的预后:所述免疫分型亚型为Immune High亚型的待测肺腺癌患者的预后可好于所述免疫分型亚型为Immune Low亚型的待测肺腺癌患者;同时基于免疫微环境基因群75个基因和SVM单样本亚型预测模型可指导患者的临床用药:所述免疫分型亚型为Immune Low亚型的待测肺腺癌患者的指导用药可为受益于使用顺铂联合长春瑞宾进行化疗;所述免疫分型亚型为ImmuneHigh亚型的待测肺腺癌患者的指导用药可为不受益于顺铂联合长春瑞宾进行化疗。使用本发明所提供的免疫微环境基因群75个基因及建立的SVM单样本亚型预测模型可以避免在肺腺癌患者中过渡使用化疗,一方面能使患者避免承受化疗带来的严重副作用,另一方面也将减轻患者和社会的经济负担。
附图说明
图1为TCGA数据集中SVM单样本亚型预测模型分型结果受试者工作特征曲线(receiver operating characteristic curve,简称ROC)图。纵坐标为真阳性率,横坐标为假阳性率。
图2为GSE81089数据集中SVM单样本亚型预测模型分型结果ROC图。纵坐标为真阳性率,横坐标为假阳性率。
图3为GSE68465数据集中SVM单样本亚型预测模型分型结果ROC图。纵坐标为真阳性率,横坐标为假阳性率。
图4为GSE14814数据集中SVM单样本亚型预测模型分型结果ROC图。纵坐标为真阳性率,横坐标为假阳性率。
图5为TCGA早中期肺腺癌(TCGA-LUAD)吸烟患者Immune High和Immune Low分子亚型的总体生存曲线。纵坐标为生存率,横坐标为总生存时间(年)。
图6为TCGA II期及IIIA期肺腺癌吸烟患者Immune High和Immune Low分子亚型的总体生存曲线。纵坐标为生存率,横坐标为总生存时间(年)。
图7为GSE81089中早中期肺腺癌吸烟患者Immune High 和Immune Low 分子亚型的总体生存曲线。纵坐标为生存率,横坐标为总生存时间(年)。
图8为GSE68465早中期肺腺癌吸烟患者中Immune High 和Immune Low 分子亚型的总体生存曲线。纵坐标为生存率,横坐标为总生存时间(年)。
图9为GSE68465 II期及IIIA期肺腺癌吸烟患者Immune High和Immune Low分子亚型的总体生存曲线。纵坐标为生存率,横坐标为总生存时间(年)。
图10为GSE14814肺腺癌患者Immune High和Immune Low分子亚型的总体生存曲线。纵坐标为生存率,横坐标为总生存时间(年)。
图11为GSE14814数据集中Immune High 和 Immune Low 亚型特异的化疗应答分析。t代表时间:治疗后1年或2-5年,作为生存率分析的landmark。A:化疗组(ACT)与 观察组(OBS)生存曲线;B:Immune High组化疗(ACT)病人与不进行化疗(OBS)病人的生存曲线。C:Immune Low组化疗(ACT)病人与不进行化疗(OBS)病人的生存曲线。
图12为利用不同数据集建立的单样本亚型预测模型—SVM预测模型及其准确度的验证。A为利用TCGA训练集建立的单样本亚型预测模型—SVM在TCGA数据集中验证的准确度;B为利用TCGA数据集建立的单样本亚型预测模型-SVM在GSE81089数据集中的准确度;C为利用GSE68465数据集建立的单样本亚型预测模型-SVM在GSE68465数据集中验证的准确度;D为利用GSE68465数据集建立的单样本亚型预测模型—SVM在GSE14814数据集中验证的准确度。
具体实施方式
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南,并不以任何方式构成对本发明的限制。
下述实施例中的实验方法,如无特殊说明,均为常规方法,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
实施例 1、早中期肺腺癌的分子诊断标志物的筛选及分子分型。
1.早中期肺腺癌分子诊断标志物的筛选。
本发明在前期人类胶质瘤转录组大数据研究中发现了250个与免疫相关的基因,利用TCGA公共数据库提供的人类肺腺癌RNA-seq平台表达量数据集(TCGA-LUAD)(portal.gdc.cancer.gov)以及GEO公共数据库数据集GSE14814(www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE14814),通过层级聚类差异表达分析,将这两个数据库中的早中期肺腺癌样本按照250个与免疫相关基因的表达谱自动分为高表达250基因的ImmuneHigh组(高免疫亚型组)和低表达250基因的Immune Low组(低免疫亚型组)。
在GSE14814数据集中进行Immune High和Immune Low两组样本数据的比较,在上述250基因中筛选出87个在两组样本中存在差异表达基因;同时筛选出48个于Immune Low组样本相比较于Immune high组样本高表达的基因。此阶段选出的肺腺癌免疫亚型分组(Immune High和Immune Low组)相关的基因共135个。利用135个基因对TCGA-LUAD 及GSE14814数据集重新分组,在分组后的样本中进行t检验,删除60个在Immune High组和Immune Low组之间表达差异较小的基因,得到如下75个基因用作为肺腺癌免疫亚型分类器基因。在此75个分类器基因中,48个基因仅在Immune High组中高表达,而另外的27个基因则仅在Immune Low组中高表达。
75个分类器基因的名称及对应的NCBI上的GenBank号信息如下:
ACKR1(GenBank号:2532,update date:2022-12-5)、AIF1(GenBank号:199,updatedate:2022-12-4)、ALOX5(GenBank号:240,update date:2022-12-8)、BRIX1(GenBank号:55299,update date:2022-12-4)、BZW2(GenBank号:28969,update date:2022-8-12)、C1QB(GenBank号:713,update date:2022-12-13)、CABYR(GenBank号:26256,update date:2022-8-12)、CAPG(GenBank号:822,update date:2022-12-8)、CCL5(GenBank号:6352,update date:2022-12-13)、CD14(GenBank号:929,update date:2022-12-8)、CD2(GenBank号:914,update date:2022-12-8)、CD247(GenBank号:919,update date:2022-12-21)、CD37(GenBank号:951,update date:2022-9-22)、CD3D(GenBank号:915,update date:2022-12-8)、CD72(GenBank号:971,update date:2022-11-13)、CD8A(GenBank号:925,update date:2022-12-14)、CFD(GenBank号:1675,update date:2022-12-8)、CKS1B(GenBank号:1163,update date:2022-12-8)、CORO1A(GenBank号:11151,update date:2022-11-6)、CST7(GenBank号:8530,update date:2022-8-5)、CTBP2(GenBank号:1488,update date:2022-12-4)、CTSW(GenBank号:1521,update date:2022-9-18)、CYBA(GenBank号:1535,update date:2022-12-13)、DARS2(GenBank号:55157,update date:2022-11-6)、DDX1(GenBank号:1653,update date:2022-12-8)、DENND3(GenBank号:22898,update date:2022-12-8)、ECT2(GenBank号:1894,update date:2022-12-13)、EEF1E1(GenBank号:9521,update date:2022-12-4)、EIF3J(GenBank号:8669,update date:2022-12-8)、EIF5B(GenBank号:9669,update date:2022-12-8)、FCER1G(GenBank号:2207,update date:2022-9-22)、GMFG(GenBank号:9535,update date:2022-12-8)、GZMA(GenBank号:3001,update date:2022-9-9)、GZMB(GenBank号:3002,update date:2022-12-13)、HCK(GenBank号:3055,update date:2022-12-8)、HSPD1(GenBank号:3329,updatedate:2022-12-8)、HSPE1(GenBank号:3336,update date:2022-12-4)、IL21R(GenBank号:50615,update date:2022-10-9)、IL2RG(GenBank号:3561,update date:2022-11-4)、LCK(GenBank号:3932,update date:2022-12-21)、LDLRAP1(GenBank号:26119,update date:2022-11-5)、LST1(GenBank号:7940,update date:2022-9-22)、LTB(GenBank号:4050,update date:2022-12-9)、MAFB(GenBank号:9935,update date:2022-12-8)、MRPL19(GenBank号:9801,update date:2022-12-8)、MRPS16(GenBank号:51021,update date:2022-12-21)、MTFR1(GenBank号:9650,update date:2022-12-17)、MTMR2(GenBank号:8898,update date:2022-12-8)、MZB1(GenBank号:51237,update date:2022-8-12)、NCF1(GenBank号:653361,update date:2022-12-8)、NCF4(GenBank号:4689,update date:2022-12-8)、NDUFS1(GenBank号:4719,update date:2022-12-8)、NKG7(GenBank号:4818,update date:2022-9-22)、NOL7(GenBank号:51406,update date:2022-12-8)、NOLC1(GenBank号:9221,update date:2022-12-4)、NUDT15(GenBank号:55270,update date:2022-11-27)、PILRA(GenBank号:29992,update date:2022-9-22)、PSMB10(GenBank号:5699,update date:2022-12-8)、PTPN7(GenBank号:5778,update date:2022-12-8)、PYCARD(GenBank号:29108,update date:2022-12-8)、RAC2(GenBank号:5880,updatedate:2022-12-8)、RRAS(GenBank号:6237,update date:2022-12-8)、SH3BGRL3(GenBank号:83442,update date:2022-12-4)、SIGLEC7(GenBank号:27036,update date:2022-8-18)、SLAMF8(GenBank号:56833,update date:2022-9-22)、SLC7A11(GenBank号:23657,update date:2022-12-13)、SNRPE(GenBank号:6635,update date:2022-12-8)、SRPK1(GenBank号:6732,update date:2022-12-8)、STARD5(GenBank号:80765,update date:2022-12-8)、TFB2M(GenBank号:64216,update date:2022-12-8)、THEMIS2(GenBank号:9473,update date:2022-12-8)、TNFRSF1B(GenBank号:7133,update date:2022-11-6)、TYROBP(GenBank号:7305,update date:2022-10-9)、UGDH(GenBank号:7358,update date:2022-12-4)和YWHAE(GenBank号:7531,update date:2022-12-8)。
2.使用75个分类器基因构建并验证早中期肺腺癌样本分子分型的模型。
2.1数据来源。
下载RNA-Seq平台的TCGA-LUAD数据集(portal.gdc.cancer.gov)和GSE81089数据集(www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE81089)以及来自Affymetrix芯片平台U133A的GSE68465数据集(www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE68465)和GSE14814数据集(www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE14814)进行早中期肺腺癌单样本免疫亚型预测模型的建立和预测。
2.2 模型建立和模型验证。
利用TCGA-LUAD数据集的469例I-III期的早中期肺腺癌样本中75个分类器基因的表达量数据,首先使用层级聚类的方式使用75个免疫亚型分类器基因把这469例早中期肺腺癌分为了 Immune High 和 Immune Low 两个免疫亚型。聚类参数:FC=1.2,p=1.46e-5,q=1.45e-5。但基于聚类的分类方法不能针对单独样本进行分子分型。为了实施个体化诊断,将 469 例样本按照 大约2:1的比例随机划分为训练集(312例)和验证集(157例)。其中训练集样本数据用于建立早中期肺腺癌单样本亚型预测模型,验证集样本数据用于个体化评估预测模型。取样采取了分层取样的方式,以保证训练集和测试集样本中 Immune High 和Immune Low 两个亚型分组中样本的比例与数据来源数据库中本身比例保持一致。
根据训练集中 312例样本的 75 个分类器基因的表达量数据(表达谱数据:其中48个分类器基因在Immune High样本中高表达但在Immune Low样本中低表达,而另外的27个分类器基因在Immune Low样本中高表达但在Immune High样本中低表达)和基于这些表达量数据使用层级聚类聚类算法将312 例样本分成的 Immune High 和 Immune Low 两个免疫亚型标签,使用python语言中机器学***台的单个早中期肺腺癌患者样本 Immune High 亚型和Immune Low 亚型的模型,该模型为单样本亚型预测模型,以下简称SVM预测模型。
并采用该模型对TCGA-LUAD数据集中的验证集样本及GSE81089数据集中样本的免疫亚型进行了预测验证。并绘制受试者工作特征曲线(receiver operatingcharacteristic curve,简称ROC曲线)验证模型分型的准确性。
代码如下:
数据标准化以及标准分型标签的确立:
在R(下载网址:https://cran.r-project.org/mirrors.html)以及R Studio(下载网址:https://posit.co/download/rstudio-desktop/)中运行:
setwd("SVM/TCGA-LUAD");
GSE81089<-read.csv("GSE81089.csv");
LUAD<-read.csv("New LUAD.csv")。
##读入归一化之后的所有变量的表达谱矩阵:
gene<-read.csv("gene.csv");
RNA_Seq<-merge(GSE81089,LUAD,by="ID");
data<-t(RNA_Seq);
data<-data.frame(data);
colnames(data)=data[1,];
data1=data[-1,];
data2=as.data.frame(lapply(data1,as.numeric));
out_pca<-prcomp(data2[,-9418]);
autoplot(out_pca,data=data2,colour='Lable',size=1,label=FALSE)。
##绘制PCA图,判断是否存在批次效应:
pheno<- data2;
row.names(RNA_Seq)<-RNA_Seq[,1];
RNA_Seq1<-RNA_Seq[,-1];
combat_edata<- ComBat(dat = RNA_Seq1, batch = pheno$Lable)。
##使用combat消除批次效应:
dat5=as.data.frame(t(combat_edata));
out_pca<-prcomp(dat5[,-9418]);
autoplot(out_pca,data=dat5,colour='Lable',size=1,label=FALSE);
dat4=as.data.frame(combat_edata);
write.csv(dat4,file = "RNA seq_batch.csv");
datt<-read.csv("RNA seq_batch.csv");
GENE<-read.csv("GENE_75.csv");
RNA_seq_75<-merge(datt,GENE,by="X.2");
write.csv(RNA_seq_75,file = "RNA seq_74batch.csv")。
##取得消除批次效应之后的75基因表达谱矩阵:
training_data=read.table("LUAD_batch.csv",sep = ",",header = T,row.names=1);
dim(training_data);
LUAD_USE<-apply(training_data, 2,scale)。
##数据标准化。
##python中运行SVM算法代码如下:
import pandas as pd;
import numpy as np;
import math;
import pandas as pd;
import matplotlib.pyplot as plt;
from sklearn import svm,datasets,preprocessing;
from sklearn.metrics import roc_curve,auc;
from sklearn.model_selection import train_test_split;
from sklearn.model_selection import cross_val_score;
from sklearn.model_selection import cross_val_score;
from sklearn.multiclass import OneVsRestClassifier。
##加载必须的模块:
DATA_LUAD=pd.read_csv(r"SVM\LUAD_73batch_ex.csv");
xunlian_y=pd.read_csv(r"SVM\TCGA-LUAD\LUAD-class-469-hc2.csv");
shujufenge1=np.array(xunlian_y);
xunlian_y=shujufenge1.transpose();
for e in range(len(xunlian_y));
xunlian_y[e]=int(xunlian_y[e]);
xunlian_y=xunlian_y.ravel();
xunlian_y=xunlian_y.transpose();
xunlian_y;
shuju=DATA_LUAD;
shujufenge=np.array(shuju);
shujufenge=shujufenge.transpose();
xunlian_x=shujufenge[:,:];
for i in range(len(xunlian_x)):
for j in range(len(xunlian_x[0])):
xunlian_x[i][j]=float(xunlian_x[i][j])。
#将数据矩阵化并且命名为xunlian_x,将标签矩阵化并命名为xunlian_y:
x_train, x_test, y_train, y_test = train_test_split(xunlian_x,xunlian_y, test_size=0.33, random_state=12)。
#将数据按照比例分割:
y_train=y_train.ravel();
from cProfile import label;
from colorsys import yiq_to_rgb;
from random import random;
from tkinter import Y;
import numpy as np;
import matplotlib.pyplot as plt;
from itertools import cycle;
import pandas as pd;
from sklearn import svm,datasets,preprocessing;
from sklearn.metrics import roc_curve,auc;
from sklearn.model_selection import train_test_split;
from sklearn.preprocessing import label_binarize;
from sklearn.multiclass import OneVsOneClassifier;
import os;
model=svm.SVC(kernel='linear',probability=True,class_weight='balanced',C=15);
model.fit(x_train,y_train.astype('int'))。
##建立模型:
predict_test=model.predict(test_x)。
##预测:
y_score = model.decision_function(test_x);
from sklearn.metrics import confusion_matrix;
import matplotlib.pyplot as plt。
#生成混淆矩阵:
import numpy as np;
cm=confusion_matrix(test_y,predict_test);
fpr,tpr,threshold=roc_curve(test_y.astype('float'),y_score);
roc_auc=auc(fpr,tpr);
plt.figure();
print(roc_auc);
lw=2;
plt.figure();
plt.plot(fpr,tpr,color='darkorange',lw=lw,label='ROC curve (area = %0.2f)'%roc_auc);
plt.plot([0, 1], [0, 1], color='navy', lw=lw, linestyle='--');
plt.xlim([-0.025, 1.025]);
plt.ylim([-0.025, 1.025]);
plt.legend(loc=4);
plt.xlabel('False Positive Rate');
plt.ylabel('True Positive Rate');
plt.title('TCGA-LUAD');
plt.legend(loc="lower right");
plt.savefig('LUAD.pdf');
plt.show()。
#绘制ROC曲线。
#使用步骤2.1所建立的早中期肺腺癌单样本亚型预测模型对同为RNA-seq平台的GSE81089数据集样本进行亚型预测的代码如下:
#DATA=pd.read_csv(r"SVM\GSE81089_73batch_ex.csv");
#test_y=pd.read_csv(r"SVM\GSE81089_class.csv");
shujufenge1=np.array(test_y);
test_y=shujufenge1.transpose();
for e in range(len(test_y)):
test_y[e]=int(test_y[e]);
test_y=test_y.ravel();
test_y=test_y.transpose();
test_y;
shuju=DATA;
shujufenge=np.array(shuju);
shujufenge=shujufenge.transpose();
test_x=shujufenge[:,:];
for i in range(len(test_x)):
for j in range(len(test_x[0])):
test_x[i][j]=float(test_x[i][j])。
model=svm.SVC(kernel='linear',probability=True,class_weight='balanced',C=15);
model.fit(x_train,y_train.astype('int'));
predict_test=model.predict(test_x);
y_score = model.decision_function(test_x)。
根据返回的ROC曲线以及混淆矩阵的准确度,不断迭代优化模型,最终得到了准确度超过90%的早中期肺腺癌单样本免疫亚型预测模型。该早中期肺腺癌单样本免疫亚型预测模型为上述SVM预测模型。
基于TCGA-LUAD数据集的验证集中的单个样本使用构建的模型进行免疫分型,与基于层级聚类建立的分型标准得到的TCGA-LUAD数据集中样本的免疫亚型相比,准确度见图12中A(均达到94%以上);ROC曲线见图1(AUC值为0.98)。
使用基于TCGA数据集建立的单样本亚型预测模型—SVM预测模型对同为RNA-seq平台的GSE81089数据集中早中期肺腺癌样本进行单样本免疫亚型预测,与基于层级聚类建立的分型标准得到的免疫亚型分型结果相比准确度见图12中B,受样本量的限制,GSE81089数据集容易受到噪音的影响,但使用单样本亚型预测模型基于75个分类器基因预测的免疫亚型仍然能够保持85%以上;ROC曲线见图2(AUC值为0.90)。
2.3 基于芯片数据集中建立并验证早中期肺腺癌单样本亚型预测模型。
为确定75个分类器基因在Affymetrix芯片数据中应用的可能性,在GEO肺腺癌数据库中使用步骤2.2中同样的方法,建立了基于U133A平台的SVM单样本亚型预测模型。
对于U133A芯片平台的数据集GSE68465和GSE14814,利用GSE68465数据集的439例I-III期的早中期肺腺癌样本中75个分类器基因的表达量数据,首先使用层级聚类的聚类方式把这439例早中期肺腺癌样本分为了 Immune High 和 Immune Low 两个亚型。聚类参数为:p=0.002,q=2.4e-4。为实施个体化分型预测,将439例样本按照约2:1 的比例随机划分为训练集(293例)样本和验证集(146例)样本,用于建立和评估验证使用75个分类器基因构建的个体化分型预测的分类器。取样采取了分层取样的方式,以保证训练集和验证集样本中 Immune High 和 Immune Low 两个亚型的样本比例与数据来源数据库中本身比例维持一致。
使用步骤2.2同样的方法,根据GSE68465数据集的训练集中293例样本的75个分类器基因的表达量数据和层级聚类算法分成的 Immune High 和 Immune Low 两个亚型标签分组,使用python语言中机器学***台的单个早中期肺腺癌样本患者 Immune High 亚型和Immune Low 亚型的模型;并采用该模型对GSE68465数据集中的验证集样本以及GSE14814数据集的样本进行了免疫亚型预测。同时绘制ROC曲线验证模型分型的准确性。
代码如下:
DATA_LUAD=pd.read_csv(r"SVM\GSE68465_batch_ex.csv");
xunlian_y=pd.read_csv(r"SVM\GSE68564-class2.csv");
shujufenge1=np.array(xunlian_y);
xunlian_y=shujufenge1.transpose();
for e in range(len(xunlian_y)):
xunlian_y[e]=int(xunlian_y[e])。
xunlian_y=xunlian_y.ravel();
xunlian_y=xunlian_y.transpose();
xunlian_y。
shuju=DATA_LUAD;
shujufenge=np.array(shuju);
shujufenge=shujufenge.transpose();
xunlian_x=shujufenge[:,:];
for i in range(len(xunlian_x)):
for j in range(len(xunlian_x[0])):
xunlian_x[i][j]=float(xunlian_x[i][j])。
#将数据矩阵化并且命名为xunlian_x,将标签矩阵化并命名为xunlian_y:
x_train, x_test, y_train, y_test = train_test_split(xunlian_x,xunlian_y, test_size=0.33, random_state=12)。
#将数据按照比例分割:
y_train=y_train.ravel();
model=svm.SVC(kernel='linear',probability=True,class_weight='balanced',C=0.01);
model.fit(x_train,y_train.astype('int'))。
##建立模型:
predict_test=model.predict(test_x)。
##预测:
y_score = model.decision_function(test_x);
from sklearn.metrics import confusion_matrix;
import matplotlib.pyplot as plt。
#生成混淆矩阵:
import numpy as np;
cm=confusion_matrix(test_y,predict_test);
fpr,tpr,threshold=roc_curve(test_y.astype('float'),y_score);
roc_auc=auc(fpr,tpr);
plt.figure();
print(roc_auc);
lw=2;
plt.figure();
plt.plot(fpr,tpr,color='darkorange',lw=lw,label='ROC curve (area = %0.2f)'%roc_auc);
plt.plot([0, 1], [0, 1], color='navy', lw=lw, linestyle='--');
plt.xlim([-0.025, 1.025]);
plt.ylim([-0.025, 1.025]);
plt.legend(loc=4)。
plt.xlabel('False Positive Rate');
plt.ylabel('True Positive Rate');
plt.title('TCGA-LUAD');
plt.legend(loc="lower right");
plt.savefig('LUAD.pdf');
plt.show()。
#绘制ROC曲线。
使用所建立的单样本亚型预测模型对同为U133A芯片平台的GSE14814数据集进行亚型预测代码如下:
#DATA=pd.read_csv(r"SVM\GSE14814batch_ex.csv");
#test_y=pd.read_csv(r"SVM\GSE14814_class.csv");
shujufenge1=np.array(test_y);
test_y=shujufenge1.transpose();
for e in range(len(test_y)):
test_y[e]=int(test_y[e])。
test_y=test_y.ravel();
test_y=test_y.transpose();
test_y;
shuju=DATA;
shujufenge=np.array(shuju);
shujufenge=shujufenge.transpose();
test_x=shujufenge[:,:];
for i in range(len(test_x)):
for j in range(len(test_x[0])):
test_x[i][j]=float(test_x[i][j])。
model=svm.SVC(kernel='linear,probability=True,class_weight='balanced',C=0.01);
model.fit(x_train,y_train.astype('int'));
predict_test=model.predict(test_x);
y_score = model.decision_function(test_x)。
基于GSE68465数据集的验证集中的单个样本使用构建的模型—SVM预测模型进行免疫分型,与基于层级聚类建立的分型标准得到的免疫亚型相比,模型对免疫亚型预测结果如图12中C所示(准确度均在95%以上);ROC曲线见图3(AUC值为0.99)。
GSE14814数据库含有71例早中期肺腺癌样本。使用基于GSE68465数据集中的验证集样本建立的单样本免疫亚型预测模型—SVM预测模型对GSE14814芯片数据集中的单样本进行免疫分型,与基于层级聚类建立的分型标准得到的免疫亚型相比,预测结果如图12中D所示(准确度均在89%以上);ROC曲线见图4(AUC值为0.98)。
实施例2、应用早中期肺腺癌的SVM单样本亚型预测模型预测吸烟肺腺癌患者预后存活率。
1.使用模型预测TCGA-LUAD数据集早中期肺腺癌吸烟患者的免疫亚型和预后。
根据TCGA-LUAD数据集469例早中期肺腺癌患者样本(治疗前检测)的 75个分类器基因的表达量数据,采用实施例 1中建立的早中期肺腺癌单样本SVM免疫分型模型,将该469例样本中的319例吸烟患者进行免疫亚型预测分类。预测得到141例早中期肺腺癌吸烟患者为Immune High亚型,178例早中期肺腺癌吸烟患者为Immune Low亚型。
2. 早中期肺腺癌吸烟患者的预后分析。
根据319例早中期肺腺癌吸烟患者的随访结果,进行5年生存期分析(Kaplan-Meier曲线及Log-rank检验)。生存曲线结果如图5所示,步骤1中免疫亚型分型为ImmuneHigh和 Immune Low的两组早中期肺腺癌亚型吸烟患者具有显著不同的预后:Immune High亚型(高免疫亚型)的5年总体生存率显著高于Immune Low 亚型(低免疫亚型)(log-rank检验,p=0.0005;风险比 0.4828)。并且如图6所示,即使同样是II期和IIIA期的病人(319例早中期肺腺癌吸烟患者中的173例),免疫亚型分型(Immune Signature)仍然能够将这群患者区分为预后较好的Immune High组(高免疫亚型组,62例)和预后较差的Immune Low组(低免疫亚型组,111例),Immune High亚型的5年总体生存率显著高于Immune Low 亚型(log-rank 检验,p=0.0454;风险比 0.5905)。
因此,实施例1中基于75 个Immune分类器基因群建立的SVM单样本免疫亚型预测模型可以预测待测早中期肺腺癌吸烟患者的预后,尤其是II期或者IIIA期患者。
3. 使用模型预测GSE81089 数据集早中期肺腺癌吸烟患者的免疫亚型和预后。
根据GSE81089数据集中103例早中期肺腺癌患者样本(治疗前检测)的75个Immune分类器基因的表达量数据,分别采用实施例1获得的肺腺癌SVM单样本亚型预测模型将该103例样本中的43例吸烟患者的免疫亚型分类。其中,得到22例 Immune High亚型早中期肺腺癌吸烟患者和21例Immune Low亚型早中期肺腺癌吸烟患者。
43例吸烟患者的最长随访时间为84个月,根据随访结果,进行生存期分析(Kaplan-Meier曲线及Log-rank检验),结果如图7所示,可以看到在GSE81089数据集中,Immune High 和 Immune Low 两个亚型早中期肺腺癌吸烟患者同样具有显著不同的预后:Immune High亚型(高免疫亚型)吸烟患者的7年总体生存率显著高于 Immune Low亚型(低免疫亚型)吸烟患者(log-rank 检验,p=0.042;风险比 0.3556)。
4. 使用模型预测GSE68465数据集早中期肺腺癌吸烟患者的免疫亚型和预后。
根据数据库GSE68465中439例早中期肺腺癌吸烟患者样本(治疗前检测)的75个Immune分类器基因的表达量数据,分别采用实施例1获得的早中期肺腺癌SVM单样本亚型预测模型将该439例样本分为 Immune High(234例)和 Immune Low 两个亚型(205例)。其中吸烟患者298例,145例为Immune High亚型,153例为Immune Low亚型。
298例吸烟患者的最长随访时间为60个月。根据随访结果,进行生存期分析(Kaplan-Meier曲线及Log-rank检验)。结果如图8所示,Immune High 和Immune Low 两个亚型同样具有显著不同的预后:Immune High 亚型(高免疫亚型)的5年总体生存率显著高于 Immune Low 亚型(低免疫亚型)(log-rank 检验,p=0.0007,风险比0.5447)。并且如图9所示,即使同样是II期和IIIA期的病人(298例吸烟患者中的219例),免疫亚型分型(ImmuneSignature)仍然能够将这群患者分为预后较好的Immune High组(100例)和预后较差的Immune Low组(119例),Immune High亚型(高免疫亚型)的5年总体生存率显著高于ImmuneLow 亚型(低免疫亚型)(log-rank 检验,p=0.0006;风险比 0.5053)。
因此,实施例1中建立的基于75 个Immune分类器基因群的SVM单样本亚型预测模型可以预测基于芯片平台的待测早中期肺腺癌吸烟患者的预后,尤其是II期或者III期A患者。
5. 使用模型预测GSE14814数据集早中期肺腺癌吸烟患者的免疫亚型和预后。
根据数据库GSE14814中验证集71例早中期肺腺癌吸烟患者样本(治疗前检测)的75个Immune分类器基因的表达量数据,采用实施例1获得的SVM单样本亚型预测模型将该71例样本分为 Immune High(35例)和 Immune Low 两个亚型(36例)。
71例患者的最长随访时间为120个月,根据随访结果,进行生存期分析(Kaplan-Meier曲线及Log-rank检验),结果如图10所示,在GSE14814数据集中,Immune High 和Immune Low 两个亚型同样具有显著不同的预后:Immune High 亚型(高免疫亚型)的5年总体生存率显著高于Immune Low 亚型(低免疫亚型)(log-rank 检验,p=0.0230;风险比0.3436)。
实施例 3、早中期肺腺癌的免疫微环境基因群及其分子分型在预测待测患者是否能够得益于顺铂联合长春瑞滨治疗中的应用。
GSE14814数据集早中期肺腺癌的表达量数据集源自一项前瞻性III期临床试验(JBR.10),附有病人的药物治疗方案。该试验把病人随机分到实验组(ACT, 顺铂联合长春瑞滨化疗,39例)和观察组(OBS,32例)。入组病人的转录组表达量数据均采集于治疗前。由于短时间内治疗效果难以体现,1年内生存期差异不显著,本发明使用Landmark分段分析的方法,如图11中A所示,在治疗后1年内(t≤1)ACT组和OBS组差异不显著:restricted meansurvival time (RMST)分析,p=0.6913。ACT组使用顺铂联合长春瑞滨化疗方案在治疗后的第2-5年(t>1)呈现显著的生存优势,与OBS组相比对,ACT组的生存率显著提升:RMST分析,p=0.014。
采用实施例1获得的基于免疫微环境基因群75个基因的表达谱建立的SVM单样本亚型预测模型预测该样本数据集中每个样本的免疫亚型,共获得Immune High和ImmuneLow两个亚型分组。然后分别在 Immune High(ACT组23例,OBS组12例)和 Immune Low(ACT组16例,OBS组20例)两个亚型中按药物治疗方案分组后进行生存期分析(Landmark分段分析及RMST分析)。
结果如图11所示,图11中B 为 Immune High组的Landmark分段及RMST分析,图11中C 为 Immune Low组的Landmark分段及RMST分析。可以观察到,与观察组(OBS组)相比,使用顺铂联合长春瑞宾的化疗组(ACT组)仅能延长Immune Low组中患者的生存期(图11中C),不能延长Immune High组中患者的生存期(图11中B)。具体体现在:Immune High组不论是治疗后1年内(t≤1)还是治疗后第2-5年(t>1),化疗(ACT组)与观察组(OBS组)相比均没有显示生存优势(图11中B,t≤1,p=0.5019;t>1,p=0.9456)。而Immune Low组内ACT方案在治疗后的第2-5年(t>1)呈现显著的生存优势,与OBS组相比对,ACT组的生存率提升:RMST分析,p=0.0011(图11中C,t≤1,p=0.4251;t>1,p=0.0011)。由此,仅Immune Low组的早中期肺腺癌能够得益于顺铂联合长春瑞滨的治疗,而Immune High 组的早中期肺腺癌则不能得益于顺铂联合长春瑞滨的治疗。
综上所述,本发明基于免疫微环境基因群75个基因的表达谱建立的SVM单样本亚型预测模型对早中期肺腺癌患者进行免疫亚型分子分型可以预测患者的预后;同时指导患者的临床用药,可以避免在 Immune High组病人中使用化疗,一方面能使患者避免承受化疗带来的严重副作用,另一方面也将减轻患者和社会的经济负担。
肿瘤样本中的免疫微环境是机体对肿瘤细胞所携带的各种基因组变异的综合反映。肿瘤细胞中的DNA层面的变异(即基因突变),有可能产生机体发育过程中从未遇见的蛋白质,进而被机体认作“neoantigen",激活机体对肿瘤的排斥性免疫反应。而肿瘤细胞携带的染色体不稳定性,将激活先天免疫的cGAS-STING信号通道,导致I型干扰素信号通道的激活有抑制肿瘤生长作用,但染色体不稳定性导致的NF-kB信号通道的激活,则诱导各种炎症因子的产生,建立感染样微环境,促进肿瘤的生存和演进。在前期原创发现基于细胞学起源的脑胶质瘤EM/PM分子分型(Sun et al. A glioma classification scheme based oncoexpression modules of EGFR and PDGFRA[J]. Proceedings of the NationalAcademy of Sciences of the United States of America, 2018, 2014年111卷9期:3538-43页.)的基础上,本发明反复探索,发现在多种肿瘤的转录组大数据中存在一群能代表其微环境中不同免疫细胞群的基因群。该基因群也能将IDH野生型胶质瘤区分为高表达或低表达免疫微环境基因群的分子亚型。但是,与低表达免疫微环境基因群的IDH野生型胶质瘤相比,高表达免疫微环境基因群的IDH野生型胶质瘤进展快,具有显著差的预后。与脑胶质瘤中免疫微环境分子分型的结果相反,本发明发现高表达免疫微环境基因群免疫亚型(Immune High组)的早中期肺腺癌预后好,但不能得益于化疗,而低表达免疫微环境基因群免疫亚型(Immune Low组)的早中期肺腺癌预后差,但能够得益于化疗。
以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、实验平台和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。

Claims (10)

1.预测待测肺腺癌患者预后的装置,其特征在于:所述装置包括如下模块:
M1)免疫分型模型构建模块:用于基于已知肺腺癌样本集的75个基因的表达谱数据、层级聚类和SVM算法获得预测单样本肺腺癌患者免疫亚型的免疫分型模型;
M2)免疫分型模块:用于基于待测肺腺癌患者的所述75个基因的表达谱数据使用所述免疫分型模型预测待测肺腺癌患者的免疫分型亚型;
M3)预后预测模块:用于基于所述免疫分型亚型预测待测肺腺癌患者的预后;所述75个基因为如下所示的基因:
ACKR1、AIF1、ALOX5、C1QB、CAPG、CCL5、CD14、CD2、CD247、CD37、CD3D、CD72、CD8A、CFD、CORO1A、CST7、CTSW、CYBA、DENND3、FCER1G、GMFG、GZMA、GZMB、HCK、IL21R、IL2RG、LCK、LDLRAP1、LST1、LTB、MAFB、MZB1、NCF1、NCF4、NKG7、PILRA、PSMB10、PTPN7、PYCARD、RAC2、RRAS、SH3BGRL3、SIGLEC7、SLAMF8、STARD5、THEMIS2、TNFRSF1B、TYROBP、BRIX1、BZW2、CABYR、CKS1B、CTBP2、DARS2、DDX1、ECT2、EEF1E1、EIF3J、EIF5B、HSPD1、HSPE1、MRPL19、MRPS16、MTFR1、MTMR2、NDUFS1、NOL7、NOLC1、NUDT15、SLC7A11、SNRPE、SRPK1、TFB2M、UGDH和YWHAE。
2.根据权利要求1所述的装置,其特征在于:所述肺腺癌患者为早中期肺腺癌患者。
3.根据权利要求1或2所述的装置,其特征在于:所述肺腺癌患者为肺腺癌吸烟患者。
4.预测待测肺腺癌患者指导用药的装置,其特征在于:所述装置包括如下模块:
N1)免疫分型模型构建模块:用于基于已知肺腺癌样本集的75个基因的表达谱数据、层级聚类和SVM算法获得预测单样本肺腺癌患者免疫亚型的免疫分型模型;
N2)免疫分型模块:用于基于待测肺腺癌患者的75个基因的表达谱数据使用所述免疫分型模型预测待测肺腺癌患者的免疫分型亚型;
N3)指导用药输出模块:用于基于所述免疫分型亚型确定待测肺腺癌患者是否受益于顺铂联合长春瑞宾进行化疗;
所述75个基因为如下所示的基因:
ACKR1、AIF1、ALOX5、C1QB、CAPG、CCL5、CD14、CD2、CD247、CD37、CD3D、CD72、CD8A、CFD、CORO1A、CST7、CTSW、CYBA、DENND3、FCER1G、GMFG、GZMA、GZMB、HCK、IL21R、IL2RG、LCK、LDLRAP1、LST1、LTB、MAFB、MZB1、NCF1、NCF4、NKG7、PILRA、PSMB10、PTPN7、PYCARD、RAC2、RRAS、SH3BGRL3、SIGLEC7、SLAMF8、STARD5、THEMIS2、TNFRSF1B、TYROBP、BRIX1、BZW2、CABYR、CKS1B、CTBP2、DARS2、DDX1、ECT2、EEF1E1、EIF3J、EIF5B、HSPD1、HSPE1、MRPL19、MRPS16、MTFR1、MTMR2、NDUFS1、NOL7、NOLC1、NUDT15、SLC7A11、SNRPE、SRPK1、TFB2M、UGDH和YWHAE。
5.预测待测肺腺癌患者预后的计算机可读存储介质,其特征在于:所述计算机可读存储介质使计算机运行如下步骤:
C1)基于已知肺腺癌样本集的75个基因的表达谱数据、层级聚类和SVM算法获得预测单样本肺腺癌患者免疫亚型的免疫分型模型;
C2)基于待测肺腺癌患者的75个基因的表达谱数据使用所述免疫分型模型预测待测肺腺癌患者的免疫分型亚型;
C3)基于所述免疫分型亚型预测待测肺腺癌患者的预后;
所述75个基因为如下所示的基因:
ACKR1、AIF1、ALOX5、C1QB、CAPG、CCL5、CD14、CD2、CD247、CD37、CD3D、CD72、CD8A、CFD、CORO1A、CST7、CTSW、CYBA、DENND3、FCER1G、GMFG、GZMA、GZMB、HCK、IL21R、IL2RG、LCK、LDLRAP1、LST1、LTB、MAFB、MZB1、NCF1、NCF4、NKG7、PILRA、PSMB10、PTPN7、PYCARD、RAC2、RRAS、SH3BGRL3、SIGLEC7、SLAMF8、STARD5、THEMIS2、TNFRSF1B、TYROBP、BRIX1、BZW2、CABYR、CKS1B、CTBP2、DARS2、DDX1、ECT2、EEF1E1、EIF3J、EIF5B、HSPD1、HSPE1、MRPL19、MRPS16、MTFR1、MTMR2、NDUFS1、NOL7、NOLC1、NUDT15、SLC7A11、SNRPE、SRPK1、TFB2M、UGDH和YWHAE。
6.根据权利要求5所述的计算机可读存储介质,其特征在于:所述肺腺癌患者为早中期肺腺癌患者;所述预后为5年以上的总生存率。
7.预测待测肺腺癌患者指导用药的计算机可读存储介质,其特征在于:所述计算机可读存储介质使计算机运行如下步骤:
D1)免疫分型模型构建模块:用于基于已知肺腺癌样本集的75个基因的表达谱数据、层级聚类和SVM算法获得预测单样本肺腺癌患者免疫亚型的免疫分型模型;
D2)免疫分型模块:用于基于待测肺腺癌患者的75个基因的表达谱数据使用所述免疫分型模型预测待测肺腺癌患者的免疫分型亚型;
D3)指导用药输出模块:用于基于所述免疫分型亚型确定待测肺腺癌患者是否受益于顺铂联合长春瑞宾进行化疗;
所述75个基因为如下所示的基因:
ACKR1、AIF1、ALOX5、C1QB、CAPG、CCL5、CD14、CD2、CD247、CD37、CD3D、CD72、CD8A、CFD、CORO1A、CST7、CTSW、CYBA、DENND3、FCER1G、GMFG、GZMA、GZMB、HCK、IL21R、IL2RG、LCK、LDLRAP1、LST1、LTB、MAFB、MZB1、NCF1、NCF4、NKG7、PILRA、PSMB10、PTPN7、PYCARD、RAC2、RRAS、SH3BGRL3、SIGLEC7、SLAMF8、STARD5、THEMIS2、TNFRSF1B、TYROBP、BRIX1、BZW2、CABYR、CKS1B、CTBP2、DARS2、DDX1、ECT2、EEF1E1、EIF3J、EIF5B、HSPD1、HSPE1、MRPL19、MRPS16、MTFR1、MTMR2、NDUFS1、NOL7、NOLC1、NUDT15、SLC7A11、SNRPE、SRPK1、TFB2M、UGDH和YWHAE。
8.检测人基因组75个基因的表达谱的物质或装置在制备预测待测肺腺癌患者预后和/或指导用药的产品中的应用;
所述75个基因为如下所示的基因:
ACKR1、AIF1、ALOX5、C1QB、CAPG、CCL5、CD14、CD2、CD247、CD37、CD3D、CD72、CD8A、CFD、CORO1A、CST7、CTSW、CYBA、DENND3、FCER1G、GMFG、GZMA、GZMB、HCK、IL21R、IL2RG、LCK、LDLRAP1、LST1、LTB、MAFB、MZB1、NCF1、NCF4、NKG7、PILRA、PSMB10、PTPN7、PYCARD、RAC2、RRAS、SH3BGRL3、SIGLEC7、SLAMF8、STARD5、THEMIS2、TNFRSF1B、TYROBP、BRIX1、BZW2、CABYR、CKS1B、CTBP2、DARS2、DDX1、ECT2、EEF1E1、EIF3J、EIF5B、HSPD1、HSPE1、MRPL19、MRPS16、MTFR1、MTMR2、NDUFS1、NOL7、NOLC1、NUDT15、SLC7A11、SNRPE、SRPK1、TFB2M、UGDH和YWHAE。
9.根据权利要求8所述的应用,其特征在于:所述肺腺癌患者为早中期肺腺癌患者;所述预后为5年以上的总生存率。
10.权利要求1-4中任一权利要求所述的装置或权利要求5-7中任一权利要求所述的计算机可读存储介质在开发和/或制备预防和/或治疗肺腺癌的产品中的应用。
CN202310186412.8A 2023-03-02 2023-03-02 基于免疫微环境基因群预测肺腺癌患者预后的装置 Active CN115862876B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310186412.8A CN115862876B (zh) 2023-03-02 2023-03-02 基于免疫微环境基因群预测肺腺癌患者预后的装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310186412.8A CN115862876B (zh) 2023-03-02 2023-03-02 基于免疫微环境基因群预测肺腺癌患者预后的装置

Publications (2)

Publication Number Publication Date
CN115862876A true CN115862876A (zh) 2023-03-28
CN115862876B CN115862876B (zh) 2023-05-26

Family

ID=85659564

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310186412.8A Active CN115862876B (zh) 2023-03-02 2023-03-02 基于免疫微环境基因群预测肺腺癌患者预后的装置

Country Status (1)

Country Link
CN (1) CN115862876B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160102364A1 (en) * 2013-05-28 2016-04-14 Beijing Normal University Neuroglioma Molecular Subtyping Gene Group and Use Thereof
CN109790583A (zh) * 2016-05-17 2019-05-21 基因中心治疗公司 对肺腺癌亚型分型的方法
CN109841281A (zh) * 2017-11-29 2019-06-04 郑州大学第一附属医院 基于共表达相似性识别肺腺癌早期诊断标识及风险预测模型的构建方法
CN110499364A (zh) * 2019-07-30 2019-11-26 北京凯昂医学诊断技术有限公司 一种用于检测扩展型遗传病全外显子的探针组及其试剂盒和应用
CN111183235A (zh) * 2017-10-03 2020-05-19 基因序列有限公司 使用微rna基因表达来对黑素瘤进行诊断、分期和监测的方法
CN112233796A (zh) * 2020-10-15 2021-01-15 杭州慕谷科技有限公司 一种在早期肝癌中免疫增强的分子亚型的研究方法
WO2022122994A1 (en) * 2020-12-11 2022-06-16 Fondazione Di Religione E Di Culto "Casa Sollievo Della Sofferenza" - Opera Di San Pio Da Pietrelcina Prognostic method for aggressive lung adenocarcinomas
CN115537467A (zh) * 2022-10-17 2022-12-30 重庆大学附属肿瘤医院 基于深度神经网络的卵巢癌生存预后预测分子模型的建立方法及其应用

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160102364A1 (en) * 2013-05-28 2016-04-14 Beijing Normal University Neuroglioma Molecular Subtyping Gene Group and Use Thereof
CN109790583A (zh) * 2016-05-17 2019-05-21 基因中心治疗公司 对肺腺癌亚型分型的方法
CN111183235A (zh) * 2017-10-03 2020-05-19 基因序列有限公司 使用微rna基因表达来对黑素瘤进行诊断、分期和监测的方法
CN109841281A (zh) * 2017-11-29 2019-06-04 郑州大学第一附属医院 基于共表达相似性识别肺腺癌早期诊断标识及风险预测模型的构建方法
CN110499364A (zh) * 2019-07-30 2019-11-26 北京凯昂医学诊断技术有限公司 一种用于检测扩展型遗传病全外显子的探针组及其试剂盒和应用
CN112233796A (zh) * 2020-10-15 2021-01-15 杭州慕谷科技有限公司 一种在早期肝癌中免疫增强的分子亚型的研究方法
WO2022122994A1 (en) * 2020-12-11 2022-06-16 Fondazione Di Religione E Di Culto "Casa Sollievo Della Sofferenza" - Opera Di San Pio Da Pietrelcina Prognostic method for aggressive lung adenocarcinomas
CN115537467A (zh) * 2022-10-17 2022-12-30 重庆大学附属肿瘤医院 基于深度神经网络的卵巢癌生存预后预测分子模型的建立方法及其应用

Also Published As

Publication number Publication date
CN115862876B (zh) 2023-05-26

Similar Documents

Publication Publication Date Title
JP6067686B2 (ja) 癌の分子的診断検査
CN109880910A (zh) 一种肿瘤突变负荷的检测位点组合、检测方法、检测试剂盒及***
CN111128299B (zh) 一种结直肠癌预后显著相关ceRNA调控网络的构建方法
CN101743327B (zh) 黑色素瘤的预后预测
JP2011523049A (ja) 頭頚部癌の同定、モニタリングおよび治療のためのバイオマーカー
CN111933211B (zh) 癌症精准化疗分型标志物筛选方法、化疗敏感性的分子分型方法和应用
Simon Genomic clinical trials and predictive medicine
CN111128385B (zh) 一种用于食管鳞癌的预后预警***及其应用
CN111676288B (zh) 用于预测肺腺癌患者预后的***及其应用
Bi et al. Identification and validation of tumor environment phenotypes in lung adenocarcinoma by integrative genome-scale analysis
CN115497562B (zh) 一种基于铜死亡相关基因的胰腺癌预后预测模型构建方法
CN112831562A (zh) 一种用于预测肝癌患者切除术后复发风险的生物标志物组合、试剂盒
CN115410713A (zh) 一种基于免疫相关基因的肝细胞癌预后风险预测模型构建
US20150294062A1 (en) Method for Identifying a Target Molecular Profile Associated with a Target Cell Population
CN114203256B (zh) 基于微生物丰度的mibc分型及预后预测模型构建方法
CN109929934B (zh) 免疫相关基因在结直肠癌预后的试剂盒和***中的应用
CN116200490A (zh) 一种检测实体瘤微小残留病灶的方法
CN111690747A (zh) 一种与早中期结肠癌相关的联合标记物、检测试剂盒以及检测***
US20190112729A1 (en) Novel set of biomarkers useful for predicting lung cancer survival
CN115862876B (zh) 基于免疫微环境基因群预测肺腺癌患者预后的装置
CN116072258A (zh) 膀胱癌肿瘤抗原的开发及预测膀胱癌患者指导用药和预后的装置
CN106119406B (zh) 多发性肉芽肿血管炎及微小动脉炎的基因分型诊断试剂盒及使用方法
WO2019206217A1 (zh) 多发性骨髓瘤分子分型及应用
CN112037851A (zh) 自噬相关基因在结直肠癌预后的试剂盒和***中的应用
CN117476097B (zh) 一种基于三级***构特征基因的结直肠癌预后和治疗反应预测模型及其构建方法和应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20240611

Address after: Room 01-23565, 2nd Floor, No. 99 Shuixian West Road, Tongzhou District, Beijing, 101100

Patentee after: Beijing Tongcheng Rongxin Technology Co.,Ltd.

Country or region after: China

Address before: 100875, 19, Xinjie street, Haidian District, Beijing

Patentee before: BEIJING NORMAL University

Country or region before: China