CN111394456B - 早期肺腺癌患者预后评估***及其应用 - Google Patents

早期肺腺癌患者预后评估***及其应用 Download PDF

Info

Publication number
CN111394456B
CN111394456B CN202010198413.0A CN202010198413A CN111394456B CN 111394456 B CN111394456 B CN 111394456B CN 202010198413 A CN202010198413 A CN 202010198413A CN 111394456 B CN111394456 B CN 111394456B
Authority
CN
China
Prior art keywords
lung adenocarcinoma
patients
patient
early
relative expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010198413.0A
Other languages
English (en)
Other versions
CN111394456A (zh
Inventor
赫捷
孙楠
张超奇
张震
王思慧
张国超
张志慧
骆玥君
王�锋
车云
曾庆鹏
王亚龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cancer Hospital and Institute of CAMS and PUMC
Original Assignee
Cancer Hospital and Institute of CAMS and PUMC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cancer Hospital and Institute of CAMS and PUMC filed Critical Cancer Hospital and Institute of CAMS and PUMC
Priority to CN202010198413.0A priority Critical patent/CN111394456B/zh
Publication of CN111394456A publication Critical patent/CN111394456A/zh
Application granted granted Critical
Publication of CN111394456B publication Critical patent/CN111394456B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/50Mutagenesis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Informatics (AREA)
  • Organic Chemistry (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Oncology (AREA)
  • Physiology (AREA)
  • Microbiology (AREA)
  • Hospice & Palliative Care (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了早期肺腺癌患者预后评估***及其应用。本发明整合了三个独立队列的632例早期肺腺癌患者的无病生存期数据,建立和验证了个体化的早期LUAD患者的IBRS模型。三个独立队列包括TCGA、GSE31210和68例冰冻组织。所述IBRS模型由如下九种基因:DYNC1I2、THOC1、ADAM10、SERPINB6、CCL20、WNT2B、SLC11A1、MAPT、PSEN1组成。早期LUAD患者的IBRS模型的建立不仅有利于了解免疫分子之间复杂的相互作用机制,更给早期LUAD患者复发预测、治疗方案的优化带来巨大的帮助。

Description

早期肺腺癌患者预后评估***及其应用
技术领域
本发明属于生物医学技术领域,具体涉及早期肺腺癌患者预后评估***及其应用。
背景技术
肺癌是中国及世界范围内发病率较高的癌症,也是肿瘤相关死亡的最主要原因。肺腺癌(Lung adenocarcinoma,LUAD)是肺癌最常见的组织学亚型,约占肺癌的40%。尽管分子靶向药物、免疫检查点抑制剂等新的治疗措施不断发展,肺癌患者的五年生存率仍维持在17%左右。肺癌的高死亡率可归结于两大原因。66%的肺癌患者确诊时已是晚期,晚期肺癌的治疗手段选择有限,预后也较差。即使对于早期肺癌患者,术后五年复发率高达30-45%,死亡风险依旧很高。随着肺癌普查逐渐广泛地应用到临床实践中,越来越多的患者会在早期被诊断。因此,更应该致力于早期肺腺癌的治疗和管理。特别是找出具有高复发风险的早期癌患者以给予更多干预措施。
近年来研究表明,免疫***中的许多成分是肿瘤发生发展的关键因子。逃避免疫破坏已是肿瘤公认的一大特征之一。尽管肺癌以往被认为是非免疫原性疾病,但新的证据显示缺乏有效的免疫反应是由于特定的免疫逃逸机制。揭示潜在的免疫逃逸机制开启了肺癌免疫治疗的新篇章。如靶向PD-1和PD-L1的免疫检查点抑制剂已经成功地应用于临床,给传统的肺癌治疗模式带来一场革命。此前已有研究报道肺癌中的免疫相关基因或免疫成分具有重要的预后预测价值。但是免疫相关基因是否可以预测早期肺癌复发仍有待研究。
鉴于免疫治疗在肺癌中的广阔前景及初诊时早期LUAD患者比例的提高,迫切需要在早期肺癌中建立基于免疫基因的复发标志物模型(immune gene-set based recurrencesignature,IBRS)。
发明内容
本发明所要解决的技术问题是如何对肺腺癌患者尤其是早期肺腺癌患者进行预后。
为解决上述技术问题,本发明首先提供了一种肺腺癌患者预后***。
本发明提供的肺腺癌患者预后***包括检测DYNC1I2、THOC1、ADAM10、SERPINB6、CCL20、WNT2B、SLC11A1、MAPT、PSEN1九种基因表达量的***。
上述肺腺癌患者预后***中,所述检测DYNC1I2、THOC1、ADAM10、SERPINB6、CCL20、WNT2B、SLC11A1、MAPT、PSEN1九种基因表达量的***包括通过荧光定量PCR方法检测所述九种基因相对表达量所需的试剂和/或仪器。
进一步的,所述通过荧光定量PCR方法检测所述九种基因相对表达量所需的试剂和/或仪器包括检测DYNC1I2、THOC1、ADAM10、SERPINB6、CCL20、WNT2B、SLC11A1、MAPT、PSEN1九种基因相对表达量的引物对。检测各个基因的引物对序列具体如表2所示。
更进一步的,所述通过荧光定量PCR方法检测所述九种基因相对表达量所需的试剂和/或仪器还包括检测内参基因的引物对。所述内参基因具体为GAPDH基因。检测内参基因的引物对序列具体如表2所示。
上述肺腺癌患者预后***中,所述***还包含数据处理装置;所述数据处理装置内设模块;所述模块具有如下(a1)和(a2)所示的功能:
(a1)以肺腺癌患者组成的待测群体的离体肺腺癌组织为标本,测定每份标本中所述九种基因的相对表达量,然后根据所述九种基因相对表达量按照如下公式计算风险值:风险值=(0.3987×DYNC1I2基因相对表达量)-(0.5611×THOC1基因相对表达量)+(0.2405×ADAM10基因相对表达量)-(0.6713×SERPINB6基因相对表达量)+(0.1268×CCL20基因相对表达量)-(0.2408×WNT2B基因相对表达量)-(0.2255×SLC11A1基因相对表达量)-(0.2034×MAPT基因相对表达量)+(0.6942×PSEN1基因相对表达量),并根据所述风险值将所述待测群体分为低风险组和高风险组;
(a2)按照如下标准确定来自于所述待测群体的待测患者的预后风险和/或预后复发率和/或预后无病生存率和/或预后总生存率:“来自于所述高风险组中的待测患者”的预后风险和/或预后复发率高于或候选高于“来自于所述低风险组中的待测患者”;“来自于所述低风险组中的待测患者”的预后无病生存率和/或总生存率高于或候选高于“来自于所述高风险组中的待测患者”。
根据所述风险值将所述待测群体分为低风险组和高风险组的方法可参照文献“1.Li X,Yuan Y,Ren J,Shi Y,Tao X.Incremental Prognostic Value of ApparentDiffusion Coefficient Histogram Analysis in Head and Neck Squamous CellCarcinoma.Academic Radiology,2018Nov;25(11):1433-1438.doi:10.1016/j.acra.2018.02.017.”中的方法,具体可按照如下步骤进行:通过R语言软件的“survminer”软件包的“surv_cutpoint”功能确定阈值,比较所述待预测肺腺癌患者的风险值和所述阈值的大小,风险值大于阈值的患者被列入高风险组,风险值小于或等于阈值的患者被列入低风险组。
所述通过R语言软件的“survminer”软件包的“surv_cutpoint”确定阈值的方法具体如下:将待预测肺腺癌患者的风险值与匹配的预后信息输入至R语言软件中,在“survminer”软件包的“surv_cutpoint”的算法下,软件会自动计算出P值最小的分割点,该分割点即为高风险组和低风险组的阈值(最优cutoff点)。
为解决上述技术问题,本发明还提供了上述肺腺癌患者预后***的新用途。
本发明提供了上述肺腺癌患者预后***在如下(1)-(8)中的应用:
(1)制备用于肺腺癌患者预后风险评估的产品;
(2)评估肺腺癌患者预后风险;
(3)制备用于肺腺癌患者预后复发率评估的产品;
(4)评估肺腺癌患者预后复发率;
(5)制备用于肺腺癌患者预后无病生存率评估的产品;
(6)评估肺腺癌患者预后无病生存率;
(7)制备用于肺腺癌患者预后总生存率的产品;
(8)评估肺腺癌患者预后总生存率。
上述DYNC1I2、THOC1、ADAM10、SERPINB6、CCL20、WNT2B、SLC11A1、MAPT、PSEN1九种基因作为标志物在制备肺腺癌患者预后的产品中的应用也属于本发明的保护范围。
检测DYNC1I2、THOC1、ADAM10、SERPINB6、CCL20、WNT2B、SLC11A1、MAPT、PSEN1九种基因表达量的物质在制备肺腺癌患者预后的产品中的应用也属于本发明的保护范围。所述物质可为上述通过荧光定量PCR方法检测所述九种基因相对表达量所需的试剂和/或仪器。
检测DYNC1I2、THOC1、ADAM10、SERPINB6、CCL20、WNT2B、SLC11A1、MAPT、PSEN1九种基因表达量的物质和上述数据处理装置在制备肺腺癌患者预后的产品中的应用也属于本发明的保护范围。
上述数据处理装置在制备肺腺癌患者预后的产品中的应用也属于本发明的保护范围。
上述肺腺癌患者预后***或应用中,所述肺腺癌患者为早期肺腺癌患者;进一步的,所述早期肺腺癌患者为TNM分期的I期肺腺癌患者和/或TNM分期的II期肺腺癌患者。
所述离体肺腺癌组织可来自所述待预测肺腺癌患者的分离的肺腺癌组织经过***固定石蜡包埋制备的样本或来自所述待预测肺腺癌患者的分离的肺腺癌组织的冰冻切片。
上述肺腺癌患者预后***或应用中,所述DYNC1I2的GenBank号为NM_001271785.2、所述THOC1的GenBank号为NM_005131.3、所述ADAM10的GenBank号为NM_001320570.2、所述SERPINB6的GenBank号为NM_001195291.3、所述CCL20的GenBank号为NM_001130046.2、所述WNT2B的GenBank号为NM_001291880.1、所述SLC11A1的GenBank号为NM_000578.4、所述MAPT的GenBank号为NM_001123066.3、所述PSEN1的GenBank号为NM_000021.4。
本发明整合了三个独立队列的632例早期肺腺癌患者的无病生存期数据,建立和验证了个体化的早期LUAD患者的IBRS模型。三个独立队列包括TCGA、GSE31210和68例冰冻组织。早期LUAD患者的IBRS模型的建立不仅有利于了解免疫分子之间复杂的相互作用机制,更给早期LUAD患者复发预测、治疗方案的优化带来巨大的帮助。
附图说明
图1为早期肺腺癌复发标志物模型IBRS的构建及验证流程图。
图2为在TCGA队列中构建早期肺腺癌复发标志物模型IBRS。A:风险值的分布、复发状态和基因表达。B:基于风险值的全部早期LUAD患者的RFS的Kaplan-Meier曲线。C:免疫相关基因标记的ROC分析,预测TCGA队列在1、3和5年时的复发风险。D:基于风险值的I期LUAD患者的RFS的Kaplan-Meier曲线。E:基于风险值的II期LUAD患者的RFS的Kaplan-Meier曲线。
图3为在TCGA队列中基于风险值分组的生存曲线。A:基于风险值的全部早期LUAD患者的OS的Kaplan-Meier曲线。B:基于风险值的I期LUAD患者的OS的Kaplan-Meier曲线。C:基于风险值的II期LUAD患者的OS的Kaplan-Meier曲线。
图4为在GSE31210中验证早期肺腺癌复发标志物模型IBRS的预后能力。A:风险值的分布、复发状态和基因表达。B:基于风险值的全部早期LUAD患者的RFS的Kaplan-Meier曲线。C:基于风险值的I期LUAD患者的RFS的Kaplan-Meier曲线。D:基于风险值的II期LUAD患者的RFS的Kaplan-Meier曲线。E:基于风险值的全部早期LUAD患者的OS的Kaplan-Meier曲线。
图5为在GSE31210中基于风险值的I期LUAD患者的OS的Kaplan-Meier曲线。
图6为在TCGA队列中按性别,吸烟史和年龄分层的早期肺腺癌复发标志物模型IBRS的预后能力的验证。基于风险值的早期LUAD人群的男性(A),女性(B),吸烟者(C),非吸烟者(D),年龄较大(E)和年龄较小(F)的患者的RFS的Kaplan-Meier曲线。
图7为在TCGA队列中按性别,吸烟史和年龄分层的所有早期LUAD患者的生存分析。基于风险值的早期LUAD人群的男性(A)、女性(B)、吸烟者(C)、非吸烟者(D)、老年(E)和年轻(F)的患者的OS的Kaplan-Meier曲线。
图8为在GSE31210队列不同分子亚型中验证早期肺腺癌复发标志物模型IBRS的预后性能。基于风险值的早期LUAD人群的男性(A)、女性(B)、吸烟者(C)、非吸烟者(D)、年龄较大(E)和年龄较小(F)的患者的RFS的Kaplan-Meier曲线。
图9为在GSE31210队列中按性别、吸烟史和年龄分层的早期肺腺癌复发标志物模型IBRS的预后能力的验证。基于风险值的早期LUAD人群的男性(A)、女性(B)、吸烟者(C)、非吸烟者(D)、年龄较大(E)和年龄较小(F)的患者的OS的Kaplan-Meier曲线。
图10为在TCGA队列中携带野生型或突变型KRAS或EGFR基因的患者中的早期肺腺癌复发标志物模型IBRS的预后能力的验证。A:在TCGA队列中按高风险(HR)或低风险(LR)得出的KRAS和EGFR野生型(WT)和突变(MUT)比例。基于风险值的EGFR-WT(B)、EGFR-MUT(C)、KRAS-WT(D)、KRAS-MUT(E)和EGFR/KRAS-WT(F)的患者的RFS的Kaplan-Meier曲线。
图11为在TCGA队列中所有LUAD早期患者携带野生型或突变型KRAS或EGFR基因的生存分析。基于风险值的EGFR-WT(A)、EGFR-MUT(B)、KRAS-WT(C)、KRAS-MUT(D)和EGFR/KRAS-WT(E)早期LUAD患者的OS的Kaplan-Meier曲线。
图12为在GSE31210队列中所有LUAD早期患者携带野生型或突变型KRAS或EGFR基因的的生存分析。A:GSE31210队列中按高风险(HR)或低风险(LR)得出的KRAS和EGFR野生型(WT)和突变型(MUT)比例。基于风险值的EGFR-WT(B)、EGFR-MUT(C)、KRAS-WT(D)、KRAS-MUT(E)和EGFR/KRAS-WT(F)早期LUAD患者的RFS的Kaplan-Meier曲线。
图13为在TCGA队列中所有LUAD早期患者携带野生型或突变型KRAS或EGFR基因的生存分析。基于风险评分的EGFR-WT(A)、EGFR-MUT(B)、KRAS-WT(C)、KRAS-MUT(D)和EGFR/KRAS-WT(E)早期LUAD患者的OS的Kaplan-Meier曲线。
图14为在68例LUAD早期患者冷冻组织的独立组中验证早期肺腺癌复发标志物模型IBRS的预后能力。A:风险值的分布,复发状态和基因表达。B:基于风险值的全部早期LUAD患者的RFS的Kaplan-Meier曲线。C:基于风险值的I期LUAD患者的RFS的Kaplan-Meier曲线D:基于风险值的II期LUAD患者的RFS的Kaplan-Meier曲线。E:基于风险值的全部早期LUAD患者的OS的Kaplan-Meier曲线。
具体实施方式
以下的实施例便于更好地理解本发明,但并不限定本发明。下述实施例中的实验方法,如无特殊说明,均为常规方法。下述实施例中所用的试验材料,如无特殊说明,均为自常规生化试剂商店购买得到的。以下实施例中的定量试验,均设置三次重复实验,结果取平均值。
下述实施例中的复发率定义为发生原位复发、远处转移的患者占入组患者的比例。
下述实施例中的总生存期(Overall Survival,OS)定义为从入组至任何原因导致的死亡或末次随访时间。
下述实施例中的总生存率定义为患者从某一特定时点开始随访,到某一特定时间尚能生存的概率。
下述实施例中的无病生存期(recurrence free survival,RFS)定义为从入组至局部复发,或远处转移,或任何原因导致的死亡,或末次随访时间。
下述实施例中的无病生存率定义为患者从某一特定时点开始随访,到某一特定时间尚未发生局部复发或者转移的概率。
下述实施例中的早期肺腺癌患者是指TNM分期的I-II期肺腺癌患者。
实施例1、基于免疫基因建立的早期肺腺癌复发标志物模型IBRS及模型验证
本发明以由338例肺腺癌患者构成的TCGA早期肺腺癌队列构建早期肺腺癌复发标志物模型IBRS,并通过由226例肺腺癌患者构成的GSE31210早期肺腺癌队列和由68例早期肺腺癌患者冰冻组织构成的独立组对构建的模型进行验证。早期肺腺癌患者的临床特征如表1所示。
表1、早期肺腺癌患者的临床特征
Figure BDA0002418459850000051
注:WT(wild-type)代表野生型;MUT(mutation)代表突变型;NA(not available)代表不可用。
一、用TCGA早期肺腺癌队列构建模型IBRS及预后方法
1、早期肺腺癌复发标志物模型IBRS的构建
构建早期肺腺癌复发标志物模型IBRS的流程图如表1所示。具体步骤如下:
1)以来自人类癌症基因组图谱(TCGA)的553例原发肺腺癌(LUAD)患者作为作为TCGA训练集。剔除475个未匹配基因和142个低表达基因(一半或超过一半表达量为0),AmiGO2的3104个免疫相关基因中的2487个匹配到TCGA训练集。
2)从TCGA训练集的553例患者中选择带有复发数据的338例早期(I-II期病人)肺腺癌患者用于预复发分析。
3)为了建立早期肺腺癌患者的复发标志物模型,采用单变量Cox比例回归模型,研究免疫相关基因对无病生存期(RFS)预后指标的影响。结果表明:2487个免疫相关基因中的232个关键基因与无病生存期(RFS)在统计学上相关。GO和KEGG分析提示了这些关键基因参与的生物学过程和相关通路。GO分析表明这些关键基因参与天然免疫反应、白细胞迁移和T细胞受体信号通路。KEGG通路显示这些关键基因与癌症相关过程、炎症通路有关。
4)为了更好地建立早期肺腺癌患者的复发标志物模型,采用LASSO Cox回归模型评估最有用的预后基因,初步纳入了如下11个基因:TGFBR1、DYNC1I2、LGR4、THOC1、ADAM10、SERPINB6、CCL20、WNT2B、SLC11A1、MAPT和PSEN1。
5)为了使复发标志物模型更加优化和实用,采用逐步Cox比例风险回归模型,最终构建出一个包括如下9个基因的预后模型:DYNC1I2(NM_001271785.2)、THOC1(NM_005131.3)、ADAM10(NM_001320570.2)、SERPINB6(NM_001195291.3)、CCL20(NM_001130046.2)、WNT2B(NM_001291880.1)、SLC11A1(NM_000578.4)、MAPT(NM_001123066.3)、PSEN1(NM_000021.4)。如下九个基因:DYNC1I2、THOC1、ADAM10、SERPINB6、CCL20、WNT2B、SLC11A1、MAPT、PSEN1构成本发明的早期肺腺癌患者的复发标志物模型,并将其记作IBRS模型。
2、早期肺腺癌复发标志物模型IBRS的预后方法
1)检测TCGA早期肺腺癌队列(338例早期肺腺癌患者)中每个肺腺癌患者的肺腺癌组织中的九个基因的相对表达量。具体检测方法如下:将获取的冰冻组织进行RNA抽提;将抽提出的RNA反转录成对应的cDNA;以反转录后的cDNA为模板进行荧光定量PCR。以GAPDH作为内参基因,记录每个反应的Ct值,检测结果以ΔCt表示,其中ΔCt=CtGene-CtGAPDH。各个目的基因和GAPDH基因的检测引物序列如表2所示。
表2、引物序列
基因名称 上游引物 下游引物
GAPDH 5'-GGAGCCAAAAGGGTCATCATCTC-3' 5'-GAGGGGCCATCCACAGTCTTCT-3'
DYNC1I2 5'-TAGGACGCTGCATTGGGATAC-3' 5'-TCGACTTGCGTGATTTTAGCC-3'
THOC1 5'-GAAAAATGAAGGTTGCCCAAGTT-3' 5'-TTGTCTCTGATTTACAGGCTTCC-3'
ADAM10 5'-TTTCAACCTACGAATGAAGAGGG-3' 5'-TAAAATGTGCCACCACGAGTC-3'
SERPINB6 5'-TCACCGAAGTGAACAAGACTGG-3' 5'-GCTTGGTAGAATTTTTGGCAGG-3'
CCL20 5'-TGCTGTACCAAGAGTTTGCTC-3' 5'-CGCACACAGACAACTTTTTCTTT-3'
WNT2B 5'-CGGGACCACACCGTCTTTG-3' 5'-GCGAGTAATAGCGTGGACTAC-3'
SLC11A1 5'-CGTGGCGGGATTCAAACTTCT-3' 5'-CACCTTAGGGTAGTAGAGATGGC-3'
MAPT 5'-CCAAGTGTGGCTCATTAGGCA-3' 5'-CCAATCTTCGACTGGACTCTGT-3'
PSEN1 5'-ACAGGTGCTATAAGGTCATCCA-3' 5'-CAGATCAGGAGTGCAACAGTAAT-3'
2)根据每个患者的相对表达量结果依照如下公式计算每个患者的风险值:风险值=(0.3987×DYNC1I2基因相对表达量)-(0.5611×THOC1基因相对表达量)+(0.2405×ADAM10基因相对表达量)-(0.6713×SERPINB6基因相对表达量)+(0.1268×CCL20基因相对表达量)-(0.2408×WNT2B基因相对表达量)-(0.2255×SLC11A1基因相对表达量)-(0.2034×MAPT基因相对表达量)+(0.6942×PSEN1基因相对表达量)。
每个患者对应的九个基因的相对表达量及风险值的检测结果如表3所示。
表3、TCGA早期肺腺癌队列患者的相对表达量及风险值的检测结果
Figure BDA0002418459850000061
Figure BDA0002418459850000071
Figure BDA0002418459850000081
Figure BDA0002418459850000091
Figure BDA0002418459850000101
Figure BDA0002418459850000111
Figure BDA0002418459850000121
Figure BDA0002418459850000131
3)根据每个患者的风险值将TCGA训练集的患者(338例早期肺腺癌患者)分为高风险组(N=148)和低风险组(N=190)。具体方法如下:
通过R语言软件的“survminer”软件包的“surv_cutpoint”功能确定阈值,比较待预测肺腺癌患者的风险值和阈值的大小,风险值大于阈值的患者被列入高风险组,风险值小于或等于阈值的患者被列入低风险组。通过R语言软件的“survminer”软件包的“surv_cutpoint”确定阈值的具体方法如下:将待预测肺腺癌患者的风险值与匹配的预后信息,输入至R语言软件中,在“survminer”软件包的“surv_cutpoint”的算法下,软件会自动计算出P值最小的分割点,该分割点即为高风险组和低风险组的阈值(最优cutoff点),
按照上述方法确定的阈值为-0.7963,风险值大于-0.7963的早期肺腺癌患者被列入高风险组,风险值小于或等于-0.7963的早期肺腺癌患者被列入低风险组。
3、早期肺腺癌复发标志物模型IBRS的有效性验证
1)利用Kaplan-Meier分析患者(338例早期肺腺癌患者)预后无病生存率RFS。Kaplan-Meier生存分析结果显示,高风险组患者的无病生存率明显低于低风险组患者(图2B),P<0.0001)。
2)为了评估本发明的早期肺腺癌复发标志物模型IBRS的预测效力,进一步计算了ROC曲线下面积,在TCGA训练集(338例早期肺腺癌患者)中,早期肺腺癌复发标志物模型IBRS对于1年、3年、5年复发预测的曲线下面积分别为0.775、0.789和0.789(图2C)。说明早期肺腺癌复发标志物模型IBRS在预测早期LUAD患者复发方面表现良好。
3)选择TCGA训练集患者(338例早期肺腺癌患者)中的I期病人,早期肺腺癌复发标志物模型IBRS可以把患者分为RFS显著不同的亚组(图2D)。同样,在II期病人中也达到相似的效果(图2E)。同时,不管是在总体还是I/II期LUAD患者中,高风险组患者的生存率明显低于低风险组患者(图3)。
二、在GSE31210队列中验证模型
1、在GSE31210队列中验证模型
为了验证本发明的早期肺腺癌复发标志物模型IBRS在其它人群中是否起作用,将来自肺癌基因芯片数据(GSE31210)的226例早期LUAD患者作为验证集。按照步骤一的2中的方法检测GSE31210中每个患者的九个基因的相对表达量、计算风险值,并将患者分为高风险组(N=61)和低风险组(N=165)(图4A)(阈值为-1.3408)。GSE31210队列患者的相对表达量及风险值的检测结果如表4所示。
表4、GSE31210队列患者的相对表达量及风险值的检测结果
Figure BDA0002418459850000132
Figure BDA0002418459850000141
Figure BDA0002418459850000151
Figure BDA0002418459850000161
Figure BDA0002418459850000171
采用Kaplan-Meier生存分析法分析高风险组和低风险组患者的无病生存率RFS和总生存率OS差异。
Kaplan-Meier生存分析显示,低风险组患者的无病生存率明显高于高风险组患者(图4B,p<0.0001)。在I期患者中,高风险或低风险组患者的RFS也有显著区别(图4C,p<0.0001)。然而,在II期患者中,免疫相关基因标志物仅显示的临界差异RFS,这可能是因为样本量有限(图4D,p=0.16)。
Kaplan-Meier生存分析显示,低风险组患者的总生存率也明显高于高风险组患者(图4E,p<0.0001)。在I期患者中,低风险组患者的总生存率也明显高于高风险组患者(图5,p<0.0001)。
2、在不同的临床亚组中验证模型
为了探讨本发明的早期肺腺癌复发标志物模型IBRS是否可以预测具有同一临床特征患者的复发,在不同的临床亚组中进行分层分析。考虑到吸烟是发展肺腺癌的最大风险因素之一,但其他因素包括性别和年龄也起到一定作用,在TCGA训练集(338例早期肺腺癌患者)或GSE31210验证集(226例早期LUAD患者)中将LUAD患者按照三个临床特征(性别,吸烟史和年龄)分层。然后使用Kaplan-Meier生存分析估计高风险组和低风险组之间的无病生存率RFS和总生存率OS差异。
TCGA训练集中患者分层分析结果显示,在所有亚组(男性和女性,吸烟者和非吸烟者,年龄较大(年龄>60岁)和年龄较小(年龄<60岁))中,与低风险组患者相比,高风险组患者的RFS更短(图6,p<0.0001),且低风险组患者的OS也显著高于高风险组(图7,p<0.05)。
GSE31210验证集中患者分层分析结果显示与TCGA训练集一致,所有六个亚组的低风险组患者的RFS明显高于高风险组患者(图8,p<0.05)。同时Kaplan-Meier生存分析显示,高风险组患者OS更短(图9,p<0.05),充分证明了本发明的早期肺腺癌复发标志物模型IBRS在临床亚组中的预测能力。
3、在不同的EGFR或KRAS突变状态下验证模型
鉴于EGFR和KRAS是肺腺癌中常见的突变基因且与不同的肿瘤免疫微环境相关,对早期肺腺癌复发标志物模型IBRS在不同EGFR和KRAS突变状态的患者中的预测能力进行分析。在TCGA训练集(338例早期肺腺癌患者)或GSE31210验证集(226例早期LUAD患者)中将LUAD患者按照EGFR基因或KRAS基因的野生型和突变型进行分层。然后使用Kaplan-Meier生存分析估计高风险组和低风险组之间的无病生存率RFS和总生存率OS差异。
TCGA训练集中不同突变状态下高风险组和低风险组患者的分布(基于全部患者的优化风险值)结果表明,与EGFR野生型(EGFR-WT)组相比,EGFR突变(EGFR-MUT)组显示出较高比例的低风险患者。相反,与KRAS野生型(KRAS-WT)组相比,KRAS突变(KARS-MUT)组显示出更高比例的高风险患者(图10A)。在不同的突变状态中,低风险组患者的RFS显著高于高风险组(图10B,C,D和E,p<0.05),低风险组患者的OS也显著高于高风险组患者(图11A,B,C,D和E,p<0.05)。
GSE31210验证集中,高风险患者也更多地集中在EGFR-WT组或EGFR-MUT组中(图12A)。此外,在GSE31210验证集中,早期肺腺癌复发标志物模型IBRS在不同突变状态中的预后预测作用也得到了充分证实。在基于突变状态的不同分层组中,高风险组患者比低风险组患者具有较短的RFS(图12,C,D和E,p<0.05)和OS(图13A,B,C,D和E),p<0.05)。
三、在68例早期肺腺癌冰冻组织的独立队列中进行验证
为了在临床实践中评估IBRS在预测早期LUAD患者发生肿瘤复发风险中的准确性,在包含68个早期肺腺癌冰冻组织的独立队列中进行验证。
按照步骤一的2中的方法检测68个早期肺腺癌冰冻组织中每个患者的九个基因的相对表达量、计算风险值,并将患者分为高风险组(N=34)和低风险组(N=34)(图14A)(阈值为-1.8481)。68例早期肺腺癌患者冰冻组织中九个基因的相对表达量检测结果及风险值的计算结果如表5所示。
表5、68例早期肺腺癌患者的相对表达量及风险值的检测结果
Figure BDA0002418459850000191
Figure BDA0002418459850000201
采用Kaplan-Meier生存分析法分析高风险组和低风险组患者的无病生存率RFS和总生存率OS差异。
Kaplan-Meier生存分析显示:高风险组患者和低风险组患者之间的RFS有显着差异(图14B,p<0.0001)。同时,早期肺腺癌复发标志物模型IBRS可以将I,II期LUAD患者分为RFS明显不同的高风险组和低风险组(图14C和D,p<0.05)。高风险组患者的OS显著低于低风险组患者(图14E,p<0.0001)。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.肺腺癌患者预后***,包括检测DYNC1I2、THOC1、ADAM10、SERPINB6、CCL20、WNT2B、SLC11A1、MAPT、PSEN1九种基因表达量的***。
2.根据权利要求1所述的***,其特征在于:所述检测DYNC1I2、THOC1、ADAM10、SERPINB6、CCL20、WNT2B、SLC11A1、MAPT、PSEN1九种基因表达量的***包括通过荧光定量PCR方法检测所述九种基因相对表达量所需的试剂和/或仪器。
3.根据权利要求1或2所述的***,其特征在于:所述***还包含数据处理装置;所述数据处理装置内设模块;所述模块具有如下(a1)和(a2)所示的功能:
(a1)以肺腺癌患者组成的待测群体的离体肺腺癌组织为标本,测定每份标本中所述九种基因的相对表达量,然后根据所述九种基因相对表达量按照如下公式计算风险值:风险值=(0.3987 × DYNC1I2基因相对表达量) - (0.5611 × THOC1基因相对表达量) +(0.2405 × ADAM10基因相对表达量) - (0.6713 × SERPINB6 基因相对表达量) +(0.1268 × CCL20 基因相对表达量) - (0.2408 × WNT2B基因相对表达量) - (0.2255× SLC11A1基因相对表达量) - (0.2034 × MAPT 基因相对表达量) + (0.6942 ×PSEN1 基因相对表达量),并根据所述风险值将所述待测群体分为低风险组和高风险组;
(a2)按照如下标准确定来自于所述待测群体的待测患者的预后风险和/或预后复发率和/或预后无病生存率和/或预后总生存率:“来自于所述高风险组中的待测患者”的预后风险和/或预后复发率高于或候选高于“来自于所述低风险组中的待测患者”;“来自于所述低风险组中的待测患者”的预后无病生存率和/或总生存率高于或候选高于“来自于所述高风险组中的待测患者”。
4.根据权利要求1-3任一所述的***,其特征在于:所述肺腺癌患者为早期肺腺癌患者。
5.根据权利要求4所述的***,其特征在于:所述早期肺腺癌患者为I期肺腺癌患者和/或II期肺腺癌患者。
6.权利要求1-5任一所述的***在如下(1)-(4)中的应用:
(1)制备用于肺腺癌患者预后风险评估的产品;
(2)制备用于肺腺癌患者预后复发率评估的产品;
(3)制备用于肺腺癌患者预后无病生存率评估的产品;
(4)制备用于肺腺癌患者预后总生存率的产品。
7.根据权利要求6所述的应用,其特征在于:所述肺腺癌患者为早期肺腺癌患者。
8.根据权利要求7所述的应用,其特征在于:所述早期肺腺癌患者为I期肺腺癌患者和/或II期肺腺癌患者。
9.DYNC1I2、THOC1、ADAM10、SERPINB6、CCL20、WNT2B、SLC11A1、MAPT、PSEN1九种基因作为标志物在制备肺腺癌患者预后的产品中的应用。
10.检测DYNC1I2、THOC1、ADAM10、SERPINB6、CCL20、WNT2B、SLC11A1、MAPT、PSEN1九种基因表达量的物质在制备肺腺癌患者预后的产品中的应用。
CN202010198413.0A 2020-03-19 2020-03-19 早期肺腺癌患者预后评估***及其应用 Active CN111394456B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010198413.0A CN111394456B (zh) 2020-03-19 2020-03-19 早期肺腺癌患者预后评估***及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010198413.0A CN111394456B (zh) 2020-03-19 2020-03-19 早期肺腺癌患者预后评估***及其应用

Publications (2)

Publication Number Publication Date
CN111394456A CN111394456A (zh) 2020-07-10
CN111394456B true CN111394456B (zh) 2022-12-02

Family

ID=71427343

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010198413.0A Active CN111394456B (zh) 2020-03-19 2020-03-19 早期肺腺癌患者预后评估***及其应用

Country Status (1)

Country Link
CN (1) CN111394456B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112946276B (zh) * 2021-03-02 2022-06-21 中国医学科学院肿瘤医院 I期肺腺癌患者术后复发风险预测***及其应用
CN113151471B (zh) * 2021-04-28 2022-08-12 复旦大学附属中山医院 用于检测肺腺癌kras突变的基因组合物、试剂盒和方法
CN113450874A (zh) * 2021-07-19 2021-09-28 中日友好医院(中日友好临床医学研究所) 预测ipf患者预后的8基因模型及应用
CN113862354B (zh) * 2021-09-23 2023-11-24 中国医学科学院肿瘤医院 用于预测局限期小细胞肺癌患者预后的***及其应用
CN114657245B (zh) * 2021-11-26 2022-10-04 中南大学湘雅二医院 基因的应用、预测i期非小细胞肺癌术后复发转移的模型及其构建方法
CN114480644A (zh) * 2022-01-07 2022-05-13 深圳市龙华区人民医院 肺腺癌基于代谢基因的分子分型
CN114934117A (zh) * 2022-05-31 2022-08-23 深圳市陆为生物技术有限公司 评价肺癌患者复发风险的产品

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080166729A1 (en) * 2007-01-09 2008-07-10 Samsung Electronics Co., Ltd. Method of predicting risk of lung cancer recurrence, and a composition, kit and microarray for the same
US20100267574A1 (en) * 2006-10-20 2010-10-21 The Washington University Predicting lung cancer survival using gene expression
CN109385478A (zh) * 2018-12-20 2019-02-26 首都医科大学附属北京朝阳医院 检测19-gcs的基因标记在制备用于诊断早期肺腺癌预后的产品中的应用
CN110499364A (zh) * 2019-07-30 2019-11-26 北京凯昂医学诊断技术有限公司 一种用于检测扩展型遗传病全外显子的探针组及其试剂盒和应用

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100267574A1 (en) * 2006-10-20 2010-10-21 The Washington University Predicting lung cancer survival using gene expression
US20080166729A1 (en) * 2007-01-09 2008-07-10 Samsung Electronics Co., Ltd. Method of predicting risk of lung cancer recurrence, and a composition, kit and microarray for the same
CN109385478A (zh) * 2018-12-20 2019-02-26 首都医科大学附属北京朝阳医院 检测19-gcs的基因标记在制备用于诊断早期肺腺癌预后的产品中的应用
CN110499364A (zh) * 2019-07-30 2019-11-26 北京凯昂医学诊断技术有限公司 一种用于检测扩展型遗传病全外显子的探针组及其试剂盒和应用

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Development and Validation of an Individualized Immune Prognostic Signature in Early-Stage Nonsquamous Non–Small Cell Lung Cancer;Bailiang Li等;《JAMA Oncology》;20171231;第3卷(第11期);第1529–1537页 *

Also Published As

Publication number Publication date
CN111394456A (zh) 2020-07-10

Similar Documents

Publication Publication Date Title
CN111394456B (zh) 早期肺腺癌患者预后评估***及其应用
US7666595B2 (en) Biomarkers for predicting prostate cancer progression
Sivendran et al. Dissection of immune gene networks in primary melanoma tumors critical for antitumor surveillance of patients with stage II–III resectable disease
CN111676288B (zh) 用于预测肺腺癌患者预后的***及其应用
JP2008521412A (ja) 肺癌予後判定手段
JP2015535176A (ja) 肝細胞癌における全生存期間および無再発生存期間の新規な予測方法
CN111653314B (zh) 一种分析识别***浸润的方法
CN111564214A (zh) 一种基于7个特殊基因的乳腺癌预后评估模型的建立与验证方法
KR101950717B1 (ko) 유방암 환자의 화학치료 유용성 예측 방법
JP2011525106A (ja) 瀰漫性b大細胞型リンパ腫のマーカーおよびその使用方法
CN111128385A (zh) 一种用于食管鳞癌的预后预警***及其应用
CN107532208A (zh) 用于测定子宫内膜癌预后的组合物和方法
CN113234829A (zh) 结肠癌预后评估基因集及其构建方法
US20110275089A1 (en) Methods for predicting survival in metastatic melanoma patients
WO2016118670A1 (en) Multigene expression assay for patient stratification in resected colorectal liver metastases
CN116206681A (zh) 一种免疫浸润细胞模型的预后基因对价值评价方法
Chen et al. ZC3H12A expression in different stages of colorectal cancer
CN113355426B (zh) 用于预测肝癌预后的评估基因集及试剂盒
CN115798703A (zh) 基于新型脂肪酸代谢相关基因预测肾透明细胞癌预后的装置和计算机可读存储介质
CN106119406A (zh) 多发性肉芽肿血管炎及微小动脉炎的基因分型诊断试剂盒及使用方法
CN115612740A (zh) 一组用于三阴性乳腺癌免疫组化分型的基因及其应用
CN113862354B (zh) 用于预测局限期小细胞肺癌患者预后的***及其应用
EP2596131A2 (en) Gene expression profiling for the identification of lung cancer
Zhang et al. Comprehensive analysis of a novel RNA modifications-related model in the prognostic characterization, immune landscape and drug therapy of bladder cancer
CN117165682B (zh) 用于乳腺癌新辅助化疗获益和/或预后评估的标志物组合及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant