CN116013403A - ***甲基化相关长链非编码rna预后及免疫治疗疗效预测模型的构建方法和用途 - Google Patents

***甲基化相关长链非编码rna预后及免疫治疗疗效预测模型的构建方法和用途 Download PDF

Info

Publication number
CN116013403A
CN116013403A CN202211516235.7A CN202211516235A CN116013403A CN 116013403 A CN116013403 A CN 116013403A CN 202211516235 A CN202211516235 A CN 202211516235A CN 116013403 A CN116013403 A CN 116013403A
Authority
CN
China
Prior art keywords
prognosis
risk
cervical cancer
patients
methylation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202211516235.7A
Other languages
English (en)
Inventor
郭亚
杨彭涛
王中卫
何赟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Second Affiliated Hospital School of Medicine of Xian Jiaotong University
Original Assignee
Second Affiliated Hospital School of Medicine of Xian Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Second Affiliated Hospital School of Medicine of Xian Jiaotong University filed Critical Second Affiliated Hospital School of Medicine of Xian Jiaotong University
Priority to CN202211516235.7A priority Critical patent/CN116013403A/zh
Publication of CN116013403A publication Critical patent/CN116013403A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明开发并公开***甲基化相关长链非编码RNA预后及免疫治疗疗效预测模型的构建方法和用途。采用Pearson相关性算法筛选RNA甲基化相关lncRNAs。单因素及多因素回归分析构建***RNA甲基化相关IncRNA的预后模型。绘制ROC及Kaplan‑Meier生存曲线、构建Nomo模型及绘制Calibration图、进行独立预后分析来评估模型的准确性。评估风险模型与临床特征、免疫细胞浸润、肿瘤突变负荷(TMB)、免疫功能、免疫治疗相关分子间的相关性。最后,采用在线数据库评估甲基化关键lncRNAs的预后及免疫治疗价值,计算IC50来预测基于目标风险模型的新型药物的有效性。总之,该预后及免疫治疗疗效预测模型可用于指导预后及制定个体化的治疗策略,并可根据预后模型中的关键分子进一步开发***诊治和预后相关的产品。

Description

***甲基化相关长链非编码RNA预后及免疫治疗疗效预测模型的构建方法和用途
技术领域
本发明涉及生物医学技术领域,尤其涉及***甲基化相关长链非编码RNA预后及免疫治疗疗效预测模型的构建方法。
背景技术
***(CC)是女性第四大最常见的癌症,最新研究报告指出每年约有57万个新发病例和31万个死亡病例。目前,手术或者放化疗是***最初的治疗模式。近年来,结合综合的治疗方法(包括手术、化放疗和免疫疗法),晚期***患者的临床预后虽明显改善,但仍不乐观。晚期***患者的5年生存率仅有17%。鉴于***对妇女的健康和生命构成严重威胁,确定有用的预测性生物标志物和治疗目标似乎势在必行。
晚期或转移性***的预后很差。以前的研究发现,在***的癌前病变和鳞状细胞癌中存在高危HPV感染和PD-L1表达升高有关。PD-L1高表达的患者预后较差。一些临床研究证明了PD-1/PD-L1抑制剂的初步安全性和有效性。目前正在进行的单药治疗和联合治疗试验,使用不同的免疫检查点抑制剂、聚腺苷二磷酸核糖聚合酶抑制剂、肿瘤血管生成抑制剂(即贝伐珠单抗)、抗体药物结合物、治疗性疫苗和肿瘤浸润性T淋巴细胞(采用免疫疗法)。这些新模式中的一些也正在与标准的铂类化疗方案进行联合评估。目前,pembrolizumab被批准用于治疗一线化疗后复发或转移的程序性死亡配体1(PD-L1)阳性***。总之,免疫疗法,特别是免疫检查点抑制剂(ICI)在晚期实体瘤中取得了初步成功,而在晚期或转移性***中的疗效和安全性仍有待探索。探索一种能够预测***患者免疫治疗疗效的分子标志物,对应提高免疫治疗效果及安全性具有重要的意义。
N6-甲基腺苷(m6A)、N1-甲基腺苷(m1A)和5-甲基胞嘧啶(m5C)及N7-甲基鸟苷(m7G)是RNA甲基化最常见的类型。RNA甲基化的改变通过与lncRNAs相互作用对特定的生物过程产生影响。另一方面,lncRNAs也可以影响参与RNA甲基化修饰的基因的功能。RNA修饰在癌症进展中具有重要的调节功能,这些改变可能为癌症诊断和治疗提供新的生物标志物近期研究表明:RNA甲基化与促进癌细胞增殖、侵袭性和转移有关。研究发现m6A与肿瘤的增殖、迁移和耐药性有关,并被确定为肿瘤的预后标志物。在HCC组织中,总的m6A及其调节因子水平的异常变化与不利的生存状况密切相关。m6A及其调节因子在恶性肿瘤中起着致癌基因或抗癌基因的作用。研究发现m5C修饰在肿瘤进展中起重要作用,可作为癌症治疗的有效生物标志物。m1A甲基化修饰加速肿瘤进展及影响预后。目前,上述RNA甲基化相关的长非编码RNA(lncRNAs)对治疗***的预后价值和免疫疗法的有效性的影响仍是未知的。因此,研究RNA甲基化在***中的作用并初步探讨其在***中的预后价值至关重要。
长链非编码RNA(IncRNA)被定义为非编码长度≥200个核苷酸的RNA。研究表明lncRNAs很有希望成为癌症的新型生物标志物和治疗靶点。然而,目前还没有研究探索***与RNA甲基化修饰相关的lncRNAs之间的相关性。其次,RNA甲基化相关的长非编码RNAs(lncRNAs)对***的预后价值和免疫疗法的有效性的影响仍是未知的。因此,临床上迫切需要构建***风险分层的关键相关lncRNAs模型,以期这些关键的RNA甲基化lncRNAs模型能够预测***患者的预后、对免疫治疗的反应性和药物敏感性,协助制定更精确和个性化的治疗策略。
发明内容
拟解决的技术问题
基于上述问题,本发明提供一种***RNA甲基化相关的长链非编码RNA预后及免疫治疗疗效预测模型的构建方法。拟解决RNA甲基化相关的IncRNA对于预测宫颈啊癌患者的预后及免疫治疗疗效没有准确可靠的分子指标问题。此项发明的开展为***患者的预后及免疫治疗疗效的评估提供可靠的生物标志物,从而有助于提高***患者预后及免疫治疗疗效的评测能力、实现早期干预和个体化治疗策略的制定。
为了达到如上目的,本发明采取如下技术方案:
一种***(CervicalCancer,CC)RNA甲基化相关的长链非编码RNA(IncRNA)预后及免疫治疗疗效预测的模型。本发明首先从TCGA数据库收集***患者的转录组数据、肿瘤突变数据及相关的临床资料。进一步从已发表研究中获取55个RNA甲基化关键分子,采用皮尔逊相关性算法筛选RNA甲基化相关IncRNAs。
采用单因素回归分析及多因素回归方法构建***RNA甲基化相关IncRNA的预后模型。采用ROC曲线和绘制Kaplan-Meier生存曲线评估预后模型的准确性。构建关键RNA甲基化IncRNAs与甲基化分子共表达网络。分析评估风险模型与临床特征、免疫细胞浸润、肿瘤突变负荷(TMB)、免疫功能、免疫治疗相关分子间的相关性。TIDE数据库评价高低风险组患者免疫治疗疗效差异。最后,采用GEPIA,Lnc2Cancer3.0,GEPIA2,GEPIA2021及TIGER在线数据库验证筛选出的RNA甲基化关键lncRNAs的预后及免疫治疗价值。进一步通过计算IC50来预测基于目标风险模型的新型药物的有效性。本发明的预后及免疫治疗预测模型可用于指导预后及制定个体化的治疗策略,并可根据预后模型中的关键分子进一步开发***诊治和预后相关的产品。
采用如上技术方案的本发明,相对于现有技术有如下有益效果:本发明上述技术方案具有以下特点:
1)本发明在TCGA数据库中提取***患者的转录组数据、肿瘤突变数据及相关的临床资料。从已发表研究中获取55个RNA甲基化关键分子。进一步采用皮尔逊相关性算法筛选RNA甲基化相关IncRNAs。采用单因素回归分析及多因素回归方法构建***RNA甲基化相关IncRNA的预后模型。采用ROC曲线、绘制Kaplan-Meier生存曲线及计算一致性指数(C-index)以评估预后模型的准确性。
构建关键RNA甲基化IncRNAs与甲基化分子共表达网络。分析评估风险模型与临床特征、免疫细胞浸润、肿瘤突变负荷(TMB)、免疫功能、免疫治疗相关分子间的相关性。TIDE数据库评价高低风险组患者免疫治疗疗效差异。通过计算IC50来预测基于目标风险模型的新型药物的有效性。最后,采用GEPIA和Lnc2Cancer3.0在线数据库验证关键RNA甲基化相关lncRNAs的预后价值。本发明的开展,可以合理、可靠地筛选出RNA甲基化相关IncRNAs分子标志物,构建RNA甲基化相关lncRNAs的风险评分模型,此风险评分模型对于预测CC患者的预后、对免疫疗法的反应性和药物敏感性、协助制定更精确和个性化的治疗策略具有重要的意义。
2)本发明构建的RNA甲基化相关lncRNAs预后风险模型能独立于其他临床因素(年龄、性别、分期、分级、T分期及N分期等)准确的预测1年、3年和5年***患者的预后。
3)与现有技术相比,本发明考虑到RNA甲基化和lncRNAs在***生物学中的重要意义,确定了一个与RNA甲基化相关的lncRNAs风险模型来预测CC患者的预后、对免疫疗法的反应性和药物敏感性。
能够对CC样本的预后进行较为精准的判定;通过更加准确地提取对RNA甲基化相关的lncRNAs,使所选择出的与RNA甲基化相关的lncRNAs可以反应大部分***患者样本的情况,从而使得最终的预后模型具有普适性,使得更多的***患者受益。
附图说明
为了进一步说明本发明,下面结合附图进一步进行说明:
图1为本发明实施流程;
图2A到图2F为***患者中RNA甲基化相关lncRNAs的筛选
图3A到图3E为为KM曲线评估5个关键RNA甲基化lncRNAs预后价值;
图3F到图3I为ROC曲线验证模型准确性;
图3J到图3K单因素及多因素回归分析风险评分独立预后特征;
图3L到图3M构建Nomogram模型及绘制Calibration图进一步验证模型准确性;
图4A到图4O为风险评分与临床特征的相关性分析;
图5A到图5I为风险评分与免疫细胞浸润、肿瘤突变负荷及免疫特征间相关性;
图6A到图6I为RNA甲基化关键lncRNAs的预后及免疫治疗的疗效评估;
图7A到图7K为预测基于目标风险模型的新型药物的有效性及验证RNA甲基化相关的关键lncRNAs的预后价值;
图8表1RNA甲基化相关基因;
图9表2单因素回归分析筛选出8个与RNA甲基化相关的IncRNAs;
图10表3多因素回归分析筛选出5个与RNA甲基化相关的IncRNAs;
图11表4FAM27E3和SOX21-AS1与CC患者免疫治疗疗效有关。
具体实施方式
1)数据收集与准备
TCGA数据库(https://portal.gdc.cancer.gov/)下载***患者的转录组数据、TMB数据和对应的临床数据。包306个***样本和3个正常人的基因表达谱。数据后处理和临床信息提取使用编程语言(strawberry-perl-5.32.0.1-64bit.msi,http://www.perl.org)。蛋白质编码基因和IncRNA使用Ensembl人类基因组进行注释和分类浏览器GRCh38.p13(http://asia.ensembl.org/index.html)。
2)RNA甲基化IncRNAs筛选
已发表文献获取55个与RNA甲基化相关分子(表1)。通过计算Pearson相关系数获得RNA甲基化相关IncRNAs,筛选标准为相关系数>0.4且P值<0.001。本发明筛选出了208个RNA甲基化相关IncRNAs。RNA甲基化相关基因与208个IncRNAs间相互作用共表达网络见图2A。
3)RNA甲基化IncRNAs预后模型构建
运行R语言中的Survival包,甲基化相关IncRNAs进行单变量Cox回归分析,初步筛选预后甲基化相关IncRNAs,P<0.05具有统计学意义。进行多元Cox回归分析并计算每位患者风险评分。将CC患者分为高风险组和低风险组。计算风险得分=N1×coef1+N2×coef2+……Nn×coefn;其中,Nn代表相关差异基因的表达量,coefn代表相关差异基因所对应的回归系数。
本发明中经过单因素回归分析发现8个与***预后相关的甲基化IncRNAs(表2)。多因素回归分析发现:FAM27E3,AC024270.3,AC096992.2,SOX21-AS1和AC012306.2与***患者预后相关。其中,FAM27E3,AC024270.3,AC096992.2,SOX21-AS1与***患者良好预后相关,AC012306.2是***患者的不良预后因素(表3)。
图2B显示筛选出5个RNA甲基化相关IncRNA与RNA甲基化基因间存在相互作用。图2C-E显示风险水平、病例生存状态和模型lncRNA表达水平。KM生存分析发现高风险组较低风险组预后差(图2F)。
4)评估模型的准确性
绘制五个RNA甲基化关键的IncRNAs的Kaplan-Meier生存曲线。采用timeROC软件包,绘制1年、3年和5年ROC曲线、计算曲线下面积(AUC)和C-index指数评估模型的预测能力。AUC值范围从0.5到1.0。AUC=0.5,表示没有任何预测价值,AUC在0.5-0.7之间代表预测的准确度低,AUC在0.7-0.9之间表示预测的准确度中等,AUC>0.9代表越策准确度高。
C-index值的范围为0.5-1.0之间。单因素和多因素Cox回归分析用于确定风险评分是否能够独立于其他临床因素(年龄、性别、分期、分级等)准确的预测3年和5年CC患者的预后。HR>1且P值小于0.05代表预后不良因素。HR<1且P值小于0.05表示预后有利因素。构建Nomo模型预测患者1、3、5年预后及绘制提名图评估Nomo模型准确性。
本发明提示:Kaplan-Meier生存曲线进一步证实FAM27E3,AC024270.3,AC096992.2,SOX21-AS1与***患者良好预后相关,AC012306.2是***患者的不良预后因素(图3A-E)。ROC曲线结果表明:1年、3年、5年的AUC分别是0.782和0.717和0.763(图3F)。ROC曲线分析发现risk-score能独立于其他临床因素预测***患者的1、3、5年预后(图3G-I)。单因素和多因素独立预后分析提示:本发明构建的预后风险模型能独立于其他预后因素准确的评估患者预后(图3J-K)。基于riskscore构建的Nomo模型及绘制Calibration图发现风险模型能够准确预测患者1、3、5年预后(图3L-M)。
5)Riskscore和临床相关性分析
本研究基于R语言中limma和ggpubr包分析了不同年龄、分级、分期、T和N分期之间风险评分差异。进一步分析了不同年龄、分级、分期、T和N分期***患者的预后差异。结果表明:不同年龄、分级、分期、T和N分期之间风险评分未见明显差异,但是StageIII-IV较StageI-II,T3-4较T1-2风险评分高的趋势(图4A-E)。在GradeII-IV和T1-2的CC患者中高风险CC患者较低风险CC患者的预后差,而在不同年龄、GradeI-II,T3-4和N分期之间高低风险组患者的生存无差异(图4F-O)。这些结果进一步表明高风险评分的CC患者预后较低风险的CC患者预后差。6)风险评分与免疫细胞浸润、肿瘤突变负荷及免疫特征间相关性
采用CIBERSORT算法比较高风险和低风险患者的中免疫细胞浸润差异。进一步使用"ggplot2"、"ggpubr"和"ggExtra"R软件包分析了免疫细胞浸润和确定的关键RNA甲基化lncRNAs之间的相关性。通过GEPIA2021(http://gepia2021.cancer-pku.cn/)在线数据库,分析浸润的免疫细胞在高低风险组的生存差异。TMB是用肿瘤特异性基因突变计算的。使用R语言中的"maftools"程序包计算突变数据。所有样本被分为高TMB组和低TMB组,利用这些数据和病人的生存率统计来检查每组病人的生存率。接下来使用四个亚组(高TMB+高风险、高TMB+低风险、低TMB+低风险评分、低TMB+高风险)的生存率来研究风险评分与患者生存率之间的关系。通过使用R软件包"Limma"、"GSVA"、"GSEABase"、"pheatmap"和"reshape2"[22],比较高风险组和低风险组之间免疫相关功能的差异。RNA甲基化相关lncRNAs和典型的免疫检查点分子(包括CD70、TNFSF9、FGL1、CD276、NT5E、HHLA2、VTCN1、TNFRSF18、CD274。PDCDL1LG2、IDO1、CTLA4、ICOS、HAVCR、PDCD1、LAG3、SIGLEC15、TNFSF4、TNFRSF9、ENTPD1、VSIR、ICOSLG、TNFSF14、TMIGD2、CD27、NCR3、BTLA、CD40LG、CD40和TNFRSF4)之间的关系。运用TIDE算法来计算免疫治疗有效的可能性。利用肿瘤免疫治疗基因表达资源的相关矩阵(TIGER,http://tiger.canceromics.org/#/)来检查确定的RNA甲基化相关的lncRNAs是否与已知的免疫治疗反应特征相关。我们进一步使用GEPIA2(http://gepia2.cancer-pku.cn/)来估计我们确定的RNA甲基化相关的lncRNAs与免疫治疗反应特征之间的相关性。
免疫微环境分析显示,幼稚B细胞和CD4+记忆型静止T细胞主要富集在低风险得分组,而活化的NK细胞主要集中在高风险组(图5A)。此外,免疫功能分析发现活性细胞溶解、促炎反应、T细胞相关刺激、免疫检查点、T细胞相关抑制、CCR、MCH-I型、副炎症反应、IFN-I型反应在高低风险中存在差异(图5B)。筛选出的5个RNA甲基化关键IncRNAs与免疫检查点抑制剂存在相关性(图5C)。
TMB是对免疫疗法反应的预测性生物标志物。因此,我们比较了高风险得分组和低风险得分组的TMB差异,并显示了突变率最大的前20个基因(图5D-E)。然而,高风险评分组和低风险评分组之间的TMB没有明显的差异(图5F)。高TMB与CC患者良好的OS有关(图5G),高TMB与低风险评分相结合的CC患者的OS最长(图5H)。低风险组免疫治疗效果更好(图5I)。7)RNA甲基化关键lncRNAs的预后及免疫治疗的疗效评估
采用GEPIA2021(GeneExpressionProfilingInteractiveAnalysis2021,http://gepia2021.cancer-pku.cn/)分析免疫细胞浸润与筛选的RNA甲基化相关的关键IncRNAs之间的相关性,并根据浸润的免疫细胞比例比较两组的生存差异。进一步使用基因表达分析互动分析2(GEPIA2,http://gepia2.cancer-pku.cn/)来估计我们确定的关键RNA甲基化相关lncRNAs和免疫疗法反应特征之间的相关性。肿瘤免疫治疗基因表达资源的相关矩阵(TIGER,http://tiger.canceromics.org/#/)通过将已发表的基因签名应用于我们提供的宫颈鳞癌和宫颈内膜腺癌(CESC)的lncRNAs,预测患者对免疫治疗的反应,并利用基因表达数据与免疫治疗的临床信息比较我们提供的lncRNAs与已知免疫治疗反应签名的性能。
本发明专利表明:AC024270.3、FAM27E3和SOX21-AS1与幼稚B细胞呈正相关。幼稚B细胞与患者的良好的总生存相关,进一步说明高表达AC024270.3、FAM27E3和SOX21-AS1的患者预后好(图6A-D)。我们评估了关键lncRNAs(FAM27E3和SOX21-AS1)对CC患者免疫治疗反应的影响。结果表明:通过应用已发表的基因签名,FAM27E3和SOX21-AS1与CC患者的免疫治疗反应相关(表4)。根据TIGER数据库分析表明在黑色素瘤-GSE91061_anti-PD-1中,FAM27E3的表达在无反应者中高于反应者,FAM27E3的过度表达与总生存期有关(图6E-F)。根据GEPIA2的分析结果:FAM27E3与衰竭的T细胞相关特征呈负相关,影响Treg细胞和静止的Treg细胞特征(图6G-I)。本发明进一步表明:低分组对免疫治疗更敏感,FAM27E3和SOX21-AS1与CC患者免疫治疗的反应明显相关。
8)IC50来预测基于目标风险模型的新型药物的有效性
本专利使用R软件中"pRRophetic"包计算化疗药物的IC50,以评估化疗对***患者的影响,该结果可用于指导具体的治疗。IC50分析发现:低风险组的患者对ABT.263、AKT抑制剂VIII及ATRA更敏感(图7B、C、F)。高风险评分的患者对A.770041、AP.24534、AS601245、AUY922、AZ628、和AZD.0530的IC50值小,表明这些患者对这五种药物更敏感(图7A,D,E,G,H,I)。
9)验证关键RNA甲基化相关lncRNAs的预后价值
采用在线分析数据库GEPIA(http://gepia.cancer-pku.cn/)和Lnc2Cancer3.0(http://bio-bigdata.hrbmu.edu.cn/lnc2cancer)来确认RNA甲基化相关lncRNAs在CC患者中的预后价值。结果进一步证实,FAM27E3和SOX21-AS1高表达与CC患者良好的预后有关(图7J,K)。
本发明有益效果
本发明上述技术方案具有以下特点:
1)本发明在TCGA数据库中提取***患者的转录组数据、肿瘤突变数据及相关的临床资料。从已发表研究中获取55个RNA甲基化关键分子。进一步采用皮尔逊相关性算法筛选RNA甲基化相关IncRNAs。采用单因素回归分析及多因素回归方法构建***RNA
甲基化相关IncRNA的预后模型。采用ROC曲线、绘制Kaplan-Meier生存曲线及计算一致性指数(C-index)以评估预后模型的准确性。
构建关键RNA甲基化IncRNAs与甲基化分子共表达网络。分析评估风险模型与临床特征、免疫细胞浸润、肿瘤突变负荷(TMB)、免疫功能、免疫治疗相关分子间的相关性。TIDE数据库评价高低风险组患者免疫治疗疗效差异。通过计算IC50来预测基于目标风险模型的新型药物的有效性。最后,采用GEPIA和Lnc2Cancer3.0在线数据库验证关键RNA甲基化相关lncRNAs的预后价值。本发明的开展,可以合理、可靠地筛选出RNA甲基化相关IncRNAs分子标志物,构建RNA甲基化相关lncRNAs的风险评分模型,此风险评分模型对于预测CC患者的预后、对免疫疗法的反应性和药物敏感性、协助制定更精确和个性化的治疗策略具有重要的意义。
2)本发明构建的RNA甲基化相关lncRNAs预后风险模型能独立于其他临床因素(年龄、性别、分期、分级、T分期及N分期等)准确的预测1年、3年和5年***患者的预后。
3)与现有技术相比,本发明考虑到RNA甲基化和lncRNAs在***生物学中的重要意义,确定了一个与RNA甲基化相关的lncRNAs风险模型来预测CC患者的预后、对免疫疗法的反应性和药物敏感性。
能够对CC样本的预后进行较为精准的判定;通过更加准确地提取对RNA甲基化相关的lncRNAs,使所选择出的与RNA甲基化相关的lncRNAs可以反应大部分***患者样本的情况,从而使得最终的预后模型具有普适性,使得更多的***患者受益。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本领域的技术人员应该了解本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的范围内。

Claims (7)

1.***甲基化相关长链非编码RNA预后及免疫治疗疗效预测模型的构建方法,其特征在于,包含如下步骤,
1)从TCGA数据库中分别获取***样本及正常样本组织的转录组数据、肿瘤突变数据及对应的临床数据;从已发表的文章中汇总并下载RNA甲基化相关的分子;
2)皮尔森相关性分析(Pearson’scorrelationalcoefficients)筛选RNA甲基化相关IncRNAs,correlationalcoefficients>0.4且p-values<0.001为筛选标准;
3)将RNA甲基化相关lncRNAs与对应患者的临床数据进行整合,进行单因素Cox回归分析,初步获得与***生存相关的RNA甲基化lncRNAs;
4)进一步将单因素回归分析筛选出的生存相关的关键lncRNAs纳入多因素回归分析筛选出关键的RNA甲基化lncRNAs,筛选条件设定为P<0.05;
5)建立预后风险评分模型绘制,计算风险得分=N1×coef1+N2×coef2+……Nn×coefn;其中,Nn代表相关差异基因的表达量,coefn代表相关差异基因所对应的回归系数;
6)通过绘制ROC曲线和Kaplan-Meier生存曲线评估预后模型的准确性;
7)单因素和多因素Cox独立预后分析用于确定风险评分是否能够独立于其他临床因素(年龄、分期、分级、T及N分期等)准确的预测1年、3年和5年***患者的预后;
8)构建Nomo模型及绘制Calibration图进一步评估模型准确性;
9)分析风险评分与***患者临床特征、免疫细胞浸润、肿瘤突变负荷(TMB)、免疫功能、免疫治疗相关分子间的相关性;
10)TIDE数据库评价高低风险组患者免疫治疗疗效差异;
11)采用GEPIA,Lnc2Cancer3.0,GEPIA2,GEPIA2021及TIGER在线数据库评估筛选出的RNA甲基化关键lncRNAs的预后及免疫治疗价值;
12)通过计算IC50来预测基于目标风险模型的新型药物的有效性。
2.如权利要求1所述的***甲基化相关长链非编码RNA预后疗效预测模型的构建方法,其特征在于,
1)数据收集与准备
TCGA数据库(https://portal.gdc.cancer.gov/)下载***患者的转录组数据、TMB数据和对应的临床数据;转录组数据中包306个***样本和3个正常人的基因表达谱;数据后处理和临床信息提取使用编程语言(strawberry-perl-5.32.0.1-64bit.msi,http://www.perl.org);蛋白质编码基因和IncRNA使用Ensembl人类基因组进行注释和分类浏览器GRCh38.p13(http://asia.ensembl.org/index.html);
2)RNA甲基化IncRNAs筛选
已发表文献获取55个与RNA甲基化相关分子;通过计算Pearson相关系数获得RNA甲基化相关IncRNAs,筛选标准为相关系数>0.4且P值<0.001;本发明筛选出了208个RNA甲基化相关IncRNAs;RNA甲基化相关基因与208个IncRNAs间相互作用共表达网络;
3)RNA甲基化IncRNAs预后模型构建
运行R语言中的Survival包,甲基化相关IncRNAs进行单变量Cox回归分析,初步筛选预后甲基化相关IncRNAs,P<0.05具有统计学意义;进行多元Cox回归分析并计算每位患者风险评分;将***患者分为高风险组和低风险组;计算风险得分=N1×coef1+N2×coef2+……Nn×coefn;其中,Nn代表相关差异基因的表达量,coefn代表相关差异基因所对应的回归系数;
经过单因素回归分析发现8个与***预后相关的甲基化IncRNAs多因素回归分析发现:FAM27E3,AC024270.3,AC096992.2,SOX21-AS1和AC012306.2与***患者预后相关;其中,FAM27E3,AC024270.3,AC096992.2,SOX21-AS1与***患者良好预后相关,AC012306.2是***患者的不良预后因素;
5个RNA甲基化相关IncRNA与RNA甲基化基因间存在相互作用;图2C-E显示风险水平、病例生存状态和模型lncRNA表达水平;KM生存分析发现高风险组较低风险组预后差;
4)评估模型的准确性
绘制五个RNA甲基化关键的IncRNAs的Kaplan-Meier生存曲线;采用timeROC软件包,绘制1年、3年和5年ROC曲线、计算曲线下面积(AUC)和C-index指数评估模型的预测能力;AUC值范围从0.5到1.0;AUC=0.5,表示没有任何预测价值,AUC在0.5-0.7之间代表预测的准确度低,AUC在0.7-0.9之间表示预测的准确度中等,AUC>0.9代表越策准确度高;
C-index值的范围为0.5-1.0之间;单因素和多因素Cox回归分析用于确定风险评分是否能够独立于其他临床因素(年龄、性别、分期、分级等)准确的预测3年和5年CC患者的预后;HR>1且P值小于0.05代表预后不良因素;HR<1且P值小于0.05表示预后有利因素;构建Nomo模型预测患者1、3、5年预后及绘制提名图评估Nomo模型准确性;
Kaplan-Meier生存曲线进一步证实FAM27E3,AC024270.3,AC096992.2,SOX21-AS1与***患者良好预后相关,AC012306.2是***患者的不良预后因素;ROC曲线结果表明:1年、3年、5年的AUC分别是0.782和0.717和0.763;ROC曲线分析发现risk-score能独立于其他临床因素预测***患者的1、3、5年预后;单因素和多因素独立预后分析提示:本发明构建的预后风险模型能独立于其他预后因素准确的评估患者预后;基于riskscore构建的Nomo模型及绘制Calibration图发现风险模型能够准确预测患者1、3、5年预后;
5)Riskscore和临床相关性分析
本研究基于R语言中limma和ggpubr包分析了不同年龄、分级、分期、T和N分期之间风险评分差异;进一步分析了不同年龄、分级、分期、T和N分期***患者的预后差异;结果表明:不同年龄、分级、分期、T和N分期之间风险评分未见明显差异,但是StageIII-IV较StageI-II,T3-4较T1-2风险评分高的趋势;在GradeIII-IV和T1-2的CC患者中高风险CC患者较低风险CC患者的预后差,而在不同年龄、GradeI-II,T3-4和N分期之间高低风险组患者的生存无差异;进一步提示高风险的CC患者预后较低风险的CC患者预后差;
6)风险评分与免疫细胞浸润、肿瘤突变负荷及免疫特征间相关性采用CIBERSORT算法比较高风险和低风险患者的中免疫细胞浸润差异;进一步使用"ggplot2"、"ggpubr"和"ggExtra"R软件包分析了免疫细胞浸润和确定的关键lncRNAs之间的相关性;通过GEPIA2021(http://gepia2021.cancer-pku.cn/)在线数据库,分析浸润的免疫细胞在高低风险组的生存差异;TMB是用肿瘤特异性基因突变计算的;使用R语言中的"maftools"程序包计算突变数据;所有样本被分为高TMB组和低TMB组,利用这些数据和病人的生存率统计来检查每组病人的生存率;接下来使用四个亚组高TMB+高风险、高TMB+低风险、低TMB+低风险评分、低TMB+高风险的生存率来研究风险评分与患者生存率之间的关系;通过使用R软件包"Limma"、"GSVA"、"GSEABase"、"pheatmap"和"reshape2",比较高风险组和低风险组之间免疫相关功能的差异;RNA甲基化相关lncRNAs和典型的免疫检查点分子,免疫检查点分子包括CD70、TNFSF9、FGL1、CD276、NT5E、HHLA2、VTCN1、TNFRSF18、CD274;PDCDL1LG2、IDO1、CTLA4、ICOS、HAVCR、PDCD1、LAG3、SIGLEC15、TNFSF4、TNFRSF9、ENTPD1、VSIR、ICOSLG、TNFSF14、TMIGD2、CD27、NCR3、BTLA、CD40LG、CD40和TNFRSF4)之间的关系;运用TIDE算法来计算免疫治疗有效的可能性;利用肿瘤免疫治疗基因表达资源的相关矩阵(TIGER,http://tiger.canceromics.org/#/)来检查确定的RNA甲基化相关的lncRNAs是否与已知的免疫治疗反应特征相关;我们进一步使用GEPIA2(http://gepia2.cancer-pku.cn/)来估计我们确定的RNA甲基化相关的lncRNAs与免疫治疗反应特征之间的相关性;
免疫微环境分析显示,幼稚B细胞和CD4+记忆型静止T细胞主要富集在低风险得分组,而活化的NK细胞主要集中在高风险组;此外,免疫功能分析发现活性细胞溶解、促炎反应、T细胞相关刺激、免疫检查点、T细胞相关抑制、CCR、MCH-I型、副炎症反应、IFN-I型反应在高低风险中存在差异;筛选出的5个RNA甲基化关键IncRNAs与免疫检查点抑制剂存在相关性;
TMB是对免疫疗法反应的预测性生物标志物;因此,我们比较了高风险得分组和低风险得分组的TMB差异,并显示了突变率最大的前20个基因;然而,高风险评分组和低风险评分组之间的TMB没有明显的差异;高TMB与CC患者良好的OS有关,高TMB与低风险评分相结合的CC患者的OS最长;低风险评分组免疫治疗效果更好;
7)RNA甲基化关键lncRNAs的预后及免疫治疗的疗效评估
采用GEPIA2021(GeneExpressionProfilingInteractiveAnalysis2021,http://gepia2021.cancer-pku.cn/)分析免疫细胞浸润与筛选的RNA甲基化相关的关键IncRNAs之间的相关性,并根据浸润的免疫细胞比例比较两组的生存差异;进一步使用基因表达分析互动分析2(GEPIA2,http://gepia2.cancer-pku.cn/)来估计我们确定的关键RNA甲基化相关lncRNAs和免疫疗法反应特征之间的相关性;肿瘤免疫治疗基因表达资源的相关矩阵(TIGER,http://tiger.canceromics.org/#/)通过将已发表的基因签名应用于我们提供的宫颈鳞癌和宫颈内膜腺癌(CESC)的lncRNAs,预测患者对免疫治疗的反应,并利用基因表达数据与免疫治疗的临床信息比较我们提供的lncRNAs与已知免疫治疗反应签名的性能。
3.如权利要求2所述的***甲基化相关长链非编码RNA预后疗效预测模型的构建方法,其特征在于,
还包含如下步骤,
8)IC50来预测基于目标风险模型的新型药物的有效性
本专利使用R软件中"pRRophetic"包计算化疗药物的IC50,以评估化疗对***患者的影响,该结果可用于指导具体的治疗;IC50分析发现:低风险组的患者对ABT.263、AKT抑制剂VIII及ATRA更敏感;高风险评分的患者对A.770041、AP.24534、AS601245、AUY922、AZ628、和AZD.0530的IC50值小,表明这些患者对这五种药物更敏感。
4.如权利要求3所述的***甲基化相关长链非编码RNA预后疗效预测模型的构建方法,其特征在于,
还包含如下步骤,
9)验证关键RNA甲基化相关lncRNAs的预后价值
采用在线分析数据库GEPIA(http://gepia.cancer-pku.cn/)和Lnc2Cancer3.0(http://bio-bigdata.hrbmu.edu.cn/lnc2cancer)来确认RNA甲基化相关lncRNAs在CC患者中的预后价值;结果进一步证实,FAM27E3和SOX21-AS1高表达与CC患者良好的预后有关。
5.AC024270.3、FAM27E3和SOX21-AS1以及三者任意之一或者组合以及其表达的物质在制备***患者的药物或者作为生物标志物的用途。
6.如权利要求6所述的用途,其特征在于,肿瘤为***。
7.FAM27E3和SOX21-AS1二者任意之一或者组合以及其表达的物质在制备治疗CC患者的药物或者作为生物标志物的用途。
CN202211516235.7A 2022-11-29 2022-11-29 ***甲基化相关长链非编码rna预后及免疫治疗疗效预测模型的构建方法和用途 Withdrawn CN116013403A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211516235.7A CN116013403A (zh) 2022-11-29 2022-11-29 ***甲基化相关长链非编码rna预后及免疫治疗疗效预测模型的构建方法和用途

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211516235.7A CN116013403A (zh) 2022-11-29 2022-11-29 ***甲基化相关长链非编码rna预后及免疫治疗疗效预测模型的构建方法和用途

Publications (1)

Publication Number Publication Date
CN116013403A true CN116013403A (zh) 2023-04-25

Family

ID=86019905

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211516235.7A Withdrawn CN116013403A (zh) 2022-11-29 2022-11-29 ***甲基化相关长链非编码rna预后及免疫治疗疗效预测模型的构建方法和用途

Country Status (1)

Country Link
CN (1) CN116013403A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116844685A (zh) * 2023-07-03 2023-10-03 广州默锐医药科技有限公司 一种免疫治疗效果评估方法、装置、电子设备及存储介质
CN117334347A (zh) * 2023-12-01 2024-01-02 北京大学 评估治疗效果方法、装置、设备及存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116844685A (zh) * 2023-07-03 2023-10-03 广州默锐医药科技有限公司 一种免疫治疗效果评估方法、装置、电子设备及存储介质
CN116844685B (zh) * 2023-07-03 2024-04-12 广州默锐医药科技有限公司 一种免疫治疗效果评估方法、装置、电子设备及存储介质
CN117334347A (zh) * 2023-12-01 2024-01-02 北京大学 评估治疗效果方法、装置、设备及存储介质
CN117334347B (zh) * 2023-12-01 2024-03-22 北京大学 评估治疗效果方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
Zhang et al. An immune-related signature predicts survival in patients with lung adenocarcinoma
Wang et al. Six-gene signature for predicting survival in patients with head and neck squamous cell carcinoma
Zhang et al. Clinical significance and inflammatory landscapes of a novel recurrence-associated immune signature in early-stage lung adenocarcinoma
CN116013403A (zh) ***甲基化相关长链非编码rna预后及免疫治疗疗效预测模型的构建方法和用途
CN111128299B (zh) 一种结直肠癌预后显著相关ceRNA调控网络的构建方法
CN111863159B (zh) 一种肿瘤免疫治疗疗效预测的列线图模型的建立方法
Wang et al. Identification and validation of a prognostic 9-genes expression signature for gastric cancer
Liu et al. Development of a novel immune-related lncRNA signature as a prognostic classifier for endometrial carcinoma
CN108424970A (zh) 用于检测癌症复发风险的生物标志物及检测方法
Sun et al. Characterization of immune landscape in papillary thyroid cancer reveals distinct tumor immunogenicity and implications for immunotherapy
CN111676288B (zh) 用于预测肺腺癌患者预后的***及其应用
Zhang et al. Development and validation of a fourteen-innate immunity-related gene pairs signature for predicting prognosis head and neck squamous cell carcinoma
CN113444804A (zh) ***预后相关基因及其在制备***预后预测诊断产品中的应用
CN114540499A (zh) 基于pcd相关基因组合构建的模型在制备预测结肠腺癌预后产品中的应用
CN115497562A (zh) 一种基于铜死亡相关基因的胰腺癌预后预测模型构建方法
Xiao et al. Identification of a novel immune-related prognostic biomarker and small-molecule drugs in clear cell renal cell carcinoma (ccRCC) by a merged microarray-acquired dataset and TCGA database
Hou et al. Prognostic significance of mutant-allele tumor heterogeneity in uterine corpus endometrial carcinoma
Zhang et al. A novel immune-related prognostic signature predicting survival in patients with pancreatic adenocarcinoma
Tian et al. Identification and validation of an immune-related gene-based prognostic index for bladder cancer
Li et al. A novel mitochondrial-related gene signature for the tumor immune microenvironment evaluation and prognosis prediction in lung adenocarcinoma
Zhang et al. Hallmark guided identification and characterization of a novel immune-relevant signature for prognostication of recurrence in stage I–III lung adenocarcinoma
Tang et al. A 10-long non-coding RNA-based expression signature as a potential biomarker for prognosis of acute myeloid leukemia
Cai et al. Histological tumor response assessment in colorectal liver metastases after neoadjuvant chemotherapy: impact of the variation in tumor regression grading and peritumoral lymphocytic infiltration
Peng et al. Stem signatures associating SOX2 antibody helps to define diagnosis and prognosis prediction with esophageal cancer
CN113721018B (zh) 用于预测肺腺癌预后的标志物及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20230425

WW01 Invention patent application withdrawn after publication