肝癌患者是否复发的预测标志物及试剂盒
技术领域
本发明涉及医学分子诊断领域,具体涉及一种肝癌患者是否复发的预测标志物及试剂盒。
背景技术
癌症是一种对人类危害极大的疾病,根据相关流行病学资料显示,每年大约会有1100万新发癌症。而在诸多癌症之中,肝癌尤其凶险,其发病率和病死率均较高,分别居世界第五位和第二位。
肝癌为发生于肝脏的恶性肿瘤,根据成因可分为原发性肝癌、转移性肝癌两大类,其中尤以原发性肝癌常见。根据肝炎-肝硬化-肝癌的进程,加之我国又是一个乙肝大国,我国每年约有11万人死于该病症,而每年新增病例则占到全世界肝癌患者的54%,无论是发病率还是死亡率均呈现出快速增加态势。
近年来,肝癌的诊断和治疗都取得了相当大的进展,但是目前仍旧有很大一部分患者由于诊断不及时而导致预后不良。有相关的研究显示:在亚洲人群中,能够做到早期诊断(肝癌病灶小于2cm),手术后的5年生存率可以提高到近70%,而如果到了肝癌的中晚期,以目前的诊疗水平其预后仅比胰腺癌略好,5年生存率仅能达到16%。
肝细胞癌(简称肝癌)是我国高发肿瘤之一,其发病率、病死率高,严重威胁人类的生命健康。根治性手术切除治疗是目前最主要的治疗方式,但术后复发转移率仍达到40%~80%,是肝癌预后差的主要原因。肝癌的发生发展与相当多的基因表达先关,这就涉及到许许多多的蛋白质,这些蛋白在肝复发组织微血管形成,基质破坏中起着重要作用。利用这些蛋白可以很好地掌握一些肝癌为何会发生复发和转移。因此,我们应当寻找相应的与肝癌复发有关的基因表达谱来确定肝癌的预后,以便及时对肝癌进行术后干预。如果在手术切除的标本中加以分析,并且能够准确地预测患者复发的风险,那么就可以让高危复发人群加以重视,提高肝癌生存期。
因此,开发出诊断肝癌患者是否复发对于降低肝癌发病率和死亡率具有非常重要的现实意义。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了肝癌患者是否复发的预测标志物及试剂盒,采用质谱分析的方法检测标志物的含量来判断肝癌患者术后复发的风险;该方法简单,实用,且通过多种小分子的检测可以更好地提高检测方法的灵敏度与特异性。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:
MRPL49蛋白,CUTA蛋白,TIAL1蛋白和CFL1蛋白中至少一种蛋白作为肝癌是否复发的标志物在制备肝癌复发判断试剂中的应用。
MRPL49特异性核酸探针,CUTA特异性核酸探针,TIAL1特异性核酸探针和CFL1特异性核酸探针中至少一种特异性核酸探针在制备肝癌复发诊断试剂盒中的应用。
一种用于肝癌复发诊断的试剂盒,包括特异性检测MRPL49蛋白的试剂、特异性检测CUTA蛋白的试剂、特异性检测TIAL1蛋白的试剂和特异性检测CFL1蛋白的试剂中至少一种试剂。
优选地,特异性检测MRPL49蛋白的试剂是特异性识别MRPL49蛋白核酸的引物或探针;特异性检测CUTA蛋白的试剂是特异性识别CUTA蛋白核酸的引物或探针;特异性检测TIAL1蛋白的试剂是特异性识别TIAL1蛋白核酸的引物或探针;特异性检测CFL1蛋白的试剂是特异性识别CFL1蛋白核酸的引物或探针。
一种肝癌患者是否复发的标志物的预后方法,包括以下步骤:采用LC-MS/MS质谱分析法检测待测样本中MRPL49蛋白、CUTA蛋白、TIAL1蛋白或CFL1蛋白的蛋白质表达量强度值。
优选地,样本中MRPL49蛋白的蛋白质表达量强度值小于37923871时,被判为复发患者,否则被判为术后未复发患者,且假阳性率为8.6%。
优选地,样本中CUTA蛋白的蛋白质表达量强度值小于382233711.7时,被判为复发患者,否则被判为术后未复发患者,且假阳性率为22.9%。
优选地,样本中TIAL1蛋白的蛋白质表达量强度值小于131017834时,被判为复发患者,否则被判为术后未复发患者,且假阳性率为22.9%。
优选地,样本中CFL1蛋白的蛋白质表达量强度值小于6181959261时,被判为复发患者,否则被判为术后未复发患者,且假阳性率为22.9%。
(三)有益效果
与现有技术相比,本发明具有如下有益效果:
(1)本发明采用LC-MS/MS质谱分析方法检测待测样本,将大量临床样本进行质谱分析后,通过将肝癌未复发患者癌组织与肝癌复发患者癌组织相应分子含量的差异倍数(大于2或小于0.5)确定4个蛋白分子具有良好的检验效益。该4个蛋白分子(MRPL49蛋白,CUTA蛋白,TIAL1蛋白和CFL1蛋白)可以作为诊断肝癌是否复发的标志物。
(2)本发明以MRPL49蛋白,CUTA蛋白,TIAL1蛋白和CFL1蛋白为生物标志物对被试者进行肝癌术后复发风险的诊断,简单易行、诊断过程安全有效易为病人所接受、诊断标准统一受个人主观因素影响较小。
(3)本发明通过质谱分析检测出的生物标志物,该方法可以为日后的抗肝癌复发药物的研发提供新的治疗靶点和思路。
附图说明
图1为MRPL49蛋白的蛋白质表达量强度值的ROC曲线图;
图2为肝癌复发组织和术后未复发组织中MRPL49蛋白的蛋白质表达量强度值图;
图3为CUTA蛋白的蛋白质表达量强度值的ROC曲线图;
图4为肝癌复发组织和术后未复发组织中CUTA蛋白的蛋白质表达量强度值图;
图5为TIAL1蛋白的蛋白质表达量强度值的ROC曲线图;
图6为肝癌复发组织和术后未复发组织中TIAL1蛋白的蛋白质表达量强度值图;
图7为CFL1蛋白的蛋白质表达量强度值的ROC曲线图;
图8为肝癌复发组织和术后未复发组织中CFL1蛋白的蛋白质表达量强度值图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
与肝癌诊断相关的生物标志物的筛选
1、实验步骤
(1)蛋白质样品信息
样本:分别取自肝癌复发组织的样本5例和取自术后未复发样本35例。
(2)样本预处理
样品采用SDT(4%(w/v) 十二烷基磺酸钠,100mM Tris/HCl pH7.6,0.1M二硫苏糖醇)裂解法提取蛋白质,然后采用BCA法进行蛋白质定量;每个样品取适量蛋白质采用Filteraided proteome preparation(FAS)法进行胰蛋白酶酶解,采用C18 Cartridge对肽段进行脱盐,肽段冻干后加入40μL 0.1%甲酸溶液复溶,肽段定量(OD280)。
BCA法进行蛋白质定量,是根据吸光值可以推算出蛋白浓度,在碱性条件下,蛋白将Cu2+还原为Cu+,Cu+与BCA试剂形成紫颜色的络合物,两分子BCA螯合一个Cu+。将该水溶性复合物在562nm处的吸收值,与标准曲线对比,即可计算待测蛋白的浓度。
(3)LC-MS/MS数据采集
每份样品采用纳升流速的HPLC液相***Easy nLC进行分离。
其中:缓冲液A液为0.1%甲酸水溶液,B液为0.1%甲酸乙腈水溶液(乙腈为84%)。
色谱柱以95%的A液平衡,样品由自动进样器上样到上样柱(Thermo ScientificAcclaim PepMap100, 100μm*2cm, nanoViper C18),经过分析柱(Thermo scientificEASY column, 10cm, ID75μm, 3μm, C18-A2)分离,流速为300nL/min。
样品经色谱分离后用Q-Exactive质谱仪进行质谱分析。检测方式为正离子,母离子扫描范围300–1800m/z,一级质谱分辨率为70,000 at 200m/z,AGC(Automatic gaincontrol)target为1e6,Maximum IT为50ms,动态排除时间(Dynamic exclusion)为60.0s。多肽和多肽碎片的质量电荷比按照下列方法采集:每次全扫描(full scan)后采集20个碎片图谱(MS2 scan),MS2 Activation Type为HCD,Isolation window为2m/z,二级质谱分辨率17, 500 at 200m/z,Normalized Collision Energy为30eV,Underfill为0.1%。
(4)蛋白质鉴定和定量分析
质谱分析原始数据为RAW文件,用软件MaxQuant软件(版本号1.5.3.17)进行查库鉴定及定量分析。
iBAQ Intensity是基于iBAQ算法得到的样品X中的蛋白质表达量,近似等于该样品中的蛋白质绝对浓度。LFQ Intensity是基于LFQ算法得到的样品X的蛋白相对表达量,常应用于组间比较。一般Labelfree选择其中之一作为定量结果。
iBAQ(Intensity-based absolute quantification)和LFQ属于Maxquant软件提供的两种不同的蛋白质定量算法。
iBAQ一般用于样本的蛋白质绝对定量,主要算法是基于该蛋白质鉴定到的肽段的强度之和与理论肽段个数的比值。
LFQ一般用于多组间的两两定量比较,主要算法是经过肽段和蛋白质多层的pair-wise矫正。本专利采用LFQ进行蛋白质定量。
(5)统计学分析
对符合同组三次重复数据中至少有两个非空值的数据进行比值计算和统计学分析,包含各比较组的LFQ或者iBAQ强度值比值和P-value;初步筛选出各组间的差异物。
进一步根据P-value验证差异蛋白物是否具有显著性。选择同时具有多维统计分析Fold change>2或<0.5认为癌组织和癌旁组织之间该蛋白物的含量存在明显的倍数差异,并且筛选出单变量统计分析P value <0.05的蛋白物,作为具有显著性差异的蛋白质;从而得到差异蛋白分子。然后利用SPSS软件作出差异蛋白物ROC曲线,并计算其曲线下面积(AUC),进而判断其诊断价值。具体判断方法为AUC线下面积大于0.7,且P<0.05,利用约登指数最大时候的阈值标准(cut off值)作为判断肿瘤与否的阈值标准(倍数大于2者认为大于阈值为肿瘤检测阳性,倍数小于0.5者认定小于阈值者为肝癌检测阳性),从而得到较高的敏感度和特异度。
(6)生物信息学分析
① GO功能注释
利用Blast2GO对目标蛋白质集合进行GO注释,过程大致可以归纳为序列比对(Blast)、GO条目提取(Mapping)、GO注释(Annotation)和InterProScan补充注释(AnnotationAugmentation)等四个步骤。
② KEGG通路注释
利用KAAS(KEGG Automatic Annotation Server)软件,对目标蛋白质集合进行KEGG通路注释。
③ GO注释和KEGG注释的富集分析
采用Fisher精确检验(Fisher’s Exact Test),比较各个GO分类或KEGG通路在目标蛋白质集合和总体蛋白质集合中的分布情况,对目标蛋白质集合进行GO注释或KEGG通路注释的富集分析。
④ 蛋白质聚类分析
首先对目标蛋白质集合的定量信息进行归一化处理(归一化到(-1,1)区间)。然后,使用Complexheatmap R包(R Version 3.4)同时对样品和蛋白质的表达量两个维度进行分类(距离算法:欧几里得,连接方式:Average linkage),并生成层次聚类热图。
⑤ 蛋白质相互作用网络分析
基于STRING(http://string-db.org/)数据库中的信息查找目标蛋白质之间的相互作用关系,并使用CytoScape软件(版本号:3.2.1)生成相互作用网络并对网络进行分析。
(7)差异表达蛋白质筛选
以倍数变化大于2.0倍(上调大于2倍或者下调小于0.5)且P value小于0.05的标准筛选差异表达蛋白质,各比较组的差异表达蛋白质数目。
(8)实验基本原理
非标记定量蛋白质组学(Label-free)技术近年来已成为重要的质谱定量方法。Label-free技术的定量原理主要有两种:首先,spectrum counts类的非标记定量方法发展较早,也形成了多种定量算法,但核心原理都是根据MS2的鉴定结果作为定量的基础,各种方法的差别在于后期算法对高通量数据的修正;第二种非标记定量方法的原理是以MS1为基础,计算每个肽段信号在LCMS色谱上的积分。本发明采用的Maxquant算法即基于第二种原理。
2、实验结果
经质谱数据分析和将肝癌复发组织与未复发组织(术后未复发)的蛋白小分子进行比较,从而得到4个蛋白分子,可以作为与肝癌复发相关的生物标志物。
为了评估蛋白分子的蛋白质表达量强度值对肝癌的诊断效能,本发明采用了ROC曲线分析,AUC为ROC曲线下的面积,是最常用的评价ROC曲线特征的参数,也是重要的试验准确度指标。若AUC在0.7以下,则表示诊断的准确率较低;AUC在0.7以上,则可以满足临床诊断的要求。
具体结果与分析如下:
(1)采用LC-MS/MS质谱分析法,检测到MRPL49蛋白在肝癌复发组织与术后未复发组织中存在差异。
研究发现,MRPL49蛋白在肝癌复发样本显著性下调了0.24倍,p值<0 .05。
由图1可知,MRPL49蛋白的AUC为 0.943>0 .7,说明具有较好的判断效果,即MRPL49蛋白可以作为肝癌术后是否复发的标志物。
在MRPL49蛋白的cut off值为37923871时,灵敏度为100%,特异度为91.4%。当进行个体检测时,MRPL49蛋白的蛋白质表达量强度值小于37923871时,被判为肝癌复发患者,否则被判为术后未复发患者(假阳性率为8.6%)。
由图2可知,肝癌复发组织样本主要分布在检测阈值(图2中实线)以下,术后未复发组织主要分布在检测阈值以上,说明肝癌复发组织和术后未复发组织的蛋白质表达量强度值相差甚大,该检测阈值检测效果良好。
综上所述,MRPL49蛋白可以作为肝癌术后是否复发的预测标志物。
(2)采用LC-MS/MS质谱分析法,检测到CUTA蛋白在肝癌复发组织与术后未复发组织中存在差异。
研究发现,CUTA蛋白在肝癌复发样本显著性下调了0.34倍,p值<0 .05。
由图3可知,CUTA蛋白的AUC为0 .863>0 .7,说明具有较好的判断效果,即CUTA蛋白可以作为肝癌术后是否复发的标志物。
在CUTA蛋白的蛋白质表达量强度值为382233711.7时,灵敏度为100%,特异度为77.1%。当进行个体检测时,CUTA蛋白的蛋白质表达量强度值小于382233711.7时,被判为复发患者,否则被判为术后未复发患者(假阳性率为22.9%)。
由图4可知,肝癌复发组织样本主要分布在检测阈值(图4中实线)以下,术后未复发组织主要分布在检测阈值以上,说明肝癌复发组织和术后未复发组织的蛋白质表达量强度值相差甚大,该检测阈值检测效果良好。
综上所述,CUTA蛋白可以作为肝癌术后是否复发的预测标志物。
(3)采用LC-MS/MS质谱分析法,检测到TIAL1蛋白在肝癌复发组织与术后未复发组织中存在差异。
研究发现,TIAL1蛋白在肝癌复发样本显著性下调了0.49倍,p值<0.05。
由图5可知,TIAL1蛋白的AUC为0.869>0.7,说明具有较好的判断效果,即TIAL1蛋白可以作为肝癌术后是否复发的标志物。
在TIAL1蛋白的蛋白质表达量强度值为131017834时,灵敏度为100%,特异度为77.1%。当进行个体检测时,TIAL1蛋白的蛋白质表达量强度值小于131017834时,被判为复发患者,否则被判为术后未复发患者(假阳性率为22.9%)。
由图6可知,肝癌复发组织样本主要分布在检测阈值(图6中实线)以下,术后未复发组织主要分布在检测阈值以上,说明肝癌复发组织和术后未复发组织的蛋白质表达量强度值相差甚大,该检测阈值检测效果良好。
综上所述,TIAL1蛋白可以作肝癌术后是否复发的预测标志物。
(4)采用LC-MS/MS质谱分析法,检测到CFL1蛋白在肝癌复发组织与术后未复发组织中存在差异。
研究发现,CFL1蛋白在肝癌复发样本显著性下调了0.49倍,p值<0.05。
由图7可知,CFL1蛋白的AUC为0. 886>0 .7,说明具有较好的判断效果,即CFL1蛋白可以作为肝癌术后是否复发的标志物。
在CFL1蛋白的蛋白质表达量强度值为6181959261时,灵敏度为80%,特异度为77.1%。当进行个体检测时,CFL1蛋白的蛋白质表达量强度值小于6181959261时,被判为复发患者,否则被判为术后未复发患者(假阳性率为22.9%)。
由图8可知,肝癌复发组织样本主要分布在检测阈值(图8中实线)以下,未复发组织主要分布在检测阈值以上,说明肝癌复发组织和术后未复发组织的蛋白质表达量强度值相差甚大,该检测阈值检测效果良好。
综上所述,CFL1的蛋白质可以作为肝癌术后是否复发的预测标志物。
实施例1
MRPL49蛋白作为肝癌是否复发的标志物在制备肝癌复发判断试剂中的应用。
MRPL49特异性核酸探针在制备肝癌复发诊断试剂盒中的应用。
一种用于肝癌复发诊断的试剂盒,包括特异性检测MRPL49蛋白的试剂;特异性检测MRPL49蛋白的试剂是特异性识别MRPL49蛋白核酸的探针。
一种肝癌患者是否复发的标志物的预后方法,包括以下步骤:采用LC-MS/MS质谱分析法检测待测样本中MRPL49蛋白的蛋白质表达量强度值;样本中MRPL49蛋白的蛋白质表达量强度值小于37923871时,被判为复发患者,否则被判为术后未复发患者,且假阳性率为8.6%。
实施例2
CUTA蛋白作为肝癌是否复发的标志物在制备肝癌复发判断试剂中的应用。
CUTA特异性核酸探针在制备肝癌复发诊断试剂盒中的应用。
一种用于肝癌复发诊断的试剂盒,包括特异性检测CUTA蛋白的试剂;特异性检测CUTA蛋白的试剂是特异性识别CUTA蛋白核酸的探针。
一种肝癌患者是否复发的标志物的预后方法,包括以下步骤:采用LC-MS/MS质谱分析法检测待测样本中CUTA蛋白的蛋白质表达量强度值;样本中CUTA蛋白的蛋白质表达量强度值小于382233711.7时,被判为复发患者,否则被判为术后未复发患者,且假阳性率为22.9%。
实施例3
TIAL1蛋白作为肝癌是否复发的标志物在制备肝癌复发判断试剂中的应用。
TIAL1特异性核酸探针在制备肝癌复发诊断试剂盒中的应用。
一种用于肝癌复发诊断的试剂盒,包括特异性检测TIAL1蛋白的试剂;特异性检测TIAL1蛋白的试剂是特异性识别TIAL1蛋白核酸的探针。
一种肝癌患者是否复发的标志物的预后方法,包括以下步骤:采用LC-MS/MS质谱分析法检测待测样本中TIAL1蛋白的蛋白质表达量强度值;样本中TIAL1蛋白的蛋白质表达量强度值小于131017834时,被判为复发患者,否则被判为术后未复发患者,且假阳性率为22.9%。
实施例4
CFL1蛋白作为肝癌是否复发的标志物在制备肝癌复发判断试剂中的应用。
CFL1特异性核酸探针在制备肝癌复发诊断试剂盒中的应用。
一种用于肝癌复发诊断的试剂盒,包括特异性检测CFL1蛋白的试剂;特异性检测CFL1蛋白的试剂是特异性识别CFL1蛋白核酸的探针。
一种肝癌患者是否复发的标志物的预后方法,包括以下步骤:采用LC-MS/MS质谱分析法检测待测样本中CFL1蛋白的蛋白质表达量强度值;样本中CFL1蛋白的蛋白质表达量强度值小于6181959261时,被判为复发患者,否则被判为术后未复发患者,且假阳性率为22.9%。
本发明以MRPL49蛋白,CUTA蛋白,TIAL1蛋白和CFL1蛋白为生物标志物对被试者进行肝癌诊断,简单易行、诊断过程安全有效易为病人所接受、诊断标准统一且受主观因素影响较小。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。