一种标志物组合及其在制备诊断甲状腺癌的试剂中的应用
技术领域
本发明属于生物医学检测领域,涉及一种miRNA标志物组合、含其的试剂盒及其在制备诊断甲状腺癌的试剂中的应用,以及由其制备的甲状腺癌诊断***。
背景技术
甲状腺癌是内分泌***发病率最高的恶性肿瘤。根据一些报告显示,甲状腺癌发病率为15.74/10万,比2003年的3.19/10万上升393.42%。其中,***状癌(Papillarythyroid carcinoma,PTC)起源于甲状腺滤泡上皮细胞,是甲状腺癌中最常见的类型。由于现代人进食过多含碘盐或海产品、工作压力大、接触电离辐射等有关,目前甲状腺癌已经成为增长率最高的恶性肿瘤。
目前甲状腺筛查的主要手段为B超,以及甲状腺功能七项检查。获得高准确率的检查结果对于医生的技术经验要求比较高,通过检查发现有结节,很多人可能会选择进一步做穿刺活检,而这同样依赖医生的操作技术,医疗水平不高的医院可能无法准确区分良恶性,导致误诊、漏诊。另一方面,随着影像学技术的不断提高,B超分辨率大大提升,许多小至1毫米的早期肿瘤和甲状腺结节都能被发现,这也导致了越来越多的过度治疗。
因此,一种基于液体活检的无创分子诊断技术,能定期监测甲状腺肿瘤微小病灶和复发转移风险的辅助诊断产品,就能够有效减轻患者负担,存在广大的市场空间和客户需要。但是液体活检需要在大量的正常细胞DNA中,检测出微量的肿瘤细胞DNA,对技术的灵敏度有极高要求。因此,寻找特异性的早期诊断标志物,开发新的早期诊断方法,是甲状腺癌的研究热点和难点,也具有重要的临床意义和社会效益。
microRNA(或简称miRNA)是最新发现的长约18-25个核苷酸的非编码小分子RNA,在进化上高度保守,数量约占基因组的1%,其在转录或转录后水平负调控蛋白质编码基因的表达,通过与其靶基因mRNA非完全互补或近似完全互补结合,导致mRNA降解或抑制其翻译。miRNA人类基因组约30%的基因受miRNA调控,miRNA的靶基因多数是参与转录、信号转导、肿瘤发生等生物学效应的基因,在细胞的生长、增殖、分化和凋亡等多方面发挥着重要的生物调节作用。现已证实miRNA的异常调控与肿瘤形成及进展关系密切。随着miRNA与癌症关系的不断深入研究,发现miRNA并不只是参与了癌症形成的初期阶段,还涉及到疾病病情变化、对药物的敏感性、患者预后等等多方面。
目前尚没有利用无创伤性、取材方便的血液标本检测判断与甲状腺***状癌相关的特异性microRNA生物标志物组合及检测试剂盒。因此,筛选血浆中与甲状腺***状癌相关的特异性microRNA生物标志物组合至关重要。
发明内容
为解决现有技术中缺乏有效的可以早期筛查个体甲状腺健康状况的方法的问题,本发明提供一种miRNA组合、含其的试剂盒及其在制备诊断甲状腺癌的诊断剂中的应用,以及由其制备的甲状腺癌诊断***。本发明miRNA组合可利用无创伤性、取材方便的血液标本检测判断甲状腺癌,具有较高的灵敏性和特异性,并可用于检测血浆中微小核糖核酸的变化,在制备检测甲状腺癌的诊断剂或筛选治疗的药物中有广泛的用途。
为解决上述技术问题,本发明的技术方案之一为:一种miRNA组合,所述miRNA组合包括hsa-miR-96-5p、hsa-miR-181a-5p、hsa-miR-181b-5p、hsa-miR-181c-5p、hsa-miR-221-3p和hsa-miR-222-3p中的一种或多种。
在一些更佳的实施方案中,所述miRNA组合包括hsa-miR-96-5p、hsa-miR-181a-5p、hsa-miR-181b-5p、hsa-miR-181c-5p、hsa-miR-221-3p和hsa-miR-222-3p中的两种或多种;优选所述miRNA组合不为hsa-miR-181a-5p、hsa-miR-221-3p和hsa-miR-222-3p中的两种或多种。
在一些进一步更佳的实施方案中,所述miRNA组合包括hsa-miR-96-5p和hsa-miR-181a-5p,或hsa-miR-96-5p和hsa-miR-181b-5p,或hsa-miR-96-5p和hsa-miR-181c-5p,或hsa-miR-96-5p和hsa-miR-221-3p,或hsa-miR-96-5p和hsa-miR-222-3p;
或hsa-miR-96-5p、hsa-miR-181a-5p和hsa-miR-221-3p,或hsa-miR-96-5p、hsa-miR-181b-5p和hsa-miR-221-3p,或hsa-miR-96-5p、hsa-miR-181c-5p和hsa-miR-221-3p,或hsa-miR-96-5p、hsa-miR-181a-5p和hsa-miR-222-3p,或hsa-miR-96-5p、hsa-miR-181b-5p和hsa-miR-222-3p,或hsa-miR-96-5p、hsa-miR-181c-5p和hsa-miR-222-3p;
或hsa-miR-96-5p、hsa-miR-181a-5p、hsa-miR-221-3p和hsa-miR-222-3p,或hsa-miR-96-5p、hsa-miR-181b-5p、hsa-miR-221-3p和hsa-miR-222-3p,或hsa-miR-96-5p、hsa-miR-181c-5p、hsa-miR-221-3p和hsa-miR-222-3p;
或hsa-miR-181a-5p、hsa-miR-181b-5p、hsa-miR-181c-5p、hsa-miR-221-3p和hsa-miR-222-3p,或hsa-miR-96-5p、hsa-miR-181b-5p、hsa-miR-181c-5p、hsa-miR-221-3p和hsa-miR-222-3p,或hsa-miR-96-5p、hsa-miR-181a-5p、hsa-miR-181c-5p、hsa-miR-221-3p和hsa-miR-222-3p,或hsa-miR-96-5p、hsa-miR-181a-5p、hsa-miR-181b-5p、hsa-miR-221-3p和hsa-miR-222-3p,或hsa-miR-96-5p、hsa-miR-181a-5p、hsa-miR-181b-5p、hsa-miR-181c-5p和hsa-miR-222-3p,或hsa-miR-96-5p、hsa-miR-181a-5p、hsa-miR-181b-5p、hsa-miR-181c-5p和hsa-miR-221-3p。
在一些进一步更佳的实施方案中,所述miRNA组合包括hsa-miR-221-3p、hsa-miR-222-3p、hsa-miR-181a-5p、hsa-miR-181b-5p、hsa-miR-181c-5p和hsa-miR-96-5p。
在本发明所述的技术方案中,miRNA的来源为血源样品,例如:血浆、血清或血液。优选地,采用人体血浆中的微小核糖核酸成熟体(mature microRNA)。
为解决上述技术问题,本发明的技术方案之二为:提供一种试剂盒,其包括如本发明的技术方案之一的miRNA组合。
在一些较佳的实施方案中,所述试剂盒还包括以下的至少其中之一:
参照物;
检测所述参照物或检测所述的miRNA组合的试剂。
在一些较佳的实施方案中,所述参照物包括内参和/或外参。
需要说明的是,检测miRNA表达量时,可以采用外参或内参。外参为人体内不存在的miRNA,人为添加进待检测样本(例如血浆样本)中,可作为质控品检测整个实验流程是否正常,结果是否可信。在本发明所述的技术方案中,所述外参可以采用例如ath-miR-159和/或cel-miR-39。
而在进行PCR相对定量分析时,则需要使用内参对目的特征进行数据校正,才能获得精确的结果。在一些更佳的实施方案中,所述内参包括hsa-93-5p、hsa-103a-3p、hsa-484、hsa-191-5p和hsa-16-5p中的一种或多种。
更为优选地,所述内参为hsa-93-5p和/或hsa-103a-3p。
检测所述miRNA组合包括直接检测miRNA含量或是间接检测miRNA逆转录cDNA或是与miRNA结合分子的手段,本领域内技术人员所知晓的例如利用荧光定量PCR法通过逆转录将目标miRNA转化为cDNA,然后进行PCR,实现实时荧光检测miRNA。
因此,检测miRNA的试剂除了可以为引物对和探针组合以外,还可以为其他检测手段所涉及的常规试剂。
需要说明的是,所述引物对是为了利用PCR法来扩增试样中的目的基因的一部分而使用,利用正向引物和反向引物的两种引物扩增特定的区域。本领域内技术人员可以根据目的基因序列通过市售商品或是自行设计引物对。同样地,探针组合本领域内技术人员可以根据检测方法采购或是自行制备所需要的探针。
在一些较佳的实施方案中,所述试剂盒还包括参照物例如hsa-93-5p和hsa-103a-3p。优选还包括检测所述参照物的试剂,例如引物对和探针组合。
在另一些较佳的实施方案中,所述试剂盒还包含说明书,所述说明书优选具有以下回归模型:logit(p)=3.0412+[181b-5p]×16.1482+[181c-5p]×27.1416+[221-3p]×0.6292-[222-3p]×22.3891-[181a-5p]×13.1472-[96-5p]×4.1459,其中,[181b-5p]、[181c-5p]、[221-3p]、[222-3p]、[181a-5p]以及[96-5p]表示对应miRNA的表达量。
在一些更佳的实施方案中,所述miRNA的表达量可以为标准化后的qPCR定量结果。
在另一些较佳的实施方案中,根据回归模型得到的p值以评估待检测的样本是否具有甲状腺癌症风险。
在另一些较佳的实施方案中,待检测的样本源自血源样本,例如血浆、血清、血液,优选地为血浆样本。
在另一些更佳的实施方式中,所述说明书存在于打印介质或可读介质中,例如纸质、光盘或U盘。
为解决上述技术问题,本发明的技术方案之三为:提供一种本发明方案中的miRNA组合、试剂盒或试剂组合物在制备诊断甲状腺癌的诊断剂中的应用。
在一些较佳的实施方案中,所述甲状腺癌选自甲状腺***状癌、甲状腺滤泡状癌、甲状腺未分化癌和甲状腺髓样癌的至少其中之一。
为解决上述技术问题,本发明的技术方案之四为:提供一种甲状腺癌诊断***,其中所述甲状腺癌诊断***包括以下模块:
输入模块,其用于输入待测样本数据,所述待测样本数据包括miRNA检测数值,miRNA选自所述的miRNA组合;
分析模块,所述分析模块通过待测样本数据得到分析结果;
以及判断模块,所述判断模块将分析结果与阈值进行比较,得出判断结果。
所述甲状腺癌诊断***具有以下特征的一种或多种:
(1)所述待测样本数据源自血源样本;
(2)所述miRNA检测数值为miRNA表达量或通过标准化处理后的miRNA表达量;
(3)所述分析模块采用逻辑回归模型进行建模,分析得到分析结果;
(4)判断时,当分析结果数值大于等于阈值,则判定为具有甲状腺癌症高风险;当分析结果数值小于阈值时,判定为具有甲状腺癌症低风险。
较佳地,所述甲状腺癌诊断***具有以下特征的一种或多种:
(1)所述待测样本数据为血浆样本;
(2)miRNA表达量为qPCR标准化处理后的miRNA表达量;和/或,采用的内参为hsa-93-5p和hsa-103a-3p;
(3)所述逻辑回归模型采用以下公式:logit(p)=3.0412+[181b-5p]×16.1482+[181c-5p]×27.1416+[221-3p]×0.6292-[222-3p]×22.3891-[181a-5p]×13.1472-[96-5p]×4.1459,其中,[181b-5p]、[181c-5p]、[221-3p]、[222-3p]、[181a-5p]以及[96-5p]表示对应miRNA的表达量;
(4)所述阈值为0.34。
需要说明的是,所述具有甲状腺癌症低风险是指所述待测样本源自健康个体或甲状腺良性结节个体,所述具有甲状腺癌症高风险是指待测样本源自甲状腺癌症患者例如甲状腺***状癌患者等。
在一些较佳的实施方案中,所述miRNA检测数值通过qPCR标准化处理后的miRNA表达量。
在一些更进一步较佳的实施方案中,qPCR采用的内参为hsa-93-5p和hsa-103a-3p,譬如hsa-miR-221-3p、hsa-miR-222-3p、hsa-miR-181a-5p、miR-181b-5p、hsa-miR-181c-5p、hsa-miR-96-5p的表达水平以hsa-93-5p和hsa-103-3p作为双内参检测得到。
在一些较佳的实施方案中,所述逻辑回归模型采用以下公式:
logit(p)=3.0412+[181b-5p]×16.1482+[181c-5p]×27.1416+[221-3p]×0.6292-[222-3p]×22.3891-[181a-5p]×13.1472-[96-5p]×4.1459,其中,[181b-5p]、[181c-5p]、[221-3p]、[222-3p]、[181a-5p]以及[96-5p]表示对应miRNA的表达量。
需要指出的是,在本发明所述的技术方案中,通过比较分析结果(例如logit(p)所得到的p值)与阈值的大小可以准确判断待测样本是否有甲状腺癌患病风险,阈值的设置大小会影响甲状腺癌诊断***的灵敏度与特异性。为了较高的灵敏度和特异性,优选采用阈值为0.34。
为解决上述技术问题,本发明的技术方案之五为:提供一种可读介质,所述可读介质存储了程序,所述程序被处理器执行时可实现本发明的技术方案之一的甲状腺癌诊断***的功能。
所述可读介质例如为光盘或U盘等任何能够被电子设备识别和读取的介质。
为解决上述技术问题,本发明的技术方案之六为:提供一种甲状腺癌诊断装置,所述甲状腺癌诊断装置包括:
(1)本发明的技术方案之一的可读介质;
(2)处理器,用于执行程序以实现所述甲状腺癌诊断***的功能;
优选还包括输出装置,用于输出诊断结果。
在符合本领域常识的基础上,上述各优选条件,可任意组合,即得本发明各较佳实例。
本发明所用试剂和原料均市售可得。
本发明的积极进步效果在于:
1.提供了一种有效地筛选与疾病尤其是早期甲状腺***状癌诊断相关的miRNA的方法。
2.提供了一种可以对早期甲状腺***状癌进行诊断的miRNA标志物及其组合。
3.通过建模,对多指标进行综合判断,提高单个标志物指标的分析性能。
4.利用血液样本进行无创检测,取材方便,无需进行穿刺。
5.检测成本低、检测灵敏度高、特异性高、可实现动态监测等优势,该方法可广泛用于疾病普查等工作。
附图说明
图1:GeNorm多内参稳定性比较。
图2:Normfinder两个内参稳定性比较。
图3:Lasso结果图。
图4:训练集模型表现。
图5:验证集模型表现。
图6:特异性miRNA在不同样本中的表现。
具体实施方式
下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。下列实施例中未注明具体条件的实验方法,按照常规方法和条件,或按照商品说明书选择。
实施例1甲状腺癌miRNA诊断试剂盒的反应体系的建立及优化
表1.检测所用试剂清单
一、使用miRNeasy Micro Kit(Qiagen,217084)进行miRNA提取
1.1准备血浆样本,单个样本吸取200μL血浆即可。
1.2向样本添加1.0mL QIAzol Lysis Buffer(简称为裂解液),涡旋混匀后室温避光静置5min后,加入1.5μL的外参混合液(ath-miR-159a+cel-miR-39)。外参为人体内不存在的miRNA,人为添加进血浆样本中,可作为质控品检测整个实验流程是否正常,结果是否可信。
1.3避光条件下,向含有裂解液的管内添加200μL三氯甲烷。室温避光静置3min。
1.4使用低温高速离心机在4℃,12000xg的条件下进行离心15min。缓慢吸取600μL上层无色水相加入新的2.0mL离心管。向无色水相中添加900μL无水乙醇(1.5倍体积,可根据吸取无色水相体积计算加入的无水乙醇体积),涡旋混匀后短暂离心。
1.5转移750μL混合样本转移至在2.0mL收集管中的RNeasy MinEl ute spincolumn内,合盖,10000xg离心15s,倒去废液。重复此步骤直至所有液体过柱。
1.6将700μL Buffer RWT加入RNeasy MinElute spin column内,10000xg离心15s,倒去废液。
1.7将500μL Buffer RPE加入RNeasy MinElute spin column内,10000xg离心15s,倒去废液。
1.8将500μL 80%乙醇加入RNeasy MinElute spin column内,10000xg离心15s,倒去废液。
1.9将RNeasy MinElute spin column转入新的2.0mL收集管内,开盖,全速离心5min。
1.10将RNeasy MinElute spin column转移至新1.5mL离心管内,向RNeasyMinElute spin column内加入14μL的无核酸酶水,全速离心3min。
二、加尾反应
使用ThermoFisher TaqManTMAdvanced miRNA cDNA合成试剂盒。
2.1根据下表2,在EP管内配置足够的Poly(A)Reaction Mix,以满足反应所需。
表2.
2.2将解冻混匀样本取2μL加入PCR反应管内,加入3μL配置好的Poly(A)ReactionMix,彻底混匀,短暂离心,收集液体,消除气泡后,放于冰板。
2.3将含有样本与Poly(A)Reaction Mix的PCR反应管用卫生纸擦干外壁后放入PCR仪,运行体系选择10μL,按照下表3程序运行PCR仪。
表3.
步骤 |
温度 |
时间 |
多腺苷酸化反应(polyadenylation) |
37℃ |
45分钟 |
终止反应 |
65℃ |
10分钟 |
保持 |
4℃ |
保持 |
三、连接接头反应
本实验使用ThermoFisher TaqManTMAdvanced miRNA cDNA合成试剂盒。
3.1提前室温解冻50%PEG 8000。根据下表4,在EP管内配置足够的LigationReaction Mix,以满足反应所需数量。
表4.
3.2取10μL混匀后的Ligation Reaction Mix加入含有加尾后样本的PCR反应管内,彻底混匀,短暂离心,消除气泡,放于冰板。
3.3将含有加尾后样本和Ligation Reaction Mix的PCR反应管用卫生纸擦干外壁后放入PCR仪,运行体积选择15μL,按照下表5程序运行。
表5.
步骤 |
温度 |
时间 |
多腺苷酸化反应(polyadenylation) |
37℃ |
45分钟 |
终止反应 |
65℃ |
10分钟 |
保持 |
4℃ |
保持 |
四、逆转录反应(逆转录以下简称RT)
本实验使用ThermoFisher TaqManTMAdvanced miRNA cDNA合成试剂盒。
4.1根据下表6,在EP管内配置足够的RT Reaction Mix,以满足反应所需。
表6.
4.2取15μL混匀后的RT Reaction Mix加入含有连接接头后样本的PCR反应管内。
4.3将含有连接接头后样本和RT Reaction Mix的反应管用卫生纸擦干外壁后放入PCR仪,运行体积选择30μL,按照下表7程序运行。
表7.
步骤 |
温度 |
时间 |
逆转录 |
42℃ |
15分钟 |
终止反应 |
85℃ |
5分钟 |
保持 |
4℃ |
保持 |
五、预扩增反应
本实验使用ThermoFisher TaqManTMAdvanced miRNA cDNA合成试剂盒。
5.1根据下表8,在EP管内配置足够的miR-Amp Reaction Mix,以满足反应所需。
表8.
组分 |
1Rxn |
4Rxns |
10Rxns |
2X miR-Amp预混物(Master Mix) |
25μL |
110μL |
275μL |
20X miR-Amp引物混合物 |
2.5μL |
11μL |
27.5μL |
无酶无菌水(RNase-free water) |
17.5μL |
77μL |
192.5μL |
预扩增反应混合总体系 |
45μL |
198μL |
495μL |
5.2按照样本数量准备相应数量的新PCR反应管,从miR-Amp Reacti on Mix中取45μL加入新的PCR反应管。
5.3将RT反应产物涡旋混匀,短暂离心消除气泡后,取5μL加入含有45μL miR-AmpReaction Mix的PCR反应管。
5.4将含有RT反应产物和miR-Amp Reaction Mix的PCR反应管用洁净卫生纸擦干外壁后放入PCR仪内,运行体积选择50μL,按照下表9程序运行。
表9.
六、qPCR反应
本实验使用TaqManTMFast Advanced预混液。
6.1对TE pH 8.0进行1:10的稀释,制备0.1X TE buffer。将制备好的0.1X TEbuffer涡旋混匀,短暂离心,消除气泡。
6.2使用0.1X TE buffer对涡旋混匀的cDNA模板进行1:10的稀释。将稀释后的cDNA模板涡旋混匀,短暂离心,消除气泡。
6.3根据下表10,在EP管内配置足够的PCR Reaction Mix,以满足反应所需。
表10.
6.4取15μL的PCRReaction Mix转移到新的PCR反应管内。向含有PCR ReactionMix的PCR反应管内加入5μL的稀释后的cDNA模板,彻底涡旋混匀,短暂离心,消除气泡。
6.5将含有稀释后cDNA模板和PCR Reaction Mix的PCR反应管使用洁净卫生纸擦干净外壁放入qPCR仪器QuantStudio5中,运行体积选择20μL,按照下表11程序运行。
表11.
实施例2一种稳定表达内参的筛选
1、使用工具:GeNorm、Normfinder
实时荧光定量PCR由于具备灵敏度高、重复性好、特异强及高通量等优点,已经成为基因表达分析的常用方法。在进行PCR相对定量分析时,需要使用内参基因对目的特征进行数据校正,才能获得精确的结果。选择一个稳定的内参对实验结果就显得尤为重要,而GeNorm和Normfinder是专门用于筛选内参基因稳定性软件。
使用GeNorm和Normfinder两款软件对选定的五个miRNA内参数据进行分析。
表12介绍了GeNorm对单个内参稳定性结果进行了排序,其中103a-3p、93-5p最稳定。
表12.GeNorm单内参稳定性结果排序
|
排序(rank) |
gId_0 |
1 |
1 |
103a-3p |
2 |
1 |
93-5p |
3 |
3 |
484 |
4 |
4 |
191-5p |
5 |
5 |
16-5p |
表13是Normfinder单内参稳定性结果,稳定性值越小,说明该特征越稳定,结果与GeNorm一致,103a-3p、93-5p最稳定。同时,GeNorm评估了不同数据量内参的稳定性。
表13.Normfinder单内参稳定性结果(与GeNorm一致)
|
Dif组 |
SD组 |
稳定性 |
103a-3p |
0.08 |
0.57 |
0.14 |
93-5p |
0.12 |
0.57 |
0.16 |
484 |
0.94 |
0.91 |
0.61 |
191-5p |
0.9 |
1.13 |
0.63 |
16-5p |
1.64 |
1.14 |
0.99 |
此外,图1显示了GeNorm多内参稳定性比较。
如图1所示,当内参数量是2的时候,最稳定。
表14展示的是当取两种miRNA作为内参,不同组合的表现情况,结果显示取103a-3p和93-5p时,稳定性值为0.13,最为稳定。
表14.Normfinder两个内参稳定性比较,内参取(103a-3p、93-5p)时,数据最稳定
|
类型1 |
类型2 |
稳定性 |
1 |
103a-3p |
93-5p |
0.13 |
2 |
484 |
93-5p |
0.35 |
3 |
93-5p |
191-5p |
0.35 |
4 |
103a-3p |
484 |
0.36 |
5 |
103a-3p |
191-5p |
0.37 |
6 |
484 |
191-5p |
0.7 |
图2则显示了Normfinder两个内参稳定性比较。
结合表12~14、图1以及图2可以看出,综合GeNorm、Normfinder结果,选择103a-3p、93-5p作为内参,二者稳定性结果最佳。
实施例3筛选甲状腺癌特异性miRNA及诊断模型构建
1、特征优化(特异性miRNA筛选)
1.1去除实验表现不好的miRNA
选取了一部分可能与甲状腺癌相关的miRNA,以下为出发的miRNA:hsa-miR-21-5p、hsa-miR-96-5p、hsa-miR-146a-5p、hsa-miR-146b-5p、hsa-miR-155-5p、hsa-miR-181a-5p、hsa-miR-181b-5p、hsa-miR-181c-5p、hsa-miR-182-5p、hsa-miR-221-3p、hsa-miR-222-3p、hsa-miR-223-3p、hsa-miR-182-5p、hsa-miR-183-5p、hsa-miR-187-3p、hsa-miR-197-3p、hsa-miR-222-5p、hsa-miR-224-5p、hsa-miR-31-5p、hsa-miR-346、hsa-miR-34a-5p、hsa-miR-375-3p、hsa-miR-10a-5p、hsa-miR-146b-5p、181a-2-3p、hsa-miR-93-5p、hsa-miR-16-5p、hsa-miR-103a-3p、hsa-miR-484、ath-miR-159a、cel-miR-39和hsa-miR-191-5p。
在所有出发miRNA中去除未出现明显扩增曲线的miRNA(为表述方便,下文省去“hsa-miR-”、“ath-miR-”和“cel-miR-”):182-5p、183-5p、187-3p、197-3p、222-5p、224-5p、31-5p、346、34a-5p、375-3p、10a-5p、146b-5p和181a-2-3p。
1.2去除外参和内参
在所有miRNA中进一步去除外参ath-159,cel-39,内参93-5p、16-5p、103a-3p、484和191-5p。
最终,剩下12种miRNA:181b-5p、146a-5p、181c-5p、146b-5p、221-3p、182-5p、223-3p、222-3p、96-5p、155-5p、21-5p、181a-5p。
1.3LASSO回归分析
采用LASSO回归模型对剩下的12种miRNA进行分析。LASSO是由1996年RobertTibshirani首次提出,全称Least absolute shrinkage and selection operator。该方法是一种压缩估计。它通过构造一个惩罚函数得到一个较为精炼的模型,使得它压缩一些系数,同时设定一些系数为零。因此保留了子集收缩的优点,是一种处理具有复共线性数据的有偏估计。LASSO回归是在损失函数后,加L1正则化,公式如下所示:
上式中,m表示样本个数,x表示特征值,i表示第i个样本,y表示样本实际结果,λ表示损失函数系数,k表示预测样本个数,j表示预测第j个样本,ωj表示预测结果。
计算过程本领域内技术人员应当知晓,因此,不再赘述,最终计算结果如表15所示。
表15.LASSO结果
181b-5p |
146a-5p |
181c-5p |
146b-5p |
221-3p |
182-5p |
0.808122042 |
-0.027005059 |
1.667366393 |
0.000000000 |
0.022913559 |
0.000000000 |
223-3p |
222-3p |
96-5p |
155-5p |
21-5p |
181a-5p |
0.002376185 |
-0.245418661 |
-0.176819387 |
0.000000000 |
-0.003365426 |
-0.477409968 |
图3中,不同的线条代表不同的特征,当x轴(即底部横轴)取不同的值时,对应选取不同的特征。X轴越往右,选取的特征数越多,越往左越少。从图3中可以看出,在该分析中,X轴取值约0.83,其体系Cp值最低,模型最好。对应的各个miRNA的系数如表15所示,其中为0的代表该特征可以舍弃。去除特征146b-5p、182-5p和155-5p,剩下9个特征:181b-5p、146a-5p、181c-5p、221-3p、223-3p、222-3p、21-5p、181a-5p和96-5p。
2、模型构建
在本实施例中所采用的模型总共收集126例数据,其中包含26例良性结节患者,32例健康人数据和68例甲状腺***状癌患者数据。将数据集随机分成训练集和测试集,训练集包含数据76例,测试集包含数据50例数据。然后使用逻辑回归函数,特征选用LASSO筛选的九个特征(181b-5p、146a-5p、181c-5p、221-3p、223-3p、222-3p、21-5p、181a-5p和96-5p)构建模型。
2.1使用逻辑回归模型
逻辑回归模型计算公式如下:
上式中:x表示特征值,y表示模型分类(0为负样本,1位正样本),z为逻辑回归中logit(p)值,t、T表示转置符号,m表示样本数,i表示第i个样本。
2.2逻辑回归模型保留p值小于0.05的特征(6个),即:181b-5p、181c-5p、221-3p、222-3p、181a-5p和96-5p。
所述miRNA序列信息如表16所示:
表16.miRNA序列信息
3、模型评估
最终模型:logit(p)=3.0412+[181b-5p]×16.1482+[181c-5p]×27.1416+[221-3p]×0.6292-[222-3p]×22.3891-[181a-5p]×13.1472-[96-5p]×4.1459
其中,[181b-5p]、[181c-5p]、[221-3p]、[222-3p]、[181a-5p]以及[96-5p]表示对应miRNA的表达量。
将logit(p)值(z值)代入下列公式中,求得的结果介于0和1之间,本模型选择阈值0.34,小于阈值认为是负样本(即对照组,对照组是指健康人群以及甲状腺良性结节人群),大于等于阈值是正样本(即患者组,患者组是指具有甲状腺***状癌患者人群)。(公式中miNRA的值为标准化后的qPCR定量结果)
将检测数据分为训练集和验证集,分别用于模型构建及模型验证。训练集和验证集模型表现分别如图4和图5所示。最终此模型的灵敏度为96%和特异性为90%。
由此可以看出,本案采用血浆样本的miRNA作为标记物,不仅大大提高了现有检测的低灵敏度(易漏诊)和低特异性(易误诊),显著提高疾病的临床检出率和实现疾病的早期发现及早期治疗,而且相较于现有传统采用甲状腺球蛋白,本案的检测方法取样更为方便(可以只通过外周血采用即可),检测结果更为精准。
4、126例检测数据汇总分析
表17. 6种miRNA在癌症组及对照组中的表现
目标 |
对照组 |
癌症组 |
差异倍数 |
P |
181b-5p |
0.11(0.08) |
0.16(0.11) |
1.45 |
0.004012391 |
181c-5p |
0.1(0.09) |
0.25(0.12) |
2.5 |
3.79E-12 |
221-3p |
8.96(7.59) |
17.16(10.69) |
1.92 |
1.85E-06 |
222-3p |
0.21(0.11) |
0.26(0.1) |
1.24 |
0.006678571 |
181a-5p |
0.57(0.34) |
0.71(0.27) |
1.25 |
0.013026022 |
96-5p |
1.3(0.89) |
0.43(0.45) |
0.33 |
1.97E-09 |
图6展示了126例数据(其中包含26例良性结节患者,32例健康人数据和68例甲状腺***状癌患者数据)中6个差异性miRNA的分析结果(差异表达miRNA热图)。从图6可以看出模型中6个差异性miRNA在患者组(甲状腺***状癌患者)和对照组(良性结节与健康人)中存在明显差异。
要注意的是,以上列举的仅为本发明的具体实施例,显然本发明不限于以上实施例,随之有着许多的类似变化。本领域的技术人员如果从本发明公开的内容直接导出或联想到的所有变形,均应属于本发明的保护范围。