线粒体全基因组DNA扩增、引物、测序及突变检测
技术领域
本发明涉及分子生物学,特别是涉及可用于线粒体全基因组DNA扩增的引物对组、试剂盒、扩增方法、测序方法以及线粒体DNA突变检测方法。
背景技术
线粒体基因组(mitochondrial DNA,mtDNA)呈闭合双链环状结构,长度为16569bp,分为编码区和非编码区。编码区共37个基因,这37个基因中有22个编码转移核糖核酸(tRNA)、2个编码核糖体核糖核酸(12S和16S rRNA),13个编码多肽。mtDNA基因排列紧密,序列间没有内含子。
mtDNA的分子结构特点决定其具有以下独特的遗传特性:
(1)高拷贝数,一般来说,人类体细胞的细胞核内仅有两个染色体DNA拷贝,而大多数细胞质内却有1000至数千个mtDNA拷贝;
(2)表现为严格的母性遗传特点,mtDNA随母本的***传递给后代;
(3)具有较高的突变率,大量研究显示mtDNA突变频率较核基因组高10倍以上;
(4)异质性,突变的mtDNA与野生型的mtDNA以不同比例共存于一个细胞质内。
由于mtDNA的高突变率和mtDNA的高度进化保守性,多数mtDNA新突变都为有害突变,并且mtDNA突变导致的临床表型极为广泛,几乎涉及到所有的组织和器官,许多病人并不出现典型症状,给临床诊断带来了极大的困难,很多线粒体疾病无法得到确诊。故线粒体基因组的准确检测具有重要的临床指导意义。
目前临床上对于mtDNA的检测,还仅集中在对少数常见的线粒体基因位点进行突变和缺失筛查,如对线粒体脑肌病伴高乳酸血症和卒中样发作(MELAS)常见突变A3243G的筛查,阳性检出率低,大多数患者难以获得准确的病因诊断。此外,这些位点的选择都是基于其他人种(主要是白种人)的实验数据,中国人的基因突变位点与欧洲人的突变位点在规律上有很大的区别。目前最常用的mtDNA的检测方法是应用聚合酶链式反应(PCR)扩增出目的DNA片段,然后采用荧光标记序列分析仪(如3730DNA序列分析仪)对扩增产物直接进行测序。由于荧光标记序列分析仪对测序片段长度的限制,需要用26对甚至更多对引物对线粒体基因组进行多重PCR,将其分割成26段甚至更多片段来进行测序,操作过于繁琐,并且无法检测拷贝数很低的变异。
发明内容
本发明是基于发明人的下列发现而完成的:
扩增线粒体基因组,可通过设计最少2对PCR引物来完成,但是,引物对数目少对DNA模板的质量要求高,基因组模板不能有过多降解,并且对Taq酶的要求也更高,需要能扩增出10kb长片段的Taq酶进行PCR,扩增片段太长同时也会增加碱基的错配率,降低检测的准确性。而设计更多对的引物来扩增线粒体基因组,如26对、43对,PCR和后续的纯化操作繁琐,PCR产物片段短,适用于线粒体基因选择部分区域做sanger测序。选用引物对数量适中,如本发明方案的8对,其优势在于,对模板的要求低,PCR产物错配率低,检测准确性高,更适用于后续的高通量测序平台。
本发明的目的是针对现有技术的不足,提供一种可用于线粒体全基因序列扩增的引物对组。
本发明的另一目的在于提供一种线粒体全基因组DNA扩增方法。
本发明的再一目地在于提供一种线粒体全基因组的测序方法。
本发明的还一目的在于提供一种线粒体DNA的突变检测方法。
本发明的再一目的在于提供一种可用于线粒体全基因组DNA扩增的试剂盒。
为实现上述目的,本发明采用了以下技术方案:
本发明公开了用于扩增线粒体全基因组序列的引物对组,所述引物对组包括以下a-h中的至少一对引物,优选含有A-H中的所有八对引物,
a、seq ID No.1:5’-CACTCCCATACTACTAATCTC-3’,
seq ID No.2:5’-TAGCATGTACTGCTCGGAGGT-3’,
b、seq ID No.3:5’-GTCCTAAACTACCAAACCTGC-3’,
seq ID No.4:5’-GTGTTAGTCATGTTAGCTTG-3’,
c、seq ID No.5:5’-ATCTCTCCCTCACTAAACGTAAG-3’,
seq ID No.6:5’-ATGAGGGCGTGATCATGAAAGGT-3’,
d、seq ID No.7:5’-GCATACACCACATGAAACATC-3’,
seq ID No.8:5’-ATGCCGTCGGAAATGGTGAAG-3’,
e、seq ID No.9:5’-TCCCACTCCTAAACACATCC-3’,
seq ID No.10:5’-AAACCCGGTAATGATGTCGG-3’,
f、seq ID No.11:5’-GCCCACGGGCTTACATC-3’,
seq ID No.12:5’-GATTGTTAGCGGTGTGGTCG-3’,
g、seq ID No.13:5’-GCCTTCTTACGAGCCAAAACC-3’,
seq ID No.14:5’-TCCAGCGTCTCGCAATGCTAT-3’,
h、seq ID No.15:5’-TTCGCCTACACAATTCTCCG-3’,
seq ID No.16:5’-TTTATGGGGTGATGTGAGCC-3’。
本发明还公开了一种线粒体全基因组DNA扩增方法,所述方法包括,采用上述的引物对组,以线粒体DNA为模板,进行PCR扩增。
所述PCR扩增时,各引物对的退火温度为52-56℃,优选为56℃。
本发明进一步公开了一种线粒体全基因组测序方法,所述方法包括,采用上述的方法扩增得到线粒体全基因组DNA,构建测序文库,采用高通量测序平台进行全基因组测序。
所述高通量测序平台选自Illumina solexa/Hiseq、ABI SOLiD、Roche454和单分子测序装置之一;在本发明一个优选的实施方式中,所述高通量测序平台为Illumina Miseq测序仪。
具体地,所述测序方法包括,将PCR扩增得到的产物分别纯化并混合后,制备DNA Paired-End PCR Free文库,***片段为100~1000bp,优选为400~600bp,更优选500bp,制备好的文库质检合格后在Miseq测序仪上直接测序检测,读长150bp。
在本发明一个具体的实施方式中,制备DNA Paired-End PCR Free文库具体包括
i、将PCR产物打断,使打断后DNA主带大小集中在***片段大小,回收所需大小的目的片段;
ii、将步骤i的产物进行末端修复;
iii、将步骤ii的产物进行3’端加A碱基;
iv、将步骤iii的产物片段加上测序接头;
v、选择并回收目的DNA片段,获得所述DNA文库;
任选地,所述目的片段为100~1000bp,优选为400~600bp,更优为500bp。
构建好的文库优选进一步进行文库质量检测,可以使用例如Agilent2100Bioanalyzer和ABI StepOnerPlus Real-Time PCR System进行质量和产量的检测。
本发明还公开了一种线粒体DNA的突变检测方法,所述方法包括,采用上述的方法进行线粒体全基因组测序,获得线粒体全基因组DNA序列,将测序结果与线粒体参考序列比对。
所述线粒体参考序列优选为修正后的剑桥参考序列NC_012920.1。
本发明还公开了一种试剂盒,所述试剂盒含有上述的引物对组。
所述试剂盒用于线粒体全基因组DNA扩增。
由于采用了以上技术方案,使本发明具备的有益效果在于:
本发明利用给定的引物直接扩增结合直接测序的方法,能够得到线粒体全基因组序列,可以一次性检测线粒体基因的全部突变,能够应用于大多数线粒体基因突变引起的疾病的检测。其中Miseq测序仪是在单个仪器上整合了扩增、测序和数据分析的新一代测序仪,在简单、快速、灵活和低成本方面占据优势,特别适用于线粒体基因组测序。本发明可应用于辅助线粒体疾病临床诊断,发病机理的研究,遗传学研究以及不同人群单倍型分型。
附图说明
图1为本发明线粒体基因PCR产物电泳图。
注:1:引物a PCR产物;2:引物b PCR产物;3:引物c PCR产物;4:引物d PCR产物;5:引物e PCR产物;6:引物f PCR产物;7:引物g PCR产物;8:引物h PCR产物;M:DNA MarkerⅢ
图2为本发明测序文库制备流程图。
图3为本发明实施例的检测样本3243位点的reads图。
具体实施方式
临床上重要的变异散布于mtDNA基因组中,而mtDNA全基因组很难被扩增。本发明开发出一种用8对引物多重PCR扩增出mtDNA全基因组的测序***,以解决上述问题。
本发明合成了能够扩增出线粒体全基因组碱基的8对高特异性PCR引物。本发明所涉及的这8对PCR引物经实验证明,能够对线粒体全基因组进行特异性扩增,并通过直接测序的方法得到真实可靠的线粒体全基因组序列资料。
本发明提供了的线粒体测序用8对PCR引物,覆盖了线粒体基因组全长,以下表1列出了该8对PCR引物序列。
表1 PCR引物序列
选用上述线粒体全基因组测序用8对PCR引物,将上下游引物稀释成10μmol/L,作为工作液。
PCR反应体系:体系总体积为25μl,其中含DNA模板1μl(含至少50ng全基因组DNA),目的片段的相应上下游引物(10μmol/L)各1μl,Taq酶(5U/μl)0.25μl,10×PCR buffer(Mg2+ Plus)2.5μl,dNTP Mixture(2.5mmol/L)4μl,ddH2O15.25μl。
引物的PCR扩增基础参数为:94℃变性45s,根据PCR引物不同确定退火温度进行30s,72℃延伸3min,共计35个循环(表2列出PCR扩增条件)。
用DNA纯化回收试剂盒纯化PCR反应产物。
纯化后的PCR产物混合,制备DNA Paired-End PCR Free文库,***片段为500bp,文库制备流程如图2所示。此外,在实际操作过程中,为了提高测序效率,本领域技术人员熟知,可以通过增加index序列,制备成DNA Paired-End PCRFree Index文库,实现与其他样品文库混合上机。
文库质检合格后,在Miseq测序仪上直接测序检测,读长150bp,测序深度5000×,每个样本产生约83M的数据量。
测序数据经过信息分析得到线粒体全基因组序列资料,与线粒体参考序列(修正后的剑桥序列NC_012920.1)比对,即可获得样本线粒体序列变异信息,包括点突变、微缺失和微重复。
利用本发明的8对引物对可以制备试剂盒,用于线粒体全基因组序列的扩增。
本发明采用8对引物对线粒体全基因组进行多重PCR反应扩增,PCR产物经过纯化后构建PCR-free文库,最后采用Miseq测序仪进行高通量测序。测序操作灵活、简单、快速,深度可达几千甚至上万乘,在检测mtDNA低频突变方面占有优势,可以检测mtDNA上的任一点突变和微缺失、微重复,辅助临床医生提高线粒体病疑似患者的确诊率。除在基因检测方面的应用,还可应用于人类学、遗传学以及mtDNA突变和疾病相关性研究等领域。线粒体全基因组Miseq测序为个体临床和群体遗传学研究检测mtDNA变异提供了一个尤其合适的平台,不仅能够重点关注mtDNA的关键变异,缩短分析时间和提高流量,同样也能够将注意力集中到检测到的mtDNA上的任一未知致病突变。跟传统测序相比,该测序方法在检测分析成千上万的mtDNA碱基时表现出重要优势。
下面通过具体实施方式结合附图对本发明作进一步详细说明。
实施例:
本发明线粒体全基因组测序用PCR引物见表1。
本发明基于所述线粒体全基因组测序用PCR引物多重PCR扩增的方法,利用覆盖线粒体基因组全长的8对PCR引物扩增目的片段,然后构建DNAPaired-End PCR Free Index文库,Miseq测序检测线粒体全基因组序列,经数据分析比对获得样本线粒体序列变异信息。
PCR扩增
选用线粒体全基因组测序用8对PCR引物(表1),将上下游引物稀释成10μmol/L,作为工作液。PCR反应体系总体积25μl,其中含DNA模板1μl(含至少50ng全基因组DNA),该DNA模板来自一位线粒体脑肌病患者的血液基因组。目的片段的相应上下游引物(10μmol/L)各1μl,Taq酶(5U/μl)0.25μl,10×PCR buffer(Mg2+ Plus)2.5μl,dNTP Mixture(2.5mmol/L)4μl,ddH2O 15.25μl。
本实验PCR反应所用试剂均为通用试剂,PCR产物的检测采用常规的方法。PCR扩增参数见表2。
表2 PCR扩增条件
引物名称 |
变性温度/时间 |
退火温度/时间 |
延伸温度/时间 |
循环次数 |
a |
94℃ 45s |
56℃ 30s |
72℃ 3min |
35 |
b |
94℃ 45s |
56℃ 30s |
72℃ 3min |
35 |
c |
94℃ 45s |
56℃ 30s |
72℃ 3min |
35 |
d |
94℃ 45s |
56℃ 30s |
72℃ 3min |
35 |
e |
94℃ 45s |
56℃ 30s |
72℃ 3min |
35 |
f |
94℃ 45s |
56℃ 30s |
72℃ 3min |
35 |
g |
94℃ 45s |
56℃ 30s |
72℃ 3min |
35 |
h |
94℃ 45s |
56℃ 30s |
72℃ 3min |
35 |
PCR扩增产物琼脂糖凝胶电泳检测
PCR扩增产物1.5%q琼脂糖凝胶电泳检测,确保PCR产物扩增成功并且条带单一,特异性好,电泳鉴定结果如图1。
PCR扩增产物的纯化
使用TIANGEN通用型DNA纯化回收试剂盒(离心柱型)纯化PCR扩增产物。
DNA Paired-End PCR Free Index文库制备
将纯化后的PCR产物混合,制备DNA Paired-End PCR Free Index文库,***片段为500bp,文库制备流程见图2。
样品打断:用Covaris S2或Covaris E210将PCR产物打断,要求打断后DNA主带大小集中在500bp左右。对打断后的DNA通过琼脂糖凝胶电泳进行检测,合格的打断产物用QIAquick Gel Extraction Kit(QIAGEN)试剂盒进行纯化回收。
末端修复:配置200μl末端修复反应体系:DNA样品60μl,T4 PNK buffer20μl,dNTP Mixture(10mMOL/L)8μl,T4 DNA polymerase 10μl,Klenow Fragment2μl,T4 PNK 10μl,ddH2O 90μl。在Thermo mixer中20℃反应30min。修复产物用试剂盒进行纯化回收。
3’端加A碱基:配置100μl3’端加A碱基反应体系:DNA样品64μl,10×bluebuffer 10μl,1mM dATP 20μl,Klenow exo(3’to5’exo minus)6μl。在Thermo mixer中37℃反应30min。加A产物用试剂盒进行纯化回收。
片段加solexa接头:配置100μl接头连接反应体系:DNA样品20μl,2×DNAligase buffer 50μl,PE Index adapter oligo mix 20μl,T4 DNA ligase 10μl。在Thermomixer中16℃反应过夜。连接产物用试剂盒进行纯化回收。
本申请中,本领域技术人员熟知,可以根据实际测序平台或其他相关条件,选择合适的测序接头。在本实施例中,所加入的测序接头序列如下Seq ID No.17所示:
5’-GATCGGAAGAGCACACGTCTGAACTCCAGTCACATCTCGTATGCCGTCTTCTGCTTC-3’
方框位置为Index标签序列,在实际应用过程中,也可以根据需要换用其他5-11个碱基替代。
所加入的测序接头将形成如下的两链不完全互补的Y型树叉状结构:
DNA片段大小选择:对上一步的连接产物通过2%琼脂糖凝胶100V电压电泳2h,进行DNA片段大小的选择。DNA片段两端分别加上接头后片段长度为630bp左右,但因所加接头为树叉状接头(两链不完全互补),电泳过程中跑得比一般630bp的慢,大致在700bp marker的位置,因此选择700bp大小的电泳条带切胶回收,切下的胶块用试剂盒进行纯化回收。
文库质量检测:构建好的文库使用Agilent 2100 Bioanalyzer和ABIStepOnerPlus Real-Time PCR System进行质量和产量的检测。
Miseq测序
文库质检合格后,在Miseq测序仪上直接测序检测,读长150bp,要求测序深度达到5000×,每个样本产生约83M的数据量。
信息分析
测序数据经过信息分析得到线粒体全基因组序列资料,与线粒体参考序列(修正后的剑桥序列NC_012920.1)比对,即可获得样本线粒体序列变异信息,包括SNP和Indel。
信息分析结果如下:
测序得到的序列与参考序列比对,覆盖度达到100%,共检测到34个SNP和5个Indel。其中包括3243A→G的致病突变(图3),3243位点的信息分析结果见表3。
表3 3243位点信息分析结果
以上内容是结合具体的实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。