CN106350590A

CN106350590A - 用于高通量测序的dna文库构建方法

Info

Publication number: CN106350590A
Application number: CN201610807018.1A
Authority: CN
Inventors: 王旭; 钟嘉泳; 张弓; 董鸣; 余卓
Original assignee: Chaintech Medical (shenzhen) Technology Co Ltd
Current assignee: Chaintech Medical (shenzhen) Technology Co Ltd
Priority date: 2016-09-06
Filing date: 2016-09-06
Publication date: 2017-01-25
Anticipated expiration: 2036-09-06
Also published as: CN106350590B

Abstract

本发明公开了一种扩增子测序文库的构建方法，包括用多对融合引物对从待测样品获得的DNA模板进行多重PCR，回收PCR产物，得到测序文库；其中所述多对融合引物分别针对DNA模板上的不同目的片段，融合引物包含针对目的片段的特异性引物序列和测序接头序列；其中多重PCR按下述反应条件进行：95℃2min；38个循环，每个循环为95℃30s，然后从76℃到55℃和58℃之间的任意温度缓慢降温，每秒降0.1℃，待降至58℃后保持20s，然后72℃30s；72℃2min，4℃保持。本发明还公开了该文库构建方法在高通量测序检测STR基因座和亲权鉴定中的应用。

Description

用于高通量测序的DNA文库构建方法

技术领域

本发明涉及生物检测领域，具体涉及一种用于高通量测序的DNA文库构建方法。

背景技术

法医DNA检验技术的研究和分析对象主要是生物体内DNA的多态性。一般来说，基因或非编码区的DNA标记在染色体上的位置称为基因座，而位于同一个基因座上不同序列的基因被称为等位基因。DNA多态性就是指作为遗传标记的基因座存在多个等位基因，分析基因座上等位基因的差异就是实现同一认定的生物学基础[1]。

微卫星DNA中的短串联重复序列(short tandem repeats，STR)[2]是一种DNA多态性，广泛存在于人类基因组的23对染色体上，通常由2-6bp的重复单位(或称核心序列，coresequence)组成，不同个体(或等位基因)之间的差异一般只表现为重复单位的重复数目差异。STR基因座是一种重要的遗传标记，在多态性程度高的基因座上，其个体识别能力强，并且可以简单地用PCR技术检测出来，因而被广泛应用。STR基因座具有以下特点：STR多态性基因座数量多，片段长度一般小于400bp，易于扩增，适于微量检材的检验；等位基因大小比较接近，较小等位基因优先扩增不明显；不同位点的STR基因座片段长度差异较小，便于复合扩增，提高检测效率。

STR基因座的分型检验技术在法医DNA检验、亲权鉴定中有着重要作用。我国大多数亲权鉴定实验室都使用多基因座STR分型技术作为主要手段，对不同的STR基因座多态性进行分析、比对并计算亲权指数(PI值，即真父可能性与假父可能性的比值)。依据国际上多数实验室[3]采用的标准(PI值≥10 000)作为区分是否“存在亲生关系”的界线。

传统的STR分型技术多以PCR技术和毛细管电泳技术为基础，使用荧光标记的引物对样品进行多重PCR扩增，产生不同大小的扩增片段并在毛细管电泳中分离，从而实现分型，但这种方法通量较低，而且由于分析的对象是片段长度，无法进一步检测核酸一级结构的微小差异，限制了检测的分辨率，此外，在存在混合样品时可能出现Stutter峰(片段分析时出现于主峰前的小峰)的干扰。而Sanger测序法由于通量、成本的原因，难以用于STR分型分析。

二代高通量测序技术(Next Generation Sequencing)技术可以一次并行对几十万到几百万条DNA分子进行序列测定，促进了测序技术的高速发展。利用二代高通量测序技术可以对全基因组进行测序。当研究者只对特定的基因组区域感兴趣的时候，可以利用扩增子测序(Amplicon Sequencing)方法只对相应区域进行测序研究。通过设计感兴趣的基因组区域的引物，进行PCR扩增，对目标区域进行富集，然后针对特定长度的PCR产物或者捕获的片段进行建库，高通量测序并进行序列分析。

目前的扩增子测序都是通过常规的建库方法，在通过PCR扩增富集到目标区域后，进行混样，然后进行末端修复和加A，再加接头，纯化样品，回收目的条带，然后PCR扩增，再跑胶回收主带，这种常规的建库方法步骤繁琐、浪费时间、工作量大，不利于大量样品的测序建库。

发明内容

本发明的目的在于提供一种扩增子测序文库的构建方法以及该文库构建方法在高通量测序检测STR基因座中的应用，该方法可以通过一次扩增实现扩增子测序文库的构建，简化建库的操作过程，降低建库的时间和成本，同时不影响测序质量。

根据本发明的一个方面，提供一种扩增子测序文库的构建方法，包括用多对融合引物对从待测样品获得的DNA模板进行多重PCR，回收PCR产物，得到测序文库；其中所述多对融合引物分别针对DNA模板上的不同目的片段，每对融合引物从5'端到3'端依次包含测序接头序列和针对目的片段的特异性引物序列。

在优选的实施方案中，多重PCR按下述反应条件进行：95℃2min；38个循环，每个循环为95℃30s，然后从76℃到55℃和58℃之间的任意温度缓慢降温，每秒降0.1℃，待降至目的温度后保持20s，然后72℃30s；72℃2min。

本发明中，所述“多对融合引物”是指两对、三对、或更多对融合引物。

在更优选的实施方案中，多重PCR按下述反应条件进行：95℃2min；38个循环，每个循环为95℃30s，然后从76℃到58℃缓慢降温，每秒降0.1℃，待降至58℃后保持20s，然后72℃30s；72℃2min。

在一些实施方案中，待测样品包括但不限于血液、体液、唾液、***、毛发、肌肉或组织器官。在优选的实施方案中，DNA模板是从待测样品中提取的基因组DNA。

本发明中，每对融合引物分别包含针对目的片段的特异性正向引物序列和反向引物序列。

在一些实施方案中，测序接头序列中包含index序列，以标识不同的DNA模板，便于将不同样品混合测序。

本发明中融合引物中所包含的测序接头序列可以是：上游引物中5'-CCTCTCTATGGGCAGTCGGTGAT-3'，下游引物中5'-CCATCTCATCCCTGCGTGTCTCCGACTCAG-index序列-GAT-3'。

本发明中融合引物中所包含的测序接头序列还可以是：上游引物中5'-AATGATACGGCGACCACCGAGATCTACAC-第一index序列-ACACTCTTTCCCTACACGACGCTCTTCCGATCT-3'，下游引物中5'-CAAGCAGAAGACGGCATACGAGAT+第二index序列+GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT-3'。

其中第一index序列与第二index序列是不同的index序列。

在一些实施方案中，多重PCR反应分1个或多个反应体系来完成。

在优选的实施方案中，一个反应体系中包含两个、三个、四个、或五个针对不同目的片段的融合引物对。

在优选的实施方案中，所述目的片段是STR基因座。

在优选的实施方案中，目的片段包括选自下述STR基因座的两种或更多种STR基因座：

CSF1PO(GenBank X14720)、FGA(GenBank M64982)、TH01(GenBank D00269)、TPOX(GenBank M68651)、D3S1358(NT_005997positions 754983-755121)、D5S818(GenBankAC008512)、D7S820(GenBank AC004848)、D8S1179(GenBank AF216671)、 D13S317(GenBankAL353628)、D16S539(GenBank AC024591)、D18S51(GenBank AP001534)、D21S11(GenBankAP000433)、D2S1338(GenBank AC010136)、CD4(Genbank M86525)、D12S391(GenbankM08921)、PLA2A1(Genbank M22970)、FABP(Genbank M18079)、D18S865(GenbankAC012289.12)和VWA(Genbank M25858)。

在更优选的实施方案中，目的片段包括下述所有STR基因座：

CSF1PO(GenBank X14720)、FGA(GenBank M64982)、TH01(GenBank D00269)、TPOX(GenBank M68651)、D3S1358(NT_005997positions 754983-755121)、D5S818(GenBankAC008512)、D7S820(GenBank AC004848)、D8S1179(GenBank AF216671)、D13S317(GenBankAL353628)、D16S539(GenBank AC024591)、D18S51(GenBank AP001534)、D21S11(GenBankAP000433)、D2S1338(GenBank AC010136)、CD4(Genbank M86525)、D12S391(GenbankM08921)、PLA2A1(Genbank M22970)和FABP(Genbank M18079)。

在更优选的实施方案中，目的片段包括下述所有STR基因座：

CSF1PO(GenBank X14720)、FGA(GenBank M64982)、TH01(GenBank D00269)、TPOX(GenBank M68651)、D3S1358(NT_005997positions 754983-755121)、D5S818(GenBankAC008512)、D7S820(GenBank AC004848)、D8S1179(GenBank AF216671)、D13S317(GenBankAL353628)、D16S539(GenBank AC024591)、D18S51(GenBank AP001534)、D21S11(GenBankAP000433)、D2S1338(GenBank AC010136)、CD4(Genbank M86525)、D12S391(GenbankM08921)、D18S865(Genbank AC012289.12)和VWA(Genbank M25858)。

其中针对各个STR基因座的特异性正向引物序列和反向引物序列如下所示：

CSF1PO：正向5'-3'：TAGCAGGTTGCTAACCACCC，反向5'-3'：TCAGACCCTGTTCTAAGTACTTC；

FGA：正向5'-3'：CCCATAGGTTTTGAACTCACAG，反向5'-3'：GTGATTTGTCTGTAATTGCCAGC；

TH01：正向5'-3'：GGGCAAAATTCAAAGGGTATCTG，反向5'-3'：TGCAGGTCACAGGGAACAC；

TPOX：正向5'-3'：AGGCACTTAGGGAACCCTC，反向5'-3'：TCCTTGTCAGCGTTTATTTGCC；

D3S1358：正向5'-3'：CAAGACCCTGTCTCATAGATAG，反向5'-3'：TCAACAGAGGCTTGCATGTATC；

D5S818：正向5'-3'：GTGACAAGGGTGATTTTCCTCTT，反向5'-3'：GTGATTCCAATCATAGCCACAG；

D7S820：正向5'-3'：GGTCAGGCTGACTATGGAG，反向5'-3'：TCCTCATTGACAGAATTGCACC；

D8S1179：正向5'-3'：TCTTTTTGCCCACACGGCC，反向5'-3'：CTGTAGATTATTTTCACTGTGGGG；

D13S317：正向5'-3'：ATTTCTTTAGTGGGCATCCGTG，反向5'-3'：CCTTCAACTTGGGTTGAGCC；

D16S539：正向5'-3'：CAGATCCCAAGCTCTTCCTC，反向5'-3'：GCATGTATCTATCATCCATCTCTG；

D18S51：正向5'-3'：CACTTCACTCTGAGTGACAAATTG，反向5'-3'：GTGTGGAGATGTCTTACAATAACAG；

D21S11：正向5'-3'：TCAATTCCCCAAGTGAATTGCC，反向5'-3'：TGTTCTCCAGAGACAGACTAATAG；

D2S1338：正向5'-3'：GTGGATTTGGAAACAGAAATGGC，反向5'-3'：GTGGCCCATAATCATGAGTTATTC；

CD4：正向5'-3'：AGGGGTACTTGTGTTAATTGTTGG，反向5'-3'：GCGTTTTCCAGTCTGAAAAAAGTG；

D12S391：正向5'-3'：GAATCAACAGGATCAATGGATGC，反向5'-3'：CCTCCATATCACTTGAGCTAATTC；

FABP：正向5'-3'：TTGTAAGCTCCATGAGGTTAGAG，反向5'-3'：AGCCTCCCTAGGTCAGATAG；

PLA2A1：正向5'-3'：TAGTATCAGTTTCATAGGGTCACC，反向5'-3'：AGTTCGTTTCCATTGTCTGTCC；

D18S865：正向5'-3'：CAAATGTAGATCTTGGGACTTGTC，反向5'-3'：ATTCTCAAACATCCCCATTACCTTC；

VWA：正向5'-3'：TCAGTATGTGACTTGGATTGATC，反向5'-3'：CAGGTTAGATAGATTAGACAGACAG。

在优选的实施方案中，多重PCR反应分1个或多个反应体系来完成。所述多个反应体系包括选自下组的一个或更多个反应体系：

包含针对TPOX基因座的融合引物和针对D18S51基因座的融合引物的反应体系；

包含针对D8S1179基因座的融合引物和针对D21S11基因座的融合引物的反应体系；

包含针对TPOX基因座的融合引物、针对D18S51基因座的融合引物、针对D8S1179基因座的融合引物和针对D21S11基因座的融合引物的反应体系；

包含针对CSF1PO基因座的融合引物、针对D3S1358基因座的融合引物、针对D13S317基因座的融合引物和针对D12S391基因座的融合引物的反应体系；

包含针对FGA基因座的融合引物、针对TH01基因座的融合引物、针对D5S818基因座的融合引物和针对PLA2A1基因座的融合引物的反应体系；

包含针对FGA基因座的融合引物、针对TH01基因座的融合引物、针对D5S818基因座的融合引物和针对VMA基因座的融合引物的反应体系；

包含针对D7S820基因座的融合引物、针对D16S539基因座的融合引物、针对D2S1338基因座的融合引物、针对CD4基因座的融合引物和FABP引物的反应体系；和

包含针对D7S820基因座的融合引物、针对D16S539基因座的融合引物、针对D2S1338基因座的融合引物、针对CD4基因座的融合引物和针对D18S865基因座的融合引物的反应体系。

在更优选的实施方案中，所述多个反应体系包括选自下组的一个或更多个反应体系：

包含1.5μM针对TPOX基因座的融合引物和3.5μM针对D18S51基因座的融合引物的反应体系；

包含1.5μM针对D8S1179基因座的融合引物和3.5μM针对D21S11基因座的融合引物的反应体系；

包含1μM针对TPOX基因座的融合引物、1.5μM针对D18S51基因座的融合引物、1μM针对D8S1179基因座的融合引物和1.5μM针对D21S11基因座的融合引物的反应体系；

包含1μM针对CSF1PO基因座的融合引物、2μM针对D3S1358基因座的融合引物、1μM针对D13S317基因座的融合引物和1μM针对D12S391基因座的融合引物的反应体系；

包含1μM针对CSF1PO基因座的融合引物、1μM针对D3S1358基因座的融合引物、1μM针对D13S317基因座的融合引物和2μM针对D12S391基因座的融合引物的反应体系；

包含1μM针对FGA基因座的融合引物、1.5μM针对TH01基因座的融合引物、1.5μM针对D5S818基因座的融合引物和1μM针对PLA2A1基因座的融合引物的反应体系；

包含1.5μM针对FGA基因座的融合引物、1μM针对TH01基因座的融合引物、1.5μM针对D5S818基因座的融合引物和1μM针对VMA基因座的融合引物的反应体系；

包含1μM针对D7S820基因座的融合引物、1μM针对D16S539基因座的融合引物、1μM针对D2S1338基因座的融合引物、1μM针对CD4基因座的融合引物和1μM FABP引物的反应体系；和

包含1μM针对D7S820基因座的融合引物、1μM针对D16S539基因座的融合引物、1μM针对D2S1338基因座的融合引物、1μM针对CD4基因座的融合引物和1μM针对D18S865基因座的融合引物的反应体系。

还可以根据情况选择其他STR基因座。备选STR基因座选择见网址：http://www.cstl.nist.gov/biotech/strbase/seq_info.htm，该网址是美国法医学的一个权威网站，其中提供了法医亲缘关系鉴定中涉及的STR基因座。这些STR基因座的参考序列信息可以从网址http://www.cstl.nist.gov/biotech/strbase/seq_ref.htm获得。

所述扩增子测序文库的构建方法适用于对任何扩增子的高通量测序，例如可用于通过高通量测序检测STR基因座、SNP、SNV、一定范围的***缺失突变等，但不限于此。

本发明的另一个方面提供扩增子高通量测序的方法，包括：利用上述扩增子测序文库构建方法制备测序文库，然后进行高通量测序并对测序数据进行数据分析。

所述扩增子高通量测序的目标片段包括但不限于包含STR基因座或包含SNP位点的片段。在优选的实施方案中，所述扩增子高通量测序的目标片段为多个STR基因座。

本发明的另一个方面提供STR基因座的检测方法，包括：利用上述扩增子测序文库构建方法制备针对多个STR基因座的测序文库，然后进行高通量测序并对测序数据进行数据分析。

在优选的实施方案中，所述数据分析包括获得所述多个STR基因座核心重复序列的重复次数。

在一些实施方案中，所述数据分析还包括对链滑脱错配导致的影子带进行分析。

在一些实施方案中，所述数据分析进一步包括获得所述多个STR基因座中的突变信息。

在一些实施方案中，本发明的扩增子高通量测序的方法和STR基因座的检测方法是非诊断目的的。

本发明的检测STR基因座的方法可用于法医以及其它涉及STR基因座检测的相关领域，如基因诊断、遗传图谱构建和群体遗传学研究等领域。在优选的实施方案中，本发明的检测STR基因座的方法用于亲权鉴定。

本发明还提供一种亲权鉴定方法，包括：通过上述STR基因座的检测方法检测基因组中的重复次数，然后计算亲权指数(Pi值)。

本发明的有益效果是：

(1)本发明的整个建库过程仅通过一次多重PCR即可完成，大大降低了扩增子测序建库的时间和成本。当应用于STR基因座分析和亲权关系鉴定时，可简化流程并降低成本。

(2)本发明的扩增子建库方法对多重PCR反应条件进行了优化设计，适用于各种扩增子的高通量测序，对引物没有选择性，使用不同的引物均可以通过本发明的建库方法一次扩增建库。

附图说明

图1是实施例1中多重PCR反应产物的琼脂糖凝胶电泳图。

图2是实施例1中的文库质检图。

图3是实施例1中每个STR的测序数据中不同重复次数的分布图。

图4是实施例2中多重PCR反应产物的聚丙烯酰氨PAGE凝胶核酸电泳图。

图5是实施例2中的文库质检图。

具体实施方式

为了能够更清楚地理解本发明的技术内容，特举以下实施例结合附图详细说明。应理解，这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法，通常按照常规条件，或按照制造厂商所建议的条件。实施例中所用到的各种化学试剂和生物制剂，均为市售产品。

实施例1：法医亲缘关系鉴定

本实施例目的为检测STR中重复序列的重复次数，其中使用NGS测序方案。

一、口腔上皮细胞采集与处理

(1)用口腔拭子采集管采集人的口腔上皮细胞。

(2)用口腔拭子基因组提取试剂盒(DP322)提取口腔上皮细胞DNA。

(3)使用Nanodrop 2000型分光光度计测定OD260nm和OD280nm，确认其纯度高，并测定其浓度。

二、多重PCR反应引物设计

(1)引物设计成融合引物，包括目的片段的特异性引物序列和测序接头序列，其中含有index序列。

(2)融合引物结构为：

上游引物：5’-CCTCTCTATGGGCAGTCGGTGAT-3'+目的片段特异性正向引物；

下游引物：5'-CCATCTCATCCCTGCGTGTCTCCGACTCAGCTAAGGTAACGAT-3'+目的片段特异性反向引物；

其中下划线序列为index序列。

(3)待扩增和测序的STR基因座以及对应的特异性引物见表1。

表1STR基因座对应的特异性引物

STR基因座	正向引物5'-3'	反向引物5'-3'
			CSF1PO	TAGCAGGTTGCTAACCACCC	TCAGACCCTGTTCTAAGTACTTC
FGA	CCCATAGGTTTTGAACTCACAG	GTGATTTGTCTGTAATTGCCAGC
			TH01	GGGCAAAATTCAAAGGGTATCTG	TGCAGGTCACAGGGAACAC
TPOX	AGGCACTTAGGGAACCCTC	TCCTTGTCAGCGTTTATTTGCC
			D3S1358	CAAGACCCTGTCTCATAGATAG	TCAACAGAGGCTTGCATGTATC
D5S818	GTGACAAGGGTGATTTTCCTCTT	GTGATTCCAATCATAGCCACAG
			D7S820	GGTCAGGCTGACTATGGAG	TCCTCATTGACAGAATTGCACC
D8S1179	TCTTTTTGCCCACACGGCC	CTGTAGATTATTTTCACTGTGGGG
			D13S317	ATTTCTTTAGTGGGCATCCGTG	CCTTCAACTTGGGTTGAGCC
D16S539	CAGATCCCAAGCTCTTCCTC	GCATGTATCTATCATCCATCTCTG
			D18S51	CACTTCACTCTGAGTGACAAATTG	GTGTGGAGATGTCTTACAATAACAG
D21S11	TCAATTCCCCAAGTGAATTGCC	TGTTCTCCAGAGACAGACTAATAG
			D2S1338	GTGGATTTGGAAACAGAAATGGC	GTGGCCCATAATCATGAGTTATTC
CD4	AGGGGTACTTGTGTTAATTGTTGG	GCGTTTTCCAGTCTGAAAAAAGTG
			D12S391	GAATCAACAGGATCAATGGATGC	CCTCCATATCACTTGAGCTAATTC
FABP	TTGTAAGCTCCATGAGGTTAGAG	AGCCTCCCTAGGTCAGATAG
			PLA2A1	TAGTATCAGTTTCATAGGGTCACC	AGTTCGTTTCCATTGTCTGTCC

三、多重PCR反应建库以及核酸琼脂糖凝胶电泳

分五组进行多重PCR反应，分组情况以及各种引物浓度如表2所示。

表2多重PCR引物分组情况

多重PCR所用试剂为DreamTaq Green PCR Master Mix 2X(Thermo Fisher，货号K1081)，反应体系见表3：

表3多重PCR反应体系

采用缓慢降温法进行多重PCR反应，反应条件如表4所示。

表4多重PCR反应条件

对PCR反应产物进行琼脂糖凝胶电泳，电泳的条件设定为：电压120V，电流400mA，时间是30min，胶浓度是1.5％，marker条带标准从下至上依次是：100bp、200bp、300bp、400bp、500bp、700bp、1kb、1600bp、2kb、5kb、8kb、10kb，结果如图1所示，5组多重PCR反应均能扩增出目的条带，而且目的条带出现的位置均在预期的范围内。

用SanPrep柱式PCR产物纯化试剂盒(上海生工，货号B518141)纯化预先混合过的五组多重PCR产物，按制造商说明进行纯化，得到用于测序的DNA文库。Nanodrop分光光度计测得纯化后的DNA文库浓度为128.73ng/μl，260/280值为1.944。

四、文库质检

文库质检由Agilent 2100来完成，质检结果如图2所示，由图形可以看出多重PCR扩增效果较为均一，没有扩增差异极大的偏好性，可以直接进行高通量测序。

五、大规模测序

(1)利用上述制备的DNA测序文库用Ion torrent平台SE400进行高通量测序，测序完成后，结果输出为FASTQ格式文件，测序数据量67M，测得匹配到STR基因座的reads数量为490536。

六、测序数据处理

(1)截取每个read的前、后20-30个碱基从而定位每个read属于哪个STR基因座，若该read无法定位到目标STR基因座上则弃掉。每种STR匹配到的reads数见表5。

表5各STR基因座所定位的reads数目

(2)由于多重PCR反应在引物延伸过程中，引物链或模板链滑脱，导致一个重复单位形成的碱基非配对环，即链滑脱错配机制，最终产生影子带(Stutter)。为方便分析影子带的影响，最终以测序数据中每个STR对应reads上分析得到的核心重复单位的重复次数类型为横坐标，以每种类型所对应的reads数的百分比为纵坐标，做直方图，如图3(a-q)所示。

(4)测试样品中每个STR基因座重复单位的次数如表6：

表6每个STR基因座重复单位的次数

STR基因座	重复次数
		CSF1PO	10,11
FGA	21,23
		TH01	7,9
TPOX	8
		D3S1358	16
D5S818	11
		D7S820	10
D8S1179	13,14
		D13S317	8,10
D16S539	9,10
		D18S51	18
D21S11	31,32
		D2S1338	19,23
CD4	5
		D12S391	18
FABP	10
		PLA2A1	11,14

实施例2：检测未知细胞系属于哪种细胞系

本实施例使用人的2个未知细胞系，通过检测STR中重复序列的重复次数从而确认未知细胞系属于哪种细胞系。其中使用NGS测序方案。

一、人细胞系DNA的提取

(1)人细胞系DNA提取采用外周血DNA试剂盒(Qiagen，货号937236)。

(2)使用Nanodrop 2000型分光光度计测定OD260nm和OD280nm，确认其纯度高，并测定其浓度，最终浓度为51ng/μl。

二、多重PCR反应建库以及聚丙烯酰氨PAGE凝胶核酸电泳

(2)融合引物结构为：

样品一：

上游引物：5’-AATGATACGGCGACCACCGAGATCTACAC-3'+index序列1(CTCTCTAT)+ACACTCTTTCCCTACACGACGCTCTTCCGATCT+目的片段特异性正向引物；

下游引物：5'-CAAGCAGAAGACGGCATACGAGAT-3'+index序列2(TCGCCTTA)+GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT+目的片段特异性反向引物；

样品二：

上游引物：5’-AATGATACGGCGACCACCGAGATCTACAC-3'+index序列1(TATCCTCT)+ACACTCTTTCCCTACACGACGCTCTTCCGATCT+目的片段特异性正向引物；

下游引物：5'-CAAGCAGAAGACGGCATACGAGAT-3'+index序列2(CTAGTACG)+GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT+目的片段特异性反向引物；

(3)待扩增和测序的STR基因座以及对应的特异性引物见表7。

表7STR基因座对应的特异性引物

三、多重PCR反应建库以及聚丙烯酰氨PAGE凝胶核酸电泳

(1)多重PCR反应使用DreamTaq Green PCR Master Mix(2X)试剂(赛默飞世尔，货号K1081)进行PCR反应，分4组多重PCR反应来完成目标STR的DNA文库构建，分组情况以及各种引物浓度如表8所示，多重PCR反应条件如同实例1中的反应条件。

表8多重PCR引物分组情况

多重PCR反应体系和反应条件同实例1。

(2)将两个样品多种PCR反应的产物全部混合在一起，进行聚丙烯酰氨PAGE凝胶核酸电泳，胶浓度为8％，跑胶时间4小时，其中，电流16mA，20分钟；30mA，3小时40分钟。结果如图4所示，4组多重PCR反应均能扩增出目的条带，而且目的条带出现的位置均在预期的范围内。

四、PCR产物(STR相关DNA文库)纯化

对两个样品多种PCR反应的产物全部混合在一起的PCR产物混合物进行纯化，按照SanPrep柱式PCR产物纯化试剂盒(上海生工，货号B518141)说明书操作指南来完成，Nanodrop分光光度计测得纯化后的DNA文库浓度为96.44ng/μl，260/280值为1.826。

五、文库质检

(1)文库质检由Agilent 2100来完成，质检结果如图5所示，由图形可以看出多重PCR扩增效果较为均一，没有扩增差异极大的偏好性，可以直接进行高通量测序。

六、大规模测序

(1)将纯化好的目的DNA文库用Illumina Miseq平台PE250进行高通量测序，测序完成后，结果输出为FASTQ格式文件，测序数据量63.6M。

(2)所测得匹配到STR基因座的reads数量为：686347。

七、测序数据分析

(1)选择双端测序中一端能覆盖STR核心重复序列的read为分析目标，另一端的read弃掉不用，截取每个目标read的前、后20-30个碱基从而定位每个read属于哪个STR基因座，若该read无法定位到目标STR基因座上则弃掉。每种STR匹配到的reads数见表9：

表9各STR基因座所定位的reads数

STR基因座	所定位的reads数目
		CSF1PO	9646
FGA	58728
		TH01	55099
TPOX	39217
		D3S1358	15413
D5S818	62128
		D7S820	108465
D8S1179	57787
		D13S317	76639
D16S539	45218
		D18S51	13047
D21S11	28294
		D2S1338	15417
CD4	22561
		D12S391	36707
D18S865	12472
		VWA	29509

(2)关于PCR反应过程中产生的Stutter带的影响，参照实例1中的办法分析，并最终分析得到细胞系基因座STR等位基因的核心重复单位的重复次数并与ATCC细胞库中细胞系对应的STR等位基因分型结果(所分析目标STR为：CSF1PO、D13S317、D16S539、D5S818、D7S820、TH01、TPOX、VWA)相比对，结果见表10、11。

表10一个未知细胞系的每个STR基因座重复单位的次数

STR基因座	重复次数
		CSF1PO	10
D13S317	11,12
		D16S539	9,13
D5S818	13
		D7S820	10
TH01	8
		TPOX	8,11
VWA	16,17

表11另一个未知细胞系的每个STR基因座重复单位的次数

故而，可以由上述STR基因座对应的等位基因分型结果判断两个未知细胞系分别属于NCI-H292细胞系和A549细胞系。

Claims

1.一种扩增子测序文库的构建方法，包括用多对融合引物对从待测样品获得的DNA模板进行多重PCR，回收PCR产物，得到测序文库；

其中所述多对融合引物分别针对DNA模板上的不同目的片段，每对融合引物从5'端到3'端依次包含测序接头序列和针对目的片段的特异性引物序列；

其中多重PCR按下述反应条件进行：95℃2min；38个循环，每个循环为95℃30s，然后从76℃到55℃和58℃之间的任意温度缓慢降温，每秒降0.1℃，待降至目的温度后保持20s，然后72℃30s；72℃2min。

2.权利要求1的构建方法，其中DNA模板是从待测样品中提取的基因组DNA。

3.权利要求1的构建方法，其中多重PCR反应分1个或多个反应体系完成。

4.非诊断目的的扩增子高通量测序方法，包括：利用权利要求1或2的方法制备测序文库，然后进行高通量测序。

5.权利要求4的方法，其中所述扩增子高通量测序的目的片段为多个STR基因座。

6.非诊断目的的STR基因座的检测方法，包括：利用上述扩增子测序文库构建方法制备针对多个STR基因座的测序文库，然后进行高通量测序并对测序数据进行数据分析。

7.权利要求6的检测方法，其中所述数据分析包括获得所述多个STR基因座核心重复序列的重复次数。

8.权利要求7的方法，所述数据分析还包括对链滑脱错配导致的影子带进行分析。

9.一种亲权鉴定方法，包括：利用权利要求7或8的方法测定基因组中STR基因座的重复次数，然后计算亲权指数(Pi值)。