CN106350590A - 用于高通量测序的dna文库构建方法 - Google Patents

用于高通量测序的dna文库构建方法 Download PDF

Info

Publication number
CN106350590A
CN106350590A CN201610807018.1A CN201610807018A CN106350590A CN 106350590 A CN106350590 A CN 106350590A CN 201610807018 A CN201610807018 A CN 201610807018A CN 106350590 A CN106350590 A CN 106350590A
Authority
CN
China
Prior art keywords
primer
locus
sequence
sequencing
str
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610807018.1A
Other languages
English (en)
Other versions
CN106350590B (zh
Inventor
王旭
钟嘉泳
张弓
董鸣
余卓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chaintech Medical (shenzhen) Technology Co Ltd
Original Assignee
Chaintech Medical (shenzhen) Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chaintech Medical (shenzhen) Technology Co Ltd filed Critical Chaintech Medical (shenzhen) Technology Co Ltd
Priority to CN201610807018.1A priority Critical patent/CN106350590B/zh
Publication of CN106350590A publication Critical patent/CN106350590A/zh
Application granted granted Critical
Publication of CN106350590B publication Critical patent/CN106350590B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Biochemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biomedical Technology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种扩增子测序文库的构建方法,包括用多对融合引物对从待测样品获得的DNA模板进行多重PCR,回收PCR产物,得到测序文库;其中所述多对融合引物分别针对DNA模板上的不同目的片段,融合引物包含针对目的片段的特异性引物序列和测序接头序列;其中多重PCR按下述反应条件进行:95℃2min;38个循环,每个循环为95℃30s,然后从76℃到55℃和58℃之间的任意温度缓慢降温,每秒降0.1℃,待降至58℃后保持20s,然后72℃30s;72℃2min,4℃保持。本发明还公开了该文库构建方法在高通量测序检测STR基因座和亲权鉴定中的应用。

Description

用于高通量测序的DNA文库构建方法
技术领域
本发明涉及生物检测领域,具体涉及一种用于高通量测序的DNA文库构建方法。
背景技术
法医DNA检验技术的研究和分析对象主要是生物体内DNA的多态性。一般来说,基因或非编码区的DNA标记在染色体上的位置称为基因座,而位于同一个基因座上不同序列的基因被称为等位基因。DNA多态性就是指作为遗传标记的基因座存在多个等位基因,分析基因座上等位基因的差异就是实现同一认定的生物学基础[1]。
微卫星DNA中的短串联重复序列(short tandem repeats,STR)[2]是一种DNA多态性,广泛存在于人类基因组的23对染色体上,通常由2-6bp的重复单位(或称核心序列,coresequence)组成,不同个体(或等位基因)之间的差异一般只表现为重复单位的重复数目差异。STR基因座是一种重要的遗传标记,在多态性程度高的基因座上,其个体识别能力强,并且可以简单地用PCR技术检测出来,因而被广泛应用。STR基因座具有以下特点:STR多态性基因座数量多,片段长度一般小于400bp,易于扩增,适于微量检材的检验;等位基因大小比较接近,较小等位基因优先扩增不明显;不同位点的STR基因座片段长度差异较小,便于复合扩增,提高检测效率。
STR基因座的分型检验技术在法医DNA检验、亲权鉴定中有着重要作用。我国大多数亲权鉴定实验室都使用多基因座STR分型技术作为主要手段,对不同的STR基因座多态性进行分析、比对并计算亲权指数(PI值,即真父可能性与假父可能性的比值)。依据国际上多数实验室[3]采用的标准(PI值≥10 000)作为区分是否“存在亲生关系”的界线。
传统的STR分型技术多以PCR技术和毛细管电泳技术为基础,使用荧光标记的引物对样品进行多重PCR扩增,产生不同大小的扩增片段并在毛细管电泳中分离,从而实现 分型,但这种方法通量较低,而且由于分析的对象是片段长度,无法进一步检测核酸一级结构的微小差异,限制了检测的分辨率,此外,在存在混合样品时可能出现Stutter峰(片段分析时出现于主峰前的小峰)的干扰。而Sanger测序法由于通量、成本的原因,难以用于STR分型分析。
二代高通量测序技术(Next Generation Sequencing)技术可以一次并行对几十万到几百万条DNA分子进行序列测定,促进了测序技术的高速发展。利用二代高通量测序技术可以对全基因组进行测序。当研究者只对特定的基因组区域感兴趣的时候,可以利用扩增子测序(Amplicon Sequencing)方法只对相应区域进行测序研究。通过设计感兴趣的基因组区域的引物,进行PCR扩增,对目标区域进行富集,然后针对特定长度的PCR产物或者捕获的片段进行建库,高通量测序并进行序列分析。
目前的扩增子测序都是通过常规的建库方法,在通过PCR扩增富集到目标区域后,进行混样,然后进行末端修复和加A,再加接头,纯化样品,回收目的条带,然后PCR扩增,再跑胶回收主带,这种常规的建库方法步骤繁琐、浪费时间、工作量大,不利于大量样品的测序建库。
发明内容
本发明的目的在于提供一种扩增子测序文库的构建方法以及该文库构建方法在高通量测序检测STR基因座中的应用,该方法可以通过一次扩增实现扩增子测序文库的构建,简化建库的操作过程,降低建库的时间和成本,同时不影响测序质量。
根据本发明的一个方面,提供一种扩增子测序文库的构建方法,包括用多对融合引物对从待测样品获得的DNA模板进行多重PCR,回收PCR产物,得到测序文库;其中所述多对融合引物分别针对DNA模板上的不同目的片段,每对融合引物从5'端到3'端依次包含测序接头序列和针对目的片段的特异性引物序列。
在优选的实施方案中,多重PCR按下述反应条件进行:95℃2min;38个循环,每个循环为95℃30s,然后从76℃到55℃和58℃之间的任意温度缓慢降温,每秒降0.1℃,待降至目的温度后保持20s,然后72℃30s;72℃2min。
本发明中,所述“多对融合引物”是指两对、三对、或更多对融合引物。
在更优选的实施方案中,多重PCR按下述反应条件进行:95℃2min;38个循环,每个循环为95℃30s,然后从76℃到58℃缓慢降温,每秒降0.1℃,待降至58℃后保持20s,然后72℃30s;72℃2min。
在一些实施方案中,待测样品包括但不限于血液、体液、唾液、***、毛发、肌肉或组织器官。在优选的实施方案中,DNA模板是从待测样品中提取的基因组DNA。
本发明中,每对融合引物分别包含针对目的片段的特异性正向引物序列和反向引物序列。
在一些实施方案中,测序接头序列中包含index序列,以标识不同的DNA模板,便于将不同样品混合测序。
本发明中融合引物中所包含的测序接头序列可以是:上游引物中5'-CCTCTCTATGGGCAGTCGGTGAT-3',下游引物中5'-CCATCTCATCCCTGCGTGTCTCCGACTCAG-index序列-GAT-3'。
本发明中融合引物中所包含的测序接头序列还可以是:上游引物中5'-AATGATACGGCGACCACCGAGATCTACAC-第一index序列-ACACTCTTTCCCTACACGACGCTCTTCCGATCT-3',下游引物中5'-CAAGCAGAAGACGGCATACGAGAT+第二index序列+GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT-3'。
其中第一index序列与第二index序列是不同的index序列。
在一些实施方案中,多重PCR反应分1个或多个反应体系来完成。
在优选的实施方案中,一个反应体系中包含两个、三个、四个、或五个针对不同目的片段的融合引物对。
在优选的实施方案中,所述目的片段是STR基因座。
在优选的实施方案中,目的片段包括选自下述STR基因座的两种或更多种STR基因座:
CSF1PO(GenBank X14720)、FGA(GenBank M64982)、TH01(GenBank D00269)、TPOX(GenBank M68651)、D3S1358(NT_005997positions 754983-755121)、D5S818(GenBankAC008512)、D7S820(GenBank AC004848)、D8S1179(GenBank AF216671)、 D13S317(GenBankAL353628)、D16S539(GenBank AC024591)、D18S51(GenBank AP001534)、D21S11(GenBankAP000433)、D2S1338(GenBank AC010136)、CD4(Genbank M86525)、D12S391(GenbankM08921)、PLA2A1(Genbank M22970)、FABP(Genbank M18079)、D18S865(GenbankAC012289.12)和VWA(Genbank M25858)。
在更优选的实施方案中,目的片段包括下述所有STR基因座:
CSF1PO(GenBank X14720)、FGA(GenBank M64982)、TH01(GenBank D00269)、TPOX(GenBank M68651)、D3S1358(NT_005997positions 754983-755121)、D5S818(GenBankAC008512)、D7S820(GenBank AC004848)、D8S1179(GenBank AF216671)、D13S317(GenBankAL353628)、D16S539(GenBank AC024591)、D18S51(GenBank AP001534)、D21S11(GenBankAP000433)、D2S1338(GenBank AC010136)、CD4(Genbank M86525)、D12S391(GenbankM08921)、PLA2A1(Genbank M22970)和FABP(Genbank M18079)。
在更优选的实施方案中,目的片段包括下述所有STR基因座:
CSF1PO(GenBank X14720)、FGA(GenBank M64982)、TH01(GenBank D00269)、TPOX(GenBank M68651)、D3S1358(NT_005997positions 754983-755121)、D5S818(GenBankAC008512)、D7S820(GenBank AC004848)、D8S1179(GenBank AF216671)、D13S317(GenBankAL353628)、D16S539(GenBank AC024591)、D18S51(GenBank AP001534)、D21S11(GenBankAP000433)、D2S1338(GenBank AC010136)、CD4(Genbank M86525)、D12S391(GenbankM08921)、D18S865(Genbank AC012289.12)和VWA(Genbank M25858)。
其中针对各个STR基因座的特异性正向引物序列和反向引物序列如下所示:
CSF1PO:正向5'-3':TAGCAGGTTGCTAACCACCC,反向5'-3':TCAGACCCTGTTCTAAGTACTTC;
FGA:正向5'-3':CCCATAGGTTTTGAACTCACAG,反向5'-3':GTGATTTGTCTGTAATTGCCAGC;
TH01:正向5'-3':GGGCAAAATTCAAAGGGTATCTG,反向5'-3':TGCAGGTCACAGGGAACAC;
TPOX:正向5'-3':AGGCACTTAGGGAACCCTC,反向5'-3':TCCTTGTCAGCGTTTATTTGCC;
D3S1358:正向5'-3':CAAGACCCTGTCTCATAGATAG,反向5'-3':TCAACAGAGGCTTGCATGTATC;
D5S818:正向5'-3':GTGACAAGGGTGATTTTCCTCTT,反向5'-3':GTGATTCCAATCATAGCCACAG;
D7S820:正向5'-3':GGTCAGGCTGACTATGGAG,反向5'-3':TCCTCATTGACAGAATTGCACC;
D8S1179:正向5'-3':TCTTTTTGCCCACACGGCC,反向5'-3':CTGTAGATTATTTTCACTGTGGGG;
D13S317:正向5'-3':ATTTCTTTAGTGGGCATCCGTG,反向5'-3':CCTTCAACTTGGGTTGAGCC;
D16S539:正向5'-3':CAGATCCCAAGCTCTTCCTC,反向5'-3':GCATGTATCTATCATCCATCTCTG;
D18S51:正向5'-3':CACTTCACTCTGAGTGACAAATTG,反向5'-3':GTGTGGAGATGTCTTACAATAACAG;
D21S11:正向5'-3':TCAATTCCCCAAGTGAATTGCC,反向5'-3':TGTTCTCCAGAGACAGACTAATAG;
D2S1338:正向5'-3':GTGGATTTGGAAACAGAAATGGC,反向5'-3':GTGGCCCATAATCATGAGTTATTC;
CD4:正向5'-3':AGGGGTACTTGTGTTAATTGTTGG,反向5'-3':GCGTTTTCCAGTCTGAAAAAAGTG;
D12S391:正向5'-3':GAATCAACAGGATCAATGGATGC,反向5'-3':CCTCCATATCACTTGAGCTAATTC;
FABP:正向5'-3':TTGTAAGCTCCATGAGGTTAGAG,反向5'-3':AGCCTCCCTAGGTCAGATAG;
PLA2A1:正向5'-3':TAGTATCAGTTTCATAGGGTCACC,反向5'-3':AGTTCGTTTCCATTGTCTGTCC;
D18S865:正向5'-3':CAAATGTAGATCTTGGGACTTGTC,反向5'-3':ATTCTCAAACATCCCCATTACCTTC;
VWA:正向5'-3':TCAGTATGTGACTTGGATTGATC,反向5'-3':CAGGTTAGATAGATTAGACAGACAG。
在优选的实施方案中,多重PCR反应分1个或多个反应体系来完成。所述多个反应体系包括选自下组的一个或更多个反应体系:
包含针对TPOX基因座的融合引物和针对D18S51基因座的融合引物的反应体系;
包含针对D8S1179基因座的融合引物和针对D21S11基因座的融合引物的反应体系;
包含针对TPOX基因座的融合引物、针对D18S51基因座的融合引物、针对D8S1179基因座的融合引物和针对D21S11基因座的融合引物的反应体系;
包含针对CSF1PO基因座的融合引物、针对D3S1358基因座的融合引物、针对D13S317基因座的融合引物和针对D12S391基因座的融合引物的反应体系;
包含针对FGA基因座的融合引物、针对TH01基因座的融合引物、针对D5S818基因座的融合引物和针对PLA2A1基因座的融合引物的反应体系;
包含针对FGA基因座的融合引物、针对TH01基因座的融合引物、针对D5S818基因座的融合引物和针对VMA基因座的融合引物的反应体系;
包含针对D7S820基因座的融合引物、针对D16S539基因座的融合引物、针对D2S1338基因座的融合引物、针对CD4基因座的融合引物和FABP引物的反应体系;和
包含针对D7S820基因座的融合引物、针对D16S539基因座的融合引物、针对D2S1338基因座的融合引物、针对CD4基因座的融合引物和针对D18S865基因座的融合引物的反应体系。
在更优选的实施方案中,所述多个反应体系包括选自下组的一个或更多个反应体系:
包含1.5μM针对TPOX基因座的融合引物和3.5μM针对D18S51基因座的融合引物的反应体系;
包含1.5μM针对D8S1179基因座的融合引物和3.5μM针对D21S11基因座的融合引物的反应体系;
包含1μM针对TPOX基因座的融合引物、1.5μM针对D18S51基因座的融合引物、1μM针对D8S1179基因座的融合引物和1.5μM针对D21S11基因座的融合引物的反应体系;
包含1μM针对CSF1PO基因座的融合引物、2μM针对D3S1358基因座的融合引物、1μM针对D13S317基因座的融合引物和1μM针对D12S391基因座的融合引物的反应体系;
包含1μM针对CSF1PO基因座的融合引物、1μM针对D3S1358基因座的融合引物、1μM针对D13S317基因座的融合引物和2μM针对D12S391基因座的融合引物的反应体系;
包含1μM针对FGA基因座的融合引物、1.5μM针对TH01基因座的融合引物、1.5μM针对D5S818基因座的融合引物和1μM针对PLA2A1基因座的融合引物的反应体系;
包含1.5μM针对FGA基因座的融合引物、1μM针对TH01基因座的融合引物、1.5μM针对D5S818基因座的融合引物和1μM针对VMA基因座的融合引物的反应体系;
包含1μM针对D7S820基因座的融合引物、1μM针对D16S539基因座的融合引物、1μM针对D2S1338基因座的融合引物、1μM针对CD4基因座的融合引物和1μM FABP引物的反应体系;和
包含1μM针对D7S820基因座的融合引物、1μM针对D16S539基因座的融合引物、1μM针对D2S1338基因座的融合引物、1μM针对CD4基因座的融合引物和1μM针对D18S865基因座的融合引物的反应体系。
还可以根据情况选择其他STR基因座。备选STR基因座选择见网址:http://www.cstl.nist.gov/biotech/strbase/seq_info.htm,该网址是美国法医学的一个权威网站,其中提供了法医亲缘关系鉴定中涉及的STR基因座。这些STR基因座的参考序列信息可以从网址http://www.cstl.nist.gov/biotech/strbase/seq_ref.htm获得。
所述扩增子测序文库的构建方法适用于对任何扩增子的高通量测序,例如可用于通过高通量测序检测STR基因座、SNP、SNV、一定范围的***缺失突变等,但不限于此。
本发明的另一个方面提供扩增子高通量测序的方法,包括:利用上述扩增子测序文库构建方法制备测序文库,然后进行高通量测序并对测序数据进行数据分析。
所述扩增子高通量测序的目标片段包括但不限于包含STR基因座或包含SNP位点的片段。在优选的实施方案中,所述扩增子高通量测序的目标片段为多个STR基因座。
本发明的另一个方面提供STR基因座的检测方法,包括:利用上述扩增子测序文库构建方法制备针对多个STR基因座的测序文库,然后进行高通量测序并对测序数据进行数据分析。
在优选的实施方案中,所述数据分析包括获得所述多个STR基因座核心重复序列的重复次数。
在一些实施方案中,所述数据分析还包括对链滑脱错配导致的影子带进行分析。
在一些实施方案中,所述数据分析进一步包括获得所述多个STR基因座中的突变信息。
在一些实施方案中,本发明的扩增子高通量测序的方法和STR基因座的检测方法是非诊断目的的。
本发明的检测STR基因座的方法可用于法医以及其它涉及STR基因座检测的相关领域,如基因诊断、遗传图谱构建和群体遗传学研究等领域。在优选的实施方案中,本发明的检测STR基因座的方法用于亲权鉴定。
本发明还提供一种亲权鉴定方法,包括:通过上述STR基因座的检测方法检测基因组中的重复次数,然后计算亲权指数(Pi值)。
本发明的有益效果是:
(1)本发明的整个建库过程仅通过一次多重PCR即可完成,大大降低了扩增子测序建库的时间和成本。当应用于STR基因座分析和亲权关系鉴定时,可简化流程并降低成本。
(2)本发明的扩增子建库方法对多重PCR反应条件进行了优化设计,适用于各种扩增子的高通量测序,对引物没有选择性,使用不同的引物均可以通过本发明的建库方法一次扩增建库。
附图说明
图1是实施例1中多重PCR反应产物的琼脂糖凝胶电泳图。
图2是实施例1中的文库质检图。
图3是实施例1中每个STR的测序数据中不同重复次数的分布图。
图4是实施例2中多重PCR反应产物的聚丙烯酰氨PAGE凝胶核酸电泳图。
图5是实施例2中的文库质检图。
具体实施方式
为了能够更清楚地理解本发明的技术内容,特举以下实施例结合附图详细说明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,或按照制造厂商所建议的条件。实施例中所用到的各种化学试剂和生物制剂,均为市售产品。
实施例1:法医亲缘关系鉴定
本实施例目的为检测STR中重复序列的重复次数,其中使用NGS测序方案。
一、口腔上皮细胞采集与处理
(1)用口腔拭子采集管采集人的口腔上皮细胞。
(2)用口腔拭子基因组提取试剂盒(DP322)提取口腔上皮细胞DNA。
(3)使用Nanodrop 2000型分光光度计测定OD260nm和OD280nm,确认其纯度高,并测定其浓度。
二、多重PCR反应引物设计
(1)引物设计成融合引物,包括目的片段的特异性引物序列和测序接头序列,其中含有index序列。
(2)融合引物结构为:
上游引物:5’-CCTCTCTATGGGCAGTCGGTGAT-3'+目的片段特异性正向引物;
下游引物:5'-CCATCTCATCCCTGCGTGTCTCCGACTCAGCTAAGGTAACGAT-3'+目的片段特异性反向引物;
其中下划线序列为index序列。
(3)待扩增和测序的STR基因座以及对应的特异性引物见表1。
表1STR基因座对应的特异性引物
STR基因座 正向引物5'-3' 反向引物5'-3'
CSF1PO TAGCAGGTTGCTAACCACCC TCAGACCCTGTTCTAAGTACTTC
FGA CCCATAGGTTTTGAACTCACAG GTGATTTGTCTGTAATTGCCAGC
TH01 GGGCAAAATTCAAAGGGTATCTG TGCAGGTCACAGGGAACAC
TPOX AGGCACTTAGGGAACCCTC TCCTTGTCAGCGTTTATTTGCC
D3S1358 CAAGACCCTGTCTCATAGATAG TCAACAGAGGCTTGCATGTATC
D5S818 GTGACAAGGGTGATTTTCCTCTT GTGATTCCAATCATAGCCACAG
D7S820 GGTCAGGCTGACTATGGAG TCCTCATTGACAGAATTGCACC
D8S1179 TCTTTTTGCCCACACGGCC CTGTAGATTATTTTCACTGTGGGG
D13S317 ATTTCTTTAGTGGGCATCCGTG CCTTCAACTTGGGTTGAGCC
D16S539 CAGATCCCAAGCTCTTCCTC GCATGTATCTATCATCCATCTCTG
D18S51 CACTTCACTCTGAGTGACAAATTG GTGTGGAGATGTCTTACAATAACAG
D21S11 TCAATTCCCCAAGTGAATTGCC TGTTCTCCAGAGACAGACTAATAG
D2S1338 GTGGATTTGGAAACAGAAATGGC GTGGCCCATAATCATGAGTTATTC
CD4 AGGGGTACTTGTGTTAATTGTTGG GCGTTTTCCAGTCTGAAAAAAGTG
D12S391 GAATCAACAGGATCAATGGATGC CCTCCATATCACTTGAGCTAATTC
FABP TTGTAAGCTCCATGAGGTTAGAG AGCCTCCCTAGGTCAGATAG
PLA2A1 TAGTATCAGTTTCATAGGGTCACC AGTTCGTTTCCATTGTCTGTCC
三、多重PCR反应建库以及核酸琼脂糖凝胶电泳
分五组进行多重PCR反应,分组情况以及各种引物浓度如表2所示。
表2多重PCR引物分组情况
多重PCR所用试剂为DreamTaq Green PCR Master Mix 2X(Thermo Fisher,货号K1081),反应体系见表3:
表3多重PCR反应体系
采用缓慢降温法进行多重PCR反应,反应条件如表4所示。
表4多重PCR反应条件
对PCR反应产物进行琼脂糖凝胶电泳,电泳的条件设定为:电压120V,电流400mA,时间是30min,胶浓度是1.5%,marker条带标准从下至上依次是:100bp、200bp、300bp、400bp、500bp、700bp、1kb、1600bp、2kb、5kb、8kb、10kb,结果如图1所示,5组多重PCR反应均能扩增出目的条带,而且目的条带出现的位置均在预期的范围内。
用SanPrep柱式PCR产物纯化试剂盒(上海生工,货号B518141)纯化预先混合过的五组多重PCR产物,按制造商说明进行纯化,得到用于测序的DNA文库。Nanodrop分光光度计测得纯化后的DNA文库浓度为128.73ng/μl,260/280值为1.944。
四、文库质检
文库质检由Agilent 2100来完成,质检结果如图2所示,由图形可以看出多重PCR扩增效果较为均一,没有扩增差异极大的偏好性,可以直接进行高通量测序。
五、大规模测序
(1)利用上述制备的DNA测序文库用Ion torrent平台SE400进行高通量测序,测序完成后,结果输出为FASTQ格式文件,测序数据量67M,测得匹配到STR基因座的reads数量为490536。
六、测序数据处理
(1)截取每个read的前、后20-30个碱基从而定位每个read属于哪个STR基因座,若该read无法定位到目标STR基因座上则弃掉。每种STR匹配到的reads数见表5。
表5各STR基因座所定位的reads数目
(2)由于多重PCR反应在引物延伸过程中,引物链或模板链滑脱,导致一个重复单位形成的碱基非配对环,即链滑脱错配机制,最终产生影子带(Stutter)。为方便分析影子带的影响,最终以测序数据中每个STR对应reads上分析得到的核心重复单位的重复次数类型为横坐标,以每种类型所对应的reads数的百分比为纵坐标,做直方图,如图3(a-q)所示。
(4)测试样品中每个STR基因座重复单位的次数如表6:
表6每个STR基因座重复单位的次数
STR基因座 重复次数
CSF1PO 10,11
FGA 21,23
TH01 7,9
TPOX 8
D3S1358 16
D5S818 11
D7S820 10
D8S1179 13,14
D13S317 8,10
D16S539 9,10
D18S51 18
D21S11 31,32
D2S1338 19,23
CD4 5
D12S391 18
FABP 10
PLA2A1 11,14
实施例2:检测未知细胞系属于哪种细胞系
本实施例使用人的2个未知细胞系,通过检测STR中重复序列的重复次数从而确认未知细胞系属于哪种细胞系。其中使用NGS测序方案。
一、人细胞系DNA的提取
(1)人细胞系DNA提取采用外周血DNA试剂盒(Qiagen,货号937236)。
(2)使用Nanodrop 2000型分光光度计测定OD260nm和OD280nm,确认其纯度高,并测定其浓度,最终浓度为51ng/μl。
二、多重PCR反应建库以及聚丙烯酰氨PAGE凝胶核酸电泳
(1)引物设计成融合引物,包括目的片段的特异性引物序列和测序接头序列,其中含有index序列。
(2)融合引物结构为:
样品一:
上游引物:5’-AATGATACGGCGACCACCGAGATCTACAC-3'+index序列1(CTCTCTAT)+ACACTCTTTCCCTACACGACGCTCTTCCGATCT+目的片段特异性正向引物;
下游引物:5'-CAAGCAGAAGACGGCATACGAGAT-3'+index序列2(TCGCCTTA)+GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT+目的片段特异性反向引物;
样品二:
上游引物:5’-AATGATACGGCGACCACCGAGATCTACAC-3'+index序列1(TATCCTCT)+ACACTCTTTCCCTACACGACGCTCTTCCGATCT+目的片段特异性正向引物;
下游引物:5'-CAAGCAGAAGACGGCATACGAGAT-3'+index序列2(CTAGTACG)+GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT+目的片段特异性反向引物;
(3)待扩增和测序的STR基因座以及对应的特异性引物见表7。
表7STR基因座对应的特异性引物
三、多重PCR反应建库以及聚丙烯酰氨PAGE凝胶核酸电泳
(1)多重PCR反应使用DreamTaq Green PCR Master Mix(2X)试剂(赛默飞世尔,货号K1081)进行PCR反应,分4组多重PCR反应来完成目标STR的DNA文库构建,分组情况以及各种引物浓度如表8所示,多重PCR反应条件如同实例1中的反应条件。
表8多重PCR引物分组情况
多重PCR反应体系和反应条件同实例1。
(2)将两个样品多种PCR反应的产物全部混合在一起,进行聚丙烯酰氨PAGE凝胶核酸电泳,胶浓度为8%,跑胶时间4小时,其中,电流16mA,20分钟;30mA,3小时40分钟。结果如图4所示,4组多重PCR反应均能扩增出目的条带,而且目的条带出现的位置均在预期的范围内。
四、PCR产物(STR相关DNA文库)纯化
对两个样品多种PCR反应的产物全部混合在一起的PCR产物混合物进行纯化,按照SanPrep柱式PCR产物纯化试剂盒(上海生工,货号B518141)说明书操作指南来完成,Nanodrop分光光度计测得纯化后的DNA文库浓度为96.44ng/μl,260/280值为1.826。
五、文库质检
(1)文库质检由Agilent 2100来完成,质检结果如图5所示,由图形可以看出多重PCR扩增效果较为均一,没有扩增差异极大的偏好性,可以直接进行高通量测序。
六、大规模测序
(1)将纯化好的目的DNA文库用Illumina Miseq平台PE250进行高通量测序,测序完成后,结果输出为FASTQ格式文件,测序数据量63.6M。
(2)所测得匹配到STR基因座的reads数量为:686347。
七、测序数据分析
(1)选择双端测序中一端能覆盖STR核心重复序列的read为分析目标,另一端的read弃掉不用,截取每个目标read的前、后20-30个碱基从而定位每个read属于哪个STR基因座,若该read无法定位到目标STR基因座上则弃掉。每种STR匹配到的reads数见表9:
表9各STR基因座所定位的reads数
STR基因座 所定位的reads数目
CSF1PO 9646
FGA 58728
TH01 55099
TPOX 39217
D3S1358 15413
D5S818 62128
D7S820 108465
D8S1179 57787
D13S317 76639
D16S539 45218
D18S51 13047
D21S11 28294
D2S1338 15417
CD4 22561
D12S391 36707
D18S865 12472
VWA 29509
(2)关于PCR反应过程中产生的Stutter带的影响,参照实例1中的办法分析,并最终分析得到细胞系基因座STR等位基因的核心重复单位的重复次数并与ATCC细胞库中细胞系对应的STR等位基因分型结果(所分析目标STR为:CSF1PO、D13S317、D16S539、D5S818、D7S820、TH01、TPOX、VWA)相比对,结果见表10、11。
表10一个未知细胞系的每个STR基因座重复单位的次数
STR基因座 重复次数
CSF1PO 10
D13S317 11,12
D16S539 9,13
D5S818 13
D7S820 10
TH01 8
TPOX 8,11
VWA 16,17
表11另一个未知细胞系的每个STR基因座重复单位的次数
故而,可以由上述STR基因座对应的等位基因分型结果判断两个未知细胞系分别属于NCI-H292细胞系和A549细胞系。

Claims (9)

1.一种扩增子测序文库的构建方法,包括用多对融合引物对从待测样品获得的DNA模板进行多重PCR,回收PCR产物,得到测序文库;
其中所述多对融合引物分别针对DNA模板上的不同目的片段,每对融合引物从5'端到3'端依次包含测序接头序列和针对目的片段的特异性引物序列;
其中多重PCR按下述反应条件进行:95℃2min;38个循环,每个循环为95℃30s,然后从76℃到55℃和58℃之间的任意温度缓慢降温,每秒降0.1℃,待降至目的温度后保持20s,然后72℃30s;72℃2min。
2.权利要求1的构建方法,其中DNA模板是从待测样品中提取的基因组DNA。
3.权利要求1的构建方法,其中多重PCR反应分1个或多个反应体系完成。
4.非诊断目的的扩增子高通量测序方法,包括:利用权利要求1或2的方法制备测序文库,然后进行高通量测序。
5.权利要求4的方法,其中所述扩增子高通量测序的目的片段为多个STR基因座。
6.非诊断目的的STR基因座的检测方法,包括:利用上述扩增子测序文库构建方法制备针对多个STR基因座的测序文库,然后进行高通量测序并对测序数据进行数据分析。
7.权利要求6的检测方法,其中所述数据分析包括获得所述多个STR基因座核心重复序列的重复次数。
8.权利要求7的方法,所述数据分析还包括对链滑脱错配导致的影子带进行分析。
9.一种亲权鉴定方法,包括:利用权利要求7或8的方法测定基因组中STR基因座的重复次数,然后计算亲权指数(Pi值)。
CN201610807018.1A 2016-09-06 2016-09-06 用于高通量测序的dna文库构建方法 Active CN106350590B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610807018.1A CN106350590B (zh) 2016-09-06 2016-09-06 用于高通量测序的dna文库构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610807018.1A CN106350590B (zh) 2016-09-06 2016-09-06 用于高通量测序的dna文库构建方法

Publications (2)

Publication Number Publication Date
CN106350590A true CN106350590A (zh) 2017-01-25
CN106350590B CN106350590B (zh) 2019-12-10

Family

ID=57859817

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610807018.1A Active CN106350590B (zh) 2016-09-06 2016-09-06 用于高通量测序的dna文库构建方法

Country Status (1)

Country Link
CN (1) CN106350590B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106906210A (zh) * 2017-04-05 2017-06-30 北京泛生子医学检验实验室有限公司 一种快速构建扩增子文库的融合引物组合
CN107012139A (zh) * 2017-04-05 2017-08-04 北京泛生子医学检验实验室有限公司 一种快速构建扩增子文库的方法
CN107937986A (zh) * 2017-11-10 2018-04-20 深圳裕策生物科技有限公司 一种ffpe dna建库用试剂盒、其用途及建库方法
CN108949942A (zh) * 2018-07-17 2018-12-07 浙江大学 一种基于高通量测序的线粒体全基因组测序方法
CN109797437A (zh) * 2019-01-18 2019-05-24 北京爱普益生物科技有限公司 一种检测多个样品时测序文库的构建方法及其应用
CN110499372A (zh) * 2019-09-18 2019-11-26 山西医科大学 基于高通量测序技术的多重pcr靶向捕获分型体系及试剂盒
CN110499373A (zh) * 2019-09-18 2019-11-26 山西医科大学 鉴定复杂亲缘关系的高通量str分型***及试剂盒
CN110734982A (zh) * 2019-09-18 2020-01-31 山西医科大学 基于高通量测序技术的连锁常染色体str分型***及试剂盒
CN113736865A (zh) * 2021-09-09 2021-12-03 元码基因科技(北京)股份有限公司 用于检测样本中基因拷贝数变异的试剂盒、反应体系及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101397584A (zh) * 2007-09-25 2009-04-01 阿普里拉股份有限公司 在中国人群中具有改善的鉴别能力的复合str测定方法以及试剂盒
CN104059980A (zh) * 2014-06-30 2014-09-24 无锡中德美联生物技术有限公司 人x染色体dna19个基因座复合扩增试剂盒及应用
CN104263726A (zh) * 2014-09-25 2015-01-07 天津诺禾致源生物信息科技有限公司 适用于扩增子测序文库构建的引物及扩增子测序文库的构建方法
CN104293783A (zh) * 2014-09-30 2015-01-21 天津诺禾致源生物信息科技有限公司 适用于扩增子测序文库构建的引物、构建方法、扩增子文库及包含其的试剂盒

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101397584A (zh) * 2007-09-25 2009-04-01 阿普里拉股份有限公司 在中国人群中具有改善的鉴别能力的复合str测定方法以及试剂盒
CN104059980A (zh) * 2014-06-30 2014-09-24 无锡中德美联生物技术有限公司 人x染色体dna19个基因座复合扩增试剂盒及应用
CN104263726A (zh) * 2014-09-25 2015-01-07 天津诺禾致源生物信息科技有限公司 适用于扩增子测序文库构建的引物及扩增子测序文库的构建方法
CN104293783A (zh) * 2014-09-30 2015-01-21 天津诺禾致源生物信息科技有限公司 适用于扩增子测序文库构建的引物、构建方法、扩增子文库及包含其的试剂盒

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
唐炳华主编: "《分子生物学【M】》", 31 May 2011, 北京:中国中医药出版社 *
邓建强等: "STR滑脱模型的构建及其影响因素", 《法医学杂志》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106906210A (zh) * 2017-04-05 2017-06-30 北京泛生子医学检验实验室有限公司 一种快速构建扩增子文库的融合引物组合
CN107012139A (zh) * 2017-04-05 2017-08-04 北京泛生子医学检验实验室有限公司 一种快速构建扩增子文库的方法
CN107937986A (zh) * 2017-11-10 2018-04-20 深圳裕策生物科技有限公司 一种ffpe dna建库用试剂盒、其用途及建库方法
CN108949942A (zh) * 2018-07-17 2018-12-07 浙江大学 一种基于高通量测序的线粒体全基因组测序方法
CN109797437A (zh) * 2019-01-18 2019-05-24 北京爱普益生物科技有限公司 一种检测多个样品时测序文库的构建方法及其应用
CN110499372A (zh) * 2019-09-18 2019-11-26 山西医科大学 基于高通量测序技术的多重pcr靶向捕获分型体系及试剂盒
CN110499373A (zh) * 2019-09-18 2019-11-26 山西医科大学 鉴定复杂亲缘关系的高通量str分型***及试剂盒
CN110734982A (zh) * 2019-09-18 2020-01-31 山西医科大学 基于高通量测序技术的连锁常染色体str分型***及试剂盒
CN110499372B (zh) * 2019-09-18 2020-05-12 山西医科大学 基于高通量测序技术的多重pcr靶向捕获分型体系及试剂盒
CN110734982B (zh) * 2019-09-18 2020-08-07 山西医科大学 基于高通量测序技术的连锁常染色体str分型***及试剂盒
CN113736865A (zh) * 2021-09-09 2021-12-03 元码基因科技(北京)股份有限公司 用于检测样本中基因拷贝数变异的试剂盒、反应体系及方法

Also Published As

Publication number Publication date
CN106350590B (zh) 2019-12-10

Similar Documents

Publication Publication Date Title
CN106350590A (zh) 用于高通量测序的dna文库构建方法
CN108517363B (zh) 一种基于二代测序的个体识别体系、试剂盒及其用途
CN109468384B (zh) 一种同时检测45个y基因座的复合扩增检测试剂盒
CN104946632A (zh) 一种具有增强鉴别能力的常染色体str基因座荧光标记复合扩增试剂盒及其应用
CN104131072B (zh) 一种对未知检材进行个体识别和亲权鉴定的方法和***
CN108060237B (zh) 基于55个y染色体snp遗传标记的法医学复合检测试剂盒
WO2018147438A1 (ja) Hla遺伝子のpcrプライマーセット及びそれを用いたシークエンス法
CN103602735A (zh) 利用高通量测序精确测定线粒体dna高频和低频突变的方法
CN103898226B (zh) 一种线粒体snp荧光标记复合扩增试剂盒及其应用
CN106399496B (zh) 高通量检测str遗传标记的建库试剂盒
KR20130142523A (ko) 차세대 염기서열 분석법을 위한 융합 프라이머의 설계방법 그리고 이러한 융합 프라이머 및 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법
CN112592981B (zh) 用于dna档案建库的引物组、试剂盒和方法
CN108823294B (zh) 基于20个单倍群d的y-snp遗传标记的法医学复合检测试剂盒
CN103270174B (zh) 化学增强型引物组合物、方法和试剂盒
CN107988385B (zh) 一种检测肉牛PLAG1基因Indel标记的方法及其专用试剂盒
CN104031989B (zh) 一种人基因组dna26个基因座的复合扩增的试剂盒
CN108753952A (zh) 一种用于人类slc25a13基因10个常见突变位点的基因分型检测试剂盒
CN102286476B (zh) Str分型标准物质
CN108517364B (zh) 基于56个y染色体snp遗传标记的法医学复合检测试剂盒
CN102286477B (zh) Str分型标准物质的制备方法
CN108642190B (zh) 基于14个常染色体snp遗传标记的法医学复合检测试剂盒
Vajpayee et al. Forensic DNA typing: inception, methodology, and technical advancements
CN113943789A (zh) 一种人红细胞血型抗原***基因分型的多重pcr方法、引物及试剂盒
CN107904297B (zh) 用于微生物多样性研究的引物组、接头组和测序方法
CN117265091B (zh) 一种用于hla-drb3/4/5基因分型的引物组、试剂盒及应用

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant