CN112626223A - 一种基于多重pcr技术和dnb技术的str分型方法 - Google Patents
一种基于多重pcr技术和dnb技术的str分型方法 Download PDFInfo
- Publication number
- CN112626223A CN112626223A CN202010814836.0A CN202010814836A CN112626223A CN 112626223 A CN112626223 A CN 112626223A CN 202010814836 A CN202010814836 A CN 202010814836A CN 112626223 A CN112626223 A CN 112626223A
- Authority
- CN
- China
- Prior art keywords
- str
- pcr
- dnb
- round
- amplification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000005516 engineering process Methods 0.000 title claims abstract description 52
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000012163 sequencing technique Methods 0.000 claims abstract description 50
- 238000006243 chemical reaction Methods 0.000 claims abstract description 31
- 238000012408 PCR amplification Methods 0.000 claims abstract description 25
- 238000007403 mPCR Methods 0.000 claims abstract description 22
- 238000007363 ring formation reaction Methods 0.000 claims abstract description 14
- 238000011156 evaluation Methods 0.000 claims abstract description 13
- 108020004414 DNA Proteins 0.000 claims description 61
- 230000003321 amplification Effects 0.000 claims description 34
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 33
- 238000013461 design Methods 0.000 claims description 10
- 108091093088 Amplicon Proteins 0.000 claims description 6
- 238000012360 testing method Methods 0.000 claims description 6
- 108090000790 Enzymes Proteins 0.000 claims description 4
- 102000004190 Enzymes Human genes 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000011144 upstream manufacturing Methods 0.000 claims description 3
- 241000282414 Homo sapiens Species 0.000 description 81
- 239000013615 primer Substances 0.000 description 28
- 238000003752 polymerase chain reaction Methods 0.000 description 22
- 239000000047 product Substances 0.000 description 9
- 238000001514 detection method Methods 0.000 description 7
- 230000003252 repetitive effect Effects 0.000 description 7
- 239000012634 fragment Substances 0.000 description 6
- 238000005251 capillar electrophoresis Methods 0.000 description 4
- 108020004638 Circular DNA Proteins 0.000 description 3
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 238000004132 cross linking Methods 0.000 description 3
- 230000004907 flux Effects 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 238000012165 high-throughput sequencing Methods 0.000 description 3
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- 239000007795 chemical reaction product Substances 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 239000002077 nanosphere Substances 0.000 description 2
- 238000007481 next generation sequencing Methods 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 108700028369 Alleles Proteins 0.000 description 1
- 239000003155 DNA primer Substances 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 108091092584 GDNA Proteins 0.000 description 1
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 1
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6888—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6834—Enzymatic or biochemical coupling of nucleic acids to a solid phase
- C12Q1/6837—Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/686—Polymerase chain reaction [PCR]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Zoology (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Analytical Chemistry (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Molecular Biology (AREA)
- Immunology (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种基于多重PCR技术和DNB技术的STR分型方法,包括S1.提取待测样品DNA;S2.针对所选取的STR位点设计多重PCR引物并建立关于DNB环化中STR序列交叉互连的评估体系;S3.以步骤S1待测样本DNA为模板,利用步骤S2设计的多重PCR引物进行第一轮PCR扩增反应;S4.将第一轮PCR产物纯化,进行第二轮PCR扩增引入高通量Index;S5.将第二轮PCR扩增回收、纯化;S6.PCR产物进行DNB测序。本发明提供了通过一套适用于DNB测序和环化的STR序列交叉互连一整套评估体系,成功建立了基于多重PCR技术和DNB技术的STR分型方法。
Description
技术领域
本发明涉及生物技术领域,更具体地,涉及一种基于多重PCR技术和DNB 技术的STR分型方法。
背景技术
短片段重复序列(short tandem repeat,STR)分型技术是目前国内外法医学进行个体识别和亲子鉴定的主要手段,具有简单快速、结果可靠、灵敏度高、重复性好的特点。常染色体STR、Y-STR和X-STR等多种遗传标记的联用对于二联体亲缘鉴定及更复杂的亲缘鉴定具有独特的应用价值。
当前法医STR分型检测方法主要为PCR-毛细管电泳法。该方法的主要原理为:①提取DNA,使用磁珠、酚/氯仿、Chelex等方法提取出纯度高、完整性好、浓度适当的DNA样品;②进行PCR扩增,PCR(聚合酶链式反应)技术是以待扩增的两条DNA链为模板,在一对人工合成的寡核苷酸引物的介导下,通过耐高温DNA聚合酶的酶促作用,快速特异地扩增出目的DNA片段;③毛细管电泳,是以Sanger酶法为原理,采用耐热DNA聚合酶参照待测模板生成一系列链终止片段。在此过程中,以4种不同的荧光染料标记反应产物,并将反应产物经过毛细管电泳分离,采用固定的激光光源对荧光信号进行激发,通过CCD(电荷耦合器件)检测收集数据,计算机分析处理得到序列信息的过程。④确定样品的STR分型。电泳后对荧光颜色不同的DNA片段的峰进行长度检测,将DNA 片段与内标进行比较确定其长度,并对应不同的颜色,最后与以同样方式确定的等位基因Ladder进行比较,得到样品的STR分型。目前基于传统的PCR-毛细管电泳的STR技术主要缺点为,一是同时检测的法医位点少,通量低,虽然多色荧光***的升级推动了一次性检测位点数的增加,但是目前仍然难以超过60 个,与此同时法医学需求检测的常染色体 STR、YSTR和XSTR的数目逐年增加。二是获得序列信息的完整性有限。基于一代CE技术的传统STR分型法,只能获得扩增子的相对长度信息,无法获得STR重复区和侧翼区的完整碱基序列,未能充分考虑序列可能存在的变异及对测序结果的影响,限制了法医DNA检测的应用场景。
高通量测序技术(High-throughput sequencing)又称“下一代”测序技术 ("Next-generation"sequencing technology),该技术可以对数百万个DNA分子进行同时测序,这使得对一个物种的转录组和基因组进行细致全貌的分析成为可能,堪称测序技术发展历程的一个里程碑。专利CN102943111A公开了高通量 DNA测序法用于测定人类基因组中短片段串联重复基因座的用途及方法,专利 CN104673907A公开了一种用于高通量检验STR分型的***及其检测方法,但是上述基于传统高通量测序技术的STR分型方法的准确性依然有待提高。DNB 测序技术基于现有二代测序开发的新的测序技术,基因组DNA首先经过片段化处理,再加上接头序列,并环化形成单链环状DNA,随后使用的滚环扩增技术(Rollingcircle amplification,RCA)可将单链环状DNA扩增2-3个数量级,所产生的扩增产物称为DNA纳米球(DNAnanoball,DNB),最终纳米球经过DNB 装载技术固定在阵列化的硅芯片上。与其他二代测序技术相比较,DNB测序技术具有以下几个优势:(1)DNB通过增加待测DNA的拷贝数而增强了信号强度,从而提高测序准确度;(2)不同于PCR指数扩增,滚环扩增技术的扩增错误不会累积;(3)DNB与芯片上活化位点的大小相同,每个位点只固定一个DNB,保证信号点之间不产生相互干扰;(4)阵列化测序芯片和DNB测序技术的结合,使得成像***像素和测序芯片的面积得到最大化利用。目前,现有技术中,还未见有基于多重PCR技术和DNB技术的STR分型方法。由于常规的 DNB测序方法形成单链环状DNA后,后续接着进行DNB的生成的测序,这一步对于基因组的随机片段或者没有固定结构的普通序列来说,影响不大。但对于存在高度重复结构、多种重复类型、碱基比例普遍失衡的STR序列而言,环化后DNB的生成和扩增可能产生严重的偏向性,甚至单链DNA本身就无法正常环化,进而严重影响测序结果的平衡。因此如何基于STR序列的特点,使用重 PCR技术和DNB技术进行STR分型,是目前亟需解决的问题。
发明内容
本发明的目的在于克服现有技术中存在的上述缺陷和不足,提供一种基于多重PCR技术和DNB技术的STR分型方法。
本发明的上述目的是通过以下技术方案给予实现的:
一种基于多重PCR技术和DNB技术的STR分型方法,包括如下步骤:
S1.待测样品预处理,提取待测样品DNA;
S2.针对待测STR基因座设计多重PCR引物并建立关于DNB环化中STR序列交叉互连的评估体系,调整多重PCR引物扩增方向;
S3.以步骤S1待测样品DNA为模板,利用步骤S2设计的多重PCR引物进行第一轮PCR扩增反应;
S4.将第一轮PCR产物纯化,进行第二轮PCR扩增引入高通量Index;
S5.将第二轮PCR扩增回收、纯化;
S6.PCR产物进行DNB测序;
步骤S2所述评估体系为对任意两条长度分别为m、n的扩增产物序列,在每个可能的碱基配对状态上,逐一移位进行相互比对,计算互连得分,即匹配碱基数和不匹配碱基数的差值;产生(m*n)次碱基比对和(m+n-1)次互连得分,取其中的最高得分作为m、n两条序列的最终互连得分;对于一组包含p条不同序列的集合,自身和两两比较,产生1/2(p2+p)组比较结果;根据比较结果选择一套使得体系互连反应总得分最低的重复基序类型组合,并据此调整所有引物扩增方向,以保证扩增出的STR序列间不发生严重的交叉互连。
本发明采用多重PCR技术可在一个反应体系内同时检测多个不同的STR基因座,针对STR基因座存在高度重复结构、多种重复类型、碱基比例普遍失衡,环化后DNB的生成和扩增可能产生严重的偏向性,甚至单链DNA本身就无法正常环化的问题,本发明设计了一套适用于DNB测序和环化的STR序列交叉互连一整套评估体系,对于需要进行环化的一组STR目标序列(包括所有序列本身、正向和反向序列以及序列和序列之间)都进行严格的序列互补自连评估,从而调整出一套最优的序列方向组合,尽量保证STR序列间不发生严重的交叉互连反应。
优选地,所述待测STR基因座包括D1S1656、D2S1338、D2S441、TPOX、 D3S1358、FGA、CSF1PO、D5S818、D7S820、D8S1179、D10S1248、TH01、 D12S391、vWA、D13S317、D16S539、D18S51、D19S433、D21S11或D22S1045 中至少两个。
优选地,本发明在针对STR基因座位点进行引物设计时,除了遵循传统多重PCR引物设计原则,本发明还兼顾不同长度、类型和拷贝数STR位点扩增子间的均衡性,使得设计的PCR扩增引物能够精确涵盖用于STR长度计算的核心重复区,并且可根据二代测序序列起始质量较高的特点,通过调整STR重复区的起始位置,以达到最优的测序质量。
进一步优选地,所述STR基因座多重PCR引物分别包括上游引物和下游引物,其序列依次如SEQ ID NO:1~40所示。
优选地,所述第一轮PCR扩增反应的扩增体系为:JN-1500MIX 6μL,基因组DNA 20-300ng,3×EnzymeHT 10μL,加H2O至30μL。
优选地,所述第一轮PCR扩增反应的扩增程序为98℃ 3~5min;98℃ 20s, 60℃6min,共20个循环;72℃ 6min。
优选地,所述第一轮PCR扩增反应的扩增体系为:2×HIFI_Enzyme 15μL,Nuclease-Free H2O13μL,Primer_MGI-F 1μL,MGI_Bar_xxx 1μL,共30μL。
本发明步骤S4所述高通量Index采用目前本领域常用的高通量Index也可完成发明目的,不过为了更加充分发挥二代测序在高通量大样本上的优势,平摊二代测序的检测成本,本发明还提供一套超高通量Index,所述高通量Index要求根据碱基平衡和激光平衡原则、GC含量30~70%、连续重复碱基小于等于5、本身反向互补不一致、汉明距离大于3、与目前主流平台Index不冲突的严格条件。
优选地,第二轮PCR扩增反应的扩增程序为:98℃ 2min;98℃ 15s,58℃ 15s,72℃30s,6个循环;72℃ 2min。
本发明还请求提供上述任一所述的方法在个体识别和/或亲权鉴定中的应用。
与现有技术相比,本发明具有以下有益效果:
本发明提供了一种基于多重PCR技术和DNB技术的STR分型方法,通过一套适用于DNB测序和环化的STR序列交叉互连一整套评估体系,对于需要进行环化的一组STR目标序列(包括所有序列本身、正向和反向序列以及序列和序列之间)都进行严格的序列互补自连评估,从而调整出一套最优的序列方向组合,保证STR序列间不发生严重的交叉互连反应,保证了测序结果的平衡,成功建立了基于多重PCR技术和DNB技术的STR分型方法,从而用于个体识别和/或亲权鉴定。
附图说明
图1为本发明基于多重PCR技术和DNB技术的STR分型方法的操作流程图。
图2为本发明示例性说明某两种STR重复序列之间存在严重的交叉互连的处理情形。
图3为本发明优化得到的超高通量Index***中某组96Index示例。
图4为标准品2800M的最终测序结果。
具体实施方式
以下结合说明书附图和具体实施例来进一步说明本发明,但实施例并不对本发明做任何形式的限定。除非特别说明,本发明采用的试剂、方法和设备为本技术领域常规试剂、方法和设备。
除非特别说明,以下实施例所用试剂和材料均为市购。
实施例1
一种基于多重PCR技术和DNB技术的STR分型方法,其操作流程如图1 所示。主要步骤如下:
一、基于二代测序的多重PCR扩增技术
(1)多重PCR扩增子的引物设计:利用多重PCR扩增子捕获技术配合二代测序检测特定的一组STR panel,需要根据这组STR位点所在的序列区域特征,设计一整套特异性的扩增引物。为适应二代测序高通量的特点,往往一次设计几百重以上的PCR引物,除了遵循传统多重PCR引物设计原则,还兼顾不同长度、类型和拷贝数STR位点扩增子间的均衡性,使得设计的PCR扩增引物能够精确涵盖用于STR长度计算的核心重复区,并且可根据二代测序序列起始质量较高的特点,通过调整STR重复区的起始位置,以达到最优的测序质量。
引物设计示例如下表1所示:
注:Chr:染色体;LEN:长度;TM:50%的引物处于解离状态时的温度;
(2)一整套适用于DNB环化的STR序列交叉互连评估体系的设计
对于需要进行环化的一组STR目标序列(所有序列本身、正向和反向、序列和序列之间)都要进行严格的序列互补自连评估,从而调整出一套最优的序列方向组合,尽量保证STR序列间不发生严重的交叉互连反应。
示例:如图2所示,某两种STR重复序列之间存在严重的交叉互连,可以通过调整其中一种STR序列的测序方向来避免;
基于以上原理,我们设计了一整套适用于DNB测序和环化的STR序列交叉互连评估体系,综合考虑一组STR序列的重复类型、重复长度、碱基比例等影响因素,从整体上优化所有STR序列的测序方向,继而保证后续的正常环化和 DNB扩增,从而达到测序结果各位点间的均衡。
原理:对任意两条长度分别为m、n的序列,在每个可能的Watson-Crick碱基配对状态上,逐一移位进行相互比对,计算互连得分,即匹配碱基数和不匹配碱基数的差值。这个过程将产生(m*n)次碱基比对和(m+n-1)次互连得分,取其中的最高得分作为m、n两条序列的最终互连得分。对于一组包含p条不同序列的集合,自身和两两比较,将产生1/2(p2+p)组比较结果,根据比较结果选择一套使得体系互连反应总得分最低的重复基序类型组合,并据此调整所有引物扩增方向,以保证扩增出的STR序列间不发生严重的交叉互连。
(3)靶区域扩增:按照下面所列反应体系和扩增条件进行第一轮PCR扩增。
扩增体系:采用0.2mL PCR管/96孔PCR板,在超净台里按照如下表2所述体系配置反应:
表2
Component | 30μL Reaction |
JN-1500MIX | 6μL |
gDNA(20-300ng) | ×μL |
3×EnzymeHT | 10μL |
H<sub>2</sub>0 | add to 30μL |
PCR扩增程序如表3所示:
表3
*如DNA低于5ng,适当增加1个循环。
(4)一套适用于目前主流二代测序平台的超高通量Index***的设计
作为一种优选地可实施方式,本发明为穷尽单端Index***的效能,充分发挥二代测序在高通量大样本上的优势,我们设计了一套适用于目前主流二代测序平台的超高通量Index***。根据碱基平衡和激光平衡原则、GC含量30~70%、连续重复碱基小于等于5、本身反向互补不一致、汉明距离大于3、与目前主流平台Index不冲突的严格条件,我们搜索了所有10bp长度Index的可能空间,最后优化了一套包含2016个Index(可按96或32个一组随机组合)的超高通量Index ***,以及对应的高效拆分脚本。数据拆分默认允许1bp的容错空间,经过多批次的实验测试,该Index***的最终下机数据拆分率达94%,最终用于样本位点分析的有效数据量高于80%,充分发挥了高通量测序平台并行测序大批量样本的优势。
以下表4为高通量2016Index***碱基平衡评估:
表4
Pos | A | C | G | T | 最高碱基占比 |
1 | 506 | 504 | 511 | 495 | 25.35% |
2 | 508 | 504 | 506 | 498 | 25.20% |
3 | 504 | 506 | 507 | 499 | 25.15% |
4 | 507 | 502 | 506 | 501 | 25.15% |
5 | 501 | 507 | 506 | 502 | 25.15% |
6 | 505 | 504 | 502 | 505 | 25.05% |
7 | 503 | 505 | 505 | 503 | 25.05% |
8 | 506 | 503 | 505 | 502 | 25.10% |
9 | 504 | 504 | 505 | 503 | 25.05% |
10 | 500 | 508 | 503 | 505 | 25.20% |
某组96Index示例,如图3所示。
(5)第一轮PCR产物纯化后,进行第二轮PCR扩增,并引入步骤(4)中二代测序相应的Index***。第二轮PCR扩增的体系如表5所示:
表5
*不同的样品请使用不同的Barcode/Index。
PCR扩增程序如表6所示:
表6
*一般为6个循环,当原始DNA少于10ng时,用8循环。
(6)PCR产物回收。用纯化试剂盒或其他等效的磁珠对PCR产物进行纯化。
二、进行二代测序(DNB测序技术)
利用华大测序仪对上述PCR产物进行DNB测序。
实施例2
一种基于多重PCR技术和DNB技术的STR分型方法,与实施例1的方法相同,其中:
(1)STR位点信息:以Expanded CODIS core loci的20个常染色体STR为例,具***点信息如下表7所示:
表7 Expanded CODIS core loci的20个常染色体STR
(2)STR位点引物信息
多重PCR初始引物设计如下表8所示,完全包含STR的重复区域:
表8
(3)关于DNB环化的STR序列交叉互连评估
按照多重PCR初始引物的扩增方向,我们得到扩增产物的重复序列,并根据重复类型、重复长度和碱基比例进行分类,如表9所示,共得到5种重复基序类型:
表9
对所有重复基序类型间可能存在的交叉互连反应进行计算评估。
原理:对任意两条长度分别为m、n的序列,在每个可能的Watson-Crick碱基配对状态上,逐一移位进行相互比对,计算互连得分,即匹配碱基数和不匹配碱基数的差值。这个过程将产生(m*n)次碱基比对和(m+n-1)次互连得分,取其中的最高得分作为m、n两条序列的最终互连得分。对于一组包含p条不同序列的集合,自身和两两比较,将产生1/2(p2+p)组比较结果。
具体到该例中,首先将各重复基序类型统一重复6次,如两个重复长度为4 的基序类型,重复6次后,得到两条24bp长度的序列,碱基逐一比对,将产生 576次碱基比对和47次互连得分(为考虑计算量,根据重复类型,可重复4-10 次,获得20-30bp长度的序列较为合适)。该组共包含10种基序类型(包括正向和反向),自身、两两之间分别比较,共产生55组比较结果(最高得分),其中有15组得分在7以上,列表如下表10所示:
表10
从上述结果表中,选择一套使得体系互连反应总得分最低的重复基序类型组合,并据此调整所有引物扩增方向,以保证扩增出的STR序列间不发生严重的交叉互连。
原理:每对反应得分的计算方式为,每种类型正向或反向选其一,根据会发生互连反应的两种类型,统计全部20个STR中属于这两种类型的位点数a、b,以及该互连反应的最高得分S,即可计算体系中该反应的得分a*b*S。一组类型在体系中的所有互连反应的得分加和,即为体系总得分。
具体到该例中,若选择的重复基序类型组合为1_rc,2_rc,3_rc,4_rc,5_rc,则其中会发生互连反应的类型为5_rc和5_rc,属于该类型的位点只有D22S1045,因此位点数分别为1和1,该互连反应的最高得分为7,因而体系中该反应的得分为1*1*7=7。因为该组合没有其他互连反应,所以体系总得分也为7,通过完全计算,我们发现该组合的体系总得分在所有组合中是最低的,因此该组合为最优的重复基序类型组合。据此,我们将所有位点的引物扩增方向进行调整,例如 D1S1656的原引物扩增方向为正向,重复基序类型为1,调整成反向扩增后,重复基序类型变为1_rc。
经过上述交叉互连评估和引物调整后,我们从整体上优化了Expanded CODIScore loci的20个常染色体STR的测序方向,继而保证后续的正常环化和 DNB扩增,从而达到测序结果各位点间的均衡。
(4)最终检测的分型结果
对于标准品2800M的最终测序结果如图4所示,表明本发明成功建立了基于多重PCR技术和DNB技术的STR分型方法,本发明基于多重PCR扩增体系,利用DNB测序技术位点多、通量高、成本低的特点进行STR分型,保证了测序结果的精确性和可靠性,同时也更适用于未来STR检测的标准化。
序列表
<110> 广州深晓基因科技有限公司
广州市刑事科学技术研究所
<120> 一种基于多重PCR技术和DNB技术的STR分型方法
<141> 2020-08-13
<160> 40
<170> SIPOSequenceListing 1.0
<210> 1
<211> 22
<212> DNA
<213> 人(Homo sapiens)
<400> 1
gcagcacaaa actcgtttag ca 22
<210> 2
<211> 26
<212> DNA
<213> 人(Homo sapiens)
<400> 2
tataagttca agcctgtgtt gctcaa 26
<210> 3
<211> 25
<212> DNA
<213> 人(Homo sapiens)
<400> 3
atgcctacat ccctagtacc tagca 25
<210> 4
<211> 24
<212> DNA
<213> 人(Homo sapiens)
<400> 4
ccagtggatt tggaaacaga aatg 24
<210> 5
<211> 22
<212> DNA
<213> 人(Homo sapiens)
<400> 5
ctgtaacaag ggctacagga at 22
<210> 6
<211> 29
<212> DNA
<213> 人(Homo sapiens)
<400> 6
caccacaccc agccataaat aacatatta 29
<210> 7
<211> 23
<212> DNA
<213> 人(Homo sapiens)
<400> 7
caccttcctc tgcttcactt ttc 23
<210> 8
<211> 23
<212> DNA
<213> 人(Homo sapiens)
<400> 8
ccttctgtcc ttgtcagcgt tta 23
<210> 9
<211> 21
<212> DNA
<213> 人(Homo sapiens)
<400> 9
ctgcagtcca atctgggtga c 21
<210> 10
<211> 23
<212> DNA
<213> 人(Homo sapiens)
<400> 10
ctcatgaaat caacagaggc ttg 23
<210> 11
<211> 29
<212> DNA
<213> 人(Homo sapiens)
<400> 11
atcacggtct gaaatcgaaa atatggtta 29
<210> 12
<211> 26
<212> DNA
<213> 人(Homo sapiens)
<400> 12
ctgcagggca taacattatc caaaag 26
<210> 13
<211> 22
<212> DNA
<213> 人(Homo sapiens)
<400> 13
acttggacag catttcctgt gt 22
<210> 14
<211> 23
<212> DNA
<213> 人(Homo sapiens)
<400> 14
cagattgtac agaggaggca ctt 23
<210> 15
<211> 22
<212> DNA
<213> 人(Homo sapiens)
<400> 15
ctctcccatc tggatagtgg ac 22
<210> 16
<211> 23
<212> DNA
<213> 人(Homo sapiens)
<400> 16
gtgacaaggg tgattttcct ctt 23
<210> 17
<211> 30
<212> DNA
<213> 人(Homo sapiens)
<400> 17
attgtgaggt cttaaaatct gaggtatcaa 30
<210> 18
<211> 30
<212> DNA
<213> 人(Homo sapiens)
<400> 18
aaagggtatg atagaacact tgtcatagtt 30
<210> 19
<211> 22
<212> DNA
<213> 人(Homo sapiens)
<400> 19
cacggcctgg caacttatat gt 22
<210> 20
<211> 30
<212> DNA
<213> 人(Homo sapiens)
<400> 20
gctgtcaaaa accgtatgta ttcttgtttc 30
<210> 21
<211> 27
<212> DNA
<213> 人(Homo sapiens)
<400> 21
aagcttagta cttaactcac tgccttg 27
<210> 22
<211> 30
<212> DNA
<213> 人(Homo sapiens)
<400> 22
ttcccttgtc ttgttattaa aggaacaact 30
<210> 23
<211> 25
<212> DNA
<213> 人(Homo sapiens)
<400> 23
aaatgacact gctacaactc acacc 25
<210> 24
<211> 22
<212> DNA
<213> 人(Homo sapiens)
<400> 24
cattggcctg ttcctccctt at 22
<210> 25
<211> 28
<212> DNA
<213> 人(Homo sapiens)
<400> 25
gtgatagtag tttcttctgg tgaaggaa 28
<210> 26
<211> 25
<212> DNA
<213> 人(Homo sapiens)
<400> 26
cttgcagatg gactgtcatg agatt 25
<210> 27
<211> 33
<212> DNA
<213> 人(Homo sapiens)
<400> 27
gagataggac agatgataaa tacataggat gga 33
<210> 28
<211> 29
<212> DNA
<213> 人(Homo sapiens)
<400> 28
cactttgccc ttattatttt gtgaactcc 29
<210> 29
<211> 23
<212> DNA
<213> 人(Homo sapiens)
<400> 29
attctgccta cagccaatgt gaa 23
<210> 30
<211> 25
<212> DNA
<213> 人(Homo sapiens)
<400> 30
caaatctcct ccttcaactt gggtt 25
<210> 31
<211> 28
<212> DNA
<213> 人(Homo sapiens)
<400> 31
ggtctaagag cttgtaaaaa gtgtacaa 28
<210> 32
<211> 23
<212> DNA
<213> 人(Homo sapiens)
<400> 32
gcgtttgtgt gtgcatctgt aag 23
<210> 33
<211> 26
<212> DNA
<213> 人(Homo sapiens)
<400> 33
cacttcactc tgagtgacaa attgag 26
<210> 34
<211> 27
<212> DNA
<213> 人(Homo sapiens)
<400> 34
gcaacaacac aaataaacaa accgtca 27
<210> 35
<211> 24
<212> DNA
<213> 人(Homo sapiens)
<400> 35
aaggaacagg tggtgttggt taca 24
<210> 36
<211> 28
<212> DNA
<213> 人(Homo sapiens)
<400> 36
gttgaggctg caaaaagcta taattgta 28
<210> 37
<211> 24
<212> DNA
<213> 人(Homo sapiens)
<400> 37
atatgtgagt caattcccca agtg 24
<210> 38
<211> 28
<212> DNA
<213> 人(Homo sapiens)
<400> 38
tgtattagtc aatgttctcc agagacag 28
<210> 39
<211> 22
<212> DNA
<213> 人(Homo sapiens)
<400> 39
cctctccacc ctatagaccc tg 22
<210> 40
<211> 27
<212> DNA
<213> 人(Homo sapiens)
<400> 40
cctcagctgt agaatggaaa tagtgac 27
Claims (10)
1.一种基于多重PCR技术和DNB技术的STR分型方法,其特征在于,包括如下步骤:
S1.待测样品预处理,提取待测样品DNA;
S2.针对待测STR基因座设计多重PCR引物并建立关于DNB环化中STR序列交叉互连的评估体系,调整多重PCR引物扩增方向;
S3.以步骤S1待测样品DNA为模板,利用步骤S2设计的多重PCR引物进行第一轮PCR扩增反应;
S4.将第一轮PCR产物纯化,进行第二轮PCR扩增引入高通量Index;
S5.将第二轮PCR扩增回收、纯化;
S6.PCR产物进行DNB测序;
步骤S2所述评估体系为对任意两条长度分别为m、n的扩增产物序列,在每个可能的碱基配对状态上,逐一移位进行相互比对,计算互连得分,即匹配碱基数和不匹配碱基数的差值;产生(m*n)次碱基比对和(m+n-1)次互连得分,取其中的最高得分作为m、n两条序列的最终互连得分;对于一组包含p条不同序列的集合,自身和两两比较,产生1/2(p2+p)组比较结果;根据比较结果选择一套使得体系互连反应总得分最低的重复基序类型组合,并据此调整所有引物扩增方向,以保证扩增出的STR序列间不发生严重的交叉互连。
2.根据权利要求1所述的STR分型方法,其特征在于,所述待测STR基因座包括D1S1656、D2S1338、D2S441、TPOX、D3S1358、FGA、CSF1PO、D5S818、D7S820、D8S1179、D10S1248、TH01、D12S391、vWA、D13S317、D16S539、D18S51、D19S433、D21S11或D22S1045中的至少两个。
3.根据权利要求1所述的STR分型方法,其特征在于,所述多重PCR引物除了遵循传统多重PCR引物设计原则,还兼顾不同长度、类型和拷贝数STR位点扩增子间的均衡性,使得设计的PCR扩增引物能够精确涵盖用于STR长度计算的核心重复区,并且根据二代测序序列起始质量较高的特点,通过调整STR重复区的起始位置,以达到最优的测序质量。
4.根据权利要求2或3所述的STR分型方法,其特征在于,所述STR基因座多重PCR引物分别包括上游引物和下游引物,其序列依次如SEQ ID NO:1~40所示。
5.根据权利要求1所述的STR分型方法,其特征在于,所述第一轮PCR扩增反应的扩增体系为:JN-1500MIX 6μL,基因组DNA 20-300ng,3×EnzymeHT10μL,加H2O至30μL。
6.根据权利要求1所述的STR分型方法,其特征在于,所述第一轮PCR扩增反应的扩增程序为98℃3~5min;98℃20s,60℃6min,共20个循环;72℃6min。
7.根据权利要求1所述的STR分型方法,其特征在于,所述高通量Index要求根据碱基平衡和激光平衡原则、GC含量30~70%、连续重复碱基小于等于5、本身反向互补不一致、汉明距离大于3、与目前主流平台Index不冲突的严格条件。
8.根据权利要求1所述的STR分型方法,其特征在于,所述第二轮PCR扩增反应的扩增体系为:2×HIFI_Enzyme 15μL,Nuclease-Free H2O 13μL,Primer_MGI-F 1μL,MGI_Bar_xxx1μL,共30μL。
9.根据权利要求1所述的STR分型方法,其特征在于,第二轮PCR扩增反应的扩增程序为:98℃2min;98℃15s,58℃15s,72℃30s,6个循环;72℃2min。
10.权利要求1~9任一项所述的方法在个体识别和/或亲权鉴定中的应用。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010814836.0A CN112626223B (zh) | 2020-08-13 | 2020-08-13 | 一种基于多重pcr技术和dnb技术的str分型方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010814836.0A CN112626223B (zh) | 2020-08-13 | 2020-08-13 | 一种基于多重pcr技术和dnb技术的str分型方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112626223A true CN112626223A (zh) | 2021-04-09 |
CN112626223B CN112626223B (zh) | 2024-03-22 |
Family
ID=75300084
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010814836.0A Active CN112626223B (zh) | 2020-08-13 | 2020-08-13 | 一种基于多重pcr技术和dnb技术的str分型方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112626223B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109022559A (zh) * | 2018-08-21 | 2018-12-18 | 华中农业大学 | 一种基于二代测序技术的分子标记检测方法 |
CN110878334A (zh) * | 2019-11-12 | 2020-03-13 | 北京康普森生物技术有限公司 | 用于扩增子测序的引物及两步pcr建库方法 |
-
2020
- 2020-08-13 CN CN202010814836.0A patent/CN112626223B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109022559A (zh) * | 2018-08-21 | 2018-12-18 | 华中农业大学 | 一种基于二代测序技术的分子标记检测方法 |
CN110878334A (zh) * | 2019-11-12 | 2020-03-13 | 北京康普森生物技术有限公司 | 用于扩增子测序的引物及两步pcr建库方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112626223B (zh) | 2024-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107208144B (zh) | 无酶且无扩增的测序 | |
CN110358815B (zh) | 一种同时检测多个靶标核酸的方法及其试剂盒 | |
CN108103164B (zh) | 一种利用多重荧光竞争性pcr检测拷贝数变异的方法 | |
CN105899680A (zh) | 核酸探针和检测基因组片段的方法 | |
CN111118151A (zh) | 基于数字pcr法的人smn1与smn2基因拷贝数检测试剂盒 | |
US11912988B2 (en) | Method and kit for constructing a simplified genomic library | |
CN110317861B (zh) | 一种检测病原体的试剂盒 | |
EP3643789A1 (en) | Pcr primer pair and application thereof | |
EP2785865A1 (en) | Method and kit for characterizing rna in a composition | |
CN109486912A (zh) | 一种用于数字pcr扩增的探针引物组合及设计方法 | |
WO2022161272A1 (zh) | 检测人群微卫星不稳定性的生物标志物组及其应用 | |
CN106591442B (zh) | 用于y染色体微缺失检测的引物组合及试剂盒 | |
CN109321662B (zh) | 一种人类Y染色体15个Indel基因座的荧光标记复合扩增试剂盒 | |
CN107406891B (zh) | Pcr方法 | |
CN110218811B (zh) | 一种筛选水稻突变体的方法 | |
CN112626223B (zh) | 一种基于多重pcr技术和dnb技术的str分型方法 | |
WO2020159435A1 (en) | Method of sequencing nucleic acid with unnatural base pairs | |
WO2020005159A1 (en) | Method for detection and quantification of genetic alterations | |
CN115851915A (zh) | 检测遗传性共济失调致病基因的引物组及方法 | |
CN116065240A (zh) | 一种高通量构建rna测序文库的方法及试剂盒 | |
US20100297622A1 (en) | Method for high-throughput gene expression profile analysis | |
CN112029836A (zh) | 检测braf基因突变的核酸组合物及试剂盒和braf基因突变的检测方法 | |
CN108841919A (zh) | 一种嵌合式sda法制备探针 | |
CN114277096B (zh) | 鉴别地中海贫血αααanti4.2杂合型和HKαα杂合型的方法和试剂盒 | |
CN117535388B (zh) | 大鼠短串联重复序列检测的扩增引物、多重扩增体系和试剂盒 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |