CN112626223A - 一种基于多重pcr技术和dnb技术的str分型方法 - Google Patents

一种基于多重pcr技术和dnb技术的str分型方法 Download PDF

Info

Publication number
CN112626223A
CN112626223A CN202010814836.0A CN202010814836A CN112626223A CN 112626223 A CN112626223 A CN 112626223A CN 202010814836 A CN202010814836 A CN 202010814836A CN 112626223 A CN112626223 A CN 112626223A
Authority
CN
China
Prior art keywords
str
pcr
dnb
round
amplification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010814836.0A
Other languages
English (en)
Other versions
CN112626223B (zh
Inventor
文少卿
雷波
王凌翔
刘超
刘长晖
刘宏
韩晓龙
徐曲毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou criminal science and technology research institute
Guangzhou Shenxiao Gene Technology Co ltd
Original Assignee
Guangzhou criminal science and technology research institute
Guangzhou Shenxiao Gene Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou criminal science and technology research institute, Guangzhou Shenxiao Gene Technology Co ltd filed Critical Guangzhou criminal science and technology research institute
Priority to CN202010814836.0A priority Critical patent/CN112626223B/zh
Publication of CN112626223A publication Critical patent/CN112626223A/zh
Application granted granted Critical
Publication of CN112626223B publication Critical patent/CN112626223B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • C12Q1/6837Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种基于多重PCR技术和DNB技术的STR分型方法,包括S1.提取待测样品DNA;S2.针对所选取的STR位点设计多重PCR引物并建立关于DNB环化中STR序列交叉互连的评估体系;S3.以步骤S1待测样本DNA为模板,利用步骤S2设计的多重PCR引物进行第一轮PCR扩增反应;S4.将第一轮PCR产物纯化,进行第二轮PCR扩增引入高通量Index;S5.将第二轮PCR扩增回收、纯化;S6.PCR产物进行DNB测序。本发明提供了通过一套适用于DNB测序和环化的STR序列交叉互连一整套评估体系,成功建立了基于多重PCR技术和DNB技术的STR分型方法。

Description

一种基于多重PCR技术和DNB技术的STR分型方法
技术领域
本发明涉及生物技术领域,更具体地,涉及一种基于多重PCR技术和DNB 技术的STR分型方法。
背景技术
短片段重复序列(short tandem repeat,STR)分型技术是目前国内外法医学进行个体识别和亲子鉴定的主要手段,具有简单快速、结果可靠、灵敏度高、重复性好的特点。常染色体STR、Y-STR和X-STR等多种遗传标记的联用对于二联体亲缘鉴定及更复杂的亲缘鉴定具有独特的应用价值。
当前法医STR分型检测方法主要为PCR-毛细管电泳法。该方法的主要原理为:①提取DNA,使用磁珠、酚/氯仿、Chelex等方法提取出纯度高、完整性好、浓度适当的DNA样品;②进行PCR扩增,PCR(聚合酶链式反应)技术是以待扩增的两条DNA链为模板,在一对人工合成的寡核苷酸引物的介导下,通过耐高温DNA聚合酶的酶促作用,快速特异地扩增出目的DNA片段;③毛细管电泳,是以Sanger酶法为原理,采用耐热DNA聚合酶参照待测模板生成一系列链终止片段。在此过程中,以4种不同的荧光染料标记反应产物,并将反应产物经过毛细管电泳分离,采用固定的激光光源对荧光信号进行激发,通过CCD(电荷耦合器件)检测收集数据,计算机分析处理得到序列信息的过程。④确定样品的STR分型。电泳后对荧光颜色不同的DNA片段的峰进行长度检测,将DNA 片段与内标进行比较确定其长度,并对应不同的颜色,最后与以同样方式确定的等位基因Ladder进行比较,得到样品的STR分型。目前基于传统的PCR-毛细管电泳的STR技术主要缺点为,一是同时检测的法医位点少,通量低,虽然多色荧光***的升级推动了一次性检测位点数的增加,但是目前仍然难以超过60 个,与此同时法医学需求检测的常染色体 STR、YSTR和XSTR的数目逐年增加。二是获得序列信息的完整性有限。基于一代CE技术的传统STR分型法,只能获得扩增子的相对长度信息,无法获得STR重复区和侧翼区的完整碱基序列,未能充分考虑序列可能存在的变异及对测序结果的影响,限制了法医DNA检测的应用场景。
高通量测序技术(High-throughput sequencing)又称“下一代”测序技术 ("Next-generation"sequencing technology),该技术可以对数百万个DNA分子进行同时测序,这使得对一个物种的转录组和基因组进行细致全貌的分析成为可能,堪称测序技术发展历程的一个里程碑。专利CN102943111A公开了高通量 DNA测序法用于测定人类基因组中短片段串联重复基因座的用途及方法,专利 CN104673907A公开了一种用于高通量检验STR分型的***及其检测方法,但是上述基于传统高通量测序技术的STR分型方法的准确性依然有待提高。DNB 测序技术基于现有二代测序开发的新的测序技术,基因组DNA首先经过片段化处理,再加上接头序列,并环化形成单链环状DNA,随后使用的滚环扩增技术(Rollingcircle amplification,RCA)可将单链环状DNA扩增2-3个数量级,所产生的扩增产物称为DNA纳米球(DNAnanoball,DNB),最终纳米球经过DNB 装载技术固定在阵列化的硅芯片上。与其他二代测序技术相比较,DNB测序技术具有以下几个优势:(1)DNB通过增加待测DNA的拷贝数而增强了信号强度,从而提高测序准确度;(2)不同于PCR指数扩增,滚环扩增技术的扩增错误不会累积;(3)DNB与芯片上活化位点的大小相同,每个位点只固定一个DNB,保证信号点之间不产生相互干扰;(4)阵列化测序芯片和DNB测序技术的结合,使得成像***像素和测序芯片的面积得到最大化利用。目前,现有技术中,还未见有基于多重PCR技术和DNB技术的STR分型方法。由于常规的 DNB测序方法形成单链环状DNA后,后续接着进行DNB的生成的测序,这一步对于基因组的随机片段或者没有固定结构的普通序列来说,影响不大。但对于存在高度重复结构、多种重复类型、碱基比例普遍失衡的STR序列而言,环化后DNB的生成和扩增可能产生严重的偏向性,甚至单链DNA本身就无法正常环化,进而严重影响测序结果的平衡。因此如何基于STR序列的特点,使用重 PCR技术和DNB技术进行STR分型,是目前亟需解决的问题。
发明内容
本发明的目的在于克服现有技术中存在的上述缺陷和不足,提供一种基于多重PCR技术和DNB技术的STR分型方法。
本发明的上述目的是通过以下技术方案给予实现的:
一种基于多重PCR技术和DNB技术的STR分型方法,包括如下步骤:
S1.待测样品预处理,提取待测样品DNA;
S2.针对待测STR基因座设计多重PCR引物并建立关于DNB环化中STR序列交叉互连的评估体系,调整多重PCR引物扩增方向;
S3.以步骤S1待测样品DNA为模板,利用步骤S2设计的多重PCR引物进行第一轮PCR扩增反应;
S4.将第一轮PCR产物纯化,进行第二轮PCR扩增引入高通量Index;
S5.将第二轮PCR扩增回收、纯化;
S6.PCR产物进行DNB测序;
步骤S2所述评估体系为对任意两条长度分别为m、n的扩增产物序列,在每个可能的碱基配对状态上,逐一移位进行相互比对,计算互连得分,即匹配碱基数和不匹配碱基数的差值;产生(m*n)次碱基比对和(m+n-1)次互连得分,取其中的最高得分作为m、n两条序列的最终互连得分;对于一组包含p条不同序列的集合,自身和两两比较,产生1/2(p2+p)组比较结果;根据比较结果选择一套使得体系互连反应总得分最低的重复基序类型组合,并据此调整所有引物扩增方向,以保证扩增出的STR序列间不发生严重的交叉互连。
本发明采用多重PCR技术可在一个反应体系内同时检测多个不同的STR基因座,针对STR基因座存在高度重复结构、多种重复类型、碱基比例普遍失衡,环化后DNB的生成和扩增可能产生严重的偏向性,甚至单链DNA本身就无法正常环化的问题,本发明设计了一套适用于DNB测序和环化的STR序列交叉互连一整套评估体系,对于需要进行环化的一组STR目标序列(包括所有序列本身、正向和反向序列以及序列和序列之间)都进行严格的序列互补自连评估,从而调整出一套最优的序列方向组合,尽量保证STR序列间不发生严重的交叉互连反应。
优选地,所述待测STR基因座包括D1S1656、D2S1338、D2S441、TPOX、 D3S1358、FGA、CSF1PO、D5S818、D7S820、D8S1179、D10S1248、TH01、 D12S391、vWA、D13S317、D16S539、D18S51、D19S433、D21S11或D22S1045 中至少两个。
优选地,本发明在针对STR基因座位点进行引物设计时,除了遵循传统多重PCR引物设计原则,本发明还兼顾不同长度、类型和拷贝数STR位点扩增子间的均衡性,使得设计的PCR扩增引物能够精确涵盖用于STR长度计算的核心重复区,并且可根据二代测序序列起始质量较高的特点,通过调整STR重复区的起始位置,以达到最优的测序质量。
进一步优选地,所述STR基因座多重PCR引物分别包括上游引物和下游引物,其序列依次如SEQ ID NO:1~40所示。
优选地,所述第一轮PCR扩增反应的扩增体系为:JN-1500MIX 6μL,基因组DNA 20-300ng,3×EnzymeHT 10μL,加H2O至30μL。
优选地,所述第一轮PCR扩增反应的扩增程序为98℃ 3~5min;98℃ 20s, 60℃6min,共20个循环;72℃ 6min。
优选地,所述第一轮PCR扩增反应的扩增体系为:2×HIFI_Enzyme 15μL,Nuclease-Free H2O13μL,Primer_MGI-F 1μL,MGI_Bar_xxx 1μL,共30μL。
本发明步骤S4所述高通量Index采用目前本领域常用的高通量Index也可完成发明目的,不过为了更加充分发挥二代测序在高通量大样本上的优势,平摊二代测序的检测成本,本发明还提供一套超高通量Index,所述高通量Index要求根据碱基平衡和激光平衡原则、GC含量30~70%、连续重复碱基小于等于5、本身反向互补不一致、汉明距离大于3、与目前主流平台Index不冲突的严格条件。
优选地,第二轮PCR扩增反应的扩增程序为:98℃ 2min;98℃ 15s,58℃ 15s,72℃30s,6个循环;72℃ 2min。
本发明还请求提供上述任一所述的方法在个体识别和/或亲权鉴定中的应用。
与现有技术相比,本发明具有以下有益效果:
本发明提供了一种基于多重PCR技术和DNB技术的STR分型方法,通过一套适用于DNB测序和环化的STR序列交叉互连一整套评估体系,对于需要进行环化的一组STR目标序列(包括所有序列本身、正向和反向序列以及序列和序列之间)都进行严格的序列互补自连评估,从而调整出一套最优的序列方向组合,保证STR序列间不发生严重的交叉互连反应,保证了测序结果的平衡,成功建立了基于多重PCR技术和DNB技术的STR分型方法,从而用于个体识别和/或亲权鉴定。
附图说明
图1为本发明基于多重PCR技术和DNB技术的STR分型方法的操作流程图。
图2为本发明示例性说明某两种STR重复序列之间存在严重的交叉互连的处理情形。
图3为本发明优化得到的超高通量Index***中某组96Index示例。
图4为标准品2800M的最终测序结果。
具体实施方式
以下结合说明书附图和具体实施例来进一步说明本发明,但实施例并不对本发明做任何形式的限定。除非特别说明,本发明采用的试剂、方法和设备为本技术领域常规试剂、方法和设备。
除非特别说明,以下实施例所用试剂和材料均为市购。
实施例1
一种基于多重PCR技术和DNB技术的STR分型方法,其操作流程如图1 所示。主要步骤如下:
一、基于二代测序的多重PCR扩增技术
(1)多重PCR扩增子的引物设计:利用多重PCR扩增子捕获技术配合二代测序检测特定的一组STR panel,需要根据这组STR位点所在的序列区域特征,设计一整套特异性的扩增引物。为适应二代测序高通量的特点,往往一次设计几百重以上的PCR引物,除了遵循传统多重PCR引物设计原则,还兼顾不同长度、类型和拷贝数STR位点扩增子间的均衡性,使得设计的PCR扩增引物能够精确涵盖用于STR长度计算的核心重复区,并且可根据二代测序序列起始质量较高的特点,通过调整STR重复区的起始位置,以达到最优的测序质量。
引物设计示例如下表1所示:
Figure BDA0002632305460000051
注:Chr:染色体;LEN:长度;TM:50%的引物处于解离状态时的温度;
(2)一整套适用于DNB环化的STR序列交叉互连评估体系的设计
对于需要进行环化的一组STR目标序列(所有序列本身、正向和反向、序列和序列之间)都要进行严格的序列互补自连评估,从而调整出一套最优的序列方向组合,尽量保证STR序列间不发生严重的交叉互连反应。
示例:如图2所示,某两种STR重复序列之间存在严重的交叉互连,可以通过调整其中一种STR序列的测序方向来避免;
基于以上原理,我们设计了一整套适用于DNB测序和环化的STR序列交叉互连评估体系,综合考虑一组STR序列的重复类型、重复长度、碱基比例等影响因素,从整体上优化所有STR序列的测序方向,继而保证后续的正常环化和 DNB扩增,从而达到测序结果各位点间的均衡。
原理:对任意两条长度分别为m、n的序列,在每个可能的Watson-Crick碱基配对状态上,逐一移位进行相互比对,计算互连得分,即匹配碱基数和不匹配碱基数的差值。这个过程将产生(m*n)次碱基比对和(m+n-1)次互连得分,取其中的最高得分作为m、n两条序列的最终互连得分。对于一组包含p条不同序列的集合,自身和两两比较,将产生1/2(p2+p)组比较结果,根据比较结果选择一套使得体系互连反应总得分最低的重复基序类型组合,并据此调整所有引物扩增方向,以保证扩增出的STR序列间不发生严重的交叉互连。
(3)靶区域扩增:按照下面所列反应体系和扩增条件进行第一轮PCR扩增。
扩增体系:采用0.2mL PCR管/96孔PCR板,在超净台里按照如下表2所述体系配置反应:
表2
Component 30μL Reaction
JN-1500MIX 6μL
gDNA(20-300ng) ×μL
3×EnzymeHT 10μL
H<sub>2</sub>0 add to 30μL
PCR扩增程序如表3所示:
表3
Figure BDA0002632305460000061
*如DNA低于5ng,适当增加1个循环。
(4)一套适用于目前主流二代测序平台的超高通量Index***的设计
作为一种优选地可实施方式,本发明为穷尽单端Index***的效能,充分发挥二代测序在高通量大样本上的优势,我们设计了一套适用于目前主流二代测序平台的超高通量Index***。根据碱基平衡和激光平衡原则、GC含量30~70%、连续重复碱基小于等于5、本身反向互补不一致、汉明距离大于3、与目前主流平台Index不冲突的严格条件,我们搜索了所有10bp长度Index的可能空间,最后优化了一套包含2016个Index(可按96或32个一组随机组合)的超高通量Index ***,以及对应的高效拆分脚本。数据拆分默认允许1bp的容错空间,经过多批次的实验测试,该Index***的最终下机数据拆分率达94%,最终用于样本位点分析的有效数据量高于80%,充分发挥了高通量测序平台并行测序大批量样本的优势。
以下表4为高通量2016Index***碱基平衡评估:
表4
Pos A C G T 最高碱基占比
1 506 504 511 495 25.35%
2 508 504 506 498 25.20%
3 504 506 507 499 25.15%
4 507 502 506 501 25.15%
5 501 507 506 502 25.15%
6 505 504 502 505 25.05%
7 503 505 505 503 25.05%
8 506 503 505 502 25.10%
9 504 504 505 503 25.05%
10 500 508 503 505 25.20%
某组96Index示例,如图3所示。
(5)第一轮PCR产物纯化后,进行第二轮PCR扩增,并引入步骤(4)中二代测序相应的Index***。第二轮PCR扩增的体系如表5所示:
表5
Figure BDA0002632305460000071
Figure BDA0002632305460000081
*不同的样品请使用不同的Barcode/Index。
PCR扩增程序如表6所示:
表6
Figure BDA0002632305460000082
*一般为6个循环,当原始DNA少于10ng时,用8循环。
(6)PCR产物回收。用纯化试剂盒或其他等效的磁珠对PCR产物进行纯化。
二、进行二代测序(DNB测序技术)
利用华大测序仪对上述PCR产物进行DNB测序。
实施例2
一种基于多重PCR技术和DNB技术的STR分型方法,与实施例1的方法相同,其中:
(1)STR位点信息:以Expanded CODIS core loci的20个常染色体STR为例,具***点信息如下表7所示:
表7 Expanded CODIS core loci的20个常染色体STR
Figure RE-GDA0002901852110000091
(2)STR位点引物信息
多重PCR初始引物设计如下表8所示,完全包含STR的重复区域:
表8
Figure BDA0002632305460000092
(3)关于DNB环化的STR序列交叉互连评估
按照多重PCR初始引物的扩增方向,我们得到扩增产物的重复序列,并根据重复类型、重复长度和碱基比例进行分类,如表9所示,共得到5种重复基序类型:
表9
Figure RE-GDA0002901852110000093
Figure RE-GDA0002901852110000101
对所有重复基序类型间可能存在的交叉互连反应进行计算评估。
原理:对任意两条长度分别为m、n的序列,在每个可能的Watson-Crick碱基配对状态上,逐一移位进行相互比对,计算互连得分,即匹配碱基数和不匹配碱基数的差值。这个过程将产生(m*n)次碱基比对和(m+n-1)次互连得分,取其中的最高得分作为m、n两条序列的最终互连得分。对于一组包含p条不同序列的集合,自身和两两比较,将产生1/2(p2+p)组比较结果。
具体到该例中,首先将各重复基序类型统一重复6次,如两个重复长度为4 的基序类型,重复6次后,得到两条24bp长度的序列,碱基逐一比对,将产生 576次碱基比对和47次互连得分(为考虑计算量,根据重复类型,可重复4-10 次,获得20-30bp长度的序列较为合适)。该组共包含10种基序类型(包括正向和反向),自身、两两之间分别比较,共产生55组比较结果(最高得分),其中有15组得分在7以上,列表如下表10所示:
表10
Figure RE-GDA0002901852110000102
Figure 1
从上述结果表中,选择一套使得体系互连反应总得分最低的重复基序类型组合,并据此调整所有引物扩增方向,以保证扩增出的STR序列间不发生严重的交叉互连。
原理:每对反应得分的计算方式为,每种类型正向或反向选其一,根据会发生互连反应的两种类型,统计全部20个STR中属于这两种类型的位点数a、b,以及该互连反应的最高得分S,即可计算体系中该反应的得分a*b*S。一组类型在体系中的所有互连反应的得分加和,即为体系总得分。
具体到该例中,若选择的重复基序类型组合为1_rc,2_rc,3_rc,4_rc,5_rc,则其中会发生互连反应的类型为5_rc和5_rc,属于该类型的位点只有D22S1045,因此位点数分别为1和1,该互连反应的最高得分为7,因而体系中该反应的得分为1*1*7=7。因为该组合没有其他互连反应,所以体系总得分也为7,通过完全计算,我们发现该组合的体系总得分在所有组合中是最低的,因此该组合为最优的重复基序类型组合。据此,我们将所有位点的引物扩增方向进行调整,例如 D1S1656的原引物扩增方向为正向,重复基序类型为1,调整成反向扩增后,重复基序类型变为1_rc。
经过上述交叉互连评估和引物调整后,我们从整体上优化了Expanded CODIScore loci的20个常染色体STR的测序方向,继而保证后续的正常环化和 DNB扩增,从而达到测序结果各位点间的均衡。
(4)最终检测的分型结果
对于标准品2800M的最终测序结果如图4所示,表明本发明成功建立了基于多重PCR技术和DNB技术的STR分型方法,本发明基于多重PCR扩增体系,利用DNB测序技术位点多、通量高、成本低的特点进行STR分型,保证了测序结果的精确性和可靠性,同时也更适用于未来STR检测的标准化。
序列表
<110> 广州深晓基因科技有限公司
广州市刑事科学技术研究所
<120> 一种基于多重PCR技术和DNB技术的STR分型方法
<141> 2020-08-13
<160> 40
<170> SIPOSequenceListing 1.0
<210> 1
<211> 22
<212> DNA
<213> 人(Homo sapiens)
<400> 1
gcagcacaaa actcgtttag ca 22
<210> 2
<211> 26
<212> DNA
<213> 人(Homo sapiens)
<400> 2
tataagttca agcctgtgtt gctcaa 26
<210> 3
<211> 25
<212> DNA
<213> 人(Homo sapiens)
<400> 3
atgcctacat ccctagtacc tagca 25
<210> 4
<211> 24
<212> DNA
<213> 人(Homo sapiens)
<400> 4
ccagtggatt tggaaacaga aatg 24
<210> 5
<211> 22
<212> DNA
<213> 人(Homo sapiens)
<400> 5
ctgtaacaag ggctacagga at 22
<210> 6
<211> 29
<212> DNA
<213> 人(Homo sapiens)
<400> 6
caccacaccc agccataaat aacatatta 29
<210> 7
<211> 23
<212> DNA
<213> 人(Homo sapiens)
<400> 7
caccttcctc tgcttcactt ttc 23
<210> 8
<211> 23
<212> DNA
<213> 人(Homo sapiens)
<400> 8
ccttctgtcc ttgtcagcgt tta 23
<210> 9
<211> 21
<212> DNA
<213> 人(Homo sapiens)
<400> 9
ctgcagtcca atctgggtga c 21
<210> 10
<211> 23
<212> DNA
<213> 人(Homo sapiens)
<400> 10
ctcatgaaat caacagaggc ttg 23
<210> 11
<211> 29
<212> DNA
<213> 人(Homo sapiens)
<400> 11
atcacggtct gaaatcgaaa atatggtta 29
<210> 12
<211> 26
<212> DNA
<213> 人(Homo sapiens)
<400> 12
ctgcagggca taacattatc caaaag 26
<210> 13
<211> 22
<212> DNA
<213> 人(Homo sapiens)
<400> 13
acttggacag catttcctgt gt 22
<210> 14
<211> 23
<212> DNA
<213> 人(Homo sapiens)
<400> 14
cagattgtac agaggaggca ctt 23
<210> 15
<211> 22
<212> DNA
<213> 人(Homo sapiens)
<400> 15
ctctcccatc tggatagtgg ac 22
<210> 16
<211> 23
<212> DNA
<213> 人(Homo sapiens)
<400> 16
gtgacaaggg tgattttcct ctt 23
<210> 17
<211> 30
<212> DNA
<213> 人(Homo sapiens)
<400> 17
attgtgaggt cttaaaatct gaggtatcaa 30
<210> 18
<211> 30
<212> DNA
<213> 人(Homo sapiens)
<400> 18
aaagggtatg atagaacact tgtcatagtt 30
<210> 19
<211> 22
<212> DNA
<213> 人(Homo sapiens)
<400> 19
cacggcctgg caacttatat gt 22
<210> 20
<211> 30
<212> DNA
<213> 人(Homo sapiens)
<400> 20
gctgtcaaaa accgtatgta ttcttgtttc 30
<210> 21
<211> 27
<212> DNA
<213> 人(Homo sapiens)
<400> 21
aagcttagta cttaactcac tgccttg 27
<210> 22
<211> 30
<212> DNA
<213> 人(Homo sapiens)
<400> 22
ttcccttgtc ttgttattaa aggaacaact 30
<210> 23
<211> 25
<212> DNA
<213> 人(Homo sapiens)
<400> 23
aaatgacact gctacaactc acacc 25
<210> 24
<211> 22
<212> DNA
<213> 人(Homo sapiens)
<400> 24
cattggcctg ttcctccctt at 22
<210> 25
<211> 28
<212> DNA
<213> 人(Homo sapiens)
<400> 25
gtgatagtag tttcttctgg tgaaggaa 28
<210> 26
<211> 25
<212> DNA
<213> 人(Homo sapiens)
<400> 26
cttgcagatg gactgtcatg agatt 25
<210> 27
<211> 33
<212> DNA
<213> 人(Homo sapiens)
<400> 27
gagataggac agatgataaa tacataggat gga 33
<210> 28
<211> 29
<212> DNA
<213> 人(Homo sapiens)
<400> 28
cactttgccc ttattatttt gtgaactcc 29
<210> 29
<211> 23
<212> DNA
<213> 人(Homo sapiens)
<400> 29
attctgccta cagccaatgt gaa 23
<210> 30
<211> 25
<212> DNA
<213> 人(Homo sapiens)
<400> 30
caaatctcct ccttcaactt gggtt 25
<210> 31
<211> 28
<212> DNA
<213> 人(Homo sapiens)
<400> 31
ggtctaagag cttgtaaaaa gtgtacaa 28
<210> 32
<211> 23
<212> DNA
<213> 人(Homo sapiens)
<400> 32
gcgtttgtgt gtgcatctgt aag 23
<210> 33
<211> 26
<212> DNA
<213> 人(Homo sapiens)
<400> 33
cacttcactc tgagtgacaa attgag 26
<210> 34
<211> 27
<212> DNA
<213> 人(Homo sapiens)
<400> 34
gcaacaacac aaataaacaa accgtca 27
<210> 35
<211> 24
<212> DNA
<213> 人(Homo sapiens)
<400> 35
aaggaacagg tggtgttggt taca 24
<210> 36
<211> 28
<212> DNA
<213> 人(Homo sapiens)
<400> 36
gttgaggctg caaaaagcta taattgta 28
<210> 37
<211> 24
<212> DNA
<213> 人(Homo sapiens)
<400> 37
atatgtgagt caattcccca agtg 24
<210> 38
<211> 28
<212> DNA
<213> 人(Homo sapiens)
<400> 38
tgtattagtc aatgttctcc agagacag 28
<210> 39
<211> 22
<212> DNA
<213> 人(Homo sapiens)
<400> 39
cctctccacc ctatagaccc tg 22
<210> 40
<211> 27
<212> DNA
<213> 人(Homo sapiens)
<400> 40
cctcagctgt agaatggaaa tagtgac 27

Claims (10)

1.一种基于多重PCR技术和DNB技术的STR分型方法,其特征在于,包括如下步骤:
S1.待测样品预处理,提取待测样品DNA;
S2.针对待测STR基因座设计多重PCR引物并建立关于DNB环化中STR序列交叉互连的评估体系,调整多重PCR引物扩增方向;
S3.以步骤S1待测样品DNA为模板,利用步骤S2设计的多重PCR引物进行第一轮PCR扩增反应;
S4.将第一轮PCR产物纯化,进行第二轮PCR扩增引入高通量Index;
S5.将第二轮PCR扩增回收、纯化;
S6.PCR产物进行DNB测序;
步骤S2所述评估体系为对任意两条长度分别为m、n的扩增产物序列,在每个可能的碱基配对状态上,逐一移位进行相互比对,计算互连得分,即匹配碱基数和不匹配碱基数的差值;产生(m*n)次碱基比对和(m+n-1)次互连得分,取其中的最高得分作为m、n两条序列的最终互连得分;对于一组包含p条不同序列的集合,自身和两两比较,产生1/2(p2+p)组比较结果;根据比较结果选择一套使得体系互连反应总得分最低的重复基序类型组合,并据此调整所有引物扩增方向,以保证扩增出的STR序列间不发生严重的交叉互连。
2.根据权利要求1所述的STR分型方法,其特征在于,所述待测STR基因座包括D1S1656、D2S1338、D2S441、TPOX、D3S1358、FGA、CSF1PO、D5S818、D7S820、D8S1179、D10S1248、TH01、D12S391、vWA、D13S317、D16S539、D18S51、D19S433、D21S11或D22S1045中的至少两个。
3.根据权利要求1所述的STR分型方法,其特征在于,所述多重PCR引物除了遵循传统多重PCR引物设计原则,还兼顾不同长度、类型和拷贝数STR位点扩增子间的均衡性,使得设计的PCR扩增引物能够精确涵盖用于STR长度计算的核心重复区,并且根据二代测序序列起始质量较高的特点,通过调整STR重复区的起始位置,以达到最优的测序质量。
4.根据权利要求2或3所述的STR分型方法,其特征在于,所述STR基因座多重PCR引物分别包括上游引物和下游引物,其序列依次如SEQ ID NO:1~40所示。
5.根据权利要求1所述的STR分型方法,其特征在于,所述第一轮PCR扩增反应的扩增体系为:JN-1500MIX 6μL,基因组DNA 20-300ng,3×EnzymeHT10μL,加H2O至30μL。
6.根据权利要求1所述的STR分型方法,其特征在于,所述第一轮PCR扩增反应的扩增程序为98℃3~5min;98℃20s,60℃6min,共20个循环;72℃6min。
7.根据权利要求1所述的STR分型方法,其特征在于,所述高通量Index要求根据碱基平衡和激光平衡原则、GC含量30~70%、连续重复碱基小于等于5、本身反向互补不一致、汉明距离大于3、与目前主流平台Index不冲突的严格条件。
8.根据权利要求1所述的STR分型方法,其特征在于,所述第二轮PCR扩增反应的扩增体系为:2×HIFI_Enzyme 15μL,Nuclease-Free H2O 13μL,Primer_MGI-F 1μL,MGI_Bar_xxx1μL,共30μL。
9.根据权利要求1所述的STR分型方法,其特征在于,第二轮PCR扩增反应的扩增程序为:98℃2min;98℃15s,58℃15s,72℃30s,6个循环;72℃2min。
10.权利要求1~9任一项所述的方法在个体识别和/或亲权鉴定中的应用。
CN202010814836.0A 2020-08-13 2020-08-13 一种基于多重pcr技术和dnb技术的str分型方法 Active CN112626223B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010814836.0A CN112626223B (zh) 2020-08-13 2020-08-13 一种基于多重pcr技术和dnb技术的str分型方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010814836.0A CN112626223B (zh) 2020-08-13 2020-08-13 一种基于多重pcr技术和dnb技术的str分型方法

Publications (2)

Publication Number Publication Date
CN112626223A true CN112626223A (zh) 2021-04-09
CN112626223B CN112626223B (zh) 2024-03-22

Family

ID=75300084

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010814836.0A Active CN112626223B (zh) 2020-08-13 2020-08-13 一种基于多重pcr技术和dnb技术的str分型方法

Country Status (1)

Country Link
CN (1) CN112626223B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109022559A (zh) * 2018-08-21 2018-12-18 华中农业大学 一种基于二代测序技术的分子标记检测方法
CN110878334A (zh) * 2019-11-12 2020-03-13 北京康普森生物技术有限公司 用于扩增子测序的引物及两步pcr建库方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109022559A (zh) * 2018-08-21 2018-12-18 华中农业大学 一种基于二代测序技术的分子标记检测方法
CN110878334A (zh) * 2019-11-12 2020-03-13 北京康普森生物技术有限公司 用于扩增子测序的引物及两步pcr建库方法

Also Published As

Publication number Publication date
CN112626223B (zh) 2024-03-22

Similar Documents

Publication Publication Date Title
CN107208144B (zh) 无酶且无扩增的测序
CN110358815B (zh) 一种同时检测多个靶标核酸的方法及其试剂盒
CN108103164B (zh) 一种利用多重荧光竞争性pcr检测拷贝数变异的方法
CN105899680A (zh) 核酸探针和检测基因组片段的方法
CN111118151A (zh) 基于数字pcr法的人smn1与smn2基因拷贝数检测试剂盒
US11912988B2 (en) Method and kit for constructing a simplified genomic library
CN110317861B (zh) 一种检测病原体的试剂盒
EP3643789A1 (en) Pcr primer pair and application thereof
EP2785865A1 (en) Method and kit for characterizing rna in a composition
CN109486912A (zh) 一种用于数字pcr扩增的探针引物组合及设计方法
WO2022161272A1 (zh) 检测人群微卫星不稳定性的生物标志物组及其应用
CN106591442B (zh) 用于y染色体微缺失检测的引物组合及试剂盒
CN109321662B (zh) 一种人类Y染色体15个Indel基因座的荧光标记复合扩增试剂盒
CN107406891B (zh) Pcr方法
CN110218811B (zh) 一种筛选水稻突变体的方法
CN112626223B (zh) 一种基于多重pcr技术和dnb技术的str分型方法
WO2020159435A1 (en) Method of sequencing nucleic acid with unnatural base pairs
WO2020005159A1 (en) Method for detection and quantification of genetic alterations
CN115851915A (zh) 检测遗传性共济失调致病基因的引物组及方法
CN116065240A (zh) 一种高通量构建rna测序文库的方法及试剂盒
US20100297622A1 (en) Method for high-throughput gene expression profile analysis
CN112029836A (zh) 检测braf基因突变的核酸组合物及试剂盒和braf基因突变的检测方法
CN108841919A (zh) 一种嵌合式sda法制备探针
CN114277096B (zh) 鉴别地中海贫血αααanti4.2杂合型和HKαα杂合型的方法和试剂盒
CN117535388B (zh) 大鼠短串联重复序列检测的扩增引物、多重扩增体系和试剂盒

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant