CN102449171B - 对fmr1和fmr2基因5’非翻译区进行表征的pcr方法 - Google Patents

对fmr1和fmr2基因5’非翻译区进行表征的pcr方法 Download PDF

Info

Publication number
CN102449171B
CN102449171B CN201080032511.1A CN201080032511A CN102449171B CN 102449171 B CN102449171 B CN 102449171B CN 201080032511 A CN201080032511 A CN 201080032511A CN 102449171 B CN102449171 B CN 102449171B
Authority
CN
China
Prior art keywords
primer
cgg
rich
district
agg
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201080032511.1A
Other languages
English (en)
Other versions
CN102449171A (zh
Inventor
G.J.拉萨姆
陈良进
S.萨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Asuragen Inc
Original Assignee
Asuragen Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Asuragen Inc filed Critical Asuragen Inc
Priority to CN201510735951.8A priority Critical patent/CN105296474B/zh
Publication of CN102449171A publication Critical patent/CN102449171A/zh
Application granted granted Critical
Publication of CN102449171B publication Critical patent/CN102449171B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6851Quantitative amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6858Allele-specific amplification

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本公开涉及通过利用一组至少其中之一包含CGG重复区的一部分的引物扩增一组产物并分离所述产物产生产物大小和丰度的表现形式,从而确定三核苷酸(例如CGG)重复区内是否存在AGG或中断元件及其位置的方法,和确定该区域内存在的重复数目的方法。

Description

对FMR1和FMR2基因5’非翻译区进行表征的PCR方法
相关申请的交叉引用
本申请根据35U.S.C.§119(e),要求2009年3月24日提交的美国临时申请61/162,977的权利。
发明描述
发明领域
本发明属于DNA合成与分析领域,特别是涉及富含GC的模板和产物。
概述
自从首次分离到DNA合成酶并确定了体外合成DNA的条件,DNA合成反应已被广泛在生物技术、医药和研究应用中用于制备和分析目的。聚合酶链式反应,或PCR是可以快速和指数性扩增DNA序列的一类DNA合成反应。与其他循环进行的合成反应一样,PCR涉及以循环的方式反复拷贝靶序列。典型的PCR实施过程包括提供与待扩增序列末端互补的引物、合适的缓冲液、镁盐、脱氧核苷三磷酸(dNTPs)和嗜热DNA聚合酶。包含在例如基因组DNA样品中的模板或靶DNA与这些成分在水溶液中接触。混合物在不同温度进行循环,这些温度促进模板的变性、引物与模板的退火、然后聚合酶对引物的延伸,从而产生更多产物。由于每个循环的产物可以在随后的反应中作为模板,产物的量几乎指数增长直至其他反应成分(开始过量存在)被耗尽。参见例如美国专利4,683,202;M.J.McPherson&S.G.Moller,PCR:TheBasics(2ndEd.,Taylor&Francis)(2006)。
PCR与其他形式的循环进行的核酸合成反应对于分子生物学、生物技术、以及日渐地对于医学都是标准工具。PCR和相关技术的关键优势是快速、低成本、敏感度、可用于高通量分析以及多能性。扩增只需要几小时甚至更短时间、少数的个别反应可能只耗费1美元以下的试剂、需要的模板量通常在纳克级别、自动化使得每个机器人每天可以进行几千个反应,可以设计出用于扩增几乎任何序列的引物。
PCR及相关技术被广泛用于分析和制备应用。PCR的典型制备用途是用于扩增序列使它可以克隆到异源载体中。PCR重要的分析应用包括涉及具有大小多态性的基因座的病情诊断或基因型确定。
表现出医学相关的大小多态性的基因座一个例子是,位于人X染色体上的FMR1基因的5’非翻译区(UTR)。正常个体的该区域内通常有5-44个CGG重复。相反,含有200到2000或更多个CGG重复的基因座等位基因指示着脆性X染色体综合征(FXS)。这种等位基因被称为全突变等位基因(FullMutationalleles)。它们在遗传学上不稳定。患有FXS的个体可能有诸如共济失调、卵巢早衰、学习障碍和其他认知/行为状况(包括类自闭症症状)的症状的各种组合。
PCR多能性的一个令人遗憾的例外是难以扩增富含GC序列的长片段,包括FMR15’UTR的全突变等位基因。对FMR1PCR进行的优化企图包括对常规PCR方法条件的改进。参见GenomeRes.6(7):633-8(1996);NucleicAcidsRes.25(19):3957-8(1997);J.Mol.Diagn8:544-550(2006);Am.J.Med.Genet.51(4):527-34(1994)。但是在FMR1PCR方法发展了15年多以后,即使最近的2008年(Genet.Med.10(10):714-9(2008)),一篇发表的关于检测新生儿中脆性X染色体的试验性筛选研究仍报道说“在确定女性中FMR1重复数目的内部验证过程中使用的...两种定量链式聚合酶反应(PCR)分析方法未能产生可靠和可重复的结果(粗体是后加的),此外“由初级或次级分离物进行的二次PCR的失败高度提示FMR1CGG重复的异常大小”。因此,本领域技术人员仍然把可重复地PCR扩增全突变脆性X染色体等位基因看作是有待解决的问题。
在通过PCR检测含有超过100个重复的CGG三联重复区时观察到,随着重复数目的增加,检测越来越弱(J.Mol.Diagn.7:605-12(2005))。这一困难,结合FXS综合征的各不相同的特性,导致为了检测全突变等位基因使用诸如Southern印迹的程序(同上)。Southern印迹通常比PCR更耗时,成本更高,没有PCR适合用于高通量应用。
Tassone等(J.Mol.Diagn.10:43-49(2008);“Tassone2008”)最近发表的文章描述了用于不经等位基因的全长扩增来检测较长CGG等位基因的分析法。还可参见WO2008/011170。该方法利用了与延展的CGG区内的位点杂交的嵌合PCR引物,这样如果存在宽的PCR产物弥散带就表明延展等位基因阳性(同上46页)。
随机杂交策略可能导致非特异性扩增和分辨力不足。这篇文章中使用的基础PCR条件已被多个不同实验室进行了检验,似乎可以成功扩增的CGG重复数目是大约350CGG重复。参见例如Salutoetal.,J.Mol.Diagn.7:605-612(2005)。Tassone2008中的非特异扩增很明显。Tassone2008图1所示的琼脂糖凝胶中的弥散带似乎含有的产物超过了包含350个重复的扩增子的预期最大长度,因此可能弥散带大部分不代表CGG重复的特异产物(参见Tassone2008的图1;泳道5中的弥散带似乎延伸到上样孔内的空间)。Tassone等在图3的图标中指出他们使用了High-Lowladder(Bionexus,Oakland,CA)作为分子量标记,图1中的标记似乎与图3的相同。High-Lowladder中最大的条带大约10kb,而图1中的弥散带超过了该条带。这一长度也比分析中使用的样品的预期全长产物长。列出的最大等位基因大小是615个CGG重复。因此,通过给1845nt重复加上大约200nt旁侧序列估计出全长产物预期大约2kb。非特异性产物会降低基于扩增的脆性X染色体关联等位基因状态的确定方法的准确性和可信度。
此外,用于检测脆性X染色体的一些单纯基于基因特异性引物设计的常规PCR方法有局限性。例如,这类方法根据PCR扩增子的迁移率提供对CGG重复数目的一个估计。为了能够准确地确定重复数目,通常相对外部校准物(例如一组合适的分子量标准)来测量扩增子迁移率。能够不依赖外部校准物的情况下准确确定CGG的数目将是可取的。
而且,FMR1等位基因可能含有散布在CGG重复中的AGG序列,通常位于重复区段的5’区域。对AGG序列元件的了解可以从一方面表征等位基因。AGG序列元件可以用于临床决策。例如注意到某个仅含有59个重复的FMR1等位基因,从母亲到她的孩子中延展为全突变等位基因的病例,并且已知该等位基因缺乏任何AGG元件。参见Nolinetal.,Am.J.Hum.Genet.72:454-464(2003)。的确,全突变如果会,也是很少在第一批20个CGG重复之后含有AGG元件,生物物理研究表明在CGG重复区段中带有AGG“中断者”的模板更可能采取更常规的DNA结构,更稳定和易于被准确地复制。参见例如Weisman-Shomeretal.,NucleicAcidsRes.28:1535-41(2000);Zhongetal.,Am.J.Med.Genet.64:261-5(1996);Larsenetal.,Am.J.Med.Genet.93:99-106(2000);和Dombrowskietal.,Hum.Mol.Genet.11:371-78(2002)。因此,需要对FMR1基因中诸如AGG元件的中断元件进行作图的技术。所以中断元件作图具有与脆性X染色体综合征,以及其他重复相关疾病有关的研究和诊断应用。
现有的AGG元件作图方法包括测序和限制性酶切图谱。DNA测序技术比较繁重,特别是因为该技术通常需要对目标序列进行富集或分离(无论是体外或通过电脑模拟),在脆性X染色体诊断测试中不是常规进行的。基于限制性酶切图谱的方法使用MnlI酶(酶识别GAGG序列,在所述序列5’方向7个碱基对处切割)来根据包含FMR15’UTR中CGG重复区的PCR产物被消化得到的片段大小来推测AGG的位置。参见例如Eichleretal.,Nat.Genet.8:88-94(1994);Zhongetal.,Am.J.Hum.Genet.57:351-361(1995)。Eichler等的方法包括重复区的PCR扩增、产物纯化、过夜酶切消化、电泳7小时以及Southern印迹。在Zhong等的方法中,“将PCR产物用酚/氯仿提取一次,乙醇沉淀并在10升中用5单位MnlI于37℃部分消化50-70分钟(thePCRproductwasextractedoncewithphenol/chloroform,ethanolprecipitated,andpartiallydigestedin10literswith5unitsatfor50-70min.)”(同上353页)。之后进行电泳和Southern印迹。这两种方法除了PCR和电泳还涉及多个步骤,包括纯化/清理、限制酶切和Southern印迹。
本文提供了方法对FMR1和FMR2基因的5’UTR中CGG重复进行定量,以及中断序列的序列成分进行鉴定、定量和揭示。本发明潜在的应用包括给脆性X染色体测试的临床应用。
一些实施方案中,发明涉及分析样品中至少一种模板所包含的至少一种CGG富含区的方法,所述方法包括:
(a)提供至少两个不同引物,包括含有CGG、CCG、GCG、CGC、GCC或GGC重复的第一引物;和与CGG富含区之外的位点退火的第二引物;
(b)用所述至少两个不同引物和包含至少一种CGG富含区的至少一种模板进行PCR,其中所述PCR产生一组产物;
(c)利用分辨率高的技术将产物分开,产生产物大小和丰度的表现形式(representation);以及
(d)得出关于所述至少一种CGG富含区中是否存在中断序列,或者中断序列在所述至少一种CGG富含区中处于何处的信息。
一些实施方案中,发明涉及分析样品中至少一种模板所包含的至少一种CGG富含区的方法,所述方法包括:
(a)提供至少三种不同引物,包括含有CGG、CCG、GCG、CGC、GCC或GGC重复和5’侧翼(flap)的第一引物;与CGG富含区之外的位点退火的第二引物;和具有第一引物的5’侧翼所包含的序列的第三引物,其中第一引物提供的浓度低于第三引物;
(b)用所述至少三种不同引物和所述至少一种模板进行PCR,其中所述PCR产生一组产物;
(c)利用分辨率高的技术将产物分开,产生产物大小和丰度的表现形式;以及
(d)由上述表现形式得出关于所述至少一种CGG富含区中是否存在中断序列,或者中断序列在所述至少一种CGG富含区中处于何处的信息。
一些实施方案中,发明涉及分析样品中至少一种模板所包含的至少一种CGG富含区的方法,所述方法包括:
(a)提供两种不同引物,其中第一引物含有CGG、CCG、GCG、CGC、GCC或GGC重复;第二引物与CGG富含区之外的位点退火;
(b)用所述至少两种不同引物和包含CGG富含区的模板进行PCR,其中所述PCR产生一组产物;
(c)利用分辨率高的技术将产物分开,产生产物大小和丰度的表现形式;以及
(d)由所述表现形式得出关于CGG重复数目的信息。
一些实施方案中,发明涉及分析样品中至少一种模板所包含的至少一种CGG富含区的方法,所述方法包括:
(a)提供三种不同引物,其中第一引物含有CGG、CCG、GCG、CGC、GCC或GGC重复和5’侧翼;第二引物与CGG富含区之外的位点退火;第三引物具有第一引物的5’侧翼所包含的序列;
(b)用所述三种不同引物和包含CGG富含区的模板进行PCR,其中所述PCR产生一组产物;
(c)利用分辨率高的技术将产物分开,产生产物大小和丰度的表现形式;以及
(d)由所述表现形式得出关于CGG重复数目的信息。
一些实施方案中,发明涉及包含选自SEQIDNO:44和SEQIDNO:45的序列的寡核苷酸。
应当理解,如权利要求,以上概述和下面的详述仅用于示范和解释,不是对发明的限制。
发明详述
发明涉及扩增CGG重复区全部或部分的扩增反应。一些实施方案中,CGG重复区包含在FMR1的5’UTR或FMR2的5’UTR中。
发明涉及这样的扩增反应,所述反应使用与CGG重复区以外退火的引物,和与CGG重复序列、序列的序列置换或反向互补(GCG、CCG、CGC、GCC或GGC)退火的引物。与CGG重复区以外(上游或下游)退火的引物可以是正向或反向引物。引物可以与CGG重复区旁侧的序列退火。这类正向引物的例子包括CGGTGGAGGGCCGCCTCTGAGC(SEQIDNO:1)、CAGGCGCTCAGCTCCGTTTCGGTTT(SEQIDNO:2)、CAGTCAGGCGCTCAGCTCCGTTTCG(SEQIDNO:3)、TCCGGTGGAGGGCCGCCTCTGAGC(SEQIDNO:4)、GGTTCGGCCTCAGTCAGGCGCTCAGCTCCGTTTCG(SEQIDNO:5)、GGGTTCGGCCTCAGTCAGGCGCTCAGCTCCGTTTCG(SEQIDNO:6)、GCGGGCCGGGGGTTCGGCCTCAGTCA(SEQIDNO:7)、CAGCGGGCCGGGGGTTCGGCCTCAG(SEQIDNO:8)、GCAGCGGGCCGGGGGTTCGGCCTCA(SEQIDNO:9)、GGGCCGGGGGTTCGGCCTCAGTCAG(SEQIDNO:10)、GGGGTTCGGCCTCAGTCAGGCGCTCA(SEQIDNO:11)、GGGGTTCGGCCTCAGTCAGGCGCTCAG(SEQIDNO:12)、GGCGCTCAGCTCCGTTTCGGTTTCACTTCC(SEQIDNO:13)、TCAGGCGCTCAGCTCCGTTTCGGTTTCA(SEQIDNO:14)、CACTTCCGGTGGAGGGCCGCCTCTGA(SEQIDNO:15)、TTCCGGTGGAGGGCCGCCTCTGAGC(SEQIDNO:16)和TCAGGCGCTCAGCTCCGTTTCGGTTTCACGGCGGCGGCGGCGGA(SEQIDNO:44)。这类反向引物的例子包括CGCACTTCCACCACCAGCTCCTCCA(SEQIDNO:17)、GGAGCCCGCCCCCGAGAGGTG(SEQIDNO:18)、GGGAGCCCGCCCCCGAGAGGT(SEQIDNO:19)、CGCACTTCCACCACCAGCTCCTCCAT(SEQIDNO:20)、CGGGAGCCCGCCCCCGAGAGGTG(SEQIDNO:21)、CCGGGAGCCCGCCCCCGAGAGGT(SEQIDNO:22)、CCGGGAGCCCGCCCCCGAGAGGTG(SEQIDNO:23)、CGCCGGGAGCCCGCCCCCGAGAGGTG(SEQIDNO:24)、GCGCCGGGAGCCCGCCCCCGAGAGGT(SEQIDNO:25)、CGCCGGGAGCCCGCCCCCGAGAGGT(SEQIDNO:26)、GCGCCATTGGAGCCCCGCACTTCCACCA(SEQIDNO:27)、GCGCCATTGGAGCCCCGCACTTCCA(SEQIDNO:28)、AGCGCCATTGGAGCCCCGCACTTCC(SEQIDNO:29)、CGCCATTGGAGCCCCGCACTTCCAC(SEQIDNO:30)、TTGGAGCCCCGCACTTCCACCACCA(SEQIDNO:31)、AGCCCCGCACTTCCACCACCAGCTCCTC(SEQIDNO:32)、GAGCCCCGCACTTCCACCACCAGCTCCT(SEQIDNO:33)、CATTGGAGCCCCGCACTTCCACCACCAG(SEQIDNO:34)、CCCGCACTTCCACCACCAGCTCCTCCATCT(SEQIDNO:35)、TAGAAAGCGCCATTGGAGCCCCGCACTTCC(SEQIDNO:36)、AAGCGCCATTGGAGCCCCGCACTTCC(SEQIDNO:37)、AAGCGCCATTGGAGCCCCGCACTTCCCCGCCGCCGCCGCCG(SEQIDNO:43)和AAGCGCCATTGGAGCCCCGCACTTCCCCGCCGCCGCCGCCT(SEQIDNO:45)。
发明进一步涉及方法及其用途,包括提供引物TCAGGCGCTCAGCTCCGTTTCGGTTTCACTTCCGGT(SEQIDNO:38)、AGCGTCTACTGTCTCGGCACTTGCCCGCCGCCGCCG(SEQIDNO:39)、TCAGGCGCTCAGCTCCGTTTCGGTTTCA(SEQIDNO:40)和TCAGGCGCTCAGCTCCGTTTCGGTTTCACGGCGGCGGCGGCGG(SEQIDNO:41)。发明还涉及包含SEQIDNOs1-38或40之一并在3’端附加CGG重复或其置换和反转序列的引物。发明进一步涉及包括提供引物的方法及其用途,所述引物含有多个序列CGG的三核苷酸重复或其置换和反转序列。在一些实施方案中,引物中的CGG重复数量是四个或五个。在一些实施方案中,引物含有12-15个核苷酸的三核苷酸重复序列。在一些实施方案中,引物含有从3个到10个的多个重复。引物可能含有3、4、5、6、7、8、9或10个重复,和任选的1或2个C和/或G残基的其他部分重复。还可以提供其他引物来保证例如多态位点的结合,或者用于扩增大小已知区域作为内部标准。
在一些实施方案中,与CGG重复序列退火的引物对包含中断元件的CGG富含区内的位点优先结合。与CGG重复序列退火的引物优先结合至少一种包含中断元件的位点,通过例如在PCR反应中使用该引物和如上所述与CGG富含区之外结合的反向第二引物,会导致选择性扩增包含所述中断元件的至少一种产物。优先结合活性可以是对包含CGG和AGG元件的位点,或者它们的置换和/或反转序列特异的,比如包含(1)一个AGG元件或者包含A的部分AGG元件,以及(2)三、四、五、或六个CGG元件和任选的部分CGG元件的位点。
优先结合的程度,表达为使用所述引物和结合到CGG富含区之外的反向第二引物进行的扩增反应中被选择性扩增的产物与背景产物的比率,可以是至少3倍、4倍、5倍或6倍;或者可以在3-12倍、3-10倍、3-8倍、4-12倍、4-10倍、4-8倍、3-7倍、4-7倍、3-6倍或4-6倍的范围内。所述至少一种被选择性扩增的产物通常其长度对应沿着模板从与包含中断元件的位点优先结合时第一引物的5’端到与CGG富含区之外位点结合时第二引物的5’端之间的距离。
一些实施方案中,与CGG重复序列退火并优先结合包含中断元件的CGG富含区内的位点的引物可能在与CGG重复序列退火的引物部分的内部或者末端含有A、T或U残基,或者换句话说,在CGG、CCG、GCG、CGC、GCC或GGC重复之中或者末端含有A、T或U残基;参见例如以上SEQIDNOs44和45。A、T或U残基可以发生在引物的3’端。当A、T或U残基发生在CGG、CCG、GCG、CGC或GCC、GGC重复的末端时,A、T或U残基与最后一个完整CGG、CCG、GCG、CGC、GCC或GGC重复之间可能有也可能没有部分CGG、CCG、GCG、CGC、GCC或GGC重复。如下文更详细的描述,可以用非天然核苷酸残基代替A、T或U残基,所述非天然核苷酸残基比其他天然核苷酸残基更优先与T/U或A残基配对。类似地,也可能用一或多个比其他天然核苷酸残基更优先与C或G残基配对的非天然核苷酸残基代替构成CGG、CCG、GCG、CGC、GCC或GGC重复的一或多个G和/或C。在本来是由CGG、CCG、GCG、CGC、GCC或GGC重复(任选含有A、T、U或如上讨论的相应的非天然残基)构成的序列中存在一或多个这种非天然残基不影响所述序列在本发明公开中被认为是CGG、CCG、GCG、CGC、GCC或GGC重复序列。
在非锚定分析法中,提供的第一引物对不包含中断元件的CGG富含区有优先结合活性。在非锚定方法结果中,较低水平的产物表明存在着中断元件,因为这些产物的合成涉及第一引物结合到包含中断元件的位点上并延伸。低水平的产物在电泳图中显示为缺口或者被较高峰包围的低峰。
在锚定分析法中,提供的第一引物对包含中断元件的CGG富含区有优先结合活性。应当注意,可以给这样的反应提供对包含中断元件的CGG富含区内的位点有优先结合活性的引物,所述反应其中的至少一种模板包含至少一种含有0、1或复数个中断元件的CGG富含区;引物“对包含中断元件的CGG富含区有优先结合活性”的说法并不表示例如CGG富含区一定包含复数个中断元件。锚定分析法中,较高水平的产物表明存在着中断元件,因为这些产物的合成涉及第一引物与包含中断元件的位点结合并延伸。高水平产物可能在电泳图中显示为被低峰和/或基线信号包围的峰尖。
一些实施方案中,锚定分析法中使用的第一引物在CGG重复之中或者3’端包含A、T或U残基。一些实施方案中,锚定分析法中使用的第一引物包含比其他天然核苷酸残基更容易与A或T/U残基配对的非天然核苷酸残基。非天然核苷酸残基是包含腺嘌呤、胸腺嘧啶、鸟嘌呤、胞嘧啶和尿嘧啶(分别是A、T、G、C和U)之外的核苷碱基的核苷酸残基。优先与A或T/U残基配对的非天然核苷酸残基的例子包括,但不限于比其他天然残基更易于与A或T/U配对的T、U或A的加合物(例如5-取代的尿嘧啶类似物);和包含诸如例如假尿嘧啶和二氨基嘌呤的核苷碱基的残基。
两种引物与双链核酸模板的相反两链结合时,它们被认为是反向的引物。
本文中,当序列发生在包含CGG重复的链中CGG富含区的5’方向时,序列是CGG富含区的上游。本文中,当序列发生在包含CGG重复的链中CGG富含区的3’方向时,序列是CGG富含区的下游。
本发明的方法可能涉及包括提供至少两种或至少三种不同引物的扩增反应。在一些实施方案中,提供了至少三种不同引物,其中的一种引物是另一引物的亚序列。在一些实施方案中,一个引物是包含CGG重复和5’侧翼序列的嵌合引物,另一个引物具有嵌合引物5’侧翼序列的序列。应当注意,具有嵌合引物5’侧翼序列之序列的引物可以,但不必须具有嵌合引物的全部非重复序列。换句话说,一个引物的部分或全部序列可以由另一个引物的序列构成;例如,嵌合引物包含5’侧翼序列,另一个引物可以包含部分或全部5’侧翼的序列。在一些实施方案中,引物含有12-15个核苷酸的CGG重复序列。5’侧翼序列可能对应与CGG重复区相邻或靠近的序列,或者与CGG重复区内的和周围的序列无关。在一些实施方案中,嵌合引物的长度大约是35、40、45、50或55nt。在一些实施方案中,一或多种引物的Tm在60℃-75℃的范围内,例如大约60℃、65℃、70℃或75℃。
一些实施方案中,提供了至少三种不同引物,其中一种引物提供的浓度低于另一种引物的浓度。例如,任选提供的嵌合引物浓度低于具有嵌合引物5’侧翼序列之序列的引物的浓度。浓度的比率,以倍数表示,可能在2-10,000或更大的范围内,例如是10、20、50、100、200、500、1,000、2,000、5,000或10,000。这种实施方案中,处于较低浓度的引物可以在扩增反应早期的几轮中被耗尽,因此延伸通常全部或者几乎全部来自仍然存在的引物(开始处于较高浓度)。
本发明涉及扩增核酸的反应。扩增反应的例子包括,但不限于PCR、NASBA(基于核酸序列性扩增)和SDA(链置换扩增)。参见例如美国专利4,683,202(PCR);美国专利6,326,173;J.ofVirol.Methods151:283-293(2008)(NASBA);以及美国专利5,648,211(SDA)。以上文献均通过引用并入本文。技术人员知道适合提供何种试剂。这些方法每一种都涉及在有助于DNA聚合发生和含有模板的溶液中进行DNA的合成,因此涉及使用DNA聚合酶、核苷酸和二价阳离子(以盐提供,特别是镁)。这些方法的不同在于提供其他的催化活性、使用热循环温育或等温温育以及引物的使用和结构。通常还要提供合适pH的缓冲液,比如pH7和8、6.5和8.5、6和9之间,或者大约7.4或7.5。
根据本发明的PCR,至少提供一对与相反两链的末端或者目标区域结合的引物,这样它们各自引导朝向另一引物的合成。反应在不同温度循环从而推动高温下底物变性步骤、低温下引物退火步骤,以及在可能但不一定比退火步骤的温度高的温度下进行延伸。由于一个循环的产物可以在下个循环中作为底物,发生扩增。
在NASBA中,除了DNA聚合酶,还提供RNA聚合酶(RNAP),后者也可能是逆转录酶(RT)(例如,可以利用RNA或DNA模板催化DNA合成的酶)。提供的引物类似于PCR中使用的那些,但至少一种引物还包含RNAP可以识别的启动子序列。因此,RT的产物作为RNAP的模板,而RNAP合成RNA作为RT的模板,从而发生扩增。一些形式的NASBA中,提供RNaseH在通过RT合成了RNA-DNA杂交体后产生单链DNA。通过RT和RNAP的联合作用,在不需要反复热变性的情况下进行扩增。
SDA技术中以等温和异步方式进行DNA扩增,意味着不是利用循环式热变性来分开两条链的,而是通过DNA合成本身进行链置换,其中3’OH的延伸导致下游链被置换。3’OH先是由外部引物提供,然后通过切口反应提供。需要提供两对引物。‘内部’的一对引物与扩增子周围结合,并且包含含有限制性酶切位点的5’侧翼。另一对“外部”引物定位在远侧,即离目标区域更远。内部引物可以与模板结合,被延伸,然后被相应外部引物的合成所置换。之后,发生置换的DNA通过例如第二链合成成为双链。下一步是将双链分子的一条链切口,这可以通过使用经修饰的核苷酸和限制酶切位点来实现,其中一条链(而非另一条链)上的所述切割位点由于修饰核苷酸而失活。反应中提供了与该位点对应的限制性内切酶,从而生成切口。所得到的切口处的3’OH被DNA聚合酶延伸,将一条链(可以再作为模板:要注意,一些展示的链并非最初是全长,但由于形成切口,内部引物帽的远端缺乏互补。这不会削弱引物结合(该引物的非帽部分具有足以稳定退火的长度)且,通过引物结合,产生5’突出端,使聚合酶能进行填充)置换,重新形成的双链分子再次成为切口反应的底物,然后被延伸和置换,导致扩增发生。过程中不需要进行反复热变性。
一些实施方案中,本发明的方法包括提供GC/AT比率大于1并且总dNTP浓度有助于利用富含GC的模板来合成DNA的dNTPs。参见美国专利申请12/371,306。GC/AT比率可以是大约1.1、1.2、1.4、1.6、2、2.5、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25或更高。GC/AT比率可以在1.1和20、1.1和15、1.1和10、1.1和8、1和15、1.1和7、1.1和6、1.1和5、1.2和25、1.4和25、1.6和25、2和25、3和25、4和25、5和25、2和15、2.5和10,或者4和10之间。总dNTP浓度可以是大约0.4、0.5、0.6、0.7、0.8、0.9、1、1.2、1.5、2或3mM。dNTP浓度可以在0.4和3mM、0.5和3mM、0.6和3mM、0.7和3mM、0.8和3mM、0.9和3mM、1和3mM、0.4和2mM、0.4和1.5mM、0.4和1.2mM、0.4和1mM、0.4和0.9mM、0.4和0.8mM、0.4和0.7mM、0.5和2mM、0.5和1mM,或者0.6和0.9mM之间。“GC/AT比率”意味着给定溶液或混合物中,dCTP、dGTP及其所有核苷酸类似物的总浓度与dATP、dTTP、dUTP及其所有核苷酸类似物的总浓度的比率。“dNTP”代表脱氧核苷三磷酸,是指dATP、dCTP、dGTP、dTTP、dUTP及其类似物。“核苷酸类似物”是包含天然碱基腺嘌呤(A)、胞嘧啶(C)、鸟嘌呤(G)、胸腺嘧啶(T)或尿嘧啶(U)之外的碱基部分、与脱氧核糖相同或类似的糖部分、以及至少一种磷酸或多个磷酸(例如二磷酸或三磷酸)部分的分子或离子。核苷酸类似物是特定核苷酸(特别是dATP、dCTP、dGTP、dTTP或dUTP)的类似物,当它包含结构和构型都适合通过聚合酶引入核酸双螺旋的三磷酸和糖部分,以及这样的碱基时,所述碱基在核酸双螺旋中的碱基配对特性和被DNA聚合酶引入核酸双螺旋的位点与以上列举的5种核苷酸之一非常类似,除了dTTP的类似物通常也是dUTP的类似物,反之亦然。与包括但不限于“核苷”、“碱基”、“核苷碱基”或“残基”等名词关联使用的名词“类似物”应当按照和与“核苷酸”关联时同样方式地解释。
一些实施方案中,可以提供强化剂。强化剂有助于成功进行产生富含GC的产物的反应。PCR反应中通常可以包括多种强化剂来提供产量、特异性和一致性,并且可能是通过降低模板DNA的Tm来实现。强化剂可能通过螺旋去稳定、反应抑制剂中和或其他机理,包括未知机理来发挥作用。强化剂包括,但不限于甜菜碱、甜菜碱类似物、甘油、牛血清白蛋白(BSA)、聚乙二醇、氯化四甲胺、7-脱氧-GTP、中性去污剂、二甲基亚砜(DMSO)、甲醇、乙醇、异丙醇、甲酰胺、丙酮、乙酰胺、N-甲基甲酰胺、N,N-二甲基甲酰胺、丙酮、乙酰甲胺、N-甲基乙酰甲胺、N,N-二甲基乙酰甲胺、2-吡咯烷酮、N-甲基吡咯烷酮、丙酰胺和异丁烯胺。中性去污剂包括,但不限于TWEEN-20、β-辛基-葡萄糖苷、辛基-β-硫-吡喃葡萄糖苷、TritonX-100、TritonX-114、NP-40、Brij-35、Brij-58、Tween-80、PluronicF-68、PluronicF-127、脱氧BigCHAP、CHAPS、CHES、壬基苯氧基聚乙氧乙醇(Tergitol-typeNP-40)和辛基苯氧基聚乙氧乙醇(IgepalCA-630)。甜菜碱类似物包括,但不限于同型丹醇(homodeanol)甜菜碱、丹醇甜菜碱、丙酸甜菜碱、同型甘油甜菜碱、二乙醇同型甜菜碱、三乙醇同型甜菜碱、羟丙基同型甜菜碱、N-甲基-N-(2-羧乙基)吗啉内盐、N-甲基-N-(2-羧乙基)哌啶内盐、N-甲基-N-(2-羧乙基)吡咯内盐、N,N-二甲基-N-(2-羟乙基)-N-(2-磺乙基)铵内盐、N,N-二甲基-N-(2-羟乙基)-N-(3-磺丙基)铵盐、N,N-二羟乙基-N-甲基-N-(3-磺丙基)铵内盐、N,N-二甲基-N-(2-羟乙基)-N-(4-磺丁基)铵内盐、N-甲基-N-(3-磺丙基)吗啉内盐和N-甲基-N-(3-磺丙基)哌啶内盐。
可以提供的甜菜碱、甜菜碱类似物和/或其他强化剂摩尔浓度在0.01和5M、0.01和4M、0.01和3M、0.01和2.5M、0.02和5M、0.03和5M、0.04和5M、0.05和5M、0.07和5M、0.1和5M、0.2和5M、0.3和5M、0.4和5M、0.5和5M、0.7和5M、1和5M、1.5和5M、0.1和4M、0.5和3M、1和2.5M,或者1.5和2.5M之间,例如大约0.01、0.02、0.05、0.1、0.2、0.5、0.75、1、1.25、1.5、1.6、1.7、1.8、1.9、2.0、2.1、2.2、2.3、2.4、2.5、3、3.5、4、4.5或5M。替代地,可以提供的强化剂w/v或v/v百分比浓度在0.1和50%、0.2和50%、0.5和50%、1和50%、2和50%、5和50%、0.1和40%、0.1和30%、0.1和20%、0.5和40%、1和30%或者2和20%之间,例如大约0.1、0.2、0.5、1、2、5、10、15、20、25、30、35、40、45或50%的体积百分比。中性去污剂可以提供体积百分比在0.0001和10%、0.0002和10%、0.0005和10%、0.001和10%、0.002和10%、0.005和10%、0.01和10%、0.02和10%、0.05和10%、0.0001和5%、0.0001和2%、0.0001和1%、0.0005和1%,或者0.001和1%之间,例如大约0.0001、0.0002、0.0003、0.0004、0.0005、0.0006、0.0007、0.0008、0.0009、0.001、0.002、0.003、0.004、0.005、0.006、0.007、0.008、0.009、0.01、0.02、0.03、0.04、0.05、0.06、0.07、0.08、0.09、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、2、3、4、5、6、7、8、9或10%的体积百分比。本领域技术人员能够确认各种强化剂的适宜浓度。
本发明涉及这样的方法,所述方法包括给扩增反应提供缓冲液。所述缓冲液可以包括例如但不限于,三羟甲基氨基甲烷(Tris)、双三羟基甲氨基丙烷(bis-trispropane)、重碳酸盐、磷酸盐、甘氨酸、组氨酸、4-(2-羟乙基)-1-哌嗪乙磺酸(HEPES)、3-(N-吗啉)丙磺酸(MOPS)和各种共轭碱/酸及其盐。
本发明涉及这样的方法,所述方法包括提供至少一种DNA聚合酶由dNTPs以模板依赖性方式合成DNA。DNA聚合酶可以包括野生型、改造过的、嗜热的、嵌合的、工程化的和/或一种以上聚合酶的混合物。DNA聚合酶可以包括ExactPolymerase(5PRIMEGmbH)、AccuSureTMDNAPolymerase(Bioline)、PhusionTMAccuPrimeTMPfx(Invitrogen)、PlatinumTaqDNAPolymeraseHighFidelity(Invitrogen)、PhireTMHotStartDNAPolymerase(NewEnglandBiolabs)、HotStartHigh-FidelityDNAPolymerase(NewEnglandBiolabs)、JumpStartTMREDTaqTMDNAPolymerase(Sigma-Aldrich)、PfuUltraTMHotstartDNAPolymerase(Stratagene)、CxHotstartDNAPolymerase(Stratagene)、PrimeSTARTMHSDNAPolymerase(Takara)、ExtensorHi-FidelityPCREnzyme(ABgene)、ACCUZYMETMDNAPolymerase(Bioline)、SAHARATMDNAPolymerase(Bioline)、VELOCITYDNAPolymerase(Bioline)、AccuPOLTMDNAPolymerase(GeneChoice,Inc.)、UniPOLTMDNAPolymerase(GeneChoice,Inc.)、ElongaseEnzymeMix(Invitrogen)、Pfx50TMDNAPolymerase(Invitrogen)、PhusionDNAPolymerase(NewEnglandBiolabs)、KODHiFiDNAPolymerase(Novagen)、KODXLDNAPolymerase(Novagen)、Expand20kbPLUSThermostableDNApolymerasemixture(RocheAppliedScience)、ExpandHighFidelityPLUSThermostableDNApolymerasemixture(RocheAppliedScience)、ExpandHighFidelityThermostableDNApolymerasemixture(RocheAppliedScience)、ExpandLongTemplateThermostableDNApolymerasemixture(RocheAppliedScience)、Easy-ATMHigh-FidelityPCRCloningEnzyme(Stratagene)、EXLTMDNAPolymerase(Stratagene)、EnhancedDNAPolymerase(Stratagene)、IIFusionDNAPolymerase(Stratagene)、KapaLongRangeTMDNAPolymerase(KapaBiosystems)、KapaHiFiTMDNAPolymerase(KapaBiosystems)、Kapa2GTMRobustDNAPolymerase(KapaBiosystems)、Kapa2GTMRobustHotStartDNAPolymerase(KapaBiosystems)、Kapa2GTMFastDNAPolymerase(KapaBiosystems)、Kapa2GTMFastHotStartDNAPolymerase(KapaBiosystems)、LATAQDNAPolymerase(Takara)、OptimaseDNAPolymerase(Transgenomic,Inc.)、Exo-PfuDNAPolymerase(Stratagene)、HotMasterTaqDNAPolymerase(5PRIMEGmbH)、HotTaqDNAPolymerase(AbnovaCorporation)、AmpliTaqDNAPolymerase(AppliedBiosystems)、BstDNAPolymeraseLgFrag(NewEnglandBiolabs)、MasterAmpTMTflDNAPolymerase(EPICENTREBiotechnologies)、RedHotDNAPolymerase(ABgene)、ThermoprimePlusDNAPolymerase(ABgene)、Taq-redDNAPolymerase(AppliChemGmbH)、BIO-X-ACTTMLongDNAPolymerase(Bioline)、BIO-X-ACTTMShortDNAPolymerase(Bioline)、BiolineHybriPolTMDNAPolymerase(Bioline)、BioThermTaqDNAPolymerase(eEnzymeLLC)、EU-TaqDNAPolymerase(eEnzymeLLC)、SynergyTaqDNAPolymerase(eEnzymeLLC)、RedPOLTMDNAPolymerase(GeneChoice,Inc.)、AccuPrimeTMGC-RichDNAPolymerase(Invitrogen)、3173DNAPolymerase、ExoMinus(Lucigen)、9DegreesNorth(Modified)DNAPolymerase(NewEnglandBiolabs)、TherminatorDNAPolymerase(NewEnglandBiolabs)、PwoDNAPolymerase(RocheAppliedScience)、Paq5000TMDNAPolymerase(Stratagene)、YieldAceTMDNAPolymerase(Stratagene)、e2TAKTMDNAPolymerase(Takara)或来自下述的天然存在的DNA聚合酶:火球菌(P.kodakaraensis)、强烈火球菌(P.furiosus)、热球菌(T.gorgonarius、T.zilligii、T.litoralis“VentTM”)、P.GB-D“DeepVent”、热球菌(T.9N-7、T.aggregans、T.barossii、T.fumicolans、T.celer)、火球菌(Pyrococcussp.ST700株)、太平洋热球菌(T.pacificus)、海底火球菌(P.abysii)、深栖热球菌(T.profundus)、T.siculi、热水热球菌(T.hydrothermalis)、Thermococcussp.GE8株、T.thioreducens)、火球菌(P.horikoshii)或热球菌(T.onnurineusNA1、Thermococcussp.9°N-7、Thermococcussp.GI-J、Thermococcussp.MAR-13、Thermococcussp.GB-C、Thermococcussp.GI-H)、水生栖热菌(Thermusaquaticus)、嗜热栖热菌(Thermusthermophiles)、栖热菌(Thermuscaldophilus)、丝状栖热菌(Thermusfiliformis)、黄栖热菌(Thermusflavus)、海栖热袍菌(Thermotogamaritime)、嗜热脂肪芽孢杆菌(Bacillusstearothermophilus)或热坚芽孢杆菌(Bacilluscaldotenax)。
通过发明获得的数据,例如测试结果,可以用于诊断是否存在某状况或疾病的过程。利用本发明获得的数据可以用于确定某个体的基因型。通过发明获得的数据可以用于检测与脆性X染色体综合征、脆性X染色体相关震颤共济失调、和脆性X染色体相关原发性卵巢功能不全关联的基因型。与这些状况相关的基因座是本领域已知的,包括但不限于FMR1、FMR2、FMR1的5’UTR、FMR2的5’UTR、FMR1的5’UTR内的CGG重复,以及FMR2的5’UTR内的CGG重复。在其他实施方案中,通过发明获得的数据可以用于检测与富含GC三核苷酸重复紊乱和/或中断元件关联的基因型,比如脆性X染色体综合征、脆性X染色体相关震颤共济失调综合征、脆性X染色体相关原发性卵巢功能不全、强直性肌营养不良、亨廷顿舞蹈症、脊延髓肌萎缩、齿状核红核苍白球丘脑下核萎缩和/或脊髓小脑性共济失调。中断元件,正如其名字暗示的,打断一系列的重复序列。CGG富含区可能包含或不包含中断元件。因此,CGG富含区可以包含一系列三核苷酸重复,在这些系列中有至少一种中断元件。与这些状况相关的基因座是本领域已知的,包括但不限于FMR1、FMR2、DMPK、ZNF9、HTT、AR、ATN1、ATXN1-3、ATXN7、ATXN10、CACNA1A、SCA8、PPP2R2B和TBP。参见例如Nat.Genet.13(1):105-8(1996);Nat.Genet.13(1):109-13(1996)。
方法可以包括确定CGG富含区任何一端,例如任何一端的60、90、120、150、180、210、240、270或300bp内是否存在中断元件,所述CGG富含区是样品中含有的至少一种等位基因所包含的。确定样品中含有的至少一种等位基因所包含的CGG富含区任何一端给定距离内是否存在中断元件,应当理解为包括确定整个CGG富含区内是否存在中断元件,从而整个CGG富含区都处于任何一端给定距离内。
一些实施方案中,方法包括不依靠辅助或反射方法对至少一种CGG富含区进行分析,所述辅助或反射方法包括诸如Southern印迹、限制性消化或测序(例如Sanger测序、Maxam-Gilbert测序、连接法测序(ligationsequencing)以及包括可逆中止碱基测序和焦磷酸测序的单分子边合成边测序(又称为第二代测序技术))的程序。但方法可以包括如本文所述确定至少一种CGG富含区的相关信息,比如长度和/或中断元件组成和位置。一些实施方案中,方法包括通过高分辨率技术,由文中所述扩增反应产生的产物大小和丰度来获取确定至少一种CGG富含区相关信息,比如长度和/或中断元件组成或位置的充分必要信息。
关于至少一种CGG富含区中是否存在中断序列或中断序列处于至少一种CGG富含区的何处的信息可能包括的信息有比如样品中的至少一种模板所包含的至少一种CGG富含区是否含有中断序列;在有一个以上不同模板的情况中,样品中的每个模板是否含有中断序列;至少一种CGG富含区中存在的中断序列数目的下界估计;和/或至少一种中断元件的至少一种位置(包括如下文讨论的,确定到给定准确水平)。鉴于本领域普通技术人员的知识,以上列出的具体类型的信息不包括其他类型可以通过本文明确或暗含地公开的发明方法确定的信息。
一些实施方案中,方法包括进行至少两个分析,其中每个分析包括(a)提供引物,其中所述至少两个分析的引物不是相同的;(b)进行扩增反应来产生一组产物;(c)将产物分开,展现所述至少两个分析产生的产物的大小和丰度;以及(d)得出关于所述至少一种CGG富含区中是否存在中断序列,或者中断序列在所述至少一种CGG富含区中处于何处的信息。一些实施方案中,得出的信息包括那些如果只进行一个分析则无法得到的信息,比如在样品包含至少两个不同的含有CGG富含区的模板和CGG富含区中的至少一种存在至少一种中断元件的情况中,至少两个CGG富含区中的哪一个包含至少一种中断元件。例如,图10中显示了根据一个分析的结果,这类信息可能不明确的情形。文中讨论了其他可能的不明确之处,以及如何解决的例子。
在一些实施方案中,至少两个分析包括锚定分析和非锚定分析。在一些实施方案中,所述至少两个分析使用了包含CGG、CCG、GCG、CGC、GCC或GGC重复的反方向引物。就是说,第一分析可以包括提供引物,所述引物含有一个包含重复的朝着上游方向的引物;第二分析可以包括提供引物,所述引物含有一个包含重复的朝着下游方向的引物;或者相反。
在一些实施方案中,方法包括至少三个分析,包括至少两个非锚定分析和至少一种锚定分析,或者反过来。所述至少两个非锚定(或锚定)分析可以如前一段落讨论的,使用包含CGG、CCG、GCG、CGC、GCC或GGC重复的反方向引物。
应当注意一些情况中,“一组产物”可能不包含复数个大的或可检测到的产物,比如在用包含最多一个CGG富含区的样品进行的锚定分析中,而其中CGG富含区含有最多一个中断序列。如果一个分析所用的引物中至少有一个与其他分析所用的引物不同,则方法之间的引物被认为“不相同”;换句话说,一些引物可以是一样的。
方法可以包括通过进行如上所述的至少两个分析,确定杂合、异倍体或镶嵌基因型的至少一种细节,其中扩增反应使用不相同的引物组,所述至少一种细节是通过比较至少两个扩增反应的结果而确定的。
样品的基因型是指样品的来源的基因型;对于混合样品的情况,这个名词涵盖了多个个体基因型。
具有杂合基因型的样品包含来自这样的细胞的遗传物质,所述细胞含有包含CGG富含区的基因座的两个等位基因。
具有镶嵌基因型的样品包含含有CGG富含区的基因座的至少两个等位基因,并且样品所来源的细胞中含有CGG富含区的基因座的等位基因中至少一种是基因不同的。具有镶嵌基因型的样品所包含的至少两个等位基因可以根据它们的丰度划分为主要或次要等位基因。丰度最大的等位基因被认为是主要等位基因,丰度最小的等位基因被认为是次要等位基因;当存在两个以上等位基因时,根据它们的相对丰度(表达为百分比)在算术上是更接近具有最大丰度还是最小丰度的等位基因来分类为主要或次要。例如,在包含相对丰度分别为60%、31%和9%的第一、第二和第三等位基因的样品中,第二等位基因被认为是次要等位基因。主要和次要等位基因的存在也可能是异倍体造成的,例如,如果基因组包含三个拷贝的CGG富含区,其中两个是相同的(主要等位基因),一个不同(次要等位基因)。异倍体在下文有详细讨论。
一些实施方案中,方法包括检测样品是否包含相对丰度至少5%、6%、7%、8%、9%、10%、15%、20%或25%的次要等位基因。应当理解,次要等位基因的CGG富含区与主要等位基因的CGG富含区不同。例如,次要等位基因含有的CGG富含区可能有不同的重复数目和/或不同的AGG元件分布。一些实施方案中,方法包括检测样品是否包含含有中断元件的次要等位基因。一些实施方案中,方法包括以下文讨论的准确程度检测中断元件在次要等位基因中的位置。
具有异倍体基因型的样品包含不是整倍数的含CGG富含区的基因座的多个等位基因。对于配子和已经发生减数***的种系细胞中的常染色体基因座,整倍数是1;除了雄性配子和已经发生减数***的雄性种系细胞中的性染色体基因座,对个体细胞,整倍数可能是0或1,对于群体平均为大约0.5(根据存在的携带X和Y染色体的细胞的数量而有差别)。对于雄性体细胞和还未发生减数***的雄性种系细胞中的X染色体基因座,整倍数也是1。对于体细胞和还未发生减数***的种系细胞中常染色体上的基因座,对于雌性体细胞和还未发生减数***的雌性种系细胞中的X染色体基因座,整倍数是2。样品有可能具有杂合、异倍体和镶嵌这些情况中的一种以上。
镶嵌基因型可能发生在例如来自一些个体的样品中,所述个体包含来源于不同祖细胞(接合子、囊胚细胞、干细胞等)的细胞,或者包含由于体细胞突变(包括重复数目的改变,比如重复延展)而基因不同的细胞。异倍体存在于一些综合征中,例如唐氏、特纳氏和克氏(Klinefelter’s),也可能经由染色体不分离事件体细胞发生;这类事件会产生能够提供异倍体样品的个体,可能也是或者不是杂合体。
可以对样品进行分析来确定有关基因型的至少一种细节,所述样品包含含有CGG富含区的基因座的至少两个不同等位基因(由于该基因座是杂合、异倍体或镶嵌中的至少一种情况)。
所述至少一种细节可以包括所述至少两个不同等位基因中的一个、两个、都没有或者两个以上(如果可行)是否包含至少一种中断元件。
所述至少一种细节可以包括所述至少两个不同等位基因中的至少一种所包含的中断元件的最小数目。例如,可以确定出一个等位基因包含至少一种中断元件。所述至少一种细节可以进一步包括另一个等位基因包含例如至少两个中断元件。
所述至少一种细节可以包括所述至少一种中断元件在一个等位基因上的位置。
一些实施方案中,所述至少一种细节包括由单个分析的结果不能明白地确定的关于杂合、异倍体和/或镶嵌样品的基因型的至少一种细节。以下列举了根据单个分析的结果可能是含糊的细节:
1.单个分析的结果可能表明存在至少一种中断元件,但该结果对于哪个等位基因包含所述至少一种中断元件可能不清楚。
2.单个分析的结果可能表明存在至少两个中断元件,但该结果对于这些中断元件包含在相同等位基因或不同等位基因中可能不清楚。
3.单个分析的结果可能表明存在至少三个中断元件,但该结果对于所述至少三个中断元件在至少两个不同等位基因中是如何分布的可能不清楚。
4.单个分析的结果可能对于第一等位基因的某位点是否存在中断元件不明确,比如被第二等位基因对应的大的峰信号遮盖了产物大小和丰度的表现。
在一些实施方案中,本发明的方法导致合成的产物不含或者没有较大部分的非特异性扩增物质。在一些实施方案中,当模板是以下实施例1-3中描述的样品之一时,方法导致合成的产物不含或者没有较大部分的非特异性扩增物质。在一些实施方案中,本发明的方法导致合成的产物不含或者没有较大部分的超过预期大小的非特异性扩增物质,所述预期大小是通过将CGG富含区长度加上根据第二引物退火位置进行的调整后计算得到的。一些实施方案中,通过对产物大小和含量表现的信号进行光密度测定或整合,确定产物含有低于20%、15%、10%、5%、2%或1%的物质大于前一句中描述的预期大小。在一些实施方案中,所述表现是电泳图。正如本文定义的,当产物如上确定含有低于大约10%的物质超过预期大小时,产物“基本不含”非特异性扩增物质。
发明涉及包括对模板进行分析的方法,所述模板含有富含GC的重复序列,比如例如CGG或CCG三核苷酸。所述分析可以包括实施扩增反应和以高分辨率将产物分开。高分辨率可能是足够将包含例如20与21、或20与22、或20与23、或20与24、或20与25个三核苷酸重复的产物区分开;或者在一些实施方案中,是足够将长度相差1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17或18个核苷酸或碱基对的产物区分开的分辨率。可以应用在本发明的方法中实现这一分离步骤的技术的例子包括,但不限于毛细管电泳和聚丙烯酰胺凝胶电泳(PAGE;一些PAGE实施方案在本领域经常被称为“跑测序胶”),或者“芯片实验室”类型的微流体/电泳***。用于进行毛细电泳的仪器可以从例如AppliedBiosystems(ABI),Beckman,Agilent和Qiagen等供货商购买,合适的仪器包括但不限于ABI310、3100、3130/3130xl或3730/3730xl;BeckmanP/ACEMDQ;Agilent2100Bioanalyzer和QiagenQIAxcel。通过电泳分离产物的过程可能包括使用液体聚合物,例如均由AppliedBiosystems销售的POP-7、POP-6、POP-5或POP-4。在一些实施方案中,产物的分离使用了可以根据大小精确地将含有大约250、300、350、400或更多个三核苷酸重复的产物分开的聚合物,比如例如POP-4。以高分辨率分离产物组可以利用机器实现,例如从包含电压源(例如DC电泳)的机器、包含压力源(例如泵)的机器和包含柱子或毛细管的机器中选择的适合进行化学分离的机器。当然机器可以包含上述组成部分中的一种以上。
以高分辨率分离产物可以产生产物大小和丰度的表现形式。该表现形式可以是本领域技术人员能够肉眼或者借助仪器(比如例如带有合适软件的计算机或光密度计)解释的图像或图形,从而理解反应产物的大小和含量。在一些实施方案中,表现形式是电泳图、照片、图形、曲线或放射自显影图像。这些表现形式可能来源于或者记录自产物或者结合在产物上的染料分子所发射的光子或β颗粒;可以通过例如摄影术或电子学方法对它们进行检测,并处理或显影生成所述表现形式。
本发明涉及的方法包括由产物大小和丰度表现形式获取关于CGG重复数目(即模板中包含多少CGG重复或者总的三核苷酸重复)的信息。这类信息获取可能包括计数表现形式中可观察到的种类的数目从而确定重复数量(从最小产物包含的重复数目开始,可能是例如4或5),或者根据表现形式中观察到的最大产物的位置估计重复数目。
在一些实施方案中,CGG富含区包含于FMR1的5’UTR或FMR2的5’UTR。
在一些实施方案中,方法包括检测CGG富含区中是否存在中断元件。在一些实施方案中,所述中断元件是AGG三核苷酸。检测是否存在这些中断元件可以通过例如确定模板中第一引物结合显著减少的位置;或者通过确定与相邻长度相比,产物的量明显减少的一组长度来实现。例如,如果在含有至少总共14个三核苷酸重复的区域中第10个三核苷酸是AGG,并且使用包含4个CGG重复的引物进行了扩增反应,可以预期相对含有9和14个重复的相邻产物,含有10、11、12和13个CGG重复的产物存在的量明显减少。含量的减少程度可能在25%到95%或更高的范围内,例如减少25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或95%。减少程度通常取决于样品的接合性;例如对于有些样品,可能相应产物的量的减少显示在25%到75%的范围内,所述样品中CGG富含区就包含该CGG富含区的等位基因而言,或者就特定AGG重复而言是来自杂合子。对于另一些样品,可能相应产物的量的减少显示在50%到95%或更高的范围内,所述样品中CGG富含区就包含该CGG富含区的等位基因而言,或者就特定AGG重复而言是来自半合子或纯合子。
在一些实施方案中,方法不需要使用外部标准或校准物,比如例如参照标准或分子量大小标准。之所以可以实现这一独立性是因为在一些实施方案中,可以利用长度相差一个三核苷酸重复的产物所对应的峰来数出最大产物的大小,其中计数可以表明模板中的重复的数量(根据引物所包含的重复数量进行必要调节)。一些实施方案中,产物大小和含量表现形式中的峰之间的间距可以用于通过例如外推来估计最大产物的大小;当对应较大重复数量的峰的分辨率不足以数出所有峰,包括最大产物的峰时,这一点很有用。
在一些实施方案中,方法可以将CGG富含区中的重复数量明确到100、50、20、10、5、4、3、2、1或0个重复以内。对一个量确定到了0个单位以内意味着确定了它的准确数值。在一些实施方案中,方法包括将CGG富含区中的重复数量明确到100、50、20、10、5、4、3、2、1或0个重复以内。例如,方法可以包括确定出CGG富含区中的重复数量含有少于70个CGG重复,明确到5、4、3、2、1或0个重复以内;确定出CGG富含区中的重复数量含有70-120个CGG重复,明确到10、5、4或3个重复以内;或者确定出CGG富含区中的重复数量含有超过120个CGG重复,最多大约200个CGG重复,明确到20、10或5个重复以内。对于更大的CGG重复区很难准确确定因为缺少可靠的已知标准。
在一些实施方案中,方法可以确定出中断元件的位置在60、45、30、15、12、9、6、5、4、3、2、1或0个核苷酸以内。可以将中断元件的位置确定为例如相对CGG富含区任何一端的距离。
一些实施方案中,引物中的至少一种包含放射性或电磁性可检测的部分。放射性可检测的部分包括发射可检测颗粒(比如β或γ颗粒)的放射性同位素,例如14C、3H、32P、33P、35S和125I。电磁学可检测的部分包括与电磁辐射(包括吸收、发射或这两者)以可检测的方式发生相互作用的化学实体,比如发色团和荧光团,例如荧光素、FAM、花青染料、罗丹明染料等。
本发明的其他方面可以部分地由以下描述中给出,和部分地由说明书显而易见,或者经过实践本发明而得知。借助尤其是所附权利要求中指出的元素和各种组合,可以认识并获得本发明的各方面。
附图简述
并入本说明书并构成说明书一部分的附图图解了发明的多个实施方案,与描述部分一起解释了发明的原理。
图1概括了包含AGG三核苷酸的CGG富含模板的扩增。引物序列是
FAM_FX-F 5′-FAM-TCAGGCGCTCAGCTCCGTTTCGGTTTCACTTCCGGT(SEQ ID NO:38)
Tag-(CCG)4 AGCGTCTACTGTCTCGGCACTTGCCCGCCGCCGCCG(SEQ ID NO:39)
显示了包含(CGG)10AGG(CGG)9AGG(CGG)9(SEQIDNO:42)的模板。它代表FMR1的5’UTR中的可能的CGG重复区。引物Tag-(GCC)4可以与重复区内部的多个位点结合;它可以与FAM标记的与CGG重复区上游退火的正向引物(FAM-FX-F)一起扩增复数个PCR产物。最短的CGG扩增子含有4个CGG重复,最长的CGG扩增子包含全长SEQIDNO:40。比全长产物显著长的任何产物被认为是非特异性产物。
图2A和2B显示了5个临床样品(AFM104、AFB107、ABB001、AFB011和AMB12,如图2A中的图线部分和图2B的左上板块所示)和3个Coriell标准(31/46CGG、31/54CGG和30/75CGG,如图2B中除左上的图线部分所示)的PCR结果的电泳图。对于临床样品,在图线部分给出了通过测序确定的CGG富含区的序列。对于Coriell标准,样品中存在的FMR1的两个5’UTR等位基因(如电泳图所示)的CGG重复含量列为“已证实”。选定的峰上标出了其对应的产物包含的CGG三核苷酸的数量。纵坐标轴上的单位代表荧光强度,是任意选择的。横坐标轴上的单位代表估计的核苷酸大小。这些估计的大小是根据CE仪器上扫描次数(与保留时间有关)确定的。
图3A和3B显示了8个Coriell标准的PCR结果的电泳图。每个图中,如果能够分辨,指出了与最大CGG三核苷酸检测数量对应的峰。在三核苷酸数量与Coriell命名不同的情况中或者检测到AGG三核苷酸的情况中,图线区域给出了由电泳图推测的序列。在图3B的右上图中,对应各个产物种类的峰不是全部能够分辨,但最右边峰的位置对应包含估计122个CGG三核苷酸。在底部的两个图中,未检测到较长等位基因的近似全长扩增产物。纵坐标和横坐标标记与图2A相同。
图4代表使用了三个引物的分析法。FMR1R-FAM与CGG重复区的下游退火,并且包含FAM荧光团用于产物的检测。嵌合引物包含CGG重复和5’侧翼,后者与第三引物(该情况中,即FMR1-F)的序列匹配;第三引物如示与原来的模板退火,但也与包含嵌合引物序列的产物退火。提供的嵌合引物浓度较低,这样它会被迅速消耗从而抑制产物大小随着循环的进行而逐步减小。
图5显示了杂合Coriell标准(示于每个图线区域)三引物分析法的PCR结果的电泳图。横坐标和纵坐标轴与图2A标记相同。每个小图中,最高的峰对应样品中存在的两个等位基因中较短的那个,并按照通过本分析确定的CGG重复数量进行了标记。峰数到了第190个峰,该峰如***的放大图所示。
图6显示了5个基因组DNA样品(小图A、B、C、D和E)的PCR结果的电泳图。小图A、B和C来自雄性基因组DNA样品。小图D和E来自雌性基因组DNA样品。选定的峰上标出了其对应的产物包含的CGG三核苷酸的数量。基因组等位基因的预测序列在图线区域列出。纵坐标轴上的单位代表荧光强度,是任意选择的。横坐标轴上的单位代表估计的核苷酸大小。如实施例中所述,用于产生板块A-E的图谱的样品被确定含有序列如下的CGG重复区。小图A:5’-(CGG)10AGG(CGG)9AGG(CGG)9-3’(SEQIDNO:46)。小图B:5’-(CGG)9AGG(CGG)9AGG(CGG)27-3’(SEQIDNO:47)。小图C:5’-(CGG)61-3’(SEQIDNO:48)。小图D:5’-(CGG)20-3’(SEQIDNO:49)和5’-(CGG)10AGG(CGG)9AGG(CGG)10-3’(SEQIDNO:50)。小图E:5’-(CGG)9AGG(CGG)9AGG(CGG)26-3’(SEQIDNO:51)和5’-(CGG)10AGG(CGG)86-3’(SEQIDNO:46)。
图7显示了给不同等位基因的两种不同AGG重复分配方式(左上,5’-(CGG)9AGG(CGG)10-3’(SEQIDNO:53)和5’-(CGG)10AGG(CGG)20-3’(SEQIDNO:54);左下,5’-(CGG)20-3’(SEQIDNO:49)和5’-(CGG)10AGG(CGG)9AGG(CGG)10-3’(SEQIDNO:50))的预测CE电泳图(左上和左下小图)以及两个等位基因的扩增产物的模拟CE电泳图(右下小图)。观察到的CE电泳图显示在右上小图中。
图8代表可以用于本发明方法的8个扩增分析。FMR1_F与CGG重复区上游退火。FMR1_R与CGG重复区下游退火。FMR1_F_FAM和FMR1_R_FAM分别对应相同的两个引物,但包含FAM荧光团用于产物的检测。FMR1_F_(CGG)n是包含CGG重复和与FMR1_F序列匹配的5’侧翼的嵌合引物,其如示与原来的模板退火,还与包含嵌合引物序列的产物退火。提供的嵌合引物浓度较低,这样它被迅速消耗,从而抑制产物大小随着循环的进行而逐步减小。FMR1_R_(CGG)n是包含CGG重复和与FMR1_R序列匹配的5’侧翼的嵌合引物,其如示与原来的模板退火,还与包含嵌合引物序列的产物退火。FMR1_F_(CGG)nA是与FMR1_F_(CGG)n对应的但含有3’端dA的嵌合引物。3’端的dA与一些CGG重复区中存在的AGG序列互补区DNA链上的T退火。FMR1_R_(CCG)nCCT是序列与FMR1_R_(CCG)n相同但还含有3’端dCdCdT的嵌合引物。末端dCdCdT与一些CGG重复区中互补DNA链上存在的AGG序列退火。这些分析使用的引物序列可以是例如:
所示FMR_F和FMR_R序列中分别自CGG重复旁侧的5’和3’区域可以被任何合适的引物序列所代替。
图9概括了按照图8H显示的PCR方案,包含AGG三核苷酸的CGG富含模板的扩增结果。图中顶端和底下的部分代表基因组DNA样品(其实际CE电泳图如图6D所示)中可能存在的两个等位基因。顶端部分概括了两个等位基因的扩增结果,这两个等位基因包括31重复等位基因(在第10个CGG重复后有一个AGG序列,即5’-(CGG)10AGG(CGG)203’(SEQIDNO:54))和20重复等位基因(在第9个CGG重复后有AGG,即(5’-(CGG)9AGG(CGG)10-3’(SEQIDNO:53))。底下的部分概括了两个等位基因的扩增结果,两个等位基因包括20重复等位基因(CGG重复内没有AGG序列,即5’-(CGG)20-3’(SEQIDNO:49))和31重复等位基因(重复位点11和重复位点21分别有一个AGG,即5’-(CGG)10AGG(CGG)9AGG(CGG)10-3’(SEQIDNO:50))。右侧的显示了基因组DNA样品的扩增产物的实际CE电泳图,展示了存在代表图9底端部分中的等位基因构型的扩增产物。
图10显示了等位基因扩增产物的模拟CE电泳图,所述扩增产物是基因组DNA样品(其实际CE电泳图如图6E所示,样品含有具有46和97个CGG重复的等位基因)通过图8B所示的PCR方案会产生的。按照图8B中的PCR方案进行扩增时,两个可能的等位基因构型(左侧小图,5’-(CGG)9AGG(CGG)9AGG(CGG)26-3’(SEQIDNO:51)和5’-(CGG)10AGG(CGG)86-3’(SEQIDNO:52);右侧小图,5’-(CGG)46-3’(SEQIDNO:55)和5’-(CGG)10AGG(CGG)49AGG(CGG)9AGG(CGG)26-3’(SEQIDNO:56))会产生相同的CE电泳图,如图中左下和右下小图以及图6E所示。
图11显示了等位基因扩增产物的模拟CE电泳图,所述扩增产物是基因组DNA样品(其实际CE电泳图如图6E所示,样品含有具有46和97个CGG重复的等位基因)通过图8D所示的PCR方案会产生的。该图模拟了来自两个可能的等位基因构型(左侧小图,5’-(CGG)9AGG(CGG)9AGG(CGG)26-3’(SEQIDNO:51)和5’-(CGG)10AGG(CGG)86-3’(SEQIDNO:52);右侧小图,5’-(CGG)46-3’(SEQIDNO:55)和5’-(CGG)10AGG(CGG)49AGG(CGG)9AGG(CGG)26-3’(SEQIDNO:56)),在通过图8D所示的PCR方案扩增后的扩增产物,所述方案中重复引物(FMR_R_(CCG)n)的方向被反转。两种等位基因情景会产生不同的CE图谱(图11,底部的小图)。
图12显示了来自以上图10和11描述部分描述的相同基因组DNA样品(含有46/97CGG重复等位基因)的等位基因扩增产物的实际CE电泳图。CE电泳图是由样品根据图8B(顶端小图)或图8F(底部小图)中的PCR方案进行扩增产生的。
图13图示了通过图8F所示的PCR方案扩增后,以上图10、11和12描述部分描述的相同基因组DNA样品(含有46/97CGG重复等位基因(5’-(CGG)9AGG(CGG)9AGG(CGG)26-3’(SEQIDNO:51)、5’-(CGG)10AGG(CGG)86-3’(SEQIDNO:52)、5’-(CGG)46-3’(SEQIDNO:55)和5’-(CGG)10AGG(CGG)49AGG(CGG)9AGG(CGG)26-3’(SEQIDNO:56))的预期扩增产物。
图14图示了利用图8H所示PCR方案,基因组DNA(如以上图10-13描述部分描述的,并含有46/97CGG重复等位基因)扩增后的预期扩增产物,所述基因组DNA具有两种不同的等位基因情形(图的顶端部分:5’-(CGG)9AGG(CGG)9AGG(CGG)26-3’(SEQIDNO:51)和5’-(CGG)10AGG(CGG)86-3’(SEQIDNO:52);图的底部:5’-(CGG)46-3’(SEQIDNO:55)和5’-(CGG)10AGG(CGG)49AGG(CGG)9AGG(CGG)26-3’(SEQIDNO:56))。图8H的PCR方法使用了反向定位并锚定的dT引物(FMR1R(CCG)nCCT)(图8H)。该方法应当产生的CE电泳图中的峰是图中顶部所代表的等位基因情形的14、15和24CGG大小等同体,所述情形中46重复等位基因含有两个AGG,97重复等位基因含有一个AGG;或者方法应当产生的CE电泳图中的峰是15、65和75CGG,大小等同图中底部所代表的等位基因情形,所述情形中46重复等位基因不含AGG,97重复等位基因含有全部三个AGG。图中还显示了该基因组DNA样品扩增后的实际CE电泳图(图右上部分)。电泳图与图左上部分显示的等位基因情形一致。
图15描绘了按照图8C所示本发明的分析方法,对基因组DNA样品和混合的基因组DNA样品进行扩增后的CE电泳图。分别对两个不同DNA样品进行分析,两个样品一个含有30CGG重复等位基因(小图A),另一个含有645CGG重复等位基因(小图B)。还分析了来自这两个样品的染色体DNA的人工混合物(小图C)从而显示方法能够在有含AGG三核苷酸***的较短等位基因的情况下,对长CGG重复靠近5’端是否存在AGG三核苷酸进行作图。
图16显示了来自样品20(表4)的染色体DNA经扩增后的CE电泳图。样品含有两个主要等位基因,其中一个是全突变等位基因;以及两个次要等位基因。等位基因构型被认为是源于样品中的多样化细胞群体。小图A,通过图8A所示方案进行PCR扩增后的扩增产物。小图B,通过图8H所示方案进行PCR扩增后的扩增产物。小图C,通过图8D所示方案进行PCR扩增后的扩增产物。除了展示了方法的AGG/CGG作图能力,数据还展示了全小图等位基因中存在AGG三核苷酸。
图17显示了由样品27(图4)经扩增染色体DNA后的CE电泳图。小图A,通过图8A所示的方案进行PCR扩增后的扩增产物。小图B,通过图8H所示的方案进行PCR扩增后的扩增产物。小图C,通过图8C所示的方案进行PCR扩增后的扩增产物。注意,小图C比小图显示的更紧密,因此全长峰应当出现的区域看不到。
图18显示了来自样品6和20(表4)的染色体DNA经扩增后的CE电泳图。小图A和B分别显示来自样品6和20,在通过图8F所示方案进行PCR扩增后的扩增产物。正如实施例中描述的,用于制作小图A和B的图谱的样品被确定出具有镶嵌的CGG重复区,由以下CGG重复序列构成。小图A:5’-(CGG)9AGG(CGG)9AGG(CGG)9-3’(SEQIDNO:57)、5’-(CGG)9AGG(CGG)7AGG(CGG)24-3’(SEQIDNO:58)(次要等位基因)和5’-(CGG)9AGG(CGG)7AGG(CGG)42-3’(SEQIDNO:59)。小图B:5’-(CGG)9AGG(CGG)9AGG(CGG)9-3’(SEQIDNO:57)、5’-(CGG)9AGG(CGG)44-3’(SEQIDNO:60)和5’-(CGG)9AGG(CGG)60-3’(SEQIDNO:61)。
图19代表给FMR1和FMR2基因5’未翻译区内的CGG重复中的AGG三核苷酸作图的流程。分析法A、C、G和F是指图8所示的相应PCR方法。
示范性实施方案列表
1.分析样品中至少一种模板所包含的至少一种CGG富含区的方法,所述方法包括:
(a)提供至少两种不同引物,包括含有CGG、CCG、GCG、CGC、GCC或GGC重复的第一引物;和与CGG富含区之外的位点退火的第二引物;
(b)用所述至少两种不同引物和包含至少一种CGG富含区的至少一种模板进行PCR,其中所述PCR产生一组产物;
(c)利用分辨率高的技术将产物分开,产生产物大小和丰度的表现形式;以及
(d)得出关于所述至少一种CGG富含区中是否存在中断序列,或者中断序列在所述至少一种CGG富含区中处于何处的信息。
2.分析样品中至少一种模板所包含的至少一种CGG富含区的方法,所述方法包括:
(a)提供至少三种不同引物,包括含有CGG、CCG、GCG、CGC、GCC或GGC重复和5’侧翼的第一引物;与CGG富含区之外的位点退火的第二引物;和具有第一引物的5’侧翼所包含的序列的第三引物,其中第一引物提供的浓度低于第三引物;
(b)用所述至少三种不同引物和所述至少一种模板进行PCR,其中所述PCR产生一组产物;
(c)利用分辨率高的技术将产物分开,产生产物大小和丰度的表现形式;以及
(d)由上述表现形式得出关于所述至少一种CGG富含区中是否存在中断序列,或者中断序列在所述至少一种CGG富含区中处于何处的信息。
3.实施方案1或2任一项的方法,包括由所述表现形式得出关于CGG富含区中是否存在中断序列的信息。
4.实施方案1或2中任一项的方法,包括由所述表现形式得出关于中断序列在CGG富含区中处于何处的信息。
5.实施方案1或2中任一项的方法,其中所述中断序列是AGG元件。
6.实施方案1或2中任一项的方法,进一步包括由所述表现形式得出关于CGG重复数目的信息。
7.实施方案6的方法,其中所述关于CGG重复数目的信息决定了CGG富含重复区包含多于还是少于200个CGG重复。
8.实施方案6的方法,其中所述关于CGG重复数目的信息决定了CGG富含区内存在的CGG重复数目。
9.实施方案1或2中任一项的方法,附带的条件是由上述表现形式得出关于所述至少一种CGG富含区中是否存在中断序列,或者中断序列在所述至少一种CGG富含区中处于何处的信息时,没有使用外部标准或校准物。
10.实施方案1或2中任一项的方法,其中所述CGG富含区包含在FMR1的5’UTR中。
11.实施方案1或2中任一项的方法,其中所述CGG富含区包含在FMR2的5’UTR中。
12.实施方案1或2中任一项的方法,其中所述高分辨率技术可以将长度相差3个核苷酸或碱基对的产物区分开。
13.实施方案1或2中任一项的方法,其中所述高分辨率技术是毛细管电泳。
14.实施方案1或2中任一项的方法,其中所述高分辨率技术是聚丙烯酰胺凝胶电泳。
15.实施方案1或2中任一项的方法,其中所述表现形式是电泳图。
16.实施方案1或2中任一项的方法,其中所述表现形式是记录自PCR产物或者结合在产物上的染料分子所发射的光子或β颗粒的图像或图形。
17.实施方案1或2中任一项的方法,其中所述得出关于CGG富含区中是否存在中断序列,或者中断序列在所述CGG富含区中处于何处的信息包括确定第一引物结合显著减少的位置。
18.实施方案1或2中任一项的方法,其中所述得出关于CGG富含区中是否存在中断序列,或者中断序列在所述CGG富含区中处于何处的信息包括确定与相邻长度的产物量相比,产物的量明显减少的一个或多个长度。
19.实施方案1或2中任一项的方法,其中所述得出关于CGG富含区中是否存在中断序列,或者中断序列在所述CGG富含区中处于何处的信息包括确定与相邻长度的产物量相比,产物的量减少至少50%的一个或多个长度。
20.实施方案1或2中任一项的方法,其中所述得出关于CGG富含区中是否存在中断序列,或者中断序列在所述CGG富含区中处于何处的信息包括确定与相邻长度的产物量相比,产物的量减少至少90%的一个或多个长度。
21.实施方案1或2中任一项的方法,其中所述得出关于CGG富含区中是否存在中断序列,或者中断序列在所述CGG富含区中处于何处的信息包括确定与相邻长度的产物量相比,产物的量减少至少25%的一个或多个长度,其中所述CGG富含区就包含该CGG富含区的等位基因而言,是来自杂合子。
22.实施方案1或2中任一项的方法,其中所述第一引物包含4或5个CGG或CCG重复。
23.实施方案1或2中任一项的方法,其中所述第二引物选自SEQIDNOs1-38。
24.实施方案1或2中任一项的方法,其中所述至少一种引物包含放射性或电磁性可检测的部分。
25.实施方案1或2中任一项的方法,其中所述至少一种引物包含荧光团。
26.实施方案1或2中任一项的方法,其中所述方法是锚定的分析法。
27.实施方案26的方法,其中第一引物在CGG、CCG、GCG、CGC、GCC或GGC重复之中或3’端包含选自A、T、AG、CT、AGG和CCT的亚序列。
28.实施方案27的方法,其中第一引物在CGG、CCG、GCG、CGC、GCC或GGC重复的3’端包含A。
29.实施方案27的方法,其中第一引物在CGG、CCG、GCG、CGC、GCC或GGC重复的3’端包含CCT。
30.实施方案26的方法,进一步包括检测所述至少一种CGG富含区所包含的至少一种中断元件。
31.实施方案30的方法,进一步包括确定样品是否包含中断元件位置不同的主要和次要等位基因。
32.实施方案1或2中任一项的方法,其中所述方法是非锚定的分析法。
33.实施方案2的方法,其中提供的所述第一引物和第三引物的浓度使得第三引物的摩尔浓度比第一引物多至少100倍。
34.实施方案2的方法,其中提供的所述第一引物和第三引物的浓度使得第三引物的摩尔浓度比第一引物多至少500倍。
35.实施方案2的方法,其中提供的所述第一引物和第三引物的浓度使得第三引物的摩尔浓度比第一引物多至少900倍。
36.实施方案2的方法,其中所述第二引物与CGG富含区下游退火,所述第三引物与CGG富含区上游退火。
37.实施方案2的方法,其中所述第二引物与CGG富含区上游退火,所述第三引物与CGG富含区下游退火。
38.实施方案1或2中任一项的方法,进一步包括提供至少另外的第一引物和任选另外的第二引物,所述另外的第一引物包含CGG、CCG、GCG、CGC、GCC或GGC重复;与至少另外的第一引物、选自步骤(a)中第二引物和另外的第二引物的引物,以及至少一种模板进行第二PCR,其中第二PCR产生第二组产物;以高分辨率技术将第二组PCR产物分开,产生第二个产物大小和丰度的表现形式;
其中步骤(a)的第一引物对不含有中断元件的CGG富含区内的位点有优先结合活性,而另外的第一引物对含有中断元件的CGG富含区内的位点有优先结合活性。
39.实施方案38的方法,其中所述另外的第一引物在CGG、CCG、GCG、CGC、GCC或GGC重复的3’端包含A。
40.实施方案38的方法,其中所述另外的第一引物在CGG、CCG、GCG、CGC、GCC或GGC重复的3’端包含T。
41.实施方案38的方法,进一步包括确定至少一种CGG富含区的至少一种长度。
42.实施方案41的方法,其中所述样品包含来自对于CGG区倍性至少为2的细胞的遗传物质,并且方法包括确定至少两个CGG富含区的至少两个长度。
43.实施方案41的方法,其中所述样品包含含有CGG富含区的等位基因,所述CGG富含区包含至少100个CGG重复。
44.实施方案38的方法,进一步包括确定样品是否包含中断元件位置不同的主要和次要等位基因。
45.实施方案38的方法,其中所述另外的第一引物相对第一引物取向相反。
46.实施方案45的方法,其中第一引物结合CGG富含区时其3’端朝向下游,另外的第一引物结合CGG富含区时其3’端朝向上游。
47.实施方案46的方法,其中所述方法包括检测至少一种中断元件并确定包含所述至少一种中断元件的CGG富含区的大小。
48.实施方案47的方法,其中样品包含至少第一和第二等位基因,并且第一和第二等位基因包含长度不同的CGG富含区。
49.实施方案38的方法,进一步包括提供至少另外的第三引物和任选另外的第四引物,所述另外的第三引物包含CGG、CCG、GCG、CGC、GCC或GGC重复;与至少另外的第三引物、选自另外的第二引物和另外的第四引物的引物,以及至少一种模板进行第三PCR,其中第三PCR产生第三组产物;以高分辨率技术将第三组PCR产物分开,产生第三个产物大小和丰度的表现形式;
其中另外的第三引物相对步骤(a)的第一引物取向相反,并且与另外的第一引物不同。
50.实施方案49的方法,进一步包括确定样品所包含的至少一种等位基因任意一端150bp内是否存在中断元件。
51.实施方案50的方法,进一步包括确定至少一种等位基因所包含的至少一种中断元件的至少一种位点。
52.实施方案1或2中任一项的方法,进一步包括提供至少另外的第一引物和另外的第二引物,所述另外的第一引物包含CGG、CCG、GCG、CGC、GCC或GGC重复;与至少另外的第一引物和另外的第二引物,以及至少一种模板进行第二PCR,其中第二PCR产生第二组产物;以高分辨率技术将第二组PCR产物分开,产生第二个产物大小和丰度的表现形式;
其中另外的第一引物与步骤(a)的第一引物取向相反。
53.实施方案52的方法,其中第一引物和另外的第一引物中的至少一种对不含中断元件的CGG富含区中的位点有优先结合活性。
54.实施方案53的方法,其中第一引物对不含中断元件的CGG富含区中的位点有优先结合活性,而另外的第一引物对包含中断元件的CGG富含区中的位点有优先结合活性。
55.实施方案54的方法,其中样品包含含有不同长度的CGG富含区的至少两个等位基因,方法进一步包括确定所述至少两个等位基因的长度。
56.实施方案55的方法,进一步包括检测至少一种中断元件和确定包含所述至少一种中断元件的等位基因的长度。
57.分析样品中至少一种模板所包含的至少一种CGG富含区的方法,所述方法包括:
(a)提供至少两种不同引物,其中第一引物含有CGG、CCG、GCG、CGC、GCC或GGC重复;和第二引物与CGG富含区之外的位点退火;
(b)用所述至少两种不同引物和包含CGG富含区的模板进行PCR,其中所述PCR产生一组产物;
(c)利用分辨率高的技术将产物分开,产生产物大小和丰度的表现形式,其中长度相差3个核苷酸的产物能够被分开;以及
(d)由所示表现形式得出关于CGG重复数目的信息。
58.分析样品中至少一种模板所包含的至少一种CGG富含区的方法,所述方法包括:
(a)提供至少三种不同引物,其中第一引物包含CGG、CCG、GCG、CGC、GCC或GGC重复和5’侧翼;第二引物与CGG富含区之外的位点退火;第三引物具有第一引物的5’侧翼所包含的序列,并且第一引物提供的浓度低于第三引物;
(b)用所述至少三种不同引物和包含CGG富含区的模板进行PCR,其中所述PCR产生一组产物;
(c)利用分辨率高的技术将产物分开,产生产物大小和丰度的表现形式,其中长度相差3个核苷酸的产物能够被分开;以及
(d)由上述表现形式得出关于CGG重复数目的信息。
59.实施方案57或58中任一项的方法,其中所述关于CGG重复数目的信息决定了CGG富含重复区包含多于还是少于200个CGG重复。
60.实施方案57或58中任一项的方法,其中所述关于CGG重复数目的信息决定了CGG富含区内存在的CGG重复数目。
61.实施方案57或58中任一项的方法,附带条件是由上述表现形式得出关于CGG重复数目的信息时,没有使用外部标准或校准物。
62.实施方案57或58中任一项的方法,其中所述CGG富含区包含在FMR1的5’UTR中。
63.实施方案57或58中任一项的方法,其中所述CGG富含区包含在FMR2的5’UTR中。
64.实施方案57或58中任一项的方法,其中所述高分辨率技术可以将长度相差3个核苷酸或碱基对的产物区分开。
65.实施方案57或58中任一项的方法,其中所述高分辨率技术是毛细管电泳。
66.实施方案57或58中任一项的方法,其中所述高分辨率技术是聚丙烯酰胺凝胶电泳。
67.实施方案57或58中任一项的方法,其中所述表现形式是电泳图。
68.实施方案57或58中任一项的方法,其中所述表现形式是记录自PCR产物或者结合在产物上的染料分子所发射的光子或β颗粒的图像或图形。
69.实施方案57或58中任一项的方法,其中所述第一引物包含4或5个CGG或CCG重复。
70.实施方案57或58中任一项的方法,其中所述第二引物选自SEQIDNOs1-38。
71.实施方案57或58中任一项的方法,其中至少一种引物含有放射性或电磁性可检测的部分。
72.实施方案57或58中任一项的方法,其中至少一种引物含有荧光团。
73.实施方案58的方法,其中提供的所述第一引物和第三引物的浓度是第三引物的摩尔浓度比第一引物多至少100倍。
74.实施方案58的方法,其中提供的所述第一引物和第三引物的浓度是第三引物的摩尔浓度比第一引物多至少500倍。
75.实施方案58的方法,其中提供的所述第一引物和第三引物的浓度是第三引物的摩尔浓度比第一引物多至少900倍。
76.实施方案58的方法,其中所述第二引物与CGG富含区下游退火,所述第三引物与CGG富含区上游退火。
77.实施方案58的方法,其中所述第二引物与CGG富含区上游退火,所述第三引物与CGG富含区下游退火。
78.包含选自SEQIDNO:44和SEQIDNO:45的序列的寡核苷酸。
实施例
以下详细描述本发明的实施方案,附图中显示了这些实施方案的各方面和结果。为了清楚和连贯性,一些实施例后面提供了几段讨论以及对方法和结果的解释,这些段落之后继续实施例的陈述。
实施例1:通过重复引导PCR(repeat-primedPCR)法和高分辨率毛细管电泳确定正常和低前突变等位基因的FMR1启动子中的CGG重复数量和AGG位点
如下对含有正常到低前突变数CGG重复的8个基因组DNA样品(5个临床样品:AFM104、AFB107、ABB001、AFB011和AMB12;以及3个Coriell标准:31/46CGG、31/54CGG和30/75CGG)进行评价。所用引物为SEQIDNOs:38-39。使用的PCR反应条件基于已发表的试验方案(Salutoetal.,J.Mol.Diagn.7:605-12(2005))并略有改动。15-20ng基因组DNA在反应缓冲液中进行扩增,反应体积15μl,反应缓冲液含有添加2.2M甜菜碱(SigmaCat.No.B0300-1VL)的RocheExpandLongTemplatePCRbuffer2(RocheCat.No.11681834001)、250μM各种dNTP(Roche,GMPGradeCat.No.G04631129103,C04631072103,A04631056103,T04631137103)、引物各1.5μM和1.25U的RocheGMA重组TaqDNA聚合酶(Roche,Cat.No.03734935001)。PCR循环条件是95℃,5分钟;然后10个循环的97℃,35秒-62℃,35秒-68℃,4分钟;然后20个循环的97℃,35秒-62℃,35秒-68℃,4min分钟,每个循环有20秒自动延伸。将1μlPCR产物与2μlROX1007分子量标准(按照DeWoodyetal.,Biotechniques37:348,350,352(2004)制备)在12μlHi-DiTMFormamide(AppliedBiosystems(ABI)partno.4311320)中混合,于95℃热变性2分钟,然后在使用POP7液体聚合物(ABIpartno.4352759)的36cm毛细管长度的ABI3130xl仪器上进行毛细管电泳。得到的电泳图如图2A和2B所示。
电泳图中的峰以4,即可能的最小产物CGG含量开始编号。峰强度从峰n到n+1(例如从峰10到11)有严重减少表明在对应峰n+1的位置有AGG三核苷酸。一个三核苷酸导致四个低强度峰,相信是因为AGG三核苷酸使得涵盖该三核苷酸的所有四个结合位点对含有CGG的引物的亲和力下降(具有SEQIDNO:39的序列的该引物含有4个CGG重复)。三核苷酸的总数目通过计数峰的总数来确定,其中如上所述第一个编号为4。图2A中每个小图右侧的小峰和图2B左上小图中的小峰被认为是引物中只有3个CGG重复与模板发生退火的情况造成的,因此不反映真实的模板长度。通过标准技术将5个临床样品测序,证实了总的重复含量和AGG三核苷酸重复的位置(见表1)。对于所有5个临床样品,通过这里公开的方法获得的结果与通过测序得到的结果一致。
表1
实施例2:用双引物重复-引导PCR法确定来自雌性样品的一些长等位基因中的重复数目和位置时的困难
为了用包含正常到全突变范围的CGG重复的样品评估该方法,检验了另外一组8个样品,即2个全血临床样品(样品IDs00100和00065,对应图3中标有69CGG和87CGG的小图)和6个Coriell细胞系基因组DNA样品(表明56、76、96、118、20/183-193和28/336CGG的Coriell命名)。如实施例1所述进行PCR反应。得到的电泳图如图3A-3B所示。在这些电泳图中,肉眼观察决定最后数的峰。对于所有6个来自雄性的样品(图3A中的所有小图和图3B的两个顶部小图),该分析能够确定AGG三核苷酸的大小(重复数目)和位置(见表2)。重复数目与Coriell命名或通过测序获得的数目在4%以内一致。方法未能检测到雌性样品中较长等位基因中存在的全部重复数目(图3B的底部小图)。
表2
实施例3:利用重复-引导PCR的改良三引物***确定高水平前突变和全突变等位基因中的CGG重复数目和AGG位置
为了增加能够检测的重复数目,如图4所示对程序进行了改进。使用了三个引物。第一引物是3’端含有5个CGG重复并具有SEQIDNO:41的序列的嵌合引物。第二引物相对第一引物是反向引物,该引物具有SEQIDNO:37的序列。第三引物相对嵌合引物是正向的,与嵌合引物序列相同,但没有5个CGG重复。提供的嵌合引物浓度为1.5nM,比第二和第一引物(各1.5μM)低将近1000倍,这样嵌合引物在开始的几个PCR循环中即被耗尽。其他条件如实施例1所述。用图5所示的模板进行这个过程,使得在顶部小图所代表的试验中获得的产物含有大约196-199个重复。这个数值接近,但略高于Coriell命名的183-193CGG重复。在底部小图代表的试验中,电泳图的右边很远处观察到一个峰,根据Coriell命名标记为336CGG重复。表观的重复数目是250-300个重复,但我们不认为这个表观大小是准确的,因为这个产物的大小不在基于POP-7聚合物的CE能够根据大小准确地将含CGG重复的产物区分开的范围内。对于基于POP-7聚合物的CE,含有超过200个CGG重复的产物容易含有人为缩短的表观大小。因此,这一结果表明该峰代表重复数目不小于250的产物。两个小图中,在产物大概的预期位点都观察到了峰,所述产物即具有Coriell命名中列出的较短等位基因所代表的重复数目,这些命名对顶端小图是20,对底部小图是28(该小图中显示的大峰对应重复数目29)。每个小图中,对应较长等位基因(Coriell命名的重复数目183-193和336)的峰比单个含重复数目的产物的峰宽。图5顶部小图中183-193CGG峰的宽度似乎大概5-10个CGG重复或者15-30bp。注意因为含有5个CGG重复的嵌合引物,图5每个电泳图中最左边的峰对应5个CGG。
实施例4:通过重复-引导PCR的改良三引物***确定AGG在雄性等位基因FMR1启动子的CGG重复中的位置
对5个基因组DNA样品进行了评估,所述样品含有的等位基因中CGG重复数目在正常到低前突变范围(30CGG、47CGG、61CGG、20/31CGG和46/97CGG)。为了简便起见,列出的CGG重复数目反映了三核苷酸总数,即CGG三核苷酸数目和中断AGG三核苷酸数目的总和。PCR扩增样品,制备的总反应混合液含有购自AsuragenInc.(Austin,TX,USA)的11.45μlGC-RichAMP缓冲液(AsuragenCat.No.#49387)、1.5μlFAM标记的FMR1引物(AsuragenCat.No.#49386;FMR1_F(SEQ.IDNO:14)、FMR1_R_FAM(含有5’FAM的SEQ.IDNO:37))、0.5μlFMR1_F_(CGG)n(SEQ.IDNO:41)(AsuragenCat.No.#49393)、0.5μl无核酸酶水,和0.05μl产自AsuragenInc.(Austin,TX,USA)的GC-richPolymeraseMix(AsuragenCat.No.#49388)。将PCR总反应混合液在分装到微量滴定板(96-或384-孔板,PhenixResearchProducts,Candler,NC,USA)之前涡旋混匀。FMR_F和FMR_R_FAM的终反应浓度是1.3μM,FMR1_F_(CGG)n的终反应浓度是1.3nM。将基因组DNA样品的小份(通常是20ng/μl的1μl)转移到微量滴定板的每个孔中。用ABgene铝箔纸(ThermoFisherScientific)将微量板密封。封好的微量板被涡旋混匀、离心并转移到热循环仪(PCRSystem9700,AppliedBiosystemsTM,FosterCity,CA,USA)中。样品扩增开始的热变性步骤是95℃,5分钟;然后10个循环的97℃,35秒-62℃,35秒-68℃,4分钟;然后20个循环的97℃,35秒-62℃,35秒和68℃,4分钟,每个循环包括20秒自动延伸。最后的延伸步骤是72℃,10分钟。图4和图8A中用示意图解释了用于分析CGG重复的这个三引物***。
PCR后,样品被保存在-15到-30℃(分析前避免光照)或者立刻用于经毛细管电泳(CE)对扩增产物的分析。为了进行CE,在12μlHi-DiTMFormamide(AppliedBiosystemsTMpartno.4311320)中将PCR严物(1μl)与2μlofROX1007分子量标准(按照DeWoodyetal.,Biotechniques37:348,350,352(2004)制备)混合,于95℃热变性2分钟,然后在使用POP7液体聚合物(AppliedBiosystemsTMpartno.4352759)的毛细管长36cm的AppliedBiosystemsTM3130xl仪器上进行毛细管电泳。得到的电泳图如图6所示。
电泳图中的峰以5开始编号,基于嵌合引物的设计,这是PCR产物的最小可能CGG重复含量。峰强度从峰n到n+1(例如图6小图A中从峰9到峰10)严重减少表明在对应峰n+1的位置有AGG三核苷酸。一个三核苷酸导致五个低强度峰,相信是因为AGG三核苷酸使得涵盖该三核苷酸的所有五个结合位点对含有CGG的引物的亲和力下降(具有SEQIDNO:41的序列的该引物含有5个CGG重复)。CGG/AGG三核苷酸的总数目通过计数峰的总数来确定,其中如上所述第一个编号为5。例如,图6小图A中的电泳图描述了从带有30CGG/AGG重复的正常雄性半合子模板扩增到的产物。在痕量左边有很清楚的三组峰,对应CGG重复引物的产物。最左边的峰对应含有5个CGG的产物,因为嵌合引物由5个互补CGG重复构成。开始的5个峰和下一组最强的5个峰之间的空隙反映了***的AGG序列造成的干扰。这个空隙等同于5个CGG重复,即嵌合引物在查询每个可能的位点进行杂交(而这反过来在引物的每个重复单位被CGG引物重复中的“C”和AGG中断序列的反转链(CCT)中的“T”之间的错配所损害)时的覆盖范围。下一组5个峰反映出当嵌合引物结合到中断AGG序列以外的位点时,信号强度的明显提高。然后又遇到第二个AGG元件,引物延伸越过最后一组CGG序列后,CGG产物信号完全消失。CE数据表明该等位基因中存在30个CGG/AGG重复。电泳图中在重复扩增子后面观察到一个空隙,最右边的峰是对应全长扩增子的非常强的产物条带,是由跨越30CGG/AGG区域的FMR1-F和FMR1R-FAM引物产生的。该CE图谱对应5’-(CGG)10AGG(CGG)9AGG(CGG)9-3’(SEQIDNO:46)序列。
由FMR1等位基因(图6,小图B-E)获得另外四个PCR产物图谱的例子。来自雄性的样品展示在小图B和C中,来自雌性的样品在小图D和E中。每种情况中,将基因特异性峰通过与DNA参照物(即ROX分子量标准)比较来确定大小。这个大小确定与以上描述的无校准物的CGG产物峰计数方法一致。利用这种策略对CGG定量的准确度和Wilsonetal.,(JMolDiagn10:2-12,2008)利用已发表的脆性X染色体共有序列信息得到的结果也有很好的相关性。利用相同的分析策略,解码出样品B和C分别是(CGG)9AGG(CGG)9AGG(CGG)27(SEQIDNO:47)和(CGG)61(SEQIDNO:48)(不含AGG)。
关于对图6D-E中结果的可能解释以及区分它们的反射分析法的讨论
要解释来自雌性基因组DNA样品的结果可能更复杂。例如,图6小图D和E展示的样品结果显露出中等和高强度峰的组合。这种产物模式反映了分别对应一个等位基因的两个CGG重复产物群体的重叠。根据杂合子图谱中两个信号“降落”(即峰信号强度的下降)的位置可以确定AGG位点。与雄性半合子等位基因的图谱的唯一不同是雌性样品中“降落”的信号强度可能永远不会减少到接近基线水平,因为在这些情况中,两个雌性等位基因在相对扩增子3’端的相同位点不含有AGG。对于小图D所示的样品(20/31CGG等位基因),位于峰10和16之间的第一个AGG信号强度“降落”从未减少到基线水平,因为只有一个等位基因在那个位点有AGG三核苷酸,而另一个含有CGG三核苷酸。相反,第二个信号“降落”回到了基线,因为20CGG等位基因在位点20结束,第二个AGG降落与电泳图中的下游CGG峰只属于31CGG等位基因。这里唯一的不确定是两个等位基因中哪个含有第一个信号降落所识别的AGG三核苷酸。基于已知的AGG单倍型的发生率,最可能的情况是很短的等位基因(20CGG)不含AGG,而31CGG等位基因含有两个AGGs(如小图D中的序列所示)。但是单独标准的三引物CGG重复引导方法不能明确地说明哪个等位基因造成了第一个AGG下降。
下一个样品(图6,小图E)的分析更复杂。CE痕量显示出三个明显的AGG下降(未标记的箭头)。采用基于单倍型统计学的最可能情形,CE痕量左侧的两个AGG下降被归给46重复等位基因,第三个AGG下降(最右侧未标记箭头)归给97重复等位基因。这样的结果,等位基因序列将是(CGG)9AGG(CGG)9AGG(CGG)26和(CGG)10AGG(CGG)86。但是,在这个序列中存在两点不确定。第一,信号下降所识别的AGG三核苷酸,在理论上,每个都可以归给两个等位基因中的任一个。如果所有三个AGG三核苷酸都存在于97重复等位基因,46CGG重复等位基因中没有AGG,由电泳图推断的序列将是(CGG)46和(CGG)9AGG(CGG)60AGG(CGG)9AGG(CGG)26。这个序列组合会产生与以上描述的相同的CE图谱。第二,46重复等位基因的全长基因特异峰(靠近CE痕量中间的强度极高的峰)可能与97重复等位基因中的任何AGG下降有重叠并掩盖了它。因此,可能97重复等位基因中还有一个AGG信号下降在CE电泳图上与全长基因特异46等位基因迁移到相同位置。
开发了其他方法来区分实施例4中显示的20/31CGG和46/97CGG等位基因的特定AGG作图可能性(图6,小图D和E)。下文实施例5展示了发明所述方法准确地解决这些不确定的用途。
对于20/31等位基因样品(图6,小图D),图7(左侧小图)中显示了20和31重复等位基因的两种可能的AGG分配。两种情形预计在通过CE分离PCR扩增产物时都得到相同的CE电泳图(图7中进行了模拟,右下小图)。两种可能的等位基因构型的模拟CE图谱(图7,右下小图)与实验CE结果一致(图7,右上小图)。
尽管标准三引物CGG重复引导法(图4,图8A)未能区分两个等位基因的AGG状况,但开发了如图8H所示的反射分析法,它能够区分这两种可能的等位基因情形,如图9所示。利用图8H所示的PCR方法,第一种等位基因情形(即每个等位基因有一个AGG,图9,上)的CE电泳图会产生大小等同14CGG和15CGG的两个相邻峰。第二种等位基因情形(即较短的20重复等位基因缺乏CGG,31重复等位基因含有两个AGG)的CE电泳图(图9,下)会产生大小等同15CGG和25CGG的峰。另一个例子中(图6,小图E),样品含有两个等位基因,分别有46和97CGG重复。正如以上提到的,标准的三引物CGG重复引导法(图4,图8A)不能区分特定等位基因的AGG含量。该样品的等位基因扩增产物的模拟CE电泳图如图10所示。图10的左下和右下小图揭示三引物CGG重复引导的PCR方法不能区分两种可能的等位基因构型。但是,当使用的PCR方法(图8C)中重复引物的方向被反转时(FMR1_R_(CCG)n;SEQIDNO:43),预期两种等位基因情形会产生不同的CE图谱,如图11下方小图所示。
实施例5:用于确定AGG在复杂雌性等位基因FMR1启动子的CGG重复内的位置的PCR方法
对图6D中的20/30CGG样品进行反射分析法,其中使用的PCR和CE条件与以上实施例4描述的相同,只是使用的引物不同。正向引物序列是FMR1_F_FAM(SEQIDNO:14),反向引物是带有3’末端dT的锚定引物(图8H,FMR_R_(CCG)nCCT,其中n=4;SEQIDNO:45)。样品的实际CE图谱含有15和25个CGG峰(图9,CE痕量),证实两个等位基因的序列为(CGG)20(SEQIDNO:49)和(CGG)10AGG(CGG)9AGG(CGG)10(SEQIDNO:50)。
当对图6E中的46/97CGG样品进行双引物重复引导的PCR分析法(如图8B示意的)时,CE图谱中只有三个AGG下降(图12,顶部小图B,未标记的箭头)。这些数据排除了可能是被46重复等位基因的基因特异峰(图6E)重叠覆盖的第4个AGG下降的可能性。并且当进行图8F图示的锚定PCR分析时,在32、42和92CGG重复位点观察到三个明显的CGG等位基因峰(图12,底部小图F)。这个结果清楚地证明了两个等位基因中只存在3个AGG。
讨论
但是,这两种分析方法(图8B、8F)都不能明确地指定每个等位基因中存在的AGG元件数目。图13解释了原因-图8F和图13显示的锚定A引物分析法(FMR1_F_(CGG)nA;SEQIDNO:44)对以下两种等位基因情形会产生相同的CE结果:等位基因情形(1)46重复等位基因有两个AGG,97重复等位基因有一个AGG(图13,顶端的图解);情形(2)46重复等位基因不含AGG,97重复等位基因含有全部三个AGG(图13,底部的图解)。然而,采用CGG引物取向被反转的分析法,每个AGG可以被准确地分配给合适的等位基因。如图14所示,使用反方向锚定dT引物(FMR1_R_(CCG)nCCT;SEQIDNO:45)的PCR分析法(图8H、图14)会产生的CE电泳图或者含有14、24和15CGG峰,是等位基因情形(1)的大小等同体;或者含有15、65和75CGG峰,是等位基因情形(2)的大小等同体。表3列出了两个等位基因中所有可能的AGG分布情况,以及由该锚定dT引导法得到的PCR扩增产物经CE分离后的预期CGG峰大小(图8H)。
表3
实施例6:以相反取向的CGG引物,利用锚定分析法确定AGG的分布
用锚定的dT引物(FMR1_R_(CCG)nCCT;SEQIDNO:45),对图6E中的46/97CGG样品进行图8H所图解的PCR法。得到的CE图谱(图14)证实了46重复CGG等位基因在重复位点10和20有两个AGG;而97CGG重复等位基因在重复位点11有一个AGG(按照文献常规做法,从第一个CGG由5’向3’数)。因此,本发明的作图方法可以用于解决染色体FMR基因中的复杂的CGG/AGG等位基因重复模式。
实施例7:利用反向CGG重复引导的PCR分析法确定正常和全突变等位基因中的CGG重复数量和AGG位点
利用三引物CGG重复引导的PCR分析法(图8A)和锚定dT反向PCR分析法(图8H)分析了29个临床染色体DNA样品中CGG重复数目和AGG三核苷酸的存在性及位置。PCR如实施例4和5所述,除了使用相应合适的引物。结果如表4所示。AGG位点号码遵循文献中的编号传统。NA表示在该等位基因中没有检测到AGG三核苷酸。含有一个以上等位基因的雄性样品(1、4、17、19、25和26)以及含有两个以上等位基因的雌性样品(6和20)相信是来源于样品内的多种细胞群体。
表4
用这两种方法(图8A、8H)进行PCR扩增和CE分析后,明确确定出29个样品中26个的等位基因CGG重复数目和AGG形态。该组中只有5个等位基因未能通过这两种检测形式肯定地确定AGG形态。这些等位基因在表4中标记了“**”(样品6中的42CGG等位基因;样品20中的54CGG、90CGG和>200CGG等位基因;样品27中的>200CGG等位基因)。本发明的其他分析方法(图8)被用于解决这些等位基因的CGG重复数目和AGG形态。
PCR产物的CE分析揭示,两种样品(20和27)在正常等位基因之一中有AGG三核苷酸。例如,在样品20中,AGG三核苷酸存在于29CGG等位基因中的位点10和20。有可能其他等位基因(例如>200CGG)含有处于完全相同的位点(10、20)的AGG三核苷酸不能被CGG重复引导的分析法(图4、8A)检测到,因为离3’端超过100核苷酸远的AGG下降由于峰强度很低会很难被检测到。这种情况中,如果两个等位基因中AGG相对CGG重复区5’端的位置是相同的,锚定dT分析法(图8H)会产生与较短等位基因的一样的峰。样品27存在类似的情况,即30CGG等位基因中鉴定到处于位点11和21的AGG三核苷酸,但不能毫无疑义地确定>200CGG等位基因中的AGG三核苷酸。
为了解决这些问题,设计了另一个反射分析法(图8C)。在用于证明的原理实验中,分析了三种人工基因组DNA模板(CoriellInstituteforMedicalResearch;Camden,NJ,USA),分别含有30CGG重复(NA07174)、645CGG重复(NA04025)和30/645CGG重复(50%NA07174和50%NA04025)。用引物FMR1_F_FAM、FMR1_R_(CCG)5和FMR1_R(SEQIDNOS:14,43,37)反方向进行了CCG重复引导分析法(图8C)。图15小图A显示了由30CGG等位基因(NA07174)产生的CE电泳图。观察到两个AGG三核苷酸,一个在位点10,一个在位点20。图15小图B显示了645CGG等位基因(NA04025)中没有AGG三核苷酸。当含有这两种等位基因的染色体样品被合并用于模拟30/645等位基因雌性样品,观察到两个AGG下降,但信号没有降至基线水平(图15,小图C)。这个结果证实了30CGG等位基因在位点10和20含有两个AGG三核苷酸,而645CGG等位基因在这些位点上不含有任何AGG中断元件。因此,这个PCR分析法能够查询诸如645CGG等位基因的长重复的5’端,从而决定是否存在AGG中断序列。
该检测法被用于分析临床样品20和27,这两个样品有含有>200CGG重复的全突变等位基因(表4)。图16显示了样品20的结果。图16小图A显示了以标准CGG引导法(图8A,重复引物取正向)进行扩增后PCR产物的CE电泳图。在位点10和20(从CGG重复的3’端开始数)观察到两个AGG。根据单倍型的发生率,AGGs通常位于位点10、11、20和21(从CGG重复区的5’端开始数)。参见例如Zhongetal.,Am.J.Hum.Genet.57:351-61(1995);Kunstetal.,Am.J.Hum.Genet.58:513-22(1996);和Eichleretal.,Hum.Mol.Genet.4:2199-208(1995)。因此单倍型发生率提示29CGG等位基因中存在AGG中断序列。图16小图B显示了相同样品用双引物锚定dT分析法(图8H,引物处于反方向)进行扩增后PCR产物的CE电泳图。这些结果证实了有两个AGG三核苷酸位于位点10和20(从CGG重复区5’端开始数)。分析图16小图A和B中的结果揭示29CGG等位基因中有两个AGG三核苷酸,其CGG重复区因此具有序列(CGG)9(AGG)(CGG)9AGG(CGG)9(SEQIDNO:57)。这个样品还有的一个不明确之处是全突变等位基因(>200CGG)可能在从5’端开始的相同位点(10、20)有AGG三核苷酸。如果是这样,这些AGG序列可能不会被反向锚定T分析法检测到并与短的等位基因中的AGG区分开(由于与正向引物的净距离和相应对5’序列元件作图时信号强度的减弱)。因此,图8D所示的PCR检测法,即CGG重复引物处于相反方向的三引物PCR分析法被用于解决这个问题。检测结果(图16小图C)证实了>200CGG等位基因在从CGG重复5’端的位点10处有一个AGG,因为在该位点信号几乎完全降到基线。这样,29CGG等位基因和200CGG等位基因在位点10都有AGG三核苷酸。全突变等位基因(>200CGG)的位点20没有AGG,因为该位点的信号没有降到靠近基线(图16小图C)。
讨论
以上分析展示了全突变等位基因中AGG三核苷酸的存在情况。我们相信这与本领域多名专家坚持的全突变等位基因中没有AGG中断序列的观点相反。此外,本发明的方法和分析法能够检测到靠近CGG重复区5’端的AGG三核苷酸中断元件。
实施例8:样品27的中断元件的作图
图17显示了由样品27(表4)获得的AGG作图结果。图17小图A显示了利用正向的标准CGG引导分析法(图8A)进行扩增后的CE电泳图,电泳图表明存在两个AGG三核苷酸。CGG峰模式揭示两个AGG,一个在位点10,一个在位点20(从CGG重复3’端开始)。基于有关常见单倍型的知识,AGG对CGG重复的干扰特征性地位于从CGG重复5’端开始数的位点10、11、20和/或21,这表明本样品中的30CGG等位基因含有AGG重复。图17小图B给出了反方向双引物锚定dTPCR方法(图8H)的结果。这个分析证实了从CGG重复5’端开始数的位点11和21有两个AGG三核苷酸-(CGG)10AGG(CGG)9AGG(CGG)9(SEQIDNO:46)。该样品还有一个不确定之处是全突变等位基因(>200CGG)可能在和30CGG重复等位基因相同的位点含有AGG三核苷酸。图17小图C给出了反向的三引物CGG-引导PCR分析(图8D)的结果。这项分析证实了>200CGG等位基因在位点11或21都没有AGG,因为这两个位点处的AGG下降没有减少到基线。.
实施例9:利用正向锚定APCR分析确定多成分样品中低丰度等位基因的AGG位点
分析来自表4中一些样品的染色体DNA揭示样品6和20中存在低丰度等位基因。相信它们是来源于这些样品中存在的多种细胞群体的等位基因。本发明的正向锚定dAPCR分析法(图8F)能够足够灵敏地检测这些次要等位基因的序列中的AGG三核苷酸。样品6和20的双引物锚定dA检验结果如图18所示。利用图8F中的PCR方法扩增来自样品6的染色体DNA,随后对PCR产物的CE分析揭示四个主要峰,长度为15、25、48和56CGG重复;和两个次要峰,长度为30和38CGG重复(图18小图A)。这些长度包括引物中的5个CGG重复、AGG中断序列和AGG中断序列与CGG重复区3’端之间的重复数量。四个主要峰证实了两个主要等位基因中的AGG位置(对于29CGG等位基因,是位点10和20;对于60CGG等位基因,是位点10和18,全部是从CGG重复5’端开始)。两个次要峰证实了次要等位基因(42CGG)含有两个AGG,一个在位点10,一个在位点18(从CGG重复的5’端开始)。尽管42CGG和60CGG等位基因在5’端开始的位点10和18都含有AGG三核苷酸,因为锚定dA分析处于正向,锚定dA引物PCR扩增子的大小是由从3’端开始数到任何可能存在的AGG之间的CGG重复数量确定的(例如对于42等位基因,是24;对于60CGG等位基因,是42)。这些PCR产物通过CE被很好地分开(30、38对比48、56重复单位)。
利用图8F所示的PCR方法扩增来自样品20的染色体DNA,随后对PCR产物的CE分析揭示了主要等位基因(根据图16显示的数据指定为29CGG等位基因)的两个主要峰(图18B)。但是,方法还揭示了处于位点50CGG和86CGG的两个次要等位基因峰,这表明两个次要等位基因中有两个AGG,都是在从5’端数的位点10(即如果从3’端数是位点45和81)。
总之,以上描述的四种分析法的合适组合使得能够对表4显示的29个临床样品中的每个等位基因CGG重复区中的AGG三核苷酸中断序列进行作图。
实施例10:流程举例(sampleworkflow)
利用发明所述方法进行AGG作图和CGG计数的流程图的一个例子如图19所示,并且结合了图8所示的分析模式中的一些。这里显示的流程只是一个例子。分析带有的编号是指图8A-H显示的那些。这个流程中使用的一些分析可以用能够达到相同目的的其他分析来代替。
说明书里的实施方案提供了对本发明实施方案的解释,不应当理解为对发明范围的限制。本领域技术人员很容易认识到发明还涵盖许多其他实施方案。本公开文本中引用的所有出版物和专利通过引用全文并入本文。当通过引用并入的材料与本说明书相悖或不一致,说明书即替代这样的材料。文中对任何文献的引用不是承认这些参考文献对本发明是现有技术。
除非另有说明,说明书(包括权利要求)中用于表示成分用量、反应条件等等的所有数字应当理解为在所有情况中带有修饰名词“大约”。相应地,除非另有声明,数字参数是近似值,可能根据本发明所要达到的有益特性而变化。最低限度,不是试图限制等同原则在权利要求范围方面的应用,每个数字参数应当参考有效数字的个数和通常的四舍五入法来解释。
除非另有说明,在一系列成份之前的名词“至少”应当理解为是指系列中的每个成份。本领域技术人员能够认识到,或者只需常规实验就能够确认这里描述的发明特定实施方案的许多等同体。以下权利要求意图涵盖这类等同体。
当权利要求中详细描述包括多个扩增(例如PCR)反应的方法时,应当理解把反应称为“第一”、“第二”等等不是指反应进行的时间顺序,这种权利要求涵盖其中所描述的反应以任何顺序或同时进行的方法,包括例如,在“第一”反应之前、同时或之后进行“第二”反应。

Claims (43)

1.制备组合物的方法,所述组合物由样品中至少一种模板所包含的至少一种CGG富含区的扩增产物组成,所述方法包括:
(a)提供至少两种不同引物,包括含有CGG、CCG、GCG、CGC、GCC或GGC重复的第一引物;和与CGG富含区之外的位点退火的第二引物;和
(b)用所述至少两种不同引物和包含至少一种CGG富含区的至少一种模板进行PCR,其中所述PCR产生一组产物;
其中所述第一引物对于CGG富含区内含有中断序列的至少一个位点有优先结合活性。
2.制备组合物的方法,所述组合物由样品中至少一种模板所包含的至少一种CGG富含区的扩增产物组成,所述方法包括:
(a)提供至少三种不同引物,包括含有CGG、CCG、GCG、CGC、GCC或GGC重复和5’侧翼的第一引物;与CGG富含区之外的位点退火的第二引物;和具有第一引物的5’侧翼所包含的序列的第三引物,其中第一引物提供的浓度低于第三引物;
(b)用所述至少三种不同引物和所述至少一种模板进行PCR,其中所述PCR产生一组产物;
其中所述第一引物对于CGG富含区内含有中断序列的至少一个位点有优先结合活性。
3.权利要求1或2中任一项所述的方法,其中所述中断序列是AGG元件。
4.权利要求1或2中任一项所述的方法,其中所述CGG富含区包含在FMR1的5’UTR中。
5.权利要求1或2中任一项所述的方法,其中所述CGG富含区包含在FMR2的5’UTR中。
6.权利要求1或2中任一项所述的方法,其中所述第一引物包含4或5个CGG或CCG重复。
7.权利要求1或2中任一项所述的方法,其中所述第二引物选自SEQIDNOs1-38。
8.权利要求1或2中任一项所述的方法,其中所述至少一种引物包含放射性或电磁性可检测的部分。
9.权利要求1或2中任一项所述的方法,其中所述至少一种引物包含荧光团。
10.权利要求1或2中任一项所述的方法,其中所述方法是锚定的分析法。
11.权利要求1或2所述的方法,其中第一引物在CGG、CCG、GCG、CGC、GCC或GGC重复之中或3’端包含选自A、T、AG、CT、AGG和CCT的亚序列。
12.权利要求11所述的方法,其中第一引物在CGG、CCG、GCG、CGC、GCC或GGC重复的3’端包含A。
13.权利要求11所述的方法,其中第一引物在CGG、CCG、GCG、CGC、GCC或GGC重复的3’端包含CCT。
14.权利要求2所述的方法,其中提供的所述第一引物和第三引物的浓度使得第三引物的摩尔浓度比第一引物多至少100倍。
15.权利要求2所述的方法,其中提供的所述第一引物和第三引物的浓度使得第三引物的摩尔浓度比第一引物多至少500倍。
16.权利要求2所述的方法,其中提供的所述第一引物和第三引物的浓度使得第三引物的摩尔浓度比第一引物多至少900倍。
17.权利要求2所述的方法,其中所述第二引物与CGG富含区下游退火,所述第三引物与CGG富含区上游退火。
18.权利要求2所述的方法,其中所述第二引物与CGG富含区上游退火,所述第三引物与CGG富含区下游退火。
19.制备组合物的方法,所述组合物由样品中至少一种模板所包含的至少一种CGG富含区的扩增产物组成,所述方法包括:
(a)提供至少两种不同引物,包括含有CGG、CCG、GCG、CGC、GCC或GGC重复的第一引物;和与CGG富含区之外的位点退火的第二引物;和
(b)用所述至少两种不同引物和包含至少一种CGG富含区的至少一种模板进行PCR,其中所述PCR产生一组产物;
(c)提供至少另外的第一引物和任选另外的第二引物,所述另外的第一引物包含CGG、CCG、GCG、CGC、GCC或GGC重复;和
(d)用至少另外的第一引物、选自步骤(a)中第二引物和另外的第二引物的引物,以及至少一种模板进行第二PCR,其中第二PCR产生第二组产物;
其中步骤(a)的第一引物对CGG富含区内不含有中断序列的位点有优先结合活性,而另外的第一引物对CGG富含区内含有中断序列的至少一个位点有优先结合活性。
20.权利要求19所述的方法,其中所述另外的第一引物在CGG、CCG、GCG、CGC、GCC或GGC重复的3’端包含A。
21.权利要求19所述的方法,其中所述另外的第一引物在CGG、CCG、GCG、CGC、GCC或GGC重复的3’端包含CCT。
22.权利要求19所述的方法,其中所述样品包含来自对于CGG区倍性至少为2的细胞的遗传物质。
23.权利要求19所述的方法,其中所述样品包含含有CGG富含区的等位基因,所述CGG富含区包含至少100个CGG重复。
24.权利要求19所述的方法,其中所述另外的第一引物相对第一引物取向相反。
25.权利要求24所述的方法,其中第一引物结合CGG富含区时其3’端朝向下游,另外的第一引物结合CGG富含区时其3’端朝向上游。
26.权利要求19所述的方法,其中样品包含至少第一和第二等位基因,并且第一和第二等位基因包含长度不同的CGG富含区。
27.权利要求19所述的方法,进一步包括提供至少另外的第三引物和任选另外的第四引物,所述另外的第三引物包含CGG、CCG、GCG、CGC、GCC或GGC重复;并用至少另外的第三引物、选自另外的第二引物和另外的第四引物的引物,以及至少一种模板进行第三PCR,其中第三PCR产生第三组产物;
其中另外的第三引物相对步骤(a)的第一引物取向相反,并且与另外的第一引物不同。
28.制备组合物的方法,所述组合物由样品中至少一种模板所包含的至少一种CGG富含区的扩增产物组成,所述方法包括:
(a)提供至少两种不同引物,包括含有CGG、CCG、GCG、CGC、GCC或GGC重复的第一引物;和与CGG富含区之外的位点退火的第二引物;和
(b)用所述至少两种不同引物和包含至少一种CGG富含区的至少一种模板进行PCR,其中所述PCR产生一组产物;和
(c)进一步包括提供至少另外的第一引物和另外的第二引物,所述另外的第一引物包含CGG、CCG、GCG、CGC、GCC或GGC重复;和
(d)用至少另外的第一引物和另外的第二引物,以及至少一种模板进行第二PCR,其中第二PCR产生第二组产物;
其中另外的第一引物与步骤(a)的第一引物取向相反,且
其中所述第一引物对CGG富含区中不含中断序列的位点有优先结合活性,而另外的第一引物对CGG富含区中包含中断序列的至少一个位点有优先结合活性。
29.权利要求28所述的方法,其中样品包含含有不同长度的CGG富含区的至少两个等位基因。
30.制备组合物的方法,所述组合物由样品中至少一种模板所包含的至少一种CGG富含区的扩增产物组成,所述方法包括:
(a)提供至少两种不同引物,其中第一引物含有CGG、CCG、GCG、CGC、GCC或GGC重复;和第二引物与CGG富含区之外的位点退火;和
(b)用所述至少两种不同引物和包含CGG富含区的模板进行PCR,其中所述PCR产生一组产物;
其中所述第一引物对于CGG富含区内含有中断序列的至少一个位点有优先结合活性。
31.制备组合物的方法,所述组合物由样品中至少一种模板所包含的至少一种CGG富含区的扩增产物组成,所述方法包括:
(a)提供三种不同引物,其中第一引物包含CGG、CCG、GCG、CGC、GCC或GGC重复和5’侧翼;第二引物与CGG富含区之外的位点退火;第三引物具有与第一引物的5’侧翼相同的序列,并且第一引物提供的浓度低于第三引物;和
(b)用所述三种不同引物和包含CGG富含区的模板进行PCR,其中所述PCR产生一组产物;
其中所述第一引物对于CGG富含区内的含有中断序列的至少一个位点有优先结合活性。
32.权利要求30或31中任一项所述的方法,其中所述CGG富含区包含在FMR1的5’UTR中。
33.权利要求30或31中任一项所述的方法,其中所述CGG富含区包含在FMR2的5’UTR中。
34.权利要求30或31中任一项所述的方法,其中所述第一引物包含4或5个CGG或CCG重复。
35.权利要求30或31中任一项所述的方法,其中所述第二引物选自SEQIDNOs1-38。
36.权利要求30或31中任一项所述的方法,其中至少一种引物含有荧光团。
37.权利要求31所述的方法,其中提供的所述第一引物和第三引物的浓度是第三引物的摩尔浓度比第一引物多至少100倍。
38.权利要求31所述的方法,其中提供的所述第一引物和第三引物的浓度是第三引物的摩尔浓度比第一引物多至少500倍。
39.权利要求31所述的方法,其中提供的所述第一引物和第三引物的浓度是第三引物的摩尔浓度比第一引物多至少900倍。
40.权利要求31所述的方法,其中所述第二引物与CGG富含区下游退火,所述第三引物与CGG富含区上游退火。
41.权利要求31所述的方法,其中所述第二引物与CGG富含区上游退火,所述第三引物与CGG富含区下游退火。
42.寡核苷酸引物,包含选自SEQIDNO:44和SEQIDNO:45的序列。
43.权利要求1或2的方法,其中所述至少一个模板来自女性。
CN201080032511.1A 2009-03-24 2010-02-16 对fmr1和fmr2基因5’非翻译区进行表征的pcr方法 Active CN102449171B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510735951.8A CN105296474B (zh) 2009-03-24 2010-02-16 对fmr1和fmr2基因5’非翻译区进行表征的pcr方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US16297709P 2009-03-24 2009-03-24
US61/162,977 2009-03-24
PCT/US2010/000426 WO2010110835A1 (en) 2009-03-24 2010-02-16 Pcr methods for characterizing the 5' untranslated region of the fmr1 and fmr2 genes

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201510735951.8A Division CN105296474B (zh) 2009-03-24 2010-02-16 对fmr1和fmr2基因5’非翻译区进行表征的pcr方法

Publications (2)

Publication Number Publication Date
CN102449171A CN102449171A (zh) 2012-05-09
CN102449171B true CN102449171B (zh) 2015-12-02

Family

ID=42313963

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201510735951.8A Active CN105296474B (zh) 2009-03-24 2010-02-16 对fmr1和fmr2基因5’非翻译区进行表征的pcr方法
CN201080032511.1A Active CN102449171B (zh) 2009-03-24 2010-02-16 对fmr1和fmr2基因5’非翻译区进行表征的pcr方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201510735951.8A Active CN105296474B (zh) 2009-03-24 2010-02-16 对fmr1和fmr2基因5’非翻译区进行表征的pcr方法

Country Status (12)

Country Link
US (2) US8679757B2 (zh)
EP (1) EP2411532B1 (zh)
KR (1) KR20110138387A (zh)
CN (2) CN105296474B (zh)
AU (1) AU2010229334B2 (zh)
BR (1) BRPI1013410B1 (zh)
ES (1) ES2629400T3 (zh)
HK (1) HK1220988A1 (zh)
IL (1) IL215296A (zh)
RU (1) RU2011142773A (zh)
WO (1) WO2010110835A1 (zh)
ZA (1) ZA201107298B (zh)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK2203173T3 (en) 2007-10-26 2016-02-29 Academisch Ziekenhuis Leiden Materials and methods for prevention of muscle diseases
EP2119783A1 (en) 2008-05-14 2009-11-18 Prosensa Technologies B.V. Method for efficient exon (44) skipping in Duchenne Muscular Dystrophy and associated means
WO2009144581A1 (en) 2008-05-27 2009-12-03 Dako Denmark A/S Hybridization compositions and methods
EP2401395A1 (en) 2009-02-26 2012-01-04 Dako Denmark A/S Compositions and methods for rna hybridization applications
WO2011046518A1 (en) 2009-10-16 2011-04-21 National University Of Singapore Screening method for trinucleotide repeat sequences
EP2531618B1 (en) 2010-02-05 2016-01-20 Quest Diagnostics Investments Incorporated Method to detect repeat sequence motifs in nucleic acid
WO2012047970A1 (en) * 2010-10-05 2012-04-12 Board Of Trustees Of Michigan State University Regulatory factors controlling oil biosynthesis in microalgae and their use
JP6081366B2 (ja) 2010-10-29 2017-02-15 アスラジェン, インコーポレイテッド リピート配列を分析するためのmPCR法
EP2761028A1 (en) 2011-09-30 2014-08-06 Dako Denmark A/S Hybridization compositions and methods using formamide
EP2768974B1 (en) * 2011-10-21 2017-07-19 Dako Denmark A/S Hybridization compositions and methods
US9371560B2 (en) 2012-07-20 2016-06-21 Asuragen, Inc. Comprehensive FMR1 genotyping
WO2014179596A1 (en) * 2013-05-01 2014-11-06 Advanced Liquid Logic, Inc. Analysis of dna
US10497463B2 (en) 2013-11-13 2019-12-03 Myriad Women's Health, Inc. Automated nucleic acid repeat count calling methods
EP3325654B1 (en) * 2015-07-23 2020-06-10 Asuragen, Inc. Methods, compositions, kits, and uses for analysis of nucleic acids comprising repeating a/t-rich segments
CN108431236B (zh) 2015-11-03 2022-11-15 奥斯瑞根公司 用于重复序列的核酸大小检测的方法
RU2620944C1 (ru) * 2016-12-27 2017-05-30 Федеральное государственное бюджетное научное учреждение "Научный центр неврологии" (ФГБНУ НЦН) Способ выявления экспансии тринуклеотидных CGG-повторов в 5'-нетранслируемой, промоторной области гена FMR1 при заболевании синдрома атаксии/тремора, ассоциированного с ломкой Х-хромосомы (FXTAS)
CN108866176B (zh) * 2017-07-11 2021-09-14 北京阅微基因技术股份有限公司 一种对fmr1基因5’非翻译区cgg单元重复数量的检测体系及检测试剂盒
CN107523621A (zh) * 2017-09-04 2017-12-29 广州市达瑞生物技术股份有限公司 一种用于检测脆性x综合征的引物组及其试剂盒
BR112021016907A2 (pt) * 2019-02-26 2021-11-03 Nogra Pharma Ltd Oligonucleotídeos de interferência com proteína de retardo mental do x frágil e métodos de sua utilização
CN110157782A (zh) * 2019-03-08 2019-08-23 北京华瑞康源生物科技发展有限公司 一种用于快速检测fmr1基因cgg重复序列的引物群及pcr试剂盒
CN110577987B (zh) * 2019-06-24 2023-08-25 厦门百欧迅生物科技有限公司 一种fmr1基因cgg重复序列的检测方法及其应用
CN113215228A (zh) * 2021-02-07 2021-08-06 迈基诺(重庆)基因科技有限责任公司 脆性x综合征fmr1基因检测引物、试剂盒及其应用
WO2023154813A1 (en) * 2022-02-09 2023-08-17 Laboratory Corporation Of America Holdings Methods and systems for detecting methylation of fragile x

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004110246A2 (en) * 2003-05-15 2004-12-23 Illumina, Inc. Methods and compositions for diagnosing conditions associated with specific dna methylation patterns
WO2008011170A2 (en) * 2006-07-19 2008-01-24 Regents Of The University Of California Methods for detecting the presence of expanded cgg repeats in the fmr1 gene 5' untranslated region

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4683202A (en) * 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
WO1992014840A1 (fr) 1991-02-13 1992-09-03 Institut National De La Sante Et De La Recherche Medicale Fragment d'acide nucleique de la region du chromosome x implique dans le syndrome x fragile, sonde nucleotidique et procede pour le diagnostic du retard mental avec x fragile
FR2672618B1 (fr) 1991-02-13 1994-12-02 Centre Nat Rech Scient Fragment d'acide nucleique de la region du chromosome x implique dans le syndrome x fragile, sonde nucleotidique et procede pour le diagnostic du retard mental avec x fragile.
US6200747B1 (en) * 1992-01-28 2001-03-13 North Shore University Hospital Research Corp. Method and kits for detection of fragile X specific, GC-rich DNA sequences
US5648211A (en) 1994-04-18 1997-07-15 Becton, Dickinson And Company Strand displacement amplification using thermophilic enzymes
US5976842A (en) * 1997-10-30 1999-11-02 Clontech Laboratories, Inc. Methods and compositions for use in high fidelity polymerase chain reaction
EP1114184A2 (en) * 1998-09-15 2001-07-11 Yale University Molecular cloning using rolling circle amplification
US6143504A (en) * 1998-10-27 2000-11-07 Arch Development Corporation Methods and compositions for the diagnosis of fragile X syndrome
DE69940623D1 (de) * 1998-11-09 2009-04-30 Eiken Chemical Prozess zur Synthetisierung von Nukleinsäure
US6335165B1 (en) * 1999-01-25 2002-01-01 Gamidagen Ltd. Methods and kits for characterizing GC-rich nucleic acid sequences
US6326173B1 (en) 1999-04-12 2001-12-04 Nanogen/Becton Dickinson Partnership Electronically mediated nucleic acid amplification in NASBA
EP1088891B1 (en) * 1999-09-28 2005-01-12 Roche Diagnostics GmbH Thermostable enzyme promoting the fidelity of thermostable DNA polymerases - for improvement of nucleic acid synthesis and amplification in vitro
US6670124B1 (en) * 1999-12-20 2003-12-30 Stemcyte, Inc. High throughput methods of HLA typing
JP2001269188A (ja) * 2000-03-11 2001-10-02 Roche Diagnostics Gmbh Pcrにおける性能が向上したb型dnaポリメラーゼ変異体
US8163480B2 (en) * 2006-10-05 2012-04-24 Quest Diagnostics Investments Incorporated Nucleic acid size detection method
US8409805B2 (en) * 2009-02-13 2013-04-02 Asuragen, Inc. Method of amplification of GC-rich DNA templates

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004110246A2 (en) * 2003-05-15 2004-12-23 Illumina, Inc. Methods and compositions for diagnosing conditions associated with specific dna methylation patterns
WO2008011170A2 (en) * 2006-07-19 2008-01-24 Regents Of The University Of California Methods for detecting the presence of expanded cgg repeats in the fmr1 gene 5' untranslated region

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
EU048204;P.D.Ladd et al;《GenBank》;20071127;1-2 *
Simplified molecular diagnosis of fragile X syndrome by fluorescent methylation-specific PCR and GeneScan analysis;Youyou Zhou et al;《Clinical Chemistry》;20061231;第52卷(第8期);1492-1500 *

Also Published As

Publication number Publication date
KR20110138387A (ko) 2011-12-27
RU2011142773A (ru) 2013-04-27
AU2010229334A1 (en) 2011-10-20
US9783848B2 (en) 2017-10-10
IL215296A0 (en) 2011-12-29
US8679757B2 (en) 2014-03-25
WO2010110835A1 (en) 2010-09-30
EP2411532B1 (en) 2017-04-05
CN102449171A (zh) 2012-05-09
ES2629400T3 (es) 2017-08-09
EP2411532A1 (en) 2012-02-01
HK1220988A1 (zh) 2017-05-19
IL215296A (en) 2016-08-31
US20140248625A1 (en) 2014-09-04
AU2010229334B2 (en) 2015-08-20
CN105296474B (zh) 2020-05-12
BRPI1013410A2 (pt) 2019-07-02
US20100243451A1 (en) 2010-09-30
BRPI1013410B1 (pt) 2020-10-06
ZA201107298B (en) 2018-11-28
CN105296474A (zh) 2016-02-03

Similar Documents

Publication Publication Date Title
CN102449171B (zh) 对fmr1和fmr2基因5’非翻译区进行表征的pcr方法
CN103328654B (zh) 立足点引物双链体的组合物及其使用方法
US7238476B2 (en) Methods and compositions for genotyping
TW408224B (en) Strand displacement amplification using thermophilic enzymes
JP2853864B2 (ja) ヌクレオチド配列を検出する方法
CN102177250B (zh) 由粗制核酸样品直接扩增的方法
US11499180B2 (en) Primer extension target enrichment and improvements thereto including simultaneous enrichment of DNA and RNA
AU2010213981C1 (en) Method of amplification of GC-rich DNA templates
CN102016074B (zh) 用于dna序型分析试验的物质和方法
ES2530273T3 (es) Amplificación de ácidos nucleicos específica de alelo
CN101506362A (zh) Ugt1a1基因扩增用引物对、含有其的ugt1a1基因扩增用试剂及其用途
CN102277424A (zh) Cyp2c19基因扩增用引物对、含有其的cyp2c19基因扩增用试剂及其用途
US20060094010A1 (en) Methods and compositions for analyzing comprised sample using single nucleotide polymorphism panels
JP2022516307A (ja) 多重コピー数変異検出および対立遺伝子比定量化のための定量的アンプリコン配列決定
CN101501223A (zh) Cyp2c19基因扩增用引物对、含有其的cyp2c19基因扩增用试剂及其用途
US9284603B2 (en) Target sequence amplification method, polymorphism detection method, and reagents for use in the methods
JPWO2003102178A1 (ja) 遺伝子多型のタイピング方法
JP4491276B2 (ja) 標的dna配列において一塩基変異多型の存在を検出する方法及びキット
EP4294941A1 (en) Structure to prevent threading of nucleic acid templates through a nanopore during sequencing
US20230357830A1 (en) Primer extension target enrighment and improvements thereto including simultaneous enrichment of dna and rna
KR20230141826A (ko) 합성 폴리뉴클레오티드 및 대립유전자를 선택적으로 증폭하기 위한 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant