CN105026577A - 通过序列捕获检测基因组重排 - Google Patents

通过序列捕获检测基因组重排 Download PDF

Info

Publication number
CN105026577A
CN105026577A CN201380074301.2A CN201380074301A CN105026577A CN 105026577 A CN105026577 A CN 105026577A CN 201380074301 A CN201380074301 A CN 201380074301A CN 105026577 A CN105026577 A CN 105026577A
Authority
CN
China
Prior art keywords
oligonucleotide
sequence
genome
nucleotide sequence
nucleotide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201380074301.2A
Other languages
English (en)
Other versions
CN105026577B (zh
Inventor
迈克尔·鲁沃洛
艾米丽·马林·勒普鲁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Agilent Technologies Inc
Original Assignee
Agilent Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agilent Technologies Inc filed Critical Agilent Technologies Inc
Publication of CN105026577A publication Critical patent/CN105026577A/zh
Application granted granted Critical
Publication of CN105026577B publication Critical patent/CN105026577B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • C12Q1/683Hybridisation assays for detection of mutation or polymorphism involving restriction enzymes, e.g. restriction fragment length polymorphism [RFLP]

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本文提供样品分析的方法。在一些实施方式中,所述方法包括:使来自检测基因组的片段化基因组DNA与式V1-B-V2的第一寡核苷酸的群体在一种或多种第二寡核苷酸存在时杂交;使产物与连接酶接触以使与V1和V2杂交的所述片段化基因组DNA的末端与所述一种或多种第二寡核苷酸连接;和使用与所述一种或多种第二寡核苷酸所提供的位点杂交的扩增引物,使产物经受聚合酶链式反应条件,其中产物的产生指示:相对于参考基因组,所述检测基因组包含染色体重排。

Description

通过序列捕获检测基因组重排
背景
长期以来,已将染色体重排、缺失和其它畸变与遗传疾病相关。染色体结构异常通常起因于同源重组中的错误。结构异常可出现在配子中并因此将存在于受影响个体的所有细胞中,或者它们可在有丝***期间出现并产生具有一些正常细胞和一些异常细胞的遗传嵌合个体。
持续需要开发用于检测和分析染色体异常的技术方法。
概述
本文提供样品分析的方法,所述方法包括:使来自检测基因组的片段化基因组DNA与式V1-B-V2的第一寡核苷酸的群体在一种或多种第二寡核苷酸存在时杂交;使产物与连接酶接触以使与V1和V2杂交的所述片段化基因组DNA的末端与所述一种或多种第二寡核苷酸连接;和使用与所述一种或多种第二寡核苷酸所提供的位点杂交的扩增引物,使产物经受聚合酶链式反应条件,其中产物的产生指示:相对于参考基因组,所述检测基因组包含染色体重排。
附图简述
本领域技术人员将理解,下述附图仅用于阐释目的。附图不旨在以任何方式限制本教导的范围。
图1示意性阐释了晕环探针的两种类型。
图2示意性阐释了本方法中所使用的第一寡核苷酸的示例性组成。
图3示意性阐释了本方法的一种实施方式。
图4示意性阐释了本方法的一种实施。
图5示意性阐释了本方法的一种实施。
定义
在更详细描述示例性实施方式之前,给出下列定义以阐释和定义说明书中所用术语的含义和范围。
数值范围包括限定该范围的数值。除非另有说明,分别地,核酸是以5’到3’方向从左往右书写,氨基酸序列是以氨基到羧基方向从左往右书写。
除非另外定义,本文所使用的所有技术和科学术语具有本发明所属的领域的普通技术人员通常理解的相同含义。Singleton,等人,DICTIONARYOF MICROBIOLOGY AND MOLECULAR BIOLOGY,第2版,John Wileyand Sons,New York(1994),和Hale&Markham,THE HARPER COLLINSDICTIONARY OF BIOLOGY,Harper Perennial,N.Y.(1991)向技术人员提供了许多本文所用术语的一般含义。尽管如此,为了清楚和容易参考,下文对某些术语进行定义。
必须注意:当在本文和所附权利要求中使用时,除非上下文明确指出相反情况,否则不使用数量词时涵盖复数的指代物。例如,术语“引物”指一个/种或多个/种引物,即单个/种引物和多个/种引物。还应注意:权利要求可撰写成排除任何任选元素。因此,该陈述旨在作为使用与权利要求要素的引述相联系的这些排他性术语如“仅仅”、“仅”等或使用“否定性”限制的在先基础。
术语“核苷酸”旨在包括那些不仅含有已知嘌呤和嘧啶碱基还含有已被修饰的其它杂环碱基的部分(moiety)。这些修饰包括甲基化的嘌呤或嘧啶,酰基化的嘌呤或嘧啶,烷基化的核糖或其它杂环。此外,术语“核苷酸”包括那些包含半抗原或荧光标记以及可以不仅包含常规核糖和脱氧核糖,也可以包含其它糖的部分。经修饰的核苷或核苷酸也包括对糖部分的修饰,例如,其中一个或多个羟基被卤素原子或脂肪族基团取代,官能化为醚、胺等。
术语“核酸”和“多核苷酸”在本文中可以互换使用,其用于描述任意长度的由核苷酸例如脱氧核糖核苷酸或核糖核苷酸构成的聚合物,例如,多于约2个碱基,多于约10个碱基,多于约100个碱基,多于约500个碱基,多于1000个碱基,高达约10000个或更多碱基,并可酶促地或合成地生产(例如,如美国专利号5,948,902和其中所引用的参考文献中所述的PNA),其可以与天然存在的核酸以序列特异性的方式进行杂交,该方式与两种天然存在的核酸杂交类似,例如,能够参与沃森-克里克碱基配对相互作用。天然存在的核苷酸包括鸟嘌呤、胞嘧啶、腺嘌呤、胸腺嘧啶和尿嘧啶(分别为G、C、A、T和U)。DNA和RNA分别具有脱氧核糖和核糖骨架,但PNA的骨架由通过肽键相连的重复N-(2-氨乙基)-甘氨酸单元构成。在PNA中,多种嘌呤和嘧啶碱基通过亚甲基羰基键连接到骨架上。锁核酸(LNA)(通常被称为无法接近的RNA)是经修饰的RNA核苷酸。LNA核苷酸的核糖部分被连接2’氧和4’碳的额外桥修饰。所述桥将核糖“封锁”为3’-内(北(North))构象,这通常发现于A-型双链体(duplex)中。只要期望,可将LNA核苷酸与寡核苷酸中的DNA或RNA残基混合。术语“非结构化核酸”或“UNA”是含有相互之间结合的稳定性较低的非天然核苷酸的核酸。例如,非结构化核酸可含有G’残基和C’残基,其中这些残基对应于G和C的非天然存在形式(即类似物),它们稳定性较低地相互碱基配对,但保留分别与天然存在的C和G残基碱基配对的能力。US20050233340中描述了非结构化核酸,其中关于UNA的公开内容通过引用被并入本文。
本文所使用的术语“寡核苷酸”表示长度为约2-200个核苷酸,直至500个核苷酸的单链核苷酸多聚体。寡核苷酸可以是合成的或者可通过酶法制成,在一些实施方式中,其长度为30-150个核苷酸。寡核苷酸可含有核糖核苷酸单体(即,可以是寡核糖核苷酸)或脱氧核糖核苷酸单体。例如,寡核苷酸的长度可以为10-20、11-30、31-40、41-50、51-60、61-70、71-80、80-100、100-150或150-200个核苷酸。在某些情况下,可如下制得寡核苷酸的群体:利用原位合成方法制造寡核苷酸阵列,以及从基底切割寡核苷酸。所述方法的实例描述于例如Cleary等人(Nature Methods 20041:241-248)和LeProust等人(Nucleic Acids Research 201038:2522-2540)中。
本文所使用的术语“引物”指在纯化的限制消化物中天然存在的或者通过合成产生的寡核苷酸,当被放置在与核酸链互补的引物延伸产物的合成被诱导的条件下时,即存在核苷酸和诱导剂(例如DNA聚合酶)且处于合适的温度和pH时,其能够担当合成起始点。引物可以是单链的或双链的,但必须足够长以在诱导剂存在时启动期望延伸产物的合成。引物的确切长度将取决于许多因素,包括温度、引物来源和方法的使用。例如,对于诊断应用,取决于靶序列的复杂性,寡核苷酸引物典型地含有15-25个或更多核苷酸,尽管它可含有更少核苷酸。本文的引物被选择为与特定靶DNA序列的不同链基本上互补。这意味着:引物必需足够互补以与它们各自的链杂交。因此,引物序列不需要反映模板的确切序列。例如,非互补的核苷酸片段可被连接到引物的5’末端,而引物序列的其余部分与链互补。或者,非互补碱基或更长序列可散布在引物中,条件是:引物序列与链序列足够互补以与其杂交并从而形成合成延伸产物的模板。
术语“杂交”指的是下述过程,其中核酸链在正常杂交条件下与第二互补核酸链退火并形成稳定双链体(同双链体或异双链体),且在相同的正常杂交条件下不与无关的核酸分子形成稳定双链体。在杂交反应中,通过使两条互补的核酸链退火来实现双链体的形成。可通过调节杂交反应发生的杂交条件(通常被称为杂交严格性)使杂交反应高度特异,从而,除非两条核酸链含有基本上或完全互补的一定数目的特定序列核苷酸,否则两条核酸链之间的杂交将不形成稳定双链体,例如在正常严格性条件下保留双链性(double-strandedness)区域的双链体。对于任何给出的杂交反应,“正常杂交或正常严格性条件”易于确定。参见,例如,Ausubel等人,Current Protocols in Molecular Biology,John Wiley&Sons,Inc.,New York,或Sambrook等人,Molecular Cloning:A Laboratory Manual,Cold SpringHarbor Laboratory Press。本文使用的术语“杂交”指的是任何下述过程,通过所述过程核酸链通过碱基配对与互补链结合。
如果核酸与参考核酸序列在中度至高度严格性杂交和洗涤条件下特异性相互杂交,那么认为这两种序列“选择性可杂交”。中度和高度严格性杂交条件是已知的(参见,例如,Ausubel,等人,Short Protocols in MolecularBiology,第3版,Wiley&Sons 1995和Sambrook等人,Molecular Cloning:ALaboratory Manual,第3版,2001Cold Spring Harbor,N.Y.)。高度严格性条件的一个实例包括在约42C下在50%甲酰胺、5X SSC、5X Denhardt氏溶液、0.5%SDS和100μg/mL变性运载体DNA中杂交,随后在室温下在2X SSC和0.5%SDS中洗涤2次并在42℃下在0.1X SSC和0.5%SDS中额外洗涤2次。
本文所使用的术语“双链体(duplex)”或“双链化的(duplexed)”描述了两个碱基配对(即,杂交在一起)的互补多核苷酸。
本文所使用的术语“扩增”指的是合成与模板核酸的一条链或两条链互补的核酸分子的过程。扩增核酸分子典型地包括:使模板核酸变性,使引物与模板核酸在低于引物熔解温度的温度下退火,以及酶促地从引物延伸以产生扩增产物。可进行一次变性、退火和延伸步骤中的每一个。然而,一般进行变性、退火和延伸步骤多次(例如,至少5或10次,多至30或40次或更多次)以使扩增产物的量增加,通常指数倍增加,尽管本发明的方法不需要指数扩增。扩增典型地需要脱氧核糖核苷三磷酸、DNA聚合酶和合适缓冲液和/或有利于聚合酶最佳活性的辅助因子的存在。术语“扩增产物”指的是由本文所定义的扩增过程产生的核酸序列。
本文所使用的术语“Tm”指的是寡核苷酸双链体中一半的双链体保持杂交且一半的双链体解离成单链时的熔解温度。寡核苷酸双链体的Tm可通过实验被测定或使用下式预测:Tm=81.5+16.6(log10[Na+])+0.41(G+C部分)-(60/N),其中N是链长,[Na+]小于1M。参见Sambrook和Russell(2001;Molecular Cloning:A Laboratory Manual,第3版,Cold Spring Harbor Press,Cold Spring Harbor N.Y.,第10章)。存在用于预测寡核苷酸双链体的Tm的其它公式,一个公式可以或多或少地适合于给定的条件或条件集合。
本文所使用的术语“游离于溶液(free in solution)”描述了未与另一分子结合或被其牵制的分子,例如多核苷酸。
本文所使用的术语“连接”指的是酶促催化地结合第一DNA分子5’末端的末端核苷酸与第二DNA分子3’末端的末端核苷酸。
术语“多个/种”、“群体”和“集合”在本文中可互换使用,其指的是包含至少2个/种成员的某物。在某些情况下,多个/种、群体或集合可具有至少10、至少100、至少200、至少10000、至少100000、至少106、至少107、至少108或至少109或更多个/种成员。
如果两种核酸“互补”,那么它们在高度严格性条件下相互杂交。术语“完美互补”被用来描述下述双链体,其中一种核酸的每个碱基与另一种核酸中的互补核苷酸碱基配对。在许多情况下,互补的两种序列具有至少10(例如至少12或15)个互补的核苷酸。
术语“消化”旨在表示下述过程,通过所述过程核酸被限制酶切割。为了消化核酸,使限制酶与含有限制酶的识别位点的核酸在适合限制酶起作用的条件下接触。适合市售限制酶活性的条件是已知的并且购买后随这些酶被提供。
寡核苷酸“结合位点”指的是靶多核苷酸中与寡核苷酸杂交的位点。如果寡核苷酸“提供”引物的结合位点,那么引物可与该寡核苷酸或其互补物杂交。
本文所使用的术语“链”指的是由通过共价键(例如磷酸二酯键)共价连接在一起的核苷酸构成的核酸。
在细胞中,DNA通常以双链形式存在,并因而具有两条互补的核酸链,在本文中被称为“顶”和“底”链。在某些情况下,染色体区域的互补链可被称为“正”链和“负”链、“第一”链和“第二”链、“编码”链和“非编码”链、“Watson”链和“Crick”链或者“正义”链和“反义”链。链被分配成顶链或底链是任意的,并非暗示任何特定的方向、功能或结构。一些示例性的哺乳动物染色体区域(例如BAC、组装体、染色体等)的第一链的核苷酸序列是已知的,并且可在例如NCBI的Genbank数据库中找到。
本文所使用的术语“顶链”指的是核酸的任何一条链,但并非核酸的两条链。当寡核苷酸或引物“仅与顶链”结合或退火时,它仅与一条链结合而不与另一条链结合。本文所使用的术语“底链”指的是与“顶链”互补的链。当寡核苷酸“仅与一条链”结合或退火时,它仅与一条链(例如,第一链或第二链)结合而不与另一条链结合。
本文所使用的术语“变性”指的是通过将核酸双链体放置在合适的变性条件下来使所述双链体的至少部分碱基对分开。变性条件在本领域众所周知。在一种实施方式中,为了使核酸双链体变性,可将该双链体暴露于高于双链体的Tm的温度,从而使该双链体的一条链从另一条链释放。在某些实施方式中,可通过将核酸暴露于至少90℃的温度持续合适量的时间(例如,至少30秒,多达30分钟)来使其变性。在某些实施方式中,可使用完全变性条件来完全分开双链体的碱基对。在另一些实施方式中,可使用部分变性条件(例如,利用低于完全变性条件的温度)来分开双链体某些部分的碱基对(例如,富含A-T碱基对的区域可分开,而富含G-C碱基对的区域可保持配对)。核酸还可被化学变性(例如,使用尿素或NaOH)。
本文所使用的术语“延伸”指的是通过使用聚合酶添加核苷酸来延伸引物。如果与核酸退火的引物被延伸,那么所述核酸担当延伸反应的模板。
本文所使用的术语“环化”指的是连接一个或多个线性分子以产生无游离的3’或5’末端的闭环形式的链。
本文所使用的术语“特有(unique)序列”指的是这样的核苷酸序列,它们彼此或与它们的互补物不同。例如,第一特有序列具有不同于第二特有序列或其互补物的核苷酸序列。除非另有说明,在样品中,特有序列仅存在于一种多核苷酸中。
在不相互杂交的核酸的语境中,本文所使用的术语“不相互杂交”指的是这样的序列,其已被设计以使它们在严格条件下不相互退火。这类序列的例子在例如US20070259357和Brenner等人(Proc.Natl.Acad.Sci.199289:5381-3)中所述的某些出版物中被称为“序列记号”,上述通过引用被并入本文。
在彼此紧邻的两核苷酸的语境中,术语“紧邻”表示:所述两核苷酸之间没有***的核苷酸。可使彼此紧邻的核苷酸彼此相连。
在多核苷酸或多肽的语境中,术语“彼此相似”表示彼此至少70%相同、至少80%相同、至少90%相同或至少95%相同的序列。
术语“单链”指的是以单链形式而非双链形式存在于组合物中的核酸链。在某些情况下,单链多核苷酸可在不存在任何互补多核苷酸时存在于组合物中。在另一些情况下,例如,在双链核酸已变性但未复性的情况下,单链多核苷酸可存在于还包含互补多核苷酸的组合物中。然而,在这些情况下,多核苷酸相互之间不碱基配对。
在相同的两种或多种序列的语境中,术语“相同”指的是具有相同核苷酸序列的两种或多种核酸。换言之,如果群体的所有多核苷酸具有相同的序列,则群体的所有多核苷酸分子具有相同的核苷酸序列。
术语“接触”表示放在一起。因此,当将第一物品与第二物品放在一起时,例如通过使它们相互触及或使它们在相同溶液中组合,这两个物品接触。因此,“接触的样品”是寡核苷酸探针已与其杂交的检测染色体。
本文所使用的术语“基因分型”指的是任何类型的核酸序列分析,其包括测序、多态性(例如,SNP)分析和鉴定重排的分析。
本文所使用的术语“测序”指的是下述方法,通过所述方法获得多核苷酸的至少10个连续核苷酸的鉴定(例如至少20个、至少50个、至少100个或至少200个或更多连续核苷酸的鉴定)。
术语“下一代测序”指的是Illumina、Life Technologies和Roche等目前采用的所谓并行化的边合成边测序或边连接边测序平台。下一代测序方法还可包括纳米孔测序方法或基于电子检测的方法例如被Life Technologies商业化的离子激流(Ion Torrent)技术。
本文所使用的术语“条码序列”或“分子条码”指的是特有的核苷酸序列,其被用来:a)鉴定和/或追踪反应中多核苷酸的来源,和/或b)计算初始分子被测序多少次(例如,在基本样品中的每个分子被不同序列标签化,然后扩增该样品的情况下)。条码序列可位于寡核苷酸的5’末端、3’末端或中间。条码序列的尺寸和组成可广泛变化;下列参考文献提供了选择适合特定实施方式的条码序列集合的指导:Brenner,美国专利号5,635,400;Brenner等人,Proc.Natl.Acad.Sci.,97:1665-1670(2000);Shoemake等人,Nature Genetics,14:450-456(1996);Morris等人,欧洲专利公开0799897A1;Wallace,美国专利号5,981,179;等等。在一个具体实施方式中,条码序列的长度可在4-36个核苷酸,或6-30个核苷酸,或8-20个核苷酸的范围内。
本文所使用的术语“PCR试剂”指的是在模板上进行聚合酶链式反应(PCR)所需的所有试剂。如本领域所知,PCR试剂基本上包括第一引物、第二引物、热稳定性聚合酶和核苷酸。取决于使用的聚合酶,离子(例如,Mg2+)也可存在。PCR试剂可任选地含有模板,靶标序列可从所述模板扩增。
在可变的两种或多种核酸序列的语境中,术语“可变的”指的是相对于彼此具有不同核苷酸序列的两种或多种核酸。换言之,如果群体的多核苷酸具有可变的序列,则群体的多核苷酸分子的核苷酸序列随分子而异。术语“可变的”不应被解读为需要群体中的每个分子具有不同于的群体中其它分子的序列。术语“可变的”表示:序列在群体的不同分子之间不同,且可以存在任何特定序列的重复。
本文所使用的术语“参考基因组”指的是可将获自检测基因组的结果与其比较的基因组。在某些情况下,所研究的区域可以是参考基因中的已知核苷酸序列,例如,序列可已被储存在例如NCBI的Genbank数据库或其它数据库中。在许多实施方式中,检测基因组和参考基因组是来自相同(例如,哺乳动物)物种的基因组。
本文所使用的术语“染色体重排”指的是这样的事件,其中染色体的一部分或更多部分在单个染色体之内或在染色体之间重排。在某些情况下,染色体重排可反映染色体结构的异常。染色体重排可以是例如,倒位、缺失、***或易位。
在染色体重排的语境中,术语“断点”指的是通过染色体重排产生的结点。例如,如果1号染色体和2号染色体之间存在重排,则通过重排的染色体中来自1号染色体的序列和来自2号染色体的序列的结点来定义重排的断点。
以下说明解释了本公开中所使用的式。本文所述的某些多核苷酸可通过式(例如,“V1-B-V2”)来指代。所述式遵循已建立的规范:即它们描述了以5’到3’方向定向的多核苷酸。式的组分(例如,“V1”、“B”和“V2’”)指的是多核苷酸内可单独限定的核苷酸序列,其中所述序列共价连接在一起以使得由式描述的多核苷酸是单个分子。在单个分子中,式的组分可彼此紧邻或彼此隔开。按照惯例,利用上撇号(’)来表示式中所显示组分的互补物,因此序列“B”的互补物为“B’”。此外,除非另有说明(例如,如果式之前是“5’-”(例如在“5’-V1-B-V2”的情况下)或如果式之后是“3’-”(例如在“V1-B-V2-3’”的情况下)),由式限定的多核苷酸可在其3’末端、其5’末端或3’和5’两末端具有额外序列。在式的语境中,术语核酸序列指的是式的组分的核苷酸序列。例如,短语“核酸序列B”指的是组分B的核苷酸序列。
其它的术语定义可出现在说明书全文中。
示例性实施方式说明
在描述多种实施方式之前,应该理解:本公开的教导不限于所述特定实施方式,并因而当然可以变化。还应该理解:本文中所用术语仅为了描述具体实施方式,并没有意图是限制性的,因为本教导的范围将仅由所附的权利要求限定。
本文所使用的节标题仅为了组织目的,其不应以任何方式被解释为限制被描述的主题。虽然结合多种实施方式描述本教导,但这并不意味着本教导限于这些实施方式。相反地,本教导包含本领域技术人员理解的各种替代选择、改变和等价物。
除非另外定义,本发明使用的所有技术和科学术语具有与本公开所属的技术领域的普通技术人员通常理解的相同含义。尽管与本文描述的那些方法和材料相似或等同的任何方法和材料也能够用于本教导的实践或检测,但现在描述一些示例性的方法和材料。
对任何出版物的引用是其在申请日前的公开,并不应当解释为承认本权利要求无权凭借着在先发明早于这种公开。此外,所提供的出版物的日期可不同于实际公开日期,其可独立确认。
正如本领域技术人员在阅读该公开后显而易见的,本文描述的和示例的每个单独的实施方案有分离的组成和特征,其可以容易地与任何其它几种实施方案的特征分开或组合而不脱离本教导的范围或精神。任何记载的方法可以以记载的事件顺序进行或逻辑上可行的任何其它顺序进行。
本文引用的所有专利和出版物,包括这些专利和出版物中公开的所有序列,通过引用被清楚并入本文。
方法
本文所述方法的某些实施方式使用“晕环探针”,其中,在本公开的语境中,这样的探针由式V1-B-V2的寡核苷酸和与区域B杂交的一种或多种第二寡核苷酸构成。为了参考目的,图1中显示了晕环探针的两种实施方式:2和16。如图1所示,晕环探针的两种实施方式2和16均包含:第一寡核苷酸4,其包含与片段靶DNA中的不同区域杂交的侧翼序列8和10,以及中心序列12。侧翼序列8对应于在本文中被称为“V1”的区域,侧翼序列10对应于在本文中被称为“V2”的区域,中心序列12对应于在本文中被称为“B”的区域。如所示,晕环探针还包含与第一寡核苷酸的中心序列12互补的一种或多种第二寡核苷酸。在本公开的语境中,这些寡核苷酸将被称为与核酸序列B杂交的一种或多种第二寡核苷酸。在实施方式2(显示于图A)中,所述一种或多种第二寡核苷酸可以是单个寡核苷酸14。在实施方式16(显示于图B)中,所述一种或多种第二寡核苷酸可以是两种寡核苷酸14a和14b,其中每种各含有与所述第一寡核苷酸杂交的区域、和不与所述第一寡核苷酸杂交的尾。在某些实施方式中,一种或多种第二寡核苷酸可提供扩增和/或测序引物结合位点和任选的分子条码序列。如果使用晕环探针16,则这些序列可存在于寡核苷酸14a和14b的尾中。图1中所示的任何一种晕环探针均可用于下文所述方法中。仅仅为了方便解释所述方法,图中示意了利用图1的图A所示的晕环探针的第一实施方式的方法。可容易地针对图1的图B所示的晕环探针调整这些方法。
晕环探针各个区域的长度可变化很大,这取决于期望的应用以及所述一种或多种第二寡核苷酸携带的载量(freight)多少(即,多少个引物结合位点、条码等)。在某些实施方式中,晕环探针双链区域的长度可为20-100个碱基对(例如30bp-60bp),且侧翼区域8和10(其与基因组中的靶序列特异性杂交)的序列长度可为10-100个碱基(例如12-50个碱基)。应该显而易见的是,晕环探针双链区域的核苷酸序列应被设计以使它不与所研究的基因组杂交。
所述方法的一种实施方式使用式V1-B-V2的单链寡核苷酸的群体和一种或多种第二寡核苷酸,其中(i)每种第一寡核苷酸的核酸序列B是相同的;(ii)核酸序列V1是可变的;(iii)核酸序列V2是可变的;(iv)在每种第一寡核苷酸内,V1和V2序列与参考基因组中相距至少10kb的特有位点杂交;且(v)所述一种或多种第二寡核苷酸与核酸序列B杂交。B不与参考基因组杂交。图2阐释了含有3种示例性第一寡核苷酸4a、4b和4c的群体。如图2中所示,每种第一寡核苷酸的核酸序列B是相同的且与一种或多种第二寡核苷酸杂交(未示出)。V1和V2的序列彼此独立地变化。在所显示的分子中,第一寡核苷酸4a、4b和4c的的5’末端分别具有不同的序列V1a、V1b和V1c,且第一寡核苷酸4a、4b和4c的的3’末端分别具有不同的序列V2a、V2b和V2c。与图1一致,所述方法中使用的一种或多种第二寡核苷酸可以是:a)与第一寡核苷酸的核酸序列B杂交的单一寡核苷酸;或两种寡核苷酸,其中每种各包含与第一寡核苷酸的核酸序列B杂交的第一区域和提供扩增引物结合位点的第二区域。
例如,在分子4a中,序列V1a和V2a与参考基因组中彼此相距至少10kb的位点结合;在分子4b中,序列V1b和V2b与参考基因组中彼此相距至少10kb的位点结合;且在分子4c中,序列V1c和V2c与参考基因组中彼此相距至少10kb的位点结合。在每种分子内,V1和V2与参考基因组中相隔一定距离的位点杂交,所述距离使得很难或不可能通过聚合酶链式反应常规获得产物。在某些情况下,与V1和V2杂交的位点在参考基因组中相距至少10kb,但在某些实施方式中,该距离可较短,例如,至少2kb或至少5kb。在某些情况下,在每种第一寡核苷酸内,与V1和V2杂交的序列在参考染色体中相距至少20kb、至少50kb、至少100kb或至少500kb。在特定实施方式中,与V1和V2杂交的序列可在参考基因组中不同的染色体臂上。特别地,在任何一种第一寡核苷酸分子中,V1和V2序列可分别与相同染色体的长臂和短臂杂交,或者相反。在另一些实施方式中,在任何一种第一寡核苷酸分子中,V1和V2序列可与不同染色体杂交(例如,V1序列可与1号染色体杂交且V2序列可与2号染色体杂交)。在某些情况下,第一寡核苷酸的群体可被设计以使得群体的V1序列与这样的位点杂交,所述位点全部在参考基因组的第一区域中的一条链中(例如,在贯穿50kb或100kb的区域分布(例如平铺(tiled))的位点);且群体的V2序列与这样的位点杂交,所述位点全部在参考基因组的第二区域中的一条链中(例如,在贯穿50kb或100kb的区域分布(例如平铺)的位点),其中所述第一和第二区域已知在其它基因组中相互重排。
在这些实施方式中,第一寡核苷酸的V1和V2序列可被设计以使得它们与重排基因组中的相同链杂交。最终,V1和V2序列可被设计以使得它们紧邻参考基因组中的限制位点杂交。在这些实施方式中,通过用限制酶消化基因组而产生的片段、第一寡核苷酸和第二寡核苷酸杂交产生这样的复合体,其中,至少一种第二寡核苷酸的至少一端与所述片段的一端可连接性邻近,如US7883849和Dahl等人(Nucl.Acids.Res.200533:e71)所述,其通过引用被并入本文。序列V1、B和V2各自的长度为至少15个核苷酸。在一些实施方式中,序列V1、B和V2的长度可独立地为至少18个核苷酸、至少20个核苷酸、至少25个核苷酸、至少30个核苷酸、直至50个核苷酸或更多。
第一寡核苷酸群体的大小可变化很大,这取决于如何实施方法。在一些实施方式中,所述群体可含有至少10个、至少50个、至少100个、至少200个、至少500个或至少1000个以及多达10000个或更多个第一寡核苷酸。此外,可使用多个不同的第一寡核苷酸群体来实施所述方法。例如,如果第一寡核苷酸的第一群体被设计为与参照基因组中已知在其它基因组中相互重排的区域杂交,那么可使用被设计为与参照基因组中已知在其它基因组中相互重排的不同区域杂交的第一寡核苷酸的第二群体来完成所述方法。方法可使用至少1种、至少2种、至少5种、至少10种或至少100种或更多种不同的第一寡核苷酸群体来完成。
如图3中所示,所述方法的某些实施方式可包括:(a)使来自检测基因组的片段化基因组DNA 20与第一寡核苷酸22的群体在一种或多种第二寡核苷酸24存在时杂交以产生杂交产物26。如所示,杂交产物包含一些复合体,例如,28、30和32。如所示,许多第一寡核苷酸(例如,复合体28和30中的那些)与两种不同的基因组片段杂交,这会被预计是因为:在每种第一寡核苷酸分子内,V1和V2序列与基因组中相距至少10kb的位点杂交。在某些情况下,相对于参考基因组,检测基因组可具有如下染色体重排:其将V1-互补序列有效移动至与V2-互补序列相同的链上接近V2-互补序列的位点。在这些情况下,如果第一寡核苷酸包含与通过重排移至接近的序列互补的V1和V2序列,那么产生复合体32,其包含与第一寡核苷酸的两端杂交的单个基因组片段。如上所述,在某些实施方式中,第一寡核苷酸被设计以使V1和V2序列紧邻参考基因组中限制酶的切割位点。在这些实施方式中,复合体32中片段的末端可与该复合体的第二寡核苷酸的末端可连接性邻近。在另一些实施方式中,可使用例如核酸外切酶和/或瓣状核酸内切酶来削减(trimmed back)片段的末端以提供这样的复合体,其中片段的末端与复合体中第二寡核苷酸的末端可连接性邻近。
杂交之后,使杂交产物26与连接酶接触以使片段化基因组DNA的末端与一种或多种第二寡核苷酸连接从而产生连接产物34。如所示,在含有与第一寡核苷酸的两端杂交的单个片段的复合体中,片段的两端与一种或多种第二寡核苷酸连接。在所显示的实施方式(其应用图1的图A中所示晕环探针)中,连接产生环状核酸分子36。在应用图1的图B中所示晕环探针的实施方式中,基因组片段与两种不同的寡核苷酸(例如,14a和14b,如图1的图B中所示)连接,这有效地将衔接子(adaptor)添加到基因组片段的两端。
连接之后,使用与一种或多种第二寡核苷酸所提供的位点杂交的扩增引物,使连接产物34经受聚合酶链式反应条件,其中如上所述,如果寡核苷酸提供引物结合位点,那么引物可与该寡核苷酸或其互补物杂交。图3中使用箭头来指示示例性的扩增引物的位点。等价结合位点可由图1的图B中所示替代性第二寡核苷酸来提供。通过扩增步骤产生产物28指示:相对于参考基因组,检测基因组包含染色体重排。如果不存在将V1-互补序列移至与V2-互补序列相同的链上接近V2-互补序列的位点的重排,则将不会得到扩增产物。
在某些实施方式中,所述方法还可包括对扩增产物38进行测序。所述测序可使用与一种或多种第二寡核苷酸的互补链杂交的引物来完成。可分析该方法以鉴定染色体重排的断点。
将显而易见的是,在某些实施方式中,通过一种或多种第二寡核苷酸所添加的序列可含有适合用于下一代测序平台的序列,所述测序平台例如,Illumina的可逆性终止法、Roche的焦磷酸测序法(454)、Life Technologies的连接测序法(SOLiD平台)或Life Technologies的离子激流平台。下列参考文献中描述了这种方法的实例:Margulies等人(Nature 2005437:376-80);Ronaghi等人(Analytical Biochemistry 1996242:84-9);Shendure(Science2005309:1728);Imelfort等人(Brief Bioinform.200910:609-18);Fox等人(Methods Mol Biol.2009;553:79-108);Appleby等人(Methods Mol Biol.2009;513:19-39)和Morozova(Genomics.200892:255-64),其中关于方法和方法的具体步骤(包括每个步骤的起始产物、试剂和终产物全部)的一般描述的通过引用被并入本文。序列可存在于一种或多种第二寡核苷酸中(在它们的尾中或在与第一寡核苷酸杂交的序列中)。在某些情况下,一种或多种第二寡核苷酸可含有两组引物结合位点,一组用于通过反向PCR扩增环状DNA,另一组用于对所得产物进行测序。一种或多种第二寡核苷酸还可包含位于扩增和测序引物结合位点下游的分子条码,其可被用来鉴定序列来自哪个样品,或计算多少不同的起始分子已被测序。
在另一些实施方式中,可使用纳米孔测序对扩增子进行测序(例如,如Soni等人Clin Chem 53:1996-20012007中所述,或如Oxford NanoporeTechnologies所述)。纳米孔测序是单分子测序技术,其中单个DNA分子在通过纳米孔时被直接测序。纳米孔是小洞,其直径1nm左右。将纳米孔浸入传导流体并越过它应用电势(电压)导致微量电流,这是因为离子通过纳米孔被传导。流过的电流量对纳米孔的尺寸和形状敏感。当DNA分子穿过纳米孔时,DNA分子上的每个核苷酸不同程度阻塞纳米孔,从而不同程度改变通过纳米孔的电流的量级。因此,这种DNA分子穿过纳米孔时的电流改变代表DNA序列的读取。纳米孔测序技术在美国专利号5,795,782、6,015,714、6,627,067、7,238,485和7,258,838以及美国专利申请公开2006003171和20090029477中被描述。
在一些具体实施方式中,可通过使用限制酶(例如具有4个、5个或6个碱基对识别位点的一种或多种限制酶)消化基因组DNA来产生片段化基因组DNA。或者,可使用化学、物理或转座酶催化片段化方法从基因组DNA产生基因组DNA,参见,例如,Adey等人(Genome Biology2010,11:R119)。例如,物理片段化方法可以包括超声、雾化或剪切基因组DNA。在某些实施方式中,在进行所述方法之前,可将基因组DNA片段化至平均尺寸在100bp-10kb(例如200bp-1kb)范围内。
上述方法可被用来分析来自几乎任何生物体(例如,植物、动物(例如,爬行动物、哺乳动物例如人类和小鼠、昆虫、蠕虫、鱼类、等)、组织样品、细菌、真菌(例如,酵母)、噬菌体、病毒、尸体组织、考古学/古代的样品等等的基因组。在某些实施方式中,所述方法中使用的初始DNA可来源于哺乳动物,其中在某些实施方式中,哺乳动物是人类。在一种实施方式中,检测基因组疑似含有染色体重排。
在某些实施方式中,被分析的初始DNA可来源于单一来源(例如,单一生物体、病毒、组织、细胞、对象等),然而在另一些实施方式中,核酸样品可以是从多个来源提取的核酸的库(例如来自多种生物体、组织、细胞、对象等的核酸的库),其中“多种”表示两种或更多种。因而,在某些实施方式中,核酸样品可含有来自2种或更多种来源,3种或更多种来源,5种或更多种来源,10种或更多种来源,50种或更多种来源,100种或更多种来源,500种或更多种来源,1000种或更多种来源,5000种或更多种来源,多达并包括约10000种或更多种来源的核酸。分子条码可允许来自不同来源的序列在分析之后被区分。此外,反应可以是多重的以在单个反应中靶向多个不同靶位点(例如,10-1000个)。
组合物
提供包含式V1-B-V2的第一寡核苷酸的群体的组合物。在某些实施方式中,(i)每种第一寡核苷酸的核酸序列B是相同的且其长度为至少15个核苷酸,(ii)核酸序列V1是可变的,(iii)核酸序列V2是可变的,和(iv)在每种第一寡核苷酸内,V1和V2序列与参考基因组中相距至少10kb的位点杂交。组合物还可包含与第一寡核苷酸的核酸序列B杂交的一种或多种第二寡核苷酸,和任选的片段化基因组DNA。可存在于该组合物中的组分的更详细描述以及可存在于组合物中的其它组分描述于上文所述的方法部分中。
试剂盒
本公开还提供用于实行如上所述本方法的试剂盒(kit)。本试剂盒可至少包含:a)式V1-B-V2的第一寡核苷酸的群体,其中(i)每种第一寡核苷酸的核酸序列B是相同的且其长度为至少15个核苷酸,(ii)核酸序列V1是可变的,(iii)核酸序列V2是可变的,且(iv)在每种第一寡核苷酸内,V1和V2序列与参考基因组中相距至少10kb的位点杂交;和b)与第一寡核苷酸的核酸序列B杂交的一种或多种第二寡核苷酸。试剂盒还可包含与所述一种或多种第二寡核苷酸所提供的位点杂交的扩增引物。此外,试剂盒还可包含用于进行引物延伸的试剂(例如,聚合酶、核苷酸和缓冲液等)和用于进行所述方法的其它酶和/或试剂(例如,连接酶等)。根据期望,试剂盒的各种组分可出现在分开的容器中或者某些相容组分可被预先组合在单个容器中。
除了上述组分之外,本试剂盒还可包含关于使用所述试剂盒的组分来实行本方法的说明(即,提供样品分析说明)。实行本方法的说明通常记录在合适的记录介质上。例如,说明可被印刷在基质(例如纸或塑料,等)上。因而,说明可作为包装***物(insert)出现在试剂盒中,在试剂盒或其组分的容器标记中(即,与包装或小包装相关)等。在另一些实施方式中,说明作为存在于合适的计算机可读存储介质(例如,CD-ROM、磁盘等)上的电子存储数据文件被呈现。在又一些实施方式中,实际说明未出现在试剂盒中,但从远程来源(例如,通过因特网)获得说明的方法被提供。这种实施方式的一个实例是包括网址的试剂盒,其中可在所述网址查看说明并/或可从所述网址下载说明。与说明一样,这种获得说明的方法被记录在合适基质上。
应用
本方法可用于多种应用,其中所述应用通常包括基因组DNA分析应用,其中将检测给定样品中特定染色体重排的存在。本方法还可用于精细地确定染色体断点和其它畸变(例如,微-倒位、缺失和易位)的位置,在某些情况下没有用关于它们位置的现有知识。本方法可用于多种诊断和研究目的,因为染色体倒位和易位在与人类疾病相关的状况和许多生物体的基因组进化中发挥重要的作用。
特别地,上述方法可用于诊断或研究多种类型的遗传异常、癌症或其它哺乳动物疾病,包括但不限于:白血病;乳腺癌;***癌;阿尔兹海默症;帕金森症;癫痫;肌萎缩性脊髓侧索硬化症;多发性硬化;中风;自闭症;猫叫综合症(5号染色体的短臂截短)、lp36缺失综合症(1号染色体的部分短臂缺失)、安格尔曼综合症(15号染色体的部分长臂缺失);普拉德-威利综合症(15号染色体的部分短臂缺失);急性淋巴细胞白血病和更特别地,慢性髓细胞性白血病(9号染色体和22号染色体之间易位);腭心面综合症(22号染色体的部分长臂缺失);特纳综合症(单个X染色体);克兰费尔特综合症(额外的X染色体);爱德华综合症(三体型18号染色体);唐氏综合症(三体型21号染色体);帕韬氏综合症(三体型13号染色体);和三体型8、9和16号,其通常无法存活至出生。
所述疾病可以是遗传的(生殖细胞突变)或偶发的(体细胞突变)。本文所述的许多示例性染色体重排与产生这些疾病的因素相关和被认为是产生这些疾病的因素。知晓染色体重排的类型和位置可大大有助于多种哺乳动物疾病的诊断、预后和理解。
某些上述方法还可用于检测患病细胞,其比需要***细胞并需要技术人员劳动和耗时的人工制备以及技术人员对载片的分析的标准细胞遗传学方法更为容易。
上述方法还可用于比较两个生物物种的基因组以推断进化关系。
基因组DNA可分离自多种来源,包括组织培养细胞和哺乳动物对象,例如,人类、灵长动物、小鼠或大鼠对象。例如,可由少于5毫升(mL)外周血分析染色体。白血细胞含有染色体而红血细胞不含染色体。可收集血液并将其与抗凝剂(例如,肝素钠)合并。还可由羊水(其含有胎儿细胞)分析基因组DNA。可使这类细胞在组织培养物中生长以使得在5-10天内能够获得用于染色体分析的***细胞。还可由骨髓分析基因组DNA,这有利于白血病或其它骨髓癌症的诊断。还可由固体组织样品分析基因组DNA。可无菌获得在约2-3mm范围内的皮肤或其它组织活检样本并将其转移至含有无菌盐水或组织转运介质的无菌小瓶中以提供用于染色体分析的材料。流产后获得的胎儿组织也可用于染色体分析,例如来自胎盘的胎儿侧、覆盖胸骨的骨膜或腹股沟韧带之上的筋膜,或来自绒膜绒毛。胎儿组织还可收集自多个位点,例如肾脏、胸腺、肺、隔膜、肌肉、腱和生殖腺。还可以进行羊膜穿刺术。
除了上述之外,本方法还可对例如骨髓涂片、血液涂片、石蜡包埋的组织制品、酶促分离的组织样品、非培养的骨髓、非培养羊水细胞和细胞离心制品进行。
实施例
在该实施例中,上述方法被用来检测通过染色体或染色体区段的易位和/或倒位所产生的基因融合。在该实施例中,晕环探针用于捕获来自复杂的序列库的特定DNA序列。随后扩增该捕获的序列并利用下一代测序平台进行测序。如上所述,晕环探针由与靶序列的5’和3’末端互补的两种基因特异序列组成。晕环方法能够检测这样的序列,其中两种晕环探针序列被<~400bp的***序列隔开。为了检测易位,晕环探针所靶向的两种序列与通过易位而融合的伴侣基因互补。在没有易位的样品中,两种序列将在不同的染色体上;或者如果在相同染色体上,它们将被多于400bp隔开,因此将不能捕获到序列。易位将使两种晕环探针序列彼此在400bp内,从而允许捕获序列。该方法的一个实例显示于图4。该方法不仅能够检测易位,而且由于对捕获的DNA进行测序,所以该方法还能够确定精确的融合点。
许多易位涉及多个断裂/融合点,所以为了捕获靶基因内的融合(无论它发生在哪儿),因此,在一个实施方式中,晕环探针被设计为以~50bp间隔平铺(tile)基因以确保融合点将被相距<400bp的晕环序列囊括(bracketed)。
易位事件期间融合序列的产生表示:序列的完整(未易位的)拷贝数将减少1。可使用针对参与易位的两个基因设计的晕环探针潜在测量这种减少。在这种情况下,在每个基因的易位点侧翼的探针将显示出相对于基因中的其它探针拷贝数减少(参见图5)。

Claims (19)

1.一种样品分析的方法,其包括:
(a)使来自检测基因组的片段化基因组DNA与式V1-B-V2的第一寡核苷酸的群体在一种或多种第二寡核苷酸存在下杂交;其中;
(i)每种所述第一寡核苷酸的核酸序列B是相同的且长度为至少15个核苷酸;
(ii)核酸序列V1是可变的;
(iii)核酸序列V2是可变的;
(iv)在每种第一寡核苷酸内,V1和V2序列与参考基因组中相距至少10kb的位点杂交;且
(v)所述一种或多种第二寡核苷酸与核酸序列B杂交
(b)使(a)的产物与连接酶接触以使与V1和V2杂交的所述片段化基因组DNA的末端与所述一种或多种第二寡核苷酸连接;和
(c)使用与所述一种或多种第二寡核苷酸所提供的位点杂交的扩增引物,使(b)的产物经受聚合酶链式反应条件,
其中通过步骤(c)产生产物指示:相对于所述参考基因组,所述检测基因组含有染色体重排。
2.权利要求1所述的方法,其还包括:对(c)的产物进行测序。
3.权利要求2所述的方法,其还包括:分析序列以鉴定所述染色体重排的断点。
4.权利要求1所述的方法,其中,在每种第一寡核苷酸内,V1和V2序列与所述参考基因组中不同染色体臂上的位点杂交。
5.权利要求1所述的方法,其中,在每种第一寡核苷酸内,V1和V2序列与所述参考基因组中不同染色体上的位点杂交。
6.权利要求1所述的方法,其中所述检测基因组和参考基因组是来自相同物种的哺乳动物基因组。
7.权利要求1所述的方法,其中所述片段化基因组DNA通过使用限制酶消化基因组DNA来产生。
8.权利要求1所述的方法,其中所述一种或多种第二寡核苷酸是与所述第一寡核苷酸的核酸序列B杂交的单一寡核苷酸。
9.权利要求1所述的方法,其中所述一种或多种第二寡核苷酸是两种寡核苷酸,其每种各包含与所述第一寡核苷酸的核酸序列B杂交的第一区域,和提供(c)的扩增引物的结合位点的第二区域。
10.权利要求1所述的方法,其中V1和V2各自的长度为至少15个碱基。
11.权利要求1所述的方法,其中所述V1序列穿过所述参考基因组中的第一区域平铺,且所述V2序列穿过所述参考基因组中的第二区域平铺。
12.权利要求1所述的方法,其中所述检测基因组被怀疑含有染色体重排。
13.组合物,其包含式V1-B-V2的第一寡核苷酸的群体,其中;
(i)每种所述第一寡核苷酸的核酸序列B是相同的且长度为至少15个核苷酸;
(ii)核酸序列V1是可变的;
(iii)核酸序列V2是可变的;
(iv)在每种第一寡核苷酸内,V1和V2序列与参考基因组中相距至少10kb的位点杂交。
14.权利要求13所述的组合物,其中所述组合物包含至少10种所述第一寡核苷酸。
15.权利要求13所述的组合物,其中V1和V2各自的长度为至少15个核苷酸。
16.权利要求13所述的组合物,其还包含与所述第一寡核苷酸的核酸序列B杂交的一种或多种第二寡核苷酸。
17.权利要求13所述的组合物,其还包含片段化基因组DNA。
18.试剂盒,其包含:
a)式V1-B-V2的所述第一寡核苷酸的群体;其中;
(i)每种所述第一寡核苷酸的核酸序列B是相同的且长度为至少15个核苷酸;
(ii)核酸序列V1是可变的;
(iii)核酸序列V2是可变的;
(iv)在每种第一寡核苷酸内,V1和V2序列与参考基因组中相距至少10kb的位点杂交;和
b)与所述第一寡核苷酸的核酸序列B杂交的一种或多种第二寡核苷酸。
19.权利要求18所述的试剂盒,其还包含与所述一种或多种第二寡核苷酸所提供的位点杂交的扩增引物。
CN201380074301.2A 2013-03-05 2013-03-05 通过序列捕获检测基因组重排 Active CN105026577B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US2013/029166 WO2014137328A1 (en) 2013-03-05 2013-03-05 Detection of genomic rearrangements by sequence capture

Publications (2)

Publication Number Publication Date
CN105026577A true CN105026577A (zh) 2015-11-04
CN105026577B CN105026577B (zh) 2020-01-03

Family

ID=51491712

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380074301.2A Active CN105026577B (zh) 2013-03-05 2013-03-05 通过序列捕获检测基因组重排

Country Status (4)

Country Link
US (1) US10017820B2 (zh)
EP (1) EP2964778B1 (zh)
CN (1) CN105026577B (zh)
WO (1) WO2014137328A1 (zh)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI646230B (zh) 2013-08-05 2019-01-01 扭轉生物科技有限公司 重新合成之基因庫
PT3889271T (pt) * 2014-06-06 2022-12-20 Univ Cornell Método para identificação e enumeração de alterações de sequência de ácidos nucleicos, expressão, cópia ou metilação de adn, utilizando reações de nuclease, ligase, polimerase e sequenciação combinadas
CA2975852A1 (en) 2015-02-04 2016-08-11 Twist Bioscience Corporation Methods and devices for de novo oligonucleic acid assembly
CA2975855A1 (en) 2015-02-04 2016-08-11 Twist Bioscience Corporation Compositions and methods for synthetic gene assembly
US9981239B2 (en) 2015-04-21 2018-05-29 Twist Bioscience Corporation Devices and methods for oligonucleic acid library synthesis
KR20180048682A (ko) * 2015-09-18 2018-05-10 바나디스 다이아그노스틱스 Dna 샘플의 분석을 위한 프로브 세트 및 이의 사용 방법
CA2998169A1 (en) 2015-09-18 2017-03-23 Twist Bioscience Corporation Oligonucleic acid variant libraries and synthesis thereof
CN108698012A (zh) 2015-09-22 2018-10-23 特韦斯特生物科学公司 用于核酸合成的柔性基底
EP3384077A4 (en) 2015-12-01 2019-05-08 Twist Bioscience Corporation FUNCTIONALIZED SURFACES AND THEIR PREPARATION
KR102212257B1 (ko) 2016-08-22 2021-02-04 트위스트 바이오사이언스 코포레이션 드 노보 합성된 핵산 라이브러리
US10417457B2 (en) 2016-09-21 2019-09-17 Twist Bioscience Corporation Nucleic acid based data storage
US10907274B2 (en) 2016-12-16 2021-02-02 Twist Bioscience Corporation Variant libraries of the immunological synapse and synthesis thereof
US11550939B2 (en) 2017-02-22 2023-01-10 Twist Bioscience Corporation Nucleic acid based data storage using enzymatic bioencryption
US10894959B2 (en) 2017-03-15 2021-01-19 Twist Bioscience Corporation Variant libraries of the immunological synapse and synthesis thereof
EP3638782A4 (en) 2017-06-12 2021-03-17 Twist Bioscience Corporation SEALLESS NUCLEIC ACID ASSEMBLY METHODS
WO2018231864A1 (en) 2017-06-12 2018-12-20 Twist Bioscience Corporation Methods for seamless nucleic acid assembly
CN111566125A (zh) 2017-09-11 2020-08-21 特韦斯特生物科学公司 Gpcr结合蛋白及其合成
KR20240024357A (ko) 2017-10-20 2024-02-23 트위스트 바이오사이언스 코포레이션 폴리뉴클레오타이드 합성을 위한 가열된 나노웰
US10936953B2 (en) 2018-01-04 2021-03-02 Twist Bioscience Corporation DNA-based digital information storage with sidewall electrodes
US11019557B2 (en) 2018-05-10 2021-05-25 Sharp Kabushiki Kaisha Apparatus and method for acquisition of periodically broadcasted system information in wireless communication
EP3814497A4 (en) 2018-05-18 2022-03-02 Twist Bioscience Corporation POLYNUCLEOTIDES, REAGENTS, AND METHODS FOR NUCLEIC ACID HYBRIDIZATION
SG11202109283UA (en) 2019-02-26 2021-09-29 Twist Bioscience Corp Variant nucleic acid libraries for antibody optimization
US11492727B2 (en) 2019-02-26 2022-11-08 Twist Bioscience Corporation Variant nucleic acid libraries for GLP1 receptor
EP3947726A1 (en) * 2019-04-03 2022-02-09 Agilent Technologies, Inc. Compositions and methods for identifying and characterizing gene translocations, rearrangements and inversions
EP3987019A4 (en) 2019-06-21 2023-04-19 Twist Bioscience Corporation BARCODE-BASED NUCLEIC ACID SEQUENCE ARRANGEMENT

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5731153A (en) * 1996-08-26 1998-03-24 The Regents Of The University Of California Identification of random nucleic acid sequence aberrations using dual capture probes which hybridize to different chromosome regions
WO2005111236A1 (en) * 2004-05-18 2005-11-24 Olink Ab Method for amplifying specific nucleic acids in parallel
US20090239764A1 (en) * 2008-03-11 2009-09-24 Affymetrix, Inc. Array-based translocation and rearrangement assays

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1329517A1 (en) 2002-01-22 2003-07-23 Wolfgang Prof. Holzgreve Method for the non-invasive prenatal diagnosis of chromosomal and/or genetic abnormalities
KR101133187B1 (ko) 2006-09-08 2012-04-12 주식회사 마크로젠 염색체 이상 검출용 마이크로어레이 및 검출 방법
US8034917B2 (en) 2008-08-28 2011-10-11 Agilent Technologies, Inc. Primer-directed chromosome painting
CA2825453C (en) 2011-03-14 2016-05-10 Ventana Medical Systems, Inc. A method of analyzing chromosomal translocations and a system therefore

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5731153A (en) * 1996-08-26 1998-03-24 The Regents Of The University Of California Identification of random nucleic acid sequence aberrations using dual capture probes which hybridize to different chromosome regions
WO2005111236A1 (en) * 2004-05-18 2005-11-24 Olink Ab Method for amplifying specific nucleic acids in parallel
US20090239764A1 (en) * 2008-03-11 2009-09-24 Affymetrix, Inc. Array-based translocation and rearrangement assays

Also Published As

Publication number Publication date
CN105026577B (zh) 2020-01-03
EP2964778A1 (en) 2016-01-13
US20160017425A1 (en) 2016-01-21
US10017820B2 (en) 2018-07-10
WO2014137328A1 (en) 2014-09-12
EP2964778A4 (en) 2016-11-23
EP2964778B1 (en) 2019-10-09

Similar Documents

Publication Publication Date Title
CN105026577A (zh) 通过序列捕获检测基因组重排
CN110191961B (zh) 制备经不对称标签化的测序文库的方法
CN104854246B (zh) 无限制酶的靶标富集
US11414695B2 (en) Nucleic acid enrichment using Cas9
CN104619894B (zh) 用于非期望核酸序列的阴性选择的组合物和方法
US10308979B2 (en) Target enrichment and labeling for multi-kilobase DNA
CN104736722A (zh) 样品制备方法
CN109154013A (zh) 转座酶和y衔接子用于片段化和标签化dna的用途
JP7046097B2 (ja) 試料核酸にアダプターを付着する方法
US20240117343A1 (en) Methods and compositions for preparing nucleic acid sequencing libraries
EP2722401B1 (en) Addition of an adaptor by invasive cleavage
JP2020524491A (ja) ガイド核酸の作製および使用
US20220364169A1 (en) Sequencing method for genomic rearrangement detection
CN109196096A (zh) 转座酶随机引发性dna样品制备
CN105026578A (zh) 通过引物延伸合成探针库
US11680285B2 (en) Hooked probe, method for ligating nucleic acid and method for constructing sequencing library
CN115175985A (zh) 从未经处理的生物样本中提取单链dna和rna并测序的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant