JP2017537657A - Target sequence enrichment - Google Patents

Target sequence enrichment Download PDF

Info

Publication number
JP2017537657A
JP2017537657A JP2017550457A JP2017550457A JP2017537657A JP 2017537657 A JP2017537657 A JP 2017537657A JP 2017550457 A JP2017550457 A JP 2017550457A JP 2017550457 A JP2017550457 A JP 2017550457A JP 2017537657 A JP2017537657 A JP 2017537657A
Authority
JP
Japan
Prior art keywords
target
adapter
probe
sequence
target sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017550457A
Other languages
Japanese (ja)
Inventor
シンシア エル. リチャード,
シンシア エル. リチャード,
Original Assignee
ニユー・イングランド・バイオレイブス・インコーポレイテツド
ダイレクテッド ジェノミクス, エルエルシー
ダイレクテッド ジェノミクス, エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ニユー・イングランド・バイオレイブス・インコーポレイテツド, ダイレクテッド ジェノミクス, エルエルシー, ダイレクテッド ジェノミクス, エルエルシー filed Critical ニユー・イングランド・バイオレイブス・インコーポレイテツド
Publication of JP2017537657A publication Critical patent/JP2017537657A/en
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay

Abstract

核酸の集団から標的配列を濃縮するための方法及び組成物であって、核酸の集団と、親和性結合ドメインを含む標的単離プローブとを溶液中で組み合わせること;標的単離プローブの一本鎖領域を、核酸の集団中の標的配列の全部又は一部にハイブリダイズさせることと;標的単離プローブを捕捉ドメインと結合させ、非結合物質を除去することにより、標的配列を含有する集団からハイブリダイズされた核酸を選択的に固定化すること;1以上の3’エキソヌクレアーゼによって、標的配列の3’末端から非標的配列を除去し、それにより標的配列の3’末端に平滑末端二重鎖又は付着端を生じさせること;任意選択的に3’二重鎖アダプター又はヘアピンアダプターの二重鎖末端を標的配列の3’末端及び標的分離プローブの5’末端にライゲートすること;標的単離プローブの3’末端を伸長させて、ライゲーションに適した標的配列の5’末端に平滑末端又は付着端を形成し、標的配列の5’末端及び標的単離プローブの3’伸長末端へのアダプターをライゲートすることを含む、方法が提供される。【選択図】図10A method and composition for concentrating a target sequence from a population of nucleic acids, comprising combining the population of nucleic acids with a target isolation probe comprising an affinity binding domain in solution; Hybridizing the region to all or part of the target sequence in the population of nucleic acids; hybridizing from the population containing the target sequence by binding the target isolation probe to the capture domain and removing unbound material. Selectively immobilizing the soy nucleic acid; removing the non-target sequence from the 3 ′ end of the target sequence by one or more 3 ′ exonucleases, thereby causing a blunt ended duplex at the 3 ′ end of the target sequence Or creating a sticky end; optionally the duplex end of the 3 ′ duplex adapter or hairpin adapter is placed at the 3 ′ end of the target sequence and the 5 ′ end of the target separation probe Extending the 3 ′ end of the target isolation probe to form a blunt or sticky end at the 5 ′ end of the target sequence suitable for ligation, and the 5 ′ end of the target sequence and 3 of the target isolation probe 'A method is provided comprising ligating an adapter to the extended end. [Selection] Figure 10

Description

次世代シーケンシング(NGS)は、がん(Dancey, et al. Cell, 48:409-420 (2012); Dawson, et al. NEJM, 368:1199-1209 (2013))、心筋症(Meder, et al. Circ. Cardiovasc. Genet., 4:110-122 (2011); Norton, et al. Curr. Opin. Cariol., 27:214-20 (2012))、遺伝性障害(Boycott, et al. Nature Genetics, 14:681-691 (2013))、出生前診断(Nepomnyashchaya, et al. Clin Chem Lab Med., 51:1141-54 (2013); Papgeorgiou, et al. Genome Medicine, 4:46 (2012))、及び神経障害(Nemeth, et al. Brain, 136:3106-180 (2013))を含めた多くの疾患の診断及び治療において貴重なツールであることが判明している。一方で、NGSによってヒトゲノム全体のシーケンシングが数日で可能になるものの、シーケンシングのコスト及びデータ分析の負担が、全ゲノムシーケンシングの臨床への橋渡しを著しく妨げている。結果として、標的配列の濃縮により、NGS(Agilent, (Santa Clara, CA), Roche/NimbleGen (Madison, WI), Illumina (San Diego, CA), Life Technologies (Grand Island, NY))、マルチプレックスPCR(Life Technologies, Illumina, Qiagen (Valencia, CA), Kailos Genetics (Huntsville, AL))、分子反転プローブ(Hiatt, et al. Genome Res., 23, 843-54 (2013))、高並列PCR(highly-parallel PCR)(Fluidigm (San Francisco, CA), Raindance (Billerica, MA))、及び単一プライマー増幅法(Enzymatics/ArcherDx (Beverly, MA), NuGen (San Carlos, CA))に依拠する分子診断を容易にすることが望ましい。   Next-generation sequencing (NGS) has been developed for cancer (Dancey, et al. Cell, 48: 409-420 (2012); Dawson, et al. NEJM, 368: 1199-1209 (2013)), cardiomyopathy (Meder, et al. Circ. Cardiovasc. Genet., 4: 110-122 (2011); Norton, et al. Curr. Opin. Cariol., 27: 214-20 (2012)), genetic disorders (Boycott, et al. Nature Genetics, 14: 681-691 (2013)), prenatal diagnosis (Nepomnyashchaya, et al. Clin Chem Lab Med., 51: 1141-54 (2013); Papgeorgiou, et al. Genome Medicine, 4:46 (2012 )), And neurological disorders (Nemeth, et al. Brain, 136: 3106-180 (2013)) proved to be a valuable tool in the diagnosis and treatment of many diseases. On the other hand, although NGS enables sequencing of the entire human genome in a few days, the cost of sequencing and the burden of data analysis significantly hinder the whole-genome sequencing from becoming a clinical bridge. As a result, NGS (Agilent, (Santa Clara, CA), Roche / NimbleGen (Madison, WI), Illumina (San Diego, CA), Life Technologies (Grand Island, NY)), multiplex PCR by enrichment of the target sequence (Life Technologies, Illumina, Qiagen (Valencia, CA), Kailos Genetics (Huntsville, AL)), molecular inversion probe (Hiatt, et al. Genome Res., 23, 843-54 (2013)), highly parallel PCR (highly -parallel PCR) (Fluidigm (San Francisco, CA), Raindance (Billerica, MA)) and single primer amplification methods (Enzymatics / ArcherDx (Beverly, MA), NuGen (San Carlos, CA)) It is desirable to facilitate.

濃縮のための現行法としては、調製されたDNAライブラリーからのハイブリダイゼーション捕捉(Albert, et al. Nature Methods, 4:903-905 (2007); Okou, et al. Nature Methods, 4:907-909 (2007))が含まれる。ハイブリダイゼーション捕捉は、固定化プローブのアレイを必要とする。理論的には、溶液中の断片化核酸は、それが相補的配列を有する場合、これらの固定化プローブにハイブリダイズする。これらの方法は、二重鎖両方の鎖が捕捉され得ることを除いて、溶液ハイブリダイゼーションの場合と同じ欠点を有する。しかし、これらの方法のさらなる欠点は、ハイブリダイゼーション前にプローブが表面に結合される場合、ハイブリダイゼーションの効率が下がることを含む。さらなる欠点としては、2−3日にもわたる非常に長いプロトコール、試験のコストを増大させる複数の工程、大量の初期インプットDNA(1μg−5μg)の必要性、ライブラリーの広範なサイズ分布、特異性がわずか55%−65%、80%+/−200から500塩基対(bp)、及び反復を捕捉することができないこと、又は非標的配列内の反復配列を含有する核酸を取り扱うことができないことが含まれる。   Current methods for enrichment include hybridization capture from prepared DNA libraries (Albert, et al. Nature Methods, 4: 903-905 (2007); Okou, et al. Nature Methods, 4: 907-909 (2007)). Hybridization capture requires an array of immobilized probes. Theoretically, a fragmented nucleic acid in solution will hybridize to these immobilized probes if it has a complementary sequence. These methods have the same disadvantages as solution hybridization, except that both strands can be captured. However, further disadvantages of these methods include a decrease in the efficiency of hybridization if the probe is bound to the surface prior to hybridization. Further disadvantages include a very long protocol over 2-3 days, multiple steps that increase the cost of the test, the need for large amounts of initial input DNA (1 μg-5 μg), extensive size distribution of the library, specificity Only 55% -65%, 80% + /-200 to 500 base pairs (bp), and unable to capture repeats, or cannot handle nucleic acids containing repeat sequences within non-target sequences It is included.

現行の方法は、標的の末端における人工配列に依拠することから、リード開始点(核酸分子のシーケンシングが開始される位置)を特定するのに適していない。さらに、現行法は、両方の標的鎖を捕捉するのに適していない。本ハイブリダイゼーション法は、通常、Sakharkarら、In Silico Biology,4:387−393(2004)で記載されている通り、200bp未満であるエキソン上の平均サイズを超える核酸断片を捕捉することから、結果的にリード開始点を明確に決定することができないことに因り、実質的に非標的のシーケンシングになる。ハイブリダイゼーションに基づくエキソーム捕捉技術の性能比較は、Clarkら、Nature Biotechnology,29:908-914(2011)で総論されている。   The current method relies on an artificial sequence at the end of the target and is not suitable for identifying the read start point (position where nucleic acid molecule sequencing is initiated). Furthermore, current methods are not suitable for capturing both target strands. This hybridization method usually results in capturing nucleic acid fragments that exceed the average size on an exon that is less than 200 bp, as described in Sakharkar et al., In Silico Biology, 4: 387-393 (2004). This leads to substantially non-targeted sequencing due to the inability to clearly determine the lead start point. A comparison of the performance of hybridization-based exome capture technologies is reviewed in Clark et al., Nature Biotechnology, 29: 908-914 (2011).

マルチプレックスPCRは、捕捉ハイブリダイゼーションの代替である。マルチプレックスPCR法はかなり高速であり、濃縮前にライブラリーを調製する必要はないが、プライマー相互作用のために反応ごとに拡張性が制限され、異なる効率で増幅するプライマーのセットを使用することから生じる増幅バイアスによる標的全体にわたる増幅の均一性変動、重複をフィルターにかけることができないこと、及び標的へのアニーリングに用いられるプライマー配列の追加が、アンプリコンの末端に含まれる。シーケンシング中、これらの配列を一通り読まざるを得ないため、それによってシーケンシングの時間及びコストが増加する。さらに、不要な配列複雑性を生成する標的配列に加えて、合成プライマーの配列が配列レポートに含まれる。分子反転プローブ及び高並列PCRはいずれも、マルチプレックスPCRによって遭遇する問題の一部を解決するが、両方法ともよりかなり高額である。分子反転プローブは長いオリゴヌクレオチド上で合成する必要があることから、高並列PCR法に関連する装置コストが生じる。その上、いずれの方法も、アンプリコンの末端に合成プライマー配列を導入する。単一プライマー法は、アンプリコンの末端の一方のみにプライマー配列を導入することから、配列決定されたプライマーの量を半減させるが、2のプライマーを用いて正確な標的配列を濃縮することによって得られるさらなる選択性を犠牲にする。その結果、高い拡張性、特異性、及び均一性でオフターゲット又はプライマー領域のシーケンシングを最小にする標的濃縮の方法が依然として必要とされている。   Multiplex PCR is an alternative to capture hybridization. Multiplex PCR methods are fairly fast and do not require the preparation of libraries prior to enrichment, but use primer sets that have different efficiencies for each reaction due to primer interactions and amplify with different efficiencies Included at the end of the amplicon are variations in amplification uniformity across the target due to the amplification bias resulting from, the inability to filter the overlap, and the addition of primer sequences used for annealing to the target. During sequencing, these sequences must be read through, which increases the time and cost of sequencing. In addition to the target sequence that generates unnecessary sequence complexity, the sequence of the synthetic primer is included in the sequence report. Both molecular inversion probes and highly parallel PCR solve some of the problems encountered by multiplex PCR, but both methods are much more expensive. Since molecular inversion probes need to be synthesized on long oligonucleotides, equipment costs associated with highly parallel PCR methods arise. In addition, both methods introduce a synthetic primer sequence at the end of the amplicon. The single primer method introduces a primer sequence at only one end of the amplicon, thus halving the amount of primer sequenced, but is obtained by concentrating the exact target sequence with two primers. At the expense of further selectivity. As a result, there remains a need for target enrichment methods that minimize off-target or primer region sequencing with high scalability, specificity, and uniformity.

概して、核酸の集団から標的配列を濃縮するための方法及び組成物が提供される。本方法は、核酸の集団と、親和性結合ドメインを含む標的単離プローブとを溶液中で組み合わせること;標的単離プローブの一本鎖領域を、核酸の集団中の標的配列の全部又は一部にハイブリダイズさせること;標的単離プローブを捕捉ドメインと結合させ、非結合物質を除去することにより、標的配列を含有する集団からハイブリダイズされた核酸を選択的に固定化すること;及び1以上の3’一本鎖特異的エキソヌクレアーゼによって、標的配列の3’末端から非標的配列を除去することを含む。   In general, methods and compositions are provided for enriching a target sequence from a population of nucleic acids. The method combines a population of nucleic acids with a target isolation probe comprising an affinity binding domain in solution; a single stranded region of the target isolation probe is combined with all or part of a target sequence in the population of nucleic acids. Selectively immobilizing the hybridized nucleic acid from the population containing the target sequence by binding the target isolation probe to the capture domain and removing unbound material; and one or more Removing the non-target sequence from the 3 ′ end of the target sequence with a 3 ′ single-strand specific exonuclease.

種々の態様において、集団中の核酸の一部又は全部は反復配列を含み、核酸の集団は、標的単離プローブの前に又はそれと共に反復配列にハイブリダイズする除去可能なブロッキングオリゴヌクレオチドと組み合わされ得る。過剰の除去可能なブロッキングオリゴヌクレオチドを使用し、二重鎖変性工程の後にハイブリダイゼーションを可能にすることが有利であり得る。次いで、核酸/除去可能なオリゴヌクレオチド二重鎖中の除去可能なブロッキングオリゴヌクレオチドは、3’一本鎖特異的エキソヌクレアーゼを有する3’非標的配列の分解と同時に又はそれより前に、選択的に分解され得る。除去可能なブロッキングオリゴヌクレオチドの分解は、除去可能なブロッキングオリゴヌクレオチドがRNAである場合にはRNAseによって、又は、例えば除去可能なブロッキングオリゴヌクレオチドが複数のウラシルを含有するDNAである場合にはウラシルグリコシラーゼ及びエンドヌクレアーゼによって、又は除去可能なブロッキングオリゴヌクレオチドを特異的に切断するためのその他任意の適切な技術によって達成され得る。   In various embodiments, some or all of the nucleic acids in the population contain repetitive sequences, and the population of nucleic acids is combined with a removable blocking oligonucleotide that hybridizes to the repetitive sequences before or with the target isolation probe. obtain. It may be advantageous to use excess removable blocking oligonucleotides to allow hybridization after the double-strand denaturation step. The removable blocking oligonucleotide in the nucleic acid / removable oligonucleotide duplex is then selectively concomitant with or prior to degradation of the 3 ′ non-target sequence with the 3 ′ single-strand specific exonuclease. Can be broken down into Degradation of the removable blocking oligonucleotide can be achieved by RNAse if the removable blocking oligonucleotide is RNA, or uracil glycosylase if the removable blocking oligonucleotide is a DNA containing multiple uracils, for example. And by endonucleases or any other suitable technique for specifically cleaving the removable blocking oligonucleotide.

様々な態様において、上記の標的単離プローブの一本鎖領域は、標的配列の3’末端及び5’末端の両方にハイブリダイズし得る。これらの状況において、親和性ドメインは、好ましくは標的単離プローブの3’末端と5’末端の間に位置するが、3’末端又は5’末端にはない部位で標的単離プローブと結合される。標的配列とのハイブリダイゼーションは、中程度にストリンジェントなハイブリダイゼーション条件下で、標的単離プローブの長さに沿って生じ得る。これらの条件は、本方法の使用が一塩基多型(SNP)を検出するためである場合に予想されるように、個々の塩基対のミスマッチが起こることを許容し得る。あるいは、ハイブリダイゼーションは、異なる供給源由来の選択された標的配列を特徴付ける可能性のある挿入又は欠失のために生じる恐れのあるミスマッチの重要な内部領域を有する標的単離プローブの末端で生じ得る。標的配列/標的単離プローブが親和性ドメインと固定化された捕捉ドメインとの結合により固定化され、3’非標的配列が除去された後か又は1以上の3’エキソヌクレアーゼを用いた除去と同時に、5’非標的配列は、1以上の5’一本鎖特異的エキソヌクレアーゼによって標的配列の5’末端から除去され得る。標的配列の3’及び5’末端でのエキソヌクレアーゼ消化に続いて、アダプターのライゲーションに適した平滑末端又は付着端を生成するために、アダプターを標的配列にライゲートさせることにより、標的配列は、容易に同定、単離、増幅、配列決定、特徴付けされ、及び/又は表現型的に重要な配列差異について分析され得る。   In various embodiments, the single stranded region of the target isolation probe described above can hybridize to both the 3 'end and the 5' end of the target sequence. In these situations, the affinity domain is preferably bound to the target isolation probe at a site that is located between the 3 ′ and 5 ′ ends of the target isolation probe but not at the 3 ′ or 5 ′ end. The Hybridization with the target sequence can occur along the length of the target isolation probe under moderately stringent hybridization conditions. These conditions may allow individual base pair mismatches to occur, as would be expected if the use of the method was to detect single nucleotide polymorphisms (SNPs). Alternatively, hybridization can occur at the end of a target isolation probe that has important internal regions of mismatch that can occur due to insertions or deletions that can characterize selected target sequences from different sources. . Removal after the target sequence / target isolation probe is immobilized by binding of the affinity domain to the immobilized capture domain and the 3 ′ non-target sequence is removed or using one or more 3 ′ exonucleases; At the same time, the 5 ′ non-target sequence can be removed from the 5 ′ end of the target sequence by one or more 5 ′ single-strand specific exonucleases. Following exonuclease digestion at the 3 'and 5' ends of the target sequence, the target sequence can be easily ligated to the target sequence to generate blunt ends or sticky ends suitable for ligation of the adapter. Can be identified, isolated, amplified, sequenced, characterized, and / or analyzed for phenotypically significant sequence differences.

本方法の態様において、標的単離プローブの異なる構造を利用し、本明細書に記載の第二のプローブと併せて使用することができる。プローブに関係なく、本方法のいくつかの共通の特徴、すなわち集団中の核酸の、親和性ドメインと結合した標的単離プローブとのハイブリダイゼーション、それに続く、標的単離プローブが固定化されている場合に生じ、非ハイブリダイズ核酸及び試薬を洗浄により、次いで3’非標的配列をエキソヌクレアーゼ消化により除去することを可能にする濃縮の第一の工程は、保存される。   In embodiments of the method, different structures of the target isolation probe can be utilized and used in conjunction with the second probe described herein. Regardless of the probe, some common features of the method, i.e., hybridization of the nucleic acids in the population to the target isolation probe bound to the affinity domain, followed by the target isolation probe being immobilized The first step of enrichment, which occurs in some cases and allows non-hybridized nucleic acids and reagents to be removed by washing and then the 3 ′ non-target sequence by exonuclease digestion, is preserved.

本方法の一態様において、標的単離プローブは、フラッププローブであってもよく、フラッププローブは一本鎖領域の3’末端から伸長する非ハイブリダイズ二本鎖領域を有する。非ハイブリダイズ二本鎖領域は、一方の鎖の5’末端でプローブの一本鎖領域の3’末端にライゲートされてもよいし、又は非ハイブリダイズ二本鎖領域において第二の鎖を構成する3’−5’オリゴヌクレオチドがアニールされている、一本鎖プローブの一部であってもよい。あるいは、非ハイブリダイズ二本鎖領域は、折り返してそれ自体とハイブリダイズして二本鎖領域を形成する、一本鎖プローブの3’末端のヘアピンから形成され得る。フラッププローブの、標的配列の5’末端へのハイブリダイゼーションの後、5’非標的配列は、5’フラップエンドヌクレアーゼ消化により除去することができ、3’−5’オリゴヌクレオチド又はヘアピンは、5’アダプターとして働くようにニッキング工程の後の標的配列の5’末端にライゲートされ得る。3’アダプターは、標的配列の3’末端にライゲートされ得る。3’及び5’アダプターは、シーケンシングプライマー部位、ライブラリー増幅プライマー部位、一意なサンプル識別子(unique sample identifier)、及び一意な分子識別子配列のうちの1以上をそれぞれ含有し得る。   In one aspect of the method, the target isolation probe may be a flap probe, which has a non-hybridized double stranded region extending from the 3 'end of the single stranded region. The non-hybridized double stranded region may be ligated to the 3 ′ end of the single stranded region of the probe at the 5 ′ end of one strand or constitute the second strand in the non-hybridized double stranded region The 3′-5 ′ oligonucleotide to be annealed may be part of a single stranded probe. Alternatively, the non-hybridized double stranded region can be formed from a hairpin at the 3 'end of a single stranded probe that folds back and hybridizes with itself to form a double stranded region. Following hybridization of the flap probe to the 5 'end of the target sequence, the 5' non-target sequence can be removed by 5 'flap endonuclease digestion and the 3'-5' oligonucleotide or hairpin can be removed 5 ' It can be ligated to the 5 'end of the target sequence after the nicking step to act as an adapter. A 3 'adapter can be ligated to the 3' end of the target sequence. The 3 'and 5' adapters may each contain one or more of a sequencing primer site, a library amplification primer site, a unique sample identifier, and a unique molecular identifier sequence.

本方法の他の態様において、標的単離プローブの一本鎖領域は、標的配列の第一の部分にハイブリダイズする。例えば、標的単離プローブの末端は、標的配列の3’末端若しくは5’末端又はその近傍の配列を有する二重鎖を形成する。第二のプローブの一本鎖領域が標的単離プローブに隣接する、又はその近傍若しくは遠位の位置で標的配列の第二の部分にハイブリダイズすることがさらに可能になり、この位置によって第二のプローブが標的単離プローブと反対側にある標的配列の末端を決定することになる。一態様において、第二のプローブは、標的配列中のヌクレオチドの90%、70%、50%、30%又は10%以下の非ランダム配列を有し、それに対応して標的単離配列は標的配列の10%、30%、50%、70%又は90%以下のヌクレオチド配列を有する。   In other embodiments of the method, the single stranded region of the target isolation probe hybridizes to the first portion of the target sequence. For example, the end of the target isolation probe forms a duplex having a sequence at or near the 3 'or 5' end of the target sequence. It is further possible for the single-stranded region of the second probe to hybridize to the second portion of the target sequence at a position adjacent to, near or distal to the target isolation probe, which position allows the second Will determine the end of the target sequence opposite to the target isolation probe. In one embodiment, the second probe has a non-random sequence of no more than 90%, 70%, 50%, 30% or 10% of the nucleotides in the target sequence, correspondingly the target isolated sequence is the target sequence Or less than 10%, 30%, 50%, 70% or 90% of the nucleotide sequence.

これらの方法の態様において、3’標的単離プローブ上の親和性ドメインは、標的単離プローブの3’末端に、又は標的単離プローブ内のどこにでも(ただし5’末端は除く)配置することができ、一方、5’標的単離プローブ上の親和性ドメインは、標的分離プローブの5’末端に、又は標的分離プローブの内のどこにでも(ただし3’末端は除く)配置され得る。   In these method embodiments, the affinity domain on the 3 ′ target isolation probe is located at the 3 ′ end of the target isolation probe or anywhere within the target isolation probe, except the 5 ′ end. While the affinity domain on the 5 ′ target isolation probe can be located at the 5 ′ end of the target separation probe or anywhere within the target separation probe, but excluding the 3 ′ end.

これらの方法の態様において、標的単離プローブが標的配列の一部に、例えば標的配列の3’末端でハイブリダイズする場合、4−10ヌクレオチドの範囲の長さを持つランダム配列を有するオリゴヌクレオチドを用いることができ、このオリゴヌクレオチドは、ポリメラーゼ伸長のためのプライマーとして働き、アダプターライゲーションに適した二本鎖の5’末端を形成する。   In these method embodiments, when the target isolation probe hybridizes to a portion of the target sequence, eg, at the 3 ′ end of the target sequence, an oligonucleotide having a random sequence with a length in the range of 4-10 nucleotides This oligonucleotide can serve as a primer for polymerase extension and forms a double-stranded 5 ′ end suitable for adapter ligation.

本方法の別の態様において、標的単離プローブ又は標的配列の5’部分に配置される第二のプローブは、ハイブリダイズする一本鎖領域と一本鎖領域の3’末端から伸長するハイブリダイズしない二本鎖領域とを有する前述のものと類似のフラッププローブである。5’非標的配列は、5’エキソヌクレアーゼ消化によって除去されて、線状プローブが標的配列の5’末端で用いられる場合には標的配列へのアダプターライゲーションに適した平滑末端又は付着端を、5’フラッププローブが用いられる場合には5’フラップエンドヌクレアーゼを提供することができる。例えば、ブロッキング部分は、標的単離プローブ又は第二のプローブへのアダプターのライゲーションを防ぐために、修飾されたヌクレオチドが提供される。5’末端のエキソヌクレアーゼ消化が5’非標的配列よりも多い又は少ないものを除去する場合、5’アダプターのライゲーション前に、付着端を埋める追加の工程を用いることができる。   In another embodiment of the method, the target isolation probe or second probe located in the 5 ′ portion of the target sequence is hybridized to a hybridizing single stranded region and the 3 ′ end of the single stranded region. A flap probe similar to that described above with a double-stranded region that does not. The 5 ′ non-target sequence is removed by 5 ′ exonuclease digestion to provide a blunt or sticky end suitable for adapter ligation to the target sequence when a linear probe is used at the 5 ′ end of the target sequence. If a 'flap probe is used, a 5' flap endonuclease can be provided. For example, the blocking moiety is provided with modified nucleotides to prevent ligation of the adapter to the target isolation probe or the second probe. If exonuclease digestion of the 5 'end removes more or less than the 5' non-target sequence, an additional step of filling in the sticky ends prior to ligation of the 5 'adapter can be used.

前述の方法の態様のいずれにおいても、3’アダプター及び任意選択的に5’アダプターは、ヘアピンアダプターであってもよい。ヘアピンアダプターの使用は、標的配列の末端を決定する標的単離プローブ又は第二のプローブがヘアピンアダプターの一方の末端に共有結合され得、標的配列はヘアピンアダプターのもう一端に共有結合されるような、さらなる利点をもたらす。変性条件下で、一本鎖核酸は、標的配列の、プライムされた増幅(primed amplification)を開始するために利用可能なアダプター配列を生じる。   In any of the foregoing method embodiments, the 3 'adapter and optionally the 5' adapter may be a hairpin adapter. The use of a hairpin adapter is such that a target isolation probe or second probe that determines the end of the target sequence can be covalently attached to one end of the hairpin adapter such that the target sequence is covalently attached to the other end of the hairpin adapter. , Bring additional benefits. Under denaturing conditions, the single stranded nucleic acid yields an adapter sequence that can be used to initiate primed amplification of the target sequence.

本方法の一態様において、5’エキソヌクレアーゼ消化後に5’プローブを置換するように、標的単離配列の3’末端をポリメラーゼによって伸長させることができる。   In one embodiment of the method, the 3 'end of the target isolation sequence can be extended by a polymerase so as to displace the 5' probe after 5 'exonuclease digestion.

本発明の方法の態様において、アダプターは、標的配列の各末端及び直接又は増幅後に配列決定される標的配列にライゲートされる。シーケンシング反応におけるリード開始点は、標的配列の3’末端又はその近傍に存在し、標的配列をわかりにくくするか又は標的配列における重大な突然変異をわかりにくくするプライマーの懸念なしに標的配列中の各ヌクレオチドのシーケンシングを可能にする方法で、標的配列の5’末端又はその近傍で終結する。突然変異の例には、挿入、欠失又はヌクレオチド多型若しくは一塩基多型のうちの1以上が含まれる。このようにして、生物の突然変異と表現型との相関は、忠実に記録することができる。   In an embodiment of the method of the invention, the adapter is ligated to each end of the target sequence and to the target sequence that is sequenced directly or after amplification. The read start point in the sequencing reaction is at or near the 3 ′ end of the target sequence and can be found in the target sequence without concern for primers that obscure the target sequence or obscure significant mutations in the target sequence. Terminates at or near the 5 'end of the target sequence in a manner that allows sequencing of each nucleotide. Examples of mutations include one or more of insertions, deletions or nucleotide polymorphisms or single nucleotide polymorphisms. In this way, the correlation between organism mutations and phenotypes can be faithfully recorded.

標的配列の一方又は両方の末端での非標的配列の除去に因って、非標的配列の不必要なシーケンシング及び分析は回避される。概して、動物又は植物の抽出物を分析するための方法であって、抽出物から核酸サンプルを得ること;前述の標的配列について濃縮すること;及び濃縮された標的分子のヌクレオチド配列を得ることを含む方法が提供される。一態様において、濃縮された標的分子から得られるヌクレオチド配列は、3’末端の5つ未満の非標的ヌクレオチドか;又は標的配列の少なくとも90%を含む。シーケンシングの前に、標的配列は、標的配列の3’及び5’末端に位置するアダプター内の配列にハイブリダイズするプライマー配列を用いて、増幅することができる。標的配列が得られたら、それを用いて、原核生物又は真核生物から変化した表現型との配列変化の相関を確立することができる。   Due to the removal of the non-target sequence at one or both ends of the target sequence, unnecessary sequencing and analysis of the non-target sequence is avoided. In general, a method for analyzing an animal or plant extract comprising obtaining a nucleic acid sample from the extract; enriching for said target sequence; and obtaining a nucleotide sequence of the enriched target molecule A method is provided. In one embodiment, the nucleotide sequence obtained from the enriched target molecule comprises less than 5 non-target nucleotides at the 3 'end; or at least 90% of the target sequence. Prior to sequencing, the target sequence can be amplified using primer sequences that hybridize to sequences within the adapter located at the 3 'and 5' ends of the target sequence. Once the target sequence is obtained, it can be used to establish a correlation of sequence changes with altered phenotypes from prokaryotes or eukaryotes.

概して、核酸の集団から標的配列を濃縮するための方法であって、次の工程の1つ以上を含む方法が提供される:核酸の集団と、親和性結合ドメインを含む標的単離プローブとを溶液中で組み合わせる工程;標的単離プローブの一本鎖領域を、核酸の集団中の標的配列の全部又は一部にハイブリダイズさせる工程;標的単離プローブを捕捉ドメインと結合させ、非結合物質を除去することにより、標的配列を含有する集団からハイブリダイズされた核酸を選択的に固定化する工程;1以上の3’エキソヌクレアーゼ(例えばエキソヌクレアーゼI、エキソヌクレアーゼT)及び/又は3’エキソヌクレアーゼ活性を有する1以上のポリメラーゼによって、標的配列の3’末端から非標的配列を除去する工程。エキソヌクレアーゼ活性は、標的配列の3’末端及び標的単離プローブの5’末端に、標的配列の3’末端及び標的単離プローブの5’末端がその後アダプターとのライゲーションに適するようにする、平滑末端二重鎖(blunt ended duplex)又は付着端を生じさせることができる。標的単離プローブの3’末端を伸長させて、標的配列の5’末端に平滑末端又は付着端を形成することができ、ここで伸長工程は、例えばdUTPなどの修飾デオキシヌクレオチドの存在下で実施される。一態様では、本方法は、上に大まかに記載したすべての工程を含む。   In general, there is provided a method for enriching a target sequence from a population of nucleic acids comprising one or more of the following steps: a population of nucleic acids and a target isolation probe comprising an affinity binding domain. Combining in solution; hybridizing a single-stranded region of a target isolation probe to all or part of a target sequence in a population of nucleic acids; binding the target isolation probe to a capture domain, and Selectively immobilizing hybridized nucleic acids from the population containing the target sequence by removing; one or more 3 ′ exonucleases (eg, exonuclease I, exonuclease T) and / or 3 ′ exonucleases Removing non-target sequences from the 3 ′ end of the target sequence with one or more active polymerases. The exonuclease activity is smooth, allowing the 3 ′ end of the target sequence and the 5 ′ end of the target isolation probe to be suitable for subsequent ligation with the adapter. A blunt ended duplex or sticky end can be created. The 3 ′ end of the target isolation probe can be extended to form a blunt or sticky end at the 5 ′ end of the target sequence, where the extension step is performed in the presence of a modified deoxynucleotide such as dUTP, for example. Is done. In one aspect, the method includes all steps generally described above.

一態様において、上記の標的単離プローブの一本鎖領域は、標的配列の一部にハイブリダイズする。一態様において、前記部分は、標的配列の3’末端に配置される。別の態様では、親和性結合ドメインは、標的単離プローブの3’末端と5’末端の間に配置される。別の態様では、標的単離プローブのエキソヌクレアーゼ分解を防ぐために、標的単離プローブは、その3’末端及び/又はその5’末端において修飾される。別の態様では、標的単離プローブの3’末端でのライゲーションを防ぐために、標的単離プローブは、その3’末端で修飾される。別の態様では、5’末端での標的単離プローブのポリメラーゼ伸長を防ぐために、標的単離プローブは、その5’末端で修飾され、修飾は例えば、インバーテッド塩基(inverted base)、炭素リンカー、ホスホロチオエート結合又はジデオキシヌクレオチドから選択される。一態様において、増幅を防ぐために、標的単離プローブは、デオキシウラシル、内部炭素リンカー又は1以上のリボヌクレオチドを含有するように修飾される。   In one embodiment, the single stranded region of the target isolation probe hybridizes to a portion of the target sequence. In one embodiment, the moiety is located at the 3 'end of the target sequence. In another aspect, the affinity binding domain is located between the 3 'and 5' ends of the target isolation probe. In another aspect, the target isolation probe is modified at its 3 'end and / or at its 5' end to prevent exonuclease degradation of the target isolation probe. In another aspect, the target isolation probe is modified at its 3 'end to prevent ligation at the 3' end of the target isolation probe. In another aspect, the target isolation probe is modified at its 5 ′ end to prevent polymerase extension of the target isolation probe at the 5 ′ end, such as an inverted base, carbon linker, Selected from phosphorothioate linkages or dideoxynucleotides. In one aspect, to prevent amplification, the target isolation probe is modified to contain deoxyuracil, an internal carbon linker, or one or more ribonucleotides.

一態様では、二重鎖アダプターかヘアピンアダプターの二重鎖領域のいずれかが、標的配列の3’末端(3’アダプター)に、任意選択的に標的単離プローブの5’末端にライゲートされる。別の態様では、二重鎖アダプターかヘアピンアダプターの二重鎖領域のいずれかが、標的配列の5’末端(5’アダプター)に、場合によって標的単離プローブの3’末端にライゲートされる。   In one aspect, either the duplex adapter or the duplex region of the hairpin adapter is ligated to the 3 ′ end of the target sequence (3 ′ adapter), optionally to the 5 ′ end of the target isolation probe. . In another embodiment, either the duplex adapter or the duplex region of the hairpin adapter is ligated to the 5 'end of the target sequence (5' adapter) and optionally to the 3 'end of the target isolation probe.

一態様では、アダプターは、NGSプラットフォーム特異的アダプター、単一ヌクレオチドオーバーハングを含有するアダプター、切断可能部位を有するY構造若しくはヘアピンアダプター、完全に相補的な二本鎖DNA(dsDNA)アダプター、又はライゲーション接合部の反対側に一本鎖DNA(ssDNA)オーバーハングを有するdsDNAアダプターであり得る。別の態様では、3’アダプターの3’末端(標的配列の3’末端に連結するアダプター)は、ジデオキシヌクレオチドを含有することができ;及び/又は標的配列の3’末端へのライゲーションが意図されるアダプターの5’末端は、リン酸基を欠いており;及び/又は標的へのライゲーションが意図されていないアダプターの5’末端若しくは3’末端は、インバーテッドヌクレオチド(inverted nucleotide)を含有する。別の態様では、アダプター配列は、シーケンシングプライマー部位、ライブラリー増幅プライマー部位、一意なサンプル識別子、及び一意な分子識別子配列のうちの少なくとも1つを含む。   In one aspect, the adapter is an NGS platform specific adapter, an adapter containing a single nucleotide overhang, a Y structure or hairpin adapter with a cleavable site, a fully complementary double stranded DNA (dsDNA) adapter, or ligation It can be a dsDNA adapter with a single-stranded DNA (ssDNA) overhang on the opposite side of the junction. In another aspect, the 3 ′ end of the 3 ′ adapter (adapter linked to the 3 ′ end of the target sequence) can contain dideoxynucleotides; and / or ligation to the 3 ′ end of the target sequence is contemplated. The 5 ′ end of the adapter lacks a phosphate group; and / or the 5 ′ or 3 ′ end of the adapter that is not intended to be ligated to the target contains inverted nucleotides. In another aspect, the adapter sequence comprises at least one of a sequencing primer site, a library amplification primer site, a unique sample identifier, and a unique molecular identifier sequence.

別の態様では、本方法は、アダプターにライゲートされた標的配列を増幅することを含む。増幅反応は、シーケンシングプラットフォームにより必要とされる配列などの、追加の配列をアダプターにライゲートされた標的に追加するプライマーを用いて実施することができる。標的配列は、定量され、配列決定され得る。   In another aspect, the method includes amplifying the target sequence ligated to the adapter. Amplification reactions can be performed with primers that add additional sequences to the target ligated to the adapter, such as those required by the sequencing platform. The target sequence can be quantified and sequenced.

標的選択及び濃縮のための方法の概略図を示す。(1)は、一本鎖核酸又は熱変性二本鎖核酸の一本の鎖を示す。(2)は、(1)にハイブリダイズされた、標的単離プローブの3’末端と5’末端の間の位置であるが3’及び5’末端ではない位置で親和性ドメイン(

Figure 2017537657
)に共有結合された標的単離プローブを示す。ここで、標的単離プローブは、標的核酸配列の全長にハイブリダイズされる。標的単離プローブは、エキソヌクレアーゼ分解、ライゲーション、及び/又はポリメラーゼ伸長を防ぐために、3’及び5’末端の一方又は両方に修飾を含むことができる。修飾には、次のうちの1以上が含まれ得る:インバーテッド塩基;炭素リンカー;ホスホロチオエート結合;及びジデオキシヌクレオチド。さらに、内部修飾としては、標的単離プローブの増幅を防ぐために、もう1つのdU又は1以上のリボヌクレオチドなどが含まれ得る。(3)は、捕捉ドメイン(
Figure 2017537657
)への(2)の結合を示す。捕捉ドメインに結合していない核酸は、洗浄によって除去される。(4)は、標的分子/標的単離プローブ二重鎖の3’及び5’末端の両方に二本鎖平滑末端をもたらす、1以上の3’及び5’一本鎖DNAエキソヌクレアーゼ若しくはRNAエキソヌクレアーゼによる消化産物に該当する。3’及び5’消化は、共に又は連続して実施することができる。消化後、酵素及び緩衝液は、洗い流される。(5)は、アダプターが標的配列の各末端にライゲートされている標的核酸を示す。標的単離プローブへのライゲーションは、遮断される。ここで用いられるアダプターは、DNA標的についてはT4 DNAリガーゼなどのDNAリガーゼを、又はRNA標的についてはT4 RNAリガーゼ2などのRNAリガーゼを使用して末端にライゲートされるNGSプラットフォーム−特異的アダプター;単一ヌクレオチドオーバーハングを含むアダプター(クレノウ(エキソ−)を用いたdAのDNA標的上への付加など、単一ヌクレオチドによって伸長された3’末端にライゲートされている);一意配列が標的DNA又はRNAの3’及び5’末端に特異的に追加され得るように切断可能部位を有する、Y構造又はヘアピンアダプター;完全に相補的なdsDNAアダプター、又はライゲーション接合部の反対側の末端にssDNAオーバーハングを有するdsDNAアダプターであり得る。これらのアダプターは、標的単離プローブへのライゲーション及び/又はコンカテマー化を回避するために、標的核酸へのライゲーションが意図されていないアダプター終端上に、5’リン酸の非存在、インバーテッドヌクレオチド又はジデオキシヌクレオチドなどの1以上の修飾を含むことができる。標的DNAの3’末端にライゲートするアダプター鎖は、ライゲーションのために5’−リン酸を含有することができる。あるいは、プローブの3’末端及びそのアダプターの5’末端が修飾されないでライゲーションを阻害する場合、このアダプター鎖は、5’−リン酸を欠くことができる。この場合、プローブのアダプターへのライゲーションの後、ニックトランスレーションによってアダプター配列を標的の3’末端に追加することができる。次いで、ライゲートしていないアダプター、酵素、及び緩衝液は、洗い流される。一方又は両方のアダプターは、標的配列が由来する核酸サンプルを同定するための一意DNA配列(UID)又は核酸サンプルが由来する個々の生物を同定するためのバーコードを含有し得る。UID及び/又はバーコードの使用は、多重化反応におけるサンプルの確認及び同定を容易にする。(6)は、固体支持体からの溶出後にアダプターにライゲートされた標的分子の、任意選択的なPCR増幅の産物に該当する。PCR又はRT−PCRを用いる場合、PCRプライマーは、シーケンシングプラットフォームによって必要とされる配列などの追加の配列を追加することもでき、又はアダプターに相補的な配列を含有するだけでもよい。あるいは、アダプターにライゲートされた標的分子が親和性ドメインにより固定化され、ひいては捕捉ドメインに結合される場合、固定化された標的分子は、固体又は半固体マトリックスから溶液への溶出を必要とせず、増幅反応に直接加えることができる。次いで、得られたライブラリーを定量化し、配列決定することができる。
図1に記載の、標的の選択及び濃縮のための方法についての変形例を示す。図2A(7)-(11)は、図1中の(1)−(3)の続きである。(7)は、一本鎖核酸又は親和性ドメインを有する標的単離プローブが結合されており、次に捕捉ドメインに結合された熱変性ランダム核酸断片の一本の鎖を示し、ここで3’非標的核酸は、3’二本鎖平滑末端を残す、1以上の3’一本鎖DNAエキソヌクレアーゼ又はRNAエキソヌクレアーゼによって消化されている。消化後、酵素及び緩衝液を洗い流し、次いで3’末端に3’アダプターを付加する(8)。アダプターの構造は、(5)について記載したものと同じである。(9)は、標的核酸の5’末端又は標的核酸が凹陥するか若しくはオーバーハングを呈する末端で二本鎖の平滑末端を残す、1以上の5’一本鎖のDNAエキソヌクレアーゼ又はRNAエキソヌクレアーゼによる消化の産物を示す。消化後、酵素及び緩衝液は、洗い流される。標的分子の一部が付着末端を含有する場合、この末端は、DNAポリメラーゼ、RNAポリメラーゼ又は逆転写酵素によるプローブの3’末端の伸長又は消化によって平滑末端化され得る。伸長のために標準的なデオキシヌクレオチド又はリボヌクレオチドを使用することができ、又はデオキシウラシル三リン酸(dUTP)などの1以上の修飾されたヌクレオチド三リン酸(NTP)、例えば、デオキシウラシル三リン酸(dUTP)を含有する混合物を使用して、後に任意の伸長配列を消化することができる。平滑末端化した後、酵素及び緩衝液は、洗い流される。上記(5)について記載したような5’アダプターは、標的分子(10)の5’末端にライゲートされて、上記(6)について記載したようなPCR(11)を可能にする。別法として、図2Aに示す方法は、5’一本鎖核酸を除去し、まず5’アダプターのライゲーションの後、3’一本鎖核酸を除去し、3’アダプターのライゲーションを行うことにより実施することができる。図2Bは、図1に示す標的選択及び濃縮のための方法の変形例を示す。(12)は、(1)からの続きであり、フラッププローブである親和性ドメインに共有結合されたフラップ標的単離プローブを示し、標的単離プローブの3’末端は、標的に相補的ではなく、NGSプラットフォーム−特異的アダプター配列の一部又は全部を含有する二本鎖DNA領域を含有する。この二本鎖領域は、標的単離プローブの一本鎖領域の3’末端を、標的単離プローブの標的核酸へのハイブリダイゼーション前、最中又は後に、NGSアダプター配列に相補的な第二のオリゴヌクレオチドにハイブリダイズさせることにより形成することができる。あるいは、標的単離プローブは、切断可能部位を有するヘアピンを形成又はそれにライゲートされて、アダプター配列の一部又は全部にわたる二本鎖領域を生成し得る。二本鎖領域の3’末端は、標的単離プローブの3’末端で終結するか、又は1以上の塩基を越えて標的単離プローブへと伸長する。親和性ドメインは、ヘアピンプローブの3’末端を除いて、標的単離プローブ内の任意の位置に存在し得る。(12)の分子は、捕捉ドメイン(13)に固定化されている。(14)は、図2Aに記載のように達成されるアダプターライゲーション前の3’非標的核酸の消化産物を示す。標的分子上の5’一本鎖DNAは、FEN−1などのフラップエンドヌクレアーゼにより切断されて、標的核酸とベイトの二本鎖領域との間でニックを生成する。ニックは、T4 DNAリガーゼなどのリガーゼとライゲートされる。(15)は、図1に示す通り、標的の、任意選択のPCRの産物を示す。図2Cは、図1に記載の方法の変形例を示す。標的単離プローブにライゲートすることができない3’アダプター(例えば図1に記載のアダプターを参照)は、(4)の3’末端にライゲートされて(16)を生成する。(17)は、3’エキソヌクレアーゼ活性を有し、ジデオキシヌクレオチドなどの修飾を阻害するライゲーションを除去し、続いて3’アダプターを伸長して平滑末端を形成し、固定化された標的単離プローブから標的を放出することができるDNAポリメラーゼ又は逆転写酵素による、アダプターの3’末端の伸長産物を示す。標準的なデオキシヌクレオチド又はリボヌクレオチドを伸長のために用いることができ、又はdUTPなどの1以上の修飾NTPを含有する混合物を使用して、後に任意の伸長された配列を消化することができる。伸長後、酵素及び緩衝液は、洗い流される。(18)において、5’アダプター(例えば図1を参照)は、(17)の5’末端にライゲートされる。 1つのプローブとして標的単離プローブを利用し、第二のプローブとして小さな可変(ランダム)オリゴヌクレオチドを利用する標的選択及び濃縮のための2プローブ法を示す。(19)は、より大きな核酸の機械的又は酵素的断片化の結果として生じる熱変性断片の一本の鎖であり得る一本鎖核酸を示す。(20)は、標的配列の3’末端とハイブリダイズされ、親和性ドメインに共有結合された3’標的単離配列であり、親和性ドメインは標的単離プローブの5’末端でない位置にある。標的単離プローブは、エキソヌクレアーゼ分解、ライゲーション、及び/又はポリメラーゼ伸長を防ぐために、3’末端に修飾を含むことができる。修飾の例には、インバーテッド塩基、炭素リンカー、ホスホロチオエート結合、及びジデオキシヌクレオチドが含まれる。標的単離プローブは、エキソヌクレアーゼ分解を防ぐために、5’末端にホスホロチオエート結合などの修飾を含むことができる。さらに、内部修飾としては、プローブの増幅を防ぐために、もう1つのdU又は1以上のリボヌクレオチドなどが含まれ得る。(21)は、捕捉ドメインへの(20)の固定化を示す。捕捉ドメインに結合していない核酸は、洗浄によって除去される。(22)は、標的核酸/標的単離プローブ二重鎖の3’末端上に二本鎖平滑末端を残す、3’一本鎖DNAエキソヌクレアーゼ又はRNAエキソヌクレアーゼによる消化産物である。消化後、酵素及び緩衝液は、洗い流される。(23)は、3’標的配列及び標的単離プローブの5’末端に共有結合された切断可能部位(X)を有するヘアピンアダプターを示す。(24)は、(23)の標的核酸の5’領域にハイブリダイズされたランダムオリゴヌクレオチドを示す。(25)は、平滑末端を形成するためのDNAポリメラーゼ、RNAポリメラーゼ又は逆転写酵素によるランダムプライマーの3’末端の伸長産物である。標準的なデオキシヌクレオチド又はリボヌクレオチドを伸長のために用いることができ、又はdUTPなどの1以上の修飾dNTPを含有する混合物を使用して、後に任意の伸長された配列を消化することができる。平滑末端化した後、酵素及び緩衝液は、洗い流される。(26)は、(25)に5’アダプターが(例えば図1に記載のようにして)結合されたものである。(27)は、(26)の増幅産物である。 図4は、2つのプローブを利用する標的の単離及び濃縮のための方法を示す図であり、ここで第二のプローブは非ランダム配列を有する。(28)は、(19)−(23)の産物であり、ここで第二のプローブは、ランダム配列を有する4−10ヌクレオチドからなるオリゴヌクレオチドの代わりに、標的核酸の5’部分にハイブリダイズされる。5’プローブは、エキソヌクレアーゼ分解を防ぐために、5’末端にホスホロチオエート結合などの修飾を含むことができる。さらに、内部修飾としては、プローブの増幅を防ぐために、もう1つのdU又は1以上のリボヌクレオチドなどが含まれ得る。(29)では、5’非標的核酸は、1以上の5’一本鎖DNA又はRNAエキソヌクレアーゼにより除去されており、第二のプローブの3’末端の、任意選択の伸長又は消化がこれに続く。(30)は、5’アダプターの(29)への付加を示す。(31)は、(30)の増幅産物に該当する。代替的な態様では、図4に記載の方法は、最初に、親和性ドメインを含有する5’標的単離配列の標的核酸の5’部分におけるハイブリダイゼーション、それに続いて、非結合プローブの捕捉及び除去、5’非標的配列を除去するための5’エキソヌクレアーゼ消化、標的核酸の3’部分への3’第二プローブのハイブリダイゼーション前の5’アダプターのライゲーション及び1以上の3’エキソヌクレアーゼを用いた非標的配列の除去によって実施することができる。 図4に記載の2プローブ法の変形例を示す。図5Aは、工程(19)−(23)で始まり、それに工程(28)−(29)が続く方法を示す。(32)は、標的核酸配列の3’末端にライゲートされたアダプターを有する標的核酸に該当する。標的核酸は、3’標的単離プローブにハイブリダイズされ、親和性ドメインは、標的単離プローブ内(ただし3’又は5’末端ではない)で共有結合される。3’標的単離プローブは、エキソヌクレアーゼ分解を防ぐために、3’及び/又は5’末端にホスホロチオエート結合などの修飾を含むことができる。内部修飾としては、標的単離プローブの増幅を防ぐために、もう1つのdU又は1以上のリボヌクレオチドなどが含まれ得る。(33)は、5’プローブを置換し、5’アダプターがライゲートされる平滑末端を生成する、(32)における3’標的単離プローブの伸長産物を示す。(35)は、増幅産物を示す。図5Bは、2つのプローブを伴う標的選択及び濃縮のための方法の変形例を示す。工程(19)−(23)の後、(35)は、(図2Bに記載の)フラッププローブが親和性ドメインなしで標的領域の5’末端とハイブリダイズされる(23)に該当する。(36)は、FEN−1などのフラップエンドヌクレアーゼによる標的分子上での5’一本鎖核酸の切断後の(35)に該当し、標的核酸とプローブの二本鎖領域との間にニックを生成している。(37)では、(36)中のニックがT4 DNAリガーゼなどのリガーゼとライゲートされる。(37)は、溶出後の標的核酸の産物増幅である。5Bの変形例には、図2Bに記載のように、親和性ドメインを含有する5’標的単離プローブのハイブリダイゼーション、それに続くフラップエンドヌクレアーゼによる5’一本鎖核酸の捕捉及び除去、及び親和性ドメインが欠失した3’標的単離プローブのハイブリダイゼーションに先立つ、ニックのライゲーション、3’一本鎖核酸の除去及び3’アダプターのライゲーションが含まれる。図5Cは、2つのプローブを伴う標的選択及び濃縮のための方法の変形例を示す。(38)は、(19)の産物であり、親和性ドメインを含有する3’標的単離プローブと5プローブの両方又は3’プローブと親和性ドメインを含有する5’標的単離プローブの両方が単一反応において標的核酸配列にハイブリダイズされる。(39)では、標的単離配列上の親和性結合ドメインは、標的配列を固定化する捕捉ドメインに結合する。(40)は、標的核酸/標的単離プローブ二重鎖の3’及び5’両末端上に二本鎖平滑末端を残す、3’及び5’一本鎖DNAエキソヌクレアーゼ又はRNAエキソヌクレアーゼによる消化産物である。3’及び5’消化は、共に又は連続して実施することができる。消化後、酵素及び緩衝液は、洗い流される。(41)は、3’及び5’アダプターが付加されている(40)である。(42)は、(41)の増幅産物である。 図6A−Dは、3’平滑末端化の効率を表すABIシーケンサーについての断片分析を示す図である。図6Aは、3’−ビオチン化プローブにハイブリダイズされ、ストレプトアビジンビーズに結合し、20ntの3’オーバーハングを形成する5’−FAM−標識オリゴヌクレオチドを模式的に示す図である。図6Bは、断片分析のためのABIシーケンサーからのクロマトグラム上の対応するピークを示す。図6Cは、3’ssDNAエキソヌクレアーゼ処理後の平滑末端化された5’−FAM標識オリゴヌクレオチドを模式的に示す。図6Dは、図1Cに対応するピークを示す図であり、単一のピークが平滑末端化されたDNAの存在と相関する。 図7A−Dは、3’−FAM標識オリゴヌクレオチドを用いた5’平滑末端化の効率を示すシーケンサーについての断片分析を示す。3’−FAM標識オリゴは、5’−ビオチン化プローブにハイブリダイズされ、ストレプトアビジンビーズに結合されて、20ntの5’オーバーハングを形成する。5’ssDNAエキソヌクレアーゼによるインキュベーション後、それに続いてビーズ洗浄により酵素を除去し、FAM−標識オリゴをNaOH中で溶出し、断片分析のためのABIシーケンサーで実施する。図7及び図7Bは、出発物質を示す。図7C及び図7Dは、オーバーハングの消化の結果を示し、図中、平滑末端dsDNA、4塩基オーバーハング、及び8塩基オーバーハングに相関する三つのピークが見られる。 血小板由来成増殖因子受容体アルファ遺伝子(PDGFRA)中のエキソンの捕捉を示す。ビオチン化標的特異的プローブは、剪断されたJurkatゲノムDNA(gDNA)にハイブリダイズされた。標的配列は、ストレプトアビジンビーズへの結合により捕捉され、BW緩衝液中での洗浄がそれに続いた。3’エキソヌクレアーゼを添加してgDNA二重鎖であるプローブのgDNA3’を除去し、その結果、プローブの5’末端が標的の3’末端を決定した。3’dA−テーリング及びアダプターライゲーションの後、ランダムプライマーは、ハイブリダイズされ、伸長されて5’平滑末端を形成し、5’アダプターのライゲーションがそれに続いた。ライブラリーは、PCRによって増幅され、Illumina MiSeq(登録商標)システム(カリフォルニア州サンディエゴのIllumina)で配列決定された。プラス及びマイナス鎖上の固定された3’末端及びランダム5’末端によるPDGFRA標的の捕捉を示す。 線維芽細胞増殖因子受容体遺伝子(FGFR2)中のエキソンの捕捉を示す。ビオチン化標的特異的プローブは、剪断されたJurkat gDNAにハイブリダイズされた。標的は、ストレプトアビジンビーズへの結合により捕捉され、Bind and Wash(BW)緩衝液中での洗浄がそれに続いた。3’エキソヌクレアーゼを添加して3’非標的gDNAを除去し、ここでプローブの5’末端が標的の3’末端を決定した。3’dA−テーリング及びアダプターライゲーションの後、標的特異的5’プローブは、標的配列にハイブリダイズされ、5’ssDNAは、平滑末端又は小さな5’オーバーハングのいずれかを残すエキソヌクレアーゼにより消化された。プローブは、DNAポリメラーゼによって伸長されて平滑末端を形成し、5’アダプターのライゲーションがこれに続いた。標的配列は、PCRによって増幅され、Illumina MiSeqで配列決定された。FGFR2標的配列の捕捉は、プラス及びマイナス鎖上の固定された3’及び5’末端により示される。 標的選択及び濃縮のための方法の概略図を示す。 (1)は、一本鎖核酸又は熱変性二本鎖核酸の一本の鎖を示す。(2)は、(1)にハイブリダイズされた標的単離プローブの3’末端と5’末端の間の位置であるが3’及び5’末端ではない位置で親和性ドメイン(
Figure 2017537657
)に共有結合した標的単離プローブを示す。ここで、標的単離プローブは、標的核酸配列の3’末端にハイブリダイズされる。標的単離プローブは、エキソヌクレアーゼ分解、ライゲーション、及び/又はポリメラーゼ伸長を防ぐために、3’及び5’末端の一方又は両方に修飾を含むことができる。修飾には、次のうちの1以上が含まれ得る:インバーテッド塩基;炭素リンカー;ホスホロチオエート結合;及びジデオキシヌクレオチド。さらに、内部修飾としては、標的単離プローブの増幅を防ぐために、もう1つのdU、内部炭素リンカー又は1以上のリボヌクレオチドなどが含まれ得る。(3)は、捕捉ドメイン(
Figure 2017537657
)への(2)の結合を示す。捕捉ドメインに結合していない核酸は、洗浄によって除去される。(4)は、標的分子/標的単離プローブ二重鎖の3’末端上に二本鎖平滑末端をもたらす、一本鎖DNAを切断可能な3’エキソヌクレアーゼ活性を有する1以上の酵素による消化産物に該当する。3’エキソヌクレアーゼを有する酵素は、エキソヌクレアーゼI、エキソヌクレアーゼT、又は3’エキソヌクレアーゼ活性を有する1以上のDNAポリメラーゼを含み得る。消化後、酵素及び緩衝液は、洗い流される。(5)は、アダプターが標的配列の3’末端にライゲートされている標的核酸を示す。ここで使用されるアダプターは、DNA標的についてはT4 DNAリガーゼなどのDNAリガーゼを、RNA標的についてはT4 RNAリガーゼ2などのRNAリガーゼを使用して末端にライゲートされるNGSプラットフォーム特異的アダプター;単一ヌクレオチドオーバーハングを含むアダプター(この場合、アダプターのライゲーションの前に、クレノウ(エキソ−)などの3’エキソヌクレアーゼ活性を欠くDNAポリメラーゼによって単一の非鋳型ヌクレオチドが標的に添加されるであろう);一意であるように切断可能部位を有するY構造又はヘアピンアダプター;完全に相補的なdsDNAアダプター、又はライゲーション接合部の反対側の末端にssDNAオーバーハングを有するdsDNAアダプターであり得る。このアダプターは、標的単離プローブへのライゲーション及び/又はコンカテマー化を回避するために、標的核酸へのライゲーションが意図されていないアダプター終端上に、ジデオキシヌクレオチド、5’リン酸の非存在又はインバーテッドヌクレオチドなどの1以上の修飾を含むことができる。標的DNAの3’末端にライゲートするアダプター鎖は、ライゲーションのために5’−リン酸を含有することができる。あるいは、プローブの3’末端及びそのアダプターの5’末端が修飾されないでライゲーションを阻害する場合、このアダプター鎖は、5’−リン酸を欠くことができる。この場合、プローブのアダプターへのライゲーションの後、ニックトランスレーションによってアダプター配列を標的の3’末端に追加することができる。次いで、ライゲートしていないアダプター、酵素、及び緩衝液は、洗い流される。アダプターは、標的配列が由来する核酸サンプルを同定するためのUID又は核酸サンプルが由来する個々の生物を同定するためのバーコードを含有し得る。UID及び/又はバーコードの使用は、多重化反応におけるサンプルの確認及び同定を容易にする。(6)は、3’エキソヌクレアーゼ活性を有するポリメラーゼを用いて平滑末端を形成するか、又は3’エキソヌクレアーゼ活性なしのポリメラーゼを用いて単一ヌクレオチドの3’オーバーハングを有する末端を形成するための、DNAポリメラーゼによるプローブの3’伸長に該当する。伸長は、標準的なデオキシヌクレオチドを用いて実施することができ、又は修飾デオキシヌクレオチド(例えばdUTP)を含有することができる。dUTPなどの修飾デオキシヌクレオチドの使用は、PCR増幅に先立って伸長産物の除去を可能にする。(7)は、アダプターが標的配列の5’末端にライゲートされている標的核酸を示す。ここで用いられるアダプターは、DNA標的についてはT4 DNAリガーゼなどのDNAリガーゼを、又はRNA標的についてはT4 RNAリガーゼ2などのRNAリガーゼを使用して末端にライゲートされるNGSプラットフォーム−特異的アダプター;単一ヌクレオチドオーバーハングを含むアダプター(クレノウ(エキソ−)を用いた非鋳型ヌクレオチドのDNA標的上への添加など、単一ヌクレオチドによって伸長された3’末端にライゲートされている);一意であるように切断可能部位を有する、Y構造又はヘアピンアダプター;完全に相補的なdsDNAアダプター、又はライゲーション接合部の反対側の末端にssDNAオーバーハングを有するdsDNAアダプターであり得る。このアダプターは、標的単離プローブへのライゲーション及び/又はコンカテマー化を回避するために、標的核酸へのライゲーションが意図されていないアダプター終端上に、ジデオキシヌクレオチド、5’リン酸の欠失又はインバーテッドヌクレオチドなどの1以上の修飾を含むことができる。次いで、ライゲートしていないアダプター、酵素、及び緩衝液は、洗い流される。アダプターは、標的配列が由来する核酸サンプルを同定するためのUID又は核酸サンプルが由来する個々の生物を同定するためのバーコードを含有し得る。UID及び/又はバーコードの使用は、多重化反応におけるサンプルの確認及び同定を容易にする。任意選択のPCR増幅は、固体支持体からの溶出後にアダプターにライゲートされた標的分子を使用して実施することができる。PCR又はRT−PCRを用いる場合、PCRプライマーは、シーケンシングプラットフォームによって必要とされる配列などの追加の配列を追加することもでき、又はアダプターに相補的な配列を含有するだけでもよい。あるいは、アダプターにライゲートされた標的分子が親和性ドメインにより固定化され、ひいては捕捉ドメインに結合される場合、固定化された標的分子は、固体又は半固体マトリックスから溶液への溶出を必要とせず、増幅反応に直接加えることができる。次いで、得られたライブラリーを定量化し、配列決定することができる。 FIG. 2 shows a schematic diagram of a method for target selection and enrichment. (1) shows a single strand of a single-stranded nucleic acid or a heat-denatured double-stranded nucleic acid. (2) is an affinity domain (3) between the 3 ′ and 5 ′ ends of the target isolation probe but not the 3 ′ and 5 ′ ends hybridized to (1).
Figure 2017537657
) Shows the target isolation probe covalently bound. Here, the target isolation probe is hybridized to the full length of the target nucleic acid sequence. Target isolation probes can include modifications at one or both of the 3 ′ and 5 ′ ends to prevent exonuclease degradation, ligation, and / or polymerase extension. Modifications can include one or more of the following: inverted base; carbon linker; phosphorothioate linkage; and dideoxynucleotide. Furthermore, internal modifications can include another dU or one or more ribonucleotides, etc. to prevent amplification of the target isolation probe. (3) is the capture domain (
Figure 2017537657
) Shows the binding of (2). Nucleic acids that are not bound to the capture domain are removed by washing. (4) One or more 3 ′ and 5 ′ single-stranded DNA exonucleases or RNA exos that provide double-stranded blunt ends at both the 3 ′ and 5 ′ ends of the target molecule / target isolation probe duplex Corresponds to nuclease digestion product. The 3 ′ and 5 ′ digestion can be performed together or sequentially. After digestion, the enzyme and buffer are washed away. (5) shows a target nucleic acid in which an adapter is ligated to each end of the target sequence. Ligation to the target isolation probe is blocked. The adapters used here are NGS platform-specific adapters ligated to the ends using DNA ligases such as T4 DNA ligase for DNA targets or RNA ligases such as T4 RNA ligase 2 for RNA targets; An adapter containing a single nucleotide overhang (ligated to the 3 'end extended by a single nucleotide, such as the addition of dA onto a DNA target using Klenow (exo-)); a unique sequence is the target DNA or RNA Y structure or hairpin adapter with a cleavable site so that it can be specifically added to the 3 ′ and 5 ′ ends of the DNA; a fully complementary dsDNA adapter, or a ssDNA overhang at the opposite end of the ligation junction DsDNA adapter with That. These adapters can be used to avoid ligation to target isolation probes and / or concatemerization on the end of the adapter that is not intended to be ligated to the target nucleic acid, One or more modifications such as dideoxynucleotides can be included. The adapter strand that is ligated to the 3 ′ end of the target DNA can contain 5′-phosphate for ligation. Alternatively, the adapter strand can lack 5'-phosphate if the 3 'end of the probe and the 5' end of its adapter are not modified to inhibit ligation. In this case, after ligation of the probe to the adapter, the adapter sequence can be added to the 3 ′ end of the target by nick translation. The unligated adapter, enzyme, and buffer are then washed away. One or both adapters may contain a unique DNA sequence (UID) for identifying the nucleic acid sample from which the target sequence is derived or a barcode for identifying the individual organism from which the nucleic acid sample is derived. The use of a UID and / or barcode facilitates sample confirmation and identification in a multiplexing reaction. (6) corresponds to the product of optional PCR amplification of the target molecule ligated to the adapter after elution from the solid support. When using PCR or RT-PCR, the PCR primers can add additional sequences, such as those required by the sequencing platform, or may only contain sequences complementary to the adapter. Alternatively, if the target molecule ligated to the adapter is immobilized by the affinity domain and thus bound to the capture domain, the immobilized target molecule does not require elution from a solid or semi-solid matrix into solution; It can be added directly to the amplification reaction. The resulting library can then be quantified and sequenced.
2 shows a variation on the method for target selection and enrichment described in FIG. 2A (7)-(11) is a continuation of (1)-(3) in FIG. (7) shows a single strand of a heat-denatured random nucleic acid fragment to which a target isolation probe having a single-stranded nucleic acid or affinity domain is bound and then bound to a capture domain, where 3 ′ Non-target nucleic acids have been digested with one or more 3 ′ single stranded DNA exonucleases or RNA exonucleases leaving a 3 ′ double stranded blunt end. After digestion, the enzyme and buffer are washed away and then a 3 ′ adapter is added to the 3 ′ end (8). The structure of the adapter is the same as that described for (5). (9) one or more 5 ′ single-stranded DNA exonucleases or RNA exonucleases that leave double-stranded blunt ends at the 5 ′ end of the target nucleic acid or at the end where the target nucleic acid is recessed or overhangs Shows the product of digestion by. After digestion, the enzyme and buffer are washed away. If part of the target molecule contains a sticky end, this end can be blunted by extension or digestion of the 3 ′ end of the probe with DNA polymerase, RNA polymerase or reverse transcriptase. Standard deoxynucleotides or ribonucleotides can be used for extension, or one or more modified nucleotide triphosphates (NTPs) such as deoxyuracil triphosphate (dUTP), for example deoxyuracil triphosphate Any extension sequence can later be digested using a mixture containing acid (dUTP). After blunting, the enzyme and buffer are washed away. The 5 ′ adapter as described for (5) above is ligated to the 5 ′ end of the target molecule (10) to allow PCR (11) as described for (6) above. Alternatively, the method shown in FIG. 2A is performed by removing the 5 ′ single stranded nucleic acid, first ligating the 5 ′ adapter, then removing the 3 ′ single stranded nucleic acid and ligating the 3 ′ adapter. can do. FIG. 2B shows a variation of the method for target selection and enrichment shown in FIG. (12) is a continuation from (1) showing a flap target isolation probe covalently linked to an affinity domain that is a flap probe, wherein the 3 ′ end of the target isolation probe is not complementary to the target , Containing a double-stranded DNA region containing part or all of the NGS platform-specific adapter sequence. This double stranded region is a second region complementary to the NGS adapter sequence at the 3 ′ end of the single stranded region of the target isolation probe before, during or after hybridization of the target isolation probe to the target nucleic acid. It can be formed by hybridizing to an oligonucleotide. Alternatively, the target isolation probe can form or be ligated to a hairpin with a cleavable site to generate a double stranded region spanning part or all of the adapter sequence. The 3 ′ end of the double stranded region terminates at the 3 ′ end of the target isolation probe or extends beyond one or more bases into the target isolation probe. The affinity domain can be present at any position within the target isolation probe except for the 3 ′ end of the hairpin probe. The molecule (12) is immobilized on the capture domain (13). (14) shows the digestion product of the 3 ′ non-target nucleic acid before adapter ligation achieved as described in FIG. 2A. The 5 ′ single stranded DNA on the target molecule is cleaved by a flap endonuclease such as FEN-1 to generate a nick between the target nucleic acid and the bait double stranded region. Nick is ligated with a ligase such as T4 DNA ligase. (15) shows the target, optional PCR product as shown in FIG. FIG. 2C shows a variation of the method described in FIG. A 3 ′ adapter that cannot be ligated to the target isolation probe (see, eg, the adapter described in FIG. 1) is ligated to the 3 ′ end of (4) to generate (16). (17) has a 3 ′ exonuclease activity, removes a ligation that inhibits modifications such as dideoxynucleotides, and subsequently extends a 3 ′ adapter to form a blunt end, thereby immobilizing the target isolation probe The extension product of the 3 ′ end of the adapter by DNA polymerase or reverse transcriptase capable of releasing the target from is shown. Standard deoxynucleotides or ribonucleotides can be used for extension, or a mixture containing one or more modified NTPs such as dUTP can be used to later digest any extended sequence. After extension, the enzyme and buffer are washed away. In (18), a 5 ′ adapter (see, eg, FIG. 1) is ligated to the 5 ′ end of (17). 2 shows a two-probe method for target selection and enrichment utilizing a target isolation probe as one probe and a small variable (random) oligonucleotide as the second probe. (19) shows a single stranded nucleic acid that can be a single strand of a heat-denatured fragment resulting from mechanical or enzymatic fragmentation of a larger nucleic acid. (20) is a 3 ′ target isolated sequence that is hybridized to the 3 ′ end of the target sequence and covalently linked to the affinity domain, where the affinity domain is not at the 5 ′ end of the target isolated probe. Target isolation probes can include modifications at the 3 ′ end to prevent exonuclease degradation, ligation, and / or polymerase extension. Examples of modifications include inverted bases, carbon linkers, phosphorothioate linkages, and dideoxynucleotides. Target isolation probes can include modifications such as phosphorothioate linkages at the 5 ′ end to prevent exonuclease degradation. Furthermore, internal modifications can include another dU or one or more ribonucleotides, etc. to prevent probe amplification. (21) shows immobilization of (20) to the capture domain. Nucleic acids that are not bound to the capture domain are removed by washing. (22) is a digestion product by 3 ′ single-stranded DNA exonuclease or RNA exonuclease leaving a double-stranded blunt end on the 3 ′ end of the target nucleic acid / target isolation probe duplex. After digestion, the enzyme and buffer are washed away. (23) shows a hairpin adapter having a 3 ′ target sequence and a cleavable site (X) covalently linked to the 5 ′ end of the target isolation probe. (24) shows a random oligonucleotide hybridized to the 5 ′ region of the target nucleic acid of (23). (25) is an extension product of the 3 ′ end of a random primer by DNA polymerase, RNA polymerase or reverse transcriptase to form a blunt end. Standard deoxynucleotides or ribonucleotides can be used for extension, or a mixture containing one or more modified dNTPs, such as dUTP, can be used to later digest any extended sequence. After blunting, the enzyme and buffer are washed away. (26) is obtained by binding a 5 ′ adapter to (25) (for example, as described in FIG. 1). (27) is the amplification product of (26). FIG. 4 shows a method for target isolation and enrichment utilizing two probes, where the second probe has a non-random sequence. (28) is the product of (19)-(23), where the second probe hybridizes to the 5 ′ portion of the target nucleic acid instead of an oligonucleotide consisting of 4-10 nucleotides with a random sequence. Is done. The 5 ′ probe can include modifications such as phosphorothioate linkages at the 5 ′ end to prevent exonuclease degradation. Furthermore, internal modifications can include another dU or one or more ribonucleotides, etc. to prevent probe amplification. In (29), the 5 ′ non-target nucleic acid has been removed by one or more 5 ′ single-stranded DNA or RNA exonucleases, and the optional extension or digestion of the 3 ′ end of the second probe Continue. (30) shows the addition of a 5 ′ adapter to (29). (31) corresponds to the amplification product of (30). In an alternative embodiment, the method described in FIG. 4 first involves hybridization in the 5 ′ portion of the target nucleic acid of the 5 ′ target isolated sequence containing the affinity domain, followed by capture of unbound probe and Removal, 5 'exonuclease digestion to remove non-target sequences, ligation of 5' adapter prior to hybridization of 3 'second probe to 3' portion of target nucleic acid and one or more 3 'exonucleases This can be done by removing the non-target sequence used. 6 shows a modification of the two-probe method described in FIG. FIG. 5A shows a method starting with steps (19)-(23) followed by steps (28)-(29). (32) corresponds to a target nucleic acid having an adapter ligated to the 3 ′ end of the target nucleic acid sequence. The target nucleic acid is hybridized to the 3 ′ target isolation probe and the affinity domain is covalently linked within the target isolation probe (but not at the 3 ′ or 5 ′ end). The 3 ′ target isolation probe can include modifications such as phosphorothioate linkages at the 3 ′ and / or 5 ′ ends to prevent exonuclease degradation. Internal modifications can include another dU or one or more ribonucleotides to prevent amplification of the target isolation probe. (33) shows the extension product of the 3 ′ target isolation probe in (32) that displaces the 5 ′ probe and generates a blunt end to which the 5 ′ adapter is ligated. (35) shows the amplification product. FIG. 5B shows a variation of the method for target selection and enrichment with two probes. After steps (19)-(23), (35) corresponds to (23) where the flap probe (described in FIG. 2B) is hybridized to the 5 ′ end of the target region without an affinity domain. (36) corresponds to (35) after cleavage of the 5 ′ single-stranded nucleic acid on the target molecule by a flap endonuclease such as FEN-1, and a nick between the target nucleic acid and the double-stranded region of the probe. Is generated. In (37), the nick in (36) is ligated with a ligase such as T4 DNA ligase. (37) is product amplification of the target nucleic acid after elution. The 5B variant includes hybridization of a 5 ′ target isolation probe containing an affinity domain, followed by capture and removal of 5 ′ single stranded nucleic acid by a flap endonuclease, and affinity as described in FIG. 2B. Includes nick ligation, 3 ′ single stranded nucleic acid removal and 3 ′ adapter ligation prior to hybridization of the 3 ′ target isolation probe lacking the sex domain. FIG. 5C shows a variation of the method for target selection and enrichment with two probes. (38) is the product of (19) wherein both the 3 ′ target isolation probe containing the affinity domain and the 5 probe or both the 5 ′ target isolation probe containing the 3 ′ probe and the affinity domain Hybridized to the target nucleic acid sequence in a single reaction. In (39), the affinity binding domain on the target isolation sequence binds to a capture domain that immobilizes the target sequence. (40) Digestion with 3 ′ and 5 ′ single-stranded DNA exonuclease or RNA exonuclease leaving double-stranded blunt ends on both 3 ′ and 5 ′ ends of the target nucleic acid / target isolation probe duplex It is a product. The 3 ′ and 5 ′ digestion can be performed together or sequentially. After digestion, the enzyme and buffer are washed away. (41) is (40) to which 3 ′ and 5 ′ adapters are added. (42) is the amplification product of (41). Figures 6A-D are fragment analysis for ABI sequencers representing the efficiency of 3 'blunting. FIG. 6A schematically shows a 5′-FAM-labeled oligonucleotide hybridized to a 3′-biotinylated probe and bound to streptavidin beads to form a 20 nt 3 ′ overhang. FIG. 6B shows the corresponding peaks on the chromatogram from the ABI sequencer for fragment analysis. FIG. 6C schematically shows blunt-ended 5′-FAM labeled oligonucleotide after 3 ′ ssDNA exonuclease treatment. FIG. 6D shows a peak corresponding to FIG. 1C, where a single peak correlates with the presence of blunt-ended DNA. Figures 7A-D show fragment analysis for sequencers showing the efficiency of 5 'blunting using 3'-FAM labeled oligonucleotides. The 3′-FAM labeled oligo is hybridized to a 5′-biotinylated probe and bound to streptavidin beads to form a 20 nt 5 ′ overhang. Following incubation with 5 'ssDNA exonuclease, the enzyme is subsequently removed by bead washing and the FAM-labeled oligo is eluted in NaOH and run on an ABI sequencer for fragment analysis. 7 and 7B show the starting material. FIGS. 7C and 7D show the results of overhang digestion, in which three peaks correlated with blunt-ended dsDNA, 4-base overhang, and 8-base overhang are seen. FIG. 6 shows the capture of exons in the platelet derived growth factor receptor alpha gene (PDGFRA). Biotinylated target-specific probes were hybridized to sheared Jurkat genomic DNA (gDNA). The target sequence was captured by binding to streptavidin beads followed by washing in BW buffer. 3 'exonuclease was added to remove the gDNA 3' of the probe, which was a gDNA duplex, so that the 5 'end of the probe determined the 3' end of the target. After 3'dA-tailing and adapter ligation, random primers were hybridized and extended to form 5 'blunt ends, followed by ligation of 5' adapters. The library was amplified by PCR and sequenced with the Illumina MiSeq® system (Illumina, San Diego, Calif.). Shows capture of PDGFRA target by immobilized 3 ′ and random 5 ′ ends on the plus and minus strands. Figure 5 shows the capture of exons in the fibroblast growth factor receptor gene (FGFR2). Biotinylated target-specific probes were hybridized to sheared Jurkat gDNA. The target was captured by binding to streptavidin beads followed by washing in Bind and Wash (BW) buffer. 3 'exonuclease was added to remove 3' non-target gDNA, where the 5 'end of the probe determined the 3' end of the target. After 3'dA-tailing and adapter ligation, the target-specific 5 'probe was hybridized to the target sequence and the 5' ssDNA was digested with an exonuclease leaving either a blunt end or a small 5 'overhang. . The probe was extended by DNA polymerase to form blunt ends, followed by ligation of 5 'adapters. The target sequence was amplified by PCR and sequenced with Illumina MiSeq. Capture of the FGFR2 target sequence is indicated by immobilized 3 ′ and 5 ′ ends on the plus and minus strands. FIG. 2 shows a schematic diagram of a method for target selection and enrichment. (1) shows a single strand of a single-stranded nucleic acid or a heat-denatured double-stranded nucleic acid. (2) is an affinity domain (3) between the 3 ′ and 5 ′ ends of the target isolation probe hybridized to (1) but not at the 3 ′ and 5 ′ ends (
Figure 2017537657
) Shows the target isolation probe covalently bound. Here, the target isolation probe is hybridized to the 3 ′ end of the target nucleic acid sequence. Target isolation probes can include modifications at one or both of the 3 ′ and 5 ′ ends to prevent exonuclease degradation, ligation, and / or polymerase extension. Modifications can include one or more of the following: inverted base; carbon linker; phosphorothioate linkage; and dideoxynucleotide. Furthermore, internal modifications can include another dU, an internal carbon linker, or one or more ribonucleotides to prevent amplification of the target isolation probe. (3) is the capture domain (
Figure 2017537657
) Shows the binding of (2). Nucleic acids that are not bound to the capture domain are removed by washing. (4) Digestion with one or more enzymes having 3 ′ exonuclease activity capable of cleaving single-stranded DNA, resulting in a double-stranded blunt end on the 3 ′ end of the target molecule / target isolation probe duplex It corresponds to a product. The enzyme having a 3 ′ exonuclease may comprise exonuclease I, exonuclease T, or one or more DNA polymerases having 3 ′ exonuclease activity. After digestion, the enzyme and buffer are washed away. (5) shows the target nucleic acid in which the adapter is ligated to the 3 ′ end of the target sequence. The adapter used here is an NGS platform-specific adapter that is ligated to the end using a DNA ligase such as T4 DNA ligase for the DNA target and an RNA ligase such as T4 RNA ligase 2 for the RNA target; An adapter containing a nucleotide overhang (in this case, a single non-template nucleotide would be added to the target by a DNA polymerase lacking 3 'exonuclease activity such as Klenow (exo-) prior to ligation of the adapter) A Y structure or hairpin adapter with a cleavable site to be unique; a fully complementary dsDNA adapter, or a dsDNA adapter with a ssDNA overhang at the opposite end of the ligation junction. This adapter is a non-existent or inverted dideoxynucleotide, 5 'phosphate on adapter end that is not intended to be ligated to the target nucleic acid to avoid ligation and / or concatamerization to the target isolation probe. One or more modifications such as nucleotides can be included. The adapter strand that is ligated to the 3 ′ end of the target DNA can contain 5′-phosphate for ligation. Alternatively, the adapter strand can lack 5'-phosphate if the 3 'end of the probe and the 5' end of its adapter are not modified to inhibit ligation. In this case, after ligation of the probe to the adapter, the adapter sequence can be added to the 3 ′ end of the target by nick translation. The unligated adapter, enzyme, and buffer are then washed away. The adapter may contain a UID for identifying the nucleic acid sample from which the target sequence is derived or a barcode for identifying the individual organism from which the nucleic acid sample is derived. The use of a UID and / or barcode facilitates sample confirmation and identification in a multiplexing reaction. (6) To form blunt ends using a polymerase with 3 ′ exonuclease activity or to form ends with a single nucleotide 3 ′ overhang using a polymerase without 3 ′ exonuclease activity This corresponds to the 3 ′ extension of the probe by DNA polymerase. Extension can be performed using standard deoxynucleotides or can contain modified deoxynucleotides (eg, dUTP). The use of modified deoxynucleotides such as dUTP allows removal of extension products prior to PCR amplification. (7) shows the target nucleic acid in which the adapter is ligated to the 5 ′ end of the target sequence. The adapters used here are NGS platform-specific adapters ligated to the ends using DNA ligases such as T4 DNA ligase for DNA targets or RNA ligases such as T4 RNA ligase 2 for RNA targets; An adapter containing a single nucleotide overhang (ligated to the 3 ′ end extended by a single nucleotide, such as addition of non-templated nucleotides on the DNA target using Klenow (exo-)); to be unique It can be a Y structure or hairpin adapter with a cleavable site; a completely complementary dsDNA adapter, or a dsDNA adapter with a ssDNA overhang at the opposite end of the ligation junction. This adapter is a dideoxynucleotide, 5 'phosphate deletion or inverted on the adapter end that is not intended to be ligated to the target nucleic acid to avoid ligation and / or concatemerization to the target isolation probe. One or more modifications such as nucleotides can be included. The unligated adapter, enzyme, and buffer are then washed away. The adapter may contain a UID for identifying the nucleic acid sample from which the target sequence is derived or a barcode for identifying the individual organism from which the nucleic acid sample is derived. The use of a UID and / or barcode facilitates sample confirmation and identification in a multiplexing reaction. Optional PCR amplification can be performed using the target molecule ligated to the adapter after elution from the solid support. When using PCR or RT-PCR, the PCR primers can add additional sequences, such as those required by the sequencing platform, or may only contain sequences complementary to the adapter. Alternatively, if the target molecule ligated to the adapter is immobilized by the affinity domain and thus bound to the capture domain, the immobilized target molecule does not require elution from a solid or semi-solid matrix into solution; It can be added directly to the amplification reaction. The resulting library can then be quantified and sequenced.

本明細書に記載の方法及び組成物は、特に主張されていない限り、本明細書に記載された特定の方法又は試薬に限定することが意図されているのではなく、単に例として示されるにすぎない。説明のための例示的な用途に関して、いくつかの態様を後述する。方法ステップが当業者に周知の標準的な方法を伴う場合、そのような方法ステップは、詳述していない。本願では、特に断りのない限り、単数形の使用には複数形が含まれる。「含まれる(included)」は、限定するものではなく、「含む(comprising)」と同等の意味を有する。用語「約」又は「およそ」は、当業者によって決定される特定の値について許容される誤差の範囲内を意味し、これは、いかにしてその値が測定又は決定されるかに部分的に依存する。特定の値が本願及び特許請求の範囲に記載されている場合、用語「約」は、特に明記しない限り、特定の値について許容される誤差の範囲内を意味する。用語「近傍(の)」は、記載された特徴部に隣接している、又はその付近の位置を指す。例えば、プローブが標的配列の決定された末端にハイブリダイズするその位置に関して「近傍の」が使用される場合、用語「近傍の」は、記載された特徴部から10ヌクレオチド未満を指し得る。用語「遠位の」は、記載された特徴部の近傍の位置ではなく、その位置が近傍である場合よりも遠い部位にある位置を指す。   The methods and compositions described herein are not intended to be limited to the specific methods or reagents described herein, but are merely shown by way of example unless otherwise stated. Only. Several aspects are described below for exemplary applications for illustration. Where method steps involve standard methods well known to those skilled in the art, such method steps are not described in detail. In this application, the use of the singular includes the plural unless specifically stated otherwise. “Included” is not limiting and has the same meaning as “comprising”. The term “about” or “approximately” means within an acceptable error range for a particular value determined by one of ordinary skill in the art, which is partly how the value is measured or determined. Dependent. Where a particular value is recited in the present application and claims, the term “about” means within the allowable error range for the particular value, unless expressly specified otherwise. The term “near” refers to a location that is adjacent to or near the described feature. For example, if “neighboring” is used with respect to its position where the probe hybridizes to the determined end of the target sequence, the term “neighboring” may refer to less than 10 nucleotides from the described feature. The term “distal” refers to a location that is not at a location near the described feature, but at a site that is farther away than if the location is near.

概して、核酸サンプルから標的核酸配列を濃縮して、標的が濃縮された核酸ライブラリーを作製するための方法が、本明細書で提供される。核酸に関する「標的濃縮」という用語は、サンプル中の特定の核酸種の相対濃度を高めることを指すものとする。   In general, provided herein are methods for enriching a target nucleic acid sequence from a nucleic acid sample to create a target enriched nucleic acid library. The term “target enrichment” with respect to nucleic acids shall refer to increasing the relative concentration of a particular nucleic acid species in a sample.

本明細書に記載の濃縮法によって、次の特徴の1つ以上が達成され得る:二重鎖核酸の両方の標的鎖を分析して希少なSNPの信頼性を高めること;リード開始点を特定する能力、GC含有量に関わらず正規化されたプローブプールの生成、反復領域を標的化する能力、標的部位の検出の全体効率の改善、捕捉前の標的の喪失の回避、標的領域外のDNA損傷とは無関係の標的のライブラリー調製、標的領域にわたる複数のプローブの必要性の低減、プローブ対間のより大きな挿入及び欠失(インデル)の捕捉、最適なクラスター形成のための狭いサイズ分布内でのライブラリーの生成、標的配列に含有される非標的塩基のパーセンテージの低下;必要なシーケンスリード長及び必要なシーケンスカバレッジの深度の最小化、濃縮の均一性向上並びに煩雑さ及び時間の低減、及びハイブリダイゼーションに基づく既存の標的濃縮方法と比較したライブラリーの調製。   One or more of the following features may be achieved by the enrichment methods described herein: analyzing both target strands of a double-stranded nucleic acid to increase the reliability of rare SNPs; Ability to generate normalized probe pools regardless of GC content, ability to target repetitive regions, improve overall efficiency of target site detection, avoid loss of target before capture, DNA outside target region Library preparation of targets independent of damage, reduced need for multiple probes across the target region, capture of larger insertions and deletions (indels) between probe pairs, within narrow size distribution for optimal cluster formation Library generation, reduced percentage of non-target bases contained in the target sequence; minimization of required sequence read length and required sequence coverage depth, enrichment uniformity And reduction of the complexity and time, and preparation of library compared to existing methods of targeted concentration based on hybridization.

精製されてはいるが処理されていないか又は修飾されていない核酸は、本明細書において核酸サンプルと称される。核酸サンプルは、その中から標的配列又は標的分子が濃縮される集団中の核酸分子又は核酸の集団に任意選択的に断片化することができる。   A nucleic acid that has been purified but not processed or modified is referred to herein as a nucleic acid sample. Nucleic acid samples can optionally be fragmented into nucleic acid molecules or populations of nucleic acids in a population from which target sequences or target molecules are enriched.

本明細書で使用される「核酸サンプル」という用語は、標的及び非標的配列を含有する任意の供給源から得られたDNA若しくはRNA又はDNA及びRNA分子若しくは配列の混合物を指す。核酸サンプルは、例えば人工供給源から、又は化学合成によって、又はウイルス、微生物を含む原核細胞若しくは真核細胞から得ることができる。生体サンプルは、ヒトを含めた又はヒトを除く脊椎動物、無脊椎動物、植物、微生物、ウイルス、マイコプラズマ、真菌又は古細菌(ancient)であり得る。生体液には、血液、唾液、脳脊髄液、胸膜液、乳、リンパ液、痰、***、骨髄、細針吸引物等、固形物(例えば大便)が含まれる。真核細胞サンプルには、胚組織、生検組織若しくは死体組織、組織、組織培養、生検、臓器又は他の生物学的、農業的若しくは環境的な供給源が含まれる。核酸サンプルを得るためには、細胞はまず、例えば高速度で小さなビーズを使用することによって物理的に、又は例えば洗浄剤及び他の界面活性剤を使用することによって化学的に破壊するか又は分解することができる。アルコール又は他の化学物質を用いて、核酸を沈殿させることができる。   The term “nucleic acid sample” as used herein refers to DNA or RNA or a mixture of DNA and RNA molecules or sequences obtained from any source containing target and non-target sequences. Nucleic acid samples can be obtained, for example, from artificial sources or by chemical synthesis or from prokaryotic or eukaryotic cells, including viruses, microorganisms. The biological sample can be a vertebrate, including or excluding a human, an invertebrate, a plant, a microorganism, a virus, a mycoplasma, a fungus, or an archaeon. The biological fluid includes solids (for example, stool) such as blood, saliva, cerebrospinal fluid, pleural fluid, milk, lymph, sputum, semen, bone marrow, and fine needle aspirate. Eukaryotic cell samples include embryonic tissue, biopsy tissue or cadaver tissue, tissue, tissue culture, biopsy, organ or other biological, agricultural or environmental sources. To obtain a nucleic acid sample, the cells are first physically disrupted or degraded, for example, by using small beads at high speed, or by using, for example, detergents and other detergents. can do. Alcohol or other chemicals can be used to precipitate the nucleic acid.

核酸サンプルは、全ゲノム配列、ゲノム配列の一部、染色体配列、葉緑体配列、ミトコンドリア配列、ポリメラーゼ連鎖反応(PCR)産物、全ゲノム増幅産物又は「増幅」の下に列挙される他の増幅プロトコール、cDNA配列、mRNA配列、ノンコーディングRNA(ncRNA)又は全トランスクリプトーム配列、エキソン、長末端反復領域(LTR)、イントロン領域、及び制御配列を含み得る。これらの例は、本発明の態様に適用可能なサンプルの種類を限定するものと解釈されるべきではない。   A nucleic acid sample can be a whole genome sequence, a portion of a genome sequence, a chromosomal sequence, a chloroplast sequence, a mitochondrial sequence, a polymerase chain reaction (PCR) product, a whole genome amplification product or other amplification listed under “Amplification” It may include protocols, cDNA sequences, mRNA sequences, non-coding RNA (ncRNA) or full transcriptome sequences, exons, long terminal repeat regions (LTR), intron regions, and regulatory sequences. These examples should not be construed as limiting the sample types applicable to embodiments of the invention.

核酸サンプルは、集団中の核酸分子のサブセットが濃縮のための標的配列を含有し得る核酸の集団を生じ得る。核酸の集団は、例えば、酵素的、機械的又は化学的手段を用いるランダム切断の産物;制限酵素などの酵素を用いて一般に達成される非ランダム又はバイアス切断(biased cleavage)の産物;切断又は断片化が必要とされないような適切なサイズ;又は環境損傷の産物であり得る。核酸の集団は、標的濃縮のための標的単離プローブと組み合わせて用いられる。   A nucleic acid sample can give rise to a population of nucleic acids in which a subset of nucleic acid molecules in the population can contain a target sequence for enrichment. A population of nucleic acids can be, for example, a product of random cleavage using enzymatic, mechanical or chemical means; a product of non-random or biased cleavage generally achieved using an enzyme such as a restriction enzyme; May be of an appropriate size such that no crystallization is required; or the product of environmental damage. The population of nucleic acids is used in combination with a target isolation probe for target enrichment.

ランダム切断は、例えばFragmentase(登録商標)(マサチューセッツ州イプスウィッチのNew England Biolabs)、DNAse I及びBenzonase(登録商標)(ニュージャージー州ギブスタウンのEMD)又は他の種類のヌクレアーゼなど、単一のヌクレアーゼ又はそれらの組み合わせを含む酵素的方法によって達成することができる。Fragmentaseは、時間依存的にdsDNA切断をもたらして、100bpから800bpのDNA断片を生成するエンドヌクレアーゼである。Benzonaseは、セラチア属マルセッセンス(Serratia marcescens)由来の遺伝子操作されたエンドヌクレアーゼであり、DNAとRNAの両方を効率的に切断することができる。他の酵素的方法には、Vvnヌクレアーゼ単独又はセラチアヌクレアーゼ又はDNase I又は当技術分野の他のヌクレアーゼ、例えばShearaseTM(カリフォルニア州アーバインのZymo Research)又はIon ShearTM(ニューヨーク州グランドアイランドLife Technologies)の使用が含まれる。DNAが断片化後に変性するため、ニッキング酵素を用いることができる。 Random cleavage can be performed by a single nuclease such as Fragmentase® (New England Biolabs, Ipswich, Mass.), DNAse I and Benzonase® (EMD, Gibbstown, NJ) or other types of nucleases, It can be achieved by enzymatic methods involving combinations thereof. Fragmentase is an endonuclease that produces dsDNA cleavage in a time-dependent manner to generate DNA fragments from 100 bp to 800 bp. Benzonase is a genetically engineered endonuclease derived from Serratia marcescens and can efficiently cleave both DNA and RNA. Other enzymatic methods, other of Vvn nuclease alone or Serratia nuclease or DNase I or art nucleases, e.g. Shearase TM (CA Irvine Zymo Research) or Ion Shear TM (Grand Island Life Technologies, NY) Includes use. Nicking enzymes can be used because DNA is denatured after fragmentation.

化学的手段には、RNAを分解するためのマグネシウム又は亜鉛イオンの使用が含まれる。例えば、超音波処理、噴霧、物理的剪断及び加熱などの物理的手段を使用することができる。工業用の機械的剪断方法の例は、Covaris(マサチューセッツ州ウォバーン)によって提供されている。   Chemical means include the use of magnesium or zinc ions to degrade RNA. For example, physical means such as sonication, spraying, physical shearing and heating can be used. An example of an industrial mechanical shearing method is provided by Covaris (Woburn, Mass.).

環境的な核酸損傷は、例えば保存中に若しくは経年によって、あるいは化学的に誘発される切断、酵素によって誘発される切断又は温度若しくは時間の適用による切断などの断片化方法の適用によって生じ得る。用語「損傷DNA」は、別段の記載がない限り、任意のインデル、任意のSNP、エピジェネティックな制御に関連しない任意の修飾塩基、標的DNAに対する任意のさらなる修飾を指すことが意図されている。様々なタイプのDNA損傷が、参照により援用される米国特許第7700283号及び米国特許第8158388号に記載されている。DNA損傷の例は、保存された組織又は細胞から単離され、ホルマリン固定パラフィン包埋(FFPE)に起因して品質が低下したDNAである。集団中の核酸は、より大きな核酸の断片であってもそうでなくてもよい。   Environmental nucleic acid damage can occur, for example, during storage or by aging, or by application of fragmentation methods such as chemically induced cleavage, enzymatically induced cleavage or cleavage by application of temperature or time. The term “damaged DNA” is intended to refer to any indel, any SNP, any modified base not associated with epigenetic regulation, any further modification to the target DNA, unless otherwise stated. Various types of DNA damage are described in US Pat. No. 7,700,823 and US Pat. No. 8,158,388, incorporated by reference. An example of DNA damage is DNA isolated from preserved tissue or cells and of reduced quality due to formalin-fixed paraffin embedding (FFPE). The nucleic acids in the population may or may not be larger nucleic acid fragments.

標的配列は、核酸の集団において生じ得る。用語「標的配列」は、特別な科学的、医学的又は農業的関連性を有する核酸中の対象とする領域を一般に指す。「標的分子」は、プローブなどにハイブリダイズする独立した化学実体である。これらの用語は、互換可能に用いられる場合もあり、これらの用語の意味は、その用語が用いられる文脈によって明らかになるであろう。標的核酸がDNAである場合、gDNAなどの大きなDNAの断片は、標的配列が濃縮されている核酸の集団を部分的に又は実質的に形成することができる。この例では、対象とする標的配列は、核酸サンプルのサブセットのみであり、したがって濃縮が望ましい。   The target sequence can occur in a population of nucleic acids. The term “target sequence” generally refers to a region of interest in a nucleic acid having a particular scientific, medical or agricultural relevance. A “target molecule” is an independent chemical entity that hybridizes to a probe or the like. These terms are sometimes used interchangeably and the meaning of these terms will be apparent according to the context in which the term is used. When the target nucleic acid is DNA, large DNA fragments such as gDNA can partially or substantially form a population of nucleic acids enriched in the target sequence. In this example, the target sequence of interest is only a subset of the nucleic acid sample, and therefore enrichment is desirable.

標的配列は、核酸分子全体であっても核酸分子の一部であってもよい。標的配列は、エキソン配列、突然変異の周囲の核酸配列の短いストレッチ、1又は複数の反復配列、cDNA配列、イントロン配列及び制御配列のうちの1以上を含み得る。対象とする特徴の例には、単一のSNP、遺伝子融合、コピー数の変化、及び/又はインデルが含まれる。統計学的に意味がある場合、これらの特徴は、生物学的有意性のある表現型と相関する可能性がある。標的分子は、1つ以上の疾患、対象とする表現型、代謝経路の調節又は同族核酸若しくはその他の核酸に関連する配列を有し得る。標的分子は、DNA配列の連続的な領域又はDNA配列の集合(例えばcDNA配列)を含み得る。標的分子は、mRNA又はncRNAなどのRNA分子であってもよい。RNA標的分子の例には、リボソームRNA(rRNA)、メッセンジャーRNA(mRNA)、サイレンシングRNA(siRNA)、核内低分子RNA(snRNA)、マイクロRNA(miRNA)、短鎖干渉RNA(siRNA)又は長鎖非コードRNA(IncRNA)が含まれる。   The target sequence may be the entire nucleic acid molecule or a part of the nucleic acid molecule. The target sequence can include one or more of an exon sequence, a short stretch of nucleic acid sequence surrounding the mutation, one or more repetitive sequences, a cDNA sequence, an intron sequence, and a control sequence. Examples of features of interest include single SNPs, gene fusions, copy number changes, and / or indels. If statistically meaningful, these features may correlate with biologically significant phenotypes. The target molecule may have sequences related to one or more diseases, phenotypes of interest, regulation of metabolic pathways, or cognate or other nucleic acids. A target molecule can comprise a continuous region of DNA sequence or a collection of DNA sequences (eg, cDNA sequence). The target molecule may be an RNA molecule such as mRNA or ncRNA. Examples of RNA target molecules include ribosomal RNA (rRNA), messenger RNA (mRNA), silencing RNA (siRNA), small nuclear RNA (snRNA), microRNA (miRNA), short interfering RNA (siRNA) or Long non-coding RNA (IncRNA) is included.

核酸の集団中の個々の核酸は、一般に核酸の集団内に含有される標的配列と同じサイズか又はそれよりも大型である。集団中の核酸のサイズ又は標的配列のサイズに関して上限はない。しかしながら、大きな分子を取り扱う効率及び濃縮された標的配列を配列決定するシーケンシングプラットフォームの能力が、サイズを限定することはあり得る。大きな核酸中の標的配列、例えば生検サンプルからのウイルスゲノムは、5000ヌクレオチド(nt)の大きさであっても、10,000nt又はそれ以上の大きさであってもよい。標的配列の長さは、ゲノム又は大型mRNAにおいて生じる500ヌクレオチド未満であり得る。例えば、標的配列が100ntから200ntの範囲の場合、核酸の集団の個々のメンバーは、およそ500ntであり得る。インタクトなgDNA又はRNAは、標的濃縮に適したサイズに断片化することができる。標的配列の長さは、断片サイズを決定するための一つの基準である。例えば、標的配列は、完全な標的領域の捕捉に都合のよい長さである、少なくとも100bpから1000bpまで、例えば200bpから800bp、例えば300bpから700bp、例えば100bpから300bp、又は100bpから400bp、又は100bpから500bpであり得る。ほとんどのエキソンは、200bp未満である。本明細書に記載の方法は、修飾されたヌクレオシドを利用して、次の特徴の少なくとも1つを達成する:他の特徴の中でもとりわけ、ハイブリダイゼーション特異性又は二重鎖の安定性の増強、ヌクレアーゼ耐性の増加、酵素切断のための部位を導入すること、酵素ライゲーションを阻害すること、酵素伸長を阻害すること又はポリメラーゼの増幅を防止すること。   Individual nucleic acids in a population of nucleic acids are generally the same size or larger than the target sequence contained within the population of nucleic acids. There is no upper limit on the size of nucleic acids in the population or the size of the target sequence. However, the efficiency of handling large molecules and the ability of sequencing platforms to sequence enriched target sequences can limit size. Target sequences in large nucleic acids, such as viral genomes from biopsy samples, can be as large as 5000 nucleotides (nt), or as large as 10,000 nt. The length of the target sequence can be less than 500 nucleotides occurring in the genome or large mRNA. For example, if the target sequence ranges from 100 nt to 200 nt, the individual members of the population of nucleic acids can be approximately 500 nt. Intact gDNA or RNA can be fragmented to a size suitable for target enrichment. The length of the target sequence is one criterion for determining the fragment size. For example, the target sequence is at least 100 bp to 1000 bp, such as 200 bp to 800 bp, such as 300 bp to 700 bp, such as 100 bp to 300 bp, or 100 bp to 400 bp, or 100 bp, that is convenient length for capture of the complete target region. It can be 500 bp. Most exons are less than 200 bp. The methods described herein utilize modified nucleosides to achieve at least one of the following characteristics: among other characteristics, enhanced hybridization specificity or duplex stability, Increase nuclease resistance, introduce sites for enzyme cleavage, inhibit enzyme ligation, inhibit enzyme extension or prevent amplification of polymerase.

所期の目的に従って選択される修飾されたヌクレオシドの使用の例は、表1に記載されている。本明細書で使用される「ヌクレオシド」という用語は、例えばKornbergら、DNA Replication,2nd Ed.Freeman,San Francisco(1992)に記載されているような、2’−デオキシ及び2’−ヒドロキシル形態を含む天然のヌクレオシドを含む。ヌクレオシドに関して「類似体」又は「修飾されたヌクレオシド」は、例えばScheit,Nucleotide Analogs,John Wiley,New York(1980);Uhlmanら、Chemical Reviews,90:543−584(1990),Crookeら、Exp.Opin.Ther.Patents,6:855−870(1996);Mesmaekerら、Current Opinion in Structual Biology,5:343−355(1995)などに記載されている、修飾された塩基部分及び/又は修飾された糖部分を有する合成ヌクレオシドを含む。改善された二重鎖安定性を有するいくつかの又は多くの類似体を含むプローブ又はアダプターの使用には、オリゴヌクレオチドN3’−

Figure 2017537657
P5’ホスホルアミデート(本明細書において「アミデート」と称される)、ペプチド核酸(本明細書において「PNA」と称される)、オリゴ−2’−O−アルキルリボヌクレオチド、C−5プロピニルピリミジンを含有するポリヌクレオチド、ロックド核酸(「LNA」)、及び同様の化合物が含まれる。そのようなオリゴヌクレオチドは、市販されており、又は文献に記載の方法を用いて合成することができる。修飾されたヌクレオシド(例えばdU又は8−オキソ−G)を選択して、特異的な酵素(ウラシルデグリコシラーゼ又はエンドヌクレアーゼVIIIを有するfpg)による類似体の部位でのオリゴヌクレオチドの切断を可能にするか、又はDNAポリメラーゼ(例えばrNMP)による増幅を防ぐことができる。修飾されたヌクレオシドは、ライゲーションを可能にするか又はブロックするために、プローブ又はアダプターの終端に配置することもできる。例えば、ライゲーションが望まれない場合、プローブ又はアダプターの5’末端又はその両方が非リン酸化されても脱リン酸化されてもよく、また3’末端がジデオキシヌクレオシド、インバーテッドヌクレオシド又は付着部分を有するか又は有しない炭素リンカーでキャッピングされ得る。オリゴヌクレオチドの5’末端をリン酸で修飾することにより、ライゲーションが可能になる。さらに、ジデオキシヌクレオシド、インバーテッドヌクレオシド又は炭素リンカーを含むがこれらに限定されない3’修飾をプローブ又はアダプターに組み込んで、ポリメラーゼによる3’伸長を防ぐことができる。アダプター、プライマー、標的単離プローブ又は1以上のホスホチオエートのような第二のプローブ上の3’及び/又は5’修飾を利用して、エキソヌクレアーゼ消化を防ぐことができる。 Examples of the use of modified nucleosides selected according to the intended purpose are listed in Table 1. As used herein, the term “nucleoside” is described in, for example, Kornberg et al., DNA Replication, 2nd Ed. It includes natural nucleosides containing 2'-deoxy and 2'-hydroxyl forms as described in Freeman, San Francisco (1992). “Analogues” or “modified nucleosides” with respect to nucleosides are described, for example, by Scheit, Nucleotide Analogs, John Wiley, New York (1980); Uhlman et al., Chemical Reviews, 90: 543-584 (o), et al., 1990. Opin. Ther. Patents, 6: 855-870 (1996); having a modified base moiety and / or a modified sugar moiety, such as described in Mesmaeker et al., Current Opinion in Structural Biology, 5: 343-355 (1995). Contains synthetic nucleosides. For the use of probes or adapters containing some or many analogues with improved duplex stability, the oligonucleotide N3'-
Figure 2017537657
P5 ′ phosphoramidate (referred to herein as “amidate”), peptide nucleic acid (referred to herein as “PNA”), oligo-2′-O-alkyl ribonucleotide, C-5 Polynucleotides containing propynyl pyrimidine, locked nucleic acids ("LNA"), and similar compounds are included. Such oligonucleotides are commercially available or can be synthesized using methods described in the literature. A modified nucleoside (eg, dU or 8-oxo-G) is selected to allow cleavage of the oligonucleotide at the site of the analog by a specific enzyme (fpg with uracil deglycosylase or endonuclease VIII). Or amplification by a DNA polymerase (eg rNMP) can be prevented. The modified nucleoside can also be placed at the end of a probe or adapter to allow or block ligation. For example, if ligation is not desired, the 5 'end or both of the probe or adapter may be unphosphorylated or dephosphorylated, and the 3' end has a dideoxynucleoside, inverted nucleoside or attachment moiety. It can be capped with a carbon linker with or without. Ligation is possible by modifying the 5 'end of the oligonucleotide with phosphate. In addition, 3 ′ modifications, including but not limited to dideoxynucleosides, inverted nucleosides, or carbon linkers, can be incorporated into the probe or adapter to prevent 3 ′ extension by the polymerase. 3 ′ and / or 5 ′ modifications on a second probe such as an adapter, primer, target isolation probe or one or more phosphothioates can be utilized to prevent exonuclease digestion.

本方法の態様における修飾されたヌクレオシドの使用の具体例には、例えば図1、2A、2B、2C又は5Cに示すように、アダプターの3’末端でのライゲーションをブロックするためのジデオキシヌクレオシドの使用が含まれる。ライゲーションをブロックするための3’修飾を、図1及び5Cの標的単離プローブに加えることができる。第二のプローブ上の3’修飾は、図4及び図5A−Cに示すように、ライゲーションをブロックすることができる。図2Cのアダプターの3’末端及び図5Aに示す標的単離プローブの3’末端でのジデオキシ修飾されたヌクレオシドの添加は、ライゲーションを阻害するが、その後の、3’エキソヌクレアーゼ活性を有する逆転写酵素又はDNAポリメラーゼによる3’末端の伸長を可能にする。さらに、親和性ドメイン及び捕捉ドメインは、標的単離配列の3’終端ヌクレオチドに結合している大きな実体である(図3、4、5B及び5Cを参照)。3’末端の親和性結合分子は、プローブライゲーション及び伸長を防ぐための別個のブロッキング実体(blocking entity)として作用し得る。さらに、捕捉ドメインに結合された親和性結合分子は、図3、4、及び5B−Cに示すように、部分標的配列へのアダプターのライゲーションを立体的に阻止することができる。本方法の一態様において、3’プローブは、5’エキソヌクレアーゼ処理の前にアダプターにライゲートさせることができ、したがって5’エキソヌクレアーゼ活性から保護されるため、2プローブ法では、任意選択で5’リン酸化以外に5’修飾を必要としない。その一方、プローブの増幅可能なライブラリーへの変換を防ぐために、単一プローブ法では、プローブの3’末端上のライゲーションを防ぐことが望ましい。   Specific examples of the use of modified nucleosides in aspects of the method include the use of dideoxynucleosides to block ligation at the 3 ′ end of the adapter, for example as shown in FIGS. 1, 2A, 2B, 2C or 5C. Is included. A 3 'modification to block ligation can be added to the target isolation probe of Figures 1 and 5C. The 3 'modification on the second probe can block ligation as shown in Figures 4 and 5A-C. Addition of dideoxy modified nucleosides at the 3 ′ end of the adapter of FIG. 2C and at the 3 ′ end of the target isolation probe shown in FIG. 5A inhibits ligation but subsequent reverse transcription with 3 ′ exonuclease activity. Allows extension of the 3 ′ end by an enzyme or DNA polymerase. Furthermore, the affinity and capture domains are large entities that are bound to the 3 'terminal nucleotide of the target isolation sequence (see Figures 3, 4, 5B and 5C). The affinity binding molecule at the 3 'end can act as a separate blocking entity to prevent probe ligation and extension. Furthermore, affinity binding molecules attached to the capture domain can sterically block adapter ligation to partial target sequences, as shown in FIGS. 3, 4, and 5B-C. In one aspect of the method, the 3 ′ probe can be ligated to the adapter prior to 5 ′ exonuclease treatment and is therefore protected from 5 ′ exonuclease activity, so in the two-probe method, optionally the 5 ′ No 5 'modification is required other than phosphorylation. On the other hand, to prevent conversion of the probe into an amplifiable library, it is desirable to prevent ligation on the 3 'end of the probe in the single probe method.

標的配列の境界は、1以上のプローブによって好ましくは決定される。本方法は、標的単離プローブを利用し、一本鎖分子又はフラッププローブであり得る第二のプローブをさらに含み得る。この方法は、小さなランダム配列オリゴヌクレオチド及び/又は除去可能なブロッキングオリゴヌクレオチドをさらに利用することができる。本明細書で使用される「プローブ」という用語は、濃縮のために同定された標的配列の領域に相補的である既知の配列を有する一本鎖ポリヌクレオチドを指す。プローブは、オリゴヌクレオチドであってもよく、「オリゴヌクレオチド」は、核酸合成機により合成され得る長さの合成核酸を指す。あるいは、オリゴヌクレオチドは、天然に存在する、単離及び精製された、任意選択的に断片化された一本鎖核酸であり得、又は部分的に一本鎖かつ部分的に二本鎖であり得る。オリゴヌクレオチドは、DNA、RNA又はその両方であり得る。   The boundary of the target sequence is preferably determined by one or more probes. The method utilizes a target isolation probe and can further include a second probe that can be a single stranded molecule or a flap probe. This method can further utilize small random sequence oligonucleotides and / or removable blocking oligonucleotides. As used herein, the term “probe” refers to a single-stranded polynucleotide having a known sequence that is complementary to a region of the target sequence identified for enrichment. A probe may be an oligonucleotide, and “oligonucleotide” refers to a synthetic nucleic acid of a length that can be synthesized by a nucleic acid synthesizer. Alternatively, the oligonucleotide can be a naturally occurring, isolated and purified, optionally fragmented single stranded nucleic acid, or partially single stranded and partially double stranded. obtain. The oligonucleotide can be DNA, RNA or both.

プローブのサイズは、標的配列と同じ長さであってもそれより短くてもよい。例えば、プローブは、10,000ntも含むことができるが、より一般的には500nt未満の長さである。プローブの長さの例は、10nt−200nt、25nt−200nt、10nt−150nt、10nt−100nt、10nt−75nt又は10nt−50ntを含む。プローブは、好ましくは、25nt−200ntの長さを有する。1回の濃縮で利用されるプローブのプールは、好ましくはサイズが同じか又は類似している。   The size of the probe may be the same length as the target sequence or shorter. For example, the probe can include as much as 10,000 nt, but more typically is less than 500 nt long. Examples of probe length include 10 nt-200 nt, 25 nt-200 nt, 10 nt-150 nt, 10 nt-100 nt, 10 nt-75 nt, or 10 nt-50 nt. The probe preferably has a length of 25 nt-200 nt. The pool of probes utilized in a single enrichment is preferably the same or similar in size.

本明細書で使用する「標的単離プローブ」という用語は、決定された長さ及び配列の核酸を指し、合成であってもよい。標的単離プローブは、親和性結合分子と結合し、固体又は半固体基質の上又は中で捕捉ドメインを介して固定化され得る。標的単離プローブは、1プローブ法及び2プローブ法において標的領域の少なくとも一方の末端を決定する。図1及び2A−Cに記載の1プローブ法において、標的単離プローブは、標的配列の両端を決定する。標的単離プローブは、DNA、RNA又はその両方であってもよく、1以上の修飾されたヌクレオシドをさらに含有していてもよい(例えば表1を参照)。標的単離プローブは、3’標的配列とアダプターとの間のライゲーションを可能にしながら、二本鎖アダプターのプローブの5’末端へのライゲーションを阻害するように、5’末端にリン酸を欠いていてもよい(例えば図1、2A−C、及び図5Cを参照)。標的単離プローブは、二本鎖アダプターへのライゲーションを容易にするために5’リン酸を含んでもよい(例えば図3、4、5Bを参照)。標的単離プローブの3’末端は、3’プローブ末端とアダプターの5’末端との間のライゲーションをブロックするように修飾することができる。標的単離プローブはまた、Tmを増加させ、プローブの標的配列へのハイブリダイゼーションを安定化させるためにLNAを含有することもできる。   As used herein, the term “target isolation probe” refers to a nucleic acid of a determined length and sequence and may be synthetic. The target isolation probe binds to the affinity binding molecule and can be immobilized via a capture domain on or in a solid or semi-solid substrate. The target isolation probe determines at least one end of the target region in the one-probe method and the two-probe method. In the one-probe method described in FIGS. 1 and 2A-C, the target isolation probe determines both ends of the target sequence. The target isolation probe may be DNA, RNA, or both, and may further contain one or more modified nucleosides (see, eg, Table 1). The target isolation probe lacks a phosphate at the 5 ′ end so as to inhibit ligation of the double stranded adapter to the 5 ′ end of the probe while allowing ligation between the 3 ′ target sequence and the adapter. (See, for example, FIGS. 1, 2A-C, and 5C). The target isolation probe may include a 5 'phosphate to facilitate ligation to the double stranded adapter (see, eg, FIGS. 3, 4, 5B). The 3 'end of the target isolation probe can be modified to block ligation between the 3' probe end and the 5 'end of the adapter. The target isolation probe can also contain LNA to increase Tm and stabilize the hybridization of the probe to the target sequence.

3’標的単離プローブと結合する親和性ドメインは、3’末端に、又は3’末端と5’末端との間であるが好ましくは3’標的単離プローブの5’末端ではない場所に配置され得る。5’標的単離プローブと結合する親和性ドメインは、5’末端に、又は3’末端と5’末端との間であるが好ましくは5’標的単離プローブの3’末端ではない場所に配置され得る。標的単離プローブが標的配列の3’末端及び5’末端の境界を決定する場合、親和性ドメインは、プローブの両末端の間であって、両末端ではない場所に好ましくは配置される。   The affinity domain that binds to the 3 ′ target isolation probe is located at the 3 ′ end or between the 3 ′ end and the 5 ′ end, but preferably not at the 5 ′ end of the 3 ′ target isolation probe. Can be done. The affinity domain that binds to the 5 ′ target isolation probe is located at the 5 ′ end or between the 3 ′ end and the 5 ′ end, but preferably not at the 3 ′ end of the 5 ′ target isolation probe. Can be done. When the target isolation probe determines the boundaries of the 3 'and 5' ends of the target sequence, the affinity domain is preferably placed at a location between the ends of the probe but not at both ends.

標的単離プローブが標的配列の3’末端にハイブリダイズする場合、標的配列の5’末端に相補的な配列を特徴とする第二のプローブが、標的配列の5’末端を決定するために使用され得る。あるいは、標的単離プローブが5’末端にハイブリダイズする場合、第二のプローブは、3’末端にハイブリダイズし得る。   When the target isolation probe hybridizes to the 3 ′ end of the target sequence, a second probe characterized by a sequence complementary to the 5 ′ end of the target sequence is used to determine the 5 ′ end of the target sequence Can be done. Alternatively, if the target isolation probe hybridizes to the 5 'end, the second probe can hybridize to the 3' end.

一例では、標的単離プローブが標的配列の3’末端にハイブリダイズされた後に、第二のプローブが優先的に加えられ、エキソヌクレアーゼ消化及び標的単離プローブに相補的な配列に隣接する非標的核酸の除去がそれに続く。第二のプローブを標的配列にハイブリダイズさせることの利点は、記載した方式での二の標的特異的プローブの使用によって偽陽性の可能性が低くなることである。あるいは、標的単離プローブ及び第二のプローブは、核酸の集団に同時に加えられ、それにより標的配列の一方又は両方の末端における非標的核酸配列のエキソヌクレアーゼ消化の前に、標的領域の3’末端及び5’末端を決定することができる。   In one example, after the target isolation probe has been hybridized to the 3 ′ end of the target sequence, a second probe is preferentially added to the non-target adjacent to the sequence complementary to the exonuclease digestion and target isolation probe. Nucleic acid removal follows. An advantage of hybridizing the second probe to the target sequence is that the use of two target-specific probes in the manner described reduces the likelihood of false positives. Alternatively, the target isolation probe and the second probe are added simultaneously to the population of nucleic acids so that prior to exonuclease digestion of the non-target nucleic acid sequence at one or both ends of the target sequence, the 3 ′ end of the target region And the 5 ′ end can be determined.

「フラッププローブ」という用語は、標的核酸にハイブリダイズする一本鎖部分と一本鎖領域の3’末端から伸長する非ハイブリダイズ二本鎖領域とを含有する合成核酸を指す。標的分離プローブは、図2Bに例示するような1プローブ法において標的領域の両端を決定する場合、又は図5Bに例示するような2プローブ法において標的領域の5’末端を決定する場合、フラッププローブであり得る。フラッププローブの二重鎖の3’末端は、ヘアピン構造により、又は短い3’−5’相補的オリゴヌクレオチドにより形成され得る。Fen−1などのフラップエンドヌクレアーゼは、フラッププローブの一本鎖領域の3’末端の反対側の部位において標的の5’末端を切断し、かつ5’非標的配列をも除去する。ニックのライゲーションは、3’ヘアピン配列の追加又はフラッププローブの3領域に相補的な鎖のライゲーションをもたらす。二重鎖の3’領域は、標的配列の5’末端にライゲートされる場合、アダプターとして働くことができ、NGSプラットフォーム特異的シーケンシングプライマー部位、ライブラリー増幅プライマー部位並びに/又はサンプル同定のためのバーコード及び/若しくはUIDなどのアダプターに日常的に組み込まれる配列要素を含み得る。   The term “flap probe” refers to a synthetic nucleic acid containing a single stranded portion that hybridizes to a target nucleic acid and a non-hybridized double stranded region extending from the 3 ′ end of the single stranded region. The target separation probe is a flap probe when determining both ends of the target region in the one-probe method as illustrated in FIG. 2B, or when determining the 5 ′ end of the target region in the two-probe method as illustrated in FIG. 5B. It can be. The 3 'end of the flap probe duplex can be formed by a hairpin structure or by a short 3'-5' complementary oligonucleotide. A flap endonuclease such as Fen-1 cleaves the 5 'end of the target at the site opposite the 3' end of the single stranded region of the flap probe and also removes the 5 'non-target sequence. Nick ligation results in the addition of a 3 'hairpin sequence or ligation of the complementary strand to the three regions of the flap probe. The 3 ′ region of the duplex can act as an adapter when ligated to the 5 ′ end of the target sequence, for NGS platform specific sequencing primer sites, library amplification primer sites and / or for sample identification It may contain sequence elements that are routinely incorporated into adapters such as barcodes and / or UIDs.

前述の1又は2のプローブの使用に加えて、核酸の集団中に反復配列が存在するかもしれない場合、除去可能なブロッキングオリゴヌクレオチドを用いることができる。「除去可能なブロッキングオリゴヌクレオチド」という用語は、短い核酸配列、例えばブロッキング核酸が標的又は非標的配列にハイブリダイズしながら消化されることが可能である、その長さ全体にわたる修飾塩基を有するDNA又はRNAseH消化を受けやすいRNAなどを指す。ブロッキングRNAを用いる場合、これは、反復配列に富むDNA(すなわちCOT−1 DNA)からコピーされたcRNA又は反復DNA配列をコード化する合成RNAに由来し得る。まれな状況では、反復領域が、標的核酸配列内に含有される。より一般的には、一つの反復配列又は複数の反復配列が、非標的DNA全体に生じる。除去可能なブロッキングオリゴヌクレオチドを加熱して、変性させ、次いで冷却して、核酸の集団へのハイブリダイゼーションを可能にすることができる。標的単離プローブ及び任意選択的に第二のプローブとのハイブリダイゼーション後、除去可能なブロッキングオリゴヌクレオチドは、RNaseHIにより、又は反応混合物中で5’及び/又は3’エキソヌクレアーゼと任意選択的に合わせることができる他の適切な酵素により切断される。   In addition to the use of one or two probes as described above, removable blocking oligonucleotides can be used if repeat sequences may be present in the population of nucleic acids. The term “removable blocking oligonucleotide” refers to a short nucleic acid sequence, eg, a DNA having a modified base over its length that allows the blocking nucleic acid to be digested while hybridizing to a target or non-target sequence or It refers to RNA that is susceptible to RNAseH digestion. Where blocking RNA is used, this can be derived from cRNA copied from repetitive sequence rich DNA (ie, COT-1 DNA) or synthetic RNA encoding repetitive DNA sequences. In rare circumstances, repetitive regions are contained within the target nucleic acid sequence. More generally, one repetitive sequence or multiple repetitive sequences occur throughout the non-target DNA. The removable blocking oligonucleotide can be heated to denature and then cooled to allow hybridization to a population of nucleic acids. After hybridization with the target isolation probe and optionally the second probe, the removable blocking oligonucleotide is optionally combined with RNase HI or in the reaction mixture with 5 ′ and / or 3 ′ exonuclease. It can be cleaved by other suitable enzymes.

標的単離プローブに加えて、第二のプローブの代わりに、10nt未満、例えば4nt、5nt、6nt、7nt、8nt又は9ntの長さのランダム配列(NNNNなど)を有するオリゴヌクレオチドは、標的配列の一本鎖領域にハイブリダイズし得る。この短いオリゴヌクレオチドは、3’末端で伸長させて、そこにアダプターをライゲートさせるのに適した平滑末端又は付着端を形成することができる。   In addition to the target isolation probe, instead of the second probe, an oligonucleotide having a random sequence (such as NNNN) with a length of less than 10 nt, eg, 4 nt, 5 nt, 6 nt, 7 nt, 8 nt, or 9 nt, It can hybridize to a single stranded region. This short oligonucleotide can be extended at the 3 'end to form a blunt or sticky end suitable for ligating the adapter there.

核酸集団内の標的配列の、標的単離プローブ中の相補的配列へのハイブリダイゼ―ションの後、二重鎖は、固体又は半固体マトリックスに結合した捕捉ドメインによって固定化することができる。一旦固定化されると、任意の非ハイブリダイズ核酸は洗浄により除去することができ、その結果、固定化された核酸は、標的配列について濃縮される。   After hybridization of the target sequence in the nucleic acid population to a complementary sequence in the target isolation probe, the duplex can be immobilized by a capture domain attached to a solid or semi-solid matrix. Once immobilized, any non-hybridized nucleic acid can be removed by washing, so that the immobilized nucleic acid is enriched for the target sequence.

非標的DNAを除去するために必要なこの洗浄工程は、工業的に利用可能なハイブリダイゼーション濃縮方法により用いられる洗浄工程よりもストリンジェンシーが低い可能性がある。なぜなら、そのような方法は、非標的分子を排除して標的分子を濃縮するために、ハイブリダイゼーション温度、洗浄温度、及び洗浄緩衝液のストリンジェンシーに依存しているためである。その結果、そのような方法は、厳格なTm範囲のプローブ及び慎重に制御された洗浄条件を必要とする。本明細書に記載の方法は、完全に結合していないライブラリー断片を除去するために洗浄が必要とされるにすぎないため、プローブについてはかなり広いTm範囲及びよりストリンジェントではない洗浄を許容する。本方法の高い特異性は、正確な標的配列がプローブにハイブリダイズされる場合には、ライゲートさせることができる平滑末端を生成するにすぎない次の工程でのエキソヌクレアーゼの使用により達成される。   This washing step required to remove non-target DNA may have less stringency than the washing step used by industrially available hybridization concentration methods. This is because such methods rely on hybridization temperature, wash temperature, and wash buffer stringency to eliminate non-target molecules and concentrate the target molecules. As a result, such methods require strict Tm range probes and carefully controlled cleaning conditions. The method described herein only allows a much wider Tm range and less stringent washing for the probe, as washing is only required to remove library fragments that are not fully bound. To do. The high specificity of this method is achieved by the use of an exonuclease in the next step that only produces blunt ends that can be ligated when the correct target sequence is hybridized to the probe.

「相補的」又は「実質的に相補的」とは、例えば二本鎖DNA分子の2本の鎖の間又は核酸の一本鎖領域上のオリゴヌクレオチドプローブ若しくはプライマーとプローブ若しくはプライマー結合部位との間など、ヌクレオチド間又は核酸間に二重鎖を形成するためのハイブリダイゼーション又は塩基対合を可能にする核酸分子の配列を意味する。一般に、相補的ヌクレオチドは、AとT(若しくはAとU)又はCとGである。2の一本鎖RNA又はDNA分子は、一方の鎖のヌクレオチドが最適に整列して比較され、適切な、潜在的な、認識された又は表現型的に意味のあるヌクレオチドの挿入又は欠失を有し、対が他方の鎖のヌクレオチドの少なくとも約50%又は少なくとも80%、又は少なくとも約90%から95%、より好ましくは約98%から100%を有する場合、実質的に相補的であると言われる。あるいは、RNA鎖又はDNA鎖が選択的ハイブリダイゼーション条件下でその補体にハイブリダイズして、安定した二重鎖を形成する場合、実質的相補性が存在する。通常、選択的ハイブリダイゼーションは、少なくとも14ntから25ntのストレッチにわたって少なくとも約65%の相補、好ましくは少なくとも約75%、より好ましくは少なくとも約90%の相補がある場合に起こる(Kanehisa,Nucleic Acids Res., 12:203 (1984)参照)。特異的なハイブリダイゼーションは、プローブと核サンプルとの間で達成することができ、核酸サンプル及びプローブの少なくとも一部が一本鎖であり、ハイブリダイゼーションに利用可能である。プローブの一部は、二本鎖であり得、したがって標的配列とのハイブリダイゼーションに利用可能ではない。一本鎖領域は、熱変性又は当該技術分野で周知の他の手段によって、二重鎖中内で又は二重鎖から形成され得る。   “Complementary” or “substantially complementary” means, for example, between an oligonucleotide probe or primer and a probe or primer binding site between two strands of a double-stranded DNA molecule or on a single-stranded region of a nucleic acid. It means a sequence of nucleic acid molecules that allows hybridization or base pairing to form a duplex, such as between, between nucleotides or between nucleic acids. In general, complementary nucleotides are A and T (or A and U) or C and G. Two single-stranded RNA or DNA molecules are compared in which the nucleotides of one strand are optimally aligned and compared with appropriate, potential, recognized or phenotypically meaningful nucleotide insertions or deletions. Substantially complementary if the pair has at least about 50% or at least 80%, or at least about 90% to 95%, more preferably about 98% to 100% of the other strand of nucleotides. Said. Alternatively, substantial complementarity exists when an RNA or DNA strand hybridizes to its complement under selective hybridization conditions to form a stable duplex. Typically, selective hybridization occurs when there is at least about 65% complementarity, preferably at least about 75%, more preferably at least about 90% complementarity over a stretch of at least 14 nt to 25 nt (Kanehisa, Nucleic Acids Res. , 12: 203 (1984)). Specific hybridization can be achieved between the probe and the nuclear sample, and at least a portion of the nucleic acid sample and probe are single stranded and are available for hybridization. Some of the probes can be double stranded and are therefore not available for hybridization with the target sequence. Single stranded regions may be formed in or from the duplex by heat denaturation or other means well known in the art.

本方法の一態様において、標的単離プローブのハイブリダイゼーションは、好ましくは溶液中で行われる。ハイブリダイゼーションの条件は、ハイブリダイゼーション配列内のミスマッチが許容され得るという意味で比較的緩和され得る。例えば、TiquiaらのBioTechniques,6:664−675(2004)又はJohnらのBioTechniques,44:259−264(2008)などにより記載の標準的な方法を用いることができる。さらに、AT/U塩基対、GC塩基対又は平衡混合物が優勢である断片はすべて、反応条件下で効率的にハイブリダイズすることができる。ハイブリダイゼーションは、3日から30分、例えば1時間から16時間に及んでもよく、この場合温度は有意に変動し、ハイブリダイゼーション混合物は変化し得る。しかし、かかるハイブリダイゼーション期間は、ハイブリダイゼーション条件に応じて、他の実施態様では、より長くても短くてもよい。   In one embodiment of the method, hybridization of the target isolation probe is preferably performed in solution. Hybridization conditions can be relatively relaxed in the sense that mismatches within the hybridization sequence can be tolerated. For example, standard methods described by Tiquia et al., BioTechniques, 6: 664-675 (2004) or John et al., BioTechniques, 44: 259-264 (2008) can be used. Furthermore, any fragment that predominates with AT / U base pairs, GC base pairs or equilibrium mixtures can all efficiently hybridize under reaction conditions. Hybridization may range from 3 days to 30 minutes, such as from 1 hour to 16 hours, in which case the temperature varies significantly and the hybridization mixture can vary. However, such hybridization periods may be longer or shorter in other embodiments, depending on the hybridization conditions.

標的核酸にハイブリダイズされた標的単離分子のハイブリダイゼーション産物は、固体又は半固体支持体上にコーティングされ得る捕捉ドメインに対する親和性ドメインの結合によって固定化されるか、又は後述の固体若しくは半固体支持対そのものであってもよい。集団における核酸の固定化は、ハイブリダイゼーションの次の工程、エキソヌクレアーゼ消化、アダプターライゲーション、任意選択的に増幅を容易にするだけでなく、非反応物質、残留試薬、及び切断生成物の洗浄による除去を可能にし、それにより交差汚染が回避され、したがって標的配列濃縮の容易性及び有効性が高まる。   The hybridization product of the target isolated molecule hybridized to the target nucleic acid is immobilized by the binding of an affinity domain to a capture domain that can be coated on a solid or semi-solid support, or a solid or semi-solid described below The support pair itself may be used. Immobilization of nucleic acids in a population not only facilitates the next step of hybridization, exonuclease digestion, adapter ligation, and optionally amplification, but also removes unreacted materials, residual reagents, and cleavage products by washing , Thereby avoiding cross-contamination, thus increasing the ease and effectiveness of target sequence enrichment.

本明細書で使用される「捕捉ドメイン」という用語は、親和性ドメインを結合するための固体支持体(下記参照)又は半固体支持体(例えばアガロース又はアクリルアミド)と結合され、ひいては標的単離プローブと結合される化学構造又は部分を指す。親和性ドメインは、ビオチン、抗原、ハプテン、修飾ヌクレオチド又はリガンドなどの小分子を含むことができ、この小分子は結合することも、(例えば直接又は間接的に捕捉ドメインへの、アミン−チオール(aminethiol)架橋、マレイミド架橋、N−ヒドロキシスクシンイミド又はN−ヒドロキシスルホスクシンイミド、ゼノン又はSiteClickによってさらに例示される、光化学的又は化学的)架橋になることも可能である。   As used herein, the term “capture domain” is bound to a solid support (see below) or semi-solid support (eg, agarose or acrylamide) for binding an affinity domain, and thus a target isolation probe. Refers to the chemical structure or moiety bound to Affinity domains can include small molecules such as biotin, antigens, haptens, modified nucleotides or ligands, which can also bind (eg, directly or indirectly to the capture domain, amine-thiol ( aminethiol) cross-linking, maleimide cross-linking, N-hydroxysuccinimide or N-hydroxysulfosuccinimide, Zenon or SiteCrick, photochemical or chemical) cross-linking.

固体支持体にDNAを付着させるための様々な方法が知られており、そのいずれも本発明の態様で使用することができる。これらは、支持体表面への共有結合及びDNAのその表面との非共有結合的相互作用(吸着による結合、例えばカチオン性表面)を含む。通常、共有結合性の固定化には、DNA(親和性ドメイン)上の活性官能基と固体表面上の活性化官能基(捕捉ドメイン)との反応が関与する。反応性官能基の例には、アミン、ヒドロキシルアミン、ヒドラジン、ヒドラジド、チオール、ホスフィン、イソチオシアネート、イソシアネート、N−ヒドロキシスクシンイミド(NHS)エステル、カルボジイミド、チオエステル、ハロアセチル誘導体、塩化スルホニル、ニトロ及びジニトロフェニルエステル、トシレート、メシレート、トリフレート、マレイミド、ジスルフィド、カルボキシル基、ヒドロキシル基、カルボニルジイミダゾール、エポキシド、アルデヒド、アシル−アルデヒド、ケトン、アジド、アルキン、アルケン、ニトロン、テトラジン、イソニトリル、テトラゾール、及びボロネートが含まれる。かかる反応の例には、アミドを形成するアミンと活性化カルボキシ基との間、チオエーテル結合を形成するチオールとマレイミドとの間、1,3−双極子付加環化反応を行うアジドとアルキン誘導体との間、アミンとエポキシ基との間、2つのアミド結合を生じる、活性化ビス−ジカルボン酸誘導体の形式の付加二官能性リンカー試薬と反応する別のアミン官能基とアミンとの間の反応又は当該技術分野で既知の他の組み合わせが含まれる。UV媒介架橋などの他の反応が、DNAの固体支持体への共有結合のために使用され得る。   Various methods are known for attaching DNA to a solid support, any of which can be used in embodiments of the present invention. These include covalent bonding to the support surface and non-covalent interactions of DNA with that surface (binding by adsorption, eg cationic surfaces). Usually, covalent immobilization involves a reaction between an active functional group on DNA (affinity domain) and an activated functional group on a solid surface (capture domain). Examples of reactive functional groups include amine, hydroxylamine, hydrazine, hydrazide, thiol, phosphine, isothiocyanate, isocyanate, N-hydroxysuccinimide (NHS) ester, carbodiimide, thioester, haloacetyl derivative, sulfonyl chloride, nitro and dinitrophenyl. Esters, tosylate, mesylate, triflate, maleimide, disulfide, carboxyl group, hydroxyl group, carbonyldiimidazole, epoxide, aldehyde, acyl-aldehyde, ketone, azide, alkyne, alkene, nitrone, tetrazine, isonitrile, tetrazole, and boronate included. Examples of such reactions include amines that form amides and activated carboxy groups, thiols that form thioether bonds and maleimides, azides and alkyne derivatives that undergo 1,3-dipolar cycloaddition reactions. The reaction between an amine and another amine functional group reacting with an additional bifunctional linker reagent in the form of an activated bis-dicarboxylic acid derivative, resulting in two amide bonds between the amine and the epoxy group, or Other combinations known in the art are included. Other reactions such as UV-mediated crosslinking can be used for covalent attachment of DNA to a solid support.

官能基は、固体支持体用に用いられる物質に本質的に存在してもよく、又は適切な物質で支持体を処理又はコーティングすることにより提供されてもよい。官能基は、固体支持体表面を適切な化学剤と反応させることにより導入することもできる。本明細書で使用される活性化は、結合剤の表面へのカップリングを可能にするための、固体支持体表面上の官能基の修飾を意味する。本明細書で使用される固体支持体は、DNAを捕捉して固定化することが望まれる任意の固体(軟質又は硬質)材料を含むことを意味する。   The functional groups may be inherent in the material used for the solid support or may be provided by treating or coating the support with a suitable material. Functional groups can also be introduced by reacting the solid support surface with a suitable chemical agent. Activation as used herein means modification of a functional group on the surface of a solid support to allow coupling of the binding agent to the surface. As used herein, a solid support is meant to include any solid (soft or hard) material where it is desired to capture and immobilize DNA.

固体支持体は、生物学的、非生物学的、有機、無機又はその組み合わせであってもよく、粒子、鎖、沈殿物、ゲル、シート、管、球、容器、毛細管、パッド、切片、フィルム、プレート、スライドの形態であってもよく、平ら、円板、球形、円等を含む任意の都合のよい形状を有し得る。固体支持体の表面は、表面が官能基を支持する限り、例えばポリマー、プラスチック、樹脂、多糖類、シリカ又はシリカ系材料、カーボン、金属、無機ガラス、膜等の様々な材料から構成され得る。都合のよい固体支持体の例は、例えばガラススライド、マイクロタイタープレート、及び適切なセンサー要素等のガラス表面、特に(例えばビーズの形態の)官能化ポリマー、化学修飾された酸化物表面、例えば二酸化ケイ素、五酸化タンタル若しくは二酸化チタン、又は化学修飾された金属表面、例えば金若しくは銀などの貴金属表面、銅若しくはアルミニウム表面、磁気表面、例えばFe、Mn、Ni、Co、及びそれらの酸化物、量子ドット、例えばIII−V(GaN、GaP、GaAs、InP若しくはInAs)又はII−VI(ZnO、ZnS、CdS、CdSe若しくはCdTe)半導体、又はLnドープ処理したフッ化物ナノ結晶、希土類によりドープ処理した酸化物ナノマテリアルである。   The solid support may be biological, non-biological, organic, inorganic or a combination thereof, particles, chains, precipitates, gels, sheets, tubes, spheres, containers, capillaries, pads, sections, films May be in the form of a plate, slide, and may have any convenient shape including flat, disc, sphere, circle, and the like. The surface of the solid support may be composed of various materials such as polymers, plastics, resins, polysaccharides, silica or silica-based materials, carbon, metal, inorganic glass, and membranes as long as the surface supports functional groups. Examples of convenient solid supports include glass surfaces such as glass slides, microtiter plates, and suitable sensor elements, in particular functionalized polymers (eg in the form of beads), chemically modified oxide surfaces such as dioxide. Silicon, tantalum pentoxide or titanium dioxide, or chemically modified metal surfaces such as noble metal surfaces such as gold or silver, copper or aluminum surfaces, magnetic surfaces such as Fe, Mn, Ni, Co, and their oxides, quantum Dot, for example III-V (GaN, GaP, GaAs, InP or InAs) or II-VI (ZnO, ZnS, CdS, CdSe or CdTe) semiconductors, or Ln-doped fluoride nanocrystals, rare earth-doped oxide Nanomaterials.

「固体支持体」は、硬質又は半硬質表面を有する物質又は物質の群を指す。固体支持体は、いくつかの実施態様では、例えばウェル、***領域、ピン、エッチングされた溝等を用いて、異なる化合物の合成領域を物理的に分離することが望ましいが、実質的に平らな固体支持体の少なくとも1つの表面であってもよい。あるいは、固体支持体は、ビーズ、樹脂、ゲル、ミクロスフェア又は他の幾何学的な構造であってもよい。ビーズの例には、ストレプトアビジンビーズ、アガロースビーズ、磁気ビーズ、Dynabeads(登録商標)(ニューヨーク州グランドアイランドのLife Technologies)、MACS(登録商標)ミクロビーズ(カリフォルニア州オーバーンのMiltenyi Biotech)、抗体コンジュゲートビーズ(例えば抗免疫グロブリンミクロビーズ)、プロテインAコンジュゲートビーズ、プロテインGコンジュゲートビーズ、プロテインA/Gコンジュゲートビーズ、プロテインLコンジュゲートビーズ、オリゴdTコンジュゲートビーズ、シリカビーズ、シリカ様ビーズ、抗ビオチンミクロビーズ、抗蛍光色素ミクロビーズ、及びBcMagTM(カリフォルニア州サンディエゴのBioclone)カルボキシ末端磁気ビーズが含まれる。標識された核酸を支持体に付着させることは、複数のポリヌクレオチドにビオチンを付着させることと、1つ以上の磁気ビーズをストレプトアビジンでコーティングすることとを含み得る。 “Solid support” refers to a substance or group of substances having a hard or semi-rigid surface. The solid support may be substantially flat in some embodiments, although it may be desirable to physically separate the synthetic regions of different compounds using, for example, wells, raised regions, pins, etched grooves, etc. It may be at least one surface of a solid support. Alternatively, the solid support may be a bead, resin, gel, microsphere or other geometric structure. Examples of beads include streptavidin beads, agarose beads, magnetic beads, Dynabeads® (Life Technologies, Grand Island, NY), MACS® microbeads (Miltenyi Biotech, Auburn, Calif.), Antibody conjugates. Gate beads (eg anti-immunoglobulin microbeads), protein A conjugate beads, protein G conjugate beads, protein A / G conjugate beads, protein L conjugate beads, oligo dT conjugate beads, silica beads, silica-like beads, Anti-biotin microbeads, anti-fluorescent dye microbeads, and BcMag (Bioclone, San Diego, Calif.) Carboxy powder Edge magnetic beads are included. Attaching a labeled nucleic acid to a support can include attaching biotin to a plurality of polynucleotides and coating one or more magnetic beads with streptavidin.

固体支持体表面は、ポリマーの層を備えていてもよい。そのような場合、ポリマーは、活性化されるべき官能基を有しているであろう。ポリマーは、ポリエチレングリコール、ポリエチレンイミド、多糖類、ポリペプチド又はポリヌクレオチド等の任意の適切なクラスの化合物から選択され得る。支持体表面へのポリマーの付着は、当業者には容易に明らかな種々の方法によって行うことができる。例えば、トリクロロシリル基又はトリスアルコキシ基を有するポリマーは、基質表面のヒドロキシル基と反応させて、シロキサン結合を形成することができる。金又は銀表面への付着は、ポリマー上のチオール基を介して起こり得る。あるいは、ポリマーは、アルカンチオールの自己組織化単層などの中間体種によって付着させることができる。したがって、選択されるポリマーの種類及びポリマーを表面に付着するために選択される方法は、基質表面に付着させるのに適した反応性を有するポリマーに、特にDNAへの非特異的な吸着に関するポリマーの特性に依存するであろう。官能基は、ポリマー上に存在してもよく、又は1以上の官能基の付加によりポリマーに付加してもよい。任意選択的に、スペーサーアームを用いて、結合DNAに柔軟性を与え、固体支持体による立体障害が最小限になるようにその環境と相互作用させることを可能にすることができる。   The solid support surface may comprise a polymer layer. In such cases, the polymer will have a functional group to be activated. The polymer may be selected from any suitable class of compounds such as polyethylene glycol, polyethylene imide, polysaccharides, polypeptides or polynucleotides. The polymer can be attached to the surface of the support by various methods that are readily apparent to those skilled in the art. For example, a polymer having a trichlorosilyl group or a trisalkoxy group can be reacted with a hydroxyl group on the substrate surface to form a siloxane bond. Adhesion to the gold or silver surface can occur through thiol groups on the polymer. Alternatively, the polymer can be attached by an intermediate species such as a self-assembled monolayer of alkanethiol. Thus, the type of polymer selected and the method selected to attach the polymer to the surface is suitable for polymers with reactivity suitable for attaching to the substrate surface, especially for non-specific adsorption to DNA. Will depend on the characteristics of Functional groups may be present on the polymer or may be added to the polymer by the addition of one or more functional groups. Optionally, spacer arms can be used to provide flexibility to the bound DNA and allow it to interact with its environment so that steric hindrance by the solid support is minimized.

核酸を固体支持体の表面に固定化するために、表面上の活性化官能基は、所定の領域のみに、又は表面全体に存在してもよく、DNA分子中に存在する官能基と選択的に反応する。時間、温度、pH、溶媒、添加剤等を含めた必要な反応条件は、用いられる特定の種に特に依存するであろうし、それぞれの特定の状況に適した条件は、当業者に容易に明らかであろう。オリゴヌクレオチドを合成し、所望の官能基を取り込むことができる。個々のヌクレオチドは、所望の反応性をもたらすために、任意のタイプの官能基で化学的に又は酵素的に修飾することができる。この化学的又は酵素的な官能化は、DNA分子に伸長させることができる。   In order to immobilize the nucleic acid on the surface of the solid support, the activated functional groups on the surface may be present only in certain regions or over the entire surface and are selective to functional groups present in the DNA molecule. To react. The required reaction conditions, including time, temperature, pH, solvent, additives, etc. will depend in particular on the particular species used, and conditions suitable for each particular situation will be readily apparent to those skilled in the art. Will. Oligonucleotides can be synthesized and incorporated with desired functional groups. Individual nucleotides can be chemically or enzymatically modified with any type of functional group to provide the desired reactivity. This chemical or enzymatic functionalization can be extended to DNA molecules.

生物物質による表面の官能化は、DNAを固体支持体に付着させるために用いることもできる。例えばマイクロプレートなどの固体支持体は、例えば抗体(若しくは抗体断片)などの結合剤又は別の親和性結合剤(例えばストレプトアビジン)を用いて修飾することができる。その場合、DNA分子は、対応する親和性リガンド(例えばビオチン)及び別の親和性結合剤(例えば、生体分子の配列の一部を認識する抗体)で修飾されている。本明細書で使用される結合剤は、例えば、タンパク質又その断片などのポリペプチド;相補鎖で塩基対合することができる、例えばオリゴヌクレオチド、ポリヌクレオチド又はその誘導体などの核酸を含む、特異的な結合対のメンバーである任意の作用剤を意味する。結合剤の例には、細胞膜に対するアゴニスト及びアンタゴニスト、毒素及び毒液、ウイルスエピトープ、抗原決定基、ホルモン及びホルモン受容体、ステロイド、ペプチド、酵素、基質、補因子、薬物、レクチン、糖、オリゴヌクレオチド、オリゴ糖、タンパク質、糖タンパク質、細胞、細胞膜、オルガネラ、細胞受容体、ビタミン、ウイルスエピトープ、並びに免疫グロブリン、例えばモノクローナル抗体及びポリクローナル抗体が含まれる。結合対の例には、ビオチン−ストレプトアビジン/アビジン、ハプテン/抗原−抗体、炭水化物−レクチン又は当業者に既知のその他のものが含まれる。   Functionalization of the surface with biological material can also be used to attach DNA to a solid support. For example, a solid support such as a microplate can be modified with a binding agent such as an antibody (or antibody fragment) or another affinity binding agent (eg streptavidin). In that case, the DNA molecule is modified with a corresponding affinity ligand (eg, biotin) and another affinity binder (eg, an antibody that recognizes part of the sequence of the biomolecule). As used herein, a binding agent is a specific, including, for example, a polypeptide such as a protein or fragment thereof; a nucleic acid such as an oligonucleotide, polynucleotide or derivative thereof that can base pair with a complementary strand. Any agent that is a member of a binding pair. Examples of binding agents include agonists and antagonists to cell membranes, toxins and venoms, viral epitopes, antigenic determinants, hormones and hormone receptors, steroids, peptides, enzymes, substrates, cofactors, drugs, lectins, sugars, oligonucleotides, Oligosaccharides, proteins, glycoproteins, cells, cell membranes, organelles, cell receptors, vitamins, viral epitopes, and immunoglobulins such as monoclonal and polyclonal antibodies are included. Examples of binding pairs include biotin-streptavidin / avidin, hapten / antigen-antibody, carbohydrate-lectin or others known to those skilled in the art.

DNAの固体支持体への共有結合を可能にする特異的結合対のさらなる例は、例えばSNAP−tag(登録商標)(マサチューセッツ州イプスウィッチのNew England Biolabs)/AGT及びベンジルグアニン誘導体(米国特許第7939284号;同第8367361号;同第7799524号;同第7888090号、及び同第8163479号)又はピリミジン誘導体(米国特許第8178314号)、CLIP−tagTM(マサチューセッツ州イプスウィッチのNew England Biolabs)/ACT及びベンジルシトシン誘導体(米国特許第8227602号)、HaloTag(登録商標)(ウィスコンシン州マディソンのPromega)及びクロロアルカン誘導体(Los, et al. Methods Mol Biol., 356:195-208 (2007))、セリン−ベータ−ラクタマーゼ及びベータ−ラクタム誘導体(国際特許出願公開WO2004/072232号)である。そのような例において、DNAをベンジルグアニン、ピリミジン、ベンジルシトシン、クロロアルカン又はベータ−ラクタム誘導体で官能化し、その後それぞれSNAP−タグ/AGT、CLIP−tag/ACT、HaloTag又はセリン−ベータ−ラクタマーゼで修飾した固体支持体中で捕捉することができる。あるいは、DNAをSNAP−tag/AGT、CLIP−tag/ACT、HaloTag又はセリン−ベータ−ラクタマーゼに特異的に又は非特異的に付着させ、その後それぞれベンジルグアニン、ピリミジン、ベンジルシトシン、クロロアルカン又はベータ−ラクタム誘導体で官能化した固体支持体中で捕捉することができる。DNAの固体支持体への共有結合を可能にする特異的結合対のさらなる例は、アシル担体タンパク質及びその修飾体(結合剤タンパク質)であり、これらは、シンターゼタンパク質によって補酵素A(結合剤基質)由来のホスホパンテテイン(phosphopantheteine)サブユニットに結合する(米国特許第7666612号)。DNAの固体支持体への好都合な結合を可能にするタンパク質又はそのフラグメントの例は、例えばキチン結合ドメイン(CBD)、マルトース結合タンパク質(MBP)、糖タンパク質、トランスグルタミナーゼ、ジヒドロ葉酸還元酵素、グルタチオン−S−トランスフェラーゼal(GST)、FLAGタグ、S−タグ、His−タグ、及び当業者に既知のその他のものである。通常、オリゴヌクレオチド、DNA又はその断片は、特異的結合対の一部であり、かつ固体支持体に共有結合的に又は非共有結合的に結合されたパートナーに特異的に結合することができる分子で修飾される。 Additional examples of specific binding pairs that allow covalent binding of DNA to a solid support include, for example, SNAP-tag® (New England Biolabs, Ipswich, Mass.) / AGT and benzylguanine derivatives (US Pat. No. 7939284; No. 8367361; No. 7799524; No. 7888090 and No. 8163479) or pyrimidine derivatives (US Pat. No. 8,178,314), CLIP-tag (New England Biolabs, Ipswich, Mass.) / ACT and benzylcytosine derivatives (US Pat. No. 8,227,602), HaloTag® (Promega, Madison, Wis.) And chloroalkane derivatives (Los, et al. Methods Mol Biol., 356) : 195-208 (2007)), serine-beta-lactamase and beta-lactam derivatives (International Patent Application Publication No. WO 2004/072232). In such examples, the DNA is functionalized with benzylguanine, pyrimidine, benzylcytosine, chloroalkane or beta-lactam derivatives and then modified with SNAP-tag / AGT, CLIP-tag / ACT, HaloTag or serine-beta-lactamase, respectively. Can be captured in a solid support. Alternatively, DNA is specifically or non-specifically attached to SNAP-tag / AGT, CLIP-tag / ACT, HaloTag or serine-beta-lactamase, and then benzylguanine, pyrimidine, benzylcytosine, chloroalkane or beta-, respectively. It can be captured in a solid support functionalized with a lactam derivative. Further examples of specific binding pairs that allow covalent binding of DNA to a solid support are acyl carrier proteins and their modifications (binder proteins), which are coenzyme A (binder substrates) by synthase proteins. ) -Derived phosphopantetheine subunit (US Pat. No. 7,666,612). Examples of proteins or fragments thereof that allow convenient binding of DNA to a solid support are eg chitin binding domain (CBD), maltose binding protein (MBP), glycoprotein, transglutaminase, dihydrofolate reductase, glutathione- S-transferase al (GST), FLAG tag, S-tag, His-tag, and others known to those skilled in the art. Usually, an oligonucleotide, DNA or fragment thereof is part of a specific binding pair and can specifically bind to a partner covalently or non-covalently bound to a solid support. Qualified with

標的DNAは上記のように固定化するが、3’エキソヌクレアーゼI及びエキソヌクレアーゼTなどの1以上の適切な3’一本鎖DNAエキソヌクレアーゼを添加して非標的DNAを除去し、標的DNAの特定のリード開始点で平滑末端を形成することができる。「3’一本鎖特異的エキソヌクレアーゼ」という用語は、一本鎖DNA切断活性を有する3’エキソヌクレアーゼを指す。いくつかの3’エキソヌクレアーゼはまた、少量の二本鎖DNA切断活性も有し、本実施態様においても使用され得る。「リード開始点」とは、核酸分子のシーケンシングが始まる位置を指す。シーケンシングリードの開始点は、1以上のヌクレアーゼを用いて一本鎖核酸を消化して、プローブと平滑末端を形成し、次いで、シーケンシングプライマー部位が標的核酸配列と直接境を接するようにアダプターをライゲーションすることにより生成することができる。その結果、選択されたプローブ配列がリード開始点を決定する。好ましくは、ヌクレアーゼは、平滑な二本鎖DNA(dsDNA)末端を形成することができる一本鎖の3’エキソヌクレアーゼであり、エンドヌクレアーゼ活性を有しない。一本鎖結合タンパク質(SSBタンパク質)などのアクセサリータンパク質を添加することができる。クレノウエキソ−及びdATPを添加し、3’末端にdAテイルを設けることができる。dAテーリング工程は、Tオーバーハング3’アダプターと共に用いる場合は任意選択であり、平滑末端アダプターには必要ではない。dAテーリングの場合、用いられる酵素、その濃度、インキュベーション時間及び温度は重要ではない。しかしながら、酵素は、Tオーバーハングアダプターの場合、dsDNAの3’末端にdAなどの単一の非鋳型ヌクレオチドを付加するべきである。   Target DNA is immobilized as described above, but one or more appropriate 3 ′ single stranded DNA exonucleases such as 3 ′ exonuclease I and exonuclease T are added to remove non-target DNA and Blunt ends can be formed at specific lead initiation points. The term “3 ′ single-strand specific exonuclease” refers to a 3 ′ exonuclease having single-stranded DNA cleavage activity. Some 3 'exonucleases also have a small amount of double-stranded DNA cleavage activity and can also be used in this embodiment. “Read start point” refers to the position where sequencing of nucleic acid molecules begins. The starting point of the sequencing read is an adapter that digests the single stranded nucleic acid with one or more nucleases to form a blunt end with the probe and then the sequencing primer site directly borders the target nucleic acid sequence Can be generated by ligation. As a result, the selected probe sequence determines the read start point. Preferably, the nuclease is a single stranded 3 'exonuclease capable of forming a smooth double stranded DNA (dsDNA) end and has no endonuclease activity. Accessory proteins such as single chain binding proteins (SSB proteins) can be added. Klenow exo- and dATP can be added to provide a dA tail at the 3 'end. The dA tailing step is optional when used with a T overhang 3 'adapter and is not required for blunt end adapters. In the case of dA tailing, the enzyme used, its concentration, incubation time and temperature are not critical. However, in the case of a T overhang adapter, the enzyme should add a single non-template nucleotide such as dA to the 3 'end of the dsDNA.

5’エキソヌクレアーゼを用いて、5’非標的一本鎖核酸を除去することができる。5’エキソヌクレアーゼがヌクレアーゼを不活性化するために熱変性温度を必要とする場合、再ハイブリダイゼーション工程を加えてプローブを鋳型に再ハイブリダイズさせることができる。5’エキソヌクレアーゼが5’陥凹末端又は5’オーバーハングを残す場合、ポリメラーゼを用いて3’オーバーハングを消化するか、又はプローブの3’陥凹末端をフィルインし、平滑末端又は1つのヌクレオチドにより伸長される末端を形成することができる。3’エキソヌクレアーゼを有するポリメラーゼを平滑末端を形成するために好ましくは使用することができ、平滑末端は、平滑末端5’アダプターにライゲートすることができる。あるいは、クレノウ(3’→5’エキソ−)又はBstなどの3’エキソ−ポリメラーゼを置換して、Tオーバーハングを有する5’アダプターにライゲートすることができる末端を形成することができる。また、dATP、dCTP、dGTP、及びdTTPの代わりに、dATP、dCTP、dGTP及びdUTPのdNTP混合物を用いてもよい。標的がRNAである場合、dNTPSと共に逆転写酵素を使用することができ、又はリボNTPを用いるRNAポリメラーゼを使用することができる。フィルインポリメラーゼ、ポリメラーゼ濃度、プローブ濃度、インキュベーション時間及び温度は、当該技術分野で教示されている通り変化し得る(例えばTabor, et al. DNA dependent DNA polymerases in Ausebel, et al. Current protocols in Molecular Biology, 3.5.10-3.5.12 (1989), New York, John Wiley and Sons; Sambrook et al. (1989) Molecular Cloning, A laboratory Manual (2nd ed), p 5.44-5.47, CSH pressを参照)。 A 5 ′ exonuclease can be used to remove 5 ′ non-target single stranded nucleic acids. If the 5 ′ exonuclease requires a heat denaturation temperature to inactivate the nuclease, a rehybridization step can be added to rehybridize the probe to the template. If the 5 'exonuclease leaves a 5' recessed end or 5 'overhang, digest the 3' overhang with polymerase or fill in the 3 'recessed end of the probe to make it blunt ended or one nucleotide To form an extended end. A polymerase with a 3 ′ exonuclease can preferably be used to form a blunt end, and the blunt end can be ligated to a blunt end 5 ′ adapter. Alternatively, a 3 ′ exo-polymerase such as Klenow (3 ′ → 5 ′ exo-) or Bst can be substituted to form a terminus that can be ligated to a 5 ′ adapter with a T overhang. Further, a dNTP mixture of dATP, dCTP, dGTP and dUTP may be used instead of dATP, dCTP, dGTP, and dTTP. If the target is RNA, reverse transcriptase can be used with dNTPS, or RNA polymerase with riboNTPs can be used. Fill-in polymerase, polymerase concentration, probe concentration, incubation time and temperature can vary as taught in the art (see, eg, Tabor, et al. DNA dependent DNA polymerases in Ausebel, et al. Current protocols in Molecular Biology, 3.5.10-3.5.12 (1989), New York, John Wiley and Sons;. Sambrook et al (1989) Molecular Cloning, a laboratory Manual (2 nd ed), p 5.44-5.47, see CSH press).

標的濃縮後又はその間に、アダプター配列を標的配列の一方又は両方の末端にライゲートすることが望ましい場合がある。「ライゲーション」とは、2つ以上の核酸、例えばオリゴヌクレオチド及び/又はポリヌクレオチドの共有結合又は連結による終端間の結合を指す。結合又は連結の特質は、広範に変わることがあり、ライゲーションは、酵素的に又は化学的に行われ得る。本明細書で使用される場合、ライゲーションは、通常酵素的に行われ、1つのオリゴヌクレオチドの終端ヌクレオチドの5’炭素と別のオリゴヌクレオチドの3’炭素との間にホスホジエステル連結を形成する。様々な鋳型主導型のライゲーション反応が、次の参照文献に記載されており、これらは参照により援用される:Whiteleyら、米国特許第4883750号;Letsingerら、米国特許第5476930号;Fungら、米国特許第5593826号;Kool、米国特許第5426180号;Landegrenら、米国特許第5871921号;Xu and Kool,Nucleic Acids Research,27:875−881(1999);Higginstら、Methods in Enzymology,68:50−71(1979);Englerら、The Enzymes,15:3−29(1982);及びNamsaraev、米国特許出願公開第2004/0110213号。   It may be desirable to ligate the adapter sequence to one or both ends of the target sequence after or during target enrichment. “Ligation” refers to the bond between termini by covalent bonding or linking of two or more nucleic acids, eg, oligonucleotides and / or polynucleotides. The nature of binding or linking can vary widely, and ligation can be performed enzymatically or chemically. As used herein, ligation is usually performed enzymatically, forming a phosphodiester linkage between the 5 'carbon of one oligonucleotide's terminal nucleotide and the 3' carbon of another oligonucleotide. Various template-driven ligation reactions are described in the following references, which are incorporated by reference: Whiteley et al., US Pat. No. 4,883,750; Letsinger et al., US Pat. No. 5,476,930; Fung et al., US Kool, U.S. Pat. No. 5,426,180; Landegren et al., U.S. Pat. No. 5,871,921; Xu and Kool, Nucleic Acids Research, 27: 875-881 (1999); Higginst et al., Methods in Enzymol: 71 (1979); Engler et al., The Enzymes, 15: 3-29 (1982); and Namsaraev, US Patent Application Publication No. 2004/0110213.

標的配列の末端にライゲートさせることができる様々な種類のアダプターが下記に議論される。用語「アダプター」とは、少なくとも部分的に二本鎖であり、隣接する標的配列の増幅のためのプライマー部位として適切な配列を含有する核酸、シーケンシングプラットフォームにより特定され、標的配列を含むライゲーション部位に隣接する配列に位置するシーケンシングプライマー、及び核酸供給源の同一性を追跡するための一意識別子及び/又はサンプルの同一性を追跡するためのバーコードを指す。シーケンシング反応におけるアダプター及びその使用の例は、米国特許第5888737号、米国特許第6013445号、米国特許第6060245号、米国特許第6175002号、米国特許第7741463号、米国特許第7803550号、米国特許第8029993号、米国特許第8288097号、米国特許出願公開第2004/0209299号、米国特許出願公開第2007/0172839号、及び米国特許出願公開第2012/0238738号などの刊行物に見出すことができる。   Various types of adapters that can be ligated to the end of the target sequence are discussed below. The term “adapter” is a nucleic acid that is at least partially double-stranded and contains a sequence that is suitable as a primer site for amplification of an adjacent target sequence, identified by a sequencing platform, and includes a ligation site comprising the target sequence Sequencing primers located in sequences adjacent to and a unique identifier for tracking the identity of the nucleic acid source and / or a barcode for tracking the identity of the sample. Examples of adapters and their use in sequencing reactions are described in US Pat. No. 5,888,737, US Pat. No. 6,013,445, US Pat. No. 6,060,245, US Pat. No. 6,175,502, US Pat. No. 7,741,463, US Pat. No. 7,803,550, US Pat. No. 8029993, U.S. Pat. No. 8288097, U.S. Patent Application Publication No. 2004/0209299, U.S. Patent Application Publication No. 2007/0172839, and U.S. Patent Application Publication No. 2012/0238738.

次いで、切断可能な一本鎖ヘアピンアダプター、二本鎖Yアダプター、完全二本鎖アダプター又は市販のDNAシーケンシングプラットフォーム上での下流のシーケンシングに適した当該技術分野で既知のその他任意の形態のアダプターを標的DNAの3’及び/又は5’末端にライゲートすることができる。ヘアピンアダプター内の切断可能部位は、dU、他の修飾ヌクレオチド、1つ以上のRNAヌクレオチド又は化学的に切断可能な部位であり得る。これらは、米国特許出願公開第2012/0238738号に記載の修飾塩基のいずれかを含み得る切断可能部位の例としてのみ役立つ。ヘアピンアダプターを使用する利点は、これらのアダプターが当該技術分野のその他のアダプターよりも短く、ライゲーションのために効果的に使用できることである。さらに、これらのアダプターは、残留一本鎖エキソヌクレアーゼ活性に対してより耐性がある。その上、標的分子及び標的単離プローブのヘアピンアダプターへのライゲーションは、標的分子を親和性ドメインに共有結合する。ヘアピンアダプターを切断し、任意の二本鎖領域を変性させた後、切断されたヘアピン配列上のプライマー部位を含有する一本鎖領域を用いて、標的配列を増幅することができる。   Then a cleavable single stranded hairpin adapter, double stranded Y adapter, full double stranded adapter or any other form known in the art suitable for downstream sequencing on a commercial DNA sequencing platform. Adapters can be ligated to the 3 ′ and / or 5 ′ ends of the target DNA. The cleavable site within the hairpin adapter can be dU, other modified nucleotides, one or more RNA nucleotides, or a chemically cleavable site. These serve only as examples of cleavable sites that may contain any of the modified bases described in US Patent Application Publication No. 2012/0238738. The advantage of using hairpin adapters is that these adapters are shorter than other adapters in the art and can be used effectively for ligation. In addition, these adapters are more resistant to residual single-stranded exonuclease activity. Moreover, ligation of the target molecule and target isolation probe to the hairpin adapter covalently binds the target molecule to the affinity domain. After cleaving the hairpin adapter and denaturing any double stranded region, the target sequence can be amplified using the single stranded region containing the primer site on the cleaved hairpin sequence.

アダプターは、Tオーバーハングを含んでもよいが、平滑末端していてもよい。アダプターは、NGSプラットフォーム表面での増幅に必要な追加の配列と共に短いアダプター配列を含有することができ、又はNGSプラットフォームによって必要とされる完全な3’又は5’配列を供給することもできる。   The adapter may include a T overhang, but may be blunt ended. The adapter can contain a short adapter sequence with additional sequences required for amplification on the NGS platform surface, or can supply the complete 3 'or 5' sequence required by the NGS platform.

一方又は両方の末端のアダプターは、miSEQ HiSEQ(登録商標)(カリフォルニア州サンディエゴのIllumina)、Ion Torrent(登録商標)(カリフォルニア州カールズバッドのApplied Biosystems)、ナノポアベースのシーケンサー(英国オックスフォードのOxford Nanopore)又はPacBio RS II(カリフォルニア州メンロパークのPacific Biosciences)等のシーケンシングプラットフォームでのシーケンシングに適した一意識別子(UID)又は分子バーコードを任意選択的に含有する。本明細書で使用される「一意識別子」(UID)という用語は、同一性(例えばタグDNA配列)がサンプル中のポリヌクレオチドを識別するために使用され得るポリヌクレオチドと結合される、タグ又はタグの組み合わせを指す。いくつかの実施態様において、ポリヌクレオチド上のUIDは、ポリヌクレオチドが由来する供給源を同定するために使用される。供給源識別子は、バーコードとも称される。例えば、核酸サンプルは、異なる供給源に由来するポリヌクレオチドのプール(例えば異なる個体、異なる組織若しくは細胞に由来するポリヌクレオチド、又は異なる時点で単離されるポリヌクレオチド)であり得、各異なる供給源由来のポリヌクレオチドは一意なUIDでタグ付けされる。このように、UIDは、ポリヌクレオチドとその供給源との間の相関をもたらす。いくつかの実施態様では、UIDは、サンプル中の各個々のポリヌクレオチドに一意にタグを付けるために使用される。サンプル中の一意なUIDの数の同定は、サンプル中に個々のポリヌクレオチドがいくつ存在するのか、又は操作されたポリヌクレオチドサンプルがいくつの元のポリヌクレオチドから由来したかという読み出しを提供することができる。本明細書で利用される識別子の例には、Brennerら、Proc.Natl.Acad.Sci.,97:1665−1670(2000);Churchら、Science,240:184−188(1988);Shoemakerら、Nature Genetics,14:450−456(1996);及びHardenbolら、Nature Biotechnology,21:673−678(2003)に示されている例が含まれる。   One or both end adapters are miSEQ HiSEQ® (Illumina, San Diego, Calif.), Ion Torrent® (Applied Biosystems, Carlsbad, Calif.), Nanopore-based sequencer (Oxford Nanopore, Oxford, UK) or Optionally contains a unique identifier (UID) or molecular barcode suitable for sequencing on a sequencing platform such as PacBio RS II (Pacific Biosciences, Menlo Park, Calif.). As used herein, the term “unique identifier” (UID) is a tag or tag in which identity (eg, a tag DNA sequence) is combined with a polynucleotide that can be used to identify a polynucleotide in a sample. Refers to a combination of In some embodiments, the UID on the polynucleotide is used to identify the source from which the polynucleotide is derived. The source identifier is also referred to as a barcode. For example, the nucleic acid sample can be a pool of polynucleotides from different sources (eg, polynucleotides from different individuals, different tissues or cells, or polynucleotides isolated at different times), from each different source Of polynucleotides are tagged with a unique UID. Thus, UID provides a correlation between a polynucleotide and its source. In some embodiments, the UID is used to uniquely tag each individual polynucleotide in the sample. Identification of the number of unique UIDs in a sample can provide a readout of how many individual polynucleotides are present in the sample or from which original polynucleotide the engineered polynucleotide sample was derived from. it can. Examples of identifiers utilized herein include Brenner et al., Proc. Natl. Acad. Sci. 97: 1665-1670 (2000); Church et al., Science, 240: 184-188 (1988); Shomaker et al., Nature Genetics, 14: 450-456 (1996); and Hardenbol et al., Nature Biotechnology, 21: 673-. 678 (2003).

アダプター濃度、リガーゼ濃度、リガーゼ反応量、反応緩衝液、反応体積、インキュベーション時間及び温度は変えることができる。さらに、ライゲーション後の洗浄工程によって、非ライゲートアダプター及びアダプターダイマーの除去が可能になる。   Adapter concentration, ligase concentration, ligase reaction volume, reaction buffer, reaction volume, incubation time and temperature can be varied. Furthermore, the non-ligated adapter and adapter dimer can be removed by a washing step after ligation.

本明細書で使用される「プライマー」という用語は、ポリヌクレオチド鋳型とともに二重鎖を形成すると核酸合成の開始点として作用し、伸長二重鎖が形成されるように鋳型に沿ってその3’末端から伸長させることができる、天然又は合成のオリゴヌクレオチドを指す。伸長プロセス中に追加されるヌクレオチドの配列は、鋳型ポリヌクレオチドの配列によって決定される。通常、プライマーは、DNAポリメラーゼによって伸長される。プライマーは一般に、プライマー伸長産物の合成におけるその使用に対応する長さであり、通常、例えば10ntから75nt、15ntから60nt、15ntから40nt、18ntから30nt、20ntから40nt、21ntから50nt、22ntから45nt、25ntから40nt等のように8ntから100ntの間の範囲の長さ、より典型的には18ntから40nt、20ntから35nt、21ntから30ntの間の範囲の長さのサイズから選択される類似の又は同一の長さ及び所定の範囲の任意の長さのものである。典型的なプライマーは、15ntから45nt、18ntから40nt、20ntから30nt、21ntから25nt等のように10ntから50ntの間の長さ及び所定の範囲の任意の長さであり得る。   As used herein, the term “primer” is used as a starting point for nucleic acid synthesis when a duplex is formed with a polynucleotide template, and 3 ′ along the template such that an extended duplex is formed. Refers to a natural or synthetic oligonucleotide that can be extended from the end. The sequence of nucleotides added during the extension process is determined by the sequence of the template polynucleotide. Usually, the primer is extended by a DNA polymerase. A primer is generally of a length corresponding to its use in the synthesis of a primer extension product, typically 10 nt to 75 nt, 15 nt to 60 nt, 15 nt to 40 nt, 18 nt to 30 nt, 20 nt to 40 nt, 21 nt to 50 nt, 22 nt to 45 nt Similar, selected from a length in the range between 8 nt and 100 nt, such as 25 nt to 40 nt, more typically a length in the range between 18 nt to 40 nt, 20 nt to 35 nt, 21 nt to 30 nt Or the same length and the arbitrary length of a predetermined range. Typical primers can be between 10 nt and 50 nt in length, such as 15 nt to 45 nt, 18 nt to 40 nt, 20 nt to 30 nt, 21 nt to 25 nt, etc. and any length in the predetermined range.

プライマーは通常、増幅における最大効率のために一本鎖であるが、代わりに二本鎖でもよい。二本鎖の場合、プライマーは通常、まずその鎖を分離するように処理されてから、伸長産物を調製するために使用される。この変性工程は、通常は熱に影響されるが、代わりにアルカリを用いて行い、続いて中和することができる。したがって、「プライマー」は、ポリメラーゼによる合成を開始するためのプライマー/鋳型複合体を生成するために、鋳型に相補的な少なくとも3’配列と、鋳型との水素結合又はハイブリダイゼーションによる複合体とを有し、DNA合成の過程で鋳型に相補的なその3’末端に連結された、共有結合した塩基を付加することにより伸長される。   Primers are usually single stranded for maximum efficiency in amplification, but may alternatively be double stranded. If double stranded, the primer is usually first treated to separate its strands and then used to prepare extension products. This denaturation step is usually affected by heat, but can instead be performed with alkali and subsequently neutralized. Thus, a “primer” comprises at least a 3 ′ sequence complementary to a template and a complex by hydrogen bonding or hybridization with the template to generate a primer / template complex for initiating synthesis by polymerase. And is extended by adding a covalently bonded base linked to its 3 'end that is complementary to the template in the course of DNA synthesis.

本方法の実施態様におけるプライマーの使用は、従来のPCR濃縮法と比較して、標的配列のより均一な増幅をもたらす。PCR濃縮において、各プライマー対は標的配列に特異的であるが、本明細書では核酸の集団中のすべての標的配列に対して、単一のプライマー対が用いられる。   The use of primers in this method embodiment results in more uniform amplification of the target sequence compared to conventional PCR enrichment methods. In PCR enrichment, each primer pair is specific for a target sequence, but a single primer pair is used herein for all target sequences in a population of nucleic acids.

一本鎖センス鎖とアンチセンス鎖の双方とも、標的単離配列に結合された捕捉ドメインによって好ましくは固定化され、ひいては標的領域の3’末端にハイブリダイズされて、アダプターへのライゲーションに適した二本鎖のDNA領域を形成する。この時点で、標的配列の3’末端以外の任意の3’一本鎖DNA領域は、エキソヌクレアーゼ切断によって好ましくは除去されている。標的鋳型の5’末端で5’プローブをハイブリダイズし、標的領域以外の外来DNAを除去し、5’アダプターを付加した後、核酸標的鋳型を増幅し、配列決定することができる。   Both the single-stranded sense strand and the antisense strand are preferably immobilized by a capture domain attached to the target isolation sequence, and thus hybridized to the 3 ′ end of the target region, suitable for ligation to the adapter. A double-stranded DNA region is formed. At this point, any 3 'single stranded DNA region other than the 3' end of the target sequence is preferably removed by exonuclease cleavage. After hybridizing a 5 'probe at the 5' end of the target template, removing foreign DNA other than the target region and adding a 5 'adapter, the nucleic acid target template can be amplified and sequenced.

3’アダプター及び5’アダプターが標的配列に共有結合している場合、部分的に二本鎖の分子の変性は、いずれか一方の末端でアダプター配列を有する一本鎖配列をもたらす。ここで、これらのアダプター配列は、PCR又は2つのプライミング配列に依拠する当該技術分野で知られている他の増幅プロトコールによるDNA増幅のためのプライマー部位として働く。濃縮された標的DNAは、例えば熱、NaOH又はホルムアミドを用いて捕捉ドメインから溶出することができるが、又はこれらが捕捉ドメインに用いられる場合には、ビーズに付着したままでもよい。増幅後、増幅したライブラリーは、ビーズ(例えばAmpure(登録商標)ビーズ、Beckman Coulter(カリフォルニア州ブレア)参照)を用いるか又はカラム精製(例えばカリフォルニア州バレンシアのQiagen製の精製製品)又は当該技術分野で既知のその他のDNA精製法により浄化することができる。次いで、得られたライブラリーを定量化し、配列決定することができる。   When the 3'adapter and 5'adapter are covalently linked to the target sequence, partial denaturation of the double-stranded molecule results in a single-stranded sequence with the adapter sequence at either end. Here, these adapter sequences serve as primer sites for DNA amplification by PCR or other amplification protocols known in the art that rely on two priming sequences. The concentrated target DNA can be eluted from the capture domain using, for example, heat, NaOH or formamide, or may remain attached to the beads if they are used in the capture domain. After amplification, the amplified library may be used with beads (see, eg, Ampure® beads, Beckman Coulter (Blair, Calif.)) Or column purification (eg, a purified product from Qiagen, Valencia, Calif.) Or the art. Can be purified by other known DNA purification methods. The resulting library can then be quantified and sequenced.

標的濃縮後に本明細書において任意選択的に用いられる増幅方法には、PCR、逆転写酵素PCR(RT−PCR)、ローリングサークル増幅、リアルタイムPCR、リガーゼ連鎖反応(LCR)、転写増幅、Qベータレプリカーゼ介在RNA増幅又は等温増幅法、例えば転写介在増幅、RNAのシグナル介在増幅技術、鎖置換増幅、ローリングサークル増幅、ループ介在等温増幅(LAMP)又はヘリカーゼ依存性増幅(例えばGill et al. Nucleosides Nucleotides Nucleic Acids, 27:224-43 (2008);米国特許第5242794号、米国特許第5494810号、米国特許第4988617号及び米国特許第6582938号:米国特許第4683195号;米国特許第4965188号;米国特許第4683202号;米国特許第4800159号(PCR);米国特許第5210015号(TaqManTM(カリフォルニア州のLife Technologies)を用いたリアルタイムPCR);米国特許第6174670号;特開平4−262799号(ローリングサークル増幅);Leone, et al. Nucleic Acids Research, 26: 2150-2155 (1998)を参照のこと)のいずれも含まれ得る。 Amplification methods optionally used herein after target enrichment include PCR, reverse transcriptase PCR (RT-PCR), rolling circle amplification, real-time PCR, ligase chain reaction (LCR), transcription amplification, Qbeta replicase Intervening RNA or isothermal amplification methods such as transcription mediated amplification, RNA signal mediated amplification techniques, strand displacement amplification, rolling circle amplification, loop mediated isothermal amplification (LAMP) or helicase dependent amplification (eg Gill et al. Nucleosides Nucleotides Nucleic Acids 27: 224-43 (2008); US Pat. No. 5,242,794, US Pat. No. 5,494,810, US Pat. No. 4,988,617 and US Pat. No. 6,582,938: US Pat. No. 4,683,195; US Pat. No. 4,965,188; No .: US Pat. No. 4,800,159 (PCR ; U.S. Patent No. 5210015 (TaqMan TM (CA Life Technologies) Real-time PCR was used); U.S. Pat. No. 6,174,670; JP-A-4-262799 (rolling circle amplification);. Leone, et al Nucleic Acids Research, 26: 2150-2155 (1998)).

NGSは、従来のシーケンシング法(例えば標準的なサンガー又はマクサム−ギルバートのシークエンシング法)を用いて、前例のないスピードでポリヌクレオチドを配列決定する能力を有するシークエンシング技術を指す。この前例のないスピードは、数千から数百万のシークエンシング反応を並行して実施し、読み取ることにより達成される。NGSシーケンシングプラットフォームには、限定されないが、次のものが含まれる:Massively Parallel Signature Sequencing(カリフォルニア州ヘイワードのLynx Therapeutics);454ピロシーケンシング(コネチカット州ブランフォードの454 Life Sciences/Roche Diagnostics);固相の可逆的色素ターミネーターシーケンシング(カリフォルニア州サンディエゴのSolexa/Illumina);SOLiD(登録商標)技術(ニューヨーク州グランドアイルのApplied Biosystems/Life Technologies);イオン半導体シーケンシング(Ion TorrentTM、ニューヨーク州グランドアイルのLife Technologies);及びDNAナノボールシーケンシング(カリフォルニア州マウンテンビューのComplete Genomics)。いくつかのNGSプラットフォームの説明については、次の文献において見出すことができる:Shendureら、Nature,26:1135−1145(2008);Mardis,Trends in Genetics,24:133−141(2007);Suら、Expert Rev Mol Diagn,11(3):333−43(2011);及びZhangら、J Genet Genomics,38(3):95−109(2011)。 NGS refers to a sequencing technique that has the ability to sequence polynucleotides at unprecedented speed using conventional sequencing methods (eg, standard Sanger or Maxam-Gilbert sequencing methods). This unprecedented speed is achieved by performing and reading thousands to millions of sequencing reactions in parallel. NGS sequencing platforms include, but are not limited to: Massively Parallel Signature Sequencing (Lynx Therapeutics, Hayward, Calif.); 454 Pyrosequencing (454 Life Science, Branford, Conn.) reversible dye terminators sequencing phase (San Diego, CA Solexa / Illumina); SOLiD (TM) technology (Grand Isle of Applied Biosystems / Life technologies, NY); ion semiconductor sequencing (ion Torrent TM, Grand a New York Life Technologies) Le; and DNA nano ball sequencing (Complete Genomics of Mountain View, California). A description of several NGS platforms can be found in the following literature: Shendure et al., Nature, 26: 1135-1145 (2008); Mardis, Trends in Genetics, 24: 133-141 (2007); Su et al. , Expert Rev Mol Dian, 11 (3): 333-43 (2011); and Zhang et al., J Genet Genomics, 38 (3): 95-109 (2011).

上記の本発明の方法の実施態様は、次のように要約することができる:標的が濃縮された核酸ライブラリーは、例えば真核生物由来のgDNA又は核酸の集団へのRNA転写物などの核酸サンプルを所定のサイズ範囲に断片化すること、マトリックスを結合するための親和性標識を含有する標的単離プローブを加えること(ここで標的単離プローブは核酸断片中の標的配列にわたる)、並びに1以上の3’及び5’特異的ヌクレアーゼ又は1以上の3’エキソヌクレアーゼ、任意選択的に1以上の5’エキソヌクレアーゼ(例えばExoVII)を、同時に(例えば組み合わせて)又は異なる工程で用いて非標的核酸を除去することによって、生成することができる。3’アダプター、任意選択的に5’アダプターは、同時に(例えば組み合わせて)又は本方法における異なる工程で標的DNAの末端に付加することができる。次に、濃縮されたDNAの増幅お及びシーケンシングが続いてもよい。アダプター配列又はプローブ配列には、バーコード及び一意識別子配列を任意選択的に含めることができる。   The above-described method embodiments of the present invention can be summarized as follows: A nucleic acid library enriched in a target is a nucleic acid such as eukaryotic gDNA or an RNA transcript into a population of nucleic acids. Fragmenting the sample into a predetermined size range, adding a target isolation probe containing an affinity label to bind the matrix, where the target isolation probe spans the target sequence in the nucleic acid fragment, and 1 Non-target using the above 3 ′ and 5 ′ specific nucleases or one or more 3 ′ exonucleases, optionally one or more 5 ′ exonucleases (eg, ExoVII) simultaneously (eg, in combination) or in different steps It can be generated by removing the nucleic acid. A 3 'adapter, optionally a 5' adapter, can be added to the end of the target DNA simultaneously (eg in combination) or at different steps in the method. The amplification and sequencing of the concentrated DNA may then be followed. The adapter sequence or probe sequence can optionally include a barcode and a unique identifier sequence.

別の態様において、少なくとも1のプローブが親和性結合ドメインを含む標的単離プローブである3’及び5’標的プローブは、同時に(例えば組み合わせて)又は異なる工程においてハイブリダイズされ、この場合標的の長さは両方のプローブのハイブリダイゼーションにより決定され、一本鎖の非標的配列はエキソヌクレアーゼにより除去される。あるいは、特異的な標的単離プローブ及び3’エキソヌクレアーゼを用いて標的の3’末端を決定し、続いて、標的配列の未決定の5’末端を形成するために、5’ヌクレアーゼの非存在下で非特異的プローブを伸長させることができる。   In another embodiment, 3 ′ and 5 ′ target probes, wherein at least one probe is a target isolation probe comprising an affinity binding domain, are hybridized simultaneously (eg, in combination) or in different steps, in which case the length of the target The length is determined by hybridization of both probes and single stranded non-target sequences are removed by exonuclease. Alternatively, a specific target isolation probe and 3 ′ exonuclease is used to determine the 3 ′ end of the target, followed by the absence of the 5 ′ nuclease to form the undetermined 5 ′ end of the target sequence Under non-specific probes can be extended.

本明細書に記載の方法についての実施態様は、開始点を特定することを含んでおり、したがって標的配列が決定されて、オフターゲット配列が存在しないという理由から、以前のハイブリダイゼーションに基づく方法よりも有利であり、他のハイブリダイゼーション法において標的配列は、非標的配列との未決定の境界を有する集団中の核酸内に残存する。さらに、両方の鎖を捕捉し、従来のハイブリダイゼーション法よりも多くのAT又はGCリッチ配列を標的内で許容することができる。   Embodiments for the methods described herein include identifying the starting point, and therefore, because the target sequence is determined and no off-target sequence is present, than the previous hybridization-based method. Also, in other hybridization methods, the target sequence remains in the nucleic acids in the population having undetermined boundaries with non-target sequences. In addition, both strands can be captured and more AT or GC rich sequences can be tolerated in the target than conventional hybridization methods.

先行技術におけるPCRに基づく方法に対する本発明の実施態様の利点は、人工の配列が標的の末端に導入されないことである。さらに、本発明の実施態様は、スケーラブルであり、増幅バイアスがより少なく、標的分子に一意なUIDを付加することが可能である。UIDは、同じ標的分子のPCR複製物の同定を可能にする。その結果、PCR複製物を分析中に濾過することができ、突然変異又は転写物の正確な定量が可能になる。   An advantage of embodiments of the present invention over PCR-based methods in the prior art is that no artificial sequence is introduced at the end of the target. Furthermore, embodiments of the present invention are scalable, have less amplification bias, and can add unique UIDs to target molecules. The UID allows the identification of PCR replicas of the same target molecule. As a result, PCR replicates can be filtered during analysis, allowing accurate quantification of mutations or transcripts.

「キット」という用語は、本発明の方法を実施するための物質又は試薬を送達するための任意の送達システムを指す。反応アッセイに関連して、かかる送達システムは、ある位場所から別の場所への反応試薬(例えば適切な容器内のプローブ、酵素、アダプター、プライマー等)及び/又は支持材(例えば緩衝液、アッセイを実施するための指示書など)の保存、移送又は送達を可能にするシステムを含む。例えば、キットは、該当する反応試薬及び/又は支持材を収容する1つ以上の密閉容器(例えば箱)を含む。かかる内容物は、一緒に又は別々に、対象とするレシピエントに送達され得る。例えば、第一の容器はアッセイにおける使用のための酵素を収容し、第二の容器はプローブを収容してもよい。キットは、非標的及び標的配列を含有する核酸サンプルから標的鋳型を選択し、濃縮するために考案されてもよい。キットは、キットの考案者若しくは製造者によって又は研究者によって定義された第一の親和性結合ドメインを含む3’プローブ(標的単離プローブ);5’プローブ;アダプター;プライマー:ヌクレアーゼ;リガーゼ;ポリメラーゼ;緩衝液;ヌクレオチド;除去可能なブロッキングオリゴヌクレオチド及び/又はマトリックスと結合される捕捉ドメインを含み得る。キットは、DNAライブラリーを作成するための1以上の緩衝溶液及び標準液をさらに含み得る。   The term “kit” refers to any delivery system for delivering substances or reagents for performing the methods of the invention. In connection with reaction assays, such delivery systems can be used from one location to another, such as reaction reagents (eg, probes, enzymes, adapters, primers, etc. in appropriate containers) and / or supports (eg, buffers, assays). Including a system for enabling storage, transport or delivery). For example, the kit includes one or more sealed containers (eg, boxes) that contain the appropriate reaction reagents and / or support materials. Such contents may be delivered to the intended recipient together or separately. For example, a first container may contain an enzyme for use in an assay and a second container may contain a probe. A kit may be devised for selecting and enriching a target template from a nucleic acid sample containing non-target and target sequences. The kit comprises a 3 ′ probe (target isolation probe) comprising a first affinity binding domain as defined by the inventor or manufacturer of the kit or by the researcher; 5 ′ probe; adapter; primer: nuclease; ligase; polymerase A buffer; a nucleotide; a removable blocking oligonucleotide and / or a capture domain associated with the matrix. The kit can further include one or more buffer solutions and standards for creating a DNA library.

図10に記載の方法についての実施態様では、ハイブリダイゼーション法で起こるような大きな断片を配列決定する必要性を排除しながら、二重濾過の必要性も回避する。ハイブリダイゼーション法では、ランダム末端を有する大きな断片が内部で増幅される。バイオインフォマティクススキャンは、同じ末端を有すると同定されたPCR複製を検出し、除去することができる。   The embodiment for the method described in FIG. 10 also avoids the need for double filtration while eliminating the need to sequence large fragments as occurs in hybridization methods. In hybridization methods, large fragments with random ends are amplified internally. A bioinformatics scan can detect and remove PCR replicas identified as having the same end.

対照的に、短い断片にアダプター末端を付加するPCR法は、すべてのリードが同じ開始及び終了配列を有するように決定された末端を有し、したがってコンピューターによってフィルターにかけることができる。   In contrast, PCR methods that add adapter ends to short fragments have ends determined so that all reads have the same start and end sequences and can therefore be filtered by a computer.

図10に示す実施態様は、5’末端をPCR複製物についてスキャンすることができるように、1つの決定された末端(3’末端)及び1つのランダム末端(5’末端)を有する。   The embodiment shown in FIG. 10 has one determined end (3 'end) and one random end (5' end) so that the 5 'end can be scanned for PCR replicas.

本明細書で引用されるすべての文書は、各個々の文書が参照により援用されることが具体的かつ個別に示された場合と同程度まで、あらゆる目的のために、それらの全体が出典明示により援用される。   All documents cited herein are expressly incorporated in their entirety for all purposes to the same extent as if each individual document was specifically and individually indicated to be incorporated by reference. Incorporated by

表1:本方法の態様における修飾ヌクレオチドの使用の例は、本願に記載されている。図は、修飾がどこでどのように用いられ得るかの例を提供するが、特定の目的のために限定することを意図するものではない。表に記載されている使用を可能にするための修飾の使用は、当該技術分野でよく知られている。

Figure 2017537657
Figure 2017537657
Figure 2017537657
Figure 2017537657
Table 1: Examples of the use of modified nucleotides in this method aspect are described in this application. The figures provide examples of where and how modifications can be used, but are not intended to be limiting for a particular purpose. The use of modifications to enable the uses described in the table is well known in the art.
Figure 2017537657
Figure 2017537657
Figure 2017537657
Figure 2017537657

以下の実施例は、特定の温度、インキュベーション時間、及び緩衝液を記載している。ただし、これらの条件は、限定することを意図するものではない。当業者であれば、様々な配列を濃縮するための出発物質として本明細書で例示されているヒトgDNAは限定を意図するものではないこと、また、同程度のハイブリダイゼーション又は増幅を行うためにpH、緩衝液及び塩の条件並びにインキュベーション時間を変化させ得る範囲が以下の指定された条件に限定されないことを理解するはずである。同様に、親和性ドメインとしてのビオチンの記載は、限定することを意図するものではない。特異的切断可能部位を有する特異的アダプターもまた、例として以下に記載されているが、限定することを意図するものではない。工程の順序を例として説明する。工程の順序が変更可能であることは理解されよう。さらに、いくつかの工程は、便宜的に追加又は削除することができる。   The following examples describe specific temperatures, incubation times, and buffers. However, these conditions are not intended to be limiting. One skilled in the art will recognize that the human gDNA exemplified herein as a starting material for enriching various sequences is not intended to be limiting and to perform the same degree of hybridization or amplification. It should be understood that the ranges in which pH, buffer and salt conditions and incubation time can be varied are not limited to the specified conditions below. Similarly, the description of biotin as an affinity domain is not intended to be limiting. Specific adapters having specific cleavable sites are also described below by way of example and are not intended to be limiting. The process sequence will be described as an example. It will be understood that the order of the steps can be changed. In addition, some steps can be added or deleted for convenience.

実施例1: 1つの標的単離プローブによるシーケンシングのための、標的配列を濃縮するための方法。
300bp断片のための製造業者のプロトコールに従い、Covarisの装置を用いてヒトgDNA(1μg)を剪断した(図1(1))。100塩基長であり、ビオチンと結合された標的単離プローブ20nmolを含有するハイブリダイゼーション反応緩衝液25μlに、剪断したDNAを加えた。この場合、100塩基配列は100nt標的配列に相補的であった(図1(2))。JohnらのBioTechniques,44,259−264(2008)に従って、ハイブリダイゼーション反応を実施した。ハイブリダイゼーション後、標的単離プローブ/標的DNA二重鎖を親水性のストレプトアビジンビーズ(マサチューセッツ州イプスウィッチのNew England Biolabs)50μlに30分間結合させ(図1(3))、標準BW Buffer(5mM トリス−HCl(pH7.5)、0.5mM EDTA、1M NaCl)で洗浄した。
本明細書を通して使用される場合、「反応混合物」とは、反応を実施するのに必要な反応物すべてを含有する溶液を意味し、これには、限定されないが、反応中の選択したレベルでpHを維持するための緩衝剤、酵素、基質、塩、補因子、捕捉剤等が含まれ得る。
ビーズを、1×NEBuffer4、2.5UのエキソヌクレアーゼT(マサチューセッツ州イプスウィッチのNew England Biolabs)及び2.5UのエキソヌクレアーゼIを含有する反応混合物(マサチューセッツ州イプスウィッチのNew England Biolabs)50μlに再懸濁させ、37℃で10分間インキュベートした。磁気ビーズを洗浄し、30ユニットのRecJfを含有する1XNEBuffer2(マサチューセッツ州イプスウィッチのNew England Biolabs)50μlに再懸濁させ、20℃で10分間インキュベートした(図1(4))。
磁気ビーズを洗浄し、dA−Tailing反応混合物(マサチューセッツ州イプスウィッチのNew England Biolabs)50μlに再懸濁させ、37℃で30分間インキュベートした。次いで、ビーズを洗浄し、45μlの1XQuick Ligation緩衝液(マサチューセッツ州イプスウィッチのNew England Biolabs)及びIllumina用のNEBNext(登録商標)アダプター(マサチューセッツ州イプスウィッチのNew England Biolabs)に再懸濁させた。Quick T4 DNAリガーゼ(マサチューセッツ州イプスウィッチのNew England Biolabs)5μlをライゲーション混合物に添加し、室温で15分間インキュベートした(図1(5))。
次いで、ビーズを洗浄し、5μlのUSERTM酵素(マサチューセッツ州イプスウィッチのNew England Biolabs)及びIllumina用のNEBNext(登録商標)プライマー(マサチューセッツ州イプスウィッチのNew England Biolabs)を含有する1XHotStart OneTaq(登録商標)PCR Master Mix(マサチューセッツ州イプスウィッチのNew England Biolabs)に再懸濁させた。PCR混合物を37℃で15分間インキュベートした。次のPCRサイクル条件が用いられる:95℃で2分間、続いて95℃で30秒間、60℃で30秒間及び72℃で1分間を25サイクル(図1(6))。25サイクルの終わりに、PCR混合物を72℃で5分間インキュベートした。次いで、標的配列から得られたPCR産物を、従来の方法を用いて配列決定した。
Example 1: Method for enriching target sequences for sequencing with one target isolation probe.
Human gDNA (1 μg) was sheared using the Covaris apparatus according to the manufacturer's protocol for the 300 bp fragment (FIG. 1 (1)). Sheared DNA was added to 25 μl of hybridization reaction buffer that was 100 bases long and contained 20 nmol of target isolation probe conjugated with biotin. In this case, the 100 base sequence was complementary to the 100 nt target sequence (FIG. 1 (2)). Hybridization reactions were performed according to John et al., BioTechniques, 44, 259-264 (2008). After hybridization, the target isolation probe / target DNA duplex was bound to 50 μl of hydrophilic streptavidin beads (New England Biolabs, Ipswich, Mass.) For 30 minutes (FIG. 1 (3)) and standard BW Buffer (5 mM) Washed with Tris-HCl (pH 7.5), 0.5 mM EDTA, 1 M NaCl).
As used throughout this specification, "reaction mixture" means a solution containing all of the reactants necessary to carry out the reaction, including but not limited to a selected level during the reaction. Buffers, enzymes, substrates, salts, cofactors, capture agents, etc. for maintaining the pH may be included.
Resuspend the beads in 50 μl of reaction mixture containing 1 × NEBuffer4, 2.5 U Exonuclease T (New England Biolabs, Ipswich, Mass.) And 2.5 U Exonuclease I (New England Biolabs, Ipswich, Mass.). Suspended and incubated at 37 ° C. for 10 minutes. The magnetic beads were washed and resuspended in 50 μl of 1 × NEBuffer2 (New England Biolabs, Ipswich, Mass.) Containing 30 units of RecJf and incubated at 20 ° C. for 10 minutes (FIG. 1 (4)).
The magnetic beads were washed and resuspended in 50 μl of dA-Tailing reaction mixture (New England Biolabs, Ipswich, Mass.) And incubated at 37 ° C. for 30 minutes. The beads were then washed and resuspended in 45 μl of 1 × Quick Ligation buffer (New England Biolabs, Ipswich, Mass.) And the NEBNext® adapter for Illumina (New England Biolabs, Ipswich, Mass.). 5 μl of Quick T4 DNA ligase (New England Biolabs, Ipswich, Mass.) Was added to the ligation mixture and incubated for 15 minutes at room temperature (FIG. 1 (5)).
The beads were then washed and the XT ™ trademark containing 5 μl of the USER enzyme (New England Biolabs, Ipswich, Mass.) And the NEBNext® primer for Illumina (New England Biolabs, Ipswich, Mass.). ) Resuspended in PCR Master Mix (New England Biolabs, Ipswich, Mass.). The PCR mixture was incubated at 37 ° C. for 15 minutes. The following PCR cycle conditions are used: 95 ° C. for 2 minutes, followed by 25 cycles of 95 ° C. for 30 seconds, 60 ° C. for 30 seconds and 72 ° C. for 1 minute (FIG. 1 (6)). At the end of 25 cycles, the PCR mixture was incubated at 72 ° C. for 5 minutes. The PCR product obtained from the target sequence was then sequenced using conventional methods.

実施例2: 1つの標的単離プローブによるシーケンシングのための、標的配列を濃縮するための方法の変形例。
実施例1及び図1中のプロトコールを、ストレプトアビジンビーズへの結合によって進め、図2A(7)−(11)に記載の工程が(1)−(3)の後に続いた。
1XNEBuffer4、2.5UのエキソヌクレアーゼT及び2.5UのエキソヌクレアーゼIを含有する反応混合物50μlにビーズを再懸濁させ、37℃で10分間インキュベートした(7)。
磁気ビーズを洗浄し、dA−Tailing反応混合物50μlに再懸濁させ、37℃で30分間インキュベートした。次いで、ビーズを洗浄し、45μlの1XQuick Ligation及びIllumina用のNEBNextアダプターに再懸濁させた。Quick T4 DNAリガーゼ5μlをライゲーション混合物に添加し、室温で15分間インキュベートした(図2A(8))。
磁気ビーズを洗浄し、20ユニットのエキソヌクレアーゼVIIを含有する1XエキソヌクレアーゼVII緩衝液(ウィスコンシン州マディソンのEpicentre)50μlに再懸濁させ、30°Cで10分間インキュベートした(9)。製造業者のプロトコールに従って、酵素を熱失活させた。ビーズを洗浄し、15UのT4 DNAポリメラーゼ及び100μM dNTPを含有する1XNEBuffer2(マサチューセッツ州イプスウィッチのNew England Biolabs)50μlに再懸濁させた。反応物を20℃で30分間インキュベートした。
次いで、ビーズを洗浄し、45μlの1XQuick Ligation緩衝液及びIllumina用のNEBNextアダプターに再懸濁させた。Quick T4 DNAリガーゼ5μlをライゲーション混合物に添加し、室温で15分間インキュベートした(10)。
アダプターのUSER切断及びPCR増幅を、実施例1に記載の通りに実施した。
Example 2: A variation of the method for enriching target sequences for sequencing with one target isolation probe.
The protocol in Example 1 and FIG. 1 proceeded by binding to streptavidin beads, and the steps described in FIGS. 2A (7)-(11) followed (1)-(3).
The beads were resuspended in 50 μl of reaction mixture containing 1 × NEBuffer4, 2.5 U exonuclease T and 2.5 U exonuclease I and incubated at 37 ° C. for 10 minutes (7).
The magnetic beads were washed, resuspended in 50 μl of dA-Tailing reaction mixture and incubated at 37 ° C. for 30 minutes. The beads were then washed and resuspended in 45 μl of 1X Quick Ligation and NEBNext adapter for Illumina. 5 μl of Quick T4 DNA ligase was added to the ligation mixture and incubated for 15 minutes at room temperature (FIG. 2A (8)).
The magnetic beads were washed and resuspended in 50 μl of 1 × exonuclease VII buffer (Epicentre, Madison, Wis.) Containing 20 units of exonuclease VII and incubated at 30 ° C. for 10 minutes (9). The enzyme was heat inactivated according to the manufacturer's protocol. The beads were washed and resuspended in 50 μl of 1 × NEBuffer 2 (New England Biolabs, Ipswich, Mass.) Containing 15 U T4 DNA polymerase and 100 μM dNTPs. The reaction was incubated at 20 ° C. for 30 minutes.
The beads were then washed and resuspended in 45 μl of 1 × Quick Ligation buffer and NEBNext adapter for Illumina. 5 μl of Quick T4 DNA ligase was added to the ligation mixture and incubated for 15 minutes at room temperature (10).
USER cleavage of the adapter and PCR amplification were performed as described in Example 1.

実施例3: 1つのFlapプローブによるシーケンシングのための、標的配列を濃縮するための方法。
実施例1に記載のプロトコールを、フラップ標的単離プローブを用いる3’アダプターのライゲーションによって進めた(図2B参照)。フラップ標的単離プローブは、標的配列の5’末端に特異的な一本鎖の3’領域、内部ビオチン−dT、切断可能なdUを含有する5’ヘアピン、NGSプラットフォーム特異的シーケンシングプライマー部位、ライブラリー増幅プライマー部位、及び一意なサンプル識別子配列(1−3、12−13)によって特徴付けられる。3’アダプターのライゲーション後、ビーズを洗浄し、5μlの10XBSA添加剤(メリーランド州ゲイサーズバーグのTrevigen)及び0.5UのHuman Fen−1(メリーランド州ゲイサーズバーグのTrevigen)を含有する1XREC Reaction Buffer12(メリーランド州ゲイサーズバーグのTrevigen)50μlに再懸濁させ、30℃で30分間インキュベートした(14)。次いで、ビーズを洗浄し、1XQuick Ligation 緩衝液45μl及びQuick T4 DNAリガーゼ5μlに再懸濁させ、室温で15分間インキュベートした。
アダプターのUSER切断及びPCR増幅を、実施例1(15)に記載の通りに実施した。
Example 3: Method for enriching target sequences for sequencing with one flap probe.
The protocol described in Example 1 proceeded by ligation of a 3 ′ adapter using a flap target isolation probe (see FIG. 2B). The flap target isolation probe consists of a single stranded 3 'region specific for the 5' end of the target sequence, an internal biotin-dT, a 5 'hairpin containing a cleavable dU, an NGS platform specific sequencing primer site, Characterized by library amplification primer sites and unique sample identifier sequences (1-3, 12-13). After ligation of the 3 ′ adapter, the beads were washed and 1 × REC containing 5 μl of 10 × BSA additive (Trevigen, Gaithersburg, Md.) And 0.5 U Human Fen-1 (Trevigen, Gaithersburg, Md.). Resuspended in 50 μl Reaction Buffer 12 (Trevigen, Gaithersburg, MD) and incubated at 30 ° C. for 30 minutes (14). The beads were then washed and resuspended in 45 μl of 1 × Quick Ligation buffer and 5 μl of Quick T4 DNA ligase and incubated at room temperature for 15 minutes.
USER cleavage of the adapter and PCR amplification were performed as described in Example 1 (15).

実施例4: 1つの標的単離プローブによるシーケンシングのための、標的配列を濃縮するための方法の変形例。
実施例1のプロトコールを、3’−ジデオキシヌクレオチドを有する標的単離プローブを用いた一本鎖3’及び5’消化(図1(1)−(4)及び図2C(16)−(18))によって進めた。ビーズを洗浄し、1XQuick Ligation緩衝液45μl及び50μM 3’平滑末端化ヘアピンDNAアダプター10μlに再懸濁させ、Quick T4 DNAリガーゼ5μlをライゲーション混合物に添加し、室温で15分間インキュベートした(16)。3’アダプター配列は、NGSプラットフォーム特異的シーケンシングプライマー部位、5’リン酸、及び3’−ジデオキシヌクレオチドを含有した。
ビーズを洗浄した後、標的/プローブ二重鎖を平滑末端化し、dAテイル化し(dA−tailed)、5’アダプターを標的にライゲートし、サイズ選択なしのライブラリー調製のための製造業者のプロトコールに従って、Illumina用のNEBNext Ultra DNA Library Prep Kit(マサチューセッツ州イプスウィッチのNew England Biolabs)を用いて標的を増幅した(17)(18)。
Example 4: A variation of the method for enriching target sequences for sequencing with one target isolation probe.
The protocol of Example 1 was followed by single-stranded 3 ′ and 5 ′ digestion with target isolation probes having 3′-dideoxynucleotides (FIGS. 1 (1)-(4) and 2C (16)-(18)). ) The beads were washed and resuspended in 45 μl of 1 × Quick Ligation buffer and 10 μl of 50 μM 3 ′ blunt-ended hairpin DNA adapter, 5 μl of Quick T4 DNA ligase was added to the ligation mixture and incubated for 15 minutes at room temperature (16). The 3 ′ adapter sequence contained an NGS platform-specific sequencing primer site, 5 ′ phosphate, and 3′-dideoxynucleotide.
After washing the beads, the target / probe duplex is blunted, dA-tailed, a 5 ′ adapter is ligated to the target, and according to the manufacturer's protocol for library preparation without size selection. The target was amplified using the NENBNext Ultra DNA Library Prep Kit for Illumina (New England Biolabs, Ipswich, Mass.) (17) (18).

実施例5: 標的単離プローブ及びランダムオリゴヌクレオチドを用いてシーケンシングするための、標的配列を濃縮するための方法。
500bp断片のための製造業者のプロトコールに従い、Covarisの装置を用いてヒトgDNA(1μg)を剪断した(図3(19))。剪断したDNAは、Tiquiaら(2004年)に記載の技術を用い、500bpのgDNA断片内の100bpから300bpのヌクレオチド標的配列の3’末端に特に相補的な、50塩基長の3’標的単離プローブ20nmolを含有するハイブリダイゼーション反応混合物25μlに添加した(図3(20))。ハイブリダイゼーション後、3’標的単離プローブ/標的DNA二重鎖を、製造業者のプロトコールに従って、親水性のストレプトアビジンビーズ50μlに30分間結合させた(図3(21))。
1XNEBuffer4、2.5UのエキソヌクレアーゼT及び2.5μlのエキソヌクレアーゼIを含有する反応混合物50μlにビーズを再懸濁させ、37℃で10分間インキュベートした(図3(22))。磁気ビーズを洗浄し、dA−Tailing反応混合物50μlに再懸濁させ、37℃で30分間インキュベートした。次いで、ビーズを洗浄し、1XQuick Ligation緩衝液45μlと、dUの切断可能な核酸塩基を含有する3’Tオーバーハングを有する50μM ヘアピンアダプター10μlとに再懸濁させ、Quick T4 DNAリガーゼ5μlをライゲーション混合物に添加し、室温で15分間インキュベートした(図3(23))。3’アダプター配列は、NGSプラットフォーム特異的シーケンシングプライマー部位、ライブラリー増幅プライマー部位及び一意な鎖識別子配列並びに3’dTオーバーハングを含有した。
ライゲーション後、ビーズを洗浄し、追加の20nmolのランダムヘキサマーを含有する50μlの1XNEBuffer2に再懸濁させた。反応物を95℃で5分間加熱し、次いで氷に移した後(図3(24))、クレノウ(エキソ−)DNAポリメラーゼ(マサチューセッツ州イプスウィッチのNew England Biolabs)及び100μMのdNTPを添加した。反応物を20℃で10分間、続いて37℃で20分間インキュベートした(図3(25))。
次いで、ビーズを洗浄し、45μlの1XQuick Ligation緩衝液(マサチューセッツ州イプスウィッチのNew England Biolabs)及びdUの切断可能な核酸塩基を含有する5’一本鎖ヘアピンアダプターに再懸濁させ、Quick T4 DNAリガーゼ(マサチューセッツ州イプスウィッチのNew England Biolabs)5μlをライゲーション混合物に添加し、室温で15分間インキュベートした(図3(26))。5’アダプター配列は、NGSプラットフォーム特異的シーケンシングプライマー部位、ライブラリー増幅プライマー部位及びサンプル同定のためのバーコード配列を含有した。
次いで、磁気ビーズを洗浄し、5μlのUSER酵素並びに3’及び5’ライブラリー増幅部位に相補的な10μM増幅プライマーを各々2.5μl含有する1XHotStart OneTaq PCR Master Mixに再懸濁させた。PCR混合物を37℃で15分間インキュベートした。次のPCRサイクル条件が用いられる:95℃で2分間、続いて95℃で30秒間、60℃で30秒間及び72℃で1分間を25サイクル(図3(27))。25サイクルの終わりに、PCR混合物を72℃で5分間インキュベートした。次いで、標的配列から得られたPCR産物を、従来の方法を用いて配列決定した。
Example 5: Method for enriching target sequences for sequencing using target isolation probes and random oligonucleotides.
Human gDNA (1 μg) was sheared using the Covaris apparatus according to the manufacturer's protocol for the 500 bp fragment (FIG. 3 (19)). Sheared DNA was isolated using a technique described in Tiquia et al. (2004), a 50 base long 3 'target isolation, particularly complementary to the 3' end of a 100 bp to 300 bp nucleotide target sequence within a 500 bp gDNA fragment. It was added to 25 μl of the hybridization reaction mixture containing 20 nmol of the probe (FIG. 3 (20)). After hybridization, the 3 ′ target isolation probe / target DNA duplex was bound to 50 μl of hydrophilic streptavidin beads for 30 minutes according to the manufacturer's protocol (FIG. 3 (21)).
The beads were resuspended in 50 μl of a reaction mixture containing 1 × NEBuffer 4, 2.5 U exonuclease T and 2.5 μl exonuclease I and incubated at 37 ° C. for 10 minutes (FIG. 3 (22)). The magnetic beads were washed, resuspended in 50 μl of dA-Tailing reaction mixture and incubated at 37 ° C. for 30 minutes. The beads are then washed and resuspended in 45 μl of 1 × Quick Ligation buffer and 10 μl of 50 μM hairpin adapter with a 3′T overhang containing dU cleavable nucleobase and 5 μl of Quick T4 DNA ligase is added to the ligation mixture. And incubated for 15 minutes at room temperature (FIG. 3 (23)). The 3 ′ adapter sequence contained an NGS platform specific sequencing primer site, a library amplification primer site and a unique strand identifier sequence and a 3 ′ dT overhang.
After ligation, the beads were washed and resuspended in 50 μl of 1 × NEBuffer 2 containing an additional 20 nmol of random hexamer. After the reaction was heated at 95 ° C. for 5 minutes and then transferred to ice (FIG. 3 (24)), Klenow (exo-) DNA polymerase (New England Biolabs, Ipswich, Mass.) And 100 μM dNTPs were added. The reaction was incubated at 20 ° C. for 10 minutes followed by 20 minutes at 37 ° C. (FIG. 3 (25)).
The beads were then washed and resuspended in 45 μl of 1 × Quick Ligation buffer (New England Biolabs, Ipswich, Mass.) And a 5 ′ single-stranded hairpin adapter containing dU cleavable nucleobase and Quick T4 DNA 5 μl of ligase (New England Biolabs, Ipswich, Mass.) Was added to the ligation mixture and incubated for 15 minutes at room temperature (FIG. 3 (26)). The 5 ′ adapter sequence contained an NGS platform specific sequencing primer site, a library amplification primer site and a barcode sequence for sample identification.
The magnetic beads were then washed and resuspended in 1 × HotStart OneTaq PCR Master Mix containing 2.5 μl each of 10 μM amplification primer complementary to 5 μl USER enzyme and 3 ′ and 5 ′ library amplification sites. The PCR mixture was incubated at 37 ° C. for 15 minutes. The following PCR cycle conditions are used: 95 ° C. for 2 minutes, followed by 25 cycles of 95 ° C. for 30 seconds, 60 ° C. for 30 seconds and 72 ° C. for 1 minute (FIG. 3 (27)). At the end of 25 cycles, the PCR mixture was incubated at 72 ° C. for 5 minutes. The PCR product obtained from the target sequence was then sequenced using conventional methods.

実施例6: 標的単離プローブ及び第二のプローブを用いるシーケンシングのための、標的配列を濃縮するための方法の変形例。
実施例5に記載のプロトコールを、3’アダプターのライゲーション((19)−(23))によって進めた。ライゲーション後、磁気ビーズを洗浄し、標的配列の5’末端に相補的な、50塩基長の5’標的単離プローブ20nmolを含む50μlの1XエキソヌクレアーゼVII緩衝液に再懸濁させた。標的単離プローブを95℃で5分間加熱し、続いて30℃までゆっくりと冷却することにより標的にアニールした(図4(28))。10UのエキソヌクレアーゼVIIを反応物に転化し、37℃でさらに10分間インキュベートした(図4(29))。製造業者のプロトコールに従って、酵素を熱失活させた。ビーズを洗浄し、追加の20nmolの5’標的単離プローブを含有する1XNEBuffer2(マサチューセッツ州イプスウィッチのNew England Biolabs)50μlに再懸濁させた。反応物を95℃で5分間加熱し、続いて30℃までゆっくりと冷却した後、15UのT4 DNAポリメラーゼ(マサチューセッツ州イプスウィッチのNew England Biolabs)及び100μMのdNTPを添加した。反応物を20℃で30分間インキュベートした。
ビーズを洗浄した後、5’アダプターのライゲーション、該アダプターのUSER切断及びPCR増幅を、3’Tオーバーハングを有するヘアピンアダプターを用いて実施例4に記載の通りに実施した((図4(30)(31))。
Example 6: A variation of the method for enriching target sequences for sequencing using a target isolation probe and a second probe.
The protocol described in Example 5 was advanced by ligation of 3 ′ adapters ((19)-(23)). After ligation, the magnetic beads were washed and resuspended in 50 μl of 1 × exonuclease VII buffer containing 20 nmol of a 50 base long 5 ′ target isolation probe complementary to the 5 ′ end of the target sequence. The target isolation probe was annealed to the target by heating at 95 ° C. for 5 minutes followed by slow cooling to 30 ° C. (FIG. 4 (28)). 10 U of exonuclease VII was converted to a reaction and incubated at 37 ° C. for an additional 10 minutes (FIG. 4 (29)). The enzyme was heat inactivated according to the manufacturer's protocol. The beads were washed and resuspended in 50 μl of 1 × NEBuffer 2 (New England Biolabs, Ipswich, Mass.) Containing an additional 20 nmol of 5 ′ target isolation probe. The reaction was heated at 95 ° C. for 5 min followed by slow cooling to 30 ° C. before adding 15 U of T4 DNA polymerase (New England Biolabs, Ipswich, Mass.) And 100 μM dNTPs. The reaction was incubated at 20 ° C. for 30 minutes.
After washing the beads, ligation of the 5 ′ adapter, USER cleavage of the adapter and PCR amplification were performed as described in Example 4 using a hairpin adapter with a 3′T overhang ((FIG. 4 (30 (31)).

実施例7: 2プローブによるシーケンシングのための、標的配列を濃縮するための方法の変形例。
実施例4に記載のプロトコールを、3’ではなく内部にビオチンを有する3’標的単離プローブを用いる5’エキソヌクレアーゼ消化及び熱失活((19)−(23)、(28)−(29))によって進めた。熱失活後、ビーズを洗浄し、15ユニットのクレノウ(エキソ−)DNAポリメラーゼ及び100μMのdNTPを含有する50μlの1XNEBuffer2に再懸濁させた。反応物を20℃で10分間、続いて37℃で20分間インキュベートした(32)。
ビーズを洗浄した後、5’アダプターのライゲーション、該アダプターのUSER切断及びPCR増幅を、実施例5に記載の通りに実施した((26)(27))。
Example 7: A variation of the method for enriching the target sequence for sequencing with two probes.
The protocol described in Example 4 was adapted from 5 ′ exonuclease digestion and heat inactivation ((19)-(23), (28)-(29) using a 3 ′ target isolation probe with biotin inside rather than 3 ′. )) Advanced. After heat inactivation, the beads were washed and resuspended in 50 μl 1 × NEBuffer 2 containing 15 units of Klenow (exo-) DNA polymerase and 100 μM dNTPs. The reaction was incubated for 10 minutes at 20 ° C. followed by 20 minutes at 37 ° C. (32).
After washing the beads, ligation of the 5 ′ adapter, USER cleavage of the adapter and PCR amplification were performed as described in Example 5 ((26) (27)).

実施例8: 標的単離プローブ及び5’フラッププローブによるシーケンシングのための、標的配列を濃縮するための方法。
実施例6に記載のプロトコールを、3’ヘアピンアダプターのライゲーションによって進めた(図3、(19)−(23))。3’アダプターのライゲーション後、ビーズを洗浄し、フラップ5’プローブ20nmolを含有する50μlの1XREC Reaction Buffer12に再懸濁させた。フラッププローブは、標的の5’末端に相補的な一本鎖の3’領域、切断可能なdUを含有する5’ヘアピン、NGSプラットフォーム特異的シーケンシングプライマー部位、ライブラリー増幅プライマー部位、及び一意なサンプル識別子配列で構成された。プローブを、95℃で5分間加熱し、その後、30℃までゆっくりと冷却することにより標的配列の5’末端にアニールした(35)。
アニーリング後、10XBSA添加剤5μl及び0.5ユニットのヒトFen−1を添加し、5’一本鎖領域を除去し、反応物を30℃で30分間インキュベートした(36)。次いで、ビーズを洗浄し、1XQuick Ligation 緩衝液45μl及びQuick T4 DNAリガーゼ5μlに再懸濁させ、室温で15分間インキュベートした。
次いで、磁気ビーズを洗浄し、5μlのUSER酵素及び増幅プライマーを含有する1XHotStart OneTaq PCR Master Mixに再懸濁させた。PCR混合物を37℃で15分間インキュベートし、次のPCRサイクル条件を用いた:95℃で2分間、続いて95℃で30秒間、60℃で30秒間及び72℃で1分間を25サイクル。25サイクルの終わりに、PCR混合物を72℃で5分間インキュベートした(37)。次いで、標的配列から得られたPCR産物を、従来の方法を用いて配列決定した。
Example 8: Method for enriching target sequences for sequencing with target isolation probes and 5 'flap probes.
The protocol described in Example 6 was advanced by ligation of 3 ′ hairpin adapters (FIGS. 3, (19)-(23)). After ligation of the 3 ′ adapter, the beads were washed and resuspended in 50 μl of 1 × REC Reaction Buffer 12 containing 20 nmol of flap 5 ′ probe. The flap probe is a single stranded 3 ′ region complementary to the 5 ′ end of the target, a 5 ′ hairpin containing a cleavable dU, an NGS platform-specific sequencing primer site, a library amplification primer site, and a unique Consists of a sample identifier array. The probe was annealed to the 5 ′ end of the target sequence by heating at 95 ° C. for 5 minutes and then slowly cooling to 30 ° C. (35).
After annealing, 5 μl of 10 × BSA additive and 0.5 units of human Fen-1 were added to remove the 5 ′ single stranded region and the reaction was incubated at 30 ° C. for 30 minutes (36). The beads were then washed and resuspended in 45 μl of 1 × Quick Ligation buffer and 5 μl of Quick T4 DNA ligase and incubated at room temperature for 15 minutes.
The magnetic beads were then washed and resuspended in 1X HotStart OneTaq PCR Master Mix containing 5 μl of USER enzyme and amplification primers. The PCR mixture was incubated at 37 ° C for 15 minutes and the following PCR cycle conditions were used: 95 ° C for 2 minutes, followed by 25 cycles of 95 ° C for 30 seconds, 60 ° C for 30 seconds and 72 ° C for 1 minute. At the end of 25 cycles, the PCR mixture was incubated at 72 ° C. for 5 minutes (37). The PCR product obtained from the target sequence was then sequenced using conventional methods.

実施例9: 2プローブによるシーケンシングのための、標的配列を濃縮するための方法の変形例。
500bp断片のための製造業者のプロトコールに従い、Covarisを用いてヒトgDNA(1μg)を剪断した(19)。剪断したDNAを、20nmolの3’標的単離プローブと20nmolの5’プローブ(それぞれが50塩基長で、100の標的の3’及び5’末端を特定する)とを含有するハイブリダイゼーション反応物25μlに添加した(38)。ハイブリダイゼーション後、ハイブリダイズした標的配列を実施例2に記載の通りに捕捉した(39)。
1XNEBuffer4、2.5ユニットのエキソヌクレアーゼT及び2.5μlのエキソヌクレアーゼIを含有する反応混合物50μlにビーズを再懸濁させ、37℃で10分間インキュベートした。磁気ビーズを洗浄し、30ユニットのRecJfを含有する1XNEBuffer2(マサチューセッツ州イプスウィッチのNew England Biolabs)50μlに再懸濁させ、20℃で10分間インキュベートした(図4)。
磁気ビーズを洗浄し、dA−Tailing反応混合物50μlに再懸濁させ、37℃で30分間インキュベートした。次いで、ビーズを洗浄し、45μlの1XQuick Ligation緩衝液及びIllumina用のNEBNextアダプターに再懸濁させた。Quick T4 DNAリガーゼ5μlをライゲーション混合物に添加し、室温で15分間インキュベートした(41)。
アダプターのUSER切断及びPCR増幅を、実施例1(42).に記載の通りに実施した。
Example 9: Variation of the method for enriching the target sequence for sequencing with two probes.
Human gDNA (1 μg) was sheared using Covaris according to the manufacturer's protocol for a 500 bp fragment (19). 25 μl of hybridization reaction containing sheared DNA containing 20 nmol of 3 ′ target isolation probe and 20 nmol of 5 ′ probe (each 50 bases long and identifies the 3 ′ and 5 ′ ends of 100 targets) (38). After hybridization, the hybridized target sequence was captured as described in Example 2 (39).
The beads were resuspended in 50 μl of reaction mixture containing 1 × NEBuffer 4, 2.5 units of exonuclease T and 2.5 μl of exonuclease I and incubated at 37 ° C. for 10 minutes. The magnetic beads were washed and resuspended in 50 μl of 1 × NEBuffer2 (New England Biolabs, Ipswich, Mass.) Containing 30 units of RecJf and incubated at 20 ° C. for 10 minutes (FIG. 4).
The magnetic beads were washed, resuspended in 50 μl of dA-Tailing reaction mixture and incubated at 37 ° C. for 30 minutes. The beads were then washed and resuspended in 45 μl of 1 × Quick Ligation buffer and NEBNext adapter for Illumina. 5 μl of Quick T4 DNA ligase was added to the ligation mixture and incubated for 15 minutes at room temperature (41).
USER cleavage of the adapter and PCR amplification were performed in Example 1 (42). As described in.

Claims (19)

核酸の集団から標的配列を濃縮するための方法であって、
(a) 核酸集団と、親和性結合ドメインを含む標的単離プローブとを溶液中で組み合わせることと;
(b) 標的単離プローブの一本鎖領域を、核酸の集団中の標的配列の全部又は一部にハイブリダイズさせることと;
(c) 標的単離プローブを捕捉ドメインと結合させ、非結合物質を除去することにより、標的配列を含有する集団からハイブリダイズされた核酸を選択的に固定化することと;
(d) 1以上の3’エキソヌクレアーゼによって、標的配列の3’末端から非標的配列を除去し、それにより標的配列の3’末端及び標的単離プローブの5’末端に、平滑末端二重鎖又は付着端を生じさせることと;
(e) 標的単離プローブの3’末端を伸長させて、標的配列の5’末端に平滑末端又は付着端を形成すること
とを含む、方法。
A method for enriching a target sequence from a population of nucleic acids comprising:
(A) combining the nucleic acid population with a target isolation probe comprising an affinity binding domain in solution;
(B) hybridizing a single stranded region of the target isolation probe to all or part of a target sequence in a population of nucleic acids;
(C) selectively immobilizing hybridized nucleic acids from a population containing the target sequence by binding the target isolation probe to the capture domain and removing unbound material;
(D) removing the non-target sequence from the 3 ′ end of the target sequence by one or more 3 ′ exonucleases, thereby creating a blunt ended duplex at the 3 ′ end of the target sequence and the 5 ′ end of the target isolation probe Or creating sticky ends;
(E) extending the 3 ′ end of the target isolation probe to form a blunt or sticky end at the 5 ′ end of the target sequence.
(b)の標的単離プローブの一本鎖領域が標的配列の一部にハイブリダイズする、請求項1に記載の方法。   The method according to claim 1, wherein the single-stranded region of the target isolation probe of (b) hybridizes to a part of the target sequence. 前記一部が標的配列の3’末端に配置される、請求項2に記載の方法。   The method of claim 2, wherein the portion is located at the 3 ′ end of the target sequence. 親和性結合ドメインが標的単離プローブの3’末端と5’末端の間に配置される、請求項1から3のいずれか一項に記載の方法。   4. A method according to any one of claims 1 to 3, wherein the affinity binding domain is located between the 3 'and 5' ends of the target isolation probe. 3’エキソヌクレアーゼがエキソヌクレアーゼI、エキソヌクレアーゼT、及び/又は3’エキソヌクレアーゼ活性を有する1以上のポリメラーゼから選択される、請求項1から4のいずれか一項に記載の方法。   5. The method according to any one of claims 1 to 4, wherein the 3 'exonuclease is selected from exonuclease I, exonuclease T, and / or one or more polymerases having 3' exonuclease activity. 伸長工程(e)がdUTPなどの修飾デオキシヌクレオチドの存在下で実施される、請求項1から5のいずれか一項に記載の方法。   6. The method according to any one of claims 1 to 5, wherein the extension step (e) is performed in the presence of a modified deoxynucleotide such as dUTP. 標的単離プローブのエキソヌクレアーゼ分解を防ぐために、標的単離プローブがその3’末端及び/又はその5’末端において修飾される、請求項1から6のいずれか一項に記載の方法。   7. A method according to any one of claims 1 to 6, wherein the target isolation probe is modified at its 3 'end and / or at its 5' end to prevent exonuclease degradation of the target isolation probe. 標的単離プローブの3’末端におけるライゲーションを防ぐために、標的単離プローブがその3’末端において修飾される、請求項1から7のいずれか一項に記載の方法。   8. The method according to any one of claims 1 to 7, wherein the target isolation probe is modified at its 3 'end to prevent ligation at the 3' end of the target isolation probe. 標的単離プローブの5’末端におけるポリメラーゼ伸長を防ぐために、標的単離プローブがその5’末端において修飾される、請求項1から8のいずれか一項に記載の方法。   9. The method of any one of claims 1-8, wherein the target isolation probe is modified at its 5 'end to prevent polymerase extension at the 5' end of the target isolation probe. 修飾がインバーテッド塩基、炭素リンカー、ホスホロチオエート結合又はジデオキシヌクレオチドから選択される、請求項7から9のいずれか一項に記載の方法。   10. A method according to any one of claims 7 to 9, wherein the modification is selected from inverted bases, carbon linkers, phosphorothioate linkages or dideoxynucleotides. 増幅を防ぐために、標的単離プローブがデオキシウラシル、内部炭素リンカー又は1以上のリボヌクレオチドを含有するように修飾される、請求項1から10のいずれか一項に記載の方法。   11. The method of any one of claims 1 to 10, wherein the target isolation probe is modified to contain deoxyuracil, an internal carbon linker, or one or more ribonucleotides to prevent amplification. (d)が、
(I) 標的配列の3’末端に対する二重鎖3’アダプター;又は
(ii) 標的配列の3’末端に対するヘアピン3’アダプターの二重鎖領域
をライゲートすることをさらに含む、請求項1から11のいずれか一項に記載の方法。
(D)
12. The method further comprises ligating a duplex region of a duplex 3 ′ adapter to the 3 ′ end of the target sequence; or (ii) a hairpin 3 ′ adapter to the 3 ′ end of the target sequence. The method as described in any one of.
(e)が
(I) 標的配列の5’末端に対する二重鎖5’アダプター;又は
(ii) 標的配列の5’末端に対するヘアピン5’アダプターの二重鎖領域
をライゲートすることをさらに含む、請求項1から12のいずれか一項に記載の方法。
(E) further comprising: (I) ligating a double stranded 5 'adapter to the 5' end of the target sequence; or (ii) a double stranded region of a hairpin 5 'adapter to the 5' end of the target sequence. Item 13. The method according to any one of Items 1 to 12.
3’及び/又は5’アダプターがNGSプラットフォーム特異的アダプター、単一ヌクレオチドオーバーハングを含有するアダプター、切断可能部位を有するY構造若しくはヘアピンアダプター、完全に相補的な二本鎖DNA(dsDNA)アダプター、又はライゲーション接合部の反対側に一本鎖DNA(ssDNA)オーバーハングを有するdsDNAアダプターである、請求項12又は13に記載の方法。   3 'and / or 5' adapters are NGS platform specific adapters, adapters containing single nucleotide overhangs, Y-structure or hairpin adapters with cleavable sites, fully complementary double stranded DNA (dsDNA) adapters, The method according to claim 12 or 13, which is a dsDNA adapter having a single-stranded DNA (ssDNA) overhang on the opposite side of the ligation junction. 3’アダプターの3’末端がジデオキシヌクレオチドを含有し、
標的配列の3’末端へのライゲーションを目的とした3’アダプターの5’末端がリン酸基を欠いており、及び/又は
標的配列の5’末端へのライゲーション用ではない5’アダプターの5’末端がインバーテッドヌクレオチドを含有する、
請求項12に記載の方法。
The 3 ′ end of the 3 ′ adapter contains a dideoxynucleotide,
The 5 ′ end of the 3 ′ adapter intended for ligation to the 3 ′ end of the target sequence lacks a phosphate group and / or is not intended for ligation to the 5 ′ end of the target sequence. The ends contain inverted nucleotides,
The method of claim 12.
3’及び/又は5’アダプターがシーケンシングプライマー部位、ライブラリー増幅プライマー部位、一意なサンプル識別子、及び一意な分子識別子配列のうちの少なくとも1つを含む、請求項12から15のいずれか一項に記載の方法。   16. The any one of claims 12 to 15, wherein the 3 'and / or 5' adapter comprises at least one of a sequencing primer site, a library amplification primer site, a unique sample identifier, and a unique molecular identifier sequence. The method described in 1. アダプターにライゲートされた標的配列を増幅することをさらに含む、請求項12から16のいずれか一項に記載の方法。   17. A method according to any one of claims 12 to 16, further comprising amplifying the target sequence ligated to the adapter. 増幅反応が、シーケンシングプラットフォームにより必要とされる配列などの、追加の配列をアダプターにライゲートされた標的に加えるプライマーを用いて実施される、請求項17に記載の方法。   18. The method of claim 17, wherein the amplification reaction is performed with a primer that adds additional sequence to the target ligated to the adapter, such as the sequence required by the sequencing platform. 標的配列を定量すること及び/又はシーケンシングすることをさらに含む、請求項12から18のいずれか一項に記載の方法。
19. The method according to any one of claims 12 to 18, further comprising quantifying and / or sequencing the target sequence.
JP2017550457A 2014-12-11 2014-12-11 Target sequence enrichment Pending JP2017537657A (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US2014/069754 WO2016093838A1 (en) 2014-12-11 2014-12-11 Enrichment of target sequences

Publications (1)

Publication Number Publication Date
JP2017537657A true JP2017537657A (en) 2017-12-21

Family

ID=52278810

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017550457A Pending JP2017537657A (en) 2014-12-11 2014-12-11 Target sequence enrichment

Country Status (2)

Country Link
JP (1) JP2017537657A (en)
WO (1) WO2016093838A1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022510723A (en) * 2019-01-02 2022-01-27 上海臻迪基因科技有限公司 Gene target area enrichment methods and kits
JP2022523362A (en) * 2019-02-21 2022-04-22 ストラトス ゲノミクス インコーポレイテッド Methods, compositions, and devices for solid-state synthesis of expandable polymers for use in single-molecule sequencing.

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11268137B2 (en) * 2016-12-09 2022-03-08 Boreal Genomics, Inc. Linked ligation
TW201936929A (en) * 2018-02-26 2019-09-16 美商Cy分子診斷公司 Composition and methods for affinity directed enrichment of rare species
GB201803240D0 (en) * 2018-02-28 2018-04-11 Synpromics Ltd Methods and compositions for enriching nucleic acids
EP3768853A4 (en) * 2018-03-23 2021-04-28 Board Of Regents The University Of Texas System Efficient sequencing of dsdna with extremely low level of errors
CA3120713A1 (en) * 2018-11-21 2020-05-28 Avida Biomed, Inc. Methods for targeted nucleic acid library formation
EP3931351A4 (en) 2019-03-01 2022-05-11 Mercy Bioanalytics, Inc. Systems, compositions, and methods for target entity detection
EP4345171A2 (en) 2019-10-25 2024-04-03 Guardant Health, Inc. Methods for 3' overhang repair

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4883750A (en) 1984-12-13 1989-11-28 Applied Biosystems, Inc. Detection of specific sequences in nucleic acids
US5242794A (en) 1984-12-13 1993-09-07 Applied Biosystems, Inc. Detection of specific sequences in nucleic acids
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4965188A (en) 1986-08-22 1990-10-23 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences using a thermostable enzyme
US4800159A (en) 1986-02-07 1989-01-24 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences
US4988617A (en) 1988-03-25 1991-01-29 California Institute Of Technology Method of detecting a nucleotide change in nucleic acids
US5494810A (en) 1990-05-03 1996-02-27 Cornell Research Foundation, Inc. Thermostable ligase-mediated DNA amplifications system for the detection of genetic disease
US5210015A (en) 1990-08-06 1993-05-11 Hoffman-La Roche Inc. Homogeneous assay system using the nuclease activity of a nucleic acid polymerase
JP3080178B2 (en) 1991-02-18 2000-08-21 東洋紡績株式会社 Method for amplifying nucleic acid sequence and reagent kit therefor
US5426180A (en) 1991-03-27 1995-06-20 Research Corporation Technologies, Inc. Methods of making single-stranded circular oligonucleotides
US5593826A (en) 1993-03-22 1997-01-14 Perkin-Elmer Corporation, Applied Biosystems, Inc. Enzymatic ligation of 3'amino-substituted oligonucleotides
EP0695305B1 (en) 1993-04-12 2003-08-06 Northwestern University Method of forming oligonucleotides
SE9400522D0 (en) 1994-02-16 1994-02-16 Ulf Landegren Method and reagent for detecting specific nucleotide sequences
US6013445A (en) 1996-06-06 2000-01-11 Lynx Therapeutics, Inc. Massively parallel signature sequencing by ligation of encoded adaptors
PT912766E (en) 1996-06-04 2009-07-16 Univ Utah Res Found Monitoring hybridization during pcr
US6060245A (en) 1996-12-13 2000-05-09 Stratagene Methods and adaptors for generating specific nucleic acid populations
US5888737A (en) 1997-04-15 1999-03-30 Lynx Therapeutics, Inc. Adaptor-based sequence analysis
US6582938B1 (en) 2001-05-11 2003-06-24 Affymetrix, Inc. Amplification of nucleic acids
DE60230689D1 (en) 2001-04-10 2009-02-12 Ecole Polytech Process for using O6-alkylguanine-DNA alkyltransferases
AU2003279089A1 (en) 2002-09-30 2004-04-19 Parallele Bioscience, Inc. Polynucleotide synthesis and labeling by kinetic sampling ligation
AU2003271669A1 (en) 2002-10-03 2004-04-23 Ecole Polytechnique Federale De Lausanne (Epfl) Substrates for O6 -alkylguanine-DNA alkyltransferase
EP2455457B1 (en) 2003-01-31 2015-03-11 Promega Corporation Covalent tethering of functional groups to proteins
US20040209299A1 (en) 2003-03-07 2004-10-21 Rubicon Genomics, Inc. In vitro DNA immortalization and whole genome amplification using libraries generated from randomly fragmented DNA
JP2007509608A (en) 2003-05-23 2007-04-19 ウペエフエル・エコル・ポリテクニック・フェデラル・ドゥ・ローザンヌ Method for labeling proteins based on acyl carrier proteins
JP2007526282A (en) 2004-03-02 2007-09-13 ウペエフエル・エコル・ポリテクニック・フェデラル・ドゥ・ローザンヌ O6-alkylguanine DNA alkyltransferase specific substrate
JP2007525988A (en) 2004-03-02 2007-09-13 ウペエフエル・エコル・ポリテクニック・フェデラル・ドゥ・ローザンヌ O6-alkylguanine-DNA alkyltransferase mutants
US8158388B2 (en) 2004-10-21 2012-04-17 New England Biolabs, Inc. Repair of nucleic acids for improved amplification
US7700283B2 (en) 2004-10-21 2010-04-20 New England Biolabs, Inc. Repair of nucleic acids for improved amplification
JP2008539198A (en) 2005-04-27 2008-11-13 コヴァリス・バイオサイエンシス・アーゲー Pyrimidines that react with O6-alkylguanine-DNA alkyltransferases
EP1924704B1 (en) 2005-08-02 2011-05-25 Rubicon Genomics, Inc. Compositions and methods for processing and amplification of dna, including using multiple enzymes in a single reaction
GB0522310D0 (en) 2005-11-01 2005-12-07 Solexa Ltd Methods of preparing libraries of template polynucleotides
US20070172839A1 (en) 2006-01-24 2007-07-26 Smith Douglas R Asymmetrical adapters and methods of use thereof
EP1882688A1 (en) 2006-07-25 2008-01-30 EPFL Ecole Polytechnique Fédérale de Lausanne Labelling of fusion proteins with synthetic probes
WO2009133466A2 (en) 2008-04-30 2009-11-05 Population Genetics Technologies Ltd. Asymmetric adapter library construction
WO2012012037A1 (en) 2010-07-19 2012-01-26 New England Biolabs, Inc. Oligonucleotide adaptors: compositions and methods of use
CA2892646A1 (en) * 2012-12-10 2014-06-19 Resolution Bioscience, Inc. Methods for targeted genomic analysis
WO2014153408A1 (en) * 2013-03-19 2014-09-25 Directed Genomics, Llc Enrichment of target sequences

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022510723A (en) * 2019-01-02 2022-01-27 上海臻迪基因科技有限公司 Gene target area enrichment methods and kits
JP7202556B2 (en) 2019-01-02 2023-01-12 上海臻迪基因科技有限公司 Methods and kits for enriching gene target areas
JP2022523362A (en) * 2019-02-21 2022-04-22 ストラトス ゲノミクス インコーポレイテッド Methods, compositions, and devices for solid-state synthesis of expandable polymers for use in single-molecule sequencing.

Also Published As

Publication number Publication date
WO2016093838A1 (en) 2016-06-16

Similar Documents

Publication Publication Date Title
JP6441893B2 (en) Target sequence enrichment
US10087481B2 (en) Enrichment of target sequences
CN110249057B (en) Method for spatially labelling and analysing nucleic acids in a biological sample
JP2017537657A (en) Target sequence enrichment
JP6997772B2 (en) Nucleic acid sample preparation method
US8512956B2 (en) Method for clonal amplification
AU2011305445B2 (en) Direct capture, amplification and sequencing of target DNA using immobilized primers
EP3103885B1 (en) Methods for sequencing nucleic acids
EP3077545B1 (en) Methods for sequencing nucleic acids
CN115927538A (en) Tagmentation using adaptor-containing immobilized transposomes
JP2018522543A (en) Methods, systems, compositions, kits, devices, and computer readable media for molecular tagging
WO2019209946A1 (en) Sequential paired-end sequencing
EP2247727A2 (en) Method for archiving and clonal expansion
US11060139B2 (en) Methods for sequencing nucleic acids
KR20080005188A (en) Selection probe amplification
JP2019531072A5 (en)
WO2015050501A1 (en) Amplification paralleled library enrichment
KR20230124636A (en) Compositions and methods for highly sensitive detection of target sequences in multiplex reactions
WO2023116376A1 (en) Labeling and analysis method for single-cell nucleic acid
CN114616342A (en) Method for preparing personalized target-independent guide RNA pools for CRISPR