JP2016511007A - 鎖になったrnaまたはdnaのライブラリを生成するための方法、組成物およびキット - Google Patents
鎖になったrnaまたはdnaのライブラリを生成するための方法、組成物およびキット Download PDFInfo
- Publication number
- JP2016511007A JP2016511007A JP2016501581A JP2016501581A JP2016511007A JP 2016511007 A JP2016511007 A JP 2016511007A JP 2016501581 A JP2016501581 A JP 2016501581A JP 2016501581 A JP2016501581 A JP 2016501581A JP 2016511007 A JP2016511007 A JP 2016511007A
- Authority
- JP
- Japan
- Prior art keywords
- sequence
- adapter
- strand
- overhang
- dna
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B01—PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
- B01J—CHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
- B01J19/00—Chemical, physical or physico-chemical processes in general; Their relevant apparatus
- B01J19/0046—Sequential or parallel reactions, e.g. for the synthesis of polypeptides or polynucleotides; Apparatus and devices for combinatorial chemistry or for making molecular arrays
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本発明は、定方向性核酸ライブラリを構築するためのキットを含む方法および組成物を提供する。本発明は、さらに定方向性cDNAライブラリを増幅および配列決定するための方法および組成物を提供する。本明細書では、RNAおよびdsDNAからの定方向性配列決定ライブラリ生成のための方法、組成物およびキットを提供する。これらの方法、組成物およびキットは、全トランスクリプトーム、全ゲノム、標的化されたかまたは選択された転写物の定方向性ライブラリの生成に使用され得、また無方向性全ゲノム配列決定ライブラリの生成にも適用され得る。
Description
相互参照
この出願は、2013年3月15日に出願された米国仮出願第61/801,510号の利益を主張し、また2013年9月18日に出願された米国出願第14/030,761号(これらの出願は、その全体が参考として本明細書に援用される)の利益も主張する。
この出願は、2013年3月15日に出願された米国仮出願第61/801,510号の利益を主張し、また2013年9月18日に出願された米国出願第14/030,761号(これらの出願は、その全体が参考として本明細書に援用される)の利益も主張する。
背景
近年の大規模並列処理配列決定技術における急速な発達により、機能ゲノム学への新たなアプローチを開発する、全ゲノムおよび全トランスクリプトームの配列決定および解析が可能となった。これらの次世代配列決定方法の1つは、メッセンジャーおよび構造的RNAから生成された相補的DNA(cDNA)の直接配列決定(RNA−Seq)を伴うものである。RNA−Seqは、伝統的な配列決定方法を凌ぐ幾つかの重要な利益をもたらし得る。RNA−Seqにより、全ての発現されたコーディングおよび非コーディング転写物について、各転写物の5’および3’末端およびスプライス接合点に注釈をつける、それらの高解像度研究が可能となり得、各細胞における転写物の相対数の定量化によって、各スプライス変異体のレベルを測定することによりRNAスプライシングを測定し、特性確認する方法が提供され得る。同様に、大規模並列処理配列決定技術は、高解像度での全ゲノム配列決定または興味の対象であるマルチプレックス標的化ゲノム配列の配列決定を可能にし得る。
近年の大規模並列処理配列決定技術における急速な発達により、機能ゲノム学への新たなアプローチを開発する、全ゲノムおよび全トランスクリプトームの配列決定および解析が可能となった。これらの次世代配列決定方法の1つは、メッセンジャーおよび構造的RNAから生成された相補的DNA(cDNA)の直接配列決定(RNA−Seq)を伴うものである。RNA−Seqは、伝統的な配列決定方法を凌ぐ幾つかの重要な利益をもたらし得る。RNA−Seqにより、全ての発現されたコーディングおよび非コーディング転写物について、各転写物の5’および3’末端およびスプライス接合点に注釈をつける、それらの高解像度研究が可能となり得、各細胞における転写物の相対数の定量化によって、各スプライス変異体のレベルを測定することによりRNAスプライシングを測定し、特性確認する方法が提供され得る。同様に、大規模並列処理配列決定技術は、高解像度での全ゲノム配列決定または興味の対象であるマルチプレックス標的化ゲノム配列の配列決定を可能にし得る。
標準的RNA−Seqの実施に伴う1つの潜在的欠点は、転写方向に関する情報の欠如である。RNA−Seqのために構築された標準的cDNAライブラリは、ランダムプライミングされた2本鎖cDNAから成る。配列決定前の普遍的プライミング部位を含むアダプターの無方向性ライゲーションは、どの鎖が元のRNA鋳型に存在したかについての情報の喪失を招き得る。鎖情報は、場合によっては、例えば、タンパク質をコードする転写物における読み枠(ORF)情報を使用することにより、または真核生物ゲノムにおけるスプライス部位情報を評価することにより、後続の解析により推測され得るが、起点となる鎖に関する直接情報が望ましいものであり得る。例えば、どの鎖が元のRNA試料に存在したかについての直接情報は、センス鎖を非コーディングRNAに割り当てるため、および重複転写物の分割時に使用され得る。
鎖特異的RNA−Seqについての幾つかの方法が近年開発されている。これらの方法は2つの主なクラスに分けられ得る。第1のクラスは、RNA転写物の5’および3’末端に対し既知配向で異なるアダプターを使用し得る。最終成果は、元のRNAの5’および3’末端に2つの異なるアダプターが隣接しているcDNAライブラリであり得る。この方法の不利な点は、クローン分子の両端のみが方向情報を保存しているということであり得る。この状況は、長いクローンの鎖特異的操作についての問題をはらみ得、フラグメント化がある場合に方向情報の喪失を招き得る。
鎖特異的RNA−Seq方法の第2のクラスは、元のRNA(例えば、重亜硫酸塩処理による)または転写されたcDNA(例えば、修飾ヌクレオチドの組込みによる)のどちらかの1鎖をマーキングすることができ、次いでマーキングされていない鎖の分解が行われ得る。RNAの重亜硫酸塩処理による鎖のマーキングは、労働集約的であり得、2鎖のうちの1つで全シトシン塩基がチミンに変換されている参照ゲノムに対するシーケンシングリードのアラインメントを必要とし得る。さらに、この解析は、重亜硫酸塩処理中の塩基変換効率が不完全、すなわち100%未満であり得るという事実故に複雑なものになり得る。
cDNAの第2鎖の修飾による鎖マーキングは、定方向性cDNAクローニングおよび配列決定にとって好ましいアプローチになっている(例、Levinら、2010を参照)。しかしながら、cDNA第2鎖マーキングアプローチは、慣用的平滑末端ライゲーションおよびデュプレックスアダプターでのcDNAライブラリ構築戦略(2つの普遍的配列決定部位を2つの別々のアダプターにより導入する)を用いるに際し、方向性情報を保存するには不十分なものであり得る。
現行の定方向性トランスクリプトームまたはゲノム配列決定の主たる欠点は、ランダムな第2鎖合成により所望のライブラリに未知の歪みが導入され、配列決定ライブラリ生成にコンプレキシティーが加わり得る限り、フラグメント化および定方向性または無方向性アダプターの結合の前にdsDNAを生成するために、所望のインプット鎖の第1および第2鎖コピー、またはRNA転写物の生成を必要とすることであり得る。
トランスクリプトームまたはゲノム配列決定のための定方向性cDNAライブラリの改善された簡便な方法が要望されている。本明細書記載の方法、組成物およびキットはこの要望を満たすことができる。
本明細書では、RNAおよびdsDNAからの定方向性配列決定ライブラリ生成のための方法、組成物およびキットを提供する。これらの方法、組成物およびキットは、全トランスクリプトーム、全ゲノム、標的化されたかまたは選択された転写物の定方向性ライブラリの生成に使用され得、また無方向性全ゲノム配列決定ライブラリの生成にも適用され得る。
一実施態様において、本明細書で提供される方法は、規定密度で非カノニカル(canonical)ヌクレオチドを含む相補的DNA鎖を合成することにより、酵素を用いてcDNAを所望のサイズ範囲にフラグメント化させ得るものであり、この酵素が非カノニカルヌクレオチドの塩基部分を開裂して、脱塩基部位を生成させ、さらにこの脱塩基部位にあるバックボーンが酵素的または化学的または熱(thermal)(例、熱(heat))手段により開裂され得る。製造されたDNAフラグメントはブロックされた3’末端を含み得る。脱塩基部位での酵素開裂は5’リン酸末端を生じさせ得、これがアダプターライゲーションのためのさらなる操作で使用され得る。
別の実施態様において、本明細書では、上記で生成された第1鎖相補的DNAの全フラグメントの3’−末端にアニーリングするように設計されたプライマーを用いて第2鎖合成をプライミングする方法が提供される。
全RNAなどのRNA鋳型からの第1鎖相補的DNA合成は、様々なプライミングスキームを用いて実施され得る。本明細書で提供されている方法の実行に有用な第1鎖プライマーは、標的RNA上の多部位でプライミングすることが可能であり得る、ランダムヘキサマーなどのランダムプライマーであり得る。別の実施形態では、第1鎖プライマーは、標的化転写物またはその一部へのハイブリダイゼーションに特異的な配列を含み得る。さらに別の実施形態において、この第1鎖プライマーは、所望されていない転写物群以外の全転写物でプライミングするように設計された配列を含み得る。例えば、第1鎖cDNAプライマーは、全rRNAなどの構造的RNAでプライミングするのではなく、全転写物で優先的にプライミングするように設計された配列を含み得る。
第1鎖cDNAプライマーの設計とは関係なく、第1鎖合成は、対応するヌクレオチドの混合物において1つまたはそれより多くの非カノニカルヌクレオチドを含む反応混合物中の逆転写酵素により実施され得、このカノニカルヌクレオチド対非カノニカルヌクレオチドの比は、所望のフラグメントサイズ範囲内のフラグメントを生成させるフラグメント化を可能にする密度で非カノニカルヌクレオチドが組み込まれるように選択され得る。フラグメント化生成物の所望のサイズ範囲は、様々な選択された配列決定プラットフォーム、または任意の他のダウンストリーム操作での使用に適応させるため、配列決定ライブラリにおいて挿入物の所望のサイズ範囲に適合するように選択され得る。
所望のサイズ範囲の1本鎖cDNAフラグメントの生成は、配列決定ライブラリおよび他のライブラリの生成のための完全自動化プロセスにとって有益であり得る。場合によっては、第1鎖cDNAフラグメントの生成が、生成物の喪失をもたらし得る音波処理などのフラグメント化の物理的方法を要求しないこともあり、単一細胞分析または非常に小さな試料からの鋳型の分析など、微量の鋳型投入量からのライブラリの生成に有用であり得る。
非カノニカルヌクレオチドdUTPを、UNG処理と組み合わせて使用することにより、脱塩基部位を生成することができる。脱塩基部位にあるバックボーンのフラグメント化は、DMEDなどのポリアミン、またはUSER(UNGとNEBからのエンドヌクレアーゼVIIIとの組み合わせ)におけるなど、酵素の組み合わせにより同じ反応混合物中で実施され得る。別法として、脱塩基部位での開裂は、反応混合物の加熱により、または様々な化学的方法により実施され得る。
本明細書で提供される方法は、様々なライブラリ調製方法で汎用されている、ランダム部位での第2鎖合成を要求しない。したがって、本明細書で提供される方法は、第2鎖cDNAを生成するための選択的プライミングの偏向の低減を提供する。
cDNA生成物の2末端における規定された異なる配列の付加は、鎖ライブラリまたは鎖特異性を保持するライブラリの生成に使用され得る。本明細書で提供される手順により生成される全フラグメントの3’−末端に規定された配列を付加するプロセスは、3’−末端に1本鎖DNAを含む、部分的デュプレックスをもつ全フラグメントのプライミングにより実施され得、この1本鎖DNA部分はランダム配列を含むものとする。1本鎖オーバーハングの長さは少なくとも6から少なくとも7、8または9個のヌクレオチドに変化し得る。1本鎖オーバーハングは、生成された全フラグメントの3’−末端にハイブリダイズさせることができ、DNAポリメラーゼによりこのフラグメントに沿って伸長され得る。部分的デュプレックスプライマーの様々な構造が予測される。幾つかの例を図2に示す。dsDNA部分を形成する2本の鎖は、さらにループにより連結され得る2本のオリゴヌクレオチドであり得る。ループまたはリンカーは、オリゴヌクレオチドを含み得るか、または非ヌクレオチドリンカーまたはその組み合わせを含み得る。それはまた、ヌクレオチド類似体を含み得る。
DNAポリメラーゼによるフラグメントに沿った前記部分的デュプレックスのハイブリダイズされた1本鎖DNA部分の伸長後、新たに合成されたdsDNAの末端が修復されて平滑末端が生成され得る。合成された第2鎖cDNAの他端にある第2の規定された配列は、ライゲーションにより付加され得る。様々なライゲーションモードが予測される。第2アダプターのライゲーションの2つの例を図1Aおよび図1Bに示す。A/T依存的ライゲーションも可能である。これまで記載されたプロセスの生成物は、2末端に規定された末端をもつ第2鎖cDNAであり得、増幅、所望のプラットフォームでの解析に適した所望の配列の付加、クローニングなどのさらなる操作に好適であり得る。付加される配列は、1つまたはそれより多くのバーコード、および/またはIllumina配列決定フローセルなどの固体表面への結合に有用な配列を含み得る。付加される配列はまた、絶対的定量化を可能にし得るユニーク配列で全フラグメントをマーキングするのに有用なランダム配列を含み得る。
本明細書記載の方法および組成物を用いてRNAから定方向性配列決定ライブラリを生成するプロセスの作業の流れを図3に示す。
また、本明細書では、ゲノムDNA鋳型などのdsDNA鋳型からのライブラリの生成のための方法および組成物が提供される。このライブラリは、全ゲノム増幅および配列決定に有用であり得、鋳型dsDNAの物理的フラグメント化を必要とすることなく、非常に小さな試料からのライブラリ生成にも有用であり得る。図4に示すように、相補鎖合成の開始は、変性dsDNA鋳型へのプライマーアニーリングを伴わずに実施され得る。鋳型DNA鎖に沿ったDNA合成は、ニック部位から開始され得る。様々なニッキング酵素の使用については当業界では周知である。鎖特異的であるかまたは鎖特異的ではないニッキング酵素は、本明細書記載の方法に有用であり得る。ニック部位からの伸長により生成された相補的DNAのランダムフラグメント化は、ランダムニッキングではなく、非カノニカルヌクレオチドのランダム挿入により達成され得る。したがって、選択されたニッキング酵素の配列依存性とは関係なく、いかなる所望のニッキング酵素も使用することが可能である。dsDNA鋳型をニッキングして、ニッキング部位間に大きな距離を生じさせる酵素は、本明細書記載の方法による最大適用範囲およびランダムフラグメント化にとって望ましいものであり得る。
dsDNA鋳型からライブラリを生成するためのプロセスは、図4で概略を示すように、鎖cDNA配列決定ライブラリの生成について記載されたものと類似したさらなる工程を含み得る。
図5は、キメラDNA/RNAプライマーを用いる単一プライマー等温増幅(SPIA)によりフラグメント化および付加された生成物を増幅するためのプロセスを記載している。このプロセスにより生成された増幅生成物は、3’および5’部分に規定された配列を含み得るため、投入された鋳型に関して鎖の保持力を提供する。
一実施態様において、本明細書では、定方向性cDNAライブラリを生成する方法であって、a)1つまたはそれより多くのプライマーを鋳型RNAにアニーリングすることと、b)dATP、dCTP、dGTP、dTTPおよびdUTPを含む反応混合物の存在下で前記の1つまたはそれより多くのプライマーを伸長させ、ここで、この反応混合物は、ある一定のdUTP対dTTP比を含むものとし、この比は所望の密度でのdUTPの組込みを可能にし、それによって所望の密度で組み込まれたdUTPを含む1つまたはそれより多くの第1鎖相補的DNA(cDNA)が生成されることと、c)ウラシル−N−グリコシラーゼ(UNG)およびUNGにより作製される脱塩基部位にあるホスホジエステルバックボーンを開裂することができる作用因子で、所望の密度で組み込まれたdUTPを含む1つまたはそれより多くの第1鎖cDNAを選択的に開裂し、ここで、この開裂により、ブロックされた3’末端を含む所望のサイズの複数の第1鎖cDNAフラグメントが生成されることと、d)部分的デュプレックスおよび3’オーバーハングを含む第1アダプターを、ブロックされた3’末端を含む複数の第1鎖cDNAフラグメントのうちの1つまたはそれより多くの3’末端にアニーリングし、ここで、この第1アダプターは、配列Aを含み、このアニーリングは、3’オーバーハングにあるランダム配列を、ブロックされた3’末端を含む複数の第1鎖cDNAフラグメントのうちの1つまたはそれより多くの3’末端に存在する相補配列にハイブリダイズさせることを含むことと、e)相補配列にハイブリダイズされた3’オーバーハングをDNAポリメラーゼで伸長させ、ここで、一方の端に配列Aを含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成されることと、f)配列Bを含む第2アダプターを、一方の端に配列Aを含む1つまたはそれより多くの前記2本鎖cDNAフラグメントにライゲーションし、ここで、このライゲーションにより、一方の端に配列Aおよび反対端に配列Bを含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成され、それによって定方向性ポリヌクレオチドライブラリが生成されることを含む方法が記載される。一部の実施形態において、前述の1つまたはそれより多くのプライマーはランダムプライマーを含む。一部の実施形態において、前述の1つまたはそれより多くのプライマーは、標的鋳型RNAまたはRNAの群に特異的な配列を含む。一部の実施形態において、RNAの群は、実質的に全ての転写物を含む。一部の実施形態において、RNAの群は、構造的RNAを含まず、この構造的RNAはリボソームRNA(rRNA)を含むものとする。一部の実施形態において、本方法は、さらに定方向性cDNAライブラリを増幅することを含み、それにより増幅生成物が生成される。一部の実施形態において、本方法は、さらに増幅生成物を配列決定する追加的工程を含む。一部の実施形態において、この増幅は、SPIAを含む。一部の実施形態において、この増幅はプライマーの使用を含み、このプライマーの1つまたはそれより多くは1つまたはそれより多くのバーコード配列を含むものとする。一部の実施形態において、この配列決定は、次世代配列決定を含む。一部の実施形態において、本方法は、工程b)の後にさらに鋳型RNAを分解することを含む。一部の実施形態において、開裂は、鋳型RNA試料をリボヌクレアーゼに曝露することを含む。一部の実施形態において、ホスホジエステルバックボーンを開裂することができる作用因子は、酵素、化学的作用因子および/または熱を含む。一部の実施形態において、化学的作用因子はポリアミンである。一部の実施形態において、ポリアミンはN,N−ジメチルエチレンジアミン(DMED)である。一部の実施形態において、酵素はエンドヌクレアーゼである。一部の実施形態において、エンドヌクレアーゼはエンドヌクレアーゼVIIIである。一部の実施形態において、部分的デュプレックスは、長鎖および短鎖を含み、この長鎖は、短鎖とデュプレックスを形成する配列Aおよび3’オーバーハングを含むものとする。一部の実施形態において、短鎖はさらに3’および/または5’末端にブロックを含む。一部の実施形態において、第1アダプターはさらに長鎖の5’末端にブロックを含む。一部の実施形態において、第1アダプターは複数の第1アダプターを含み、前述の複数の第1アダプターのそれぞれにおけるランダム配列は、前述の複数の第1アダプターの別のものにおけるランダム配列とは異なるものとし、その複数の第1アダプターのそれぞれが配列Aを含むものとする。一部の実施形態において、工程d)の結果、3’末端でアニーリングされた複数の第1アダプターの1つをさらに含む工程c)で生成されたブロックされた3’末端を含む所望のサイズの前述の複数の第1鎖cDNAフラグメントの実質的に全てが得られる。一部の実施形態において、第1アダプターはさらに短鎖の5’末端にブロックを含む。一部の実施形態において、第1アダプターはさらにステムループを含み、このステムループは、部分的デュプレックスの長鎖の5’末端を部分的デュプレックスの短鎖の3’末端と連結し、この長鎖は配列Aおよび3’オーバーハングを含むものとする。一部の実施形態において、3’オーバーハングは少なくとも6、7、8または9個のヌクレオチドを含む。一部の実施形態において、第2アダプターは部分的デュプレックスを含み、この部分的デュプレックスは、短鎖とハイブリダイズされた長鎖を含み、この長鎖は配列Bおよびオーバーハングを含むものとする。一部の実施形態において、長鎖は配列Bおよび3’オーバーハングを含み、この短鎖は3’末端にブロックを含む。一部の実施形態において、ライゲーションにより、一方の端に配列Aを、反対端に配列Bを含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成され、この配列Aは一方の端の5’末端にあり、配列Bは反対端の3’末端にある。一部の実施形態において、長鎖は配列Bおよび5’オーバーハングを含み、短鎖は5’末端にブロックを含むものとする。一部の実施形態において、ライゲーションにより、一方の端に配列Aを、反対端に配列Bを含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成され、この配列Aは一方の端の5’末端にあり、配列Bは反対端の5’末端にある。一部の実施形態において、反対端の3’末端は、鋳型として配列Bを用いて伸長されており、それによって、一方の端の5’末端に配列Aを、そして反対端の3’末端に配列Bと相補的な配列B’を含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成される。一部の実施形態において、ライゲーションは平滑末端ライゲーションを含み、工程e)で生成された一方の端に配列Aを含む1つまたはそれより多くの2本鎖cDNAフラグメントは、工程f)の前に末端修復されるものとする。一部の実施形態において、第1および/または第2アダプターは、さらに1つまたはそれより多くのバーコードを含む。
一実施態様において、本明細書では、全トランスクリプトーム定方向性配列決定方法であって、a)1つまたはそれより多くのプライマーを鋳型RNAにアニーリングすることと、b)dATP、dCTP、dGTP、dTTPおよびdUTPを含む反応混合物の存在下で前記プライマーを伸長させ、ここで、この反応混合物は、ある一定のdUTP対dTTP比を含むものとし、この比は所望の密度でのdUTPの組込みを可能にし、それによって所望の密度で組み込まれたdUTPを含む1つまたはそれより多くの第1鎖相補的DNA(cDNA)が生成されることと、c)ウラシル−N−グリコシラーゼ(UNG)およびUNGにより作製される脱塩基部位にあるホスホジエステルバックボーンを開裂することができる作用因子で、所望の密度で組み込まれたdUTPを含む1つまたはそれより多くの第1鎖cDNAを選択的に開裂し、ここで、この開裂により、ブロックされた3’末端を含む所望のサイズの複数の第1鎖cDNAフラグメントが生成されることと、d)部分的デュプレックスおよび3’オーバーハングを含む第1アダプターを、ブロックされた3’末端を含む複数の第1鎖cDNAフラグメントのうちの1つまたはそれより多くの3’末端にアニーリングし、ここで、この第1アダプターは配列Aを含み、このアニーリングは、3’オーバーハングにあるランダム配列を、ブロックされた3’末端を含む複数の第1鎖cDNAフラグメントのうちの1つまたはそれより多くの3’末端に存在する相補配列にハイブリダイズさせることを含むことと、e)相補配列にハイブリダイズされた3’オーバーハングをDNAポリメラーゼで伸長させ、ここで、一方の端に配列Aを含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成されることと、f)配列Bを含む第2アダプターを、一方の端に配列Aを含む1つまたはそれより多くの前記2本鎖cDNAフラグメントにライゲーションし、ここで、このライゲーションにより、一方の端に配列Aおよび反対端に配列Bを含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成され、それによって定方向性cDNAライブラリが生成されることと、g)その定方向性cDNAライブラリを増幅および/または配列決定することを含む方法が記載されている。5一部の実施形態において(5In some embodiments)、前述の1つまたはそれより多くのプライマーはランダムプライマーを含む。一部の実施形態において、前述の1つまたはそれより多くのプライマーは、標的鋳型RNAまたはRNAの群に特異的な配列を含む。一部の実施形態において、RNAの群は、実質的に全ての転写物を含む。一部の実施形態において、RNAの群は、構造的RNAを含まず、前記構造的RNAはリボソームRNA(rRNA)を含むものとする。一部の実施形態において、増幅はSPIAを含む。一部の実施形態において、この増幅はプライマーの使用を含み、このプライマーの1つまたはそれより多くはバーコード配列を含むものとする。一部の実施形態において、この配列決定は、次世代配列決定を含む。一部の実施形態において、本方法は、工程b)の後に鋳型RNAを分解することを含む。一部の実施形態において、開裂は、鋳型RNA試料をリボヌクレアーゼに曝露することを含む。一部の実施形態において、ホスホジエステルバックボーンを開裂することができる作用因子は、酵素、化学的作用因子および/または熱を含む。一部の実施形態において、化学的作用因子はポリアミンである。一部の実施形態において、ポリアミンはN,N−ジメチルエチレンジアミン(DMED)である。一部の実施形態において、酵素はエンドヌクレアーゼである。一部の実施形態において、エンドヌクレアーゼはエンドヌクレアーゼVIIIである。一部の実施形態において、部分的デュプレックスは、長鎖および短鎖を含み、この長鎖は、短鎖とデュプレックスを形成する配列Aおよび3’オーバーハングを含むものとする。一部の実施形態において、短鎖はさらに3’および/または5’末端にブロックを含む。一部の実施形態において、第1アダプターはさらに長鎖の5’末端にブロックを含む。一部の実施形態において、第1アダプターは複数の第1アダプターを含み、前述の複数の第1アダプターのそれぞれにおけるランダム配列は、前述の複数の第1アダプターの別のものにおけるランダム配列とは異なるものとし、その複数の第1アダプターのそれぞれが配列Aを含むものとする。一部の実施形態において、工程d)の結果、3’末端でアニーリングされた複数の第1アダプターの1つをさらに含む工程c)で生成されたブロックされた3’末端を含む所望のサイズの前述の複数の第1鎖cDNAフラグメントの実質的に全てが得られる。一部の実施形態において、第1アダプターはさらに短鎖の5’末端にブロックを含む。一部の実施形態において、第1アダプターはさらにステムループを含み、このステムループは、部分的デュプレックスの長鎖の5’末端を部分的デュプレックスの短鎖の3’末端と連結し、この長鎖は配列Aおよび3’オーバーハングを含むものとする。一部の実施形態において、3’オーバーハングは少なくとも6、7、8または9個のヌクレオチドを含む。一部の実施形態において、第2アダプターは部分的デュプレックスを含み、この部分的デュプレックスは、短鎖とハイブリダイズされた長鎖を含み、この長鎖は配列Bおよびオーバーハングを含むものとする。一部の実施形態において、長鎖は配列Bおよび3’オーバーハングを含み、この短鎖は3’末端にブロックを含む。一部の実施形態において、ライゲーションにより、一方の端に配列Aを、反対端に配列Bを含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成され、この配列Aは一方の端の5’末端にあり、配列Bは反対端の3’末端にあるものとする。一部の実施形態において、長鎖は配列Bおよび5’オーバーハングを含み、短鎖は5’末端にブロックを含むものとする。一部の実施形態において、ライゲーションにより、一方の端に配列Aを、反対端に配列Bを含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成され、この配列Aは一方の端の5’末端にあり、配列Bは反対端の5’末端にある。一部の実施形態において、反対端の3’末端は、鋳型として配列Bを用いて伸長され、それによって、一方の端の5’末端に配列Aを、そして反対端の3’末端に配列Bと相補的な配列B’を含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成される。一部の実施形態において、ライゲーションは平滑末端ライゲーションを含み、工程e)で生成された一方の端に配列Aを含む1つまたはそれより多くの2本鎖cDNAフラグメントは、工程f)の前に末端修復されるものとする。一部の実施形態において、第1および/または第2アダプターは、さらに1つまたはそれより多くのバーコードを含む。
一実施態様において、本明細書では、定方向性cDNAライブラリを生成する方法であって、a)鋳型dsDNAをニッキング酵素で処理し、ここで、この処理により、鋳型dsDNAの1鎖のホスホジエステルバックボーンに1つまたはそれより多くの破断が生じ、この破断により、その1鎖において1つまたはそれより多くの3’ヒドロキシルが生成されることと、b)前述の1つまたはそれより多くの3’ヒドロキシルを伸長させ、ここで、この伸長はdATP、dCTP、dGTP、dTTPおよびdUTPを含む反応混合物の存在下で行われ、この反応混合物は、ある一定のdUTP対dTTP比を含み、この比は所望の密度でのdUTPの組込みを可能にし、それによって所望の密度で組み込まれたdUTPを含む1つまたはそれより多くの第1鎖相補的DNA(cDNA)が生成されることと、c)ウラシル−N−グリコシラーゼ(UNG)およびUNGにより作製される脱塩基部位にあるホスホジエステルバックボーンを開裂することができる作用因子で、所望の密度で組み込まれたdUTPを含む1つまたはそれより多くの第1鎖cDNAを選択的に開裂し、ここで、この開裂により、ブロックされた3’末端を含む所望のサイズの複数の第1鎖cDNAフラグメントが生成されることと、d)部分的デュプレックスおよび3’オーバーハングを含む第1アダプターを、ブロックされた3’末端を含む複数の第1鎖cDNAフラグメントのうちの1つまたはそれより多くの3’末端にアニーリングし、ここで、この第1アダプターは配列Aを含み、このアニーリングは、3’オーバーハングにあるランダム配列を、ブロックされた3’末端を含む複数の第1鎖cDNAフラグメントのうちの1つまたはそれより多くの3’末端に存在する相補配列にハイブリダイズさせることを含むことと、e)相補配列にハイブリダイズされた3’オーバーハングをDNAポリメラーゼで伸長させ、ここで、一方の端に配列Aを含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成されることと、f)配列Bを含む第2アダプターを、一方の端に配列Aを含む1つまたはそれより多くの前記2本鎖cDNAフラグメントにライゲーションし、ここで、このライゲーションにより、一方の端に配列Aおよび反対端に配列Bを含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成され、それによって定方向性cDNAライブラリが生成されることを含む方法が記載される。一部の実施形態において、本方法は、さらに定方向性cDNAライブラリを増幅することを含み、それにより増幅生成物が生成される。一部の実施形態において、本方法は、さらに増幅生成物を配列決定する追加的工程を含む。一部の実施形態において、この増幅は、SPIAを含む。一部の実施形態において、この増幅はプライマーの使用を含み、このプライマーの1つまたはそれより多くは1つまたはそれより多くのバーコード配列を含むものとする。一部の実施形態において、この配列決定は、次世代配列決定を含む。一部の実施形態において、ニッキング酵素は、鎖特異的ニッキング酵素を含む。一部の実施形態において、工程b)における1つまたはそれより多くの3’ヒドロキシルの伸長は、鎖置換活性を含むDNAポリメラーゼにより行われる。一部の実施形態において、ホスホジエステルバックボーンを開裂することができる作用因子は、酵素、化学的作用因子および/または熱を含む。一部の実施形態において、化学的作用因子はポリアミンである。一部の実施形態において、ポリアミンはN,N−ジメチルエチレンジアミン(DMED)である。一部の実施形態において、酵素はエンドヌクレアーゼである。一部の実施形態において、エンドヌクレアーゼはエンドヌクレアーゼVIIIである。一部の実施形態において、部分的デュプレックスは、長鎖および短鎖を含み、この長鎖は、短鎖とデュプレックスを形成する配列Aおよび3’オーバーハングを含むものとする。一部の実施形態において、短鎖はさらに3’および/または5’末端にブロックを含む。一部の実施形態において、第1アダプターはさらに長鎖の5’末端にブロックを含む。一部の実施形態において、第1アダプターは複数の第1アダプターを含み、前述の複数の第1アダプターのそれぞれにおけるランダム配列は、前述の複数の第1アダプターの別のものにおけるランダム配列とは異なるものとし、その複数の第1アダプターのそれぞれが配列Aを含むものとする。一部の実施形態において、工程d)の結果、3’末端でアニーリングされた複数の第1アダプターの1つをさらに含む工程c)で生成されたブロックされた3’末端を含む所望のサイズの前述の複数の第1鎖cDNAフラグメントの実質的に全てが得られる。一部の実施形態において、第1アダプターはさらに短鎖の5’末端にブロックを含む。一部の実施形態において、第1アダプターはさらにステムループを含み、このステムループは、部分的デュプレックスの長鎖の5’末端を部分的デュプレックスの短鎖の3’末端と連結し、この長鎖は配列Aおよび3’オーバーハングを含むものとする。一部の実施形態において、3’オーバーハングは少なくとも6、7、8または9個のヌクレオチドを含む。一部の実施形態において、第2アダプターは部分的デュプレックスを含み、この部分的デュプレックスは、短鎖とハイブリダイズされた長鎖を含み、この長鎖は配列Bおよびオーバーハングを含むものとする。一部の実施形態において、長鎖は配列Bおよび3’オーバーハングを含み、この短鎖は3’末端にブロックを含む。一部の実施形態において、ライゲーションにより、一方の端に配列Aを、反対端に配列Bを含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成され、この配列Aは一方の端の5’末端にあり、配列Bは反対端の3’末端にある。一部の実施形態において、長鎖は配列Bおよび5’オーバーハングを含み、短鎖は5’末端にブロックを含むものとする。一部の実施形態において、ライゲーションにより、一方の端に配列Aを、反対端に配列Bを含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成され、この配列Aは一方の端の5’末端にあり、配列Bは反対端の5’末端にある。一部の実施形態において、反対端の3’末端は、鋳型として配列Bを用いて伸長されており、それによって、一方の端の5’末端に配列Aを、そして反対端の3’末端に配列Bと相補的な配列B’を含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成される。一部の実施形態において、ライゲーションは平滑末端ライゲーションを含み、工程e)で生成された一方の端に配列Aを含む1つまたはそれより多くの2本鎖cDNAフラグメントは、工程f)の前に末端修復されるものとする。一部の実施形態において、第1および/または第2アダプターは、さらに1つまたはそれより多くのバーコードを含む。
一実施態様において、本明細書では、全ゲノム配列決定方法であって、a)ゲノムDNAをニッキング酵素で処理し、この処理により、ゲノムDNAの1鎖のホスホジエステルバックボーンに1つまたはそれより多くの破断が生じ、この破断により、その1鎖において1つまたはそれより多くの3’ヒドロキシルが生成されることと、b)前述の1つまたはそれより多くの3’ヒドロキシルを伸長させ、ここで、この伸長はdATP、dCTP、dGTP、dTTPおよびdUTPを含む反応混合物の存在下で行われ、この反応混合物は、ある一定のdUTP対dTTP比を含み、この比は所望の密度でのdUTPの組込みを可能にし、それによって所望の頻度で組み込まれたdUTPを含む1つまたはそれより多くの第1鎖相補的DNA(cDNA)が生成されることと、c)ウラシル−N−グリコシラーゼ(UNG)およびUNGにより作製される脱塩基部位にあるホスホジエステルバックボーンを開裂することができる作用因子で、所望の密度で組み込まれたdUTPを含む1つまたはそれより多くの第1鎖cDNAを選択的に開裂し、ここで、この開裂により、ブロックされた3’末端を含む所望のサイズの複数の第1鎖cDNAフラグメントが生成されることと、d)部分的デュプレックスおよび3’オーバーハングを含む第1アダプターを、ブロックされた3’末端を含む複数の第1鎖cDNAフラグメントのうちの1つまたはそれより多くの3’末端にアニーリングし、ここで、この第1アダプターは配列Aを含み、このアニーリングは、3’オーバーハングにあるランダム配列を、ブロックされた3’末端を含む複数の第1鎖cDNAフラグメントのうちの1つまたはそれより多くの3’末端に存在する相補配列にハイブリダイズさせることを含むことと、e)相補配列にハイブリダイズされた3’オーバーハングをDNAポリメラーゼで伸長させ、ここで、一方の端に配列Aを含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成されることと、f)配列Bを含む第2アダプターを、一方の端に配列Aを含む1つまたはそれより多くの前記2本鎖cDNAフラグメントにライゲーションし、ここで、このライゲーションにより、一方の端に配列Aおよび反対端に配列Bを含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成され、それによって定方向性cDNAライブラリが生成されることと、g)定方向性cDNAライブラリを増幅および/または配列決定することを含む方法が記載される。一部の実施形態において、この増幅は、SPIAを含む。一部の実施形態において、この増幅はプライマーの使用を含み、このプライマーの1つまたはそれより多くはバーコード配列を含むものとする。一部の実施形態において、この配列決定は、次世代配列決定を含む。一部の実施形態において、ニッキング酵素は、鎖特異的ニッキング酵素を含む。一部の実施形態において、工程b)における1つまたはそれより多くの3’ヒドロキシルの伸長は、鎖置換活性を含むDNAポリメラーゼにより行われる。一部の実施形態において、ホスホジエステルバックボーンを開裂することができる作用因子は、酵素、化学的作用因子および/または熱を含む。一部の実施形態において、化学的作用因子はポリアミンである。一部の実施形態において、ポリアミンはN,N−ジメチルエチレンジアミン(DMED)である。一部の実施形態において、酵素はエンドヌクレアーゼである。一部の実施形態において、エンドヌクレアーゼはエンドヌクレアーゼVIIIである。一部の実施形態において、部分的デュプレックスは、長鎖および短鎖を含み、この長鎖は、短鎖とデュプレックスを形成する配列Aおよび3’オーバーハングを含むものとする。一部の実施形態において、短鎖はさらに3’および/または5’末端にブロックを含む。一部の実施形態において、第1アダプターはさらに長鎖の5’末端にブロックを含む。一部の実施形態において、第1アダプターは複数の第1アダプターを含み、前述の複数の第1アダプターのそれぞれにおけるランダム配列は、前述の複数の第1アダプターの別のものにおけるランダム配列とは異なるものとし、その複数の第1アダプターのそれぞれが配列Aを含むものとする。一部の実施形態において、工程d)の結果、3’末端でアニーリングされた複数の第1アダプターの1つをさらに含む工程c)で生成されたブロックされた3’末端を含む所望のサイズの前述の複数の第1鎖cDNAフラグメントの実質的に全てが得られる。一部の実施形態において、第1アダプターはさらに短鎖の5’末端にブロックを含む。一部の実施形態において、第1アダプターはさらにステムループを含み、このステムループは、部分的デュプレックスの長鎖の5’末端を部分的デュプレックスの短鎖の3’末端と連結し、この長鎖は配列Aおよび3’オーバーハングを含むものとする。一部の実施形態において、3’オーバーハングは少なくとも6、7、8または9個のヌクレオチドを含む。一部の実施形態において、第2アダプターは部分的デュプレックスを含み、この部分的デュプレックスは、短鎖とハイブリダイズされた長鎖を含み、この長鎖は配列Bおよびオーバーハングを含むものとする。一部の実施形態において、長鎖は配列Bおよび3’オーバーハングを含み、この短鎖は3’末端にブロックを含む。一部の実施形態において、ライゲーションにより、一方の端に配列Aを、反対端に配列Bを含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成され、この配列Aは一方の端の5’末端にあり、配列Bは反対端の3’末端にあるものとする。一部の実施形態において、長鎖は配列Bおよび5’オーバーハングを含み、短鎖は5’末端にブロックを含むものとする。一部の実施形態において、ライゲーションにより、一方の端に配列Aを、反対端に配列Bを含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成され、この配列Aは一方の端の5’末端にあり、配列Bは反対端の5’末端にある。一部の実施形態において、反対端の3’末端は、鋳型として配列Bを用いて伸長されており、それによって、一方の端の5’末端に配列Aを、そして反対端の3’末端に配列Bと相補的な配列B’を含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成される。一部の実施形態において、ライゲーションは平滑末端ライゲーションを含み、工程e)で生成された一方の端に配列Aを含む1つまたはそれより多くの2本鎖cDNAフラグメントは、工程f)の前に末端修復されるものとする。一部の実施形態において、第1および/または第2アダプターは、さらに1つまたはそれより多くのバーコードを含む。
一実施態様において、本明細書では、定方向性ポリヌクレオチドライブラリを生成する方法であって、a)1つまたはそれより多くのプライマー、逆転写酵素、および非カノニカルヌクレオチドを含む反応混合物の存在下で鋳型RNAを逆転写し、ここでこの反応混合物は所望の密度で非カノニカルヌクレオチドを組み込ませるのに適した比率の非カノニカルヌクレオチドを含み、それによって所望の密度で組み込まれた非カノニカルヌクレオチドを含む1つまたはそれより多くの第1鎖相補的DNA(cDNA)が生成されることと、b)所望の密度で組み込まれた非カノニカルヌクレオチドを含む1つまたはそれより多くの第1鎖cDNAを開裂作用因子で選択的に開裂し、ここでこの開裂作用因子による開裂により、ブロックされた3’末端を含む所望のサイズの複数の第1鎖cDNAフラグメントが生成されることと、c)部分的デュプレックスおよび3’オーバーハングを含む第1アダプターを、ブロックされた3’末端を含む複数の第1鎖cDNAフラグメントのうちの1つまたはそれより多くの3’末端にアニーリングし、ここで、この第1アダプターは配列Aを含み、このアニーリングは、3’オーバーハングにあるランダム配列を、ブロックされた3’末端を含む複数の第1鎖cDNAフラグメントのうちの1つまたはそれより多くの3’末端に存在する相補配列にハイブリダイズさせることを含むことと、d)相補配列にハイブリダイズされた3’オーバーハングをDNAポリメラーゼで伸長させ、ここで、一方の端に配列Aを含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成されることと、e)配列Bを含む第2アダプターを、一方の端に配列Aを含む1つまたはそれより多くの前記2本鎖cDNAフラグメントにライゲーションし、ここで、このライゲーションにより、一方の端に配列Aおよび反対端に配列Bを含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成され、それによって定方向性ポリヌクレオチドライブラリが生成されることを含む方法が記載される。一部の実施形態において、鋳型RNAはmRNAを含む。一部の実施形態において、前述の1つまたはそれより多くのプライマーはランダムプライマーを含む。一部の実施形態において、前述の1つまたはそれより多くのプライマーは、標的RNAまたはRNAの群に特異的な配列を含む。一部の実施形態において、RNAの群は、実質的に全ての転写物を含む。一部の実施形態において、RNAの群は、構造的RNAを含まず、前記構造的RNAはリボソームRNA(rRNA)を含むものとする。一部の実施形態において、本方法は、工程a)の後にさらに鋳型RNAを分解することを含む。一部の実施形態において、非カノニカルdNTPはdUTPを含む。一部の実施形態において、開裂作用因子は、グリコシラーゼおよびポリアミン、熱または酵素を含む。一部の実施形態において、グリコシラーゼはウラシル−N−グリコシラーゼ(UNG)である。一部の実施形態において、ポリアミンはN,N−ジメチルエチレンジアミン(DMED)である。一部の実施形態において、酵素はエンドヌクレアーゼを含む。一部の実施形態において、エンドヌクレアーゼはエンドヌクレアーゼVIIIである。一部の実施形態において、第1アダプターは複数の第1アダプターを含み、前述の複数の第1アダプターのそれぞれにおけるランダム配列は、前述の複数の第1アダプターの別のものにおけるランダム配列とは異なるものとし、その複数の第1アダプターのそれぞれが配列Aを含むものとする。一部の実施形態において、アニーリングの結果、3’末端でアニーリングされた複数の第1アダプターの1つをさらに含むブロックされた3’末端を含む所望のサイズの前述の複数の第1鎖cDNAフラグメントの実質的に全てが得られる。一部の実施形態において、部分的デュプレックスは、長鎖および短鎖を含み、この長鎖は、短鎖とデュプレックスを形成する配列Aおよび3’オーバーハングを含むものとする。一部の実施形態において、短鎖はさらに3’および/または5’末端にブロックを含む。一部の実施形態において、第1アダプターはさらにステムループを含み、このステムループは、部分的デュプレックスの長鎖の5’末端を部分的デュプレックスの短鎖の3’末端と連結し、この長鎖は配列Aおよび3’オーバーハングを含むものとする。一部の実施形態において、第1アダプターはさらに長鎖の5’末端にブロックを含む。一部の実施形態において、第1アダプターはさらに短鎖の5’末端にブロックを含む。一部の実施形態において、3’オーバーハングは少なくとも6、7、8または9個のヌクレオチドを含む。一部の実施形態において、第2アダプターは、デュプレックス、部分的デュプレックス、またはステムループにより連結されたデュプレックス部分を含む1本鎖を含む。一部の実施形態において、第1および/または第2アダプターは、さらに1つまたはそれより多くのバーコードを含む。一部の実施形態において、第2アダプターは部分的デュプレックスを含み、この部分的デュプレックスは、短鎖とハイブリダイズされた長鎖を含み、この長鎖は配列Bおよびオーバーハングを含むものとする。一部の実施形態において、長鎖は配列Bおよび3’オーバーハングを含み、この短鎖は3’末端にブロックを含む。一部の実施形態において、ライゲーションにより、一方の端に配列Aを、反対端に配列Bを含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成され、この配列Aは一方の端の5’末端にあり、配列Bは反対端の3’末端にあるものとする。一部の実施形態において、長鎖は配列Bおよび5’オーバーハングを含み、短鎖は5’末端にブロックを含むものとする。一部の実施形態において、ライゲーションにより、一方の端に配列Aを、反対端に配列Bを含む前述の1つまたはそれより多くの2本鎖cDNAフラグメントが生成され、この配列Aは一方の端の5’末端にあり、配列Bは反対端の5’末端にある。一部の実施形態において、反対端の3’末端は、鋳型として配列Bを用いて伸長され、それによって、一方の端の5’末端に配列Aを、そして反対端の3’末端に配列Bと相補的な配列B’を含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成される。一部の実施形態において、本方法は、さらに定方向性cDNAライブラリを増幅することを含み、それにより増幅生成物が生成され、さらに増幅生成物を配列決定する追加的工程を含む。一部の実施形態において、この増幅は、SPIAを含む。一部の実施形態において、この増幅はプライマーの使用を含み、このプライマーの1つまたはそれより多くはバーコード配列を含むものとする。一部の実施形態において、この配列決定は、次世代配列決定を含む。一部の実施形態において、ライゲーションは平滑末端ライゲーションを含み、工程e)で生成された一方の端に配列Aを含む1つまたはそれより多くの2本鎖cDNAフラグメントは、工程f)の前に末端修復されるものとする。
一実施態様において、本明細書では、定方向性ポリヌクレオチドライブラリを生成する方法であって、a)鋳型DNAをニッキング酵素で処理し、この処理により、鋳型DNAの1鎖のホスホジエステルバックボーンに1つまたはそれより多くの破断が生じ、この1つまたはそれより多くの破断により、その1鎖において1つまたはそれより多くの3’ヒドロキシルが生成されることと、b)前述の1つまたはそれより多くの3’ヒドロキシルを伸長させ、ここで、この伸長は非カノニカルヌクレオチドを含む反応混合物の存在下で行われ、この反応混合物は、所望の密度で非カノニカルヌクレオチドを組み込ませるのに適した比率の非カノニカルヌクレオチドを含み、それによって所望の密度で組み込まれた非カノニカルヌクレオチドを含む1つまたはそれより多くの第1鎖相補的DNA(cDNA)が生成されることと、c)所望の密度で組み込まれた非カノニカルヌクレオチドを含む1つまたはそれより多くの第1鎖cDNAを開裂作用因子で選択的に開裂し、ここでこの開裂作用因子による開裂により、ブロックされた3’末端を含む所望のサイズの複数の第1鎖cDNAフラグメントが生成されることと、d)部分的デュプレックスおよび3’オーバーハングを含む第1アダプターを、ブロックされた3’末端を含む複数の第1鎖cDNAフラグメントのうちの1つまたはそれより多くの3’末端にアニーリングし、ここで、この第1アダプターは配列Aを含み、このアニーリングは、3’オーバーハングにあるランダム配列を、ブロックされた3’末端を含む複数の第1鎖cDNAフラグメントのうちの1つまたはそれより多くの3’末端に存在する相補配列にハイブリダイズさせることを含むことと、e)相補配列にハイブリダイズされた3’オーバーハングをDNAポリメラーゼで伸長させ、ここで、一方の端に配列Aを含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成されることと、f)配列Bを含む第2アダプターを、一方の端に配列Aを含む1つまたはそれより多くの前記2本鎖cDNAフラグメントにライゲーションし、ここで、このライゲーションにより、一方の端に配列Aおよび反対端に配列Bを含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成され、それによって定方向性ポリヌクレオチドライブラリが生成されることを含む方法が記載される。一部の実施形態において、鋳型DNAは2本鎖DNA(dsDNA)を含む。一部の実施形態において、鋳型DNAはゲノムDNAを含む。一部の実施形態において、ニッキング酵素は、鎖特異的ニッキング酵素を含む。一部の実施形態において、工程b)における3’ヒドロキシルの伸長は、鎖置換活性を含むDNAポリメラーゼにより行われる。一部の実施形態において、非カノニカルdNTPはdUTPを含む。一部の実施形態において、開裂作用因子は、グリコシラーゼおよびポリアミン、熱または酵素を含む。一部の実施形態において、グリコシラーゼはウラシル−N−グリコシラーゼ(UNG)である。一部の実施形態において、ポリアミンはN,N−ジメチルエチレンジアミン(DMED)である。一部の実施形態において、酵素はエンドヌクレアーゼを含む。一部の実施形態において、エンドヌクレアーゼはエンドヌクレアーゼVIIIである。一部の実施形態において、第1アダプターは複数の第1アダプターを含み、前述の複数の第1アダプターのそれぞれにおけるランダム配列は、前述の複数の第1アダプターの別のものにおけるランダム配列とは異なるものとし、その複数の第1アダプターのそれぞれが配列Aを含むものとする。一部の実施形態において、アニーリングの結果、3’末端でアニーリングされた複数の第1アダプターの1つをさらに含むブロックされた3’末端を含む所望のサイズの前述の複数の第1鎖cDNAフラグメントの実質的に全てが得られる。一部の実施形態において、部分的デュプレックスは、長鎖および短鎖を含み、この長鎖は、短鎖とデュプレックスを形成する配列Aおよび3’オーバーハングを含むものとする。一部の実施形態において、短鎖はさらに3’および/または5’末端にブロックを含む。一部の実施形態において、第1アダプターはさらにステムループを含み、このステムループは、部分的デュプレックスの長鎖の5’末端を部分的デュプレックスの短鎖の3’末端と連結し、この長鎖は配列Aおよび3’オーバーハングを含むものとする。一部の実施形態において、第1アダプターはさらに長鎖の5’末端にブロックを含む。一部の実施形態において、第1アダプターはさらに短鎖の5’末端にブロックを含む。一部の実施形態において、3’オーバーハングは少なくとも6、7、8または9個のヌクレオチドを含む。一部の実施形態において、第2アダプターは、デュプレックス、部分的デュプレックス、またはステムループにより連結されたデュプレックス部分を含む1本鎖を含む。一部の実施形態において、第1および/または第2アダプターは、さらに1つまたはそれより多くのバーコードを含む。一部の実施形態において、第2アダプターは部分的デュプレックスを含み、この部分的デュプレックスは、短鎖とハイブリダイズされた長鎖を含み、この長鎖は配列Bおよびオーバーハングを含むものとする。一部の実施形態において、長鎖は配列Bおよび3’オーバーハングを含み、この短鎖は3’末端にブロックを含む。一部の実施形態において、ライゲーションにより、一方の端に配列Aを、反対端に配列Bを含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成され、この配列Aは一方の端の5’末端にあり、配列Bは反対端の3’末端にあるものとする。一部の実施形態において、長鎖は配列Bおよび5’オーバーハングを含み、短鎖は5’末端にブロックを含むものとする。一部の実施形態において、ライゲーションにより、一方の端に配列Aを、反対端に配列Bを含む前述の1つまたはそれより多くの2本鎖cDNAフラグメントが生成され、この配列Aは一方の端の5’末端にあり、配列Bは反対端の5’末端にある。一部の実施形態において、反対端の3’末端は、鋳型として配列Bを用いて伸長され、それによって、一方の端の5’末端に配列Aを、そして反対端の3’末端に配列Bと相補的な配列B’を含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成される。一部の実施形態において、本方法は、さらに定方向性cDNAライブラリを増幅することを含み、それにより増幅生成物が生成される。一部の実施形態において、本方法は、さらに増幅生成物を配列決定する追加的工程を含む。一部の実施形態において、この増幅は、SPIAを含む。一部の実施形態において、この増幅はプライマーの使用を含み、このプライマーの1つまたはそれより多くはバーコード配列を含むものとする。一部の実施形態において、この配列決定は、次世代配列決定を含む。一部の実施形態において、ライゲーションは平滑末端ライゲーションを含み、工程e)で生成された一方の端に配列Aを含む1つまたはそれより多くの2本鎖cDNAフラグメントは、工程f)の前に末端修復されるものとする。
一実施態様において、本明細書では、定方向性ポリヌクレオチドライブラリを生成する方法であって、a)1つまたはそれより多くの脱塩基部位に1つまたはそれより多くの脱塩基部位(sitse)を含む1つまたはそれより多くのポリヌクレオチドのホスホジエステルバックボーンを化学的に開裂し、これによって所望のサイズ範囲内にある、ブロックされた3’末端を含む1つまたはそれより多くのポリヌクレオチドが生成されることと、b)ブロックされた3’末端を含む1つまたはそれより多くのポリヌクレオチドの3’末端に第1アダプターを付加し、この第1アダプターは配列Aを含み、この配列Aは、前述のブロックされた3’末端を含む1つまたはそれより多くのポリヌクレオチドとハイブリダイゼーションできないことと、c)鋳型として前述のブロックされた3’末端を含む1つまたはそれより多くのポリヌクレオチドを用いて、前述のブロックされた3’末端を含む1つまたはそれより多くのポリヌクレオチドの3’末端に付加された第1アダプターの3’末端を伸長させ、ここで一方の端に配列Aを含む1つまたはそれより多くの2本鎖ポリヌクレオチドが生成されることと、d)一方の端に配列Aを含む1つまたはそれより多くの2本鎖ポリヌクレオチドに配列Bを含む第2アダプターを付加し、ここで配列Bは配列Aとは異なり、この付加により、一方の端に配列Aを、反対端に配列Bを含む1つまたはそれより多くの2本鎖ポリヌクレオチドが生成され、それにより定方向性ポリヌクレオチドライブラリが生成されることを含む方法が記載される。一部の実施形態において、ホスホジエステルバックボーンをポリアミンで開裂することにより、所望のサイズ範囲内の、ブロックされた3’末端を含む1つまたはそれより多くのポリヌクレオチドが生成される。一部の実施形態において、ポリアミンはN,N’−ジメチルエチレンジアミン(DMED)である。一部の実施形態において、1つまたはそれより多くの脱塩基部位を含む1つまたはそれより多くのポリヌクレオチドは、非カノニカルヌクレオチドの塩基部分を開裂することができる酵素で、1つまたはそれより多くのポリヌクレオチドにおける非カノニカルヌクレオチドの塩基部分を開裂することにより生成され、そこで脱塩基部位が生成される。一部の実施形態において、非カノニカルヌクレオチドは、dUTP、dITP、および5−OH−Me−dCTPから成る群から選択される。一部の実施形態において、非カノニカルヌクレオチドの塩基部分を開裂することができる酵素は、N−グリコシラーゼである。一部の実施形態において、N−グリコシラーゼは、ウラシルN−グリコシラーゼ(UNG)、ヒポキサンチン−N−グリコシラーゼ、およびヒドロキシ−メチルシトシン−N−グリコシラーゼから成る群から選択される。一部の実施形態において、非カノニカルヌクレオチドはdUTPであり、非カノニカルヌクレオチドの塩基部分を開裂することができる酵素はUNGである。一部の実施形態において、非カノニカルヌクレオチドはdUTPであり、非カノニカルヌクレオチドの塩基部分を開裂することができる酵素はUNGであり、ホスホジエステルバックボーンはDMEDで開裂される。一部の実施形態において、1つまたはそれより多くの非カノニカルヌクレオチドを含む1つまたはそれより多くのポリヌクレオチドは、2つまたはそれより多くの異なる非カノニカルヌクレオチドの存在下で合成され、それによって2つまたはそれより多くの異なる非カノニカルヌクレオチドを含む1つまたはそれより多くのポリヌクレオチドが合成される。一部の実施形態において、1つまたはそれより多くの脱塩基部位を含む1つまたはそれより多くのポリヌクレオチドは、DNAまたはRNAを含む鋳型核酸から合成される。一部の実施形態において、鋳型核酸は、mRNA、cDNAおよびゲノムDNAから成る群から選択される。一部の実施形態において、1つまたはそれより多くの脱塩基部位を含む1つまたはそれより多くのポリヌクレオチドは、1本鎖または2本鎖である。一部の実施形態において、1つまたはそれより多くの脱塩基部位を含む1つまたはそれより多くのポリヌクレオチドは、ポリメラーゼ連鎖反応(PCR)、鎖置換型増幅(SDA)、多置換型増幅(MDA)、ローリングサークル増幅(RCA)、単一プライマー等温増幅(SPIA)およびRibo−SPIAから成る群から選択される増幅方法により合成される。一部の実施形態において、1つまたはそれより多くの脱塩基部位を含む1つまたはそれより多くのポリヌクレオチドは、逆転写、プライマー伸長、限定プライマー伸長、複製、およびニック翻訳から成る群から選択された方法により合成される。一部の実施形態において、第1アダプターはさらに部分的デュプレックスおよび3’オーバーハングを含む。一部の実施形態において、第1アダプターは複数の第1アダプターを含み、前述の複数の第1アダプターのそれぞれにおけるランダム配列は、前述の複数の第1アダプターの別のものにおけるランダム配列とは異なるものとし、その複数の第1アダプターのそれぞれが配列Aを含むものとする。一部の実施形態において、アニーリングの結果、3’末端でアニーリングされた複数の第1アダプターの1つをさらに含むブロックされた3’末端を含む所望のサイズの前述の複数の第1鎖cDNAフラグメントの実質的に全てが得られる。一部の実施形態において、この付加には、第1アダプターの3’オーバーハングを、ブロックされた3’末端を含むポリヌクレオチドの3’末端にアニーリングすることが含まれ、このアニーリングは、3’オーバーハングにあるランダム配列を、ブロックされた3’末端を含むポリヌクレオチドの3’末端に存在する相補配列にハイブリダイズさせることを含む。一部の実施形態において、部分的デュプレックスは、長鎖および短鎖を含み、この長鎖は、短鎖とデュプレックスを形成する配列Aおよび3’オーバーハングを含むものとする。一部の実施形態において、短鎖はさらに短鎖の3’および/または5’末端にブロックを含む。一部の実施形態において、第1アダプターはさらにステムループを含み、このステムループは、部分的デュプレックスの長鎖の5’末端を部分的デュプレックスの短鎖の3’末端と連結し、この長鎖は配列Aおよび3’オーバーハングを含むものとする。一部の実施形態において、第1アダプターはさらに長鎖の5’末端にブロックを含む。一部の実施形態において、第1アダプターはさらに短鎖の5’末端にブロックを含む。一部の実施形態において、3’オーバーハングは少なくとも6、7、8または9個のヌクレオチドを含む。一部の実施形態において、工程d)は第2アダプターをライゲーションすることを含む。一部の実施形態において、このライゲーションは、平滑末端ライゲーションを含む。一部の実施形態において、工程c)で生成された一方の端に配列Aを含むポリヌクレオチドは、工程d)の前に末端修復される。一部の実施形態において、第2アダプターは、デュプレックス、部分的デュプレックス、またはステムループにより連結されたデュプレックス部分を含む1本鎖を含む。一部の実施形態において、第1および/または第2アダプターは、さらに1つまたはそれより多くのバーコードを含む。一部の実施形態において、第2アダプターは部分的デュプレックスを含み、この部分的デュプレックスは、短鎖とハイブリダイズされた長鎖を含み、この長鎖は配列Bおよびオーバーハングを含むものとする。一部の実施形態において、長鎖は配列Bおよび3’オーバーハングを含み、この短鎖は3’末端にブロックを含む。一部の実施形態において、第2アダプターの付加により、一方の端に配列Aを、反対端に配列Bを含む1つまたはそれより多くの2本鎖ポリヌクレオチドが生成され、この配列Aは一方の端の5’末端にあり、配列Bは反対端の3’末端にあるものとする。一部の実施形態において、長鎖は配列Bおよび5’オーバーハングを含み、短鎖は5’末端にブロックを含むものとする。一部の実施形態において、第2アダプターの付加により、一方の端に配列Aを、反対端に配列Bを含む前述の1つまたはそれより多くの2本鎖ポリヌクレオチドが生成され、この配列Aは一方の端の5’末端にあり、配列Bは反対端の5’末端にある。一部の実施形態において、反対端の3’末端は、鋳型として配列Bを用いて伸長され、それによって、一方の端の5’末端に配列Aを、そして反対端の3’末端に配列Bと相補的な配列B’を含む1つまたはそれより多くの2本鎖ポリヌクレオチドが生成される。一部の実施形態において、本方法は、さらに定方向性cDNAライブラリを増幅することを含み、それにより増幅生成物が生成される。一部の実施形態において、本方法は、さらに増幅生成物を配列決定する追加的工程を含む。一部の実施形態において、この増幅は、SPIAを含む。一部の実施形態において、この増幅はプライマーの使用を含み、このプライマーの1つまたはそれより多くはバーコード配列を含むものとする。一部の実施形態において、この配列決定は、次世代配列決定を含む。
一実施態様において、本明細書では、定方向性ポリヌクレオチドライブラリを生成する方法であって、a)非カノニカルヌクレオチドの存在下で鋳型核酸から1つまたはそれより多くのポリヌクレオチドを合成し、これにより非カノニカルヌクレオチドを含む1つまたはそれより多くのポリヌクレオチドが生成されることと、b)非カノニカルヌクレオチドの塩基部分を開裂することができる酵素で、1つまたはそれより多くの合成されたポリヌクレオチドからの非カノニカルヌクレオチドの塩基部分を開裂し、これにより脱塩基部位が生成されることと、c)この脱塩基部位で脱塩基部位を含む1つまたはそれより多くのポリヌクレオチドのホスホジエステルバックボーンを開裂し、これによりブロックされた3’末端を含む所望のサイズ範囲内の1つまたはそれより多くのポリヌクレオチドが生成されることと、d)ブロックされた3’末端を含む1つまたはそれより多くのポリヌクレオチドの3’末端に第1アダプターを付加し、この第1アダプターは配列Aを含み、この配列Aは、前述のブロックされた3’末端を含む1つまたはそれより多くのポリヌクレオチドとハイブリダイゼーションできないことと、e)鋳型として前述のブロックされた3’末端を含む1つまたはそれより多くのポリヌクレオチドを用いて、前述のブロックされた3’末端を含む1つまたはそれより多くのポリヌクレオチドの3’末端に付加された第1アダプターの3’末端を伸長させ、ここで一方の端に配列Aを含む1つまたはそれより多くの2本鎖ポリヌクレオチドが生成されることと、f)一方の端に配列Aを含む1つまたはそれより多くの2本鎖ポリヌクレオチドに配列Bを含む第2アダプターを付加し、ここで配列Bは配列Aとは異なり、この付加により、一方の端に配列Aを、反対端に配列Bを含む1つまたはそれより多くの2本鎖ポリヌクレオチドが生成され、それにより定方向性ポリヌクレオチドライブラリが生成されることを含む方法が記載される。一部の実施形態において、工程(b)および(c)は同じ反応混合物中で同時に実施される。一部の実施形態において、本方法は、全4カノニカルヌクレオチドおよび1非カノニカルヌクレオチドの存在下で鋳型核酸から1つまたはそれより多くのポリヌクレオチドを合成することを含むもので、非カノニカルヌクレオチドは、所望のサイズ範囲内にあるフラグメントを生成するのに適した比率で提供されるものとする。一部の実施形態において、前述の非カノニカルヌクレオチドを含む1つまたはそれより多くのポリヌクレオチドは、ポリメラーゼ連鎖反応(PCR)、鎖置換型増幅(SDA)、多置換型増幅(MDA)、ローリングサークル増幅(RCA)、単一プライマー等温増幅(SPIA)およびRibo−SPIAから成る群から選択される増幅方法により合成される。一部の実施形態において、前述の非カノニカルヌクレオチドを含む1つまたはそれより多くのポリヌクレオチドは、逆転写、プライマー伸長、限定プライマー伸長、複製、およびニック翻訳から成る群から選択された方法により合成される。一部の実施形態において、第1アダプターはさらに部分的デュプレックスおよび3’オーバーハングを含む。一部の実施形態において、第1アダプターは複数の第1アダプターを含み、前述の複数の第1アダプターのそれぞれにおけるランダム配列は、前述の複数の第1アダプターの別のものにおけるランダム配列とは異なるものとし、その複数の第1アダプターのそれぞれが配列Aを含むものとする。一部の実施形態において、アニーリングの結果、3’末端でアニーリングされた複数の第1アダプターの1つをさらに含むブロックされた3’末端を含む所望のサイズの前述の複数の第1鎖cDNAフラグメントの実質的に全てが得られる。一部の実施形態において、この付加には、第1アダプターの3’オーバーハングを、ブロックされた3’末端を含む1つまたはそれより多くのポリヌクレオチドの3’末端にアニーリングすることが含まれ、このアニーリングは、3’オーバーハングにあるランダム配列を、ブロックされた3’末端を含む1つまたはそれより多くのポリヌクレオチドの3’末端に存在する相補配列にハイブリダイズさせることを含む。一部の実施形態において、部分的デュプレックスは、長鎖および短鎖を含み、この長鎖は、短鎖とデュプレックスを形成する配列Aおよび3’オーバーハングを含むものとする。一部の実施形態において、短鎖はさらに3’および/または5’末端にブロックを含む。一部の実施形態において、長鎖はさらに5’末端にブロックを含む。一部の実施形態において、第1アダプターはさらにステムループを含み、このステムループは、部分的デュプレックスの長鎖の5’末端を部分的デュプレックスの短鎖の3’末端と連結し、この長鎖は配列Aおよび3’オーバーハングを含むものとする。一部の実施形態において、第1アダプターはさらに短鎖の5’末端にブロックを含む。一部の実施形態において、3’オーバーハングは少なくとも6、7、8または9個のヌクレオチドを含む。一部の実施形態において、工程f)は第2アダプターをライゲーションすることを含む。一部の実施形態において、このライゲーションは、平滑末端ライゲーションを含む。一部の実施形態において、工程e)で生成された一方の端に配列Aを含む1つまたはそれより多くのポリヌクレオチドは、工程f)の前に末端修復される。一部の実施形態において、第2アダプターは、デュプレックス、部分的デュプレックス、またはステムループにより連結されたデュプレックス部分を含む1本鎖を含む。一部の実施形態において、第1および/または第2アダプターは、さらに1つまたはそれより多くのバーコードを含む。一部の実施形態において、第2アダプターは部分的デュプレックスを含み、この部分的デュプレックスは、短鎖とハイブリダイズされた長鎖を含み、この長鎖は配列Bおよびオーバーハングを含むものとする。一部の実施形態において、長鎖は配列Bおよび3’オーバーハングを含み、この短鎖は3’末端にブロックを含む。一部の実施形態において、第2アダプターの付加により、一方の端に配列Aを、反対端に配列Bを含む1つまたはそれより多くの2本鎖ポリヌクレオチドが生成され、この配列Aは一方の端の5’末端にあり、配列Bは反対端の3’末端にあるものとする。一部の実施形態において、長鎖は配列Bおよび5’オーバーハングを含み、短鎖は5’末端にブロックを含むものとする。一部の実施形態において、第2アダプターの付加により、一方の端に配列Aを、反対端に配列Bを含む前述の1つまたはそれより多くの2本鎖ポリヌクレオチドが生成され、この配列Aは一方の端の5’末端にあり、配列Bは反対端の5’末端にあるものとする。一部の実施形態において、反対端の3’末端は、鋳型として配列Bを用いて伸長され、それによって、一方の端の5’末端に配列Aを、そして反対端の3’末端に配列Bと相補的な配列B’を含む1つまたはそれより多くの2本鎖ポリヌクレオチドが生成される。一部の実施形態において、本方法は、さらに定方向性ポリヌクレオチドライブラリを増幅することを含み、それにより増幅生成物が生成される。一部の実施形態において、本方法は、さらに増幅生成物を配列決定する追加的工程を含む。一部の実施形態において、この増幅は、SPIAを含む。一部の実施形態において、この増幅はプライマーの使用を含み、このプライマーの1つまたはそれより多くはバーコード配列を含むものとする。一部の実施形態において、この配列決定は、次世代配列決定を含む。
本明細書ではまた、定方向性cDNAライブラリを生成する方法であって、(a)鋳型RNAに1つまたはそれより多くのプライマーをアニーリングすることと、(b)dATP、dCTP、dGTP、dTTP、およびdUTPを含む反応混合物の存在下で前述の1つまたはそれより多くのプライマーを伸長させ、ここで反応混合物は、ある一定のdUTP対dTTP比を含み、この比は所望の密度でのdUTPの組込みを可能にし、それにより所望の密度で組み込まれたdUTPを含む1つまたはそれより多くの第1鎖相補的DNA(cDNA)が生成されることと、(c)ウラシル−N−グリコシラーゼ(UNG)およびUNGにより作製される脱塩基部位にあるホスホジエステルバックボーンを開裂することができる作用因子で、所望の密度で組み込まれたdUTPを含む1つまたはそれより多くの第1鎖cDNAを選択的に開裂し、ここで、この開裂により、ブロックされた3’末端を含む所望のサイズの複数の第1鎖cDNAフラグメントが生成されることと、(d)部分的デュプレックスおよび3’オーバーハングを含む第1アダプターを、ブロックされた3’末端を含む複数の第1鎖cDNAフラグメントのうちの1つまたはそれより多くの3’末端にアニーリングし、ここで、この第1アダプターは配列Aを含み、このアニーリングは、3’オーバーハングにあるランダム配列を、ブロックされた3’末端を含む複数の第1鎖cDNAフラグメントのうちの1つまたはそれより多くの3’末端に存在する相補配列にハイブリダイズさせることを含むことと、(e)相補配列にハイブリダイズされた3’オーバーハングをDNAポリメラーゼで伸長させ、ここで、一方の端に配列Aを含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成されることと、(f)配列Bを含む第2アダプターを、一方の端に配列Aを含む1つまたはそれより多くの前記2本鎖cDNAフラグメントにライゲーションし、ここで、このライゲーションにより、一方の端に配列Aおよび反対端に配列Bを含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成され、それによって定方向性ポリヌクレオチドライブラリが生成されることと、(g)任意選択でこの定方向性cDNAライブラリを増幅および/または配列決定することを含む方法が提供される。
本明細書ではまた、定方向性cDNAライブラリを生成する方法であって、(a)鋳型dsDNAをニッキング酵素で処理し、ここで、この処理により、鋳型dsDNAの1鎖のホスホジエステルバックボーンに1つまたはそれより多くの破断が生じ、この破断により、その1鎖において1つまたはそれより多くの3’ヒドロキシルが生成されることと、(b)前述の1つまたはそれより多くの3’ヒドロキシルを伸長させ、ここで、この伸長はdATP、dCTP、dGTP、dTTPおよびdUTPを含む反応混合物の存在下で行われ、この反応混合物は、ある一定のdUTP対dTTP比を含み、この比は所望の密度でのdUTPの組込みを可能にし、それによって所望の密度で組み込まれたdUTPを含む1つまたはそれより多くの第1鎖相補的DNA(cDNA)が生成されることと、(c)ウラシル−N−グリコシラーゼ(UNG)およびUNGにより作製される脱塩基部位にあるホスホジエステルバックボーンを開裂することができる作用因子で、所望の密度で組み込まれたdUTPを含む1つまたはそれより多くの第1鎖cDNAを選択的に開裂し、ここで、この開裂により、ブロックされた3’末端を含む所望のサイズの複数の第1鎖cDNAフラグメントが生成されることと、(d)部分的デュプレックスおよび3’オーバーハングを含む第1アダプターを、ブロックされた3’末端を含む複数の第1鎖cDNAフラグメントのうちの1つまたはそれより多くの3’末端にアニーリングし、ここで、この第1アダプターは配列Aを含み、このアニーリングは、3’オーバーハングにあるランダム配列を、ブロックされた3’末端を含む複数の第1鎖cDNAフラグメントのうちの1つまたはそれより多くの3’末端に存在する相補配列にハイブリダイズさせることを含むことと、(e)相補配列にハイブリダイズされた3’オーバーハングをDNAポリメラーゼで伸長させ、ここで、一方の端に配列Aを含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成されることと、(f)配列Bを含む第2アダプターを、一方の端に配列Aを含む1つまたはそれより多くの前記2本鎖cDNAフラグメントにライゲーションし、ここで、このライゲーションにより、一方の端に配列Aおよび反対端に配列Bを含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成され、それによって定方向性cDNAライブラリが生成されることと、(g)任意選択でこの定方向性cDNAライブラリを増幅および/または配列決定することを含む方法が提供される。
本明細書ではまた、全ゲノムライブラリを生成する方法であって、(a)ニッキングされた、および/またはフラグメント化されたdsDNA鋳型核酸を変性させることと、(b)部分的デュプレックスおよび3’オーバーハングを含む第1アダプターを、複数の1本鎖DNAフラグメントの1つまたはそれより多くの3’末端にアニーリングし、ここで、この第1アダプターは配列Aを含み、このアニーリングは、3’オーバーハングにあるランダム配列を、前述の複数の1本鎖DNAフラグメントの1つまたはそれより多くの3’末端に存在する相補配列にハイブリダイズさせることを含むことと、(c)相補配列にハイブリダイズされた3’オーバーハングをDNAポリメラーゼで伸長させ、ここで、一方の端に配列Aを含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成されることと、(e)配列Bを含む第2アダプターを、一方の端に配列Aを含む1つまたはそれより多くの前記2本鎖cDNAフラグメントにライゲーションし、ここで、このライゲーションにより、一方の端に配列Aおよび反対端に配列Bを含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成され、それによって定方向性cDNAライブラリが生成されることと、(f)任意選択でこの定方向性cDNAライブラリを増幅および/または配列決定することを含む方法が提供される。
前述の方法のいずれかの一部の実施形態において、1つまたはそれより多くのプライマーは、ランダムプライマーを含む。一部の実施形態において、1つまたはそれより多くのプライマーは、実質的に全ての転写物を含むRNAの群に特異的な配列を含む。一部の実施形態において、1つまたはそれより多くのプライマーは、構造的RNAを含まないRNAの群に特異的な配列を含み、この構造的RNAはリボソームRNA(rRNA)を含むものとする。一部の実施形態において、ホスホジエステルバックボーンを開裂することができる作用因子は、酵素、化学的作用因子および/または熱を含む。一部の実施形態において、化学的作用因子はポリアミンである。一部の実施形態において、ポリアミンはN,N−ジメチルエチレンジアミン(DMED)である。一部の実施形態において、第1アダプターは、長鎖および短鎖を含み、この長鎖は、短鎖とデュプレックスを形成する配列Aおよび3’オーバーハングを含むものとする。一部の実施形態において、第1アダプターは複数の第1アダプターを含み、前述の複数の第1アダプターのそれぞれにおけるランダム配列は、前述の複数の第1アダプターの別のものにおけるランダム配列とは異なるものとし、その複数の第1アダプターのそれぞれが配列Aを含むものとする。一部の実施形態において、第1アダプターはさらにステムループを含み、このステムループは、部分的デュプレックスの長鎖の5’末端を部分的デュプレックスの短鎖の3’末端と連結し、この長鎖は配列Aおよび3’オーバーハングを含むものとする。一部の実施形態において、3’オーバーハングは少なくとも6、7、8または9個のヌクレオチドを含む。一部の実施形態において、第2アダプターは部分的デュプレックスを含み、この部分的デュプレックスは、短鎖とハイブリダイズされた長鎖を含み、この長鎖は配列Bおよびオーバーハングを含むものとする。一部の実施形態において、長鎖は配列Bおよび3’オーバーハングを含み、この短鎖は3’末端にブロックを含む。一部の実施形態において、このライゲーションにより、一方の端に配列Aを、反対端に配列Bを含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成され、この配列Aは一方の端の5’末端にあり、配列Bは反対端の3’末端にあるものとする。一部の実施形態において、長鎖は配列Bおよび5’オーバーハングを含み、短鎖は5’末端にブロックを含むものとする。一部の実施形態において、このライゲーションにより、一方の端に配列Aを、反対端に配列Bを含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成され、この配列Aは一方の端の5’末端にあり、配列Bは反対端の5’末端にあるものとする。一部の実施形態において、反対端の3’末端は、鋳型として配列Bを用いて伸長され、それによって、一方の端の5’末端に配列Aを、そして反対端の3’末端に配列Bと相補的な配列B’を含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成される。一部の実施形態において、ニッキング酵素は鎖特異的ニッキング酵素を含む。一部の実施形態において、工程b)における1つまたはそれより多くの3’ヒドロキシルの伸長は、鎖置換活性を含むDNAポリメラーゼにより行われる。一部の実施形態において、ライゲーションは平滑末端ライゲーションを含み、工程e)で生成された一方の端に配列Aを含む1つまたはそれより多くの2本鎖cDNAフラグメントは、工程f)の前に末端修復される。一部の実施形態において、第1および/または第2アダプターは、さらに1つまたはそれより多くのバーコードを含む。
参照による援用
本明細書で挙げた全ての出版物、特許および特許出願は、個々の出版物、特許、または特許出願がそれぞれ具体的かつ個別に参照によって援用されることが示されているかのごとく、同じ程度まで出典明示により本明細書に援用されている。
本明細書で挙げた全ての出版物、特許および特許出願は、個々の出版物、特許、または特許出願がそれぞれ具体的かつ個別に参照によって援用されることが示されているかのごとく、同じ程度まで出典明示により本明細書に援用されている。
新規な特徴を、添付の請求の範囲に詳細に示す。本明細書で提供される方法、組成物およびキットの原理が利用されている実例となる実施形態を示す以下に詳述する記載および以下に説明する添付図面を参照することにより、特徴および利点に関して理解が深まるはずである。
I.概要
本明細書では、核酸(例、RNAおよびDNA)鋳型からの定方向性核酸配列決定ライブラリ構築のための方法、組成物およびキットが提供される。一実施態様において、本明細書では、ハイスループット配列決定方法と適合し得、同時に元の核酸試料の方向性(鎖性)情報を維持するRNAおよびDNA鋳型から核酸ライブラリを生成するための方法、組成物およびキットが提供される。これらの方法を用いることにより、鋳型ゲノムdsDNAの物理的フラグメント化を必要とせずに、全トランスクリプトームおよび全ゲノムを表すライブラリを生成することができる。また、これらの方法を用いることにより、単細胞を含む非常に小さな試料からライブラリを生成することができる。
本明細書では、核酸(例、RNAおよびDNA)鋳型からの定方向性核酸配列決定ライブラリ構築のための方法、組成物およびキットが提供される。一実施態様において、本明細書では、ハイスループット配列決定方法と適合し得、同時に元の核酸試料の方向性(鎖性)情報を維持するRNAおよびDNA鋳型から核酸ライブラリを生成するための方法、組成物およびキットが提供される。これらの方法を用いることにより、鋳型ゲノムdsDNAの物理的フラグメント化を必要とせずに、全トランスクリプトームおよび全ゲノムを表すライブラリを生成することができる。また、これらの方法を用いることにより、単細胞を含む非常に小さな試料からライブラリを生成することができる。
II.鎖特異的選択
本明細書で提供される組成物、方法およびキットは、鋳型核酸についての方向性情報を保持するのに使用され得る。鋳型核酸はRNAまたはDNAであり得る。鋳型核酸は、1本鎖または2本鎖であり得る。「鎖特異的」、「(定)方向性」または「鎖性」の語は、互いに相補的である2つの鎖間において2本鎖ポリヌクレオチドでの区別を生じさせる能力を指し得る。「鎖ライブラリ」、「鎖cDNAライブラリ」、「定方向性ライブラリ」または「定方向性cDNAライブラリ」の語は互換的に使用され得る。「鎖マーキング」の語は、2本鎖ポリヌクレオチドの2つの鎖間で区別するための任意の方法を指し得る。「選択」の語は、2本鎖ポリヌクレオチドの2つの鎖間で選択を行う任意の方法を指し得る。
本明細書で提供される組成物、方法およびキットは、鋳型核酸についての方向性情報を保持するのに使用され得る。鋳型核酸はRNAまたはDNAであり得る。鋳型核酸は、1本鎖または2本鎖であり得る。「鎖特異的」、「(定)方向性」または「鎖性」の語は、互いに相補的である2つの鎖間において2本鎖ポリヌクレオチドでの区別を生じさせる能力を指し得る。「鎖ライブラリ」、「鎖cDNAライブラリ」、「定方向性ライブラリ」または「定方向性cDNAライブラリ」の語は互換的に使用され得る。「鎖マーキング」の語は、2本鎖ポリヌクレオチドの2つの鎖間で区別するための任意の方法を指し得る。「選択」の語は、2本鎖ポリヌクレオチドの2つの鎖間で選択を行う任意の方法を指し得る。
本明細書記載の方法に基づくと、核酸鋳型の方向性および鎖情報の保持は、50%を超える効率で決定され得る。本明細書記載の方法を用いることによる方向性および鎖配向の保持の効率は、>50%。>55%、>60%、>65%、>70%、>75%、>80%、>85%、>90%、または>95%であり得る。方向性および鎖配向の保持の効率は、>70%、>80%、>90%または>99%であり得る。本明細書記載の方法を用いることにより、ポリヌクレオチドライブラリにおいて50%を超えるポリヌクレオチドが特異的鎖配向を含む定方向性ポリヌクレオチドライブラリを生成することができる。本明細書記載の方法を用いた特異的鎖配向の保持は、>50%。>55%、>60%、>65%、>70%、>75%、>80%、>85%、>90%、または>95%であり得る。定方向性ポリヌクレオチドライブラリにおけるポリヌクレオチドの特異的鎖配向の保持は>99%であり得る。
III.ポリヌクレオチド、試料およびヌクレオチド
定方向性核酸ライブラリは、核酸の任意の供給源から得られた核酸鋳型から生成され得る。核酸はRNAまたはDNAであり得る。核酸は1本鎖または2本鎖であり得る。場合によっては、核酸はDNAである。DNAは、当業界における標準技術を用いて入手および精製され得、精製または非精製形態のDNAを含み得る。DNAは、ミトコンドリアDNA、無細胞DNA、相補的DNA(cDNA)またはゲノムDNAであり得る。場合によっては、核酸はゲノムDNAである。DNAは、プラスミドDNA、コスミドDNA、細菌人工染色体(BAC)、または酵母人工染色体(YAC)であり得る。DNAは、1つまたはそれより多くの染色体に由来し得る。例えば、DNAがヒト由来の場合、DNAは、染色体1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、X、またはYのうちの1つまたはそれより多くに由来し得る。場合によっては、DNAは2本鎖DNAである。場合によっては、2本鎖DNAはゲノムDNAである。場合によっては、DNAはcDNAである。場合によっては、cDNAは2本鎖cDNAである。場合によっては、cDNAはRNAに由来し、このRNAに対し第1鎖合成、次いで第2鎖合成が行われる。RNAは、当業界における標準技術を用いて入手および精製され得、精製または非精製形態のRNAを含み得、限定される訳ではないが、例えばmRNA、tRNA、snRNA、rRNA、レトロウイルス、小非コーディングRNA、ミクロRNA、ポリソームRNA、プレmRNA、イントロンRNA、ウイルスRNA、無細胞RNAおよびそれらのフラグメントが挙げられる。非コーディングRNAまたはncRNAには、snoRNA、ミクロRNA、siRNA、piRNAおよび長ncRNAが含まれ得る。
定方向性核酸ライブラリは、核酸の任意の供給源から得られた核酸鋳型から生成され得る。核酸はRNAまたはDNAであり得る。核酸は1本鎖または2本鎖であり得る。場合によっては、核酸はDNAである。DNAは、当業界における標準技術を用いて入手および精製され得、精製または非精製形態のDNAを含み得る。DNAは、ミトコンドリアDNA、無細胞DNA、相補的DNA(cDNA)またはゲノムDNAであり得る。場合によっては、核酸はゲノムDNAである。DNAは、プラスミドDNA、コスミドDNA、細菌人工染色体(BAC)、または酵母人工染色体(YAC)であり得る。DNAは、1つまたはそれより多くの染色体に由来し得る。例えば、DNAがヒト由来の場合、DNAは、染色体1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、X、またはYのうちの1つまたはそれより多くに由来し得る。場合によっては、DNAは2本鎖DNAである。場合によっては、2本鎖DNAはゲノムDNAである。場合によっては、DNAはcDNAである。場合によっては、cDNAは2本鎖cDNAである。場合によっては、cDNAはRNAに由来し、このRNAに対し第1鎖合成、次いで第2鎖合成が行われる。RNAは、当業界における標準技術を用いて入手および精製され得、精製または非精製形態のRNAを含み得、限定される訳ではないが、例えばmRNA、tRNA、snRNA、rRNA、レトロウイルス、小非コーディングRNA、ミクロRNA、ポリソームRNA、プレmRNA、イントロンRNA、ウイルスRNA、無細胞RNAおよびそれらのフラグメントが挙げられる。非コーディングRNAまたはncRNAには、snoRNA、ミクロRNA、siRNA、piRNAおよび長ncRNAが含まれ得る。
本明細書記載の方法に用いる核酸の供給源は、核酸を含む試料であり得る。核酸は、試料から単離され、試料からの核酸の精製について当業界で既知の方法のいずれかにより精製され得る。試料は、ポリヌクレオチドを含む非細胞体(例、ウイルス)または細胞に基づく生物(例、古細菌、細菌または真核生物ドメインの構成員)に由来し得る。場合によっては、試料は、扉または卓上などの表面のスワッブから得られる。
試料は、対象、例えば植物、真菌、真正細菌、古細菌、原生生物(protest)または動物に由来し得る。対象は、生物、すなわち単細胞または多細胞生物であり得る。対象は培養細胞であり得、とりわけ一次細胞または確立された細胞系からの細胞であり得る。試料は、まず任意の好適な形態の多細胞生物から単離され得る。動物は、魚類、例えばゼブラフィッシュであり得る。動物は哺乳類であり得る。哺乳類は、例えばイヌ、ネコ、ウマ、ウシ、マウス、ラットまたはブタであり得る。哺乳類は、霊長類、例えばヒト、チンパンジー、オランウータン、またはゴリラであり得る。ヒトは男性または女性であり得る。試料は、ヒト胚またはヒト胎児由来であり得る。ヒトは、幼児、小児、ティーンエージャー、成人または高齢者であり得る。女性は、妊娠しているか、妊娠している疑いがあるか、または妊娠する計画がある女性であり得る。場合によっては、試料は対象からの単一または個別の細胞であり、ポリヌクレオチドは単一または個別の細胞に由来することもある。場合によっては、試料は、個々の微生物、または微生物の集団、または微生物と宿主細胞核酸または無細胞核酸との混合物であることもある。
試料は、健康な対象(例、ヒト対象)由来であり得る。場合によっては、試料は、少なくとも妊娠4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、または26週目の対象(例、妊婦)から採取されることもある。場合によっては、対象は、遺伝的疾患に罹患しているか、遺伝的疾患についてのキャリアであるか、または遺伝的疾患を発症するか伝える危険があることもあり、この場合、遺伝的疾患は、突然変異、挿入、付加、欠失、転座、点突然変異、トリヌクレオチド反復障害および/または1塩基多型(SNP)などの遺伝的変異に結びつき得る何らかの疾患である。
試料は、特異的な疾患、障害または状態を有するか、または特異的な疾患、障害または状態を有する疑いがある(または有する危険がある)対象に由来し得る。例えば、試料は、癌患者、癌を有する疑いがある患者、または癌を有する危険がある患者に由来し得る。癌は、例えば、急性リンパ芽球性白血病(ALL)、急性骨髄性白血病(AML)、副腎皮質癌腫、カポジ肉腫、肛門癌、基底細胞癌腫、胆管癌、膀胱癌、骨癌、骨肉腫、悪性線維性組織球腫、脳幹グリオーマ、脳癌、頭蓋咽頭腫、上衣芽腫、上衣腫、髄芽細胞腫、髄上皮腫、松果体実質腫瘍、乳癌、気管支腫瘍、バーキットリンパ腫、非ホジキンリンパ腫、カルチノイド腫瘍、子宮頸癌、脊索腫、慢性リンパ球性白血病(CLL)、慢性骨髄性白血病(CML)、結腸癌、結腸直腸癌、皮膚T細胞リンパ腫、非浸潤性乳管癌、子宮体癌、食道癌、ユーイング肉腫、眼部癌、眼内黒色腫、網膜芽細胞腫、線維性組織球腫、胆嚢癌、胃癌、グリオーマ、有毛細胞性白血病、頭部および頸部癌、心臓癌、肝細胞(肝臓)癌、ホジキンリンパ腫、下咽頭癌、腎臓癌、喉頭癌、***癌、口腔癌、肺癌、非小細胞癌腫、小細胞癌腫、メラノーマ、口癌、骨髄異形成症候群、多発性骨髄腫、髄芽腫、鼻腔癌、副鼻腔癌、神経芽細胞腫、上咽頭癌、口腔癌、中咽頭癌、骨肉腫、卵巣癌、膵臓癌、乳頭腫症、傍神経節腫、副甲状腺癌、陰茎癌、咽頭癌、下垂体腫瘍、形質細胞腫瘍、前立腺癌、直腸癌、腎細胞癌、横紋筋肉腫、唾液腺癌、セザリー症候群、皮膚癌、非黒色腫、小腸癌、軟組織肉腫、扁平上皮癌腫、精巣癌、咽喉癌、胸腺腫、甲状腺癌、尿道癌、子宮癌、子宮肉腫、膣癌、外陰癌、ヴァルデンシュトレームマクログロブリン血症、またはウィルムス腫瘍であり得る。試料は、癌患者からの癌組織および/または正常組織由来であり得る。
試料は、房水、ガラス体液、胆汁、全血、血清、血漿、母乳、脳脊髄液、耳垢、内リンパ液、外リンパ液、胃液、粘液、腹腔液、唾液、皮脂、***、汗、涙、膣分泌物、吐物、糞または尿であり得る。試料は、病院、研究室、臨床または医学研究室から入手され得る。試料は、対象から採取され得る。
試料は、水、土壌、空気などの媒体を含む環境的試料であり得る。試料は、法医学的試料(例、毛髪、血液、***、唾液など)であり得る。試料は、生物テロ攻撃で使用される作用因子(例、インフルエンザ、炭疽病、天然痘)を含み得る。
試料は、核酸を含み得る。核酸は、例えば、ミトコンドリアDNA、ゲノムDNA、mRNA、siRNA、miRNA、cRNA、1本鎖DNA、2本鎖DNA、1本鎖RNA、2本鎖RNA、tRNA、rRNA、またはcDNAであり得る。試料は、無細胞核酸を含み得る。試料は、細胞系、ゲノムDNA、無細胞血漿、ホルマリン固定パラフィン包埋(FFPE)試料、または瞬間冷凍試料であり得る。ホルマリン固定パラフィン包埋試料は、核酸を抽出する前に脱パラフィン処理され得る。試料は、臓器、例えば心臓、皮膚、肝臓、肺、胸部、胃、膵臓、膀胱、結腸、胆嚢、脳などに由来し得る。核酸は、当業者に利用可能な手段により試料から抽出され得る。
試料は、フラグメント化、ライゲーション、変性、および/または増幅または本明細書で提供される方法のいずれにも適格なものとなるように処理され得る。例としての試料処理としては、試料の細胞溶解による核酸の放出、試料の精製(例、酵素反応を阻害し得る他の試料成分から核酸を単離するため)、試料の希釈/濃縮、および/またはさらなる核酸処理用の試薬との併用を挙げることができる。一部の実施例では、試料を、制限酵素、逆転写酵素または核酸処理の任意の他の酵素と組み合わすことができる。
本明細書記載の方法は、1つまたはそれより多くの標的核酸を分析または検出するのに使用され得る。ポリヌクレオチドの語またはその文法的均等内容語は、共有結合により一緒になった少なくとも2つのヌクレオチドを指し得る。本明細書記載のポリヌクレオチドは、ホスホジエステル結合を含み得るが、場合によっては、下記で概説するように(例えばプライマーおよび標識プローブなどのプローブの構築において)、例えば、ホスホルアミド(Beaucageら、Tetrahedron 49(10):1925(1993)およびそこに出てくる参考文献、Letsinger,J.Org.Chem.35:3800(1970)、Sprinzlら、Eur.J.Biochem.81:579(1977)、Letsingerら、Nucl.Acids Res.14:3487(1986)、Sawaiら、Chem.Lett.805(1984)、Letsingerら、J.Am.Chem.Soc.110:4470(1988)およびPauwelsら、Chemica Scripta 26:141 91986))、ホスホロチオエート(Magら、Nucleic Acids Res.19:1437(1991)および米国特許第5,644,048号)、ホスホロジチオエート(Briuら、J.Am.Chem.Soc.111:2321(1989))、O−メチルホスホロアミダイト結合(Eckstein、Oligonucleotides and Analogues:A Practical Approach、Oxford University Pressを参照)、およびペプチド核酸(本明細書では「PNA」とも称す)バックボーンおよび結合(Egholm,J.Am.Chem.Soc.114:1895(1992)、Meierら、Chem.Int.Ed.Engl.31:1008(1992)、Nielsen,Nature,365:566(1993)、Carlssonら、Nature 380:207(1996)を参照、これら全てについては、出典明示で援用する)を含む代替的バックボーンを有し得る核酸類似体も包含される。他の類似体核酸には、ロックト核酸(本明細書では「LNA」とも称す)を含む二環式構造を有するもの(Koshkinら、J.Am.Chem.Soc.120.13252 3(1998))、正のバックボーンを有するもの(Denpcyら、Proc.Natl.Acad.Sci.USA 92:6097(1995))、非イオン性バックボーンを有するもの(米国特許第5,386,023,5,637,684,5,602,240,5,216,141および4,469,863号、Kiedrowshiら、Angew.Chem.Intl.Ed.English 30:423(1991)、Letsingerら、J.Am.Chem.Soc.110:4470(1988)、Letsingerら、Nucleoside & Nucleotide 13:1597(1994)、第2および3章、ASC Symposium Series 580,“Carbohydrate Modifications in Antisense Research”、Y.S.SanghuiおよびP.Dan Cook編、Mesmaekerら、Bioorganic & Medicinal Chem.Lett.4:395(1994)、Jeffsら、J.Biomolecular NMR 34:17(1994)、Tetrahedron Lett.37:743(1996))ならびに、米国特許第5,235,033および5,034,506号、ならびに第6および7章、ASC Symposium Series 580,“Carbohydrate Modifications in Antisense Research”,Y.S.SanghuiおよびP.Dan Cook編、に記載されたものを含む、非リボースバックボーンを有するものがある。また、1つまたはそれより多くの炭素環状糖を含む核酸も、核酸の定義内に含まれる(Jenkinsら、Chem.Soc.Rev.(1995)pp169 176を参照)。幾つかの核酸類似体は、Rawls、C & E News 1997年6月2日号35頁に記載されている。「ロックト核酸」もまた、核酸類似体の定義の範囲内に含まれる。LNAは、リボース環が2’−O原子を4’−C原子と連結するメチレン架橋により「ロックされた」核酸類似体の1つのクラスである。これらの参考文献は全て、出典明示により本明細書に援用する。リボース−リン酸バックボーンのこれらの修飾を行うことにより、生理学的環境における上記分子の安定性および半減期を増加させることができる。例えば、PNA:DNAおよびLNA−DNAハイブリッドは、さらに高い安定性を呈し得るため、場合によっては使用されることもあり得る。核酸は、明記したように1本鎖状または2本鎖状であり得、または2本鎖配列や1本鎖配列の両方の部分を含み得る。適用法によって、核酸は、DNA(例えば、ゲノムDNA、ミトコンドリアDNAおよびcDNAを含む)、RNA(例えば、mRNAおよびrRNAを含む)またはハイブリッドであり得、この場合、核酸は、デオキシリボヌクレオチドおよびリボヌクレオチドの任意の組み合わせ、およびウラシル、アデニン、チミン、シトシン、グアニン、イノシン、キサンチン(xathanine)、ヒポキサンチン(hypoxathanine)、イソシトシン、イソグアニンなどを含む、塩基の任意の組み合わせを含む。
「非修飾ヌクレオチド」または「非修飾dNTP」または「古典的dNTP」の語は、DNA合成においてビルディングブロックとして通常使用され得る4つのデオキシリボヌクレオチド三リン酸、dATP(デオキシアデノシン三リン酸)、dCTP(デオキシシチジン三リン酸)、dGTP(デオキシグアノシン三リン酸)およびdTTP(デオキシチミジン三リン酸)を指し得る。
「カノニカルdNTP」または「カノニカルヌクレオチド」の語は、DNAに通常見い出される4つのデオキシリボヌクレオチド三リン酸、dATP、dCTP、dGTPおよびdTTPを指すのに使用され得る。
「修飾ヌクレオチド」、「修飾dNTP」または「ヌクレオチド類似体」の語は、1つの対応する非修飾ヌクレオチドまたは古典的dNTPを置換するのに好適な任意の分子を指し得る。かかる修飾ヌクレオチドに対しては、それが置き換わる古典的または非修飾dNTPと同一の、または類似した塩基対マッチングが行われることが可能でなければならない。修飾ヌクレオチドまたはdNTPは、それが好適な分解剤または開裂作用因子により選択的に分解されるかまたは開裂される特異的な分解または開裂に好適なものでなくてはならない。修飾ヌクレオチドは、選択的除去または開裂に適格な修飾ヌクレオチドを含むDNA鎖をマーキングしなければならず、またはポリヌクレオチド鎖の分離を促進しなければならない。かかる除去または開裂または分離は、修飾ヌクレオチドと選択的に相互作用する、したがって唯一のポリヌクレオチド鎖を選択的に除去するか、または除去のためにマーキングするかまたは開裂する分子、粒子または酵素により達成され得る。
「非カノニカル」の語は、DNAにおける4つのカノニカル塩基以外のDNAにおける核酸塩基、またはそれらのデオキシリボヌクレオチドまたはデオキシリボヌクレオチド類似体を指し得る。ウラシルはRNAにおける共通の核酸塩基であるが、ウラシルはDNAにおける非カノニカル塩基である。場合によっては、非カノニカルdNTPはdUTPである。
「バーコード」の語は、そのバーコードを随伴する核酸の何らかの特徴を識別させ得る既知核酸配列を指し得る。場合によっては、同定されるべき核酸の特徴は核酸が由来する試料である。場合によっては、バーコードは、少なくとも3、4、5、6、7、8、9、10、11、12、13、14、15またはそれより長いヌクレオチド長である。場合によっては、バーコードは、10、9、8、7、6、5、または4ヌクレオチド長より短いこともある。オリゴヌクレオチド(例、プライマーまたはアダプター)は、約1、2、3、4、5、6、7、8、9、または10の異なるバーコード、1、2、3、4、5、6、7、8、9、または10より多いかまたは少ない異なるバーコード、または少なくとも1、2、3、4、5、6、7、8、9、または10の異なるバーコードを含み得る。バーコードは、鋳型核酸を含む試料由来の鋳型核酸に(例、アニーリングまたはライゲーションによって)随伴され得る。場合によっては、ある1つの試料に由来する鋳型核酸に随伴したバーコードが、別の試料に由来する鋳型核酸に随伴したバーコードと異なることもある。第1の試料に由来する鋳型核酸に随伴したバーコードは、第2の試料に由来する鋳型核酸に随伴したバーコードとは異なる長さを有し得る。バーコードは、十分な長さを有し得、試料に伴うバーコードに基づいて試料を識別させ得るのに十分な程度異なり得る配列を含み得る。場合によっては、バーコード、およびそれが関与する試料供給源は、バーコード配列における1つまたはそれより多くのヌクレオチドの突然変異、挿入、または欠失の後、例えば1、2、3、4、5、6、7、8、9、10またはそれより多くのヌクレオチドの突然変異、挿入、または欠失の後に、正確に識別され得る。場合によっては、複数のバーコードにおける各バーコードは、少なくとも3つのヌクレオチド位置、例えば少なくとも3、4、5、6、7、8、9、10またはそれより多くの位置でその複数のバーコードにおける他の全てのバーコードとは異なることもある。場合によっては、アダプターが、複数のバーコード配列のうちの少なくとも1つを含むこともある。場合によっては、第2アダプターオリゴヌクレオチドのためのバーコードは、第1アダプター/プライマーオリゴヌクレオチドのためのバーコードから独立して選択されることもある。場合によっては、バーコードを有する第1アダプター/プライマーオリゴヌクレオチドおよび第2アダプターオリゴヌクレオチドが、この対のアダプターが同一または異なる1つまたはそれより多くのバーコードを含むように対合されることもある。場合によっては、本明細書記載の方法は、標的核酸が連結しているバーコード配列に基づいて鋳型核酸が由来する試料を識別することをさらに含むこともある。バーコードは、鋳型核酸に連結されると、鋳型核酸が由来した試料の識別子としての役割を果たすポリヌクレオチド配列を含み得る。
場合によっては、バーコードは、複数の核酸フラグメントを含む試料内の個々のフラグメントにそれぞれユニークなマーキングをするのに有用なランダム配列を含むことがある。ユニークに付加されたバーコードは、大規模並列処理次世代配列決定などのダウンストリーム定量化手順中におけるユニークフラグメントの定量化手段を提供する。バーコードは、本明細書記載の方法において有用な任意のアダプターおよび/またはプライマーの一部であり得るため、本明細書で提供される方法により個別フラグメントまたは複数のフラグメントに付加され得る。これらの場合、バーコードは、ランダムに付加され、試料ではなくそれらが付加されるフラグメントについてユニークである。これらのバーコードは、試料または核酸の供給源に特異的なバーコードと組み合わされ得る。
例えばポリヌクレオチド合成、非カノニカルヌクレオチドの塩基部分の開裂、脱塩基部位でのホスホジエステルバックボーンの開裂など、ある事象を「起こらせ得る」または「可能にする」条件または事象が起こるのに「好適」である条件とは、かかる事象が起こるのを妨げない条件である。したがって、これらの条件は、この事象を可能にする、促進する、容易にする、および/または事象に対し誘導的である。当業界で既知であり、本明細書に記載のかかる条件は、例えばポリヌクレオチド配列の性質、温度、および緩衝条件によって異なる。これらの条件はまた、ポリヌクレオチド合成、非カノニカルヌクレオチドの塩基部分の開裂、脱塩基部位でのホスホジエステルバックボーンの開裂など、どのような事象が所望されるかによって異なる。
IV.非カノニカルヌクレオチドを含むポリヌクレオチドの合成
非カノニカルヌクレオチドを含むポリヌクレオチドは、少なくとも1つの非カノニカルヌクレオチドの存在下で鋳型核酸からポリヌクレオチドを合成することにより製造され得、これにより非カノニカルヌクレオチドを含むポリヌクレオチドが生成される。ポリヌクレオチド(例、第1鎖cDNA)への非カノニカルヌクレオチドの組込み頻度は、本明細書で提供される方法を用いて製造されたフラグメントのサイズと関連している。これは、本明細書で記載したように、非カノニカルヌクレオチドを含むポリヌクレオチドにおける非カノニカルヌクレオチド間の間隔が、使用される反応条件とともに、非カノニカルヌクレオチドからの脱塩基部位の生成および脱塩基部位でのバックボーンの開裂から生じるフラグメントのおおよそのサイズを決定し得るためである。フラグメントの望ましいサイズ範囲は、大規模並列配列決定に好適な配列決定ライブラリの生成など、ダウンストリーム・アプリケーションの必要条件にしたがって変化させ得る。
非カノニカルヌクレオチドを含むポリヌクレオチドは、少なくとも1つの非カノニカルヌクレオチドの存在下で鋳型核酸からポリヌクレオチドを合成することにより製造され得、これにより非カノニカルヌクレオチドを含むポリヌクレオチドが生成される。ポリヌクレオチド(例、第1鎖cDNA)への非カノニカルヌクレオチドの組込み頻度は、本明細書で提供される方法を用いて製造されたフラグメントのサイズと関連している。これは、本明細書で記載したように、非カノニカルヌクレオチドを含むポリヌクレオチドにおける非カノニカルヌクレオチド間の間隔が、使用される反応条件とともに、非カノニカルヌクレオチドからの脱塩基部位の生成および脱塩基部位でのバックボーンの開裂から生じるフラグメントのおおよそのサイズを決定し得るためである。フラグメントの望ましいサイズ範囲は、大規模並列配列決定に好適な配列決定ライブラリの生成など、ダウンストリーム・アプリケーションの必要条件にしたがって変化させ得る。
本明細書で示したように、ポリヌクレオチドは、改変および/または修飾ヌクレオチド、ヌクレオチド間結合、リボヌクレオチドなどを含み得るが、本明細書で提供される方法により生成されるポリヌクレオチドは、DNAまたは相補的DNA(cDNA)であり得、このcDNAは、鋳型核酸と相補的である。
鋳型核酸からのポリヌクレオチド(例、1本鎖DNAおよび2本鎖DNA)の合成方法は、当業界では周知であり、例としては、限定される訳ではないが、単一プライマー等温増幅(SPIA(商標))、Ribo−SPIA(商標)、PCR、逆転写、プライマー伸長、限定プライマー伸長、複製(ローリングサークル複製を含む)、鎖置換型増幅(SDA)、ニック翻訳、多置換型増幅(MDA)、ローリングサークル増幅(RCA)および、例えば、少なくとも1つの非カノニカルヌクレオチドがポリヌクレオチドに組み込まれ得るように鋳型核酸配列の相補体の合成をもたらす任意の方法がある。例えば、Kurn、米国特許第6,251,639号、Kurn、国際公開02/00938、Kurn,米国特許第6,946,251号、Kurn、米国特許第6,692,918号、Mullis、米国特許第4,582,877号、Wallace、米国特許第6,027,923号、米国特許第5,508,178、5,888,819、6,004,744、5,882,867、5,710,028、6,027,889、6,004,745、5,763,178、5,011,769号、また、Sambrook(1989)“Molecular Cloning:A Laboratory Manual”、第2版、Ausebel(1987、および最新版)“Current Protocols in Molecular Biology”,Mullis(1994)“PCR:The Polymerase Chain Reaction”も参照。当業界で既知の1つまたはそれより多くの方法を用いることにより、非カノニカルヌクレオチドを含むポリヌクレオチドを生成することができる。非カノニカルヌクレオチドを含むポリヌクレオチドは、1本鎖または2本鎖または部分的2本鎖であり得ること、および2本鎖ポリヌクレオチドの一方または両方の鎖は非カノニカルヌクレオチドを含み得ることが理解される。便宜上、「DNA」は、本明細書においてポリヌクレオチドを記載(および例示)するのに使用され得る。DNA、したがってポリヌクレオチドは、鋳型核酸に相補的なヌクレオチド鎖を製造することにより生成された相補的DNA(cDNA)であり得る(例、RNA鋳型から第1および/または第2鎖合成により製造されたcDNAまたは鋳型DNAを用いて伸長または複製反応から製造されたcDNA)。好適な方法には、非カノニカルヌクレオチドを含む1つの1本鎖または2本鎖ポリヌクレオチドをもたらす方法(例えば、逆転写、2本鎖cDNAの製造、単一ラウンドのDNA複製)、ならびに多数の1本鎖または2本鎖コピーまたは鋳型の相補体のコピーをもたらす方法(例えば、単一プライマー等温増幅またはRibo−SPIA(商標)またはPCR)がある。場合によっては、非カノニカルヌクレオチドを含む1本鎖ポリヌクレオチドが、単一プライマー等温増幅を用いて合成されることもある。Kurnら、米国特許第6,251,639および6,692,918号を参照。
非カノニカルヌクレオチドを含むポリヌクレオチドは、必要ならば、好適な酵素およびプライマーを含む、ポリヌクレオチドの合成に好適な反応条件のもと4つの全カノニカルヌクレオチドおよび少なくとも1つの非カノニカルヌクレオチドの存在下で鋳型から生成され得る。非カノニカルヌクレオチドを含むポリヌクレオチドを合成するための、プライマーを含む、反応条件および試薬は、当業界では既知であり、本明細書でもさらに検討されている。好適な非カノニカルヌクレオチドは、当業界では周知であり、例えば、デオキシウリジン三リン酸(dUTP)、デオキシイノシン三リン酸(dITP)、5−ヒドロキシメチルデオキシシチジン三リン酸(5−OH−Me−dCTP)がある。例えば、Jendrisak、米国特許第6,190,865 B1号、Mol.Cell Probes(1992)251−6を参照。2つまたはそれより多くの異なる非カノニカルヌクレオチドは、本明細書で提供されたDNAポリメラーゼにより鋳型核酸から合成されるポリヌクレオチドに組み込まれ得、それにより少なくとも2つの異なる非カノニカルヌクレオチドを含むポリヌクレオチドが生成され得る。
場合によっては、非カノニカルヌクレオチドを含むポリヌクレオチドは、本明細書で提供された非カノニカルヌクレオチドの存在下で1鋳型核酸または複数の鋳型核酸からの逆転写により生成されることもあり、ここで鋳型核酸はRNAであるものとする。場合によっては、非カノニカルヌクレオチドを含むポリヌクレオチドは、鋳型核酸からの逆転写により生成される第1鎖cDNAを用いて本明細書で提供される要領で非カノニカルヌクレオチドの存在下での第2鎖合成反応により生成されることもあり、ここで鋳型核酸はRNAであるものとする。場合によっては、逆転写に使用されるプライマーは、ランダムプライマーを含むこともあり、このランダムプライマーは、1つまたはそれより多くのRNA鋳型に対して指向したランダム配列を含む。場合によっては、逆転写に使用されるプライマーは、標的RNAまたはRNAの群に対して特異的な配列を含むこともある。RNAの群は、実質的に全ての転写物を含み得る。標的とされたRNAの群は、構造的RNA、例えばリボソームRNA(rRNA)を除く全RNAであり得る。場合によっては、第2鎖合成に使用されるプライマーは、ランダムプライマーを含み、このランダムプライマーは、第1鎖cDNA合成に使用された1つまたはそれより多くのRNA鋳型に対して指向したランダム配列を含むものとする。場合によっては、第2鎖合成に使用されるプライマーは、第1鎖cDNA合成に使用された標的RNAまたはRNAの群に特異的な配列を含む。RNAの群は、実質的に全ての転写物を含み得る。標的とされたRNAの群は、構造的RNA、例えばリボソームRNA(rRNA)を除く全RNAであり得る。場合によっては、第1鎖cDNAまたは第2鎖cDNA、またはその両方の合成に使用される単数または複数のプライマーは、単数または複数のポリヌクレオチド鋳型上の特異的標的とハイブリダイズさせるにように設計され得る。
場合によっては、本明細書で提供される要領で非カノニカルヌクレオチドの存在下で非カノニカルヌクレオチドを含むポリヌクレオチドは、鋳型核酸からのプライマー伸長反応により生成されることもあり、この場合鋳型核酸はDNAである。DNAはdsDNAであり得る。dsDNAは、プライマー伸長反応前に当業界で既知の任意の方法により変性され得る。プライマーは、ランダム配列または特異的な標的配列または配列群に対して指向した配列を含み得る。場合によっては、非カノニカルヌクレオチドを含むポリヌクレオチドは、dsDNAにおける1鎖のホスホジエステルバックボーンにおけるニックまたは破断からの伸長により生成されることもある。単一鋳型核酸が簡便さのために使用されるが、このプライマー伸長反応は、1つまたはそれより多くの鋳型核酸またはその混合物で行われ得、それによりプライマー伸長反応から1つまたはそれより多くの生成物が生成され得ることが理解される。
場合によっては、非カノニカルヌクレオチドを含むポリヌクレオチドは、本明細書で提供される要領で非カノニカルヌクレオチドの存在下、1鋳型核酸または複数の鋳型核酸からの鎖置換型増幅反応により生成されることがあり、この場合鋳型核酸はDNAである。DNAは、本明細書記載の方法のいずれかにより生成されるdsDNAまたはゲノムDNAであり得る。dsDNAは、ニッキング酵素またはエンドヌクレアーゼで処理され得る。ニッキング酵素は、dsDNA鋳型(例、ゲノムDNA)における1鎖のホスホジエステルバックボーンに破断を生じさせ得、それにより遊離3’ヒドロキシル(OH)が生成され得る。この遊離3’OHは、本明細書で提供される要領で鎖置換活性を含むDNA依存的DNAポリメラーゼを用いて伸長され得、このdsDNA鋳型の他方の鎖は鋳型として使用され得る。ニッキング酵素は、鎖特異的または非鎖特異的であり得る。本明細書で提供される方法で使用するためのニッキング酵素またはエンドヌクレアーゼには、New England Biolabsにより提供されるものを含め、当業界で既知の任意のニッキング酵素が含まれ得る。ニッキングエンドヌクレアーゼの例としては、限定される訳ではないが、トップ鎖開裂性Nt.AlwI、Nt.BbvCI、Nt.BstNBI、Nt.SapIまたはNt.CviPII、またはボトム鎖開裂性Nb.BbvCI、Nb.BsmI、またはNb.BsrDIが挙げられる。ニッキングエンドヌクレアーゼは、例えばNt.BspQI、Nt.BsmAI、またはNb.Mva1269Iであり得る。
図4は、鎖置換型増幅を用いて、ゲノムDNA鋳型から非カノニカルヌクレオチドを含むポリヌクレオチドを生成させる具体例としての方法を示す。2本鎖DNA(ゲノムDNA)をニッキング酵素で処理して、dsDNA鋳型の1鎖にニック(例、1つまたはそれより多い)を生じさせる。ニッキング酵素で処理後dsDNAの1鎖におけるニックは、それにより1つまたはそれより多くの3’ヒドロキシル(OH)を生じさせ得る。場合により、ニッキング酵素は、センス選択的であり得、それにより鋳型DNAの鎖性が維持され得る。次いで、1鎖にニック(例、1つまたはそれより多い)を含むdsDNAは、4つの全dNTP(例、dATP、dTTP、dCTP、およびdGTP)、および非カノニカルヌクレオチド(例、dUTP)を含む反応混合物の存在下で鎖置換活性を含むDNAポリメラーゼにより処理され得、ここで、このDNAポリメラーゼは、ニッキング酵素により生成される前述の1つまたはそれより多くの3’OHを用いて、鋳型としてdsDNAの他方の鎖または非ニック鎖を用いる伸長反応を行わせ、それによりウラシル塩基を含む1本鎖生成物またはポリヌクレオチド(例、1つまたはそれより多い、または複数)を生成させ得る。次いで、ウラシル塩基を含む1本鎖生成物またはポリヌクレオチドを、本明細書で提供される要領で熱またはポリアミン(DMED)と組み合わせてUDGで処理することにより3’末端にブロックを含む多数または複数の1本鎖ポリヌクレオチドが生成され得る。ウラシル塩基を含む1本鎖生成物へのdUTPの組込み頻度は、3’末端ブロックを含む多数のフラグメントが開裂作用因子(例、UDGおよび熱またはDMED)での処理後に生成されるように、本明細書で提供される要領で制御され得る。
非カノニカルヌクレオチドの制限された、および/または制御された組込みのための条件は、当業界では既知である。例えば、Jendrisak、米国特許第6,190,865 B1号、Mol.Cell Probes(1992)251−6、Anal.Biochem.(1993)211:164−9を参照、また、Sambrook(1989)“Molecular Cloning:A Laboratory Manual”、第2版、Ausebel(1987、および最新版)“Current Protocols in Molecular Biology”も参照。得られる非カノニカルヌクレオチドを含むポリヌクレオチドにおける非カノニカルヌクレオチドの頻度(または間隔)や、したがって本明細書で提供される方法(すなわち、非カノニカルヌクレオチドの塩基部分の開裂、および非カノニカルヌクレオチドでのホスホジエステルバックボーンの開裂後)を用いて生成されたフラグメントの平均サイズは、鋳型における非カノニカルヌクレオチド(複数も可)に対応するヌクレオチド(複数も可)の頻度(または配列のヌクレオチド含有量の他の尺度、例えば平均G−C含有量など)、反応混合物中に存在する非カノニカルヌクレオチドに対するカノニカルヌクレオチドの比率、ポリメラーゼが非カノニカルヌクレオチドを組み込む能力、非カノニカルヌクレオチド対カノニカルヌクレオチドの相対的組込み効率などを含む、当業界で既知の変数により制御され得る。また、平均フラグメント化サイズも、本明細書で提供されるように、フラグメント化中に使用される反応条件と関連し得る。反応条件は、例えば、本明細書で提供される方法を用いて生じた平均フラグメントサイズを評価することにより経験的に決定され得る。
本明細書で提供される非カノニカルヌクレオチドを含むポリヌクレオチドを生成させるための方法を用いることにより、得られた非カノニカルヌクレオチドを含むポリヌクレオチドにおいて、正確に5、10、15、20、25、30、40、50、65、75、85、100、123、150、175、200、225、250、300、350、400、450、500、550、600、または650ヌクレオチド離して、前記列挙の数値のヌクレオチドより多く離して、前記列挙の数値のヌクレオチドより少なく離して、少なくとも前記列挙の数値のヌクレオチド離して、多くとも前記列挙の数値のヌクレオチド離して、または約前記列挙の数値のヌクレオチドごとに、非カノニカルヌクレオチドを組み込むことができる。非カノニカルヌクレオチドは、約200ヌクレオチドごと、約100ヌクレオチドごと、または約50ヌクレオチドごとに組み込まれ得る。非カノニカルヌクレオチドは、約50〜約200ヌクレオチドごとに組み込まれ得る。場合によっては、dUTPとdTTPとの1:5の比率が反応混合物中で使用されることもある。他の具体例としての比率は、正確に1:1、1:2、1:3、1:4、1:5、1:6、1:7、1:8、1:9、1:10、1:15、1:20または1:50、約前記列挙の比、前記列挙の比より大、前記列挙の比より小、少なくとも前記列挙の比、または多くとも前記列挙の比のdUTP対dTTP比であり得る。
鋳型核酸(これとともに非カノニカルヌクレオチドを含むポリヌクレオチドが合成される)は、いかなる供給源からのいかなる鋳型核酸でもよい。鋳型核酸としては、精製形態または非精製形態の任意の供給源からの2本鎖、部分的2本鎖、および1本鎖核酸があり、DNA(dsDNAおよびssDNA)またはRNA、例えばtRNA、mRNA、rRNA、ミトコンドリアDNAおよびRNA、クロロプラストDNAおよびRNA、DNA−RNAハイブリッド、またはこれらの混合物、遺伝子、染色体、プラスミド、微生物、例えば細菌、酵母、ウイルス、ウイロイド、カビ、真菌、植物、動物、ヒトなどの生物材料のゲノム、およびそのフラグメントであり得る。核酸の入手および精製は当業界での標準的技術を使用する。RNAは、当業界での標準的技術を用いて入手および精製され得る。DNA鋳型(ゲノムDNA鋳型を含む)は、RNA形態で転写され得、これは、Kurn、米国特許第6,251,639 B1号に開示された方法および当業界で既知の他の技術(発現系など)を用いて達成され得る。一般にゲノムDNAのRNAコピーは、イントロン、調節および制御エレメントなど、一般的にmRNAからは見い出されない非転写配列を含む。RNA鋳型のDNAコピーは、Kurn、米国特許第6,946,251号に記載された方法または当業界で既知の他の技術を用いて合成され得る。DNA−RNAハイブリッドからの非カノニカルヌクレオチドを含むポリヌクレオチドの合成は、ハイブリッドを変性させてssDNAおよび/またはRNAを得ること、RNA/DNAハイブリッドからRNAを開裂することができる作用因子での開裂、および当業界で既知の他の方法により達成され得る。場合によっては、鋳型RNAを、合成された非カノニカルヌクレオチドを含むポリヌクレオチドのフラグメント化と同時に開裂することもある。鋳型は、生物試料などの複合混合物の小さな画分に過ぎないものでよく、当業界で周知の手順により様々な生物材料から入手され得る。鋳型は既知または未知のものであり得、興味の対象である1つより多い所望の特異的核酸配列を含み得、これらはそれぞれ互いに同じまたは異なるものであり得る。したがって、本明細書で提供される方法は、非カノニカルヌクレオチドを含む1つの特異的ポリヌクレオチドを製造するためだけでなく、同時に非カノニカルヌクレオチドを含む複数の異なる特異的ポリヌクレオチドを製造するためにも有用であり得る。鋳型DNAは、核酸の部分集団、例えばサブトラクティブ・ハイブリダイゼーションプローブ、全ゲノムDNA、制限フラグメント、cDNAライブラリ、全mRNAから調製されたcDNA、クローン化ライブラリ、または本明細書記載の鋳型のいずれかの増幅生成物であり得る。場合によっては、鋳型核酸配列の一部分の相補体の合成の最初の工程は、鋳型変性である。変性工程は、熱変性または当業界で既知の任意の他の方法、例えばアルカリ処理であり得る。他の場合には、鋳型核酸配列の一部分の相補体の合成の最初の工程は、ニッキング工程である。2本鎖鋳型のニッキングは、酵素反応により、または物理的もしくは化学的手段により実施され得る。
非カノニカルヌクレオチド(例、dUTP)を含むポリヌクレオチドまたは第1鎖cDNAは、単一核酸として記載される。このポリヌクレオチドは、単一ポリヌクレオチドまたはポリヌクレオチドの集団(数個のポリヌクレオチドから多数〜非常に多数のポリヌクレオチド)であり得ることが理解される。さらに、非カノニカルヌクレオチドを含むポリヌクレオチドは、多数または複数(少数から非常に多数まで)の異なるポリヌクレオチド分子であり得ることが理解される。かかる集団は、配列(例、遺伝子ファミリーまたはスーパーファミリーの構成員)または配列の非常な多様性(例、全mRNAから生成、全ゲノムDNAから生成など)の点で関連し得る。ポリヌクレオチドはまた、単一配列(既知遺伝子の一部または全部、例えばコーディング領域、ゲノム部分などであり得る)に対応し得る。特異的ポリヌクレオチド配列および多数または複数のポリヌクレオチド配列を生成するための方法、試薬および反応条件は、当業界では既知である。
非カノニカルヌクレオチドを含むポリヌクレオチドの好適な合成方法は、(本明細書で概括的に記載したとおり、非カノニカルヌクレオチドを含むポリヌクレオチドが核酸鋳型に沿って合成されるという意味で)鋳型依存的であり得る。非カノニカルヌクレオチドが、鋳型非依存的方法の結果としてポリヌクレオチド中に組み込まれ得ることが理解される。例えば、1つまたはそれより多くのプライマー(複数も可)は、1つまたはそれより多くの非カノニカルヌクレオチドを含むように設計され得る。例えば、Richards、米国特許第6,037,152、5,427,929および5,876,976号を参照。プライマーに非カノニカルヌクレオチドを含めることは、単一プライマー等温増幅などの方法にとって特に好適であり得る。Kurn、米国特許第6,251,639 B1号、Kurn、WO02/00938、Kurn、米国特許公開第2003/0087251 A1号を参照。非カノニカルヌクレオチド(複数も可)はまた、非カノニカルヌクレオチドを含む第2ポリヌクレオチドのテーリングまたはライゲーションなどの鋳型非依存的方法によりポリヌクレオチドに付加され得る。テーリングおよびライゲーションの方法は、当業界では周知である。
V.第1鎖cDNAからの定方向性ライブラリの生成
非カノニカルヌクレオチドの塩基部分を開裂することにより脱塩基部位を作製
場合によっては、非カノニカルヌクレオチドを含むポリヌクレオチドを、非カノニカルヌクレオチドの塩基部分を全般的に、特異的にまたは選択的に開裂することができる酵素などの作用因子で処理して、脱塩基部位を作製することもある。本明細書で使用される「脱塩基部位」は、例えば、非カノニカルヌクレオチドの塩基部分の開裂を行うことができる作用因子(例、酵素、酸性条件、または化学試薬)での(ポリヌクレオチド鎖に存在する)非カノニカルヌクレオチドの処理により、ヌクレオチドの塩基部分を開裂することができる作用因子で塩基部分(塩基全体を含む)を除去した後に残る化学的構造全てを包含する。一部の実施形態では、この作用因子(酵素など)は、非カノニカルヌクレオチドの塩基部分と非カノニカルヌクレオチドにおける糖との間の結合の加水分解を触媒することにより、ヘミアセタール環を含み、塩基を欠く脱塩基部位(互換的に「AP」部位と呼ばれる)を生成させるが、他の開裂生成物も本明細書で提供される方法での使用について考えられる。非カノニカルヌクレオチドの塩基部分の開裂に好適な作用因子および反応条件は、当業界では既知であり、N−グリコシラーゼ(「DNAグリコシラーゼ」または「グリコシダーゼ」とも呼ばれる)、例えばウラシルN−グリコシラーゼ(「UNG」、dUTPを特異的に開裂する)(「ウラシルDNAグリコシラーゼ」と互換的に呼ばれる)、ヒポキサンチン−N−グリコシラーゼ、およびヒドロキシ−メチルシトシン−N−グリコシラーゼ、3−メチルアデニンDNAグリコシラーゼ、3−または7−メチルグアニンDNAグリコシラーゼ、ヒドロキシメチルウラシルDNAグリコシラーゼ、T4エンドヌクレアーゼVが挙げられる。例えば、Lindahl、PNAS(1974)71(9):3649−3653、Jendrisak、米国特許第6,190,865 B1号を参照。場合によっては、UNGを用いて、本明細書で提供される方法により生成されたポリヌクレオチドにおけるdUTP組込みの塩基部分を開裂することもある。
非カノニカルヌクレオチドの塩基部分を開裂することにより脱塩基部位を作製
場合によっては、非カノニカルヌクレオチドを含むポリヌクレオチドを、非カノニカルヌクレオチドの塩基部分を全般的に、特異的にまたは選択的に開裂することができる酵素などの作用因子で処理して、脱塩基部位を作製することもある。本明細書で使用される「脱塩基部位」は、例えば、非カノニカルヌクレオチドの塩基部分の開裂を行うことができる作用因子(例、酵素、酸性条件、または化学試薬)での(ポリヌクレオチド鎖に存在する)非カノニカルヌクレオチドの処理により、ヌクレオチドの塩基部分を開裂することができる作用因子で塩基部分(塩基全体を含む)を除去した後に残る化学的構造全てを包含する。一部の実施形態では、この作用因子(酵素など)は、非カノニカルヌクレオチドの塩基部分と非カノニカルヌクレオチドにおける糖との間の結合の加水分解を触媒することにより、ヘミアセタール環を含み、塩基を欠く脱塩基部位(互換的に「AP」部位と呼ばれる)を生成させるが、他の開裂生成物も本明細書で提供される方法での使用について考えられる。非カノニカルヌクレオチドの塩基部分の開裂に好適な作用因子および反応条件は、当業界では既知であり、N−グリコシラーゼ(「DNAグリコシラーゼ」または「グリコシダーゼ」とも呼ばれる)、例えばウラシルN−グリコシラーゼ(「UNG」、dUTPを特異的に開裂する)(「ウラシルDNAグリコシラーゼ」と互換的に呼ばれる)、ヒポキサンチン−N−グリコシラーゼ、およびヒドロキシ−メチルシトシン−N−グリコシラーゼ、3−メチルアデニンDNAグリコシラーゼ、3−または7−メチルグアニンDNAグリコシラーゼ、ヒドロキシメチルウラシルDNAグリコシラーゼ、T4エンドヌクレアーゼVが挙げられる。例えば、Lindahl、PNAS(1974)71(9):3649−3653、Jendrisak、米国特許第6,190,865 B1号を参照。場合によっては、UNGを用いて、本明細書で提供される方法により生成されたポリヌクレオチドにおけるdUTP組込みの塩基部分を開裂することもある。
本明細書で提供される方法により生成される非カノニカルヌクレオチドを含むポリヌクレオチドに存在する非カノニカルヌクレオチドの塩基部分の開裂は、非カノニカルヌクレオチドの塩基部分を全般的、特異的または選択的に開裂することができる作用因子(酵素など)が、特定の非カノニカルヌクレオチドの塩基部分を開裂するという意味で、全般的、特異的または選択的開裂であり得、この開裂された塩基部分の約98%、約95%、約90%、約85%、または約80%を超える塩基部分は、非カノニカルヌクレオチドの塩基部分であるものとする。しかしながら、開裂の程度はさらに小さいこともあり得る。したがって、特異的開裂への言及は例示的である。全般的、特異的または選択的開裂は、3’末端にブロックを含むポリヌクレオチドフラグメント(すなわち、脱塩基部位でのバックボーンの開裂により生成されるフラグメント)を生成するための本明細書で提供される方法におけるフラグメントサイズの制御に望ましいものであり得る。反応条件は、脱塩基部位(複数も可)が作製される反応が完了するまで続き得るように選択され得る。
本明細書で提供される方法により生成された非カノニカルヌクレオチドを含むポリヌクレオチドは、非カノニカルヌクレオチドを伴うポリヌクレオチドの合成後に精製され得る(例えば、反応混合物中に存在し得る残留遊離非カノニカルヌクレオチドを排除するため)。場合によっては、非カノニカルヌクレオチドを含むポリヌクレオチドの合成と後続工程(非カノニカルヌクレオチドの塩基部分の開裂および脱塩基部位でのホスホジエステルバックボーンの開裂など)との間の中間精製が無いこともある。
本明細書で示すように、便宜上、非カノニカルヌクレオチドの塩基部分の開裂(これにより脱塩基部位が生成される)は別々の工程として記載されてきた。この工程が非カノニカルヌクレオチドを含むポリヌクレオチドの合成(本明細書で提供される要領で)、および脱塩基部位でのバックボーンの開裂(フラグメント化)と同時に行われ得ることが理解される。さらに、非カノニカルヌクレオチドを含むポリヌクレオチドの合成および非カノニカルヌクレオチドの開裂による脱塩基部位の生成の工程が同時に行われ得、脱塩基部位でのバックボーンの開裂が後続の工程で実施され得ることが理解される。脱塩基部位でのバックボーンの開裂は、鋳型核酸の変性を含む工程と同時に実施され得るか、または2つの工程は、連続的に実施され得る。
特定の非カノニカルヌクレオチドが、非カノニカルヌクレオチドの塩基部分を開裂することができる特定の酵素により認識される程度まで、非カノニカルヌクレオチドの選択が、非カノニカルヌクレオチドの塩基部分の開裂に使用される酵素の選択を決定づけ得ることが理解される。少なくとも1つの非カノニカルヌクレオチドの選択については、使用されたDNAポリメラーゼによる非カノニカルヌクレオチドを含む合成されたポリヌクレオチドへの組込み効率によりさらに決定づけられ得る。
脱塩基部位またはその付近でのバックボーンの開裂によるポリヌクレオチドフラグメントの生成
本明細書で提供される方法により生成された脱塩基部位を含むポリヌクレオチドのバックボーンは、ブロックされた3’末端をもつポリヌクレオチドフラグメントを生成する作用因子により脱塩基部位またはその付近で開裂され得る。ヌクレオチドの塩基部分の開裂により脱塩基部位が作製され、ポリヌクレオチドバックボーンの開裂が同時に実施され得ることが理解される。しかしながら、便宜上、これらの反応は別々の工程として記載される。
本明細書で提供される方法により生成された脱塩基部位を含むポリヌクレオチドのバックボーンは、ブロックされた3’末端をもつポリヌクレオチドフラグメントを生成する作用因子により脱塩基部位またはその付近で開裂され得る。ヌクレオチドの塩基部分の開裂により脱塩基部位が作製され、ポリヌクレオチドバックボーンの開裂が同時に実施され得ることが理解される。しかしながら、便宜上、これらの反応は別々の工程として記載される。
ヌクレオチド、例えば本明細書で生成されたポリヌクレオチドに存在する非カノニカルヌクレオチドの塩基部分の開裂による脱塩基部位の生成後、ポリヌクレオチドのバックボーンは、脱塩基部位でバックボーンの開裂を行うことによりブロックされた3’末端を含むポリヌクレオチドフラグメントを生成することができる作用因子により、脱塩基部位またはその付近、例えば非カノニカルヌクレオチドの組込み部位(非カノニカルヌクレオチドの塩基部分の開裂後、脱塩基部位とも呼ばれる)で開裂され得る。ポリヌクレオチドバックボーンの開裂(「フラグメント化」とも呼ばれる)の結果、少なくとも2つのフラグメント(脱塩基部位を含むポリヌクレオチドに存在する脱塩基部位の数、および開裂の程度に左右される)が生じ得、そのうちの1つはブロックされた3’末端を含まない。
脱塩基部位でのバックボーンの開裂により、ブロックされた3’末端を含むポリヌクレオチドフラグメントを生成することができる好適な作用因子(例えば、酵素、化学物質および/または熱などの反応条件)は、当業界では周知であり、加熱処理および/または化学的処理(塩基性条件、酸性条件、アルキル化条件、または脱塩基部位のアミンによる開裂を含む)がある。例えば、McHughおよびKnowland、Nucl.Acids Res.(1995)23(10):1664−1670、Bioorgan.Med.Chem(1991)7:2351、Sugiyama、Chem.Res.Toxicol.(1994)7:673−83、Horn,Nucl.Acids.Res.,(1988)16:11559−71)を参照。本明細書で使用される「作用因子」または「開裂作用因子」は、熱などの反応条件を包含する。場合によっては、開裂はポリアミン、例えばN,N’−ジメチルエチレンジアミン(DMED)で行われる。例えば、McHughおよびKnowland、前出を参照。場合によっては、開裂は、酵素の組み合わせで行われる。本明細書で提供される方法で使用するための酵素の組み合わせの一例は、USER(New England BiolabsからのUNGとエンドヌクレアーゼVIIIとの組み合わせ)である。
開裂は、脱塩基残基に対し3’に隣接したヌクレオチドと脱塩基残基との間で行われ得る。当業界で周知のとおり、脱塩基部位が得られるフラグメントの3’末端に位置するように、開裂は、脱塩基部位に対して3’であり得る(例、脱塩基残基のデオキシリボース環および3’リン酸基と隣接ヌクレオチドのデオキシリボース環との間の開裂により、隣接ヌクレオチドのデオキシリボース環に遊離5’リン酸基が生じる)。塩基性条件下またはアミン(N,N’−ジメチルエチレンジアミンなど)による処理の結果、脱塩基部位に対し3’に隣接したホスホジエステルバックボーンの開裂が起こり、ブロックされた3’末端をもつポリヌクレオチドフラグメントが生成し得る。さらに、開裂のより複雑な形態、例えばホスホジエステルバックボーンの開裂および脱塩基ヌクレオチド(の一部分)の開裂が起こるような開裂も可能である。例えば、ある一定の条件下、化学的処理および/または熱処理を用いる開裂は、脱塩基部位デオキシリボース環とその3’リン酸間の結合の開裂をもたらすβ排除工程を含み得、標識され得るか、またはさらなる開裂および閉環反応が行われ得る反応性α,β−不飽和アルデヒドが生じる。例えば、Sugiyama、Chem.Res.Toxicol.(1994)7:673−83、Horn、Nucl.Acids.Res.(1988)16:11559−71を参照。多数の異なるタイプのブロックされた3’末端を含む開裂生成物をもたらす2つまたはそれより多くの異なる方法を含む、1つより多い開裂方法が使用され得ることが理解される。
脱塩基部位でのバックボーンの開裂は、全般的、特異的または選択的開裂であり得、その約98%、約95%、約90%、約85%、または約80%を超える開裂が脱塩基部位で行われる。しかしながら、開裂の程度はそれより少ないこともあり得る。したがって、特異的開裂への言及は例示である。全般的、特異的または選択的開裂は、本明細書で提供される定方向性ポリヌクレオチドライブラリの生成のためのブロックされた3’末端を含むポリヌクレオチドフラグメントを生成する方法におけるフラグメントサイズの制御に望ましいものであり得る。開裂反応が、かなり過剰の試薬の存在下で行われ、ポリヌクレオチドの過剰な開裂についての懸念が最小限である状態で(すなわち、上記の合成工程中、組み込まれた非カノニカルヌクレオチドの間隔により判定され得る、所望のフラグメントサイズを維持しながら)完了まで続行され得るように、反応条件は選択され得る。一端に一脱塩基部位およびポリヌクレオチドフラグメント内またはその内部(すなわち、末端ではない)に脱塩基部位(複数も可)を含むポリヌクレオチドフラグメントが生成され得るように、開裂の程度はさらに低いものであり得る。
本明細書で示したとおり、非カノニカルヌクレオチドの存在下で合成されたポリヌクレオチドにおける非カノニカルヌクレオチドの塩基部分の開裂により脱塩基部位が生成される実施形態では、非カノニカルヌクレオチドを含むポリヌクレオチドにおける非カノニカルヌクレオチド間の間隔、ならびに選択された反応条件により、得られるフラグメント(脱塩基部位が生成される、非カノニカルヌクレオチドの塩基部分の開裂、および本明細書記載の脱塩基部位でのバックボーンの開裂後)のおおよそのサイズが決定されるため、ポリヌクレオチドへの非カノニカルヌクレオチドの組込みの頻度は、本明細書で提供される方法を用いて製造されたフラグメントのサイズに関連している。高い効率および忠実度でフラグメント標的全体に沿ったポリメラーゼ活性を可能にするため、フラグメントが第2鎖合成のための鋳型としての役割を果たすときに脱塩基部位を欠くフラグメントを生成するために、脱塩基部位(複数も可)でバックボーンの完全な開裂を実施することが一般的に望ましい。
定方向性ポリヌクレオチドライブラリを生成するための本明細書で提供される方法について、好適なフラグメントサイズは、正確に5、10、15、20、25、30、40、50、65、75、85、100、123、150、175、200、225、250、300、350、400、450、500、550、600、650のヌクレオチド長、前記列挙の数値より多いヌクレオチド長、前記列挙の数値より少ないヌクレオチド長、少なくとも前記列挙の数値のヌクレオチド長、多くとも前記列挙の数値のヌクレオチド長、または約前記列挙の数値のヌクレオチド長であり得る。場合によっては、フラグメントは約200ヌクレオチド長、約100ヌクレオチド長、または約50ヌクレオチド長であり得る。他の場合には、フラグメントの集団のサイズは約50〜200ヌクレオチドであり得る。特にフラグメントの集団が生成されるとき、非カノニカルヌクレオチドの組込み(開裂後のフラグメントサイズに関連する)は鋳型ごとに、また同じ鋳型のコピー間でも異なり得るため、フラグメントサイズが概数であることが理解される。したがって、同じ出発材料(単一ポリヌクレオチド鋳型など)から生成されたフラグメントは、依然として同じおおよそのサイズまたはサイズ範囲を有しながらも、異なる(および/または重複)配列を有し得る。
脱塩基部位でのポリヌクレオチドバックボーンの開裂後、脱塩基部位を欠き得る、3’最上位(3’−most)フラグメント以外のどのフラグメントも1つの脱塩基部位を含み得る(開裂が完全に有効である場合)。他のフラグメントは全て3’脱塩基部位(ブロックされた3’末端)を含み得る。場合によっては、本明細書で提供される方法により生成される脱塩基部位の1本鎖cDNAまたはポリヌクレオチドのバックボーンのフラグメント化により、ブロックされた3’末端、および5’末端のリン酸を含むフラグメントが生成され得る。
ポリヌクレオチドフラグメントに付加されたアダプターのポリメラーゼ伸長
場合によっては、本明細書で提供される方法により調製される、ブロックされた3’末端および場合により5’リン酸を含むポリヌクレオチドの3’末端にオリゴヌクレオチドを付加することもある。このオリゴヌクレオチドは、オリゴヌクレオチドの3’末端に存在する1本鎖DNAを、ブロックされた3’末端を含むポリヌクレオチドの3’末端にアニーリングすることにより付加され得る。場合によっては、本明細書で提供される方法により調製される、ブロックされた3’末端および場合により5’リン酸を伴うポリヌクレオチドを、3’ヒドロキシル(OH)基をもつオーバーハングを含むオリゴヌクレオチドにハイブリダイゼーションし、鋳型依存的ポリメラーゼでオリゴヌクレオチドの3’OH基から伸長させることもあり、この3’OHをもつオーバーハングはポリヌクレオチドフラグメントの3’末端にアニーリングするものとする。オリゴヌクレオチドは、アダプターまたはプライマーであり得る。オリゴヌクレオチドは、DNA、RNAまたはその組み合わせを含み得る。オリゴヌクレオチドは、約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、90、100または200のヌクレオチド長、約前記列挙の数値より少ないヌクレオチド長、または約前記列挙の数値より多いヌクレオチド長であり得る。オリゴヌクレオチドは、部分的デュプレックスを含むか、または1本鎖であり得る。場合によっては、オリゴヌクレオチドは、部分的デュプレックスアダプターを含むこともあり、この部分的デュプレックスは、長鎖および短鎖を含むものとする。場合によっては、部分的デュプレックスアダプターを含むオリゴヌクレオチドは、約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20のヌクレオチド、前記列挙の数値より多いヌクレオチド、前記列挙の数値より少ないヌクレオチドまたは少なくとも前記列挙の数値のヌクレオチドのオーバーハングを有することもある。オーバーハングは、3’オーバーハングであり得る。場合によっては、オーバーハングは3’オーバーハングであり、このオーバーハングは少なくとも6、7、8または9個のヌクレオチドを含むものとする。場合によっては、オリゴヌクレオチドの3’オーバーハングが、本明細書記載の方法により生成されるブロックされた3’末端を含むポリヌクレオチドの3’末端に存在する配列とハイブリダイズさせることもある。場合によっては、オリゴヌクレオチドはデュプレックス状配列を含むこともある。場合によっては、オリゴヌクレオチドは、約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60、65、70、75、80、90、100、200またはそれより多いか、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60、65、70、75、80、90、100、200またはそれより多いかよりも多いか、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60、65、70、75、80、90、100、200またはそれより多いかよりも少ないか、または少なくとも5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60、65、70、75、80、90、100、200またはそれより多くの塩基対合またはデュプレックス状配列を含むこともある。場合によっては、部分的デュプレックスおよび3’オーバーハングを含むオリゴヌクレオチドに存在する部分的デュプレックスが、本明細書で提供される方法により生成される3’末端ブロックを含むポリヌクレオチドに存在する内部配列とのオリゴヌクレオチドのハイブリダイゼーションを妨げる役割を果たすこともある。本明細書記載の部分的デュプレックスおよび3’オーバーハングを含むオリゴヌクレオチドのデュプレックス部分は、3’末端にブロックを含むポリヌクレオチドに存在する内部配列とのハイブリダイゼーションではなく、3’末端にブロックを含むポリヌクレオチドの3’末端とのオリゴヌクレオチドの3’オーバーハングの優先的ハイブリダイゼーションを可能にし得る。優先的ハイブリダイゼーションは、オリゴヌクレオチドのデュプレックス部分により誘発される立体障害およびスタッキング効果に起因し得る。場合によっては、オリゴヌクレオチドは1本鎖である。場合によっては、1本鎖アダプターは、約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、90、100、または200ヌクレオチド長、前記列挙の数値より多いヌクレオチド長、前記列挙の数値より少ないヌクレオチド長、または少なくとも前記列挙の数値のヌクレオチド長を含むこともある。場合によっては、オリゴヌクレオチドは、本明細書で提供される方法により生成されるブロックされた3’末端を含むポリヌクレオチドの3’末端にある配列とハイブリダイゼーション可能な3’部分、およびハイブリダイゼーション不可能な5’部分を含む1本鎖テイルドプライマーである。さらに、ハイブリダイゼーション不可能な部分は、識別子配列(例、バーコード、TruSeq配列など)を含み得る。場合によっては、1本鎖オリゴヌクレオチドは、3’オーバーハングを含むステムループまたはヘアピン構造を形成することがあり、この3’オーバーハングは、本明細書記載の方法により生成されるブロックされた3’末端を含むポリヌクレオチドの3’末端に存在する配列とハイブリダイズさせる。場合によっては、ヘアピンのステムが、約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、75、100またはそれより多くのヌクレオチド長、約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、75、100またはそれより多いよりも少ないヌクレオチド長、または約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、75、100またはそれより多いよりも多いヌクレオチド長であることもある。場合によっては、ヘアピンのループ配列は、約5、10、15、20、25、30、35、40、45、50またはそれより多くのヌクレオチド長、約5、10、15、20、25、30、35、40、45、50またはそれより多いよりも少ないヌクレオチド長、または約5、10、15、20、25、30、35、40、45、50またはそれより多いよりも多いヌクレオチド長であることもある。場合によっては、ステムループ構造を含むオリゴヌクレオチドが、約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド、前記列挙の数値より多いヌクレオチド、前記列挙の数値より少ないヌクレオチド、または少なくとも前記列挙の数値のヌクレオチドの3’オーバーハングを有することもある。場合によっては、オリゴヌクレオチドは、1つまたはそれより多くのバーコードを含むこともある。場合によっては、1つまたはそれより多くのバーコードは、オリゴヌクレオチドのステムおよび/またはループにある。ステムループを含むオリゴヌクレオチドは、さらにループ内に制限エンドヌクレアーゼ部位を含み得る。ステムループを含むオリゴヌクレオチドは、さらにステム内に制限エンドヌクレアーゼ部位を含み得る。3’末端にブロックを含むポリヌクレオチドの3’末端に存在する配列に対して指向した3’オーバーハングを含むオリゴヌクレオチドは、さらに3’オーバーハングの3’末端以外の任意および/または全ての他の末端にブロックを含み得る。さらにオリゴヌクレオチドは、既知または普遍的配列(例、配列A)を含み得、そのため普遍的または既知配列のための配列特異的プライマーの生成および/または使用が可能となり得る。この工程のためのアダプターまたはプライマーのいくつかの例を図2に示す。dsDNA部分を形成する2本の鎖は、ループによりさらに連結され得る2つのオリゴヌクレオチドであり得る。ループまたはリンカーは、オリゴヌクレオチド、非ヌクレオチドリンカーまたはその組み合わせを含み得る。ループまたはリンカーはまた、ヌクレオチド類似体を含み得る。場合によっては、オリゴヌクレオチドは、平滑末端を含む第1末端および3’オーバーハングを含む第2末端を含む部分的デュプレックスを含むこともあり、この部分的デュプレックスは長鎖と短鎖との間に形成され、長鎖は、短鎖とデュプレックスを形成する既知または普遍的配列(例、配列A)および3’オーバーハングを含むものとする。短鎖は、3’および/または5’末端にブロックを有し得る。長鎖は5’末端にブロックを有し得る。3’または5’ブロックは、本明細書で提供される任意のブロックまたはブロッキング基を含み得る。3’オーバーハングは、本明細書で提供される方法により生成された非カノニカルヌクレオチドを含むポリヌクレオチドの3’ブロック末端に存在する配列と相補的な配列を含み得る。1本鎖3’オーバーハングは、ランダム配列を含み得る。場合によっては、ランダム配列を含む3’オーバーハングを含むオリゴヌクレオチドのプールまたは複数のオリゴヌクレオチドは、本明細書で提供される方法のいずれかにより生成されるブロックされた3’末端を含む複数のポリヌクレオチドの3’末端にアニーリングされることもある。場合によっては、オリゴヌクレオチドのプールまたは複数のオリゴヌクレオチドのそれぞれのランダム配列が、異なるランダム配列を含むこともある。場合によっては、オリゴヌクレオチドのプールまたは複数のオリゴヌクレオチドのそれぞれのランダム配列が、同じランダム配列を含むこともある。場合によっては、オリゴヌクレオチドのプールまたは複数のオリゴヌクレオチドが、同じ普遍的または既知配列(例、配列A)を含むこともある。場合によっては、オリゴヌクレオチドのプールまたは複数のオリゴヌクレオチドが、異なる普遍的または既知配列を含むこともある。場合によっては、オリゴヌクレオチド(例、第1アダプター)の1本鎖3’オーバーハングが、本明細書で提供される方法により生成されるブロックされた3’末端を含む実質的に全てのポリヌクレオチドの3’末端にハイブリダイズさせることもある。場合によっては、オリゴヌクレオチド(例、第1アダプター)のプールまたは複数のオリゴヌクレオチド(例、第1アダプター)により提供される1本鎖3’オーバーハングのプールまたは複数の1本鎖3’オーバーハング(ここで、オリゴヌクレオチド(例、第1アダプター)のプールまたは複数のオリゴヌクレオチド(例、第1アダプター)の各オリゴヌクレオチド(例、第1アダプター)は、異なるランダム配列を含む3’オーバーハングを含むものとする)が、本明細書で提供される方法のいずれかにより生成される3’ブロック化末端を含む実質的に全てのポリヌクレオチドの3’末端にハイブリダイズさせることもある。オリゴヌクレオチド(例、第1アダプター)の1本鎖3’オーバーハングは、本明細書で提供される方法により生成される3’ブロック化末端を含むポリヌクレオチドの1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59
%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%または100%を超える%、前記列挙の%より少ない%、少なくとも前記列挙の%、多くとも前記列挙の%、または約前記列挙の%とハイブリダイズさせることができる。場合によっては、1本鎖3’オーバーハングは、本明細書で提供される方法により生成される3’ブロック化末端を含むポリヌクレオチドの1〜10%、10〜20%、20〜30%、30〜40%、40〜50%、50〜60%、60〜70%、70〜80%、80〜90%、90〜95%、95〜99%または90〜100%の3’末端にハイブリダイズさせることもある。場合によっては、1本鎖3’オーバーハングは、本明細書で提供される方法により生成される3’ブロック化末端を含むポリヌクレオチドの約1〜約10%、約10〜約20%、約20〜約30%、約30〜約40%、約40〜約50%、約50〜約60%、約60〜約70%、約70〜約80%、約80〜約90%、または約90〜約100%の3’末端にハイブリダイズさせることもある。オリゴヌクレオチド(例、第1アダプター)のプールまたは複数のオリゴヌクレオチド(例、第1アダプター)により提供される1本鎖3’オーバーハングのプールまたは複数の1本鎖3’オーバーハング(ここで、オリゴヌクレオチド(例、第1アダプター)のプールまたは複数のオリゴヌクレオチド(例、第1アダプター)の各オリゴヌクレオチド(例、第1アダプター)は、異なるランダム配列を含む3’オーバーハングを含むものとする)は、本明細書で提供される方法により生成される3’ブロック化末端を含むポリヌクレオチドの1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%または100%を超える%、前記列挙の%より少ない%、少なくとも前記列挙の%、多くとも前記列挙の%、または約前記列挙の%とハイブリダイゼーションし得る。場合によっては、オリゴヌクレオチド(例、第1アダプター)のプールまたは複数のオリゴヌクレオチド(例、第1アダプター)により提供される1本鎖3’オーバーハングのプールまたは複数の1本鎖3’オーバーハング(ここで、オリゴヌクレオチド(例、第1アダプター)のプールまたは複数のオリゴヌクレオチド(例、第1アダプター)の各オリゴヌクレオチド(例、第1アダプター)は、異なるランダム配列を含む3’オーバーハングを含むものとする)が、本明細書で提供される方法により生成される3’ブロック化末端を含むポリヌクレオチドの1〜10%、10〜20%、20〜30%、30〜40%、40〜50%、50〜60%、60〜70%、70〜80%、80〜90%、90〜95%、95〜99%または90〜100%の3’末端にハイブリダイズさせることもある。場合によっては、オリゴヌクレオチド(例、第1アダプター)のプールまたは複数のオリゴヌクレオチド(例、第1アダプター)により提供される1本鎖3’オーバーハングのプールまたは複数の1本鎖3’オーバーハング(ここで、オリゴヌクレオチド(例、第1アダプター)のプールまたは複数のオリゴヌクレオチド(例、第1アダプター)の各オリゴヌクレオチド(例、第1アダプター)は、異なるランダム配列を含む3’オーバーハングを含むものとする)が、本明細書で提供される方法により生成される3’ブロック化末端を含むポリヌクレオチドの約1〜約10%、約10〜約20%、約20〜約30%、約30〜約40%、約40〜約50%、約50〜約60%、約60〜約70%、約70〜約80%、約80〜約90%、または約90〜約100%の3’末端にハイブリダイズさせることもある。場合によっては、オリゴヌクレオチドは、1つまたはそれより多くのバーコードを含むこともある。場合によっては、1つまたはそれより多くのバーコードは、ステムおよび/またはループにある。場合によっては、バーコードは、バーコードが付加された本明細書記載の方法により生成された個々のポリヌクレオチドにユニークなマーキングをするのに有用なランダム配列を含むこともある。場合によっては、バーコードは、ランダムに付加され、それが付加されたフラグメントについてユニークなものであることもある。これらのバーコードを、鋳型核酸の試料に特異的なバーコードと組み合わせることができる。
場合によっては、本明細書で提供される方法により調製される、ブロックされた3’末端および場合により5’リン酸を含むポリヌクレオチドの3’末端にオリゴヌクレオチドを付加することもある。このオリゴヌクレオチドは、オリゴヌクレオチドの3’末端に存在する1本鎖DNAを、ブロックされた3’末端を含むポリヌクレオチドの3’末端にアニーリングすることにより付加され得る。場合によっては、本明細書で提供される方法により調製される、ブロックされた3’末端および場合により5’リン酸を伴うポリヌクレオチドを、3’ヒドロキシル(OH)基をもつオーバーハングを含むオリゴヌクレオチドにハイブリダイゼーションし、鋳型依存的ポリメラーゼでオリゴヌクレオチドの3’OH基から伸長させることもあり、この3’OHをもつオーバーハングはポリヌクレオチドフラグメントの3’末端にアニーリングするものとする。オリゴヌクレオチドは、アダプターまたはプライマーであり得る。オリゴヌクレオチドは、DNA、RNAまたはその組み合わせを含み得る。オリゴヌクレオチドは、約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、90、100または200のヌクレオチド長、約前記列挙の数値より少ないヌクレオチド長、または約前記列挙の数値より多いヌクレオチド長であり得る。オリゴヌクレオチドは、部分的デュプレックスを含むか、または1本鎖であり得る。場合によっては、オリゴヌクレオチドは、部分的デュプレックスアダプターを含むこともあり、この部分的デュプレックスは、長鎖および短鎖を含むものとする。場合によっては、部分的デュプレックスアダプターを含むオリゴヌクレオチドは、約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20のヌクレオチド、前記列挙の数値より多いヌクレオチド、前記列挙の数値より少ないヌクレオチドまたは少なくとも前記列挙の数値のヌクレオチドのオーバーハングを有することもある。オーバーハングは、3’オーバーハングであり得る。場合によっては、オーバーハングは3’オーバーハングであり、このオーバーハングは少なくとも6、7、8または9個のヌクレオチドを含むものとする。場合によっては、オリゴヌクレオチドの3’オーバーハングが、本明細書記載の方法により生成されるブロックされた3’末端を含むポリヌクレオチドの3’末端に存在する配列とハイブリダイズさせることもある。場合によっては、オリゴヌクレオチドはデュプレックス状配列を含むこともある。場合によっては、オリゴヌクレオチドは、約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60、65、70、75、80、90、100、200またはそれより多いか、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60、65、70、75、80、90、100、200またはそれより多いかよりも多いか、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60、65、70、75、80、90、100、200またはそれより多いかよりも少ないか、または少なくとも5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60、65、70、75、80、90、100、200またはそれより多くの塩基対合またはデュプレックス状配列を含むこともある。場合によっては、部分的デュプレックスおよび3’オーバーハングを含むオリゴヌクレオチドに存在する部分的デュプレックスが、本明細書で提供される方法により生成される3’末端ブロックを含むポリヌクレオチドに存在する内部配列とのオリゴヌクレオチドのハイブリダイゼーションを妨げる役割を果たすこともある。本明細書記載の部分的デュプレックスおよび3’オーバーハングを含むオリゴヌクレオチドのデュプレックス部分は、3’末端にブロックを含むポリヌクレオチドに存在する内部配列とのハイブリダイゼーションではなく、3’末端にブロックを含むポリヌクレオチドの3’末端とのオリゴヌクレオチドの3’オーバーハングの優先的ハイブリダイゼーションを可能にし得る。優先的ハイブリダイゼーションは、オリゴヌクレオチドのデュプレックス部分により誘発される立体障害およびスタッキング効果に起因し得る。場合によっては、オリゴヌクレオチドは1本鎖である。場合によっては、1本鎖アダプターは、約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、90、100、または200ヌクレオチド長、前記列挙の数値より多いヌクレオチド長、前記列挙の数値より少ないヌクレオチド長、または少なくとも前記列挙の数値のヌクレオチド長を含むこともある。場合によっては、オリゴヌクレオチドは、本明細書で提供される方法により生成されるブロックされた3’末端を含むポリヌクレオチドの3’末端にある配列とハイブリダイゼーション可能な3’部分、およびハイブリダイゼーション不可能な5’部分を含む1本鎖テイルドプライマーである。さらに、ハイブリダイゼーション不可能な部分は、識別子配列(例、バーコード、TruSeq配列など)を含み得る。場合によっては、1本鎖オリゴヌクレオチドは、3’オーバーハングを含むステムループまたはヘアピン構造を形成することがあり、この3’オーバーハングは、本明細書記載の方法により生成されるブロックされた3’末端を含むポリヌクレオチドの3’末端に存在する配列とハイブリダイズさせる。場合によっては、ヘアピンのステムが、約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、75、100またはそれより多くのヌクレオチド長、約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、75、100またはそれより多いよりも少ないヌクレオチド長、または約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、75、100またはそれより多いよりも多いヌクレオチド長であることもある。場合によっては、ヘアピンのループ配列は、約5、10、15、20、25、30、35、40、45、50またはそれより多くのヌクレオチド長、約5、10、15、20、25、30、35、40、45、50またはそれより多いよりも少ないヌクレオチド長、または約5、10、15、20、25、30、35、40、45、50またはそれより多いよりも多いヌクレオチド長であることもある。場合によっては、ステムループ構造を含むオリゴヌクレオチドが、約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド、前記列挙の数値より多いヌクレオチド、前記列挙の数値より少ないヌクレオチド、または少なくとも前記列挙の数値のヌクレオチドの3’オーバーハングを有することもある。場合によっては、オリゴヌクレオチドは、1つまたはそれより多くのバーコードを含むこともある。場合によっては、1つまたはそれより多くのバーコードは、オリゴヌクレオチドのステムおよび/またはループにある。ステムループを含むオリゴヌクレオチドは、さらにループ内に制限エンドヌクレアーゼ部位を含み得る。ステムループを含むオリゴヌクレオチドは、さらにステム内に制限エンドヌクレアーゼ部位を含み得る。3’末端にブロックを含むポリヌクレオチドの3’末端に存在する配列に対して指向した3’オーバーハングを含むオリゴヌクレオチドは、さらに3’オーバーハングの3’末端以外の任意および/または全ての他の末端にブロックを含み得る。さらにオリゴヌクレオチドは、既知または普遍的配列(例、配列A)を含み得、そのため普遍的または既知配列のための配列特異的プライマーの生成および/または使用が可能となり得る。この工程のためのアダプターまたはプライマーのいくつかの例を図2に示す。dsDNA部分を形成する2本の鎖は、ループによりさらに連結され得る2つのオリゴヌクレオチドであり得る。ループまたはリンカーは、オリゴヌクレオチド、非ヌクレオチドリンカーまたはその組み合わせを含み得る。ループまたはリンカーはまた、ヌクレオチド類似体を含み得る。場合によっては、オリゴヌクレオチドは、平滑末端を含む第1末端および3’オーバーハングを含む第2末端を含む部分的デュプレックスを含むこともあり、この部分的デュプレックスは長鎖と短鎖との間に形成され、長鎖は、短鎖とデュプレックスを形成する既知または普遍的配列(例、配列A)および3’オーバーハングを含むものとする。短鎖は、3’および/または5’末端にブロックを有し得る。長鎖は5’末端にブロックを有し得る。3’または5’ブロックは、本明細書で提供される任意のブロックまたはブロッキング基を含み得る。3’オーバーハングは、本明細書で提供される方法により生成された非カノニカルヌクレオチドを含むポリヌクレオチドの3’ブロック末端に存在する配列と相補的な配列を含み得る。1本鎖3’オーバーハングは、ランダム配列を含み得る。場合によっては、ランダム配列を含む3’オーバーハングを含むオリゴヌクレオチドのプールまたは複数のオリゴヌクレオチドは、本明細書で提供される方法のいずれかにより生成されるブロックされた3’末端を含む複数のポリヌクレオチドの3’末端にアニーリングされることもある。場合によっては、オリゴヌクレオチドのプールまたは複数のオリゴヌクレオチドのそれぞれのランダム配列が、異なるランダム配列を含むこともある。場合によっては、オリゴヌクレオチドのプールまたは複数のオリゴヌクレオチドのそれぞれのランダム配列が、同じランダム配列を含むこともある。場合によっては、オリゴヌクレオチドのプールまたは複数のオリゴヌクレオチドが、同じ普遍的または既知配列(例、配列A)を含むこともある。場合によっては、オリゴヌクレオチドのプールまたは複数のオリゴヌクレオチドが、異なる普遍的または既知配列を含むこともある。場合によっては、オリゴヌクレオチド(例、第1アダプター)の1本鎖3’オーバーハングが、本明細書で提供される方法により生成されるブロックされた3’末端を含む実質的に全てのポリヌクレオチドの3’末端にハイブリダイズさせることもある。場合によっては、オリゴヌクレオチド(例、第1アダプター)のプールまたは複数のオリゴヌクレオチド(例、第1アダプター)により提供される1本鎖3’オーバーハングのプールまたは複数の1本鎖3’オーバーハング(ここで、オリゴヌクレオチド(例、第1アダプター)のプールまたは複数のオリゴヌクレオチド(例、第1アダプター)の各オリゴヌクレオチド(例、第1アダプター)は、異なるランダム配列を含む3’オーバーハングを含むものとする)が、本明細書で提供される方法のいずれかにより生成される3’ブロック化末端を含む実質的に全てのポリヌクレオチドの3’末端にハイブリダイズさせることもある。オリゴヌクレオチド(例、第1アダプター)の1本鎖3’オーバーハングは、本明細書で提供される方法により生成される3’ブロック化末端を含むポリヌクレオチドの1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59
%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%または100%を超える%、前記列挙の%より少ない%、少なくとも前記列挙の%、多くとも前記列挙の%、または約前記列挙の%とハイブリダイズさせることができる。場合によっては、1本鎖3’オーバーハングは、本明細書で提供される方法により生成される3’ブロック化末端を含むポリヌクレオチドの1〜10%、10〜20%、20〜30%、30〜40%、40〜50%、50〜60%、60〜70%、70〜80%、80〜90%、90〜95%、95〜99%または90〜100%の3’末端にハイブリダイズさせることもある。場合によっては、1本鎖3’オーバーハングは、本明細書で提供される方法により生成される3’ブロック化末端を含むポリヌクレオチドの約1〜約10%、約10〜約20%、約20〜約30%、約30〜約40%、約40〜約50%、約50〜約60%、約60〜約70%、約70〜約80%、約80〜約90%、または約90〜約100%の3’末端にハイブリダイズさせることもある。オリゴヌクレオチド(例、第1アダプター)のプールまたは複数のオリゴヌクレオチド(例、第1アダプター)により提供される1本鎖3’オーバーハングのプールまたは複数の1本鎖3’オーバーハング(ここで、オリゴヌクレオチド(例、第1アダプター)のプールまたは複数のオリゴヌクレオチド(例、第1アダプター)の各オリゴヌクレオチド(例、第1アダプター)は、異なるランダム配列を含む3’オーバーハングを含むものとする)は、本明細書で提供される方法により生成される3’ブロック化末端を含むポリヌクレオチドの1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%または100%を超える%、前記列挙の%より少ない%、少なくとも前記列挙の%、多くとも前記列挙の%、または約前記列挙の%とハイブリダイゼーションし得る。場合によっては、オリゴヌクレオチド(例、第1アダプター)のプールまたは複数のオリゴヌクレオチド(例、第1アダプター)により提供される1本鎖3’オーバーハングのプールまたは複数の1本鎖3’オーバーハング(ここで、オリゴヌクレオチド(例、第1アダプター)のプールまたは複数のオリゴヌクレオチド(例、第1アダプター)の各オリゴヌクレオチド(例、第1アダプター)は、異なるランダム配列を含む3’オーバーハングを含むものとする)が、本明細書で提供される方法により生成される3’ブロック化末端を含むポリヌクレオチドの1〜10%、10〜20%、20〜30%、30〜40%、40〜50%、50〜60%、60〜70%、70〜80%、80〜90%、90〜95%、95〜99%または90〜100%の3’末端にハイブリダイズさせることもある。場合によっては、オリゴヌクレオチド(例、第1アダプター)のプールまたは複数のオリゴヌクレオチド(例、第1アダプター)により提供される1本鎖3’オーバーハングのプールまたは複数の1本鎖3’オーバーハング(ここで、オリゴヌクレオチド(例、第1アダプター)のプールまたは複数のオリゴヌクレオチド(例、第1アダプター)の各オリゴヌクレオチド(例、第1アダプター)は、異なるランダム配列を含む3’オーバーハングを含むものとする)が、本明細書で提供される方法により生成される3’ブロック化末端を含むポリヌクレオチドの約1〜約10%、約10〜約20%、約20〜約30%、約30〜約40%、約40〜約50%、約50〜約60%、約60〜約70%、約70〜約80%、約80〜約90%、または約90〜約100%の3’末端にハイブリダイズさせることもある。場合によっては、オリゴヌクレオチドは、1つまたはそれより多くのバーコードを含むこともある。場合によっては、1つまたはそれより多くのバーコードは、ステムおよび/またはループにある。場合によっては、バーコードは、バーコードが付加された本明細書記載の方法により生成された個々のポリヌクレオチドにユニークなマーキングをするのに有用なランダム配列を含むこともある。場合によっては、バーコードは、ランダムに付加され、それが付加されたフラグメントについてユニークなものであることもある。これらのバーコードを、鋳型核酸の試料に特異的なバーコードと組み合わせることができる。
場合によっては、本方法は、さらに伸長反応の実施を含み得る。伸長反応は、当業界で既知のいずれかの数の方法を用いて実施され得るもので、限定される訳ではないが、鎖置換活性をもつDNA依存的DNAポリメラーゼおよび4つの全dNTP(すなわち、dATP、dTTP、dCTP、およびdGTP)(ここで、dNTPは非修飾である)の使用が含まれる。場合によっては、伸長反応は、DNAポリメラーゼおよび非修飾dNTP(すなわち、dATP、dTTP、dCTP、およびdGTP)により実施されることもある。場合によっては、伸長反応は、ブロックされた3’末端を含むポリヌクレオチドの3’ブロック化末端に見い出される相補的配列にアニーリングされた3’オーバーハングを伸長させることもあり、それにより非相補的末端を含む2本鎖ポリヌクレオチドが生成され、ここで、この3’ブロックを含むポリヌクレオチドは鋳型ポリヌクレオチドとしての役割を果たすものとする。非相補的末端を含む2本鎖ポリヌクレオチドは、このポリヌクレオチドの一方の端にあるオリゴヌクレオチドからの既知または普遍的配列(例、配列A)および反対端にある伸長反応のための鋳型としての役割を果たしたブロックされた3’末端を含むポリヌクレオチドの5’末端に相補的な配列を含み得る。伸長反応により生成された2本鎖ポリヌクレオチドは、鋳型ポリヌクレオチドのフラグメントを含む第1鎖、および鋳型ポリヌクレオチドのフラグメントに相補的な配列および既知または普遍的配列(例、配列A)を含む第2鎖を含み得、ここで既知配列は、第2鎖の5’末端に存在し、第1鎖の3’末端は、既知または普遍的配列(例、配列A)に相補的な配列と鋳型ポリヌクレオチドからの3’ブロックとの間のホスホジエステルバックボーンにギャップを含むものとする。既知または普遍的配列(例、配列A)は、既知または普遍的配列(例、配列A)を含む鎖をマーキングする役割を果たし得る。非カノニカルヌクレオチドが第1鎖cDNA合成中に組み込まれる場合、本明細書で提供される方法によるマーキングされた鎖の生成により、鋳型核酸の配列を表すマーキングされた鎖が製造される。非カノニカルヌクレオチドが第2鎖cDNA合成中に組み込まれる場合、本明細書で提供される方法によるマーキングされた鎖の生成により、鋳型核酸に相補的な配列を表すマーキングされた鎖が製造される。
場合によっては、非相補的末端を含む2本鎖ポリヌクレオチド(ここで、一方の末端は、1末端に既知または普遍的配列(例、配列A)を含む)は、伸長反応後に末端修復されることもある。末端修復は、平滑末端、非平滑末端(すなわち、スティッキーまたは付着末端)、または単一塩基オーバーハングの生成、例えば3’エキソヌクレアーゼ活性を欠くポリメラーゼによる2本鎖核酸生成物の3’末端への単一dAヌクレオチドの付加を含み得る。場合によっては、末端修復を、一方の端に既知または普遍的配列(例、配列A)を含む2本鎖ポリヌクレオチドで行うことにより、既知配列を含む一方の端と反対端に平滑末端が生成されることもあり、この一方の端は、既知または普遍的配列(例、配列A)を含み、反対端は、3’OHを伴う平滑末端を含むものとする。末端修復は、当業界で既知のいずれかの数の酵素および/または方法を用いて実施され得る。オーバーハングは、約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド、前記列挙の数値より多いヌクレオチド、前記列挙の数値より少ないヌクレオチド、または少なくとも前記列挙の数値のヌクレオチドを含み得る。
本方法は、一方の端に配列Aおよび反対端に3’OHを含む2本鎖ポリヌクレオチドにアダプターを付加することをさらに含み得る。場合によっては、本明細書で提供される方法により生成された3’ブロックを含むポリヌクレオチドにアニーリングされたアダプターは第1アダプターであり、一方の端に第1アダプター配列を含む2本鎖ポリヌクレオチドの反対端に付加されたアダプターは、第2アダプターである。ライゲーションは、平滑末端ライゲーションまたはスティッキーもしくは付着末端ライゲーションであり得る。第2アダプターの付加は、ライゲーションによって行われ得る。ライゲーションは、ライゲーション実施のための当業界で既知の酵素のいずれか(例、T4 DNAリガーゼ)により実施され得る。第2アダプターは、当業界で既知のいずれのタイプのアダプターでもよく、限定される訳ではないが、慣用的なデュプレックスまたは2本鎖アダプターが挙げられる。アダプターは、DNA、RNAまたはそれらの組み合わせを含み得る。第2アダプターは、約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、90、100、または200ヌクレオチド長、約前記列挙の数値より少ないヌクレオチド長、または約前記列挙の数値より多いヌクレオチド長であり得る。第2アダプターは、デュプレックスアダプター、部分的デュプレックスアダプター、または1本鎖アダプターであり得る。場合によっては、第2アダプターはデュプレックスアダプターである。場合によっては、このデュプレックスアダプターは、約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、90、100、または200ヌクレオチド長、約前記列挙の数値より少ないヌクレオチド長、または約前記列挙の数値より多いヌクレオチド長であり得る。場合によっては、第2アダプターは、部分的デュプレックスアダプターであり、この場合アダプターは、長鎖および短鎖を含むものとする。場合によっては、部分的デュプレックスアダプターを含む第2アダプターは、約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20ヌクレオチド、前記列挙の数値より多いヌクレオチド、前記列挙の数値より少ないヌクレオチド、または少なくとも前記列挙の数値のヌクレオチドのオーバーハングを有することもある。場合によっては、このオーバーハングは、5’オーバーハングである。場合によっては、このオーバーハングは、3’オーバーハングである。場合によっては、第2アダプターの部分的デュプレックスが、約5、6、7、8、9、10、12、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60、65、70、75、80、90、100、200またはそれより多くの塩基対合またはデュプレックス状配列、5、6、7、8、9、10、12、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60、65、70、75、80、90、100、200またはそれより多いよりも多い塩基対合またはデュプレックス状配列、5、6、7、8、9、10、12、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60、65、70、75、80、90、100、200またはそれより多いよりも少ない塩基対合またはデュプレックス状配列、または少なくとも5、6、7、8、9、10、12、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60、65、70、75、80、90、100、200またはそれより多くの塩基対合またはデュプレックス状配列を含むこともある。場合によっては、アダプターは、1本鎖アダプターを含むこともある。場合によっては、1本鎖アダプターは、約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、90、100、または200のヌクレオチド長、前記列挙の数値より多いヌクレオチド長、前記列挙の数値より少ないヌクレオチド長、または少なくとも前記列挙の数値のヌクレオチド長を含むことがある。場合によっては、1本鎖アダプターは、ステムループまたはヘアピン構造を形成することがある。場合によっては、ヘアピンアダプターのステムが、約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、75、100またはそれより多くのヌクレオチド長、約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、75、100またはそれより多いよりも少ないヌクレオチド長、または約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、75、100またはそれより多いよりも多いヌクレオチド長であることもある。場合によっては、ヘアピンアダプターのループ配列が、約5、10、15、20、25、30、35、40、45、50またはそれより多くのヌクレオチド長、約5、10、15、20、25、30、35、40、45、50またはそれより多いよりも少ないヌクレオチド長、または約5、10、15、20、25、30、35、40、45、50またはそれより多いよりも多いヌクレオチド長であることもある。第2アダプターは、さらに既知または普遍的配列(例、配列B)を含み得、したがって、普遍的または既知配列についての配列特異的プライマーが生成および/または使用され得る。ステムループを含む第2アダプターは、さらにループ内に制限エンドヌクレアーゼ部位を含み得る。ステムループを含む第2アダプターは、さらにステム内に制限エンドヌクレアーゼ部位を含み得る。本明細書で提供される方法では、本明細書で提供される第2アダプターの既知または普遍的配列は、本明細書で提供される第1アダプターの既知または普遍的配列とは同じかまたは異なり得る。第1アダプターが配列Aを含み、第2アダプターが配列Bを含む場合もあり、その場合、配列Bは配列Aと異なるかまたは非相補的である。場合によっては、第2アダプターが1つまたはそれより多くのバーコードを含むこともある。場合によっては、1つまたはそれより多くのバーコードは、ステムおよび/またはループにある。
場合によっては、一方の端に既知または普遍的配列(例、配列A)および反対端に3’OHを含む2本鎖ポリヌクレオチドへの第2アダプターの付加は、平滑末端ライゲーションによることもある。場合によっては、第2アダプターの付加は、付着またはスティッキー末端ライゲーションによることもあり、この場合、第2アダプターにおけるオーバーハングは、このオーバーハングに対し相補的な配列を含む2本鎖ポリヌクレオチドにおけるオーバーハングとハイブリダイズさせる。場合によっては、第2アダプターは、一方の端に既知または普遍的配列(例、配列A)および反対端に3’OHを含む2本鎖ポリヌクレオチドの5’末端へのライゲーションが可能なライゲーション鎖または第1鎖および一方の端に既知または普遍的配列(例、配列A)および反対端に3’OHを含む2本鎖ポリヌクレオチドのいずれの末端にもライゲーションできない非ライゲーション鎖または第2鎖を含むこともある。場合によっては、第2アダプターは、一方の端に既知または普遍的配列(例、配列A)および反対端に3’OHを含む2本鎖ポリヌクレオチドの3’末端へのライゲーションが可能なライゲーション鎖または第1鎖および一方の端に既知または普遍的配列(例、配列A)および反対端に3’OHを含む2本鎖ポリヌクレオチドのいずれの末端にもライゲーションできない非ライゲーション鎖または第2鎖を含むこともある。第2アダプターは、部分的デュプレックスアダプターである場合もあり、この場合、アダプターは長鎖および短鎖を含み、長鎖はライゲーション鎖または第1鎖であり、短鎖は非ライゲーション鎖または第2鎖である。短鎖は、3’および/または5’末端にブロックを有し得る。長鎖は、3’または5’末端にブロックを有し得る。3’または5’ブロックは、本明細書で提供される任意のブロックまたはブロッキング基を含み得る。部分的デュプレックスは、等しくない長さの鎖を有する場合もある。場合によっては、部分的デュプレックスは、アダプターの一方の端にオーバーハングおよびアダプターの別の端に平滑末端を含むこともある。オーバーハングは、3’末端または5’末端にあり得る。場合によっては、部分的デュプレックスは、アダプターの各末端にオーバーハングを含むこともある。オーバーハングは、長さが等しい場合も等しくない場合もあり得る。ライゲーション鎖の5’末端は、5’リン酸基を含まない場合もある。場合によっては、ライゲーション鎖の5’末端は、5’リン酸を含むこともあり、この場合ポリヌクレオチドの3’末端は遊離3’ヒドロキシルを欠く。場合によっては、第2アダプターは、3’オーバーハングを含む長鎖および短鎖と部分的デュプレックスを形成する既知配列(例、配列B)を含むこともあり、この場合、短鎖は3’末端にブロックを含み、長鎖は一方の端に既知または普遍的配列(例、配列A)および反対端に3’OHを含む2本鎖ポリヌクレオチドの前述の反対端にある3’OHにライゲーションされ、それにより両端に既知または普遍的配列を含む2本鎖ポリヌクレオチドが生成される。さらにこれらの場合に対し、両端に既知または普遍的配列を含む2本鎖ポリヌクレオチドは、5’末端に本明細書記載のようにブロックされた3’末端を含むポリヌクレオチドにアニーリングされ、伸長されたオリゴヌクレオチドに由来する既知または普遍的配列および第2アダプターのライゲーションに由来する既知または普遍的配列を含む1鎖を含む。場合によっては、この1鎖は、5’末端に配列Aおよび3’末端に配列Bを含むこともある。場合によっては、第2アダプターは、5’オーバーハングを含む長鎖および短鎖と部分的デュプレックスを形成する既知配列(例、配列B)を含むこともあり、この場合、短鎖は5’末端にブロックを含み、長鎖は一方の端に既知または普遍的配列(例、配列A)および反対端に3’OHを含む2本鎖ポリヌクレオチドのこの反対端にある5’リン酸にライゲーションされ、それにより両端に既知または普遍的配列を含む2本鎖ポリヌクレオチドが生成される。さらにこれらの場合に対し、一方の端に既知または普遍的配列(例、配列A)および反対端に3’OHを含む2本鎖ポリヌクレオチドへの第2アダプターのライゲーションにより、一方の端に本明細書記載のようにブロックされた3’末端を含むポリヌクレオチドにアニーリングされ、伸長されたオリゴヌクレオチドに由来する既知または普遍的配列(例、配列A)および反対端に第2アダプターに由来する既知または普遍的配列(例、配列B)を含む2本鎖ポリヌクレオチドが生成され、この本明細書記載のようにブロックされた3’末端を含むポリヌクレオチドにアニーリングされ、伸長されたオリゴヌクレオチドに由来する既知または普遍的配列(例、配列A)は一方の端の5’末端にあり、第2アダプターに由来する既知または普遍的配列(例、配列B)は反対端の5’末端にあるものとする。場合によっては、この1鎖は、1鎖の5’末端に配列Aおよび別の鎖の5’末端に配列Bを含むこともあり、配列Aを含む鎖の3’末端は鋳型として配列Bを用いて伸長され、それにより一方の端の5’末端に配列Aを、そして反対端の3’末端に配列Bと相補的な配列B’を含む1つまたはそれより多くの2本鎖ポリヌクレオチドが生成される。
場合によっては、本方法はさらに変性工程を含むこともあり、本明細書で提供される方法により生成された反対端に非相補的な既知または普遍的配列を含む2本鎖ポリヌクレオチドが変性される。変性は、限定される訳ではないが、加熱変性、および/または化学的変性が含まれ得る当業界で既知の方法のいずれかを用いて達成され得る。加熱変性は、本明細書で提供される方法により生成された反対端に非相補的な既知または普遍的配列を含むポリヌクレオチドの融解温度を超えるまで反応混合物の温度を上昇させることにより実施され得る。融解温度は、約30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、81、82、83、84、85、86、87、88、89、90、91、92、93、94、または95℃、前記で列挙した温度より高温、前記で列挙した温度より低温、または少なくとも前記で列挙した温度であり得る。温度は、融解温度を約1、2、3、4、5、6、7、8、9、または10℃上まわる温度、1、2、3、4、5、6、7、8、9、または10℃より多く上まわる温度、1、2、3、4、5、6、7、8、9、または10℃より少なく上まわる温度、または少なくとも1、2、3、4、5、6、7、8、9、または10℃上まわる温度に高められ得る。化学的変性は、塩基(すなわち、NaOH)、および/または競合的変性剤(すなわち、尿素またはホルムアルデヒド)を用いて実施され得る。場合によっては、変性により、本明細書で提供される方法により生成された反対端に非相補的な既知または普遍的配列を含む1本鎖ポリヌクレオチドが生成されることもある。
変性後、本明細書で提供される方法により生成された反対端に非相補的な既知または普遍的配列を含む1本鎖ポリヌクレオチドを増幅することにより、定方向性ポリヌクレオチドライブラリが生成される。本明細書記載のように、一方の端または第1端の既知または普遍的配列は第1アダプターに由来し得、他方の端または第2端の既知または普遍的配列は第2アダプターに由来し得る。増幅は、反対端に存在する非相補的既知または普遍的配列に対して指向したプライマー対を用いて実施され得る。増幅は、当業界で既知の増幅方法を用いて実施され得、例としては、限定される訳ではないが、PCRまたは単一プライマー等温増幅(SPIA)が挙げられる。場合によっては、5’末端に配列Aを、そして3’末端に配列Bを含む1本鎖ポリヌクレオチドは、プライマー対を用いて増幅されることもあり、このプライマー対の第1プライマーは配列Bの一部分に相補的な配列を含み、プライマー対の第2プライマーは配列Aの相補体である配列A’の一部分に相補的な配列を含む。場合によっては、1鎖の5’末端に配列Aを、そして3’末端に配列B’を含む1本鎖ポリヌクレオチドは、プライマー対を用いて増幅されることもあり、このプライマー対の第1プライマーは配列B’の一部分に相補的な配列を含み、プライマー対の第2プライマーは配列Aの相補体である配列A’の一部分に相補的な配列を含む。場合によっては、第1および/または第2プライマーは、さらに1つまたはそれより多くの識別子配列を含み得る。場合によっては、識別子配列は、第1および/または第2プライマー上にハイブリダイゼーション不可能なテイルを含むこともある。識別子配列は、バーコード配列、フローセル配列、インデックス配列、またはそれらの組み合わせであり得る。インデックス配列は、Illuminaにより製造された次世代配列決定プラットフォームと適合し得るTruseqプライマー配列である場合もある。場合によっては、第1および/または第2プライマーは固体表面に結合し得る。固体表面は、平面状表面またはビーズであり得る。平面状表面は、チップ、マイクロアレイ、ウェルまたはフローセルの表面であり得る。場合によっては、第1および/または第2プライマーは、固体表面への増幅反応の1つまたはそれより多くの配列エレメント生成物(すなわち、増幅生成物)を含むこともあり、その1つまたはそれより多くの配列は、固体表面に結合された1つまたはそれより多くの捕捉プローブと相補的である。他の大規模並列処理次世代配列決定プラットフォームと適合し得る当業界で既知の他の配列エレメントは、テイル配列に組み込まれ得る。
配列決定は、本明細書記載の次世代配列決定(NGS)法を全て含め、任意の配列決定方法であってよい。NGS法は、合成による配列決定を含む場合もある。一部の実施形態では、配列決定は、ポリヌクレオチドに付加されたアダプターにより本明細書で提供される方法により生成されるポリヌクレオチドに導入された既知または普遍的配列に対して指向したプライマーで行われる。場合によっては、配列決定は、反対端に非相補的既知または普遍的配列を含む1本鎖ポリヌクレオチドを増幅するために使用された第1および/または第2プライマーによりポリヌクレオチドに導入された識別子配列に対して指向したプライマーで行われることもある。識別子配列は、バーコード配列、フローセル配列、および/またはインデックス配列であり得る。インデックス配列は、Illuminaにより製造された次世代配列決定プラットフォームと適合し得るTruseqプライマー配列である場合もある。
RNA試料から定方向性ポリヌクレオチドライブラリを生成するために本明細書記載の方法を用いる具体例としての作業の流れを描く概略図を図3に示す。工程Iは、試料から全RNAを単離し、第1鎖プライマーを全RNAにアニーリングすることから出発する。第1鎖プライマーは、ランダム配列または特異的転写物または転写物の群に特異的な配列を含み得る。第1鎖プライマーは、ある種の転写物(例、rRNAおよび/またはミトコンドリアRNA)を除く全ての転写物をプライミングするように設計され得る。工程IIでは、工程Iからの第1鎖プライマーを用いて工程Iで単離された全RNAに対し第1鎖cDNA合成を行う。第1鎖cDNA合成反応は、全4dNTPおよび非カノニカルdNTPであるdUTPを含む反応混合物の存在下で行われる。工程IIIは、UDGを用いてdUを含む第1鎖cDNAを開裂することにより脱塩基部位を生成すること、およびUDGにより生成された脱塩基部位でホスホジエステルバックボーンを開裂することができる開裂作用因子を必然的に伴う。開裂作用因子はDMEDまたは熱であり得る。工程IIIは、3’末端にブロックおよび任意選択で5’リン酸を含むポリヌクレオチドを生じさせる。工程IIが所望の密度でウラシル塩基を含む第1鎖cDNAを製造するように、工程II中におけるdUTPの組込みは、反応混合物内におけるdUTPの量または他のdNTPに対するdUTPの比率を制御することにより制御され得、工程IIIでは、所望のサイズの3;末端にブロックを含むポリヌクレオチドをが生成される。所望のサイズは、例えば特異的次世代配列決定プラットフォームのようなダウンストリーム・アプリケーションにより決定され得る。工程Iからの鋳型全RNAを工程IVで分解し、工程IIIで生成されたポリヌクレオチドを工程Vで精製する。鋳型RNAの分解は、リボヌクレアーゼ(例、リボヌクレアーゼHまたはリボヌクレアーゼI)または加熱処理を用いて実施され得る。精製後、ランダム配列を含む3’オーバーハングを含む第1アダプターを、工程IIIで生成されたポリヌクレオチドの3’末端に存在する配列にアニーリングする。第1アダプターは、1本鎖であり得、3’オーバーハングに加えてヘアピン構造を含み得る。第1アダプターは、複数の第1アダプターであり得、この複数の第1アダプターはそれぞれ異なるランダム配列を含み、それらはそれぞれ同じ普遍的配列を含む。第1アダプターは、部分的デュプレックスを形成する2つのオリゴヌクレオチドを含み得、一方の鎖は3’末端にある他方の鎖より長く、そのため3’オーバーハングを含む。第1アダプターは、さらに第1普遍的配列を含み得る。一旦アニーリングされると、工程IIIで生成されたポリヌクレオチドの3’末端にアニーリングされたオーバーハングの3’末端は、DNAポリメラーゼで伸長され、第2鎖cDNAが製造される。新たに生成された第2鎖の末端は、工程VIIIでT4ポリメラーゼを用いて研磨され、次いで工程IXで精製され得る。最終的に、第2アダプターを、工程VIIの2本鎖ポリヌクレオチド生成物にライゲーションされる。第2アダプターは、第2普遍的配列を含み得る。工程Xの生成物は、第1末端と第2末端との間に元のRNA鋳型の一部分を表す配列を含む挿入物を伴って一方の端に第1普遍的配列および第2の反対端に第2普遍的配列をもつ1鎖を含む2本鎖ポリヌクレオチドを含み得る。次いで、工程Xの生成物を工程XIで精製し、工程XIIにおいて工程Xの生成物に付加された第1および第2普遍的配列に対して指向したプライマーでのPCRに付す。このプライマーは、当業界で既知の次世代配列決定プラットフォームのいずれにも適したものであり得、さらに当業界で既知のバーコードおよび/または任意の他の識別子配列を含み得る。
RNA鋳型から定方向性ポリヌクレオチドライブラリを生成するための本明細書記載の方法の実施形態の具体例を示す概略図を図1Aに示す。図1Aの工程Iで説明するように、プライマーを鋳型RNAにハイブリダイズさせる。本明細書で提供されるように、プライマーは、ランダム配列、転写物特異的配列、および/またはオリゴdTを含み得る。工程IIでは、プライマーをdUTPの存在下で伸長させて、第1鎖cDNAまたはポリヌクレオチド伸長生成物を製造する。この伸長は、本明細書で提供されるところのRNA依存的DNAポリメラーゼを用いて実施され得る。工程IIIでは、鋳型RNAの分解後、ウラシル塩基を含むポリヌクレオチドを、UNGおよび熱またはポリアミン(DMED)を用いて分解することにより、3’ブロック化末端を含む多数のフラグメントを製造する。鋳型RNAの分解は、リボヌクレアーゼ(例、リボヌクレアーゼHまたはリボヌクレアーゼI)を用いて実施され得る。別法として、RNA鋳型ポリヌクレオチドを、限定される訳ではないが、加熱またはアルカリpH処理を含む他の方法または様々な方法の組み合わせにより分解することもできる。また、RNA鋳型の分解のための加熱処理は、脱塩基部位を含む相補的DNAのバックボーンの開裂にも使用され得、したがって、単一工程で相補的DNAおよびRNA鋳型のフラグメント化が達成され得る。工程IVでは、第1アダプターを、工程IIIで生成されたポリヌクレオチドの3’ブロック化末端に存在する配列にアニーリングする。第1アダプターは、3’末端にランダム配列を含む3’オーバーハングを含み、それにより、この3’オーバーハングは、工程IIIで生成されたポリヌクレオチドの3’ブロック化末端にある相補的配列に結合する。第1アダプターは、複数の第1アダプターであり得、この複数の第1アダプターはそれぞれ、異なるランダム配列を含み、この複数の第1アダプターの1つにあるランダム配列は、工程IIIで生成されたポリヌクレオチドの1つまたはそれより多くの3’末端に存在する相補的配列にアニーリングし得る。この複数の第1アダプターはそれぞれ配列Aを含み得る。第1アダプターのアニーリングされた3’オーバーハングの3’末端を、工程Vにおいてブロックされた3’末端を含むポリヌクレオチドに沿って伸長させることにより、2本鎖ポリヌクレオチドの1鎖の5’末端に付加された配列Aを伴う2本鎖ポリヌクレオチドが生成される。配列Aに相補的な配列A’は、工程IIIで生成された3’ブロックゆえに、工程Vで生成された2本鎖ポリヌクレオチドの他方の鎖には付加されない。工程VIでは、第2アダプターを、配列Aを含む末端とは反対側にある、工程Vで生成された2本鎖ポリヌクレオチドの末端にライゲーションする。第2アダプターは、配列Bを含む長鎖と配列Bの相補体B’の一部分を含む短鎖との間に形成された、部分的デュプレックスを含む。長鎖はさらに3’オーバーハングを含み、短鎖はさらに3’末端にブロックを含む。このブロックは、本明細書で提供されるいずれのブロックまたはブロッキング基でもよい。工程VIでは、長鎖はライゲーション鎖としての役割を果たし、短鎖は非ライゲーション鎖としての役割を果たすため、長鎖の5’末端は、その5’末端に配列Aを含む工程Vで製造された2本鎖ポリヌクレオチドの鎖の3’末端にライゲーションされ、それにより非相補的末端を含む2本鎖ポリヌクレオチドが生成される。ライゲーションは、限定される訳ではないが、工程Vで生成された2本鎖ポリヌクレオチドの末端での平滑末端の生成および平滑末端ライゲーションの実施を含め、本明細書で提供される方法の何れを用いても実施され得る。工程VIで生成された2本鎖ポリヌクレオチドの1鎖は、5;末端に配列Aおよび3’末端に配列Bを含む鎖特異的なポリヌクレオチドを含む。鎖特異的ポリヌクレオチドは、本明細書で提供される増幅方法の何れを用いても増幅され得る。場合によっては、増幅は、配列Bに対して指向した第1プライマーおよび配列Aの相補体A’に対して指向した第2プライマーを用いての増幅反応の実施を含むこともある(comprises performed)。第1プライマーまたは第2プライマーのいずれか、または両方は、さらにハイブリダイゼーション不可能なテイルを含み得、このテイルは、逆フローセル配列、TruSeqプライマー配列、バーコード配列および/または本明細書記載のダウンストリーム・アプリケーションに有用な任意の他の望ましい配列を含むものとする。第1プライマーおよび第2プライマーでの増幅後、ライゲーションされたアダプターに由来する各末端に非相補的アダプター配列およびフローセル配列が付加された2本鎖ポリヌクレオチド配列を含む増幅生成物が生成される。増幅生成物は、本明細書で提供される次世代配列決定プラットフォームのいずれとも適合し得る。
図1Bは、RNA鋳型から定方向性ポリヌクレオチドライブラリを生成するための本明細書記載の方法の実施形態の具体例としての概略図を示す。図1Bの工程IからVは、図1Aの工程IからVと同一である。図1Aと同様、図1Bの工程VIの第2アダプターは、配列Bを含む長鎖と配列Bの相補体B’の一部分を含む短鎖との間に形成された、部分的デュプレックスを含む。図1Aとは対照的に、図1Bの工程VIの第2アダプターの長鎖は5’オーバーハングを含み、短鎖はさらに5’末端にブロックを含む。このブロックは、本明細書で提供されるいずれのブロックまたはブロッキング基でもよい。工程VIでは、長鎖はライゲーション鎖としての役割を果たし、短鎖は非ライゲーション鎖としての役割を果たすため、長鎖の5’末端は、その5’末端に配列Aを含む工程Vで製造された2本鎖ポリヌクレオチドの反対鎖の5’末端にライゲーションされ、それにより非相補的末端を含む2本鎖ポリヌクレオチドが生成される。ライゲーションは、限定される訳ではないが、工程Vで生成された2本鎖ポリヌクレオチドの末端での平滑末端の生成および平滑末端ライゲーションの実施を含め、本明細書で提供される方法の何れを用いても実施され得る。5’末端にあるブロック故に、短鎖は、5’末端に配列Aを含む工程Vで生成された2本鎖ポリヌクレオチドの鎖にライゲーションされず、この場合ギャップが存在する。工程VIIでは、工程VIで生成された2本鎖ポリヌクレオチドに対し、フィルイン反応を行い、これにより、その5’末端に配列Aを含む鎖の3’末端を、鋳型として配列Bを用いて本明細書で提供される鎖置換活性を含むDNAポリメラーゼを用いることにより伸長させる。別法として、ライゲーションされていない鎖は、ポリメラーゼのエキソヌクレアーゼ活性により除去され得る。工程VIIにより、5;末端に配列Aおよび3’末端に配列B’を含む鎖特異的ポリヌクレオチドを含む2本鎖ポリヌクレオチドの1鎖を含む2本鎖ポリヌクレオチドが生成される。場合によっては、工程IVの第2アダプターは、2本鎖アダプターを含むこともあり、この第1鎖は配列Bを含み、第2鎖は配列B’を含み、第1鎖は両端にブロックを含み、第2鎖は3’末端にブロッキング基を含む。これらの場合において、第2アダプターのライゲーションにより、工程VIIを必要とせずに、5;末端に配列Aおよび3’末端に配列B’を含む鎖特異的ポリヌクレオチドを含む2本鎖ポリヌクレオチドの1鎖を含む2本鎖ポリヌクレオチドが生成される。鎖特異的ポリヌクレオチドは、本明細書で提供される増幅方法の何れを用いても増幅され得る。場合によっては、増幅は、配列B’に対して指向した第1プライマーおよび配列Aの相補体A’に対して指向した第2プライマーを用いての増幅反応を含むこともある。第1プライマーまたは第2プライマーのいずれか、または両方は、さらにハイブリダイゼーション不可能なテイルを含み得、このテイルは、逆フローセル配列、TruSeqプライマー配列、および/またはバーコード配列を含むものとする。第1プライマーおよび第2プライマーでの増幅後、ライゲーションされたアダプターに由来する各末端に非相補的アダプター配列およびフローセル配列が付加された2本鎖ポリヌクレオチド配列を含む増幅生成物が生成される。増幅生成物は、本明細書で提供される次世代配列決定プラットフォームと適合し得る。
SPIAを用いて本明細書で提供される方法により生成されたポリヌクレオチドを増幅するための本明細書記載の方法の実施形態の具体例を示す概略図を図5に示す。工程Iでは、キメラ増幅プライマーを、本明細書で提供される方法により生成された5’末端に配列Aおよび3’末端に配列Bを含むポリヌクレオチドとハイブリダイズさせる。キメラ増幅プライマーは、配列Cを含む3’DNA部分および配列Dを含む5’RNA部分を含み得、配列Cは配列Bの一部分と相補的な配列を含み、配列Dは上記のポリヌクレオチドとハイブリダイゼーション不可能な配列を含む。工程IIでは、RNA依存的DNAポリメラーゼ活性を含むDNAポリメラーゼを用いて伸長反応を行い、ここで配列Cの3’末端を、鋳型として上記のポリヌクレオチドを用いて伸長させ、ポリヌクレオチドの配列Bの3’末端を、鋳型として配列Dを用いて伸長させることにより、一方の端に配列Aおよびその相補体A’ならびに他方の端にRNA配列DおよびそのDNA相補体D’を含むヘテロデュプレックスを含む2本鎖ポリヌクレオチドが生成される。工程IIIでは、配列Dを、リボヌクレアーゼHを用いて開裂し、そこで一方の端に配列Aおよびその相補体A’ならびに他方の端に配列Cを含む3’1本鎖DNAオーバーハングを含む2本鎖ポリヌクレオチドが生成される。工程IVでは、配列D’に相補的な5’RNA部分を含む増幅キメラプライマーを、配列D’にアニーリングし、鎖置換型DNAポリメラーゼを用いて伸長させ、そこでDNAポリメラーゼは、3’末端に配列A’および5’末端に配列Cを含む1本鎖増幅生成物を置き換え、一方の端に配列Aおよびその相補体A’ならびに他方の端にRNA配列DおよびそのDNA相補体D’を含むヘテロデュプレックスを含む2本鎖ポリヌクレオチドが新たに生成される。次いで、工程IIIおよびIVを反復することにより、増幅生成物のプールが生成される。
VI.オリゴヌクレオチド
「オリゴヌクレオチド」の語は、典型的には200未満の残基長、例えば15〜100ヌクレオチド長のポリヌクレオチド鎖を指し得るが、それより長いポリヌクレオチド鎖も包含するものとする。オリゴヌクレオチドは、1本鎖状または2本鎖状であり得る。「プライマー」および「オリゴヌクレオチドプライマー」の語は、相補的なヌクレオチド配列とハイブリダイズさせることができるオリゴヌクレオチドを指し得る。「オリゴヌクレオチド」の語は、「プライマー」、「アダプター」および「プローブ」の語と互換的に使用され得る。
「オリゴヌクレオチド」の語は、典型的には200未満の残基長、例えば15〜100ヌクレオチド長のポリヌクレオチド鎖を指し得るが、それより長いポリヌクレオチド鎖も包含するものとする。オリゴヌクレオチドは、1本鎖状または2本鎖状であり得る。「プライマー」および「オリゴヌクレオチドプライマー」の語は、相補的なヌクレオチド配列とハイブリダイズさせることができるオリゴヌクレオチドを指し得る。「オリゴヌクレオチド」の語は、「プライマー」、「アダプター」および「プローブ」の語と互換的に使用され得る。
「ハイブリダイゼーション」/「ハイブリダイズさせる」および「アニーリング(する)」の語は、互換的に使用され得、相補的な核酸の対合を指し得る。
「プライマー」の語は、鋳型(標的ポリヌクレオチド、標的DNA、標的RNAまたはプライマー伸長生成物など)とハイブリダイズさせることができ、また鋳型に相補的なポリヌクレオチドの重合を促進することができる、一般的に遊離3’ヒドロキシル基をもつオリゴヌクレオチドを指し得る。プライマーは、プライマーのテイルを構成する非ハイブリダイゼーション性配列を含み得る。プライマーは、その配列が標的と完全に相補的なわけではない場合があるとしても、依然として標的とハイブリダイズさせるものであり得る。
プライマーは、例えばPCRまたはcDNA合成におけるように、ポリヌクレオチド鋳型に沿ったポリメラーゼによる伸長反応で使用され得るオリゴヌクレオチドであり得る。オリゴヌクレオチドプライマーは、1本鎖状であり、標的ポリヌクレオチドの配列とハイブリダイズさせることができる配列をその3’末端に含む、合成ポリヌクレオチドであり得る。通常、標的核酸とハイブリダイズさせるプライマーの3’領域は、配列またはプライマー結合部位と少なくとも80%、90%、95%、または100%の相補性を有する。
プライマーは、2次構造および自己ハイブリダイゼーションを回避するために既知パラメータにしたがって設計され得る。種々のプライマー対は、別のプライマー対と例えば約1、2、3、4、5、6、7、8、9または10℃以内でのほぼ同じ温度で、アニーリングおよび融解することができる。場合によっては、約1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、100、200、500、1000、5000、10,000またはそれより多くのプライマーが最初に使用されることもある。かかるプライマーは、本明細書記載の遺伝的標的とハイブリダイズさせることが可能であり得る。場合によっては、約2〜約10,000、約2〜約5,000、約2〜約2,500、約2〜約1,000、約2〜約500、約2〜約100、約2〜約50、約2〜約20、約2〜約10、または約2〜約6のプライマーが使用されることもある。
プライマーは、当業界で周知の方法を用いる適切な配列のクローニングおよび直接的化学合成を含む、様々な方法により調製され得る(Narangら、Methods Enzymol.68:90(1979)、Brownら、Methods Enzymol.68:109(1979))。プライマーはまた、Integrated DNA Technologies、Operon Technologies、Amersham Pharmacia Biotech、Sigma、およびLife Technologiesなどの販売元から入手され得る。プライマーは、同一の融解温度を有し得る。プライマーの融解温度は、約30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、81、82、83、84、または85℃、前記で列挙した温度より高い温度、前記で列挙した温度より低い温度、または少なくとも前記で列挙した温度であり得る。場合によっては、プライマーの融解温度は、約30〜約85℃、約30〜約80℃、約30〜約75℃、約30〜約70℃、約30〜約65℃、約30〜約60℃、約30〜約55℃、約30〜約50℃、約40〜約85℃、約40〜約80℃、約40〜約75℃、約40〜約70℃、約40〜約65℃、約40〜約60℃、約40〜約55℃、約40〜約50℃、約50〜約85℃、約50〜約80℃、約50〜約75℃、約50〜約70℃、約50〜約65℃、約50〜約60℃、約50〜約55℃、約52〜約60℃、約52〜約58℃、約52〜約56℃、または約52〜約54℃である。
プライマーの長さを5’末端または3’末端で伸ばすか、または短くすることにより、所望の融解温度をもつプライマーを製造することができる。プライマー対のプライマーの一方は、他方のプライマーより長いものであり得る。プライマーの3’アニーリング長は、プライマー対内で異なり得る。また、各プライマー対のアニーリング位置は、プライマー対の配列および長さが所望の融解温度をもたらすように設計され得る。25塩基対より小さいプライマーの融解温度を求める等式は、Wallace法則(Td=2(A+T)+4(G+C))である。また、限定される訳ではないが、Array Designer Software(Arrayit Inc.)、Oligonucleotide Probe Sequence Design Software for Genetic Analysis(Olympus Optical Co.)、NetPrimer、およびDNAsis(Hitachi Software Engineering製)を含む、コンピュータプログラムを用いてプライマーを設計することもできる。各プライマーのTM(融解またはアニーリング温度)は、Net Primer(http://www.premierbiosoft.com/netprimer/index.htmlでの無料ウェブに基づくプログラム)などのソフトウェアプログラムを用いて計算され得る。限定される訳ではないが、約サイクル1、2、3、4、5、約サイクル6〜約サイクル10、約サイクル10〜約サイクル15、約サイクル15〜約サイクル20、約サイクル20〜約サイクル25、約サイクル25〜約サイクル30、約サイクル30〜約サイクル35、または約サイクル35〜約サイクル40を含む、何サイクルかの増幅の後、プライマーのアニーリング温度を再計算して増加させることができる。最初の増幅サイクル後、プライマーの5’半分は、興味の対象である各遺伝子座からの生成物に組み込まれ得、したがって、TMは、各プライマーの5’半分および3’半分の両配列に基づいて再計算され得る。
限定される訳ではないが、約サイクル1、2、3、4、5、約サイクル6〜約サイクル10、約サイクル10〜約サイクル15、約サイクル15〜約サイクル20、約サイクル20〜約サイクル25、約サイクル25〜約サイクル30、約サイクル30〜約サイクル35、または約サイクル35〜約サイクル40を含む、何サイクルかの増幅の後、プライマーのアニーリング温度を再計算し、増加させることができる。最初の増幅サイクル後、プライマーの5’半分は、興味の対象である各遺伝子座からの生成物に組み込まれ得、したがって、TMは、各プライマーの5’半分および3’半分の両配列に基づいて再計算され得る。
「相補的な」は、配列の全体または一部分のみに対する相補性を指し得る。特異的オリゴヌクレオチドプライマーのハイブリダイゼーション可能な配列におけるヌクレオチドの数は、そのオリゴヌクレオチドプライマーのハイブリダイゼーションに使用されるストリンジェンシー条件が過度のランダムな非特異的ハイブリダイゼーションを阻害することになるようなものとするべきである。通常、オリゴヌクレオチドプライマーのハイブリダイゼーション部分におけるヌクレオチドの数は、そのオリゴヌクレオチドプライマーがハイブリダイズさせる標的ポリヌクレオチド上の規定された配列と少なくとも同じ大きさ、すなわち、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも約20ヌクレオチド、および一般的には約6〜約10または6〜約12または(of)12〜約200ヌクレオチド、通常約10〜約50ヌクレオチドとなる。標的ポリヌクレオチドは、先に記載したオリゴヌクレオチドプライマー(複数も可)より大きいものであり得る。
場合によっては、標的ポリヌクレオチド配列の同一性は既知であり、ハイブリダイゼーション可能なプライマーは、正確に前述の標的ポリヌクレオチド配列のアンチセンス配列にしたがって合成され得る。他の場合において、標的ポリヌクレオチド配列が未知であるとき、オリゴヌクレオチドプライマーのハイブリダイゼーション可能な配列はランダム配列であり得る。ランダム配列を含むオリゴヌクレオチドプライマーは、以下に記載するように「ランダムプライマー」と称され得る。さらに他の場合において、第1プライマーまたは第2プライマーなどのオリゴヌクレオチドプライマーは、例えば第1プライマーのセットまたは第2プライマーのセットなど、プライマーのセットを含む。場合によっては、第1プライマーまたは第2プライマーのセットは、複数(例、約2、3、4、6、8、10、20、40、80、100、125、150、200、250、300、400、500、600、800、1000、1500、2000、2500、3000、4000、5000、6000、7000、8000、10,000、20,000、または25,000、前記列挙の数値より多い数値、前記列挙の数値より少ない数値、または少なくとも前記列挙の数値)の標的配列とハイブリダイズさせるように設計されたプライマーの混合物を含み得る。場合によっては、この複数の標的配列は、1群の関連配列、ランダム配列、全トランスクリプトームまたはその画分(例、実質的画分)、またはmRNAなどの配列の任意の群を含み得る。本明細書で提供される方法で使用するためのプライマーは、それぞれ表3および表4で列挙した第1アダプター配列および第2アダプター配列に対して指向している、表1および表2に列挙したプライマーのいずれかであり得る。
「アダプター」の語は、興味の対象である標的ポリヌクレオチドまたは標的ポリヌクレオチド鎖へのそのライゲーションにより、興味の対象である標的ポリヌクレオチドまたは標的ポリヌクレオチド鎖の即増幅可能な生成物の生成を可能にする、既知配列のオリゴヌクレオチドを指し得る。様々なアダプター設計が使用され得る。好適なアダプター分子としては、1本鎖または2本鎖核酸(DNA、RNAまたはその組み合わせ)分子またはその誘導体、ステムループ核酸分子、1、2、3、4、5、6、7、8、9、10塩基またはそれより長い1つまたはそれより多くの1本鎖オーバーハングを含む2本鎖分子、タンパク質、ペプチド、アプタマー、有機分子、小有機分子、または2本鎖核酸フラグメントに、例えばライゲーションなどにより、共有結合的または非共有結合的に結合され得る当業界で既知の任意のアダプター分子がある。アダプターは、2本鎖核酸(またはオーバーハングを伴う2本鎖核酸)生成物にライゲーションされ得る2本鎖部分を含むように設計され得る。
アダプターオリゴヌクレオチドは、少なくともそれらを構成する1つまたはそれより多くの配列エレメントを受け入れるのに十分である、任意の好適な長さを有し得る。一部の場合には、アダプターは、約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、90、100、200またはそれより多くのヌクレオチド長、約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、90、100、200またはそれより多いよりも少ないヌクレオチド長、または約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、90、100、200またはそれより多いよりも多いヌクレオチド長である。一部の場合には、アダプターは、ステムループまたはヘアピンアダプターであり、ヘアピンアダプターのステムは、約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、75、100またはそれより多くのヌクレオチド長、約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、75、100またはそれより多いよりも少ないヌクレオチド長、または約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、75、100またはそれより多いよりも多いヌクレオチド長である。ステムは、ヘアピンアダプター上の相補的領域間にハイブリダイゼーションをもたらす様々な異なる配列を用いて設計され得、2本鎖DNAの局所領域がもたらされ得る。例えば、均等なG:CおよびA:T塩基対を表す15〜18ヌクレオチド長であるステム配列が使用され得る。かかるステム配列は、それらの予測された融解温度約45℃を下回る温度で安定したdsDNA構造を形成すると予測される。ヘアピンのステムに加わる配列は、ワトソン−クリック塩基対合規則にしたがってステムにおける1領域の各塩基がステムにおける他領域の各塩基と水素結合を介してハイブリダイズさせるように、完全に相補的であり得る。別法として、ステムにおける配列は、完全な相補性から逸脱することがある。例えば、ワトソン−クリック塩基対合規則に従わない対向塩基により作製されたステム構造内には誤対合および・またはバルジがあり得、および/または、ステムの1領域には、ステムに加わっている他領域における1つまたはそれより多くの対応する塩基位置を有しない1つまたはそれより多くのヌクレオチドがあり得る。誤対合配列は、誤対合を認識する酵素を用いて開裂され得る。ヘアピンのステムは、DNA、RNA、またはDNAおよびRNAの両方を含み得る。場合によっては、ヘアピンのステムおよび/またはループ、またはヘアピンのステムを形成するハイブリダイゼーション可能な配列の一方または両方が、例えば、限定される訳ではないが、エンドヌクレアーゼおよびグリコシラーゼを含む酵素による開裂についての基質であるヌクレオチド、結合、または配列を含むこともある。ステムの組成は、ステムを形成するハイブリダイゼーション可能な配列の1つのみが開裂されるように決定され得る。例えば、リボヌクレアーゼHなど、RNA−DNAデュプレックスにおけるRNAを開裂する酵素による開裂により、RNAを含む配列のみが開裂されるように、ステムを形成する配列の1つはRNAを含み得、ステムを形成する他の配列はDNAから成る。ヘアピンのステムおよび/またはループの一方の鎖または両方の鎖は、約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20、前記列挙の数値より多い数値、前記列挙の数値より少ない数値、または少なくとも前記列挙の数値の非カノニカルヌクレオチド(例、ウラシル)、および/またはメチル化ヌクレオチドを含み得る。一部の場合には、ヘアピンアダプターのループ配列は、約5、10、15、20、25、30、35、40、45、50またはそれより多くのヌクレオチド長、約5、10、15、20、25、30、35、40、45、50またはそれより多いよりも少ないヌクレオチド長、または約5、10、15、20、25、30、35、40、45、50またはそれより多いよりも多いヌクレオチド長である。
アダプターは、共有結合で連結された少なくとも2つのヌクレオチドを含み得る。本明細書で使用されるアダプターは、ホスホジエステル結合を含み得るが、場合によっては、下記で概説するように、例えば、ホスホルアミド(Beaucageら、Tetrahedron 49(10):1925(1993)およびそこに出てくる参考文献、Letsinger,J.Org.Chem.35:3800(1970)、Sprinzlら、Eur.J.Biochem.81:579(1977)、Letsingerら、Nucl.Acids Res.14:3487(1986)、Sawaiら、Chem.Lett.805(1984)、Letsingerら、J.Am.Chem.Soc.110:4470(1988)およびPauwelsら、Chemica Scripta 26:141 91986))、ホスホロチオエート(Magら、Nucleic Acids Res.19:1437(1991)および米国特許第5,644,048号)、ホスホロジチオエート(Briuら、J.Am.Chem.Soc.111:2321(1989))、O−メチルホスホロアミダイト連結(Eckstein、Oligonucleotides and Analogues:A Practical Approach、Oxford University Pressを参照)、およびペプチド核酸(本明細書では「PNA」とも称す)バックボーンおよび連結(Egholm,J.Am.Chem.Soc.114:1895(1992)、Meierら、Chem.Int.Ed.Engl.31:1008(1992)、Nielsen,Nature,365:566(1993)、Carlssonら、Nature 380:207(1996)を参照、これらについては、出典明示で援用する)を含む、代替的バックボーンを有し得る核酸類似体も含まれる。他の類似体核酸には、ロックト核酸(本明細書では「LNA」とも称す)を含む二環式構造を有するもの(Koshkinら、J.Am.Chem.Soc.120.13252 3(1998))、正のバックボーンを有するもの(Denpcyら、Proc.Natl.Acad.Sci.USA 92:6097(1995))、非イオン性バックボーンを有するもの(米国特許第5,386,023,5,637,684,5,602,240,5,216,141および4,469,863号、Kiedrowshiら、Angew.Chem.Intl.Ed.English 30:423(1991)、Letsingerら、J.Am.Chem.Soc.110:4470(1988)、Letsingerら、Nucleoside & Nucleotide 13:1597(1994)、第2および3章、ASC Symposium Series 580,“Carbohydrate Modifications in Antisense Research”、Y.S.SanghuiおよびP.Dan Cook編、Mesmaekerら、Bioorganic & Medicinal Chem.Lett.4:395(1994)、Jeffsら、J.Biomolecular NMR 34:17(1994)、Tetrahedron Lett.37:743(1996))ならびに、米国特許第5,235,033および5,034,506号、ならびに第6および7章、ASC Symposium Series 580,“Carbohydrate Modifications in Antisense Research”,Y.S.SanghuiおよびP.Dan Cook編、に記載されたものを含む、非リボースバックボーンを有するものがある。また、1つまたはそれより多くの炭素環状糖を含む核酸も、核酸の定義内に含まれる(Jenkinsら、Chem.Soc.Rev.(1995)pp169 176を参照)。幾つかの核酸類似体は、Rawls、C & E News 1997年6月2日号35頁に記載されている。「ロックト核酸」もまた、核酸類似体の定義の範囲内に含まれる。LNAは、リボース環が2’−O原子を4’−C原子と連結するメチレン架橋により「ロックされた」核酸類似体の1つのクラスである。これらの参考文献は全て、出典明示により援用する。リボース−リン酸バックボーンのこれらの修飾を行うことにより、生理学的環境における上記分子の安定性および半減期を増加させることができる。例えば、PNA:DNAおよびLNA−DNAハイブリッドは、さらに高い安定性を呈し得るため、場合によっては使用されることもあり得る。アダプターは、明記したように1本鎖状または2本鎖状であり得、または2本鎖配列や1本鎖配列の両方の部分を含み得る。適用法によって、アダプターは、DNA、RNAまたはハイブリッドであり得、この場合、アダプターは、デオキシリボヌクレオチドおよびリボヌクレオチドの任意の組み合わせ、およびウラシル、アデニン、チミン、シトシン、グアニン、イノシン、キサンチン(xathanine)、ヒポキサンチン(hypoxathanine)、イソシトシン、イソグアニンなどを含む、塩基の任意の組み合わせを含む。
図2で説明するように、本明細書で提供される第1アダプターは、3’オーバーハングを含む2本鎖核酸または1本鎖核酸であり得る。図2のIで示すように、第1アダプターは、2つのオリゴヌクレオチド間の部分的デュプレックスを含み、第1のオリゴヌクレオチドは、5’末端に既知配列Aおよび3’オーバーハングを含む長鎖を含み、第2のオリゴヌクレオチドは、3’末端に配列Aと相補的な配列、A’を含む短鎖を含む。図2のIにおける短鎖は、さらに3’末端および5’末端にブロックを含み、これがライゲーションを阻害する役割を果たし得る。場合によっては、長鎖が5’末端にブロックを含むこともあり、それによりライゲーションが阻害される。図2のIIで示すように、第1アダプターは1本鎖オリゴヌクレオチドを含み、そのオリゴヌクレオチドの5’末端は、オリゴヌクレオチドの3’末端付近に位置する既知配列Aに結合し、5’末端は、配列Aに相補的な配列、A’を含み、その結合により3’オーバーハングが生成される。図2のIIにおける1本鎖オリゴヌクレオチドアダプターの5’末端および3’末端は、リンカーを通して連結され得る。このリンカーは、ステムループ、非ヌクレオチドリンカー、またはその組み合わせであり得る。ステムループは、DNA、RNA、ヌクレオチド類似体、またはその組み合わせを含み得る。図2のIIにおける1本鎖オリゴヌクレオチドアダプターの5’末端は5’ブロックを含み得、これがライゲーションを阻害し得る。有用な第2アダプターのための様々な構築物が予想される。本明細書で提供される定方向性ポリヌクレオチドライブラリを製造するための方法を実施するのに有用な第2アダプターは、本明細書で提供される方法により製造されたdsDNA生成物の末端へのライゲーションに好適な1末端をもつdsDNA、部分的デュプレックスまたはステムループアダプターなどであり得る。場合によっては、第2アダプターは、2つのオリゴヌクレオチド間に部分的デュプレックスを含むこともあり、この場合、第1のオリゴヌクレオチドは、既知配列、Bを含む長鎖を含み、第2のオリゴヌクレオチドは、配列Bの一部分と相補的な配列、B’を含む短鎖を含み、長鎖および短鎖間の結合により、3’オーバーハングが生成する。第2アダプターの短鎖は、さらに3’末端および/または5’末端にブロックを含み得、これがライゲーションを阻害する役割を果たし得る。長鎖の3’末端は、3’末端にブロックを含み得る。場合によっては、第2アダプターは、2つのオリゴヌクレオチド間に部分的デュプレックスを含むこともあり、この場合、第1のオリゴヌクレオチドは、既知配列、Bを含む長鎖を含み、第2のオリゴヌクレオチドは、配列Bの一部分と相補的な配列、B’を含む短鎖を含み、長鎖および短鎖間の結合により、5’オーバーハングが生成する。第2アダプターの短鎖は、さらに5’末端にブロックを含み得、これがライゲーションを阻害する役割を果たし得る。長鎖の3’末端および/または5’末端はブロックを含み得、これがライゲーションを阻害し得る。本明細書で提供される任意のアダプターにおけるブロックは、本明細書で提供されるブロックの何れであってもよい。本明細書で提供される方法において使用するためのアダプターは、表3および表4に列挙した第1アダプターおよび/または第2アダプターの何れであってもよい。
様々なライゲーションプロセスおよび試薬が当業界では既知であり、本明細書で提供される方法の実施に有用であり得る。例えば、平滑末端ライゲーションが使用され得る。同様に、単一dAヌクレオチドは、3’エキソヌクレアーゼ活性を欠くポリメラーゼにより2本鎖DNA生成物の3’末端に付加され得、dTオーバーハングを含むアダプターにアニーリングし得る(またはこの逆)。この設計により、ハイブリダイズされた成分を続いて(例、T4 DNAリガーゼにより)ライゲーションさせることが可能となる。他のライゲーション戦略および対応する試薬は当業界では既知であり、有効なライゲーション反応を実施するためのキットおよび試薬は市販されている(例、New England Biolabs、Rocheから)。
VII.ブロッキング基
本明細書で提供される要領で定方向性ポリヌクレオチドライブラリを生成するための方法で使用されるアダプターおよび/またはプライマーはいずれも、5’末端および/または3’末端にブロッキング基を含み得る。デュプレックスまたは部分的デュプレックスを含むアダプターおよび/またはプライマーは、デュプレックスまたは部分的デュプレックスを形成する一方または両方の鎖の5’末端および/または3’末端にブロックを含み得る。本明細書で提供されるアダプターまたはプライマーのいずれにおいてもブロックされた末端は、酵素的に非反応性となり得るためアダプター二量体形成および/またはライゲーションを阻止することができる。ブロッキング基は、ジデオキシヌクレオチド(ddCMP、ddAMP、ddTMP、またはddGMP)、様々な修飾ヌクレオチド(例、ホスホロチオエート修飾ヌクレオチド)、または非ヌクレオチド化学的部分であり得る。場合によっては、ブロッキング基は、ブロッキング部分を含むヌクレオチド類似体を含むこともある。ブロッキング部分は、ヌクレオチド類似体が第2のヌクレオチドまたはヌクレオチド類似体と共有連結を形成するのを阻害または阻止するヌクレオチド類似体の一部を意味し得る。例えば、ペントース部分を有するヌクレオチド類似体の場合、可逆性のブロッキング部分は、ヌクレオチドの3’酸素と第2ヌクレオチドの5’リン酸間におけるホスホジエステル結合の形成を阻止し得る。可逆性ブロッキング部分としては、ホスフェート、ホスホジエステル、ホスホトリエステル、チオリン酸エステルおよび炭素エステルを挙げることができる。場合によっては、ブロッキング部分は、ヌクレオチド類似体のペントース部分の3’位または2’位に結合され得る。可逆性ブロッキング部分は、脱ブロッキング剤で除去され得る。5’末端および/または3’末端にあるブロッキング基は、スペーサー(C3ホスホロアミダイト、トリエチレングリコール(TEG)、光開裂性ヘキサエチレングリコール)、逆方向ジデオキシ−T、ビオチン、チオール、ジチオール、ヘキサンジオール、ジゴキシゲニン、アジド、アルキン、またはアミノ修飾因子であり得る。ビオチンブロッキング基は、光開裂性ビオチン、ビオチン−トリエチレングリコール(TEG)、ビオチン−dT、デスチオビオチン−TEG、ビオチン−アジド、またはデュアルビオチンであり得る。5’末端におけるブロックは、5’リン酸を欠く5’末端でのヌクレオチドを含み得る。5’末端は、酵素での処理により除去され得る。酵素はホスファターゼであり得る。3’末端におけるブロックは、遊離3’ヒドロキシルを欠くヌクレオチドを含み得る。末端(すなわち、5’末端および/または3’末端)はさらにホスホチオエート結合を含み得る。ホスホチオエート結合は、ホスホチオエート結合を含む任意のアダプターまたはプライマーを保護する役割を果たし得る。この保護はヌクレアーゼ分解からであり得る。
本明細書で提供される要領で定方向性ポリヌクレオチドライブラリを生成するための方法で使用されるアダプターおよび/またはプライマーはいずれも、5’末端および/または3’末端にブロッキング基を含み得る。デュプレックスまたは部分的デュプレックスを含むアダプターおよび/またはプライマーは、デュプレックスまたは部分的デュプレックスを形成する一方または両方の鎖の5’末端および/または3’末端にブロックを含み得る。本明細書で提供されるアダプターまたはプライマーのいずれにおいてもブロックされた末端は、酵素的に非反応性となり得るためアダプター二量体形成および/またはライゲーションを阻止することができる。ブロッキング基は、ジデオキシヌクレオチド(ddCMP、ddAMP、ddTMP、またはddGMP)、様々な修飾ヌクレオチド(例、ホスホロチオエート修飾ヌクレオチド)、または非ヌクレオチド化学的部分であり得る。場合によっては、ブロッキング基は、ブロッキング部分を含むヌクレオチド類似体を含むこともある。ブロッキング部分は、ヌクレオチド類似体が第2のヌクレオチドまたはヌクレオチド類似体と共有連結を形成するのを阻害または阻止するヌクレオチド類似体の一部を意味し得る。例えば、ペントース部分を有するヌクレオチド類似体の場合、可逆性のブロッキング部分は、ヌクレオチドの3’酸素と第2ヌクレオチドの5’リン酸間におけるホスホジエステル結合の形成を阻止し得る。可逆性ブロッキング部分としては、ホスフェート、ホスホジエステル、ホスホトリエステル、チオリン酸エステルおよび炭素エステルを挙げることができる。場合によっては、ブロッキング部分は、ヌクレオチド類似体のペントース部分の3’位または2’位に結合され得る。可逆性ブロッキング部分は、脱ブロッキング剤で除去され得る。5’末端および/または3’末端にあるブロッキング基は、スペーサー(C3ホスホロアミダイト、トリエチレングリコール(TEG)、光開裂性ヘキサエチレングリコール)、逆方向ジデオキシ−T、ビオチン、チオール、ジチオール、ヘキサンジオール、ジゴキシゲニン、アジド、アルキン、またはアミノ修飾因子であり得る。ビオチンブロッキング基は、光開裂性ビオチン、ビオチン−トリエチレングリコール(TEG)、ビオチン−dT、デスチオビオチン−TEG、ビオチン−アジド、またはデュアルビオチンであり得る。5’末端におけるブロックは、5’リン酸を欠く5’末端でのヌクレオチドを含み得る。5’末端は、酵素での処理により除去され得る。酵素はホスファターゼであり得る。3’末端におけるブロックは、遊離3’ヒドロキシルを欠くヌクレオチドを含み得る。末端(すなわち、5’末端および/または3’末端)はさらにホスホチオエート結合を含み得る。ホスホチオエート結合は、ホスホチオエート結合を含む任意のアダプターまたはプライマーを保護する役割を果たし得る。この保護はヌクレアーゼ分解からであり得る。
VIII.RNA依存的DNAポリメラーゼ
本明細書で提供される方法および組成物で使用するためのRNA依存的DNAポリメラーゼは、本明細書で提供される方法にしたがってプライマーの伸長を実施することができるものであり得る。したがって、RNA依存的DNAポリメラーゼは、少なくとも大部分はリボヌクレオチドから成る核酸鋳型に沿って核酸プライマーを伸長させることができるものであり得る。本明細書で提供される方法、組成物およびキットでの使用に好適なRNA依存的DNAポリメラーゼには、逆転写酵素(RT)が含まれる。RTは、当業界ではよく知られている。RTの例としては、限定される訳ではないが、モロニーネズミ白血病ウイルス(M−MLV)逆転写酵素、ヒト免疫不全ウイルス(HIV)逆転写酵素、ラウス肉腫ウイルス(RSV)逆転写酵素、トリ骨髄芽球症ウイルス(AMV)逆転写酵素、ラウス関連ウイルス(RAV)逆転写酵素、および骨髄芽球症関連ウイルス(MAV)逆転写酵素または他のトリ肉腫−白血病ウイルス(ASLV)逆転写酵素、ならびにそこから誘導される修飾RTがある。例えば、米国特許第7056716号を参照。多くの逆転写酵素、例えばトリ骨髄芽球症ウイルス由来の逆転写酵素(AMV−RT)、およびモロニーネズミ白血病ウイルス由来の逆転写酵素(MMLV−RT)などは、複数の活性(例えば、ポリメラーゼ活性およびリボヌクレアーゼ活性)を含み、2本鎖cDNA分子の形成において機能し得る。しかしながら、場合によっては、リボヌクレアーゼH活性を欠くか、または実質的に低減させたRTを使用することが好ましいこともある。リボヌクレアーゼH活性を欠くRTは当業界では既知であり、突然変異によりリボヌクレアーゼH活性が排除されている野生型逆転写酵素の突然変異を含むものが含まれる。リボヌクレアーゼH活性が低減されたRTの例は、例えば米国特許出願公開第20100203597号に記載されている。これらの場合において、大腸菌から単離されたものなど、他の供給源からのリボヌクレアーゼHの添加は、出発RNA試料の分解および2本鎖cDNAの形成に使用され得る。また、異なる非突然変異体RTの組み合わせ、異なる突然変異体RTの組み合わせ、および1つまたはそれより多くの非突然変異体RTと1つまたはそれより多くの突然変異体RTの組み合わせを含む、RTの組み合わせも考えられ得る。
本明細書で提供される方法および組成物で使用するためのRNA依存的DNAポリメラーゼは、本明細書で提供される方法にしたがってプライマーの伸長を実施することができるものであり得る。したがって、RNA依存的DNAポリメラーゼは、少なくとも大部分はリボヌクレオチドから成る核酸鋳型に沿って核酸プライマーを伸長させることができるものであり得る。本明細書で提供される方法、組成物およびキットでの使用に好適なRNA依存的DNAポリメラーゼには、逆転写酵素(RT)が含まれる。RTは、当業界ではよく知られている。RTの例としては、限定される訳ではないが、モロニーネズミ白血病ウイルス(M−MLV)逆転写酵素、ヒト免疫不全ウイルス(HIV)逆転写酵素、ラウス肉腫ウイルス(RSV)逆転写酵素、トリ骨髄芽球症ウイルス(AMV)逆転写酵素、ラウス関連ウイルス(RAV)逆転写酵素、および骨髄芽球症関連ウイルス(MAV)逆転写酵素または他のトリ肉腫−白血病ウイルス(ASLV)逆転写酵素、ならびにそこから誘導される修飾RTがある。例えば、米国特許第7056716号を参照。多くの逆転写酵素、例えばトリ骨髄芽球症ウイルス由来の逆転写酵素(AMV−RT)、およびモロニーネズミ白血病ウイルス由来の逆転写酵素(MMLV−RT)などは、複数の活性(例えば、ポリメラーゼ活性およびリボヌクレアーゼ活性)を含み、2本鎖cDNA分子の形成において機能し得る。しかしながら、場合によっては、リボヌクレアーゼH活性を欠くか、または実質的に低減させたRTを使用することが好ましいこともある。リボヌクレアーゼH活性を欠くRTは当業界では既知であり、突然変異によりリボヌクレアーゼH活性が排除されている野生型逆転写酵素の突然変異を含むものが含まれる。リボヌクレアーゼH活性が低減されたRTの例は、例えば米国特許出願公開第20100203597号に記載されている。これらの場合において、大腸菌から単離されたものなど、他の供給源からのリボヌクレアーゼHの添加は、出発RNA試料の分解および2本鎖cDNAの形成に使用され得る。また、異なる非突然変異体RTの組み合わせ、異なる突然変異体RTの組み合わせ、および1つまたはそれより多くの非突然変異体RTと1つまたはそれより多くの突然変異体RTの組み合わせを含む、RTの組み合わせも考えられ得る。
IX.DNA依存的DNAポリメラーゼ
本明細書で提供される方法および組成物で使用するためのDNA依存的DNAポリメラーゼは、遊離3’ヒドロキシルを含む核酸の伸長を実施することができるものであり得る。遊離3’ヒドロキシルを含む核酸は、本明細書で提供されるプライマーおよび/またはアダプター上にあり得る。遊離3’ヒドロキシルを含む核酸は、ニッキング酵素によるdsDNA(例、ゲノムDNA)の処理により生成されるdsDNA(例、ゲノムDNA)の鎖上にあり得る。DNA依存的DNAポリメラーゼは、RNA鋳型の存在下またはRNA鋳型の選択的除去後、第1鎖cDNAに沿って遊離3’OHを伸長させることができるものであり得る。本明細書で提供される方法に好適なDNA依存的DNAポリメラーゼの例としては、限定される訳ではないが、3’−エキソヌクレアーゼを伴うかまたは伴わないKlenowポリメラーゼ、Bst DNAポリメラーゼ、Bcaポリメラーゼ、.phi.29 DNAポリメラーゼ、Ventポリメラーゼ、Deep Ventポリメラーゼ、Taqポリメラーゼ、T4ポリメラーゼ、および大腸菌DNAポリメラーゼ1、その誘導体、またはポリメラーゼの混合物がある。場合によっては、ポリメラーゼは、5’−エキソヌクレアーゼ活性を含まないこともある。他の場合には、ポリメラーゼは、5’−エキソヌクレアーゼ活性を含むこともある。場合によっては、遊離3’OHの伸長は、例えば、Bstポリメラーゼなど、強い鎖置換活性を含むポリメラーゼを用いて実施され得る。他の場合には、遊離3’OHの伸長は、弱い鎖置換活性を含むかまたは鎖置換活性を含まないポリメラーゼを用いて実施され得る。当業者であれば、本明細書で提供される方法における任意の伸長工程中における鎖置換活性の使用の利点および不利点、およびどのポリメラーゼが鎖置換活性を提供すると予測され得るかを認識できる(例、New England Biolabs Polymerasesを参照)。例えば、鎖置換活性は、ランダムプライミングおよび伸長工程中における全トランスクリプトーム適用範囲を確保するか、またはニッキング酵素によるゲノムDNAの処理後の伸長工程中における全ゲノム適用範囲を確保するのに有用であり得る。
本明細書で提供される方法および組成物で使用するためのDNA依存的DNAポリメラーゼは、遊離3’ヒドロキシルを含む核酸の伸長を実施することができるものであり得る。遊離3’ヒドロキシルを含む核酸は、本明細書で提供されるプライマーおよび/またはアダプター上にあり得る。遊離3’ヒドロキシルを含む核酸は、ニッキング酵素によるdsDNA(例、ゲノムDNA)の処理により生成されるdsDNA(例、ゲノムDNA)の鎖上にあり得る。DNA依存的DNAポリメラーゼは、RNA鋳型の存在下またはRNA鋳型の選択的除去後、第1鎖cDNAに沿って遊離3’OHを伸長させることができるものであり得る。本明細書で提供される方法に好適なDNA依存的DNAポリメラーゼの例としては、限定される訳ではないが、3’−エキソヌクレアーゼを伴うかまたは伴わないKlenowポリメラーゼ、Bst DNAポリメラーゼ、Bcaポリメラーゼ、.phi.29 DNAポリメラーゼ、Ventポリメラーゼ、Deep Ventポリメラーゼ、Taqポリメラーゼ、T4ポリメラーゼ、および大腸菌DNAポリメラーゼ1、その誘導体、またはポリメラーゼの混合物がある。場合によっては、ポリメラーゼは、5’−エキソヌクレアーゼ活性を含まないこともある。他の場合には、ポリメラーゼは、5’−エキソヌクレアーゼ活性を含むこともある。場合によっては、遊離3’OHの伸長は、例えば、Bstポリメラーゼなど、強い鎖置換活性を含むポリメラーゼを用いて実施され得る。他の場合には、遊離3’OHの伸長は、弱い鎖置換活性を含むかまたは鎖置換活性を含まないポリメラーゼを用いて実施され得る。当業者であれば、本明細書で提供される方法における任意の伸長工程中における鎖置換活性の使用の利点および不利点、およびどのポリメラーゼが鎖置換活性を提供すると予測され得るかを認識できる(例、New England Biolabs Polymerasesを参照)。例えば、鎖置換活性は、ランダムプライミングおよび伸長工程中における全トランスクリプトーム適用範囲を確保するか、またはニッキング酵素によるゲノムDNAの処理後の伸長工程中における全ゲノム適用範囲を確保するのに有用であり得る。
場合によっては、本明細書記載の方法により生成された2本鎖生成物またはフラグメントを末端修復することにより、本明細書記載のアダプターライゲーション適用のための平滑末端を作製することができる。2本鎖生成物での平滑末端の生成については、例えばエキソヌクレアーゼ1、エキソヌクレアーゼ7またはその組み合わせなどの1本鎖特異的DNAエキソヌクレアーゼを使用して、2本鎖生成物のオーバーハング状1本鎖末端を分解することにより生成が行われ得る。別法として、2本鎖生成物は、1本鎖特異的DNAエンドヌクレアーゼ、例えば、限定される訳ではないが、緑豆エンドヌクレアーゼまたはS1エンドヌクレアーゼの使用により平滑末端にされ得る。別法として、2本鎖生成物は、1本鎖エキソヌクレアーゼ活性を含むポリメラーゼ、例えばT4 DNAポリメラーゼ、1本鎖エキソヌクレアーゼ活性を含む任意の他のポリメラーゼ、またはその組み合わせを使用して2本鎖生成物またはフラグメントのオーバーハング状1本鎖末端を分解することにより平滑末端にされ得る。場合によっては、1本鎖エキソヌクレアーゼ活性を含むポリメラーゼを、1つまたはそれより多くのdNTPを含むかまたは含まない反応混合物中でインキュベーションしてもよい。他の場合には、1本鎖核酸特異的エキソヌクレアーゼおよび1つまたはそれより多くのポリメラーゼの組み合わせを用いて、伸長反応の2本鎖生成物を平滑末端にすることができる。さらに他の場合には、本明細書で提供される伸長反応の生成物は、2本鎖生成物のオーバーハング状1本鎖末端にフィルイン(filling in)することにより平滑末端状にされ得る。例えば、フラグメントを、1つまたはそれより多くのdNTPの存在下でポリメラーゼ、例えばT4 DNAポリメラーゼまたはKlenowポリメラーゼまたはその組み合わせとインキュベーションすることにより、2本鎖生成物の1本鎖部分にフィルインすることができる。別法として、2本鎖生成物またはフラグメントは、エキソヌクレアーゼおよび/またはポリメラーゼを用いる1本鎖オーバーハング分解反応、および1つまたはそれより多くのdNTPの存在下1つまたはそれより多くのポリメラーゼを用いるフィルイン反応の組み合わせにより平滑化され得る。
別の実施形態において、本明細書記載のアダプターライゲーション適用は、アダプターの1鎖(例、非ライゲーション鎖)と2本鎖生成物またはフラグメントの1鎖の間にギャップを残し得る。これらの場合には、ギャップ修復またはフィルイン反応は、アダプターの他方の鎖(例、ライゲーション鎖)に相補的な配列を伴う2本鎖生成物またはフラグメントの付加に使用され得る。ギャップ修復は、任意の数の本明細書記載のDNA依存的DNAポリメラーゼにより実施され得る。場合によっては、ギャップ修復は、鎖置換活性をもつDNA依存的DNAポリメラーゼにより実施され得る。場合によっては、ギャップ修復は、弱い鎖置換活性をもつかまたは鎖置換活性をもたないDNA依存的DNAポリメラーゼを用いて実施され得る。場合によっては、アダプターのライゲーション鎖は、ギャップ修復またはフィルイン反応についての鋳型としての役割を果たし得る。場合によっては、ギャップ修復は、Taq DNAポリメラーゼを用いて実施され得る。
X.開裂作用因子
本明細書で提供される方法により生成された非カノニカルdNTPを含むポリヌクレオチドの選択的除去または開裂は、ポリヌクレオチドの酵素処理の使用を通して達成され得る。本明細書で提供される方法により生成されたマーキングされた鎖の開裂に使用され得る酵素としては、dUTPの塩基部分を選択的に分解することができるウラシル−N−グリコシラーゼ(UNG)などのグリコシラーゼを挙げることができる。本明細書で提供される1つまたはそれより多くの非カノニカルヌクレオチドおよびそれらの非カノニカルまたは修飾ヌクレオチド基質を含む第1鎖cDNAまたはポリヌクレオチドの生成に使用され得るさらなるグリコシラーゼには、DNAバックボーンから5−メチルシトシン(5−MeC)の塩基部分を開裂することができる5−メチルシトシンDNAグリコシラーゼ(5−MCDG)(Wolffeら、Proc.Nat.Acad.Sci.USA 96:5894−5896,1999)、DNAバックボーンから3−メチルアデノシンの塩基部分を開裂することができる3−メチルアデノシン−DNAグリコシラーゼI(例、Hollisら(2000)Mutation Res.460:201−210を参照)および/またはDNAバックボーンから3−メチルアデノシン、7−メチルグアニン、7−メチルアデノシン、および/3−メチルグアニンの塩基部分を開裂することができる3−メチルアデノシンDNAグリコシラーゼIIがある。McCarthyら(1984)EMBO J.3:545−550を参照。5−MCDGの多官能形態および単官能形態については記載されている。Zhuら、Proc.Natl.Acad.Sci.USA 98:5031−6、2001、Zhuら、Nuc.Acid Res.28:4157−4165、2000およびNeddermannら、J.B.C.271:12767−74、1996(二官能性5−MCDGを記載、VairapandiおよびDuker、Oncogene 13:933−938、1996、Vairapandiら、J.Cell.Biochem.79:249−260、2000(5−MCDG活性を含む単官能性酵素を記載)を参照。場合によっては、5−MCDGは、完全メチル化ポリヌクレオチド部位(例、CpGジヌクレオチド)を優先的に開裂することもあれば、他の場合には、5−MCDGは半メチル化ポリヌクレオチドを優先的に開裂することもある。例えば、単官能性ヒト5−メチルシトシンDNAグリコシラーゼは、完全メチル化CpG部位にあるDNAを特異的に開裂し、半メチル化DNAに対しては比較的不活性であり得る(VairapandiおよびDuker、前出、Vairapandiら、前出)。反対に、雛胚5−メチルシトシンDNAグリコシラーゼは、半メチル化されたメチル化部位に向けられたより大きな活性を有し得る。場合によっては、5−MCDGの活性は、組換え体高CpG RNA、ATP、RNAヘリカーゼ酵素、および増殖細胞核抗原(PCNA)などの副因子で強化(増加または増強)されることもある。米国特許公開第20020197639 A1号を参照。1つまたはそれより多くの作用因子が使用され得る。場合によっては、1つまたはそれより多くの作用因子が同じメチル化ヌクレオチドの塩基部分を開裂することもある。他の場合には、1つまたはそれより多くの作用因子は、異なるメチル化ヌクレオチドの塩基部分を開裂することもある。2つまたはそれより多くの作用因子での処理は連続的または同時であり得る。
本明細書で提供される方法により生成された非カノニカルdNTPを含むポリヌクレオチドの選択的除去または開裂は、ポリヌクレオチドの酵素処理の使用を通して達成され得る。本明細書で提供される方法により生成されたマーキングされた鎖の開裂に使用され得る酵素としては、dUTPの塩基部分を選択的に分解することができるウラシル−N−グリコシラーゼ(UNG)などのグリコシラーゼを挙げることができる。本明細書で提供される1つまたはそれより多くの非カノニカルヌクレオチドおよびそれらの非カノニカルまたは修飾ヌクレオチド基質を含む第1鎖cDNAまたはポリヌクレオチドの生成に使用され得るさらなるグリコシラーゼには、DNAバックボーンから5−メチルシトシン(5−MeC)の塩基部分を開裂することができる5−メチルシトシンDNAグリコシラーゼ(5−MCDG)(Wolffeら、Proc.Nat.Acad.Sci.USA 96:5894−5896,1999)、DNAバックボーンから3−メチルアデノシンの塩基部分を開裂することができる3−メチルアデノシン−DNAグリコシラーゼI(例、Hollisら(2000)Mutation Res.460:201−210を参照)および/またはDNAバックボーンから3−メチルアデノシン、7−メチルグアニン、7−メチルアデノシン、および/3−メチルグアニンの塩基部分を開裂することができる3−メチルアデノシンDNAグリコシラーゼIIがある。McCarthyら(1984)EMBO J.3:545−550を参照。5−MCDGの多官能形態および単官能形態については記載されている。Zhuら、Proc.Natl.Acad.Sci.USA 98:5031−6、2001、Zhuら、Nuc.Acid Res.28:4157−4165、2000およびNeddermannら、J.B.C.271:12767−74、1996(二官能性5−MCDGを記載、VairapandiおよびDuker、Oncogene 13:933−938、1996、Vairapandiら、J.Cell.Biochem.79:249−260、2000(5−MCDG活性を含む単官能性酵素を記載)を参照。場合によっては、5−MCDGは、完全メチル化ポリヌクレオチド部位(例、CpGジヌクレオチド)を優先的に開裂することもあれば、他の場合には、5−MCDGは半メチル化ポリヌクレオチドを優先的に開裂することもある。例えば、単官能性ヒト5−メチルシトシンDNAグリコシラーゼは、完全メチル化CpG部位にあるDNAを特異的に開裂し、半メチル化DNAに対しては比較的不活性であり得る(VairapandiおよびDuker、前出、Vairapandiら、前出)。反対に、雛胚5−メチルシトシンDNAグリコシラーゼは、半メチル化されたメチル化部位に向けられたより大きな活性を有し得る。場合によっては、5−MCDGの活性は、組換え体高CpG RNA、ATP、RNAヘリカーゼ酵素、および増殖細胞核抗原(PCNA)などの副因子で強化(増加または増強)されることもある。米国特許公開第20020197639 A1号を参照。1つまたはそれより多くの作用因子が使用され得る。場合によっては、1つまたはそれより多くの作用因子が同じメチル化ヌクレオチドの塩基部分を開裂することもある。他の場合には、1つまたはそれより多くの作用因子は、異なるメチル化ヌクレオチドの塩基部分を開裂することもある。2つまたはそれより多くの作用因子での処理は連続的または同時であり得る。
場合によって、本明細書で提供される方法により生成された第1鎖cDNAのDNAバックボーンにおける脱塩基部位については、続いて脱塩基部位にあるバックボーンのフラグメント化または開裂が行われ得る。脱塩基部位のバックボーンを開裂することができる好適な作用因子(例えば、酵素、化学物質および/または熱などの反応条件)には、加熱処理および/または化学的処理(塩基性条件、酸性条件、アルキル化条件、または脱塩基部位のアミン介在開裂を含む)(例、McHughおよびKnowland、Nucl.Acids Res.(1995)23(10):1664−1670、Bioorgan.Med.Chem.(1991)7:2351、Sugiyama、Chem.Res.Toxicol.(1994)7:673−83、Horn、Nucl.Acids.Res.(1988)16:11559−71を参照)、および/または脱塩基部位でのポリヌクレオチドの開裂を触媒する酵素の使用がある。例えば、脱塩基部位でのポリヌクレオチドの開裂を触媒する酵素は、APエンドヌクレアーゼ(別名、「脱プリン脱ピリミジン部位エンドヌクレアーゼ」)(例、大腸菌エンドヌクレアーゼIV、ウィスコンシン、マディソンのEpicentre Tech.,Incから入手可能)、大腸菌エンドヌクレアーゼIIIまたはエンドヌクレアーゼIV、カルシウムイオン存在下での大腸菌エキソヌクレアーゼIIIであり得る。例えば、Lindahl,PNAS(1974)71(9):3649−3653、Jendrisak、米国特許第6,190,865 B1号、Shida、Nucleic Acids Res.(1996)24(22):4572−76、Srivastava,J.Biol.Chem.(1998)273(13):21203−209、Carey,Biochem.(1999)38:16553−60、Chem Res Toxicol(1994)7:673−683を参照。本明細書で使用される「作用因子」の語は、加熱などの反応条件を包含する。場合によっては、APエンドヌクレアーゼ(大腸菌エンドヌクレアーゼIV)は、脱塩基部位でのホスホジエステルバックボーンまたはホスホジエステル結合の開裂に使用されることもある。場合によっては、開裂は、N,N’−ジメチルエチレンジアミン(DMED)などのアミンによることもある。例えば、McHughおよびKnowland、前出を参照。
場合によっては、1つまたはそれより多くの脱塩基部位を含むポリヌクレオチド(例、第1鎖cDNA)は、求核基または塩基で処理され得る。場合によっては、求核基は、第1級アミン、第2級アミン、または第3級アミンなどのアミンである。例えば、脱塩基部位は、ピペリジン、モルホリンまたはそれらの組み合わせで処理され得る。場合によっては、熱ピペリジン(例、90℃で1M)を用いて、1つまたはそれより多くの脱塩基部位を含むポリヌクレオチドを開裂し得る。場合によっては、モルホリン(例、37℃または65℃で3M)を用いることにより、1つまたはそれより多くの脱塩基部位を含むポリヌクレオチドを開裂することができる。別法として、ポリアミンを用いて、1つまたはそれより多くの脱塩基部位を含むポリヌクレオチドを開裂することができる。好適なポリアミンには、例えば、スペルミン、スペルミジン、1,4−ジアミノブタン、リシン、トリペプチドK−W−K、DMED、ピペラジン、1,2−エチレンジアミン、またはそれらの任意の組み合わせがある。場合によっては、1つまたはそれより多くの脱塩基部位を含むポリヌクレオチドは、ベータ脱離反応、デルタ脱離反応またはそれらの組み合わせの実施に好適な試薬で処理され得る。場合によっては、本明細書で提供される方法は、カノニカルまたは非修飾ヌクレオチドに影響を及ぼすことがなく、それ故本方法の生成物の配列完全性を維持し得る単一反応混合物における緩やかな条件下での酵素または酵素の組み合わせおよびDMEDなどのポリアミンの使用を提供する。好適な緩やかな条件は、中性pHまたは中性付近のpHでの条件を含み得る。他の好適な条件には、約4.5またはそれより高いpH、5またはそれより高いpH、5.5またはそれより高いpH、6またはそれより高いpH、6.5またはそれより高いpH、7またはそれより高いpH、7.5またはそれより高いpH、8またはそれより高いpH、8.5またはそれより高いpH、9またはそれより高いpH、9.5またはそれより高いpH、10またはそれより高いpH、または約10.5またはそれより高いpHがある。さらに他の好適な条件としては、約4.5〜10.5、約5〜10.0、約5.5〜9.5、約6〜9、約6.5〜8.5、約6.5〜8.0、または約7〜8.0がある。好適な緩やかな条件はまた、室温または室温付近の条件を含み得る。他の好適な条件としては、約10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃、20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、46℃、47℃、48℃、49℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃、61℃、62℃、63℃、64℃、65℃、66℃、67℃、68℃、69℃、または70℃またはそれより高い温度が含まれる。さらに他の好適な条件としては、約10℃〜約70℃、約15℃〜約65℃、約20℃〜約60℃、約20℃〜約55℃、約20℃〜約50℃、約20℃〜約45℃、約20℃〜約40℃、約20℃〜約35℃、または約20℃〜約30℃がある。場合によっては、緩やかな開裂条件の使用により、最終生成物収率が高められ、配列完全性が維持され、または本明細書で提供される方法をより自動化に適したものにし得る。
フラグメント化を含む実施形態では、脱塩基部位を含むポリヌクレオチドのバックボーンは、脱塩基部位で開裂され得、そこでポリヌクレオチドの2つまたはそれより多くのフラグメントが生成され得る。少なくともフラグメントの1つは、本明細書に記載のように、脱塩基部位を含み得る。脱塩基部位のポリヌクレオチドのホスホジエステルバックボーンまたはホスホジエステル結合を開裂する作用因子が、本明細書では提供される。一部の実施形態では、この作用因子は、大腸菌APエンドヌクレアーゼIVなどのAPエンドヌクレアーゼである。他の実施形態では、作用因子はDMEDである。他の実施形態では、作用因子は、熱、塩基性条件、酸性条件、またはアルキル化剤である。さらに他の実施形態では、脱塩基部位のホスホジエステルバックボーンを開裂する作用因子は、ヌクレオチドの塩基部分を開裂して脱塩基部位を形成する作用因子と同じである。例えば、本明細書で提供される方法のグリコシラーゼは、グリコシラーゼ活性およびリアーゼ活性の両方を含み得、そこでグリコシラーゼ活性はヌクレオチド(例、修飾ヌクレオチド)の塩基部分を開裂して脱塩基部位を形成し、リアーゼ活性はこうして形成された脱塩基部位にあるホスホジエステルバックボーンを開裂する。場合によっては、グリコシラーゼが、グリコシラーゼ活性およびAPエンドヌクレアーゼ活性の両方を含むことがある。
脱塩基部位でのバックボーンの開裂に作用することにより、本明細書記載の方法にしたがって3’末端が第1アダプターとハイブリダイゼーションしたときにポリメラーゼにより伸長し得ないブロックされた3’末端を含むフラグメントを生成させ得る作用因子または条件を使用することが望ましいものであり得る。
本明細書で提供される方法にしたがって非カノニカルヌクレオチドまたは修飾ヌクレオチドの塩基部分の開裂を実施するのに適切な反応媒体および条件は、非カノニカルヌクレオチドまたは修飾ヌクレオチドの塩基部分の開裂を可能にするものである。かかる媒体および条件は、当業者には既知であり、様々な出版物、例えば、Lindahl、PNAS(1974)71(9):3649−3653およびJendrisak、米国特許第6,190,865 B1号、米国特許第5,035,996号、および米国特許第5,418,149号に記載されている。一実施形態では、UDG(ウィスコンシン、マディソンのEpicentre Technologies)を、核酸合成反応混合物に添加し、37℃で20分間インキュベーションする。一実施形態では、反応条件は、非カノニカルヌクレオチドまたは修飾ヌクレオチドを含むポリヌクレオチドの合成および非カノニカルヌクレオチドまたは修飾ヌクレオチドの塩基部分の開裂の場合と同じである。別の実施形態では、異なる反応条件が、これらの反応に使用される。一部の実施形態では、ポリメラーゼが開裂生成物の末端を伸長するのを阻止するためにUNGの前または同時にキレート試薬(regent)(例、EDTA)を添加する。
一実施形態では、選択は、合成されたポリヌクレオチドの1鎖への少なくとも1つの修飾ヌクレオチドの組込みにより為され、選択的除去は、その少なくとも1つの修飾ヌクレオチドに対して特異的な活性を呈する酵素での処理により行われる。場合によっては、合成されたポリヌクレオチドの1鎖に組み込まれている修飾ヌクレオチドが、デオキシウリジン三リン酸(dUTP)であり、選択的開裂がUNGにより行われることもある。UNGは、dUTPを選択的に分解する一方で、他のdNTPおよびそれらの類似体に対しては中性である。UNGでの処理により、N−グリコシル結合が開裂され、dU残基の塩基部分が除去され、脱塩基部位が形成される。一実施形態では、UNG処理は、脱プリン/脱ピリミジン部位エンドヌクレアーゼ(APE)の存在下で行われ、脱塩基部位にニックが作製される。したがって、UNG/APEで処理されたdUTPが組み込まれたポリヌクレオチド鎖が開裂され得る。別の場合には、ニック生成および開裂は、DMEDなどのポリアミンでの処理、または加熱処理により達成される。
XI.適用方法
本明細書記載の方法、組成物およびキットは、大規模並列配列決定法(すなわち、次世代配列決定法)またはハイブリダイゼーション・プラットフォームなどのダウンストリーム・アプリケーションのための即増幅可能な生成物を生成するのに有用であり得る。増幅方法は、当業界では周知である。使用され得るPCR技術の例としては、限定される訳ではないが、定量PCR、定量的蛍光PCR(QF−PCR)、マルチプレックス蛍光PCR(MF−PCR)、リアルタイムPCR(RT−PCR)、シングルセルPCR、制限酵素断片長多型PCR(PCR−RFLP)、PCR−RFLP/RT−PCR−RFLP、ホットスタートPCR、ネステッドPCR、in situポロニーPCR、in situローリングサークル増幅(RCA)、ブリッジPCR、ピコタイターPCR、デジタルPCR、ドロップレット・デジタルPCR、およびエマルジョンPCRがある。他の好適な増幅方法には、リガーゼ連鎖反応(LCR)、転写増幅、分子内反転プローブ(MIP)PCR、自家持続配列複製、標的ポリヌクレオチド配列の選択的増幅、共通配列プライムポリメラーゼ連鎖反応(CP−PCR)、任意プライムポリメラーゼ連鎖反応(AP−PCR)、変性オリゴヌクレオチドプライムPCR(DOP−PCR)および核酸に基づく配列増幅(NABSA)、単一プライマー等温増幅(SPIA、例えば、米国特許第6,251,639号を参照)、Ribo−SPIA、またはそれらの組み合わせがある。本発明で使用され得る他の増幅方法には、米国特許第5,242,794、5,494,810、4,988,617および6,582,938号に記載されたものがある。標的核酸の増幅は、ビーズ上で行われ得る。他の実施形態では、増幅はビーズ上では行われない。増幅は、等温増幅、例えば等温線形増幅によるものであり得る。反応をポリメラーゼ添加前に2分間95℃に加熱するか、またはサイクル1における最初の加熱工程までポリメラーゼを不活性状態で保ち得るホットスタートPCRが実施され得る。ホットスタートPCRを用いることにより、非特異的増幅を最小限にすることができる。増幅についての他の戦略および実施態様は、例えば、2010年7月8日に公開された、米国特許公開第2010/0173394 A1号に記載されており、本明細書では出典明示で援用する。場合によっては、増幅方法は、例えば、普通にはcDNA生成のために行われるような、数ラウンドのみの増幅(例、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30など)ですむように限定的条件下で実施され得る。増幅のラウンド数は、約1〜30、1〜20、1〜15、1〜10、5〜30、10〜30、15〜30、20〜30、10〜30、15〜30、20〜30、または25〜30であり得る。
本明細書記載の方法、組成物およびキットは、大規模並列配列決定法(すなわち、次世代配列決定法)またはハイブリダイゼーション・プラットフォームなどのダウンストリーム・アプリケーションのための即増幅可能な生成物を生成するのに有用であり得る。増幅方法は、当業界では周知である。使用され得るPCR技術の例としては、限定される訳ではないが、定量PCR、定量的蛍光PCR(QF−PCR)、マルチプレックス蛍光PCR(MF−PCR)、リアルタイムPCR(RT−PCR)、シングルセルPCR、制限酵素断片長多型PCR(PCR−RFLP)、PCR−RFLP/RT−PCR−RFLP、ホットスタートPCR、ネステッドPCR、in situポロニーPCR、in situローリングサークル増幅(RCA)、ブリッジPCR、ピコタイターPCR、デジタルPCR、ドロップレット・デジタルPCR、およびエマルジョンPCRがある。他の好適な増幅方法には、リガーゼ連鎖反応(LCR)、転写増幅、分子内反転プローブ(MIP)PCR、自家持続配列複製、標的ポリヌクレオチド配列の選択的増幅、共通配列プライムポリメラーゼ連鎖反応(CP−PCR)、任意プライムポリメラーゼ連鎖反応(AP−PCR)、変性オリゴヌクレオチドプライムPCR(DOP−PCR)および核酸に基づく配列増幅(NABSA)、単一プライマー等温増幅(SPIA、例えば、米国特許第6,251,639号を参照)、Ribo−SPIA、またはそれらの組み合わせがある。本発明で使用され得る他の増幅方法には、米国特許第5,242,794、5,494,810、4,988,617および6,582,938号に記載されたものがある。標的核酸の増幅は、ビーズ上で行われ得る。他の実施形態では、増幅はビーズ上では行われない。増幅は、等温増幅、例えば等温線形増幅によるものであり得る。反応をポリメラーゼ添加前に2分間95℃に加熱するか、またはサイクル1における最初の加熱工程までポリメラーゼを不活性状態で保ち得るホットスタートPCRが実施され得る。ホットスタートPCRを用いることにより、非特異的増幅を最小限にすることができる。増幅についての他の戦略および実施態様は、例えば、2010年7月8日に公開された、米国特許公開第2010/0173394 A1号に記載されており、本明細書では出典明示で援用する。場合によっては、増幅方法は、例えば、普通にはcDNA生成のために行われるような、数ラウンドのみの増幅(例、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30など)ですむように限定的条件下で実施され得る。増幅のラウンド数は、約1〜30、1〜20、1〜15、1〜10、5〜30、10〜30、15〜30、20〜30、10〜30、15〜30、20〜30、または25〜30であり得る。
標的および参照配列の増幅技術は、当業界では既知であり、例えば、米国特許第7,048,481号に記載の方法が挙げられる。簡単に述べると、これらの技術は、試料を小滴に分離し、場合によっては、それぞれが各小滴につき平均して約5、4、3、2または1個を下回る標的核酸分子(ポリヌクレオチド)を含有するものとし、各小滴中の核酸配列を増幅し、標的核酸配列の存在を検出することを伴う方法および組成物を含み得る。場合によっては、増幅される配列は、ゲノムDNAそれ自体ではなく、ゲノムDNAに対するプローブ上に存在することもある。場合によっては、少なくとも200、175、150、125、100、90、80、70、60、50、40、30、20、10、または0の小滴の有する標的核酸のコピーが0であることもある。
PCRは、変性、オリゴヌクレオチドプライマーアニーリング、および好熱性鋳型依存的ポリヌクレオチドポリメラーゼによるプライマー伸長の反復サイクルに基づいたインビトロ増幅を伴い得、その結果、プライマーが両側に隣接するポリヌクレオチド分析質の所望の配列コピーが指数的に増加し得る。場合によっては、DNAの反対鎖にアニーリングする2つの異なるPCRプライマーは、一方のプライマーのポリメラーゼ触媒による伸長生成物が他方のための鋳型鎖としての役割を果たし得るように配置され得、長さがオリゴヌクレオチドプライマーの5’末端間の距離により規定される異なる2本鎖フラグメントが蓄積されることになる。
LCRは、前形成された核酸プローブの対を連結させるためにリガーゼ酵素の使用を伴い得る。プローブは、核酸分析質(存在するとすれば)の各相補鎖とハイブリダイゼーションし得、リガーゼは、プローブの各対を一緒に結合するのに使用され得、次サイクルで役割を果たすことにより特定の核酸配列を反復させ得る2つの鋳型が得られる。
SDA(Westinら、2000、Nature Biotechnology、18、199−202、Walkerら、1992、Nucleic Acids Research、20、7、1691−1696)は、HincIIまたはBsoBIなどの制限エンドヌクレアーゼがその認識部位のヘミホスホロチオエート形態の非修飾鎖にニックを入れる能力、およびKlenow exo minusポリメラーゼ、またはBstポリメラーゼなどのエキソヌクレアーゼ欠損DNAポリメラーゼがニックにある3’末端を伸長させ、下流DNA鎖を置き換える能力に基づいた等温増幅を含み得る。指数的増幅は、センス反応から置き換えられた鎖がアンチセンス反応についての標的としての役割を果たす(逆も可能)センスおよびアンチセンス反応のカップリングにより生じる。
本明細書記載の方法の幾つかの実施態様は、核酸またはポリヌクレオチドの線形増幅を使用し得る。線形増幅は、核酸またはポリヌクレオチド分子、通常核酸またはポリヌクレオチド分析質の1鎖のみの相補体の1つまたはそれより多くのコピーの形成を含む方法を指し得る。したがって、線形増幅と指数的増幅間の主な差異は、後者のプロセスでは、生成物がさらなる生成物の形成のための基質としての役割を果たし、前者のプロセスでは、出発配列が生成物の形成のための基質であるが、反応、すなわち、出発鋳型の複製の生成物は生成物の生成のための基質ではないことである。形成される生成物の量が時間の指数関数である指数的増幅とは反対に、線形増幅では、形成される生成物の量は、時間の一次関数として増加する。
場合によっては、増幅は、例えばポリメラーゼ連鎖反応(PCR)によるDNAの特異的2本鎖配列の酵素的増幅では指数的である。他の実施形態では、増幅方法は線形である。他の実施形態では、増幅方法は等温である。
XII.適用法
本明細書で開示された方法および組成物の一実施態様は、それらが、興味の対象である生物材料の損失を最小限に抑えて、次世代配列決定またはハイブリダイゼーション・プラットフォームなどの下流解析に効率的および経済的に使用され得ることである。本明細書記載の方法は、それぞれ全ゲノムまたは全トランスクリプトーム解析のための鋳型DNAまたはRNAからのハイスループット配列決定ライブラリの生成に特に有用であり得る。
本明細書で開示された方法および組成物の一実施態様は、それらが、興味の対象である生物材料の損失を最小限に抑えて、次世代配列決定またはハイブリダイゼーション・プラットフォームなどの下流解析に効率的および経済的に使用され得ることである。本明細書記載の方法は、それぞれ全ゲノムまたは全トランスクリプトーム解析のための鋳型DNAまたはRNAからのハイスループット配列決定ライブラリの生成に特に有用であり得る。
例えば、本明細書記載の方法は、米国特許第5,750,341、6,306,597および5,969,119号に記載されたように、Illuminaにより商品化された方法による配列決定に有用であり得る。定方向性(鎖特異的)核酸ライブラリは、本明細書記載の方法を用いて調製され得、選択された1本鎖核酸は、例えば、PCRにより増幅される。次いで、得られた核酸を変性させ、1本鎖増幅されたポリヌクレオチドを、フローセルチャンネルの内側表面に無作為に結合させ得る。非標識ヌクレオチドを付加して、固相ブリッジ増幅を開始させることにより、2本鎖DNAの稠密なクラスターを製造することができる。第1塩基配列決定サイクルを開始させるため、4つの標識可逆性ターミネータ、プライマーおよびDNAポリメラーゼが添加され得る。レーザー励起後、フローセル上の各クラスターからの蛍光を画像化する。次いで、各クラスターについての第1塩基の同一性を記録する。配列決定サイクルを実施することにより、一度でフラグメント配列1塩基(fragment sequence one base)を決定することができる。
場合によっては、本明細書記載の方法は、Applied Biosystemsにより商品化されたライゲーション方法(例、SOLiDシーケンシング)による配列決定法で配列決定するための標的ポリヌクレオチドの調製に有用であり得る。定方向性(鎖特異的)核酸ライブラリは、本明細書記載の方法を用いて調製され得、次いで、選択された1本鎖核酸は、ポリスチレンビーズと一緒に油中水エマルジョン中に投入され、例えばPCRにより増幅され得る。場合によっては、本明細書で提供される方法のいずれかなど、代替的増幅方法が、油中水エマルジョンで使用され得る。エマルジョンにより形成された各水微小滴中の増幅生成物は、その微小滴中に存在する1つまたはそれより多くのビーズと相互作用、結合またはハイブリダイゼーションし、それにより実質的に1つの配列の複数の増幅生成物を伴うビーズが得られる。エマルジョンが破壊されたとき、ビーズは試料の上部へ浮遊し、アレイへ配列される。本方法は、ビーズに結合した核酸を鎖状または部分的1本鎖状にする工程を含み得る。次いで、配列決定プライマーを、4つの異なる蛍光標識オリゴヌクレオチドプローブの混合物と一緒に加える。このプローブが、配列決定プライマーの直接的な隣接位置および3’の配列決定されるポリヌクレオチドにおける2塩基に特異的に結合することにより、4塩基のどれがそれらの位置にあるかが決定される。洗浄および投入された第1のプローブからの(form)蛍光シグナルの読み取り後、リガーゼを添加する。リガーゼは、オリゴヌクレオチドプローブを第5塩基および第6塩基の間で開裂し、配列決定されるポリヌクレオチドから蛍光染料を除去する。この配列における介入位置が全て画像化されるまで異なる配列プライマーを用いて全プロセスを繰り返す。このプロセスにより、「大規模並列」的に何百万ものDNAフラグメントの同時読み取りが可能となる。この「ライゲーションによる配列決定」技術は、1つだけではなく2塩基をコードするプローブを使用するもので、シグナル誤対合によるエラー認識を可能にするため、塩基決定精度が増すことになる。
他の実施形態では、本方法は、限定される訳ではないが、Marguliesら、Nature(2005)437:376−380(2005)および米国特許第7,244,559、7,335,762、7,211,390、7,244,567、7,264,929、および7,323,305号に記載された方法および装置を含む、454/Roche Life Sciencesにより商品化された方法を用いた合成による配列決定のための標的ポリヌクレオチドの調製に有用である。定方向性(鎖特異的)核酸ライブラリは、本明細書記載の方法を用いて調製され得、選択された1本鎖核酸は、例えばPCRにより増幅され得る。次いで、増幅された生成物は、ビーズに固定化され、PCRによる増幅に好適な油中水エマルジョン中で画分化され得る。場合によっては、例えば本明細書で提供される方法のいずれかなど、PCR以外の代替的増幅方法が、油中水エマルジョンで使用され得る。エマルジョンが破壊されたとき、増幅されたフラグメントは、ビーズに結合したままであり得る。本方法は、ビーズに結合した核酸を1本鎖状または部分的1本鎖状にする工程を含み得る。ビーズは、濃縮され、各ウェルにおおよそ1ビーズがあるように光ファイバースライドのウェルに加えられ得る。ヌクレオチドを、ポリメラーゼ、スルフヒドロラーゼおよびルシフェラーゼの存在下、固定順序でウェル全域およびその中へ流入させ得る。標的鎖に相補的なヌクレオチドの付加により、カメラなどにより記録され得る化学発光シグナルがもたらされ得る。プレート全域で作製されたシグナル強度と位置情報の組み合わせにより、ソフトウェアでDNA配列を決定することが可能となり得る。
他の実施形態では、本方法は、米国特許出願第11/167,046号、および米国特許第7,501,245、7,491,498、7,276,720号、および米国特許出願公開第US20090061439、US20080087826、US20060286566、US20060024711、US20060024678、US20080213770、およびUS20080103058号に記載された、Helicos BioSciences Corporation(マサチューセッツ、ケンブリッジ)により商品化された方法による配列決定のための標的ポリヌクレオチド(複数も可)の調製に有用である。定方向性(鎖特異的)核酸ライブラリは、本明細書記載の方法を用いて調製され得、選択された1本鎖核酸は、例えばPCRにより増幅される。次いで、増幅生成物は、フローセル表面に固定化され得る。本方法は、フローセル表面に結合した核酸を鎖状または部分的1本鎖状にする工程を含み得る。次いで、ポリメラーゼおよび標識ヌクレオチドは、固定化されたDNA全体に流し込まれ得る。蛍光標識ヌクレオチドがDNAポリメラーゼによりDNA鎖に組み込まれた後、表面をレーザーで照明し、画像を捕捉し、処理することにより単一分子組込み事象を記録して配列データを作製することができる。
場合によっては、本明細書記載の方法は、米国特許第7462452、7476504、7405281、7170050、7462468、7476503、7315019、7302146、7313308号および米国特許出願公開第US20090029385、US20090068655、US20090024331およびUS20080206764号に記載された、Pacific Biosciencesにより商品化された方法による配列決定に有用であり得る。定方向性(鎖特異的)核酸ライブラリは、本明細書記載の方法を用いて調製され得、選択された1本鎖核酸は、例えばPCRにより増幅される。次いで、核酸は0モード導波管アレイに固定化され得る。本方法は、導波管アレイに結合した核酸を1本鎖状または部分的1本鎖状にする工程を含み得る。ポリメラーゼおよび標識ヌクレオチドを反応混合物に添加し、ヌクレオチド組込みをヌクレオチドの末端リン酸基に結合された蛍光標識により視覚化することができる。蛍光標識を、ヌクレオチド組込みの一部として切り取ることができる。場合によっては、環状鋳型を用いることにより、単一分子での多数のリードが可能となる。
本明細書記載の方法で使用され得る配列決定技術の別の例は、ナノポア配列決定法である(例、Soni G VおよびMeller A.(2007)Clin Chem 53:1996−2001を参照)。ナノポアは、直径1ナノメートル程度の小さな穴であり得る。導電性流体にナノポアを浸漬し、その全域に電位を適用すると、ナノポアを通るイオンの伝導ゆえに微弱電流が生じ得る。流れる電流の量は、ナノポアのサイズに感受性である。DNA分子がナノポアを通過すると、DNA分子上の各ヌクレオチドは、ナノポアを異なる度合いで塞ぐ。したがって、DNA分子がナノポアを通過するときのナノポアを通る電流の変化が、DNA配列の読み取りを表し得る。
本明細書記載の方法で使用され得る配列決定技術の別の例は、Life TechologyのIon Torrentにより提供される半導体配列決定法である(例、Ion Personal Genome Machine(PGM)を使用する)。Ion Torrent技術は、多層、例えば微細加工ウェルを伴う層、イオン感受性層、およびイオンセンサー層を有する半導体チップを使用し得る。核酸がウェルに導入され得、例えば、単一核酸(nucleic)のクローン集団が単一ビーズに結合され得、ビーズはウェルに導入され得る。ビーズ上の核酸の配列決定を開始するため、1タイプのデオキシリボヌクレオチド(例、dATP、dCTP、dGTP、またはdTTP)がウェルに導入され得る。1つまたはそれより多くのヌクレオチドがDNAポリメラーゼにより組み込まれたとき、プロトン(水素イオン)がウェルで放出され得、これがイオンセンサーにより検出され得る。次いで、半導体チップを洗浄し、このプロセスを異なるデオキシリボヌクレオチドで反復し得る。複数の核酸が、半導体チップのウェルで配列決定され得る。半導体チップは、DNAを配列決定するための化学的感受性電界効果トランジスタ(chemFET)アレイを含み得る(例えば、米国特許出願公開第20090026082号に記載)。配列決定プライマーの3’末端にある新たな核酸鎖への1つまたはそれより多くの三リン酸の組込みは、chemFETによって電流の変化により検出され得る。アレイは、多数のchemFETセンサーを有し得る。
本明細書記載の方法で使用され得る配列決定技術の別の例は、DNAナノボール配列決定法(例えば、Complete Genomicsにより実施されている、例えば、Drmanacら(2010)Science 327:78−81を参照)である。DNAが、単離され、フラグメント化され、サイズ選択され得る。例えば、DNAは、約500bpの平均長に(例、音波処理により)フラグメント化され得る。アダプター(Adl)は、フラグメントの末端に結合され得る。アダプターを用いて、配列決定反応のためのアンカーとのハイブリダイゼーションを行うことができる。アダプターが各末端に結合したDNAが、PCR増幅され得る。アダプター配列は、相補的1本鎖末端が互いに結合して環状DNAを形成するように修飾され得る。DNAは、それを後続工程で使用されるIISタイプ制限酵素による開裂から保護するためにメチル化され得る。アダプター(例、右アダプター)は、制限認識部位を有し得、制限認識部位は非メチル化状態のままであり得る。アダプターにおける非メチル化制限認識部位は、制限酵素(例、Acul)により認識され得、DNAは、右アダプターの右方13bpでAculにより開裂され、線状2本鎖DNAを形成し得る。第2ラウンドの右および左アダプター(Ad2)は、線状DNAのどちらかの末端にライゲーションされ得、両アダプターが結合した全DNAは、(例、PCRにより)PCR増幅され得る。Ad2アダプターは、それらが互いに結合し、環状DNAを形成するように修飾され得る。DNAはメチル化され得るが、制限酵素認識部位は、左Ad1アダプター上で非メチル化状態のままであり得る。制限酵素(例、Acul)が適用され得、DNAは、Ad1の左方13bpで開裂されて線状DNAフラグメントを形成し得る。第3ラウンドの右および左アダプター(Ad3)は、線状DNAの右側隣接および左側隣接にライゲーションされ得、得られたフラグメントはPCR増幅され得る。このアダプターは、それらが互いに結合し、環状DNAを形成し得るように修飾され得る。IIIタイプ制限酵素(例、EcoP15)が加えられ得、EcoP15が、Ad3の左方26bpおよびAd2の右方26bpでDNAを開裂し得る。この開裂により、DNAの大きな断片が除去され得、DNAが再度線形にされ得る。第4ラウンドの右および左アダプター(Ad4)がDNAにライゲーションされ得、そのDNAが(例、PCRにより)増幅され得、それらが互いに結合し、完成した環状DNA鋳型を形成するように修飾され得る。ローリングサークル複製(例、Phi29DNAポリメラーゼを使用)を用いることにより、DNAの小さなフラグメントを増幅することができる。4つのアダプター配列は、ハイブリダイゼーションし得るパリンドローム配列を含み得、1本鎖がそれ自体折り重なって、平均直径がおおよそ200〜300ナノメートルであり得る、DNAナノボール(DNB(TM))を形成することができる。DNAナノボールは、マイクロアレイ(配列決定用フローセル)に(例、吸着により)結合され得る。フローセルは、二酸化ケイ素、チタンおよびヘキサメチルジシラザン(HMDS)およびフォトレジスト材料で被覆されたシリコンウェハーであり得る。配列決定は、DNAに蛍光プローブをライゲーションすることによる非連鎖配列決定法により実施され得る。目的の(interrogated)位置の蛍光の色は、高解像度カメラにより可視化され得る。アダプター配列間のヌクレオチド配列の同一性が決定され得る。
場合によっては、本配列決定技術は、順方向および逆方向の両鋳型鎖が配列決定され得るペアエンド配列決定法を含み得る。場合によっては、本配列決定技術は、メイトペアライブラリ配列決定法を含み得る。メイトペアライブラリ配列決定法では、DNAはフラグメントであり得、2〜5kbのフラグメントが(例、ビオチン標識dNTPで)末端修復され得る。DNAフラグメントは環状化され得、非環状化DNAは消化により除去され得る。環状DNAは、フラグメント化され、(例、ビオチン標識を用いて)精製され得る。精製されたフラグメントは、末端修飾され、配列決定用アダプターにライゲーションされ得る。
場合によっては、配列リードは、約10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、244、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、312、313、314、315、316、317、318、319、320、321、322、323、324、325、326、327、328、329、330、331、332、333、334、335、336、337、338、339、340、341、342、343、344、345、346、347、348、349、350、351、352、353、354、355、356、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、372、373、374、375、376、377、378、379、380、381、382、383、384、385、386、387、388、389、390、391、392、393、394、395、396、397、398、399、400、401、402、403、404、405、406、407、408、409、410、411、412、413、414、415、416、417、418、419、420、421、422、423、424、425、426、427、428、429、430、431、432、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478、479、480、481、482、483、484、485、486、487、488、489、490、491、492、493、494、495、496、497、498、499、500、525、550、575、600、625、650、675、700、725、750、775、800、825、850、875、900、925、950、975、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、または3000塩基、約前記列挙の数値より多い塩基、約前記列挙の数値より少ない塩基、または少なくとも約前記列挙の数値の塩基である。場合によっては、配列リードは、約10〜約50塩基,約10〜約100塩基,約10〜約200塩基,約10〜約300塩基,約10〜約400塩基,約10〜約500塩基,約10〜約600塩基,約10〜約700塩基,約10〜約800塩基,約10〜約900塩基,約10〜約1000塩基,約10〜約1500塩基,約10〜約2000塩基,約50〜約100塩基,約50〜約150塩基,約50〜約200塩基,約50〜約500塩基,約50〜約1000塩基,約100〜約200塩基,約100〜約300塩基,約100〜約400塩基,約100〜約500塩基,約100〜約600塩基,約100〜約700塩基,約100〜約800塩基,約100〜約900塩基、または約100〜約1000塩基である。
試料からの配列リードの数は、約100、1000、5,000、10,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000、2,000,000、3,000,000、4,000,000、5,000,000、6,000,000、7,000,000、8,000,000、9,000,000、または10,000,000、約前記列挙の数値より多い数値、約前記列挙の数値より少ない数値、または少なくとも約前記列挙の数値であり得る。
試料の配列決定の深度は、約1×、2×、3×、4×、5×、6×、7×、8×、9×、10×、11×、12×、13×、14×、15×、16×、17×、18×、19×、20×、21×、22×、23×、24×、25×、26×、27×、28×、29×、30×、31×、32×、33×、34×、35×、36×、37×、38×、39×、40×、41×、42×、43×、44×、45×、46×、47×、48×、49×、50×、51×、52×、53×、54×、55×、56×、57×、58×、59×、60×、61×、62×、63×、64×、65×、66×、67×、68×、69×、70×、71×、72×、73×、74×、75×、76×、77×、78×、79×、80×、81×、82×、83×、84×、85×、86×、87×、88×、89×、90×、91×、92×、93×、94×、95×、96×、97×、98×、99×、l00×、110×、120×、130×、140×、150×、160×、170×、180×、190×、200×、300×、400×、500×、600×、700×、800×、900×、l000×、1500×、2000×、2500×、3000×、3500×、4000×、4500×、5000×、5500×、6000×、6500×、7000×、7500×、8000×、8500×、9000×、9500×、または10,000×、約前記列挙の数値より多い数値、約前記列挙の数値より少ない数値、または少なくとも約前記列挙の数値であり得る。試料の配列決定の深度は、約1×〜約5×、約1×〜約10×、約1×〜約20×、約5×〜約10×、約5×〜約20×、約5×〜約30×、約10×〜約20×、約10×〜約25×、約10×〜約30×、約10×〜約40×、約30×〜約100×、約100×〜約200×、約100×〜約500×、約500×〜約1000×、約1000×、〜約2000×、約1000×〜約5000×、または約5000×〜約10,000×であり得る。配列決定の深度は、ある配列(例、ゲノム)が配列決定される回数であり得る。場合によっては、Lander/Waterman等式をカバレッジのコンピュータ演算に使用する。一般式は、C=LN/G(式中、C=カバレッジ、G=半数体ゲノム長、L=リード長、およびN=リード数)であり得る。
場合によっては、異なるバーコードが、本明細書記載の方法により鋳型核酸から生成されたポリヌクレオチドに(例、プライマーおよび/またはアダプターを用いることにより)付加され得、ここで鋳型核酸は異なる試料に由来するものとし、異なる試料はプールされ、マルチプレックスアッセイで分析され得る。バーコードは、鋳型核酸の起源となる試料の判定を可能にし得る。様々な試料から生成されたライブラリのプールは、バーコードを付加する段階によって、バーコード配列付加後の異なる段階で実施され得る。
XIII.組成物および反応混合物
本方法は、さらに1つまたはそれより多くの組成物または反応混合物を提供する。場合によっては、反応混合物は、(a)鋳型RNA、(b)ランダム配列を含むプライマー、(c)逆転写酵素、(d)非修飾dNTPおよび非カノニカルdNTP(例、dUTP)の混合物、(e)3’オーバーハングおよび既知配列Aを含む長鎖および短鎖を含む第1アダプター、(f)DNAポリメラーゼ、(g)非修飾dNTPの混合物、(h)3’オーバーハングおよび既知配列Bを含む長鎖および3’末端にブロックを含む短鎖を含む第2アダプターを含むこともある。場合によっては、反応混合物は、さらに(e)第2アダプターのライゲーションおよび場合により本明細書記載の第2アダプター配列を含むポリヌクレオチドの末端の伸長の後にポリヌクレオチドの各末端に作製されたユニークなプライミング部位に指向した増幅プライマーを含むこともある。場合によっては、反応混合物は、さらに(f)本明細書で提供される方法により生成されたポリヌクレオチドの末端に付加されたアダプター配列の1つまたはそれより多くに存在する配列に対して指向した配列決定用プライマーを含むこともある。一部の実施形態では、プライマー(b)は、構造的RNA(rRNAなど)以外の全転写物と優先的にハイブリダイズさせるプライマーなど、望ましい群の鋳型への優先的ハイブリダイゼーションについて選択された配列を含む。一部の実施形態では、第1アダプター(e)は、ランダム配列を含む3’オーバーハングを伴うステム−ループオリゴヌクレオチドを含む。
本方法は、さらに1つまたはそれより多くの組成物または反応混合物を提供する。場合によっては、反応混合物は、(a)鋳型RNA、(b)ランダム配列を含むプライマー、(c)逆転写酵素、(d)非修飾dNTPおよび非カノニカルdNTP(例、dUTP)の混合物、(e)3’オーバーハングおよび既知配列Aを含む長鎖および短鎖を含む第1アダプター、(f)DNAポリメラーゼ、(g)非修飾dNTPの混合物、(h)3’オーバーハングおよび既知配列Bを含む長鎖および3’末端にブロックを含む短鎖を含む第2アダプターを含むこともある。場合によっては、反応混合物は、さらに(e)第2アダプターのライゲーションおよび場合により本明細書記載の第2アダプター配列を含むポリヌクレオチドの末端の伸長の後にポリヌクレオチドの各末端に作製されたユニークなプライミング部位に指向した増幅プライマーを含むこともある。場合によっては、反応混合物は、さらに(f)本明細書で提供される方法により生成されたポリヌクレオチドの末端に付加されたアダプター配列の1つまたはそれより多くに存在する配列に対して指向した配列決定用プライマーを含むこともある。一部の実施形態では、プライマー(b)は、構造的RNA(rRNAなど)以外の全転写物と優先的にハイブリダイズさせるプライマーなど、望ましい群の鋳型への優先的ハイブリダイゼーションについて選択された配列を含む。一部の実施形態では、第1アダプター(e)は、ランダム配列を含む3’オーバーハングを伴うステム−ループオリゴヌクレオチドを含む。
XIV.キット
本明細書記載の組成物はいずれもキット中に含まれ得る。非限定的な例において、キットは、好適な容器中に、1アダプターまたは幾つかのアダプター、1つまたはそれより多くのオリゴヌクレオチドプライマーおよびライゲーション、プライマー伸長および増幅用の試薬を含む。キットはまた、ビーズ懸濁液などの精製手段、および核酸修飾酵素を含み得る。
本明細書記載の組成物はいずれもキット中に含まれ得る。非限定的な例において、キットは、好適な容器中に、1アダプターまたは幾つかのアダプター、1つまたはそれより多くのオリゴヌクレオチドプライマーおよびライゲーション、プライマー伸長および増幅用の試薬を含む。キットはまた、ビーズ懸濁液などの精製手段、および核酸修飾酵素を含み得る。
キットの容器は、一般的に、成分を中に、好適には一定分量で入れることができる少なくとも1つのバイアル、試験管、フラスコ、ボトル、注射器または他の容器を含むことになる。キット中に複数の成分がある場合、キットはまた、一般的に、追加的成分を別々に入れることができる第2、第3または他の追加的容器を含むことになる。しかしながら、成分の様々な組み合わせは、1つの容器に含まれ得る。
キットの成分が1つまたはそれより多くの液状溶液で提供されるとき、その液状溶液は水溶液であり得る。しかしながら、キットの成分は、乾燥粉末(複数も可)として提供され得る。試薬および/または成分が乾燥粉末として提供されるとき、粉末は、好適な溶媒の添加により再構成され得る。
本方法は、本明細書記載の1つまたはそれより多くの組成物および本明細書記載の方法の実施に適した他の好適な試薬を含むキットを提供する。本明細書記載の方法は、例えば、臨床研究室または犯罪研究室用の診断キット、または核酸増幅、またはRNA−seqライブラリ調製キット、または一般研究室用の分析キットを提供する。したがって、本方法は、本明細書記載の方法を実施するための試薬、例えば試料調製試薬、オリゴヌクレオチド、結合分子、原液、ヌクレオチド、ポリメラーゼ、酵素、正および負の制御オリゴヌクレオチドおよび標的配列、試験管またはプレート、フラグメント化もしくは開裂試薬、検出試薬、精製マトリックス、および使用説明書の一部または全部を含むキットを含む。場合によっては、キットは、3’末端にランダム配列を含む第1鎖相補的DNAプライマーを含むこともある。場合によっては、キットに含まれる第1鎖cDNAプライマーは、rRNA以外の全転写物など、選択された標的の群とハイブリダイゼーション可能な配列を含むこともある。場合によっては、キットは、修飾ヌクレオチドまたは非カノニカルヌクレオチドを含むこともある。好適な修飾ヌクレオチドまたは非カノニカルヌクレオチドは、限定される訳ではないが、dUTPを含む本明細書で提供される任意のヌクレオチドを包含する。場合によっては、キットは、開裂作用因子を含むこともある。場合によっては、開裂作用因子は、グリコシラーゼおよび化学的作用因子、または酵素であり得る。グリコシラーゼは、UNGであり得る。化学的作用因子は、ポリアミンであり得る。ポリアミンは、DMEDであり得る。酵素は、エンドヌクレアーゼであり得る。エンドヌクレアーゼは、エンドヌクレアーゼVIIIまたはAPEであり得る。場合によっては、キットは、第1の普遍的配列および3’オーバーハングを含む第1アダプター/プライマーを含むこともあり、この3’オーバーハングは、3’末端ブロックを含むポリヌクレオチドの3’末端に存在する配列に対して指向した配列を含む。場合によっては、キットは、3’オーバーハングを含む1つまたはそれより多くのオリゴヌクレオチド第1アダプター(one of more oligonucleotide)を含むこともあり、この3’オーバーハングはランダム配列を含む。場合によっては、第1プライマーは、ステム−ループオリゴヌクレオチドを含むこともある。場合によっては、第1アダプターは、さらにバーコード配列および普遍的配列を含むこともある。場合によっては、キットは、第2の普遍的配列を含む第2のアダプターを含むこともある。場合によっては、キットは、第1アダプターに存在する普遍的配列に相補的な配列の一部分に対して指向した第1プライマーおよび第2アダプターに存在する普遍的配列に対して指向した配列またはその相補体を含む第2プライマーを含むこともある。
場合によっては、キットは、1つまたはそれより多くの反応混合物成分、または反応混合物成分の1つまたはそれより多くの混合物を含み得る。場合によっては、反応混合物成分またはその混合物は、例えば1.1×、1.5×、2×、2.5×、3×、4×、5×、6×、7×、10×、15×、20×、25×、33×、50×、75×、100×またはそれより高い倍率に濃縮された原液などの、濃縮原液として提供され得る。反応混合物成分は、限定される訳ではないが、緩衝液、塩類、二価カチオン、共沸混合物、カオトロピック、dNTP、標識ヌクレオチド、非カノニカルヌクレオチドまたは修飾ヌクレオチド、染料、発蛍光団、ビオチン、酵素(エンドヌクレアーゼ、エキソヌクレアーゼ、グリコシラーゼなど)またはそれらの任意の組み合わせを含む、本明細書で提供される組成物のいずれかを含み得る。
場合によっては、キットは、本明細書で提供されるオリゴヌクレオチドプライマーなど、1つまたはそれより多くのオリゴヌクレオチドプライマーを含み得る。例えば、キットは、本明細書で提供される方法により生成されたポリヌクレオチドの末端に付加されたアダプター配列に指向した配列を含む、1つまたはそれより多くのオリゴヌクレオチドプライマーを含み得る。場合によっては、キットは、標的核酸(例、第1および/または第2アダプター配列に存在する配列)とハイブリダイゼーション可能な3’部分および標的核酸とはハイブリダイゼーションできない5’部分を含むテイルドプライマーを含み得る。場合によっては、テイルドプライマーの5’部分は、1つまたはそれより多くのバーコード配列または他の識別子配列を含むこともある。場合によっては、識別子配列は、フローセル配列、TruSeqプライマー配列、および/または第2のリードバーコード配列を含むこともある。
場合によっては、キットは、1つまたはそれより多くのポリメラーゼ、またはその混合物を含み得る。場合によっては、その1つまたはそれより多くのポリメラーゼまたはその混合物は、鎖置換活性を含み得る。好適なポリメラーゼとしては、本明細書で提供されるポリメラーゼの任意のものが挙げられる。キットは、例えばdNTP、非カノニカルヌクレオチドまたは修飾ヌクレオチド、またはヌクレオチド類似体など、1つまたはそれより多くのポリメラーゼ基質をさらに含み得る。
場合によっては、キットは、所望の生成物からフラグメント化生成物を除去する、核酸生成物の精製のための1つまたはそれより多くの手段、または上記の組み合わせを含み得る。核酸生成物の精製に好適な手段としては、限定される訳ではないが、1本鎖特異的エキソヌクレアーゼ、アフィニティーマトリックス、核酸精製カラム、スピンカラム、限外濾過または透析試薬、または限定される訳ではないが、アクリルアミドまたはアガロースを含む電気泳動試薬、またはこれらの任意の組み合わせがある。
場合によっては、キットは、平滑末端を作製するための1つまたはそれより多くの試薬を含み得る。例えば、キットは、1つまたはそれより多くの、限定される訳ではないが、エキソヌクレアーゼ1またはエキソヌクレアーゼ7を含む1本鎖DNA特異的エキソヌクレアーゼ、緑豆エキソヌクレアーゼまたはS1エキソヌクレアーゼなどの1本鎖DNA特異的エンドヌクレアーゼ、1つまたはそれより多くの、例えばT4 DNAポリメラーゼまたはKlenowポリメラーゼなどのポリメラーゼ、またはこれらの任意の組み合わせを含み得る。別法として、キットは、1つまたはそれより多くの1本鎖DNA特異的エキソヌクレアーゼ、エンドヌクレアーゼおよび1つまたはそれより多くのポリメラーゼを含み得、この場合、試薬は混合物としては提供されない。さらに、平滑末端を作製するための試薬は、dNTPを含み得る。
場合によっては、キットは、アダプター分子へのライゲーションのための2本鎖生成物を調製するための1つまたはそれより多くの試薬を含み得る。例えば、本キットは、dATP、dCTP、dGTP、dTTPまたはこれらの任意の混合物を含み得る。場合によっては、キットは、例えばT4ポリヌクレオチドキナーゼなどのポリヌクレオチドキナーゼを含み得る。さらに、キットは、平滑末端化された2本鎖DNAフラグメントからの3’伸長部を作製するのに適したポリメラーゼを含み得る。好適なポリメラーゼ、例えば、exo−Klenowポリメラーゼが含まれ得る。
場合によっては、キットは、本明細書で提供されるアダプター分子のいずれかなど、1つまたはそれより多くのアダプター分子を含み得る。好適なアダプター分子には、1本鎖または2本鎖核酸(DNAまたはRNA)分子またはその誘導体、ステム−ループ核酸分子、1、2、3、4、5、6、7、8、9、10塩基またはそれより長い1つまたはそれより多くの1本鎖オーバーハングを含む2本鎖分子、タンパク質、ペプチド、アプタマー、有機分子、小有機分子、または2本鎖DNAフラグメントに、例えばライゲーションなどにより、共有結合的または非共有結合的に結合され得る当業界で既知の任意のアダプター分子がある。場合によっては、キットはアダプターを含むこともあり、このアダプターはデュプレックスアダプターであり得、この一方の鎖は既知または普遍的配列を含み、他方の鎖は5’および/または3’ブロックを含むものとする。長鎖はまた、5’または3’ブロックを含み得る。さらなる実施形態では、デュプレックスアダプターは、部分的デュプレックスアダプターである。場合によっては、部分的デュプレックスアダプターは、既知または普遍的配列を含む長鎖、および5’および3’ブロックを含む短鎖を含むこともある。長鎖はまた、5’または3’ブロックを含み得る。場合によっては、3’ブロックは、末端ジデオキシヌクレオチド(dideonucleotide)でブロックされていることもある。
場合によっては、キットは、本明細書記載の方法のアダプター(複数も可)および2本鎖生成物間で形成されたライゲーション複合体でギャップまたはフィルイン修復を実施するための1つまたはそれより多くの試薬を含み得る。キットは、ギャップ修復の実施に好適なポリメラーゼを含み得る。好適なポリメラーゼ、例えば、Taq DNAポリメラーゼが含まれ得る。
キットは、キットの使用についての使用説明書をさらに含み得る。例えば、キットは、限定される訳ではないが、例えばパイロシーケンシング、合成による配列決定、ハイブリダイゼーションによる配列決定、単一分子配列決定、ナノポア配列決定、およびライゲーション、高密度PCR、デジタルPCR、大規模並列Q−PCRによる配列決定、本明細書記載の方法により生成された増幅核酸生成物の特徴決定、またはこれらの任意の組み合わせを含む、大規模解析に有用なトランスクリプトームまたはゲノムの全体または一部を表す定方向性ポリヌクレオチドライブラリまたは定方向性cDNAライブラリを生成するための使用説明書を含み得る。本キットは、1つまたはそれより多くの反応混合物成分を混合して、本明細書記載の方法に好適な1つまたはそれより多くの混合物を生成するための使用説明書をさらに含み得る。本キットは、1つまたはそれより多くのオリゴヌクレオチドプライマーを核酸鋳型にハイブリダイゼーションさせるための使用説明書をさらに含み得る。本キットは、例えばポリメラーゼおよび/または修飾dNTPで1つまたはそれより多くのオリゴヌクレオチドプライマーを伸長させるための使用説明書をさらに含み得る。本キットは、DNA生成物を開裂作用因子で処理するための使用説明書をさらに含み得る。場合によっては、開裂作用因子は、グリコシラーゼおよび化学的作用因子、または酵素である。グリコシラーゼは、UNGであり得る。化学的作用因子はポリアミンであり得る。ポリアミンはDMEDであり得る。酵素はエンドヌクレアーゼであり得る。エンドヌクレアーゼはエンドヌクレアーゼVIIIまたはAPEであり得る。キットは、本明細書で提供される方法の工程のいずれかにより提供される生成物のいずれかの精製についての使用説明書をさらに含み得る。本キットは、例えば1本鎖DNA特異的エキソヌクレアーゼ、ポリメラーゼまたはこれらの任意の組み合わせで、例えば1本鎖オーバーハングを除去するか、または1本鎖オーバーハングをフィルインすることによる、平滑末端化フラグメントを作製するための使用説明書をさらに含み得る。キットは、本明細書記載の方法により作製された2本鎖DNAフラグメントの5’末端をリン酸化するための使用説明書をさらに含み得る。キットは、1つまたはそれより多くのアダプター分子を2本鎖DNAフラグメントにライゲーションするための使用説明書をさらに含み得る。
キットは、キットに含まれていない任意の他の試薬の使用に加えてキット成分を使用するための使用説明書を含むことになる/含み得る。使用説明書は、実行され得る変形を含み得る。
特に断らない限り、本明細書で使用されている遺伝学、分子生物学、生化学および核酸の用語および記号は、例えば、KornbergおよびBaker、DNA Replication、第2版(W.H.Freeman、ニューヨーク、1992)、Lehninger、Biochemistry、第2版(Worth Publishers、ニューヨーク、1975)、StrachanおよびRead、Human Molecular Genetics、第2版(Wiley−Liss、ニューヨーク、1999)、Eckstein編集、Oligonucleotides and Analogs:A Practical Approach(Oxford University Press、ニューヨーク、1991)、Gait編集、Oligonucleotide Synthesis:A Practical Approach(IRL Press、Oxford、1984)など、本分野における標準学術論文およびテキストに記載のものに従うものとする。
実施例1:100ng全RNA投入からの鎖ライブラリ調製
図3に記載されたプロセスを用いて、図3におけるプロセスの作業の流れにしたがってUniversal Human Reference(UHR)全RNA試料(100ng)から鎖cDNA配列決定ライブラリを生成した。
図3に記載されたプロセスを用いて、図3におけるプロセスの作業の流れにしたがってUniversal Human Reference(UHR)全RNA試料(100ng)から鎖cDNA配列決定ライブラリを生成した。
a.)dUを含む第1鎖cDNAの合成:2μlのFirst Strand Primer Mix(NuGEN、0334−32)および2μlのH2Oを、2μlのUniversal Human Reference RNA(50ng/μl、Agilent)に加えた。この混合物を5分間65℃でインキュベーションし、氷上で冷却した。以下の混合物を上記のものに加えた:2.5μlのFirst Strand Buffer Mix(NuGEN、0334−32)、0.5μlのFirst Strand Enzyme Mix(NuGEN、0334−32)、0.375μlの1mM dUTPおよび0.625μlのH2O。第1鎖cDNA合成を40℃で30分間実施した後、70℃で10分間インキュベーションした。
b.)第1鎖cDNAのフラグメント化:0.5μlのUSER Enzyme(New England BioLabs)を、上記の第1鎖cDNA合成反応混合物に加え、反応混合物を37℃で30分間インキュベーションした後、95℃で10分間インキュベーションした。
c.)RNA加水分解:2μlの1N NaOHを上記cDNAフラグメント化反応混合物に加え、反応混合物を95℃で15分間インキュベーションし、次いで冷却した反応混合物に2μlの1N HClを添加して反応混合物を中和することにより投入されたRNAを加水分解した。
d.)精製:製造業者の使用説明書にしたがってssDNA/RNA Clean & Concentrator(Zymo Research)を用いて、フラグメント化された第1鎖cDNAを精製し、精製されたフラグメント化第1鎖cDNAを10μlのH2O中で溶離した。
e.)一端に第1アダプターが付加されたdsDNAへの第1鎖cDNAの全フラグメントの変換:10μlの精製フラグメント化および3’ブロック化第1鎖cDNAを、1.5μlの10×NEBuffer2(New England BioLabs)、1.5μlの2.5mM dNTP、フラグメント化第1鎖cDNAのブロックされた3’末端とハイブリダイゼーション可能な0.5μlの10μM第1アダプター(ランダム配列の8−塩基3’オーバーハングを伴う33bpのdsDNA)および1μlのH2Oと混合した。混合物を65℃で5分間インキュベーションし、氷上で冷却した。0.5μlのBsu DNAポリメラーゼ、(Large Fragment New England BioLabs)を添加し、反応混合物を25℃で15分間、37℃で15分間、次いで70℃で10分間インキュベーションすることにより、第1鎖cDNAフラグメントに沿ってハイブリダイゼーションした第1アダプターの伸長を実施した。
f.)DNA末端の研磨:上記反応混合物を0.5μlのT4 DNAポリメラーゼ(Enzymatics)と合わせ、反応混合物を25℃で30分間、次いで70℃で10分間インキュベーションした。
g.)上記で作製されたds cDNAの平滑末端への第2アダプターのライゲーション:上記反応混合物に以下のものを添加することにより、ライゲーションを実施した:6μlの5×Quick Ligation Buffer(New England BioLabs)、2.5μlの20μM第2アダプター、1.5μlのQuick Ligase(New England BioLabs)、および5μlのH2O。反応混合物を25℃で30分間、次いで70℃で10分間インキュベーションした。
h.)精製:ライゲーション生成物(第1アダプターが一端に付加され、他方の端に第2アダプターが付加されたdsDNA)を、0.8倍体積のAgencourt Ampure XP(Beckman Coulter)を用いて精製し、25μl中で溶離した。
i.)PCR増幅:上記で調製した第1アダプターおよび第2アダプターが付加された鎖cDNA生成物のライブラリを、第1アダプターおよび第2アダプターに特異的な配列、およびマルチプレックス配列決定を可能にするバーコードを含むプライマーで、以下のPCRプログラムを用いた17サイクルにわたって、PCR増幅した:70℃5分、17×(94℃30秒、60℃30秒、72℃1分)72℃5分。
j.)精製:PCR産物(増幅された鎖cDNAライブラリ)を、製造業者の使用説明書に従って1倍体積のAgencourt Ampure XP(Beckman Coulter)を用いて精製した。
100ngのUHR全RNAから生成された一方向性配列決定ライブラリのサイズ分布を、BioAnalyzer(Agilent)を用いて分析した。前記ライブラリのサイズ分布を図6に示す。
実施例2:1ng全RNA投入からの鎖cDNAライブラリの生成
a.)dUを含む第1鎖cDNAの合成:2μlのFirst Strand Primer Mix(NuGEN、0334−32)および2μlのH2Oを、2μlのUniversal Human Reference RNA(0.5ng/μl、Agilent)に加えた。この混合物を5分間65℃でインキュベーションし、氷上で冷却した。以下の混合物を上記のものに加えた:2.5μlのFirst Strand Buffer Mix(NuGEN、0334−32)、0.5μlのFirst Strand Enzyme Mix(NuGEN、0334−32)、0.375μlの1mM dUTPおよび0.625μlのH2O。第1鎖cDNA合成を40℃で30分間実施した後、70℃で10分間インキュベーションした。
a.)dUを含む第1鎖cDNAの合成:2μlのFirst Strand Primer Mix(NuGEN、0334−32)および2μlのH2Oを、2μlのUniversal Human Reference RNA(0.5ng/μl、Agilent)に加えた。この混合物を5分間65℃でインキュベーションし、氷上で冷却した。以下の混合物を上記のものに加えた:2.5μlのFirst Strand Buffer Mix(NuGEN、0334−32)、0.5μlのFirst Strand Enzyme Mix(NuGEN、0334−32)、0.375μlの1mM dUTPおよび0.625μlのH2O。第1鎖cDNA合成を40℃で30分間実施した後、70℃で10分間インキュベーションした。
b.)第1鎖cDNAのフラグメント化:0.5μlのUSER Enzyme(New England BioLabs)を、上記の第1鎖cDNA合成反応混合物に加え、反応混合物を37℃で30分間インキュベーションした後、95℃で10分間インキュベーションした。
c.)RNA加水分解:2μlの1N NaOHを上記cDNAフラグメント化反応混合物に加え、反応混合物を95℃で15分間インキュベーションし、次いで冷却した反応混合物に2μlの1N HClを添加して反応混合物を中和することにより投入されたRNAを加水分解した。
d.)精製:製造業者の使用説明書にしたがってssDNA/RNA Clean & Concentrator(Zymo Research)を用いて、フラグメント化された第1鎖cDNAを精製し、精製されたフラグメント化第1鎖cDNAを10μlのH2O中で溶離した。
e.)一端に第1アダプターが付加されたdsDNAへの第1鎖cDNAの全フラグメントの変換:10μlの精製フラグメント化および3’ブロック化第1鎖cDNAを、1.5μlの10×NEBuffer2(New England BioLabs)、1.5μlの2.5mM dNTP、フラグメント化第1鎖cDNAのブロックされた3’末端とハイブリダイゼーション可能な0.5μlの10μM第1アダプター(ランダム配列の8−塩基3’オーバーハングを伴う33bpのdsDNA)および1μlのH2Oと混合した。混合物を65℃で5分間インキュベーションし、氷上で冷却した。0.5μlのBsu DNAポリメラーゼ、(Large Fragment New England BioLabs)を添加し、反応混合物を25℃で15分間、37℃で15分間、次いで70℃で10分間インキュベーションすることにより、第1鎖cDNAフラグメントに沿ってハイブリダイゼーションした第1アダプターの伸長を実施した。
f.)DNA末端の研磨:上記反応混合物を0.5μlのT4 DNAポリメラーゼ(Enzymatics)と合わせ、反応混合物を25℃で30分間、次いで70℃で10分間インキュベーションした。
g.)精製:DNAを、1.5倍体積のAgencourt Ampure XP(Beckman Coulter)を用いて精製し、18μlのH2Oで溶離した。
h.)上記で作製されたds cDNAの平滑末端への第2アダプターのライゲーション:上記精製DNA生成物に以下のものを添加することにより、ライゲーションを実施した:5μlの5×Quick Ligation Buffer(New England BioLabs)、0.625μlの20μM第2アダプター、および1.5μlのQuick Ligase(New England BioLabs)。反応混合物を25℃で30分間、次いで70℃で10分間インキュベーションした。
i.)精製:ライゲーション生成物(第1アダプターが一端に付加され、他方の端に第2アダプターが付加されたdsDNA)を、0.8倍体積のAgencourt Ampure XP(Beckman Coulter)を用いて精製し、25μlのH2O中で溶離した。
j.)2工程の間に精製工程を挟んで2工程でPCR増幅を行った。
以下のPCRプログラムを用いて、18サイクルにわたって第1工程PCRを実施した:70℃5分、18×(94℃30秒、60℃30秒、72℃1分)72℃5分。
この工程からのPCR産物を、0.8倍体積のAgencourt Ampure XP(Beckman Coulter)を用いて精製した。
精製したPCR産物を、さらに以下のPCRプログラムを用いて7サイクルにわたって増幅した:7×(94℃30秒、60℃30秒、72℃1分)72℃5分。
この2つの工程のPCRは、プライマー−二量体アーチファクトの潜在的発生を減少させる目標を持って着手された。
k.)精製:製造業者の使用説明書にしたがって1倍体積のAgencourt Ampure XP(Beckman Coulter)を用いることにより、PCR産物(増幅された鎖cDNAライブラリ)を精製した。
実施例3:RNA鎖保持効率およびトランスクリプトーム配列決定品質。
本明細書で提供される方法を用いた鎖保持効率を、ヒトmRNAのコーディングエキソン、3’−UTRおよび5’−UTR領域ならびにrRNAに対しマッピングする配列リードの鎖バイアスを評価することにより実験的に確認した。本明細書で提供される方法および組成物にしたがって生成された定方向性cDNAライブラリを、実施例1および2で記載されたように、100ngおよび1ngの全UHR RNAから生成した。Illumina Genome Analyzer IIを用いて、単一末端40ヌクレオチドリードを生成した。配列決定データおよび鎖保持効率の結果を図9に要約した。図9は、100ng(試料1、s4_L2DR14、試料2、s4_L2DR15)および1ngの全UHR RNA(試料3、BC14)から生成されたライブラリについて95%を超える鎖保持性およびrRNAから生成される極小のリードを示した。
本明細書で提供される方法および組成物を用いることによる、実施例1および2に記載された定方向性cDNAライブラリから生成されたトランスクリプトーム配列決定の品質を、配列決定データからさらに立証した。100ng(試料1、s4_L2DR14、試料2、s4_L2DR15、図7)および1ngの全UHR RNA(試料3、BC14、図10)から生成されたライブラリについて示されたように、5’−3’表示の解析により、非バイアスの全トランスクリプトーム配列決定が立証される。さらに、実施例1および2で記載された定方向性cDNA配列決定ライブラリの生成に使用される第1鎖cDNAプライマーの選択により、rRNAの表示が最小であるライブラリが生成される。
本明細書で提供される方法および組成物により、図8に示されるように、実施例1記載の要領で生成されたライブラリs4_L2DR14およびs4_L2DR15についての配列決定データ、100万当たりの1キロベース転写物当たりのリード数(RPKM)の相関関係により示されるように、全RNA試料からの定方向性cDNA配列決定ライブラリを用いた高度に再生可能な遺伝子発現プロファイリングが得られる。
実施例4:単細胞から単離された全RNAからの鎖ライブラリ調製:
図1に示されたプロセスを、単細胞からRNAを単離した後、図3でのプロセスの作業の流れに従った単細胞から単離された全RNAからの鎖cDNA配列決定ライブラリの生成に使用する。
図1に示されたプロセスを、単細胞からRNAを単離した後、図3でのプロセスの作業の流れに従った単細胞から単離された全RNAからの鎖cDNA配列決定ライブラリの生成に使用する。
a.)単細胞を細胞溶解緩衝液中で溶解する。
b.)dUを含む第1鎖cDNAの合成:2μlのFirst Strand Primer Mix(NuGEN、0334−32)および2μlのH2Oを、細胞溶菌液に加える。この混合物を5分間65℃でインキュベーションし、氷上で冷却する。以下の混合物を上記のものに加える:2.5μlのFirst Strand Buffer Mix(NuGEN、0334−32)、0.5μlのFirst Strand Enzyme Mix(NuGEN、0334−32)、0.375μlの1mM dUTPおよび0.625μlのH2O。第1鎖cDNA合成を40℃で30分間実施した後、70℃で10分間インキュベーションする。
b.)第1鎖cDNAのフラグメント化:0.5μlのUSER Enzyme(New England BioLabs)を、上記の第1鎖cDNA合成反応混合物に加え、反応混合物を37℃で30分間インキュベーションした後、95℃で10分間インキュベーションする。
c.)RNA加水分解:2μlの1N NaOHを上記cDNAフラグメント化反応混合物に加え、反応混合物を95℃で15分間インキュベーションし、次いで冷却した反応混合物に2μlの1N HClを添加して反応混合物を中和することにより投入されたRNAを加水分解する。
d.)精製:製造業者の使用説明書にしたがってssDNA/RNA Clean & Concentrator(Zymo Research)を用いて、フラグメント化された第1鎖cDNAを精製し、精製されたフラグメント化第1鎖cDNAを10μlのH2O中で溶離する。
e.)一端に第1アダプターが付加されたdsDNAへの第1鎖cDNAの全フラグメントの変換:10μlの精製フラグメント化および3’ブロック化第1鎖cDNAを、1.5μlの10×NEBuffer2(New England BioLabs)、1.5μlの2.5mM dNTP、フラグメント化第1鎖cDNAのブロックされた3’末端とハイブリダイゼーション可能な0.5μlの10μM第1アダプター(ランダム配列の8−塩基3’オーバーハングを伴う33bpのdsDNA)および1μlのH2Oと混合する。混合物を65℃で5分間インキュベーションし、氷上で冷却する。0.5μlのBsu DNAポリメラーゼ、(Large Fragment New England BioLabs)を添加し、反応混合物を25℃で15分間、37℃で15分間、次いで70℃で10分間インキュベーションすることにより、第1鎖cDNAフラグメントに沿ってハイブリダイゼーションした第1アダプターの伸長を実施する。
f.)DNA末端の研磨:上記反応混合物を0.5μlのT4 DNAポリメラーゼ(Enzymatics)と合わせ、反応混合物を25℃で30分間、次いで70℃で10分間インキュベーションする。
g.)上記で作製されたds cDNAの平滑末端への第2アダプターのライゲーション:上記反応混合物に以下のものを添加することにより、ライゲーションを実施する:6μlの5×Quick Ligation Buffer(New England BioLabs)、2.5μlの20μM第2アダプター、1.5μlのQuick Ligase(New England BioLabs)、および5μlのH2O。反応混合物を25℃で30分間、次いで70℃で10分間インキュベーションする。
h.)精製:ライゲーション生成物(第1アダプターが一端に付加され、他方の端に第2アダプターが付加されたdsDNA)を、0.8倍体積のAgencourt Ampure XP(Beckman Coulter)を用いて精製し、25μl中で溶離する。
i.)PCR増幅:上記で調製した第1アダプターおよび第2アダプターが付加された鎖cDNA生成物のライブラリを、第1アダプターおよび第2アダプターに特異的な配列、およびマルチプレックス配列決定を可能にするバーコードを含むプライマーで、以下のPCRプログラムを用いた17サイクルにわたって、PCR増幅する:70℃5分、17×(94℃30秒、60℃30秒、72℃1分)72℃5分。
j.)精製:製造業者の使用説明書にしたがって1倍体積のAgencourt Ampure XP(Beckman Coulter)を用いることにより、PCR産物(増幅された鎖cDNAライブラリ)を精製する。
本発明の好ましい実施形態を本明細書で示し、説明したが、かかる実施形態が例として挙げられたものに過ぎないことは、当業者には明らかなはずである。当業者であれば、本発明から逸脱することなく、数多くの変形、変更および置き換えを想到することになろう。本明細書記載の本発明の実施形態に対する様々な代替形態が本発明を実践するにあたり使用され得ることは、理解される。以下の特許請求の範囲は、本発明の範囲を規定するもので、これらの特許請求の範囲に含まれる方法および構造ならびにそれらの均等内容のものもそこに包含されるものとする。
Claims (41)
- 定方向性cDNAライブラリを生成するための方法であって、
a)1つまたはそれより多くのプライマーを鋳型RNAにアニーリングさせる工程と、
b)dATP、dCTP、dGTP、dTTPおよびdUTPを含む反応混合物の存在下で前記1つまたはそれより多くのプライマーを伸長させる工程であって、ここで、前記反応混合物は、ある一定のdUTP対dTTP比を含み、前記比は所望の密度でのdUTPの組込みを可能にし、それによって所望の密度で組み込まれたdUTPを含む1つまたはそれより多くの第1鎖相補的DNA(cDNA)が生成される、工程と、
c)ウラシル−N−グリコシラーゼ(UNG)および前記UNGにより作製される脱塩基部位にあるホスホジエステルバックボーンを開裂することができる作用因子で、所望の密度で組み込まれたdUTPを含む前記1つまたはそれより多くの第1鎖cDNAを選択的に開裂する工程であって、ここで、前記開裂により、ブロックされた3’末端を含む所望のサイズの複数の第1鎖cDNAフラグメントが生成される、工程と、
d)部分的デュプレックスおよび3’オーバーハングを含む第1アダプターを、ブロックされた3’末端を含む前記複数の第1鎖cDNAフラグメントのうちの1つまたはそれより多くの3’末端にアニーリングさせる工程であって、ここで、前記第1アダプターは配列Aを含み、前記アニーリングは、前記3’オーバーハングにあるランダム配列を、ブロックされた3’末端を含む前記複数の第1鎖cDNAフラグメントのうちの前記1つまたはそれより多くの3’末端に存在する相補配列にハイブリダイズさせることを含む、工程と、
e)前記相補配列にハイブリダイズされた前記3’オーバーハングをDNAポリメラーゼで伸長させる工程であって、ここで、一方の端に前記配列Aを含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成される、工程と、
f)配列Bを含む第2アダプターを、一方の端に前記配列Aを含む前記1つまたはそれより多くの2本鎖cDNAフラグメントにライゲーションさせる工程であって、ここで、前記ライゲーションにより、一方の端に前記配列Aおよび反対端に前記配列Bを含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成され、それによって前記定方向性ポリヌクレオチドライブラリが生成される、工程と、
を含む、方法。 - 全トランスクリプトーム定方向性配列決定のための方法であって、
a)1つまたはそれより多くのプライマーを鋳型RNAにアニーリングさせる工程と、
b)dATP、dCTP、dGTP、dTTPおよびdUTPを含む反応混合物の存在下で前記プライマーを伸長させる工程であって、ここで、前記反応混合物は、ある一定のdUTP対dTTP比を含み、前記比は所望の密度でのdUTPの組込みを可能にし、それによって所望の密度で組み込まれたdUTPを含む1つまたはそれより多くの第1鎖相補的DNA(cDNA)が生成される、工程と、
c)ウラシル−N−グリコシラーゼ(UNG)および前記UNGにより作製される脱塩基部位にあるホスホジエステルバックボーンを開裂することができる作用因子で、所望の密度で組み込まれたdUTPを含む前記1つまたはそれより多くの第1鎖cDNAを選択的に開裂する工程であって、ここで、前記開裂により、ブロックされた3’末端を含む所望のサイズの複数の第1鎖cDNAフラグメントが生成される、工程と、
d)部分的デュプレックスおよび3’オーバーハングを含む第1アダプターを、ブロックされた3’末端を含む前記複数の第1鎖cDNAフラグメントのうちの1つまたはそれより多くの3’末端にアニーリングさせる工程であって、ここで、前記第1アダプターは配列Aを含み、前記アニーリングは、前記3’オーバーハングにあるランダム配列を、ブロックされた3’末端を含む前記複数の第1鎖cDNAフラグメントのうちの前記1つまたはそれより多くの3’末端に存在する相補配列にハイブリダイズさせることを含む、工程と、
e)前記相補配列にハイブリダイズされた前記3’オーバーハングをDNAポリメラーゼで伸長させる工程であって、ここで、一方の端に前記配列Aを含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成される、工程と、
f)配列Bを含む第2アダプターを、一方の端に前記配列Aを含む前記1つまたはそれより多くの2本鎖cDNAフラグメントにライゲーションさせる工程であって、ここで、前記ライゲーションにより、一方の端に前記配列Aおよび反対端に前記配列Bを含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成され、それによって定方向性cDNAライブラリが生成される、工程と、
g)前記定方向性cDNAライブラリを増幅および/または配列決定する工程と、
を含む方法。 - 定方向性cDNAライブラリを生成するための方法であって、
a)鋳型dsDNAをニッキング酵素で処理する工程であって、ここで、前記処理により、前記鋳型dsDNAの1鎖のホスホジエステルバックボーンに1つまたはそれより多くの破断が生じ、前記破断により、前記1鎖において1つまたはそれより多くの3’ヒドロキシルが生成される、工程と、
b)前記1つまたはそれより多くの3’ヒドロキシルを伸長させる工程であって、ここで、前記伸長はdATP、dCTP、dGTP、dTTPおよびdUTPを含む反応混合物の存在下で行われ、前記反応混合物は、ある一定のdUTP対dTTP比を含み、前記比は所望の密度でのdUTPの組込みを可能にし、それによって所望の密度で組み込まれたdUTPを含む1つまたはそれより多くの第1鎖相補的DNA(cDNA)が生成される、工程と、
c)ウラシル−N−グリコシラーゼ(UNG)および前記UNGにより作製される脱塩基部位にあるホスホジエステルバックボーンを開裂することができる作用因子で、所望の密度で組み込まれたdUTPを含む前記1つまたはそれより多くの第1鎖cDNAを選択的に開裂する工程であって、ここで、前記開裂により、ブロックされた3’末端を含む所望のサイズの複数の第1鎖cDNAフラグメントが生成される、工程と、
d)部分的デュプレックスおよび3’オーバーハングを含む第1アダプターを、ブロックされた3’末端を含む前記複数の第1鎖cDNAフラグメントのうちの1つまたはそれより多くの3’末端にアニーリングさせる工程であって、ここで、前記第1アダプターは配列Aを含み、前記アニーリングは、前記3’オーバーハングにあるランダム配列を、ブロックされた3’末端を含む前記複数の第1鎖cDNAフラグメントのうちの前記1つまたはそれより多くの3’末端に存在する相補配列にハイブリダイズさせることを含む、工程と、
e)前記相補配列にハイブリダイズされた前記3’オーバーハングをDNAポリメラーゼで伸長させる工程であって、ここで、一方の端に前記配列Aを含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成される、工程と、
f)配列Bを含む第2アダプターを、一方の端に前記配列Aを含む前記1つまたはそれより多くの2本鎖cDNAフラグメントにライゲーションさせる工程であって、ここで、前記ライゲーションにより、一方の端に前記配列Aおよび反対端に前記配列Bを含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成され、それによって定方向性cDNAライブラリが生成される、工程と、
を含む、方法。 - 全ゲノム配列決定のための方法であって、
a)ゲノムDNAをニッキング酵素で処理する工程であって、前記処理により、前記ゲノムDNAの1鎖のホスホジエステルバックボーンに1つまたはそれより多くの破断が生じ、前記破断により、前記1鎖において1つまたはそれより多くの3’ヒドロキシルが生成される、工程と、
b)前記1つまたはそれより多くの3’ヒドロキシルを伸長させる工程であって、前記伸長はdATP、dCTP、dGTP、dTTPおよびdUTPを含む反応混合物の存在下で行われ、前記反応混合物は、ある一定のdUTP対dTTP比を含み、前記比は所望の密度でのdUTPの組込みを可能にし、それによって所望の頻度で組み込まれたdUTPを含む1つまたはそれより多くの第1鎖相補的DNA(cDNA)が生成される、工程と、
c)ウラシル−N−グリコシラーゼ(UNG)および前記UNGにより作製される脱塩基部位にあるホスホジエステルバックボーンを開裂することができる作用因子で、所望の密度で組み込まれたdUTPを含む前記1つまたはそれより多くの第1鎖cDNAを選択的に開裂する工程であって、ここで、前記開裂により、ブロックされた3’末端を含む所望のサイズの複数の第1鎖cDNAフラグメントが生成される、工程と、
d)部分的デュプレックスおよび3’オーバーハングを含む第1アダプターを、ブロックされた3’末端を含む前記複数の第1鎖cDNAフラグメントのうちの1つまたはそれより多くの3’末端にアニーリングさせる工程であって、ここで、前記第1アダプターは配列Aを含み、前記アニーリングは、前記3’オーバーハングにあるランダム配列を、ブロックされた3’末端を含む前記複数の第1鎖cDNAフラグメントのうちの前記1つまたはそれより多くの3’末端に存在する相補配列にハイブリダイズさせることを含む、工程と、
e)前記相補配列にハイブリダイズされた前記3’オーバーハングをDNAポリメラーゼで伸長させる工程であって、ここで、一方の端に前記配列Aを含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成される、工程と、
f)配列Bを含む第2アダプターを、一方の端に前記配列Aを含む前記1つまたはそれより多くの2本鎖cDNAフラグメントにライゲーションさせる工程であって、ここで、前記ライゲーションにより、一方の端に前記配列Aおよび反対端に前記配列Bを含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成され、それによって定方向性cDNAライブラリが生成される、工程と、
g)前記定方向性cDNAライブラリを増幅および/または配列決定する工程と、
を含む方法。 - 前記1つまたはそれより多くのプライマーが、ランダムプライマーを含む、請求項1または2に記載の方法。
- 前記1つまたはそれより多くのプライマーが、標的鋳型RNAまたはRNAの群に特異的な配列を含む、請求項1または2に記載の方法。
- 前記RNAの群が実質的に全ての転写物を含む、請求項6に記載の方法。
- 前記RNAの群が、構造的RNAを含まず、前記構造的RNAがリボソームRNA(rRNA)を含む、請求項6に記載の方法。
- ホスホジエステルバックボーンを開裂することができる前記作用因子が、酵素、化学的作用因子、および/または熱を含む、請求項1、2、3または4に記載の方法。
- 前記化学的作用因子がポリアミンである、請求項9に記載の方法。
- 前記ポリアミンがN,N−ジメチルエチレンジアミン(DMED)である、請求項10に記載の方法。
- 前記酵素がエンドヌクレアーゼである、請求項9に記載の方法。
- 前記エンドヌクレアーゼがエンドヌクレアーゼVIIIである、請求項12に記載の方法。
- 前記部分的デュプレックスが長鎖および短鎖を含み、前記長鎖が、前記短鎖とデュプレックスを形成する前記配列Aおよび3’オーバーハングを含む、請求項1、2、3または4に記載の方法。
- 前記短鎖がさらに3’および/または5’末端にブロックを含む、請求項14に記載の方法。
- 前記第1アダプターが複数の第1アダプターを含み、前記複数の第1アダプターのそれぞれにおける前記ランダム配列が、前記複数の第1アダプターの別のものにおけるランダム配列とは異なり、各々の前記複数の第1アダプターは、前記配列Aを含む、請求項1、2、3または4に記載の方法。
- 工程d)の結果、3’末端にアニーリングされた前記複数の第1アダプターの1つをさらに含む工程c)で生成されたブロックされた3’末端を含む所望のサイズの前記複数の第1鎖cDNAフラグメントの実質的に全てが得られる、請求項16に記載の方法。
- 前記第1アダプターがさらにステムループを含み、前記ステムループが前記部分的デュプレックスの長鎖の5’末端を前記部分的デュプレックスの短鎖の3’末端と連結し、前記長鎖が前記配列Aおよび前記3’オーバーハングを含む、請求項1、2、3または4に記載の方法。
- 前記第1アダプターがさらに前記長鎖の5’末端にブロックを含む、請求項14に記載の方法。
- 前記第1アダプターがさらに前記短鎖の5’末端にブロックを含む、請求項16に記載の方法。
- 前記3’オーバーハングが、少なくとも6、7、8または9個のヌクレオチドを含む、請求項1、2、3または4に記載の方法。
- 前記第2アダプターが部分的デュプレックスを含み、前記部分的デュプレックスは短鎖にハイブリダイズされた長鎖を含み、前記長鎖は前記配列Bおよびオーバーハングを含む、請求項1、2、3または4に記載の方法。
- 前記長鎖が前記配列Bおよび3’オーバーハングを含み、前記短鎖が3’末端にブロックを含む、請求項22に記載の方法。
- 前記ライゲーションにより、一方の端に前記配列Aおよび反対端に前記配列Bを含む前記1つまたはそれより多くの2本鎖cDNAフラグメントが生成され、前記配列Aが一方の端の5’末端にあり、前記配列Bが反対端の3’末端にある、請求項23に記載の方法。
- 前記長鎖が前記配列Bおよび5’オーバーハングを含み、前記短鎖が5’末端にブロックを含む、請求項22に記載の方法。
- 前記ライゲーションにより、一方の端に前記配列Aおよび反対端に前記配列Bを含む前記1つまたはそれより多くの2本鎖cDNAフラグメントが生成され、前記配列Aが一方の端の5’末端にあり、前記配列Bが反対端の5’末端にある、請求項25に記載の方法。
- 前記反対端の3’末端が鋳型として前記配列Bを用いて伸長され、それにより一方の端の5’末端に前記配列Aおよび反対端の3’末端に前記配列Bと相補的な配列B’を含む1つまたはそれより多くの2本鎖cDNAフラグメントが生成される、請求項26に記載の方法。
- さらに前記定方向性cDNAライブラリを増幅する工程を含み、それにより増幅生成物が生成される、請求項1または3に記載の方法。
- さらに前記増幅生成物を配列決定する追加的工程を含む、請求項28に記載の方法。
- 前記増幅がSPIAを含む、請求項28に記載の方法。
- 前記増幅がプライマーの使用を含み、前記プライマーの1つまたはそれより多くが1つまたはそれより多くのバーコード配列を含む、請求項28に記載の方法。
- 前記配列決定が、次世代配列決定を含む、請求項29に記載の方法。
- 前記増幅がSPIAを含む、請求項2または4に記載の方法。
- 前記増幅がプライマーの使用を含み、前記プライマーの1つまたはそれより多くがバーコード配列を含む、請求項2または4に記載の方法。
- 前記配列決定が、次世代配列決定を含む、請求項2または4に記載の方法。
- 工程b)の後さらに前記鋳型RNAを分解する工程を含む、請求項1または2に記載の方法。
- 前記開裂が、前記鋳型RNA試料をリボヌクレアーゼに曝露することを含む、請求項1または2に記載の方法。
- 前記ニッキング酵素が鎖特異的ニッキング酵素を含む、請求項3または4に記載の方法。
- 工程b)での前記1つまたはそれより多くの3’ヒドロキシルの前記伸長が、鎖置換活性を含むDNAポリメラーゼにより行われる、請求項3または4に記載の方法。
- 前記ライゲーションが、平滑末端ライゲーションを含み、工程e)で生成された一方の端に前記配列Aを含む前記1つまたはそれより多くの2本鎖cDNAフラグメントが工程f)の前に末端修復される、請求項1、2、3または4に記載の方法。
- 前記第1アダプターおよび/または前記第2アダプターがさらに1つまたはそれより多くのバーコードを含む、請求項1、2、3または4に記載の方法。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361801510P | 2013-03-15 | 2013-03-15 | |
US61/801,510 | 2013-03-15 | ||
US14/030,761 US20140274729A1 (en) | 2013-03-15 | 2013-09-18 | Methods, compositions and kits for generation of stranded rna or dna libraries |
US14/030,761 | 2013-09-18 | ||
PCT/US2014/024581 WO2014150931A1 (en) | 2013-03-15 | 2014-03-12 | Methods, compositions and kits for generation of stranded rna or dna libraries |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2016511007A true JP2016511007A (ja) | 2016-04-14 |
Family
ID=51529802
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016501581A Pending JP2016511007A (ja) | 2013-03-15 | 2014-03-12 | 鎖になったrnaまたはdnaのライブラリを生成するための方法、組成物およびキット |
Country Status (7)
Country | Link |
---|---|
US (1) | US20140274729A1 (ja) |
EP (1) | EP2971289A1 (ja) |
JP (1) | JP2016511007A (ja) |
CN (1) | CN105143525A (ja) |
CA (1) | CA2903125A1 (ja) |
SG (1) | SG11201507136SA (ja) |
WO (1) | WO2014150931A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021166989A1 (ja) * | 2020-02-18 | 2021-08-26 | 国立研究開発法人理化学研究所 | アダプター配列が付加されたdna分子を製造する方法、およびその利用 |
JP7276571B1 (ja) | 2022-06-20 | 2023-05-18 | 凸版印刷株式会社 | フラップエンドヌクレアーゼの蛍光基質における三重鎖構造の形成効率を向上させる方法 |
Families Citing this family (88)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9206418B2 (en) | 2011-10-19 | 2015-12-08 | Nugen Technologies, Inc. | Compositions and methods for directional nucleic acid amplification and sequencing |
CN105861487B (zh) | 2012-01-26 | 2020-05-05 | 纽亘技术公司 | 用于靶向核酸序列富集和高效文库产生的组合物和方法 |
EP2823064B1 (en) | 2012-03-05 | 2019-02-06 | President and Fellows of Harvard College | Methods for epigenetic sequencing |
US9487828B2 (en) | 2012-05-10 | 2016-11-08 | The General Hospital Corporation | Methods for determining a nucleotide sequence contiguous to a known target nucleotide sequence |
SG11201408478QA (en) | 2012-06-18 | 2015-02-27 | Nugen Technologies Inc | Compositions and methods for negative selection of non-desired nucleic acid sequences |
US20150011396A1 (en) | 2012-07-09 | 2015-01-08 | Benjamin G. Schroeder | Methods for creating directional bisulfite-converted nucleic acid libraries for next generation sequencing |
US9951386B2 (en) | 2014-06-26 | 2018-04-24 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US9567631B2 (en) | 2012-12-14 | 2017-02-14 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10752949B2 (en) | 2012-08-14 | 2020-08-25 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10273541B2 (en) | 2012-08-14 | 2019-04-30 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
CA3216609C (en) | 2012-08-14 | 2024-05-14 | 10X Genomics, Inc. | Microcapsule compositions and methods |
US10323279B2 (en) | 2012-08-14 | 2019-06-18 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10584381B2 (en) | 2012-08-14 | 2020-03-10 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US11591637B2 (en) | 2012-08-14 | 2023-02-28 | 10X Genomics, Inc. | Compositions and methods for sample processing |
US10221442B2 (en) | 2012-08-14 | 2019-03-05 | 10X Genomics, Inc. | Compositions and methods for sample processing |
US9701998B2 (en) | 2012-12-14 | 2017-07-11 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10533221B2 (en) | 2012-12-14 | 2020-01-14 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
CA2900543C (en) | 2013-02-08 | 2023-01-31 | 10X Genomics, Inc. | Partitioning and processing of analytes and other species |
US9822408B2 (en) | 2013-03-15 | 2017-11-21 | Nugen Technologies, Inc. | Sequential sequencing |
TWI646230B (zh) | 2013-08-05 | 2019-01-01 | 扭轉生物科技有限公司 | 重新合成之基因庫 |
US9828600B2 (en) * | 2013-09-20 | 2017-11-28 | University Of Massachusetts | Compositions and methods for constructing cDNA libraries that allow for mapping the 5′ and 3′ ends of RNAs |
CA2929596C (en) | 2013-11-13 | 2022-07-05 | Nugen Technologies, Inc. | Compositions and methods for identification of a duplicate sequencing read |
CN106661612A (zh) | 2014-01-27 | 2017-05-10 | 通用医疗公司 | 制备用于测序的核酸的方法 |
GB201403216D0 (en) * | 2014-02-24 | 2014-04-09 | Cambridge Epigenetix Ltd | Nucleic acid sample preparation |
US9745614B2 (en) | 2014-02-28 | 2017-08-29 | Nugen Technologies, Inc. | Reduced representation bisulfite sequencing with diversity adaptors |
WO2015157567A1 (en) | 2014-04-10 | 2015-10-15 | 10X Genomics, Inc. | Fluidic devices, systems, and methods for encapsulating and partitioning reagents, and applications of same |
US20150298091A1 (en) | 2014-04-21 | 2015-10-22 | President And Fellows Of Harvard College | Systems and methods for barcoding nucleic acids |
EP4053292A1 (en) | 2014-06-26 | 2022-09-07 | 10X Genomics, Inc. | Methods of analyzing nucleic acids from individual cells or cell populations |
US10102337B2 (en) | 2014-08-06 | 2018-10-16 | Nugen Technologies, Inc. | Digital measurements from targeted sequencing |
US10563196B2 (en) | 2014-10-17 | 2020-02-18 | Mgi Tech Co., Ltd | Primer for nucleic acid random fragmentation and nucleic acid random fragmentation method |
CN114807307A (zh) | 2014-10-29 | 2022-07-29 | 10X 基因组学有限公司 | 用于靶核酸测序的方法和组合物 |
US9975122B2 (en) | 2014-11-05 | 2018-05-22 | 10X Genomics, Inc. | Instrument systems for integrated sample processing |
BR112017014902A2 (pt) | 2015-01-12 | 2018-03-13 | 10X Genomics Inc | processos e sistemas para a preparação de bibliotecas de sequenciamento de ácido nucleico e bibliotecas preparadas usando os mesmos |
CA2975855A1 (en) | 2015-02-04 | 2016-08-11 | Twist Bioscience Corporation | Compositions and methods for synthetic gene assembly |
CA2975852A1 (en) | 2015-02-04 | 2016-08-11 | Twist Bioscience Corporation | Methods and devices for de novo oligonucleic acid assembly |
US11274343B2 (en) | 2015-02-24 | 2022-03-15 | 10X Genomics, Inc. | Methods and compositions for targeted nucleic acid sequence coverage |
WO2016137973A1 (en) | 2015-02-24 | 2016-09-01 | 10X Genomics Inc | Partition processing methods and systems |
WO2016168584A1 (en) | 2015-04-17 | 2016-10-20 | President And Fellows Of Harvard College | Barcoding systems and methods for gene sequencing and other applications |
US9981239B2 (en) | 2015-04-21 | 2018-05-29 | Twist Bioscience Corporation | Devices and methods for oligonucleic acid library synthesis |
CN107636163A (zh) | 2015-04-29 | 2018-01-26 | 加利福尼亚大学董事会 | 用于构建链特异性cDNA文库的组合物和方法 |
WO2016183100A1 (en) * | 2015-05-11 | 2016-11-17 | Twist Bioscience Corporation | Compositions and methods for nucleic acid amplification |
CA2998169A1 (en) | 2015-09-18 | 2017-03-23 | Twist Bioscience Corporation | Oligonucleic acid variant libraries and synthesis thereof |
CN108698012A (zh) | 2015-09-22 | 2018-10-23 | 特韦斯特生物科学公司 | 用于核酸合成的柔性基底 |
EP3384077A4 (en) | 2015-12-01 | 2019-05-08 | Twist Bioscience Corporation | FUNCTIONALIZED SURFACES AND THEIR PREPARATION |
CN115369161A (zh) | 2015-12-04 | 2022-11-22 | 10X 基因组学有限公司 | 用于核酸分析的方法和组合物 |
WO2017197338A1 (en) | 2016-05-13 | 2017-11-16 | 10X Genomics, Inc. | Microfluidic systems and methods of use |
CN116445593A (zh) * | 2016-08-10 | 2023-07-18 | 格里尔公司 | 测定一生物样品的一甲基化图谱的方法 |
KR102212257B1 (ko) | 2016-08-22 | 2021-02-04 | 트위스트 바이오사이언스 코포레이션 | 드 노보 합성된 핵산 라이브러리 |
WO2018053362A1 (en) | 2016-09-15 | 2018-03-22 | ArcherDX, Inc. | Methods of nucleic acid sample preparation |
AU2017328953B2 (en) | 2016-09-15 | 2023-09-14 | Archerdx, Llc | Methods of nucleic acid sample preparation for analysis of cell-free DNA |
US10417457B2 (en) | 2016-09-21 | 2019-09-17 | Twist Bioscience Corporation | Nucleic acid based data storage |
CN110024037B (zh) * | 2016-11-30 | 2023-06-27 | 微软技术许可有限责任公司 | 经由连接的dna随机存取存储*** |
US10907274B2 (en) | 2016-12-16 | 2021-02-02 | Twist Bioscience Corporation | Variant libraries of the immunological synapse and synthesis thereof |
US10550429B2 (en) | 2016-12-22 | 2020-02-04 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10815525B2 (en) | 2016-12-22 | 2020-10-27 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10011872B1 (en) | 2016-12-22 | 2018-07-03 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
GB2559117B (en) * | 2017-01-19 | 2019-11-27 | Oxford Nanopore Tech Ltd | Double stranded polynucleotide synthesis method, kit and system |
EP4029939B1 (en) | 2017-01-30 | 2023-06-28 | 10X Genomics, Inc. | Methods and systems for droplet-based single cell barcoding |
US11550939B2 (en) | 2017-02-22 | 2023-01-10 | Twist Bioscience Corporation | Nucleic acid based data storage using enzymatic bioencryption |
US10894959B2 (en) | 2017-03-15 | 2021-01-19 | Twist Bioscience Corporation | Variant libraries of the immunological synapse and synthesis thereof |
US20180340169A1 (en) | 2017-05-26 | 2018-11-29 | 10X Genomics, Inc. | Single cell analysis of transposase accessible chromatin |
SG11201901822QA (en) | 2017-05-26 | 2019-03-28 | 10X Genomics Inc | Single cell analysis of transposase accessible chromatin |
WO2018231864A1 (en) | 2017-06-12 | 2018-12-20 | Twist Bioscience Corporation | Methods for seamless nucleic acid assembly |
EP3638782A4 (en) | 2017-06-12 | 2021-03-17 | Twist Bioscience Corporation | SEALLESS NUCLEIC ACID ASSEMBLY METHODS |
CN107217052A (zh) * | 2017-07-07 | 2017-09-29 | 上海交通大学 | 一种定量高通量测序文库的制备方法及其配套试剂盒 |
CN111566125A (zh) | 2017-09-11 | 2020-08-21 | 特韦斯特生物科学公司 | Gpcr结合蛋白及其合成 |
CN109486923B (zh) * | 2017-09-11 | 2022-02-18 | 广州永诺生物科技有限公司 | 多重扩增子测序用引物***、其应用以及测序文库的构建方法 |
CA3078147A1 (en) * | 2017-10-13 | 2019-04-18 | Ribbon Biolabs Gmbh | A novel method for synthesis of polynucleotides using a diverse library of oligonucleotides |
KR20240024357A (ko) | 2017-10-20 | 2024-02-23 | 트위스트 바이오사이언스 코포레이션 | 폴리뉴클레오타이드 합성을 위한 가열된 나노웰 |
US11099202B2 (en) | 2017-10-20 | 2021-08-24 | Tecan Genomics, Inc. | Reagent delivery system |
CN111051523B (zh) | 2017-11-15 | 2024-03-19 | 10X基因组学有限公司 | 功能化凝胶珠 |
US10829815B2 (en) | 2017-11-17 | 2020-11-10 | 10X Genomics, Inc. | Methods and systems for associating physical and genetic properties of biological particles |
US10936953B2 (en) | 2018-01-04 | 2021-03-02 | Twist Bioscience Corporation | DNA-based digital information storage with sidewall electrodes |
CN108486100A (zh) * | 2018-03-22 | 2018-09-04 | 苏州泰康吉安仪器科技有限公司 | 一种dna长度可控片段化方法及其在构建文库中的应用 |
SG11202009889VA (en) | 2018-04-06 | 2020-11-27 | 10X Genomics Inc | Systems and methods for quality control in single cell processing |
GB201807793D0 (en) * | 2018-05-14 | 2018-06-27 | Oxford Nanopore Tech Ltd | Method |
EP3814497A4 (en) | 2018-05-18 | 2022-03-02 | Twist Bioscience Corporation | POLYNUCLEOTIDES, REAGENTS, AND METHODS FOR NUCLEIC ACID HYBRIDIZATION |
EP3666904A1 (en) | 2018-12-14 | 2020-06-17 | Lexogen GmbH | Nucleic acid amplification and identification method |
SG11202109283UA (en) | 2019-02-26 | 2021-09-29 | Twist Bioscience Corp | Variant nucleic acid libraries for antibody optimization |
US11492727B2 (en) | 2019-02-26 | 2022-11-08 | Twist Bioscience Corporation | Variant nucleic acid libraries for GLP1 receptor |
EP3988666B1 (en) * | 2019-06-20 | 2023-10-25 | BGI Shenzhen | Method for constructing library on basis of rna samples, and use thereof |
EP3987019A4 (en) | 2019-06-21 | 2023-04-19 | Twist Bioscience Corporation | BARCODE-BASED NUCLEIC ACID SEQUENCE ARRANGEMENT |
CN110628886B (zh) * | 2019-09-05 | 2022-09-30 | 华侨大学 | 一种检测dna中的单链断裂的方法 |
US20230416727A1 (en) * | 2020-11-06 | 2023-12-28 | The University Of Chicago | Hairpin oligonucleotides and uses thereof |
WO2022212589A1 (en) * | 2021-03-31 | 2022-10-06 | Illumina, Inc. | Blocking oligonucleotides for the selective depletion of non-desirable fragments from amplified libraries |
CN113249507B (zh) * | 2021-07-05 | 2021-12-10 | 湖南赛哲智造科技有限公司 | 一种病原耐药基因的存在及表达情况的共检测方法 |
CN114350756A (zh) * | 2021-11-22 | 2022-04-15 | 西安交通大学 | 基于dna切刻/聚合链置换循环反应的全基因组自引发扩增方法及试剂盒 |
CN115852495B (zh) * | 2022-12-30 | 2023-09-15 | 苏州泓迅生物科技股份有限公司 | 一种基因突变文库的合成方法及其应用 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1573056A4 (en) * | 2002-05-17 | 2007-11-28 | Nugen Technologies Inc | METHODS FOR FRAGMENTATION, LABELING AND IMMOBILIZATION OF NUCLEIC ACIDS |
EP2272976A1 (en) * | 2009-07-06 | 2011-01-12 | Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. | Method for differentiation of polynucleotide strands |
WO2011019964A1 (en) * | 2009-08-12 | 2011-02-17 | Nugen Technologies, Inc. | Methods, compositions, and kits for generating nucleic acid products substantially free of template nucleic acid |
US8722585B2 (en) * | 2011-05-08 | 2014-05-13 | Yan Wang | Methods of making di-tagged DNA libraries from DNA or RNA using double-tagged oligonucleotides |
-
2013
- 2013-09-18 US US14/030,761 patent/US20140274729A1/en not_active Abandoned
-
2014
- 2014-03-12 CA CA2903125A patent/CA2903125A1/en not_active Abandoned
- 2014-03-12 JP JP2016501581A patent/JP2016511007A/ja active Pending
- 2014-03-12 EP EP14769547.2A patent/EP2971289A1/en not_active Withdrawn
- 2014-03-12 SG SG11201507136SA patent/SG11201507136SA/en unknown
- 2014-03-12 CN CN201480016197.6A patent/CN105143525A/zh active Pending
- 2014-03-12 WO PCT/US2014/024581 patent/WO2014150931A1/en active Application Filing
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021166989A1 (ja) * | 2020-02-18 | 2021-08-26 | 国立研究開発法人理化学研究所 | アダプター配列が付加されたdna分子を製造する方法、およびその利用 |
JP7276571B1 (ja) | 2022-06-20 | 2023-05-18 | 凸版印刷株式会社 | フラップエンドヌクレアーゼの蛍光基質における三重鎖構造の形成効率を向上させる方法 |
JP2024000310A (ja) * | 2022-06-20 | 2024-01-05 | Toppanホールディングス株式会社 | フラップエンドヌクレアーゼの蛍光基質における三重鎖構造の形成効率を向上させる方法 |
Also Published As
Publication number | Publication date |
---|---|
SG11201507136SA (en) | 2015-10-29 |
EP2971289A1 (en) | 2016-01-20 |
CN105143525A (zh) | 2015-12-09 |
CA2903125A1 (en) | 2014-09-25 |
US20140274729A1 (en) | 2014-09-18 |
WO2014150931A1 (en) | 2014-09-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11697843B2 (en) | Methods for creating directional bisulfite-converted nucleic acid libraries for next generation sequencing | |
JP2016511007A (ja) | 鎖になったrnaまたはdnaのライブラリを生成するための方法、組成物およびキット | |
US20210071171A1 (en) | Compositions and methods for targeted nucleic acid sequence enrichment and high efficiency library generation | |
US9745614B2 (en) | Reduced representation bisulfite sequencing with diversity adaptors | |
US9206418B2 (en) | Compositions and methods for directional nucleic acid amplification and sequencing | |
US20110224105A1 (en) | Methods, compositions, and kits for generating nucleic acid products substantially free of template nucleic acid | |
KR102398479B1 (ko) | 카피수 보존 rna 분석 방법 | |
CN109511265A (zh) | 通过链鉴定改进测序的方法 | |
US11993805B2 (en) | Methods, compositions, and kits for preparing nucleic acid libraries | |
JP2022160661A (ja) | 単一分子配列決定のための一本鎖環状dna鋳型の作成 |