JP6374964B2

JP6374964B2 - 特別なキャプチャープローブ（ｈｅａｔｓｅｑ）を使用したシークエンスキャプチャー法

Info

Publication number: JP6374964B2
Application number: JP2016530538A
Authority: JP
Inventors: アルバート，トーマス; ノートン，ジェイソン; パテル，ジガー; バージェス，ダニエル; リアミチェフ，ヴィクター; ブロックマン，マイケル
Original assignee: F Hoffmann La Roche AG
Current assignee: F Hoffmann La Roche AG
Priority date: 2013-08-02
Filing date: 2014-07-31
Publication date: 2018-08-15
Anticipated expiration: 2034-07-31
Also published as: JP2016525363A; EP3027766A1; CA2917782A1; WO2015014962A1; US20150141257A1; CN105980574A

Description

本発明は、ゲノムまたは複合ＤＮＡ試料のターゲテッド領域をキャプチャーして、ターゲテッド領域（単数または複数）内にみられる遺伝子多型の効率的な検査および／または検出を可能にするための方法の分野に関する。

ゲノムのターゲテッド領域を効率的にキャプチャーする方法は、疾患または他の形質に関連する遺伝子多型を迅速シークエンシング仲介により検知および検出するのを可能にすることができる。二本鎖のアダプターライゲートしたシークエンシングライブラリーをターゲットキャプチャーのための材料として利用する現在のハイブリダイゼーションベースの手法は時間がかかり、資源集約的である。ターゲットキャプチャーのための伝統的な分子反転プローブ(molecular inversion probe)（ＭＩＰ）ベースの方法はシークエンシング前のワークフロー時間を短縮できるが、遺伝子座増幅／提示(representation)バイアス、対立遺伝子バイアス、および特定のシークエンシングプラットフォームに関連する系統的アーチファクトのため制限される。

本発明は、改良されたＭＩＰを大量に並行製造するための新規プロトコルである。このＭＩＰに対する分子改良は、プローブの作製、ワークフロー、試料特異性を伴なう固有配列エレメントおよび初期試料集団中に存在する特異的分子を独自に識別する配列タグの付加をカバーする。最後に、本発明を遺伝子座提示バイアスと対立遺伝子バイアスの両方の問題を克服する経験的最適化戦略とも組み合わせる。この改良された手法は規模拡大が可能であり、単一遺伝子座のアンプリコンから構成されるターゲットの増幅から１００万以上の遺伝子座のターゲティングまで利用できる。

下記の本発明の態様の記載を添付の図面と合わせて参照することによって、本発明の特徴およびそれらを達成する方法がより明らかになり、本発明自体がより良く理解されるであろう。
図１は、ＭＩＰ前駆体、増幅されるＭＩＰ前駆体、および増幅生成物の制限消化を記載した模式図である。図２は、酵素消化生成物のアガロースゲル精製である。図３は、ゲノムＤＮＡのターゲテッド鎖にハイブリダイズしている７０−ｍｅｒＭＩＰプローブ、およびＭＩＰプローブの伸長／ライゲーションを表わす。図４は、伸長／ライゲーション後のＭＩＰプローブ（すなわち、“キャプチャーした”生成物を含むもの）のゲル精製である。図５は、２０−ｍｅｒターゲット領域をもつプローブの融点範囲および可変長ターゲット領域をもつプローブの融点範囲（Ｔｍ平衡化したもの）を示すグラフである。図６は、固定長プローブ（挿入図）およびＴｍ平衡化した可変長プローブ（主グラフ）のシークエンスカバレージ(sequence coverage)を示すグラフである。図７は、ＵＩＤを含むＭＩＰ前駆体、ＭＩＰ前駆体の増幅、増幅生成物のニッキング、およびシークエンスキャプチャーに際して用いたブロッキングオリゴヌクレオチドを記載した模式図である。図８は、ＤＮＡターゲットへのＵＩＤ配列を含むＭＩＰプローブのハイブリダイゼーション、およびＭＩＰプローブの環化を表わす。図９は、伸長／ライゲーション後のＭＩＰプローブのゲル精製を示す。図１０は、ＵＩＤ配列の使用を表わす。図１１は、ＭＩＰプローブの合成を表わす模式図である。図１２（１２Ａおよび１２Ｂ）は、ＭＩＰプローブを使用したワークフローを表わす図である。図１２（１２Ａおよび１２Ｂ）は、ＭＩＰプローブを使用したワークフローを表わす図である。図１３は、試料源を同定するための試料インデックス（ＭＩＤ）の使用を表わす。図１４は、事象カウンティングのためのＵＩＤ配列の使用を表わす。図１５は、１プローブからのＵＩＤタグの分布を示す。図１６は、プローブ再平衡化の結果を示す。

これらの図面は本発明の態様を示すが、これらの図面は必ずしも正確な縮尺率ではなく、本発明をより良く図示および説明するために特定の特徴が誇張されている場合がある。ここに述べる代表例は本発明の代表的態様を１形態で図示したものであり、それらの代表例が何らかの形で本発明の範囲を限定するものと解釈すべきではない。

伝統的に、分子反転プローブ（ＭＩＰ）は、それらの末端またはその付近に一本鎖ターゲットヌクレオチド配列の２つの離れた部分に対して特異的に相補性である領域をもつ一本鎖核酸プローブであった。末端にあるそれらのターゲット特異的部分がターゲット配列に適正にアラインして相補するために本質的に環状構造をとるのでそれらのプローブは“反転”し、あるいは逆にターゲット領域とターゲット特異的部分の間での同じ相互作用を可能にするためにターゲットが“反転”する。本発明は、データ解析のために有用な配列、そのようなＭＩＰを作製するための改良された合成方法、およびＭＩＰプローブプールを最適化するために有用な方法を提供することにより、ＭＩＰの改良を提供する。

本発明は、核酸試料の複雑性を低減するための核酸キャプチャープローブのセットを含み、セットの各プローブは下記のものを含む：複合試料中に存在する第１ターゲット配列に特異的にハイブリダイズする第１末端配列；複合試料中に存在する第２ターゲット配列に特異的にハイブリダイズする第２末端配列；ここで、第１ターゲット配列と第２ターゲット配列は両方とも同一ターゲット鎖上に位置する；ならびに第１末端配列と第２末端配列を連結するリンカー配列であって、固有識別子（ＵＩＤ）配列を含むリンカー配列；ここで、ＵＩＤは、プローブの形成に際してプローブのセット中の個々のプローブそれぞれについてランダムヌクレオチド合成により生成したランダム生成タグ配列である。

本発明は、対立遺伝子バイアス、遺伝子座増幅／提示バイアス、および特定のシークエンシングプラットフォームに関連する系統的アーチファクトを判定するための改良された特徴を備えた、ＭＩＰプローブを含む。さらに、本発明は、ＭＩＰプローブを作製するための鋳型としてアレイを用いてそのような改良されたＭＩＰプローブを作製する特定の方法をも含む。ある態様において、ＭＩＰプローブはＭＩＰプローブのための鋳型としてアレイを用いて作製される。特定の態様において、本発明は、マスクレス・アレイ合成(Maskless Array Synthesis)（ＭＡＳ）(参照：Singh-Gasson et al., Nature Biotechnology, 17: 974-978, 1999, 本明細書に援用する)でＭＩＰプローブを作製することを含む。

ある態様において、ＭＩＰプローブはプローブデザインを最適化するように設計される。特定の態様において、プローブプールはプローブ再分布を用いて設計される。プローブ再分布は、アレイの表面全体にわたって同一プローブの多重複製物を合成することにより合成に際して個々のプローブの相対濃度を低下または増大させることによって実施される。ある態様において、プローブプール中のプローブはプローブ長さ最適化を用いて設計される。ある態様において、プローブはプローブ動態最適化を用いて、たとえば最適プローブデザインを決定するためのＴｍ（融解温度）を用いて設計される。

ある態様において、ＭＩＰプローブは分子ＩＤタグ(Molecular ID tag)（ＭＩＤ）を含む。そのようなＭＩＤは、本質的に、キャプチャーされた核酸が由来する試料を同定する目的に用いられる“バーコード”核酸配列である。したがって、ＭＩＤ配列は試料特異的識別子の使用により元の試料の同定を可能にし、ここで、特定の試料からキャプチャーされた各配列は共通のバーコード配列を共有する。ＭＩＤ配列は多種多様な方法で試料に付加することができ、それにはＭＩＤ配列を含むアダプター配列とのライゲーション、またはＭＩＤ配列を含むプライマーを用いる増幅によるものが含まれる。

特定の態様において、ＭＩＤバーコードはＭＩＰプローブ中に存在せず、プライマー部位およびＭＩＤバーコードを含む別の部位を含むプライマーを用いてプローブが複製および伸長された後に初めて存在する。ある態様において、ＭＩＰプローブをターゲット配列と接触させた後に初めて、ＭＩＤバーコードが付加される。この態様の一例は、ＭＩＰプローブ（ＭＩＤバーコードを含まないもの）がそれのターゲット配列と接触して特異的にハイブリダイズした時点で行なわれる。伸長およびライゲーションによりＭＩＰプローブは環化し、次いでこの環化したＭＩＰプローブは付加されたＭＩＤバーコードを含むプライマーを用いて複製／増幅される。

本発明は、核酸試料の複雑性を低減するための核酸キャプチャープローブのセットを含む。プローブは、複合試料中に存在する第１ターゲット配列に特異的にハイブリダイズする第１末端配列、および複合試料中に存在する第２ターゲット配列に特異的にハイブリダイズする第２末端配列を含む。この態様において、第１ターゲット配列と第２ターゲット配列は両方とも同一ターゲット鎖上に位置する。プローブは、第１末端配列と第２末端配列を連結するリンカー配列をも含み、このリンカー配列は固有識別子（ＵＩＤ）配列を含む。ＵＩＤは、プローブの形成に際してプローブのセット中の個々のプローブそれぞれについて化学的に誘導したランダムヌクレオチド合成により生成したランダム生成タグ配列である。

特定の態様において、プローブはさらにＭＩＤバーコードを含み、ここで、特定の核酸試料に使用するプローブはすべて同一のＭＩＤバーコード配列を含む。この方法で、特定の試料からのすべての結果をトラッキングすることができる。

本発明の特定の態様は、下記を含む方法をも伴なう：ａ）アレイ上でＭＩＰ前駆体を合成することであって、その際、前駆体は１以上のプライマー、１以上の制限部位、ならびにＭＩＰ前駆体の一方の末端付近に第１末端ターゲット配列および反対側の末端付近に第２末端ターゲット配列を含む；ｂ）ＭＩＰ前駆体を溶液中へ増幅すること；ｃ）溶液を採集すること；およびｄ）増幅した前駆体を１種類以上の制限酵素を使用して消化して、ＭＩＰプローブを形成すること。特定の態様において、ＭＩＰ前駆体はさらに固有識別子（ＵＩＤ）配列を含む。

本発明の特定の態様は、第１末端ターゲット配列および／または第２末端ターゲット配列の融解温度を近接または一致させるために、これら２種類のターゲット配列の配列長さを変更する方法をも伴なう。この融点温度の一致によって、ＭＩＰプローブプールについてのシークエンスカバレージが増大する。

１態様において、ＭＩＰプローブがＭＩＰ前駆体のエレメントまたはその増幅生成物に再ハイブリダイズするのを阻止するように設計されたブロッキングオリゴヌクレオチドの存在下で、ハイブリダイゼーション工程を実施する。

ＭＩＰ前駆体からニッキング酵素（またはこの方法に有用な他の酵素、たとえば鎖を破断できる酵素、たとえばＵＤＧ／ＵＮＧ）を用いて作製したＭＩＰプローブを、領域ＸおよびＹにより規定される領域のターゲテッドキャプチャーのために使用する。ＭＩＰはニッキングされたけれども二本鎖であり、したがってハイブリダイゼーション工程で変性した際にこの二本鎖ＭＩＰから有効な一本鎖ＭＩＰが放出されるであろう。この一本鎖の有効ＭＩＰがそれの相補体に再ハイブリダイズして元の二本鎖ＭＩＰを形成するのを阻止するために、３０−ｍｅｒのブロッキングオリゴ（３００−２４−１）を添加する。このオリゴ（３００−２４−１）は高いモル過剰で添加されるので、二本鎖ＭＩＰカセットに優先的にハイブリダイズして、先に放出された有効な一本鎖ＭＩＰがデュプレックスを形成するのを阻止するであろう。有効な一本鎖ＭＩＰはこうして後続の伸長＋ライゲーション反応においてターゲテッドキャプチャーに利用できる状態になり、それにより環状ＭＩＰが得られるであろう。

本発明は、ターゲット配列の一部を同定するために下記によりＭＩＰプローブを使用する態様をも含む：ａ）ＭＩＰプローブを核酸試料にハイブリダイズさせること；ｂ）核酸試料の一部が複製されて環化ＭＩＰプローブに組み込まれるように、ＭＩＰプローブをポリメラーゼで環化すること；ｃ）エキソヌクレアーゼを使用して線状核酸を実質的に消化すること；およびｄ）ＭＩＰプローブの配列を決定すること。配列が決定されると、いずれかのＵＩＤ配列（特定の態様において使用した場合）が予想結果と比較して過剰提示または過小提示されているかを判定するためにＵＩＤ配列を使用できる。

本発明方法の１態様において、アレイ合成はマスクレス・アレイ合成を使用して実施される。ＭＡＳは核酸合成のための経済的で高フレキシブルなプラットフォームであるという利点をもち、したがってＭＡＳの使用は他の合成法より有利になることができる。

本発明の特定の態様において、プローブ選択は、たとえばターゲティングするエキソンが小さい（通常は１５０塩基未満）場合、単一エキソンをカバーするために１つのプローブを必要とするにすぎない可能性がある。他の態様において、プローブ選択は、より大きなターゲット、たとえばより大きなエキソンをカバーするために多数のプローブを必要とし、シークエンシング工程を用いてターゲテッドオーバーラップを決定し、そしてターゲット配列をアセンブリングする。ある態様において、大きな領域と小さな領域の両方をターゲティングし、両方法を合わせたものが必要となる。

本発明の開示に際して、特定の用語は以下の節に記載する意味をもつ。
用語“a”、“an”および“the”は、一般に、そうではないことが内容から明らかに示されない限り複数表記を含む。

用語“増幅(amplification)”は、一般に、ターゲット核酸から複数の核酸分子を生成することを表わし、ここで、ポリメラーゼによる伸長の開始部位を提供するためにプライマー類がターゲット核酸分子上の特定部位にハイブリダイズする。増幅は当技術分野で一般に知られているいずれかの方法、たとえば標準ＰＣＲ、ロングＰＣＲ(long PCR)、ホットスタートＰＣＲ(hot start PCR)、ｑＰＣＲ、ＲＴ−ＰＣＲおよび等温増幅(Isothermal Amplification)により実施できるが、これらに限定されない。本明細書中で用いる用語“増幅する(amplifying)”は、一般に、ターゲット核酸から複数の核酸分子を生成することを表わし、ここで、ポリメラーゼによる伸長の開始部位を提供するために少なくとも１つのプライマーがターゲット核酸分子上の特定部位にハイブリダイズする。増幅は当技術分野で一般に知られているいずれかの方法、たとえば標準ＰＣＲ、ロングＰＣＲ、ホットスタートＰＣＲ、ｑＰＣＲ、ＲＴ−ＰＣＲおよび等温増幅により実施できるが、これらに限定されない。他の増幅反応には、特にリガーゼ連鎖反応、ポリメラーゼリガーゼ連鎖反応、Ｇａｐ−ＬＣＲ、修復連鎖反応(Repair Chain Reaction)、３ＳＲ、ＮＡＳＢＡ、鎖置換増幅(Strand Displacement Amplification)（ＳＤＡ）、転写仲介増幅(Transcription Mediated Amplification)（ＴＭＡ）、およびＱｂ増幅が含まれる。

用語“相補性”は、一般に、２つのヌクレオチドの塩基間で適切な温度およびイオン性緩衝液の条件下において好ましい熱力学的安定性および特異的対合を形成する能力を表わす。この対合は各ヌクレオチドの水素結合特性に依存する。これの最も基本的な例は、チミン／アデニン塩基およびシトシン／グアニン塩基間の水素結合対である。本発明において、ターゲット核酸の増幅のためのプライマーは両方ともそれらの長さ全体にわたってターゲット核酸分子と完全に相補的であってもよく、あるいは“準相補的”であってもよく、この場合、プライマーはターゲット核酸に最小限にハイブリダイズできるかまたはハイブリダイズできない追加の非相補配列を含む。

本明細書中で用いる用語“検出する”は、一般に、試料中のターゲット核酸分子の存在または非存在の査定を目的とした定性試験に関係する。
本明細書中で用いる用語“エンリッチした”は、一般に、ターゲット核酸を含む試料を処理するいずれかの方法であって、ターゲット核酸を試料中に存在する他の材料の少なくとも一部から分離できる方法に関係する。したがって、“エンリッチメント”は他の材料より多量のターゲット核酸の生成であると解釈される。

用語“過剰”は、一般に、特定の試薬または試薬類が他のものと比較してより多量またはより高濃度であることを表わす。
用語“ハイブリダイズ”は、一般に、それらのヌクレオチド配列が調和する異なる核酸分子間の塩基対合を表わす。用語“ハイブリダイズ”と“アニール”は互換性をもって使用できる。

用語“核酸”または“ポリヌクレオチド”は互換性をもって使用でき、リボース核酸（ＲＮＡ）もしくはデオキシリボース核酸（ＤＮＡ）のポリマーに該当するポリマー、またはそのアナログを表わす。これには、ヌクレオチドのポリマー、たとえばＲＮＡおよびＤＮＡ、ならびに合成形態、その修飾された（たとえば、化学的または生化学的に修飾された）形態、および混合ポリマー（たとえば、ＲＮＡとＤＮＡの両方のサブユニットを含むもの）が含まれる。代表的な修飾には、メチル化、アナログによる１以上の天然ヌクレオチドの置換、ヌクレオチド間修飾、たとえば非荷電結合（たとえば、メチルホスホネート、ホスホトリエステル、ホスホアミデート、カルバメートなど）、ペンデント(pendent)部分（たとえば、ポリペプチド）、インターカレーター（たとえば、アクリジン、プソラレン(psoralen)など）、キレーター、アルキレーター(alkylator)、および修飾された結合（たとえば、アルファアノマー核酸など）が含まれる。指定配列に水素結合その他の化学的相互作用により結合するそれらの能力においてポリヌクレオチドを模倣した合成分子も含まれる。一般に、ヌクレオチドモノマーはホスホジエステル結合により連結するが、合成形態の核酸は他の結合を含むことができる（たとえば、Nielsen et al. (Science 254:1497-1500, 1991に記載されるペプチド核酸)。核酸は、たとえば染色体または染色体セグメント、ベクター（たとえば、発現ベクター）、発現カセット、裸のＤＮＡまたはＲＮＡポリマー、ポリメラーゼ連鎖反応（ＰＣＲ）の生成物、オリゴヌクレオチド、プローブ、およびプライマーであるか、あるいはそれらを含むことができる。核酸は、たとえば一本鎖、二本鎖、または三本鎖であってもよく、いずれか特定の長さに限定されない。別途指示しない限り、個々の核酸配列は明示したいずれかの配列のほかに相補配列を含むかまたはコードする。

用語“ヌクレオチド”は、天然のリボヌクレオチドまたはデオキシリボヌクレオチドのモノマーのほかに、本明細書中ではその関連構造バリアントを表わすと解釈すべきであり、状況からそうではないことが明示されない限り、それにはヌクレオチドが使用される特定の状況（たとえば、相補的塩基へのハイブリダイゼーション）に関して機能均等である誘導体およびアナログが含まれる。

用語“オリゴヌクレオチド”は、少なくとも２つの核酸モノマー単位（たとえば、ヌクレオチド）を含む核酸を表わす。オリゴヌクレオチドは一般的には約６から約１７５までの核酸モノマー単位、より一般的には約８から約１００までの核酸モノマー単位、よりさらに一般的には約１０から約５０までの核酸モノマー単位（たとえば、約１５、約２０、約２５、約３０、約３５、またはより多数の核酸モノマー単位）を含む。オリゴヌクレオチドの厳密なサイズは、そのオリゴヌクレオチドの最終的な機能または用途を含めた多数の要因に依存するであろう。オリゴヌクレオチドは所望によりいずれか適切な方法によって調製され、それには既存配列または天然配列の単離、ＤＮＡの複製または増幅、逆転写、適切な配列のクローニングおよび制限消化、あるいは下記の方法による直接化学合成が含まれるが、それらに限定されない：たとえば、Narang et al.(Meth. Enzymol. 68:90-99, 1979)のホスホトリエステル法；Brown et al.(Meth. Enzymol. 68:109-151, 1979)のホスホジエステル法；Beaucage et al. (Tetrahedron Lett. 22:1859-1862, 1981)のジエチルホスホルアミダイト法；Matteucci et al. (J. Am. Chem. Soc. 103:3185-3191, 1981)のトリエステル法；自動合成法；Singh-Gasson et al., Nature Biotechnology, 17: 974-978, 1999に記載されるマスクレス・アレイ合成、もしくはU.S. Pat. No. 4,458,066の固体支持体法、または当業者に既知の他の方法。

用語“プライマー”は、ポリヌクレオチド伸長が開始する条件下（たとえば、適切な緩衝液中で、適切な温度または温度サイクル（単数または複数）における、必要なヌクレオシド三リン酸（コピーされる鋳型により指示されるもの）およびポリメラーゼの存在を含む条件下（たとえば、ポリメラーゼ連鎖反応の場合のように））に置かれた際に、鋳型指向性核酸合成(template-directed nucleic acid synthesis)の開始点として作用することができるポリヌクレオチドを表わす。さらに説明すると、プライマーは他の多様なオリゴヌクレオチド仲介合成法にも使用でき、それには de novo ＲＮＡ合成および in vitro 転写関連方法（たとえば、核酸配列ベースの増幅(nucleic acid sequence-based amplification)（ＮＡＳＢＡ）、転写仲介増幅(transcription mediated amplification)（ＴＭＡ）など）のイニシエーターとしての使用が含まれる。プライマーは、一般に一本鎖オリゴヌクレオチド（たとえば、オリゴデオキシリボヌクレオチド）である。プライマーの適切な長さはそのプライマーの目的用途に依存するが、一般的に６から４０までのヌクレオチド、より一般的には１５から３５までのヌクレオチドの範囲である。短いプライマー分子は、一般に鋳型との十分に安定なハイブリッド複合体を形成するために必要な温度がより低い。プライマーは必ずしも鋳型の厳密な配列を反映する必要はないが、プライマー伸長が起きるためには鋳型とハイブリダイズするのに十分なほど相補的でなければならない。特定の態様において、用語“プライマー対”は、増幅すべき核酸配列の５’末端の相補体とハイブリダイズする５’センスプライマー（時には“フォワード”と呼ばれる）および増幅すべき核酸配列の３’末端の相補体とハイブリダイズする３’アンチセンスプライマー（時には“リバース”と呼ばれる）を含むプライマーのセットを意味する（たとえば、ターゲット配列がＲＮＡとして発現するか、あるいはＲＮＡであれば）。プライマーは、所望により、分光、光化学、生化学、免疫化学または化学的な手段により検出できる標識を取り込ませることによって標識できる。たとえば、有用な標識には、３２Ｐ、蛍光色素、高電子密度試薬、酵素（ＥＬＩＳＡアッセイにおいて一般に用いられるもの）、ビオチン、またはハプテンおよびタンパク質であってそれに対する抗血清もしくはモノクローナル抗体が得られるものが含まれる。

本発明の意味において、核酸の“精製”、“単離”または“抽出”は、下記に関係する：核酸をたとえば増幅による診断アッセイで分析する前に、それらを一般に種々の成分の複合混合物を含有する生物試料から精製、単離または抽出しなければならない。第１工程として、核酸のエンリッチメントを可能にする方法を使用できる。そのようなエンリッチメントの方法は本明細書に記載されている。

本明細書中で用いる用語“定量する”は、試料中に存在するターゲット核酸の量または濃度の決定に関係する。
“ターゲット核酸”は、本明細書中で試料中の分析すべき核酸、すなわち試料中のその存在、非存在、核酸配列および／または量を決定すべき核酸を表わすために用いられる。ターゲット核酸はゲノム配列、たとえば特定の遺伝子の一部、ＲＮＡ、ｃＤＮＡ、または他のいずれの形態の核酸配列であってもよい。ある態様において、ターゲット核酸はウイルス性または微生物性のものであってもよい。

用語“ターゲット核酸”と“ターゲット分子”は互換性をもって使用でき、増幅反応の対象である核酸分子を表わし、所望によりそれの配列情報を得るためにシークエンシング反応によりそれを調べることができる。

用語“ターゲット特異的領域”または“対象領域”は互換性をもって使用でき、特定の核酸分子の科学的対象である領域を表わす。これらの領域は、対象領域（単数または複数）を囲む増幅反応用プライマーを設計し、それによりこれらの対象領域を含むターゲット核酸アンプリコンを回収するために、一般に少なくとも部分的に既知の配列をもつ。

用語“熱安定性ポリメラーゼ”は、熱に対して安定であり、耐熱性であり、二本鎖核酸を変性させるのに必要な時間、高められた温度を付与した際に、後続のポリヌクレオチド伸長反応を行なうのに十分な活性を保持し、不可逆的に変性（不活性化）することのない酵素を表わす。核酸変性に必要な加熱条件は当技術分野で周知であり、たとえばU.S. Patent No. 4,683,202、4,683,195、および4,965,188に例示されている。本発明に用いる熱安定性ポリメラーゼは、温度サイクリング反応、たとえばポリメラーゼ連鎖反応“ＰＣＲ”に使用するのに適している。本発明の目的について、不可逆的変性は永続的かつ完全な酵素活性喪失を表わす。熱安定性ポリメラーゼについて、酵素活性は、ヌクレオチドを適正に結合させて鋳型核酸鎖に対して相補的なポリヌクレオチド伸長生成物を形成する触媒作用を表わす。好熱性細菌からの熱安定性ＤＮＡポリメラーゼには、たとえばテルモトガ・マリチマ(Thermotoga maritima)、テルムス・アクアティカス(Thermus aquaticus)、テルムス・テルモフィルス(Thermus thermophilus)、テルムス・フラブス(Thermus flavus)、テルムス・フィリホルミス(Thermus filiformis)、テルムス属種Ｓｐｓ１７、テルムス属種Ｚ０５、テルムス・カルドフィルス(Thermus caldophilus)、バチルス・カルドテナックス(Bacillus caldotenax)、テルモトガ・ネオポリタナ(Thermotoga neopolitana)、テルモシフォ・アフリカヌス(Thermosipho africanus)からのＤＮＡポリメラーゼが含まれる。

用語“マスクレス・アレイ合成(Maskless Array Synthesis)”（ＭＡＳ）は、アレイとしての基体の表面における物理的マスクの非存在下でのオリゴヌクレオチドの光指向合成(light-directed synthesis)を表わす；たとえば、Singh-Gasson et al., Nature Biotech, 17: 974-978 (Oct. 1999)により記載された方法；それの教示内容を本明細書に援用する。簡単に述べると、ＭＡＳ法は、一般に、バーチャルマスクを形成するマイクロミラーからなるデジタルマイクロアレイミラーデバイス(digital microarray mirror device)（ＤＭＤ）を使用する。これらのミラーは個々にアドレス指定でき、いずれか特定のパターンまたはイメージを作成するために広域波長で使用できる。ＤＭＤは基体の表面にイメージを形成し、ここで、基体は光によって活性化される化合物部分を含む。次いで指定ヌクレオチドを含有する溶液を基体の表面に流し、活性化された領域に結合させる。溶液に含有されるヌクレオチドは感光性保護基で光保護されている。合成の第２ラウンドで、ＤＭＤは基体の選択された領域上に第２イメージを形成し、これによりそれらの領域の基体を選択的に活性化し、そして第２の指定ヌクレオチド（これも光保護されている）を基体上に流す。この第２ヌクレオチドは、第２ラウンドの照射に際して活性化された領域に結合する。こうして選択したヌクレオチドを選択した領域に付加することができ、マスクの非存在下での光指向合成によりオリゴヌクレオチドのアレイを合成することが可能になる。オリゴヌクレオチド配列を１モノマーずつ構築するためには、このプロセスを多数回反復する。

アレイを構築する他の方法、たとえばクロムマスクの使用、またはアレイ上へのオリゴヌクレオチドのスポッティングも、本発明に使用できる。ＭＡＳは本発明に使用した場合に改良されたフレキシビリティーおよび簡潔性を提供するが、他のアレイ形成法も有用である。本発明に使用できるＭＡＳ以外の合成方式の例は、Ａｆｆｙｍｅｔｒｉｘ、ＯｘｆｏｒｄＧｅｎｅＴｅｃｈｎｏｌｏｇｉｅｓ、およびＡｇｉｌｅｎｔが採用している周知の方法である。

本発明は、ＭＩＰ前駆体分子をアレイ表面で合成し、次いでそれらのＭＩＰ前駆体を溶液中へ増幅することを伴ない、次いでそこで他の製造工程を実施することができる。特定の態様において、ＭＩＰ前駆体をＰＣＲなどの増幅方式により増幅する。そのような態様において、ＭＩＰ前駆体は一般にそれらがそのような後続の増幅工程に有用なプライマー部位を含むように合成される。

本発明の特定の観点において、プローブがＵＩＤ領域を含むようにそれらをアレイ上で製造する。ＵＩＤ領域は個々のプローブに固有のプローブセグメントであり、存在する特定のＵＩＤ配列に基づいてそのプローブを同定できる。ＵＩＤ配列は幾つかの異なる方法で設計でき、それにはプローブに使用すべき特定のＵＩＤ配列の予備計画、コンピューターその他の手段によるランダムＵＩＤ配列作製、続いてＵＩＤ配列をプローブに組み込むためのプローブ合成、または化学的に誘導したランダム合成によるものが含まれる。“化学的に誘導したランダム合成(chemically-derived random synthesis)”は、予備計画なしに、または予めランダム配列決定せずに、プローブ合成に際して数種類のヌクレオチドを混合して同時に合成表面に施し、ランダムに配列に形成させることを意味する。１態様において、光指向合成（たとえば、マスク下アレイ合成またはマスクレス・アレイ合成）に有用な４種類の一般的なヌクレオチド（Ａ、Ｃ、Ｔ、Ｇ）すべてを混合し、数回の連続反復合成に際して添加し、アレイ表面の光活性化された部分にランダムに結合させる。この態様において、Ａ、Ｃ、ＴまたはＧの順序は配列の予備計画なしにランダムであろう。化学的に誘導したランダム合成は、配列を予備計画するための工程がワークフローに追加されないという点で、プローブ製造方法の効率化という利点をもたらす。

実施例１：ＭＩＰプローブプールの調製および精製
ＭＩＰ−前駆体からＭＩＰへの変換のためのプロトコルを図１に詳述する。図１ＡはＭＩＰ−前駆体分子に関する一例を示す。この例では、ＭＩＰ前駆体はアレイ表面に前駆体が形成されるようにＭＡＳユニット上での合成により形成された。この例におけるＭＩＰ前駆体分子は２つの１５ｍｅｒプライマー部位を５’および３’末端に含む。末端プライマー部位に隣接して、ターゲット特異的領域である２つの２０ｍｅｒ部位、Ｘ２０およびＹ２０があり、それらは試料中の特定のターゲット領域の境界をなす特定部位に対して相補的である。Ｘ２０とＹ２０の間にリンカー領域（この場合は３０ｍｅｒ配列）があり、それはこれら２つのターゲット特異的配列を互いに連結している。

次いで２つのプライマーを用いてＭＩＰ前駆体を増幅処理する；この例ではプライマーを図１Ｂに示す。フォワードとリバースの両プライマーがあった。図１Ｂに示すように、フォワードプライマーはＭＩＰ前駆体分子の５’末端セクションにあるものと同一の配列を含み、一方、リバースプライマーはＭＩＰ前駆体分子の３’末端にある配列に対して相補的な配列を含む。したがって、第１増幅工程で、リバースプライマーはＭＩＰ前駆体にハイブリダイズし、伸長して相補配列を生成し、それにその後の増幅工程でフォワードプライマーが結合できる。この例では、入口と出口をもつチャンバー（ＧｒａｃｅＢｉｏ−Ｌａｂ，パーツ０５８７６７０２００１または０５８７１１５８００１）をＭＩＰ−前駆体アレイに付着させて、そこでＭＩＰ−前駆体分子を増幅鋳型として用いた増幅が行なわれるチャンバーを形成した。増幅はサーマルサイクラー内でＳｌｉｄｅＧｒｉｄｄｌｅＡｄａｐｔｏｒ（ＢｉｏＲａｄ，ＳＧＰ０１９６）を用いて実施された。下記のものを含有する in situ ＰＣＲマスターミックスを調製した。

マスターミックスを入れたチューブを９５℃の加熱ブロック内に５分間置いて脱ガスした。ＨｏｔＳｔａｒｔＴａｑ酵素（１１ｕＬ［５Ｕ／ｕｌ］）をミックスに添加して増幅プロトコルを開始した。この例において、用いたプロトコルは下記の工程を伴なっていた：１）アレイを９７℃に１５分間加熱し、その時間の終了付近で１ｍＬのＰＣＲミックスをチャンバーに装填し、装填口をシールし、気泡を除去し、そして第２口をシールする；２）チャンバーを、１００℃／１分；４８℃／１．５分；７８℃／１分の加熱工程で３０回サイクリングする；３）チャンバーを７２℃に１５分間保持する；そして４）最終工程としてチャンバーを４℃に冷却する。

増幅工程の後、一方のシールを解除し、チャンバーから液体を取り出し、ＱｉａｑｕｉｃｋＰＣＲ精製キット（Ｑｉａｇｅｎ）を説明に従って用いて精製した。精製した後、光学濃度測定を用いて精製ＭＩＰ−前駆体の濃度を測定した。プロセスのこの時点で、ＭＩＰ前駆体は図１Ｃに示すように増幅しており、二本鎖形態である。

ＭＩＰ前駆体のさらなる処理を実施した。具体的には、さらに２種類のニッキング酵素を用いて二本鎖前駆体分子を消化した。具体的には、５μｇ（２１．３μｌ）のＰＣＲ生成物を１００μｌの１×ＮｅＢ２中５μｌのＮｔ．Ａｌｗ１（１０Ｕ／μｌ，ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）により、３７℃で３時間消化した。生成物を２％アガロース臭化エチジウムゲルで分析した。この最初の消化の後、生成物をさらに５μｌのＮｂ．ＢｓｒＤ１（１０Ｕ／μｌ，ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）により６５℃で６時間、続いて８０℃で２０分間、消化した。インキュベーション時間は、使用する酵素、濃度、反応条件などに応じてほぼ確実に変動する可能性がある。消化反応が終了した後、試料をＱｉａｇｅｎヌクレオチド分離キットで精製した。３０μｌの標準溶離緩衝液を用いて溶離を実施した。ＤＮＡ濃度を測定し（１０６ｎｇ／μｌ）、図２に示すように試料を４％アガロース臭化エチジウムゲルで分析した。

図２に示すゲルのレーン１は０．５μｌの２５塩基対ラダー分子量基準を含む。レーン２では、０．７μｌの２３５ｎｇ／μｌＰＣＲ生成物（すなわち、増幅後の、ただし制限酵素消化前の生成物）を分析した。レーン３は３μｌの２酵素消化物を分析した際のゲル生成物を示す。したがって、列３は試料へのハイブリダイゼーションに用いた最終ＭＩＰプローブプールを含む。

実施例２：ターゲテッド領域のキャプチャーのためのＭＩＰプローブプールの使用
前記の実施例１からのプロトコルにより、ゲノムＤＮＡへのハイブリダイゼーションに有用な７０−ｍｅｒＭＩＰが得られる。これらの例の目的について、このプールをＭＩＰ４８０ミックスと表示した。そのようなＭＩＰを、ｃＤＮＡ、ＲＮＡなどを含めた他の形態の核酸ターゲットについて使用するために調製できることも容易に認識される。ＭＩＰプローブをゲノムＤＮＡに接触させるハイブリダイゼーション工程および伸長工程を図３に示す。

この例では、約７５０ｎｇのｈｇＤＮＡまたは２．２５×１０５コピーのｈｇＤＮＡを用いた。ＭＩＰ：ゲノムの当量比を約１００：１に維持しながら、１ｐｇの各プローブ（５００ｐｇ＝０．５ｎｇのＭＩＰ４８０ミックス）を用いた。これらのＭＩＰ計算は、７０ヌクレオチドのＭＩＰフラグメントのみが存在すると仮定する。ハイブリダイゼーション反応のために、下記の試薬を用いた。

対照として、ｇＤＮＡをＨ_２Ｏで置き換える。９５℃で１０分間変性し、６０℃で３６時間インキュベートする。
キャプチャーされたＤＮＡ配列（この場合はエキソン）を次いで環化した。リガーゼおよびポリメラーゼ酵素のミックス１０μｌを調製し、それぞれ２５μｌのキャプチャー反応に添加した。このリガーゼ／ポリメラーゼミックスは下記の試薬を含む。

合計１０μｌを２５μｌのキャプチャー反応液に添加し、６０℃で２４時間インキュベートする。伸長／環化工程を図３に示す。
下記の試薬（すべてＮｅｗＥｎｇｌａｎｄＢｉｏｓｃｉｅｎｃｅｓから）を用いてエキソヌクレアーゼの混合物を調製した。

線状ＤＮＡを除去するために、２ｕｌのエキソヌクレアーゼミックスをそれぞれ３５ｕｌのａｍｐｌｉｇａｓｅ反応に添加した。試料を３７℃で１時間、８０℃で１０分間、そして９５℃で５分間、インキュベートした。

線状ＤＮＡを除去した後、残りの生成物を2５ｕｌの反応でＰＣＲ増幅し、精製した。このＰＣＲ増幅（インバースＰＣＲ）のために、下記の試薬を用いた。

この反応において、マルチプレックスプライマー(multiplex primer)は試料同定のためのＭＩＤ配列を含む。ＰＣＲ増幅のために、反応を９８℃に３０分間保持し、次いで３０回サイクリングし（９８℃で１０分／６０℃で３０分／７２℃で１分）、次いで７２℃に２分間保持する。ＰＣＲ生成物を４％アガロースゲルで分析した（図４）。図４において、レーン１は５ｕｌのｇＤＮＡＭＩＰキャプチャーＰＣＲ生成物を２０ｕｌのＴＥ中に含有し、レーン２は対照（ｇＤＮＡを水で置き換えたもの）を含有し、レーン３は０．５ｕｌの２５塩基対ラダーを含有する。レーン１からのＤＮＡ濃度は２３．５ｎｇ／ｕｌまたは１３０ｎＭと測定された。この増幅および精製した生成物を、次いでたとえばＩｌｌｕｍｉｎａＴｒｕＳｅｑシークエンシングを用いるシークエンシングに使用できる。

実施例３：ＸおよびＹについて可変長（２０〜３０ｎｔ）をもつ融解温度（Ｔｍ）平衡化した４７４ＭＩＰを使用したエキソンキャプチャーのためのＭＩＰプロトコル
この例では、使用したＭＩＰプローブは２０〜３０ヌクレオチドの可変ＸおよびＹ領域長さをもつ。この態様において、ＴｍはＸとＹの融解温度がほぼ等しくなるように標準式を用いて計算される。

先の例において、固定長２０−ｎｔのターゲット特異的領域をもつ、下記のように表わされるＭＩＰプローブが作製された：
５’−（Ｘ２０）ＡＧＡＴＣＧＧＡＡＧＡＧＣＡＣＡＴＣＣＧＡＣＧＧＴＡＧＴＧＴ（Ｙ２０），ＸおよびＹは２つの２０ヌクレオチド長さのターゲット特異的領域を表わす。本発明の態様においては、ＭＩＰプローブは可変領域をもち、下記のように表わすことができる：
５’−（Ｘ２０〜３０）ＡＧＡＴＣＧＧＡＡＧＡＧＣＡＣＡＴＣＣＧＡＣＧＧＴＡＧＴＧＴ（Ｙ２０〜３０），ここで、Ｘ領域とＹ領域は必ずしも同一長さをもつ必要はない。固定長２０−ｎｔのプローブおよびＴｍ平衡化した２０〜３０−ｎｔプローブのＴｍ分布を図５に示す。図５において、Ｘ−軸はプローブの融解温度を示し、一方、Ｙ軸はプローブ数を示す。これから分かるように、プローブのＴｍを変化させると、集団はＸおよびＹ領域の長さを固定した場合より狭い融点範囲に集中する。下記の表は図５に用いたデータを含む。

２０−ｎｔ固定ＭＩＰプローブプールを用いて示されたシークエンスカバレージを２０〜３０−ｎｔ可変ＭＩＰプローブプールと対比して判定するために実験を行なった。これらの実験の結果を図６に示す。図６は、固定Ｔｍで設計したＭＩＰプローブ（挿入図）をＴｍ平衡化設計と比較したシークエンスカバレージの頻度分布（リード(read)の数）を示す。挿入図は４５％のＭＩＰが何らカバレージをもたないこと（カバレージ０）を示し、これに対しＴｍ平衡化設計ではカバレージをもたないＭＩＰの数が３％に低下し、４７４ＭＩＰにより提示されるターゲテッド領域について約１５倍の改善を示す。Ｔｍ平衡化設計の大部分のＭＩＰについてシークエンスカバレージは相対的に高く、あるＭＩＰについては数百万に及ぶリードが検出された。図６において、Ｘ−軸はシークエンスカバレージを表わし、それはＩｌｌｕｍｉｎａＨｉＳｅｑでのこの特定のランについて各ＭＩＰにつき検出されたリード数の尺度である。カバレージをビンに区分した(binned)頻度分布として表わす。

その図（挿入図を参照）において、固定長ＭＩＰプローブプールはシークエンスカバレージを効率的に示さない大きな部分のプール集団を示した。事実、２１５／４７４のプローブ（４５％）はターゲット配列を効率的にカバーしなかった。対照的に、このグラフの主部分はＴｍを平衡化した場合のシークエンスカバレージを示す。容易に分かるように、シークエンスカバレージを示さないプローブの数は１５／４７４（３％）にまで劇的に減少した。したがって、ＸおよびＹターゲット領域のＴｍがほぼ同等である態様は、ＸおよびＹ領域が設定された長さのものである他の態様を上回る改良に寄与する。

実施例４：ＸおよびＹ領域について２０〜３０ヌクレオチドの可変長をもち、平衡化ＴｍおよびＮ６ＵＩＤをもつ４７４ＭＩＰを使用したエキソンキャプチャー用のＭＩＰプロトコル
ＵＩＤ配列を含むＭＩＰ前駆体についての一般的フォーマットを図７Ａに表わす。この例では、ＭＩＰプローブは、ＮＮＮＮＮＮ（Ｎ６）として表記されるＵＩＤ領域を含むリンカーで連結された可変長ターゲット領域ＸおよびＹをもつ。ＵＩＤ領域はもちろん６ヌクレオチド以外の鎖長で合成でき、個々の実験または用途に必要なランダム性を誘導するのに十分な長さでありさえすればよい。このセグメントは、各プローブにおいて合成されるランダム生成配列である（すなわち、各プローブがそれ自体のランダムＵＩＤ配列をもつ）。この配列は、シークエンシングワークフローの終了付近で、いずれか特定のプローブターゲットが増幅バイアス、遺伝子座増幅／提示バイアス、および特定のシークエンシングプラットフォームに関連する系統的アーチファクトによって過剰提示されているかを判定するために使用できる。前記と同様なワークフローで、ＭＩＰプローブを合成し、次いでプライマーを用いて増幅し（図７Ｂを参照）、次いで制限酵素でニッキングし、一本鎖ＭＩＰプールとして放出させる（図７Ｃを参照）。

一本鎖ＭＩＰはＤＮＡ（たとえばゲノムＤＮＡ，ただし、いかなる核酸分子も使用できる）にハイブリダイズする。一本鎖ＭＩＰに対する相補鎖をブロッキングオリゴヌクレオチドによりブロックする；その一例を図７Ｄに表わす。

この態様において、ＭＩＰ前駆体鋳型はマスクレス・アレイ合成（ＭＡＳ）を用いてアレイ上に合成された。前記の実施例の場合のように、ＭＩＰ前駆体アレイをＧｒａｃｅＢｉｏｌａｂチャンバーに付着させ、in situ ＰＣＲマスターミックスを調製した。このin situ ＰＣＲマスターミックスは実質的に前記の実施例１の場合と同一であり、ただしｄＮＴＰ濃度を１０ｍＭに低下させ、より多い体積（１３．７５μｌ）をマスターミックスに用いた。ｄＮＴＰ試薬の体積の増加は、用いたフォワードおよびリバースプライマーの体積の減少（２０μｌから１８μｌに）ならびに水の体積の減少によって相殺された。

マスターミックスを入れたチューブを９５℃の加熱ブロック内に５分間置いて脱ガスした。ＨｏｔＳｔａｒｔＴａｑ酵素（１１ｕＬ［５Ｕ／ｕｌ］）をミックスに添加して増幅プロトコルを開始した。この例で用いたプロトコルは下記の工程を伴なっていた：１）アレイを９７℃に１５分間加熱し、その時間の終了付近で１ｍＬのＰＣＲミックスをチャンバーに装填し、装填口をシールし、気泡を除去し、そして第２口をシールする；２）チャンバーを、１００℃／１分；４８℃／１．５分；７８℃／１分の加熱工程で１５〜１８回サイクリングした；３）チャンバーを７２℃に１５分間保持する；そして４）最終工程としてチャンバーを４℃に冷却する。

増幅工程の後、一方のシールを解除し、チャンバーから液体を取り出し、ＱｉａｑｕｉｃｋＰＣＲ精製キット（Ｑｉａｇｅｎ）を説明に従って用いて精製した。精製した後、光学濃度測定を用いて精製ＭＩＰ−前駆体の濃度を測定した。１スライド上で１５回の増幅サイクルを用いて０．３μｇのＭＩＰ−前駆体が得られ、一方、他のスライド上で１８回の増幅サイクルを用いて２．３μｇが得られた。低い増幅量の試料の追加増幅を１ｍｌのＰＣＲで実施した：５×ＨＦ緩衝液（２００μｌ）、５０μＭのプライマー３００−２０−１（１０μｌ）、５０μＭのプライマー３００−２２−２（１０μｌ）、１０ｍＭのｄＮＴＰ（２０μｌ）、ＭＩＰ前駆体５ｎｇ／μｌ（５μｌ）、水（７５０μｌ）、Ｐｈｕｓｉｏｎポリメラーゼ（５μｌ）。試料を９８℃に加熱し、次いで１０回サイクリングした（９８℃で２０分，６０℃で１分，７２℃で１分）。ＰＣＲ生成物を５０μｌのＨ_２０中で精製した（Ｑｉａｇｅｎ）。この追加増幅の後、ＤＮＡ濃度は１１７ｎｇ／μｌと測定された。

増幅の後、ＭＩＰ前駆体を制限酵素で処理した：２．５μｇのＰＣＲ生成物を５μｌのＮｔ．ＡｌｗＩ（１０ｕ／μｌ，ＮＥＢ）により、１００μｌの１×ＮＥＢ２中、３７℃で３時間消化した。５μｌのＮｂ．ＢｓｒＤＩ（１０ｕ／μｌ，ＮＥＢ）を添加した。６５℃で３時間、続いて８０℃で２０分間、インキュベートした。消化反応物をＱｉａｇｅｎヌクレオチド分離キットで精製し、３０μｌの溶離緩衝液中に溶離した。ＤＮＡ濃度は４７ｎｇ／μｌと測定され、８６ｎｔのＴｍ平衡化したＮ６ＭＩＰの濃度は４７＊８６／（１２６＋８６）＝１９ｎｇ／μｌであった。

酵素処理の後、ＭＩＰプローブを図８に示すようにゲノムＤＮＡにハイブリダイズさせる。明確にするために、環化した構造のＭＩＰを表わした先の図とは異なり、図８は環化した形のゲノムＤＮＡを表わしていることを留意すべきである。概念的にいずれのアレンジメントも適正に機能し、視覚化するための個々の好みによっていずれかの構造が選択されるにすぎないことは、当業者に容易に認識される。

この例では、下記の試薬を用いてプローブをゲノムＤＮＡにハイブリダイズさせた。

対照として、ｇＤＮＡを水で置き換えた。試料を９５℃で１０分間変性し、６１℃で３６時間インキュベートした。
この態様において、ゲノムＤＮＡにハイブリダイズしたＭＩＰは、Ｐｈｕｓｉｏｎポリメラーゼでギャップ充填した後にＡｍｐｌｉｇａｓｅにより環化された。リガーゼ／ポリメラーゼミックスは下記の試薬を用いて調製された。

合計１０μｌのリガーゼ／ポリメラーゼミックスをそれぞれ２５μｌのキャプチャー反応に添加し、６０℃で２４時間インキュベートした。
線状ＤＮＡを消化するために、下記の試薬からなるエキソヌクレアーゼミックスで試料を処理した。

線状ＤＮＡを消化するために、２μｌのエキソヌクレアーゼミックスをそれぞれ３５μｌのＰｈｕｓｉｏｎ／ａｍｐｌｉｇａｓｅ反応液に添加した。試料を３７℃で１時間、８０℃で１０分間、９５℃で５分間インキュベートした。

キャプチャー後の試料を次いで５０μｌの反応で増幅および精製する。

試料を次いでサーマルサイクリングで増幅した：９８Ｃで３０分、次いで２８回のサーマルサイクル（９８Ｃで１０分／６０Ｃで３０分／７２Ｃで１分）。増幅の後、５μｌのＰＣＲ生成物を４％アガロースゲルで３０分間、分析した。結果を図９に示す。レーン１は２５−ｂｐのラダーを示し、レーン２はＰＣＲ生成物を示す。

増幅した試料を次いでＩｌｌｕｍｉｎａシークエンサーでシークエンシングした。
実施例５：エキソーム（Ｅｘｏｍｅ）キャプチャーのためのＭＩＰ設計
この例では、前記の実施例４に記載したものと同じプロトコルを用い、ただし４７４ＭＩＰプローブのプールを合成する代わりに、個々のプローブ上にＸおよびＹターゲット領域について２０〜３０ヌクレオチドの可変長をもち、平衡化ＴｍおよびＮ６ＵＩＤ配列をもつ４３７，２０２のＭＩＰプローブを含むようにプールを増加した（“４３７Ｋプール”）。

４３７Ｋプールを用いてシークエンシング分析を実施して、キャプチャー成功率を判定した。４３７Ｋプールは約８２％のキャプチャー成功率をもつと判定された（すなわち、プール中のプローブの８２％がターゲテッド配列のキャプチャーに成功した）。

実施例６：ＵＩＤの使用
ＵＩＤはシークエンシング結果における特定のプローブの過剰提示または過小提示を判定するために使用でき、個々のプローブに関係する特定のリードのトラッキングがデータ解析のために重要である他の目的にも有用である。１態様において、ＵＩＤは、図１０に示すように増幅により導入された潜在的な対立遺伝子バイアスの存在下で接合状態(zygosity)を判定するために用いられる。各ＭＩＰプローブについて、シークエンシングリードはそのプローブについて合成されたＵＩＤ配列（リード１、リード２、または両方に現われる可能性がある）を示し、かつ目的とするキャプチャー配列を含むであろう（図１０Ａを参照）。

図１０ＢはＭＩＰがプライマーベースのプローブであり、したがって目的ターゲット上にアラインした配列の‘積み重なり(stack)’を生成することを示す。プローブ特異的ＵＩＤは分子キャプチャー事象を区別するために用いられる。１つのＵＩＤが増幅によって多数のシークエンシングリードペア(read pair)をもつ可能性がある。バリアントを見出だす目的で、同一ＵＩＤを含むリードペアの各セットから代表的リードペアまたはコンセンサス配列を選択する。あるキャプチャー事象が優先的に増幅されていれば、そのＵＩＤも運ばれているであろう。このＵＩＤベースの複製物リードペア削減は潜在的な増幅バイアスを排除する（図１０Ｃを参照）。

図１１は、本発明のＭＩＰプローブの作製法の態様を例示する。マスクレス・アレイ合成を用いて、アレイ（この例では２．１Ｍフィーチャーのマイクロアレイ）上で１モノマーずつ前駆体分子を合成する。前駆体分子を３’末端でアレイの表面に固定することができる。合成されると、アレイを in situ ＰＣＲ処理して、可溶化、増幅し、１個のウラシルを１つのプローブ鎖に取り込ませる。増幅の後、前駆体は溶液中の二本鎖分子であり、１個のウラシル塩基を含む。増幅の後、この例では、ウラシル−ＤＮＡグリコシラーゼ（ＵＤＧ）およびエンドヌクレアーゼＶＩＩＩを用いて二本鎖分子を消化処理し、Ｎｂ．ＤＳＲＤＩがプローブ鎖上にのみニックを形成して、厳密に両方の in situ プライマーアダプターを離脱させる。変性ＰＡＧＥゲル電気泳動はプローブの形成を立証し、プローブの相補体をも示す。

図1２Ａおよび１２Ｂは、ＭＩＰプローブに関するワークフローの１態様を例示する。図１２Ａ１では、一本鎖ＭＩＰプローブをターゲットＤＮＡと適切な比率で混合する。ＭＩＰプローブとターゲットを適切な期間ハイブリダイズさせる（図１２Ａ２）；時間はプローブおよびターゲットの複雑性および比率に依存する。ハイブリダイゼーションの後、ＭＩＰプローブを伸長およびライゲートさせて、ターゲット配列をコピーし、プローブ／ターゲット配列を環化する（図１２Ａ３）。伸長およびライゲーションはＤＮＡポリメラーゼおよびＤＮＡリガーゼの混合物を用いて達成される。

伸長／ライゲーションの後、一本鎖鋳型およびプローブを消化する（図１２Ｂ１）。ある態様において、エキソヌクレアーゼ、たとえばＥｘｏＩおよびＥｘｏＩＩＩの混合物を一本鎖分子の消化のために使用する。一本鎖分子が消化された時点で、プローブ／ターゲットを増幅する。特定の態様において、シークエンシングアダプターおよび試料インデックスバーコード（ＭＩＤ）配列（図１２Ｂ２に“Ｎ”と表記する）を組み込む。ＭＩＤコードはそれぞれの検査試料について異なる配列を使用し、試料をそれらのＭＩＤコードにより同定できるのでシークエンシング前の増幅後プーリングを可能にする。図１２Ｂ３は、増幅後の二本鎖生成物の構造を表わし、この時点でそれはシークエンシングに使用できる状態である。

図１３は、本発明を用いる試料トラッキングの態様を例示する。試料トラッキングの目的は、多数の実験（それぞれ異なるゲノムＤＮＡ試料をアッセイしたもの）からキャプチャーされた増幅ＤＮＡ配列を、シークエンシング前にプールできるようにすることである。これによって、いずれか個々の試料についてキャプチャーされた配列の分析のために、典型的な第２世代機器でのシークエンシングのラン毎に得られた多量のシークエンシングデータを、通常はそれよりはるかに少ない配列データ要求に対して、より効率的にマッチングさせることができ、それによってコストが低減し、効率が向上し、より高い試料スループットを得ることができる。

試料トラッキングは、環化ＭＩＰプローブを増幅するために用いられるＰＣＲプライマーの１つに試料トラッキングインデックス（通常は６〜１４ヌクレオチドの配列）を含有させることにより達成される。同一のＤＮＡ試料に由来するキャプチャーされた生成物のアンプリコンは、そのＤＮＡのゲノム内の多種多様な領域をターゲティングするけれども、それらはすべて同一のトラッキングインデックスをもつであろう。プールしたキャプチャーされた生成物のシークエンシング後、付随するインデックス配列を解読することにより、それぞれのリードペアの由来を解明することができる。

図１４は、ＭＩＰプローブに組み込まれたＵＩＤ配列を用いた事象計数(event-counting)の態様からの模擬データを例示する。事象計数の目的は、増幅バイアスまたは他のエラーの影響を排除した後のバリアント呼出に固有のキャプチャー事象を同定することである。ＵＩＤは各プローブに（ＰＣＲプライマー自体にではなく）組み込まれたランダム配列であり、増幅に際してコピーされる。各プローブ分子は、他のプローブ分子のように同一試料中の同一のエキソンを厳密にターゲティングするために用いられるとしても、異なるＵＩＤ配列をもつべきである。シークエンシングの後、１つ（最高のシークエンスクオリティースコアをもつもの）を除いて、同一のＵＩＤ配列をもつすべてのリードペアがＰＣＲ複製物と同様に廃棄される。残されたデータはすべて同等の情報価値をもち、試料の真の複雑性を表わすと仮定される。この能力は、変異事象、たとえば試料における体細胞変異、または混合集団におけるいずれかのバリアントの真の頻度を決定するために有用である。図１４には、ＵＩＤ補正付きおよび補正なしの単一エキソンからの模擬データを表示する。ＵＩＤ補正なしのデータでは、バイアスがかかった変異対立遺伝子増幅のため、変異（Ｘ）は試料ＤＮＡにおいて５０％の頻度で不正確に測定されるであろう。ＵＩＤ補正付きでは、試料ＤＮＡにおける実際の変異頻度は１７％であることが明らかになる。

図１５は、比較的大きなＭＩＰプローブデザイン内の単一プローブターゲット（ＰＴＥＮエキソン４）に対応する２３，５１７のリードペアの解析を示す。この解析により７２９の個別の６−ｍｅｒＵＩＤタグが明らかになった。あるタグの高い（＞３００）頻度によって強い増幅バイアスの可能性が立証され、一方、ＵＩＤは重複情報を表わすリードの９６．４％の排除を可能にした。

図１６は、プローブ再平衡化の結果を示す。ＥＧＦＲ遺伝子の４つのエキソンを６種類のＨＥＡＴ−Ｓｅｑプローブ（ＩＤＴから入手）でターゲティングした。５０ｐＭのプローブを５００ｎｇのｇＤＮＡにアニールさせ、４時間かけて環化し、次いで増幅した。プローブ／ターゲット構築体を次いでシークエンシングした。マッピングしたリードの９９％がターゲティングしたエキソンに最大約１００，０００Ｘの可変カバレージ深度でアラインした（ＵＩＤ重複排除(deduplification)の前）。このＥＧＦＲ実験で得られた高変動性のシークエンスカバレージ深度は、大部分の高度に多重化した増幅ベースのターゲテッドシークエンシング法に固有の重大な非効率性を例示する。プローブ比の再調整(rebalancing)（右）はターゲット間の配列分布を変化させることができるが、予測できない様式においてである。経験と反復によるプローブ設計方法が現在最も有効な解決策である（対照＝２１０，６３４のリード；ＭＩＰ条件１＝４２９，２０２のリード；ＭＩＰ条件２＝３１３，３４６のリード）。

Claims

ＭＩＰプローブを調製する方法であって、下記を含む前記方法：
ａ）アレイ上でＭＩＰ前駆体を合成することであって、ここでＭＩＰ前駆体は；
ｉ）５’及び３’末端に２つのプライマー結合部位を含み；
ｉｉ）前記プライマー結合部位の内側の一方の末端付近に第１末端ターゲット配列、および反対側の末端付近に第２末端ターゲット配列を含み；
ｉｉｉ）前記第１末端ターゲット配列、および前記第２末端ターゲット配列の間にリンカー領域を含み；
ｉｖ）ＭＩＰプローブ鎖上の５’末端側のターゲット配列の５’末端にニッキングのための酵素が認識する部位を有し；ならびに、
ｖ）ＭＩＰプローブ鎖上の３’末端側のターゲット配列の３’末端にニッキングのための酵素が認識する部位を有する；
ｂ）前記２つのプライマー結合部位に結合するプライマーを用いて、ＭＩＰ前駆体を溶液中で増幅すること；
ｃ）溶液を採集すること；
ｄ）増幅した前駆体を１種類以上のニッキングのための酵素を使用して消化して、ＭＩＰプローブを形成すること、ここで前記酵素はＭＩＰ前駆体中の前記ニッキングのための酵素が認識する部位を認識するものである；
ｅ）前記ＭＩＰプローブを、一本鎖のＭＩＰプローブのリンカー領域に相補的なブロッキングオリゴヌクレオチドとハイブリダイズさせること。
ＭＩＰ前駆体のリンカー領域が固有識別子（ＵＩＤ）配列を含む、請求項１に記載の方法。
アレイ合成がマスクレス・アレイ合成を使用して実施される、請求項１又は２に記載の方法。
第１末端ターゲット配列および／または第２末端ターゲット配列の配列長さを、これら２種類のターゲット配列の融解温度を近接させるために変更する、請求項１〜３のいずれか１項に記載の方法。
ターゲット配列の一部を同定する方法であって、下記を含む前記方法：
ｆ）請求項１〜４のいずれか１項に記載の方法でＭＩＰプローブを調製すること；
ｇ）ＭＩＰプローブを核酸試料にハイブリダイズさせること；
ｈ）核酸試料の一部が複製されて環化ＭＩＰプローブに組み込まれるように、ＭＩＰプローブをポリメラーゼで環化すること；
ｉ）エキソヌクレアーゼを使用して線状核酸を実質的に消化すること；および、
ｊ）ＭＩＰプローブの配列を決定すること。
さらに、ＭＩＰプローブが固有識別子（ＵＩＤ）配列を含む場合に、ＭＩＰプローブの配列を評価し、いずれかのＵＩＤ配列が予想結果と比較して過剰提示または過小提示されているかを判定することを含む、請求項５に記載の方法。