JP6374964B2 - 特別なキャプチャープローブ(heatseq)を使用したシークエンスキャプチャー法 - Google Patents

特別なキャプチャープローブ(heatseq)を使用したシークエンスキャプチャー法 Download PDF

Info

Publication number
JP6374964B2
JP6374964B2 JP2016530538A JP2016530538A JP6374964B2 JP 6374964 B2 JP6374964 B2 JP 6374964B2 JP 2016530538 A JP2016530538 A JP 2016530538A JP 2016530538 A JP2016530538 A JP 2016530538A JP 6374964 B2 JP6374964 B2 JP 6374964B2
Authority
JP
Japan
Prior art keywords
mip
probe
sequence
nucleic acid
target sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016530538A
Other languages
English (en)
Other versions
JP2016525363A (ja
Inventor
アルバート,トーマス
ノートン,ジェイソン
パテル,ジガー
バージェス,ダニエル
リアミチェフ,ヴィクター
ブロックマン,マイケル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
F Hoffmann La Roche AG
Original Assignee
F Hoffmann La Roche AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by F Hoffmann La Roche AG filed Critical F Hoffmann La Roche AG
Publication of JP2016525363A publication Critical patent/JP2016525363A/ja
Application granted granted Critical
Publication of JP6374964B2 publication Critical patent/JP6374964B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Description

本発明は、ゲノムまたは複合DNA試料のターゲテッド領域をキャプチャーして、ターゲテッド領域(単数または複数)内にみられる遺伝子多型の効率的な検査および/または検出を可能にするための方法の分野に関する。
ゲノムのターゲテッド領域を効率的にキャプチャーする方法は、疾患または他の形質に関連する遺伝子多型を迅速シークエンシング仲介により検知および検出するのを可能にすることができる。二本鎖のアダプターライゲートしたシークエンシングライブラリーをターゲットキャプチャーのための材料として利用する現在のハイブリダイゼーションベースの手法は時間がかかり、資源集約的である。ターゲットキャプチャーのための伝統的な分子反転プローブ(molecular inversion probe)(MIP)ベースの方法はシークエンシング前のワークフロー時間を短縮できるが、遺伝子座増幅/提示(representation)バイアス、対立遺伝子バイアス、および特定のシークエンシングプラットフォームに関連する系統的アーチファクトのため制限される。
本発明は、改良されたMIPを大量に並行製造するための新規プロトコルである。このMIPに対する分子改良は、プローブの作製、ワークフロー、試料特異性を伴なう固有配列エレメントおよび初期試料集団中に存在する特異的分子を独自に識別する配列タグの付加をカバーする。最後に、本発明を遺伝子座提示バイアスと対立遺伝子バイアスの両方の問題を克服する経験的最適化戦略とも組み合わせる。この改良された手法は規模拡大が可能であり、単一遺伝子座のアンプリコンから構成されるターゲットの増幅から100万以上の遺伝子座のターゲティングまで利用できる。
下記の本発明の態様の記載を添付の図面と合わせて参照することによって、本発明の特徴およびそれらを達成する方法がより明らかになり、本発明自体がより良く理解されるであろう。
図1は、MIP前駆体、増幅されるMIP前駆体、および増幅生成物の制限消化を記載した模式図である。 図2は、酵素消化生成物のアガロースゲル精製である。 図3は、ゲノムDNAのターゲテッド鎖にハイブリダイズしている70−mer MIPプローブ、およびMIPプローブの伸長/ライゲーションを表わす。 図4は、伸長/ライゲーション後のMIPプローブ(すなわち、“キャプチャーした”生成物を含むもの)のゲル精製である。 図5は、20−merターゲット領域をもつプローブの融点範囲および可変長ターゲット領域をもつプローブの融点範囲(Tm平衡化したもの)を示すグラフである。 図6は、固定長プローブ(挿入図)およびTm平衡化した可変長プローブ(主グラフ)のシークエンスカバレージ(sequence coverage)を示すグラフである。 図7は、UIDを含むMIP前駆体、MIP前駆体の増幅、増幅生成物のニッキング、およびシークエンスキャプチャーに際して用いたブロッキングオリゴヌクレオチドを記載した模式図である。 図8は、DNAターゲットへのUID配列を含むMIPプローブのハイブリダイゼーション、およびMIPプローブの環化を表わす。 図9は、伸長/ライゲーション後のMIPプローブのゲル精製を示す。 図10は、UID配列の使用を表わす。 図11は、MIPプローブの合成を表わす模式図である。 図12(12Aおよび12B)は、MIPプローブを使用したワークフローを表わす図である。 図12(12Aおよび12B)は、MIPプローブを使用したワークフローを表わす図である。 図13は、試料源を同定するための試料インデックス(MID)の使用を表わす。 図14は、事象カウンティングのためのUID配列の使用を表わす。 図15は、1プローブからのUIDタグの分布を示す。 図16は、プローブ再平衡化の結果を示す。
これらの図面は本発明の態様を示すが、これらの図面は必ずしも正確な縮尺率ではなく、本発明をより良く図示および説明するために特定の特徴が誇張されている場合がある。ここに述べる代表例は本発明の代表的態様を1形態で図示したものであり、それらの代表例が何らかの形で本発明の範囲を限定するものと解釈すべきではない。
伝統的に、分子反転プローブ(MIP)は、それらの末端またはその付近に一本鎖ターゲットヌクレオチド配列の2つの離れた部分に対して特異的に相補性である領域をもつ一本鎖核酸プローブであった。末端にあるそれらのターゲット特異的部分がターゲット配列に適正にアラインして相補するために本質的に環状構造をとるのでそれらのプローブは“反転”し、あるいは逆にターゲット領域とターゲット特異的部分の間での同じ相互作用を可能にするためにターゲットが“反転”する。本発明は、データ解析のために有用な配列、そのようなMIPを作製するための改良された合成方法、およびMIPプローブプールを最適化するために有用な方法を提供することにより、MIPの改良を提供する。
本発明は、核酸試料の複雑性を低減するための核酸キャプチャープローブのセットを含み、セットの各プローブは下記のものを含む:複合試料中に存在する第1ターゲット配列に特異的にハイブリダイズする第1末端配列;複合試料中に存在する第2ターゲット配列に特異的にハイブリダイズする第2末端配列;ここで、第1ターゲット配列と第2ターゲット配列は両方とも同一ターゲット鎖上に位置する;ならびに第1末端配列と第2末端配列を連結するリンカー配列であって、固有識別子(UID)配列を含むリンカー配列;ここで、UIDは、プローブの形成に際してプローブのセット中の個々のプローブそれぞれについてランダムヌクレオチド合成により生成したランダム生成タグ配列である。
本発明は、対立遺伝子バイアス、遺伝子座増幅/提示バイアス、および特定のシークエンシングプラットフォームに関連する系統的アーチファクトを判定するための改良された特徴を備えた、MIPプローブを含む。さらに、本発明は、MIPプローブを作製するための鋳型としてアレイを用いてそのような改良されたMIPプローブを作製する特定の方法をも含む。ある態様において、MIPプローブはMIPプローブのための鋳型としてアレイを用いて作製される。特定の態様において、本発明は、マスクレス・アレイ合成(Maskless Array Synthesis)(MAS)(参照:Singh-Gasson et al., Nature Biotechnology, 17: 974-978, 1999, 本明細書に援用する)でMIPプローブを作製することを含む。
ある態様において、MIPプローブはプローブデザインを最適化するように設計される。特定の態様において、プローブプールはプローブ再分布を用いて設計される。プローブ再分布は、アレイの表面全体にわたって同一プローブの多重複製物を合成することにより合成に際して個々のプローブの相対濃度を低下または増大させることによって実施される。ある態様において、プローブプール中のプローブはプローブ長さ最適化を用いて設計される。ある態様において、プローブはプローブ動態最適化を用いて、たとえば最適プローブデザインを決定するためのTm(融解温度)を用いて設計される。
ある態様において、MIPプローブは分子IDタグ(Molecular ID tag)(MID)を含む。そのようなMIDは、本質的に、キャプチャーされた核酸が由来する試料を同定する目的に用いられる“バーコード”核酸配列である。したがって、MID配列は試料特異的識別子の使用により元の試料の同定を可能にし、ここで、特定の試料からキャプチャーされた各配列は共通のバーコード配列を共有する。MID配列は多種多様な方法で試料に付加することができ、それにはMID配列を含むアダプター配列とのライゲーション、またはMID配列を含むプライマーを用いる増幅によるものが含まれる。
特定の態様において、MIDバーコードはMIPプローブ中に存在せず、プライマー部位およびMIDバーコードを含む別の部位を含むプライマーを用いてプローブが複製および伸長された後に初めて存在する。ある態様において、MIPプローブをターゲット配列と接触させた後に初めて、MIDバーコードが付加される。この態様の一例は、MIPプローブ(MIDバーコードを含まないもの)がそれのターゲット配列と接触して特異的にハイブリダイズした時点で行なわれる。伸長およびライゲーションによりMIPプローブは環化し、次いでこの環化したMIPプローブは付加されたMIDバーコードを含むプライマーを用いて複製/増幅される。
本発明は、核酸試料の複雑性を低減するための核酸キャプチャープローブのセットを含む。プローブは、複合試料中に存在する第1ターゲット配列に特異的にハイブリダイズする第1末端配列、および複合試料中に存在する第2ターゲット配列に特異的にハイブリダイズする第2末端配列を含む。この態様において、第1ターゲット配列と第2ターゲット配列は両方とも同一ターゲット鎖上に位置する。プローブは、第1末端配列と第2末端配列を連結するリンカー配列をも含み、このリンカー配列は固有識別子(UID)配列を含む。UIDは、プローブの形成に際してプローブのセット中の個々のプローブそれぞれについて化学的に誘導したランダムヌクレオチド合成により生成したランダム生成タグ配列である。
特定の態様において、プローブはさらにMIDバーコードを含み、ここで、特定の核酸試料に使用するプローブはすべて同一のMIDバーコード配列を含む。この方法で、特定の試料からのすべての結果をトラッキングすることができる。
本発明の特定の態様は、下記を含む方法をも伴なう:a)アレイ上でMIP前駆体を合成することであって、その際、前駆体は1以上のプライマー、1以上の制限部位、ならびにMIP前駆体の一方の末端付近に第1末端ターゲット配列および反対側の末端付近に第2末端ターゲット配列を含む;b)MIP前駆体を溶液中へ増幅すること;c)溶液を採集すること;およびd)増幅した前駆体を1種類以上の制限酵素を使用して消化して、MIPプローブを形成すること。特定の態様において、MIP前駆体はさらに固有識別子(UID)配列を含む。
本発明の特定の態様は、第1末端ターゲット配列および/または第2末端ターゲット配列の融解温度を近接または一致させるために、これら2種類のターゲット配列の配列長さを変更する方法をも伴なう。この融点温度の一致によって、MIPプローブプールについてのシークエンスカバレージが増大する。
1態様において、MIPプローブがMIP前駆体のエレメントまたはその増幅生成物に再ハイブリダイズするのを阻止するように設計されたブロッキングオリゴヌクレオチドの存在下で、ハイブリダイゼーション工程を実施する。
MIP前駆体からニッキング酵素(またはこの方法に有用な他の酵素、たとえば鎖を破断できる酵素、たとえばUDG/UNG)を用いて作製したMIPプローブを、領域XおよびYにより規定される領域のターゲテッドキャプチャーのために使用する。MIPはニッキングされたけれども二本鎖であり、したがってハイブリダイゼーション工程で変性した際にこの二本鎖MIPから有効な一本鎖MIPが放出されるであろう。この一本鎖の有効MIPがそれの相補体に再ハイブリダイズして元の二本鎖MIPを形成するのを阻止するために、30−merのブロッキングオリゴ(300−24−1)を添加する。このオリゴ(300−24−1)は高いモル過剰で添加されるので、二本鎖MIPカセットに優先的にハイブリダイズして、先に放出された有効な一本鎖MIPがデュプレックスを形成するのを阻止するであろう。有効な一本鎖MIPはこうして後続の伸長+ライゲーション反応においてターゲテッドキャプチャーに利用できる状態になり、それにより環状MIPが得られるであろう。
本発明は、ターゲット配列の一部を同定するために下記によりMIPプローブを使用する態様をも含む:a)MIPプローブを核酸試料にハイブリダイズさせること;b)核酸試料の一部が複製されて環化MIPプローブに組み込まれるように、MIPプローブをポリメラーゼで環化すること;c)エキソヌクレアーゼを使用して線状核酸を実質的に消化すること;およびd)MIPプローブの配列を決定すること。配列が決定されると、いずれかのUID配列(特定の態様において使用した場合)が予想結果と比較して過剰提示または過小提示されているかを判定するためにUID配列を使用できる。
本発明方法の1態様において、アレイ合成はマスクレス・アレイ合成を使用して実施される。MASは核酸合成のための経済的で高フレキシブルなプラットフォームであるという利点をもち、したがってMASの使用は他の合成法より有利になることができる。
本発明の特定の態様において、プローブ選択は、たとえばターゲティングするエキソンが小さい(通常は150塩基未満)場合、単一エキソンをカバーするために1つのプローブを必要とするにすぎない可能性がある。他の態様において、プローブ選択は、より大きなターゲット、たとえばより大きなエキソンをカバーするために多数のプローブを必要とし、シークエンシング工程を用いてターゲテッドオーバーラップを決定し、そしてターゲット配列をアセンブリングする。ある態様において、大きな領域と小さな領域の両方をターゲティングし、両方法を合わせたものが必要となる。
本発明の開示に際して、特定の用語は以下の節に記載する意味をもつ。
用語“a”、“an”および“the”は、一般に、そうではないことが内容から明らかに示されない限り複数表記を含む。
用語“増幅(amplification)”は、一般に、ターゲット核酸から複数の核酸分子を生成することを表わし、ここで、ポリメラーゼによる伸長の開始部位を提供するためにプライマー類がターゲット核酸分子上の特定部位にハイブリダイズする。増幅は当技術分野で一般に知られているいずれかの方法、たとえば標準PCR、ロングPCR(long PCR)、ホットスタートPCR(hot start PCR)、qPCR、RT−PCRおよび等温増幅(Isothermal Amplification)により実施できるが、これらに限定されない。本明細書中で用いる用語“増幅する(amplifying)”は、一般に、ターゲット核酸から複数の核酸分子を生成することを表わし、ここで、ポリメラーゼによる伸長の開始部位を提供するために少なくとも1つのプライマーがターゲット核酸分子上の特定部位にハイブリダイズする。増幅は当技術分野で一般に知られているいずれかの方法、たとえば標準PCR、ロングPCR、ホットスタートPCR、qPCR、RT−PCRおよび等温増幅により実施できるが、これらに限定されない。他の増幅反応には、特にリガーゼ連鎖反応、ポリメラーゼリガーゼ連鎖反応、Gap−LCR、修復連鎖反応(Repair Chain Reaction)、3SR、NASBA、鎖置換増幅(Strand Displacement Amplification)(SDA)、転写仲介増幅(Transcription Mediated Amplification)(TMA)、およびQb増幅が含まれる。
用語“相補性”は、一般に、2つのヌクレオチドの塩基間で適切な温度およびイオン性緩衝液の条件下において好ましい熱力学的安定性および特異的対合を形成する能力を表わす。この対合は各ヌクレオチドの水素結合特性に依存する。これの最も基本的な例は、チミン/アデニン塩基およびシトシン/グアニン塩基間の水素結合対である。本発明において、ターゲット核酸の増幅のためのプライマーは両方ともそれらの長さ全体にわたってターゲット核酸分子と完全に相補的であってもよく、あるいは“準相補的”であってもよく、この場合、プライマーはターゲット核酸に最小限にハイブリダイズできるかまたはハイブリダイズできない追加の非相補配列を含む。
本明細書中で用いる用語“検出する”は、一般に、試料中のターゲット核酸分子の存在または非存在の査定を目的とした定性試験に関係する。
本明細書中で用いる用語“エンリッチした”は、一般に、ターゲット核酸を含む試料を処理するいずれかの方法であって、ターゲット核酸を試料中に存在する他の材料の少なくとも一部から分離できる方法に関係する。したがって、“エンリッチメント”は他の材料より多量のターゲット核酸の生成であると解釈される。
用語“過剰”は、一般に、特定の試薬または試薬類が他のものと比較してより多量またはより高濃度であることを表わす。
用語“ハイブリダイズ”は、一般に、それらのヌクレオチド配列が調和する異なる核酸分子間の塩基対合を表わす。用語“ハイブリダイズ”と“アニール”は互換性をもって使用できる。
用語“核酸”または“ポリヌクレオチド”は互換性をもって使用でき、リボース核酸(RNA)もしくはデオキシリボース核酸(DNA)のポリマーに該当するポリマー、またはそのアナログを表わす。これには、ヌクレオチドのポリマー、たとえばRNAおよびDNA、ならびに合成形態、その修飾された(たとえば、化学的または生化学的に修飾された)形態、および混合ポリマー(たとえば、RNAとDNAの両方のサブユニットを含むもの)が含まれる。代表的な修飾には、メチル化、アナログによる1以上の天然ヌクレオチドの置換、ヌクレオチド間修飾、たとえば非荷電結合(たとえば、メチルホスホネート、ホスホトリエステル、ホスホアミデート、カルバメートなど)、ペンデント(pendent)部分(たとえば、ポリペプチド)、インターカレーター(たとえば、アクリジン、プソラレン(psoralen)など)、キレーター、アルキレーター(alkylator)、および修飾された結合(たとえば、アルファアノマー核酸など)が含まれる。指定配列に水素結合その他の化学的相互作用により結合するそれらの能力においてポリヌクレオチドを模倣した合成分子も含まれる。一般に、ヌクレオチドモノマーはホスホジエステル結合により連結するが、合成形態の核酸は他の結合を含むことができる(たとえば、Nielsen et al. (Science 254:1497-1500, 1991に記載されるペプチド核酸)。核酸は、たとえば染色体または染色体セグメント、ベクター(たとえば、発現ベクター)、発現カセット、裸のDNAまたはRNAポリマー、ポリメラーゼ連鎖反応(PCR)の生成物、オリゴヌクレオチド、プローブ、およびプライマーであるか、あるいはそれらを含むことができる。核酸は、たとえば一本鎖、二本鎖、または三本鎖であってもよく、いずれか特定の長さに限定されない。別途指示しない限り、個々の核酸配列は明示したいずれかの配列のほかに相補配列を含むかまたはコードする。
用語“ヌクレオチド”は、天然のリボヌクレオチドまたはデオキシリボヌクレオチドのモノマーのほかに、本明細書中ではその関連構造バリアントを表わすと解釈すべきであり、状況からそうではないことが明示されない限り、それにはヌクレオチドが使用される特定の状況(たとえば、相補的塩基へのハイブリダイゼーション)に関して機能均等である誘導体およびアナログが含まれる。
用語“オリゴヌクレオチド”は、少なくとも2つの核酸モノマー単位(たとえば、ヌクレオチド)を含む核酸を表わす。オリゴヌクレオチドは一般的には約6から約175までの核酸モノマー単位、より一般的には約8から約100までの核酸モノマー単位、よりさらに一般的には約10から約50までの核酸モノマー単位(たとえば、約15、約20、約25、約30、約35、またはより多数の核酸モノマー単位)を含む。オリゴヌクレオチドの厳密なサイズは、そのオリゴヌクレオチドの最終的な機能または用途を含めた多数の要因に依存するであろう。オリゴヌクレオチドは所望によりいずれか適切な方法によって調製され、それには既存配列または天然配列の単離、DNAの複製または増幅、逆転写、適切な配列のクローニングおよび制限消化、あるいは下記の方法による直接化学合成が含まれるが、それらに限定されない:たとえば、Narang et al.(Meth. Enzymol. 68:90-99, 1979)のホスホトリエステル法;Brown et al.(Meth. Enzymol. 68:109-151, 1979)のホスホジエステル法;Beaucage et al. (Tetrahedron Lett. 22:1859-1862, 1981)のジエチルホスホルアミダイト法;Matteucci et al. (J. Am. Chem. Soc. 103:3185-3191, 1981)のトリエステル法;自動合成法;Singh-Gasson et al., Nature Biotechnology, 17: 974-978, 1999に記載されるマスクレス・アレイ合成、もしくはU.S. Pat. No. 4,458,066の固体支持体法、または当業者に既知の他の方法。
用語“プライマー”は、ポリヌクレオチド伸長が開始する条件下(たとえば、適切な緩衝液中で、適切な温度または温度サイクル(単数または複数)における、必要なヌクレオシド三リン酸(コピーされる鋳型により指示されるもの)およびポリメラーゼの存在を含む条件下(たとえば、ポリメラーゼ連鎖反応の場合のように))に置かれた際に、鋳型指向性核酸合成(template-directed nucleic acid synthesis)の開始点として作用することができるポリヌクレオチドを表わす。さらに説明すると、プライマーは他の多様なオリゴヌクレオチド仲介合成法にも使用でき、それには de novo RNA合成および in vitro 転写関連方法(たとえば、核酸配列ベースの増幅(nucleic acid sequence-based amplification)(NASBA)、転写仲介増幅(transcription mediated amplification)(TMA)など)のイニシエーターとしての使用が含まれる。プライマーは、一般に一本鎖オリゴヌクレオチド(たとえば、オリゴデオキシリボヌクレオチド)である。プライマーの適切な長さはそのプライマーの目的用途に依存するが、一般的に6から40までのヌクレオチド、より一般的には15から35までのヌクレオチドの範囲である。短いプライマー分子は、一般に鋳型との十分に安定なハイブリッド複合体を形成するために必要な温度がより低い。プライマーは必ずしも鋳型の厳密な配列を反映する必要はないが、プライマー伸長が起きるためには鋳型とハイブリダイズするのに十分なほど相補的でなければならない。特定の態様において、用語“プライマー対”は、増幅すべき核酸配列の5’末端の相補体とハイブリダイズする5’センスプライマー(時には“フォワード”と呼ばれる)および増幅すべき核酸配列の3’末端の相補体とハイブリダイズする3’アンチセンスプライマー(時には“リバース”と呼ばれる)を含むプライマーのセットを意味する(たとえば、ターゲット配列がRNAとして発現するか、あるいはRNAであれば)。プライマーは、所望により、分光、光化学、生化学、免疫化学または化学的な手段により検出できる標識を取り込ませることによって標識できる。たとえば、有用な標識には、32P、蛍光色素、高電子密度試薬、酵素(ELISAアッセイにおいて一般に用いられるもの)、ビオチン、またはハプテンおよびタンパク質であってそれに対する抗血清もしくはモノクローナル抗体が得られるものが含まれる。
本発明の意味において、核酸の“精製”、“単離”または“抽出”は、下記に関係する:核酸をたとえば増幅による診断アッセイで分析する前に、それらを一般に種々の成分の複合混合物を含有する生物試料から精製、単離または抽出しなければならない。第1工程として、核酸のエンリッチメントを可能にする方法を使用できる。そのようなエンリッチメントの方法は本明細書に記載されている。
本明細書中で用いる用語“定量する”は、試料中に存在するターゲット核酸の量または濃度の決定に関係する。
“ターゲット核酸”は、本明細書中で試料中の分析すべき核酸、すなわち試料中のその存在、非存在、核酸配列および/または量を決定すべき核酸を表わすために用いられる。ターゲット核酸はゲノム配列、たとえば特定の遺伝子の一部、RNA、cDNA、または他のいずれの形態の核酸配列であってもよい。ある態様において、ターゲット核酸はウイルス性または微生物性のものであってもよい。
用語“ターゲット核酸”と“ターゲット分子”は互換性をもって使用でき、増幅反応の対象である核酸分子を表わし、所望によりそれの配列情報を得るためにシークエンシング反応によりそれを調べることができる。
用語“ターゲット特異的領域”または“対象領域”は互換性をもって使用でき、特定の核酸分子の科学的対象である領域を表わす。これらの領域は、対象領域(単数または複数)を囲む増幅反応用プライマーを設計し、それによりこれらの対象領域を含むターゲット核酸アンプリコンを回収するために、一般に少なくとも部分的に既知の配列をもつ。
用語“熱安定性ポリメラーゼ”は、熱に対して安定であり、耐熱性であり、二本鎖核酸を変性させるのに必要な時間、高められた温度を付与した際に、後続のポリヌクレオチド伸長反応を行なうのに十分な活性を保持し、不可逆的に変性(不活性化)することのない酵素を表わす。核酸変性に必要な加熱条件は当技術分野で周知であり、たとえばU.S. Patent No. 4,683,202、4,683,195、および4,965,188に例示されている。本発明に用いる熱安定性ポリメラーゼは、温度サイクリング反応、たとえばポリメラーゼ連鎖反応“PCR”に使用するのに適している。本発明の目的について、不可逆的変性は永続的かつ完全な酵素活性喪失を表わす。熱安定性ポリメラーゼについて、酵素活性は、ヌクレオチドを適正に結合させて鋳型核酸鎖に対して相補的なポリヌクレオチド伸長生成物を形成する触媒作用を表わす。好熱性細菌からの熱安定性DNAポリメラーゼには、たとえばテルモトガ・マリチマ(Thermotoga maritima)、テルムス・アクアティカス(Thermus aquaticus)、テルムス・テルモフィルス(Thermus thermophilus)、テルムス・フラブス(Thermus flavus)、テルムス・フィリホルミス(Thermus filiformis)、テルムス属種Sps17、テルムス属種Z05、テルムス・カルドフィルス(Thermus caldophilus)、バチルス・カルドテナックス(Bacillus caldotenax)、テルモトガ・ネオポリタナ(Thermotoga neopolitana)、テルモシフォ・アフリカヌス(Thermosipho africanus)からのDNAポリメラーゼが含まれる。
用語“マスクレス・アレイ合成(Maskless Array Synthesis)”(MAS)は、アレイとしての基体の表面における物理的マスクの非存在下でのオリゴヌクレオチドの光指向合成(light-directed synthesis)を表わす;たとえば、Singh-Gasson et al., Nature Biotech, 17: 974-978 (Oct. 1999)により記載された方法;それの教示内容を本明細書に援用する。簡単に述べると、MAS法は、一般に、バーチャルマスクを形成するマイクロミラーからなるデジタルマイクロアレイミラーデバイス(digital microarray mirror device)(DMD)を使用する。これらのミラーは個々にアドレス指定でき、いずれか特定のパターンまたはイメージを作成するために広域波長で使用できる。DMDは基体の表面にイメージを形成し、ここで、基体は光によって活性化される化合物部分を含む。次いで指定ヌクレオチドを含有する溶液を基体の表面に流し、活性化された領域に結合させる。溶液に含有されるヌクレオチドは感光性保護基で光保護されている。合成の第2ラウンドで、DMDは基体の選択された領域上に第2イメージを形成し、これによりそれらの領域の基体を選択的に活性化し、そして第2の指定ヌクレオチド(これも光保護されている)を基体上に流す。この第2ヌクレオチドは、第2ラウンドの照射に際して活性化された領域に結合する。こうして選択したヌクレオチドを選択した領域に付加することができ、マスクの非存在下での光指向合成によりオリゴヌクレオチドのアレイを合成することが可能になる。オリゴヌクレオチド配列を1モノマーずつ構築するためには、このプロセスを多数回反復する。
アレイを構築する他の方法、たとえばクロムマスクの使用、またはアレイ上へのオリゴヌクレオチドのスポッティングも、本発明に使用できる。MASは本発明に使用した場合に改良されたフレキシビリティーおよび簡潔性を提供するが、他のアレイ形成法も有用である。本発明に使用できるMAS以外の合成方式の例は、Affymetrix、Oxford Gene Technologies、およびAgilentが採用している周知の方法である。
本発明は、MIP前駆体分子をアレイ表面で合成し、次いでそれらのMIP前駆体を溶液中へ増幅することを伴ない、次いでそこで他の製造工程を実施することができる。特定の態様において、MIP前駆体をPCRなどの増幅方式により増幅する。そのような態様において、MIP前駆体は一般にそれらがそのような後続の増幅工程に有用なプライマー部位を含むように合成される。
本発明の特定の観点において、プローブがUID領域を含むようにそれらをアレイ上で製造する。UID領域は個々のプローブに固有のプローブセグメントであり、存在する特定のUID配列に基づいてそのプローブを同定できる。UID配列は幾つかの異なる方法で設計でき、それにはプローブに使用すべき特定のUID配列の予備計画、コンピューターその他の手段によるランダムUID配列作製、続いてUID配列をプローブに組み込むためのプローブ合成、または化学的に誘導したランダム合成によるものが含まれる。“化学的に誘導したランダム合成(chemically-derived random synthesis)”は、予備計画なしに、または予めランダム配列決定せずに、プローブ合成に際して数種類のヌクレオチドを混合して同時に合成表面に施し、ランダムに配列に形成させることを意味する。1態様において、光指向合成(たとえば、マスク下アレイ合成またはマスクレス・アレイ合成)に有用な4種類の一般的なヌクレオチド(A、C、T、G)すべてを混合し、数回の連続反復合成に際して添加し、アレイ表面の光活性化された部分にランダムに結合させる。この態様において、A、C、TまたはGの順序は配列の予備計画なしにランダムであろう。化学的に誘導したランダム合成は、配列を予備計画するための工程がワークフローに追加されないという点で、プローブ製造方法の効率化という利点をもたらす。
実施例1:MIPプローブプールの調製および精製
MIP−前駆体からMIPへの変換のためのプロトコルを図1に詳述する。図1AはMIP−前駆体分子に関する一例を示す。この例では、MIP前駆体はアレイ表面に前駆体が形成されるようにMASユニット上での合成により形成された。この例におけるMIP前駆体分子は2つの15merプライマー部位を5’および3’末端に含む。末端プライマー部位に隣接して、ターゲット特異的領域である2つの20mer部位、X20およびY20があり、それらは試料中の特定のターゲット領域の境界をなす特定部位に対して相補的である。X20とY20の間にリンカー領域(この場合は30mer配列)があり、それはこれら2つのターゲット特異的配列を互いに連結している。
次いで2つのプライマーを用いてMIP前駆体を増幅処理する;この例ではプライマーを図1Bに示す。フォワードとリバースの両プライマーがあった。図1Bに示すように、フォワードプライマーはMIP前駆体分子の5’末端セクションにあるものと同一の配列を含み、一方、リバースプライマーはMIP前駆体分子の3’末端にある配列に対して相補的な配列を含む。したがって、第1増幅工程で、リバースプライマーはMIP前駆体にハイブリダイズし、伸長して相補配列を生成し、それにその後の増幅工程でフォワードプライマーが結合できる。この例では、入口と出口をもつチャンバー(Grace Bio−Lab,パーツ05876702001または05871158001)をMIP−前駆体アレイに付着させて、そこでMIP−前駆体分子を増幅鋳型として用いた増幅が行なわれるチャンバーを形成した。増幅はサーマルサイクラー内でSlide Griddle Adaptor(BioRad,SGP0196)を用いて実施された。下記のものを含有する in situ PCRマスターミックスを調製した。
マスターミックスを入れたチューブを95℃の加熱ブロック内に5分間置いて脱ガスした。HotStartTaq酵素(11uL[5U/ul])をミックスに添加して増幅プロトコルを開始した。この例において、用いたプロトコルは下記の工程を伴なっていた:1)アレイを97℃に15分間加熱し、その時間の終了付近で1mLのPCRミックスをチャンバーに装填し、装填口をシールし、気泡を除去し、そして第2口をシールする;2)チャンバーを、100℃/1分;48℃/1.5分;78℃/1分の加熱工程で30回サイクリングする;3)チャンバーを72℃に15分間保持する;そして4)最終工程としてチャンバーを4℃に冷却する。
増幅工程の後、一方のシールを解除し、チャンバーから液体を取り出し、Qiaquick PCR精製キット(Qiagen)を説明に従って用いて精製した。精製した後、光学濃度測定を用いて精製MIP−前駆体の濃度を測定した。プロセスのこの時点で、MIP前駆体は図1Cに示すように増幅しており、二本鎖形態である。
MIP前駆体のさらなる処理を実施した。具体的には、さらに2種類のニッキング酵素を用いて二本鎖前駆体分子を消化した。具体的には、5μg(21.3μl)のPCR生成物を100μlの1×NeB2中5μlのNt.Alw1(10U/μl,New England Biolabs)により、37℃で3時間消化した。生成物を2%アガロース臭化エチジウムゲルで分析した。この最初の消化の後、生成物をさらに5μlのNb.BsrD1(10U/μl,New England Biolabs)により65℃で6時間、続いて80℃で20分間、消化した。インキュベーション時間は、使用する酵素、濃度、反応条件などに応じてほぼ確実に変動する可能性がある。消化反応が終了した後、試料をQiagenヌクレオチド分離キットで精製した。30μlの標準溶離緩衝液を用いて溶離を実施した。DNA濃度を測定し(106ng/μl)、図2に示すように試料を4%アガロース臭化エチジウムゲルで分析した。
図2に示すゲルのレーン1は0.5μlの25塩基対ラダー分子量基準を含む。レーン2では、0.7μlの235ng/μl PCR生成物(すなわち、増幅後の、ただし制限酵素消化前の生成物)を分析した。レーン3は3μlの2酵素消化物を分析した際のゲル生成物を示す。したがって、列3は試料へのハイブリダイゼーションに用いた最終MIPプローブプールを含む。
実施例2:ターゲテッド領域のキャプチャーのためのMIPプローブプールの使用
前記の実施例1からのプロトコルにより、ゲノムDNAへのハイブリダイゼーションに有用な70−mer MIPが得られる。これらの例の目的について、このプールをMIP480ミックスと表示した。そのようなMIPを、cDNA、RNAなどを含めた他の形態の核酸ターゲットについて使用するために調製できることも容易に認識される。MIPプローブをゲノムDNAに接触させるハイブリダイゼーション工程および伸長工程を図3に示す。
この例では、約750ngのhgDNAまたは2.25×105コピーのhgDNAを用いた。MIP:ゲノムの当量比を約100:1に維持しながら、1pgの各プローブ(500pg=0.5ngのMIP480ミックス)を用いた。これらのMIP計算は、70ヌクレオチドのMIPフラグメントのみが存在すると仮定する。ハイブリダイゼーション反応のために、下記の試薬を用いた。
対照として、gDNAをHOで置き換える。95℃で10分間変性し、60℃で36時間インキュベートする。
キャプチャーされたDNA配列(この場合はエキソン)を次いで環化した。リガーゼおよびポリメラーゼ酵素のミックス10μlを調製し、それぞれ25μlのキャプチャー反応に添加した。このリガーゼ/ポリメラーゼミックスは下記の試薬を含む。
合計10μlを25μlのキャプチャー反応液に添加し、60℃で24時間インキュベートする。伸長/環化工程を図3に示す。
下記の試薬(すべてNew England Biosciencesから)を用いてエキソヌクレアーゼの混合物を調製した。
線状DNAを除去するために、2ulのエキソヌクレアーゼミックスをそれぞれ35ulのampligase反応に添加した。試料を37℃で1時間、80℃で10分間、そして95℃で5分間、インキュベートした。
線状DNAを除去した後、残りの生成物を25ulの反応でPCR増幅し、精製した。このPCR増幅(インバースPCR)のために、下記の試薬を用いた。
この反応において、マルチプレックスプライマー(multiplex primer)は試料同定のためのMID配列を含む。PCR増幅のために、反応を98℃に30分間保持し、次いで30回サイクリングし(98℃で10分/60℃で30分/72℃で1分)、次いで72℃に2分間保持する。PCR生成物を4%アガロースゲルで分析した(図4)。図4において、レーン1は5ulのgDNA MIPキャプチャーPCR生成物を20ulのTE中に含有し、レーン2は対照(gDNAを水で置き換えたもの)を含有し、レーン3は0.5ulの25塩基対ラダーを含有する。レーン1からのDNA濃度は23.5ng/ulまたは130nMと測定された。この増幅および精製した生成物を、次いでたとえばIllumina TruSeqシークエンシングを用いるシークエンシングに使用できる。
実施例3:XおよびYについて可変長(20〜30nt)をもつ融解温度(Tm)平衡化した474 MIPを使用したエキソンキャプチャーのためのMIPプロトコル
この例では、使用したMIPプローブは20〜30ヌクレオチドの可変XおよびY領域長さをもつ。この態様において、TmはXとYの融解温度がほぼ等しくなるように標準式を用いて計算される。
先の例において、固定長20−ntのターゲット特異的領域をもつ、下記のように表わされるMIPプローブが作製された:
5’−(X20)AGATCGGAAGAGCACATCCGACGGTAGTGT(Y20),XおよびYは2つの20ヌクレオチド長さのターゲット特異的領域を表わす。本発明の態様においては、MIPプローブは可変領域をもち、下記のように表わすことができる:
5’−(X20〜30)AGATCGGAAGAGCACATCCGACGGTAGTGT(Y20〜30),ここで、X領域とY領域は必ずしも同一長さをもつ必要はない。固定長20−ntのプローブおよびTm平衡化した20〜30−ntプローブのTm分布を図5に示す。図5において、X−軸はプローブの融解温度を示し、一方、Y軸はプローブ数を示す。これから分かるように、プローブのTmを変化させると、集団はXおよびY領域の長さを固定した場合より狭い融点範囲に集中する。下記の表は図5に用いたデータを含む。
20−nt固定MIPプローブプールを用いて示されたシークエンスカバレージを20〜30−nt可変MIPプローブプールと対比して判定するために実験を行なった。これらの実験の結果を図6に示す。図6は、固定Tmで設計したMIPプローブ(挿入図)をTm平衡化設計と比較したシークエンスカバレージの頻度分布(リード(read)の数)を示す。挿入図は45%のMIPが何らカバレージをもたないこと(カバレージ0)を示し、これに対しTm平衡化設計ではカバレージをもたないMIPの数が3%に低下し、474 MIPにより提示されるターゲテッド領域について約15倍の改善を示す。Tm平衡化設計の大部分のMIPについてシークエンスカバレージは相対的に高く、あるMIPについては数百万に及ぶリードが検出された。図6において、X−軸はシークエンスカバレージを表わし、それはIllumina HiSeqでのこの特定のランについて各MIPにつき検出されたリード数の尺度である。カバレージをビンに区分した(binned)頻度分布として表わす。
その図(挿入図を参照)において、固定長MIPプローブプールはシークエンスカバレージを効率的に示さない大きな部分のプール集団を示した。事実、215/474のプローブ(45%)はターゲット配列を効率的にカバーしなかった。対照的に、このグラフの主部分はTmを平衡化した場合のシークエンスカバレージを示す。容易に分かるように、シークエンスカバレージを示さないプローブの数は15/474(3%)にまで劇的に減少した。したがって、XおよびYターゲット領域のTmがほぼ同等である態様は、XおよびY領域が設定された長さのものである他の態様を上回る改良に寄与する。
実施例4:XおよびY領域について20〜30ヌクレオチドの可変長をもち、平衡化TmおよびN6 UIDをもつ474 MIPを使用したエキソンキャプチャー用のMIPプロトコル
UID配列を含むMIP前駆体についての一般的フォーマットを図7Aに表わす。この例では、MIPプローブは、NNNNNN(N6)として表記されるUID領域を含むリンカーで連結された可変長ターゲット領域XおよびYをもつ。UID領域はもちろん6ヌクレオチド以外の鎖長で合成でき、個々の実験または用途に必要なランダム性を誘導するのに十分な長さでありさえすればよい。このセグメントは、各プローブにおいて合成されるランダム生成配列である(すなわち、各プローブがそれ自体のランダムUID配列をもつ)。この配列は、シークエンシングワークフローの終了付近で、いずれか特定のプローブターゲットが増幅バイアス、遺伝子座増幅/提示バイアス、および特定のシークエンシングプラットフォームに関連する系統的アーチファクトによって過剰提示されているかを判定するために使用できる。前記と同様なワークフローで、MIPプローブを合成し、次いでプライマーを用いて増幅し(図7Bを参照)、次いで制限酵素でニッキングし、一本鎖MIPプールとして放出させる(図7Cを参照)。
一本鎖MIPはDNA(たとえばゲノムDNA,ただし、いかなる核酸分子も使用できる)にハイブリダイズする。一本鎖MIPに対する相補鎖をブロッキングオリゴヌクレオチドによりブロックする;その一例を図7Dに表わす。
この態様において、MIP前駆体鋳型はマスクレス・アレイ合成(MAS)を用いてアレイ上に合成された。前記の実施例の場合のように、MIP前駆体アレイをGrace Biolabチャンバーに付着させ、in situ PCRマスターミックスを調製した。このin situ PCRマスターミックスは実質的に前記の実施例1の場合と同一であり、ただしdNTP濃度を10mMに低下させ、より多い体積(13.75μl)をマスターミックスに用いた。dNTP試薬の体積の増加は、用いたフォワードおよびリバースプライマーの体積の減少(20μlから18μlに)ならびに水の体積の減少によって相殺された。
マスターミックスを入れたチューブを95℃の加熱ブロック内に5分間置いて脱ガスした。HotStartTaq酵素(11uL[5U/ul])をミックスに添加して増幅プロトコルを開始した。この例で用いたプロトコルは下記の工程を伴なっていた:1)アレイを97℃に15分間加熱し、その時間の終了付近で1mLのPCRミックスをチャンバーに装填し、装填口をシールし、気泡を除去し、そして第2口をシールする;2)チャンバーを、100℃/1分;48℃/1.5分;78℃/1分の加熱工程で15〜18回サイクリングした;3)チャンバーを72℃に15分間保持する;そして4)最終工程としてチャンバーを4℃に冷却する。
増幅工程の後、一方のシールを解除し、チャンバーから液体を取り出し、Qiaquick PCR精製キット(Qiagen)を説明に従って用いて精製した。精製した後、光学濃度測定を用いて精製MIP−前駆体の濃度を測定した。1スライド上で15回の増幅サイクルを用いて0.3μgのMIP−前駆体が得られ、一方、他のスライド上で18回の増幅サイクルを用いて2.3μgが得られた。低い増幅量の試料の追加増幅を1mlのPCRで実施した:5×HF緩衝液(200μl)、50μMのプライマー300−20−1(10μl)、50μMのプライマー300−22−2(10μl)、10mMのdNTP(20μl)、MIP前駆体5ng/μl(5μl)、水(750μl)、Phusionポリメラーゼ(5μl)。試料を98℃に加熱し、次いで10回サイクリングした(98℃で20分,60℃で1分,72℃で1分)。PCR生成物を50μlのH0中で精製した(Qiagen)。この追加増幅の後、DNA濃度は117ng/μlと測定された。
増幅の後、MIP前駆体を制限酵素で処理した:2.5μgのPCR生成物を5μlのNt.AlwI(10u/μl,NEB)により、100μlの1×NEB2中、37℃で3時間消化した。5μlのNb.BsrDI(10u/μl,NEB)を添加した。65℃で3時間、続いて80℃で20分間、インキュベートした。消化反応物をQiagenヌクレオチド分離キットで精製し、30μlの溶離緩衝液中に溶離した。DNA濃度は47ng/μlと測定され、86ntのTm平衡化したN6 MIPの濃度は47*86/(126+86)=19ng/μlであった。
酵素処理の後、MIPプローブを図8に示すようにゲノムDNAにハイブリダイズさせる。明確にするために、環化した構造のMIPを表わした先の図とは異なり、図8は環化した形のゲノムDNAを表わしていることを留意すべきである。概念的にいずれのアレンジメントも適正に機能し、視覚化するための個々の好みによっていずれかの構造が選択されるにすぎないことは、当業者に容易に認識される。
この例では、下記の試薬を用いてプローブをゲノムDNAにハイブリダイズさせた。
対照として、gDNAを水で置き換えた。試料を95℃で10分間変性し、61℃で36時間インキュベートした。
この態様において、ゲノムDNAにハイブリダイズしたMIPは、Phusionポリメラーゼでギャップ充填した後にAmpligaseにより環化された。リガーゼ/ポリメラーゼミックスは下記の試薬を用いて調製された。
合計10μlのリガーゼ/ポリメラーゼミックスをそれぞれ25μlのキャプチャー反応に添加し、60℃で24時間インキュベートした。
線状DNAを消化するために、下記の試薬からなるエキソヌクレアーゼミックスで試料を処理した。
線状DNAを消化するために、2μlのエキソヌクレアーゼミックスをそれぞれ35μlのPhusion/ampligase反応液に添加した。試料を37℃で1時間、80℃で10分間、95℃で5分間インキュベートした。
キャプチャー後の試料を次いで50μlの反応で増幅および精製する。
試料を次いでサーマルサイクリングで増幅した:98Cで30分、次いで28回のサーマルサイクル(98Cで10分/60Cで30分/72Cで1分)。増幅の後、5μlのPCR生成物を4%アガロースゲルで30分間、分析した。結果を図9に示す。レーン1は25−bpのラダーを示し、レーン2はPCR生成物を示す。
増幅した試料を次いでIlluminaシークエンサーでシークエンシングした。
実施例5:エキソーム(Exome)キャプチャーのためのMIP設計
この例では、前記の実施例4に記載したものと同じプロトコルを用い、ただし474 MIPプローブのプールを合成する代わりに、個々のプローブ上にXおよびYターゲット領域について20〜30ヌクレオチドの可変長をもち、平衡化TmおよびN6 UID配列をもつ437,202のMIPプローブを含むようにプールを増加した(“437Kプール”)。
437Kプールを用いてシークエンシング分析を実施して、キャプチャー成功率を判定した。437Kプールは約82%のキャプチャー成功率をもつと判定された(すなわち、プール中のプローブの82%がターゲテッド配列のキャプチャーに成功した)。
実施例6:UIDの使用
UIDはシークエンシング結果における特定のプローブの過剰提示または過小提示を判定するために使用でき、個々のプローブに関係する特定のリードのトラッキングがデータ解析のために重要である他の目的にも有用である。1態様において、UIDは、図10に示すように増幅により導入された潜在的な対立遺伝子バイアスの存在下で接合状態(zygosity)を判定するために用いられる。各MIPプローブについて、シークエンシングリードはそのプローブについて合成されたUID配列(リード1、リード2、または両方に現われる可能性がある)を示し、かつ目的とするキャプチャー配列を含むであろう(図10Aを参照)。
図10BはMIPがプライマーベースのプローブであり、したがって目的ターゲット上にアラインした配列の‘積み重なり(stack)’を生成することを示す。プローブ特異的UIDは分子キャプチャー事象を区別するために用いられる。1つのUIDが増幅によって多数のシークエンシングリードペア(read pair)をもつ可能性がある。バリアントを見出だす目的で、同一UIDを含むリードペアの各セットから代表的リードペアまたはコンセンサス配列を選択する。あるキャプチャー事象が優先的に増幅されていれば、そのUIDも運ばれているであろう。このUIDベースの複製物リードペア削減は潜在的な増幅バイアスを排除する(図10Cを参照)。
図11は、本発明のMIPプローブの作製法の態様を例示する。マスクレス・アレイ合成を用いて、アレイ(この例では2.1Mフィーチャーのマイクロアレイ)上で1モノマーずつ前駆体分子を合成する。前駆体分子を3’末端でアレイの表面に固定することができる。合成されると、アレイを in situ PCR処理して、可溶化、増幅し、1個のウラシルを1つのプローブ鎖に取り込ませる。増幅の後、前駆体は溶液中の二本鎖分子であり、1個のウラシル塩基を含む。増幅の後、この例では、ウラシル−DNAグリコシラーゼ(UDG)およびエンドヌクレアーゼVIIIを用いて二本鎖分子を消化処理し、Nb.DSRDIがプローブ鎖上にのみニックを形成して、厳密に両方の in situ プライマーアダプターを離脱させる。変性PAGEゲル電気泳動はプローブの形成を立証し、プローブの相補体をも示す。
図12Aおよび12Bは、MIPプローブに関するワークフローの1態様を例示する。図12A1では、一本鎖MIPプローブをターゲットDNAと適切な比率で混合する。MIPプローブとターゲットを適切な期間ハイブリダイズさせる(図12A2);時間はプローブおよびターゲットの複雑性および比率に依存する。ハイブリダイゼーションの後、MIPプローブを伸長およびライゲートさせて、ターゲット配列をコピーし、プローブ/ターゲット配列を環化する(図12A3)。伸長およびライゲーションはDNAポリメラーゼおよびDNAリガーゼの混合物を用いて達成される。
伸長/ライゲーションの後、一本鎖鋳型およびプローブを消化する(図12B1)。ある態様において、エキソヌクレアーゼ、たとえばExoIおよびExoIIIの混合物を一本鎖分子の消化のために使用する。一本鎖分子が消化された時点で、プローブ/ターゲットを増幅する。特定の態様において、シークエンシングアダプターおよび試料インデックスバーコード(MID)配列(図12B2に“N”と表記する)を組み込む。MIDコードはそれぞれの検査試料について異なる配列を使用し、試料をそれらのMIDコードにより同定できるのでシークエンシング前の増幅後プーリングを可能にする。図12B3は、増幅後の二本鎖生成物の構造を表わし、この時点でそれはシークエンシングに使用できる状態である。
図13は、本発明を用いる試料トラッキングの態様を例示する。試料トラッキングの目的は、多数の実験(それぞれ異なるゲノムDNA試料をアッセイしたもの)からキャプチャーされた増幅DNA配列を、シークエンシング前にプールできるようにすることである。これによって、いずれか個々の試料についてキャプチャーされた配列の分析のために、典型的な第2世代機器でのシークエンシングのラン毎に得られた多量のシークエンシングデータを、通常はそれよりはるかに少ない配列データ要求に対して、より効率的にマッチングさせることができ、それによってコストが低減し、効率が向上し、より高い試料スループットを得ることができる。
試料トラッキングは、環化MIPプローブを増幅するために用いられるPCRプライマーの1つに試料トラッキングインデックス(通常は6〜14ヌクレオチドの配列)を含有させることにより達成される。同一のDNA試料に由来するキャプチャーされた生成物のアンプリコンは、そのDNAのゲノム内の多種多様な領域をターゲティングするけれども、それらはすべて同一のトラッキングインデックスをもつであろう。プールしたキャプチャーされた生成物のシークエンシング後、付随するインデックス配列を解読することにより、それぞれのリードペアの由来を解明することができる。
図14は、MIPプローブに組み込まれたUID配列を用いた事象計数(event-counting)の態様からの模擬データを例示する。事象計数の目的は、増幅バイアスまたは他のエラーの影響を排除した後のバリアント呼出に固有のキャプチャー事象を同定することである。UIDは各プローブに(PCRプライマー自体にではなく)組み込まれたランダム配列であり、増幅に際してコピーされる。各プローブ分子は、他のプローブ分子のように同一試料中の同一のエキソンを厳密にターゲティングするために用いられるとしても、異なるUID配列をもつべきである。シークエンシングの後、1つ(最高のシークエンスクオリティースコアをもつもの)を除いて、同一のUID配列をもつすべてのリードペアがPCR複製物と同様に廃棄される。残されたデータはすべて同等の情報価値をもち、試料の真の複雑性を表わすと仮定される。この能力は、変異事象、たとえば試料における体細胞変異、または混合集団におけるいずれかのバリアントの真の頻度を決定するために有用である。図14には、UID補正付きおよび補正なしの単一エキソンからの模擬データを表示する。UID補正なしのデータでは、バイアスがかかった変異対立遺伝子増幅のため、変異(X)は試料DNAにおいて50%の頻度で不正確に測定されるであろう。UID補正付きでは、試料DNAにおける実際の変異頻度は17%であることが明らかになる。
図15は、比較的大きなMIPプローブデザイン内の単一プローブターゲット(PTEN エキソン4)に対応する23,517のリードペアの解析を示す。この解析により729の個別の6−mer UIDタグが明らかになった。あるタグの高い(>300)頻度によって強い増幅バイアスの可能性が立証され、一方、UIDは重複情報を表わすリードの96.4%の排除を可能にした。
図16は、プローブ再平衡化の結果を示す。EGFR遺伝子の4つのエキソンを6種類のHEAT−Seqプローブ(IDTから入手)でターゲティングした。50pMのプローブを500ngのgDNAにアニールさせ、4時間かけて環化し、次いで増幅した。プローブ/ターゲット構築体を次いでシークエンシングした。マッピングしたリードの99%がターゲティングしたエキソンに最大約100,000Xの可変カバレージ深度でアラインした(UID重複排除(deduplification)の前)。このEGFR実験で得られた高変動性のシークエンスカバレージ深度は、大部分の高度に多重化した増幅ベースのターゲテッドシークエンシング法に固有の重大な非効率性を例示する。プローブ比の再調整(rebalancing)(右)はターゲット間の配列分布を変化させることができるが、予測できない様式においてである。経験と反復によるプローブ設計方法が現在最も有効な解決策である(対照=210,634のリード;MIP条件1=429,202のリード;MIP条件2=313,346のリード)。

Claims (6)

  1. MIPプローブを調製する方法であって、下記を含む前記方法:
    a)アレイ上でMIP前駆体を合成することであって、ここでMIP前駆体は;
    i)5’及び3’末端に2つのプライマー結合部位を含み;
    ii)前記プライマー結合部位の内側の一方の末端付近に第1末端ターゲット配列、および反対側の末端付近に第2末端ターゲット配列を含み;
    iii)前記第1末端ターゲット配列、および前記第2末端ターゲット配列の間にリンカー領域を含み;
    iv)MIPプローブ鎖上の5’末端側のターゲット配列の5’末端にニッキングのための酵素が認識する部位を有し;ならびに、
    v)MIPプローブ鎖上の3’末端側のターゲット配列の3’末端にニッキングのための酵素が認識する部位を有する;
    b)前記2つのプライマー結合部位に結合するプライマーを用いて、MIP前駆体を溶液中で増幅すること;
    c)溶液を採集すること;
    d)増幅した前駆体を1種類以上のニッキングのための酵素を使用して消化して、MIPプローブを形成すること、ここで前記酵素はMIP前駆体中の前記ニッキングのための酵素が認識する部位を認識するものである
    e)前記MIPプローブを、一本鎖のMIPプローブのリンカー領域に相補的なブロッキングオリゴヌクレオチドとハイブリダイズさせること。
  2. MIP前駆体のリンカー領域が固有識別子(UID)配列を含む、請求項に記載の方法。
  3. アレイ合成がマスクレス・アレイ合成を使用して実施される、請求項1又は2に記載の方法。
  4. 第1末端ターゲット配列および/または第2末端ターゲット配列の配列長さを、これら2種類のターゲット配列の融解温度を近接させるために変更する、請求項1〜3のいずれか1項に記載の方法。
  5. ターゲット配列の一部を同定する方法であって、下記を含む前記方法:
    )請求項1〜4のいずれか1項に記載の方法でMIPプローブを調製すること
    g)MIPプローブを核酸試料にハイブリダイズさせること;
    )核酸試料の一部が複製されて環化MIPプローブに組み込まれるように、MIPプローブをポリメラーゼで環化すること;
    )エキソヌクレアーゼを使用して線状核酸を実質的に消化すること;および、
    )MIPプローブの配列を決定すること。
  6. さらに、MIPプローブが固有識別子(UID)配列を含む場合に、MIPプローブの配列を評価し、いずれかのUID配列が予想結果と比較して過剰提示または過小提示されているかを判定することを含む、請求項に記載の方法。
JP2016530538A 2013-08-02 2014-07-31 特別なキャプチャープローブ(heatseq)を使用したシークエンスキャプチャー法 Active JP6374964B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361861695P 2013-08-02 2013-08-02
US61/861,695 2013-08-02
PCT/EP2014/066539 WO2015014962A1 (en) 2013-08-02 2014-07-31 Sequence capture method using specialized capture probes (heatseq)

Publications (2)

Publication Number Publication Date
JP2016525363A JP2016525363A (ja) 2016-08-25
JP6374964B2 true JP6374964B2 (ja) 2018-08-15

Family

ID=51260871

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016530538A Active JP6374964B2 (ja) 2013-08-02 2014-07-31 特別なキャプチャープローブ(heatseq)を使用したシークエンスキャプチャー法

Country Status (6)

Country Link
US (1) US20150141257A1 (ja)
EP (1) EP3027766A1 (ja)
JP (1) JP6374964B2 (ja)
CN (1) CN105980574A (ja)
CA (1) CA2917782A1 (ja)
WO (1) WO2015014962A1 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2934982T3 (es) * 2015-03-30 2023-02-28 Becton Dickinson Co Métodos para la codificación con códigos de barras combinatorios
CA2993347A1 (en) 2015-07-29 2017-02-02 Progenity, Inc. Nucleic acids and methods for detecting chromosomal abnormalities
WO2017020024A2 (en) * 2015-07-29 2017-02-02 Progenity, Inc. Systems and methods for genetic analysis
AU2017266299A1 (en) * 2016-05-17 2018-12-20 Dname-It Nv Methods for identification of samples
EP3246412A1 (en) * 2016-05-17 2017-11-22 DName-iT NV Methods for identification of samples
US20190316180A1 (en) * 2016-11-23 2019-10-17 Universite De Strasbourg Tandem barcoding of target molecules for their absolute quantification at single-entity resolution
CN110491445B (zh) * 2018-05-11 2023-05-30 广州华大基因医学检验所有限公司 Uid测序、uid序列设计、uid去重质量值校正的方法及应用
CN112292460A (zh) 2018-06-12 2021-01-29 主基因有限公司 核酸扩增方法
CN108949909A (zh) * 2018-07-17 2018-12-07 厦门生命互联科技有限公司 一种用于基因检测的血小板核酸文库构建方法和试剂盒
CN113474466A (zh) 2019-02-21 2021-10-01 主基因有限公司 多倍体基因分型
WO2020206170A1 (en) 2019-04-02 2020-10-08 Progenity, Inc. Methods, systems, and compositions for counting nucleic acid molecules
KR20220038604A (ko) 2019-05-30 2022-03-29 래피드 제노믹스 엘엘씨 표적 게놈 영역의 유연한 및 고처리량 시퀀싱
WO2021127406A1 (en) * 2019-12-19 2021-06-24 The Regents Of The University Of California Methods of producing target capture nucleic acids
EP4211265A1 (en) * 2020-09-10 2023-07-19 Universiteit Antwerpen Methylation detection assay
CN113029009B (zh) * 2021-04-30 2022-08-02 高速铁路建造技术国家工程实验室 一种双视角视觉位移测量***及方法
AU2022329276A1 (en) * 2021-08-18 2024-04-04 Yeda Research And Development Co. Ltd. Ultrafast molecular inversion probe-based targeted sequencing assay for low variant allele frequency

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2002246612B2 (en) * 2000-10-24 2007-11-01 The Board Of Trustees Of The Leland Stanford Junior University Direct multiplex characterization of genomic DNA
AU2003239899A1 (en) * 2002-05-24 2003-12-12 Somagenics, Inc. Methods and compositions for production of directed sequence libraries
CA2537134C (en) * 2003-09-02 2014-08-19 Keygene N.V. Ola-based methods for the detection of target nucleic acid sequences
US20060234264A1 (en) * 2005-03-14 2006-10-19 Affymetrix, Inc. Multiplex polynucleotide synthesis
WO2007061284A1 (en) * 2005-11-22 2007-05-31 Plant Research International B.V. Multiplex nucleic acid detection
WO2007092538A2 (en) * 2006-02-07 2007-08-16 President And Fellows Of Harvard College Methods for making nucleotide probes for sequencing and synthesis
CA2760439A1 (en) * 2009-04-30 2010-11-04 Good Start Genetics, Inc. Methods and compositions for evaluating genetic markers
US20130261196A1 (en) * 2010-06-11 2013-10-03 Lisa Diamond Nucleic Acids For Multiplex Organism Detection and Methods Of Use And Making The Same
US8759036B2 (en) * 2011-03-21 2014-06-24 Affymetrix, Inc. Methods for synthesizing pools of probes
EP2788499B1 (en) * 2011-12-09 2016-01-13 Illumina, Inc. Expanded radix for polymeric tags
US20150344973A1 (en) * 2012-04-23 2015-12-03 Pathogenica, Inc. Method and System for Detection of an Organism

Also Published As

Publication number Publication date
JP2016525363A (ja) 2016-08-25
EP3027766A1 (en) 2016-06-08
CA2917782A1 (en) 2015-02-05
WO2015014962A1 (en) 2015-02-05
US20150141257A1 (en) 2015-05-21
CN105980574A (zh) 2016-09-28

Similar Documents

Publication Publication Date Title
JP6374964B2 (ja) 特別なキャプチャープローブ(heatseq)を使用したシークエンスキャプチャー法
JP7322063B2 (ja) 新規なプライマーおよびその使用
AU704625B2 (en) Method for characterizing nucleic acid molecules
AU2016268089B2 (en) Methods for next generation genome walking and related compositions and kits
US6361940B1 (en) Compositions and methods for enhancing hybridization and priming specificity
US20210246498A9 (en) Human identification using a panel of snps
CN110719957B (zh) 用于核酸靶向富集的方法和试剂盒
KR102592367B1 (ko) 게놈 및 치료학적 적용을 위한 핵산 분자의 클론 복제 및 증폭을 위한 시스템 및 방법
US20200299764A1 (en) System and method for transposase-mediated amplicon sequencing
CN110603326A (zh) 扩增靶核酸的方法
JPWO2002036822A1 (ja) 核酸塩基配列決定方法
JPWO2007055255A1 (ja) 複数の識別用核酸配列を増幅する方法
US20210395799A1 (en) Methods for variant detection
KR20230124636A (ko) 멀티플렉스 반응에서 표적 서열의 고 감응성 검출을위한 조성물 및 방법
US6670120B1 (en) Categorising nucleic acid
JP2022546485A (ja) 腫瘍高精度アッセイのための組成物および方法
JP7490071B2 (ja) シーケンシングのための新規核酸鋳型構造
KR102237248B1 (ko) 소나무 개체식별 및 집단의 유전 분석용 snp 마커 세트 및 이의 용도
US20240209414A1 (en) Novel nucleic acid template structure for sequencing
CN118215744A (zh) 利用等温线性扩增探针的靶标富集和定量

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160317

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170203

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20170508

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170703

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180621

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180720

R150 Certificate of patent or registration of utility model

Ref document number: 6374964

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250