JP2001509027A - 核酸種を検出または定量するための方法および組成物 - Google Patents

核酸種を検出または定量するための方法および組成物

Info

Publication number
JP2001509027A
JP2001509027A JP53449798A JP53449798A JP2001509027A JP 2001509027 A JP2001509027 A JP 2001509027A JP 53449798 A JP53449798 A JP 53449798A JP 53449798 A JP53449798 A JP 53449798A JP 2001509027 A JP2001509027 A JP 2001509027A
Authority
JP
Japan
Prior art keywords
probe
probes
nucleic acid
labeled
array
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP53449798A
Other languages
English (en)
Inventor
ドラマナク,ラドジェ
Original Assignee
ヒセック,インコーポレーテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US08/784,747 external-priority patent/US6309824B1/en
Priority claimed from US08/812,951 external-priority patent/US6297006B1/en
Application filed by ヒセック,インコーポレーテッド filed Critical ヒセック,インコーポレーテッド
Publication of JP2001509027A publication Critical patent/JP2001509027A/ja
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • C12Q1/6837Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10TTECHNICAL SUBJECTS COVERED BY FORMER US CLASSIFICATION
    • Y10T436/00Chemistry: analytical and immunological testing
    • Y10T436/14Heterocyclic carbon compound [i.e., O, S, N, Se, Te, as only ring hetero atom]
    • Y10T436/142222Hetero-O [e.g., ascorbic acid, etc.]
    • Y10T436/143333Saccharide [e.g., DNA, etc.]

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

(57)【要約】 本発明は標的核酸種の検出方法を提供し、この方法は、支持体に固定されたプローブのアレイおよび多数の標識プローブを用意し、ここで各標識プローブは標的核酸の第1部分に相補的な第1核酸配列をもつように選択され、支持体に固定された少なくとも1つのプローブの核酸配列は標的核酸配列の第2部分に相補的であって、第2部分は第1部分に隣接しており;プローブ配列の相補的配列へのハイブリダイゼーションに適した条件下で前記アレイに標的核酸を添加し;前記アレイに標識プローブを導入し;支持体に固定されたプローブを標的核酸にハイブリダイズさせ;標識プローブを標的核酸にハイブリダイズさせ;前記アレイ中の隣接してハイブリダイズしたプローブに標識プローブを連結し;そして前記アレイ中のプローブに連結された標識プローブを検出する;各ステップを含んでなる。

Description

【発明の詳細な説明】 核酸種を検出または定量するための方法および組成物 関連出願の相互参照 本特許出願は、1997年3月4日出願の米国特許出願第08/812,951号の一部継続 出願であり、また、1997年1月16日出願の米国特許出願第08/784,747号の一部継 続出願である。発明の利用分野 本発明は一般的には核酸分析のための方法および装置に関し、特に核酸を解析 するための方法および装置に関する。発明の背景 分子生物学、医学およびバイオテクノロジーのさらなる進展にとって、核酸サ ンプル中の4種類のヌクレオチドの配列を決定する速度は技術上の主要な障害と なっている。ゲルでの核酸分子の分離を必要とする核酸配列決定法が1978年以来 使用されてきている。核酸配列を決定するための他の確立された方法は、ハイブ リダイゼーションによるシークエンシング(sequencing by hybridization:SBH) である。 ヌクレオチドの配列(すなわち、サンプル中のA,G,C,Tヌクレオチドの順序 )を決定する伝統的な方法を行うには、特定のヌクレオチドでの分解または複製 しつつある鎖のジデオキシ・チェーン・ターミネーションにより、ランダムに終 結され、異なって標識された核酸断片の混合物を調製する。その後、得られた1 〜500bpの範囲の核酸断片をゲル上で分離し、はしご状のバンド(隣接するサン プル同士は鎖長が1ヌクレオチドだけ異なる)を形成させる。 アレイに基づくSBH法は核酸分子の分離、分解、合成またはイメージングにお いて単一塩基分解能を必要としない。長さがK塩基の短鎖オリゴヌクレオチドの ミスマッチ識別可能ハイブリダイゼーションを用いると、構成的K-merオリゴヌ クレオチドのリストを標的核酸について調べることができる。標的核酸の配列は スコアリング(scoring)されてユニークにオーバーラップするオリゴヌクレオチ ドにより組み立てることができる。 ハイブリダイゼーションによるシークエンシングを達成するために利用できる 方法はいくつかある。SBHフォーマット1と呼ばれる方法では、核酸サンプルを アレイとして整列させ、そのサンプルを標識プローブとハイブリダイズさせる。 いくつかのプローブの並行スコアリングのために同じサンプル核酸のセットを有 するレプリカ膜を使用してもよいし、かつ/また、プローブを多重化してもよい 。核酸サンプルをナイロン膜または他の適当な支持体上にアレイとして整列させ てハイブリダイズさせる。それぞれの膜アレイは多数回再使用することができる 。フォーマット1は大量のサンプルをバッチ処理するのに特に有効である。 SBHフォーマット2においては、プローブをそれらの個々の配列に対応する支 持体上の位置にアレイとして整列させ、標識した核酸サンプルの断片を、アレイ に整列させたプローブとハイブリダイズさせる。この場合、断片についての配列 情報は、整列させた全プローブとの同時ハイブリダイゼーション反応において決 定される。他の核酸断片の配列を決定するために、同じオリゴヌクレオチドアレ イを再使用することができる。こうしたアレイはプローブのスポッティングまた はin situ合成により作製することができる。 SBHフォーマット3においては、2セットのプローブが用いられる。ある実施 形態において、1セットは位置が分かっているプローブのアレイ形態をしており 、もう1セットは標識されていて、マルチウェルプレート中に保存される。この 場合は、標的核酸を標識する必要がない。標的核酸と1以上の標識プローブを、 アレイとして整列させたプローブのセットに添加する。1つの結合プローブと1 つの標識プローブが両方とも標的核酸に隣接してハイブリダイズすると、それら は共有結合で連結されて、連結プローブの長さの合計に等しい検出配列をもたら す。この方法は長い核酸断片(例えば完全な細菌ゲノム)の塩基配列決定を、よ り小さい断片種での核酸サブクローニングを行うことなく、可能にするものであ る。 本発明においては、1以上の核酸サンプルの効率のよい同定および塩基配列決 定にSBHを適用する。この方法は核酸診断、法医学、および遺伝子マッピングの 分野で多くの用途を有する。それはまた、遺伝子疾患の原因となる突然変異や他 の特質を同定するために、生物多様性を評価するために、または核酸配列に依存 する多くの他のタイプのデータを得るために使用することができる。発明の概要 本発明は、標的核酸種を検出する方法を提供し、この方法は、支持体に付着さ せたプローブのアレイおよび多数の標識プローブを用意し(ただし、各標識プロ ーブは標的核酸の第1部分に相補的な第1核酸配列を有するように選択され、ま た、支持体に付着された少なくとも1つのプローブの核酸配列は標的の核酸配列 の第2部分に相補的であり、この第2部分は第1部分に隣接している);プロー ブ配列を相補的配列とハイブリダイズさせるのに適した条件下で標的核酸を前記 アレイに添加し;標識プローブを前記アレイに導入し;支持体に付着させたプロ ーブを標的核酸とハイブリダイズさせ;標識プローブを標的核酸とハイブリダイ ズさせ;標識プローブを前記アレイ中の隣接してハイブリダイズしたプローブに 連結させ;そして前記アレイ中のプローブに連結された標識プローブを検出する ;各ステップを含んでなる。好ましい本発明方法によれば、支持体に付着させた プローブのアレイはユニバーサル(普遍的)なプローブセットを含むものである 。 本発明の他の好ましい態様によれば、支持体に付着させたプローブの少なくと も2つは標的核酸配列のオーバーラップする配列を特定し、より好ましくは標識 プローブの少なくとも2つが標的核酸配列のオーバーラップする配列を特定する 。 さらに、本発明の他の態様によれば、配列の知られている標的核酸を検出する 方法が提供され、この方法は、核酸サンプルを、固相支持体に付着させた固定化 オリゴヌクレオチドプローブのセットに、ハイブリダイズする条件下で接触させ (ただし、固定化プローブは前記標的核酸配列の異なる部分と特異的にハイブリ ダイズすることができる);標的核酸を溶液中の標識オリゴヌクレオチドプロー ブのセットに、ハイブリダイズする条件下で接触させ(ただし、標識プローブは 固定化プローブに隣接する前記標的核酸配列の異なる部分と特異的にハイブリダ イズすることができる);標的配列上の固定化プローブにすぐ接している標識プ ローブを固定化プローブに(例えば、リガーゼを使用して)共有結合で連結さ せ;連結されていないあらゆる標識プローブを除去し;固定化プローブに結合さ れた前記標識プローブの存在を検出することにより標的核酸の存在を検出する; 各ステップを含んでなる。 本発明はまた、細胞型、組織または組織混合物中の部分的にまたは完全に配列 決定された遺伝子のセットの1メンバーの発現を確認する方法を提供し、この方 法は、前記配列決定された遺伝子に特異的な固定化プローブおよび標識プローブ の対を特定し;固定化プローブの1以上のアレイに、未標識核酸サンプルと対応 する標識プローブをハイブリダイズさせ;隣接してハイブリダイズした標識プロ ーブと固定化プローブとの間に共有結合を形成させ;連結されていないプローブ を除去し;そしてアレイ中の予め特定された位置に結合した標識プローブを検出 することにより、配列決定された遺伝子の存在を確認する;各ステップを含んで なる。本発明のこの態様の好ましい実施形態において、標的核酸は病原体の存在 を証明するだろう。 さらに、本発明は、オリゴヌクレオチドプローブのアレイを提供し、このアレ イは、ナイロン膜;ナイロン膜上のオリゴヌクレオチドプローブの多数のサブア レイであって、前記サブアレイは多数の個々のスポットを含み、各スポットが同 一配列の多数のオリゴヌクレオチドプローブを含むもの;およびナイロン膜上の サブアレイ間に配置された、隣接サブアレイ間の交差汚染を防止する多数の疎水 性バリアー;を含んでなる。 さらに、本発明は、標的核酸中の第1末端および第2末端を有する反復配列の 配列決定法を提供し、この方法は、(a)前記反復配列を含む様々な長さのスペー サーオリゴヌクレオチドを多数用意し;(b)前記反復配列の第1末端に隣接する ことが知られている第1オリゴヌクレオチドを用意し;(c)多数の第2オリゴヌ クレオチドを用意し(ただし、そのうちの1つは前記反復配列の第2末端に隣接 しており、前記多数の第2オリゴヌクレオチドは標識されている):(d)第1オ リゴヌクレオチドと多数の第2オリゴヌクレオチド、および多数のスペーサーオ リゴヌクレオチドの1つを標的核酸とハイブリダイズさせ;(e)ハイブリダイズ したオリゴヌクレオチドを連結させ;(f)連結したオリゴヌクレオチドを非連結 オリゴヌクレオチドから分離し;そして(g)連結オリゴヌクレオチド中の標識を 検出する;各ステップを含んでなる。 さらにまた、本発明は、標的核酸中の第1末端および第2末端を有する分岐点 配列の配列決定法を提供し、この方法は、(a)前記分岐点配列の第1部分に相補 的な第1オリゴヌクレオチドを用意し(ただし、第1オリゴヌクレオチドは前記 分岐点配列の第1末端から少なくとも1ヌクレオチドだけ伸長している);(b) 前記分岐点配列の第2部分に相補的で、標識されている第2オリゴヌクレオチド を多数用意し(ただし、多数の第2オリゴヌクレオチドは前記分岐点配列の第2 末端から少なくとも1ヌクレオチドだけ伸長しており、前記分岐点配列の第2末 端から伸長している第2オリゴヌクレオチドの部分が分岐点配列に由来する多数 の配列に相補的な配列を含む);(c)第1オリゴヌクレオチド、および多数の第 2オリゴヌクレオチドのうちの1つを標的DNAとハイブリダイズさせ;(d)ハイブ リダイズしたオリゴヌクレオチドを連結させ;(e)連結したオリゴヌクレオチド を非連結オリゴヌクレオチドから分離し;そして(f)連結オリゴヌクレオチド中 の標識を検出する;各ステップを含んでなる。 さらにまた、本発明は、標的核酸に対してネガティブであると予想されるプロ ーブを用いて配列を確認する方法を提供する。その後、標的核酸を「ネガティブ 」プローブとハイブリダイズさせて、これらのプローブが標的核酸との完全な塩 基対合を形成しないことを確認することにより、標的配列を確認する。 さらにまた、本発明は、配列情報を少なくすることなく、プローブがハイブリ ダイゼーション反応において多重化され得る(すなわち、異なるプローブが異な る標識をもち、その結果異なるプローブの標的へのハイブリダイゼーションが識 別可能となる)ように、異なる標識を結合させたオリゴヌクレオチドプローブを 用いて核酸を分析する方法を提供する。好ましい実施形態において、標識は放射 性同位体、蛍光分子、酵素またはエレクトロホア質量標識(electrophore massla bel)である。より好ましい実施形態では、異なって標識されたオリゴヌクレオチ ドプローブがフォーマットIII SBHで用いられ、多数のプローブ(2より多い、 ただし1つのプローブは固定化プローブである)が一緒に連結される。 さらにまた、本発明は、標的核酸がサンプル中の相同核酸と比べてごく少量で 存在するとき、既知の配列を有する標的核酸の存在を検出する方法を提供する。 好ましい実施形態において、標的核酸は多数の源からの核酸を含むサンプル中に 非常に低い頻度で存在する対立遺伝子である。別の好ましい実施形態では、標的 核酸が突然変異を起こした配列をもち、核酸サンプル中に非常に低い頻度で存在 する。 さらにまた、本発明は、シングル・パス・ゲルシークエンシング(single pass gel sequencing)を用いて標的核酸の配列を確認する方法を提供する。シングル ・パス・ゲルシークエンシング用のプライマーはSBHにより得られた配列に由来 し、これらのプライマーを標準的なサンガー(Sanger)シークエンシング反応で用 いて標的核酸についてのゲル配列情報を得る。次に、シングル・パス・ゲルシー クエンシングにより得られた配列をSBH由来の配列と比較して、その配列を確認 する。 さらにまた、本発明は、シングル・パス・ゲルシークエンシングにより分岐点 を解明する方法を提供する。シングル・パス・ゲルシークエンシング反応用のプ ライマーは1回目のSBHシークエンシング後に得られたSfsの末端から同定し、こ れらのプライマーを標準的サンガーシークエンシング反応で用いて、Sfsの分岐 点を通るゲルシークエンシング情報を得る。その後、分岐点を通るサンガーシー クエンシング結果をSfsと比較して、隣接しているSfsを同定することによりSfs をアラインする。 さらにまた、本発明は、SBH反応に先立ってPCR産物を精製することなく、PCR により標的核酸を含むサンプルを調製する方法を提供する。フォーマットISBHに おいて、前もって精製せずに、粗製のPCR産物を支持体にアプライし、その支持 体は標識プローブの導入に先立って洗浄してもよい。 さらにまた、本発明は、標的核酸を分析する方法および装置を提供する。この 装置は希望の時間に一緒に混合される2つの核酸のアレイを含む。好ましい実施 形態においては、一方のアレイの核酸が標識される。より好ましい実施形態では 、2つのアレイ間に物質を配置し、この物質がアレイ中の核酸同士の混合を防止 する。この物質を取り除くか、または透過性にすると、2つのアレイ中の核酸が 一緒に混合される。別の好ましい実施形態では、一方のアレイの核酸が標的核酸 で、他方のアレイの核酸がオリゴヌクレオチドプローブである。他の好ましい実 施形 態では、両方のアレイの核酸がオリゴヌクレオチドプローブである。別の好まし い実施形態では、一方のアレイの核酸がオリゴヌクレオチドプローブと標的核酸 で、他方のアレイの核酸がオリゴヌクレオチドプローブである。他の好ましい実 施形態では、両方のアレイの核酸がオリゴヌクレオチドプローブと標的核酸であ る。 上記の装置を用いる本発明の1つの方法は、支持体に固定させた核酸のアレイ を用意し、第2の核酸のアレイを用意し、第2アレイの核酸を固定アレイの核酸 に接触させる条件を提供し、その際、一方のアレイの核酸が標的核酸で、他方の アレイの核酸がオリゴヌクレオチドプローブであり、そしてハイブリダイゼーシ ョンの結果を分析する、各ステップを含んでなる。好ましい実施形態において、 固定アレイは標的核酸で、第2アレイは標識したオリゴヌクレオチドプローブで ある。より好ましい実施形態では、2つのアレイ間に物質が配置されており、こ の物質を取り除くか核酸透過性とするまで、この物質が核酸同士の混合を防止す る。 上記の装置を用いる本発明の2つ目の方法は、核酸プローブの2つのアレイを 用意し、2つのアレイを互いにおよび標的核酸に接触させる条件を提供し、標的 核酸上で隣接しているプローブを一緒に連結し、そしてその結果を分析する、各 ステップを含んでなる。好ましい実施形態において、一方のアレイのプローブは 固定されており、他方のアレイのプローブは標識されている。より好ましい実施 形態では、2つのアレイ間に物質が配置されており、この物質を取り除くかプロ ーブ透過性とするまで、この物質がプローブ同士の混合を防止する。好ましい実施形態の詳細な説明 フォーマット1 SBHは、大きいサンプルセットの同時分析に適切である。膜 の小片を用いて数千の独立したハイブリダイゼーション反応を行なうことにより 、大きいアレイ上の数千のサンプルの並行スコアリング(scoring)を実施するこ とができる。DNAの同定は1反応につき1〜20個のプローブを必要とするかもし れず、また突然変異の同定はある場合には各サンプルに対して特異的に選択され た、または設計された1000個以上のプローブを必要とするかもしれない。突然変 異DNAセグメントの性質を同定するためには、ハイブリダイゼーションの第1ラ ウンドで検出された各突然変異に対して特異的プローブが合成または選択される 。 DNAサンプルは、適切なスペーサーによって分離されていてよい、複数の小ア レイの形で調製することができる。そしてこれらのアレイは、マルチウェルプレ ート中に整列させたオリゴヌクレオチドのセットから選択されたプローブを用い て同時に試験することができる。上記小アレイは1またはそれ以上のサンプルか ら成ってよい。各小アレイ中のDNAサンプルは、ある配列の突然変異または個々 のサンプルを含んでいてよい。連続した小アレイをより大きいアレイにまとめる ことができる。そのような大きいアレイは同一小アレイの複製を含むことができ る。または、異なるDNA断片のサンプルからなる複数のアレイを含むことができ る。普遍的プローブセット(universal set of probes)は、例えば各塩基対(bp) を読む重複性について、あらかじめ特定された正確さでDNA断片を分析するのに 十分なプローブを含む。これらのセットは、1つの特異的断片に対して必要とさ れる以上のプローブを含みうるが、しかし異なる配列を有する数千のDNAサンプ ルを試験するのに必要なプローブよりも少ないプローブを含みうる。 DNAまたは対立遺伝子の同定、および診断的配列決定プロセスは以下の工程を 含みうる: 1)多数の小アレイのそれぞれとハイブリダイズさせるべきプローブサブセッ トを、特定用途用セット、代表的セットまたは普遍的セットか ら選択する: 2)並行して分析すべき各アレイ上の各サブアレイに第1プローブを加える; 3)ハイブリダイゼーションを実施し、その結果をスコアリングする; 4)以前に使用したプローブを剥がす; 5)スコアリングすべき残りのプローブについて、ハイブリダイゼーション工 程、スコアリング工程および剥がす工程を繰り返す; 5)得られた結果を処理して、最終分析結果を得るか、またはハイブリダイズ させるべき付加的プローブを決定する; 6)特定のサブアレイについて付加的ハイブリダイゼーションを実施し;そし て 7)完全なデータセットを処理し、最終分析結果を得る。 このアプローチは、1種類(例えば、DNA、RNA)からなる少数の核酸サンプル の迅速な同定および配列決定を提供する。また、あらかじめ合成した取り扱い可 能なサイズのプローブセットを用いることにより、サブアレイ形態の多種類のサ ンプルの並行分析をも提供する。DNAの正体の決定、DNA診断および突然変異の同 定のための効率的で用途の広い方法をつくり出すために、2つのアプローチが組 み合わせられたのである。 既知配列を同定するためには、長いユニークなプローブの代わりに、より短い プローブの小セットを用いることができる。このアプローチにおいては、スコア リングすべきプローブがもっと多く存在してもよいが、普遍的プローブセットを 合成して任意の種類の配列をカバーすることが可能である。例えば、6量体の完 全なセットは4,096個のプローブを含むのみであり、また7量体の完全なセット は16,384個のプローブを含むのみである。 DNA断片の完全な配列決定は、2レベルのハイブリダイゼーションによって実 施することができる。1レベルは、全塩基を少なくとも1回カバーするのに十分 なプローブセットのハイブリダイゼーションである。 この目的のため、標準サンプルに対する特定プローブセットを合成することがで きる。このようなプローブセットとのハイブリダイゼーションの結果は、非標準 サンプルにおいて突然変異(相違)が存在するかどうか、そしてどこに存在する かを明らかにする。 さらに、このプローブセットは「ポジティブ」プローブのハイブリダイゼーシ ョン結果を確認するための「ネガティブ」プローブを含むことができる。変化の 正体を確認するため、付加的な特異的プローブをサンプルにハイブリダイズさせ ることができる。この付加的プローブセットは「ポジティブ」(突然変異配列) および「ネガティブ」プローブの両方を有するであろう。そして配列変化がポジ ティブプローブによって同定され、ネガティブプローブによって確認されるであ ろう。 別の実施形態においては、普遍的セット由来の全プローブをスコアリングする ことができる。普遍的プローブセットは、望ましくない時間の消費をすることな く2工程プロセスでサンプルあたり比較的少数のプローブのスコアリングを可能 とする。ハイブリダイゼーションプロセスは、最初にハイブリダイズさせるべき 最適なプローブサブセットをコンピュータで算定する第1工程、および得られた 結果に基づいて普遍的プローブセットの中からスコアリングすべき付加的プロー ブを決定する第2工程で上首尾なプロービング(probing)を伴いうる。両方のプ ローブセットはセット中のポジティブプローブを確認する「ネガティブ」プロー ブを有する。さらに、次に別の工程で、サンプルをSBHの結果から同定された「 ネガティブ」プローブのセットとハイブリダイズさせることにより、得られた配 列を確認することができる。 SBH配列組立においては、分析されたDNA断片中に偶然または生物学的理由によ り反復して存在するK-1オリゴヌクレオチドに特別の考慮を払わなければならな い。付加的情報が何もない場合でも、DNAの比較的小さい断片を全塩基対が数回 読まれるほど完全に組み立てることができる。 比較的長い断片の組立においては、ポジティブにスコアリングされたプローブ セットにおけるK-1配列(すなわち、プローブの長さよりも短 い配列)の反復存在ゆえに曖昧さが生じうる。突然変異した、または類似の配列 を確認すべき場合にはこの問題は存在しない(すなわち、K-1配列は全く同じに は反復されない)。1つの配列の知識を鋳型として用いて、未知の配列に対する ポジティブプローブをアレイ化(arraying)し上記鋳型上で最適合を示すことによ って、類似していることが(例えばデータベース中におけるその存在によって) 知られている配列を正しく組み立てることができる。 サンプルアレイの使用は、単一サンプル上の、または小さいサンプルセット上 の多数のオリゴヌクレオチドの連続的スコアリングを回避するこのアプローチは 、たった1つの物理的対象の操作によって、より多数のプローブの並行したスコ アリングを可能とする。長さ1000bpのDNAサンプルのサブアレイを比較的短時間 の間に配列決定することが可能である。もしサンプルが1つのアレイの50個のサ ブアレイにスポッティングされていて、そして該アレイが10回プロービングされ る場合、500個のプローブがスコアリングされうる。突然変異の存在をスクリー ニングする場合には、各塩基を3回カバーするに十分なプローブを用いてよい。 もし突然変異が存在するならば、数個のカバリング(covering)プローブが影響を 受けるであろう。ネガティブプローブの正体に関する情報の使用は、2塩基の正 確さ(a two base precision)で突然変異の位置を示すことができる。この方法で 位置づけられた単一塩基突然変異を解明するため、さらに15個のプローブを用い ることができる。これらのプローブは2つの問題となる位置に対する任意の塩基 の組み合わせ(欠失および付加がないと仮定して)をカバーする。これらのプロ ーブは、与えられたサンプルを含む50個のサブアレイについて1サイクルでスコ アリングすることができる。多重標識カラースキーム(multiple label color sc heme)(すなわち、マルチプレキシング(multiplexing))の実施においては、それ ぞれ異なる蛍光色素等の異なる標識を有する2から6個のプローブをプールとし て用いることができる。そして、それによってハイブリダイゼーションサイクル 数を減らし、配列決定プロセスを短時間に することができる。 より複雑な場合には、2つの接近した突然変異または挿入がありうる。これら はより多数のプローブを用いて処理することができる。例えば、3塩基挿入は64 個のプローブを用いて解明することができる。最も複雑な場合は、数工程のハイ ブリダイゼーションおよび前に実施したハイブリダイゼーションの結果に基づく 新しいプローブセットの選択によって対処しうる。 分析すべきサブアレイが1種類からなる数十または数百のサンプルを含む場合 、数個のサンプルは1またはそれ以上の変化(突然変異、挿入または欠失)を含 むことが見いだされうる。突然変異が存在する各セグメントについて、特異的プ ローブセットをスコアリングすることができる。1種類のサンプルについてスコ アリングすべきプローブの総数は数百でありうる。レプリカアレイの並行スコア リングは、数百個のプローブのスコアリングを比較的少ないサイクル数で実施す ることを容易にする。さらに、適合性(compatible)プローブをプールすることが できる。ポジティブハイブリダイゼーションは、特定のDNAセグメントをチェッ クするために選択されたプローブのせいであるとされることがある。なぜなら、 これらのセグメントは通常それらを構成する塩基の75%において相違しているか らである。 より長いプローブのより大きいセットを用いることにより、より長い標的を分 析することができる。これらの標的は、エキソンクローンのプール等の断片のプ ールであってよい。 特異的ハイブリダイゼーションスコアリング法は、二倍体染色体セット由来の 配列決定すべきゲノムセグメントにおける突然変異の存在を明らかにするために 使用できる。i)1つの染色体に由来する配列が公知の対立遺伝子を表し、他の 染色体に由来する配列が新しい突然変異を表す場合;またはii)両方の染色体が 新しいが異なる突然変異を含む場合は、2つの変法が存在する。両方の場合、変 化の位置を示すために設計された走査(scanning)工程は、突然変異の位置におい て2倍の最大シグ ナル差をもたらす。さらに、この方法はある遺伝子のどの対立遺伝子が個人に担 持されているのか、また該個人はその遺伝子についてホモ接合かヘテロ接合かを 同定するために使用できる。 上記第1の場合に必要とされる2倍シグナル差のスコアリングは、対応するシ グナルをホモ接合対照およびヘテロ接合対照と比較することによって効率的に実 施できる。このアプローチは、与えられたサンプルにおける各特定プローブに対 するハイブリダイゼーションシグナルの相対的低下の測定を可能とする。これは 重要である。なぜなら、ハイブリダイゼーションの効率は、同一の完全にマッチ する標的を有する異なる核酸断片とハイブリダイズした特定のプローブについて 2倍以上変動しうるからである。さらに、異なる突然変異部位はオリゴヌクレオ チドプローブの数に応じて2以上のプローブに影響を与えうる。2〜4個の連続 したプローブに対するシグナルの低下は、突然変異部位であることをより重大に 指示する。その中の1または2〜3のプローブが完全マッチシグナル(これはミ スマッチを含む2本鎖から生じるシグナルよりも平均して8倍強い)を生じるよ うに選択した小セットのプローブを用いて試験することにより、結果をチェック することができる。 区分けした(Partitioned)膜は、特定の配列型を表す比較的多数のサンプル、 または比較的少数のサンプルによって表される多くの異なる種類のサンプルを収 容する実験の非常にフレキシブルな組織化を可能とする。4-256個の範囲のサン プルを特別効率よく処理することができる。オリゴヌクレオチドの保存および標 識化に用いる標準的マルチウェルプレートの配置およびサイズに合わせて、上記 した数の範囲内のドット(dot)から成るサブアレイを設計することができる。サ ブアレイのサイズはサンプルの異なる数に合わせて適合させることができる。ま たは、2〜3の標準的サブアレイサイズを用いることができる。1種類からなる 全サンプルが1つのサブアレイに納まらない場合は、付加的サブアレイまたは膜 を用いて同一のプローブで処理してよい。さらに、各サブアレイについてレプリ カ数を調整することによって、同定または配列決定プ ロセスを完了させるのに要する時間を変えることができる。 本明細書に用いる「中間断片」という用語は、長さが5〜1000塩基、好ましく は10〜40bpのオリゴヌクレオチドを意味する。 フォーマット3においては、既知配列を有するオリゴヌクレオチドプローブの 第1セットは、該プローブがそれぞれ相補的な配列を有する核酸とハイブリダイ ズするのを可能とする条件下で固相支持体に固定されている。標識されたオリゴ ヌクレオチドプローブの第2セットは、溶液の形で提供される。セット内および セット間の両方において、プローブは同じ長さであっても、または異なる長さで あってもよい。配列決定すべき核酸またはその中間断片は、第1のプローブセッ トに2本鎖形態で適用することができる(特にrecAタンパク質が存在して非変性 条件下でのハイブリダイゼーションを可能とする場合は)。または、1本鎖形態 で、かつ相補性の程度が異なるハイブリッドを許す条件下(例えば、完全にマッ チしたハイブリッドと1塩基対ミスマッチを有するハイブリッドの識別を可能と する条件下)で適用することができる。配列決定すべき核酸またはその中間断片 は、第2プローブセットの前、後、またはそれと同時に第1プローブセットに適 用することができる。標的上の隣接する部位に結合するプローブ同士は共に結合 される(例えば、スタッキング(stacking)相互作用によって、またはリガーゼも しくは隣接するプローブ間に化学結合形成を引き起こす他の手段によって)。隣 接するプローブ同士を結合させた後、第1プローブセットのメンバーとの化学結 合によって表面に固定化されていない断片およびプローブを、例えばハイブリッ ドを融解させる高温(100℃まで)の洗浄液を用いて洗い流す。次に、使用した 標識(例えば、化学発光、蛍光、放射能、酵素、デンシトメトリー、またはエレ クトロホア(electrophore)質量標識でありうる)に対して適切な手段を用いて、 第2セット由来の結合プローブを検出することができる。 本明細書においては、特定の条件下でヌクレオチド塩基が水素結合による安定 した2本鎖を形成するならば、それらヌクレオチド塩基は「マ ッチ」もしくは「対合」している、または「相補的」であるという。例えば、ハ イブリダイゼーションアッセイに一般に採用される条件下で、アデニン(「A」 )はチミン(「T」)とマッチするが、グアニン(「G」)またはシトシン(「 C」)とはマッチしない。同様に、GはCとマッチするが、AまたはTとはマッ チしない。より特異性の低い様式で水素結合する他の塩基、例えばイノシンまた は普遍的塩基(Universal Base)("M"塩基、Nicholsら,1994)等、または他の改変 された塩基、例えばメチル化塩基等は、特定の条件下でそれらが安定した2本鎖 を形成する相手の塩基に対して相補的である。プローブは、そのプローブ中の各 塩基が配列決定すべき核酸中の塩基とワトソンおよびクリックの塩基対合法則に したがって水素結合することによって2本鎖を形成するならば、「完全に相補的 である」または「完全なマッチ」もしくは「完全な塩基対合」であると言われる 。(すなわち、周辺の配列効果の不在下では、形成された2本鎖は特定のプロー ブに対して最大結合エネルギーを有する)。「完全に相補的である」および「完 全なマッチ」もしくは「完全な塩基対合」とは、類似体または改変されたヌクレ オチドを含むプローブをも包含することが意図されている。類似体または改変さ れたヌクレオチドに対する「完全なマッチ」は、該類似体または改変ヌクレオチ ドに対して選択された「完全マッチ規則」(例えば、特定の類似体または改変ヌ クレオチドに対して最大結合エネルギーを有する結合ペアー)にしたがって判断 される。上記「規則」にしたがって結合ペアーを形成しないプローブ中の各塩基 は、特定のハイブリダイゼーション条件下で「ミスマッチ」もしくは「誤対合」 であると言われる。 各プローブが配列決定すべき核酸に対して完全なマッチであるリストを作製す ることができる。次に、このリスト上のプローブを分析して、最大オーバーラッ プ様式(maximal overlap fashion)で並べることができる。このように並べるこ とは、第1プローブをリスト上の他のプローブのそれぞれと比較して、どのプロ ーブが第2プローブの5'末端の塩基配列に一致する最も長い塩基配列を有する3' 末端を持っているかを決定 することによって実施できる。次に、第1および第2プローブをオーバーラップ させ、さらに第2ブローブの5'末端を残りの全プローブの3'末端と比較すること により、また第1プローブの3'末端を残りの全プローブの5'末端と比較すること により、このオーバーラップさせるプロセスを繰り返すことができる。他のプロ ーブとオーバーラップさせていないプローブがリスト上に残らなくなるまで、こ のプロセスを続けることができる。または、ポジティブプローブのリストから2 個以上のプローブを選択し、そしてオーバーラップさせたプローブ(「配列核(se quencenucleus)」)の2以上のセットを並行して作製することができる。このよ うな配列組立法のためのプローブリストは、配列決定すべき核酸に対して完全に 相補的な全プローブのリスト、またはその任意のサブセットであってよい。 プローブの5'および3'末端をオーバーラップさせて、より長い配列を作製する ことができる。このプローブを組み立てるプロセスは、分枝点(断片内でプロー ブが繰り返される)、プローブよりも長い反復配列、またはクローン化されてい ないセグメントのために曖昧さが生じるまで継続する。任意の2つの曖昧な点の 間の配列をサブクローン配列の断片(Sfs)という。配列組立においてプローブと の代替的な適切なオーバーラップが有効であるゆえに曖昧さが生じた場合は、代 替的オーバーラップ部位にまたがるより長いプローブを用いたハイブリダイゼー ション、競合ハイブリダイゼーション、代替的末端の曖昧な部位にまたがる末端 プローブ対への連結、またはシングルパス(single pass)ゲル分析(Sfsの曖昧で ない順序づけをもたらすための)を用いることができる。 上記の手順を用いることによって、ハイブリダイゼーションパターン(これは 核酸サンプルの同一性と相関していて、該サンプルを同定するための特徴として 役立つ可能性がある)からオーバーラップまたは非オーバーラッププローブに至 まで、組み立てたSfsから中間断片または供給源のDNA分子全体(例えば、染色体 )の完全な配列まで、任意の所望レベルの配列を得ることができる。 配列決定は一般に以下の工程を含んでなる: (a)核酸断片が相補配列を有する固定化プローブと一次複合体を形成するの を可能とするに有効な条件下で、固定化オリゴヌクレオチドプローブのアレイを 核酸断片と接触させ; (b)この一次複合体が標識化プローブとハイブリダイズするのを可能とする に有効な条件下で、該一次複合体を溶液形態の標識化オリゴヌクレオチドプロー ブの1セットと接触させ、それによって該核酸断片が固定化プローブおよび標識 化プローブの両方とハイブリダイズしている二次複合体を形成し; (c)二次複合体から固定化プローブに隣接してハイブリダイズしていない標 識化プローブをすべて除去し; (d)標識の存在を検出することによって隣接する標識化および非標識プロー ブの存在を検出し;そして (e)固定化および標識化プローブの既知配列を連結することによって該断片 のヌクレオチド配列を決定する。 ハイブリダイゼーションおよび洗浄条件は、実質的に完全にマッチしたハイブ リッド(核酸断片とプローブが7個のポジションのうち6個でハイブリダイズす るようなハイブリッド)を検出するように選択することができ、完全なマッチと 1塩基対ミスマッチの識別を可能とするように選択することができ、または完全 にマッチしたハイブリッドのみを検出するように選択することができる。 適切なハイブリダイゼーション条件は最適化手順または予備試験によってルー チンに決定することができる。このような手順または試験は、研究室で使用する プロトコールを確立するために当業者によって日常的に実施されている。例えば 、Ausubelら,Current Protocols in Molecular Biology,Vol.1-2,John Wile y & Sons(1989);Sambrookら,Molecular Cloning:ALaboratory Manual,第2版 、Vols.1-3,Cold Springs Harbor Press(1989);およびManiatis,Molecular C loning,A Laboratory Manual,Cold Spring Harbor Laboratory,Cold Spring Harb or,NewYork(1982)を参照されたい。これらすべては参照によりここに組み入れ ている。例えば、温度、成分の濃度、ハイブリダイゼーションおよび洗浄の時間 、緩衝液の成分、それらのpHおよびイオン強度を変えることができる。 標識化プローブと固定化プローブが物理的または化学的に結合されない実施形 態においては、検出は制御されたストリンジェンシーを有する洗浄工程にのみ依 存する場合がある。このような条件下では、隣接するプローブはプローブ間のス タッキング相互作用のゆえに増大した結合アフィニティーをもつ。プロセスを最 適化するため、上記のように条件を変えることができる。 標識化プローブと固定化プローブが連結される実施形態においては、化学結合 剤(例えば、水溶性カルボジイミドまたは臭化シアン)またはリガーゼ酵素(市 販のT4DNAリガーゼ等)によって連結を実施することができる。洗浄条件は、隣 接対非隣接の標識化および固定化プローブを識別するように選択することができ 、隣接プローブと非隣接プローブに対する安定性の差異を利用することができる 。 オリゴヌクレオチドプローブは、蛍光色素、化学発光系、放射性標識(例えば 、35S、3H、32Pまたは33P)、または質量分光測定によって検出可能な同位体を用 いて標識することができる。 配列の分からない核酸分子が約45または50bpより長い場合は、その分子を断片 化し、断片の配列を決定することが出来る。断片化は制限酵素消化、剪断または NaOHによって実施することができる。断片を大きさによって分離し(例えば、ゲ ル電気泳動によって)、約10から40bpsという好ましい断片の長さを得ることが できる。 当業者に公知の多くの方法によってオリゴヌクレオチドを固定化することがで きる。例えば、ヌクレオシドホスホルアミダイトまたはヌクレオシドヒドロゲン ホスホレート等の試薬を用いた、リン酸基を介したレーザー活性化光脱保護結合 などである。ガラス、ナイロン、シリコンおよびフルオロカーボン支持体を用い ることができる。 オリゴヌクレオチドをアレイに組織化することができる。そして、これらのア レイは特定の長さの全プローブの全部またはサブセットを含むことができる。ま たは、選択された複数の長さのプローブのセットを含むことができる。疎水性の 間仕切りを用いてプローブまたはプローブサブセットを分離することができる。 アレイは種々の用途(例えば、地図作製、部分配列決定、診断を目的とする標的 領域の配列決定、mRNA配列決定および大規模配列決定)に合わせて設計すること ができる。プローブの組み合わせおよび支持体上のプローブの配置を選択するこ とによって、特定用途専用とすべき特異的チップ(chip)を設計することができる 。 例えば、長さ5塩基の全てのオリゴヌクレオチドからなる1024個の固定化プロ ーブのアレイ(各アレイは1024個の別個のプローブを含む)を構築することがで きる。この例におけるプローブは、情報的な意味において5量体である(実際に はより長いプローブであってよい)。1024個の5量体プローブからなる第2セッ トを標識化し、各標識化プローブの1つを配列決定すべき断片と共に固定化プロ ーブのアレイにアプライすることができる。この例においては、1024個のプロー ブを有するアレイは大きいスーパーアレイまたは「スーパーチップ」中で組み合 わせられるであろう。これらの例で1個の固定化プローブおよび標識化プローブ の1つが末端同士で核酸断片と共にハイブリダイズしている場合、2つのプロー ブは例えば連結によって結合され、未結合標識が除去される。その後、既知配列 の標識化プローブが添加された、既知配列の固定化プローブを有するアレイの1 点において標識が存在することの相互関係によって、サンプル断片に相補的な10 量体が検出される。サンプル断片の配列は、単に標識化プローブの配列に続けら れた固定化プローブの配列である。このようにして、5量体のみを用いる、そし てその結果オリゴヌクレオチド合成に要する労力の1000分の1しか必要としない コンビナトリアルプロセスによって、考えうる百万個の10量体を試験することが 可能である。 配列決定すべき核酸サンプルは断片化してもよいし、またはサンプル 中の二次構造に由来するハイブリダイゼーションへの障害を回避するために別途 処理してもよい(例えば、recAを用いるなど)。サンプルは、例えばCvi JI等の 制限酵素を用いた消化、物理的剪断(例えば超音波による)、またはNaOH処理に よって断片化することができる。得られた断片をゲル電気泳動によって分離し、 約10bpから約40bpくらいの適切な長さの断片をゲルから抽出する。 固定化プローブと標識化プローブの間に開裂可能な結合を導入し、次にフォー マット3分析の1ラウンドが終了した後にこの結合を開裂することによって、再 使用可能なフォーマット3 SBHアレイを作製することができる。標識化プロー ブはリボヌクレオチドであってよい。または、標識化プローブをRNAseもしくは ウラシル-DNAグリコシレート処理またはNaOH処理によって後で除去することがで きるように、リボヌクレオチドを標識化プローブの結合塩基として用いてもよい 。さらに、化学的連結によって生じた結合を選択的に開裂してもよい。 他の変法は、特異性および効率を増大させるための改変オリゴヌクレオチドの 使用、ハイブリダイゼーションシグナルを増大させるための循環(cycling)ハイ ブリダイゼーション、例えば、標識化プローブの第1セットに最適となるように 選択した条件(例:温度)下でハイブリダイゼーションサイクルを実施し、続い て標識化プローブの第2セットに最適となるように選択した条件下でハイブリダ イゼーションを行なう、等である。読み枠のシフトは、4つのヌクレオチド塩基 A、T、CおよびGのそれぞれで終わるプローブの混合物(好ましくは等モル量 の混合物)を用いて決定することができる。 分枝点は断片の順序づけられた配列に曖昧さを引き起こす。配列情報はSBHに よって決定されるが、そのような曖昧さ(「分枝点」)が存在する場合はハイブ リダイゼーションデータを整理するために(i)完全なゲルシークエンシングの費 用のほんの一部の費用で読み取りの長さが長いシングルパスゲルシークエンシン グ;または(ii)関連配列との比較を用いることができる。分枝点を通るシングル パスゲルシークエンシング のためのプライマーは、SBH配列情報から、または既知のベクター配列から同定 され(例えば、ベクター挿入部位の両側の配列)、そして核酸サンプルを用いて 標準的なサンガーシークエンシング反応が実施される。このシングルパスゲルシ ークエンシングから得られた配列を、分枝点に入っていきかつ出てくるSfsと比 較し、Sfsの順序を同定する。または、Sfsの配列を関連配列と比較し、Sfsを順 序づけて関連配列に最も近い配列を創出してもよい。 さらに、シングルパスゲルシークエンシングによって標的断片中のタンデムな 反復核酸セグメントの数を決定することができる。遺伝子のタンパク質をコード している部分にはタンデムな反復はまれにしか存在しないので、ゲルシークエン シング工程は非コード領域の1つが特に興昧があると同定された場合(例えば、 それが重要な調節領域である場合)にのみ実施されるであろう。 約200個ほどにすぎないヌクレオチドプローブのセットについて示されるハイ ブリダイゼーションの度合いに関する情報を得ることは(完全な配列決定に要す る労力の約5%)、各遺伝子の独特な特徴を明らかにする。この情報は、ライブラ リー由来のcDNA分子を分類し、該ライブラリーが同一遺伝子の複数コピーを含む かどうかを決定するのに用いることができる。そのような特徴によって、同一の 、類似した、および異なるcDNA分子を識別し、リストを作ることができる。 核酸および核酸を単離し、クローン化し、配列決定する方法は当業者に周知で ある。例えば、Ausubelら,Current Protocols in Molecular Biology,Vol.1- 2,John Wiley & Sons(1989);およびSambrookら,Molecular Cloning;ALaborato ry Manual,第2版、Vols.1-3,Cold Springs Harbor Press(1989)を参照され たい。これらは両方とも参照によりここに組み入れている。 SBHは、当業者に公知の多数の方法によって実践されうる、十分開発された技 法である。特に、ハイブリダイゼーションによる配列決定に関連する技法につい ては、下記の文献を参照によりここに組み入れる。す なわち、Drmanacら、米国特許第5,202,231号、1993年4月13日発行;Drmanacら, Genomics,4,114-128(1989);Drmanacら,Proceedings of the First Int'l.Co nf.Electrophoresis Supercomputing Human Genome,Cantorら(編),World S cientific Pub.Co.,Singapore,47-59(1991);Drmanacら,Science,260,1649 -1652(1993);Lehrachら,Genome Analysis:Genetic and Physical Mapping,1, 39-81(1990),Cold Spring Harbor Laboratory Press;Drmanacら,Nucl.Acids Res.,4691(1986);Stevanovicら,Gene,79,139(1989);Panuskuら,Mol.Biol .Evol.,l,607(1990);Nizeticら,Nucl.AcidsRes.,19,182(1991);Drmanac ら,J.Biomol.Struct.Dyn.,5,1085(1991);Hoheiselら,Mol.Gen.,4,125 -132(1991);Strezoskaら,Proc.Natl.Acad.Sci.(USA),88,10089(1991);Dr manacら,Nucl.Acids Res.,19,5839(1991);およびDrmanacら,Int.J.Genom e Res.,1,59-79(1992)である。 以下の実施例を用いて本発明を説明する。本開示を考慮するならば、当業者は 本発明の範囲内で他の多くの実施形態および変法が成しえることを認めるであろ う。したがって、本発明のより広い態様は以下の実施例の開示に限定されないこ とが意図される。実施例1 プローブセットの調製 2種類の普遍的プローブセットを調製することができる。最初のセットは比較 的短いプローブの完全なセット(または少なくとも非相補的なサブセット)であ る。例えば、4096個の6量体全て(または約2000個の非相補的6量体)、または 16,384個の7量体全て(または約8000個の非相補的7量体)である。8量体およ びより長いプローブの完全な非相補的サブセットは32,000以上のプローブを含む ので、便利さにおいて劣る。 ブローブセットの第2の種類は、任意の配列中の各塩基対を少なくと も1つのプローブを用いて読むのにまだ十分である、小さいプローブサブセット として選択される。例えば、12個の16量体が十分である。2本鎖DNAを配列決定 するための7量体、8量体および9量体の小さいサブセットは、それぞれ約3000 、10,000および30,000個のプローブからなる。 プローブセットは既知配列を有する標的核酸を同定するように、および/また は既知配列を有する標的核酸の対立遺伝子または突然変異体を同定するように選 択することも可能である。そのようなプローブセットは、標的核酸の全ヌクレオ チド位置(position)が少なくとも1回読まれるように、十分なプローブを含む。 対立遺伝子または突然変異体は、「ポジティブ」プローブの1個の結合の喪失に よって同定される。次に、プローブ位置において考えうるすべてのヌクレオチド 変化および変化の組み合わせを含むプローブセットを用いて標的核酸を調べるこ とによって、これら対立遺伝子または突然変異体の特異的配列を決定する。 プローブは、標準的化学を用いて、1から3個の非特定塩基(混合したA、T 、CおよびG)または普遍的塩基(例えば、M塩基またはイノシン)を末端に用 いて調製することができる。放射能標識を用いる場合、放射能標識化リン酸基に よるキナージング(kinasing)のためにプローブは5'末端にOH基を有してよい。ま たは、任意の適合性の系(例えば蛍光色素)を用いて標識化されたプローブを使 用してもよい。他の種類のプローブ、例えばPNA(タンパク質核酸)、または2 本鎖の安定性を変化させる改変塩基を含むプローブ等もまた使用できる。 プローブはバーコードを付したマルチウェルプレート中に保存することができ る。少数のプローブ用には、96ウェルプレートが使用できる。10,000個以上のプ ローブ用には、384または864ウェルプレートでの保存が好ましい。全プローブを 保存するのに5から50個のプレートで十分である。1プローブの約5pgが1つのD NAサンプルとハイブリダイズさせるのに十分であろう。したがって、プローブあ たり約50mgという少量の合成から、1千万個のサンプルが分析可能である。各プ ローブを3つ置きのサンプルに対して使用するならば、そして各サンプルの長さ が10 00bpであるならば、5000個のプローブからなる1セットで300億以上の塩基(ヒ トゲノム10個)を配列決定することができる。実施例2 改変オリゴヌクレオチドを有するプローブ 改変オリゴヌクレオチドをハイブリダイゼーションプローブに導入して、該オ リゴヌクレオチドにとって適切な条件下で使用することができる。例えば、C5位 にハロゲンを有するピリミジンを用いて、塩基スタッキングに影響を及ぼすこと によって2本鎖の安定性を向上させることができる。2,6-ジアミノプリンを用い てチミンとの塩基対合に第3の水素結合を提供し、それによってDNA 2本鎖を熱 的に安定化させることができる。2,5-ジアミノプリンの使用は2本鎖の安定性を 増大させてアニーリングのためのよりストリンジェントな条件を可能としうる。 そしてそれによって2本鎖形成の特異性を向上させ、バックグラウンドの問題を 抑制し、またより短いオリゴマーの使用を可能とする。 これらの改変ヌクレオチドの三リン酸型の合成は、HoheiselおよびLehrach(19 90)に開示されている。 非識別的塩基類似体、すなわちNicholsら(1994)によって設計された普遍的塩 基もまた使用できる。この新規な類似体1-(2-デオキシ-D-リボフラノシル)-3-ニ トロピロール(Mと称する)は、遺伝子暗号の縮重の結果生じる設計上の問題を 解決するために、または断片的なペプチド配列データしか得られない場合に、オ リゴヌクレオチドプローブおよびプライマー中に使用するべく作製された。この 類似体は、DNA 2本鎖を立体的に破壊することなく、水素結合相互作用を最小に する一方、スタッキングを最大にする。 このMヌクレオシド類似体は、ヘテロ芳香族環に結合した非プロトン性極性置 換基を用いて、鎖内および鎖間のスタッキング相互作用を増大させて塩基対合特 異性における水素結合の役割を小さくして、スタッキング相互作用を最大にする ように設計された。Nicholsら(1994)は、p- ニトロアニリンとの構造的および電子的類似ゆえに3-ニトロピロール2-デキシ リボヌクレオシドを好んだ。この化合物の誘導体は、2本鎖DNAの最も小さい公 知のインターカレーターである。 ヌクレオシドMの、ジメトキシトリチルによって保護されたホスホルアミダイ トは、配列決定およびポリメラーゼチェーンリアクション(PCR)のためのプラ イマーとして用いられるヌクレオチドへの組み込みにも利用できる。Nicholsら( 1994)は、プライマー特異性を喪失させることなく、相当数のヌクレオチドをM で置換できることを示した。 Mの独特な特性は、連続したヌクレオチドの長い一続きと置き代わって、なお 機能性の配列決定プライマーをもたらすその能力である。3、6および9個のM 置換を有する配列のすべてが、判読可能な配列決定用ラダーをもたらすことが報 告されている;また、Mを含む3つの異なるプライマーを用いたPCRはすべて正 しい産物の増幅をもたらした(Nicholsら,1994)。 3-ニトロピロールを含むオリゴヌクレオチドのプライマーとして機能する能力 は、2本鎖構造が相補鎖で形成されているに相違ないことを強く示唆する。オリ ゴヌクレオチド対d(5-C2-T5XT5G2-3)およびd(5-C2A5YA5G2-3)(ここでXお よびYはA、C、G、TまたはMでありうる)について得られた光学的熱プロフ ィールは、DNAの2本鎖から1本鎖への移行について観察される通常のS字状パ ターンに合っていると報告された。XM塩基対(ここでXはA、C、GまたはT で、YはMであった)を含むオリゴヌクレオチドのTm値は、すべて3℃範囲内に おさまることが報告された(Nicholsら,1994)。実施例3 プローブの選択および標識化 サブアレイからなるアレイを作製する際は、各サブアレイに対する各ハイブリ ダイゼーションサイクルにおいてハイブリダイズさせるべきプローブセットを規 定する。例えば、384個のプローブからなる1セット を普遍的セットから選択して、そして4サイクルのそれぞれにおいて96回のプロ ービングを実施することができる。1サイクルでハイブリダイズさせるべく選択 されたプローブは、好ましくは類似したG+C含量を有する。 各サイクルについて選択したプローブを96ウェルプレートに移し、保存する前 に(例えば、安定な蛍光色素を用いて)標識されていない場合は、キナージング または他の標識方法によって標識する。 ハイブリダイゼーションの第1ラウンドに基づいて、今後のサイクルのために 各サブアレイについて新しいプローブセットを規定することができる。アレイの いくつかは、いくつかのサイクルのおいて使用されないことがある。例えば、64 個の患者サンプルのうち8サンプルしか突然変異を示さず、また各突然変異に対 して最初に8個のプローブがスコアリングされる場合、64個のプローブ全部を1 サイクルでスコアリングすることができ、32個のサブアレイは使用されない。こ れらの未使用サブアレイは、ハイブリダイゼーション緩衝液で処理してフィルタ ーの乾燥を防ぐことができる。 任意の便利な方法、例えば単一チャンネルピペッティング装置、またはBeckma n Biomek 1000(Beckman Instruments,Fullerton,California)もしくはMega Tw oロボット(Megamation,Lawrenceville,New Jersey)等のロボティックステー ション(robotic station)によって保存プレートからプローブを回収することが できる。ロボティックステーションはデータ分析プログラムおよびプローブ管理 プログラムと共に統合することができる。これらのプログラムのアウトプットは 、1またはそれ以上のロボティックステーションへのインプットでありうる。 プローブを1個ずつ回収して、ハイブリダイゼーション緩衝液で覆ったサブア レイに加えることができる。回収したプローブは新しいプレートに入れて、標識 するか、またはハイブリダイゼーション緩衝液と混合することが好ましい。回収 の好ましい方法は、保存プレートに1つずつ接近し、選択された各プローブの十 分な量を各プレートから中間プレー トの特定ウェルへピペッティングする(または金属ピンで移す)ことである。回 収プロセスをスピードアップするため、それぞれアドレスで呼び出せる(address able)ピペットまたはピンからなるアレイを用いることができる。実施例4 標識化プローブの調製 例えばApplied Biosystemsのシステムを用いて、自動合成(当業者には日常的 なものである)によってオリゴヌクレオチドプローブを調製することができる。 または、多孔性テフロンウェーファー(wafer)のスタックを用いるGenosys Biote chnologies Inc.の方法によって調製することができる。 オリゴヌクレオチドプローブは、例えば100-200μmまたは100-400μmのスポッ ト(spot)を有するアレイについては放射性標識(35S、32P、33P、好ましくは33P) ;非放射性同位体(Jacobsenら,1990);または発蛍光団(Brumbaughら,1988)等 を用いて標識することができる。これらの標識法の全ては当技術分野においては 日常的な方法で、Sambrookら(1989)の該当セクションおよび更にはSchubertら(1 990)、Murakamiら(1991)、Cateら(1991)の文献に記述されている通りである。こ れらの論文はすべて参照により具体的に本明細書に組み入れてある。 放射能標識化に関しては、一般的な方法はT4ポリヌクレオチドキナーゼを用い た末端標識化、またはクレノウポリメラーゼもしくはT7ポリメラーゼを用いた高 比活性標識化である。これらの方法を以下に記述する。 5'末端にリン酸基をもたない合成オリゴヌクレオチドを合成し、それゆえ酵素 バクテリオファージT4ポリヌクレオチドキナーゼを用いて[-32P]ATPまたは[-33P ]ATPから-32Pまたは-33Pを転移させることによって容易に標識化を行なう。反応 が効率的に行なわれると、そのようなプローブの比活性は[-32P]ATPまたは[-33P ]ATP自体の比活性と同程度まで高くなりうる。以下に記述する反応は、10pmolの オリゴヌクレオチド を標識して比活性を高くするために設計された。異なる量のオリゴヌクレオチド の標識化は、反応液のサイズを増大または減少させ、全成分の度を一定に保つこ とによって容易に達成できる。 反応混合物は、1.0μlのオリゴヌクレオチド(10pmole/μl);2.0μlの10xバク テリオファージT4ポリヌクレオチドキナーゼ緩衝液;5.0μlの[-32P]ATPまたは[-33 P]ATP(比活性5000Ci/mmole;水溶液mlあたり10mCi)(10pmole);および11.4μl の水を用いて調製される。8単位(約1μl)のバクテリオファージT4ポリヌクレ オチドキナーゼを反応混合物に添加し、37℃で45分間インキュベートする。反応 液を68℃で10分間加熱し、バクテリオファージT4ポリヌクレオチドキナーゼを失 活させる。 次に、32Pまたは33Pのオリゴヌクレオチドへの転移効率およびその比活性を測 定する。該プローブの比活性が許容できる場合は、プローブを精製する。比活性 が低すぎる場合は、さらに8単位の酵素を添加して、68℃で10分間反応液を加熱 して酵素を失活させる前に37℃でさらに30分間インキュベートする。 放射能標識化オリゴヌクレオチドの精製は、例えばエタノールを用いた沈殿、 セチルピリジニウムブロミドを用いた沈殿、bio-gel P-60を通すクロマトグラフ ィー、Sep-Pak C18カラムを用いるクロマトグラフィー、またはポリアクリルア ミドゲル電気泳動によって行なうことができる。 大腸菌DNAポリメラーゼIのクレノウ断片を用いて合成オリゴヌクレオチドに 相補的なDNA鎖を合成し、より高い比活性を有するプローブを得ることができる 。短いプライマーをオリゴヌクレオチド鋳型(この配列は所望の放射能標識化プ ローブの相補体である)にハイブリダイズさせる。次に、大腸菌DNAボリメラー ゼIのクレノウ断片を用いてプライマーを伸長させ、鋳型に指示される様式で[-32 P]dNTPsまたは[-33P]dNTPsを取り込む。反応後、変性によって鋳型および反応 生成物を分離し、次に変性条件下でポリアクリルアミドゲル電気泳動にかける。 この方法 によると、オリゴヌクレオチド1分子あたり数個の放射性原子を含むオリゴヌク レオチドプローブを作製することができる。 この方法を用いるためには、所望の比活性を達成するのに必要であり、かつ全 ての鋳型鎖の完全な合成を可能とするのに十分な、計算された量の[a−32P]dNTP sまたは[a-33P]dNTPsを微小遠心管内で混合する。次に、この試験管に適切な量 のプライマーおよび鋳型DNAを添加する。ここでプライマーは鋳型に対して3か ら10倍モル過剰とする。 次に、0.1容量の10xクレノウ緩衝液を加えてよく混合する。次に反応液5μl につき2-4単位の大腸菌DNAポリメラーゼIクレノウ断片を加え、混合して4℃で 2-3時間インキュベートする。所望であれば、反応液の小アリコート(0.1μl)を 取って、10%トリクロロ酢酸(TCA)によって沈殿可能となった放射能の比率を測定 することにより、この反応プロセスをモニターすることができる。 等容量のゲルローディング(gel-loading)緩衝液を用いて反応液を希釈し、3 分間80℃に加熱し、次に全サンプルを変性ポリアクリルアミドゲルに加える。電 気泳動後、ゲルをオートラジオグラフィーにかけ、プローブを局在化させてゲル から除去する。蛍光プローブ標識化のための種々の方法もまた利用できる。例え ば、Brumbaughら(1988)は蛍光的に標識されたプライマーの合成を記述している 。C-5に結合した、12個の原子からなる一次アミン「リンカーアーム(linker arm )」を有するデオキシウリジン類似体が合成される。この類似体の合成は、有機 金属中間体を介して2-デオキシウリジンを誘導体化し、5-(メチルプロペノイル) -2-デオキシウリジンを得ることからなる。ジメトキシトリチル-クロリドとの反 応は、対応する5-ジメトキシトリチル付加物を生成する。上記メチルエステルを 加水分解し、活性化し、そして適切にモノアシル化したアルキルジアミンと反応 させる。精製後、得られたリンカーアームヌクレオシドを、化学的オリゴヌクレ オチド合成に適したヌクレオシド類似体に変換する。 次に、改変ホスホルアミダイト化学を用いて、1または2個のリンカ ーアーム塩基を含むオリゴヌクレオチドを合成する。25μlの500mM重炭酸ソーダ (pH9.4)に50nmolのリンカーアームオリゴヌクレオチドを溶解した溶液に、ジメ チルスルホキシドに溶解した300mM FITCを20μl添加した。混合物を室温で6時 間攪拌する。20mM酢酸アンモニウム(pH6)を用いて1x30cm Sephadex G-25カラム から溶出することによって、オリゴヌクレオチドを遊離のFITCから分離し、最初 のUV吸収ピーク中の画分を合わせる。 一般に、オリゴヌクレオチドの5'末端に蛍光標識をすることは、初めに2つの 工程を必要とする。第1に、自動核酸合成の間にN-保護アミノアルキルホスホル アミダイト誘導体をオリゴヌクレオチドの5'末端に付加する。保護基を全て除去 した後、適切な蛍光色素を有するNHSエステルを5'アミノ基に一晩かけて結合さ せ、次に逆相HPLCまたはPAGEを用いて標識化オリゴヌクレオチドを過剰な色素か ら精製する。 Schubertら(1990)は、フルオレセインで標識したオリゴヌクレオチドが自動DN A合成の間に生成されることを可能とする、ホスホルアミダイトの合成を記述し た。 Murakamiらもまた、フルオレセイン標識オリゴヌクレオチドの調製を記述した 。 Cateら(1991)は、プローブの検出を可能とするために、直接化学発光基質(AMP PD)と組み合わせてアルカリホスファターゼに直接結合させたオリゴヌクレオチ ドプローブの使用を記述している。 標識化プローブは合成するよりも、むしろGENSETを含む種々の商業的供給源か ら容易に購入することができる。 他の標識には、標識化抗体に対する特異的結合メンバーとして役立ちうるリガ ンド、化学発光物質、酵素、標識化リガンドに対する特異的結合対メンバーとし て役立ちうる抗体、等が含まれる。容易に採用しうるイムノアッセイにおいて多 様な標識が採用されてきた。さらに別な標識としては、抗原、特異的活性を有す る基、および電気化学的に検出可能な成分が挙げられる。 一般に、エレクトロホア質量標識("EML")を用いた核酸の標識化は、例えばXu ら,J.Chromatography 764:95-102(1997)に記述されている。エレクトロホアと は、電子捕獲質量分析(EC-MS)によって高感度で検出可能な化合物である。EMLは 、当技術分野で周知のヌクレオチドを可逆的に改変するための化学を用いてプロ ーブに結合させることができる(例えば、周知のヌクレオチド合成化学は、分子 を保護基としてヌクレオチドに結合させる種々の方法を教示している)。EMLは 、種々の周知の電子捕獲質量分析装置(例えば、Finnigan Corporationが販売し ている装置)を用いて検出される。さらに、EMLの検出に使用できる技法は、例 えば、迅速な原子衝撃(bombardment)質量分析(例えば、Kosterら,Biomedical Environ.Mass Spec.14:111-116(1987)参照);血漿脱着質量分析;エレク トロスプレー/イオンスプレー(例えば、Fennら,J.Phys.Chem.88:4451-59( 1984);PCT出願WO90/14148;Smithら,Anal.Chem.62:882-89(1990)参照);およ びマトリックス補助(matrix-assisted)レーザー脱着/イオン化[Hillenkampら, "マトリックス補助UV-レーザー脱着/イオン化:大きい生体分子の質量分析への 新しいアプローチ",Biological Mass Spectrometry(BurlingameおよびMcCloske y編),Elsevier Science Publishers,Amsterdam,pp.49-60(1990);Huth-Fehre ら,"オリゴデオキシチミジル酸のマトリックス補助レーザー脱着質量分析",Ra pid Communications in Mass Spectrometry,6:209-13(1992)]を含む。 好ましい実施形態においては、EMLは光感受性の共有結合によってプローブに 結合される。EMLは、標的核酸とのハイブリダイゼーションの後、所望の波長の 光を発するレーザーまたは他の光源によってプローブから放出される。次に、EM LはGC-MS(ガスクロマトグラフ-質量分析計)または他の適切な装置に送られ、 その質量によって同定される。実施例5 配列決定用チップおよびアレイの調製 基本的な実施例は、50ミクロンの表面に付着した6量体を用いて3×3mmの寸 法のチップを得て、チップを組み合わせて20cm×20cmのアレイを得ることができ る。別の実施例は、10×10ミクロンの表面に付着した9量体オリゴヌクレオチド を用いて5×5mmの寸法の9量体チップを作っている。そのようなチップを4,00 0ユニット用いることにより、30×30cmのアレイを作ることができる。4,000〜16 ,000オリゴチップを正方形のアレイに配列した。プレート、または図示したよう なチューブの集まりを配列決定用キットの一部としてアレイと同梱し得る。 アレイは、互いに物理的に分離され得るか、疎水性表面によって分離され得る 。疎水性ストリップ(strip)分離を利用するために考えられる一つの方法は、QA Laboratories(トロント、カナダ)によって生み出されたIso-Grid微生物学シス テムなどの技術を用いることである。 疎水性グリッド(grid)膜フィルター(HGMF)は、広範な数値範囲およびコロニ ーの自動計数という独特の魅力を発揮するものであり、約10年間、分析的食品微 生物学で使用されてきた。市販のグリッドの一つとしてQA Laboratories社(ト ロント、カナダ)製のISO-GRIDTMがあり、これは正方形(60×60cm)のポリスル ホンポリマー(Gelman Tuffryn HT-450,孔径0.45μ)からなり、その上には160 0(40×40)の正方形セルからなる黒色疎水性インクグリッドが印刷されている 。HGMFには、予め、減圧濾過によって細菌懸濁液を接種し、選択した分化培地ま たは選択培地上でインキュベートした。 微生物増殖は膜上の既知の位置およびサイズのグリッドセルに制限されるので 、HGMFは従来のプレートまたは膜フィルターよりもMPN装置のように作用する 。Peterkinら(1987)は、これらのHGMFをHGMFレプリケーターとともに使用した場 合、ゲノムライブラリーを増殖させ、保存することができるということを報告し ている。そのような道具の一つは、ISO-GRIDの1600セルのそれぞれの増殖を複製 し、作成するマスターHGMFの多くのコピーが可能になる(Peterkinら,1987)。 Sharpeら(1989)もQA Laboratories製のISO-GRID HGMFならびに自動 HGMFカウンター(MI-100インタープリター)およびRP-100レプリケーターを用い た。彼らは、多数の微生物培養物を維持し、スクリーニングするための技術を報 告した。 Peterkinおよび共同研究者らは、後に、疎水性グリッド膜フィルターを用いて DNAプローブをスクリーニングするための方法を記載した(Peterkinら,1989) 。この著者らは、HGMFに直接効率的にコロニーハイブリダイゼーションするため の方法を報告した。以前は、上にHGMFが印刷されているエポキシスルホンポリマ ーのDNA結合能が低く不十分な結果しか得られていなかった。しかしながら、Pet erkinら(1989)は、複製され、インキュベートされたHGMFを、DNAと接触させる前 にポリカチオンであるポリエチレンイミンで処理することによって膜の表面への DNAの結合が改良されるということを報告した。この初期の研究は細胞DNA付着を 用いるものであり、本発明とは異なる目的を有しているが、その記載された方法 体系は、フォーマット3 SBHに容易に適合し得る。 有用な配列を迅速に同定するために、Peterkinら(1989)は、種々のクローン由 来の放射能標識プラスミドDNAを使用し、調製したHGMF上でDNAに対するその特異 性を試験した。この方法においては、組換えプラスミド由来のDNAが、容易且つ 再現可能なように調製され得るHGMF複製上において100の生物に対するコロニー ハイブリダイゼーションによって迅速にスクリーニングされた。 小さい(2〜3mm)チップを用いて操作し、数千の反応を平行して実施する。 本発明の解決法は、チップおよびプローブを対応するアレイに維持することであ る。一の実施例においては、250,000の9量体を含むチップを、シリコンウエハ 上にて間に1mMの溝を有する8×12フォーマット(96チップ)に配列した8×8m Mのプレートの形態(15μM/オリゴヌクレオチド、Peaseら,1994)に合成する 。一つのチップ上に1つのプローブでマルチチャンネルピペットまたはピンアレ イのいずれかによってプローブを加える。4000の6量体全部をスコアリングする ために、異なるアレイを用いて、または1セットのチップアレイを数回再使 用することによって42のチップアレイを用いる必要がある。 上記の場合においては、アプリケーションの初期の表記、F=9;P=6;お よびF+P=15を用いる。チップは、式BxNn(ここで、xは特定の塩基B の数であり、nは非特定の塩基の数であり、xは4〜10でnは1〜4である。) のプローブを有し得る。より効率的なハイブリダイゼーションを得るため、そし て任意の担体オリゴヌクレオチドの潜在的な影響を回避するために、特定の塩基 は、非特定の塩基によって囲まれ得るものであり、したがって、(N)nBx( N)mなどの式によって示される(図4)。実施例6 担体結合オリゴヌクレオチドの調製 オリゴヌクレオチド、すなわち、小核酸セグメントは、例えば、一般的に自動 オリゴヌクレオチド合成装置を用いて行われているように、化学的手段によって オリゴヌクレオチドを直接合成することによって容易に調製することができる。 担体結合オリゴヌクレオチドは、ガラス、ポリスチレンまたはテフロンのよう な任意の適当な担体を用いて当業者に公知の方法のいずれかによって調製され得 る。一つの戦略は、標準的な合成装置によって合成されたオリゴヌクレオチドを 正確に滴下することである。固定は、受動(passive)吸着を用いて(Inouyeおよ びHondo,1990);紫外光を用いて(Nagataら,1985;Dahlenら,1987;Morrieyお よびCollins,1989)または塩基修飾DNAの共有結合によって(Kellerら,1988;19 89)行われ得る(全参考文献は特定的に本明細書に組み入れる)。 用いられ得る別の戦略は、リンカーとしての強ビオチン−ストレプトアビジン 相互作用の使用である。例えば、Broudeら(1994)は、ビオチニル化プローブの使 用を記載しているが、これらは2本鎖プローブであり、ストレプトアビジン被覆 磁気ビーズ上に固定される。ストレプトアビジン被覆ビーズはDynal(オスロ) から購入し得る。もちろん、ス トレプトアビジンを有する表面の被覆にはこの同一の結合化学が適用可能である 。ビオチニル化プローブは、例えば、Operon Technologies(アラメダ、CA)な どの種々の供給元から購入し得る。 Nunc Laboratories(ネイパーヴィル、IL)も使用できる適当な材料を販売し ている。Nunc Laboratoriesは、DNAを、Covalink NHと呼ばれるマイクロウェル 表面に共有結合することができる方法を開発した。CovaLink NHは、さらなる共 有カップリングに対して架橋頭として作用する第2級アミノ基(>NH)がグラフ トしたポリスチレン表面である。CovaLinkモジュールは、Nunc Laboratoriesか ら購入し得る。DNA分子は、ホスホロアミデート結合によって独占的に5'-末端に てCovaLinkに結合し得るものであり、DNAを1pmol以上固定化することができる (Rasmussenら,1991)。 5'-末端におけるDNA分子の共有結合に対するCovaLink NHストリップの使用が 記載されている(Rasmussenら,1991)。この技術においては、ホスホロアミデ ート結合が用いられる(Chuら,1983)。これは、1個のみの共有結合を用いる 固定化が好ましいので有利である。ホスホロアミデート結合は、DNAを、ポリス チレン表面上に2nmの長いスペーサーアームを介して共有結合的にグラフトされ たスペーサーアームの末端に位置するCovaLink NH第2級アミノ基に連結する。 ホスホロアミデート結合によってオリゴヌクレオチドをCovaLink Hに連結するた めに、オリゴヌクレオチド末端は5'-末端リン酸基を有する必要がある。恐らく 、ビオチンをCovaLinkに共有結合させ、次いで、ストレプトアビジンを用いてプ ローブを結合させることは可能である。 より具体的には、連結方法は、DNAを水に溶解し(7.5ng/μl)、95℃で10分間 変性し、氷上で10分間冷却することを含む。次いで、氷冷した0.1Mの1-メチル イミダゾール、pH7.0(1-MeIm7)を、10mM 1-MeIm7の最終濃度まで加える。続い て、ssDNA溶液を、氷上に放置したCovaLink NHストリップに分配する(75μl /ウェル)。 10mM 1-Melm7に0.2Mで1-エチル-3-(3-ジメチルアミノプロピル)-カ ルボジイミド(EDC)を溶解した溶液を新たに製造し、ウェル当たり25μlを 加える。ストリップを50℃にて5時間インキュベートする。インキュベーション 後、ストリップを、例えば、Nunc-Immuno Washを用いて洗浄する(まず、ウェル を3回洗浄し、次いでウェルを洗浄溶液に5分間浸漬し、最後にウェルを3回洗 浄する(ここで、洗浄溶液は0.4N NaOH、0.25%SDSを含み、50℃に加熱され る))。 本発明との使用にさらに適した方法は、PCT特許出願W090/03382(Southern およびMaskos)(参照により本明細書に組み入れられる)に記載された方法であ ると考えられる。担体に結合したオリゴヌクレオチドを調製するかかる方法は、 ヌクレオシド3'-試薬を、担体が有する脂肪族ヒドロキシル基に、ホスホジエス テル共有結合によりリン酸基を介して結合させることを含む。次いで、オリゴヌ クレオチドを担体に保持したヌクレオシド上で合成し、保護基を、オリゴヌクレ オチドが担体から切断されない標準条件下で合成オリゴヌクレオチド鎖から除去 する。適当な試薬としては、ヌクレオシドホスホロアミダイトおよびリン酸水素 ヌクレオシド(nucleoside hydrogen phosphorate)が挙げられる。 DNAプローブアレイの調製用のDNAプローブを調製するためのオンチップ(on-ch ip)戦略が用いられ得る。例えば、Fodorら(1991)によって記載されたように(参 照により本明細書に組み入れられる)、対処可能な(addressable)レーザー活性 化光脱保護が、ガラス表面上でのオリゴヌクレオチドの直接的な化学合成におい て用いられ得る。プローブは、Van Nessら(1991)によって記載されたようにナイ ロン担体上にも固定し得るものであり、またはDuncanおよびCavalier(1988)の方 法を用いてテフロンに連結し得るものでもよい(これらの参考文献は全て特定的 に本明細書に組み入れる)。 Van Nessら(1991)によって記載されたようにオリゴヌクレオチドをナイロン担 体に連結するためには、アルキル化によるナイロン表面の活性化および塩化シア ヌリルを用いるオリゴヌクレオチドの5'-アミンの 選択的活性化が必要である。 担体結合オリゴヌクレオチドを調製するための一の特定の方法は、Peaseら(1 994、参照により本明細書に組み入れる)によって記載された光発生(light-gene rated)合成を利用することである。この著者らは、電流フォトリソグラフ技術を 用いて固定化オリゴヌクレオチドプローブ(DNAチップ)のアレイを作製した。 これらの方法は、光を用いて高密度の小型化アレイにおいてオリゴヌクレオチド プローブの合成を誘導するものであり、光不安定性5'-保護N-アシル−デオキシ ヌクレオシドホスホロアミダイト、表面リンカー化学および万能のコンビナトリ アル合成戦略を利用するものである。256の空間的に規定されたオリゴヌクレオ チドプローブのマトリックスがこの手法で作製され、次いで本明細書に記載した ように、都合の良いフォーマット3配列決定において使用され得る。 もちろん、上記のような光活性化チップの一つなどのDNAチップは供給業者か ら簡単に購入することができる。このことについては、サンタクララ、CA、9505 1のAffymetrixおよびBeckmanに問い合わせることができる。実施例7 核酸断片の調製 配列決定される核酸は、c DNA、ゲノムDNA、染色体DNA、顕微解剖染色体バン ド、コスミドまたはYAC挿入物、およびmRNAなどのRNAのような任意の 適当な起源から、増幅工程を行わずに得られ得る。例えば、Sambrookら(1989)は 、哺乳動物細胞から高分子量DNAを単離するための3つのプロトコルを記載して いる(p.9.14〜9.23)。 ターゲット核酸断片は、M13、プラスミドまたはλベクターにおいてクロー ンとして調製され得るか、および/またはゲノムDNAまたはc DNAからPCRまた はその他の増幅方法によって直接調製され得る。試料は、マルチウェルプレート 内で調製され得るか、分配され得る。約 100〜1000ngのDNA試料が、最終容量2〜500mlで調製され得る。PCRによって 調製されたターゲット核酸は、精製せずにフォーマットISBH用の基質に直接塗布 され得る。ターゲット核酸が基質に固定されたら、基質は洗浄され得るか、直接 プローブでアニールされ得る。 次いで、例えば、Sambrookら(1989)の9.24〜9.28に記載されているような制限 酵素の使用、超音波およびNaOH処理による剪断などの当業者に公知の方法のいず れかによって核酸は断片化される。 Schrieferら(1990、参照により本明細書に組み入れられる)によって記載さ れているような低圧剪断も適している。この方法では、DNA試料を、低圧〜中圧 の種々の圧力で微小フレンチプレスセルを通過させる。レバー装置によってセル に低圧〜中圧の圧力を制御しながらかけることができる。これらの研究の結果か ら、低圧剪断が音波および酵素的DNA断片化法の有用な代替法であることが示さ れる。 DNAを断片化するのに特に適した一つの方法は、Fitzgeraldら(1992)によって 記載された、2つの塩基認識エンドヌクレアーゼCviJlを用いる方法であると考 えられる。この著者らは、DNAをショットガンクローニングおよび配列決定に適 していると考えられる特定サイズに急速断片化および分画するためのアプローチ を記載した。本発明者は、これも、本発明の配列決定技術において使用するため のランダムであるが比較的小さいDNAの断片を作製するのに特に有用であると考 えている。 制限エンドヌクレアーゼCviJIは、通常、GとCの間の認識配列PuGCPyを切断 して平滑末端を残す。異型反応条件(これはこの酵素(CviJI**)の特異性を変 更する)により、小分子pUC19(2688塩基対)からDNA断片の擬ランダム分布が得 られる。Fitzgeraldら(1992)は、高速ゲル濾過法によってサイズ分画され、末端 修復無しにlac ZマイナスM13クローニングベクターに直接ライゲートされたpUC1 9のCviJI**消化を用いて、この断片化戦略のランダム性を定量的に評価した。76 クローンの配列分析により、CviJI**はPuGCPy部位に加えてpyGCPyおよびPuGCPu を制限し、新規配列データがランダム断片化と一致する速度で蓄 積されるということが分かった。 文献に報告されているように、音波処理およびアガロースゲル分画と比較した 場合のこのアプローチの利点としては、要求されるDNAの量がより少ないこと( 2〜5μgの代わりに0.2〜0.5μg);および含まれる工程がより少ないこと( 予備ライゲーション、末端修復、化学的抽出、またはアガロースゲル電気泳動お よび溶出が要求されない)が挙げられる。これらの利点により、フォーマット3 による配列決定のためのDNAを調製する場合に使用することも考えられる。 核酸断片を得る、または調製する手法に関係無く、DNAを変性してハイブリダ イゼーションに利用可能な1本鎖断片を得ることが重要である。これは、DNA溶 液を80〜90℃で2〜5分間インキュベートすることによって行われる。次いで、 溶液を2℃まですばやく冷却してDNAがチップと接触する前のDNA断片の再生を防 止する。また、リン酸基も、実施例VIに記載されたように、ゲノムDNAから除去 する必要がある。実施例8 DNA アレイの調製 アレイは、ナイロン膜などの担体上にDNA試料を滴下することによって調製さ れ得る。滴下は、金属ピンのアレイ(マイクロタイタープレートのウェルの配列 に対応する位置)を用いることによってナイロン膜へ約20nlのDNA溶液を移動さ せて繰り返し行われ得る。オフセット印刷によって、ウェルの密度よりも高いド ット密度が得られる。使用される標識の種類に応じて、1mm2当たり1〜25ドット が適応し得る。予め選択したある数の横列および縦列におけるスポッティングを 回避することによって、分離サブセット(サブアレイ)が形成され得る。一つの サブアレイにおける試料は、異なる個体由来のDNA(または同一遺伝子)の同一 ゲノム断片、または異なる重複ゲノムクローンであり得る。サブアレイのそれぞ れは、同一試料のレプリカスポッティングを示し得る。一つの実施例においては 、64人の患者由来の選択された遺伝子断片が増幅さ れ得る。各患者に対して、増幅遺伝子断片は一つの96-ウェルプレート中に存在 し得る(96ウェルの全てが同一試料を含む)。64人の患者のそれぞれについてのプ レートを調製する。96-ピン装置を用いることによって、全試料を一枚の8×12c m膜に滴下し得る。サブアレイには、各患者から一つずつ、64の試料が含まれ得 るものである。96のサブアレイが同一の場合、ドットスパンは1mm2であり得るも のであり、サブアレイ間には1mmの空間が存在し得る。 別のアプローチは、物理的スペーサー(例えば、膜上に成形したプラスチック 製グリッド、マルチウェルプレートの底部に塗布された膜のソート(sort)に類似 したグリッド、または疎水性ストリップ)によって仕切ることのできる膜または プレート(NUNC(ネイパーヴィル、イリノイ)から市販されている)を使用する ことである。固定された物理的スペーサーは、フラット燐光体記憶スクリーン(f lat phosphor-storage screens)またはX線フィルムへの露光による画像には好 ましくない。実施例9 ハイブリダイゼーションおよびスコアリング方法 標識プローブはハイブリダイゼーション緩衝液と混合され得るものであり、ピ ペット、好ましくはマルチチャンネルピペットによってサブアレイに移され得る 。サブアレイ間のプローブの混合を防止するために(膜内に刷り込まれた疎水性 ストリップまたは物理的障壁が存在しない場合)、対応するプラスチック、金属 またはセラミックのグリッドが膜にしっかりとプレスされ得る。また、緩衝液の 容量は、1mm2当たり約1ml以下まで低減され得る。用いられるプローブの濃度 およびハイブリダイゼーション条件は、プローブを急速に希釈させることによっ て有意な交差ハイブリダイゼーションを防止するために洗浄緩衝液がサブアレイ の配列上にすばやく注がれ得る以外は先に記載されたとおりであり得る。同じ理 由で、最小濃度のプローブが使用され得るものであり、ハイブリダイゼーション 時間は最大実用レベルまで延長され得るものである。 DNA検出および配列決定に関し、「正常な」配列についての知識によってシグナ ルを増大させるための連続的なスタッキング相互作用現象の使用が可能になる。 標識プローブに加えて、背中合わせにハイブリダイズする非標識プローブがハイ ブリダイゼーション反応にさらに添加され得る。ハイブリッドの量は、数倍に増 大され得る。プローブはライゲーシションによって接続され得る。このアプロー チは、「コンプレッション(compressions)」を形成するDNA領域を解明するのに 重要であり得る。 放射能標識プローブの場合、好ましくは燐光体記憶技術によってフィルターの 像が得られ得る。蛍光標識は、CCDカメラ、共焦顕微鏡またはそうでないもの によってスコアリングされ得る。種々のハイブリダイゼーション実験のデータを 正確に評価し、まとめるために、生のシグナルを各ドット中のターゲットの量に 基づいて標準化する。1ドット当たりのターゲットDNAの量の差は、各プローブ のシグナルを一のドットにおいてスコアリングされた全プローブについての平均 シグナルで割ることによって補正され得る。標準化されたシグナルは、種々の実 験のデータを比較するために、通常、1〜100の範囲で倍率変更され得るもので ある。また、各サブアレイにおいて、完全適正ターゲットを含まないそれらの試 料中の平均バックグラウンドシグナルを測定するために、いくつかの対照DNAが 用いられ得る。倍数(多倍数)スコアから得られた試料に対し、ホモ接合性対照 を用いることにより試料中のヘテロ接合体を認識することができる。実施例 10オリゴヌクレオチドとのハイブリダイゼーション オリゴヌクレオチドは、Genosys社(ヒューストン、テキサス)から購入、ま たはApplied Bilosystems 381A DNA合成装置にて作成した。使用したプローブの 大部分は、HPLCまたはゲル電気泳動で精製しなかった。例えば、プローブは 、インターフェロン(921bpのEco RI-Bgl IIヒトB1−インターフェロン断片を含 むM13クローン(Ohnoおよび Tangiuchi,Proc.Natl.Acad.Sci.74:4370-4374(1981))における単独の完全 に相補的なターゲット、およびM13ベクター自体における末端塩基不適正対合 を有する少なくとも1つのターゲットの両方を有するように設計した。 オリゴヌクレオチドの末端標識は、T4-ポリヌクレオチドキナーゼ(5単位、A mersham)、g32P-ATP(3.3pM、10mCi Amersham 3000Ci/mM)およびオリゴヌ クレオチド(4pM、10ng)を含む10ml溶液中で、記載されたとおりに(Maniatis ら,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Laboratory Cold Spring Harbor,ニューヨーク(1982))行った。プローブの比活性は2.5〜 5×10 9cpm/nMであった。 1本鎖DNA(0.5M NaOH、1.5M NaClの溶液2〜4ml中)を、同一の溶液で湿 らせたGene Screen膜に滴下し、フィルターをpH6.5の0.05M Na2HPO4中で中和し 、80℃で60分間オーブンで焼き、1分間UV照射した。次いで、フィルターをハイ ブリダイゼーション溶液(0.5M Na2HPO4pH7.2、7%ラウロイルサルコシンナト リウム)中で室温にて5分間インキュベートし、プラスチック製のペトリ皿の表 面に置いた。32P末端標識オリゴマープローブを4nM濃度で含むハイブリダイゼ ーション溶液(10ml、0.5M Na2HPO4pH7.2、7%ラウロイルサルコシンナトリウ ム)の液滴を、フィルター当たり1〜6ドットで置いて、正方形のポリエチレン 断片(約1×1cm)で覆い、湿気の多いチャンバー内で示した温度にて3時間イ ンキュベートした。フィルターを6×SSC洗浄溶液中に0℃で3×5分間置い てハイブリダイズしていないプローブを除去することによってハイブリダイゼー ションを停止させた。フィルターを乾燥するか、または示した時間および温度で さらに洗浄し、オートラジオグラフィーを行った。識別(discrimination)測定の ために、オートラジオグラフィー(燐光画像装置(Molecular Dynamics,サニー ヴェイル、カリフォルニア)が用いられ得る)後にドットを乾燥フィルターから 切り出し、液体シンチレーションカクテル中に入れてカウントし た。IFおよびM13ドットについてのcpmの非補正比はDとして与えられる。 本明細書で報告した条件により、非常に短いオリゴヌクレオチドとのハイブリ ダイゼーションが可能になるが、ターゲット核酸と相補的であり、よってそれに 結合する適正対合および不適正対合オリゴヌクレオチド間の識別を確実に行うこ とができる。完全に相補的なターゲットとハイブリッド中に1個の不適正対合を 有する不完全に相補的なターゲット間の識別(D)の程度に基づいて特異的短鎖 配列のハイブリダイゼーションの効率的な検出に影響を及ぼす因子が規定される 。実験的な試験において、長さが6〜8ヌクレオチドの28個のプローブの、2つ のM13クローンまたは膜フィルターに結合したモデルオリゴヌクレオチドへの ドットブロットハイブリダイゼーションを行った。実験手順を誘導する原理を下 記に示す。 プローブ過剰の条件下における、プローブよりもほんの数ヌクレオチド長いフ ィルター結合ターゲット核酸へのオリゴヌクレオチドハイブリダイゼーションは 、ターゲット濃度に関する擬一次反応である。この反応は、 St/S0=e-kh[OP]t によって定義される。ここで、St、およびS0は、それぞれ時間tおよびt0に おけるターゲット配列濃度である。(OP)はプローブ濃度であり、tは温度で ある。ハイブリッド形成の反応速度定数kh,は、0℃〜30℃の範囲でほんのわ ずか増大する(PorschkeおよびEigen,J.Mol.Blol.62:361(1971);Craigら, J.Mol.Bjol.62:383(1971))。 ハイブリッド溶融は、 Ht、/H0=e-kmt で示されるように、ハイブリッド濃度に関する一次反応である(ここではフィル ター結合状態のため質量に置き換えた)。 この方程式において、HtおよびH0はそれぞれ時間tおよびt0におけるハイ ブリッド濃度であり;kmは温度および塩濃度に依存するハ イブリッド溶融についての反応速度定数である(Ikutaら,Nucl.Acijds Res.1 5 :797(1987);PorsclikeおよびEigen,J.Mol.Biol.62:361(1971);Craigら,J .Mol.Biol.62:303(1971))。ハイブリダイゼーション(これは鎖会合プロセ スである)中、逆行、溶融、または鎖解離反応が同様に生じる。したがって、や がて形成されるハイブリッドの量は、順反応および逆反応の結果である。プロー ブ濃度の上昇および/または温度の低下によって平衡はハイブリッド形成の方に 移行し得る。しかしながら、大量の緩衝液中での洗浄サイクル中、プローブがな くなるので、溶融反応が優勢になり、逆反応ハイブリダイゼーションが微々たる ものになる。この分析は、使用可能な短鎖オリゴヌクレオチドハイブリダイゼー ション(SOH)条件が、プローブ濃度および温度によって変化するということ を示すものである。 Dまたは識別は、方程式4: D=Hp(tw)/Hi(tw) で定義される。 Hp(tw)およびHi(tw)は、それぞれ、同一量の完全および不完全相補的2 本鎖についての洗浄時間tw後に残留しているハイブリッドの量である。所定の 温度に対し、識別Dは10の長さの洗浄時間とともに変化し、Hi=B(方程式5) の場合に最大値に達する。 バックグラウンドBは、この系で検出可能な最低ハイブリダイゼーション信号 を示す。Hiのさらなる減少は調べられないので、Dは、洗浄の継続により増大 する。tw経過後の洗浄は、Bに比べてHpを低下させ、Dが減少するように見 える。不完全ハイブリッドについての最適洗浄時間twは、方程式3および5か ら、 tw=-ln(B/Hi(t0))/km.i である。 Hpは同じtw時間洗浄されているので、方程式を組み合わせて、最適識別関 数: D=eIn(B/Hi(t0))km,p/km,iX Hp(t0)/B が得られる。 Tの関数としてのDの変化は、最適洗浄温度の選択のために重要である。これ は、先の方程式にアレニウスの式: K- =Ae-Ea/RT を用いて最終方程式: D=Hp((t0)/B X(B/Hi(t0))(Ap/Ai)e(Ea,i-Ea,p)/RT (ここで、BはHi(t0)よりも小さい。) を作ることによって得られる。 完全ハイブリッドについての活性化エネルギーEa,p、および不完全ハイブリ ッドについての活性化エネルギーEa,iは等しいか、Ea,iがEa,pよりも小さい ものであり得るので、Dは、それぞれ、温度に無関係であるか、または温度の上 昇とともに減少する。この結果は、SOHにおける良好な識別のためのストリン ジェントな温度条件についての調査が正しいものではないということを意味する ものである。低温で洗浄することによって、同等のまたは良好な識別が得られる が、洗浄時間は、温度の低下とともに指数関数的に増大する。識別は、Hi(t0 )がHp(t0)と比べて増大する場合、Tとともにより顕著に低下する。 低温でのDは、Hp(t0)/Hi(t0)比よりもHp(t0)/B比に高度に依存 する。この結果は、この工程で得られる識別にかかわらずハイブリダイゼーショ ンにおいてHpの十分な量を得ることがよりよいということを示すものである。 次いで、より良好な識別を洗浄によって得ることができる。というのは、より多 量の完全ハイブリッドにより示差融解が効果を示すにはより時間がかかるからで ある。同様に、より大量の標的核酸を用いると、必要な識別がKm,pとKm,iの間 の差が小さい場合でさえ得られる この簡単なモデルにおいてカバーされるものよりも複雑な状況に外挿したとこ ろ、その結果は、所与の核酸標的内での多数の末端誤対合を有するプローブのハ イブリダイゼーションの場合に識別を得るには低温での洗浄がより重要であると いうことである。 実験の手引きとして記載された理論原理を用いて、信頼度の高いハイブリダイ ゼーションが長さ6〜8ヌクレオチドのプローブにより得られた。実験は全てフ ィルター上にハイブリダイゼーション溶液のフィルムを形成させる浮遊性プラス チックシートを用いて行った。この操作によりプローブの量を最大限低減するこ とができ、したがって、ドットブロットハイブリダイゼーションにおける標識コ ストが低減される。リン酸ハイブリダイゼーション緩衝液にラウロイル硫酸ナト リウムの代わりに高濃度のラウロイルサルコシンナトリウムを用いると、反応温 度を室温から12℃まで下げることができる。同様に、4〜6×SSC、10%ラウ ロイルサルコシンナトリウム緩衝液を用いると、2℃くらいの低温でハイブリダ イゼーションを行うことができる。これらの緩衝液中の界面活性剤は、最大40nM 濃度の標識プローブで許容できるバックグラウンドを得るためのものである。短 鎖オリゴヌクレオチドハイブリッドの熱安定性についての予備的な特性付けを、 50%G+C含量の原型オクタマー、すなわち配列TGCTCATGのプローブを用いて測 定した。理論的な見込みは、このプローブが安定性の低いオクタマーの一つであ るということである。その遷移エンタルピーはより安定なヘプタマーのものと同 様であり、さらに長さ6ヌクレオチドのプローブとも同様である(Bresslauerら ,Proc.Natl.Acad.Sci.U.S.A.83:3746(1986))。ハイブリッドの50%が単 位時間1分で融解される温度であるパラメーターTdは18℃である。この結果は 、Tdがllbp2本鎖よりも8bpハイブリッドのほうが15℃低いということを示し ている(Wallaceら,Nucleic Acids Res.6:3543(1979))。 モデルオリゴヌクレオチドによる実験に加えて、M13ベクターを短鎖オリゴ ヌクレオチドハイブリダイゼーションの実際的な証明のため の系として選択した。主な目的は、本発明の方法の種々の用途で用いられるもの と同様の標的を用いて有用な末端誤対合識別を示すことである。M13モデル用 のオリゴヌクレオチドプローブは、M13ベクター自体が末端誤対合塩基を含む ように選択された。921bpのヒトインターフェロン遺伝子挿入物を含むM13組 換え体であるベクターIFは、1個の完全な対合標的を有する。したがって、I Fは、M13ベクター自体と比較して、同一またはそれ以上の数の誤対合標的を 有する。 低温条件およびドットブロットを用いることにより、完全な標的および誤対合 標的を含むタイ(tie)ドットと誤対合標的のみを含むドットとの間にハイブリダ イゼーション信号における十分な相違が得られた。これは、6量体オリゴヌクレ オチドにも当てはまり、また、核酸の大きなIF−M13対にハイブリダイズし た7および8量体オリゴヌクレオチドについても当てはまる。 ハイブリダイゼーション信号は、プローブとの反応用のフィルター上の利用可 能な標的の量に依存する。必須の対照は、信号強度の差が2つのドットにおける 核酸の量の変動を反映するものではないということを示すことである。IFおよ びM13における同一数および同一種類の標的を有するプローブとのハイブリダ イゼーションは、ドット中に等量のDNAが存在することを示すものである。ハイ ブリッド形成の効率はハイブリッドの長さとともに増大するので、6ヌクレオチ ドを有する2本鎖についての信号は、フィルターに結合した多量のオリゴヌクレ オチド標的を用いることにより最もうまく検出された。それらの低分子量のため に、標的として作用する核酸の大分子と比べた場合、多数のオリゴヌクレオチド 標的分子が所与の表面領域に結合することができる。 未精製DNAによる検出の感度を測定するために、種々の量のファージ上清を フィルター上にスポットし、32P標識オクタマーとハイブリダイズさせた。わず か0.5ngのDNAを含む50,000,000の末精製ファージのような少量で、短鎖オリ ゴヌクレオチドハイブリダイゼーション法の感度が十分であることを示す検出可 能な信号が得られた。反応時間が 短く、実用性が増す。 上記の理論を説明した節に記載したように、ハイブリッドの平衡収量は、プロ ーブ濃度および/または反応温度に依存する。例えば、13℃における4nMのオク タマーによる同量の標的の信号レベルは、40nMのプローブ濃度を用いる場合より も3倍低く、25℃までハイブリダイゼーション温度を上昇させることによって4. 5倍減少する。 最大識別を得るための低温洗浄の有用性は示されている。この現象を視覚的に 明らかにするために、ベクター特異的プローブによるハイブリダイゼーションを 用いてIFドットの50倍のDNAをM13ドットに入れた。この方法において、 実際のプローブを用いたハイブリダイゼーション工程後の信号は、対合の場合よ りも誤対合の場合に強くなった。Hp/Hi比は1:4であった。7℃での長時 間洗浄後、完全ハイブリッドの大量の損失なしに信号強度の逆転が得られ、2: 1の比になった。これとは対照的に、25℃では識別を得ることはできない。とい うのは、対合標的信号が2分間洗浄ですでにバックグラウンドレベルまで低下し ており、それと同時に、誤対合ハイブリッド由来の信号は依然として検出可能で あるからである。7℃と比べた場合の13℃の識別の損失は、それほど大きくない が、はっきりと目に見える。7℃における90分時点と13℃における15分時点を考 えると、誤対合ハイブリッド信号がバックグラウンドレベル付近である場合(こ れは各条件についての最適洗浄時間を示す)、13℃よりも7℃の量のほうが数倍 大きいことは明らかである。このことをさらに説明すると、2つの温度で同量の 出発ハイブリッドを洗浄することによる識別の経時変化は、低温にてより高い最 大Dを示す。これらの結果は、温度と洗浄工程の出発時点における2種類のハイ ブリッドの量の割合とによりDが変化するという傾向を立証するものである。 短鎖オリゴヌクレオチドハイブリダイゼーション条件の一般的な有用性を示す ために、本発明者らは、4ヘプタマー、10オクタマー、さらに長さが最大12ヌク レオチドまでの14プローブのハイブリダイゼーショ ンを本発明者らの単純なM13系において観察した。これらは、GC含量が両極 端なノナマーGTTTTTTAAおよびオクタマーGGCAGGCGを含む。GC含量および配列 は短鎖ハイブリッドの安定性に影響を及ぼすものと予想されるが(Bresslauerら ,Proc.Natl.Acad.Sci.U.S.A.83:3746(1986))、低温短鎖オリゴヌクレオ チド条件は、十分な識別を得ることにおいて全ての試験プローブに適用可能であ った。長さ13ヌクレオチドのプローブで得られた最良の識別値は20であり、配列 の変動による数倍の低下は容易に許容できる。 M13系は、識別のレベルにおける標的DNA複雑性の効果を示すという利点 を有する。誤対合標的を有しないか、または5個の誤対合標的を有しており、1 個のGC対のみが異なる2つのオクタマーに関し、観察された識別は、それぞれ 、18.3および1.7であった。 この方法の有用性を示すために、長さ8ヌクレオチドの3つのプローブを、Bl uescriptベクターにおけるライブラリーから製造した51プラスミドDNAドット のコレクションについて試験した。一のプローブがBluescriptベクターに対して 存在し、特異的であったが、M13には存在しておらず、一方、その他の2つの プローブは既知の配列の挿入物である標的を有していた。この系は、各プローブ によるハイブリダイゼーション陰性または陽性対照DNAを使用することができ た。また、このプローブ配列(CTCCCTTT)も、インターフェロン挿入物における 相補的標的を有していた。M13ドットは陰性であり、一方、M13またはBlue scriptにおけるインターフェロン挿入物は陽性であるので、ハイブリダイゼーシ ョンは配列特異的である。同様に、適切な標的がクローン中に存在する場合、51 挿入物の1個のみにおいて標的配列を検出するプローブ、または検査される挿入 物のどれにおいても標的配列を検出しないプローブが、ハイブリダイゼーション が生じていることを立証する対照とともに用いられた。 長さ6〜8ヌクレオチドの非常に短いオリゴヌクレオチドハイブリッドについ ての熱安定性曲線は、長さ11〜12ヌクレオチドのハイブリッ ドよりも少なくとも15℃低い(図1およびWallaceら,Nucleic Acids Res.6:35 43-3557(1979))。しかしながら、低温にて、とても実用的な0.4〜40nM濃度のオ リゴヌクレオチドプローブを用いてハイブリダイゼーション反応を行うと、既知 または未知の核酸標的の相補的配列の検出が可能になる。未知の核酸配列を完全 に決定するためには、65,535の8量体プローブを含むセット全体が使用され得る 。この目的に十分な量の核酸は、数マイクロリットルのM13培養物、10mlの細 菌培養物由来のプラスミド調製物(prep)もしくは細菌の単一コロニー、または1m l未満の標準PCR反応のような都合のよい生物学的試料中に存在する。 長さ6〜10の短鎖オリゴヌクレオチドによりすぐれた識別が得られる。1個の 末端誤対合によるハイブリッド安定性の相対的な低下は、より長いプローブより も大きい。オクタマーTGCTCATGを用いた結果はこの結論を支持するものである。 この実験において、G/T末端誤対合を有する標的は、この種類の誤対合の標的へ のハイブリダイゼーションが、その他の全種類のオリゴヌクレオチドの中で最も 安定である。得られたこの識別は、19塩基対2本鎖における内部G/T誤対合と同 一であるかそれよりも大きい(Ikutaら,Nucl.Acids res.15:797(1987))。短 鎖オリゴヌクレオチドハイブリダイゼーションに対して記載されたハイブリダイ ゼーション条件を用いてこれらの識別特性を利用することにより、オリゴヌクレ オチド標的の非常に正確な測定が可能になる。完全および不完全ハイブリッド間 の識別の検出が容易であることとは対照的に、非常に短いオリゴヌクレオチドを 用いることにより存在し得る問題は十分な量のハイブリッドの調製である。実際 、HpおよびHiを識別するための要求は、ドットにおけるDNAの量および/ またはプローブ濃度の増大によって、またはハイブリダイゼーション温度の低下 によって促進される。しかしながら、より高濃度のプローブは、通常、バックグ ラウンドを増大させる。さらに、使用するのに実際的な量の標的核酸に限定され る。この問題は、4nMのプローブにより効率的なバックグラウンドを与える高濃 度の界面活性剤Sarcosylによって解決された。プローブの フィルターへの非特異的結合に対する競争相手の使用、またはハイブリダイゼー ション担体材料を変更することによってさらなる改良が得られる。さらに、Ea が45kcal/molよりも低いプローブ(例えば、多くのヘタマーおよびヘキサマーの 大部分)については、修飾オリゴヌクレオチドは、それらの非修飾体よりも安定 なハイブリッドを生じさせる(Asselineら,Proc.Natl.Acad.Sci.81:3297(1 984))。低温を用いた短鎖オリゴヌクレオチドハイブリダイゼーションのために 本発明において記載したハイブリダイゼーション条件により、全ての配列および 2本鎖ハイブリッド投入量についての良好な識別が得られる。種々の配列のため のハイブリダイゼーション条件において統一性を得るのに払われる唯一の代償は 、洗浄時間の、配列に依存した数分から最大24時間までの増大である。さらに、 洗浄時間は、塩濃度を低下させることによって低減することができる。 短鎖オリゴヌクレオチドハイブリダイゼーションにおいて、一の対合ハイブリ ッドの識別は誤対合ハイブリッドよりも優れているが、誤対合ハイブリッドから の信号が存在し、誤対合ハイブリッドの大部分は末端誤対合から生じる。これは 、一定の長さのプローブによって効率的に検査され得る挿入物のサイズを限定し 得るものである。 識別における配列複雑性の影響は無視することができない。しかしながら、複 雑性効果は、特異的非ランダム配列に対する短鎖オリゴヌクレオチドハイブリダ イゼーションによる配列情報を規定する場合、より有意であり、適当なプローブ 対標的の長さの比を用いることによって克服することができる。長さの比は、統 計学的根拠で、識別を排除するか、間違って識別を逆転させ得るであろういくつ かの末端誤対合を有する特異的配列を発生させることがないように選択される。 結果は、それぞれ、0.6、2.5、および10bよりも短い核酸挿入物において長さ6 、7、および8ヌクレオチドのオリゴヌクレオチドを使用することを示唆するも のである。実施例11 DNA配列決定 サブアレイの配列により、複製サブアレイの状態で配列された小さな試料セッ トを効率的に配列決定することができる;例えば、64の試料が8×8mmのサブア レイに配列され得るものであり、そして16×24サブアレイが、サブアレイ間に1 mm幅の空間を有する15×23cm膜上に複製され得る。いくつかのレプリカ膜が製造 され得る。例えば、3072の7量体の普遍的セット由来のプローブは32個の96ウェ ルプレートに分配され、キナーゼ処理によって標識され得る。4つの膜が一のハ イブリダイゼーションサイクル中に平行して処理され得る。各膜上で、384のプ ローブが得点付けされ得る。プローブは全て2つのハイブリダイゼーションサイ クルにおいて得点付けされる。ハイブリダイゼーション強度が得点付けされ得る ものであり、その配列は、下記のようにしてアセンブルされ得る。 単一の試料サブアレイがいくつかの未知のものを含む場合、特に、同様の試料 が用いられる場合、先に得点付けされたプローブの結果に基づいてプローブが理 知的に選択されるならばより少数のプローブで十分であり得る。例えば、プロー ブAAAAAAAが陽性でない場合、8の重複プローブのいずれかが陽性である可能性 は小さい。AAAAAAAが陽性である場合、通常、2つのプローブが陽性である。こ の場合の配列決定プロセスは、第1に、最小限重複したプローブのサブセットを ハイブリダイズさせて陽性アンカーを規定し、次いでアンカーの順序ならびにそ れらの間のギャップのサイズおよび型についての最も可能性の高い仮定の一つを 確定するプローブを連続的に選択することからなる。この第2段階では、2〜10 のプローブのプールが使用され得るものであり、ここで、各プローブは、そのプ ールのその他のプローブに陽性であると予想される試料とは異なる一つのDNA 試料中においてのみ陽性であるように選択される。 サブアレイアプローチにより、分岐した問題を解決することにおい て、プローブ競合(重複プローブ)またはプローブ協同(プローブの連続的スタ ッキング)を効率的に実行することができる。プローブの普遍的セットのハイブ リダイゼーション後、配列アセンブリプログラムによって候補配列サブ断片(S F)を決定する。SFのさらなるアセンブリのために、(DNA断片の重複配列、 類似配列、シングルパス(single pass)ゲル配列から、またはその他のハイブリ ダイゼーションもしくは制限マッピングデータから)さらなる情報を得る必要が ある。分岐点によるシングルパスゲル配列決定用のプライマーは、SBH配列情 報または公知のベクター配列、例えば、ベクター挿入部位の隣接配列から同定さ れ、標準サンガー配列決定反応が試料DNAにおいて行われる。このシングルパ スゲル配列決定から得られた配列を、分岐点に読み込み、分岐点から読み出すS fと比較してSfの順序を同定する。さらに、シングルパスゲル配列決定をSB Hと組み合わせて核酸を新たに配列決定したり、再配列決定することができる。 競合ハイブリダイゼーションおよび連続スタッキング相互作用を使用してSf をアセンブルすることもできる。これらのアプローチは、SBHによる多数の試 料の配列決定に対する商業的価値を限定するものであり、ここで、均一なアレイ が用いられる場合、標識プローブがアレイに付けた試料に塗布される。幸い、レ プリカサブアレイを用いる少数の試料の分析により両方のアプローチを効率的に 行うことができる。レプリカサブアレイのそれぞれにおいて、同一のサブアレイ にスポットした異なる試料における突然変異誘発配列を解明する場合と同様にプ ローブのプールを用いることにより、一つの分岐点が1以上のDNA試料につい て試験され得る(上記参照)。 本実施例に記載した64の試料のそれぞれにおいて約100の分岐点が存在する場 合、そして8の試料が各サブアレイにおいて平行して分析される場合、少なくと も800のサブアレイプロービング(probings)が全ての分岐を解明する。これは、3 072の塩基性プロービングについて、さらに800のプロービング(25%)が用いら れるということを意味するもので ある。より好ましくは、2つのプロービングが一つの分岐点に用いられる。サブ アレイがより小さい場合、より少数の追加のプロービングが用いられる。例えば 、サブアレイが16試料からなる場合、200の追加プロービングが得点付けされ得 る(6%)。7量体プローブ(N1-271-2)ならびに競合もしくは協同的分 岐解明アプローチまたはその両方を用いることによって、約100pdの断片が約400 0のプロービングによってアセンブルされ得る。さらに、8量体プローブ(NB8 N)を用いると、4kbまたはそれより長い断片が12,000のプロービングによりア センブルされ得る。ギャップド(gapped)プローブ、例えば、NB4NB3Nまたは NB4NB4Nを用いることにより、分岐点の数を低減することができる。実施例12 プローブのサブアレイへの一時付着および標識プローブのライゲーションによる DNA分析 4〜40塩基の有益な長さを有するオリゴヌクレオチドプローブを、標準的な化 学により合成し、チューブまたはマルチウェルプレートに保存する。1〜10,000 のプローブを含むプローブの特異的なセットを、別々の担体または巨大担体の別 個の区画上に付着またはin situ合成によって配列する。後者の場合、区画また はサブアレイは物理的または疎水性障壁によって分離され得る。プローブアレイ は、in situ合成によって調製され得る。適当なサイズの試料DNAを1以上の 特異的アレイとハイブリダイズさせる。多くの試料が同一サブアレイにおけるプ ールとしてまたは一つの担体内の種々のサブアレイと独立してインテロゲートさ れ得るものである。試料と同時に、またはその後に、単独の標識プローブまたは 標識プローブのプールをサブアレイのそれぞれに加える。付着した標識プローブ が試料DNA中の相補的標的に背中合わせにハイブリダイズする場合、それらは ライゲートされる。ライゲーションの発生は、プローブの標識を検出することに よって測定される。 この操作は、DNA試料が担体に永久に付着しないという記載され たDNA分析プロセスの変形である。一時付着は、担体に固定したプローブによ って得られる。この場合、標的DNA配列プロセスは必要ではない。さらに、ラ イゲーションにより、短鎖標識プローブを短鎖固定プローブと組み合わせること によって、より長いオリゴヌクレオチド配列の検出が可能になる。 このプロセスはいくつかの独特の特徴を有する。基本的に、標的の一時付着に よりその再使用が可能である。ライゲーションが生じた後、標的が放出され得る ものであり、標識は担体に共有結合されたままである。この特徴により、標的を 循環することができ、少量の標的で検出可能な信号を発生させることができる。 最適条件下では、標的を増幅させる必要がなく、例えば、DNA試料の天然源を 、診断および配列決定プロセスに直接使用することができる。標的は、効率的な ハイブリダイゼーションと効率的な2本鎖の融解の間で温度をサイクルさせるこ とによって放出され得る。より好ましくは、サイクルさせない。温度および成分 の濃度は、遊離標的とハイブリッド中の標的との平衡が約50:50%のレベルにあ るように規定され得る。この場合、ライゲートされた産物は連続産生される。異 なる目的に対しては、異なる平衡比が最適である。 電場を用いて標的消費を増大させることができる。初めに、各サブアレイ内で の水平電場パルシングを用いてより高速の標的選別を行うことができる。この段 階では、平衡はハイブリッド形成の方に移行し、非標識プローブが用いられ得る 。標的選別段階後、適切な洗浄(これは、試料の移動を制限するための垂直電場 によって助けられ得る)が行われ得る。識別性ハイブリッド融解、ハイブリダイ ゼーションによる標的回収、ならびに未使用標的のライゲーションおよび除去を 数サイクル行うことにより、特異性を増大させ得る。次の工程では、標識プロー ブが加えられ、垂直電気パルスが印加され得る。温度を上昇させることによって 、最適な遊離標的およびハイブリダイズされた標的の比が得られる。垂直電場は 、選別された標的の拡散を防止する。 固定されたプローブのサブアレイおよび標識プローブのセット(普 遍的プローブセットから特別に設計または選択されたもの)を種々の方法で配列 させて効率的且つ柔軟な配列決定および診断プロセスを行うことができる。例え ば、細菌ゲノムの短い断片(約100〜500bp)が部分的または完全に配列決定され る場合、既知の配列の塩基上で設計されたプローブの小さいアレイ(長さ5〜30 塩基)が用いられ得る。サブアレイ当たり10の標識プローブの異なるプールでイ ンテロゲートされる場合、それぞれ10プローブを有する10のサブアレイのアレイ により200塩基のチェックが可能になり、ライゲーションにより接続された2つ の塩基のみが得点付けされると考えられる。誤対合がハイブリッド全体で識別さ れる条件下で、プローブを1以上の塩基で置換して同数のプローブを用いてより 長い標的をカバーすることができる。長いプローブを用いることによって、標的 は、試料中のDNAの残りから増幅または単離することなく直接インテロゲート され得る。また、いくつかの標的が一つの試料中で同時に分析(スクリーニング )され得る。得られた結果が突然変異(または病原体)の発生を示す場合、さら なるプローブのプールを用いて突然変異の型または病原体のサブタイプを検出す ることができる。これは、患者の小画分のみで感染または突然変異を有すること が予測されるので、予防診断において非常に経済的であり得る方法の望ましい特 徴である。 実施例に記載された方法において、種々の検出方法、例えば、放射能標識、蛍 光標識、酵素または抗体(化学発光)、光散乱によって検出可能な巨大分子また は粒子またはインターフェロメトリー法が使用され得る。実施例13 オクタマーおよびノナマーを用いた標的の配列決定 オクタマーおよびノナマーオリゴヌクレオチドのハイブリダイゼーションから 得られたデータから、ハイブリダイゼーションによる配列決定が非常に高い精度 をもたらすものであることが分かる。この実験では、 既知の配列を用いることにより、一連の連続重複成分であるオクタマーおよびノ ナマーオリゴヌクレオチドを予測した。 完全に対合するオリゴヌクレオチドに加えて、誤対合オリゴヌクレオチド(そ の内部または末端の誤対合がオリゴヌクレオチドによって形成された2本鎖内に 生じる)および標的を調べた。これらの分析では、最も低い実用温度を用いてハ イブリダイゼーション形成を最大化した。同一またはそれよりも低い温度で洗浄 を行って、誤対合対対合オリゴヌクレオチド/標的ハイブリダイゼーションのよ り大きい解離速度を利用することによって最大識別を確保した。これらの条件が 全ての配列に適用可能であることが示されるが、絶対ハイブリダイゼーション収 量は配列依存性であることが示される。 仮定され得る最小不安定化誤対合は、単純な末端誤対合であり、そのため、ハ イブリダイゼーションによる配列決定の試験は、完全な対合オリゴヌクレオチド /標的2本鎖を末端誤対合オリゴヌクレオチド/標的2本鎖から識別する能力で ある。 ドットブロットフォーマットにおける105のハイブリダイズするオリゴヌクレ オチドの102についての識別値は2よりも大きく、配列の高度に正確な作製を可 能にする。また、この系は、ハイブリダイゼーション形成およびハイブリダイゼ ーション強度における配列の効果の分析も可能にする。 PCRによって調製されたヒトインターフェロン遺伝子の既知部分の100塩基 対、すなわち100bpの標的配列を、既知配列の105オリゴヌクレオチドプローブの 標的核酸へのハイブリダイゼーションから得られた結果を用いて作製した。用い たオリゴヌクレオチドプローブは、その配列が完全に標的と相補的である72のオ クタマーオリゴヌクレオチドおよび21のノナマーオリゴヌクレオチドを含んでい た。93のプローブのセットにより、1または2の塩基で置換された標的配列の連 続重複フレームが得られた。 ミスマッチの影響を評価するため、少なくとも一方の末端にミスマッチを含有 しているその他の12のプローブについて、100bpの試験標的配列とハイブリダイ ズさせたとき、ハイブリダイゼーションを試験した。標的とする末端ミスマッチ を有する12のプローブと、この12のオリゴヌクレオチドが4つの対照DNAと完全 にマッチした二本鎖ハイブリッドを形成するように選択した4つの別の対照核酸 配列とのハイブリダイゼーションもまた試験した。こうして、実験で使用した各 オリゴヌクレオチドについて、内部ミスマッチ、末端ミスマッチおよび完全にマ ッチしたオリゴヌクレオチドの二本鎖、ならびに標的とのハイブリダイゼーショ ンを評価した。試験8量体および9量体オリゴヌクレオチドとのハイブリダイゼ ーションに対するDNA標的の絶対濃度の影響を、同時増幅させたプラスミドDNA内 で唯一出現する非標的部位への別のオリゴヌクレオチドプローブのハイブリダイ ゼーションを検出して、標的DNA濃度を確定することによって、決定した。 この実験の結果によって、標的または対照DNAに完全にマッチする相補的配列 を含有するオリゴヌクレオチドの全部がミスマッチを有するオリゴヌクレオチド よりも強くハイブリダイズすることが示された。この結論に至るため、各プロー ブについてHpおよびD値を試験した。Hpは試験標的とオリゴヌクレオチドプ ローブとの間で形成されたハイブリッド二本鎖の量と定義する。105プローブに ついて得られたハイブリダイゼーションについて0から10までの数値を指定する ことによって、105プローブの68.5%が2より大きいHpを有することが明らか であった。 1)試験オリゴヌクレオチドと標的または対照核酸との間で形成された完全に マッチする二本鎖を含有するドットと2)同一のオリゴヌクレオチドと標的また は対照核酸内の別の部位との間で形成されたミスマッチを含有するドットとの間 のシグナル強度の比率としてDを定義したとき、差異がある数値(D)が得られ た。数値Dの変動は1)バックグラウンド値に対するシグナルの可視化を可能に するハイブリダイゼーション効率の摂動、または2)試験オリゴヌクレオチドと 標的の間に見られるミスマッチのタイプ、のいずれかに起因する。この実験で得 られたD値は試験した102個の105オリゴヌクレオチドプローブについて2〜40で あった。102個のオリゴヌクレオチド群の全体について計算したDによれば、 平均Dが10.6であった。 オリゴヌクレオチド/標的二本鎖が末端ミスマッチを示すものが20例あった。 これらの5例において、Dは10より大きかった。これらの例における大きなD値 はおそらく最も安定な(G/TおよびG/A)末端ミスマッチ以外のものに起因するハ イブリダイゼーションの不安定化によるものと考えられる。その他の可能性は、 オリゴヌクレオチドまたは標的のいずれかの配列にエラーがあったことである。 低Hpを有するプローブに対する標的のエラーは可能性としては排除された。 なぜならば、こうしたエラーがあればその他の8個のオーバーラップするオリゴ ヌクレオチドのハイブリダイゼーションに影響するはずであるからである。その 他のオーバーラップするオリゴヌクレオチドについて配列のミスマッチに起因す る明らかな不安定性はなかったので、標的配列が正しいことを意味している。7 個の新しく合成されたオリゴヌクレオチドのハイブリダイゼーションを再試験し た結果、オリゴヌクレオチド配列のエラーの可能性は排除された。7個のオリゴ ヌクレオチドの内、ただ1個のみがさらによいD値の結果を示した。低ハイブリ ッド形成値はハイブリッドの不安定性またはハイブリッド二本鎖の形成不能性に よるものと思われる。ハイブリッド二本鎖の形成不能性は1)選択したプローブ の自己相補性、または2)標的/標的自己ハイブリダイゼーションのいずれかの 結果と考えられる。プローブが自己相補性であれば、オリゴヌクレオチド/標的 ハイブリッド二本鎖形成よりもオリゴヌクレオチド/オリゴヌクレオチド二本鎖 形成が優先されるはずである。同様に、標的が自己相補性であれば標的/標的会 合が優先されるか、または内部パリンドロームを形成するはずである。これらの 可能性を評価する際、プローブの分析から、問題のプローブが相互にハイブリッ ドを形成しないことが明らかだった。さらに、標的/標的ハイブリダイゼーショ ンの寄与を試験する際に、問題のオリゴヌクレオチドプローブの1つが同一の標 的を含有する2種のDNAと非効果的にハイブリダイズすることが判定された。2 種のDNAが同一の標的配列について自己相補性領域を有する可能性は低いので、 標的/標的ハイブリダイゼーションは低ハイブリダイゼーション形成に寄与しな かったという結論が導かれる。このように、これらの結果は、特定のオリゴヌク レオチドについて観察された低ハイブリッド形成の原因がハイブリッドの不安定 性であってハイブリッド形成の不能性ではないことを意味している。この結果は 、低ハイブリッド形成がある種のオリゴヌクレオチドの特定の配列に起因するこ とをも意味している。さらに、この結果は、8量体または9量体オリゴヌクレオ チドを使用するならば、配列を作製するのに信頼できる結果が得られるであろう ことを意味している。 これらの結果は、記載した方法を使用して、構成オリゴヌクレオチドの最大且 つ独特のオーバーラップによって、任意の特定の標的核酸の長い配列を産生する ことができることを示している。こうした配列決定方法は、個々の成分オリゴマ ーの含有量によって決まり、その頻度および位置には無関係である。 下記のアルゴリズムを使用して産生される配列は高忠実度のものである。4つ の信頼性の低い数値を含む105のハイブリダイゼーション数値から産生された配 列が正しかったという事実が示すように、このアルゴリズムはハイブリダイゼー ションドットからの偽陽性シグナルに寛容性である。ハイブリダイゼーションに よる配列決定のこの忠実度は、短いオリゴヌクレオチドのハイブリダイゼーショ ンの「オールオアナン(all or none)」速度論、ならびに完全にマッチする二本 鎖とミスマッチ二本鎖との間に存在する二本鎖の安定性の差異に起因する。マッ チおよび末端ミスマッチ二本鎖の二本鎖の安定性の比率は二本鎖の長さが減少す るにつれて増加する。さらに、結合エネルギーは二本鎖の長さが減少するにつれ て減少し、これは低下したハイブリダイゼーション効率をもたらす。しかし、得 られた結果は、ハイブリダイゼーションによって配列決定する高度に正確な方法 を産生するために、8量体ハイブリダイゼーションが二本鎖の安定性と識別に影 響する因子を平衡させることを示している。他の例で得られた結果は、6、7ま たは8ヌクレオチドのオリゴヌクレオチドが0.5kb(6量体)、2kb(7量体)ま たは6kb(8量体)の標的に対する信頼できる配列を作製するために効果的に使 用することができることを示している。完全ゲノム配列を作製するために、長い 断片の配列をオーバーラップさせることもできる。 実施例14 得られたデータの分析 DOTSプログラム(Drmanacら、1993)などの画像分析プログラムによって画像 ファイルを分析し、例えばSCORESプログラム(Drmanacら、1994)において、関 与する統計関数によって算定および評価する。シグナルの分布から、シグナルの +/−出力への変換について最適閾値を決定する。検出された標識の位置から、 その標識位置に対応する固定化および標識されたプローブの既知の配列を結合さ せることによって、その断片からのF+Pヌクレオチド配列が決定されるはずで ある。これによって、コンピュータでの演繹によって決定されたオーバーラップ するF+P配列から、ヒト染色体などの起源分子の完全核酸配列または配列サブ 断片を組み立てることができるはずである。 1つの選択肢は配列組み立てプロセス中にハイブリダイゼーションシグナル、 例えばスコアを+/−出力に変換することである。この場合、組み立ては非常に 高スコアのF+P配列、例えばF+P配列AAAAAATTTTTTから開始する。4つの可 能なオーバーラッププローブ、AAAAATTTTTTA,AAAAATTTTTT,AAAAATTTTTTCおよ びAAAAATTTTTTG、ならびに開始点が異なっているその他の3つのプローブ(TAAA AATTTTTT,;CAAAAATTTTTT,;GAAAAATTTTTT)のすべてのスコアを比較して、3つの 結論が確定する:(i)出発プローブおよび4つのオーバーラッププローブの中の 1つのみがその他の6つのプローブに比較して顕著に陽性のスコアである場合は 、1つのヌクレオチドについて右方向にAAAAAATTTTTT配列が延長されるはずであ る;(ii)出発プローブ以外にはどのプローブも顕著に陽性スコアでない場合は、 組み立ては停止し、配列決定されるDNA分子の末端に例えばAAAAAATTTTT配列があ る;(iii)オーバーラップおよび/またはその他の3つのプローブの中で2以上 の顕著に陽性のプローブが見られる場合、エラーまたは分枝のため、組み立ては 停止する(Drmanacら、1989)。 コンピュータでの演繹プロセスには現存するアルゴリズムを使用するコンピュ ータプログラムを利用する(例えば、Pevzner,1989;Drmanacら、1991;Labat and Drmanac,1993;を参照されたい。それぞれを参照により本明細書中に組み入れる )。 F+Pの他に、F(スペース1)P、F(スペース2)P、F(スペース3) PまたはF(スペース4)Pが判定される場合、すべてのデータセットにマッチ するようなアルゴリズムを使用して、考えられるエラーを修正するかまたは分枝 問題が存在する状況を解決する(例えば、Drmanacら、1989;Bainsら、1988;を 参照されたい。それぞれを参照により本明細書中に組み入れる)。 実施例15 2ステップハイブリダイゼーションによる配列決定 以下は本発明者によって考案された配列決定方法論の実行を記述するためのい くつかの例である。最初に、全チップを100,000,000bp程度の複雑なDNA混合物( ヒト染色体1個)とハイブリダイズさせる。ハイブリダイゼーションを実施する ためのガイドラインを例えばDrmanacら(1990);Khrapkoら(1991);およびBroude ら(1994)などの報文中で見ることができる。これらの文献はFormat 3 SBHの初期 ステップ使用するのに適切なハイブリダイゼーションの温度範囲、バッファーお よび洗浄ステップについて教示している。 本発明者は特に、供給することができる標的DNAが比較的低濃度であるため、 ハイブリダイゼーションを高塩濃度、低温(−2℃〜5℃)で数時間まで実施する ことを意図している。この目的のため、10℃で沈殿するリン酸ナトリウムバッフ ァー(Drmanacら,1990)の代わりにSSCバッファーを使用する。第2ステップが あるので、洗浄を長くする必要はなく(2,3分)、高度に複雑なDNAサンプルの配列 決定のためにハイブリダイゼーションサイクルを使用する場合には、完全に削除 することができる。標識プローブでの第2ハイブリダイゼーションステップに続 けることができるように、ハイブリダイゼーションおよび洗浄工程について同一 のバッファーを使用する。 各アレイ、例えば8×8mmアレイについて、簡単な自動器具を使用した適当な洗 浄の後、標識プローブ、例えば6量体1個を添加することとする。96チップ(tip )または96ピンの器具を使用して、これを42操作実施する。科学文献に既に記載 されているようにして、やはりある範囲の識別条件を利用することができる。 本発明者は特に以下の条件の使用を意図している。第1に、標識プローブを添 加して、低温(0〜5℃)で(添加オリゴヌクレオチドが高濃度なので)数分間だ けインキュベートした後、F+Pの長さに応じて温度を3〜10℃に上昇させ、そ して洗浄バッファーを添加する。この時、使用する洗浄バッファーはどの連結反 応にも適合するものである(例えば塩濃度範囲が100mM)。リガーゼを添加後、迅 速な連結(30分朱満)およびその後の完全マッチおよびミスマッチハイブリッド の識別を可能にするため、温度を再び15〜37℃に上昇させる。 Pontius & Berg(1991、参照として本明細書中に組み入れる)によって記載さ れたように、Format 3 SBHにおいて使用するために、カチオン性界面活性剤の使 用も意図される。これらの著者はDNAの再生において、2つの単純なカチオン性 界面活性剤、ドデシル−およびセチルトリメチルアンモニウムブロマイド(DTAB およびCTAB)の使用を記載している。 DTABおよびCTABは第4級アミン、テトラメチルアンモニウムブロマイド(TMAB )の変形で、メチル基の1つが12炭素数(DTAB)または16炭素数(CTAB)のアル キル基のいずれかで置換されている。TMABはテトラメチルアンモニウムイオンの ブロマイド塩であり、核酸の再生実験において、G-C含量の偏りにともなう融解 温度を減少させるために使用される試薬である。DTABおよびCTABは構造上ドデシ ル硫酸ナトリウム(SDS)に類似しており、SDSの陰性荷電した硫酸塩が陽性荷電 した第4級アミンで置換されている。SDSは非特異的結合を減少させ、そしてヌ クレアーゼを阻害するために、ハイブリダイゼーションバッファーとして普通に 使用されるが、再生の速度には大きくは影響しない。 連結プロセスを使用する時、標識プローブとともに、またはバックグラウンド 値を減少させるための適当な洗浄ステップの後に、酵素を添加することができる 。どのSBH法においても使用については従来は提案されていないが、リガーゼ技 術は分子生物学の分野の中では十分確立されている。例えば、Hoodおよび共同研 究者はリガーゼが介在する遺伝子検出技法を記載しており(Landegrenら、1988) 、この方法論をFormat 3 SBHでの使用にそのまま適用することができる。Wu & W allaceもまた、2つの隣接する短い合成オリゴヌクレオチドを連結するためのバ クテリオファージT4 DNAリガーゼの使用を記載している。そのオリゴ連結反応は 50mM Tris HCl pH7.6,10mM MgCl2,1mM ATP,1mMDTTおよび5% PEG中で実施 された。連結反応ではT4 DNAリガーゼ(1単位;Bethesda Research Laborator y)の添加の前に、100℃で5〜10分加熱し、その後0℃に冷却した。大部分の連 結反応を30℃で実施し、100℃で5分加熱することによって停止させ た。 ハイブリダイズした隣接の、または連結した長さ(F+P)のオリゴヌクレオ チドを識別して検出するために適切な最終の洗浄を次に実施する。この洗浄ステ ップは、連結しなかった標識プローブの全部およびその他の化合物の全部を洗い 流すため、40〜60℃で数分間、水で実施して、最大限にバックグラウンドを低下 させる。共有結合した標識オリゴヌクレオチドであるので、検出は簡単化される (時間および低温の制約がない)。 使用する標識に応じて、各種の装置によってチップの画像化を実施する。放射 性標識については、フォスファ貯蔵スクリーン技術およびスキャナーとしてPhos phorImagerを使用することができる(Molecular Dynamics,Sunnyvale,CA)。チッ プをカセット中に入れ、フォスファスクリーンでカバーする。1〜4時間の曝露の 後、スクリーンをスキャニングし、画像ファイルをコンピュータのハードディス クに保存する。蛍光標識の検出については、CCDカメラおよびエピフルオレセン ト(epifluorescent)または共焦点顕微鏡分析を使用する。CCDカメラのピクセル( pixel)上に直接生成されたチップについて、Eggersらの記載(1994、参照として 本明細書中に組み入れる)にしたがって、検出を実施することができる。 プローブに基づくアッセイにおいて、標識された標的分子の分布を定量的に検 出して画像化する、活性固体支持体として、電荷結合素子(CCD)検出器が供用 される。これらの器具は高度な並行アッセイ、超感度検出、高スループット、積 算したデータの捕捉およびコンピュータ処理を提供するマイクロエレクトロニク スの固有の特徴を使用するものである。Eggersら(1994)は本発明のFormat 3 S BHなどのプローブに基づくアッセイで使用するためのCCDについて記載している 。これは高感度および直接のカプリング(coupling)の利用によって、数秒以内の 定量的評価を可能にする。 この積算型CCD検出手法はチップ上の分子結合現象の検出を可能にする。その 検出器はサンプルを独特に特徴づける2次元パターンを迅速に産生する。このCC Dを基礎とする分子検出器の特定の操作において、特定の生物学的プローブをCCD のピクセル上に直接固定するか、またはCCD表面に置く使い捨てのカバースリッ プに接着することができる。サンプル分子を放射性同位元素、ケミルミネセント または蛍光タグで標識することができる。 サンプルをCCDを基体とするプローブアレイに曝露するとき、Format 3の場合 は2つの相補的プローブにサンプルが結合したピクセルの位置で、光子または放 射性同位元素の崩壊産物が放射される。次に、標識サンプルからの荷電粒子また は放射線がCCDゲートに入射すると、電子ホールペアがシリコン中に産生される 。次に、電子は隣接するCCDゲートの下に集められ、連続的にディスプレーモジ ュール上に読み出される。各ピクセルで産生された光電子の数は直接これらの近 接部分での分子結合事象の数に比例する。結果として、分子の結合を定量的に測 定することができる(Eggersら、1994)。 サンプルに近接して画像化アレイを置くことによって、従来のCCDカメラに見 られるようなレンズに基づく手法よりも、回収効率が係数で10以上改善される。 すなわち、サンプル(エミッター)を検出器(画像化アレイ)の近くに接触させ るもので、これによってレンズおよび鏡などの従来の画像化光学器が排除される 。 標的分子にリポーター基として放射性同位元素が付着した時、エネルギーを持 つ粒子が検出される。マイクロ加工した検出器において、エネルギーを変更する 粒子を放出するいくつかのリポーター基が利用されて成功してきた。それらとし て32P,33P,35S,14Cおよび125Lが含まれる。低いエネルギー粒子(例えば35 S)の方がより良好な鱒像能を提供するが、高いエネルギー粒子(例えば32P) の方が最高の分子検出感度を提供する。したがって、放射性同位元素リポーター の選択は必要に応じて組合せることができる。特定の放射性同位元素標識を選択 すれば、Eggersらの記載(1994)のように、シグナル対ノイズ比(SNR)を計算す ることによって、検出の実施を予測することができる。 変法としてのルミネセント検出方法には標的分子に付着させた蛍光またはケミ ルミネセントリポーター基の使用が関与する。蛍光標識は共有結合または相互作 用によって付着させることができる。量子効率は蛍光シグナル波長におけるより も励起波長において数次数の規模で低いので、使用するCCD装置に対しては、近U V(300〜350nm)範囲に強い吸収バンドを有し、可視(500〜650nm)範囲に主要 な放射バンドを有する、エチジウムブロマイドなどの蛍光染料が最適である。 検出するルミネセンスの様相から、ポリシリコンCCDゲートはUV範囲の入射光 の寄与をはずす能力を装備しているが、蛍光リポーター基によって産生される可 視ルミネセンスに対しては高感受性である。UV励起に対するこうした固有の強い 識別によって、本明細書中に組み入れられたEggersらの報文(1994)中の方法に したがうCCDによれば、大きなSNR(100より大きい)の達成が可能となる。 プローブの検出器上への固定化については、安価なSiO2ウェハー上にハイブリ ダイゼーションマトリックスを生成させ、ハイブリダイズさせ、そして乾燥した 後、続いてこれをCCDの表面に置く。このフォーマットは、DNAのハイブリダイゼ ーションを安価な使い捨てのSiO2ウェハー上で実施し、したがってより高価なCC D検出器の再使用が可能になるので、経済的に効果的である。あるいは、供用す る(dedicated)プローブマトリックスを作製するために、CCD上に直接プローブを 固定化することもできる。 SiO2コーティング上にプローブを固定するためには、エポキシ−シラン試薬お よび標準的なSiO2修飾化学を利用して、フィルム表面に均一なエポキシド層を結 合する。次にこのSiO2表面に、エポキシド環との第2級アミンの形成によって、 アミン修飾オリゴヌクレオチドプローブを結合させる。生成するリンケージはオ リゴヌクレオチドの3塩基とSiO2表面との間での分離の際に交替し得る(rotata ble)結合を17個提供する。完全なアミンの脱プロトンを確実にし、そしてカプ リング中の2次構造の形成を最少にするため、反応を0.1M KOH中で実施し、3 7℃で6時間インキュベートする。 一般的なFormat 3 SBHにおいては、シグナルは10億ポイント毎に記録される。 全アレイ、例えば5×5mm 4000個を同時にハイブリダイズさせる必要はなく、も っと少ない数のアレイを順次使用することが可能である。 サイクルハイブリダイゼーションはハイブリダイゼーションのシグナルを増加 させるための可能な1方法である。1サイクルにおいて、固定されたプローブの 大部分が標識プローブに非相補的な尾部配列を有するDNA断片とハイブリダイズ するはずである。温度を上昇させることによって、これらのハイブリッドは融解 する。次のサイクルにおいて、これらのいくつか(約0.1%)が適切なDNA断片と ハイブリダイズし、そして別の標識プローブが連結される。この場合、両プロー ブセットについてミスマッチがあるDNAハイブリッドの識別可能な融解が同時 に発生する。 サイクルハイブリダイゼーションにおいては、T4については37℃で、または熱 安定性リガーゼについてはもっと高温で、全成分をサイクルの開始前に添加する 。次に温度を15〜37℃に低下させ、チップを10分までインキュベートし、次に温 度を37℃またはそれ以上に2,3分上昇させ、その後再び低下させる。サイクルは1 0回まで反復することができる。1変法として、サイクルさせないで、最適な高 温側(10〜50℃)を使用し、より長い(1〜3時間の)連結反応を実施すること ができる。 本明細書に記載する操作法は比較的少数のオリゴヌクレオチドしか必要としな いので、標準的合成法及び正確なオリゴヌクレオチドのスポッティングを使用し て、複雑なチップの製造が可能である。例えば、7量体オリゴの全部が合成され れば(16384プローブ)、14量体256,000,000のリストを判定することができる。 本発明方法の重要な1変法は、塩基アレイについて2以上の異なる標識プロー ブを使用するものである。これは2つの目的を念頭に置いて実行することができ る;多重系にすることによって、別々にハイブリダイズするアレイの数を減少さ せる;または3×6または3×7などのさらに長いオリゴ配列のリストを判定するこ とができる。この場合、2つの標識を使用すれば、陽性部位が両標識の十分なシ グナルを有するに違いないので、3つの連続するオリゴヌクレオチドの特定化が ほとんど完全である。 さらに別の追加の変法はyが1〜4であるBxNyプローブを含有するチップ を使用するものである。これらのチップによれば異なるフレームの配列の読み取 りが可能になる。これは標識プローブの適切なセット、またはFおよびPプロー ブの両方が非特異的末端部位(すなわちなんらかの末端縮重要素)を有するもの 、を使用することによって達成することができる。固体支持体に一定の配列を有 するプローブを連結するためのリンカーの一部として、普遍的塩基を使用するこ ともできる。これによってプローブがさらにハイブリダイゼーションに利用しや すくなり、そして構築物がさらに安定になる。プローブが5塩基であれば、リン カーとして、例えば3塩基の普遍的塩基を使用することができる(図4)。実施例16 ハイブリダイゼーションデータからの配列の決定 もしも所定のオーバーラップする(N−1)量体が2回以上重複する場合は、 配列の組み立てが妨害されるかもしれない。この場合、配列を延長する際に、最 後のヌクレオチドが異なっている2つのN量体のいずれかが使用されるかもしれ ない。この分岐点が配列の明確な組み立ての制約となる。 標的核酸の完全配列を産生するため、標的核酸とハイブリダイズする既知のオ リゴヌクレオチドの配列の再組み立ては、場合によっては達成されないことがあ る。これは、標的核酸がハイブリダイズのために使用されるオリゴヌクレオチド のサイズとの関連で適切なサイズの断片になっていない場合に、なんらかの情報 が失われることによる。情報の喪失の量は配列決定する標的の長さに比例する。 十分短い標的を使用すれば、それらの配列を明確に決定することができる。 ある長さのDNAにそって分布する、配列の組み立てを妨害することがある重複 配列の確率を算出することができる。この誘導には配列の構成に必要なパラメー ター:配列サブ断片(SF)の定義の導入が必要である。サブ断片配列は、標的核 酸の配列のいずれかの部分が標的配列内で2回以上反復している(N−1)量体 で開始および終結している場合の配列である。したがって、サブ断片は本発明の 方法での配列の組み立てプロセス中に2つの分岐点の間に産生される配列である 。全サブ断片の合計は、オーバーラップする短い末端があるので、実際の標的核 酸よりも長い。サブ断片はその末端および開始部で共通する(N−1)量体を有 するので、一般的にその他の情報がないと線状には組み立てられない。各核酸標 的について、その反復される(N−1)量体の数に応じて、異なる数のサブ断片 が得られる。この数はN−1の値および標的の長さに応じて決まる。 この2つの因子の相関関係を評価することで確率を算出することができる。長 さN−1または平均距離A0のオーバーラップ配列を使用して陽性N量体の序列 化が達成される場合、Lf塩基の長さの断片のN−1は以下の等式によって与え られる: Nsf=1+A0X K X P(K,Lf) ここでKは2以上であり、P(K,Lf)はLf塩基の長さの断片上にN量体が K回出現する確率を表す。また、任意の与えられた配列についてN量体の含量か らサブ断片を形成することができるコンピュータプログラムについて下記の実施 例18に記載する。 サブ断片の数は一定の長さのプローブについて、断片の長さが増加するにつれ て増加する。得られるサブ断片はそれらの中にあって独特の序列とは限らない。 完全ではないが、この情報は配列の比較分析および機能性配列の特徴の認識のた めに非常に有用である。このタイプの情報は部分配列とも称される。部分配列を 得るための別の方法は所定の長さのオリゴヌクレオチドプローブのサブセットの みを使用するものである。 あるランダムDNA配列について理論に従う予測配列とコンピュータシミュレー ションとの間には比較的良好な一致があるようである。例えば、N−1=7につ いては、[1個の8量体または16個の5'(A,T,C,G)B8(A,T,C,G)3’のタイプの10 量体群を使用して]200塩基の標的核酸が平均3個のサブ断片を有する。しかし 、平均値に対する分散によって、4個以上のサブ断片を持つ標的が2000個中1個 未満となるためには、標的核酸のライブラリーが500塩基対の挿入物を持つよう にしなければならない。このように、ランダム配列の長い核酸の配列決定の理想 的ケースにおいては、標的核酸の十分短い挿入物を有する典型的なライブラリー を使用することができる。こうした挿入物について、本発明の方法によって個々 の標的を再構築することが可能である。次に、確定された個々の挿入配列のオー バーラップによって、大きな核酸の全配列が得られる。 非常に短い断片、例えば8量体プローブについて50塩基のものの必要数を減少 させるため、クローニングまたはランダムPCRのようなすべてのランダムDNA断片 化プロセス中に存在するオーバーラップ断片に含まれる情報を使用する。短い物 理的(physical)核酸断片のプールを使用することも可能である。1メガ塩基の配 列決定のために、8量体または5'(A,T,C,G)N8(A,T,C,G)3’のような11量体を使 用すると、50bp断片20,000個は必要でなく、2,100サンプルのみで十分である。 この数は、ランダム7kbクローン(基本ライブラリー)700個、500bpの20クロー ン(サブ断片序列化ライブラリー)1250プール、およびジャンピング(または類 似の)ライブラリーから150クローンで構成される。開発された アルゴリズム(実施例18参照)により、これらの記載したサンプルのハイブリダ イゼーションデータを使用して、配列を再生する。 実施例17 アルゴリズム この実施例では、ある出発核酸配列の別々にランダムに確定された断片の最少 数におけるk要素数の構成成分から、4文字のアルファベットで書かれた長い配 列を産生するためのアルゴリズムについて記載する。ここでKはオリゴヌクレオ チドプローブの長さである。このアルゴリズムは主としてハイブリダイゼーショ ンによる配列決定(SBH)プロセスにおいて使用することを意図している。この アルゴリズムはサブ断片(SF)、情報断片(IF)および情報断片を確定するための 物理的核酸配列のプールの使用確率を基礎としている。 記載したように、サブ断片は標的核酸中のK−1オリゴマー配列の反復の結果 である組み立てプロセス中の分岐点に起因するようである。サブ断片は配列中に 出現するいずれかの2つの長さK−1の要素数の反復間に見られる配列断片であ る。K−1要素の多重出現は配列産生のプロセスにおいてK要素のオーバーラッ プを序列化するのを妨害する原因である。妨害は配列をサブ断片のまま残すこと になる。こうして、その序列が唯一のものとして決定されていない、分岐間の明 確なセグメントを配列サブ断片と称する。 情報断片とはオーバーラップする物理的配列断片の最も近い末端によって決定 される、ある配列の断片として定義される。 一定の数の物理的断片を情報断片を定義する可能性を失わないでプールするこ とができる。ランダムにプールされる断片の全長は配列決定プロセスにおいて使 用するkタプルの長さによって決まる。 このアルゴリズムは2つの主なユニットで構成される。第1の部分はある配列 中に含まれるkタプルのセットからのサブ断片の産生のために使用される。サブ 断片は一定のサイズの物理的核酸配列のコード領域内かまたは長い核酸配列内の 確定された情報断片内で産生することができる。両タイプの断片は基本的ライブ ラリー中の1つである。このアルゴリズムでは基本的ライブラリーの情報断片の kタプルの含有量の決定、すなわち配列産生プロセスにおいて使用される情報断 片の調製については記載しない。 このアルゴリズムの第2の部分では、基本的ライブラリーの核酸断片の完全配 列を再生する目的で、得られたサブ断片の線状序列を決定する。この目的のため 、出発配列のランダムにプールされた断片で作られた、第2の序列化ライブラリ ーを使用する。このアルゴリズムは完全なメガベースプラス(megabaseplus)配列 を再生するために、基本的断片の配列を組合せるステップは含んでいない。これ は情報断片の産生に必須の基本的ライブラリーの断片のリンクアップ(link-up) を使用して達成することができる。あるいは、これは、共通の末端配列の存在に 基づくオーバーラップの検索を使用して、このアルゴリズムによって基本的ライ ブラリーの断片の配列を産生した後に、達成することができる。 このアルゴリズムには、基本的および序列化ライブラリーの核酸配列中の所定 のkタプルの出現数の認識も必要ではなく、また断片の末端にどのkタプルが存在 するかの情報も必要でない。このアルゴリズムは各種の長さのkタプルの混合成 分を使用して操作する。このアルゴリズムの概念によれば、偽陽性および偽陰性 kタプルを含有するkタプルセットを使用して操作することが可能になる。特定の 場合においてのみ、偽kタプルの含量が産生される配列の完全性および正確性に 主として影響する。このアルゴリズムはシミュレーション実験におけるパラメー ターの最適化のため、および実際のSBH実験における配列の産生、例えばゲノムD NA配列の産生のために、使用することができる。パラメーターの最適化において 、実用的で便利な断片のためのオリゴヌクレオチドプローブ(kタプル)の選択 、および/または確定されたプローブのための最適長さおよび断片の数の選択は 特に重要である。 アルゴリズムのこの部分はkタプルの含量からの配列の産生プロセスにおいて 、中心的役割を有している。これは最大オーバーラップによるkタプルの独特の 序列化に基づいている。配列の産生における主な障害は特定の反復配列ならびに 偽陽性および/または偽陰性kタプルである。アルゴリズムのこの部分の目的は 正しい配列を有する最少数の可能な最長のサブ断片を得ることである。アルゴリ ズムのこの部分は1つの基本的ステップといくつかの制御ステップで構成される 。 ある種の情報は主なサブ断片の全部が産生された後でないと使用することができ ないので、2段階プロセスが必要である。 配列の産生の主な問題は、定義上、特定のkタプルの出現の数に関する情報を 持たない要素含量から反復配列を得ることである。全アルゴリズムの概念は基本 的にこの問題の解決如何による。原則的に、2つの相反する手法がある:1)反 復配列を最初に、pSFの産生プロセスにおいて得るか、または2)反復配列を後 に、サブ断片の最終の序列化プロセスにおいて得る。第1の場合、pSFは過剰の 配列を含有し、第2の場合は配列が不足して含有される。第1の手法は産生され た過剰の配列の除去が必要であり、そして第2では最終の配列の組み立てプロセ スにおいて、サブ断片のどれかを複数回使用させる必要がある。 kタプル(k-tuple)のユニークなオーバーラップに関する規則の厳密度における 対する2つの手法の差異。厳密度が低い方の規則では、kタプルxの最も右側のk -1末端が、kタプルYの最も左側の末端上にのみ存在する場合にかぎって、kタ プルxがkタプルYと曖昧さのない(unambiguously)最大のオーバーラップを生じ るとみなす。この規則によれば、反復配列の発生および余分な配列の形成は許容 される。 第2の手法で使用される、厳密度が高い方の規則では、次のような更なる条件 が追加され、kタプルXの最も右側のk-1末端が、kタプルYの最も左側の末端上 にのみ存在し、かつkタプルYの最も左側のk-1末端が、kタプルX以外のいずれ のkタプルの最も右側の末端上にも存在しない場合にかぎって、kタプルXがkタ プルYと明確に最大のオーバーラップを生じるとみなす。この厳密度が高い規則 に基づくアルゴリズムの方が単純であり、本明細書中では、これについて説明す る。 所定のサブ断片の伸長プロセスは、含まれる最後のkタプルの右側k-1末端がい ずれのkタプルの左側末端上にも存在しないかまたは2つ以上のkタプル上に存在 する場合に停止させる。これが唯一のkタプル上に存在する場合、規則の第2の 部分について調べる。このとき、直前に組み込まれたkタプルのほかに、それと 異なるkタプルも存在するのであれば、所定のサブ断片の組み立ては、直前に組 み込まれたkタプルの最も左側の位置までとし、そこで組み立てを停止させ る。このようなほかのkタプルが存在しないのであれば、ユニークなk-1オーバー ラップの条件が満たされたとみなし、所定のサブ断片を右側に要素1個分延長さ せる。 こうした基本的な規則のほかに、異なる長さのkタプルを使用できるようにす るために、補助的な規則を使用する。最大のオーバーラップは、オーバーラップ 対の短い方のkタプルのk-1の長さとする。pSFの発生は、ファイルから得られる 最初のkタプルを出発物質として行われる。このファイルにおいて、kタプルは、 核酸配列中の順序とは関係なくランダムに出現する。従って、ファイル中の最初 のkタプルは、必ずしも、配列の最初の部分や特定のサブ断片の開始端に存在し なくてもよい。サブ断片の発生プロセスは、先に記載の規則により規定されるユ ニークなオーバーラップを利用したkタプルの順序づけ(ordering)によって行う 。各使用済みkタプルはファイルから除去する。組み込まれた最後のkタプルと 曖昧さのない状態でオーバーラップする更なるkタプルが存在しなくなった時点 で、サブ断片の組み立てを停止し、別のpSFの組み立てを開始する。ほとんどの サブ断片の発生は、実際の開始端から始まるわけではないので、形成されたpSF をkタプルファイルに追加し、これを、より長いkタプルとみなす。もう1つの可 能性のある方法としては、最初のkタプルから両方向にサブ断片を伸長させる方 法が挙げられる。このプロセスは、更なるオーバーラップが行えなくなったとき 、すなわち、いずれのサブ断片の伸長をも行えなくなったときに終了する。 pSFは、3つのグループ:すなわち、1)完全なkタプルセットの場合における、 最大の長さを有する正確な配列のサブ断片、2)不完全なセットおよび/またはい くつかの偽陽性(false positive)のkタプルを含むセットに対して最大で曖昧さ のないオーバーラップ規則を適用したことに起因して生じる短いサブ断片、およ び3)不適切な配列のpSFに分けることができる。2)の場合のセットの不完全さは 、ハイブリダイゼーション試験の偽陰性(false negative)の結果、およびkタプ ルの不適切なセットの使用に起因するものである。これらは、偽陽性および偽陰 性のkタプルによって形成され、a)誤って結合されたサブ断片、b)不適切な末端 を有するサブ断片、c)偽陽性のkタプルから生じる偽最小(false minimal)のサブ 断片であると考えられる。 偽陽性のkタプルを考慮した場合、2つ以上の誤った塩基を含有するかまたは 中央部に1つの誤った塩基を含有するkタプルが存在する可能性、および末端に 誤つた塩基を有するkタプルが存在する可能性がある。短いか、間違っているか 、または誤って結合されたサブ断片の発生は、後者のkタプルによって引き起こ される。前者の2種のkタプルは、kタプルの長さと等しい長さを有する間違った pSFとなる。 偽陰性のkタプルが1つ存在する場合、最大のオーバーラップが不可能なため 、pSFが発生する。最も左側または最も右側の末端に間違った塩基を有する偽陽 性のkタプルが1つ存在する場合、曖昧さのないオーバーラップが不可能なため 、pSFが発生する。共通のk-1配列を有する偽陽性および偽陰性のkタプルが両方 ともファイル中に存在する場合、発生するpSFのうちの1つには、関連する末端 に間違ったkタプルが含まれる。 配列中に誤りの含まれるサブ断片を修正するプロセス、および曖昧さがない状 態で結合されたpSFの連結は、サブ断片の発生の後、サブ断片の順序づけのプロ セスで行う。誤つて結合されたpSFの切断、および曖昧さのない結合のpSFによる 最終サブ断片の形成からなる第1のステップについて、以下に説明する。 誤って結合されたサブ断片の生成には、2つの場合が考えられる。第1の場合 は、間違ったkタプルが、長さk-1の反復配列のアセンブリー中の箇所に出現する ときに誤りを生じる。第2の場合は、反復配列がk-1よりも短い。このような状 況は、2つの変種(variant)のそれぞれで起こる可能性がある。第1の変種では 、こうした反復配列のうちの1つが、断片の末端に現れる。第2の変種では、断 片中の任意の位置にこうした反復配列が現れる。第1の変種が生成するには、フ ァイル中にいくつかのkタプルが不足し(偽陰性)、誤った結合が形成される必要 がある。第2の変種が生成するには、ファイル中に偽陰性のkタプルと偽陽性のk タプルの両方が存在する必要がある。k-1配列の反復を考慮すると、いずれかの 末端が内部で反復される場合にはkタプルが1つだけ欠損していれば十分である 。厳密な内部反復を起こすには、2つの欠損が必要である。その理由は、配列の 末端は、情報としては、偽陰性kタプルの無限線形アレイとみなすことができる からである。「k-1よりも小さい場合」には、2つまたは3つの特定の間違った kタプルを必要とする長さk-2の反復配列だけが考慮の対象となるであろう。こう したものだけが実際の実験で検出され、他のものが出現する頻度はかなり少ない 可能性が強い。 反復配列が断片の末端に出現しない場合、誤って結合されたサブ断片を識別す るために、より厳密な規定がなされる。このような状況では、更に2つのサブ断 片を検出することが可能である。そのうちの1つは最も左側の末端上に、他方は 、最も右側の末端上に、誤って結合されたサブ断片中にも存在するk-2配列を含 む。反復配列が断片の末端に存在する場合、サブ断片の生成に誤りを引き起こす k-2配列を最も左側の末端または最も右側の末端に含有するサブ断片は1つだけ 存在する。 誤って結合されたサブ断片の、切断による除去は、次のような共通の規則に従 って行われる。任意のサブ断片の長さk-2の最も左側または最も右側の配列が任 意の他のサブ断片中に存在する場合、このサブ断片を、それぞれk-2配列を含有 する2つのサブ断片に切断する。この規則は、反復k-1配列の箇所に1つ以上の 偽陰性kタプルが存在する場合の反復末端のようなよりまれなケースには適用さ れない。誤って結合されたこの種のサブ断片は、オーバーラップ断片または基本 ライブラリーおよび順序づけライブラリーの両方の情報断片から得られる情報を 用いて識別することができる。更に、同じk-1配列を含有する両方の位置に2つ 以上の偽陰性kタプルが出現する場合、誤って結合されたサブ断片が残存するで あろう。このようなことが起こるには、少なくとも4つの特定の間違ったkタプ ルが必要であるため、これは非常にまれなケースであろう。一方のサブ断片の終 了端および他方のサブ断片の開始端のk-2よりも短い配列を組み合わせることに よって所定の配列が得られ場合、長さkの配列上のこれらのサブ断片を切断する ための追加規則を導入することができる。 記載の規則を厳密に適用すると、完全性はいくらか損なわれるが、アウトプッ トの精度は確保される。サブ断片の中には、誤って結合されていないにもかかわ らず、誤って結合されたサブ断片のパターンに当てはまるために切断されてしま うものがあるだろう。このようなケースはいくつか存在する。例えば、断片が、 少なくとも2つの同一のk-1配列のほかに、k-1配列中の任意のk-2配列を含有 する場合、または断片が、少なくとも2回反復されるk-2配列と、中央部に所定 のk-2配列を含有する少なくとも1つの偽陰性kタプルとを含有する場合が挙げら れる。 アルゴリズムのこの部分の目的は、pSFの数を、正しい配列を有する、より長 いサブ断片の最小数にまで低減させることである。より長いユニークなサブ断片 、または完全な配列の発生は、2つの状況下で可能である。第1の状況下では、 反復されるk-1ワードの特定の順序が関係する。いくつかのまたはすべての最大 に延長されたpSF(pSFの第1のグループ)を、ユニークに順序づけることが可能 な場合がある。例えば、断片S-R1-a-R2-b-R1-c-R2-E(式中、SおよびEは、断 片の開始端および終了端であり、a、b、およびcは、それぞれのサブ断片に特異 的な異なる配列であり、R1およびR2は、一列に並んで反復される2つのk-1配列 である)の場合には、5つのサブ断片が発生される(S-R1、R1-a-R2、R2-b-R1、R 1-c-R2、およびR-E)。これらは2つの方法で順序づけられる可能性がある。すな わち、上記のもとの配列またはS-R1-c-R-b-R1-a-R-Eとして順序づけられる可能 性がある。これとは対照的に、同じ数および同じタイプの反復配列を有するが順 序の異なる断片、すなわち、S-R1-a-R1-b-R-c-R-Eの場合には、すべてのサブ断 片を含有する他の配列が存在しない。このタイプの例は、pSFの発生プロセスの 後でのみ、識別可能である。これらは、pSF発生のプロセスに2つのステップが 必要であることを示している。ファイル中に偽陰性および/または偽陽性のkタ プルが含まれる場合、非反復k-1配列の位置に間違った短いサブ断片が発生する 第2の状況は、より重要である。 両方のpSFグループに対する解決策にば、2つの部分が含まれる。第1の部分 では、今までに存在しない(non-existing)偽最小のサブ断片として出現する偽 陽性のkタプルを除去する。k-aよりも長い一方の末端およびk-bよりも長い他方 の末端のいずれの末端上でもオーバーラップしない長さkのすべてのkタプルサ ブ断片を除去し、最大数の結合を形成できるようにする。本発明者らの実験では 、十分な数の偽陽性kタプルを除去するのに、aおよびbの値として2および3 がそれぞれ適切な値であった。 ユニークに結合させることのできるサブ断片の連結は、第2のステップで行う 。 結合に対する規則は、次の通りである。すなわち、2つのサブ断片の関連する終 了端または開始端でのオーバーラップ配列が、任意の他のサブ断片の開始端およ び/または終了端に存在しない場合にかぎって、2つのサブ断片を曖昧さのない 状態で結合させることが可能であるとする。 例外は、対象の対のうちの一方のサブ断片が同一の開始端および終了端を有す る場合である。このような場合には、たとえファイル中に同じ終了端を有するも う1つのサブ断片が存在したとしても、結合は許容される。このときの主な問題 点は、オーバーラップ配列を正確に規定することである。一対のサブ断片だけに 対してユニークなオーバーラップ配列が、k-2よりも短い場合、またはそのオー バーラップ配列は長さがk-2以上であるが、k-4よりも長い任意の長さのオーバー ラップ配列を有する他のサブ断片が存在する場合、結合は許容されない。また、 pSFの標準型末端、および最後の1個(または数個)の塩基を除いた後に残る末 端は、オーバーラップ配列と見なす。 このステップの後、いくつかの偽陽性kタプル(最小サブ断片として)および 間違った末端を有するいくつかのサブ断片が残る可能性がある。更に、非常にま れなケースではあるが、何種類かの特定の間違ったkタプルが特定の数だけ同時 に存在する場合には誤った結合を生じる可能性がある。こうした状況は、サブ断 片の順序づけプロセスで、および未切断の「誤って結合された」サブ断片を取り 扱う追加の制御ステップで検出および解決されるであろう。 得られる短いサブ断片には2種類ある。通常は、反復k-1配列が分配されるの で、こうしたサブ断片が互いに曖昧さのない状態で結合される可能性がある。こ れは、pSFの発生プロセスの後で行うことが可能であり、pSF発生のプロセスにお いて2ステップが必要となる好適な例である。偽陽性および/または偽陰性のk タプルの含まれるファイルを使用した場合、非反復k-1配列の部位に短いpSFが得 られる。偽陽性のkタプルを考慮すると、kタプルが1つ以上の間違った塩基を含 む場合(または中央部のどこかに1つの間違った塩基を含む場合)、ならびにkタ プルが末端上に間違った塩基を含む場合が考えられる。短くかつ間違った(また は誤って結合された)サブ断片の発生は、後者のkタプルに起因したものである 。前者のタイプのkタプルは、kタプルの長さと同じ長さを有する間違っ たpSFとなる。 アルゴリズムのうちのpSFを連結させる部分の目的は、pSFの数を、正しい配列 を有する、より長いサブ断片の最小数にまで低減させることである。k-aよりも 長い一方の末端およびk-bよりも長い他方の末端のいずれの末端上でもオーバー ラップしない長さkのすべてのkタプルサブ断片を除去し、最大数の結合を形成 できるようにする。このようにすると、偽陽性のkタプルの大半が除去される。 結合に対する規則は、次の通りである。すなわち、2つのサブ断片の関連する終 了端または開始端でのオーバーラップ配列が、任意の他のサブ断片の開始端およ び/または終了端に存在しない場合にかぎって、2つのサブ断片を曖昧さがない 状態で結合されることが可能であるとする。例外は、同じ開始端および終了端を 有するサブ断片の場合である。このような場合には、ファイル中に同じ終了端を 有するもう1つのサブ断片が存在するときに結合が許容される。ここでの主な問 題点は、オーバーラップ配列を正確に規定することである。k-1またはk-2の配列 の反復の箇所に少なくとも2つの特定の偽陰性のkタプルが存在する場合、およ び偽陽性および偽陰性のkタプルが共存する場合、いくつかのオーバーラップ配 列を破壊または「隠蔽」する恐れがあり、その結果、曖昧さはないが間違った結 合のpSFを生じる可能性がある。これを防止するには、正確さのために完全性を 犠牲にしなければならない。すなわち、k-4よりも長いほかのオーバーラップ配 列が存在する場合にはk-2よりも短い末端配列上での結合は許容されない。オー バーラップ配列は、pSFの末端により規定されるか、または最後の1個もしくは 数個の塩基を除いた末端により規定される。 非常にまれなケースではあるが、何種類かの特定の偽陽性および偽陰性のkタ プルが特定の数だけ存在する場合には、間違った末端を有するいくつかのサブ断 片が残るか、いくつかの偽陽性のkタプル(最小サブ断片として)が残るか、ま たは間違った結合を生じる可能性がある。こうした状況は、サブ断片の順序づけ プロセス中において、および未切断の誤って結合されたサブ断片を取り扱う追加 の制御ステップ中において、検出および解決される。 サブ断片の順序づけプロセスは、それらの発生プロセスと類似している。サブ 断片をより長いkタプルとみなした場合、オーバーラップ末端を介してそれらの 曖昧さのない結合を行うことによって順序づけが行われる。曖昧さのない結合に 対する情報上の基準は、基本ライブラリーの断片中で発生させたサブ断片を、こ れらの断片のセグメントを表すグループに分けることである。この方法は、関連 する結合配列を有する、より長いオリゴヌクレオチドとのハイブリダイゼーショ ンに基づくこの問題の生化学的解決法と同様である。結合配列は、基本ライブラ リー断片の適切なセグメントのkタプルセットを用いて、サブ断片として発生さ せる。関連するセグメントは、基本ライブラリーのそれぞれの断片とオーバーラ ップする順序づけライブラリーの断片により規定される。最も短いセグメントは 、順序づけライブラリーの情報断片である。より長いセグメントは、いくつかの 隣接した情報断片であるか、または順序づけライブラリーおよび基本ライブラリ ーの対応する断片のオーバーラップ部分を合わせたものである。個々のサンプル の数を減少させるために、順序づけライブラリーの断片をランダムにプールし、 ユニークなkタプル成分を決定する。 順序づけライブラリー中の多数の断片を使用することにより、非常に短いセグ メントを発生させ、これにより、k-1配列が多数回出現する可能性を低減させる 。これが、サブ断片を発生させる理由である。更に、基本ライブラリーの所定の 断片の種々の領域からなる、より長いセグメントには、反復k-1配列のいくつか は含まれない。すべてのセグメントにおいて、特定のサブ断片対に対する結合配 列(結合サブ断片)を所定の断片から発生させる。順序づけのプロセスには、次 の3つのステップが含まれる。すなわち、(1)各セグメントのkタプル成分を発生 させるステップ、(2)各セグメント中のサブ断片を発生させるステップ、(3)セグ メントのサブ断片を結合させるステップである。第1のセグメントは、基本ライ ブラリーの指定の断片のkタプル成分と、順序付けライブラリーのプールのkタプ ル成分との有意な共通部分および差分として規定される。第2の(より短い)セ グメントは、第1のセグメントのkタプル成分の共通部分および差分として規定 される。 差分および共通部分の両方に偽陽性および偽陰性のkタプルが蓄積されるとい う問題がある。開始配列からの偽陰性kタプルは、共通部分(オーバーラップ部 分)に蓄積し、偽陽性kタプルは、両方の配列中にランダムに現れるが、関連す るオー バーラップ領域には現れない。一方、いずれの開始配列に由来する偽陽性kタプ ルについても、その大多数は、共通部分には取り込まれない。これは、個々の断 片とオーバーラップする断片から得られる情報を利用することによって、個々の 断片に起因した実験誤差が減少する例である。間違ったkタプルは、他の理由に より差分の部分に蓄積する。もとの配列からの偽陰性のセットは、共通部分から の偽陽性に対して拡大され、偽陽性のセットは、間違って共通部分に含まれてい ないkタプルに対して、すなわち、共通部分にある偽陰性に対して拡大される。 開始配列に10%の偽陰性データが含まれている場合、第1および第2の共通部分に は、それぞれ19%および28%の偽陰性のkタプルが含まれるであろう。一方、基 本断片およびプールがそれぞれ500bpおよび10,000bpの長さを有する場合、数学 的な推定からは77個の偽陽性が予測されうる。しかしながら、「失われた」kタ プルのうちのほとんどを回収し、偽陽性kタプルのほとんどを除去することが可 能である。 第1に、kタプル成分の所定の対の共通部分として、指定のセグメントに対す るkタプルの基本成分を決定しなければならない。この後で、一方の末端にk-1配 列を含み、他方の末端に、基本セットの2つのkタプルの末端に出現するk-+配列 を含む、共通部分の開始kタプル成分のすべてのkタプルを組み込む。これは、差 分の部分を発生させる前に行い、これにより、このプロセスにおいて偽陽性が蓄 積されるのを防止する。これに続いて、kタプルセットの同じタイプの拡大を、 共通部分から借用されるはっきりと異なる差分に適用する。借用したすべてのk タプルを、共通部分ファイルから偽陽性として除去する。 共通部分、すなわち、共通のkタプルのセットを、(基本断片)×(順序づけ ライブラリーのプール)の各対に対して規定する。セット中のkタプルの数が有 意である場合、記載の規則に従って偽陰性を用いて拡大する。第1の差分セット は、指定の基本フラグメントから、得られた共通部分セットを差し引くことによ って得られる。偽陰性kタプルは、記載の規則に従って、共通部分セットから借 用することによって差分セットに追加し、同時に、共通部分セットから偽陽性k タプルとして除去する。基本断片がプールした断片よりも長い場合、この差分は 、更なるステップでの有用性を低減させる2つの別々のセグメントになることが できる。第1のセグメントはすべて、有意な数のkタプルを含有する(基本断片 )×(順序づけ ライブラリーのプール)の対の発生された共通部分および差分である。第2のセ グメントのkタプルセットは、第1のセグメントのすべての可能な対のkタプルセ ットを比較することによって得られる。2つの差分は、有意な数のkタプルとの共 通部分を生じる各対から定義される。共通部分断片からの利用可能な情報の大部 分は、このステップで回収される。その結果、共通部分および差分を生成させる 第3ラウンドからはほとんど情報が得られない。 (2)セグメントのサブ断片の発生は、基本ライブラリーの断片について説明し たものと同じようにして行われる。 (3)サブ断片の結合方法には、いくつかのオーバーラップ末端を有する所定の 基本ライブラリー断片から得られるサブ断片のうちの正しく連結されたサブ断片 の対を逐次決定するステップが含まれる。2つが同じ開始端を有し、2つが同じ終 了端を有する、4つの関連するサブ断片の場合、結合可能な4つの異なるサブ断片 対が存在する。一般的には、2つが正しく、2つが間違いである。正しいものを見 つけるために、所定の基本断片に対するすべての第1および第2のセグメントから 発生されるサブ断片中において、各対の結合配列の存在を調べる。偶然に生じる 配列との干渉を防止するように、結合配列の長さおよび位置を選択する。これら は、k+2以上であり、指定の対の両方のサブ断片中のオーバーラップ配列のほか に、少なくとも1つの要素2を含む。2つの結合配列が見出され、のこりの2つが存 在しない場合のみ、結合が許容される。2つの連結されたサブ断片をファイル中 の前のサブ断片と置き換え、このプロセスを周期的に繰り返す。 反復配列は、このステップで発生する。これは、いくつかのサブ断片が、連結 されたサブ断片中に2回以上含まれることを意味する。これらは、2つの異なるサ ブ断片と1つのサブ断片との結合に関わる結合配列を見出すことによって、識別 されるであろう。 pSFの組み立ておよびpSFを連結させてより大きなサブ断片にするプロセスにお いて発生する誤って結合されたサブ断片の識別は、所定の基本断片からのサブ断 片の配列が、その断片に対するセグメント中に発生されるサブ断片の配列中に存 在するかを調べる試験に基づくものである。誤って結合されたサブ断片を指摘す る不適切な結合位置からの配列は見出されないであろう。 サブ断片の順序づけにおける記載の3つのステップのほかに、誤りのない、よ り完全な配列を発生させるために、特定の配列に適用可能ないくつかの追加のス テップまたは制御ステップが必要であろう。 どのサブ断片がどのセグメントに属するかの決定は、セグメントおよびサブ断 片中のkタプルの成分を比較することによって行う。kタプル成分中に誤り(プー ル中の一次的な誤りおよびkタプルの出現頻度に起因する統計的な誤り)があると 、サブ断片を正確に分割することは不可能である。従って、「全か無か(all or none)」の分割を行う代わりに、各サブ断片に対して、所定のセグメントから生 じる確率(P(sf,s))を決定する。この確率は、kタプルの長さ、サブ断片の長さ、 順序づけライブラリーの断片の長さ、プールのサイズ、およびファイル中の間違 ったkタプルのパーセントの関数である。 P(sf,s)=(Ck-F)/Lsf 式中、Lsfはサブ断片の長さであり、Ckは所定のサブ断片/セグメント対に対す る共通kタプルの数であり、Fは、kタプルの長さ、基本ライブラリーの断片、プ ールのサイズ、および誤りのパーセントの間の関係を含むパラメータである。 特定のセグメントに帰属されるサブ断片は、冗長な短いpSFとして扱われ、曖 昧さの無い結合のプロセスに送られる。曖昧さの無い結合の定義は、この場合に はわずかに異なる。なぜなら、これは、オーバーラップ末端を有するサブ断片が 、対象のセグメントに属する確率に基づいているからである。このほか、曖昧さ の無い結合の精度は、他のセグメント中のこれらのサブ断片の結合に従うことに よって制御される。異なるセグメント中での結合の後、得られたサブ断片をすべ て一緒にまとめ、より長いサブ断片中に含まれる、より短いサブ断片を除去し、 残ったサブ断片を通常の結合プロセスに送る。配列が完全に再生されない場合、 特定のセグメントに属するかに関する、同じかまたはより厳密度の低い判定基準 を用いて、サブ断片の分割および結合のプロセスを繰り返し、続いて曖昧さの無 い結合を行う。 曖昧さの無いオーバーラップを規定する、より厳密度の高い判定基準を使用す る場合は、いくつかの情報は使用されない。完全な配列の代わりに、所定の断片 に対するいくつかの確率を規定する数個のサブ断片を得る。より低い厳密度の判 定基準を用いて、正確で完全な配列を発生させる。例えば、間違った結合など、 特定の状況下では、完全であるが正確でない配列を発生するか、または互いに結 合を生じない「モンスター(monster)」サブ断片を発生する可能性がある。従っ て、基本ライブラリーの各断片に対して、a)1つが正しい数種の解、およびb)最 も可能性の高い正しい解が得られる。また、非常にまれなケースではあるが、サ ブ断片発生プロセス中の誤りに起因して、または帰属の確率の特定の比に起因し て、曖昧さの無い解が得られないか、または最も可能性の高い解が1つ得られる 。これらのケースは、不完全な配列として残るか、またはこれらのデータを基本 ライブラリー中の他のオーバーラップ断片と比較することによって、曖昧さの無 い解が得られる。 ヒトゲノムのGC含量をシミュレートするために、40%のGCを含有するランダム に発生させた50kb配列に対して、記載のアルゴリズムを試験した。この配列の中 央部分には、種々のAll、および全長約4kbのいくつかの他の反復配列が挿入され た。in vitro SBH試験をシミュレートするために、次の操作を行って、適切なデ ータを用意した。 − 基本ライブラリーの作製をシミュレートするために、60個の5kbオーバー ラップ「クローン」の位置をランダムに規定した。 − 順序づけライブラリーの作製をシミュレートするために、1000個の500bp 「クローン」の位置をランダムに決定した。配列からこれらの断片を抽出した。 20個の断片のランダムプールを作製し、プールのkタプルセットを決定してハー ドディスクに保存した。これらのデータは、サブ断片の順序づけ段階で使用する 。同じ密度のクローンに対して、基本ライブラリー中の4百万個のクローンおよ び順序づけライブラリー中の3百万個のクローンを、全ヒトゲノムに対して使用 する。合計数7百万個のクローンは、ほとんどすべてのゲノムDNAのランダムク ローニングおよびゲルに基づく方法により配列決定を行うための数kbの長さのク ローンの数の数分の1である。 5kb断片の開始端および終了端に関するデータから、配列中にある117個の「情 報断片」を決定した。この後、単一の「情報断片」を形成するオーバーラップk タプルのセットを決定した。予め決定したリストと一致するkタプルのサブセッ ト だけを使用した。このリストには、65%の8量体と、30%の9量体と、5%の10〜1 2量体が含まれていた。サブ断片の発生および順序づけのプロセスは、これらの データに基づいて行った。 2回の実験でシミュレートされたデータについて、アルゴリズムの試験を行っ た。100%正しいデータセットを用いて、50個の情報断片からなる配列を再生さ せ(20,000bpを超える)、10%の間違ったkタプル(5%の偽陽性kタプルと5%の 偽陰性kタプル)を用いて、26個の情報断片(約10,000bp)を再生させた。 第1の実験では、すべてのサブ断片は正しく、50個の情報断片のうちの1個だけ は、配列が完全に再生されず、5個のサブ断片の形態で残った。順序づけライブ ラリーのオーバーラップ断片の位置を解析したところ、この5個のサブ断片のユ ニークな順序づけに対する情報が欠けていることが分かった。これらのサブ断片 は、オーバーラップ末端に基づいて、1-2-3-4-5およひ1-4-3-2-5の2通りで結合 されていると考えられる。サブ断片2と4の位置が入れ替わっている点だけが異な っている。サブ断片2、3、および4は比較的短い(合計で約100bp)ため、順序づ けライブラリーの断片の中にサブ断片3の領域で開始または終了するものが存在 しない確率が比較的大きく、この場合がその例であった。 実際の配列決定をシミュレーションするために、複数の実験において、いくつ かの偽(false)(「ハイブリダイゼーション」)データを入力として含めた。オリ ゴマーハイブリダイゼーション実験では、提示された状態下にて信頼できないデ ータを生じる唯一の状態は、末端ミスマッチ対完全マッチハイブリダイゼーショ ンである。それ故に、シミュレーションにおいて、実際のエレメントとはいずれ か一方の末端で一個のエレメントが異なるこれらのk−タプルのみが偽陽性であ ると考えられた。これらの「偽」セットは次の様に作られる。情報断片のk−タ プルの本来のセットに、5%偽陽性k−タプルのサブセットを加える。セットか ら無作為にk−タプルを拾って偽陽性k−タプルを作り、それをコピーし、ヌク レオチドをその始端または終端で改変する。その後、無作為に選んだ5%k−タ プルのサブセットを差し引く。この方法で、末端に間違った塩基をもつk−タプ ルで正しいk−タプルを置き換えた最も複雑な事例の統計的期待数が得られる。 記述したk−タプルのセットの作製は、10%までの偽データとなる。この値は 、コピーされ、変更され、そして削除されるk−タプルの選択の無作為度(rando mness)によって事例に応じて変化する。それにもかかわらず、このパーセントは 実際のハイブリダイゼーション実験の信頼できないデータの量の3〜4倍を越え る。導入される10%の誤差は、基本ライブラリーの断片(基本ライブラリーの情 報断片)中およびセグメント中の両方において、サブ断片の数の2倍増加となる 。偽陽性を含有するk−タプルのセットについて予測されるように、最終サブ断 片の約10%は末端に間違った塩基を有する(1次サブ断片の作製を参照)。サブ断 片の誤結合の事例も、間違った配列をもつサブ断片も、観察されなかった。オー ダリングプロセス(ordering process)で試験した26断片のうち4つの情報断片で 、完全な配列が再生されなかった。4事例のすべてで、配列は、同じセグメント 中に含有される複数の長いサブ断片および複数の短いサブ断片の形で得られた。 この結果は、アルゴリズム原理が偽データのパーセントが高くなると働くように なることを示す。 k−タプル成分からの配列の作製の成功は、完全性および正確度を使って記述 することができる。作製のプロセスで、2つの特定の状態を定義することができ る:1)情報のいくらかの部分は作製される配列に欠けるが、曖昧さがどこにあ るか、それらがどのタイプに属するかが分かっている、および、2)得られた再 生配列は、k−タプル成分が作製された配列とマッチしないが、誤りを検出する ことができない。正確なk−タプルのセットの使用におけるように、アルゴリズ ムがその理論的限界まで開発されていると仮定すれば、第1の状態のみが起こり 得る。そこで、不完全さは、曖昧さなしに配列させることができない或る特定の 数のサブ断片および単調配列の正確な長さ、すなわち完全タンデム繰返し数の決 定の問題を生じる。 偽k−タプルで、間違った配列が作製されることがある。誤りの理由は、アル ゴリズムの欠点にあるのでなく、k−タプルの所定の成分が曖昧さなしに本来の ものと異なる配列を表すという事実にある。ファイルに存在する偽k−タプルの 種類によって、3種類の誤差を定義することができる。偽陰性k−タプル(偽陽 性を伴なわない)は「欠失」をもたらす。偽陽性k−タプルは「伸長(不等交叉) 」をもたらす。偽陰性を伴なう偽陽性により、単独でまたは「欠失」と組み合わ せて「挿入」がもたらされる。サブ断片の2つの可能な開始点間の全てのk−タ プル(またはそれらの大部分)が偽陰性であると、欠失がもたらされる。配列のど の位置もみなkk−タプルにより定義されるので、共通事例における欠失の発生は 、k連続偽陰性を必要とする。(10%の偽陰性とk=8では、この状態は108エレ メントごとに起こる)。この状態は、10ゲノム等価を含有するランダムライブラ リーを使う哺乳動物のゲノム配列決定であっても滅多に起こらない。 配列の末端は偽陰性k−タプルの無限線形(endless linear)アレイと考えるこ とができるので、偽陽性k−タプルにより起こる配列の末端の伸長は「挿入」の 特殊事例である。1つのk−タプルよりも長いサブ断片を生成する偽陽性k−タ プルの1群を考えることができる。サブ断片が、オーダリングライブラリーのラ ンダムな物理的断片のように、オーバーラップした断片に作製されれば、この種 の状態を検出することができる。挿入、または欠失の代わりの挿入は、偽陽性お よび偽陰性k−タプルの特定の組合わせの結果として起こり得る。第1の事例で は、連続偽陰性の数はkより小さい。両事例ともに、複数のオーバーラップする 偽陽性k−タプルが必要である。その挿入と欠失は、偽k−タプルの数および特 異性についての要件があまりに高すぎるので、実際的な影響はなく、ほとんど理 論的な可能性に過ぎない。 最小数および偽陽性および/または偽陰性の種類の理論的要件に適合しないす べての他の状態では、k−タプル成分の誤りは作製される配列の完全性の低下を もたらすに過ぎない。 サンプルを、支持体に結合した既知配列のプローブと溶液中の標識されたプロ ーブに曝すことにより、サンプル核酸であるSBHを配列決定する。プローブリガ ーゼがプローブとサンプルの混合物中に導入され、そして、支持体が、結合プロ ーブとサンプルに沿って続けて(back to back)ハイブリダイズした標識プローブ (labeled probe)とを保持していれば、2つのプローブは化学的にリガーゼの作 用により連結されるであろう。洗浄後、化学的に連結されて支持体に結合され標 識されたプローブのみが、標識プローブの存在により検出される。アレイの特定 位置で支持体に結合されたプローブの同一性(identity)および標識プローブの同 一性を知ることにより、3つの基質のサンプルをもつフォーマット上のアレイの 1点における標識の存在により、サンプルの配列の一部分を決定することができ る。そして、連結されたプローブ対のすべての配列が最大限に重複することはな いので、サンプルの配列を再構築できるであろう。配列決定されるべきサンプル はいずれも、10塩基対("bp")の核酸断片またはオリゴヌクレオチドではない可能 性がある。サンプルは好ましくは長さで4〜1000塩基である。 プローブの長さは、10塩基未満、好ましくは長さで4〜9塩基の間である。こ の方法により、支持体−結合プローブのアレイは、所定の長さの全てのオリゴヌ クレオチドを含むことができ、または特定の試験のために選ばれたオリゴヌクレ オチドのみを含むことができる。所定の長さの全てのオリゴヌクレオチドを使え ば、中央オリゴヌクレオチドの数は4Nにより計算することができ、ここでNは プローブの長さである。実施例18 配列チップの再使用 配列決定プロセスで連結反応を使う場合、その後、通常のオリゴヌクレオチド チップはすぐには再使用できない。本発明者はこれを様々な方法で克服すること ができると考える。 第2プローブであるプローブPにリボヌクレオチドを使うことができ、その場 合、このプローブは実質的にRNAse処理で除去することができる。RNAse処理には 、特異的に1本鎖RNA 3のピリミジン残基を攻撃して隣接ヌクレオチドへのリン 酸結合を切断するエンドリボヌクレアーゼであるRNAse Aを用いることができる 。最終生成物は、ピリミジン3リン酸および末端ピリミジン3リン酸をもつオリ ゴヌクレオチドである。RNAseは補因子(cofactor)および2価カチオンなしで作 用する。 RNAseを用いるために、一般的に、Sambrookら(1989;引用により本明細書に組 み入れる)により記載されたように、チップを適切なRNAse含有バッファー中でイ ンキュベートする。37℃、10〜60分間で、8x8mmまたは9x9mmアレイ当たり30 〜50μlのRNAse含有バッファーの使用が適切である。その後、ハイブリダイゼー ションバッファーで洗浄する。 広範に応用できるのではないが、特定の実施様態では、Craigら(1989)(引用に より本明細書に組み入れる)が記載したようにウラシル塩基も使うことができる 。再使用可能なチップを得るための連結したプローブ結合の破壊は、DNAからウ ラシルを除去するウラシル−DNAグリコシラーゼである大腸菌修復酵素による消 化で達成されるであろう。 プローブ間で特異的に切断可能な結合を作製し、そして、検出後にその結合を 切断することができるであろう。例えば、これは、Shabarovaら(1991)およびDol innayaら(1988)(両文献を引用により本明細書に特定的に組み入れる)により記載 されたように、化学連結反応により達成することができる。 Shabarovaら(1991)は、臭化シアンを縮合剤として使うオリゴデオキシリボヌ クレオチドの縮合を記載する。彼らの1工程の化学連結反応では、オリゴヌクレ オチドを97℃に加熱し、ゆっくり0℃に冷却し、その後、アセトニトリル中の10 mM BrCN 1μlを加える。 Dolinnayaら(1988)は、ホスホルアミジエートとピロホスフェートのヌクレオ チド間結合をいかにしてDNA二重らせんに組み込むかを示す。彼らは、DNAの糖リ ン酸主鎖の改変のために、水溶性カルボジイミド(CDI)をカップリング剤と する化学連結法も使う。ホスホアミド結合の選択的切断は、5分間、95℃、15% CH3COOHとの接触を含む。ピロホスフェート結合の選択的切断ば、ピリジ ン−水混合物(9:1)および新しく蒸留した(CF3CO)2Oとの接触を含む。実施例19 診断−既知の変異または完全遺伝子再配列決定のスコアリング 簡単な事例では、目標は選択した既知の変異がDNAセグメントに起こるか否か を発見することであろう。この目的には、12以下のプローブ、例えば一方の対立 遺伝子に陽性な5プローブ、他方の対立遺伝子に陽性な5プローブ、および両方 に陰性な2プローブで十分であろう。サンプル当たりスコアリングすべきプロー ブ数が小さいので、多数のサンプルを平行して分析することができる。例えば、 3ハイブリダイゼーションサイクルの12プローブにより、64人の患者由来の96の 異なるゲノム遺伝子座または遺伝子セグメントが、64人の患者由来の同じDNAセ グメントを表すそれぞれ64ドットを有する12x24サブアレイを含有する1枚の6x9 インチ膜上で分析することができる。この実施例では、サンプルは64枚の96ウエ ルプレートで調製することができる。各プレートは患者一人に対応し、各ウエル は分析されるべきDNAセグメントの1つに対応する。64枚のプレートからのサン プルは、膜を4分の1ずつ4つのレプリカにスポットすることができる。 単一チャネルピペッティングによりまたは単一ピン伝達装置により(または個 々に制御したピペットまたはピンのアレイにより)、12プローブのセットを96セ グメントのそれぞれについて選ぶことができ、選ばれたプローブは12枚の96ウエ ルプレートにアレイすることができる。予め標識されていない場合は、プローブ を標識することができ、その後、4枚のプレートからのプローブをハイブリダイ ゼーションバッファーと混合し、好ましくは96チャネルピペッティング装置によ りサブアレイに加える。1回のハイブリダイゼーションサイクル後に、膜を37℃ 〜55℃、好ましくは未希釈ハイブリダイゼーションまたは洗浄バッファー中でイ ンキュベートして、先に適用したプローブを剥がすことができる。 一方の対立遺伝子に陽性なプローブを陽性とし、他方の対立遺伝子に陽性なプ ローブを陰性とする尤度(likelihood)を使って、2つの対立遺伝子のいずれが存 在するかを決定する。この重複したスコアリングスキームでは、各プローブのハ イブリダイゼーションにおける多少のレベルの誤差(約10%)は許容することがで きる。 特に低い重複性(redundancy)で十分であれば、殆どの対立遺伝子をスコアリン グするのに不完全なセットのプローブ、例えば、2つの対立遺伝子の一方がサン プル中に含まれるか否かを示す1つまたは2つのプローブを使うことができる。 例えば、4000個の8量体のセットでは、無作為に選んだ遺伝子座の2つの対立遺 伝子の一方に対して少なくとも1つの陽性なプローブを発見する可能性は91%で ある。プローブの不完全なセットは、分析サンプル中のG+C含量および他の偏り( biase)を反映するよう最適化することができる。 完全遺伝子の配列決定については、遺伝子を適切なセグメント数で増幅するこ とができる。各セグメントについて、1セットのプローブ(2〜4塩基当たり約 1プローブ)を選んでハイブリダイズさせる。これらのプローブは分析セグメン トのどこかに変異があることを同定することができる。1つ以上の変異部位が検 出されるセグメント(すなわち、これらのセグメントを含有するサブアレイ)は、 追加のプローブでハイブリダイズして、変異部位の正確な配列を見出すことがで きる。もしDNAサンプルを第2の6量体ごとに試験すれば、変異は陽性にハイブ リダイズされたプローブTGCAAAおよびTATTCCにより囲まれ、3つの陰性プローブ :CAAAAC、AAACTAおよびACTATTによりカバーされる位置に局所化されるので、変 異ヌクレオチドはその位置で正常配列に起こるAおよび/またはCでなければな らない。それらは、単一塩基変異、または塩基AA、ACもしくはCTの間に1もしく は2のヌクレオチド欠失および/もしくは挿入により改変され得る。 1つの手法は、陽性にハイブリダイズしたプローブTGCAAAをヌクレオチド1つ 右に伸長し、プローブTATTCCをヌクレオチド1つ左に伸長するプローブを選ぶこ とである。これらの8プローブ(GCAAAA、GCAAAT、GCAAAC、GCAAAGおよびATATTC 、TTATTC、CTATTC、GTATTC)により、2つの問題のヌクレオチドが決定される。 変異についての最も尤度の高い仮説を決定することができる。例えば、AはG に変異することが見出される。これらの結果を満す解は2つある。AのGによる 置き換えは、単なる改変であるか、あるいは、その改変に加えて新しく決定した Gと次のCとの間に塩基がいくつか挿入されている。もし架橋プローブによる結 果が陰性であれば、これらの選択肢は、最初に変異位置(AAGCTA)を含む少なくと も1つの架橋プローブおよび追加の8プローブ:CAAAGA、CAAAGT、CAAAGC、CAAA GG、およびACTATT、TCTATT、CCTATT、GCTATTによりチェックすることができる。 変異を求めるプローブを選ぶ方法は他にも多くある。 二倍体の場合、ヘテロ接合体を同定するために、試験サンプルとホモ接合体対 照についてスコアの個別の比較を実施することができる(上述を参照)。いくつか の連続的なプローブは、これらプローブによりカバーされるセグメントに2つの 染色体の一方で変異が起こると、ほぼ2倍小さいシグナルを有すると予測される 。実施例20 遺伝子障害および他の形質に関わる遺伝子(変異)の同定 固定したサンプルのアレイ上のより長いプローブの普遍的なセット(8量体ま たは9量体)を用いて、5〜20kbの長さのDNA断片をサブクローニングせずに配 列決定することができる。さらに、配列決定の速度は容易に約1000万塩基対/日 /ハイブリダイゼーション装置とすることができる。この性能により、科学的ま たは医学的に興味がもたれる個人由来の大画分のヒト遺伝子またはヒトゲノムを 繰り返し再配列決定することが可能となる。ヒト遺伝子の50%を再配列決定する ためには、約1億塩基対がチェックされる。これは相対的に短時間で許容できる 費用にて行うことができる。 この膨大な再配列決定能力は、複数の方法で変異および/または障害もしくは 他の何らかの形質をコードする遺伝子を同定するのに使うことができる。基本的 に、特定の障害をもつ患者の特定の組織またはゲノムDNA由来のmRNA(cDNAに変換 され得る)を出発物質として使うことができる。両方のDNA起源から、適当な長さ の分離した遺伝子またはゲノム断片をクローニング手法によりもしくはin vitro 増幅手法(例えばPCR)により調製することができる。クローニングを使 う場合、配列決定の前に、分析すべき最小セットのクローンをライブラリーから 選択することができる。特に5kbより長い少数のクローンを探し出すのであれば 、少数のプローブのハイブリダイゼーションにより効率的に行うことができる。 クローニングはハイブリダイゼーションデータの量を約2倍増加するかも知れな いが、数万に及ぶPCRプライマーを必要としなくなる。 方法の一つの変形では、遺伝子またはゲノム断片は、Hga Iのような酵素によ る制限切断により調製することができ、この酵素はDNAを次のように切断する:G ACGC(N5')ICTGCG(N10')。5塩基の突出末端は、断片ごとに異なる。1つの酵素 は、ある特定数の遺伝子に対し適切な断片を生成する。cDNAまたはゲノムDNAを いくつかの酵素を用いて別々の反応で切断することにより、目的の全ての遺伝子 を適切に切除することができる。1つの手法では、切断DNAをサイズにより分画 する。この方法により調製した(および個別にヌクレオチドを3'末端から除去し 末端の長さと特異性を増加させるエキソヌクレアーゼIIIにより任意に処理され た)DNA断片を試験管内またはマルチウェルプレート内に分散することができる。 共通部分および可変的な適当な長さの突出末端をもつ相対的に小さいDNAアダプ ターのセットから、増幅する必要のあるすべての遺伝子断片についてアダプター 対を選択することができる。これらのアダプターを連結し、その後、PCRを普遍 的プライマーにより実施する。1000アダプターから100万対を作製することがで き、かくして100万の異なる断片をアダプターの共通末端に相補性のあるプライ マーの普遍的な対により特異的に同一条件で増幅することができる。 もしDNA差異が複数の忠者で繰り返されていることが見出され、その配列改変 がノンセンスであるかまたは対応タンパク質の機能を改変することができれば、 その変異遺伝子は障害の原因となり得る。個人の有意数を特定の形質について分 析することにより、特定遺伝子の機能性対立遺伝子変化が特定形質と結び付くこ とがあり得る。 この方法は、広範な系図についての非常に高価な遺伝子マッピングの必要性を 除くために使うことができ、そしてこのような遺伝子データまたは遺伝子物質が 存在しない場合には特別な価値を有する。実施例21 遺伝子マッピングにおける単一ヌクレオチド多形性のスコアリング この適用で開示される技術は、単一ヌクレオチド多形性(SNUP)をもつゲノム 断片の効率的な同定に適切である。10個人について、クローニングによりもしく はin vitro増幅により増幅することができる既知配列の多数のゲノム断片に、記 載した配列決定方法を適用することにより、SNUPをもつDNAセグメントの十分な 数を同定することができる。多形性断片は、さらにSNUPマーカーとして使うこと ができる。これらのマーカーは、予めマッピングされる(例えばそれらはマッピ ングされたSTSを表す)かまたはそれらは以下に記載のスクリーニング手法によ ってマッピングすることができる。 SNUPは、関係ある家族または集団からのあらゆる個人について、マーカーを増 幅しそれらをサブアレイのアレイの形に配列することによりスコアリングするこ とができる。サブアレイは分析した個人から増幅した同じマーカーを含有する。 各マーカーに対して、既知の変異の診断におけるごとく、1つの対立遺伝子に対 して陽性な6つ以下のプローブのセットおよび他の対立遺伝子に対して陽性な6 つ以下のプローブのセットを選択してスコアリングすることができる。1つまた は1群のマーカーと障害との有意な関連から、関わる遺伝子の染色***置を決定 することができる。処理能力が高く費用が安いので、何千ものマーカーを何千も の人に対してスコアリングすることができる。このデータの量は、百万塩基より も小さい解像レベルで遺伝子の局所化ならびに多遺伝子性疾患に関わる遺伝子の 局所化を可能とする。局所化された遺伝子は、関係する健常者および患者由来の 特定領域を配列決定して変異をスコアリングすることにより、同定することがで きる。 PCRは、ゲノムDNAからのマーカーの増幅に好ましい。それぞれのマーカーはプ ライマーの特定対を必要とする。現存マーカーは変換することができるし、また 新しいマーカーを定義することができ、Hga Iタイプ制限酵素によりゲノムDNAを 切断し、アダプター対と連結することにより調製することができる。 SNUPマーカーは、増幅することができるし、または独立した増幅反応の数を 減少するためプールとしてスポットすることができる。この場合、1サンプル当 たりさらに多くのプローブをスコアリングすることができる。4つのマーカーを プールして12のレプリカ膜にスポットすると、48のプローブ(1マーカー当たり 12)を4サイクルでスコアリングすることができる。実施例22 DNA 断片の正体の検出および実証 制限酵素切断、クローニングまたはin vitro増幅(例えばPCR)により作製し たDNA断片は、しばしば実験で同定することができる。同定は、ゲル電気泳動上 の特定サイズのDNAバンドの存在を実証することにより実施できる。代わりに、 特定のオリゴヌクレオチドを調製して、ハイブリダイゼーションにより問題のDN Aサンプルを確認することに使うことができる。本願発明で開発した方法は、各 断片に対する特定のオリゴヌクレオチドを調製することなく多数のサンプルのよ り効率良い同定を可能とする。各断片に対する普遍セットから既知の配列に基づ いて、1セットの陽性および陰性プローブを選ぶことができる。陽性として選ば れるプローブは、通常1または数個のオーバーラップする群を形成することがで き、陰性プローブは全インサートにわたり広がる。 この技術は、STSの同定のために、YACクローン上のそれらのマッピングのプロ セスで使うことができる。それぞれのSTSを約100のYACクローンまたはYACクロー ンのプール上で試験することができる。これらの100の反応からのDNAを1つのサ ブアレイにスポットすることが可能である。異なるSTSは連続サブアレイを表す ことができる。数回のハイブリダイゼーションサイクルで、DNAサンプルのそれ ぞれに対してサイン(signature)が作製され、サインは与えられたYACクローン 中の特定のSTSの存在を必要な信頼度で検証または否定する。 独立したPCR反応数またはスポット用の独立したサンプル数を減少させるため 、いくつかのSTSを、1つの反応で同時に増幅するかまたはPCRサンプルをそれぞ れ混合することができる。この場合、1ドット当たりより多くのプローブをスコ アリングしなければならない。STSのプール化はYACのプール化とは独立しており 、単一YACまたはYACのプールについて使うことができる。異なる色で 標識されたいくつかのプローブを一緒にハイブリダイズさせるときは、このスキ ームは特に魅力的である。 サンプル中のDNA断片の存在確証に加え、数個の異なるプローブまたは1以上 のプローブのプールのハイブリダイゼーション強度を使ってDNA量を測定するこ とができる。得られた強度を既知DNA量を有する対照サンプルの強度と比較する ことにより、全てのスポットしたサンプル中のDNA量を同時に定量することがで きる。DNA断片の同定には少しのプローブのみ必要であり、そしてDNA N塩基長 として使い得るN可能性プローブ(N possible probe)があるので、この適用は、 どのDNAセグメントの同定にも十分な大きいプローブのセットを必要としない。1 000の8量体から、平均でほぼ30の完全マッチングプローブを1000塩基断片に対し 選ぶことができる。実施例23 感染症生物とその変種の同定 患者のウイルス性、細菌性、真菌性および他の寄生生物の検出のためのDNAベ ースの試験は、通常、代替物より信頼性が高くかつより安価である。DNA試験の 主な利点は、特定の株および変異株を同定することができ、その結果、さらに有 効な治療を適用できることである。2つの適用を以下に記載する。 細菌感染症における12の既知の抗生物質耐性遺伝子の存在をこれら遺伝子を増 幅して試験することができる。128人の患者からの増幅産物を2つのサブアレイ にスポットすることができ、その後、12遺伝子についての24のサブアレイを8x12 cm膜上で4回繰り返すことができる。各遺伝子ごとに、12プローブを陽性および 陰性スコアリング用に選ぶことができる。ハイブリダイゼーションを3サイクル 実施することができる。これらの試験には、はるかに小さいセットのプローブが 最も普遍的であろう。例えば、1000の8量体のセットから、1000の塩基断片で平 均30のプローブが陽性であり、そして通常、10の陽性プローブが高い信頼性の同 定に十分である。実施例9に記載したとおり、数個の遺伝子を一緒に増幅しおよ び/またはスポットすることができ、与えられたDNAの量を定量することができ る。増幅した遺伝子の量を感染のレベルの指標として使うことが できる。 他の実施例は、HIVウイルスの1つの遺伝子または全ゲノムの可能な配列決定 に関わる。ウイルスは、急速に多様化するため、最適療法の選択に多くの困難が ある。DNA断片を、64人までの患者由来の単離ウイルスから増幅し、記載した手 法により再配列決定することができる。得られた配列に基づいて、最適療法を選 ぶことができる。もし2つのウイルス型の混合物がありその1つが基本配列を有 すれば(ヘテロ接合体の場合と同様に)、そのハイブリダイゼーションスコアを 他のサンプル、特に基本ウイルスタイプのみを含有する対照サンプルのスコアと の定量的な比較により、変異体を同定することができる。サンプルに存在する2 つのウイルス型の1つの変異を起こした部位をカバーする3〜4プローブに対し て2倍小さいスコアを得ることができる(上記を参照)。実施例24 法廷のおよび親の同定 配列多形性は個人のゲノムDNAを独特なものにする。これは犯罪現場からの血 液または他の体液または組織の分析および犯罪容疑者からのサンプルとの比較を 可能とする。十分な数の多形性部位をスコアリングしてサンプルの独特なサイン を作製する。SBHは、容易に単一ヌクレオチド多形性をスコアリングしてかかる サインを作製することができる。 サンプルおよび容疑者由来のDNA断片の1セット(10〜1000)を増幅すること ができる。1つの断片を表すサンプルおよび容疑者由来のDNAを1つまたはいく つかのサブアレイにスポットし、それぞれのサブアレイを4回複製することがで きる。3サイクルで、12プローブは、各DNA遺伝子座に対し、容疑者を含む各サ ンプル中の対立遺伝子AまたはBの存在を決定することができる。サンプルおよ び容疑者のパターンをマッチングして、犯罪に関わる容疑者の発見に導くことが できる。 同じ手法を子供の両親との合致性を証明するかまたは否定するために適用する ことができる。子供および成人からDNAを調製し、多形遺伝子座を増幅すること ができ;AまたはBの対立遺伝子のパターンをそれぞれについてのハイブリダ イゼーションにより決定することができる。得たパターンの比較は陽性および陰 性対照と共に、家族関係の決定を助ける。この事例では、同定のためには対立遺 伝子の有意な部分だけが1人の親とマッチする必要がある。スコアリングした多 数の遺伝子座は、手法における統計的誤差の回避また新生(de novo)変異の効 果のマスキングを可能とする。実施例25 集団または種の遺伝的多様性および生態学的ニッチェの生物学的多様性の評価 有意な数の遺伝子座(例えば、いくつかの遺伝子または全ミトコンドリアDNA )上の対立遺伝子変異の頻度を測定することにより、ある集団の遺伝形質、歴史 および進化に与える環境の影響または疾患もしくは消滅への疑いその他に関する 結論のような、様々なタイプの結論の展開を可能とする。これらのアセスメント は、特定の既知の対立遺伝子を試験することにより、または、環境におけるわず かな変異または変異誘発物質の存在を明らかにし得る新生(de novo)変異を規 定することができるいくつかの遺伝子座の完全な再配列決定により実施すること ができる。 さらに、リボソームRNAまたは高度に保存的なタンパク質の遺伝子のような進 化的に保存されたDNA配列を再配列決定することにより、微生物世界の生物多様 性を調査することができる。DNAは環境および保存配列に対応するプライマーを 使い増幅した特定遺伝子から調製することができる。DNA断片を選択的にプラス ミドベクターにクローニングする(または、マルチウエルプレート中で1ウエル 当たり1分子のレベルまで希釈し、その後、in vitroで増幅する)ことができる 。この方法で調製したクローンは上に記載したように再配列決定することができ る。2つのタイプの情報が得られる。第1に、様々な種のカタログならびにそれ ぞれの種の個々の密度を規定することができる。情報の他の部分は、生態学的因 子または汚染が生態系に与える影響を測定するために使うことができる。それは 、汚染により或る種が根絶されたかまたは種間の存在比が変化したかを示すこと ができる。方法は化石由来DNAの配列決定にも適用可能である。実施例26 核酸種の検出または数量化 DNAまたはRNA種は、基質に固定した非標識プローブ(unlabeled probe)およ び溶液中の標識プローブ(labeled probe)を含むプローブ対を用いることによ り、検出し数量化することができる。それらの種は、標識プローブおよびリガー ゼの存在で非標識プローブへ曝露することにより、検出し数量化することができ る。特定的には、サンプル核酸主鎖上の標識プローブと非標識プローブとの連結 反応により伸長したプローブの形成が、検出すべき種の存在を示すことになる。 従って、連結してない標識プローブを除去した後に、基質のアレイの特定の点に おける標識の存在は、サンプル種の存在を示し、標識の量は種の発現レベルを示 す。 代わりに、1つ以上の非標識プローブを、溶液に導入する1つ以上の標識プロ ーブとの対の第1のメンバーとして基質上にアレイすることができる。1つの方 法では、アレイ上の標識の多重化を、識別可能な波長の蛍光を発する染料を使う ことにより行うことができる。この方式で、同定する種に特異的な標識および非 標識プローブの対をもつアレイに適用されたcDNAの混合物を、cDNA種の存在およ びその発現レベルについて試験することができる。好ましい実施様態によれば、 この手法を、cDNAの配列部分に、検出すべきcDNAの配列とオーバーラップする配 列を含んでなる非標識および標識プローブ対の対を選ぶことにより実施すること ができる。 プローブは、その組成中に標的病原性ゲノム生物との組合わせでのみ現れる選 ばれたプローブ対を含むことにより、特定の病原性生物ゲノムの存在および量を 検出するように選ぶことができる。かくして、単一プローブ対は病原性生物ゲノ ムに対して必ずしも特異的ではないが、対の組合わせでは特異的である。同様に 、cDNAを検出するか配列決定するに当たって、特定のプローブはcDNAもしくは種 の他のタイプに特異的でないことが起こり得る。それにも関わらず、明確なアレ イ位置に配置された選ばれたプローブの組合わせが特定種の存在を示す場合には 、特定種の存在および量をその結果により決定することができる。 約10kb以上のDNAをもつ感染体(infectious agents)を、ポリメラーゼ連鎖 反応(PCR)または他の標的増幅方法を使わずに、支持体結合検出チップを使っ て検出することができる。他の方法によれば、細菌およびウイルスを含む感染体 のゲノムは、PCRによる単一標的ヌクレオチド配列の増幅および標的配列に特異 的な標識プローブのハイブリダイゼーションによる標的の存在の検出によりアッ セイする。かかるアッセイは単一標的配列にのみ特異的であるので、従って、遺 伝子をPCRのような方法により増幅して検出可能なシグナルを得るに十分な標的 を得ることが必要である。 この実施例によって、フォーマット3型反応を通して感染体の特徴的なヌクレ オチド配列を検出する改良法が提供されるが、この方法では多重の異なる固定さ れた、問題の感染体に特異的なオリゴヌクレオチドプローブのアレイを含んでな る固相検出チップが作られる。標的核酸に相補性のある多くの非標識プローブの 混合物を含んでなる単一ドットは、種に特異的な標識を1つの位置に濃縮し、そ れにより広がったまたは単一のプローブ標識付けを越えて感度を改良する。かか る多重プローブは標的ヌクレオチド配列のオーバーラップ配列であり得るが、非 オーバーラップ配列ならびに非隣接でもあり得る。かかるプローブは、好ましく は、約5〜12ヌクレオチドの長さを有する。 プローブアレイに曝露される核酸サンプルおよびサンプルに存在する標的配列 は多重固定化プローブとハイブリダイズするであろう。その後、固定したプロー ブに隣接した標的配列と特異的に結合するよう選ばれた多重標識プローブのプー ルはサンプルとともに、非標識オリゴヌクレオチドプローブ混合物のアレイに適 用される。その後、リガーゼ酵素をチップに適用して隣接プローブをサンプルに 連結する。その後、検出チップを洗浄して未ハイブリダイズおよび未連結プロー ブおよびサンプル核酸を除去し、サンプル核酸の存在を標識の存在または不在に より定量することができる。この方法は、サンプル物質のモル濃度の約1000倍低 いモル濃度で信頼できるサンプル検出を可能とする。 本発明のさらなる1つの様態として、それ自身が多重の色素生産性、酵素性も しくは放射性の標識を含んでなるかまたは多重に標識されたさらなるプローブ剤 による特異的結合にそれ自身が感受性をもつ遊離プローブに、共通尾部(common tail)を提供するような方法により、標識プローブのシグナルを増幅するこ とができる。この方法で、シグナル増幅の第2ラウンドを実施することができる 。標識または非標識プローブを増幅の第2ラウンドに使うことができる。この増 幅の第2ラウンドで、多重標識をもつ長いDNAサンプルは、10〜100倍の間の増加 した増幅強度を得ることができ、100,000倍の全シグナル増幅を得ることができ る。この実施例の両様態の使用を通じて、強度シグナル約100,000倍は、PCRまた は他の増幅手法を使うことなくプローブ−DNA連結反応の陽性な結果を与えるこ とができる。 本発明のさらなる様態によって、プローブの完全なセット、例えば4096の6量 体プローブからなるアレイまたはスーパーアレイを調製することができる。この タイプのアレイは、どの核酸種でも検出または部分的から完全な配列決定まで使 うことができるという意味では普遍的である。1つのアレイ中の個々のスポット は単一プローブ種またはプローブの混合物、例えば単一反応で合成されるN(1-3 )B(4-6)N(1-3)タイプの混合物を含むことができる(Nは全ての4ヌクレオチ ドを、Bは一つの特定のヌクレオチドを表し、付随した数字は塩基数の範囲、例 えば1-3は「1から3塩基まで」を意味する)。これらの混合物は、同じ長い核 酸種分子の様々な部分からシグナルを集めることにより低濃度で存在する核酸種 に対してより強いシグナルを与える。プローブの普遍的セットは、ユニットアレ イとしてスポットされる多くのサブセットに小分割されてよく、ユニットアレイ はサンプルと標識プローブ類を含むハイブリダイゼーションバッファーの拡散を 防止するバリアーにより分離される。 既知配列をもつ核酸種の検出のために、固定した非標識プローブおよび溶液中 の標識プローブの両方を含んでなる1つ以上のオリゴヌクレオチド配列を選択す ることができる。標識プローブは合成されるかまたは予め合成した、例えば7量 体の、完全セットから選択される。標識プローブを対応する固定したプローブの ユニットアレイに加えて、固定したプローブおよび標識プローブの1対を隣接し て標的配列にハイブリダイズさせ、リガーゼの投与によりプローブを共有結合さ せる。 もしユニットアレイが与えられた核酸種に陽性である1つ以上の固定したプロ ーブを含有すれば(分離したスポットとしてもしくは同じスポット内で)、全て の対応する標識プローブを混合し同じユニットアレイに加えることができる。核 酸種の混合物を試験するときは、標識プローブの混合物は一層重要である。核酸 種の複雑な混合物の1例は1細胞または組織中のmRNAである。 本発明の1つの実施様態によれば、固定したプローブのユニットアレイは、相 対的に少数の標識プローブのカクテルとともにすべての可能な固定したプローブ の使用を可能とする。もし多重標識スキームを実施すれば、標識プローブのもつ と複雑なカクテルを使うことができる。好ましい多重化方法は、様々な蛍光染料 または質量分光分析により分離することができる分子タグを使うことができる。 代わりに、本発明の好ましい実施様態によって、多くの核酸配列にしばしばハ イブリダイズする相対的に短い固定したプローブを選択することができる。かか る短いプローブを、少なくとも1つの標識プローブが固定したプローブのそれぞ れと対応するように調製することができる標識プローブのカクテルとともに組み 合わせて使うことができる。好ましいカクテルは、どの標識プローブも1を越え る固定したプローブと対応しないカクテルである。実施例27 すべての可能な10量体(10-mers)をもつHIVウイルスセグメントの問い掛け フォーマットIII SBHのこの実施例では、ナイロン膜(例えば、Gene Screen) 上にすべての可能な結合した5量体(5-mers)(1024個の可能な5量体)のアレ イを作製した。結合した5量体オリゴヌクレオチドは、5'-TTTTTT-NNN-3'の5'尾 部を用いて合成した(N=すべての4塩基A、C、G、T;合成のこの工程で等 モル量の全4塩基が加えられた)。これらのオリゴヌクレオチドをナイロン膜上 に正確にスポットし、スポットを乾燥させ、そして乾燥したスポットをUV光で処 理してオリゴヌクレオチドを固定した。この方法により、1平方ナノメートル当 たり18オリゴヌクレオチドまでのオリゴヌクレオチド密度を得た。UV処理後、ナ イロン膜を界面活性剤を含有するバッファーにより60〜80℃で処理した。オリゴ ヌクレオチドのスボットを横10縦10からなるスポットのサブアレイに格子形成し た。そして、それぞれのサブアレイは64個の5量体スポットおよび36個の対照ス ポットを有する。16個のサブアレイはすべての可能な5量体を 包含する1024個の5量体を与える。 アレイ中のサブアレイは、それぞれのサブアレイが隣接したサブアレイから交 叉汚染を受けずサンプルにハイブリダイズできるように、物理的バリアー、例え ば、疎水性ストリップによりお互いが区分けされた。好ましい実施様態では、疎 水性ストリップは、(当技術分野で周知の溶媒のような)適切な溶媒中のシリコ ーン溶液(例えば、家庭用シリコーン糊およびシールペースト)で作る。シリコ ーングリースのこの溶液はサブアレイとサブアレイの間に適用され、溶媒が蒸発 した後に疎水性ストリップとしてセル間を分離する役割を果たすラインを形成す る。 このフォーマットIII実施例では、遊離または溶液(結合してない)5量体を 5'-NN-3'の3'尾部を用いて合成した(N=すべての4塩基A、G、C、T)。 この実施様態では、20kb未満の既知DNA配列を配列決定するために、遊離の5量 体と結合した5量体を組み合わせて、すべての可能な10量体を作製する。20kbの 二本鎖DNAを40kbの1本鎖DNAに変性する。この40kbの1本鎖DNAをすべての可能な1 0量体の約4%とハイブリダイズさせる。この10量体結合の低い頻度および既知の 標的配列により、配列情報を失うことなく、各サブアレイの処理のための遊離ま たは溶液(結合してない)5量体のプール作製が可能となる。好ましい実施様態 では、各サブアレイ用に16プローブをプールし、すべての可能な5量体が、遊離 5量体の64全プール中に表される。かくして、すべての可能な10量体は、1024サ ブアレイ(遊離5量体の各プールについて16アレイ)を使い、DNAサンプルに対 してプローブすることができる。 この実施様態における標的DNAは、HIVウイルスの2つの600bpセグメントを表 わす。これらの600bpセグメントは、60個のオーバーラップする30量体(30量体 はそれぞれの隣接30量体と20ヌクレオチドだけオーバーラップする)のプールに より表される。30量体のプールは、当技術分野で周知の剪断し、消化し、および /または標的DNAをランダムPCRして非常に小さい断片のランダムプールを作製す る技術を使って処理された標的DNAを模擬する。 上に記載したように、先のフォーマットIII実施例で、遊離5量体は、放射性 同位体、ビオチン、蛍光染料、その他で標識される。その後、標識された遊離5 量体を、結合した5量体とともに、標的DNAとハイブリダイズし、そして連結す る。好ましい実施様態では、300〜1000ユニットのリガーゼを反応に加える。ハ イブリダイゼーション条件は先の実施例の教示に従って行われる。連結および標 的DNAと過剰遊離プローブの除去の後に、アレイをアッセイして(上の実施例に 記載した技術を使って)標識プローブの位置を決定する。 標的の既知のDNA配列、および各サブアレイ中の既知の遊離および結合5量体 は、それぞれのサブアレイ中でどの結合5量体が標識された遊離5量体と連結す るかを予測する。これらの予測された20ドット由来のシグナルは失われ、予測さ れた配列からの標的DNAのそれぞれの改変に対して新しい20シグナルが得られた 。これらの新しい10ドット中の結合5量体のオーバーラップ配列は、それぞれの 新しいドット中でどの標識された遊離5量体が結合しているかを同定する。 記載した方法を使って、標識された遊離5量体のアレイおよびプール、HIVDNA 配列をすべての可能な10量体で探索(probe)した。フォーマットIII手法を使い 、試験したセグメントの「野生型」配列、ならびにこれらのセグメントに導入さ れたいくつかの「変異体」配列を適切に同定した。実施例28 繰返しDNA配列の配列決定 1つの実施様態では、標的DNA中の繰返しDNA配列は、修正フォーマットIII手 法における「スペーサー(spacer)オリゴヌクレオチド」を用いて配列決定され る。繰返しDNA配列の様々な長さのスペーサーオリゴヌクレオチド(繰返し配列 は第1のSBH実施で同定される)を、第1の既知の隣接オリゴヌクレオチドおよ び第2の既知のスペーサーの他のサイドに隣接する可能性のあるオリゴヌクレオ チドもしくは群(第1のSBH実施から判る)とともに、標的DNAとハイブリダイズ させる。繰返しDNAセグメントの長さにマッチするスペーサーが標的にハイブリ ダイズされているときは、2つの隣接オリゴヌクレオチドはスペーサーに連結す ることができる。もし第1の既知のオリゴヌクレオチドが基質に固定されており 、第2の既知のまたは可能なオリゴヌクレオチドが標識されていれ ば、適切な長さのスペーサが標的DNAにハイブリダイズされているときは、標識 された第2の既知のまたは可能なオリゴヌクレオチドを含む結合した連結反応産 物が形成される。実施例29 フォーマットIII SBHによる分岐点を通じての配列決定 1つの実施様態では、標的DNAの分岐点が、オリゴヌクレオチドの第3のセッ トおよび修正フォーマットIII手法を使って配列決定される。第1のSBH実施後、 配列を編集(compile)すると、いくつかの分岐点を同定することができる。こ れらは、分岐点に導く既知の配列の1つと部分的にオーバーラップする、オリゴ ヌクレオチドをハイブリダイズし、その後、標識された、分岐点に由来する配列 の1つに対応する、追加のオリゴヌクレオチドを、標的にハイブリダイズするこ とにより解決することができる。適切なオリゴヌクレオチドが標的DNAにハイブ リダイズしていると、標識オリゴヌクレオチドは他のものと連結することができ る。好ましい実施様態では、分岐点からの1〜数個のヌクレオチドだけオフセッ トした第1のオリゴヌクレオチドが(分岐配列の1つを読みこむように)選ばれ 、第1からおよび分岐点配列へ読む第2のオリゴヌクレオチドも選ばれ、そして 1または数個のヌクレオチドにより分岐点配列のオーバーラップをもつすべての 可能な分岐配列に対応する第3のオリゴヌクレオチドのセット(第1のオリゴヌ クレオチドに対応)が選ばれる。これらのオリゴヌクレオチドは標的DNAにハイ ブリダイズされ、適切な分岐配列(第1のオリゴヌクレオチドの分岐配列にマッ チする)をもつ第3オリゴヌクレオチドのみが第1および第2オリゴヌクレオチ ドとの連結反応産物を生成するであろう。実施例30 標的核酸を分析するための多重化プローブ この実施例では、プローブのセットが様々な標識により標識付けされているの で、或るセット中の各プローブはそのセット中の他のプローブから識別すること ができる。かくして、1回のハイブリダイゼーション反応でプローブ情報の損失 なしに、プローブのセットを標的核酸と接触させることができる。好ましい実施 様態では、様々な標識は様々な放射性同位体、または様々な蛍光標識、または様 々なEMLである。これらのプローブのセットは、フォーマットI、フォーマットII またはフォーマットIII SBHで使うことができる。 フォーマットI SBHでは、様々に標識されたプローブのセットは、完全マッチ と1塩基対ミスマッチの間の識別を可能とする条件下で基質に固定した標的核酸 とハイブリダイズする。標的核酸に結合する特異的なプローブは、その様々な標 識により同定され、そして完全マッチは、少なくとも部分的にこの結合情報から 決定される。 フォーマットII SBHでは、標的核酸は様々なプローブで標識され、プローブの アレイにハイブリダイズされる。プローブに結合する特異的な標的核酸は、それ らの様々な標識により同定され、そして完全マッチは、少なくとも部分的にこの 結合情報から決定される。 フォーマットIII SBHでは、様々に標識されたプローブおよび固定したプロー ブのセットは、標的核酸に完全マッチが1塩基対ミスマッチから識別することが 可能な条件下でハイブリダイズされる。標的上で固定したプローブに隣接する標 識されたプローブを固定したプローブに結合させ、そしてこれらの生成物をそれ らの様々な標識により検出して識別する。 好ましい実施様態では、種々の標識は、電子捕獲質量分析計(EC-MS)で検出 することができるEMLである。EMLは様々な主鎖分子から調製することができ、あ る特定の芳香族主鎖が特に好ましい(例えば、Xuら,J.Chromatog.764:95-102 (1997)を参照)。EMLは可逆的かつ安定した方法でプローブに付着しており、プ ローブが標的核酸とハイブリダイズした後、EMLはプローブから除去されて標準E C-MSにより同定される(例えば、EC-MSはガスクロマトグラフィー−質量分析計 で行うことができる)。実施例31 低頻度標的核酸の検出 フォーマットIII SBHは、サンプル中に1つのヌクレオチドだけ異なる同様な 配列が1部〜99部存在する配列を同定するのに十分な識別力を有する。こうして 、フォーマットIIIは、核酸のサンプル、例えば血液由来のサンプル中に非常に 低濃度で存在する核酸を同定するために使うことができる。 1つの実施様態では、その2つの配列は嚢胞性織維症(cystic fibrosis)に 関するものであり、配列は3ヌクレオチドの欠失によってお互いに異なる。2つ の配列に関するプローブは次の通りであった。すなわち、野生型由来の欠失を識 別するプローブを支持体に固定し、標識された隣接プローブは両者に共通とした 。これらの標的とプローブを使い、欠失変異体が野生型の1部から99部で存在し たときには、それをフォーマットIII SBHにより検出することができた。実施例32 標的核酸を分析するためのポラロイド装置および方法 核酸の2つのアレイ、およびその混合が望まれるまで2つのアレイの核酸を混 合から防止する光学的材料により、核酸を分析する装置を構築することができる 。この装置のアレイは、限定されるものではないが、ナイロン膜、ニトロセルロ ース膜、または上に開示した他の材料を含む様々な支持体により支持することが できる。好ましい実施様態では、支持体の1つは、疎水性ストリップにより区画 に分離された膜、またはゲルもしくはスポンジを含み得るウエルをもつ適切な支 持材料である。この実施様態では、プローブを膜の区画上に、またはウエル、ゲ ル、もしくはスポンジ中に置き、そしてプローブを可溶化するために、溶液(標 的核酸を含むかまたは含まない)を膜またはウエルに加える。その後、可溶化プ ローブの入った溶液は、第2の核酸アレイと接触させる。核酸は、限定されるも のでないが、オリゴヌクレオチドプローブまたは標的核酸であり、プローブまた は標的核酸は標識することができる。核酸は、限定されるものでないが、放射性 同位体、蛍光標識またはエレクトロフォアマス標識(electrophore mass label )を含む当技術分野で汎用的に使われる標識のどれかで標識することができる。 核酸の混合を防止する材料は2つのアレイの間に、その材料が取り外されると 2つのアレイの核酸が一緒に混合するように配置される。この材料はシート、膜 、または他のバリアーの形であってよく、この材料は核酸の混合を防止するいか な る材料からなることもできる。 この装置はフォーマットI SBHで次のように使うことができる:装置の第1の アレイは支持体に固定された標的核酸を有し、そして装置の第2のアレイは標識 された核酸プローブを有しかつ第1のアレイの標的核酸を問う(interrogate) ために除去することができる。2つのアレイは、プローブを標的核酸と接触する ことから防止する材料のシートにより任意に分離され、このシートが取り外され るとプローブは標的を問うことができる。適当なインキュベーションおよび洗浄 工程の後、標的のアレイが「読」みとられて、どのプローブが標的と完全マッチ を形成するかを決定することができる。この読みとりは自動化するかまたは手動 で(例えばオートラジオグラムを使って、眼で)行うことができる。フォーマッ トII SBHでは、行われる方法は、標的が標識されかつプローブが固定されている ことを除くと上に記載したものと同様である。 あるいは、装置はフォーマットIII SBHでは次のように使うことができる:核 酸プローブの2つのアレイを形成し、いずれかもしくは両方のアレイの核酸プロ ーブを標識することができ、そしてアレイの1つはその支持体に固定することが できる。2つのアレイはプローブを混合から防止する材料のシートにより分離さ れる。フォーマットIIは、標的核酸を加え、シートを取り外すことによりプロー ブがお互いにおよび標的と混合することにより開始される。標的上の隣接する部 位に結合するプローブは(例えば、塩基スタッキング相互作用(base-stacking interaction)または主鎖に共有結合することにより)一緒に結合され、そして その結果を読みとってどのプローブが標的と隣接部位に結合したかを決定する。 プローブの1セットが支持体に固定されると、固定したアレイを読みとって他の アレイからのどのプローブが固定されたプローブと一緒に結合したかを決定する ことができる。上に記載した方法のように、この読みとりは自動化するかまたは マニュアルで(例えばオートラジオグラムを使って、眼で)行うことができる。 本発明は、本発明の単一の様態の説明として意図された例示の実施様態により 範囲が限定されるものでなく、そして機能的に均等である組成物と方法ば本発明 の範囲内にある。実際に、本発明の好ましい実施様態を考慮すると、当業者には 本発明の実施において多数の変形と変更が起こりうることが予測される。したが って、本発明の範囲にあるべき限定は添付した請求の範囲に示されるもののみで ある。 本明細書の本文に引用された全ての参考文献は、参考として本明細書にそれら の全文を組み入れる。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G01N 33/58 C12N 15/00 A (31)優先権主張番号 08/892,503 (32)優先日 平成9年7月14日(1997.7.14) (33)優先権主張国 米国(US) (81)指定国 EP(AT,BE,CH,DE, DK,ES,FI,FR,GB,GR,IE,IT,L U,MC,NL,PT,SE),OA(BF,BJ,CF ,CG,CI,CM,GA,GN,ML,MR,NE, SN,TD,TG),AP(GH,GM,KE,LS,M W,SD,SZ,UG,ZW),EA(AM,AZ,BY ,KG,KZ,MD,RU,TJ,TM),AL,AM ,AT,AU,AZ,BA,BB,BG,BR,BY, CA,CH,CN,CU,CZ,DE,DK,EE,E S,FI,GB,GE,GH,GM,GW,HU,ID ,IL,IS,JP,KE,KG,KP,KR,KZ, LC,LK,LR,LS,LT,LU,LV,MD,M G,MK,MN,MW,MX,NO,NZ,PL,PT ,RO,RU,SD,SE,SG,SI,SK,SL, TJ,TM,TR,TT,UA,UG,UZ,VN,Y U,ZW

Claims (1)

  1. 【特許請求の範囲】 1.塩基配列決定の結果を確認する方法であって、 SBHを用いて核酸から配列を入手し、 前記核酸の配列に相補的なプローブおよび厳密には相補的でないプローブの セットを同定し、 完全な塩基対合と1塩基の誤対合との識別を可能にする条件下で前記プロー ブを核酸とハイブリダイズさせ、 前記プローブが前記核酸との完全な塩基対合を形成しないことを確認する、 各ステップを含んでなる方法。 2.SBHがフォーマットI SBHである、請求項1に記載の方法。 3.SBHがフォーマットIII SBHである、請求項1に記載の方法。 4.前記プローブのセットが核酸の配列に対して厳密には相補的でない、請求項 1に記載の方法。 5.塩基配列決定の結果を確認する方法であって、 SBHを用いて核酸から配列を入手し、 前記核酸用の少なくとも1つのプライマーを選択し、 サンガーシークエンシング法を用いて前記プライマーにより前記核酸の配列 を決定し、 SBHから得られた核酸の配列を、サンガーシークエンシング法より得られた 核酸の配列と比較する、 各ステップを含んでなる方法。 6.核酸配列からの多数のSfsを順序づける方法であって、 SBHを用いて核酸から配列を入手し、 多数のSfsの配列から多数のプライマーを同定し、その結果、前記プライマ ーは分岐点を読み過ごす複製反応を前記核酸上で開始することができ、 サンガーシークエンシング法を用いて前記プライマーにより前記核酸の配列 を決定し、 分岐点のまわりの核酸のサンガーシークエンシング法により得られた配列を 、 Sfsの配列と比較し、それによりSfsの順序を決定する、 各ステップを含んでなる方法。 7.多数のプローブを互いに識別することができる条件下で核酸をインテロゲー ト(interrogate)するために用いられる、核酸分析用の多数のプローブ。 8.前記核酸が既知の配列を有し、プローブが標識されている、請求項7に記載 のプローブ。 9.多数のプローブが多数の異なる標識で標識されており、その結果、プローブ はそれに結合された異なる標識により互いから識別可能である、請求項7に記 載の多数のプローブ。 10.プローブのプールを多数含む核酸分析用のプローブのセットであって、各プ ールが核酸をインテロゲート(interrogate)するために用いられ、多数のプロ ーブが多数の異なる標識で標識されており、各プール中のプローブはプローブ に結合された異なる標識により互いから識別可能である、上記プローブのセッ ト。 11.多数の異なる標識が多数の異なる放射性同位体である、請求項9に記載のプ ローブのセット。 12.多数の異なる標識が多数の異なる蛍光分子である、請求項9に記載のプロー ブのセット。 13.多数の異なる標識が多数の異なるEMLである、請求項9に記載のプローブの セット。 14.多数の異なる標識が多数の異なる放射性同位体である、請求項10に記載のプ ローブのセット。 15.多数の異なる標識が多数の異なる蛍光分子である、請求項10に記載のプロー ブのセット。 16.多数の異なる標識が多数の異なるEMLである、請求項10に記載のプローブの セット。 17.核酸を分析する方法であって、 オリゴヌクレオチドプローブのアレイを用意し、 前記アレイにサンプル核酸を導入し、 1塩基の誤対合と完全な塩基対合との識別を可能にする条件下で、多数の標 識プローブを前記アレイに添加し、 前記アレイにリガーゼを添加し、 リガーゼ、標識プローブ、サンプル核酸およびアレイプローブを、標識プロ ーブがサンプル核酸上でアレイプローブに隣接するとき、標識プローブをアレ イプローブに連結させる条件下でインキュベートし、そして 前記アレイに連結された標識プローブを検出する、 各ステップを含んでなる方法。 18.インキュベーションステップ後に連結されていない標識プローブを除去する ステップをさらに含む、請求項17に記載の方法。 19.前記核酸が既知の配列を有し、多数のプローブが標識されている、請求項18 に記載の方法。 20.標識が放射性同位体、蛍光分子およびEMLよりなる群から選択される、請求 項19に記載の方法。 21.多数のプローブが多数の異なる標識で標識されており、その結果、プローブ はプローブに結合された異なる標識により互いから識別可能である、請求項18 に記載の方法。 22.多数の異なる標識が多数の異なる放射性同位体である、請求項21に記載の方 法。 23.多数の異なる標識が多数の異なる蛍光分子である、請求項21に記載の方法。 24.多数の異なる標識が多数の異なるEMLである、請求項21に記載の方法。 25.多数の核酸を分析する方法であって、 多数の核酸を含むサンプルを取得し、その際、標的核酸は、少なくとも、標 的と相同であるが少なくとも1個のヌクレオチドで標的と相違する核酸99部に 対して1部の割合で存在し、 標的核酸を確認しうるプローブのセットを選択し、 サンプルとプローブを、1塩基の誤対合と完全な塩基対合との識別を可能に する条件下で混合し、 プローブがサンプル中の核酸と完全な塩基対合を形成するか否かを確認する 、 各ステップを含んでなる方法。 26.核酸を分析する装置であって、 核酸の第1アレイ、 核酸の第2アレイ、 第1アレイと第2アレイの間に配置された、第1アレイ中の核酸と第2アレ イ中の核酸との混合を防止する物質、 を含んでなる装置。 27.第2アレイ中の核酸が標識されたオリゴヌクレオチドプローブである、請求 項26に記載の装置。 28.第1アレイ中の核酸が多数のサンプル核酸である、請求項27に記載の装置。 29.標的核酸を分析する方法であって、 支持体に固定された既知配列の結合プローブのアレイを用意し、 既知配列の標識プローブのアレイを用意し、 結合プローブのアレイと標識プローブのアレイの間に配置された、結合およ び標識プローブのアレイ中のプローブ同士の混合を防止する物質を用意し、 標的核酸を標識プローブに添加し、 1塩基の誤対合と完全な塩基対合との識別を可能にする条件下で、標識プロ ーブ、結合プローブおよび標的核酸が一緒に混合されるように、結合プローブ と標識プローブの間の前記物質を取り除き、 標的核酸中の隣接部位にハイブリダイズした結合プローブと標識プローブを 連結し、 結合プローブアレイに連結された標識プローブを検出する、 各ステップを含んでなる方法。 30.標的核酸を分析する方法であって、 支持体に固定された既知配列の結合プローブのアレイを用意し、 既知配列の標識プローブのアレイを用意し、 結合プローブのアレイと標識プローブのアレイの間に配置された、結合およ び標識プローブのアレイ中のプローブ同士の混合を防止する物質を用意し、 標識プローブと結合プローブが一緒に混合されるように、結合プローブと標 識プローブの間の前記物質を取り除き、 1塩基の誤対合と完全な塩基対合との識別を可能にする条件下で、標識およ び結合プローブに標的核酸を添加し、 標的核酸中の隣接部位にハイブリダイズした結合プローブと標識プローブを 連結し、 結合プローブアレイに連結された標識プローブを検出する、 各ステップを含んでなる方法。 31.標的核酸を分析する方法であって、 支持体に固定された既知配列の結合プローブのアレイを用意し、ここで結合 プローブの一部は標的核酸の多数の第1部分に相補的であり、 既知配列の標識プローブのアレイを用意し、ここで標識プローブの一部は標 的核酸の多数の第2部分に相補的であり、特定の第2部分は特定の第1部分に 隣接しており、 結合プローブのアレイと標識プローブのアレイの間に配置された、結合およ び標識プローブのアレイ中のプローブ同士の混合を防止する物質を用意し、 標的核酸を標識プローブに添加し、 1塩基の誤対合と完全な塩基対合との識別を可能にする条件下で、標識プロ ーブ、結合プローブおよび標的核酸が一緒に混合されるように、結合プローブ と標識プローブの間の前記物質を取り除き、 標的核酸中の特定の第1および第2部分に結合した結合プローブと標識プロ ーブを連結し、 結合プローブアレイに連結された標識プローブを検出する、 各ステップを含んでなる方法。 32.標的核酸を分析する方法であって、 支持体に固定された既知配列の結合プローブのアレイを用意し、ここで結合 プローブの一部は標的核酸の多数の第1部分に相補的であり、 既知配列の標識プローブのアレイを用意し、ここで標識プローブの一部は標 的核酸の多数の第2部分に相補的であり、特定の第2部分は特定の第1部分に 隣接しており、 結合プローブのアレイと標識プローブのアレイの間に配置された、結合およ び標識プローブのアレイ中のプローブ同士の混合を防止する物質を用意し、 標識プローブと結合プローブが一緒に混合されるように、結合プローブと標 識プローブの間の前記物質を取り除き、 1塩基の誤対合と完全な塩基対合との識別を可能にする条件下で、標識およ び結合プローブに標的核酸を添加し、 標的核酸中の特定の第1および第2部分に結合した結合プローブと標識プロ ーブを連結し、 結合プローブアレイに連結された標識プローブを検出する、 各ステップを含んでなる方法。 33.標的核酸を分析する方法であって、 結合された標的核酸のアレイを用意し、 既知配列の標識プローブのアレイを用意し、 結合標的のアレイと標識プローブのアレイの間に配置された、標的核酸と標 識プローブの混合を防止する物質を用意し、 1塩基の誤対合と完全な塩基対合との識別を可能にする条件下で、標識プロ ーブと結合標的核酸が一緒に混合されるように、結合標的と標識プローブの間 の前記物質を取り除き、 どの標識プローブが標的DNAとの完全な塩基対合を形成したかを確認する、 各ステップを含んでなる方法。
JP53449798A 1997-01-16 1998-01-14 核酸種を検出または定量するための方法および組成物 Pending JP2001509027A (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US08/784,747 US6309824B1 (en) 1997-01-16 1997-01-16 Methods for analyzing a target nucleic acid using immobilized heterogeneous mixtures of oligonucleotide probes
US08/784,747 1997-01-16
US08/812,951 US6297006B1 (en) 1997-01-16 1997-03-04 Methods for sequencing repetitive sequences and for determining the order of sequence subfragments
US08/812,951 1997-03-04
US08/892,503 US20020042048A1 (en) 1997-01-16 1997-07-14 Methods and compositions for detection or quantification of nucleic acid species
US08/892,503 1997-07-14
PCT/US1998/000704 WO1998031836A1 (en) 1997-01-16 1998-01-14 Methods and compositions for detection or quantification of nucleic acid species

Publications (1)

Publication Number Publication Date
JP2001509027A true JP2001509027A (ja) 2001-07-10

Family

ID=27419818

Family Applications (1)

Application Number Title Priority Date Filing Date
JP53449798A Pending JP2001509027A (ja) 1997-01-16 1998-01-14 核酸種を検出または定量するための方法および組成物

Country Status (11)

Country Link
US (2) US20020042048A1 (ja)
EP (1) EP0968305A1 (ja)
JP (1) JP2001509027A (ja)
KR (1) KR20000070230A (ja)
CN (1) CN1250485A (ja)
AU (1) AU745201B2 (ja)
BR (1) BR9806914A (ja)
CA (1) CA2278011A1 (ja)
IL (1) IL130913A0 (ja)
NZ (1) NZ513913A (ja)
WO (1) WO1998031836A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2005056834A1 (ja) * 2003-12-10 2007-07-05 オリンパス株式会社 核酸配列解析方法
JPWO2015166768A1 (ja) * 2014-05-02 2017-05-18 Idacセラノスティクス株式会社 単一細胞由来核酸の解析方法

Families Citing this family (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5547839A (en) 1989-06-07 1996-08-20 Affymax Technologies N.V. Sequencing of surface immobilized polymers utilizing microflourescence detection
US6741344B1 (en) * 1994-02-10 2004-05-25 Affymetrix, Inc. Method and apparatus for detection of fluorescently labeled materials
US5631734A (en) 1994-02-10 1997-05-20 Affymetrix, Inc. Method and apparatus for detection of fluorescently labeled materials
US6090555A (en) * 1997-12-11 2000-07-18 Affymetrix, Inc. Scanned image alignment systems and methods
US6406848B1 (en) 1997-05-23 2002-06-18 Lynx Therapeutics, Inc. Planar arrays of microparticle-bound polynucleotides
USRE43097E1 (en) 1994-10-13 2012-01-10 Illumina, Inc. Massively parallel signature sequencing by ligation of encoded adaptors
EP0972078B1 (en) 1997-03-20 2005-06-01 Affymetrix, Inc. (a California Corporation) Iterative resequencing
GB9718921D0 (en) * 1997-09-05 1997-11-12 Brax Genomics Ltd Catalytically generated mass labels
US20030036084A1 (en) * 1997-10-09 2003-02-20 Brian Hauser Nucleic acid detection method employing oligonucleotide probes affixed to particles and related compositions
WO1999035287A1 (fr) * 1998-01-08 1999-07-15 Laboratory Of Molecular Biophotonics Sondes pour detecter un acide nucleique cible, procede de detection d'un acide nucleique cible, et phase solide pour detecter l'acide nucleique cible et procede de production de ce dernier
US6268210B1 (en) 1998-05-27 2001-07-31 Hyseq, Inc. Sandwich arrays of biological compounds
CA2335951C (en) 1998-06-24 2013-07-30 Mark S. Chee Decoding of array sensors with microspheres
US7399844B2 (en) * 1998-07-09 2008-07-15 Agilent Technologies, Inc. Method and reagents for analyzing the nucleotide sequence of nucleic acids
US6703228B1 (en) * 1998-09-25 2004-03-09 Massachusetts Institute Of Technology Methods and products related to genotyping and DNA analysis
EP1001037A3 (en) * 1998-09-28 2003-10-01 Whitehead Institute For Biomedical Research Pre-selection and isolation of single nucleotide polymorphisms
US6245518B1 (en) * 1998-12-11 2001-06-12 Hyseq, Inc. Polynucleotide arrays and methods of making and using the same
DE60042775D1 (de) 1999-01-06 2009-10-01 Callida Genomics Inc Verbesserte sequenzierung mittels hybridisierung durch verwendung von sondengemischen
US7595189B2 (en) 1999-01-08 2009-09-29 Applied Biosystems, Llc Integrated optics fiber array
DE60031506T2 (de) 1999-01-08 2007-08-23 Applera Corp., Foster City Fasermatrix zum zusammenbringen von chemischen stoffen, sowie verfahren zur herstellung und anwendung davon
JP2003527075A (ja) 1999-03-25 2003-09-16 ハイセック,インコーポレーテッド ハイブリダイゼーションによる配列分析のための、溶液ベースの方法
US20060275782A1 (en) 1999-04-20 2006-12-07 Illumina, Inc. Detection of nucleic acid reactions on bead arrays
EP1190100B1 (en) 1999-05-20 2012-07-25 Illumina, Inc. Combinatorial decoding of random nucleic acid arrays
US6544732B1 (en) 1999-05-20 2003-04-08 Illumina, Inc. Encoding and decoding of array sensors utilizing nanocrystals
US8080380B2 (en) 1999-05-21 2011-12-20 Illumina, Inc. Use of microfluidic systems in the detection of target analytes using microsphere arrays
US8481268B2 (en) 1999-05-21 2013-07-09 Illumina, Inc. Use of microfluidic systems in the detection of target analytes using microsphere arrays
AU5497100A (en) * 1999-06-19 2001-01-09 Hyseq, Inc. Improved methods of sequence assembly in sequencing by hybridization
ATE542916T1 (de) 1999-08-18 2012-02-15 Illumina Inc Methoden zur erzeugung von oligonukleotidlösungen
US6291180B1 (en) * 1999-09-29 2001-09-18 American Registry Of Pathology Ultrasound-mediated high-speed biological reaction and tissue processing
JP3668075B2 (ja) 1999-10-12 2005-07-06 光夫 板倉 遺伝物質シーケンス決定用懸濁系、その懸濁系を用いた遺伝物質シーケンス決定方法およびその懸濁系を用いたSNPs高速スコアリング方法
US6512580B1 (en) * 1999-10-27 2003-01-28 Verification Technologies, Inc. Method and apparatus for portable product authentication
ATE360095T1 (de) 2000-02-07 2007-05-15 Illumina Inc Nukleinsäure nachweisverfahren mit universellem priming
WO2001057269A2 (en) 2000-02-07 2001-08-09 Illumina, Inc. Nucleic acid detection methods using universal priming
US7582420B2 (en) 2001-07-12 2009-09-01 Illumina, Inc. Multiplex nucleic acid reactions
AU2001241474A1 (en) 2000-02-11 2001-08-20 The Texas A And M University System Biosensor compositions and methods of use
AU2001238389B2 (en) 2000-02-16 2006-09-21 Illumina, Inc. Parallel genotyping of multiple patient samples
US6591196B1 (en) * 2000-06-06 2003-07-08 Agilent Technologies Inc. Method and system for extracting data from surface array deposited features
US20020182609A1 (en) * 2000-08-16 2002-12-05 Luminex Corporation Microsphere based oligonucleotide ligation assays, kits, and methods of use, including high-throughput genotyping
US20030190612A1 (en) * 2000-08-31 2003-10-09 Nobuko Yamamoto Detecting method and detection substrate for use therein
CA2443515C (en) * 2001-04-03 2011-06-14 Christopher Becker Methods and kits useful for the simplification of complex peptide mixtures
EP1390526A4 (en) * 2001-04-18 2005-02-02 Perlegen Sciences Inc METHOD FOR IDENTIFYING THE EVOLUTIONARY PRESERVED SEQUENCES
US20030119015A1 (en) * 2001-05-10 2003-06-26 Perlegen Sciences, Inc. Methods for nucleic acid analysis
US20030036073A1 (en) * 2001-06-07 2003-02-20 Saba James Anthony Matrix Sequencing: a novel method of polynucleotide analysis utilizing probes containing universal nucleotides
WO2003006676A2 (en) * 2001-07-13 2003-01-23 Nanosphere, Inc. Method for immobilizing molecules onto surfaces
US7297553B2 (en) * 2002-05-28 2007-11-20 Nanosphere, Inc. Method for attachment of silylated molecules to glass surfaces
DE10140499B4 (de) * 2001-08-17 2005-02-03 Bruker Daltonik Gmbh Probenträgerplatten für Massenspektrometrie mit Ionisierung durch matrixunterstützte Laserdesorption
ES2314093T3 (es) * 2001-12-08 2009-03-16 Seegene, Inc. Cebador para el control de la reasociacion y sus usos.
CA2513985C (en) 2003-01-21 2012-05-29 Illumina Inc. Chemical reaction monitor
US8105771B2 (en) * 2003-02-26 2012-01-31 Callida Genomics, Inc. Random array DNA analysis by hybridization
US7276338B2 (en) * 2003-11-17 2007-10-02 Jacobson Joseph M Nucleotide sequencing via repetitive single molecule hybridization
EP1804609A2 (en) * 2004-09-29 2007-07-11 Tel Hashomer Medical Research Infrastructure and Services Ltd. Monitoring of convection enhanced drug delivery
EP2241637A1 (en) * 2005-02-01 2010-10-20 AB Advanced Genetic Analysis Corporation Nucleic acid sequencing by performing successive cycles of duplex extension
EP2233581A1 (en) * 2005-02-01 2010-09-29 AB Advanced Genetic Analysis Corporation Nucleic acid sequencing by performing successive cycles of duplex extension
DK2463386T3 (en) 2005-06-15 2017-07-31 Complete Genomics Inc Nucleic acid analysis using random mixtures of non-overlapping fragments
US9445025B2 (en) 2006-01-27 2016-09-13 Affymetrix, Inc. System, method, and product for imaging probe arrays with small feature sizes
US8055098B2 (en) * 2006-01-27 2011-11-08 Affymetrix, Inc. System, method, and product for imaging probe arrays with small feature sizes
KR100812259B1 (ko) * 2006-06-12 2008-03-10 주식회사 씨젠 기지의 서열에 인접한 미지의 dna 서열을 증폭하는 방법
WO2011011535A2 (en) 2009-07-21 2011-01-27 Gen-Probe Incorporated Methods and compositions for quantitative detection of nucleic acid sequences over an extended dynamic range
WO2011103467A2 (en) 2010-02-19 2011-08-25 Life Technologies Corporation Methods and systems for nucleic acid sequencing validation, calibration and normalization
WO2011138402A1 (en) 2010-05-05 2011-11-10 Check-Points Holding B.V. Assays, compositions and methods for detecting drug resistant micro-organisms
WO2016046253A1 (en) * 2014-09-23 2016-03-31 Ait Austrian Institute Of Technology Gmbh Fast and highly specific dna-based multiplex detection
US11352667B2 (en) * 2016-06-21 2022-06-07 10X Genomics, Inc. Nucleic acid sequencing

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4562159A (en) 1981-03-31 1985-12-31 Albert Einstein College Of Medicine, A Division Of Yeshiva Univ. Diagnostic test for hepatitis B virus
US4677054A (en) 1983-08-08 1987-06-30 Sloan-Kettering Institute For Cancer Research Method for simple analysis of relative nucleic acid levels in multiple small samples by cytoplasmic dot hybridization
AU575586B2 (en) 1983-09-02 1988-08-04 Syngene, Inc. Oligonucleotide synthesis employing primer with oxidzable substituents in system
US4613566A (en) 1984-01-23 1986-09-23 President And Fellows Of Harvard College Hybridization assay and kit therefor
FI71768C (fi) 1984-02-17 1987-02-09 Orion Yhtymae Oy Foerbaettrade nykleinsyrareagenser och foerfarande foer deras framstaellning.
US4766062A (en) 1984-05-07 1988-08-23 Allied Corporation Displacement polynucleotide assay method and polynucleotide complex reagent therefor
GB8432118D0 (en) 1984-12-19 1985-01-30 Malcolm A D B Sandwich hybridisation technique
DE3506703C1 (de) 1985-02-26 1986-04-30 Sagax Instrument AB, Sundbyberg Verfahren zur Sequenzanalyse von Nucleinsaeuren,insbesondere der Desoxyribonucleinsaeure (DNA) und der Ribonucleinsaeure (RNA),sowie Traeger zur Durchfuehrung des Verfahrens und Verfahren zur Herstellung des Traegers
GB8509880D0 (en) 1985-04-17 1985-05-22 Ici Plc Testing device
EP0228075B1 (en) 1986-01-03 1991-04-03 Molecular Diagnostics, Inc. Eucaryotic genomic dna dot-blot hybridization method
US5348855A (en) 1986-03-05 1994-09-20 Miles Inc. Assay for nucleic acid sequences in an unpurified sample
NO870613L (no) 1986-03-05 1987-09-07 Molecular Diagnostics Inc Deteksjon av mikroorganismer i en prŸve inneholdende nukleinsyre.
CA1284931C (en) 1986-03-13 1991-06-18 Henry A. Erlich Process for detecting specific nucleotide variations and genetic polymorphisms present in nucleic acids
US5310893A (en) 1986-03-31 1994-05-10 Hoffmann-La Roche Inc. Method for HLA DP typing
US4981783A (en) 1986-04-16 1991-01-01 Montefiore Medical Center Method for detecting pathological conditions
CA1308372C (en) 1986-08-11 1992-10-06 Geneva Ruth Davis Nucleic acid probe sandwich assay methods and compositions
AU601021B2 (en) 1987-03-11 1990-08-30 Molecular Diagnostics, Inc. Assay for necleic acid sequences in a sample
US5202231A (en) 1987-04-01 1993-04-13 Drmanac Radoje T Method of sequencing of genomes by hybridization of oligonucleotide probes
US5525464A (en) 1987-04-01 1996-06-11 Hyseq, Inc. Method of sequencing by hybridization of oligonucleotide probes
US6270961B1 (en) 1987-04-01 2001-08-07 Hyseq, Inc. Methods and apparatus for DNA sequencing and DNA identification
US4849334A (en) 1987-06-09 1989-07-18 Life Technologies, Inc. Human papillomavirus 43 nucleic acid hybridization probes and methods for employing the same
AU2084988A (en) 1987-06-26 1989-01-19 E.I. Du Pont De Nemours And Company Affinity removal of contaminating sequences from recombinant cloned na using capture beads
GB8810400D0 (en) 1988-05-03 1988-06-08 Southern E Analysing polynucleotide sequences
US5002867A (en) 1988-04-25 1991-03-26 Macevicz Stephen C Nucleic acid sequence determination by multiple mixed oligonucleotide probes
AU632494B2 (en) 1988-05-20 1993-01-07 F. Hoffmann-La Roche Ag Immobilized sequence-specific probes
GB8822228D0 (en) 1988-09-21 1988-10-26 Southern E M Support-bound oligonucleotides
JPH02299598A (ja) 1989-04-14 1990-12-11 Ro Inst For Molecular Genetics & Geneteic Res 微視的サイズの別個の粒子と結合している核酸試料中のごく短い配列の全部または一部のオリゴヌクレチドプローブとのハイブリダイゼーションによる決定法
EP0562047A4 (en) 1990-12-06 1995-11-02 Affymax Tech Nv Sequencing by hybridization of a target nucleic acid to a matrix of defined oligonucleotides
AU1999092A (en) 1991-05-24 1992-12-30 Walter Gilbert Method and apparatus for rapid nucleic acid sequencing
JPH07501929A (ja) 1991-08-23 1995-03-02 アイシス・ファーマシューティカルス・インコーポレーテッド オリゴマーフラグメントの合成非ランダム化
US5474796A (en) 1991-09-04 1995-12-12 Protogene Laboratories, Inc. Method and apparatus for conducting an array of chemical reactions on a support surface
US5503980A (en) * 1992-11-06 1996-04-02 Trustees Of Boston University Positional sequencing by hybridization
US5795714A (en) * 1992-11-06 1998-08-18 Trustees Of Boston University Method for replicating an array of nucleic acid probes
NZ275194A (en) * 1993-09-27 1997-09-22 Arch Dev Corp Method and kit for nucleic acid sequencing
US6974666B1 (en) * 1994-10-21 2005-12-13 Appymetric, Inc. Methods of enzymatic discrimination enhancement and surface-bound double-stranded DNA
US5545531A (en) 1995-06-07 1996-08-13 Affymax Technologies N.V. Methods for making a device for concurrently processing multiple biological chip assays
JP2000504575A (ja) 1996-02-08 2000-04-18 アフィメトリックス,インコーポレイテッド 微生物のチップベースの種分化および表現型特徴付け
US5804384A (en) * 1996-12-06 1998-09-08 Vysis, Inc. Devices and methods for detecting multiple analytes in samples
US6037186A (en) * 1997-07-16 2000-03-14 Stimpson; Don Parallel production of high density arrays

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2005056834A1 (ja) * 2003-12-10 2007-07-05 オリンパス株式会社 核酸配列解析方法
JPWO2015166768A1 (ja) * 2014-05-02 2017-05-18 Idacセラノスティクス株式会社 単一細胞由来核酸の解析方法

Also Published As

Publication number Publication date
NZ513913A (en) 2001-09-28
BR9806914A (pt) 2001-09-18
US6383742B1 (en) 2002-05-07
WO1998031836A1 (en) 1998-07-23
CN1250485A (zh) 2000-04-12
US20020042048A1 (en) 2002-04-11
AU745201B2 (en) 2002-03-14
IL130913A0 (en) 2001-01-28
CA2278011A1 (en) 1998-07-23
KR20000070230A (ko) 2000-11-25
AU6131798A (en) 1998-08-07
EP0968305A1 (en) 2000-01-05

Similar Documents

Publication Publication Date Title
JP2001509027A (ja) 核酸種を検出または定量するための方法および組成物
US6309824B1 (en) Methods for analyzing a target nucleic acid using immobilized heterogeneous mixtures of oligonucleotide probes
US6297006B1 (en) Methods for sequencing repetitive sequences and for determining the order of sequence subfragments
US20030108897A1 (en) Methods and compositions for detection or quantification of nucleic acid species
JP2001514906A (ja) 核酸種を検出または定量するための方法および組成物
US6355419B1 (en) Preparation of pools of nucleic acids based on representation in a sample
EP0723598B1 (en) Methods and compositions for efficient nucleic acid sequencing
US6401267B1 (en) Methods and compositions for efficient nucleic acid sequencing
Chetverin et al. Oligonucleotide arrays: New concepts and possibilities
JP3793570B2 (ja) ハイブリッド形成による位置配列決定
US6027880A (en) Arrays of nucleic acid probes and methods of using the same for detecting cystic fibrosis
EP0972081B1 (en) Method of nucleic acid amplification
US6582908B2 (en) Oligonucleotides
US20030073623A1 (en) Novel nucleic acid sequences obtained from various cDNA libraries
EP2145963A1 (en) Enhanced sequencing by hybridization using pools of probes
US20030036084A1 (en) Nucleic acid detection method employing oligonucleotide probes affixed to particles and related compositions
KR20010022917A (ko) 핵산 종을 감지하고 이를 정량화하는 방법 및 그 조성물
CZ254699A3 (cs) Způsoby a kompozice vhodné pro detekci nebo kvantifikaci druhů nukleových kyselin
WO1999036567A2 (en) Enhanced discrimination of perfect matches from mismatches using a modified dna ligase
JP2004529663A (ja) Happiarマッピング