JP2004502129A5 - - Google Patents

Download PDF

Info

Publication number
JP2004502129A5
JP2004502129A5 JP2000609615A JP2000609615A JP2004502129A5 JP 2004502129 A5 JP2004502129 A5 JP 2004502129A5 JP 2000609615 A JP2000609615 A JP 2000609615A JP 2000609615 A JP2000609615 A JP 2000609615A JP 2004502129 A5 JP2004502129 A5 JP 2004502129A5
Authority
JP
Japan
Prior art keywords
genes
array
gene
hybridization
microarray
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2000609615A
Other languages
Japanese (ja)
Other versions
JP2004502129A (en
Filing date
Publication date
Priority claimed from CA002268695A external-priority patent/CA2268695A1/en
Priority claimed from US09/299,193 external-priority patent/US6511849B1/en
Application filed filed Critical
Priority claimed from PCT/US2000/009526 external-priority patent/WO2000060126A2/en
Publication of JP2004502129A publication Critical patent/JP2004502129A/en
Publication of JP2004502129A5 publication Critical patent/JP2004502129A5/ja
Withdrawn legal-status Critical Current

Links

Images

Description

【書類名】明細書
【発明の名称】マイクロアレイにおける遺伝子の発現のための定量アッセイ
【特許請求の範囲】
【請求項1】マイクロアレイ、ノーザンブロットまたはサザンブロットにおけるDNAハイブリダイゼーションを検出するための方法であって、該方法は以下の工程:
ジゴキシゲニン標識された遺伝子特異的プライマーを、標的核酸分子に加える工程、
該プライマーを該標的核酸分子と反応させて、標識された標的核酸分子を生成する工程、
該標識された標的核酸分子と、色素原基質を切断する酵素と結合体化された抗ジゴキシゲニン抗体とをインキュベートする工程、および
該標的核酸分子と該抗体との反応を、比色、色素原、または化学発光のアッセイのための検出手段を用いて検出する工程、
を包含する、方法。
【請求項2】前記核酸分子がDNAである、請求項1に記載の方法。
【請求項3】前記標的DNAがマイクロアレイ上にあり、そしてpg量で存在する、請求項1に記載の方法。
【請求項4】前記標的DNAがノーザンブロット上にある、請求項1に記載の方法。
【請求項5】前記標的DNAがサザンブロット上にある、請求項1に記載の方法。
【請求項6】前記プライマーは、前記標的核酸分子と反応され、該核酸分子はDNAであり、そして該標的DNAは、ポリメラーゼ連鎖反応において増幅される、請求項1に記載の方法。
【請求項7】前記検出手段が、化学発光基質である3−(4−メトキシスピロ{1,2−ジオキセタン−3,2’−(5’−クロロ)トリシクロ[3.3.1.13,7]デカン}−4−イル)フェニルリン酸二ナトリウム−CSPDである、請求項1に記載の方法。
【請求項8】さらに、抗体インキュベーション後に、5−ブロモ−4−クロロ−3−インドリルホスフェート、トルイジン塩(BCIP)およびニトロブルーテトラゾリウムクロリド(NBT)を用いて検出緩衝液中で染色する工程を包含する、請求項1に記載の方法。
【請求項9】マイクロアレイフォーマットにおけるプローブと標的DNAとの間のハイブリダイゼーション反応の分解能を増強するための方法であって、該方法は以下の工程:
試験サンプルを該マイクロアレイ中に200試験スポット未満の量で提供する工程、
を包含する、方法。
【請求項10】少なくとも3つのスポットが前記各試験サンプルについて提供される、請求項8に記載の方法。
【請求項11】前記3つのスポットは、前記マイクロアレイ中にランダムに配置される、請求項10に記載の方法。
【請求項12】少なくとも9つのハウスキーピング遺伝子がデータの正規化のために提供される、請求項9に記載の方法。
【請求項13】さらに、他の試験サンプルおよびハウスキーピング遺伝子のサイズに比較して、各試験サンプルについての検出反応のサイズを正規化するための手段を提供する工程、
を包含する、請求項12に記載の方法。
【請求項14】前記各試験サンプル検出反応は、同じ直径のサークルへと適合される、請求項13に記載の方法。
【請求項15】前記適合工程は、各試験サンプルについてのデータを測定および正規化するコンピュータによって実施される、請求項14に記載の方法。
【請求項16】前記データは、さらに、前記ハウスキーピング遺伝子の各々についての検出反応に比較して正規化される、請求項15に記載の方法。
【請求項17】請求項1に記載の方法において使用するためのキットであって、以下:
ジゴキシゲニンおよび核酸プライマーを標識する試薬を備える、キット。
【請求項18】さらに、比色基質、色素原基質および化学発光基質からなる群より選択される、基質を備える、請求項17に記載のキット。
【請求項19】請求項9に記載の方法に使用するための情報科学システム。
【発明の詳細な説明】
【0001】
(発明の背景)
米国政府は、米国国立老化研究所(U.S. National Institute on Aging)からEugenia Wangに、そして米国国防総省の国防高等研究計画局(Defense Advanced Research Projects Agency)からE.Wangに与えられた、助成金R01AG09278によって、本発明における権利を有する。
【0002】
本発明は、例えばコンビナトリアルライブラリにおけるマイクロアレイでの遺伝子の発現の定量的ならびに定性的なレベルを検出するための方法の領域にある。
【0003】
マイクロアレイ技術は、DNAおよびRNAの変異を系統的に調査する方法を生物学者に提供する。最近まで、科学者が利用できる唯一のツールは、差次的発現をアッセイするための、ノーザンブロット分析、RNアーゼ保護、またはRT−PCRであった。これらの技術は、一度に扱う遺伝子が少数に限られている。対照的に、マイクロアレイ技術は、多数の遺伝子発現を同時に包括的に観察する手段を提供し、これは、非常な注目を引き、分子生物学の研究および臨床的診断の両方の標準的なツールとなっている。発現プロファイリング実験の最初の工程なので、アレイイメージの分析および定量は、それに続くデータマイニング(mining)および探査の精度に対して、重大な影響を及ぼす。
【0004】
マイクロアレイは、典型的には、ナノモル(ピコグラム未満)量の個別の遺伝子、cDNA、または発現配列タグ(「EST」)(部分遺伝子配列)を、ニトロセルロースまたはケイ素プレート、あるいはフォトリソグラフィーで調製されたガラス基板のような基板上の、別個の部位に含む。およそ一千のESTを含むマイクロアレイが、Affymatrixから市販されている。Clontechは、腫瘍の研究のような特定の研究領域、あるいは広範囲な適用のために設計された、AffimatrixのESTの約半分の数の遺伝子特異的cDNA断片のアレイを販売している。
【0005】
いったん作製したら、アレイを、遺伝子特異的プライマー混合物を用いた標準的な技術を使用して、cDNAプローブにハイブリダイズする。分析される核酸−標的−を単離し、増幅し、そして、典型的には蛍光レポーター基、放射標識またはリン標識プローブで、標識する。ハイブリダイゼーション反応が完了した後、アレイをスキャナに挿入し、ここでハイブリダイゼーションのパターンを検出する。ハイブリダイゼーションデータを、標的(これはそのとき、プローブアレイに結合している)中に既に取り込まれたレポーター基から発せられる光として収集する。標的に完全にマッチしたプローブは、ミスマッチを有するものよりも強いシグナルを生成する。アレイ上の各プローブの配列および位置は既知であるので、プローブアレイに適用された標的核酸の正体が、相補性により決定され得る。
【0006】
使用される多様な標識がある。cDNAおよびESTは、オートラジオグラフ法またはホスホルイメージング(32P)によって検出され得る。蛍光染料もまた用いられ、Clontechのような供給者から市販されている。
【0007】
ヒトゲノム計画のマッピングおよび配列決定フェーズは、スケジュールよりもかなり先行している。今までに、真核生物S.cerevisiaeおよびC.elegansを含む、17モデルの生物の完全ゲノム配列が完成している。完全ヒトゲノム配列は、本年中に入手し得ると予想されている。しかし、既に配列決定された遺伝子のうちで、53,000のヒト遺伝子の約20%、あるいは6,200の酵母オープンリーディングフレームの25%の機能が知られているに過ぎない。ヒトゲノム計画の次のフェーズは、残りの80%の遺伝子の機能の理解を扱う。新規な遺伝子の機能の研究のための主たるアプローチは、その発現のパターン−いつ、どこで、そしてどの程度強く、発現するか−を決定することによる。
【0008】
現在遺伝子発現レベルの研究の手段となっている技術には、ノーザンブロット(Alwineら、Proc.Natl Acad.Sci.USA 74:5350−5354(1977))、RT−PCR(Martoranaら、Bio Techniques 27、136−144(1999)、Wenら、Proc.Natl.Acad.Sci.USA 95、334−339(1998))、差次的ディスプレイ(LiangおよびPardee、Science 257、967−971(1992))、cDNAライブラリからのDNAの配列決定(Okubo,Kら、Nature Genet.2、173−179(1992))、および遺伝子発現の系統的分析−SAGE(Velculescu,V.E.ら、Cell 88,243−251(1997))が含まれる。SAGE以外のこれらのアプローチは全て、同時に処理できるのは、わずかに数ダースから数百の試料のみである。近い将来に受け取るであろう膨大な量の情報(異なる条件下、および異なる生物における、数万の遺伝子の発現パターン)を考慮するならば、cDNAまたはオリゴヌクレオチドマイクロアレイのような高スループットの方法のみが、この難題を解決するのに十分なほど有力であると考えられる。
【0009】
cDNAマイクロアレイは既に、以下の例を含む多くのケースにおいて成功を治めている:明所および暗所でのA.thalianaの萌芽(Desprezら、Plant J.14,643−652(1998))、ヒトT細胞における熱ショックおよびホルボールエステル調節遺伝子(Shenaら、Proc.Natl Acad.Sci.USA 93,10614−10619(1996))、若および老齢マウス(Lee、Science 285,1390−1393(1999))、および血清刺激に対する応答における、ヒト線維芽細胞における遺伝子発現の時間的プログラム(Iyer,V.R.ら、Science 283、83−87(1999))。マイクロアレイの実行の多くの局面が、最近、Nature Genetics 21、増刊(1999)の特集で総説されている。今まで、多くの場合、cDNAアレイは、ガラススライド上に印刷されていた。支持体としてのガラスは、多くの利点を有している。ガラスは、耐久性のある、非多孔質の物質であり、特有の蛍光性が少ない。しかし、他方で、ガラス上のマイクロアレイの各ドットの装填量は、ナイロンメンブレン上よりも低い。結果として、ガラス上のマイクロアレイでは、高濃度、典型的には、1アレイ当たり、50−200μgの総RNA、または数μgのmRNAの蛍光標識プローブを、各ハイブリダイゼーションにおいて用いることが必要である(Dugganら、Nature Genetics 21、増刊、10−14(1999))。このような量のRNAは通常、入手できず、この事実は、可能なcDNAマイクロアレイの実行を制限する。このマイクロアレイに不利な、cDNAに関する別の問題は、cDNAライブラリのクローン挿入物から抽出されるPCR産物(Gerholdら、TIBS 24、168−173(1999))が、おそらくは、至適なハイブリダイゼーションプローブではないことである。なぜなら、クローン挿入物は、非常に異なる長さ(0.3−3.0kb)およびGC含量を有することがあり、そのため異なる融点を有し得るからである。これは、特定のハイブリダイゼーション条件下でのマイクロアレイ中の異なるプローブのハイブリダイゼーションの効率が非常に顕著に異なり得ることを意味し、これにより、発現プロフィールが実験条件に依存することになる。最後に、ガラス上のアレイでのハイブリダイゼーションのためのcDNA標的が蛍光標識された場合、このアプローチは1つの実験中の対照と試験試料との直接比較を可能とするが(Cheungら、Nature Genetics 21、増刊、15−19(1999))、蛍光プローブの感度は、放射性または酵素結合されたプローブの感度よりも低い。蛍光プローブはまた、分析の間に退色することがあり、アレイを再度走査することが不可能となる。大事なことを1つ言い残したが、蛍光を分析するために必要なレーザースキャナおよび他の装置の価格は、cDNAマイクロアレイを広く実行するには、依然として高すぎる。
【0010】
マイクロアレイは、莫大な数の遺伝子を同時に記述する、単純かつ包括的な方法を提供する。Cheungら、Nature Genet.21、15−19(1999)、ならびにBrownおよびBotstein、Nature Genet.21、33−37(1999)によって報告されているように、アレイ調製技術は近年、完成されているが、アレイデータの定量および分析のための技術は、未だ、発展段階にある。上記のように、アレイは、一般に、正常な生物学的および疾患プロセスの研究、および差次的遺伝子発現のプロファイリングのような、広範囲の用途を見いだしている。従って、アレイデータの分析は、少なからぬ研究的興味を引いている。発現プロファイリング実験の最初の工程なので、アレイイメージの分析および定量は、それに続くデータマイニングおよび探査の精度に対して、重大な影響を及ぼす。しかし、市販のパッケージのコストの高さにもかかわらず(Bowtell、Nature Genet.21、25−32(1999))、定量および分析のための手順は、未だ、時間がかかり、退屈である。いくつかの市販のパッケージは、遺伝子発現を抽出するために、剛直なテンプレートグリッドを用い、そしてそのテンプレートに重ねる際に、1ピクセルまでの精度が要求される。初めて使用するユーザーの場合、2つのアレイの単純な比較に、数時間かかることもある。さらに、多くの市販のソフトウエアパッケージは、アレイの整列のみならず、結果の信頼性の評価もまた、操作する人間に依存する。さらに、遺伝子発現の検出のための現在入手可能なシステムの全ては、欠点を有している。特定の遺伝子の存在または発現が過剰であることに起因するブリーディングが、いくつかの市販のフィルタの問題であり、1つのスポットから隣接のスポットへのブリーディングが、隣接のスポットについての結果をあいまいにする。蛍光標識は退色するので、永久的記録は別の技術によってなされなければならない。検出の感度は低い。
【0011】
これらの問題のいくつかは、より特異的なプライマー混合物を用いることで、最小化されている。ランダムプライミングによって生成するcDNAプローブは、ほぼ全てのRNA種の中に、等方性の標識を分配する。多くの標識種は、非特異的バックグラウンドハイブリダイゼーションにのみ寄与するか、あるいは多くの異なるcDNA断片に対して交差ハイブリダイズする。アレイ上に提示される遺伝子に対して相補的な配列である標識の割合は最小限である。標識は、オリゴ(dT)プライマーを用いて、poly A+RNAに濃縮され得る。しかし、多くの細胞はいつでも数千の遺伝子由来のmRNAを含むので、プローブは主として、所望されない交差ハイブリダイゼーションに寄与し得る、アレイ上に提示されない配列からなる。共通の配列を排除するためのプローブの選択は、役立つ。これらの問題に向けられる別のアプローチは、アレイ上の遺伝子の数を減らすことである。さらに別のアプローチは、各アレイに複数の試料を適用して、結果を平均することができ、異常な結果を容易に同定できるようにすることである。
【0012】
しかし、これらの技術はいずれも、マイクロアレイの分析に付随する問題を排除していない。遺伝子およびESTのマイクロアレイの分析のための、感度の高い、正確な、再現性のある手段に対する要求は未だ存する。単に定性的な検出ではなく定量的な検出の必要性もまた存在する。
【0013】
従って、本発明の目的は、多数の遺伝子、cDNAまたはESTのマイクロアレイにおける遺伝子発現を正確に検出するための方法および材料を提供することにある。
【0014】
本発明の更なる目的は、マイクロアレイ中で遺伝子を定量ならびに検出するための方法および材料を提供することにある。
【0015】
本発明の別の目的は、マイクロアレイ、ノーザンブロット、サザンブロットまたはDNAハイブリダイゼーションを用いる他の技術で使用するための、遺伝子発現の非放射性または非蛍光アッセイを提供することにある。
【0016】
(発明の要旨)
例えば、量が非常に少なく、そしてスポットが非常に近接して位置し、その結果、激しい反応が隣接のスポットまで流れ出し得るような厄介な状況となり、そのため近隣の部位の反応の精度を不明確にするような、コンビナトリアルライブラリにおける、マイクロアレイにおける遺伝子発現またはハイブリダイゼーションの検出のための方法が開発された。このアッセイは、検出のためにジゴキシゲニン酵素アッセイを用いる。
【0017】
実施例は、酵素検出系の有用性を示す。所与の培養細胞試料に対して特異的なEボックス関連遺伝子の転写的に調節されたプロフィールが、目的の培養物から単離されたRNAから産生されたユニークなジゴキシゲニン(DIG)標識cDNAによって決定された。この特異的酵素標識プローブは、DIGに対するアルカリホスファターゼ結合体化抗体の比色的評価によって、ハイブリダイゼーション反応強度を検出するという、最終結果を可能にする。Eボックスマイクロアレイの各位置上の酵素の沈着は、放射性プローブで曝露時間のために必要とされる長い遅延の問題なしに、そして蛍光プローブアプローチに関連する光漂白および高バックグラウンド反応の問題なしに、CCDカメラに取り付けた直立式顕微鏡によって、容易に分析される。酵素的アプローチは、同じ様式で制御される遺伝子発現のサブグループを分析するように、遺伝子スクリーニングの仕事を注文に応じて適合(custom−adapt)させる、ユーザーフレンドリーな設計者のアプローチを提供する。このアッセイは、非常に感度が高く、0.02ナノグラムという少量の検出を可能とする。
【0018】
スポットを正規化するソフトウエア分析を用いて、マイクロアレイフォーマットでのDNAの発現の分析の信頼性を高めるための方法もまた、開発されている。このプロセスは、起こり得るアレイの空間的な歪曲にもかかわらず、大規模なアレイデータを自動的に定量するために、変形可能なテンプレート技術を用いる。変形可能なテンプレートの各ノードは、遺伝子スポットを表し、そして勾配降下ルールに従って繰り返され、これが、データミスマッチエネルギーとテンプレート変形エネルギーとを組み合わせたエネルギー関数を最小化する。
【0019】
分析のための正規化方法の有用性は、加齢によってその転写レベルが変化したマウス肝臓における遺伝子ファミリーの同定研究において実証された。市販のcDNAマイクロアレイを用いて、若いマウス由来の肝臓mRNAレベルを、加齢したC57BL/6雄マウスに対して分析した。若いマウスおよび加齢マウスの肝臓由来のRT−cDNAの、588遺伝子のマウスcDNAマイクロアレイ(ClonTech Atlas Mouse cDNA Expression Array)に対するハイブリダイゼーションは、その活性が組織の機能および正常な生理学的状態の修復および維持のために重要な、特定の遺伝子のファミリーの発現における、特異的な、調和した加齢関連の変化を示す。これらの遺伝子ファミリーは、腫瘍サプレッサー、細胞周期レギュレーター、および種々のストレス応答およびシグナル経路成分を含む。32P−標識ssRT−cDNAをマイクロアレイハイブリダイゼーションアッセイのためのプローブとして用い、mRNAレベルを非常に高い存在度から非常に低い存在度までの範囲で変動させた。本明細書中に記載されるこのプロセスは、より優れた結果を得ることを実証した。
【0020】
(発明の詳細な説明)
2つの方法論が、遺伝子検出のマイクロアレイ分析の分解能および感度を高めるために開発された。第1は、発色団検出アッセイであり、マイクロアレイ、ノーザンブロット、サザンブロット、およびDNAハイブリダイゼーションの決定のための他の技術における発現量の決定を促進する。第2は、遺伝子アレイを分析するための、迅速かつ信頼性のあるアプローチであり、アレイ中の発現スポットを抽出するために、変形可能なテンプレートを用い、これは、信頼性のない発現を自動的に同定することが可能である。この自動化された繰り返しは、定量におけるヒューマンエラーをかなりの程度まで低減し、そしてアレイを比較するプロセシング時間を、既存のパッケージに比べて10倍、至適化する。
【0021】
(マイクロアレイの作製のための装置)
図1a−1eは、生物学的物質のマイクロアレイの形成のための装置を示す。図1aおよび1bに示すように、装置の基部は防振台1である。台1の上に、第1の水平線形ガイド2によって搭載されているのは、プラットフォーム14である。プラットフォーム14は、キャリッジ(図示せず)を通じてガイド2中の親ねじのような駆動機構(図示せず)に接続している。水平線形ガイド2は、駆動機構に接続した、コンピュータ制御されるモータ5aを支持し、これが、第1の線形ガイド2に沿ったプラットフォームの前後運動をもたらす。モータ5aはコンピュータ13に増幅器15および運動制御板28を介して連結している。
【0022】
プラットフォーム14は、脱着可能な試料貯蔵部11を所定の位置18に保持するように設計されている。図1bに示すように、試料貯蔵部11は96ウェルのマイクロタイタープレートである。プラットフォーム14はまた、一連の基板12を保持し、これは、基板の下のプラットフォーム上の穴21を通じて吸引することによって作り出される吸引手段によって、その位置に保持されている。
【0023】
図1aおよび1bでわかるように、台1の対向する両側は垂直の立ち上がり6であり、これは、プラットフォーム14および第1の線形ガイド2の上方にまたがるように、実質的に横方向に取り付けられた第2の水平線形ガイド3を支持する、上端を有する。第2の水平線形ガイド3は、キャリッジ(図示せず)とねじで契合した親ねじのような駆動機構(図示せず)に接続したコンピュータ制御モータ5bを支持し、これはガイド3に沿って、モータ5bの作動によって異動し得、増幅器16および運動制御板28を介してコンピュータ13に接続している。
【0024】
第3のガイド4は、第3の線形ガイド4が第1の線形ガイド2および第2の線形ガイド3に対して実質的に直角であるようにして、キャリッジによって第2の線形ガイド3に取り付けられている。コンピュータ制御モータ5bによって、第3の線形ガイド4は、キャリッジにより、第2の線形ガイド3の軸に沿って前後に移動し得る。第3の線形ガイド4内の駆動機構、例えば、キャリッジとかみ合う親ねじは、更なるコンピュータ制御されるモータ5cによって、第3の線形ガイド4が垂直に移動すること、および移動の範囲内の任意の所望の位置に位置決めされることを、可能にする。コンピュータ制御は、移動制御板28に接続した、増幅器17に対する、モータ5aの接続によって達成される。線形ガイド2、線形ガイド3、線形ガイド4および3つのキャリッジの使用は、三次元における移動を提供する。
【0025】
図1cに示すように、第3の線形ガイド4の下端近くに、サンプリングマニホルド9が取り付けられ、これは、試料貯蔵部11中の4つの試料位置から4つ全てのサンプリングニードル8によって、同時に試料をピックアップすることができる間隔で、マニホルドに沿って線状に間隔を空けた4つのサンプリングニードル8を含む。サンプリングマニホルド98は、2つの位置の間を、サンプリングマニホルド9と第3の線形ガイド4との間を接続する空気シリンダ10の作動によって移動することができる。図1cに示すように、実線で、サンプリングマニホルド9は、サンプリングおよびクリーニングのための「下降」位置にある。第3の線形ガイド4が再度位置決めされているとき、サンプリングマニホルドは、破線で表されるように、「上昇」位置に旋回する。
【0026】
第3の線形ガイド4の基部は、その上に搭載された圧電インクジェット7を有し、サンプリングニードル8は、マイクロライン導管34によって、圧電インクジェット7に接続する(図1c)。各サンプリングニードル8は、導管34を通じてマイクロポンプ35に接続し、そこからマイクロ弁36に接続する。各マイクロ弁36は、ポンプ35から送達される流体が、対応の圧電インクジェット7、あるいは廃棄に、選択的に向けられ得るように、調節可能である。
【0027】
図1bに示すように、2つの重力オーバーフロー貯蔵部24、25が、隔離台1上の、プラットフォームの背後に、第1の線形ガイド2の対向する両側に位置して存在する。貯蔵部24、25は、クリーニング溶液を含み、これは、所望であれば、装置の内部を通ってポンプで注入される。図1dに示すように、このようなオーバーフロー貯蔵部24、25は、オーバーフロー貯蔵部の下方の位置に流体取り入れ口40を備え、この中に、目的の溶液が流体貯蔵部41からポンプ44で送られる。オーバーフロー貯蔵部の上の部分には、流体オーバーフロー開口部42があり、ここから、オーバーフロー貯蔵部中の液体が、流体貯蔵部41に戻る。オーバーフロー貯蔵部は、さらに、サンプリングニードル8を挿入させるための開口部43を頂部に備える。
【0028】
また、防振台1の上には、2つのクリーニングボックス26、27(図1b)が、第1の線形ガイド2の対向する両側に、重力オーバーフロー貯蔵部24、25の外向きに、位置している。図1eに示すように、各ボックスの頂部には、開口部51、52が設けられ、サンプリングニードル8および圧電インクジェット7を各々、収容するようになっている。各ボックス26、27は、その内側に、洗浄流体を洗浄流体貯蔵部(図示せず)からサンプリングニードル8および圧電インクジェット7の外側表面に送達するための、ノズル50を備える。ボックスの下部には、出口ポート53が設けられ、これを通じて、廃洗浄流体が、真空トラップ中に吸い出される。
【0029】
操作時には、多数の基板12がプラットフォーム14上に配置され、そして選択された試料が試料貯蔵部11中に入れられる。第1の線形ガイド2の上に装着されたプラットフォーム14は、サンプリングマニホルド9がサンプリングの位置に来るような位置に移動する。サンプリングマニホルド9は、空気シリンダ10の作動によって降下し、そして第3の線形ガイド4が降下して、サンプリングニードル8を試料貯蔵部11の中に配置する。マイクロアレイに入れられる試料の量が、サンプリングニードル8を通じて、マイクロポンプ35によって取り出され、そして導管34を通じて、圧電インクジェット7に送達され、そしてサンプリングマニホルド9が元に戻る。圧電インクジェット7は基板12の上方に位置決めされ、そして圧電インクジェット7が試料を基板12上に送達する。このプロセスが、複数の試料が所定の位置の選択された基板12に送達されて、マイクロアレイを形成すべく、繰り返される。
【0030】
試料の相互汚染を防ぐために、サンプリングニードル8、導管34、マイクロポンプ35、マイクロ弁36、および圧電インクジェット7は、異なる試料の取り出しの間に、クリーニングされる。これは、2つの重力オーバーフロー貯蔵部(1つは(24)塩水を含み、他方(25)は水を含む)を用いて行われる。塩水または水がサンプリングニードル8によって取り出されて、導管34を通って圧電インクジェット7まで送達されて、系を洗い流す。この後に、クリーニングボックス26、27を用いて、水および/または空気がサンプリングニードル8および圧電インクジェットの外側表面に吹き付けられる。
【0031】
プロセスの全てが自動化され得る。動作制御、デジタル作動、試料プロセシング、およびマイクロポンピングは全て、そのために設計された特別のコンピュータプログラムを用いて、コンピュータによって制御され得る。重力オーバーフロー貯蔵部を通じての流体の再循環のような、特定の機能は、作動中、連続的に動作し得、コンピュータ制御は必要ない。
【0032】
種々の液体試薬が、記載した装置を用いて分配され得る。例えば、液体はDNA、RNA、改変核酸および核酸アナログ、ペプチド、抗体、抗原、酵素、または細胞を含み得る。この装置はまた、アクチベーターまたはインヒビター流体を分配し得る。アクチベーター流体は、基板に可能な結合を作るもの、あるいは先に配置された試薬との合成反応を引き起こすものである。インヒビター流体は、基板上の領域を保護して、その領域中の物質が反応するのを妨げる。
【0033】
圧電インクジェット7は、好ましくは、ドロップ−オン−デマンドプリンタヘッドであり、これは、計測された少量の液体を、迅速かつ正確に送達し得る。送達される物質の量は、具体的な用途に依り、そして、例えば、10から1000ピコリットル(pl)、好ましくは20から100pl、そして最も好ましくは35plであり得る。試料貯蔵部の例は、96ウェルおよび384ウェルマイクロタイタープレートおよびエッペンドルフTMチューブを含む。サンプリングデバイスの例は、サンプリングニードルを含み、これは、ステンレス鋼の穴あき管で作製され得、シリンジチップを含み得る。
【0034】
重量オーバーフロー貯蔵部およびクリーニングボックスは、任意の適切な位置に位置し得る。
【0035】
マイクロポンプ35は、間欠的または連続的に作動し得る。間欠的な作動は、動作制御板の制御の下で、AC→DCリレーを用いて達成され得る。
【0036】
装置の構成要素は、組立および装置の使用のための指示と共に、組み立てように分かれた状態で提供され得る。
【0037】
(ジゴキシゲニン酵素検出アッセイ)
実施例2で実証するように、核酸分子間のハイブリダイゼーションの程度を可視化するための非常に感度および精度の高い手段が開発されてきている。このアッセイは、ジゴキシゲニン(DIG)を利用して、標的核酸分子、例えば、遺伝子特異的プライマーから生成されるcDNAを標識し、続いて、アルカリホスファターゼ(AP)のような酵素と組み合わされた抗ジゴキシゲニン抗体と共にインキュベートして、比色的または化学発光検出を行う。
【0038】
この方法は、核酸分子、典型的にはcDNAを標識する工程、標識された分子をハイブリダイズする工程、リンスしてハイブリダイズしなかった物質を除去する工程、ハイブリダイズされた物質を酵素結合抗ジゴキシゲニン抗体、典型的にはアルカリホスファターゼとインキュベートする工程、結合した酵素を明らかにするために染色する工程、およびデータ収集のためにスキャンする工程を包含する。この方法は、速く、最大で2日間を必要とし、そして4マイクログラム以下の試料を検出し得る。
【0039】
アッセイを使用して、0.02ナノグラムという少ない核酸を検出し得る。これは、出発物質(すなわち、標的とされる組織から単離されるDNAまたはRNA)が1〜2マイクログラムと少なくともよいこと意味する。出発物質はジゴキシゲン法によって標識され得、次に、この標識された核酸をマイクロアレイでのハイブリダイゼーションのために用いる。AffimatrixおよびClonTechで現在用いられている方法は、出発物質として、得ることが困難なmRNAを用いることを必要とし、少なくとも100〜1,000マイクログラムの総RNAを必要とする。これは、本明細書に記載のアッセイで検出され得る0.02ナノグラムのために必要な1〜2マイクログラムの総RNAと、対照的である。
【0040】
アッセイは、色素原、化学発光または比色基質を切断し得る酵素を用いる。好ましい実施形態において、酵素は、アルカリホスファターゼであり、そして基質は、3−(4−メトキシスピロ{1,2−ジオキセタン−3,2’−(5’−クロロ)トリシクロ[3.3.1.1]デカン}−4−イル)フェニルリン酸二ナトリウム−CSPDである。好ましい実施形態において、抗体のインキュベーションの後、反応した基質は、5−ブロモ−4−クロロ−3−インドリルホスフェート、トルイジン塩(BCIP)、およびニトロブルーテトラゾリウムクロリド(NBT)で、検出緩衝液中で染色される。
【0041】
(アレイ画像からの遺伝子発現の抽出)
理想的なアレイ画像において、遺伝子配列は、同じサイズの均等な間隔のスポットとして表される。しかし、スポットの印刷におけるランダムな攪乱のため、あるいは所望されない温度によって引き起こされるメンブレンの歪みのために、スポットはその理想的な位置から移動され得る。単純なグリッドのテンプレートは、遺伝子発現を抽出するには不十分である。これらのスポットの変動を克服するために、遺伝子スポットのひずみを追跡するための、形を変化させる能力を有する変形可能なテンプレートが開発されている。アクティブシェイプモデル(Cootesら、Computer Vision and Image Understanding 61、38−59(1995);Ostu,N.IEEE Trans.on Syst.Man & Cybern.8、62−66(1978);およびAdryanら、BioTech.26、1174−1179(1999))および変形可能なテンプレート(Serra,J.Image Analysis and Mathematical Morphology,Academic Press、London、1982;Haralickら、IEEE Trans.on Patt.Anal.Mach.Intell.9、532−550(1987);Ostu,N.IEEE Trans.on Syst. Man & Cybern.8、62−66(1978))が、所望の目的物の形状に関連する事前情報を、アクティブ「スネーク」モデルの開発に組み入れることによって、ひずんだ目的物を検出し、場所を突きとめるために開発された。
【0042】
一般に、変形可能なテンプレートマッチング技術は、モデル駆動型およびデータ駆動型の分析を、エネルギー関数および一組の正則化パラメータによって統合する。2つの因子、データミスマッチおよびテンプレート変形が考慮される。通常、基準関数は、これらの2つの因子を定量化するために定義される。1つは入力パターンが変形したテンプレートとどのくらい異なるかを測定し、そして他方は、テンプレートが変形している程度を測定する。テンプレートミスマッチングまたは分類の適用において、最適なマッチングは、これらの2つの基準の加重合計を最小化することによって達成される。加重因子は正則化パラメータと呼ばれ、これは、テンプレート変形とデータミスマッチとの間にトレードオフを与える。
【0043】
(テンプレート表示)
実施例で記載されているように、生の画像をClonTech cDNAマウスアレイからスキャンする。アレイの入力画像の三次元ビューにおける各試料スポットは、グレーレベル空間中の局所的最小(local minimum)に対応する。次に、適切な情報を抽出するために、以下のモデルを用いる。
【0044】
遺伝子試料のアレイは、同じサイズのN個の円のスポットの組として表される。各スポットは、
【0045】
【数1】

Figure 2004502129
【0046】
で表され、ここでC(P,r)はユークリッド座標P=(x,y)を中心とする、半径rの円である。スポットの強度は、円の内側のピクセル強度の平均値
【0047】
【数2】
Figure 2004502129
【0048】
である。マイクロアレイスポットの半径は、印刷および画像化条件によって決まり、全アレイにわたって、測定され、かつ定数として設定される。従って、プロトタイプテンプレートは一般的なアレイについての事前知識に基づき、これはアレイの周囲の均等な間隔の円のグリッドとして設定され得る。変形可能なテンプレートを使用する目的は、データミスマッチおよびテンプレート変形因子の両方に関して、全てのスポットの中心の最適な位置を見いだすことにある。
【0049】
(データミスマッチエネルギー)
データミスマッチエネルギーは、入力パターンに対する変形したテンプレートの適合度を測定する。入力画像がグレーレベルなので、そして遺伝子発現が局所領域の積分強度によって表されるので、データミスマッチエネルギーは、積分強度の式で定義され得る。
【0050】
【数3】
Figure 2004502129
【0051】
ポテンシャル関数
【0052】
【数4】
Figure 2004502129
【0053】
を各スポットで定義すると、データミスマッチエネルギーは、
【0054】
【数5】
Figure 2004502129
【0055】
と単純化され、ここでφはi個目のノードの重みであり、そしてrは試料スポットについての予め規定された半径である。ポテンシャル関数は、局所領域にわたるグレーレベル値の積分であり、これは平滑化能を有する。実験結果は、小さな摂動およびノイズに対するその堅牢さを示す。
【0056】
(テンプレート変形エネルギー)
テンプレート変形エネルギーは、変形したテンプレートのプロトタイプテンプレートからの偏差を測定する。テンプレート変形から並進(translation)は、メンブレンの歪みによって、起こる。変形の程度を定量化するために、各スポットについての変形エネルギーを、変形コントロールノードPのその所定の位置Pi0からのユークリッド距離として定義する:
【0057】
【数6】
Figure 2004502129
【0058】
ここで、λはi個目のノードの多様性(flexibility)である。テンプレート変形エネルギーの最小化は、ノードが摂動および局所のバックグラウンド中のノイズによって引きつけられることを妨げることを助け、それゆえ、提案されたアルゴリズムの堅牢さを増大させる。
【0059】
(緩和)
テンプレート変形およびデータミスマッチエネルギーを組み合わせると、全エネルギー関数を
E=αE+E (4)
として定義でき、αは、正則化パラメータである。
【0060】
試料スポットの局在化手順は、全エネルギーの最小化に対応する。この関数の最小値は、包括的な最適化法、例えば、動的プログラミング、グリーディサーチング(greedy searching)アルゴリズム、神経ネットワークなどを用いることによって得られ得るが、過大な計算のコストがかかる。アレイの各スポットは、所定の位置にプリントされているので、遺伝子スポットは、規則的なアレイの中に提示されることが仮定され、そのため、初期位置は、マトリックス全体の中の位置の数に従って、所定の部位で選択され得る。プロトタイプアレイテンプレートは入力アレイに十分近く配置され得ることもまた仮定される。従って、アレイスポットは、初期グリッドの周囲の局所的最小(local minimum)を見いだすことによって局在化され得る。これは、決定論的勾配降下技術(deterministic gradient descent technique)によって具現化される:
【0061】
【数7】
Figure 2004502129
【0062】
i=1,2,...,N、およびηは学習速度である。
【0063】
同位体アレイにおいて、各スポットの多様性および重みは同じに設定される。標的中心の位置は、(4)で定義されるエネルギーを最小化するように回帰され、これは、ゴムバンド上のノードの組として理解され得る;ノードの位置は、エネルギー場の局所的最小の底に下降する傾向にある。ノードの動きを制限し、そして学習速度に対する最適値の同調を回避するために、各繰り返しにおいてノードを、ΔxおよびΔyの符号に従って、1単位、移動させる。例えば、AtlasTMcDNAアレイの1つの機能グループ由来の遺伝子発現を抽出するために、3*3アウトレンジピクセル平滑化フィルタ(Ekstrom,M.P.Digital Image Processing Techniques、Academic Press,London、1984)を適用して、白黒ノイズsalt−and−pepper)を減少させる。メンブレンは、ハイブリダイゼーションおよび洗浄の手順の間に歪み、その結果、調査中のメンブレンと所定のグリッドテンプレートとの間の正確なマッチを見出すことは不可能である。しかし、5回未満の繰り返しの後、変形可能なテンプレートの全てのノードは、(4)で定義される全エネルギー関数を最小化する安定した位置に来る。目視観察は、変形したグリッドテンプレートと遺伝子スポットとの間の良好な対応を確認する。
【0064】
(非信頼性領域の検出)
アレイハイブリダイゼーションにおいて、いくつかの強力なシグナルが、オートラジオグラフにおいて観察され、口語的に「ブリーディング」スポットと呼ばれる。これらの過剰発現シグナルは、それ自体の定量化のみならず、その近隣の遺伝子の定量においても問題を引き起こす。アレイデータの分析のための大多数の市販のパッケージは、ユーザーがブリーディングした遺伝子とその近隣を目視でチェックする必要があるか、あるいはこれらのスポットの存在を単に無視するかのいずれかである。過剰発現スポットの検出の失敗は、2つの遺伝子発現プロフィールの間の比較において、誤った結果を導き得る。本明細書に記載のアプローチの目的は、ブリーディング領域を自動的に同定し、そしてユーザーに定量結果の誤りの可能性を警告することにある。そのため、ユーザーは、それらのメンブレン中の問題のある領域の、単調で退屈な実体のない評価から解放される。
【0065】
以下の基本的な仮定は、一般的なアレイにおけるスポットについてなされている:
スポットは相互排除的である。
【0066】
各スポット内の強度の変化は、特定の範囲を有する。
【0067】
各スポットは、限定されたサイズの連結した成分である。
従って、過剰発現スポットの同定は、所定サイズより大きいスポットをフィルタで除くので、単純化され得る。形状に基づいて、数学的モルホロジーは、デジタル画像の処理のための効率的なアプローチを提供し、そして線形フィルタでは解決することが困難な画像プロセシング問題の解決に広く用いられている。適切に用いると、数学的モルホロジー的演算は、その本質的な形状特性を保存し、不適切さを除外することによって、イメージデータを単純化する傾向にある。基本的な数学的モルホロジー的演算は、侵食(erosion)と膨張変換である。侵食および膨張変換の合成に基づいて、開放(opening)と閉鎖(closing)が定義される。バイナリ画像の場合を考えると,Aを元のバイナリ画像のバイナリ「オン」ピクセルを表すポイントの組とし、そしてBを構造化要素(structuring element)のバイナリ「オン」ピクセルを表す点の組とする。基本的なモルホロジー的演算は以下のように定義される:
バイナリ画像Aのバイナリ構造化要素Bによる膨張変換、
【0068】
【数8】
Figure 2004502129
【0069】
バイナリ画像Aのバイナリ構造化要素Bによる侵食
【0070】
【数9】
Figure 2004502129
【0071】
バイナリ画像Aのバイナリ構造化要素Bによる開放、
【0072】
【数10】
Figure 2004502129
【0073】
バイナリ画像Aのバイナリ構造化要素Bによる閉鎖、
【0074】
【数11】
Figure 2004502129
【0075】
過剰発現スポットを正常な発現スポットと区別するために、円板の構造化要素、C(このサイズは検査中のアレイ上のスポットの上限である)を選択した。
C={(x、y)|x+y<R}、ここでRは理想的なスポットの最大半径である。
【0076】
過剰発現スポットの同定手順は、以下のように記載され得る:
ステップ1.入力画像F={f(x、y)|0≦x<M,0≦y<N}を包括的閾値技術、例えば、Ostuの閾値化法(Ostu,N.A IEEE
Trans.on Syst.Man & Cybern.8,62−66(1978))によって、最適な判別分析に基づいて、バイナリ化する:
G={g(x、y)|0≦x<M,0≦y<N}
【0077】
【数12】
Figure 2004502129
【0078】
Tは、Ostuの最適閾値である。
ステップ2.正常サイズのスポットを、構造化要素Cで、モルホロジー的開放によって、フィルターで除外する:
【0079】
【数13】
Figure 2004502129
【0080】
従って、非信頼性領域は、組:
【0081】
【数14】
Figure 2004502129
【0082】
で表される。
ステップ3.コントロールノードP=(x,y)を、もし
【0083】
【数15】
Figure 2004502129
【0084】
ならば、過剰発現スポットと同定する。
【0085】
実際、定量化の問題は、過剰発現のみに存するのではなく、その近隣のスポットにも存する。スポットの真の位置の位置決めの繰り返しの間に、いくつかのコントロールノードが過剰発現スポットに急速に誘引される。なぜなら、低いデータミスマッチエネルギー場がこれらのスポットの周囲に形成されるからである。この系において、遺伝子発現スポットは、もし対応のコントロールノードがその初期位置から遠くに移動したならば、非信頼性と標識される。
【0086】
(標識測定)
マイクロアレイでの定量的分析において、各スポットから放射される蛍光あるいは放射能の量は、そのスポットに会合した標識核酸プローブの量の表示である(AtlasTMcDNA発現アレイユーザーマニュアル、プロトコル#PT3140−1、バージョン#PR91208、7−9頁、1998)。3Dで表示される各スポットの強度は、試料スポットについての半球形状の仮定は定量的目的には十分ではないことを示す。以下の積分関数は、各スポットの容量を計算するために用いられる:
【0087】
【数16】
Figure 2004502129
【0088】
個別の画像において、積分は、合計で置き換えられ、そして円の面積を用いて、容量が正規化される:
【0089】
【数17】
Figure 2004502129
【0090】
ここで
【0091】
【数18】
Figure 2004502129
【0092】
は変形可能なテンプレートマッチングの繰り返しから得られた標的ノードである。正規化容量は、範囲[0,Imax]内の真の値であり、ここでImaxはピクセル値の上限である。8ビットおよび16ビットグレースケール画像について、Imaxは、各々、255および65535に等しい。
【0093】
(性能試験:自動化プロセシング対手動操作)
系を、2つのClonTechフィルターからの24サブ画像に基づいて調整した。調整ステージは、エネルギーの規定の中で最適な正規化パラメータを選択することを含む。系を17ClonTechフィルタからの204サブ画像、および研究所内で印刷した50バイオチップマイクロアレイ画像で試験した。試験結果は、スポットが相互排除的である場合、提案したモデルがスポットを申し分なく抽出することができることを示す。しかし、いくつかのスポットは、過剰発現されたものに誘引され、そのため定量手順に歪みを起こす。系はこれらの、誤りのスポットを自動的に同定することができるが、最終的な解決は、最適なプローブと実験条件の設計における改良を必要とする。表1は、AtlasTMアレイの分析における3つの系(ClonTechによってリリースされたAtlasImageTM1.0(http://www.clontech.com)、Johannes Gutenberg Unversityによって開発されたEstBlot(Adryanら、BioTech26,1174−1179(1999))、および本発明らの研究室で開発されたArrayAnalyzerを含む)の間の比較を列挙する。既存の系と比べて、本発明らの系は数倍速く働く。系の誤差を、1つのアレイに対して6回の定量手順を繰り返すことによって測定する。2つの因子が系の評価において考慮される:平均誤差
【0094】
【数19】
Figure 2004502129
【0095】
および最大誤差
【0096】
【数20】
Figure 2004502129
【0097】
、ここでμおよびδは、平均値、ならびに数回の繰り返しの中のi個目のスポットの測定における標準偏差である。表2は、ClonTechフィルタおよび研究所内で印刷したマイクロアレイの両方に対する2つの系の比較を列挙し、そして本明細書に記載の系が、既存の系よりも性能が優れていることが明らかである。提案されたアレイ画像分析法に伴う系の誤差を定量するために、2つの試料を比較し、そして以下の比較手順の局面が分析された:定量における誤差、比率における誤差、および正規化における誤差。定量における関連誤差は、δ/μとして定義し、ここでδおよびμは、この独立した6回の試験の間のi個目の標準偏差および平均値である。2つの試料の遺伝子発現を比較するために、本発明者らは、従来の倍率(fold ratio)の代わりに相対倍率を定義した。試料SおよびSについて、相対倍率は
【0098】
【数21】
Figure 2004502129
【0099】
として計算され、これは[−1,+1]の範囲の値である。正の値はSからSへのアップレギュレーションを示し、そして負の値はSからSへのダウンレギュレーションを示す。相対倍率は、従来のものと同様の意味を有するが、ただし、その値は正規化されており、理解し易い。例えば、RRF=±0.5は、2回でのアップまたはダウンレギュレーションに対応する。遺伝子の存在度と、比率における平均および最大誤差との間の関連を比較する。低、中、および高存在度として、正規化された存在度が[0,0.33]、[0.33,0.67]、[0.67,1]の遺伝子に関して、各カテゴリーについての比率の最大誤差は、各々、1.89%、4.89%および15.54%である。低存在度の遺伝子の中の割合は、定量におけるプロトタイプテンプレートの初期位置に対して、より、感度が高い。従って、この系は、中および高存在度のスポットの扱いにおいて、より信頼性が高い。表3は、スポットの自動化評価(信頼性標識)および定量的誤差の間の関連を示す。定量的研究は、自動的に同定された「非信頼性」位置が他の2つのカテゴリーよりも、より誤差を受けることを確認する。実際、「非信頼性」スポットの割合は、ハイブリダイゼーション手順の品質の指標として使用され得る。
【0100】
ArrayAnalyzerは、定量および比較関数の大部分を自動化する。これはAtlas cDNAアレイの異なる機能グループを、別々に処理し、従って、この系は、全てのタイプのアレイの処理へと容易に一般化されることが可能となる。一方で、ArrayAnalyzerは、異なるユーザー間の変動にも強い。スポットの定量は、ユーザーの主観的な判断よりもむしろ、インプット画像の性質に大きく依存する。大部分の市販の系は、人間のオペレータに結果の信頼性の評価を依存しているが、ArrayAnalyzerは自動的に、過剰発現スポットおよびその影によって引き起こされる潜在的な誤差を同定する。この系の固有の特徴の1つは、非信頼性の定量を放棄し、誤差を導く結果を予め除外する。配列依存性のハイブリダイゼーション特性および任意のハイブリダイゼーション反応に固有の変動に起因して、Atlasデータおよび任意の他のアレイデータは、半定量的であるに過ぎないと考えるべきであるのは、何の価値もない。アレイ実験の任意の興味深い結果を他のアッセイで確認して、RNAのレベルをノーザンおよび/または半定量的RT−PCR法を通じて測定することが常に必要である。
【0101】
要約すると、ここで提示されるコンピュータプログラムによって定義されるプロセスは、無差別なマイクロアレイ設計に固有の非信頼性の問題のいくつかに向けられる。さらなる解決は、マイクロアレイを、クラスターパターンで、「分割および征服(divide−and−conquer)」様式で、設計して、遺伝子をその固有の存在度のレベルに従って、グループ分けし、そして次にこれらをテンプレートに整列させることである。「分割および征服」アプローチは、また、汎用性を提供し、集中的な努力で、選択された遺伝子のクラスターのフォローアップ研究を可能とする。新たなレポートは、18,000から20,000遺伝子のテンプレートにおける遺伝子発現の変化を測定するためのマイクロアレイ分析アプローチの力を示す。本明細書に記載の方法は、大部分の変化が生じた領域を検出することを可能とし、綿密なフォローアップの確認を、他の分子的方法論、例えばノーザンブロット分析および/または半定量的RT−PCR分析を通じて可能とする。さらに、選択された領域はまた、コンピュータ自動化分析対手動デンシトメトリーによるトレーシングを比較するための、綿密な分析のために使用され得る。最終的には、任意のマイクロアレイ分析に関与するコンピュータ作業は複数の遺伝子変化を、最大の信頼性および再現性で、人的誤差を最小限にして、詳細に記録するべきである。この問題は、強力な数学的モデリングおよびコンピュータプログラムによって取り扱うことができるが、より重要なことには、これは、マイクロアレイを設計するときに心に浮かぶ必要がある。従って、遺伝子を生物学的系におけるその存在度のレベルに応じて遺伝子をクラスターにするための、「デザイナーバイオチップ」、ならびにコンピュータで自動化されたデータ分析のプロセシングの使用は、高スループット技術の現在の進行におけるバイオインフォマティクスの職務を容易にする。
【0102】
(実施例1:変形可能なテンプレートを用いた若齢および老齢動物由来のDNAの比較)
P.ChomcynskiおよびN.Sacchi、Anal Biochem.162,156(1987)に記載の技術に従って、総RNAを凍結した肝臓から、ホモジナイズした肝臓をグアニジウム/フェノール溶液で抽出することによって単離した。水性相をさらに、(25:24:1)フェノール:CHCl:IAAで抽出し、そしてグリコーゲンを遠心分離で除去した。RNAをエタノール沈殿で回収し、分光法で定量し、そしてゲル電気泳動で定性した。1.5μgの高品質Dnase処理総RNAを、588最適化プライマー(ClonTech)を用いた[アルファ−32P]dATP標識されたMMLV逆転写酵素cDNA合成において、使用した。組み込まれていない32P−標識化ヌクレオチドを標識化cDNAプローブから、重力溶離を用いたChroma Spin spinカラム(ClonTech)によるプロファイリングによって除去した。cDNA/RNAプローブを含む画分を68℃で1MのNaOHを用いて、一本鎖cDNAに変換し、そして1M NaHPO[pH7.0]で中和した。プローブを終夜68℃で、588PCR遺伝子産物を含む予備ハイブリダイズ(68℃、30分間)されたClonTechマウスマイクロアレイに、Ct−1DNAおよび剪断した鮭***の存在下、ExpressHybハイブリダイゼーション溶液(ClonTech)を用いて、ハイブリダイズした。メンブレンを4回、予め加温した2X SSC、1%SDSで洗浄し、次いで予め加温した0.1X SSC、0.5%SDSで2回、さらに洗浄した。メンブレンを次に、オートラジオグラフィーおよびホスホルイメージングのために、プラスチックラップで湿ったままラップした。
【0103】
ClonTech AtlasマウスcDNA発現アレイの分析において、オートラジオグラフフィルムを300DPI、8ビットグレースケールで、典型的な市販のフラットベッドスキャナ、Saphir Linotype−Hellによってスキャンした。得られた画像を、研究所内で開発されたソフトウエアパッケージArrayAnalyzerによって画質補正し、分析した。所望されない歪みを有するメンブレンを扱うために、変形可能なテンプレートを定義して、遺伝子発現を自動的に定量する。変形可能なテンプレート中の各ノードを、勾配降下ルール(これはデータミスマッチエネルギーおよびテンプレート変形エネルギーを組み合わせたエネルギー関数を最小化する)に従って繰り返す。理想的な遺伝子スポットは所定の半径の円でモデル化される。従って、遺伝子発現は、積分強度によって定量化され得る。ArrayAnalyzerはまた、「ブリーディング」領域を同定することが可能であり、そのため、ユーザーに、定量における潜在的誤りを警告する。後の分析において、これらの領域は注意深くチェックされ、そして論議から除かれる。2つの試料の遺伝子発現を比較するために、相対的倍率を従来の倍率の代わりに定義する。試料間の相対的倍率は、操作における人的誤差を考慮して、組毎の比較は中および高存在度の遺伝子において、より信頼性があることを示す。本文に記載の実験結果は各フィルタ毎、3回の繰り返しの平均に基づく。2つの試料の正規化において、ラムダDNAをネガティブコントロールとして選択し、そしてHPRT、MOD、およびG3PDHをポジティブコントロールとして選択した。線形正規化法を適用した。
表1 2つのClonTech Atlas arrayの定量における3つの系の性能
【0104】
【表1】
Figure 2004502129
【0105】
(1)AtlasImageTM1.0のプロセシングタイムは製造者の指示にで見積もられたもの。
(2)EstBlotおよびArrayAnalyzerのプロセシング時間は、Pentium(登録商標)400,348MB RAMで試験される。
この表において、「M」は手動操作を表し、「A」は自動化プロセシングを表す。ArrayAnalyzerのプロセシング時間の測定における演算子「」は、同じ手順の繰り返し時間を意味する。ArrayAnalyzerは一般的なアレイ分析について設計されているので、ClonTechのcDNAアレイ中の各遺伝子のグループおよびハウスキーピング遺伝子は個別のアレイとして処理される。従って、定量化関数は、各アレイに9回適用され(6回は機能グループ、3回はコントロール遺伝子)、そして比較関数が6回適用される。
表2 定量におけるシステムエラーの比較
【0106】
【表2】
Figure 2004502129
【0107】
2人の独立したオペレータが、プロトタイプテンプレートの初期位置(左上および右下隅)を与えるために必要である。各オペレータは、同じ手順を1つの試料に3回繰り返す。試験の間、人間のオペレータはグリッドテンプレートの初期位置を整列中に3つから10ピクセルまで置き換えたことが観察された。6回の繰り返しについては、2つの因子が系の評価に置いて考慮された:平均誤差
【0108】
【数22】
Figure 2004502129
【0109】
および最大誤差
【0110】
【数23】
Figure 2004502129
【0111】
ここでμおよびδは、i個目のスポットの測定における、平均値、ならびに標準偏差である。
表3 異なる標識のスポットについての誤差の比較
【0112】
【表3】
Figure 2004502129
【0113】
実験条件は表3と同じである。この表は、スポットの自動化評価(信頼性標識)と定量的誤差との間の関係を示す。2つの因子が考慮される:平均誤差
【0114】
【数24】
Figure 2004502129
【0115】
および比率の比較における最大誤差の平均である。自動的に同定された「非信頼性」位置は他の2つのカテゴリーよりも損害を受けていることが示される。実際に、「非信頼性」スポットの割合は、ハイブリダイゼーション手順の品質の指標として用いることができる。
【0116】
(実施例2:Eボックス結合関連遺伝子発現のマイクロアレイ分析についてのジゴキシゲニン酵素的検出)
発現プロファイリングのためのcDNAマイクロアレイの利点および問題を具現化するために、ジゴキシゲニン(DIG)を遺伝子特異的プライマーから生成される標的cDNAを標識するために利用することに基づき、引き続き、アルカリホスファターゼ(AP)と結合した抗ジゴキシゲニン抗体と共にインキュベートし、そして比色的または化学発光検出を行う、新規なアプローチを開発した。多くの遺伝子のプロモーター領域に位置する、Eボックス結合要素(CAGGTG)を含む遺伝子の組をプローブとして選択した。おそらく、Eボックス結合遺伝子の最もよく知られた代表はc−Mycであり、このトランス活性化活性は、細胞サイクルの調節、増殖、およびアポトーシスにおいて重要な役割を果たしている(Eilers,M.Mol.Cells 9,1−6(1999);Dang,C.V.Mol.Cell.Biol.19,1−11(1999);FacchiniおよびPenn FASEB Journal 12、633−651(1998))。c−Mycについて相互作用または調節的発現をする遺伝子、ならびにその発現がEボックス結合依存的であるいくつかの標的遺伝子が、このマイクロアレイに含まれる。ハイブリダイゼーションプローブの標識化のための酵素的アプローチと組み合わせれた、これらのカスタム設計されたマイクロアレイは、遺伝子発現の特定のサブグループの高スループット遺伝子スクリーニングアッセイのための、安価な、ユーザーフレンドリーな系の開発を可能にする。
【0117】
(材料および方法)
(アレイ形成のためのプローブの選択)
Eボックス結合タンパク質、ならびにc−Myc−調節、−相互作用および標的遺伝子を、異なるデータベース−GeneAtlas(http://www.citi2.fr/GENATLAS)、GeneCards(http://bioinfo.weizmann.ac.il/cards)、GenBank(http://www.ncbi.nkm.nih.gov/Web/Genbank)およびPubMed(http://ncbi.nlm.gov/PubMed)から選択した。Unigene(http://www.ncbi.nlm.nih.gov/UniGene/index.html)クラスター数および配列を用いて、遺伝子を同定し、そしてその固有性を確認した。9つのハウスキーピング遺伝子、ならびにHeLa細胞DNAをポジティブコントロールとして選択し、ネガティブコントロールとして、ラムダDNAおよび2×SSC(2×標準塩溶液−0.3M NaCl、30mM クエン酸Na、pH7.0)を選択した。各遺伝子について、一組のプライマーを、Primer3ソフトウエア(RosenおよびSkaletsky(1998)Primer3.コードはhttp://www−genome.wi.mit.edu/genome software/otherprimer3.htmlから入手可能)の補助の下に、生成した。プログラムパラメータは、アンプリコンが80℃に近くなるが88℃を越えず、あるいは75℃未満となり、アンプリコンの長さが一般に約450bp(いくつかの外層は300から700bpの間)であり、プライマーアニーリング温度が約60℃、平均プライマー長が23bpとなるように、選択した。全てのアンプリコンの配列は、著作権のあるソフトウエア(BLASTIN,FASTA)を用いて、注意深く確かめ、繰り返し要素と他の関連の配列との相同性を回避し、そしてまた同じファミリー由来の遺伝子間を区別した。全ての選択された遺伝子の全リストを表4に示す。
【0118】
(DNA、RNAおよびmRNA単離)
総RNAおよびDNAを、約10HeLa細胞培養物および新鮮な血液アリコートからTrizol試薬(Gibco BRL、Burlington,ON)から単離されたヒト末梢リンパ球から、単離した。DNAおよびRNA濃度および品質を、分光法および0.8または2%アガロースゲル中でのゲル電気泳動によって、各々、求めた。ポリ(A)RNAを150μgの総RNAから、Oligotex mRNAキット(Qiagen、Mississauga、ON)を用いて、製造者の指示に従って、単離した。
【0119】
(プローブの増幅および精製)
製造者の指示に従って、40μlの反応中で、200UのMMLV(Gibco BRL、Burlington、ON)を用いて、10μgの総RNAを逆転写した。各プライマーの組についての2つのPCR反応を、総容量100μLで、GeneAmp PCRシステム9700(PE Applied Biosystems,Norwalk,CT)中で行った。各50μlの反応(10mM Tris−HCl、pH8.6、50mM KCl、0.1%Triton X−100、1.5mM MgCl、0.5mMの各dNTP、20pMの各プライマー、1.25UのTaq DNAポリメラーゼ(Amersham Pharmacia Biotech,Baie d’Urfe、QC)および10μlのRT反応または100ngのゲノムDNA)を以下のように熱サイクルにかけた:第1サイクル、94℃で5分間、35サイクル、94℃で45秒間、60℃で1分間および72℃で30秒間、最終サイクル、72℃で7分間。RT−PCRで増幅され得ないプローブを、プライマーが遺伝子の3’領域で選択される条件で、ゲノムDNAから抽出し、PCR産物のサイズおよび収率は、2%アガロース中のゲル電気泳動によって決定した。次にPCR産物を、または分取アガロースゲル電気泳動の後に(副産物が決定されるなら)、溶液またはアガロースゲルバンドから、GFXカラム(Amersham Pharmacia Biotech,Baie d’Urfe、QC)を用いて精製した。精製の後、全てのプローブの濃度をアガロースゲル電気泳動で見積もり、そして約100ng/μlに調節した。
【0120】
(ロボティックアレイ)
2×標準塩溶液(SSC)中の精製されたPCR産物を、GeneMachinesTMOmniGridマイクロアレイ(Genomic Instrumentation Services,San Carlos、CA)にChipMaker2チップ(Telechem International、San Jose、CA)を装着して用いて、384ウェルプレートから三連でアレイを形成した。ドット間の空間は400μmであった。マイクロアレイを、標準的なガラススライドにテープで取り付けた、Hybond−NナイロンメンブレンまたはHybond−N+ナイロンメンブレン(Amersham Pharmacia Biotech,Baie d’Urfe、QC)の上に印刷した。各10スライドとメンブレンの前後に、通常のスライドを挿入して、印刷品質を検査した。アレイを形成した後、メンブレンに50mJでUV照射(GS Gene Linker、Bio−Rad、Hercules、CA)して、DNAを固定化した。アレイを含むメンブレンのフラグメント(約1×1.5cm)を切り出し、沸騰水中で5分間、変性し、0.1%SDSで5分間リンスし、そしてプレハイブリダイゼーションに用いた。UV照射工程の後、メンブレンはガラススライドに付けたまま保存し得る。
【0121】
(ハイブリダイゼーションのためのDIG標識cDNAの調製)
遺伝子特異的プライマー(GSP)の初期混合物を製造した。この目的のために、プローブを調製するためのRT−PCR反応に用いた1nMの各プライマーを総量250μlで混合した。ジゴキシゲニン(DIG)標識された標的をRT反応によって以下のように生成した:総量14μlの、1μlのGSP、4μgの総RNA、およびRNAアーゼを含まない水を、65℃で15分間加熱して、RNAを変性させ、そして次にプライマーアニーリングのために、室温で5分間保持した。あるいは、2μgのmRNAおよび400ngのオリゴ(dT)12−18プライマーを用いた。酵素製造者から供給された8μlの5×第1標準緩衝液、2μlのdATP、dCTPおよびdGTPの10mM混合物(最終濃度各500μM)、4μlの0.1M DDT、0.7μlのRNAガード、31U/μl(Amersham Pharmacia Biotech、Baie d’Urfe、QC)、10μlの19:1 dTTP:DIG−11−dUTPの2mM混合物(Roche、Laval、QC)および2μl(200U/μl)のモロニーマウス白血病ウイルス逆転写酵素(MMLV RT)(Gibco BRL、Burlington、ON)を含む反応混合物を加えた。反応を37℃で1時間行い、次いで、94℃で5分間、酵素切断をGeneAmp9700で行った。あるいは、Omniscript 逆転写酵素(Qiagen,Missisauga、ON)を製造者の指示に従って用いた。標識化反応は、GFXカラム上で精製した。この工程は、100bpより短い全ての標識化産物、ならびに未組み込みのヌクレオチド、プライマーおよびタンパク質を除去する。
【0122】
精製の後、標識化の効力を以下のように見積もった:1μlの1:100、1:1000、1:10000および1:100000希釈物を、我々のアッセイの標準化のために、既知濃度(10−0.01pg/μl)のコントロールDIG標識化DNA(Roche,Laval、QC)の希釈物と共に、Hybond−Nメンブレン上にスポッティングした。UVでの固定化の後、メンブレンをDIGに対するアルカリホスファターゼ(AP)結合抗体(抗DIG−AP)と共にインキュベートし、リンスし、そして化学発光基質、3−(4−メトキシスピロ{1,2−ジオキセタン−3,2’−(5’−クロロ)トリシクロ[3.3.1.13,7]デカン}−4−イル)フェニルリン酸二ナトリウム−CSPD(Roche、Laval、QC)で、製造者の指示に従って、染色した。
【0123】
(ハイブリダイゼーションおよびプロセッシング)
ハイブリダイゼーションおよびプレハイブリダイゼーションのために、DIG Easy Hyb緩衝液(Roche、Laval、QC)または50%脱イオンホルムアミドを含むホルムアミド緩衝液、5×SSC、2%ブロッキング溶液(Roche、laval、QC)、0.1%N−ラウロイルサルコシン、0.02%SDS、100μg/ml変性サケDNAを用いた。メンブレンを42℃で2時間、ハイブリダイゼーションオーブン(Autoblot、Bellco,Vineland、NJ)中でプレハイブリダイズした。ハイブリダイゼーションを42℃で終夜、5mlのFalconチューブに入れた1ml以下のハイブリダイゼーション溶液中で、行った。ハイブリダイゼーション混合物中の標識化プローブの濃度は、10ng/mlを構成した。ハイブリダイゼーションの前に、プローブを65℃で10分間、ハイブリダイゼーション溶液中で変性した。
【0124】
その後、ハイブリダイゼーションメンブレンを(特に言及のない限り)、1×SSC、0.1%SDSで15分間、室温で、2回リンスし、そして次に予め加温した0.1×SSC、0.1%SDSで15分間、68℃ですすいだ。あるいは、メンブレンを、よりストリンジェントな条件、すなわち、2×SSC、0.1%SDS中、68%で30分間、2回、および0.1×SSC、0.1%SD中、68℃で30分間、2回リンスした。リンス緩衝液(0.3%Tween20含有、マレイン酸緩衝液(0.1Mマレイン酸、0.15M NaCl、pH7.5))で5分間平衡化した後、メンブレンを1.5時間、1パーセントブロッキング溶液中でわずかに攪拌しながらブロックし、そして次に30分間、10mlのアルカリホスファターゼ結合ヒツジ抗ジゴキシゲニン抗体(Roche,Laval、QC)中で処理し、比色染色のために1:1000に希釈し、あるいは化学発光検出のために1:10000に希釈した。抗体インキュベーションの後、メンブレンを3回、15分間、リンス緩衝液中でリンスし、2分間、検出緩衝液(0.1M Tris−HCl、0.15M NaCl、pH9.5)中で平衡化し、そして175μg/mlの5−ブロモ−4−クロロ−3−インドリル−ホスフェート、トルイジン塩(BCIP)、および330μg/mlのニトロブルーテトラゾリウムクロリド(NBT)で、検出緩衝液中で染色した。あるいは、CSPDの1:100希釈物をアプライし、化学発光を製造者(Roche、Laval、QC)の推奨に従って、BioMax MR Kodakフィルムを用いて検出した。
【0125】
(アレイのスキャンおよび評価)
アレイを、Multiscan−4システム(Applied Scientific Instrumentation、Eugene、OR)およびカラーCCD Sony 950カメラを装備したOlympus顕微鏡でスキャンした。データ取得および異なる視野の1つのフィルム上へのモンタージュは、Northern Eclipse Imaging System(EMPIX Imaging、Missisauga、ON)によって行った。各ドットでの酵素反応の強度の定量的測定、バックグラウンドの引き算、ハウスキーピング遺伝子に対する正規化、および対のハイブリダイゼーションの比較は全て、研究室内のソフトウエアプログラムで行った。
【0126】
(結果)
(プローブおよびプライマーの選択)
異なるデータベースの注意深い評価の後、アレイ形成のために、9個のハウスキーピング遺伝子を含む61遺伝子を選択した。この遺伝子のセットは、38Eボックス結合遺伝子をMyc(c−、N−、L1およびL2)ファミリー、5c−Myc調節因子(ZFP161、nm23−H2S、MBP−1、RBMS 1およびRBMS2)、5c−Myc相互作用遺伝子(YY1、TFII−1、PAM、MM−1、およびアルファ−チューブリン)、および4c−Myc標的遺伝子(プロチモシンアルファ、MRDB、ODC1、およびcdc25A)と共に含む。ポジティブコントロールは、異なる発現レベルの9種のハウスキーピング遺伝子(UBC、ベータ−アクチン、GADPH、HPRT1、ホスホリパーゼ2、HLA−C、PRS9、アルドラーゼC、およびRPL13A)、およびまたHeLaゲノムDNAを含む。ラムダDNAおよび2×SSC(2×標準塩溶液)(これは全てのプローブについて溶媒として用いられた)をネガティブコントロールとして選択した。
【0127】
全ての遺伝子に対するプライマーは、PCR反応と同じ条件に対応し、そして同じ融点の産物を産生するという条件で、Primer3ソフトウエアの補助で選択した。大部分の産物は、HeLaまたはリンパ球cDNAから産生された。cDNAからのPCR増幅が失敗した場合、プライマーはこれらの遺伝子の3’領域から選択され、そしてアンプリコンはHeLaゲノムDNAから産生された。プライマーの平均アニーリング温度は、60.1±0.9℃であり、これは、全てのPCR反応が96ウェルフォーマットで行われることを可能にした。産物のサイズおよび融点、ならびにプライマーのアニーリング温度を表4に示す。アレイ形成のためのPCR産物の平均サイズ、およびその融点は、各々、441±58bpおよび80±3℃であった。これらのパラメータの選択は、ハイブリダイゼーションおよびハイブリダイゼーション後のリンスをストリンジェントな条件で行うことを可能とし、クロスハイブリダイゼーションの可能性およびバックグラウンドレベルを劇的に低下させる。
【0128】
プライマーの周到な選択は、いくつかの場合で、非常に近い遺伝子ファミリーのメンバー間(例えば、USF1および2、ID2、3および4、Mycファミリーのメンバー等)、または2つの異なるc−Mycの転写物間の識別のために用いられ得る。周知のように、異なるプロモーターから転写された、種々の調節特性を有する、いくつかの異なるc−Mycの転写体が存在する(BodescotおよびBrison Gene 174、115−120(1996))。1stエクソンおよび2nd−3rdエクソン中でプライマーを選択することは、全長および短縮体のc−Mycの間の識別を可能とする。
【0129】
(ハイブリダイゼーションに影響を及ぼす条件)
ナイロンメンブレン上に印刷されたcDNAマイクロアレイによるハイブリダイゼーションの結果におそらく影響を及ぼすいくつかのパラメータを注意深く試験した。まず第1に、遺伝子プロファイリングの結果を、mRNAまたは全HeLa RNAのいずれかを用いて検査した。驚くべきことに、発現の全てのパターンは、mRNA由来のシグナルが数倍高いいくつかの遺伝子(UBC、RPL−13A、MBP−1)を除いて、非常に類似していた。最も顕著な違いは、UBCにおいて見いだされ、これは5倍に達していた。あるいは、HPRT1およびホスホリパーゼA2についてのシグナルは、全RNAよりも高い。mRNAの量が制限因子である条件下では、全RNAを代わりに用いてもよく、発現プロファイリングの結果に有意な違いはない。
【0130】
ハイブリダイゼーションのためのジゴキシゲニン標識化標的の産生のために用いた、2つの逆転写酵素、モロニーマウス白血病ウイルス(MMLV)(Gibco BRL、Burlington、ON)およびOmniScript(Qiagen、Mississauga、ON)の比較は、遺伝子特異的プライマーを用いたときに、発現プロフィール中にいかなる違いも示さなかった。しかし、シグナル強度は、MMLVで標識した後、特に染色の日の後に、より強かった(表5)。オリゴ(dT)プライマーをmRNAと共に用いた場合、いくつかの遺伝子の発現レベルにいくつかの有意な違いが検出された。OmniScriptでの標識化は、RP−S9、RP−L13A、エノラーゼ1、N−MycおよびMAD4に対して2−3倍強度の高いシグナルを生成する。
【0131】
どの緩衝液がマイクロアレイによるハイブリダイゼーションにより良好であるかを決めるために、EasyHybTM(Roche、Laval、QC)およびホルムアルデヒドベースの緩衝液を比較した。HeLa mRNAの発現プロフィールは、緩衝液の組成とは無関係であることが見いだされたが、シグナルは、ホルムアルデヒド緩衝液中でのハイブリダイゼーションの後の方が高く(表5)、そして2%のブロッキング剤を加えるとEasyHybTMに比べてさらにバックグラウンドが低下し、これにより次のスキャンおよび画像評価を促進する。
【0132】
異なるストリンジェンシーのリンス条件を用いた場合に、HeLa mRNAの発現プロフィール中には実質的な差異は見いだされなかった(材料および方法参照)。よりストリンジェントなリンスは、すべてのシグナルを一様に低下させ、よりシャープな境界を有するシグナルを生成し、そのためより容易にスキャンおよび評価が可能となる。標準的なリンス条件はおそらく既に、cDNAマイクロアレイおよび遺伝子特異的プライマーのハイブリダイゼーションには十分ストリンジェントである。従って、時間がかからないので、標準的なリンスが好ましい。
【0133】
正に荷電した(Hybond−N+)ナイロンメンブレンと中性(Hybond−N)ナイロンメンブレンの比較は、感度に違いがないことを明らかにした。この考察はさておき、中性(Hybond−N)ナイロンメンブレンは、印刷支持体として強い生地なので、好ましい。この強度は、正に荷電したHybond−N+メンブレンでは見られず、これは目に見える印刷跡を保持したので、画像分析を複雑にし、バックグラウンドを増大させた。
【0134】
表5からわかるように、染色時間が終夜から1日と延びても、通常、シグナルの全体の強度はわずかに10%上がっただけである。染色時間が長いと反応のバックグラウンドレベルを増大させ、これは高感度の潜在的な利点を損なう。ハイブリダイゼーション条件の変動は、全体のシグナル強度を30−40%増大させ得る。しかし、正の影響は付加的ではなく、マイクロアレイアプローチの全強度における最大の差異は、わずか50%に達するに過ぎない。cDNAマイクロアレイでのDIG−標識化標的のハイブリダイゼーションのために、以下の条件が至適である:中性ナイロンメンブレン上にプローブを印刷、全RNAでの逆転写反応、遺伝子特異的プライマーおよびMMLV逆転写酵素、ホルムアルデヒド緩衝液中でのハイブリダイゼーション、および標準的なリンス条件。これらの条件を以下の段落に記載の実験において実行した。
【0135】
(ハイブリダイゼーションの特異性、感度および信頼性)
cDNAマイクロアレイハイブリダイゼーションの特異性を評価するために、長さ(368−711bp)のアレイ形成産物の全範囲をカバーする、5つの遺伝子(MRDB、ODC、TFII−1、cdc25A、およびc−Myc)を、多重のPCR反応によって標識し、そしてcDNAアレイとハイブリダイズした(図6)。予期されるように、アレイ上の5試料のみが、HeLaゲノムDNAコントロールと同様に、ポジティブであった。なぜなら、これはHeLaゲノムDNAが最も高濃度で位置51にスポットされている位置にハイブリダイズするからである。そしてネガティブは、スポットされたHeLaゲノムDNAが低量である、位置1aおよび1bでわずかに検出されるか、あるいは検出されなかったことを示す。全体として、これらの実験は、クロスハイブリダイゼーションの徴候を示さなかった(図4)
感度を見積もり、cDNAマイクロアレイハイブリダイゼーションの較正曲線を誘導するために、異なる濃度のこの5遺伝子PCR混合物(10、4、1,0.4、0.1,および0.04ng/ml)をアレイとハイブリダイズした。この実験の結果を図5に示す。半対数座標における線形依存性と、4−10ng/mlの範囲での明らかなプラトーが、全ての遺伝子について観察され、同じ45±2の傾きであった。検出の下限は、アレイ中の異なるプローブによってわずかに変化し、個別の遺伝子ごとに40−100pg/mlに対応する。これらの結果は、製造者(Roche,Laval、QC)によれば、ジゴキシゲニン系の検出限界(10−30pg/ml)に近い。この感度のレベルは、各々、全細胞mRNAの0.04%より多くを表す、中間的存在度のmRNAの検出を可能とする。この検出レベルを考慮すると、中間的存在度の約70遺伝子を含むマイクロアレイでのハイブリダイゼーションについて、遺伝子特異的プライマーから産生される7ngの標識化プローブで十分であると見積もられる。次のハイブリダイゼーションのために、10ng/mlの標識プローブ濃度を選択した。遺伝子特的プライマーとの標準的逆転写標識化反応の収率は、約20−40ngであった。従って、1つの標識化反応で、2−4回の個別のハイブリダイゼーション反応のために十分な産物が得られる。不安定な放射性プローブとは対照的にDIG標識プローブは、貯蔵でき、そして数回再使用できる。20℃で数ヶ月貯蔵した後、ハイブリダイゼーション混合物を2−3回再使用すると、元のものと非常に一致した結果が得られた。
【0136】
アレイを3600dpiの解像度でスキャンし、そして結果を顕微鏡スキャニングの結果と比較した。一般に、複製されたドット間の変動は、スキャナの場合には高く、そして線形性は、スキャナのソフトウエアに影響を受け得る。スキャナは、特に化学発光検出が実行された場合の、ハイブリダイゼーションの結果の、初期評価に使用され得る。
【0137】
(ヒトリンパ球と比較したHela細胞の発現プロファイリング)
Eボックス遺伝子の発現プロファイルが、複製HeLa細胞(図8a)および正常ヒトリンパ球(図8b)において決定された。リンパ球において、最も顕著な変化は、Eボックス関連遺伝子TCF4、MAD4、およびアルドラーゼCの2倍を越えるアップレギュレーションからなる。あるいは、c−Myc−調節遺伝子MBP1およびNm23−H2Sのダウンレギュレーション、ならびにc−Mycの小さいダウンレギュレーションおよびM−Mycのアップレギュレーションが、HeLa細胞と比べてリンパ球で記録された。いくつかのc−Myc相互作用および標的遺伝子の発現は、リンパ球中で、ダウン(MM−1、ODC1)またはアップ(PAM、MrDb)レギュレートした。また、小さいアップ(MITF、ID2)およびダウン(TFEB)レギュレーションが、HeLa細胞と比較して、リンパ球中のいくつかのEボックス結合遺伝子の発現において検出された。これらの結果を図9a、9bおよび9cに示す。
【0138】
(要旨)
cDNAおよびオリゴヌクレオチドマイクロアレイは、遺伝子発現パターンの研究のためのますます強力な技術となってきている。この分野の急速な進歩にもかかわらず、この技術のいくつかの限界が残っている。主要な障害の1つは、多量のmRNAが必要とされることである。既存のマイクロアレイ系にかかわる他の問題は、データマイニングである。新規な遺伝子の機能を判断するためには、数万もの遺伝子の発現に対する情報が絶対に重大であるが、いくつかの例では、研究者は、多くの生理学的条件下での、遺伝子のわずか1つのサブセットの発現プロフィールに興味を持つ。61個からの3−6個の遺伝子の発現における有意差はすでに、膨大な数、数百または数千の遺伝子の通常のマイクロアレイから検出され得るよりも、より扱いやすい。例えば、45,000遺伝子のSAGA分析において、正常細胞と癌性ヒト細胞における差示的発現はわずか約1%であることが見いだされた。若齢および老齢マウスにおける発現プロファイルの分析から同様の見積もりが得られた。約6,000遺伝子のうち約1.8%のみの発現が2倍を越えて変化する。
【0139】
ナイロンフィルタ上にマイクロアレイを印刷し、そして遺伝子特異的プライマーを有するcDNAの標識にジゴキシゲニンを用いると、ハイブリダイゼーション当たり4μgという少量の総RNAを使用することが可能となる。これは、Clontechプロトコルにおける放射能で得られ得る感度と同じであり、そして、数μgのmRNAを必要とし、従って開始するのに100から1,000マイクログラムの総RNAを必要とする通常のマイクロアレイよりも感度が高い。さらに、高い標識化感度をのDIG標識プローブは、蛍光または放射性標識されたものとは対照的に長期間貯蔵でき、そして数回再使用できる。
【0140】
マイクロアレイに含める遺伝子を注意深く選択し、そしてジゴキシゲニンを標識化に用ると、放射性標識の別の欠点を回避することもまた補助される。Eボックスマイクロアレイ中の遺伝子は、全ての同じカテゴリーのアバンダンス(abundance)(中程度または低い程度の豊富さ)である。非常に多量の遺伝子を除外することは、強いシグナルの合併の問題を除去する。合併したシグナルは、いくつかの状況下で、スキャニングのプロセスを実質的に複雑にし、そしてデータ取得ステップの間に信頼性の低い結果をもたらす。
【0141】
放射性および蛍光プローブアプローチの両方に代わって酵素標識アプローチを用いる他の利点は、時間の節約と、繰り返し性の局面である。一般に、開始から終了までのこのプロセスは、cDNAの標識化のために必要なステップ、ハイブリダイゼーション、リンス、アルカリホスファターゼ結合抗ジゴキシゲニン抗体とのインキュベーション、結合したアルカリホスファターゼを明らかにするための染色、およびデータ取得のためのスキャニングを含み、最大で2日間を必要とする。これは、放射性32Pまたは33P標識プローブについて、最高で8日間の曝露が必要とされるのに比べて、かなりの時間の節約である。酵素標識されたプローブの蛍光標識されたプローブに対する利点は、データ評価ステップにおけるコストの節約である。この方法は安価な日常的な直立顕微鏡を必要とするのに対し、蛍光標識プローブは、高価なレーザー検出系または共焦顕微鏡のセットアップの使用を必要とする。これは、蛍光がスキャニングプロセスの後に容易に退色し得るという有名な事実に加えて、アレイを安価な顕微鏡で、元のシグナル強度を失うことなく、繰り返しスキャンする能力のために、発明者らの酵素的アプローチをはるかに優れたものとする。
【0142】
これらの結果は以下のような、市販の遺伝子発現アレイと比べることができる、
表6:遺伝子発現アレイ系の比較性能
【0143】
【表6】
Figure 2004502129
【0144】
*慣用的使用、括弧内は電流限界。
**インビトロ転写反応における増幅前(代表的には、30〜100倍)。
表4 マイクロアレイにおいて表わされるEボックス転写因子、c−Myc相互作用遺伝子およびハウスキーピング遺伝子の一覧表
【0145】
【表4】
Figure 2004502129
Figure 2004502129
Figure 2004502129
Figure 2004502129
【0146】
表5 マイクロアレイシグナルの強度に関する異なるハイブリダイゼーション条件の影響
【0147】
【表5】
Figure 2004502129
【0148】
*バックグラウンドを差し引いた後の全てのマイクロアレイのドットの総強度;同じ量のDIG標識HeLa cDNAを全てのハイブリダイゼーションに用いた。
【図面の簡単な説明】
【図1a】
図1aは、マイクロアレイを作製するための装置を示す。
【図1b】
図1bは、マイクロアレイを作製するための装置を示す。
【図1c】
図1cは、マイクロアレイを作製するための装置を示す。
【図1d】
図1dは、マイクロアレイを作製するための装置を示す。
【図1e】
図1eはマイクロアレイを作製するための装置を示す。
【図2】
図2a〜eは、テンプレートの定義、繰り返し、非信頼性領域の検出、およびスポット標識化の全工程を示す。「*」として標識された過剰発現スポット、および「?」で標識された、過剰発現スポットの影で歪められたスポットを識別することは容易である。スポットの標識は、オリジナル画像に対する視覚検査によって確認され、ここで矢印は、過剰発現されたスポットの影にあるスポットの位置を示す。図2aは、ClonTchのcDNAアレイの一部の生の画像である。アレイ定量方法は、二つ組でスポットされた588個のcDNA要素を含む、ClonTech AtlasTM cDNAフィルターアレイを分析することによって試験された。製造者によって提供される使用者マニュアルに従って、放射性標識化、アレイハイブリダイゼーション、およびすすぎの手順の後に、オートラジオグラフを得た。オートラジオグラフを垂直に300DPIで走査し、8ビットクレースケールおよびガンマ補正を無効にして、デジタル画像を得た。33アウトレンジ(out−range)ピクセル平滑化フィルタを適用して、白黒(salt−and−pepper)ノイズを減少させた。初期位置を、Clontechフィルタの1ブロックである、オリジナル画像上のグリッドテンプレートに重ねる。ユーザーは、グラフィカルユーザーインターフェースを介して、左上および右下の角のスポットの位置を提供することが要求される。式(5)および(6)において、パラメータは、λ=・SUB>i=1および轣≠T0と設定する。図2bは、プロトタイプテンプレートへの初期整列である。図2cは、変形可能なテンプレートの自動繰り返しによる精密整列である。図2dは、数学的モルホロジーにより検出される非信頼性領域(黄色)を示す。構造化要素を、理想的な試料スポットと同じサイズの円板として選択する。図2eは、非信頼性領域に対応するスポットの自動標識化を示す(「*」過剰発現スポット;「?」影によって歪曲されたスポット;「o」正常スポット)。
【図3】
図3a〜3dは、反復性および信頼性の定性的および定量的評価を示す。ClonTech AtlasTMマウスcDNAアレイの2つのブロック(転写因子および一般のDNA結合タンパク質)を同じ変形可能なテンプレート法を用いて定量化した。画像化条件は図2aと同じである。2人の独立したオペレータが、プロトタイプテンプレートの初期位置(左上および右下隅)を決めるのに必要である(図3a)。各オペレータは、1つの試料に対して同じ手順を3回繰り返す。簡単にするために、[0,0.33]のスポットの正規化強度を低存在度、[0.33,0.67]を中程度の存在度、および[0.67,1]を高存在度と定義する。強度に対する相対誤差は、低存在度スポットの定量における誤差が、中および高存在度スポットの定量におけるものよりも高いことが見出されたことを示す。強度に対する、比で表した最大誤差は、低存在度スポット中の比で表した誤差が残りのスポットよりも高いことを示す(図3b)。所望されない正規化の例を、対照遺伝子と比較している2つの試料中の遺伝子発現と比較する(図3c)。線L1は、2つの同じ試料:S1i=S2i、i=1、...、Nの、理想的な場合であり、線L2は、実際の試料の中央線であり、線L3は実際の対照の中央線である。正規化手順は、座標空間を角θ(L2,L3)で回転させるものとして理解され得る。従って、正規化の信頼性は、角θ(L1,L3)およびθ(L2,L3)によって評価され得る(図3d)。角度が大きいほど、正規化の信頼性は低い。この場合、θ(L1,L3)=−29.30゜、θ(L2,L3)=−14.58°。望ましい正規化の例は、θ(L1,3)=−0.96゜、θ(L2,L3)=2.13゜に見られる。
【図4】
図4は、Eボックス結合関連遺伝子発現の評価のためのcDNAマイクロアレイハイブリダイゼーションを示す。マトリックス位置は、各遺伝子の略称と共に、同量が析出したドットの3つの繰り返しの各位置の下に記載されている。X軸は、数1、2、3、4および5の位置を示し、そしてY軸は「a」から「o」位置を示す。各遺伝子トリプレットについてのマトリックス位置を、この後は、X、Y軸で同定する。例えば、5kは、N−Mycの位置を示し、そして3dはMadの位置を示す。同じ座標が、表4にも含まれる。
【図5】
図5aおよびbは、Hela細胞中でのEボックス結合関連遺伝子発現の発現プロフィールを示す。図5a−総RNAを、遺伝子特異的プライマーとのRT反応で、ジゴキシゲニンで標識した。図5b−mRNAを、オリゴ(dT)プライマーとのRT反応で、ジゴキシゲニンで標識した。マトリックス内の矢印は:I−Hela DNA(ポジティブコントロール);II−ラムダDNA(ネガティブコントロール);III−UBC;IV−RPL−13A;V−MBP−1;VI−HPRT1の位置を示す。ドット間の距離は、1mmの直線によって測定され得る。
【図6】
図6は、cDNAマイクロアレイによる、5対のプライマーでの多重PCRの産物のハイブリダイゼーションを示す。マトリックス内の矢印は:I−Mrdb;II−c−Myc p64;III−TFII−1;IV−ODC1;V−cdc25A;VI−HelaゲノムDNAを指す。
【図7】
図7は、Mrdb、c−Myc,TFII−1、ODC1、およびcdc25aを含む、5つの遺伝子の濃度間の関係、ならびにハイブリダイゼーションシグナルの強度を示す。対数近似を示す。ドットの強度は、Y軸上の任意の単位によって表される。濃度は、X軸上でng/mlで測定される。
【図8】
図8aおよび8bは、Hela細胞(図8a)、および正常なヒトリンパ球(図8b)中のEボックス関連遺伝子の発現プロフィールを示す。マトリックス内の矢印は:I−アルドラーゼC;II−Mad4;III−MB−1の位置を示す。
【図9a】
図9aは、Hela細胞およびヒトリンパ球中のEボックス遺伝子発現の、2つ一組の比較を示す。2つの独立したハイブリダイゼーションを各タイプの細胞について平均した。図9aは、遺伝子発現の違いの三次元表示、および図9bは二次元の表示である。各パネルは、図8aの1つの列に対応し、そして各バーは、個別の遺伝子を示す。図9cは、相対比の値に依存して、共通の発現の増加または減少を有する遺伝子の分布である。試料S1とS2との間の相対倍率は
【数25】
Figure 2004502129
として計算され、これは[−1,+1]の範囲の値を与える。正の値は、試料S2中の遺伝子のアップレギュレーションに対応し、そして負の値はダウンレギュレーションに対応する。相対倍率は従来の倍率と同様の意味を有するが、ただし、この値は正規化されており、対称性であり、明確な物理的解釈がなされる。RDM(S,S)=±0.5は、2つの試料の正規化において、2倍のアップまたはダウンレギュレーションに対応し、比較的一定の発現レベルのハウスキーピング遺伝子の組が対称として選択され、そして線形正規化が適用される。
【図9b】
図9bは、Hela細胞およびヒトリンパ球中のEボックス遺伝子発現の、2つ一組の比較を示す。2つの独立したハイブリダイゼーションを各タイプの細胞について平均した。図9aは、遺伝子発現の違いの三次元表示、および図9bは二次元の表示である。各パネルは、図8aの1つの列に対応し、そして各バーは、個別の遺伝子を示す。図9cは、相対比の値に依存して、共通の発現の増加または減少を有する遺伝子の分布である。試料S1とS2との間の相対倍率は
【数26】
Figure 2004502129
として計算され、これは[−1,+1]の範囲の値を与える。正の値は、試料S2中の遺伝子のアップレギュレーションに対応し、そして負の値はダウンレギュレーションに対応する。相対倍率は従来の倍率と同様の意味を有するが、ただし、この値は正規化されており、対称性であり、明確な物理的解釈がなされる。RDM(S,S)=±0.5は、2つの試料の正規化において、2倍のアップまたはダウンレギュレーションに対応し、比較的一定の発現レベルのハウスキーピング遺伝子の組が対称として選択され、そして線形正規化が適用される。
【図9c】
図9cは、Hela細胞およびヒトリンパ球中のEボックス遺伝子発現の、2つ一組の比較を示す。2つの独立したハイブリダイゼーションを各タイプの細胞について平均した。図9aは、遺伝子発現の違いの三次元表示、および図9bは二次元の表示である。各パネルは、図8aの1つの列に対応し、そして各バーは、個別の遺伝子を示す。図9cは、相対比の値に依存して、共通の発現の増加または減少を有する遺伝子の分布である。試料S1とS2との間の相対倍率は
【数27】
Figure 2004502129
として計算され、これは[−1,+1]の範囲の値を与える。正の値は、試料S2中の遺伝子のアップレギュレーションに対応し、そして負の値はダウンレギュレーションに対応する。相対倍率は従来の倍率と同様の意味を有するが、ただし、この値は正規化されており、対称性であり、明確な物理的解釈がなされる。RDM(S,S)=±0.5は、2つの試料の正規化において、2倍のアップまたはダウンレギュレーションに対応し、比較的一定の発現レベルのハウスキーピング遺伝子の組が対称として選択され、そして線形正規化が適用される。[Document Name] Statement
Title: Quantitative assay for expression of genes on microarrays
[Claims]
1. A method for detecting DNA hybridization in a microarray, Northern blot or Southern blot, comprising the following steps:
Adding a digoxigenin-labeled gene-specific primer to the target nucleic acid molecule,
Reacting the primer with the target nucleic acid molecule to produce a labeled target nucleic acid molecule;
Incubating the labeled target nucleic acid molecule with an anti-digoxigenin antibody conjugated to an enzyme that cleaves the chromogenic substrate; and
Detecting the reaction between the target nucleic acid molecule and the antibody using a detection means for a colorimetric, chromogenic, or chemiluminescent assay;
A method comprising:
2. The method according to claim 1, wherein said nucleic acid molecule is DNA.
3. The method of claim 1, wherein said target DNA is on a microarray and is present in pg.
4. The method of claim 1, wherein said target DNA is on a Northern blot.
5. The method according to claim 1, wherein said target DNA is on a Southern blot.
6. The method of claim 1, wherein said primer is reacted with said target nucleic acid molecule, said nucleic acid molecule is DNA, and said target DNA is amplified in a polymerase chain reaction.
7. The detecting means comprises a chemiluminescent substrate, 3- (4-methoxyspiro {1,2-dioxetane-3,2 ′-(5′-chloro) tricyclo [3.3.1.1]. 3,7 ] The method according to claim 1, which is disodium {-4-yl) phenyl sodium phosphate-CSPD.
8. A step of staining the antibody with 5-bromo-4-chloro-3-indolyl phosphate, toluidine salt (BCIP) and nitroblue tetrazolium chloride (NBT) in the detection buffer after the antibody incubation. The method of claim 1, comprising:
9. A method for enhancing the resolution of a hybridization reaction between a probe and a target DNA in a microarray format, the method comprising the following steps:
Providing a test sample in the microarray in an amount of less than 200 test spots;
A method comprising:
10. The method of claim 8, wherein at least three spots are provided for each said test sample.
11. The method of claim 10, wherein said three spots are randomly arranged in said microarray.
12. The method of claim 9, wherein at least nine housekeeping genes are provided for data normalization.
13. Providing a means for normalizing the size of the detection reaction for each test sample as compared to the size of the other test sample and the housekeeping gene.
13. The method of claim 12, comprising:
14. The method of claim 13, wherein each test sample detection reaction is adapted to a circle of the same diameter.
15. The method of claim 14, wherein said fitting step is performed by a computer that measures and normalizes data for each test sample.
16. The method of claim 15, wherein said data is further normalized relative to a detection response for each of said housekeeping genes.
17. A kit for use in the method of claim 1, comprising:
A kit comprising a reagent for labeling digoxigenin and a nucleic acid primer.
18. The kit according to claim 17, further comprising a substrate selected from the group consisting of a colorimetric substrate, a chromogenic substrate and a chemiluminescent substrate.
19. An informatics system for use in the method of claim 9.
DETAILED DESCRIPTION OF THE INVENTION
[0001]
(Background of the Invention)
The U.S. Government has issued E.E. from the United States National Institute on Aging to Eugenia Wang, and from the U.S. Department of Defense, Defense Advanced Research Projects Agency. The grant R01AG09278 awarded to Wang has rights in the present invention.
[0002]
The present invention is in the area of methods for detecting quantitative as well as qualitative levels of expression of a gene on a microarray, for example in a combinatorial library.
[0003]
Microarray technology offers biologists a way to systematically investigate DNA and RNA mutations. Until recently, the only tools available to scientists were Northern blot analysis, RNase protection, or RT-PCR to assay for differential expression. These techniques are limited to handling a small number of genes at a time. In contrast, microarray technology offers a means of simultaneously and comprehensively observing large numbers of gene expression, which has drawn considerable attention and has become a standard tool for both molecular biology research and clinical diagnostics. Has become. As the first step in an expression profiling experiment, the analysis and quantification of the array image has a significant impact on the accuracy of the subsequent data mining and exploration.
[0004]
Microarrays are typically prepared in nanomolar (less than picogram) amounts of individual genes, cDNA, or expressed sequence tags ("ESTs") (partial gene sequences) on nitrocellulose or silicon plates, or photolithography. Included in a separate location on a substrate, such as a glass substrate. Microarrays containing approximately one thousand ESTs are commercially available from Affymatrix. Clontech markets an array of gene-specific cDNA fragments that are about half the number of Affimatrix ESTs designed for specific research areas, such as tumor research, or for a wide range of applications.
[0005]
Once made, the array is hybridized to cDNA probes using standard techniques with a mixture of gene-specific primers. The nucleic acid-target to be analyzed is isolated, amplified, and labeled, typically with a fluorescent reporter group, a radiolabel or a phosphorus-labeled probe. After the hybridization reaction is completed, the array is inserted into a scanner where the pattern of hybridization is detected. Hybridization data is collected as light emitted from reporter groups already incorporated into the target, which is then bound to the probe array. Probes that perfectly match the target produce a stronger signal than those that have a mismatch. Since the sequence and position of each probe on the array is known, the identity of the target nucleic acid applied to the probe array can be determined by complementarity.
[0006]
There are a variety of labels used. cDNA and EST can be obtained by autoradiography or phosphor imaging ( 32 P). Fluorescent dyes have also been used and are commercially available from suppliers such as Clontech.
[0007]
The mapping and sequencing phases of the Human Genome Project are well ahead of the schedule. Up to now, eukaryotes S. cerevisiae and C.I. The complete genome sequences of 17 model organisms, including elegans, have been completed. It is expected that fully human genomic sequences will be available later this year. However, of the genes already sequenced, only about 20% of the functions of 53,000 human genes or 25% of the 6,200 yeast open reading frames are known. The next phase of the Human Genome Project deals with understanding the function of the remaining 80% of the genes. The main approach for studying the function of a new gene is by determining its pattern of expression—when, where, and how strongly it is expressed.
[0008]
Techniques that are currently the means of studying gene expression levels include Northern blots (Alwine et al., Proc. Natl Acad. Sci. USA 74: 5350-5354 (1977)), RT-PCR (Martorana et al., BioTechniques 27). 136-144 (1999), Wen et al., Proc. Natl. Acad. Sci. USA 95, 334-339 (1998)), differential display (Liang and Pardee, Science 257, 967-971 (1992)), Sequencing of DNA from cDNA libraries (Okubo, K et al., Nature Genet. 2, 173-179 (1992)), and systematic analysis of gene expression-SAGE (Velculescu, VE et al., Cell 8). Include 243-251 (1997)). All of these approaches except SAGE can process only a few dozen to hundreds of samples simultaneously. Given the vast amount of information that will be received in the near future (expression patterns of tens of thousands of genes under different conditions and in different organisms), only high-throughput methods such as cDNA or oligonucleotide microarrays It is considered powerful enough to solve this challenge.
[0009]
cDNA microarrays have already been successful in many cases, including the following examples: A. in light and dark. thaliana sprouts (Desprez et al., Plant J. 14, 643-652 (1998)), heat shock and phorbol ester regulatory genes in human T cells (Shena et al., Proc. Natl Acad. Sci. USA 93, 10614-10619). 1996)), young and old mice (Lee, Science 285, 1390-1393 (1999)), and a temporal program of gene expression in human fibroblasts in response to serum stimulation (Iyer, VR et al., Science). 283, 83-87 (1999)). Many aspects of microarray implementation have recently been reviewed in a special issue of Nature Genetics 21, special edition (1999). Until now, cDNA arrays have often been printed on glass slides. Glass as a support has many advantages. Glass is a durable, non-porous material with low inherent fluorescence. However, on the other hand, the loading of each dot of the microarray on glass is lower than on a nylon membrane. As a result, microarrays on glass require the use of fluorescently labeled probes at high concentrations, typically 50-200 μg of total RNA, or several μg of mRNA per array in each hybridization ( Dugan et al., Nature Genetics 21, extra edition, 10-14 (1999)). Such quantities of RNA are usually not available, which fact limits the performance of a possible cDNA microarray. Another problem with cDNA that is detrimental to this microarray is that the PCR products extracted from the clonal inserts of the cDNA library (Gerhold et al., TIBS 24, 168-173 (1999)) are likely to be optimal hybridization probes. That is not. This is because clone inserts can have very different lengths (0.3-3.0 kb) and GC content and can therefore have different melting points. This means that the efficiency of hybridization of different probes in a microarray under specific hybridization conditions can vary very significantly, which will make the expression profile dependent on the experimental conditions. Finally, if the cDNA target for hybridization on the array on glass was fluorescently labeled, this approach would allow direct comparison of the control and test samples in one experiment (Cheung et al., Nature Genetics). 21, Supplement, 15-19 (1999)), the sensitivity of fluorescent probes is lower than that of radioactive or enzyme-linked probes. Fluorescent probes can also fade during analysis, making it impossible to scan the array again. Last but not least, the price of laser scanners and other equipment needed to analyze fluorescence is still too high for widespread implementation of cDNA microarrays.
[0010]
Microarrays offer a simple and comprehensive way to describe vast numbers of genes simultaneously. Cheung et al., Nature Genet. 21, 15-19 (1999), and Brown and Botstein, Nature Genet. 21, 33-37 (1999), although array preparation techniques have recently been completed, techniques for quantification and analysis of array data are still in a developmental stage. As noted above, arrays generally find a wide range of uses, such as for studying normal biological and disease processes, and for profiling differential gene expression. Thus, the analysis of array data has attracted considerable research interest. As the first step in an expression profiling experiment, analysis and quantification of the array image has a significant impact on the accuracy of subsequent data mining and exploration. However, despite the high cost of commercially available packages (Bowell, Nature Genet. 21, 25-32 (1999)), the procedures for quantification and analysis are still time-consuming and tedious. Some commercially available packages use a rigid template grid to extract gene expression, and require up to one pixel accuracy when overlaying the template. For first-time users, a simple comparison of the two arrays can take hours. In addition, many commercially available software packages rely not only on the human beings to manipulate the array, but also the reliability of the results. Furthermore, all currently available systems for the detection of gene expression have drawbacks. Bleeding due to excessive presence or expression of a particular gene is a problem with some commercially available filters, where bleeding from one spot to an adjacent spot obscure results for adjacent spots. I do. Permanent recording must be done by another technique as the fluorescent labels fade. The sensitivity of detection is low.
[0011]
Some of these problems have been minimized by using more specific primer mixtures. CDNA probes generated by random priming distribute an isotropic label among nearly all RNA species. Many labeled species contribute only to non-specific background hybridization or cross-hybridize to many different cDNA fragments. The percentage of labels that are sequences complementary to the genes displayed on the array is minimal. Labels can be enriched on poly A + RNA using oligo (dT) primers. However, since many cells will always contain mRNA from thousands of genes, the probes will primarily consist of sequences not displayed on the array that can contribute to unwanted cross-hybridization. The choice of probes to eliminate common sequences is helpful. Another approach that addresses these issues is to reduce the number of genes on the array. Yet another approach is to apply multiple samples to each array so that the results can be averaged and abnormal results can be easily identified.
[0012]
However, none of these techniques has eliminated the problems associated with microarray analysis. There remains a need for sensitive, accurate, and reproducible tools for the analysis of gene and EST microarrays. There is also a need for quantitative detection, not just qualitative detection.
[0013]
Accordingly, it is an object of the present invention to provide methods and materials for accurately detecting gene expression on microarrays of large numbers of genes, cDNAs or ESTs.
[0014]
It is a further object of the present invention to provide methods and materials for quantifying and detecting genes in microarrays.
[0015]
It is another object of the present invention to provide a non-radioactive or non-fluorescent assay for gene expression for use in microarrays, Northern blots, Southern blots or other techniques using DNA hybridization.
[0016]
(Summary of the Invention)
For example, the volume is very small and the spots are located very close together, resulting in a troublesome situation where a violent reaction can flow out to an adjacent spot, thereby obscuring the accuracy of the reaction at nearby sites. Methods have been developed for the detection of gene expression or hybridization on microarrays in combinatorial libraries. This assay uses a digoxigenin enzyme assay for detection.
[0017]
The examples show the utility of the enzyme detection system. The transcriptionally regulated profile of the E-box associated gene specific for a given cultured cell sample is determined by the unique digoxigenin (DIG) -labeled cDNA produced from RNA isolated from the culture of interest. Was done. This specific enzyme-labeled probe allows the end result of detecting the intensity of the hybridization reaction by colorimetric evaluation of alkaline phosphatase conjugated antibodies to DIG. Enzyme deposition on each position of the E-box microarray eliminates the long delay problems required for exposure time with radioactive probes, and the problems of photobleaching and high background reactions associated with the fluorescent probe approach. , Easily analyzed by an upright microscope attached to a CCD camera. The enzymatic approach offers a user-friendly designer approach that tailors the task of genetic screening to analyze subgroups of gene expression that are regulated in the same manner. This assay is very sensitive, allowing detection as low as 0.02 nanograms.
[0018]
Methods have also been developed to increase the reliability of analysis of DNA expression in a microarray format using software analysis to normalize spots. This process uses deformable template technology to automatically quantify large-scale array data despite possible spatial distortion of the array. Each node of the deformable template represents a gene spot and is repeated according to the gradient descent rule, which minimizes an energy function that combines the data mismatch energy and the template deformation energy.
[0019]
The utility of the normalization method for analysis was demonstrated in studies identifying gene families in mouse liver whose transcript levels changed with age. Liver mRNA levels from young mice were analyzed on aged C57BL / 6 male mice using a commercial cDNA microarray. Hybridization of RT-cDNA from livers of young and aged mice to a mouse cDNA microarray of 588 genes (ClonTech Atlas Mouse cDNA Expression Array), whose activity is repairing and maintaining tissue function and normal physiological state 2 shows specific, coordinated age-related changes in the expression of specific gene families that are important for These gene families include tumor suppressors, cell cycle regulators, and various stress response and signaling pathway components. 32 P-labeled ssRT-cDNA was used as a probe for the microarray hybridization assay, and mRNA levels varied from very high to very low abundance. This process described herein has demonstrated better results.
[0020]
(Detailed description of the invention)
Two methodologies have been developed to increase the resolution and sensitivity of microarray analysis for gene detection. The first is the chromophore detection assay, which facilitates the determination of expression levels in microarrays, Northern blots, Southern blots, and other techniques for determining DNA hybridization. The second is a rapid and reliable approach to analyze gene arrays, using deformable templates to extract expression spots in the array, which automatically relies on unreliable expression. Can be identified. This automated repetition reduces human errors in quantification to a considerable extent and optimizes the processing time comparing arrays by a factor of 10 compared to existing packages.
[0021]
(Apparatus for preparation of microarray)
1a-1e show an apparatus for the formation of a microarray of biological substances. As shown in FIGS. 1 a and 1 b, the base of the device is a vibration isolator 1. Mounted on the platform 1 by the first horizontal linear guide 2 is a platform 14. The platform 14 is connected to a drive mechanism (not shown) such as a lead screw in the guide 2 through a carriage (not shown). The horizontal linear guide 2 supports a computer-controlled motor 5a connected to a drive mechanism, which causes the platform to move back and forth along the first linear guide 2. The motor 5a is connected to the computer 13 via the amplifier 15 and the motion control board 28.
[0022]
The platform 14 is designed to hold the removable sample storage 11 in place 18. As shown in FIG. 1b, the sample reservoir 11 is a 96-well microtiter plate. The platform 14 also holds a series of substrates 12, which are held in place by suction means created by suction through holes 21 on the platform below the substrate.
[0023]
As can be seen in FIGS. 1 a and 1 b, the opposing sides of the platform 1 are vertical risers 6, which are mounted substantially laterally so as to span over the platform 14 and the first linear guide 2. And has an upper end for supporting a second horizontal linear guide 3. The second horizontal linear guide 3 supports a computer-controlled motor 5b connected to a drive mechanism (not shown) such as a lead screw engaged with a carriage (not shown), which runs along the guide 3. , And can be moved by the operation of the motor 5b and is connected to the computer 13 via the amplifier 16 and the motion control board 28.
[0024]
The third guide 4 is attached to the second linear guide 3 by a carriage such that the third linear guide 4 is substantially perpendicular to the first linear guide 2 and the second linear guide 3. Have been. By means of the computer-controlled motor 5b, the third linear guide 4 can be moved back and forth along the axis of the second linear guide 3 by the carriage. The drive mechanism in the third linear guide 4, for example a lead screw engaging the carriage, is driven by a further computer-controlled motor 5c to allow the third linear guide 4 to move vertically and any movement within the range of movement. At the desired position. Computer control is achieved by the connection of the motor 5a to the amplifier 17 connected to the movement control board 28. The use of linear guide 2, linear guide 3, linear guide 4 and three carriages provides for movement in three dimensions.
[0025]
As shown in FIG. 1 c, near the lower end of the third linear guide 4, a sampling manifold 9 is mounted, which simultaneously controls the sample from all four sample positions in the sample reservoir 11 by means of all four sampling needles 8. And four linearly spaced sampling needles 8 along the manifold at intervals that can be picked up. The sampling manifold 98 can be moved between the two positions by the actuation of an air cylinder 10 connecting between the sampling manifold 9 and the third linear guide 4. As shown in FIG. 1c, in solid line, the sampling manifold 9 is in a "down" position for sampling and cleaning. When the third linear guide 4 is repositioned, the sampling manifold pivots to the "up" position, as represented by the dashed line.
[0026]
The base of the third linear guide 4 has a piezoelectric inkjet 7 mounted thereon, and the sampling needle 8 is connected to the piezoelectric inkjet 7 by a microline conduit 34 (FIG. 1c). Each sampling needle 8 connects to a micropump 35 through a conduit 34 and from there to a microvalve 36. Each micro-valve 36 is adjustable so that the fluid delivered from the pump 35 can be selectively directed to the corresponding piezo inkjet 7 or waste.
[0027]
As shown in FIG. 1 b, two gravity overflow reservoirs 24, 25 are present on the stand 1 behind the platform, on opposite sides of the first linear guide 2. Reservoirs 24, 25 contain a cleaning solution, which is pumped through the interior of the device, if desired. As shown in FIG. 1d, such overflow reservoirs 24, 25 are provided with a fluid inlet 40 at a position below the overflow reservoir, into which the target solution is pumped from the fluid reservoir 41 by a pump 44. Can be In the upper part of the overflow reservoir there is a fluid overflow opening 42 from which the liquid in the overflow reservoir returns to the fluid reservoir 41. The overflow storage further has an opening 43 at the top for inserting the sampling needle 8.
[0028]
Also, on the vibration isolator 1, two cleaning boxes 26, 27 (FIG. 1 b) are located on opposite sides of the first linear guide 2, outward of the gravity overflow storages 24, 25. ing. As shown in FIG. 1e, openings 51 and 52 are provided at the top of each box to accommodate the sampling needle 8 and the piezoelectric inkjet 7, respectively. Each box 26, 27 is provided with a nozzle 50 therein for delivering cleaning fluid from a cleaning fluid reservoir (not shown) to the outer surface of the sampling needle 8 and the piezoelectric inkjet 7. An outlet port 53 is provided at the bottom of the box, through which waste cleaning fluid is drawn into the vacuum trap.
[0029]
In operation, a number of substrates 12 are placed on a platform 14 and a selected sample is placed in a sample reservoir 11. The platform 14 mounted on the first linear guide 2 moves to a position such that the sampling manifold 9 is at the position of the sampling. The sampling manifold 9 is lowered by the actuation of the pneumatic cylinder 10 and the third linear guide 4 is lowered, placing the sampling needle 8 in the sample reservoir 11. The amount of sample placed in the microarray is removed by the micropump 35 through the sampling needle 8 and delivered to the piezo inkjet 7 through the conduit 34 and the sampling manifold 9 returns. The piezo inkjet 7 is positioned above the substrate 12 and the piezo inkjet 7 delivers the sample onto the substrate 12. This process is repeated so that multiple samples are delivered to the selected substrate 12 in place and form a microarray.
[0030]
To prevent sample cross-contamination, the sampling needle 8, conduit 34, micropump 35, microvalve 36, and piezo inkjet 7 are cleaned during removal of different samples. This is done with two gravity overflow reservoirs, one containing (24) saline and the other (25) containing water. Brine or water is withdrawn by sampling needle 8 and delivered through conduit 34 to piezo inkjet 7 to flush the system. Thereafter, using the cleaning boxes 26 and 27, water and / or air is sprayed on the sampling needle 8 and the outer surface of the piezoelectric inkjet.
[0031]
All of the process can be automated. Motion control, digital operation, sample processing, and micropumping can all be controlled by a computer using special computer programs designed for it. Certain functions, such as fluid recirculation through the gravity overflow reservoir, can operate continuously during operation and do not require computer control.
[0032]
Various liquid reagents can be dispensed using the described device. For example, the liquid may include DNA, RNA, modified nucleic acids and nucleic acid analogs, peptides, antibodies, antigens, enzymes, or cells. The device may also dispense an activator or inhibitor fluid. The activator fluid is one that makes a possible bond to the substrate or that initiates a synthetic reaction with the reagents placed earlier. The inhibitor fluid protects an area on the substrate and prevents substances in that area from reacting.
[0033]
The piezoelectric ink jet 7 is preferably a drop-on-demand printer head, which can deliver a small amount of measured liquid quickly and accurately. The amount of substance delivered depends on the specific application and can be, for example, 10 to 1000 picoliters (pl), preferably 20 to 100 pl, and most preferably 35 pl. Examples of sample reservoirs are 96-well and 384-well microtiter plates and Eppendorf TM Including tubes. Examples of sampling devices include a sampling needle, which may be made of a stainless steel perforated tube and may include a syringe tip.
[0034]
The weight overflow reservoir and cleaning box may be located in any suitable location.
[0035]
The micropump 35 can operate intermittently or continuously. Intermittent operation can be achieved with an AC → DC relay under the control of an operation control board.
[0036]
The components of the device may be provided separately for assembly, with instructions for assembly and use of the device.
[0037]
(Digoxigenin enzyme detection assay)
As demonstrated in Example 2, very sensitive and accurate means for visualizing the degree of hybridization between nucleic acid molecules have been developed. This assay utilizes digoxigenin (DIG) to label a target nucleic acid molecule, eg, cDNA generated from gene-specific primers, followed by anti-digoxigenin combined with an enzyme such as alkaline phosphatase (AP). Incubate with the antibody to perform colorimetric or chemiluminescent detection.
[0038]
The method includes the steps of labeling a nucleic acid molecule, typically a cDNA, hybridizing the labeled molecule, rinsing to remove unhybridized material, and enzymatically binding the hybridized material to an enzyme-linked antibody. Incubating with a digoxigenin antibody, typically alkaline phosphatase, staining to reveal bound enzyme, and scanning for data collection. This method is fast, requires up to two days, and can detect up to 4 micrograms of sample.
[0039]
Assays can be used to detect as little as 0.02 nanograms of nucleic acid. This means that the starting material (i.e., DNA or RNA isolated from the targeted tissue) is at least as good as 1-2 micrograms. The starting material can be labeled by the digoxigen method, and the labeled nucleic acid is then used for hybridization on a microarray. The methods currently used by Affimatrix and ClonTech require the use of difficult-to-obtain mRNAs as starting materials, requiring at least 100-1,000 micrograms of total RNA. This is in contrast to 1-2 micrograms of total RNA required for 0.02 nanograms that can be detected in the assays described herein.
[0040]
Assays use enzymes that can cleave chromogens, chemiluminescent or colorimetric substrates. In a preferred embodiment, the enzyme is alkaline phosphatase and the substrate is 3- (4-methoxyspiro-1,2-dioxetane-3,2 '-(5'-chloro) tricyclo [3.3.1. 1] decane {-4-yl) disodium phenylphosphate-CSPD. In a preferred embodiment, after incubation of the antibody, the reacted substrates are 5-bromo-4-chloro-3-indolyl phosphate, toluidine salt (BCIP), and nitroblue tetrazolium chloride (NBT) in detection buffer. Stained with
[0041]
(Extraction of gene expression from array image)
In an ideal array image, gene sequences are represented as equally spaced spots of the same size. However, the spot can be moved from its ideal position due to random perturbations in the printing of the spot or due to membrane distortion caused by undesired temperatures. Simple grid templates are not sufficient to extract gene expression. To overcome these spot variations, deformable templates with the ability to change shape have been developed to track the distortion of gene spots. Active Shape Model (Cootes et al., Computer Vision and Image Understanding 61, 38-59 (1995); Ostu, N. IEEE Trans. On Syst. Man & Cyber. 8, 62-66 (1978); and Adrian et al. 26, 1174-1179 (1999)) and deformable templates (Serra, J. Image Analysis and Mathematical Morphology, Academic Press, London, 1982; Haralick et al., IEEE Trans. Pat. In Pat. -550 (1987); Ostu, N. IEEE Trans. On Sy. t. Man & Cybern. Developed to locate.
[0042]
In general, deformable template matching techniques integrate model-driven and data-driven analysis with an energy function and a set of regularization parameters. Two factors are considered, data mismatch and template deformation. Typically, a criterion function is defined to quantify these two factors. One measures how different the input pattern is from the deformed template, and the other measures the degree to which the template is deformed. In template mismatching or classification applications, optimal matching is achieved by minimizing the weighted sum of these two criteria. The weighting factors are called regularization parameters, which provide a trade-off between template deformation and data mismatch.
[0043]
(Template display)
Raw images are scanned from a ClonTech cDNA mouse array as described in the Examples. Each sample spot in the three-dimensional view of the input image of the array corresponds to a local minimum in gray level space. Next, the following model is used to extract appropriate information.
[0044]
The array of gene samples is represented as a set of N circular spots of the same size. Each spot is
[0045]
(Equation 1)
Figure 2004502129
[0046]
Where C (P, r) is a circle of radius r centered on Euclidean coordinates P = (x, y). Spot intensity is the average of pixel intensities inside the circle
[0047]
(Equation 2)
Figure 2004502129
[0048]
It is. The radius of the microarray spot is determined by printing and imaging conditions, measured across the entire array, and set as a constant. Thus, the prototype template is based on prior knowledge of the general array, which can be set as a grid of evenly spaced circles around the array. The purpose of using deformable templates is to find the optimal location of the center of all spots, both for data mismatch and template deformation factors.
[0049]
(Data mismatch energy)
The data mismatch energy measures the fitness of the deformed template to the input pattern. Since the input image is a gray level, and since gene expression is represented by the integral intensity of the local area, the data mismatch energy can be defined by the integral intensity equation.
[0050]
[Equation 3]
Figure 2004502129
[0051]
Potential function
[0052]
(Equation 4)
Figure 2004502129
[0053]
Is defined for each spot, the data mismatch energy is
[0054]
(Equation 5)
Figure 2004502129
[0055]
Where φ i Is the weight of the i-th node and r is the predefined radius for the sample spot. The potential function is the integration of the gray level values over a local area, which has the ability to smooth. Experimental results show its robustness to small perturbations and noise.
[0056]
(Template deformation energy)
Template deformation energy measures the deviation of the deformed template from the prototype template. Translation from template deformation occurs due to membrane distortion. To quantify the degree of deformation, the deformation energy for each spot is calculated using the deformation control node P i Its predetermined position P i0 Define as the Euclidean distance from:
[0057]
(Equation 6)
Figure 2004502129
[0058]
Where λ i Is the diversity of the i-th node. Minimizing template deformation energy helps prevent nodes from being attracted by perturbations and noise in local background, and thus increases the robustness of the proposed algorithm.
[0059]
(Relaxation)
Combining template deformation and data mismatch energies gives the total energy function
E = αE 1 + E 2 (4)
And α is a regularization parameter.
[0060]
The localization procedure of the sample spot corresponds to the minimization of the total energy. The minimum of this function can be obtained by using comprehensive optimization methods, such as dynamic programming, greedy searching algorithms, neural networks, etc., but at the cost of excessive computation. Since each spot in the array is printed in a predetermined location, it is assumed that the gene spots are presented in a regular array, so that the initial location is determined according to the number of locations in the entire matrix. , At a given site. It is also assumed that the prototype array template can be located close enough to the input array. Thus, the array spot can be localized by finding a local minimum around the initial grid. This is embodied by a deterministic gradient descent technique:
[0061]
(Equation 7)
Figure 2004502129
[0062]
i = 1, 2,. . . , N, and η are learning rates.
[0063]
In the isotope array, the diversity and weight of each spot are set the same. The position of the target center is regressed to minimize the energy defined in (4), which can be understood as a set of nodes on the rubber band; the position of the node is the local minimum of the energy field It tends to descend to the bottom. To limit the movement of the node and avoid tuning the optimal value to the learning speed, the node is moved one unit at each iteration according to the sign of Δx and Δy. For example, Atlas TM Applying a 3 * 3 out-range pixel smoothing filter (Ekstrom, MP Digital Image Processing Technologies, Academic Press, London, 1984) to extract gene expression from one functional group of the cDNA array, Black-and-white noise (salt-and-pepper) is reduced. The membrane is distorted during the hybridization and washing procedures, so that it is not possible to find an exact match between the membrane under investigation and a given grid template. However, after less than 5 iterations, all nodes of the deformable template come to stable positions that minimize the total energy function defined in (4). Visual observation confirms a good correspondence between the deformed grid template and the gene spot.
[0064]
(Detection of unreliable area)
In array hybridization, some strong signals are observed on the autoradiograph and are colloquially called "bleeding" spots. These overexpression signals cause problems not only in the quantification of itself, but also in the quantification of nearby genes. Most commercial packages for analysis of array data either require the user to visually check the bleeding gene and its neighborhood, or simply ignore the presence of these spots. Failure to detect overexpressed spots can lead to erroneous results in comparing between two gene expression profiles. The purpose of the approach described herein is to automatically identify bleeding regions and alert the user to possible quantification error. Thus, the user is relieved of a monotonous, boring and tangible evaluation of problematic areas in those membranes.
[0065]
The following basic assumptions are made for spots in a typical array:
The spots are mutually exclusive.
[0066]
The change in intensity within each spot has a specific range.
[0067]
Each spot is a connected component of limited size.
Thus, identification of overexpressed spots can be simplified as spots larger than a predetermined size are filtered out. Based on shape, mathematical morphology provides an efficient approach for processing digital images and is widely used to solve image processing problems that are difficult to solve with linear filters. When used properly, mathematical morphological operations tend to simplify image data by preserving its essential shape properties and eliminating inadequacies. The basic mathematical morphological operations are erosion and dilation transformation. Opening and closing are defined based on the composition of the erosion and expansion transformations. Consider the case of a binary image, where A is a set of points representing the binary "on" pixels of the original binary image, and B is a set of points representing the binary "on" pixels of the structuring element. . The basic morphological operation is defined as:
Dilation transformation of binary image A by binary structuring element B,
[0068]
(Equation 8)
Figure 2004502129
[0069]
Erosion of binary image A by binary structuring element B
[0070]
(Equation 9)
Figure 2004502129
[0071]
Opening binary image A by binary structuring element B,
[0072]
(Equation 10)
Figure 2004502129
[0073]
Closure of binary image A by binary structuring element B,
[0074]
(Equation 11)
Figure 2004502129
[0075]
The disc structuring element, C, whose size is the upper limit of spots on the array under test, was chosen to distinguish overexpressed spots from normal expressed spots.
C = {(x, y) | x 2 + Y 2 <R 2 }, Where R is the maximum radius of the ideal spot.
[0076]
The procedure for identifying over-expressed spots can be described as follows:
Step 1. The input image F = {f (x, y) | 0 ≦ x <M, 0 ≦ y <N} is determined by a comprehensive thresholding technique, for example, the Ostu thresholding method (Ostu, NA IEEE).
Trans. on Syst. Man & Cybern. 8, 62-66 (1978)) and binarize based on optimal discriminant analysis:
G = {g (x, y) | 0 ≦ x <M, 0 ≦ y <N}
[0077]
(Equation 12)
Figure 2004502129
[0078]
T is the optimal threshold value of Ostu.
Step 2. Normal size spots are filtered out by morphological opening with structuring element C:
[0079]
(Equation 13)
Figure 2004502129
[0080]
Thus, the unreliable region is the group:
[0081]
[Equation 14]
Figure 2004502129
[0082]
It is represented by
Step 3. Control node P i = (X i , Y i ), If
[0083]
(Equation 15)
Figure 2004502129
[0084]
Then, it is identified as an overexpression spot.
[0085]
In fact, the problem of quantification lies not only in overexpression, but also in nearby spots. During the repetition of locating the true position of the spot, several control nodes are rapidly attracted to the overexpressed spot. This is because a low data mismatch energy field is formed around these spots. In this system, the gene expression spot is labeled as unreliable if the corresponding control node has moved far from its initial position.
[0086]
(Label measurement)
In quantitative analysis on a microarray, the amount of fluorescence or radioactivity emitted from each spot is an indication of the amount of labeled nucleic acid probe associated with that spot (Atlas). TM cDNA Expression Array User Manual, Protocol # PT3140-1, Version # PR91208, pages 7-9, 1998). The intensity of each spot displayed in 3D shows that the hemispherical assumption for the sample spot is not sufficient for quantitative purposes. The following integral function is used to calculate the volume of each spot:
[0087]
(Equation 16)
Figure 2004502129
[0088]
In individual images, the integral is replaced by the sum and the area of the circle is used to normalize the volume:
[0089]
[Equation 17]
Figure 2004502129
[0090]
here
[0091]
(Equation 18)
Figure 2004502129
[0092]
Is the target node obtained from the repetition of the deformable template matching. The normalized capacity is in the range [0, I max ], Where I max Is the upper limit of the pixel value. For 8-bit and 16-bit grayscale images, I max Is equal to 255 and 65535, respectively.
[0093]
(Performance test: Automated processing versus manual operation)
The system was tuned based on 24 sub-images from two ClonTech filters. The tuning stage involves selecting the optimal normalization parameters within the definition of energy. The system was tested with 204 sub-images from a 17 ClonTech filter and 50 biochip microarray images printed in the laboratory. Test results indicate that the proposed model can extract spots satisfactorily if the spots are mutually exclusive. However, some spots are attracted to those that are overexpressed, thus distorting the quantification procedure. Although the system can automatically identify these erroneous spots, the final solution requires improvements in the design of optimal probes and experimental conditions. Table 1 shows Atlas TM Three systems in the analysis of the array (AtlasImage released by ClonTech) TM 1.0 (http://www.clontech.com), EstBlot (Adryan et al., BioTech 26, 1174-1179 (1999)) developed by Johannes Gutenberg University, and zrayAy developed in our lab. ) Are listed. Compared to existing systems, our system works several times faster. System error is measured by repeating the quantification procedure six times for one array. Two factors are considered in the evaluation of the system: mean error
[0094]
[Equation 19]
Figure 2004502129
[0095]
And maximum error
[0096]
(Equation 20)
Figure 2004502129
[0097]
, Where μ i And δ i Is the mean value as well as the standard deviation in the measurement of the i-th spot in several repetitions. Table 2 lists a comparison of the two systems for both the ClonTech filter and the laboratory printed microarray, and it is clear that the systems described herein outperform the existing systems. . To quantify the system error associated with the proposed array image analysis method, two samples were compared and the following aspects of the comparison procedure were analyzed: error in quantification, error in ratio, and error in normalization. . The relevant error in quantification is δ i / Μ i Where δ i And μ i Is the i-th standard deviation and mean of the six independent tests. To compare the gene expression of the two samples, we have defined a relative magnification instead of the conventional fold ratio. Sample S 1 And S 2 The relative magnification is
[0098]
(Equation 21)
Figure 2004502129
[0099]
Which is a value in the range [-1, + 1]. Positive value is S 1 To S 2 To up-regulation, and negative values indicate S 1 To S 2 The down regulation to is shown. The relative magnification has the same meaning as the conventional one, except that its value is normalized and easy to understand. For example, R RF = ± 0.5 corresponds to twice up or down regulation. Compare the association between gene abundance and the mean and maximum error in ratios. For genes with normalized abundances [0, 0.33], [0.33, 0.67], [0.67, 1] as low, medium, and high abundances, The maximum error of the ratio is 1.89%, 4.89% and 15.54%, respectively. The proportion among low abundance genes is more sensitive to the initial position of the prototype template in quantification. Thus, this system is more reliable in handling medium and high abundance spots. Table 3 shows the association between automated evaluation of spots (reliability label) and quantitative error. Quantitative studies confirm that automatically identified "unreliable" locations are more error-prone than the other two categories. In fact, the percentage of "unreliable" spots can be used as an indicator of the quality of the hybridization procedure.
[0100]
ArrayAnalyzer automates most of the quantification and comparison functions. It processes different functional groups of Atlas cDNA arrays separately, thus allowing the system to be easily generalized to processing of all types of arrays. On the other hand, ArrayAnalyzer is strong against fluctuation between different users. The quantification of the spot depends largely on the nature of the input image, rather than on the user's subjective judgment. While most commercial systems rely on human operators to evaluate the reliability of the results, Array Analyzer automatically identifies potential errors caused by overexpressed spots and their shadows. One of the unique features of this system is that it discards unreliable quantification and preliminarily excludes results that lead to errors. Due to the sequence-dependent hybridization properties and the inherent variability of any hybridization reaction, Atlas data and any other array data should be considered only semi-quantitative. Not worth it It is always necessary to confirm any interesting results of array experiments with other assays and to measure the levels of RNA through Northern and / or semi-quantitative RT-PCR methods.
[0101]
In summary, the process defined by the computer program presented here addresses some of the unreliability issues inherent in promiscuous microarray designs. A further solution is to design microarrays in a cluster pattern, in a "divide-and-conquer" manner, group genes according to their unique abundance levels, and then It is to align with the template. The "split and conquer" approach also provides versatility and allows, with intensive effort, follow-up studies of selected clusters of genes. New reports show the power of microarray analysis approaches to measure changes in gene expression in templates of 18,000 to 20,000 genes. The methods described herein make it possible to detect areas where most of the changes have occurred, and to confirm close follow-up with other molecular methodologies, such as Northern blot analysis and / or semi-quantitative RT. -Through PCR analysis. In addition, the selected region can also be used for in-depth analysis to compare tracing by computer automated analysis versus manual densitometry. Ultimately, the computational work involved in any microarray analysis should document multiple genetic changes with maximum confidence and reproducibility, with minimal human error. This problem can be handled by powerful mathematical modeling and computer programs, but more importantly, it needs to come to mind when designing microarrays. Thus, the use of "designer biochips", as well as the processing of computer-assisted data analysis, to cluster genes according to their level of abundance in biological systems, as well as the processing of high-throughput technologies Facilitating the role of bioinformatics in the process of progress.
[0102]
Example 1 Comparison of DNA from Young and Old Animals Using Deformable Templates
P. Chomcynski and N.C. Sacchi, Anal Biochem. 162, 156 (1987). Total RNA was isolated from frozen liver by extracting homogenized liver with a guanidium / phenol solution. The aqueous phase was further treated with (25: 24: 1) phenol: CHCl 3 : Extracted with IAA and glycogen was removed by centrifugation. RNA was recovered by ethanol precipitation, quantified by spectroscopy, and qualified by gel electrophoresis. 1.5 μg of high quality Dnase treated total RNA was purified using 588 optimized primers (ClonTech) [Alpha- 32 [P] dATP was used in MMLV reverse transcriptase cDNA synthesis. Not incorporated 32 P-labeled nucleotides were removed from the labeled cDNA probe by profiling on a Chroma Spin spin column (ClonTech) using gravity elution. The fraction containing the cDNA / RNA probe was converted to single-stranded cDNA at 68 ° C. using 1M NaOH, and 1M NaH 2 PO 4 Neutralized with [pH 7.0]. Probes were placed on a prehybridized (68 ° C, 30 minutes) ClonTech mouse microarray containing the 588 PCR gene product at 68 ° C overnight. 0 Hybridization was performed using an ExpressHyb hybridization solution (ClonTech) in the presence of t-1 DNA and sheared salmon sperm. The membrane was washed four times with pre-warmed 2X SSC, 1% SDS, and then twice more with pre-warmed 0.1X SSC, 0.5% SDS. The membrane was then wrapped wet with plastic wrap for autoradiography and phosphor imaging.
[0103]
In analysis of the ClonTech Atlas mouse cDNA expression array, autoradiographic films were scanned at 300 DPI, 8-bit grayscale by a typical commercial flatbed scanner, Saphir Linotype-Hell. The obtained images were image-corrected by a software package ArrayAnalyzer developed in the laboratory and analyzed. To handle membranes with unwanted distortion, a deformable template is defined to automatically quantify gene expression. Each node in the deformable template is repeated according to a gradient descent rule, which minimizes an energy function that combines the data mismatch energy and the template deformation energy. An ideal gene spot is modeled by a circle of a predetermined radius. Thus, gene expression can be quantified by integral intensity. ArrayAnalyzer can also identify "bleeding" regions, thus alerting the user to potential errors in quantification. In later analyses, these areas will be checked carefully and removed from discussion. To compare the gene expression of the two samples, the relative magnification is defined instead of the conventional magnification. The relative magnification between samples indicates that pairwise comparisons are more reliable for moderate and high abundance genes, taking into account human error in the procedure. The experimental results described herein are based on the average of three repetitions for each filter. In normalizing the two samples, lambda DNA was selected as a negative control, and HPRT, MOD, and G3PDH were selected as positive controls. A linear normalization method was applied.
Table 1 Performance of three systems in quantification of two ClonTech Atlas arrays
[0104]
[Table 1]
Figure 2004502129
[0105]
(1) The processing time of AtlasImage ™ 1.0 was estimated according to the manufacturer's instructions.
(2) EstBlot and ArrayAnalyzer processing times are tested on a Pentium 400, 348 MB RAM.
In this table, "M" represents manual operation and "A" represents automated processing. The operator "" in the ArrayAnalyzer processing time measurement * "Means the repetition time of the same procedure. Since the Array Analyzer is designed for general array analysis, each group of genes and housekeeping genes in the ClonTech cDNA array is treated as a separate array. Thus, the quantification function is applied to each array 9 times (6 functional groups, 3 control genes) and the comparison function is applied 6 times.
Table 2 Comparison of system errors in quantification
[0106]
[Table 2]
Figure 2004502129
[0107]
Two independent operators are needed to provide the initial position (upper left and lower right corner) of the prototype template. Each operator repeats the same procedure three times for one sample. During testing, it was observed that a human operator replaced the initial position of the grid template from 3 to 10 pixels during alignment. For six iterations, two factors were taken into account in evaluating the system: average error
[0108]
(Equation 22)
Figure 2004502129
[0109]
And maximum error
[0110]
[Equation 23]
Figure 2004502129
[0111]
Where μ i And δ i Is the average value and the standard deviation in the measurement of the i-th spot.
Table 3 Comparison of errors for spots with different labels
[0112]
[Table 3]
Figure 2004502129
[0113]
The experimental conditions are the same as in Table 3. This table shows the relationship between automated evaluation of spots (reliability label) and quantitative error. Two factors are considered: average error
[0114]
(Equation 24)
Figure 2004502129
[0115]
And the average of the maximum errors in the ratio comparison. The automatically identified "unreliable" location is shown to be more damaged than the other two categories. In fact, the percentage of "unreliable" spots can be used as an indicator of the quality of the hybridization procedure.
[0116]
Example 2: Digoxigenin enzymatic detection for microarray analysis of E-box binding related gene expression
To embody the advantages and problems of cDNA microarrays for expression profiling, the use of digoxigenin (DIG) to label target cDNAs generated from gene-specific primers has been followed by alkaline phosphatase (AP) A novel approach has been developed that is incubated with an anti-digoxigenin antibody conjugated with) and performs colorimetric or chemiluminescent detection. A set of genes containing E-box binding elements (CAGGTG) located in the promoter regions of many genes were selected as probes. Perhaps the best-known representative of E-box binding genes is c-Myc, whose transactivating activity plays an important role in cell cycle regulation, proliferation, and apoptosis (Eilers, M. Mol. Cells 9, 1-6 (1999); Dang, CV Mol. Cell. Biol. 19, 1-11 (1999); Facchini and Penn FASEB Journal 12, 633-651 (1998)). Genes that interact or regulate expression for c-Myc, as well as some target genes whose expression is E-box binding dependent, are included in this microarray. Combined with an enzymatic approach for labeling hybridization probes, these custom-designed microarrays provide an inexpensive, user-friendly system for high-throughput gene screening assays for specific subgroups of gene expression. Enables the development of
[0117]
(Materials and methods)
(Selection of probe for array formation)
E-box binding proteins, and c-Myc-regulation, -interactions and target genes were identified in different databases-GeneAtlas (http://www.citi2.fr/GENATLAS), GeneCards (http://bioinfo.weizmann.ac. il / cards), GenBank (http://www.ncbi.nkm.nih.gov/Web/Genbank) and PubMed (http://ncbi.nlm.gov/PubMed). Unigene (http://www.ncbi.nlm.nih.gov/UniGene/index.html) cluster numbers and sequences were used to identify genes and confirm their uniqueness. Nine housekeeping genes and HeLa cell DNA were selected as positive controls, lambda DNA and 2 × SSC (2 × standard salt solution—0.3 M NaCl, 30 mM Na citrate, pH 7.0) were selected as negative controls did. For each gene, a set of primers was supplied with Primer3 software (Rosen and Skaletsky (1998) Primer3. Code available from http://www-genome.wi.mit.edu/genomesoftware/otherprimer3.html). Under, generated. The program parameters are such that the amplicon is close to 80 ° C. but does not exceed 88 ° C. or is less than 75 ° C., the amplicon length is generally about 450 bp (some outer layers are between 300 and 700 bp) and the primers are The selection was such that the annealing temperature was about 60 ° C. and the average primer length was 23 bp. All amplicon sequences have been carefully checked using copyrighted software (BLASTIN, FASTA) to avoid homology between repetitive elements and other related sequences, and also between genes from the same family. Was distinguished. A complete list of all selected genes is shown in Table 4.
[0118]
(DNA, RNA and mRNA isolation)
Total RNA and DNA were reduced to about 10 8 It was isolated from human peripheral lymphocytes isolated from Trizol reagent (Gibco BRL, Burlington, ON) from HeLa cell cultures and fresh blood aliquots. DNA and RNA concentrations and quality were determined by spectroscopy and gel electrophoresis in 0.8 or 2% agarose gels, respectively. Poly (A) + RNA was isolated from 150 μg of total RNA using the Oligotex mRNA kit (Qiagen, Mississauga, ON) according to the manufacturer's instructions.
[0119]
(Amplification and purification of probe)
10 μg of total RNA was reverse transcribed using 200 U of MMLV (Gibco BRL, Burlington, ON) in a 40 μl reaction according to the manufacturer's instructions. Two PCR reactions for each primer set were performed in a GeneAmp PCR system 9700 (PE Applied Biosystems, Norwalk, CT) in a total volume of 100 μL. Each 50 μl reaction (10 mM Tris-HCl, pH 8.6, 50 mM KCl, 0.1% Triton X-100, 1.5 mM MgCl 2 , 0.5 mM of each dNTP, 20 pM of each primer, 1.25 U of Taq DNA polymerase (Amersham Pharmacia Biotech, Baiae d'Urfe, QC) and 10 μl of RT reaction or 100 ng of genomic DNA as follows. 1 cycle, 94 ° C for 5 minutes, 35 cycles, 94 ° C for 45 seconds, 60 ° C for 1 minute and 72 ° C for 30 seconds, final cycle, 72 ° C for 7 minutes. Probes that cannot be amplified by RT-PCR are extracted from genomic DNA under conditions where primers are selected in the 3 'region of the gene, and the size and yield of PCR products are determined by gel electrophoresis in 2% agarose did. The PCR product was then purified, or after preparative agarose gel electrophoresis (if by-products were determined), from a solution or agarose gel band using a GFX column (Amersham Pharmacia Biotech, Baiae d'Urfe, QC). . After purification, the concentration of all probes was estimated by agarose gel electrophoresis and adjusted to about 100 ng / μl.
[0120]
(Robotic array)
Purified PCR products in 2 × standard salt solution (SSC) were collected using GeneMachines TM Arrays were formed in triplicate from 384-well plates using an OmniGrid microarray (Genomic Instrumentation Services, San Carlos, Calif.) Fitted with ChipMaker2 chips (Telechem International, San Jose, Calif.). The space between the dots was 400 μm. Microarrays were printed on Hybond-N nylon membrane or Hybond-N + nylon membrane (Amersham Pharmacia Biotech, Baiae d'Urfe, QC) taped to a standard glass slide. Normal slides were inserted before and after each of the 10 slides and the membrane to check print quality. After forming the array, the membrane was irradiated with UV at 50 mJ (GS Gene Linker, Bio-Rad, Hercules, CA) to immobilize the DNA. A fragment of the membrane containing the array (about 1 x 1.5 cm) was excised, denatured in boiling water for 5 minutes, rinsed with 0.1% SDS for 5 minutes, and used for prehybridization. After the UV irradiation step, the membrane may be stored on a glass slide.
[0121]
(Preparation of DIG-labeled cDNA for hybridization)
An initial mixture of gene specific primers (GSP) was prepared. For this purpose, 1 nM of each primer used in the RT-PCR reaction for preparing the probe was mixed in a total volume of 250 μl. Digoxigenin (DIG) labeled targets were generated by RT reaction as follows: a total of 14 μl, 1 μl GSP, 4 μg total RNA and RNAase free water was heated at 65 ° C. for 15 minutes, The RNA was denatured and then kept at room temperature for 5 minutes for primer annealing. Alternatively, 2 μg mRNA and 400 ng oligo (dT) 12-18 Primers were used. 8 μl of 5 × primary buffer, 2 μl of a 10 mM mixture of dATP, dCTP and dGTP (500 μM each final concentration), 4 μl of 0.1 M DDT, 0.7 μl of RNA guard, 31 U / supplied from enzyme manufacturer μl (Amersham Pharmacia Biotech, Baied d'Urfe, QC), 10 μl of a 2 mM mixture of 19: 1 dTTP: DIG-11-dUTP (Roche, Laval, QC) and 2 μl (200 U / μl) of Moloney murine leukemia virus reverse transcription A reaction mixture containing the enzyme (MMLV RT) (Gibco BRL, Burlington, ON) was added. The reaction was performed at 37 ° C. for 1 hour, followed by enzyme cleavage at 94 ° C. for 5 minutes with GeneAmp 9700. Alternatively, Omniscript reverse transcriptase (Qiagen, Mississauga, ON) was used according to the manufacturer's instructions. The labeling reaction was purified on a GFX column. This step removes all labeled products shorter than 100 bp, as well as unincorporated nucleotides, primers and proteins.
[0122]
After purification, the labeling potency was estimated as follows: 1 μl of the 1: 100, 1: 1000, 1: 10000 and 1: 100000 dilutions were used to standardize our assay at a known concentration (10 (−0.01 pg / μl) with a dilution of control DIG-labeled DNA (Roche, Laval, QC) was spotted onto Hybond-N membrane. After UV immobilization, the membrane was incubated with an alkaline phosphatase (AP) conjugated antibody to DIG (anti-DIG-AP), rinsed, and the chemiluminescent substrate, 3- (4-methoxyspiro} 1,2-dioxetane -3,2 '-(5'-chloro) tricyclo [3.3.1.1 3,7 Stained with [decane {-4-yl) phenyl disodium phosphate-CSPD (Roche, Laval, QC) according to the manufacturer's instructions.
[0123]
(Hybridization and processing)
For hybridization and prehybridization, DIG Easy Hyb buffer (Roche, Laval, QC) or formamide buffer containing 50% deionized formamide, 5 × SSC, 2% blocking solution (Roche, laval, QC), 0.1% N-lauroyl sarcosine, 0.02% SDS, 100 μg / ml denatured salmon DNA was used. The membrane was prehybridized at 42 ° C. for 2 hours in a hybridization oven (Autoblot, Bellco, Vineland, NJ). Hybridization was performed overnight at 42 ° C. in no more than 1 ml of hybridization solution in a 5 ml Falcon tube. The concentration of labeled probe in the hybridization mixture constituted 10 ng / ml. Prior to hybridization, the probe was denatured in the hybridization solution at 65 ° C. for 10 minutes.
[0124]
The hybridization membrane was then rinsed twice (unless otherwise noted) with 1 × SSC, 0.1% SDS for 15 minutes at room temperature and then pre-warmed 0.1 × SSC, 0.1 × SSC. Rinse with 1% SDS for 15 minutes at 68 ° C. Alternatively, the membrane is subjected to more stringent conditions, i.e., twice at 68% in 2xSSC, 0.1% SDS for 30 minutes and at 68C in 0.1xSSC, 0.1% SD. Rinse twice for 30 minutes. After equilibrating for 5 minutes with a rinse buffer (containing 0.3% Tween 20, maleic acid buffer (0.1 M maleic acid, 0.15 M NaCl, pH 7.5)), the membrane was blocked for 1 hour and 1% blocking. Block with slight agitation in the solution and then treat for 30 minutes in 10 ml of alkaline phosphatase-conjugated sheep anti-digoxigenin antibody (Roche, Laval, QC) and dilute 1: 1000 for colorimetric staining Or 1: 10000 for chemiluminescence detection. After antibody incubation, the membrane is rinsed three times for 15 minutes in rinse buffer, equilibrated for 2 minutes in detection buffer (0.1 M Tris-HCl, 0.15 M NaCl, pH 9.5), and Staining was performed in detection buffer with 175 μg / ml 5-bromo-4-chloro-3-indolyl-phosphate, toluidine salt (BCIP), and 330 μg / ml nitroblue tetrazolium chloride (NBT). Alternatively, a 1: 100 dilution of CSPD was applied and chemiluminescence was detected using BioMax MR Kodak film according to the manufacturer's recommendations (Roche, Laval, QC).
[0125]
(Array scanning and evaluation)
Arrays were scanned on an Olympus microscope equipped with a Multiscan-4 system (Applied Scientific Instrumentation, Eugene, OR) and a color CCD Sony 950 camera. Data acquisition and montage of different fields on one film was performed by Northern Eclipse Imaging System (EMPIX Imaging, Mississauga, ON). Quantitative measurement of the intensity of the enzymatic reaction at each dot, subtraction of background, normalization to housekeeping genes, and comparison of paired hybridizations were all performed by software programs in the laboratory.
[0126]
(result)
(Selection of probe and primer)
After careful evaluation of the different databases, 61 genes, including 9 housekeeping genes, were selected for array formation. This set of genes includes the 38E box binding gene as the Myc (c-, N-, L1 and L2) family, 5c-Myc regulator (ZFP161, nm23-H2S, MBP-1, RBMS 1 and RBMS2), 5c-Myc Includes with interacting genes (YY1, TFII-1, PAM, MM-1, and alpha-tubulin), and 4c-Myc target genes (prothymosin alpha, MRDB, ODC1, and cdc25A). Positive controls include nine housekeeping genes (UBC, beta-actin, GADPH, HPRT1, phospholipase 2, HLA-C, PRS9, aldolase C, and RPL13A) with different expression levels, and also HeLa genomic DNA. Lambda DNA and 2 × SSC (2 × standard salt solution), which was used as solvent for all probes, were selected as negative controls.
[0127]
Primers for all genes were selected with the aid of Primer3 software, provided that they corresponded to the same conditions as the PCR reaction and produced the same melting point product. Most products were produced from HeLa or lymphocyte cDNA. If PCR amplification from the cDNA failed, primers were selected from the 3 'region of these genes, and amplicons were produced from HeLa genomic DNA. The average annealing temperature of the primers was 60.1 ± 0.9 ° C., which allowed all PCR reactions to be performed in a 96-well format. The size and melting point of the product and the annealing temperature of the primers are shown in Table 4. The average size of the PCR products for array formation, and their melting points were 441 ± 58 bp and 80 ± 3 ° C., respectively. The selection of these parameters allows hybridization and post-hybridization rinsing to be performed under stringent conditions, dramatically reducing the potential for cross-hybridization and background levels.
[0128]
Careful selection of primers can, in some cases, be very close between members of the gene family (eg, USF1 and 2, ID2, 3, and 4, members of the Myc family, etc.), or transcription of two different c-Myc. It can be used for discrimination between objects. As is well known, there are several different c-Myc transcripts with different regulatory properties transcribed from different promoters (Bodescot and Bison Gene 174, 115-120 (1996)). 1 st Exon and 2 nd -3 rd Selecting primers in exons allows discrimination between full-length and truncated c-Myc.
[0129]
(Conditions affecting hybridization)
Several parameters were examined carefully which likely affected the results of the hybridization with the cDNA microarray printed on the nylon membrane. First, the results of gene profiling were examined using either mRNA or total HeLa RNA. Surprisingly, all patterns of expression were very similar, except for some genes (UBC, RPL-13A, MBP-1), whose signals from mRNA were several times higher. The most striking difference was found in UBC, which reached a factor of five. Alternatively, the signal for HPRT1 and phospholipase A2 is higher than total RNA. Under conditions where the amount of mRNA is the limiting factor, total RNA may be used instead and there is no significant difference in the results of expression profiling.
[0130]
Comparison of the two reverse transcriptases, Moloney murine leukemia virus (MMLV) (Gibco BRL, Burlington, ON) and OmniScript (Qiagen, Mississauga, ON), used for the production of digoxigenin-labeled targets for hybridization. Did not show any differences in the expression profiles when using gene specific primers. However, the signal intensity was stronger after labeling with MMLV, especially after the day of staining (Table 5). When the oligo (dT) primer was used with mRNA, some significant differences in the expression levels of some genes were detected. Labeling with OmniScript generates a 2-3 fold higher signal intensity for RP-S9, RP-L13A, enolase 1, N-Myc and MAD4.
[0131]
To determine which buffers are better for hybridization with the microarray, EasyHyb TM (Roche, Laval, QC) and formaldehyde-based buffers were compared. The expression profile of HeLa mRNA was found to be independent of buffer composition, but the signal was higher after hybridization in formaldehyde buffer (Table 5) and 2% blocking Add EasyHyb TM The background is further reduced compared to, which facilitates the next scan and image evaluation.
[0132]
No substantial differences were found in the expression profile of HeLa mRNA when using different stringency rinse conditions (see Materials and Methods). A more stringent rinse uniformly reduces all signals and produces signals with sharper boundaries, which can be more easily scanned and evaluated. Standard rinsing conditions are probably already sufficiently stringent for hybridization of cDNA microarrays and gene-specific primers. Therefore, a standard rinse is preferred, as it takes less time.
[0133]
A comparison of a positively charged (Hybond-N +) nylon membrane and a neutral (Hybond-N) nylon membrane revealed no difference in sensitivity. Aside from this consideration, neutral (Hybond-N) nylon membranes are preferred because they are strong fabrics as printing supports. This intensity was not seen with the positively charged Hybond-N + membrane, which complied the image analysis and increased background as it retained visible print marks.
[0134]
As can be seen from Table 5, extending the staining time from overnight to one day typically increases the overall intensity of the signal by only 10%. Long staining times increase the background level of the reaction, which detracts from the potential advantage of high sensitivity. Variations in hybridization conditions can increase overall signal intensity by 30-40%. However, the positive effect is not additive, with the largest difference in the overall intensity of the microarray approach reaching only 50%. For hybridization of DIG-labeled targets on cDNA microarrays, the following conditions are optimal: printing probes on neutral nylon membrane, reverse transcription reaction on total RNA, gene-specific primers and MMLV reversal. Transcriptase, hybridization in formaldehyde buffer, and standard rinsing conditions. These conditions were performed in the experiments described in the following paragraphs.
[0135]
(Specificity, sensitivity and reliability of hybridization)
To evaluate the specificity of cDNA microarray hybridization, five genes (MRDB, ODC, TFII-1, cdc25A, and c-Myc) covering the entire range of array formation products (368-711 bp) in length Was labeled by multiple PCR reactions and hybridized to the cDNA array (FIG. 6). As expected, only 5 samples on the array were positive, as was the HeLa genomic DNA control. This is because the HeLa genomic DNA will hybridize to the location that is spotted at location 51 at the highest concentration. Negative indicates that spotted HeLa genomic DNA is low or only slightly detected at positions 1a and 1b or not detected. Overall, these experiments showed no signs of cross-hybridization (FIG. 4).
Different concentrations of this 5-gene PCR mixture (10, 4, 1, 0.4, 0.1, and 0.04 ng / ml) were combined with the array to estimate sensitivity and derive a calibration curve for cDNA microarray hybridization. Hybridized. The result of this experiment is shown in FIG. Linear dependence in semi-logarithmic coordinates and a clear plateau in the range of 4-10 ng / ml were observed for all genes, with the same 45 ± 2 slope. The lower limit of detection varies slightly with different probes in the array, corresponding to 40-100 pg / ml for each individual gene. These results, according to the manufacturer (Roche, Laval, QC), are close to the detection limit (10-30 pg / ml) for the digoxigenin system. This level of sensitivity allows for the detection of intermediate abundance mRNA, each representing greater than 0.04% of total cellular mRNA. Given this level of detection, it is estimated that 7 ng of labeled probe produced from gene-specific primers will be sufficient for hybridization on a microarray containing about 70 genes of intermediate abundance. A labeled probe concentration of 10 ng / ml was chosen for the next hybridization. The yield of a standard reverse transcription labeling reaction with gene specific primers was about 20-40 ng. Thus, one labeling reaction yields enough product for 2-4 separate hybridization reactions. In contrast to labile radioactive probes, DIG-labeled probes can be stored and reused several times. After storage at 20 ° C. for several months, the hybridization mixture was reused 2-3 times with very consistent results.
[0136]
The array was scanned at a resolution of 3600 dpi and the results were compared with the results of microscopic scanning. In general, the variability between replicated dots is high in the case of a scanner, and linearity can be affected by scanner software. The scanner can be used for an initial assessment of the results of the hybridization, especially when chemiluminescent detection is performed.
[0137]
(Expression profiling of Hela cells compared to human lymphocytes)
The expression profile of the E-box gene was determined in replicating HeLa cells (FIG. 8a) and normal human lymphocytes (FIG. 8b). In lymphocytes, the most striking changes consist of more than 2-fold up-regulation of the E-box associated genes TCF4, MAD4, and aldolase C. Alternatively, down-regulation of the c-Myc-regulated genes MBP1 and Nm23-H2S, as well as small down-regulation of c-Myc and up-regulation of M-Myc were recorded in lymphocytes compared to HeLa cells. Several c-Myc interactions and expression of target genes were down-regulated (MM-1, ODC1) or up (PAM, MrDb) in lymphocytes. Also, small up (MITF, ID2) and down (TFEB) regulation was detected in the expression of some E-box binding genes in lymphocytes as compared to HeLa cells. These results are shown in FIGS. 9a, 9b and 9c.
[0138]
(Abstract)
cDNA and oligonucleotide microarrays have become an increasingly powerful technique for studying gene expression patterns. Despite the rapid progress in this area, some limitations of this technology remain. One of the major obstacles is that large amounts of mRNA are required. Another problem with existing microarray systems is data mining. Information on the expression of tens of thousands of genes is absolutely critical in determining the function of a new gene, but in some cases, researchers have found that gene expression under many physiological conditions I am interested in one subset of expression profiles. Significant differences in the expression of 3-6 genes from 61 are already more manageable than can be detected from ordinary microarrays of vast numbers, hundreds or thousands of genes. For example, in SAGA analysis of 45,000 genes, differential expression in normal and cancerous human cells was found to be only about 1%. Similar estimates were obtained from analysis of expression profiles in young and old mice. Expression of only about 1.8% of about 6,000 genes varies more than 2-fold.
[0139]
Printing microarrays on nylon filters and using digoxigenin to label cDNA with gene-specific primers allows the use of as little as 4 μg of total RNA per hybridization. This is the same sensitivity that can be obtained with radioactivity in the Clontech protocol, and requires a few micrograms of mRNA, and thus a regular microarray that requires 100 to 1,000 micrograms of total RNA to start More sensitive than In addition, DIG-labeled probes with high labeling sensitivity can be stored for long periods of time, as opposed to fluorescently or radiolabeled, and can be reused several times.
[0140]
Careful selection of the genes to include in the microarray and use of digoxigenin for labeling also helps to avoid another drawback of radiolabeling. The genes in the E-box microarray are all of the same category of abundance (medium or low abundance). Excluding very large numbers of genes eliminates the problem of strong signal mergers. The merged signal, under some circumstances, substantially complicates the scanning process and produces unreliable results during the data acquisition step.
[0141]
Other advantages of using an enzyme labeling approach instead of both radioactive and fluorescent probe approaches are time saving and repeatability aspects. Generally, this process from start to finish includes the steps necessary for labeling the cDNA, hybridization, rinsing, incubation with an alkaline phosphatase-conjugated anti-digoxigenin antibody, staining to reveal bound alkaline phosphatase, and Includes scanning for data acquisition and requires up to 2 days. This is radioactive 32 P or 33 For P-labeled probes, there is a considerable time saving compared to requiring up to 8 days of exposure. An advantage of enzyme-labeled probes over fluorescently-labeled probes is the cost savings in the data evaluation step. While this method requires an inexpensive, routine upright microscope, fluorescently labeled probes require the use of expensive laser detection systems or confocal microscope setups. This, in addition to the well-known fact that fluorescence can easily fade after the scanning process, and the ability to repeatedly scan the array with an inexpensive microscope without losing the original signal intensities, has led to our inventors. Make the enzymatic approach much better.
[0142]
These results can be compared to commercially available gene expression arrays, such as:
Table 6: Comparative performance of gene expression array systems
[0143]
[Table 6]
Figure 2004502129
[0144]
* Conventional usage, current limit in parentheses.
** Before amplification in in vitro transcription reaction (typically 30-100 fold).
Table 4 List of E-box transcription factors, c-Myc interacting genes and housekeeping genes represented in the microarray
[0145]
[Table 4]
Figure 2004502129
Figure 2004502129
Figure 2004502129
Figure 2004502129
[0146]
Table 5 Effect of different hybridization conditions on microarray signal intensity
[0147]
[Table 5]
Figure 2004502129
[0148]
* Total intensity of all microarray dots after background subtraction; the same amount of DIG-labeled HeLa cDNA was used for all hybridizations.
[Brief description of the drawings]
FIG. 1a
FIG. 1a shows an apparatus for making a microarray.
FIG. 1b
FIG. 1b shows an apparatus for making a microarray.
FIG. 1c
FIG. 1c shows an apparatus for making a microarray.
FIG. 1d
FIG. 1d shows an apparatus for making a microarray.
FIG. 1e
FIG. 1e shows an apparatus for making a microarray.
FIG. 2
2a-e show all steps of template definition, repetition, detection of unreliable regions, and spot labeling. It is easy to distinguish over-expressed spots labeled as "*" and spots distorted by over-expressed spots, labeled with "?". Spot marking is confirmed by visual inspection on the original image, where the arrows indicate the location of the spot in the shadow of the overexpressed spot. FIG. 2a is a raw image of a portion of a ClonTch cDNA array. The array quantification method uses a ClonTech Atlas containing 588 cDNA elements spotted in duplicate. TM Tested by analyzing the cDNA filter array. Autoradiographs were obtained after radiolabeling, array hybridization, and rinsing procedures according to the user manual provided by the manufacturer. The autoradiograph was scanned vertically at 300 DPI and digital images were obtained with 8-bit clay scale and gamma correction disabled. 3 * A three-out-range pixel smoothing filter was applied to reduce salt-and-pepper noise. The initial position is superimposed on a grid template on the original image, which is one block of the Clontech filter. The user is required to provide the location of the upper left and lower right corner spots via the graphical user interface. In equations (5) and (6), the parameter is λ i = SUB> i = 1 and sum @ T0. FIG. 2b is an initial alignment to the prototype template. FIG. 2c is a fine alignment by automatic repetition of deformable templates. FIG. 2d shows the unreliable area (yellow) detected by mathematical morphology. The structuring element is selected as a disk of the same size as the ideal sample spot. FIG. 2e shows the automatic labeling of spots corresponding to unreliable regions (“*” overexpressed spots; spots distorted by “?” Shadows; “o” normal spots).
FIG. 3
Figures 3a-3d show qualitative and quantitative assessments of repeatability and reliability. ClonTech Atlas TM Two blocks of the mouse cDNA array (transcription factor and general DNA binding protein) were quantified using the same deformable template method. The imaging conditions are the same as in FIG. 2a. Two independent operators are needed to determine the initial position (upper left and lower right corner) of the prototype template (FIG. 3a). Each operator repeats the same procedure three times for one sample. For simplicity, the normalized intensity of the spot at [0,0.33] is low abundance, [0.33,0.67] is medium abundance, and [0.67,1] is high. Defined as existence. The relative error to intensity indicates that the error in quantifying low abundance spots was found to be higher than in quantifying medium and high abundance spots. The maximum error, expressed as a ratio, to the intensity indicates that the error, expressed as a ratio in the low abundance spots, is higher than the remaining spots (FIG. 3b). An example of unwanted normalization is compared to gene expression in two samples comparing to a control gene (FIG. 3c). Line L1 represents two identical samples: S1i = S2i, i = 1,. . . , N, where line L2 is the center line of the actual sample and line L3 is the center line of the actual control. The normalization procedure can be understood as rotating the coordinate space by the angle θ (L2, L3). Therefore, the reliability of the normalization can be evaluated by the angles θ (L1, L3) and θ (L2, L3) (FIG. 3d). The larger the angle, the less reliable the normalization. In this case, θ (L1, L3) = − 29.30 ° and θ (L2, L3) = − 14.58 °. Examples of desirable normalization can be found at θ (L1,3) = − 0.96 °, θ (L2, L3) = 2.13 °.
FIG. 4
FIG. 4 shows cDNA microarray hybridization for evaluation of E-box binding-related gene expression. The matrix positions are listed below each position of three repetitions of the same amount of deposited dots, along with the abbreviations for each gene. The X axis shows the positions of Equations 1, 2, 3, 4, and 5, and the Y axis shows the "a" to "o" positions. The matrix position for each gene triplet is subsequently identified on the X, Y axes. For example, 5k indicates the position of N-Myc and 3d indicates the position of Mad. The same coordinates are also included in Table 4.
FIG. 5
Figures 5a and b show the expression profiles of E-box binding related gene expression in Hela cells. Figure 5a-Total RNA was labeled with digoxigenin in an RT reaction with gene specific primers. Figure 5b-mRNA was labeled with digoxigenin in an RT reaction with an oligo (dT) primer. Arrows in the matrix indicate the position of: I-Hella DNA (positive control); II-lambda DNA (negative control); III-UBC; IV-RPL-13A; V-MBP-1; VI-HPRT1. The distance between the dots can be measured by a 1 mm straight line.
FIG. 6
FIG. 6 shows the hybridization of the products of multiplex PCR with 5 pairs of primers by cDNA microarray. Arrows in the matrix point to: I-Mrdb; II-c-Myc p64; III-TFII-1; IV-ODC1; V-cdc25A; VI-Hella genomic DNA.
FIG. 7
FIG. 7 shows the relationship between the concentrations of the five genes, including Mrdb, c-Myc, TFII-1, ODC1, and cdc25a, and the intensity of the hybridization signal. Show logarithmic approximation. The dot intensity is represented by an arbitrary unit on the Y axis. The concentration is measured in ng / ml on the X-axis.
FIG. 8
Figures 8a and 8b show the expression profiles of E-box related genes in Hela cells (Figure 8a) and normal human lymphocytes (Figure 8b). Arrows in the matrix indicate the positions of: I-Aldolase C; II-Mad4; III-MB-1.
FIG. 9a
FIG. 9a shows a pairwise comparison of E-box gene expression in Hela cells and human lymphocytes. Two independent hybridizations were averaged for each type of cell. FIG. 9a is a three-dimensional display of differences in gene expression, and FIG. 9b is a two-dimensional display. Each panel corresponds to one row in FIG. 8a, and each bar represents an individual gene. FIG. 9c is a distribution of genes with a common increase or decrease in expression, depending on the value of the relative ratio. The relative magnification between samples S1 and S2 is
(Equation 25)
Figure 2004502129
Which gives a value in the range [-1, + 1]. Positive values correspond to up-regulation of the gene in sample S2 and negative values correspond to down-regulation. Relative magnification has the same meaning as conventional magnification, except that this value is normalized, symmetric, and has a clear physical interpretation. R DM (S 1 , S 2 ) = ± 0.5 corresponds to a two-fold up or down regulation in normalization of the two samples, a set of housekeeping genes with relatively constant expression levels is selected as symmetric, and linear normalization is Applied.
FIG. 9b
FIG. 9b shows a pairwise comparison of E-box gene expression in Hela cells and human lymphocytes. Two independent hybridizations were averaged for each type of cell. FIG. 9a is a three-dimensional display of differences in gene expression, and FIG. 9b is a two-dimensional display. Each panel corresponds to one row in FIG. 8a, and each bar represents an individual gene. FIG. 9c is a distribution of genes with a common increase or decrease in expression, depending on the value of the relative ratio. The relative magnification between samples S1 and S2 is
(Equation 26)
Figure 2004502129
Which gives a value in the range [-1, + 1]. Positive values correspond to up-regulation of the gene in sample S2 and negative values correspond to down-regulation. Relative magnification has the same meaning as conventional magnification, except that this value is normalized, symmetric, and has a clear physical interpretation. R DM (S 1 , S 2 ) = ± 0.5 corresponds to a two-fold up or down regulation in normalization of the two samples, a set of housekeeping genes with relatively constant expression levels is selected as symmetric, and linear normalization is Applied.
FIG. 9c
FIG. 9c shows a pairwise comparison of E-box gene expression in Hela cells and human lymphocytes. Two independent hybridizations were averaged for each type of cell. FIG. 9a is a three-dimensional display of differences in gene expression, and FIG. 9b is a two-dimensional display. Each panel corresponds to one row in FIG. 8a, and each bar represents an individual gene. FIG. 9c is a distribution of genes with a common increase or decrease in expression, depending on the value of the relative ratio. The relative magnification between samples S1 and S2 is
[Equation 27]
Figure 2004502129
Which gives a value in the range [-1, + 1]. Positive values correspond to up-regulation of the gene in sample S2 and negative values correspond to down-regulation. Relative magnification has the same meaning as conventional magnification, except that this value is normalized, symmetric, and has a clear physical interpretation. R DM (S 1 , S 2 ) = ± 0.5 corresponds to a two-fold up or down regulation in normalization of the two samples, a set of housekeeping genes with relatively constant expression levels is selected as symmetric, and linear normalization is Applied.

JP2000609615A 1999-04-08 2000-04-10 Quantitative assays for gene expression on microarrays Withdrawn JP2004502129A (en)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
CA002268695A CA2268695A1 (en) 1999-04-08 1999-04-08 Apparatus and method for analyzing information in arrays of information sites
US12923399P 1999-04-14 1999-04-14
US09/299,193 US6511849B1 (en) 1999-04-23 1999-04-23 Microarrays of biological materials
PCT/US2000/009526 WO2000060126A2 (en) 1999-04-08 2000-04-10 Quantitative assay for expression of genes in microarray

Publications (2)

Publication Number Publication Date
JP2004502129A JP2004502129A (en) 2004-01-22
JP2004502129A5 true JP2004502129A5 (en) 2004-12-24

Family

ID=27170957

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000609615A Withdrawn JP2004502129A (en) 1999-04-08 2000-04-10 Quantitative assays for gene expression on microarrays

Country Status (5)

Country Link
EP (1) EP1230383A2 (en)
JP (1) JP2004502129A (en)
AU (1) AU4224400A (en)
IL (1) IL145826A0 (en)
WO (1) WO2000060126A2 (en)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2001251086A1 (en) * 2000-03-31 2001-10-15 Sir Mortimer B. Davis Jewish General Hospital Microchip arrays of regulatory genes
US7219016B2 (en) * 2001-04-20 2007-05-15 Yale University Systems and methods for automated analysis of cells and tissues
CN1424405A (en) * 2001-12-14 2003-06-18 宋克 Gene chip molecular probe and related technology
DE10212958A1 (en) * 2002-03-22 2003-10-09 Friz Biochem Gmbh Detecting nucleic acid-oligonucleotide hybridization, useful e.g. for diagnostic tests, comprises using solid support that includes one or more built-in reference regions to indicate complete (optionally also zero or partial) hybridization
AU2009270534B2 (en) * 2008-07-15 2015-09-17 Institut Pasteur Korea Method and apparatus for imaging of features on a substrate
AU2010276236B2 (en) 2009-07-21 2014-03-20 Gen-Probe Incorporated Methods and compositions for quantitative detection of nucleic acid sequences over an extended dynamic range
US20110224088A1 (en) * 2010-03-11 2011-09-15 Heidi Lyng Biomarkers for subtypes of cervical cancer
JP5543310B2 (en) * 2010-09-29 2014-07-09 富士フイルム株式会社 Immunochromatographic inspection method and apparatus
JP5543888B2 (en) * 2010-09-29 2014-07-09 富士フイルム株式会社 Immunochromatographic inspection method and apparatus

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3813278A1 (en) * 1988-01-12 1989-07-20 Boehringer Mannheim Gmbh METHOD FOR DETECTING NUCLEIC ACIDS
IL129872A0 (en) * 1996-11-12 2000-02-29 Qbi Entpr Ltd Method for identifying translationally regulated genes
EP2295988A2 (en) * 1996-12-31 2011-03-16 High Throughput Genomics, Inc. Multiplexed molecular analysis apparatus and its fabrication method
WO1998052961A1 (en) * 1997-05-19 1998-11-26 Mirus Corporation Method for single-step attachment of a label to target molecules

Similar Documents

Publication Publication Date Title
US6759197B2 (en) Microchip arrays of regulatory genes
US8521441B2 (en) Method and computer program product for reducing fluorophore-specific bias
Freeman et al. Fundamentals of DNA hybridization arrays for gene expression analysis
US7774143B2 (en) Methods for analyzing high dimensional data for classifying, diagnosing, prognosticating, and/or predicting diseases and other biological states
US6500620B2 (en) Methods for amplifying and detecting multiple polynucleotides on a solid phase support
Wildsmith et al. Microarrays under the microscope
US8283122B2 (en) Prediction of clinical outcome using gene expression profiling and artificial neural networks for patients with neuroblastoma
US20060281126A1 (en) Methods for monitoring the expression of alternatively spliced genes
JP2004502129A5 (en)
WO2000060126A2 (en) Quantitative assay for expression of genes in microarray
Gomase et al. Microarray: an approach for current drug targets
US20050255466A1 (en) Method and system for determining absolute mrna quantities
CA2367413A1 (en) Quantitative assay for expression of genes in microarray
Dubey et al. Microarray technology: basic concept, protocols, and applications
Gupta et al. Microarray: an emerging diagnostic tool in dentistry
JEFFREY Construction and applications of gene microarrays on nylon
Zhang et al. DNA Microarray
Dago Performance assessment of different microarray designs using RNA-Seq as reference
Lee Microarray Technology
El-Rifai et al. Genetic analysis using microarrays
Last et al. Molecular Diagnosis of Lymphoma