JP3825281B2 - 検索スケジューリング装置、プログラム及びプログラムを記録した記録媒体 - Google Patents

検索スケジューリング装置、プログラム及びプログラムを記録した記録媒体 Download PDF

Info

Publication number
JP3825281B2
JP3825281B2 JP2001186907A JP2001186907A JP3825281B2 JP 3825281 B2 JP3825281 B2 JP 3825281B2 JP 2001186907 A JP2001186907 A JP 2001186907A JP 2001186907 A JP2001186907 A JP 2001186907A JP 3825281 B2 JP3825281 B2 JP 3825281B2
Authority
JP
Japan
Prior art keywords
search
probe
microarray
sample
expression intensity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001186907A
Other languages
English (en)
Other versions
JP2003004736A (ja
Inventor
大輔 山口
宣之 山本
卓郎 田村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Software Engineering Co Ltd
Original Assignee
Hitachi Software Engineering Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Software Engineering Co Ltd filed Critical Hitachi Software Engineering Co Ltd
Priority to JP2001186907A priority Critical patent/JP3825281B2/ja
Priority to US10/154,007 priority patent/US20030004939A1/en
Publication of JP2003004736A publication Critical patent/JP2003004736A/ja
Application granted granted Critical
Publication of JP3825281B2 publication Critical patent/JP3825281B2/ja
Priority to US11/979,038 priority patent/US20080270362A1/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression

Landscapes

  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Molecular Biology (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、特定のDNAやタンパク質と特異的にハイブリダイズする生体高分子等を多数スポットしたマイクロアレイを対象として、そのハイブリ反応等の測定結果データから、目的の特徴を備えるマイクロアレイやプローブ等を分類・検索する検索スケジューリング装置、プログラム及びプログラムを記録した記録媒体に関する。
【0002】
【従来の技術】
従来、何種類ものプローブを配置・固定化してなるマイクロアレイを用いた実験では、これらマイクロアレイに対して、調査対象となるターゲットをアプライ(反応)させることで、両者の結合、又は非結合を観測する。
このマイクロアレイは、スポッタのような装置を用いて、マイクロアレイ上の一のスポット毎に一種類のプローブを固定化して、全スポットには、幾種類ものプローブが配置・固定化された構成となっている。
このマイクロアレイ上に配置・固定化された幾種類ものプローブと、このマイクロアレイに反応(アプライ)させるターゲットとの結合の様子(結合の有無等)の観測は、マイクロアレイのスポット毎の結合反応の量を測定することによって行われる。
【0003】
この結合反応の量の測定は、予め実験に際してターゲットに結合しておいた蛍光物質等による発現強度(例えば、蛍光量)を、スポット毎に測定することによって行われ、その測定結果、すなわち実験結果は数値として得られるようになっている。
上述したマイクロアレイを用いた実験における、各スポット、すなわち各プローブの発現強度の測定結果は、収集・蓄積され、これに基づき各種の分析が行われる。
近年、このようなマイクロアレイとして、DNAをプローブとして固定化したDNAマイクロアレイが、急速に普及しつつある。
【0004】
【発明が解決しようとする課題】
しかし、このようなマイクロアレイを用いた実験によって得られる実験結果のデータ量は、非常に膨大なものであり、これをどのように分類,解析するかが課題となっている。
例えば、マイクロアレイを用いた実験では、幾種類ものプローブが配置・固定化されている一のマイクロアレイに、一のターゲットをアプライし、異種プローブ間で同じターゲットに対する発現強度を比較する。
【0005】
また、複数のプローブが同じ配置であるマイクロアレイを複数準備し、この複数のマイクロアレイそれぞれに相異なるターゲットをアプライし、各アレイ間で同じプローブの異なるターゲットに対する発現強度を比較する。
しかしながら、このような実験によるデータが大量に収集・蓄積されるようになってくると、上述した分類,解析のために、大量蓄積された実験結果データの中から目的の性質を持つターゲットを探したり、ある種の性質によってプローブを分類する等の作業が必要となってくる。
これまでにも発現強度順、名前順、プローブ群等毎にプローブの整理・検索は行われていたが、実験データの中には、誤差や、プローブ種毎に非特異的な反応が含まれることも多く、これらが実験結果の分類,解析を困難なものにしている。
【0006】
本発明は、上記した問題点に鑑み、このようなマイクロアレイを用いた実験の実験結果データの中から、非特異的な反応のスポット群や反応の誤差が整理・検索に与える影響を抑制して、目的の特徴を持つデータ(マイクロアレイ、プローブ、ターゲット等の個有データ)を整理・検索可能にした検索スケジューリング装置、プログラム、及びプログラムを記録した記録媒体を提供することを目的とする。
【0007】
【課題を解決するための手段】
上記した課題を解決するために、本発明の検索スケジューリング装置は、プローブが固定化されたスポットを備えるマイクロアレイにターゲットとしてのサンプルをアプライした場合の当該マイクロアレイのスポット毎の測定結果の発現強度が記憶される検索用レコード、及び検索用レコードに記憶されている各マイクロアレイのスポット毎の発現強度の値に基づいて、当該各マイクロアレイのスポットに固定化されたプローブ種毎の発現強度の値に応じたマイクロアレイ数が記憶されるヒストグラム用レコードを有するデータセットファイルと、一又は複数のプローブについての発現強度のが検索条件として入力されたとき、当該検索条件の又は複数のプローブについての発現強度の値と検索用レコードに記憶されている当該検索条件と同じ一又は複数のプローブ種のサンプル毎の発現強度の値との差、並びに当該検索条件の一又は複数のプローブ種についてヒストグラム用レコードを基に作成されたヒストグラム上における当該検索条件の発現強度の値に対応したマイクロアレイ数に基づいて、サンプル毎若しくはサンプルをアプライしたマイクロアレイ毎に当該検索条件の一又は複数のプローブ種と結合する度合いを算出し、当該算出した度合いに基づいて当該検索条件の一又は複数のプローブ種と特徴的に結合するサンプル若しくは当該サンプルをアプライしたマイクロアレイを特定する検索手段とを備えることを特徴とする。
また、本発明の検索スケジューリング装置は、プローブが固定化されたスポットを備えるマイクロアレイにターゲットとしてのサンプルをアプライした場合の当該マイクロアレイのスポット毎の測定結果の発現強度が記憶される検索用レコード、及び検索用レコードに記憶されている各マイクロアレイのスポット毎の発現強度の値に基づいて、当該各マイクロアレイにアプライしたサンプル種毎の発現強度の値に応じたプローブ種数若しくはスポット数が記憶されるヒストグラム用レコードを有するデータセットファイルと、一又は複数のサンプル種についての発現強度の値が検索条件として入力されたとき、当該検索条件の一又は複数のサンプル種についての発現強度の値と検索用レコードに記憶されている当該検索条件と同じ一又は複数のサンプル種をアプライしたマイクロアレイのスポット毎の発現強度の値との差、並びに当該検索条件の一又は複数のサンプル種をアプライしたマイクロアレイについてヒストグラム用レコードを基に作成されたヒストグラム上における当該検索条件の発現強度の値に対応したプローブ種の数に基づいて、プローブ種毎に当該検索条件の一又は複数のサンプル種と結合する度合いを算出し、当該算出した度合いに基づいて当該検索条件の一又は複数のサンプル種と特徴的に結合するプローブ種を特定する検索手段とを備えることを特徴とする。
【0008】
これにより、マイクロアレイを用いた実験の実験結果データの中から、非特異的な反応のスポット群や反応の誤差が整理・検索に与える影響を抑制して、目的の特徴を持つデータ(マイクロアレイ、プローブ、ターゲット等の個有データ)を整理・検索可能となる。
【0009】
また、本発明の検索スケジューリング装置の前記検索手段は、前記検索されるプローブ又はマイクロアレイ別の発現強度のヒストグラム上におけるユニークさを、その算出した度合いを比較することにより、目的の特徴を持つデータ(マイクロアレイ、プローブ、ターゲット等の個有データ)が数量的に判定可能になる。
【0010】
また、本発明は、コンピュータを、上述した構成からなる検索スケジューリング装置として機能させるためのプログラム、又はこのプログラムを記録したコンピュータ読み取り可能な記録媒体であることを特徴とする。
【0011】
これにより、コンピュータを、マイクロアレイを用いた実験の実験結果データの中から、非特異的な反応のスポット群や反応の誤差が整理・検索に与える影響を抑制して、目的の特徴を持つデータ(マイクロアレイ、プローブ、ターゲット等の個有データ)を整理・検索可能な検索スケジューリング装置として、利用することができる。
【0012】
【発明の実施の形態】
以下、添付図面を参照しながら、本発明の実施の形態について説明する。
図1は、本発明の一実施の形態の検索スケジューリング装置1の構成を示すブロック図である。
検索スケジューリング装置1は、キーボード装置11及びディスプレイ装置12を有する入出力装置10と、各種制御/演算を行う演算装置20と、各種データが記録されるデータセットファイル装置30とから大略構成されている。
【0013】
入出力装置10は、実験結果や検索条件等といった各種データをキーボード装置11から入力したり、データセットファイル装置30の記録データの検索結果等といった各種データをディスプレイ装置12に表示する等する。
なお、実験結果の演算装置20への入力は、キーボード装置11でマニュアル入力せずとも、図示せぬ実験結果の測定装置を予め演算装置20とデータ伝送可能に構成し、この測定装置を入力装置として、実験結果を自動入力することもできる。
【0014】
演算装置20は、図示せぬCPU,RAM,ROM,I/F(インタフェース)等から構成されている。演算装置20は、ROMに予め固定されているプログラム、又は付設されたCD-ROMドライブ等の記録媒体読取装置によって読込んだCD-ROM等の記録媒体に固定されたプログラム、又は外部ネットワークからI/Fを介して配信されたプログラム等に基づき、後述する検索用データ設定処理、検索実行処理等に関わる各種個別処理を行う。
【0015】
データセットファイル装置30は、演算装置20とI/Fを介して接続された外部記憶装置、ネットワーク接続されたデータサーバ等によって構成されている。
本実施の形態の場合、データセットファイル装置30は、スポットレコード31、検索用スポットレコード32、ヒストグラム用区間レコード33、及び区間設定レコード34といった各種データレコードを備える。
【0016】
図2は、このデータセットファイル装置30に備えられた各種データレコードの構成図である。
まず、スポットレコード31は、入出力装置10から入力されたスポット毎の実験結果を記憶するための、プローブコードエリア31aと、発現強度エリア31bとを備える。
【0017】
プローブコードエリア31aは、マイクロアレイA(K)(ただし、Kは1≦K≦Nの任意の整数、Nは自然数)上の個々のスポットsp(1)〜sp(M)(ただし、Mは自然数)毎に固定化されたプローブp(1)〜p(M)に対応させて、そのスポットsp(I)(ただし、Iは1≦I≦Mの任意の整数)に固定されたプローブp(I)の識別(種類)を表すプローブコードを記憶する。
【0018】
発現強度エリア31bは、個々のスポットsp(1)〜sp(M)、すなわちプローブコードエリア31aに記憶されたプローブp(1)〜p(M)個々に対応させて、実験結果として得られた蛍光量等の発現強度の測定データを記憶する。
検索用スポットレコード32は、マイクロアレイA(1)〜A(N)を用いた実験結果についてその検索用にデータを蓄積しておくためのもので、アレイコードエリア32aと、プローブコードエリア32bと、標準化発現強度エリア32cとを備える。
【0019】
アレイコードエリア32aは、実験が行われたマイクロアレイA(1)〜A(N)それぞれについて、その識別を表すアレイコードを記憶する。
プローブコードエリア32bは、このアレイコードエリア32aに記憶された個々のマイクロアレイA(K)に対応させて、そのマイクロアレイA(K)上のスポットsp(1)〜sp(M)に固定されたプローブp(1)〜p(M)のプローブコードを記憶する。
【0020】
標準化発現強度エリア32cは、プローブコードエリア32aに記憶された各プローブp(I)に対応させて、実験結果としての標準化された発現強度(標準化発現強度)Ep(I)を記憶する。
ここで、この標準化発現強度エリア32cには、前述のスポットレコード31の発現強度エリア31bのように、実験結果である蛍光量等の発現強度の測定データがそのまま記憶されるのではなく、例えば所定の大きさの測定データを基準値とした場合に、実験結果の発現強度の測定データをこの基準値に対して標準化(正規化)したデータが、標準化発現強度Ep(I)として記憶される。
【0021】
そのため、この標準化発現強度エリア32cに記憶されている標準化発現強度Ep(I)の値の大小を参照すれば、ターゲットとして適用したサンプルsm(K)に対する結合反応量の高低が理解できるだけではなく、異なるプローブ同士又は異なるターゲット同士で、この標準化発現強度Ep(I)の値の大小を相対比較することによって、結合反応量の高低が対照判断できる。
【0022】
また、ヒストグラム用区間レコード33は、前記検索用スポットレコード32に記憶されているデータを用いて作成され、プローブ種類別又は各マイクロアレイ別といったヒストグラムのための各種データを記憶する。
そのために、ヒストグラム用区間レコード33は、プローブコードを記憶するプローブコードエリア33aと、このプローブコードエリア33aに対応させてそれぞれ設けられた、区間コードエリア33b、度数エリア33c、及びユニークスコアエリア33dとを備える。
【0023】
区間設定レコード34は、前述のヒストグラムを作成する等のために、そのデータ集計に利用される値の区間を定義するためのもので、その区間の識別を示す区間コードを記憶する区間コードエリア34aと、その区間を規定するための上限値及び下限値を記憶する上限エリア34b及び下限エリア34cと、その区間の代表値を記録する区間代表値エリア34dとを有する。
【0024】
以下、上記構成からなる本実施の形態の検索スケジューリング装置1の作用について説明する。
図3は、プローブp(1)〜p(M)が固定されたN個のマイクロアレイA(1)〜A(N)(ただし、Nは自然数)を用いて行った実験結果の一例を便宜的に示したものである。
なお、図3では、説明簡便のため、各マイクロアレイA(1)〜A(N)の各スポットsp(1)〜sp(M)に固定されたプローブp(1)〜p(M)のうち、プローブコードpa〜poからなるプローブPa〜Poについての実験結果だけを図示している。
【0025】
図3において、各マイクロアレイA(1)〜A(N)毎に記されている、プローブコードpa〜poの脇の括弧[ ]内の数値は、プローブp(1)〜p(M)に所定のサンプルsm(K)をアプライした実験の発現強度の測定結果から演算されたプローブp(1)〜p(M)の標準化発現強度Ep(1)(K)〜Ep(M)(K)の中の、各プローブPa〜Poの標準化発現強度Epa(K)〜Epo(K)を示す。
【0026】
ここで、このマイクロアレイA(1)〜A(N)を用いた実験の概略、及び実験終了時に検索スケジューリング装置1によって行われる検索用データセット作成処理について説明する。
各マイクロアレイA(1)〜A(N)には、それぞれ種類が異なる特定のDNAやタンパク質等といったプローブp(1)〜p(M)が、そのマイクロアレイ上のスポットsp(1)〜sp(M)(図示せず)に対応して、個別に配置・固定化されている。
【0027】
実験は、それぞれプローブp(1)〜p(M)が固定されている同一構成のN個のマイクロアレイA(1)〜A(N)に対し、N種類のサンプルsm(1)〜sm(N)(図示せず)の内の1個ずつをターゲットとしてアプライして行われる。
この際、N種類のサンプルsm(1)〜sm(N)は、それぞれ異なる特定のDNAやタンパク質等を含有する一方、この特定のDNAやタンパク質には予め蛍光物質等が結合され、ハイブリダイゼーションによってプローブp(1)〜p(M)と結合した場合、その結合反応量が数量的に測定可能な構成となっている。
【0028】
これにより、一のマイクロアレイA(K)に対し、一のサンプルsm(K)をターゲットとしてアプライしてハイブリダイズさせた後、マイクロアレイA(K)のスポットsp(1)〜sp(M)別の蛍光量等の発現強度を測定することによって、マイクロアレイA(K)のスポットsp(1)〜sp(M)にそれぞれ固定されているプローブp(1)〜p(M)と、アプライしたサンプルsm(K)との結合の様子(結合の有無、結合反応量等)を観測することができる。
そして、この実験結果は、入出力装置10のキーボード装置11や、直接データ伝送可能に接続されている実験測定装置(図示省略)から入力され、演算装置20に供給される。
【0029】
図4は、実験結果が供給されたときに演算装置20が行う、検索用データセット作成処理のフローチャートである。
演算装置20には、一のマイクロアレイA(K)に対し一のサンプルsm(K)をターゲットとしてアプライする実験が終了すると、アプライしたサンプルsm(K)の種類に対応するマイクロアレイA(K)のアレイコード、このマイクロアレイA(K)のスポットsp(1)〜sp(M)に固定されているプローブp(1)〜p(M)のプローブコード(プローブコードpa〜poを含む)、及びこのマイクロアレイA(K)のスポットsp(1)〜sp(M)毎の発現強度の測定値等の実験結果データが供給される。
【0030】
この検索用データセット作成処理では、演算装置20は、まず、供給されたp(1)〜p(M)のプローブコードと、スポットsp(1)〜sp(M)毎に測定された発現強度の測定値データとを互いに対応つけて、データセットファイル装置30のスポットレコード31に記憶する(ステップS11)。
これにより、スポットレコード31には、プローブコードエリア31a及び発現強度エリア31bが、マイクロアレイA(K)に固定されたプローブ数(スポット数)分‘M’だけ確保される。
【0031】
次に、演算装置20は、データセットファイル装置30の検索用スポットレコード32にも、供給されたマイクロアレイA(K)のアレイコードと、供給されたプローブp(1)〜p(M)のプローブコードとを、そのアレイコードに対応つけて記憶する(ステップS12)。
また、演算装置20は、前記スポットレコード31の発現強度エリア31bに記憶された発現強度の測定値データに基づき、プローブp(1)〜p(M)毎に標準化発現強度Ep(1)(K)〜Ep(M)(K)の演算を行い、この標準化発現強度Ep(1)(K)〜Ep(M)(K)を、マイクロアレイA(K)のアレイコード及びプローブp(1)〜p(M)のプローブコードと対応つけて、検索用スポットレコード32の標準化発現強度エリア32cに併せて記憶する(ステップS13)。
【0032】
すなわち、検索用スポットレコード32には、演算装置20にマイクロアレイA(K)についての実験結果が供給される毎に、アレイコードエリア32aが新たに1つ追加され、プローブコードエリア32b及び標準化発現強度エリア32cがこのマイクロアレイA(K)のプローブ数(スポット数)分‘M’だけ追加される。
【0033】
これにより、この検索用スポットレコード32には、今までに行われた実験で用いられた全てのマイクロアレイA(1)〜A(N)について、そのマイクロアレイA(K)のアレイコードと、そのマイクロアレイA(K)のスポットsp(1)〜sp(M)に固定化されたプローブp(1)〜p(M)のプローブコードと、そのプローブp(1)〜p(M)の標準化発現強度Ep(1)(K)〜Ep(M)(K)とが、相互に検索可能に記憶される。
したがって、図3に示される記号及び数値は、アレイコード、プローブコード、及び標準化発現強度といった、この検索用スポットレコード32に蓄積されているデータ内容に該当する。
【0034】
本実施の形態の検索スケジューリング装置1では、この検索用データセットの作成処理と併せて、検索処理の際に用いられるヒストグラム用区間レコード33の作成・更新処理を、実験結果データが入力供給される度毎に行う構成となっており(ステップS14)、後述の検索実行処理における検索時間の短縮を図っている。
【0035】
図5は、このヒストグラム用区間レコード33の作成・更新処理の一例を示すフローチャートである。
ヒストグラム用区間レコード33の作成・更新処理は、本実施の形態の検索スケジューリング装置1では、次のように行われる。
【0036】
演算装置20は、初期設定後(ステップS14-1)、データセットファイル装置30の区間設定レコード34に予め設定されている、区間コードエリア34a毎の標準化発現強度の下限エリア34b及び上限エリア34cの設定データを参照し、ステップS12で演算された、マイクロアレイA(K)に固定されたプローブp(I)の標準化発現強度Ep(I)(K)が、いずれの区間コードSC(L)(なお、本実施の形態の場合は、Lは整数で、0<L≦10)に対応するかを判別する(ステップS14-2)。
図6は、この区間設定レコード34の一具体的例を簡略的に示した図である。
【0037】
図3に示したマイクロアレイA(1)を例に説明すれば、標準化発現強度Epa(1)が‘0.31’のプローブPaについては、その区間コードは‘SC3’と判別され、同様にして標準化発現強度Epb(1)が‘0.53’のプローブPbの区間コードは‘SC5’、標準化発現強度Epc(1)が‘0.07’のプローブPcの区間コードは‘SC1’と判別される。
【0038】
なお、区間設定レコード34は、図6に示したものにあっては、隣り合う区間の上限と下限とが重なり合わないように上限データと下限データとが設定されている構成となっているが、隣り合う区間同士が一部重複するように上限データと下限データとを設定したり、区間の幅を均等又は変則としたり、またプローブp(I)の種別毎にそれぞれ異なる区間設定レコード34とすることも可能である。
【0039】
そして、演算装置20は、マイクロアレイA(K)の一のプローブp(I)についての区間コードSC(L)を判別すると、データセットファイル装置30のヒストグラム用区間レコード33のプローブコードエリア33aを検索し(ステップS14-3)、プローブp(I)と同じプローブコードが既に記憶されているヒストグラム用区間レコードHp(I)にあるか否かを判別する(ステップS14-4)。
【0040】
演算装置20は、同じプローブコードのヒストグラム用区間レコードHp(I)が既にある場合には、判別した区間コードSC(L)と同じデータが記憶されている区間コードエリア33bに対応する度数エリア33cの数値データを1だけインクリメントする(ステップS14-5)。
これにより、データセットファイル装置30のスポットレコード31及び検索用スポットレコード32に新たなマイクロアレイA(K)の実験データがファイリングされる都度、既にマイクロアレイA(1)〜A(K−1)のデータ集合をもとに作成された、各プローブp(1)〜p(M)毎の標準化発現強度のヒストグラムHG(1)〜HG(M)の更新が行われる。
【0041】
これに対し、演算装置20は、同じプローブコードが記憶されているヒストグラム用区間レコードHp(I)がデータセットファイル装置30にない場合(すなわち、プローブp(I)が新規なプローブの場合)には、プローブp(I)のプローブコードについてのヒストグラム用区間レコード33を新たに設定し、判別した区間コードSC(L)と同じ区間コードエリア33bに対応する度数エリア33cに‘1’を設定するとともに、異なる区間コードエリア33bに対応する度数エリア33cには‘0’を設定する(ステップS14-6)。
これにより、データセットファイル装置30には、新規なプローブp(I)に対して、ヒストグラム用区間レコードHp(I)の新規作成が行われる。
【0042】
さらに、本実施の形態の検索スケジューリング装置1では、演算装置20は、ステップS14-5,S14-6で、一のプローブp(I)のプローブコードについてのヒストグラム用区間レコード33の更新・作成を終了すると、このプローブp(I)について、その各区間コードSC1〜SC10に対応する標準化発現強度Ep(I)(sc1)〜Ep(I)(sc10)(図6参照)それぞれが、どれだけ特徴的であるかを数量的に示すユニークスコアUp(I)(L)の演算処理を行う(ステップS14-7)。
【0043】
ここで、演算装置20が行うユニークスコアUp(I)(L)の演算処理を説明するにあたって、まず、このユニークスコアUp(I)(L)について説明する。
図7は、上述したステップS14-2〜S14-6で表したヒストグラムの作成・更新処理の結果、プローブPbのヒストグラム用区間レコードHpbに基づき作成された、プローブPbのヒストグラムHGpbの一例を示したものである。
【0044】
図8は、同じくプローブPeのヒストグラム用区間レコードHpeに基づき作成される、プローブPeのヒストグラムHGpeの一例を示したものである。
図7に示したプローブPbのヒストグラムHGpbにおいて、その区間コードSC7に対応する標準化発現強度Epbsc(7)の値‘0.70’についての頻度‘2’は、他の標準化発現強度Epbsc(1)〜Epbsc(6)及びEpbsc(8)〜Epbsc(10)に対応する頻度Fと比較して、相対的にその値が低くなっている。
【0045】
これは、プローブPbが、標準化発現強度Epbsc(7)の値‘0.70’では、特定の2種類のサンプルsm(X1),sm(X2)とだけしか結合反応を起こさず、当該2種類のサンプルsm(X1),sm(X2)の特定に当たっては,プローブPbが非常に効果的であることを示す。
すなわち、プローブPbの標準化発現強度Epbsc(7)の値‘0.7’は、プローブp(b)の標準化発現強度Epbsc(7)〜Epbsc(10)の値の集合の中でも、非常に特徴的な値であり、実験時にその発現現象を識別又は測定し易く、重要性が高い。
【0046】
また、図8に示したプローブPeのヒストグラムHGpeにおいて、その標準化発現強度Epesc(1)の値‘0.1’に対応する頻度‘27’は、他の標準化発現強度Epesc(2)〜Epesc(10)に対応する頻度と比較して、相対的にその値が大きくなっている。
これは、対象プローブPeが、標準化発現強度Epesc(1)の値‘0.1’では、特定の27種類のサンプルsm(X1),sm(X2),・・・,sm(X27)それぞれと結合反応を起こすことを示し、当該27種類のサンプルsm(X1)〜(X27)のうちのあるサンプルsm(XX)だけの特定に当たっては,プローブPeが余り効果的ではないことを示す。
【0047】
さらに、この‘0.1’という標準化発現強度Epesc(1)の値は、実験時にその発現現象を識別又は測定しにくいという意味でも、重要性が低い。
すなわち、プローブPeの標準化発現強度Epesc(1)の値‘0.1’は、プローブPeの標準化発現強度Epesc(1)〜Epesc(10)の値の集合の中では、特徴的ではなく余り重要でない。
【0048】
そこで、本実施の形態の検索スケジューリング装置1では、プローブp(I)が所定の区間コードSC(L)に対応した標準化発現強度Ep(I)sc(L)で、いかに特定のサンプルsm(K)とだけしか結合反応を起こさず、それ以外のサンプルsm(exK)とは結合反応を起こさないかの度合いを数量的に示すユニークスコアUp(I)(L)を定め、その演算処理をステップS14-7で行う。
【0049】
ユニークスコアUp(I)(L)の演算処理は、本実施の形態では、演算装置20は、プローブp(I)の標準化発現強度Ep(I)sc(L)に対して、予め定めた所定の閾値範囲SAを持って、この閾値範囲SA内の標準化発現強度のプローブの頻度F、すなわち該当マイクロアレイの合計数を求めた上で、ユニークスコアUp(I)(L)を演算する。本実施の形態では、この所定の閾値範囲SAを、例えば次のように予め定めている。
閾値範囲:Ep(I)sc(L)−0.2 < SA < Ep(I)sc(L)+0.2 ・・・ (式1)
【0050】
そして、この所定の閾値範囲SAのサンプルsm(K)の数を“MS”,全サンプルsm(1)〜(N)の数、すなわち実験結果を得たマイクロアレイA(K)の総数を“N”とすると、ユニークスコアUp(I)(L)は、本実施の形態では、次のように定義される。
ユニークスコア:Up(I)(L)=log(N/MS) ・・・(式2)
したがって、このユニークスコアUp(I)(L)は、該当するプローブp(I)の所定の区間コードSC(L)に対応した標準化発現強度Ep(I)sc(L)に特徴がなければ、所定の閾値範囲SA内のサンプルsm(K)の数“MS”は大きくなって、全サンプル数“N”に近づくこととなり、“0”に近づく。
【0051】
これに対し、該当するプローブp(I)の所定の区間コードSC(L)に対応した標準化発現強度Ep(I)sc(L)が特徴的になるほど、所定の閾値範囲SA内のサンプルsm(K)の数“MS”は小さくなり、ユニークスコアUp(I)(L)は大きな値となる。
例えば、図7に示したプローブPbのヒストグラムHGpbにおける、所定の区間コードSC(L)に対応した標準化発現強度Epbsc(L)“0.1”,“0.2”,“0.3”,・・・,“1”について、そのうちの“0.5”及び“0.7”を例に、演算装置30が行うユニークスコアUpb(L)の演算処理を説明すると、次のようになる。
【0052】
<Epbsc(5):0.5>
閾値範囲: 0.3 <Epbsc(5) < 0.7
閾値範囲内のプローブp(b)の該当区間コード(標準化発現強度)及び頻度:
SC4(Epbsc(4)=0.4),F=27
SC5(Epbsc(5)=0.5),F=10
SC6(Epbsc(6)=0.6),F= 4
ユニークスコア:Upb(5)=log(100/41) ・・・(式3)
N=100,MS=27+10+4=41
<Epbsc(7):0.7>
閾値範囲: 0.5 <Epbsc(7) < 0.9
閾値範囲内のプローブp(b)の該当区間コード(標準化発現強度)及び頻度:
SC6(Epbsc(6)=0.6),F= 4
SC7(Epbsc(7)=0.7),F= 2
SC8(Epbsc(8)=0.8),F= 2
ユニークスコア:Upb(7)=log(100/8) ・・・(式4)
N=100,MS=4+2+2=8
【0053】
同様に、図8に示したプローブPeのヒストグラムHGpeにおける、所定の区間コードSC(L)に対応した標準化発現強度Epesc(L)“0.1”,“0.2”,“0.3”,・・・,“1”について、そのうちの“0.1”及び“0.2”を例に、演算装置30が行うユニークスコアUpe(L)の演算処理を説明すると、次のようになる。
<Epesc(1):0.1>
閾値範囲: 0 <Epesc(1) < 0.3
閾値範囲内のプローブPeの該当区間コード(標準化発現強度)及び頻度:
SC1(Epesc(1)=0.1),F=27
SC2(Epbsc(2)=0.2),F=36
ユニークスコア:Upe(1)=log(100/63) ・・・(式5)
N=100,MS=27+36=63
<Epesc(2):0.2>
閾値範囲: 0 <Epbsc(2) < 0.4
閾値範囲内のプローブPeの該当区間コード(標準化発現強度)及び頻度:
SC1(Epesc(1)=0.1),F=27
SC2(Epbsc(2)=0.2),F=36
SC3(Epbsc(3)=0.3),F=14
ユニークスコア:Upe(2)=log(100/77) ・・・(式6)
N=100,MS=27+36+14=77
【0054】
そして、ステップS14-7では、上記のように、演算装置20は、プローブp(I)の所定の区間コードSC(L)にそれぞれ対応したユニークスコアUp(I)(L)を演算し、その演算結果をプローブp(I)のヒストグラム用区間レコード33の、区間コードSC(L)に対応して設けられているユニークスコアエリア33dに更新記憶していく。
【0055】
このように、演算装置20は、マイクロアレイA(K)に固定されたプローブp(I)について、上述したヒストグラムHGp(1)〜HGp(M)の更新・作成処理(ステップS14-2〜S14-6)、ユニークスコアエリア33dのユニークスコアUp(I)(L)の演算・更新処理(ステップS14-7)を行うと、マイクロアレイA(K)にまだヒストグラムHGp(I)の更新・作成処理、及びユニークスコアエリア33dのユニークスコアUp(I)(L)の演算・更新処理が行われていないスポットsp(I)がスポットレコード31に残っているか否かを確認し(ステップS14-8)、残っている場合には、スポットsp(I)すなわちプローブp(I)を更新して、ステップS14-2〜S14-8の処理を行う。
【0056】
なお、スポットレコード31に記憶されたプローブp(I)のプローブコードと、スポットsp(1)〜sp(M)毎に測定された発現強度の測定値とは、本実施の形態では、このプローブp(I)についてのヒストグラム用区間レコード33の作成・更新後、新たな実験結果データが供給される際にリセットされるようになっている。
また、スポットsp(1)〜sp(M)毎に測定された発現強度の測定値は、検索用スポットレコード32に、マイクロアレイA(K)のヒストグラム用区間レコード作成・更新処理後も記憶しておくように構成してもよく、この場合はスポットレコード31は、検索用スポットレコード32で兼用し、省略することもできる。
【0057】
次に、検索スケジューリング装置1が行う検索実行処理について説明する。
図9は、その際、検索スケジューリング装置1の演算装置20が行う検索実行処理を示したフローチャートである。
ここでは、検索条件として、プローブPbと標準化発現強度‘0.72’の結合反応を起こし、かつプローブPeと標準化発現強度‘0.01’の結合反応を起こすサンプルsm(X)(ただし、1≦X≦N)を検索する場合を例に、以下、説明する。
【0058】
なお、説明にあたって検索条件となったプローブPb及びプローブPeを、検索対象のデータセットファイル装置30のヒストグラム用区間レコード33に記憶されているプローブPb及びプローブPeと区別するため、以下、前者を目的プローブPbm及び目的プローブPemと称し、後者を対象プローブPbt及び対象プローブPetとして称して両者を区別して説明する。
【0059】
まず、上記目的プローブPbm[0.72],Pem[0.01]が、入出力装置10の例えばキ−ボード装置11によって設定されると、これを受けた検索スケジューリング装置1の演算装置20は、マイクロアレイA(K)を初期設定し(ステップS21)、データセットファイル装置30の検索用スポットレコード32にそれぞれ記憶されているマイクロアレイA(1)〜A(N)の検索用スポットレコードの中から、初期設定又は更新設定された所定のマイクロアレイA(K)の検索用スポットレコードを検索し、そこから、そのアレイコード、目的プローブPbm及びPemに対応する対象プローブPbt及びPetの標準化発現強度Epbt,Epetを読出す(ステップS22)。
【0060】
ところで、この読出した目的プローブPbm及びPemに対応する対象プローブPbt及びPetの標準化発現強度Epbt,Epetの値は、目的プローブPbm及びPemの標準化発現強度Epbm,Epemの値と差を有するのが通常である。
例えば、図3に示したマイクロアレイA(3)及びA(7)について、検索条件としての目的プローブPbmの標準化発現強度Epbtの値‘0.72’に注目してみると、マイクロアレイA(3)の対象プローブPbtの標準化発現強度Epbtの値‘0.52’は、目的プローブPbmとの間に‘0.20’の差がある。これに対して、マイクロアレイA(7)の対象プローブPbtの標準化発現強度Epbtの値‘0.70’は、目的プローブPbmとの間に‘0.02’しか差がない。
【0061】
したがって、目的プローブPbmだけに着目してみれば、マイクロアレイA(7)すなわちサンプルsm(7)の方が、マイクロアレイA(3)すなわちサンプルsm(3)よりも、検索対象のサンプルsm(X)に対する標準化発現強度についての類似性が高いことになる。
ところが、同じく検索条件としての目的プローブPemの標準化発現強度Epbtの値‘0.01’に注目してみると、マイクロアレイA(7)の対象プローブPetの標準化発現強度Epetの値‘0.21’は、目的プローブPemとの間に‘0.20’の差があるのに対し、マイクロアレイA(3)の対象プローブPetの標準化発現強度Epetの値‘0.02’は、目的プローブPbmとの間に‘0.01’の差しかなく、検索対象のサンプルsm(X)の標準化発現強度についての類似性が逆になってしまう。
【0062】
そこで、演算装置20は、まず目的プローブPbm及びPemの標準化発現強度Epbm,Epemと、この目的プローブPbm及びPemに対応するマイクロアレイA(K)の対象プローブPbt及びPetの標準化発現強度Epbt,Epetとの発現強度誤差スコアSp(I)A(K)を演算する(ステップS23)。
【0063】
この発現強度誤差スコアSp(I)A(K)は、各目的プローブp(I)mの標準化発現強度Ep(I)mと、マイクロアレイA(K)の対象プローブp(I)tの標準化された発現強度Ep(I)tとの差(距離)を数量的に表すもので,次のようにして求められる。
Sp(I)A(K) = 1− absolute(Ep(I)m−Ep(I)A(K)t) ・・・(式7)
Ep(I)m:目的プローブp(I)mの標準化発現強度
Ep(I)A(K)t:目的プローブp(I)mの標準化発現強度Ep(I)に対応したアレイA(K)の対象プローブp(I)tの標準化発現強度
【0064】
そして、マイクロアレイA(3)及びマイクロアレイA(7)を例に、目的プローブPbm及びPemそれぞれの発現強度誤差スコアSp(I)A(K) を計算すると、次のようになる。
SpbA(3)=1− absolute(0.72−0.52)=0.8 ・・・(式8)
SpbA(7)=1− absolute(0.72−0.70)=0.9 ・・・(式9)
SpeA(3)=1− absolute(0.01−0.02)=0.99 ・・・(式10)
SpeA(7)=1− absolute(0.01−0.21)=0.8 ・・・(式11)
【0065】
したがって、発現強度誤差スコアSp(I)A(K) は、目的プローブp(I)mの標準化発現強度Ep(I)mに対して、目的プローブp(I)mに対応したマイクロアレイA(K)における対象プローブp(I)tの標準化発現強度Ep(I)tの差が小さくなれば小さくなるほど、‘1’に近づくようになっている。
すなわち、発現強度誤差スコアSp(I)A(K) の値が‘1’に近いほど、そのアレイA(K)における対象プローブp(I)tの目的プローブp(I)mに対する類似可能性が高くなり、同一可能性が増す。
しかし、上述したように、この発現強度誤差スコアSp(I)A(K) だけの目的プローブp(I)mに対する類似可能性だけでは、一のマイクロアレイA(K1)と別のマイクロアレイA(K2)との間でその類似性が逆になることがある。
【0066】
そこで、次に、演算装置20は、対象プローブp(I)tそれぞれについて、前述したユニークスコアUp(I)(L)を求める。
このユニークスコアUp(I)(L)を求めるに当たって,本実施の形態では、演算装置20は、目的プローブp(I)mに対応する対象プローブp(I)tそれぞれについて、その標準化された発現強度Ep(I)tに基づき、データセットファイル装置30の区間設定レコード34を参照して、対象プローブp(I)tそれぞれの標準化された発現強度Ep(I)tに対応する区間コードを検索する(ステップS24)。
【0067】
そして、演算装置20は、その対象プローブp(I)tそれぞれについて、検索用スポットレコード32から得た対象プローブp(I)tのプローブコードを基に、対象プローブp(I)tそれぞれのヒストグラム用区間レコード33のユニークスコアエリア33dを検索する。
【0068】
その際、演算装置20は、先に区間設定レコード34から獲得した区間コードを基に,当該検索したヒストグラム用区間レコード33の該当区間コードが記憶されている区間コードエリア33bに対応したユニークスコア33dの記憶内容、すなわち対象プローブp(I)tの発現強度Ep(I)tについて予め演算されたユニークスコアUp(I)(L)(ステップS14-7参照)を読み出す。
このようにして、本実施の形態の場合は、演算装置20は、検索実行時には数値計算を行うことなく、当該マイクロアレイA(K)における対象プローブp(I)tそれぞれのユニークスコアUp(I)(L)を演算する(ステップS25)。
【0069】
この後、演算装置20は、当該マイクロアレイA(K)の対象プローブp(I)t毎に獲得した発現強度誤差スコアSp(I)A(K)と、及びユニークスコアUp(I)(L)とに基づいて,対象プローブp(I)tそれぞれの対応する目的プローブp(I)mに対する類似性及び特徴性を総合する。
【0070】
この一の目的プローブp(I)mに対応する一の対象プローブp(I)tの類似・同一性及び特徴性を総合するに当たって、本実施の形態では、次式のような差異スコアDSp(I)A(K)を定め、これを演算する(ステップS26)。
Figure 0003825281
Sp(I)A(K) :対象プローブp(I)tの発現強度誤差スコア
Up(I)(L):対象プローブp(I)tのユニークスコア
C1:定数(本実施の形態においては、C1=1)
【0071】
この差異スコアDSp(I)A(K)について、マイクロアレイA(3)及びマイクロアレイA(7)を例に、目的プローブPbm及びPemそれぞれの差異スコアDSpbA(3),DSpeA(3),DSpbA(7),DSpeA(7)を演算すると、次のようになる。
Figure 0003825281
【0072】
したがって、この差異スコアDSp(I)A(K)によれば、発現強度誤差スコアSp(I)A(K)が表す、発現強度(標準化発現強度)の面からの対象プローブp(I)tと目的プローブp(I)mとの類似性に、ユニークスコアUp(I)(L)が表す対象プローブp(I)tの発現強度の特徴性が加味されることになり、より対象プローブp(I)tが検索対象のサンプルsm(X)について絞りこまれることになる。
【0073】
その上で,演算装置20は、当該マイクロアレイA(K)に適用したサンプルsm(K)について、検索条件が目的プローブp(I)mで設定された検索対象のサンプルsm(X)に対する類似性を調べるために、次に説明するような差異スコア合計TDSp(I)A(K)を演算する(ステップS27)。
差異スコア合計:TDSp(I)A(K) = Σ [DSp(I)A(K)] ・・・(式17)
【0074】
ここで、例えば、上記マイクロアレイA(3)及びマイクロアレイA(7)について、差異スコア合計TDSp(I)A(3)及びTDSp(I)A(7)を演算すると次のようになる。
Figure 0003825281
この差異スコア合計TDSp(I)A(K) は、検索条件としての目的プローブp(I)mが複数ある場合に用いられ、検索対象のサンプルsm(X)に対するマイクロアレイA(K)にターゲットとして適用したサンプルsm(K)の類似性が高くなるほど、その値が大きくなるようになっている。
【0075】
そこで、演算装置20は、当該マイクロアレイA(K)について差異スコア合計TDSp(I)A(K)演算すると、その値が予め差異限界値として設定された差異スコア合計限界値SLを超えているかどうかを判別する(ステップS28)。なお、この差異スコア合計限界値SLは、検索に際して、目的プローブp(I)mの数や、従前の検索結果等を考慮し、予め適宜設定されるものである。
【0076】
そして、演算装置20は、この差異スコア合計限界値SLを超えていれば、当該マイクロアレイA(K)にターゲットとしてアプライさせたサンプルsm(K)は、検索対象のサンプルsm(X)である類似性又は同一性が高いとして、マイクロアレイA(K)すなわちサンプルsm(K)についてのデータを、入出力装置10へ回答出力する一方(ステップS29)、マイクロアレイA(K)が入出力装置10によって予め検索対象範囲として設定された検索範囲の最後のマイクロアレイA(K)であるか否かを判別する(ステップS30)。
【0077】
演算装置20は、マイクロアレイA(K)が検索対象範囲の最後のマイクロアレイA(K)ではなく、未確認の残りのマイクロアレイA(K)がある場合は、検索対象のマイクロアレイA(K)を更新設定し(ステップS31)、前記ステップS22〜S30の処理を、この未確認の残りのマイクロアレイA(K)が無くなるまで繰り返す。
【0078】
したがって、本実施の形態の検索スケジューリング装置1によれば、入出力装置10によって、検索したい所望のサンプルsm(X)について、検索条件としてのこのサンプルsm(X)と結合反応を起こすプローブP(I)の発現強度Ep(I)、すなわち目的プローブP(I)tの発現強度Ep(I)tを設定入力すれば、演算装置20はデータセットファイル装置に蓄積された実験結果のレコードに基づき,検索条件を満たすマイクロアレイA(K)を探し出し、検索結果を入出力装置10に表示する。
【0079】
図10は、検索条件を設定入力するときの入出力装置10のディスプレイ装置12による表示例を示す。
本表示例では、検索条件は順位付けされ、設定された差異スコア合計限界値SL、及び目的プローブp(I)mの標準化発現強度Ep(I)mが表示されている。
【0080】
図11は、検索結果についての入出力装置10のディスプレイ装置12による表示例を示す。
なお、上記実施の形態においては、差異限界値SLは、ステップS28で説明したように、差異スコア合計TDSp(I)A(K)に対してのみ設定するように構成したが、これに限らず目的プローブp(I)m毎に差異限界値SLp(I)mを設定し、対象プローブp(I)tそれぞれの差異スコアSp(I)A(K)をこの差異限界値SLp(I)mと比較判断して,その結果を検索結果とするように構成してもよい。そして、この場合は、ステップS27で示した差異スコア合計TDSp(I)A(K)の演算処理を省略することも、また、対象プローブp(I)tそれぞれの差異スコアSp(I)A(K)をこの差異限界値SLp(I)mと比較判断した上で、さらに差異スコア合計TDSp(I)A(K)をその差異限界値SLと比較するようにしてもよい。
【0081】
さらに、上記実施の形態に係る検索スケジューリング装置1では、標準化発現強度Ep(I)の計算、ヒストグラムHGp(I)の作成、ユニークスコアUp(I)(L)の計算を検索時に先立って事前に行っておく構成となっているので、検索時にこれらを毎回計算するよりも高速に検索が行えるようになっているが、検索速度を余り考慮しなくて済む場合は、検索スケジューリング装置1は、これらを検索時に毎回計算する構成であってもよい。
【0082】
ところで、上述した実施の形態の検索スケジューリング装置1では、そのユニークスコアUp(I)(L)は、一のプローブp(I)に対して複数のマイクロアレイA(1)〜A(N)(すなわちサンプルsm(1)〜sm(N))を結合反応させた場合、その発現強度の大きさに関係して、それぞれのマイクロアレイA(K)(すなわち、サンプルsm(K))が、その余のマイクロアレイA(notK)(すなわち、その余のサンプルsm(notK))に比較して、このプローブp(I)に対してどれだけユニークであるかを表している。
【0083】
そして、検索スケジューリング装置1は、プローブ種毎に標準化発現強度Ep(I)を指定してマイクロアレイA(1)〜A(N)のヒストグラム(図7,図8参照)を作成し、対象となる複数のマイクロアレイA(1)〜A(N)のアレイ群の中から、目的の発現パターンを持つアレイA(X)を検索している。
しかしながら、本発明のユニークスコアUは、このようなユニークスコアUp(I)(L)だけに限定されるものではなく、また検索スケジューリング装置1もこのユニークスコアUp(I)(L)だけに限定される構成のものではない。
【0084】
例えば、一のターゲットとしてのサンプルsm(K)に対して、マイクロアレイA(K)に固定化された複数のプローブp(1)〜p(M)を結合反応させた場合、その発現強度の大きさに関係して、それぞれのプローブp(I)が、その余のプローブp(notI)に比較して、このサンプルsm(K)に対してどれだけユニークであるかを表すユニークスコアUa(K)(L)も考えることができる。
【0085】
この場合、検索スケジューリング装置1は、サンプル種毎に標準化発現強度Esm(K)を指定してプローブp(1)〜p(M)のヒストグラム(図7,図8参照)を作成し、対象となる複数のプローブp(1)〜p(M)のプローブ群の中から、目的の発現パターンを持つプローブp(X)を検索する。
【0086】
図12は、例えばマイクロアレイA(2)のヒストグラム用区間レコードHa(2)に基づき作成された、マイクロアレイA(2)のヒストグラムHGa(2)の一例を示す。
図13は、例えばマイクロアレイA(9)のヒストグラム用区間レコードHa(9)に基づき作成された、マイクロアレイA(9)のヒストグラムHGa(9)の一例を示す
【0087】
図12及び図13のヒストグラムHGa(2),HGa(9)を例に、このプローブp(X)の検索について、例えば、マイクロアレイA(2)のサンプルsm(2)に対して‘0.72’という発現強度を有し、かつマイクロアレイA(9)のサンプルsm(9)に対して‘0.01’という発現強度を有するプローブp(X)を検索する場合を考え、具体的に説明する。
【0088】
この場合、ユニークスコアUa(K)(L)は、一のマイクロアレイA(K)すなわちサンプルsm(K)における、予め設定された閾値範囲SA内の対象プローブ数を‘MP’とし、一のマイクロアレイA(K)すなわちサンプルsm(K)がアプライされたプローブの総数を‘M’とすると、
ユニークスコア:Ua(K)(L)=log(M/MP) ・・・(式20)
となる。
【0089】
また、この発現強度誤差スコアSa(K)p(I)は、
Ssm(K)p(I) = C1− absolute(Ea(K)−Ea(K)p(I)t) ・・・(式21)
Ea(K)m:目的サンプルa(K)mの標準化発現強度
Esm(K)p(I)t:目的サンプルa(K)mの標準化発現強度Ea(K)mに対応した対象サンプルa(K)mの標準化発現強度
C1:定数(例えば、C1=1)
となる。
差異スコア:DSa(K)p(I)
= Sa(K)p(I) * Ua(K)(L)
=[C1− absolute(Ea(K)m−Ea(K)p(I)t)] * log(M/MP) ・・・(式22)
Sa(K)p(I) :対象サンプルa(K)tの発現強度誤差スコア
Ua(K)(L):対象サンプルa(K)tのユニークスコア
C1:定数(本実施の形態においては、C1=1)
となる。
【0090】
図14は、このプローブp(X)の検索結果についての入出力装置10のディスプレイ装置12による表示例を示す。
この場合、差異限界値がマイクロアレイA(2),A(9)毎の差異スコアDSa(K)p(I)に対して設けられ、差異限界値を超えたプローブp(X)のマイクロアレイA(2)の差異スコアDSa(2)p(X)、及びマイクロアレイA(9)の差異スコアDSa(9)p(X)は、反転表示等によって、差異限界値を超えない差異スコアDSa(2)p(notX),DSa(2)p(notX)と区別されて識別表示されるようになっている。
【0091】
この結果により、マイクロアレイA(2), マイクロアレイA(9)の両方で差異スコアDSa(K)p(I)が1を超えているのは、プローブPm,Po、Ppであることからこれを検索結果とする。また、前述の実施の形態のような差異スコアDSa(K)p(I)の合計TDSa(K)p(I)を計算して結果として用いることもできる。
本実施の形態においては、時系列である種の変化パターンを示すプローブp(X)を検索すること等に利用できる。
【0092】
【発明の効果】
以上のように、本発明によれば、マイクロアレイを用いた実験の実験結果データの中から、非特異的な反応のスポット群や反応の誤差が整理・検索に与える影響を抑制して、目的の特徴を持つデータ(マイクロアレイ、ターゲットとしてのサンプル、プローブ等の個有データ)を整理・検索可能になる。
【図面の簡単な説明】
【図1】本発明の一実施の形態の検索スケジューリング装置1の構成を示すブロック図である。
【図2】データセットファイル装置30に備えられた各種データレコードの構成図である。
【図3】プローブp(1)〜p(M)が固定されたN個のマイクロアレイA(1)〜A(N)(ただし、Nは自然数)を用いて行った実験結果の一例を便宜的に示したものである。
【図4】実験結果が供給されたときに演算装置20が行う、検索用データセット作成処理のフローチャートである。
【図5】ヒストグラム用区間レコード33の作成・更新処理の一例を示すフローチャートである。
【図6】この区間設定レコード34の一具体的例を簡略的に示した図である。
【図7】ステップS14-2〜S14-6で表したヒストグラムの作成・更新処理の結果、プローブPbのヒストグラム用区間レコードHpbに基づき作成された、プローブPbのヒストグラムHGpbの一例を示したものである。
【図8】プローブPeのヒストグラム用区間レコードHpeに基づき作成される、プローブPeのヒストグラムHGpeの一例を示したものである。
【図9】検索スケジューリング装置1の演算装置20が行う検索実行処理を示したフローチャートである。
【図10】検索条件を設定入力するときの入出力装置10のディスプレイ装置12による表示例を示す。
【図11】検索結果についての入出力装置10のディスプレイ装置12による表示例を示す。
【図12】マイクロアレイA(2)のヒストグラム用区間レコードHa(2)に基づき作成された、マイクロアレイA(2)のヒストグラムHGa(2)の一例を示す。
【図13】例えばマイクロアレイA(9)のヒストグラム用区間レコードHa(9)に基づき作成された、マイクロアレイA(9)のヒストグラムHGa(9)の一例を示す。
【図14】プローブp(X)の検索結果についての入出力装置10のディスプレイ装置12による表示例を示す。
【符号の説明】
1 検索スケジューリング装置
10 入出力装置
20 演算装置
30 データセットファイル装置
31 スポットレコード
32 検索用スポットレコード
33 ヒストグラム用区間レコード
34 区間設定用レコード

Claims (6)

  1. プローブが固定化されたスポットを備えるマイクロアレイにターゲットとしてのサンプルをアプライした場合の当該マイクロアレイのスポット毎の測定結果の発現強度が記憶される検索用レコード、及び該検索用レコードに記憶されている各マイクロアレイのスポット毎の発現強度の値に基づいて、当該各マイクロアレイのスポットに固定化されたプローブ種毎の発現強度の値に応じたマイクロアレイ数が記憶されるヒストグラム用レコードを有するデータセットファイルと、
    又は複数のプローブについての発現強度のが検索条件として入力されたとき、当該検索条件の一又は複数のプローブ種についての発現強度の値と前記検索用レコードに記憶されている当該検索条件と同じ一又は複数のプローブ種のサンプル毎の発現強度の値との差、並びに当該検索条件の一又は複数のプローブ種について前記ヒストグラム用レコードを基に作成されたヒストグラム上における当該検索条件の発現強度の値に対応したマイクロアレイ数に基づいて、サンプル毎若しくはサンプルをアプライしたマイクロアレイ毎に当該検索条件の一又は複数のプローブ種と結合する度合いを算出し、当該算出した度合いに基づいて当該検索条件の一又は複数のプローブ種と特徴的に結合するサンプル若しくは当該サンプルをアプライしたマイクロアレイを特定する検索手段と
    を備えることを特徴とする検索スケジューリング装置。
  2. プローブが固定化されたスポットを備えるマイクロアレイにターゲットとしてのサンプルをアプライした場合の当該マイクロアレイのスポット毎の測定結果の発現強度が記憶される検索用レコード、及び該検索用レコードに記憶されている各マイクロアレイのスポット毎の発現強度の値に基づいて、当該各マイクロアレイにアプライしたサンプル種毎の発現強度の値に応じたプローブ種数若しくはスポット数が記憶されるヒストグラム用レコードを有するデータセットファイルと、
    一又は複数のサンプル種についての発現強度の値が検索条件として入力されたとき、当該検索条件の一又は複数のサンプル種についての発現強度の値と前記検索用レコードに記憶されている当該検索条件と同じ一又は複数のサンプル種をアプライしたマイクロアレイのスポット毎の発現強度の値との差、並びに当該検索条件の一又は複数のサンプル種をアプライしたマイクロアレイについて前記ヒストグラム用レコードを基に作成されたヒストグラム上における当該検索条件の発現強度の値に対応したプローブ種の数に基づいて、プローブ種毎に当該検索条件の一又は複数のサンプル種と結合する度合いを算出し、当該算出した度合いに基づいて当該検索条件の一又は複数のサンプル種と特徴的に結合するプローブ種を特定する検索手段と
    を備えることを特徴とする検索スケジューリング装置。
  3. コンピュータを、
    プローブが固定化されたスポットを備えるマイクロアレイにターゲットとしてのサンプルをアプライした場合の当該マイクロアレイのスポット毎の測定結果の発現強度が記憶される検索用レコード、及び該検索用レコードに記憶されている各マイクロアレイのスポット毎の発現強度の値に基づいて、当該各マイクロアレイのスポットに固定化されたプローブ種毎の発現強度の値に応じたマイクロアレイ数が記憶されるヒストグラム用レコードを有するデータセットファイルと、
    又は複数のプローブについての発現強度のが検索条件として入力されたとき、当該検索条件の一又は複数のプローブ種についての発現強度の値と前記検索用レコードに記憶されている当該検索条件と同じ一又は複数のプローブ種のサンプル毎の発現強度の値との差、並びに当該検索条件の一又は複数のプローブ種について前記ヒストグラム用レコードを基に作成されたヒストグラム上における当該検索条件の発現強度の値に対応したマイクロアレイ数に基づいて、サンプル毎若しくはサンプルをアプライしたマイクロアレイ毎に当該検索条件の一又は複数のプローブ種と結合する度合いを算出し、当該算出した度合 いに基づいて当該検索条件の一又は複数のプローブ種と特徴的に結合するサンプル若しくは当該サンプルをアプライしたマイクロアレイを特定する検索手段と
    を備える検索スケジューリング装置として機能させるためのプログラム。
  4. コンピュータを、
    プローブが固定化されたスポットを備えるマイクロアレイにターゲットとしてのサンプルをアプライした場合の当該マイクロアレイのスポット毎の測定結果の発現強度が記憶される検索用レコード、及び該検索用レコードに記憶されている各マイクロアレイのスポット毎の発現強度の値に基づいて、当該各マイクロアレイにアプライしたサンプル種毎の発現強度の値に応じたプローブ種数若しくはスポット数が記憶されるヒストグラム用レコードを有するデータセットファイルと、
    一又は複数のサンプル種についての発現強度の値が検索条件として入力されたとき、当該検索条件の一又は複数のサンプル種についての発現強度の値と前記検索用レコードに記憶されている当該検索条件と同じ一又は複数のサンプル種をアプライしたマイクロアレイのスポット毎の発現強度の値との差、並びに当該検索条件の一又は複数のサンプル種をアプライしたマイクロアレイについて前記ヒストグラム用レコードを基に作成されたヒストグラム上における当該検索条件の発現強度の値に対応したプローブ種の数に基づいて、プローブ種毎に当該検索条件の一又は複数のサンプル種と結合する度合いを算出し、当該算出した度合いに基づいて当該検索条件の一又は複数のサンプル種と特徴的に結合するプローブ種を特定する検索手段と
    を備える検索スケジューリング装置として機能させるためのプログラム。
  5. コンピュータを、
    プローブが固定化されたスポットを備えるマイクロアレイにターゲットとしてのサンプルをアプライした場合の当該マイクロアレイのスポット毎の測定結果の発現強度が記憶される検索用レコード、及び該検索用レコードに記憶されている各マイクロアレイのスポット毎の発現強度の値に基づいて、当該各マイクロアレイのスポットに固定化されたプローブ種毎の発現強度の値に応じたマイクロアレイ数が記憶されるヒストグラム用レコードを有するデータセットファイルと、
    又は複数のプローブについての発現強度のが検索条件として入力されたとき、当該検索条件の一又は複数のプローブ種についての発現強度の値と前記検索用レコードに記憶されている当該検索条件と同じ一又は複数のプローブ種のサンプル毎の発現強度の値との差、並びに当該検索条件の一又は複数のプローブ種について前記ヒストグラム用レコードを基に作成されたヒストグラム上における当該検索条件の発現強度の値に対応したマイクロアレイ数に基づいて、サンプル毎若しくはサンプルをアプライしたマイクロアレイ毎に当該検索条件の一又は複数のプローブ種と結合する度合いを算出し、当該算出した度合いに基づいて当該検索条件の一又は複数のプローブ種と特徴的に結合するサンプル若しくは当該サンプルをアプライしたマイクロアレイを特定する検索手段と
    を備える検索スケジューリング装置として機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
  6. コンピュータを、
    プローブが固定化されたスポットを備えるマイクロアレイにターゲットとしてのサンプルをアプライした場合の当該マイクロアレイのスポット毎の測定結果の発現強度が記憶される検索用レコード、及び該検索用レコードに記憶されている各マイクロアレイのスポット毎の発現強度の値に基づいて、当該各マイクロアレイにアプライしたサンプル種毎の発現強度の値に応じたプローブ種数若しくはスポット数が記憶されるヒストグラム用レコードを有するデータセットファイルと、
    一又は複数のサンプル種についての発現強度の値が検索条件として入力されたとき、当該検索条件の一又は複数のサンプル種についての発現強度の値と前記検索用レコードに記 憶されている当該検索条件と同じ一又は複数のサンプル種をアプライしたマイクロアレイのスポット毎の発現強度の値との差、並びに当該検索条件の一又は複数のサンプル種をアプライしたマイクロアレイについて前記ヒストグラム用レコードを基に作成されたヒストグラム上における当該検索条件の発現強度の値に対応したプローブ種の数に基づいて、プローブ種毎に当該検索条件の一又は複数のサンプル種と結合する度合いを算出し、当該算出した度合いに基づいて当該検索条件の一又は複数のサンプル種と特徴的に結合するプローブ種を特定する検索手段と
    を備える検索スケジューリング装置として機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2001186907A 2001-06-20 2001-06-20 検索スケジューリング装置、プログラム及びプログラムを記録した記録媒体 Expired - Fee Related JP3825281B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2001186907A JP3825281B2 (ja) 2001-06-20 2001-06-20 検索スケジューリング装置、プログラム及びプログラムを記録した記録媒体
US10/154,007 US20030004939A1 (en) 2001-06-20 2002-05-23 Search scheduling apparatus, program and recording medium having the same program recorded therein
US11/979,038 US20080270362A1 (en) 2001-06-20 2007-10-30 Search scheduling apparatus, program and recording medium having the same program recorded therein

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001186907A JP3825281B2 (ja) 2001-06-20 2001-06-20 検索スケジューリング装置、プログラム及びプログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JP2003004736A JP2003004736A (ja) 2003-01-08
JP3825281B2 true JP3825281B2 (ja) 2006-09-27

Family

ID=19026279

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001186907A Expired - Fee Related JP3825281B2 (ja) 2001-06-20 2001-06-20 検索スケジューリング装置、プログラム及びプログラムを記録した記録媒体

Country Status (2)

Country Link
US (2) US20030004939A1 (ja)
JP (1) JP3825281B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7403939B1 (en) 2003-05-30 2008-07-22 Aol Llc Resolving queries based on automatic determination of requestor geographic location
US7562069B1 (en) 2004-07-01 2009-07-14 Aol Llc Query disambiguation
US7272597B2 (en) 2004-12-29 2007-09-18 Aol Llc Domain expert search
US7349896B2 (en) * 2004-12-29 2008-03-25 Aol Llc Query routing
US7818314B2 (en) * 2004-12-29 2010-10-19 Aol Inc. Search fusion
US7571157B2 (en) * 2004-12-29 2009-08-04 Aol Llc Filtering search results
US7941398B2 (en) * 2007-09-26 2011-05-10 Pentaho Corporation Autopropagation of business intelligence metadata
JP5402375B2 (ja) * 2009-08-07 2014-01-29 ソニー株式会社 情報処理装置、基準値決定方法およびプログラム
JP2023119530A (ja) * 2022-02-16 2023-08-28 富士フイルム株式会社 情報処理装置、情報処理方法、及び情報処理プログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5758257A (en) * 1994-11-29 1998-05-26 Herz; Frederick System and method for scheduling broadcast of and access to video programs and other data using customer profiles
IL138944A0 (en) * 1998-04-22 2001-11-25 Imaging Res Inc Process for evaluating chemical and biological assays
US20040002818A1 (en) * 2001-12-21 2004-01-01 Affymetrix, Inc. Method, system and computer software for providing microarray probe data

Also Published As

Publication number Publication date
JP2003004736A (ja) 2003-01-08
US20030004939A1 (en) 2003-01-02
US20080270362A1 (en) 2008-10-30

Similar Documents

Publication Publication Date Title
US20080270362A1 (en) Search scheduling apparatus, program and recording medium having the same program recorded therein
JP3776728B2 (ja) 遺伝子発現および評価システム
EP0935210A2 (en) Computer aided visualisation of expression comparison
JP2009520278A (ja) 科学情報知識管理のためのシステムおよび方法
JP6208227B2 (ja) バイオマーカシグネチャを生成するためのシステムおよび方法
KR20070038925A (ko) 유전자 진단을 위한 마커 선택 프로그램을 포함하는 컴퓨터판독가능 매체, 마커 선택 장치 및 시스템, 및 유전자진단 함수 생성 장치 및 시스템
WO2000071993A1 (en) Near infrared spectroscopy system and method for the identification of genetically modified grain
WO2014081456A1 (en) Efficient comparison of polynucleotide sequences
Marinov et al. Interrogating the accessible chromatin landscape of eukaryote genomes using ATAC-seq
Chiang et al. Understanding the ramifications of quantitative ordinal scales on accuracy of estimates of disease severity and data analysis in plant pathology
CN111263964A (zh) 基因解析方法、基因解析装置、管理服务器、基因解析***、程序、及记录介质
CN102395977B (zh) 核酸定量的方法
US20070172833A1 (en) Gene expression profile retrieving apparatus, gene expression profile retrieving method, and program
JP6891150B2 (ja) 解析方法、情報処理装置、遺伝子解析システム、プログラム、記録媒体
WO2008007630A1 (fr) Méthode et appareil de recherche de protéine
de Santiago et al. Analysis of ChIP-seq data in R/Bioconductor
JP2017126212A (ja) パスウェイ解析プログラム、パスウェイ解析方法、及び、情報処理装置
Haverty et al. Limited agreement among three global gene expression methods highlights the requirement for non-global validation
Eng et al. Discrete mixture modeling to address genetic heterogeneity in time-to-event regression
Bylesjö et al. MASQOT: a method for cDNA microarray spot quality control
CN113981063A (zh) 免疫球蛋白A肾病RhoGTPase相关诊断标志物
KR100456627B1 (ko) 3차원 구조기반의 거대분자의 기능 예측 시스템 및 그 방법
Rampelli et al. From whole-genome shotgun sequencing to viral community profiling: the viromescan tool
CN105574357B (zh) 一种生物标记物的功能验证芯片的制备方法
US20230116904A1 (en) Selecting a cell line for an assay

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040409

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060613

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060629

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090707

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090707

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090707

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120707

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150707

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees