JP4229647B2 - 大腸癌の肝転移を予測するための遺伝子セット - Google Patents
大腸癌の肝転移を予測するための遺伝子セット Download PDFInfo
- Publication number
- JP4229647B2 JP4229647B2 JP2002193381A JP2002193381A JP4229647B2 JP 4229647 B2 JP4229647 B2 JP 4229647B2 JP 2002193381 A JP2002193381 A JP 2002193381A JP 2002193381 A JP2002193381 A JP 2002193381A JP 4229647 B2 JP4229647 B2 JP 4229647B2
- Authority
- JP
- Japan
- Prior art keywords
- seq
- gene
- genes
- gene set
- liver metastasis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Description
【発明の属する技術分野】
本願発明は、大腸癌の肝転移に関与する遺伝子セットに関する。より詳細には、DNAマイクロアレイ法により大腸癌原発巣組織に特異的に発現した遺伝子群の発現情報を遺伝子判別分析手法に基づく統計解析処理することにより、大腸癌の肝転移の予測に有効な遺伝子セットを同定する方法、当該方法によって同定された遺伝子セット及び大腸癌原発巣組織における当該遺伝子セットの発現情報を用いて大腸癌の肝転移を予測する方法に関する。
【0002】
【従来の技術】
大腸癌は世界的に発生率が高く、本邦でも年々増加の一途を辿っている。現在、臨床における大腸癌の悪性度分類は、Dukes分類をはじめ、癌の大腸壁深達度や所属リンパ節への転移の程度などの病理学的な事項により判定されている。しかし、このような臨床病理学的分類では同じ病気でもその予後にはばらつきがあり、大腸癌の最たる予後規定因子である異時性肝転移の予測は困難である。そのため現状では、進行癌に対し異時性肝転移予防のために抗癌剤投与など画一的な術後治療が施されている。
【0003】
一方、大腸癌は、多段階発癌の構造など分子生物学的な研究がもっともよく進んでいる癌の一つで、これまでAPC, K−ras, p53, DCCなどの個々の遺伝子についての報告が多数みられる。しかし、これらの遺伝子のいずれかに注目するだけでは、大腸癌の個性を表現するには不十分であるため、近年は後述するように、DNAマイクロアレイなどを用いることにより、一度に極めて多数の遺伝子の発現情報を得ることにより有用な新規知見を得る試みがなされ始めている。
【0004】
Alizadehらは、びまん性大細胞型B細胞リンパ腫患者の末梢血から分取したBリンパ球を試料としてDNAマイクロアレイによる測定を行い、得られた遺伝子発現データの階層的クラスタリングを行うことにより、同病患者の末梢血Bリンパ球には、リンパ組織の胚中心に存在するB細胞に類似した遺伝子発現パターンを示す場合と、in vitroで活性化したB細胞に類似した遺伝子発現パターンを示す場合の2種類があることを見出した(Nature, vol. 403, p503-511 (2000))。両者の生存率をKaplan-Meierプロットで調べた結果、後者の発現パターンを示すB細胞を持つ患者は、前者の発現パターンを示すB細胞を持つ患者と比べて予後が悪いことが明らかとなった。加えて、従来からの病理学的診断に基づく予後予測に従うよりも、著者らの行った遺伝子発現情報のクラスタリングで得られた結果の方が予後との相関性が高かった。Alizadehらの研究結果は、遺伝子発現情報から臨床的に利用可能な有用な法則性を導き出せたという点で意義のあるものといえる。しかし、その法則が全く新たな臨床例についても適用できるかどうかについての検証はなされておらず、この論文の範囲でのみ成立する結果である可能性は否定できない。
【0005】
Khanらは、組織学的には区別が難しい小円形青色細胞腫に属する4種類の癌が、人工ニューラルネットワークを利用した遺伝子発現情報の解析により正確に区別されることを報告した(Nature Medicine, vol.7, p673-679 (2001))。この報告の中では、全体のデータから無作為に抜き出した一部のデータを用いて導き出した人工ニューラルネットワークモデルに対して、テストサンプルのデータを入力した場合にも、正確な判定結果が得られることが検証されている。したがって、ここで導き出された人工ニューラルネットワークモデルは、この論文内のデータの範囲に限定されるものではなく、小円形青色細胞腫に属する4種類の癌を区別するために一般的に適用可能なものであることが示唆される。しかしながら、人工ニューラルネットワークモデルで得られる判定結果は、数学的な根拠を明確に説明できないという点で一般には受け入れられにくい。
【0006】
上述したDNAマイクロアレイの測定で得られる大量の遺伝子発現データを統計学的手法により処理することで目的に叶う情報を導き出す方法については、確立された一般的なものとして認められていないのが現状である。
大腸癌の肝転移に関わる分子標的を同定することを目的としてDNAマイクロアレイを用いて行われた最近の研究例としては、柳川らの報告(Neoplasia, vol.3, No.5, p395-401 (2001))がある。著者らは、公共の遺伝子データベースに登録されているヒトcDNAの塩基配列に基づいて設計したオリゴDNAをプライマーとして用い、ヒトのcDNAを鋳型としてPCRを行い、9,121種類の増幅cDNA断片を得た。次いで、これらのcDNA断片をプローブとしてプリントしたDNAマイクロアレイを使って、10症例の大腸癌患者より分離した大腸癌原発巣及び大腸癌肝転移巣の遺伝子発現プロファイルを調べた。その結果、原発巣に対して肝転移巣で発現が上昇している40種類の遺伝子と、原発巣に対して肝転移巣で発現が低下している7種類の遺伝子を明らかにし、大腸癌の肝転移に関わる可能性がある候補遺伝子セットを同定した。
【0007】
【発明が解決しようとする課題】
しかしながら、これらの遺伝子セットは、本願発明で開示するところの、大腸癌の異時性肝転移の予測に有用な情報を提供するものではない。また、上記の9,121種類のプローブは、公共のデータベースに登録されている配列の中から無作為に選択されたものであるため、ヒトの遺伝子発現プロファイルを解析するために広く使用できるという利点がある反面、大腸癌で特異的に発現している重要な遺伝子を同定するための材料としては好ましいものではない。上述したように、大腸癌の肝転移を予測することができる遺伝子セットは、未だ開発されていない。
【0008】
【課題を解決するための手段】
本願発明の目的は、大腸癌の肝転移予測に利用可能な遺伝子セットを選択する方法及び当該方法によって得られる遺伝子セットを提供することにある。
また,本願発明の他の目的は、大腸癌原発巣組織における当該遺伝子セットの発現情報に基づき、大腸癌原発巣組織切除手術後の肝転移を予測する方法を提供することにある。
本発明者らは、上記の目的を達成するために鋭意研究を重ねた結果、大腸癌原発巣組織、大腸癌肝転移巣組織及び正常大腸粘膜組織を材料として作製したcDNAライブラリーから選択したプローブを用いてオリジナルのDNAマイクロアレイを作製し、それを用いて大腸癌組織における遺伝子発現解析を行うことにより、大腸癌の発育・進展に関連すると考えられる候補遺伝子の同定が可能であることを発見した(竹政ら,Biochem. Biophys. Res. Commun., vol.285, p1244-1249 (2001))。
【0009】
本願発明においては、上記のDNAマイクロアレイを用いて、異時性肝転移を起こした患者と異時性肝転移を起こさなかった患者に由来する大腸癌原発巣における遺伝子発現データを取得し、それらを統計解析したところ、大腸癌の肝転移予測に利用可能な有用な遺伝子セットを同定することに成功し、本願発明を完成するに至った。
したがって、本願発明は、大腸癌原発巣組織に特異的に発現している遺伝子について、肝転移した症例と肝転移しなかった症例の遺伝子発現データを統計解析処理することからなる、大腸癌の肝転移予測に利用可能な有用な遺伝子セットの選択方法を包含する。
また、本願発明は、斯かる方法により選択された遺伝子セットを包含する。
さらに、本願発明は、大腸癌原発巣組織における当該遺伝子セットの発現情報を統計解析処理した情報に基づき、大腸癌の肝転移を予測する方法を包含する。
【0010】
【発明の実施の形態】
以下、本願発明について詳述する。
本願発明の方法は、正常大腸粘膜との比較における大腸癌原発巣組織の遺伝子発現データを取得する第1の工程、大腸癌原発巣組織摘出後に肝転移が認められた症例と肝転移が認められなかった症例(それぞれ「肝転移あり症例」、「肝転移なし症例」と呼称することがある)の当該遺伝子の発現情報について統計学的処理を行う第2の工程により得られる大腸癌の肝転移予測に利用可能な遺伝子セットを決定する方法、当該方法によって同定された遺伝子セット及び当該遺伝子セットの大腸癌原発巣組織における発現情報を肝転移の予測に使用する方法によって特徴付けられる。
【0011】
上記の第1の工程には、DNAマイクロアレイ法、Northern解析法、アダプター付加競合PCR法(Kato K, Nucl. Acids Res., vol.25, p4694-4696 (1997))及びTaq Man PCR法(Applied Biosystems社)等の方法を利用することができるが、好ましくは、DNAマイクロアレイ法が使用される。本願発明においてDNAマイクロアレイ法とは、一般に使用されるcDNAマイクロアレイ及びDNAチップを用いた方法を含むものとする。
【0012】
DNAマイクロアレイ法を利用する場合、第1の工程は、DNAマイクロアレイにプリントされたプローブに標識遺伝子をハイブリダイズさせ、これを検出するステップからなる。DNAマイクロアレイにプリントされるプローブとして、ヒト大腸癌原発巣細胞、ヒト大腸癌肝転移巣細胞及びヒト正常大腸粘膜細胞から調製されたcDNAまたはその断片が使用される。前記細胞は、他の動物種由来の細胞であってもよい。具体的には、TRIzol試薬(GIBCO BRL社)、ISOGEN(ニッポンジーン社)などの試薬を用い、各試薬の添付文書に記載された方法に従って、上記のそれぞれの細胞から全RNAが抽出される。次いで、例えば、mRNA Purification Kit(Amersham BioSciences社)などの市販のキットにより、添付の方法に従って、該全RNAからポリアデニン付加RNA(以下、「mRNA」と称することもある)が精製される。mRNAは、例えば、SuperScript plasmid system for cDNA synthesis and plasmid cloning(GIBCO BRL社)などの市販のcDNAライブラリー作製キットによりcDNAライブラリーに変換される。こうして得られたcDNAライブラリーの各cDNAは、最終的には、大腸菌にクローニングされる。クローニングの方法は、サムブルック(Sambrook)らが述べている一般的な方法(Molecular Cloning, A Laboratory Manual, 第2版、Cold Spring Harbor Laboratory Press, New York, 1989)に従って行われる。
【0013】
クローン化されたcDNAの増幅と精製は、以下のように行われる。クローン化した前記大腸菌をヘルパーファージ(GIBCO BRL社)と共に培養し、一本鎖cDNAを有するファージを得、PCR法により該ファージのcDNAを増幅させる。培養に使用される培地として、一般に市販されている培地、例えば、CIRCLEGROW培地(BIO 101社)、LB培地(BECTON DICKINSON社)などが挙げられるが、いずれを使用してもよい。大腸菌とヘルパーファージの混合比は、大腸菌量に対して1/1000〜1/100量、好ましくは、1/500量が使用される。培養は、植菌した菌量に依存するが、一般に大腸菌が増殖する条件、例えば、37℃、pH6〜8、12〜16時間で行われる。PCR法によるcDNAの増幅は、遠心分離により一本鎖cDNAを有するファージ含有培養上清と大腸菌とを分離した後、培養上清に含まれるファージ中の一本鎖cDNAを鋳型として行われる。具体的には、上記の培養上清、ヒトcDNAと連結されているベクター部分の配列に対して相補的なプライマー及び、例えばTaKaRa Z-Taq DNAポリメラーゼ(タカラ社)のような耐熱性DNAポリメーラーゼを用いて行われる。
【0014】
増幅DNA断片は、ガラスビーズ法、QIAquick PCR Purification Kit(QIAGEN社)等の市販のPCR産物精製キットによって精製される。例えば、ガラスビーズ法によるcDNAの精製は、活性化SILICAビーズ(SIGMA社)添加ヨウ化カリウム液にPCR後の反応液を加えて攪拌した後、フィルター付96ウェルプレートMultiScreen-GV(MILLIPORE社)に移し遠心分離を行い、フィルター上のガラスビーズを洗浄バッファーで洗浄後、TEバッファーで増幅cDNAを回収することによって達成される。
【0015】
このようにして得られたcDNA断片の塩基配列は、例えばBig Dye Terminator Cycle Sequencing FS Ready Reaction Kit(Applied Biosystems社)などのシークエンシングキット及び、例えばABI PRISM 3700 Genetic Analyzer(Aplied Biosystems社)などのDNAシークエンサーを用いてシークエンシングを行うことにより決定することができる。得られた塩基配列は、例えば、GenBankに登録されているデータ−ベースとホモロジーを比較することにより,既知の配列か否かを判定することができる。かくして、遺伝子名が同定された約3000種類及び遺伝子名が同定されなかった1400種類のクローン化cDNA断片を取得することができた。
【0016】
DNAマイクロアレイは、上記のcDNA断片含有溶液をマイクロウェルプレートに注入した後、例えばSPBIO−2000マイクロアレイヤー(日立ソフトウェアエンジニアリング社)などの機器を用い、一般に市販されているシランコートスライドガラスやポリリジンコートガラスにプリントすることにより作製される。cDNA溶液は、0.05μg/μl〜1μg/μlの濃度で用いられる。市販の既知遺伝子のcDNA断片を含め全部で4,608種類のcDNA断片をプリントしたDNAマイクロアレイを調製した。ここで得られたcNDA断片(プローブ)のシリアル番号、遺伝子名、GenBankへのアクセス番号をまとめたデータベースを作成した。
【0017】
cDNAライブラリからPCRで増幅したDNA断片の代わりにハイブリダイゼーションのために有効な鎖長を持つ合成DNAを用いても同様の結果を得ることができる。すなわち、本発明で開示された遺伝子名あるいは配列情報に基づいて、その一部の配列からなる約20ヌクレオチド以上の長さを持つ合成DNAをプローブとして、同様の解析を行うことができる。
大腸癌で特異的に発現している遺伝子の解析に使用される標識cDNAは、インフォームドコンセントを経て収集された203症例の大腸癌原発巣組織から抽出されたそれぞれの全RNAを用いて調製される。127例は大腸癌原発巣の除去手術後に肝転移が認められず予後が良好であった症例、51症例は除去手術後に肝転移が認められた症例、25例は肝臓以外の臓器や粘膜に転移が認められた症例である。コントロールとして使用される標識cDNAは、前記203例中、40症例の大腸癌原発巣組織周辺の正常大腸粘膜組織の全RNAから調製される。
【0018】
cDNAの標識は、Brownらの方法(http://cmgm.stanford.edu/pbrown/protocols/4_human_RNA.html)に従って、前述のDNAマイクロアレイにプリントされるプローブと同じ方法により大腸癌原発巣組織から抽出された全RNAまたは更に精製されたmRNA、あるいはT7 RNAポリメラーゼを用いたRNAの増幅法(http://cmgm.stanford.edu/pbrown/protocolsampprotocol_3.html)により増幅したRNAを、cDNAに変換するときに標識ヌクレオチドを取り込ませることによって行われる。標識ヌクレオチドとして、蛍光色素標識、ビオチン標識されたものなどを使用できるが、好ましくは、蛍光色素標識されたヌクレオチドが使用される。蛍光色素としては、一般にCy3及び/又はCy5が使用される。ビオチン標識ヌクレオチドを用いる場合には、蛍光物質フィコエリスリンで標識した標識アビジンが使用される。
【0019】
具体的には、大腸癌原発巣組織由来のCy3標識cDNA(以下、「Cy3cDNA」と称することもある)は、上記の全RNA、オリゴdTプライマー、dNTP及びCy3標識dUTPを含む混合液に逆転写酵素を加えた後、37〜45℃、好ましくは、42℃で、1〜3時間、好ましくは、1時間加温することにより調製される。コントロールとして使用される正常大腸粘膜由来のCy5標識cDNA(以下、「Cy5cDNA」と称することもある)の調製も、正常大腸粘膜組織の全RNAを用いて同様の方法により行われる。こうして得られたCy3cDNA及びCy5cDNAは、それぞれ変性溶液中で65〜70℃、好ましくは、70℃で、10〜20分間、好ましくは、10分間加熱処理し、中和後、等量混合される(以下、「Cy5・Cy3cDNA」と称することもある)。変性溶液として、50mM EDTAを含む0.5N NaOH又は1N NaOHなどを用いることができるが、50mM EDTAを含む0.5N NaOHを使用するのが好ましい。Cy5・Cy3cDNAの精製は、例えばMicrocon-30(Amicon社)などの市販キットを用い、添付の方法に従って行われる。
【0020】
Cy5・Cy3cDNAとDNAマイクロアレイにプリントされたプローブとのハイブリダイゼーションは、Brownらの方法(http://cmgm.stanford.edu/pbrown/protocols/5_hyb_human.html)に準じて行われる。先ず、プローブを熱変性させるためにDNAマイクロアレイを加熱処理し、これに100℃で2分間加熱処理したCy5・Cy3cDNA含有ハイブリダイゼーション液を滴下し、カバーガラスで覆った後、DNAマイクロアレイを密閉容器に入れ、ハイブリダイゼーションを行う。ハイブリダイゼーション条件としては、ハイブリダイゼーション液がホルムアミドを含む場合には、42℃で12時間以上のハイブリダイゼーションが行われ、ホルムアミドを含まない場合には約68℃で12時間以上のハイブリダイゼーションが行われる。ハイブリダイゼーションの終了後、例えばScan Array 4000(GSI Lumonics社)などの機器によりCy3とCy5の蛍光をスキャンし、蛍光パターンを画像データとして得る。
【0021】
続いて、これらの画像データを、例えばQuantarrayソフトウェア(GSI Lumonics社)などのマイクロアレイデータ専用解析ソフトを用いて解析することにより、全プローブについてのCy3とCy5の蛍光強度をテキスト形式の数値データとして得る。蛍光強度の低い部分はバックグラウンドの影響を大きく受けるので、例えば蛍光強度が高い方から3,000データポイントだけを残すなどの方法により、蛍光強度がカットオフを超えるデータのみを残し、蛍光強度の低いプローブのデータは棄却される。各プローブのCy3とCy5の蛍光強度値の比を算出し、検出感度の補正を行った標準化数値データを得る。上記の標準化数値データのうち、ハイブリダイゼーションに供した203症例の85%にあたる173症例以上についてデータが取得できており、且つ203症例の大腸癌原発巣のデータ内での分散値(variance)が、12例の正常大腸粘膜についてのデータ内での分散値の1.1倍を超えていた、合計2,069種類のプローブに対応するデータのみを選択する。これらのデータ中に存在する欠損値を何らかの方法で補完して以降の解析に使用する必要がある。補完の方法としては様々なものが適用可能であるが、例えば、補完する欠損値を含む症例についての全データの平均値に、その欠損値を含む遺伝子の全症例についてのデータの平均値を加えた値から、全症例についての全遺伝子のデータの平均値を引いた値をもって補完する方法がある。他にはTroyanskayaらの報告(Bioinformatics, vol.17, p520-525 (2001))において3種類の補完方法、すなわち、K-Nearest Neighbors (KNN) method、Singular Value Decomposition (SVD) based method及びrow average methodによる補完の例が示されている。これらのうちのいずれかの方法を適用することにより、全ての欠損値を補完することが可能である。かくして選択される標準化数値データ(以下、「標準化遺伝子発現データ」と称することもある)は、バックグラウンドの影響を受けておらず、Cy3とCy5の検出感度の違いによる誤差を含まず、解析した症例の大半においてデータが取得されており、かつ、正常大腸粘膜との比較における大腸癌原発巣の遺伝子発現の変動幅が個人差に起因する遺伝子発現の変動幅を超えている遺伝子の発現情報を有しており、以後の統計解析の信頼性を確保することができるものである。
【0022】
本願発明の第2の工程には、上記の標準化遺伝子発現データのうち、大腸癌原発巣の除去手術後に肝転移が認められなかった127例及び肝転移が認められた51症例の標準化遺伝子発現データが使用される。本工程における統計学的処理は、標準化遺伝子発現データを多変量解析することによって行われる。多変量解析の手法として、判別分析、主成分分析などを用いることができるが、好ましくは、判別分析である。
【0023】
図1は、遺伝子判別分析手法の概略を示す。
手順101:上記の標準化遺伝子発現データ、標準化遺伝子発現データ中の数値のそれぞれに対応するDNAマイクロアレイ上のプローブ番号のリスト(以下、「対象遺伝子セット」と称するすることもある)と症例番号のリスト(以下、「対象サンプルセット」と称することもある)からなる標準化データマトリックスを用意する。
手順102:標準化遺伝子発現データ中の多重共線性の問題を除去するために、ピアソンの相関係数を指標として対象遺伝子セットの中から遺伝子発現のパターンが各症例間で似通った遺伝子同士をグループ化し、グループの代表遺伝子以外の遺伝子を対象遺伝子セットから除去する。
【0024】
手順103:後述の高判別能遺伝子の順位付け処理によって、高い判別能力を持つ順番に遺伝子を並べたリスト(高判別能遺伝子リスト)を生成する。高判別能遺伝子リストを生成する工程は、以降の解析における計算量を減らすために効果的であるが、この工程の導入は、計算機の能力が十分であれば必ずしも必要ではない。
手順104:後述の高判別能遺伝子セット決定手法により、高い判別能力を持つ1つの遺伝子セット(以下、「総合高判別能遺伝子セット」と称することもある)を得る。
手順105:総合高判別能遺伝子セットの判別能力を評価基準に基づき評価する。評価基準はより高い方が好ましい。具体的には、判別能力値が50%以上、好ましくは70%以上、より好ましくは85%以上である。
【0025】
手順107:評価基準を満すならば得られた総合高判別能遺伝子セットを採択する。
手順108:高判別能遺伝子リストの先頭の遺伝子を除く。手順104に戻り、次の総合高判別能遺伝子セットを得る。総合高判別能遺伝子セットの判別能力が評価基準以上であるならば、得られたその総合高判別能遺伝子セットを採択し、判別能力が評価基準以下である場合、その総合高判別能遺伝子セットは採用せず、処理を終了する。以上の手順を繰り返すことによって、総合高判別能遺伝子セットの組を得ることができる。
【0026】
図1における手順102の多重共線性の問題を除去する処理は、手順201〜204に従って実施される(図2参照)。本処理は、対象遺伝子セットのうち、遺伝子発現のパターンが各症例間で似通った遺伝子同士をグループ化し、グループの代表遺伝子以外の遺伝子を対象遺伝子セットから除去することにより、遺伝子発現プロファイルの多重共線性の問題を回避するために行われる。
手順201:遺伝子セットに含まれる全遺伝子の組(遺伝子対)において、各症例における標準化発現量を説明変量としたピアソンの相関係数を求める。
手順203:相関係数が0.8以上の遺伝子の組を探索する。
【0027】
手順204:最も多くの遺伝子対に含まれる遺伝子を代表遺伝子とし、その遺伝子と遺伝子対を作る遺伝子を対象遺伝子セットから除く。この処理によって、遺伝子発現プロファイルの多重共線性の問題が排除されたデータセットが生成される。代表遺伝子との間に多重共線性があるとして解析対象から外された遺伝子(高相関遺伝子)は、解析の過程において、代表遺伝子の代替遺伝子として用いることが可能である。また、解析によって得られる総合高判別能遺伝子セットに含まれる代表遺伝子は、高相関遺伝子によって代替可能である。
【0028】
図1における手順103の高判別能遺伝子の順位付けの概略を図3に示す。肝転移あり症例群と肝転移なし症例群の標準化遺伝子発現データを、それぞれS、Tとするとき、S及びTの各標準化遺伝子発現データを更にサンプルグループa、bに2分割し、計4組のサンプルグループの集合を得る。これらについて統計解析し、判別遺伝子集合の決定を行う(図3:301)。この過程を、十分な回数繰り返し(図3:302)、各過程において決定された判別遺伝子集合に含まれる遺伝子の出現回数を集計する(図3:303)。ブートストラップ法と呼ばれるこの処理によってデータに含まれるノイズに影響されることなく、普遍的に高判別能を有する遺伝子のリストを得ることが可能である。
【0029】
より具体的には、高判別能遺伝子の順位付け処理は手順401〜408に従って実施される(図4参照)。
手順401:高判別能遺伝子セットを求める処理の繰り返し回数を記憶するカウンタIを0に初期化する。
手順402:上記の2つの集合、S,Tそれぞれをランダムに2つの集合a,bに2分割し、Sa,Sb,Ta,Tbの4つのサンプル集合を得る。サンプルセットのランダムな選択において、ランダムサンプリングに因らず、ランダム分割を採用することにより、各サンプルの解析に供せられる頻度を正確に一致させることが可能となる。
【0030】
手順403:後述する高判別能遺伝子セット採択手法により、Sa,Ta2つの集合を対象とした高判別能遺伝子セットを得る。
手順404:Sb, Tb2つの集合を対象とした高判別能遺伝子セットを得る。
手順405:手順403、404によって得られた高判別能遺伝子セットに含まれる遺伝子を蓄積する。
手順406:Iを1増加し、Iが5,000より小さい間、手順402以降を繰り返す。
手順407:Iが5,000に達することで繰り返しを完了する。
手順408:蓄積された遺伝子を集計して、高判別能遺伝子セットに含まれた回数の多い遺伝子ほど高い判別能力を持った遺伝子であると判断して順位付けを行う。
【0031】
このような高判別能遺伝子セットに含まれる回数の多い遺伝子の上位100種類を表1〜3に記載した。
【表1】
【表2】
【表3】
【0032】
表1〜3におけるシリアル番号は、本願発明で用いたプローブの任意の番号を示す。また、アクセス番号及び遺伝子名は、データベース(GenBank)に登録されたものである。ホモロジー検索の結果、既知の遺伝子やESTに合致しなかったプローブについては、表1〜3中に記載の通り遺伝子名を未知遺伝子とし、それぞれの配列番号1〜13における塩基配列を配列表の配列番号1〜13に記載した。表1〜3に記載の遺伝子は、出現する頻度が高いほど大腸癌の肝転移への関与が深いと考えられ、大腸癌の肝転移抑制のための薬剤開発あるいは治療法開発の標的としての利用が期待される。また、表1〜3中に記載の遺伝子のうち、遺伝子名をEST及び未知遺伝子としてその配列を開示したものは、新規な遺伝子の一部分の配列であることから、遺伝子全長をクローニングするための情報、すなわちPCRプライマーのデザインのためや、サザンハイブリダイゼーションやノーザンハイブリダイゼーション用のプローブデザインのための情報として利用可能である。更に、将来的にこれらの配列の上流または下流部分の配列が解読されれば、本発明で開示した範囲意外の部分配列をプローブとして使用し、本発明と同様の肝転移予測診断を行うことが可能である。また、これらの遺伝子についても全長がクローニングされ、該遺伝子がコードするタンパクの機能が解明されれば、表1〜3に記載の既知の遺伝子と同様に肝転移抑制の標的遺伝子として利用できる可能性がある。
【0033】
高判別能遺伝子セットを採択する手法は、図4における手順403及び404において行う高判別能遺伝子セットを採択する手法の一例を示すもので、手順501〜505に従って実施される(図5参照)。この際、ロジスティック回帰における遺伝子の組み合わせを評価する基準として、最尤法(maximun likelihood method)の範疇に属するAIC値(赤池情報量規準)又はSchwarzのBIC値などの指標が用いられるが、好ましくはAIC値が採用される。また、全く異なる評価基準として、症例データの判別成績を利用することもできる。
手順501:空の遺伝子集合Gを用意する。
手順502:GとGに含まれない全ての遺伝子eの組について、後述の手法により、対象サンプルにおける判別対象となる状態S,Tに関するロジスティック回帰を行い、AIC値が最小となる遺伝子e’を見つける。
手順503:(G+e’)のAIC値をGのAIC値と比較する。
手順504:(G+e’)のAIC値の方が小さな場合は要素e’を遺伝子集合Gに加え、手順502以降を繰り返す。
手順505:手順503において、(G+e’)のAIC値の方が小さくない場合は、繰り返し処理を終了し、Gに含まれる遺伝子を高判別能遺伝子セットとする。
【0034】
図1における手順104の総合高判別能遺伝子セットの決定は、手順601〜608に従って実施される(図6参照)。
手順601:総合高判別能遺伝子セットを求める処理の繰り返し回数を記憶するカウンタIを0に初期化する。
手順602:繰り返しの間に発生する最小AIC値:Aとその際の遺伝子数:Wを初期化する。
手順603:Iを1増加する。
手順604:順位付けられた遺伝子の1〜I番目を対象として、手順103におけると同様の手順により、判別対象となる2つの集合S,集合Tに対するロジスティック回帰を行い、AIC値A’を求める。
手順606:A’がAよりも小さな場合、A’の値をAに、IをWに記憶する。
手順607:Iが100より小さい間、手順603以下を繰り返す。
手順608:順位付けられた遺伝子の1〜100番目の組における最小のAIC値を持つ組として、1〜W番目の遺伝子を得、これを総合高判別能遺伝子セットとして採択する。
【0035】
図1における手順105の総合高判別能遺伝子セットの判別能力評価の手順は、手順701〜707に従って実施される(図7参照)。
手順701:処理の繰り返し回数を記憶するカウンタIを0に初期化する。
手順702:肝転移あり症例群と肝転移なし症例群の集合であるS,Tのそれぞれをランダムに2分割して部分集合Sa、Sc及びTa、Tcを得る。ここで、2分割するかわりに、適当な数の症例データをランダムにサンプリングして部分集合Sa、Sc及びTa、Tcを得ることもできる。
手順703:2つの部分集合、SaとTaを用いて、総合高判別能遺伝子セットによって集合S,Tを判別する判別式を求める。
手順704:ScとTcを用いて、判別式の検証を行って結果を蓄積する。すなわち、判別式は前記のロジスティック回帰により求め、その式を使ってScとTcに含まれるサンプルが、正確に判別されるかを判定する。これは、判定式による判定結果が各サンプルの実際の臨床情報と一致しているかどうかを判定することを意味する。
手順705及び706:Iを1増加し、Iが10,000より小さい間、手順702以下を繰り返す。
手順707:1症例についてのIの検証判定回数に対し、その95%以上の回数が臨床情報と合致していた症例を正解と判定する。正解と判定された症例の、全解析症例数に占める割合を判別能力値と定義し、これを求める。
手順705及び706のIの繰り返し回数は、統計的な意味を持たせるのに十分な回数であれば特に限定されるものではないが、好ましくは、I=10,000である。
手順702〜706までの一連の手順の繰り返しは、手順103で選出した総合高判別遺伝子セットの判別能力を評価するためのクロスバリデーションに相当する。この操作により、普遍的に正しい判別能力を有する総合高判別遺伝子セットを採択することができる。
【0036】
以上の手順により表4から表15までに記載の総合高判別能遺伝子セットの組を決定することができる。また、表5及び表6に含まれるシリアル番号3017のプローブについては、図2に記載した手順により高相関遺伝子が6種類同定された。表16はこれらのプローブ遺伝子を示す。これらは、3017番と等価なものと考えられる。したがって、表5及び表6の総合高判別能遺伝子セットのうち、3017は、表16のプローブ遺伝子のいずれとも置換することが可能である。
【0037】
【表4】
【0038】
【表5】
【0039】
【表6】
【0040】
【表7】
【0041】
【表8】
【0042】
【表9】
【0043】
【表10】
【0044】
【表11】
【0045】
【表12】
【0046】
【表13】
【0047】
【表14】
【0048】
【表15】
【0049】
【表16】
【0050】
表4から表15までに開示した総合高判別能遺伝子セットの各々、及び、表5と表6の中のシリアル番号3017の遺伝子を、表16に含まれる遺伝子のいずれかと置換して生成される総合高判別能遺伝子セットの各々の発現情報は大腸癌の肝転移予測に利用される。すなわち、例えば、新たな大腸癌患者の大腸癌原発巣組織における総合高判別能遺伝子セットの遺伝子発現データを取得し、そのデータを実施例で求めた上記の回帰式の全部または一部に代入して判定結果を得ることにより、その大腸癌患者が将来的に肝転移を起こす可能性が高いか否かを予測することができる。複数の総合高判別能遺伝子セットについて上記の判別解析を行うことにより、判定精度の向上も期待できる。
【0051】
また、新たにロジスティック回帰式などの回帰式を作成するのに十分な数の別の症例について本願発明で開示した総合高判別能遺伝子セットの発現データを解析すれば、本実施例で作成したロジスティック回帰式そのものを使わなくとも、新たな回帰式を作成し、肝転移の予測判定に利用することもできる。
【0052】
また、上記の総合高判別能遺伝子セットは、種々の統計解析処理する手法を用いて、新規な症例について肝転移の予測判定に有効に利用される。このような統計解析処理法として、ロジスティック回帰式による手法のみならず、階層的クラスタリング、人工ニューラルネットワーク(ANN)モデル、Self-Organizing Map (SOM)、Support Vector Machine(SVM)などの手法が挙げられる。例えば、新規な症例について、総合高判別能遺伝子セットの遺伝子発現データを取得し、そのデータを本実施例で使用した遺伝子発現データに追加して上記のクラスタリングを行うことにより、追加した新規な症例のデータが、肝転移あり症例を多く含むクラスターと肝転移なし症例を多く含むクラスターのどちらに含まれるかを調べることによって、その新規な症例が肝転移を起こす可能性が高いか否かを予測判定することができる。
【0053】
また、新たに階層的クラスタリングを行うのに十分な数の別の症例について本願発明で開示した総合高判別能遺伝子セットの発現データを解析すれば、本実施例で取得した遺伝子発現データそのものを使わなくとも、新たなクラスタリングを行い肝転移の予測判定に利用することもできる。同様に、ANNモデル、SOM、SVMについても、十分な数の新たな症例に対して、本願発明で開示した総合高判別能遺伝子セットの発現データを解析すれば、本実施例で取得した遺伝子発現データそのものは必ずしも必要ではない。
また、本願発明で開示する上記の各々の総合高判別能遺伝子セットは、肝転移予測に必要な最小限の数の遺伝子を含むものであり、他のいくつかの遺伝子を加えて新たな遺伝子セットを生成し、それを用いて肝転移予測に利用することも可能である。逆に、各遺伝子セットから1〜数個の遺伝子を抜いても肝転移を予測することは可能である。更には、各遺伝子セットの遺伝子を相互に組み合わせて新たな遺伝子セットを構築することもできる。これらを実施する際には、上述した方法に従って、新規な遺伝子セットの判別能力評価を行うことが望ましい。このとき、遺伝子セットは、判別能力値が50%以上、好ましくは、70%以上、更に好ましくは、85%以上になる場合に採択される。
【0054】
【実施例】
以下に本発明に至るまでの実施例を示すが、本実施例によって本願発明は何ら制約を受けることはない。なお、実施例において使用した試薬類は特にことわりのない限り、ナカライテスク株式会社より購入したものを使用した。
実施例1
cDNAライブラリーの作製
大腸癌における遺伝子発現プロファイル解析に特化したDNAマイクロアレイを作製するためには、プリントするプローブを大腸癌そのものから単離するのが最良と考えた。そこで、プローブの元となる3つのcDNAライブラリーすなわち、大腸癌原発巣cDNAライブラリー、大腸癌肝転移巣cDNAライブラリー、及び正常大腸粘膜cDNAライブラリーを作製した。方法は、まず、インフォームドコンセントを経て収集されたヒト大腸癌原発巣細胞、ヒト大腸癌肝転移巣細胞及びヒト正常大腸粘膜細胞のそれぞれからTRIzol試(GIBCO BRL社より購入)を用いて全RNAを抽出した。次に、これらの全RNAの中に存在するポリアデニン付加RNA(以下、「mRNA」と記載する)を、mRNA Purification Kit(Amersham BioSciences社より購入)を用いて精製した。精製手順は、本キットに添付のマニュアルに従った。さらにこれらのmRNAを材料に、市販のキットSuperScript plasmid system for cDNA synthesis and plasmid cloning(GIBCO BRL社より購入)を用いて上述の3種類のcDNAライブラリーを作製した。最終的には、作製したcDNAライブラリーを大腸菌XL2-Blue株(STRATAGENE社より購入)に導入することによりcDNAライブラリークローンを得た。
【0055】
実施例2
cDNAライブラリークローンにクローニングされているcDNAの増幅と精製
実施例1に記載の方法で作製した3種類のcDNAライブラリーのそれぞれのライブラリーから、各10,000クローンずつの大腸菌コロニーを、予め150μLのCIRCLEGROW培地(BIO 101社より購入)を分注しておいた96ウェルプレートのそれぞれのウェルに植菌した。なお、本CIRCLEGROW培地には、分注する前に予め1/500量のM13KO7ヘルパーファージ(GIBCO BRL社より購入)を添加しておいた。大腸菌コロニーを植菌したプレートは37℃のインキュベーター内で12〜16時間培養した。培養後、プレート遠心機を用いて遠心分離することにより菌体を沈殿させた。こうして得られた培養上清中には、各cDNAライブラリークローンにクローニングされているヒトcDNAに由来する一本鎖DNAを含むファージが含まれている。従って、この培養上清と、ヒトcDNAと連結されているベクター部分の配列に対して相補的なプライマーDNAを用いてPCRを行うことにより、各cDNAライブラリークローンにクローニングされているヒトcDNAを増幅DNA断片として得ることができる。
【0056】
実際には、0.2mL用のマイクロチューブ内で、1μLの上記培養上清、3μLの10xZ−Taqバッファー、2.5μLの2.5mM dNTP、0.5μLの10pmol/μL M13 forwardプライマー(配列;5’-GTTTTCCCAGTCACGACGTT)(配列番号14)、0.5μLの10pmol/μL M13 reverseプライマー(配列;5’-AGCGGATAACAATTTCACAC)(配列番号15)、0.25μLのTaKaRa Z-Taq DNAポリメラーゼ及び22.25μLの滅菌蒸留水を混合し、サーマルサイクラーGeneAmp PCR System 9700(Applied Biosystems社より購入)上でPCR増幅した。反応サイクルは、96℃で30秒、48℃で30秒、72℃で4分間の3ステップを1サイクルとして35サイクル行った。増幅されたDNA断片はガラスビーズ法によって精製した。すなわち、増幅後のPCR反応液に対して、塩酸処理によって活性化したSILICAビーズ(SIGMA社より購入)を添加した6Mヨウ化ナトリウム溶液を150μL加えてよく攪拌し、フィルター付96ウェルプレートMultiScreen-GV(MILLIPORE社より購入)に移し遠心分離により濾過を行った。フィルター上に残ったガラスビーズに100μLの洗浄バッファー(20mM Tris−HCl、1mM EDTA、100mM NaCl、50%エタノール)を添加して再び遠心分離することにより洗浄した。再度同じようにして洗浄を行った後、フィルター上に残ったガラスビーズに対して25μLのTEバッファー(10mM Tris−HCl、1mM EDTA)を添加して遠心分離することにより、濾液中に精製された増幅DNAを回収した。
【0057】
実施例3
ライブラリークローン由来cDNAの塩基配列解析
前述のようにして精製した、各cDNAライブラリークローン由来の増幅cDNA断片の塩基配列を決定した。すなわち、精製DNA溶液4μLを鋳型DNAとして用い、Big Dye Terminator Cycle Sequencing FS Ready Reaction Kit(Applied Biosystems社より購入)を用いてサイクルシークエンシング反応を行った。反応溶液の調製及び反応条件は上記キットに添付のマニュアルに従った。反応生成物の精製はMILLIPORE社のウェブサイト(http://www.millipore.com/nihon\analytical\jppubdbase.nsf/docs/tn053JA.html)に紹介されている「マルチスクリーン96ウェルプレートを用いたダイターミネーターおよびシークエンシング反応物のクリーンアップ」法に従って行った。
【0058】
その後、精製済シークエンシング反応物の電気泳動及び塩基配列の自動解析にはABI PRISM 3700 Genetic Analyzer(Applied Biosystems社より購入)を用いた。このようにして決定された各cDNAの塩基配列について、遺伝子配列データベースであるGenBankに登録されている配列に対してホモロジー検索プログラムであるBLASTを利用したホモロジー検索を行うことにより、各cDNAライブラリークローンにクローニングされているcDNAの遺伝子名とGenBank中でのアクセス番号を明らかにした。このホモロジー検索で同定したGenBank中でのアクセス番号を指標に、同じ遺伝子断片を含むクローンを重複して選ばないようにしながらDNAマイクロアレイにプリントする4,430種類のクローンを選択した。その内訳は、遺伝子名が同定できた断片が約3,000種類、遺伝子名を同定できなかった未知遺伝子断片が約1,400種類であった。
【0059】
実施例4
DNAマイクロアレイにプリントするcDNAの調製
実施例3に記載の手順で選択した4,430クローンについて、前述と同様にしてPCRによるcDNAの増幅を行った。ただし、今回は反応容量が100μLで反応を行った。すなわち、0.2mL用のマイクロチューブ内で、3μLのcDNAライブラリークローン培養上清、10μLの10xZ-Taqバッファー、8μLの2.5mM dNTP、1μLの10pmol/μL M13 forwardプライマー(配列;5’-GTTTTCCCAGTCACGACGTT)(配列番号14)、1μLの10pmol/μL M13 reverseプライマー(配列;5’-AGCGGATAACAATTTCACAC)(配列番号15)、0.5μLのTaKaRa Z-Taq DNAポリメラーゼ及び76.5μLの滅菌蒸留水を混合し、サーマルサイクラーGeneAmp PCR System 9700(Applied Biosystems社より購入)上でPCR増幅した。反応サイクルは、96℃で30秒、48℃で30秒、72℃で4分間の3ステップを1サイクルとして35サイクル行った。この反応で使用した10xZ-Taqバッファー、2.5mM dNTP及びTaKaRa Z-Taq DNAポリメラーゼは、いずれも宝酒造株式会社より購入した。反応後は、通常のエタノール沈殿を行うことにより増幅DNAの精製を行った。最終的には、増幅DNAを30μLの3xSSC(0.45M塩化ナトリウム,45mMクエン酸ナトリウム,pH7.0)溶液に溶解した。
【0060】
さらに、今回発明者らが作製したライブラリーに含まれていなかったものの、論文などで癌との関連が示唆されていた約170種類の既知遺伝子についてもcDNA断片を準備した。実際には、170種類のうち140種類については米国Research Genetics社で販売されていたクローンを購入して前述と同様のPCRを行うことにより目的のcDNA断片を得た。残り30種類については、市販のクローンがなかったため、GenBankに登録されている配列に基づいてデザインした、各遺伝子配列に特異的なPCRプライマーを用いて、ヒト正常大腸粘膜及び大腸癌より抽出したmRNAを材料として通常のRT−PCRを行うことにより、目的とする増幅cDNA断片を得た。これらの増幅DNA断片についてもエタノール沈殿を行うことにより精製し、最終的に30μLの3xSSCに溶解した。
【0061】
実施例5
DNAマイクロアレイの作製
実施例1〜4に記載した方法で増幅したcDNA断片(合計4,608種類)をDNAマイクロアレイにプリントするプローブとして使用した。具体的には、これらのcDNAの溶液を384ウェルプレート(Applied Biosystems社より購入)に移し、SPBIO−2000マイクロアレイヤー(日立ソフトウェアエンジニアリング)を使ってシランコートスライドガラス(BM機器)にプリントすることにより大腸癌解析用DNAマイクロアレイを完成した。また、プリントした各cDNAプローブ(以下、単に「プローブ」と記載することがある)にはシリアル番号を付与し、前述の方法で調べた各プローブの塩基配列、遺伝子名及びGenBankにおけるアクセス番号に加えて、スライドガラス上でのプローブの位置情報の照合が可能なようにデータベースを作製した。このデータベースにおいては、前述のホモロジー検索でGenBank中の既知のcDNAと合致しなかったプローブについては、便宜上、遺伝子名を未知遺伝子とし、ESTのみと合致したものについては遺伝子名をESTとした。
【0062】
実施例6
試料からの全RNA調製
DNAマイクロアレイを用いた、大腸癌における遺伝子発現解析を行うための試料として、インフォームドコンセントを経て収集された、大腸癌手術時に切除された大腸癌原発巣組織試料203症例分及びその周辺部より分離された正常大腸粘膜組織試料52症例分を用いた。大腸癌原発巣組織試料は全て、日本における大腸癌の病期分類において第II期及び第III期に属するものであり、うち127症例は原発巣の除去手術後に異時性肝転移が見られず予後が良好であった患者(以下、「肝転移なし症例」と記載する)に由来するものであり、51症例は原発巣の除去手術後数年以内に肝臓への転移が見られた患者(以下、「肝転移あり症例」と記載する)、残り25症例は肝臓以外の臓器や腹膜への転移が見られた症例に由来するものであった。各試料より前述のようにしてTRIzol試薬を用いて全RNAを抽出した。52例分の正常大腸粘膜試料由来の全RNAのうち40人分を混合して、全ての実験を通して使用する標準正常大腸粘膜全RNAとした。これらのRNAサンプルの濃度は、定法通りに分光光度計を用いて測定した波長260nmでの吸光度に基づいて算出した。
【0063】
実施例7
蛍光ラベルターゲットの調製
DNAマイクロアレイにハイブリダイズさせる蛍光ラベルターゲットは以下の手順で作製した。まず、25μgの大腸癌原発巣組織由来全RNA(以下、「大腸癌RNA」と記す)と25μgの標準正常大腸粘膜全RNA(以下、「標準大腸粘膜RNA」と記す)を別々のチューブに入れ、それぞれに2μgの18ヌクレオチドから成るオリゴdTプライマーを加え、滅菌蒸留水にて容量を14μLとし、70℃で10分間加熱した後、直ちに氷上に移して急冷した。その後、それぞれのチューブに、6μLの5xFirst Strand Buffer、3μLの0.1M DTT、1.5μLの20xdNTP mix(10mMのdATP,dCTP,dGTP及び6mMのdTTPの混合物)及び0.5μLのRNAguardを添加した。さらに、大腸癌RNAを入れた方のチューブに蛍光色素Cy3でラベルされたdUTP(以下、「Cy3−dUTP」と記す;濃度1mM)を3μL、標準大腸粘膜RNAを入れた方のチューブにCy5でラベルされたdUTP(以下、「Cy5−dUTP」と記す;濃度1mM)を3μL加えて、42℃にて2分間保温した。
【0064】
その後、逆転写酵素であるSuperScriptIIを各チューブに2μL加えて、42℃にてさらに1時間保温することによりラベル反応を行った。この反応により、大腸癌RNAと標準大腸粘膜RNAを鋳型としてcDNA合成が起こる際に、それぞれCy3−dUTPとCy5−dUTPが取り込まれることにより、それぞれCy3とCy5で蛍光ラベルされた大腸癌ラベルターゲットと標準大腸粘膜ラベルターゲットが生成する。この反応で使用した5xFirst Strand Buffer、0.1M DTT及びSuperScriptIIは、いずれもGIBCO BRL社より購入した。また、dATP,dCTP,dGTP及びdTTP、Cy5−dUTP及びCy3−dUTP、そしてRNAguardはいずれもAmersham BioSciences社より購入した。反応後は、各チューブに5μLの変性溶液(0.5N NaOH,50mM EDTA)を添加して70℃で10分間加熱した後、7.5μLの1M Tris−HCl(pH7.5)を加えることにより中和した。これらの処理を行った段階で、大腸癌ラベルターゲットと標準大腸粘膜ラベルターゲットを混合し、ここに10μgのhuman COT-1 DNA(GIBCO BRL社より購入)を添加した。この混合液にTEバッファーを加えて500μLに調整し、Microcon-30(Amicon社より購入)を用いて精製・濃縮することにより、未反応のCy5−dUTP及びCy3−dUTPなどを除去した。精製・濃縮の手順はMicrocon-30に添付のマニュアルに従った。最終的には、全容量が5μLとなるまで濃縮し、これをDNAマイクロアレイにハイブリダイズさせるラベルターゲットとした。
【0065】
実施例8
DNAマイクロアレイの前処理
DNAマイクロアレイをマスキング溶液(3gの無水コハク酸、190mLのN−メチル−2−ピロリドン及び21mLの0.2Mホウ酸ナトリウムの混合液)に5分間浸すことによりマスキングを行った後、95℃の蒸留水に3分間浸すことにより、マイクロアレイ上にプリントされているcDNAを熱変性させた。その後直ちに95%以上のエタノールに1分間浸して脱水し風乾させた。
【0066】
実施例9
ラベルターゲットとDNAマイクロアレイとのハイブリダイゼーション
実施例8のようにして調製したラベルターゲット溶液5μLに対して、2.5μLの10mg/mLのポリアデニン(Roche社より購入)、0.5μLの10%SDS溶液、3μLの20xPM溶液(0.4%BSAと1%SDSの混合液)、15μLのホルムアミド、3μLの20xSSC(3M塩化ナトリウム,0.3Mクエン酸ナトリウム,pH7.0)及び滅菌蒸留水1μLを添加し、100℃で2分間加熱した後、暗所にて約30分間室温で静置した。その後、前項に記載の方法で前処理したDNAマイクロアレイのcDNAがプリントされている部分に滴下し、24x40ミリメートルのカバーガラス(マツナミガラス工業より購入)で覆い、マイクロアレイを密閉容器に入れ、その容器ごと42℃のインキュベーターに約16時間入れておくことにより、ラベルターゲットをマイクロアレイ上のcDNAにハイブリダイズさせた。ハイブリダイゼーションの後、マイクロアレイを0.1%SDSを含む2xSSCに浸して10分間洗浄し、次に、0.1%SDSを含む0.1xSSCに浸して10分間洗浄した。さらに、0.1xSSCに浸して5分間の洗浄を2回行った後、滴を切って暗所で風乾させた。
【0067】
実施例10
マイクロアレイのスキャンとデータ解析
洗浄後風乾させたマイクロアレイを、マイクロアレイ専用共焦点レーザースキャナであるScanArray 4000(GSI Lumonics社製 )を使ってCy3とCy5の蛍光を独立にスキャンすることにより、マイクロアレイ上の各プローブにハイブリダイズした大腸癌ターゲットと標準大腸ターゲットに由来するCy3とCy5の蛍光パターンを16ビットのTiff形式のスキャン画像データとして得た。続いて、それらの画像データをマイクロアレイデータ専用解析ソフトであるQuantarrayソフトウェア(GSI Lumonics社製)を用いて解析することにより、全プローブについてのCy3とCy5の蛍光強度をテキスト形式の数値データとして得た。バックグラウンドの補正のために、cDNAがプリントされていない部分の蛍光強度値を、各プローブについての蛍光強度値から差し引いた。また、蛍光強度値が低い部分は実験誤差の影響を大きく受けるため、蛍光強度値が高い方から約3000のデータポイントを残して他のデータは棄却した。各プローブについてのCy3とCy5の蛍光強度値の比、すなわちCy3/Cy5を算出し、底が2の対数値(以下、「log(Cy3/Cy5)」と記載)に変換した。スキャンの際に起こりうるCy3とCy5の検出感度調整のずれを補正して標準化するために、各プローブについてのlog(Cy3/Cy5)値から、全log(Cy3/Cy5)値の中央値(median)を差し引くことにより標準化log(Cy3/Cy5)値を得た。
【0068】
以上の操作により、標準大腸粘膜RNAを基準としたときの、肝転移なしの症例127例分及び肝転移ありの症例51例分の大腸癌原発巣の相対的発現強度を対数化し、標準化した数値データを得ることができた。また、同様の操作によって、標準大腸粘膜RNAを基準としたときの、正常大腸粘膜サンプル12例分の数値データも得た。これらの数値データのうち、解析した203症例の大腸癌原発巣のうちの85%にあたる173症例以上についてデータが取得できており、かつ、203症例の大腸癌原発巣のデータ内での分散値(variance)が、12例の正常大腸粘膜についてのデータ内での分散値の1.1倍を超えていた合計2,069種類のプローブについてのデータのみを選択した。これらのデータ中に存在する欠損値は次の方法で補完した。すなわち、補完する欠損値を含む症例についての全データの平均値に、その欠損値を含む遺伝子の全症例についてのデータの平均値を加えた値から、全症例についての全遺伝子のデータの平均値を引いた値をもって補完した。このようにして得た数値データを以降、標準化遺伝子発現データと記載する。
【0069】
実施例11
DNAマイクロアレイデータの統計解析による大腸癌異時性肝転移予測のための高判別能遺伝子セットの決定
本項においては、DNAマイクロアレイにプリントしたプローブを指して遺伝子と呼称することがある。
本発明である、大腸癌肝転移の予測判定に利用可能な遺伝子セットを決定する上で実施された情報処理手順は、遺伝子発現データの判別分析手法に基づく手法に従った。以下、図面を参照して具体的に説明する。
以下、本発明を実施する場合の一形態を、処理手順を示すフローチャートにより、より詳細に説明する。
【0070】
図1は、本発明の実施の一形態における判別分析手法の手順を示すフローチャートである。ここでは、実施例10に記載した肝転移あり症例群と肝転移なし症例群に由来する遺伝子発現データに基づいて、両群の違いを特徴付ける遺伝子とパラメータを求めることを目的とする。それを決定することができれば、新規のサンプルにおいて、上述の両群の違いを特徴付ける遺伝子の発現データを取得し、そのデータを例えば本実施例に記載のようにロジスティック回帰式に代入することにより、その新規サンプルが肝転移あり症例群と肝転移なし症例群のどちらの群に所属するものであるか、すなわち、その新規サンプルの提供者が将来肝転移を起こすか否かを予測判定することが可能となる。
【0071】
まず、実施例10に記載の方法により得られた標準化遺伝子発現データ、標準化遺伝子発現データ中の数値のそれぞれに対応するDNAマイクロアレイ上のプローブ番号のリスト(以下、「対象遺伝子セット」と記載することがある)と症例番号のリスト(以下、「対象サンプルセット」と記載することがある)からなる標準化データマトリックスを用意した(101)。
続いて、対象遺伝子セットの中から、後述の方法により、遺伝子発現のパターンが各症例間で似通ったものを除去することにより、標準化遺伝子発現データ中の多重共線性の問題を除去した(102)。多重共線性を除去した対象遺伝子セットにおいて、後述する高判別能遺伝子の順位付け手法によって、高い判別能力を持つ順番に遺伝子を並べたリスト(高判別能遺伝子リスト)を生成し(103)、さらに、後述する総合高判別能遺伝子セット決定手法により、高い判別能力を持つ1つの遺伝子セット(総合高判別能遺伝子セット)を得た(104)。
【0072】
得られた総合高判別能遺伝子セットにつき、後述する判別能力評価手法により判別能力を評価し(105)、このセットを用いた場合の判別能力が基準値を満たす場合、すなわち後述の判別能力値が70%以上である場合(106)、得られた総合高判別能遺伝子セットを採択し(107)、引き続き、高判別能遺伝子順序より先頭の遺伝子を除き(108)、手順104に戻り、次の総合高判別能遺伝子セットを得た。総合高判別能遺伝子セットの判別能力値が70%未満である場合、その総合高判別能遺伝子セットは採用せず、処理を終了した。以上の手順によって、基準値以上の判別能力を持った、異なる遺伝子の組み合わせからなる総合高判別能遺伝子セットの組を得ることができた。
【0073】
図2は、図1における手順102の多重共線性除去の手順を示すものである。対象遺伝子セットのうち、遺伝子発現のパターンが各症例間で似通った遺伝子同士をグループ化し、グループの代表遺伝子以外の遺伝子を対象遺伝子セットから除去することにより、遺伝子発現プロファイルの多重共線性の問題を回避するための処理である。具体的には、遺伝子セットに含まれる全遺伝子の組(遺伝子対)において、各症例における標準化発現量を説明変量としたピアソンの相関係数を求め(201)、その値が0.8以上のものを相関が高い遺伝子対とした。相関が高い遺伝子対が存在する間(202)、最も多くの遺伝子対に含まれる遺伝子を代表遺伝子とし(203)、その遺伝子と遺伝子対を作る遺伝子を対象遺伝子セットから除いた(204)。この処理によって、一次的な相関の高い遺伝子対が存在しない遺伝子セットが生成された。代表遺伝子との間に多重共線性があるとして解析対象から外された遺伝子(高相関遺伝子)は、解析の過程において、代表遺伝子の代替遺伝子として用いることが可能である。また、解析によって得られる総合高判別能遺伝子セットに含まれる代表遺伝子は、高相関遺伝子によって代替可能である。
【0074】
図4は、図1における手順103における高判別能遺伝子の順位付けの手法を示すものである。この手法は、判別対象である対象サンプルをランダムに分割したサンプルセットにおいて高判別能遺伝子セットを求める処理を大量に繰り返すことにより、データに含まれるノイズに影響されず、普遍的に高判別能を持つ遺伝子のリストを得ることを可能とした処理である。また、サンプルセットのランダムな選択において、ランダムサンプリングに因らず、ランダム分割を採用することにより、各サンプルの解析に供せられる頻度を正確に一致させることを可能にしている。まず、高判別能遺伝子セットを求める処理の繰り返し回数を記憶するカウンタIを0に初期化した(401)。以下、肝転移あり症例群と肝転移なし症例群を、それぞれ便宜上S,Tと記載することがある。S,Tそれぞれをランダムに2分割し、Sa,Sb,Ta,Tbの4つのサンプル集合を得た(402)。
【0075】
後述する高判別能遺伝子セット採択手法により、Sa,Taの2つの集合を対象とした高判別能遺伝子セットを得(403)、さらに、Sb, Tbの2つの集合を対象とした高判別能遺伝子セットを得て(404)、手順403、手順404によって得られた高判別能遺伝子セットに含まれる遺伝子を蓄積した(405)。Iを1増加し(406)、Iが5,000より小さい間(407)、手順402以降を繰り返した。Iが5,000に達することで繰り返しを完了し、蓄積された遺伝子を集計して、高判別能遺伝子セットに含まれた回数の多い遺伝子より、高い判別能力を持った遺伝子であると判断して順位付けを行った(408)。表1〜3は、上述の順位付けにより得られたリストのうち、高い判別能力を持つと考えられる遺伝子、すなわち高判別能遺伝子セットに含まれた回数が多い遺伝子の上位100種類を示す。表1〜3のシリアル番号は、DNAマイクロアレイに固定したプローブ遺伝子の番号を示す。表1〜3のプローブ遺伝子名及びアクセス番号は、GenBankに記載されたものである。上記のホモロジー検索の結果、既知の遺伝子やESTに合致しなかったプローブについては、表1〜3中に記載の通り遺伝子名を未知遺伝子とし、配列番号1から13と表記した。これら未知遺伝子の塩基配列を、配列表の配列番号1から13に記載した。
【0076】
これまでに記載した経緯に基づけば、この表1〜3に含まれる遺伝子の発現情報は、大腸癌の異時性肝転移の予測判別のために有用であると考えられる。さらに、表1〜3に含まれる遺伝子の中から、より好ましい遺伝子を選択してセットとして使用することにより、好成績で大腸癌の異時性肝転移の予測判別ができると考えられる。そのための一方法として、発明者らは、前述のようにの手順104から手順108の一連の手順に従って総合高判別能遺伝子セットの組を選出した。
【0077】
図5は、図4における手順403と404において行う高判別能遺伝子セットを採択する手法の一例を示すものである。まず、空の遺伝子集合Gを用意し(501)、GとGに含まれない全ての遺伝子eの組について、対象サンプルにおける判別対象となる状態S,Tに関するロジスティック回帰を行い、AIC値が最小となる要素e’を見つけた(502)。(G+e’)のAIC値をGのAIC値と比較し(503)、(G+e’)のAIC値の方が小さな場合は要素e’を遺伝子集合Gに加え、手順502以降を繰り返した。手順503において、(G+e’)のAIC値の方が小さくない場合は、繰り返し処理を終了し、Gに含まれる遺伝子を高判別能遺伝子セットとした。
【0078】
ここで、ロジスティック回帰は、式:
【数1】
(1)
であらわされる出力関数(ロジスティック関数)を用いた回帰モデルであり、目的とする判別式は:
【数2】
(2)
で表すことができる。ここで、iはサンプル毎の系列(遺伝子)を、nは系列数(遺伝子数)を表す。
【0079】
遺伝子集合G+要素e’を説明変数とした出力が0から1の間の値を取り、肝転移なし症例の場合には0に近い値を出力し、肝転移あり症例の場合には1に近い値を出力することを期待して、ロジスティック回帰モデルの出力yを肝転移あり症例である確率と解釈、肝転移なし症例である確率を1−yと解釈するとき、計測データより得られる尤度は、確率の積である式:
【数3】
(3)
で表すことができ、尤度を最大とするパラメータを求める。実際には、計算の簡便さより、対数尤度の式:
【数4】
(4)
が最大となるパラメータをNewton-Raphson法により求めた。斯かるパラメータは、Davidon-Fletcher-Powell法により求めることもできる。
【0080】
AIC(赤池情報量規準)は、データの情報を最も有効に活かすのには,どのモデルが最適かを判断する規準であり、式:
【数5】
(5)
で表される。ここで、Nはサンプル数、Log(L)は対数尤度、pは説明変数の数(回帰変数の自由度に相当、ここでは遺伝子数)を表す。AICを用いることにより、肝転移あり症例と肝転移なし症例を区別するために、最適な遺伝子の組み合わせを判断することが可能である。
【0081】
図6は、図1における手順104の、総合高判別能遺伝子セットの決定の手順を示すものである。まず、総合高判別能遺伝子セットを求める処理の繰り返し回数を記憶するカウンタIを0に初期化した(601)。繰り返しの間に発生する最小AIC値:Aとその際の遺伝子数:Wを初期化し(602)、Iを1増加した(603)。順位付けられた遺伝子の1〜I番目を対象として、手順103におけると同様の手順により、判別対象となる2つの集合S,集合Tに対するロジスティック回帰を行い、AIC値A’を求めた(604)。A’がAよりも小さい場合、A’の値をAに、IをWに記憶し(606)、Iが100より小さい間、手順603以下を繰り返した(607)。こうして、順位付けられた遺伝子の1〜100番目の組における最小のAIC値を持つ組として、1〜W番目の遺伝子を得、これを総合高判別能遺伝子セットとして採択した(608)。
【0082】
図7は、図1における手順105において行う、総合高判別能遺伝子セットの判別能力評価の手順を示すものである。まず、処理の繰り返し回数を記憶するカウンタIを0に初期化した(701)。肝転移あり症例群と肝転移なし症例群の集合であるS,Tのそれぞれをランダムに2分割して部分集合Sa、Sc及びTa、Tcを得た(702)。2つの部分集合、SaとTaを用いて、総合高判別能遺伝子セットによって集合S,Tを判別する判別式を求め(703)、ScとTcを用いて、判別式の検証を行って結果を蓄積した(704)。すなわち、判別式は前記のロジスティック回帰により求め、その式を使ってScとTcに含まれるサンプルが、正確に判別されるかを判定した。すなわち、判定式による判定結果が各サンプルの実際の臨床情報と一致しているかどうかを判定したことになる。Iを1増加し(705)、Iが10,000より小さい間、手順702以下を繰り返した(706)。この手順702〜706までの一連の手順の繰り返しの結果、各症例についてIの繰り返し回数の分だけ、すなわちI=10,000ならば10,000回の検証判定結果が蓄積される。この10,000回の判定のうち9,500回以上の判定結果が正解であった症例、すなわち臨床情報と合致していた症例の全解析症例数に対する割合を判別能力値として求めた(707)。
【0083】
このようにして決定した、総合高判別能遺伝子セットの組と各々の判別能力値を表4から表15までに記載した。各表におけるシリアル番号、アクセス番号及び遺伝子名は、前述の通りである。また、表5及び表6に含まれるシリアル番号3017のプローブについては、図2に記載した手順により高相関遺伝子が6種類同定された。これらについては表16に遺伝子名及びGenBankにおけるアクセス番号をまとめて記載した。これら6種類のプローブは、それらの代表として解析に使用した3017番と等価なものと考えてよいので、表5及び表6に挙げた遺伝子セットのうちの3017は、表16に挙げた6種類のいずれとでも置換することが可能である。
従って、表4から表15までに開示した総合高判別能遺伝子セットの各々、及び、表5と表6の中のシリアル番号3017の遺伝子を表16に含まれる遺伝子のいずれかと置換して生成される総合高判別能遺伝子セットの各々の発現情報は大腸癌の肝転移予測に有効に利用され得る。
【0084】
さらに、表4から表15までに開示した総合高判別能遺伝子セットの各々は、前述の判別能力値70%という基準値を上回る精度で肝転移を予測するために必要な、最小限の数の遺伝子を含むものであり、他のいくつかの遺伝子を加えて新たな遺伝子セットを生成し、それを用いて肝転移予測に利用することも可能である。それを証明する例として、表4,表5及び表6に示した総合高判別能遺伝子セットのそれぞれに、いくつかの遺伝子を加えて生成した新たな遺伝子セットと、それらの判別能力値を表17,表18及び表19に示した。表17,表18及び表19の遺伝子セットの判別能力値はいずれも70%を上回っていることから、本願発明で開示した総合高判別能遺伝子セットの各々と同様に、肝転移予測に利用可能である。
【0085】
【表17】
【0086】
【表18】
【0087】
【表19】
【0088】
実施例12
総合高判別能遺伝子セットのDNAクラスタリングへの適用
実施例11で解析した178症例の中から、20例の肝転移あり症例と20例の肝転移なし症例を無作為に選出し、それらの標準化遺伝子発現データの中から、表4に記載した6種の遺伝子の遺伝子発現データを抜き出し、各症例の遺伝子発現データ間の類似度を計る距離尺度としてユークリッド平方距離を用い、クラスタリングのアルゴリズムとしてウォード法を採用してクラスタリングを行った。実際にクラスタリングを行うためには、市販のソフトウェアであるGenExplore(Applied Maths BVBA社)を使用し、症例方向と遺伝子方向の二方向のクラスタリングを行った。すなわち、症例毎のクラスタリングを行ったうえで、さらに遺伝子毎にクラスタリングを行った。その結果、図8に示すように、肝転移あり症例と肝転移なし症例を完全に分離することができた。さらに、表4に記載した6遺伝子に他の9遺伝子を加えた表17に記載の15遺伝子について、上記と同じ方法でクラスタリングを行った結果を図9に示した。図9に示したクラスタリングの細かい点は図8のものとは異なるものの、この場合も肝転移あり症例と肝転移なし症例を完全に分離することができた。最後に、前述の178症例について表17に記載の15遺伝子の発現データをクラスタリングした結果を図10に示した。このクラスタリングにより、全症例は、2つの群に分離され、第一群に含まれる症例のほとんどは肝転移あり症例である一方で、第二群に含まれる症例のほとんどは肝転移なし症例であった。
また、図8〜図10中のA及びDの領域に含まれる発現データ値はB及びCの領域に含まれる発現データ値よりも高い傾向が認められた。
【0089】
これらのことから、本願発明で開示した総合高判別能遺伝子セット、あるいは、該セットに好ましい方法で選ばれたいくつかの遺伝子を加えて生成される遺伝子セットの遺伝子発現データに基づけば、階層的クラスタリングでも肝転移あり群と肝転移なし群を分離可能であることが示された。
【0090】
【発明の効果】
本願発明によると、大腸癌の肝転移に密接に関連した遺伝子セットを選択する方法、当該方法によって選択された遺伝子セット及び大腸癌原発巣組織における当該遺伝子セットの発現情報に基づく大腸癌の肝転移の予測方法が提供される。本願発明の方法に従えば、大腸癌原発巣組織の当該遺伝子セットの遺伝子発現情報をロジスティック回帰式で解析することにより、良好な肝転移予測成績を得ることができる。したがって、大腸癌原発巣切除手術の時点において肝転移を予測することが可能である。
【0091】
本願発明の遺伝子セットは、他の統計解析方法、例えば、階層的クラスタリン及びニューラルネットワーク等に利用できるので、方法の如何を問わず、大腸癌の肝転移予測に普遍的に有効である。
肝転移の予測によって症例に応じた、よりよい治療方針の選択が可能であり、また医療経済効果も期待できる。例えば、異時性肝転移の可能性の高い症例に対しては予防肝動注などの積極的な治療を施行することによって予後の改善が期待できる。また、異時性肝転移の可能性の低い症例に対しては抗癌剤投与を回避し、不必要な副作用による患者の苦痛を軽減することができる。
【0092】
更に、本願発明の遺伝子セットは、肝転移の原因として機能する遺伝子である可能性が高く、これらの遺伝子及びその発現産物を標的とする薬剤を開発し、肝転移を直接抑制できるようにすることも期待できる。
また、表1〜3中に記載の遺伝子のうち、遺伝子名をEST及び未知遺伝子としてその配列を開示したものは、新規な遺伝子の一部分の配列であることから、遺伝子全長をクローニングするための情報、すなわちPCRプライマーのデザインのためや、サザンハイブリダイゼーションやノーザンハイブリダイゼーション用のプローブデザインのための情報として利用可能である。更に、将来的にこれらの上流または下流部分の配列が解読されれば、本発明で開示した範囲意外の部分配列をプローブとして使用し、本発明と同様の肝転移予測診断を行うことが可能である。また、これらの遺伝子について全長をクローニングできれば、表1〜3に記載の既知の遺伝子と同様に大腸癌の肝転移抑制のための薬剤開発あるいは治療法開発の標的としての利用も期待できる。
【0093】
【配列表】
【図面の簡単な説明】
【図1】 遺伝子発現データから総合高判別能遺伝子セットの組を得るまでの、全ての手順を含むフローチャートを示す。
【図2】 図1中に示した手順102の、多重共線性の除去方法をより詳細に説明するためのフローチャートを示す。
【図3】 本願発明において、高判別能を有する遺伝子を得るために採用したブートストラップ法の概念図を示す。
【図4】 図1中に示した手順103の、高判別能遺伝子の順位付け方法をより詳細に説明するためのフローチャートを示す。
【図5】 図4中に示した手順403及び手順404の、高判別能遺伝子セットの採択方法をより詳細に説明するためのフローチャートを示す。
【図6】 図1中に示した手順104の、総合高判別能遺伝子セットの決定方法をより詳細に説明するためのフローチャートを示す。
【図7】 図1中に示した手順105の、総合高判別能力セットの判別能力評価方法をより詳細に説明するためのフローチャートを示す。
【図8】 40症例の大腸癌原発巣について、表4に記載した肝転移予測のための総合高判別能遺伝子セットの遺伝子発現データをクラスタリングした結果を示す。距離尺度としてユークリッド平方距離、クラスタリングのアルゴリズムとしてウォード法を用いた。縦方向は遺伝子のクラスタリング、横方向は症例のクラスタリングを示す。
【図9】 40症例の大腸癌原発巣について、表17に記載した肝転移予測のための総合高判別能遺伝子セットの遺伝子発現データをクラスタリングした結果を示す。クラスタリングは、図8と同じ方法で行った。
【図10】 178症例の大腸癌原発巣について、表17に記載した肝転移予測のための総合高判別能遺伝子セットの遺伝子発現データをクラスタリングした結果を示す。クラスタリングは、図8と同じ方法で行った。
Claims (10)
- 下記の配列番号又はデータベースのアクセス番号で表される遺伝子を含む、大腸癌の異時性肝転移を予測するための遺伝子セット:
(1)AI337444, M32977, Y07572, 配列番号1, U36764, AL122042;
(2)Y07572, U36764, X76132, AL122042, M32977, L13210;
(3)X76132, M32977, AL122042, U36764, 配列番号1, L13210, AL096741;
(4)AL122042, 配列番号1, U36764, M32977, L13210, M20430, 配列番号3, AB018257;
(5)配列番号1, L13210, M32977, 配列番号3, U36764, AL096741, M20430, X65923, 配列番号2;
(6)M32977, L13210, 配列番号3, M20430, X65923, AL096741, AF072711;
(7)L13210, 配列番号3, M20430, U36764, X65923, AL096741, AF072711, 配列番号2, BC013953;
(8)X65923, U36764, 配列番号3, AL096741, 配列番号2, AF072711, M20430, BC013953;
(9)AF072711, 配列番号2, AL096741, 配列番号3, U36764, M20430, BC013953;
(10)AL096741, 配列番号3, 配列番号2, U36764, 配列番号4, BC013953, AF054175;
(11)配列番号2, U36764, 配列番号3, 配列番号4, AF054175, AB018257, BC013953;
(12)配列番号4, AF054175, U36764, AB018257, BC013953, AY044845, 配列番号3。 - 下記の配列番号又はデータベースのアクセス番号で表される遺伝子からなる、大腸癌の異時性肝転移を予測するための遺伝子セット。
(1)AI337444, M32977, Y07572, 配列番号1, U36764, AL122042;
(2)Y07572, U36764, X76132, AL122042, M32977, L13210;
(3)X76132, M32977, AL122042, U36764, 配列番号1, L13210, AL096741;
(4)AL122042, 配列番号1, U36764, M32977, L13210, M20430, 配列番号3, AB018257;
(5)配列番号1, L13210, M32977, 配列番号3, U36764, AL096741, M20430, X65923, 配列番号2;
(6)M32977, L13210, 配列番号3, M20430, X65923, AL096741, AF072711;
(7)L13210, 配列番号3, M20430, U36764, X65923, AL096741, AF072711, 配列番号2, BC013953;
(8)X65923, U36764, 配列番号3, AL096741, 配列番号2, AF072711, M20430, BC013953;
(9)AF072711, 配列番号2, AL096741, 配列番号3, U36764, M20430, BC013953;
(10)AL096741, 配列番号3, 配列番号2, U36764, 配列番号4, BC013953, AF054175;
(11)配列番号2, U36764, 配列番号3, 配列番号4, AF054175, AB018257, BC013953;
(12)配列番号4, AF054175, U36764, AB018257, BC013953, AY044845, 配列番号3;
(13)AI337444, M32977, Y07572, 配列番号1, U36764, AL122042, X76132, L13210, AY044845, AB033097, AF072711, M20430, AF013759, X02469, M81934;
(14)Y07572, U36764, X76132, AL122042, M32977, L13210, 配列番号1, AY044845, AL096741, M81934, M20430, 配列番号3, 配列番号2, X65923, AF072711, AB018257, X04665;
(15)X76132, M32977, AL122042, U36764, 配列番号1, L13210, AL096741, 配列番号3, AF072711。 - データベースのアクセス番号X76132の遺伝子がデータベースのアクセス番号AB011100, M15518, U74301, M23114, AF073298, AL136635から選ばれる遺伝子 の何れかによって置換された請求項1又は2に記載の遺伝子セット。
- 遺伝子が大腸癌原発巣組織由来である請求項1ないし3のいずれかに記載の遺伝子セット。
- 大腸癌原発巣組織がヒト由来である請求項4記載の遺伝子セット。
- 請求項1ないし5のいずれかに記載の遺伝子セットの遺伝子発現情報を用いることを特徴とする大腸癌の異時性肝転移を予測する方法。
- 遺伝子発現情報が大腸癌原発巣組織摘出時における癌組織由来である請求項6に記載の方法。
- 遺伝子発現情報を統計解析処理することを特徴とする請求項6又は7に記載の方法。
- 統計解析処理が多変量解析により行われることを特徴とする請求項8に記載の方法。
- 多変量解析がSOM、SVM、ロジステック回帰式、階層的クラスタリング及びニューラルネットワークのいずれかであることを特徴とする請求項9に記載の方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002193381A JP4229647B2 (ja) | 2002-07-02 | 2002-07-02 | 大腸癌の肝転移を予測するための遺伝子セット |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002193381A JP4229647B2 (ja) | 2002-07-02 | 2002-07-02 | 大腸癌の肝転移を予測するための遺伝子セット |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004033082A JP2004033082A (ja) | 2004-02-05 |
JP4229647B2 true JP4229647B2 (ja) | 2009-02-25 |
Family
ID=31702350
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002193381A Expired - Fee Related JP4229647B2 (ja) | 2002-07-02 | 2002-07-02 | 大腸癌の肝転移を予測するための遺伝子セット |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4229647B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1774029B1 (en) * | 2004-07-16 | 2013-04-24 | DSM IP Assets B.V. | Method for detecting the risk of type 2 diabetes |
JP2007037421A (ja) * | 2005-08-01 | 2007-02-15 | Osaka Univ | 大腸癌リンパ節転移の有無を予測するための遺伝子セット |
CA2621070A1 (en) * | 2005-09-02 | 2007-03-08 | Toray Industries, Inc. | Composition and method for diagnosing kidney cancer and estimating kidney cancer patient's prognosis |
JP4870976B2 (ja) * | 2005-11-10 | 2012-02-08 | 株式会社Dnaチップ研究所 | 全血を用いた自己免疫疾患の検査方法 |
JP5548872B2 (ja) * | 2010-08-26 | 2014-07-16 | 株式会社島津製作所 | 大腸がん肝転移マーカー、及び試料中の大腸がん肝転移マーカーの分析方法 |
-
2002
- 2002-07-02 JP JP2002193381A patent/JP4229647B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2004033082A (ja) | 2004-02-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10697975B2 (en) | Methods for identifying, diagnosing, and predicting survival of lymphomas | |
DK2158332T3 (en) | PROGRAM FORECAST FOR MELANANCANCES | |
JP4435259B2 (ja) | 微量胃癌細胞の検出法 | |
JP2017525350A (ja) | 胃がん診断用のマイクロrnaバイオマーカー | |
EP2121988B1 (en) | Prostate cancer survival and recurrence | |
CN107206043A (zh) | 使用机器学习和高维转录数据在经支气管活检上诊断特发性肺纤维化的***和方法 | |
JP7005596B2 (ja) | 乳がんに関連する染色体相互作用の検出 | |
JP2005509442A (ja) | 免疫遺伝子レパートリーのプロファイリング | |
KR20190026769A (ko) | 유전자 발현 프로파일을 사용하여 폐암을 진단하기 위한 조성물 및 방법 | |
WO2007015459A1 (ja) | 大腸癌リンパ節転移の有無を予測するための遺伝子セット | |
JP4317854B2 (ja) | 微量胃癌細胞の検出法 | |
JP4229647B2 (ja) | 大腸癌の肝転移を予測するための遺伝子セット | |
JP2015107091A (ja) | 膵臓がんの検出キット及び検出方法 | |
JP2020068673A (ja) | 口腔癌判定装置、口腔癌判定方法、プログラム及び口腔癌判定キット | |
US20180051342A1 (en) | Prostate cancer survival and recurrence | |
US20220098677A1 (en) | Method for determining rcc subtypes | |
CN101457254A (zh) | 肝癌预后 | |
EP1683862B1 (en) | Microarray for assessing neuroblastoma prognosis and method of assessing neuroblastoma prognosis | |
KR20240021975A (ko) | 종양 평가를 위한 물질 및 방법 | |
JP5192632B2 (ja) | 肺癌組織中の遺伝子発現強度を識別する方法 | |
CN114424291A (zh) | 免疫组库健康评估***和方法 | |
JP2007006792A (ja) | 肺腺癌の胸膜浸潤を判別するための遺伝子セット | |
JP2007135466A (ja) | 肺腺癌の再発を予測するための遺伝子セット | |
Luong | Predicting Formalin-fixed Paraffin-embedded (FFPE) Sequencing Artefacts from Breast Cancer Exome Sequencing Data Using Machine Learning | |
EP4392781A1 (en) | Random epigenomic sampling |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050422 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080108 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080307 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080408 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081007 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20081008 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20081008 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081017 |
|
TRDD | Decision of grant or rejection written | ||
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20081008 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20081118 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20081202 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4229647 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111212 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111212 Year of fee payment: 3 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111212 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121212 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131212 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313532 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |