JP2010527577A - 検出方法 - Google Patents

検出方法 Download PDF

Info

Publication number
JP2010527577A
JP2010527577A JP2009511302A JP2009511302A JP2010527577A JP 2010527577 A JP2010527577 A JP 2010527577A JP 2009511302 A JP2009511302 A JP 2009511302A JP 2009511302 A JP2009511302 A JP 2009511302A JP 2010527577 A JP2010527577 A JP 2010527577A
Authority
JP
Japan
Prior art keywords
probe number
affymetrix probe
genes detected
detected
genes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2009511302A
Other languages
English (en)
Inventor
ラポインテ,ローレンス,シー.
ダン,ロバート
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Commonwealth Scientific and Industrial Research Organization CSIRO
Original Assignee
Commonwealth Scientific and Industrial Research Organization CSIRO
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Commonwealth Scientific and Industrial Research Organization CSIRO filed Critical Commonwealth Scientific and Industrial Research Organization CSIRO
Publication of JP2010527577A publication Critical patent/JP2010527577A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6881Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for tissue or cell typing, e.g. human leukocyte antigen [HLA] probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Pathology (AREA)
  • Microbiology (AREA)
  • Data Mining & Analysis (AREA)
  • Cell Biology (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

本発明は一般に、その発現プロファイルが大腸内の細胞若しくは細胞集団の解剖学的起源を特徴付ける核酸分子のアレイに関する。より詳細には、本発明は、その発現プロファイルが大腸内の細胞若しくは細胞集団の近位若しくは遠位起源を特徴付ける核酸分子のアレイに関する。本発明の発現プロファイルは、大腸に由来する細胞若しくは細胞集団の解剖学的起源を決定することを含むがそれには限定されない範囲の用途において有用である。さらに、正常細胞が腫瘍状態に向かう進行は表現型脱分化を特徴とすることが多いので、本発明の方法は、結腸内のそれらの解剖学的所在位置を考慮に入れて考察した場合に対象細胞によって発現されるべき発現プロファイルに比較して不正確な発現プロファイルの発現に基づく細胞異常を同定する手段をさらに提供する。従って、本発明のこの態様は、結腸直腸腫瘍などの状態の発症若しくは発症への素因などの大腸内の異常の指標となる大腸結腸細胞の存在を同定する貴重な手段を提供する。

Description

発明の分野
本発明は一般に、その発現プロファイルが大腸内の細胞若しくは細胞集団の解剖学的起源を特徴付ける核酸分子のアレイに関する。より詳細には、本発明は、その発現プロファイルが大腸内の細胞若しくは細胞集団の近位若しくは遠位起源を特徴付ける核酸分子のアレイに関する。本発明の発現プロファイルは、大腸に由来する細胞若しくは細胞集団の解剖学的起源を決定することを含むがそれには限定されない範囲の用途において有用である。さらに、腫瘍状態への正常細胞の進行は表現型脱分化を特徴とすることが多いので、本発明の方法は、結腸内のそれらの解剖学的所在位置を考慮に入れて考察した場合に対象細胞によって発現されるべき発現プロファイルに比較して不正確な発現プロファイルの発現に基づく細胞異常を同定する手段をさらに提供する。従って、本発明のこの態様は、大腸内の異常、例えば結腸直腸腫瘍などの状態の発症若しくは発症への素因の指標となる大腸結腸細胞の存在を同定する貴重な手段を提供する。
発明の背景
本明細書において著者が言及する刊行物の書誌の詳細は、本明細書の最後にアルファベット順で集められている。
本明細書における任意の先行技術に関する言及は、その先行技術がオーストラリアにおける共通の一般的知識の一部を形成することの承認若しくは提案の何らかの形態ではなく、そうであると見なすべきではない。
腺腫は、腺組織に由来する、若しくは明確に規定された腺構造を示す上皮起源の良性腫瘍である。一部の腺腫は、認識できる組織要素、例えば線維組織(線維腺腫)を示すが、他の腺腫、例えば気管支腺腫は、臨床的症候群を発症させる活性化合物を産生する。脳下垂体を含む特定の器官における腫瘍は、しばしばそれらの組織学的染色親和性、例えば、好酸性、好塩基性及び嫌色素性腺腫によって分類される。
腺腫は発癌性となることがあり、その場合は腺癌と呼ばれる。従って、腺癌は、身体のほとんどの器官の構成要素である腺構造から発生する悪性上皮腫瘍であると規定されている。この用語は、腺成長パターンを示す腫瘍にも適用される。これらの腫瘍は、それらが産生する物質によって、例えば粘液分泌性及び漿液性腺癌へ、又はそれらの細胞のパターンへの顕微鏡的配列によって、例えば乳頭状及び濾胞状腺癌へ下位分類することができる。これらの癌は、中実性又は嚢胞性(嚢胞腺癌)の場合がある。各器官は、様々な組織学的タイプを示す腫瘍を生成することがあり、例えば卵巣は粘液腺癌及び嚢胞腺癌のどちらも生じさせることがある。一般に、腺腫内の癌の全発生率は、およそ5%である。しかし、これはサイズに関連し、1cm未満の腺腫においてはまれであるが、4cmを超える絨毛病変では40〜50%であると推定される。高度の形成異常を備える腺腫は、より高い癌の発生率を有する。散発性腺腫が発生すると、26カ月間以内に新規の腺腫が発生する可能性はおよそ30%である。
結腸直腸腺腫は、特により豊かな国々では、発生率の増加を示している腺腫のクラスを表している。腺腫の原因、及びそれから腺癌への移行については、依然として集中的研究の対象となっている。現在までに、遺伝的素因に加えて、環境因子(例えば、食生活)がこの状態の発生にある役割を果たすのではないかと推測されてきた。大多数の研究は、関連する環境因子は、高脂肪食、低繊維食及び高精製炭水化物に関連すると指摘している。
結腸腺腫は、最初は扁平である形成異常性上皮の局所的増殖である。それらは無柄性(sessile)(扁平)若しくは有茎性(penduculated)(茎を有する)いずれかの肉眼的形態によって分類される。小さな腺腫(0.5mm未満)は平滑な黄褐色の表面を示すが、有茎性腺腫は敷石状若しくは分葉状の赤褐色の表面を備える頭部を有する。無柄性腺腫はより繊細な絨毛表面を示す。有茎性腺腫は、管状若しくは線管絨毛性である可能性が高いが、無柄性病変は絨毛性である可能性が高い。無柄性腺腫は盲腸及び直腸において最も一般的であるが、すべての有茎性腺腫はS状結腸及び大腸の残りの部分の間で同等に分かれる。
腺腫は、一般には無症候性であるため、それらの早期診断及び治療を困難にする。腺腫の肉眼的形態に基づいて癌の存在の有無を予測することは技術的に不可能であるが、大きな腺腫は小さな腺腫より悪性腫瘍の高い併発率を示すと考えられる。無柄性腺腫は、同一サイズの有茎性腺腫よりも高い悪性腫瘍発生率を示す。一部の腺腫は、顕微鏡的便失血の生成を生じさせる。しかし、便潜血は非腺腫性状態の指標となる場合もあり、悪性変化の不在下では閉塞症状は一般に観察されないので、腺腫の正確な診断は、高度に侵襲性の手技、例えば生検解析の適用を行わないと困難になる。従って、腺腫の原因及び悪性腫瘍への移行を解明するだけではなくより有益な情報の得られる診断プロトコール、詳細には早期、例えば前悪性腫瘍期に腺腫及び腺癌腫の迅速でルーチン的かつ正確な診断を可能にするプロトコールを開発する持続的な必要が依然としてある。このために、結腸直腸腺癌についての研究は、近位腫瘍と遠位腫瘍との間で発生率、組織病理学及び予後が相違することを示唆してきた。
この研究方針の追求に関して、遺伝子発現プロファイリングの出現は、腸粘膜発達に関する理解の向上をもたらしてきた。例えば、腺窩基部から内腔への放射軸平衡を生成かつ維持することに関係する転写因子及び上皮細胞分化を発生させる転写因子の調節は、マイクロアレイ遺伝子発現分析の結果として現在ではより明確に理解されている(Peifer, 2002, Nature 420:274-5,277、Traber, 1999, Adv Exp Med Biol 470:1-14)。同様に、胎児の腸内での発達的にプログラムされた遺伝的事象、特に小腸と大腸との上皮の局所的な相違の原因となるそれらの分子制御機構に関する理解も向上してきた(de Santa Barbara et al., 2003, Cell Mol Life Sci 60:1322-1332、Park et al., 2005, Genesis 41:1-12)。他方、大腸の長手軸に沿った近位−遠位遺伝子発現変動についてはほとんど何も分かっていない(Bates et al. 2002, Gastroenterology 122:1467-1482)。結腸直腸腺癌についての疫学的研究は、近位腫瘍と遠位腫瘍との間で発生率、組織病理学及び予後が相違することへの支持を示唆している(Bonithon-Kopp and Benhamiche, 1999, Eur J Cancer Prev 8 Suppl 1:S3-12、Bufill, 1990, Ann Intern Med 113:779-788、Deng et al., 2002, Br J Cancer 86:574-579、Distler and Holt, 1997, Dig Dis 15:302-311)。そこで、位置特異的変動に関する理解は、結腸直腸癌を含む結腸直腸に沿った特徴的分布パターンを有する疾患についての貴重な洞察を提供できよう(Birkenkamp-Demtroder et al., 2005, Gut 54:374-384、Caldero et al., 1989, Virchows Arch A Pathol Anat Histopathol 415:347-356、Garcia-Hirschfeld Garcia et al., 1999, Rev Esp Enferm Dig 91:481-488)。
結腸直腸(大腸とも呼ばれる)は、臨床的便宜性のために回腸の末端領域から始まる6つの解剖学的領域、盲腸;上行結腸;横行結腸;下行結腸;S状結腸;及び直腸へ分けられることが多い。又は、これらの区間は近位及び遠位大腸を含む2つの領域モデルに大腸を分けるように分類することもできる。近位(「右」)領域は、一般には盲腸、上行結腸、及び横行結腸を含むと見なされ、他方遠位(「左」)領域は脾湾曲部、下行結腸、S状結腸湾曲部及び直腸を含んでいる。この分割線は、それらの分岐部が横行結腸に沿って3分の2であるこれらの領域の別個の胎児個体発生及びさらに各器官への別個の動脈供給によって支持される。近位大腸は胎児の中腸から発生し、上腸間膜動脈によって供給されるが、遠位大腸は胎児の後腸から形成され、下腸間膜動脈によって供給される(Yamada and Alpers, 2003, Textbook of Gastroenterology, 2 Vol. Set.)。近位−遠位差に関する包括的概観は、(Iacopetta, 2002, Int J Cancer 101:403-408)に提供されている。
本発明に通じる研究において、1パネルの遺伝子がヒト大腸の近位区間と遠位区間との間で示差的に発現することが決定されている。そこで、これにより目的の大腸由来細胞が近位起源であるのか、遠位起源であるのかを決定するための手段の開発が可能になった。このため正常大腸由来細胞若しくは組織のサンプルは、大腸内のそれらの解剖学的起源に関してルーチン的に特徴付けることができる。さらになお、大多数の疾患状態は疾患細胞の表現型プロファイル若しくは遺伝子転写における何らかの変化によって特徴付けられ、これは特に腫瘍性の素因がある、又は腫瘍性になっている細胞について当てはまるので、本発明の方法は、異常な細胞若しくは異常になる素因のある細胞を同定する便宜的手段を提供する。より詳細には、大腸の解剖学的起源が公知である細胞がその位置に特徴的ではない1個又はそれ以上の遺伝子若しくは遺伝子プロファイルを発現する場合は、その細胞は異常であると分類され、次にその異常の性質を解明するためにさらなる分析を受けさせることができる。
発明の概要
本明細書及び添付の特許請求項を通して、文脈が他のことを必要としない限り、用語「含む(comprise)」、並びに例えば「含む(comprises)」、「含んでいる(comprising)」などの変形は、表示した整数若しくは工程又は整数若しくは工程の群を含むが、任意の他の整数若しくは工程又は整数若しくは工程の群を排除しないことを意味すると理解されたい。
本明細書で使用する用語「由来する」は、特定の整数若しくは整数の群が規定された種から始まっているが、必ずしも規定された起源から直接的に得られていないと見なすべきである。さらに、本明細書で使用する「1つの(a)」、「及び(and)」及び「その(the)」の単数形には、文脈が明確に他のことを指示しない限り複数の指示対象が含まれる。
他に規定しない限り、本明細書で使用するすべての技術用語及び科学用語は、本発明が属する分野の当業者が一般に理解している意味と同一の意味を有する。
本発明の1つの態様は、個体の大腸に由来する細胞若しくは細胞集団の解剖学的起源を決定するための方法であって、前記個体由来の生物学的サンプル中において、
(i)
Affymetrixプローブ番号:218888_s_atによって検出された1個又はそれ以上の遺伝子、
Affymetrixプローブ番号:225290_atによって検出された遺伝子、
Affymetrixプローブ番号:226432_atによって検出された遺伝子、
Affymetrixプローブ番号:231576_atによって検出された遺伝子、
Affymetrixプローブ番号:235733_atによって検出された遺伝子、
Affymetrixプローブ番号:236894_atによって検出された遺伝子、
Affymetrixプローブ番号:239656_atによって検出された遺伝子、
Affymetrixプローブ番号:242059_atによって検出された遺伝子、
Affymetrixプローブ番号:242683_atによって検出された遺伝子、
AFARP1、若しくはAffymetrixプローブ番号:202234_s_atによって検出された1個又はそれ以上の遺伝子、
ANPEP、若しくはAffymetrixプローブ番号:202888_s_atによって検出された1個又はそれ以上の遺伝子、
CCL13、若しくはAffymetrixプローブ番号:206407_s_atによって検出された1個又はそれ以上の遺伝子、
CRYL1、若しくはAffymetrixプローブ番号:220753_s_atによって検出された1個又はそれ以上の遺伝子、
CYP2B6、若しくはAffymetrixプローブ番号:206754_s_atによって検出された1個又はそれ以上の遺伝子、
CYP2C18、若しくはAffymetrixプローブ番号:208126_s_atによって検出された1個又はそれ以上の遺伝子、
CYP2C9、若しくはAffymetrixプローブ番号:214421_x_at又は220017_x_atによって検出された1個又はそれ以上の遺伝子、
EPB41L3、若しくはAffymetrixプローブ番号:211776_s_atによって検出された1個又はそれ以上の遺伝子、
ETNK1、若しくはAffymetrixプローブ番号:222262_s_at若しくは224453_s_atによって検出された1個又はそれ以上の遺伝子、
FAM45A、若しくはAffymetrixプローブ番号:221804_s_at若しくは222955_s_atによって検出された1個又はそれ以上の遺伝子、
FGFR2、若しくはAffymetrixプローブ番号:203639_s_atによって検出された1個又はそれ以上の遺伝子、
GBA3、若しくはAffymetrixプローブ番号:219954_s_atによって検出された1個又はそれ以上の遺伝子、
GSPT2、若しくはAffymetrixプローブ番号:205541_s_atによって検出された1個又はそれ以上の遺伝子、
GULP1、若しくはAffymetrixプローブ番号:215913_s_atによって検出された1個又はそれ以上の遺伝子、
HOXA9、若しくはAffymetrixプローブ番号:205366_s_at若しくは214551_s_atによって検出された1個又はそれ以上の遺伝子、
HOXC6、若しくはAffymetrixプローブ番号:206858_s_atによって検出された1個又はそれ以上の遺伝子、
HOXD3、若しくはAffymetrixプローブ番号:206601_s_atによって検出された1個又はそれ以上の遺伝子、
ME2、若しくはAffymetrixプローブ番号:210153_s_atによって検出された1個又はそれ以上の遺伝子、
MESP1、若しくはAffymetrixプローブ番号:224476_s_atによって検出された1個又はそれ以上の遺伝子、
MOCS1、若しくはAffymetrixプローブ番号:213181_s_atによって検出された1個又はそれ以上の遺伝子、
MSCP、若しくはAffymetrixプローブ番号:218136_s_at若しくは221920_s_atによって検出された1個又はそれ以上の遺伝子、
NETO2、若しくはAffymetrixプローブ番号:222774_s_atによって検出された1個又はそれ以上の遺伝子、
OASL、若しくはAffymetrixプローブ番号:210757_s_atによって検出された1個又はそれ以上の遺伝子、
PITX2、若しくはAffymetrixプローブ番号:207558_s_atによって検出された1個又はそれ以上の遺伝子、
PRAP1、若しくはAffymetrixプローブ番号:243669_s_atによって検出された1個又はそれ以上の遺伝子、
SCUBE2、若しくはAffymetrixプローブ番号:219197_s_atによって検出された1個又はそれ以上の遺伝子、
SEC6L1、若しくはAffymetrixプローブ番号:225457_s_atによって検出された1個又はそれ以上の遺伝子、
SLC16A1、若しくはAffymetrixプローブ番号:202236_s_at若しくは209900_s_atによって検出された1個又はそれ以上の遺伝子、
UGT1A3、若しくはAffymetrixプローブ番号:208596_s_atによって検出された1個又はそれ以上の遺伝子、
UGT1A8、若しくはAffymetrixプローブ番号:221305_s_atによって検出された1個又はそれ以上の遺伝子;
又は
(ii)
Affymetrixプローブ番号:230105_atによって検出された遺伝子、
Affymetrixプローブ番号:230269_atによって検出された遺伝子、
Affymetrixプローブ番号:238378_atによって検出された遺伝子、
Affymetrixプローブ番号:239814_atによって検出された遺伝子、
Affymetrixプローブ番号:239994_atによって検出された遺伝子、
Affymetrixプローブ番号:240856_atによって検出された遺伝子、
Affymetrixプローブ番号:242414_atによって検出された遺伝子、
Affymetrixプローブ番号:244553_atによって検出された遺伝子、
ARF4、若しくはAffymetrixプローブ番号:201097_s_atによって検出された1個又はそれ以上の遺伝子、
BTG3、若しくはAffymetrixプローブ番号:213134_x_at若しくは205548_s_atによって検出された1個又はそれ以上の遺伝子、
CHST5、若しくはAffymetrixプローブ番号:221164_x_at又は223942_x_atによって検出された1個又はそれ以上の遺伝子、
CMAH、若しくはAffymetrixプローブ番号:205518_s_atによって検出された1個又はそれ以上の遺伝子、
CRYBA2、若しくはAffymetrixプローブ番号:220136_s_atによって検出された1個又はそれ以上の遺伝子、
CTSE、若しくはAffymetrixプローブ番号:205927_s_atによって検出された1個又はそれ以上の遺伝子、
DKFZp761N1114、若しくはAffymetrixプローブ番号:242372_s_atによって検出された1個又はそれ以上の遺伝子、
EPB41L4A、若しくはAffymetrixプローブ番号:228256_s_atによって検出された1個又はそれ以上の遺伝子、
EPHA3、若しくはAffymetrixプローブ番号:206070_s_atによって検出された1個又はそれ以上の遺伝子、
FAS、若しくはAffymetrixプローブ番号:204781_s_atによって検出された1個又はそれ以上の遺伝子、
FER1L3、若しくはAffymetrixプローブ番号:201798_s_at若しくは211864_s_atによって検出された1個又はそれ以上の遺伝子、
FLJ20152、若しくはAffymetrixプローブ番号:218532_s_at若しくは218510_x_atによって検出された1個又はそれ以上の遺伝子、
FLJ23548、若しくはAffymetrixプローブ番号:218187_s_atによって検出された1個又はそれ以上の遺伝子、
FN1、若しくはAffymetrixプローブ番号:211719_s_at若しくは210495_x_at若しくは212464_at若しくは216442_x_atによって検出された1個又はそれ以上の遺伝子、
FOXA2、若しくはAffymetrixプローブ番号:210103_s_atによって検出された1個又はそれ以上の遺伝子、
FRZB、若しくはAffymetrixプローブ番号:203698_s_atによって検出された1個又はそれ以上の遺伝子、
GDF15、若しくはAffymetrixプローブ番号:221577_x_atによって検出された1個又はそれ以上の遺伝子、
GJB3、若しくはAffymetrixプローブ番号:205490_s_atによって検出された1個又はそれ以上の遺伝子、
HOXD13、若しくはAffymetrixプローブ番号:207397_s_atによって検出された1個又はそれ以上の遺伝子、
INSM1、若しくはAffymetrixプローブ番号:206502_s_atによって検出された1個又はそれ以上の遺伝子、
MGC4170、若しくはAffymetrixプローブ番号:212959_s_atによって検出された1個又はそれ以上の遺伝子、
MLPH、若しくはAffymetrixプローブ番号:218211_s_atによって検出された1個又はそれ以上の遺伝子、
NEBL、若しくはAffymetrixプローブ番号:203962_s_atによって検出された1個又はそれ以上の遺伝子、
PLA2G2A、若しくはAffymetrixプローブ番号:203649_s_atによって検出された1個又はそれ以上の遺伝子、
PTPRO、若しくはAffymetrixプローブ番号:208121_s_atによって検出された1個又はそれ以上の遺伝子、
PYY、若しくはAffymetrixプローブ番号:207080_s_at又は211253_x_atによって検出された1個又はそれ以上の遺伝子、
SH3BP4、若しくはAffymetrixプローブ番号:222258_s_atによって検出された1個又はそれ以上の遺伝子、
SLC28A2、若しくはAffymetrixプローブ番号:207249_s_atによって検出された1個又はそれ以上の遺伝子、
SLC2A10、若しくはAffymetrixプローブ番号:221024_s_atによって検出された1個又はそれ以上の遺伝子、
SPON1、若しくはAffymetrixプローブ番号:213994_s_at若しくは209437_s_atによって検出された1個又はそれ以上の遺伝子、
STS、若しくはAffymetrixプローブ番号:203769_s_atによって検出された1個又はそれ以上の遺伝子、
TM4SF11、若しくはAffymetrixプローブ番号:204519_s_atによって検出された1個又はそれ以上の遺伝子、
TUSC3、若しくはAffymetrixプローブ番号:213432_s_at若しくは209228_x_atによって検出された1個又はそれ以上の遺伝子から選択される1個又はそれ以上の遺伝子の発現レベルを測定する工程を含み、
正常遠位大腸コントロールレベルに比較して(i)群の遺伝子の発現レベルが高い場合は近位大腸起源であることを示し、及び正常近位大腸コントロールレベルに比較して(ii)群の遺伝子の発現レベルが高い場合は遠位大腸起源であることを示す方法。
また別の態様では、個体の大腸に由来する細胞若しくは細胞集団の解剖学的起源を決定するための方法であって、前記個体由来の生物学的サンプル中において、
(i)
PITX2、若しくはAffymetrixプローブ番号:207558_s_atによって検出された1個又はそれ以上の遺伝子、
ETNK1、若しくはAffymetrixプローブ番号:222262_s_at若しくは224453_s_atによって検出された1個又はそれ以上の遺伝子、
FAM3B、
CYP2C18、若しくはAffymetrixプローブ番号:208126_s_atによって検出された1個又はそれ以上の遺伝子、
GBA3、若しくはAffymetrixプローブ番号:219954_s_atによって検出された1個又はそれ以上の遺伝子、
MEP1B、
ADRA2A、
HSD3B2、
CYP2B6、若しくはAffymetrixプローブ番号:206754_s_atによって検出された1個又はそれ以上の遺伝子、
SLC14A2、若しくはAffymetrixプローブ番号:226432_s_atによって検出された1個又はそれ以上の遺伝子、
CYP2C9、若しくはAffymetrixプローブ番号:231576_s_atによって検出された1個又はそれ以上の遺伝子、
DEFA5、
OASL、若しくはAffymetrixプローブ番号:210797_s_atによって検出された1個又はそれ以上の遺伝子、
SLC37A3、
REG1A、
MEP1B、
NR1H4;又は
(ii)
DKFZp761N1114、若しくはAffymetrixプローブ番号:242374_s_atによって検出された1個又はそれ以上の遺伝子、
PRAC、
INSL5、
HOXB13、又は
WFDC2から選択される1個又はそれ以上の遺伝子の発現レベルを測定する工程を含み、
正常遠位大腸コントロールレベルに比較して(i)群の遺伝子の発現レベルが高い場合は近位大腸起源であることを示し、及び正常近位大腸コントロールレベルに比較して(ii)群の遺伝子の発現レベルが高い場合は遠位大腸起源であることを示す方法が提供される。
また別の態様では、本発明は、個体の大腸に由来する細胞若しくは細胞集団の解剖学的起源を決定するための方法であって、
公知の大腸の近位−遠位起源に由来する細胞若しくは細胞集団における遺伝子の発現を表す発現トレーニングデータ、及び前記細胞若しくは細胞集団と前記近位−遠位起源との関連を表す近位−遠位起源トレーニングデータを含むトレーニングデータを入手する工程と;及び
大腸に由来するまた別の細胞若しくは細胞集団における遺伝子発現を表すまた別の発現データに基づいて、前記また別の細胞若しくは細胞集団の近位−遠位起源の指標となる近位−遠位起源データを生成するための分類データを生成するために、多変量分析を使用して前記トレーニングデータを処理する工程とを含む方法を提供する。
本発明は、個体の大腸に由来する細胞若しくは細胞集団の解剖学的起源を決定するための検出方法であって、
公知の少なくとも1つの大腸の近位−遠位起源に由来する細胞若しくは細胞集団における遺伝子発現を表す第1発現データを入手する工程と;
前記細胞若しくは細胞集団の第1発現データと近位−遠位起源との関連を表す多変量モデルデータを生成するために多変量分析を用いて前記第1発現データを処理する工程と;
個体の大腸に由来する細胞若しくは細胞集団における遺伝子発現を表す第2発現データを入手する工程と;
前記細胞若しくは細胞集団の近位−遠位起源を表す近位−遠位起源データを生成するために前記第2発現データ及び前記多変量モデルデータを処理する工程とを含む方法をさらに提供する。
好ましくは、第1発現データを入手する工程は、前記第1発現データがそれのサブセットである第3発現データを入手する工程を含んでおり、そして本方法は、前記大腸の近位−遠位軸に沿って、単独若しくは組み合わせてのいずれかで、示差的に発現した1サブセットの遺伝子に対応する第3発現データのサブセットを選択するために前記第3発現データを処理する工程を含んでおり、選択されたサブセットは前記第1発現データである。
本発明は、個体の大腸に由来する細胞若しくは細胞集団の解剖学的起源を決定するための方法であって、
大腸に由来する公知の大腸の近位−遠位起源に由来する細胞若しくは細胞集団における遺伝子発現を表す第1発現データを入手する工程と;
少なくとも1つの第2細胞若しくは細胞集団の近位−遠位起源を表す近位−遠位起源データを生成するために、大腸の前記少なくとも1つの第2細胞若しくは細胞集団における前記遺伝子の発現を表す第2発現データを処理するための分類データを生成するためにカーネル法を用いて前記第1発現データを処理する工程とを含む方法をさらに提供する。
本発明は、個体の大腸に由来する細胞若しくは細胞集団の解剖学的起源を決定するための検出方法であって、
大腸に由来する公知の大腸の近位−遠位起源に由来する細胞若しくは細胞集団における遺伝子発現を表す第1発現データを入手する工程と;
前記遺伝子の発現の少なくとも1つの線形組み合わせに対応する主成分データを生成するために主成分分析を用いて前記第1発現データを処理する工程であって、前記主成分データは前記細胞若しくは細胞集団の近位−遠位起源の少なくとも1つを示す工程とを含む方法をさらに提供する。
本発明は、個体の大腸に由来する細胞若しくは細胞集団の解剖学的起源を決定するための方法であって、
公知の少なくとも1つの大腸の近位−遠位起源に由来する細胞若しくは細胞集団における遺伝子の発現を表す発現データを入手する工程と;及び
前記細胞若しくは細胞集団の近位−遠位起源の少なくとも1つを示す正準変量データを生成するために、正準変量分析を用いて前記発現データを処理する工程とを含む方法をさらに提供する。
本発明は、個体の大腸に由来する細胞若しくは細胞集団の解剖学的起源を決定するための方法であって、
公知の少なくとも1つの大腸の近位−遠位起源に由来する細胞若しくは細胞集団における遺伝子の発現を表す発現トレーニングデータ、及び前記細胞若しくは細胞集団と前記近位−遠位起源との関連を表す近位−遠位起源トレーニングデータを含むトレーニングデータを入手する工程と;
前記遺伝子の発現レベルの線形若しくは非線形組み合わせを表す分類データを生成するために前記トレーニングデータを処理する工程であって、前記分類データは、大腸から採取されたまた別の細胞若しくは細胞亜集団における前記遺伝子の発現を表すまた別の発現データに基づいて、前記また別の細胞若しくは細胞亜集団の近位−遠位起源を示すまた別の近位−遠位起源データを生成するために適合させられる工程とを含む方法をさらに提供する。
本発明は、上記の方法のいずれか1つを実行するための成分を有する検出システムをさらに提供する。
本発明は、上記の方法のいずれか1つを実行するためのそこに保存されたプログラム取扱説明書を有するコンピュータ可読記憶媒体をさらに提供する。
本発明は、
少なくとも1つの大腸に由来する細胞若しくは細胞集団における遺伝子の発現を表す発現トレーニングデータ、及び前記細胞若しくは細胞集団と前記近位−遠位起源との関連を表す近位−遠位起源トレーニングデータを含むトレーニングデータを入手するための手段と;
前記遺伝子の発現レベルの線形若しくは非線形組み合わせを表す分類データを生成するために前記トレーニングデータを処理するための手段であって、前記分類データは、大腸から採取されたまた別の細胞若しくは細胞集団における前記遺伝子の発現を表すまた別の発現データに基づいて、前記また別の細胞若しくは細胞集団の近位−遠位起源を示す近位−遠位起源データを生成するために適合させられる手段とを含む検出システムをさらに提供する。
また別の態様では、大腸における細胞異常又は細胞異常を特徴とする状態の発症又は発症に対する素因を決定するための方法であって、上記に記載した方法の1つに従って、大腸における公知の近位若しくは遠位起源に由来する生物学的サンプルの近位−遠位遺伝子発現プロファイルを決定する工程を含み、正常近位−遠位大腸遺伝子発現プロファイルと一致しない遺伝子発現プロファイルの検出は前記プロファイルを発現する細胞若しくは細胞集団の異常の指標となる方法が提供される。
本発明の関連する態様は、核酸アレイであって、そのアレイが複数の、
(i)上述した位置マーカー遺伝子のいずれか1つに対応するヌクレオチド配列若しくはそれと少なくとも80%の同一性を示す配列を含む核酸分子又は前記核酸分子の官能的誘導体、フラグメント、変異体若しくはホモログ;又は
(ii)42℃の低ストリンジェンシー条件下で(i)の配列のいずれか1つ又はそれ以上にハイブリダイズすることのできるヌクレオチド配列を含む核酸分子、又は前記核酸分子の官能的誘導体、フラグメント、変異体若しくはホモログ;
(iii)42℃の低ストリンジェンシー条件下で(i)の配列のいずれか1つ又はそれ以上にハイブリダイズすることのできるヌクレオチド配列を含む核酸プローブ若しくはオリゴヌクレオチド、又は前記核酸分子の官能的誘導体、フラグメント、変異体若しくはホモログ;
(iv)(i)若しくは(ii)の核酸分子によってコードされたタンパク質、又は誘導体、フラグメント、変異体若しくはホモログを含み、
前記核酸の発現のレベルは、大腸に由来する細胞若しくは細胞亜集団の近位−遠位起源を示す核酸アレイを提供する。
近位領域と遠位領域との間の分割線が移動した場合の示差プローブセットの数を比較したグラフ表示である。 近位及び遠位大腸において上昇した転写産物の相対数のグラフ表示である。 2遺伝子モデルの典型的な例のグラフ表示である。 結腸直腸に沿って段階的変化を示す転写産物の発現増加の相対方向のグラフ表示である。 5セグメントモデル挙動を示す遺伝子のグラフ表示である。 図6a:もしあれば小さな構造を解明する、「ディスカバリ用」(Discover)データセットの全44,928プローブセットへ主成分分析(PCA)を適用することによって生成された第1及び第2主成分の典型的な例のグラフ表示である。図6b:大腸の近位及び遠位部分に対応する2つのクラスを解明する、盲腸及び直腸(即ち、大腸の最近位端及び最遠位端)から組織サンプル中で各々示差的に発現する1サブセットの115プローブセットへPCAを適用することによって生成された第1及び第2主成分のグラフである。 図7A:大腸の近位−遠位軸に沿った組織の位置の関数としての図6Aの第1主成分のグラフである。図7B:大腸の近位−遠位軸に沿った組織の位置の関数としての図6Bの第1主成分のグラフである。 図8A:プロファイル分析によって生成された第1及び第2正準変量のグラフである。図8B:大腸の近位−遠位軸に沿った組織の位置の関数としての図8Aの第1正準変量のグラフである。 各サブセット内の遺伝子の数の関数としての各サブセットの遺伝子から生成されたサポートベクターのクロスバリデーション誤差推定のグラフである。 検出システムの好ましい実施形態のブロック図である。 検出システムによって実行される検出方法の好ましい実施形態のフロー図である。
発明の詳細な説明
本発明は、一部には近位起源対遠位起源に関して、大腸からの細胞若しくは細胞集団の解剖学的起源を特徴付ける遺伝子発現プロファイルの解明を基礎としている。この所見は、現在はその解剖学的起源に関して、大腸に由来する細胞集団を特徴付けるルーチン手段の開発を促進してきた。それでも今後、一部の細胞障害は対応する正常細胞に比較して疾患細胞の遺伝子発現プロファイルにおける変化によって特徴付けられるので、本発明は、大腸内の公知の解剖学的位置に由来している大腸細胞を、それらがその特定位置に基づいて発現することが予測されるであろう遺伝子発現プロファイルへの何らかの変化についてルーチン的にスクリーニングする手段をさらに提供する。正確な遺伝子発現プロファイルが観察されない場合は、その細胞は異常を示しているので、その異常の詳細を診断する方法によって詳細に評価すべきである。特別には、腫瘍細胞、又はそれに対する素因のある細胞は、時々は脱分化を経験する−これは細胞の遺伝子発現表現型から余り分化していない表現型への変化によって証明されることは当業者には理解されるであろう。従って、近位若しくは遠位起源の大腸細胞に特徴的な遺伝子発現プロファイルへの何らかの変化は、大腸腫瘍、例えば腺腫若しくは腺癌の発症若しくは発症に対する素因の指標となることがある。さらに本発明によって提供されるのは、本発明の方法において使用するための核酸アレイ、例えばマイクロアレイである。
従って、本発明の1つの態様は、個体の大腸に由来する細胞若しくは細胞集団の解剖学的起源を決定するための方法であって、前記個体由来の生物学的サンプル中において、
(i)
Affymetrixプローブ番号:218888_s_atによって検出された1個又はそれ以上の遺伝子、
Affymetrixプローブ番号:225290_atによって検出された遺伝子、
Affymetrixプローブ番号:226432_atによって検出された遺伝子、
Affymetrixプローブ番号:231576_atによって検出された遺伝子、
Affymetrixプローブ番号:235733_atによって検出された遺伝子、
Affymetrixプローブ番号:236894_atによって検出された遺伝子、
Affymetrixプローブ番号:239656_atによって検出された遺伝子、
Affymetrixプローブ番号:242059_atによって検出された遺伝子、
Affymetrixプローブ番号:242683_atによって検出された遺伝子、
AFARP1、若しくはAffymetrixプローブ番号:202234_s_atによって検出された1個又はそれ以上の遺伝子、
ANPEP、若しくはAffymetrixプローブ番号:202888_s_atによって検出された1個又はそれ以上の遺伝子、
CCL13、若しくはAffymetrixプローブ番号:206407_s_atによって検出された1個又はそれ以上の遺伝子、
CRYL1、若しくはAffymetrixプローブ番号:220753_s_atによって検出された1個又はそれ以上の遺伝子、
CYP2B6、若しくはAffymetrixプローブ番号:206754_s_atによって検出された1個又はそれ以上の遺伝子、
CYP2C18、若しくはAffymetrixプローブ番号:208126_s_atによって検出された1個又はそれ以上の遺伝子、
CYP2C9、若しくはAffymetrixプローブ番号:214421_x_at若しくは220017_x_atによって検出された1個又はそれ以上の遺伝子、
EPB41L3、若しくはAffymetrixプローブ番号:211776_s_atによって検出された1個又はそれ以上の遺伝子、
ETNK1、若しくはAffymetrixプローブ番号:222262_s_at若しくは224453_s_atによって検出された1個又はそれ以上の遺伝子、
FAM45A、若しくはAffymetrixプローブ番号:221804_s_at若しくは222955_s_atによって検出された1個又はそれ以上の遺伝子、
FGFR2、若しくはAffymetrixプローブ番号:203639_s_atによって検出された1個又はそれ以上の遺伝子、
GBA3、若しくはAffymetrixプローブ番号:219954_s_atによって検出された1個又はそれ以上の遺伝子、
GSPT2、若しくはAffymetrixプローブ番号:205541_s_atによって検出された1個又はそれ以上の遺伝子、
GULP1、若しくはAffymetrixプローブ番号:215913_s_atによって検出された1個又はそれ以上の遺伝子、
HOXA9、若しくはAffymetrixプローブ番号:205366_s_at若しくは214551_s_atによって検出された1個又はそれ以上の遺伝子、
HOXC6、若しくはAffymetrixプローブ番号:206858_s_atによって検出された1個又はそれ以上の遺伝子、
HOXD3、若しくはAffymetrixプローブ番号:206601_s_atによって検出された1個又はそれ以上の遺伝子、
ME2、若しくはAffymetrixプローブ番号:210153_s_atによって検出された1個又はそれ以上の遺伝子、
MESP1、若しくはAffymetrixプローブ番号:224476_s_atによって検出された1個又はそれ以上の遺伝子、
MOCS1、若しくはAffymetrixプローブ番号:213181_s_atによって検出された1個又はそれ以上の遺伝子、
MSCP、若しくはAffymetrixプローブ番号:218136_s_at若しくは221920_s_atによって検出された1個又はそれ以上の遺伝子、
NETO2、若しくはAffymetrixプローブ番号:222774_s_atによって検出された1個又はそれ以上の遺伝子、
OASL、若しくはAffymetrixプローブ番号:210757_s_atによって検出された1個又はそれ以上の遺伝子、
PITX2、若しくはAffymetrixプローブ番号:207558_s_atによって検出された1個又はそれ以上の遺伝子、
PRAP1、若しくはAffymetrixプローブ番号:243669_s_atによって検出された1個又はそれ以上の遺伝子、
SCUBE2、若しくはAffymetrixプローブ番号:219197_s_atによって検出された1個又はそれ以上の遺伝子、
SEC6L1、若しくはAffymetrixプローブ番号:225457_s_atによって検出された1個又はそれ以上の遺伝子、
SLC16A1、若しくはAffymetrixプローブ番号:202236_s_at若しくは209900_s_atによって検出された1個又はそれ以上の遺伝子、
UGT1A3、若しくはAffymetrixプローブ番号:208596_s_atによって検出された1個又はそれ以上の遺伝子、
UGT1A8、若しくはAffymetrixプローブ番号:221305_s_atによって検出された1個又はそれ以上の遺伝子;又は
(ii)
Affymetrixプローブ番号:230105_atによって検出された遺伝子、
Affymetrixプローブ番号:230269_atによって検出された遺伝子、
Affymetrixプローブ番号:238378_atによって検出された遺伝子、
Affymetrixプローブ番号:239814_atによって検出された遺伝子、
Affymetrixプローブ番号:239994_atによって検出された遺伝子、
Affymetrixプローブ番号:240856_atによって検出された遺伝子、
Affymetrixプローブ番号:242414_atによって検出された遺伝子、
Affymetrixプローブ番号:244553_atによって検出された遺伝子、
ARF4、若しくはAffymetrixプローブ番号:201097_s_atによって検出された1個又はそれ以上の遺伝子、
BTG3、若しくはAffymetrixプローブ番号:213134_x_at若しくは205548_s_atによって検出された1個又はそれ以上の遺伝子、
CHST5、若しくはAffymetrixプローブ番号:221164_x_at若しくは223942_x_atによって検出された1個又はそれ以上の遺伝子、
CMAH、若しくはAffymetrixプローブ番号:205518_s_atによって検出された1個又はそれ以上の遺伝子、
CRYBA2、若しくはAffymetrixプローブ番号:220136_s_atによって検出された1個又はそれ以上の遺伝子、
CTSE、若しくはAffymetrixプローブ番号:205927_s_atによって検出された1個又はそれ以上の遺伝子、
DKFZp761N1114、若しくはAffymetrixプローブ番号:242372_s_atによって検出された1個又はそれ以上の遺伝子、
EPB41L4A、若しくはAffymetrixプローブ番号:228256_s_atによって検出された1個又はそれ以上の遺伝子、
EPHA3、若しくはAffymetrixプローブ番号:206070_s_atによって検出された1個又はそれ以上の遺伝子、
FAS、若しくはAffymetrixプローブ番号:204781_s_atによって検出された1個又はそれ以上の遺伝子、
FER1L3、若しくはAffymetrixプローブ番号:201798_s_at若しくは211864_s_atによって検出された1個又はそれ以上の遺伝子、
FLJ20152、若しくはAffymetrixプローブ番号:218532_s_at若しくは218510_x_atによって検出された1個又はそれ以上の遺伝子、
FLJ23548、若しくはAffymetrixプローブ番号:218187_s_atによって検出された1個又はそれ以上の遺伝子、
FN1、若しくはAffymetrixプローブ番号:211719_s_at若しくは210495_x_at若しくは212464_at若しくは216442_x_atによって検出された1個又はそれ以上の遺伝子、
FOXA2、若しくはAffymetrixプローブ番号:210103_s_atによって検出された1個又はそれ以上の遺伝子、
FRZB、若しくはAffymetrixプローブ番号:203698_s_atによって検出された1個又はそれ以上の遺伝子、
GDF15、若しくはAffymetrixプローブ番号:221577_x_atによって検出された1個又はそれ以上の遺伝子、
GJB3、若しくはAffymetrixプローブ番号:205490_s_atによって検出された1個又はそれ以上の遺伝子、
HOXD13、若しくはAffymetrixプローブ番号:207397_s_atによって検出された1個又はそれ以上の遺伝子、
INSM1、若しくはAffymetrixプローブ番号:206502_s_atによって検出された1個又はそれ以上の遺伝子、
MGC4170、若しくはAffymetrixプローブ番号:212959_s_atによって検出された1個又はそれ以上の遺伝子、
MLPH、若しくはAffymetrixプローブ番号:218211_s_atによって検出された1個又はそれ以上の遺伝子、
NEBL、若しくはAffymetrixプローブ番号:203962_s_atによって検出された1個又はそれ以上の遺伝子、
PLA2G2A、若しくはAffymetrixプローブ番号:203649_s_atによって検出された1個又はそれ以上の遺伝子、
PTPRO、若しくはAffymetrixプローブ番号:208121_s_atによって検出された1個又はそれ以上の遺伝子、
PYY、若しくはAffymetrixプローブ番号:207080_s_at若しくは211253_x_atによって検出された1個又はそれ以上の遺伝子、
SH3BP4、若しくはAffymetrixプローブ番号:222258_s_atによって検出された1個又はそれ以上の遺伝子、
SLC28A2、若しくはAffymetrixプローブ番号:207249_s_atによって検出された1個又はそれ以上の遺伝子、
SLC2A10、若しくはAffymetrixプローブ番号:221024_s_atによって検出された1個又はそれ以上の遺伝子、
SPON1、若しくはAffymetrixプローブ番号:213994_s_at若しくは209437_s_atによって検出された1個又はそれ以上の遺伝子、
STS、若しくはAffymetrixプローブ番号:203769_s_atによって検出された1個又はそれ以上の遺伝子、
TM4SF11、若しくはAffymetrixプローブ番号:204519_s_atによって検出された1個又はそれ以上の遺伝子、
TUSC3、若しくはAffymetrixプローブ番号:213432_s_at若しくは209228_x_atによって検出された1個又はそれ以上の遺伝子から選択される1個又はそれ以上の遺伝子の発現レベルを測定する工程を含み、
正常遠位大腸コントロールレベルに比較して(i)群の遺伝子の発現レベルが高い場合は近位大腸起源であることを示し、及び正常近位大腸コントロールレベルに比較して(ii)群の遺伝子の発現レベルが高い場合は遠位大腸起源であることを示す方法に向けられる。
上記に詳述したように、本発明の方法は、大腸内の細胞の遠位対近位位置が現在ではこれらの位置の各々の細胞に固有である遺伝子発現プロファイルによって究明できるという決定に基礎を置いている。従って、「大腸に由来する」細胞若しくは細胞集団の「解剖学的起源」若しくは「解剖学的位置」を決定するとの言及は、問題の細胞が大腸の遠位領域又は大腸の近位領域を起源とするかどうかを決定することについての言及であると理解されたい。これに加えて、「起源」若しくは「位置」は、細胞が大腸から採取された時点の直前、又はその細胞が大腸から自然に剥離した場所(例、それが剥がれ落ちて便サンプル中で見いだされる場所)で細胞が大腸から離れる直前の時点のいずれかのその細胞若しくは調査中の細胞の位置を意味する。本発明を任意の1つの理論若しくは作用機序に限定せずとも、大腸のそれ自体は消化機能を有していないが、しかし小腸を通過した未消化の食物から大量の水及び電解質を吸収する。定期的な間隔で、蠕動運動は直腸へ向けて脱水された内容物(便)を移動させる。臨床的便宜性のために大腸は一般に、回腸の末端領域後に始まる6つの解剖学的領域に分けられる−これらは次のとおりである。
(i)盲腸;
(ii)上行結腸;
(iii)横行結腸;
(iv)下行結腸;
(v)S状結腸;及び
(vi)直腸。
これらの区間は、近位及び遠位大腸を含む2つの領域モデルに大腸を分けて分類することもできる。近位領域は、一般には盲腸及び上行結腸を含むと理解され、他方遠位領域は脾湾曲部、下行結腸、S状結腸湾曲部及び直腸を含んでいる。この大腸の近位領域と遠位領域との分割線は、横行結腸に沿っておよそ3分の2に存在すると考えられている。この分割線は、それらの分岐部が横行結腸に沿って3分の2であるこれらの領域の別個の胎児個体発生及びさらに各器官への別個の動脈供給によって支持される。従って、横行結腸の組織は、それらの起源点に対応するこの分岐部の側に依存して近位若しくは遠位のいずれかである可能性がある。本発明の方法は必ずしも細胞がそれを起源とする近位若しくは遠位大腸の部分を示さない可能性はあるが、その組織が近位起源若しくは遠位起源のいずれであるかに関連する貴重な情報を提供することは理解されるであろう。近位大腸は胎児の中腸から発生して上腸間膜動脈によって供給されるが、遠位大腸は胎児の後腸から形成されて下腸間膜動脈によって供給される。
従って、大腸の「近位」領域は盲腸及び上行結腸を含む大腸の区間についての言及であると理解すべきであり、大腸の「遠位」領域についての言及は、脾湾曲部、下行結腸、S状結腸湾曲部及び直腸についての言及であると理解されたい。横行結腸領域は近位及び遠位の両方の領域を含んでおり、それらの相対比率は近位及び遠位組織の分岐部が存在する場所に依存するであろう。詳細には、横行結腸の組織は肝湾曲部及び脾湾曲部の間の相対間隔に依存して近位若しくは遠位領域のいずれかに由来する可能性がある。
本発明によると、上記の段落(i)及び(ii)に詳述した遺伝子が、その遺伝子を発現する細胞が大腸の近位領域若しくは大腸の遠位領域に位置するかどうかに依存してそれらの発現レベルへの示差的変化に関して変調されることが決定されている。参照の容易さのために、これらの遺伝子及びそれらのmRNA転写産物はイタリック体の文字列で表示されるが、他方それらのタンパク質発現産物は非イタリック体の文字列で表示される。これらの遺伝子は、包括的に「位置マーカー」と呼ばれる。
上記の副段落(i)及び(ii)に列挙した遺伝子の各々は、それらのコードされたタンパク質発現産物と同様に、当業者には周知であろう。結腸直腸(大腸)細胞位置のマーカーとしてのこれらの遺伝子の同定は、Affymetrix HG133A若しくはHG133B遺伝子チップを用いる示差的発現分析によって発生した。このために、各遺伝子チップは、およそ35,000個の遺伝子から転写されたRNAを検出するおよそ45,000個のプローブセットによって特徴付けられる。平均して、およそ11個のプローブ対が単一遺伝子のRNA転写産物の重複若しくは連続する領域を検出する。一般に、それからRNA転写産物がAffymetrixプローブによって同定可能な遺伝子は周知であり、特徴付けられた遺伝子である。しかし、一部のプローブが未だ規定されていないRNA転写産物を検出する限りにおいて、これらの遺伝子は「Affymetrixプローブxによって検出された1個又はそれ以上の遺伝子」と表示される。一部の場合には単一プローブによって多数の遺伝子を検出することができる。これは、さらに必要に応じて示される。しかし、これは対象遺伝子の発現レベルを検出できる方法に関しての制限であるとは意図されていないことを理解されたい。最初の例では、対象遺伝子転写産物は、Affymetrix遺伝子チップ上に存在するであろう他のプローブによって検出できることも理解されるであろう。単一プローブについての言及は、単に目的の遺伝子転写産物の識別子として含まれている。しかし転写産物を実際にスクリーニングすることによって、Affymetrixプローブが一般に向けられる末端600bp転写産物領域に向けられるだけでなく、転写産物の任意の領域に向けられるプローブを利用することができる。
このため上で列挙した遺伝子及びそれらの転写かつ翻訳された発現産物の各々についての言及は、これらの分子のすべての形態及びそれらのフラグメント、変異体若しくは変異形についての言及と理解されたい。当業者であれば理解するように、一部の遺伝子は個体間の対立遺伝子変異を示すことが公知である。従って、本発明は、本発明の診断用途に関して実際の核酸配列間の小さな遺伝的変異形が個体間に存在する可能性があるという事実にもかかわらず、同一転帰を達成するそのような変異形に及ぶと理解されたい。このため本発明は、すべてのRNA(例えば、mRNA、一次RNA転写産物、miRNA、tRNA、rRNAなど)、cDNA及び選択的スプライシング又は任意の他の変異、多型若しくは対立遺伝子変異から発生するペプチドアイソフォームに及ぶと理解されたい。さらにこれは、任意のサブユニットポリペプチド、例えばモノマー、マルチマー、融合タンパク質若しくは他の複合体として存在するかどうかにかかわらず、生成できる前駆形態についての言及を含むと理解されたい。
本発明を任意の1つの理論若しくは作用機序に限定せずとも、上述した遺伝子の各々は、遠位及び近位大腸の細胞間と同様に、単独若しくは組み合わせてのいずれかで示差的に発現し、このために任意の所与の細胞サンプルの解剖学的起源に特徴的であるが、これらの遺伝子の一部の発現は特に有意なレベルの感受性、特異性、陽性予測値及び/又は陰性予測値を示した。従って、好ましい実施形態では、これらの遺伝子の1つ又はそれ以上の発現レベルがスクリーニングして評価されるであろう。
このため本発明は、個体の大腸に由来する細胞若しくは細胞集団の解剖学的起源を決定するための方法であって、前記個体由来の生物学的サンプル中において、
(i)
PITX2、若しくはAffymetrixプローブ番号:207558_s_atによって検出された1個又はそれ以上の遺伝子、
ETNK1、若しくはAffymetrixプローブ番号:222262_s_at若しくは224453_s_atによって検出された1個又はそれ以上の遺伝子、
FAM3B、
CYP2C18、若しくはAffymetrixプローブ番号:208126_s_atによって検出された1個又はそれ以上の遺伝子、
GBA3、若しくはAffymetrixプローブ番号:219954_s_atによって検出された1個又はそれ以上の遺伝子、
MEP1B、
ADRA2A、
HSD3B2、
CYP2B6、若しくはAffymetrixプローブ番号:206754_s_atによって検出された1個又はそれ以上の遺伝子、
SLC14A2、若しくはAffymetrixプローブ番号:226432_s_atによって検出された1個又はそれ以上の遺伝子、
CYP2C9、若しくはAffymetrixプローブ番号:231576_s_atによって検出された1個又はそれ以上の遺伝子、
DEFA5、
OASL、若しくはAffymetrixプローブ番号:210797_s_atによって検出された1個又はそれ以上の遺伝子、
SLC37A3、
REG1A、
MEP1B、
NR1H4;又は
(ii)
DKFZp761N1114、若しくはAffymetrixプローブ番号:242374_s_atによって検出された1個又はそれ以上の遺伝子、
PRAC、
INSL5、
HOXB13、又は
WFDC2から選択される1個又はそれ以上の遺伝子の発現レベルを測定する工程を含み、
正常遠位大腸コントロールレベルに比較して(i)群の遺伝子の発現レベルが高い場合は近位大腸起源であることを示し、及び正常近位大腸コントロールレベルに比較して(ii)群の遺伝子の発現レベルが高い場合は遠位大腸起源であることを示す方法を提供する。
好ましくは、前記遺伝子は、ETNK1及び/又はGBA3及び/又はPRACである。
本発明の検出方法は、任意の適切な生物学的サンプル上で実行できる。このために、「生物学的サンプル」との言及は、例えば細胞物質、生体液(例、血液)、便、組織生検標本、外科標本又は動物の身体に導入されて引き続き除去された液体(例えば、腸洗浄液から回収された溶液)などであるがそれらに限定されない動物に由来する生物学的物質の任意のサンプルについての言及であると理解されたい。本発明の方法によって試験される生物学的サンプルは、直接的に試験できる、又は試験前に何らかの処理形態を必要とすることがある。例えば、生検若しくは外科的サンプルは試験前にホモジナイズ化を必要とすることがある、又は個々の遺伝子の定量的発現レベルのインサイチュー試験のために切片作製を必要とすることがある。
または、細胞サンプルは、試験前に透過処理を必要とすることがある。さらに、生物学的サンプルが液体形にはない範囲内で、(試験のためにそのような形態が必要とされる場合は)、サンプルを動員するためには試薬、例えばバッファーの添加を必要とすることがある。
位置マーカー遺伝子が生物学的サンプル中に存在する範囲内で、生物学的サンプルは直接的に試験できる、さもなければ生物学的サンプル中に存在する核酸物質の全部若しくは一部を試験の前に単離することができる。さらにまた別の例では、サンプルは、部分的に精製できる、さもなければ分析前に濃縮することができる。例えば、生物学的サンプルが極めて多様な細胞集団を含む範囲内で、特に重要な亜集団について濃縮することが望ましい場合がある。それに由来する標的細胞集団若しくは分子について、試験前に前処理する、例えば生きているウイルスの不活性化若しくはゲル上でのランは本発明の範囲内に含まれる。さらに、生物学的サンプルは新しく採取されてよい、又は試験前に(例えば凍結乾燥によって)保存されていてよい、又はさもなければ試験前に(例えば、培養を受けさせることによって)処理されてよいことも理解されたい。
本明細書に開示した方法によって試験するために最も適合するサンプルのタイプの選択は、その状況の性質に依存するであろう。好ましくは、前記サンプルは、便サンプル、腸洗浄液、外科的切除物若しくは組織生検である。
上記に詳述したように、本発明は、大腸内のその解剖学的起源に関して、大腸に由来する細胞若しくは細胞集団を特徴付けるために設計されている。従って、「細胞若しくは細胞集団」との言及は、個々の細胞若しくは細胞群についての言及と理解されたい。前記細胞群は、広汎性の細胞集団、細胞懸濁液、被嚢性の細胞集団若しくは組織の形態を取る細胞集団であってよい。
「発現」との言及は、核酸分子の転写及び/又は翻訳についての言及と理解されたい。この点で、本発明は、RNA転写産物(例えば、一次RNA、mRNA、miRNA、tRNA、rRNA)の形態を取っている位置マーカーについてのスクリーニングに関して例示される。「RNA」との言及は、RNAの任意の形態、例えば一次RNA、mRNA、miRNA、tRNA若しくはrRNAなどについての言及を含むと理解されたい。本発明を多少なりとも限定することなく、増加若しくは減少したRNA合成を導く遺伝子転写の調節は、発現産物を産生するためのこれらのRNA転写産物(例、mRNA)の一部の翻訳とも相関しているであろう。従って、本発明は、細胞若しくは細胞集団の近位若しくは遠位起源の指標としての位置マーカー発現産物の変調した発現のレベル若しくはパターンについてのスクリーニングに向けられる検出方法にもさらに及ぶ。1つの方法はmRNA転写産物及び/又は対応するタンパク質発現産物についてスクリーニングすることであるが、本発明はこれには限定されず、任意の他の形態の位置マーカー、例えば一次RNA転写産物についてのスクリーニングにも及ぶと理解されたい。任意の所与の状態に対して最も適切なスクリーニング標的を決定することは明確に当業者の技術の範囲内に含まれる。好ましくは、タンパク質発現産物は、分析のサブセットである。
「核酸分子」との言及は、デオキシリボ核酸分子及びリボ核酸分子の両方についての言及と理解されたい。このため本発明は、生物学的サンプル中のmRNAレベルについての直接的スクリーニング又は目的のmRNA集団から逆転写されている相補的cDNAについてのスクリーニングの両方に及ぶ。DNA若しくはRNAいずれかについてのスクリーニングに向けられる方法を設計することは明確に当業者の技術の範囲内に含まれる。上記で詳述したように、本発明の方法は、対象mRNAから翻訳されたタンパク質発現産物についてのスクリーニングにさらに及ぶ。
本発明の方法は、生物学的サンプルの位置マーカーの発現レベルとこれらのマーカーの正常な近位及び遠位レベルとの相関を基礎としている。「正常レベル」は、大腸内の近位起源の細胞若しくは細胞集団によって発現されたマーカーのレベル及び遠位起源の細胞若しくは細胞集団によって発現されたマーカーのレベルである。従って、本発明の検出方法に関連する2種の正常レベル値がある。これらの正常レベル値は、これらのマーカーの発現レベル若しくはパターンを変化させるであろう異常若しくは異常に対する素因を示さない大腸由来細胞の発現レベルに基づいて計算されることは理解されるであろう。
正常レベルは、試験の被験者である同一個体由来の組織を用いて決定することができる。しかし、これは関係する個体にとって極めて侵襲性である可能性があり、このため本方法は、問題の患者以外の、健常個体から入手された個別若しくは包括的結果を反映する標準的結果に比較して試験結果を分析するためにより便宜的である可能性が高いことは理解されるであろう。この後者の分析の形態は、実際に好ましい分析方法であるが、それは目的の試験サンプルである単一生物学的サンプルの収集及び分析を必要とするキットの設計を可能にするからである。近位及び遠位正常参照レベルを提供する標準的結果は、当業者には周知であろう任意の適切な手段によって計算できる。例えば、正常組織の集団は、本発明の位置マーカーの発現レベルに関して評価できるので、それに対してすべての今後の試験サンプルが分析される標準値若しくはある範囲の数値を提供する。近位及び遠位正常参照レベルは、特定のコホートの被験者から、そのコホートに由来する試験サンプルに関して使用するために決定できることもまた理解されたい。従って、特性、例えば年齢、性別、民族若しくは健康状態に関して相違するコホートに対応する多数の標準値又は範囲を決定できる。前記「正常レベル」は、離散的レベル若しくはある範囲のレベルであってよい。試験される生物学的サンプルの結果は、好ましくは近位及び遠位正常参照レベルの両方に対して評価される。上記に規定した、正常遠位レベルに比較した(i)群の遺伝子の発現における増加は、試験組織が近位起源であることを示しているが、他方上記に規定した、正常近位レベルに比較した(ii)群の遺伝子の発現における増加は、組織が遠位起源であることを示している。しかし、得られた結果が正常若しくは遠位レベルと“同一”であり、これにより試験サンプルはそれに比較して評価されている正常参照レベルサンプルと同一起源であることを示すかどうかを決定するという観点から得られる結果を分析することによって、規定された相関的工程にアプローチできることもまた理解されるであろう。
試験の対象である「個体」は任意の霊長類であってよいことを理解されたい。好ましくは、霊長類は、ヒトである。
上記に詳述したように、本発明は核酸分子の検出に関して例示されているが、対象位置マーカーの発現産物についての試験に基づく検出方法をさらに含んでいると理解されたい。本発明は、1つ又はそれ以上の生物学的サンプル中のタンパク質産物若しくは核酸物質いずれかを同定することに基づく検出方法を意味するとさらに理解されたい。しかし、位置マーカーの一部は、タンパク質発現産物をコードしない遺伝子若しくは遺伝子フラグメントに相関する可能性があることを理解されたい。従って、これが発生する範囲内では、発現産物について試験することはおそらく可能ではなく、対象マーカーは核酸発現プロファイルに基づいて評価されなければならない。
用語「タンパク質」は、ペプチド、ポリペプチド及びタンパク質を含むと理解されたい。タンパク質は、グリコシル化若しくは非グリコシル化であってよい、及び/又はタンパク質、例えばアミノ酸、脂質、炭水化物又は他のペプチド、ポリペプチド若しくはタンパク質に融合した、連結した、結合した、又はさもなければ結び付いているある範囲の他の分子を含有していてよい。本明細書での「タンパク質」との言及には、ある配列のアミノ酸を含むタンパク質、並びに他の分子、例えばアミノ酸、脂質、炭水化物、又は他のペプチド、ポリペプチド若しくはタンパク質と結び付いたタンパク質が含まれる。
本発明の位置マーカータンパク質は、2つ又はそれ以上の分子が一緒に結び付いていることを意味するマルチマー形態にあってよい。同一タンパク質分子が一緒に結び付いている場合、その複合体はホモマルチマーである。ホモマルチマーの例は、ホモダイマーである。少なくとも1つのマーカータンパク質が少なくとも1つの非マーカータンパク質と結び付いている場合は、その複合体は、ヘテロマルチマー、例えばヘテロダイマーである。
「フラグメント」との言及は、対象核酸分子の部分についての言及と理解されたい。これは特に便サンプル中の変調したRNAレベルについてのスクリーニングに関して重要であるが、それは対象RNAが腸の環境に起因して分解、さもなければフラグメント化されている可能性が高いためである。このため実際に対象RNA分子のフラグメントを検出することができ、そのフラグメントは適切に特異的なプローブを使用することによって同定される。
また別の態様では、本発明は、個体の大腸に由来する細胞若しくは細胞集団の解剖学的起源を決定するための方法であって、
公知の大腸の近位−遠位起源に由来する細胞若しくは細胞集団における遺伝子の発現を表す発現トレーニングデータ、及び前記細胞若しくは細胞集団と前記近位−遠位起源との関連を表す近位−遠位起源トレーニングデータを含むトレーニングデータを入手する工程と;
大腸に由来するまた別の細胞若しくは細胞集団の近位−遠位起源の指標となる近位−遠位起源データを生成するために前記また別の細胞若しくは細胞集団における遺伝子発現を表すまた別の発現データに基づいて分類データを生成するために、多変量分析を使用して前記トレーニングデータを処理する工程とを含む方法を提供する。
本発明は、個体の大腸に由来する細胞若しくは細胞集団の解剖学的起源を決定するための検出方法であって、
公知の少なくとも1つの大腸の近位−遠位起源に由来する細胞若しくは細胞集団における遺伝子発現を表す第1発現データを入手する工程と;
前記細胞若しくは細胞集団の選択された発現データと近位−遠位起源との関連を表す多変量モデルデータを生成するために多変量分析を用いて前記選択された発現データを処理する工程と;
個体の大腸に由来する細胞若しくは細胞集団における遺伝子発現を表す第2発現データを受け入れる工程と;
前記細胞若しくは細胞集団の近位−遠位起源を表す近位−遠位起源データを生成するために前記第2発現データ及び前記多変量モデルデータを処理する工程とを含む方法をさらに提供する。
好ましくは、第1発現データを入手する工程は、前記第1発現データがそれのサブセットである第3発現データを入手する工程を含んでおり、そして本方法は、前記大腸の近位−遠位軸に沿って、単独若しくは組み合わせてのいずれかで、示差的に発現した1サブセットの遺伝子に対応する第3発現データのサブセットを選択するために前記第3発現データを処理する工程を含んでおり、選択されたサブセットは前記第1発現データである。
好ましくは、本方法は、前記近位−遠位起源を表す前記近位−遠位起源データを生成するために前記また別の発現データ及び前記多変量分類データを処理する工程を含んでいる。
最も好ましくは、選択された発現データは、
Affymetrixプローブ番号:218888_s_atによって検出された1個又はそれ以上の遺伝子、
Affymetrixプローブ番号:225290_atによって検出された遺伝子、
Affymetrixプローブ番号:226432_atによって検出された遺伝子、
Affymetrixプローブ番号:231576_atによって検出された遺伝子、
Affymetrixプローブ番号:235733_atによって検出された遺伝子、
Affymetrixプローブ番号:236894_atによって検出された遺伝子、
Affymetrixプローブ番号:239656_atによって検出された遺伝子、
Affymetrixプローブ番号:242059_atによって検出された遺伝子、
Affymetrixプローブ番号:242683_atによって検出された遺伝子、
Affymetrixプローブ番号:230105_atによって検出された遺伝子、
Affymetrixプローブ番号:230269_atによって検出された遺伝子、
Affymetrixプローブ番号:238378_atによって検出された遺伝子、
Affymetrixプローブ番号:239814_atによって検出された遺伝子、
Affymetrixプローブ番号:239994_atによって検出された遺伝子、
Affymetrixプローブ番号:240856_atによって検出された遺伝子、
Affymetrixプローブ番号:242414_atによって検出された遺伝子、
Affymetrixプローブ番号:244553_atによって検出された遺伝子、
Affymetrixプローブ番号:217320によって検出された遺伝子、
Affymetrixプローブ番号:236141によって検出された遺伝子、
Affymetrixプローブ番号:236513によって検出された遺伝子、
Affymetrixプローブ番号:238143によって検出された遺伝子、
AFARP1、若しくはAffymetrixプローブ番号:202234_s_atによって検出された1個又はそれ以上の遺伝子、
ANPEP、若しくはAffymetrixプローブ番号:202888_s_atによって検出された1個又はそれ以上の遺伝子、
CCL13、若しくはAffymetrixプローブ番号:206407_s_atによって検出された1個又はそれ以上の遺伝子、
CRYL1、若しくはAffymetrixプローブ番号:220753_s_atによって検出された1個又はそれ以上の遺伝子、
CYP2B6、若しくはAffymetrixプローブ番号:206754_s_atによって検出された1個又はそれ以上の遺伝子、
CYP2C18、若しくはAffymetrixプローブ番号:208126_s_atによって検出された1個又はそれ以上の遺伝子、
CYP2C9、若しくはAffymetrixプローブ番号:214421_x_at若しくは220017_x_atによって検出された1個又はそれ以上の遺伝子、
EPB41L3、若しくはAffymetrixプローブ番号:211776_s_atによって検出された1個又はそれ以上の遺伝子、
ETNK1、若しくはAffymetrixプローブ番号:222262_s_at若しくは224453_s_atによって検出された1個又はそれ以上の遺伝子、
FAM45A、若しくはAffymetrixプローブ番号:221804_s_at若しくは222955_s_atによって検出された1個又はそれ以上の遺伝子、
FGFR2、若しくはAffymetrixプローブ番号:203639_s_atによって検出された1個又はそれ以上の遺伝子、
GBA3、若しくはAffymetrixプローブ番号:219954_s_atによって検出された1個又はそれ以上の遺伝子、
GSPT2、若しくはAffymetrixプローブ番号:205541_s_atによって検出された1個又はそれ以上の遺伝子、
GULP1、若しくはAffymetrixプローブ番号:215913_s_atによって検出された1個又はそれ以上の遺伝子、
HOXA9、若しくはAffymetrixプローブ番号:205366_s_at若しくは214551_s_atによって検出された1個又はそれ以上の遺伝子、
HOXC6、若しくはAffymetrixプローブ番号:206858_s_atによって検出された1個又はそれ以上の遺伝子、
HOXD3、若しくはAffymetrixプローブ番号:206601_s_atによって検出された1個又はそれ以上の遺伝子、
ME2、若しくはAffymetrixプローブ番号:210153_s_atによって検出された1個又はそれ以上の遺伝子、
MESP1、若しくはAffymetrixプローブ番号:224476_s_atによって検出された1個又はそれ以上の遺伝子、
MOCS1、若しくはAffymetrixプローブ番号:213181_s_atによって検出された1個又はそれ以上の遺伝子、
MSCP、若しくはAffymetrixプローブ番号:218136_s_at若しくは221920_s_atによって検出された1個又はそれ以上の遺伝子、
NETO2、若しくはAffymetrixプローブ番号:222774_s_atによって検出された1個又はそれ以上の遺伝子、
OASL、若しくはAffymetrixプローブ番号:210757_s_atによって検出された1個又はそれ以上の遺伝子、
PITX2、若しくはAffymetrixプローブ番号:207558_s_atによって検出された1個又はそれ以上の遺伝子、
PRAP1、若しくはAffymetrixプローブ番号:243669_s_atによって検出された1個又はそれ以上の遺伝子、
SCUBE2、若しくはAffymetrixプローブ番号:219197_s_atによって検出された1個又はそれ以上の遺伝子、
SEC6L1、若しくはAffymetrixプローブ番号:225457_s_atによって検出された1個又はそれ以上の遺伝子、
SLC16A1、若しくはAffymetrixプローブ番号:202236_s_at若しくは209900_s_atによって検出された1個又はそれ以上の遺伝子、
UGT1A3、若しくはAffymetrixプローブ番号:208596_s_atによって検出された1個又はそれ以上の遺伝子、
UGT1A8、若しくはAffymetrixプローブ番号:221305_s_atによって検出された1個又はそれ以上の遺伝子、
ARF4、若しくはAffymetrixプローブ番号:201097_s_atによって検出された1個又はそれ以上の遺伝子、
BTG3、若しくはAffymetrixプローブ番号:213134_x_at若しくは205548_s_atによって検出された1個又はそれ以上の遺伝子、
CHST5、若しくはAffymetrixプローブ番号:221164_x_at若しくは223942_x_atによって検出された1個又はそれ以上の遺伝子、
CMAH、若しくはAffymetrixプローブ番号:205518_s_atによって検出された1個又はそれ以上の遺伝子、
CRYBA2、若しくはAffymetrixプローブ番号:220136_s_atによって検出された1個又はそれ以上の遺伝子、
CTSE、若しくはAffymetrixプローブ番号:205927_s_atによって検出された1個又はそれ以上の遺伝子、
DKFZp761N1114、若しくはAffymetrixプローブ番号:242372_s_atによって検出された1個又はそれ以上の遺伝子、
EPB41L4A、若しくはAffymetrixプローブ番号:228256_s_atによって検出された1個又はそれ以上の遺伝子、
EPHA3、若しくはAffymetrixプローブ番号:206070_s_atによって検出された1個又はそれ以上の遺伝子、
FAS、若しくはAffymetrixプローブ番号:204781_s_atによって検出された1個又はそれ以上の遺伝子、
FER1L3、若しくはAffymetrixプローブ番号:201798_s_at若しくは211864_s_atによって検出された1個又はそれ以上の遺伝子、
FLJ20152、若しくはAffymetrixプローブ番号:218532_s_at若しくは218510_x_atによって検出された1個又はそれ以上の遺伝子、
FLJ23548、若しくはAffymetrixプローブ番号:218187_s_atによって検出された1個又はそれ以上の遺伝子、
FN1、若しくはAffymetrixプローブ番号:211719_s_at若しくは210495_x_at若しくは212464_at若しくは216442_x_atによって検出された1個又はそれ以上の遺伝子、
FOXA2、若しくはAffymetrixプローブ番号:210103_s_atによって検出された1個又はそれ以上の遺伝子、
FRZB、若しくはAffymetrixプローブ番号:203698_s_atによって検出された1個又はそれ以上の遺伝子、
GDF15、若しくはAffymetrixプローブ番号:221577_x_atによって検出された1個又はそれ以上の遺伝子、
GJB3、若しくはAffymetrixプローブ番号:205490_s_atによって検出された1個又はそれ以上の遺伝子、
HOXD13、若しくはAffymetrixプローブ番号:207397_s_atによって検出された1個又はそれ以上の遺伝子、
INSM1、若しくはAffymetrixプローブ番号:206502_s_atによって検出された1個又はそれ以上の遺伝子、
MGC4170、若しくはAffymetrixプローブ番号:212959_s_atによって検出された1個又はそれ以上の遺伝子、
MLPH、若しくはAffymetrixプローブ番号:218211_s_atによって検出された1個又はそれ以上の遺伝子、
NEBL、若しくはAffymetrixプローブ番号:203962_s_atによって検出された1個又はそれ以上の遺伝子、
PLA2G2A、若しくはAffymetrixプローブ番号:203649_s_atによって検出された1個又はそれ以上の遺伝子、
PTPRO、若しくはAffymetrixプローブ番号:208121_s_atによって検出された1個又はそれ以上の遺伝子、
PYY、若しくはAffymetrixプローブ番号:207080_s_at若しくは211253_x_atによって検出された1個又はそれ以上の遺伝子、
SH3BP4、若しくはAffymetrixプローブ番号:222258_s_atによって検出された1個又はそれ以上の遺伝子、
SLC28A2、若しくはAffymetrixプローブ番号:207249_s_atによって検出された1個又はそれ以上の遺伝子、
SLC2A10、若しくはAffymetrixプローブ番号:221024_s_atによって検出された1個又はそれ以上の遺伝子、
SPON1、若しくはAffymetrixプローブ番号:213994_s_at若しくは209437_s_atによって検出された1個又はそれ以上の遺伝子、
STS、若しくはAffymetrixプローブ番号:203769_s_atによって検出された1個又はそれ以上の遺伝子、
TM4SF11、若しくはAffymetrixプローブ番号:204519_s_atによって検出された1個又はそれ以上の遺伝子、
TUSC3、若しくはAffymetrixプローブ番号:213432_s_at若しくは209228_x_atによって検出された1個又はそれ以上の遺伝子、
SCD、若しくはAffymetrixプローブ番号:200832_s_atによって検出された1個又はそれ以上の遺伝子、
ABCB1、若しくはAffymetrixプローブ番号:211994_s_atによって検出された1個又はそれ以上の遺伝子、
BTBD3、若しくはAffymetrixプローブ番号:202946_s_atによって検出された1個又はそれ以上の遺伝子、
CA1、若しくはAffymetrixプローブ番号:205950_s_atによって検出された1個又はそれ以上の遺伝子、
DHRS9、若しくはAffymetrixプローブ番号:224009_x_at若しくは223952_x_atによって検出された1個又はそれ以上の遺伝子、
DKFZP564I1171、若しくはAffymetrixプローブ番号:225457_s_atによって検出された1個又はそれ以上の遺伝子、
EIF5A、若しくはAffymetrixプローブ番号:201123_s_atによって検出された1個又はそれ以上の遺伝子、
IGHD、若しくはAffymetrixプローブ番号:214973_x_atによって検出された1個又はそれ以上の遺伝子、
PCK1、若しくはAffymetrixプローブ番号:208383_s_atによって検出された1個又はそれ以上の遺伝子、
RBP4、若しくはAffymetrixプローブ番号:219140_s_atによって検出された1個又はそれ以上の遺伝子、
TRPM6、若しくはAffymetrixプローブ番号:224412_s_atによって検出された1個又はそれ以上の遺伝子、
UGT1A6、若しくはAffymetrixプローブ番号:215125_s_atによって検出された1個又はそれ以上の遺伝子から選択される遺伝子に対応する。
本発明は、個体の大腸に由来する細胞若しくは細胞集団の解剖学的起源を決定するための方法であって、
公知の少なくとも1つの大腸の近位−遠位起源に由来する細胞若しくは細胞集団における遺伝子発現を表す第1発現データを入手する工程と;及び
少なくとも1つの第2細胞若しくは細胞集団の近位−遠位起源を表す近位−遠位起源データを生成するために、大腸の前記少なくとも1つの第2細胞若しくは細胞集団における前記遺伝子の発現を表す第2発現データを処理するために、分類データを生成するためにカーネル法を用いて前記第1発現データを処理する工程とを含む方法をさらに提供する。
好ましくは、本方法は、前記位置を表す近位−遠位起源データを生成するために前記第2発現データ及び前記分類データを処理する工程を含んでいる。
好ましくは、前記カーネル法は、サポートベクターマシン(SVM)を含んでいる。
より好ましくは、前記分類データは、
Affymetrixプローブ番号:218888_s_atによって検出された1個又はそれ以上の遺伝子、
Affymetrixプローブ番号:225290_atによって検出された遺伝子、
Affymetrixプローブ番号:226432_atによって検出された遺伝子、
Affymetrixプローブ番号:231576_atによって検出された遺伝子、
Affymetrixプローブ番号:235733_atによって検出された遺伝子、
Affymetrixプローブ番号:236894_atによって検出された遺伝子、
Affymetrixプローブ番号:239656_atによって検出された遺伝子、
Affymetrixプローブ番号:242059_atによって検出された遺伝子、
Affymetrixプローブ番号:242683_atによって検出された遺伝子、
Affymetrixプローブ番号:230105_atによって検出された遺伝子、
Affymetrixプローブ番号:230269_atによって検出された遺伝子、
Affymetrixプローブ番号:238378_atによって検出された遺伝子、
Affymetrixプローブ番号:239814_atによって検出された遺伝子、
Affymetrixプローブ番号:239994_atによって検出された遺伝子、
Affymetrixプローブ番号:240856_atによって検出された遺伝子、
Affymetrixプローブ番号:242414_atによって検出された遺伝子、
Affymetrixプローブ番号:244553_atによって検出された遺伝子、
Affymetrixプローブ番号:217320によって検出された遺伝子、
Affymetrixプローブ番号:236141によって検出された遺伝子、
Affymetrixプローブ番号:236513によって検出された遺伝子、
Affymetrixプローブ番号:238143によって検出された遺伝子、
AFARP1、若しくはAffymetrixプローブ番号:202234_s_atによって検出された1個又はそれ以上の遺伝子、
ANPEP、若しくはAffymetrixプローブ番号:202888_s_atによって検出された1個又はそれ以上の遺伝子、
CCL13、若しくはAffymetrixプローブ番号:206407_s_atによって検出された1個又はそれ以上の遺伝子、
CRYL1、若しくはAffymetrixプローブ番号:220753_s_atによって検出された1個又はそれ以上の遺伝子、
CYP2B6、若しくはAffymetrixプローブ番号:206754_s_atによって検出された1個又はそれ以上の遺伝子、
CYP2C18、若しくはAffymetrixプローブ番号:208126_s_atによって検出された1個又はそれ以上の遺伝子、
CYP2C9、若しくはAffymetrixプローブ番号:214421_x_at若しくは220017_x_atによって検出された1個又はそれ以上の遺伝子、
EPB41L3、若しくはAffymetrixプローブ番号:211776_s_atによって検出された1個又はそれ以上の遺伝子、
ETNK1、若しくはAffymetrixプローブ番号:222262_s_at若しくは224453_s_atによって検出された1個又はそれ以上の遺伝子、
FAM45A、若しくはAffymetrixプローブ番号:221804_s_at若しくは222955_s_atによって検出された1個又はそれ以上の遺伝子、
FGFR2、若しくはAffymetrixプローブ番号:203639_s_atによって検出された1個又はそれ以上の遺伝子、
GBA3、若しくはAffymetrixプローブ番号:219954_s_atによって検出された1個又はそれ以上の遺伝子、
GSPT2、若しくはAffymetrixプローブ番号:205541_s_atによって検出された1個又はそれ以上の遺伝子、
GULP1、若しくはAffymetrixプローブ番号:215913_s_atによって検出された1個又はそれ以上の遺伝子、
HOXA9、若しくはAffymetrixプローブ番号:205366_s_at若しくは214551_s_atによって検出された1個又はそれ以上の遺伝子、
HOXC6、若しくはAffymetrixプローブ番号:206858_s_atによって検出された1個又はそれ以上の遺伝子、
HOXD3、若しくはAffymetrixプローブ番号:206601_s_atによって検出された1個又はそれ以上の遺伝子、
ME2、若しくはAffymetrixプローブ番号:210153_s_atによって検出された1個又はそれ以上の遺伝子、
MESP1、若しくはAffymetrixプローブ番号:224476_s_atによって検出された1個又はそれ以上の遺伝子、
MOCS1、若しくはAffymetrixプローブ番号:213181_s_atによって検出された1個又はそれ以上の遺伝子、
MSCP、若しくはAffymetrixプローブ番号:218136_s_at若しくは221920_s_atによって検出された1個又はそれ以上の遺伝子、
NETO2、若しくはAffymetrixプローブ番号:222774_s_atによって検出された1個又はそれ以上の遺伝子、
OASL、若しくはAffymetrixプローブ番号:210757_s_atによって検出された1個又はそれ以上の遺伝子、
PITX2、若しくはAffymetrixプローブ番号:207558_s_atによって検出された1個又はそれ以上の遺伝子、
PRAP1、若しくはAffymetrixプローブ番号:243669_s_atによって検出された1個又はそれ以上の遺伝子、
SCUBE2、若しくはAffymetrixプローブ番号:219197_s_atによって検出された1個又はそれ以上の遺伝子、
SEC6L1、若しくはAffymetrixプローブ番号:225457_s_atによって検出された1個又はそれ以上の遺伝子、
SLC16A1、若しくはAffymetrixプローブ番号:202236_s_at若しくは209900_s_atによって検出された1個又はそれ以上の遺伝子、
UGT1A3、若しくはAffymetrixプローブ番号:208596_s_atによって検出された1個又はそれ以上の遺伝子、
UGT1A8、若しくはAffymetrixプローブ番号:221305_s_atによって検出された1個又はそれ以上の遺伝子、
ARF4、若しくはAffymetrixプローブ番号:201097_s_atによって検出された1個又はそれ以上の遺伝子、
BTG3、若しくはAffymetrixプローブ番号:213134_x_at若しくは205548_s_atによって検出された1個又はそれ以上の遺伝子、
CHST5、若しくはAffymetrixプローブ番号:221164_x_at若しくは223942_x_atによって検出された1個又はそれ以上の遺伝子、
CMAH、若しくはAffymetrixプローブ番号:205518_s_atによって検出された1個又はそれ以上の遺伝子、
CRYBA2、若しくはAffymetrixプローブ番号:220136_s_atによって検出された1個又はそれ以上の遺伝子、
CTSE、若しくはAffymetrixプローブ番号:205927_s_atによって検出された1個又はそれ以上の遺伝子、
DKFZp761N1114、若しくはAffymetrixプローブ番号:242372_s_atによって検出された1個又はそれ以上の遺伝子、
EPB41L4A、若しくはAffymetrixプローブ番号:228256_s_atによって検出された1個又はそれ以上の遺伝子、
EPHA3、若しくはAffymetrixプローブ番号:206070_s_atによって検出された1個又はそれ以上の遺伝子、
FAS、若しくはAffymetrixプローブ番号:204781_s_atによって検出された1個又はそれ以上の遺伝子、
FER1L3、若しくはAffymetrixプローブ番号:201798_s_at若しくは211864_s_atによって検出された1個又はそれ以上の遺伝子、
FLJ20152、若しくはAffymetrixプローブ番号:218532_s_at若しくは218510_x_atによって検出された1個又はそれ以上の遺伝子、
FLJ23548、若しくはAffymetrixプローブ番号:218187_s_atによって検出された1個又はそれ以上の遺伝子、
FN1、若しくはAffymetrixプローブ番号:211719_s_at若しくは210495_x_at若しくは212464_at若しくは216442_x_atによって検出された1個又はそれ以上の遺伝子、
FOXA2、若しくはAffymetrixプローブ番号:210103_s_atによって検出された1個又はそれ以上の遺伝子、
FRZB、若しくはAffymetrixプローブ番号:203698_s_atによって検出された1個又はそれ以上の遺伝子、
GDF15、若しくはAffymetrixプローブ番号:221577_x_atによって検出された1個又はそれ以上の遺伝子、
GJB3、若しくはAffymetrixプローブ番号:205490_s_atによって検出された1個又はそれ以上の遺伝子、
HOXD13、若しくはAffymetrixプローブ番号:207397_s_atによって検出された1個又はそれ以上の遺伝子、
INSM1、若しくはAffymetrixプローブ番号:206502_s_atによって検出された1個又はそれ以上の遺伝子、
MGC4170、若しくはAffymetrixプローブ番号:212959_s_atによって検出された1個又はそれ以上の遺伝子、
MLPH、若しくはAffymetrixプローブ番号:218211_s_atによって検出された1個又はそれ以上の遺伝子、
NEBL、若しくはAffymetrixプローブ番号:203962_s_atによって検出された1個又はそれ以上の遺伝子、
PLA2G2A、若しくはAffymetrixプローブ番号:203649_s_atによって検出された1個又はそれ以上の遺伝子、
PTPRO、若しくはAffymetrixプローブ番号:208121_s_atによって検出された1個又はそれ以上の遺伝子、
PYY、若しくはAffymetrixプローブ番号:207080_s_at若しくは211253_x_atによって検出された1個又はそれ以上の遺伝子、
SH3BP4、若しくはAffymetrixプローブ番号:222258_s_atによって検出された1個又はそれ以上の遺伝子、
SLC28A2、若しくはAffymetrixプローブ番号:207249_s_atによって検出された1個又はそれ以上の遺伝子、
SLC2A10、若しくはAffymetrixプローブ番号:221024_s_atによって検出された1個又はそれ以上の遺伝子、
SPON1、若しくはAffymetrixプローブ番号:213994_s_at若しくは209437_s_atによって検出された1個又はそれ以上の遺伝子、
STS、若しくはAffymetrixプローブ番号:203769_s_atによって検出された1個又はそれ以上の遺伝子、
TM4SF11、若しくはAffymetrixプローブ番号:204519_s_atによって検出された1個又はそれ以上の遺伝子、
TUSC3、若しくはAffymetrixプローブ番号:213432_s_at若しくは209228_x_atによって検出された1個又はそれ以上の遺伝子、
SCD、若しくはAffymetrixプローブ番号:200832_s_atによって検出された1個又はそれ以上の遺伝子、
ABCB1、若しくはAffymetrixプローブ番号:211994_s_atによって検出された1個又はそれ以上の遺伝子、
BTBD3、若しくはAffymetrixプローブ番号:202946_s_atによって検出された1個又はそれ以上の遺伝子、
CA1、若しくはAffymetrixプローブ番号:205950_s_atによって検出された1個又はそれ以上の遺伝子、
DHRS9、若しくはAffymetrixプローブ番号:224009_x_at若しくは223952_x_atによって検出された1個又はそれ以上の遺伝子、
DKFZP564I1171、若しくはAffymetrixプローブ番号:225457_s_atによって検出された1個又はそれ以上の遺伝子、
EIF5A、若しくはAffymetrixプローブ番号:201123_s_atによって検出された1個又はそれ以上の遺伝子、
IGHD、若しくはAffymetrixプローブ番号:214973_x_atによって検出された1個又はそれ以上の遺伝子、
PCK1、若しくはAffymetrixプローブ番号:208383_s_atによって検出された1個又はそれ以上の遺伝子、
RBP4、若しくはAffymetrixプローブ番号:219140_s_atによって検出された1個又はそれ以上の遺伝子、
TRPM6、若しくはAffymetrixプローブ番号:224412_s_atによって検出された1個又はそれ以上の遺伝子、
UGT1A6、若しくはAffymetrixプローブ番号:215125_s_atによって検出された1個又はそれ以上の遺伝子から選択された遺伝子を表している。
さらにより好ましくは、前記分類データは、13遺伝子のサブセットを表している。
最も好ましくは、前記13遺伝子は、
PRAC、
CCL11、
FRZB、若しくはAffymetrixプローブ番号:203698_s_atによって検出された1個又はそれ以上の遺伝子、
GDF15、若しくはAffymetrixプローブ番号:221577_x_atによって検出された1個又はそれ以上の遺伝子、
CLDN8、
SEC6L1、若しくはAffymetrixプローブ番号:221577_x_atによって検出された1個又はそれ以上の遺伝子、
GBA3、若しくはAffymetrixプローブ番号:279954_s_atによって検出された1個又はそれ以上の遺伝子、
DEFA5、
SPINK5、
OSTalpha、
ANPEP、若しくはAffymetrixプローブ番号:202888_s_atによって検出された1個又はそれ以上の遺伝子、及び
MUC5である。
本発明は、個体の大腸に由来する細胞若しくは細胞集団の解剖学的起源を決定するための検出方法であって、
公知の少なくとも1つの大腸の近位−遠位起源に由来する細胞若しくは細胞集団における遺伝子発現を表す第1発現データを入手する工程と;
前記遺伝子の発現の少なくとも1つの線形組み合わせに対応する主成分データを生成するために主成分分析を用いて前記第1データを処理する工程であって、前記主成分データは前記細胞若しくは細胞集団の前記近位−遠位起源の少なくとも1つを示す工程とを含む方法をさらに提供する。
好ましくは、第1発現データを入手する前記工程は、前記第1発現データがそれのサブセットである第3発現データを入手する工程を含んでおり、そして本方法は、前記少なくとも1つの大腸の近位−遠位軸に沿って示差的に発現した1サブセットの遺伝子に対応する第3の選択された発現データのサブセットを選択するために前記第3発現データを処理する工程を含んでおり、選択されたサブセットは前記第1発現データである。
好ましくは、選択された発現データは、
Affymetrixプローブ番号:218888_s_atによって検出された1個又はそれ以上の遺伝子、
Affymetrixプローブ番号:225290_atによって検出された遺伝子、
Affymetrixプローブ番号:226432_atによって検出された遺伝子、
Affymetrixプローブ番号:231576_atによって検出された遺伝子、
Affymetrixプローブ番号:235733_atによって検出された遺伝子、
Affymetrixプローブ番号:236894_atによって検出された遺伝子、
Affymetrixプローブ番号:239656_atによって検出された遺伝子、
Affymetrixプローブ番号:242059_atによって検出された遺伝子、
Affymetrixプローブ番号:242683_atによって検出された遺伝子、
Affymetrixプローブ番号:230105_atによって検出された遺伝子、
Affymetrixプローブ番号:230269_atによって検出された遺伝子、
Affymetrixプローブ番号:238378_atによって検出された遺伝子、
Affymetrixプローブ番号:239814_atによって検出された遺伝子、
Affymetrixプローブ番号:239994_atによって検出された遺伝子、
Affymetrixプローブ番号:240856_atによって検出された遺伝子、
Affymetrixプローブ番号:242414_atによって検出された遺伝子、
Affymetrixプローブ番号:244553_atによって検出された遺伝子、
Affymetrixプローブ番号:217320によって検出された遺伝子、
Affymetrixプローブ番号:236141によって検出された遺伝子、
Affymetrixプローブ番号:236513によって検出された遺伝子、
Affymetrixプローブ番号:238143によって検出された遺伝子、
AFARP1、若しくはAffymetrixプローブ番号:202234_s_atによって検出された1個又はそれ以上の遺伝子、
ANPEP、若しくはAffymetrixプローブ番号:202888_s_atによって検出された1個又はそれ以上の遺伝子、
CCL13、若しくはAffymetrixプローブ番号:206407_s_atによって検出された1個又はそれ以上の遺伝子、
CRYL1、若しくはAffymetrixプローブ番号:220753_s_atによって検出された1個又はそれ以上の遺伝子、
CYP2B6、若しくはAffymetrixプローブ番号:206754_s_atによって検出された1個又はそれ以上の遺伝子、
CYP2C18、若しくはAffymetrixプローブ番号:208126_s_atによって検出された1個又はそれ以上の遺伝子、
CYP2C9、若しくはAffymetrixプローブ番号:214421_x_at若しくは220017_x_atによって検出された1個又はそれ以上の遺伝子、
EPB41L3、若しくはAffymetrixプローブ番号:211776_s_atによって検出された1個又はそれ以上の遺伝子、
ETNK1、若しくはAffymetrixプローブ番号:222262_s_at若しくは224453_s_atによって検出された1個又はそれ以上の遺伝子、
FAM45A、若しくはAffymetrixプローブ番号:221804_s_at若しくは222955_s_atによって検出された1個又はそれ以上の遺伝子、
FGFR2、若しくはAffymetrixプローブ番号:203639_s_atによって検出された1個又はそれ以上の遺伝子、
GBA3、若しくはAffymetrixプローブ番号:219954_s_atによって検出された1個又はそれ以上の遺伝子、
GSPT2、若しくはAffymetrixプローブ番号:205541_s_atによって検出された1個又はそれ以上の遺伝子、
GULP1、若しくはAffymetrixプローブ番号:215913_s_atによって検出された1個又はそれ以上の遺伝子、
HOXA9、若しくはAffymetrixプローブ番号:205366_s_at若しくは214551_s_atによって検出された1個又はそれ以上の遺伝子、
HOXC6、若しくはAffymetrixプローブ番号:206858_s_atによって検出された1個又はそれ以上の遺伝子、
HOXD3、若しくはAffymetrixプローブ番号:206601_s_atによって検出された1個又はそれ以上の遺伝子、
ME2、若しくはAffymetrixプローブ番号:210153_s_atによって検出された1個又はそれ以上の遺伝子、
MESP1、若しくはAffymetrixプローブ番号:224476_s_atによって検出された1個又はそれ以上の遺伝子、
MOCS1、若しくはAffymetrixプローブ番号:213181_s_atによって検出された1個又はそれ以上の遺伝子、
MSCP、若しくはAffymetrixプローブ番号:218136_s_at若しくは221920_s_atによって検出された1個又はそれ以上の遺伝子、
NETO2、若しくはAffymetrixプローブ番号:222774_s_atによって検出された1個又はそれ以上の遺伝子、
OASL、若しくはAffymetrixプローブ番号:210757_s_atによって検出された1個又はそれ以上の遺伝子、
PITX2、若しくはAffymetrixプローブ番号:207558_s_atによって検出された1個又はそれ以上の遺伝子、
PRAP1、若しくはAffymetrixプローブ番号:243669_s_atによって検出された1個又はそれ以上の遺伝子、
SCUBE2、若しくはAffymetrixプローブ番号:219197_s_atによって検出された1個又はそれ以上の遺伝子、
SEC6L1、若しくはAffymetrixプローブ番号:225457_s_atによって検出された1個又はそれ以上の遺伝子、
SLC16A1、若しくはAffymetrixプローブ番号:202236_s_at若しくは209900_s_atによって検出された1個又はそれ以上の遺伝子、
UGT1A3、若しくはAffymetrixプローブ番号:208596_s_atによって検出された1個又はそれ以上の遺伝子、
UGT1A8、若しくはAffymetrixプローブ番号:221305_s_atによって検出された1個又はそれ以上の遺伝子、
ARF4、若しくはAffymetrixプローブ番号:201097_s_atによって検出された1個又はそれ以上の遺伝子、
BTG3、若しくはAffymetrixプローブ番号:213134_x_at若しくは205548_s_atによって検出された1個又はそれ以上の遺伝子、
CHST5、若しくはAffymetrixプローブ番号:221164_x_at若しくは223942_x_atによって検出された1個又はそれ以上の遺伝子、
CMAH、若しくはAffymetrixプローブ番号:205518_s_atによって検出された1個又はそれ以上の遺伝子、
CRYBA2、若しくはAffymetrixプローブ番号:220136_s_atによって検出された1個又はそれ以上の遺伝子、
CTSE、若しくはAffymetrixプローブ番号:205927_s_atによって検出された1個又はそれ以上の遺伝子、
DKFZp761N1114、若しくはAffymetrixプローブ番号:242372_s_atによって検出された1個又はそれ以上の遺伝子、
EPB41L4A、若しくはAffymetrixプローブ番号:228256_s_atによって検出された1個又はそれ以上の遺伝子、
EPHA3、若しくはAffymetrixプローブ番号:206070_s_atによって検出された1個又はそれ以上の遺伝子、
FAS、若しくはAffymetrixプローブ番号:204781_s_atによって検出された1個又はそれ以上の遺伝子、
FER1L3、若しくはAffymetrixプローブ番号:201798_s_at若しくは211864_s_atによって検出された1個又はそれ以上の遺伝子、
FLJ20152、若しくはAffymetrixプローブ番号:218532_s_at若しくは218510_x_atによって検出された1個又はそれ以上の遺伝子、
FLJ23548、若しくはAffymetrixプローブ番号:218187_s_atによって検出された1個又はそれ以上の遺伝子、
FN1、若しくはAffymetrixプローブ番号:211719_s_at若しくは210495_x_at若しくは212464_at若しくは216442_x_atによって検出された1個又はそれ以上の遺伝子、
FOXA2、若しくはAffymetrixプローブ番号:210103_s_atによって検出された1個又はそれ以上の遺伝子、
FRZB、若しくはAffymetrixプローブ番号:203698_s_atによって検出された1個又はそれ以上の遺伝子、
GDF15、若しくはAffymetrixプローブ番号:221577_x_atによって検出された1個又はそれ以上の遺伝子、
GJB3、若しくはAffymetrixプローブ番号:205490_s_atによって検出された1個又はそれ以上の遺伝子、
HOXD13、若しくはAffymetrixプローブ番号:207397_s_atによって検出された1個又はそれ以上の遺伝子、
INSM1、若しくはAffymetrixプローブ番号:206502_s_atによって検出された1個又はそれ以上の遺伝子、
MGC4170、若しくはAffymetrixプローブ番号:212959_s_atによって検出された1個又はそれ以上の遺伝子、
MLPH、若しくはAffymetrixプローブ番号:218211_s_atによって検出された1個又はそれ以上の遺伝子、
NEBL、若しくはAffymetrixプローブ番号:203962_s_atによって検出された1個又はそれ以上の遺伝子、
PLA2G2A、若しくはAffymetrixプローブ番号:203649_s_atによって検出された1個又はそれ以上の遺伝子、
PTPRO、若しくはAffymetrixプローブ番号:208121_s_atによって検出された1個又はそれ以上の遺伝子、
PYY、若しくはAffymetrixプローブ番号:207080_s_at若しくは211253_x_atによって検出された1個又はそれ以上の遺伝子、
SH3BP4、若しくはAffymetrixプローブ番号:222258_s_atによって検出された1個又はそれ以上の遺伝子、
SLC28A2、若しくはAffymetrixプローブ番号:207249_s_atによって検出された1個又はそれ以上の遺伝子、
SLC2A10、若しくはAffymetrixプローブ番号:221024_s_atによって検出された1個又はそれ以上の遺伝子、
SPON1、若しくはAffymetrixプローブ番号:213994_s_at若しくは209437_s_atによって検出された1個又はそれ以上の遺伝子、
STS、若しくはAffymetrixプローブ番号:203769_s_atによって検出された1個又はそれ以上の遺伝子、
TM4SF11、若しくはAffymetrixプローブ番号:204519_s_atによって検出された1個又はそれ以上の遺伝子、
TUSC3、若しくはAffymetrixプローブ番号:213432_s_at若しくは209228_x_atによって検出された1個又はそれ以上の遺伝子、
SCD、若しくはAffymetrixプローブ番号:200832_s_atによって検出された1個又はそれ以上の遺伝子、
ABCB1、若しくはAffymetrixプローブ番号:211994_s_atによって検出された1個又はそれ以上の遺伝子、
BTBD3、若しくはAffymetrixプローブ番号:202946_s_atによって検出された1個又はそれ以上の遺伝子、
CA1、若しくはAffymetrixプローブ番号:205950_s_atによって検出された1個又はそれ以上の遺伝子、
DHRS9、若しくはAffymetrixプローブ番号:224009_x_at若しくは223952_x_atによって検出された1個又はそれ以上の遺伝子、
DKFZP564I1171、若しくはAffymetrixプローブ番号:225457_s_atによって検出された1個又はそれ以上の遺伝子、
EIF5A、若しくはAffymetrixプローブ番号:201123_s_atによって検出された1個又はそれ以上の遺伝子、
IGHD、若しくはAffymetrixプローブ番号:214973_x_atによって検出された1個又はそれ以上の遺伝子、
PCK1、若しくはAffymetrixプローブ番号:208383_s_atによって検出された1個又はそれ以上の遺伝子、
RBP4、若しくはAffymetrixプローブ番号:219140_s_atによって検出された1個又はそれ以上の遺伝子、
TRPM6、若しくはAffymetrixプローブ番号:224412_s_atによって検出された1個又はそれ以上の遺伝子、
UGT1A6、若しくはAffymetrixプローブ番号:215125_s_atによって検出された1個又はそれ以上の遺伝子から選択される遺伝子に対応する。
本発明は、個体の大腸に由来する細胞若しくは細胞集団の解剖学的起源を決定するための方法であって、
公知の少なくとも1つの大腸の近位−遠位起源に由来する細胞若しくは細胞集団における遺伝子発現を表す第1発現データを入手する工程と;及び
前記細胞若しくは細胞集団の近位−遠位起源の少なくとも1つを示す正準変量データを生成するために正準変量分析を用いて前記発現データを処理する工程とを含む方法をさらに提供する。
好ましくは、前記正準変量分析は、プロファイル分析を含んでいる。
好ましくは、前記サブセットの遺伝子は、
Affymetrixプローブ番号:218888_s_atによって検出された1個又はそれ以上の遺伝子、
Affymetrixプローブ番号:225290_atによって検出された遺伝子、
Affymetrixプローブ番号:226432_atによって検出された遺伝子、
Affymetrixプローブ番号:231576_atによって検出された遺伝子、
Affymetrixプローブ番号:235733_atによって検出された遺伝子、
Affymetrixプローブ番号:236894_atによって検出された遺伝子、
Affymetrixプローブ番号:239656_atによって検出された遺伝子、
Affymetrixプローブ番号:242059_atによって検出された遺伝子、
Affymetrixプローブ番号:242683_atによって検出された遺伝子、
Affymetrixプローブ番号:230105_atによって検出された遺伝子、
Affymetrixプローブ番号:230269_atによって検出された遺伝子、
Affymetrixプローブ番号:238378_atによって検出された遺伝子、
Affymetrixプローブ番号:239814_atによって検出された遺伝子、
Affymetrixプローブ番号:239994_atによって検出された遺伝子、
Affymetrixプローブ番号:240856_atによって検出された遺伝子、
Affymetrixプローブ番号:242414_atによって検出された遺伝子、
Affymetrixプローブ番号:244553_atによって検出された遺伝子、
Affymetrixプローブ番号:217320によって検出された遺伝子、
Affymetrixプローブ番号:236141によって検出された遺伝子、
Affymetrixプローブ番号:236513によって検出された遺伝子、
Affymetrixプローブ番号:238143によって検出された遺伝子、
AFARP1、若しくはAffymetrixプローブ番号:202234_s_atによって検出された1個又はそれ以上の遺伝子、
ANPEP、若しくはAffymetrixプローブ番号:202888_s_atによって検出された1個又はそれ以上の遺伝子、
CCL13、若しくはAffymetrixプローブ番号:206407_s_atによって検出された1個又はそれ以上の遺伝子、
CRYL1、若しくはAffymetrixプローブ番号:220753_s_atによって検出された1個又はそれ以上の遺伝子、
CYP2B6、若しくはAffymetrixプローブ番号:206754_s_atによって検出された1個又はそれ以上の遺伝子、
CYP2C18、若しくはAffymetrixプローブ番号:208126_s_atによって検出された1個又はそれ以上の遺伝子、
CYP2C9、若しくはAffymetrixプローブ番号:214421_x_at若しくは220017_x_atによって検出された1個又はそれ以上の遺伝子、
EPB41L3、若しくはAffymetrixプローブ番号:211776_s_atによって検出された1個又はそれ以上の遺伝子、
ETNK1、若しくはAffymetrixプローブ番号:222262_s_at若しくは224453_s_atによって検出された1個又はそれ以上の遺伝子、
FAM45A、若しくはAffymetrixプローブ番号:221804_s_at若しくは222955_s_atによって検出された1個又はそれ以上の遺伝子、
FGFR2、若しくはAffymetrixプローブ番号:203639_s_atによって検出された1個又はそれ以上の遺伝子、
GBA3、若しくはAffymetrixプローブ番号:219954_s_atによって検出された1個又はそれ以上の遺伝子、
GSPT2、若しくはAffymetrixプローブ番号:205541_s_atによって検出された1個又はそれ以上の遺伝子、
GULP1、若しくはAffymetrixプローブ番号:215913_s_atによって検出された1個又はそれ以上の遺伝子、
HOXA9、若しくはAffymetrixプローブ番号:205366_s_at若しくは214551_s_atによって検出された1個又はそれ以上の遺伝子、
HOXC6、若しくはAffymetrixプローブ番号:206858_s_atによって検出された1個又はそれ以上の遺伝子、
HOXD3、若しくはAffymetrixプローブ番号:206601_s_atによって検出された1個又はそれ以上の遺伝子、
ME2、若しくはAffymetrixプローブ番号:210153_s_atによって検出された1個又はそれ以上の遺伝子、
MESP1、若しくはAffymetrixプローブ番号:224476_s_atによって検出された1個又はそれ以上の遺伝子、
MOCS1、若しくはAffymetrixプローブ番号:213181_s_atによって検出された1個又はそれ以上の遺伝子、
MSCP、若しくはAffymetrixプローブ番号:218136_s_at若しくは221920_s_atによって検出された1個又はそれ以上の遺伝子、
NETO2、若しくはAffymetrixプローブ番号:222774_s_atによって検出された1個又はそれ以上の遺伝子、
OASL、若しくはAffymetrixプローブ番号:210757_s_atによって検出された1個又はそれ以上の遺伝子、
PITX2、若しくはAffymetrixプローブ番号:207558_s_atによって検出された1個又はそれ以上の遺伝子、
PRAP1、若しくはAffymetrixプローブ番号:243669_s_atによって検出された1個又はそれ以上の遺伝子、
SCUBE2、若しくはAffymetrixプローブ番号:219197_s_atによって検出された1個又はそれ以上の遺伝子、
SEC6L1、若しくはAffymetrixプローブ番号:225457_s_atによって検出された1個又はそれ以上の遺伝子、
SLC16A1、若しくはAffymetrixプローブ番号:202236_s_at若しくは209900_s_atによって検出された1個又はそれ以上の遺伝子、
UGT1A3、若しくはAffymetrixプローブ番号:208596_s_atによって検出された1個又はそれ以上の遺伝子、
UGT1A8、若しくはAffymetrixプローブ番号:221305_s_atによって検出された1個又はそれ以上の遺伝子、
ARF4、若しくはAffymetrixプローブ番号:201097_s_atによって検出された1個又はそれ以上の遺伝子、
BTG3、若しくはAffymetrixプローブ番号:213134_x_at若しくは205548_s_atによって検出された1個又はそれ以上の遺伝子、
CHST5、若しくはAffymetrixプローブ番号:221164_x_at若しくは223942_x_atによって検出された1個又はそれ以上の遺伝子、
CMAH、若しくはAffymetrixプローブ番号:205518_s_atによって検出された1個又はそれ以上の遺伝子、
CRYBA2、若しくはAffymetrixプローブ番号:220136_s_atによって検出された1個又はそれ以上の遺伝子、
CTSE、若しくはAffymetrixプローブ番号:205927_s_atによって検出された1個又はそれ以上の遺伝子、
DKFZp761N1114、若しくはAffymetrixプローブ番号:242372_s_atによって検出された1個又はそれ以上の遺伝子、
EPB41L4A、若しくはAffymetrixプローブ番号:228256_s_atによって検出された1個又はそれ以上の遺伝子、
EPHA3、若しくはAffymetrixプローブ番号:206070_s_atによって検出された1個又はそれ以上の遺伝子、
FAS、若しくはAffymetrixプローブ番号:204781_s_atによって検出された1個又はそれ以上の遺伝子、
FER1L3、若しくはAffymetrixプローブ番号:201798_s_at若しくは211864_s_atによって検出された1個又はそれ以上の遺伝子、
FLJ20152、若しくはAffymetrixプローブ番号:218532_s_at若しくは218510_x_atによって検出された1個又はそれ以上の遺伝子、
FLJ23548、若しくはAffymetrixプローブ番号:218187_s_atによって検出された1個又はそれ以上の遺伝子、
FN1、若しくはAffymetrixプローブ番号:211719_s_at若しくは210495_x_at若しくは212464_at若しくは216442_x_atによって検出された1個又はそれ以上の遺伝子、
FOXA2、若しくはAffymetrixプローブ番号:210103_s_atによって検出された1個又はそれ以上の遺伝子、
FRZB、若しくはAffymetrixプローブ番号:203698_s_atによって検出された1個又はそれ以上の遺伝子、
GDF15、若しくはAffymetrixプローブ番号:221577_x_atによって検出された1個又はそれ以上の遺伝子、
GJB3、若しくはAffymetrixプローブ番号:205490_s_atによって検出された1個又はそれ以上の遺伝子、
HOXD13、若しくはAffymetrixプローブ番号:207397_s_atによって検出された1個又はそれ以上の遺伝子、
INSM1、若しくはAffymetrixプローブ番号:206502_s_atによって検出された1個又はそれ以上の遺伝子、
MGC4170、若しくはAffymetrixプローブ番号:212959_s_atによって検出された1個又はそれ以上の遺伝子、
MLPH、若しくはAffymetrixプローブ番号:218211_s_atによって検出された1個又はそれ以上の遺伝子、
NEBL、若しくはAffymetrixプローブ番号:203962_s_atによって検出された1個又はそれ以上の遺伝子、
PLA2G2A、若しくはAffymetrixプローブ番号:203649_s_atによって検出された1個又はそれ以上の遺伝子、
PTPRO、若しくはAffymetrixプローブ番号:208121_s_atによって検出された1個又はそれ以上の遺伝子、
PYY、若しくはAffymetrixプローブ番号:207080_s_at若しくは211253_x_atによって検出された1個又はそれ以上の遺伝子、
SH3BP4、若しくはAffymetrixプローブ番号:222258_s_atによって検出された1個又はそれ以上の遺伝子、
SLC28A2、若しくはAffymetrixプローブ番号:207249_s_atによって検出された1個又はそれ以上の遺伝子、
SLC2A10、若しくはAffymetrixプローブ番号:221024_s_atによって検出された1個又はそれ以上の遺伝子、
SPON1、若しくはAffymetrixプローブ番号:213994_s_at若しくは209437_s_atによって検出された1個又はそれ以上の遺伝子、
STS、若しくはAffymetrixプローブ番号:203769_s_atによって検出された1個又はそれ以上の遺伝子、
TM4SF11、若しくはAffymetrixプローブ番号:204519_s_atによって検出された1個又はそれ以上の遺伝子、
TUSC3、若しくはAffymetrixプローブ番号:213432_s_at又は209228_x_atによって検出された1個又はそれ以上の遺伝子、
SCD、若しくはAffymetrixプローブ番号:200832_s_atによって検出された1個又はそれ以上の遺伝子、
ABCB1、若しくはAffymetrixプローブ番号:211994_s_atによって検出された1個又はそれ以上の遺伝子、
BTBD3、若しくはAffymetrixプローブ番号:202946_s_atによって検出された1個又はそれ以上の遺伝子、
CA1、若しくはAffymetrixプローブ番号:205950_s_atによって検出された1個又はそれ以上の遺伝子、
DHRS9、若しくはAffymetrixプローブ番号:224009_x_at若しくは223952_x_atによって検出された1個又はそれ以上の遺伝子、
DKFZP564I1171、若しくはAffymetrixプローブ番号:225457_s_atによって検出された1個又はそれ以上の遺伝子、
EIF5A、若しくはAffymetrixプローブ番号:201123_s_atによって検出された1個又はそれ以上の遺伝子、
IGHD、若しくはAffymetrixプローブ番号:214973_x_atによって検出された1個又はそれ以上の遺伝子、
PCK1、若しくはAffymetrixプローブ番号:208383_s_atによって検出された1個又はそれ以上の遺伝子、
RBP4、若しくはAffymetrixプローブ番号:219140_s_atによって検出された1個又はそれ以上の遺伝子、
TRPM6、若しくはAffymetrixプローブ番号:224412_s_atによって検出された1個又はそれ以上の遺伝子、
UGT1A6、若しくはAffymetrixプローブ番号:215125_s_atによって検出された1個又はそれ以上の遺伝子から選択される。
本発明は、個体の大腸に由来する細胞若しくは細胞集団の解剖学的起源を決定するための方法であって、
公知の少なくとも1つの大腸の近位−遠位起源に由来する細胞若しくは細胞集団における遺伝子の発現を表す発現トレーニングデータ、及び前記細胞若しくは細胞集団と前記近位−遠位起源との関連を表す近位−遠位起源トレーニングデータを含むトレーニングデータを入手する工程と;
前記遺伝子の発現レベルの線形若しくは非線形組み合わせを表す分類データを生成するために前記トレーニングデータを処理する工程であって、前記分類データは、前記また別の細胞若しくは細胞亜集団における前記遺伝子の発現を表すまた別の発現データに基づいて、大腸から採取されたまた別の細胞若しくは細胞亜集団の近位−遠位起源を示すまた別の近位−遠位起源データを生成するために適合させられる工程とを含む方法をさらに提供する。
有益にも、前記処理する工程は、GeneRaveを用いて前記トレーニングデータを処理する工程を含むことができる。
好ましくは、前記サブセットの遺伝子は、
Affymetrixプローブ番号:218888_s_atによって検出された1個又はそれ以上の遺伝子、
Affymetrixプローブ番号:225290_atによって検出された遺伝子、
Affymetrixプローブ番号:226432_atによって検出された遺伝子、
Affymetrixプローブ番号:231576_atによって検出された遺伝子、
Affymetrixプローブ番号:235733_atによって検出された遺伝子、
Affymetrixプローブ番号:236894_atによって検出された遺伝子、
Affymetrixプローブ番号:239656_atによって検出された遺伝子、
Affymetrixプローブ番号:242059_atによって検出された遺伝子、
Affymetrixプローブ番号:242683_atによって検出された遺伝子、
Affymetrixプローブ番号:230105_atによって検出された遺伝子、
Affymetrixプローブ番号:230269_atによって検出された遺伝子、
Affymetrixプローブ番号:238378_atによって検出された遺伝子、
Affymetrixプローブ番号:239814_atによって検出された遺伝子、
Affymetrixプローブ番号:239994_atによって検出された遺伝子、
Affymetrixプローブ番号:240856_atによって検出された遺伝子、
Affymetrixプローブ番号:242414_atによって検出された遺伝子、
Affymetrixプローブ番号:244553_atによって検出された遺伝子、
Affymetrixプローブ番号:217320によって検出された遺伝子、
Affymetrixプローブ番号:236141によって検出された遺伝子、
Affymetrixプローブ番号:236513によって検出された遺伝子、
Affymetrixプローブ番号:238143によって検出された遺伝子、
AFARP1、若しくはAffymetrixプローブ番号:202234_s_atによって検出された1個又はそれ以上の遺伝子、
ANPEP、若しくはAffymetrixプローブ番号:202888_s_atによって検出された1個又はそれ以上の遺伝子、
CCL13、若しくはAffymetrixプローブ番号:206407_s_atによって検出された1個又はそれ以上の遺伝子、
CRYL1、若しくはAffymetrixプローブ番号:220753_s_atによって検出された1個又はそれ以上の遺伝子、
CYP2B6、若しくはAffymetrixプローブ番号:206754_s_atによって検出された1個又はそれ以上の遺伝子、
CYP2C18、若しくはAffymetrixプローブ番号:208126_s_atによって検出された1個又はそれ以上の遺伝子、
CYP2C9、若しくはAffymetrixプローブ番号:214421_x_at若しくは220017_x_atによって検出された1個又はそれ以上の遺伝子、
EPB41L3、若しくはAffymetrixプローブ番号:211776_s_atによって検出された1個又はそれ以上の遺伝子、
ETNK1、若しくはAffymetrixプローブ番号:222262_s_at若しくは224453_s_atによって検出された1個又はそれ以上の遺伝子、
FAM45A、若しくはAffymetrixプローブ番号:221804_s_at若しくは222955_s_atによって検出された1個又はそれ以上の遺伝子、
FGFR2、若しくはAffymetrixプローブ番号:203639_s_atによって検出された1個又はそれ以上の遺伝子、
GBA3、若しくはAffymetrixプローブ番号:219954_s_atによって検出された1個又はそれ以上の遺伝子、
GSPT2、若しくはAffymetrixプローブ番号:205541_s_atによって検出された1個又はそれ以上の遺伝子、
GULP1、若しくはAffymetrixプローブ番号:215913_s_atによって検出された1個又はそれ以上の遺伝子、
HOXA9、若しくはAffymetrixプローブ番号:205366_s_at若しくは214551_s_atによって検出された1個又はそれ以上の遺伝子、
HOXC6、若しくはAffymetrixプローブ番号:206858_s_atによって検出された1個又はそれ以上の遺伝子、
HOXD3、若しくはAffymetrixプローブ番号:206601_s_atによって検出された1個又はそれ以上の遺伝子、
ME2、若しくはAffymetrixプローブ番号:210153_s_atによって検出された1個又はそれ以上の遺伝子、
MESP1、若しくはAffymetrixプローブ番号:224476_s_atによって検出された1個又はそれ以上の遺伝子、
MOCS1、若しくはAffymetrixプローブ番号:213181_s_atによって検出された1個又はそれ以上の遺伝子、
MSCP、若しくはAffymetrixプローブ番号:218136_s_at若しくは221920_s_atによって検出された1個又はそれ以上の遺伝子、
NETO2、若しくはAffymetrixプローブ番号:222774_s_atによって検出された1個又はそれ以上の遺伝子、
OASL、若しくはAffymetrixプローブ番号:210757_s_atによって検出された1個又はそれ以上の遺伝子、
PITX2、若しくはAffymetrixプローブ番号:207558_s_atによって検出された1個又はそれ以上の遺伝子、
PRAP1、若しくはAffymetrixプローブ番号:243669_s_atによって検出された1個又はそれ以上の遺伝子、
SCUBE2、若しくはAffymetrixプローブ番号:219197_s_atによって検出された1個又はそれ以上の遺伝子、
SEC6L1、若しくはAffymetrixプローブ番号:225457_s_atによって検出された1個又はそれ以上の遺伝子、
SLC16A1、若しくはAffymetrixプローブ番号:202236_s_at若しくは209900_s_atによって検出された1個又はそれ以上の遺伝子、
UGT1A3、若しくはAffymetrixプローブ番号:208596_s_atによって検出された1個又はそれ以上の遺伝子、
UGT1A8、若しくはAffymetrixプローブ番号:221305_s_atによって検出された1個又はそれ以上の遺伝子、
ARF4、若しくはAffymetrixプローブ番号:201097_s_atによって検出された1個又はそれ以上の遺伝子、
BTG3、若しくはAffymetrixプローブ番号:213134_x_at若しくは205548_s_atによって検出された1個又はそれ以上の遺伝子、
CHST5、若しくはAffymetrixプローブ番号:221164_x_at若しくは223942_x_atによって検出された1個又はそれ以上の遺伝子、
CMAH、若しくはAffymetrixプローブ番号:205518_s_atによって検出された1個又はそれ以上の遺伝子、
CRYBA2、若しくはAffymetrixプローブ番号:220136_s_atによって検出された1個又はそれ以上の遺伝子、
CTSE、若しくはAffymetrixプローブ番号:205927_s_atによって検出された1個又はそれ以上の遺伝子、
DKFZp761N1114、若しくはAffymetrixプローブ番号:242372_s_atによって検出された1個又はそれ以上の遺伝子、
EPB41L4A、若しくはAffymetrixプローブ番号:228256_s_atによって検出された1個又はそれ以上の遺伝子、
EPHA3、若しくはAffymetrixプローブ番号:206070_s_atによって検出された1個又はそれ以上の遺伝子、
FAS、若しくはAffymetrixプローブ番号:204781_s_atによって検出された1個又はそれ以上の遺伝子、
FER1L3、若しくはAffymetrixプローブ番号:201798_s_at若しくは211864_s_atによって検出された1個又はそれ以上の遺伝子、
FLJ20152、若しくはAffymetrixプローブ番号:218532_s_at若しくは218510_x_atによって検出された1個又はそれ以上の遺伝子、
FLJ23548、若しくはAffymetrixプローブ番号:218187_s_atによって検出された1個又はそれ以上の遺伝子、
FN1、若しくはAffymetrixプローブ番号:211719_s_at若しくは210495_x_at若しくは212464_at若しくは216442_x_atによって検出された1個又はそれ以上の遺伝子、
FOXA2、若しくはAffymetrixプローブ番号:210103_s_atによって検出された1個又はそれ以上の遺伝子、
FRZB、若しくはAffymetrixプローブ番号:203698_s_atによって検出された1個又はそれ以上の遺伝子、
GDF15、若しくはAffymetrixプローブ番号:221577_x_atによって検出された1個又はそれ以上の遺伝子、
GJB3、若しくはAffymetrixプローブ番号:205490_s_atによって検出された1個又はそれ以上の遺伝子、
HOXD13、若しくはAffymetrixプローブ番号:207397_s_atによって検出された1個又はそれ以上の遺伝子、
INSM1、若しくはAffymetrixプローブ番号:206502_s_atによって検出された1個又はそれ以上の遺伝子、
MGC4170、若しくはAffymetrixプローブ番号:212959_s_atによって検出された1個又はそれ以上の遺伝子、
MLPH、若しくはAffymetrixプローブ番号:218211_s_atによって検出された1個又はそれ以上の遺伝子、
NEBL、若しくはAffymetrixプローブ番号:203962_s_atによって検出された1個又はそれ以上の遺伝子、
PLA2G2A、若しくはAffymetrixプローブ番号:203649_s_atによって検出された1個又はそれ以上の遺伝子、
PTPRO、若しくはAffymetrixプローブ番号:208121_s_atによって検出された1個又はそれ以上の遺伝子、
PYY、若しくはAffymetrixプローブ番号:207080_s_at若しくは211253_x_atによって検出された1個又はそれ以上の遺伝子、
SH3BP4、若しくはAffymetrixプローブ番号:222258_s_atによって検出された1個又はそれ以上の遺伝子、
SLC28A2、若しくはAffymetrixプローブ番号:207249_s_atによって検出された1個又はそれ以上の遺伝子、
SLC2A10、若しくはAffymetrixプローブ番号:221024_s_atによって検出された1個又はそれ以上の遺伝子、
SPON1、若しくはAffymetrixプローブ番号:213994_s_at若しくは209437_s_atによって検出された1個又はそれ以上の遺伝子、
STS、若しくはAffymetrixプローブ番号:203769_s_atによって検出された1個又はそれ以上の遺伝子、
TM4SF11、若しくはAffymetrixプローブ番号:204519_s_atによって検出された1個又はそれ以上の遺伝子、
TUSC3、若しくはAffymetrixプローブ番号:213432_s_at若しくは209228_x_atによって検出された1個又はそれ以上の遺伝子、
SCD、若しくはAffymetrixプローブ番号:200832_s_atによって検出された1個又はそれ以上の遺伝子、
ABCB1、若しくはAffymetrixプローブ番号:211994_s_atによって検出された1個又はそれ以上の遺伝子、
BTBD3、若しくはAffymetrixプローブ番号:202946_s_atによって検出された1個又はそれ以上の遺伝子、
CA1、若しくはAffymetrixプローブ番号:205950_s_atによって検出された1個又はそれ以上の遺伝子、
DHRS9、若しくはAffymetrixプローブ番号:224009_x_at若しくは223952_x_atによって検出された1個又はそれ以上の遺伝子、
DKFZP564I1171、若しくはAffymetrixプローブ番号:225457_s_atによって検出された1個又はそれ以上の遺伝子、
EIF5A、若しくはAffymetrixプローブ番号:201123_s_atによって検出された1個又はそれ以上の遺伝子、
IGHD、若しくはAffymetrixプローブ番号:214973_x_atによって検出された1個又はそれ以上の遺伝子、
PCK1、若しくはAffymetrixプローブ番号:208383_s_atによって検出された1個又はそれ以上の遺伝子、
RBP4、若しくはAffymetrixプローブ番号:219140_s_atによって検出された1個又はそれ以上の遺伝子、
TRPM6、若しくはAffymetrixプローブ番号:224412_s_atによって検出された1個又はそれ以上の遺伝子、
UGT1A6、若しくはAffymetrixプローブ番号:215125_s_atによって検出された1個又はそれ以上の遺伝子から選択された遺伝子を含んでいる。
有益にも、前記サブセットの遺伝子は、7個の遺伝子を含むことができる。
好ましくは、前記7個の遺伝子は、SEC6L1、PRAC、SPINK5、SEC6L1、ANPEP、DEFA5、及びCLDN8である。
また別の好ましい実施形態では、前記サブセットの遺伝子は、以下のサブセット、
(i)
SCD、若しくはAffymetrixプローブ番号:200832_s_atによって検出された1個又はそれ以上の遺伝子、
MMP12、
P2RY14、
CLDN8、
ETNK1;
(ii)
PCP4、
SLC28A2、若しくはAffymetrixプローブ番号:207249_s_atによって検出された1個又はそれ以上の遺伝子、
CCL18、
RBP4、若しくはAffymetrixプローブ番号:219140_s_atによって検出された1個又はそれ以上の遺伝子、
DKFZP564I1171、
PRAC;
(iii)
EIF5A、若しくはAffymetrixプローブ番号:201123_s_atによって検出された1個又はそれ以上の遺伝子、
IGFBP2、
GDF15、若しくはAffymetrixプローブ番号:221577_s_atによって検出された1個又はそれ以上の遺伝子、
DKFZP564I1171、若しくはAffymetrixプローブ番号:225457_s_atによって検出された1個又はそれ以上の遺伝子、
MUC12;
(iv)
HLA−DRB4、
HOXB13、
INSL5、
ETNK1、若しくはAffymetrixプローブ番号:222262_s_atによって検出された1個又はそれ以上の遺伝子;
(v)
ANPEP、若しくはAffymetrixプローブ番号:202888_s_atによって検出された1個又はそれ以上の遺伝子、
DEFA5、
CHST5、若しくはAffymetrixプローブ番号:221164_x_atによって検出された1個又はそれ以上の遺伝子、
Affymetrixプローブ番号:226432_atによって検出された遺伝子、
COLM;
(vi)
SCNN1B、
FN1、若しくはAffymetrixプローブ番号:211719_x_atによって検出された1個又はそれ以上の遺伝子、
ETNK1、若しくはAffymetrixプローブ番号:224453_s_atによって検出された1個又はそれ以上の遺伝子、
Affymetrixプローブ番号:225290_atによって検出された遺伝子、
OSTalpha、
HOXD10、
プローブ番号:230269;
(vii)
SLC20A1、
HSPCA、
Affymetrixプローブ番号:217320_atによって検出された遺伝子、
CCL18、
HOXB13;
(viii)
CD69、
OLFM4、若しくはAffymetrixプローブ番号:212768_s_atによって検出された1個又はそれ以上の遺伝子、
UGT1A6、若しくはAffymetrixプローブ番号:215125_s_atによって検出された1個又はそれ以上の遺伝子、
CHST5、若しくはAffymetrixプローブ番号:223942_x_atによって検出された1個又はそれ以上の遺伝子、
Affymetrixプローブ番号:231576_atによって検出された遺伝子、
MUC11;
(ix)
PLA2G2A、若しくはAffymetrixプローブ番号:203649_s_atによって検出された1個又はそれ以上の遺伝子、
REG3A、
CCL13、若しくはAffymetrixプローブ番号:206407_s_atによって検出された1個又はそれ以上の遺伝子、
GCG、
UGT1A3、若しくはAffymetrixプローブ番号:208596_s_atによって検出された1個又はそれ以上の遺伝子、
FN1、若しくはAffymetrixプローブ番号:210485_x_atによって検出された1個又はそれ以上の遺伝子、
MT1M、
OR51E2;
(x)
SLC16A1、若しくはAffymetrixプローブ番号:202236_s_atによって検出された1個又はそれ以上の遺伝子、
WFDC2、
S100P、
PTPRO、若しくはAffymetrixプローブ番号:208121_s_atによって検出された1個又はそれ以上の遺伝子、
CCL11、
ASPN、
FAM3B;
(xi)
EMP1、
NEBL、若しくはAffymetrixプローブ番号:203962_s_atによって検出された1個又はそれ以上の遺伝子、
TFF1、
CMAH、若しくはAffymetrixプローブ番号:205518_s_atによって検出された1個又はそれ以上の遺伝子、
PYY、若しくはAffymetrixプローブ番号:207080_s_atによって検出された1個又はそれ以上の遺伝子、
ECAT11、
NETO2、若しくはAffymetrixプローブ番号:222774_s_atによって検出された1個又はそれ以上の遺伝子;
(xii)
HSD17B2、
HGD、
CA1、若しくはAffymetrixプローブ番号:205950_s_atによって検出された1個又はそれ以上の遺伝子、
CPM、
LGALS2、
IGHD、若しくはAffymetrixプローブ番号:214973_x_atによって検出された1個又はそれ以上の遺伝子、
FN1、若しくはAffymetrixプローブ番号:216442_xs_atによって検出された1個又はそれ以上の遺伝子;
(xiii)
CLC、
DEFA6、
FN1、若しくはAffymetrixプローブ番号:212464_s_atによって検出された1個又はそれ以上の遺伝子、
FST、
Affymetrixプローブ番号:236513_atによって検出された遺伝子、
Affymetrixプローブ番号:240856_atによって検出された遺伝子、
ETNK1;
(xiv)
PITX2、若しくはAffymetrixプローブ番号:207558_s_atによって検出された1個又はそれ以上の遺伝子、
DHRS9、若しくはAffymetrixプローブ番号:224009_x_atによって検出された1個又はそれ以上の遺伝子、
DKFZp761N1114;
KIAA1913;
(xv)
GHR、
HSD3B2、
MEP1B、
HOXA9、若しくはAffymetrixプローブ番号:213651_s_atによって検出された1個又はそれ以上の遺伝子、
TRPM6、若しくはAffymetrixプローブ番号:224412_s_atによって検出された1個又はそれ以上の遺伝子、
Affymetrixプローブ番号:239994_atによって検出された遺伝子;
(xvi)
SPINK5、
PCK1、若しくはAffymetrixプローブ番号:208383_s_atによって検出された1個又はそれ以上の遺伝子、
ADRA2A、
NQO1、若しくはAffymetrixプローブ番号:210519_s_atによって検出された1個又はそれ以上の遺伝子、
GBA3、
Affymetrixプローブ番号:228004_atによって検出された遺伝子;
(xvii)
SCGB2A1、
NR1H4、
NETO2、若しくはAffymetrixプローブ番号:218888_s_atによって検出された1個又はそれ以上の遺伝子、
ST6GALNAC6;
(xviii)
NEBL、
PROM1、若しくはAffymetrixプローブ番号:204304_s_atによって検出された1個又はそれ以上の遺伝子、
AGR2、
REG1A、
UGT1A8、若しくはAffymetrixプローブ番号:221305_s_atによって検出された1個又はそれ以上の遺伝子、
DKFZp761N1114、若しくはAffymetrixプローブ番号:242372_s_atによって検出された1個又はそれ以上の遺伝子;
(xix)
ACSL1、
ST3GAL4、
GBA3、若しくはAffymetrixプローブ番号:219954_s_atによって検出された1個又はそれ以上の遺伝子、
SLC2A10、若しくはAffymetrixプローブ番号:221024_s_atによって検出された1個又はそれ以上の遺伝子、
DHRS9、若しくはAffymetrixプローブ番号:223952_s_atによって検出された1個又はそれ以上の遺伝子、
LAMA1;
(xx)
EFNA1、
BTBD3、若しくはAffymetrixプローブ番号:202946_s_atによって検出された1個又はそれ以上の遺伝子、
PI3、
ABCB1、若しくはAffymetrixプローブ番号:209994_s_atによって検出された1個又はそれ以上の遺伝子、
C10orf45、
BCMP11、
C6orf105、
CAPN13、
CPM、
Affymetrixプローブ番号:236141_atによって検出された遺伝子、
Affymetrixプローブ番号:238143_atによって検出された遺伝子のうちの1つ又はそれ以上である。
「近位−遠位起源」との言及は、近位起源若しくは遠位起源いずれかの細胞若しくは発現データについての言及と理解されたい。「細胞若しくは細胞亜集団」、「大腸」、「近位」、「遠位」、「起源」、「位置」、「遺伝子」及び「発現」との言及は、上記に提供した意味と同一の意味を有すると理解されたい。
本発明は、上記の方法のいずれか1つを実行するための成分を有する検出システムをさらに提供する。
本発明は、上記の方法のいずれか1つを実行するためのそこに保存されたプログラム取扱説明書を有するコンピュータ可読記憶媒体をさらに提供する。
本発明は、
少なくとも1つの大腸に由来する細胞若しくは細胞集団における遺伝子の発現を表す発現トレーニングデータ、及び前記細胞若しくは細胞集団と前記近位−遠位起源との関連を表す近位−遠位起源トレーニングデータを含むトレーニングデータを入手するための手段と;
前記遺伝子の発現レベルの線形若しくは非線形組み合わせを表す分類データを生成するために多変量分析を用いて前記トレーニングデータを処理するための手段であって、前記分類データは、また別の細胞若しくは細胞集団における前記遺伝子の発現を表すまた別の発現データに基づいて、大腸から採取された前記また別の細胞若しくは細胞集団の近位−遠位起源を示す近位−遠位起源データを生成するために適合させられる手段とを含む検出システムをさらに提供する。
上記に詳述したように、本発明の方法は、その解剖学的起源に特徴的な遺伝子発現プロファイルを発現していない遠位若しくは近位起源の細胞が異常な発現プロファイルを示しており、このため対象異常の完全な範囲及び性質を決定するために詳細な分析を受けるべきであることに基づいて異常な細胞を同定するために有用である。例えば、一部の結腸直腸腺腫若しくは腺癌細胞は、これらの細胞の腫瘍性(neoplastic)形質転換に特徴的である脱分化事象に起因して正しくない近位−遠位大腸発現プロファイルを示す可能性がある。
従って、また別の態様では、大腸における細胞異常又は細胞異常を特徴とする状態の発症若しくは発症に対する素因を決定するための方法であって、上記に記載した方法の1つに従って、大腸における公知の近位若しくは遠位起源に由来する生物学的サンプルの近位−遠位遺伝子発現プロファイルを決定する工程を含み、正常近位−遠位大腸遺伝子発現プロファイルと一致しない遺伝子発現プロファイルの検出は前記プロファイルを発現する細胞若しくは細胞集団の異常の指標となる方法が提供される。
「遺伝子発現プロファイル」との言及は、上記に記載した単変量若しくは多変量遺伝子発現結果についての言及と理解されたい。例えば、「プロファイル」は、上記で考察した1つ又はそれ以上のマーカー遺伝子の発現レベル又は上記に記載した遺伝子及び/又は遺伝子セットの多変量分析の結果と相関付けることができる。従って、「近位−遠位遺伝子発現プロファイル」との言及は、近位大腸起源の細胞に特徴的な遺伝子発現プロファイル及び遠位大腸起源の細胞に特徴的な遺伝子発現プロファイルについての言及である。
本発明の状況における分析の対象である細胞は、公知の近位若しくは遠位起源であることは理解されるであろう。この情報は、任意の適切な方法によって決定できるが、最も便宜的には生検を介して大腸内の規定の位置から生物学的サンプルを単離する工程によって満たされる。しかし、生物学的サンプルを採取する、さもなければその解剖学的起源を決定する他の適切な方法は除外されない。
生物学的サンプルの細胞若しくは細胞集団の異常は、通常はその特定の近位若しくは遠位起源の細胞を特徴付けるであろうプロファイルの検出に一致していない遺伝子発現プロファイルの検出に基づいている。「一致しない」とは、分析される1個又はそれ以上の遺伝子の発現レベルが正常コントロールにおいて典型的に観察される遺伝子の発現レベルと一致しないことを意味する。
本発明の方法は、単発試験として、又は疾患が発症するリスク状態にあると考えられる個体の継続的モニターとして、又は治療的若しくは予防的処置レジメン、例えば異常な遺伝子発現プロファイルを特徴とする疾患細胞のアブレーション(ablation)の有効性のモニターとして有用である。これらの状況では、生物学的サンプルの任意の1つ又はそれ以上のクラスにおける位置マーカー発現レベル若しくは発現プロファイルの変調についてのマッピングは、個体の状態又は現在使用されている治療的若しくは予防的レジメンの有効性についての貴重な指標である。従って、本発明の方法は、正常レベル(上記に規定した)に比較して、又は前記個体の生物学的サンプルから決定された1つ又はそれ以上の以前の遺伝子マーカーレベル若しくは発現プロファイルに比較して個体における位置マーカーレベル若しくは発現プロファイルの変調についてのモニタリングに及ぶと理解されたい。
生物学的サンプル中の対象の発現した位置マーカーについて試験する手段は以下などであるが、それらに限定されない当業者には周知であろう任意の適切な方法によって達成できる。
(i)インビボ検出。
分子イメージングは、腸組織内のマーカーの変化した発現を明らかにできるイメージングプローブ若しくは試薬の投与後に使用できる。
分子イメージング(Moore et al., BBA, 1402:239-249, 1988、Weissleder et al., Nature Medicine 6:351-355, 2000)は、「古典的」診断イメージング技術、例えばX線、コンピュータ断層撮影(CT)、MRI、陽電子断層撮影法(PET)若しくは内視鏡検査を使用して現在視認されるマクロ特徴と相関する分子発現のインビボイメージングである。
(ii)蛍光インサイチューハイブリダイゼーション(FISH)による細胞中での、又は例えば定量的逆転写酵素ポリメラーゼ連鎖反応(QRTPCR)若しくは競合的RT−PCR産物のフローサイトメトリー定性などの技術による細胞由来の抽出物中でのRNA発現のアップレギュレーションの検出(Wedemeyer et al., Clinical Chemistry 48:9 1398-1405, 2002)。
(iii)例えばアレイ技術による、細胞抽出物由来のRNAの発現プロファイルの評価(Alon et al., Proc. Natl. Acad. Sci. USA:96, 6745-6750, June 1999)。
「マイクロアレイ」は、各々が固体支持体の表面上で形成された規定領域を有する、好ましくは別個の領域の線形若しくは多次元のアレイである。マイクロアレイ上の別個の領域の密度は、単一固相支持体の表面、好ましくは少なくとも約50/cm、より好ましくは少なくとも約100/cm、一層より好ましくは少なくとも約500/cm、及びさらに一層より好ましくは少なくとも約1,000/cmの表面上で検出される標的ポリヌクレオチドの総数によって決定される。本明細書で使用するように、DNAマイクロアレイは、標的ポリヌクレオチドを増幅又はクローニングするために使用されるチップ若しくは他の表面上に配置されたオリゴヌクレオチドプローブのアレイである。アレイ内の各特定群のプローブの位置は公知であるので、標的ポリヌクレオチドの同一性は、マイクロアレイ内の特定位置へのそれらの結合に基づいて決定できる。
DNAマイクロアレイ技術における近年の発達は、単一固相支持体上の複数の標的核酸分子の大規模アッセイを実行することを可能にする。米国特許第5,837,832号明細書(Chee et al.)及び関連出願は、サンプル中での特定核酸配列をハイブリダイゼーション及び検出するためのオリゴヌクレオチドプローブのアレイを固定化する工程を記載している。当該の組織から単離された当該の標的ポリヌクレオチドは、DNAチップへハイブリダイゼーションさせられ、そして別個のプローブ位置での標的ポリヌクレオチドの優先性及びハイブリダイゼーション度に基づいて特異的配列が検出される。アレイの1つの重要な使用は示差的遺伝子発現の分析にあるが、様々な細胞若しくは組織、しばしば当該の組織及びコントロール組織における遺伝子の発現プロファイルが比較され、そして各組織間の遺伝子発現における何らかの差が同定される。そのような情報は、特定組織タイプにおいて発現した遺伝子のタイプの同定及び発現プロファイルに基づく状態の診断のために有用である。
1つの例では、当該のサンプル由来のRNAは、標識したcDNAを入手するために逆転写を受けさせられる。米国特許第6,410,229号明細書(Lockhart et al.)を参照されたい。cDNAは、次に公知の順序でチップ若しくは他の表面上に配列された公知の配列のオリゴヌクレオチド若しくはcDNAへハイブリダイズさせられる。また別の例では、RNAは、生物学的サンプルから単離され、その上にcDNAプローブが固定されているチップへハイブリダイズさせられる。標識されたcDNAがハイブリダイズするオリゴヌクレオチドの位置はcDNA上の配列情報を提供し、他方標識されてハイブリダイズしたRNA若しくはcDNAの量は、当該のRNA若しくはcDNAの相対発現量の推定値を提供する。Schena, et al. Science 270:467-470 (1995)を参照されたい。例えば、ヒト癌における遺伝子発現パターンを分析するためのcDNAマイクロアレイの使用については、DeRisi, et al. (Nature Genetics 14:457-460 (1996))によって記載されている。
好ましい実施形態では、対象核酸に対応する核酸プローブが作製される。バイオチップに付着した核酸プローブは、本発明の標的配列及びプローブの特異的ハイブリダイゼーションが発生するように生物学的サンプルの核酸に実質的に相補的であるように設計される。この相補性は、本発明の標的配列と一本鎖核酸との間のハイブリダイゼーションを妨害するであろう任意の数の塩基対ミスマッチが存在していてよいという点で完全である必要はない。ヌクレオチドレベルでの遺伝子の全体的ホモロジーはおそらく約40%以上、おそらくは約60%以上、及び一層よりおそらくは約80%以上であろう;さらに約8〜12ヌクレオチド以上の対応する隣接配列が存在するであろうと予測されている。しかし、突然変異の数が極めて多いと、最小ストリンジェントのハイブリダイゼーション条件下でさえハイブリダイゼーションが発生できなくなり、配列は相補的標的配列ではなくなる。そこで、本明細書での「実質的に相補的」は、プローブが通常の反応条件下、特別には高ストリンジェンシー条件下でハイブリダイズするために標的配列へ十分に相補的であることを意味する。
核酸プローブは、一般に一本鎖であるが、部分的一本鎖及び部分的二本鎖であってよい。プローブの鎖の数(strandedness)は、標的配列の構造、組成、及び特性によって決定される。一般に、オリゴヌクレオチドプローブは、約6、8、10、12、15、20、30〜約100塩基長の範囲に及び、約10〜約80塩基が好ましく、約15〜約40塩基が特に好ましい。即ち、一般に全遺伝子がプローブとして使用されることはまれである。一部の実施形態では、数百塩基までというはるかに長い核酸を使用できる。プローブは、当業者には公知の条件下で相補的テンプレート配列へハイブリダイズするために十分に特異的である。プローブの配列とそれらがハイブリダイゼーション中にハイブリダイズするそれらの相補的テンプレート(標的)配列との間のミスマッチの数は、BLAST(デフォルト設定)によって決定されるように、一般に15%を超えず、通常は10%を超えず、及び好ましくは5%を超えない。
オリゴヌクレオチドプローブは、通常は核酸(ウラシル、シトシン、チミン、アデニン及びグアニン)内で見いだされる天然型複素環式塩基、並びに修飾された塩基及び塩基アナログを含むことができる。標的配列へのプローブのハイブリダイゼーションと適合する任意の修飾された塩基若しくは塩基アナログは、本発明の実践において有用である。プローブの糖若しくはグリコシド部分は、デオキシリボース、リボース、及び/又はこれらの糖の修飾形、例えば2’−O−アルキルリボースを含むことができる。好ましい実施形態では、糖部分は2’−デオキシリボースである;しかしプローブが標的配列にハイブリダイズする能力と適合する任意の糖部分を使用できる。
1つの実施形態では、プローブのヌクレオシドユニットは、当分野においては周知であるように、ホスホジエステル骨格によって連結されている。追加の実施形態では、ヌクレオチド間結合は、ホスホロチオエート、メチルホスホネート、スルファメート(例、米国特許第5,470,967号明細書)及びポリアミド(即ち、ペプチド核酸)を含むがそれらに限定されないプローブの特異的ハイブリダイゼーションと適合する当業者には公知の任意の結合を含むことができる。ペプチド核酸は、Nielsen et al. (1991) Science 254:1497-1500、米国特許第5,714,331号明細書、及びNielsen (1999) Curr. Opin. Biotechnol. 10:71-75に記載されている。
所定の実施形態では、プローブは、キメラ分子であってよい;即ち1つより多いタイプの塩基若しくは糖サブユニットを含んでいてよい、及び/又は結合は同一プライマー内の1つより多いタイプの結合であってよい。プローブは、当分野において公知であるように、その標的配列へのハイブリダイゼーションを促進する部分、例えば、インタカレータ及び/又はマイナーグルーブ・バインダを含むことができる。塩基、糖、及びヌクレオシド間骨格の変形、並びにプローブ上の任意のペンダント基の存在は、配列特異的方法でプローブがその標的配列と結合する能力と適合するであろう。これらの結合内では、極めて多数の構造的修飾が可能である。有益にも、本発明によるプローブは、それらがシグナル増幅を可能にするような構造的特性を有していてよく、そのような構造的特性は、例えばUrdea et al. (Nucleic Acids Symp. Ser., 24:197-200 (1991))又は欧州特許第0225,807号明細書に記載されたような分枝状DNAプローブである。さらに、プローブを形成する様々な複素環式の塩基、糖、ヌクレオシド及びヌクレオチドを調製するための合成方法、並びに特に所定の配列のオリゴヌクレオチドの調製は、十分に開発され、当分野において公知である。オリゴヌクレオチド合成のための好ましい方法は、米国特許第5,419,966号明細書の教示を組み込んでいる。
標的核酸内の多型及び/又は二次構造、データの重複性等について明らかにするために、特定の標的核酸のための複数のプローブを設計することができる。一部の実施形態では、1配列当たり1つより多いプローブが使用される場合は、オーバーラッピングプローブ又は単一標的遺伝子の相違する区間に対するプローブのいずれかが使用される。つまり、2つ、3つ、4つ又はそれ以上のプローブが特定標的のために重複する状態で構築するために使用される。これらのプローブは、オーバーラッピング(即ち、共通する一部の配列を有していてよい)であってよい、又は遺伝子の別個の配列に対して特異的である。複数の標的ポリヌクレオチドが本発明によって検出されるべきである場合は、特定標的ポリヌクレオチドに対応する各プローブ若しくはプローブ群がマイクロアレイの別個の領域に配置される。
プローブは、溶液中、例えばウエル内若しくはマイクロアレイの表面上にあってもよいし、又は固体支持体へ付着していてもよい。使用できる固体支持体材料の例には、プラスチック、セラミック、金属、樹脂、ゲル及び膜が含まれる。固体支持体の有用なタイプには、プレート、ビーズ、磁気材料、マイクロビーズ、ハイブリダイゼーションチップ、膜、結晶、セラミック及び自己集合性単層が含まれる。1つの例は、二次元若しくは三次元マトリックス、例えば複数のプローブ結合部位を備えるゲル若しくはハイブリダイゼーションチップを含んでいる(Pevzner et al., J. Biomol. Struc. & Dyn. 9:399-410, 1991、Maskos and Southern, Nuc. Acids Res. 20:1679-84, 1992)。
ハイブリダイゼーションチップは、引き続いて標的核酸とハイブリダイズする極めて大きなプローブアレイを構築するために使用できる。チップのハイブリダイゼーションパターンの分析は、標的ヌクレオチド配列の同定に役立つことができる。パターンは手動若しくはコンピュータ援用で分析できるが、ハイブリダイゼーションによる位置シーケンシングはコンピュータ分析及び自動化に役立つことは明白である。また別の例では、蛍光ビーズをベースとするアプローチと組み合わせて固相構造支持体上でAffymetrixチップを使用することができる。また別の例では、cDNAマイクロアレイを使用できる。これに関連して、Lockkart et al.(即ち固相上のインサイチューでのAffymetrix合成プローブ)によって記載されたオリゴヌクレオチドが特に好ましく、即ちフォトリソグラフィである。
当業者には理解されるように、核酸は、様々な方法で固体支持体へ付着又は固定化させることができる。本明細書における「固定化」は、結合、洗浄、分析、及び除去の条件下で核酸プローブと固体支持体との間の結び付き若しくは結合が十分に安定性であることを意味する。結合は、共有若しくは非共有であってよい。本明細書における「非共有結合」及び文法的同等語は、静電性、親水性、及び疎水性の相互作用いずれかの1つ又はそれ以上を意味する。非共有結合には、分子、例えばストレプトアビジンの支持体への共有的付着、及びビオチン化プローブのストレプトアビジンへの非共有結合が含まれる。本明細書における「共有結合」及び文法的同等語は、2つの部分である支持体及びプローブが、σ結合、π結合及び配位結合を含む少なくとも1つの結合によって付着させられていることを意味する。共有結合は、プローブと固体支持体との間で直接的に形成される場合もあるし、あるいは、架橋剤によってか、又は固体支持体若しくはプローブのいずれか又は両方の分子上に特異的反応基を包含することによって形成される場合もある。固定化は、さらに又共有及び非共有相互作用の組み合わせを含むことができる。
核酸プローブは、共有結合、例えば結合剤とのコンジュゲート化によって、又は共有結合若しくは非共有結合(例えば静電性相互作用、水素結合若しくは抗体−抗原結合)によって、或いはそれらの組み合わせによって固体支持体へ付着させることができる。典型的な結合剤には、ビオチン/アビジン、ビオチン/ストレプトアビジン、黄色ブドウ球菌(Staphylococcus aureus)タンパク質A/IgG抗体Fフラグメント、及びストレプトアビジン/タンパク質Aキメラ(T. Sano and C.R. Cantor, Bio/Technology 9:1378-81 (1991)))、又はこれらの物質の誘導体若しくは組み合わせが含まれる。核酸は、固体支持体へ光切断可能結合、静電結合、ジスルフィド結合、ペプチド結合、ジエステル結合又はこれらの種類の結合の組み合わせによって付着させることができる。アレイもまた、選択的に解除できる結合、例えば4,4’−ジメトキシトリチル若しくはその誘導体によって固体支持体へ付着させることができる。有用であることが見いだされている誘導体には、3若しくは4[ビス−(4−メトキシフェニル)]−メチル−安息香酸、N−スクシンイミジル−3若しくは4[ビス−(4−メトキシフェニル)]−メチル−安息香酸、N−スクシンイミジル−3若しくは4[ビス−(4−メトキシフェニル)]−ヒドロキシメチル−安息香酸、N−スクシンイミジル−3若しくは4[ビス−(4−メトキシフェニル)]−クロロメチル−安息香酸、及びこれらの酸の塩が含まれる。
一般に、プローブは、当業者には理解されるように、様々な方法でバイオチップに付着させられる。本明細書に記載したように、核酸は、最初に合成して、続いてバイオチップへ付着させることができる、又はバイオチップ上で直接的に合成することができる。
バイオチップは、適切な固体基質を含んでいる。本明細書における「基質」若しくは「固体支持体」若しくは他の文法的同等語は、核酸プローブの付着若しくは結び付きのために適切な別個の個別部位(discrete individual site)を含有するように修飾することができ、そして少なくとも1つの検出方法に従順である任意の物質を意味する。本発明の固相支持体は、ヌクレオチドのハイブリダイゼーション及び合成を支持するために適合する任意の固体の材料及び構造であってよい。好ましくは、固相支持体は、その上にプライマーを固定化して逆転写酵素反応を実行できる少なくとも1つの実質的に剛性の表面を含んでいる。ポリヌクレオチドマイクロアレイ要素が安定的に結び付けられる基質は、プラスチック、セラミック、金属、アクリルアミド、セルロース、ニトロセルロース、ガラス、ポリスチレン、ポリエチレンビニルアセテート、ポリプロピレン、ポリメタクリレート、ポリエチレン、ポリエチレンオキシド、ポリシリケート、ポリカーボネート、Teflon RTM、フルオロカーボン、ナイロン、シリコンラバー、ポリアンヒドリド、ポリグリコール酸、ポリ乳酸、ポリオルトエステル、ポリプロピルフメレート、コラーゲン、グリコサミノグリカン、及びポリアミノ酸を含む様々な物質から作製できる。基質は、二次元形若しくは三次元形、例えばゲル、膜、薄いフィルム、ガラス、プレート、シリンダ、ビーズ、磁気ビーズ、光ファイバ、織繊維などであってよい。アレイの好ましい形態は、三次元アレイである。好ましい三次元アレイは、タグ付ビーズの集合である。各タグ付ビーズは、それに付着した様々なプライマーを有する。タグはシグナリング手段、例えば色(Luminex、Illumina)及び電磁場(Pharmaseq)などによって検出可能であり、タグ付ビーズ上のシグナルは(例、光ファイバを使用して)遠隔的に検出することさえできる。固体支持体のサイズは、DNAマイクロアレイテクノロジーのために有用ないずれかの標準的マイクロアレイサイズであってよく、サイズは本発明の反応を実施するために使用される特定の機械に適応させるために特別仕立てすることができる。一般に、基質は光学検出を可能にし、感知できる蛍光を発しない。
1つの実施形態では、バイオチップ及びプローブの表面は、それら2つのその後の付着のために化学的官能基を用いて誘導体化することができる。そこで、例えば、バイオチップは、アミノ基、カルボキシ基、オキソ基及びチオール基を含むがそれらに限定されない化学的官能基を用いて誘導体化されるが、特に好ましいのはアミノ基である。これらの官能基を用いると、プローブは、プローブ上の官能基を使用して付着させることができる。例えば、アミノ基を含有する核酸は、アミノ基を含む表面に、例えば当分野において公知であるようにリンカーを用いて付着させることができる;例えば、ホモ−二官能リンカー又はヘテロ−二官能リンカーは周知である(参照して本明細書に組み込まれる1994 Pierce Chemical Company catalog, technical section on cross-linkers, pages 155-200を参照されたい)。さらに、一部の場合には、追加のリンカー、例えばアルキル基(置換基及びヘテロアルキル基を含む)を使用できる。
この実施形態では、オリゴヌクレオチドは、当分野において公知であるように合成され、次に固体支持体の表面に付着させられる。当業者には理解されるように、5’若しくは3’の末端を固体支持体へ付着させることができる、又は付着は内部ヌクレオシドを介してであってよい。追加の実施形態では、固体支持体への固定化は、極めて強力であってよいが、それでも非共有であってよい。例えば、ストレプトアビジンを用いて共有的にコーティングされた表面へ結合し、結果として付着を生じさせるビオチン化オリゴヌクレオチドを作製できる。
アレイは、任意の便宜的方法、例えばポリヌクレオチドマイクロアレイ要素を前形成し、次にそれらを表面と安定的に結び付ける方法によって生成できる。又は、オリゴヌクレオチドは、当分野において公知であるように、表面上で合成できる。多数の様々なアレイ構成及びそれらの製造方法は当業者には公知であり、国際出願第95/25116号パンフレット及び国際出願第95/35505号パンフレット(photolithographic techniques)、米国特許第5,445,934号明細書(in situ synthesis by photolithography)、米国特許第5,384,261号明細書(in situ synthesis by mechanically directed flow paths)、及び米国特許第5,700,637号明細書(synthesis by spotting, printing or coupling)に開示されている;それらの開示は、全体として参照して本明細書に組み込まれる。DNAをビーズへ結合させるためのまた別の方法は、ビーズに付着させたリガンド結合分子へ連結させるためにDNAの末端に付着した特異的リガンドを使用する。可能性のあるリガンド結合パートナー対には、ビオチン−アビジン/ストレプトアビジン、様々な抗体/抗原対、例えばジゴキシゲニン−抗ジゴキシゲニン抗体が含まれる(Smith et al., Science 258:1122-1126 (1992))。支持体へのDNAの共有化学結合は、ホスホアミデート結合を通してDNA上の5’−ホスフェートを被覆されたマイクロスフェアへ連結させるための標準結合剤を使用することによって遂行できる。固体基質へオリゴヌクレオチドを固定化するための方法は、明確に確立されている。Pease et al., Proc. Natl. Acad. Sci. USA 91(11):5022-5026 (1994)を参照されたい。オリゴヌクレオチドを固体基質へ付着させるために好ましい方法は、Guo et al., Nucleic Acids Res. 22:5456-5465 (1994)によって記載されている。固定化は、インサイチューDNA合成(Maskos and Southern、上記)又はロボットによるアレイ作成技術と組み合わせた化学的に合成されたオリゴヌクレオチドの共有結合(Guo et al.、上記)によって遂行できる。
バイオチップアレイを代表とする固相技術に加えて、遺伝子発現は液相アレイを用いて定量することもできる。1つのそのようなシステムは、動的ポリメラーゼ連鎖反応(PCR)である。動的PCRは、特異的核酸配列の同時の増幅及び定量を可能にする。この特異性は、標的部位を囲んでいる一本鎖核酸配列へ優先的に付着するように設計された合成オリゴヌクレオチドプライマーに由来する。このオリゴヌクレオチドプライマーの対は、標的配列の各鎖上で特異的な、非共有結合複合体を形成する。これらの複合体は、反対方向における二本鎖RNAのインビトロ転写を促進する。反応混合物の温度サイクリングは、連続サイクルのプライマー結合、転写及び核酸から個別鎖への再溶融を作り出す。その結果は、標的dsDNA産物の指数的増加である。この産物は、インターカレート色素若しくは配列特異的プローブのいずれかを使用してリアルタイムで定量できる。SYBR(r) Green 1は、dsDNAへ優先的に結合するインターカレート色素の1例であり、蛍光シグナルにおける同時増加を生じさせる。配列特異的プローブ、例えばTaqMan.RTM.法とともに使用されるプローブは、蛍光色素及びオリゴヌクレオチドの反対側の末端へ共有結合した消光分子からなる。プローブは、2つのプライマー間で標的DNA配列へ選択的に結合するように設計される。DNAストランドがPCR反応中に合成される場合は、蛍光色素は、ポリメラーゼのエキソヌクレアーゼ活性によってプローブから切断され、シグナル脱消光(dequenching)が生じる。プローブシグナリング法は、インターカレート色素法よりより特異的であり得るが、各場合には、シグナル強度は生成されたdsDNA産物に比例している。当該の核酸配列に対して特異的なプライマー及び/又はプローブを表す各ウエルを備えるマルチウエル液相アレイにおいて、各タイプの定量方法を使用できる。組織若しくは細胞系のメッセンジャーRNA調製物と一緒に使用すると、1アレイのプローブ/プライマー反応は当該の複数の遺伝子産物の発現を同時に定量することができる。Germer et al., Genome Res. 10:258-266 (2000)、Heid et al., Genome Res. 6:986-994 (1996)を参照されたい。
(iv)例えばイムノアッセイによる、細胞抽出物中での変化した位置マーカータンパク質レベルの測定。
生物学的サンプル中のタンパク様の位置マーカー発現産物についての試験は、当業者には周知である多数の適切な方法のいずれか1つによって実施できる。適切な方法の例には、組織切片の抗体スクリーニング、生検標本若しくは体液サンプルが含まれるが、それらに限定されない。
抗体をベースとする診断方法が使用される範囲内で、マーカータンパク質の存在は多数の方法、例えばウェスタンブロッティング、ELISA又はフローサイトメトリー法で決定できる。当然ながら、これらには、非競合的タイプの一部位及び二部位の両方又は「サンドイッチ」アッセイ、並びに伝統的競合的結合アッセイが含まれる。これらのアッセイは、標識抗体の標的への直接結合もまた含んでいる。
サンドイッチアッセイは特に最も有用かつ一般に使用されるアッセイであり、本発明において使用するために好都合である。サンドイッチアッセイ技術の多数の変形が存在し、すべてが本発明によって包含されることが意図されている。手短には、典型的なフォーワードアッセイでは、未標識抗体は固体基板上に固定化され、試験対象のサンプルは結合分子と接触させられる。適切な期間のインキュベーション後、抗体−抗原複合体の形成を可能にするために十分な期間に渡り、抗原に対して特異的な、検出可能なシグナルを生成できるレポーター分子で標識された二次抗体が次に添加されて、抗体−抗原標識抗体のまた別の複合体を形成するために十分な時間にわたりインキュベートされる。任意の未反応物質は洗い流され、抗原の存在はレポーター分子によって生成するシグナルの観察によって決定される。これらの結果は、可視シグナルの単純な観察によって定性的であってよい、又はコントロールサンプルとの比較によって定量することができる。フォーワードアッセイについての変形には、サンプル及び標識された抗体の両方が同時に結合抗体へ添加される同時アッセイが含まれる。これらの技術は当業者には周知であり、容易に明白なように任意の小さな変形を含んでいる。
典型的なフォーワードサンドイッチアッセイでは、マーカー若しくはその抗原性部分に対する特異性を有する一次抗体は、固体表面へ共有的結合若しくは受動的結合のいずれかで結合させられる。固体表面は、典型的にはガラス若しくはポリマーであり、最も一般的に使用されるポリマーは、セルロース、ポリアクリルアミド、ナイロン、ポリスチレン、ポリビニルクロライド若しくはポリプロピレンである。固体支持体は、チューブ、ビーズ、マイクロプレートのディスク、又はイムノアッセイを実施するために適切な任意の他の表面の形態であってよい。結合プロセスは当分野において周知であり、一般に架橋結合、共有結合若しくは物理的吸着からなり、ポリマー抗体複合体は、試験サンプルのための調製において洗浄される。試験対象のサンプルのアリコートは次に固相複合体へ加えられ、抗体内に存在する任意のサブユニットの結合を可能にするために十分な時間(例、2〜40分間)及び適切な条件(例、25℃)下でインキュベートされる。インキュベーション期間に続いて、抗体サブユニット固相は洗浄され、乾燥させられ、抗原の一部分に対して特異的な二次抗体と一緒にインキュベートされる。二次抗体は、抗原への二次抗体の結合を示すために使用されるレポーター分子へ連結させられる。
代替法は、生物学的サンプル中の標的分子を固定化し、次に固定化された標的を、レポーター分子で標識されていても標識されていなくてもよい特異的抗体へ曝露させる工程を含んでいる。標的の量及びレポーター分子シグナルの強度に依存して、結合標的は抗体を用いた直接標識化によって検出することができる。又は、一次抗体に対して特異的な二次標識抗体は、標的−一次抗体−二次抗体三次複合体を形成するために標的−一次抗体複合体へ曝露させられる。複合体は、レポーター分子によって放出されたシグナルによって検出される。
本明細書において使用される「レポーター分子」は、その化学的性質によって、抗原−結合抗体の検出を可能にする分析によって同定可能なシグナルを提供する分子を意味する。検出は、定性的又は定量的のいずれであってもよい。このタイプのアッセイにおいて最も一般に使用されるレポーター分子は、酵素、蛍光体若しくは放射性核種含有分子(即ち、放射性同位体)及び化学発光分子のいずれかである。
酵素イムノアッセイの場合は、酵素は、一般にグルタルアルデヒド若しくはペリオデートによって、二次抗体へコンジュゲート化される。しかし容易に理解されるように、当業者が容易に利用できる極めて広範囲の様々なコンジュゲート技術が存在する。一般に使用される酵素には、特にホースラディッシュペルオキシダーゼ、グルコースオキシダーゼ、β−ガラクトシダーゼ及びアルカリホスファターゼが含まれる。特異的酵素とともに使用できる基質は、一般に、対応する酵素による加水分解を受けると検出可能な変色を生成するために選択される。適切な酵素の例には、アルカリホスファターゼ及びペルオキシダーゼが含まれる。さらにまた、上述した発色性基質よりむしろ蛍光産物を産生する蛍光源基質を使用することもまた可能である。すべての場合に、酵素標識抗体は一次抗体ハプテン複合体へ添加され、結合させられ、次に過剰な試薬が洗い流される。適切な基質を含有する溶液が次に抗体−抗原−抗体の複合体へ添加される。基質は二次抗体に連結した抗体と反応し、定性的可視シグナルを生じさせるが、これはさらに通常は分光測光法によって、サンプル中に存在していた抗原の量の指標を提供するために定量することができる。「レポーター分子」は、さらに細胞の凝集若しくは凝集の阻害(例えばラテックスビーズ上の赤血球等)についての使用にも及ぶ。
又は、蛍光化合物、例えばフルオレセイン及びローダミンは、それらの結合能力を変化させずに抗体へ化学的に結合させることができる。特定波長の光線を用いた照明により活性化すると、蛍光色素標識抗体は光線エネルギーを吸収し、分子内の興奮性への状態を誘導し、光線顕微鏡を用いて視覚的に検出可能な特徴的な色での光線放出が続く。EIAにおけるのと同様に、蛍光標識抗体は、一次抗体−ハプテン複合体へ結合させられる。未結合試薬を洗い流した後、残留している三次複合体は次に、適切な波長の光線に曝露させられ、観察された蛍光は当該のハプテンの存在を示す。免疫蛍光及びEIA法は、どちらも当分野において明確に確立され、本方法のために特に好ましい。しかし、その他のレポーター分子、例えば放射性同位体、化学発光若しくは生物発光分子もまた使用できる。
(v)細胞表面上の、例えば免疫組織化学によるタンパク質位置マーカーの変化した発現を決定する。
(vi)上記の項目(iv)及び(vi)に詳述したものに加えて、任意の適切な機能試験、酵素試験若しくは免疫学的試験に基づく変化したタンパク質発現を決定する。
当業者であれば、ルーチン方法の問題として、所与の方法を特定タイプの生物学的サンプルへ適用する適切性を決定することができよう。
決して本発明を限定するわけではなく、そして上記で詳述したように、遺伝子発現レベルは、当分野において公知の様々な方法によって測定できる。例えば、遺伝子転写若しくは翻訳産物を測定できる。遺伝子転写産物、即ちRNAは、例えば、ハイブリダイゼーションアッセイ、ラン−オフアッセイ、ノーザンブロット、又は当分野において公知の他の方法によって測定できる。
ハイブリダイゼーションアッセイは、一般に、一本鎖RNA転写産物へハイブリダイズするオリゴヌクレオチドプローブの使用を含んでいる。そこで、オリゴヌクレオチドプローブは、転写されたRNA発現産物に相補的である。典型的には、配列特異的プローブは、RNA若しくはcDNAへハイブリダイズするように指令することができる。本明細書で使用する「核酸プローブ」は、相補的配列へハイブリダイズするDNAプローブ若しくはRNAプローブであってよい。当業者であれば、配列特異的ハイブリダイゼーションが発生するようなプローブを設計する方法を知っているであろう。当業者であれば、さらに特異的RNAを生成するために転写された遺伝子のための遺伝子発現の量の尺度として配列特異的ハイブリダイゼーションの量を定量する方法をさらに知っているであろう。
ハイブリダイゼーションサンプルは、特異的遺伝子発現産物への核酸プローブの特異的ハイブリダイゼーションを可能にするために十分な条件下で維持される。本明細書で使用する「特異的ハイブリダイゼーション」は、ほぼ正確なハイブリダイゼーション(例、たとえミスマッチが存在したとしても、ごく少数である)を示す。特異的ハイブリダイゼーションは、高ストリンジェンシー条件下又は中ストリンジェンシー条件下で実施できる。1つの実施形態では、特異的ハイブリダイゼーションのためのハイブリダイゼーション条件は高ストリンジェンシーである。例えば、特定の高ストリンジェンシー条件は、低相補的核酸から完全相補的核酸を識別するために使用できる。核酸ハイブリダイゼーションのための「高ストリンジェンシー条件」、「中ストリンジェンシー条件」及び「低ストリンジェンシー条件」は、Current Protocols in Molecular Biologyの第2.10.1〜2.10.16及び第6.3.1〜6.3.6頁(Ausubel, F. et al., “Current Protocols in Molecular Biology”, John Wiley & Sons, (1998)(それらの全教示は参照して本明細書に組み込まれる))に説明されている。ハイブリダイゼーションのストリンジェンシーを決定する正確な条件は、イオン強度(例、0.2×SSC、0.1×SSC)、温度(例、室温、42℃、68℃)及び不安定化剤(例えばホルムアミド又は変性剤(例えばSDS))の濃度だけではなく、核酸配列の長さ、塩基組成、ハイブリダイジング配列間のミスマッチ率及び他の非同一配列内のその配列のサブセットの発生頻度にも依存する。そこで、同等条件は、2つの核酸分子間の同一性若しくは類似性の類似度を維持しながら、これらのパラメータの1つ又はそれ以上を変化させることによって決定できる。典型的には、条件は、相互に対して少なくとも約60%、少なくとも約70%、少なくとも約80%、少なくとも約90%又は少なくとも95%以上同一である配列がもう一方にハイブリダイズしたままであるように使用される。ハイブリダイゼーション条件をハイブリダイゼーションが発生しないストリンジェンシーレベルからハイブリダイゼーションが最初に観察されるレベルへ変化させることによって、サンプル中の最も相補的な配列を備えて(例、選択的に)所与の配列をハイブリダイズさせる条件を決定できる。
中ストリンジェンシー若しくは低ストリンジェンシーの条件についての洗浄条件の決定を記載する代表的条件は、Kraus, M. and Aaronson, S., 1991. Methods Enzymol., 200:546-556及びAusubel et al., Current Protocols in Molecular Biology, John Wiley & Sons, (1998)に記載されている。洗浄は、通常はハイブリッドの相補性の最小レベルを決定できるように条件が設定されている工程である。一般に、相同性ハイブリダイゼーションだけが発生する最低温度から開始して、(SSC濃度定数を保持しながら)最終洗浄温度が減少させられる各℃は、ハイブリダイズする配列間の最高ミスマッチ率を1%増加させる。一般に、SSCの濃度を2倍にすると、Tにおいて約17℃の増加が生じる。これらのガイドラインを用いると、洗浄温度は、求められるミスマッチのレベルに依存して、高ストリンジェンシー、中ストリンジェンシー若しくは低ストリンジェンシーに対して経験的に決定できる。例えば、低ストリンジェンシー洗浄は、0.2×SSC/0.1% SDSを含有する溶液中で10分間に渡り室温での洗浄を含むことができる;中ストリンジェンシー洗浄は、0.2×SSC/0.1% SDSを含有する予備加温(42℃)した溶液中で42℃で15分間に渡る洗浄を含むことができる;及び高ストリンジェンシー洗浄は、0.1×SSC/0.1% SDSを含有する予備加温(68℃)した溶液中で68℃で15分間に渡る洗浄を含むことができる。さらに、洗浄は、当分野において公知であるように所望の結果を入手するために反復して、又は連続的に実施できる。同等条件は、当分野において公知であるように、標的核酸分子と使用されるプライマー若しくはプローブ(例、ハイブリダイズされる配列)との間の相補性の類似度を維持しながら、1例として示したパラメータの1つ又はそれ以上を変化させることによって決定できる。
本発明の関連する態様は、核酸アレイであって、そのアレイが複数の、
(i)上述した位置マーカー遺伝子のいずれか1つに対応するヌクレオチド配列若しくはそれと少なくとも80%の同一性を示す配列を含む核酸分子又は前記核酸分子の官能的な誘導体、フラグメント、変異体若しくはホモログ;又は
(ii)42℃の低ストリンジェンシー条件下で(i)の配列のいずれか1つ又はそれ以上にハイブリダイズすることのできるヌクレオチド配列を含む核酸分子、又は前記核酸分子の官能的な誘導体、フラグメント、変異体若しくはホモログ;
(iii)42℃の低ストリンジェンシー条件下で(i)の配列のいずれか1つ又はそれ以上にハイブリダイズすることのできるヌクレオチド配列を含む核酸プローブ若しくはオリゴヌクレオチド、又は前記核酸分子の官能的な誘導体、フラグメント、変異体若しくはホモログ;
(iv)(i)若しくは(ii)の核酸分子によってコードされたタンパク質、又はそれらの誘導体、フラグメント、若しくはホモログを含み、
前記核酸の発現のレベルは、大腸に由来する細胞若しくは細胞亜集団の近位−遠位起源を示す核酸アレイを提供する。
本明細書において42℃での低ストリンジェンシーとの言及は、ハイブリダイゼーションのための少なくとも約1%(v/v)〜少なくとも約15%(v/v)のホルムアミド及び少なくとも約1M〜少なくとも約2Mの塩、及び洗浄条件のための少なくとも約1M〜少なくとも約2Mの塩を含み、そしてこれらを包含している。必要な場合にはまた別のストリンジェンシー条件、例えばハイブリダイゼーションのための少なくとも約16%(v/v)〜少なくとも約30%(v/v)のホルムアミド及び少なくとも約0.5M〜少なくとも約0.9Mの塩、並びに洗浄条件のための少なくとも約0.5M〜少なくとも約0.9Mの塩を含み、これらを包含する中ストリンジェンシー、又はハイブリダイゼーションのための少なくとも約31%(v/v)〜少なくとも約50%(v/v)のホルムアミド及び少なくとも約0.01M〜少なくとも約0.15Mの塩、並びに洗浄条件のための少なくとも約0.01M〜少なくとも約0.15M塩を含み包含する高ストリンジェンシーを適用してもよい。一般に、洗浄はT=69.3+0.41(G+C)%[19]=−12°Cで実施される。しかし、二本鎖DNAのTは、ミスマッチ塩基対の数における1%の増加に伴って1℃ずつ低下する(Bonner et al (1973) J. Mol. Biol. 81:123)。
1ライブラリ若しくは1アレイの核酸若しくはタンパク質マーカーは、豊富かつ高度に貴重な情報を提供する。さらに、そのような配列の2つ又はそれ以上のアレイ若しくはプロファイル(アレイの使用から得られた情報)は、1セットの試験結果と基準、例えばまた別のサンプル若しくは保存されたキャリブレータと比較するための有用なツールである。アレイを使用する際には、個々の核酸メンバーは、典型的には離れた位置へ固定化され、結合反応のために反応させられる。集合したマーカーセットと関連付けられたプライマーは、配列ライブラリを調製する、又は他の生物学的サンプルからのマーカーを直接的に検出するいずれかのために有用である。
1ライブラリ(若しくは、ライブラリ内の少なくとも一部の配列に対応する物理的に分離した核酸について言及する場合は、アレイ)の遺伝子マーカーは、高度に望ましい特性を示す。これらの特性は、特異的条件と結び付き、調節プロファイルとして特徴付けることができる。本明細書で言及するプロファイルは、それをマーカーが起源とする組織の診断情報を提供する1セットのメンバーを意味する。多くの例におけるプロファイルは、預託された配列から作製されたアレイ上の一連のスポットを含んでいる。
特徴的な患者プロファイルは、一般にアレイの使用によって調製される。アレイプロファイルは、1つ又はそれ以上の他のアレイプロファイル若しくは他の参照プロファイルと比較することができる。比較結果は、疾患状態、発達状態、治療に対する受容性に関する豊富な情報及び患者についてのその他の情報を提供できる。
本発明のまた別の態様は、生物学的サンプルをアッセイするための診断用キットであって、1つ又はそれ以上の近位−遠位マーカーを検出するための作用物質及び第1区画内におけるその作用物質による検出を促進するために有用な試薬を含むキットを提供する。例えば、生物学的サンプルを受領するためのまた別の手段も含めることができる。作用物質は、任意の適切な検出分子であってよい。
以下では、本発明を非限定的実施例によってさらに記載する。
正常な大腸内での示差的転写産物発現のマップ
材料及び方法
遺伝子発現データ
非腫瘍性大腸に沿ってヒト遺伝子発現の変化を探索するために、本発明者らは、(Lipshutz et al., 1999, Nat Genet 21:20-24)に記載されているAffymetrix社(米国カリフォルニア州サンタクララ)製GeneChip(登録商標)オリゴヌクレオチドマイクロアレイシステムを使用して収集された遺伝子発現データを使用した。これらのデータは、2つの独立したAffymetrix社(米国カリフォルニア州サンタクララ)製ヒトゲノム133 GeneChipデータセット:「ディスカバリ(discovery)」のためのHGU−133 A&Bチップデータの大規模商業的マイクロアレイデータベース、及び本発明者らが「バリデーション(validation)」のために作製した小規模のHGU−133 Plus 2.0マイクロアレイデータセットである。
大規模データセットは、遺伝子発現パターンを同定するために分析し、独立して引き出した第2発現セットを使用してこれらのパターンをバリデート(確認)した。そこで、第1データセットは仮説を作成するために検索し、第2セットは仮説を試験するために使用した。
本試験のためのデータは、結腸直腸組織標本から単離したポリ−A mRNA転写産物から合成した標識cRNAへハイブリダイズさせたオリゴヌクレオチドマイクロアレイである。本発明者らが使用するAffymetrixプラットフォームは、プローブセットと呼ばれる1パネルの11完全マッチ25bpオリゴヌクレオチドプローブ(及び11ミスマッチプローブ)を用いて標的mRNA転写産物を定量するために設計されている。プローブセット結合強度の生物学的関連性を決定するために、本発明者らは、入手可能な最も新しいAffymetrixメタファイル及びBioConductorライブラリを用いて、生じたプローブセットのリストに注釈を付けた。本発明者らは、任意の所与の標的「遺伝子」に対して理論的に反応性であるマイクロアレイプラットフォーム上には多数のプローブセットが存在することに注目している。本発明者らの関心の焦点は大腸に沿って転写産物発現動力学を探索することであり、基礎にあるゲノム機構を解明することではないので、この現象を詳細には探索しない。
それでも、この基本的な注釈の詳細は、これらのデータの生物学的関連性を解釈する場合には考慮に入れなければならず、本発明者らは読者(及びこれらの技術を使用する他の研究者)には用語「遺伝子」及び「プローブセット」を互換的に使用する危険性に警戒を払うように注意を促しておく。
「ディスカバリ」用データセット
184片の結腸直腸組織標本についての遺伝子発現及び臨床的記述は、GeneLogic社(米国メリーランド州ゲーサーズバーグ)から購入した。
以下の特性を備える個々の組織マイクロアレイデータを選択した。盲腸、上行結腸、下行結腸、S状結腸、若しくは直腸の1つと指定される解剖学的に同定可能な切除部位を備える他の点では健常な(即ち、標本部位で炎症若しくは他の疾患の証拠が見られない)組織標本由来の非腫瘍性結腸直腸粘膜(組織学検査によって確証した)。
GeneLogicデータベースから選択した各組織について、本発明者らは、計44,928個のプローブセット(HGU133A及びHGU133Bを合わせて)、各組織についての実験及び臨床的記述子、並びに組織学的標本のデジタル保存された顕微鏡写真を含有する生データの電子ファイルを受領した。各データの記録は、臨床的一貫性のために手作業により評価し、記録のサンプルは、デジタル保管された組織学検査画像を用いる組織病理学的検査のために無作為に選択した。品質管理分析は、製造業者によって規定された必須の品質管理尺度を満たしていないアレイを同定かつ除去するために実施した(Affymetrix, 2001、Wilson and Miller, 2005, Bioinformatics)。
遺伝子発現レベルは、Microarray Suite(MAS) 5.0(Affymetrix社)及びRobust Multichip Average(RMA)標準化技術の両方によって計算した。(Affymetrix, 2001、Hubbell et al., 2002, Bioinformatics 18:1585-1592、Irizarry et al., 2003, Nucleic Acids Res 31:e15]。MAS標準化データは、標準品質管理ルーチンを実施するために使用し、その後の全分析について最終データセットはRMAを用いて標準化した。
「バリデーション」用データセット
「バリデーション」用セット内の結腸直腸標本は、大都市であるアデレードにある第3紹介病院組織銀行(tertiary referral hospital tissue bank)(Repatriation General Hospital and Flinders Medical Centre)から収集した。組織銀行及び本プロジェクトは、Repatriation General Hospitalの研究倫理審査委員会による承認を受け、試験対象の各組織については患者からの同意を受領した。外科的切除に続いて、標本は無菌容器内に配置され、手術室から収集された。手術による切除から手術室からの収集までの時間は、様々であったが30分間以内であった。サンプルは、サイズがおよそ125mm(5×5×5mm)であり、結腸領域並びに病変に近位若しくは遠位のいずれかの距離の両方で規定された、可能な限り病変から離れた場所で肉眼的には正常な組織が採取された。組織はクリオバイアル(cryovial)中に配置され、その後直ちに液体窒素中に浸漬させられ、処理時まで−150℃で保存された。
本発明者らは、標準プロトコール及び市販で入手できるキットを使用して冷凍サンプルを処理した。手短には、冷凍組織は、RNase活性を中和するために冷却したPromega SV RNA溶解バッファー(Promega社、オーストラリア国シドニー)の存在下でカーバイドビーズミル(Mixer Mill MM 300、Qiagen社、オーストラリア国メルボルン)を使用してホモジナイズした。各組織についてのホモジナイズした組織溶解物は、便宜的容量に等分し、−80℃で保存した。全RNAは、Promega SV Total RNAシステムを製造業者の取扱説明書に従って使用して組織溶解物から抽出し、完全性はゲルエレクトロフォレーシスによって視覚的に評価した。
mRNA転写産物の相対発現を測定するために、組織RNAサンプルはAffymetrix HG U133 Plus 2.0 GeneChips
(Affymetrix社、米国カリフォルニア州サンタクララ)を製造業者のプロトコル(Affymetrix, 2004)に従って使用して分析した。ビオチン標識cRNAは、「One−Cycle cDNA」キット(T7−oligo(dT)プライマーを組み込んでいる)及びGeneChip IVT標識キットとともに5μg(1.0μg/μL)の全RNA(約1μgのmRNA)を用いて調製した。インビトロ転写cRNAは、フラグメント化し(20μg)、品質管理のためにハイブリダイゼーションの前に分光法及びゲルエレクトロフォレーシスによって分析した。最後に、ハイブリダイゼーションカクテルは、15μgのcRNA(0.5μg/μL)を用いて調製し、Affymetrixハイブリダイゼーションチャンバ640内で16時間にわたり45℃でHG U133 Plus 2.0マイクロアレイへハイブリダイズさせた。各cRNAサンプルには、品質モニタリングのために標準真核生物ハイブリダイゼーションコントロールを用いてスパイクした。
ハイブリダイズしたマイクロアレイは、ストレプトアビジンフィコエリトリンを用いて染色し、Affymetrix Fluidics Station 450を使用してビオチン化抗ストレプトアビジン抗体を含有する溶液を用いて洗浄した。最後に、染色かつ洗浄したマイクロアレイをAffymetrixスキャナ3000によってスキャンした。
マイクロアレイ画像生ファイルをデジタル化フォーマットへ変換させるためには、Affymetrixソフトウエアパッケージを使用した。上述したディスカバリ用セットと同様に、バリデーション用データセットのための遺伝子発現レベルは、品質管理目的にはMAS 5.0(Affymetrix社)を、そして発現データについてはRMA標準化法を用いて作成した。
統計学的分析
図10に示したように、検出システムは、サポートベクターマシン(SVM)モジュール1002、プロファイルアナライザ1004、主成分アナライザ1006、及び分類器モジュール1007を含む検出モジュール1002〜1007を含んでいる。本検出システムは、大腸の近位−遠位軸に沿って、その腸由来の細胞、若しくは細胞集団の起源を表す位置データを生成する検出方法を実行する。位置データは、その細胞若しくは細胞集団内の遺伝子の発現を表す遺伝子発現データを処理する工程によって生成される。上述した実施形態では、検出システムは、標準的なコンピュータシステム、例えばIntel IA−32をベースとするコンピュータシステムであり、そして検出モジュール1002〜1007は、そのコンピュータシステムと結び付けられた非揮発性(例、ハードディスク)記憶装置1020上に保存されたソフトウエアモジュールとして実行される。しかし、本明細書に記載した検出モジュール1002〜1007若しくは検出方法の少なくとも一部は、或いは1つ又はそれ以上の専用ハードウエア成分、例えば特定用途向け集積回路(ASIC)として実行できることは明白であろう。
本明細書に記載した実施形態では、本検出システムはさらに、C++ライブラリを含むC++言語サポートを提供するためのC++モジュール1008、及び(Venables and Ripley, 2002)に記載されてhttp://cran.r−project.orgでのCRANオープンソース保管場所から入手できるR統計プログラミング言語及びMASSライブラリのためのサポートを提供するRモジュール1012もまた含んでいる。本システムはさらに、http://www.r−project.orgで記載されているように、プロファイルアナライザ1004及び主成分アナライザ1006と一緒に、Rプログラミング言語において実行されるhttp://www.bioconductor.orgから入手できるBioConductorソフトウエアアプリケーション1010も含んでいる。SVM 1002は、C++プログラミング言語で実行される。分類器モジュール1007は、http://www.bioinformatics.csiro.au/products.shtml及びその中で提供された参考文献に記載されたように、GeneRaveアプリケーションである。本システムはさらに、Microarray Suite(MAS) 5.01014、及びRobust Multichip Average(RMA)標準化アプリケーション1016もまた含んでいるが、どちらもAffymetrix社から入手でき、http://www.affymetrix.comに記載されている。ソフトウエアアプリケーションは、標準オペレーティングシステム1018、例えばLinux若しくはMac0S 10.4の制御下で実行され、本コンピュータシステムは、少なくとも1基のプロセッサ1022、ランダムアクセスメモリ1024、キーボード1026、標準ポインティングデバイス、例えばマウス1028、及びディスプレイ1030を含む標準コンピュータハードウエア成分を含んでいるが、それらは全部、図示したようにシステムバス1032を介して相互接続されている。
本検出方法は、図11の一般形に記載の分類方法を含んでいる。最初に工程1102では、本システムは公知の近位−遠位起源の細胞内での遺伝子の発現を表す発現データを受信する、さもなければ発現データを入手する。工程1104では、多変量若しくはその他の分類法若しくは決定法の形態が、以下で説明するように、分類データを生成するために発現データに適用される。典型的には、発現データは、単独若しくは組み合わせて、既に大腸の近位−遠位軸に沿って示差的に発現することが公知である遺伝子の発現を表す。しかし、本方法は、以下で説明するように、そのような遺伝子及び/又は遺伝子の組み合わせを同定するためにも使用できる。工程1106では、分類データは、大腸に沿ってその細胞の近位−遠位起源を予測するために、未知の起源の細胞内での同一遺伝子の発現を表すまた別の発現データに適用される。
さらに、当業者には、最初に生成された分類データによって表される結果として生じた分類子(classifier)若しくは識別機能は、分類の結果及びそれらの有用性を向上させるために決定の理論的原理に基づいて調整できることは明白であろう。例えば、結果の見込みにおいて以前の意見を組み込むことができる、及び/又は様々な誤分類のケースのコストに基づいて決定表面(decision surface)を修飾することができる。決定理論、損失関数を最小限に抑える、及び誤分類のコストについてのこれらの方法およびその他の関連の方法は、(Krzanowski and Marriott, 1995)に記載されている。
全ての統計学的分析のためには、本発明者らは、R統計学環境のためにBioConductor社から入手できるオープンソースソフトウエアを使用した(Rは、S統計学分析環境のオープンソース実行である)(Bioconductor社、www.bioconductor.org)(Gautier et al., 2004, Bioinformatics 20:307-315、Gentleman et al., 2004, Genome Biol 5:R80)。
遺伝子発現レベルの線形及び非線形組み合わせを生成かつ処理するために使用される、線形回帰、多重線形回帰、線形判別分析、ロジスティック回帰、一般化線形モデル、及び主成分分析を含む線形方法は、全部が例えば(Hastie, 2001)に記載されている。これらの方法はRで実行される。
遺伝子発現勾配は、3種の分析技術を用いて分析した。第1に、本発明者らは、通常の単変量法で大腸に沿って個別遺伝子の遺伝子発現変化を比較した。次に、本発明者らは、二分性(近位 対 遠位)発現変化を段階的(マルチセグメント)変化モデルと比較するために線形モデルを用いて発現の統計的有意差を示している特定遺伝子を詳細に探索した。最後に、本発明者らは、近位−遠位軸に沿った繊細なゲノム全般に及ぶ発現変動を理解するために多変量法を適用した。そのようなゲノム全般に及ぶ発現変動は、ニアレストネイバー(nearest−neighbour)法を含む、(Ripley, 1996)に記載されたノンパラメトリック法を用いてデータを得た(interrogate)。
個別遺伝子発現マップ
単変量示差的発現
近位及び遠位の大腸間で示差的に発現した遺伝子転写産物は、Rについての「limma」Bioconductorライブラリ(Smyth, 2005)において実行された中等度のt検定を用いて同定した。有意性推定値(p値)は、多重仮説試験(MHT)について調整するために保守的ボンフェローニ(conservative Bonferroni)補正を用いて補正した。盲腸 対 直腸に限定した組織のサブセットを同様に試験した。
示差的に発現したと同定された遺伝子転写産物についても、修飾t検定を用いてプローブセット毎に「バリデーション」用標本において評価した。バリデーション用データにおいて同様に示差的であった示差的プローブセットの総数の有意性を評価するために、「バリデーションされた」プローブセットの数はモンテカルロ・シミュレーションを用いて推定したヌル分布と比較した。
マルチセグメント大腸モデル対2セグメント大腸モデルの比較
セグメント間の遺伝子発現変動の性質を評価するために、本発明者らは、マルチセグメント 対 2セグメントフレームワーク内で線形モデルへの相対適合性について示差的に発現したプローブセットを分析した。この分析の目的は、大腸の末端間で示差的に発現することが公知であるプローブセットのセグメント間発現が、継続的段階化に近似する5セグメント線形モデルによって、又はより単純な二分の「近位」対「遠位」勾配のいずれによってより良好にモデリングされるのかを探索することである。本発明者らのデータは、結腸直腸セグメントの指定によってのみ同定され、大腸の全長に沿った連続的測定によって同定されるものではないので、本発明者らは、組織セグメントの位置を用いて連続モデルに近似させる。本発明者らは、大腸の近位−遠位軸に沿って変動する転写産物を同定する可能性を最大化するために、最も末端のセグメント(盲腸及び直腸)間で示差的に発現しているプローブセットを選択する。
本発明者らは、各組織について結腸直腸セグメントによって規定した指標マトリックスに従って5因子ロバスト線形モデルを使用して、最初に大腸の近位−遠位軸に沿ったこれらのプローブセットの発現をモデリングした。このモデルについて、各組織は、生検位置によって、盲腸、上行結腸、下行結腸、S状結腸、又は直腸の1つへ指定した(以下に記載する理由から、横行組織はこの分析には含めなかった)。この5セグメントモデルを次に、大腸の理論的な近位及び遠位の領域に対応する設計マトリックスを備える2因子ロバスト線形モデルと比較した。両方のモデル比較には同一データを使用したが、2セグメントモデルについては、第1因子(近位組織に対応する)は盲腸及び上行結腸由来の組織全部を含んでいたが、第2因子(遠位大腸に対応する)は、下行結腸、S状結腸及び直腸セグメント由来の全組織を含んでいた。
これらの別個のモデルを各プローブセットについて比較する場合には、本発明者らは、より複雑な5セグメントモデルによって提供される改良された当てはめ(減少した回帰残留)は単純な2セグメントモデルより有意に優れているという仮説Haを評価するためにF検定を使用した。非有意な残留減少は、ヌル仮説を拒絶しないことを示す。
H0:単純な代替モデルに比してより複雑な5セグメントモデルを採用することに固有の価値はない。
多変量遺伝子発現パターンのマッピング
結果
遺伝子発現データの収集
ディスカバリ用及びバリデーション用データセット
ディスカバリ用データセットは、GeneLogic社から購入したAffymetrix HG U133A/B GeneChipマイクロアレイへのcRNAのハイブリダイゼーションからのデータを用いて生成した。
HG U133A/B GeneChipについての包含基準及び品質保証基準を満たしている184片の正常組織由来のデータを分析し、仮説作成のために使用した。組織は、以下のセグメントサブセット(29片の盲腸、45片の上行結腸、13片の下行結腸、54片のS状結腸、及び43片の直腸)を含んでいた。各組織について、44,928個のプローブセットについてバックグラウンドを補正し、RMA前処理を用いて標準化した。
「バリデーション」用データセットを構築するために、8片の近位組織標本及び11片の遠位標本から調製した標識cRNAへ19HG U133 Plus2.0 GeneChipをハイブリダイズさせた。組織及びGeneChip容認性についてのストリンジェントな品質管理パラメータのために、このバリデーション用データセットは、マルチセグメントモデルを探索するために十分な組織を含んでいなかった。各マイクロアレイは、54,675個のプローブセットについて転写産物の発現を測定した。
近位及び遠位の大腸間の理論的接合点は、肝湾曲部から測定して横行結腸の全長のおよそ3分の2である。(Yamada and Alpers, 2003、上記)。サンプルデータは、横行結腸に沿った間隔に対して特異的ではなかったので、これらの組織はディスカバリ分析からは除外した。
大腸に沿った遺伝子の変動
個別遺伝子の発現変化
単変量示差的発現
大腸の解剖学的セグメント間の「天然」分割点を探索するために、本発明者らは、仮説的「分割線」を盲腸から直腸へ段階的に移動させた場合のプローブセット発現変化の絶対数を測定した。図1は、全連続的セグメント間の組み合わせについて示差的に発現したプローブセットの数を示している。統計的有意ではないが、プローブセット差の最高数206は、近位及び遠位の領域が上行結腸及び下行結腸セグメント間で分割された場合に発生する。この分割点は胚発生並びに近位及び遠位セグメントの通例の分離の両方に関する本発明者らの理解と一致しているので、本発明者らの研究は、近位及び遠位の組織はこの様式で分離されていると仮定した。
およそ154個の公知の遺伝子標的に対応する計206個のプローブセットは、対応する領域に比較して近位若しくは遠位の結腸直腸サンプル中でより高度に示差的に発現した(ボンフェローニ補正、p<0.05)。これらの206個のプローブセット中、31個(16.5%)はさらに有意差を伴ってバリデーション用データにおいても示差的に発現した(31/206、モンテカルロ推定による、p<<0.05)。
計115個のプローブセットは、盲腸(n=29)及び直腸(n=43)からのみ選択した組織間で示差的に発現した。これらのプローブセット中102個(89%)は上述した近位及び遠位の大腸間で異なる206個のプローブセット中に含まれているが、基本的には、大腸の最末端間で相違する遺伝子発現転写産物を単離するためには、盲腸対直腸の遺伝子発現が有用である。このサブセットでは、28個(24.3%)のプローブセットがバリデーション用データにおいても直腸 対 盲腸で同様に示差的に発現した(28/115、モンテカルロ推定による、p<<10−5)。
示差的に発現したプローブセット並びに近位及び遠位組織において上昇した発現を伴うプローブセットについての差分統計量は、各々表1及び2に示されている。図2は、各々近位(n=94)又は遠位(n=126)腸(若しくは盲腸及び直腸)において有意に高く発現したプローブセットの数を比較している。
マルチセグメント遺伝子発現モデル
示差的発現についての分析もまた、盲腸から直腸へ順に全5つのセグメント間移動について実施した(即ち、盲腸 対 上行結腸、上行結腸 対 横行結腸など)。興味深いことに、任意の2つの隣接セグメント間で有意な程度に示差的に発現した転写産物は見られなかった(中等度t検定;p<0.05)。
これらの遺伝子転写産物の発現変化の正確な性質を探索するために、本発明者らは、各組織サンプルについての位置に基づいて発現データに当てはめたロバスト線形モデルを構築かつ比較した。単変量プローブセット発現の2つのロバスト線形モデルを、大腸の2つの末端セグメントである盲腸及び直腸間で示差的に発現した115個のプローブセット各々について比較した。詳細には、本発明者らは、これらの末端セグメント間で示差的に発現した転写産物の発現が単純な2セグメントモデルによって、又はより記述的な5セグメントモデルによってより良好に説明(残留当てはめに関して)されるかどうかをクエリーした。
示差的に発現した115個のプローブセット中、本分析は複雑なモデルが65例(57%)のケースについて観察された遺伝子発現データへ当てはめたモデルを有意に改善しないというヌル仮説を拒絶しなかった(F検定、p>0.05)。そこで、大腸に沿ってこれらの示差的に発現した転写産物の半分超は2セグメント発現モデルによってモデリングすることに成功したので、これにより発現は二分性であり、近位 対 遠位いずれかの位置によって規定される。盲腸及び直腸間で最も示差的に発現したプローブセットは、PRACに対する転写産物である。この転写産物についての2セグメントモデル及びマルチセグメントモデルの比較は、図3に示されている。
残りの50個(43%)のプローブセットについては、ヌル仮説は拒絶され(p<0.05)たが、これはセグメント位置に依存する5因子モデルが実際に有意な方法で、近位−遠位軸に沿ってそのような転写産物の発現の予測有効性を向上させることを示唆している。これらのモデルについての検討は、大多数のモデルが、大腸に沿って進行する組織中で単調に増加するか、又は単調に減少することを確証している。
興味深いことに、50個のマルチセグメントモデル中41個(82%)は大腸を横断して段階的増加を示すが、近位から遠位発現へ段階的減少を示すのは9個(18%)のモデルに過ぎないことである(図4に示した)。両方の有機溶質トランスポーターについてのモデルであるα(OSTalpha)及びホメオボックス遺伝子B13(HOXB13)は、図5に例示したように、5セグメントモデルを用いると有意に向上する。
大腸に沿った遺伝子発現パターン
大腸に沿った個別遺伝子変化の分析に加えて、本発明者らは、多変量分析法を使用して、近位−遠位軸に沿った遺伝子変化のパターンを探索した。
監視主成分分析(Supervised Principal Components Analysis)
器官レベルでの発現変動性の構造を可視化かつ探索するために、本検出システムの主成分アナライザ(PCA)1006を用いて主成分分析(PCA)及び監視PCAとして公知であるPCAの変形を遺伝子発現データへ適用した。PCAは、(Venables and Ripley, 2002)に記載され、Rで実行した。監視PCAについての詳細な記述は、(Bair et al., 2004)に見いだすことができる。
最初に、「ディスカバリ用」データセットの全44,928個のプローブセットの遺伝子発現を表す発現データを、主成分分析(PCA)を使用してPCAモジュール1006によって処理した。PCAは、次元数を減少させるためにデータセットの次元の線形変換を生じさせることによって多次元データセットを単純化するための標準方法である。変換されたデータは、「主成分」の分類されたセットを表す主成分データとして提供されるので、第1主成分は最大分散を有し、第2主成分は2番目に大きい分散を有するなどである。完全データセットへPCAを適用した結果は、第1主成分がx軸にプロットされ、第2主成分がy軸にプロットされているグラフである図6Aに示した多変量若しくは主成分データを含んでいる。この低次元見込み収益(perspective yield)についての検査は、組織セグメントと一致するデータ内で明白な構造を生じさせないが、これは全遺伝子に渡って測定された遺伝子発現変動の主要起源が組織の位置とは独立していることを示唆している。
全遺伝子のサブセットを使用して組織位置を示す1つ又はそれ以上の主成分を生成できるかどうかを調査するために、発現データを監視PCAによって分析した。(Bair et al., 2004)に記載されたように、監視PCAは標準主成分分析に類似するが、主成分を生成するためには1サブセットの特徴/遺伝子(通常は、一部の単変量手段によって選択される)しか使用しない。この場合には、盲腸と直腸(即ち、大腸の両末端(extreme ends))間で示差的に発現した遺伝子のセットをPCA分析のために選択した。しかし、他の形態の特徴選択もまた代わりに使用できよう。詳細には、大腸の全セグメント由来の全184の正常組織を別にして、減少したデータマトリックスは盲腸及び直腸から採取した組織サンプル間で示差的に発現する115個のプローブセットだけを含めることによって生成した。標準PCAは、次にこの特徴特異的データに関して実施した。図6Bに示したように、最初の2つの主成分のグラフは、近位 対 遠位の分割線にほぼ対応する184片の組織サンプル内での2つの大きな亜集団の存在を示唆している。この細胞起源への依存性は、図7Bに図示したように、第1主成分を大腸に沿った細胞起源の関数としてグラフ表示するとより明白に視認される。図7Bに示した記号は、四分位範囲(即ち、データの半分)を表し、「エラーバー」は、1.5×四分位範囲を示している。これらの限度外のデータは、外れ値と見なされ、個別にプロットされている。おそらくS状結腸と直腸との間には弱い分離が示唆されているようであるが、盲腸及び上行結腸の前方組織は強度に重複し、分離は不良である。
主成分データを使用するとこれらの細胞由来の遺伝子の発現に基づいて細胞の起源を予測することができたが、以下で説明するように、この作業のためには他の分析方法が好ましい。
プロファイル分析(正準変量分析)
腸に沿った発現パターンもまた、セグメント間 対 セグメント内の発現変動を可視化するためにProfile Analysisを用いてプロファイルアナライザ1004によって分析した。(Kiiveri, 1992)に記載されたように、プロファイル分析は変量の数が観察結果の数を超えるケースに適合する標準正準変量分析の変法である。この方法は相当に少数の独立因子を用いて因子分析モデル(Kiiveri, 1992)によってp×pクラス内共分散マトリックス(p x p within-class covariance matrix)Sをモデリングする。正準変量の各々における各項(即ち、遺伝子)の有意性を決定するためには、順列試験を使用する。有意な項だけを含めることによって、プロファイル分析は、特徴選択能力を提供する。
この方法は、クラス変動構造を特性付けるための探索用ツールとして一般に有用である。正準変量分析は、(Venables and Ripley, 2002)に記載されたように、R MASSライブラリ内で実行される。プロファイル分析は、(Kiiveri, 1992)に記載されたように、Rにおける著作権を有するライブラリ(proprietary library)内で実行される。
組織についてのセグメント標識に関する推測的知識を前提にして、プロファイル分析はクラス内(即ち、各セグメントを用いて)変動を最小限に抑えながら大腸の5つのセグメント各々の最大のクラス間分離を提供する限定された遺伝子転写産物サブスペースを同定することを試みる。完全データセットのプロファイル分析の結果は、第1正準変量がx軸に沿ってプロットされ、第2正準変量がy軸に沿ってプロットされているグラフとして図8Aに示した正準変量データを含んでいる。組織セグメントが第1正準変量と相関することは明白であるが、第2及びそれ以降の正準変量はクラス分離情報をほとんど、又は全く提供しない。この結果は、結腸直腸セグメント各々を分離することに同一プローブセットが含まれること、即ち組織セグメントの観点からの差の最大の原因は第1正準変量次元を生成するために使用されるセグメントであり、従って全セグメントがこの同一特徴セットのプローブセットによって最高に分類されることを示唆している。図8Bに示したように、第1正準変量が使用される場合でさえ、いずれのセグメントも完全には分離されないが、セグメントの自然な順序付けは明らかに保存されている。上述したPCAを用いた場合と同様に、正準変量データは、起源が未知である細胞の近位−遠位起源を分類するために使用できようが、この目的には以下に記載する方法が好ましい。
サポートベクターマシン
上述した多変量方法は大腸に沿った遺伝子発現変動を調査するためには有用であるが、ロバスト方法で組織の位置も予測する遺伝子を同定するために、そして低いクロスバリデーション・エラー率で組織の位置を予測するために使用できる最小サブセットのプローブセット/遺伝子を同定するために監視機械学習(surpervised machine leaning)を使用した。
記載した実施形態では、使用される特定形態の機械学習は、SVM(サポートベクターマシン)モジュール1002によって提供されるサポートベクターマシン(SVM)である;しかし、当業者には、その代りに他のカーネル法を使用できることは明白であろう。(Scholkopf, 2004)に記載されたように、カーネル法は、このマッピングの本質的特徴が単純なカーネルによって捕捉されると、それによって変量が別のスペースへマッピングされる線形方法の拡張法である。カーネル法は、カーネルスペース内では観察結果が線形に分離可能であるがオリジナルのデータスペース内では分離可能でないケースにおいて特に有益な可能性がある。
SVM 1002は、(Cristianini and Shawe-Taylor, 2000)に記載されたように、標準SVM法を使用して、クラス決定分割線に沿って観察結果(即ち、組織)を最大限に分離する特徴(遺伝子転写産物)の組み合わせを決定する。
詳細には、サポートベクターマシン(SVM)1002を使用して、その発現が盲腸及び直腸を起源とする細胞の最高の分離を可能にする完全データセットから最小サブセットのプローブセットを表す分類データを生成した。SVM 1002は、線形カーネルを用いてトレーニングし、各反復で生成された分類データは10倍クロスバリデーションを用いて評価した。転写産物の各サブセットからの最小寄与遺伝子転写産物(lowest contributing gene transcript)は、高予測精度を備える最小セットの転写産物を同定するために再帰的に排除した。
モデル内に含まれたプローブセットの数の関数としてのクロスバリデーションSVMエラー率(それらは除外に成功したので)は、図9に示されている。完全(0%)クロスバリデーション・エラー率を生じさせる最小特徴セットは、表3に示した13個のプローブセットを含んでいる。
独立データセットにおけるこのモデルの有用性を測定するために、13特徴モデルについての分類データをバリデーション用データ内の近位 対 遠位の予測性能について試験した。これらの13個のプローブセットを用いて構築した伝統的な線形判別分析モデルを使用して、8個の近位組織及び11個の遠位組織が100%の精度で予測された。
分類器モデル
SVM 1002の代替手段として、大腸に沿って起源が未知である細胞若しくは細胞集団の起源を同定するために使用できる遺伝子の組み合わせを同定するために、大腸の近位−遠位軸に沿って公知の位置から採取された組織サンプルから完全発現データを処理するために分類器1007もまた使用した。記載した実施形態では、http://www.bioinformatics.csiro.au/overview.shtmlで記載されたように、線形GeneRave分類器を使用した。GeneRaveは、変量の数が観察結果の数を超えるケースにおいて好ましい。しかし当業者には、非線形分類器及び正規化ロジスティック回帰に基づく分類器を含む、他の分類器を代わりに使用できることは明白であろう。
(Kiiveri 2002)に記載されたように、GeneRave分類器1007は、位置が未知であるサンプルの位置を正確に同定するために使用できるサブセットの遺伝子を同定するために発現レベルの線形組み合わせを表す分類データを生成する。GeneRave 1007は、ベイジアン(Bayesian)ネットワークモデルを使用して、他の遺伝子の線形組み合わせにおいてそれから対応する組織サンプルが採取される位置との何ら相関を有していない遺伝子を除外することによって遺伝子を選択する。
完全データセットのGeneRave分析の結果は、それらの発現レベルを使用すると大腸の近位−遠位軸に沿って対応する細胞の起源を正確に同定することができる1セットの7個の遺伝子に対応する分類データである。7個の遺伝子は、SEC6L1、PRAC、SPINK5、SEC6L1、ANPEP、DEFA5、及びCLDN8である。
考察
大腸に沿った遺伝子示差的発現のマップ
単変量発現分析は、ヒト成人における正常近位大腸領域と正常遠位大腸領域との間で示差的に発現する154個の固有の遺伝子標的に対応する206個のプローブセットを同定した。1サブセットの115個のプローブセット(近位 対 遠位のリストに89%共通)は、盲腸及び直腸の末端結腸直腸セグメント間で同様に示差的に発現する。興味深いことに、本発明者らは、任意の2つの隣接セグメント間で有意に示差的に発現する転写産物はないことを見いだした。
これらの所見の妥当性を推測するために、本発明者らは、独立セットのマイクロアレイデータ内でこれらの遺伝子転写産物の発現変化についても測定した。本発明者らの最初の184片の結腸直腸組織サンプルのディスカバリ用データセット内の206個の示差的に発現したプローブセット中31個は、19片の標本についてのバリデーション用データにおいてもまた示差的に発現した。
モンテカルロシミュレーションを用いて、本発明者らは、両方のデータセット内で示差的であるそのような多数のプローブセットは極めて可能性が低いことを証明した。
これらの「バリデートされた」転写産物中ほぼすべて(28/31、90%)が同様に盲腸及び直腸の2つの末端セグメント間で示差的に発現した。対応する遺伝子標的154個中57個(37%)は、独立手段によって近位大腸と遠位大腸との間で示差的に発現することが確証された。
個々の遺伝子についての転写産物の示差的発現
ディスカバリ用データ内で本発明者らが観察した最も有意に示差的なプローブセットは、PRACについての遺伝子転写産物に対してであった。PRACは、近位組織に比較して遠位大腸内で高度に発現する。さらに、PRACは上行及び下行の結腸直腸組織標本間で発生する急激な発現変化を伴って大腸に沿って低−高パターンで発現すると思われる。
本発明者らは、近位大腸と遠位大腸との間で示差的に発現する7個のHOX遺伝子に対応する8個のプローブセットを見いだした。哺乳動物ホメオボックス遺伝子ファミリーの39個のメンバーは、発生中の胚の前後軸に沿って身体セグメントの同一性を規定する高度に保存された転写因子からなる(Hostikka and Capecchi, 1998, Mech Dev 70:133-145、Kosaki et al., 2002, Teratology 65:50-62)。4群のHOX遺伝子パラログは前から後への順序、例えばHOXA1からHOX13に発現する(Montgomery et al., 1999, Gastroenterology 116:702-731)。近位組織内では小さな番号のHOX遺伝子が高度に発現するが(HOXD3、HOXD4、HOXB6、HOXC6及びHOXA9)、遠位大腸内では大きな番号の遺伝子がより多く発現する(HOXB13及びHOXD13)ことが見いだされている。
興味深いことに、本発明者らの所見では近位−遠位軸に沿って示差的に発現することが以前に証明されている一部の遺伝子転写産物が明確に存在しなかった。本発明者らのデータは、脊椎動物の範囲を超えて腸パターン発達に含まれていることが証明されていた転写因子である尾側ホメオボックス遺伝子であるCDX1若しくはCDX2について有意な発現勾配を証明していない(Chalmers et al., 2000)(James et al., 1994)(Silberg et al., 2000)。詳細には、CDX2は成人大腸内での結腸表現型を維持することに役割を果たすと考えられ、近年近位大腸では相当に高濃度で存在するが、遠位大腸内には存在しないことが証明された(James et al., 1994)(Silberg et al., 2000)。この遺伝子についてのプローブセット発現の統計学的分析も視覚的検査も、本発明者らのデータでは大腸に沿った示差的発現を示していない(データは示していない)。
本発明者らは、溶質キャリア輸送遺伝子の数について有意な示差的転写産物発現を観察した。SLC2A10、SLC13A2及びSLC28A2についてのプローブセット発現は遠位大腸内では高かったが、溶質キャリアファミリーメンバーであるSLC9A3、SLC14A2、SLC16A1、SLC20A1、SCL23A3、及びSLC37A2は近位組織内の方が高かった。
本発明者らの結果は、大腸内で発現すると以前に考えられていた膜結合ムチンの染色体7q22クラスタの5つのメンバー中3つ全部に対するプローブセットであるMUC11、MUC12及びMUC17は遠位腸内で高レベルで示差的に発現することを証明している(Byrd and Bresalier, 2004, Cancer Metastasis Rev 23:77-99、Williams et al., 1999, Cancer Res 59:4083-4089、Gum et al., 2002, Biochem Biophys Res Commun 291:466-475)。本発明者らはさらに、独立バリデーション用データにおいてMUC12及びMUC17についての示差的発現パターンも確証した。以前の報告は、MUC11及びMUC12についてのゲノム配列が密接に関連する遺伝子由来であるか、又はおそらく同一遺伝子であるかさえについての問題を提起していた(Byrd and Bresalier, 2004、上記)。MUC11及びMUC12プローブセットの相関分析は、発現が増加するにつれて相関が弱まるプローブセット発現範囲の下端で強力かつ正の相関を示している(データは示していない)。この相関プロファイルは、高い発現レベルで増加する変動性に起因し得るか、又はおそらく遠位大腸(それらが高い場所)内での発現レベルが明確な転写制御を反映しているからである。
さらに、以前の研究は、分泌されたゲル形成ムチンMUC5Bは大腸内では弱くしか発現しないと示唆していたが(Byrd and Bresalier, 2004、上記)、本発明者らの研究結果は、この転写産物に反応性のプローブセットは、膜結合ムチンに関しては遠位大腸内で高度に発現することを証明している。
本発明者らがヒトについてここで報告する発現パターンの一部は、齧歯類モデルの消化管内で同様にパターン化されることが証明されている。しかし、以前にマウス及びラットの大腸に沿って示差的に発現すると証明されていた多数の特異的遺伝子は、本発明者らによってはそのように発現するとは見いだされなかった。そのような遺伝子転写産物標的には、カルボニックアンヒドラーゼIV(Fleming et al., 1995)、溶質キャリアファミリー4メンバー1(alias AE1)(Rajendran et al., 2000)、CD36/脂肪酸トランソロカーゼ(Chen et al., 2001)、及びtoll様受容体4(Ortega-Cava et al., 2003)が含まれる。他方、本発明者らのデータは、その発現産物は正常ラット大腸内での水分吸収に関係することが疑われている遺伝子であるアクアポリン−8(AQP8)の発現に関する以前の研究とは一致している(Calamita et al., 2001)。本発明者らは、AQP8が遠位組織に比較してヒト近位大腸内で高レベルで有意に発現することを観察している(p<0.006、データは示していない)。claudin接着結合タンパク質のファミリーもまた大腸内の水分障壁完全性を維持することに役割を果たす可能性がある(Jeansonne et al., 2003)。本発明者らは、claudin−8(CLDN8)が遠位結腸直腸組織においてはるかにより高度に発現することを見いだした。これとは逆に、同様に接着結合原線維内に局在すると考えられているclaudin−15(CLDN15)は、近位結腸直腸組織において高レベルで発現した(Colegio et al., 2002)。
大腸に沿った遺伝子発現変化の性質
この研究の1つの目的は、どの遺伝子転写産物が大腸に沿って示差的に発現するのかを理解することであり、第2の目的は、領域若しくはセグメントの特異的詳細において近位−遠位軸に沿ったこれらの発現変化の性質を探索することであった。
本発明者らは、結腸直腸に沿って統計的有意な転写産物の発現変化の2つの大まかなパターンを観察した。主要パターンは、2セグメント発現モデルによってよく当てはめられた65個の遺伝子転写産物によって記述される。本発明者らは、これらの転写産物の発現は、事実上二分的であり、近位セグメントでは上昇し、遠位セグメントでは減少する、又はその逆も真であると提案する。
そのようなデータは、近位大腸と遠位大腸との間の「天然」分割線(divide)が上行結腸及び下行結腸の間で発生するという従来の解剖学的見解と一致している。この所見は、下行結腸及びS状結腸間の区切り点が最大の示差発現を生じさせるというKomuroらによる近年の報告とは相容れない(Komuro et al., 2005)。しかし本発明者らは、結腸直腸癌組織標本においてこのパターンを分析することに加えて、Komuroらがさらに分析に横行結腸を含めることを選択したことに注目している。本発明者らは、横行結腸の全長のほぼ3分の2の地点にある予測中腸−後腸融合点に関する可能性のある交絡影響(confounding affect)を回避するためにそのセグメント由来の組織を意図的に排除している。
第2セットの50個の転写産物は二分性変化を示さず、むしろ5セグメントモデルへ発現データを適用することによって当てはめにおける有意な向上を示し、これは盲腸から直腸へ大腸に沿って移動するより緩やかな発現勾配があることを支持している。
これらの2つの特徴的な発現パターンは、近位−遠位軸に沿った遺伝子発現はおそらく組織体の2つの基礎となるシステムによって調整されることを暗示している。
本発明者らは、ここで測定した成人正常組織中での示差的に発現した転写産物の大多数は、胚発生の中腸 対 後腸のパターンと一致するパターンで発現することを観察した。さらに、監視PCA及び正準変量分析を含む多変量方法もまた、これらのデータ間の変動の主要原因は、近位 対 遠位の分割線によって説明されることを示唆している。近年の試験において、Glebovらは、成人における上行結腸及び下行結腸の間で示差的に発現した遺伝子の数は、17〜24週齢の胎児大腸内で同様に同定された遺伝子の数より実質的に多いことを見いだした。Glebovらは、成人大腸の遺伝子発現パターンはおそらく妊娠約30週時に成人結腸表現型の発現と同時に、又はおそらく消化管の出生後管腔内容物に反応してさえ設定されるという仮説を立てている。本発明者らは、胎児大腸内での遺伝子発現については探索しなかったが、中腸−後腸融合点と一致する胚起源を支持する成人における発現パターンを観察している。
盲腸及び直腸の間で段階的発現変化を示すそれらの転写産物の大多数は、盲腸から直腸へ移動する増加した発現のプロトタイプ的パターンを示す。このパターンは、近位で上昇した転写産物の数はおそらく遠位領域内で上昇した数と同等である中腸−後腸の示差的転写産物においては観察されない。本発明者らは、それらの転写産物における特徴的な遠位に向かって増加するパターンは、内因的に規定された中腸−後腸パターンと比較して外因性因子の関数(function)であろうと提案する。そのような因子は、盲腸から直腸への一方向方法で移動する管腔内容物及び/又は大腸に沿ったマイクロフローラにおける領域的変化の影響を含むことができよう。そのような外因性制御が転写活性を誘導する積極的方法で機能するか又は減少した転写サイレンシングを通して機能するかを調査するためには、今後の研究が必要とされるであろう。
大腸に沿って一致した遺伝子発現変化
大腸に沿って一致した遺伝子の発現を探索するために、本発明者らは、さらにこれらの発現データへ主成分分析及びプロファイル分析を適用する。近位 対 遠位の遺伝子発現パターンとこれらの多変量可視化技術との間には強力な証拠がある。さらに、セグメント内変動を縮めようとしながら同時にセグメント間発現の差を最大にするプロファイル分析は、盲腸から直腸の間の変動性の原因となる同一セットの遺伝子がさらに個別セグメントを最良に分離することを示唆している。これらの多変量分析の結果はわずかな近位−遠位勾配を排除しないが、これらの多変量プロットの見掛けの2相性の性質は、これらの組織における発現変動の主な原因が中腸由来パターン 対 後腸由来パターンと一致していることを示唆している。
より小さなセットの遺伝子の方が有益な可能性がある
最後に、サポートベクターマシンの洗練された分類方法を使用して、近位 対遠位の組織の安定かつ強固な分類を提供するために使用できる1サブセットの情報を提供するプローブセットを選択する。SVM 1002によって「選択された」プローブセットは、上記の単変量法によって同定された示差的転写産物のサブセットである。独立バリデーションセット内の13転写産物モデルを評価することによって、これらの予測因子の強固性がさらに証明される。
当業者であれば、本明細書に記載した本発明は、詳細に記載した以外に変形及び修飾される余地があることを理解するであろう。本発明がすべてのそのような変形及び修飾を含むことを理解されたい。本発明はさらに、本明細書に個別若しくは包括的に言及又は指示したすべての工程、特徴、組成物及び化合物、並びに前記工程若しくは特徴の任意の2つ又はそれ以上のいずれか及びすべての組み合わせを含んでいる。
結論
本発明者らの研究は、転写産物の富裕度及びおそらくは転写調節は、大腸の近位−遠位軸に沿って2つの大まかなパターンに従うことを示唆している。優勢なパターンは、近位腸及び遠位腸の中腸−後腸の胚起源と一致する二分性発現パターンである。このパターンに従う転写産物は、遠位で上昇するパターン及び近位で上昇するパターンへほぼ同等に分割される。本発明者らが観察した第2パターンは、盲腸から直腸へ向かう転写産物レベルにおける段階的変化を特徴とし、それらのほぼ全部が遠位組織に向かって増加する発現を示す。本発明者らは、二分性中腸−後腸パターンを示す組織はおそらく大腸の内因性胚起源を反映する可能性が高いが、段階的変化を示す組織は内腔の流れ(luminal flow)及びマイクロフローラの変化などの外因性因子を反映することを提案する。これらをまとめると、これらのパターンは大腸の遺伝子発現マップを構成する。これは、全ヒト起源の初めてのそのようなマップである。

Claims (50)

  1. 個体の大腸に由来する細胞又は細胞集団の解剖学的起源を決定するための方法であって、
    公知の少なくとも1つの大腸の近位−遠位起源に由来する細胞若しくは細胞集団における遺伝子の発現を表す発現トレーニングデータ、及び前記細胞若しくは細胞集団と前記近位−遠位起源との関連を表す近位−遠位起源トレーニングデータを含むトレーニングデータを入手する工程と;ならびに
    前記遺伝子の発現レベルの線形若しくは非線形組み合わせを表す分類データを生成するために前記トレーニングデータを処理する工程であって、前記分類データは、また別の細胞若しくは細胞亜集団における前記遺伝子の発現を表すまた別の発現データに基づいて、大腸から採取された前記また別の細胞若しくは細胞亜集団の近位−遠位起源を示すまた別の近位−遠位起源データを生成するために適合させられる工程とを含む方法。
  2. 前記また別の近位−遠位起源データを生成するために前記分類データ及び前記また別の発現データを処理する工程を含む、請求項1に記載の方法。
  3. 前記処理する工程は、統計的回帰、一般化線形方法、及び/又は多重線形回帰に基づく、請求項1又は2に記載の方法。
  4. 前記処理する工程は、GeneRaveを用いて前記トレーニングデータを処理する工程を含む、請求項1〜3のいずれか一項に記載の方法。
  5. 個体の大腸に由来する細胞又は細胞集団の解剖学的起源を決定するための方法であって、
    公知の大腸の近位−遠位起源に由来する細胞若しくは細胞集団における遺伝子の発現を表す発現トレーニングデータ、及び前記細胞若しくは細胞集団と前記近位−遠位起源との関連を表す近位−遠位起源トレーニングデータを含むトレーニングデータを入手する工程と;ならびに
    また別の細胞若しくは細胞集団における遺伝子発現を表すまた別の発現データに基づいて、大腸に由来する前記また別の細胞若しくは細胞集団の近位−遠位起源の指標となる近位−遠位起源データを生成するための分類データを生成するために、多変量分析を使用して前記トレーニングデータを処理する工程とを含む方法。
  6. 前記近位−遠位起源データを生成するために前記また別の発現データ及び前記分類データを処理する工程を含む、請求項5に記載の方法。
  7. 個体の大腸に由来する細胞若しくは細胞集団の解剖学的起源を決定するための検出方法であって、
    公知の少なくとも1つの大腸の近位−遠位起源に由来する細胞若しくは細胞集団における遺伝子発現を表す第1発現データを入手する工程と;ならびに
    前記細胞若しくは細胞集団の第1発現データと近位−遠位起源との関連を表す多変量モデルデータを生成するために多変量分析を用いて第1発現データを処理する工程であって、前記多変量モデルデータは個体の大腸に由来する前記細胞若しくは細胞集団における遺伝子の発現を表す第2発現データに基づいて細胞若しくは細胞集団の近位−遠位起源を表す近位−遠位起源データを生成するために適合させられる工程とを含む方法。
  8. 個体の大腸に由来する細胞若しくは細胞集団における遺伝子発現を表す前記第2発現データを入手する工程と;ならびに
    前記細胞若しくは細胞集団の近位−遠位起源を表す前記近位−遠位起源データを生成するために前記発現データ及び前記多変量モデルデータを処理する工程とを含む、請求項7に記載の方法。
  9. 前記第1発現データを入手する工程は、前記第1発現データがそれのサブセットである第3発現データを入手する工程を含み、そして前記方法は、前記大腸の近位−遠位軸に沿って、単独若しくは組み合わせてのいずれかで、示差的に発現した1サブセットの遺伝子に対応する第3発現データのサブセットを選択するために前記第3発現データを処理する工程を含み、選択されたサブセットは前記第1発現データである、請求項7に記載の方法。
  10. 個体の大腸に由来する細胞若しくは細胞集団の解剖学的起源を決定するための方法であって、
    公知の少なくとも1つの大腸の近位−遠位起源に由来する細胞若しくは細胞集団における遺伝子発現を表す第1発現データを入手する工程と;ならびに
    少なくとも1つの第2細胞若しくは細胞集団の近位−遠位起源を表す近位−遠位起源データを生成するために、大腸の前記少なくとも1つの第2細胞若しくは細胞集団における前記遺伝子の発現を表す前記発現データを処理するために、分類データを生成するためにカーネル法を用いて前記第1発現データを処理する工程とを含む方法。
  11. 前記カーネル法は、サポートベクターマシン(SVM)を含む、請求項10に記載の方法。
  12. 前記方法は、前記近位−遠位起源データを生成するために前記第2発現データ及び前記分類データを処理する工程を含む、請求項10又は11に記載の方法。
  13. 個体の大腸に由来する細胞又は細胞集団の解剖学的起源を決定するための検出方法であって、
    公知の少なくとも1つの大腸の近位−遠位起源に由来する細胞若しくは細胞集団における遺伝子発現を表す第1発現データを入手する工程と;ならびに
    前記遺伝子の発現の少なくとも1つの線形組み合わせに対応する主成分データを生成するために主成分分析を用いて前記第1発現データを処理する工程であって、前記主成分データは前記細胞若しくは細胞集団の少なくとも1つの前記近位−遠位起源を示す工程とを含む方法。
  14. 前記第1発現データを入手する工程は、前記第1発現データがそれのサブセットである第3発現データを入手する工程を含み、そして前記方法は、前記少なくとも1つの大腸の近位−遠位軸に沿って示差的に発現した1サブセットの遺伝子に対応する第3発現データのサブセットを選択するために前記第3発現データを処理する工程を含み、選択されたサブセットは前記第1発現データである、請求項13に記載の方法。
  15. 少なくとも1つの第2細胞若しくは細胞集団の近位−遠位起源を表す近位−遠位起源データを生成するために、大腸の前記少なくとも1つの第2細胞若しくは細胞集団における前記遺伝子の発現を表す前記主成分データ及び第2発現データを処理する工程を含む、請求項13又は14に記載の方法。
  16. 個体の大腸に由来する細胞若しくは細胞集団の解剖学的起源を決定するための方法であって、
    公知の少なくとも1つの大腸の近位−遠位起源に由来する細胞若しくは細胞集団における遺伝子発現を表す第1発現データを入手する工程と;ならびに
    前記細胞若しくは細胞集団の近位−遠位起源の少なくとも1つを示す正準変量データを生成するために正準変量分析を用いて前記発現データを処理する工程とを含む方法。
  17. 前記正準変量分析は、プロファイル分析を含む、請求項16に記載の方法。
  18. 前記正準変量データは、1サブセットの前記遺伝子に対応する、請求項16又は17に記載の方法。
  19. 少なくとも1つの第2細胞若しくは細胞集団の近位−遠位起源を表す近位−遠位起源データを生成するために、大腸の前記少なくとも1つの第2細胞若しくは細胞集団における前記遺伝子の発現を表す前記正準変量データ及び第2発現データを処理する工程を含む、請求項25〜27のいずれか一項に記載の方法。
  20. 前記近位−遠位起源データによって指示された近位−遠位起源の正確さ若しくは有用性を改善するために以前の意見及び/又は1又はそれ以上の誤分類の見積もりに基づいて分類データを修飾する工程を含む、請求項1〜19のいずれか一項に記載の方法。
  21. 前記近位−遠位起源は、ノンパラメトリック法を用いて決定される、請求項1〜10のいずれか一項に記載の方法。
  22. 前記ノンパラメトリック法は、ニアレストネイバー(nearest−neighbour)法を含む、請求項21に記載の方法。
  23. 前記遺伝子は、
    Affymetrixプローブ番号:218888_s_atによって検出された1個又はそれ以上の遺伝子、
    Affymetrixプローブ番号:225290_atによって検出された遺伝子、
    Affymetrixプローブ番号:226432_atによって検出された遺伝子、
    Affymetrixプローブ番号:231576_atによって検出された遺伝子、
    Affymetrixプローブ番号:235733_atによって検出された遺伝子、
    Affymetrixプローブ番号:236894_atによって検出された遺伝子、
    Affymetrixプローブ番号:239656_atによって検出された遺伝子、
    Affymetrixプローブ番号:242059_atによって検出された遺伝子、
    Affymetrixプローブ番号:242683_atによって検出された遺伝子、
    Affymetrixプローブ番号:230105_atによって検出された遺伝子、
    Affymetrixプローブ番号:230269_atによって検出された遺伝子、
    Affymetrixプローブ番号:238378_atによって検出された遺伝子、
    Affymetrixプローブ番号:239814_atによって検出された遺伝子、
    Affymetrixプローブ番号:239994_atによって検出された遺伝子、
    Affymetrixプローブ番号:240856_atによって検出された遺伝子、
    Affymetrixプローブ番号:242414_atによって検出された遺伝子、
    Affymetrixプローブ番号:244553_atによって検出された遺伝子、
    Affymetrixプローブ番号:217320によって検出された遺伝子、
    Affymetrixプローブ番号:236141によって検出された遺伝子、
    Affymetrixプローブ番号:236513によって検出された遺伝子、
    Affymetrixプローブ番号:238143によって検出された遺伝子、
    ABHD5、FAM3B、IGFBP2、POPDC3、
    ADRA2A、FLJ10884、KCNG1、REG1A、
    APOBEC1、FLJ22761、KIFAP3、SLC14A2、
    C10orf45、FTHFD、LOC375295、SLC20A1、
    C10orf58、GCNT1、ME3、SLC23A3、
    CCL8、HAS3、MEP1B、SLC38A2、
    CLDN15、HOXB6、NPY6R、SLC9A3、
    DEFA5、HOXD4、NR1H3、TBCC、
    EYA2、HSD3B2、HR1H4、ZNF493、
    OSTalpha、
    PAP、
    AFARP1、若しくはAffymetrixプローブ番号:202234_s_atによって検出された1個又はそれ以上の遺伝子、
    ANPEP、若しくはAffymetrixプローブ番号:202888_s_atによって検出された1個又はそれ以上の遺伝子、
    CCL13、若しくはAffymetrixプローブ番号:206407_s_atによって検出された1個又はそれ以上の遺伝子、
    CRYL1、若しくはAffymetrixプローブ番号:220753_s_atによって検出された1個又はそれ以上の遺伝子、
    CYP2B6、若しくはAffymetrixプローブ番号:206754_s_atによって検出された1個又はそれ以上の遺伝子、
    CYP2C18、若しくはAffymetrixプローブ番号:208126_s_atによって検出された1個又はそれ以上の遺伝子、
    CYP2C9、若しくはAffymetrixプローブ番号:214421_x_at若しくは220017_x_atによって検出された1個又はそれ以上の遺伝子、
    EPB41L3、若しくはAffymetrixプローブ番号:211776_s_atによって検出された1個又はそれ以上の遺伝子、
    ETNK1、若しくはAffymetrixプローブ番号:222262_s_at若しくは224453_s_atによって検出された1個又はそれ以上の遺伝子、
    FAM45A、若しくはAffymetrixプローブ番号:221804_s_at若しくは222955_s_atによって検出された1個又はそれ以上の遺伝子、
    FGFR2、若しくはAffymetrixプローブ番号:203639_s_atによって検出された1個又はそれ以上の遺伝子、
    GBA3、若しくはAffymetrixプローブ番号:219954_s_atによって検出された1個又はそれ以上の遺伝子、
    GSPT2、若しくはAffymetrixプローブ番号:205541_s_atによって検出された1個又はそれ以上の遺伝子、
    GULP1、若しくはAffymetrixプローブ番号:215913_s_atによって検出された1個又はそれ以上の遺伝子、
    HOXA9、若しくはAffymetrixプローブ番号:205366_s_at若しくは214551_s_atによって検出された1個又はそれ以上の遺伝子、
    HOXC6、若しくはAffymetrixプローブ番号:206858_s_atによって検出された1個又はそれ以上の遺伝子、
    HOXD3、若しくはAffymetrixプローブ番号:206601_s_atによって検出された1個又はそれ以上の遺伝子、
    ME2、若しくはAffymetrixプローブ番号:210153_s_atによって検出された1個又はそれ以上の遺伝子、
    MESP1、若しくはAffymetrixプローブ番号:224476_s_atによって検出された1個又はそれ以上の遺伝子、
    MOCS1、若しくはAffymetrixプローブ番号:213181_s_atによって検出された1個又はそれ以上の遺伝子、
    MSCP、若しくはAffymetrixプローブ番号:218136_s_at若しくは221920_s_atによって検出された1個又はそれ以上の遺伝子、
    NETO2、若しくはAffymetrixプローブ番号:222774_s_atによって検出された1個又はそれ以上の遺伝子、
    OASL、若しくはAffymetrixプローブ番号:210757_s_atによって検出された1個又はそれ以上の遺伝子、
    PITX2、若しくはAffymetrixプローブ番号:207558_s_atによって検出された1個又はそれ以上の遺伝子、
    PRAP1、若しくはAffymetrixプローブ番号:243669_s_atによって検出された1個又はそれ以上の遺伝子、
    SCUBE2、若しくはAffymetrixプローブ番号:219197_s_atによって検出された1個又はそれ以上の遺伝子、
    SEC6L1、若しくはAffymetrixプローブ番号:225457_s_atによって検出された1個又はそれ以上の遺伝子、
    SLC16A1、若しくはAffymetrixプローブ番号:202236_s_at若しくは209900_s_atによって検出された1個又はそれ以上の遺伝子、
    UGT1A3、若しくはAffymetrixプローブ番号:208596_s_atによって検出された1個又はそれ以上の遺伝子、
    UGT1A8、若しくはAffymetrixプローブ番号:221305_s_atによって検出された1個又はそれ以上の遺伝子、
    ACACA、FMOD、LOC151162、S100P、
    C13orf11、FRMD3、MCF2L、SCGB2A1、
    C20orf56、GALNT5、MMP28、SCNN1B、
    CAPN13、GARNL4、MUC11、SHANK2、
    CLDN8、GCG、MUC12、SIAT2、
    COLM、GNE、MUC17、SIAT4C、
    CRIP1、HGD、MUC5B、SIAT7F、
    DNAJC12、HOXB13、NEDD4L、SIDT1、
    FAM3C、INSL5、PARP8、SLC13A2、
    FBX025、IRS1、PCDH21、SLPI、
    FLJ20366、ISL1、PI3、SPINK5、
    FLJ20989、KIAA0703、PRAC、SST、
    KIAA0830、PRAC2、TFF1、
    KIAA1913、PTTG1IP、TNFSF11、
    LAMA1、QPRT、TPH1、
    LGALS2、QSCN6、WFDC2、
    RBM24、
    ARF4、若しくはAffymetrixプローブ番号:201097_s_atによって検出された1個又はそれ以上の遺伝子、
    BTG3、若しくはAffymetrixプローブ番号:213134_x_at若しくは205548_s_atによって検出された1個又はそれ以上の遺伝子、
    CHST5、若しくはAffymetrixプローブ番号:221164_x_at若しくは223942_x_atによって検出された1個又はそれ以上の遺伝子、
    CMAH、若しくはAffymetrixプローブ番号:205518_s_atによって検出された1個又はそれ以上の遺伝子、
    CRYBA2、若しくはAffymetrixプローブ番号:220136_s_atによって検出された1個又はそれ以上の遺伝子、
    CTSE、若しくはAffymetrixプローブ番号:205927_s_atによって検出された1個又はそれ以上の遺伝子、
    DKFZp761N1114、若しくはAffymetrixプローブ番号:242372_s_atによって検出された1個又はそれ以上の遺伝子、
    EPB41L4A、若しくはAffymetrixプローブ番号:228256_s_atによって検出された1個又はそれ以上の遺伝子、
    EPHA3、若しくはAffymetrixプローブ番号:206070_s_atによって検出された1個又はそれ以上の遺伝子、
    FAS、若しくはAffymetrixプローブ番号:204781_s_atによって検出された1個又はそれ以上の遺伝子、
    FER1L3、若しくはAffymetrixプローブ番号:201798_s_at若しくは211864_s_atによって検出された1個又はそれ以上の遺伝子、
    FLJ20152、若しくはAffymetrixプローブ番号:218532_s_at若しくは218510_x_atによって検出された1個又はそれ以上の遺伝子、
    FLJ23548、若しくはAffymetrixプローブ番号:218187_s_atによって検出された1個又はそれ以上の遺伝子、
    FN1、若しくはAffymetrixプローブ番号:211719_s_at若しくは210495_x_at若しくは212464_at若しくは216442_x_atによって検出された1個又はそれ以上の遺伝子、
    FOXA2、若しくはAffymetrixプローブ番号:210103_s_atによって検出された1個又はそれ以上の遺伝子、
    FRZB、若しくはAffymetrixプローブ番号:203698_s_atによって検出された1個又はそれ以上の遺伝子、
    GDF15、若しくはAffymetrixプローブ番号:221577_x_atによって検出された1個又はそれ以上の遺伝子、
    GJB3、若しくはAffymetrixプローブ番号:205490_s_atによって検出された1個又はそれ以上の遺伝子、
    HOXD13、若しくはAffymetrixプローブ番号:207397_s_atによって検出された1個又はそれ以上の遺伝子、
    INSM1、若しくはAffymetrixプローブ番号:206502_s_atによって検出された1個又はそれ以上の遺伝子、
    MGC4170、若しくはAffymetrixプローブ番号:212959_s_atによって検出された1個又はそれ以上の遺伝子、
    MLPH、若しくはAffymetrixプローブ番号:218211_s_atによって検出された1個又はそれ以上の遺伝子、
    NEBL、若しくはAffymetrixプローブ番号:203962_s_atによって検出された1個又はそれ以上の遺伝子、
    PLA2G2A、若しくはAffymetrixプローブ番号:203649_s_atによって検出された1個又はそれ以上の遺伝子、
    PTPRO、若しくはAffymetrixプローブ番号:208121_s_atによって検出された1個又はそれ以上の遺伝子、
    PYY、若しくはAffymetrixプローブ番号:207080_s_at若しくは211253_x_atによって検出された1個又はそれ以上の遺伝子、
    SH3BP4、若しくはAffymetrixプローブ番号:222258_s_atによって検出された1個又はそれ以上の遺伝子、
    SLC28A2、若しくはAffymetrixプローブ番号:207249_s_atによって検出された1個又はそれ以上の遺伝子、
    SLC2A10、若しくはAffymetrixプローブ番号:221024_s_atによって検出された1個又はそれ以上の遺伝子、
    SPON1、若しくはAffymetrixプローブ番号:213994_s_at若しくは209437_s_atによって検出された1個又はそれ以上の遺伝子、
    STS、若しくはAffymetrixプローブ番号:203769_s_atによって検出された1個又はそれ以上の遺伝子、
    TM4SF11、若しくはAffymetrixプローブ番号:204519_s_atによって検出された1個又はそれ以上の遺伝子、
    TUSC3、若しくはAffymetrixプローブ番号:213432_s_at若しくは209228_x_atによって検出された1個又はそれ以上の遺伝子、
    AQP8、LGALS2、EFNA1、ORF51E2、
    CCL11、C6ORF105、EMP1、PROM1、
    CLDN8、CCL11、FST、REG3A、
    MMP12、CD69、GHR、SCNN1B、
    P2RY14、CLC、HLA−DRB4、ST3GAL4、
    CCL18、CPM、HOXD10、ST6GALNAC6、
    ACSL1、DEFA6、HSD17B2、
    AGR2、DHRS9、HSPCA、
    ASPN、IGHD、
    MT1M、
    SCD、若しくはAffymetrixプローブ番号:200832_s_atによって検出された1個又はそれ以上の遺伝子、
    ABCB1、若しくはAffymetrixプローブ番号:211994_s_atによって検出された遺伝子、
    BTBD3、若しくはAffymetrixプローブ番号:202946_s_atによって検出された1個又はそれ以上の遺伝子、
    CA1、若しくはAffymetrixプローブ番号:205950_s_atによって検出された1個又はそれ以上の遺伝子、
    DHRS9、若しくはAffymetrixプローブ番号:224009_x_at若しくは223952_x_atによって検出された1個又はそれ以上の遺伝子、
    DKFZP564I1171、若しくはAffymetrixプローブ番号:225457_s_atによって検出された1個又はそれ以上の遺伝子、
    EIF5A、若しくはAffymetrixプローブ番号:201123_s_atによって検出された1個又はそれ以上の遺伝子、
    IGHD、若しくはAffymetrixプローブ番号:214973_x_atによって検出された1個又はそれ以上の遺伝子、
    PCK1、若しくはAffymetrixプローブ番号:208383_s_atによって検出された1個又はそれ以上の遺伝子、
    RBP4、若しくはAffymetrixプローブ番号:219140_s_atによって検出された1個又はそれ以上の遺伝子、
    TRPM6、若しくはAffymetrixプローブ番号:224412_s_atによって検出された1個又はそれ以上の遺伝子、
    UGT1A6、若しくはAffymetrixプローブ番号:215125_s_atによって検出された1個又はそれ以上の遺伝子から選択された遺伝子を含む、請求項1〜22のいずれか一項に記載の方法。
  24. 前記遺伝子は7個の遺伝子のみ含む、請求項1〜23のいずれか一項に記載の方法。
  25. 前記遺伝子は、SEC6L1、PRAC、SPINK5、SEC6L1、ANPEP、DEFA5、及びCLDN8を含む、請求項1〜24のいずれか一項に記載の方法。
  26. 前記遺伝子は以下の遺伝子の群、
    (i)
    SCD、若しくはAffymetrixプローブ番号:200832_s_atによって検出された1個又はそれ以上の遺伝子、
    MMP12、
    P2RY14、
    CLDN8、
    ETNK1;
    (ii)
    PCP4、
    SLC28A2、若しくはAffymetrixプローブ番号:207249_s_atによって検出された1個又はそれ以上の遺伝子、
    CCL18、
    RBP4、若しくはAffymetrixプローブ番号:219140_s_atによって検出された1個又はそれ以上の遺伝子、
    DKFZP564I1171、
    PRAC;
    (iii)
    EIF5A、若しくはAffymetrixプローブ番号:201123_s_atによって検出された1個又はそれ以上の遺伝子、
    IGFBP2、
    GDF15、若しくはAffymetrixプローブ番号:221577_s_atによって検出された1個又はそれ以上の遺伝子、
    DKFZP564I1171、若しくはAffymetrixプローブ番号:225457_s_atによって検出された1個又はそれ以上の遺伝子、
    MUC12;
    (iv)
    HLA−DRB4、
    HOXB13、
    INSL5、
    ETNK1、若しくはAffymetrixプローブ番号:222262_s_atによって検出された1個又はそれ以上の遺伝子;
    (v)
    ANPEP、若しくはAffymetrixプローブ番号:202888_s_atによって検出された1個又はそれ以上の遺伝子、
    DEFA5、
    CHST5、若しくはAffymetrixプローブ番号:221164_x_atによって検出された1個又はそれ以上の遺伝子、
    Affymetrixプローブ番号:226432_atによって検出された遺伝子、
    COLM;
    (vi)
    SCNN1B、
    FN1、若しくはAffymetrixプローブ番号:211719_x_atによって検出された1個又はそれ以上の遺伝子、
    ETNK1、若しくはAffymetrixプローブ番号:224453_s_atによって検出された1個又はそれ以上の遺伝子、
    Affymetrixプローブ番号:225290_atによって検出された遺伝子、
    OSTalpha、
    HOXD10、
    プローブ番号:230269;
    (vii)
    SLC20A1、
    HSPCA、
    Affymetrixプローブ番号:217320_atによって検出された遺伝子、
    CCL18、
    HOXB13;
    (viii)
    CD69、
    OLFM4、若しくはAffymetrixプローブ番号:212768_s_atによって検出された1個又はそれ以上の遺伝子、
    UGT1A6、若しくはAffymetrixプローブ番号:215125_s_atによって検出された1個又はそれ以上の遺伝子、
    CHST5、若しくはAffymetrixプローブ番号:223942_x_atによって検出された1個又はそれ以上の遺伝子、
    Affymetrixプローブ番号:231576_atによって検出された遺伝子、
    MUC11;
    (ix)
    PLA2G2A、若しくはAffymetrixプローブ番号:203649_s_atによって検出された1個又はそれ以上の遺伝子、
    REG3A、
    CCL13、若しくはAffymetrixプローブ番号:206407_s_atによって検出された1個又はそれ以上の遺伝子、
    GCG、
    UGT1A3、若しくはAffymetrixプローブ番号:208596_s_atによって検出された1個又はそれ以上の遺伝子、
    FN1、若しくはAffymetrixプローブ番号:210485_x_atによって検出された1個又はそれ以上の遺伝子、
    MT1M、
    OR51E2;
    (x)
    SLC16A1、若しくはAffymetrixプローブ番号:202236_s_atによって検出された1個又はそれ以上の遺伝子、
    WFDC2、
    S100P、
    PTPRO、若しくはAffymetrixプローブ番号:208121_s_atによって検出された1個又はそれ以上の遺伝子、
    CCL11、
    ASPN、
    FAM3B;
    (xi)
    EMP1、
    NEBL、若しくはAffymetrixプローブ番号:203962_s_atによって検出された1個又はそれ以上の遺伝子、
    TFF1、
    CMAH、若しくはAffymetrixプローブ番号:205518_s_atによって検出された1個又はそれ以上の遺伝子、
    PYY、若しくはAffymetrixプローブ番号:207080_s_atによって検出された1個又はそれ以上の遺伝子、
    ECAT11、
    NETO2、若しくはAffymetrixプローブ番号:222774_s_atによって検出された1個又はそれ以上の遺伝子;
    (xii)
    HSD17B2、
    HGD、
    CA1、若しくはAffymetrixプローブ番号:205950_s_atによって検出された1個又はそれ以上の遺伝子、
    CPM、
    LGALS2、
    IGHD、若しくはAffymetrixプローブ番号:214973_x_atによって検出された1個又はそれ以上の遺伝子、
    FN1、若しくはAffymetrixプローブ番号:216442_xs_atによって検出された1個又はそれ以上の遺伝子;
    (xiii)
    CLC、
    DEFA6、
    FN1、若しくはAffymetrixプローブ番号:212464_s_atによって検出された1個又はそれ以上の遺伝子、
    FST、
    Affymetrixプローブ番号:236513_atによって検出された遺伝子、
    Affymetrixプローブ番号:240856_atによって検出された遺伝子、
    ETNK1;
    (xiv)
    PITX2、若しくはAffymetrixプローブ番号:207558_s_atによって検出された1個又はそれ以上の遺伝子、
    DHRS9、若しくはAffymetrixプローブ番号:224009_x_atによって検出された1個又はそれ以上の遺伝子、
    DKFZp761N1114、
    KIAA1913;
    (xv)
    GHR、
    HSD3B2、
    MEP1B、
    HOXA9、若しくはAffymetrixプローブ番号:213651_s_atによって検出された1個又はそれ以上の遺伝子、
    TRPM6、若しくはAffymetrixプローブ番号:224412_s_atによって検出された1個又はそれ以上の遺伝子、
    Affymetrixプローブ番号:239994_atによって検出された遺伝子;
    (xvi)
    SPINK5、
    PCK1、若しくはAffymetrixプローブ番号:208383_s_atによって検出された1個又はそれ以上の遺伝子、
    ADRA2A、
    NQO1、若しくはAffymetrixプローブ番号:210519_s_atによって検出された1個又はそれ以上の遺伝子、
    GBA3、
    Affymetrixプローブ番号:228004_atによって検出された遺伝子;
    (xvii)
    SCGB2A1、
    NR1H4、
    NETO2、若しくはAffymetrixプローブ番号:218888_s_atによって検出された遺伝子、
    ST6GALNAC6;
    (xviii)
    NEBL、
    PROM1、若しくはAffymetrixプローブ番号:204304_s_atによって検出された1個又はそれ以上の遺伝子、
    AGR2、
    REG1A、
    UGT1A8、若しくはAffymetrixプローブ番号:221305_s_atによって検出された1個又はそれ以上の遺伝子、
    DKFZp761N1114、若しくはAffymetrixプローブ番号:242372_s_atによって検出された1個又はそれ以上の遺伝子;
    (xix)
    ACSL1、
    ST3GAL4、
    GBA3、若しくはAffymetrixプローブ番号:219954_s_atによって検出された1個又はそれ以上の遺伝子、
    SLC2A10、若しくはAffymetrixプローブ番号:221024_s_atによって検出された1個又はそれ以上の遺伝子、
    DHRS9、若しくはAffymetrixプローブ番号:223952_s_atによって検出された1個又はそれ以上の遺伝子、
    LAMA1;
    (xx)
    EFNA1、
    BTBD3、若しくはAffymetrixプローブ番号:202946_s_atによって検出された1個又はそれ以上の遺伝子、
    PI3、
    ABCB1、若しくはAffymetrixプローブ番号:209994_s_atによって検出された1個又はそれ以上の遺伝子、
    C10orf45、
    BCMP11、
    C6orf105、
    CAPN13、
    CPM、
    Affymetrixプローブ番号:236141_atによって検出された遺伝子、
    Affymetrixプローブ番号:238143_atによって検出された遺伝子のうちの1つ又はそれ以上を含む、請求項1〜23のいずれか一項に記載の方法。
  27. 前記分類データは、13個の遺伝子のサブセットを表す、請求項1〜23のいずれか一項に記載の方法。
  28. 前記遺伝子は、
    PRAC、
    CCL11、
    FRZB、若しくはAffymetrixプローブ番号:203698_s_atによって検出された1個又はそれ以上の遺伝子、
    GDF15、若しくはAffymetrixプローブ番号:221577_x_atによって検出された1個又はそれ以上の遺伝子、
    CLDN8、
    SEC6L1、若しくはAffymetrixプローブ番号:221577_x_atによって検出された1個又はそれ以上の遺伝子、
    GBA3、若しくはAffymetrixプローブ番号:279954_s_atによって検出された1個又はそれ以上の遺伝子、
    DEFA5、
    SPINK5、
    OSTalpha、
    ANPEP、若しくはAffymetrixプローブ番号:202888_s_atによって検出された1個又はそれ以上の遺伝子、及び
    MUC5を含む、請求項1〜27のいずれか一項に記載の方法。
  29. 請求項1〜28のいずれか一項に記載の方法を実行するための成分を有する検出システム。
  30. 請求項1〜28のいずれか一項に記載の方法を実行するためのプログラム取扱説明書をその上に保存しているコンピュータ可読記憶媒体。
  31. 少なくとも1つの大腸に由来する細胞若しくは細胞集団における遺伝子の発現を表す発現トレーニングデータ、及び前記細胞若しくは細胞集団と近位−遠位起源との関連を表す前記近位−遠位起源トレーニングデータを含むトレーニングデータを入手するための手段と;
    前記遺伝子の発現レベルの線形若しくは非線形組み合わせを表す分類データを生成するために前記トレーニングデータを処理するための手段であって、前記分類データは、また別の細胞若しくは細胞集団における前記遺伝子の発現を表すまた別の発現データに基づいて、大腸から採取された前記また別の細胞若しくは細胞集団の近位−遠位起源を示す近位−遠位起源データを生成するために適合させられる手段とを含む、検出システム。
  32. 個体の大腸に由来する細胞又は細胞集団の解剖学的起源を決定するための方法であって、前記個体由来の生物学的サンプル中において、
    (i)
    PITX2、若しくはAffymetrixプローブ番号:207558_s_atによって検出された1個又はそれ以上の遺伝子、
    ETNK1、若しくはAffymetrixプローブ番号:222262_s_at若しくは224453_s_atによって検出された1個又はそれ以上の遺伝子、
    FAM3B、
    CYP2C18、若しくはAffymetrixプローブ番号:208126_s_atによって検出された1個又はそれ以上の遺伝子、
    GBA3、若しくはAffymetrixプローブ番号:219954_s_atによって検出された1個又はそれ以上の遺伝子、
    MEP1B、
    ADRA2A、
    HSD3B2、
    CYP2B6、若しくはAffymetrixプローブ番号:206754_s_atによって検出された1個又はそれ以上の遺伝子、
    SLC14A2、若しくはAffymetrixプローブ番号:226432_s_atによって検出された1個又はそれ以上の遺伝子、
    CYP2C9、若しくはAffymetrixプローブ番号:231576_s_atによって検出された1個又はそれ以上の遺伝子、
    DEFA5、
    OASL、若しくはAffymetrixプローブ番号:210797_s_atによって検出された1個又はそれ以上の遺伝子、
    SLC37A3、
    REG1A、
    MEP1B、
    NR1H4;又は
    (ii)
    DKFZp761N1114、若しくはAffymetrixプローブ番号:242374_s_atによって検出された1個又はそれ以上の遺伝子、
    PRAC、
    INSL5、
    HOXB13又は
    WFDC2から選択される1個又はそれ以上の遺伝子の発現レベルを測定する工程を含み、
    正常遠位大腸コントロールレベルに比較して(i)群の遺伝子のより高い発現レベルは近位大腸起源であることを示し、及び正常近位大腸コントロールレベルに比較して(ii)群の遺伝子のより高い発現レベルは遠位大腸起源であることを示す方法。
  33. 個体の大腸に由来する細胞又は細胞集団の解剖学的起源を決定するための方法であって、前記個体由来の生物学的サンプル中において、
    (i)
    Affymetrixプローブ番号:218888_s_atによって検出された1個又はそれ以上の遺伝子、
    Affymetrixプローブ番号:225290_atによって検出された遺伝子、
    Affymetrixプローブ番号:226432_atによって検出された遺伝子、
    Affymetrixプローブ番号:231576_atによって検出された遺伝子、
    Affymetrixプローブ番号:235733_atによって検出された遺伝子、
    Affymetrixプローブ番号:236894_atによって検出された遺伝子、
    Affymetrixプローブ番号:239656_atによって検出された遺伝子、
    Affymetrixプローブ番号:242059_atによって検出された遺伝子、
    Affymetrixプローブ番号:242683_atによって検出された遺伝子、
    ABHD5、FAM3B、IGFBP2、POPDC3、
    ADRA2A、FLJ10884、KCNG1、REG1A、
    APOBEC1、FLJ22761、KIFAP3、SLC14A2、
    C10orf45、FTHFD、LOC375295、SLC20A1、
    C10orf58、GCNT1、ME3、SLC23A3、
    CCL8、HAS3、MEP1B、SLC38A2、
    CLDN15、HOXB6、NPY6R、SLC9A3、
    DEFA5、HOXD4、NR1H3、TBCC、
    EYA2、HSD3B2、HR1H4、ZNF493、
    OSTalpha、
    PAP、
    AFARP1、若しくはAffymetrixプローブ番号:202234_s_atによって検出された1個又はそれ以上の遺伝子、
    ANPEP、若しくはAffymetrixプローブ番号:202888_s_atによって検出された1個又はそれ以上の遺伝子、
    CCL13、若しくはAffymetrixプローブ番号:206407_s_atによって検出された1個又はそれ以上の遺伝子、
    CRYL1、若しくはAffymetrixプローブ番号:220753_s_atによって検出された1個又はそれ以上の遺伝子、
    CYP2B6、若しくはAffymetrixプローブ番号:206754_s_atによって検出された1個又はそれ以上の遺伝子、
    CYP2C18、若しくはAffymetrixプローブ番号:208126_s_atによって検出された1個又はそれ以上の遺伝子、
    CYP2C9、若しくはAffymetrixプローブ番号:214421_x_at若しくは220017_x_atによって検出された1個又はそれ以上の遺伝子、
    EPB41L3、若しくはAffymetrixプローブ番号:211776_s_atによって検出された1個又はそれ以上の遺伝子、
    ETNK1、若しくはAffymetrixプローブ番号:222262_s_at若しくは224453_s_atによって検出された1個又はそれ以上の遺伝子、
    FAM45A、若しくはAffymetrixプローブ番号:221804_s_at若しくは222955_s_atによって検出された1個又はそれ以上の遺伝子、
    FGFR2、若しくはAffymetrixプローブ番号:203639_s_atによって検出された1個又はそれ以上の遺伝子、
    GBA3、若しくはAffymetrixプローブ番号:219954_s_atによって検出された1個又はそれ以上の遺伝子、
    GSPT2、若しくはAffymetrixプローブ番号:205541_s_atによって検出された1個又はそれ以上の遺伝子、
    GULP1、若しくはAffymetrixプローブ番号:215913_s_atによって検出された1個又はそれ以上の遺伝子、
    HOXA9、若しくはAffymetrixプローブ番号:205366_s_at若しくは214551_s_atによって検出された1個又はそれ以上の遺伝子、
    HOXC6、若しくはAffymetrixプローブ番号:206858_s_atによって検出された1個又はそれ以上の遺伝子、
    HOXD3、若しくはAffymetrixプローブ番号:206601_s_atによって検出された1個又はそれ以上の遺伝子、
    ME2、若しくはAffymetrixプローブ番号:210153_s_atによって検出された1個又はそれ以上の遺伝子、
    MESP1、若しくはAffymetrixプローブ番号:224476_s_atによって検出された1個又はそれ以上の遺伝子、
    MOCS1、若しくはAffymetrixプローブ番号:213181_s_atによって検出された1個又はそれ以上の遺伝子、
    MSCP、若しくはAffymetrixプローブ番号:218136_s_at若しくは221920_s_atによって検出された1個又はそれ以上の遺伝子、
    NETO2、若しくはAffymetrixプローブ番号:222774_s_atによって検出された1個又はそれ以上の遺伝子、
    OASL、若しくはAffymetrixプローブ番号:210757_s_atによって検出された1個又はそれ以上の遺伝子、
    PITX2、若しくはAffymetrixプローブ番号:207558_s_atによって検出された1個又はそれ以上の遺伝子、
    PRAP1、若しくはAffymetrixプローブ番号:243669_s_atによって検出された1個又はそれ以上の遺伝子、
    SCUBE2、若しくはAffymetrixプローブ番号:219197_s_atによって検出された1個又はそれ以上の遺伝子、
    SEC6L1、若しくはAffymetrixプローブ番号:225457_s_atによって検出された1個又はそれ以上の遺伝子、
    SLC16A1、若しくはAffymetrixプローブ番号:202236_s_at若しくは209900_s_atによって検出された1個又はそれ以上の遺伝子、
    UGT1A3、若しくはAffymetrixプローブ番号:208596_s_atによって検出された1個又はそれ以上の遺伝子、
    UGT1A8、若しくはAffymetrixプローブ番号:221305_s_atによって検出された1個又はそれ以上の遺伝子;又は
    (ii)
    Affymetrixプローブ番号:230105_atによって検出された遺伝子、
    Affymetrixプローブ番号:230269_atによって検出された遺伝子、
    Affymetrixプローブ番号:238378_atによって検出された遺伝子、
    Affymetrixプローブ番号:239814_atによって検出された遺伝子、
    Affymetrixプローブ番号:239994_atによって検出された遺伝子、
    Affymetrixプローブ番号:240856_atによって検出された遺伝子、
    Affymetrixプローブ番号:242414_atによって検出された遺伝子、
    Affymetrixプローブ番号:244553_atによって検出された遺伝子、
    ACACA、FMOD、LOC151162、S100P、
    C13orf11、FRMD3、MCF2L、SCGB2A1、
    C20orf56、GALNT5、MMP28、SCNN1B、
    CAPN13、GARNL4、MUC11、SHANK2、
    CLDN8、GCG、MUC12、SIAT2、
    COLM、GNE、MUC17、SIAT4C、
    CRIP1、HGD、MUC5B、SIAT7F、
    DNAJC12、HOXB13、NEDD4L、SIDT1、
    FAM3C、INSL5、PARP8、SLC13A2、
    FBX025、IRS1、PCDH21、SLPI、
    FLJ20366、ISL1、PI3、SPINK5、
    FLJ20989、KIAA0703、PRAC、SST、
    KIAA0830、PRAC2、TFF1、
    KIAA1913、PTTG1IP、TNFSF11、
    LAMA1、QPRT、TPH1、
    LGALS2、QSCN6、WFDC2、
    RBM24、
    ARF4、若しくはAffymetrixプローブ番号:201097_s_atによって検出された1個又はそれ以上の遺伝子、
    BTG3、若しくはAffymetrixプローブ番号:213134_x_at若しくは205548_s_atによって検出された1個又はそれ以上の遺伝子、
    CHST5、若しくはAffymetrixプローブ番号:221164_x_at若しくは223942_x_atによって検出された1個又はそれ以上の遺伝子、
    CMAH、若しくはAffymetrixプローブ番号:205518_s_atによって検出された1個又はそれ以上の遺伝子、
    CRYBA2、若しくはAffymetrixプローブ番号:220136_s_atによって検出された1個又はそれ以上の遺伝子、
    CTSE、若しくはAffymetrixプローブ番号:205927_s_atによって検出された1個又はそれ以上の遺伝子、
    DKFZp761N1114、若しくはAffymetrixプローブ番号:242372_s_atによって検出された1個又はそれ以上の遺伝子、
    EPB41L4A、若しくはAffymetrixプローブ番号:228256_s_atによって検出された1個又はそれ以上の遺伝子、
    EPHA3、若しくはAffymetrixプローブ番号:206070_s_atによって検出された1個又はそれ以上の遺伝子、
    FAS、若しくはAffymetrixプローブ番号:204781_s_atによって検出された1個又はそれ以上の遺伝子、
    FER1L3、若しくはAffymetrixプローブ番号:201798_s_at若しくは211864_s_atによって検出された1個又はそれ以上の遺伝子、
    FLJ20152、若しくはAffymetrixプローブ番号:218532_s_at若しくは218510_x_atによって検出された1個又はそれ以上の遺伝子、
    FLJ23548、若しくはAffymetrixプローブ番号:218187_s_atによって検出された1個又はそれ以上の遺伝子、
    FN1、若しくはAffymetrixプローブ番号:211719_s_at若しくは210495_x_at若しくは212464_at若しくは216442_x_atによって検出された1個又はそれ以上の遺伝子、
    FOXA2、若しくはAffymetrixプローブ番号:210103_s_atによって検出された1個又はそれ以上の遺伝子、
    FRZB、若しくはAffymetrixプローブ番号:203698_s_atによって検出された1個又はそれ以上の遺伝子、
    GDF15、若しくはAffymetrixプローブ番号:221577_x_atによって検出された1個又はそれ以上の遺伝子、
    GJB3、若しくはAffymetrixプローブ番号:205490_s_atによって検出された1個又はそれ以上の遺伝子、
    HOXD13、若しくはAffymetrixプローブ番号:207397_s_atによって検出された1個又はそれ以上の遺伝子、
    INSM1、若しくはAffymetrixプローブ番号:206502_s_atによって検出された1個又はそれ以上の遺伝子、
    MGC4170、若しくはAffymetrixプローブ番号:212959_s_atによって検出された1個又はそれ以上の遺伝子、
    MLPH、若しくはAffymetrixプローブ番号:218211_s_atによって検出された1個又はそれ以上の遺伝子、
    NEBL、若しくはAffymetrixプローブ番号:203962_s_atによって検出された1個又はそれ以上の遺伝子、
    PLA2G2A、若しくはAffymetrixプローブ番号:203649_s_atによって検出された1個又はそれ以上の遺伝子、
    PTPRO、若しくはAffymetrixプローブ番号:208121_s_atによって検出された1個又はそれ以上の遺伝子、
    PYY、若しくはAffymetrixプローブ番号:207080_s_at若しくは211253_x_atによって検出された1個又はそれ以上の遺伝子、
    SH3BP4、若しくはAffymetrixプローブ番号:222258_s_atによって検出された1個又はそれ以上の遺伝子、
    SLC28A2、若しくはAffymetrixプローブ番号:207249_s_atによって検出された1個又はそれ以上の遺伝子、
    SLC2A10、若しくはAffymetrixプローブ番号:221024_s_atによって検出された1個又はそれ以上の遺伝子、
    SPON1、若しくはAffymetrixプローブ番号:213994_s_at若しくは209437_s_atによって検出された1個又はそれ以上の遺伝子、
    STS、若しくはAffymetrixプローブ番号:203769_s_atによって検出された1個又はそれ以上の遺伝子、
    TM4SF11、若しくはAffymetrixプローブ番号:204519_s_atによって検出された1個又はそれ以上の遺伝子、
    TUSC3、若しくはAffymetrixプローブ番号:213432_s_at若しくは209228_x_atによって検出された1個又はそれ以上の遺伝子から選択される1個又はそれ以上の遺伝子の発現レベルを測定する工程を含む方法であって、
    正常遠位大腸コントロールレベルに比較して(i)群の遺伝子のより高い発現レベルは近位大腸起源であることを示し、及び正常近位大腸コントロールレベルに比較して(ii)群の遺伝子のより高い発現レベルは遠位大腸起源であることを示す方法。
  34. 前記近位領域は、盲腸及び上行結腸を含む、請求項32又は33に記載の方法。
  35. 前記遠位領域は、脾湾曲部、下行結腸、S状結腸湾曲部及び直腸を含む、請求項33に記載の方法。
  36. 前記遺伝子は、ETNK1である、請求項32又は33、34又は35に記載の方法。
  37. 前記遺伝子は、GBA3である、請求項32又は33又は34又は35に記載の方法。
  38. 前記遺伝子は、PRACである、請求項32又は33又は34又は35に記載の方法。
  39. 前記生物学的サンプルは、便サンプル、浣腸洗浄液、外科的切除物又は組織生検である、請求項32〜38のいずれか一項に記載の方法。
  40. アレイが、複数の、
    (i)請求項33に列挙した位置マーカー遺伝子のいずれか1つに対応するヌクレオチド配列若しくはそれと少なくとも80%の同一性を示す配列を含む核酸分子又は前記核酸分子の官能的誘導体、フラグメント、変異体若しくはホモログ;
    (ii)42℃の低ストリンジェンシー条件下で(i)の配列のいずれか1つ又はそれ以上にハイブリダイズすることのできるヌクレオチド配列を含む核酸分子、又は前記核酸分子の官能的誘導体、フラグメント、変異体若しくはホモログ;
    (iii)42℃の低ストリンジェンシー条件下で(i)の配列のいずれか1つ又はそれ以上にハイブリダイズすることのできるヌクレオチド配列を含む核酸プローブ若しくはオリゴヌクレオチド、又は前記核酸分子の官能的誘導体、フラグメント、変異体若しくはホモログ;
    (iv)(i)若しくは(ii)の核酸分子によってコードされたタンパク質、又は前記タンパク質の誘導体、フラグメント、若しくはホモログを含む核酸アレイであって、
    前記核酸の発現のレベルは、大腸に由来する細胞若しくは細胞亜集団の近位−遠位起源を示す核酸アレイ。
  41. 前記位置マーカーは、請求項32又は33に列挙したマーカーである、請求項40に記載のアレイ。
  42. アレイが、複数の、
    (i)ETNK1及び/又はGBA3及び/又はPRACに対応するヌクレオチド配列又はそれと少なくとも80%の同一性を示す配列を含む核酸分子又は前記核酸分子の官能的誘導体、フラグメント、変異体若しくはホモログ;又は
    (ii)42℃の低ストリンジェンシー条件下で(i)の配列のいずれか1つ又はそれ以上にハイブリダイズすることのできるヌクレオチド配列を含む核酸分子、又は前記核酸分子の官能的誘導体、フラグメント、変異体若しくはホモログ;
    (iii)42℃の低ストリンジェンシー条件下で(i)の配列のいずれか1つ又はそれ以上にハイブリダイズすることのできるヌクレオチド配列を含む核酸プローブ若しくはオリゴヌクレオチド、又は前記核酸分子の官能的誘導体、フラグメント、変異体若しくはホモログ;
    (iv)(i)若しくは(ii)の核酸分子によってコードされたタンパク質、又は前記タンパク質の誘導体、フラグメント、変異体若しくはホモログを含む核酸アレイであって、
    前記核酸の発現のレベルは、大腸に由来する細胞若しくは細胞亜集団の近位−遠位起源を示す核酸アレイ。
  43. 前記アレイは、請求項32〜39のいずれか一項に記載の方法において使用される、請求項40〜42のいずれか一項に記載のアレイ。
  44. 個体の大腸に由来する細胞若しくは細胞集団の解剖学的起源を決定するための請求項40〜42のいずれか一項に記載のアレイの使用。
  45. 前記遺伝子は、
    PITX2、若しくはAffymetrixプローブ番号:207558_s_atによって検出された1個又はそれ以上の遺伝子、
    ETNK1、若しくはAffymetrixプローブ番号:222262_s_at若しくは224453_s_atによって検出された1個又はそれ以上の遺伝子、
    FAM3B、
    CYP2C18、若しくはAffymetrixプローブ番号:208126_s_atによって検出された1個又はそれ以上の遺伝子、
    GBA3、若しくはAffymetrixプローブ番号:219954_s_atによって検出された1個又はそれ以上の遺伝子、
    MEP1B、
    ADRA2A、
    HSD3B2、
    CYP2B6、若しくはAffymetrixプローブ番号:206754_s_atによって検出された1個又はそれ以上の遺伝子、
    SLC14A2、若しくはAffymetrixプローブ番号:226432_s_atによって検出された1個又はそれ以上の遺伝子、
    CYP2C9、若しくはAffymetrixプローブ番号:231576_s_atによって検出された1個又はそれ以上の遺伝子、
    DEFA5、
    OASL、若しくはAffymetrixプローブ番号:210797_s_atによって検出された1個又はそれ以上の遺伝子、
    SLC37A3、
    REG1A、
    MEP1B、
    NR1H4;又は
    DKFZp761N1114、若しくはAffymetrixプローブ番号:242374_s_atによって検出された1個又はそれ以上の遺伝子、
    PRAC、
    INSL5、
    HOXB13、又は
    WFDC2から選択される、請求項23に記載の方法。
  46. 前記発現レベルはタンパク質発現である、請求項1〜39又は45のいずれか一項に記載の方法。
  47. 前記発現レベルはmRNA発現である、請求項1〜39又は45のいずれか一項に記載の方法。
  48. 大腸における細胞異常又は細胞異常を特徴とする状態の発症又は発症に対する素因を決定するための方法であって、前記方法は請求項1〜39又は45〜47のいずれか一項に記載の方法に従って、大腸における公知の近位若しくは遠位起源に由来する生物学的サンプルの近位−遠位遺伝子発現プロファイルを決定する工程を含み、正常近位−遠位大腸遺伝子発現プロファイルと一致しない遺伝子発現プロファイルの検出は前記プロファイルを発現する細胞若しくは細胞集団の異常の指標となる方法。
  49. 1つ又はそれ以上の近位−遠位マーカーを検出するための作用物質(agent)及び前記作用物質による検出を促進するために有用な試薬を含む、生物学的サンプルをアッセイするための診断用キット。
  50. 請求項1〜39又は45〜47のいずれか一項に記載の方法において使用する場合の、請求項49に記載のキット。
JP2009511302A 2006-05-22 2007-05-22 検出方法 Withdrawn JP2010527577A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US80231206P 2006-05-22 2006-05-22
PCT/AU2007/000703 WO2007134395A1 (en) 2006-05-22 2007-05-22 Detection method

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2014043282A Division JP2014158468A (ja) 2014-03-05 2014-03-05 検出方法

Publications (1)

Publication Number Publication Date
JP2010527577A true JP2010527577A (ja) 2010-08-19

Family

ID=38722870

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009511302A Withdrawn JP2010527577A (ja) 2006-05-22 2007-05-22 検出方法

Country Status (10)

Country Link
US (2) US20090325810A1 (ja)
EP (2) EP2767595B1 (ja)
JP (1) JP2010527577A (ja)
CN (1) CN101506379A (ja)
AU (1) AU2007252306B2 (ja)
BR (1) BRPI0713098A2 (ja)
NZ (1) NZ573190A (ja)
RU (1) RU2008150483A (ja)
WO (1) WO2007134395A1 (ja)
ZA (1) ZA200810140B (ja)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101344519B (zh) * 2008-08-21 2012-08-22 上海交通大学 用于优化结直肠癌诊断的肿瘤标志物多分割点设置***
MX2012005595A (es) * 2009-11-26 2012-05-29 Hoffmann La Roche Proteina marcadora para diabetes de tipo 2.
US8609612B2 (en) 2010-02-12 2013-12-17 Ngm Biopharmaceuticals, Inc. Methods of treating glucose metabolism disorders
US10767214B2 (en) 2010-10-28 2020-09-08 Clinical Genomics Pty Ltd Method of microvesicle enrichment
BR112014028122B1 (pt) 2012-05-11 2022-08-23 Commonwealth Scientific And Industrial Research Organisation Método para triar o princípio ou a predisposição ao princípio de neoplasma no intestino grosso ou para monitorar neoplasma no intestino grosso em indivíduo
HRP20211911T1 (hr) 2013-03-15 2022-03-18 Protagonist Therapeutics, Inc. Analozi hepcidina i njihova uporaba
CN113621027A (zh) 2014-05-16 2021-11-09 领导医疗有限公司 α4β7整联蛋白硫醚肽拮抗剂
RU2736637C9 (ru) 2014-07-17 2021-02-08 Протагонист Терепьютикс, Инк. Пептидные ингибиторы рецептора интерлейкина-23 для перорального приема и их применение для лечения воспалительных заболеваний кишечника
KR20170036727A (ko) * 2014-08-01 2017-04-03 아리오사 다이어그노스틱스, 아이엔씨. 혼성화를 이용한 표적 핵산 검출 방법
CN105044360A (zh) * 2015-07-22 2015-11-11 浙江大学医学院附属邵逸夫医院 Rbp4作为结直肠癌血清标记物的应用及诊断试剂盒
WO2017117411A1 (en) 2015-12-30 2017-07-06 Protagonist Therapeutics, Inc. Analogues of hepcidin mimetics with improved in vivo half lives
CN105938521A (zh) * 2016-07-04 2016-09-14 苏州大学附属儿童医院 一种强直性脊柱炎预警模型建立方法及装置
US20200064357A1 (en) * 2016-11-09 2020-02-27 Protagonist Therapeutics, Inc. Methods for determining and monitoring gastrointestinal inflammation
WO2018200715A1 (en) * 2017-04-25 2018-11-01 The University Of Chicago Cellular analysis
US11450121B2 (en) * 2017-06-27 2022-09-20 The Regents Of The University Of California Label-free digital brightfield analysis of nucleic acid amplification
US10636512B2 (en) 2017-07-14 2020-04-28 Cofactor Genomics, Inc. Immuno-oncology applications using next generation sequencing
CN108179192A (zh) * 2018-02-06 2018-06-19 徐州医科大学 一种基因多态性变异位点早期诊断子宫内膜癌的试剂盒
WO2019157268A1 (en) 2018-02-08 2019-08-15 Protagonist Therapeutics, Inc. Conjugated hepcidin mimetics
CN108490178B (zh) * 2018-02-13 2019-08-30 中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所) 用于npc诊断及预后预测的标志物及其应用
WO2019200398A1 (en) * 2018-04-13 2019-10-17 Dana-Farber Cancer Institute, Inc. Ultra-sensitive detection of cancer by algorithmic analysis
CN110055338B (zh) * 2019-04-11 2023-09-05 珠海铂华生物工程有限公司 一种弥漫性大b细胞淋巴瘤基因突变检测试剂盒
CN110456072A (zh) * 2019-08-15 2019-11-15 深圳市盛波尔生命科学技术有限责任公司 胰岛再生原蛋白1α的应用及其检测方法
TW202237167A (zh) 2020-11-20 2022-10-01 比利時商健生藥品公司 介白素-23受體之肽抑制劑組合物

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4868105A (en) 1985-12-11 1989-09-19 Chiron Corporation Solution phase nucleic acid sandwich assay
US5700637A (en) 1988-05-03 1997-12-23 Isis Innovation Limited Apparatus and method for analyzing polynucleotide sequences and method of generating oligonucleotide arrays
US6040138A (en) 1995-09-15 2000-03-21 Affymetrix, Inc. Expression monitoring by hybridization to high density oligonucleotide arrays
US5143854A (en) 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
US5470967A (en) 1990-04-10 1995-11-28 The Dupont Merck Pharmaceutical Company Oligonucleotide analogs with sulfamate linkages
US5714331A (en) 1991-05-24 1998-02-03 Buchardt, Deceased; Ole Peptide nucleic acids having enhanced binding affinity, sequence specificity and solubility
US5419966A (en) 1991-06-10 1995-05-30 Microprobe Corporation Solid support for synthesis of 3'-tailed oligonucleotides
US5384261A (en) 1991-11-22 1995-01-24 Affymax Technologies N.V. Very large scale immobilized polymer synthesis using mechanically directed flow paths
US5837832A (en) 1993-06-25 1998-11-17 Affymetrix, Inc. Arrays of nucleic acid probes on biological chips
US6015880A (en) 1994-03-16 2000-01-18 California Institute Of Technology Method and substrate for performing multiple sequential reactions on a matrix
US5807522A (en) 1994-06-17 1998-09-15 The Board Of Trustees Of The Leland Stanford Junior University Methods for fabricating microarrays of biological samples
US20010036635A1 (en) * 2000-03-27 2001-11-01 Waldman Scott A. Compositions and methods for identifying and targeting cancer cells of alimentary canal origin
WO2002059609A2 (en) * 2000-12-08 2002-08-01 Eos Biotechnology, Inc. Methods of diagnosing colorectal cancer and/or breast cancer, compositions, and methods of screening for colorectal cancer and/or breast cancer modulators
EP1608964A4 (en) * 2003-03-14 2009-07-15 Peter Maccallum Cancer Inst PROFILING THE EXPRESSION OF TUMORS

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JPN6012044845; Cancer Epidemiol. Biomarkers Prev., 12(2003) p.755-762 *
JPN6012044846; J. Surg. Res., 124(2005) p.216-224 *

Also Published As

Publication number Publication date
AU2007252306B2 (en) 2013-10-17
EP2024509A4 (en) 2010-08-04
CN101506379A (zh) 2009-08-12
US20170260585A1 (en) 2017-09-14
ZA200810140B (en) 2009-12-30
US20090325810A1 (en) 2009-12-31
AU2007252306A1 (en) 2007-11-29
EP2767595A1 (en) 2014-08-20
RU2008150483A (ru) 2010-06-27
EP2024509A1 (en) 2009-02-18
BRPI0713098A2 (pt) 2012-10-16
WO2007134395A1 (en) 2007-11-29
NZ573190A (en) 2012-03-30
EP2767595B1 (en) 2018-09-19

Similar Documents

Publication Publication Date Title
JP2010527577A (ja) 検出方法
JP6106636B2 (ja) 2型腫瘍症(neoplasms−ii)の診断法
US10344334B2 (en) Method of diagnosing neoplasms
US20190249260A1 (en) Method for Using Gene Expression to Determine Prognosis of Prostate Cancer
US8299233B2 (en) Molecular in vitro diagnosis of breast cancer
JP4435259B2 (ja) 微量胃癌細胞の検出法
KR20100058421A (ko) 신규 발병 심부전증에 대한 개별 위험 평가용 전사체 바이오마커
JP4317854B2 (ja) 微量胃癌細胞の検出法
CN101457254B (zh) 用于肝癌预后的基因芯片和试剂盒
BR112020012280A2 (pt) composições e métodos para diagnosticar cânceres de pulmão usando perfis de expressão de gene
EP1683862B1 (en) Microarray for assessing neuroblastoma prognosis and method of assessing neuroblastoma prognosis
JP2014158468A (ja) 検出方法
AU2015203005B2 (en) A method of diagnosing neoplasms
JP2019187361A (ja) メチル含有基修飾核酸を精製、分離または濃縮する方法
Westbrook et al. Novel Targets for Diagnosis and Treatment of Breast Cancer Identified by Genomic Analysis

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100521

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100521

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120828

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20121127

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20121204

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130228

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20131105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140305

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140430

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20140529

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20140711

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20141112

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20141117

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20150511