JP2018512160A - 肺がんのタイピングのための方法 - Google Patents

肺がんのタイピングのための方法 Download PDF

Info

Publication number
JP2018512160A
JP2018512160A JP2017553970A JP2017553970A JP2018512160A JP 2018512160 A JP2018512160 A JP 2018512160A JP 2017553970 A JP2017553970 A JP 2017553970A JP 2017553970 A JP2017553970 A JP 2017553970A JP 2018512160 A JP2018512160 A JP 2018512160A
Authority
JP
Japan
Prior art keywords
biomarkers
classifier
classifier biomarkers
sample
hybridization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017553970A
Other languages
English (en)
Other versions
JP2018512160A5 (ja
Inventor
ハワジン ファルキ,
ハワジン ファルキ,
マイラ ライ−ゴールドマン,
マイラ ライ−ゴールドマン,
グレッグ メイヒュー,
グレッグ メイヒュー,
チャールズ ペロウ,
チャールズ ペロウ,
デイビッド ニール ヘイズ,
デイビッド ニール ヘイズ,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of North Carolina at Chapel Hill
Original Assignee
University of North Carolina at Chapel Hill
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of North Carolina at Chapel Hill filed Critical University of North Carolina at Chapel Hill
Publication of JP2018512160A publication Critical patent/JP2018512160A/ja
Publication of JP2018512160A5 publication Critical patent/JP2018512160A5/ja
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Hospice & Palliative Care (AREA)
  • Biophysics (AREA)
  • Oncology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

肺がん試料の分子サブタイピングのための方法および組成物が提供されている。具体的には、患者の腺癌の肺がんサブタイプが、終末呼吸単位(TRU)、近位炎症性(PI)、または近位増殖性(PP)であるか否かを評価する方法が、本明細書に提供されている。本方法は、患者から得られる肺がん試料において、核酸レベルで、表1〜表6のクラシファイヤーバイオマーカーまたはこれらのサブセットのレベルを検出することを必要とする。クラシファイヤーバイオマーカーのレベルに部分的に基づいて、肺がん試料は、TRU、PI、またはPP試料として分類される。

Description

仮出願でない米国出願への相互参照
本出願は、2015年4月14日に出願された米国仮出願番号第62/147,547号からの優先権を主張しており、この仮出願は、すべての目的のためにその全体が参考として本明細書中に援用される。
配列表に関する陳述
本願と関連した配列表は、紙のコピーの代わりにテキストフォーマットで提供されており、本明細書に参照により組み込まれている。配列表を含有するテキストファイルの名称は、GNCN_007_01WO_ST25.txtである。テキストファイルは、17KBであり、2016年4月14日に作成され、EFS−Webを介して電子的に提出されている。
発明の背景
肺がんは、米国におけるがん死の主要原因であり、220,000を超える新しい肺がん症例が毎年同定されている。肺がんは、組織診断によって一般に決定されるサブタイプ(小細胞癌、非小細胞癌、カルチノイド、腺癌、および扁平上皮細胞癌腫)を有する異種疾患である。肺がんの様々な形態的サブタイプの区別が患者管理の指導において必須であり、追加の分子検査が特異的な治療標的マーカーを同定するのに使用される。形態のばらつき、限られた組織試料、および治療的に標的とされるマーカーの、長くなる一方のリストの評価の必要性は、現在の診断基準にとっての難題となっている。組織学的診断再現性の試験は、病理学者間の合致および病理学者間の合致が限定的であることを示している。
新しい療法が肺がんの特定のサブタイプにますます向けられている一方(ベバシズマブおよびペメトレキセド)、組織学的診断再現性の試験は、病理学者間の合致が限定的であること、および病理学者間ではさらに合致することが少ないことを示している。低分化型腫瘍、矛盾する免疫組織化学検査結果、およびほんの限られた数の染色しか実施することができない小体積生検は依然として、現在の診断基準にとっての難題である(TravisおよびRekhtman、Sem Resp and Crit Care Med、2011年;32巻(1号):22〜31頁;Travisら、Arch Pathol Lab Med、2013年;137巻(5号):668〜84頁;Tangら、J Thorac Dis、2014年;6巻(S5号):S489〜S501頁)。
TravisおよびRekhtman、Sem Resp and Crit Care Med、2011年;32巻(1号):22〜31頁 Travisら、Arch Pathol Lab Med、2013年;137巻(5号):668〜84頁; Tangら、J Thorac Dis、2014年;6巻(S5号):S489〜S501頁
TCGA肺がんゲノムプロジェクトに提出された肺がん試料の専門的な病理学的再レビューを伴う最近の例では、提出された肺腫瘍の15〜20%が再分類されており、このことから、形態に基づく診断が難題であり続けていることが確認される。(Cancer Genome Atlas Research Network、「Comprehensive genomic characterization of squamous cell lung cancers.」、Nature、489巻、7417号(2012年):519〜525頁;Cancer Genome Atlas Research Network、Comprehensive molecular profiling of lung adenocarcinoma、Nature、511巻、7511号(2014年):543〜550頁、これらのそれぞれは、その全体が本明細書に参照により組み込まれている)。したがって、肺がんサブタイプを決定するためのより信頼できる手段の必要性が存在する。本発明は、この必要性および他の必要性に対処するものである。
発明の要旨
一態様では、患者の腺癌の肺がんサブタイプが、スクアモイド(squamoid)(近位炎症性(proximal inflammatory))、ブロンコイド(bronchoid)(終末呼吸単位(terminal respiratory unit))、またはマグノイド(magnoid)(近位増殖性(proximal proliferative))であるか否かを評価する方法。一実施形態では、本方法は、患者から得られる肺がん試料において、核酸レベルで表1A、表1B、表1C、表2、表3、表4、表5、または表6のクラシファイヤーバイオマーカーの少なくとも5種のクラシファイヤーバイオマーカーのレベルをプローブするステップを含む。プローブするステップは、一実施形態では、試料を、表1A、表1B、表1C、表2、表3、表4、表5、または表6の少なくとも5種のクラシファイヤーバイオマーカーのcDNA分子の部分に実質的に相補的である5種またはそれ超のオリゴヌクレオチドと、これらの5種またはそれ超のオリゴヌクレオチドのこれらの相補体または実質的な相補体へのハイブリダイゼーションに適した条件下で混合すること;ハイブリダイゼーションが、これらの5種またはそれ超のオリゴヌクレオチドとこれらの相補体または実質的な相補体との間で起こるか否かを検出すること;検出するステップに基づいて少なくとも5種のクラシファイヤーバイオマーカーのハイブリダイゼーション値を得ることを含む。次いで、少なくとも5種のクラシファイヤーバイオマーカーのハイブリダイゼーション値を、少なくとも1つの試料訓練セットからの参照ハイブリダイゼーション値(単数または複数)と比較し、ここで、少なくとも1つの試料訓練セットは、(i)少なくとも5種のバイオマーカーを過剰発現する試料、もしくは少なくとも5種のバイオマーカーのサブセットを過剰発現する試料からの少なくとも5種のバイオマーカーのハイブリダイゼーション値(単数または複数)、(ii)参照スクアモイド(近位炎症性)、ブロンコイド(終末呼吸単位)、もしくはマグノイド(近位増殖性)試料からのハイブリダイゼーション値、または(iii)無腺癌肺試料からのハイブリダイゼーション値を含む。比較するステップの結果に基づいて腺癌の肺がん試料をスクアモイド(近位炎症性)、ブロンコイド(終末呼吸単位)、またはマグノイド(近位増殖性)サブタイプとして分類する。一実施形態では、比較するステップは、少なくとも5種のクラシファイヤーバイオマーカーのハイブリダイゼーション値と、参照ハイブリダイゼーション値との間の相関を決定することを含む。一実施形態では、比較するステップは、少なくとも5種のバイオマーカーの平均発現比を決定することと、この平均発現比を、試料訓練セットにおける参照値から得られる少なくとも5種のバイオマーカーの平均発現比と比較することとをさらに含む。一実施形態では、プローブするステップは、混合するステップの前に核酸またはその部分を単離することを含む。さらなる実施形態では、ハイブリダイゼーションは、cDNAのcDNAへのハイブリダイゼーション、それによって非天然複合体を形成すること、またはcDNAのmRNAへのハイブリダイゼーション、それによって非天然複合体を形成することを含む。なおさらなる実施形態では、プローブするステップは、試料中の核酸を増幅することを含む。一実施形態では、肺がん試料は、パラフィン中に包埋された肺細胞を含む。一実施形態では、肺がん試料は、新鮮凍結試料である。一実施形態では、肺がん試料は、ホルマリン固定パラフィン包埋(FFPE)肺組織試料、新鮮および凍結組織試料から選択される。
別の態様では、ヒト患者からの肺組織試料が、スクアモイド(近位炎症性)、ブロンコイド(終末呼吸単位)、またはマグノイド(近位増殖性)腺癌の肺がんサブタイプであるか否かを評価するための方法が、本明細書に提供されている。一実施形態では、本方法は、クラシファイヤーバイオマーカーに特異的なオリゴヌクレオチドを用いたRNA−seq、逆転写酵素ポリメラーゼ連鎖反応(RT−PCR)、またはハイブリダイゼーションアッセイによって、核酸レベルで表1A、表1B、表1C、表2、表3、表4、表5、または表6の少なくとも5種のクラシファイヤーバイオマーカーの発現レベルを検出するステップと;表1A、表1B、表1C、表2、表3、表4、表5、または表6の少なくとも5種のクラシファイヤーバイオマーカーの発現の検出されたレベルを、少なくとも1つの試料訓練セットからの少なくとも5種のクラシファイヤーバイオマーカーの発現レベルと比較するステップとを含む。一実施形態では、少なくとも1つの試料訓練セットは、(i)少なくとも5種のバイオマーカーを過剰発現する試料、もしくは少なくとも5種のバイオマーカーのサブセットを過剰発現する試料からの少なくとも5種のバイオマーカーの発現レベル(単数または複数)、(ii)参照スクアモイド(近位炎症性)、ブロンコイド(終末呼吸単位)、もしくはマグノイド(近位増殖性)試料からの発現レベル、または(iii)無腺癌肺試料からの発現レベルを含み;そして比較するステップの結果に基づいて肺組織試料をスクアモイド(近位炎症性)、ブロンコイド(終末呼吸単位)、またはマグノイド(近位増殖性)サブタイプとして分類するステップを含む。一実施形態では、比較するステップは、肺組織試料から得た発現データと、少なくとも1つの訓練セット(単数または複数)からの発現データとの間の相関を決定することを含む統計的アルゴリズムを適用することと;統計的アルゴリズムの結果に基づいて肺組織試料をスクアモイド(近位炎症性)、ブロンコイド(終末呼吸単位)、またはマグノイド(近位増殖性)サブタイプとして分類することとを含む。一実施形態では、比較するステップは、少なくとも5種のバイオマーカーの平均発現比を決定することと、この平均発現比を、試料訓練セットからの参照値から得られる少なくとも5種のバイオマーカーの平均発現比と比較することとをさらに含む。一実施形態では、肺組織試料は、ホルマリン固定パラフィン包埋(FFPE)肺組織試料、新鮮および凍結組織試料から選択される。
さらに別の態様では、肺がんに罹患している患者について疾患アウトカムを決定するための方法が、本明細書に提供されており、本方法は、患者から得た第1の試料の遺伝子発現分析を介して肺がんのサブタイプを決定して、遺伝子発現ベースサブタイプを生成するステップと;患者から得た第2の試料の形態学的分析を介して肺がんのサブタイプを決定して、形態学ベースサブタイプを生成するステップと;遺伝子発現ベースサブタイプを形態学ベースサブタイプと比較するステップであって、遺伝子発現ベースサブタイプと形態学ベースサブタイプとの間の一致の存在または非存在は、疾患アウトカムを予測する、ステップとを含む。一実施形態では、遺伝子発現ベースサブタイプと形態学ベースサブタイプとの間の不一致は、不良な疾患アウトカムを予測する。一実施形態では、疾患アウトカムは、全生存である。一実施形態では、遺伝子発現ベースサブタイプおよび/または形態学ベースサブタイプは、腺癌、扁平上皮細胞癌腫、または神経内分泌癌腫である。一実施形態では、神経内分泌癌腫は、小細胞癌腫およびカルチノイドを包含する。一実施形態では、第1の試料および/または第2の試料は、ホルマリン固定パラフィン包埋(FFPE)肺組織試料、新鮮または凍結組織試料である。一実施形態では、第1の試料および第2の試料は、同一の試料の部分である。一実施形態では、遺伝子発現分析は、RNA配列決定、逆転写酵素ポリメラーゼ連鎖反応(RT−PCR)、またはハイブリダイゼーションベース分析を実施することによって、第1の試料において、核酸レベルで表1A、表1B、表1C、表2、表3、表4、表5、または表6の少なくとも5種のクラシファイヤーバイオマーカーの発現レベルを決定することを含む。一実施形態では、RT−PCRは、定量的リアルタイム逆転写酵素ポリメラーゼ連鎖反応(qRT−PCR)である。一実施形態では、RT−PCRは、少なくとも5種のクラシファイヤーバイオマーカーに特異的なプライマーを用いて実施され;本方法は、表1A、表1B、表1C、表2、表3、表4、表5、もしくは表6の少なくとも5種のクラシファイヤーバイオマーカーの発現の検出されたレベルを、少なくとも1つの試料訓練セット(単数または複数)における少なくとも5種のクラシファイヤーバイオマーカーの発現と比較するステップであって、少なくとも1つの試料訓練セットは、参照腺癌試料から得た、表1A、表1B、表1C、表2、表3、表4、表5、もしくは表6の少なくとも5種のクラシファイヤーバイオマーカーの発現データ、参照扁平上皮細胞癌腫試料から得た、表1A、表1B、表1C、表2、表3、表4、表5、もしくは表6の少なくとも5種のクラシファイヤーバイオマーカーの発現データ、参照神経内分泌癌腫試料から得た、表1A、表1B、表1C、表2、表3、表4、表5、もしくは表6の少なくとも5種のクラシファイヤーバイオマーカーの発現データ、またはこれらの組合せを含む、ステップと;比較するステップの結果に基づいて第1の試料を腺癌、扁平上皮細胞癌腫、または神経内分泌癌腫サブタイプとして分類するステップとを含む。一実施形態では、比較するステップは、第1の試料から得た発現データと、少なくとも1つの訓練セット(単数または複数)からの発現データとの間の相関を決定することを含む統計的アルゴリズムを適用することと;統計的アルゴリズムの結果に基づいて第1の試料を腺癌、扁平上皮細胞癌腫、または神経内分泌癌腫サブタイプとして分類することとを含む。一実施形態では、少なくとも5種のクラシファイヤーバイオマーカーに特異的なプライマーは、表1A、表1B、表1C、表2、表3、表4、表5、または表6に列挙された順方向プライマーおよび逆方向プライマーである。一実施形態では、ハイブリダイゼーション分析は、(a)患者から得られる肺がん試料において、核酸レベルで表1A、表1B、表1C、表2、表3、表4、表5、または表6の少なくとも5種のクラシファイヤーバイオマーカーのレベルをプローブするステップであって、(i)試料を、表1A、表1B、表1C、表2、表3、表4、表5、または表6の少なくとも5種のクラシファイヤーバイオマーカーの核酸分子の部分に実質的に相補的である5種またはそれ超のオリゴヌクレオチドと、5種またはそれ超のオリゴヌクレオチドのこれらの相補体または実質的な相補体へのハイブリダイゼーションに適した条件下で混合すること;(ii)ハイブリダイゼーションが、5種またはそれ超のオリゴヌクレオチドとこれらの相補体または実質的な相補体との間で起こるか否かを検出すること;(iii)検出するステップに基づいて少なくとも5種のクラシファイヤーバイオマーカーのハイブリダイゼーション値を得ることを含むステップと;(b)少なくとも5種のクラシファイヤーバイオマーカーのハイブリダイゼーション値を、少なくとも1つの試料訓練セットからの参照ハイブリダイゼーション値(単数または複数)と比較するステップであって、少なくとも1つの試料訓練セットは、参照腺癌試料からのハイブリダイゼーション値、参照扁平上皮細胞癌腫試料からのハイブリダイゼーション値、参照神経内分泌癌腫試料からのハイブリダイゼーション値、またはこれらの組合せを含む、ステップと;(c)比較するステップの結果に基づいて肺がん試料を腺癌、扁平上皮細胞癌腫、または神経内分泌癌腫サブタイプとして分類するステップとを含む。一実施形態では、比較するステップは、少なくとも5種のクラシファイヤーバイオマーカーのハイブリダイゼーション値と、参照ハイブリダイゼーション値との間の相関を決定することを含む。一実施形態では、比較するステップは、少なくとも5種のバイオマーカーの平均発現比を決定することと、この平均発現比を、試料訓練セットにおける参照値から得られる少なくとも5種のバイオマーカーの平均発現比と比較することとをさらに含む。一実施形態では、プローブするステップは、混合するステップの前に核酸またはその部分を単離することを含む。一実施形態では、ハイブリダイゼーションは、cDNAプローブのcDNAバイオマーカーへのハイブリダイゼーション、それによって非天然複合体を形成することを含む。一実施形態では、ハイブリダイゼーションは、cDNAプローブのmRNAバイオマーカーへのハイブリダイゼーション、それによって非天然複合体を形成することを含む。一実施形態では、第2の試料の形態学的分析は、組織学的分析である。
一実施形態では、上記に示した態様のいずれかの少なくとも5種のクラシファイヤーバイオマーカーは、表1A、表1B、または表1Cの少なくとも10種のバイオマーカー、少なくとも20種のバイオマーカー、または少なくとも30種のバイオマーカーを含む。一実施形態では、少なくとも5種のクラシファイヤーバイオマーカーは、表2の少なくとも10種のバイオマーカー、少なくとも20種のバイオマーカー、または少なくとも30種のバイオマーカーを含む。一実施形態では、少なくとも5種のクラシファイヤーバイオマーカーは、表3の少なくとも10種のバイオマーカー、少なくとも20種のバイオマーカー、または少なくとも30種のバイオマーカーを含む。一実施形態では、少なくとも5種のクラシファイヤーバイオマーカーは、表4の6種のバイオマーカーを含む。一実施形態では、少なくとも5種のクラシファイヤーバイオマーカーは、表5の6種のバイオマーカーを含む。一実施形態では、少なくとも5種のクラシファイヤーバイオマーカーは、表6の少なくとも10種のバイオマーカー、少なくとも20種のバイオマーカー、または少なくとも30種のバイオマーカーを含む。一実施形態では、少なくとも5種のクラシファイヤーバイオマーカーは、表1A、表1B、または表1Cの約10〜約30種のクラシファイヤーバイオマーカー、または約15〜約40種のクラシファイヤーバイオマーカーを含む。一実施形態では、少なくとも5種のクラシファイヤーバイオマーカーは、表2の約10〜約30種のクラシファイヤーバイオマーカー、または約15〜約40種のクラシファイヤーバイオマーカーを含む。一実施形態では、少なくとも5種のクラシファイヤーバイオマーカーは、表3の約10〜約30種のクラシファイヤーバイオマーカー、または約15〜約40種のクラシファイヤーバイオマーカーを含む。一実施形態では、少なくとも5種のクラシファイヤーバイオマーカーは、表6の約5〜約30種のクラシファイヤーバイオマーカー、または約10〜約30種のクラシファイヤーバイオマーカーを含む。一実施形態では、少なくとも5種のクラシファイヤーバイオマーカーは、表1A、表1B、または表1Cに示したクラシファイヤーバイオマーカーのそれぞれを含む。一実施形態では、少なくとも5種のクラシファイヤーバイオマーカーは、表2に示したクラシファイヤーバイオマーカーのそれぞれを含む。一実施形態では、少なくとも5種のクラシファイヤーバイオマーカーは、表3に示したクラシファイヤーバイオマーカーのそれぞれを含む。一実施形態では、少なくとも5種のクラシファイヤーバイオマーカーは、表6に示したクラシファイヤーバイオマーカーのそれぞれを含む。一実施形態では、少なくとも5種のクラシファイヤーバイオマーカーは、表1Aに示したクラシファイヤーバイオマーカーのそれぞれを含む。一実施形態では、少なくとも5種のクラシファイヤーバイオマーカーは、表1Bに示したクラシファイヤーバイオマーカーのそれぞれを含む。一実施形態では、少なくとも5種のクラシファイヤーバイオマーカーは、表1Cに示したクラシファイヤーバイオマーカーのそれぞれを含む。
図1A〜1Dは、腺癌(図1A)、扁平上皮細胞癌腫(図1B)、小細胞癌腫(図1C)、およびカルチノイド(図1D)についての例示的な遺伝子発現ヒートマップを例示する。 図1A〜1Dは、腺癌(図1A)、扁平上皮細胞癌腫(図1B)、小細胞癌腫(図1C)、およびカルチノイド(図1D)についての例示的な遺伝子発現ヒートマップを例示する。 図1A〜1Dは、腺癌(図1A)、扁平上皮細胞癌腫(図1B)、小細胞癌腫(図1C)、およびカルチノイド(図1D)についての例示的な遺伝子発現ヒートマップを例示する。 図1A〜1Dは、腺癌(図1A)、扁平上皮細胞癌腫(図1B)、小細胞癌腫(図1C)、およびカルチノイド(図1D)についての例示的な遺伝子発現ヒートマップを例示する。
図2は、FFPE RT−PCR遺伝子発現データセットについての遺伝子発現階層的クラスタリングのヒートマップを例示する。
図3は、77のFFPE試料についての病理学的レビューおよびLSP予測の比較を例示する。各矩形は、試料数によって並べられた単一試料を表す。矢印は、病理学的レビューおよび遺伝子発現の両方によって元の診断と合致しなかった6つの試料を示す(試料の詳細については表18を参照)。
図4〜7は、3つの独立したADデータセット:すべての病期にわたる、LSP遺伝子発現サブタイプを割り当てられたディレクターズチャレンジ(Sheddenら;図4)、TCGA RNAseqデータ(図5)、Tomidaらのアレイデータ(図6)またはプールされた(図7)についての5年間にわたる全生存の関数としての、予測された肺がんサブタイプAD、SQ、またはNEを示すカプラン・マイヤープロットを例示する。 図4〜7は、3つの独立したADデータセット:すべての病期にわたる、LSP遺伝子発現サブタイプを割り当てられたディレクターズチャレンジ(Sheddenら;図4)、TCGA RNAseqデータ(図5)、Tomidaらのアレイデータ(図6)またはプールされた(図7)についての5年間にわたる全生存の関数としての、予測された肺がんサブタイプAD、SQ、またはNEを示すカプラン・マイヤープロットを例示する。 図4〜7は、3つの独立したADデータセット:すべての病期にわたる、LSP遺伝子発現サブタイプを割り当てられたディレクターズチャレンジ(Sheddenら;図4)、TCGA RNAseqデータ(図5)、Tomidaらのアレイデータ(図6)またはプールされた(図7)についての5年間にわたる全生存の関数としての、予測された肺がんサブタイプAD、SQ、またはNEを示すカプラン・マイヤープロットを例示する。 図4〜7は、3つの独立したADデータセット:すべての病期にわたる、LSP遺伝子発現サブタイプを割り当てられたディレクターズチャレンジ(Sheddenら;図4)、TCGA RNAseqデータ(図5)、Tomidaらのアレイデータ(図6)またはプールされた(図7)についての5年間にわたる全生存の関数としての、予測された肺がんサブタイプAD、SQ、またはNEを示すカプラン・マイヤープロットを例示する。
図8〜11は、3つの独立したADデータセット:病期IおよびIIにわたる、LSP遺伝子発現サブタイプを割り当てられたディレクターズチャレンジ(Sheddenら;図8)、TCGA RNAseqデータ(図9)、Tomidaらのアレイデータ(図10)、プールされた(図11)についての5年間にわたる全生存の関数としての、予測された肺がんサブタイプAD、SQ、またはNEを示すカプラン・マイヤープロットを例示する。 図8〜11は、3つの独立したADデータセット:病期IおよびIIにわたる、LSP遺伝子発現サブタイプを割り当てられたディレクターズチャレンジ(Sheddenら;図8)、TCGA RNAseqデータ(図9)、Tomidaらのアレイデータ(図10)、プールされた(図11)についての5年間にわたる全生存の関数としての、予測された肺がんサブタイプAD、SQ、またはNEを示すカプラン・マイヤープロットを例示する。 図8〜11は、3つの独立したADデータセット:病期IおよびIIにわたる、LSP遺伝子発現サブタイプを割り当てられたディレクターズチャレンジ(Sheddenら;図8)、TCGA RNAseqデータ(図9)、Tomidaらのアレイデータ(図10)、プールされた(図11)についての5年間にわたる全生存の関数としての、予測された肺がんサブタイプAD、SQ、またはNEを示すカプラン・マイヤープロットを例示する。 図8〜11は、3つの独立したADデータセット:病期IおよびIIにわたる、LSP遺伝子発現サブタイプを割り当てられたディレクターズチャレンジ(Sheddenら;図8)、TCGA RNAseqデータ(図9)、Tomidaらのアレイデータ(図10)、プールされた(図11)についての5年間にわたる全生存の関数としての、予測された肺がんサブタイプAD、SQ、またはNEを示すカプラン・マイヤープロットを例示する。
図12は、増殖スコア(11の遺伝子PAM50シグネチャー)が、図4〜6に示される3つすべてのデータセットにおいて、AD−ADと比較してAD−NE/SQにおいてより高いことを例示する。
図13は、フィッシャー正確検定を使用した、一致しない(AD−NE/SQ)試料と比較した、組織学−遺伝子発現が一致する(AD−AD)試料における遺伝子変異の普及率を例示する。
図14は、LSP遺伝子発現によってNEまたはSQ(AD−NE/SQ)である組織学的に定義された腺癌試料の除外後の肺腺癌予後強度(prognostic strength)における低減を例示する。
図15は、全生存(OS)のCox比例ハザードモデルを例示する。図15のハザード比の表におけるモデルは、試料の3分の1を高リスクとする二値化リスクスコア(0.67分位数における)を使用した。表のp値部分におけるモデルでは、すべてのリスクスコアは連続的なままであった。すべてのモデルは(T、N、年齢)について調整した。
発明の詳細な説明
遺伝子発現ベース腺癌サブタイピングは、腺癌の腫瘍を3つの生物学的に別個のサブタイプ(終末呼吸単位(TRU;以前にはブロンキオイド(Bronchioid)と呼ばれた)、近位炎症性(PI;以前にはスクアモイドと呼ばれた)、および近位増殖性(PP;以前にはマグノイドと呼ばれた))へと分類することが示されている。これら3つのサブタイプは、それらの予後、それらの喫煙者対非喫煙者の分布、それらのEGFR変更の普及率、ALK再編成、TP53変異、およびそれらの血管新生特徴が変動する。本発明は、患者の腺癌サブタイプ(終末呼吸単位(TRU)、近位炎症性(PI)、近位増殖性(PP))に部分的に基づいて、腺癌患者集団について予後または疾患アウトカムを決定するための、当技術分野における必要性に対処する。
本明細書で使用される場合、「発現プロファイル」は、弁別的遺伝子(discriminative gene)の相対存在量、レベル、発現の存在または非存在の測定に対応する1つまたは複数の値を含む。発現プロファイルは、肺がんの診断の前もしくは後の対象に由来するものであってもよく、処置もしくは療法の前もしくは後の1つもしくは複数の時点で対象から収集される生体試料に由来するものであってもよく、処置もしくは療法がない(例えば、肺がんと診断され、もしくは肺がんのリスクにあると診断された対象における疾患の進行をモニターし、もしくは疾患の発生を評価するために)間の1つもしくは複数の時点で対象から収集される生体試料に由来するものであってもよく、または健康な対象から収集してもよい。用語「対象」は、患者と相互交換可能に使用され得る。患者は、ヒト患者であり得る。
本明細書で使用される場合、バイオマーカーまたはクラシファイヤーに言及して使用される用語「発現レベルを決定する」または「発現プロファイルを決定する」または「発現レベルを検出する」または「発現プロファイルを検出する」は、1つまたは複数のバイオマーカーの量、例えば、バイオマーカーポリペプチドまたはmRNA(またはそれらに由来するcDNA)の量を定量的、半定量的、または定性的に確認または測定するための、試料、例えば、対象もしくは患者の試料および/または対照試料への、バイオマーカー特異的作用物質、例えば、プローブ、プライマー、もしくは抗体および/または方法の適用を意味する。例えば、バイオマーカーのレベルは、バイオマーカー検出剤、例えば抗体、例えば標識された抗体が、バイオマーカーに特異的に結合し、例えば、ポリペプチドバイオマーカーの量の相対的または絶対的確認を可能にする、例えば、免疫組織化学検査、ELISA、ウエスタンブロット、免疫沈降などを含むイムノアッセイ、プローブまたはプライマーもしくはプライマーセットが、核酸バイオマーカーの量を確認するために使用される、例えば、マイクロアレイ分析、RT−PCR、例えば定量的RT−PCR(qRT−PCR)、遺伝子発現の連続分析(SAGE)、ノーザンブロット、デジタル分子ビーコンテクノロジー、例えば、Nanostring Counter分析、およびTaqMan定量的PCRアッセイを含むプローブベース方法および増幅ベース方法などを含むハイブリダイゼーションおよびPCRプロトコールなどを含むいくつかの方法によって決定され得る。mRNAの検出および定量化の他の方法、例えば、ホルマリン固定パラフィン包埋(FFPE)組織試料または細胞におけるmRNA in situハイブリダイゼーションが適用され得る。このテクノロジーは、ハイブリダイゼーションシグナルを増幅するために増幅システムに特異的に結合する各mRNAに対するプローブセットを使用する、QuantiGene ViewRNA(Affymetrix)によって現在提供されている;これらの増幅されたシグナルは、標準的な蛍光顕微鏡または画像化システムを使用して可視化され得る。例えば、試料が、同じ組織切片中に存在する正常細胞および腫瘍細胞を有する場合、このシステムは、例えば、不均一な試料中の転写物レベルを検出および測定できる。述べたように、TaqManプローブベース遺伝子発現分析(PCRベース)もまた、組織試料における遺伝子発現レベルを測定するために使用され得、このテクノロジーは、FFPE試料におけるmRNAレベルを測定するために有用であることが示されている。簡潔に述べると、TaqManプローブベースアッセイは、mRNA標的に特異的にハイブリダイズするプローブを利用する。このプローブは、各末端に結合されたクエンチャー色素およびレポーター色素(蛍光分子)を含み、蛍光は、mRNA標的への特異的ハイブリダイゼーションが起こる場合にのみ発光される。増幅ステップの間に、ポリメラーゼ酵素のエキソヌクレアーゼ活性は、クエンチャー色素およびレポーター色素をプローブから脱離させ、蛍光発光が起こり得る。この蛍光発光は記録され、シグナルは、検出システムによって測定される;これらのシグナル強度は、試料中の所与の転写物(遺伝子発現)の存在量を計算するために使用される。
本発明の「バイオマーカー」または「クラシファイヤーバイオマーカー」には、遺伝子およびタンパク質、ならびにこれらのバリアントおよび断片が含まれる。このようなバイオマーカーには、バイオマーカーをコードする核酸配列の全体的もしくは部分的配列、またはこのような配列の相補体を含むDNAが含まれる。バイオマーカー核酸には、目的の核酸配列の任意の発現産物またはこれらの部分もまた含まれる。バイオマーカータンパク質は、本発明のDNAバイオマーカーによってコードされるタンパク質、または本発明のDNAバイオマーカーに対応するタンパク質である。バイオマーカータンパク質は、バイオマーカータンパク質またはポリペプチドのいずれかの全体的または部分的アミノ酸配列を含む。
「バイオマーカー」は、組織または細胞におけるそれらの発現レベルが、正常または健康な細胞または組織のものと比較して変更される、任意の遺伝子またはタンパク質である。本発明のバイオマーカーの検出、および一部の場合ではレベルは、試料の区別を可能にする。
本明細書に提供するバイオマーカーパネルおよび方法は、様々な態様では、(i)患者のNSCLCサブタイプが、腺癌もしくは扁平上皮細胞癌腫であるか否か、(ii)患者の肺がんサブタイプが、腺癌、扁平上皮細胞癌腫、もしくは神経内分泌癌腫(小細胞癌腫、およびカルチノイドの両方を包含する)であるか否か、かつ/または(iii)患者の肺がんサブタイプが、腺癌、扁平上皮細胞癌腫、もしくは小細胞癌腫であるか否かを評価するのに使用される。一実施形態では、本明細書で記載するように、本明細書に提供する方法は、患者の肺がん(腺癌)試料を近位炎症性(スクアモイド)、近位増殖性(マグノイド)、または終末呼吸単位(ブロンキオイド)として特徴付けるステップをさらに含む。
信頼できる分類を行うことができるバイオマーカーは、対照と比較して、上方調節(例えば、発現が増加される)または下方調節(例えば、発現が減少される)されるバイオマーカーであり得る。対照は、本明細書に提供する任意の対照であり得る。例えば、表1A、表1B、表1C、表2、表3、表4、表5、および表6に開示したバイオマーカーパネルまたはそのサブセットは、様々な実施形態では、患者の肺がんサブタイプを評価および分類するのに使用される。
一般に、本明細書に提供する方法は、特定の肺がんサブタイプ(例えば、腺癌のサブタイプ)として肺がん試料を分類するのに使用される。一実施形態では、本方法は、患者または対象から得られる肺がん試料において、表1A、表1B、表1C、表2、表3、表4、表5、または表6の少なくとも5種のクラシファイヤーバイオマーカーの発現レベルを検出または決定するステップを含む。一実施形態では、検出するステップは、RNA−seq、RT−PCR、またはハイブリダイゼーションに適した条件下で、表1A、表1B、表1C、表2、表3、表4、表5、または表6の少なくとも5種のクラシファイヤーバイオマーカーのcDNA分子の部分に実質的に相補的であるオリゴヌクレオチドを用いたRNA−seq、逆転写酵素ポリメラーゼ連鎖反応(RT−PCR)、またはハイブリダイゼーションアッセイを実施することと、検出するステップに基づいて少なくとも5種のクラシファイヤーバイオマーカーの発現レベルを得ることとによる、核酸レベルにおけるものである。次いで、少なくとも5種のクラシファイヤーバイオマーカーの発現レベルは、少なくとも1つの試料訓練セットからの表1A、表1B、表1C、表2、表3、表4、表5、または表6の少なくとも5種のクラシファイヤーバイオマーカーの参照発現レベルと比較される。少なくとも1つの試料訓練セットは、(i)少なくとも5種のバイオマーカーを過剰発現する試料、もしくは少なくとも5種のバイオマーカーのサブセットを過剰発現する試料からの少なくとも5種のバイオマーカーの発現レベル(単数または複数)、(ii)参照スクアモイド(近位炎症性)、ブロンコイド(終末呼吸単位)、もしくはマグノイド(近位増殖性)試料からの発現レベル、または(iii)無腺癌肺試料からの発現レベル;および肺組織試料をスクアモイド(近位炎症性)、ブロンコイド(終末呼吸単位)、またはマグノイド(近位増殖性)サブタイプとして分類するステップを含み得る。次いで、肺がん試料は、比較するステップの結果に基づいて、腺癌、扁平上皮細胞癌腫、神経内分泌癌腫、もしくは小細胞癌腫、またはさらにはブロンキオイド、スクアモイド、もしくはマグノイドサブタイプの腺癌として分類され得る。一実施形態では、比較するステップは、肺組織またはがん試料から得た発現データと、少なくとも1つの訓練セット(単数または複数)からの発現データとの間の相関を決定することを含む統計的アルゴリズムを適用することと;統計的アルゴリズムの結果に基づいて肺組織またはがん試料をスクアモイド(近位炎症性)、ブロンコイド(終末呼吸単位)、またはマグノイド(近位増殖性)サブタイプとして分類することとを含み得る。
一実施形態では、本方法は、患者から得られる肺がん試料において、核酸レベルで表1A、表1B、表1C、表2、表3、表4、表5、または表6の少なくとも5種のクラシファイヤーバイオマーカーのレベルをプローブするステップを含む。プローブするステップは、一実施形態では、試料を、表1A、表1B、表1C、表2、表3、表4、表5、または表6の少なくとも5種のクラシファイヤーバイオマーカーのcDNA分子の部分に実質的に相補的である5種またはそれ超のオリゴヌクレオチドと、これらの5種またはそれ超のオリゴヌクレオチドのこれらの相補体または実質的な相補体へのハイブリダイゼヘションに適した条件下で混合すること;ハイブリダイゼーションが、これらの5種またはそれ超のオリゴヌクレオチドとこれらの相補体または実質的な相補体との間で起こるか否かを検出すること;検出するステップに基づいて少なくとも5種のクラシファイヤーバイオマーカーのハイブリダイゼーション値を得ることを含む。次いで、少なくとも5種のクラシファイヤーバイオマーカーのハイブリダイゼーション値を、少なくとも1つの試料訓練セットからの参照ハイブリダイゼーション値(単数または複数)と比較する。例えば、少なくとも1つの試料訓練セットは、参照腺癌、扁平上皮細胞癌腫、神経内分泌癌腫試料、小細胞癌腫試料から得たハイブリダイゼーション値を含む。例えば、比較するステップの結果に基づいて肺がん試料を腺癌、扁平上皮細胞癌腫、神経内分泌癌腫、または小細胞癌腫として分類する。
肺組織試料は、ヒト対象または患者から単離される任意の試料であり得る。例えば、一実施形態では、分析は、パラフィンワックスに包埋された肺生検で実施される。本発明のこの態様は、小さい生検からでも主要な組織型を正確に同定することによって現在の診断を改善する手段を提供する。RT−PCR法を含む本発明の方法は、感度がよく、正確であり、パラフィン包埋試料を用いて使用するためのマルチアナライト能力を有する。例えば、参照により本明細書に組み込まれている、Croninら(2004年)、Am. J Pathol.、164巻(1号):35〜42頁を参照。
ホルマリン固定およびパラフィンワックス中の組織包埋は、光学顕微鏡評価の前に組織を処理するためのユニバーサル手法である。ホルマリン固定パラフィン包埋(FFPE)標本によって与えられる主要な利点は、組織切片における細胞形態学的詳細および構成的形態学的詳細の保存である。(Foxら(1985年)、J Histochem Cytochem、33巻:845〜853頁)。生検標本が処理される標準的な緩衝ホルマリン固定液は、典型的には、37%ホルムアルデヒドおよび10〜15%メチルアルコールを含有する水溶液である。ホルムアルデヒドは、in vitroでタンパク質−核酸架橋およびタンパク質−タンパク質架橋の形成をもたらす高度に反応性の双極性化合物である(Clarkら(1986年)、J Histochem Cytochem、34巻:1509〜1512頁;McGheeおよびvon Hippel(1975年)、Biochemistry、14巻:1281〜1296頁、それぞれ本明細書に参照により組み込まれている)。
一実施形態では、本明細書で使用される試料は、個体から得られ、新鮮凍結パラフィン包埋(FFPE)組織を含む。しかし、他の組織および試料タイプも本明細書で使用するのに適用できる(例えば、新鮮組織、または凍結組織)。
FFPE組織からRNAを単離するための方法は、当技術分野で公知である。一実施形態では、トータルRNAは、参照により本明細書に組み込まれているBibikovaら(2004年)、American Journal of Pathology、165巻:1799〜1807頁によって記載されているようにFFPE組織から単離することができる。同様に、High Pure RNA Paraffin Kit(Roche)を使用することができる。パラフィンは、キシレン抽出、その後のエタノール洗浄によって除去される。RNAは、DNase I処置ステップが含めて、MasterPure Purificationキット(Epicenter、Madison、Wis.)を使用して、切片にされた組織ブロックから単離することができる。RNAは、供給業者のインストラクションに従ってトリゾール試薬(Invitrogen Life Technologies、Carlsbad、Calif.)を使用して凍結試料から抽出することができる。測定可能な残留するゲノムDNAを有する試料を、DNaseI処置に再び付し、DNA混入についてアッセイすることができる。すべての精製、DNase処置、および他のステップは、製造者のプロトコールに従って実施され得る。トータルRNAを単離した後、試料を、使用するまで−80℃で貯蔵することができる。
mRNA抽出のための一般的な方法は、当技術分野で周知であり、Ausubelら編、Current Protocols in Molecular Biology、John Wiley & Sons、New York、1987〜1999年を含めた分子生物学の標準的な教科書に開示されている。パラフィン包埋組織からRNAを抽出するための方法は、例えば、RuppおよびLocker(Lab Invest.、56巻:A67頁、1987年)ならびにDe Andresら(Biotechniques、18巻:42〜44頁、1995年)に開示されている。特に、RNA単離は、製造者のインストラクションに従って、Qiagen(Valencia、Calif.)などの商業的製造者製の精製キット、緩衝液セット、およびプロテアーゼを使用して実施され得る。例えば、培養液中の細胞に由来するトータルRNAは、Qiagen RNeasyミニカラムを使用して単離することができる。他の市販のRNA単離キットとしては、MasterPure(商標)Complete DNA and RNA Purification Kit(Epicentre、Madison、Wis.)およびParaffin Block RNA Isolation Kit(Ambion、Austin、Tex.)がある。組織試料からのトータルRNAは、例えば、RNA Stat−60(Tel−Test、Friendswood、Tex.)を使用して単離することができる。腫瘍から調製されるRNAは、例えば、塩化セシウム密度勾配遠心分離によって単離することができる。さらに、多数の組織試料を、例えば、Chomczynskiの単一ステップRNA単離プロセス(米国特許第4,843,155号、すべての目的に関してその全体が参照により組み込まれている)などの当業者に周知の技法を使用して容易に処理することができる。
一実施形態では、試料は、肺組織試料、例えば、腺癌試料から回収される細胞を含む。細胞は、当技術分野で公知の標準技法を使用して生体試料から回収され得る。例えば、一実施形態では、細胞は、細胞試料を遠心分離し、ペレット化された細胞を再懸濁することによって回収される。細胞は、リン酸緩衝生理食塩水(PBS)などの緩衝液中に再懸濁することができる。細胞懸濁液を遠心分離して細胞ペレットを得た後、細胞を溶解させて、核酸、例えば、メッセンジャーRNAを抽出することができる。任意の種類のさらなる処理に付されたものを含めて、対象から得られるすべての試料は、対象から得られていると見なされる。
試料は、一実施形態では、本明細書に示したバイオマーカーの組合せのバイオマーカーレベルを検出する前にさらに処理される。例えば、細胞試料または組織試料中のmRNAは、試料の他の成分から分離され得る。試料を濃縮および/または精製してmRNAをその非天然状態で単離することができ、その理由は、mRNAは、その天然環境にないためである。例えば、研究により、in vivoでのmRNAの高次構造は、同じ配列のin vitro構造と異なることが示されている(例えば、すべての目的に関してその全体が本明細書に組み込まれている、Rouskinら(2014年)、Nature、505巻、701〜705頁を参照)。
試料に由来するmRNAは、一実施形態では、合成DNAプローブにハイブリダイズされ、このプローブは、一部の実施形態では、検出部分(例えば、検出可能標識、捕捉配列、バーコード報告配列)を含む。したがって、これらの実施形態では、非天然mRNA−cDNA複合体が、バイオマーカーを検出するために最終的に作製および使用される。別の実施形態では、試料に由来するmRNAは、検出可能標識、例えば、フルオロフォアで直接標識される。さらなる実施形態では、非天然標識mRNA分子は、cDNAプローブにハイブリダイズされ、複合体が検出される。
一実施形態では、mRNAが試料から得られると、それは、ハイブリダイゼーション反応において相補的DNA(cDNA)に変換され、または1種または複数のcDNAプローブと一緒にハイブリダイゼーション反応において使用される。cDNAは、in vivoで存在せず、したがって、非天然分子である。さらに、cDNA−mRNAハイブリッドは、合成のものであり、in vivoで存在しない。cDNAがin vivoで存在しないことに加えて、cDNAは、mRNAと必然的に異なり、その理由は、それがデオキシリボ核酸を含み、リボ核酸を含まないためである。次いでcDNAは、例えば、ポリメラーゼ連鎖反応(PCR)または当業者に公知の他の増幅法によって増幅される。例えば、採用され得る他の増幅法としては、すべての目的に関してその全体が参照により組み込まれているリガーゼ連鎖反応(LCR)(すべての目的に関してその全体が参照により組み込まれている、WuおよびWallace、Genomics、4巻:560頁(1989年)、Landegrenら、Science、241巻:1077頁(1988年))、転写増幅(すべての目的に関してその全体が参照により組み込まれている、Kwohら、Proc. Natl. Acad. Sci. USA、86巻:1173頁(1989年))、自己持続配列複製(すべての目的に関してその全体が参照により組み込まれている、Guatelliら、Proc. Nat. Acad. Sci. USA、87巻:1874頁(1990年))、ならびに核酸ベース配列増幅(NASBA)がある。PCR増幅のためのプライマーを選択するためのガイドラインは、当業者に公知である。例えば、すべての目的に関してその全体が参照により組み込まれている、McPhersonら、PCR Basics: From Background to Bench、Springer-Verlag、2000年を参照。この増幅反応の産物、すなわち、増幅されたcDNAは、必然的に非天然産物である。第1に、上述したように、cDNAは、非天然分子である。第2に、PCRの場合では、増幅プロセスは、出発材料のあらゆる個々のcDNA分子について数億のcDNAコピーを創製する機能を果たす。生成されるコピーの数は、in vivoで存在するmRNAのコピーの数からはるかにかけ離れている。
一実施形態では、cDNAは、断片に追加のDNA配列(例えば、アダプター、レポーター、捕捉配列もしくは部分、バーコード)を導入するプライマーで増幅され(例えば、アダプター特異的プライマーを使用して)、またはmRNAもしくはcDNAバイオマーカー配列は、追加の配列(例えば、アダプター、レポーター、捕捉配列もしくは部分、バーコード)を含むcDNAプローブに直接ハイブリダイズされる。したがって、増幅および/またはmRNAのcDNAプローブへのハイブリダイゼーションは、追加の配列を導入し、非天然ハイブリッドを形成することによって、非天然一本鎖cDNA、またはmRNAから非天然二本鎖分子を創製する機能を果たす。さらに、当業者に公知であるように、増幅手順は、これらと関連した誤り率を有する。したがって、増幅により、cDNA分子にさらなる修飾が導入される。一実施形態では、アダプター特異的プライマーを用いた増幅中に、検出可能標識、例えば、フルオロフォアが一本鎖cDNA分子に付加される。したがって、増幅はまた、少なくとも(i)cDNAは、in vivoで存在しないこと、(i)アダプター配列がcDNA分子の両端に付加されて、in vivoで存在しないDNA配列が作製されること、(ii)増幅と関連した誤り率により、in vivoで存在しないDNA配列がさらに創製されること、(iii)自然において存在するものと比較した場合のcDNA分子の異種構造、および(iv)cDNA分子への検出可能標識の化学的付加のために、自然において存在しないDNA複合体を創製する機能を果たす。
一部の実施形態では、目的のバイオマーカーの発現は、非天然cDNA分子の検出を介して核酸レベルで検出される。
一部の実施形態では、肺がんサブタイピングのための方法は、クラシファイヤーバイオマーカーセットの発現レベルを検出することを含む。一部の実施形態では、検出することは、核酸レベルまたはタンパク質レベルでの表1(肺がんサブタイプ遺伝子パネルとしても特徴付けられる)、表2、表3、表4、表5、または表6のクラシファイヤーバイオマーカーのすべてを含む。別の実施形態では、表1の単一のクラシファイヤーバイオマーカーまたはクラシファイヤーバイオマーカーのサブセット、例えば、約5〜約20種が検出される。検出することは、それだけに限らないが、RNA−seq、逆転写酵素ポリメラーゼ連鎖反応(RT−PCR)、マイクロアレイハイブリダイゼーションアッセイ、または別のハイブリダイゼーションアッセイ、例えば、クラシファイヤーバイオマーカーに特異的なプライマーおよび/もしくはプローブを用いた、例えば、NanoStringアッセイなどを含めた任意の適当な技法によって実施することができる。一部の場合では、増幅法(例えば、RT−PCRまたはqRT−PCR)に有用なプライマーは、表1A、表1B、表1C、表2、表3、表4、表5、または表6に提供された順方向プライマーおよび逆方向プライマーである。しかし、表1A、表1B、表1C、表2、表3、表4、表5、および表6に提供されたプライマーは、単に例示的な目的のためであり、本発明を限定すると解釈されるべきでないことが留意されるべきである。
本明細書に記載のバイオマーカーは、目的の核酸配列、または逆転写反応においてin vitroで合成により得られるこれらの非天然cDNA産物のいずれかの全配列または部分配列を含むRNAを含む。用語「断片」は、一般に、少なくとも10、15、20、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、800、900、1,000、1,200、もしくは1,500の連続したヌクレオチド、または最大で、本明細書に開示の全長バイオマーカーポリヌクレオチド中に存在するヌクレオチドの数を含むポリヌクレオチドの部分を指すように意図されている。バイオマーカーポリヌクレオチドの断片は、一般に、少なくとも15、25、30、50、100、150、200、もしくは250の連続したアミノ酸、または最大で、本発明の全長バイオマーカータンパク質中に存在するアミノ酸の総数をコードすし得る。
一部の実施形態では、RNA転写物またはその発現産物などの過剰発現は、試料中のすべての測定される転写物(もしくはこれらの産物)であり得る参照RNA転写物もしくはこれらの発現産物、またはRNA転写物(もしくはこれらの非天然cDNA産物)の特定の参照セットのレベルに正規化することによって決定される。正規化は、アッセイされるRNAまたはcDNAの量、および使用されるRNAまたはcDNAの品質のばらつきの両方の差異を補正し、または正規化するために実施される。したがって、アッセイは、典型的には、周知のハウスキーピング遺伝子、例えば、GAPDHおよび/またはβ−アクチンなどを含めたある特定の正規化遺伝子の発現を測定し、組み込む。代わりに、正規化は、アッセイされるバイオマーカーのすべて、またはその大きいサブセットの平均シグナルまたは中央値シグナルに基づくことができる(グローバル正規化手法)。
例えば、一実施形態では、表1A、表1B、表1C、表2、表3、表4、表5、および表6のいずれかにおけるバイオマーカーのうちの約5〜約10、約5〜約15、約5〜約20、約5〜約25、約5〜約30、約5〜約35、約5〜約40、約5〜約45、約5〜約50種が、肺がんサブタイプを決定する方法において検出される。別の実施形態では、表1A、表1B、表1C、表2、表3、表4、表5のうちのいずれか1つからの、または表6からのバイオマーカーのそれぞれが、肺がんサブタイプを決定する方法において検出される。
単離mRNAを、ハイブリダイゼーション、またはそれだけに限らないが、サザン分析もしくはノーザン分析、PCR分析、およびプローブアレイ、NanoStringアッセイを含む増幅アッセイにおいて使用することができる。mRNAレベルを検出するための一方法では、単離mRNAまたは合成cDNAを、検出されている遺伝子によってコードされるmRNAにハイブリダイズすることができる核酸分子(プローブ)と接触させる。核酸プローブは、例えば、長さが少なくとも7、15、30、50、100、250、または500ヌクレオチドのオリゴヌクレオチドなどのcDNAまたはその部分であり、本発明の非天然cDNAまたはmRNAバイオマーカーにストリンジェントな条件下で特異的にハイブリダイズするのに十分であり得る。
上記に説明したように、一実施形態では、mRNAが試料から得られると、それは、ハイブリダイゼーション反応で相補的DNA(cDNA)に変換される。mRNAのcDNAへの変換は、特異的mRNAの部分に相補的である配列を含むオリゴヌクレオチドまたはプライマーを用いて実施され得る。mRNAのcDNAへの変換は、ランダム配列を含むオリゴヌクレオチドまたはプライマーを用いて実施され得る。mRNAのcDNAへの変換は、mRNAのポリ(A)テイルに相補的である配列を含むオリゴヌクレオチドまたはプライマーを用いて実施され得る。cDNAは、in vivoで存在せず、したがって非天然分子である。さらなる実施形態では、次いでcDNAは、例えば、ポリメラーゼ連鎖反応(PCR)または当業者に公知の他の増幅法によって増幅される。PCRは、表1A、表1B、表1C、表2、表3、表4、表5、または表6に提供された順方向プライマーおよび/または逆方向プライマーを用いて実施され得る。この増幅反応の産物、すなわち、増幅されたcDNAは、必然的に非天然産物である。上述したように、cDNAは、非天然分子である。第2に、PCRの場合では、増幅プロセスは、出発材料のあらゆる個々のcDNA分子について数億のcDNAコピーを創製する機能を果たす。生成されるコピーの数は、in vivoで存在するmRNAのコピーの数からはるかにかけ離れている。
一実施形態では、cDNAは、断片に追加のDNA配列(アダプター配列)を導入するプライマーで増幅される(アダプター特異的プライマーを使用して)。アダプター配列は、テイルであり得、このテイル配列は、cDNAに相補的ではない。例えば、表1A、表1B、表1C、表2、表3、表4、表5、または表6に提供された順方向プライマーおよび/または逆方向プライマーは、テイル配列を含み得る。したがって増幅は、既に非天然のcDNAにバーコード、アダプター、および/またはレポーター配列を導入することによって、非天然一本鎖cDNAから非天然二本鎖分子を創製する機能を果たす。一実施形態では、アダプター特異的プライマーを用いた増幅中に、検出可能標識、例えば、フルオロフォアが、一本鎖cDNA分子に付加される。したがって、増幅はまた、少なくとも(i)cDNAは、in vivoで存在しないこと、(i)アダプター配列がcDNA分子の両端に付加されて、in vivoで存在しないDNA配列が作製されること、(ii)増幅と関連した誤り率により、in vivoで存在しないDNA配列がさらに創製されること、(iii)自然において存在するものと比較した場合のcDNA分子の異種構造、および(iv)cDNA分子への検出可能標識の化学的付加のために、自然において存在しないDNA複合体を創製する機能を果たす。
一実施形態では、合成cDNA(例えば、増幅されたcDNA)は、例えば、マイクロアレイを介して、プローブを用いたハイブリダイゼーションを介して固体表面に固定化される。別の実施形態では、cDNA産物は、cDNA産物とハイブリダイズする蛍光プローブの導入を介するリアルタイムポリメラーゼ連鎖反応(PCR)を介して検出される。例えば、一実施形態では、バイオマーカー検出は、定量的蛍光発生RT−PCR(例えば、TaqMan(登録商標)プローブを用いた)によって評価される。PCR分析については、周知の方法が、分析で使用するためのプライマー配列の決定について当技術分野で利用可能である。
本明細書に提供されるバイオマーカーは、一実施形態では、捕捉プローブおよび/またはレポータープローブを使用するハイブリダイゼーション反応を介して検出される。例えば、ハイブリダイゼーションプローブは、ビーズ、ガラス、またはシリコン基板などの固体表面に誘導体化されたプローブである。別の実施形態では、捕捉プローブが溶液中に存在し、患者の試料と混合され、その後、例えば、ビオチン−アビジン相互作用(例えば、ビオチンが捕捉プローブの一部であり、アビジンが表面上にある場合)を介した表面へのハイブリダイゼーション産物の付着が続く。ハイブリダイゼーションアッセイは、一実施形態では、捕捉プローブおよびレポータープローブの両方を採用する。レポータープローブは、捕捉プローブまたはバイオマーカー核酸にハイブリダイズすることができる。次いで例えばレポータープローブは、試料中のバイオマーカー(単数または複数)のレベルを決定するためにカウントおよび検出される。捕捉プローブおよび/またはレポータープローブは、一実施形態では、検出可能標識、および/または表面への官能化を可能にする基を含有する。
例えば、nCounter遺伝子分析システム(例えば、すべての目的に関してその全体が参照により組み込まれている、Geissら(2008年)、Nat. Biotechnol.、26巻、317〜325頁を参照)を、本明細書に提供する方法とともに使用するのに適用できる。
その開示全体がすべての目的に関して参照により組み込まれている米国特許第7,473,767号および同第8,492,094号に記載されたハイブリダイゼーションアッセイを、本明細書に提供する方法で使用するのに、すなわち、本明細書に記載のバイオマーカーおよびバイオマーカー組合せを検出するのに適用できる。
バイオマーカーレベルは、膜ブロット(ハイブリダイゼーション分析、例えば、ノーザン、サザン、ドットなどで使用されるものなど)、またはマイクロウェル、試料チューブ、ゲル、ビーズ、または繊維(もしくは結合した核酸を含む任意の固体支持体)を使用してモニターすることができる。例えば、それぞれその全体が参照により組み込まれている、米国特許第5,770,722号、同第5,874,219号、同第5,744,305号、同第5,677,195号、おおび同第5,445,934号を参照。
一実施形態では、マイクロアレイがバイオマーカーレベルを検出するのに使用される。マイクロアレイは、異なる実験間の再現性のためにこの目的に特に非常に適している。DNAマイクロアレイは、多数の遺伝子の発現レベルを同時に測定するための一方法をもたらす。各アレイは、固体支持体に付着された捕捉プローブの再現可能なパターンからなる。標識されたRNAまたはDNAは、アレイ上の相補的プローブにハイブリダイズされ、次いでレーザースキャニングによって検出される。アレイ上の各プローブのハイブリダイゼーション強度が決定され、相対的な遺伝子発現レベルを表す定量的値に変換される。例えば、それぞれその全体が参照により組み込まれている、米国特許第6,040,138号、同第5,800,992号、および同第6,020,135号、同第6,033,860号、および同第6,344,316号を参照。高密度オリゴヌクレオチドアレイは、試料中の多数のRNAについての遺伝子発現プロファイルを決定するのに特に有用である。
機械的合成法を使用してこれらのアレイを合成するための技法は、例えば、米国特許第5,384,261号に記載されている。平面アレイ表面が一般に使用されるが、アレイは、実質的に任意の形状の表面、またはさらには多数の表面上に製作することができる。アレイは、ビーズ、ゲル、ポリマー表面、繊維(光ファイバーなど)、ガラス、または任意の他の適切な基板上の核酸(またはペプチド)であり得る。例えば、それぞれその全体が参照により組み込まれている、米国特許第5,770,358号、同第5,789,162号、同第5,708,153号、同第6,040,193号、および同第5,800,992号を参照。アレイは、診断またはすべてを含むデバイスの他の操作を可能にする様式で包装され得る。例えば、それぞれその全体が参照により組み込まれている、米国特許第5,856,174号および同第5,922,591号を参照。
遺伝子発現の連続分析(SAGE)が、一実施形態では、本明細書に記載の方法において採用される。SAGEは、各転写物のために個々のハイブリダイゼーションプローブを準備する必要なく、多数の遺伝子転写物の同時のかつ定量的な分析を可能にする方法である。最初に、転写物をユニークに同定するのに十分な情報を含有する短い配列タグ(約10〜14bp)が生成され、ただし、タグは、各転写物内のユニークな位置から得られる。次いで、多くの転写物が一緒に連結されて長い連続分子が形成され、それを配列決定し、同時に複数のタグの素性を明らかにすることができる。転写物の任意の集団の発現パターンを、個々のタグの存在量を決定し、各タグに対応する遺伝子を同定することによって定量的に評価することができる。その全体が参照により組み込まれている、Velculescuら、Science、270巻:484〜87頁、1995年;Cell、88巻:243〜51頁、1997年を参照。
核酸レベルでのバイオマーカーレベル分析の追加の方法は、Brennerら(その全体が参照により組み込まれている、Nat. Biotech.、18巻:630〜34頁、2000年)によって記載されているような、配列決定法、例えば、RNAseq、次世代配列決定、および超並列シグネチャー配列決定(MPSS)の使用である。これは、非ゲルベースシグネチャー配列決定を、別個の直径5μmのマイクロビーズ上の数百万の鋳型のin vitroクローニングと組み合わせる配列決定手法である。最初に、DNA鋳型のマイクロビーズライブラリーが、in vitroクローニングによって構築される。この後に、高密度で(典型的には3.0×10マイクロビーズ/cm超)、フローセル内で鋳型含有マイクロビーズの平面アレイがアセンブルされる。各マイクロビーズ上のクローニングされた鋳型の遊離端が、DNA断片分離を必要としない蛍光ベースシグネチャー配列決定法を使用して同時に分析される。この方法は、酵母cDNAライブラリーから数十万の遺伝子シグネチャー配列を単一のオペレーションで同時かつ正確にもたらすことを示した。
バイオマーカーレベル分析が核酸レベルである場合の別の方法は、例えば、RT−PCRまたは定量的RT−PCR(qRT−PCR)などの増幅法の使用である。試料中のバイオマーカーmRNAのレベルを決定するための方法は、例えば、RT−PCR(Mullis、1987年、米国特許第4,683,202号に示される実験実施形態)、リガーゼ連鎖反応(Barany(1991年)Proc. Natl. Acad. Sci. USA 88巻:189〜193頁)、自己持続配列複製(Guatelliら(1990年)Proc. Natl. Acad. Sci. USA 87巻:1874〜1878頁)、転写増幅システム(Kwohら(1989年)Proc. Natl. Acad. Sci. USA 86巻:1173〜1177頁)、Q−ベータレプリカーゼ(Lizardiら(1988年)Bio/Technology 6巻:1197頁)、ローリングサークル型複製(Lizardiら、米国特許第5,854,033号)、または任意の他の核酸増幅法による核酸増幅のプロセスと、その後の、当業者に周知の技術を使用する増幅された分子の検出とを伴い得る。多数の異なるPCRまたはqRT−PCRプロトコールが、当技術分野で公知であり、試料中の弁別的遺伝子の発現の検出および/または定量化のために本発明に記載される組成物を使用する使用のために直接適用または適応され得る。例えば、本明細書に参照により組み込まれている、Fanら(2004年)Genome Res. 14巻:878〜885頁を参照。一般に、PCRでは、標的ポリヌクレオチド配列は、少なくとも1つのオリゴヌクレオチドプライマーまたはオリゴヌクレオチドプライマーの対を用いた反応によって増幅される。プライマー(単数または複数)は、標的核酸の相補的領域にハイブリダイズし、DNAポリメラーゼが、標的配列を増幅するようにプライマー(単数または複数)を伸長させる。ポリメラーゼベース核酸増幅産物を提供するのに十分な条件下で、1つのサイズの核酸断片が、反応産物(増幅産物である標的ポリヌクレオチド配列)を支配する。増幅サイクルが、単一の標的ポリヌクレオチド配列の濃度を増加させるために反復される。反応は、PCRに一般的に使用される任意のサーモサイクラーにおいて実施され得る。
定量的RT−PCR(qRT−PCR)(リアルタイムRT−PCRとも呼ぶ)は、定量的測定値を提供するだけでなく、低減された時間および混入を提供するので、一部の状況下で好ましい。本明細書で使用される場合、「定量的PCR(または「リアルタイムqRT−PCR」)は、反応産物のサンプリングの繰り返しの必要なしにPCR増幅が起きているときの、PCR増幅の進行の直接的モニタリングを指す。定量的PCRでは、反応産物は、それらが生成され、シグナルがバックグラウンドレベルを上回って上昇した後、反応がプラトーに達する前に追跡されるように、シグナリング機構(例えば、蛍光)を介してモニターされ得る。検出可能なレベルまたは「閾値」レベルの蛍光を達成するために必要とされるサイクルの数は、PCRプロセスの開始時における増幅可能な標的の濃度に伴って直接変動し、試料中の標的核酸の量のリアルタイムでの測定を提供するためのシグナル強度の測定を可能にする。DNA結合色素(例えば、SYBR緑色)または標識されたプローブが、PCR増幅によって生成された伸長産物を検出するために使用され得る。本発明の配列を含む標識されたプローブを利用する任意のプローブ形式が使用され得る。
免疫組織化学検査法も本発明のバイオマーカーのレベルを検出するのに適している。試料を後の調製のために凍結させ、または固定液中に直ちに入れることができる。組織試料を、試薬、例えば、ホルマリン、グルタルアルデヒド(gluteraldehyde)、メタノールなどで処置することによって固定し、パラフィン中に包埋することができる。ホルマリン固定パラフィン包埋組織試料から免疫組織化学的分析のためのスライドを調製するための方法は、当技術分野で周知である。
一実施形態では、表1A、表1B、表1C、表2、表3、表4、表5、または表6のバイオマーカー(またはそのサブセット、例えば、5〜20、5〜30、5〜40種のバイオマーカー)のレベルは、試料中のすべてのRNA転写物、もしくはこれらの非天然cDNA発現産物、もしくはタンパク質産物、または試料中のRNA転写物の参照セット、もしくはこれらの非天然cDNA発現産物の参照セット、もしくはこれらのタンパク質産物の参照セットの発現レベルに対して正規化される。
全体にわたって示されているように、本明細書に示した方法は、患者の肺がんサブタイプを決定するための方法を提供する。バイオマーカーレベルが、例えば、非天然cDNAバイオマーカーレベルまたは非天然mRNA−cDNAバイオマーカー複合体を測定することによって決定されると、バイオマーカーレベルを、例えば、検出されたレベルの統計的方法または直接比較を使用して参照値または参照試料と比較することで、肺がん分子サブタイプの決定が行われる。比較に基づいて、患者の肺がん試料は、例えば、神経内分泌癌腫、扁平上皮細胞癌腫、腺癌として分類される。別の実施形態では、比較に基づいて、患者の肺がん試料は、扁平上皮細胞癌腫、腺癌、または小細胞癌腫として分類される。さらに別の実施形態では、比較に基づいて、患者の肺がん試料は、スクアモイド(近位炎症性)、ブロンコイド(終末呼吸単位)、またはマグノイド(近位増殖性)として分類される。
一実施形態では、表1A、表1B、表1C、表2、表3、表4、表5、または表6の少なくとも5種のクラシファイヤーバイオマーカーの発現レベル値は、少なくとも1つの試料訓練セットからの参照発現レベル値(単数または複数)と比較され、ここで、少なくとも1つの試料訓練セットは、参照試料(単数または複数)からの発現レベル値を含む。さらなる実施形態では、少なくとも1つの試料訓練セットは、腺癌試料、扁平上皮細胞癌腫試料、神経内分泌癌腫試料、小細胞肺癌試料、近位炎症性(スクアモイド)、近位増殖性(マグノイド)、終末呼吸単位(ブロンキオイド)試料、またはこれらの組合せから得た、表1A、表1B、表1C、表2、表3、表4、表5、または表6の少なくとも5種のクラシファイヤーバイオマーカーの発現レベル値を含む。
別々の実施形態では、表1A、表1B、表1C、表2、表3、表4、表5、または表6の少なくとも5種のクラシファイヤーバイオマーカーのハイブリダイゼーション値は、少なくとも1つの試料訓練セットからの参照ハイブリダイゼーション値(単数または複数)と比較され、ここで、少なくとも1つの試料訓練セットは、参照試料(単数または複数)からのハイブリダイゼーション値を含む。さらなる実施形態では、少なくとも1つの試料訓練セットは、腺癌試料、扁平上皮細胞癌腫試料、神経内分泌癌腫試料、小細胞肺癌試料、近位炎症性(スクアモイド)、近位増殖性(マグノイド)、終末呼吸単位(ブロンキオイド)試料、またはこれらの組合せからの、表1A、表1B、表1C、表2、表3、表4、表5、または表6の少なくとも5種のクラシファイヤーバイオマーカーのハイブリダイゼーション値を含む。別の実施形態では、少なくとも1つの試料訓練セットは、以下の表Aに提供した参照試料からの、表1A、表1B、表1C、表2、表3、表4、表5、表6の少なくとも5種のクラシファイヤーバイオマーカーのハイブリダイゼーション値を含む。
バイオマーカーの検出されたレベルを参照値および/または参照試料と比較するための方法が、本明細書に提供されている。この比較に基づいて、一実施形態では、対象の試料から得たバイオマーカーレベルと参照値との間の相関が得られる。次いで肺がんサブタイプの評価が行われる。
様々な統計的方法を、患者から得られるバイオマーカーレベルと、例えば、少なくとも1つの試料訓練セットからの参照バイオマーカーレベルとの比較を助けるのに使用することができる。
一実施形態では、教師あり(supervised)パターン認識法が採用される。教師ありパターン認識法の例として、それだけに限らないが、最短重心法(nearest centroid method)(Dabney(2005年)、Bioinformatics、21巻(22号):4148〜4154頁、およびTibshiraniら(2002年)、Proc. Natl. Acad. Sci. USA、99巻(10号):6576〜6572頁);クラス分析のソフト独立型モデリング(SIMCA)(例えば、Wold、1976年を参照);部分最小二乗分析(PLS)(例えば、Wold、1966年;Joreskog、1982年;Frank、1984年;Bro, R.、1997年を参照);線形判別分析(LDA)(例えば、Nillson、1965年を参照);K−最近接分析(KNN)(例えば、Brownら、1996年を参照);人工ニューラルネットワーク(ANN)(例えば、Wasserman、1989年;Ankerら、1992年;Hare、1994年を参照);確率的ニューラルネットワーク(PNN)(例えば、Parzen、1962年;Bishop、1995年;Speckt、1990年;Broomheadら、1988年;Patterson、1996年を参照);規則誘導(RI)(例えば、Quinlan、1986年を参照);およびベイジアン法(例えば、Bretthorst、1990年a、1990年b、1988年を参照)を挙げることができる。一実施形態では、遺伝子発現データに基づいて腫瘍サブタイプを同定するためのクラシファイヤーは、そのそれぞれの全体が参照により本明細書に組み込まれている、Mullinsら(2007年)、Clin Chem.、53巻(7号):1273〜9頁に記載された重心ベース法である。
他の実施形態では、教師なし訓練手法が採用され、したがって、訓練セットは使用されない。
再び教師あり学習手法について試料訓練セットに言及すると、一部の実施形態では、試料訓練セット(単数または複数)は、腺癌試料からのクラシファイヤーバイオマーカーのすべて(例えば、表1A、表1B、表1C、表2、表3、表4、表5、表6のいずれかのすべてのクラシファイヤーバイオマーカー)の発現データを含むことができる。一部の実施形態では、試料訓練セット(単数または複数)は、扁平上皮細胞癌腫試料、腺癌試料、および/または神経内分泌癌腫試料からのクラシファイヤーバイオマーカーのすべて(例えば、表1A、表1B、表1C、表2、表3、表4、表5、表6のいずれかのすべてのクラシファイヤーバイオマーカー)の発現データを含むことができる。一部の実施形態では、試料訓練セット(単数または複数)は、試料間変動を除去するために正規化される。
一部の実施形態では、比較することは、パラメトリックであってもノンパラメトリックであってもよい、例えば任意の適当な多変量統計分析モデルなどの統計的アルゴリズムを適用することを含み得る。一部の実施形態では、統計的なアルゴリズムを適用することは、ヒト肺組織試料から得た発現データと、腺癌および扁平上皮細胞癌腫訓練セット(単数または複数)からの発現データとの間の相関を決定することを含むことができる。一部の実施形態では、(例えば)、リーブワンアウトクロスバリデーション(LOOCV)などのクロスバリデーションが実施される。一部の実施形態では、積分相関が実施される。一部の実施形態では、スピアマン相関が実施される。一部の実施形態では、重心ベース法が、その全体が参照により本明細書に組み込まれている、Mullinsら(2007年)、Clin Chem.、53巻(7号):1273〜9頁に記載されているように、かつ遺伝子発現データに基づいて統計的アルゴリズムのために採用される。
対象に由来する試料(検査試料)に対して実施された遺伝子発現の結果は、生体試料(単数または複数)、または正常であると分かっている、もしくは疑われる生体試料(単数または複数)(「参照試料」もしくは「正常試料」、例えば、非腺癌試料)に由来するデータと比較することができる。一部の実施形態では、参照試料または参照遺伝子発現データは、特定の分子サブタイプの腺癌(adenocarcimona)、即ち、スクアモイド(近位炎症性)、ブロンコイド(終末呼吸単位)、またはマグノイド(近位増殖性)を有することが既知の個体から得られるまたはそれに由来する。別の実施形態では、参照試料または参照バイオマーカーレベルデータは、肺がんサブタイプ、例えば、腺癌、扁平上皮細胞癌腫、神経内分泌癌腫、または小細胞癌腫を有することが分かっている個体から得られ、またはそれに由来する。
参照試料は、検査試料と同じ時間または異なる時間にアッセイされ得る。代わりに、参照試料からのバイオマーカーレベル情報を、後日アクセスするためにデータベースまたは他の手段に保管してもよい。
検査試料に対するアッセイのバイオマーカーレベル結果を、参照試料に対する同じアッセイの結果と比較することができる。一部の場合では、参照試料に対するアッセイの結果は、データベースまたは参照値(単数または複数)からのものである。一部の場合では、参照試料に対するアッセイの結果は、当業者によって公知の、または一般に認められている値または値の範囲である。一部の場合では、比較は定性的である。他の場合では、比較は定量的である。一部の場合では、定性的比較または定量的比較は、それだけに限らないが、以下の1つまたは複数を伴い得る:蛍光値、スポット強度、吸光度値、化学発光シグナル、ヒストグラム、臨界閾値、統計的有意性値、本明細書に記載の遺伝子の発現レベル、mRNAコピー数を比較すること。
一実施形態では、オッズ比(OR)が、各バイオマーカーレベルパネル測定値について計算される。ここで、ORは、患者の測定されたバイオマーカー値とアウトカム、例えば、肺がんサブタイプとの間の関連性の尺度である。例えば、すべての目的に関してその全体が参照により組み込まれている、J. Can. Acad. Child Adolesc. Psychiatry、2010年;19巻(3号):227〜229頁を参照。
一実施形態では、指定された統計的信頼水準が、肺がんサブタイプに関する信頼水準をもたらすために決定され得る。例えば、90%超の信頼水準が、肺がんサブタイプの有用な予測因子であり得ると決定される場合がある。他の実施形態では、ある程度ストリンジェントな信頼水準が選択され得る。例えば、約または少なくとも約50%、60%、70%、75%、80%、85%、90%、95%、97.5%、99%、99.5%、または99.9%の信頼水準が選択され得る。もたらされる信頼水準は、一部の場合では、試料の品質、データの品質、分析の品質、使用される具体的な方法、および/または分析される遺伝子発現値の数(すなわち、遺伝子の数)に関連している場合がある。応答の可能性をもたらすための指定された信頼水準は、偽陽性または偽陰性の予期された数に基づいて選択され得る。指定された信頼水準を実現し、または診断力を伴ったマーカーを同定するためにパラメーターを選択するための方法は、それだけに限らないが、受信者動作特性(ROC)曲線分析、バイノーマルROC、主成分分析、オッズ比分析、部分最小二乗分析、特異値分解、最小絶対収縮および選択演算子分析、最小角回帰、および閾値勾配による正則化(threshold gradient directed regularization)法がある。
肺がんサブタイプの決定は、一部の場合では、遺伝子発現データの信頼性を正規化および/または改善するように設計されたアルゴリズムの適用によって改善され得る。本発明の一部の実施形態では、データ分析は、処理される個々のデータ点が多数であることに起因して、本明細書に記載の様々なアルゴリズムを適用するために、コンピューターまたは他のデバイス、機械または装置を利用する。「機械学習アルゴリズム」は、例えば、肺がんサブタイプを決定するために1つまたは複数の遺伝子発現プロファイルを特徴付けるのに採用される、「クラシファイヤー」としても当業者に公知の計算ベースの予測方法を指す。例えば、マイクロアレイベースハイブリダイゼーションアッセイ、配列決定アッセイ、NanoStringアッセイなどによって決定されるバイオマーカーレベルは、一実施形態では、プロファイルを分類するためにアルゴリズムにかけられる。教師あり学習では、一般に、クラスの中の相違(例えば、腺癌陽性、腺癌陰性、扁平上皮細胞癌腫(squamous)陽性、扁平上皮細胞癌腫(squamous)陰性、神経内分泌癌腫陽性、神経内分泌癌腫陰性、小細胞陽性、小細胞陰性、スクアモイド(近位炎症性)陽性、ブロンコイド(終末呼吸単位)陽性、またはマグノイド(近位増殖性)陽性)を認識するためにクラシファイヤーを「訓練し」、次いで独立した検査セットでクラシファイヤーの精度を「検査する」。新しい未知の試料について、クラシファイヤーを使用して、例えば、試料が属するクラス(例えば、腺癌対扁平上皮細胞癌腫対神経内分泌癌腫)を予測することができる。
一部の実施形態では、ロバストなマルチアレイ平均(RMA)法が、未処理データを正規化するのに使用される場合がある。RMA法は、いくつかのマイクロアレイ上のそれぞれのマッチしたセルについてバックグラウンド補正した強度を計算することによって始まる。一実施形態では、バックグラウンド補正値は、すべての目的に関してその全体が参照により組み込まれている、Irizarryら(2003年)、Biostatistics、4月、4巻(2号):249〜64頁によって記載されているように正の値に制限される。バックグラウンド補正後、次いで、それぞれのバックグラウンド補正されたマッチしたセルの強度の底2の対数が得られる。次いで、各マイクロアレイについてバックグラウンド補正され、対数変換され、マッチした強度は、分位数正規化法を使用して正規化される。分位数正規化法では、各入力アレイおよび各プローブ値について、アレイパーセンタイルプローブ値が、すべてのアレイパーセンタイル点の平均と置き換えられる。この方法は、その全体が参照により組み込まれている、Bolstadら、Bioinformatics、2003年によってより完全に記載されている。分位数正規化の後、次いで正規化されたデータを線形モデルにフィッティングして、各マイクロアレイの各プローブについての強度尺度を得ることができる。次いで、Tukeyのメディアンポリッシュアルゴリズム(すべての目的に関してその全体が参照により組み込まれている、Tukey, J. W.、Exploratory Data Analysis、1977年)を使用して、正規化されたプローブセットデータについて対数スケール強度レベルを決定することができる。
様々な他のソフトウェアプログラムを実装することができる。ある特定の方法では、特徴選択およびモデル推定を、glmnetを使用してlassoペナルティを用いてロジスティック回帰によって実施することができる(その全体が参照により組み込まれている、Friedmanら(2010年)、Journal of statistical software、33巻(1号):1〜22頁)。未処理の読みは、TopHatを使用してアラインできる(その全体が参照により組み込まれている、Trapnellら(2009年)、Bioinformatics、25巻(9号):1105〜11頁)。諸方法では、上位の特徴(10〜200の範囲のN)が、e1071ライブラリー(その全体が参照により組み込まれている、Meyer D.、Support vector machines: the interface to libsvm in package e1071.、2014年)を使用して線形サポートベクターマシン(SVM)(その全体が参照により組み込まれている、Suykens JAK、Vandewalle J.、Least Squares Support Vector Machine Classifiers、Neural Processing Letters、1999年;9巻(3号):293〜300頁)を訓練するのに使用される。信頼区間は、一実施形態では、pROCパッケージ(その全体が参照により組み込まれている、Robin X、Turck N、Hainard Aら、pROC: an open-source package for R and S+ to analyze and compare ROC curves、BMC bioinformatics、2011年;12巻:77頁)を使用して計算される。
さらに、データをフィルタリングして、疑わしいと見なされ得るデータを除去してもよい。一実施形態では、約4、5、6、7、または8未満のグアノシン+シトシンヌクレオチドを有するマイクロアレイプローブに由来するデータは、これらの異常なハイブリダイゼーション傾向または二次構造問題に起因して信頼できないと見なされる場合がある。同様に、約12、13、14、15、16、17、18、19、20、21、または22超のグアノシン+シトシンヌクレオチドを有するマイクロアレイプローブに由来するデータは、これらの異常なハイブリダイゼーション傾向または二次構造問題に起因して信頼できないと一実施形態では見なされる場合がある。
本発明の一部の実施形態では、プローブセットからのデータは、これらが検出可能なレベル(バックグラウンドより上)で同定されない場合、分析から除外され得る。
本開示の一部の実施形態では、分散を呈さない、または低い分散を呈するプローブセットは、さらなる分析から除外され得る。低分散プローブセットは、カイ二乗検定を介して分析から除外される。一実施形態では、プローブセットは、その変換された分散が、(N−l)自由度を有するカイ二乗分布の99パーセント信頼区間の左にある場合、低分散であると見なされる。(N−l)プローブセット分散/(遺伝子プローブセット分散)。Chi−Sq(N−l)について、Nが、入力CELファイルの数である場合、(N−l)は、カイ二乗分布の自由度であり、「遺伝子についてのプローブセット分散」は、遺伝子にわたるプローブセット分散の平均である。本発明の一部の実施形態では、所与のmRNAまたはmRNAの群についてのプローブセットは、これらが、GC含有量、信頼性、分散などについて以前に記載したフィルターステップを通過する最小数未満のプローブを含有する場合、さらなる分析から除外される場合がある。例えば、一部の実施形態では、所与の遺伝子または転写物クラスターについてのプローブセットは、これらが、約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15未満、または約20未満のプローブを含有する場合、さらなる分析から除外され得る。
バイオマーカーレベルデータ分析の方法は、一実施形態では、本明細書に提供される特徴選択アルゴリズムの使用をさらに含む。本発明の一部の実施形態では、特徴選択は、LIMMAソフトウェアパッケージ(すべての目的に関してその全体が参照により組み込まれている、Smyth, G. K.(2005年)、Limma:linear models for microarray data. In: Bioinformatics and Computational Biology Solutions using R and Bioconductor、R. Gentleman、V. Carey、S. Dudoit、R. Irizarry、W. Huber(編)、Springer、New York、397〜420頁)を使用することによってもたらされる。
バイオマーカーレベルデータ分析の方法は、一実施形態では、プレクラシファイヤーアルゴリズムの使用を含む。例えば、アルゴリズムは、特異的分子フィンガープリントを使用して、試料をこれらの組成に従って予め分類し、次いで補正/正規化因子を適用することができる。次いでこのデータ/情報を、最終的な分類アルゴリズムに送ることができ、このアルゴリズムは、その情報を組み込んで最終的な診断を助ける。
バイオマーカーレベルデータ分析の方法は、一実施形態では、本明細書に提供されるクラシファイヤーアルゴリズムの使用をさらに含む。本発明の一実施形態では、対角線形判別分析、k−最近隣アルゴリズム、サポートベクターマシン(SVM)アルゴリズム、線形サポートベクターマシン、ランダムフォレストアルゴリズム、もしくは確率モデルベース法、またはこれらの組合せが、マイクロアレイデータを分類するために提供される。一部の実施形態では、試料(例えば、様々なバイオマーカーレベルプロファイルの、様々な肺がんサブタイプの、および/または腺癌の様々な分子サブタイプ(例えば、スクアモイド、ブロンコイド、マグノイド)の)を区別する同定されたマーカーは、目的のクラス間のバイオマーカーレベルの差異の統計的有意性に基づいて選択される。一部の場合では、統計的有意性は、偽発見率(FDR)についてのBenjamin Hochbergまたは別の補正を適用することによって調整される。
一部の場合では、クラシファイヤーアルゴリズムは、すべての目的に関してその全体が参照により組み込まれている、FishelおよびKaufmanら、2007年、Bioinformatics、23巻(13号):1599〜606頁に記載されたものなどのメタ分析手法を追加されている場合がある。一部の場合では、クラシファイヤーアルゴリズムは、再現性分析などのメタ分析手法を追加されている場合がある。
バイオマーカーレベルデータの分析に事後確率を導出および適用するための方法は、当技術分野で公知であり、例えば、すべての目的に関してその全体が参照により組み込まれている、Smyth, G. K.、2004年、Stat. Appl. Genet. Mol. Biol.、3巻:論文3に記載されている。一部の場合では、事後確率を本発明の方法において使用して、クラシファイヤーアルゴリズムによって提供されるマーカーをランク付けすることができる。
バイオマーカーレベルプロファイリングの結果の統計的評価は、肺がんサブタイプ(腺癌、扁平上皮細胞癌腫、神経内分泌癌腫);腺癌の分子サブタイプ(スクアモイド、ブロンコイド、またはマグノイド);特定の治療的介入、例えば、血管新生阻害剤療法または化学療法の成功の可能性のうちの1つまたは複数を示す1つまたは複数の定量的な値を提供し得る。一実施形態では、データは、患者ケアを指導するのにその最も有用な形式で医師に直接提示され、または臨床試験における患者集団もしくは所与の薬物投与についての患者集団を定義するのに使用される。分子プロファイリングの結果は、それだけに限らないが、スチューデントT検定、両側T検定、ピアソン順位和分析、隠れマルコフモデル分析、q−qプロットの分析、主成分分析、一元配置ANOVA、二元配置ANOVA、LIMMAなどを含めた当技術分野で公知のいくつかの方法を使用して統計的に評価することができる。
一部の場合では、精度は、元の診断の精度を決定するために経時的に対象を追跡することによって決定され得る。他の場合では、精度は、確定的な様式で、または統計的方法を使用して確立され得る。例えば、受信者動作特性(ROC)分析を使用することによって、最適なアッセイパラメーターを決定して、具体的なレベルの精度、特異性、正の予測値、負の予測値、および/または偽発見率を実現することができる。
一部の場合では、バイオマーカーレベルプロファイリングアッセイの結果は、分子プロファイリング企業、個人、医療提供者、または保険会社の代表またはエージェントによるアクセスのためにデータベースに入力される。一部の場合では、アッセイ結果は、医療専門家などの企業の代表、エージェント、またはコンサルタントによる試料分類、同定、または診断を含む。他の場合では、データのコンピューター分析またはアルゴリズム分析は、自動的に提供される。一部の場合では、分子プロファイリング企業は、個人、保険会社、医療提供者、研究者、または政府機関に、実施される分子プロファイリングアッセイ、コンサルティングサービス、データ分析、結果の報告、またはデータベースアクセスのうちの1つまたは複数について対価請求する場合がある。
本発明の一部の実施形態では、バイオマーカーレベルプロファイリングアッセイの結果は、コンピュータースクリーンでの報告として、または紙の記録として提示される。一部の実施形態では、報告は、それだけに限らないが、参照試料または参照値(単数または複数)と比較したバイオマーカーのレベル(例えば、コピー数または蛍光強度などによって報告される);バイオマーカーレベル値および肺がんサブタイプに基づいた、対象が特定の療法に応答する可能性、ならびに提案される療法のうちの1つまたは複数などの情報を含み得る。
一実施形態では、遺伝子発現プロファイリングの結果は、腺癌陽性、腺癌陰性、扁平上皮細胞癌腫陽性、扁平上皮細胞癌腫陰性、神経内分泌癌腫陽性、神経内分泌癌腫陰性、小細胞癌腫陽性、小細胞癌腫陰性、スクアモイド(近位炎症性)陽性、ブロンコイド(終末呼吸単位)陽性、マグノイド(近位増殖性)陽性、スクアモイド(近位炎症性)陰性、ブロンコイド(終末呼吸単位)陰性、マグノイド(近位増殖性)陰性;血管新生阻害剤もしくは化学療法への応答のしやすさ;血管新生阻害剤もしくは化学療法への応答のしにくさ;またはこれらの組合せのうちの1つまたは複数に分類することができる。
本発明の一部の実施形態では、結果は、訓練されたアルゴリズムを使用して分類される。本発明の訓練されたアルゴリズムには、既知の遺伝子発現値および/または正常試料、例えば、腺癌の特定の分子サブタイプと診断された個体からの試料の参照セットを使用して開発されたアルゴリズムが含まれる。一部の場合では、公知の遺伝子発現値の参照セットは、特定の分子サブタイプの腺癌を有すると診断された個体から得られ、血管新生阻害剤療法に応答する(または応答しない)こともまた公知である。
試料のカテゴリー化に適したアルゴリズムとしては、それだけに限らないが、k−最近隣アルゴリズム、サポートベクターマシン、線形判別分析、対角線形判別分析、アップダウン、ナイーブベイジアンアルゴリズム、ニューラルネットワークアルゴリズム、隠れマルコフモデルアルゴリズム、遺伝的アルゴリズム、またはこれらの任意の組合せがある。
バイナリークラシファイヤーが実際の真の値(例えば、生体試料からの値)と比較されるとき、典型的には4つの可能なアウトカムがある。予測からのアウトカムが、p(「p」は、欠失症候群または重複症候群の存在などの陽性のクラシファイヤー出力である)であり、実際の値もpである場合、それは、真の陽性(TP)と呼ばれるが、実際の値がnである場合、それは、偽陽性(FP)と言われる。反対に、予測アウトカムおよび実際の値の両方がn(「n」は、欠失症候群または重複症候群なしなどの陰性のクラシファイヤー出力である)であるとき、真の陰性が起こっており、偽陰性は、予測アウトカムがnであり、一方、実際の値がpであるときである。一実施形態では、人が血管新生阻害剤療法に応答しやすいかしにくいかを決定しようとする検査を考慮されたい。この場合において偽陽性は、実際には応答しないのに、人が陽性の試験結果を得るときに起こる。他方において偽陰性は、彼らが実際には応答しやすいのに、人が陰性の検査結果を得、彼らが応答しにくいと示唆されるときに起こる。同じことが、肺がんサブタイプを分類するのに当てはまる。
陽性予測値(PPV)、または精度率、または疾患の検査後確率は、応答しやすいもしくはしにくいと正しく診断される、または正しい肺がんサブタイプと診断される、あるいはこれらの組合せである、陽性試験結果を有する対象の割合である。これは、陽性の検査が、検査されている基礎状態を反映する確率を反映する。しかしその値は、変動し得る疾患の有病率に依存する。一例では、以下の特性が提供される:FP(偽陽性);TN(真の陰性);TP(真の陽性);FN(偽陰性)。偽陽性率(α)=FP/(FP+TN)−特異性;偽陰性率(β)=FN/(TP+FN)−感度;仕事率=感度=1−β;尤度比陽性=感度/(l−特異性);尤度比陰性=(1−感度)/特異性。陰性予測値(NPV)は、正しく診断されている陰性試験結果を有する対象の割合である。
一部の実施形態では、主題方法のバイオマーカーレベル分析の結果は、所与の診断が正しい統計的信頼水準をもたらす。一部の実施形態では、このような統計的信頼水準は、少なくとも約、または約85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%超、またはそれ超である。
一部の実施形態では、本方法は、試料中のバイオマーカーレベルと、例えば、少なくとも1つの訓練セット中に存在する参照バイオマーカーレベルとの比較に基づいて特定の肺がんサブタイプとして肺組織試料を分類することをさらに含む。一部の実施形態では、肺組織試料は、比較の結果が、1つまたは複数の判断基準、例えば、最小パーセント合致、(例えば)カッパ統計量などのパーセンテージ合致に基づいて計算される統計量の値、最小相関(例えば、ピアソン相関)などを満たす場合、特定のサブタイプとして分類される。
本明細書に記載の方法は、ソフトウェア(メモリーに記憶され、かつ/もしくはハードウェアで実行される)、ハードウェア、またはこれらの組合せによって実施され得ることが意図されている。ハードウェアモジュールは、例えば、汎用プロセッサー、フィールドプログラマブルゲートアレイ(FPGA)、および/または特定用途向け集積回路(ASIC)を含み得る。ソフトウェアモジュール(ハードウェアで実行される)は、Unix(登録商標)ユーティリティ、C、C++、Java(登録商標)、Ruby、SQL、SAS(登録商標)、Rプログラミング言語/ソフトウェア環境、ビジュアルベーシック(商標)、ならびに他のオブジェクト指向の、手続型の、または他のプログラミング言語および開発ツールを含めた様々なソフトウェア言語(例えば、コンピューターコード)で表現することができる。コンピューターコードの例としては、それだけに限らないが、コンパイラーによって生成されるものなどの、マイクロコードまたはマイクロインストラクション、マシンインストラクション、ウェブサービスを作製するのに使用されるコード、およびインタープリターを使用してコンピューターによって実行されるより高いレベルのインストラクションを含有するファイルがある。コンピューターコードの追加の例としては、それだけに限らないが、制御信号、暗号化されたコード、および圧縮コードがある。
本明細書に記載の一部の実施形態は、本明細書に開示の様々なコンピューターで実装される操作および/または方法を実施するためにインストラクションまたはコンピューターコードを有する非一時的なコンピューター可読媒体(非一時的プロセッサー可読媒体またはメモリーと呼ぶこともできる)を伴ったデバイスに関する。コンピューター可読媒体(またはプロセッサー可読媒体)は、それがそれ自体で一時的伝搬信号(例えば、空間またはケーブルなどの伝送媒体で情報を搬送する伝搬電磁波)を含まないという意味で非一時的である。媒体およびコンピューターコード(コードと呼ぶこともできる)は、1つまたは複数の具体的な目的のために設計および構築されたものであり得る。非一時的コンピューター可読媒体の例としては、それだけに限らないが、磁気記憶媒体、例えば、ハードディスク、フロッピー(登録商標)ディスク、および磁気テープなど;コンパクトディスク/デジタルビデオディスク(CD/DVD)などの光記憶媒体、コンパクトディスク−リードオンリーメモリー(CD−ROM)、およびホログラフィックデバイスなど;光ディスクなどの光磁気記憶媒体;搬送波信号処理モジュール;ならびにプログラムコードを記憶および実行するように特別に構成されているハードウェアデバイス、例えば、特定用途向け集積回路(ASIC)、プログラマブルロジックデバイス(PLD)、リードオンリーメモリー(ROM)、およびランダムアクセスメモリー(RAM)デバイスなどがある。本明細書に記載の他の実施形態は、例えば、本明細書に論じたインストラクションおよび/またはコンピューターコードを含むことができるコンピュータープログラム製品に関する。
一部の実施形態では、単一のバイオマーカー、または約5〜約10種、約5〜約15種、約5〜約20種、約5〜約25種、約5〜約30種、約5〜約35種、約5〜約40種、約5〜約45種、約5〜約50種のバイオマーカー(例えば、表1A、表1B、表1C、表2、表3、表4、表5、および表6に開示したような)は、少なくとも約70%、少なくとも約71%、少なくとも約72%、約73%、約74%、約75%、約76%、約77%、約78%、約79%、約80%、約81%、約82%、約83%、約84%、約85%、約86%、約87%、約88%、約89%、約90%、約91%、約92%、約93%、約94%、約95%、約96%、約97%、約98%、約99%、最大で100%、および間のすべての値の予測成功率で肺がんのタイプおよび/またはサブタイプを分類することができる。一部の実施形態では、本明細書に開示のバイオマーカーの任意の組合せ(例えば、表1A、表1B、表1C、表2、表3、表4、表5、および表6、ならびにこれらのサブコンビネーションにおける)を使用して、少なくとも約70%、少なくとも約71%、少なくとも約72%、約73%、約74%、約75%、約76%、約77%、約78%、約79%、約80%、約81%、約82%、約83%、約84%、約85%、約86%、約87%、約88%、約89%、約90%、約91%、約92%、約93%、約94%、約95%、約96%、約97%、約98%、約99%、最大で100%、および間のすべての値の予測成功率を得ることができる。
一部の実施形態では、単一のバイオマーカー、または約5〜約10種、約5〜約15種、約5〜約20種、約5〜約25種、約5〜約30種、約5〜約35種、約5〜約40種、約5〜約45種、約5〜約50種のバイオマーカー(例えば、表1A、表1B、表1C、表2、表3、表4、表5、および表6に開示したような)は、少なくとも約70%、少なくとも約71%、少なくとも約72%、約73%、約74%、約75%、約76%、約77%、約78%、約79%、約80%、約81%、約82%、約83%、約84%、約85%、約86%、約87%、約88%、約89%、約90%、約91%、約92%、約93%、約94%、約95%、約96%、約97%、約98%、約99%、最大で100%、および間のすべての値の感度または特異性で肺がんタイプおよび/またはサブタイプを分類することができる。一部の実施形態では、本明細書に開示のバイオマーカーの任意の組合せを使用して、少なくとも約70%、少なくとも約71%、少なくとも約72%、約73%、約74%、約75%、約76%、約77%、約78%、約79%、約80%、約81%、約82%、約83%、約84%、約85%、約86%、約87%、約88%、約89%、約90%、約91%、約92%、約93%、約94%、約95%、約96%、約97%、約98%、約99%、最大で100%、および間のすべての値の感度または特異性を得ることができる。
一部の実施形態では、本発明の方法を実践するための1つまたは複数のキットがさらに提供されている。キットは、クラシファイヤーバイオマーカーのバイオマーカーレベルを検出するための少なくとも1種の試薬、例えば、抗体、核酸プローブまたはプライマーなどを含む任意の製品(例えば、パッケージまたは容器)を包含することができる。キットは、本発明の方法を実施するためのユニットとして販売促進し、流通させ、または販売することができる。さらに、キットは、キットおよびその使用のための方法を記載している添付文書を含有することができる。
一実施形態では、がんに罹患している患者について疾患アウトカムまたは予後を決定するための方法が、本明細書に提供されている。一部の場合では、がんは肺がんである。本方法は、患者のがんの分子サブタイプを患者のがんの形態学的サブタイプと比較することによって、患者について疾患アウトカムまたは予後を決定するステップであって、分子サブタイプと形態学的サブタイプとの間の一致の存在または非存在は、患者の疾患アウトカムまたは予後を予測する、ステップを含み得る。一実施形態では、分子サブタイプと形態学的サブタイプとの間の不一致は、不良な予後または不良な疾患アウトカムを示す。不良な予後または疾患アウトカムは、その分子サブタイプおよび形態学的サブタイプの決定が一致する、同じタイプのがん(例えば、肺がん)に罹患している患者との比較であり得る。疾患アウトカムまたは予後は、ある期間または間隔(例えば、0〜36カ月または0〜60カ月)にわたって全生存を試験することによって測定され得る。一実施形態では、生存は、サブタイプ(例えば、肺がん、腺癌(TRU、PI、およびPP)、神経内分泌癌腫(小細胞癌腫およびカルチノイド)、または扁平上皮細胞癌腫(squamous)について)の関数として分析される。無再発生存および全生存は、標準的なカプラン・マイヤープロット(図4〜11を参照)ならびにCox比例ハザードモデリングを使用して評価され得る。
一実施形態では、分子サブタイプは、クラシファイヤーバイオマーカーの発現レベルを検出し、それによって発現プロファイルを得ることによって決定される。発現プロファイルは、本明細書に提供する方法のいずれかを使用して決定され得る。一部の場合では、患者は、肺がんに罹患しており、患者から得られる肺組織試料の分子サブタイプは、発現レベルを検出するための本明細書に提供する方法(例えば、RNA−seq、RT−PCR、またはハイブリダイゼーションアッセイ、例えば、マイクロアレイハイブリダイゼーションアッセイなど)のいずれかを使用して、表1A、表1B、表1C、表2、表3、表4、表5、または表6の単一のバイオマーカー、または約5〜約10種、約5〜約15種、約5〜約20種、約5〜約25種、約5〜約30種、約5〜約35種、約5〜約40種、約5〜約45種、約5〜約50種のクラシファイヤーバイオマーカーのレベルを検出することによって決定される。
一実施形態では、分子サブタイプは、RT−PCR(またはqRT−PCR)を実施することによって、肺組織試料において、核酸レベルで表1A、表1B、表1C、表2、表3、表4、表5、または表6の少なくとも5種のクラシファイヤーバイオマーカーの発現レベルを検出し、患者から得られる肺組織試料の分子サブタイプが腺癌、扁平上皮細胞癌腫、または神経内分泌癌腫サブタイプであるかを決定するために、検出された発現レベルを本明細書で記載するような参照試料または訓練セットのものと比較することによって決定される。神経内分泌癌腫サブタイプは、小細胞癌腫およびカルチノイドを包含し得る。腺癌サブタイプは、TRU、PI、またはPPとしてさらに分類され得る。RT−PCRは、少なくとも5種のクラシファイヤーバイオマーカーに特異的なプライマーを用いて実施され得る。少なくとも5種のクラシファイヤーバイオマーカーに特異的なプライマーは、表1A、表1B、表1C、表2、表3、表4、表5、または表6に列挙された順方向プライマーおよび逆方向プライマーである。
一実施形態では、分子サブタイプは、肺組織試料において、核酸レベルで表1A、表1B、表1C、表2、表3、表4、表5、または表6の少なくとも5種のクラシファイヤーバイオマーカーのレベルをプローブするステップであって、試料を、表1A、表1B、表1C、表2、表3、表4、表5、または表6の少なくとも5種のクラシファイヤーバイオマーカーの核酸分子の部分に実質的に相補的である5種またはそれ超のオリゴヌクレオチドと、5種またはそれ超のオリゴヌクレオチドのこれらの相補体または実質的な相補体へのハイブリダイゼーションに適した条件下で混合すること、ハイブリダイゼーションが、5種またはそれ超のオリゴヌクレオチドとこれらの相補体または実質的な相補体との間で起こるか否かを検出すること、検出するステップに基づいて少なくとも5種のクラシファイヤーバイオマーカーのハイブリダイゼーション値を得ることによるステップと、患者から得られる肺組織試料の分子サブタイプが腺癌、扁平上皮細胞癌腫、または神経内分泌癌腫サブタイプであるかを決定するために、検出されたハイブリダイゼーション値を本明細書で記載するような参照試料または訓練セットのものと比較するステップとによって決定される。神経内分泌癌腫サブタイプは、小細胞癌腫およびカルチノイドを包含し得る。腺癌サブタイプは、TRU、PI、またはPPとしてさらに分類され得る。
一実施形態では、組織試料(例えば、肺組織試料)の形態学的サブタイプは、組織学的分析である。組織学的分析は、当技術分野で公知の方法のいずれかを使用して実施され得る。一実施形態では、肺組織試料には、組織学的分析に基づいて腺癌、扁平上皮細胞癌腫(squamous)、または神経内分泌癌腫の組織学的サブタイプが割り当てられる。一実施形態では、肺がんに罹患している患者から得られる肺組織試料の組織学的サブタイプは、肺組織試料の分子サブタイプと比較され、分子サブタイプは、クラシファイヤー遺伝子(例えば、表1A、表1B、表1C、表2、表3、表4、表5、または表6からの)の遺伝子発現レベルを試験することによって決定される。一実施形態では、組織学的サブタイプと分子サブタイプとが一致し、患者の全生存(例えば、標準的なカプラン・マイヤープロットならびにCox比例ハザードモデリングを使用することによって決定されるような)は、同じサブタイプのがんを有する他の患者の全生存と実質的に類似している。一実施形態では、組織学的サブタイプと分子サブタイプとは一致せず、患者の全生存(例えば、標準的なカプラン・マイヤープロットならびにCox比例ハザードモデリングを使用することによって決定されるような)は、がんの一致する分子サブタイプおよび組織学的サブタイプの決定を有する他の患者の全生存と実質的に非類似である。一致しないサブタイプを有する患者の全生存確率は、一致するサブタイプのがん(例えば、肺がん)を有する患者の全生存確率よりも、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、60%、70%、75%、80%、85%、90%、95%、97.5%、99%、99.5%、もしくは99.9%少ないまたはそれよりも低くてもよい。
一実施形態では、患者の肺がんサブタイプを決定すると、患者は、適当な療法、例えば、血管新生阻害剤を用いた化学療法または薬物療法について選択される。一実施形態では、療法は、血管新生阻害剤療法であり、血管新生阻害剤は、血管内皮増殖因子(VEGF)阻害剤、VEGF受容体阻害剤、血小板由来増殖因子(PDGF)阻害剤、またはPDGF受容体阻害剤である。
別の実施形態では、血管新生阻害剤は、インテグリンアンタゴニスト、セレクチンアンタゴニスト、接着分子アンタゴニスト(例えば、細胞間接着分子(ICAM)−1、ICAM−2、ICAM−3、血小板内皮接着分子(PCAM)、血管細胞接着分子(VCAM)のアンタゴニスト)、リンパ球機能関連抗原1(LFA−1)、塩基性線維芽細胞増殖因子アンタゴニスト、血管内皮増殖因子(VEGF)モジュレーター、または血小板由来増殖因子(PDGF)モジュレーター(例えば、PDGFアンタゴニスト)である。対象がインテグリンアンタゴニストに応答しやすいか否かを決定する一実施形態では、インテグリンアンタゴニストは、小分子インテグリンアンタゴニスト、例えば、Paolilloら(Mini Rev Med Chem、2009年、12巻、1439〜1446頁、その全体が参照により組み込まれている)によって記載されるアンタゴニスト、またはその全体が参照により本明細書に組み込まれている米国特許第6,524,581号に記載されるような白血球接着誘導性サイトカインもしくは増殖因子アンタゴニスト(例えば、腫瘍壊死因子−α(TNF−α)、インターロイキン−1β(IL−1β)、単球走化性タンパク質−1(MCP−1)および血管内皮増殖因子(VEGF))である。
本明細書に提供する方法は、対象が以下の血管新生阻害剤のうちの1種または複数に応答しやすいか否かを決定するためにも有用である:インターフェロンガンマ1β、ピルフェニドンを伴ったインターフェロンガンマ1β(Actimmune(登録商標))、ACUHTR028、αVβ5、アミノ安息香酸カリウム、アミロイドP、ANG1122、ANG1170、ANG3062、ANG3281、ANG3298、ANG4011、抗CTGF RNAi、アプリジン、salviaおよびschisandra chinensisを伴ったastragalus membranaceus抽出物、アテローム硬化性プラークブロッカー、アゾル、AZX100、BB3、結合組織増殖因子抗体、CT140、ダナゾール、エスブリエット、EXC001、EXC002、EXC003、EXC004、EXC005、F647、FG3019、フィブロコリン(Fibrocorin)、フォリスタチン、FT011、ガレクチン−3阻害剤、GKT137831、GMCT01、GMCT02、GRMD01、GRMD02、GRN510、ヘベロン(Heberon)アルファR、インターフェロンα−2β、ITMN520、JKB119、JKB121、JKB122、KRX168、LPA1受容体アンタゴニスト、MGN4220、MIA2、マイクロRNA 29aオリゴヌクレオチド、MMI0100、ノスカピン、PBI4050、PBI4419、PDGFR阻害剤、PF−06473871、PGN0052、ピレスパ、ピルフェネックス、ピルフェニドン、プリチデプシン、PRM151、Px102、PYN17、PYN17を伴ったPYN22、レリベルゲン(Relivergen)、rhPTX2融合タンパク質、RXI109、セクレチン、STX100、TGF−β阻害剤、トランスフォーミング増殖因子、β−受容体2オリゴヌクレオチド、VA999260、XV615、またはこれらの組合せ。
別の実施形態では、対象が1種または複数の内因性血管新生阻害剤に応答しやすいか否かを決定するための方法が提供されている。さらなる実施形態では、内因性血管新生阻害剤は、エンドスタチン、XVIII型コラーゲンに由来する20kDa C末端断片、アンギオスタチン(プラスミンの38kDa断片)、またはタンパク質のトロンボスポンジン(TSP)ファミリーのメンバーである。さらなる実施形態では、血管新生阻害剤は、TSP−1、TSP−2、TSP−3、TSP−4、およびTSP−5である。以下の血管新生阻害剤:可溶性VEGF受容体、例えば、可溶性VEGFR−1およびニューロピリン1(NPR1)、アンジオポエチン−1、アンジオポエチン−2、バソスタチン、カルレティキュリン、血小板因子−4、メタロプロテイナーゼの組織阻害剤(TIMP)(例えば、TIMP1、TIMP2、TIMP3、TIMP4)、軟骨由来血管新生阻害剤(例えば、ペプチドトロポニンIおよびコンドロモジュリンI(chrondomodulin I))、トロンボスポンジンモチーフ1を伴ったディスインテグリンおよびメタロプロテイナーゼ、インターフェロン(IFN)(例えば、IFN−α、IFN−β、IFN−γ)、ケモカイン、例えば、C−X−Cモチーフを有するケモカイン(例えば、インターフェロンガンマ誘導タンパク質10または小誘導性サイトカインB10としても公知のCXCL10)、インターロイキンサイトカイン(例えば、IL−4、IL−12、IL−18)、プロトロンビン、抗トロンビンIII断片、プロラクチン、TNFSF15遺伝子によってコードされるタンパク質、オステオポンチン、マスピン、カンスタチン、プロリフェリン関連タンパク質のうちの1種または複数への応答の可能性を決定するための方法もまた提供されている。
一実施形態では、以下の血管新生阻害剤:アンジオポエチン−1、アンジオポエチン−2、アンギオスタチン、エンドスタチン、バソスタチン、トロンボスポンジン、カルレティキュリン、血小板因子−4、TIMP、CDAI、インターフェロンα、インターフェロンβ、血管内皮増殖因子阻害剤(VEGI)メタ−1、メタ−2、プロラクチン、VEGI、SPARC、オステオポンチン、マスピン、カンスタチン、プロリフェリン関連タンパク質(PRP)、レスチン、TSP−1、TSP−2、インターフェロンガンマ1β、ACUHTR028、αVβ5、アミノ安息香酸カリウム、アミロイドP、ANG1122、ANG1170、ANG3062、ANG3281、ANG3298、ANG4011、抗CTGF RNAi、アプリジン、salviaおよびschisandra chinensisを伴ったastragalus membranaceus抽出物、アテローム硬化性プラークブロッカー、アゾル、AZX100、BB3、結合組織増殖因子抗体、CT140、ダナゾール、エスブリエット、EXC001、EXC002、EXC003、EXC004、EXC005、F647、FG3019、フィブロコリン、フォリスタチン、FT011、ガレクチン−3阻害剤、GKT137831、GMCT01、GMCT02、GRMD01、GRMD02、GRN510、ヘベロンアルファR、インターフェロンα−2β、ITMN520、JKB119、JKB121、JKB122、KRX168、LPA1受容体アンタゴニスト、MGN4220、MIA2、マイクロRNA 29aオリゴヌクレオチド、MMI0100、ノスカピン、PBI4050、PBI4419、PDGFR阻害剤、PF−06473871、PGN0052、ピレスパ、ピルフェネックス、ピルフェニドン、プリチデプシン、PRM151、Px102、PYN17、PYN17を伴ったPYN22、レリベルゲン、rhPTX2融合タンパク質、RXI109、セクレチン、STX100、TGF−β阻害剤、トランスフォーミング増殖因子、β−受容体2オリゴヌクレオチド、VA999260、XV615、またはこれらの組合せのうちの1種または複数への応答の可能性を決定するための方法が提供されている。
さらに別の実施形態では、以下の血管新生阻害剤:パゾパニブ(ヴォトリエント)、スニチニブ(スーテント)、ソラフェニブ(ネクサバール)、アキシチニブ(インライタ)、ポナチニブ(アイクルシグ)、バンデタニブ(カプレルサ)、カボザンチニブ(コメトリグ(Cometrig))、ラムシルマブ(サイラムザ)、レゴラフェニブ(スチバーガ)、ジブ−アフリベルセプト(ザルトラップ)、またはこれらの組合せのうちの1種または複数への応答の可能性を決定するための方法が提供されている。さらに別の実施形態では、血管新生阻害剤は、VEGF阻害剤である。さらなる実施形態では、VEGF阻害剤は、アキシチニブ、カボザンチニブ、アフリベルセプト、ブリバニブ、チボザニブ、ラムシルマブ、またはモテサニブである。なおさらなる実施形態では、血管新生阻害剤は、モテサニブである。
一実施形態では、本明細書に提供する方法は、血小板由来増殖因子(PDGF)ファミリーのメンバーのアンタゴニスト、例えば、PDGF−受容体(PDGFR)のシグナル伝達および/または活性を阻害、低減、またはモジュレートする薬物への応答の、対象の可能性を決定することに関する。例えば、PDGFアンタゴニストは、一実施形態では、抗PDGFアプタマー、抗PDGF抗体もしくはその断片、抗PDGFR抗体もしくはその断片、または低分子アンタゴニストである。一実施形態では、PDGFアンタゴニストは、PDGFR−αまたはPDGFR−βのアンタゴニストである。一実施形態では、PDGFアンタゴニストは、抗PDGF−βアプタマーE10030、スニチニブ、アキシチニブ、ソラフェニブ(sorefenib)、イマチニブ、イマチニブメシル酸塩、ニンテダニブ、パゾパニブHCl、ポナチニブ、MK−2461、ドビチニブ、パゾパニブ、クレノラニブ、PP−121、テラチニブ、イマチニブ、KRN633、CP673451、TSU−68、Ki8751、アムバチニブ、チボザニブ、マシチニブ、モテサニブ二リン酸塩、ドビチニブ二乳酸、リニファニブ(ABT−869)である。
本発明を、以下の実施例を参照することによってさらに例示する。しかし、これらの実施例は、上述した実施形態のように、例示的であり、本発明の範囲を制限すると決して解釈されるべきでないことに留意されるべきである。
(実施例1)
57の遺伝子発現肺サブタイプパネル(LSP)をバリデートするための方法
2,168の肺がん試料を含むいくつかの公的に利用可能な肺がん遺伝子発現データセット(TCGA、NCI、UNC、Duke、Expo、Seoul、Tokyo、およびFrance)をアセンブルして、肺腫瘍の形態学的分類を補完するように開発された57の遺伝子発現肺サブタイプパネル(LSP)をバリデートした。LSPは、52の肺腫瘍分類遺伝子+5つのハウスキーピング遺伝子を含んでいた。遺伝子発現データおよび肺腫瘍形態学的分類の両方を有するデータセットを選択した。ゲノムデータの3つのカテゴリーを、データセット:Affymetrix U133+2(n=883)(「A−833」とも呼ばれる)、Agilent 44K(n=334)(「A−334」とも呼ばれる)、およびIllumina RNAseq(n=951)(「I−951」とも呼ばれる)で表した。データソースを表7に提供し、正規化法を表8に提供する。腺癌、カルチノイド、小細胞癌腫、および扁平上皮細胞癌腫の確定診断を有する試料を、分析で使用した。
A−833データセットを、以前に記載した方法に従って、腺癌、カルチノイド、小細胞癌腫、および扁平上皮細胞癌腫遺伝子重心(gene centroid)を計算するための訓練として使用した。次いで、A−833データで訓練された遺伝子重心を正規化されたTCGAおよびA−334データセットに適用して、公的に利用可能な遺伝子発現データを使用して肺腫瘍を分類するLSPの能力を調査した。A−833訓練重心(training centroid)をA−833データセットに適用するために、評価を、リーブワンアウト(LOO)クロスバリデーションを使用して実施した。スピアマン相関を、A−833遺伝子発現訓練重心に対する腫瘍試料遺伝子発現結果について計算した。腫瘍に、最大に相関した重心に対応するゲノム定義の組織学的型(カルチノイド、小細胞癌腫、腺癌、および扁平上皮細胞癌腫)を割り当てた。2クラス、3クラス、および4クラス予測を探索した。正しい予測を、腫瘍の組織学的診断にマッチするLSPコールとして定義した。パーセント合致を、すべての予測の数によって除した正しい予測の数として定義し、合致カッパ統計量を計算した。
10の肺腫瘍RNA発現データセットを組み合わせて、3つのプラットフォーム特異的データセット(A−833、A−334、およびI−951)にした。患者集団は、多様であり、病期1〜病期IVの範囲の腫瘍を有する喫煙者および非喫煙者を含んでいた。3つのデータセットの試料特性および肺がん診断は、表9に含まれている。
2クラス、3クラス、および4クラス予測因子について予測された腫瘍型を、腫瘍形態学的分類およびパーセント合致と比較し、Fleissカッパを各予測因子について計算した(表10a〜c)。
形態学的分類単独に基づく肺がん診断の観察者間再現性の評価は、以前に公開されている。全体的な観察者間合致は、タイピングスキームの単純化で改善した。包括的な2004世界保健機関分類システムを使用して、観察者間合致は低かった(k=0.25)。合致は、治療上意味がある扁平上皮/非扁平上皮の2タイプ区別に診断を単純化すると改善した(k=0.55)。観察者間診断の合致を、本バリデーション試験における2、3、および4クラスLSP診断の合致と比較する(表11)。
肺がんの様々な形態学的なサブタイプの間の区別は、ますます重要になっており、その理由は、治療剤開発および患者管理が、各腫瘍のユニークな特徴により特異的に標的化された状態になっているためである。組織学的診断は、挑戦的であり得、いくつかの試験は、形態学的な診断の再現性が限定的であることを実証している。p63およびTTF−1などのいくつかの免疫組織化学検査マーカーを加えると、診断上の精度が改善されるが、多くの肺がん生検は、サイズおよび/または細胞充実度が限られており、複数のIHCマーカーを使用する完全な特徴付けを妨げている。合致は、組織学的診断のより大きい精度および/またはRNA発現結果のより大きい精度におそらく起因して、他のデータセットと比較してTCGA RNAseqデータセットにおけるすべてのクラシファイヤー(2、3、および4タイプ)について著しくより良好であった(%合致範囲91%〜94%)。以下に記載するいくつかの限定事項にもかかわらず、本試験は、LSPが肺腫瘍のタイピングにおける組織診断の貴重な補助となるものであり得ることを実証する。
数百の肺がん試料を有する複数のデータセットでは、肺サブタイプパネル(LSP)を使用する分子プロファイリングは、光学顕微鏡で得られる診断と有利には匹敵し、病理学者の再評価より高いレベルの合致を示した。RNAベース腫瘍サブタイピングは、特に、組織が限定的であり、形態学的診断が不明確なままであるとき、診療所において貴重な情報を提供することができる。
以下の参考文献の開示は、すべての目的に関してその全体が参照により本明細書に組み込まれている。
(実施例2)
複数の新鮮凍結およびホルマリン固定パラフィン包埋肺腫瘍遺伝子発現データセットの肺がんサブタイピング
2,177の試料を含む複数のデータセットをアセンブルして、肺サブタイプパネル(LSP)遺伝子発現クラシファイヤーを評価した。データセットは、2,099の新鮮凍結肺がん試料を含むいくつかの公的に利用可能な肺がん遺伝子発現データセット(TCGA、NCI、UNC、Duke、Expo、Seoul、およびFrance)、ならびに78のFFPE試料から新しく収集された遺伝子発現データを含んでいた。データソースを以下の表12に提供する。78のFFPE試料は、IRB承認プロトコールを使用してノースカロライナ大学チャペルヒル校(UNC−CH)で収集された、アーカイブされた残留する肺腫瘍試料であった。AD、カルチノイド、小細胞癌腫(SCC)、またはSQCの確定診断を有する試料のみを、分析で使用した。ゲノムデータの合計4カテゴリーが分析に利用可能であった:Affymetrix U133+2(n=693)、Agilent 44K(n=344)、Illumina(登録商標)RNAseq(n=1,062)、および新しく収集されたqRT−PCR(n=78)データ。
アーカイブされたFFPE肺腫瘍試料(n=78)を、以下の改変とともに、以前に記載されたqRT−PCR遺伝子発現アッセイ(すべての目的に関してその全体が本明細書に参照により組み込まれている、Wilkersonら、J Molec Diagn、2013年;15巻:485〜497頁)を使用して分析した。RNAを、High Pure RNA Paraffin Kit(Roche Applied Science、Indianapolis、IN)を使用して、FFPE組織の1つの10μmの切片から抽出した。抽出したRNAを5ng/μLに希釈し、第1の鎖のcDNAを、ランダム六量体(Superscript III(登録商標)、Invitrogen(登録商標)、Thermo Fisher Scientific Corp、Waltham、MA)と組み合わせて遺伝子特異的3’プライマーを使用して合成した。ABI7900(Applied Biosystems、Thermo Fisher Scientific Corp、Waltham、MA)を、SYBR緑色蛍光(530nm)を連続的にモニターしながらqRT−PCRに使用した。ABI7900定量化ソフトウェアは、増幅曲線および関連した閾値サイクル(Ct)値を生成した。試料とともに集めた元の臨床診断は、表13にある。
病理学的レビューは、追加の切片を収集および画像化したFFPE肺腫瘍コホートについてのみ可能であった。各試料からの2つの連続した切片を、ヘマトキシリン&エオシン(H&E)染色し、Aperio(商標)ScanScope(登録商標)スライドスキャナー(Aperio Technologies、Vista、CA)を使用してスキャンした。バーチャルスライドは、32〜320対物レンズ(340拡大レンズ)に等価な拡大率で見ることができた。病理学者レビューを元の臨床診断および遺伝子発現ベースサブタイプ分類に対して盲検化した。病理学的レビューベース組織学的サブタイプコールを元の診断と比較した(n=78)。病理学的レビューの合致は、両方のスライドが元の診断と同じサブタイプに割り当てられた試料として定義した。
すべての統計分析は、R3.0.2ソフトウェア(http://cran.R-project.org)を使用して行った。データ分析は、FFについて、およびFFPE腫瘍試料について別個に行った。
新鮮凍結データセット分析:データセットを表12に記載したように正規化した。Affymetrixデータセットは、以前に記載された方法(Wilkersonら、PLoS ONE.、2012年;7巻(5号)e36530頁、Doi:10.1371/journal.pone.0036530;Wilkersonら、J Molec Diagn、2013年;15巻:485〜497頁、そのそれぞれは、すべての目的に関してその全体が本明細書に参照により組み込まれている)に従ってAD、カルチノイド、SCC、およびSQC遺伝子重心を計算するための訓練セットとして機能を果たした。
Affymetrix訓練遺伝子重心を表14に提供する。訓練セット遺伝子重心を、正規化されたTCGA RNAseq遺伝子発現データセットおよびAgilentマイクロアレイ遺伝子発現データセットにおいて検査した。公共のAgilentデータセットからの欠損したデータに起因して、Agilent評価は、CIB1、FOXH1、LIPE、PCAM1、TUBA1の遺伝子を除外して52の遺伝子パネルではなく、47の遺伝子クラシファイヤーを用いて実施した。
Affymetrixデータの評価を、リーブワンアウト(LOO)クロスバリデーションを使用して実施した。スピアマン相関を、Affymetrix遺伝子発現訓練重心に対する腫瘍検査試料について計算した。腫瘍に、最大に相関した重心に対応するゲノム定義の組織学的型(AD、SQC、またはNE)を割り当てた。正しい予測を、腫瘍の元の組織学的診断にマッチするLSPコールとして定義した。パーセント合致を、全予測の数によって除した正しい予測の数として定義し、合致カッパ統計量を計算した。
FFPE試料分析からのqRT−PCR:FFPE肺腫瘍試料のqRT−PCRデータから計算された、以前に公開された訓練重心(本明細書に参照により組み込まれている、Wilkersonら、J Molec Diagn、2013年;15巻:485〜497頁)を、FFPE肺腫瘍組織からのqRT−PCR遺伝子発現のこの新しい試料セットにおいてクロスバリデートした。WilkersonらのADおよびSQC重心を、公開された通り使用した(本明細書に参照により組み込まれている、Wilkersonら、J Molec Diagn、2013年;15巻:485〜497頁)。神経内分泌癌腫遺伝子重心を、公開された遺伝子発現データ(n=130)(本明細書に参照により組み込まれている、Wilkersonら、J Molec Diagn、2013年;15巻:485〜497頁)を使用して同様に計算した。FFPE組織評価についてのWilkersonらの遺伝子重心(本明細書に参照により組み込まれている、Wilkersonら、J Molec Diagn、2013年;15巻:485〜497頁)は、表15に含まれている。FFPE試料遺伝子発現データをスケール変更して、遺伝子分散をWilkersonらのデータとアラインした。データセット間の標識頻度の差異を考慮に入れた遺伝子特異的な倍率を計算した。次いで遺伝子発現データを、中央値中心化、符号反転し(高いCt=低い存在量)、遺伝子特異的な倍率を使用してスケール変更した。サブタイプは、各試料を3つのサブタイプ重心と相関させ、最高の相関重心(スピアマン相関)を有するサブタイプを割り当てることによって予測した。
9つのFF+1つの新しいFFPE qRT−PCR遺伝子発現データセットを含む10の肺腫瘍遺伝子発現データセットを組み合わせて、4つのプラットフォーム特異的データセットにした(Affymetrix、Agilent、Illumina RNAseq、およびqRT−PCR)。臨床情報が利用可能であったデータセットについては、患者集団は、多様であり、病期1〜病期IVの範囲の腫瘍を有する喫煙者および非喫煙者を含んでいた。本試験で使用したデータセットの試料特性および肺がん診断は、表16に含まれている。AD、SQC、SCC、またはカルチノイドの確定診断を伴わない試料を除外し、qRT−PCR分析に失敗した1つのFFPE試料を除外した後、以下の試料がさらなるデータ分析に利用可能であった:Affymetrix(n=538)、Agilent(n=322)、Illumina RNAseq(n=951)、およびqRT−PCR(n=77)。
新しいFFPEデータセットの新規の評価の手段として、本発明者らは、FFPEアーカイブ試料(n=77)からのLSP遺伝子発現の階層的クラスタリングを実施した。予期されたように、この分析は、AD、SQC、およびNEに対応する3つのクラスター/サブタイプを実証した(図2)。次いで、所定のLSP 3−サブタイプ重心予測因子を4つすべてのデータセットに適用し、結果を腫瘍形態学的分類と比較した。パーセント合致およびFleissカッパを各データセットについて計算した(表17)。パーセント合致は、78%〜91%の範囲であり、カッパは、0.57〜0.85の範囲であった。
独立した病理合致を評価する別の手段として、77のFFPE肺腫瘍の盲検化された病理学的レビューの元の形態学的診断との合致は、82%(63/77)であることが判明した。12/77の場合では、盲検化された重複するスライドは、矛盾する結果をもたらし、10/77の場合では、重複物の少なくとも一方は、「腺扁平上皮」、「大細胞」、または「高悪性度低分化癌」という非明示的な病理学的サブタイプ分類を有していた。77の試料のそれぞれについての元の形態学的な診断、盲検化された病理学的レビュー、および遺伝子発現LSPサブタイプコールの比較を図3に示す。一致しない試料のオーバーラップ(すなわち、腫瘍サブタイプが病理学的レビューおよび遺伝子発現LSPコールの両方によって元の形態診断と合致しなかった6つの試料)の詳細を表18に提供する。全体的に、元の病理学的コールに対するLSPのこれらの一致値は、任意の2人の病理学者との間の一致と少なくとも同じぐらい大きく(Grilleyら、Arch Pathol Lab Med、2013年;137巻:32〜40頁;Thunnissenら、Virchows Arch、2012年;461巻(6号):629〜38頁、Doi:10.1007/s00428-012-1234-x.、2012年10月12日電子出版;Thunnissenら、Mod Pathol、2012年;25巻(12号):1574〜83頁、Doi:10.1038/modpathol.2012.106;そのそれぞれは、すべての目的に関して本明細書に参照により組み込まれている)、したがって、本明細書に記載のアッセイは、訓練された病理学者と少なくとも同じぐらいよく機能することを示唆した。
本試験では、LSPは、信頼できるサブタイプ分類をもたらし、複数の遺伝子発現プラットフォームにわたって、かつFFPE標本を使用するときでもその性能をバリデートした。新しくアッセイしたFFPE試料の階層的クラスタリングは、52のクラシファイヤーバイオマーカーのレベルに基づいて3つのサブタイプ(AC、SQC、およびNE)の良好な分離を実証した。LSP重心を使用するときの形態診断との一致は、他のデータセットと比較してTCGA試料と関連した非常に広範な病理学的レビューおよび組織学的診断の精度におそらく起因して、TCGA RNAseqデータセットにおいて最大であった(合致=91%)。合致は、Agilentデータセットにおいて最低であった(78%)。このデータセットは、その分析について利用可能であった遺伝子の数が少なかったことによって影響された可能性がある。全体的に、LSPアッセイは、52ではなく47のみの遺伝子が分析のために存在したAgilentデータセットを除いてすべてのデータセットにおいて病理学的レビューより元の形態診断とのより高い一致を示した。
盲検化された病理学的再レビューが可能であったFFPE試料では、結果は、病理学的コールが、元の診断と常に一貫しているとは限らず、これらは、各試料から提供される重複スライドにおいて必ずしも一貫していないことを示唆した。試料のサブセット(n=6)について、病理学的再レビューおよびLSP遺伝子発現分析の両方は、同じ代替の診断を示唆し、これから、現状における「ゴールドスタンダード」であった元の形態学的診断の精度が疑問視された。
本試験では、Affymetrixデータセットにおける少数のNE腫瘍試料があり、AgilentデータセットおよびTCGAデータセットの両方においてNE試料が存在しなかった。これは、FFPE試料セット中の相対的に高い数のNE試料(31/77)によって部分的に克服されたため、NE試料を同定するLSPシグネチャーの能力の良好な検査がもたらされた。本試験の別の限定事項は、盲検化された病理学的再レビューに関する。盲検化された病理学的レビューは、2つの画像化された切片に基づき、複数の切片/ブロック、および潜在的にIHC染色剤が診断を行うのに利用可能である通常の組織診断の標準プラクティスを反映しなかった。
参照による組み込み
以下の参考文献は、すべての目的に関してその全体が参照により組み込まれている。
(実施例3)
遺伝子発現サブタイピングによる扁平上皮細胞癌腫または神経内分泌癌腫プロファイルを有する腺癌肺腫瘍の生存差。
図4〜7に示されるように、アレイデータにおいて開発されたおよび本明細書に記載される肺サブタイプパネル(LSP)3−クラス(腺癌(AD)、扁平上皮細胞癌腫(SQ)、および神経内分泌癌腫(NE))最短重心(nearest centroid)予測因子を、ディレクターズチャレンジ(Sheddenら、Affyアレイ、n=442、図4)、TCGA(RNAseq、n=492、図5)、およびTomidaら(Agilentアレイ、n=117、図6)データセットにおいて、すべての病期の組織診断定義のAD試料に適用した。各組織診断定義のAD試料は、LSP最短重心予測因子に基づいて、AD、SQ、またはNEと予測された。各データセット(図4〜6)およびプールされたデータセット(図7)についてのカプラン・マイヤープロット(図4〜7)およびログランク検定を使用して、2つの群、組織学的に一致したおよび遺伝子発現(GE)一致したもの(AD−AD)、ならびに組織学的に一致しなかったおよびGE一致しなかったもの(AD予測されたSQまたはNE(AD−NE/SQ))において、5年間の全生存を評価および比較した。Cox比例ハザードモデルを使用して、T病期、N病期、および増殖について制御しつつ、生存差を評価した(PAM 50スコアによって測定したような;図12)。ADサブタイプ(終末呼吸単位(TRU)、近位増殖性(PP)、および近位炎症性(PI))間の試料の分布を調査した。
すべての病期の組織診断定義のAD試料に対して実施した分析について、予測因子は、組織学的AD試料の80%においてGEによるADサブタイプを確認したが、組織学的AD試料は、症例のそれぞれ12%および8%において、SQおよびNEのGEサブタイプとコールされた。AD−NE/SQ群(組織診断によってADかつ遺伝子発現LSPによってSQまたはNE)は、各データセットにおいて、AD−AD群(組織診断およびLSPの両方によってAD)よりも不良な生存を有した(RNAseq、ディレクターズ、およびTomidaにおけるログランクp値は、それぞれ1.17e−06、0.0009、および0.0001であった)。3つのデータセットをプールし、各試験における異なるベースラインハザードを考慮に入れた層別化coxモデルを使用すると、AD−NE/SQをAD−ADと比較するハザード比は、1.84(95% CI 1.48〜2.30)であった。T病期、N病期、および増殖スコアについて調整するモデルをフィットさせた場合、HRは1.58(95% CI 1.22〜2.04)であった。AD−NE/SQ試料のアデノサブタイプ(Adenosubtype)プロファイリングは、腫瘍が圧倒的にPPまたはPIのADサブタイプのものであったことを示した(209/213)。
全体的に、約20%の組織学定義の肺腺癌(AD)は、遺伝子発現プロファイルが異なっている。組織診断−GEが一致しないAD腫瘍は、一致する症例よりも悪い生存を示す。生存差は、上昇した増殖スコアによって部分的に説明され得る(図12を参照)。生存差は、腫瘍生物学および/または標準的なAD管理レジメンに対する多様な応答に起因し得る。さらに、遺伝子発現腫瘍サブタイピングは、不良な予後を有するAD試料のサブセットを同定する貴重な臨床情報を提供し得る。不良な予後の腺癌試料は、PIおよびPPの腺癌サブタイプに属し、上昇した増殖スコアを実証する。AD腫瘍のこのサブセットは、標準的な腺癌管理に対してあまり応答しない可能性がある。
参照による組み込み
以下の参考文献は、すべての目的に関してその全体が参照により組み込まれている。
(実施例4)
遺伝子発現サブタイピングによる扁平上皮細胞癌腫または神経内分泌癌腫プロファイルを有する腺癌肺腫瘍の生存差
図8〜11に示されるように、アレイデータにおいて開発されたおよび本明細書に記載される肺サブタイプパネル(LSP)3−クラス(腺癌(AD)、扁平上皮細胞癌腫(SQ)、および神経内分泌癌腫(NE))最短重心予測因子を、ディレクターズチャレンジ(Sheddenら、Affyアレイ、n=371、図8)、TCGA(RNAseq、n=384、図9)、およびTomidaら(Agilentアレイ、n=92、図10)データセットにおいて、病期IおよびIIの組織診断定義のAD試料に適用した。各組織診断定義のAD試料は、LSP最短重心予測因子に基づいて、AD、SQ、またはNEと予測された。各データセット(図8〜10)およびプールされたデータセット(図11)についてのカプラン・マイヤープロット(図8〜11)およびログランク検定を使用して、2つの群、組織学的に一致したおよび遺伝子発現(GE)一致したもの(AD−AD)、ならびに組織学的に一致しなかったおよびGE一致しなかったもの(AD予測されたSQまたはNE(AD−NE/SQ))において、5年間の全生存を評価および比較した。Cox比例ハザードモデルを使用して、LSPハザード比を試験し、それを、いくつかの他の予後パネル、Wilkersonら(506の遺伝子)、Wistubaら(31の遺伝子)、Kratzら(11の遺伝子)およびZhuら(15の遺伝子)と比較した。Wistubaらについては、遺伝子に均等に重みづけした。Kratzらについては、遺伝子に、刊行物中の係数に従って重みづけした。Zhuらについては、遺伝子に、TCGA ADデータセットにおけるOSに対する影響の方向に従って、−1〜+1の重みづけを行った。Wilkersonらについては、リスクスコアを、TRU(ブロンキオイド)重心までの距離として計算した。遺伝子変異の普及率を、肺ADおよびSQの顕著に関連した変異について試験した。予測因子は、組織学的AD試料の81%においてGEによるADサブタイプを確認したが、組織学的AD試料は、症例のそれぞれ12%および7%において、SQおよびNEのGEサブタイプとコールされた。AD−NE/SQ群(組織診断によってADかつ遺伝子発現LSPによってSQまたはNE)は、各データセットにおいて、AD−AD群(組織診断およびLSPの両方によってAD)よりも不良な生存を有した(図8〜10中のログランクp値を参照)。3つのデータセットをプールし、各試験における異なるベースラインハザードを考慮に入れた層別化coxモデルを使用すると、AD−NE/SQをAD−ADと比較するハザード比は、図11に示されるように、2.27(95% CI 1.71〜3)であった。
実施例3からの結論と合致して、この分析は、組織学的に定義された肺ADの約20%が、遺伝子発現サブタイプによって異なることを示した。さらに、組織診断−GEが一致しないAD腫瘍は、図14および15に示されるように、より悪い生存を実証し、複数の予後遺伝子シグネチャーにおける予後リスクの多くの原因である。図13に示されるように、組織診断−GEが一致しない試料における変異頻度は、評価した9/48の遺伝子について、一致する試料とは顕著に異なる。最後に、生存差は、腫瘍生物学および/または標準的なAD管理に対する多様な応答に帰せられ得る。
参照による組み込み
以下の参考文献は、すべての目的に関してその全体が参照により組み込まれている。
上述した様々な実施形態は、さらなる実施形態をもたらすように組み合わせることができる。本明細書に参照され、かつ/または出願データシートに列挙された米国特許、米国特許出願公開、米国特許出願、外国特許、外国特許出願、および非特許刊行物のすべては、その全体が参照により本明細書に組み込まれている。実施形態の態様は、必要であれば、様々な特許、出願、および刊行物の概念を採用してなおさらなる実施形態をもたらすように改変することができる。
これらの変更および他の変更を、上記詳細な説明を踏まえると実施形態に行うことができる。一般に、以下の特許請求の範囲において、使用した用語は、本明細書および特許請求の範囲に開示した具体的な実施形態に特許請求の範囲を限定するように解釈されるべきでないが、このような特許請求の範囲が権利を与えられる均等物の全範囲とともにすべての可能な実施形態を含むように解釈されるべきである。したがって、特許請求の範囲は、本開示によって限定されない。

Claims (84)

  1. 患者の腺癌の肺がんサブタイプが、スクアモイド(近位炎症性)、ブロンコイド(終末呼吸単位)、またはマグノイド(近位増殖性)であるか否かを評価する方法であって、
    (a)前記患者から得られる肺がん試料において、核酸レベルで表1A、表1B、表1C、表2、表3、表4、表5、または表6のクラシファイヤーバイオマーカーの少なくとも5種のクラシファイヤーバイオマーカーのレベルをプローブするステップであって、
    (i)前記試料を、表1A、表1B、表1C、表2、表3、表4、表5、または表6の前記少なくとも5種のクラシファイヤーバイオマーカーの核酸分子の部分に実質的に相補的である5種またはそれ超のオリゴヌクレオチドと、前記5種またはそれ超のオリゴヌクレオチドのこれらの相補体または実質的な相補体へのハイブリダイゼーションに適した条件下で混合すること;
    (ii)ハイブリダイゼーションが、前記5種またはそれ超のオリゴヌクレオチドとこれらの相補体または実質的な相補体との間で起こるか否かを検出すること;
    (iii)前記検出するステップに基づいて前記少なくとも5種のクラシファイヤーバイオマーカーのハイブリダイゼーション値を得ること
    を含むステップと;
    (b)前記少なくとも5種のクラシファイヤーバイオマーカーの前記ハイブリダイゼーション値を、少なくとも1つの試料訓練セットからの参照ハイブリダイゼーション値(単数または複数)と比較するステップであって、前記少なくとも1つの試料訓練セットは、(i)前記少なくとも5種のバイオマーカーを過剰発現する試料、もしくは前記少なくとも5種のバイオマーカーのサブセットを過剰発現する試料からの前記少なくとも5種のバイオマーカーのハイブリダイゼーション値(単数または複数)、(ii)参照スクアモイド(近位炎症性)、ブロンコイド(終末呼吸単位)、もしくはマグノイド(近位増殖性)試料からのハイブリダイゼーション値、または(iii)無腺癌肺試料から得たハイブリダイゼーション値を含む、ステップと;
    (c)前記比較するステップの結果に基づいて前記腺癌試料をスクアモイド(近位炎症性)、ブロンコイド(終末呼吸単位)、またはマグノイド(近位増殖性)サブタイプとして分類するステップと
    を含む方法。
  2. 前記比較するステップが、前記少なくとも5種のクラシファイヤーバイオマーカーの前記ハイブリダイゼーション値と、前記参照ハイブリダイゼーション値との間の相関を決定することを含む、請求項1に記載の方法。
  3. 前記比較するステップが、前記少なくとも5種のバイオマーカーの平均発現比を決定することと、前記平均発現比を、前記試料訓練セットにおける前記参照値から得られる前記少なくとも5種のバイオマーカーの平均発現比と比較することとをさらに含む、請求項1に記載の方法。
  4. 前記プローブするステップが、前記混合するステップの前に前記核酸またはその部分を単離することを含む、請求項1から3のいずれか一項に記載の方法。
  5. 前記ハイブリダイゼーションが、cDNAプローブへのcDNAバイオマーカーのハイブリダイゼーション、それによって非天然複合体を形成することを含む、請求項1から4のいずれか一項に記載の方法。
  6. 前記ハイブリダイゼーションが、cDNAプローブのmRNAバイオマーカーへのハイブリダイゼーション、それによって非天然複合体を形成することを含む、請求項1から4のいずれか一項に記載の方法。
  7. 前記プローブするステップが、前記試料中の前記核酸を増幅することを含む、請求項1から5のいずれか一項に記載の方法。
  8. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表1A、表1B、または表1Cの少なくとも10種のバイオマーカー、少なくとも20種のバイオマーカー、または少なくとも30種のバイオマーカーを含む、請求項1から7のいずれか一項に記載の方法。
  9. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表2の少なくとも10種のバイオマーカー、少なくとも20種のバイオマーカー、または少なくとも30種のバイオマーカーを含む、請求項1から7のいずれか一項に記載の方法。
  10. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表3の少なくとも10種のバイオマーカー、少なくとも20種のバイオマーカー、または少なくとも30種のバイオマーカーを含む、請求項1から7のいずれか一項に記載の方法。
  11. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表4の6種のバイオマーカーを含む、請求項1から7のいずれか一項に記載の方法。
  12. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表5の6種のバイオマーカーを含む、請求項1から7のいずれか一項に記載の方法。
  13. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表6の少なくとも10種のバイオマーカー、少なくとも20種のバイオマーカー、または少なくとも30種のバイオマーカーを含む、請求項1から7のいずれか一項に記載の方法。
  14. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表1A、表1B、または表1Cの約10〜約30種のクラシファイヤーバイオマーカー、または約15〜約40種のクラシファイヤーバイオマーカーを含む、請求項1から7のいずれか一項に記載の方法。
  15. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表2の約10〜約30種のクラシファイヤーバイオマーカー、または約15〜約40種のクラシファイヤーバイオマーカーを含む、請求項1から7のいずれか一項に記載の方法。
  16. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表3の約10〜約30種のクラシファイヤーバイオマーカー、または約15〜約40種のクラシファイヤーバイオマーカーを含む、請求項1から7のいずれか一項に記載の方法。
  17. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表6の約5〜約30種のクラシファイヤーバイオマーカー、または約10〜約30種のクラシファイヤーバイオマーカーを含む、請求項1から7のいずれか一項に記載の方法。
  18. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表1A、表1B、または表1Cに示したクラシファイヤーバイオマーカーのそれぞれを含む、請求項1から7のいずれか一項に記載の方法。
  19. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表2に示したクラシファイヤーバイオマーカーのそれぞれを含む、請求項1から7のいずれか一項に記載の方法。
  20. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表3に示したクラシファイヤーバイオマーカーのそれぞれを含む、請求項1から7のいずれか一項に記載の方法。
  21. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表6に示したクラシファイヤーバイオマーカーのそれぞれを含む、請求項1から7のいずれか一項に記載の方法。
  22. 前記試料が、パラフィン中に包埋された肺細胞を含む、請求項1から21のいずれか一項に記載の方法。
  23. 前記試料が、新鮮凍結試料である、請求項1から21のいずれか一項に記載の方法。
  24. 肺組織試料が、ホルマリン固定パラフィン包埋(FFPE)肺組織試料、新鮮および凍結組織試料から選択される、請求項1から21のいずれか一項に記載の方法。
  25. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表1Aに示したクラシファイヤーバイオマーカーのそれぞれを含む、請求項18に記載の方法。
  26. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表1Bに示したクラシファイヤーバイオマーカーのそれぞれを含む、請求項18に記載の方法。
  27. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表1Cに示したクラシファイヤーバイオマーカーのそれぞれを含む、請求項18に記載の方法。
  28. 肺がんに罹患している患者について疾患アウトカムを決定するための方法であって、前記患者から得た第1の試料の遺伝子発現分析を介して前記肺がんのサブタイプを決定して、遺伝子発現ベースサブタイプを生成するステップと;前記患者から得た第2の試料の形態学的分析を介して前記肺がんのサブタイプを決定して、形態学ベースサブタイプを生成するステップと;前記遺伝子発現ベースサブタイプを前記形態学ベースサブタイプと比較するステップであって、前記遺伝子発現ベースサブタイプと前記形態学ベースサブタイプとの間の一致の存在または非存在は、前記疾患アウトカムを予測する、ステップとを含む方法。
  29. 前記遺伝子発現ベースサブタイプと前記形態学ベースサブタイプとの間の不一致が、不良な疾患アウトカムを予測する、請求項28に記載の方法。
  30. 前記疾患アウトカムが全生存である、請求項28または29に記載の方法。
  31. 前記遺伝子発現ベースサブタイプおよび/または前記形態学ベースサブタイプが、腺癌、扁平上皮細胞癌腫、または神経内分泌癌腫腫である、請求項28から30のいずれか一項に記載の方法。
  32. 前記神経内分泌癌腫腫が、小細胞癌腫およびカルチノイドを包含する、請求項31に記載の方法。
  33. 前記第1の試料および/または前記第2の試料が、ホルマリン固定パラフィン包埋(FFPE)肺組織試料、新鮮または凍結組織試料である、請求項28から32のいずれか一項に記載の方法。
  34. 前記第1の試料および前記第2の試料が、同一の試料の部分である、請求項28から33のいずれか一項に記載の方法。
  35. 前記遺伝子発現分析が、RNA配列決定、逆転写酵素ポリメラーゼ連鎖反応(RT−PCR)、またはハイブリダイゼーションベース分析を実施することによって、前記第1の試料において、核酸レベルで表1A、表1B、表1C、表2、表3、表4、表5、または表6の少なくとも5種のクラシファイヤーバイオマーカーの発現レベルを決定することを含む、請求項28から34のいずれか一項に記載の方法。
  36. 前記RT−PCRが、定量的リアルタイム逆転写酵素ポリメラーゼ連鎖反応(qRT−PCR)である、請求項35に記載の方法。
  37. 前記RT−PCRが、前記少なくとも5種のクラシファイヤーバイオマーカーに特異的なプライマーを用いて実施され;前記方法が、表1A、表1B、表1C、表2、表3、表4、表5、もしくは表6の前記少なくとも5種のクラシファイヤーバイオマーカーの発現の検出されたレベルを、少なくとも1つの試料訓練セット(単数または複数)における前記少なくとも5種のクラシファイヤーバイオマーカーの発現と比較するステップであって、前記少なくとも1つの試料訓練セットは、参照腺癌試料の、表1A、表1B、表1C、表2、表3、表4、表5、もしくは表6の前記少なくとも5種のクラシファイヤーバイオマーカーの発現データ、参照扁平上皮細胞癌腫試料の、表1A、表1B、表1C、表2、表3、表4、表5、もしくは表6の前記少なくとも5種のクラシファイヤーバイオマーカーの発現データ、参照神経内分泌癌腫腫試料の、表1A、表1B、表1C、表2、表3、表4、表5、もしくは表6の前記少なくとも5種のクラシファイヤーバイオマーカーの発現データ、またはこれらの組合せを含む、ステップと;前記比較するステップの結果に基づいて前記第1の試料を腺癌、扁平上皮細胞癌腫、または神経内分泌癌腫サブタイプとして分類するステップとを含む、請求項35に記載の方法。
  38. 前記比較するステップが、前記第1の試料から得た発現データと、前記少なくとも1つの訓練セット(単数または複数)からの発現データとの間の相関を決定することを含む統計的アルゴリズムを適用することと;前記統計的アルゴリズムの結果に基づいて前記第1の試料を腺癌、扁平上皮細胞癌腫、または神経内分泌癌腫サブタイプとして分類することとを含む、請求項37に記載の方法。
  39. 前記少なくとも5種のクラシファイヤーバイオマーカーに特異的な前記プライマーが、表1A、表1B、表1C、表2、表3、表4、表5、または表6に列挙された順方向プライマーおよび逆方向プライマーである、請求項37または38に記載の方法。
  40. 前記ハイブリダイゼーションベース分析が、
    (a)前記患者から得られる肺がん試料において、核酸レベルで表1A、表1B、表1C、表2、表3、表4、表5、または表6の少なくとも5種のクラシファイヤーバイオマーカーのレベルをプローブするステップであって、
    (i)前記試料を、表1A、表1B、表1C、表2、表3、表4、表5、または表6の前記少なくとも5種のクラシファイヤーバイオマーカーの核酸分子の部分に実質的に相補的である5種またはそれ超のオリゴヌクレオチドと、前記5種またはそれ超のオリゴヌクレオチドをこれらの相補体または実質的な相補体のハイブリダゼーションに適した条件下で混合すること;
    (ii)ハイブリダイゼーションが、前記5種またはそれ超のオリゴヌクレオチドとこれらの相補体または実質的な相補体との間で起こるか否かを検出すること;
    (iii)前記検出するステップに基づいて前記少なくとも5種のクラシファイヤーバイオマーカーのハイブリダイゼーション値を得ること
    を含むステップと;
    (b)前記少なくとも5種のクラシファイヤーバイオマーカーの前記ハイブリダイゼーション値を、少なくとも1つの試料訓練セットからの参照ハイブリダイゼーション値(単数または複数)と比較するステップであって、前記少なくとも1つの試料訓練セットは、参照腺癌試料からのハイブリダイゼーション値、参照扁平上皮細胞癌腫試料からのハイブリダイゼーション値、参照神経内分泌癌腫試料からのハイブリダイゼーション値、またはこれらの組合せを含む、ステップと;
    (c)前記比較するステップの結果に基づいて前記肺がん試料を腺癌、扁平上皮細胞癌腫、または神経内分泌癌腫サブタイプとして分類するステップと
    を含む、請求項35に記載の方法。
  41. 前記比較するステップが、前記少なくとも5種のクラシファイヤーバイオマーカーの前記ハイブリダイゼーション値と、前記参照ハイブリダイゼーション値との間の相関を決定することを含む、請求項40に記載の方法。
  42. 前記比較するステップが、前記少なくとも5種のバイオマーカーの平均発現比を決定することと、前記平均発現比を、前記試料訓練セットにおける前記参照値から得られる前記少なくとも5種のバイオマーカーの平均発現比と比較することとをさらに含む、請求項40に記載の方法。
  43. 前記プローブするステップが、前記混合するステップの前に前記核酸またはその部分を単離することを含む、請求項40から42のいずれか一項に記載の方法。
  44. 前記ハイブリダイゼーションが、cDNAプローブのDNAバイオマーカーへのハイブリダイゼーション、それによって非天然複合体を形成することを含む、請求項40から43のいずれか一項に記載の方法。
  45. 前記ハイブリダイゼーションが、cDNAプローブのmRNAバイオマーカーへのハイブリダイゼーション、それによって非天然複合体を形成することを含む、請求項40から43のいずれか一項に記載の方法。
  46. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表1A、表1B、または表1Cの少なくとも10種のバイオマーカー、少なくとも20種のバイオマーカー、または少なくとも30種のバイオマーカーを含む、請求項35に記載の方法。
  47. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表2の少なくとも10種のバイオマーカー、少なくとも20種のバイオマーカー、または少なくとも30種のバイオマーカーを含む、請求項35に記載の方法。
  48. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表3の少なくとも10種のバイオマーカー、少なくとも20種のバイオマーカー、または少なくとも30種のバイオマーカーを含む、請求項35に記載の方法。
  49. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表4の6種のバイオマーカーを含む、請求項35に記載の方法。
  50. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表5の6種のバイオマーカーを含む、請求項35に記載の方法。
  51. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表6の少なくとも10種のバイオマーカー、少なくとも20種のバイオマーカー、または少なくとも30種のバイオマーカーを含む、請求項35に記載の方法。
  52. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表1A、表1B、または表1Cの約10〜約30種のクラシファイヤーバイオマーカー、または約15〜約40種のクラシファイヤーバイオマーカーを含む、請求項35に記載の方法。
  53. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表2の約10〜約30種のクラシファイヤーバイオマーカー、または約15〜約40種のクラシファイヤーバイオマーカーを含む、請求項35に記載の方法。
  54. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表3の約10〜約30種のクラシファイヤーバイオマーカー、または約15〜約40種のクラシファイヤーバイオマーカーを含む、請求項35に記載の方法。
  55. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表6の約5〜約30種のクラシファイヤーバイオマーカー、または約10〜約30種のクラシファイヤーバイオマーカーを含む、請求項35に記載の方法。
  56. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表1A、表1B、または表1Cに示したクラシファイヤーバイオマーカーのそれぞれを含む、請求項35に記載の方法。
  57. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表2に示したクラシファイヤーバイオマーカーのそれぞれを含む、請求項35に記載の方法。
  58. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表3に示したクラシファイヤーバイオマーカーのそれぞれを含む、請求項35に記載の方法。
  59. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表6に示したクラシファイヤーバイオマーカーのそれぞれを含む、請求項35に記載の方法。
  60. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表1Aに示したクラシファイヤーバイオマーカーのそれぞれを含む、請求項56に記載の方法。
  61. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表1Bに示したクラシファイヤーバイオマーカーのそれぞれを含む、請求項56に記載の方法。
  62. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表1Cに示したクラシファイヤーバイオマーカーのそれぞれを含む、請求項56に記載の方法。
  63. 前記第2の試料の前記形態学的分析が、組織学的分析である、請求項28から62のいずれか一項に記載の方法。
  64. ヒト患者からの肺組織試料が、スクアモイド(近位炎症性)、ブロンコイド(終末呼吸単位)、またはマグノイド(近位増殖性)腺癌の肺がんサブタイプであるか否かを評価する方法であって、
    クラシファイヤーバイオマーカーに特異的なオリゴヌクレオチドを用いたRNA−seq、逆転写酵素ポリメラーゼ連鎖反応(RT−PCR)、またはハイブリダイゼーションアッセイによって、核酸レベルで表1A、表1B、表1C、表2、表3、表4、表5、または表6の少なくとも5種のクラシファイヤーバイオマーカーの発現レベルを検出するステップと;
    表1A、表1B、表1C、表2、表3、表4、表5、または表6の前記少なくとも5種のクラシファイヤーバイオマーカーの発現の検出されたレベルを、少なくとも1つの試料訓練セットからの前記少なくとも5種のクラシファイヤーバイオマーカーの発現レベルと比較するステップであって、前記少なくとも1つの試料訓練セットは、(i)前記少なくとも5種のバイオマーカーを過剰発現する試料、もしくは前記少なくとも5種のバイオマーカーのサブセットを過剰発現する試料からの前記少なくとも5種のバイオマーカーの発現レベル(単数または複数)、(ii)参照スクアモイド(近位炎症性)、ブロンコイド(終末呼吸単位)、もしくはマグノイド(近位増殖性)試料からの発現レベル、または(iii)無腺癌肺試料からの発現レベルを含む、ステップと;
    前記比較するステップの結果に基づいて前記肺組織試料をスクアモイド(近位炎症性)、ブロンコイド(終末呼吸単位)、またはマグノイド(近位増殖性)サブタイプとして分類するステップと
    を含む方法。
  65. 前記比較するステップが、前記肺組織試料から得た発現データと、前記少なくとも1つの訓練セット(単数または複数)からの発現データとの間の相関を決定することを含む統計的アルゴリズムを適用することと;前記統計的アルゴリズムの結果に基づいて前記肺組織試料をスクアモイド(近位炎症性)、ブロンコイド(終末呼吸単位)、またはマグノイド(近位増殖性)サブタイプとして分類することとを含む、請求項64に記載の方法。
  66. 前記肺組織試料が、ホルマリン固定パラフィン包埋(FFPE)肺組織試料、新鮮および凍結組織試料から選択される、請求項64または65に記載の方法。
  67. 前記比較するステップが、前記少なくとも5種のバイオマーカーの平均発現比を決定することと、前記平均発現比を、前記試料訓練セットにおける前記参照値から得られる前記少なくとも5種のバイオマーカーの平均発現比と比較することとをさらに含む、請求項64に記載の方法。
  68. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表1A、表1B、または表1Cの少なくとも10種のバイオマーカー、少なくとも20種のバイオマーカー、または少なくとも30種のバイオマーカーを含む、請求項64から67のいずれか一項に記載の方法。
  69. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表2の少なくとも10種のバイオマーカー、少なくとも20種のバイオマーカー、または少なくとも30種のバイオマーカーを含む、請求項64から67のいずれか一項に記載の方法。
  70. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表3の少なくとも10種のバイオマーカー、少なくとも20種のバイオマーカー、または少なくとも30種のバイオマーカーを含む、請求項64から67のいずれか一項に記載の方法。
  71. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表4の6種のバイオマーカーを含む、請求項64から67のいずれか一項に記載の方法。
  72. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表5の6種のバイオマーカーを含む、請求項64から67のいずれか一項に記載の方法。
  73. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表6の少なくとも10種のバイオマーカー、少なくとも20種のバイオマーカー、または少なくとも30種のバイオマーカーを含む、請求項64から67のいずれか一項に記載の方法。
  74. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表1A、表1B、または表1Cの約10〜約30種のクラシファイヤーバイオマーカー、または約15〜約40種のクラシファイヤーバイオマーカーを含む、請求項64から67のいずれか一項に記載の方法。
  75. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表2の約10〜約30種のクラシファイヤーバイオマーカー、または約15〜約40種のクラシファイヤーバイオマーカーを含む、請求項64から67のいずれか一項に記載の方法。
  76. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表3の約10〜約30種のクラシファイヤーバイオマーカー、または約15〜約40種のクラシファイヤーバイオマーカーを含む、請求項64から67のいずれか一項に記載の方法。
  77. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表6の約5〜約30種のクラシファイヤーバイオマーカー、または約10〜約30種のクラシファイヤーバイオマーカーを含む、請求項64から67のいずれか一項に記載の方法。
  78. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表1A、表1B、または表1Cに示したクラシファイヤーバイオマーカーのそれぞれを含む、請求項64から67のいずれか一項に記載の方法。
  79. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表2に示したクラシファイヤーバイオマーカーのそれぞれを含む、請求項64から67のいずれか一項に記載の方法。
  80. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表3に示したクラシファイヤーバイオマーカーのそれぞれを含む、請求項64から67のいずれか一項に記載の方法。
  81. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表6に示したクラシファイヤーバイオマーカーのそれぞれを含む、請求項64から67のいずれか一項に記載の方法。
  82. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表1Aに示したクラシファイヤーバイオマーカーのそれぞれを含む、請求項78に記載の方法。
  83. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表1Bに示したクラシファイヤーバイオマーカーのそれぞれを含む、請求項78に記載の方法。
  84. 前記少なくとも5種のクラシファイヤーバイオマーカーが、表1Cに示したクラシファイヤーバイオマーカーのそれぞれを含む、請求項78に記載の方法。
JP2017553970A 2015-04-14 2016-04-14 肺がんのタイピングのための方法 Pending JP2018512160A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562147547P 2015-04-14 2015-04-14
US62/147,547 2015-04-14
PCT/US2016/027503 WO2016168446A1 (en) 2015-04-14 2016-04-14 Methods for typing of lung cancer

Publications (2)

Publication Number Publication Date
JP2018512160A true JP2018512160A (ja) 2018-05-17
JP2018512160A5 JP2018512160A5 (ja) 2019-05-23

Family

ID=57126370

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017553970A Pending JP2018512160A (ja) 2015-04-14 2016-04-14 肺がんのタイピングのための方法

Country Status (6)

Country Link
US (4) US20190203296A1 (ja)
EP (1) EP3283654A4 (ja)
JP (1) JP2018512160A (ja)
CN (1) CN107849613A (ja)
CA (1) CA2982775A1 (ja)
WO (1) WO2016168446A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019516407A (ja) * 2016-05-17 2019-06-20 ジーンセントリック セラピューティクス, インコーポレイテッド 肺腺癌のサブタイピングのための方法

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3149209B1 (en) * 2014-05-30 2021-02-17 Genecentric Therapeutics, Inc. Methods for typing of lung cancer
US11514289B1 (en) * 2016-03-09 2022-11-29 Freenome Holdings, Inc. Generating machine learning models using genetic data
US11041214B2 (en) 2016-05-17 2021-06-22 Genecentric Therapeutics, Inc. Methods for subtyping of lung squamous cell carcinoma
CN109182526A (zh) * 2018-10-10 2019-01-11 杭州翱锐生物科技有限公司 用于早期肝癌辅助诊断的试剂盒及其检测方法
WO2023009174A1 (en) * 2021-07-30 2023-02-02 Oregon Health & Science University Methods for predicting lymph node status, likelihood of metastasis, and/or overall prognosis in patients with melanoma
CN116403648B (zh) * 2023-06-06 2023-08-01 中国医学科学院肿瘤医院 一种基于多维分析建立的小细胞肺癌免疫新分型方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200413725A (en) * 2002-09-30 2004-08-01 Oncotherapy Science Inc Method for diagnosing non-small cell lung cancers
US20060024692A1 (en) * 2002-09-30 2006-02-02 Oncotherapy Science, Inc. Method for diagnosing non-small cell lung cancers
WO2008151110A2 (en) * 2007-06-01 2008-12-11 The University Of North Carolina At Chapel Hill Molecular diagnosis and typing of lung cancer variants
CN101509035A (zh) * 2008-09-05 2009-08-19 中国人民解放军总医院 肺癌分型的基因序列及其应用
EP3149209B1 (en) * 2014-05-30 2021-02-17 Genecentric Therapeutics, Inc. Methods for typing of lung cancer

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019516407A (ja) * 2016-05-17 2019-06-20 ジーンセントリック セラピューティクス, インコーポレイテッド 肺腺癌のサブタイピングのための方法
JP7241353B2 (ja) 2016-05-17 2023-03-17 ジーンセントリック セラピューティクス, インコーポレイテッド 肺腺癌のサブタイピングのための方法

Also Published As

Publication number Publication date
EP3283654A1 (en) 2018-02-21
US20190203296A1 (en) 2019-07-04
US20220243283A1 (en) 2022-08-04
CA2982775A1 (en) 2016-10-20
US20210147948A1 (en) 2021-05-20
CN107849613A (zh) 2018-03-27
WO2016168446A1 (en) 2016-10-20
EP3283654A4 (en) 2018-12-12
US20220002820A1 (en) 2022-01-06

Similar Documents

Publication Publication Date Title
JP7241353B2 (ja) 肺腺癌のサブタイピングのための方法
JP7241352B2 (ja) 肺扁平上皮癌のサブタイピングのための方法
US20220002820A1 (en) Methods for typing of lung cancer
US10829819B2 (en) Methods for typing of lung cancer
US20230395263A1 (en) Gene expression subtype analysis of head and neck squamous cell carcinoma for treatment management
US12006554B2 (en) Methods for subtyping of head and neck squamous cell carcinoma
US11851715B2 (en) Detecting cancer cell of origin
US20210054464A1 (en) Methods for subtyping of bladder cancer
US11739386B2 (en) Methods for determining response to PARP inhibitors
US20240182984A1 (en) Methods for assessing proliferation and anti-folate therapeutic response
US20230243813A1 (en) Methods for selecting and treating cancer with fgfr3 inhibitors
WO2023164595A2 (en) Methods for subtyping and treatment of head and neck squamous cell carcinoma

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171214

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190412

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190412

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200204

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20200430

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20200702

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20201012