JP6775499B2 - 肺がん状態の評価方法 - Google Patents

肺がん状態の評価方法 Download PDF

Info

Publication number
JP6775499B2
JP6775499B2 JP2017523184A JP2017523184A JP6775499B2 JP 6775499 B2 JP6775499 B2 JP 6775499B2 JP 2017523184 A JP2017523184 A JP 2017523184A JP 2017523184 A JP2017523184 A JP 2017523184A JP 6775499 B2 JP6775499 B2 JP 6775499B2
Authority
JP
Japan
Prior art keywords
lung cancer
genes
subject
gene
bronchoscopy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017523184A
Other languages
English (en)
Other versions
JP2017527304A (ja
JP2017527304A5 (ja
Inventor
ホイットニー,ダンカン,エイチ.
エラショフ,マイケル
Original Assignee
ベラサイト インコーポレイテッド
ベラサイト インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ベラサイト インコーポレイテッド, ベラサイト インコーポレイテッド filed Critical ベラサイト インコーポレイテッド
Publication of JP2017527304A publication Critical patent/JP2017527304A/ja
Publication of JP2017527304A5 publication Critical patent/JP2017527304A5/ja
Application granted granted Critical
Publication of JP6775499B2 publication Critical patent/JP6775499B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57423Specifically defined cancers of lung
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/30Microarray design
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Description

関連出願の相互参照
[0001] 本出願は、2014年7月14に出願した米国特許仮出願第62/024,456号および2015年5月12日に出願した米国特許仮出願第62/160,403号の優先権を主張するものであり、この仮出願の全内容は、それら全体があらゆる目的のために参照によって本明細書に組み入れられる。
電子的に提出したテキストファイルについての記載
[0002] 電子的に提出したテキストファイルの内容は、それら全体が参照により本明細書に組み入れられている:配列表のコンピュータ可読形式コピー(ファイル名:VRCT-008_02WO_ST25.txt、記録日:2015年7月14日、ファイズサイズ:9キロバイト)。
[0003] 本開示は、一般に、遺伝子発現情報を使用してがんを評定するための方法および組成物に関する。
[0004] 肺がんを診断する上での課題、特に、最も有効に処置することができる早期に診断する上での課題は、疾患を診断するための細胞への到達である。早期肺がんは、小さい病変を概して伴い、これらの病変は、気管支鏡検査などの標準的技術によって到達することが特に難しい肺気道末梢領域に出現することもある。
[0005] 対象のための適切な診断的介入計画および/または処置計画を確立する方法、ならびに医療提供者が適切な診断的介入計画および/または処置計画を確立するのに役立つ方法を本明細書において提供する。一部の実施形態では、この方法は、気道フィールドの損傷の概念(airway field of injury concept)に基づく。一部の実施形態では、この方法は、対象ががんを有する尤度の評定に有用である情報提示遺伝子(informative-gene)の発現レベルに基づいて肺がんリスクスコアを確立することを含む。一部の実施形態では、本明細書において提供する方法は、ルーチンの細胞または組織試料採取手法の間に対象から得られる生体試料における情報提示遺伝子の発現レベルに基づいて評定を行うことを含む。一部の実施形態では、生体試料は、組織学的に正常な細胞を含む。一部の実施形態では、本開示の態様は、第一の気道部分から得られる一見組織学的に正常な細胞における特定の情報提示遺伝子の発現レベルを使用して気道の第二の部分での(例えば、組織学的に正常な細胞の試料を採取した部分から遠い気道の部分で)がんの尤度を評価することができるという結論に、少なくとも一部は基づく。一部の実施形態では、組織学的に正常な細胞(例えば、気管支の細胞)の試料採取は、そのような細胞を含有する組織を一般に容易に入手できるので有利であり、したがって、再現可能に試料採取することがほとんどできない疑わしい病変の組織を得ることを含む手法と比較して、有用な試料を再現可能に得ることが可能である。一部の実施形態では、この方法は、対象の気管支から採取した細胞学的に正常に見える細胞における情報提示遺伝子の発現レベルに基づいて肺がんの評定を行うことを含む。一部の実施形態において肺がんの尤度の予測に有用な情報提示遺伝子を表1、11および26に提供する。
[0006] 本開示方法の一部の態様によると、対象が肺がんを有する尤度を決定する方法であって、対象から得た生体試料を遺伝子発現分析に付す工程を含み、遺伝子発現分析が、肺がん状態に関係する1つまたは複数の情報提示遺伝子(例えば、表11から選択される情報提示遺伝子)の生体試料におけるmRNA発現レベルを決定することを含む、方法を提供する。一部の実施形態では、この方法は、対象の1つまたは複数の自己報告可能な特徴に関係する1つまたは複数のゲノム相関遺伝子(genomic correlate gene)の生体試料におけるmRNA発現レベルを決定することを含む。一部の実施形態では、この方法は、上で決定した発現レベルを、対象が肺がんを有する尤度を示す肺がんリスクスコアに変換することをさらに含む。一部の実施形態では、対象の1つまたは複数の自己報告可能な特徴は、喫煙パック年、喫煙状態、年齢および性別から選択される。一部の実施形態では、肺がんリスクスコアは、使用企図集団(intended use population)内の肺がんの除外について90%より高い陰性的中率(NPV)を有するモデルに従って決定される。一部の実施形態では、肺がんリスクスコアは、COPDと診断された対象について85%より高い陰性的中率(NPV)を有するモデルに従って決定される。
[0007] 一部の実施形態では、適切な診断的介入計画は、少なくとも一部は肺がんリスクスコアに基づいて確立される。一部の実施形態では、この方法は、医療提供者が早期の正確な診断を行うのに役立つ。一部の実施形態では、この方法は、医療提供者が患者の臨床評価の早期に適切な治療的介入を確立するのに役立つ。一部の実施形態では、この方法は、気管支鏡検査手法の間に得られる生体試料を評価することを含む。一部の実施形態では、この方法は、医療提供者が、他の方法では情報価値のない気管支鏡検査から患者の診断および/または処置に関して情報価値のある決定を行うことを可能にするので、有益である。一部の実施形態では、リスクまたは尤度評定は、低リスク病変のモニタリングに適した監視につながる。一部の実施形態では、リスクまたは尤度評定は、特定のがんのより早い診断、したがって、より早い治療につながる。
[0008] 本明細書に記載する特定の方法は、単独でまたは他の方法と併用で、医療提供者に彼らが患者の診断および治療を決定するのに役立つ有用な情報を提供する。本明細書において開示する特定の方法は、他の方法が患者の肺がん状態に関する有用な情報を提供することができなかった場合に利用される。本明細書において開示する特定の方法は、ルーチンの気管支鏡検査手法の間に得られる細胞または組織試料を評価または診断するための代替または補完的方法を提供し、この手法が患者のケアを管理するために有用な情報をもたらす尤度を増加させる。本明細書において開示する方法は高感度であり、対象が肺がんを有する尤度に関する情報を、悪性肺組織から遠い位置から得られることもある細胞または組織試料(例えば、組織学的に正常な組織)から生じさせる。本明細書に記載する特定の方法を使用して、ルーチンの細胞または組織試料採取手法(例えば、補助的気管支鏡検査手法、例えばブラッシング、例えば細胞採取用ブラシによるブラッシング;生検;洗浄;針穿刺吸引)中に得られる組織学的に正常な細胞または組織を評価することによって対象が肺がんを有する尤度を評定することができる。しかし、いずれの好適な組織または細胞試料を使用してもよいことは理解されるはずである。多くの場合、この方法によって評定される細胞または組織は、組織学的に正常に見える。一部の実施形態では、対象は、気管支鏡検査の候補として、および/または呼吸器に疑わしい病変があると、同定された。
[0009] 一部の実施形態では、本明細書において開示する方法は、医療提供者が、肺がんを有する対象のリスクと、対象の肺がんの存在または不在を確認することを目的とした特定の侵襲的診断手法に関連するリスクとを比較検討することによって適切な診断的介入および/または処置計画を決定することを可能にするので、有用である。一部の実施形態では、疾患にかかっている確率が低い対象と、リスクはより低いががんを除外できないこともある介入とを整合させることが、目的である。
[0010] 本開示の一部の態様によると、遺伝子発現情報を使用して対象の肺がん状態を評価する方法であって、次の行為の1つまたは複数を含む方法を提供する:(a)気管支鏡検査で調べられた(例えば、呼吸器に疑わしい病変を有すると同定され、そのためその病変を評価するために気管支鏡検査で調べられた)対象の呼吸器から生体試料を得ること、(b)生体試料における複数の情報提示遺伝子の発現レベルを決定することを含む遺伝子発現分析に生体試料を付すこと、(c)複数の情報提示遺伝子の発現レベルに基づいて肺がんリスクスコアをコンピュータ処理すること、(d)肺がんリスクスコアのレベルが第一の閾値レベルを超えた(例えば、第一の閾値レベルより上であった)場合、対象には肺がん状態を評価するための第一の診断的介入が必要であると決定すること、(e)肺がんリスクスコアのレベルが第二の閾値レベルを超えた(例えば、第二の閾値レベルより下であった)場合、対象には肺がん状態を評価するための第二の診断的介入が必要であると決定すること。一部の実施形態では、この方法は、(f)肺がんリスクスコアのレベルが第一の閾値レベルと第二の閾値レベルの間であった場合、対象には肺がん状態を評価するための第三の診断的介入が必要であると決定することをさらに含む。
[0011] 特定の実施形態では、本明細書におけるアプローチを対象が気管支鏡検査で調べ、その気管支鏡検査によって不確定または非診断情報が得られた場合、使用することができるだろう。したがって、そのような対象を低リスクに割り当てる方法であって、(a)気管支鏡検査手法で診断できなかった対象の呼吸器から生体試料を得る工程、(b)生体試料における複数の情報提示遺伝子の発現レベルを決定することを含む遺伝子発現分析に生体試料を付す工程、(c)複数の情報提示遺伝子の発現レベルに基づいて肺がんリスクスコアをコンピュータ処理する工程、および(d)肺がんリスクスコアのレベルが第一の閾値レベルを超えた(例えば、第一の閾値レベルより下であった)場合、対象は肺がんのリスクが低いと決定する工程、ならびに任意選択により、(e)低リスク対象を1つまたは複数の非侵襲的追跡調査手法、例えばCT監視に割り当てる工程のうちの1つまたは複数を含む方法を、本明細書において開示する。そのようなアプローチによって、対象集団はその後の侵襲的アプローチを回避することができる。閾値レベル以上である対象については、気管支鏡検査で診断できなかった後、旧来のアプローチを続けてもよい。
[0012] 一部の実施形態では、第一の診断的介入は、経胸壁針穿刺吸引(transthoracic needle aspiration, mediastinoscopy)、縦隔鏡検査または開胸術を実施することを含む。一部の実施形態では、第二の診断的介入は、慎重な経過観察(例えば、定期的モニタリング)に従事することを含む。一部の実施形態では、慎重な経過観察は、呼吸器を定期的に画像診断して疑わしい病変を評価することを含む。一部の実施形態では、慎重な経過観察は、1年、2年、4年、5年までまたはそれより長い間、呼吸器を定期的に画像診断して疑わしい病変を評価することを含む。一部の実施形態では、慎重な経過観察は、少なくとも1年に1回、呼吸器を画像診断して疑わしい病変を評価することを含む。一部の実施形態では、慎重な経過観察は、少なくとも1年に2回、呼吸器を画像診断して疑わしい病変を評価することを含む。一部の実施形態では、慎重な経過観察は、がんがないと対象が診断されるまで、対象の定期的モニタリングを含む。一部の実施形態では、慎重な経過観察は、がんを有すると対象が診断されるまで、対象の定期的モニタリングを含む。一部の実施形態では、慎重な経過観察は、前の段落で述べた工程(a)〜(f)のうちの1つまたは複数を定期的に反復することを含む。一部の実施形態では、第三の診断的介入は、気管支鏡検査手法を実施することを含む。一部の実施形態では、第三の診断的介入は、前の段落で述べた工程(a)〜(e)を反復することを含む。特定の実施形態では、第三の診断的介入は、肺がんリスクスコアが第一の閾値レベルと第二の閾値レベルの間であるという決定から6カ月以内に工程(a)〜(e)を反復することを含む。特定の実施形態では、第三の診断的介入は、肺がんリスクスコアが第一の閾値レベルと第二の閾値レベルの間であるという決定から3カ月以内に工程(a)〜(e)を反復することを含む。一部の実施形態では、第三の診断的介入は、肺がんリスクスコアが第一の閾値レベルと第二の閾値レベルの間であるという決定から1カ月以内に工程(a)〜(e)を反復することを含む。
[0013] 一部の実施形態では、複数の情報提示遺伝子は、表11の遺伝子の群から選択される。一部の実施形態では、これらの遺伝子のサブセットの発現レベルを評価し、基準発現レベル(例えば、がんを有さない正常患者のもの)と比較する。一部の実施形態では、サブセットは、a)発現の増加が肺がんもしくは肺がんリスク増加と関連づけられる遺伝子、b)発現の減少が肺がんもしくは肺がんリスク増加または両方と関連づけられる遺伝子を含む。一部の実施形態では、サブセットの遺伝子の少なくとも5%、少なくとも10%、少なくとも20%、少なくとも30%、少なくとも40%または約50%は、肺がんリスク増加に関連して発現レベル増加を有する。一部の実施形態では、サブセットの遺伝子の少なくとも5%、少なくとも10%、少なくとも20%、少なくとも30%、少なくとも40%または約50%は、肺がんリスク増加に関連して発現レベル減少を有する。一部の実施形態では、表11の遺伝子から選択される10〜80またはそれより多くの遺伝子(例えば、5〜10、10〜20、20〜30、30〜40、40〜50、50〜60、60〜70、70〜80、約10、約15、約17、約25、約35、約45、約55、約65、約75、またはそれより多くの遺伝子)の各々についての発現レベルを評価する(例えば、アッセイするか、あるいは調べる)。一部の実施形態では、1つまたは複数の対照遺伝子(例えば、1、2、3、4または5つの対照遺伝子)の発現レベルも評価する。アッセイが、他の遺伝子、例えば参照遺伝子または他の遺伝子も(それらがいかに情報価値あるかに関係なく)含むことができることは、理解されるはずである。しかし、本明細書に記載する情報提示遺伝子サブセットのいずれかについての発現プロファイルが肺がんリスク増加を示す場合には、適切な治療または診断の推奨を、本明細書に記載する通り行うことができる。
[0014] 一部の実施形態では、表11からの遺伝子の1つまたは複数のサブセットの発現レベルの変化の同定を医師または他の医療専門家に任意の好適な形式で提供することができる。一部の実施形態では、本明細書において開示する予測モデル単独でのこれらの遺伝子発現プロファイルおよび/または結果は、診断の実施、予後予測の提供、またはさらなる診断もしくは特定の処置の推奨に十分なものでありうる。しかし、一部の実施形態では、本明細書において開示する予測モデルの遺伝発現プロファイルおよび/または結果は、他の情報(例えば、他の発現情報、および/または家族歴を含む対象についての他の物理的もしくは化学的情報)とともに、対象の診断、予後予測および/または処置に役立つこともある。
[0015] 一部の実施形態では、対象は、呼気有機の画像診断によって呼吸器に疑わしい病変を有すると同定される。特定の実施形態では、呼吸器の画像診断は、コンピュータ支援断層撮影、磁気共鳴画像法、超音波検査または胸部X線を実施することを含む。
[0016] 一部の実施形態では、患者から生体試料を得る方法を提供する。これらの生体試料における情報提示遺伝子の発現レベルは、患者が肺がんを有する尤度の評定する基礎を提供する。生体試料を処理する方法を提供する。一部の実施形態では、この処理方法によって、下流の情報提示遺伝子分析を可能にするためのRNAの質および完全性が保証され、得られる結果の質が保証される。したがって、様々な品質管理工程(例えば、RNAサイズ分析)をこれらの方法に用いることができるだろう。生体試料を包装および保存する方法を提供する。生体試料を、例えばその生体試料が処理されうるおよび/または遺伝子発現分析が実施されうるアッセイ研究室に、発送または輸送する方法を提供する。生体試料に関する遺伝子発現分析を実施して、試料における情報提示遺伝子の発現レベルを決定する方法を提供する。情報提示遺伝子の遺伝子発現分析の結果を分析および解釈する方法を提供する。遺伝子発現分析の結果を要約するレポートを作成する方法、ならびにアッセイ結果および/またはアッセイ解釈を医療提供者(例えば医師)に送信するまたは送る方法を提供する。さらに、さらなる処置または侵襲的診断手法の推奨を行うことを含む、治療決定を遺伝子発現アッセイ結果に基づいて行う方法を提供する。
[0017] 一部の実施形態では、本開示の態様は、対象が肺がんを有する尤度の決定であって、対象から得た生体試料を、少なくとも1つの情報提示遺伝子(例えば、表11から選択される少なくとも2つの遺伝子)の生体試料における発現レベルを決定する工程を含む遺伝子発現分析に付す工程、および発現レベルを、対象が肺がんを有する尤度の決定に役立つように使用する工程によるものである決定に関する。
[0018] 一部の実施形態では、決定する工程は、発現レベルを、対象が肺がんを有する尤度を示す肺がんリスクスコアに変換することをさらに含む。一部の実施形態では、肺がんリスクスコアは、重み付け発現レベルの組合せである。一部の実施形態では、肺がんリスクスコアは、重み付け発現レベルの合計である。一部の実施形態では、発現レベルは、肺がんを有する尤度増加の予測に対するそれらの相対的寄与によって重み付けされる。
[0019] 一部の実施形態では、本開示の態様は、対象の処置コースの決定であって、対象から得た生体試料を、少なくとも2つの情報提示遺伝子(例えば、表11から選択される少なくとも2つのmRNA)の生体試料における発現レベルを決定することを含む遺伝子発現分析に付す工程、および発現レベルに基づいて対象の処置コースを決定する工程によるものである決定に関する。一部の実施形態では、処置コースは、発現レベルから導出される(derived from)肺がんリスクスコアに基づいて決定される。一部の実施形態では、対象が肺がんを有する尤度が相対的に高いことを示す肺がんリスクスコアに基づいて、この対象は肺がん治療の候補として同定される。一部の実施形態では、対象が肺がんを有する尤度が相対的に高いことを示す肺がんリスクスコアに基づいて、この対象は肺の侵襲的手法の候補として同定される。一部の実施形態では、肺の侵襲的手法は、経胸壁針穿刺吸引、縦隔鏡検査または開胸術である。一部の実施形態では、対象が肺がんを有する尤度が相対的に低いことを示す肺がんリスクスコアに基づいて、この対象は肺がん治療または肺の侵襲的手法の候補でないと同定される。一部の実施形態では、遺伝子発現分析の結果を要約するレポートが作成される。一部の実施形態では、このレポートは、肺がんリスクスコアを示す。
[0020] 一部の実施形態では、本開示の態様は、対象が肺がんを有する尤度の決定であって、対象から得た生体試料を、少なくとも1つの情報提示遺伝子(例えば、表11から選択される少なくとも1つの情報提示mRNA)の生体試料における発現レベルを決定することを含む遺伝子発現分析に付す工程、および対象が肺がんを有する尤度を、発現レベルに少なくとも一部は基づいて決定する工程によるものである決定に関する。
[0021] 一部の実施形態では、本開示の態様は、対象が肺がんを有する尤度の決定であって、対象の呼吸上皮から得た生体試料を、少なくとも1つの情報提示遺伝子(例えば、表11から選択される少なくとも1つの情報提示mRNA)の生体試料における発現レベルを決定することを含む遺伝子発現分析に付す工程、および発現レベルに少なくとも一部は基づいて対象が肺がんを有する尤度を決定する工程によるものであり、生体試料が組織学的に正常な組織を含む、決定に関する。
[0022] 一部の実施形態では、本開示の態様は、ゲノム情報を処理するためのコンピュータ実装方法(computer-implemented method)であって、対象から得た生体試料における少なくとも2つの情報提示遺伝子(例えば、表11からの少なくとも2つの情報提示mRNA)の発現レベルを表すデータを得る工程、および発現レベルを、対象が肺がんを有する尤度の決定に役立つように使用する工程によるものである、コンピュータ実装方法に関する。コンピュータ実装方法は、ユーザーインターフェースによってデータを入力する工程、プロセッサを使用してコンピュータ処理すること(例えば、算出すること、比較すること、あるいは分析すること)、および/またはディスプレイまたは他のユーザーインターフェースによって結果を出力する工程を含むことができる。
[0023] 一部の実施形態では、決定する工程は、対象が肺がんを有する尤度を示すリスクスコアを算出することを含む。一部の実施形態では、リスクスコアのコンピュータ処理は、発現レベルが肺がんを有する尤度増加の予測に対するそれらの相対的寄与によって重み付けされる重み付き発現レベル(例えば、単独での、または1つもしくは複数のゲノム相関遺伝子を伴う、1つまたは複数の情報提示遺伝子の発現レベル)の組合せを決定することを含む。一部の実施形態では、ゲノム相関遺伝子は、特定の臨床的変数(例えば、自己報告可能変数)に関係するまたは特定の臨床的変数と相関する遺伝子である。一部の実施形態では、そのような臨床的変数は、がん、例えば肺がんと相関する。一部の実施形態では、遺伝子の発現レベルを使用するのではなく、対象集団内で共線的に変動する(例えば、互いに相関している)関連遺伝子の群を単一の値(例えば、関連遺伝子群の平均値)に結びつけるまたはまとめることができるだろう。一部の実施形態では、コンピュータ実装方法は、リスクスコアを示すレポートを作成する工程を含む。一部の実施形態では、レポートは、対象の医療提供者に送信される。
[0024] 一部の実施形態では、コンピュータ実装方法は、表11のクラスター1、2、3、4、5、6、7、8、9、10または11で同定される遺伝子のセットから選択される少なくとも2、3、4、5、6、7、8、9または10遺伝子の生体試料における発現レベルを表すデータを得ることを含む。一部の実施形態では、これらの遺伝子は、MYOTを含む。
[0025] 本明細書に記載するいずれの実施形態または態様においても、生体試料を対象の呼吸上皮から得ることができることは、理解されるはずである。呼吸上皮は、口、鼻、咽頭、気管、気管支、細気管支または肺胞のものでありうる。しかし、他の呼吸上皮源も使用することができる。生体試料は、組織学的に正常な組織を含むことができる。生体試料は、気管支ブラッシング、例えば細胞採取用ブラシ(cytobrush)もしくは組織採取用ブラシ(histobrush)、気管支肺胞洗浄、気管支生検、口腔内洗浄、タッチプレップ、細針吸引液、または痰採取を使用して得ることができる。対象は、肺がんの1つもしくは複数の症状を示すことがあり、および/またはコンピュータ支援断層撮影もしくは胸部X線によって観察可能である病変を有することがある。場合によっては、対象は、本明細書において開示する方法によって評価される前に原発性肺がんと診断されていない。
[0026] 本明細書に記載する実施形態または態様のいずれにおいても、発現レベルは、定量的逆転写ポリメラーゼ連鎖反応、ビーズベースの核酸検出アッセイもしくはオリゴヌクレオチドアレイアッセイ(例えば、マイクロアレイアッセイ)または他の技術を使用して決定することができる。
[0027] 本明細書に記載する実施形態または態様のいずれにおいても、肺がんは、腺癌、扁平上皮癌、小細胞がんまたは非小細胞がんでありうる。
[0028] 一部の実施形態では、本開示の態様は、少なくとも1つの核酸プローブから本質的になる組成物であって、少なくとも1つの核酸プローブの各々が情報提示遺伝子(例えば、表11から選択される少なくとも1つの情報提示mRNA)と特異的にハイブリダイズするものである組成物に関する。
[0029] 一部の実施形態では、本開示の態様は、5以下、10以下、25以下、50以下、100以下または200以下の核酸プローブを含む組成物であって、核酸プローブの各々が情報提示遺伝子(例えば、表1または11から選択される少なくとも1つの情報提示mRNA)と特異的にハイブリダイズするものである組成物に関する。
[0030] 一部の実施形態では、組成物は、少なくとも1、2、3、4、5、6、7、8、9または10の核酸プローブを含む。一部の実施形態では、少なくとも2、3、4、5、6、7、8、9または10の核酸プローブは、表11のクラスター1、2、3、4、5、6、7、8、9、10または11から選択される異なる遺伝子から発現されるmRNAとハイブリダイズする。
[0031] 一部の実施形態では、核酸プローブは、ビーズと直接または間接的にコンジュゲートされている。一部の実施形態では、ビーズは、磁性ビーズである。一部の実施形態では、核酸プローブは、固体支持体に固定化されている。一部の実施形態では、固体支持体は、ガラス、プラスチックまたはシリコンチップである。
[0032] 一部の実施形態では、本開示の態様は、本明細書に記載する任意の核酸プローブ組成物を収容する少なくとも1つの容器またはパッケージを含むキットに関する。
[0033] 一部の実施形態では、発現レベルは、定量的逆転写ポリメラーゼ連鎖反応を使用して決定される。
[0034] 一部の実施形態では、本開示の態様は、対象(例えばヒト対象)が肺がんを有する尤度を決定するためにその発現レベルを使用することができる遺伝子に関する。一部の実施形態では、本明細書に記載する1つまたは複数の遺伝子の発現レベル(例えば、mRNAレベル)を、気道試料(例えば、気管支鏡検査中にまたは適切な気管支洗浄試料から得られる上皮細胞または他の試料)において決定することができる。一部の実施形態では、本明細書に記載する情報提示遺伝子(例えば、1〜5、5〜10、10〜15、15〜20、20〜25、25〜50、50〜80、またはそれより多くの遺伝子)の1つまたは複数のサブセットについてのmRNA発現増加および/または減少パターンを診断、予後予測および/または治療目的で決定および使用することができる。本明細書に記載する1つまたは複数の発現パターンが、患者に個別の診断、予後および/もしくは治療の予測もしくは推奨を提供するために単独で使用されうることまたは1つもしくは複数のさらなる患者特異的兆候とともに役立ちうることは、理解されるはずである。一部の実施形態では、高い精度での肺がんリスクの予測に有用である、肺がんを有するの(現行または既往)喫煙者と肺がんを有さない(現行または既往)喫煙者を区別する情報提示遺伝子のセットを提供する。一部の実施形態では、情報提示遺伝子は、表1または11から選択される。
[0035] 一部の実施形態では、対象が肺がんを有する尤度を決定する方法であって、対象から得た生体試料を遺伝子発現分析に付すことを含み、遺伝子発現分析が、肺がん状態に関係する1つまたは複数の情報提示遺伝子(例えば、表1または11から選択される情報提示遺伝子)の生体試料におけるmRNA発現レベルを決定することを含む方法を、本明細書で提供する。一部の実施形態では、この方法は、対象の1つまたは複数の自己報告可能な特徴に関係する1つまたは複数のゲノム相関遺伝子の生体試料におけるmRNA発現レベルを決定することを含む。一部の実施形態では、この方法は、上で決定した発現レベルを、対象が肺がんを有する尤度を示す肺がんリスクスコアに変換することをさらに含む。一部の実施形態では、対象の1つまたは複数の自己報告可能な特徴は、喫煙パック年、喫煙状態、年齢および性別から選択される。一部の実施形態では、肺がんリスクスコアは、次の式に従って決定される:

(式中、
スコア1=W+WxGG+WxGS+WxGPY+WxGA+WxC1A+WxC1B+WxC2+WxC3+WxC4A+W10xC4B
および
スコア2=W+WxGG+WxGS+WxGPY+Wx報告年齢+WxC1A+WxC1B+WxC2+WxC3+WxC4A+W10xC4B、ならびに
GG、GS、GPY、GA、C1A、C1B、C2、C3、C4AおよびC4Bは、本明細書において開示する式に従って決定される)。
[0036] 一部の実施形態では、情報提示遺伝子は、表1または11から選択される。一部の実施形態では、対象集団内で共線的に変動する(例えば、互いに相関している)関連遺伝子の群を単一の値(例えば、関連遺伝子群の平均値)に結びつけるまたはまとめることができるだろう。一部の実施形態では、関連遺伝子の群は、同じ細胞および/または分子経路と関連づけられるので、相関関係がある。一部の実施形態では、少なくとも2、少なくとも3、少なくとも4、少なくとも5、またはそれより多くの関連遺伝子(例えば、相関遺伝子、共通クラスター内の遺伝子)が共に単一の値に結びつけられる。一部の実施形態では、関連遺伝子の群は、複数の対象(例えば、2〜100名、2〜500名、2〜1000名またはそれより多くの対象)から得られる発現レベルのクラスター分析を行うことによって同定される。そのような関連遺伝子を同定するために、例えば、重心に基づくクラスタリング(例えば、k平均クラスタリング)、連結性に基づくクラスタリング(例えば、階層的クラスタリング)および他の好適なアプローチを含む、いずれの適切なクラスター分析を使用してもよい。そのようなクラスターの非限定的な例は、関連遺伝子(例えば相関遺伝子)が同じクラスター内にあるように各遺伝子が存在するクラスターが第2列の値によって指定されている表11で同定される。一部の実施形態では、関連遺伝子セットの発現状態を表す値は、その関連遺伝子セットの平均発現レベルである。例えば、対象ががんを有する尤度を予測するためのモデルで次の値の1つまたは複数を使用することができるだろう:CIA、C1B、C2、C3、C4AおよびC4B(この場合、
CIA=(BST1、CD177.1、CD177.2)の平均、
C1B=(ATP12A、TSPAN2)の平均、
C2=(GABBRI、MCAM、NOVA1、SDC2)の平均、
C3=(CDR1、CGREF1、CLND22、NKX3−1)の平均、
C4A=(EPHX3、LYPD2)の平均、および
C4B=(MIA、RNF150)の平均)。
[0037] 一部の実施形態では、クラスター内の遺伝子を互いに置き換えることができる。したがって、一部の実施形態では、クラスター内のすべての遺伝子を予測モデルで評価または使用する必要がある。一部の実施形態では、クラスター内の1、2、3、4、5、6、7、8、9または10遺伝子のみが本明細書に記載の分析に独立して選択される。一部の実施形態では、表11のクラスター内の少なくとの1、2、3、4、5、6、7、8、9または10遺伝子が同定される。
[0038] 一部の実施形態では、1つまたは複数の情報提示遺伝子は、表11のクラスター1として同定される遺伝子セットから選択される。一部の実施形態では、1つまたは複数の情報提示遺伝子は、表11のクラスター2として同定される遺伝子セットから選択される。一部の実施形態では、1つまたは複数の情報提示遺伝子は、表11のクラスター3として同定される遺伝子セットから選択される。一部の実施形態では、1つまたは複数の情報提示遺伝子は、表11のクラスター4として同定される遺伝子セットから選択される。一部の実施形態では、1つまたは複数の情報提示遺伝子は、表11のクラスター5として同定される遺伝子セットから選択される。一部の実施形態では、1つまたは複数の情報提示遺伝子は、表11のクラスター6として同定される遺伝子セットから選択される。一部の実施形態では、1つまたは複数の情報提示遺伝子は、表11のクラスター7として同定される遺伝子セットから選択される。一部の実施形態では、1つまたは複数の情報提示遺伝子は、表11のクラスター8として同定される遺伝子セットである。一部の実施形態では、1つまたは複数の情報提示遺伝子は、表11のクラスター9として同定される遺伝子セットから選択される。一部の実施形態では、1つまたは複数の情報提示遺伝子は、表11のクラスター10として同定される遺伝子セットから選択される。一部の実施形態では、1つまたは複数の情報提示遺伝子は、表11のクラスター11として同定される遺伝子セットから選択される。一部の実施形態では、情報提示遺伝子は、MYOTを含む。一部の実施形態では、クラスターから選択される遺伝子は、例えば、選択される遺伝子の発現レベルの平均、中央値、最頻値または他の要約統計量などの、単一の値に減縮される。
[0039] 一部の実施形態では、対象のための適切な診断的介入計画および/または処置計画を確立する方法、ならびに医療提供者が適切な診断的介入計画および/または処置計画を確立するのに役立つ方法を本明細書において提供する。一部の実施形態では、ルーチンの細胞または組織試料採取手法の間に対象から得られる生体試料における情報提示遺伝子の発現レベルに基づいてリスク評定を行うことを含む方法を提供する。一部の実施形態では、情報提示遺伝子の発現レベルに基づいて肺がんリスクスコアを確立することを含む方法を提供する。一部の実施形態では、適切な診断的介入計画は、少なくとも一部は肺がんリスクスコアに基づいて確立される。一部の実施形態では、医療提供者が早期の正確な診断を行うのに役立つ方法を本明細書にいて提供する。一部の実施形態では、医療提供者が患者の臨床評価の早期に適切な治療的介入を確立するのに役立つ方法を本明細書において提供する。一部の実施形態では、気管支鏡検査手法の間に得られる生体試料を評価することを含む方法を本明細書において提供する。一部の実施形態では、この方法は、医療提供者が、他の方法では情報価値のない気管支鏡検査から患者診断および/または処置に関して情報価値のある決定を行うことを可能にするので、有益である。一部の実施形態では、リスク評定は、低リスク病変のモニタリングに適した監視につながる。一部の実施形態では、リスク評定は、特定のがんのより早い診断、したがって、より早い治療につながる。
[0040] 対象が肺がん、例えば腺癌、扁平上皮癌、小細胞がんまたは非小細胞がん、を有する尤度を決定する方法を、本明細書において提供する。この方法は、単独でまたは他の方法と併用で、医療提供者に彼らが患者の診断および治療を決定するのに役立つ有用な情報を提供する。本明細書において開示する方法は、他の方法が患者の肺がん状態に関する有用な情報を提供することができなかった場合に利用されることが多い。例えば、気管支鏡検査手法のおおよそ50%は、不確定または非診断情報をもたらす。不確定結果源は多数あり、異なる医療センターで利用可能なトレーニングおよび手法に依存しうる。しかし、特定の実施形態では、気管支鏡検査と併用での分子法が、がん検出精度を向上させると予想される。
[0041] 一部の実施形態では、対象が肺がんを有する尤度を決定する方法を本明細書において提供する。一部の実施形態では、対象から得た生体試料を、肺がん状態に関係する1つまたは複数の情報提示遺伝子のcDNAレベルを測定することと対象の1つまたは複数の自己報告可能特徴に関係する1つまたは複数のゲノム相関遺伝子のcDNAレベルを測定することとを含む遺伝子発現分析に付す工程、および対象が肺がんを有する尤度を示す肺がんリスクスコアを、(a)および(b)において決定したcDNAレベルに基づいて決定する工程を含み、cDNAが生体試料からのmRNAから調製されるものである方法を提供する。
[0042] 一部の実施形態では、本開示の方法は、mRNAのcDNAへの変換を含む。さらなる実施形態では、cDNAが増幅される。
[0043] これらおよび他の態様を本明細書中でより詳細に説明し、非限定的な図および実施例によって例証する。
[0044]すべての定性AEGIS I試料のすべての遺伝子発現データのペアワイズ相関からの相関係数のプロットの非限定的な例を示す図である。相関係数<0.955の試料を異常値として同定し、さらなる分析から除外した。合計597の試料を保持した。 [0045]1セットのトレーニング試料に基づく予測モデルについてのROC曲線の非限定的な例を示す図である。 [0046]1セットの気管支鏡検査陰性トレーニング試料に基づく予測モデルについてのROC曲線の非限定的な例を示す図である。 [0047]次のカラーコーディングを示す図である:研究の組み入れ基準を満たした患者(青色)、除外された患者(黄色)、最終分析に組み入れられた患者(緑色)。 [0048]示されているAEGIS1(左)およびAEGIS2(右)コホートにおける全患者(薄い灰色)および気管支鏡検査で診断できなかった患者のサブセット(黒色)についてのROC曲線を示す図である。AEGIS1では、2群について、それぞれ、AUC=0.78(95%CI、0.73〜0.83)およびAUC=0.76(95%CI、0.68〜0.83)(p=0.31)。AEGIS2では、2群について、それぞれ、AUC=0.74(95%CI、0.68〜0.80)およびAUC=0.75(95%CI、0.68〜0.82)(p=0.85)。また、AUCは、気管支鏡検査で診断できなかった患者についてAEGIS1とAEGIS2を比較して有意差がなかった(p=0.61)。 [0049]気管支鏡検査と併用での分類子について算出した陰性分類子コール(negative classifier call)(実線;陰性尤度比を使用して調整したもの)および陽性分類子コール(positive classifier call)(点線;陽性尤度比を使用して調整したもの)に基づく検査前POMに関係づけられる検査後POMを示す図である。陰性分類子コール曲線は、検査前POMが66%未満の患者について、気管支鏡検査が陰性であり、分類子が陰性である場合、検査後POMが10%未満であることを示す。気管支鏡検査が陰性で分類子スコアが陽性である患者については、検査前尤度が5%より大きい場合、検査後がん尤度は10%より高い。 検査前尤度、および分類子と気管支鏡検査の陰性尤度比に基づく、検査後のがんを発症する確率を示す図である。検査後の肺がんを発症する確率を、診断を確定できなかった気管支鏡検査と陰性分類子スコア(陰性尤度比を使用して調整したもの)とに基づく検査前のがんを発症する確率と関連させて示す。この曲線は、検査前のがんを発症する確率が66%未満である患者について(短い縦線)、気管支鏡検査所見が陰性であり、分類子スコアが陰性である場合、検査後の確率が10%未満である(破線)ことを示す。 [0050]遺伝子とがん関連遺伝子発現のペアワイズ相関を示す図である。遺伝子とがん関連遺伝子発現のすべての可能なペア(n=232)間の相関関係を評定して、同様の遺伝子発現パターンを共有する遺伝子の群を同定した。教師なし階層的クラスタリングを使用して、相関遺伝子を11のクラスターに分類した。クラスターを確立するための樹状図閾値レベルをy軸(緑色線)上に示す。遺伝子をクラスターから簡潔に選択して、線形回帰を使用して肺がん状態を予測した。分類子遺伝子は、特定のクラスター(青色で輪郭を描いてある)から、各クラスターから2〜4遺伝子を使用して得た。クラスター4および7は、肺がんの場合にアップレギュレートされた遺伝子を含有し、クラスター1、2、9および10は、肺がんの場合にダウンレギュレートされた。 [0051]検査セットにおける気管支鏡検査で診断できなかった患者のROC曲線を示す図である。気管支鏡検査によって肺がんの診断が得られなかった患者(肺がん有病率=31%)123名について、AUC=0.81。 [0052]トレーニングセットのすべての患者に対応する遺伝子データ(黒色線)および気管支鏡検査で診断できなかった患者のサブセットに対応する遺伝子発現データ(灰色線)を、ロックされた分類子を使用して分析したことを示す図である。AUCは、2群についてそれぞれ0.78(95%CI、0.73〜0.82)および0.78(95%CI、0.71〜0.85)と算出された。 [0053]遺伝子分類子CD177によって表される核酸配列とのハイブリダイゼーションに使用した核酸プローブを示す図である。図10Aは、CD177.1の19の核酸プローブ(上から下に順番に配列番号24〜42)を開示する。 遺伝子分類子CD177によって表される核酸配列とのハイブリダイゼーションに使用した核酸プローブを示す図である。図10Bは、CD177.2の4つ核酸プローブ(上から下に順番に配列番号43〜46)を開示する。
[0054] 本明細書において開示する方法は、気管支鏡検査手法(または呼吸組織を評価するための他の手法)によって得られる細胞または組織試料を評価するための代替または補完的アプローチを提供し、この手法が患者のケアを管理するために有用な情報をもたらす尤度を増加させる。本明細書において開示する方法は高感度であり、対象が肺がんを有する尤度に関する情報を、悪性肺組織から遠い気道内の領域から得られることが多い細胞または組織試料(例えば、気道上皮細胞の気管支ブラッシング)から生じさせる。一般に、本明細書において開示する方法は、対象から得た生体試料を遺伝子発現分析に付して遺伝子発現レベルを評価することを含む。しかし、一部の実施形態では、対象が肺がんを有する尤度は、さらなる部分では、生体試料の組織学的検査の結果に基づいて、または他の診断兆候、例えば、タンパク質レベル、mRNAレベル、画像診断結果、胸部X線検査結果などを考慮することによって、決定される。
[0055] 用語「対象」は、本明細書で使用する場合、一般に哺乳動物を指す。典型的には、対象はヒトである。しかし、この用語は、他の種、例えば、ブタ、マウス、ラット、イヌ、ネコまたは他の霊長類を包含する。特定の実施形態では、対象は、実験対象、例えばマウスまたはラットである。
[0056] 対象は、男性であってもよく、または女性であってもよい。対象は、乳児であっても、幼児であっても、小児であっても、若年成人であっても、成人であっても、または高齢者であってもよい。対象は、喫煙者であってもよく、既往喫煙者であってもよく、または非喫煙者であってもよい。対象は、がんの個人歴または家族歴を有することもある。対象は、がんのない個人歴または家族歴を有することもある。対象は、肺がんまたは他の肺障害(例えば、肺気腫、COPD)の1つまたは複数の症状を示すこともある。例えば、対象は、新たなもしくは持続性咳嗽、既存の慢性咳嗽の悪化、血痰、持続性気管支炎もしくは反復呼吸器感染症、胸痛、原因不明の体重減少および/もしくは疲労、または呼吸困難、例えば息切れもしくは喘鳴を有することもある。対象は、コンピュータ支援断層撮影または胸部X線によって観察可能でありうる病変を有することもある。対象は、気管支鏡検査を受けた個体、または(例えば、検出可能な病変の存在もしくは疑わしい画像診断結果のため)気管支鏡検査の候補として同定された個体であることもある。一部の実施形態では、対象は、慢性閉塞性肺疾患(COPD)を有する、またはCOPDと診断された。一部の実施形態では、対象は、COPDを有さない、またはCOPDと診断されていない。医師または他の医療提供者のケアを受けている対象を「患者」と呼ぶこともある。
[0057] 用語「約」は、本明細書で使用する場合、「約」が修飾する目的語のプラスまたはマイナス10パーセントを指す。したがって、語「約10、20または30」は、8〜11、18〜22、27〜33をそれぞれ包含する。
情報提示遺伝子
[0058] 本開示の遺伝子の発現レベルは、対象の肺がん状態に関する有用な情報を提供すると同定された。これらの遺伝子を本明細書では「情報提示遺伝子」と呼ぶ。情報提示遺伝子は、タンパク質コード遺伝子および非タンパク質コード遺伝子を含む。情報提示遺伝子の発現レベルが、適切な遺伝子産物(例えば、mRNA、miRNA、タンパク質など)のレベルを評価することによって決定されうることは、当業者には理解されるであろう。相応じて、特定のmRNAの発現レベルは、対象の肺がん状態に関する有用な情報を提供すると同定された。これらのmRNAを本明細書では「情報提示mRNA」と呼ぶ。
[0059] 表11は、がんの場合に差次的に発現される情報提示遺伝子のリストを提供するものである。一部の実施形態では、肺がんの場合に差次的に発現される情報提示遺伝子は、BST1、CD177.1、CD177.2、ATP12A、TSPAN2、GABBR1、MCAM、NOVA1、SDC2、CDR1、CGREF1、CLND22、NKX3−1、EPHX3、LYPD2、MIA、RNF150から選択される。一部の実施形態では、肺がんの場合に差次的に発現される情報提示遺伝子は、TMEM51、CR1L、PDZKlIP1、MICAL2、VWA5A、ACAD8、SAA4、GLYATL2、ETV6、CD177、CEACAM7、QPCT、CASP10、PI3、BST1、MTNR1A、STARD4、CFB、SLC26A8、VNN2、HDAC9、SLC26A4およびLCN2から選択される。一部の実施形態では、肺がんの場合に差次的に発現される情報提示遺伝子は、CCDC18、FAM72D、NUF2、FBXO28、GPR137B、STIL、DEPDC1、TSPAN2、ASPM、KIF14、KIF20B、RAD51AP1、GAS2L3、SPIC、SMAGP、ATP12A、BRCA2、BORA、SKA3、DLGAP5、CASC5、LRRC28、PYCARD、TXNL4B、EFCAB5、SPAG5、ABCAl2、AURKA、SGOL1、BANK1、CENPE、CASP6、MAD2L1、CCNA2、CCNB1、KIF20A、CENPK、ERAP1、FAM54A、PHTF2、CLDN12、BPGM、PCMTD1、MELKおよびMST4から選択される。一部の実施形態では、肺がんの場合に差次的に発現される情報提示遺伝子は、CR1、GOS2、CSF3R、S100Al2、SELL、NCF2、LIPN、ZNF438、NAMPT、CBL、CASP5、CARD16、CARD17、CLEC4A、LRRK2、HMGN2P46、AQP9、BCL2A1、ITGAX、GPR97、CCL4、PSTPIP2、IFI30、FFAR2、EMR3、FPR1、LILRA5、PLEK、MXD1、TNFAIP6、CXCR2、IL1B、CXCR1、SIRPB1、NCF4、IRAK2、PROK2、TLR2、TREM1、SOD2、CREB5、TNFRSF10C、CSGALNACT1およびASAP 1から選択される。一部の実施形態では、肺がんの場合に差次的に発現される情報提示遺伝子は、PLA2G2A、NFYC、RASSF10、GLB1L3、TRIM3、MCAM、MSRB3、SLITRK5、GAS6、NOVA1、GABRG3、ABCA3、LPO、FSCN2、RASD1、HILS1、SDK2、NTN5、KCNA7、ATOH8、KCNIP3、INHBB、VSTM2L、ZNRF3、PLEKHG4B、GNMT、GABBR1、ARHGEF10、SDC2、CRB2、GAS1、PNPLA7およびRAI2から選択される。
[0060] 本明細書において開示する特定の方法は、少なくとも1つの情報提示遺伝子の生体試料における発現レベルを決定することを含む。しかし、一部の実施形態では、発現分析は、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、または少なくとも80の情報提示遺伝子の生体試料における発現レベルを決定することを含む。一部の実施形態では、発現分析は、1〜5、1〜10、5〜10、5〜15、10〜15、10〜20、15〜20、15〜25、20〜30、25〜50、25〜75、50〜100、50〜200またはそれより多くの情報提示遺伝子、例えば表11のもの、の生体試料における発現レベルを決定することを含む。一部の実施形態では、発現分析は、少なくとも1〜5、1〜10、2〜10、5〜10、5〜15、10〜15、10〜20、15〜20、15〜25、20〜30、25〜50、25〜75、50〜100、50〜200またはそれより多くの情報提示遺伝子、例えば表11のもの、の生体試料における発現レベルを決定することを含む。
[0061] 一部の実施形態では、発現分析のための情報提示遺伝子の数は、臨床的に有用である予測転帰信頼性レベルをもたらすために十分なものである。この信頼性レベル(例えば、予測モデルの強度)は、精度、感度、特異性、および受信者操作特性(ROC)曲線の曲線下面積(AUC)を含むがこれらに限定されない様々な性能パラメータによって、評定することができるだろう。特徴事項(例えば、遺伝子数、mRNA)の数を変えてこれらのパラメータを評定して、情報提示遺伝子の最適な数およびセットを決定することができるだろう。単独で使用したときまたは他の情報と併用したときに少なくとも60%、70%、80%、90%の精度、感度または特異性は有用でありうる。
[0062] いずれの適切なシステムまたは方法を情報提示遺伝子の発現レベルの決定に使用してもよい。ハイブリダイゼーションベースのアッセイの使用によって遺伝子発現レベルを決定してもよい。本明細書で使用する場合、用語「ハイブリダイゼーションベースのアッセイ」は、核酸ハイブリダイゼーションを含むあらゆるアッセイを指す。ハイブリダイゼーションベースのアッセイは、核酸の増幅を含むこともあり、含まないこともある。ハイブリダイゼーションベースのアッセイは当技術分野において周知であり、アレイベースのアッセイ(例えば、オリゴヌクレオチドアレイ、マイクロアレイ)、オリゴヌクレオチドがコンジュゲートされたビーズアッセイ(例えば、Multiplex Bead-based Luminex(登録商標)アッセイ)、分子反転プローブアッセイ、および定量的RT−PCRアッセイを含むが、これらに限定されない。多重システム、例えば、オリゴヌクレオチドアレイまたはビーズベースの核酸アッセイシステムは、複数の遺伝子のレベルの同時評価に特に有用である。核酸レベルを決定するための他の適切な方法は、当業者には明らかであるだろう。
[0063] 本明細書で使用する場合、「レベル」は、物質、例えばmRNA、の量または出現率を示す値を指す。レベルは、絶対値、例えば、試料中のmRNAの量であることもあり、または相対値、例えば、基準試料(対照試料)中のmRNAの量に対する試料中のmRNA量であることもある。レベルは、物質の存在または不在を示す二進値であることもある。例えば、試料中の物質の量の測定値、例えば、PCR反応またはマイクロアレイからの蛍光測定値がバックグラウンド値を超える場合、その物質は、その試料中に存在すると同定されうる。同様に、試料中の分子の量の測定値がバックグラウンド値であるまたはバックグラウンド値未満である場合、その物質は、その試料に不在である(またはその試料中で検出不能である)と同定されうる。物質のレベルが直接決定されることもあり、または間接的に決定されることもあることは、理解されるはずである。
[0064] 情報提示mRNAのさらなる非限定的な例は、例えば、以下の特許出願に開示されており、これらの特許出願の内容はそれら全体があらゆる目的で参照により本明細書に組み入れられている:発明の名称ISOLATION OF NUCLEIC ACID FROM MOUTH EPITHELIAL CELLSで2006年5月12日に出願された米国特許出願公開第2007/148650号、発明の名称ISOLATION OF NUCLEIC ACID FROM MOUTH EPITHELIAL CELLSで2009年1月9日に出願された米国特許出願公開第2009/311692号、発明の名称ISOLATION OF NUCLEIC ACID FROM MOUTH EPITHELIAL CELLSで2010年9月17日に出願された米国特許出願第12/884,714号、発明の名称DETECTION METHODS FOR DISORDER OF THE LUNGで2005年12月6日に出願された米国特許出願公開第2006/154278号、発明の名称DIAGNOSTIC FOR LUNG DISORDERS USING CLASS PREDICTIONで2008年2月8日に出願された米国特許出願公開第2010/035244号、発明の名称DIAGNOSTIC FOR LUNG DISORDERS USING CLASS PREDICTIONで2010年8月26日に出願された米国出願第12/869,525号、発明の名称BIOMARKERS FOR SMOKE EXPOSUREで2008年9月19日に出願された米国特許出願第12/234,368号、発明の名称BIOMARKERS FOR SMOKE EXPOSUREで2010年10月154日に出願された米国特許出願第12/905,897号、発明の名称IDENTIFICATION OF NOVEL PATHWAYS FOR DRUG DEVELOPMENT FOR LUNG DISEASEで2008年9月19日に出願された米国特許出願公開第2009/186951号、発明の名称DIAGNOSTIC AND PROGNOSTIC METHODS FOR LUNG DISORDERS USING GENE EXPRESSION PROFILESで2008年9月9日に出願された米国特許出願公開第2009/061454号、発明の名称DIAGNOSTIC AND PROGNOSTIC METHODS FOR LUNG DISORDERS USING GENE EXPRESSION PROFILESで2010年11月5日に出願された米国特許出願第12/940,840号、発明の名称MULTIFACTORIAL METHODS FOR DETECTING LUNG DISORDERSで2009年3月30日に出願された米国特許出願公開第2010/055689号、および発明の名称METHODS FOR EVALUATING LUNG CANCER STATUSで2013年4月26日に出願された国際公開出願第PCT/US13/38449号。
cDNA
[0065] cDNA分子は、当業者によってmRNA分子から合成される天然に存在しないポリヌクレオチド配列である。一部の実施形態では、本発明のcDNA分子は、得られるまたは獲得される。逆転写酵素を利用するRNAのcDNAの変換は、イントロンを欠く天然に存在しない分子であるcDNAを生じさせる。cDNAに頼る方法は、自然界に天然に存在しない人工分子に必然的に依存し、例えば、cDNA分子のタンパク質発現、またはcDNA分子のハイブリダイゼーションである。
[0066] 特定の態様では、生体試料中のmRNAを使用して、少なくとも1つのプライマーを使用するmRNAの逆転写によって試料からcDNAを生成し、その中のcDNAを増幅するためのセンスおよびアンチセンスプライマーとしてポリヌクレオチドを使用してcDNAを増幅し、増幅されたcDNAの存在を検出する。さらなる態様では、増幅されたcDNAの配列を任意の好適な方法によって決定することができる。
[0067] 一実施形態では、mRNAは、試料から得られると、相補DNA(cDNA)に変換される。cDNAはインビボで存在せず、したがって非天然分子である。さらなる実施形態では、次いで、cDNAは、例えば、ポリメラーゼ連鎖反応(PCR)または当業者に公知の他の増幅方法によって増幅される。この増幅反応の産物、すなわち増幅cDNAは、必ずしも非天然産物とは限らない。上で述べたように、cDNAは、非天然分子である。次に、PCRの場合、増幅プロセスは、出発原料の個々のcDNA分子ごとに何億ものcDNAコピーを生じさせるのに役立つ。生成されるコピーの数は、インビボで存在するmRNAのコピーの数とはかけ離れている。
[0068] 一実施形態では、cDNAは、追加のDNA配列(アダプター配列)を(アダプター特異的プライマーを使用して)断片上に導入するプライマーを使用して増幅される。したがって、増幅は、既に非天然のcDNA上にバーコード、アダプターおよび/またはレポーター配列を導入することによって非天然一本鎖cDNAから非天然二本鎖分子を生じさせるのに役立つ。一実施形態では、アダプター特異的プライマーでの増幅中に、検出可能な標識、例えばフルオロフォア、が一本鎖cDNA分子に付加される。したがって、増幅は、少なくとも(i)cDNAがインビボで存在しない、(i)アダプター配列がcDNA分子の末端に付加されて、インビボで存在しないDNA配列を作る、(ii)増幅に関連するエラー率が、インビボで存在しないDNA配列をさらに生じさせる、(iii)自然界に存在するものと比較して全く異なるcDNA分子構造、および(iv)検出可能な標識のcDNA分子への化学的付加のため、自然界に存在しないDNA複合体を生じさせるのにも役立つ。
[0069] 一実施形態では、合成cDNA(例えば、増幅cDNA)は、プローブとのハイブリダイゼーションによって、例えばマイクロアレイによって、固体表面に固定化されている。別の実施形態では、cDNA産物は、リアルタイムポリメラーゼ連鎖反応(PCR)により、cDNA産物とハイブリダイズする蛍光プローブの導入によって検出される。例えば、一実施形態では、バイオマーカー検出は、(例えば、TaqMan(登録商標)プローブを用いる)定量的蛍光発生RT−PCRによって評定される。PCR分析については、分析に使用するためのプライマー配列の決定に当技術分野において周知の方法を利用できる。
[0070] 一実施形態では、cDNAを合成し、増幅するために、5’Ampli FINDER RACEキット(Clontechによって製造されているもの)、およびPCRを使用する5’RACE法(Frohman, M.A. et al., Proc.Natl.Acad.Sci.USA (1988) 85:8998-9002; Belyaysky, A. et al., Nucleic Acids Research.(1989) 17:2919-2932)を使用することができる。そのようなcDNA合成プロセスでは、制限酵素部位をcDNAの両末端に導入することができる。
ゲノム相関物
[0071] 本明細書において開示するように、特定の遺伝子の発現レベルは、対象の特定の自己報告可能な特徴に関係する(対象の特定の自己報告可能な特徴と相関関係がある)と同定された。そのような遺伝子を本明細書では「ゲノム相関遺伝子」または「ゲノム相関物」と呼び、そのような遺伝子は、そうでなければ誤っておよび/または不正確に報告されることがある対象の特徴の代替マーカーとなるので、有用である。例えば、一部の実施形態では、対象は、パック年、喫煙状態または年齢などの情報を(例えば、そのような情報を過小評価することによって)誤って推定することがある。そのような実施形態において、ゲノム相関遺伝子に基づく予測モデルの使用は、誤った報告に関連する変動性を低減または除去することができる。なぜなら、このモデルは、何を報告するかについての対象の決定および/または状況についての対象の記憶ではなく、ゲノム相関遺伝子の発現に基づくからである。そのようなゲノム相関遺伝子の発現レベルが、適切な遺伝子産物(例えば、mRNA、miRNA、タンパク質など)のレベルを評価することによって決定されうることは、当業者には理解されるであろう。ゲノム相関遺伝子の発現レベルは、肺がん状態の情報提示遺伝子(例えば、表11から選択される情報提示遺伝子)と平行して、またはそのような遺伝子とは無関係に決定することができるだろう。
[0072] 一部の実施形態では、ゲノム相関物は、環境ハザード(例えば、たばこの煙)に対する個体の応答を反映する。一部の実施形態では、ゲノム相関物は、ハザードへの曝露を反映する。
[0073] 一部の実施形態では、対象の性別が1つまたは複数のゲノム相関遺伝子に基づいて決定される。一部の実施形態では、性別に関係するゲノム相関遺伝子は、RPS4Y1である。一部の実施形態では、RPS4Y1の発現が閾値より下である場合にはその対象は男性と同定され、RPS4Y1の発現が閾値より上である場合、その対象を女性と同定される。一部の実施形態では、閾値は、目的の遺伝子について男性と女性を正確に区別する相対発現レベルである。
[0074] 一部の実施形態では、対象の喫煙状態(例えば現行または既往)が1つまたは複数のゲノム相関遺伝子に基づいて決定される。一部の実施形態では、喫煙状態に関係するゲノム相関遺伝子は、SLC7A11、CLND10またはTKTである。一部の実施形態では、対象の喫煙状態は、次のモデルに従って決定される:喫煙状態(ゲノム喫煙(GS)とも呼ぶ)=exp(x)/(1+exp(x))(式中、

この式中、

は、この回帰モデルの回帰重みであり、遺伝子記号は、それぞれの遺伝子各々の相対発現強度を表す)。一部の実施形態では、喫煙者は、人生でたばこを少なくとも100本喫煙した対象である。一部の実施形態では、既往喫煙者は、禁煙しているまたは気管支鏡検査前1カ月以内に喫煙していない対象である。
[0075] 一部の実施形態では、対象の喫煙歴が1つまたは複数のゲノム相関遺伝子に基づいて決定される。一部の実施形態では、喫煙歴に関係するゲノム相関遺伝子は、AKR1C2またはRUNX1T1である。一部の実施形態では、対象の喫煙歴は、次のモデルに従って決定される:喫煙歴(ゲノムパック年(GPY)とも呼ぶ)=exp(x)/(1+exp(x))(式中、

この式中、

は、このモデルの回帰重みであり、遺伝子記号は、それぞれの遺伝子各々の相対発現強度を表す)。
[0076] 一部の実施形態では、対象の年齢が1つまたは複数のゲノム相関遺伝子に基づいて決定される。一部の実施形態では、年齢に関係するゲノム相関遺伝子は、CD52、SYT8、TNNT3、ALX1 、KLRK1、RASA3、CERS3、ASPA、GRP、APOC1、EPHX3、REEP1、FAM198B、PCDHB4、PCDHB16、FOXD1、SPARC、NKAPLまたはGPR110である。一部の実施形態では、対象の年齢は、次のモデルに従って決定される:年齢(ゲノム年齢(GA)とも呼ぶ)=

(式中、

は、このモデルの回帰重みであり、遺伝子記号は、それぞれの遺伝子各々の相対発現強度を表す)。
生体試料
[0077] この方法は、一般に、対象から生体試料を得ることを含む。本明細書で使用する場合、語「生体試料を得ること」は、対象から生体試料を直接または間接的に獲得するためのあらゆるプロセスを指す。例えば、生体組織は、(例えば、ポイントオブケア施設、診療所、病院で)対象から組織または液体試料を入手することによって得られることがある。あるいは、生体試料は、対象から試料を直接入手した1名または複数の人物から(例えば、実験室施設で)試料を受け取ることによって得られることもある。
[0078] 用語「生体試料」は、対象、例えば患者、に由来する試料を指す。生体試料は、通常、組織、細胞および/または生体分子を含む。一部の実施形態では、生体試料は、例えば、内視鏡、例えば気管支鏡検査、によって決定して、それが組織学的に正常であることに基づいて得られる。一部の実施形態では、生体試料は、がん性細胞を含有する疑いのない領域、例えば気管支または他の区域もしくは領域から得られる。一部の実施形態では、組織学的または細胞学的検査が実施される。しかし、組織学的または細胞学的検査が任意選択でありうることは理解されるはずである。一部の実施形態では、生体試料は、呼吸上皮の試料である。呼吸上皮は、対象の口、鼻、咽頭、気管、気管支、細気管支または肺胞のものでありうる。生体試料は、気管支の上皮を含むことがある。一部の実施形態では、例えば標準的な組織学的または細胞学的方法によって決定して、生体試料には検出可能ながん細胞がない。一部の実施形態では、組織学的に正常な試料が評価のために得られる。多くの場合、生体試料は、擦過またはブラッシング、例えば気管支ブラッシングによって得られる。しかし、例えばブラッシング、擦過、気管支肺胞洗浄、気管支生検または経気管支針穿刺吸引を含む、他の手法を使用してもよいことは、理解されるはずである。
[0079] 発現レベルの決定を助長するために適切ないずれの手法で生体分子を処理してもよいことを理解されたい。例えば、生化学的、機械的および/または熱的処理方法を適切に使用して、生体分子から目的の生体分子、例えばRNAを単離することができるだろ。したがって、RNAまたは他の分子は、当技術分野において周知の方法を使用して試料を処理することによって生体分子から単離することができるだろう。
肺がん評定
[0080] 本明細書において開示する方法は、情報提示遺伝子の発現レベルを1つまたは複数の適切な基準と比較することを含む。「適切な基準」は、既知肺がん状態を示す特定の情報提示遺伝子の発現レベル(または発現レベルの範囲)である。適切な基準は、この方法の実施者によって実験的に決定されることもあり、または既存の値もしくは値の範囲であることもある。適切な基準は、肺がんを示す発現レベル(または発現レベルの範囲)を表す。例えば、適切な基準は、肺がんを有することが分かっている対象から得た基準(対照)生体試料における情報提示遺伝子の発現レベルの代表であることもある。適切な基準が肺がんを示す場合、肺がんの特徴づけまたは診断を必要とする対象から決定された発現レベルとその適切な基準との検出可能な差の欠如(例えば、統計的有意差の欠如)は、対象の肺がんを示すことができるだろう。適切な基準が肺がんを示す場合、肺がんの特徴づけまたは診断を必要とする対象から決定された発現レベルとその適切な基準との差は、肺がんのない患者を示すことができるだろう。
[0081] あるいは、適切な基準は、肺がんのない対象を示す遺伝子の発現レベル(または発現レベルの範囲)であることもある。例えば、適切な基準は、肺がんがないことが分かっている対象から得た基準(対照)生体試料における特定の情報提示遺伝子の発現レベルの代表であることもある。適切な基準が肺がんのない対象を示す場合、肺がんの診断を必要とする対象から決定された発現レベルとその記適切な基準との差は、対象の肺がんを示すことができるだろう。あるいは、適切な基準が肺がんのない対象を示す場合、肺がんの診断を必要とする対象から決定された発現レベルとその適切な基準との検出可能な差の欠如(例えば、統計的有意差の欠如)は、肺がんのない対象を示すことができるだろう。
[0082] 一部の実施形態では、基準標準値は、変化の閾値レベルとなり、したがって、試料における遺伝子の発現レベルが変化(特定のバイオマーカーに依存する増加または減少)の閾値レベルの範囲内である場合には対象は肺がんがないと同定されるが、レベルが閾値レベルより上である場合には対象は肺がんを有するリスクがあると同定される。
[0083] 一部の実施形態では、この方法は、情報提示遺伝子の発現レベルと、肺がんを有さないと同定される対照対象における情報提示遺伝子の発現レベルを表す基準標準値とを比較することを含む。この基準標準値は、例えば、肺がんを有さないと同定される対照対象の集団における情報提示遺伝子の平均発現レベルであることもある。
[0084] 発現レベルと適切な基準との統計的に有意である差の大きさは、様々でありうる。例えば、生体試料における情報提示遺伝子の発現レベルが、その遺伝子の適切な基準より少なくとも1%、少なくとも5%、少なくとも10%、少なくとも25%、少なくとも50%、少なくとも100%、少なくとも250%、少なくとも500%、または少なくとも1000%高いまたは低い場合、肺がんを示す有意差を検出することができるだろう。同様に、生体試料における情報提示遺伝子の発現レベルが、その遺伝子の適切な基準より少なくとも1.1倍、1.2倍、1.5倍、2倍、少なくとも3倍、少なくとも4倍、少なくとも5倍、少なくとも6倍、少なくとも7倍、少なくとも8倍、少なくとも9倍、少なくとも10倍、少なくとも20倍、少なくとも30倍、少なくとも40倍、少なくとも50倍、少なくとも100倍、またはそれを超えて高いまたは低い場合、有意差を検出することができるだろう。一部の実施形態では、情報提示遺伝子と適切な基準との発現の少なくとも20%〜50%の差は有意である。有意差は、適切な統計検定を使用することによって同定することができるだろう。統計的有意性の検定は当技術分野において周知であり、Petruccelli、ChenおよびNandramによるApplied Statistics for Engineers and Scientists、1999年復刻版に例示されている。
[0085] 複数の発現レベルを複数の適切な基準レベルと例えば遺伝子ごとに比較して対象の肺がん状態を評定することができるだろうことを理解されたい。この比較は、ベクトル差として行われることもある。そのような場合、多変量検定、例えばホテリングT2検定を使用して、観察された差の有意性を評価することができるだろう。そのような多変量検定は当技術分野において周知であり、Richard Arnold JohnsonおよびDean W. Wichern Prentice HallによるApplied Multivariate Statistical Analysis、第6版(2007年4月2日)に例示されている。
分類方法
[0086] この方法は、対象から得た生体試料における情報提示遺伝子の発現レベル(発現パターンまたはプロファイルとも呼ぶ)のセットと、基準レベル(基準パターンとも呼ぶ)の複数のセットであって、各基準パターンが既知肺がん状態と関連しているものである複数のセットと比較する工程、発現パターンと最も酷似している基準パターンを同定する工程、および基準パターンの既知肺がん状態を発現パターンと関連づけることによって対象の肺がん状態を分類する(特徴づける)工程を含むこともある。
[0087] この方法は、対象の病態を分類するために使用することできる予測モデルを構築または作成することを含むこともあり、予測モデルを分類子または予測子と呼ぶことがある。本明細書で使用する場合、「肺がん分類子」は、対象から得た生体試料で決定された発現レベルに基づいて対象の肺がん状態を特徴づける予測モデルである。典型的に、このモデルは、分類(肺がん状態)が既に突き止められている試料を使用して構築される。このモデル(分類子)を構築したら、その後、肺がん状態が分かっていない対象の生体試料から得た発現レベルにそれを当てはめて、対象の肺がん状態を予測することができるだろう。したがって、この方法は、肺がん分類子を発現レベルに当てはめ、その結果、肺がん分類子によって発現レベルに基づいて対象の肺がん状態が特徴づけられる工程を含むことがある。対象は、予測された肺がん状態に基づいて、例えば医療提供者よって、さらに処置または評価されることがある。
[0088] この分類方法は、発現レベルを、対象が肺がんを有する尤度を示す肺がんリスクスコアに変換する工程を含むことがある。例えば線形判別分類子を使用する場合などの一部の実施形態では、肺がんリスクスコアは、発現レベルが肺がんを有する尤度増加の予測に対するそれらの相対的寄与によって重み付けされる重み付き発現レベルの組合せ(例えば、合計、積、または他の組合せ)として得られることもある。
[0089] 当技術分野において公知の様々な予測モデルが肺がん分類子として使用されうることは、理解されるはずである。例えば、肺がん分類子は、ロジスティック回帰、部分最小二乗法、線形判別分析、二次判別分析、ニューラルネットワーク、単純ベイズ、C4.5決定木、k最近傍法、ランダムフォレスト、サポートベクターマシンまたは他の適切な方法から選択されるアルゴリズムを含みうる。
[0090] 肺がんを有すると同定された複数の対象から得た生体試料における複数の情報提示遺伝子の発現レベルを含むデータセットを用いて肺がん分類子をトレーニングすることができるだろう。例えば、組織学的所見に基づいて肺がんを有すると同定された複数の対象から得た生体試料における複数の情報提示遺伝子の発現レベルを含むデータセットを用いて肺がん分類子をトレーニングすることができるだろう。トレーニングセットは、肺がんを有さないと同定された対照対象も通常は含むことになる。当業者には理解されるであろうが、トレーニングデータセットの対象集団は、設計によって様々な特徴を有することがあり、例えば、集団の特徴は、分類子を使用する診断方法が有用でありうる対象の特徴に依存しうる。例えば、集団は、すべて男性からなることもあり、すべて女性からなることもあり、または男性と女性の両方からなることもある。集団は、がん歴を有する対象からなることもあり、がん歴を有さない対象からなることもあり、両方のカテゴリーからの対象からなることもある。集団は、喫煙者、既往喫煙者、および/または非喫煙者である対象を含むことがある。
[0091] クラス予測強度を測定して、そのモデルが生体試料を分類する信頼度を決定することもできる。この信頼度は、対象がそのモデルによって予測された特定のクラスのものである尤度の推定値として役立つことができるだろう。
[0092] したがって、予測強度は、試料の分類の信頼度を伝え、どのような場合に試料を分類することができないかを評価する。試料を検査しても、試料が特定のクラスに属さない、または試料を特定のクラスに確実に割り当てることができない場合がありうる。これは、例えば、決定された閾値より上もしくは下、または特定の範囲内のスコアを得た試料が、分類できない試料(例えば「ノーコール」)である場合、閾値または範囲を利用することによって果たすことができるだろう。
[0093] モデルを構築したら、当技術分野において公知の方法を使用してモデルの妥当性を検査することができる。モデルの妥当性を検査するための1つの方法は、データセットの交差検証によるものである。交差検証を実施するために、試料の1つまたはサブセットを除去し、除去された試料なしで、上で説明したようにモデルを構築して「交差検証モデル」を作る。その場合、除去された試料は、本明細書に記載のモデルによって分類される。このプロセスを初期データセットのすべての試料またはサブセットで行い、エラー率を決定する。その後、モデルの精度を評定する。このモデルは、検査される試料を、既知であるクラスまたは以前に突き止められたクラスに、高い精度で分類する。モデルを検証するもう1つの方法は、そのモデルを独立したデータセット、例えば、肺がん状態が分かっていない新たな生体試料に当てはめることである。
[0094] 当業者には理解されるであろうが、モデルの強度は、精度、感度および特異性を含むがこれらに限定されない様々なパラメータによって評定することができるだろう。精度、感度および特異性をコンピュータ処理するための方法は当技術分野において公知であり、本明細書に記載されている(例えば、実施例を参照されたい)。肺がん分類子は、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%の、またはそれより高い精度を有することができるだろう。肺がん分類子は、約60%〜70%、70%〜80%、80%〜90%、または90%〜100%の範囲の精度を有することができるだろう。肺がん分類子は、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%の、またはそれより高い感度を有することができるだろう。肺がん分類子は、約60%〜70%、70%〜80%、80%〜90%、または90%〜100%の範囲の感度を有することができるだろう。肺がん分類子は、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも99%の、またはそれより高い特異性を有することができるだろう。肺がん分類子は、約60%〜70%、70%〜80%、80%〜90%、または90%〜100%の範囲の特異性を有することができるだろう。
[0095] 陰性的中率(NPV)は、使用企図集団内の肺がんの除外について40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%または99%より高いことがある。
[0096] 使用企図集団は、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%もしくは99%の、がん有病率を有することがある。
臨床的処置/管理
[0097] 特定の態様では、対象の処置コースを決定する方法を提供する。この方法は、対象から得た生体試料における1つまたは複数の情報提示遺伝子の発現レベルを決定する工程、および発現レベルに基づいて対象の処置コースを決定する工程を概して含む。多くの場合、処置コースは、発現レベルから導出される肺がんリスクスコアに基づいて決定される。対象が肺がんを有する尤度が相対的に高いことを示す肺がんリスクスコアに基づいて、この対象は肺がん治療の候補として同定されることもある。対象が肺がんを有する尤度が相対的に高い(例えば、60%より高い、70%より高い、80%より高い、90%より高い)ことを示す肺がんリスクスコアに基づいて、この対象は肺の侵襲的手法(例えば、経胸壁針穿刺吸引、縦隔鏡検査、または開胸術)の候補として同定されることもある。対象が肺がんを有する尤度が相対的に低い(例えば、50%より低い、40%より低い、30%より低い、20%より低い)ことを示す肺がんリスクスコアに基づいて、この対象は肺がん治療または肺の侵襲的手法の候補でないと同定されることもある。場合によっては、中等度リスクスコアが得られ、対象は、高リスクカテゴリーに入るとも低リスクカテゴリーに入るとも示されない。一部の実施形態では、医療提供者は、「慎重な経過観察」に従事し、より後の一時点または複数の時点で採取される生体試料に関して分析を繰り返すこともあり、または肺がんを除外するためにさらなる診断手法に着手することもあり、またはがんが存在する決定を、リスク決定を行った直後に行うこともある。特定の例では、対象は、気管支鏡検査で診断できないため中等度リスクと同定され、本明細書における方法を使用する、患者のがんリスクが低いという決定に従って、非侵襲的モニタリング(例えばCT監視)に再び割り当てられる。別の特定の例では、本明細書に記載するようにアッセイした試料を使用することができるだろう。この方法は、遺伝子発現分析の結果を要約するレポートの作成も含むことがある。通常、レポートは、肺がんリスクスコアの表示も含むだろう。
コンピュータ実装方法
[0098] 本明細書において開示する方法を、非常に多数の仕方のいずれで実行してもよい。例えば、特定の実施形態は、ハードウェア、ソフトウェアまたはこれらの組合せを使用して実行することができるだろう。ソフトウェアに実装した場合、単一のコンピュータによって提供されるか複数のコンピュータ間で分散されるかにかかわらずソフトウェアコードを任意の好適なプロセッサまたは一連のプロセッサで実行することができる。そのようなプロセッサを、集積回路として、1つの集積回路部品に1つまたは複数のプロセッサを有するように実装することができるだろう。しかし、いずれの好適な形式の回路網を使用してプロセッサを実行してもよい。
[0099] さらに、コンピュータが、ラックマウント型コンピュータ、デスクトップコンピュータ、ラップトップコンピュータまたはタブレットコンピュータなどの多数の形態のいずれでも具体化されうることは、理解されるはずである。加えて、コンピュータは、携帯情報端末(PDA)、スマートフォン、または任意の他の好適な携帯もしくは固定型電子デバイスを含む、好適な処理能力を有するが一般にコンピュータとはみなされないデバイスに埋め込まれることもある。
[00100] また、コンピュータは、1つまたは複数の入力および出力デバイスを備えていることもある。これらのデバイスを、数ある中でも、ユーザーインターフェースの提示に使用することができる。ユーザーインターフェースを提供するために使用することができる出力デバイスの例としては、出力の視覚的表示のためのプリンターまたはディスプレイスクリーン、および出力の可聴表示のためのスピーカーまたは他の音響発生デバイスが挙げられる。ユーザーインターフェースに使用することができる入力デバイスの例としては、キーボード、ならびにポインティングデバイス、例えばマウス、タッチパッド、およびデジタイズ用タブレットが挙げられる。もう1つの例として、コンピュータは、音声認識によってまたは他の可聴形式で入力情報を受信することができるだろう。
[00101] そのようなコンピュータは、ローカルエリアネットワークまたはワイドエリアネットワーク、例えばエンタープライズネットワークもしくはインターネット、のような形態を含む、任意の好適な形態の1つまたは複数のネットワークによって相互接続することができるだろう。そのようなネットワークは、いずれの好適な技術に基づくものであってもよく、いずれの好適なプロトコルに従って操作してもよく、および無線ネットワーク、有線ネットワークまたは光ファイバーネットワークを含みうる。
[00102] また、本明細書で概要を述べる様々な方法またはプロセスは、様々なオペレーティングシステムまたはプラットフォームのいずれか1つを利用する1つまたは複数のプロセッサで実行可能であるソフトウェアとしてコード化することができるだろう。加えて、そのようなソフトウェアは、多数の好適なプログラミング言語および/またはプログラミングもしくはスクリプト作成ツールのいずれかを使用して書くことができ、フレームワークまたはバーチャルマシンで実行される実行可能な機械語コードまたは中間コードとしてコンパイルすることもできるだろう。
[00103] これに関して、本開示の態様は、1つまたは複数のコンピュータまたは他のプロセッサで実行されたときに上で論じた開示の様々な実施形態を実行する方法を実施する1つまたは複数のプログラムがエンコードされた1つのコンピュータ可読媒体(または複数のコンピュータ可読媒体(例えば、コンピュータメモリ、1つもしくは複数のフロッピーディスク、コンパクトディスク(CD)、光ディスク、デジタルビデオディスク(DVD)、磁気テープ、フラッシュメモリ、フィールドプログラマブルゲートアレイもしくは他の半導体デバイスにおける回路構成、または他の非一過性、有形コンピュータ記憶媒体)として具体化することができるだろう。1つまたは複数のコンピュータ可読媒体は、トランスポート可能でありうるので、そこに記憶されている1つまたは複数のプログラムを1つまたは複数の異なるコンピュータまたは他のプロセッサにロードして、上で論じたような本開示の様々な態様を実行することができる。本明細書で使用する場合、用語「非一過性コンピュータ可読記憶媒体」は、製品(すなわち製造品)またはマシンであるとみなすことができるコンピュータ可読媒体のみを包含する。
[00104] 用語「プログラム」または「ソフトウェア」は、一般的な意味で、上で論じたような本開示の様々な態様を実行するようにコンピュータまたは他のプロセッサをプラグラムするために利用することができる任意のタイプのコンピュータコードまたはコンピュータ実行可能命令のセットを指すように、本明細書では使用している。加えて、この実施形態の一態様によると、実行されたときに本開示の方法を実施する1つまたは複数のコンピュータプログラムは、単一のコンピュータまたはプロセッサ上に存在する必要はなく、そのようなコンピュータプログラムを多数の異なるコンピュータまたはプロセッサの間で、モジュラー形式で分散させて本開示の様々な態様を実行することができるだろうということは、理解されるはずである。
[00105] 本明細書で使用する場合、用語「データベース」は、検索および読み出しが容易で速くなるように整理されたデータの集まりを一般に指す。さらに、データベースは、通常、論理データ構造と物理データ構造を含む。本明細書に記載する方法が、関係データベース、オブジェクト関係データベースおよびXMLベースのデータベース(ここで、XMLは「拡張可能マークアップ言語(eXtensible-Markup-Language)」を表す)を含む任意のタイプのデータベースと併用されうることは、当業者には理解されるであろう。例えば、遺伝子発現情報をデータベースに記憶させ、データベースから読み出すことができるだろう。遺伝子発現情報を様々な他の関連情報(例えば、医師が処置プロトコルを確立するおよび/もしくは診断決定を行うのに役立つレポートもしくは文書の作成に適切である情報、または患者試料の追跡に役立つ情報)と関係づけるような様式で遺伝子発現情報を記憶させること、またはそのような様式で遺伝子情報にインデクスを付けることができるだろう。そのような関連情報としては、例えば、患者識別情報、注文医師識別情報、注文診療所に関する情報(例えば、住所、電話番号)、生体試料の起源に関する情報(例えば、組織型、試料採取日)、生体試料処理情報、試料品質管理情報、生体試料保存情報、遺伝子アノテーション情報、肺がんリスク分類子情報、肺がんリスク因子情報、支払情報、注文日情報などを挙げることができるだろう。
[00106] コンピュータ実行可能命令は、1つまたは複数のコンピュータまたは他のデバイスによって実行される多くの形態、例えばプログラムモジュールでありうる。一般に、プログラムモジュールは、特定のタスクを実施するまたは特定の抽象データ型を実行する、ルーチン、プログラム、オブジェクト、コンポーネント、データ構造などを含む。通常、プログラムモジュールの機能性を様々な実施形態で所望通りに組み合わせるまたは分配することができるだろう。
[00107] 本開示の一部の態様では、ゲノム情報を処理するためのコンピュータ実装方法を提供する。この方法は、一般に、1つまたは複数の情報提示遺伝子の生体試料における発現レベルを表すデータを得る工程、および対象が肺がんを有する尤度を、発現レベルに少なくとも一部は基づいて決定する工程を含む。本明細書において開示する統計または分類方法のいずれも、コンピュータ実装方法に組み込むことができるだろう。一部の実施形態では、この方法は、対象が肺がんを有する尤度を示すリスクスコアを算出する工程を含む。リスクスコアの算出は、発現レベルが肺がんを有する尤度増加の予測に対するそれらの相対的寄与によって重み付けされる重み付き発現レベルの組合せ(例えば、合計、積、または他の組合せ)の決定を含むことがある。コンピュータ実装方法は、リスクスコアを指定することなどによって遺伝子発現分析の結果を要約するレポートを作成する工程も含むことがある。そのような方法は、対象の医療提供者にレポートを送信する工程も含むことがある。
Affymetrixアレイ
[00108] 一部の態様では、Affymetrix Human Gene 1.0 STアレイ(Affymetrixカタログ番号901087)を使用して、生体試料中のmRNAまたはcDNAを同定する。Affymetrix Human Gene 1.0 STアレイは、www.affymetrix.com/site/include/byproduct.affx?product=hugene−1_0−st−v1において開示されている非常に多くのプローブを利用する。単一の遺伝子の複数のセグメントに対応する複数のプローブが存在するのではなく、1プローブの遺伝子に対する比が1:1でないと言うことができる特異的遺伝子のセグメントに対応する複数のプローブが存在する。一例では、LYPD2遺伝子は、Human Gene 1.0 STアレイ(リリース32)における3つのプローブセット、Affymetrix Human Gene 1.0 STアレイ(HuGene-1_0-st-v1 Probeset Annotations)において開示されているプローブセットID8153343、8153344および8153345、によって表される。アレイの好適な例示的ビルドとしては、リリース32(2011年9月30日)、リリース33(2013年3月27日)、リリース34(2014年4月7日)、(2015年4月15日)のリリース35、およびリリース36が挙げられる。さらなるリリースを含む追加のリリースを使用してもよい。プローブセットおよび核酸配列の相関関係を示す情報は、www.affymetrix.com/site/include/byproduct.affx?product=hugene−1_0−st−v1を含む、Affymetrix.comにおいて見つけることができる。さらに、データセットは、www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GPL6244における、本開示の方法の実施に利用することができるだろうプローブおよび遺伝子を列挙しているNCBI Gene Expession OmnibusウェブサイトのPlatform GPL6244で入手可能である。プローブセットおよび遺伝子記号の相関関係を示すものを含むこれらの文書は、参照により本明細書に組み込まれている。
組成物およびキット
[00109] 一部の態様では、情報提示遺伝子の発現レベルの決定に有用である組成物および関連方法を提供する。例えば、情報提示遺伝子とまたは情報提示遺伝子に相補的な配列を有する核酸と特異的にハイブリダイズする核酸プローブから本質的になる組成物を提供する。組成物は、対照遺伝子またはそれに相補的な核酸と特異的にハイブリダイズするプローブも含むことがある。組成物は、適切な緩衝剤、塩または検出試薬も含むことがある。核酸プローブは、固体支持体(例えば、ガラス、プラスチックもしくはシリコンチップ)またはビーズ(例えば、磁性ビーズ)に直接または間接的に固定されていることもある。核酸プローブは、ビーズベースの核酸検出アッセイで使用するために注文生産されることもある。
[00110] 一部の実施形態では、5以下、10以下、25以下、50以下、100以下または200以下の核酸プローブを含む組成物を提供する。場合によっては、核酸プローブの各々は、表11から選択されるmRNAと、またはmRNAに相補的な配列を有する核酸と、特異的にハイブリダイズする。一部の実施形態では、情報提示mRNAを検出するプローブも含まれる。場合によっては、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、または少なくとも20の核酸プローブの各々が、表11から選択されるmRNAと、またはこのmRNAに相補的な配列を有する核酸と、特異的にハイブリダイズする。一部の実施形態では、組成物は、生化学的に別の反応で異なる遺伝子を検出するために、または同じ生化学的反応で複数の遺伝子を検出するために調製される。一部の実施形態では、組成物は、多重反応を実施するために調製される。
[00111] 複数の情報提示遺伝子のレベルを同時に決定する方法に有用であるオリゴヌクレオチド(核酸)アレイも、本明細書において提供する。そのようなアレイは、商業的供給源から得られるまたは作製されることもある。核酸アレイを作製する方法も当技術分野において周知である。例えば、核酸アレイは、遺伝子に対応する核酸またはその部分にハイブリダイズすることができる多数のオリゴヌクレオチド、ポリヌクレオチドまたはcDNAを固体支持体に固定化することによって作成することができるだろう。核酸アレイ作成に関する方法および目的の核酸の検出における使用に関する方法の非限定的な例を提供している、Current Protocols In Molecular Biology(Ausubelら編、John Wiley and #38; Sons NY, 2000)の22章「Nucleic Acid Arrays」またはLiu CGら、「An oligonucleotide microchip for genome−wide microRNA profiling in human and mouse tissues」、Proc Nall Acad Sci USA、2004年6月29日、101(26):9740〜4を当業者に紹介する。一部の実施形態では、アレイは、少なくとも2、少なくとも5、少なくとも10、少なくとも20、少なくとも50、少なくとも60、少なくとも70またはそれより多くの情報提示遺伝子に対する結合プローブを含む、またはそのような結合プローブから本質的になる。一部の実施形態では、アレイは、2以下、5以下、10以下、20以下、50以下、60以下、70以下またはそれより多くの情報提示遺伝子に対する結合プローブを含む、またはそのような結合プローブから本質的になる。一部の実施形態では、アレイは、表11から選択される1、2、3、4、5、6、7、8、9または10のmRNAを含む、またはそのようなmRNAからなる。一部の実施形態では、アレイは、表11から選択される4、5または6のmRNAを含む、またはそのようなmRNAからなる。オリゴヌクレオチドアレイを含むキットも提供する。キットは、核酸標識試薬、およびアレイを使用して発現レベルを決定するための指示を含むこともある。
[00112] 本明細書に記載する組成物を、情報提示遺伝子の発現レベルを決定および評価するためのキットとして提供することができる。組成物を、診断または研究用途でのそれらの使用を助長するための診断または研究キットに組立ててもよい。キットは、本開示の成分を収容する1つまたは複数の容器、および使用指示を含むこともある。具体的には、そのようなキットは、本明細書に記載する1つまたは複数の組成物を、これらの組成物の所期の用途および適正な使用を説明する指示とともに含むことがある。キットは、様々な実験を実行するために適切な濃度または量の成分を有することができるだろう。
[00113] キットを、本明細書に記載する方法の研究者、医療提供者、診断研究所または他の実在物による使用を助長するように設計してもよく、多くの形態で使うことができる。キットの組成物の各々は、適用可能な場合、液体形態で(例えば、溶液で)または固体形態(例えば乾燥粉末)で備えられることがある。特定の場合、組成物の一部は、例えば、そのキットに備えられていることもあり備えられていないこともある好適な溶媒または他の物質の添加によって、構成可能か、あるいは処理可能でありうる。本明細書で使用する場合、「指示」は、指示および/または推奨の要素を定義することができ、通常、本開示の包装の上または包装に付随する書面での指示を含む。指示は、指示がキットと関連しうることを使用者が明確に理解するようにあらゆる様式で、例えば、オーディオビジュアル(例えば、ビデオテープ、DVDなど)、インターネット、および/またはウェブベースの通信で提供される、あらゆる口頭または電子的指示も含むことができる。書面での指示は、診断用製品または生物学的製剤の製造、使用または販売を規制する政府機関によって規定された形式でありえ、これらの指示は、この機関による承認も示すことができる。
[00114] キットは、1つまたは複数の容器に入っている、本明細書に記載する成分のいずれか1つまたは複数を有することもある。一例として、一実施形態では、キットは、そのキットの1つもしくは複数の成分の混合、ならびに/あるいは試料の単離および混合、ならびに対象への適用についての指示を含むことがある。キットは、本明細書に記載する薬剤を収容する容器を含むこともある。成分は、液体、ゲルまたは固体(例えば粉末)の形態であることがある。成分を無菌調製し、凍結状態で発送することができるだろう。あるいは、それらの成分は、保存用のバイアルまたは他の容器に収容されることもある。第二の容器が、滅菌調製された他の成分を有することもある。
[00115] 本明細書で使用する場合、数に関して用語「おおよそ」または「約」は、別段の記述がない限り、または文脈からそうでないことが明らかでない限り、その数の両方向に(その数より上または下に)1%、5%、10%、15%または20%の範囲内に入る数を(そのような数が、可能な値の0%未満になるまたは100%を超えることになる場合を除いて)含むと一般に考える。
[00116] 本明細書に記載するすべての参考文献は、本明細書に記載する目的のために参照によって組み入れられている。
[00117] 本開示の例示的実施形態を以下の実施例によってさらに詳細に説明することにする。これらの実施形態は、本開示の例示であり、本開示が、それらの例示的実施形態に限定されないことは、当業者に理解されるであろう。
実施例1:マイクロアレイベースの予測モデルの開発
序論
[00118] この実施例は、予測アルゴリズムの開発する方法を記載するものである。最適化された最終モデルを、このモデルに使用した遺伝子の組合せを含めて説明する。この方法は、がん特異的サインの選択に役立てるために臨床因子ゲノム相関物(CFGC)を使用する。
[00119] 目的は、ゲノム相関物を導出することによって、より特異的に臨床因子に寄与する遺伝子発現シグナルを考慮に入れた上で、肺がん状態を有効に予測する新たながん予測モデルを開発し、特徴づけることである。ゲノム相関物は、本明細書では、対象の性別、喫煙状態および喫煙歴などの、特定の臨床的特徴を予測するための遺伝子発現アルゴリズムと定義する。
[00120] 目的は、以下の特定の性能基準を満たす予測アルゴリズムの開発であった:
使用企図集団内の肺がんの除外について90%より高い陰性的中率(NPV)、および
COPDと診断された対象について85%より高いNPV。
材料および方法
試料処理および分析
[00121] 肺がんの疑いのため気管支鏡検査を受ける予定になっている対象から臨床検体を採取した。予定された気管支鏡検査手法の間に標準的気管支ブラシを使用して対象の主気管支から気管支上皮細胞(BEC)を採取した。
[00122] Gene 1.0 STマイクロアレイ(Affymetrix)を使用する遺伝子発現マイクロアレイで試料を分析した。アレイデータのペアワイズ相関分析を行って(本明細書中で説明する)異常値を同定した。合計597の試料を最終データセットとして保持した。その後、データセットを等しいサイズのトレーニングセットと検証セットに無作為に分けた。
[00123] マイクロアレイCELファイルを予測アルゴリズムの開発に使用した。対象を、先ず、独立したトレーニングセットと検証セットに指定し、遺伝子選択および予測モデルの最適化をトレーニングセット内で行った。このモデルを最適化し、ロックした後、検証セット試料のがん状態を予測した。
正規化/バッチ調整
[00124] RMAを使用して、Gene 1.0 ST(Affymetrix)CELファイルからの遺伝子発現値をコンピュータ処理した。ComBatバッチ調整を使用してバッチ効果について補正した。すべての試料を5つの別個のマイクロアレイ実験(すなわちバッチ)の中で分析した。トレーニング試料および検査試料をRMAおよびComBat前処理に組み込んだ。その後の開発は、前に説明したようにトレーニングセットに限定した。RINスコアが4未満であった試料に対応するCELファイルを除外し、平均ペアワイズ相関が0.955未満であった試料も除外した(図1を参照されたい)。
ゲノム相関物
[00125] 対応する臨床的特徴を正確に予測する遺伝子発現サインとしてゲノム相関物を確立した。がん状態を予測するための別の遺伝子との組合せでのゲノム相関物を予測アルゴリズムに組み込む。以下の臨床的特徴についての相関物を開発し、評価した:
性別
喫煙状態(現行対既往)
喫煙歴(パック年、PY)
年齢
[00126] 目的の臨床的特徴を区別する上位ランクの遺伝子を選択し、ロジスティック回帰を使用してそれらの遺伝子をモデルとフィッティングすることによって、ゲノム相関物を開発した。臨床的特徴のスコア付けは、それらの選択された遺伝子の遺伝子発現に基づいた。
[00127] 検証セットにおいて同時に検査するための2つのモデルを平行して開発した。第一のモデル(スコア1)は、本明細書に記載される方法であって、報告された年齢を予測アルゴリズムに組み入れる方法とゲノムシグナルに基づくものであった。第二のモデル(スコア2)は、年齢についてのゲノム相関物を使用して開発し、その後、予測アルゴリズムに組み込んだ。
初期ゲノム選択
[00128] 年齢、性別、喫煙状態およびパック年に対するがん状態(0/1)のロジスティック回帰を使用して臨床因子モデルを開発した。臨床因子モデルからの残差は、これらの残差を有する各遺伝子の関連性を検査するために経験的ベイズ線形モデルを使用して、遺伝子の選択に使用した。上位232遺伝子をこのモデルのp値および倍数変化に基づいて選択した。上位232遺伝子を表11に収載する。
クラスタリング/最終遺伝子選択
[00129] 選択プロセス中の偏りを最小にするために、および強固な最終選択を得るために、遺伝子選択およびモデルフィッティングを自動交差検証アプローチで行った。遺伝子選択は、以下の工程からなった。階層的クラスタリングを使用して遺伝子を11のクラスターに分けた。各遺伝子のクラスターメンバーシップは、表11の第2列で同定される。クラスターの各々について、各クラスター内のすべての遺伝子を使用してクラスター平均をコンピュータ処理した。LASSO選択と逆方向選択をデータの反復無作為サブセットで併用して、がん状態との独立した予測的関連性を有するように一貫して選択された6つのクラスターを同定した。次いで、交差検証を使用して、クラスター平均の予測強度を保持するであろう各クラスター内の遺伝子の近似数を決定した。
[00130] 遺伝子滴定分析を行って、最終モデル内の選択クラスターからの遺伝子数増加に対するそのモデルの感度を決定した。これを最適化の一部として含めて、補足遺伝子が、モデルの臨床的感度さらに増やすかどうかを決定した。
ソフトウェア
[00131] rmsパッケージ、limmaパッケージ、検証パッケージおよびsvaパッケージを含むR(バージョン3.01)を分析に使用した。
結果
ゲノム相関物の導出
[00132] 全トレーニングセットを使用して、臨床的特徴を表す遺伝子を選択した。これらの「ゲノム相関遺伝子」は、可能な限り正確に臨床因子を表すために最小の遺伝子セットに基づくものであった。ゲノム性別(GG)は、単一遺伝子を使用して精度100%で定義した。値を次のように示す:RPS4Y1<閾値の場合、GG=1(男性)、およびそうでなければGG=0(女性)。
[00133] ゲノム喫煙状態については、経験的ベイズt検定に基づいて遺伝子をスクリーニングした。p値による上位遺伝子を、喫煙状態が従属変数であるロジスティック回帰モデルに含めた。結果として得た予測ゲノム喫煙(GS)値は、(遺伝子記号を使用して相対発現強度を表す)このモデルから導出した:

(式中、

は、このゲノム回帰モデルの回帰重みであり、およびGS=exp(x)/(1+exp(X)))。
[00134] ゲノムパック年については、経験的ベイズt検定に基づいて遺伝子をスクリーニングした。p値による上位遺伝子を、パック年<10が従属変数であるロジスティック回帰モデルに含めた。結果として得た予測ゲノムパック年(GPY)値は、このモデルから導出した:

(式中、

は、このゲノム回帰モデルの回帰重みであり、およびGPY=exp(x)/(1+exp(X)))。
[00135] ゲノム年齢については、経験的ベイズ線形モデルに基づいて遺伝子をスクリーニングした。p値による上位遺伝子を、年齢(歳)が従属変数であるペナルティ付き線形回帰モデル(LASSO)に含めた。結果として得た予測ゲノム年(GA)値は、このモデルから導出した:

(式中、

は、このゲノム年齢回帰モデルの回帰重みである)。
がん遺伝子の導出
[00136] 方法セクションで説明したクラスタリング分析を使用して、上位232遺伝子を最初に選択し、その後、遺伝子を下位方向に選択していった。
[00137] 次いで、交差検証を使用して、クラスター平均の予測強度を保持するであろう各クラスター内の遺伝子の近似数を決定した。この数は、1クラスター当たり2〜4遺伝子であることが判明した。各クラスター内の最終遺伝子選択は、p値、倍数変化、および文献からのがん関連性についての証拠の強さに基づいた。各クラスター内で低減された遺伝子セットを使用して、次のようにクラスター平均をコンピュータ処理し直した:
CIA=(BST1、CD177.1、CD177.2)の平均
C1B=(ATP 12A、TSPAN2)の平均
C2=(GABBRI、MCAM、NOVA1、SDC2)の平均
C3=(CDR1、CGREF1、CLND22、NKX3−1)の平均
C4A=(EPHX3、LYPD2)の平均
C4B=(MIA、RNF150)の平均。
完成モデルの説明
[00138] 最終モデル係数を推定するために、年齢(歳)、ゲノム性別(GG)、ゲノム喫煙状態(GS)、ゲノムパック年(GPY)および6つの低減された遺伝子クラスター平均(CIA、C1B、C2、C3、C4A、C4Bと表示する)を独立予測子として用い、がん状態(0/1)を従属変数として用いる、ペナルティ付きロジスティック回帰モデルを使用した。ペナルティ付加因子(ラムダ)は、臨床的/ゲノム相関物について0であり、遺伝子発現クラスターの各々について10であった。同じアプローチを使用したが、年齢の代わりに上で定義のゲノム年齢(GA)を用いて、第二のモデルを構築した。その後、モデル係数を推定し直した。
[00139] 最終分類アルゴリズムは、次の形であった:
スコア1=W+WxGG+WxGS+WxGPY+Wx報告年齢+WxC1A+WxC1B+WxC2+WxC3+WxC4A+W10xC4B
スコア2=W+WxGG+WxGS+WxGPY+WxGA+WxC1A+WxC1B+WxC2+WxC3+WxC4A+W10xC4B。
[00140] その後、次の式を使用して、ロジスティック回帰スコアを0〜1の範囲の予測スコアに変換する:
予測モデルの評価
[00141] トレーニングセット試料をトレーニング群と検査群それぞれに無作為に分けた(90:10)交差検証アプローチを使用した。臨床的精度を記録し、このプロセスを100重反復した。トレーニングセットのスコアは、各試料についての総反復数の平均として報告された。結果は、50%特異性を生じさせるようにおよび臨床的感度を最大にするようにスコア閾値を定義した後のROC曲線として、AUCとして、ならびに感度および特異性として報告された。
[00142] すべてのトレーニングセット試料のスコアを生成し、記録された臨床状態と比較した。スコア1およびスコア2のROC曲線をすべての試料について図2に、および気管支鏡検査陰性試料のみについて図3に示す。AUCを、すべての試料についてはスコア1=0.803およびスコア2=0.785と算出し、気管支陰性セットについてはスコア1=0.808およびスコア2=0.778と算出した。表1は、この予測スコアモデルで使用した情報提示遺伝子のリストを提供するものである。表1.1は、そのような遺伝子の発現を検出するためのプローブ配列の非限定的リストを提供するものである。
[00145] 下の表2は、トレーニングセットにおける気管支鏡検査陰性対象についての2つのモデルの性能特性の要約を提供するものである。気管支陰性対象(N)の数は、感度についいてはCA+対象、および特異性についてはCA−対象に対応する。
[00147]モデル性能
[00148] 特定のスコア閾値を使用して(スコア1および2に基づく)予測モデルの感度および特異性の算出を行って、CA+およびCA−試料の予測を区別した。トレーニングセットで両方のモデルについて選択した同じ閾値(モデルスコア=0.65)を検証セットで使用した。先ず、予測精度を両方のモデルの気管支鏡検査陰性試料(使用企図ケース)に関して決定し、要約する。
[00149] 検証セット内のいくつかのサブグループカテゴリーについての予測モデルの感度も算出した。両方のモデルについての結果を表3〜9に示す。サブカテゴリーは、信頼区画に影響を与える様々な数の試料を含有する。
トレーニングセットの性能と検証セットの性能の比較
[00158] トレーニングセットにおける予測モデルの総合的予測精度と検証セットにおける予測モデルの総合的予測精度を比較して、独立したコホートにおけるこれらのモデルの再現性を評価した。結果を表10に提供する。
[00160] トレーニングセットと検証セット間で感度および特異性の有意差(p>0.05)はいずれのモデルについても観察されなかった。さらに、2つのコホート間での各モデルについてのAUCの小さな差は、(p>0.05に基づいて)統計的に有意でなかった。感度および特異性は、全試料(気管支陰性と気管支陽性を合わせたもの)と比較した気管支陰性試料についても同様であった。スコア1とスコア2間で総合的な性能の比較的小さい降下があり、スコア2はスコア1と比較してAUCの2〜4%ポイントの降下を示した。
実施例2:気管支鏡検査診断を受ける肺がん患者のための気管支ゲノム分類子の検証
序論
[00162] 肺がんが疑われる肺病変を有する患者の気管支鏡検査は診断を下せないことが多い。この結果、多くの場合、さらなる侵襲的検査となるが、多くの病変は良性である。本発明者らは、気管支鏡検査の診断性能を向上させることができる気管支遺伝子発現分類子の検証に努めた。
[00163] 肺がんが疑われる病変は、胸部画像診断で同定されることが多い。監視画像診断を進めるか、または組織試料採取を必要とする侵襲的評価を進めるかの決断は、複雑であり、悪性の尤度、生検能力、手術のリスクおよび患者の嗜好の評定を要する[1]。生検を要する場合、そのアプローチとしては、気管支鏡検査、経胸壁針生検(TTNB)、または外科的肺生検(SLB)を挙げることができる。これらの様式間の選択は、通常、病変のサイズおよび位置、アデノパシーの存在、手法のリスクおよび地域の専門家の技術などの考慮事項によって決定される。気管支鏡検査は、気胸の併発が1%未満である安全な手法である[2]。米国では年間おおよそ500,000件の気管支鏡検査が実施されており[3]、そのおおよそ半数が、肺がんの鑑別診断のためである。しかし、気管支鏡検査は、病変の位置およびサイズに依存してその感度に34〜88%の幅があることよって制限される[4]。より新しい気管支鏡誘導技術を用いても、末梢病変については感度が約70%に過ぎない[5]。
[00164] 気管支鏡検査で診断できない患者は、確定診断を確立するためにさらなる侵襲的検査を受けることが多い。SLBは、おおよそ5%の合併症発症率および約1%の30日間死亡率があるその固有のリスクを考えると、望ましい初期アプローチではない[6]。重要なこととして、SLBの20〜25%は、良性病変と最終的に診断される患者に関して実施されている[7、8]。さらに、TTNBは、気胸発症率15%を含む有意な罹患率を伴い[9]、その6%は胸腔チューブドレナージを必要とする[10、11]。侵襲的手法のこれらの隠れた危険を考えると、画像診断監視に適している、悪性の尤度が低い患者を同定するための代替アプローチが必要である。
[00165] 臨床検体の遺伝子発現測定を使用する、がんを含む生物学的病態の分類は、十分に確率されている[12]。肺がんの状況では、喫煙者の近位気道から採取された細胞学的に正常な上皮に特徴的ながん関連遺伝子発現パターンがある[13]。最近、本発明者らは、気管支鏡検査によって主気管支から採取した気管支上皮細胞(BEC)における遺伝子発現分類子であって、現行および既往喫煙者の中の肺がんを有する患者と有さない患者を区別する遺伝子発現分類子を開発した(原稿投稿済み)。本発明者らは、肺がんが疑われたため気管支鏡検査を受ける患者の2つの前向き多施設治験においてこの分類子を検証するために、およびこの分類子が気管支鏡検査の診断性能をどの程度変化させるかを評定するために、本研究に着手した。
材料および方法
研究デザイン、集団およびプロトコル
[00166] 肺がんの疑いのため気管支鏡検査を受ける現行および既往喫煙者を、2つの独立した前向き多施設観察研究(NCT01309087およびNCT00746759)であるAEGIS1およびAEGIS2に登録した。米国、カナダおよびアイルランドの28施設で患者を登録した。細胞診ブラシを使用して、主気管支から正常に見えるBECを採取し、RNA保存薬に浸漬した。分類子の結果は、医師にも患者にも報告しなかった。気管支鏡検査前に患者をスクリーニングして、患者が研究プロトコルの要件を満たすかどうかを決定した。除外基準は、21歳未満の対象、非喫煙者(人生で100本未満のたばこ喫煙と定義した)、および併存するがんまたは肺がん歴を有する患者を含んだ。気管支鏡検査の直前に24時間より長い間、人工呼吸器につながれていた患者、またはこの研究に同意できないもしくはこの研究を遵守できない患者は、除外した。最終診断が確定されるまで、または気管支鏡検査の12カ月後まで、患者を追跡した。肺がんの診断は、指標気管支鏡検査の時点で確定されたか、またはTTNB、SLB、第二の気管支鏡検査もしくは他の侵襲的手法を使用するその後の生検によって確定された。使用した特定の気管支鏡検査方法およびその後の監視画像診断、または気管支鏡検査で診断できなかった後に実施される手法は、処置する医師の自由裁量であった。がんがないと診断された患者は、追跡調査12カ月の時点で、特定の良性診断を受けた、またはX線検査で安定していた/解消されていた。追跡調査12カ月の時点でがんの確定診断が下されなかった、特定の良性診断が下されなかった、または安定していなかった/解消されていなかった患者は、さらなる分析から除外した。処置する医師は、気管支鏡検査前に5段階尺度(10%未満、10〜39%、40〜60%、61〜85%、および85%超)を使用して、各患者の検査前の悪性の確率(POM)を評定した。この研究プロトコルは、各参加施設の施設内治験審査委員会によって承認され、すべての患者から登録前に書面によるインフォームドコンセントを得た。
[00167] AEGIS1には患者合計855名およびAEGIS2には患者合計502名に登録資格があり、これらの患者を2009年1月〜2012年8月(図4)に米国、カナダおよびアイルランドの28の医療センターにおいて登録した(表12)。これらの施設は、三次医療センター/大学病院(n=20)、地域密着型の病院(n=6)、および退役軍人局病院(n=2)の混合であった。
[00168] 登録後、さらなる患者を以下の基準に基づいて研究から除外した(図4を参照されたい)。第一に、AEGIS1の患者合計111名およびAEGIS2の患者合計71名は、以下のプロトコル逸脱のため不適格であった:AEGIS1において、患者24名は、再調査により研究登録基準を満たさなかった、または採取した検体がデータ登録の際に受け入れ基準を満たさなかった、または登録されたが検体が採取されなかった。さらなる87試料は、RINスコア<4またはRNA収量<1μgのいずれかのため、RNA単離後の最低限のQC基準を満たさなかった。AEGIS2には、データ登録の際に受け入れ基準を満たさない検体が採取されたため不適格の患者3名、およびRNAについての最低限のQC基準を満たさなかった68試料があった。第二に、AEGIS1の患者40名およびAEGIS2の患者10名を含む、非原発性肺がんと診断された患者を除外した。加えて、AEGIS1の患者91名およびAEGIS2の患者71名を含む、12カ月時点での再調査によって最終診断が下されなかった患者も研究から除外した。AEGIS1および2からのこれらの患者162名のおおよそ3分の2(n=106)は、初期気管支鏡検査後、追跡不能であり、さらに、残りの3分の1(n=56)は、気管支鏡検査後12カ月の時点で確定診断が下らなかった。最後に、本発明者らは、遺伝子発現データがQC基準アッセイ(下のマイクロアレイ処理方法で説明する)に不合格であった、AEGIS1の患者16名およびAEGIS2の患者9名を除外した。
[00169] AEGIS1コホートを、予め同等のトレーニングセットと検査セットに無作為に分けた。トレーニングセット(患者数n=299)を使用して、年齢に加えて23遺伝子で構成された遺伝子発現分類子を導出し、他に記載した(原稿投稿済み)。トレーニングセットでは、分類子は、気管支鏡検査で肺がんの診断に至らなかった患者(n=134)において0.78のAUC(95%CI、0.71〜0.85)と、93%の感度および57%の特異性を有することが判明した。本研究は、2つの独立した検証セットでのロックされた分類子の検証に焦点を置いている。
[00170] 最終AEGIS1およびAEGIS2検証セットのベースライン人口統計学および臨床的特徴を表1で比較する。各コホート内のがんと診断された患者と良性疾患と診断された患者の別個の比較を表12に提供する。
[00174] 臨床データおよび人口統計学的データを各患者から収集し、研究症例報告書(CRF)に記録した。さらなる病理報告書および放射線読影レポートを各患者の診療記録に維持し、再調査に利用できた。すべてのソースドキュメントをモニターし、研究スポンサーによって維持されたデータベースに入力した。肺病変のサイズおよび位置は、CTスキャンレポートから得た。対象を気管支鏡検査の12カ月後まで追跡調査し、臨床診断のためのデータを収集した。肺がんの診断は病理検査からの結果に基づくものであり、病理報告書のコピーを医療センターから集めた。がんの臨床診断につながる検体は、気管支鏡検査中に得たか、気管支鏡検査で診断できなかった場合はその後の侵襲的手法から得た。気管支鏡検査で診断できなかった後に実施したすべての臨床的手法に関するデータを研究中に収集した。気管支鏡検査で診断できなかった患者からのその後の評価は、各研究センターの処置する医師の自由裁量であった。一部のケースでは、診断を成功させるために気管支鏡検査後に1種より多くの手法を要したが、すべてのケースで肺がんの診断につながる手法を収集した。侵襲的追跡調査手法は、第二の気管支鏡検査、TTNB、または縦隔鏡検査、胸腔鏡検査、開胸術もしくはビデオ補助胸腔鏡手術(VATS)を含みうる外科的肺生検(SLB)のいずれかと定義した。
[00175] がんと診断されなかった患者の記録は、がんがないと対象に断言するための決定プロセスを経た。このプロセスは、5名の呼吸器科医の一団による各患者についての入手可能な診療記録の再調査からなった。この一団からの呼吸器科医2名は、個々のケースを独立して再調査し、患者を、彼/彼女が次の基準の1つを満たした場合、がんがないと決定した:患者が、初期の疑わしい異常を説明する代替診断で診断され、その異常が安定しているとまたはその異常が解消されたと決定された。12カ月の追跡調査期間の完了時にこれらの基準を満たさなかった患者には最終診断が下されず、これらの患者をこの研究のさらなる分析から除外した。
[00176] 組織診断(表13)およびがんの病期(表14)データを、原発性肺がんと診断された患者について分析した。データを研究CRFから抽出し、完全診療記録の再調査によって確認した。全がんのうち、AEGIS1の80%(175/220;95%CI、74〜84%)およびAEGIS2の83%(222/267;95%CI、78〜87%)は、NSCLCであった。17%(38/220;95%CI、13〜23%)および16%(42/267 95%CI、12〜21%)SCLCがんがそれぞれあった。既知がん病期データがあるNSCLC患者のうち、早期(病期Iまたは2)は、AEGIS1に40%(53/139 95%CI、32〜48%)およびAEGIS2に37%(67/199;95%CI、30〜44%)存在した。
[00179] 良性診断の各々についてのデータを診療記録から抽出し、表15に要約した。両方の研究で、がんのない対象のおおよそ3分の2に代替診断が下され、それらの特定の代替診断を研究ごとに表S4に列挙した。解消されたまたは安定していると決定された異常を有した患者の診断は、気管支鏡検査後12カ月の時点での追跡調査画像診断を含む診療記録の再調査に基づくものであり、がんのない患者のおおよそ3分の1は、両方の研究でこのカテゴリーに入った。
[00181] 臨床的に必要と判断された気管支鏡検査中に、研究参加者は、標準的な使い捨て細胞診ブラシを使用しこれを気管支壁にこすりつけて、右または左主気管支の一連の粘膜ブラッシングを受けた。2つのブラシ擦過採取物を各患者から得た。医師は、正常に見える上皮組織のブラシ擦過採取物を得るためのおよび腫瘍組織または異形成細胞の試料採取を避けるためのトレーニングを受けた。すべての試料をRNA保存薬(RNAprotect、Qiagen)で保存し、データ登録および処理のために中央CLIA認定検査室に発送した。センターに、14日間まで4℃で試料を保存するように、ならびに2日以内に発送するサービスとスポンサーによって提供された断熱輸送箱(NanoCool)とを使用して周囲温度より低い温度(4〜20℃)で発送するように要請した。
[00182] 検査室手法
[00183] 遺伝子発現分析前に、すべてのBEC検体を処理して、RNAを単離し、品質および収量について分析した。RNA収量が少なくとも1μgであり、RINスコアが4より上であった試料のみをGene−ST 1.0マイクロアレイにかけた。すべてのマイクロアレイデータをGEOにGSE66499として寄託した。
[00184] カラムベースの方法(miRNeasy Kit、Qiagen)およびその製造業者の推奨プロトコルを使用して、試料を溶解し、RNAを単離した。大きいRNA画分を分光光度計(Nanodrop、ThermoFisher)で分析して、濃度、純度および収量を決定した。試料をRNA完全性についても分析し(Bioanalyzer)、RINスコアとして報告した。収量が1μg未満であり、RINスコアが4未満であった試料は、研究から除外した。AEGIS1の検体のおおよそ10%およびAEGIS2の検体のおおよそ13%を、不十分なRNA品質または量のため除外した。その後、さらなる処理までRNAを凍結(−80℃)保存した。
[00185] Ambion WT Expressionキット(Life technologiesカタログ番号4440536)を使用して全RNA 200ngをセンス鎖cDNAに変換し、その後、Affymetrix GeneChip WT末端標識キット(Affymetrixカタログ番号900671)で標識した。ハイブリダイゼーションのために、Hybridization,Wash and Stainキット(Affymetrixカタログ番号900720)を使用して、ハイブリダイゼーションカクテルを調製し、標識cDNA標的に付加させ、Human Gene 1.0 STアレイ(Affymetrixカタログ番号901087)に適用し、45℃で16時間インキュベートした。ハイブリダイゼーション後、標準的Affymetrix手法を使用して、アレイを洗浄し、染色した後、それらをAffymetrix GeneChip Scannerでスキャンした。Expression Consoleソフトウェア(Affymetrix)を使用してデータを抽出した。
[00186] Affymetrix Human Gene 1.0 STアレイ(Affymetrixカタログ番号901087)は、www.affymetrix.com/site/include/byproduct.affx?product=hugene−1_0−st−v1に開示されている非常に多くのプローブを利用する。単一の遺伝子の複数のセグメントに対応する複数のプローブが存在するのではなく、1プローブの遺伝子に対する比が1:1でないと言うことができる特異的遺伝子のセグメントに対応する複数のプローブが存在する。一例では、LYPD2遺伝子は、Human Gene 1.0 STアレイ(リリース32)における3つのプローブセット、Affymetrix Human Gene 1.0 STアレイ(HuGene-1_0-st-v1 Probeset Annotations、2011年9月30日のリリース32、2013年3月27日のリリース33、および2014年4月7日のリリース34)に開示されているプローブセットID8153343、8153344および8153345、によって表される。プローブセットと核酸配列の相関関係を示す情報は、www.affymetrix.com/site/include/byproduct.affx?product=hugene−1_0−st−v1を含む、Affymetrix.comで見つけることができる。さらに、データセットは、www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GPL6244における本開示の方法の実施に利用することができるだろうプローブおよび遺伝子を列挙しているNCBI Gene Expession OmnibusウェブサイトのPlatform GPL6244で入手可能である。プローブセットと遺伝子記号の相関関係を示すものを含むこれらのドキュメントは、参照により本明細書に組み込まれている。
[00187] 各コホートの最終データセット内の試料に対応するマイクロアレイデータ(CELファイル)を、RMAを使用して正規化した[22]。AEGIS1試料を合計5バッチで実行し、ComBat[23]を使用してバッチ効果を補正した。AEGIS2試料は、すべて、単一マイクロアレイバッチで実行した。正規化後、遺伝子発現全体で0.955より低いゲノムワイドペアワイズ相関を有するような異常値を同定した。すべてのマイクロアレイデータをGEOに受入番号GSE66499で寄託した。
[00188] マイクロアレイデータの正規化および前処理は、補足の付属書類に記載する。AEGIS1に登録した対象は、独立したトレーニングセットと検証セットに既に無作為に割り当て済みであり(図4)、分類子アルゴリズムは、前に説明したように厳密にAEGIS1トレーニングセット内で導出し、ロックした。23遺伝子の発現および患者年齢に基づくこの事前設定分類子を使用して、AEGIS1検証セットの各試料についてのスコアおよびすべてのAEGIS2試料についてのスコアを生成した。事前設定閾値を使用して、これらのスコアを検査陽性と検査陰性に二分した。
[00189] 受信者操作特性(ROC)曲線、曲線下面積の算出(AUC)[14]、感度の推定値、特異性の推定値、陰性的中率(NPV)の推定値、陽性的中率(PPV)の推定値、および(1−感度)/特異性と定義された陰性尤度比(NLR)の推定値を使用して、分類子の性能を評価した。マン・ホイットニーノンパラメトリック検定を連続変数の分析に使用し、フィッシャー正確確率検定をカテゴリー変数に使用した。すべての信頼区画を両側二項95%信頼区画(95%CI)として報告する。統計分析は、Rソフトウェア(バージョン3.01)を使用して実施した。
[00190] 気管支鏡検査前に専門家の意見および入手可能な診療記録に基づいて、次のカテゴリー:10%未満、10〜39%、40〜60%、61〜85%、および85%超のうちの1つを使用して、登録したすべての対象について検査前POMを評定するように医師に依頼した。結果を10%未満、10〜60%、および60%超のカテゴリーにまとめた。次いで、本発明者らは、そのPOMカテゴリーの各々におけるがんの実際の有病率を算出して、階層化POMレベルでがんの実際の有病率を比較した(表16)。加えて、本発明者らは、気管支鏡検査で診断できなかった後の肺がんの有病率が、10%未満、10〜60%および60%超POM群でそれぞれ、3%、29%および80%であることを見出した。

[00194] 病変のサイズによって階層化した気管支ゲノム分類子の予測精度を表2に要約し、検査前POMによって階層化した気管支ゲノム分類子の予測精度を表3に要約する。病期および組織診断によって階層化した、肺がんと診断された患者についての分類子の感度も、表S5およびS6に報告する。気管支鏡検査と併用での分類子は、すべてのカテゴリーについて90%より高い感度をもたらす。
結果
研究参加者の特徴づけ
[00196] AEGIS1からの患者298名は、第一の検証セットとして役立ち、研究基準を満たしたAEGIS2からの患者341名すべてを第二の検証セットとして使用した(図4および表13)。肺がんの有病率は、AEGIS1およびAEGIS2コホートについてそれぞれ74%および78%であった。肺がんを有する患者は、より年配であり(p<0.001)、がんを有さない患者と比較して累積たばこ曝露がより高度であり(p<0.001)、現行喫煙者である可能性がより高かった(AEGIS1ではp=0.07、およびAEGIS2ではp=0.03;表12)。がんの病期および良性診断のカテゴリーについての要約をそれぞれ表15および16に示す。
気管支鏡検査の性能
[00197] 患者合計639名は、肺がんが疑われたため気管支鏡検査を受けた。そのうち、272名(43%;95%CI、39〜46)を診断できず、これは、最終的に肺がんと診断された患者487名のうちの120名(25%;95%CI、21〜29)を含んだ。肺がんについての気管支鏡検査の感度は、AEGIS1およびAEGIS2においてそれぞれ74%(95%CI、68〜79)および76%(95%CI、71〜81)であった。気管支鏡検査で診断できない患者の98%(272名中267名)については追跡調査手法データを入手できた。気管支鏡検査で診断できなかった後、良性病変を有した147名のうちの52名(35%;95%CI、24〜38)およびがんを有した120名のうちの118名(98%;95%CI、94〜99)を含む、患者267名のうち170名(64%;95%CI、58〜69)に関して侵襲的手法を実施した。SLBを患者76名に関して行い、そのうち27名(36%;95%CI、26〜47)は、良性病変を有した。
[00198] 遺伝子発現分類子の性能
[00199] 単独での分類子は、AEGIS1において、AUC=0.78(95%CI、0.73〜0.83)を有し、がんを有する患者220名のうちの194名(感度88%;95%CI、83〜92)、およびがんを有さない患者78名のうちの37名(特異性47%;95%CI、37〜58)を正確に同定した(図5)。AEGIS2では、分類子は、AUC=0.74(95%CI、0.68〜0.80)を有し、がんを有する患者267名のうちの237名(感度89%;95%CI、84〜92)、およびがんを有さない患者74名のうちの35名(特異性47%;95%CI、36〜59)を正しく同定した。気管支鏡検査と分類子の併用は、AEGIS1および2において感度を、気管支鏡検査単独についてのそれぞれ74%および76%と比較して、それぞれ、96%(95%CI、93〜98)および98%(95%CI、96〜99)に増加させた(p<0.001)。
[00200] 気管支鏡検査で診断できない患者に関して、分類子は、AEGIS1では患者57名のうちの49名(感度86%;95%CI、74〜94)およびAEGIS2では患者67名のうちの62名(感度92%;95%CI、82〜97)でがんを正確に同定した。分類子AUCに関する2つのコホートの患者間の有意差は、全患者にわたって(p=0.32)も、気管支鏡検査で診断できない患者(p=0.61)についてもなかった(図5)ので、本発明者らは、サブグループのその後の分析には2つのコホートを併用した。単独での気管支鏡検査の感度は、3cm未満であった病変(p<0.001)または末梢に位置した病変(p<0.001)に関して、より低かった(表17)。対照的に、単独での分類子の感度および気管支鏡検査と併用での分類子の感度は一貫して高く、病変のサイズおよび位置(表17)にも、がんの病期(表18)にも、組織学的亜型(表19)にも有意に関連しなかった。
中等度のがん発症確率を有する患者における分類子の精度
[00203] 本発明者らは、医師によって評定された悪性の確率(POM)を低(10%未満)、中(10〜60%)および高(60%超)POMのカテゴリー(表3)に結びつけて、肺がんリスクの評定についてのガイドライン勧告[1]に合わせた。気管支鏡検査は、中等度の検査前POMを有する患者の83%(n=101)に関して、がん有病率41%にもかかわらず、がんを診断できなかった。この患者群に関して、分類子は、気管支鏡検査で診断できない患者の中で91%(95%CI、75〜98)のNPVおよび40%のPPV(95%CI、28〜54)を達成した(表20)。
[00205] 分類子は、気管支鏡検査で診断できなかった患者に関して高いNPVを有したが、肺がんまたは陰性分類子スコア(すなわち、偽陰性)を有する、気管支鏡検査で診断できなかった患者13名がいた。大多数(13名中10名)は、高(60%超)POMを有し、患者3名だけが10〜60%検査前POM群であった。
[00206] 気管支鏡検査と併用での分類子のNLRを算出して、検査後確率が10%未満になる検査前POMの範囲を決定した。気管支鏡検査のNLR(0.244;95%CI、0.21〜0.29)は、分類子と併用したとき、0.056(95%CI、0.03〜0.10)に向上した。結果として、気管支鏡検査と分類子の両方が陰性である場合、検査後POMは、検査前POMが66%以下である患者については10%未満に低減される(図6)。
結果の評価
[00207] この研究は、2つの独立した前向きコホート内の気管支鏡検査を受けた患者の中で肺がんを有さない患者を同定する気管支ゲノム分類子の検証を記述するものである。本発明者らは、ゲノム発現分類子が、併用コホートにおいて肺がんの様々なサイズ、位置、病期および細胞型を通して高い感度を有することを見出した。分類子と気管支鏡検査の併用は、AEGIS−1およびAEGIS−2検証コホートにおいてそれぞれ96%および98%の感度を有する。本発明者らは、このタイプの分類子の臨床的必要性を裏付けるいくつかの追加の所見も報告する。第一に、本発明者らの研究は、気管支鏡検査で診断できないことが、(特に、中等度の検査前POMの患者において)一般的であり、SLBを含むさらなる侵襲的検査につながることが、最終的に肺がんを有さないと判明する患者でよくあるという以前に報告された観察を確証した。第二に、分類子の高い感度とは対照的に、小さい、末梢の、または早期のがんでは気管支鏡検査がうまく遂行されないことを本発明者らは見出した。第三に、分類子は、中等度のPOMを有する患者および気管支鏡検査で診断できない患者において高いNPVを有する。これらの所見は、肺がんの有病率は41%であるが気管支鏡検査の感度はたった41%である中等度のPOMを有する患者に関して臨床的決断を下すのに、この分類子が役立つ可能性があることを示唆している。高いNPVのため、気管支鏡検査で診断できない患者および中等度のPOMを有する患者における陰性分類子スコアは、画像診断による能動的監視を伴うより保守的な診断戦略の正当な理由となる。
[00208] 分類子の高いNPVは、分類子陰性である中等度のPOMを有する患者に関して不必要な侵襲的手法を回避するのに役立つが、肺がんを有する少数の患者がこの群には存在し、その陰性遺伝子発現分類子の結果が、これらの患者に関するさらなる侵襲的検査を遅らせることもある。しかし、この患者群は、即刻侵襲的戦略を用いない場合の標準的技法である画像診断による能動的監視を受けることになる[1、15]。これによって、確定診断を確立するためのさらなる侵襲的検査の誘因になる病変拡大の同定が可能になる。中等度のPOMを有する患者で観察される高いNPVとは対照的に、分類子は、この設定で40%というわずかなPPVを有する。したがって、分類子での陽性結果は、診断戦略の変更の正当な理由にはならず、さらなる検査は、侵襲的戦略と画像診断監視戦略間の選択に使用される旧来の因子に基づく必要があるだろう。
[00209] この遺伝子発現分類子を近位BECで測定し、肺病変内の細胞からのBECでは測定しない。細胞学的に正常な近位気道における遺伝子発現変化によって肺実質内の肺がんの存在を検出することができることは、「損傷の場」パラダイムに直接端を発している[13]。Spiraらは、肺がんを有する現行および既往喫煙者間には細胞学的に正常な気管支上皮細胞の異なる遺伝子発現変化パターンがあることを以前に証明した[13、16]。加えて、肺がんを有する喫煙者および前悪性気道病変を有する喫煙者の近位気道上皮では発がんシグナル伝達経路が活性化される[17]。つい最近、Kadaraら[18]は、発現が非小細胞肺がん自体および隣接小気道上皮において変化する遺伝子が、近位気道上皮において変化する遺伝子中に濃縮されており、これは、近位気道内の遺伝子発現変化が、肺腫瘍において観察されるトランスクリプトームの変化をある程度反映することを示唆していることを立証した。
[00210] 気管支鏡検査は、その手法によって肺がんの診断が得られる場合にのみ「診断に役立つ」と考えた。特定の良性の病因の診断に役立つ可能性のある比較的少数の気管支鏡検査があったが、これらの患者の大部分は、肺がんと最終的に診断された患者を含めて、さらなる侵襲的検査を受けた。これは、肺がんに対する懸念が、気管支鏡検査での初期良性所見にもかかわらず高い状態のままであったことを示唆している。結局、本発明者らは、臨床的変数との組合せで分類子を具体化するモデルの精度を評定しなかった。臨床的リスク予測モデルが孤立性肺結節のために開発された[1、20、21]が、より大きい病変(すなわち、3cm超)、浸潤物または他の特徴事項、例えばリンパ節肥大を含む、より広範な所見を有する患者を含む、診断のための気管支鏡検査を受けることを選択する患者のための検証されたモデルはない。したがって、ほとんどの患者は、肺がん発症確率についての医師の定性評価に基づいて、気管支鏡検査に選択される。重要なこととして、本発明者らは、利用可能な臨床的リスク因子を具体化するプロセスである、医師の評定により中等度のPOMを有する患者において本発明者らの分類子がうまく機能することを立証する。
[00211] この研究の潜在的効果は、その研究デザインの多数の重要な強度によって強化される。第一に、これらは、検査が臨床的に使用されることになる状況で(すなわち診断前に)分類子を測定する、2つの独立した前向き検証研究であった。これは、分子マーカーを発見研究からそれらの最終的な臨床的応用に移す極めて重要な工程である。第二に、この大規模多施設デザインは、異なる実施状況および地理的位置からの気管支鏡検査を受ける患者の組み入れを可能にした。第三に、本発明者らのデータは、気管支鏡検査で診断できない患者および中等度の検査前POMを有する患者の中で高い肺がん有病率を立証し、がんの状態について最大の不確実性がある状況で分類子が91%のNPVを有すること示す。この状況で、肺がんについて高い感度を有する分類子を使用する機会があることにより、後に能動的監視によりフォローされ得る肺がんを有さない患者の確信的同定を可能にし、これにより潜在的に有害な侵襲的追跡検査が回避される。
実施例3:気管支鏡検査診断を受ける肺がん患者のための気管支ゲノム分類子の導出
序論
[00212] 肺がんは、米国におけるがん死亡率の主因であり、2014年には新たな診断が224,000件および死亡が160,000件ある推定され、その90%は喫煙に起因する[24]。最近、National Lung Cancer Screening Trialは、低用量コンピュータ断層撮影(CT)スクリーニングが高リスク個体の20%相対死亡率低下をもたらすことを明らかにした[25]。しかし、この死亡率の低下は、高率(約96%)の偽陽性CT所見を伴い、そしてまたそれが、侵襲的診断手法の過剰利用に対する懸念を生じさせた[26]。
[00213] 肺がんが疑われる患者は、気管支鏡検査で調べられることが多く、その主目的は、病理分析のための疑わしい肺病変の試料採取である。米国では年間500,000件の気管支鏡検査が実施されると推定され[27]、そのおおよそ半数は、肺がんの診断のためである。気管支鏡検査は、他の侵襲的試料採取方法、例えば、経胸壁針生検(TTNB)、または外科的技法より安全であると考えられる。しかし、気管支鏡検査の診断感度は、34%(2cm未満の末梢小結節について)〜88%(より大きい、中心部に位置する病変について)の範囲であり最適とは言えない[28]。誘導技術の採用は、気管支鏡検査の適用可能性をより難易度の高い疑わしい病変(すなわち、肺の末梢部にあることが多い孤立性肺結節)へと広げたが、肺がんのための気管支鏡検査の全体的な臨床的感度は、実質的に向上されていない[29、30]。気管支鏡検査で診断できない場合、医師は、関連合併症があるさらなる侵襲的診断手法[31、32]を進めるか、画像診断による監視を選択するか曖昧なままであることが多い。現行の診療では、これらの侵襲的手法を実施したとき、患者のおおよそ3分の1は良性疾患を有すると決定される[33]。これは、これらの手法が回避できることを示唆している。気管支鏡検査の診断率を実質的に向上させることによってこの曖昧さを減少させる方法は、患者ケアを向上させることができるだろう。
[00214] たばこの煙は、呼吸器全体を覆っている気道上皮細胞の損傷の分子場を作り出すことが以前に立証されている[34]。気管支気道トランスクリプトームに対するたばこの煙の可逆的および不可逆的影響は特徴づけられており、気管支上皮の一連の遺伝子発現変化が、肺がんを有する現行および既往喫煙者において確認されている[35]。これらのがん関連遺伝子発現プロファイルは、気管支鏡検査で診断できない場合に肺がんを検出するための高感度分類子をもたらすことが以前に証明されている。気管支鏡検査中に容易に入手できる生体試料で測定されるこの分類子の高い感度は、検査結果が陰性であったときは非常に低い肺がん発症確率をもたらし、また医師が自信をもって能動的監視を進めることおよび肺がんを有さない対象におけるリスクの高い侵襲的手法を低減させることを可能にしうることを示唆している。
材料および方法
トレーニングセット患者集団
[00215] 鑑別診断の一部として気管支鏡検査を受ける、肺がんの疑いがある現行および既往たばこ喫煙者の(NCT01309087およびNCT00746759として登録された)予測的、観察的、コホート研究としてデザインしたAEGIS治験(Airway Epithelium Gene Expression In the DiagnosiS of Lung Cancer:肺がんの診断における気道上皮遺伝子発現)に患者を登録した。コホートの一つから1セットの患者(「AEGIS1」)を、遺伝子発現分類子のトレーニングのみを目的として選択した。この研究は、参加医療センターの各々のIRBによって承認され、すべての患者は、登録前にインフォームドコンセントにサインした。気管支鏡検査後、最終診断が下されるまでまたは12カ月間、すべての登録患者を追跡した。患者は、気管支鏡検査で得られたまたはその後の肺生検(気管支鏡検査が肺がんの診断に至らなかったときのTTNBもしくは外科的肺生検(SLB)など)によって得られた細胞病理に基づいて、原発性肺がんを有すると診断された。患者は、気管支鏡検査後12カ月の時点で診療記録の再調査および追跡調査手法に基づいて、良性疾患を有すると診断された(より詳細に追加ファイル1に記載する)。気管支鏡検査は、気管支鏡検査手法時に採取した臨床試料の細胞診断または病理検査によって肺がんの確定診断が得られた場合、「診断に役立つ」と考えた。
[00216] NIH登録AEGIS研究(NCT01309087およびNCT00746759)に登録した患者は、最低でも年齢21歳であり、人生で少なくとも100本のたばこを喫煙したことがある、肺がんの疑いのため臨床的に必要と判断された気管支鏡検査を受ける患者であった。研究除外は、原発性肺がんと以前に診断されたことがある患者、気管支鏡検査直前に24時間以上継続的に人工呼吸器につながれていた患者、またはこの研究に同意できないもしくはこの研究を遵守できない患者を含んだ。原発性肺がん以外の悪性腫瘍を有する患者を除外するために、分類子のトレーニング前にさらなる患者を除外した。これは、あらゆる悪性腫瘍歴のある患者、肺への転移性癌が確認された、または登録後に活動性の非肺原発癌を有することが判明した患者の除外を含む。また、最終確定診断が下されていない患者を除外した。最後に、検体処理後、不十分なRNA収量(<1μg)および質(RIN<4)であったものをさらなる分析から除外した。
[00217] 気管支鏡検査後12カ月までの間、患者を追跡し、記録を再調査して、最終臨床診断を確認または決定した。がんの診断は、気管支鏡検査中に採取した、または気管支鏡検査で診断できなかった場合に追跡調査手法で採取した、細胞/組織の細胞病理に基づいた。診断に至る追跡調査手法は、第二の気管支鏡検査、経胸壁針穿刺吸引(TTNA)、外科的肺生検(SLB)または手法の組合せからなった。がんと診断されなかった患者および12カ月間追跡した患者の記録は、5名の呼吸器科医の一団による判定プロセスを経た。このプロセスは、入手可能な診療記録の再調査からなるものであり、患者が次の基準の1つを満たした場合にのみ患者にがんがないと断言した:初期の疑わしい異常を説明する代替診断で診断され、その異常が安定しているとまたはその異常が解消されたと決定された。12カ月の追跡調査期間の完了時にこれらの基準を満たさなかった患者を「不確定」と表示し、診断の「真実性」を欠くためトレーニングから除外した。
試料採取
[00218] 25の参加医療センター各々の医師に、気管支鏡検査中に標準的な気管支鏡検査用細胞診ブラシを使用して右主気管支(または何らかの異常が右側で観察された場合には左側)から正常に見える気管支上皮細胞(BEC)を採取するように指示した。採取後、採取直後に細胞診ブラシを切断してRNA保存薬(Qiagen RNAProtect、カタログ番号76526)に入れ、4℃で保存した。その後、さらなる処理のために検体を4〜20℃で中央検査室に発送した。
[00219] 48時間以内の4〜20℃での検体の輸送を可能にする輸送箱をすべての施設に提供した。2日以内に届けるサービスを使用して検体を送るように施設に依頼した。中央検査室で受け取り次第、検体を点検し、検査室情報システムにデータ登録した。受け入れた検体をRNA単離前に4℃で保存し、通常、受け取って7日以内にRNA単離を行った。すべての保存の記録、および発送時間の記録を保持し、検体採取とRNA単離の間の累積時間は、(RNA保存薬の製造者の推奨基準と一致して)30日未満であった。
RNA単離
[00220] ボルテックスミキサーを使用して細胞診ブラシからBECを分離し、次いで、ペレット化し、QIAzol溶解試薬(Qiagen)を使用して処理した。フェノール/クロロホルム抽出によってRNAを単離し、シリカ膜スピン−カラム(Qiagen miRNeasyキット、カタログ番号217004)を製造業者の推奨基準に従って用いて精製した。NanoDrop ND−1000分光光度計(Thermo Scientific)を用いてRNAを分析して濃度および純度を決定し、2100 Bioanalyzer(Agilent Technologies)を用いてRNA完全性(RIN)を測定した。その後、各試料をさらなるマイクロアレイでの処理まで−80℃で保存した。
cDNA調製
[00221] Affymetrixマイクロアレイとともに使用するために設計されたAmbion WT Expressionキット(Life Technologiesカタログ番号4440536)を使用して、全RNAをセンス鎖cDNAに変換し、増幅した。全RNA 200ngで出発して、T7プロモータープライマープロトコルを使用して逆転写によって一本鎖cDNAを調製した。DNAポリメラーゼを使用して、一本鎖cDNAを二本鎖cDNAに変換した。
マイクロアレイ処理
[00222] 全RNAから得たcDNAをAffymetrix GeneChip WT末端標識キット(Affymetrixカタログ番号900671)で標識した。標識されたcDNAをGene 1.0 STマイクロアレイ(Affymetrixカタログ番号901085)にハイブリダイズし、Affymetrix GeneChip Scannerで分析した。標準Affymetrix Gene 1.0 ST CDFおよびRMA[38]を使用して、患者試料各々についての個々のCELファイルを正規化した。
[00223] Affymetrixマイクロアレイとともに使用するために設計された市販用キット(Ambion WT;Life Technologies、カタログ番号4440536)を使用して全RNAをセンス鎖cDNAに変換した。全RNA 200ngで出発して、T7プロモータープライマープロトコルを使用して逆転写によって一本鎖cDNAを調製した。DNAポリメラーゼを使用して、一本鎖cDNAを二本鎖cDNAに変換した。二本鎖cDNAは、cRNAのインビトロ転写のテンプレートとして作用し、次いでそのcRNAを精製して酵素、塩、無機リン酸塩および組み込まれていないヌクレオチドを除去した。UV吸収を使用してcRNAの収量を測定し、次いで、精製されたcRNA 10μgを使用して、ランダムプライマーおよびdUTP/dNTPの混合物を用いる逆転写によって、標識センス鎖cDNAを生成し、断片化し、GeneChip WT末端標識キット(Affymetrix、カタログ番号900671)を使用して標識した。Hybridization, Wash and Stainキット(Affymetrixカタログ番号900720)を使用して、その標識cDNAをGene 1.0 STマイクロアレイ(Affymetrixカタログ番号901085)にハイブリダイズし、45℃で16時間インキュベートした。ハイブリダイゼーション後、アレイを洗浄し、標準Affymetrix手法を使用して染色した後、Affymetrix GeneChip Scannerでスキャンし、データをExpression Consoleソフトウェア(Affymetrix)を使用して抽出した。したがって、本明細書に記載するマイクロアレイは天然分子の発現を測定しておらず、むしろこれらのマイクロアレイは、天然に存在しないcDNA分子の発現を測定する。
分類子開発
[00224] 遺伝子発現分類子を多工程プロセスで導出した。初期モデル化は、トレーニングデータを使用して、3つの臨床的共変数(性別、たばこ使用、および喫煙歴)と関連する遺伝子(「遺伝子発現相関物」)を選択して、これらの臨床的変数の遺伝子発現相関物を同定することからなった。次いで、肺がん関連遺伝子を選択し、最後に、がん遺伝子と遺伝子発現相関物と患者年齢と組合せに基づいて肺がんの尤度を予測するための分類子を決定した。この分類子開発手法のすべての態様を、交差検証を使用して、およびトレーニングセットからのデータのみを使用して決定した。
臨床因子遺伝子発現相関物(CFGC)
[00225] 性(男性/女性)、喫煙状態(現行/既往)、およびパック年(<10/>10)を含む、この研究集団における肺がんの共変数をモデル化して、臨床因子の遺伝子発現相関物を同定した。経験的ベイズt検定を使用して、発現が臨床因子の各々と有意に関連する遺伝子を同定した。次に、各臨床因子の値を予測するために使用することができる遺伝子をスパースに選択した[36]。最後に、性別(GG)、喫煙状態(GS)およびパック年(GPY)の遺伝子発現相関物からの予測値を患者ごとにコンピュータ処理し、肺がん関連遺伝子発現がある遺伝子の選択に、および下で説明する肺がん分類子に使用した。
肺がん遺伝子の選択
[00226] トレーニングデータ、CFGCおよび患者年齢を予測子として使用し、肺がん状態(1=がん陽性および0=がん陰性)を従属変数として用いるロジスティック回帰モデルをフィッティングした。次に、遺伝子発現値を独立変数として使用し、ロジスティック回帰モデル残差を従属変数として使用して、経験的ベイズ線形モデルをフィッティングした。これを使用して、病態と最もよく直接相関し、臨床的共変数とは無関係の遺伝子を選択した。この分析からの上位肺がん関連遺伝子を、階層的クラスタリングを使用して分類した。交差検証を使用して、遺伝子を反復的に選択してAUCを最大にして、予測精度を推定した。この目的は、最高分類子性能を累積的にもたらすクラスター、およびそれらのクラスターの各々を最もよく表す特異的遺伝子を選択することであった。遺伝子滴定分析も実施して、最適な性能をもたらすクラスター当たりの遺伝子数を決定した。選択されたクラスターについて、上位遺伝子を平均して、患者/クラスターの組合せごとにクラスター平均推定値を得た。DAVID[37]を使用してがんクラスター各々の中の遺伝子の機能分析を実施して、分類子のがん関連遺伝子を記述する生物学的タームを特定した。
肺がん分類子
[00227] 肺がん状態を結果変数として使用し、がん遺伝子発現推定値、患者年齢、性別(GG)、喫煙状態(GS)、パック年(GPY)のCFGCを予測子として使用して、肺がん分類子を開発した。ペナルティ付きロジスティック回帰モデルを使用してモデルをフィッティングした。ペナルティ付加因子(ラムダ)は、臨床的/遺伝子発現相関物について0であり、遺伝子発現クラスター推定の各々について10であった。結果として生ずるスコアは、0〜1段階尺度である。肺がん状態を予測するためのスコア閾値を、気管支鏡検査で診断できない患者についておおよそ90%の感度を達成するように定めた。肺がん状態を予測するために(臨床的に決定した)年齢、性別、喫煙状態およびパック年をロジスティック回帰モデルに組み入れた「臨床モデル」を作成することによって、単独での臨床因子と比較して肺がんを予測する遺伝子発現分類子の利益の評価を実施した。肺がん状態を予測する性能の点での完全遺伝子発現分類子と臨床因子分類子との差を、トレーニングセットにおける各モデルのAUCの比較によって評定した。
独立検査セットの分析
[00228] この研究において導出したロックされた分類子の性能を評定するために、以前の研究[35]からのデータを独立検査セットとして使用した。その研究では、BECは、肺がんの疑いのため気管支鏡検査を受けた患者から気管支鏡検査時に採取され、RNAは、マイクロアレイ(Affymetrix HG-U133A)で分析された。Bioconductor Rパッケージ(バージョン1.28.1)のRobust Multiarray Average(RMA)[38]を使用して、その研究からのCELファイル(n=163)を正規化し直して遺伝子レベル発現値を生成した。この処理は、交差プラットフォーム分析を助長するために、Entrez Gene特異的プローブセットチップ定義ファイル(CDF)[39]をAffymetrixによって提供されている標準U133A CDFの代わりに使用した。統計コンピュータ処理のためのR環境(バージョン2.9.2)を使用して分析を行った。
[00229] マイクロアレイプラットフォームの差に対応するために2つの変更を加えて、分類子を検査セットの患者に適用した。第一に、試験セットにおける各遺伝子の発現レベルの平均をトレーニングセットで観察された平均に移す遺伝子ワイズ定数(gene wise constant)によって、HG−U133A RMA発現値を調整した。第二に、対応するHG−U133Aプローブセットが入手できない場合の分類子遺伝子(LYPD2およびRNF150)については、トレーニングセットにおける遺伝子の平均発現値を検査セット試料のすべてに使用した。
統計法
[00230] 予測精度の標準測定値:曲線下面積(AUC)、感度、特異性、NPVおよびPPVを使用して、分類子精度を評定した。10%試料分割セットを使用する交差検証をトレーニングセットで使用して、これらのアプローチを使用して作成した予測分類子の性能を推定した[40]。これらの性能推定値を使用して、分類子発見手法の開発を誘導した。最終モデルを設定した後、検査セットの一度の分析を行った。フィッシャー正確確率検定を使用して、すべてのカテゴリー変数の統計的有意性を算出し、連続変数にはt検定を使用した。
結果
研究対象集団
[00231] 肺がんと診断された患者223名および良性疾患と診断された患者76名からなるAEGIS1からの患者299名のセット(表1)を使用して、本発明者らの発現分類子を導出した。独立検査セットの特徴は、前に説明した[ ]。ここではそれを要約する。研究デザインは、ここで説明するものと同様であったが、研究集団が多少異なった。患者は、検査セットと比較してトレーニングセットでのほうが平均して年上であった(p<0.001)(しかし、肺がんと診断された患者については年齢に有意差はなかった(p=0.959))。トレーニングセットのほうが、現行喫煙者も少なく(p=0.050)、3cm未満の病変を有する患者の割合も小さかった(p<0.001)。加えて、肺がんの有病率は、トレーニングセットのほうが高かった(75%対48%;p<0.001)。
分類子の導出および性能の評価
[00233] 遺伝子発現は、アレイ上の遺伝子の大きな割合が、現行喫煙状態と関連した(p<0.001で6477遺伝子;上位10遺伝子を表22に報告する)。交差検証に基づいて、ロジスティック回帰に基づく喫煙状態分類子として役立つように、上位にランクされた遺伝子のうちの3つ(SLC7A11、TKTおよびCLND10)を選択した。この喫煙状態分類子は、トレーニングセット内で0.93のAUCを有した。喫煙状態とは無関係の喫煙歴についてのさらなるCFGCを導出し、このCFGCは、パック年で測定した累積煙曝露に基づくものであった。喫煙歴(<10PY対>10PY)は、531の遺伝子の発現と有意に関連した(p<0.001;上位10遺伝子を表23に報告する)。ロジスティック回帰に基づく喫煙歴分類子として役立つように、上位遺伝子のうちの2つ(RUNX1T1、AKR1C2)を選択し、この分類子は、トレーニングセット内で0.78のAUCを有した。性は、339の遺伝子と有意に関連した(p<0.001;上位10遺伝子を表24に報告する)。最上位にランクされた遺伝子(RPS4Y1)は、トレーニングセット内で性の完璧な分類子(AUC=1)であった。
[00237] 方法に関して説明したように、本発明者らは、発現が肺がんのCFGCモデルからの残差と有意に関連する遺伝子を同定した。合計232のがん関連遺伝子(表25)は、有意性基準(Tスコア>2.7)を満たした。232遺伝子のペアワイズ相関、続いての階層的クラスタリングを調査して、同様の発現パターンを有する遺伝子を同定し、それらの遺伝子を11のクラスターに分割した(図7)。各クラスター内の遺伝子は相関していたので、本発明者らは、各クラスター内の遺伝子の小セットの平均を使用して、スパースにクラスターを表すことができるという仮説を立てた。本発明者らは、AUCを推定するために交差検証を使用して分類子を最適化した。本発明者らは、発現が肺がんと最も強く関連する遺伝子クラスターを表す遺伝子を選択し、クラスター1、2、4、7、9および10の組み入れによって最高AUCが得られると断定した。本発明者らはまた、クラスター当たり2〜4遺伝子を超えると検査性能が向上しないと断定した。交差検証で、トレーニングセットのすべての患者(n=299)についてAUC=0.80(95%CI、0.75〜0.84)。気管支鏡検査で診断できない患者のサブセット(n=134)について、性能は同様であった(AUC=0.81;95%CI、0.74〜0.87)。
[00239] 次いで、全トレーニングセットに対して最終分類子発見手法を使用して最終肺がん分類子を決定した。この分類子は、予測子としての6つのがん遺伝子クラスター(合計17の遺伝子によって表される)と患者年齢と遺伝子発現相関物(GG、GS、GPY)(表26)の組合せからなった。0.65のスコア閾値を使用して二分類を行った(スコア>/=0.65を有する患者をがん陽性と予測し、0.65未満を有する患者をがん陰性と予測した)。この分類子は、トレーニングセットで93%の感度および57%の特異性を有し、肺がんについて気管支鏡検査で診断できなかった患者のサブセット(AUC=0.78;95% 0.71〜0.85)と比較して全トレーニングセットについての分類子のAUC(0.78;95%CI、0.73〜0.82)に有意差はなかった(図9を参照されたい)。
[00241] a)ゲノム性別は、RPS4Y1<7.5の場合、GG=1(女性)と定義し、そうでなければ0(男性)と定義した。予測ゲノム喫煙(GS)値を導出した(式中、x=40.8579−0.4462*SLC7A11−2.1298*CLND10−1.8256*TKT、およびゲノム喫煙GS=e/(1+e))。予測ゲノムパック年(GPY)値を導出した(式中、x=−5.1429+2.1891*RUNX1T1−0.9506*AKR1C2、およびゲノムパック年GPY=exp(x)/(1+exp(x)))。予測分類子の一般式は、スコア=e/(1+e)(式中、y=b+Σ(b*x)、この式中、bは切片であり、bは、係数であり、およびxは、特徴事項(示した通り)である)であった。
[00242] b)特徴事項は、患者年齢(報告された通り)、方法に関して説明した通りのGG、GS、GPY、およびCA(i)、肺がん遺伝子クラスター(図7に示す)を含む。
[00243] 遺伝子発現分類子は、トレーニングセットにおいて、単独で臨床因子を使用するモデル(AUC=0.72;95%CI、0.67〜0.77)より有意に良好に機能した(AUC=0.78;95%CI、0.73〜0.82)(p<0.001)。17がん遺伝子の機能分析を別々に要約する(表27)。がんに関連して、これらの遺伝子のうちの9つがダウンレギュレートされ、8つがアップレギュレートされる。
独立検査セットの検証
[0245] 独立検査セットの気管支鏡検査で診断できない患者(n=123)では、分類子のAUCが0.81(95%CI、0.73〜0.88)(図8)であり、これは、トレーニングセットの気管支鏡検査で診断できない患者に関する性能(AUC=0.78;95% 0.71〜0.85;p=0.495)と同様であった。感度は92%であり、特異性は55%であり、NPVは94%であった(95%CI、83〜99%)、(表28を参照されたい)。興味深いことに、本発明者らは、がんについての分類子の感度に対するがん組織学およびがんの病期(表29)ならびに病変のサイズ(表30)のいずれの効果も観察しなかった。さらに、検査セットでは、分類子は、現行喫煙者に関して0.79のAUCおよび既往喫煙者に関して0.82のAUCを有した。これは、喫煙状態が分類子性能に対して劇的な影響を及ぼさないことを示唆している(p=0.710)。単独での気管支鏡検査と比較したとき、遺伝子発現分類子と気管支鏡検査の併用は、51%から95%に感度を向上させた(p<0.001)。
[00248] 肺がんの疑いのため気管支鏡検査手法での診断を受けた163名の患者のうち、78名はがんと診断された。肺がん診断は、患者40名に関しては気管支鏡検査で下され(a)(51%;95%CI、40〜62%)、気管支鏡検査で診断が下されなかった残りの肺がん患者に関しては、分類子は、彼らのうちの34名を正しく予測した(b)(89%;95%CI、75〜96%)。気管支鏡検査と併用した分類子は、肺がんを有する患者78名のうちの74名(95%;95%CI、87〜98%)の検出をもたらした(c)。亜型および病期による肺がんについての気管支鏡検査、分類子および併用手法の感度も示す。
[00250] 肺がんと診断された患者および良性疾患と診断された患者を含む。
[00251] 表26に目的の複数の遺伝子発現分類子が列挙されている。次の表、表31は、遺伝子発現分類子についての記述的裏付けを与える、NCBIで入手できる、遺伝子IDを提供するものである。遺伝子分類子CD177を、CD177.1およびCD177.2という2つの名称で表31に示す。このCD177.1およびCD177.2という名称で、2つの異なるプローブセットが、これらの遺伝子分類子によって表される遺伝子の差次的発現を検出するアレイで使用されることを識別する。図10Aは、CD177.1に対応する、CD177へのハイブリダイゼーションに利用した19のプローブを開示するものである。図10Bは、CD177.2に対応する、CD177へのハイブリダイゼーションに利用した4つのプローブを開示するものである。
結果の評価
[00253] 現行および既往喫煙者の気管支気道からの正常な上皮細胞に、たばこの煙への曝露および肺がんの存在に関連する持続的遺伝子発現変化があることは、研究によって立証されている[32、41、42、43]。気管支鏡検査中に得られるこれらの比較的非侵襲的に採取された検体において肺がんを正確に検出できる分類子を、これらのがんに関連する差を使用して導出することができる[35]。現行の診療では、気管支鏡検査が悪性腫瘍の所見をもたらさない場合に肺がんを除外することは難題であり、偽陰性率は20〜70%に及びうる[28]。現行のガイドラインは、疾患のリスクが高い患者は、より侵襲的な追跡調査診断手法を進めるべきであることを示唆しており[28]、これらの診断手法は合併症のリスクが高い[31]。しかし、不確性のため、これらの手法は、良性疾患を有することが判明する患者に実施されることが多い[33]。したがって、本発明者らの目標は、気管支鏡検査中に近位気道から遺伝子発現分類子を得て全体的な感度を増加させること、気管支鏡検査で診断できない場合の曖昧さを最小にすること、および不必要な侵襲的手法の必要性を低減させることであった。
[00254] 本研究において、本発明者らは、より大きい多施設研究からの肺がんが疑われるため気管支鏡検査を受ける現行および既往喫煙者のコホートを活用して、肺がんの遺伝子発現分類子を導出した。この分類子は、高い感度および高いNPVを有する多変量ロジスティック回帰モデルである。重要なこととして、本発明者らは、肺がんが疑われるため気管支鏡検査を受ける喫煙者から採取した気道試料の以前に発表した研究からのデータを使用して、独立コホートでこの分類子の性能を検証した。検査セットにおける気管支鏡検査で診断できない患者での感度は92%であり、特異性は55%である。単独での気管支鏡検査についての69%のNPVと比較してこの検査セットでのNPVは94%であり、これは、医師が、気管支鏡検査で診断できなかった後、肺がんを有する可能性の低い患者を確実に同定することにこの分類子が役立つことを示唆している。
[00255] 肺がんを有する現行および既往喫煙者の正常に見える気道上皮において差次的に発現される遺伝子の機能は、損傷フィールドの基礎となる生物学を理解する上での手がかりとなる。抑制される遺伝子の中には、CD177およびBST1をはじめとする免疫応答に関与する多数の遺伝子があり、これは、肺がんを有する喫煙者の気道における免疫応答障害を示唆している。発現がp53ノックダウンによって抑制され、肺腺癌の予後不良に関連する遺伝子TSPAN2[44]も、がん患者において低レベルで発現される。異物代謝、たばこの煙の中の発がん物質のプロセッシング、および他の上皮がんの発がんに関与する遺伝子であるEPHX3も、ダウンレギュレートされる[45]。肺がんの場合にアップレギュレートされる分類子遺伝子の中で、NOVA1およびCDR1は、主としてニューロンで発現されるが腫瘍でも発現され、小細胞肺がんをはじめとするいくつかの悪性腫瘍における傍腫瘍性抗体と関連する[46、47、48、49、50]。さらに、肺がんの場合にアップレギュレートされるMCAMは、基底気管支上皮細胞において発現される[51]。MCAMは、修復中の気管上皮においても強く、一過的にアップレギュレートされ[52]、気道上皮再生に必要であり[53]、COPD[54]および喘息[55]の患者の気管支上皮においてアップレギュレートされる。SDC2およびNKX3−1ならびに細胞周期停止媒介因子CGREF1を含む、細胞成長および増殖を調節する多数の分類子遺伝子が、肺がん患者でアップレギュレートされる。最後に、本発明者らの分類子の中で、喫煙状態を予測するために選択されるCFGC遺伝子(SLC7A11、CLDN10、TKT)および喫煙歴を予測するために選択されるCFGC遺伝子(RUNX1T1、AKR1C2)は、たばこ煙曝露によって変化し、それによって気道上皮生態に対する喫煙の頑強な作用が確認されることが以前に報告されている[11、18、33]。
[00256] 本発明者らの発見アプローチは、遺伝子発現に基づく肺がん診断に関する以前の研究[35]を、主として、肺がんに関連する発現を用いて特徴事項の選択前に予測モデルの成分としての臨床的共変数を明確にモデル化することで拡大する。環境障害および他の臨床因子に対する応答が個体間でかなり異なりうることは、公知である。したがって、本発明者らのアプローチは、環境障害(例えば、累積煙曝露)に対する患者レベルの生理的応答を把握する(capture)ために遺伝子発現を使用するアプローチであった。この応答は実際に報告される値より疾患リスクをより大きく反応しうるからである[57]。本発明者らのアプローチのもう1つの構成要素は、モデル化された臨床因子を考慮に入れた上で、発現ががんと関連する遺伝子を選択することであった。このアプローチは、がん関連の遺伝子発現を伴う遺伝子によって把握されるがんの尤度についての情報が、モデル化された臨床因子によって把握されるがんについての情報とは無関係であることを保証するのに役立つという仮説を、本発明者らは立てた。本発明者らの分類子発見アプローチのさらなる重要な態様は、クラスタリングによって独立したがん関連遺伝子発現パターンを同定し、次いでがん関連遺伝子発現モジュールの各々についての相加的効果としてがんをモデル化する、本発明者らの方法論であった。がんとの関連性に従って全体的に上位にランクされる遺伝子のみを選択すると、単一のがん関連分子プロセスを反映する遺伝子の全集団を選択する結果となる可能性がありうるのであるが、本発明者らの方法論はこれとは対照的である。正常に見える気道上皮細胞において肺がんのリスクを予測するための遺伝子発現分類子を導出する以前の研究によって、気管支鏡検査で診断できない場合に高い感度およびNPVを有する同様の結果が記載されている[35]。その分類子には、ここに記載するものと比較して共通する遺伝子はないが、本発明者らは、本発明者らの新規分類子が、その独立検査セットにおいて強い性能をもたらす同様の作用機序を示すと考えている。しかし、これを選択する特異的遺伝子の差は、特徴事項選択プロセスの差に起因しうる。
[00257] 本発明者らは、疑わしい肺がんに気管支鏡検査とともに使用することができる、近位気道からの細胞を使用する肺がんについての遺伝子発現分類子を導出した。本発明者らは、独立検査セットにおいてこの分類子の性能を検証した。この分類子は、高いNPVをもたらす気管支鏡検査手法に相当な感度を付加する。この分類子は、気管支鏡検査で診断できない場合に肺がんを有するリスクが低い患者を同定することによって意思決定に役立つように使用することができる。
[00258] このように本開示の少なくとも1つの実施形態のいくつかの態様を説明したが、様々な代替、修飾および改良が当業者には容易に思いつくことは理解されるはずである。そのような代替、修飾および改良は、本開示の一部であると考え、本開示の趣旨および範囲内であると考える。したがって、上述の説明および図面は、例としてのものに過ぎず、本開示を後続の特許請求項によって詳細に記述する。
[00259] 請求項における請求項構成要素を修飾するための、「第一の」、「第二の」、「第三の」などのような序数の用語の使用は、それだけでは、優先性、優先順位、ある請求項構成要素の別の請求項構成要素に対する順序、または方法の行為を行う時間的順序を含意せず、請求項構成要素を区別するために、特定の名前を有するある請求項構成要素と(序数の用語の使用のため)同じ名前を有する別の請求項構成要素とを区別するための表示として使用するものにすぎない。
参照による組み入れ
[00260] 本明細書に引用するすべての参考文献、論文、出版物、特許、公開特許および特許出願は、それら全体があらゆる目的で組み入れられる。
参考文献
1. Gould, M. K., Donington, J., Lynch, W. R., et al. Evaluation of individuals with pulmonary nodules: When is it lung cancer?: Diagnosis and management of lung cancer: American College of Chest Physicians evidence-based clinical practice guidelines. CHEST Journal 2013; 143(5_suppl): e93S-e120S.
2. Tukey, M. H., & Wiener, R. S. . Population-based estimates of transbronchial lung biopsy utilization and complications. Respiratory medicine 2012; 106(11): 1559-1565.
3. Ernst A, Silvestri G, Johnstone D. Interventional Pulmonary Procedures: Guidelines from the American College of Chest Physicians. Chest 2003;123;1693-1717
4. Rivera MP, Mehta AC, Wahidi MM. Establishing the Diagnosis of Lung Cancer: Diagnosis and Management of Lung Cancer, 3rd ed: American College of Chest Physicians Evidence-Based Clinical Practice Guidelines. Chest 2013;143: e142S-65S.
5. Memoli, J. S. W., Nietert, P. J., & Silvestri, G. A. Meta-analysis of guided bronchoscopy for the evaluation of the pulmonary nodule. CHEST Journal 2012; 142(2): 385-393.
6. Ost, D., Fein, A. M., & Feinsilver, S. H. (2003). The solitary pulmonary nodule. New England Journal of Medicine, 348(25), 2535-2542.
7. Grogan, E. L., Weinstein, J. J., Deppen, S. A., et al. Thoracic operations for pulmonary nodules are frequently not futile in patients with benign disease. Journal of thoracic oncology: official publication of the International Association for the Study of Lung Cancer 2011, 6(10): 1720.
8. Detterbeck, F. C., Mazzone, P. J., Naidich, D. P., & Bach, P. B. Screening for lung cancer: diagnosis and management of lung cancer: American College of Chest Physicians evidence-based clinical practice guidelines. CHEST Journal 2013; 143(5_suppl): e78S-e92S.
9. Wiener, R. S., Wiener, D. C., & Gould, M. K. Risks of Transthoracic Needle Biopsy: How High? Clinical pulmonary medicine 2013; 20(1): 29.
10. Covey, A. M., Gandhi, R., Brody, L. A., Getrajdman, G., Thaler, H. T., & Brown, K. T. Factors associated with pneumothorax and pneumothorax requiring treatment after percutaneous lung biopsy in 443 consecutive patients. Journal of vascular and interventional radiology 2004; 15(5): 479-483.
11. Geraghty, P. R., Kee, S. T., McFarlane, G., Razavi, M. K., Sze, D. Y., & Dake, M. D. CT-guided Transthoracic Needle Aspiration Biopsy of Pulmonary Nodules: Needle Size and Pneumothorax Rate 1. Radiology 2003; 229(2): 475-481.
12. Golub, T. R., Slonim, D. K., Tamayo, P., et al. Molecular classification of cancer: class discovery and class prediction by gene expression monitoring. Science 1999; 286(5439): 531-537.
13. Spira A, Beane JE, Shah V, et al. Airway epithelial gene expression in the diagnostic evaluation of smokers with suspect lung cancer. Nature medicine 2007;13:361-6.
14. Hanley JA, McNeil BJ. The meaning and use of the area under a receiver operating characteristic (ROC) curve. Radiology 1982;143:29-36.
15. MacMahon, H., Austin, J. H., Gamsu, G., et al. Guidelines for management of small pulmonary nodules detected on CT scans: a statement from the Fleischner Society 1. Radiology 2005, 237(2): 395-400..
16. Beane, J., Sebastiani, P., Whitfield, T. H., et al. A prediction model for lung cancer diagnosis that integrates genomic and clinical features. Cancer Prevention Research 2008; 1(1): 56-64.
17. Gustafson, A. M., Soldi, R., Anderlind, C., et al. Airway PI3K pathway activation is an early and reversible event in lung cancer development. Science translational medicine 2010; 2(26): 26ra25-26ra25.
18. Kadara, H., Fujimoto, J., Yoo, S. Y., Maki, et al. Transcriptomic architecture of the adjacent airway field cancerization in non-small cell lung cancer. Journal of the National Cancer Institute 2014; 106(3): dju004.
19. Alexander, E. K., Kennedy, G. C., Baloch, et al. Preoperative diagnosis of benign thyroid nodules with indeterminate cytology. New England Journal of Medicine 2012, 367(8): 705-715.
20. McWilliams A, Tammemagi MC, Mayo JR, et al. Probability of cancer in pulmonary nodules detected on first screening CT. N Engl J Med 2013;369:910-9.
21. Ost DE, Gould MK. Decision making in patients with pulmonary nodules. American journal of respiratory and critical care medicine 2012;185:363-72.
22. Irizarry, R. A., Bolstad, B. M., Collin, F., Cope, L. M., Hobbs, B., & Speed, T. P. (2003). Summaries of Affymetrix GeneChip probe level data. Nucleic acids research, 31(4), e15-e15.
23. Johnson WE, Li C, Rabinovic A. Adjusting batch effects in microarray expression data using empirical Bayes methods. Biostatistics 2007; 8: 118-127.
24. Howlader N, Noone AM, Krapcho M, et al. SEER stat fact sheets: lung and bronchus. Available online: http://seer.cancer.gov/statfacts/html/lungb.html.
25. The National Lung Screening Trial Research Team. Reduced Lung-Cancer Mortality with Low-Dose Computed Tomographic Screening. N Engl J Med 2011; 365:395-409
26. Tanoue LT, Tanner NT, Gould MK, Silvestri GA. Lung Cancer Screening. Am J Respir Crit Care Med. published online 04 Nov 2014
27. Ernst A, Silvestri G, Johnstone D. Interventional Pulmonary Procedures: Guidelines from the American College of Chest Physicians. Chest 2003;123;1693-1717
28. Rivera, M. P., Mehta, A. C., & Wahidi, M. M. (2013). Establishing the Diagnosis of Lung Cancer Diagnosis and Management of Lung Cancer, 3rd ed: American College of Chest Physicians Evidence-Based Clinical Practice Guidelines. CHEST Supplement. Chest, 143, e143S.
29. Silvestri, G. A., Feller-Kopman, D., Chen, A., Wahidi, M., Yasufuku, K., & Ernst, A. (2012). Latest Advances in Advanced Diagnostic and Therapeutic Pulmonary Procedures Update on Pulmonary Procedures. CHEST Journal, 142(6), 1636-1644.
30. Gildea, T. R., Mazzone, P. J., Karnak, D., Meziane, M., & Mehta, A. C. (2006). Electromagnetic navigation diagnostic bronchoscopy: a prospective study. American journal of respiratory and critical care medicine, 174(9), 982-989.
31. Wiener, R. S., Schwartz, L. M., Woloshin, S., & Welch, H. G. (2011). Population-based risk for complications after transthoracic needle lung biopsy of a pulmonary nodule: an analysis of discharge records. Annals of internal medicine, 155(3), 137-144.
32. Fontaine-Delaruelle, C., Ferretti, G., Gamondes, D., Pradat, E., Souquet, P. J., & Couraud, S. (2014). Is transthoracic core needle biopsy under CT scan a good deal for benign diseases' diagnosis?. European Respiratory Journal, 44(Suppl 58), P679.
33. Smith MA, Battafarano RJ, Meyers BF, Zoole JB, Cooper JD, Patterson GA. Prevalence of benign disease in patients undergoing resection for suspected lung cancer. The Annals of thoracic surgery 2006;81:1824-1828; discussion 1828-1829
34. Beane, J., Sebastiani, P., Liu, G., Brody, J. S., Lenburg, M. E., & Spira, A. (2007). Reversible and permanent effects of tobacco smoke exposure on airway epithelial gene expression. Genome Biol, 8(9), R201.
35. Spira A, Beane JE, Shah V, Steiling K, Liu G, Schembri F, Gilman S, Dumas YM, Calner P, Sebastiani P, Sridhar S, Beamis J, Lamb C, Anderson T, Gerry N, Keane J, Lenburg ME, Brody J. Airway epithelial gene expression in the diagnostic evaluation of smokers with suspect lung cancer. Nature Medicine 2007; 13(3):361-6
36. Tibshirani, R. (1996). Regression shrinkage and selection via the lasso. Journal of the Royal Statistical Society. Series B (Methodological), 267-288.
37. Da Wei Huang, B. T. S., & Lempicki, R. A. (2008). Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources. Nature protocols, 4(1), 44-57.
38. Irizarry, R. A., Hobbs, B., Collin, F., Beazer‐Barclay, Y. D., Antonellis, K. J., Scherf, U., & Speed, T. P. (2003). Exploration, normalization, and summaries of high density oligonucleotide array probe level data. Biostatistics, 4(2), 249-264.
39. Dai, M., Wang, P., Boyd, A. D., Kostov, G., Athey, B., Jones, E. G., et al., (2005). Evolving gene/transcript definitions significantly alter the interpretation of GeneChip data. Nucleic acids research, 33(20), e175-e175.
40. Golub, T. R., Slonim, D. K., Tamayo, P., Huard, C., Gaasenbeek, M., Mesirov, J. P., et al., (1999). Molecular classification of cancer: class discovery and class prediction by gene expression monitoring. Science, 286(5439), 531-537.
41. Kadara, H., Fujimoto, J., Yoo, S. Y., Maki, Y., Gower, A. C., Kabbout, M., et al., (2014). Transcriptomic Architecture of the Adjacent Airway Field Cancerization in Non-Small cell lung cancer. Journal of the National Cancer Institute, 106(3)
42. Steiling, K., Ryan, J., Brody, J. S., & Spira, A. (2008). The field of tissue injury in the lung and airway. Cancer prevention research, 1(6), 396-403.
43. Bosse, Y., Postma, D. S., Sin, D. D., Lamontagne, M., Couture, C., Gaudreault, N., et al., (2012). Molecular signature of smoking in human lung tissues. Cancer research, 72(15), 3753-3763.
44. Otsubo, C., Otomo, R., Miyazaki, M., Matsushima-Hibiya, Y., Kohno, T., Iwakawa, R., et al., (2014). TSPAN2 Is Involved in Cell Invasion and Motility during Lung Cancer Progression. Cell reports, 7(2), 527-538.
45. Oster, B., Thorsen, K., Lamy, P., Wojdacz, T. K., Hansen, L. L., Birkenkamp‐Demtroder, K., et al., (2011). Identification and validation of highly frequent CpG island hypermethylation in colorectal adenomas and carcinomas. International journal of cancer, 129(12), 2855-2866.
46. Knudsen, A., Monstad, S. E., Dorum, A., Lonning, P. E., Salvesen, H. B., Drivsholm, L., et al., (2006). Ri antibodies in patients with breast, ovarian or small cell lung cancer determined by a sensitive immunoprecipitation technique. Cancer Immunology, Immunotherapy, 55(10), 1280-1284.
47. Buckanovich, R. J., Posner, J. B., & Darnell, R. B. (1993). Nova, the paraneoplastic Ri antigen, is homologous to an RNA-binding protein and is specifically expressed in the developing motor system. Neuron, 11(4), 657-672.
48. Salemi, M., Fraggetta, F., Galia, A., Pepe, P., Cimino, L., Condorelli, R. A., & Calogero, A. E. (2013). Cerebellar degeneration-related autoantigen 1 (CDR1) gene expression in prostate cancer cell lines. The International journal of biological markers, 30;29(3):e288-90
49. Tanaka, M., Tanaka, K., Onodera, O., & Tsuji, S. (1995). Trial to establish an animal model of paraneoplastic cerebellar degeneration with anti-Yo antibody: 1. Mouse strains bearing different MHC molecules produce antibodies on immunization with recombinant Yo protein, but do not cause Purkinje cell loss. Clinical neurology and neurosurgery, 97(1), 95-100.
50. Furneaux, H. M., Rosenblum, M. K., Dalmau, J., Wong, E., Woodruff, P., Graus, F., & Posner, J. B. (1990). Selective expression of Purkinje-cell antigens in tumor tissue from patients with paraneoplastic cerebellar degeneration. New England Journal of Medicine, 322(26), 1844-1851.
51. Shih, I. M., Nesbit, M., Herlyn, M., & Kurman, R. J. (1998). A new Mel-CAM (CD146)-specific monoclonal antibody, MN-4, on paraffin-embedded tissue. Modern pathology: an official journal of the United States and Canadian Academy of Pathology, Inc, 11(11), 1098-1106.
52. Tsukamoto, Y., Taira, E., Miki, N., & Sasaki, F. (2001). The role of gicerin, a novel cell adhesion molecule, in development, regeneration and neoplasia. Histol Histopathol. 2001; 16(2):563-71.
53. Tsukamoto, Y., Taira, E., Kotani, T., Yamate, J., Wada, S., Takaha, N., et al., (1996). Involvement of gicerin, a cell adhesion molecule, in tracheal development and regeneration. Cell Growth Differ. 7(12), 1761-1767.
54. Schulz, C., Petrig, V., Wolf, K., Kratzel, K., Kohler, M., Becker, B., & Pfeifer, M. (2003). Upregulation of MCAM in primary bronchial epithelial cells from patients with COPD. Eur Respir J. 2003; 22(3):450-6.
55. Simon, G. C., Martin, R. J., Smith, S., Thaikoottathil, J., Bowler, R. P., Barenkamp, S. J., & Chu, H. W. (2011). Up-regulation of MUC18 in airway epithelial cells by IL-13: implications in bacterial adherence. Am J Resp Cell Mol Biol, 44(5), 606-613.
56. Penning, T. M., & Lerman, C. (2008). Genomics of smoking exposure and cessation: lessons for cancer prevention and treatment. Cancer Prevention Research, 1(2), 80-83.
57. Lampe, J. W., Stepaniants, S. B., Mao, M., Radich, J. P., Dai, H., Linsley, P. S., et al., (2004). Signatures of environmental exposures using peripheral leukocyte gene expression: tobacco smoke. Cancer Epidemiology Biomarkers & Prevention, 13(3), 445-453.

Claims (13)

  1. 対象が肺がんを有する尤度を決定する方法であって、
    (a)対象の生体試料のmRNAを、
    (i)肺がん状態に関係する1つまたは複数の情報提示遺伝子の、前記生体試料におけるmRNA発現レベルを決定する工程と、
    (ii)前記対象の1つまたは複数の自己報告可能な特徴に関係する1つまたは複数のゲノム相関遺伝子の前記生体試料におけるmRNA発現レベルを決定する工程であって、前記対象の1つまたは複数の自己報告可能な特徴は喫煙状態、喫煙歴、または年齢を含み、前記ゲノム相関遺伝子は、(1)前記対象の1つまたは複数の自己報告可能な特徴が喫煙状態を含む場合、SLC7A11、CLND10またはTKTを含み、(2)前記対象の1つまたは複数の自己報告可能な特徴が喫煙歴を含む場合、AKR1C2またはRUNX1T1を含み、または(3)前記対象の1つまたは複数の自己報告可能な特徴が年齢を含む場合、CD52、SYT8、TNNT3、ALXI、KLRKI、RASA3、CERS3、ASPA、GRP、APOCI、EPHX3、REEPI、FAM198B、PCDHB4、PCDHB16、FOXD1、SPARC、NKAPLまたはGPR110を含む、工程と
    を含む遺伝子発現分析に付す工程、および
    (b)前記対象が肺がんを有する尤度を示す肺がんリスク評定を、(i)および(ii)において決定した発現レベルに基づいて決定する工程
    を含む方法。
  2. 前記対象の1つまたは複数の自己報告可能な特徴が、さらに性別を含前記ゲノム相関遺伝子が、さらにRPS4Y1を含む、請求項1に記載の方法。
  3. 前記1つまたは複数の情報提示遺伝子が、表11から選択される、請求項1または2に記載の方法。
  4. 前記1つまたは複数の情報提示遺伝子が、
    表11のクラスター1として同定される遺伝子のセットから選択される少なくとも2つの遺伝子、
    表11のクラスター2として同定される遺伝子のセットから選択される少なくとも2つの遺伝子、
    表11のクラスター3として同定される遺伝子のセットから選択される少なくとも2つの遺伝子、
    表11のクラスター4として同定される遺伝子のセットから選択される少なくとも2つの遺伝子、
    表11のクラスター5として同定される遺伝子のセットから選択される少なくとも2つの遺伝子、
    表11のクラスター6として同定される遺伝子のセットから選択される少なくとも2つの遺伝子、
    表11のクラスター7として同定される遺伝子のセットから選択される少なくとも2つの遺伝子、
    表11のクラスター8として同定される遺伝子のセットから選択される少なくとも2つの遺伝子、
    表11のクラスター9として同定される遺伝子のセットから選択される少なくとも2つの遺伝子、または、
    表11のクラスター10として同定される遺伝子のセットから選択される少なくとも2つの遺伝子
    を含む、請求項1〜3のいずれか一項に記載の方法。
  5. 前記1つまたは複数の情報提示遺伝子が、MYOTを含む、請求項1〜4のいずれか一項に記載の方法。
  6. 前記肺がんリスク評定が、重み付き発現レベルの合計に基づいて決定される、請求項1〜5のいずれか一項に記載の方法。
  7. 前記肺がんリスク評定が、工程(a)の(i)及び工程(a)の(ii)からのmRNA発現レベルからの重み付き発現レベルを用いるアルゴリズムを利用して決定される、請求項1〜6のいずれか一項に記載の方法。
  8. 前記肺がんリスク評定が、一定の集団内の肺がんの除外について90%より高い陰性的中率(NPV)を有するモデルに従って決定される、請求項1〜7のいずれか一項に記載の方法。
  9. 前記肺がんリスク評定が、慢性閉塞性肺疾患と診断された対象について85%より高い陰性的中率(NPV)を有するモデルに従って決定される、請求項1〜8のいずれか一項に記載の方法。
  10. 前記mRNA発現レベルが、肺がんを有する尤度増加の予測に対するそれらの相対的寄与によって重み付けされる、請求項1〜9のいずれか一項に記載の方法。
  11. 前記生体試料が、前記対象の呼吸上皮から得られる、請求項1〜10のいずれか一項に記載の方法。
  12. 工程(a)の前に、前記対象からの生体試料を細胞学的検査に付す工程をさらに含み、
    前記細胞学的検査により前記生体試料が不確定と示され、
    工程(a)が、不確定と示された前記生体試料のmRNAを遺伝子発現分析に付す工程を含む、請求項1〜11のいずれか一項に記載の方法。
  13. 前記対象から、前記1つまたは複数の自己報告可能な特徴を受け取る工程をさらに含む、請求項1〜12のいずれか一項に記載の方法。
JP2017523184A 2014-07-14 2015-07-14 肺がん状態の評価方法 Active JP6775499B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201462024456P 2014-07-14 2014-07-14
US62/024,456 2014-07-14
US201562160403P 2015-05-12 2015-05-12
US62/160,403 2015-05-12
PCT/US2015/040437 WO2016011068A1 (en) 2014-07-14 2015-07-14 Methods for evaluating lung cancer status

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2020126239A Division JP2020182489A (ja) 2014-07-14 2020-07-27 肺がん状態の評価方法

Publications (3)

Publication Number Publication Date
JP2017527304A JP2017527304A (ja) 2017-09-21
JP2017527304A5 JP2017527304A5 (ja) 2018-08-30
JP6775499B2 true JP6775499B2 (ja) 2020-10-28

Family

ID=55078998

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2017523184A Active JP6775499B2 (ja) 2014-07-14 2015-07-14 肺がん状態の評価方法
JP2020126239A Pending JP2020182489A (ja) 2014-07-14 2020-07-27 肺がん状態の評価方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2020126239A Pending JP2020182489A (ja) 2014-07-14 2020-07-27 肺がん状態の評価方法

Country Status (8)

Country Link
US (2) US20160130656A1 (ja)
EP (2) EP3916110A1 (ja)
JP (2) JP6775499B2 (ja)
KR (1) KR102461014B1 (ja)
CN (2) CN114807368A (ja)
AU (2) AU2015289758B2 (ja)
CA (1) CA2954169A1 (ja)
WO (1) WO2016011068A1 (ja)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2390347A1 (en) 2005-04-14 2011-11-30 Trustees Of Boston University Diagnostic for lung disorders using class prediction
EP1999472A2 (en) 2006-03-09 2008-12-10 The Trustees Of Boston University Diagnostic and prognostic methods for lung disorders using gene expression profiles from nose epithelial cells
AU2008302076B2 (en) 2007-09-19 2015-06-11 The Trustees Of Boston University Identification of novel pathways for drug development for lung disease
US9495515B1 (en) 2009-12-09 2016-11-15 Veracyte, Inc. Algorithms for disease diagnostics
WO2014186036A1 (en) 2013-03-14 2014-11-20 Allegro Diagnostics Corp. Methods for evaluating copd status
US11976329B2 (en) 2013-03-15 2024-05-07 Veracyte, Inc. Methods and systems for detecting usual interstitial pneumonia
WO2016073768A1 (en) 2014-11-05 2016-05-12 Veracyte, Inc. Systems and methods of diagnosing idiopathic pulmonary fibrosis on transbronchial biopsies using machine learning and high dimensional transcriptional data
KR20190026769A (ko) * 2016-06-21 2019-03-13 더 위스타 인스티튜트 오브 아나토미 앤드 바이올로지 유전자 발현 프로파일을 사용하여 폐암을 진단하기 위한 조성물 및 방법
WO2018009915A1 (en) 2016-07-08 2018-01-11 Trustees Of Boston University Gene expression-based biomarker for the detection and monitoring of bronchial premalignant lesions
WO2018050299A1 (en) * 2016-09-14 2018-03-22 Philip Morris Products S.A. Systems, methods, and gene signatures for predicting a biological status of an individual
US11244764B2 (en) 2016-12-21 2022-02-08 Cerner Innovation, Inc. Monitoring predictive models
US11408887B2 (en) 2017-05-22 2022-08-09 The National Institute for Biotechnology in the Negev Ltd. Biomarkers for diagnosis of lung cancer
WO2018223066A1 (en) * 2017-06-02 2018-12-06 Veracyte, Inc. Methods and systems for identifying or monitoring lung disease
US20210267488A1 (en) * 2018-07-02 2021-09-02 3M Innovative Properties Company Sensing system and method for monitoring time-dependent processes
KR102274564B1 (ko) * 2018-07-03 2021-07-07 (주) 프로큐라티오 빅데이터분석기반 암진단장치
CN108998531B (zh) * 2018-08-31 2021-10-01 昆明医科大学第一附属医院 肺癌下调长链非编码rna标志物及其应用
CN109615075B (zh) * 2018-12-14 2022-08-19 大连海事大学 一种基于多层聚类模型的居民日常行为识别方法
US20210287795A1 (en) * 2020-03-12 2021-09-16 Optellum Limited Cad device and method for assisting an estimation of lung disease from medical images
CN114196758B (zh) * 2020-03-30 2022-08-16 中国医学科学院肿瘤医院 外泌体arpc5、azi2等在肺癌诊断中的应用
CN113801936B (zh) * 2020-03-30 2022-04-19 中国医学科学院肿瘤医院 用于肺癌诊断的试剂盒、装置及方法
CN111863130A (zh) * 2020-04-07 2020-10-30 至本医疗科技(上海)有限公司 肿瘤免疫治疗预后标志物的筛选方法及应用
CN112034185A (zh) * 2020-09-11 2020-12-04 上海市胸科医院 Gpr110、vegfr、cd34在鉴别肺腺癌亚型中的用途
WO2022212283A1 (en) * 2021-03-29 2022-10-06 Veracyte, Inc. Methods and systems to identify a lung disorder
US20220327690A1 (en) * 2021-04-07 2022-10-13 Optellum Limited Cad device and method for analysiing medical images
CN113444796B (zh) * 2021-06-29 2023-02-07 浙江医院 与肺癌相关的生物标志物及其在诊断癌症中的应用
KR102417602B1 (ko) * 2021-11-30 2022-07-07 (주)플라스바이오 인공 지능 모델 기반 종양 관리 장치 및 방법
CN114854755B (zh) * 2022-05-30 2023-05-23 陕西师范大学 一种抑制vstm2l表达的慢病毒载体及其应用

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003097666A2 (en) * 2002-05-16 2003-11-27 Euro-Celtique, S.A. Use of gastrin releasing peptide (grp) and its receptor in cancer screening
CA3084542A1 (en) * 2003-06-10 2005-01-06 The Trustees Of Boston University Gene expression analysis of airway epithelial cells for diagnosing lung cancer
EP1692255A4 (en) 2003-11-12 2010-12-08 Univ Boston ISOLATION OF NUCLEIC ACID FROM MUNDEPLITHELZELLEN
EP2390347A1 (en) 2005-04-14 2011-11-30 Trustees Of Boston University Diagnostic for lung disorders using class prediction
US9347945B2 (en) 2005-12-22 2016-05-24 Abbott Molecular Inc. Methods and marker combinations for screening for predisposition to lung cancer
EP1999472A2 (en) 2006-03-09 2008-12-10 The Trustees Of Boston University Diagnostic and prognostic methods for lung disorders using gene expression profiles from nose epithelial cells
KR101443214B1 (ko) * 2007-01-09 2014-09-24 삼성전자주식회사 폐암 환자 또는 폐암 치료를 받은 폐암 환자의 폐암 재발 위험을 진단하기 위한 조성물, 키트 및 마이크로어레이
EP2156184B1 (en) * 2007-05-08 2013-11-27 Picobella, LLC Methods for diagnosing and treating prostate and lung cancer
AU2008302076B2 (en) 2007-09-19 2015-06-11 The Trustees Of Boston University Identification of novel pathways for drug development for lung disease
US20100055689A1 (en) 2008-03-28 2010-03-04 Avrum Spira Multifactorial methods for detecting lung disorders
GB0811413D0 (en) * 2008-06-20 2008-07-30 Kanton Basel Stadt Gene expression signatures for lung cancers
MX2012014268A (es) * 2010-07-09 2013-02-12 Somalogic Inc Biomarcadores de cancer de pulmon y usos de los mismos.
KR20130017525A (ko) * 2011-08-11 2013-02-20 주식회사 젠닥스 대장암, 유방암, 신장암 또는 갑상선암의 조기 진단을 위한 바이오 마커 및 이의 용도
AU2012300375A1 (en) * 2011-08-29 2014-03-20 Cardiodx, Inc. Methods and compositions for determining smoking status
US9753043B2 (en) 2011-12-18 2017-09-05 20/20 Genesystems, Inc. Methods and algorithms for aiding in the detection of cancer
US20150088430A1 (en) * 2012-04-26 2015-03-26 Allegro Diagnostics Corp Methods for evaluating lung cancer status
US20140220006A1 (en) * 2013-02-01 2014-08-07 Meso Scale Technologies, Llc Lung cancer biomarkers

Also Published As

Publication number Publication date
CN106795565B (zh) 2022-05-10
EP3169814B1 (en) 2022-05-04
CA2954169A1 (en) 2016-01-21
CN114807368A (zh) 2022-07-29
AU2015289758B2 (en) 2021-09-09
EP3169814A1 (en) 2017-05-24
EP3169814A4 (en) 2018-03-07
JP2020182489A (ja) 2020-11-12
EP3916110A1 (en) 2021-12-01
KR20170053617A (ko) 2017-05-16
AU2021218178A1 (en) 2021-09-09
US20210040562A1 (en) 2021-02-11
CN106795565A (zh) 2017-05-31
JP2017527304A (ja) 2017-09-21
US20160130656A1 (en) 2016-05-12
KR102461014B1 (ko) 2022-10-31
AU2015289758A1 (en) 2017-02-02
WO2016011068A1 (en) 2016-01-21

Similar Documents

Publication Publication Date Title
JP6775499B2 (ja) 肺がん状態の評価方法
Biasci et al. A blood-based prognostic biomarker in IBD
US20210057046A1 (en) Methods and systems for analyzing microbiota
JP5405110B2 (ja) 原発不明がんの原発巣を同定するための方法および材料
US20150088430A1 (en) Methods for evaluating lung cancer status
WO2013033640A1 (en) Methods and compositions for detecting cancer based on mirna expression profiles
EP2388336A1 (en) Method and kits for diagnosing colorectal cancer
JP2017512304A (ja) バイオマーカーシグネチャー法ならびにそのための装置およびキット
US20180107783A1 (en) Validating biomarker measurement
WO2013049152A2 (en) Methods for evaluating lung cancer status
US20210262040A1 (en) Algorithms for Disease Diagnostics
JP2023524016A (ja) 結腸細胞増殖性障害を特定するためのrnaマーカと方法
US20210166813A1 (en) Systems and methods for evaluating longitudinal biological feature data
AU2020398660A1 (en) Machine learning techniques for gene expression analysis
Hong et al. Cell-free DNA methylation biomarker for the diagnosis of papillary thyroid carcinoma
US20220148677A1 (en) Methods and systems for detecting genetic fusions to identify a lung disorder
US20240071622A1 (en) Clinical classifiers and genomic classifiers and uses thereof
WO2022212283A1 (en) Methods and systems to identify a lung disorder
McKinney et al. A blood-based prognostic biomarker in inflammatory bowel disease

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20180426

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20180426

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180712

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180712

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190830

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200424

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200727

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200910

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201006

R150 Certificate of patent or registration of utility model

Ref document number: 6775499

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250