JP2011521203A - Copdバイオマーカーシグネチャー - Google Patents

Copdバイオマーカーシグネチャー Download PDF

Info

Publication number
JP2011521203A
JP2011521203A JP2010550748A JP2010550748A JP2011521203A JP 2011521203 A JP2011521203 A JP 2011521203A JP 2010550748 A JP2010550748 A JP 2010550748A JP 2010550748 A JP2010550748 A JP 2010550748A JP 2011521203 A JP2011521203 A JP 2011521203A
Authority
JP
Japan
Prior art keywords
copd
protein
classification
group
tnf
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010550748A
Other languages
English (en)
Other versions
JP5574990B2 (ja
Inventor
フランソワ、ジェルベ
ビスワナス、デバナラヤン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lineagen Inc
Original Assignee
Lineagen Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lineagen Inc filed Critical Lineagen Inc
Publication of JP2011521203A publication Critical patent/JP2011521203A/ja
Application granted granted Critical
Publication of JP5574990B2 publication Critical patent/JP5574990B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/12Pulmonary diseases
    • G01N2800/122Chronic or obstructive airway disorders, e.g. asthma COPD

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Bioethics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本発明は、試験試料中のCOPDであることを示す示差発現タンパク質の発現を検出する方法に関する。同定されたCOPDバイオマーカーシグネチャー内のタンパク質の循環レベルを検出することにより、COPD診断および疾患の監視、ならびに治療に対する応答の予測を助けることができる。開示されたバイオマーカーシグネチャー、またはそのバイオマーカーサブセットを評価することにより、個々のマーカーでは見出せないある程度の識別が提供される。

Description

関連出願の相互参照
本出願は、2008年3月10日に出願された米国特許仮出願第61/068,772号の恩典を主張し、これは参照により本明細書に組み入れられる。
本発明は、一般に、慢性閉塞性肺疾患(COPD)の迅速な検出および正確な診断のための方法に関する。より具体的には、本発明は、COPDであることを示すバイオマーカーシグネチャーと、これらのバイオマーカーシグネチャー内の1つまたは複数のタンパク質の示差発現を検出して試験試料を分類することとに関する。
慢性閉塞性肺疾患(COPD)は、タバコの煙のような粒子の吸入に対する異常な炎症反応によって引き起こされる進行性の気流制限によって特徴付けられる(概説として、Fabbriら,2006,Am.J.Respir.Crit.Care Med.173:1056−1065を参照されたい)。COPDは米国における主な死因である(Heffner,2002,Respir.Care 47:586−607)。医師は、患者の症状を観察し、喫煙や職業などのライフスタイルの選択を評価し、健康診断を行ない、肺活量測定試験を行なって患者の気流を測定することによってCOPDを診断する。COPDの最も信頼できる診断パラメータは肺活量測定によって測定されるFEV1(1秒間努力呼気容量)の低下である(Rennard,1998,Chest 113:235S−241S)。健常な非喫煙者および喫煙者では、緩徐ではあるが進行性のFEV1低下が観察される(≦20ml/年)。喫煙者の約15%では、肺機能が正常よりも急速に低下し、加速的な身体能力制限(低運動耐容能)と呼吸困難とをもたらす(Rennard,1998,前掲)。COPD患者間での低下速度は非常に大いに変動し得る。
米国特許出願公開第2006/0211026号(P.Belloniらの名で2006年9月に公開)には、生体試料中のバイオマーカーの相対的なレベルが予想されるレベルよりも高いのかまたは低いのかを決定することによって肺気腫およびCOPDを診断し、治療薬の候補の有効性を評価するための方法であって、このバイオマーカーが、特異的SpB、デスモシン、VEGF、IGFBP2、MMP12、TIMP1、MMP9、Crabp2、Rbp1、Cyp26a1、Tgm2、Timp3、Adam17、セルピンa1、Slpi、Col1al1、Eln、TGFβ1、TGFβ−RII、Sftpa1、Sftpb、Csf2、Cxcl1、Cxcl2、Cxcl5、IL−8Rβ、IL−8Rα、IL−6、TNF、EGF−R、Areg、PDGFα、HpGF、FGF7、Kdr、flt1、Angpt1、Tek、HIF1α、Hyou1、PGF、およびトロポエラスチンからなる群から選択される、方法が開示されている。
PCT出願公開WO2004/070058号(Bayer Healthcare AGの名で2004年8月19日に公開)には、COPD患者における、ヒト膜貫通、4−ドメイン、サブファミリーS、メンバー8B(「MS4A8B」)の過剰発現およびCOPDの診断/予後マーカーとしてのその使用が開示されている。
PCT出願公開WO2006/118522号(Astrazeneca ABの名で2006年11月9日に公開)には、亜鉛−α2−糖タンパク質、α1−アンチトリプシン、コラーゲンタイプIII、プロスタグランジン−H2 Dイソメラーゼ、コラーゲンタイプI、α1−ミクログロブリン、FGF、オステオポンチン、α1−酸性糖タンパク質2およびフィブリノゲンα−E鎖に由来するペプチドのCOPDバイオマーカーとしての同定および使用が開示されている。
PCT出願公開WO2007/084485号(Batelle Memorial Instituteの名で2007年7月26日に公開)では、COPD関連疾患を評価するために、喫煙者で示差発現した種々の遺伝子マーカーと、該マーカーの使用とが同定されている。
PCT出願公開WO2008/003066号(Respiris,Inc.の名で2008年1月3日に公開)には、情報コンテンツのリポジトリからCOPDマーカーを同定する方法と、疾患の進行を急速低下状態と緩徐低下状態の間で評価することを含むCOPDの診断に該マーカーを使用することとが開示されている。
慢性閉塞性肺疾患(COPD)の迅速な検出および/または正確な診断のための方法を提供する。本方法は、試験試料(例えば、血液または血液派生物、例えば、血漿もしくは血清)中の、開示された3つの多分析物パネルのうちの1つに含まれるタンパク質バイオマーカーの少なくともサブセットを定量化することによって実施することができる。対照対象に見出されるレベルと統計的に異なる選択されたバイオマーカーの変化レベルは、COPDの陽性診断を裏付ける。したがって、COPDと診断された患者の血漿試料中に見出される、本明細書で「バイオマーカーシグネチャー」と記載されるタンパク質バイオマーカーの多分析物パネルは、COPDの陽性診断または陰性診断の裏付け、ならびに陽性COPD診断の重症度(例えば、急速低下COPDおよび緩徐低下COPD)の分類に役立つ。特定の実施形態では、正確な診断および/または分類を行なうに当たって90%を超える精度を本開示の方法により提供する。
COPD患者で示差発現する循環タンパク質が本明細書で同定され、記載されている。循環血漿マーカーとしては、アポリポタンパク質H、CD40、ハプトグロビン、インターロイキン−8(「IL−8」)、単球走化性タンパク質−1(「MCP−1」)、腫瘍壊死因子受容体II(「TNF−RII」)、アポリポタンパク質CIII、顆粒球−マクロファージコロニー刺激因子(「GM−CSF」)、免疫グロブリンA(「IgA」)、マクロファージ炎症性タンパク質1−α(「MIP−1α」)、組織因子、腫瘍壊死因子−α(「TNF−α」)、α−1アンチトリプシン、C−反応性タンパク質(「CRP」)、フィブリノゲン、インターロイキン−4(「IL−4」)、マクロファージ由来ケモカイン(「MDC」)、および可溶性血管細胞接着分子1(「sVCAM−1」)が挙げられる。上記の血漿マーカーのサブセットを含む3つのバイオマーカーシグネチャーであって、(a)急速低下COPD患者と対照(シグネチャー1)、(b)緩徐低下COPD患者と対照(シグネチャー2)、および(c)急速低下COPD患者と緩徐低下COPD患者(シグネチャー3)の区別を可能にするバイオマーカーシグネチャーを開示する。
したがって、本発明は、試験試料中のCOPDであることを示す示差タンパク質発現を検出する方法を提供し、その場合、該試験試料は、血液または血液派生物(例えば、血漿)を含むが、これらに限定されない。本明細書で同定されたタンパク質の循環レベルを検出することにより、患者を「COPDを有する」と分類すること(診断)、およびCOPDと診断された患者を疾患の重症度に従って分類すること(疾患の監視)ができる。このような分類を治療に対する応答の予測で用いて、COPD治療のための奏効する治療法の開発を助け、治験での(すなわち、患者の治療計画後の)薬効の事前評価を助けることができる。例えば、ある単一の時点または時間経過において、開示されたバイオマーカーの発現測定は、患者が治療を受けた後に行なうことができ、この治療には、例えば、薬物療法、併用薬物療法、および非薬理学的な介入が含まれ得る。本明細書に開示されるバイオマーカーシグネチャー、またはそのバイオマーカーサブセットを評価することにより、個々のマーカーでは見出せないある程度の識別が提供される。一実施形態では、発現プロファイルは、タンパク質の濃度または量を測定することによって決定される。
一実施形態では、本発明は、哺乳類対象から得られた試験試料を分類するコンピュータ実行型の方法であって、(a)該試験試料と関連するデータセットを取得する工程であって、該取得データセット(すなわち、試験データセット)が、(i)アポリポタンパク質H、CD40、ハプトグロビン、インターロイキン−8(IL−8)、単球走化性タンパク質−1(MCP−1)、および腫瘍壊死因子受容体II(TNF−RII)と、(ii)アポリポタンパク質CIII、CD40、顆粒球−マクロファージコロニー刺激因子(GM−CSF)、ハプトグロビン、免疫グロブリンA(IgA)、マクロファージ炎症性タンパク質1α(MIP−1α)、組織因子、および腫瘍壊死因子−α(TNF−α)と、(iii)α−1アンチトリプシン、C−反応性タンパク質(CRP)、フィブリノゲン、顆粒球−マクロファージコロニー刺激因子(GM−CSF)、インターロイキン−4(IL−4)、マクロファージ由来ケモカイン(MDC)、組織因子、腫瘍壊死因子受容体II(TNFRII)、および可溶性血管細胞接着分子1(sVCAM−1)と、からなる群から選択される多分析物パネルから選択される少なくとも3つのタンパク質マーカーについての定量的データを含む、工程と、(b)該取得データセットを1つまたは複数の参照データセットと比較するコンピュータ上の分析プロセスに該取得データセットを入力する工程と、(c)該分析プロセスの出力に従って該試験試料を分類する工程であって、該分類が慢性閉塞性肺疾患(COPD)分類および健康分類からなる群から選択される、工程と、を含む方法を提供する。好ましい哺乳類対象はヒト対象である。
さらなる実施形態では、本発明は、ヒト対象から得られた試験試料を分類する方法であって、(a)該試験試料と関連するデータセットを取得する工程であって、該取得データセットが、(i)アポリポタンパク質H、CD40、ハプトグロビン、インターロイキン−8(IL−8)、単球走化性タンパク質−1(MCP−1)、および腫瘍壊死因子受容体II(TNF−RII)と、(ii)アポリポタンパク質CIII、CD40、顆粒球−マクロファージコロニー刺激因子(GM−CSF)、ハプトグロビン、免疫グロブリンA(IgA)、マクロファージ炎症性タンパク質1α(MIP−1α)、組織因子、および腫瘍壊死因子−α(TNF−α)と、(iii)α−1アンチトリプシン、C−反応性タンパク質(CRP)、フィブリノゲン、顆粒球−マクロファージコロニー刺激因子(GM−CSF)、インターロイキン−4(IL−4)、マクロファージ由来ケモカイン(MDC)、組織因子、腫瘍壊死因子受容体II(TNFRII)、および可溶性血管細胞接着分子1(sVCAM−1)と、からなる群から選択される多分析物パネルから選択される少なくとも3つのタンパク質マーカーについての定量的データを含む、工程と、(b)該取得データセットを1つまたは複数の参照データセットと比較する分析プロセスを用いて該試験試料を分類するために該取得データセットを変換する工程と、(c)該分析プロセスの出力に従って該試験試料を分類する工程であって、該分類が慢性閉塞性肺疾患(COPD)分類および健康分類からなる群から選択される、工程と、を含む方法に関する。
本明細書に開示される分析方法は、限定するものではないが、1つまたは複数の参照データセットを利用して、予測モデルを作成する工程を含む。試料を分類するために試験試料データを予測モデルと比較するが、その場合、分類はCOPD分類および健康分類からなる群から選択される。COPD分類は、急速低下COPD分類または緩徐低下COPD分類であり得る。
本発明の予測モデルは、参照集団から得られた本明細書に記載の1つまたは複数のマーカーセットの定量的データを利用する。一実施形態では、定量的データは、開示されたバイオマーカーシグネチャー、またはそのタンパク質バイオマーカーサブセット内のタンパク質バイオマーカーの(例えば、好適な検出方法で測定される)血液または血液派生物(例えば、血漿)中のタンパク質濃度または相対量を表す。予測モデルは分類の際にある程度の精度を提供することができるが、その場合、このモデルは、所望の品質閾値を満たす。対象となる品質閾値は、所与の閾値の精度を提供することができ、本明細書で品質メトリックと呼ぶことがある。予測モデルは、例えば、少なくとも約70%、少なくとも約80%、少なくとも約90%、またはそれを上回る品質メトリック、例えば、分類精度、を提供し得る。そのようなモデルにおいて、感度と選択性の所望のバランスを提供するようにパラメータを適切に選択し得る。
本発明の一実施形態では、そのような予測モデルは、哺乳類対象から得られた試験試料を、健常人またはCOPDの人、特に、急速低下COPDの人に由来するものであると分類するための方法で使用することができる。該方法の第1の工程は、血液または血液派生物(例えば、血漿)試料と関連するデータセットを得ることであり、その場合、このデータセットは、アポリポタンパク質H、CD40、ハプトグロビン、インターロイキン−8(IL−8)、単球走化性タンパク質−1(MCP−1)および腫瘍壊死因子受容体II(TNF−RII)からなる群から選択される少なくとも3つ、または少なくとも4つ、または少なくとも5つ、または6つ全てのタンパク質マーカーについての定量的データを含む。次いで、試験試料データセットを、予測モデルの作成に使用される1つまたは複数の参照試料から得られる同一のタンパク質マーカー群からの定量的データを含む参照データセットと比較する。一実施形態では、試験データセットと予測モデルの作成に使用される参照データセット(単数または複数)はともに、アポリポタンパク質H、MCP−1、およびTNF−RIIという、少なくとも3つの血漿マーカーについての定量的データを含む。別の実施形態では、定量的データは、タンパク質濃度の測定値である。
別の実施形態では、予測モデルは、血液または血液派生物(例えば、血漿)試料と関連するデータセットを得ることにより、哺乳類対象から得られた試験試料を分類する際に使用されるが、その場合、このデータセットは、アポリポタンパク質CIII、CD40、ハプトグロビン、顆粒球−マクロファージコロニー刺激因子(GM−CSF)、免疫グロブリンA(IgA)、マクロファージ炎症性タンパク質1α(MIP−1α)、組織因子、および腫瘍壊死因子−α(TNF−α)からなる群から選択される少なくとも3つ、または少なくとも4つ、または少なくとも5つ、または少なくとも6つ、または少なくとも7つ、または8つ全てのタンパク質マーカーについての定量的データを含む。上記の実施形態に記載されているように、試験試料データセットを、予測モデルの作成に使用される1つまたは複数の参照試料から得られる同一のデータセット(すなわち、同一のタンパク質バイオマーカー群に由来する定量的データから構成された参照データセット)と比較する。この方法により、試料が、健常人またはCOPDの人、特に、緩徐低下COPDの人に由来するものであると分類される。さらなる実施形態では、試験データセットと予測モデルの作成に使用される参照データセット(単数または複数)はともに、IgA、MIP−1α、および組織因子という、少なくとも3つの血漿マーカーについての定量的データを含む。別の実施形態では、定量的データは、タンパク質濃度の測定値である。
さらなる実施形態では、予測モデルは、哺乳類対象から得られた試験試料を、特定の重症度のCOPD、特に、急速低下COPDまたは緩徐低下COPDの人に由来するものであると分類する際に使用される。該方法の第1の工程は、血液または血液派生物(例えば、血漿)試料と関連するデータセットを得ることであり、その場合、このデータセットは、α−1アンチトリプシン、C−反応性タンパク質(CRP)、フィブリノゲン、顆粒球−マクロファージコロニー刺激因子(GM−CSF)、インターロイキン−4(IL−4)、マクロファージ由来ケモカイン(MDC)、組織因子、腫瘍壊死因子受容体II(TNF−RII)、および可溶性血管細胞接着分子1(sVCAM−1)からなる群から選択される少なくとも3つ、または少なくとも4つ、または少なくとも5つ、または少なくとも6つ、または少なくとも7つ、または少なくとも8つ、または9つ全てのタンパク質マーカーについての定量的データを含む。試験試料データセットは、予測モデルの作成に使用される1つまたは複数の参照試料から得られる同一のデータセット(すなわち、同一のタンパク質バイオマーカー群に由来する定量的データから構成された参照データセット)と比較される。さらなる実施形態では、データセットは、MDC、組織因子、およびsVCAM−1という、少なくとも3つの血漿マーカーについての定量的データを含む。別の実施形態では、定量的データは、タンパク質濃度の測定値である。
本明細書で使用するとき、急速低下COPDの人は、肺活量測定で測定したとき、平均で年間40ml以上のFEV1(1秒間努力呼気容量)を失う。緩徐低下COPDの人は、平均で年間40ml未満のFEV1を失う。
「含む(comprises)」のようなオープンエンド形式(open−ended)の用語への言及により、追加の要素または工程が認められる。追加の要素または工程の可能性を強調するために、「1つまたは複数」のような語句が、オープンエンド型の用語とともにまたはオープンエンド型の用語なしで使用されることもある。
明示しない限り、「1つ(a)」または「1つ(an)」のような用語への言及は、1つ(one)に限定されない。例えば、「1つの細胞(a cell)」は、「複数の細胞(cells)」を除外しない。複数存在する可能性を強調するために、1つまたは複数のような語句が使用されることもある。
本発明の他の特徴および利点は、様々な実施例を含む、本明細書に提供されるさらなる説明から明白である。提供される実施例には、本発明を実施するのに有用な様々な要素および方法が説明されている。本実施例は、請求された発明を限定するものではない。本開示に基づいて、当業者は、本発明を実施するのに有用な他の要素および方法を同定および利用することができる。
単変量分析で測定したときに、COPD急速低下群(「+」)およびCOPD緩徐低下群(「◇」)および/または健常対象(「●」)の間で有意に異なるレベルで存在する4例の血漿マーカー(A)エオタキシン、(B)IL−4、(C)MCP−1、および(D)sVCAM−1を示す。 (A)COPD急速低下群と健常対照、(B)COPD緩徐低下群と健常対照、および(C)COPD急速低下群とCOPD緩徐低下群という、異なるシグネチャーを用いた線形判別分析(LDA)からのグラフ出力を示す(「●」、対照(CTL);「+」、COPDまたはCOPD急速型;「◇」、COPD緩徐型)。LDA分析では、データセットの各点から各群の多変量平均値までの距離を測定し、その点を最も近い群へと分類する。使用した距離量は、変数間の分散と共分散を考慮に入れるマハラノビス距離である。各多変量平均値は表示付きの丸である。丸の大きさは、平均値の95%信頼限界に相当する。有意に異なる群は、交差しない丸を有する傾向にある。これらのグラフは、SAS Institute(Cary,NC)のJMPソフトウェアv5.0.1を用いて作成された。
COPD患者を陽性同定するおよび/またはCOPDの結果として急速な肺の低下もしくは緩徐な肺の低下を経験する可能性のある罹患患者を区別するための分子的因子と最も信頼のおける試験の両方の開示を本明細書で提供する。COPDは、肺機能の顕著な制限が疾患の後期にしか現れない、何十年もかけてゆっくりと進行する疾患であるので、1)COPDの診断を助けること、2)肺機能低下速度を予測すること、および3)治験で時宜に適った形で薬効を監視することが可能なバイオマーカーを早期に検出することは非常に有用である。
I.血漿バイオマーカー
そのレベルが健常対照と比較してCOPD患者において統計的に異なる血漿タンパク質の同定を開示する(実施例3参照)。本明細書に記載の単変量分析によって評価され、分析された89個の血漿マーカーのうち、25個がCOPD急速低下群と健常対照群の間で統計的に異なり(p<0.05;以下の表3参照)、4個のマーカーがCOPD緩徐低下群と健常対照群の間で統計的に異なり(p<0.05;以下の表4参照)、10個のマーカーがCOPD急速低下群とCOPD緩徐低下群の間で統計的に異なる(p<0.05;以下の表5参照)。これらの血漿マーカーはどれも、それらだけではCOPD患者と対照を明確に区別することはできないので、線形判別分析(LDA)法を用いるデータの多変量分析を行なった。この方法により、COPD急速低下群と健常対照(シグネチャー1)、COPD緩徐低下群と健常対照(シグネチャー2)、およびCOPD急速低下群とCOPD緩徐低下群(シグネチャー3)を正確に区別することができる3つの血漿バイオマーカー群が同定された。
血液は、気管支肺胞洗浄液または誘発喀痰に含まれる肺分泌物よりも簡単に入手できかつ信頼できるので、血漿中で検出できるCOPDバイオマーカーが好ましい。興味深いことに、局所性炎症と全身性炎症の両方がCOPDで起こるという証拠が増えている(Wouters,2005,Proc.Am.Thorac.Soc.2:26−33に概説されている)。しかしながら、COPDが、煙で刺激された肺に現れる一般的な炎症調節の欠陥に起因するのか、または肺で特異的に起こって全身に広がる制御不能の炎症プロセスが起因するのかは依然として明らかではない。いずれにせよ、末梢血は、COPDの進行に関する好都合でかつ豊富な情報源である。
シグネチャー1は、以下の6つのタンパク質マーカー、すなわち、アポリポタンパク質H、CD40、ハプトグロビン、インターロイキン−8(IL−8)、単球走化性タンパク質−1(MCP−1)、および腫瘍壊死因子受容体II(TNF−RII)から構成される多分析物パネルである。シグネチャー1は、COPD急速低下群由来の血漿試料を93%の症例(感度)で、および健常者由来の血漿試料を86%の症例(特異度)で正確に同定し、この2つの群を90%の全体精度で区別することができる(以下の実施例3の表6参照)。
シグネチャー2は、以下の8つのタンパク質マーカー、すなわち、アポリポタンパク質CIII、CD40、顆粒球−マクロファージコロニー刺激因子(GM−CSF)、ハプトグロビン、免疫グロブリンA(IgA)、マクロファージ炎症性タンパク質1α(MIP−1α)、組織因子、および腫瘍壊死因子−α(TNF−α)から構成される多分析物パネルである(以下の実施例3の表6参照)。シグネチャー2は、(健常対象ではなく)COPD緩徐低下群からの血漿試料を、感度91%、特異度96%、全体精度94%で正確に同定することができる。
シグネチャー3は、以下の9つのタンパク質マーカー、すなわち、α−1アンチトリプシン、C−反応性タンパク質(CRP)、フィブリノゲン、顆粒球−マクロファージコロニー刺激因子(GM−CSF)、インターロイキン−4(IL−4)、マクロファージ由来ケモカイン(MDC)、組織因子、腫瘍壊死因子受容体II(TNF−RII)、および血管細胞接着分子1(sVCAM−1)から構成される多分析物パネルである。シグネチャー3は、血漿試料がCOPD急速低下群に由来するものであることを95%の症例(感度)で、および血漿試料がCOPD緩徐低下群に由来するものであることを86%の症例(特異度)で正確に同定し、この2つの群を92%の全体精度で区別することができる(以下の実施例3の表6参照)。
表1に、本明細書に開示されるシグネチャー1〜3に同定されるタンパク質についてのさらなる情報を提供する。記載された受託番号は、米国国立衛生研究所によって維持されている全米バイオテクノロジー情報センター(NCBI)データベース内に登録されているものに対応する。
Figure 2011521203
タンパク質は、複数の異なる形態で試料中に存在することが多い。これらの形態は、翻訳前修飾および翻訳後修飾のいずれかまたは両方から生じ得る。翻訳前の修飾形態としては、対立遺伝子変異体、スプライス変異体、およびRNA編集形態が挙げられる。翻訳後の修飾形態としては、タンパク質分解による切断(例えば、親タンパク質のシグナル配列または断片の切断)、グリコシル化、リン酸化、脂質化、酸化、メチル化、システイン化、スルホン化、およびアセチル化から生じる形態が挙げられる。
したがって、本出願において名前または受託番号によって同定される特異的なバイオマーカー配列に加えて、本発明は、表1に記載の例示されたバイオマーカー配列(ヌクレオチド配列またはタンパク質配列のいずれか)と少なくとも90%、または少なくとも95%、または少なくとも97%同一な天然に存在する変異体を試験試料中で検出することも企図する。該バイオマーカー変異体は、本発明の方法に対する有用性を有するものとし、かつ表1の列1に記載の新規バイオマーカーの検出に使用される、本明細書に開示される方法(例えば、表1に記載のタンパク質バイオマーカーに特異的な抗体との交差反応性)によって検出されるものとする。これらの変異体としては、多型、スプライス変異体、および突然変異が挙げられるが、これらに限定されない。
2つ以上の核酸配列またはポリペプチド配列との関連で、「同一性」パーセントという用語は、配列比較アルゴリズム(例えば、BLASTPおよびBLASTNもしくは当業者に利用可能な他のアルゴリズム)を用いてまたは目視検査によって測定される、最大一致を求めて比較し、整列させたときに、規定のパーセンテージの同一ヌクレオチドまたは同一アミノ酸残基を有する2つ以上の配列またはサブ配列を指す。適用次第で、同一性パーセントは、比較されている配列のある領域に対して(例えば、機能ドメインに対して)存在することもあるし、あるいは、比較される2つの配列の全長にわたって存在することもある。配列比較のために、典型的には、1つの配列が参照配列の役目を果たし、試験配列がそれに対して比較される。配列比較アルゴリズムを使用する場合、試験配列と参照配列をコンピュータに入力し、必要な場合、サブ配列座標を指定し、配列アルゴリズムプログラムパラメータを指定する。次いで、配列比較アルゴリズムは、参照配列に対する試験配列(単数または複数)の配列同一性パーセントを計算する。比較のための配列の最適なアラインメントは、例えば、スミスとウォーターマンの局所相同性アルゴリズム(1981,Adv.Appl.Math.2:482)によって、ニードルマンとワンチの相同性アライメントアルゴリズム(1970,J.Mol.Biol.48:443)によって、ピアソンとリップマンの類似性検索の方法(1988,Proc.Natl.Acad.Sci.USA 85:2444)によって、これらのアルゴリズムのコンピュータ実施(Wisconsin Geneticsソフトウェアパッケージ,Genetics Computer Group,575 Science Dr.,Madison,WIの中のGAP、BESTFIT、FASTA、およびTFASTA)によって、または目視検査によって実行することができる(一般的には、Ausubel,FMら,Current Protocols in Molecular Biology,4,John Wiley & Sons,Inc.,Brooklyn,N.Y.,A.1E.1−A.1F.11,1996−2004を参照されたい)。配列同一性および配列相同性のパーセントを決定するのに好適なアルゴリズムの1つの例はBLASTアルゴリズムであり、これは、Altschulら(1990,J.Mol.Biol.215:403−410)に記載されている。BLAST解析を実施するためのソフトウェアは、全米バイオテクノロジー情報センター(www.ncbi.nlm.nih.gov)から公に利用可能である。
II.バイオマーカー検出
タンパク質バイオマーカーは、分子量および/またはその既知のタンパク質アイデンティティにより特徴付けられる。タンパク質バイオマーカーは、種々の分画技術、例えば、質量分析を伴うクロマトグラフ分離、固定化した抗体を用いるタンパク質捕捉、および従来のイムノアッセイを用いて、試料中の他のタンパク質から分別することができる。この目的を達成するために利用し得る検出パラダイムとしては、光学的方法、電気化学的方法(ボルタメトリー技術およびアンペロメトリー技術)、原子間力顕微鏡法、および高周波法、例えば、多極共鳴分光法が挙げられる。共焦点と非共焦点の両方の顕微鏡法に加えて、蛍光、発光、化学発光、吸光度、反射率、透過率、ならびに複屈折または屈折率の検出が、光学的方法の実例となる(例えば、表面プラズモン共鳴、偏光解析法、共振ミラー法、グレーティングカプラー導波管法、および干渉法)。
試料(例えば、本明細書に記載の試験試料)中のタンパク質を検出または測定する場合、異なるタンパク質と同じタンパク質の異なる形態の両方を区別する能力は、タンパク質間の違いの性質と使用される検出方法によって決まる。例えば、モノクローナル抗体を用いるイムノアッセイは、エピトープを含むあらゆるタンパク質形態を検出し、それらを区別しない。しかしながら、タンパク質上の異なるエピトープに対する2つの抗体を使用するサンドイッチイムノアッセイは、両方のエピトープを含むあらゆるタンパク質形態を検出し、これらのエピトープのうちの1つしか含まない形態を検出しない。タンパク質の特定の形態(または特定の形態のサブセット)が、特定の方法によって一緒に検出される異なる形態の群よりも良好なバイオマーカーである場合、アッセイの能力が劣っていてもよい。したがって、タンパク質の形態を区別し、かつ1つまたは複数の所望のタンパク質形態を特異的に検出および測定するアッセイ法を利用することが有用であり得る。タンパク質分析物の異なる形態を区別すること、またはタンパク質分析物の特定の形態を特異的に検出することを、分析物の「分別」と言う。
本発明の一実施形態では、血液試料、または血液由来の試料(例えば、血漿、血清)を、本明細書に記載の多分析物バイオマーカーシグネチャーのメンバーとして開示される1つまたは複数のタンパク質マーカーの存在についてアッセイする。典型的には、血液試料を採取し、血漿または血清などの派生産物を試験する。このようなタンパク質バイオマーカーは、特異的結合メンバーを使用することによって検出し得る。例えば、この目的のために抗体を使用することは、特に興味深い。以下のものを含む様々なフォーマットが、このようなアッセイに使用される:抗体アレイ;酵素結合免疫吸着アッセイ(ELISA)およびラジオイムノアッセイ(RIA)フォーマット;懸濁液/溶液中での標識抗体の結合ならびにフローサイトメトリーおよび質量分析を含むが、これらに限定されない方法による検出を含む。検出には、1種の抗体または抗体パネル、好ましくは、アレイフォーマットの抗体パネルを利用してもよい。
本発明のバイオマーカーは、気相イオンを検出するために質量分析計を利用する方法である質量分析によって検出することもできる。質量分析計の例は、飛行時間型、磁場型、四重極フィルター型、イオントラップ型、イオンサイクロトロン共鳴型、静電場型の分析装置およびこれらのハイブリッドである。質量分析計は、レーザー脱離/イオン化(LDI)質量分析計であり得る。レーザー脱離/イオン化質量分析では、タンパク質分析物を、質量分析計のプローブインターフェースに係合し、イオン化と質量分析計への導入のために分析物をイオン化エネルギーに提示するように構成された装置である、質量分析プローブの表面に置く。レーザー脱離質量分析計は、分析物を表面から脱離させるために、それらを揮発させてイオン化し、質量分析計のイオン光学がそれらを利用できるようにするために、通常は紫外線レーザーからのレーザーエネルギーを利用するが、赤外線レーザーからのレーザーエネルギーも利用する。LDIによるタンパク質分析は、MALDIまたはSELDIという形をとることができる(Zhangらの名で出願された米国特許公開第20070172902号参照)。
質量分析は、異なる形態のタンパク質を分別するのに特に強力な方法でもあるが、それは、これらの異なる形態が、通常、この手法により分別可能な異なる質量を有するからである。したがって、タンパク質の1つの形態が、このバイオマーカーのもう1つの形態よりも、開示された方法による検出に優れたバイオマーカーであるならば、従来のイムノアッセイによって、これらの形態を区別することと有用なバイオマーカーを特異的に検出することの両方ができない場合に、質量分析によって、有用な形態を特異的に検出し、測定することができる場合がある。
質量分析は、イムノアッセイと組み合わせることもできる。最初に、生体特異的捕捉試薬(例えば、バイオマーカーおよびその諸形態を認識する抗体)を用いて、対象となるバイオマーカーを捕捉する。好ましくは、生体特異的捕捉試薬は、ビーズ、プレート、膜、またはアレイのような固相に結合されている。結合しなかった材料を洗い流した後、捕捉された分析物を質量分析によって検出および/または測定する。従来のMALDIまたはSELDI、およびエレクトロスプレーイオン化のような、レーザー脱離手法を含む、様々な種類の質量分析は、上記のような、タンパク質形態の検出に有用である。
試験試料は、バイオチップによって分析することもできる。バイオチップは、通常、固体基板を含み、大抵は平らな表面を有しており、そこに(吸着剤または親和性試薬とも呼ばれる)捕捉試薬が付着している。多くの場合、バイオチップの表面は複数のアドレス可能な場所を含み、各場所はそこに結合した捕獲試薬を有する。タンパク質バイオチップは、ポリペプチドを捕捉するように構成されたバイオチップである。多くのタンパク質バイオチップが当技術分野で記載されている。これらには、例えば、Ciphergen Biosystems,Inc.(Fremont,CA)、Zyomyx(Hayward,CA)、Invitrogen(Carlsbad,CA)、Biacore(Uppsala,Sweden)、およびProcognia(Berkshire,UK)によって製造されるタンパク質バイオチップが含まれる。このようなタンパク質バイオチップの例は、以下の特許または公開特許出願に記載されている:米国特許第6,225,047号(Hutchens & Yip);米国特許第6,537,749号(KuimelisおよびWagner);米国特許第6,329,209号(Wagnerら);PCT国際公開WO00/56934号(Englertら);PCT国際公開WO03/048768号(Boutellら);および米国特許第5,242,828号(Bergstromら)。
III.試料の分類
本発明は、対象における慢性閉塞性肺疾患(COPD)を迅速に検出および/または正確に診断し、COPDと診断された対象に由来する試料をこの疾患の重症度に従って分類および/または同定し、対象におけるCOPDの進行度を同定および評価する(疾患の監視/病期診断)ために使用される方法を開示する。試験試料を、健常対照、急速低下COPD患者、または緩徐低下COPD患者に由来するものであると分類および/または同定することを用いて、治療計画への応答を予測および/または監視することもでき、これには、治験期間中の薬効の監視が含まれるが、これに限定されない。したがって、本発明は、治療剤および治療計画の有効性を評価する方法;疾患の病期診断および分類の方法などを含む。早期検出を用いて、発症しつつあるCOPDの存在を明らかにすることができ、それによって、適切な予防手段または防御手段による治療介入が可能になる。
試験試料をCOPD対象(緩徐低下COPDまたは急速低下COPDのいずれか)から得られたものであると分類および/もしくは同定するか、患者をCOPDと診断するか、または患者におけるCOPDの重症度を分類する方法では、本明細書で提供される1つまたは複数のタンパク質マーカーの、血液、血清、および血漿を含むが、これらに限定されない、試験試料中での発現パターンを入手し、対照値と比較して、診断/分類を決定する。例えば、血液由来の試料(試験試料)を、特異的結合剤(例えば、抗体)、または特異的結合剤のパネルに適用して、対象となるマーカーの存在を決定する、および/または試料中のマーカーを定量化することができる。分析は、一般に、本明細書に記載のマーカー、例えば、アポリポタンパク質H、CD40、ハプトグロビン、インターロイキン−8(「IL−8」)、単球走化性タンパク質−1(「MCP−1」)、腫瘍壊死因子受容体II(「TNF−RII」)、アポリポタンパク質CIII、顆粒球−マクロファージコロニー刺激因子(「GM−CSF」)、免疫グロブリンA(「IgA」)、マクロファージ炎症性タンパク質1α(「MIP−1α」)、組織因子、腫瘍壊死因子−α(「TNF−α」)、α−1アンチトリプシン、C−反応性タンパク質(「CRP」)、フィブリノゲン、インターロイキン−4(「IL−4」)、マクロファージ由来ケモカイン(「MDC」)、および可溶性血管細胞接着分子1(「sVCAM−1」)のうちの少なくとも1つ;通常、これらのマーカーのうちの少なくとも2つ、より通常は、これらのマーカーのうちの少なくとも3つを検出および/または定量化する工程を含み、所望される特定の分類によっては、これらのマーカーのうちの4つ、5つ、6つ、7つ、または全てを検出および/または定量化する工程を含むこともある。
試験試料をCOPD対象に由来するものであると分類するおよび/または対象をCOPDと診断する、特に、急速低下COPDと健常対照を分類する場合、好ましいマーカーセットは、以下の多分析物パネル、すなわち、アポリポタンパク質H、CD40、ハプトグロビン、IL−8、MCP−1、およびTNF−RIIのうちの少なくとも3つを含むが、それらのうちの4つ、5つ、または6つ全てを含むこともある。この多分析物パネルは、本明細書に記載のシグネチャー1に相当する。この方法にとって好ましい定量化するための少なくとも3つのマーカーは、健常対象ではなくCOPD急速低下群に由来する血漿試料を約89%の全体精度で正確に同定する、アポリポタンパク質H、MCP−1、およびTNF−RIIである(以下の表6参照)。精度は、シグネチャー1中の記載された6つ全てのバイオマーカーについての定量的データを評価することによって、約90%まで上昇する(以下の表6参照)。
試験試料を、COPD対象に由来するものであると分類するおよび/または対象をCOPDと診断する、特に、緩徐低下COPDと健常対照を分類する場合、好ましいマーカーセットは、以下の多分析物パネル、すなわち、アポリポタンパク質CIII、CD40、ハプトグロビン、GM−CSF、IgA、MIP−1α、組織因子、およびTNF−αのうちの少なくとも3つを含むが、それらのうちの4つ、5つ、6つ、7つ、または8つ全てを含むこともある。この多分析物パネルは、本明細書に記載のシグネチャー2に相当する。この方法にとって好ましい定量化するための少なくとも3つのマーカーは、健常対象ではなくCOPD緩徐低下群に由来する血漿試料を約76%の全体精度で正確に同定する、IgA、MIP−1α、および組織因子である(以下の表6参照)。精度は、GM−CSF(合計4つのバイオマーカー)をさらに定量化することによって約78%まで上昇し、GM−CSFとアポリポタンパク質CIII(合計5つのバイオマーカー)をさらに定量化することによって約83%まで上昇する。精度は、記載された8つ全てのバイオマーカーについての定量化データを評価することによって約94%まで上昇する(以下の表6参照)。
試験試料を、COPD対象に由来するものであると分類するおよび/または対象をCOPDと診断する、特に、急速低下COPDと緩徐低下COPDを分類する場合、好ましいマーカーセットは、以下の多分析物パネル、すなわち、α−1アンチトリプシン、CRP、フィブリノゲン、GM−CSF、IL−4、MDC、組織因子、TNF−RII、およびsVCAM−1のうちの少なくとも3つを含むが、それらのうちの4つ、5つ、6つ、7つ、8つ、または9つ全てを含むこともある。この多分析物パネルは、本明細書に記載のシグネチャー3に相当する。この方法にとって好ましい定量化するための少なくとも3つのマーカーは、COPD緩徐低下群に由来する血漿試料ではなくCOPD急速低下群に由来する血漿試料を約80%の全体精度で正確に同定する、MDC、組織因子、およびsVCAM−1である(以下の表6参照)。精度は、IL−4(合計4つのバイオマーカー)をさらに定量化することによって約85%まで上昇し、また、精度は、記載された9つ全てのバイオマーカーについての定量化データを評価することによって約92%まで上昇する。COPD(すなわち、急速低下群と緩徐低下群)の重症度の段階を決める場合、個々の試験データセットを、既知の病期の疾患試料から得られた1つまたは複数の参照データセットと比較し、病期を予測するモデルを構築し、そのモデルにデータセットを入力して、予測された病期診断を得る。
したがって、本明細書に開示される情報を用いて、本発明は、哺乳類対象から得られた試験試料を分類するコンピュータ実行型の方法であって、(a)該試料と関連するデータセットを取得する工程であって、該取得データセット(すなわち、試験データセット)が、(i)アポリポタンパク質H、CD40、ハプトグロビン、インターロイキン−8(IL−8)、単球走化性タンパク質−1(MCP−1)、および腫瘍壊死因子受容体II(TNF−RII)と、(ii)アポリポタンパク質CIII、CD40、顆粒球−マクロファージコロニー刺激因子(GM−CSF)、インターロイキン−4(IL−4)、ハプトグロビン、免疫グロブリンA(IgA)、マクロファージ炎症性タンパク質1α(MIP−1α)、組織因子、および腫瘍壊死因子−α(TNF−α)と、(iii)α−1アンチトリプシン、C−反応性タンパク質(CRP)、フィブリノゲン、顆粒球−マクロファージコロニー刺激因子(GM−CSF)、マクロファージ由来ケモカイン(MDC)、組織因子、腫瘍壊死因子受容体II(TNF−RII)、および可溶性血管細胞接着分子1(sVCAM−1)と、からなる群から選択される多分析物パネルから選択される少なくとも3つのタンパク質マーカーについての定量的データを含む、工程と、(b)該取得データセットを1つまたは複数の参照データセットと比較するコンピュータ上の分析プロセスに、該取得データセットを入力する工程と、(c)該分析プロセスの出力に従って該試料を分類する工程であって、該分類がCOPD分類および健康分類からなる群から選択される、工程と、を含む方法を提供する。さらなる実施形態では、COPD分類は、急速低下COPD分類および/または緩徐低下COPD分類のいずれかに相当する。
本発明はさらに、ヒト対象から得られた試験試料を分類するための方法であって、(a)該試験試料と関連するデータセットを取得する工程であって、該取得データセットが、(i)アポリポタンパク質H、CD40、ハプトグロビン、インターロイキン−8(IL−8)、単球走化性タンパク質−1(MCP−1)、および腫瘍壊死因子受容体II(TNF−RII)と、(ii)アポリポタンパク質CIII、CD40、顆粒球−マクロファージコロニー刺激因子(GM−CSF)、ハプトグロビン、免疫グロブリンA(IgA)、マクロファージ炎症性タンパク質1α(MIP−1α)、組織因子、および腫瘍壊死因子−α(TNF−α)と、(iii)α−1アンチトリプシン、C−反応性タンパク質(CRP)、フィブリノゲン、顆粒球−マクロファージコロニー刺激因子(GM−CSF)、インターロイキン−4(IL−4)、マクロファージ由来ケモカイン(MDC)、組織因子、腫瘍壊死因子受容体II(TNF−RII)、および可溶性血管細胞接着分子1(sVCAM−1)からなる群から選択される多分析物パネルから選択される少なくとも3つのタンパク質マーカーについての定量的データを含む、工程と、(b)該取得データセットを1つまたは複数の参照データセットと比較する分析プロセスを用いて該試験試料を分類するために該取得データセットを変換する工程と、(c)該分析プロセスの出力に従って該試料を分類する工程であって、該分類が慢性閉塞性肺疾患(COPD)分類および健康分類からなる群から選択される、工程とを含む方法を提供する。
対象(例えば、ヒト患者)に最も適した治療方針を正確に開発するために、本明細書に記載の分類方法を用いて、診断または疾患の病期診断の目的でこのような対象を同定することができる。これらの分類方法を用いて、治験期間中にCOPD治療薬の有効性を計算および評価するのを助けることもできる。したがって、ひとたび対象が分類されれば、この情報を変換して、例えば、該対象においてCOPDがさらに進行するのを制限するより効果的な治療計画を作成する、またはCOPD治療で使用される薬剤候補の有効性を決定することができる。
本明細書に開示される方法は、本明細書に記載の3つのバイオマーカーシグネチャーの少なくともサブセットの、試験血漿試料中濃度の決定とともに実施することができる。特定の実施形態では、開示される方法は、正確な診断をするに当たって90%を超える精度を提供する。
本明細書に記載の方法は、これらの方法を実施することができる任意の装置を用いて実施し得る。使用し得る装置の例としては、あらゆる種類のコンピュータを含む、電子計算装置が挙げられるが、これらに限定されない。本明細書に記載の方法がコンピュータ上で実施される場合、コンピュータがこれらの方法の工程を実行するように設定するために使用し得るコンピュータプログラムは、コンピュータプログラムを含むことができる任意のコンピュータ可読媒体に含まれ得る。使用し得るコンピュータ可読媒体の例としては、ディスケット、CD−ROM、DVD、ROM、RAM、ならびに他のメモリおよびコンピュータ記憶装置が挙げられるが、これらに限定されない。コンピュータがこれらの方法の工程を実行するように設定するために使用し得るコンピュータプログラムは、電子ネットワーク上で、例えば、インターネット、ワールドワイドウェブ、イントラネット、または他のネットワーク上でも提供し得る。
本明細書に記載の方法は、プロセッサーとコンピュータ可読媒体とを含むシステムであって、このシステムにこれらの方法の工程を実行させるためのプログラムコード手段を含むシステムの中で実施し得る。プロセッサーは、これらの方法の実施に必要とされる作業を実行できる任意のプロセッサーであり得る。プログラムコード手段は、システムの中で実施されたときに、このシステムに本明細書に記載の方法の工程を実行させることができる任意のコードであり得る。プログラムコード手段の例としては、C++、Java、もしくはFortranのような、高レベルのコンピュータ言語で書かれた、本出願に記載の方法を実行するための命令;アセンブリ言語のような低レベルのコンピュータ言語で書かれた、本出願に記載の方法を実行するための命令;またはコンパイルされ、連結されたマシン言語のような、コンピュータで実行可能な形式の、本明細書に記載の方法を実行するための命令が挙げられるが、これらに限定されない。
IV.データ分析
試料(例えば、試験試料または参照試料)中のマーカーの定量は、上記の、当技術分野で公知の方法によって測定される。試験試料から得られた定量的データ(本明細書で互換的に使用される、「取得データセット」または「試験データセット」)は、取得データセットを1つまたは複数の参照データセットと比較する分析的な分類プロセスを受ける。一実施形態では、試験されるバイオマーカーのタンパク質濃度データを含むが、これに限定されない、生データを定量化し、試験試料から得られるのと同じ定量的データを用いて1つまたは複数の参照集団を評価することによって作成される予測モデルと比較する。予測モデルは、参照集団からの学習データセットを用いて作成されるが、その場合、この学習データセットと試験(または取得)データセットはともに、同じ定量的情報から構成される。例えば、本発明の一実施形態では、試験試料を分類する方法または対象を急速低下COPD患者と診断する方法を実施する場合に、アポリポタンパク質H、MCP−1、およびTNF−RIIの循環血漿濃度データからなる試験試料と関連するデータセットを、健常人(参照試料1)と急速低下COPDの人(参照試料2)の両方から得られる同じ濃度データセット(すなわち、アポリポタンパク質H、MCP−1、およびTNF−RIIの循環血漿濃度)を用いて作成された予測モデルと比較する。
したがって、好ましい実施形態では、本発明の方法は、COPDを診断または分類するための分類子を使用する。分類子は、多分析物プロファイルを含む入力を受け取って、試験試料がどの群に属するかを示すデータを含む出力を提供する、任意の適当なパターン認識方法に基づくことができる。分類子は、対象の1つまたは複数の参照集団(参照データセット)からの学習データを用いて学習させることができる。通常、学習データは、学習集団中の各々の対象について、患者から採取した好適な試料中のバイオマーカータンパク質の定量的測定結果を含む多分析物プロファイルを含む。
分析的な分類プロセスは、定量的データを操作して試験試料を分類するために、種々の統計的分析方法のいずれか1つを使用し得る。有用な方法の例としては、線形判別分析(LDA)、再帰的特徴削除、マイクロアレイの予測分析、ロジスティック回帰、CARTアルゴリズム、FlexTreeアルゴリズム、LARTアルゴリズム、ランダムフォレストアルゴリズム、MARTアルゴリズム、および機械学習アルゴリズムが挙げられる。好ましい分析方法は、LDAである。これらの方法のいずれか1つを使用しつつ、1つまたは複数の参照データセットを用いて予測モデルを作成する。このようなモデルの作成では、対照試料および/または罹患試料を含むデータセットを学習セットとして使用する。学習セットは、試験試料で定量されるのと同じマーカー群についてのデータを含むことになる。急速低下COPD患者と健常対象、緩徐低下COPD患者と健常対象、および急速低下COPD患者と緩徐低下COPD患者を区別するために使用される予測モデルの例を本明細書で提供する。例えば、実施例3を参照されたい。
本明細書に示される予測モデルは、本明細書に記載のシグネチャー1、2、もしくは3に含まれるバイオマーカー、または該シグネチャー内のバイオマーカーサブセットの、複数回のタンパク質レベル測定の結果を利用し、そして、所望の精度で、ある人が特定の状態(ここで、状態は、急速低下COPD、緩徐低下COPD、または健康(疾患状態なし)であり得る)に属すると分類する方法を提供する。したがって、対象となる分類には、試験試料を以下の状態、すなわち、i)COPD状態(急速低下COPD状態または緩徐低下COPD状態を含む)とii)健康状態(疾患状態なし)のうちの1つまたは複数に割り当てることが含まれるが、これに限定されるものではない。
取得データセットと参照データセットを比較することで統計的に有意な差が得られるかどうかを決定することによって分類することもできる。統計的に有意な差が得られる場合は、データセットが得られた試料を参照データセット群に属さないと分類する。逆に、このような比較が参照データセットと比べて統計的に有意でない場合は、データセットが得られた試料を参照データセット群に属すると分類する。
試料が所与の群に属する確率を決定するための閾値を設定する予測モデル化方法によって分類することができる。本発明の方法の確率は、少なくとも約70%、好ましくは少なくとも約80%、より好ましくは少なくとも約90%またはそれを上回るものである。モデルの予測能力は、特定の値または値の範囲の品質メトリック、例えば、精度、を提供するその能力によって評価し得る。一実施形態では、望ましい品質閾値は、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、または少なくとも約90%もしくはそれを上回る精度で、試験試料を分類する能力を有する。「精度」という用語は、疾患状態(例えば、COPD)と対照状態(例えば、健康)とを正確に識別する個々のマーカーまたはマーカー組合せのコンピュータ演算能力を指す。当技術分野で知られているように、予測モデルの相対的な感度と特異度は、選択性メトリックまたは感度メトリックのどちらかに有利になるように合わせることができるが、この場合、2つのメトリックは反対の関係にある。「感度」という用語が、疾患状態を正確に同定する個々のマーカーまたはマーカー組合せの能力を指すのに対し、「特異度」という用語は、正常な(例えば、罹患していない)状態を正確に同定するこの(これらの)マーカーの能力を指す。上記のモデルの限度を調整して、実施される試験の特定の要件に応じた、選択された感度レベルまたは特異度レベルを提供することができる。感度と特異度の一方または両方は、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、または少なくとも約90%もしくはそれを上回るものであり得る。
各マーカーの値(例えば、濃度)を、通常3つ1組でまたは3つ1組で複数回、測定することによって、生データを初めに分析することができる。データは操作することができる。例えば、標準曲線を用いて生データを変換することができ、3つ1組の測定結果の平均値を用いて各患者の平均値および標準偏差を算出することができる。モデルで使用する前に、これらの値を変換する、例えば、対数変換、ボックス・コックス変換(BoxおよびCox(1964) J.Royal Stat.Soc,Series B,26:211−246参照)することができる。次に、データを予測モデルに入力すると、この予測モデルが、試料を状態によって分類する。得られた情報は、患者、医療従事者、または臨床研究の分析者に提供することができる。
COPD状態についての予測モデルを作成するために、既知の対照試料および/または対象となる分類に対応する試料を含む、頑健なデータセットを学習セット(「参照データセット」)で使用する。試料サイズは、一般に認められている基準を用いて選択する。上で論じられているように、異なる統計的方法を用いて、精度の高い予測モデルを得ることができる。線形判別分析(LDA)を用いたそのような分析の一例を実施例3に示す。
線形判別分析(LDA)は、試験試料または試験対象を、特定の対象物特性に基づいて、2つのカテゴリーのうちの1つに分類しようとする。換言すれば、LDAは、実験で測定された対象物属性によって対象物のカテゴリー化が予測されるかどうかを検証する。LDAは、通常、連続独立変数と二値カテゴリー独立変数を必要とする。本発明において、学習集団サブセットの全てにわたる本明細書に開示の選択されたバイオマーカーセットの定量値(例えば、タンパク質濃度データ)は、必須の連続独立変数の役割を果たす。学習集団の各メンバーの臨床群分類は、二値カテゴリー独立変数の役割を果たす。
LDAは、グループ分け情報を用いて群間分散と群内分散の比を最大化する変数の線形結合を求める。暗黙のうちに、LDAによって使用される線形重みは、学習セット全体のバイオマーカーの定量値(例えば、タンパク質濃度)がどのように2つの群(例えば、COPD対照群と健常対照群)に分かれるかによって決まる。いくつかの実施形態では、LDAを、学習試料中のメンバーN個×本明細書に記載のバイオマーカーと組み合わせたバイオマーカーK個のデータ行列に適用する。次に、学習集団の各メンバーの線形判別式をプロットする。第1の対照亜群(例えば、健常群)に相当する学習集団のメンバーがクラスターを形成して1つの範囲の線形判別値(例えば、負)をとり、第2の対照亜群(例えば、COPD対象)に相当する学習集団のメンバーがクラスターを形成して第2の範囲の線形判別値(例えば、正)をとることが理想的である。判別値のクラスター間の分離がより大きい場合に、LDAはより成功していると考えられる。線形判別分析についてのさらなる情報については、Duda,Pattern Classification,第2版,2001,John Wiley & Sons,Inc;およびHastie,2001,The Elements of Statistical Learning,Springer,New York;Venables & Ripley,1997,Modern Applied Statistics with s−plus,Springer,New Yorkを参照されたい。
二次判別分析(QDA)は、LDAと同じ入力パラメータを受け取り、LDAと同じ結果を返す。QDAは、線形方程式ではなく、二次方程式を用いて、結果を出す。LDAとQDAは互換的であり、どちらを用いるかは好みの問題および/または分析を支援するソフトウェアの可用性の問題である。ロジスティック回帰は、LDAおよびQDAと同じ入力パラメータを受け取り、LDAおよびQDAと同じ結果を返す。
一実施形態では、予測モデルの導出において階層的クラスタリングを行ない、その場合、ピアソン相関をクラスタリングメトリックとして利用する。1つの手法は、COPDデータセットを「教師あり学習」問題の「学習試料」とみなすことである。CARTは、医学への適用において標準となっているが(Singer(1999) Recursive Partitioning in the Health Sciences,Springer)、これは、任意の質的特徴を量的特徴に変換し、それらをホテリングのT統計量のための標本再利用法で評価される達成有意性水準によって分類し、lasso法を好適に適用することによって改変し得る。予測の問題は、回帰の質を評価する際の分類にジニ基準を実際に好適に利用することにより、予測を見失わない回帰の問題へと変わる。
この手法は、FlexTree(Huangら,2004,Proc.Natl.Acad.Sci.USA 101:10529−10534)と呼ばれるものにつながっている。FlexTreeは、シミュレーションにおいて、また、SNPおよび他の種類のデータに適用したときに、非常によく機能する。ソフトウェア自動化FlexTreeが開発されている。近年の努力により、LARTreeまたはsimply LART(Turnbull(2005) Classification Trees with Subset Analysis Selection by the Lasso,Stanford University)と呼ばれる手法が開発されている。この名前は、CARTおよびFlexTreeに見られるような二分木;上で言及したlasso法;およびEfronら(2004) Annals of Statistics 32:407−451によってLARSと呼ばれているものによるlasso法の実施を反映している。Huangら,2004(前掲)も参照されたい。
使用し得る他の分析方法には、ロジスティック回帰が含まれる(例えば、Ruczinskiら,2003,J Comput.Graph.Stat.12:475−512参照)。ロジスティック回帰は、その分類子を二分木として示すことができるという点でCARTに似ている。ロジスティック回帰は、各ノードが、CARTによって生成される単純な「and」文よりも一般的な特徴についてのブーリアン文を有するという点で異なる。
別の手法は、最短収縮重心(nearest shrunken centroid)の手法である(Tibshiraniら,2002,Proc.Natl.Acad.Sci.USA 99:6567−72)。この技法はk−means法に似ているが、クラスター中心を収縮することにより、情報を提供する少数の特徴に焦点を絞るように(lasso法に見られるような)特徴を自動的に選択するという利点を有する。この手法は、PAMソフトウェアとして利用可能であり、広く使用されている。さらに2組のアルゴリズムは、ランダムフォレスト(Breimanら,2001,Mach Learn.45:5−32)とMART(Hastieら,2001,The Elements of Statistical Learning,Springer)である。これら2つの方法は、既に「コミッティー法(committee method)」である。したがって、これらは、結果を「採決する」予測子を含む。
有意性を順序付けるために、偽発見率(FDR)を決定することができる。まず、1組の非類似値の帰無分布を作成する。一実施形態では、観測されたプロファイル値を並べ変えて、偶然に得られる一連の相関係数の分布を創出し、それによって、適当な組の相関係数の帰無分布を創出する(参照により本明細書に組み入れられる、Tusherら,2001,Proc.Natl.Acad.Sci.USA 98,5116−21を参照されたい)。帰無分布の組は、全ての利用可能なプロファイルについての各プロファイルの値を並べ変え、全てのプロファイルの対相関係数を計算し、この順列の相関係数の確率密度関数を計算し、この手順をN回(ここで、Nは大数、通常約300である)繰り返すことによって得られる。N個の分布を用いて、所与の有意水準の実験的に観測された類似値の分布から得られる(類似)値を超える相関係数値のカウントの適当な尺度(平均値、中央値など)を計算する。
FDRとは、実験データにおけるこの選択されたピアソン相関よりも大きい相関(有意な相関)の数に対する(ランダム化されたデータの組におけるこの選択されたピアソン相関よりも大きい相関から推定される)期待される偽有意な相関(falsely significant correlation)の数の比率のことである。このカットオフ相関値を、実験プロファイル間の相関に適用することができる。
上述の分布を用いて、有意性についての信頼度を選択する。これを用いて、偶然に得られたと考えられる結果を超える相関係数の最小値を決定する。この方法を用いて、正の相関、負の相関、または両方の閾値を得る。この閾値(単数または複数)を用いて、ユーザーは、対相関係数の観測値をフィルタリングし、閾値(単数または複数)を超えないものを削除することができる。さらに、所与の閾値について、偽陽性率の推定値を得ることができる。各々の個々の「ランダム相関」分布については、観測結果がいくつ閾値範囲から外れるかを見出すことができる。この手順によってカウントの数列が得られる。この数列の平均と標準偏差から、潜在的な偽陽性の平均数とその標準偏差が得られる。
代替の分析手法では、横断面分析で選択される変数を予測子として個別に利用する。具体的なCOPD転帰と、各々の患者が観察されるランダムな時間長と、プロテオームの特徴および他の特徴の選択とが与えられれば、生存分析のためのパラメトリック手法が、広く適用されているセミパラメトリックなコックスモデルよりも優れている場合がある。ワイブルの生存に関するパラメトリックフィットは、ハザード率が単調増加するか、単調減少するか、または一定となること許すものであるが、これはまた、(コックスモデルが表示する)比例ハザードを表示し、加速故障時間も表示する。回帰係数の近似最尤度推定量とその関数を得るときに利用可能な標準的手段は全て、このモデルで利用可能である。
さらに、特に共変量の数を、lassoを用いて扱いやすい大きさに減らすことによって、分析が大幅に単純化されることになり、生存に対する完全にノンパラメトリックな手法の可能性が認められるので、コックスモデルを使用することができる。これらの統計手段は、ありとあらゆるプロテオームデータに適用可能である。容易に測定可能であって、かつ臨床的意義のあるCOPDを有する人の検出に関して極めて情報量の多い、1組のバイオマーカーを提供する。
予測モデルの開発においては、1サブセットのマーカー、すなわち、少なくとも3組、少なくとも4組、少なくとも5組、少なくとも6組、または完全な組のマーカーを選択することが望ましい場合がある。通常、精度の高い予測モデルを維持しながら、定量的試料分析に必要なもの(例えば、試薬の可用性、定量の利便性など)を提供する1サブセットのマーカーを選択する。分類モデルを構築するためのいくつかの情報提供マーカーの選択は、性能メトリックに基づいた有用な予測能力を有するモデルを生成するために、性能メトリックの定義とユーザー定義の閾値とを必要とする。例えば、性能メトリックは、予測の感度および/または特異度、ならびに予測モデルの全体精度であってもよい。実施例3に記載されるように、COPDおよびこの疾患の特定の病期に関連するバイオマーカーを同定するために、LDAが学習モデルで使用された。1サブセットのマーカーの選択を、マーカーサブセットの前進選択または後退選択に使用してもよい。マーカー全てを用いることなくモデルの性能を最適化するいくつかのマーカーを選択してもよい(下記の実施例3の表6参照)。最適な項数を定義するための1つの方法は、所望の予測能力(例えば、80%を超える精度、または同等量の感度/特異度)を有するモデルを生成する項数であって、所与の分析プロセスに使用される任意の項の組合せと項数とを用いてこのメトリックについて得られる最大値からわずかに1標準誤差である項数を選択することである。
V.試薬およびキット
1つまたは複数の上記方法を実施するための試薬およびそのキットも提供する。本試薬およびそのキットは、非常に様々なものであってもよい。対象となる試薬には、COPDと関連する循環タンパク質マーカーの上記発現プロファイルの作成で使用されるように特別に設計された試薬が含まれる。
したがって、本発明は、1つまたは複数の上記方法を実施するためのキットであって、本明細書に記載のCOPDバイオマーカーに特異的な少なくとも1つの試薬を含み、このCOPDバイオマーカーが、アポリポタンパク質H、CD40、ハプトグロビン、インターロイキン−8(「IL−8」)、単球走化性タンパク質−1(「MCP−1」)、腫瘍壊死因子受容体II(「TNF−RII」)、アポリポタンパク質CIII、顆粒球−マクロファージコロニー刺激因子(「GM−CSF」)、免疫グロブリンA(「IgA」)、マクロファージ炎症性タンパク質1−α(MIP−1α)、組織因子、および腫瘍壊死因子−α(「TNF−α」)、α−1アンチトリプシン、C−反応性タンパク質(「CRP」)、フィブリノゲン、インターロイキン−4(「IL−4」)、マクロファージ由来ケモカイン(「MDC」)、および可溶性血管細胞接着分子1(「sVCAM−1」)からなる群から選択される、キットを提供する。1つまたは複数のバイオマーカーの発現は、1つまたは複数のバイオマーカーを検出する該試薬を用いて測定することができる。このキットを用いて、COPD群または健常群のヒト対象から得られる試験試料を分類する。
一実施形態では、該キットは、本明細書に記載の1つまたは複数のバイオマーカーシグネチャーから選択される少なくとも3つのタンパク質マーカーを検出するための試薬を含む。したがって、該キットは、
(a)アポリポタンパク質H、CD40、ハプトグロビン、インターロイキン−8(IL−8)、単球走化性タンパク質−1(MCP−1)、および腫瘍壊死因子受容体II(TNF−RII)と、
(b)アポリポタンパク質CIII、CD40、顆粒球−マクロファージコロニー刺激因子(GM−CSF)、ハプトグロビン、免疫グロブリンA(IgA)、マクロファージ炎症性タンパク質1α(MIP−1α)、組織因子、および腫瘍壊死因子−α(TNF−α)と、
(c)α−1アンチトリプシン、C−反応性タンパク質(CRP)、フィブリノゲン、顆粒球−マクロファージコロニー刺激因子(GM−CSF)、インターロイキン−4(IL−4)、マクロファージ由来ケモカイン(MDC)、組織因子、腫瘍壊死因子受容体II(TNFRII)、および可溶性血管細胞接着分子1(sVCAM−1)と、
からなる群から選択される多分析物パネルから選択される少なくとも3つのタンパク質マーカーを検出するための試薬を含み得る。
本発明のキットは、生体試料中の本明細書に開示されるCOPDバイオマーカーに対応するポリペプチドまたは本明細書に開示されるCOPDバイオマーカーに対応するポリペプチドをコードするmRNAを検出するのに有用な標識化合物または標識薬剤である試薬と、試料中のポリペプチドまたはmRNAの量を測定するための手段(例えば、ポリペプチドに結合する抗体またはポリペプチドをコードするDNAもしくはmRNAに結合するオリゴヌクレオチドプローブ)とを含み得る。COPDバイオマーカーに対応するポリペプチドとの結合に好適なこのような試薬の1つの種類は、対象となるマーカーに結合する抗体またはその断片(抗体誘導体を含む)である。さらに、核酸(例えば、ゲノムDNA、mRNA、スプライスされたmRNA、cDNA)との結合に好適な試薬には、相補的核酸が含まれる。プローブ構造、基質組成、および結合技術が多種多様に異なっている、種々様々なアレイフォーマットが当技術分野で知られている。さらなる実施形態では、試薬は、検出可能な物質で直接的または間接的に標識されている。
特定の実施形態では、1つまたは複数のバイオマーカーの発現は、(a)1つまたは複数のバイオマーカーによって調節されるポリペプチドの発現を検出すること、(b)バイオマーカーを調節するポリペプチドの発現を検出すること、または(c)バイオマーカーの代謝物の発現を検出することによって検出される。
抗体ベースのキットについて、キットは、例えば(1)本発明のバイオマーカーに対応するポリペプチドに結合する(例えば、固体支持体に結合した)第1の抗体と、任意で(2)当該ポリペプチドまたは第1の抗体のいずれかに結合し、かつ検出可能な標識にコンジュゲートされている第2の異なる抗体とを含むことができる。
オリゴヌクレオチドベースのキットについて、キットは、例えば(1)本発明のバイオマーカーに対応するポリペプチドをコードする核酸配列にハイブリダイズするオリゴヌクレオチド、例えば、検出可能に標識されたオリゴヌクレオチド、または(2)本発明のバイオマーカーに対応する核酸分子を増幅するのに有用な1対のプライマーを含むことができる。
キットは、緩衝剤、防腐剤、タンパク質安定化剤、および/または検出可能な標識の検出に必要な構成要素などの、他の構成要素を含むこともできる。キットは、様々な方法で利用される試薬、例えば、血液試料を採取および処理するための装置、2次抗体、ELISA試薬;チューブ、スピンカラムなどを含み得る。キットの各構成要素を個々の容器に封入することができ、また、これらの様々な容器を全て、単一のパッケージに納めることができる。
対象となる代表的なアレイ組成物またはキット組成物は、アポリポタンパク質H、CD40、ハプトグロビン、IL−8、MCP−1およびTNF−RIIからなる群から選択される少なくとも3つ、少なくとも4つ、少なくとも5つ、もしくは6つ全てのマーカーを定量するための試薬を含むか、またはこれらの試薬からなる。このキットを用いて、試験試料を、健常患者ではなく、急速低下COPDと分類する、および/または対象を、健常患者ではなく、急速低下COPDと診断することができる。キットに含まれる試薬を用いて定量するのに好ましい少なくとも3つのマーカーは、アポリポタンパク質H、MCP−1、およびTNF−RIIを含み得る、またはこれらからなり得る。
別の一実施形態では、代表的なアレイまたはキットは、アポリポタンパク質CIII、CD40、ハプトグロビン、GM−CSF、IgA、MIP−1α、組織因子、およびTNF−αからなる群から選択される少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、少なくとも7つ、もしくは8つ全てのマーカーを定量するための試薬を含むか、またはこれらの試薬からなる。このキットを用いて、試験試料を、健常患者ではなく、緩徐低下COPDと分類する、および/または対象を、健常患者ではなく、緩徐低下COPDと診断することができる。キットに含まれる試薬を用いて定量するのに好ましい少なくとも3つのマーカーは、IgA、MIP−1α、および組織因子を含み得る、またはこれらからなり得る。
またさらなる実施形態では、代表的なアレイまたはキットは、α−1アンチトリプシン、CRP、フィブリノゲン、GM−CSF、IL−4、MDC、組織因子、TNF−RII、およびsVCAM−1からなる群から選択される少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、少なくとも7つ、少なくとも8つ、もしくは9つ全てのマーカーを定量するための試薬を含むか、またはこれらの試薬からなる。このキットを用いて、試験試料を、緩徐低下COPDではなく、急速低下COPDと分類する、および/または対象を、緩徐低下COPDではなく、急速低下COPDと診断することができる。キットに含まれる試薬を用いて定量するのに好ましい少なくとも3つのマーカーは、MDC、組織因子、およびsVCAM−1を含み得る、またはこれらからなり得る。
キットは、1つまたは複数の表現型を統計分析するためのソフトウェアパッケージをさらに含み得、予測モデル内での分類の確率を計算するための参照データベース(単数または複数)を含み得る。
上記の構成要素に加えて、本キットは、本方法を実施するための、および本キットを用いて実施されたアッセイの結果を解釈するための指示をさらに含み得る。これらの指示は、種々の形態で本キットに存在し得、1つまたは複数のこれらの形態が、本キットに存在し得る。これらの指示が存在し得る1つの形態は、好適な媒体または基板(例えば、情報が印刷された1枚または複数枚の紙)の上、キットの包装中、添付文書中などに印刷された情報としてのものである。さらに別の手段は、情報が記録されたコンピュータ可読媒体、例えば、ディスケット、CDなどである。存在し得るさらに別の手段は、遠隔部位の情報にアクセスするためにインターネット経由で使用し得るウェブサイトアドレスである。任意の好都合な手段がキットに存在し得る。
本発明の様々な特徴をさらに説明する実施例を以下でさらに示す。これらの実施例は、本発明を実施するための有用な方法も説明する。これらの実施例は、請求された発明を限定するものではない。
実施例1
研究対象の採取
15年間の縦断的肺機能研究の最後に、40人のCOPD患者と20人の健常対照からクエン酸緩衝液中に血液を採取した。COPD患者と健常対照は、現喫煙者または元喫煙者のいずれかであった。COPD患者は、当初、NIHが資金援助した全米肺健康研究(National Lung Health Study)という、肺機能に関する5年間の縦断的研究の一環として1987〜88年に募集された(Owens,1991,Am.J.Med.91:37S−40S)。募集された患者は、FEV1が50%〜90%の範囲で、FEV1/努力肺活量(FVC)が0.7未満で、かつCOPDの特徴的な呼吸器症状を示す、35歳〜59歳の現喫煙者であった。肺活量測定は、肺健康研究の期間中、毎年行なわれた。この研究で評価されたCOPD患者については、ユタ大学で次の10年間、様々な間隔でさらなる肺活量測定が行なわれた。15年間の肺機能に関する縦断的情報に基づいて、COPD患者は2つのはっきりと区別できる群に分類された。26人の急速低下群のCOPDサブグループは、過去15年間で年間平均40ml以上のFEV1を失った人によって定義される。これは、健康な喫煙者と非喫煙者について報告されている20mlのFEV1という正常な低下の2倍以上である(Rennard,1998,前掲)。14人の緩徐低下群のCOPDサブグループは、年間平均40ml未満のFEV1を失った人によって定義される。血液採取の時点で、急速低下群は、それまでの15年間で平均20.2%のFEV1を失っているので、全体で、予想される正常FEV1の64%を有していた。緩徐低下群は、それまでの15年間で平均2.4%のFEV1しか失っていないので、全体で、予想される正常FEV1の72%を有していた。COPD患者は全員、他の主な病気にはかかっておらず、研究期間中はコルチコステロイドを使用しておらず、よく似た年齢および性別分布であった。健康な喫煙者/元喫煙者の対照は、研究期間中ずっと募集され、性別、年齢、および民族性によってマッチングされた。研究におけるCOPD患者と対照の臨床的特徴を表2に報告する。
Figure 2011521203
実施例2
血漿マーカーの分析
Rules−Based Medicine社(Austin,TX)独自のヒト抗原MAPプラットフォームでマーカーを分析するために、この会社に凍結血漿試料を送付した。凍結血漿試料を室温で解凍し、ボルテックスし、清澄化するために13,000 x gで5分間回転させ、マーカー分析用に40uLを取って、マスターマイクロタイタープレートに入れた。自動ピペッティングを用いて、各試料のアリコートを、ヒト抗原MAPの捕捉ミクロスフェアマルチプレックスの1つに導入した。これらの試料と捕捉ミクロスフェアの混合物を完全に混合し、室温で1時間インキュベートした。次に、各マルチプレックスに対するビオチン化レポーター抗体のマルチプレックス化カクテルをロボット制御によって添加し、完全に混合した後、室温でさらに1時間インキュベートした。各マルチプレックス中に完全に混合し、室温で1時間インキュベートした過剰なストレプトアビジン−フィコエリスリン溶液を用いて、これらのマルチプレックスを発色させた。各マルチプレックス化反応液の容量を真空濾過で減少させ、分析用のマトリックス緩衝液中に希釈することによって容量を増大させた。Luminex 100装置で分析を行ない、得られたデータ流を、Rules−Based Medicineで開発された独自のデータ分析ソフトウェアを用いて解釈した。各マルチプレックスについて、各マイクロタイタープレート上に校正物質と対照を含めた。各プレートの最初と最後の列に8点の校正物質を入れ、3つのレベルの対照を2つ1組で含めた。適切なアッセイ性能を保証するために、各マルチプレックスの高レベルと中レベルと低レベルの対照について、まず検査結果を明らかにした。データ分析パッケージに含まれる4および5パラメータの、加重および非加重曲線当てはめアルゴリズムを用いて、特定のマルチプレックス中にある各々の分析物についての未知値を測定した。
実施例3
データ分析
個々のマーカーの単変量分析。ウィルコクソン順位和検定を用いて、COPD急速低下群と健常対照、COPD緩徐低下群と健常対照、およびCOPD急速低下群とCOPD緩徐低下群の間の各マーカーの有意性を評価した。正確なp−値は、シフトアルゴリズム(StreitbergおよびRohmel(1986) Exact Distribution for Permutations and Rank Test:An Introduction to Some Recently Published Algorithms.Statistical Software Newsletter.12:10−17)を用いて決定した。加えて、より厳密な偽発見率を用いて、各マーカーの有意性の強さをさらに評価した。p−値で評価される偽陽性率(FPR)は、実際に変化しなかった全マーカーの中での偽陽性の比率のことである。q−値で評価される偽発見率(FDR)は、偽陽性である有意変化の比率である。各マーカーのq−値は、Benjamini & Hockberg(BenjaminiおよびHockberg,2000,J.Behav.Educ.Statist.25:60−83)によって提唱された方法を用いて導き出された。分析は全て、R、バージョン2.4(R Development Core Team(2006).R:A language and environment for statistical computing.R Foundation for Statistical Computing,Vienna,Austria.ISBN 3−900051−07−0,URL http://www.R−project.org.)を用いて実施された。
本発明者らは、まず、試験した89個の血漿マーカーの1つ1つについて、COPD急速低下群と対照の間の平均値(中央値)を比較した。多くの小さいけれども有意な(p<0.05)差がこれら2つの群の間に認められた(表3)。p−値で評価される偽陽性率(FPR)は、実際に変化しなかった全マーカーの中での偽陽性の比率のことである。q−値で評価される偽発見率(FDR)は、偽陽性である有意変化の比率である。正の変化倍数値は、健常対照に対する増加を表し、負の値は減少を表す。激しい変化倍数という点で、最も大きな差は、インターロイキン−4(IL−4;急速低下群において4.2倍の増加)、エオタキシン(2.6倍の増加)、インターロイキン−7(IL−7;2.2倍の増加)、およびハプトグロビン(2.0倍の増加)の場合に見られた。統計的に最も有意な差は、IL−4、単球走化性タンパク質(MCP−1)、可溶性血管細胞接着分子−1(sVCAM−1)、およびエオタキシンについて認められ、p値(偽陽性率)は0.1%未満、q値(偽発見率)は1%未満であった(図1)。対照的に、緩徐COPD低下群と対照との単変量比較からは、より少なくかつより小さい有意差が明らかとなった(表4)。4つのマーカーのみが0.05未満のp値を有し、かつ4例全てにおいて、偽発見率が非常に高かった(>50%)。最後に、緩徐COPD低下群と急速COPD低下群を比較したときに、いくつかの興味深い差が見られた(表5)。インターロイキン−4(IL−4)、インターロイキン−5(IL−5)、単球走化性タンパク質−1(MCP−1)、マクロファージ由来ケモカイン(MDC)、および組織因子は、緩徐低下群と比較して急速低下群において有意により高いレベルで存在した(p<0.05)。癌抗原19.9、免疫グロブリンA型(IgA)、インスリン、マクロファージ炎症性タンパク質1α(MIP−1α)、および可溶性血管細胞接着分子1(sVCAM−1)は、緩徐低下群と比較して急速低下群において有意により低いレベルで存在した。
Figure 2011521203
Figure 2011521203
Figure 2011521203
シグネチャーを同定するための多変量分析。線形判別分析(Venables,W.N. & Ripley,B.D.,(2002).Modern Applied Statistics,第4版.Springer)による前進選択法を用いて、COPD急速低下群と健常対照、COPD緩徐低下群と健常対照、およびCOPD急速低下群とCOPD緩徐低下群を最適に類別する多分析物パネル(シグネチャー)を決定した。この分析では、データセットの各点から各群の多変量平均(セントロイドと呼ぶ)までの距離を測定し、その点を最も近い群へと分類した。使用した距離量は、変数間の分散と共分散を考慮に入れるマハラノビス距離であった。代表的な多分析物パネル(シグネチャー)を、その予測性能とともに表6に示す。これらのマーカーが提供データセットについてCOPDと対照を類別する予測性能を、50回繰り返しの5倍クロス確認を用いて調べた。これによって、データがランダムに5つの亜群に分けられ、各グループが1回に1つ除外され、残りの4つの亜群に対するモデルが構築され、このフィッティングしたモデルを用いて第5の亜群における疾患分類が予測され、これが5つの群全てに対して繰り返された後、結果が平均化される。この分析を50回繰り返して、全体精度の信頼できる推定値を、バイオマーカーシグネチャーの感度と特異度とともに生成する。これらの分析は、20人の対照と14人または26人のCOPD対象に基づいており、R、バージョン2.4(R Development Core Team(2006).R:A language and environment for statistical computing.R Foundation for Statistical Computing,Vienna,Austria.ISBN 3−900051−07−0,URL http://www.R−project.org.)を用いて行なわれた。
Figure 2011521203
どの血漿マーカーもそれらだけではCOPD患者と対照を明確に区別することができなかったので、本発明者らは、線形判別分析法(LDA)を用いるデータの多変量分析を行なった。この方法によって、COPD急速低下群と対照(健常喫煙者)を正確に区別することができる血漿マーカー群(シグネチャー1)が同定された(図2A)。図2Aは、COPD急速低下群と健常対照を類別する6マーカーシグネチャーの主成分を用いた二次元表示の線形判別分析(LDA)からの出力である。使用した距離量は、変数間の分散と共分散を考慮に入れるマハラノビス距離である。各多変量平均は、表示付きの丸である。丸の大きさは、平均の95%信頼限界に相当する。有意に異なる群は、交差しない丸を有する傾向にある。シグネチャー1は、以下の6個のマーカーから構成されている:アポリポタンパク質H、CD40、ハプトグロビン、インターロイキン−8(IL−8)、単球走化性タンパク質−1(MCP−1)、および腫瘍壊死因子受容体II(TNF−RII)。これらのマーカーの単変量分析により、CD40(1.15倍、p<0.5)を除いて、有意差が示された(p<0.05;表3)。シグネチャー1は、血漿試料がCOPD急速低下群に由来するものであることを93%の症例(感度)で、血漿試料が健常対象に由来するものであることを86%の症例(特異度)で正確に同定することができ、2つのグループを約90%の全体精度で区別することが50回繰り返しの5倍クロス確認によって示された。
次に、本発明者らは、シグネチャー1の縦断的安定性を検証することを望んだ。最初の試料を用いてシグネチャー1を同定してから約1年後に、26人中9人のCOPD急速低下群と20人中5人の健常対照から血液試料を採取した。このシグネチャーは、9人全てのCOPD急速低下群と5人中4人の健常対照を正確に同定し、約93%の全体精度を示した(表6)。
LDA法を用いて、本発明者らは、COPD緩徐低下群と健常対照を正確に区別することができる2つ目の血漿マーカー群(シグネチャー2)も同定した(図2)。図2は、COPD緩徐低下群と健常対照を類別する8マーカーシグネチャーの主成分を用いた二次元表示の線形判別分析(LDA)からの出力である。シグネチャー2は、以下の8個のマーカーから構成されている:アポリポタンパク質CIII、CD40、顆粒球−マクロファージコロニー刺激因子(GM−CSF)、ハプトグロビン、免疫グロブリンA(IgA)、マクロファージ炎症性タンパク質1α(MIP−1α)、組織因子、および腫瘍壊死因子−α(TNF−α)。シグネチャー2は、91%の感度と96%の特異度を有し、緩徐低下群と対照を約94%の全体精度で区別することが50回繰り返しの5倍クロス確認によって示された(表6)。
最後に、本発明者らは、COPD急速低下群と緩徐低下群を正確に区別することができる3つ目の血漿マーカー群(シグネチャー3)を同定した(図2C)。図2Cは、COPD緩徐低下群と急速低下群を類別する9マーカーシグネチャーの主成分を用いた二次元表示の線形判別分析(LDA)からの出力である。シグネチャー3は、以下の9個のマーカーから構成されている:α1−アンチトリプシン、C−反応性タンパク質(CRP)、フィブリノゲン、顆粒球−マクロファージコロニー刺激因子(GM−CSF)、インターロイキン−4(IL−4)、マクロファージ由来ケモカイン(MDC)、組織因子、腫瘍壊死因子受容体II(TNF−RII)、および可溶性血管細胞接着分子−1(sVCAM−1)。シグネチャー3は、血漿試料がCOPD急速低下群に由来するものであることを95%の症例で、血漿試料がCOPD緩徐低下群に由来するものであることを86%の症例で正確に同定することができ、2つのグループを約92%の全体精度で区別することが50回繰り返しの5倍クロス確認によって示された(表6)。
表7に、LDA分析から得られた、優れた感度と特異度を与える代表的なバイオマーカー組合せを記載する。R(Venables,W.N. & Ripley,B.D.,(2002).Modern Applied Statistics,第4版.Springer,New York)の中のコントリビュートライブラリー(contributed library)を用いて、様々なマーカー組合せの性能を評価するためのLDAを行なった。Rの中のコントリビュートライブラリーを用いて、バイオマーカー組合せの性能メトリックの信頼できる推定値を得るための5倍クロス確認を行なった(Andrea PetersおよびTorsten Hothorn,2004,Improved Predictors,Rパッケージ バージョン0.8〜3)。
Figure 2011521203
考察。本研究において、本発明者らは、そのレベルが健常対照と比較してCOPD患者で統計的に異なる血漿タンパク質を同定した。評価した89個の血漿マーカーのうち、25個が急速低下群と対照の間で統計的に異なっていた(p<0.05)のに対し、4個のマーカーしか、緩徐低下群と対照の間で統計的に異なっていなかった(p<0.05)。これらの単変量分析から、緩徐低下群と対照の間に存在する(わずか4個のマーカー、p<0.05)統計的有意差よりも大きい統計的有意差が急速低下群と緩徐低下群の間に実際に存在する(10個のマーカー、p<0.05)ことが示された。本発明者らの知る限り、これは、この疾患の緩徐発現と急速発現をこのように大規模に血清学的に区別した最初の研究である。
α1−アンチトリプシン(Aldonyteら,2004,COPD1:155−164)、エオタキシン(Aldonyteら,2004,前掲;Janhz−Rozykら,2000,Pol.Merkur.Lekarski.9:649−652)、フィブリノゲン(Ganら,2004,Thorax 59:574−580)、IL−4(Zhangら,1999,J Tongji Med.Univ.19:15−19)、IL−8、MCP−1、およびVEGF(Pinto−Plataら,2007,Thorax 62:595−601)などの、急速低下群と対照の間で差を示すマーカーのうちのいくつかは、増悪していないCOPD患者の血液中で調節されることが過去に報告されている。対照と比較して急速低下群で顕著に調節される25個のマーカーのうち、可溶性のTNF−α受容体II(sTNFRII)と可溶型の血管細胞接着分子−1(sVCAM−1)の2個しか急速低下群で減少しない。興味深いことに、これらは両方とも、抗炎症タンパク質である。sTNFRIIが炎症促進性タンパク質TNF−α(Carpentierら,2004,Curr.Med.Chem,11:2205−2212)を捕捉するのに対し、sVCAM−1は、VCAM−1を担持する白血球がVCAM−1リガンドであるα4β1インテグリンを発現する内皮細胞に接着するのを妨害する(Foster,1996,J Allergy Clin.Immunol.98:S270−S277)。
興味深いことに、対照よりも急速低下群で顕著に増大するマーカーのパネルの中には、好中球とマクロファージという、COPDに関与する2つの細胞型の活性を調節することが知られている、GM−CSF、IL−8、およびMCP−1などの走化性因子が存在している(Barnes,2004,Pharmacol Rev.56:515−548)。より一層興味深いことに、そのリストの中には、Th2/Tc2表現型と関連する、IL−4、IL−5、IL−10、IL−13、およびエオタキシンなどのいくつかのメディエーターが存在している。このことは、COPD患者の肺に存在するTリンパ球が、健常喫煙者由来のTリンパ球よりも顕著に多いIL−4、IL−10、およびIL−13を産生するという最近の研究報告と一致する(Barceloら,2006,Clin.Exp.Immunol.145:474−479)。この観察は、より重篤な種類の疾患において喘息とCOPDの間に重複があることを示唆する仮説を支持する(Jeffery,Peter K.“Lymphocytes, Chronic Bronchitis and Chronic Obstructive Pulmonary Disease.” Chronic Obstructive Pulmonary Disease:Pathogenesis to Treatment:Novartis Foundation Symposium,第234巻. Derek Chadwick & Jamie A.Goode編.Chichester:Wiley,2001.149−168)。
COPDは、多くの他の慢性疾患と同様に、表現型の発現が遺伝的要因と環境要因によって影響される不均一性の高い疾患であると考えられている。このため、単変量分析を行なったときに、各血漿マーカーについて群内変動性が観測されることが予想される。COPDと対照から得られた血清中マーカーを単変量分析した後の類似の変動性が別のグループによって最近記載された(Pinto−Plataら,2007,前掲)。このような状況において、各々の個々の血漿マーカーは、健常人由来の試料と緩徐型または急速型のいずれかのCOPD患者を正確に区別する限られた能力しか持たない。多変量分析における複数のマーカーの組合せは、こうした群内不均一性を考慮に入れる。多変量分析により、急速低下群と健常対照を約90%の精度で区別することができる6マーカーシグネチャーが同定された。重要なことは、約1年後に同じコホートから得られた試料を分析したとき、これらの同じ6個のマーカーを用いて類似の結果が得られたということであり、これによって、このシグネチャーが縦断的に安定であり、したがって、臨床的に有用である可能性があることが示唆される。このシグネチャーは、COPDの特徴となる炎症において役割を果たすことが推定される、IL−8やMCP−1などの、好中球と単球に対する走化性因子(Barnes,2004,前掲);慢性腎不全(Schwabeら,1999,Clin.Exp.Immunol.117:153−158)、慢性肝疾患(Schmilovitz−Weissら,2004,Apoptosis 9:205−210)、アルツハイマー病(Mocaliら,2004,Exp.Gerontol.39:1555−1561)、および全身性硬化症(Komuraら,2007,J.Rheumatol.34:353−358)の患者で上昇することが過去に報告されているCD40と命名された表面糖タンパク質の血中可溶形態;抗酸化特性と抗炎症特性を有する急性期タンパク質であるハプトグロビン(ZviおよびLevy,2006,Clin.Lab.52:29−35);抗炎症性sTNFRII;ならびに血液凝固、止血、および抗リン脂質抗体の産生を含む、種々の生理的経路に関与する血漿糖タンパク質であるアポリポタンパク質H(McNeilら,1990,Proc.Natl.Acad.Sci.USA 87:4120−4124)から構成される。
sCD40とハプトグロビンは、緩徐低下群と対照を約94%の精度で区別することができる8個の血漿マーカーからなる群の一部でもある。このシグネチャーには、3つの他のサイトカイン/ケモカイン、すなわち、安定なCOPD患者と増悪したCOPD患者から得られる気管支肺胞洗浄液中に高いレベルで見られる、好中球の生存と活性の調節因子であるGM−CSF(Balbiら,1997,Eur.Respir.J.10:846−850);好中球と単球に対する走化性因子であるMIP1−α(Barnes,2004,前掲)、およびCOPDに関与し(Barnes,2004,前掲)、安定なCOPD患者の血中により高いレベルで見られる(Ganら,2994,前掲)サイトカインである、TNF−αも含まれる。COPD緩徐低下群のシグネチャーは、リポタンパク質代謝の調節因子であるアポリポタンパク質CIII(Shachter,2001,Curr.Opin.Lipidol.12:297−304);過去に抗リン脂質抗体と関連付けられている血中免疫グロブリンのサブタイプであるIgA(Staubら,2006,Autoimmun.Rev.6:104−106);および抗リン脂質抗体の存在と血栓閉塞性合併症を特徴とする抗リン脂質症候群の患者で上昇することが分かっている凝固因子である可溶性組織因子(sTF)によって完成となる。
急速COPD低下群対緩徐COPD低下群のシグネチャーは、9個の血漿マーカーから構成される。これらのマーカーのうちの3つ、α1−アンチトリプシン、C−反応性タンパク質(CRP)、およびフィブリノゲンは、COPD患者において調節されることが広く報告されている(Ganら,2004,前掲;RanesおよびStoller,2005,Semin.Respir.Crit.Care Med.26:154−166)。3つの他のマーカーは、GM−CSF、IL−4、およびマクロファージ由来ケモカイン(MDC)という、サイトカイン/ケモカインである。GM−CSFは、緩徐低下群のシグネチャーにも含まれており、上で考察されている。IL−4は、単変量分析において緩徐低下群や対照と比較して急速低下群で最も顕著に増大したマーカーである。MDC(CCL22)は、IL−4によって上方調節されることが示されており、Th2細胞の炎症部位への動員に重要な役割を果たしている(Ganら,2004,前掲;YamashitaおよびKuroda,2002,Crit.Rev.Immunol.22:105−114)。このシグネチャーは、上記のsTF、sTNFRII、およびsVCAM−1をもって完成となる。
対照と緩徐COPD低下群と急速COPD低下群を区別する単一のシグネチャーを同定するという試みからは、82%を超える精度が得られなかった。急速COPD低下群または緩徐COPD低下群と対照を正確に区別する明確なシグネチャーの必要性と、急速COPD低下群と緩徐COPD低下群を正確に区別するシグネチャーを発見することができるという事実とによって、COPDにおける肺機能低下速度と関連がある基本的な生化学的違いが存在することが示唆される。本発明者らの知る限り、本研究は、緩徐低下型のCOPDと急速低下型のCOPDを区別する血漿マーカーを記載した最初の研究である。

Claims (22)

  1. ヒト対象から得られた試験試料を分類するコンピュータ実行型の方法であって、
    (a)前記試験試料と関連するデータセットを取得する工程であって、前記取得データセットが、
    (i)アポリポタンパク質H、CD40、ハプトグロビン、インターロイキン−8(IL−8)、単球走化性タンパク質−1(MCP−1)、および腫瘍壊死因子受容体II(TNF−RII)と、
    (ii)アポリポタンパク質CIII、CD40、顆粒球−マクロファージコロニー刺激因子(GM−CSF)、ハプトグロビン、免疫グロブリンA(IgA)、マクロファージ炎症性タンパク質1α(MIP−1α)、組織因子、および腫瘍壊死因子−α(TNF−α)と、
    (iii)α−1アンチトリプシン、C−反応性タンパク質(CRP)、フィブリノゲン、顆粒球−マクロファージコロニー刺激因子(GM−CSF)、インターロイキン−4(IL−4)、マクロファージ由来ケモカイン(MDC)、組織因子、腫瘍壊死因子受容体II(TNFRII)、および可溶性血管細胞接着分子1(sVCAM−1)と、からなる群から選択される多分析物パネルから選択される少なくとも3つのタンパク質マーカーについての定量的データを含む、工程と、
    (b)1つまたは複数の参照データセットに対して前記取得データセットを比較するコンピュータ上の分析プロセスに前記取得データセットを入力する工程と、
    (c)前記分析プロセスの出力に従って前記試験試料を分類する工程であって、前記分類が慢性閉塞性肺疾患(COPD)分類および健康分類からなる群から選択される、工程と、を含む方法。
  2. 前記試験試料を分類した後に、(a)治験で薬物の効力を評価するか、前記対象におけるCOPDを診断するか、前記対象におけるCOPDの進行度を評価するか、もしくは前記対象のためのCOPD治療計画を開発するために、前記分類情報を変換する工程、または(b)前記対象のCOPDを治療する工程のいずれかをさらに含む、請求項1に記載の方法。
  3. 前記試験試料が、血液、血漿、および血清からなる群から選択される、請求項1または2に記載の方法。
  4. 前記分析プロセスが、前記1つまたは複数の参照データセットを含む予測モデルの使用を含む、請求項3に記載の方法。
  5. COPD分類が、急速低下COPD分類または緩徐低下COPD分類のいずれかに相当する、請求項4に記載の方法。
  6. 前記1つまたは複数の参照データセットが、健常対象、急速低下COPDと診断された対象、および緩徐低下COPDと診断された対象からなる群から選択される1人または複数人のヒト対象から得られた定量的データを含む、請求項5に記載の方法。
  7. 前記少なくとも3個のタンパク質マーカーが、アポリポタンパク質H、MCP−1、およびTNF−RIIを含む、請求項6に記載の方法。
  8. 前記取得データセットが、アポリポタンパク質H、CD40、ハプトグロビン、IL−8、MCP−1、およびTNF−RIIからの定量的データを含む、請求項7に記載の方法。
  9. 前記少なくとも3つのタンパク質マーカーが、IgA、MIP−1α、および組織因子を含む、請求項6に記載の方法。
  10. 前記取得データセットが、アポリポタンパク質CIII、CD40、GM−CSF、ハプトグロビン、IgA、MIP−1α、組織因子、およびTNF−αからの定量的データを含む、請求項9に記載の方法。
  11. 前記少なくとも3つのタンパク質マーカーが、MDC、組織因子、およびsVCAM−1を含む、請求項6に記載の方法。
  12. 前記取得データセットが、α−1アンチトリプシン、CRP、フィブリノゲン、GM−CSF、IL−4、MDC、組織因子、TNF−RII、およびsVCAM−1からの定量的データを含む、請求項11に記載の方法。
  13. 前記分析プロセスが、線形判別分析(LDA)モデル、サポートベクターマシン分類アルゴリズム、再帰的特徴削除モデル、マイクロアレイの予測分析モデル、ロジスティック回帰モデル、CARTアルゴリズム、FlexTreeアルゴリズム、LARTアルゴリズム、ランダムフォレストアルゴリズム、MARTアルゴリズム、または機械学習アルゴリズムのいずれかの使用を含む、請求項1または2に記載の方法。
  14. 前記分析プロセスが、75%を超える品質メトリックを提供するように選択された項を含むLDAモデルの使用を含む、請求項13に記載の方法。
  15. 前記品質メトリックが精度である、請求項14に記載の方法。
  16. 前記LDAモデルを、少なくとも70%の感度または特異度のうちの少なくとも1つを提供するように調整する、請求項15に記載の方法。
  17. 前記予測モデルが、分類のための少なくとも75%の品質メトリックを有する、請求項4に記載の方法。
  18. 前記予測モデルが、分類のための少なくとも90%の品質メトリックを有する、請求項17に記載の方法。
  19. 前記品質メトリックが精度である、請求項17に記載の方法。
  20. 前記予測モデルの限度を、少なくとも70%の感度または特異度のうちの少なくとも1つを提供するように調整する、請求項19に記載の方法。
  21. ヒト対象から得られた試験試料を分類するためのキットであって、
    (a)アポリポタンパク質H、CD40、ハプトグロビン、インターロイキン−8(IL−8)、単球走化性タンパク質−1(MCP−1)、および腫瘍壊死因子受容体II(TNF−RII)と、
    (b)アポリポタンパク質CIII、CD40、顆粒球−マクロファージコロニー刺激因子(GM−CSF)、ハプトグロビン、免疫グロブリンA(IgA)、マクロファージ炎症性タンパク質1α(MIP−1α)、組織因子、および腫瘍壊死因子−α(TNF−α)と、
    (c)α−1アンチトリプシン、C−反応性タンパク質(CRP)、フィブリノゲン、顆粒球−マクロファージコロニー刺激因子(GM−CSF)、インターロイキン−4(IL−4)、マクロファージ由来ケモカイン(MDC)、組織因子、腫瘍壊死因子受容体II(TNFRII)、および可溶性血管細胞接着分子1(sVCAM−I)と、
    からなる群から選択される多分析物パネルから選択される少なくとも3つのタンパク質マーカーを検出するための試薬を含み、
    前記分類が、慢性閉塞性肺疾患(COPD)分類と健康分類からなる群から選択される、
    キット。
  22. 前記試薬が抗体である、請求項21に記載のキット。
JP2010550748A 2008-03-10 2009-02-27 Copdバイオマーカーシグネチャー Expired - Fee Related JP5574990B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US6877208P 2008-03-10 2008-03-10
US61/068,772 2008-03-10
PCT/US2009/035376 WO2009114292A1 (en) 2008-03-10 2009-02-27 Copd biomarker signatures

Publications (2)

Publication Number Publication Date
JP2011521203A true JP2011521203A (ja) 2011-07-21
JP5574990B2 JP5574990B2 (ja) 2014-08-20

Family

ID=41065531

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010550748A Expired - Fee Related JP5574990B2 (ja) 2008-03-10 2009-02-27 Copdバイオマーカーシグネチャー

Country Status (6)

Country Link
US (2) US20110160070A1 (ja)
EP (2) EP2269060B1 (ja)
JP (1) JP5574990B2 (ja)
CN (1) CN102089654A (ja)
CA (1) CA2718251A1 (ja)
WO (1) WO2009114292A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013524202A (ja) * 2010-03-29 2013-06-17 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 喀痰分析を用いるcopd増悪検出

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0911007D0 (en) 2009-06-25 2009-08-12 Univ Hospital Of North Staffordshire Analyzer apparatus and methods for lung disease
AU2011217734B2 (en) * 2010-02-16 2016-08-11 The University Of Newcastle Protein biomarkers for obstructive airways diseases
US20140030735A1 (en) 2011-03-07 2014-01-30 Temple University - Of The Commonwealth System Of Higher Education Biomarkers of chronic obstructive pulmonary disease
WO2013190092A1 (en) 2012-06-21 2013-12-27 Philip Morris Products S.A. Gene signatures for copd diagnosis
US20140012637A1 (en) * 2012-07-06 2014-01-09 Xerox Corporation Traffic delay detection by mining ticket validation transactions
US9103837B2 (en) 2012-11-07 2015-08-11 Somalogic, Inc. Chronic obstructive pulmonary disease (COPD) biomarkers and uses thereof
JP6636174B2 (ja) * 2015-12-30 2020-01-29 インスティチュート オブ フィジックス ベオグラード,ユニバーシティ オブ ベオグラード 生物粒子のパターンを含むセキュリティタグ
CA3059044A1 (en) * 2017-04-12 2018-10-18 Proterixbio, Inc. Biomarker combinations for monitoring chronic obstructive pulmonary disease and/or associated mechanisms
CN109680060A (zh) * 2017-10-17 2019-04-26 华东师范大学 甲基化标志物及其在肿瘤诊断、分类中的应用
CA3116768A1 (en) * 2018-10-30 2020-05-07 Somalogic, Inc. Methods for sample quality assessment
US10354205B1 (en) 2018-11-29 2019-07-16 Capital One Services, Llc Machine learning system and apparatus for sampling labelled data
CN110824166A (zh) * 2019-11-20 2020-02-21 淄博市中心医院 一种便捷的肿瘤标志物分子检测方法
US20230298696A1 (en) * 2020-07-24 2023-09-21 The Regents Of The University Of California Biomarkers and methods of selecting and using the same
CN112725435A (zh) * 2021-01-28 2021-04-30 中国医学科学院北京协和医院 慢阻肺急性加重易感基因及其在预测易感慢阻肺急性加重中的应用
CN113951867B (zh) * 2021-10-19 2023-10-17 天津大学 一种基于口鼻气流信号的慢性阻塞性肺疾病识别装置
CN114708918A (zh) * 2022-04-20 2022-07-05 中国科学院深圳先进技术研究院 特发性肺纤维化中罕见巨噬细胞亚群及疾病标志物的鉴定方法及***

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006118522A1 (en) * 2005-04-29 2006-11-09 Astrazeneca Ab Peptides as biomarkers of copd
JP2006526140A (ja) * 2002-12-24 2006-11-16 バイオサイト インコーポレイテッド 鑑別診断のためのマーカーおよびその使用方法
WO2007084485A2 (en) * 2006-01-13 2007-07-26 Battelle Memorial Institute Markers for assessing copd-related diseases
JP2007527209A (ja) * 2003-06-27 2007-09-27 アクチミス ファーマシューティカルズ インコーポレーテッド Copdキナーゼ(rcキナーゼ)において制御される、キナーゼの制御
WO2008003066A2 (en) * 2006-06-28 2008-01-03 Lineagen, Inc. Apparatus, compositions, and methods for assessment of chronic obstructive pulmonary disease progression among rapid and slow decline conditions

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE462454B (sv) 1988-11-10 1990-06-25 Pharmacia Ab Maetyta foer anvaendning i biosensorer
NZ516848A (en) 1997-06-20 2004-03-26 Ciphergen Biosystems Inc Retentate chromatography apparatus with applications in biology and medicine
IL138668A0 (en) 1998-04-03 2001-10-31 Phylos Inc Addressable protein arrays
US6406921B1 (en) 1998-07-14 2002-06-18 Zyomyx, Incorporated Protein arrays for high-throughput screening
WO2000056934A1 (en) 1999-03-24 2000-09-28 Packard Bioscience Company Continuous porous matrix arrays
GB2384239A (en) 2001-12-05 2003-07-23 Sense Proteomic Ltd Arrays of protein variants
WO2004070058A1 (en) 2003-02-03 2004-08-19 Bayer Healthcare Ag Methods and compositions for the prediction, diagnosis, prognosis, prevention and treatment of copd
JP2007527239A (ja) * 2004-02-27 2007-09-27 バイオシーク インコーポレイティッド 喘息およびアトピーの生物学的データセットプロファイリング方法
US7991557B2 (en) * 2004-06-19 2011-08-02 Genenews Corporation Computer system and methods for constructing biological classifiers and uses thereof
WO2006097244A2 (en) 2005-03-17 2006-09-21 F. Hoffman-La Roche Ag Methods for assessing emphysema
WO2007002264A2 (en) 2005-06-22 2007-01-04 The Johns Hopkins University Biomarker for ovarian cancer: ctap3-related proteins
US20070099239A1 (en) * 2005-06-24 2007-05-03 Raymond Tabibiazar Methods and compositions for diagnosis and monitoring of atherosclerotic cardiovascular disease
ES2606015T3 (es) * 2005-12-22 2017-03-17 Abbott Molecular Inc. Métodos y combinaciones de marcadores para la detección de la predisposición al cáncer de pulmón
WO2007103568A2 (en) * 2006-03-09 2007-09-13 Biosite, Inc. Methods and compositions for the diagnosis of diseases of the aorta

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006526140A (ja) * 2002-12-24 2006-11-16 バイオサイト インコーポレイテッド 鑑別診断のためのマーカーおよびその使用方法
JP2007527209A (ja) * 2003-06-27 2007-09-27 アクチミス ファーマシューティカルズ インコーポレーテッド Copdキナーゼ(rcキナーゼ)において制御される、キナーゼの制御
WO2006118522A1 (en) * 2005-04-29 2006-11-09 Astrazeneca Ab Peptides as biomarkers of copd
WO2007084485A2 (en) * 2006-01-13 2007-07-26 Battelle Memorial Institute Markers for assessing copd-related diseases
WO2008003066A2 (en) * 2006-06-28 2008-01-03 Lineagen, Inc. Apparatus, compositions, and methods for assessment of chronic obstructive pulmonary disease progression among rapid and slow decline conditions

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013524202A (ja) * 2010-03-29 2013-06-17 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 喀痰分析を用いるcopd増悪検出

Also Published As

Publication number Publication date
EP2269060A4 (en) 2011-05-11
EP2269060B1 (en) 2016-08-17
WO2009114292A1 (en) 2009-09-17
US20110160070A1 (en) 2011-06-30
EP2269060A1 (en) 2011-01-05
EP3156925A2 (en) 2017-04-19
JP5574990B2 (ja) 2014-08-20
CN102089654A (zh) 2011-06-08
EP3156925A3 (en) 2017-06-21
US20180004895A1 (en) 2018-01-04
CA2718251A1 (en) 2009-09-17

Similar Documents

Publication Publication Date Title
JP5574990B2 (ja) Copdバイオマーカーシグネチャー
Rossios et al. Sputum transcriptomics reveal upregulation of IL-1 receptor family members in patients with severe asthma
JP2022136138A (ja) 分類システムおよびそのキットを使用した肺疾患の同定および診断方法
US20070099239A1 (en) Methods and compositions for diagnosis and monitoring of atherosclerotic cardiovascular disease
US9423403B2 (en) Chronic obstructive pulmonary disease (COPD) biomarkers and uses thereof
US20080300797A1 (en) Two biomarkers for diagnosis and monitoring of atherosclerotic cardiovascular disease
Ling et al. A diagnostic algorithm combining clinical and molecular data distinguishes Kawasaki disease from other febrile illnesses
JP2015514227A (ja) 結核バイオマーカーおよびその使用
US20140162370A1 (en) Urine biomarkers for necrotizing enterocolitis and sepsis
US20220215963A1 (en) Time Window-Based Platform for the Rapid Stratification of Blunt Trauma Patients into Distinct Outcome Cohorts
Jiang et al. RNA sequencing data from neutrophils of patients with cystic fibrosis reveals potential for developing biomarkers for pulmonary exacerbations
WO2015164616A1 (en) Biomarkers for detection of tuberculosis
Qiu et al. A novel prognostic signature for idiopathic pulmonary fibrosis based on five-immune-related genes
Edmiston et al. Gene expression profiling of peripheral blood leukocytes identifies potential novel biomarkers of chronic obstructive pulmonary disease in current and former smokers
Faro et al. Polygenic risk scores and risk stratification in deep vein thrombosis
Wang et al. Transcriptomic analysis identified SLC40A1 as a key iron metabolism-related gene in airway macrophages in childhood allergic asthma
Baghela et al. Facilitating systems-level analyses of all-cause and Covid-mediated sepsis through SeptiSearch, a manually-curated compendium of dysregulated gene sets
Bonaroti et al. Prognostic biomarkers to predict outcomes in trauma
Wesnawa et al. Emerging Role of Precision Medicine in Diagnosis and Treatment of Chronic Respiratory Disease
US20240255524A1 (en) Renal Insufficiency Prediction and Uses Thereof
Dasgupta et al. Metabolomics and Transcriptomic Approach to Understand the Pathophysiology of Interstitial Lung Disease
US20230268031A1 (en) Monitoring and management of cell therapy-induced toxicities
WO2024015485A1 (en) Methods of assessing dementia risk
Yang Blood-based biomarkers of asthma
Cui et al. Integration of metabolomics methodologies for the development of predictive models for mortality risk in patients with severe COVID-19.

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120227

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121218

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121221

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130321

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130328

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130422

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130430

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130521

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130528

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130621

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140204

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140424

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140603

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140701

R150 Certificate of patent or registration of utility model

Ref document number: 5574990

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees