JP6731957B2 - 子宮内膜癌の診断方法 - Google Patents

子宮内膜癌の診断方法 Download PDF

Info

Publication number
JP6731957B2
JP6731957B2 JP2017563386A JP2017563386A JP6731957B2 JP 6731957 B2 JP6731957 B2 JP 6731957B2 JP 2017563386 A JP2017563386 A JP 2017563386A JP 2017563386 A JP2017563386 A JP 2017563386A JP 6731957 B2 JP6731957 B2 JP 6731957B2
Authority
JP
Japan
Prior art keywords
analysis
model
motomeko
classification
metabolites
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017563386A
Other languages
English (en)
Other versions
JP2018511811A (ja
Inventor
トロイシ,ジャコポ
スカラ,ジョヴァンニ
カンピーリア,ピエトロ
ズッロ,フルヴィオ
グイーダ,マウリーツィオ
Original Assignee
オスモティック・ソチエタ・ア・レスポンサビリタ・リミタータ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by オスモティック・ソチエタ・ア・レスポンサビリタ・リミタータ filed Critical オスモティック・ソチエタ・ア・レスポンサビリタ・リミタータ
Priority claimed from PCT/EP2016/053726 external-priority patent/WO2016135119A1/en
Publication of JP2018511811A publication Critical patent/JP2018511811A/ja
Application granted granted Critical
Publication of JP6731957B2 publication Critical patent/JP6731957B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57442Specifically defined cancers of the uterus and endometrial
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57449Specifically defined cancers of ovaries
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2560/00Chemical aspects of mass spectrometric analysis of biological material
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/52Predicting or monitoring the response to treatment, e.g. for selection of therapy based on assay results in personalised medicine; Prognosis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/70Mechanisms involved in disease identification
    • G01N2800/7023(Hyper)proliferation
    • G01N2800/7028Cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16ZINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
    • G16Z99/00Subject matter not provided for in other main groups of this subclass

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Immunology (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Hematology (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Urology & Nephrology (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Microbiology (AREA)
  • Pathology (AREA)
  • Biotechnology (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Cell Biology (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Reproductive Health (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Description

本発明は、血液のメタボローム解析(metabolomic analysis)、および分類モデルによる代謝プロファイルのバイオインフォマティクス(bioinformatics)操作に基づく、子宮内膜癌(endometrial carcinoma)の診断方法に関する。
子宮内膜癌は雌性生殖管の最も一般的な浸潤癌であり、それは女性におけるすべての浸潤腫瘍(皮膚腫瘍を除く)の7%に関与している。
子宮内膜癌は40歳未満の女性には稀である。発症のピークは55〜65歳である。臨床病理研究および分子解析により、子宮内膜癌を2つの大きなカテゴリーであるタイプIおよびタイプIIに分類することが支持されている。
タイプIは最も頻度が高く、80%より高い症例パーセントをもち、それは子宮内膜増殖腺を冒すので、類子宮内膜癌(endometrioid carcinoma)という用語で定義される。一般に、それは子宮内膜過形成の枠内で発生し、これと同様に肥満症、糖尿病、高血圧症、不妊症および明白なエストロゲン刺激を伴う。最近の研究により、子宮内膜過形成は子宮内膜癌の前駆症状であるという論題を支持するさらなる証拠が提示された(Muller GL et al. Allelotype mapping of unstable microsatellites establishes direct lineage continuity between endometrial carcinoma precancers and cancers. Cancers Res 56:4483, 1996)。タイプIIの子宮内膜癌は一般にタイプIの子宮内膜癌より10歳後(65〜75歳)の女性が罹患し、タイプIと異なりそれはほとんどすべて子宮内膜萎縮の枠で発症する。
タイプIIは子宮内膜癌の症例の15%未満を占め、ほとんど分化していない(G3)。大部分の一般的サブタイプは漿液性のものであり、それは生物学的および形態学的に卵巣癌とオーバーラップしているためそのように定義される。より一般的でない組織学的サブタイプもこのカテゴリーに属する:明細胞癌(clear cell carcinoma)および悪性混合型のミューラー腫瘍(Muellerian tumour)。
今のところ、閉経期前後および閉経期後の年齢の無症状集団についての子宮内膜癌の早期診断のための集団検診は、それが子宮頚癌についてのパップテスト(パパニコロー検査)(Pap-test)により実施されているので適切ではない。
子宮頚膣部(exocervical)試料について実施された研究により、約40〜50%の偽陰性の頻度が証明された;膣環境の作用を受けた子宮内膜剥離細胞は変化を生じ、したがって腫瘍細胞を正常細胞から識別できる特徴を失うからである。さらに、予後は診断の早期性によって厳密に拘束され、事実、5年後の生存率はステージIにおける診断の場合の78〜98%からステージIVにおける診断の場合の3〜10%にまで急激に低下する。
現在までに、ヒト血清の数千の代謝産物が同定され、メタボロミクスの適用によって多数の疾患に対するバイオマーカーの開発が可能になった:たとえば、統合失調症(Kaddurah-Daouk R., Metabolic profiling of patients with schizophrenia, PLOS Med 2006; 8:e363)、髄膜炎(Subramanian A. et al., Proton MR/CSF analysis and a new software as predictors for the differentiation of meningitis in children, NMR Biomed 2005; 18:213-25)、および結腸癌(Denkert C., et al., Metabolite profiling of human colon carcinoma - deregulation of TCA cycle and amino acid turnover, Mol. Cancer 2008; 7:1-15)。それにもかかわらず、婦人科領域におけるメタボロミクスの利用は現在まで卵巣癌に関する研究に限定されている(Fan L. et al. Identification of metabolic biomarkers to diagnose epithelial ovarian cancer using a UPLC/QTOF/MS platform Acta Oncologica, 2012; 51:473-479)。現在まで、子宮内膜癌の診断のためにガスクロマトグラフィーを質量分析と組み合わせて計量化学的手法で実施された研究は文献に報告されていない。
Muller GL et al. Allelotype mapping of unstable microsatellites establishes direct lineage continuity between endometrial carcinoma precancers and cancers. Cancers Res 56:4483, 1996 Kaddurah-Daouk R., Metabolic profiling of patients with schizophrenia, PLOS Med 2006; 8:e363 Subramanian A. et al., Proton MR/CSF analysis and a new software as predictors for the differentiation of meningitis in children, NMR Biomed 2005; 18:213-25 Denkert C., et al., Metabolite profiling of human colon carcinoma - deregulation of TCA cycle and amino acid turnover, Mol. Cancer 2008; 7:1-15 Fan L. et al. Identification of metabolic biomarkers to diagnose epithelial ovarian cancer using a UPLC/QTOF/MS platform Acta Oncologica, 2012; 51:473-479
したがって、この悲惨な雌性新生物を早期診断するために、年齢または既知のリスク因子に対するリスクをもつ集団についてスクリーニングを実施できる非侵襲的診断方式が強く要望されている。
有利なことに、本発明は子宮内膜癌の診断のための非侵襲的方法により前記の問題を解決する。現在まで、この種の腫瘍のそのような組織学的判別が可能な他の非侵襲的診断法はない。
本発明の目的を以下に詳細に説明する。
図1は、子宮内膜癌を伴う患者および健常対照のメタボロームプロファイルのデータに基づく解析OPLS−DAの結果を示す。スコアプロットは2クラスをオーバーラッピングなしに識別する。三角は子宮内膜癌に罹患している患者を表わし、これに対し小円は健常患者を表わす。軸上にレポートされた主成分PC1およびPC2は、それぞれ16.5%および14.9%の系列内変動(global variance)を示す。 図2は、本発明に従って、PLS−DAモデルで得られた組織学的分類(タイプIの癌−対−タイプIIの癌)を示す。スポットはタイプIの子宮内膜癌を伴う女性のメタボロームプロファイルを表わし、これに対し三角はタイプIIの子宮内膜癌を伴う患者のものを表わす。これらのサンプルのうち1つだけがこのモデルにより必ずしも一義的に(univocally)適性領域に配属できない領域にある。
定義
用語“メタボロミクス”で、生物の小分子のメタボロームプロファイル試験による細胞プロセスの分析を意図する。
用語“メタボローム解析”で、本発明者らは、生体試料中の可能な最大数の代謝産物の同定および濃度決定を目的としたプロセスを実施することを表わすものとする。
用語“代謝産物”で、同化または異化タイプの細胞または細胞セットの生物学的プロセスに由来する小分子を表わすものとする。
用語“代謝産物”で、本発明者らは、生体試料内に同定および測定される可能性のある1000ダルトン未満の分子量をもつすべての分子を表わすものとする。
用語“メタボロームプロファイル”で、患者の血液中の代謝産物がそれらの相対的割合に応じてもつ特定のパターンを意図する。
PLS−DA(Partial Least Squares Discriminant Analysis)(部分的最小二乗判別分析)は、多変量回帰の手法を用いて、オリジナル変数(X)の直線的組合わせにより確定クラス(determinate class)(Y)への該当性(pertinence)を予測できる情報を抽出する管理された方法である。クラスの識別における有効性を評価するために、並べ替え検定(permutation test)を実施する。それぞれの並べ替えにおいて、データ(X)および交換した(commuted)クラスラベル(Y)から、そのモデルについてオリジナルクラスの割り当てに基づく交差検証(cross validation)により確定した最適数の成分を用いてPLS−DAモデルを構築する。2タイプの統計学的検定を実施して、クラス間の識別力を判定する。第1のものはそのモデルのトレーニングフェーズ(training phase)における予測正確度(prediction accuracy)に基づく。第2のものは、クラス内およびクラス間の二次的距離(quadratic distance)の和の比(B/W−比)に従った分離距離(separation distance)に基づく。
OPLS−DA(Orthogonal Partial Least Squares - Discriminant Analysis)(直交部分的最小二乗−判別分析)は、PLS−DA検定の重要な発展であり、データ行列におけるクラスの変動を直交方向に管理するために提唱された。
OPLS−DAはモデルPLS−DAの分類性能を高める。分類性能は、“k−分割交差検証(k-fold cross validation)”に基づいて、データ行列をk個のランダムサブセットに分割することにより推定される。それぞれの計算サイクルについて、サブセットFのうちの1個をテストセットとして取り分けておき、残りのk−1個のサブセットをトレーナーとして用いる。K個のサブセットのそれぞれをテストセットとして1回用いると、K個の精度値(precision value)が得られる。分類の正確度(accuracy)は、k個のサブセットにおける正確率(accuracy rate)の平均として計算される。検証するために、このモデルに“1点排除交差検証(leave one out cross validation)”(LOOCV)方法による交差検証を施す。データ行列を、k個のサブセットに分割する前に平均および単位分散に基準化する(scale)。言い換えると、トレーニングデータの平均および標準偏差を用いてセンターを指定し、テストデータを基準化する。トレーニングした時点で、そのモデルを用いて、そのデータが“過剰適応(overfitting)”を作りだしたかどうかをチェックする。これを行なうために、クラスラベルが分かっている検証セットを作成し、こうしてそれがトレーニングデータのものに匹敵する正確率を与えるかどうかをチェックする。他の方法はプロット検証(plot validation)R/Qであり、それは、現在のモデルが見せかけ(spurious)である、すなわちそのモデルは設定されたサブセットだけにはフィットするけれども新たな観察についても全く同様にYを予測するものではないというリスクを査定する補助となる。Rの数値は、このモデルにより説明できるトレーニングセットの変動率(percentage variation)である。
の数値は、交差検証したRの尺度である。この検証は、行列をそのままにした状態で観察順序(order of observation)Yをランダムに並べ替えたデータに基づいて、オリジナルモデルの適合度(goodness of fit)を異なるモデルの適合度と比較する。モデルの検証の基準は下記のとおりである:
1.並べ替えたデータセット上のすべてのQ値は、現在のデータセットについて推定したQ値より低くなければならない。これが確認されなければ、そのモデルは過剰適応であることを意味する;
2.回帰直線(実際の点QをQ並べ替え値のクラスターの重心(centroid)に連結する線)は負の数値のy軸切片(intercept)をもつ。
サポートベクターマシン(Support Vector Machine)(SVM)は、分類用途には比較的新しい教師あり機械学習法(machine learning supervised technique)である。SVMは1982年にVapnikによって初めて提唱された(Vapnik, V. Estimation of Dependences Based on Empirical Data; Springer Verlag: New York, 1982)。本質的に二項分類器(binary classifier)であるSVMの基本原理は下記のとおりである:2つのクラスをもつセットデータがあれば、超平面(hyperplane)の形の線形分類器が構築され、それは、経験的分類エラーの最小化と同時に幾何学的マージンの最大化において、最大マージンをもつ。直線的に分離されないデータセットの場合、オリジナルデータをより高い次元の特徴空間(feature space)内へマッピングし、この新たな空間(これは“カーネル(kernel)”として知られる)に線形分類器(linear classifier)を構築する。
トレーニングデータのセット
を考慮すると、SVMは超平面を決定し、そのパラメーターは下記の凸最適化問題(convex optimization problem):
に下記の条件
を施したものの解により得られる(w,b)によって与えられる;上記において、cは正規化パラメーター(regularization parameter)、すなわち学習正確度と予測という項の折衷であり、εは分類エラー数の尺度である。正規化という項の採用により、過剰適応の問題は低減する。
決定木
決定木(decision tree)はデータの帰納的分割(recursive partitioning)に基づいて分類モデルを構築する。一般に、決定木のアルゴリズムは全データセットで開始し、それらのデータを1以上の属性(attribute)の数値に基づいて2以上のサブグループに分割し、次いで各サブセットを各サブセットのサイズが適切レベルに達するまで、より小さなグループに反復分割する。このモデリングプロセス全体を木構造で表わすことができ、作成したモデルをルール“if−then(もし・・ならば・・する)”のセットとしてまとめることができる。決定木は解釈が容易であり、計算負荷が低く(computationally undemanding)、ノイズの多いデータに対処できる。大部分の決定木は、たとえば本発明の目的のような分類問題に取り組む。これに関連して、この手法は分類木(classification tree)とも呼ばれる。木構造による表現において、節(knot)はデータの1セットを表わし、データの全セットは根にある節として表わされる。
発明の詳細な記載
本発明は、血液のメタボローム解析、ならびに得られた結果をPLS−DAおよびOPLS−DAからなるグループにおいて選択した判別分析モデルまたはSVMおよび決定木からなるグループにおいて選択した機械学習モデルを用いる多変量解析によりインテグレーションすることに基づいて、子宮内膜癌を診断するための方法に関する。
本発明の目的は、血液のメタボローム解析に基づく子宮内膜癌の診断方法であり、この方法は下記のフェーズを含む:
(I)下記を含むトレーニングフェーズ:
−子宮内膜癌を伴う患者および健常対照に由来する血液試料のGCMSまたはGC×GCMS分析;
−少なくとも分類モデルをトレーニングするための、少なくとも判別分析モデルまたは機械学習モデルを用いる多変量解析による、得られた結果のインテグレーション;
(II)未知血液試料のGCMSまたはGC×GCMS分析、およびトレーニングフェーズ(I)で形成した分類モデルに基づくクラスへのそれの割り当てを含む、割り当てフェーズ。
収集したクロマトグラムについて、
−少なくとも、PLS−DAおよびOPLS−DAからなる群から選択した判別分析モデル、または
−SVMおよび決定木からなる群から選択した機械学習モデル
を用いて実施する多変量解析は、有利なことに未知試料の満足すべき二分類(dichotomous classification)(“健常患者”対“子宮内膜癌に罹患している患者”)を可能にした。多変量PLS−DA解析で得られた分類モデルは、癌の組織学的識別(タイプIの癌−対−タイプIIの癌)すら可能にした。現在まで、この種の腫瘍のそのような組織学的識別を可能にする他の非侵襲的診断方法はない。
そのようなトレーニングフェーズ(I)において、子宮内膜癌に罹患している患者ならびに類似の身体的(BMI、年齢、共存疾患)および社会的(教育レベル、社会経済状態)特徴を備えた健常な女性に由来する試料を分析し、この方法で分類モデルをトレーニングする。このトレーニングフェーズは、これら2グループの血液に存在する代謝プロファイルの特徴を作成し、境界を定めることを目的とする。分類モデルの良好な予測性を得るためには、同定した代謝プロファイルの変数の少なくとも80%に等しい数の、子宮内膜癌を伴う患者および健常対照に由来する血液試料に、多変量解析を施し、そのような試料が少なくとも2つの異なるクラスに属する必要がある。
そのような割り当てフェーズ(II)において、未知試料にGCMS分析を施し、得られたクロマトグラムを、先にトレーニングしたモデルに従って最も可能性の高い適切なクラスを推定して分類する。
本発明の子宮内膜癌診断方法は、それぞれの代謝産物の濃度の測定に基づくのではなく、代謝産物の全クラスターをバイオマーカー(代謝プロファイル)とみなし、2グループに異なる割合で存在するため、それらを2つの異なる適切なクラスに入れることができる。
好ましくは、トレーニングフェーズ(I)はさらに下記のサブフェーズを含む:
−子宮内膜癌を伴う患者および健常対照に由来する血液試料からの代謝産物の抽出および誘導体化;
−各試料についてクロマトグラムを得るための、抽出および誘導体化した代謝産物のGCMSまたはGC×GCMS分析;各クロマトグラムは代謝プロファイルである;
−子宮内膜癌を伴う患者および健常対照の代謝プロファイルのデータ行列作成;
−データアレイ多変量解析の結果としての少なくとも分類モデルの構造化;その際、少なくとも判別分析モデルまたは機械学習モデルを用いてその多変量解析を実施して、少なくとも分類モデルをトレーニングする。
種々の分類モデルを本発明に従って使用できる;好ましくは、その分類モデルはPLS−DA、OPLS−DA、SVMおよび決定木からなる群から選択される。
好ましくは、割り当てフェーズ(II)はさらに下記のサブフェーズを含む:
−少なくとも未知血液試料からの代謝産物の抽出および誘導体化;
−未知血液試料について少なくともクロマトグラムを得るための、抽出および誘導体化した代謝産物のGCMSまたはGC×GCMS分析;
−未知血液試料のクロマトグラムからの代謝プロファイル作成;
−フェーズ(I)でトレーニングした分類モデルに基づくクラスへのその代謝プロファイルの割り当て。
好ましくは、本発明の方法は、“健常患者”または“子宮内膜癌に罹患している患者”の二分類のためにトレーニングした分類モデルを想定する。よりいっそう好ましくは、その分類モデルは“タイプI”または“タイプII”癌の組織学的分類のためにもトレーニングされる。
好ましくは、抽出はアルコール類および非プロトン極性溶媒の水性混合物、好ましくはCHOH/HO/CHCl、よりいっそう好ましくは体積比2〜3/0.5〜0.5/0.5〜1のものからなる抽出混合物を用いて実施される。
好ましい態様において、抽出および誘導体化のサブフェーズは下記を含む:
i)抽出混合物の添加から得られた試料の撹拌;
ii)i)で得られた試料の遠心分離;
iii)ピリジン中の塩酸メトキシアミンで処理することによる、ii)から得られた上清の誘導体化;
iv)下記のものからなる群から選択されるシラン処理剤(シリル化剤)(silanization agent)による、iii)で得られた試料の上清のシラン処理:N,O−ビス(トリメチルシリル)トリフルオロアセトアミド(BSTFA)、N−メチル−N−(トリメチルシリル)トリフルオロアセトアミド(MSTFA)、ヘキサメチルジシラザン(HMDS)、1−(トリメチルシリル)イミダゾール(TMSI)、N−tert−ブチルジメチルシリル−N−メチルトリフルオロアセトアミド(MTBSTFA)、1−(tert−ブチルジメチルシリル)イミダゾール(TBDMSIM);場合によりトリメチルクロロシラン(TMCS)の存在下で。
好ましくは、代謝産物の抽出は試料に既知アリコートの基準化合物を添加した後に実施される;好ましくは、その基準化合物はリビトール(ribitol)である。
本発明の目的に有用な代謝産物を分離するために、一次元ガスクロマトグラフィーおよび二次元ガスクロマトグラフィーの両方で作業することができる;二次元ガスクロマトグラフィーは、その手法のより良好な分解能がより良好な分類正確度を提供するので好ましい。いずれにしろ、実施例に示すように、より一般的な一次元ガスクロマトグラフィーで作業することもできる。
好ましくはスキャンモードで得られたガスクロマトグラムを、クロマトグラムトレースのバックグラウンドノイズより10倍より大きい面積をもつすべてのピークを同定するようにインテグレーションする。
基準化合物(好ましくはリビトール)のピークを、定量分析および保持時間センタリングの両方のための基準として用いて、各ピークを1つの信号m/zの数量化(quantization)および少なくとも2つの信号m/zの定性に基づいて同定する。インテグレーションの後、正規化面積パーセント法で定量を実施する。この数量化から得られた結果(正規化面積パーセント)を行列に変換し、その際、各試料が行(line)を表わし、列(column)は基準化合物の保持時間と比較したガスクロマトグラフィー保持時間により一義的に同定された種々の代謝産物により表わされる。行列の第1列を用いて適切なクラスを決定する。最も容易な例では、“健常患者”および“子宮内膜癌に罹患している患者”の2クラスのみを想定することができ、以後、本発明の作業のエビデンスをこの二分類に基づいてレポートする。
前記に開示した方法であってさらに下記のフェーズを含むものも本発明の目的である:
−クロマトグラムのインテグレーション;その際、そのインテグレーションによりクロマトグラムトレースのバックグラウンドノイズの10倍より大きい面積を有するすべてのピークの同定が得られる;定量分析および保持時間センタリングの両方のために基準化合物のピークを使用;
その際、各ピークを下記に基づいて同定する:
−1つの信号m/zの数量化;
−少なくとも2つの信号m/zの定性;
−正規化面積パーセント法による定量;
−定量から得られたデータの、行列への変換;その際、各試料が行を表わし、列はクロマトグラフィー保持時間により一義的に同定された種々の代謝産物により表わされる。
正規化および補正したクロマトグラム(リビトールのピーク面積を基準としたもの)について、SIMPCA−P 13.0(Umetrics)、RapidMiner 5.3(Rapid−I)およびR(Foundation for Statistical Computing,Vienna)を用いて、データ(PLS−DAおよびOPLS−DA)および自動化学習(automatic learning)(SVMおよび決定木)の多変量統計解析を実施する。数値を平均上にセンタリングし、分散を正規化する。
代謝プロファイルについて、モデルOPLS−DAは予測成分(predictive component)および3つの直交成分(orthogonal component)を用いて満足すべきモデリング能および予測性を示した(Rcum=0.995,Q cum=0.985)。図1は、OPLS−DAモデルで得られたクラス間分離を示す。
さらに、モデルPLS−DAによる癌の組織所見に基づく分類を構築した。図2に示すように、1試料のみがクラスの規定空間の不確定領域に位置した。
本発明は限定ではない下記の実施例を考慮してより良く理解できる。
ある程度の子宮内膜癌の診断を伴う患者から子宮摘出介入の前に採取した血液試料ならびに類似の身体的および社会経済的特徴をもつけれども健常な子宮を備えた対照女性から採取した血液試料について実施したメタボローム解析から出発して、本発明の目的である診断法を開発した。子宮摘出後に、外植臓器の分析により得られた病理解剖学的エビデンスに基づいてアイソタイプおよび新生物ステージについての情報を収集した。
試料の採集
自発的に血液試料を提供した子宮内膜癌を伴う88人の女性および80人の健常な女性から試料を採取した。試験はMagna Grecia of Catanzaro大学の倫理委員会により承認され、患者および健常ボランティアは試験の目的についてのインフォームドコンセントに署名した。子宮摘出介入の直前にバイアルBD Vacutainer(登録商標)を用いて血液試料を採取し、血清を分析時まで−80℃で凍結しておいた。子宮内膜病巣の生検による子宮外診検査(hysterectoscopic test)後の子宮内膜癌の診断の疑いを、子宮摘出介入後の子宮の病理解剖学的検査により確認した。子宮内膜癌の徴候をもたず、類似の身体的および社会経済的特徴(体重、身長、BMI、年齢、身分、教育レベルなど)を備えた女性から血液を採取して、対照グループを同様に手配した。
症例および対照の人口および臨床特徴を表1にレポートし、一方、表2には検査した腫瘍の病理解剖学的特徴を挙げる。
代謝産物の抽出および誘導体化
50マイクロリットルの血清を2mLのエッペンドルフ型バイアルに移し、リビトール1g/Lの溶液20μL、ならびに2.5部のメタノール、1部の水および1部のクロロホルム(CHOH:HO:CHCl,2.5:1:1)からなる混合物200μLを添加した。
この溶液をボルテックスで30秒間混合した。
試料を次いで16000rpmで10分間、4℃で遠心分離した。200μLアリコートの上清を採集し、新たな2mLエッペンドルフ型バイアルに移し、200μLのHOを添加し、ボルテックスで30秒間混合し、16000rpmで5分間、4℃で再び遠心分離した。
350μLアリコートの上清を再び採集し、1.5のガラスアンプルに移し、凍結乾燥した。
凍結乾燥試料を50μLの塩酸メトキシアミン20mg/mL(ピリジン中)で処理した。この反応を37℃で撹拌(350rpm)下に90分間実施した。最後に、1%のトリメチルクロロシランを含む50μLのジ N,O−ビス(トリメチルシリル)トリフルオロアセトアミド(BSTFA)を各アンプルに添加し、シラン処理反応を37℃で60分間、撹拌下に(350rpm)実施した。
MDGCMS解析
二次元ガスクロマトグラフィーのために、タイプSLB−5ms 30.0m×0,25mm ID,フィルム[シルフェニレン(silphenylene)ポリマー,実際にはポリ(5%ジフェニル/95%メチルシロキサン)に等しい極性をもつ]厚さ1μmの一次カラム(第1オーブンに配置)(J&W Agilent)を用い、それを7ドア付きインターフェース(SGE)の位置1に接続した。
BPX−50 5,0m×0,50mm ID,フィルムの厚さ0.25μmをインターフェースの位置7に接続した。BPX−50 1.5m×0.25mm ID,0.25μmを位置6にセットし、320℃に設定した水素炎イオン化型検出器(flame ionisation detector)(FID)に接続し、一方、5.0mの分析カラム(FIDに接続したものと化学的に同一)をシステムqMSに接続した。
FIDに接続したカラムは、二次元フラックスを低減するために、かつほとんど代表的でない化合物がクロマトグラフィーの無作為変動によるものではないことをチェックするために用いられた。
インターフェースSGEのドア3と4を接続するために、40μL(20cm×0.71mm OD×0.51mm ID,ステンレススチール製)外側キャピラリー管を用いた。
2つのオーブンについて等しい温度プログラムは下記のとおりであった:80℃で1分間、次いで320℃まで3℃/分で加熱し、4分間保持。
ヘリウム(一定の直線速度)の出発圧を129.6kPaに設定した。同様に一定の直線速度条件で作動するAPC(advanced control of pressure)(圧力の高度制御)のヘリウムの補助出発圧を90.4kPaに設定した。
注入体積1μL、スプリット比1:5。モジュレーション期間を4.1秒(蓄積期間4.0秒,注入期間0.1秒)に設定した。四重極質量分析計の条件は下記のとおりであった:イオン化モード:電子衝撃(70eV)、質量範囲:40〜600m/z、スキャン速度:10.000amu/秒。
GCMS分析
一次元ガスクロマトグラフィーのために、タイプCP−Sil 8 CB GCカラム、30m、0.25mm、1,00μmのカラム(Agilent J&W)を用いた。
GCの温度プログラムは、100℃の出発温度を1分間、次いで320℃まで4℃/分の加熱、および4分の保持時間、全作動時間60分を想定した。
ヘリウム(一定の線速度39cm/秒)の出発圧を83.7kPaに設定した。注入体積2μL、スプリット比1:5。四重極質量分析計の条件は下記のとおりであった:イオン化モード:電子衝撃(70eV)、質量範囲:35〜600m/z、スキャン速度:3.333amu/秒、溶媒カット時間4.5分間。
行列データの作成
TICクロマトグラムにおいては通常は250より多い信号が検出され、これらのピークのうちあるものは、他の試料中に対応するものがなかったため、濃度が低すぎたので、または代謝産物として確認するにはスペクトル性に乏しかったので、それ以上は調べなかった。
合計198の内因性代謝産物、たとえばアミノ酸、有機酸、炭水化物、脂肪酸およびステロイドを検出した。ピークの同定のために、最大許容量としては作表したコバッツ指数(Kovats index)と実験指数10との差を設定し、一方でライブラリーにおける検索のための最小適合性を85%に設定して、線状保持指標(linear retention index)(LRI)を用いた。2つのライブラリーを用いた:NIST11、および500を超える代謝産物を分析試料と同じ条件で誘導体化することにより特別に開発したライブラリー。リビトールの信号を基準にしてピークの面積を正規化および補正した。結果をコンマで区切った行列ファイル(CSV)にまとめ、統計処理に適したソフトウェアにロードした。
スキャンモードで得られたガスクロマトグラムを、ガスクロマトグラムトレースのバックグラウンドノイズの10倍より大きい面積をもつすべてのピークを同定するようにインテグレーションした。各ピークを信号m/zの数量化および少なくとも2つの信号m/zの定性に基づいて同定した。インテグレーションの後、正規化面積パーセント法による定量を実施し、リビトールピークを定量分析および保持時間センタリングの両方のための基準として用いた。
この数量化(正規化面積パーセント)から得られた結果を行列に変換し、その際、各試料が行を表わし、列はガスクロマトグラフィー保持時間により一義的に同定された種々の代謝産物により表わされた。行列の第1列を用いて試料の適切なクラスを規定する。最も簡単な例では、2つのクラス“健常患者”および“子宮内膜癌に罹患している患者”のみを想定することができ、以後、本発明の作業のエビデンスをこの二分類に基づいてレポートする。新生物の組織タイプおよびグレーディングを予測するために試験した種々の分類モデルの可能性についてもさらなるエビデンスが得られた。
統計解析
正規化および補正したクロマトグラム(リビトールのピーク面積を基準にしたもの)について、SIMPCA−P 13.0(Umetrics)、RapidMiner 5.3(Rapid−I)およびR(Foundation for Statistial Computing, Vienna)を用いてデータ(PLS−DAおよびOPLS−DA)および自動化学習(SVMおよび決定木)の多変量統計解析を実施した。
数値を平均上にセンタリングし、分散を正規化した。
結果
代謝プロファイルについて、モデルOPLS−DAは予測成分および3つの直交成分を用いて満足すべきモデリング能および予測性を示した(Rcum=0.995,Q cum=0.985)。他の分類モデルは良好な(OPLS−DAより低いけれども)分類能を示した。未知試料の適切なクラスの最終割り当てのために種々の方法が可能である。単一モデルの回答を使用でき、あるいは種々のモデルの回答をより複雑な決定アルゴリズムでインテグレーションすることができる。
表3は調査したモデルを評価するために用いた診断性能の査定の幾つかの指標をレポートする。感度はTP/(TP+FN)として計算され、その際、TPは真の陽性、すなわち提唱したモデルによって子宮内膜癌に罹患していると正しく診断された試料の数を表わし、FNは偽陰性、すなわち誤って陰性と同定された試料の数である。特異度はTN/(TN+FP)として計算され、その際、TNは真の陰性、すなわち健常であると正しく診断された試料の数を表わし、FPは偽陽性、すなわち誤って健常と診断された者の数を表わす。陽性尤度比(ratio of positive likelihood)(PLR)は感度/(1−特異度)として計算され、一方、陰性尤度比(NLR)は(1−感度)/特異度として計算された。予測値(的中率)(predictive value)(NPV)はTN/(TN+FN)として計算され、一方、陽性予測値(VPP)はTP/(TP+FP)として計算された。正確度はすべての正しい割り当てのパーセントを表わし、(TP+TN)/(TP+FP+TN+FN)として計算され、一方、繰り返し精度(併行精度)(repeatability)はある試料の10回反復分析における正しい再割り当ての数として計算された。
クラスの分離にはるかに大きく関与した代謝産物を同定するために、各成分についてimportant variables in the projection(射影における変数重要度)(VIP)のスコアを計算した。VIPスコアは、いずれかの次元のy−分散の量を考慮したplsの負荷の重み付き平方和(weighted sum of the squares of loading)を表わす。2つのピークは、モデルPLS−DAおよびOPLS−DAの両方(子宮内膜癌−対−対照の分類、およびタイプI対タイプIIの分類の両方)において2より大きいVIPスコアを示す。これらは決定木においても重要な節と同定され、これらの所見は分類プロセスにおけるこれらの変数の重要性が大きいことを示唆する(データをリポートしていない)。第1代謝産物(VIPスコア=2,3;スペクトル計測類似率=91%;δLRI=11)はグルタミンアミノ酸に起因する信号であるという結果になり、一方、第2代謝産物(VIPスコア=2,1;スペクトル計測類似率=89% δLRI=16)はグルコノ δ−ラクトンに起因する信号であるという結果になった。

Claims (11)

  1. 血液のメタボローム解析に基づく方法であって、下記のフェーズを含む方法:
    (I)下記を含むトレーニングフェーズ:
    −子宮内膜癌を伴う患者および健常対照に由来する血液試料のGCMSまたはGC×GCMS分析;
    −少なくとも分類モデルをトレーニングするための、少なくとも判別分析モデルまたは機械学習モデルを用いる多変量解析による、得られた結果のインテグレーション;
    (II)未知血液試料のGCMSまたはGC×GCMS分析、およびトレーニングフェーズ(I)で形成した分類モデルに基づく適切なクラスへのそれの割り当てを含む、割り当てフェーズ。
  2. −PLS−DAおよびOPLS−DAからなる群から少なくとも判別分析モデルを選択する、または
    −SVMおよび決定木からなる群から機械学習モデルを選択する、
    請求項1に記載の方法。
  3. トレーニングフェーズ(I)が下記のサブフェーズを含む、請求項1または2に記載の方法:
    −癌を伴う患者および健常対照に由来する血液試料からの代謝産物の抽出および誘導体化;
    −各試料についてクロマトグラムを得るための、抽出および誘導体化した代謝産物のGCMSまたはGC×GCMS分析;
    −子宮内膜癌を伴う患者および健常対照の代謝プロファイルのデータ行列作成;
    −データアレイ多変量解析の結果としての少なくとも分類モデルの構造化;その際、少なくとも判別分析モデルまたは機械学習モデルを用いてその多変量解析を実施して、少なくとも分類モデルをトレーニングする。
  4. フェーズ(II)がさらに下記のサブフェーズを含む、請求項1から3のうちいずれかに記載の方法:
    −少なくとも未知血液試料からの代謝産物の抽出および誘導体化;
    −未知血液試料について少なくともクロマトグラムを得るための、抽出および誘導体化した代謝産物のGCMSまたはGC×GCMS分析;
    −未知血液試料のクロマトグラムからの代謝プロファイル作成;
    −フェーズ(I)でトレーニングした分類モデルに基づくクラスへのその代謝プロファイルの割り当て。
  5. 子宮内膜癌を伴う患者および健常対照に由来する血液試料の数が、同定した代謝プロファイルの変数の数の少なくとも80%に等しい、請求項1から4のうちいずれかに記載の方法。
  6. 分類モデルを二分類“健常”または“子宮内膜癌に罹患している患者”についてトレーニングする、請求項1から5のうちいずれかに記載の方法。
  7. 分類モデルをさらに“タイプI”または“タイプII”癌の組織学的分類についてトレーニングする、請求項1から6のうちいずれかに記載の方法。
  8. 抽出および誘導体化が下記を含む、請求項に記載の方法:
    i)抽出混合物の添加から得られた試料の撹拌;
    ii)i)で得られた試料の遠心分離;
    iii)ピリジン中の塩酸メトキシアミンで処理することによる、ii)で得られた上清の誘導体化;
    iv)下記のものからなる群から選択されるシラン処理剤による、iii)で得られた試料の上清シラン処理:N,O−ビス(トリメチルシリル)トリフルオロアセトアミド(BSTFA)、N−メチル−N−(トリメチルシリル)トリフルオロアセトアミド(MSTFA)、ヘキサメチルジシラザン(HMDS)、1−(トリメチルシリル)イミダゾール(TMSI)、N−tert−ブチルジメチルシリル−N−メチルトリフルオロアセトアミド(MTBSTFA)、1−(tert−ブチルジメチルシリル)イミダゾール(TBDMSIM);
    その際、抽出混合物はアルコール類および非プロトン極性溶媒の水性混合物からなる。
  9. 代謝産物の抽出を、アリコートの基準化合物の添加により実施する、請求項に記載の方法。
  10. 前記基準化合物はリビトールである、請求項9に記載の方法。
  11. さらに下記のフェーズを含む、請求項1から10のうちいずれかに記載の方法:
    −請求項1から10のうちいずれかに記載の方法により得られたクロマトグラムのインテグレーション;その際、そのインテグレーションによりクロマトグラムトレースのバックグラウンドノイズの10倍より大きい面積を有するすべてのピークが同定される;定量分析および保持時間センタリングの両方のために基準化合物のピークを使用;
    その際、各ピークを下記に基づいて同定する:
    −1つの信号m/zの数量化;
    −少なくとも2つの信号m/zの定性;
    −正規化面積パーセント法による定量;
    −定量から得られたデータの、行列への変換;その際、各試料が行を表わし、列はクロマトグラフィー保持時間により一義的に同定された種々の代謝産物により表わされる。
JP2017563386A 2015-02-27 2016-02-23 子宮内膜癌の診断方法 Active JP6731957B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
ITUB20157151 2015-02-27
IT102015000007151 2015-02-27
PCT/EP2016/053726 WO2016135119A1 (en) 2015-02-27 2016-02-23 Method for the diagnosis of endometrial carcinoma

Publications (2)

Publication Number Publication Date
JP2018511811A JP2018511811A (ja) 2018-04-26
JP6731957B2 true JP6731957B2 (ja) 2020-07-29

Family

ID=60450378

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017563386A Active JP6731957B2 (ja) 2015-02-27 2016-02-23 子宮内膜癌の診断方法

Country Status (4)

Country Link
US (1) US20180038867A1 (ja)
EP (1) EP3262416B1 (ja)
JP (1) JP6731957B2 (ja)
ES (1) ES2711814T3 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10531825B2 (en) * 2016-10-14 2020-01-14 Stoecker & Associates, LLC Thresholding methods for lesion segmentation in dermoscopy images
WO2022031859A2 (en) * 2020-08-05 2022-02-10 Cornell University Methylmalonic acid and metabolism thereof is a cancer biomarker and target
CN118043658A (zh) * 2021-09-07 2024-05-14 株式会社岛津制作所 质谱分析方法及icp质谱分析装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007057309A (ja) * 2005-08-23 2007-03-08 Yoshikimi Kikuchi 子宮体癌の検出方法
JP2007271370A (ja) * 2006-03-30 2007-10-18 Japan Health Science Foundation 子宮癌検出用マーカー
AU2011232434B2 (en) * 2010-03-23 2013-11-21 Purdue Research Foundation Early detection of recurrent breast cancer using metabolite profiling
JP2011247869A (ja) * 2010-04-27 2011-12-08 Kobe Univ メタボローム解析手法を用いた特定疾患の検査方法
KR101467482B1 (ko) * 2012-12-26 2014-12-01 라정찬 호흡가스를 이용한 암의 진단방법

Also Published As

Publication number Publication date
EP3262416B1 (en) 2018-12-26
EP3262416A1 (en) 2018-01-03
JP2018511811A (ja) 2018-04-26
ES2711814T3 (es) 2019-05-07
US20180038867A1 (en) 2018-02-08

Similar Documents

Publication Publication Date Title
CA3030255C (en) Methods and systems for determining autism spectrum disorder risk
US20240133865A1 (en) Methods and Systems for Determining Autism Spectrum Disorder Risk
EP3775906B1 (en) Metabolite-based breast cancer detection and diagnosis
JP6731957B2 (ja) 子宮内膜癌の診断方法
CN113156018A (zh) 一种肝胆疾病诊断模型的建立方法及诊断***
CN113484518B (zh) 一种区分肺部疾病的诊断生物标志物
CN115440375A (zh) 一种结直肠癌预测***及其应用
CN115436633A (zh) 一种结直肠癌检测的生物标志物及其应用
CN114047263A (zh) 代谢标志物在制备用于诊断ais的检测试剂或检测物的用途及试剂盒
WO2022133738A1 (zh) 一种术前鉴别甲状腺良恶性结节的生物标志物、试剂盒及其应用
CN116519952B (zh) 颈动脉体瘤术前筛查及诊断的标志物及其应用
JP2017516118A (ja) 胎児奇形の早期検出のための非侵襲的診断法
WO2016135119A1 (en) Method for the diagnosis of endometrial carcinoma
CN116500280B (zh) 一组诊断颈动脉体瘤的标志物及其应用
CN112255333B (zh) 卵巢肿瘤尿液代谢标志物及其应用
CN112255334B (zh) 用于区分交界性和恶性卵巢肿瘤的小分子标志物及其应用
D’Andréa et al. Pilot Study on the Use of Untargeted Metabolomic Fingerprinting of Liquid-Cytology Fluids as a Diagnostic Tool of Malignancy for Thyroid Nodules. Metabolites 2023, 13, 782
WO2024107923A1 (en) Methods for the detection and treatment of lung cancer
TZ et al. c) Agent. LoNooNI, Alessandra. A s Partners sL, via

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190218

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200210

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200511

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200608

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200707

R150 Certificate of patent or registration of utility model

Ref document number: 6731957

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250