JP6245387B2 - 3次元スペクトルデータ処理装置及び処理方法 - Google Patents

3次元スペクトルデータ処理装置及び処理方法 Download PDF

Info

Publication number
JP6245387B2
JP6245387B2 JP2016571511A JP2016571511A JP6245387B2 JP 6245387 B2 JP6245387 B2 JP 6245387B2 JP 2016571511 A JP2016571511 A JP 2016571511A JP 2016571511 A JP2016571511 A JP 2016571511A JP 6245387 B2 JP6245387 B2 JP 6245387B2
Authority
JP
Japan
Prior art keywords
spectrum
dimensional
difference
similarity
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016571511A
Other languages
English (en)
Other versions
JPWO2016120958A1 (ja
Inventor
有里子 中木村
有里子 中木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shimadzu Corp
Original Assignee
Shimadzu Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shimadzu Corp filed Critical Shimadzu Corp
Publication of JPWO2016120958A1 publication Critical patent/JPWO2016120958A1/ja
Application granted granted Critical
Publication of JP6245387B2 publication Critical patent/JP6245387B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8675Evaluation, i.e. decoding of the signal into analytical information
    • G01N30/8682Group type analysis, e.g. of components having structural properties in common
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/0027Methods for using particle spectrometers
    • H01J49/0036Step by step routines describing the handling of the data generated during a measurement
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers
    • G01N30/7206Mass spectrometers interfaced to gas chromatograph
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers
    • G01N30/7233Mass spectrometers interfaced to liquid or supercritical fluid chromatograph

Landscapes

  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Description

本発明は、マススペクトルや吸光スペクトルなど、所定のパラメータと信号強度値との関係を示すスペクトルが、時間や空間位置など別のパラメータの変化に従って得られる3次元スペクトルデータを処理する3次元スペクトルデータ処理装置及び処理方法に関し、さらに詳しくは、例えばそれぞれ異なるサンプルから得られた複数の3次元スペクトルデータの類似性や相違性に基づく解析を行うための3次元スペクトルデータ処理装置及び処理方法に関する。本発明は例えば、液体クロマトグラフ質量分析装置(LC−MS)、ガスクロマトグラフ質量分析装置(GC−MS)、フォトダイオードアレイ(PDA)検出器等のマルチチャンネル型検出器を用いた液体クロマトグラフ、波長走査可能な紫外可視分光光度計や赤外分光光度計を検出器として用いた液体クロマトグラフやガスクロマトグラフ、さらにはイメージング質量分析装置などで得られた3次元スペクトルデータを処理するのに好適である。
液体クロマトグラフ質量分析装置(LC−MS)では、検出器である質量分析装置において所定の質量電荷比m/z範囲のスキャン測定を繰り返すことで、質量電荷比と信号強度との関係を示すマススペクトルを時々刻々と得ることができる。また、PDA検出器を検出器として用いた液体クロマトグラフでは、波数や波長などと信号強度(吸光度)との関係を示す吸光スペクトルを時々刻々と得ることができる。本明細書では、こうした時間等のパラメータの変化に従って得られる複数のマススペクトルや吸収スペクトル等のスペクトルを構成するデータを、3次元スペクトルデータという。
図9(a)はLC−MSにより得られる3次元スペクトルデータの模式図である。この場合の3次元スペクトルデータとは、マススペクトルの単位軸である質量電荷比m/z、マススペクトルの信号強度(イオン強度)、及び時間(保持時間RT)という三つのディメンジョンを有するデータである。
ところで、生化学分野や食品、環境などの様々な分野において、多成分を含む複雑なサンプルから特徴的な成分を探索したり該成分の含有量を調べたりするために、プロファイリング(多変量解析)による差異解析が利用されている(非特許文献1参照)。各サンプルからそれぞれ得られた3次元スペクトルデータを用いた差異解析では、一般に、まず、3次元スペクトルデータからピーク高さやピーク面積等の特徴を抽出し特徴データを作成する。そして、サンプル毎に作成した特徴データをテーブル形式に整理した2次元特徴データテーブルに対して主成分分析などの多変量解析を行い、その結果から複数のサンプルの類似性等を把握する。
複数のサンプルの3次元スペクトルデータから2次元特徴データテーブルを作成する従来の一方法について説明する。図9(a)に示したような3次元スペクトルデータに基づいて、例えば保持時間RT=0.00におけるマススペクトルを抽出すると図9(b)に示すようなマススペクトルが得られる。こうしたマススペクトルに対し所定の条件に従ってピーク検出を行い、検出された各ピークの高さ(強度値)又はピーク面積(強度の積分値)を求める。そして、マススペクトルに現れる各ピークの質量電荷比及びピーク高さ(又は面積)をピーク情報として収集する。
測定開始時点から測定終了時点までの保持時間全体に亘って得られた全てのマススペクトルに対して同様の処理を行うことで、全てのマススペクトルに現れる全てのピークについてのピーク情報が得られる。そして、このピーク情報に基づき、図10に示すように、サンプル毎に、各ピークの質量電荷比及び保持時間に対するピーク高さ(又は面積)を示した2次元特徴データテーブルを作成する。なお、このテーブルでは、或るサンプルにおいて或る質量電荷比及び或る保持時間にピークが存在しない(検出されない)場合には、その質量電荷比及び保持時間に対応するピーク高さをゼロにしておけばよい。
また、LCやGC(特にLC)では、たとえカラムでの成分分離条件を同一にしても、測定環境の相違や装置の系統誤差などの要因により、同一成分の保持時間が若干相違する、つまりは保持時間ずれが起こることがある。そのため、上記のような手順で2次元特徴データテーブルを作成するに先立って、保持時間方向のアライメント処理(保持時間を合わせる処理)を行う必要がある場合がある(特許文献1参照)。
このようにして作成した2次元特徴データテーブルを用いて主成分分析などの多変量解析を行い、その結果に基づいて例えば多数のサンプルを複数のグループに分け、さらにはその差異を特徴付ける成分の特定などを行う。
特開2014−202582号公報
「マルチプロファイリング(多変量解析)〜プロファイリングと混合系定量を可能とする多変量解析〜」、株式会社島津製作所、[平成26年12月18日検索]、インターネット<URL: http://www.an.shimadzu.co.jp/apl/chemometrics/>
上述したように、従来の差異解析では、2次元特徴データテーブルを作成するべく3次元スペクトルデータから特徴データを求める際に、スペクトルに対してピーク検出を行いピーク情報を抽出する必要がある。そのため、次のような問題がある。
(1)スペクトル波形におけるピーク検出のアルゴリズムには様々なものが知られており、同じスペクトル波形でもそのアルゴリズムの種類によって検出されるピークが異なる。そのため、ピーク検出のアルゴリズムの種類によって、得られる特徴データが変わることになり、それに基づいて作成される2次元特徴データテーブルに対する多変量解析の結果も異なることになる。
(2)どのようなアルゴリズムであっても、ピーク検出を行う際には例えば強度閾値などの検出条件を設定する必要があるが、設定する条件が適切でないと的確なピーク検出ができず、重要なピークを見落としたり逆に本来はピークでないものをピークとして誤検出したりするおそれがある。
(3)スペクトルに現れるピークの数が多すぎると2次元特徴データテーブルのデータ量が膨大になり、多変量解析により適切な結果が得られなくなることがある。
(4)LCやGCを用いたシステムにおいてスペクトル単位で正確なピーク検出を行うには、上述したように保持時間方向のアライメント処理が必要である。こうしたアライメント処理が不十分であると2次元特徴データテーブルが正確でなくなり、多変量解析により適切な結果が得られなくなる。これを回避するには、分析者自身が3次元スペクトルデータや2次元特徴データテーブルを確認し、手動で修正しなければならないことがある。
上記問題は主としてスペクトル単位でピーク検出を行うことに伴って生じる問題である。本発明はこうした課題を解決するために成されたものであり、その目的とするところは、スペクトル単位でのピーク検出を行うことなく複数の3次元スペクトルデータに基づく的確な多変量解析結果を得ることができる3次元スペクトルデータ処理装置及び処理方法を提供することにある。
上記課題を解決するためになされた本発明に係る3次元スペクトルデータ処理装置は、第1のパラメータと信号強度との関係を示すスペクトルが第2のパラメータの変化に伴って得られてなる複数のスペクトルを構成する3次元スペクトルデータを処理する装置であって、複数のサンプルからそれぞれ得られた3次元スペクトルデータの間の類似性又は相違性を解析するための3次元スペクトルデータ処理装置において、
a)複数のサンプルの中で特異的なサンプルから得られた一つの3次元スペクトルデータを構成する複数のスペクトルを、第2のパラメータの値によらない一つのスペクトルの集合とみなして多変量解析を行い、その結果に基づいてその特異的なサンプルを特徴付け得る1又は複数の特徴スペクトルを求める特徴スペクトル取得部と、
b)前記特徴スペクトル取得部で得られた前記特徴スペクトル毎に、複数のサンプルに対する3次元スペクトルデータそれぞれについて、一つのサンプルに対する3次元スペクトルデータから抽出される第2のパラメータの値毎のスペクトルのそれぞれと一つの特徴スペクトルとの類似度を計算し、その複数の類似度から該サンプルに対応する類似度の代表値を算出するスペクトル類似度算出部と、
c)前記特徴スペクトル毎に複数のサンプルに対応してそれぞれ得られた類似度の代表値に基づいて、特異的なサンプルと非特異的なサンプルとを区別し得る有意な差が認められるか否かを調べ、有意な差が認められる類似度が得られる特徴スペクトルを差異スペクトルとして決定する差異スペクトル決定部と、
を備えることを特徴としている。
また上記課題を解決するためになされた本発明に係る3次元スペクトルデータ処理方法は、第1のパラメータと信号強度との関係を示すスペクトルが第2のパラメータの変化に伴って得られてなる複数のスペクトルを構成する3次元スペクトルデータを処理する方法であって、複数のサンプルからそれぞれ得られた3次元スペクトルデータの間の類似性又は相違性を解析するための3次元スペクトルデータ処理方法において、
a)複数のサンプルの中で特異的なサンプルから得られた一つの3次元スペクトルデータを構成する複数のスペクトルを、第2のパラメータの値によらない一つのスペクトルの集合とみなして多変量解析を行い、その結果に基づいてその特異的なサンプルを特徴付け得る1又は複数の特徴スペクトルを求める特徴スペクトル取得ステップと、
b)前記特徴スペクトル取得ステップにおいて得られた前記特徴スペクトル毎に、複数のサンプルに対する3次元スペクトルデータそれぞれについて、一つのサンプルに対する3次元スペクトルデータから抽出される第2のパラメータの値毎のスペクトルのそれぞれと一つの特徴スペクトルとの類似度を計算し、その複数の類似度から該サンプルに対応する類似度の代表値を算出するスペクトル類似度算出ステップと、
c)前記特徴スペクトル毎に複数のサンプルに対応してそれぞれ得られた類似度の代表値に基づいて、特異的なサンプルと非特異的なサンプルとを区別し得る有意な差が認められるか否かを調べ、有意な差が認められる類似度が得られる特徴スペクトルを差異スペクトルとして決定する差異スペクトル決定ステップと、
を有することを特徴としている。
ここでいう「3次元スペクトルデータ」とは例えば、LC−MSやGC−MSにおいて時間経過に伴い得られる多数のマススペクトル(nが2以上であるMSnスペクトルを含む)を表すデータ、イメージング質量分析装置においてサンプル上の多数の異なる(つまりは空間位置が異なる)測定点から得られる多数のマススペクトルを表すデータ、PDA検出器や波長走査可能な紫外可視分光光度計を用いたLCにおいて時間経過に伴い得られる多数の吸光スペクトルを表すデータ、赤外分光光度計を検出器として用いたGCにおいて時間経過に伴い得られる多数の吸光スペクトルを表すデータ、などである。
本発明に係る3次元スペクトルデータ処理装置では、複数のサンプルの差異解析を行うために、その複数のサンプルをそれぞれ測定することで得られた3次元スペクトルデータが与えられる。ただし、その複数のサンプルの中の一つは例えば特異的な成分が含まれる特異的なサンプルであるとの付加情報が別途与えられる。即ち、これは教師ありの差異解析である。
特徴スペクトル取得部は、上記付加情報により特定される特異的なサンプル由来の一つの3次元スペクトルデータから作成される複数のスペクトルを第2のパラメータの値に依らない一つのスペクトル集合とみなし、これに対し所定の多変量解析を行う。例えば3次元スペクトルデータがLC−MSにより得られるデータである場合、スペクトルの集合を作成する段階で、各マススペクトルの第2のパラメータの値(LC−MSでは保持時間が相当)の情報は廃棄される。使用される多変量解析は典型的には主成分解析(PCA)であるが、これに限るものではなく、非負値行列因子分解(NMF=Non-negative Matrix Factorization)、多変量スペクトル分解(MCR=Multivariate Curve Resolution) などでもよい。スペクトルデータ集合に対し主成分分析を行った場合、導出される各主成分に対して第1のパラメータ値(例えば質量電荷比)毎に因子負荷量が求まる。したがって、第1のパラメータと因子負荷量との関係を特徴スペクトルとすることができ、主成分の数だけ特徴スペクトルが求まる。なお、この場合、主成分数は累積寄与率などに基づき自動的に定まるようにするか、或いは、分析者が適当な主成分数を決定して入力部からの入力操作によって設定できるようにすればよい。
通常、特徴スペクトルは複数求まるから、スペクトル類似度算出部は、特徴スペクトル毎に、複数のサンプルに対する3次元スペクトルデータそれぞれについて、一つのサンプルに対する3次元スペクトルデータから抽出される各測定時点のスペクトルのそれぞれと特徴スペクトルとの類似度を計算する。したがって、一つのサンプルにおいて、一つの特徴スペクトルに対する類似度がスペクトルの数だけ求まる。そこで、その複数の類似度から、一つのサンプルにおいて一つの特徴スペクトルに関連する類似度の代表値を計算する。代表値は、例えば複数の類似度の平均値、中央値、最頻値、合計値、又は最大値などのいずれかとすればよい。これにより、サンプル毎に、特徴スペクトルの数だけ類似度の代表値が求まる。
差異スペクトル決定部は、上述したように得られた類似度の代表値に基づいて、与えられた複数のサンプルに含まれる特異的なサンプルと非特異的なサンプルとを区別し得る有意な差が認められるか否かを調べる。有意差の有無の判断は例えば、統計学における様々な仮説検定の手法を用いて行うことができる。特異的なサンプル群の類似度の代表値の分布と非特異的なサンプル群の類似度の代表値の分布との間で有意な差が認められるような分布を示す特徴スペクトルは、その差に対応する成分に関連する情報を含んでいると推定される。そこで、差異スペクトル決定部は、有意な差が認められる類似度が得られる特徴スペクトルを、特異的なサンプルと非特異的なサンプルとの間の相違を反映した差異スペクトルとして決定する。
例えば差異スペクトルにおいて大きな強度を示すピークは、特異的なサンプルに含まれ非特異的なサンプルには含まれない特徴的な成分由来であると推定される。そこで、例えば分析者は表示画面上に表示された差異スペクトルから大きな強度のピークに対応した質量電荷比を求め、その質量電荷比から成分を推定する。もちろん、好ましくは、このような成分推定を自動的に行えるようにするとよい。
即ち、本発明に係る3次元スペクトルデータ処理装置は、好ましくは、
化合物に関する情報が収録されているデータベースと、
前記差異スペクトル決定部で決定された差異スペクトルから得られる情報を前記データベース内の情報と照合することで成分同定を行う成分同定部と、
をさらに備える構成とするとよい。
データベースとしては様々な化合物が収録された汎用の化合物データベースを利用することができる。また、サンプルの種類が限定された特定の目的の解析を行う場合には、その目的に応じた化合物を収録したデータベースを用いるとよい。上記構成によれば、例えば特異的なサンプルを特徴付ける成分が未知であっても、そうした成分を差異解析によって自動的に特定することができる。
また本発明に係る3次元スペクトルデータ処理装置では、前記差異スペクトル決定部で決定された差異スペクトル、及び、該差異スペクトルに対する全てのサンプルにおける類似度の代表値の分布状況、を表示する表示部をさらに備える構成としてもよい。
この構成によれば、分析者は特異的なサンプルを特徴付ける成分に対応すると推定される差異スペクトルを視認することができるだけでなく、類似度の代表値の分布状況から、その差異スペクトルの信頼度も判断することができる。
本発明に係る3次元スペクトルデータ処理装置及び処理方法によれば、従来のように3次元スペクトルデータに対するピーク検出を行って特徴データを求めることなく、特定の成分を含む特異的なサンプル群と該成分を含まないサンプル群との二つに対する差異解析を的確に行い、その成分に対応するスペクトルを探索することができる。このため、ピーク検出のアルゴリズムの種類の相違やピーク検出条件の設定の不適切さなどに起因する差異解析の誤差を回避することができ、差異解析で得られるスペクトルを用いた成分の推定の精度も向上する。
また、本発明に係る3次元スペクトルデータ処理装置及び処理方法では、特徴スペクトルを求める際に保持時間等の第2のパラメータは考慮されないので、複数のサンプルに対する特徴データを含む2次元特徴データテーブルを求める際に通常必要となる複数のサンプル間で保持時間を揃えるアライメント処理も不要であり、そうした処理に要する手間と時間を省くことができる。その結果、差異解析全体のスループットを向上させることができる。
本発明に係る3次元スペクトルデータ処理装置を備えたLC−MSシステムの一実施例の概略構成図。 差異解析の概念図。 本実施例のLC−MSシステムにおける特徴スペクトル取得処理の手順を示すフローチャート。 本実施例のLC−MSシステムにおけるスペクトル類似度算出処理の手順を示すフローチャート。 スペクトル類似度算出処理により求まる類似度代表値テーブルを示す図。 本実施例のLC−MSシステムにおける差異スペクトル決定処理の手順を示すフローチャート。 特徴スペクトル取得処理及びスペクトル類似度算出処理の説明図。 全サンプルの類似度の分布の表示例を示す図。 (a)はLC−MSにより得られる3次元マススペクトルデータの模式図、(b)は一つのマススペクトルを示す図。 3次元マススペクトルデータに基づいて作成される2次元特徴データテーブルの一例を示す図。
本発明に係る3次元スペクトルデータ処理装置を備えたLC−MSシステムの一実施例について、添付図面を参照して説明する。
本実施例のLC−MSシステムにおいて、図示しないものの、LC部1は、移動相を一定流量で送給する送液ポンプ、送給される移動相中に試料を注入するインジェクタ、試料中の成分を時間方向に分離するカラム、などを含む。また、MS部2は例えば、エレクトロスプレーイオン源を備えた飛行時間型質量分析装置であり、LC部1において時間方向に分離された成分を含む試料が順次MS部2に導入され、MS部2では導入される試料に含まれる成分由来のイオンが検出される。
MS部2で得られた検出信号はデータ処理部3に入力される。データ処理部3は後述する特徴的な処理を行うために、機能ブロックとして、データ収集処理部31、データ記憶部32、主成分分析処理部33、特徴スペクトル取得部34、スペクトル類似度算出部35、差異スペクトル決定部36、成分同定部37、スペクトルライブラリ38、を含む。また、このデータ処理部3には、分析者が各種入力操作を行うための入力部4と、処理結果などを表示するための表示部5と、が接続されている。なお、データ処理部3の機能の大部分は、パーソナルコンピュータにインストールされた専用のデータ処理ソフトウエアを該コンピュータ上で動作させることで具現化することができる。
本実施例のLC−MSシステムでは、LC部1及びMS部2を含む測定部でサンプルに対する測定を行うことにより、サンプルをLC部1に導入した時点から時間が経過するに伴って検出信号が得られる。データ収集処理部31は入力された検出信号をデジタルデータに変換しデータ記憶部32に格納する。一つのサンプルに対する測定によって、例えば図7(a)(図9(a)と同じ)に示したような3次元マススペクトルデータが得られる。多変量解析による網羅的解析を行う場合には、解析対象である多数のサンプルに対する測定がそれぞれ行われ、各サンプルに対応する3次元マススペクトルデータがデータ記憶部32に格納される。
上記のように複数のサンプルに対応する3次元マススペクトルデータがそれぞれデータ記憶部32に格納されている状態で実行される、本実施例のLC−MSシステムにおける特徴的なデータ処理について説明する。
図2はここで想定している差異解析の概念図である。
測定される多数のサンプルには、特異的成分を含むことが分かっているサンプルa1、a2、…と、特異的成分を含まないことが分かっているサンプルb1、b2、…とがある。これらサンプルは、図示するように、特異的サンプル群と非特異的サンプル群とに分けられ、各サンプルはそのいずれかの群に属するものとしてラベル付けされているものとする。ただし、特異的成分が何であるのかは不明である。ここでは、特異的サンプル群と非特異的サンプル群という二つの群に含まれるサンプルの間の差異解析を行い、その差異を特徴付ける成分、つまりは上記特異的成分を同定することを解析の目的としている。
図3は特徴スペクトル取得処理の手順を示すフローチャート、図4はスペクトル類似度算出処理の手順を示すフローチャート、図6は差異スペクトル決定処理の手順を示すフローチャートである。また、図7は特徴スペクトル取得処理及びスペクトル類似度算出処理の説明図、図5はスペクトル類似度算出処理により求まる類似度代表値テーブルを示す図である。
例えば分析者が入力部4から差異解析の実行を指示すると、データ処理部3では、図3に示す手順で特徴スペクトル取得処理が行われる。
即ち、主成分分析処理部33は、特異的サンプル群のラベルが付されたサンプルのうちの一つに対応する3次元マススペクトルデータをデータ記憶部32から読み出し、このデータに対する主成分分析を行う(ステップS11)。ここで選択される一つのサンプルは、最も特異的であると推定されるサンプルであることが望ましい。そこで、いずれの特異的サンプルを選択するかを分析者が入力部4から指定できるようにしておくとよい。図7(a)に示すように、データ記憶部32から得られる3次元マススペクトルデータには保持時間RTの情報が含まれるが、ステップS11において主成分分析を行う際には、3次元マススペクトルデータを保持時間に関係のない、単なるマススペクトルデータの集合であるとみなす(図7(b)参照)。この時点で、3次元マススペクトルデータから保持時間の情報は破棄される。
主成分分析処理部33は予め主成分の数を決めておかず、主成分分析によって求まる累積寄与率に基づいて主成分数PCを定める(ステップS12)。主成分分析によって、第1主成分〜第PC主成分までの各主成分に対する因子負荷量(主成分ローディング)が、質量電荷比毎に計算される。特徴スペクトル取得部34は、主成分毎に、この因子負荷量を質量電荷比軸上に並べたスペクトル(図7(c)参照)を作成し、これを特異的サンプルの特徴スペクトルL1〜LPCとして定める(ステップS13)。主成分分析を実施することによって特異的サンプルにおける3次元マススペクトルデータの特徴を統計量に基づいて抽出することができ、PC個の特徴スペクトルの少なくともいずれか一つに特異的成分の情報が反映される筈である。この時点では、いずれの主成分に対する因子負荷量が特異的成分の情報を含むのかは不明であるため、ステップS13で得られるのは、特異的サンプルと非特異的サンプルとの差異を特徴付ける可能性のあるスペクトルである。
なお、本実施例では、3次元マススペクトルデータから求めたマススペクトルの集合に対し多変量解析の一手法である主成分分析を適用しているが、ここで利用可能な手法は主成分分析に限らない。例えば、非負値行列因子分解(NMF)、多変量スペクトル分解(MCR) などでもよい。主成分分析では因子負荷量が負値になる場合があるため注意を要するが、多変量スペクトル分解などでは因子負荷量が必ず正値になるため、特徴スペクトルを作成するのに却って都合がよい。
データ処理部3では、続いて、図4に示す手順でスペクトル類似度算出処理が行われる。即ち、スペクトル類似度算出部35は、主成分を指定する変数pcを1に設定し(ステップS21)、類似度算出の基準となる特徴スペクトルLpcを設定する(ステップS22)。次に、サンプルを指定する変数nを1に設定し(ステップS23)、n番目のサンプルから得られた3次元マススペクトルデータを解析対象のデータとして設定する(ステップS24)。ここで、全てのサンプルa1、a2、…、b1、b2、…には予め連続番号を付しておくものとする。
次いで、保持時間を指定する変数tを0に設定し(ステップS25)、n番目のサンプル由来の3次元マススペクトルデータにおいて保持時間tにおけるマススペクトルStを抽出し、このマススペクトルStと特徴スペクトルLpcとの類似度Corrtを計算する(ステップS26)。この類似度Corrtは例えば、質量電荷比毎の信号強度値の差異に基づいて計算するものとすることができる。また、測定条件が同じであってもサンプルが異なると検出感度が相違することがあるから、類似度を計算する前に、例えば特定の質量電荷比における信号強度値や強度が最大である信号強度値を揃えるように、一方又は両方のスペクトルにおける信号強度を規格化するようにしてもよい。
二つのスペクトル間の類似度Corrtが得られたならば、変数tが測定終了時間Tに達したか否かを判定する(ステップS27)。そして変数tが測定終了時間Tに達していなければ、変数tにデータ測定時間間隔Δtを加算したものを新たな変数tとし(ステップS28)ステップS26へと戻る。したがって、ステップS26、S27、S28の繰り返しによって、指定されたn番目のサンプルに対し、変数tが0から測定終了時間Tまでの、つまりは測定開始時点から測定終了時点までの全測定期間に得られた全てのマススペクトルについて特徴スペクトルLpcとの間の類似度Corrtが計算されることになり、測定点数と同数の類似度Corrtが得られる(図7(d)参照)。
ステップS27でYesと判定されると、スペクトル類似度算出部35は、そのn番目のサンプルについて得られた、測定点数と同数の全ての類似度Corrtに基づいて、類似度の代表値Vnを計算して保存する(ステップS29)。この代表値Vnは全ての類似度の平均値、中央値、最頻値、合計値又は最大値などである。例えばn=1、pc=1であるときには、図5に示したテーブル中の実線で囲んだ枠100内の一つの代表値が求まる。
続いて、サンプルを指定する変数nが全サンプル数Nに達したか否かを判定し(ステップS30)、達していなければ変数nをインクリメントして(ステップS31)ステップS24へと戻る。したがって、ステップS24〜S31の繰り返しによって、N個の全てのサンプルそれぞれについて、各サンプルから得られた3次元マススペクトルデータに基づくマススペクトルと一つの特徴スペクトルLpcとの間の類似度の代表値Vnが求まることになる。例えばpc=1であるときには、図5に示したテーブル中の一点鎖線で囲んだ枠101内のN個の類似度代表値が求まる。
ステップS30でYesと判定されると、次いで、主成分を指定する変数pcが主成分数PCに達したか否かを判定し(ステップS32)、達していなければ変数pcをインクリメントして(ステップS33)ステップS22へと戻る。したがって、ステップS22〜S33の繰り返しによって、PC個の全ての特徴スペクトルLpcそれぞれについて、N個のサンプルのそれぞれに対応する類似度代表値が求まることになる。即ち、図5に示したテーブル中の二点鎖線で囲んだ枠102内の(N×PC)個の、つまりはサンプルと特徴スペクトルとの全ての組み合わせに対する類似度代表値が求まることになり、図5に示した類似度代表値テーブルが完成する。なお、このように類似度代表値テーブルを埋める各類似度代表値を求めるために、図4に示した手順とは異なる手順を用いることができることは明らかである。
データ処理部3ではさらに、図6に示す手順で差異スペクトル決定処理が行われる。即ち、差異スペクトル決定部36は、まず主成分を指定する変数pcを1に設定する(ステップS41)。そして、上述した類似度代表値テーブル中の類似度代表値を用いて、特異的サンプル群と非特異的サンプル群との二つのサンプル群の間で、特徴スペクトルLpcに対する類似度代表値の分布に有意差があるか否かの検定を実施する(ステップS42)。
この有意差の有無の判断には、従来から知られている様々な統計学上の仮説検定を用いることができる。
上記検定によって二つのサンプル群に対応する類似度代表値の分布に有意差があると判定された場合(ステップS43でYes)には、そのときの特徴スペクトルLpcを二つのサンプル群に対する差異スペクトルとして決定する(ステップS44)。一方、ステップS43で類似度代表値の分布に有意差がないと判定された場合には、ステップS44の処理をパスする。そして、主成分を指定する変数pcが主成分数PCに達したか否かを判定し(ステップS45)、達していなければ変数pcをインクリメントして(ステップS46)ステップS42へと戻る。したがって、ステップS42〜S46の繰り返しによって、PC個の全ての特徴スペクトルLpcそれぞれについて、類似度代表値の分布に有意差があるか否が判定され、有意差があるとされた1又は複数の特徴スペクトルが差異スペクトルとして決定される。上述したように、この差異スペクトルは特異的サンプルに含まれ非特異的サンプルには含まれない特異的成分を特徴付けている情報を含むスペクトルであると考えられる。
そこで、成分同定部37はスペクトルライブラリ38が利用可能であるか否かを判定し(ステップS47)、利用可能であれば、1又は複数の差異スペクトルをスペクトルライブラリ38中の情報と照合することで特異的成分を同定する(ステップS48)。このとき、マススペクトルのパターン(つまりはマススペクトル中の複数のピークの質量電荷比)を照合してもよいが、差異スペクトルから強度の大きな特定のピークに対応する質量電荷比を求め、スペクトルライブラリ38中に収録されている化合物の質量と照合するだけでもよい。なお、こうしたスペクトルライブラリ38としては、例えば米国国立バイオインフォマティクスセンターが運用するPubchemなどの汎用の化合物データベースを用いてもよいし、或いは、装置メーカーから提供された若しくはユーザー自身が作成した特定の化合物のみを収録したライブラリを用いてもよい。
そして、成分が同定できればその同定結果を差異スペクトルとともに表示部5の画面上に表示する。また、成分同定できなければその旨を表示する。さらには、何らかの理由でスペクトルライブラリ38が利用できなければ、差異スペクトルのみを表示する(ステップS49)。このようにして、本実施例のLC−MSシステムによれば、二つのサンプル群に対する差異解析によって求まる差異スペクトルや、該差異スペクトルから導出される特異的成分に関する情報を分析者に提供することができる。
また、差異スペクトルだけでなく、全てのサンプルの類似度の分布を示すグラフを作成して表示すると、ステップS44で決定された差異スペクトルが複数のサンプル群を識別するのに適切か否かを分析者が直感的に且つ容易に確認することができる。
図8は第1〜第3主成分の特徴スペクトルに対する全サンプルの類似度の分布を示すグラフの一例である。この例では、ステップS42の検定によって、第3主成分の特徴スペクトルのみが差異スペクトルとして決定された。この第3主成分における類似度の分布を見ると、非特異的サンプルと特異的サンプルとが明確に分離されており、決定された差異スペクトルが適切であることを分析者も確認することができる。
なお、上記実施例は本発明の一例であり、本発明の趣旨の範囲で適宜変形、追加、修正を加えても本願特許請求の範囲に包含されることは明らかである。
例えば、上記実施例は本発明をLC−MSで得られたデータに適用したものであるが、GC−MS、PDA検出器や波長走査可能な紫外可視分光光度計を用いたLC、赤外分光光度計を検出器として用いたGCなどにおいて、時間経過に伴って順次得られるスペクトルを構成するデータに適用できることは明らかである。また、イメージング質量分析装置において、空間位置が相違する多数の測定点からそれぞれ得られるデータを処理する際に本発明を用いることもできる。
1…LC部
2…MS部
3…データ処理部
31…データ収集処理部
32…データ記憶部
33…主成分分析処理部
34…特徴スペクトル取得部
35…スペクトル類似度算出部
36…差異スペクトル決定部
37…成分同定部
38…スペクトルライブラリ
4…入力部
5…表示部

Claims (6)

  1. 第1のパラメータと信号強度との関係を示すスペクトルが第2のパラメータの変化に伴って得られてなる複数のスペクトルを構成する3次元スペクトルデータを処理する装置であって、複数のサンプルからそれぞれ得られた3次元スペクトルデータの間の類似性又は相違性を解析するための3次元スペクトルデータ処理装置において、
    a)複数のサンプルの中で特異的なサンプルから得られた一つの3次元スペクトルデータを構成する複数のスペクトルを、第2のパラメータの値によらない一つのスペクトルの集合とみなして多変量解析を行い、その結果に基づいてその特異的なサンプルを特徴付け得る1又は複数の特徴スペクトルを求める特徴スペクトル取得部と、
    b)前記特徴スペクトル取得部で得られた前記特徴スペクトル毎に、複数のサンプルに対する3次元スペクトルデータそれぞれについて、一つのサンプルに対する3次元スペクトルデータから抽出される第2のパラメータの値毎のスペクトルのそれぞれと一つの特徴スペクトルとの類似度を計算し、その複数の類似度から該サンプルに対応する類似度の代表値を算出するスペクトル類似度算出部と、
    c)前記特徴スペクトル毎に複数のサンプルに対応してそれぞれ得られた類似度の代表値に基づいて、特異的なサンプルと非特異的なサンプルとを区別し得る有意な差が認められるか否かを調べ、有意な差が認められる類似度が得られる特徴スペクトルを差異スペクトルとして決定する差異スペクトル決定部と、
    を備えることを特徴とする3次元スペクトルデータ処理装置。
  2. 請求項1に記載の3次元スペクトルデータ処理装置であって、
    化合物に関する情報が収録されているデータベースと、
    前記差異スペクトル決定部で決定された差異スペクトルから得られる情報を前記データベース内の情報と照合することで成分同定を行う成分同定部と、
    をさらに備えることを特徴とする3次元スペクトルデータ処理装置。
  3. 請求項1又は2に記載の3次元スペクトルデータ処理装置であって、
    前記差異スペクトル決定部で決定された差異スペクトル、及び、該差異スペクトルに対する全てのサンプルにおける類似度の代表値の分布状況、を表示する表示部をさらに備えることを特徴とする3次元スペクトルデータ処理装置。
  4. 第1のパラメータと信号強度との関係を示すスペクトルが第2のパラメータの変化に伴って得られてなる複数のスペクトルを構成する3次元スペクトルデータを処理する方法であって、複数のサンプルからそれぞれ得られた3次元スペクトルデータの間の類似性又は相違性を解析するための3次元スペクトルデータ処理方法において、
    a)複数のサンプルの中で特異的なサンプルから得られた一つの3次元スペクトルデータを構成する複数のスペクトルを、第2のパラメータの値によらない一つのスペクトルの集合とみなして多変量解析を行い、その結果に基づいてその特異的なサンプルを特徴付け得る1又は複数の特徴スペクトルを求める特徴スペクトル取得ステップと、
    b)前記特徴スペクトル取得ステップにおいて得られた前記特徴スペクトル毎に、複数のサンプルに対する3次元スペクトルデータそれぞれについて、一つのサンプルに対する3次元スペクトルデータから抽出される第2のパラメータの値毎のスペクトルのそれぞれと一つの特徴スペクトルとの類似度を計算し、その複数の類似度から該サンプルに対応する類似度の代表値を算出するスペクトル類似度算出ステップと、
    c)前記特徴スペクトル毎に複数のサンプルに対応してそれぞれ得られた類似度の代表値に基づいて、特異的なサンプルと非特異的なサンプルとを区別し得る有意な差が認められるか否かを調べ、有意な差が認められる類似度が得られる特徴スペクトルを差異スペクトルとして決定する差異スペクトル決定ステップと、
    を有することを特徴とする3次元スペクトルデータ処理方法。
  5. 請求項4に記載の3次元スペクトルデータ処理方法であって、
    前記差異スペクトル決定ステップにおいて決定された差異スペクトルから得られる情報を、化合物に関する情報が収録されているデータベース内の情報と照合することで成分同定を行う成分同定ステップ、をさらに備えることを特徴とする3次元スペクトルデータ処理方法。
  6. 請求項4又は5に記載の3次元スペクトルデータ処理方法であって、
    前記差異スペクトル決定ステップにおいて決定された差異スペクトル、及び、該差異スペクトルに対する全てのサンプルにおける類似度の代表値の分布状況、を表示部により表示する表示処理ステップ、をさらに有することを特徴とする3次元スペクトルデータ処理方法。
JP2016571511A 2015-01-26 2015-01-26 3次元スペクトルデータ処理装置及び処理方法 Active JP6245387B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2015/051966 WO2016120958A1 (ja) 2015-01-26 2015-01-26 3次元スペクトルデータ処理装置及び処理方法

Publications (2)

Publication Number Publication Date
JPWO2016120958A1 JPWO2016120958A1 (ja) 2017-07-06
JP6245387B2 true JP6245387B2 (ja) 2017-12-13

Family

ID=56542618

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016571511A Active JP6245387B2 (ja) 2015-01-26 2015-01-26 3次元スペクトルデータ処理装置及び処理方法

Country Status (3)

Country Link
US (1) US10598639B2 (ja)
JP (1) JP6245387B2 (ja)
WO (1) WO2016120958A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018158801A1 (ja) * 2017-02-28 2018-09-07 株式会社島津製作所 スペクトルデータの特徴抽出装置および方法
EP3756003A4 (en) * 2018-02-19 2022-03-16 Cerno Bioscience Llc RELIABLE AND AUTOMATIC MASS SPECTRAL ANALYSIS
WO2021049011A1 (ja) * 2019-09-13 2021-03-18 株式会社島津製作所 分析装置
EP4361624A1 (en) * 2021-06-24 2024-05-01 National Institute for Materials Science Method for estimating content ratio of components contained in sample, composition estimating device, and program
CN114018861B (zh) * 2021-10-28 2023-07-07 四川启睿克科技有限公司 一种基于特征峰的光谱重构方法
CN116559108B (zh) * 2023-05-19 2024-01-12 中国科学院地理科学与资源研究所 一种低浓度石油烃污染土壤近红外光谱诊断指标提取方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7653496B2 (en) * 2006-02-02 2010-01-26 Agilent Technologies, Inc. Feature selection in mass spectral data
JP4856436B2 (ja) * 2006-02-08 2012-01-18 日本分光株式会社 マッピングデータ表示方法、プログラム、および装置
JP4983451B2 (ja) * 2007-07-18 2012-07-25 株式会社島津製作所 クロマトグラフ質量分析データ処理装置
JP6088177B2 (ja) * 2011-09-02 2017-03-01 株式会社 資生堂 解析装置、解析方法、プログラム
JP6020314B2 (ja) 2013-04-04 2016-11-02 株式会社島津製作所 クロマトグラフ質量分析データ処理装置

Also Published As

Publication number Publication date
WO2016120958A1 (ja) 2016-08-04
JPWO2016120958A1 (ja) 2017-07-06
US20170356889A1 (en) 2017-12-14
US10598639B2 (en) 2020-03-24

Similar Documents

Publication Publication Date Title
JP6245387B2 (ja) 3次元スペクトルデータ処理装置及び処理方法
JP6620894B2 (ja) クロマトグラフ質量分析用データ解析装置
US11423331B2 (en) Analytical data analysis method and analytical data analyzer
JP5327388B2 (ja) 分析データ処理方法及び装置
CN109073615B (zh) 数据处理装置
WO2015059753A1 (ja) 包括的2次元クロマトグラフ用データ処理装置
JP6132073B2 (ja) 包括的2次元クロマトグラフ用データ処理装置
JPWO2014108992A1 (ja) クロマトグラフ質量分析用データ処理装置
GB2561879A (en) Spectroscopic analysis
JPWO2014087770A1 (ja) クロマトグラフ用データ処理装置及びデータ処理方法
JP5315025B2 (ja) スペクトル解析および表示
US20200011769A1 (en) Indentification of chemicals in a sample using gc/saw and raman spectroscopy
JP7108136B2 (ja) 分析装置
WO2018158801A1 (ja) スペクトルデータの特徴抽出装置および方法
JP7334788B2 (ja) 波形解析方法及び波形解析装置
US9739756B2 (en) Data processing system and method for chromatograph
JP6244492B1 (ja) スペクトルの判定装置および判定方法
CN109477776B (zh) 使用gc/saw和拉曼光谱学来鉴别样本中的化学物质
JP2007078640A (ja) Icp発光分光分析方法及びicp発光分光分析装置
JP6628181B2 (ja) 質量分析を用いた試料解析方法及び試料解析システム
AD A system suitability testing platform for untargeted, high-resolution mass spectrometry
JP2010151651A (ja) 液体クロマトグラフ装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170321

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171017

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171030

R151 Written notification of patent or utility model registration

Ref document number: 6245387

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151