WO2014128912A1

WO2014128912A1 - データ処理装置及びデータ処理方法

Info

Publication number: WO2014128912A1
Application number: PCT/JP2013/054465
Authority: WO
Inventors: 山田　洋平
Original assignee: 株式会社島津製作所
Priority date: 2013-02-22
Filing date: 2013-02-22
Publication date: 2014-08-28
Also published as: US10535507B2; EP2960647A4; JPWO2014128912A1; CN105008908B; EP2960647B1; JP6004080B2; CN105008908A; EP2960647A1; US20150380225A1

Abstract

　多数の既知化合物のＭＳ^ｎマススペクトルを予め記憶するデータベース記憶領域３２ｃと、未知化合物のＭＳ^ｎマススペクトルを取得する取得部３１ａと、未知化合物のＭＳ^ｎマススペクトルと、多数の既知化合物のＭＳ^ｎマススペクトルとの類似性を示すスコアをそれぞれ求めるスコア算出部３１ｄとを備えるデータ処理装置１であって、イオン強度の大きさにより数段階の強度スコアに分類する強度スコア算出部３１ｂと、各ピークについて質量電荷比の誤差を示す位置スコアを求める位置スコア算出部３１ｃとを備え、スコア算出部３１ｄは、各ピークについて、既知化合物のＭＳ^ｎマススペクトル中のピークの強度スコアと、未知化合物のＭＳ^ｎマススペクトル中のピークの強度スコアと、位置スコアとを積算し、全ピークの積算値の総和をスコアとして算出することを特徴とする。

Description

データ処理装置及びデータ処理方法

　本発明は、質量分析装置によって得られた未知化合物のＭＳ^ｎマススペクトルと、多数の既知化合物のＭＳ^ｎマススペクトルとの類似性を示すスコアをそれぞれ求め、そのスコアに基づいて未知化合物を同定するデータ処理方法及びそれを用いたデータ処理装置に関する。

　イオントラップ型質量分析装置等を用いた質量分析においては、ＭＳ／ＭＳ分析（ＭＳ^２分析）という手法が知られている。一般的なＭＳ^２分析では、まず分析対象の未知化合物から目的とする特定の質量電荷比（ｍ／ｚ）を有するイオンをプリカーサイオン（親イオン）として選別し、その選別したプリカーサイオンをＣＩＤ（Collision Induced Dissociation：衝突誘起分解）によって開裂させ、開裂イオンを生成する。開裂様式は化学構造に依存するため、開裂によって生成したフラグメントイオンを質量分析することにより、未知化合物のＭＳ^２マススペクトル（化学構造の情報）を取得することができる。

　近年、医薬品や農薬やタンパク質等の未知化合物を同定する場合には、未知化合物の分子量が大きくなり、化学構造も複雑になっている。そのため、未知化合物の種類によっては、一段階の開裂操作だけでは充分に小さな質量までイオンが開裂しない場合がある。そうした場合には、開裂操作を複数回繰り返し、生成したフラグメントイオンを質量分析するＭＳ^ｎ分析が行われている。

　このようなＭＳ^ｎ分析により得られたＭＳ^ｎマススペクトルから未知化合物の化学構造を推定する解析処理として、データベースを用いたパターンマッチング処理が行われている（例えば、特許文献１や非特許文献１参照）。データベースには、多数の化合物名及び化学構造（既知化合物）と、その既知化合物のＭＳ^ｎマススペクトルが含まれている。そして、パターンマッチング処理では、既知化合物のＭＳ^ｎマススペクトルと、未知化合物のＭＳ^ｎマススペクトルとを比較することにより、未知化合物のＭＳ^ｎマススペクトルと、多数の既知化合物のＭＳ^ｎマススペクトルとの類似性を示すスコアを、重み付き内積やピークの出現確率等を用いてそれぞれ求めている。その結果、スコアが高い順番に既知化合物を配列することで、測定者は未知化合物を同定している。

特開２００５－２０１８３５号公報

Stephen E. Stein, and Donald R. Scott "Optimization and Testing of Mas Spectral Library Search Algorithms for Compound Identification" 1994, American Society for Mass Spectrometry, 859-866.

　ところで、同一の化合物をＭＳ^ｎ分析した場合でも、得られたＭＳ^ｎマススペクトルが異なることがある。すなわち、ＭＳ^ｎマススペクトルでは、ピークのイオン強度Ｉやピークの位置（ｍ／ｚ）やピークの有無等が変化しやすい。そのため、上述したようなパターンマッチング処理では、イオン強度Ｉが大きく変化したり、ピークの位置がずれたり、あるべきピークが現れなかったりすることがあり、スコアが低下し、その結果、未知化合物のＭＳ^ｎマススペクトルと、多数の既知化合物のＭＳ^ｎマススペクトルとの類似性を正しく評価していないことがあった。

　本件発明者は、上記課題を解決するために、未知化合物のＭＳ^ｎマススペクトルと、多数の既知化合物のＭＳ^ｎマススペクトルとの類似性を正しく評価する検索方法について検討を行った。上述したようなパターンマッチング処理では、ＭＳ^ｎマススペクトル中のピークのイオン強度Ｉやピークの位置（ｍ／ｚ）やピークの有無等が変化しやすいことが考慮されておらず、スコアが低下することがわかった。そこで、未知化合物のＭＳ^ｎマススペクトルと、多数の既知化合物のＭＳ^ｎマススペクトルとの類似性を評価する際に、ＭＳ^ｎマススペクトル中のピークのイオン強度Ｉやピークの位置（ｍ／ｚ）やピークの有無等が変化することを考慮した検索方法を見出した。

　すなわち、本発明のデータ処理装置は、多数の既知化合物のＭＳ^ｎマススペクトルを予め記憶するデータベース記憶領域と、未知化合物のＭＳ^ｎマススペクトルを取得する取得部と、未知化合物のＭＳ^ｎマススペクトルと、多数の既知化合物のＭＳ^ｎマススペクトルとの類似性を示すスコアをそれぞれ求めるスコア算出部とを備えるデータ処理装置であって、未知化合物のＭＳ^ｎマススペクトル中の各ピーク及び既知化合物のＭＳ^ｎマススペクトル中の各ピークを、イオン強度の大きさによって数段階の強度スコアにそれぞれ分類する強度スコア算出部と、未知化合物のＭＳ^ｎマススペクトル中のニュートラルロスのピークを求めるニュートラルロス算出部と、既知化合物のＭＳ^ｎマススペクトル中の前記ニュートラルロスのピークを含むピークの質量電荷比と、対応する未知化合物のＭＳ^ｎマススペクトル中のピークの質量電荷比との差に基づいて、質量電荷比の誤差を示す位置スコアを各ピークについてそれぞれ求める位置スコア算出部とを備え、前記スコア算出部は、各ピークについて、既知化合物のＭＳ^ｎマススペクトル中のピークの強度スコアと、未知化合物のＭＳ^ｎマススペクトル中のピークの強度スコアと、位置スコアとを積算し、全ピークについての積算値の総和をスコアとして算出するようにしている。

　ここで、「未知化合物のＭＳ^ｎマススペクトル」とは、未知化合物をＭＳ^ｎ分析した際に得られたものであり、「既知化合物のＭＳ^ｎマススペクトル」とは、未知化合物と同様の条件（イオン化法や開裂方法等）で既知化合物をＭＳ^ｎ分析した際に得られたものであってもよく、また、未知化合物と異なる条件で既知化合物をＭＳ^ｎ分析した際に得られたものや、既知化合物の化学構造から計算されたものであってもよい。

　本発明のデータ処理装置によれば、まず、＜１＞ピークのイオン強度Ｉについては次のように処理する。ピークのイオン強度Ｉは変化しやすいが、大きなイオン強度Ｉのピークは、対象化合物から得られやすいフラグメントイオンのピークであると考えられる。そこで、未知化合物のＭＳ^ｎマススペクトルについて、イオン強度Ｉの大きさによって数段階（例えば、上位、中位、下位）に各ピークをそれぞれ分類するとともに、データベースの既知化合物のＭＳ^ｎマススペクトルについても、イオン強度Ｉの大きさによって数段階（例えば、上位、中位、下位）に各ピークをそれぞれ分類する。これにより、イオン強度Ｉが異なっても、類似したピークを見つけるようにする。
　また、ピークの有無は変化しやすいので、未知化合物のＭＳ^ｎマススペクトルと既知化合物のＭＳ^ｎマススペクトルとで同一の位置（質量電荷比）にピークが存在しなくても、互いにニュートラルロスの関係にあるピークが存在する場合がある。そこで、ニュートラルロス算出部は、未知化合物のＭＳ^ｎマススペクトルについて、ピークの位置とプリカーサイオンの質量とからニュートラルロスのピークを求める。これにより、未知化合物のＭＳ^ｎマススペクトル中であるべきピークが現れなくても、ピークを対応付けることができる。なお、ＭＳ^ｎマススペクトル中に追加するニュートラルロスのピークのイオン強度Ｉについては、例えば、元としたピークと同じイオン強度Ｉとする。

　次に、＜２＞ピークの位置（ｍ／ｚ）については次のように処理する。未知化合物のＭＳ^ｎマススペクトル中のピークの位置はある程度のずれが生じる。そこで、既知化合物のＭＳ^ｎマススペクトル中のピークの位置を基準とし、質量分析装置のピークの位置の精度範囲（例えば、質量分析装置で－１．０～１．０や、ＴＯＦで－０．００５～０．００５や、タンデム四重極で－０．５～０．５）に位置スコア「１．０」を対応付け、その精度範囲外で位置スコア「０.０」に漸近する位置スコアを対応付けることで、ピークの位置が異なっても、類似したピークを見つけるようにする。

　そして、上述したように、対応付けられた各ピークについて、既知化合物のＭＳ^ｎマススペクトル中のピークの強度スコアと、未知化合物のＭＳ^ｎマススペクトル中のピークの強度スコアと、位置スコアとを積算し、全ピークについての積算値の総和をスコアとして算出する。

　以上のように、本発明のデータ処理装置によれば、未知化合物のＭＳ^ｎマススペクトル中のピークのイオン強度Ｉやピークの位置（ｍ／ｚ）やピークの有無等が変化しても、未知化合物のＭＳ^ｎマススペクトルと、多数の既知化合物のＭＳ^ｎマススペクトルとの類似性を正しく評価することができる。

（その他の課題を解決するための手段及び効果）
　また、本発明のデータ処理装置においては、既知化合物のＭＳ^ｎマススペクトル中のピークの質量電荷比と、未知化合物のＭＳ^ｎマススペクトル中のピークの質量電荷比との内で、一致したペア数から求められた一致度に基づいて、一致度を示すピークスコアを求めるピークスコア算出部とを備え、前記スコア算出部は、前記スコアに前記ピークスコアを加算するようにしてもよい。

　本発明のデータ処理装置によれば、＜３＞ピーク・ニュートラルロスペアの一致度については次のように処理する。既知化合物のＭＳ^ｎマススペクトル中のピークの質量電荷比と、未知化合物のＭＳ^ｎマススペクトル中のピーク（ニュートラルロスのピークも含む）の質量電荷比との内で、一致したペア数から一致度を示すピークスコア（例えば、（一致したピーク数／既知化合物のＭＳ^ｎマススペクトル中のピーク数）×１００）を求める。

　また、本発明のデータ処理装置においては、前記強度スコア算出部は、未知化合物のＭＳ^ｎマススペクトル中の各ピーク及び既知化合物のＭＳ^ｎマススペクトル中の各ピークを、イオン強度又は当該イオン強度のｌｏｇの変換値の大きさによって３段階、もしくは数段階の強度スコアにそれぞれ分類するようにしてもよい。

　また、本発明のデータ処理装置においては、前記強度スコア算出部は、未知化合物のＭＳ^ｎマススペクトル中の各ピーク及び既知化合物のＭＳ^ｎマススペクトル中の各ピークを、イオン強度の大きさとピークの質量電荷比の大きさとによって数段階の強度スコアにそれぞれ分類するようにしてもよい。
　本発明のデータ処理装置によれば、ＭＳ^ｎマススペクトルでは、質量電荷比に比例してピークのユニーク度が大きくなるが、質量電荷比が大きなピークは、イオン強度が小さくなる場合があるため、イオン強度を質量電荷比に応じて重み付ける（例えばイオン強度をＩ、質量荷電比をＭとして、あるピークの強度ＩをＩ＝Ｍ×（Ｉ）^１／２のように重み付ける）ことで、未知化合物のＭＳ^ｎマススペクトルと、多数の既知化合物のＭＳ^ｎマススペクトルとの類似性を正しく評価することができる。

　また、本発明のデータ処理装置においては、前記強度スコア算出部は、未知化合物のＭＳ^ｎマススペクトルにおいて、イオン強度の大きさが閾値以下であるピークを除去するようにしてもよい。
　本発明のデータ処理装置によれば、適切なピークだけに注目したスコアを得ることができ、信頼性の高い検索ができるようになる。

　また、本発明のデータ処理装置においては、前記位置スコア算出部は、既知化合物のＭＳ^ｎマススペクトル中のピークの質量電荷比を基準とし、当該基準から離れるにしたがって低くなる位置スコアを、未知化合物のＭＳ^ｎマススペクトル中の各ピークについてそれぞれ求めるようにしてもよい。
　本発明のデータ処理装置によれば、例えば、既知化合物のＭＳ^ｎマススペクトル中のピークの質量電荷比を基準とし、その基準から離れるにしたがって低くなる適当な分布関数や、既知化合物のＭＳ^ｎマススペクトル中のピークの質量電荷比を基準とし、適当な傾きで位置スコア「０」に減衰していく近似関数や、既知化合物のＭＳ^ｎマススペクトル中のピークの質量電荷比を基準とし、一定範囲まである位置スコアとし、その一定範囲外は位置スコア「０」とするステップ関数や、これらの組み合わせにすることで、各ピークについて位置スコアをそれぞれ求める。なお、基準とする既知化合物のＭＳ^ｎマススペクトル中のピークの質量電荷比も、一定値とするだけでなく、存在確率や、構造式の分子軌道計算から求められる結合力等に基づいた可変値としてもよい。また、分布関数や近似関数やステップ関数中に、既知化合物のＭＳ^ｎマススペクトル中のピークが複数存在する場合には、最も基準に近いピークや、強度スコアと位置スコアとの積算値が高いピークを選択することとしてもよい。
　以上のように、本発明のデータ処理装置によれば、ピークの位置の関数を用いることで、信頼性の高い検索ができるようになる。また、ピークの位置の関数を直線的な分布にした場合には、簡素化され効率的に検索ができるようになる。

　また、本発明のデータ処理装置においては、前記位置スコア算出部は、未知化合物のＭＳ^ｎマススペクトル中のピークの質量電荷比を、アダクトイオンの質量を用いて補正するようにしてもよい。
　本発明のデータ処理装置によれば、アダクトイオン（－Ｈ、－ＯＨ、－ＣＯ_２等の付加体）によってピークの位置が１以上ずれることも考えられる。そこで、精度範囲外のピークに対してもアダクトに基づいて対応付けることで、ピークの位置が１以上ずれても、類似したピークを見つけることができる。

　また、本発明のデータ処理装置においては、前記ピークスコア算出部は、一致したペア数にしたがって増加するピークスコアを求めるようにしてもよい。
　本発明のデータ処理装置によれば、一致したペア数にしたがってスコアへの影響度を変えることができ、多くの部分構造が一致する同一の化合物の代謝物等の変化体を正しく検索することができる。

　また、本発明のデータ処理装置においては、前記スコア算出部は、未知化合物のＭＳ^ｎ＋ｍマススペクトルと、多数の既知化合物のＭＳ^ｎ＋ｍマススペクトルとの類似性を示すＭＳ^ｎ＋ｍマススペクトルのスコアをそれぞれ求め、ＭＳ^ｎマススペクトルのスコアに、ＭＳ^ｎ＋ｍマススペクトルのスコアを加算するようにしてもよい。
　本発明のデータ処理装置によれば、関連付けられた子や親のマススペクトルもスコアに反映でき、信頼性の高い検索ができるようになる。

　そして、本発明のデータ処理方法は、多数の既知化合物のＭＳ^ｎマススペクトルを予め記憶するデータベース記憶領域と、未知化合物のＭＳ^ｎマススペクトルを取得する取得部と、未知化合物のＭＳ^ｎマススペクトルと、多数の既知化合物のＭＳ^ｎマススペクトルとの類似性を示すスコアをそれぞれ求めるスコア算出部とを備えるデータ処理装置を用いたデータ処理方法であって、未知化合物のＭＳ^ｎマススペクトル中の各ピーク及び既知化合物のＭＳ^ｎマススペクトル中の各ピークを、イオン強度の大きさによって数段階の強度スコアにそれぞれ分類する強度スコア算出ステップと、未知化合物のＭＳ^ｎマススペクトル中のニュートラルロスのピークを求めるニュートラルロス算出ステップと、既知化合物のＭＳ^ｎマススペクトル中の前記ニュートラルロスのピークを含むピークの質量電荷比と、対応する未知化合物のＭＳ^ｎマススペクトル中のピークの質量電荷比との差に基づいて、質量電荷比の誤差を示す位置スコアを各ピークについてそれぞれ求める位置スコア算出ステップと、各ピークについて、既知化合物のＭＳ^ｎマススペクトル中のピークの強度スコアと、未知化合物のＭＳ^ｎマススペクトル中のピークの強度スコアと、位置スコアとを積算し、全ピークについての積算値の総和をスコアとして算出するスコア算出ステップとを含むようにしている。

　また、本発明のデータ処理方法においては、既知化合物のＭＳ^ｎマススペクトル中のピークの質量電荷比と、未知化合物のＭＳ^ｎマススペクトル中のピークの質量電荷比との内で、一致したペア数から求められた一致度に基づいて、一致度を示すピークスコアを求めるピークスコア算出ステップと、前記スコアに前記ピークスコアを加算する加算ステップとを含むようにしてもよい。

本発明の一実施形態である質量分析装置の概略構成を示すブロック図。分布関数記憶領域に記憶された分布関数の一例を示す図。データ処理方法の一例について説明するためのフローチャート。データ処理方法の一例について説明するためのフローチャート。

　以下、本発明の実施形態について図面を用いて説明する。なお、本発明は、以下に説明するような実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で種々の態様が含まれる。

　図１は、本発明の一実施形態である質量分析装置の概略構成を示すブロック図である。
　液体クロマトグラフ質量分析装置（ＬＣ／ＭＳ）１は、液体クロマトグラフ装置（ＬＣ）１０と、ＭＳ^ｎ分析が可能な質量分析装置（ＭＳ）２０と、コンピュータ（データ処理装置）３０とを備える。
　なお、ここでは、ＬＣ／ＭＳ１で得られたマススペクトルを利用する場合を例にとるが、ガスクロマトグラフ質量分析装置（ＧＣ／ＭＳ）等の他のクロマトグラフ質量分析装置や、試料の直接導入を行う質量分析装置を利用する場合も同様である。

　ＬＣ１０は、カラムオーブン１１と、カラムオーブン１１に内装されるカラム１２と、カラム１２の入口端に接続されるサンプル注入部１３とを備える。
　このようなＬＣ１０によれば、試料は、キャリアガスに押されてサンプル注入部１３からカラム１２内に導入されることになる。これにより、試料に含まれる各成分（未知化合物）は、カラム１２内を通過する間に時間軸方向に分離されて、カラム１２の出口端に到達することになる。なお、カラム１２の出口端はＭＳ２０に接続されている。

　ＭＳ２０は、未知化合物をイオン化するイオン源２１と、生成したイオンを質量分離しかつＭＳ^ｎ分析が可能な質量分離部２２と、質量分離されたイオンを検出する検出器２３とを備える。イオン源２１には、エレクトロスプレイイオン源の他、ソニックスプレイイオン源や、イオンスプレイや、マトリックス支援レーザー脱離イオン源等が使用可能である。質量分離部２２としては、例えば、三連四重極型の質量分析装置やイオントラップ型の質量分析装置等を用いることができる。なお、各試料成分由来のイオンから適当な質量電荷比（ｍ／ｚ）を有するイオンがプリカーサイオンとして自動的に選択されるか、事前に指定した質量荷電比（ｍ／ｚ）のピークをプリカーサイオンとして選定し、このプリカーサイオンを開裂させて発生したフラグメントイオンの質量分離・検出が行われる。

　このようなＭＳ２０によれば、イオン源２１でイオン化されたイオンは、質量分離部２２へ導入される。質量分離部２２では、イオンを質量分離する。また、測定者の設定にしたがってＭＳ^ｎ分析（ｎ＝２，３，４，・・・）を順次行う。質量分離されたイオンは検出器２３へ送られ、ＭＳ^ｎマススペクトル（ｎ＝２，３，４，・・・）として検出され、ＭＳ^ｎマススペクトル（ｎ＝２，３，４，・・・）のデータがコンピュータ３０へ送られる。

　コンピュータ３０は、ＣＰＵ３１とメモリ３２と入力装置３３と表示装置３４とを備える。ＣＰＵ３１が処理する機能をブロック化して説明すると、未知化合物のＭＳ^ｎマススペクトルのデータを取得する取得部３１ａと、強度スコアＩ_ｄ，Ｉ_ｑを算出する強度スコア算出部３１ｂと、位置スコアＳ（ｅｒｒ）を算出する位置スコア算出部３１ｃと、ニュートラルロス算出部３１ｅと、ピークスコアＳ（Ｎ）を算出するピークスコア算出部３１ｆと、スコアＳｃｒを算出するスコア算出部３１ｄとを有する。

　メモリ３２は、イオン強度Ｉを蓄積するためのイオン強度記憶領域３２ａと、未知化合物のＭＳ^ｎマススペクトルを記憶するための未知化合物データ記憶領域３２ｂと、多数の既知化合物のＭＳ^ｎマススペクトルを予め記憶するデータベース記憶領域３２ｃと、位置スコアＳ（ｅｒｒ）を算出するための分布関数を予め記憶する分布関数記憶領域３２ｄと有する。

　ここで、データベース記憶領域３２ｃに記憶された既知化合物のＭＳ^ｎマススペクトルは、ＭＳ２０で実際に既知化合物をＭＳ^ｎ分析した際に得られたものであり、多数の既知化合物をＭＳ^ｎ分析することにより、データベース記憶領域３２ｃに記憶されている。
　そして、データベース記憶領域３２ｃに記憶された既知化合物のＭＳ^ｎマススペクトルは、イオン強度Ｉ_ｄについては強度スコア算出部３１ｂによりイオン強度Ｉ_ｄの大きさによって３段階に各ピークがそれぞれ分類されており、具体的には、イオン強度Ｉ_ｄがＩ_１以上であるピークを上位の強度スコア「４」に分類し、イオン強度Ｉ_ｄがＩ_２以上Ｉ_１未満であるピークを中位の強度スコア「３」に分類し、イオン強度Ｉ_ｄがＩ_２未満であるピークを下位の強度スコア「２」に分類している。
　また、既知化合物のＭＳ^ｎマススペクトルは、質量電荷比（ｍ／ｚ）については位置スコア算出部３１ｃにより各ピークの質量電荷比（ｍ／ｚ）がそれぞれ求められている。
　これにより、例えば、一の既知化合物のＭＳ^ｎマススペクトルでは、ｉ番目のピークについては強度スコア「４」、質量電荷比（ｍ_ｉ／ｚ_ｉ）が割り当てられ、（ｉ＋１）番目のピークについては強度スコア「２」、質量電荷比（ｍ_{（ｉ＋１）}／ｚ_{（ｉ＋１）}）が割り当てられるように、全てのピークについて強度スコアと質量電荷比（ｍ／ｚ）とが割り当てられている。そして、全ての既知化合物のＭＳ^ｎマススペクトルについて、全てのピークについて強度スコアと質量電荷比（ｍ／ｚ）とが割り当てられている。

　また、図２は、分布関数記憶領域３２ｄに記憶された分布関数の一例を示す図である。横軸は質量電荷比ｍ／ｚの差ｅｒｒとなっており、縦軸は位置スコアＳ（ｅｒｒ）となっている。分布関数は、差ｅｒｒが０であるときには位置スコア「１」を対応付け、差ｅｒｒが大きくなるにしたがって位置スコア「０」に近づくように低くなっている。

　取得部３１ａは、未知化合物をＭＳ^ｎ分析（ｎ＝２，３，４，・・・）することで、検出器２３で取得されたイオン強度Ｉ_ｑをメモリ３２に蓄積させた後、イオン強度Ｉ_ｑを縦軸に、ｍ／ｚを横軸にとることにより、ＭＳ^ｎマススペクトル（ｎ＝２，３，４，・・・）を作成して未知化合物データ記憶領域３２ｂに記憶させる制御を行う。

　強度スコア算出部３１ｂは、未知化合物のＭＳ^ｎマススペクトル（ｎ＝２，３，４，・・・）中の各ピークを、イオン強度Ｉ_ｑの大きさによって３段階の強度スコアにそれぞれ分類する制御を行う。具体的には、イオン強度Ｉ_ｑがＩ_１以上であるピークを上位の強度スコア「４」に分類し、イオン強度Ｉ_ｑがＩ_２以上Ｉ_１未満であるピークを中位の強度スコア「３」に分類し、イオン強度Ｉ_ｑがＩ_２未満であるピークを下位の強度スコア「２」に分類する。

　ニュートラルロス算出部３１ｅは、未知化合物のＭＳ^ｎマススペクトル中のニュートラルロスのピークを求める制御を行う。例えば、各試料成分由来のイオンから適当な質量電荷比（ｍ／ｚ）を有するイオンがプリカーサイオンとして自動的に選択されるか、事前に指定した質量荷電比（ｍ／ｚ）のピークをプリカーサイオンとして選定し、得られた未知化合物のＭＳ^ｎマススペクトルについて、ピークの質量電荷比（ｍ／ｚ）とプリカーサイオンの質量とからニュートラルロスを求める。これにより、未知化合物のＭＳ^ｎマススペクトル（ｎ＝２，３，４，・・・）中にニュートラルロスのピークを含んだものが作成される。なお、ＭＳ^ｎマススペクトル中に追加するニュートラルロスのピークのイオン強度Ｉについては、例えば、元としたピークと同じイオン強度Ｉとする。

　位置スコア算出部３１ｃは、既知化合物のＭＳ^ｎマススペクトル中のピークの質量電荷比（ｍ／ｚ）と、対応する未知化合物のＭＳ^ｎマススペクトル中のピーク（ニュートラルロスのピークも含む）の質量電荷比（ｍ／ｚ）との差ｅｒｒに基づいて、質量電荷比（ｍ／ｚ）の誤差を示す位置スコアＳ（ｅｒｒ）を各ピークについてそれぞれ求める制御を行う。
　まず、未知化合物データ記憶領域３２ｂに記憶された未知化合物のＭＳ^ｎマススペクトルについて、各ピーク（ニュートラルロスのピークも含む）の質量電荷比（ｍ／ｚ）をそれぞれ求める。
　次に、未知化合物のＭＳ^ｎマススペクトルと、様々な既知化合物のＭＳ^ｎマススペクトルとを次々と比較していくことになるが、Ｘ番目の既知化合物のＭＳ^ｎマススペクトルと、未知化合物のＭＳ^ｎマススペクトルとを比較するときには、Ｘ番目の既知化合物のＭＳ^ｎマススペクトル中のｉ番目のピークの質量電荷比（ｍ／ｚ）に最も近い質量電荷比（ｍ／ｚ）のピーク（ニュートラルロスのピークも含む）を見つけ出す。例えば、Ｘ番目の既知化合物のＭＳ^ｎマススペクトル中のｉ番目のピークの質量電荷比（ｍ／ｚ）に最も近い質量電荷比（ｍ／ｚ）のピークとして、未知化合物のＭＳ^ｎマススペクトル中のｊ番目のピークを見つけ出す。そして、Ｘ番目の既知化合物のＭＳ^ｎマススペクトル中のｉ番目のピークの質量電荷比（ｍ／ｚ）と、未知化合物のＭＳ^ｎマススペクトル中のｊ番目のピークの質量電荷比（ｍ／ｚ）との差ｅｒｒを算出し、差ｅｒｒを図２に示す分布関数に代入することで、位置スコアＳ_ｉｊ（ｅｒｒ）を求める。

　さらに、Ｘ番目の既知化合物のＭＳ^ｎマススペクトル中の（ｉ＋１）番目のピークの質量電荷比（ｍ／ｚ）に最も近い質量電荷比（ｍ／ｚ）のピーク（ニュートラルロスのピークも含む）を見つけ出す。例えば、Ｘ番目の既知化合物のＭＳ^ｎマススペクトル中の（ｉ＋１）番目のピークの質量電荷比（ｍ／ｚ）に最も近い質量電荷比（ｍ／ｚ）のピークとして、未知化合物のＭＳ^ｎマススペクトル中の（ｊ＋ｎ）番目のピークを見つけ出す。そして、Ｘ番目の既知化合物のＭＳ^ｎマススペクトル中の（ｉ＋１）番目のピークの質量電荷比（ｍ／ｚ）と、未知化合物のＭＳ^ｎマススペクトル中の（ｊ＋ｎ）番目のピークの質量電荷比（ｍ／ｚ）との差ｅｒｒを算出し、差ｅｒｒを図２に示す分布関数に代入することで、位置スコアＳ_{（ｉ＋１）（ｊ＋ｎ）}（ｅｒｒ）を求める。
　このようにして、Ｘ番目の既知化合物のＭＳ^ｎマススペクトル中の全ピークについて対応する未知化合物のＭＳ^ｎマススペクトル中のピーク（ニュートラルロスのピークも含む）を見つけ出し、位置スコアＳ（ｅｒｒ）を求める。

　ピークスコア算出部３１ｆは、下記式（１）に基づいてピークスコアＳ（Ｎ）を求める制御を行う。
　Ｓ（Ｎ）＝（一致したピーク数／既知化合物のＭＳ^ｎマススペクトル中のピーク数）×１００　・・・（１）
　これにより、既知化合物のＭＳ^ｎマススペクトル中のピークの質量電荷比（ｍ／ｚ）と、未知化合物のＭＳ^ｎマススペクトル中のピーク（ニュートラルロスのピークも含む）の質量電荷比（ｍ／ｚ）との内で、一致したペア数から求められた一致度を示すピークスコアＳ（Ｎ）が求められる。例えば、Ｘ番目の既知化合物のＭＳ^ｎマススペクトル中のピーク数が５個であり、一致したピーク数が３個であれば、一致度を示すピークスコア「６０」となり、（Ｘ＋１）番目の既知化合物のＭＳ^ｎマススペクトル中のピーク数が１０個であり、一致したピーク数が１個であれば、一致度を示すピークスコア「１０」となる。
　なお、「一致した」とは、既知化合物のＭＳ^ｎマススペクトルのピークに対して、未知化合物のＭＳ^ｎマススペクトル中において、位置スコアＳ（ｅｒｒ）が０でないピーク或いはニュートラルロスのピークが存在することをいう。

　スコア算出部３１ｄは、下記式（２）に基づいてスコアＳｃｒを算出する制御を行う。
　Ｓｃｒ＝Ｓ_ｉｊ（ｅｒｒ）×Ｉ_ｄｉ×Ｉ_ｑｊ＋Ｓ_{（ｉ＋１）（ｊ＋ｎ）}（ｅｒｒ）×Ｉ_{ｄ（ｉ＋１）}×Ｉ_{ｑ（ｊ＋ｎ）}＋・・・＋Ｓ（Ｎ）　・・・（２）
　なお、「Ｉ_ｄｉ」は、既知化合物のＭＳ^ｎマススペクトル中のｉ番目のピークの強度スコアであり、「Ｉ_{ｄ（ｉ＋１）}」は、既知化合物のＭＳ^ｎマススペクトル中の（ｉ＋１）番目のピークの強度スコアであり、「Ｉ_ｑｊ」は、未知化合物のＭＳ^ｎマススペクトル中のｊ番目のピークの強度スコアであり、「Ｉ_{ｑ（ｊ＋ｎ）}」は、未知化合物のＭＳ^ｎマススペクトル中の（ｊ＋ｎ）番目のピークの強度スコアである。
　これにより、各ピークについて、既知化合物のＭＳ^ｎマススペクトル中のピークの強度スコアＩ_ｄと、未知化合物のＭＳ^ｎマススペクトル中のピークの強度スコアＩ_ｑと、位置スコアＳ（ｅｒｒ）とを積算し、全ピークについての積算値の総和を算出し、その算出値にピークスコアＳ（Ｎ）を加算することで、未知化合物とＸ番目の既知化合物との類似性を示すスコアＳｃｒが算出される。このようにして、未知化合物のＭＳ^ｎマススペクトルと、様々な既知化合物のＭＳ^ｎマススペクトルとの類似性を示すスコアＳｃｒが算出されていく。

　ここで、液体クロマトグラフ質量分析装置（ＬＣ／ＭＳ）１を用いた未知化合物を同定するデータ処理方法について説明する。図３は、データ処理方法の一例について説明するためのフローチャートである。
　まず、ステップＳ１０１の処理において、未知化合物のＭＳ^ｎマススペクトル（ｎ＝２，３，４，・・・）を作成する。

　次に、ステップＳ１０２の処理において、未知化合物のＭＳ^ｎマススペクトルについて、各ピークの質量電荷比（ｍ／ｚ）をそれぞれ求める。
　次に、ステップＳ１０３の処理において、未知化合物のＭＳ^ｎマススペクトル（ｎ＝２，３，４，・・・）中の各ピークを、イオン強度Ｉ_ｑの大きさによって３段階の強度スコアにそれぞれ分類する（強度スコア算出ステップ）。
　次に、ステップＳ１０４の処理において、未知化合物のＭＳ^ｎマススペクトル中のニュートラルロスのピークを求める（ニュートラルロス算出ステップ）。
　次に、ステップＳ１０５の処理において、既知化合物の順番を示す既知化合物順番パラメータＸ＝１とする。

　次に、ステップＳ１０６の処理において、スコアＳｃｒ＝０とする。
　次に、ステップＳ１０７の処理において、既知化合物のＭＳ^ｎマススペクトル中のピークの順番を示すピーク順番パラメータｉ＝１とする。

　次に、ステップＳ１０８の処理において、既知化合物のＭＳ^ｎマススペクトル中のｉ番目のピークの質量電荷比（ｍ／ｚ）に最も近い質量電荷比（ｍ／ｚ）のピークを見つけ出す。そして、既知化合物のＭＳ^ｎマススペクトル中のｉ番目のピークの質量電荷比（ｍ／ｚ）と、未知化合物のＭＳ^ｎマススペクトル中のｊ番目のピークの質量電荷比（ｍ／ｚ）との差ｅｒｒを算出し、差ｅｒｒを図２に示す分布関数に代入することで、位置スコアＳ_ｉｊ（ｅｒｒ）を求める（位置スコア算出ステップ）。
　次に、ステップＳ１０９の処理において、Ｓｃｒ＝Ｓｃｒ＋Ｓ_ｉｊ（ｅｒｒ）×Ｉ_ｄｉ×Ｉ_ｑｊとする。

　次に、ステップＳ１１０の処理において、ｉ＝ｉ_ｍａｘ（既知化合物のＭＳ^ｎマススペクトル中で最後の順番のピーク）であるか否かを判定する。ｉ＝ｉ_ｍａｘでないと判定したときには、ステップＳ１１１の処理において、ｉ＝ｉ＋１として、ステップＳ１０８の処理に戻る。
　一方、ｉ＝ｉ_ｍａｘであると判定したときには、ステップＳ１１２の処理において、式（１）に基づいてピークスコアＳ（Ｎ）を求める（ピークスコア算出ステップ）。
　次に、ステップＳ１１３の処理において、Ｓｃｒ＝Ｓｃｒ＋Ｓ（Ｎ）とする（スコア算出ステップ）。

　次に、ステップＳ１１４の処理において、Ｘ＝Ｘ_ｍａｘ（最後の順番の既知化合物）であるか否かを判定する。Ｘ＝Ｘ_ｍａｘでないと判定したときには、ステップＳ１１５の処理において、Ｘ＝Ｘ＋１として、ステップＳ１０６の処理に戻る。
　一方、Ｘ＝Ｘ_ｍａｘであると判定したときには、ステップＳ１１６の処理において、スコアＳｃｒが高い順番に既知化合物を配列する。
　そして、ステップＳ１１６の処理が終了したときには、本フローチャートを終了させる。

　以上のように、液体クロマトグラフ質量分析装置（ＬＣ／ＭＳ）１によれば、未知化合物のＭＳ^ｎマススペクトル中のピークのイオン強度Ｉ_ｑやピークの位置（ｍ／ｚ）やピークの有無等が変化しても、未知化合物のＭＳ^ｎマススペクトルと、多数の既知化合物のＭＳ^ｎマススペクトルとの類似性を正しく評価することができる。

＜他の実施形態＞
（１）上述した液体クロマトグラフ質量分析装置（ＬＣ／ＭＳ）１では、強度スコア算出部３１ｂは、未知化合物のＭＳ^ｎマススペクトル（ｎ＝２，３，４，・・）中の各ピークと既知化合物のＭＳ^ｎマススペクトル（ｎ＝２，３，４，・・・）中の各ピークとを、イオン強度Ｉ_ｑ，Ｉ_ｄの大きさによって３段階の強度スコアにそれぞれ分類する構成を示したが、イオン強度Ｉ_ｑ，Ｉ_ｄのｌｏｇの変換値の大きさによって２段階や４段階の強度スコアにそれぞれ分類する構成としてもよい。さらに、強度スコア算出部は、未知化合物のＭＳ^ｎマススペクトルにおいて、イオン強度Ｉ_ｑの大きさが閾値以下であるピークを除去する構成としてもよい。

（２）上述した液体クロマトグラフ質量分析装置（ＬＣ／ＭＳ）１では、強度スコア算出部３１ｂは、未知化合物のＭＳ^ｎマススペクトル（ｎ＝２，３，４，・・・）中の各ピークと既知化合物のＭＳ^ｎマススペクトル（ｎ＝２，３，４，・・・）中の各ピークとを、イオン強度Ｉ_ｑ，Ｉ_ｄの大きさによって３段階の強度スコアにそれぞれ分類する構成を示したが、イオン強度Ｉ_ｑ，Ｉ_ｄの大きさとピークの質量電荷比の大きさとによって数段階の強度スコアにそれぞれ分類する構成としてもよい。例えば、イオン強度Ｉ_ｑ，Ｉ_ｄがＩ_１以上であるピークを上位の強度スコア「４」に分類し、イオン強度Ｉ_ｑ，Ｉ_ｄがＩ_２以上Ｉ_１未満であるピークを中位の強度スコア「３」に分類し、イオン強度Ｉ_ｑ，Ｉ_ｄがＩ_２未満であるピークを下位の強度スコア「２」に分類するとともに、質量電荷比がｍ_１／ｚ_１以上であるピークに強度スコア「２」を加算し、質量電荷比がｍ_１／ｚ_１未満であるピークに強度スコア「１」を加算する。

（３）上述した液体クロマトグラフ質量分析装置（ＬＣ／ＭＳ）１では、位置スコア算出部は、未知化合物のＭＳ^ｎマススペクトル中のピークの質量電荷比を、アダクトイオンの質量を用いて補正する構成としてもよい。

（４）上述した液体クロマトグラフ質量分析装置（ＬＣ／ＭＳ）１では、式（１）に基づいてピークスコアＳ（Ｎ）を求める構成を示したが、一致したペア数にしたがって増加するピークスコアＳ（Ｎ）を求める構成としてもよい。例えば、既知化合物のＭＳ^ｎマススペクトル中のピーク数の８割以上が一致した場合にはピークスコア「１００」とし、既知化合物のＭＳ^ｎマススペクトル中のピーク数の５割以上８割未満が一致した場合にはピークスコア「５０」とし、既知化合物のＭＳ^ｎマススペクトル中のピーク数の２割が一致した場合にはピークスコア「２０」とする。

（５）上述した液体クロマトグラフ質量分析装置（ＬＣ／ＭＳ）１では、スコア算出部は、未知化合物のＭＳ^ｎ＋ｍマススペクトルと、多数の既知化合物のＭＳ^ｎ＋ｍマススペクトルとの類似性を示すＭＳ^ｎ＋ｍマススペクトルのスコアをそれぞれ求め、ＭＳ^ｎマススペクトルのスコアに、ＭＳ^ｎ＋ｍマススペクトルのスコアを加算する構成としてもよい。

　本発明は、質量分析装置によって得られた未知化合物のＭＳ^ｎマススペクトルと、多数の既知化合物のＭＳ^ｎマススペクトルとの類似性を示すスコアをそれぞれ求め、そのスコアに基づいて未知化合物を同定するデータ処理方法等に利用することができる。

　　１：　液体クロマトグラフ質量分析装置（データ処理装置）
３１ａ：　取得部
３１ｂ：　強度スコア算出部
３１ｃ：　位置スコア算出部
３１ｄ：　スコア算出部
３２ｃ：　データベース記憶領域

Claims

　多数の既知化合物のＭＳ^ｎマススペクトルを予め記憶するデータベース記憶領域と、
　未知化合物のＭＳ^ｎマススペクトルを取得する取得部と、
　未知化合物のＭＳ^ｎマススペクトルと、多数の既知化合物のＭＳ^ｎマススペクトルとの類似性を示すスコアをそれぞれ求めるスコア算出部とを備えるデータ処理装置であって、
　未知化合物のＭＳ^ｎマススペクトル中の各ピーク及び既知化合物のＭＳ^ｎマススペクトル中の各ピークを、イオン強度の大きさによって数段階の強度スコアにそれぞれ分類する強度スコア算出部と、
　未知化合物のＭＳ^ｎマススペクトル中のニュートラルロスのピークを求めるニュートラルロス算出部と、
　既知化合物のＭＳ^ｎマススペクトル中の前記ニュートラルロスのピークを含むピークの質量電荷比と、対応する未知化合物のＭＳ^ｎマススペクトル中のピークの質量電荷比との差に基づいて、質量電荷比の誤差を示す位置スコアを各ピークについてそれぞれ求める位置スコア算出部とを備え、
　前記スコア算出部は、各ピークについて、既知化合物のＭＳ^ｎマススペクトル中のピークの強度スコアと、未知化合物のＭＳ^ｎマススペクトル中のピークの強度スコアと、位置スコアとを積算し、全ピークについての積算値の総和をスコアとして算出することを特徴とするデータ処理装置。
　既知化合物のＭＳ^ｎマススペクトル中のピークの質量電荷比と、未知化合物のＭＳ^ｎマススペクトル中のピークの質量電荷比との内で、一致したペア数から求められた一致度に基づいて、一致度を示すピークスコアを求めるピークスコア算出部とを備え、
　前記スコア算出部は、前記スコアに前記ピークスコアを加算することを特徴とする請求項１に記載のデータ処理装置。
　前記強度スコア算出部は、未知化合物のＭＳ^ｎマススペクトル中の各ピーク及び既知化合物のＭＳ^ｎマススペクトル中の各ピークを、イオン強度又は当該イオン強度のｌｏｇの変換値の大きさによって３段階、もしくは数段階の強度スコアにそれぞれ分類することを特徴とする請求項１又は請求項２に記載のデータ処理装置。
　前記強度スコア算出部は、未知化合物のＭＳ^ｎマススペクトル中の各ピーク及び既知化合物のＭＳ^ｎマススペクトル中の各ピークを、イオン強度の大きさとピークの質量電荷比の大きさとによって数段階の強度スコアにそれぞれ分類することを特徴とする請求項１又は請求項２に記載のデータ処理装置。
　前記強度スコア算出部は、未知化合物のＭＳ^ｎマススペクトルにおいて、イオン強度の大きさが閾値以下であるピークを除去することを特徴とする請求項１又は請求項２に記載のデータ処理装置。
　前記位置スコア算出部は、既知化合物のＭＳ^ｎマススペクトル中のピークの質量電荷比を基準とし、当該基準から離れるにしたがって低くなる位置スコアを、未知化合物のＭＳ^ｎマススペクトル中の各ピークについてそれぞれ求めることを特徴とする請求項１又は請求項２に記載のデータ処理装置。
　前記位置スコア算出部は、未知化合物のＭＳ^ｎマススペクトル中のピークの質量電荷比を、アダクトイオンの質量を用いて補正することを特徴とする請求項１又は請求項２に記載のデータ処理装置。
　前記ピークスコア算出部は、一致したペア数にしたがって増加するピークスコアを求めることを特徴とする請求項２に記載のデータ処理装置。
　前記スコア算出部は、未知化合物のＭＳ^ｎ＋ｍマススペクトルと、多数の既知化合物のＭＳ^ｎ＋ｍマススペクトルとの類似性を示すＭＳ^ｎ＋ｍマススペクトルのスコアをそれぞれ求め、
　ＭＳ^ｎマススペクトルのスコアに、ＭＳ^ｎ＋ｍマススペクトルのスコアを加算することを特徴とする請求項１又は請求項２に記載のデータ処理装置。
　多数の既知化合物のＭＳ^ｎマススペクトルを予め記憶するデータベース記憶領域と、
　未知化合物のＭＳ^ｎマススペクトルを取得する取得部と、
　未知化合物のＭＳ^ｎマススペクトルと、多数の既知化合物のＭＳ^ｎマススペクトルとの類似性を示すスコアをそれぞれ求めるスコア算出部とを備えるデータ処理装置を用いたデータ処理方法であって、
　未知化合物のＭＳ^ｎマススペクトル中の各ピーク及び既知化合物のＭＳ^ｎマススペクトル中の各ピークを、イオン強度の大きさによって数段階の強度スコアにそれぞれ分類する強度スコア算出ステップと、
　未知化合物のＭＳ^ｎマススペクトル中のニュートラルロスのピークを求めるニュートラルロス算出ステップと、
　既知化合物のＭＳ^ｎマススペクトル中の前記ニュートラルロスのピークを含むピークの質量電荷比と、対応する未知化合物のＭＳ^ｎマススペクトル中のピークの質量電荷比との差に基づいて、質量電荷比の誤差を示す位置スコアを各ピークについてそれぞれ求める位置スコア算出ステップと、
　各ピークについて、既知化合物のＭＳ^ｎマススペクトル中のピークの強度スコアと、未知化合物のＭＳ^ｎマススペクトル中のピークの強度スコアと、位置スコアとを積算し、全ピークについての積算値の総和をスコアとして算出するスコア算出ステップとを含むことを特徴とするデータ処理方法。
　既知化合物のＭＳ^ｎマススペクトル中のピークの質量電荷比と、未知化合物のＭＳ^ｎマススペクトル中のピークの質量電荷比との内で、一致したペア数から求められた一致度に基づいて、一致度を示すピークスコアを求めるピークスコア算出ステップと、
　前記スコアに前記ピークスコアを加算する加算ステップとを含むことを特徴とする請求項１０に記載のデータ処理方法。