JP4594154B2 - 少なくとも1つの成分および生成する生成物の観点でサンプルを特性付けし、特性付けデータを提供するための2つ以上の技術に基づいた少なくとも1つのサンプルの分析;方法、システムおよび指示プログラム - Google Patents

少なくとも1つの成分および生成する生成物の観点でサンプルを特性付けし、特性付けデータを提供するための2つ以上の技術に基づいた少なくとも1つのサンプルの分析;方法、システムおよび指示プログラム Download PDF

Info

Publication number
JP4594154B2
JP4594154B2 JP2005116310A JP2005116310A JP4594154B2 JP 4594154 B2 JP4594154 B2 JP 4594154B2 JP 2005116310 A JP2005116310 A JP 2005116310A JP 2005116310 A JP2005116310 A JP 2005116310A JP 4594154 B2 JP4594154 B2 JP 4594154B2
Authority
JP
Japan
Prior art keywords
characterization
data
measurement
mass
grouping
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005116310A
Other languages
English (en)
Other versions
JP2005308741A (ja
Inventor
ガルクザレク ウルズラ
クバレク パーフェル
ヘーゼル ヴォルフガング
Original Assignee
エフ ホフマン−ラ ロッシュ アクチェン ゲゼルシャフト
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by エフ ホフマン−ラ ロッシュ アクチェン ゲゼルシャフト filed Critical エフ ホフマン−ラ ロッシュ アクチェン ゲゼルシャフト
Publication of JP2005308741A publication Critical patent/JP2005308741A/ja
Application granted granted Critical
Publication of JP4594154B2 publication Critical patent/JP4594154B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8624Detection of slopes or peaks; baseline correction
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/0027Methods for using particle spectrometers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8603Signal analysis with integration or differentiation
    • G01N2030/862Other mathematical operations for data preprocessing
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8675Evaluation, i.e. decoding of the signal into analytical information
    • G01N30/8682Group type analysis, e.g. of components having structural properties in common

Landscapes

  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)

Description

本発明は、少なくとも1つの成分、特にそこに含まれている化学的成分、生物的成分あるいは生物化学的成分、および少なくとも1つの該技術を行うことから生じる生成物に関して、該サンプルを特性付ける特性化データを提供するために、2つ以上の技術を行うことにより、少なくとも1つのサンプルを分析する方法およびシステムに関する。この点に関して、それは、
a)i)成分を分離するための、あるいは
ii)該第1分析技術あるいは少なくとも1つの第1分析技術を行うことにより生じる生成物を分離するための、あるいは
iii)該第1分析技術あるいは少なくとも1つの第1分析技術を行うことにより生じる成分および生成物を分離するための
少なくとも1つの第1分析技術を行う工程であって、該第1分析技術は、該サンプルに関して、あるいはすでに分離された成分あるいは生成物に関して行われ、該分離は、該成分あるいは生成物の少なくとも1つの第1識別特性に基づいて行われことを特徴とする工程と;
b)既に分離された、あるいは分離中の成分あるいは生成物に関して、少なくとも1つのさらなる技術を行う工程であって、さらなる技術は、i)少なくとも1度工程a)を行うことにより得られる少なくとも1つの分離、および ii)少なくとも1つのさらなる識別特性のうちの少なくとも1つに基づいて、分離された成分あるいは生成物を特性づけるための少なくとも1つの分析技術および検出技術であることを特徴とする工程からなることを特徴とする方法を参照にするものである。
そのような方法において、少なくとも工程b)おそらく工程a)中でも、少なくとも2つの特性付け測定量という観点での該成分あるいは生成物の少なくとも1つの特性付けを表示する測定データを提供し、該特性付け測定量の少なくとも1つの第1は、少なくとも1度の工程a)を行うことから得られる該あるいは少なくとも1つの分離を反映し、また、該特性付け測定量のさらなる少なくとも1つは、i)少なくとも1度の工程a)を行うことから得た少なくとも1つの他の分離および ii)該さらなる識別特性あるいは少なくとも1つのさらなる識別特性の少なくとも1つを反映する検出ハードウエアが使用される。
実施される技術および望みの特性付けにより、該検出ハードウエアにより提供される該測定データは、該検出ハードウエアにより検出されまたそれに関連した少なくとも1つの特性付け測定量を参照した少なくとも1つの定量的測定量に関して、検出ハードウエアにより提供される少なくとも1つの定量化を表示する定量的測定データを含んでいてもよいし、含まなくても良い。
上記のような背景において、一般的態様により、本発明は、データの取り扱い、データ処理および該2つ以上の技術を行うことから得られるデータに関連したデータ処理にも関している。特に、本態様により、本発明は、少なくとも2つの、一般的には少なくとも3あるいはそれ以上の固有の次元を持つデータの非情報コンテンツおよび情報コンテンツのあいだの区別あるいは識別に関するものである。1例として、液体クロマトグラフィーとイオン化質量スペクトル分析法たとえば電気スプレーイオン化質量スペクトル分析との組み合わせから得られた3次元のデータセットがある。このような背景においてあるいは他の背景においても、パターン認識分析あるいは少なくともいわゆるピークピッキングが、サンプル群の各サンプルの適当な特性付けに必要である。従来は、このようなパターン認識分析あるいは少なくともいわゆるピークピッキングは、各データの可視化に基づいて、オペレータあるいは科学者により行われてきた。この技術の状態は、そのようなデータから関係情報をいくつか抽出できるある方法およびアルゴリズムである。いくつかの先行技術アプローチの概略を以下に示す。
このような背景におけるさらなる一般的態様は、液体クロマトグラフィーとイオン化質量スペクトル分析法(LC−MS)、あるいは液体クロマトグラフィーと電気スプレーイオン化質量スペクトル分析法(LC−ESI−MS)などから得られるデータセットは、少なくとも多くの実際的応用において、大記憶容量を必要とするという問題である。したがって、関係する情報を表示するデータのみ、あるいは一般的には、関係する情報の適当なマッピングをデータに蓄えることにより、必要とされる記憶スペースを減少させる態様、あるいは記憶スペースを減少させるためのある種のデータ圧縮が、問題となる。
本発明の背景は、非限定的例、すなわち液体クロマトグラフィーとイオン化質量スペクトル分析法、たとえば、電気スプレーイオン化質量スペクトル分析法との組み合わせに基づいて説明する。分析技術のこの組み合わせは、実用的に高度な関係のある非常に強力な分析道具である。
関係情報に対するデータ量を削減するために、すなわち多次元あるいは高次元データ、たとえばLC−MSデータセットあるいはLC−MSデータセット類などから関係する情報を抽出することを目標としたデータ処理方法は、データ分析たとえばパターン認識分析あるいは、単にある種のピークピッキングの重要な工程である。LC−MSデータセット(あるいはMSスペクトルセット)は、広い質量範囲、たとえば質量/電荷値(m/z)で表される約50―100Daから数千Da(典型的には、2000−10000Da)を用いた数百スキャンからなる。このことは、1回の測定のデータセットは、数百万のデータポイントからなり、そこから大部分は、冗長な情報(電気的および化学的ノイズ、可動相部品から来る非冗長の「真」の信号、イオン源汚染、クロマトグラフィー材料の漏れ信号)を表示することを意味する。1次データポイントの莫大な数のために、冗長情報を手動で選択することは、実際の使用においては想像できないし、このために適当なアルゴリズムの応用が必要である。
LC−MSデータなどの多くの2次元、3次元あるいはそれ以上の高次元データセットに対しては、パターン認識分析に対してかなりの有害な作用を及ぼす両次元上の操作毎の変化が、観察される。同じ物質の信号をデータセットの集合体(1サンプル以上の測定など)に正しく割り当てることは、正当なパターン認識分析応用の重要な前提である。パターン内の個々の化学品に対して虚偽のピークの割り当てを行うことは、「真」のパターンを見出す可能性を減少させる。
LC−MSデータセットにおいては、保持時間の変動は、種々の理由、たとえば傾斜形成の不均一性、流速の変動、クロマトグラフイーカラムの過負荷、クロマトグラフー材料の経時変化による化学的変化および機械的変化などにより生じうる。質量/電荷測定の変動は、たとえば質量検出の精度、質量―電荷値、強度値あるいは信号/ノイズ比、連続スペクトルからの中心スペクトルの発生などに依存している。
多くのケモメトリック方法は、LC−MSデータ(以下を参照)のデータ処理を取り扱っている。これらの方法の大多数は、1次元のみのデータを解析するアルゴリズムを用いて、データセットの情報部分を抽出するものである。これらの方法のいくつかは、同時に二つの次元でデータを解析し、このことが、予備処理データの品質を実質的に向上させる。
以下に考慮される公知の方法は、いずれも、非常に類似の情報コンテンツを持った矛盾しないデータセットとして全分析セット(サンプル群)に関しているものではなくて、個々の分析ごとに別個に分析を行うものである。
いくつかの従来技術のアプローチ
クロマトグラフイージャーナルA771、1997年、1−7頁「連続一対共分散法の液体クロマトグラフィーへの応用、質量スペクトル分析データ;クロマトグラムにおける信号/ノイズ比および検体ピークの解像度の両者の向上」デビッド・マデイマンら。
一般的には、連続1対共分散法(SPC)は、1連の仮想増幅質量スペクトルを発生させる。質量スペクトル中の各データポイントは、次の質量スペクトル中の対応するデータポイントと積算され、幾何学的に増幅されたスペクトルとなり;各積算操作に使用されたスペクトル数は、共分散法アルゴリズムのオーダーを定めるものとなる。このようにして、クロマトグラム中のS/N比および解像度の劇的な向上は、達成されているが、絶対定量情報は、連続的なデータポイントの積算により失われているから、このアルゴリズムは、定性的な解析のみに使用できる。
アナリテイカ・ケミカ・アクタ446巻、2001年467−476頁:「ケモメトリックスを用いた複雑LC−MSデータの迅速解釈」、W,ウインデイッヒら、
米国特許第5,672,869号(クロマトグラフィー/スペクトル分析法における成分検出用のノイズバックグランド削減法)
成分検出アルゴリズム(CODA)は、LC−MSデータから、ランダムノイズ、スパイクおよび移動相ピーク除去により、化合物情報を抽出する。それは、元のクロマトグラムおよび0から1のあいだの値を持つ類似性指標を用いたスパイク除去用スムーズ形式のあいだの差の評価を使用する。ユーザーは、類似性指標カットオフ値を特定するべきである。背景の溶媒を表示するクロマトグラムを検出するために、選択された質量クロマトグラム内の全てのデータポイントの平均値の比較を用いる。
公知の方法は、基本的には、次の工程を包含する:
1.スペクトル分析法によるデータを平滑化する工程、
2.変数の強度の平均値を得る工程
3.第1工程で得られたデータから第2工程で得た平均値を差し引く工程
4.第3工程の出力と元の変数を正規化する工程
5.類似性を比較しかつ閾値を設定する工程
6.閾値を越える全変数を選択する工程
7.選択されたクロマトグラムを得るために選択された変数の合計をプロットする工程
クロマトグラフイージャーナルA849、1999年、71−85頁「ウインドウ表示の質量選択方法:液体クロマトグラフィー−質量スペクトル分析データ用の真データ処理アルゴリズム」C,M.フレミングら。
「ウインドウ表示の質量選択方法(WMSM)」と名づけられるSPC改良法は、データ中に生じるランダムノイズを除去するために示している。この処理方法は、ランダムバックグラウンドノイズを除去するための2工程よりなり、さらにピーク幅における差により、検体をノイズから区別することが出来るという主たる前提に基づいている。
この方法の前提は:
1.どのピークもウインドウの長さに亙って非ゼロ信号を持っている。
2.ランダムノイズの特性は、ウインドウにより定義されたスキャン数に亙り一定の信号を持っていないが、完結的に、ゼロ強度を表示するということである。ウインドウ範囲に亙っての強度積算は、ゼロ信号になる。
3.低一貫性バックグラウンドは、各クロマトグラムの平均値をこのクロマトグラムから差し引くことにより、除去される。
4.移動相ピークは、理論ピークの最大長さを設定する選択基準により除去される。このピークが、最大許容値より長い場合には、データセットから除去される。
この方法の前提は、LC−MSデータセット(たとえば、重なったピーク、変動する強度値を持った長いノイズ域)中に生じる偶発性の全てを完全には包含していない。SPC法に対する利点としては、原理的には、絶対強度値の保存がありうるが、バックグラウンドを差し引いた後強度値の補正を必要とすることになる。
特異値分解法
特異値分解法(SVD)は、データ圧縮および角マトリクスに対する固有値分解によるノイズ低減に対して共通の方法である。
(フレミングら:クロマトグラフイージャーナルA849、1999年、71−85頁およびそこで引用された文献中にある本方法の特性)
WO02/13228A2(混合物中の化学化合物を同定し、また定量化する方法およびシステム、フォーゲルら)
クロマトグラムのデータポイントの平滑化工程および平滑化されたクロマトグラム(クロマトグラムは、選択された質量あるいは全イオンクロマトグラムのいずれかであってもよい)に対するエンタルピー値を求める工程からなるデータ処理と評価方法が開示されている。データセット中の各平滑化質量クロマトグラムに対する品質因子(エンタルピー値に基づいた)の評価後、アルゴリズムは、定められた閾値以上のIQ値をもつ選択された質量クロマトグラムから再構築された全イオンクロマトグラムを発生させる。
米国特許第5,995,989号A1(スペクトル分析に関連したデータの圧縮とろ過用の方法と装置、ゲッケら)
スペクトル分析に関連したデータの圧縮とろ過用の方法と装置が開示されている。この方法は、各データポイントの値をモニターし、それを以前のデータポイントと比較して、それが、ピーク上にあるかあるいはピークのごく近くにあるかどうかを求める。意図されたデータ数に対する強度値を合計し、ノイズのあるバックグラウンドの平均を求めるために平均化する。閾値は、ズレに経験で定められた常数kを掛けることにより求められ、各データポイントは、この閾値に比較される。
米国特許第2002/0193950A1(質量スペクトル分析方法、ギャビンら)
質量スペクトル分析法を開示している。この分析法は、S/Nカットオフ以上の信号の検出、信号の集積化、特性の事前選択、選択クラスターに対する同定質量値、分類モデルの創生および未知サンプルの割り当てよりなっている。この方法は、クロマトグラフィー法による検出以前の時間依存性の分離を行うことなく、MALDI,SELDIあるいはESI−MSスペクトルなどの1次元信号に対してあらかじめ定められる。
この文書は、異なった生物学的状況により特性付けられるクラスを持った分類モデルの創造に焦点を当てている。こういう背景で、クラスター分析法を用いた特性事前選択が、記載されている。あらかじめ定められた信号数(ここでは、信号が存在する生物学的サンプル)を持っている信号クラスターは、分類モデルに対して選択され、信号の少ないクラスターは、捨てられる。
生データを事前処理する可能性は、この文書の中で極簡単に考慮されている。この最後には、データ分析は、検出された標識の信号強度(たとえば、信号の高さ)を求める工程を包含しうることが述べられており、また「異常値」(あらかじめ定められた統計分布からズレたデータ)を除去することが、述べられている。
米国特許第2003/0040123A1(多次元データ中でのピーク選択、ヘーステイング)
この方法は、データの各次元成分に対するローカルノイズ閾値を計算する。各点は、データセットの各次元に対して、それに適用されたローカルノイズ閾値を持っており、1点は、適用されたローカルノイズ閾値の全てをその値が越える場合にのみ、ピーク候補として、選択される。隣接する候補ピークを実際のピークに集めて1団とする(それは、検出された真のクロマトグラフィー法によるピークを意味する)。
ノイズ閾値は、特定の1点の周りの点のウインドウから計算できる。ピークピッキング後、追加の基準は、それらがピークデータベース中に受け入れられる前に、このピークに適用できる。実際のピークの選択に関しては、線形分析、あるいは質量クロマトグラムあるいは質量スペクトル用アイソトープ分布分析法に対するベイジアン/尤度などの追加のピーク認識アルゴリズムも適用しても良い。詳細は、示されていない。ピークピッキングに関しては、公知のノイズ分布に基づいて、適当なフィルターを用いることにより、ノイズを低減できると考えられており、このためピークを検出できる。米国特許第2003/0040123A1中に開示されている方法は、ノイズ問題、殊に、データの異なる次元に異なるノイズ閾値を適用することにより、LC−MSデータ中のノイズの特異性を述べている。
質量スペクトル分析データに関しての例に用いることが出来るいわゆるデータ検索技術のレビューは、「医薬の発見と開発における現在の意見2001、4(3)、325−331ページ」「バイオ標識発見のためのスペクトル分析法のデータ検索」S.M.ノートンらの中で見出す事が出来る。一般の関心事としては、パターン解析および人工知能に関するIEEEトランスアクション22(1)、2000年4−37頁「統計的パターン認識:レビュー」A.K.ジェーンらのレビュー記事もあり、その記事は、特性抽出および選択、クラスター解析、およびベイジアン統計を含む統計方法に基づいて、一般的ないわゆるデータ検索などの問題を考察している。
LC−MSスペクトル分析法の背景にある現在のアルゴリズムの欠点は、一般に、
1.ピークピッキング(ノイズ除去、スパイク同定、移動相クラスター消去)に必要な全情報は、特定の単一データセットの解析に基づくことになっている。データ特性の取得された情報は、次のデータセットに転送してはならないし、このため次のデータセット用の新しいピークピッキングプロセスのスタートが必要である。
2.大抵のアルゴリズムは、保持時間の不正確さおよび特定のピークに対する質量/電荷値に関する知識を保存しない。これは、パターン認識法により分析されるデータセットの集合体中に、同一物質(ピーク)の信号を正しく割り当てるために、重要なポイントである。パターン内の同一物質に対してピークの間違った割り当てをすることは、間違った正のあるいは負の結果を与えることになる。
3.大抵の記載された方法は、実際を反映しない非常に正確な質量対電荷値を前提としている。一定期間溶離する単一ピークの質量/電荷値(m/z)は、MS分析器の質量精度に起因している不正確さ、すなわちノイズピークの元の値と比較して中心質量値の質量シフトを示している。
このような質量トレース中へのデータの「ハードビニング」は、実際の分子が、測定された質量対電荷比中の第1少数位上で変化するという事実を心にとどめていない。このことは、質量軸の測定の不正確さのために、ピークを連続トレース中に分けることになり、このために、次のエラーを生じる:
−ピークに対するビンの不正な割り当て
−ピーク中の不正な全強度値
−保持時間軸中に生じるギャップは、ピークとしてまったく認識されていない正しいピークに導かれる。
より高度の質量精度の測定の場合でさえも(TOF分析器のように)、これらの理由が、結果として検出信号の重なりを生じ、また続いて、データポイントの不正な割り当てを各々のピーク(ビン)に行うことになり、たとえば、より高い荷電状態でのアイソトープの重なり信号、非常に類似の分子量を持ったクロマトグラフィーで不完全に分離された物質を生じることになる。
「広い」質量トレースの選択の場合には、種々のピークからのデータポイントを単一ビン中にプールするリスクがあり、一方、「狭い」質量トレースの選択の場合には、単一ピークを分離して、2つ以上のビンを生じることになる。
4.大抵の記載した方法は、質量トレースに沿って、定められたΔm/z(4重極解析器からのデータに対するデフォールト0.5−1Daより、TOF解析器からのデータに対して、Δm/z 0.1−0.01)を用いて、ピークピッキングを行う。通常は、オペレータは、質量精度についての初期情報およびデータセット中の関係する情報の位置に基づいて、取得データを評価する。
しかしながら、血清あるいは尿サンプルのLC抽出物、組織ホモジェネート抽出物、細胞培養媒体、などの非常に複雑なサンプルの大きな集合体のパターン認識分析法に対して、質量トレースに沿ってのピークピッキングの戦略は、結果として計算時間の広がりとなる。1つのピークを***して2つの連続した質量トレースにするという問題とは別に、このことは、情報信号の位置についての初期情報を知ることも無く、その情報のコンテンツに関係なく全ての質量トレースをスクリーンする必要があるから、複雑なデータセットのデータ処理に対して、非常に退屈な戦略となる。
5.大抵の記載した方法は、単一質量トレース(m/z値)上でのノイズ削減を行い、また完全なデータセットに亙るノイズの一般的な特性を特徴づけしていない。従来の「ハードビニング」と共に、情報データポイントが、削除されるという危険がある。
本発明の目的は、上記に確認したように、非情報データおよび情報データ情報のあいだを識別するために、多次元測定データの有効データ処理あるいはデータ処理に適している方法を提供することである。特に、この発明は、上述した現在のアプローチの欠点の少なくともいくつかを克服するための基礎を提供することを目的とする。本目的および他の目的は、付帯された独立請求項により定められる発明により達成される。好ましい実施の態様およびさらなる改良は、付帯された請求項の従属請求項により、また本発明の次の要約中にも定められている。
異なった態様および好ましい実施の態様および更なる利点と追加の説明に結びつくさらなる改良による発明の要約は、非制限的図示例を参照して、すなわち液体クロマトグラフィーとイオン化質量スペクトル分析法(たとえば、電気スプレーイオン化質量スペクトル分析法)との組み合わせおよび対応した測定データを参照にして、次に示す。一般的には、このようなデータは、3次元を持ち、すなち、クロマトグラフイーカラム中の各物質の保持時間に関係する第1次元、各イオンの質量対電荷比に関係する第2次元およびイオン強度あるいはある保持時間およびある質量対電荷比に対して測定されたイオンカウウント数、すなわち(保持時間、質量対電荷比)−座標に関しての第3次元を持っている。カラム中のある物質の保持時間は、質量スペクトル分析計の各測定スキャンを確認するスキャン数という言葉で、あるいはある質量対電荷比を持つあるイオン強度が検出されるための検出時間により、一般的に表現されている。そのような測定データに基づいて、各サンプルあるいはサンプル数を分析するために、同一物質(生成物のサンプルの成分)に帰せられるこれらのデータポイントを同定するデータにグループ分けすることが、必要であり、このことは、従来、経験に基づいて、オペレータあるいは科学者がこのようなデータの目視による表示を見て行ってきたし、また先に考察した先行文献中のパターン認識アルゴリズムおよび異なったピークピッキングに行われるように試みられている。同一物質から由来するデータポイントは、あるスキャン数間隔あるいは検出時間間隔およびある質量対電荷比間隔に位置している。そのようなスキャン数間隔は、[NION−ΔNdev、NION+ΔNdev]として示され、そのような検出時間間隔は、[tION−Δtdev、tION+Δtdev]として示され、またそのような質量対電荷比は、[m/zION−Δm/zdev、m/zION+Δm/zdev]として示され、そこでは、NION、tIONおよびm/zIONは、一般的に境界NION−ΔNdev、NION+ΔNdev、あるいはtION−Δtdev、tION+Δtdevあるいは、m/zION−Δm/zdev、m/zION+Δm/zdevを持っている各測定値間隔の中央値のみである。しかし、さらによく理解するためには、これらの値NION、tIONおよびm/zIONは、ある物質に対して測定される真の、あるいは特性的あるいは平均スキャン数、検出時間、あるいは質量対電荷比であると仮定するが、それは、個々のデータポイントが、平均値あるいは真の値の周りに対照的に分配されているときにのみ各間隔の中心値に対応する。
理解に役立つように、本発明の次の要約および説明および好ましい実施態様およびさらなる改良の要約および説明において、これらの例に参照を含めることにより、非限定的図示例がここで考慮されていることを、明確に参照する。この包含された要約および説明中には、参照質量対電荷比(質量対電荷比を参照)と共に、参照スキャン数(記述したスキャン数を参照)、あるいは参照検出時間(検出時間を参照)があり、さらに−適用するとすれば−質量スペクトル分析計により測定される参照イオン強度(イオン強度あるいは、イオンカウンターを参照)がある。さらに、参照として、スキャン数および検出時間に対する各測定値Ni、およびti(これらは、使用しても良い代替値である)、質量対電荷比に対する各測定値m/zi、および−適用するとすれば−イオン強度に対する各測定値li、とともに、上述した該表示における各測定値間隔がある。
この非限定的図示例に基づいたいくつかの参照としては、さらに意味を各文脈中に明確にするべきであるが、たとえば、NION;tION(各イオンの真の、あるいは特性値の、あるいは平均のそれぞれのスキャン数あるいは検出時間を参照)、m/zION(各イオンの真の、あるいは特性値の、あるいは平均の質量対電荷比を参照)、Δm/zi(各イオンの真の、あるいは特性値の、あるいは平均の質量対電荷比からの、質量対電荷比に対する各測定値のズレを参照)が、含まれる。この参照は、参照サインに関して従来の慣行と同様に、請求項中に含まれている。したがって、「コンマ」により隔てられた参照は、一般に共通に適用できる参照のリストとして見なければならないし、「セミコロン」により隔てられた参照は、一般に代替物として適用できる参照のリストとして見なければならない。
これらの参照は、本発明の理解の手助けをするためだけのものであり、また他の測定状況および他の分析および検出技術に対して、もちろん、他の言葉および参照が、これまで使用した参照の代わりに導入しなければならないという点は、強調するべきである。
さらなる注意としては、以下、測定するべきあるいは定量するべき量(あるいは変数)、あるいは複数の量(あるいは変数)および各量あるいは変数に対して測定されるあるいは定量される値あるいは複数の値のあいだは、完全に識別するように試みる。たとえば、ある電圧が関心事であれば、量あるいは変数電圧は、量として示され、各測定あるいは定量から得られた電圧値(たとえば、単位ボルトを有している)は、値として示される。先に考慮された非限定的図示例中において、スキャン数、検出時間、質量対電荷比およびイオン強度という言葉は、この意味において複数の量を参照し、またNi、ti、m/ziおよびliは、この意味で複数の値を参照する。これらの識別は、基本的には、理解の手助けをするものであり、ともかく本発明の範囲に対して限定的作用を持つものではないと考えるべきである。
第1態様によれば、本発明は、少なくとも1つの成分、特にそこに含まれている化学的成分、生物的成分あるいは生物化学的成分、および少なくとも1つの該技術を行うことから生じる生成物に関して、該サンプルを評価する特性化データを提供するために、2つ以上の技術を行うことにより、少なくとも1つのサンプルを分析する方法であって、
a)i)成分を分離するための、あるいは
ii)該第1分析技術あるいは少なくとも1つの第1分析技術を行うことにより生じる生成物を分離するための、あるいは
iii)該第1分析技術あるいは少なくとも1つの第1分析技術を行うことにより生じる成分および生成物を分離するための
少なくとも1つの第1分析技術を行う工程であって、該第1分析技術は、該サンプルに関して、あるいはすでに分離されている成分あるいは生成物に関して行われ、該分離は、該成分あるいは生成物の少なくとも1つの第1識別特性に基づいて行われることを特徴とする工程と、
b)既に分離された、あるいは分離中の成分あるいは生成物に関して、少なくとも1つのさらなる技術を行う工程であって、さらなる技術は、i)少なくとも1度工程a)を行うことにより得られる少なくとも1つの分離、および ii)少なくとも1つのさらなる識別特性のうちの少なくとも1つに基づいて、分離された成分あるいは生成物を特性づけるための少なくとも1つの分析技術および検出技術であることを特徴とする工程からなることを特徴とする方法であり;
少なくとも工程b)において、少なくとも2つの特性付け測定量(スキャン数、質量対電荷比;検出時間、質量対電荷比)と、少なくとも1度工程a)を行うことにより得られる該分離あるいは少なくとも1つの分離を反映する該特性付け測定量の少なくとも1つの第1(スキャン数;検出時間)と、i)少なくとも1度工程a)を行うことにより得られる少なくとも1つの他の分離と ii)該さらなる識別特性あるいはさらなる識別特性の少なくとも1つのうちの少なくとも1つを反映する該特性付け測定量の少なくとも1つのさらなる(質量対電荷比)と言う言葉で該成分あるいは生成物の少なくとも1つの特性付けを表示する測定データを提供する検出ハードウエアを使用することを特徴とし;
該方法は、
c)該特性付け測定量の少なくとも1つの該第1(スキャン数;検出時間)と言う言葉で、該特性付けあるいは少なくとも1つの特性付けを表示する少なくとも1つの各第1特性付け測定値(Ni、ti)と、該特性付け測定量の該少なくとも1つのさらなる(質量対電荷比)と言う言葉で、該特性付けあるいは少なくとも1つの特性付けを表示する少なくとも1つのさらなる各特性付け測定値(m/zi)とを互いに関連させることにより、検出ハードウエアにより提供される測定データに基づいて、データ組((Ni、m/zi);(ti、m/zi))を提供する工程と、
d)該データ組を、該特性付け測定量の少なくとも1つに対する特性付け測定値に関して、測定値を特性付ける特性付け測定値間隔([m/zION−Δm/zdev、m/zION+Δm/zdev]、[NION−ΔNdev、NION+ΔNdev];[m/zION−Δm/zdev、m/zION+Δm/zdev]、[tION−Δtdev、tION+Δtdev])で、該各間隔は、該成分あるいは生成物の1つの特定物に潜在的に関連しているきめられるものである測定値間隔にグループ分けする工程とからなり;
該グループ分けが、該成分あるいは生成物の該特定物に関連した真の、あるいは特性的な、あるいは平均の特性付け測定値(m/zION)からの各特性付け測定値(m/zi)のズレ(Δm/zi)の少なくとも1つの統計的分布に基づいて行われることを特徴とし;
さらに該方法は、
e)i)該グループ分けから得られるデータ組の群および ii)該グループ分けから得られた該特性付け測定値の少なくとも1つの間隔([m/zION−Δm/zdev、m/zION+Δm/zdev]、[NION−ΔNdev、NION+ΔNdev];[m/zION−Δm/zdev、m/zION+Δm/zdev]、[tION−Δtdev、tION+Δtdev])の少なくとも1つを反映しあるいは包含するデータの貯蔵、表示および印刷あるいはデータの可視化の少なくとも1つの工程と;
f)i)該グループ分けから得られるデータ組の群および ii)該グループ分けから得られた該特性付け測定値の少なくとも1つの間隔([m/zION−Δm/zdev、m/zION+Δm/zdev]、[NION−ΔNdev、NION+ΔNdev];[m/zION−Δm/zdev、m/zION+Δm/zdev]、[tION−Δtdev、tION+Δtdev])の少なくとも1つに基づいて、あるいは工程e)により貯蔵され、表示されあるいは印刷されたデータあるいは可視化に基づいて、該少なくとも1つのサンプルの解析あるいは該成分あるいは生成物の少なくとも1つ解析をする工程の少なくとも1つからさらになることを特徴とする方法を提供する(提案1)。
本発明の第1態様によれば、測定データのグループ分けは、成分あるいは生成物の特定物に関連している真の、あるいは特性的な、あるいは平均の特性付け測定値からの各特性付け測定値のズレの少なくとも1つの統計的分布に基づいて行われる。このアプローチに基づいて、非常に有効なグループ分けを、行うことが出来る。LC質量スペクトル分析法(LC−MS分析法)の例を参照して、質量対電荷比データ部分に対する適当な間隔を求めるために、すなわち、測定データに関して定められる対応する座標システムの質量対電荷比軸に沿って、適当な間隔を見出すために、本アプローチは、有利に採用できる。このような状況から、伝統的なあるいは従来の統計学のみならずベイジアン統計あるいは非頻度統計も有利に用いられる。
工程a)は、数回、同時にあるいは連続的に使用しても良いことを、指摘するべきである。工程b)は、工程a)による分離に類似の分離を包含しても良いし、あるいは少なくともそのような分離を行うために採用しても良い。1例として、分離を行うために採用される質量スペクトル分析法がある。しかし、もし異なった物質が、すでに分離されていれば、そのときには、該物質に関して質量スペクトル分析法を行うことは、必ずしもさらなる分離を生じるものではなく、その代わりに工程a)で行われる分離、おそらく少なくとも1つのクロマトグラフイーカラムなどをもちいることによる分離を反映するある検出時間あるいはスキャン数に対して、m/z軸の物質のマップを作ることのみに役立つ。
工程b)も数回、同時にあるいは連続的に行うことが出来る。さらに、測定状況および用いられる技術により、工程b)は、工程a)と同時に、あるいは重ねて行うことが出来る。1例として、誘導蛍光発光による電気泳動バンドのオンライン検出を用いる電気泳動法がある。このような測定状況において、電気泳動法は、物質を分離する。この分離に基づいて、該分離を表示する測定データは、工程b)にしたがって、得られる。
他の可能性は、工程a)も測定データを提供するために、検出ハードウエアの使用を包含することである。再び、適当な手段により検出される電気泳動法バンドのオンライン検出のできる電気泳動法の例を参照する。得られる分離に基づいて、蛍光発光バンドの検出からえられる特性付けのほかに、追加の特性付けが、工程b)にしたがって得られよう。
工程c)に関しては、データを体系化する可能性が多いことを注目すべきである。使用されるデータ構造には制限はなんらない。各データ組の特性付け測定値は、互いの関連性および各特性付け測定量に関して、各データ組の特性付け測定値を同定できることは、充分であるから、これらの特性付け測定値は、グループ分けにアクセスされよう。したがって、「データ組」という言葉ならびに互いの特性付け測定値の関連性は、機能的に理解されねばならないし、このような関連性およびアクセスの可能性を実行する、あるいは反映するあるいは可能にする可能性のあるデータ体系化を含んでいるものとする。
工程c)も工程d)も、同時に、あるいはともかく交互に配置して行っても良い。同じことは、工程d)および工程e)にも適用される。さらに、一方では工程d)あるいは/および工程e)また一方では工程f)は、同時に、あるいはともかく交互に配置して行っても良い。
該間隔は、一般的に成分あるいは生成物の1特定物に確実に関連して求められることに注目すべきである。本発明によるグループ分けの作業仮説は、成分あるいは生成物の1特定物にそれぞれ関連する間隔を求めるために、グループ分けが有効であるということである。しかし、作為があれば、あるいは最適の分析技術および検出技術を用いなければ、必ずしも悪い測定を排除できるものではない。エラーの可能性を考慮すると、本発明によるグループ分けは、成分あるいは生成物の1特定物に潜在的に関連する間隔を、ともかく求めるものである。これらの間隔が、成分あるいは生成物の1特定物に確かに関連するかどうかは、おそらく、分析されるべきサンプルあるいはサンプル群に関する現在の知識および参照データベース中に含まれる参照データベースを考慮して、さらなる実証工程で求められよう。
工程e)に関しては、該グループ分けにより得られるデータ組のグループあるいは/および該グループ分けにより得られる各特性付け測定値の間隔を反映するかあるいは含んでいる好ましくはデータのみ、あるいはデータの可視化が、貯蔵されあるいは/および表示されあるいは/および印刷されることを付け加えるべきであり、またグループあるいは間隔に入らない他のデータを捨てることを付け加えるべきである。このことは、データ削減に大いに役立つ。各グループのデータ組あるいは各間隔に入るデータ組ではなくて、グループあるいは間隔を記述するデータの代わりに、LC−MSデータの場合、たとえば平均m/z値、平均t値、あるいはN値および合計強度値(たとえば、全ての個々の強度の合計、データ組により定められる曲線の元にある領域に亙る積分、平均強度値、など)が、蓄えられれば、ある種のデータ圧縮という意味でのデータのさらなる削減は、得られるかもしれない。平均m/z値および平均t値、あるいはN値にさらに加えて、あるいはその代わりに、おそらく各間隔の境界を蓄えることにより、あるいは各間隔の中心値および幅を蓄えることにより、m/z間隔およびt間隔あるいはN間隔が、蓄えられる。しかし、特にもし大きなデータ貯蔵スペースが使用できるか、また高速のプロセッサが使用可能であれば、そのようなデータ削減およびデータ圧縮は必ずしも必要ではないことを強調するべきである。このような状況下に、そのようなデータのグループ分けは、データ解析に役立たせる価値が高い。たとえば、同一グループに属するデータ組は、異なる色を異なるグループに帰することにより、(たとえば虚偽の色あるいは幻影色表示から知られる)、データの可視化で同定され、その結果各サンプルあるいはサンプル類の定性的解析が、科学者あるいはオペレータがデイスプレイ上あるいはプリントアウト上での可視化で見えるのに役立つことになる。
少なくとも、工程d)による該グループ分けおよび一般的には、貯蔵、表示および印刷およびさらなる工程e)の解析、および一般的には、工程c)によるデータ組の提供は、適当なデータ処理配列、たとえばデータ処理ユニットあるいはデータ処理システムなど、あるいは汎用コンピュータあるいは測定および解析システムの制御ユニットにより、自動的に行われあるいは自動化される。科学者あるいはオペレータが、あるアクションをトリガーする、あるいはある処理工程に対する基礎として取り入れられるあるデータを入力することが、可能であろうが、そのようなグループ分けは、おそらく本発明を具現化するプログラム指示の制御の下に、該技術を行うことから得られる生データ測定に基づいて、人の作用を用いずに行われるものである。
好ましくは、工程d)による該グループ分けは、該成分あるいは生成物の該特定物に関連した真の、あるいは特性的な、あるいは平均の特性付け測定値(m/zION)からの各特性付け測定値のズレ(Δm/zi)の統計的分布を示す測定ズレの統計的分布に基づいて行われる(提案2)。
さらに、該間隔は、該ズレ(Δm/zi)の統計的分布により、該成分あるいは生成物の該特定物から由来する各特性付け測定値の全ての実質的量を含んでいる間隔に対応することが、示唆されている(提案3)。
有利にするために、該間隔は、該成分あるいは生成物の該特定物から由来する全ての特性付け測定値の実質的量を包含するために、該ズレ(Δm/zi)の統計的分布により予測される予測間隔であってもよい(提案4)。
もし該間隔が、初期化データに基づいて、および−工程d)によるグループ分けのうちに−該成分あるいは生成物の該特定物に由来し、またまだグループ分けされていないデータ組に属する全ての各特性付け測定値の実質的量を包含するために既にグループ分けされているデータ組に基づいて、該ズレ(Δm/zi)の統計的分布により予測される予測間隔、おそらく確信間隔であるとすれば、高度に有効なグループ分けが、得られよう(提案5)。好ましくは、ベイジアン統計をこの状況で使用する。いわゆるベイジアンを有利にするために、習得あるいは更新が使用され、現在の特性付け測定値を向上させる。
次元は、工程c)により提供されるデータ組に帰せられてもよい。これに関して、該データ組の1つの第1次元上に描かれる少なくとも1つの各第1特性付け測定値(Ni、ti)を包含するために、また該データ組の少なくとも1つの更なる次元上に描かれる少なくとも1つのさらなる各特性付け測定値(m/zi)を包含するために、該データ組は、工程c)中に発生されることが、提案されている(提案6)。これらの次元、たとえば適当な次元のアレーを反映するデータ構造を有利にするために使用しても良い。
工程d)に関しては、該データ組は、工程d)において、少なくとも2つの異なった特性付け測定量に対する特性付け測定値に関して特性付け測定値間隔([m/zION−Δm/zdev、m/zION+Δm/zdev]、[NION−ΔNdev、NION+ΔNdev];[m/zION−Δm/zdev、m/zION+Δm/zdev]、[tION−Δtdev、tION+Δtdev])にグループ分けされており、その中では、該グループ分けは、該少なくとも2つの異なった特性付け測定量の各々に対しての1つの特性付け測定値を含む間隔セット([m/zION−Δm/zdev、m/zION+Δm/zdev]、[NION−ΔNdev、NION+ΔNdev];[m/zION−Δm/zdev、m/zION+Δm/zdev]、[tION−Δtdev、tION+Δtdev])が、該成分あるいは生成物の該特定物に潜在的に関連して求められ、そこでは、該グループ分けは、該特性付け測定量の少なくとも1つに対する特性付け測定値の特性付け測定値間隔([m/zION−Δm/zdev、m/zION+Δm/zdev])に関して、該ズレ(Δm/zi)の統計的分布の少なくとも1つに基づいて行われるということをさらに提案している(提案7)。提案6を参照にして、少なくとも2つの異なった特性付け測定量に関連した該特性付け測定値は、該データ組の異なった次元上で描かれるであろう。
好ましくは、該グループ分けは、該さらなる特性付け測定量に対するさらなる特性付け測定値の特性付け測定値間隔([m/zION−Δm/zdev、m/zION+Δm/zdev])、あるいはさらなる特性付け測定値間隔としてここでも示されるさらなる特性付け測定値の少なくとも1つのさらなる特性付け測定量、該特性付け測定値間隔([m/zION−Δm/zdev、m/zION+Δm/zdev])に関して、該ズレ(Δm/zi)の統計的分布の少なくとも1つに基づいて行われる(提案8)。
測定状況および使用される技術により、該測定ハードウエアにより提供される該測定データは、時々、しばしば、あるいは一般的に、該検出ハードウエアにより検出されかつそれに関連する少なくとも1つの特性付け測定量を参照して、少なくとも1つの定量的測定量(イオン強度)と言う言葉で検出ハードウエアにより提供される少なくとも1つの定量化(イオン強度)を表示する定量的測定データを包含するであろう。この場合、該データ組は、少なくとも1つの各特性付け測定値を包含しても良い。この点に関して、該データ組((Ni、m/zi、li);(ti、m/zi、li))は、該定量化あるいは少なくとも1つの定量化(イオン強度)を表示する該少なくとも1つの各第1特性付け測定値(Ni、ti)と、該少なくとも1つのさらなる各特性付け測定値(m/zi)および少なくとも1つの定量的測定量(イオン強度)と言う言葉で、該定量化あるいは少なくとも1つの定量化(イオン強度)を表示する少なくとも1つの各定量的測定値(li)とを、互いに関連づけることにより提供されることを提案する(提案9)。この場合、該データ組は、該データ組の1つの第1次元上に描かれる少なくとも1つの各第1特性付け測定値(Ni、ti)を包含するために、該データ組の少なくとも1つの更なる次元上に描かれる少なくとも1つのさらなる各特性付け測定値(m/zi)を包含するために、また該データ組の少なくとも1つの他の次元上に描かれる少なくとも1つの該各特性付け測定値(li)を包含するために工程c)中に発生されてもよい(提案10)。
本発明の第2の態様を参照して、工程d)における該グループ分けは、複数の該定量的測定値(li)で各々は該データ組のそれぞれ1つに属している値の少なくとも1つの集約的特性に基づいて、さらに行われることを、さらに提案する(提案11)。
特に、該グループ分けは、複数の該定量的測定値から求められる全体の定量的尺度値よりなる少なくとも1つの集約的特性に基づいて、有利にするために行われても良い(提案12)。全体の定量的尺度値として、たとえば、複数の該定量的測定値、複数の該定量的測定値の和あるいは積などに対しての平均の定量的測定値が役立つかもしれない。「全体の定量的尺度値」という言葉の中の準語「尺度」は、全体の定量的尺度値が、組み合わせて考えられる該定量的測定値の全体特性を示す尺度として役立つことが出来ることを意味している。したがって、該定量的測定値あるいは該定量的測定値のいくつかの平均が、増加するかまた逆の場合に、全体の定量的測定値が減少することは、排除されない。たとえば、一方での全体的定量的測定値と他方での定量的測定値のあいだには、逆の関係がある。
さらに該グループ分けは、複数の該定量的測定値の少なくとも1つの各々をそれぞれ含むこれらのデータ組により直接にあるいは間接に定められる少なくとも1つの曲線あるいは柱状図の形状よりなる少なくとも1つの集約的特性に基づいて、追加的にあるいは2者択一的に、有利にするために行っても良い(提案13)。この場合、該少なくとも1つの曲線あるいは柱状図の形状が、準組値、おそらくはこれらの該データ組の組値より定められ、またそこでは、準組値、おそらくは組値がそれぞれ、複数の該定量的測定値の少なくとも1つの各値および少なくとも1つの各複数の該特性付け測定値を含み、少なくとも1つの特性付け測定値は、少なくとも1つの各定量的測定量に関連している少なくとも1つの特性付け測定量という言葉で少なくとも1つの該特性付けを表示している(提案14)。
提案11から14の少なくとも1つを参照して、工程d)に関しては、該データ組は、工程d)において、少なくとも2つの異なった特性付け測定量に対する特性付け測定値に関して特性付け測定値間隔([m/zION−Δm/zdev、m/zION+Δm/zdev]、[NION−ΔNdev、NION+ΔNdev];[m/zION−Δm/zdev、m/zION+Δm/zdev]、[tION−Δtdev、tION+Δtdev])にグループ分けされており、その中では、該グループ分けは、該少なくとも2つの異なった特性付け測定量の各々に対しての1つの特性付け測定値を含む間隔セット([m/zION−Δm/zdev、m/zION+Δm/zdev]、[NION−ΔNdev、NION+ΔNdev];[m/zION−Δm/zdev、m/zION+Δm/zdev]、[tION−Δtdev、tION+Δtdev])が、該成分あるいは生成物の該特定物に潜在的に関連して求められ、そこでは、該グループ分けは、該特性付け測定量の少なくとも1つに対する特性付け測定値の特性付け測定値間隔([NION−ΔNdev、NION+ΔNdev];[tION−Δtdev、tION+Δtdev])に関して、複数の該定量的測定値(li)の集約的特性に基づいて行われる(提案15)。提案10を参照にして、少なくとも2つの異なった特性付け測定量に関連した該特性付け測定値は、該データ組の異なった次元上で描かれるであろう。
有利にするために、該グループ分けは、該第1特性付け測定量あるいは少なくとも1つの該第1特性付け測定量に対する第1特性付け測定値間隔([NION−ΔNdev、NION+ΔNdev];[tION−Δtdev、tION+Δtdev])に関する該複数の該特性付け測定値(li)の集約的特性に基づいて行われ、ここにおける第1特性付け測定値の該特性付け測定値間隔([NION−ΔNdev、NION+ΔNdev];[tION−Δtdev、tION+Δtdev])は、該第1特性付け測定値間隔としても示される(提案16)。
提案9から16を参照して、工程e)に貯蔵され、表示されあるいは印刷されているデータは、該定量的測定量あるいは少なくとも1つの定量的測定量という言葉で該定量化あるいは少なくとも1つの定量化を表示する定量的情報を含むことがさらに示唆される(提案17)。該グループ分けから得られるデータ組の各グループに対して、少なくとも1つの各蓄積的定量値は、該定量的測定量あるいは少なくとも1つの定量的測定量という言葉で、該定量化あるいは少なくとも1つの定量化を表示するために各グループのデータ組中に含まれる定量的測定値に基づいて、由来するということを示唆している(提案18)。たとえば、平均定量値あるいは定量値の合計は、蓄積的定量値として使用しても良い。好ましくは、工程e)では、各蓄積的定量値は、蓄積的定量値がベースとしている蓄積的定量値の代わりに蓄えられる(提案19)。実質的なデータ圧縮が得られよう。提案1の工程e)に関する上記の註を参照のこと。
既に(提案11の状況の中で述べている)第2の態様にしたがって、本発明は、少なくとも1つの成分、特にそこに含まれている化学的成分、生物的成分あるいは生物化学的成分、および少なくとも1つの該技術を行うことから生じる生成物に関して、該サンプルを評価する特性化データを提供するために、2つ以上の技術を行うことにより、少なくとも1つのサンプルを分析する方法であって、
a)i)成分を分離するための、あるいは
ii)該第1分析技術あるいは少なくとも1つの第1分析技術を行うことにより生じる生成物を分離するための、あるいは
iii)該第1分析技術あるいは少なくとも1つの第1分析技術を行うことにより生じる成分および生成物を分離するための
少なくとも1つの第1分析技術を行う工程であって、該第1分析技術は、該サンプルに関して、あるいはすでに分離されている成分あるいは生成物に関して行われ、該分離は、該成分あるいは生成物の少なくとも1つの第1識別特性に基づいて行われることを特徴とする工程と、
b)既に分離された、あるいは分離中の成分あるいは生成物に関して、少なくとも1つのさらなる技術を行う工程であって、さらなる技術は、i)少なくとも1度工程a)を行うことにより得られる少なくとも1つの分離、および ii)少なくとも1つのさらなる識別特性のうちの少なくとも1つに基づいて、分離された成分あるいは生成物を特性づけるための少なくとも1つの分析技術および検出技術であることを特徴とする工程からなることを特徴とする方法であり;
少なくとも工程b)において、少なくとも2つの特性付け測定量(スキャン数、質量対電荷比;検出時間、質量対電荷比)と、少なくとも1度工程a)を行うことにより得られる該分離あるいは少なくとも1つの分離を反映する該特性付け測定量の少なくとも1つの第1(スキャン数;検出時間)と、i)少なくとも1度工程a)を行うことにより得られる少なくとも1つの他の分離と ii)該さらなる識別特性あるいはさらなる識別特性の少なくとも1つのうちの少なくとも1つを反映する該特性付け測定量の少なくとも1つのさらなる(質量対電荷比)と言う言葉で該成分あるいは生成物の少なくとも1つの特性付けを表示する測定データを提供する検出ハードウエアを使用することを特徴とし;
該検出ハードウエアにより提供される該測定データは、該検出ハードウエアにより検出されかつそれに関連する少なくとも1つの特性付け測定量を参照して、定量的測定量(イオン強度)と言う言葉で検出ハードウエアにより提供される少なくとも1つの定量化(イオン強度)を表示する定量的測定データを包含することを特徴とし、
該方法は、
c)該特性付け測定量の少なくとも1つの該第1(スキャン数;検出時間)と言う言葉で、該特性付けあるいは少なくとも1つの特性付けを表示する少なくとも1つの各第1特性付け測定値(Ni、ti)と、該特性付け測定量の該少なくとも1つのさらなる(質量対電荷比)と言う言葉で、該特性付けあるいは少なくとも1つの特性付けを表示する少なくとも1つのさらなる各特性付け測定値(m/zi)と、定量的測定量(イオン強度)と言う言葉で、該定量化あるいは少なくとも1つの定量化(イオン強度)を表示する少なくとも1つの各定量的測定値(li)とを互いに関連させることにより、検出ハードウエアにより提供される測定データに基づいて、データ組((Ni、m/zi、li);(ti、m/zi、li))を提供する工程と、
d)該データ組を、該特性付け測定量の少なくとも1つに対する特性付け測定値に関して、測定値を特性付ける特性付け測定値間隔([m/zION−Δm/zdev、m/zION+Δm/zdev]、[NION−ΔNdev、NION+ΔNdev];[m/zION−Δm/zdev、m/zION+Δm/zdev]、[tION−Δtdev、tION+Δtdev])で、該各間隔は、該成分あるいは生成物の1つの特定物に潜在的に関連しているきめられるものである測定値間隔にグループ分けする工程とからなり;
該グループ分けは、複数の該定量的測定値(li)で各々は該データ組のそれぞれ1つに属している値の少なくとも1つの集合的特性に基づいて、さらに行われることを特徴とし;
さらに該方法は、
e)i)該グループ分けから得られるデータ組の群および ii)該グループ分けから得られた該特性付け測定値の少なくとも1つの間隔([m/zION−Δm/zdev、m/zION+Δm/zdev]、[NION−ΔNdev、NION+ΔNdev];[m/zION−Δm/zdev、m/zION+Δm/zdev]、[tION−Δtdev、tION+Δtdev])の少なくとも1つを反映しあるいは包含するデータの貯蔵、表示および印刷あるいはデータの可視化の少なくとも1つの工程と;
f)i)該グループ分けから得られるデータ組の群および ii)該グループ分けから得られた該特性付け測定値の少なくとも1つの間隔([m/zION−Δm/zdev、m/zION+Δm/zdev]、[NION−ΔNdev、NION+ΔNdev];[m/zION−Δm/zdev、m/zION+Δm/zdev]、[tION−Δtdev、tION+Δtdev])の少なくとも1つに基づいて、あるいは工程e)により貯蔵され、表示されあるいは印刷されたデータあるいは可視化に基づいて、該少なくとも1つのサンプルの解析あるいは該成分あるいは生成物の少なくとも1つ解析をする工程の少なくとも1つからさらになることを特徴とする方法を提供する(提案20)。
第2態様によれば、本発明は、複数の該定量的測定量の少なくとも1つの集約的特性、および該データ組の各1つに属する該複数の該定量的測定量の各々に基づいて該測定データのグループ分けをすることを提案する。このアプローチに基づいて、非常に有効なグループ分けを、行うことが出来る。LC−MS分析法の例を参照して、時間あるいはスキャン数部分に対する適当な間隔を求めるために、すなわち、測定データに関して定められる対応する座標システムの時間あるいはスキャン数軸に沿って、適当な間隔を見出すために、本アプローチは、有利に採用できる。
工程a)は、数回、同時にあるいは連続的に使用しても良いことを、指摘するべきである。工程b)は、工程a)による分離に類似の分離を包含しても良いし、あるいは少なくともそのような分離を行うために採用しても良い。1例として、分離を行うために採用される質量スペクトル分析法がある。しかし、もし異なった物質が、すでに分離されていれば、そのときには、該物質に関して質量スペクトル分析法を行うことは、必ずしもさらなる分離を生じるものではなく、その代わりに工程a)で行われる分離、おそらく少なくとも1つのクロマトグラフイーカラムなどをもちいることによる分離を反映するある検出時間あるいはスキャン数に対して、m/z軸の物質のマップを作ることのみに役立つことになる。
工程b)も数回、同時にあるいは連続的に行うことが出来る。さらに、測定状況および用いられる技術により、工程b)は、工程a)と同時に、あるいは重ねて行うことが出来る。1例として、誘導蛍光発光による電気泳動バンドのオンライン検出を用いるキャピラリー電気泳動法(CE)がある。このような測定状況において、電気泳動法は、物質を分離する。この分離に基づいて、該分離を表示する測定データは、工程b)にしたがって、得られる。
他の可能性は、工程a)も測定データを提供するために、検出ハードウエアの使用を包含することである。再び、適当な手段により検出される電気泳動法バンドのオンライン検出のできる電気泳動法の例を参照する。得られる分離に基づいて、蛍光発光バンドの検出からえられる特性付けのほかに、追加の特性付けが、工程b)にしたがって得られよう。
工程c)に関しては、データを体系化する可能性が多いことを注目すべきである。使用されるデータ構造には制限はなんらない。各データ組の特性付け測定値は、互いの関連性および各特性付け測定量に関して、各データ組の特性付け測定値を同定できることは、充分であるから、これらの特性付け測定値は、グループ分けにアクセスされよう。したがって、「データ組」という言葉ならびに互いの特性付け測定値の関連性は、機能的に理解されねばならないし、このような関連性およびアクセスの可能性を実行する、あるいは反映するあるいは可能にする可能性のあるデータ体系化を含んでいるものとする。
工程c)も工程d)も、同時に、あるいはともかく交互に配置して行っても良い。同じことは、工程d)および工程e)にも適用される。さらに、一方では工程d)あるいは/および工程e)また一方では工程f)は、同時に、あるいはともかく交互に配置して行っても良い。
該間隔は、一般的に成分あるいは生成物の1特定物に確実に関連して求められることに注目すべきである。本発明によるグループ分けの作業仮説は、成分あるいは生成物の1特定物にそれぞれ関連する間隔を求めるために、グループ分けが有効であるということである。しかし、作為があれば、あるいは最適の分析技術および検出技術を用いなければ、必ずしも悪い測定を排除できるものではない。エラーの可能性を考慮すると、本発明によるグループ分けは、成分あるいは生成物の1特定物に潜在的に関連する間隔を、ともかく求めるものである。これらの間隔が、成分あるいは生成物の1特定物に確かに関連するかどうかは、おそらく、分析されるべきサンプルあるいはサンプル群に関する現在の知識および参照データベース中に含まれる参照データベースを考慮して、さらなる実証工程で求められよう。
工程e)に関しては、該グループ分けにより得られるデータ組のグループあるいは/および該グループ分けにより得られる各特性付け測定値の間隔を反映するかあるいは含んでいる好ましくはデータのみ、あるいはデータの可視化が、貯蔵されあるいは/および表示されあるいは/および印刷されることを付け加えるべきであり、またグループあるいは間隔に入らない他のデータを捨てることを付け加えるべきである。このことは、データ削減に大いに役立つ。各グループのデータ組あるいは各間隔に入るデータ組ではなくて、グループあるいは間隔を記述するデータの代わりに、LC−MSデータの場合、たとえば平均m/z値、平均t値、あるいはN値および合計強度値(たとえば、全ての個々の強度の合計、データ組により定められる曲線の元にある領域に亙る積分、平均強度値、など)が、蓄えられれば、ある種のデータ圧縮という意味でのデータのさらなる削減は、得られるかもしれない。平均m/z値および平均t値、あるいはN値にさらに加えて、あるいはその代わりに、おそらく各間隔の境界を蓄えることにより、あるいは各間隔の中心値および幅を蓄えることにより、m/z間隔およびt間隔あるいはN間隔が、蓄えられる。しかし、特にもし大きなデータ貯蔵スペースが使用できるか、また高速のプロセッサが使用可能であれば、そのようなデータ削減およびデータ圧縮は必ずしも必要ではないことを強調するべきである。このような状況下に、そのようなデータのグループ分けは、データ解析に役立たせる価値が高い。たとえば、同一グループに属するデータ組は、異なる色を異なるグループに帰することにより、(たとえば虚偽の色あるいは幻影色表示から知られる)、データの可視化で同定され、その結果各サンプルあるいはサンプル類の定性的解析が、科学者あるいはオペレータがデイスプレイ上あるいはプリントアウト上での可視化で見えるのに役立つことになる。
少なくとも、工程d)による該グループ分けおよび一般的には、貯蔵、表示および印刷およびさらなる工程e)の解析、および一般的には、工程c)によるデータ組の提供は、適当なデータ処理配列、たとえばデータ処理ユニットあるいはデータ処理システムなど、あるいは汎用コンピュータあるいは測定および解析システムの制御ユニットにより、自動的に行われあるいは自動化される。科学者あるいはオペレータが、あるアクションをトリガーする、あるいはある処理工程に対する基礎として取り入れられるあるデータを入力することが、可能であろうが、そのようなグループ分けは、おそらく本発明を具現化するプログラム指示の制御の下に、該技術を行うことから得られる生データ測定に基づいて、人の作用を用いずに行われるものである。
有利にするために、複数の該定量的測定値から求められる全体の定量的尺度値よりなる少なくとも1つの集約的特性に基づいて、該グループ分けは、行われても良い(提案21)。全体の定量的尺度値として、たとえば、複数の該定量的測定値、複数の該定量的測定値の和あるいは積などに対しての平均の定量的測定値が役立つかもしれない。「全体の定量的尺度値」という言葉の中の準語彙「尺度」は、全体の定量的尺度値が、組み合わせて考えられる該定量的測定値の全体特性を示す尺度として役立つことが出来ることを意味している。したがって、該定量的測定値あるいは該定量的測定値のいくつかの平均が、増加するかまた逆の場合に、全体の定量的測定値が減少することは、排除されない。たとえば、一方での全体的定量的測定値と他方での定量的測定値のあいだには、逆の関係があるようである。
追加的にあるいは2者択一的に、該グループ分けは、複数の該定量的測定値の少なくとも1つの各々をそれぞれ含むこれらのデータ組により直接にあるいは間接に定められる少なくとも1つの曲線あるいは柱状図の形状よりなる少なくとも1つの集約的特性に基づいて、有利にするために行っても良い(提案22)。
該少なくとも1つの曲線あるいは柱状図の形状が、準組値、おそらくはこれらの該データ組の組値より定められ、またそこでは、準組値、おそらくは組値がそれぞれ、複数の該定量的測定値の少なくとも1つの各値および少なくとも1つの各複数の該特性付け測定値を含み、少なくとも1つの特性付け測定値は、少なくとも1つの各定量的測定量に関連している少なくとも1つの特性付け測定量という言葉で少なくとも1つの該特性付けを表示している(提案23)。
工程c)を参照して、該データ組は、該データ組の1つの第1次元上に描かれる少なくとも1つの各第1特性付け測定値(Ni、ti)を包含するために、該データ組の少なくとも1つの更なる次元上に描かれる少なくとも1つのさらなる各特性付け測定値(m/zi)を包含するために、また該データ組の少なくとも1つの他の次元上に描かれる少なくとも1つの該各特性付け測定値(li)を包含するために工程c)中に発生されてもよい(提案24)。
工程d)を参照して、該データ組は、工程d)において、少なくとも2つの異なった特性付け測定量に対する特性付け測定値に関して特性付け測定値間隔([m/zION−Δm/zdev、m/zION+Δm/zdev]、[NION−ΔNdev、NION+ΔNdev];[m/zION−Δm/zdev、m/zION+Δm/zdev]、[tION−Δtdev、tION+Δtdev])にグループ分けされており、その中では、該グループ分けは、該少なくとも2つの異なった特性付け測定量の各々に対しての1つの特性付け測定値を含む間隔セット([m/zION−Δm/zdev、m/zION+Δm/zdev]、[NION−ΔNdev、NION+ΔNdev];[m/zION−Δm/zdev、m/zION+Δm/zdev]、[tION−Δtdev、tION+Δtdev])が、該成分あるいは生成物の該特定物に潜在的に関連して求められ、そこでは、該グループ分けは、該特性付け測定量の少なくとも1つに対する特性付け測定値の特性付け測定値間隔([NION−ΔNdev、NION+ΔNdev];[tION−Δtdev、tION+Δtdev])に関して、該複数の該特性付け測定値(li)の該集約的特性に基づいて行われるということを示唆している(提案25)。提案24を参照にして、少なくとも2つの異なった特性付け測定量に関連した該特性付け測定値は、該データ組の異なった次元上で描かれるであろう。
好ましくは、該グループ分けは、該第1特性付け測定量、あるいは少なくとも1つの第1特性付け測定量に対する第1特性付け測定値の特性付け測定値間隔([NION−ΔNdev、NION+ΔNdev];[tION−Δtdev、tION+Δtdev])に関する該複数の該特性付け測定値(li)の集約的特性に基づいて行われ、ここでの第1特性付け測定値の特性付け測定値間隔([NION−ΔNdev、NION+ΔNdev];[tION−Δtdev、tION+Δtdev])は、第1特性付け測定値間隔としても示される(提案26)。
一般的に、工程e)に貯蔵され、印刷されあるいは表示されているデータは、該定量的測定量あるいは少なくとも1つの定量的測定量という言葉で、該定量化あるいは少なくとも1つの定量化を表示する定量的情報を含むであろう(提案27)。
さらに、該グループ分けから得られるデータの各グループに対して、少なくとも1つの各蓄積的定量値は、該定量的測定量あるいは少なくとも1つの定量的測定量という言葉で、該定量化あるいは少なくとも1つの定量化を表示するために、各グループのデータ組中に含まれる定量的測定値に基づいて、由来するということを示唆している(提案28)。好ましくは、工程e)では、各蓄積的定量値は、蓄積的定量値がベースとしている蓄積的定量値の代わりに蓄えられる(提案29)。実質的なデータ圧縮を得ることができる。提案20の工程e)に関する上記の註を参照のこと。
本発明の第1態様を参照して、工程d)における該グループ分けは、該成分あるいは生成物の該特定物に関連した真の、あるいは特性的な、あるいは平均の各特性付け測定値(m/zION)からの各特性付け測定値(m/zi)のズレ(Δm/zi)の少なくとも1つの統計的分布に基づいて、さらに行われるということをさらに示唆している(提案30)。
工程e)における該グループ分けは、利益を得るために、該成分あるいは生成物の該特定物に関連した真の、あるいは特性的な、あるいは平均の各特性付け測定値(m/zION)からの各特性付け測定値のズレ(Δm/zi)の少なくとも1つの統計的分布に基づいて、行われてもい(提案31)。
該グループ分けが参照する該間隔は、ズレ(Δm/zi)の該統計的分布により、該成分あるいは生成物の該特定物から由来する各特性付け測定値の全ての実質的量を含んでいる間隔に対応してもよい(提案32)。
もし該間隔が、該成分あるいは生成物の該特定物から由来する全ての特性付け測定値の実質的量を包含するために、該ズレ(Δm/zi)の統計的分布により予測される予測間隔であるとすると、高度に有効なグループ分けが、達成されよう(提案33)。
特に、該間隔は、初期化データに基づいて、および−工程d)によるグループ分けのうちに−該成分あるいは生成物の該特定物に由来し、またまだグループ分けされていないデータ組に属する全ての各特性付け測定値の実質的量を包含するために既にグループ分けされているデータ組に基づいて、該ズレ(Δm/zi)の統計的分布により予測される予測間隔、おそらく確信間隔である(提案34)。
提案32から34の少なくとも1つを参照して、該データ組は、工程d)において、少なくとも2つの異なった特性付け測定量に対する特性付け測定値に関して、特性付け測定値間隔([m/zION−Δm/zdev、m/zION+Δm/zdev]、[NION−ΔNdev、NION+ΔNdev];[m/zION−Δm/zdev、m/zION+Δm/zdev]、[tION−Δtdev、tION+Δtdev])にグループ分けされており、その中では、該グループ分けは、該少なくとも2つの異なった特性付け測定量の各々に対しての1つの特性付け測定値を含む間隔セット([m/zION−Δm/zdev、m/zION+Δm/zdev]、[NION−ΔNdev、NION+ΔNdev];[m/zION−Δm/zdev、m/zION+Δm/zdev]、[tION−Δtdev、tION+Δtdev])が、該成分あるいは生成物の該特定物に潜在的に関連して求められるように行われ、そこでは、該グループ分けは、該少なくとも1つの該特性付け測定量に対する特性付け測定値の特性付け測定値間隔([m/zION−Δm/zdev、m/zION+Δm/zdev])に関して、該ズレ(Δm/zi)の少なくとも1つの統計的分布に基づいて行われるということを、さらに示唆している(提案35)。提案24を参照にして、少なくとも2つの異なった特性付け測定量に関連した該特性付け測定値は、該データ組の異なった次元上で描かれるであろう。
好ましくは、該グループ分けは、該さらなる特性付け測定量あるいは少なくとも1つのさらなる特性付け測定量に対するさらなる特性付け測定値の特性付け測定値間隔([m/zION−Δm/zdev、m/zION+Δm/zdev])に関して、該ズレ(Δm/zi)の少なくとも1つの統計的分布に基づいて行われ、ここでのさらなる特性付け測定値の該特性付け測定値間隔([m/zION−Δm/zdev、m/zION+Δm/zdev])は、さらなる特性付け測定値間隔としてここでも示されている(提案36)。
本発明の第1態様による該1から19および本発明の第2態様による該20から36を参照にして、本発明の第1態様によるおよび本発明の第2態様によるアプローチは、提案11から16および提案30から36により明確に示唆されているように、組み合わせて実現される。しかし、該アプローチ(本発明の第1態様によるアプローチおよび本発明の第2態様によるアプローチ)の1つのみに基づいて、先行技術の解と比較した主たる改良が、達成されよう。
該提案のいずれかを参照して、該データ組は、該グループ分けの過程で、決められたアクセススケジュールにより、アクセスされるということをさらに提案している(提案37)。特に、該データ組あるいは1つのデータ組の少なくとも1つの準組のデータ組が、該特性付け測定量の少なくとも1つに対する特性付け測定値により、好ましくは、該第1特性付け測定量により、支配されるシーケンスにおいてアクセスされよう(提案38)。有利にするために、該データ組あるいは該データ組の少なくとも1つの準組のデータ組は、特性付け測定値を増加あるいは減少させるために、アクセスされよう(提案39)。
本発明の第2態様を参照して(提案11と20を比較)およびこの点での追加の提案(提案12から16および提案21から29の比較)を参照して、さらなる利点に導くさらなる提案を次に述べる。
少なくとも提案14から23を参照して、該柱状図あるいは曲線は、複数の該特性付け測定値および該複数の各特性付け測定値に関連している少なくとも1つの各特性付け測定値により直接にあるいは間接に定められ、特性付け測定値は、それぞれ、強度値、収率値、量値、カウント値、確率値、あるいは強度、収率、量、カウント、確率などの少なくとも1つの特性付け測定量という言葉で測定される、また各少なくとも1つの特性付け測定値を参照して測定される他の定量値として解釈されるということをさらに示唆している(提案40)。追加的にあるいは2者択一的に、グループ分けが根拠としている該曲線あるいは少なくとも1つの曲線が、これらのデータ組により、あるいは1)該特性付け測定値が、該データ組、あるいは該準組値、あるいは対値中に含まれている少なくとも1つの特性付け測定量および2)該特性付け測定値が、該データ組、あるいは該準組値、あるいは対値中に含まれている少なくとも1つの定量的測定量の少なくとも1つの言葉で不連続の不連続曲線として直接に、該準組値、あるいは対値により、定められることを示唆している(提案41)。さらに追加的にあるいは代替的に、グループ分けが根拠としている該曲線あるいは少なくとも1つの曲線が、これらのデータ組により、あるいは1)該特性付け測定値が、該データ組、あるいは該準組値、あるいは対値中に含まれている少なくとも1つの特性付け測定量および2)該特性付け測定値が、該データ組、あるいは該準組値、あるいは対値中に含まれている少なくとも1つの定量的測定量の少なくとも1つの言葉で連続である連続曲線として直接に、あるいは間接に、該準組値、あるいは対値により、定められることを示唆している(提案42)。
もし該グループ分けが、少なくとも1つの先鋭性条件が該複数の該特性付け測定値の各々の少なくとも1つをそれぞれ含むこれらのデータ組に対して、あるいは該準組値、あるいは対値に対し、あるいは該曲線あるいは柱状図に対して、実行するかどうかを決定するための少なくとも1つの先鋭性チェックを行うことを包含する場合には、該少なくとも1つの集約的特性に基づいた高度に有効なグループ分けを得ることが出来る(提案43)。追加的にあるいは代替的に、該グループ分けが、少なくとも1つの先鋭性条件が該複数の該特性付け測定値の各々の少なくとも1つをそれぞれ含むこれらのデータ組に対して、あるいは該準組値、あるいは対値に対し、あるいは該曲線あるいは柱状図に対して、実行するかどうかを決定するための少なくとも1つの単一モード性チェックを行うことを包含することを示唆している(提案44)。ただ唯一の最大値があるとすれば、柱状図あるいは曲線および対応した該複数の定量的測定値を持っている該データ組が、単一モード化される。該単一モード性チェックは、該成分あるいは生成物の1特定物からまったく起因するピークおよび用いた技術の人工物などにより生じる他のピークのあいだを識別するためには、強力である。
原理上、この単一モード性チェックをどのようにして実行するかという点で異なった可能性がある。好ましい実施の態様により、該単一モード性チェックは、他方では参照関数と、一方ではこれらのデータ組の比較、あるいは該準組値、あるいは対値の比較、あるいは、該曲線あるいは柱状図の比較を含んでおり、該比較関数は、これらのデータ組、あるいは該準組値、あるいは対値、あるいは該曲線あるいは柱状図に基づいて求められ、そこでは、一方ではこれらのデータ組、あるいは該準組値、あるいは対値の比較、あるいは、該曲線あるいは柱状図と、他方では参照関数との点状の差は、該複数の該定量的測定値に関連している該複数の該特性付け測定値の全てあるいはある部分に対して計算され、そこでは、参照関数は、これらのデータ組、あるいは該準組値、あるいは対値の比較、あるいは、該曲線あるいは柱状図に基づいて求められるので、計算される点状差の最大点状差あるいは計算される点状差の点状差合計は、単一モード性条件の実行あるいは非実行に対する尺度となる(提案45)。該参照関数は、第1中間関数を得るために積分あるいは和により、第1中間関数への最近接単一モード関数である第2中間関数を見出すことにより、また該第2中間関数を微分することにより、あるいは参照関数を得るために該第2中間関数からの差を計算することにより、これらのデータ組、あるいは該準組値、あるいは対値の比較、あるいは、該曲線あるいは柱状図から計算しても良い(提案46)。
提案45あるいは46を参照して、該グループ分けにおいて、該複数の該特性付け測定値のズレあるいは該参照関数の対応値からの該曲線あるいは柱状図の対応する値のズレを反映する少なくとも1つのズレ尺度値が、計算されることが、さらに示唆される(提案47)。
一般的に、該単一モード性チェックは実施できるので、もし単一モード性条件は、該ズレ尺度値が、閾値ズレ尺度値に満たされないでかつ実施されないと決められると、もし該全体のズレ尺度値が、該閾値ズレ尺度値を越えるか、該単一モード性条件が実行されないと決定されると、もし該全体のズレ尺度値が、ある閾値ズレ尺度値に足りなくて、実行されると決定されると、もし該全体のズレ尺度値が、該閾値ズレ尺度値を越えると、該単一モード性条件は、実行されると決定される(提案48)。語彙「ズレ尺度値」中の準語彙「尺度」は、該参照値から該定量的測定量のズレを反映する値は、原理上ズレ尺度値として使用されるということを表明しようとするものである。したがって、ズレ尺度値は、全てのズレ(たとえば、点状差のいくつか)と共に増加するか、あるいは−逆の関係が取れるのならば−ズレの増加と共に減少しよう。しかし、好ましくは、該最大点状差あるいは該点状差は、該ズレ尺度値として計算される(提案49)。その他、該先鋭性チェックあるいは/および単一モード性チェックに好ましくはさらに追加して、該成分あるいは生成物の1つの特定物の関連するデータポイントあるいは間隔の間違った決定を避けるために、用いても良い。たとえば、第r次の条件の少なくとも1つの中央値が、該複数の該定量的測定量の少なくとも1つの各値をそれぞれ含むこれらのデータ組に対して、あるいは該準組値、あるいは対値あるいは該曲線あるいは柱状図に対して、実行するかどうかを決定するための少なくとも1つの中央モーメントチェックを行うことを含んでも良い(提案50)。特に、異なった次元の複数の中央モーメントのあいだの関係に基づいて少なくとも1つの条件が、該複数の該定量的測定量の少なくとも1つの各量をそれぞれ含むこれらのデータ組に対して、あるいは該準組値、あるいは対値あるいは該曲線あるいは柱状図に対して、実行するかどうかを決定するための少なくとも1つの中央モーメントチェックを行うことを、該グループ分けは、含んでいることを示唆している(提案51)。
好ましい実施の態様によると、該グループ分けは、少なくとも1つの尖度条件が、該複数の該定量的測定量の少なくとも1つの各量をそれぞれ含むこれらのデータ組に対して、あるいは該準組値、あるいは対値あるいは該曲線あるいは柱状図に対して、実行するかどうかを決定するための少なくとも1つの尖度チェックを行うことを含んでいる(提案52)。測定値用に求められるいわゆる尖度に基づいたグループ分けすることは、該成分あるいは生成物の1つの特定物からまさに由来する該データにおけるピークと応用される技術の人工物によって生じる他のピークとを識別するために、高度に有効である。
ここで尖度を参照することは、統計上の尖度の定義、すなわち分布の第4中心モーメントを分布の第2中心モーメントの2乗で割ったものを反映しあるいは対応する測定の特性付けを含むものとする。
しかし、原理上、尖度チェックの実施の仕方には多くの方法がある。この点に関しては、もし尖度尺度値が、閾値尺度値に足りなくてかつ実行しないと決める場合には、もし尖度尺度値が、閾値尺度値に足りなくてかつ実行すると決める場合には、もし該尖度尺度値が、閾値尺度値を超える場合には、該尖度条件は、実行されると決めるのが、好ましい(提案53)。
概して、該少なくとも1つの集約的特性に基づいた該グループ分けは、これらのデータ組に基づいた、あるいは該準組値、あるいは対値に基づいた、あるいは該曲線あるいは柱状図に基づいた第2次中心モーメントおよび第4次中心モーメントの少なくとも1つを計算することを包含しても良い(提案54)。好ましくは、該グループ分けは、これらのデータ組に基づいた、あるいは該準組値、あるいは対値に基づいた、あるいは該曲線あるいは柱状図に基づいた第2次中心モーメントおよび第4次中心モーメントを計算すること、および第2次中心モーメントの2乗に対する第4次中心モーメントの比を計算することを包含する(提案55)。尖度チェックおよび尖度条件に関しては、第2次中心モーメントの2乗に対する第4次中心モーメントの該比は、該尖度尺度値として使用されることが示唆される(提案56)。
概して、該グループ分け、特に本発明の第2の態様による該グループ分けは、該複数の該定量的測定値と関連した特性付け測定値の直接あるいは間接の比較を包含し、あるいは該複数の定量的測定値の少なくとも1つの各値をそれぞれ含むこれらのデータ組の直接あるいは間接の比較を包含し、あるいは一方では該準組値、あるいは対値、あるいは該曲線あるいは柱状図の、他方では、真の、特性的な、あるいは平均特性付け測定値(NION;tION)の付近の特性付け測定値に対する期待定量的測定値の統計分布との直接あるいは間接の比較を包含しても良い(提案57)。
もし該グループ分けが、少なくとも1つの中心傾向条件が、該複数の該定量的測定量の少なくとも1つの各量をそれぞれ含むこれらのデータ組に対して、あるいは該準組値、あるいは対値あるいは該曲線あるいは柱状図に対して、実行するかどうかを決定するための少なくとも1つの中央傾向チェックを行うことを包含するとすれば、それも正当であろう(提案58)。「中央傾向」という語彙は、分布のいわゆる「位置」とする。該位置に対する尺度は、たとえば、いくらかの「平均値」(たとえば、数平均、幾何平均、調和平均あるいは一般化平均)あるいは各測定値の単純和であっても良い。
好ましい実施態様によれば、該グループ分けは、少なくとも1つの定量的条件、あるいは強度条件が、該複数の該定量的測定量の少なくとも1つの各量をそれぞれ含むこれらのデータ組に対して、あるいは該準組値、あるいは対値あるいは該曲線あるいは柱状図に対して、実行するかどうかを決定するために、少なくとも1つの定量的チェックあるいは強度チェックを行うことを包含する(提案59)。
提案58および59の少なくとも1つを参照して、該グループ分けにおいて、該複数の定量的測定値は、全体の定量的測定値あるいは全体強度尺度値に結び付けられていることを示唆している(提案60)。有利にするために、該全体的定量的測定値に対する該定量的測定値の結びつけは、あるいは全体強度尺度値は、少なくとも1つの背景値あるいはベースライン値を含み、そこでは、該定量的測定値は、該複数の定量的測定値と背景値あるいはベースライン値あるいいは各背景値あるいはベースライン値との間の差の結びつきに対応している(提案61)。好ましくは、該複数の定量的測定値あるいは差は、該全ての定量的測定値あるいは全ての強度尺度値にさらに結びついている(提案62)。
原理上、該中央傾向条件および該定量化条件をどのようにして実行できるかについては、多くの可能性がある。この点に関しては、もし該全体的定量的測定値あるいは全体的強度尺度値が、閾値定量的測定値あるいは閾値強度尺度値を越えてかつ実行されないと決定される場合には、もし該全体的定量的測定値あるいは全体的強度尺度値が、該閾値定量的測定値あるいは閾値強度尺度値に足りなくて、あるいは、該中央傾向条件あるいは該定量化条件、あるいは該強度条件は、実行されないと決定される場合には、もし該全体的定量的測定値あるいは全体的強度尺度値が、閾値定量的測定値あるいは閾値強度尺度値を越えてかつ実行されると決定される場合には、もし該全体的定量的測定値あるいは全体的強度尺度値が、閾値定量的測定値あるいは閾値強度尺度値に足りない場合には、該中央条件あるいは該定量化条件あるいは強度条件を実行することが決められることを提案している(提案63)。再び、準語彙「尺度」は、どのように「尺度値」を定義づけるかという制限は原理上ないので、「尺度値」を増加させるかあるいは減少させるかということは、個々の条件をよりよく実行することを示しているという可能性を考慮に入れて、使用される。
本発明の第2の態様(提案11および20を比較)による該グループ分けは、有利にするために、次の工程を含んでも良い(提案64)。
d3)あらかじめ定められたアクセススケジュールにより、該データ組あるいは該あるいは該データ組の部分集合の少なくとも1つのデータ組にアクセスする工程と;
d5)少なくとも1つのアクセスされたデータ組を、該成分あるいは生成物の1つの特定物に関連しているデータ組の各群の最初のあるいはさらなる候補メンバーとして同定し、必要により、該同定は、少なくとも1つの同定条件の実施に依存している工程と
d6)もしある停止基準あるいは停止基準の少なくとも1つが、実施されると、
i)グループわけを停止する工程と;を包含し、
工程d6)が、達成されるまで、工程d3)からd5)を反復することを特徴とする方法。
工程d3)、d5)およびd6)による本グループ分けも、本発明の第1の態様によるグループ分けを包含しても良い。
1つの中止基準は、同定条件に基づいても良い。たとえば、1つの中止基準によると、アクセスされたデータ組あるいは巧くあるいは同時にアクセスされるデータ組の決められた数が、同定条件を実行しない場合には、このグループ分けは、中止される(提案64a)。さらに、測定データの構成にもよるが、アクセス工程d3)でアクセスされる少なくとも1つの各データ組の有無に基づく中止条件があってもよい。このような中止基準により、もし1つのアクセス工程d3)中で、あるいはアクセス工程d3)の決められた数の中で、検出ハードウエアによる検出を表示する適切な測定データを含むデータ組を、見出すことが出来ない場合には、このグループ分けは、中止される(提案64b)。
該成分あるいは生成物の1つの特定物に関係する(あるいは、潜在的に関係する)複数のグループあるいはデータ組は、同時に考慮するように付け加えるべきである。アクセス工程d3)によるアクセスは、アクセスされたデータ組が、既に確立されたデータ組のグループに、あるいは、既に確立されたデータ組のグループの1つに、加えられるという結果、あるいは第1のデータ組あるいはデータ組の1つの追加のグループが、このデータ組に基づいて確立されるという結果を持っても良い。
好ましくは(提案65)、準工程d5)は、さらに、
iii)少なくとも1つの確認条件を、該成分あるいは生成物の1つの特定物に関連するデータ組の該各グループの複数の候補メンバーに適用し、該複数の候補メンバーは、もし該少なくとも1つの確認条件が該候補メンバーに対して、集約的に実行されるとき、該グループの確認された候補メンバーとなることを特徴とする準工程;あるいは
iii')少なくとも1つの確認条件を、該成分あるいは生成物の1つの特定物に関連するデータ組の複数の候補および該各グループの確認されたメンバーに適用し、各候補メンバーは、もし該少なくとも1つの確認条件が該候補および確認されたメンバーに対して、集約的に実行されるとき、該グループの確認されたメンバーとなることを特徴とする準工程を含む。
さらに、該グループに付加された第1候補メンバーは、該グループから削除され、あるいはそこでは、もし該複数の候補メンバーに対して、少なくとも1つの確認条件が集約的に実行されないとき、該グループは、削除される(提案66)。該少なくとも1つの候補メンバーは、もし該複数の確認された候補メンバーに対して、該確認条件が集約的に実行されないとき、該グループから削除される(提案67)。
工程d6)を参照にして、ひとつの中止基準は、該少なくとも1つの確認条件からなり、該中止基準は、もし該確認条件が、該複数の候補メンバーに対して、あるいは少なくとも1つの追加的候補メンバーとともに複数の確認されるメンバーに対して集約的に実行されないとき、実行されるように決定される(提案68)。
該確認条件およびしたがってグループ分けは、複数の定量的測定値の少なくとも1つの集約的特性上の利点に基づいていてもよく、各々は、該候補あるいは確認されるメンバーの各1つに属している(提案69)。本提案は、提案11および20による一般的アプローチの特別な実施態様(工程d)と比較)、すなわち、本発明の第2の態様の解の実施態様であると考えられるものである。特に、該確認条件は、該候補あるいは確認されるメンバーに属する該複数の該定量的測定値から求められる全体定量的尺度値からなる少なくとも1つの集約的特性に基づいていても良い(提案70;提案12および21を比較)。さらに、該確認条件は、該候補あるいは確認されるメンバーにより直接あるいは間接に定められる少なくとも1つの曲線あるいは柱状図の形状からなる少なくとも1つの集約的特性に基づいていても良い(提案71;提案13および22を比較)。本発明の第2の態様によるアプローチに関する他の提案も、該候補あるいは確認されるメンバーに対して、あるいは該確認条件に関して、適用しても良い。したがって、該確認条件が、実行されるのか、されないのかという決定は、提案12から16の少なくとも1つの、あるいは提案21から26の少なくとも1つの、あるいは他の提案のいずれか1つ、たとえば提案40から63の少なくとも1つの特徴および方法工程にしたがって行っても良い(提案72)。
本方法のさらなる実施態様は、有利となろう。工程6)に関して、本工程は、さらに
ii)もし候補メンバーあるいは確認されているメンバーあるいは候補および確認されているメンバーのグループが、見出されると、さらに候補メンバーを追加するために、該グループ閉じる準工程をさらに包含することを示唆している(提案73)。
好ましい実施態様によると、方法工程d3)からd6)は、全データ組あるいはデータ組の該準セットの全データ組が、アクセスされるまで数回反復される(提案74)。さらに、数準セットが提供されること、また該データ組の該数準セットの各々に対して、工程d3)およびd6)は、該データ組の各準セットの全データ組が、アクセスされるまで、少なくとも1回、一般的には数回反復されることが示唆されている(提案75)。
有利になるように、該同定条件およびしたがって該グループ分けは、各特性付け測定値に関するズレの少なくとも1つの統計的分布に基づいても良い(提案76)。特に該同定条件は、本発明の第1の態様(提案1、工程dを比較)および提案30)によるグループ分けに関係してもよい。特に、本発明の第1の態様を参照しているが、一般的にも、該同定条件は、もしアクセスされた各データ組の少なくとも1つの特性付け測定値が、あらかじめ定められた特性付け測定値間隔に入る場合には、あるいは該ズレの少なくとも1つの分布に基づいて得られる現在の特性付け測定値間隔に入る場合には、実行するように決定しても良い(提案77)。従来の「ハードビニング」間隔の意味でのこの状況下で決められた特性付け測定値間隔を使用しても良いことを付け加えるべきである。しかし、好ましくは、間隔境界に関してのグループ分けのうちに決められた間隔および該成分あるいは生成物の1特定物に対するそれらの潜在的関連性が、使用され、またそれらは、本発明の第1の態様によるグループ分けからフォローしている。
本発明の第1の態様を参照して(提案1および30を比較する)、またこの点に関するさらなる提案を参照して(提案2から20および31から36を比較する)、さらなる利点に導くさらなる提案を次に述べる。
特に、提案1から5あるいは30から34の少なくとも1つを参照して、ズレ(Δm/zi)の統計的分布の少なくとも1つに基づく該グループ分け、すなわち特に測定ズレの統計的分布の少なくとも1つ(提案2および31を比較する)は、各データ組の少なくとも1つの特性付け測定値(Δm/zi)が、該ズレの統計的分布から得られる現在の特性付け測定値間隔([m/zION−Δm/zdev、m/zION+Δm/zdev])に入るか、あるいは入らないかを決定することを包含していることを示唆している(提案78)。好ましくは、ズレ(±Δm/zi)の該統計的分布は、少なくとも1つの特性付け測定値(Δm/zi)が、現在の特性付け測定値間隔([m/zION−Δm/zdev、m/zION+Δm/zdev])に入るという決定および各少なくとも1つの特性付け測定値が、現在の特性付け測定値に入らないという決定の少なくとも1つに基づいて、更新され、またそこでは、更新される特性付け測定値間隔([m/zION−Δm/zdev、m/zION+Δm/zdev])は、ズレの更新された統計的分布から得られ、該グループ分けにおいて、現在の特性付け測定値間隔として使用される(提案79)。好ましくは、ベイジアンの更新あるいは習得スキームは、このような背景で使用されている。図示される非限定的例のLC−MS解析、たとえばNC−ESI−MS解析を参照にして、この更新あるいは習得は、質量対電荷比の軸に沿って適当な間隔を決定する事に関して、有利にするために行うことが出来る。
提案5あるいは提案34あるいはこれらの提案のうちの1つに基づいた他の提案のいずれかを参照して、該グループ分けは、次の工程を含む(提案80);
d1)測定ズレの現在の分布として、初期化データに基づいた測定ズレの以前の分布を前提とする工程と;
d2)測定ズレ(Δm/zi)の現在の分布に基づいて、少なくとも1つの現在の予測間隔、おそらくは現在の確信間隔を得る(たとえば、計算するあるいは求める)工程と;
d3)あらかじめ定められたアクセススケジュールにより、該データ組あるいは該あるいは該データ組の少なくとも1つのデータ組、おそらく第1データ組あるいは次のデータ組にアクセスする工程と;
d4)アクセスされる各データ組の少なくとも1つの特性付け測定値(m/zi)が、現在の予測間隔([m/zION−Δm/zdev、m/zION+Δm/zdev])中に落ちるか、あるいは落ちないかを決定する工程と;
d5)もし特性付け測定値が、現在の予測間隔に落ちる場合には;
i)少なくとも1つのアクセスされたデータ組を、該成分あるいは生成物の1つの特定物に関連しているデータ組の各群の最初のあるいはさらなる候補メンバーとして特性付け測定値を包含するデータ組を同定する工程と
ii)少なくとも測定ズレの現在の分布に基づいて、またおそらく現在の予測間隔以内の該特性付け測定値の位置に基づいて、既にアクセスされていないデータ組に関して測定ズレの以前の分布である測定ズレの後の分布を計算する工程と;
d6)もしある停止基準あるいは停止基準の少なくとも1つが、実施されると、
i)測定ズレの現在の分布に基づいたグループわけを停止する工程と;を包含し、
工程d6)が、達成されるまで、工程d2)からd5)を反復することを特徴とすることを包含しても良い。
工程d1)から工程d6)による本グループ分けは、本発明の第2の態様によるグループ分けを含んでいても良い。
工程d6)を参照して、1つの中止基準によると、もし特性付け測定値あるいは、巧くあるいは同時にアクセスされるデータ組に含められる特性付け測定値の決められた数が、現在の予想間隔に入らない場合には、このグループ分けは、中止される(提案81)。さらに、測定データの構成にもよるが、アクセス工程d3)でアクセスされる少なくとも1つの各データ組の有無に基づく中止条件があってもよい。このような中止基準により、もし1つのアクセス工程d3)中で、あるいはアクセス工程d3)の決められた数の中で、検出ハードウエアによる検出を表示する適切な測定データを含むデータ組を、見出すことが出来ない場合には、このグループ分けは、中止される(提案81a)。
該成分あるいは生成物の1つの特定物に関係する(あるいは、潜在的に関係する)複数のグループあるいはデータ組は、同時に考慮するように付け加えるべきである。アクセス工程d3)によるアクセスは、アクセスされたデータ組が、既に確立されたデータ組のグループに、あるいは、既に確立されたデータ組のグループの1つに、加えられるという結果、あるいは第1のデータ組あるいはデータ組の1つの追加のグループが、このデータ組に基づいて確立されるという結果を持っても良い。
工程d5)は、さらに、有利にするために、
iii)少なくとも1つの確認条件を、該成分あるいは生成物の1つの特定物に関連するデータ組の該各グループの複数の候補メンバーに適用し、該複数の候補メンバーは、もし該少なくとも1つの確認条件が該候補メンバーに対して、集約的に実行されるとき、該グループの確認された候補メンバーとなることを特徴とする工程;あるいは
iii')少なくとも1つの確認条件を、該成分あるいは生成物の1つの特定物に関連するデータ組の複数の候補および該各グループの確認されたメンバーに適用し、各候補メンバーは、もし該少なくとも1つの確認条件が該候補および確認されたメンバーに対して、集約的に実行されるとき、該グループの確認されたメンバーとなることを特徴とする工程を含む(提案82)。
この確認条件は、該候補メンバーあるいは集約的候補メンバーの集約的特性に基づいても良い。
あるテスト条件による該成分あるいは生成物の1特定物に関連付けられるように既に決められさらにそれゆえに確認されるメンバーとして同定されるように決められたデータポイントは、維持することが出来るし、また追加のデータポイントは、これらの追加データポイントも、同一成分あるいは生成物に関連しているかどうかを決めるための該条件に対して、確認されるメンバーとともに試験できるから、確認されるメンバーおよび候補メンバー間の提案された識別は、高度に有効なグループ分けを行える。
引かれるべき因果関係に関して、もし該少なくとも1つの確認条件あるいはいくつかの確認条件の少なくとも1つが、該複数の候補メンバーあるいは該複数の候補および確認されるメンバーに対して集約的に実行されない場合には、異なる解は、可能である。1つのアプローチにより、該グループに加えられた少なくとも第1候補メンバーは、該グループから削除されるか、あるいはそこでは、もし該少なくとも1つの確認条件が、あるいはもしいくつかの確認条件のうちの少なくとも1つの特定の確認条件が、該複数の候補メンバーに対して集約的に実行されない場合には、該グループは、削除される(提案83)。さらに、もし該少なくとも1つの確認条件が、あるいはもしいくつかの確認条件のうちの少なくとも1つの特定の確認条件が、該複数の確認される候補メンバーに対して集約的に実行されない場合には、該グループは、削除される(提案84)。
好ましい実施態様によると、1つの中断基準は、もし該確認条件が、該複数の候補メンバーに対して、あるいは少なくとも1つの追加の候補メンバーと共に該複数の確認されるメンバーに対して集約的に実行されない場合には、実行されないと決定される(提案85)。
もし該確認条件およびそれ故グループ分けが、複数の定量的測定値(li)の少なくとも1つの集約的特性に基づいている場合には、高度に効果的なグループ分けを得ることができて、それぞれは、該候補あるいは確認されるメンバーに属している(提案86)。特に、該確認条件は、本発明の第2の態様によるグループ分けに関係してもよい(提案11および20、工程d)を比較する)。本発明の第2の態様による該グループ分けの好ましい実施態様は、該グループ分けが基づいている該集約的特性を、候補メンバーあるいは該候補および確認されるメンバーに関係させている。したがって、該確認条件は、該候補あるいは確認されるメンバーに属する該複数の該定量的測定値から求められる全体の定量的尺度値よりなる少なくとも1つの集約的特性に基づいていても良い(提案87)。該確認条件は、該候補あるいは確認されるメンバーにより直接あるいは間接に定められる少なくとも1つの曲線あるいは柱状図の形状よりなる少なくとも1つの集約的特性に基づいていても良い(提案88)。本発明の第2の態様に関する他の提案も、この状況に用いても良い。したがって、該確認条件を実行するかしないかを決定することは、特性および少なくとも1つの提案12から16あるいは少なくとも1つの提案21から26、あるいは他の提案のいずれか、たとえば提案44から77の方法工程にしたがって、行っても良い(提案89)。
測定ズレの現在の分布に基づいたグループ分けを再び参照して、工程d6)は、
ii)もし候補メンバーあるいは確認されているメンバーあるいは候補および確認されているメンバーのグループが、見出されると、さらに候補メンバーを追加するために、該グループ閉じる準工程をさらに包含することが、さらに示唆される(提案90)。
工程d1)からd6)は、全データ組あるいはデータ組の該準セットの全データ組が、アクセスされるまで数回反復されることを提案する(提案91)。さらに、該データ組の該数準セットの各々に対して、工程d1)およびd6)は、該データ組の各準セットの全データ組が、アクセスされるまで、少なくとも1回、一般的には数回反復されることが提案されている(提案92)。
データ組の少なくとも1つの参照準セットに対して、測定ズレの以前の分布は、あらかじめ定められたあるいは仮定された初期化データに基づいて、工程d1)において初期化され、該初期化データは、好ましくは、少なくとも1つの理論的初期化データおよび少なくとも1つの外部標準を用いた測定に基づいて得られるあるいは提供される初期化データおよび過去の実際の経験に基づいて仮定される初期化データを包含し、さらにそこでは、データ組の該参照準セットは、参照目的で、あるいは内部標準としてサンプル中に添加された参照成分により、潜在的に生じる、あるいはそのような参照成分に関係する生成物により、潜在的に生じると決められているデータ組を包含するということを提案している(提案93)。さらに、データ組の少なくとも1つの参照準セットに対して、測定ズレの以前の分布は、あらかじめ定められたあるいは仮定された初期化データに基づいて、工程d1)において初期化され、該初期化データは、好ましくは、少なくとも1つの理論的初期化データおよび少なくとも1つの外部標準を用いた測定に基づいて得られるあるいは提供される初期化データおよび過去の実際の経験に基づいて仮定される初期化データおよび該参照準セットのデータ組に関して行われたグループ分けから得られる初期化データを包含し、さらにそこでは、データ組の該参照準セットは、サンプル中に含まれる関心のあるあるいは未知の成分により、潜在的に生じる、あるいはそのような成分に関係する生成物により、潜在的に生じると決められているデータ組を包含するということを提案している(提案94)。
提案93および94により、該グループ分けに含まれているたとえば、ベイジアン更新習得スキームなどの更新あるいは習得において、この更新あるいは習得は、適当な出発値から開始するということを可能にする。
上記の提案の多くは、本発明の1つの特定のあるいは両態様に直接に、あるいは間接に関係する、すなわち、本発明の第1の態様あるいは/および本発明の第2の態様に直接に、あるいは間接に関係する。多くの追加的利点は、本発明のこれらのアプローチの実行に関係していない、あるいはこれらのアプローチの実行に直接にあまり指向していない特徴および方法工程からも得ることが出来る。たとえば、測定データのノイズ除去を行う方法工程を実行しても良い。特に、その方法は、電気的ノイズあるいは化学的ノイズなどの少なくとも1つのノイズにより潜在的に生じる、あるいは、該技術あるいは該検出ハードウエアに関連するあるいは生じると決められるデータポイントあるいはデータ組を除去することにより、該測定データあるいはデータ組のノイズ除去を行う工程を含むことが示唆される(提案95)。好ましくは、該ノイズ除去は、該グループ分けを行う前に行い(提案96)その結果ノイズは、グループ分けには有害な作用を及ぼさない。
提案9あるいは20を参照して、該ノイズ除去は、測定された定量的測定値(li)の分布を求めることからなり、またデータポイントあるいはデータ組(そのそれぞれの少なくとも1つの定量的測定値は、測定された定量的測定値の該分布から由来する定量的値の閾値、あるいは強度閾値に足りない)を除去することからなっていてもよい(提案97)。もし該定量的値の閾値、あるいは強度閾値が、定量的測定値の柱状図あるいは該分布を表示する定量的測定値の対数において、最小値に対応する場合には、少なくともある測定状況に対する高度に有効なノイズろ過が、得られよう。そこでは、該最小値は、一方の真の信号に帰せられる少なくとも1つの柱状図と他方のノイズに帰せられる少なくとも1つの柱状図のあいだの最小値である(提案98)。
本発明の第1の態様あるいは/および第2の態様による方法は、参照目的で、あるいは内部標準としてサンプルに添加された参照成分により潜在的に生じる、あるいは、参照成分などに関係する生成物により潜在的に生じると決められる、あるいは、該技術あるいは該検出ハードウエアの少なくとも1つのシステムの人工物に対応すると決められるデータポイントあるいはデータ組を除去することにより、該測定データあるいは該データ組の特性付け測定値依存性のろ過を行う工程を、さらに含んでいても良い(提案99)。適当なものとして、特性付け測定値依存性のろ過は、該グループ分けの前、あるいは後あるいはそのあいだに行っても良い。該グループ分け内の更新あるいは習得スキームの初期化に使用される参照成分に関係するデータポイントに関してのろ過の場合に、これらのデータポイントあるいはデータ組は、初期化が行われるまで、もちろん維持されなければならない。工程e)およびf)によるさらなる分析に対して、蓄えられ、表示され、印刷されまた使用される他のデータに沿って、参照データとしてそのようなデータポイントあるいはデータ組を維持することは、しばしば正当である。
本発明の第1あるいは第2あるいは両者の態様による方法は、該技術あるいは該検出ハードウエアの少なくとも1つの非システム的人工物に対応すると決められるデータポイントあるいはデータ組を除去することにより、該測定データあるいは該データ組の特性付け測定値非依存性のろ過を行う工程を、さらに含んでいても良い(提案100)。たとえば、スパイクなどの人工物は、除去してもよい。好ましくは、該測定データあるいは該データ組は、該データポイントあるいはデータ組に用いられる少なくとも1つの分布基準に基づいて、除去される(提案101)。
一般的に、本発明の第1の態様による、あるいは第2の態様による、あるいは両者の態様によるグループ分けは、データ組の複数の集合に関する各グループ分けを包含してもよく、この集合は、異なったサンプルに基づいて得られ、あるいは同一サンプルに該2つ以上の技術を繰り返し行うことにより、得られることを特徴とする(提案102)。この場合、各集合に対して行われたグループ分け結果は、興味あるものであり、あるいは代替的に、各集合に関して行われるグループ分け結果を結び付けて達成される第2のグループ分け結果であってもよい。第2の可能性に関して、該グループ分けは、該集合の1つに関して行われるグループ分けから得られるデータ組の少なくとも1つのグループを、データ組の結び付けられたグループあるいは該グループ分けの結果として、データ組の結び付けられたグループを得るために、該集合の1つに関して行われるグループ分けから得られるデータ組の少なくとも1つの各グループに結びつけることを包含していることを提案している(提案103)。代替的にあるいは2者択一的に、該グループ分けは、該集合の1つに関して行われるグループ分けから得られる少なくとも1つの各特性付け測定値間隔を、該グループ分けの結果として、1つの結び付けられた特性付け測定値間隔あるいは結び付けられた特性付け測定値間隔類を得るために、該集合の少なくとも1つの他のものに関して行われるグループ分けから得られる少なくとも1つの各特性付け測定値間隔に結びつけることを包含してもよい(提案104)。
前述において、それは、LC−MSスペクトル解析、たとえばLC−ESI−MSスペクトル解析の測定状況を図示される非限定的例として、しばしば参照した。原理的には、使用される技術(少なくとも1つの第1分析技術たとえば、第1分析および検出技術およびさらなる技術、たとえば、さらなる分析技術あるいはさらなる検出技術、あるいはさらなる分析および検出技術)に関しての制限はない。
第1技術に関して、該成分および生成物の少なくとも1つの分離を行うために採用されるいかなる技術使用できると信じられている。さらにより一般的に、該第1技術あるいは少なくとも1つの第1技術は、好ましくは、化学的効果、物理的効果、動力学的特性および平衡特性の少なくとも1つに基づいて、該成分および生成物の少なくとも1つの分離を行うために採用されることを示唆している(提案105)。好ましい実施の態様によると、該第1分析技術あるいは少なくとも1つの第1分析技術は、クロマトグラフィー技術および電気泳動技術のうちの少なくとも1つからなっている(提案106)。
該第1分析技術あるいは少なくとも1つの第1分析技術は、あるいはイオン化技術、好ましくは、電気スプレーイオン化技術あるいは/およびMALDI技術を含めて、質量スペクトル分析技術からもなっていることを注意するべきである(提案107)。
該さらなる技術に関しては、該さらなる技術あるいは少なくとも1つのさらなる技術は、スペクトル分析技術からなっている(提案108)。たとえば、該さらなる技術あるいは少なくとも1つのさらなる技術は、光スペクトル分析技術からなっていてもよい(提案109)。他の可能性は、該さらなる技術あるいは少なくとも1つのさらなる技術は、電気化学的および電量技術の少なくとも1つからなっていてもよい(提案110)。
該さらなる技術あるいは少なくとも1つのさらなる技術は、化学的効果、物理的効果、動力学的特性および平衡特性の少なくとも1つに基づいて、該成分および生成物の少なくとも1つの分離を行うために採用されてもよい(提案111)。
好ましくは、該さらなる技術あるいは少なくとも1つのさらなる技術は、あるいはイオン化技術、好ましくは電気スプレーイオン化技術あるいは/およびMALDI技術を含めて、質量スペクトル分析技術からなっている(提案112)。他の分析技術を、2者択一的にあるいは追加的に使用しても良い。
該さらなる技術あるいは少なくとも1つのさらなる技術は、粒子検出技術、あるいはイオン検出技術からなっていてもよい(提案113)。さらに、該さらなる技術あるいは少なくとも1つのさらなる技術は、光子検出技術、放射線検出技術および電子検出技術の少なくとも1つからなっていてもよい(提案114)。
第1態様による本発明は、少なくとも1つの成分、特にそこに含まれている化学的成分、生物的成分あるいは生物化学的成分、および先行する請求項1から20のいずれか1つに請求されている方法に記載されている少なくとも1つの該技術を行うことから生じる生成物に関して、該サンプルを評価する特性化データを提供するために、2つ以上の技術を行うことにより、少なくとも1つのサンプルを分析するシステムであって、
a)i)成分を分離するための、あるいは
ii)該第1分析技術あるいは少なくとも1つの第1分析技術を行うことにより生じる生成物を分離するための、あるいは
iii)該第1分析技術あるいは少なくとも1つの第1分析技術を行うことにより生じる成分および生成物を分離するための
少なくとも1つの第1分析技術を行うために採用されている少なくとも1つの第1分析部門あるいはユニットであって、少なくとも1つの第1分析部門あるいはユニットは、該サンプルに関して、あるいはすでに分離されている成分あるいは生成物に関して該第1分析技術を行うために採用されており、該第1分析部門あるいはユニットは、該成分あるいは生成物の少なくとも1つの第1識別特性に基づいて、該分離を行うために採用されていることを特徴とする少なくとも1つの第1分析部門あるいはユニットと;
b)i)該1つの第1分析部門あるいはユニットにより達成される少なくとも1つの分離および ii)少なくとも1つのさらなる識別特性のうちの少なくとも1つに基づいて、分離された成分あるいは生成物を特性づけるための少なくとも1つの分析技術を行うために採用されている少なくとも1つの第1分析部門あるいはユニットと、該さらなる技術は、分析技術および検出技術の少なくとも1つであり、該さらなる部門あるいはユニットは、分析および検出部門あるいはユニットの少なくとも1つであることを特徴とする少なくとも1つの第1分析部門あるいはユニットとからなり;
少なくともさらなる該部門あるいはユニットは、少なくとも2つの特性付け測定量(スキャン数、質量対電荷比;検出時間、質量対電荷比)と、該1つの第1分析部門あるいはユニットにより達成される該分離あるいは少なくとも1つの分離を反映する該特性付け測定量の少なくとも1つの第1(スキャン数;検出時間)と、1)該1つの第1分析部門あるいはユニットにより達成される少なくとも1つの分離と2)該さらなる識別特性あるいはさらなる識別特性の少なくとも1つのうちの少なくとも1つを反映する該特性付け測定量の少なくとも1つのさらなる(質量対電荷比)と言う言葉で、該成分あるいは生成物の少なくとも1つの特性付けを表示する測定データを提供するために採用される関連の検出ハードウエアを含みあるいは持っていることを特徴とし;
該検出ハードウエアは、該検出ハードウエアにより検出されかつそれに関連する少なくとも1つの特性付け測定量を参照して、少なくとも1つの定量的測定量(イオン強度)と言う言葉で検出ハードウエアにより提供される少なくとも1つの定量化(イオン強度)を表示する定量的測定データを包含する測定データを提供するために、採用されてもよく、あるいは採用されなくてもよいことを特徴とし;
該システムは、さらに、少なくとも1つのプロセッサを持つ少なくとも1つの制御ユニットと、関連する少なくとも1つのデータ貯蔵ユニットを含みあるいは有する該制御ユニットと、さらに好ましくは関連する少なくとも1つの表示ユニットを持つ該制御ユニットと、印刷ユニットからなり、また好ましくは、少なくとも1つの第1分析部門あるいはユニットおよび該さらなる部門あるいはユニットを制御するために、配置されあるいはプログラムされていることを特徴とし;
該制御ユニットは、
c)該特性付け測定量の少なくとも1つの該第1(スキャン数;検出時間)と言う言葉で、該特性付けあるいは少なくとも1つの特性付けを表示する少なくとも1つの各第1特性付け測定値(Ni、ti)と、該特性付け測定量の該少なくとも1つのさらなる(質量対電荷比)と言う言葉で、該特性付けあるいは少なくとも1つの特性付けを表示する少なくとも1つのさらなる各特性付け測定値(m/zi)とを互いに関連させることにより、検出ハードウエアにより提供される測定データに基づいて、データ組((Ni、m/zi);(ti、m/zi))を提供するために;
d)該データ組を、該特性付け測定量の少なくとも1つに対する特性付け測定値に関して、測定値を特性付ける特性付け測定値間隔([m/zION−Δm/zdev、m/zION+Δm/zdev]、[NION−ΔNdev、NION+ΔNdev];[m/zION−Δm/zdev、m/zION+Δm/zdev]、[tION−Δtdev、tION+Δtdev])で、該各間隔は、該成分あるいは生成物の1つの特定物に潜在的に関連しているきめられるものである測定値間隔にグループ分けするために;配置されあるいはプログラムされていることを特徴とし;
該制御ユニットは、該成分あるいは生成物の該特定物に関連した真の、あるいは特性的な、あるいは平均の特性付け測定値(m/zION)からの各特性付け測定値(m/zi)のズレ(Δm/zi)の少なくとも1つの統計的分布に基づいて、該グループ分けを行うために配置されあるいはプログラムされていることを特徴とし;
さらに該制御ユニットは、次の少なくとも1つ;
e)i)該グループ分けから得られるデータ組の群および ii)該グループ分けから得られた該特性付け測定値の少なくとも1つの間隔([m/zION−Δm/zdev、m/zION+Δm/zdev]、[NION−ΔNdev、NION+ΔNdev];[m/zION−Δm/zdev、m/zION+Δm/zdev]、[tION−Δtdev、tION+Δtdev])の少なくとも1つを反映しあるいは包含するデータの貯蔵、表示および印刷あるいはデータの可視化の少なくとも1つと;
f)i)該グループ分けから得られるデータ組の群および ii)該グループ分けから得られた該特性付け測定値の少なくとも1つの間隔([m/zION−Δm/zdev、m/zION+Δm/zdev]、[NION−ΔNdev、NION+ΔNdev];[m/zION−Δm/zdev、m/zION+Δm/zdev]、[tION−Δtdev、tION+Δtdev])の少なくとも1つに基づいて、あるいは工程e)により貯蔵され、表示されあるいは印刷されたデータあるいは可視化に基づいて、該少なくとも1つのサンプルの解析あるいは該成分あるいは生成物の少なくとも1つ解析;を提供するために、配置されあるいはプログラムされていることを特徴とするシステムをさらに提供する(提案115)。
第2態様によると本発明は、少なくとも1つの成分、特にそこに含まれている化学的成分、生物的成分あるいは生物化学的成分、および先行する請求項1から20のいずれか1つに請求されている方法に記載されている少なくとも1つの該技術を行うことから生じる生成物に関して、該サンプルを評価する特性化データを提供するために、2つ以上の技術を行うことにより、少なくとも1つのサンプルを分析するシステムであって、
a)i)成分を分離するための、あるいは
ii)該第1分析技術あるいは少なくとも1つの第1分析技術を行うことにより生じる生成物を分離するための、あるいは
iii)該第1分析技術あるいは少なくとも1つの第1分析技術を行うことにより生じる成分および生成物を分離するための
少なくとも1つの第1分析技術を行うために採用されている少なくとも1つの第1分析部門あるいはユニットであって、少なくとも1つの第1分析部門あるいはユニットは、該サンプルに関して、あるいはすでに分離されている成分あるいは生成物に関して該第1分析技術を行うために採用されており、該第1分析部門あるいはユニットは、該成分あるいは生成物の少なくとも1つの第1識別特性に基づいて、該分離を行うために採用されていることを特徴とする少なくとも1つの第1分析部門あるいはユニットと;
b)i)該1つの第1分析部門あるいはユニットにより達成される少なくとも1つの分離および ii)少なくとも1つのさらなる識別特性のうちの少なくとも1つに基づいて、分離された成分あるいは生成物を特性づけるための少なくとも1つの分析技術を行うために採用されている少なくとも1つの第1分析部門あるいはユニットと、該さらなる技術は、分析技術および検出技術の少なくとも1つであり、該さらなる部門あるいはユニットは、分析および検出部門あるいはユニットの少なくとも1つであることを特徴とする少なくとも1つの第1分析部門あるいはユニットとからなり;
少なくともさらなる該部門あるいはユニットは、少なくとも2つの特性付け測定量(スキャン数、質量対電荷比;検出時間、質量対電荷比)と、該1つの第1分析部門あるいはユニットにより達成される該分離あるいは少なくとも1つの分離を反映する該特性付け測定量の少なくとも1つの第1(スキャン数;検出時間)と、i)該1つの第1分析部門あるいはユニットにより達成される少なくとも1つの分離と ii)該さらなる識別特性あるいはさらなる識別特性の少なくとも1つのうちの少なくとも1つを反映する該特性付け測定量の少なくとも1つのさらなる(質量対電荷比)と言う言葉で、該成分あるいは生成物の少なくとも1つの特性付けを表示する測定データを提供するために採用される関連の検出ハードウエアを含みあるいは持っていることを特徴とし;
該検出ハードウエアは、該検出ハードウエアにより検出されかつそれに関連する少なくとも1つの特性付け測定量を参照して、少なくとも1つの定量的測定量(イオン強度)と言う言葉で検出ハードウエアにより提供される少なくとも1つの定量化(イオン強度)を表示する定量的測定データを包含する測定データを提供するために、採用されていることを特徴とし;
該システムは、さらに、少なくとも1つのプロセッサを持つ少なくとも1つの制御ユニットと、関連する少なくとも1つのデータ貯蔵ユニットを含みあるいは有する該制御ユニットと、さらに好ましくは関連する少なくとも1つの表示ユニットを持つ該制御ユニットと、印刷ユニットからなり、また好ましくは、少なくとも1つの第1分析部門あるいはユニットおよび該さらなる部門あるいはユニットを制御するために、配置されあるいはプログラムされていることを特徴とし;
該制御ユニットは、
c)該特性付け測定量の少なくとも1つの該第1(スキャン数;検出時間)と言う言葉で、該特性付けあるいは少なくとも1つの特性付けを表示する少なくとも1つの各第1特性付け測定値(Ni、ti)と、該特性付け測定量の該少なくとも1つのさらなる(質量対電荷比)と言う言葉で、該特性付けあるいは少なくとも1つの特性付けを表示する少なくとも1つのさらなる各特性付け測定値(m/zi)と、定量的測定量(イオン強度)と言う言葉で、該定量化あるいは少なくとも1つの定量化(イオン強度)を表示する少なくとも1つの各定量的測定値(li)とを互いに関連させることにより、検出ハードウエアにより提供される測定データに基づいて、データ組((Ni、m/zi、li);(ti、m/zi、li))を提供するために;
d)該データ組を、該特性付け測定量の少なくとも1つに対する特性付け測定値に関して、測定値を特性付ける特性付け測定値間隔([m/zION−Δm/zdev、m/zION+Δm/zdev]、[NION−ΔNdev、NION+ΔNdev];[m/zION−Δm/zdev、m/zION+Δm/zdev]、[tION−Δtdev、tION+Δtdev])で、該各間隔は、該成分あるいは生成物の1つの特定物に潜在的に関連しているきめられるものである測定値間隔にグループ分けするために;配置されあるいはプログラムされていることを特徴とし;
該制御ユニットは、複数の該定量的測定値(li)で各々は該データ組のそれぞれ1つに属している値の少なくとも1つの集合的特性に基づいて、該グループ分けを行うために、配置されあるいはプログラムされていることを特徴とし;
さらに該制御ユニットは、次の少なくとも1つ;
e)i)該グループ分けから得られるデータ組の群および ii)該グループ分けから得られた該特性付け測定値の少なくとも1つの間隔([m/zION−Δm/zdev、m/zION+Δm/zdev]、[NION−ΔNdev、NION+ΔNdev];[m/zION−Δm/zdev、m/zION+Δm/zdev]、[tION−Δtdev、tION+Δtdev])の少なくとも1つを反映しあるいは包含するデータの貯蔵、表示および印刷あるいはデータの可視化の少なくとも1つと;
f)i)該グループ分けから得られるデータ組の群および ii)該グループ分けから得られた該特性付け測定値の少なくとも1つの間隔([m/zION−Δm/zdev、m/zION+Δm/zdev]、[NION−ΔNdev、NION+ΔNdev];[m/zION−Δm/zdev、m/zION+Δm/zdev]、[tION−Δtdev、tION+Δtdev])の少なくとも1つに基づいて、あるいは工程e)により貯蔵され、表示されあるいは印刷されたデータあるいは可視化に基づいて、該少なくとも1つのサンプルの解析あるいは該成分あるいは生成物の少なくとも1つ解析;を提供するために、配置されあるいはプログラムされていることを特徴とするシステムをさらに提供する(提案116)。
本発明の第1あるいは第2あるいは両者の態様によるシステムに対しては、該第1分析部門あるいはユニット、該分析ハードウエア、あるいはシステムおよび制御ユニットの各他の部品は、該技術を行うために、該データ組を提供するために、該グループ分けを行うために、かつ提案1から114の1つあるいはいくつかによる方法にしたがって、該尺度e)およびf)の少なくとも1つを提供するために、採用され、配列され、あるいはプログラム化されることをさらに提案する(提案117)。
本発明によるシステムは、複数の構造的に独立したサブシステムの形式であってもよく、あるいは異なる位置に位置づけられても良いことに注意するべきである。1つのサブシステム、測定サブシステムは、測定のみを行うために提供されてもよく、他のサブシステム、グループ分けサブシステムは、測定サブシステムにより提供されかつグループ分けサブシステムに対して若干移される測定データに基づいて、データのグループ分けのみを行うために提供されても良い。このデータの移送は、通信リンク経由あるいはデータキャリヤー経由で行っても良い。
第1態様による本発明は、少なくとも1つの成分、特にそこに含まれている化学的成分、生物的成分あるいは生物化学的成分、および先行する請求項1から20のいずれか1つに請求されている方法に記載されている少なくとも1つの該技術を行うことから生じる生成物に関して、該サンプルを評価する特性化データを提供するために、2つ以上の技術を行うことにより、少なくとも1つのサンプルを分析するシステムにより実行可能な指令のプログラムであって、このシステムは、
a)i)成分を分離するための、あるいは
ii)該第1分析技術あるいは少なくとも1つの第1分析技術を行うことにより生じる生成物を分離するための、あるいは
iii)該第1分析技術あるいは少なくとも1つの第1分析技術を行うことにより生じる成分および生成物を分離するための
少なくとも1つの第1分析技術を行うために採用されている少なくとも1つの第1分析部門あるいはユニットであって、少なくとも1つの第1分析部門あるいはユニットは、該サンプルに関して、あるいはすでに分離されている成分あるいは生成物に関して該第1分析技術を行うために採用されており、該第1分析部門あるいはユニットは、該成分あるいは生成物の少なくとも1つの第1識別特性に基づいて、該分離を行うために採用されていることを特徴とする少なくとも1つの第1分析部門あるいはユニットと;
b)i)該1つの第1分析部門あるいはユニットにより達成される少なくとも1つの分離および ii)少なくとも1つのさらなる識別特性のうちの少なくとも1つに基づいて、分離された成分あるいは生成物を特性づけるための少なくとも1つの分析技術を行うために採用されている少なくとも1つの第1分析部門あるいはユニットと、該さらなる技術は、分析技術および検出技術の少なくとも1つであり、該さらなる部門あるいはユニットは、分析および検出部門あるいはユニットの少なくとも1つであることを特徴とする少なくとも1つの第1分析部門あるいはユニットとからなり;
少なくともさらなる該部門あるいはユニットは、少なくとも2つの特性付け測定量(スキャン数、質量対電荷比;検出時間、質量対電荷比)と、該1つの第1分析部門あるいはユニットにより達成される該分離あるいは少なくとも1つの分離を反映する該特性付け測定量の少なくとも1つの第1(スキャン数;検出時間)と、1)該1つの第1分析部門あるいはユニットにより達成される少なくとも1つの分離と2)該さらなる識別特性あるいはさらなる識別特性の少なくとも1つのうちの少なくとも1つを反映する該特性付け測定量の少なくとも1つのさらなる(質量対電荷比)と言う言葉で、該成分あるいは生成物の少なくとも1つの特性付けを表示する測定データを提供するために採用される関連の検出ハードウエアを含みあるいは持っていることを特徴とし;
該検出ハードウエアは、該検出ハードウエアにより検出されかつそれに関連する少なくとも1つの特性付け測定量を参照して、少なくとも1つの定量的測定量(イオン強度)と言う言葉で検出ハードウエアにより提供される少なくとも1つの定量化(イオン強度)を表示する定量的測定データを包含する測定データを提供するために、採用されてもよく、あるいは採用されなくてもよいことを特徴とし;
該システムは、さらに、少なくとも1つのプロセッサを持つ少なくとも1つの制御ユニットと、関連する少なくとも1つのデータ貯蔵ユニットを含みあるいは有する該制御ユニットと、さらに好ましくは関連する少なくとも1つの表示ユニットを持つ該制御ユニットと、印刷ユニットからなり、また好ましくは、少なくとも1つの第1分析部門あるいはユニットおよび該さらなる部門あるいはユニットを制御するために、配置されあるいはプログラムされていることを特徴とし;
該制御ユニットは、該指示に応答して、
c)該特性付け測定量の少なくとも1つの該第1(スキャン数;検出時間)と言う言葉で、該特性付けあるいは少なくとも1つの特性付けを表示する少なくとも1つの各第1特性付け測定値(Ni、ti)と、該特性付け測定量の該少なくとも1つのさらなる(質量対電荷比)と言う言葉で、該特性付けあるいは少なくとも1つの特性付けを表示する少なくとも1つのさらなる各特性付け測定値(m/zi)とを互いに関連させることにより、検出ハードウエアにより提供される測定データに基づいて、データ組((Ni、m/zi);(ti、m/zi))を提供する工程と;
d)該データ組を、該特性付け測定量の少なくとも1つに対する特性付け測定値に関して、測定値を特性付ける特性付け測定値間隔([m/zION−Δm/zdev、m/zION+Δm/zdev]、[NION−ΔNdev、NION+ΔNdev];[m/zION−Δm/zdev、m/zION+Δm/zdev]、[tION−Δtdev、tION+Δtdev])で、該各間隔は、該成分あるいは生成物の1つの特定物に潜在的に関連しているきめられるものである測定値間隔にグループ分けする工程と;を実行することを特徴とし;
該制御ユニットは、該指示に応答して、該成分あるいは生成物の該特定物に関連した真の、あるいは特性的な、あるいは平均の特性付け測定値(m/zION)からの各特性付け測定値(m/zi)のズレ(Δm/zi)の少なくとも1つの統計的分布に基づいて、該グループ分けを行うことを特徴とし;
さらに該制御ユニットは、該指示に応答して、次の工程の少なくとも1つ;
e)i)該グループ分けから得られるデータ組の群および ii)該グループ分けから得られた該特性付け測定値の少なくとも1つの間隔([m/zION−Δm/zdev、m/zION+Δm/zdev]、[NION−ΔNdev、NION+ΔNdev];[m/zION−Δm/zdev、m/zION+Δm/zdev]、[tION−Δtdev、tION+Δtdev])の少なくとも1つを反映しあるいは包含するデータの貯蔵、表示および印刷あるいはデータの可視化の少なくとも1つと;
i)該グループ分けから得られるデータ組の群および ii)該グループ分けから得られた該特性付け測定値の少なくとも1つの間隔([m/zION−Δm/zdev、m/zION+Δm/zdev]、[NION−ΔNdev、NION+ΔNdev];[m/zION−Δm/zdev、m/zION+Δm/zdev]、[tION−Δtdev、tION+Δtdev])の少なくとも1つに基づいて、あるいは工程e)により貯蔵され、表示されあるいは印刷されたデータあるいは可視化に基づいて、該少なくとも1つのサンプルの解析あるいは該成分あるいは生成物の少なくとも1つの解析の工程;
を実行することを特徴とするシステムにより実行可能なプログラムをさらに提供する(提案118)。
第2態様による本発明は、少なくとも1つの成分、特にそこに含まれている化学的成分、生物的成分あるいは生物化学的成分、および先行する請求項1から20のいずれか1つに請求されている方法に記載されている少なくとも1つの該技術を行うことから生じる生成物に関して、該サンプルを評価する特性化データを提供するために、2つ以上の技術を行うことにより、少なくとも1つのサンプルを分析するシステムにより実行可能な指令のプログラムであって、このシステムは、
a)i)成分を分離するための、あるいは
ii)該第1分析技術あるいは少なくとも1つの第1分析技術を行うことにより生じる生成物を分離するための、あるいは
iii)該第1分析技術あるいは少なくとも1つの第1分析技術を行うことにより生じる成分および生成物を分離するための
少なくとも1つの第1分析技術を行うために採用されている少なくとも1つの第1分析部門あるいはユニットであって、少なくとも1つの第1分析部門あるいはユニットは、該サンプルに関して、あるいはすでに分離されている成分あるいは生成物に関して該第1分析技術を行うために採用されており、該第1分析部門あるいはユニットは、該成分あるいは生成物の少なくとも1つの第1識別特性に基づいて、該分離を行うために採用されていることを特徴とする少なくとも1つの第1分析部門あるいはユニットと;
b)i)該1つの第1分析部門あるいはユニットにより達成される少なくとも1つの分離および ii)少なくとも1つのさらなる識別特性のうちの少なくとも1つに基づいて、分離された成分あるいは生成物を特性づけるための少なくとも1つの分析技術を行うために採用されている少なくとも1つの第1分析部門あるいはユニットと、該さらなる技術は、分析技術および検出技術の少なくとも1つであり、該さらなる部門あるいはユニットは、分析および検出部門あるいはユニットの少なくとも1つであることを特徴とする少なくとも1つの第1分析部門あるいはユニットとからなり;
少なくともさらなる該部門あるいはユニットは、少なくとも2つの特性付け測定量(スキャン数、質量対電荷比;検出時間、質量対電荷比)と、該1つの第1分析部門あるいはユニットにより達成される該分離あるいは少なくとも1つの分離を反映する該特性付け測定量の少なくとも1つの第1(スキャン数;検出時間)と、1)該1つの第1分析部門あるいはユニットにより達成される少なくとも1つの分離と2)該さらなる識別特性あるいはさらなる識別特性の少なくとも1つのうちの少なくとも1つを反映する該特性付け測定量の少なくとも1つのさらなる(質量対電荷比)と言う言葉で、該成分あるいは生成物の少なくとも1つの特性付けを表示する測定データを提供するために採用される関連の検出ハードウエアを含みあるいは持っていることを特徴とし;
該検出ハードウエアは、該検出ハードウエアにより検出されかつそれに関連する少なくとも1つの特性付け測定量を参照して、少なくとも1つの定量的測定量(イオン強度)と言う言葉で検出ハードウエアにより提供される少なくとも1つの定量化(イオン強度)を表示する定量的測定データを包含する測定データを提供するために、採用されていることを特徴とし;
該システムは、さらに、少なくとも1つのプロセッサを持つ少なくとも1つの制御ユニットと、関連する少なくとも1つのデータ貯蔵ユニットを含みあるいは有する該制御ユニットと、さらに好ましくは関連する少なくとも1つの表示ユニットを持つ該制御ユニットと、印刷ユニットからなり、また好ましくは、少なくとも1つの第1分析部門あるいはユニットおよび該さらなる部門あるいはユニットを制御するために、配置されあるいはプログラムされていることを特徴とし;
該制御ユニットは、該指示に対応して、
c)該特性付け測定量の少なくとも1つの該第1(スキャン数;検出時間)と言う言葉で、該特性付けあるいは少なくとも1つの特性付けを表示する少なくとも1つの各第1特性付け測定値(Ni、ti)と、該特性付け測定量の該少なくとも1つのさらなる(質量対電荷比)と言う言葉で、該特性付けあるいは少なくとも1つの特性付けを表示する少なくとも1つのさらなる各特性付け測定値(m/zi)と、定量的測定量(イオン強度)と言う言葉で、該定量化あるいは少なくとも1つの定量化(イオン強度)を表示する少なくとも1つの各定量的測定値(li)とを互いに関連させることにより、検出ハードウエアにより提供される測定データに基づいて、データ組((Ni、m/zi、li);(ti、m/zi、li))を提供する工程と;
d)該データ組を、該特性付け測定量の少なくとも1つに対する特性付け測定値に関して、測定値を特性付ける特性付け測定値間隔([m/zION−Δm/zdev、m/zION+Δm/zdev]、[NION−ΔNdev、NION+ΔNdev];[m/zION−Δm/zdev、m/zION+Δm/zdev]、[tION−Δtdev、tION+Δtdev])で、該各間隔は、該成分あるいは生成物の1つの特定物に潜在的に関連しているきめられるものである測定値間隔にグループ分けする工程と;を実行することを特徴とし;
該制御ユニットは、該指示に応答して、複数の該定量的測定値(li)で各々は該データ組のそれぞれ1つに属している値の少なくとも1つの集合的特性に基づいて、該グループ分けを行うことを特徴とし;
さらに該制御ユニットは、該指示に応答して、次の少なくとも1つの工程;
e)i)該グループ分けから得られるデータ組の群および ii)該グループ分けから得られた該特性付け測定値の少なくとも1つの間隔([m/zION−Δm/zdev、m/zION+Δm/zdev]、[NION−ΔNdev、NION+ΔNdev];[m/zION−Δm/zdev、m/zION+Δm/zdev]、[tION−Δtdev、tION+Δtdev])の少なくとも1つを反映しあるいは包含するデータの貯蔵、表示および印刷あるいはデータの可視化の少なくとも1つ工程と;
f)i)該グループ分けから得られるデータ組の群および ii)該グループ分けから得られた該特性付け測定値の少なくとも1つの間隔([m/zION−Δm/zdev、m/zION+Δm/zdev]、[NION−ΔNdev、NION+ΔNdev];[m/zION−Δm/zdev、m/zION+Δm/zdev]、[tION−Δtdev、tION+Δtdev])の少なくとも1つに基づいて、あるいは工程e)により貯蔵され、表示されあるいは印刷されたデータあるいは可視化に基づいて、該少なくとも1つのサンプルの解析あるいは該成分あるいは生成物の少なくとも1つ解析の工程と;
実行することを特徴とするシステムにより実行可能なプログラムをさらに提供する(提案119)。
本発明の第1あるいは第2あるいは両者の態様によるプログラムに対しては、該指示に対応して、該制御ユニットは、該データ組を提供し、該グループ分けを行い、かつ提案1から114の1つあるいはいくつかによる方法にしたがって、工程e)およびf)の少なくとも1つを行うことをさらに提案する(提案120)。該プログラムは、提案1から114の1つあるいはいくつかにより定められるような方法を実行するために、提案115から117の1つによるシステムにより、実行できよう(提案121)。
本発明による指示のプログラムは、少なくとも1つの測定サブシステムおよび少なくとも1つのグループ分けサブシステムからなる全体システムのグループ分けサブシステムのみを制御するのに役立つかも知れないということに注意するべきである。そのような場合、グループ分けサブシステムの制御ユニットは、測定サブシステムの検出ハードウエアにより提供され、またたとえば通信リンクを経由して、あるいはデータキャリヤーの手段により、グループ分けサブシステムに移されるデータ上で作用することを注意するべきである。追加のプログラムモジュールは、測定サブシステムを制御するのに役立つかもしれない。
さらに、本発明は、提案118から121の1つによるプログラムを具現化するコンピュータプログラム製品に関するものである(提案122)。このコンピュータプログラム製品は、該指示のプログラムを運ぶコンピュータ読み取り可能な媒体の形式であっても良い(提案123)。
さらに、本発明は、通信リンクを経由して、あるいはインターネットを経由して読み込むための提案118から121の1つにより、プログラムを蓄えるサーバーコンピュータシステムに関するものである(提案124)。
独立請求項により定められまた−さらなる利点に導く好ましい実施態様およびデザイン−従属請求項および前述の異なる提案により定められる本発明は、全てのシングルあるいは全次元の測定値を明確に変数として、すなわちランダムあるいは確率論的な変数として処理することを可能にし、また明確に提供する。これは、関連する特性付け測定値(たとえば、質量対電荷比および時間あるいはスキャン数値)のプリセットされたグリッド(ハードビン)上での変動として、たとえが各定量的測定値(たとえば、イオン強度)を処理するよりも、一般的により正しく応用測定手段を反映させる。
さらに、異なった態様および追加の提案における本発明によれば、適当にすれば、たとえば、内部標準サンプルなどの品質サンプルあるいは参照サンプルを含めた測定操作の全測定からの変化量の特性に関する情報を得ることが出来る。したがって、より信頼性のある情報を得ることが出来る。
LC−MSスペクトル分析に関する出版された方法において、データポイントは、質量軸および時間軸上のプリセットされたグリッドのビン中に集められている。このようにして、1つの物質の信号は、質量軸の測定不正確により、2つの異なったビン中に位置づけられ/検出され、そしてこれが次のエラーを導くことになる。
−ピークへのビンの誤った割り当て
−ピーク中での誤った全強度値
−保持時間軸に起きるギャップが、ピークとしてまったく認識されていない正しいピークを導くことすら起きるかもしれない。
本発明は、グリッドのスキームを共に残すことを、また各サンプルから得られる信号あるいは測定データにより求められるビンの位置と大きさを持つことを目的としている。このようにして、ピークの未検出は、避けられかつ検出されたピークの測定は、おそらく3次元以上の全てにおいて、より精密になる。
適用された技術、たとえばクロマトグラフィープロセスおよび質量スペクトル分析による検出に基づいて、データ前処理および処理プロセスの多くの設定パラメータが、特にグループ分けが根拠としている統計モデル化に対して自動的に見出されることになろう。設定パラメータの見積もりは、適用されるモデル化により、何が代表的であるかにより、個々のサンプルに対しおよびサンプル数に対しグローバルに両者にサンプル特異的に、行うことが出来る。このようにして、データ前処理およびデータ処理の重要なパラメータの手動設定をかなりの程度に避けることが出来、あるいは、少なくとも適度に行うことが出来て、測定状況および分析されるサンプルあるいはサンプル類という観点から、正確にできる。このため、データ前処理およびデータ処理を、ある機器から他の機器へあるいはあるオペレターから他のオペレターへの転送を容易にできることになる。
適用技術についての、たとえばクロマトグラフィープロセスおよび質量スペクトル分析による検出についての知識に基づいて、適切なパラメータ、条件および前提たとえば統計的モデル化における前提、および測定精度を守るための最小限の必要事項は、品質制御の意味から、全ての次元において自動的にチェックされる。
本発明は、ある応用領域に限定されるものではない。本発明の方法、システムおよびプログラムを2つの態様に適用するのに適しかつ異なった提案にしたがっている分析システムおよび方法およびデータフォーマットに対するいくつかの例は、次の通りである:
A)質量スペクトル分析による検出器を用いたイオン源ユニットを経由して結ばれた分離された、たとえば時間分解信号オンライン、あるいは1つの共通イオン源ユニットあるいはいくつかの質量スペクトル分析による検出器を用いた各イオン源ユニットを経由して結ばれた信号オンラインを発生させる少なくとも1つの分析方法のあらゆる可能な組み合わせ。
−たとえば、MS分析器に直接に結ばれたクロマトグラフィー方法、電気クロマトグラフィー方法、あるいは電気泳動方法、たとえば、液体クロマトグラフィー(LC),ガスクロマトグラフィー(GC),電気クロマトグラフィー(EC)、電気泳動法(EF)、等速電気泳動法(ITP)
−たとえば、ESI(電気スプレーイオン化),APCI−MS(常圧化学イオン化),PI−MS(光子イオン化),MALDI(マトリクス支援レーザーイオン化),FAB(高速原子衝撃),EI(電子衝撃)イオン化技術,
−たとえば、4極子、トリプル4極子、TOF(飛行時間),FT(フーリエ変換)質量解析器
質量スペクトル分析データの全ての共通タイプは、データ入力、たとえば;−連続スペクトルデータスペクトル軸中のデータ密度は、MS検出(ダルトンあたりのデータポイント)のパラメータによってセットされる:−質量ピークおよびその高さの平均質量対電荷値により特性付けられる連続データの削減された形式として使用できる。
B)測定の各分離点あるいは時間点における多重信号の取得という観点で、スペクトル信号あるいは多重信号を生成する少なくとも1つの検出器と組み合わせて分離された、たとえば時間分解信号を発生させる少なくとも1つの分析技術のあらゆる可能な組み合わせ。
−たとえば、分光測光法(たとえば、DAD,IR,蛍光、光学2色性、レーザー散乱)
−たとえば、電気化学的(たとえば、電量分析)
分光測光法検出器に対して、LC−MSデータなどのデータに関して示唆されるいくつかの予測間隔(たとえば、確信間隔)以内の測定/非測定のデジタルモデル化の使用は、適当なスペクトル中の信号のスペクトルバンド幅以内の測定数に対するいくつかの連続あるいは不連続のモデル化により、置換できる。
ベイジアン習得に使用される初期の確信間隔は、その値が、通常は無視できるから、測定の期待エラーによってのみ決められるのみならず、適当なスペクトル中の信号のスペクトルバンドの期待幅によっても決められる。
C)シリアルあるいはパラレルの2つ以上の検出器と組み合わせて、分離された、たとえば時間分解信号を発生させる少なくとも1つの分析技術のあらゆる可能な組み合わせ。
−2つ以上の質量スペクトル分析検出器の組み合わせ、あるいは例A)およびB)の2つ以上の検出器の組み合わせ
例:検体(たとえば、溶出液)の流れは、クロマトグラフィー分離後、同一あるいは異なる流速を持つ2つ以上の特定の流れに分けられ、さらにそれらは、異なるタイプの検出器中に平行に導入される。両検出器から生じた信号は、測定された品質/特性(たとえば、質量対電荷比、波長)および量(たとえば、強度/カウント/吸光度)に依存しない分析の全ての時間点における補足的情報を表示する。
2つ以上の検出器の組み合わせのいくつかの技術的特性(たとえば、キャピラリー長さ、種々の流速、フローセルあるいはイオン源デザイン)は、同一の操作からデータの時間軸の不和合性となる検体流れの同じ部分に対する信号取得の種々の遅れを生じる。時間軸の一致は、相対的時間上での全ての測定から、内部標準に対する信号の割り当てにより起こる。このプロセスは良く知られており、クロマトグラフィーの応用にしばしば使用される(たとえば、溶出指標)。
全ての他の測定状況において、分離された、たとえば時間分解信号実質的データの削減は、適切な信号の抽出およびノイズ除去の抽出という観点で得られよう。
本発明により得られるグループ分けの結果に用いられる適当なパターン認識アルゴリズムと協力して、本発明の方法およびシステムは、たとえば、生物学、生物化学、あるいはヒトの診断への応用を見出すことが出来る。いくつかの例は:、
1.毒性、細胞および組織バイオロジーにおける生物学的システムに対する外部刺激の多検体への影響の研究。
2.代謝研究、新しい代謝産物の同定、代謝経路の記述および代謝障害
3.傷病の非治療の種々の段階から治療される病人の正常人との認識/識別、予見/前向き研究のみならず調査過程の傷病(侵攻性対非侵攻性、遅い成長対速い成長)のタイプ
4.ヒトの診断における標識のスクリーニング
2つの態様および異なる提案における本発明を、図示的な非限定的例のLC−MSスペクトル解析、特にLC−ESI−MSスペクトル解析に基づいて、またLC−MSデータ、特にLC−ESI−MSデータおよび本発明の第1および第2態様によるグループ分けの好ましい具体例に基づいて、より詳細に、次に示す。この点に関して、それは、次の図示的図、ダイアグラムおよびフローチャートを参照する:
次のようなLC−MSスペクトル分析法、特にLC−ESI−MSスペクトル分析法の測定状況において、3次元測定データは、―第1次元−スキャン数(Ni)あるいは保持時間値(ti)あるいは検出時間(ti)により、および−第2次元−質量対電荷値(m/zi)により、および―第3次元―強度値(li)あるいはカウント数により定義される1つのデータポイントあるいはデータ組により得られるという仮定をたてる。本発明により可能なように、データ前処理およびデータ処理は、3次元ランダムベクトル(一般に多次元ランダムベクトルの)の実現としての信号のこれらの測定値に関して、ベースとしている。
基本的な考え方
ある測定状況に関する本発明の実行に対して、使用された技術およびハードウエアの特性は、そこから生じる信号あるいは測定データの特性に関して解析されるべきである。これに関して、使用された技術およびハードウエアに基づいて得られる測定値の3次元(一般に多次元の)分布の特性は、解析されるべきである。
一般に、信号の源は、各測定値分布の形状とパラメータを決める。異なる源から由来する信号の分布のそのような特性に基づいて、不適切な源から高い確率で来る信号をろ過することが、一般には、可能になる。適切な分布のパラメータは、前提とした源にもよるが、個々のサンプルに対してサンプル特異的で、あるいはサンプル数に対してグローバルであると見なしても良い。
イオンの信号は、LCプロセスにより、保持時間の分子特異的分布を持ち、MSプロセスによっては、m/z値のイオン特異的分布を持っている。あるスキャン時間とあるm/zにおいて、ある元のイオンが測定できるという条件の下に、強度分布は、a)物質の平均保持時間;b)イオン化プロセス;c)サンプル中の物質の組成に依存する。サンプル中の物質の濃度が、測定強度に強い影響を与えるだけでなく、たとえば共溶出物質との可能な抑制メカニズムのような異なる物質間の相互作用も、強い影響を与える。これらの影響の測定可能な結果は、サンプル中の物質の組成についての潜在的に興味ある情報を提供する。
ここで、測定データ中にあるデータ部分を生じかつそれに対して測定データ中にピークを見出さなければならない各サンプルの成分のみを一般に参照する。しかし、元のサンプル中に既に含まれていなかったある他の物質を生じる分析技術を使用することは、排除されるべきではない。この物質(ここでは、生成物として示す)が形成されている出発材料でさえも、サンプル中に元々含まれていないことであってもよい。それにもかかわらず、追加の物質あるいは生成物に由来するピークの同定が、サンプルの特性付情報を与えるように、追加の物質あるいは生成物が、サンプルのなんらかの特性を反映してもよい。勿論、通常のLC−MS分析では、特性付けられるサンプルの成分以外の追加の生成物は、一般的にない。
ノイズ除去
第1工程で、電気的あるいは化学的ノイズは、ろ過できる。これらを識別するための可能な基準は、測定される強度値の高さである。電気的ノイズは、検出されるイオンからは生じなくて、かつその程度において、m/z値および保持時間は、意味が無い。たとえば、LC−MSシステムの全成分の不可避の汚染により説明することが出来る化学的ノイズは、常におよびどこでも(保持時間およびm/z領域参照)弱い信号が、測定されることに特徴がある。化学的ノイズの対数化された強度値の分布は、通常の分布により容易に記載できて、その期待値は、他の信号クラスターの期待値より特徴的に低く、また電気的ノイズに属する第3信号クラスターの1つより高い。図1は、対応する例を示す。対数化された強度値の柱状図においては、真の信号と化学的電気的ノイズのあいだには谷あるいは最小値がある。このようにして、対数化された強度値の柱状図における谷を見出すことにより、ノイズ信号と非ノイズ信号のあいだにはよく分離された線を引くことが出来る。この境界線は、従来のデータ処理技術に基づいて、多に中の最小値を見出すことにより、各個々のサンプルに対して、自動的に求めることが出来る。
本技術の系統的人工物
サンプルから来ない物質は、サンプルの物質の組成に関する適切な情報をほとんど提供しないか、あるいはまったく提供しない。移動相のイオンの信号および添加した標準のイオンの信号は、この測定法の人工物である。分布のパラメータは、ブランク測定中および標準品の測定中におけるサンプル数に対して、あるいはサンプルのグループに対して、グローバルに求めることが出来る。これらの測定に基づいて、同定テンプレートおよび削除テンプレートを定めることが出来て、それは、それに対してそれらが、典型的なm/z値および保持時間を示すので、添加した標準から、あるいは移動相から最も来そうな質量および保持スペース(領域)中の信号を同定しまた望みにより、削除する。典型的な強度が含まれる3次元同定テンプレートおよび削除テンプレートは、さらに、検出されることになっている、また望みにより、削除される共溶出分子および相互作用現象の信号を出すことになろう。
スパイク除去
クロマトグラフィープロセス以内に、ノイズの典型的な特性も物質の典型的な特性をも持たない全ての他の信号は、スパイクと呼ばれる。主な原因は、たとえば移動相、カラム、キャピラリー中のあるいはイオン源中の測定機器側の全ての種類の「土くれのような」汚染であると考えられる。このことが、クロマトグラフィー特性による予想外のときに、現れるイオンをもたらすことになる。このような信号は、再生できなくて、このため、実際の統計モデルには採用するべきではない。スパイクの信号は、その信号が、真のピークの分布前提を満足しないという事実に基づいて、除去しても良い。各適応基準に対する閾値の値は、個々のサンプル以内あるいは種々のサンプルに対してグローバルに求めてもよい。もし、グループ分けが、適当な条件に基づいている場合には、ピークの除去は、グループ分けの過程で自動的に行うことが出来る。
分布モデルの適用
前提とされる図示的状況において使用可能な分布モデル用の例を次に示す。
電気的ノイズ
好ましくは、強度分布のみが、時間軸および質量軸を考慮することなくモデル化される。換言すれば、ランダムベクトルのみが、電気的ノイズを特性付けるための強度の境界分布を考慮している。期待値が、この分布に対して存在することを仮定する。
l(el)〜F(μ(el)) (F1)
化学的ノイズ
再び、好ましくは、強度分布のみが、時間軸および質量軸を考慮することなくモデル化される。正規分布が、強度の対数に対しての分布タイプとして仮定する。
log10l(ch)〜N(μ(ch),σ(ch)) (F2)
質量対電荷比の測定における質量測定エラーの分布
イオンM*の質量対電荷比を測定するために、小さなねじれがあるという可能性を考慮に入れて、正規分布測定エラーを仮定する:
MZ−mz(M*)〜N(δ(M*),(σ(M*)) (F3)
最も簡単な場合、測定エラーが、全てのイオンを等しく関与しているということ、すなわち
すべてのM*に対してδ(M*)≡δ,σ(M*)≡σ
が、有効であると仮定する。しかし、イオンの質量対電荷比のサイズあるいは強度のサイズにより、測定エラーをモデル化することが、適当であろう。
保持時間および強度の分布
1次事象は、時間Tすなわち保持時間Tを持った物質の1つの単一分子の溶出である。
最も簡単なモデルにおいて、クロマトグラフィープロセス中のある物質の単一分子の保持時間に対して、正規分布を仮定してもよい。
T〜N(μt(M),σt(M)) (F4)
これから、スキャン時間tS−1とtSのあいだでのある物質の分子の溶出の事象に対するベルヌーイ分布を、次の2つの式でフォローする:
l(M)|ts〜Bin(1,p(M,ts)) (F5)

p(M,ts)=φ(ts|μt(M),σt(M))−φ(tS-1|μt(M),σt(M)) (F6)
正規分布の前提は、稼動プロセスの全体簡素化である。その基本モデル−放射状拡散プロセスに依存しているファン・デイームタ理論における質量転移および乱流拡散−は、勾配溶離の使用によりすでに妨害されているが、クロマトグラフィープロセス(たとえば、不動のあるいは静止相を持っている物質の2次相互作用、混合保持メカニズム、経時変化による不動相の機械的および化学的変化)における種々の他のプロセス稼働を経由しても妨害されている。ある単一の物質を測定するときに、保持時間の分布に対して、さらに複雑なモデルがあり、それらが、上記のプロセスをさらに詳細に記述する。全てのモデルは、共通に、内在する分布が、単一モードであり、またそれらが、尖度におけるよりもむしろ歪曲あるいはねじれて、正規分布からズレている。
さらに、一般的には、(F6)に対して次のように書ける。
p(M,ts)=F(ts|MΔtS)−F(tS-1|M,ΔtS-1) (7)
式中、Fは、単一モード分布クラスから来ておりまた分子特異的パラメータ、および溶離特異的パラメータおよびかくして時間依存性パラメータにより、正確な形で求められる。
(F6)あるいは(F7)から、1次事象に対して、ベルヌーイ分布は、ある物質のあるイオンが、2回のスキャン時のあいだに検出されていることを、フォローしているが、このイオンが、イオン化プロセス中に生じるという事象がさらに起きるに違いないから、成功の確率は小さくなる。
l(M)|tS〜Bin(1,p(M*,tS) (F8)

p(M*,tS)=p(M*,M)p(M,tS) (F9)
LC−MSプロセス中の「真」の信号の強度は、2回のスキャン時のあいだの物質のある電荷数を用いてイオンの検出を行う頻度である。ベルヌーイ分布の1次事象が独立であるという簡素化仮定の下に、またNM分子が、クロマトグラフィープロセスに暴露された場合には、このことは、従法線分布により記述される。
l(M*)|tS〜Bin(NM,p(M*,tS)) (F10)
抑制メカニズムは、p(M*,M)を削減するかもしれないということに注意するべきである。MS機器の過敏性およびノイズカットオフは、ランダム変数の具現化を検閲して観察することになる。
移動相の物質
質量スペクトル分析器のイオン源への移動相の連続した流れは、大抵非常に強い溶媒クラスターイオンをデータのLC−MSセットの背景に出現させる。これらの信号は、生じたクロマトグラフィープロセスの特性をなんら示さないので、2回のスキャン時tS-1とtSのあいだでのそれらのイオンの1つが出現する頻度は、入力NM(ΔtS)の(初期発生)量とイオン化の確率により支配される従法線分布となる(NM(ΔtS)が、全てのΔtSに対して大きい場合):
l(M*)|tS〜Bin(NM(ΔtS),p(M*,M)) (F11)
製品
もし用いられた分析技術あるいは技術が、ある生成物を生み出す場合には、適用できる分布モデルは、生産メカニズムに依存している。当業者なら、適当な分布モデルをセットアップできる。
本発明にしたがったデータ前処理およびデータ処理
そのような理論的考察およびモデルに基づいて、測定データのグループ分けは、既知のおよび未知のイオンのピークを見出すための現在の図示のケースにおいて、既知のおよび未知の成分あるいは生成物のピークを見出すために実行できる。
その処理の始めにおいて、たとえば、図1にしたがって、強度値の仮想対数分布に基づいて、好ましくは、データのノイズ除去をする。真のデータから得られる密度柱状図において、真の信号と電気的および化学的ノイズのあいだの最小値を探し、その後ノイズに起因する信号を除去する。「統計的パターン認識」あるいは「ベイジアン習得」を適用する必要は無い。個々に提案している好ましいアプローチにおいて、分布F1およびF2による理論的モデル化は、ノイズ除去アプローチを与えることのみに役立つ。「統計モデル」は、理論的モデルを、ノイズ信号と真の信号とのあいだの境界が、柱状図の谷間で探さねばならないということを予測していることとして、その程度でのみ適用される。
しかし、ノイズ除去後残留している信号のグループ分けに対しては、ベイジアン習得は、サンプルの各成分、あるいはサンプルの集合あるいは該サンプルあるいはサンプルに適用される技術の1つあるいはいくつかから生じる生成物の各成分おそらく関連しているグループあるいは間隔中のグループデータに適用される。
好ましい実施の態様におけるベイジアン習得は、信号あるいは関心のあるデータ組をグループ分けするのに基本的には役立っており、それらは、使用される技術にもよるが、幅、たとえば4極子質量スペクトル分析器に対しては約±0.2Daの幅、飛行時間スペクトル分析器に対しては約±0.002Daの幅およびフーリエ変換スペクトル分析器に対しては約±0.0002Daの幅を持ったか確信間隔以内の各成分あるいは生成物におそらく関連していると思われる。確信間隔(および期待される測定精度)の選択は、MS分析器におけるイオンを分離する方法に依存している。ここで述べる値は、従来の測定条件の下で予測される典型的な測定不正確さである。
このグループ分けから得られる信号のこれらのグループに対して、選択されたイオンモニタリング(SIM)クロマトグラムの種類における次元の削減が、m/z次元中の全てのデータポイントを、各時間値あるいはスキャン数以内に結びつけることにより、得られよう。好ましくは、このグループ分けは、ベイジアン習得から得られる確信間隔上で行われるだけでなく、追加の条件上でも行われる。特に、各成分あるいは生成物に関連する信号および人工物などの他の信号のあいだの識別は、各確信間隔以内の強度値が、強度カットオフ条件、単一モード性条件および尖度条件の少なくとも1つあるいはいくつかを満足するものとするという条件に基づいて、得られよう。この強度カットオフ条件は、真のピーク下にある領域は、真の信号として認知される閾値を越えているものとするという前提に基づいている。この単一モード性条件および尖度条件は、真の信号および人工物などの他の信号が、信号の形に基づいて識別できるという前提に基づいている。
外部標準を基にした測定から由来する出発値からなどの、所定の出発値からスタートして、各確信間隔は、ベイジアン習得により(特に狭められて)決定されあるいは改良される。外部標準の測定から由来する出発値は、内部標準に基づいた特定の測定状況あるいはシステムに、LC−MSスペクトル分析の場合には、内部標準に帰せられる信号に選択的なアルゴリズムを用いることにより、各サンプルとともに溶出する、あるいは各サンプルに添加される内部標準に基づいて、適用してもよい。その後、望みにより削除テンプレートを用いて信号を除去してもよい。
移動相に帰せなければならない信号も対応する削除テンプレートを用いることにより除去できることを加えるべきである。関心のある成分あるいは生成物から由来する信号、あるいは未知の成分あるいは生成物から由来する信号のグループ分けの前に、このことが、好ましくはおこなわれる。
測定エラー分布N(δ、σ)のサンプル特異的習得
測定エラー分布は、添加された標準に割り当てられる信号の助けを用いて、習得できる。これらの真の質量対電荷比は公知であるので、いかなる乖離度も観察されよう。好ましくは、測定エラー分布は、全ての物質およびイオンに対して同じであるという仮定をすることにより、ベイジアン後評価が用いられる。このようにして、あまり情報量が高い場合、およびもし前提とした測定エラーが、あまりにも小さい場合に、グループ分けプロセスで標準のイオンピークとして集められる信号をなんら見出すことが出来ないので、ベイジアン習得に選択される前の分布は、明確にチェックされる。この後分布は、各サンプル内の測定エラーが、許容できるかどうかをテストするために使用できる。もしこれがこの場合であると、あるいはそのようなテストをしないでアルゴリズムを実行すると決心する場合には、添加された標準に関係するデータ上でのベイジアン習得から得られる測定エラーの後分布は、未知の物質中のイオンに対するピーク検出用の前分布として役立つ(図3を比較)。
他のオプションは、観察される測定領域内の不等測定エラー分布を仮定した測定エラー分布のベイジアン後評価であろう。
既知の物質の信号の検出
初期仮定:LC−MSが適用される物質あるいはサンプルの内、1つ以上のイオンの質量対電荷比および関連ピークの保持時間は、同じシステムで行われる以前の測定などから知られている。質量スペクトル分析器を用いた経験は、たとえば「90%の確実性で95%の観察が、イオンの真の質量対電荷比を最大±0.4Daだけミスをする」という測定エラーの確定間隔についての不確かなメッセージを可能にしている。これが、測定エラー分布の未知のパラメータに対する前分布を求めるのに役立っており、その助けにより、イオンの信号のm/z値(m/zウインドウ)に対する予測確信間隔が、確立できる。
既知の保持時間の前のスタートスキャン時間において、既知の真のm/z値の周りのm/zウインドウ内の観察の調査を開始する。そのような信号が見出されるときには、次のスキャンにおいて、同じタイプのイオンのm/z値に対するベイジアン更新スキームにしたがって、新しい予測確信間隔が、形成される。もし、1連のあるいは現在のm/zウインドウ内に少なくとも1つ以上のスキャンに亙り観察が無い場合には、そのピークは完成されたものだと考えて、さらにこのm/zトレースの近傍に沿った信号は、同じイオンには属さないと考えられる。スキャン時間が、現在の保持時間よりなる信号のグループは、各標準イオンのピークとして同定される(図13を比較)。
いくつかの信号を未知のイオンのピークとしてグループ分けすること
未知のm/z値を持ったイオンに対する調査は、測定エラー分布のパラメータに対する前分布に基づいてスタートされる。最初のスキャンを開始して、次のスキャンにおける同じタイプのイオンに対する予測間隔を、ベイジアン習得による各観察されたm/z値に対して、計算する。第1の信号を検出後、既知の物質に対するのと同じスキームにより、信号は、グループ分けされる。しかし既知の物質と同じという検出された「類似の」信号は真のピークであるという確かさは無いから、更なる基準は、たとえば用いられた技術の人工物などの他の可能な事象からのピークと識別するために使用される。
モデル化するという意味において、m/zウインドウ内の継続的スキャンにおけるいくつかの信号が、見出されるときに、次の事象が、起きたかもしれない:
1.ノイズ事象:ノイズカットオフ以上に存在する化学的ノイズイオンの偶発的接近
2.ピーク(ピーク事象):信号は、サンプルのクロマトグラフィーで分離された分子のイオンに属する。
3.いくつかの重なりピーク(ピーク事象)
4.恒久事象:信号は、移動相のイオンに属する。
5.スパイク(スパイク事象):溶解された汚染物のいくらか異なった、たとえばいくつかの信号が、あるいは他の非系統的人工物が測定された。
ノイズ事象からのピークの識別
ノイズ事象からのピークの識別をするために、強度カットオフをセットしてもよく、その値は、そのサンプル内の谷柱状図中に求めても良い(図1を比較)。
強度カットオフを求める例
強度カットオフを求めるために使用する観察される強度は、出来るだけ低い確率を持つべきであり、全てノイズ事象であるべきである。これは、たとえば、それらの最大値あるいはそれらの平均値が、ノイズの強度の3−σ領域外にあるときの場合である。ノイズ強度の変動は、各個々のサンプルに対する谷柱状図中で検出されよう。
それから由来して、強度値の合計に適用されるなんらかの弱い強度条件も求められようし、この強度条件により強度値は、真のピークであると同定される最大値を越えるものとする。これらが、典型的には、より短く起こりまた真のピークよりも小さい強度で起きるので、これは、スパイクの識別にも有用である。
スパイクからのピークの識別
スパイクからのピークの識別のために、時間ウインドウに沿って強度値の形状を使用しても良く、それは、ほぼ正規の尖度を持った単一モード分布の柱状図に対応するべきである。これは、分布モデル(F10)中の成功確率(F7)の時間における変動による。
したがって、単一モード性からの乖離度について、あるいは尖度についてなんらかを言う柱状図の各パラメータを、識別のために使用しても良い。
これらのパラメータに対する閾値の値は、たとえばブランクおよび標準測定中に結びつけて考えられるいくつかのサンプルから求めるべきである。
重なるピーク類からのピークの識別
適当な基準は:
単一モード性からの乖離度
モデル(F11)のベイズ因子およびタイプ(F11)のいくつかのモデルの混合物
一定ピークからのピークの識別
適当な基準は:
単一モード性からの乖離度
ブランクの測定における習得されたm/z値への近傍
モデル(F11)およびモデル(F10)のベイズ因子
べイジアン習得スキームあるいは更新スキーム
適当な分布により定められる現在のm/zウインドウに基づいて、この第1データあるいは次のデータが、見出されるときに、このデータポイントが、各成分あるいは生成物におそらく属しているかいないかが、決定される。もし、このデータポイントが、この現在の質量ウインドウに入らない場合には、そのときには、このデータポイントは、各グループの候補の1員という意味で、各成分あるいは生成物に属することが、決定され、またの現在のm/zウインドウに入らない場合には、そのときには、このデータポイントは、各成分あるいは生成物に属さないことが、決定される。
内部標準の場合には、初期のm/zウインドウは、内部標準の公知のm/z値およびこの公知の値の付近のm/z値が、この間隔に含まれるように、公知のm/z値の付近に確立されるm/z間隔に対応する。測定エラー分布としては、既知のm/z値に集中する正規分布が想定される。
未知の物質(成分あるいは生成物)の場合には、初期のm/zウインドウは、未知の成分あるいは生成物に由来する信号は、予測されているm/z軸の全領域をカバーする。「真」のm/z値は、まだ知られていないので、正規分布ではなくて、いわゆるt−分布に対応する正規分布の代わりの分布が、仮定される。
第1のデータポイントが、見出されると、そのときには、このデータポイントが、各成分あるいは生成物におそらく属しているかいないのかを、決定する。もしこのデータポイントが、初期のm/zウインドウに入らないときには、そのときには、このデータポイントは、ある成分あるいは生成物に属し、またこのデータポイントに基づいて、適用可能な分布(公知物質の場合には正規分布および未知物質の場合にはt−分布)が、このデータポイントに基づいた分布の各パラメータを設定することにより、更新される。この更新された分布から、新しいm/zウインドウが、求められる。もし、時間軸あるいはスキャン軸に沿って続くデータポイントが、このm/z値に入らないときには、そのときには、このデータポイントは、同一物質に属することを仮定する。
このm/zウインドウは、大多数、たとえば同一サンプルに属する全データポイントの99%が、現在の分布により、m/zウインドウに入るように定められる。
測定エラーの分布に基づいて、確立される現在のm/z間隔あるいはm/zウインドウに入るデータポイントのグループを見出すことは、これらのデータポイントを、一般的には、各物質に属するピークとして同定するための十分条件ではない。したがって、一般的な追加の条件を採用するべきである。
1つの条件は、上述した強度カットオフ条件あるいは強度条件である。
他の条件は、真のピークと他の現象のあいだの有効な識別を可能とさせる単一モード性条件である。諸ピークを見出すことが出来るばかりではなく、重なりピークも解像される。単一モード性条件の実行に対するチェックは、次のように実行しても良い:測定値の柱状図は、いわゆるS−曲線に理想的に対応する第1曲線まで積分するかあるいは合計する。その後、第1曲線は、微分され、元の不連続なデータポイントを表示する第2曲線を得る。第2曲線と柱状図(分布)の測定値の正の差を合計することにより、次の単一モード性曲線からのズレに対する尺度が、得られる。この尺度を、閾値と比較する。単一モード性条件は、この尺度が、たとえば10%より小さければ実行されると仮定する。
単一モード性に対するチェックは、真のピークを見出すための唯一の適当な方法ではない。測定値の仮定された分布の追加の特性は、たとえば分布の尖度あるいは柱状図と考えても良い。尖度という語彙は、第4の中央モーメントを分布あるいは柱状図の第2モーメントを2乗したもので割った値とする。正規分布に対する3の尖度値に基づいて、約±0.1のズレは、対応する尖度条件を実行するために許容される。
ここで考慮される好ましい実施の形態によれば、ベイジアン習得も、ベイジアン習得スキームあるいはベイジアン更新スキームも、時間軸あるいはスキャン数軸に沿って測定値を見出すためには適用されない。ベイジアン習得あるいはベイジアン更新は、m/z軸に沿って測定値を見出すためにだけ適用される。しかし、他の状況では、全ての適切な軸に関してのベイジアン習得は、適当であってもよい。
一般的ベイズ習得
ベイジアン統計では、確率分布は、(将来の)事象について仮説を設けるときに、不確実性を定量し、またそれらは、世間の未知の「真」の状態について仮説を立てる不確実性を定量するためにも使用出来る。
ベイジアン習得理論は、もし新しい証拠あるいは将来の事象あるいは世間の未知の状態に関しての情報―データが、届く場合には、不確実性の現状レベルを以下に更新するかということを規定する枠組みである。この更新メカニズムに対する基礎式が、いわゆるベイズ式である。それは、レベレンド・トーマス・ベイズ氏により、彼の死の2年後に、1763年に最初に出版された。ベイズ、トーマス「機会の原則における問題解決へ向けての随筆」Philosophical Transaction of the Royal Society(1763)53:370-418。そのもっとも簡単な形式においては、Hを仮説またEを証拠とすると、それは、次のことを述べている:
Pr(H|E,C)=Pr(H|C)Pr(E|H,C)/Pr(E|C)
ここで、Pr(H|E,C)は、現在の状況C(Hについての不確実性の状態)を与えられEを得た後H中の信頼の確率であり、またPr(H|C)は、Cを与えられ、Eを考慮する前にHの前確率である。この理論の左辺Pr(H|E)は、通常はHの後確率とされている。
もし、データが反復して集められあるいは流れとなって入ってくる場合には、1ポイントにおける後確率(それは、仮説のセットおよびそれらの準セットに対する後確率の収集である)のいずれも、次のポイントの前確率である。また、2つの後分布は、組み合わされて、結ばれた後分布を形成することが出来る。
ある機器の質量対電荷の測定エラーについて前分布を求めること
同一タイプからのイオンの「たいていの」測定が、出現するということが、期待されるところでは、あるm/z間隔の長さを特定するように頼まれる専門家にとっては、対応する見積もりを提供するのに、一般的には問題は無いであろう。さらに、その専門家が、彼あるいは彼女が該情報についてどのくらい確かであるか(たとえば、C=80または90%?)ということを定義するように頼まれたとき、この専門家は、そのような見積もりを与えるのに一般的に問題はない。それは、ある実験の結果について賭けを考える場合のちょうどそのようなものである。全ての測定の(1−α)*100%の百分率に対するある予想間隔の観点で「たいてい」を解釈すると、ベイジアン習得あるいは更新スキームに対する基礎としての前分布を求めるための基本情報は、入手可能である。これらのメッセージは、ベイジアン統計の方法により、容易に組み合わされて、前分布を形成する。特定された確実性の効果は、それが低ければ低いほど、後分布上への入手データの影響は、高くなる。ベイジアン統計の批評家たちは、ベイジアン統計の多くの応用の中で、前分布の影響を最小にするためには、「データに、データ自身を語らせる」ことが、ベストであろうとしばしばクレームしている。しかし、現在の状況では、このアルゴリズムが、同時に溶出しかつやや異なったm/z値を持つイオンの特定から、標準の特定されたイオンの測定をともかくも識別できるように、測定された値あるいはあるタイプのイオンが、このイオンの真のm/z値に近くなるというある確実性を必要とされているから、確実性Cがあまり小さすぎないことが、一般的に重要である。さらに、専門家が、「4極子分析器を用いると、自分は、90%の確実性で、質量不正確性が±0.2Daになると期待する」というこのようなメッセージを出すことは、一般的にまったく問題がないであろう。
ある未知のイオンの質量対電荷値のベイジアン習得
ベイジアン更新あるいは習得アルゴリズムの好ましい実施の態様は、ゲルマン、カーリン、スターンおよびルビン(1995年、3.3章):ベイジアンデータ解析、チャップマン・ホール/CRCに記載されているように、共役前分布を用いた正常データのベイジアンモデルに基づいている。頁数は、CRCリプリント、2000年を参照のこと。
ベイジアン習得のプロセスは、パラメータμ0、σ2 0、k0およびv0を持った所定のN−lnv−X2前分布を用いてスタートする(式(3.6)、71頁)。
パラメータσ2 0およびv0は、専門家の質量エラー分布上の規格を用いて、セットアップされてきたし、既知の真の質量対電荷値をもった内部標準のイオンの観測されたピークによるあるサンプルの与えられたLC−MS測定に対して潜在的にすでに更新されてきた。
未知の物質に対して、μ0およびk0を特定するために、質量対電荷値の観察された間隔[L,U]上で、期待値(すなわち、この間隔の中間)における正規分布の最大確率の最小値(すなわち、LおよびU中で)の比が、1/0.9999に等しくなるように、フラットプライアが取られる。
ここで、あるイオンが、スキャン時間t1において質量対電荷値y1を用いて検出されたと仮定する。分散σ2で測定される未知の質量対電荷値μに対する更新されたジョイント分布は、72頁上の式(3.7)下の式により、更新されたパラメータμ1、σ2 1、k1およびv1を持った、あるN−lnv−X2分布でもある。
72頁上の式(3.9)および73頁上の第1式にそれぞれ与えられているように、σ2およびμに対する限界後分布を、これらから計算できる。このように、真の分散σ2についての不確実性は、自由度v1およびスケールσ1 2を持った、あるスケールされたlnv−X2分布により記載される。このようにして、真のパラメータμについての不確実性は、自由度v1、位置μ1およびスケール(σ1 2/k0-0.5を持った、あるt分布により記載される。
32頁上の式(2.7)および式(2.8)を用いて次のスキャン中に検出される同じタイプのイオンの場合での質量対電荷値についての期待値をコードする予想後分布を、これらから計算できる。このように、質量対電荷値についての不確実性は、これらのイオンの真の質量対電荷値μについての不確実性のように、あるt分布によっても記載される。この分布は、μについての不確実性を記載している分布と同じ自由度v1および位置μ1を持っているが、未知の分散σ2により測定された値が、真のパラメータの周りに広がるという知識から生じる大きなスケールを持った分布である。このスケールは、かくして、(σ2 1+σ1 2/k0-0.5である。
この分布の(1−a)間隔は、対応するt−分布のα/2百分率および(1−α/2)百分率により与えられる。この間隔は、スキャン時間t2に対する質量ウインドウを定める。
もし、あるイオンが、そこで検出されると、μ1、σ2 1、k1およびv1が、μ0、σ2 0、k0およびv0に取って代わり、また同じ習得プロセスが、上記のようにスタートする。
また、前述:ゲルマン、カーリン、スターンおよびルビン(2003年):ベイジアンデータ解析、チャップマン・ホール/CRCおよびテキストブック:D.S.シルビアによる「データ解析、ベイジアン指導書」(1996年、オックスフォード大学出版部)を参照したテキストブックの第2版を参照のこと。このテキストブックは、ここに考察した測定状況の背景中および他の測定状況の背景中における測定データのグループ分けに適したベイジアン習得スキームをセットアップするために必要とされる全ての情報を包含する。
m/z軸に関する分布モデルとしてここに考察しているいわゆる「共役プライアを持った正規モデル」のほかに、他の分布モデル、たとえば、測定可能なm/z値の不連続性を考慮できるいわゆる「共役プライアを持った多項式モデル」も、用いても良い。
たとえば「ベイジアンデータ解析」から異なった式類は、閉鎖された形式では常に正確には解かれないので、多くの解が必要であろうということを、付け加えるべきである。処理の効率化のために、近似の解たとえば、スチューデントt−蓄積分布関数の逆を計算するための解を計算することさえ、有用であろう。適切な式のそのような数値解あるいは近似の解は、熟練した人なら容易に実行できる。
ベイジアン習得スキームの好ましい実行
すでに示したように、成分あるいは生成物、特に未知の成分および生成物に関して特性付けられるサンプルに対しての測定データのグループ分けは、標準の測定に対して得られるグループ分け結果を考慮しているベイジアン習得スキームに基づいている。さらに、ブランク測定に関するグループ分け結果を考慮することが好ましい。
この点に関して、「グローバルな」処理スキームを次のように提案する:
1.内部標準のみを含んでいるサンプルの測定セットの処理(「標準測定」)
出力:
a)各標準物質s=1、...、S、各物質のイオンにより生じたデータポイントが見出されたm/z軸上の自動的に求められた間隔の数
b)質量測定エラーに対する後分布
2.なんらのサンプルを注入することのないバックグラウンド測定のセットの処理(「ブランク測定」)
出力:
移動相中の物質のイオンにより生じたデータポイントが見出されたm/z軸上の自動的に求められた間隔の数
3.測定されたサンプルのセットの処理
出力:
各サンプルに対して、サンプル中のイオンにより生じたピークの自動的に求められた数。
ピークは、
a)m/z軸(質量ウインドウ)上の間隔および
b)時間軸(時間ウインドウ)上の間隔により記載される。
これらの2つの間隔は、時間軸およびm/z軸を記述しており、その中では、ピーク検出アルゴリズムにより、同じタイプのイオンの測定が現れかつこのタイプのたいていの測定が、同じように他の測定されたサンプル中に現れると期待されている。
さらに、ピークは、
c)そのピークを生じる全てのデータポイントの強度値の合計である強度により記述される。
標準の処理に関して、次の「ローカル」処理スキームあるいは次の工程を提案する:
単一の測定に対しては、
1)ノイズ除去
2)標準物質の特定のイオンのピークの検出
a、質量測定エラー分布のチェック
b、それが充分であれば、質量エラー分布を更新する
3)特定イオンとして同じ時間間隔に現れるイオンのピーク検出。これらは、同様に、内部標準により潜在的に生じると考えられている。
4)時間の標準化
を行うこと。
標準測定セット中の情報の組み合わせに対して、
5)時間ウインドウおよび質量ウインドウの矩形が、少なくともある程度重なる測定のある百分率(たとえば80%あるいは50%)中に現れるこれらのピークの検出をすること。質量ウインドウは、組み合わされて「標準削除テンプレート」を形成する。新しい測定中の「標準削除テンプレート」の時間ウインドウは、それ自身内の内部標準の特定イオンピークを用いて、各測定中で個々に求められるであろう。
6)仕上げの質量エラー後分布に対する機器(ベイジアン習得)の質量エラー分布についての情報と全ての標準測定を組み合わせること。
「単一測定」として、少なくとも1つの内部標準を含む1つのサンプルに対して得られる完全な測定データセットは、ここに意味づけられる。しばしば、このような標準測定は、複数のサンプルに対して行われ、あるいは各1つのサンプルに対して数回、たとえば50回行われる。ここで前提とする「単一測定」は、アルゴリズムが時間ウインドウおよび質量ウインドウを検出するために用いられるそのようなデータセットの1つを参照する。もし標準測定が、複数のサンプルに対して行われてきたか、あるいは各1つのサンプルに対して数回行われてきた場合には、各単一測定に対して得られた時間ウインドウおよび質量ウインドウは、たとえば各個々のウインドウの全てを含む各エンベロープウインドウに対応するために、あるいは全領域のある百分率をカバーする平均ウインドウに対応するために、あるいはウインドウの重なりに基づいて、各時間ウインドウおよび質量ウインドウの組み合わせに結び付けられてもよい(工程5を比較)。有利にするために、個々のウインドウの組み合わせは、ベイジアン統計に基づいて行われてもよく、その結果、各個々のウインドウに関連する確信値は、生じた組み合わせウインドウの確信値に結び付けられる。数多くの異なった単一測定に対する各ウインドウの組み合わせは、図2に示す。
処理ブランクに関しては、次の「ローカル」処理スキームあるいは次の工程を提案する:
第1測定に対しては:
1)ノイズ除去
2)移動相中の物質のイオンの質量トレースの検出
ブランク測定セット中の情報の組み合わせに対して、
3)質量ウインドウが、少なくともある特定の程度重なる測定のある百分率(たとえば80%あるいは50%)中に現れるこれらの質量トレースの検出をすること。これらは、「移動削除テンプレート」の組み合わされた形式である。
再び、「単一測定」という語彙は、完全なブランク測定データセットを参照する。ブランク測定セットに対して得られるグループ分け結果を、工程3)により結び付けてもよい。
成分あるいは製品に関して特性付けられるサンプルの処理に関して、次の「ローカル」処理スキームあるいは次の工程を提案する。
単一の測定に対しては;
1)ノイズ除去
2)標準物質の特定のイオンのピークの検出
a、質量測定エラー分布のチェック
b、それが充分であれば、質量測定エラー分布を更新する
3)サンプル中の他のイオンのピーク検出
4)時間の標準化
サンプル測定の(サブ)セット中の情報の組み合わせに対して、
5)時間ウインドウおよび質量ウインドウの矩形が、少なくともある特定の程度重なる測定のある百分率(たとえば80%あるいは50%)中に現れるこれらのピークの検出をすること。これらは、サンプルの(サブ)セットに対する典型的なピークを形成するために、組み合わされる。
再び、「単一測定」という語彙は、サンプルに対して得られる完全な測定データセットを参照する。もし測定が、特定の1つのサンプルに関して数回行われてきた場合には、あるいはもし、複数のサンプルが、組み合わせて考慮されるものとすると、そのときには、工程5)にしたがって、各単一グループ分け結果を、結び付けることが出来る。
測定データの異なった集合に対して得られるグループ分け結果の組み合わせは、たとえば、もし、しかし「個々のサンプル」として考えなければならない、あるいは一方では、関心のある情報を組み合わせて含むいくつかの類似のサンプルが測定されたときには、適用しても良い。1例として、同じ病気を患っている患者から由来しているサンプルがある。各グループの組み合わせは、この病気を反映しているデータ中でのパターンの同定に役立っている。
標準削除テンプレートの適用は、工程2)の追加の準工程cとして実行できるオプションである。しかし、価値のある更なる情報は、さらなる解析に役立つこれらのグループ分け結果から得られるかもしれないので、内部標準に対して達成されたグループ分け結果を維持することが、しばしば適当であろう。たとえば、物質の相互影響に関する情報は、そこから由来するかもしれない。
ノイズ除去
提案された処理スキームの各々は、第1肯定としてノイズ除去を含んでいる。既に示したように、信号とノイズを識別するための基準は、データポイントの強度のサイズである。電気的ノイズは、検出されたイオンからは生じないので、m/z値および保持時間は、意味が無い。化学的ノイズは、どこにでも現れ、いつでも弱い信号である。対数強度分布は、3つの分布:化学的ノイズに対する低い平均値および高い平均値を持った2つの正規分布および電気的ノイズの非常に小さな強度に対するある単一モード性分布の混合物により、巧くモデル化される。低い強度を持ったノイズと信号とのあいだの良好な分離は、対数強度の柱状図の窪みに見出すことが出来る(図1参照)。この窪みは、各サンプルに対して、個々におよび自動的に求められる。
図1は、1サンプル中の全データポイントの強度の対数の柱状図を示している。異なった作用を持った領域が見受けられる:ごく左側には、スムースな分布は、データの発生を規定するようなものはない。それとは別に、2つの主なクラスターを識別することが出来る。低強度データポイントのクラスターおよび高強度データポイントの他のクラスターである。低レベルのクラスター中のデータは、ノイズにより生じると仮定する。
提案によると、ノイズ除去は、1サンプルに対する単一測定を表示するデータに関して、グローバルに行われていることを、付け加えるべきである。しかしノイズ除去に関する良好な結果は、m/z値あるいは/および時間値特異性ノイズ除去が、実行される場合には、得られよう。
質量エラー分布のチェック
内部標準の使用により、期待測定値および該測定エラー内のデータポイントの期待百分率に関して専門家の予測をチェックできるので、内部標準に関して行われる測定に基づいて、ベイジアン更新スキームに対するパラメータの初期化が可能になる。このことは、次のように行われる:
内部標準の特定のイオンの各々に対して、真のm/z値に対する検出されたデータポイントの観察されたm/z値の乖離度は、計算される。もし、与えられた測定の実際の質量測定エラーが、専門家が期待していたものより大きい場合には、このことは、2つの効果を主に持つことになる:
1.それが、かなり大きい場合には、ピーク検出アルゴリズムは、1以上の特定のイオンにより生じる1つのピークを形成するこれらのデータポイントを検出しないであろう。
2.それが、やや大きい場合には、特定の不確実性により、専門家は、予測間隔について、予測間隔の実際のサイズは、以前のものより幅広くなるとする。
このことは、ボックスプロットで可視化することが出来る。好ましくは、アルゴリズムは、もし、1つあるいは両方の影響がある測定に対して観察される場合には、警告を表示する。
図3は、そのようなボックスプロットダイアグラムを示している。縦座標に沿って、測定エラーΔm/zが、概説され、また横軸に沿って、ある内部標準に対する理論値が、概説される。各標準に対して、上部と下部を持つボックスが、示され、上部ボックス部および下部ボックス部は、それぞれ各測定データの全ての25%を表示している。内部標準の結果は、組み合わされ、それは、ダイアグラムの最も左の部分に示されている。不断の横線が、前の(1−α)−予測間隔(ここでは:前の95%間隔)を表示し、横破線は、前の(1−α/2)−予測間隔(ここでは:前の97.5%間隔)を表示し、また最も左部の短い横点破線は、後の(1−α)−予測間隔(ここでは:後の95%間隔)を表示している。
この場合に対して、専門家は、エラー間隔は±0.4Daであると予測した。ベイジアン習得後の質量ウインドウ全体標準は、点破線により表示されている間隔、すなわち約−0.22から0.31Daの中に存在しており、それは、専門家により予測される範囲以内である。現在の場合、全ての特定イオンの全てのピークは、見出されており、このため、測定および初期化は、質量測定エラー制御を合格している。
質量測定エラー分布の習得
もしある測定が、内部標準に基づいた質量測定エラーのチェックに合格した場合には、残りの全ては、前の質量測定エラー分布の習得を更新するために使用しても良いし、未知のイオンを検出するために使用しても良い。予測間隔の付いての確実性は、今では、以前よりもかなり高くなっており、多くのベイジアン設定において、それは、前の不確実性と観察数の組み合わせとして表現できる(ここでは、残余の数)。もし、標準の測定が、全ての他の測定のあいだでランダムに行われた場合に、これは、プロセスへの良好な道であり、このため、機器の性能における変化は、標準の測定で検出できたであろう。しかし、もし後分布を、将来の操作に使用する意図があるのであれば、予測間隔の新しい長さについての情報のみを保持するのが、賢いことであろうが、それについての確実性を低下させることにもなる。これは、多くのベイジアンモデルに対して、後分布の式を導入しやすくなる。効果において、この手段は、機器の特性の変化に、より敏感になるであろう。
時間の標準化
内部標準に基づいて、時間あるいはスキャン数軸の標準化(時間の標準化)を行ってもよい。
内部標準という概念は、分配液体クロマトグラフィー中の溶出指標の理論から由来しており、またそれは、簡易化された仮定の下で、現在の状況で使用されている。移動相組成のランダム変動は、保持時間中でのシフトの原因となり、分離された物質の溶出順序は、不変のままであり、しかも傾斜溶出により、保持時間の差は、線形化された。2つの内部標準の保持のあいだの保持時間は、線形関数を用いて標準化される。観察の時間間隔に亙って広がる保持時間を用いて、所定の実験的設定中で測定可能でありかつ質量対電荷値の範囲をカバーする内部標準に対する物質のセットのいずれかを使用することができる。
時間の標準化は、基本的には、仮定された真の、あるいは理論的な、あるいは共通の時間軸あるいはスキャン軸上に、測定された時間軸あるいはスキャン軸を描くことに等しい。この時間の標準化により、装置依存性のズレを除去することが出来る。
分離たとえば少なくとも1つの第1解析技術に基づいて達成された時間シリーズなどに基づいて、複数の異なるさらなる技術が、用いられ、各技術は、少なくとも1つの第1解析技術により達成された分離が、描かれるそのものの時間軸あるいは他の特性付け測定値軸を持っているという状況に対して、時間の標準化の概念を、一般化し、あるいは外挿することが出来る。これらの異なる時間軸あるいは特性付け測定値軸は、各さらなる技術から得られる測定データ部分中に現れる内部標準に基づいて、同期化されあるいは標準化されてもよい。
実施の態様
本発明による方法の好ましい実施の態様により、示したように、一般にいくつかのサンプル、すなわち、ブランクサンプル、標準のみを含むサンプル、真のサンプル、検定サンプルおよび内部標準を含む真のサンプルを解析する。1つの真のサンプルに関して、少なくとも1つの関連した標準測定および少なくとも1つのブランク測定を、真のサンプルから得られる測定データに関して、グループ分けの初期化に対する基礎として、使用するべきである。したがって、まず、真のサンプルに対するグループ分けをスタ−トさせる前に、ブランクサンプルと標準サンプルに対する測定データを得ておかなければならない。しかし、データ前処理およびデータ処理が、該サンプルに対する全測定を含めたデータセットに関してグローバルに行われていることを排除するべきではない。さらに、測定データを提供する技術を行う過程で、同時に、データ前処理およびデータ処理をすでに行うことを排除するべきではない。特に、検出ハードウエアにより提供される測定データの収集を用いて挟まれるある種の「オンラインデータ処理」を、実行してもよい。
未知の物質および内部標準を含む真のサンプルの測定データのグループ分けおよびベイジアン習得は、好ましくは、次のように行われる:まず、それは、内部標準が、期待されている既知のm/zトレースに沿って、対応するデータポイントに対して探索される。この探索に対して、ベイジアン習得アルゴリズムは、既知のm/z値および標準サンプル上の測定から得られる予測質量対電荷間隔を用いて、初期化される。真のm/z値は、既知であるので、正規分布を仮定する。
内部標準に基づいたベイジアン習得の後に、未知のイオンの探索に向けて、ベイジアン習得アルゴリズムを開始する。この探索に対して、まず、どちらのm/z値を仮定しなければならないかが、未知であるから、全m/z軸に亘る測定エラーの公平な分布を仮定する。第1データポイントが、検出された後、このデータポイントのm/z値に集中されていた測定エラー分布を、さらなる探索のためのベイジアン習得アルゴリズムを初期化するために、仮定する。真のm/z値が、未知であるために、正規分布の代わりに、t−分布をとる。同一ピークに属する追加のデータポイントをさらに探索するために、t−分布を初期化し、それにより、得られた予測質量対電荷間隔あるいはウインドウは、内部標準から由来するデータのグループ分けから得られる予測質量対電荷間隔あるいはウインドウを、まだ反映している。電流予測質量対電荷ウインドウに入る各追加のデータポイントは、一般的に、t−分布が集中される平均m/z値を変化させ、また一般的にこの分布の幅をも変化させ、またしたがって、生じる予測質量対電荷ウインドウを変化させる。しかし、単一データ値は、分布から得られる予測質量対電荷ウインドウ上への影響は相対的に低いから、平均m/z値上げおよびそれゆえ予測質量対電荷ウインドウの位置上での単一データポイントの影響は、ウインドウの幅に対する影響よりも高くなる。
ベイジアンモデル化に基づいた内部標準の特定イオンのピークを検出するプロセスの1例は、図4aから4dのフローチャートあるいはデータフロー中に、より詳細に述べられている。予測間隔(1−α)および専門家により見積もられた確実性Pおよび特定イオンの各m/z値に基づいて、そのようなイオンの測定に対する前分布が、確立される。この確率計算法を適用することにより、第1質量ウインドウが、求められる。安全サイドにするために、専門家により見積もられた予測間隔(1−α)よりも大きな予測間隔(1−α/2)を用いて、アルゴリズムをスタートさせる。電流質量ウインドウ、たとえば、専門家の予測に基づいて得られる第1質量ウインドウおよび対応する後続の電流質量ウインドウは、各電流質量ウインドウに入る測定が、後続のスキャン中に観察されない限り、同一のままである。
もし、電流質量ウインドウに入る測定値が、観察される場合には(比較;図4a中のスキャンiおよびi+1)、そのときには、そのようなイオンの測定に対する後分布は、ベイジアン習得により得られ、また確率計算法を適用することにより、各次の電流質量ウインドウ(比較;図4aおよび図4b中の第2質量ウインドウあるいは第3質量ウインドウ)が、得られる。
第1質量ウインドウ中にはいる第1測定値を見出した後、同一物質に属するさらなるデータポイントを探索することは、次のスキャン中に、電流質量ウインドウに入るさらなるデータポイントが、見出されない場合には、原理上、中止しても良い。しかし、1つあるいはいくつかの連続スキャンにおいて、各電流質量ウインドウに入る質量ポイントが見出されないことが、よく起こるから、中止条件は、あまりにも厳しい。したがって、1つの物質あるいはイオンに属する全てのデータポイントが、ここで見出されたと仮定して、同一イオンに関連するさらなるデータポイントに対する探索を中止する前に、追加のデータポイントを与えないある数のスキャンを行うことが好ましい。これは、ダイアグラム(比較;図4b)に例示しており、そこでは、もし、すなわち、各電流質量ウインドウを確立した後の次のスキャンにおいて、この電流質量ウインドウにはいるデータポイントが、見出されないという状況に対して、省略NaNは、「番号ではない」を意味する。たとえば、電流質量ウインドウに入るデータポイントが、見出されない1つあるいは2つの後続のスキャンは、探索を中止することなく行われることを許されよう。
内部標準の特定のイオンを検出する過程でも、他の条件たとえば単一モード性条件および強度条件をさらに適用することは、適当であろう。たとえば、各電流質量ウインドウに入ることが連続して見出され、またしたがって、同じイオンにおそらく関連していると思われる4つのデータポイントに基づいて、これを、行うことが出来る。この種の少なくとも1つの追加の条件、たとえば、単一モード性条件および強度条件に基づいて、さらに探索の中止が、あってもよい。探索の中止後、ベイジアン習得アルゴリズムは、各他の内部標準の他の特定イオンに関連するデータポイントに対する探索に対して、新たに初期化しても良い。
各探索の中止後、生じる保持時間は、各内部標準の既知の値に基づいてチェックしても良い(図4c)。各ピークに対して、適切なデータを出力しても良い(図4d)。
未知のイオンのピーク検出に関しての対応する例を、図5に示す。手続きは、図4aから4dの場合と非常に類似している。各特定イオンの理論的m/z値に集中される各分布(たとえば、正規分布)を仮定する代わりに、使用された装置の全測定範囲にわたる公平な分布を、ここでは、出発質量ウインドウとして用いる。
第1データポイントを検出した後、後分布および狭められた電流質量ウインドウは、確率計算法に基づいて得られ、適応可能な質量ウインドウのピーク検出および更新に関して、内部標準の特定のイオンのピークの場合として、アルゴリズムは、基本的には進行する。しかし、未知のイオン検出に対しては、強度カットオフ条件あるいは強度条件およびクロマトグラフィー法ピークの典型的な形状に基づいた少なくとも1つの条件などの追加の条件の適用が、同じタイプのイオン測定は、m/z値およびスキャン時間という観点で互いに近接しなければならないという暗黙の要求に加えて、行われるべきである。特に、各強度値の連続は、最小の蓄積強度を持ちまたクロマトグラフィー法ピークの典型的な形状を示す。以下において、これらの追加の条件の好ましい実施を説明する。
グループ分けの過程での追加的基準の適用
まず第1に、もし、ある適用可能な質量ウインドウ内での第2観察が、第1観察より小さな強度を持っている場合には、第1観察が落とされ、また第1強度値および第2強度値が、単一モード性条件という観点から同じピーク中に属することが出来ないから、第1観察の役割に取って代わる第2の観察を用いて、探索が、継続される。
適用可能な質量ウインドウ内のm/z値(m/z1、m/z2、m/z3、m/z4)を用いて、継続的スキャン時間中に、4つのデータポイントが、観察されるとすると、そのときには、共通のベースラインを用いてとられた蓄積的強度が、ある閾値以上であるかどうかをチェックされる。そうでない限り、適用可能な質量ウインドウ内の探索は、継続される。もし、次のスキャンにおいて、適用可能な質量ウインドウ中への追加のデータポイントの流れが、強度カットオフ通過する強度値を用いないで遮断される場合には、このデータポイントは、捨てる。
ある適用可能な質量ウインドウ内のある継続的データポイントの蓄積的強度が、強度カットオフを合格する場合には、強度値の連続が、ある単一モード性の形状を示すかどうかが、チェックされる。もしこれが、あまり大きく妨害されない場合には、探索は継続される。もしそれが妨害される場合には、第1データポイントは、落とされまた捨てられ、さらに探索は、新しい集合体である他のデータポイントを用いて継続される。もし、次のスキャン時において、さらに多くのデータポイントが、その集合体に入り、また導入される新しいデータポイントを用いるときに、入る場合に、単一モード性は、もはや実行されなくて、最近のデータポイントを持たないデータポイントの集合体が、完成されたピークと考えられかつ新しい探索が、第1のものとして、最近のデータポイントを用いて、スタートされる。
したがって、電流質量ウインドウに入るデータポイントを巧く見出して、単一モード性条件およびある種の強度条件、好ましくは追加の尖度条件も、同じイオンにおそらく属している4つのデータポイントが、見出された後、スタートに適用される。これらのデータポイントは、データポイントの各グループの「候補メンバー」と名づけられている。もし、追加の条件が、実行され時には、そのときには、各イオンに属する全てのデータポイントは、見出され、あるいは、このm/z範囲には、そのようなデータポイントはない。後になって、他の未知のイオンに対して、アルゴリズムの再初期化を行う。このことは、完全なm/z軸あるいは各測定の完全なm/z観察間隔にわたる公平な分布は、再びアルゴリズムのスタートのために仮定されることを、意味している。
ある程度重なる質量ウインドウを持つピークの集まりが、見出される場合は、各質量ウインドウおよび時間ウインドウは、これらのピークが、移動相に帰せられるべきかどうかをチェックするために、組み合わされる。この組み合わされた時間ウインドウは、観察時間の大部分に亘り広がり、その後、これらのデータポイントは、移動相中のイオン測定であるということを、一般的には仮定できる。したがって、これらのデータは、対応する削除テンプレートを適用することにより、削除しても良い。
データポイントの集約的特性付けに基づく基準
強度条件、単一モード性条件および尖度条件あるいは検出は、適用可能な質量ウインドウ内のm/z値を用いた次のスキャン時に観測されるデータポイントの属する複数の強度値の集約的特性付けに基づく追加の条件に対する例である。後者の2つの条件は、次のように適用される:
あるポテンシャルピークは、保持時間t1、t2...tNおよび強度l1、l2...lNを用いて見出されると仮定する。第1保持時間は、ある時間間隔の上限値であり、ある質量対電荷範囲以内のl1イオンは、そこまで集められる。さらに、その間隔の下限値は、必要とされまた以下のように定義される:
0:=t1−min{tn+1−tn、n=1...N}
これらは、単一モード性条件および尖度条件が適用されるデートである。
同一の成分のイオンに属する1連の観察される強度値は、いわゆる「グループ分け」データのある柱状図として解釈できる。語彙「グループ分け」のある統計的意義を、ここでは仮定する。したがって、単一モード性条件および尖度条件は、この統計的意義中の「グループ分けされた」データに対して、適用される。
これは、検出ハードウエアが、スキャン時間で定義される時間間隔内に現れる同じ(不連続の)質量対電荷値用いて、全てのイオンを、実際にはカウントするからである。
LC−プロセスが、あるランダムプロセス与えられると、同一物質中の分子は、ある保持時間あるいは検出時間の付近のある確率分布による確率を持って現れる。この分布は、時間に対して(ほとんど)連続であるように見えるが、プロセスは、不連続時間ポイント、すなわち異なったスキャン時間でのみ観察できる。このようにして、各バー−すなわち強度−が、ある時間間隔内で観察された数の発生を与える柱状図が、観察される。
観測できない「オリジナル」データに対して比較されるグループ分けデータは、時には、分析の適合しうる方法を必要とする。
単一モード性のチェック
単一モード性のチェックは、いわゆるハーチガンのDIP−テストおよびハーチガン(1985);参照、P.M.ハーチガン:「単一モード性用テストに対するDIPテストの計算」;応用統計学(1985年)34巻320−325頁、およびJ.A.ハーチガンおよびP.M.ハーチガン「単一モード性のDIPテスト」;統計学年報(1985年)13巻70−84頁に基づいている。
さらに、ギャブラーおよびボルグ:「単一モード性および単一モード性統計学、ZUMA−報告(1996年)38巻33−34頁」を参照している。
1)ピーク強度は、合計が1つになるまで正規化され、
Figure 0004594154
そして、集約合計は、次式で計算される。
Figure 0004594154
得られる関数Fempは、ある経験的分布関数の特性を持っている。
2)この分布関数に対する最近接単一モード性分布関数は、最大の凸状優級数および最小の凹状の劣級数を用いて見出される。
モードmを持つ単一モード性分布関数は、(∞、m]で凸であり、また[m、∞)で凹である。経験的分布Fempに対する最近接単一モード性分布関数Uは、間隔[t1、tL]におけるFempの最大の凸状優級数および間隔[tU、tN]における最小の凹状の劣級数により与えられ、そこでは、tLおよびtUは、FempおよびU間の(点状)距離を最小にするために反復して求められる。(Uは、連続−図6参照)。この距離が、「DIP」と呼ばれている。
3)そこで、この差は、
u(tn):U(tn+1)−U(tn),n=0,...,N
構築され、またfempと同じグラニテイを持つUによる、ある近接経験的密度関数uが、得られる。
4)単一モード性の尺度として使用される差は、uおよびfemp間の最大点状差であると定義される。
あるいは、従来のDIP尺度であるUおよびFemp間の最大点状差も使用できよう。しかし、得られた限りの結果は、良好には見えない。その理由は、おそらく、DIP統計学は、元のデータ用に開発されたが、このデータは、グループ分けされたデータであるということであろう。
5)もしこの差が、ある閾値(典型的には、0.01から0.1のあいだのある値)より大きい場合には、データポイントの集合体は、同じタイプのイオンからは生じないと考えられている。
均一分布は、単一モード性分布のクラスに属しているので、ほとんど長方形状をした柱状図は、非単一モード性閾値によりろ過されない。このことは、適合された単一モード性密度の尖度をチェックすることにより、行われる。
尖度のチェック
尖度を計算するための計算式を書くに当たり、平均保持時間は、
Figure 0004594154
として示されている。さらに、次の式で示される対応する保持時間間隔あるいは検出時間間隔の各々の平均値は、
Figure 0004594154
必要である。
適合される単一モード性密度の尖度は、
Figure 0004594154
により計算される。
(ここで使用されるように)尖度は、第4中央モーメントを第2中央モーメントの2乗で割ったものと定義される。正規分布の尖度−標準正規分布のみでなく−は、3である。いずれの間隔上で定義される均一分布(長方形分布とも呼ばれている)の尖度は、1.8である。このように、ほとんど長方形状の柱状図をろ過するためには、尖度閾値は、好ましくは、越えられなければならない約2から2.5のレベルに設定される。
一般的に、あるランダム変数の第r番目の変数は、ランダム変数の第rべき乗の期待値であると定義されている。あるランダム変数の第r番目の中央モーメントは、第1番目の中央モーメントに対して、ランダム変数の差の第r乗の期待値であると定義されている。
ある分布の密度の位置は、次の高次の中央モーメントである第1モーメントにより求められる。このモーメントが等しいものが多ければ多いほど、分布は、類似性が多くなる。
図示例
次に、ベイジアン更新スキームに対するいくつかの図示例およびそれに基づいて得られるグループ分けを示す。
ある未知のイオンに対するピークを探して、全m/z幅に亘り測定エラーの公平な分布を、図7aにシンボル的に示すように、仮定する。データポイントの第1観察は、強度値を与える(図7b)。ベイジアン確率計算法に基づいて、狭められた質量ウインドウが、得られる(図7c)。この質量ウインドウ(図7c)に入るさらなるデータポイントは、ある強度を持つサンプルの同じ生成物あるいは成分に属している候補データポイントとして、同定される(図7d)。このスキームは、反復され(図7eおよび図7fを比較)、また同じイオンによって生じたと思われる1連の強度値(図7h)を導くことになる。図7hによる強度値は、強度チェック、単一モード性チェックおよび尖度チェックを合格した。
グループ分けにおいて、電流質量ウインドウに入るデータポイントは、各スキャン中には、見出されないということを、説明されるであろう。図8aおよび図8bに示すように、対応する失われた強度値が、たとえば1連の強度値中への直線的外挿により加えられてもよく、それに対して、強度条件、単一モード性条件および尖度条件が、適用される。もし後続の強度値の1つあるいは定められた数が、失われると、そのときには、失われたデータポイントは、適用された技術の状況により生じかつそれらが、存在していても、それを検出できないので、グループ分けは、中止してはならない。失われたポイントあるいは複数のポイントの外挿により、検出された集合強度は、否定的には影響されなくて、単一モード性テストおよび尖度テストが、まだ有効に適用できる。
好ましくは、強度条件は、ピークを形成していると思われる各グループのデータポイントに属する複数の強度値に直接適用されないで、その代わりに、各強度値とこのグループの第1強度値および最後の強度値を交差する直線ベースラインの対応する強度との強度差Δliに適用される。図8bにおいて、時間ポイントtiからの強度値および時間ポイントti+8に対する強度値ではあるが、そのようなベースラインが引かれる。したがって、強度値のそのようなグループの第1および最後の強度値は、強度条件においてのチェックによる蓄積的強度値には、寄与しない。
好ましくは、単一モード性条件は、単一モード性の要件のマイナーな妨害は、許容できるように、適用される(図9)。
2つの重なるピークの各々の1つに関連するデータポイントの2つのグループのあいだに不明確な相互作用が、あるとしても(図11)、単一モード性チェックは、重なるピーク重なるピークの分離には、強力な手段となることを証明した(図10)。
単一モード性条件単独あるいは他の条件、特に尖度条件と組み合わせることにより、ベイジアン習得を適用しないこと、およびただピーク探索アルゴリズムのみが、いわゆる「ハードビニング」という意味で、m/zトレースを固定するために、各ピークを、強度条件および単一モード性条件またおそらくは少なくとも1つの追加条件、たとえば尖度条件に基づいているピーク探索アルゴリズムと同定するために適用されることが、ある測定状況に対して充分であろう。
好ましくは、強度条件、単一モード性条件および好ましくは尖度条件も、いずれのピークも、少なくとも4つのデータポイントを持たなければならないという仮定に基づいて、少なくとも4つのデータポイントにより形成されたデータグループのみに適用される。したがって、4ポイントより少ないポイントを持つスパイクは、どんな場合でも真のピークとは考えられないから、強度条件、単一モード性条件および他の条件が適用される前に、捨てられる。4あるいはそれ以上のポイントを持つスパイク(図12)は、強度条件あるいは/および単一モード性条件を一般的に合格しない。これらの条件を合格するスパイクは、もし強度条件などの分布条件に基づいた他の条件が、適用されない場合には、真のピークとして取り扱って良い。通常は、分析は、多くの測定の合奏に基づいているから、原理上は、強度条件および単一モード性条件を合格したスパイクを選別する必要は、一般的にない。スパイクが何度かの測定において同じ場所で起こることはほとんどない。
未知のグループに関するグループ分けを参照にして、グループ分けプロセスも、図13によるダイアグラムを示す。第1データポイントを見出した後、データポイントに集中されているm/z値に対する質量エラー分布が、得られる。さらに、個々の電流分布により定められる個々の電流質量ウインドウに入るデータポイントは、各々の同じイオンに関連する同一グループの候補メンバーとして、同定される。好ましくは、「電流質量ウインドウに入るデータポイント」および「電流質量ウインドウに入るデータポイント」の情報は、ベイジアン更新に対して考慮に入れられるが、各々のデータポイントの強度は、考慮に入れられない。しかし、このことは、原理上可能である。ここで仮定されるアプローチによると、強度が考慮に入れられないときには、t−軸あるいはスキャン数軸の方向に起こる異なったデータポイントの分布は、各グループの全メンバー(候補あるいは確認されたメンバー)に対して得られるm/z値が、得られる分布の最大に対応するという各電流後分布(これは、次のデータポイントに対する前分布である)を得るために評価される。
ベイジアン習得から得られる質量対電荷軸に沿った「変数ビン」の使用は、データポイントの悪いグループ分けすなわちあるデータポイントが、他の悪いイオンに属するという悪い決定が、避けることが出来るというメジャーな利点を持っている。このことが、m/z軸に沿った「ハードビン」に基づいている従来のピークピッキング方法における危険である。図14は、ハードビニング(図14a)を、ベイジアン習得(図14b)から得られる変数ビンに基づいたグループ分けとを図面で比較している。1つの変数ビンは、各電流(適用可能な)変数ビンに入る全ての観察に対する平均m/z値、m/zIONおよびm/zIONに集中される各変数ビンの幅2*Δm/zdevにより特性付けられる。図14aにおいては、「ハードビニング」方法の場合に悪くグループ分けされるであろうこれらのデータポイントは、矢印により同定される。
データ処理および前述中に提示されたスキームにしたがったグループ分けは、さらに図15から23に図示する。
図15は、何らかの処理の前の生データの部分を示す。ノイズに帰せられるデータポイントは、たとえば、図1に基づいて説明されるような対数処理した強度値の柱状図に基づいて、除去できる。このようなノイズデータポイントは、フルドットとして、図16中に同定される。図17は、ノイズレベル以上の強度値を持つデータポイントを示す。このノイズデータポイントは、除去されてきた。
内部標準イオンが予測される質量ウインドウに、アルゴリズムを選択的に適用することにより、図18にフルポイントとしてマークされるデータポイントは、内部標準の特定イオンの1つにより生じられるとして同定される。これらのポイントおよび他のデータに基づいて、質量エラー分布は、チェックされかつ習得される。
このアルゴリズムを残りのポイントに適用することにより、他のデータポイントのみならず真のクロマトグラフィーピークの全ての候補データポイントは、同定される。図19では、クロマトグラフィーピークの基準を満たさないデータポイントが、フルポイントとして示されている。したがって、このアルゴリズムは、これらのデータポイントが、LC−MSプロセスを正しく経由するある物質により生じていないということを決定する。図20は、図19中の457と457.5Daのあいだにあるデータポイントの1連の強度値を示す。明瞭なピーク形状を持った結果およびある(蓄積的)かなりの強度の結果が無いので、全てのデータポイントは、捨てる。
図21は、クロマトグラフィーピークの基準を実行するこれらのデータポイントを、フルドットとして示している。図21は、明らかに単一モード性の形状をフォローしているこれらのデータポイントの1連の強度値を示している。
これらのデータポイントを維持する代わりに、蓄積的強度および質量ウインドウおよび時間ウインドウの矩形が、検出されたイオンについての主な情報として、維持されても良い(図23)。
システム
図24は、発明の態様の1つあるいは両方の態様中で、本発明を実行するために使用されるシステムの構造の例を系統的に示す。システムあるいは分析装置100は、分離ユニット102、たとえばキャピラリー電気泳動ユニットあるいは液体クロマトグラフィーユニット、イオン化ユニット104、たとえば、電気スプレーイオン化ユニットおよび質量分析ユニット106(たとえば、飛行時間スペクトル分析器、4極子質量スペクトル分析器など)を持っている。分離ユニット102は、各サンプルの成分を分離しかつ分離された成分を時間連続により、イオン化ユニット104に提供し、その中では、成分はイオン化されまた質量分析ユニット106に提供され、またそれは、検出時間あるいはスキャン数、各イオンあるいは各イオン類の質量対電荷値および各イオンあるいはイオン類に対する強度あるいはカウント数を含む3次元データの合計になるデータの時間シリーズあるいはスキャンシリーズを提供するために、適当なイオン分離および検出ハードウエアを持っている。
このユニットは、表示110を持った制御ユニット108、キーボード112、およびプリンタ114により制御される。少なくとも1つのプロセッサ116およびデータ貯蔵ユニット118が、制御ユニット中に統合されている。貯蔵ユニット118は、本システム100を用いて達成される測定結果と比較するための関心のある成分の特性データのデータを貯蔵しても良い。
制御ユニット108は、質量スペクトル分析器106からの測定データを受け取り、かつ本発明にしたがってこれらのデータをグループ分けする。
これらのグループ分けを行うために、質量スペクトル分析器106から受け取る生データは、貯蔵ユニット118中に貯蔵される。好ましくは、各時間あるいはスキャン数値、各質量対電荷値および各強度値あるいはカウント数値の互いの連携を反映するデータ構造が、使用される。これらの生じるデータは、生データから由来できる全ての興味ある情報を基本的には含んでいる。全てのさらなる分析は、生データの代わりに、生じるグループ分けデータに基づいて行うことが出来る。したがって、生データは、グループ分けデータの発生後削除しても良い。たとえ更なる分析を、生データに基づいて行うとしても、グループ分けデータは、特に関心のあるデータポイントを同定させるから、グループ分けデータは、非常に手助けとなる。
本発明によるデータ前処理およびデータ処理も、データ処理システム、たとえば、ユニット102,104および106を含む測定ユニットに直接にはリンクされていないたとえば、汎用コンピュータにより、行っても良いことは、注意されるべきである。
図24によるシステム100に関して、本発明を具現化するこのようなシステムは、本発明を具現化する適当なソフトウエアを搭載することにより、データ処理を行うように適合される制御ユニットを持っている従来のシステムに基づいて、提供されても良いということを付け加えておくべきである。このソフトウエアは、本発明を具現化する指示プログラムを運んでいるコンピュータ読み取り可能な媒体の形式データたとえば、CD−ROMあるいはDVD−ROMの形式で、あるいはサーバー・コンピュータシステム、たとえばインターネットからのソフトウエアの取り込みにより、提供されてもよい。
2つの態様における本発明によるデータ前処理およびデータ処理は、血清サンプルのLC−ESI−MSデータセットに適用された。ノイズ除去、スパイク同定、移動相および内部標準のシーケンスの削除および可変ビン中へのピークのグループ分けにより、データ量をかなり削減しながら、「真」のピークの位置と強度についての完全に適切な情報を保持する新しいデータセットが、発生された。生データは、約22MBのデータ量に相当する約300万の単一データポイントを包含していた。データ前処理およびデータ処理後、約700kBのデータ量に相当する1087ピークが、残った。したがって、そこに含まれる成分に関して、サンプルの特性付けに必要な全ての情報は、維持されたが、かなりのデータ削減と圧縮が、得られた。
図25は、2つの態様における本発明によるデータ前処理およびデータ処理の前(図24a:生データ)および後(図24b:グループ分けされたデータ)のLC−MSデータセットの3次元表示の比較である。関係のある情報は、データ量を約100という因数だけ削減しながら、保持される。
数値例
大きなLC−MS生データセット中の本発明によるグループわけにより見出されるピークを表示するダイアグラムを示す図26を参照し、また図26によるグループ分け結果の根底をなすグループ分けを表示するプロトコルデータセットが、含まれている図27から78に示されたグループ分けプロトコルを参照して、本発明によるグループ分けの好ましい実施の態様を、さらに示している。図27から78は、多くのグループ分けプロトコル頁を持つグループ分けプロトコルからの抜粋を表している。
グループ分けプロトコルの序文部分10において、グループ分けが根拠としているいくつかのパラメータを、図27の1頁グループ分けプロトコルに対して示している。重要なパラメータは、強度カットオフ閾値、単一モード性カットオフ閾値および尖度カットオフ閾値である。プロトコルの第12章および14章において、仮定された前分布およびベイジアン統計に対する初期化データが、与えられている。
より簡単なデータ処理という理由のために、電流質量対電荷ウインドウに入るデータポイントの生データをスキャンするときに、全質量対電荷軸を1度に考えるのではなくて、グループ分けプロトコルの電流部分における作業中の質量対電荷ウインドウが200.00から205.00Daのある作業中の質量対電荷ウインドウのみを考察している(16における所見を参照)。2000.00Daまでの他の質量対電荷範囲は、5.00Da各幅を持った(好ましくは重なっている)各作業中の質量対電荷ウインドウ中で、別々にスキャンされる。
グループ分けアルゴリズムは、作業中の質量対電荷ウインドウ、すなわち200.00から205.00Daのウインドウに対応して、電流質量対電荷ウインドウに対して初期化される。この電流ウインドウに亘る公平な分布は、前分布と仮定される。
スキャン時間901.33秒(18参照)での質量スペクトル分析器の1スキャンに対応するデータを経由した第1スキャンは、2つの観察(20参照)を生じ、すなわち2つのデータポイントが、見出され、その第1データは、201.01Daの質量対電荷比と78682の強度を持っており、他のデータは、202.93Daの質量対電荷比と5342784の強度を持っている。
図28のグループ分けプロトコル3頁は、これまでのグループ分けの結果をまとめている。電流位置を与える名前により同定される2つの電位ピークが、見出された:ピークおよびおおよその平均m/z値を形成するデータポイントの各グループに対して、候補メンバーとして付け加えられる前のデータポイントのスキャン数。現在の場合には、第1スキャン後に、2つのグループがあり、各グループは、1つの候補データポイント、すなわち22および24に示されているスキャン1MZ201およびスキャン1MZ203として示されるグループあるいはピークをそれぞれ含んでいる。これらの統計数式から、次のスキャンに対する前分布となる後分布およびそこから生じる95%予測質量ウインドウが、2つのグループに対して23および25示したように得られる。分布としては、t−分布が、取られる。
図28のグループ分けプロトコル4頁上で示された第2スキャンは、4つの観察を生じた。見出された2つのデータポイントは、グループ分けプロトコル3頁による予測質量ウインドウに入った、すなわち、予測質量ウインドウ[200.72、201.30]中のデータポイント(200.75、13554)は、スキャン1MZ201ピークと関連し、また予測質量ウインドウ[202.65、203.22]中のデータポイント(202.93、3867132)は、スキャン1MZ203ピークに関連していた。第2スキャン中に見出された各データポイントの強度値は、第1スキャン中に見出された各データポイントの強度値に足りないので、第1スキャンの各データポイントは、スキャン2MZ201としてここで示されるグループあるいはピークから削除され、またスキャン2MZ203としてここで示されるグループあるいはピークから削除されて、かつ第3スキャンに対する前分布である第2スキャン後の後分布が、第2スキャンで見出された各データポイントに基づいて新たに初期化される。グループ分けプロトコルは、5頁の26上の対応する註を含む。
第2スキャンで見出される他の2つのデータポイント(200.24、47617)および(201.27、18193)は、さらに2つの電位ピークあるいはグループ、すなわちピークあるいはグループスキャン2MZ200およびスキャン2MZ201を生じる。
第3スキャンは、2つの追加のデータポイントを見出した、またそのうちのデータポイント(201.01,31529)は、グループスキャン2MZ201の予測質量ウインドウ中に入り、このためこのデータポイントは、このグループに加えられ、ここでスキャン3MZ201として示される。他のデータポイント(203.06、2587450)は、スキャン3MZ203として示される追加の電位ピークあるいはグループを生じる。
この説明の中で、それらの質量対電荷値およびそれらの強度値によってのみ同定されるデータポイントは、まったくの3次元データポイント、すなわち、クロマトグラフィーユニット中の保持時間を表す各スキャン時間をも含むデータポイントであることを、加えておくべきである。したがって、ここで第3スキャン中に見出されるデータポイント(201.01,31529)を参照すると、これは、3次元のデータポイントあるいはデータ組(905.53[秒]、201.01[m/z]、31529[l])に対するただ単なる省略である。各測定値が参照する測定量は、さらに角付きの括弧で与えられている。スキャン時間tiの代わりに、スキャン数Niも使用できかつ3次元データポイントあるいはデータ組中に含まれる。
スキャン3MZ201としてここで示されるグループスキャン2MZ201に付加される追加のデータポイントは、図30のグループ分けプロトコル7頁中の30で示されているように、予測t−分布および予測質量ウインドウの更新となる。第4スキャンに対応して、ここでスキャン4MZ201として示されるさらなる候補メンバーが、グループスキャン3MZ201に付加される(図31のグループ分けプロトコル9頁参照)。
もし、1スキャン中に、追加の候補メンバーが、見出されない場合には、電位ピークあるいはグループは、削除されないことを付け加えるべきである。もし、1スキャン中に、グループの追加の候補メンバーが、見出されないでかつ1スキャン中にメンバーが見出される場合には、そのときには、失われたメンバーが、隣の候補メンバーとのあいだの直線的外挿により加えられる。しかし、もし、次の2つのスキャン中に、追加の候補メンバーが、見出されない場合には、そのときには、そのグループは、削除される。
したがって、グループスキャン2MZ201は、グループスキャン3MZ201としての第3スキャンとして、唯一の候補メンバー(201.27、18193)を用いて、維持される。しかし、第4スキャンが、このグループに対して、追加の候補メンバーを生成しなかったので、このグループは、第4スキャン後削除される。
ここで使用される表示において、異なるグループは、同じ名前を持っていることを追加するべきである。第3スキャン後、スキャン3MZ201という名を持った2つのグループがあり、その1つは、ヘッドライン「1観察での潜在ピーク」後に含まれるただ1つの候補メンバーを持っており、またもう1つは、ヘッドライン「2観察での潜在ピーク」の下に含まれる2つの候補メンバーを含む。
紛失したデータポイントの外挿は、図33から35のグループ分けプロトコル13から17頁に見ることが出来る。スキャン6のデータポイント(200.37、25053)に基づいて、グループ分けプロトコル13頁上のスキャン6MZ200として示される電位ピークあるいはグループが、確立された。第7スキャンは、このグループに対して、なんら追加の候補メンバーを与えなかったため、ここでスキャン7MZ200として示されるこのグループは、グループ分けプロトコル15上に示され、ただ1つの候補メンバーを持つことになる(32を参照)。このグループの対応する予測質量ウインドウは、[200.08、200.65]である。スキャン8中には、m/z値を持って予測質量ウインドウ中にはいるデータポイント[200.37、34490]が、見出される。したがって、データポイントが、グループスキャン7MZ200に付加され、またここで、スキャン8MZ200で示されるグループは、グループ分けプロトコル17頁上で示され、3つのデータポイント(34参照)を含み、スキャン7の失われたデータポイントにはいるために、線形外挿により得られる追加のデータポイント(200.37、29771)を含む。
図26中に示されるピークの第1データポイントは、スキャン9、すなわちデータポイント(204.73、34040)中で見出され、またこのポイントに基づいて、電位ピークあるいはグループスキャン9MZ205は、図36および37のグループ分けプロトコル20および21頁上に示されるように、確立される。このグループは、グループ分けプロトコル20頁上および矢印による次のグループ分けプロトコル頁上でマークされる。
スキャン10から34のそれぞれは、図26によるグループあるいはピークのさらなるメンバーを与える。スキャン35においては、図75のグループ分けプロトコル97頁に見られるように、このグループあるいはピークのさらなる候補メンバーは、見出されないので、スキャン35の後、このグループあるいはピーク、ここでは示されるスキャン35MZ205は、グループ分けプロトコル99頁上に示され、スキャン34後の図74中のグループ分けプロトコル96上のように、26メンバー(26観察結果)を持っている。
このグループあるいはピークの電流予測質量ウインドウ[204.72、205.12]に入るm/z値が無いので(28参照)、スキャン36(グループ分けプロトコル100頁を比較)は、このグループあるいはピークの追加の候補メンバーを見出せなかった。したがって、26データポイントにより形成されるグループスキャン35MZ205は、スキャン36後に、候補メンバーのさらなる追加に対して閉じられる。
図26に示されるピークあるいはグループは、強度条件、単一モード性条件および尖度条件を実行する。好ましくは、これらの条件は、4つの候補メンバーを持つ各電位ピークあるいはグループに適用されるので、各グループのそのようなデータポイントのみおよびそのようなグループのみが、これらの全ての基準を満たすあるいは各グループに添加される追加の候補メンバーに基づいて実行される潜在ピークに対応して、潜在的グループとして維持される。このことは、これらのデータポイントは、各グループから削除されるか、あるいは、後続のグループ分けにおいておそらく見出される追加の候補メンバーに基づいてさえも、これらの条件が実行できないという意味において、これらの条件のいずれも実行しないかあるいは実行できないこれらのデータポイントは、削除されても良いということを、意味している。しかし、強度条件、単一モード性条件および尖度条件は、候補メンバーをさらに追加するためのグループを閉じた後にのみ適用されるように、グループ分けを実行してもよく、このため、これらの条件の1つが実行されない場合および各ピークを表示するグループとして維持されるときには、このグループは、捨てられる。
さらなる候補メンバーの追加のためのこのグループあるいはピークを閉じた後のグループあるいはピークを定める質量対電荷間隔として、図26によるピークの場合には、図76上の28に示される質量ウインドウであるラストの前質量ウインドウ(すなわち、追加の潜在的メンバーが見出されなかったさらなるスキャンに対して、95%−予測質量ウインドウ)、あるいは、2者択一的に、このグループあるいはピークに属するデータポイントの最低および最高のm/z値により定められる間隔に注意するべきである。検出時間間隔として、好ましくは、このグループあるいはピークに属するデータポイントの最低および最高の時間値が、このグループあるいはピークのスキャン35MZ205、間隔[918.14(s)、970.66(s)]の場合にとられる。2者択一的に、このグループに加えられる第1および最後のデータポイントのスキャン数により定められるこのグループあるいはスキャンのスキャン35MZ205、間隔[9、34]の場合に、このスキャン数間隔が、使用できる。
図27から図78に示されるグループ分けプロトコル頁は、電位ピークに関連した他のグループに関しても、グループ分けの仮定を示しているが、それは、特に、次の2つのスキャンにおいて、さらなる候補メンバーが、見出されなかったから、グループ分けの過程で、捨てられる。このプロトコルは、次の情報が与えられるので、グループ分けプロセスおよびデータ処理をフォローさせる:
各スキャンに対して、どちらのデータポイントが、見出されたかを示している。これらのデータポイントを用いて、どちらの電位ピークが、補われてきたかを示している:更新(どのようにして、およびなぜ)、結果を持って終了(ポイントの棄却あるいは1つのピークに対する組み合わせ)および理由。
電流質量ウインドウに入る追加のデータポイントは、見出されないので、終了する電位ピークは、リストアップされ、その結果が、示される:結果を持って終了(ポイントの放棄あるいはピークに対する組み合わせ)および理由。
もし電位ピークが、i)各グループ中の4つの候補メンバーより以上の、および ii)充分な強度以上の閾値の上を通過する場合には、データポイントの棄却に関する決定あるいは真のピークとしての同定は、可視化される:このグループ分けプロトコルから示された抜粋に対して、これは、図26に示されたピークにのみ適用し、図26は、この可視化である。
各スキャンの終わりにおいて、それらの電流データ:m/z値強度、追加のm/z値および失われたデータポイントのギャップを埋めるための線形外挿から得られる強度値、t−分布のパラメータ、次のスキャンに対する予測質量ウインドウを含めた電流電位ピークが、リストアップされる。
本実施の態様におけるグループ分けの実施(それにより、グループ分けが、作業質量ウインドウ中で行われる)を参照して、重ね作業質量ウインドウが、提供され、そのため、境界であるいはm/z軸に沿って2つの作業質量ウインドウの境界を横切って、ピークに関してグループ分けを行うことが可能になることを付け加えるべきである。もしあるピークが、重なりm/z範囲にあるときには、そのときには、ピークは、1度は、2つの重ね作業質量ウインドウの各々に基づいて、2度見出されることになるだろう。2つのピークのうちの1つはその後、棄却されるであろう。
さらなる実施の態様
本発明は、ここで考察された実施の態様に限定されない。たとえば、本発明は、3以上の高い次元を持った測定状況に適用しても良い。たとえば、クロマトグラフィーユニット後に存在する物質の流れを、スペクトル分析器たとえば、UV−スペクトル分析器に、分けても良い。この場合、時間の標準化後あるいはすぐに得られる共通時間軸に基づいて、質量スペクトルと結び付けられる追加の強度スペクトル(波長に亙るUV強度)が、得られるであろう。このような測定状況に対する測定データは、5次元を持つであろう:時間、質量対電荷比、質量スペクトル分析器強度、波長およびUV強度。他の可能性は、2つのタイプのイオン化、たとえばESIイオン化およびAPCIイオン化(各々は、各質量スペクトル分析器と結ばれている)を平行して行うことである。この場合、共通の時間軸により結ばれている2つの質量スペクトル、すなわちESIスペクトルおよびAPCIスペクトルが、得られるであろうから、再び5次元が得られ、もし同様にUVスペクトル分析と組み合わせると、そのときには、7次元にもなる。
さらに、本発明は、まったく異なる分析技術および検出技術に応用できる。
他の態様によれば、本発明は、物質の特性付けに関して、少なくとも1つのサンプルを特性付ける特性付けデータを提供するために、2つ以上の技術を行うことにより得られる測定データをグループ分けするための方法を提供する。本発明の1つの特別な態様によると、このグループ分けは、各特性付け測定値のズレの少なくとも1つの統計的分布に基づいて行われる。本発明の他の特別な態様によると、このグループ分けは、複数の各定量的測定値の少なくとも1つの集約的特性付けに基づいて行われる。
あるサンプルに対して得られるデータポイントの1セットの全てのデータポイントの強度の対数の柱状図であり、その中では、ノイズにより生じる低強度データポイントのクラスターおよび真の信号により生じる高強度値を持ったクラスターが、識別できる。 生データの異なった集合から得られるグループ分け結果および第2のグループ分け結果を得るためのこれらのグループ分け結果の組み合わせを概略的に示す。 経験的分布データに基づいて、質量エラー分布のチェックをさせるボックスプロットダイアグラムである。 フローチャートあるいはデータフロータイプダイアグラムを示し、また生じるグループ分けデータは、内部標準の特定のイオンのピークを見出すためのグループ分けの実施の態様を示す。 フローチャートあるいはデータフロータイプダイアグラムを示し、また生じるグループ分けデータは、内部標準の特定のイオンのピークを見出すためのグループ分けの実施の態様を示す。 フローチャートあるいはデータフロータイプダイアグラムを示し、また生じるグループ分けデータは、内部標準の特定のイオンのピークを見出すためのグループ分けの実施の態様を示す。 フローチャートあるいはデータフロータイプダイアグラムを示し、また生じるグループ分けデータは、内部標準の特定のイオンのピークを見出すためのグループ分けの実施の態様を示す。 サンプルの成分の不明なイオンのピークを見出すためのグループ分け実施の態様を示すフローチャートあるいはデータフロータイプダイアグラムを示す。 単一モード性条件(ギャブラーおよびボルグからとられたダイアグラム、1996年)に使用されるいわゆる「DIP」尺度を示すダイアグラムである。 図部分7aから7dにおける概略的表示を用いて、ベイジアン習得に基づいたグループ分けにより、いくつかのピークを見出すための例を示している。 図部分7eから7gにおける概略的表示を用いて、ベイジアン習得に基づいたグループ分けにより、いくつかのピークを見出すための例を示している。 図部分8aおよび8bにおける概略的表示を用いて、グループ分けの過程でのm/z軸に対する1つの欠測値の取り扱いをするための図示例である。 単一モード性条件の少ない妨害はあるが、ピークとして同定される測定データのための図示例である。 単一モード性条件に基づいたグループ分けの過程で、分離できる重なりピークを示す図示例である。 ピーク類は、不明確な相互作用を持って高度に重なっているけれども、単一モード性条件に基づいて、分離できる重なりピークに関するさらなる図示例である。 測定データ中のスパイクに対する図示例である。 平均あるいは特性値m/zIONからの各データポイントのズレΔm/ziの分布に基づいたm/z軸に沿ったグループ分けプロセスの概略表示である。 「ハードビニング」法(図14a)に基づいたグループ分けおよび図13に示すグループ分けプロセスにしたがった変数ビン(図14b)に基づいたグループ分けの比較のための2つのダイアグラムである。 生データのノイズ除去とクロマトグラフィーピークとそこから抽出された適切な情報を同定するために、ノイズ除去された生データに基づいたグループ分けを示す3次元ダイアグラムのグラフ表示である。 生データのノイズ除去とクロマトグラフィーピークとそこから抽出された適切な情報を同定するために、ノイズ除去された生データに基づいたグループ分けを示す3次元ダイアグラムのグラフ表示である。 生データのノイズ除去とクロマトグラフィーピークとそこから抽出された適切な情報を同定するために、ノイズ除去された生データに基づいたグループ分けを示す3次元ダイアグラムのグラフ表示である。 生データのノイズ除去とクロマトグラフィーピークとそこから抽出された適切な情報を同定するために、ノイズ除去された生データに基づいたグループ分けを示す3次元ダイアグラムのグラフ表示である。 生データのノイズ除去とクロマトグラフィーピークとそこから抽出された適切な情報を同定するために、ノイズ除去された生データに基づいたグループ分けを示す3次元ダイアグラムのグラフ表示である。 生データのノイズ除去とクロマトグラフィーピークとそこから抽出された適切な情報を同定するために、ノイズ除去された生データに基づいたグループ分けを示す3次元ダイアグラムのグラフ表示である。 生データのノイズ除去とクロマトグラフィーピークとそこから抽出された適切な情報を同定するために、ノイズ除去された生データに基づいたグループ分けを示す3次元ダイアグラムのグラフ表示である。 生データのノイズ除去とクロマトグラフィーピークとそこから抽出された適切な情報を同定するために、ノイズ除去された生データに基づいたグループ分けを示す3次元ダイアグラムのグラフ表示である。 生データのノイズ除去とクロマトグラフィーピークとそこから抽出された適切な情報を同定するために、ノイズ除去された生データに基づいたグループ分けを示す3次元ダイアグラムのグラフ表示である。 本発明によるシステムの実施の態様の概略ブロックダイアグラムである。 発明によるデータ前処理およびデータ処理の前の生LC−MSデータを示している。 本発明によるデータ前処理およびデータ処理から得られるデータセットの比較を行わせる2つのダイアグラムを示している。 ベイジアン習得に基づいたグループ分けによるピークに属する同定されたデータポイントを示す3次元ダイアグラムのグラフ表示である。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。 図26によるグループ分けの結果に下線を引いたグループ分けの過程で生じたグループ分けプロトコルのプロトコル1から104頁のグループ分けを示している。

Claims (12)

  1. 分析技術および検出技術の1種または2種を組み合わせた2または3以上の技術を行うことにより、少なくとも1つのサンプルを分析して、少なくとも1つの成分、特にそこに含まれている化学的成分、生物的成分あるいは生物化学的成分、および少なくとも1つの該技術を行うことから生じる生成物に関して、該サンプルを評価する特性化データを提供する方法であって、
    a)i)成分を分離するための、あるいは
    ii)前記2または3以上の分析技術のうちの少なくとも1つの分析技術を行うことにより生じる生成物を分離するための、あるいは
    iii)該少なくとも1つの分析技術を行うことにより生じる成分および生成物を分離するための
    少なくとも1つの分析技術を行う工程であって、該分析技術は、該サンプルに関して、あるいはすでに分離されている成分あるいは生成物に関して行われ、該分離は、該成分あるいは生成物の少なくとも1つの第1識別特性に基づいて行われることを特徴とする工程と、
    b)既に分離された、あるいは分離中の成分あるいは生成物に関して、少なくとも1つの技術を行う工程であって、さらなる技術は、i)工程a)を少なくとも1度行うことにより得られる少なくとも1つの分離、および ii)少なくとも1つの識別特性のうちの少なくとも1つに基づいて、分離された成分あるいは生成物を特性づけるための少なくとも1つの分析技術および検出技術であることを特徴とする工程からなることを特徴とする方法であり;
    少なくとも工程b)において、質量対電荷比のスキャン数および質量対電荷比または質量スペクトルのスキャンの検出時間および質量対電荷比の少なくとも2つの特性付け測定量と、工程a)を少なくとも1度行うことにより得られる該分離あるいは少なくとも1つの分離を反映する該特性付け測定量の少なくとも1つの質量対電荷比のスキャン数および質量スペクトルのスキャンの検出時間と、i)工程a)を少なくとも1度行うことにより得られる少なくとも1つの他の分離と ii)該さらなる識別特性あるいはさらなる識別特性の少なくとも1つのうちの少なくとも1つを反映する該特性付け測定量のうちの少なくとも1つの質量対電荷比により該成分あるいは生成物の少なくとも1つの特性付けを表示する測定データを提供する検出ハードウエアを使用することを特徴とし;
    該方法は、
    c)該特性付け測定量の少なくとも1つの質量対電荷比のスキャン数および質量スペクトルのスキャンの検出時間により、該特性付けあるいは少なくとも1つの特性付けを表示する前記少なくとも1つの質量対電荷比のスキャン数または質量スペクトルのスキャンの検出時間にかかわる第1特性付け測定値と、該特性付け測定量の該少なくとも1つの質量対電荷比により、該特性付けあるいは、少なくとも1つの特性付けを表示する前記少なくとも1つの質量対電荷比にかかわる特性付け測定値とを互いに関連させることにより、検出ハードウエアにより提供される測定データに基づいて、データ組を提供する工程と、
    d)該データ組を、該特性付け測定量の少なくとも1つに対する特性付け測定値に関して、測定値を特性付ける特性付け測定値間隔で、該各間隔は、該成分あるいは生成物の1つの特定物に潜在的に関連して求められるものである測定値間隔にグループ分けする工程とからなり;
    該グループ分けが、該成分あるいは生成物の該特定物に関連した真の、あるいは特性的な、あるいは平均の特性付け測定値からの各特性付け測定値のズレの少なくとも1つの統計的分布に基づいて行われ、前記間隔は、初期化データに基づいて、工程d)によるグループ分けの過程で、前記成分あるいは製品の前記特定物から始まりかつ既にグループ分けされていないデータ組に属している各特性付け測定値全ての実質的量を包含するために既にグループ分けされたデータ組に基づいて、ズレの前記統計的分布によって予測される予測間隔であることを特徴とし;
    さらに該方法は、
    e)i)該グループ分けから得られるデータ組の群および ii)該グループ分けから得られた該特性付け測定値の少なくとも1つの間隔の少なくとも1つを反映しあるいは包含するデータの格納、表示および印刷あるいはデータの可視化の少なくとも1つの工程および;
    f)i)該グループ分けから得られるデータ組の群および ii)該グループ分けから得られた該特性付け測定値の少なくとも1つの間隔の少なくとも1つに基づいて、あるいは工程e)により格納され、表示されあるいは印刷されたデータあるいは可視化に基づいて、前記少なくとも1つのサンプルの解析あるいは前記成分あるいは生成物の少なくとも1つ解析をする工程
    のうちの少なくとも1つを含むことを特徴とする方法。
  2. 分析技術および検出技術の1種または2種を組み合わせた2または3以上の技術を行うことにより、少なくとも1つのサンプルを分析して、少なくとも1つの成分、特にそこに含まれている化学的成分、生物的成分あるいは生物化学的成分、および少なくとも1つの前記技術を行うことから生じる生成物に関して、前記サンプルを評価する特性化データを提供する方法であって、
    a)i)成分を分離するための、あるいは
    ii)前記2または3以上の技術のうちの少なくとも1つの分析技術を行うことにより生じる生成物を分離するための、あるいは
    iii)前記少なくとも1つの分析技術を行うことにより生じる成分および生成物を分離するための
    少なくとも1つの分析技術を行う工程であって、前記分析技術は、前記サンプルに関して、あるいはすでに分離されている成分あるいは生成物に関して行われ、前記分離は、前記成分あるいは生成物の少なくとも1つの第1識別特性に基づいて行われることを特徴とする工程と、
    b)既に分離された、あるいは分離中の成分あるいは生成物に関して、少なくとも1つの技術を行う工程であって、さらなる技術は、i)工程a)を少なくとも1度行うことにより得られる少なくとも1つの分離、および ii)少なくとも1つの識別特性のうちの少なくとも1つに基づいて、分離された成分あるいは生成物を特性づけるための少なくとも1つの分析技術および検出技術であることを特徴とする工程からなることを特徴とする方法であり;
    少なくとも工程b)において、質量対電荷比のスキャン数および質量対電荷比または質量スペクトルのスキャンの検出時間および質量対電荷比の少なくとも2つの特性付け測定量と、工程a)を少なくとも1度行うことにより得られる前記分離あるいは少なくとも1つの分離を反映する前記特性付け測定量の少なくとも1つの質量対電荷比のスキャン数および質量スペクトルのスキャンの検出時間と、i)工程a)を少なくとも1度行うことにより得られる少なくとも1つの他の分離と ii)前記さらなる識別特性あるいはさらなる識別特性の少なくとも1つのうちの少なくとも1つを反映する前記特性付け測定量の少なくとも1つの質量対電荷比により、前記成分あるいは生成物の少なくとも1つの特性付けを表示する測定データを提供する検出ハードウエアを使用することを特徴とし;
    前記検出ハードウエアにより提供される前記測定データは、前記検出ハードウエアにより検出されかつそれに関連する少なくとも1つの特性付け測定量を参照して、イオン強度により、検出ハードウエアにより提供される少なくとも1つのイオン強度を表示する定量的測定データを包含することを特徴とし、
    前記方法は、
    c)前記特性付け測定量の少なくとも1つの前記質量対電荷比のスキャン数および質量スペクトルのスキャンの検出時間により、前記特性付けあるいは少なくとも1つの特性付けを表示する前記少なくとも1つの質量対電荷比のスキャン数または質量スペクトルのスキャンの検出時間にかかわる第1特性付け測定値と、前記特性付け測定量の前記少なくとも1つの質量対電荷比により、前記特性付けあるいは少なくとも1つの特性付けを表示する少なくとも1つの質量対電荷比にかかわる特性付け測定値と、イオン強度により、前記定量化あるいは少なくとも1つのイオン強度を表示する少なくとも1つの各定量的測定値とを、互いに関連させることにより、検出ハードウエアにより提供される測定データに基づいて、データ組を提供する工程と、
    d)前記データ組を、前記特性付け測定量の少なくとも1つに対する特性付け測定値に関して、測定値を特性付ける特性付け測定値間隔で、前記各間隔は、前記成分あるいは生成物の1つの特定物に潜在的に関連して求められるものである測定値間隔にグループ分けする工程とからなり;
    前記グループ分けは、複数の前記定量的測定値で各々は前記データ組のそれぞれ1つに属している値の少なくとも1つの集合的特性に基づいて、さらに行われることを特徴とし、前記集合的特性が、複数の前記定量的測定値から求められる全般的定量的測定値または複数の前記定量的測定値の少なくとも1つの各値を包含しているこれらのデータ組により、直接にあるいは間接に定められる少なくとも1つの曲線あるいはヒストグラムの形状からなり;
    さらに前記方法は、
    e)i)前記グループ分けから得られるデータ組の群および ii)前記グループ分けから得られた前記特性付け測定値の少なくとも1つの間隔の少なくとも1つを反映しあるいは包含するデータの格納、表示および印刷あるいはデータの可視化の少なくとも1つの工程および;
    f)i)前記グループ分けから得られるデータ組の群および ii)前記グループ分けから得られた前記特性付け測定値の少なくとも1つの間隔の少なくとも1つに基づいて、あるいは工程e)により格納され、表示されあるいは印刷されたデータあるいは可視化に基づいて、前記少なくとも1つのサンプルの解析あるいは前記成分あるいは生成物の少なくとも1つ解析をする工程
    のうちの少なくとも1つを含むことを特徴とする方法。
  3. 工程d)における前記グループ分けが、前記成分あるいは生成物の前記特定物に関連した真の、あるいは特性的な、あるいは平均の特性付け測定値からの各特性付け測定値のズレの少なくとも1つの統計的分布に基づいて、さらに行われ、前記間隔は、初期化データに基づいて、工程d)によるグループ分けの過程で、前記成分あるいは製品の前記特定物から始まりかつ既にグループ分けされていないデータ組に属している各特性付け測定値全ての実質的量を包含するために既にグループ分けされたデータ組に基づいて、ズレの前記統計的分布によって予測される予測間隔であることを特徴とする請求項2記載の方法。
  4. 各データ組の少なくとも1つの特性付け測定値が、ズレの前記統計的分布から得られる電流特性付け測定値間隔中に落ちるか、あるいは落ちないかの決定を、ズレの少なくとも1つの統計的分布に基づいてのグループ分けが、包含することを特徴とする請求項1または3記載の方法。
  5. 少なくとも1つの各特性付け測定値が、電流特性付け測定値間隔中に入るという決定と、少なくとも1つの各特性付け測定値が、電流特性付け測定値間隔中に入らないという決定との少なくとも1つに基づいて、ズレの前記統計的分布を更新することを特徴し、また更新される特性付け測定値間隔が、ズレの更新される統計的分布から得られ、前記グループ分けにおける電流特性付け測定値として使用されることを特徴とする請求項4記載の方法。
  6. 前記グループ分けが、
    d1)測定ズレの電流分布として、初期化データに基づいた測定ズレの以前の分布を前提とする工程と;
    d2)測定ズレの電流分布に基づいて、少なくとも1つの電流予測間隔を得る工程と;
    d3)あらかじめ定められたアクセススケジュールにより、前記データ組あるいは前記あるいは前記データ組の少なくとも1つのデータ組にアクセスする工程と;
    d4)アクセスされる各データ組の少なくとも1つの特性付け測定値が、電流予測間隔中に落ちるか、あるいは落ちないかを決定する工程と;
    d5)もし特性付け測定値が、電流予測間隔に落ちる場合には;
    i)少なくとも1つのアクセスされたデータ組を、前記成分あるいは生成物の1つの特定物に関連しているデータ組の各群の最初のあるいはさらなる候補メンバーとして特性付け測定値を包含するデータ組を同定する工程と
    ii)少なくとも測定ズレの電流分布に基づいて、既にアクセスされていないデータ組に関して測定ズレの以前の分布である測定ズレの後の分布を計算する工程と;
    d6)もしある停止基準あるいは停止基準の少なくとも1つが、実施されると、
    i)測定ズレの電流分布に基づいたグループわけを停止する工程と;
    ii)もし候補メンバーあるいは確認されているメンバーあるいは候補および確認されているメンバーのグループが、見出されると、さらに候補メンバーを追加するために、前記グループを閉じる工程とを包含し、
    工程d6)が、達成されるまで、工程d2)からd5)を反復することを特徴とする請求項1、3、4または5記載の方法。
  7. 少なくとも1つの成分、特にそこに含まれている化学的成分、生物的成分あるいは生物化学的成分、および請求項1から6にかかわる特性化データを提供するために、分析技術および検出技術の1種または2種を組み合わせた2または3以上の技術を行うことにより、少なくとも1つのサンプルを分析するシステムであって、
    a)i)成分を分離するための、あるいは
    ii)前記2または3以上の技術のうちの少なくとも1つの分析技術を行うことにより生じる生成物を分離するための、あるいは
    iii)前記少なくとも1つの分析技術を行うことにより生じる成分および生成物を分離するための
    少なくとも1つの分析技術を行うために適合されている少なくとも1つの分析部あるいはユニットであって、少なくとも1つの分析部あるいはユニットは、前記サンプルに関して、あるいはすでに分離されている成分あるいは生成物に関して前記分析技術を行うために適合されており、前記分析部あるいはユニットは、前記成分あるいは生成物の少なくとも1つの第1識別特性に基づいて、前記分離を行うために適合されていることを特徴とする少なくとも1つの分析部あるいはユニットと;
    b)i)前記1つの分析部あるいはユニットにより達成される少なくとも1つの分離および ii)少なくとも1つの識別特性のうちの少なくとも1つに基づいて、分離された成分あるいは生成物を特性づけるための少なくとも1つの分析技術を行うために適合されている少なくとも1つの分析部あるいはユニットと、前記さらなる技術は、分析技術および検出技術の少なくとも1つであり、前記さらなる分析部あるいはユニットは、分析および検出部あるいはユニットの少なくとも1つであることを特徴とする少なくとも1つの分析部あるいはユニットとからなり;
    少なくとも前記分析部あるいはユニットは、質量対電荷比のスキャン数および質量対電荷比または質量スペクトルのスキャンの検出時間および質量対電荷比の少なくとも2つの特性付け測定量と、前記1つの分析部あるいはユニットにより達成される前記分離あるいは少なくとも1つの分離を反映する前記特性付け測定量の少なくとも1つの質量対電荷比のスキャン数および質量スペクトルのスキャンの検出時間と、i)前記1つの分析部あるいはユニットにより達成される少なくとも1つの分離と ii)前記さらなる識別特性あるいはさらなる識別特性の少なくとも1つのうちの少なくとも1つを反映する前記特性付け測定量の少なくとも1つの質量対電荷比により、前記成分あるいは生成物の少なくとも1つの特性付けを表示する測定データを提供するために適合される関連の検出ハードウエアを含むことを特徴とし;
    前記検出ハードウエアは、前記検出ハードウエアにより検出され、かつそれに関連する少なくとも1つの特性付け測定量を参照して、少なくとも1つのイオン強度により、検出ハードウエアにより提供される少なくとも1つのイオン強度を表示する定量的測定データを包含する測定データを提供するために、適合されてもよく、あるいは適合されなくてもよいことを特徴とし;
    前記システムは、さらに、少なくとも1つのプロセッサを持つ少なくとも1つの制御ユニットと、関連する少なくとも1つのデータ格納ユニットを含みあるいは有する前記制御ユニットと、さらに好ましくは関連する少なくとも1つの表示ユニットを持つ前記制御ユニットと、印刷ユニットからなり、また好ましくは、少なくとも1つの分析部あるいはユニットおよび前記分析部あるいはユニットを制御するために、配置されあるいはプログラムされていることを特徴とし;
    前記制御ユニットは、
    c)前記特性付け測定量の少なくとも1つの前記質量対電荷比のスキャン数および質量スペクトルのスキャンの検出時間により、前記特性付けあるいは少なくとも1つの特性付けを表示する前記少なくとも1つの質量対電荷比のスキャン数または質量スペクトルのスキャンの検出時間にかかわる第1特性付け測定値と、前記特性付け測定量の前記少なくとも1つの質量対電荷比により、前記特性付けあるいは少なくとも1つの特性付けを表示する前記少なくとも1つの質量対電荷比にかかわる特性付け測定値とを互いに関連させることにより、検出ハードウエアにより提供される測定データに基づいて、データ組を提供するために;
    d)前記データ組を、前記特性付け測定量の少なくとも1つに対する特性付け測定値に関して、測定値を特性付ける特性付け測定値間隔で、前記各間隔は、前記成分あるいは生成物の1つの特定物に潜在的に関連して求められるものである測定値間隔にグループ分けするために;配置されあるいはプログラムされていることを特徴とし;
    前記制御ユニットは、前記成分あるいは生成物の前記特定物に関連した真の、あるいは特性的な、あるいは平均の特性付け測定値からの各特性付け測定値のズレの少なくとも1つの統計的分布に基づいて、前記グループ分けを行うために配置されあるいはプログラムされ、それによって前記間隔は、初期化データに基づいて、工程d)によるグループ分けの過程で、前記成分あるいは製品の前記特定物から始まりかつ既にグループ分けされていないデータ組に属している各特性付け測定値全ての実質的量を包含するために既にグループ分けされたデータ組に基づいて、ズレの前記統計的分布によって予測される予測間隔であることを特徴とし;
    さらに前記制御ユニットが、
    e)i)前記グループ分けから得られるデータ組の群および ii)前記グループ分けから得られた前記特性付け測定値の少なくとも1つの間隔の少なくとも1つを反映しあるいは包含するデータの格納、表示および印刷あるいはデータの可視化の少なくとも1つと;
    f)i)前記グループ分けから得られるデータ組の群および ii)前記グループ分けから得られた前記特性付け測定値の少なくとも1つの間隔の少なくとも1つに基づいて、あるいは工程e)により格納され、表示されあるいは印刷されたデータあるいは可視化に基づいて、前記少なくとも1つのサンプルの解析あるいは前記成分あるいは生成物の少なくとも1つ解析を提供するために、配置されあるいはプログラムされていることを特徴とするシステム。
  8. 少なくとも1つの成分、特にそこに含まれている化学的成分、生物的成分あるいは生物化学的成分、および先行する請求項1から6にかかわる特性化データを提供するために、分析技術および検出技術の1種または2種を組み合わせた2または3以上の技術を行うことにより、少なくとも1つのサンプルを分析するシステムであって、
    a)i)成分を分離するための、あるいは
    ii)前記2または3以上の技術のうちの少なくとも1つの分析技術を行うことにより生じる生成物を分離するための、あるいは
    iii)前記少なくとも1つの分析技術を行うことにより生じる成分および生成物を分離するための
    少なくとも1つの分析技術を行うために適合されている少なくとも1つの分析部あるいはユニットであって、少なくとも1つの分析部あるいはユニットは、前記サンプルに関して、あるいはすでに分離されている成分あるいは生成物に関して前記分析技術を行うために適合されており、前記分析部あるいはユニットは、前記成分あるいは生成物の少なくとも1つの第1識別特性に基づいて、前記分離を行うために適合されていることを特徴とする少なくとも1つの分析部あるいはユニットと;
    b)i)前記1つの分析部あるいはユニットにより達成される少なくとも1つの分離および ii)少なくとも1つの識別特性のうちの少なくとも1つに基づいて、分離された成分あるいは生成物を特性づけるための少なくとも1つの分析技術を行うために適合されている少なくとも1つの分析部あるいはユニットと、前記さらなる技術は、分析技術および検出技術の少なくとも1つであり、前記さらなる分析部あるいはユニットは、分析および検出部あるいはユニットの少なくとも1つであることを特徴とする少なくとも1つの分析部あるいはユニットとからなり;
    少なくともさらなる前記分析部あるいはユニットは、質量対電荷比のスキャン数および質量対電荷比または質量スペクトルのスキャンの検出時間および質量対電荷比の少なくとも2つの特性付け測定量と、前記1つの分析部あるいはユニットにより達成される前記分離あるいは少なくとも1つの分離を反映する前記特性付け測定量の少なくとも1つの質量対電荷比のスキャン数および質量スペクトルのスキャンの検出時間と、i)前記1つの分析部あるいはユニットにより達成される少なくとも1つの分離と ii)前記さらなる識別特性あるいはさらなる識別特性の少なくとも1つのうちの少なくとも1つを反映する前記特性付け測定量の少なくとも1つの質量対電荷比により、前記成分あるいは生成物の少なくとも1つの特性付けを表示する測定データを提供するために適合される関連の検出ハードウエアを含むことを特徴とし;
    前記検出ハードウエアは、前記検出ハードウエアにより検出されかつそれに関連する少なくとも1つの特性付け測定量を参照して、少なくとも1つのイオン強度により、検出ハードウエアにより提供される少なくとも1つのイオン強度を表示する定量的測定データを包含する測定データを提供するために、適合されていることを特徴とし;
    前記システムは、さらに、少なくとも1つのプロセッサを持つ少なくとも1つの制御ユニットと、関連する少なくとも1つのデータ格納ユニットを含みあるいは有する前記制御ユニットと、さらに好ましくは関連する少なくとも1つの表示ユニットを持つ前記制御ユニットと、印刷ユニットからなり、また好ましくは、少なくとも1つの分析部あるいはユニットおよび前記さらなる分析部あるいはユニットを制御するために、配置されあるいはプログラムされていることを特徴とし;
    前記制御ユニットは、
    c)前記特性付け測定量の少なくとも1つの前記質量対電荷比のスキャン数および質量スペクトルのスキャンの検出時間により、前記特性付けあるいは少なくとも1つの特性付けを表示する少なくとも1つの質量対電荷比のスキャン数または質量スペクトルのスキャンの検出時間にかかわる第1特性付け測定値と、前記特性付け測定量の前記少なくとも1つの質量対電荷比により、前記特性付けあるいは少なくとも1つの特性付けを表示する少なくとも1つの質量対電荷比にかかわる特性付け測定値と、イオン強度により、前記定量化あるいは少なくとも1つのイオン強度を表示する少なくとも1つの各定量的測定値とを、互いに関連させることにより、検出ハードウエアにより提供される測定データに基づいて、データ組を提供するために;
    d)前記データ組を、前記特性付け測定量の少なくとも1つに対する特性付け測定値に関して、測定値を特性付ける特性付け測定値間隔で、前記各間隔は、前記成分あるいは生成物の1つの特定物に潜在的に関連して求められるものである測定値間隔にグループ分けするために;配置されあるいはプログラムされていることを特徴とし;
    前記制御ユニットは、複数の前記定量的測定値で各々は前記データ組のそれぞれ1つに属している値の少なくとも1つの集合的特性に基づいて、前記グループ分けを行うために、配置されあるいはプログラムされていることを特徴とし、前記集合的特性が、複数の前記定量的測定値から求められる全般的定量的測定値または複数の前記定量的測定値の少なくとも1つの各値を包含しているこれらのデータ組により、直接にあるいは間接に定められる少なくとも1つの曲線あるいはヒストグラムの形状からなり;
    さらに前記制御ユニットは、次の少なくとも1つ;
    e)i)前記グループ分けから得られるデータ組の群および2)前記グループ分けから得られた前記特性付け測定値の少なくとも1つの間隔の少なくとも1つを反映しあるいは包含するデータの格納、表示および印刷あるいはデータの可視化の少なくとも1つと;
    f)i)前記グループ分けから得られるデータ組の群および ii)前記グループ分けから得られた前記特性付け測定値の少なくとも1つの間隔の少なくとも1つに基づいて、あるいは工程e)により格納され、表示されあるいは印刷されたデータあるいは可視化に基づいて、前記少なくとも1つのサンプルの解析あるいは前記成分あるいは生成物の少なくとも1つ解析を提供するために、配置されあるいはプログラムされていることを特徴とするシステム。
  9. 少なくとも1つの成分、特にそこに含まれている化学的成分、生物的成分あるいは生物化学的成分、および先行する請求項1から6にかかわる特性化データを提供するために、分析技術および検出技術の1種または2種を組み合わせた2または3以上の技術を行うことにより、少なくとも1つのサンプルを分析するシステムにより実行可能な指令のプログラムであって、このシステムは、
    a)i)成分を分離するための、あるいは
    ii)前記2または3以上の技術のうちの少なくとも1つの分析技術を行うことにより生じる生成物を分離するための、あるいは
    iii)前記少なくとも1つの分析技術を行うことにより生じる成分および生成物を分離するための
    少なくとも1つの分析技術を行うために適合されている少なくとも1つの分析部あるいはユニットであって、少なくとも1つの分析部あるいはユニットは、前記サンプルに関して、あるいはすでに分離されている成分あるいは生成物に関して前記分析技術を行うために適合されており、前記分析部あるいはユニットは、前記成分あるいは生成物の少なくとも1つの第1識別特性に基づいて、前記分離を行うために適合されていることを特徴とする少なくとも1つの分析部あるいはユニットと;
    b)i)前記1つの分析部あるいはユニットにより達成される少なくとも1つの分離および ii)少なくとも1つの識別特性のうちの少なくとも1つに基づいて、分離された成分あるいは生成物を特性づけるための少なくとも1つの分析技術を行うために適合されている少なくとも1つの分析部あるいはユニットと、前記さらなる技術は、分析技術および検出技術の少なくとも1つであり、前記さらなる分析部あるいはユニットは、分析および検出部あるいはユニットの少なくとも1つであることを特徴とする少なくとも1つの分析部あるいはユニットとからなり;
    少なくともさらなる前記分析部あるいはユニットは、質量対電荷比のスキャン数および質量対電荷比または質量スペクトルのスキャンの検出時間および質量対電荷比の少なくとも2つの特性付け測定量と、前記1つの分析部あるいはユニットにより達成される前記分離あるいは少なくとも1つの分離を反映する前記特性付け測定量の少なくとも1つの質量対電荷比のスキャン数および質量スペクトルのスキャンの検出時間と、i)前記1つの分析部あるいはユニットにより達成される少なくとも1つの分離と ii)前記さらなる識別特性あるいはさらなる識別特性の少なくとも1つのうちの少なくとも1つを反映する前記特性付け測定量の少なくとも1つの質量対電荷比により、前記成分あるいは生成物の少なくとも1つの特性付けを表示する測定データを提供するために適合される関連の検出ハードウエアを含むことを特徴とし;
    前記検出ハードウエアは、前記検出ハードウエアにより検出されかつそれに関連する少なくとも1つの特性付け測定量を参照して、少なくとも1つのイオン強度により、検出ハードウエアにより提供される少なくとも1つのイオン強度を表示する定量的測定データを包含する測定データを提供するために、適合されてもよく、あるいは適合されなくてもよいことを特徴とし;
    前記システムは、さらに、少なくとも1つのプロセッサを持つ少なくとも1つの制御ユニットと、関連する少なくとも1つのデータ格納ユニットを含みあるいは有する前記制御ユニットと、さらに好ましくは関連する少なくとも1つの表示ユニットを持つ前記制御ユニットと、印刷ユニットからなり、また好ましくは、少なくとも1つの分析部あるいはユニットおよび前記さらなる分析部あるいはユニットを制御するために、配置されあるいはプログラムされていることを特徴とし;
    前記制御ユニットは、前記指示に応答して、
    c)前記特性付け測定量の少なくとも1つの前記質量対電荷比のスキャン数および質量スペクトルのスキャンの検出時間により、前記特性付けあるいは少なくとも1つの特性付けを表示する少なくとも1つの質量対電荷比のスキャン数または質量スペクトルのスキャンの検出時間にかかわる第1特性付け測定値と、前記特性付け測定量の前記少なくとも1つの質量対電荷比により、前記特性付けあるいは少なくとも1つの特性付けを表示する少なくとも1つの質量対電荷比にかかわる特性付け測定値とを互いに関連させることにより、検出ハードウエアにより提供される測定データに基づいて、データ組を提供する工程と;
    d)前記データ組を、前記特性付け測定量の少なくとも1つに対する特性付け測定値に関して、測定値を特性付ける特性付け測定値間隔で、前記各間隔は、前記成分あるいは生成物の1つの特定物に潜在的に関連して求められるものである測定値間隔にグループ分けする工程とを実行することを特徴とし;
    前記制御ユニットは、前記指示に応答して、前記成分あるいは生成物の前記特定物に関連した真の、あるいは特性的な、あるいは平均の特性付け測定値からの各特性付け測定値のズレの少なくとも1つの統計的分布に基づいて、前記グループ分けを行い、それによって前記間隔は、初期化データに基づいて、工程d)によるグループ分けの過程で、前記成分あるいは製品の前記特定物から始まりかつ既にグループ分けされていないデータ組に属している各特性付け測定値全ての実質的量を包含するために既にグループ分けされたデータ組に基づいて、ズレの前記統計的分布によって予測される予測間隔であることを特徴とし;
    さらに前記制御ユニットは、前記指示に応答して、次の工程の少なくとも1つ;
    e)i)前記グループ分けから得られるデータ組の群および ii)前記グループ分けから得られた前記特性付け測定値の少なくとも1つの間隔の少なくとも1つを反映しあるいは包含するデータの格納、表示および印刷あるいはデータの可視化の少なくとも1つと;
    f)i)前記グループ分けから得られるデータ組の群および ii)前記グループ分けから得られた前記特性付け測定値の少なくとも1つの間隔の少なくとも1つに基づいて、あるいは工程e)により格納され、表示されあるいは印刷されたデータあるいは可視化に基づいて、前記少なくとも1つのサンプルの解析あるいは前記成分あるいは生成物の少なくとも1つの解析の工程;
    を実行することを特徴とするシステムにより実行可能なプログラム。
  10. 少なくとも1つの成分、特にそこに含まれている化学的成分、生物的成分あるいは生物化学的成分、および先行する請求項1から6にかかわる特性化データを提供するために、分析技術および検出技術の1種または2種を組み合わせた2または3以上の技術を行うことにより、少なくとも1つのサンプルを分析するシステムにより実行可能な指令のプログラムであって、このシステムは、
    a)i)成分を分離するための、あるいは
    ii)前記2または3以上の技術のうちの少なくとも1つの分析技術を行うことにより生じる生成物を分離するための、あるいは
    iii)前記少なくとも1つの分析技術を行うことにより生じる成分および生成物を分離するための
    少なくとも1つの分析技術を行うために適合されている少なくとも1つの分析部あるいはユニットであって、少なくとも1つの分析部あるいはユニットは、前記サンプルに関して、あるいはすでに分離されている成分あるいは生成物に関して前記分析技術を行うために適合されており、前記分析部あるいはユニットは、前記成分あるいは生成物の少なくとも1つの第1識別特性に基づいて、前記分離を行うために適合されていることを特徴とする少なくとも1つの分析部あるいはユニットと;
    b)i)前記1つの分析部あるいはユニットにより達成される少なくとも1つの分離および ii)少なくとも1つの識別特性のうちの少なくとも1つに基づいて、分離された成分あるいは生成物を特性づけるための少なくとも1つの分析技術を行うために適合されている少なくとも1つの分析部あるいはユニットと、前記さらなる技術は、分析技術および検出技術の少なくとも1つであり、前記さらなる分析部あるいはユニットは、分析および検出部あるいはユニットの少なくとも1つであることを特徴とする少なくとも1つの分析部あるいはユニットとからなり;
    少なくともさらなる前記分析部あるいはユニットは、質量対電荷比のスキャン数および質量対電荷比または質量スペクトルのスキャンの検出時間および質量対電荷比の少なくとも2つの特性付け測定量と、前記1つの分析部あるいはユニットにより達成される前記分離あるいは少なくとも1つの分離を反映する前記特性付け測定量の少なくとも1つの質量対電荷比のスキャン数および質量スペクトルのスキャンの検出時間と、i)前記1つの分析部あるいはユニットにより達成される少なくとも1つの分離と ii)前記さらなる識別特性あるいはさらなる識別特性の少なくとも1つのうちの少なくとも1つを反映する前記特性付け測定量の少なくとも1つの質量対電荷比により、前記成分あるいは生成物の少なくとも1つの特性付けを表示する測定データを提供するために適合される関連の検出ハードウエアを含むことを特徴とし;
    前記検出ハードウエアは、前記検出ハードウエアにより検出されかつそれに関連する少なくとも1つの特性付け測定量を参照して、少なくとも1つのイオン強度により、検出ハードウエアにより提供される少なくとも1つのイオン強度を表示する定量的測定データを包含する測定データを提供するために、適合されていることを特徴とし;
    前記システムは、さらに、少なくとも1つのプロセッサを持つ少なくとも1つの制御ユニットと、関連する少なくとも1つのデータ格納ユニットを含みあるいは有する前記制御ユニットと、さらに好ましくは関連する少なくとも1つの表示ユニットを持つ前記制御ユニットと、印刷ユニットからなり、また好ましくは、少なくとも1つの分析部あるいはユニットおよび前記さらなる分析部あるいはユニットを制御するために、配置されあるいはプログラムされていることを特徴とし;
    前記制御ユニットは、前記指示に対応して、
    c)前記特性付け測定量の少なくとも1つの前記質量対電荷比のスキャン数および質量スペクトルのスキャンの検出時間により、前記特性付けあるいは少なくとも1つの特性付けを表示する少なくとも1つの質量対電荷比のスキャン数または質量スペクトルのスキャンの検出時間にかかわる第1特性付け測定値と、前記特性付け測定量の前記少なくとも1つの質量対電荷比により、前記特性付けあるいは少なくとも1つの特性付けを表示する少なくとも1つの質量対電荷比にかかわる特性付け測定値と、イオン強度により、前記定量化あるいは少なくとも1つのイオン強度を表示する少なくとも1つの各定量的測定値とを、互いに関連させることにより、検出ハードウエアにより提供される測定データに基づいて、データ組を提供する工程と;
    d)前記データ組を、前記特性付け測定量の少なくとも1つに対する特性付け測定値に関して、測定値を特性付ける特性付け測定値間隔で、前記各間隔は、前記成分あるいは生成物の1つの特定物に潜在的に関連して求められるものである測定値間隔にグループ分けする工程と;を実行することを特徴とし;
    前記制御ユニットは、前記指示に応答して、複数の前記定量的測定値で各々は前記データ組のそれぞれ1つに属している値の少なくとも1つの集合的特性に基づいて、前記グループ分けを行い、前記集合的特性が、複数の前記定量的測定値から求められる全般的定量的測定値または複数の前記定量的測定値の少なくとも1つの各値を包含しているこれらのデータ組により、直接にあるいは間接に定められる少なくとも1つの曲線あるいはヒストグラムの形状からなることを特徴とし;
    さらに前記制御ユニットは、前記指示に応答して、次の少なくとも1つの工程;
    e)i)前記グループ分けから得られるデータ組の群および2)前記グループ分けから得られた前記特性付け測定値の少なくとも1つの間隔の少なくとも1つを反映しあるいは包含するデータの格納、表示および印刷あるいはデータの可視化の少なくとも1つ工程と;
    f)i)前記グループ分けから得られるデータ組の群および ii)前記グループ分けから得られた前記特性付け測定値の少なくとも1つの間隔の少なくとも1つに基づいて、あるいは工程e)により格納され、表示されあるいは印刷されたデータあるいは可視化に基づいて、前記少なくとも1つのサンプルの解析あるいは前記成分あるいは生成物の少なくとも1つ解析の工程と;
    実行することを特徴とするシステムにより実行可能なプログラム。
  11. 請求項9および10のいずれかに記載のプログラムにより具現化されるコンピュータ製品。
  12. 通信リンクを経由して、書き込むための請求項9および10のいずれかに記載のプログラムを格納するサーバー・コンピュータシステム。
JP2005116310A 2004-04-23 2005-04-13 少なくとも1つの成分および生成する生成物の観点でサンプルを特性付けし、特性付けデータを提供するための2つ以上の技術に基づいた少なくとも1つのサンプルの分析;方法、システムおよび指示プログラム Expired - Fee Related JP4594154B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
EP04009709 2004-04-23

Publications (2)

Publication Number Publication Date
JP2005308741A JP2005308741A (ja) 2005-11-04
JP4594154B2 true JP4594154B2 (ja) 2010-12-08

Family

ID=34924713

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005116310A Expired - Fee Related JP4594154B2 (ja) 2004-04-23 2005-04-13 少なくとも1つの成分および生成する生成物の観点でサンプルを特性付けし、特性付けデータを提供するための2つ以上の技術に基づいた少なくとも1つのサンプルの分析;方法、システムおよび指示プログラム

Country Status (5)

Country Link
US (1) US7676329B2 (ja)
EP (1) EP1598666A1 (ja)
JP (1) JP4594154B2 (ja)
CN (1) CN1690713B (ja)
CA (1) CA2501003C (ja)

Families Citing this family (82)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020115056A1 (en) 2000-12-26 2002-08-22 Goodlett David R. Rapid and quantitative proteome analysis and related methods
GB0305796D0 (en) 2002-07-24 2003-04-16 Micromass Ltd Method of mass spectrometry and a mass spectrometer
EP1745499B1 (en) * 2004-04-30 2015-10-21 Micromass UK Limited Mass spectrometer
GB0409676D0 (en) 2004-04-30 2004-06-02 Micromass Ltd Mass spectrometer
US7526048B2 (en) * 2005-08-11 2009-04-28 Mitsubishi Electric Research Laboratories, Inc. Energy threshold selection for UWB TOA estimation
GB2432712B (en) 2005-11-23 2007-12-27 Micromass Ltd Mass spectrometer
GB0609253D0 (en) 2006-05-10 2006-06-21 Micromass Ltd Mass spectrometer
US7571056B2 (en) * 2006-05-25 2009-08-04 Vialogy Corp. Analyzing information gathered using multiple analytical techniques
US7512570B2 (en) * 2006-05-30 2009-03-31 Zaracom Technologies Inc. Artificial intelligence analyzer and generator
FI20065430A0 (fi) * 2006-06-21 2006-06-21 Valtion Teknillinen Spektroskopiadatan normalisointi usean sisäisen standardin avulla
FR2920235B1 (fr) * 2007-08-22 2009-12-25 Commissariat Energie Atomique Procede d'estimation de concentrations de molecules dans un releve d'echantillon et appareillage
US7653509B2 (en) * 2007-08-29 2010-01-26 Verity Software House Probability state models
DE102007059461A1 (de) * 2007-12-03 2009-06-04 Gesellschaft zur Förderung der Analytischen Wissenschaften e.V. Verfahren zur Auswertung analytbezogener Signale aus einem mittels der Ionenbeweglichkeitsspektrometrie aufgenommenen IMS-Chromatogramm
US8073635B2 (en) * 2008-02-15 2011-12-06 Dh Technologies Development Pte. Ltd. Method of quantitation by mass spectrometry
US10456036B2 (en) 2008-12-23 2019-10-29 Roche Diabetes Care, Inc. Structured tailoring
US9918635B2 (en) 2008-12-23 2018-03-20 Roche Diabetes Care, Inc. Systems and methods for optimizing insulin dosage
KR101529407B1 (ko) 2008-12-23 2015-06-16 에프. 호프만-라 로슈 아게 수집 디바이스 상에서 구동하는 구조화된 수집 절차의 구현, 실행, 데이터 수집, 및 데이터 분석을 위한 관리 방법 및 시스템
US10437962B2 (en) 2008-12-23 2019-10-08 Roche Diabetes Care Inc Status reporting of a structured collection procedure
US20120011125A1 (en) 2008-12-23 2012-01-12 Roche Diagnostics Operations, Inc. Management method and system for implementation, execution, data collection, and data analysis of a structured collection procedure which runs on a collection device
US9117015B2 (en) 2008-12-23 2015-08-25 Roche Diagnostics Operations, Inc. Management method and system for implementation, execution, data collection, and data analysis of a structured collection procedure which runs on a collection device
US20120038650A1 (en) * 2009-04-17 2012-02-16 Rainer Heller Alternate Sequence Descriptions For Producing Alternate Execution Paths In An Automation System
CN101763466B (zh) * 2010-01-20 2011-08-24 西安电子科技大学 基于动态样本选择集成的生物信息识别方法
US8548067B2 (en) * 2010-01-29 2013-10-01 Goran Ivkovic Single sensor radio scene analysis for packet based radio signals using 2nd and 4th order statistics
US8532933B2 (en) 2010-06-18 2013-09-10 Roche Diagnostics Operations, Inc. Insulin optimization systems and testing methods with adjusted exit criterion accounting for system noise associated with biomarkers
US8571333B2 (en) * 2010-10-17 2013-10-29 Canon Kabushiki Kaisha Data clustering
US9026536B2 (en) 2010-10-17 2015-05-05 Canon Kabushiki Kaisha Systems and methods for cluster comparison
CN106252192B (zh) * 2010-11-08 2018-04-03 Dh科技发展私人贸易有限公司 用于通过质谱分析快速筛选样本的***及方法
ES2865728T3 (es) * 2010-11-17 2021-10-15 Pioneer Hi Bred Int Predicción de fenotipos y rasgos basados en el metaboloma
US20120173151A1 (en) 2010-12-29 2012-07-05 Roche Diagnostics Operations, Inc. Methods of assessing diabetes treatment protocols based on protocol complexity levels and patient proficiency levels
CA2825280A1 (en) * 2011-01-21 2012-07-26 Massdefect Technologies, Llc Background subtraction-mediated data-dependent acquisition
US10488377B2 (en) * 2011-03-11 2019-11-26 Leco Corporation Systems and methods to process data in chromatographic systems
US8688631B2 (en) * 2011-03-17 2014-04-01 Alexander Savenok System and method for media file synchronization
US8766803B2 (en) 2011-05-13 2014-07-01 Roche Diagnostics Operations, Inc. Dynamic data collection
US8755938B2 (en) 2011-05-13 2014-06-17 Roche Diagnostics Operations, Inc. Systems and methods for handling unacceptable values in structured collection protocols
US9069725B2 (en) 2011-08-19 2015-06-30 Hartford Steam Boiler Inspection & Insurance Company Dynamic outlier bias reduction system and method
US10557840B2 (en) 2011-08-19 2020-02-11 Hartford Steam Boiler Inspection And Insurance Company System and method for performing industrial processes across facilities
JP5933032B2 (ja) * 2012-01-16 2016-06-08 レコ コーポレイションLeco Corporation クロマトグラフィーピークを処理しグループ化するシステム及び方法
GB201205720D0 (en) * 2012-03-30 2012-05-16 Micromass Ltd A method for the investigation of differences in analytical data and an apparatus adapted to perform such a method
CN107068531B (zh) * 2012-04-02 2019-05-07 Dh科技发展私人贸易有限公司 使用离子阱跨越质量范围进行连续窗口化获取的***及方法
DE102012112242C5 (de) * 2012-12-13 2021-07-29 Labor Berlin - Charité Vivantes GmbH Analyseverfahren für die Analyse von Substanzgemischen
CA2843276A1 (en) * 2013-02-20 2014-08-20 Hartford Steam Boiler Inspection And Insurance Company Dynamic outlier bias reduction system and method
US11646918B2 (en) 2013-03-15 2023-05-09 Digital Global Systems, Inc. Systems, methods, and devices for electronic spectrum management for identifying open space
US10257727B2 (en) 2013-03-15 2019-04-09 DGS Global Systems, Inc. Systems methods, and devices having databases and automated reports for electronic spectrum management
US9622041B2 (en) * 2013-03-15 2017-04-11 DGS Global Systems, Inc. Systems, methods, and devices for electronic spectrum management
US10231206B2 (en) 2013-03-15 2019-03-12 DGS Global Systems, Inc. Systems, methods, and devices for electronic spectrum management for identifying signal-emitting devices
US10257729B2 (en) 2013-03-15 2019-04-09 DGS Global Systems, Inc. Systems, methods, and devices having databases for electronic spectrum management
US10237770B2 (en) 2013-03-15 2019-03-19 DGS Global Systems, Inc. Systems, methods, and devices having databases and automated reports for electronic spectrum management
US10271233B2 (en) * 2013-03-15 2019-04-23 DGS Global Systems, Inc. Systems, methods, and devices for automatic signal detection with temporal feature extraction within a spectrum
US10299149B2 (en) 2013-03-15 2019-05-21 DGS Global Systems, Inc. Systems, methods, and devices for electronic spectrum management
US10219163B2 (en) 2013-03-15 2019-02-26 DGS Global Systems, Inc. Systems, methods, and devices for electronic spectrum management
DE102013213362A1 (de) * 2013-07-08 2015-01-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zur Identifizierung und Quantifizierung von emittierenden Teilchen in Systemen
KR20230030044A (ko) 2014-04-11 2023-03-03 하트포드 스팀 보일러 인스펙션 앤드 인슈어런스 컴퍼니 시스템 조작 및 수행 데이터 모델링에 기초한 미래 신뢰도 예측 개선
US20170098010A1 (en) * 2014-09-25 2017-04-06 Hitachi, Ltd. Data integration apparatus and data integration method
US9921811B2 (en) * 2015-03-26 2018-03-20 Wal-Mart Stores, Inc. Multiple display environment for software development projects
US9703689B2 (en) * 2015-11-04 2017-07-11 International Business Machines Corporation Defect detection using test cases generated from test models
EP3276343B1 (en) 2016-07-28 2019-08-28 Alpha M.O.S. Method and device for characterising an analyte
CN106596814B (zh) * 2016-11-25 2018-01-26 大连达硕信息技术有限公司 一种复杂液‑质联用数据中的色谱峰定量分析方法
US10529241B2 (en) 2017-01-23 2020-01-07 Digital Global Systems, Inc. Unmanned vehicle recognition and threat management
US10459020B2 (en) 2017-01-23 2019-10-29 DGS Global Systems, Inc. Systems, methods, and devices for automatic signal detection based on power distribution by frequency over time within a spectrum
US10700794B2 (en) 2017-01-23 2020-06-30 Digital Global Systems, Inc. Systems, methods, and devices for automatic signal detection based on power distribution by frequency over time within an electromagnetic spectrum
US10275612B1 (en) * 2017-03-03 2019-04-30 Microsoft Technology Licensing, Llc Combining the smoothed posterior distribution with empirical distribution for cohorts with small sample size
JP6899560B2 (ja) * 2017-05-23 2021-07-07 株式会社島津製作所 質量分析データ解析装置及び質量分析データ解析用プログラム
EP3410109A1 (en) * 2017-06-02 2018-12-05 Thermo Fisher Scientific (Bremen) GmbH Systems and methods for extracting mass traces
US20190049561A1 (en) * 2017-12-28 2019-02-14 Intel Corporation Fast lidar data classification
CN108814618B (zh) * 2018-04-27 2021-08-31 歌尔科技有限公司 一种运动状态的识别方法、装置及终端设备
US12014267B2 (en) * 2018-07-13 2024-06-18 Arizona Board Of Regents On Behalf Of Arizona State University Systems and methods for sequential event prediction with noise-contrastive estimation for marked temporal point process
US10943461B2 (en) 2018-08-24 2021-03-09 Digital Global Systems, Inc. Systems, methods, and devices for automatic signal detection based on power distribution by frequency over time
US11636292B2 (en) 2018-09-28 2023-04-25 Hartford Steam Boiler Inspection And Insurance Company Dynamic outlier bias reduction system and method
US20220359178A1 (en) * 2019-08-30 2022-11-10 Dh Technologies Development Pte. Ltd. Method for Mass Spectrometry
US11328177B2 (en) 2019-09-18 2022-05-10 Hartford Steam Boiler Inspection And Insurance Company Computer-based systems, computing components and computing objects configured to implement dynamic outlier bias reduction in machine learning models
US11615348B2 (en) 2019-09-18 2023-03-28 Hartford Steam Boiler Inspection And Insurance Company Computer-based systems, computing components and computing objects configured to implement dynamic outlier bias reduction in machine learning models
EP4022532A1 (en) 2019-09-18 2022-07-06 Hartford Steam Boiler Inspection and Insurance Company Computer-based systems, computing components and computing objects configured to implement dynamic outlier bias reduction in machine learning models
CN111191041A (zh) * 2019-11-22 2020-05-22 腾讯云计算(北京)有限责任公司 特征数据获取方法、数据存储方法、装置、设备及介质
CN111694827B (zh) * 2020-05-31 2023-04-07 重庆大学 一种电力设备状态监测数据缺失值分类插补方法和***
CN111797311B (zh) * 2020-06-19 2022-12-13 冯选明 一种电梯重量平衡系数检测***
CN111780956B (zh) * 2020-06-24 2022-12-13 黄毅 一种照度均匀度测试装置和方法
CN113917057B (zh) * 2020-07-07 2022-07-12 同方威视技术股份有限公司 用于确定已知标准样品的重要特征峰的方法和装置
JP2022181723A (ja) * 2021-05-26 2022-12-08 株式会社島津製作所 分析方法および診断支援方法
CN113419020A (zh) * 2021-06-30 2021-09-21 成都师范学院 糖化血红蛋白重叠峰识别方法、装置、***、设备及介质
CN114544818B (zh) * 2022-03-09 2022-09-13 新泰市日进化工科技有限公司 一种三氮唑生产回收物中甲酰胺浓度的检测方法及***
TWI831466B (zh) * 2022-11-11 2024-02-01 耀登科技股份有限公司 航向姿態的校正方法及航向姿態校正系統
CN117892061B (zh) * 2023-12-27 2024-06-28 上海生物芯片有限公司 用于定性定量分析的一维谱图数据处理方法、***、终端及介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001028252A (ja) * 1999-07-14 2001-01-30 Jeol Ltd 質量分析方法
JP2002527756A (ja) * 1998-10-15 2002-08-27 ネオジェネシス・ドラッグ・ディスカバリー・インコーポレイテッド 化学品混合物中の化合物を同定する方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MY107650A (en) 1990-10-12 1996-05-30 Exxon Res & Engineering Company Method of estimating property and / or composition data of a test sample
US5672869A (en) 1996-04-03 1997-09-30 Eastman Kodak Company Noise and background reduction method for component detection in chromatography/spectrometry
US5885841A (en) * 1996-09-11 1999-03-23 Eli Lilly And Company System and methods for qualitatively and quantitatively comparing complex admixtures using single ion chromatograms derived from spectroscopic analysis of such admixtures
DE19713194C2 (de) 1997-03-27 1999-04-01 Hkr Sensorsysteme Gmbh Verfahren und Anordnung zum Erkennen von Eigenschaften einer Probe auf der Basis der Massenspektroskopie
US5995989A (en) 1998-04-24 1999-11-30 Eg&G Instruments, Inc. Method and apparatus for compression and filtering of data associated with spectrometry
GB0016459D0 (en) 2000-07-04 2000-08-23 Pattern Recognition Systems As Method
NL1016034C2 (nl) 2000-08-03 2002-02-08 Tno Werkwijze en systeem voor het identificeren en kwantificeren van chemische componenten van een te onderzoeken mengsel van materialen.
CN1295243A (zh) * 2000-12-12 2001-05-16 吴斌 用生化酶标多功能分析仪测试血红蛋白检测技术的方法
US7343247B2 (en) 2001-07-30 2008-03-11 The Institute For Systems Biology Methods of classifying drug responsiveness using multiparameter analysis
CA2457432A1 (en) * 2001-08-13 2003-02-27 Jan Van Der Greef Method and system for profiling biological systems
US6873915B2 (en) 2001-08-24 2005-03-29 Surromed, Inc. Peak selection in multidimensional data
US20020193950A1 (en) 2002-02-25 2002-12-19 Gavin Edward J. Method for analyzing mass spectra

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002527756A (ja) * 1998-10-15 2002-08-27 ネオジェネシス・ドラッグ・ディスカバリー・インコーポレイテッド 化学品混合物中の化合物を同定する方法
JP2001028252A (ja) * 1999-07-14 2001-01-30 Jeol Ltd 質量分析方法

Also Published As

Publication number Publication date
CN1690713A (zh) 2005-11-02
US20060080040A1 (en) 2006-04-13
CN1690713B (zh) 2010-09-01
CA2501003C (en) 2009-05-19
US7676329B2 (en) 2010-03-09
JP2005308741A (ja) 2005-11-04
EP1598666A1 (en) 2005-11-23
CA2501003A1 (en) 2005-10-23

Similar Documents

Publication Publication Date Title
JP4594154B2 (ja) 少なくとも1つの成分および生成する生成物の観点でサンプルを特性付けし、特性付けデータを提供するための2つ以上の技術に基づいた少なくとも1つのサンプルの分析;方法、システムおよび指示プログラム
US7279679B2 (en) Methods and systems for peak detection and quantitation
EP2344874B1 (en) Methods of automated spectral peak detection and quantification without user input
JP2022066231A (ja) 生成イオンスペクトルのデータ独立取得および参照スペクトルライブラリ照合
US8428889B2 (en) Methods of automated spectral peak detection and quantification having learning mode
US7606667B2 (en) Mass spectrometry analysis method and system
EP2438436B1 (en) Methods of automated spectral peak detection and quantification without user input
JP2022525427A (ja) 質量分析法データにおける境界の自動検出
Burton et al. Instrumental and experimental effects in LC–MS-based metabolomics
JP2006528339A (ja) クロマトグラフィー/質量分析における生体分子パターンのアノテーション法及びシステム
WO2019176658A1 (ja) クロマトグラフィー質量分析方法およびクロマトグラフ質量分析装置
JP6748085B2 (ja) 干渉検出および着目ピークのデコンボルーション
CN114184599A (zh) 单细胞拉曼光谱采集数目估计方法、数据处理方法及装置
Laursen et al. Enhanced monitoring of biopharmaceutical product purity using liquid chromatography–mass spectrometry
CN116642989A (zh) 一种靶向液-质代谢组学数据的自动定量分析方法
Devitt et al. Estimation of low-level components lost through chromatographic separations with finite detection limits
AU2012202251B2 (en) Method and system for mass spectrometry analysis
Delabrière New approaches for processing and annotations of high-throughput metabolomic data obtained by mass spectrometry
CN114761795A (zh) 用于多跃迁监测的方法和装置
JP2023135276A (ja) 学習方法、および学習プログラム
JP4839248B2 (ja) 質量分析システム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080226

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080526

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080529

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080725

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080730

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080825

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090120

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090417

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090929

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20091225

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100105

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100127

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100201

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20100525

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100824

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100916

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130924

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees