WO2020225864A1

WO2020225864A1 - 分析装置

Info

Publication number: WO2020225864A1
Application number: PCT/JP2019/018338
Authority: WO
Inventors: 山田　洋平; 慎司金澤; 弘之安田; 研大國澤
Original assignee: 株式会社島津製作所
Priority date: 2019-05-08
Filing date: 2019-05-08
Publication date: 2020-11-12
Also published as: EP3968016A4; JPWO2020225864A1; US20220196615A1; CN113711031A; EP3968016A1; JP7108136B2; CN113711031B

Abstract

本発明の一態様である分析装置は、試料に対する所定の分析を行うことで得られたクロマトグラム又はスペクトルを用いて、該試料に含まれる成分の定性又は定量を行う分析装置であり、含有の有無を確認したい又は定量したい複数の目的成分の情報を利用して、目的試料に対する所定の分析により得られたクロマトグラム又はスペクトル上で目的成分に対応するピーク検出を行い、各ピークのピーク情報を取得するとともに、そのピーク検出の確からしさを示す指標値である確度情報を求めるピーク検出部（１２０）と、目的成分の少なくとも一部のリストを表示部（１３）に表示するものであって、ピーク検出部において該リストに含まれる目的成分に対応して検出されたピークの確度情報、又は該確度情報から求まる他の情報を、その目的成分に対応付けて記載したリストを表示する表示処理部（１４０）、を備える。

Description

分析装置

　本発明は、試料に対する分析によって得られるクロマトグラム波形又はスペクトル波形を解析することで、該試料についての定性分析や定量分析を行う分析装置に関する。本発明に係る分析装置は例えば、ガスクロマトグラフ質量分析装置を含むガスクロマトグラフ（ＧＣ）装置、液体クロマトグラフ質量分析装置を含む液体クロマトグラフ（ＬＣ）装置、質量分析装置、分光分析装置（赤外吸光分光光度計、可視紫外分光光度計、蛍光分光光度計など）、Ｘ線分析装置（蛍光Ｘ線分析装置、Ｘ線回折分析装置など）、を含むものとする。

　ガスクロマトグラフ装置や液体クロマトグラフ装置では、各種の成分が含まれる試料をカラムに導入し、該試料がカラムを通過する過程で各種の成分を時間方向に分離して、カラムの出口に設けた検出器により検出する。検出器により得られた検出信号に基づいて作成されるクロマトグラムには、試料中の成分に対応するピークが現れる。そのピークが観測される時間（保持時間）は成分の種類に対応しているため、このピークの保持時間から成分を特定する、つまりは定性分析を行うことができる。また、ピークの高さや面積はその成分の濃度又は含有量に対応しているため、ピークの高さ値や面積値からその成分の濃度や含有量を求める、つまりは定量分析を行うことができる。

　定性分析や定量分析を行うには、クロマトグラム波形上でピークを的確に検出し、ピークの始点、終点の位置（時間）を確定する必要がある。実際のクロマトグラム波形では様々なノイズが重畳していたり、ベースラインが変動していたり、或いは複数の成分由来のピークが重なっていたりする。そのため、クロマトグラム波形からピークを的確に検出するのは必ずしも容易ではない。そのため、クロマトグラム波形からピークを検出するために、従来、様々なアルゴリズムが提案され、実用に供されている（特許文献１、２など参照）。また、最近では、クロマトグラム波形上のピーク検出に、ディープラーニングなどのＡＩ（人工知能）を利用する試みも行われている。

特開２００９－８５８２号公報国際公開第２０１７／０９４１７０号パンフレット特開２０１５－５９７８２号公報

ウェイ・リウ（Wei Liu）、ほか６名、「ＳＳＤ：シングル・ショット・マルチボックス・デテクタ（SSD: Single Shot Multibox Detector）」、［online］、［２０１９年４月１８日検索］、arXiv.org、インターネット＜URL: https://arxiv.org/pdf/1512.02325.pdf＞

　上述したようにピーク検出には様々な手法があるものの、いずれのアルゴリズムを用いるにしても、様々な形状のクロマトグラムに対して常に的確なピーク検出が行えるとは限らない。そのため、一般に、自動的に検出されたピークの波形形状やその始点・終点をオペレータが表示画面上で確認し、必要に応じて、それをオペレータがマニュアル操作で修正するという作業が行われる（特許文献３等参照）。

　しかしながら、多成分一斉分析においては、百を超える数の化合物を同時に測定する場合もあり、その場合、クロマトグラム波形にはそれぞれ各化合物に対応する多数のピークが観測される。また、測定対象である試料の数が多く、得られるクロマトグラム波形の数が膨大になる場合もある。こうした場合、個々のクロマトグラム波形上の全てのピークをそれぞれオペレータが目視で確認しながら、的確なピーク検出が行われていないピークを見つけマニュアル操作で始点・終点を修正するという作業を行うと、膨大な時間を要してしまう。また、オペレータに対する作業負担も重く、不適切なピークを見逃す等の作業ミスを生じる大きな要因となる。

　なお、ガスクロマトグラフ装置や液体クロマトグラフ装置で得られるクロマトグラム上のピーク検出のみならず、質量分析装置で得られるマススペクトル上のピーク検出、分光分析装置で得られる吸光又は蛍光スペクトル上のピーク検出、Ｘ線分析装置で得られるＸ線強度スペクトル上のピーク検出などにおいても同様の問題が生じる。

　本発明はこうした課題を解決するために成されたものであり、その目的とするところは、オペレータによる、自動的なピーク検出処理によって検出されたピークの的確性の判断及びピークの修正作業の負担を軽減し、精度の高い定性分析や定量分析を効率的に行うことができる分析装置を提供することである。

　上記課題を解決するために成された本発明の一態様は、試料に対する所定の分析を行うことで得られたクロマトグラム又はスペクトルを用いて、該試料に含まれる目的成分の定性又は定量を行う分析装置であって、
　前記試料に対する所定の分析により得られたクロマトグラム又はスペクトル上で前記目的成分に対応するピーク検出を行い、各ピークのピーク情報を取得するとともに、そのピーク検出の確からしさを示す指標値である確度情報を求めるピーク検出部と、
　前記目的成分の少なくとも一部のリストを表示部に表示するものであって、前記ピーク検出部において該リストに含まれる目的成分に対応して検出されたピークの確度情報、又は該確度情報から求まる他の情報を、その目的成分に対応付けて記載したリストを表示する表示処理部と、
　を備えるものである。

　本発明において、所定の分析とは例えば、液体クロマトグラフィやガスクロマトグラフィなどのクロマトグラフ分析、質量分析、イオン移動度分析、吸光分光分析や蛍光分光分析などの分光分析、Ｘ線分析などである。また、試料に含まれる成分とは、化合物、分子、又は元素などである。

　所定の分析がクロマトグラフ分析であって該分析によりクロマトグラムが得られる場合、本発明の一態様である分析装置において、ピーク検出部は例えば、予め定められた複数の目的成分の保持時間の情報を用い、クロマトグラム上で各目的成分に対応するピーク検出を行う。ピーク検出部は、例えば検出されたピークの波形形状に基づいて始点及び終点を含むピーク情報を求めるが、併せて、それら情報の推定の正確性を示す確度情報を求める。表示処理部は、各ピークの確度情報を受けて、目的成分の全て又は一部と、その目的成分に対応するピークの確度情報又は該確度情報から求まる他の情報とを、対応付けて記載した成分リストを作成して表示部に表示する。

　ここで、ピークの確度情報から求まる他の情報とは、例えば、指標値そのものを所定の閾値で以て判定した結果である二値の情報、指標値又は指標値が含まれる値の範囲に対応付けられているグラフィカルな情報（アイコンなど）などを含むものとすることができる。

　ピークの確度情報を数値で表示する場合、その数値が大きいときに確度が高い、数値が低いときに確度が高い、のいずれでもよい。また、ピーク確度情報をグラフィカルに表示する場合、確度が高いことを示す情報の形態は問わない。いずれの場合でも、オペレータつまりは人間が見たときに、良否を判断できるような態様や形態で表示しさえすればよい。

　例えばピークの確度情報である指標値が大きいときに確度が高いと定めた場合、表示処理部により表示部に表示される成分リストにおいて、上記指標値が低いものは高いものに比べて、ピークの始点や終点などのピーク情報が適切でない可能性が高い。そこで、オペレータは、表示された成分リストにおいてピークの確度情報又は該確度情報から求まる他の情報を順番に確認し、例えば確度の指標値が他よりも顕著に低い成分のみを選択して、その成分に対応して検出されているピークの波形形状を確認することができる。

　このように本発明に係る分析装置の一態様によれば、自動的に検出されたピークの中でその情報の信頼性が低いものを、オペレータが効率良く確認し、必要に応じてピーク情報を修正することができる。それにより、多成分一斉分析の際の定性分析や定量分析におけるオペレータの作業負担を軽減し、効率的な分析を実現することができる。また、例えば多数のピークが観測されるクロマトグラムやスペクトルを解析する際に、オペレータが確認すべきピークの数が減ることで確認作業のミスや見落としなどを防止することができる。

本発明の一実施形態であるＬＣシステム及び該システムに用いられる学習済みモデルを作成するシステムの概略構成図。本実施形態のＬＣシステムにおいて使用される学習済みモデルを作成する際の処理の流れを示すフローチャート。本実施形態のＬＣシステムにおけるピーク検出処理の流れを示すフローチャート。本実施形態のＬＣシステムにおいて用いられる、ニューラルネットワークによる学習済みモデルを示す模式図本実施形態のＬＣシステムにおいて用いられる学習済みモデルを作成する際の処理を説明するための模式図。本実施形態のＬＣシステムにおいて学習済みモデルを用いたピーク検出処理を説明するための模式図。本実施形態のＬＣシステムにおけるピーク自動検出処理によって求まるピークの始点・終点の候補の表示の一例を示す図。本実施形態のＬＣシステムにおけるピーク自動検出処理によって求まるピークの始点・終点の候補の一例を示す図。本実施形態のＬＣシステムにおいて表示される、ピーク検出確度の情報を含む化合物リストの一例を示す図。図９に示した化合物リストをピーク検出確度の小さい順にソートしたときの一例を示す図。本実施形態のＬＣシステムにおいて表示される、ピーク検出確度の情報を含む化合物リストの他の例を示す図。本実施形態のＬＣシステムにおいて表示される、ピーク検出確度の情報を含む化合物リストの他の例を示す図。本実施形態のＬＣシステムにおいて表示される、ピーク検出確度の情報を含む化合物リストの他の例を示す図。

　以下、本発明に係る分析装置の一実施形態であるＬＣシステムについて、添付の図面を参照して詳細に説明する。
　図１は、本実施形態のＬＣシステム及び該システムに用いられる学習済みモデルを作成するシステムの概略構成図である。

　このＬＣシステム１は、ＬＣ測定部１０、データ解析部１１、操作部１２、及び表示部１３を備える。ＬＣ測定部１０は図示しないが、送液ポンプ、インジェクタ、カラム、カラムオーブン、検出器などを含み、与えられた試料についてのＬＣ分析を実行し、検出器で得られる信号強度の時間的な変化を示すクロマトグラムデータを取得する。検出器の種類や方式は特に問わないが、例えば質量分析装置、フォトダイオードアレイ（ＰＤＡ）検出器などを用いることができる。

　データ解析部１１は、データ収集部１１０、ピーク検出処理部１２０、定性・定量解析部１３０、結果表示処理部１４０、ピーク検出結果修正処理部１５０などの機能ブロックを含む。ピーク検出処理部１２０はさらに、画像生成部１２１、ピーク位置推定部１２２、学習済みモデル記憶部１２３、ピーク決定部１２４などの機能ブロックを含む。

　データ解析部１１において、データ収集部１１０はＬＣ測定部１０で得られたクロマトグラムデータを収集しこれを記憶する。ピーク検出処理部１２０は、収集されたクロマトグラムデータに基づくクロマトグラム波形においてピークを自動的に検出し、検出したピークの始点及び終点の位置（保持時間）、及びピーク検出の確からしさの指標値である検出確度を含むピーク情報を出力する。定性・定量解析部１３０は、ピーク検出処理部１２０から与えられたピーク情報に基づいて、各ピークに対応する成分（化合物）を同定したり、ピーク高さ値やピーク面積値を計算し、その値から各成分の濃度又は含有量である定量値を算出したりする。結果表示処理部１４０は、算出された定量値や各ピークの検出確度の情報を受けて、それらを所定の形式で表示部１３に表示する。ピーク検出結果修正処理部１５０は、操作部１２を介したオペレータの操作に応じて、ピーク検出処理部１２０で検出されたピークの情報を修正する。

　図１において、ＬＣシステム１とは別に設けられているモデル作成部２は、学習データ入力部２０、画像生成部２１、学習実行部２２、及びモデル構築部２３を機能ブロックとして含む。このモデル作成部２において作成される学習済みモデルが、ＬＣシステム１のデータ解析部１１における学習済みモデル記憶部１２３に格納される。

　なお、通常、データ解析部１１の実体は、所定のソフトウェアがインストールされたパーソナルコンピュータやより性能の高いワークステーション、或いは、そうしたコンピュータと通信回線を介して接続された高性能なコンピュータを含むコンピュータシステムである。即ち、データ解析部１１に含まれる各ブロックの機能は、コンピュータ単体又は複数のコンピュータを含むコンピュータシステムに搭載されているソフトウェアを実行することで実施される、該コンピュータ又はコンピュータシステムに記憶されている各種データを用いた処理によって具現化されるものとすることができる。

　次に、ピーク検出処理部１２０において実施されるピーク検出処理について詳細に説明する。
　ごく概略的にいうと、このピーク検出処理部１２０では、クロマトグラム波形（クロマトグラムカーブ）を２次元画像に変換したうえで、その画像上に存在する物体のカテゴリーと位置とを検出する機械学習の一手法であるディープラーニング（Deep Learning）の手法を用いることによって、ピークの始点及び終点の位置を検出している。

　［学習済みモデルの作成］
　よく知られているように、機械学習法では、多数の学習データを用いて学習済みモデルを予め構築しておく必要がある。上述したように、この学習済みモデルの構築の作業は、ＬＣシステム１の一部であるデータ解析部１１において行われるのではなく、別のコンピュータシステムにより構成されるモデル作成部２で実施され、その結果が学習済みモデル記憶部１２３に格納される。それは、一般に学習済みモデルの構築作業は多量のデータを処理するために計算量が膨大であり、かなり高性能で且つ画像処理に対応したコンピュータが必要であるためである。図２は、モデル作成部２において行われる学習済みモデル作成時の処理の流れを示すフローチャートである。

　学習済みモデルを作成する際には、多数の多様なクロマトグラム波形データを用意すると共に、その各クロマトグラム波形に現れている一又は複数のピークの始点及び終点の保持時間を正確に求めておく。ここでいう多様なクロマトグラム波形データとは、実際にピーク検出を実施する際のクロマトグラム波形に現れる可能性がある、様々なノイズの混入、ベースラインの変動（ドリフト）、複数のピークの重なり、或いは、ピーク形状の変形、などの要素を含むクロマトグラム波形である。学習データ入力部２０は、この多数のクロマトグラム波形データとピーク始点・終点を含む正確なピーク情報とのセットを学習データとして読み込む（ステップＳ１）。

　画像生成部２１は、時系列信号であるクロマトグラム波形データに基づいてクロマトグラムを作成し、時間経過に伴う信号強度の変化を示すクロマトグラム波形（クロマトグラムカーブ）を所定の画素数の２次元画像に変換する（ステップＳ２）。ここでは一例として、画素数は５１２×５１２であるものとする。この画像変換の際に、クロマトグラム波形上のピークの中で信号強度が最大であるピークのピークトップが矩形状の画像の上辺に一致するように、その波形のｙ方向のサイズを規格化する。また、クロマトグラム波形の全測定時間範囲又は一部の測定時間範囲（例えばユーザにより指示された測定時間範囲）が矩形状の画像のｘ方向（横方向）の長さに一致するように、その波形のｘ方向のサイズを規格化する（ステップＳ３）。なお、ｘ方向のサイズを規格化する際に、データ点数が５１２画素に満たない場合には適宜アップサンプリングし、元データに沿う高解像度波形に変換してもよい。

　画像生成部２１は、ステップＳ１で読み込まれた全てのクロマトグラム波形データについて同様に画像に変換する。クロマトグラム波形の規格化を伴う画像化の処理によって元のクロマトグラム波形の強度情報や時間情報は失われ、波形形状を表す画像が生成されることになる。なお、ステップＳ１において全てのデータを読み込んでからステップＳ２～Ｓ３の処理を実行するのではなく、ステップＳ１におけるデータの読み込みを行いながら、すでに読み込まれたデータについてステップＳ２～Ｓ３による画像化を行ってもよいことは当然である。

　また画像生成部２１は、クロマトグラム波形データとセットになっているピーク情報を、上述した画像化に際してのｘ方向、ｙ方向の規格化、つまりはクロマトグラム波形の伸縮に応じて、画像上の位置情報つまりはｘ方向及びｙ方向の画素位置の情報に変換する（ステップＳ４）。

　次に、学習実行部２２は、上記のようにして学習データであるクロマトグラム波形から生成された多数の画像を用いた機械学習を実施し、モデル構築部２３はその学習結果に基づき、クロマトグラム波形上のピークの始点及び終点を推定するための学習モデルを構築する。周知のように機械学習には様々なアルゴリズムがあるが、ここでは画像認識における一般物体検知アルゴリズムの一つであるディープラーニングを用い、その中でも特に画像認識に優れているＳＳＤ法を用いる（ステップＳ５）。

　ＳＳＤ法は、ディープラーニングの中では最も広く利用されている畳み込みニューラルネットワーク（ＣＮＮ）を用いた手法の一つであり、現時点では最も高速で且つ高い認識精度を実現可能なアルゴリズムである。ＳＳＤ法は、リウ（Liu Wei）らにより非特許文献１で提案されたものであり、そのアルゴリズムの詳細については非特許文献１等に詳細に説明されているので、ここでは本実施形態における特徴点についてのみ述べる。

　一般的なＳＳＤ法では、２次元的な画像内で物体が存在している部分を推測するためにＣＮＮにより抽出した画像特徴マップ（feature map）を使用するが、その画像特徴マップを少しずつ畳み込んでいくことにより様々なサイズ（画素数）の画像特徴マップを利用している。これによって様々な大きさの物体領域候補を検出することができる。これに対し、ここで検出したいのはピークの始点及び終点のｘ方向の位置である。そこで、ｘ方向の様々な大きさの区間内に存在するピークの始点及び終点を検出するようにアルゴリズムを変更している。

　図４は、本実施例で用いられるニューラルネットワークによる学習済みモデルを示す模式図である。また図５は学習済みモデルを作成する際の処理を説明するための模式図である。図５に示しているように、ここでは、上記ステップＳ２～Ｓ３の処理で生成された画像のｘ方向の長さ全体の幅のウインドウを持つセグメントSg1を設定し、次に、セグメントSg1のウインドウを半分に分割したウインドウ幅が１／２であるセグメントSg2、Sg3を設定する。同様にして、セグメントSg2、Sg3のウインドウをそれぞれ半分に分割したウインドウ幅が元の１／４である４個のセグメントSg4、Sg5、Sg6、Sg7を設定する、という操作を繰り返し、全部で１２０個のセグメントSg1～Sg120を定める。この各セグメントがＣＮＮにより画像特徴マップを抽出する単位であり、学習データとしての画像に基づいてこの単位毎にピークの始点及び終点で決まるピーク範囲を学習する。

　この学習モデルにおけるニューラルネットワークでは、図４に示すように、入力層に設けられた２６２１４４個のノードのそれぞれに５１２×５１２画素の画像における各画素の画素値が入力される。図４においてpxnは１枚の画像におけるｎ番目の画素を示す。なお、画像がカラー又は複数色である場合には、画素毎に例えば三原色の各色の画素値が入力されるため、入力層のノード数は例えば３倍になる。

　学習実行部２２では、多数の画像に基づく上記のような入力に対しディープラーニングによって多数の中間層から成る層構造のネットワークが学習され、最終的な出力層に設けられた６００個のノードからそれぞれ数値情報が出力される。この６００個のノードから出力される情報は、１２０個のセグメントSg1～Sg120のそれぞれについて算出される、ピーク検出の確度（confidence）confn、そのセグメントのウインドウの左端からピーク始点までのｘ方向のオフセット量xsn、入力画像の下端からピーク始点までのｙ方向のオフセット量ysn、そのセグメントのウインドウの右端からピーク終点までのｘ方向のオフセット量xen、入力画像の下端からピーク終点までのｙ方向のオフセット量yen、という５次元の情報である。図５中では１番目のセグメントSg1に対する上記５次元の情報を｛conf1, xs1, ys1, xe1, ye1｝として示している。ここでは、ピーク検出の確度はピーク範囲とウインドウとの重なりの長さで定義し、その値の範囲は０～１である。

　図５の例ではクロマトグラム波形に二つのピークが存在する。前半のピークの始点の画素位置は（xs_a, ys_a）、終点の画素位置は（xe_a, ye_a）であり、そのピーク範囲はＡである。一方、後半のピークの始点の画素位置は（xs_b, ys_b）、終点の画素位置は（xe_b, ye_b）であり、ピーク範囲はＢである。この場合、セグメントSg1におけるxs1、ys1、xe1、及びye1は図６中に示すようになる。また、confはSg1のウインドウの幅とピーク範囲Ａとの重なりに応じた計算値である。上述したように学習データにおけるピークの始点・終点の画素位置やピーク範囲は既知であるから、多数の学習データについて正解にできるだけ一致するように学習を行って各中間層におけるネットワーク重みを算出しつつモデルを構築する。

　モデル構築部２３はこうして多数の学習データを用いてディープラーニングを行うことで求めた学習モデルを一旦保存する（ステップＳ６）。ＬＣシステム１において学習済みモデル記憶部１２３には、モデル作成部２において上述したように作成された学習モデルが例えば通信回線を介して伝送され格納される。

　［目的試料に対するピーク検出処理］
　次に、ＬＣシステム１のデータ解析部１１で実行される、目的試料に対して得られたクロマトグラム波形上のピークの検出処理を説明する。図３はピーク検出処理部１２０において行われるピーク検出処理の流れを示すフローチャートである。
　まず、画像生成部１２１は処理対象であるクロマトグラム波形データをデータ収集部１１０から読み込む（ステップＳ１１）。そして、読み込んだデータに対し、モデル作成部２の画像生成部２１で実行されたステップＳ２～Ｓ３によるクロマトグラム波形データの画像化と同様のステップＳ１２～Ｓ１３の処理を実行することにより、クロマトグラムカーブを含む５１２×５１２画素の画像を生成する。

　目的試料中に含まれるかどうかを確認したい成分や、含まれている場合にはその量を知りたい成分が予め決められている場合、それら目的成分の標準的な保持時間は予め分かっている。そこで、各目的成分の標準的な保持時間の付近の所定の時間範囲でクロマトグラム波形を切り出し、その切り出されたクロマトグラム波形からクロマトグラムカーブを含む画像を生成すればよい。これにより、クロマトグラム上で、目的成分に対応するピークを検出することができる。一方、標準的な保持時間が不明である、未知成分を検出したい或いは、既知の目的成分と未知成分と併せて検出したい場合には、時間範囲を限定せず、全測定時間範囲のクロマトグラム波形に対してピーク検出を実行すればよい。

　なお、ＬＣ測定部１０の検出器が質量分析装置である場合、通常、検出対象の質量電荷比が予め分かっている既知成分については選択イオンモニタリング（ＳＩＭ）測定又は多重反応モニタリング（ＭＲＭ）測定で検出し、未知成分についてはスキャン測定で検出される。

　ピーク位置推定部１２２は、生成された画像の各画素の画素値に、学習済みモデル記憶部１２３に格納されている学習済みモデルを適用して１２０個のセグメント毎の上記５次元の情報を取得する。即ち、画像内でピークの始点及び終点と推測される画素位置の情報をピーク検出確度と共に取得する（ステップＳ１４）。

　図６はピーク検出結果の一例を示す図である。ここでは、セグメント毎に｛confn, xsn, ysn, xen, yen｝（ただしnは1～120）が求まるため、多くの場合、一つのピークに対し複数のセグメントで、ピーク検出の確度が０でない｛confn, xsn, ysn, xen, yen｝が得られる。なお、一般にピーク検出の確度confnが低いものは信頼性に乏しい。そこで、この例では算出されたconfnが所定値（ここでは０．５）以下である場合に、その５次元のピーク情報は有用でないとみなして｛０, ０, ０, ０, ０｝としているが、そうした確度による取捨選択を行わずに全ての結果を利用するようにしてもよい。

　上述したように一般的に、一つのピークに対し始点・終点の位置がピーク検出確度と共に複数得られる。つまり、一つの成分に対しピークの候補が複数存在する。そこで、ピーク決定部１２４は、成分毎に、その成分に対応する複数のピーク始点・終点の中でピーク検出確度が最も高いものが正解であると推定し、そのピークの始点・終点の情報を選択してピーク検出結果として出力する（ステップＳ１５）。

　また、単にピーク検出確度の大きさに基づいて、正解であると推定されるピーク情報を選択するのではなく、ピーク決定部１２４は次のような処理を実施してもよい。
　いま、一つのピークに対してピーク始点・終点の候補が複数ある場合、始点、終点毎に、時間軸上でのピーク検出確度の変化を確度分布として捉えグラフ化する。このグラフは線グラフでもよいしヒートマップ等でもよい。例えば複数の点に対して適宜のフィッティングを行って確度分布曲線を求めると、その点の中でピーク検出確度が最大である点で確度分布曲線が極大値をとるとは限らず、そのピーク検出確度が最大である点の近傍で確度分布曲線が極大値をとることがある。その場合、その極大値をとる位置（時間）のほうがピーク始点又は終点として妥当であると考えられる。そこで、確度分布曲線が極大値をとる位置をピーク始点又は終点とすればよい。またそのときの極大値をピーク検出確度とすればよい。

　定性・定量解析部１３０は上記ピーク検出結果を受け、各成分に対応するピーク毎に、ピーク始点及び終点の間の時間範囲内で信号強度が最大である（つまりはピークトップに対応する）時間又はピーク重心に対応する時間を求め、これを当該ピークの代表的な保持時間（検出ＲＴ）とする。また、そのピーク毎にピーク面積値（又は高さ値）を計算する。さらに、算出されたピーク面積値を予め取得しておいた検量線に照らして、目的成分の濃度や含有量である定量値を算出する（ステップＳ１６）。各成分に対応するピーク毎に求めた上記検出ＲＴを、後述する図９～図１３に示した化合物リスト中に表示するようにしてもよい。

　［化合物リストの表示］
　結果表示処理部１４０は、成分毎のピーク検出結果、及び成分毎の定量値算出結果に基づいて、化合物リストを作成して表示部１３の画面上に表示する（ステップＳ１７）。
　図９はこのときに表示される化合物リストの一例である。図９において、「化合物名」は各化合物の名称であり、「Ｒ．Ｔ．」は標準的な保持時間又は実測の保持時間である。

　目的試料中に既知の成分が含まれるかどうかを確認したい場合や、既知の成分の含有量を知りたい場合には、化合物リストはそうした既知の成分のリストである。この場合、目的試料に対する実測で得られたクロマトグラム上のピーク検出は、この化合物リストに掲載されている化合物に対して実行される。一方、未知成分についての定性や定量も行う場合（又は全ての成分が未知である場合）には、上述したように全測定時間範囲についてピーク検出が実施され、検出されたピークについて成分が同定されれば化合物名が付与され、成分が同定されなければ「Unknown」の成分として、化合物リストが作成される。成分が「Unknown」である場合、化合物リスト中の「化合物名」の欄には「Unknown」と表示するほか、空欄としたり「＊」等を表示したりしてもよい。また、「Ｒ．Ｔ．」の欄は空欄としたり「＊」等を表示したりしてもよいし、定性・定量解析部１３０で求まった検出ＲＴを表示してもよい。

　図９に示した化合物リスト中の「定量値」の列は、定性・定量解析部１３０により算出された定量値である。ピーク波形は同じであってもピーク検出処理部１２０で求められた始点・終点の位置が変わるとピーク面積値が変わるから、当然、定量値も変わることになる。そのため、ピークの始点・終点の位置が適切でないと定量値も不正確である。正確な定量値を得るには、ピーク検出処理部１２０で得られたピークの始点・終点を適切に修正する必要がある。従来のＬＣシステムでは、どの化合物に対応するピークの始点・終点が不適切であるのかをオペレータが把握するために、そのオペレータはクロマトグラム上のピーク波形を一つずつ表示画面上で確認する必要があった。そのため、化合物の数が多いとその作業は非常に煩雑で時間を要していた。

　これに対し、本実施形態のＬＣシステムでは、ピーク検出処理の過程で算出されたピーク検出の確度confnの値を、化合物リスト中の各化合物に対応して「ピーク検出確度」の列に掲載している。図９の例では、名称が「Comp C」である化合物のピーク検出確度は０．９０と高いが、名称が「Comp B」である化合物のピーク検出確度は０．６４と相対的に低くなっている。ここでは、このピーク検出確度の数値が低いほど、定量値の信頼性は低いと推測できる。そこで、オペレータは表示された化合物リストを確認し、ピーク検出確度の数値が他よりも顕著に低い成分に対応する定量値の信頼性が低いと判断する。

　図９では、化合物リスト中の化合物の並びが保持時間の順序になっているが、ピーク検出確度の列のヘッダの操作子をクリック操作することで、化合物をピーク検出確度の降順又は昇順にソートすることができる。図１０は、ピーク検出確度の小さい順にソートした結果を示す図である。このようにソートすることで、信頼性が低い化合物を容易に抽出することができる。

　上述したようにオペレータは化合物リスト中のピーク検出確度の数値から、定量値の信頼性が低い化合物を選択し、その化合物について検出されているピーク波形を確認したり必要に応じてそのピーク情報を修正したりする。具体的には、化合物リストにおいて確認したい化合物名又は定量値の欄等を操作部１２によりクリック操作すると、ピーク検出結果修正処理部１５０は、該化合物について検出されているクロマトグラム上のピーク波形を別のウインドウに表示する。図８は一つの化合物に対するピーク波形の表示の一例である。

　この例では、一つの化合物に対応するピークについて、ピーク位置推定部１２２で推定されたピークの始点の位置を丸印、終点の位置を三角印で示すとともに、ピーク決定部１２４で選択された（ピーク検出確度が最大である）始点・終点を黒色の塗りつぶしで、それ以外を白抜きで示している。また、吹き出し表示中の括弧（）内の先頭の数値がピーク検出確度（０～１の範囲）であり、それに続く数値はピーク始点の時間及び強度の情報である。ここでは、比較の際に最も重要であるピーク検出確度の数値を、他の数値よりも目立つように太字で示している。

　オペレータは表示部１３の画面上で、こうしたピーク波形と検出されたピークの始点・終点の位置とを目視で確認する。そして、オペレータは、操作部１２によりピークの始点・終点を適宜変更する操作を行い、再解析を指示する。ピーク検出結果修正処理部１５０はこの指示を受けて、変更後の始点・終点の位置に基づきピーク面積値を再計算し、さらに定量値を算出する。

　このようにして、本実施形態のＬＣシステムでは、オペレータはクロマトグラム上のピーク波形を一つずつ表示画面上で確認することなく、定量値の信頼性が乏しいと推測できる化合物に対応するピーク波形のみを確認し、必要に応じてピーク始点・終点を修正することができる。

　なお、化合物リストには、各化合物に対応するさらに別の情報を加えてもよい。例えば、ＬＣ測定部１０の検出器が質量分析装置である場合には対応するm/zを加えてもよいし、検出器がＰＤＡ検出器である場合には対応する波長を加えてもよい。また、保持時間は標準的な保持時間と実測の保持時間との両方を表示してもよい。

　［化合物リストの表示の変形例］
　上記ステップＳ１７で表示部１３に表示される化合物リストは、以下に述べるように様々な形態に変更することができる。

　例えば図９に示したような化合物リストにおいて、ピーク検出確度が高いものと低いものとの視覚的な識別性を向上させるために、ピーク検出確度の数値に応じて、又はその数値範囲に応じて、文字のフォント、文字の色、文字の明度、文字の大きさ、文字の太さなどを変えるようにしてもよい。また、ピーク検出確度の数値が予め決めた閾値を下回るものに対し、吹き出し表示でピークの修正を促すテキスト（例えば「要修正」、「要確認」）情報を表示するようにしてもよいし、逆に、ピーク検出確度の数値が予め決めた閾値以上であるものに対し、吹き出し表示でピークが適切であることを示すテキスト（例えば「適正」、「確認不要」）情報を表示するようにしてもよい。

　また、このときに表示する化合物リストには、存在の有無の確認対象である又は定量の対象である目的化合物全てを掲載するのではなく、ピークの修正や確認が必要である、ピーク検出確度の数値が所定の閾値を下回る化合物のみに絞って掲載するようにしてもよい。図１２は、こうした絞り込み機能を持たせた化合物リストの表示例である。

　この場合、絞り込み条件として閾値が指定されないときには、図９と同様に、全ての目的化合物を掲載しておく。そして、オペレータが閾値の数値を入力すると、ピーク検出確度がその閾値以上である化合物をリストから除外し、残りの、つまりはピーク検出確度が閾値を下回る化合物のみが掲載された化合物リストを表示する。これにより、オペレータはこのリストにある化合物についてのみ、対応するピーク波形を確認すればよい。

　また、図９及び図１２の例では、オペレータはピーク検出確度が低いことを把握できるものの、ピーク検出確度が低い理由については分からない。そこで、ピーク検出確度が他よりも低くなっている要因として推定される事項を、吹き出し表示等で表示するようにしてもよい。具体的には、一つの化合物に対応付けられているピークの始点や終点の位置のばらつきが大きい、隣接するピークと重なっている可能性がある、ベースラインの傾きが大きい、等の要因候補を表示すればよい。これらの要因は、上述したピーク検出の過程で推定することが可能なものである。

　また、上記実施形態のＬＣシステムでは、一つのクロマトグラム波形上でピークを検出しているので、一つの成分に対してピーク波形は一つであることを前提としていたが、ＬＣ測定部１０の検出器がＰＤＡ検出器である場合や質量分析装置（特にトリプル四重極型質量分析装置や四重極－飛行時間型質量分析装置などのタンデム型質量分析装置）である場合には、一つの化合物に対して、互いに異なる波長における、又は互いに異なる質量電荷比（ＭＲＭトランジション）における複数のクロマトグラムが得られるのが一般的である。そのため、一つの化合物に対する複数のクロマトグラムそれぞれについて、ピーク始点・終点を含むピーク情報とピーク検出確度とが得られる。

　例えば、ＬＣ測定部１０の検出器がタンデム型質量分析装置である場合、定量イオンと一又は複数の確認イオンとについてそれぞれ抽出イオンクロマトグラム（慣用的にマスクロマトグラムという）が得られるから、一つの化合物に対して少なくとも二以上のピーク情報が得られる。そこで、その場合には、図１１に示すように、異なるクロマトグラムに対して得られた複数のピーク検出確度を全て表示するようにしてもよい。もちろん、図１１に示したように、始めから複数のピーク検出確度を表示するのではなく、定量値の算出に使用されたピークに関するピーク検出確度のみを表示しておき、例えばその表示欄をクリック操作したりマウスオーバーしたりすることで、それ以外のピークに関するピーク検出確度が表示されるようにしてもよい。

　また、一つの化合物に対して二以上のピーク情報が得られる場合に、化合物リスト中のピーク検出確度の数値として、その複数のピークに関するピーク検出確度から求めた代表値、例えば、最大値、最小値、平均値、中央値等の統計値を用いてもよい。また、例えばオペレータが化合物リスト中のピーク検出確度の欄やその横に付加されているアイコンなどをクリック操作する毎に、表示する数値を順番に変更するようにしてもよい。

　また、ピーク検出確度の数値を表示する代わりに、数値や数値範囲に対応した適宜のアイコンなどを表示してもよい。また、より簡略化して、ピーク検出確度が閾値以上であるものを「○」又は「１」、閾値を下回るものを「×」又は「０」とした、いわゆる二値で表示するようにしてもよい。

　さらにまた、図１３に示すように、ピーク検出確度の数値とともに、そのピーク検出確度に対応する概略のピーク波形を、吹き出し表示やポップアップ画面などで表示するようにしてもよい。これによって、オペレータは、より簡便に概略のピーク波形を確認することができる。

　［そのほかの変形例］
　また、上記実施形態のＬＣシステムでは、化合物リストの表示の態様のほかに、様々な変形が可能である。
　具体的には、上記実施形態では、ピーク検出の手法としてディープラーニングを用いていたが、それ以外の機械学習の手法を用いてもよいし、機械学習以外の方法でもよい。例えば、機械学習以外の方法としては、検出したピークの左右対称性を評価したシンメトリ係数をピーク確度の情報として付与することが考えられる。重要であるのは、ピーク検出の過程で、そのピーク検出の信頼性を示す情報が得られることである。

　また、上記実施形態は、試料に対するクロマトグラフィ分析により得られたクロマトグラム上でピーク検出を行う例であるが、本発明は、ガスクロマトグラフ装置や液体クロマトグラフ装置以外の様々な分析装置に適用することができる。

　例えば、質量分析装置で得られるマススペクトル、吸光分光光度計や蛍光分光光度計などの各種の分光分析装置で得られる光学的なスペクトル、イオン移動度分析装置で得られるイオン移動度スペクトル、さらにはＸ線分析装置で得られるＸ線スペクトルなどの、各種のスペクトル波形上でピーク検出を行い、検出されたピークに基づいて化合物、分子、元素を同定したり定量したりする場合にも、本発明を適用できることは明らかである。

　さらにまた、上記実施形態や各種の変形例に限らず、本発明の趣旨の範囲で適宜変形、修正、追加を行っても本願特許請求の範囲に包含されることは明らかである。

　［種々の態様］
　以上、図面を参照して本発明における実施形態を説明したが、最後に、本発明の種々の態様について説明する。

　本発明の第１の態様は、試料に対する所定の分析を行うことで得られたクロマトグラム又はスペクトルを用いて、該試料に含まれる目的成分の定性又は定量を行う分析装置であって、
　前記試料に対する所定の分析により得られたクロマトグラム又はスペクトル上で前記目的成分に対応するピーク検出を行い、各ピークのピーク情報を取得するとともに、そのピーク検出の確からしさを示す指標値である確度情報を求めるピーク検出部と、
　前記目的成分の少なくとも一部のリストを表示部に表示するものであって、前記ピーク検出部において該リストに含まれる目的成分に対応して検出されたピークの確度情報、又は該確度情報から求まる他の情報を、その目的成分に対応付けて記載したリストを表示する表示処理部と、
　を備えるものである。

　本発明の第１の態様によれば、ピーク検出部において自動的に検出されたピークの中で、その情報の信頼性が低いものを、オペレータが効率良く確認し、必要に応じてピーク情報を修正することができる。それにより、多成分一斉分析の際の定性分析や定量分析におけるオペレータの作業負担を軽減し、効率的な分析を実現することができる。また、例えば多数のピークが観測されるクロマトグラムやスペクトルを解析する際に、オペレータが確認すべきピークの数が減ることで確認作業のミスや見落としなどを防止することができる。

　本発明の第２の態様は、第１の態様において、前記ピーク検出部は、前記目的成分の事前情報を利用してピーク検出を行うものとすることができる。所定の分析がクロマトグラフ分析である場合、目的成分の事前情報は標準保持時間を含むものとすることができる。

　本発明の第２の態様によれば、ピーク検出を行う範囲（例えば時間範囲）を限定することができるので、ピーク検出の精度が向上する。

　本発明の第３の態様は、第１又は第２の態様において、前記ピーク検出部で得られたピーク情報に基づいて該ピークに対応する目的成分の定量値を求める定量分析部、をさらに備え、前記表示処理部は、前記定量分析部で得られた定量値を前記リスト中に記載するものとすることができる。

　本発明の第３の態様によれば、オペレータは、成分毎の定量値とピーク検出確度の情報とを併せて確認することができる。

　本発明の第４の態様は、第１～第３の態様のいずれか一つにおいて、前記表示処理部は、前記ピークの確度情報を所定の閾値と比較し、該閾値に対する大小の識別が視覚的に可能な態様で該確度情報を表示するものとすることができる。

　本発明の第４の態様によれば、オペレータは、ピーク情報の信頼性が低いものと高いものとを一目で判断し、例えば、信頼性が低いピークの波形のみを容易に選択して確認することができる。

　本発明の第５の態様は、第４の態様において、前記識別が視覚的に可能な態様とは、前記閾値に対して確度が低いものを絞り込んだリストを表示することであるものとすることができる。

　本発明の第５の態様によれば、再確認すべきデータを効率よく抽出することができるので、オペレータの作業効率が一層向上する。

　本発明の第６の態様は、第１～第５の態様のいずれか一つにおいて、前記表示処理部は、前記リストにおいて確度に関するソートが可能であるものとすることができる。

　本発明の第６の態様によれば、第５の態様と同様に、再確認すべきデータを効率よく抽出することができるので、オペレータの作業効率が一層向上する。

　本発明の第７の態様は、第１～第６の態様のいずれか一つにおいて、前記所定の分析では一つの目的成分に対し複数のクロマトグラムが得られ、前記ピーク検出部は一つの目的成分に対する複数のクロマトグラムそれぞれについてピークを検出し、前記表示処理部は、一つの目的成分に対する複数のクロマトグラムそれぞれについて検出されたピークについての複数のピーク確度情報を表示するものとすることができる。

　また本発明の第８の態様は、第１～第７の態様のいずれか一つにおいて、前記所定の分析では一つの目的成分に対し複数のクロマトグラムが得られ、前記ピーク検出部は一つの目的成分に対する複数のクロマトグラムそれぞれについてピークを検出し、前記表示処理部は、一つの目的成分に対する複数のクロマトグラムそれぞれについて検出されたピークについての複数のピーク確度情報から求まる代表値を表示するものとすることができる。

　第７及び第８の態様において、所定の分析は、典型的には、多波長同時検出が可能であるフォトダイオードアレイ検出器などを検出器として用いたクロマトグラフィ分析、又は、タンデム型質量分析装置を検出器として用いたクロマトグラフィ分析である。こうした分析装置では、一つの成分（化合物）に対して複数のクロマトグラムが得られるから、その中で最も高いピーク検出確度を示す、つまりは信頼性が高いピークを用いて、該成分の定量を行うことができる。

　また本発明の第９の態様は、第１～第８の態様のいずれか一つにおいて、前記ピーク検出部は、ピークの始点及び終点が既知である複数のクロマトグラム又はスペクトルを用いた機械学習によって予め構築された学習済みモデルを使用して、前記試料についてのクロマトグラム又はスペクトルに現れる一又は複数のピークの始点の位置又は終点の位置の少なくとも一方を含むピーク情報を推定するものであり、前記確度情報は、該ピーク情報の推定の確からしさを示す指標値であるものとすることができる。

　本発明の第９の態様によれば、学習済みモデルを使用して推定されたピークの始点と終点の信頼性を効率よく確認することができる。

１…ＬＣシステム
１０…ＬＣ測定部
１１…データ解析部
１１０…データ収集部
１２０…ピーク検出処理部
１２１…画像生成部
１２２…ピーク位置推定部
１２３…学習済みモデル記憶部
１２４…ピーク決定部
１３０…定性・定量解析部
１４０…結果表示処理部
１５０…ピーク検出結果修正処理部
１２…操作部
１３…表示部
２…モデル作成部
２０…学習データ入力部
２１…画像生成部
２２…学習実行部
２３…モデル構築部

Claims

　試料に対する所定の分析を行うことで得られたクロマトグラム又はスペクトルを用いて、該試料に含まれる目的成分の定性又は定量を行う分析装置であって、
　前記試料に対する所定の分析により得られたクロマトグラム又はスペクトル上で前記目的成分に対応するピーク検出を行い、各ピークのピーク情報を取得するとともに、そのピーク検出の確からしさを示す指標値である確度情報を求めるピーク検出部と、
　前記目的成分の少なくとも一部のリストを表示部に表示するものであって、前記ピーク検出部において該リストに含まれる目的成分に対応して検出されたピークの確度情報、又は該確度情報から求まる他の情報を、その目的成分に対応付けて記載したリストを表示する表示処理部と、
　を備える、分析装置。
　前記ピーク検出部は、前記目的成分の事前情報を利用してピーク検出を行う、請求項１に記載の分析装置。
　前記ピーク検出部で得られたピーク情報に基づいて該ピークに対応する目的成分の定量値を求める定量分析部、をさらに備え、前記表示処理部は、前記定量分析部で得られた定量値を前記リスト中に記載する、請求項１に記載の分析装置。
　前記表示処理部は、前記ピークの確度情報を所定の閾値と比較し、該閾値に対する大小の識別が視覚的に可能な態様で該確度情報を表示する、請求項１に記載の分析装置。
　前記識別が視覚的に可能な態様とは、前記閾値に対して確度が低いものを絞り込んだリストを表示することである、請求項４に記載の分析装置。
　前記表示処理部は、前記リストにおいて確度に関するソートが可能である、請求項１に記載の分析装置。
　前記所定の分析では一つの目的成分に対し複数のクロマトグラムが得られ、前記ピーク検出部は一つの目的成分に対する複数のクロマトグラムそれぞれについてピークを検出し、前記表示処理部は、一つの目的成分に対する複数のクロマトグラムそれぞれについて検出されたピークについての複数のピーク確度情報を表示する、請求項１に記載の分析装置。
　前記所定の分析では一つの目的成分に対し複数のクロマトグラムが得られ、前記ピーク検出部は一つの目的成分に対する複数のクロマトグラムそれぞれについてピークを検出し、前記表示処理部は、一つの目的成分に対する複数のクロマトグラムそれぞれについて検出されたピークについての複数のピーク確度情報から求まる代表値を表示する、請求項１に記載の分析装置。
　前記ピーク検出部は、ピークの始点及び終点が既知である複数のクロマトグラム又はスペクトルを用いた機械学習によって予め構築された学習済みモデルを使用して、前記試料についてのクロマトグラム又はスペクトルに現れる一又は複数のピークの始点の位置又は終点の位置の少なくとも一方を含むピーク情報を推定するものであり、前記確度情報は該ピーク情報の推定の確からしさを示す指標値である、請求項１に記載の分析装置。