JP2023128342A - 学習用データの作成方法、波形解析装置、波形解析方法、およびコンピュータプログラム - Google Patents

学習用データの作成方法、波形解析装置、波形解析方法、およびコンピュータプログラム Download PDF

Info

Publication number
JP2023128342A
JP2023128342A JP2022032633A JP2022032633A JP2023128342A JP 2023128342 A JP2023128342 A JP 2023128342A JP 2022032633 A JP2022032633 A JP 2022032633A JP 2022032633 A JP2022032633 A JP 2022032633A JP 2023128342 A JP2023128342 A JP 2023128342A
Authority
JP
Japan
Prior art keywords
peak
waveform
item
candidate
given
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022032633A
Other languages
English (en)
Inventor
慎司 金澤
Shinji Kanazawa
健太 知野見
Kenta CHINOMI
雄紀 坂本
Yuki Sakamoto
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shimadzu Corp
Original Assignee
Shimadzu Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shimadzu Corp filed Critical Shimadzu Corp
Priority to JP2022032633A priority Critical patent/JP2023128342A/ja
Priority to US18/113,689 priority patent/US20230280318A1/en
Priority to CN202310160227.1A priority patent/CN116699049A/zh
Publication of JP2023128342A publication Critical patent/JP2023128342A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8624Detection of slopes or peaks; baseline correction
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8624Detection of slopes or peaks; baseline correction
    • G01N30/8631Peaks
    • G01N30/8634Peak quality criteria
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8693Models, e.g. prediction of retention times, method development and validation
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/88Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N2030/022Column chromatography characterised by the kind of separation mechanism
    • G01N2030/025Gas chromatography
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers

Landscapes

  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Quality & Reliability (AREA)
  • Engineering & Computer Science (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

【課題】機械学習を用いたピークピッキングの精度を向上するための技術を提供する。【解決手段】解析装置は、推定モデルの学習処理のための学習用データを作成する。より具体的には、解析装置は、所与の種類の装置の複数の参照波形を取得する(ステップSP1)。また、解析装置は、複数の参照波形のそれぞれに対して、所与の種類の装置に対応した基準に従って、ピークに関する情報を特定する(ステップSP3)。そして、解析装置は、複数の参照波形のそれぞれに対して、特定されたピークに関する情報を付与する(ステップSP4)。【選択図】図8

Description

本開示は、クロマトグラムおよびスペクトルの波形の解析のための、学習用データの作成方法、波形解析装置、波形解析方法、およびコンピュータプログラムに関する。
従来より、試料に含まれる成分を同定または定量するためにクロマトグラフが用いられている。クロマトグラフでは、試料中の成分をカラムで分離し、カラムから流出する成分を順に検出する。その後、横軸が時間を表し、縦軸が検出強度を表す、クロマトグラムを作成する。
クロマトグラムからピークの高さおよび面積を求めるためには、クロマトグラムのベースラインから立ち上がるピーク開始点および終了点を特定する必要がある。クロマトグラムのピーク開始点および終了点を特定する作業は、ピークピッキングと呼ばれる。ピーク開始点および終了点が特定されることによって、ピークの高さおよび面積が定まる。ピークの高さおよび面積から、ピークに対応する化合物の濃度などを計算することができる。
近年、機械学習を用いてピークピッキングを自動化する試みが進められている。機械学習の中でもディープラーニングを用いたピークピッキングの手法として、物体検知の技術を利用する手法と、セマンティックセグメンテーションの技術を利用する手法とが知られている(特許文献1、非特許文献1、非特許文献2、および非特許文献3)。
特に、特許文献1には、ピークピッキングの問題を画像認識分野の物体検知として定式化することで、SSD(Single Shot Multibox Detector)を用いたピークピッキング結果の確信度を表示する手法が開示されている。SSDは、ピークピッキングの結果と、その結果に対する確信度とを併せて出力する。非特許文献2には、ピークピッキングの問題をセマンティックセグメンテーションの問題として定式化することによってピークピッキングを実現する手法が開示されている。非特許文献3には、ニューラルネットワークを用いたピークピッキングの手法が開示されている。
国際公開第2020/225864号
「AIで開発したアルゴリズムによるデータ解析支援」、[online]、[2021年9月6日検索]、株式会社島津製作所、インターネット<URL:https://www.shimadzu.co.jp/news/press/jmsxjkglv6g0snf.html> Kanazawa S、ほか10名、Fake metabolomics chromatogram generation for facilitating deep learning of peak-picking neural networks. J Biosci Bioeng. 2021 Feb;131(2):207-212. doi: 10.1016/j.jbiosc.、2020年9月13日、Epub 2020 Oct 10. PMID: 33051155. Olaf Ronneberger、ほか2名、「U-Net: Convolutional Networks for Biomedical Image Segmentation」、[online]、(2015年5月18日提出)arXiv.org、インターネット<URL: https://arxiv.org/pdf/1505.04597.pdf>
上述のような機械学習を用いたピークピッキングにおいて、その精度の向上が常に求められている。
本開示の目的は、機械学習を用いたピークピッキングの精度を向上するための技術を提供することである。
本開示のある局面に従う学習用データの作成方法は、所与の種類の装置の複数の参照波形に基づいて対象波形におけるピークに関する情報を出力するようにコンピュータを機能させる、推定モデルを作成するための学習用データを作成する方法であって、複数の参照波形を取得するステップと、複数の参照波形のそれぞれに対して、所与の種類の装置に対応した基準に従って、ピークに関する情報を特定するステップと、複数の参照波形のそれぞれに対して、特定されたピークに関する情報を付与するステップと、を備える。
本開示の他の局面に従う波形解析装置は、所与の種類の装置の対象波形を取得する波形取得部と、学習済の推定モデルに対して対象波形を入力し、対象波形におけるピークに関する情報を取得するピーク情報取得部と、を備え、推定モデルは、対象波形が入力された際に対象波形におけるピークに関する情報を出力するように、所与の種類の装置の複数の参照波形のそれぞれが所与の種類の装置に対応した基準に従って特定されたピークに関する情報を付与されることによって作成された学習用データを用いて学習処理を施されている。
本開示のさらに他の局面に従う波形解析方法は、所与の種類の装置の対象波形を取得するステップと、学習済の推定モデルに対して対象波形を入力し、対象波形におけるピークに関する情報を取得するステップと、を備え、推定モデルは、対象波形が入力された際に対象波形におけるピークに関する情報を出力するように、所与の種類の装置の複数の参照波形のそれぞれが所与の種類の装置に対応した基準に従って特定されたピークに関する情報を付与されることによって作成された学習用データを用いて学習処理を施されている。
本開示のさらに他の局面に従うコンピュータプログラムは、コンピュータの1以上のプロセッサによって実行されることにより、当該コンピュータに上述の波形解析方法を実施させる。
本開示によれば、機械学習を用いたピークピッキングの精度を向上するための技術が提供される。
解析装置1の全体構成を示すブロック図である。 クロマトグラムの一例を示す図である。 クロマトグラムの他の例を示す図である。 学習済みモデルを作成する手順を説明するためのブロック図である。 クロマトグラムの他の例を示す図である。 図5のクロマトグラム400に対してユーザが選出したピーク領域の候補を模式的に示す図である。 学習用データのデータ構成の具体例を模式的に示す図である。 学習用データを作成する手順を説明するためのフローチャートである。 学習済みモデルを作成する手順を説明するためのフローチャートである。 学習済みモデル(学習済みの推定モデル300)を用いてクロマトグラムデータを判定する手順を説明するためのフローチャートである。 学習済みモデルの判定結果の一例を示す図である。 判定結果に基づいてラベル付け処理が行われたグラフの一例を示す図である。 判定結果を表示する画像120の一例を示す図である。
以下、本開示の実施の形態について、図面を参照しながら詳細に説明する。なお、図中同一または相当部分には同一符号を付してその説明は繰り返さない。
[解析装置の構成]
図1は、解析装置1の全体構成を示すブロック図である。解析装置1は、制御部として機能するプロセッサ10と、記憶部として機能するメモリ20と、入出力ポート30とを備える。入出力ポート30には、マウス40、キーボード50、および表示装置60が接続される。入出力ポート30には、質量分析計などを接続してもよい。入出力ポート30には、インターネットあるいは構内ネットワークなどを通じて1または複数の端末装置を接続してもよい。
解析装置1は、たとえば、パーソナルコンピュータをベースとして構成される。解析装置1は、インターネットなどのネットワークを通じて1または複数の端末装置からアクセスすることが可能なサーバによって構成されてもよい。
入出力ポート30には、測定データ(クロマトグラムデータ)が入力される。測定データは、解析対象として利用される場合もあれば、推定モデルの学習用データの作成に利用される場合もある。測定データは、入出力ポート30に接続された質量分析計を通じて、解析装置1に入力されてもよい。質量分析計、質量分析計に接続されるガスクロマトグラフ、および解析装置1によって、ガスクロマトグラフ質量分析システムが構成されてもよい。
メモリ20には、学習用データ210と、測定データ213と、機械学習に用いられる推定モデル300と、解析処理および機械学習の処理を実行するための解析用プログラム200とが少なくとも格納される。測定データ213は、入出力ポート30に入力され得る。
学習用データ210は、複数の学習用サンプルを含む。複数の学習用サンプルは、訓練用データ211および検証用データ212に分類される。一実現例では、複数の学習用サンプルのうち、80%が訓練用データ211に分類され、20%が検証用データ212に分類される。すなわち、この例では、14250個の学習用サンプル(1セットが475個のクロマトグラムより構成されるサンプルセットを30セット分)が準備された場合、11400個の学習用サンプルが訓練用データ211に分類され、2850個の学習用サンプルが検証用データ212に分類される。ただし、訓練用データ211と検証用データ212の割合は、これに限定されず、適宜設定され得る。
訓練用データ211および検証用データ212は、各種の成分を含有する試料をクロマトグラフ質量分析装置で測定することにより得られたクロマトグラムの波形のデータを含む。クロマトグラムは、たとえば、ガスクロマトグラフで分離された成分を質量分析計でMSスキャン測定し、検出した全ての質量電荷比のイオンの合計強度の時間変化を表すトータルイオンクロマトグラムである。クロマトグラムは、SIM測定またはMRM測定し、特定の質量電荷比のイオンの強度の時間変化を表すマスクロマトグラムであってもよい。
訓練用データ211および検証用データ212は、正解データとして、ピークに関する情報を含む。ピークに関する情報は、ピークピッキングにより特定される。ピークピッキングは、訓練用データ211および検証用データ212のそれぞれに含まれるクロマトグラムに対して実施される。ピークに関する情報は、ピークの位置の情報(ピーク開始点の位置、ピークトップの位置、および/または、ピーク終了点の位置)を含んでいてもよい。
訓練用データ211および検証用データ212のそれぞれに含まれる波形のデータ(クロマトグラム)は、強度値の所定の範囲内(たとえば±1.0)となるように予め規格化されている。規格化により強度スケールが異なる複数のクロマトグラムを共通の強度スケールに統一しておくことで、学習済みモデルの精度を高めることができる。
訓練用データ211および検証用データ212のそれぞれに含まれるクロマトグラムは、実際の試料の測定により得られたクロマトグラムであってもよいし、シミュレーション(たとえば、非特許文献2参照)により作成されたクロマトグラムであってもよい。
クロマトグラムの波形は、時間軸方向に所定数の部分波形に分割されている。所定数は、たとえば512または1024などであり、各部分波形の幅(時間軸方向の長さ)が少なくともピーク幅よりも小さくなるように設定される。所定数は、たとえば、ピーク幅の大きさと1つのピークを構成するために必要なデータ点数とに基づいて定められる。
各部分波形データには、部分波形のピークに関する情報(特性情報)が対応付けられている。部分波形に対応付けられる特性情報には、少なくとも、当該部分波形がピーク領域に属するものであるか非ピーク領域に属するものであるかを示す情報が含まれている。
解析用プログラム200により、分割部201、モデル作成部202、判定部203、計算部204、画像処理部205、および出力部206が構成される。
分割部201は、クロマトグラムの波形を予め決められた数の部分波形に分割する。モデル作成部202は、学習用データ210を用いて、推定モデル300の機械学習を進め、学習済みの推定モデル300を作成する。
判定部203は、学習済みの推定モデル300を用いて、クロマトグラムのピークピッキングを行う。以下、学習済みの推定モデル300を「学習済みモデル」と称する場合がある。
計算部204は、判定部203の判定結果の確信度を計算する。画像処理部205は、判定結果および確信度を含む画像データを作成する。出力部206は、画像データを含む表示信号を入出力ポート30から表示装置60へ出力する。なお、解析装置1が表示装置60を備えていてもよい。
[クロマトグラムの一例]
図2は、クロマトグラムの一例を示す図である。ここでは、クロマトグラムから特定される各部の名称を簡単に説明する。クロマトグラムは、ベースラインの部分と、ピーク領域とに分類することができる。ベースラインからの立ち上がり部分は、ピーク開始点およびピーク終了点と称される。ピーク開始点とピーク終了点との間の領域は、ピーク領域と称される。ピーク領域のうち、検出強度が非常に強い部分(最も強い部分)は、ピークトップと称される。
一実現例では、ピーク領域は、単体ピークと未分離ピークとに分けられる。図2には、単体ピークが示される。図3は、クロマトグラムの他の例を示す図である。図3の波形30では、領域31,32として示されるように、ピークトップを頂上とする山状波形が2つ連なっている。これらの2つの山状波形の間の谷に該当する部分の検出強度は、ベースラインに対応する強度まで落ちていない。領域31を含む山状波形および領域32を含む山状波形は、いずれも未分離ピークと称される。
[学習済みモデルの作成]
次に、学習済みモデルを作成する手順について説明する。図4は、学習済みモデルを作成する手順を説明するためのブロック図である。
図4に示されるように、解析装置1のモデル作成部202は、学習装置として機能する。モデル作成部202は、学習用データ210に基づいて、推定モデル300を学習させる。推定モデル300は、ニューラルネットワークを用いることで、ディープラーニングを行う。推定モデル300は、ニューラルネットワークによる計算に用いられる重み付け係数などのパラメータを含む。
推定モデル300を学習させるため、たとえば、教師あり学習のアルゴリズムが用いられる。モデル作成部202は、学習用データ210を用いた教師あり学習によって、推定モデル300を学習させる。
推定モデル300の学習には、セマンティックセグメンテーション(Semantic Segmentation)の技術が用いられる。セマンティックセグメンテーションは、一般に、二次元的に分布する画素データで構成された画像を解析するために用いられる。本実施の形態では、時間軸に沿って一次元的に並ぶデータで構成されるクロマトグラムの波形の解析にセマンティックセグメンテーションを適用する。セマンティックセグメンテーションを実行可能な推定モデルとして、たとえば、U-Net、SeGNet、PSPNetなどを用いることができる。本実施の形態では、U-Netを用いる。
図4に示されるように、学習用データ210は、クロマトグラムデータと正解データとを含む。より具体的には、学習用データ210は学習用サンプルのセットであり、各学習用サンプルはクロマトグラムデータと正解データとを含む。さらに具体的には、本実施形態では、各学習用サンプルは、クロマトグラムデータの部分波形ごとに作成された正解データを含む。
モデル作成部202には、クロマトグラムの部分波形と、それに対応する正解データとが入力される。正解データは、たとえば、既に特定されたピークピッキングの結果である。ピークピッキングの結果にピークトップを含めてもよい。
本実施形態では、正解データは、推定モデル300が解析対象とするクロマトグラムの装置の種類に対応した基準に従って作成される。正解データの作成については、図5および図6を参照して後述される。
モデル作成部202は、推定モデル300に学習用データ210の中のクロマトグラムを適用することにより当該クロマトグラムに対するピークピッキングの結果を導出し、導出された結果と正解データとに基づいて推定モデル300を学習させる。具体的には、モデル作成部202は、推定モデル300によって導出された結果が正解データに近づくように推定モデル300内のパラメータを調整することにより、推定モデル300を学習させる。
[正解データの作成]
図5および図6を参照して、正解データの作成について説明する。図5は、クロマトグラムの他の例を示す図である。図5のクロマトグラム400において、縦軸は検出強度を表し、横軸は保持時間を表し、波形41は保持時間に対する検出強度の変化を表す。図6は、図5のクロマトグラム400に対してユーザが選出したピーク領域の候補を模式的に示す図である。図6では、領域C1~C12が付記されている。領域C1~C12のそれぞれは、本実施形態において波形41に対してユーザにより選択された12個のピーク領域の候補のそれぞれの少なくとも一部を指し示す。本明細書では、「ピーク領域」を単に「ピーク」と称する場合があり、また、「ピーク領域の候補」を単に「ピークの候補」と称する場合もある。
本実施形態では、上述の通り、正解データは、推定モデル300が解析対象とするクロマトグラムの装置の種類に対応した基準に従って作成される。
たとえば、推定モデル300が、解析対象とするクロマトグラムの装置の種類がガスクロマトグラフである場合、正解データは、ガスクロマトグラフに対応した基準に従って作成される。すなわち、推定モデル300が、ガスクロマトグラフによる分析結果として得られたクロマトグラムに対するピークに関する情報の推定に利用される場合、学習用データ210(訓練用データ211および検証用データ212)に含まれる複数のクロマトグラムのそれぞれに付加される正解データは、ガスクロマトグラフに対応した基準に従って作成される。
ガスクロマトグラフに対応した基準の一例は、ピークピッキングにおいてピークとして特定するためのS/N比の閾値をより小さい値とすることである。より具体的には、主ピークの前後の小さいピークに対して、ピークとして特定するためのS/N比の閾値をより小さい値とすることである。S/N比は、ガスクロマトグラムに対して設定されたノイズの強度に対するピークトップの強度である。
一実現例では、解析対象が一般的なクロマトグラフ(たとえば、液体クロマトグラフ)のクロマトグラムである場合には、ピークとして特定するためのS/N比が「10以上」とされるところ、解析対象がガスクロマトグラフのクロマトグラムである場合には、ピークとして特定するためのS/N比が「5以上」とされてもよい。さらにS/N比が「10以上」の主ピークと隣接し、分離度が一定値以下の範囲のピークについてはS/N比が「10より小さい値以上(例えば5以上)」としてもよい。ガスクロマトグラフでは測定対象の試料が誘導体化される。これにより、ガスクロマトグラフのクロマトグラムでは、主ピークの前後に小さなピークが生じる場合が多い。上記のようにS/N比の閾値が調整されることにより、ガスクロマトグラフのクロマトグラムにおいて生じることが想定される、主ピークの前後の小さいピークが、ピークピッキングにおいてピークとしてより確実に特定され得る。ピークの候補がピークとして特定されることにより、当該候補のピークに関する情報が正解データとして作成される。ピークの候補がピークとして特定されなければ、当該候補のピークに関する情報は正解データには含まれない。
ガスクロマトグラフのクロマトグラムとは、ガスクロマトグラフによって測定されたクロマトグラムであってもよいし、ガスクロマトグラフの測定結果としてシミュレーションにより作成されたクロマトグラムであってもよい。
「主ピークの前後の小さいピーク」は、たとえば、ピークピッキングにおいて特定された他のピークと隣接しており、当該他のピークとの間で分離度が所与の値を有するピークとして定義される。ここで、「他のピーク」は、「主ピーク」である。「主ピーク」は、一般的なクロマトグラフのクロマトグラムに対するピークピッキングでピークとして特定されるS/N比を有することが想定される。分離度とは、あるピークが隣接する他のピークからどの程度分離しているかを示す指標である(「分離度のはなし_その1」、株式会社島津製作所、2022年1月12日検索、[online]、<URL:https://www.an.shimadzu.co.jp/hplc/support/lib/lctalk/81/81intro.htm>)。一例では、あるピークに対して隣接する主ピークとの分離度として算出された値が1.5以下である場合に、当該ピークが「主ピークの前後の小さいピーク」として特定される。ただし、ここで利用された分離度の値(1.5)は、単なる一例であり、本開示に係る技術が適用される状況に応じて適宜変更され得る。
「主ピークの前後の小さいピーク」について、より具体的に説明する。たとえば、図6の例において、領域C4内のピークは、そのS/N比が10以上であるため「主ピーク」として選択されるが、領域C5内のピークは、そのS/N比が10未満であるため「主ピーク」としては選択されない場合を想定する。この場合、領域C4内のピークと領域C5内のピークとの分離度が算出される。そして、この分離度が1.5未満であるとき、領域C5内のピークは、そのS/N比が5以上であれば、ピークピッキングにおいてピークとして特定される。
ガスクロマトグラフに対応した基準の他の例は、主ピークの前後の小さいピークの検出強度が、主ピークの検出強度に対して所与の比率以上であれば、当該小さいピークをピークピッキングにおいてピークとして特定することである。所与の比率は、たとえば1/10である。
一実現例では、解析対象が一般的なクロマトグラフのクロマトグラムである場合、ピークとして特定するためのS/N比が10以上とされる場合を想定する。一方、解析対象がガスクロマトグラフのクロマトグラムである場合には、S/N比が10未満のピークであっても、S/N比が10以上の主ピークに隣接し、当該主ピークのピークトップの検出強度の1/10以上の検出強度を有するピークトップを含む場合には、ピークピッキングにおいてピークとして特定される。このように主ピークのピークトップの検出強度に関する基準でピークが特定されることにより、ガスクロマトグラフのクロマトグラムにおいて生じることが想定される、主ピークの前後の小さいピークが、ピークピッキングにおいてピークとしてより確実に特定され得る。
ガスクロマトグラフに対応した基準のさらに他の例は、クロマトグラムにおいてノイズが確認できない場合には、ピークとして特定されるためのS/N比の条件を設けないということである。
一実現例では、解析対象が一般的なクロマトグラフのクロマトグラムである場合、ピークとして特定するためのS/N比が10以上とされる場合を想定する。一方、解析対象がガスクロマトグラフのクロマトグラムである場合には、クロマトグラムにおいてノイズが見えない場合には、ユーザによって候補として選択された領域C1~C12内のピークの全てが、そのS/N比に拘わらず、ピークピッキングにおいてピークとして特定される。このように、ノイズが見えない場合には、ピークの候補がそのピークトップのS/N比に拘わらずピークとして特定されることにより、クロマトグラムにおいて多数のピークが生じていることによりノイズが見えない場合にも、ピークとして特定されるべき候補が確実にピークとして特定され得る。このような基準は、ガスクロマトグラフによる測定によって得られるクロマトグラムの保持時間の範囲が液体クロマトグラフによる測定によって得られるクロマトグラムよりも一般的に短いことに対応する。ガスクロマトグラフによる測定によって得られるクロマトグラムの保持時間の範囲が短くなることは、ガスクロマトグラフによる測定では液体クロマトグラフによる測定と比較して保持時間のズレが小さくなることに起因する。
ノイズが見える場合の一例は、図2の保持時間9.6~9.8分の範囲の検出強度のように、変化が、一定時間以上一定の範囲内で(たとえば、0.1分以上検出強度5以内に)収まっている状態がである。すなわち、検出強度が一定の範囲内に位置する継続時間が一定時間以上であれば、クロマトグラムにおいてノイズが見えると判断される。一方、ノイズが見えない場合の一例は、図6に示されるように、検出強度の変化が、上記一定時間以上上記一定の範囲内で収まっている部分を持たない状態である。すなわち、検出強度が一定の範囲内に位置する継続時間が一定時間未満であれば、クロマトグラムにおいてノイズが見えないと判断される。
以上、ピーク候補がピークとして特定されるための複数の条件が説明された。これらの条件は、単独で適用されてもよいし、複数で組み合わされて適用されてもよい。
[正解データの具体例]
図7は、学習用データのデータ構成の具体例を模式的に示す図である。図7には、学習用サンプルのデータ構成の一例が示される。図7の例は、1つの学習用サンプルのデータ構成を表す。図7に示された例では、1つのクロマトグラムに含まれる波形が複数の部分波形に分割され、各部分波形に特性情報(正解データ)が付加されている。なお、図7に示されたデータ構成は、単なる一例であって、本実施形態にかかる学習用データでは、1つのクロマトグラムの波形が部分波形に分割されている必要はない。
図7に示されるように、各部分波形には、正解データとして、大分類の特性情報と小分類の特性情報とが付加されている。大分類の特性情報は、部分波形がピーク領域に属するか、非ピーク領域に属するかを表す。小分類の特性情報は、部分波形がピーク領域または非ピーク領域において有する属性を表す。たとえば、部分波形Aには、大分類の特性情報として「非ピーク領域に属する」が付加され、また、小分類の特性情報として「ベースライン」が付加されている。
正解データに含まれる情報の種類は、図7に示されたような大分類および小分類の特性情報として示された情報の種類に限定されない。正解データは、ピークトップの検出強度などの、他の種類の情報を含んでいても良い。
[処理の流れ(学習用データの作成)]
図8は、学習用データを作成する手順を説明するためのフローチャートである。当該フローチャートに従うと、学習用データを構成する1つの学習用サンプルが作成される。学習用データは、一実現例では、解析装置1は、プロセッサ10に解析用プログラム200を実行させることにより、本フローチャートの処理を実施する。
ステップSP1にて、解析装置1は、クロマトグラムデータを読み出す。一実現例では、クロマトグラムデータは、入出力ポート30を介して入力されて、または、シミュレーションによって作成されて、メモリ20に格納される。プロセッサ10は、メモリ20からクロマトグラフデータを読み出す。ステップSP1において読み出されるクロマトグラムデータは、推定モデル300の学習処理のために利用されるデータであり、参照波形の一例である。
ステップSP2にて、解析装置1は、クロマトグラムデータに含まれる波形に対してピークを特定する。一実現例では、ユーザは、波形に対してピークの候補を選択し、当該ピークの候補の中から上記基準に従ってピークを特定し、特定されたピークを解析装置1に入力する。解析装置1は、ユーザからの入力に従って、クロマトグラフデータに含まれる波形に対してピークを特定する。なお、解析装置1が、ユーザからの入力を必要とすることなく、クロマトグラムデータから上記基準に従ってピークを特定してもよい。
ステップSP3にて、解析装置1は、ピークに関する情報を特定する。一実現例では、ユーザは、ピークに関する情報(たとえば、図7の特性情報)を特定し、解析装置1に入力する。解析装置1は、ユーザからの入力に従って、ピークに関する情報を特定する。
ステップSP4にて、解析装置1は、ピークに関する情報をクロマトグラムデータに付加する。ステップSP1において読み出されたクロマトグラムデータにピークに関する情報が付加されることにより、1つの学習用サンプルが作成される。作成された学習用サンプルは、訓練用データ211または検証用データ212として、メモリ20に格納される。
その後、解析装置1は、図8のフローチャートの処理を終了させる。解析装置1は、各学習用サンプルについて図8の処理を実施することにより、学習用データを作成する。
[処理の流れ(学習済みモデルの作成)]
図9は、学習済みモデルを作成する手順を説明するためのフローチャートである。解析装置1は、プロセッサ10に解析用プログラム200を実行させることにより、本フローチャートの処理を実施する。
まず、プロセッサ10は、推定モデル300の学習を開始させる操作を検出する(ステップS1)。たとえば、ユーザがマウス40およびキーボード50を用いて、推定モデル300の学習を開始させる操作をした場合、その操作がステップS1において検出される。
次に、プロセッサ10は、メモリ20から学習用データ210(訓練用データ211および検証用データ212)を読み出す(ステップS2)。次に、プロセッサ10は、推定モデル300に訓練用データ211を入力する(ステップS3)。次に、推定モデル300において、ディープラーニングによる学習処理が実行される(ステップS4)。本実施の形態において推定モデル300の学習に用いるU-Netでは、部分波形から正しい特性情報が得られるように、ニューラルネットワークの重みづけが調整される。
より具体的には、訓練用データ211の部分波形および部分波形に対応付けられた特性情報に基づいて、推定モデル300のパラメータが調整される。パラメータを調整する過程では、単体ピーク、未分離ピーク、ピーク開始点、ピーク終了点、およびベースラインなどを推定する処理と、推定結果と正解データとを照らし合わせる処理とが実行される。
次に、プロセッサ10は、ステップS4の学習処理の結果に応じて作成された推定モデル300をメモリ20に格納する(ステップS5)。
次に、プロセッサ10は、推定モデル300が検証用データ212の部分波形を解析して付与した特性情報の正答率を算出する(ステップS6)。
次に、プロセッサ10は、予め定められた終了条件が成立しているか否かを判定する(ステップS7)。たとえば、訓練用データ211を用いて繰り返し実施する学習処理の回数が予め決められた回数に達している場合、プロセッサ10は、終了条件が成立していると判定する。終了条件が成立していない場合、プロセッサ10は、終了条件が成立するまで、ステップS3からステップS6の制御を繰り返す。
プロセッサ10は、終了条件が成立した場合、図9の一連の処理を終了する。
[クロマトグラムの波形の解析]
次に、未解析のクロマトグラムの波形を解析する手順について、フローチャートを参照して説明する。図10は、学習済みモデル(学習済みの推定モデル300)を用いてクロマトグラムデータを判定する手順を説明するためのフローチャートである。解析装置1のプロセッサ10が解析用プログラム200の一部を実行することにより、本フローチャートの処理が実現される。
はじめに、プロセッサ10は、クロマトグラムデータ(測定データ)を取得する(ステップS11)。クロマトグラムデータは、入出力ポート30に接続された質量分析計などの計測機器を通じて、または、入出力ポート30に接続された端末装置などを通じて、解析装置1に入力される。ステップS11において取得されるデータは、ピークに関する情報の推定対象のデータであり、対象波形の一例である。対象波形を取得するように機能するプロセッサ10により、波形取得部が構成される。
次に、プロセッサ10は、取得されたクロマトグラムの波形を予め決められた数の部分波形に分割する(ステップS12)。クロマトグラム波形の分割数は、訓練用データ211および検証用データ212と同数であってもよく、異なる数であってもよい。
ただし、各部分波形の幅(時間軸方向の長さ)が少なくとも、クロマトグラムに含まれることが予測されるピークの幅よりも小さくなるように、波形の長さ(クロマトグラフ質量分析の実行時間の長さ)に応じて分割数が決定される。たとえば、512または1024などに分割数を設定することが考えられる。
次に、プロセッサ10は、学習済みの推定モデル300(学習済みモデル)に部分波形を入力する(ステップS13)。次に、プロセッサ10は、学習済みモデルとして、部分波形がピーク領域に属するものであるか否かを判定し、ラベル付け処理を実行する(ステップS14)。より具体的には、部分波形から、ピーク開始点および終了点、ベースライン、単体ピーク、未分離ピーク、ピークトップなどが判定される。また、それぞれの判定結果の重みが算出される。また、ステップS14では、各部分波形に特性情報(ピーク領域に属するものであるか否かの情報)が付加される。ステップS14において推定モデル300を利用して各部分波形の特性情報を作成するように機能するプロセッサ10により、ピーク情報取得部が構成される。
次に、プロセッサ10は、判定結果を示すグラフを作成し、作成されたグラフを表示するための表示信号を表示装置60へ出力する(ステップS15)。これにより、表示装置60には、判定結果が表示される。たとえば、表示装置60の画面には、クロマトグラムの波形上に、ピーク開始点、およびピーク終了点が表示される。
次に、プロセッサ10は、ピーク開始点および終了点の修正指示を検出したか否かを判定する(ステップS16)。本実施の形態では、表示装置60の画面上でユーザがピーク開始点および終了点を修正する操作を行うことが可能である。プロセッサ10は、修正指示が検出された場合、ステップS17へ制御を進め、修正指示が検出されない場合、ステップS18へ制御を進める。
ユーザがマウス40およびキーボード50により、ピーク開始点および終了点を修正する操作をした場合、プロセッサ10は、修正指示に応じて画面上のデータを修正する(ステップS17)。このように、プロセッサ10は、ユーザの修正指示を受け付けて、ピーク開始点および終了点を修正する。
プロセッサ10は、データを修正した後、データを確定させる操作を検出したか否かを判定する(ステップS18)。データを確定させる操作が検出されない場合、プロセッサ10は、ステップS16へ制御を戻す。プロセッサ10は、データを確定させる操作が検出された場合、判定結果(データが修正された場合には修正後の判定結果)をメモリ20に格納し(ステップS19)、本フローチャートに基づく処理を終える。
[判定結果の一例]
図11は、学習済みモデルの判定結果の一例を示す図である。図11の上のグラフは、入力されたクロマトグラムの波形W0を示す。図11の下のグラフは、入力されたクロマトグラムに対する学習済みモデルの判定結果を表す。両グラフの横軸(インデックス)は、時間軸に対応する。図11の上のグラフの縦軸は検出強度を表す。図11の下のグラフの縦軸は学習済みモデルにより出力された重みを示す。重みは、0~1の範囲に正規化されている。
学習済みモデルの判定結果として示される波形W1~W5は、それぞれ、ベースライン、単体ピーク、未分離ピーク、ピーク開始点、およびピーク終了点に対応する。クロマトグラムの波形W0と波形W1~W5とを対比することにより、たとえば、クロマトグラムの波形W0のうち、インデックスIsの位置において、ピーク開始点に対応する重みが最も高くなることがわかる。同様に、クロマトグラムの波形W0のうち、インデックスIeの位置において、ピーク終了点に対応する重みが最も高くなることがわかる。この場合、たとえば、解析装置1は、クロマトグラムの波形W0のうち、インデックスIsの位置をピーク開始点と判定し、インデックスIeの位置をピーク終了点と判定する。
ここでは、判定対象として、ピーク開始点、ピーク終了点、単体ピーク、未分離ピーク、およびベースラインを例に挙げているが、ピークトップなど、他の要素を判定対象に加えることもできる。
プロセッサ10は、図11に示されるように、学習済みモデルによって判定されたピーク開始点Isに対応する重みWsと、学習済みモデルによって判定されたピーク終了点Ieに対応する重みWeとの平均値を計算することにより、ピークの確信度を特定する。
図12は、判定結果に基づいてラベル付け処理が行われたグラフの一例を示す図である。図12の上のグラフは、図11の下に示したグラフと同一である。図12の下のグラフは、入力されたクロマトグラムの波形W0(図11参照)を、波形W1~波形W5に基づいてラベル付けしたグラフである。ラベル0~4は、それぞれ、ベースライン、単体ピーク、未分離ピーク、ピーク開始点、およびピーク終了点に対応する。
たとえば、ラベル付け処理は、次の手順で行われる。すなわち、波形W1~W5のうち、あるインデックスIxの位置で最も重みが大きい波形を選択し、その選択した波形でインデックスIxの値をラベル付けする。xをインデックスの初期値から最終値まで変化させて同じ処理を繰り返すことによって、ラベル付け処理が終了する。たとえば、図12には、インデックス0~Isまでの区間がベースラインにラベル付け(ラベル=0)されたグラフが示されている。
[判定結果の表示]
図13は、判定結果を表示する画像120の一例を示す図である。画像120は、表示装置60によって表示される。画像120は、解析対象であるクロマトグラムの波形とともに、判定結果に対応するピーク開始点Isおよびピーク終了点Ieを含む欄121を含む。判定結果は、波形121に対して取得されたピークに関する情報である。プロセッサ10は、欄121に、ピーク開始点Isおよびピーク終了点Ie以外の判定結果を含めてもよく、また、画像120に、上述のように算出された確信度を含めてもよい。
プロセッサ10は、画像120の他、図11に示す態様の2つのグラフを含む画像と、図12に示す態様の2つのグラフを含む画像と、図11および図12に含まれる3つのグラフを縦方向に並べた画像とを選択的に表示装置60に表示することが可能である。いずれの画像にも、上述のように算出された確信度が併せて表示されてもよい。また、いずれの画像にも、ステップS6(図9)で算出されたモデルの正答率が表示されてもよい。ユーザは、マウス40およびキーボード50を用いて、いずれの画像を表示するかを示す指示を解析装置1に入力することができる。
プロセッサ10は、画像120に、判定結果の導出に利用された学習済モデルについて、学習用データの作成のために上述された基準を表す情報を含めてもよい。
本実施の形態は、いずれも一例であって、本開示の趣旨に沿って適宜に変更することが可能である。ここではクロマトグラフ質量分析により得られたクロマトグラムの波形を処理する場合を例に説明した。しかし、質量分析計以外の検出器(分光光度計)を有するクロマトグラフ、およびガスクロマトグラフで取得されたクロマトグラムも同様に解析装置1により解析することができる。さらに、解析の対象はクロマトグラムに限定されない。たとえば、分光光度計による測定で取得された分光スペクトル(波長または波数軸に対する検出強度の変化を表した波形)を解析対象としてもよい。LC、GC、LC-PDA、LC/MS、GC/MS、LC/MS/MS、GC/MS/MS、LC/MS-IT-TOFなどで得られたいずれの波形を解析対象としてもよい。
[態様]
上記した実施の形態およびその変形例は、以下の態様の具体例であることが当業者により理解される。
(第1項)一態様に係る学習用データの作成方法は、所与の種類の装置の複数の参照波形に基づいて対象波形におけるピークに関する情報を出力するようにコンピュータを機能させる、推定モデルを作成するための学習用データを作成する方法であって、前記複数の参照波形を取得するステップと、前記複数の参照波形のそれぞれに対して、前記所与の種類の装置に対応した基準に従って、ピークに関する情報を特定するステップと、前記複数の参照波形のそれぞれに対して、特定された前記ピークに関する情報を付与するステップと、を備えていていもよい。
第1項に記載の学習用データの作成方法によれば、所与の装置の対象波形に対するピークピッキングにおいて、機械学習を用いたピークピッキングの精度を向上するための技術が提供される。
(第2項)第1項に記載の学習用データの作成方法において、前記所与の種類の装置は、ガスクロマトグラフを含んでいてもよい。
第2項に記載の学習用データの作成方法によれば、ガスクロマトグラフを含む所与の装置の対象波形に対するピークピッキングにおいて、機械学習を用いたピークピッキングの精度を向上するための技術が提供される。
(第3項)第1項または第2項に記載の学習用データの作成方法において、前記基準は、各参照波形において、ピーク候補をピークとして特定するために、当該ピーク候補のS/N比が第1の値以上であるという第1の項目に加えて、当該ピーク候補が前記第1の項目に従って特定されたピークに隣接し、かつ、当該ピーク候補のS/N比が前記第1の値より小さい第2の値以上であるという第2の項目を含んでいてもよい。
第3項に記載の学習用データの作成方法によれば、主ピークの前後の小さいピークが、ピークピッキングにおいてピークとしてより確実に特定され得る。
(第4項)第3項の学習用データの作成方法において、前記第2の項目は、前記第1の項目に従って特定されたピークとの分離度が所定値以下であることを含んでいてもよい。
第4項に記載の学習用データの作成方法によれば、主ピークの前後の小さいピークが、ピークピッキングにおいてピークとしてさらに確実に特定され得る。
(第5項)第3項に記載の学習用データの作成方法において、前記第2の項目は、前記ピーク候補をピークとして特定するために、前記ピーク候補の検出強度が、前記第1の項目に従って特定されたピークの検出強度に対して所与の比率以上であることを含んでいてもよい。
第5項に記載の学習用データの作成方法によれば、主ピークの前後の小さいピークが、ピークピッキングにおいてピークとしてより確実に特定され得る。
(第6項)第1項~第5項のいずれか1項に記載の学習用データの作成方法において、前記基準は、各参照波形において、所与の強度範囲における信号の継続時間が所与の時間未満である場合には、各参照波形において、ピーク候補を当該ピーク候補のS/N比に拘わらずピークとして特定することを含んでいてもよい。
第6項に記載の学習用データの作成方法によれば、クロマトグラムにおいて多数のピークが生じていることによりノイズが見えない場合にも、ピークとして特定されるべき候補が確実にピークとして特定され得る。
(第7項)一態様に係る波形解析装置は、所与の種類の装置の対象波形を取得する波形取得部と、学習済の推定モデルに対して前記対象波形を入力し、前記対象波形におけるピークに関する情報を取得するピーク情報取得部と、を備え、前記推定モデルは、前記対象波形が入力された際に前記対象波形におけるピークに関する情報を出力するように、前記所与の種類の装置の複数の参照波形のそれぞれが前記所与の種類の装置に対応した基準に従って特定されたピークに関する情報を付与されることによって作成された学習用データを用いて学習処理を施されていてもよい。
第7項に記載の波形解析装置によれば、所与の装置の対象波形に対するピークピッキングにおいて、機械学習を用いたピークピッキングの精度を向上するように学習された推定モデルが利用される。
(第8項)第7項に記載の波形解析装置において、前記所与の種類の装置は、ガスクロマトグラフを含んでいてもよい。
第8項に記載の波形解析装置によれば、ガスクロマトグラフを含む所与の装置の対象波形に対するピークピッキングにおいて、機械学習を用いたピークピッキングの精度を向上するように学習された推定モデルが利用される。
(第9項)第7項または第8項に記載の波形解析装置において、前記基準は、各参照波形において、ピーク候補をピークとして特定するために、当該ピーク候補のS/N比が第1の値以上であるという第1の項目に加えて、当該ピーク候補が前記第1の項目に従って特定されたピークに隣接し、かつ、当該ピーク候補のS/N比が前記第1の値より小さい第2の値以上であるという第2の項目を含んでいてもよい。
第9項に記載の波形解析装置によれば、主ピークの前後の小さいピークが、ピークピッキングにおいてピークとしてより確実に特定され得るような学習用データを用いて学習された推定モデルが、ピークピッキングに利用される。
(第10項)第9項の波形解析装置において、前記第2の項目は、前記第1の項目に従って特定されたピークとの分離度が所定値以下であることを含んでいてもよい。
第10項に記載の波形解析装置によれば、主ピークの前後の小さいピークが、ピークピッキングにおいてピークとしてさらに確実に特定され得る。
(第11項)第9項に記載の波形解析装置において、前記第2の項目は、前記ピーク候補をピークとして特定するために、前記ピーク候補の検出強度が、前記第1の項目に従って特定されたピークの検出強度に対して所与の比率以上であることを含んでいてもよい。
第11項に記載の波形解析装置によれば、主ピークの前後の小さいピークが、ピークピッキングにおいてピークとしてより確実に特定され得るような学習用データを用いて学習された推定モデルが、ピークピッキングに利用される。
(第12項)第7項~第11項のいずれか1項に記載の波形解析装置において、前記基準は、各参照波形において、所与の強度範囲における信号の継続時間が所与の時間未満である場合には、各参照波形において、ピーク候補を当該ピーク候補のS/N比に拘わらずピークとして特定することを含んでいてもよい。
第12項に記載の波形解析装置によれば、クロマトグラムにおいて多数のピークが生じていることによりノイズが見えない場合にも、ピークとして特定されるべき候補が確実にピークとして特定され得るような学習用データを用いて学習された推定モデルが、ピークピッキングに利用される。
(第13項)一態様に係る波形解析方法は、所与の種類の装置の対象波形を取得するステップと、学習済の推定モデルに対して前記対象波形を入力し、前記対象波形におけるピークに関する情報を取得するステップと、を備え、前記推定モデルは、前記対象波形が入力された際に前記対象波形におけるピークに関する情報を出力するように、前記所与の種類の装置の複数の参照波形のそれぞれが前記所与の種類の装置に対応した基準に従って特定されたピークに関する情報を付与されることによって作成された学習用データを用いて学習処理を施されていてもよい。
第13項に記載の波形解析方法によれば、所与の装置の対象波形に対するピークピッキングにおいて、機械学習を用いたピークピッキングの精度を向上するように学習された推定モデルが利用される。
(第14項)第13項に記載の波形解析方法において、前記所与の種類の装置は、ガスクロマトグラフを含んでいてもよい。
第14項に記載の波形解析方法によれば、ガスクロマトグラフを含む所与の装置の対象波形に対するピークピッキングにおいて、機械学習を用いたピークピッキングの精度を向上するように学習された推定モデルが利用される。
(第15項)第13項または第14項に記載の波形解析方法において、前記基準は、各参照波形において、ピーク候補をピークとして特定するために、当該ピーク候補のS/N比が第1の値以上であるという第1の項目に加えて、当該ピーク候補が前記第1の項目に従って特定されたピークに隣接し、かつ、当該ピーク候補のS/N比が前記第1の値より小さい第2の値以上であるという第2の項目を含んでいてもよい。
第15項に記載の波形解析方法によれば、主ピークの前後の小さいピークが、ピークピッキングにおいてピークとしてより確実に特定され得るような学習用データを用いて学習された推定モデルが、ピークピッキングに利用される。
(第16項)第15項の波形解析方法において、前記第2の項目は、前記第1の項目に従って特定されたピークとの分離度が所定値以下であることを含んでいてもよい。
第16項に記載の波形解析方法によれば、主ピークの前後の小さいピークが、ピークピッキングにおいてピークとしてさらに確実に特定され得る。
(第17項)第15項に記載の波形解析方法において、前記第2の項目は、前記ピーク候補をピークとして特定するために、前記ピーク候補の検出強度が、前記第1の項目に従って特定されたピークの検出強度に対して所与の比率以上であることを含んでいてもよい。
第17項に記載の波形解析方法によれば、主ピークの前後の小さいピークが、ピークピッキングにおいてピークとしてより確実に特定され得るような学習用データを用いて学習された推定モデルが、ピークピッキングに利用される。
(第18項)第13項~第17項のいずれか1項に記載の波形解析方法において、前記基準は、各参照波形において、所与の強度範囲における信号の継続時間が所与の時間未満である場合には、各参照波形において、ピーク候補を当該ピーク候補のS/N比に拘わらずピークとして特定することを含んでいてもよい。
第18項に記載の波形解析方法によれば、クロマトグラムにおいて多数のピークが生じていることによりノイズが見えない場合にも、ピークとして特定されるべき候補が確実にピークとして特定され得るような学習用データを用いて学習された推定モデルが、ピークピッキングに利用される。
(第19項)一態様に係るコンピュータプログラムは、コンピュータの1以上のプロセッサによって実行されることにより、前記コンピュータに第13項~第18項のいずれか1項に記載の波形解析方法を実施させる。
第19項に記載のコンピュータプログラムによれば、所与の装置の対象波形に対するピークピッキングにおいて、機械学習を用いたピークピッキングの精度を向上するように学習された推定モデルが利用される。
今回開示された実施の形態は、全ての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は、上記した実施の形態の説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内での全ての変更が含まれることが意図される。
1 解析装置、10 プロセッサ、20 メモリ、30 入出力ポート、40 マウス、41 波形、50 キーボード、60 表示装置、61 画像、62 画像、65,66 アイコン、200 解析用プログラム、201 分割部、202 モデル作成部、203 判定部、204 計算部、205 画像処理部、206 出力部、210 学習用データ、211 訓練用データ、212 検証用データ、213 測定データ、300 推定モデル、400 クロマトグラム、C1~C12 領域。

Claims (19)

  1. 所与の種類の装置の複数の参照波形に基づいて対象波形におけるピークに関する情報を出力するようにコンピュータを機能させる、推定モデルを作成するための学習用データを作成する方法であって、
    前記複数の参照波形を取得するステップと、
    前記複数の参照波形のそれぞれに対して、前記所与の種類の装置に対応した基準に従って、ピークに関する情報を特定するステップと、
    前記複数の参照波形のそれぞれに対して、特定された前記ピークに関する情報を付与するステップと、を備える、学習用データの作成方法。
  2. 前記所与の種類の装置は、ガスクロマトグラフを含む、請求項1に記載の学習用データの作成方法。
  3. 前記基準は、各参照波形において、ピーク候補をピークとして特定するために、当該ピーク候補のS/N比が第1の値以上であるという第1の項目に加えて、当該ピーク候補が前記第1の項目に従って特定されたピークに隣接し、かつ、当該ピーク候補のS/N比が前記第1の値より小さい第2の値以上であるという第2の項目を含む、請求項1または請求項2に記載の学習用データの作成方法。
  4. 前記第2の項目は、前記第1の項目に従って特定されたピークとの分離度が所定値以下であることを含む、請求項3に記載の学習用データの作成方法。
  5. 前記第2の項目は、前記ピーク候補をピークとして特定するために、前記ピーク候補の検出強度が、前記第1の項目に従って特定されたピークの検出強度に対して所与の比率以上であることを含む、請求項3に記載の学習用データの作成方法。
  6. 前記基準は、各参照波形において、所与の強度範囲における信号の継続時間が所与の時間未満である場合には、各参照波形において、ピーク候補を当該ピーク候補のS/N比に拘わらずピークとして特定することを含む、請求項1~請求項5のいずれか1項に記載の学習用データの作成方法。
  7. 所与の種類の装置の対象波形を取得する波形取得部と、
    学習済の推定モデルに対して前記対象波形を入力し、前記対象波形におけるピークに関する情報を取得するピーク情報取得部と、を備え、
    前記推定モデルは、前記対象波形が入力された際に前記対象波形におけるピークに関する情報を出力するように、前記所与の種類の装置の複数の参照波形のそれぞれが前記所与の種類の装置に対応した基準に従って特定されたピークに関する情報を付与されることによって作成された学習用データを用いて学習処理を施されている、波形解析装置。
  8. 前記所与の種類の装置は、ガスクロマトグラフを含む、請求項7に記載の波形解析装置。
  9. 前記基準は、各参照波形において、ピーク候補をピークとして特定するために、当該ピーク候補のS/N比が第1の値以上であるという第1の項目に加えて、当該ピーク候補が前記第1の項目に従って特定されたピークに隣接し、かつ、当該ピーク候補のS/N比が前記第1の値より小さい第2の値以上であるという第2の項目を含む、請求項7または請求項8に記載の波形解析装置。
  10. 前記第2の項目は、前記第1の項目に従って特定されたピークとの分離度が所定値以下であることを含む、請求項9に記載の波形解析装置。
  11. 前記第2の項目は、前記ピーク候補をピークとして特定するために、前記ピーク候補の検出強度が、前記第1の項目に従って特定されたピークの検出強度に対して所与の比率以上であることを含む、請求項9に記載の波形解析装置。
  12. 前記基準は、各参照波形において、所与の強度範囲における信号の継続時間が所与の時間未満である場合には、各参照波形において、ピーク候補を当該ピーク候補のS/N比に拘わらずピークとして特定することを含む、請求項7~請求項11のいずれか1項に記載の波形解析装置。
  13. 所与の種類の装置の対象波形を取得するステップと、
    学習済の推定モデルに対して前記対象波形を入力し、前記対象波形におけるピークに関する情報を取得するステップと、を備え、
    前記推定モデルは、前記対象波形が入力された際に前記対象波形におけるピークに関する情報を出力するように、前記所与の種類の装置の複数の参照波形のそれぞれが前記所与の種類の装置に対応した基準に従って特定されたピークに関する情報を付与されることによって作成された学習用データを用いて学習処理を施されている、波形解析方法。
  14. 前記所与の種類の装置は、ガスクロマトグラフを含む、請求項13に記載の波形解析方法。
  15. 前記基準は、各参照波形において、ピーク候補をピークとして特定するために、当該ピーク候補のS/N比が第1の値以上であるという第1の項目に加えて、当該ピーク候補が前記第1の項目に従って特定されたピークに隣接し、かつ、当該ピーク候補のS/N比が前記第1の値より小さい第2の値以上であるという第2の項目を含む、請求項13または請求項14に記載の波形解析方法。
  16. 前記第2の項目は、前記第1の項目に従って特定されたピークとの分離度が所定値以下であることを含む、請求項15に記載の波形解析方法。
  17. 前記第2の項目は、前記ピーク候補をピークとして特定するために、前記ピーク候補の検出強度が、前記第1の項目に従って特定されたピークの検出強度に対して所与の比率以上であることを含む、請求項15に記載の波形解析方法。
  18. 前記基準は、各参照波形において、所与の強度範囲における信号の継続時間が所与の時間未満である場合には、各参照波形において、ピーク候補を当該ピーク候補のS/N比に拘わらずピークとして特定することを含む、請求項13~請求項17のいずれか1項に記載の波形解析方法。
  19. コンピュータの1以上のプロセッサによって実行されることにより、前記コンピュータに請求項13~請求項18のいずれか1項に記載の波形解析方法を実施させる、コンピュータプログラム。
JP2022032633A 2022-03-03 2022-03-03 学習用データの作成方法、波形解析装置、波形解析方法、およびコンピュータプログラム Pending JP2023128342A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2022032633A JP2023128342A (ja) 2022-03-03 2022-03-03 学習用データの作成方法、波形解析装置、波形解析方法、およびコンピュータプログラム
US18/113,689 US20230280318A1 (en) 2022-03-03 2023-02-24 Learning data producing method, waveform analysis device, waveform analysis method, and recording medium
CN202310160227.1A CN116699049A (zh) 2022-03-03 2023-02-24 学习用数据的制作方法、波形解析装置及方法、记录介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022032633A JP2023128342A (ja) 2022-03-03 2022-03-03 学習用データの作成方法、波形解析装置、波形解析方法、およびコンピュータプログラム

Publications (1)

Publication Number Publication Date
JP2023128342A true JP2023128342A (ja) 2023-09-14

Family

ID=87842104

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022032633A Pending JP2023128342A (ja) 2022-03-03 2022-03-03 学習用データの作成方法、波形解析装置、波形解析方法、およびコンピュータプログラム

Country Status (3)

Country Link
US (1) US20230280318A1 (ja)
JP (1) JP2023128342A (ja)
CN (1) CN116699049A (ja)

Also Published As

Publication number Publication date
US20230280318A1 (en) 2023-09-07
CN116699049A (zh) 2023-09-05

Similar Documents

Publication Publication Date Title
US11486866B2 (en) Waveform analyzer
US8428889B2 (en) Methods of automated spectral peak detection and quantification having learning mode
US11302039B2 (en) Waveform analyzer
JP6813033B2 (ja) 分析データ解析方法および分析データ解析装置
EP4016375A1 (en) Video classification method, device and system
EP3495812A1 (en) Analysis data processing method and analysis data processing device
JP6748085B2 (ja) 干渉検出および着目ピークのデコンボルーション
JP2014211393A (ja) ピーク検出装置
JP2023159214A (ja) 波形解析方法及び波形解析装置
JP2023128342A (ja) 学習用データの作成方法、波形解析装置、波形解析方法、およびコンピュータプログラム
JP7414125B2 (ja) 波形情報推定方法及び装置、並びに、ピーク波形処理方法及び装置
WO2020225864A1 (ja) 分析装置
JP7424595B2 (ja) 識別器の生成方法及び装置
US20230280316A1 (en) Learning data producing method, waveform analysis device, waveform analysis method, and recording medium
US7904410B1 (en) Constrained dynamic time warping
US20230243789A1 (en) Analysis device and analysis method
JP7480843B2 (ja) ピークトラッキング装置、ピークトラッキング方法およびピークトラッキングプログラム
US20230296572A1 (en) Training Method
JP7249976B2 (ja) マススペクトル処理装置及び方法
US20130204582A1 (en) Systems and Methods for Feature Detection in Mass Spectrometry Using Singular Spectrum Analysis
Jones et al. Data Analysis