JP7483367B2 - 情報処理装置、情報処理装置の制御方法、及びプログラム - Google Patents

情報処理装置、情報処理装置の制御方法、及びプログラム Download PDF

Info

Publication number
JP7483367B2
JP7483367B2 JP2019227570A JP2019227570A JP7483367B2 JP 7483367 B2 JP7483367 B2 JP 7483367B2 JP 2019227570 A JP2019227570 A JP 2019227570A JP 2019227570 A JP2019227570 A JP 2019227570A JP 7483367 B2 JP7483367 B2 JP 7483367B2
Authority
JP
Japan
Prior art keywords
test substance
information
learning model
sample
spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019227570A
Other languages
English (en)
Other versions
JP2020101543A (ja
Inventor
英孝 河村
彰大 田谷
泰 吉正
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of JP2020101543A publication Critical patent/JP2020101543A/ja
Application granted granted Critical
Publication of JP7483367B2 publication Critical patent/JP7483367B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8693Models, e.g. prediction of retention times, method development and validation
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/33Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using ultraviolet light
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/3577Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing liquids, e.g. polluted water
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/65Raman scattering
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N23/00Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00
    • G01N23/02Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00 by transmitting the radiation through the material
    • G01N23/06Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00 by transmitting the radiation through the material and measuring the absorption
    • G01N23/083Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00 by transmitting the radiation through the material and measuring the absorption the radiation being X-rays
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N23/00Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00
    • G01N23/20Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00 by using diffraction of the radiation by the materials, e.g. for investigating crystal structure; by using scattering of the radiation by the materials, e.g. for investigating non-crystalline materials; by using reflection of the radiation by the materials
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N23/00Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00
    • G01N23/22Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00 by measuring secondary emission from the material
    • G01N23/223Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00 by measuring secondary emission from the material by irradiating the sample with X-rays or gamma-rays and by measuring X-ray fluorescence
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/62Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating the ionisation of gases, e.g. aerosols; by investigating electric discharges, e.g. emission of cathode
    • G01N27/622Ion mobility spectrometry
    • G01N27/623Ion mobility spectrometry combined with mass spectrometry
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2201/00Features of devices classified in G01N21/00
    • G01N2201/12Circuits of general importance; Signal processing
    • G01N2201/129Using chemometrical methods
    • G01N2201/1296Using chemometrical methods using neural networks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8624Detection of slopes or peaks; baseline correction
    • G01N30/8631Peaks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions

Landscapes

  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Pathology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Electrochemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Toxicology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)
  • Biomedical Technology (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Biophysics (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)

Description

本発明は、情報処理装置、情報処理装置の制御方法、及びプログラムに関する。
様々な試料中に含まれる特定成分(以下、被検物質という。)の濃度や量を知る方法としてスペクトル解析が広く用いられている。スペクトル解析では、試料に何らかの刺激を与えた際の応答を検出し、得られた信号をもとに試料を構成する成分に関する情報(スペクトル情報)を得ることができる。刺激や応答を特徴づける、光を含む電磁波の強度の他、温度、質量、そして特定の質量をもった破片のカウント数がスペクトル情報である。刺激として電子衝突を用いて、分解によって生じた破片の質量に対しその量を記録し構造などの情報を得ることもスペクトル解析には含まれる。
スペクトル解析の中にはあらかじめ構成成分間の立体的な大きさや、電荷、親・疎水性の違いを利用し、分離を試みた後に電磁波を照射して解析を行う方法もある。これは分離分析と呼ばれる。例えば液体クロマトグラフィー(以下、HPLCという。)では、カラム種や移動相種、そして温度や流速などの分析条件を最適化することにより被検物質とその他の物質(以下、夾雑物という。)を分離する。そして、分離した被検物質のスペクトルを計測する事で濃度や量を知る事ができる。また、夾雑物との分離が困難な場合は、予め夾雑物の一部を取り除く前処理を行ったり、分離条件の最適化検討を行ったりする場合もある。前処理や分離条件の最適化でも夾雑物との分離ができない場合は、演算処理によるピーク分割が試みられる。
従来のピーク分割法としては、ベースラインを設ける方法や、ピーク間の極小値を利用して垂直に分割する方法、特許文献1及び特許文献2に記載されたガウス関数など適当な関数を、最小二乗法を用いてフィッティングし分割する方法がある。
ここで、生体由来のサンプルの分析にはHPLCが使われることが多い。しかし、尿や血液など生体由来のサンプルでは夾雑物が多いことや、摂取物由来の未知の夾雑物が含まれるケースがあることから、被検物質を夾雑物から分離する為の分離条件検討や前処理、ピーク分割法等に習熟した操作者が必要になる。
その他、食品の残留の農薬分析や、環境分析夾雑物等も試料に夾雑物が多く含まれるケースは多々ある。そのため初心者でも前処理が必要なく簡便にかつ精度よく夾雑物のサンプル中の被検物質を分析できる方法が強く望まれていた。
特開平6-324029号公報 特開2006-177980号公報 特開2018-152000号公報
上記の通り、従来、スペクトル情報から被検物質の濃度や量といった定量的な情報を得るためには、夾雑物を分離するための前処理や、ピーク分割法などの演算処理が必要である。そこで、ユーザは被検物質を含む試料のスペクトル情報を基にした学習モデルを利用し、定量的な情報を算出することが考えられる。ユーザは経験などに基づき、この算出結果が正確であるかを判定し、算出結果に不安が残る場合は分析条件や前処理を変え、再び分析から算出の流れを繰り返す。そのため、例え不正確な算出結果であっても算出値をそのまま採用してしまったり、反対に不要な再分析を行ってしまったりすることがあった。
本発明は、学習モデルを用いて推定された、被検物質の定量的な情報に対するユーザの判断を補助することを目的とする。
なお、前記目的に限らず、後述する発明を実施するための形態に示す各構成により導かれる作用効果であって、従来の技術によっては得られない作用効果を奏することも本明細書の開示の他の目的の1つとして位置付けることができる。
本発明に係る情報処理装置は、以下の構成を備える。すなわち、情報処理装置は、被検物質と夾雑物とを含む試料のスペクトル情報を学習モデルに入力することにより推定された、前記被検物質の定量的な情報を取得する情報取得手段と、前記取得された、前記被検物質の定量的な情報に関する信頼度を取得する信頼度取得手段と、を有することを特徴とする。
学習モデルを用いて推定された、被検物質の定量的な情報に対するユーザの判断を補助することが可能になる。
第1の実施形態に係る情報処理装置を含む情報処理システムの全体構成の一例を示す図である。 第1の実施形態における、学習モデルの生成に関する処理手順のフローチャートの一例を示す図である。 第1の実施形態における、信頼度を取得する処理手順のフローチャートの一例を示す図である。 第1の実施形態における、試料のスペクトル情報の一例を示す図である。 第1の実施形態における、Δ値と相関係数の対応関係の一例を示す図である。 第1の実施形態における、被検物質の定量的な情報と信頼度とを表示する画面の一例を示す図である。 第2の実施形態に係る情報処理装置を含む情報処理システムの全体構成の一例を示す図である。 第2の実施形態における、クラス分類学習モデルを説明するための図である。 実施例1から実施例3のシミュレーション結果を示す図である。
以下に、図面を参照しながら、本発明を実施するための形態(実施形態)について説明する。但し、本発明の範囲は以下で説明する各実施形態に限定されるものではない。
<第1の実施形態>
まず、第1の実施形態を説明するにあたり、用語の説明を行う。
(試料)
本実施形態における試料とは、複数種類の化合物を含み構成される混合物である。本実施形態では、試料には被検物質とその他の物質(夾雑物)とが含まれているものとする。試料は混合物であれば、特に限定されない。また、混合物の成分が特定されている必要はなく、未知の成分が含有されていてもよい。例えば、血液、尿、唾液等の生体由来の混合物でも良いし、飲食物でもよい。生体由来のサンプルの分析はサンプル提供者の栄養や健康状態を知るための手がかりを含むため、その分析は医学的にも栄養学的にも価値がある。例えば尿中ビタミンB3は糖質、脂質、タンパク質の代謝、エネルギー産生に関与しているため、その尿中代謝物であるN1-メチル-2-ピリドン-5-カルボキサミドの測定は健康維持のための栄養指導に役立つ。
(被検物質)
本実施形態における被検物質とは、試料中に含まれる1つ以上の既知の成分である。例えば、タンパク質、DNA、ウイルス、菌類、水溶性ビタミン類、脂溶性ビタミン類、有機酸類、脂肪酸類、アミノ酸類、糖類、農薬、環境ホルモンで構成される群から選択される少なくとも一種である。
例えば、栄養素の量を知りたいのであれば被検物質としては、チアミン(ビタミンB1)、リボフラビン(ビタミンB2)、ビタミンB3代謝物であるN1-メチルニコチンアミド、N1-メチル-2-ピリドン-5-カルボキサミド、ビタミンB6代謝物である4-ピリドキシン酸などある。ほかに、N1-メチル-4-ピリドン-3-カルボキサミド、パントテン酸(ビタミンB5)、ピリドキシン(ビタミンB6)、ビオチン(ビタミンB7)、プテロイルモノグルタミン酸(ビタミンB9)、シアノコバラミン(ビタミンB12)、アスコルビン酸(ビタミンC)等の水溶性ビタミンがある。ほかに、L-トリプトファン、リシン、メチオニン、フェニルアラニン、トレオニン、バリン、ロイシン、イソロイシン、L-ヒスチジン等のアミノ酸がある。ほかに、ナトリウム、カリウム、カルシウム、マグネシウム、リン等のミネラル、が挙げられる。
(定量的な情報)
本実施形態における定量的な情報とは、被検物質が試料に含まれる量、被検物質が試料に含まれる濃度、試料中の被検物質の有無で構成される群から選択される少なくとも一つである。また、被検物質の基準量に対して試料に含まれる濃度又は量の比率、被検物質の試料に含まれる量又は濃度の比率で構成される群から選択される少なくとも一つである。
(スペクトル情報)
本実施形態におけるスペクトル情報とは、クロマトグラム、光電子スペクトル、赤外線吸収スペクトル(IRスペクトル)、核磁気共鳴スペクトル(NMRスペクトル)、蛍光スペクトル、蛍光X線スペクトル、紫外/可視吸収スペクトル(UV/Visスペクトル)、ラマンスペクトル、原子吸光スペクトル、フレーム発光スペクトル、発光分光スペクトル、X線吸収スペクトル、X線回折スペクトル、常磁性共鳴吸収スペクトル、電子スピン共鳴スペクトル、質量スペクトル、熱分析スペクトルで構成される群から選択される少なくとも一種である。
次に、図1を用いて、本実施形態における情報処理システムを説明する。図1は、第1の実施形態に係る情報処理装置を含む情報処理システムの全体構成を示す図である。
情報処理システムは、情報処理装置10とデータベース22と分析装置23とを含んでいる。情報処理装置10とデータベース22とは、通信手段を介して互いに通信可能に接続されている。本実施形態においては、通信手段はLAN(Local Area Network)21で構成される。また、情報処理装置10と分析装置23とは、USB(Universal Serial Bus)等の規格の通信手段で接続されている。なお、LANは有線LANでも無線LANでもよいし、WANであってもよい。また、USBはLANであってもよい。
データベース22は、分析装置23による分析によって取得されたスペクトル情報を管理する。また、データベース22は、後述する学習モデル生成部42により生成された学習モデル(学習済みモデル)を管理する。情報処理装置10は、データベース22で管理されたスペクトル情報や学習モデルを、LAN21を介して取得する。
本実施形態における学習モデルとは、回帰学習モデルであり、深層学習などの機械学習によって生成されたものを用いることができる。機械学習アルゴリズムに教師データを用いて学習を行い、適切な予測が行えるように構築したものをここでは学習モデルと呼ぶ。学習モデルに用いる機械学習アルゴリズムには様々な種類がある。例えば、ニューラルネットワークを用いた深層学習を使うことができる。ニューラルネットワークは入力層、出力層、複数の隠れ層から構成され、各層は活性化関数と呼ばれる計算式で結合されている。ラベル(入力に対応する出力)付き教師データを用いる場合、入力と出力の関係が成り立つように活性化関数の係数を決定していく。複数の教師データを用いて係数を決定して行くことで、高い精度で入力に対する出力を予測できる学習モデルを生成する事ができる。
分析装置23は、試料や被検物質等を分析するための装置である。分析装置23は、分析手段の一例に相当する。なお、前述したように、本実施形態では、情報処理装置10と分析装置23とが通信可能に接続されている。しかし、情報処理装置10の内部に分析装置23を備える形態であってもよいし、分析装置23の内部に情報処理装置10を備える形態であってもよい。更に、不揮発メモリなどの記録媒体を介して分析結果(スペクトル情報)を分析装置23から情報処理装置10へ受け渡す形態でもよい。
本実施形態における分析装置23は、スペクトル情報を取得できるものであれば限定されず、化学的な分析手法や、物理的な分析手法を用いた装置を利用できる。本実施形態において、化学的な分析手法を用いた装置は、例えば、液体クロマトグラフィーやガスクロマトグラフィー等のクロマトグラフィー、及びキャピラリー電気泳動法で構成される群から選択される少なくとも一種の手法を用いる。本実施形態において、物理的な分析手法を用いた装置は、例えば、光電子分光法、赤外吸収分光法、核磁気共鳴分光法、蛍光分光法、蛍光X線分光法、可視・紫外線吸収分光法、ラマン分光法、原子吸光法、フレーム発光分光法、発光分光法、X線吸収分光法、X線回折法、常磁性共鳴吸収等を利用した電子スピン共鳴分光法、質量分析法、熱分析法で構成される群から選択される少なくとも一種の手法を用いる。
例えば、液体クロマトグラフィーを用いた装置では移動相容器、送液ポンプ、試料注入部、カラム、検出器、A/D変換機を備える。検出器は紫外線や可視光線、赤外線などを用いた電磁波検出器をはじめ、電気化学検出器、イオン検出器等が用いられる。この場合、得られるスペクトル情報は時間に対する検出器からの出力強度となる。
情報処理装置10は、その機能的な構成として、通信IF31、ROM32、RAM33、記憶部34、操作部35、表示部36、制御部37を具備する。
通信IF(Interface)31は、例えば、LANカード及びUSBのインターフェースカードで実現される。通信IF31は、LAN21とUSBを介した外部装置(例えば、データベース22と分析装置23)と情報処理装置10との間の通信を司る。ROM(Read Only Memory)32は、不揮発性のメモリ等で実現され、各種プログラム等を記憶する。RAM(Random Access Memory)33は、揮発性のメモリ等で実現され、各種情報を一時的に記憶する。記憶部34は、例えば、HDD(Hard Disk Drive)等で実現され、各種情報を記憶する。操作部35は、例えば、キーボードやマウス等で実現され、ユーザからの指示を装置内に入力する。表示部36は、例えば、ディスプレイ等で実現され、各種情報をユーザに向けて表示する。操作部35や表示部36は、制御部37からの制御によりGUI(Graphical User Interface)としての機能を提供する。
制御部37は、例えば、少なくとも1つのCPU(Central Processing Unit)等で実現され、情報処理装置10における処理を統括制御する。制御部37は、その機能的な構成として、スペクトル情報取得部41、学習モデル生成部42、学習モデル取得部43、推定部44、情報取得部45、信頼度取得部46、表示制御部47を具備する。
スペクトル情報取得部41は、被検物質と夾雑物とを少なくとも含む試料の分析結果、具体的には試料のスペクトル情報を分析装置23から取得する。なお、あらかじめ分析結果が格納されたデータベース22から、試料のスペクトル情報を取得してもよい。また、同様に被検物質のスペクトル情報を取得する。この被検物質のスペクトル情報は、被検物質が単一で存在した場合のスペクトル情報である。そして、スペクトル情報取得部41は、取得した試料のスペクトル情報を、推定部44と信頼度取得部46に出力する。また、取得した被検物質のスペクトル情報を学習モデル生成部42と信頼度取得部46に出力する。
学習モデル生成部42は、スペクトル情報取得部41が取得した被検物質のスペクトル情報を用いて教師データを生成する。そして、学習モデル生成部42は、教師データを用いて深層学習を実行し、学習モデルを生成する。教師データの生成及び学習モデルの生成に関する詳細な説明は、後述する。そして、学習モデル生成部42は、生成した学習モデルを学習モデル取得部43へ出力する。なお、学習モデル生成部42は、生成した学習モデルをデータベース22へ出力してもよい。
学習モデル取得部43は、学習モデル生成部42が生成した学習モデルを取得する。なお、学習モデルがデータベース22に格納されている場合には、学習モデル取得部43は、データベース22から学習モデルを取得する。そして、学習モデル取得部43は、取得した学習モデルを推定部44へ出力する。
推定部44は、学習モデル取得部43が取得した学習モデルに、スペクトル情報取得部41が取得した試料のスペクトル情報を入力することにより、試料に含まれる被検物質の定量的な情報を学習モデルに推定させる。そして、推定部44は、推定された定量的な情報を、情報取得部45へ出力する。推定部44は、試料のスペクトル情報を学習モデルに入力することにより、被検物質の定量的な情報を推定する推定手段の一例に相当する。
情報取得部45は、学習モデルが推定した定量的な情報を取得する。すなわち、情報取得部45は、被検物質と夾雑物とを含む試料のスペクトル情報を学習モデルに入力することにより推定された、前記被検物質の定量的な情報を取得する情報取得手段の一例に相当する。そして、情報取得部45は、取得した定量的な情報を表示制御部47へ出力する。
信頼度取得部46は、情報取得部45が取得した、被検物質の定量的な情報に関する信頼度を取得する。すなわち、信頼度取得部46は、前記取得された、前記被検物質の定量的な情報に関する信頼度を取得する信頼度取得手段の一例に相当する。本実施形態における信頼度とは、学習モデルによって推定された被検物質の定量的な情報をどの程度信頼してよいのかを示す指標である。信頼度の取得に関する詳細な説明は後述する。そして、信頼度取得部46は、取得した信頼度を表示制御部47へ出力する。
表示制御部47は、情報取得部45が取得した定量的な情報と、信頼度取得部46が取得した信頼度とを表示部36に表示させる。表示制御部47は、表示制御手段の一例に相当する。
なお、制御部37が具備する各部の少なくとも一部は、独立した装置として実現してもよい。また、夫々が機能を実現するソフトウェアとして実現してもよい。この場合、機能を実現するソフトウェアは、クラウドをはじめとするネットワークを介したサーバ上で動作してもよい。本実施形態では各部はローカル環境におけるソフトウェアにより夫々実現されているものとする。
また、図1に示す情報処理システムの構成はあくまで一例である。例えば、情報処理装置10の記憶部34がデータベース22の機能を具備し、記憶部34が各種情報を保持してもよい。
次に図2~図6を用いて、本実施形態における処理手順を説明する。
図2は、学習モデルの生成に関する処理手順のフローチャートである。
(S201)(被検物質単体を分析)
ステップS201では、分析装置23は、被検物質単体を分析し、被検物質のスペクトル情報を取得する。分析条件は、感度や分析時間などの観点から適宜選択すればよい。その際、分析装置23は、被検物質の濃度を何通りか変化させて分析する。どの程度の数が必要であるかは、物質の性質などによっても異なるが、一般的に3点以上変化させることが望ましい。被検物質が複数種類ある場合は、被検物質ごとにそれぞれ分析することが望ましいが、被検物質同士の信号が十分分離できている場合は、同時に分析してもよい。そして、分析装置23は、取得したスペクトル情報を情報処理装置10に出力する。情報処理装置10は分析装置23からスペクトル情報を受信し、RAM33又は記憶部34に保持する。スペクトル情報取得部41は、こうして保持されたスペクトル情報を取得する。なお、前述したように、分析結果であるスペクトル情報は、データベース22が保持してもよい。この場合、スペクトル情報取得部41は、データベース22からスペクトル情報を取得する。また、分析装置23が被検物質を分析するタイミングは、ステップS202における教師データの生成よりも前に実行されれば、どのようなタイミングであってもよい。
(S202)(教師データを生成)
ステップS202では、学習モデル生成部42は、スペクトル情報取得部41が取得した、被検物質のスペクトル情報を用いて、複数の教師データを生成する。教師データの生成方法について、具体的に説明する。教師データは、被検物質のスペクトル情報に乱数で生成した任意の波形を加算することで生成される。例えば、液体クロマトグラフィーでは、スペクトル情報(クロマトグラム)が示す波形はガウス分布であることが多い。そのため、学習モデル生成部42は、ピークの高さ、中央値、標準偏差を乱数で決定した複数のガウス曲線(ガウス関数)を足し合わせて、複数のランダムノイズを生成する。
スペクトル情報は、リテンションタイム(試料の注入からある化合物が検出器で検出されるまでに要する時間)全域に渡って用意する必要はない。被検物質のピークを中央にしてトリミングしたデータを用意すればよい。トリミングする範囲が広いほど、後の算出部で定量する際の精度は上がるが、精度を上げるのに必要となる教師データの数は増える。トリミングする範囲は、被検物質ピークの標準偏差(σ)の6倍以上30倍以下であることが好ましく、10倍以上20倍以下であることがより好ましく、14倍以上18倍以下であることがさらに好ましい。
次に、トリミングしたデータに任意の波形を加算する。加算する波形の数は、クロマトグラム上で分離できずピークが重複してしまう可能性のある数であることが好ましいが、通常は2個以上8個以下であることが好ましい。加算する波形の数が8個を超えると、被検物質のピークの形状予測が難しくなり、定量精度が低下する場合がある。加算する波形の数が2個未満であると、ピークが重複しているクロマトグラムに対して精度よく定量できない場合がある。加算する波形の数は、3個以上6個以下であることがより好ましく、4個以上5個以下であることがさらに好ましい。任意の波形の形状は、下記式1に示すガウス関数とする。
Figure 0007483367000001
ここで、aは、想定される被検物質のピーク高さに対して0からα%の値、bは、トリミングした範囲に対してβ%までの値の範囲で乱数によって決定する。例えば、被検物質のピーク中央に対して±8σの範囲をトリミングした場合、bは、-8σ×β%から+8σ×β%の範囲の任意の値である。α及びβは、50以上300以下であることが好ましく、50以上250以下であることがより好ましく、50以上200以下であることがさらに好ましい。cは、被検物質ピークの標準偏差の好ましくは0.1倍以上10倍以下、より好ましくは0.2倍以上8倍以下、さらに好ましくは0.5倍以上5倍以下の範囲で乱数によって決定する。
学習モデル生成部42は、この複数のランダムノイズそれぞれと被検物質のスペクトル情報が示す波形とを足し合わせた複数の波形を生成する。こうして生成された複数の波形は、被検物質と夾雑物とを含む仮想的な試料のスペクトル情報(学習用スペクトル情報)として用いられる。つまり、生成された複数のスペクトル情報を、教師データを構成する入力データとして決定する。更に、学習モデル生成部42は、生成されたスペクトル情報の基となった、被検物質のスペクトル情報から特定されるピークの高さ(定量的な情報)を、教師データを構成する正解データとして決定する。このようにして、学習モデル生成部42は、入力データと正解データの組である複数の教師データを生成する。そして、ステップS201において、学習モデル生成部42は、被検物質の濃度に応じたスペクトル情報を取得しているので、この濃度ごとに複数の教師データを生成する。なお、クロマトグラムの波形は、リテンションタイムが大きくなるにつれて、ピークの幅が大きくなる傾向にあることを踏まえて、学習モデル生成部42は、生成する波形の幅を広くしてもよい。
特許文献3では検体のマススペクトルデータを癌の有無と紐付けて機械学習させる方法が開示されている。しかし、機械学習の精度を上げる為には多量の教師データを必要とする。特許文献3では教師データとして9万種のデータを用意している。つまり、機械学習は複雑な分析結果に対して精度良く解析できるが、多量の教師データを用意する必要がある点が難点である。本実施形態では、機械学習の難点である教師データを多量に用意する必要がないため、ユーザの負担を軽減することができる。
なお、このようにして教師データを生成したが、複数の試料を分析装置23で分析することで、学習用の試料のスペクトル情報を取得し、被検物質の定量的な情報と併せて教師データとしてもよい。また、前述した方法とは異なる方法で、仮想的な試料のスペクトル情報を生成してもよい。
(S203)(学習モデルを生成)
ステップS203では、学習モデル生成部42は、ステップS202で濃度ごとに生成した複数の教師データを用いて、所定のアルゴリズムに従った機械学習を実施することにより、学習モデルを生成する。本実施形態では、所定のアルゴリズムとして、ニューラルネットワークを用いる。学習モデル生成部42は、複数の教師データを用いてニューラルネットワークに学習をさせることにより、試料のスペクトル情報の入力に基づいて、試料に含まれる被検物質の定量的な情報を推定する学習モデルを生成する。なお、ニューラルネットワークの学習方法は、周知技術であるため、本実施形態では詳細な説明を省略する。また、所定のアルゴリズムとして、例えば、SVM(サポートベクターマシン)、DNN(ディープニューラルネットワーク)、CNN(コンボリューショナルニューラルネットワーク)等を用いてもよい。被検物質が複数種類ある場合は、それぞれの物質に対して学習モデルを構築する。そして、学習モデル生成部42は、RAM33、記憶部34、又はデータベース22に、生成した学習モデルを格納する。
以上のようにして、試料のスペクトル情報に基づいて、試料に含まれる被検物質の定量的な情報を推定する学習モデルを生成する。
次に、信頼度を取得する方法について、説明する。図3は、信頼度を取得する処理手順を示すフローチャートである。
(S301)(試料を分析)
ステップS301では、分析装置23は、目的の試料を分析し、試料のスペクトル情報を取得する。分析条件は、前述したステップS201と同一の条件とする。そして、分析装置23は、取得したスペクトル情報を情報処理装置10に出力する。情報処理装置10は分析装置23からスペクトル情報を受信し、RAM33又は記憶部34に保持する。スペクトル情報取得部41は、こうして保持されたスペクトル情報を取得する。なお、前述したように、分析結果であるスペクトル情報は、データベース22が保持してもよい。この場合、スペクトル情報取得部41は、データベース22からスペクトル情報を取得する。また、分析装置23が試料を分析するタイミングは、ステップS302における定量的な情報の推定よりも前に実行されれば、どのようなタイミングであってもよい。
(S302)(定量的な情報を推定)
ステップS302では、学習モデル取得部43は、RAM33、記憶部34、又はデータベース22に格納された学習モデルを取得する。そして、推定部44は、取得された学習モデルに、ステップS301で取得された試料のスペクトル情報を入力することにより、試料に含まれる被検物質の定量的な情報を推定させる。また、必要に応じて、推定部44は、推定された定量的な情報を、表示部36において表示する形式に換算する。表示部36において表示する形式としては、g/L、mol/Lなどの濃度でもよいし、基準量(標準量)に対する割合でもよい。学習モデルにより推定される値がこれらの表示形式であれば、換算する必要はない。そして、情報取得部45は、推定された定量的な情報を推定部44から取得し、RAM33又は記憶部34に格納する。
このように、被検物質のピークと夾雑物のピークが完全に分離できていなくても機械学習で得られる学習モデルを利用することで、分析に関する複雑で高度な知識が無くても精度よく被検物質の定量的な情報を得ることができる。
その結果、熟練者でなくとも簡易に高精度で被検物質の定量分析を行うことができる。
(S303)(信頼度を取得)
ステップS303では、信頼度取得部46は、ステップS302で推定された定量的な情報に関する信頼度を取得する。信頼度の取得方法について、具体的に説明する。
信頼度取得部46は、スペクトル情報取得部41が出力した、被検物質のスペクトル情報を取得する。そして、信頼度取得部46は、この被検物質のスペクトル情報から特定されるピーク(第1のピーク)のリテンションタイム(第1のリテンションタイム)を特定する。次に、信頼度取得部46は、スペクトル情報取得部41が出力した、試料のスペクトル情報を取得する。そして、信頼度取得部46は、試料のスペクトル情報から、第1のピークのリテンションタイムに最近接のリテンションタイムを有するピーク(第2のピーク)を特定する。信頼度取得部46は、こうして特定された第1のピークのリテンションタイムと、第2のピークのリテンションタイムとの間の時間差を算出し、算出した時間差をΔ値とする。または、被検物質のスペクトル情報における半値全幅の中央部のリテンションタイムと、試料のスペクトル情報の第2のピークにおける半値全幅の中央部のリテンションタイムとの時間差を、Δ値としても良い。
図4(a)は、スペクトル情報取得部41から取得した、試料のスペクトル情報401を示す。図4に示す試料のスペクトル情報401はクロマトグラムであり、縦軸が信号強度を示し、横軸がリテンションタイムを示している。スペクトル情報401のうち、402に示す範囲を抽出したものが図4(b)である。図4(b)では、説明のため、更に同一範囲の被検物質のスペクトル情報403を重ねて表示している。信頼度取得部46は、被検物質のスペクトル情報403から第1のピーク404を特定する。そして、この第1のピークのリテンションタイムに最近接のリテンションタイムを有する第2のピーク405を特定する。この第1のピークのリテンションタイムと、第2のピークのリテンションタイムとの時間差406がΔ値となる。
次に、信頼度取得部46は、算出されたΔ値と同じΔ値を持つ、被検物質と夾雑物とを含む仮想的な試料のスペクトル情報を複数生成する。この生成方法は、ステップS202で説明した方法と同様である。そして、信頼度取得部46は、生成した複数のスペクトル情報をステップS302で取得された学習モデルに入力し、仮想的な試料に含まれる被検物質の定量的な情報を、生成されたスペクトル情報ごとに推定する。ここでは、この推定された定量的な情報を、推定値と称する。また、仮想的な試料のスペクトル情報の生成で用いた被検物質のスペクトル情報から特定されるピークの高さ(定量的な情報)を、正解値と称する。信頼度取得部46は、この複数の推定値と正解値との間の相関係数を算出し、算出された相関係数を、ステップS302で推定された定量的な情報に関する信頼度とする。信頼度取得部46は、このようにして算出された信頼度を取得し、RAM33又は記憶部34に格納する。
なお、本実施形態では、ステップS303において相関係数を算出したが、あらかじめΔ値ごとに相関係数を算出しておいてもよい。図5は、Δ値ごとに相関係数を算出した結果を示す図である。あらかじめ相関係数を算出しておく場合には、信頼度取得部46は、第1のピークのリテンションタイムと、第2のピークのリテンションタイムとの間の時間差(Δ値)と同一の値を図5のΔ値の列から検索する。信頼度取得部46は、検索した結果、同一の値が見つかったら、その値に対応する相関係数を相関係数の列から取得し、この取得した相関係数を信頼度とする。なお、同一の値が見つからなかった場合には、信頼度取得部46は、算出されたΔ値に最も近い値を図5のΔ値の列から特定すればよい。
(S304)(定量的な情報と信頼度を表示)
ステップS304では、表示制御部47は、ステップS302で学習モデルにより推定された、試料に含まれる被検物質の定量的な情報と、ステップS303で算出された信頼度とを、表示部36に表示させる。その際、グラフ形式や表形式に整理して表示してもよい。図6に、表示部36に表示された画面(ウィンドウ)の一例を示す。さらに、“高い”や“低い”など信頼度の数値に応じ、そのレベルを表示してもよい。また、算出された信頼度が所定の閾値よりも高い場合は、推定された定量的な情報に関する、色や文字の太さや文字の大きさ等の表示形態を変更してもよい。算出された信頼度が所定の閾値よりも低い場合も同様である。
このように、推定された定量的な情報に関する信頼度をユーザに提示することで、学習モデルによって推定された被検物質の定量的な情報をどの程度信頼してよいのかをユーザが判断しやすくなる。すなわち、学習モデルを用いて推定された、被検物質の定量的な情報に対するユーザの判断を補助することが可能になる。
<第2の実施形態>
次に、第2の実施形態を説明する。第1の実施形態では、推定値と正解値との間の相関係数を信頼度とした。第2の実施形態では、クラス分類学習モデルにより推定される分類確率を信頼度とする。
図7は、第2の実施形態における情報処理システムの全体構成を示す図である。以下の機能部を除き、第2の実施形態における情報処理システムの全体構成、情報処理装置10のハードウェア構成及び機能構成は、第1の実施形態と同一であるため、説明を省略する。
スペクトル情報取得部41は、被検物質と夾雑物とを少なくとも含む試料の分析結果、具体的には試料のスペクトル情報を分析装置23から取得する。なお、あらかじめ分析結果が格納されたデータベース22から、試料のスペクトル情報を取得してもよい。また、同様に被検物質のスペクトル情報を取得する。この被検物質のスペクトル情報は、被検物質が単一で存在した場合のスペクトル情報である。そして、スペクトル情報取得部41は、取得した試料のスペクトル情報を、推定部44に出力する。また、取得した被検物質のスペクトル情報を学習モデル生成部42に出力する。
学習モデル生成部42は、スペクトル情報取得部41が取得した被検物質のスペクトル情報を用いて教師データを生成する。そして、学習モデル生成部42は、教師データを用いて深層学習を実行し、学習モデルを生成する。第2の実施形態で生成される学習モデルは、クラス分類学習モデルである。図8に示すように、出力層のノードが複数あり、各ノードが被検物質の定量的な情報を示すクラスに相当する。そして、その出力層の各ノードの出力値が分類確率を示している。教師データの生成及び学習モデルの生成に関する詳細な説明は、第1の実施形態において説明した通りである。そして、学習モデル生成部42は、生成した学習モデルを学習モデル取得部43へ出力する。なお、学習モデル生成部42は、生成した学習モデルをデータベース22へ出力してもよい。
推定部44は、学習モデル取得部43が取得した学習モデルに、スペクトル情報取得部41が取得した試料のスペクトル情報を入力することにより、試料に含まれる被検物質の定量的な情報を学習モデルに推定させる。また、学習モデル取得部43は、推定された定量的な情報の分類確率も学習モデルに推定させる。そして、推定部44は、推定された定量的な情報を情報取得部45へ出力し、推定された分類確率を信頼度取得部46へ出力する。
信頼度取得部46は、情報取得部45が取得した、被検物質の定量的な情報に関する信頼度を取得する。本実施形態における信頼度とは、学習モデルにより推定された分類確率である。よって、推定部44から取得した分類確率を、定量的な情報に関する信頼度とする。信頼度取得部46は、取得した信頼度を表示制御部47へ出力する。
次に、第2の実施形態における処理手順について説明する。第2の実施形態における学習モデルの生成に関する処理手順は、以下の点以外は、図2に示すフローチャートと同様である。
ステップS203において、学習モデル生成部42が学習モデルを生成する際に、学習モデル生成部42は、クラス分類学習モデルを使用する。そのため、教師データを用いた学習では、正解データである定量的な情報に対応する、出力層のノードのうち最も出力値(分類確率)が大きい濃度の出力値を100%に近づけるように、学習モデルに学習させる。
第2の実施形態における信頼度の取得に関する処理手順は、以下の点以外は、図3に示すフローチャートと同様である。
ステップS302において、推定部44は、試料に含まれる被検物質の定量的な情報と、分類確率を学習モデルに推定させる。学習モデルからの出力値である分類確率が最も高いノードに対応する定量的な情報を、試料に含まれる被検物質の定量的な情報とする。そして、ステップS303において、信頼度取得部46は、推定された分類確率を信頼度として取得する。ステップS304では、表示制御部47は、ステップS302で学習モデルにより推定された、試料に含まれる被検物質の定量的な情報と、ステップS303で取得された信頼度とを、表示部36に表示させる。
このように、クラス分類学習モデルの分類確率を信頼度として採用してもよい。第2の実施形態も第1の実施形態と同様に、学習モデルを用いて推定された、被検物質の定量的な情報に対するユーザの判断を補助することが可能になる。
<その他の実施形態>
以上、実施形態を詳述したが、本発明は、システム、装置、方法、プログラム又は記憶媒体等としての実施態様をとることが可能である。具体的には、情報処理装置の機能を分散させることで複数の機器から構成されるシステムに本発明を適用してもよいし、一つの機器からなる装置に適用してもよい。また、本発明の機能および処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。また、本発明の範囲には、上述の実施例に示す機能および処理を実現するためのコンピュータプログラム自体も含まれる。また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどとの協働で実施形態の機能が実現されてもよい。この場合には、OSなどが、実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される。さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれて前述の実施形態の機能の一部或いは全てが実現されてもよい。なお本発明の範囲は上述した実施形態に限定されるものではない。上述した複数の実施形態のうち少なくとも二つを組み合わせることも可能である。
<実施例>
以下に、実施例および比較例を挙げて本発明をより詳細に説明する。なお、本発明は以下の実施例に限定されるものではない。実施例1~実施例3は、第1の実施形態に対応し、実施例4は、第2の実施形態に対応する。
(実施例1)
まず、上述したデータ処理の手法の効果を評価するために、該手法をシミュレーションデータに適用した例について説明する。
被検物質データ(被検物質のスペクトル情報)として、中央値=250、標準偏差=20、ピーク高さ=0.0から1.0まで0.1刻みの正規分布波形のデータを11種類用意した。
各被検物質データに対して、中央値、標準偏差、ピーク高さを乱数で設定した4つの正規分布波形を加算したものを試料データ(仮想的な試料のスペクトル情報)とした。試料データは1つの被検物質データに対して1000種類用意した。各試料データとそこに含まれる被検物質データのピーク高さを組にして11000の教師データとし、これを用いて機械学習を行い、回帰学習モデルを生成した。機械学習の手法として、全結合ニューラルネットワークを用い、活性化関数としてrelu関数、およびlinear関数を用いた。損失関数として平均二乗誤差を用い、最適化アルゴリズムにはAdamを用いた。十分な定量精度を得るには、100エポック程度の繰り返し演算が必要であった。
次に、試料データと同様の手法で作成した試料データを多数用意した。その中から被検物質データのピークの近傍に位置する、試料データのピークに注目した。そのピークの最大値をとるリテンションタイムと被検物質データのピークの最大値をとるリテンションタイムとを比較し、その時間差(Δ値)が25になる試料データを1100個選択した。これらの試料データを学習モデルに入力し、試料データに含まれる被検物質のピーク高さを求めた。図9は横軸が試料データ作成時に用いた被検物質のピーク高さ(正解値)、縦軸が学習モデルを用いて得られた被検物質のピーク高さ(推定値)である。図9(a)に示す通り、正解値と推定値との間の相関係数は0.99であり、この相関係数をΔ値が25になる試料データの信頼度とした。
(実施例2)
Δ値が20になる試料データを1100個選択し、これらを学習モデルに入力し、試料データに含まれる被検物質のピーク高さを求めたこと以外は実施例1と同様である。図9(b)に示す通り、相関係数は0.93であり、この値をΔ値が20になる試料データの信頼度とした。
(実施例3)
Δ値が15になる試料データを1100個選択し、これらを学習モデルに入力し、試料データに含まれる被検物質のピーク高さを求めたこと以外は実施例1や2と同様である。図9(c)に示す通り、相関係数は0.87であり、この値をΔ値が15になる試料データの信頼度とした。
(実施例4)
実施例1と同様に教師データを用意して機械学習を行い、クラス分類学習モデルを生成した。機械学習の手法として、全結合ニューラルネットワークを用い、活性化関数としてrelu関数、およびsoftmax関数を用いた。損失関数としてクロスエントロピーを用い、最適化アルゴリズムにはSGDを用いた。十分な定量精度を得るには、100エポック程度の繰り返し演算が必要であった。
試料データと同様の手法でデータを11個作成した。これらを学習モデルに入力し、試料データに含まれる被検物質のピーク高さを分類した。またそれぞれの分類値の分類確率を信頼度とした。
10 情報処理装置
21 LAN
22 データベース
23 分析装置
31 通信IF
32 ROM
33 RAM
34 記憶部
35 操作部
36 表示部
37 制御部
41 スペクトル情報取得部
42 学習モデル生成部
43 学習モデル取得部
44 推定部
45 情報取得部
46 信頼度取得部
47 表示制御部

Claims (16)

  1. 被検物質と夾雑物とを含む試料のスペクトル情報を学習モデルに入力することにより推定された、前記被検物質の定量的な情報を取得する情報取得手段と、
    前記取得された、前記被検物質の定量的な情報に関する信頼度を取得する信頼度取得手段と、を有し、
    前記信頼度は、前記被検物質のスペクトル情報に基づいて特定される、前記被検物質の定量的な情報と、前記学習モデルにより推定される、前記被検物質の定量的な情報との間の相関係数であることを特徴とする情報処理装置。
  2. 前記信頼度取得手段は、前記試料のスペクトル情報と、前記被検物質のスペクトル情報とを用いて、前記信頼度を取得することを特徴とする、請求項1に記載の情報処理装置。
  3. 前記スペクトル情報は、クロマトグラムであり、
    前記信頼度取得手段は、前記試料のスペクトル情報に基づいて特定されるリテンションタイムと、前記被検物質のスペクトル情報に基づいて特定されるリテンションタイムとを用いて、前記信頼度を取得することを特徴とする、請求項1に記載の情報処理装置。
  4. 前記取得された信頼度を表示部に表示させる表示制御手段を更に有することを特徴とする、請求項1乃至の何れか1項に記載の情報処理装置。
  5. 前記表示制御手段は、更に前記取得された前記被検物質の定量的な情報を前記表示部に表示させることを特徴とする、請求項に記載の情報処理装置。
  6. 前記学習モデルは、前記被検物質のスペクトル情報に基づいて生成された学習用スペクトル情報と、前記被検物質のスペクトル情報に基づいて特定される、前記被検物質の定量的な情報との複数の組を教師データとして用いて学習された学習モデルであることを特徴とする、請求項1乃至の何れか1項に記載の情報処理装置。
  7. 前記学習用スペクトル情報は、前記被検物質のスペクトル情報とランダムノイズとを用いて生成されることを特徴とする、請求項に記載の情報処理装置。
  8. 前記ランダムノイズは、複数のガウス関数の組み合わせによって得られる波形であることを特徴とする、請求項に記載の情報処理装置。
  9. 前記試料のスペクトル情報を前記学習モデルに入力することにより、前記被検物質の定量的な情報を推定する推定手段を更に有することを特徴とする、請求項1乃至の何れか1項に記載の情報処理装置。
  10. 前記スペクトル情報は、クロマトグラム、光電子スペクトル、赤外線吸収スペクトル、核磁気共鳴スペクトル、蛍光スペクトル、蛍光X線スペクトル、紫外/可視吸収スペクトル、ラマンスペクトル、原子吸光スペクトル、フレーム発光スペクトル、発光分光スペクトル、X線吸収スペクトル、X線回折スペクトル、常磁性共鳴吸収スペクトル、電子スピン共鳴スペクトル、質量スペクトル、及び熱分析スペクトルの少なくとも1つであることを特徴とする、請求項1に記載の情報処理装置。
  11. 前記試料のスペクトル情報を取得するための分析を行う分析手段を更に有することを特徴とする、請求項1又は10に記載の情報処理装置。
  12. 前記分析手段は、クロマトグラフィー、キャピラリー電気泳動法、光電子分光法、赤外吸収分光法、核磁気共鳴分光法、蛍光分光法、蛍光X線分光法、可視・紫外線吸収分光法、ラマン分光法、原子吸光法、フレーム発光分光法、発光分光法、X線吸収分光法、X線回折法、常磁性共鳴吸収を利用した電子スピン共鳴分光法、質量分析法、及び熱分析法の少なくとも1つを行うことを特徴とする請求項11に記載の情報処理装置。
  13. 前記被検物質は、タンパク質、DNA、ウイルス、菌類、水溶性ビタミン類、脂溶性ビタミン類、有機酸類、脂肪酸類、アミノ酸類、糖類、農薬、及び環境ホルモンの少なくとも1つであることを特徴とする、請求項1乃至12の何れか1項に記載の情報処理装置。
  14. 前記被検物質は、チアミン、リボフラビン、N1-メチルニコチンアミド、N1-メチル-2-ピリドン-5-カルボキサミド、4-ピリドキシン酸、N1-メチル-4-ピリドン-3-カルボキサミド、パントテン酸、ピリドキシン、ビオチン、プテロイルモノグルタミン酸、シアノコバラミン、及びアスコルビン酸の少なくとも1つであることを特徴とする、請求項1乃至13の何れか1項に記載の情報処理装置。
  15. 前記定量的な情報は、前記被検物質が前記試料に含まれる量、前記被検物質が前記試料に含まれる濃度、前記試料中の前記被検物質の有無、前記被検物質の基準量に対する前記試料に含まれる前記被検物質の濃度又は量の比率、前記被検物質が前記試料に含まれる量又は濃度の比率の少なくとも1つであることを特徴とする、請求項1乃至14の何れか1項に記載の情報処理装置。
  16. 被検物質と夾雑物とを含む試料のスペクトル情報を学習モデルに入力することにより推定された、前記被検物質の定量的な情報を取得する情報取得工程と、
    前記取得された、前記被検物質の定量的な情報に関する信頼度を取得する信頼度取得工程と、を有し、前記信頼度は、前記被検物質のスペクトル情報に基づいて特定される、前記被検物質の定量的な情報と、前記学習モデルにより推定される、前記被検物質の定量的な情報との間の相関係数であることを特徴とする情報処理方法。
JP2019227570A 2018-12-20 2019-12-17 情報処理装置、情報処理装置の制御方法、及びプログラム Active JP7483367B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018238829 2018-12-20
JP2018238829 2018-12-20

Publications (2)

Publication Number Publication Date
JP2020101543A JP2020101543A (ja) 2020-07-02
JP7483367B2 true JP7483367B2 (ja) 2024-05-15

Family

ID=71101751

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019227570A Active JP7483367B2 (ja) 2018-12-20 2019-12-17 情報処理装置、情報処理装置の制御方法、及びプログラム

Country Status (4)

Country Link
US (1) US20210311001A1 (ja)
JP (1) JP7483367B2 (ja)
CN (1) CN113196053A (ja)
WO (1) WO2020129895A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7469799B2 (ja) 2020-07-08 2024-04-17 東京都公立大学法人 計測装置および計測方法
KR102458523B1 (ko) * 2020-10-13 2022-10-25 서강대학교산학협력단 실리콘 광증배기 기반 광자 계수 엑스선 검출기의 에너지 스펙트럼 데이터 처리 방법 및 서버
KR102271995B1 (ko) * 2021-01-12 2021-07-05 국방과학연구소 인공 신경망을 이용한 지표면 화학 작용제 탐지 시스템
CN117980998A (zh) 2021-09-30 2024-05-03 富士胶片株式会社 学习用数据的获取方法、学习用数据获取***、软传感器的构建方法、软传感器、学习用数据
FR3136856A1 (fr) * 2022-06-21 2023-12-22 Commissariat A L'energie Atomique Et Aux Energies Alternatives Méthode de validation des prédictions d’un modèle supervisé d’analyse quantitative multivariée de données spectrales

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016004525A (ja) 2014-06-19 2016-01-12 株式会社日立製作所 データ分析システム及びデータ分析方法
WO2018117129A1 (ja) 2016-12-19 2018-06-28 株式会社ユカシカド 尿検査装置および尿検査方法
WO2019092837A1 (ja) 2017-11-09 2019-05-16 富士通株式会社 波形解析装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4468742A (en) * 1981-03-17 1984-08-28 The Regents Of University Of California Microprocessor system for quantitative chromatographic data analysis
JP3130139B2 (ja) * 1992-09-17 2001-01-31 株式会社日立製作所 クロマトグラム解析方法及びクロマトグラフ装置
JP3071085B2 (ja) * 1993-03-15 2000-07-31 株式会社日立製作所 クロマトグラム解析表示方法及びその装置
GB0016459D0 (en) * 2000-07-04 2000-08-23 Pattern Recognition Systems As Method
JP6136771B2 (ja) * 2013-08-30 2017-05-31 株式会社島津製作所 物質同定方法及び該方法を用いる質量分析装置
US10866222B2 (en) * 2015-11-05 2020-12-15 Shimadzu Corporation Chromatograph mass spectrometric data processing method and processing device
KR102497849B1 (ko) * 2016-05-09 2023-02-07 삼성전자주식회사 분석물질 농도 예측 방법 및 장치
CN106248844B (zh) * 2016-10-25 2018-05-04 中国科学院计算技术研究所 一种肽段液相色谱保留时间预测方法及***
CN108064341B (zh) * 2017-06-12 2020-05-12 深圳前海达闼云端智能科技有限公司 物质成分检测方法、装置和检测设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016004525A (ja) 2014-06-19 2016-01-12 株式会社日立製作所 データ分析システム及びデータ分析方法
WO2018117129A1 (ja) 2016-12-19 2018-06-28 株式会社ユカシカド 尿検査装置および尿検査方法
WO2019092837A1 (ja) 2017-11-09 2019-05-16 富士通株式会社 波形解析装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
多サンプルMS 高速定量解析ソフトウェア MS Quant Manager,日本,ライフィクス株式会社,2014年06月,https://ja.reifycs.com/files/BrochureMsQuantManager.pdf,検索日2019/07/24
金澤光洋、荻原淳,人工知能(AI)を用いたMSクロマトグラムピーク自動検出,第65回質量分析総合討論会講演要旨集,日本,日本質量分析学会,2017年05月01日,p.102

Also Published As

Publication number Publication date
CN113196053A (zh) 2021-07-30
WO2020129895A1 (ja) 2020-06-25
US20210311001A1 (en) 2021-10-07
JP2020101543A (ja) 2020-07-02

Similar Documents

Publication Publication Date Title
JP7483367B2 (ja) 情報処理装置、情報処理装置の制御方法、及びプログラム
Checa et al. Lipidomic data analysis: tutorial, practical guidelines and applications
Xi et al. Statistical analysis and modeling of mass spectrometry-based metabolomics data
Gorrochategui et al. ROIMCR: a powerful analysis strategy for LC-MS metabolomic datasets
WO2020105566A1 (ja) 情報処理装置、情報処理装置の制御方法、プログラム、算出装置、及び算出方法
Tran et al. Interpretation of variable importance in partial least squares with significance multivariate correlation (sMC)
Kenar et al. Automated label-free quantification of metabolites from liquid chromatography–mass spectrometry data
Farrés et al. Chemometric evaluation of Saccharomyces cerevisiae metabolic profiles using LC–MS
US20160216244A1 (en) Method and electronic nose for comparing odors
US11681778B2 (en) Analysis data processing method and analysis data processing device
Hendrickx et al. Reverse engineering of metabolic networks, a critical assessment
Petrick et al. AI/ML-driven advances in untargeted metabolomics and exposomics for biomedical applications
US20220252531A1 (en) Information processing apparatus and control method for information processing apparatus
Borgsmüller et al. WiPP: Workflow for improved peak picking for gas chromatography-mass spectrometry (GC-MS) data
Chen et al. Gas chromatography-ion mobility spectrometric classification of vegetable oils based on digital image processing
Percival et al. Univariate and multivariate statistical approaches to the analysis and interpretation of NMR-based metabolomics datasets of increasing complexity
US11841373B2 (en) Information processing apparatus, method for controlling information processing apparatus, and program
Damian et al. Applications of a new subspace clustering algorithm (COSA) in medical systems biology
CN112634997A (zh) 一种甾醇数据库建立及甾醇分析方法
Kristal et al. Metabolomics in the study of aging and caloric restriction
JP2020106340A (ja) 情報処理装置、情報処理装置の制御方法、及びプログラム
Hassani et al. Degrees of freedom estimation in principal component analysis and consensus principal component analysis
Chovancova et al. Quantitative metabolomics analysis of depression based on PLS-DA model
Ten-Doménech et al. Analysis of longitudinal metabolomic data using multivariate curve resolution-alternating least squares and pathway analysis
Toda et al. Comparison of classification accuracy and feature selection between sparse and non-sparse modeling of metabolomics data

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231121

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20231213

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240115

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240402

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240501

R150 Certificate of patent or registration of utility model

Ref document number: 7483367

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150