JP2020101524A - 情報処理装置、情報処理装置の制御方法、プログラム、算出装置、及び算出方法 - Google Patents

情報処理装置、情報処理装置の制御方法、プログラム、算出装置、及び算出方法 Download PDF

Info

Publication number
JP2020101524A
JP2020101524A JP2019208332A JP2019208332A JP2020101524A JP 2020101524 A JP2020101524 A JP 2020101524A JP 2019208332 A JP2019208332 A JP 2019208332A JP 2019208332 A JP2019208332 A JP 2019208332A JP 2020101524 A JP2020101524 A JP 2020101524A
Authority
JP
Japan
Prior art keywords
information
spectrum
test substance
sample
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019208332A
Other languages
English (en)
Inventor
彰大 田谷
Akihiro Taya
彰大 田谷
泰 吉正
Yasushi Yoshimasa
泰 吉正
河村 英孝
Hidetaka Kawamura
英孝 河村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of JP2020101524A publication Critical patent/JP2020101524A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24137Distances to cluster centroïds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/88Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86
    • G01N2030/8804Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86 automated systems
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/88Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86
    • G01N2030/8895Independent juxtaposition of embodiments; Reviews
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/88Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Chemical & Material Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Immunology (AREA)
  • Mathematical Physics (AREA)
  • Analytical Chemistry (AREA)
  • Pathology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)

Abstract

【課題】 従来、スペクトル情報から被検物質の情報を得るためには、夾雑物を分離するための前処理や、ピーク分割法などの演算処理が必要であった。【解決手段】 本発明に係る情報処理装置は、被検物質と夾雑物とを含む試料のスペクトル情報を学習モデルに入力することにより推定された、前記被検物質の定量的な情報を取得する情報取得手段を有することを特徴とする。【選択図】 図1

Description

本発明は、情報処理装置、情報処理装置の制御方法、プログラム、算出装置、及び算出方法に関する。
様々な試料中に含まれる特定成分(以下被検物質)の濃度や量を知る方法としてスペクトル解析が広く用いられている。スペクトル解析では、試料に何らかの刺激を与えた際の応答を検出し、得られた信号をもとに試料を構成する成分に関する情報(スペクトル情報)を得ることができる。刺激や応答を特徴づける、光を含む電磁波の強度の他、温度、質量、そして特定の質量をもった破片のカウント数がスペクトル情報である。刺激として電子衝突を用いて、分解によって生じた破片の質量に対しその量を記録し構造などの情報を得ることもスペクトル解析には含まれる。
スペクトル解析の中にはあらかじめ構成成分間の立体的大きさや、電荷、親・疎水性の違いを利用し、分離を試みた後に電磁波を照射して解析を行う方法もある。これは分離分析と呼ばれる。例えば液体クロマトグラフィー(以下HPLC)では、カラム種や移動相種、そして温度や流速などの分析条件を最適化することにより被検物質とその他の物質(以下、夾雑物と呼ぶ)を分離する。そして、分離した被検物質のスペクトルを計測する事で濃度や量を知る事ができる。また、夾雑物との分離が困難な場合は、予め夾雑物の一部を取り除く前処理を行う事や、分離条件の最適化検討を行う場合もある。前処理や分離条件の最適化でも夾雑物との分離ができない場合は、演算処理によるピーク分割が試みられる。
従来のピーク分割法としては、ベースラインを設ける方法(図5)や、ピーク間の極小値を利用して垂直に分割する方法(図6)、特許文献1や2に記載されたガウス関数など適当な関数を、最小二乗法を用いてフィッティングし分割する方法がある。
ここで、生体由来のサンプルの分析にはHPLCが使われることが多い。しかし、尿や血液など生体由来のサンプルでは夾雑物が多いことや、摂取物由来の未知の夾雑物が含まれるケースがあることから、被検物質を夾雑物から分離する為の分離条件検討や前処理、ピーク分割法等に習熟した操作者が必要になる。
その他、食品の残留の農薬分析や、環境分析夾雑物等も試料に夾雑物が多く含まれるケースは多々ある。そのため初心者でも前処理が必要なく簡便にかつ精度よく夾雑物のサンプル中の被検物質を分析できる方法が強く望まれていた。
特開平6−324029号公報 特開2006−177980号公報 特開2018−152000号公報
上記の通り、従来、スペクトル情報から被検物質の情報を得るためには、夾雑物を分離するための前処理や、ピーク分割法などの演算処理が必要であった。
上記課題を解決するために本発明の一態様に係る情報取得装置では、被検物質と夾雑物とを含む試料のスペクトル情報を学習モデルに入力することにより推定された、前記被検物質の定量的な情報を取得する情報取得手段を有し、前記学習モデルは、前記被検物質のスペクトル情報に基づいて生成された学習用スペクトル情報に基づいて生成されることを特徴とする。
さらに本発明の他の態様に係る情報処理装置の制御方法は、被検物質と夾雑物とを含む試料のスペクトル情報を学習モデルに入力することにより推定された、前記被検物質の定量的な情報を取得する情報取得工程を有し、前記学習モデルは、前記被検物質のスペクトル情報に基づいて生成された学習用スペクトル情報に基づいて生成されることを特徴とする。
上記課題を解決するために本発明の他の態様に係る算出装置は、被検物質を含む試料のスペクトル情報を受け付ける受付部と、前記被検物質のスペクトル情報に関する学習モデルを取得する取得部と、前記試料のスペクトル情報と、前記学習モデルとに基づき、前記被検物質の定量的な情報を算出する算出部とを有することを特徴とする。
さらに本発明の他の態様に係る算出方法は、被検物質を含む試料のスペクトル情報を受け付ける受付工程と、前記被検物質のスペクトル情報に関する学習モデルを取得する取得工程と、
前記試料のスペクトル情報と、前記学習モデルとに基づき、前記被検物質の定量的な情報を算出する算出工程とを有することを特徴とする。
本発明に係る情報処理装置及び算出装置によれば、夾雑物を分離するための前処理や、ピーク分割法などの演算処理をしなくても、スペクトル情報から被検物質について、精度の高い情報を得ることができる。
本発明の実施形態1に係る情報処理装置の概略ブロック図である。 本発明の実施形態1における、学習モデルの生成に関する処理手順のフローチャートの一例を示す図である。 本発明の実施形態1における、被検物質の定量情報を取得する処理手順のフローチャートの一例を示す図である。 本発明の実施形態1における、試料中の被検物質の量を算出処理する処理のフローチャートの一例を示す図である。 従来のベースラインを設けるピーク分割法の一例を示す図である。 従来のピーク間の極小値を利用して垂直に分割するピーク分割法の一例を示す図である。 本発明の実施形態2に係る算出装置の概略ブロック図である。 本発明の実施形態2における、試料中の被検物質の量を算出する処理のフローチャートの一例を示す図である。 本発明の実施例1における、被検物質3種類を含むクロマトグラムの一例を示す図である。 本発明の実施例1における、被検物質3種類の他に複数の異なる成分を加えたクロマトグラムの一例を示す図である。 本発明の実施例1における、学習モデルを用いた被検物質ピーク高さ予測結果を示す図である。 本発明の実施例2における、スペクトル情報の分割方法を示す図である。 本発明の実施例2における、学習モデルを用いた被検物質ピーク高さ予測結果を示す図である。 本発明の実施例3における、学習モデルを用いた被検物質ピーク高さ予測結果を示す図である。 本発明の実施例4における、ピーク高さから関連する情報を予測する学習モデルの一例を示す図である。 本発明の実施例4における、ピーク高さから関連する情報を予測した結果の一例を示す図である。 本発明の実施例5において、学習モデルを用いた被検物質のピーク高さの予測結果を示す図である。 従来手法(図5)を用いた被検物質のピーク高さの予測結果を示す図である。 本発明の実施例6においてHPLC分析で得られたクロマトグラムを示す図である。 本発明の実施例6において、学習モデルを用いた被検物質のピーク高さの予測結果を示す図である。 本発明の実施例7において得たクロマトグラムを示す図である。 本発明の実施例7において、学習モデルを用いた被検物質のピーク高さの予測結果を示す図である。
(第一の実施形態)
以下に、図面を参照しながら、本発明の実施形態について説明する。但し、本発明の範囲は以下で説明する各実施形態に限定されるものではない。
まず、本実施形態を説明するにあたり、用語の説明を行う。
(試料)
本実施形態における試料とは、複数種類の化合物を含み構成される混合物である。本実施形態では、試料には被検物質とその他の物質(夾雑物)とが含まれている混合物とし、混合物であれば、特に限定されない。また、混合物の成分が特定されている必要はなく、未知の成分が含有されていてもよい。例えば、試料は、血液、尿、唾液等の生体由来の混合物でも良いし、飲食物でもよい。生体由来のサンプルの分析はサンプル提供者の栄養や健康状態を知るための手がかりを含むため、その分析は医学的にも栄養学的にも価値がある。例えば尿中ビタミンB3は糖質、脂質、タンパク質の代謝、エネルギー産生に関与しているため、その尿中代謝物であるN1−メチル−2−ピリドン−5−カルボキサミドの測定は健康維持のための栄養指導に役立つ。
(被検物質)
本実施形態における被検物質とは、試料中に含まれる1つ以上の既知の成分である。例えば、タンパク質、DNA、ウイルス、菌類、水溶性ビタミン類、脂溶性ビタミン類、有機酸類、脂肪酸類、アミノ酸類、糖類、農薬、環境ホルモンで構成される群から選択される少なくとも一種である。
例えば、栄養素の量を知りたい場合、被検物質としては、チアミン(ビタミンB1)、リボフラビン(ビタミンB2)、ビタミンB3代謝物であるN1−メチルニコチンアミド、N1−メチル−2−ピリドン−5−カルボキサミド、ビタミンB6代謝物である4−ピリドキシン酸、N1−メチル−4−ピリドン−3−カルボキサミド、パントテン酸(ビタミンB5)、ピリドキシン(ビタミンB6)、ビオチン(ビタミンB7)、プテロイルモノグルタミン酸(ビタミンB9)、シアノコバラミン(ビタミンB12)、アスコルビン酸(ビタミンC)等の水溶性ビタミンや、L−トリプトファン、リシン、メチオニン、フェニルアラニン、トレオニン、バリン、ロイシン、イソロイシン、L−ヒスチジン等のアミノ酸や、ナトリウム、カリウム、カルシウム、マグネシウム、リン等のミネラル、等を用いることができる。
(定量的な情報)
本実施形態における定量的な情報として、被検物質が試料に含まれる量、被検物質が試料に含まれる濃度、試料中の被検物質の有無等を用いることができる。また、その他の被検物質の定量的な情報として、被検物質の基準量に対して、試料に含まれる被検物質の濃度あるいは量の比率や、試料に含まれる被検物質の量あるいは被検物質の濃度の比率等を用いることができる。
(スペクトル情報)
本実施形態におけるスペクトル情報とは、クロマトグラム、光電子スペクトル、赤外線吸収スペクトル(IRスペクトル)、核磁気共鳴スペクトル(NMRスペクトル)、蛍光スペクトル、蛍光X線スペクトル、紫外/可視吸収スペクトル(UV/Visスペクトル)、ラマンスペクトル、原子吸光スペクトル、フレーム発光スペクトル、発光分光スペクトル、X線吸収スペクトル、X線回折スペクトル、常磁性共鳴吸収スペクトル、電子スピン共鳴スペクトル、質量スペクトル、熱分析スペクトルで構成される群から選択される少なくとも一種である。
(情報処理システム、情報処理装置)
次に、図1を用いて、本実施形態における情報処理システムを説明する。図1は、本実施形態に係る情報処理装置を含む情報処理システムの全体構成を示す図である。
情報処理システムは、情報処理装置10とデータベース22と分析装置23とを含んでいる。情報処理装置10とデータベース22とは、通信手段を介して互いに通信可能に接続されている。本実施形態においては、通信手段はLAN(Local Area Network)21で構成される。また、情報処理装置10と分析装置23とは、USB(Universal Serial Bus)等の規格の通信手段で接続されている。なお、LANは有線LANでも無線LANでもよいし、WAN(Wide Area Network)であってもよい。また、USBはLANであってもよい。
データベース22は、分析装置23による分析によって取得されたスペクトル情報を管理する。また、データベース22は、後述する学習モデル生成部42により生成された学習モデル(学習済みモデル)を管理する。情報処理装置10は、データベース22で管理されたスペクトル情報や学習モデルを、LAN21を介して取得する。
(学習モデル)
本実施形態における学習モデルとは、回帰学習モデルであり、深層学習などの機械学習によって生成されたものを用いることができる。機械学習アルゴリズムに教師データを用いて学習を行い、適切な推測が行えるように構築したものをここでは学習モデルと呼ぶ。学習モデルに用いる機械学習アルゴリズムには様々な種類がある。例えば、ニューラルネットワークを用いた深層学習を使うことができる。ニューラルネットワークは入力層、出力層、複数の隠れ層から構成され、各層は活性化関数と呼ばれる計算式で結合されている。ラベル(入力に対応する出力)付き教師データを用いる場合、入力と出力の関係が成り立つように活性化関数の係数を決定していく。複数の教師データを用いて係数を決定していくことで、高い精度で入力に対する出力を予測できる学習モデルを生成する事ができる。
(分析装置)
分析装置23は、試料や被検物質等を分析するための装置である。分析装置23は、分析手段の一例に相当する。なお、前述したように、本実施形態では、情報処理装置10と分析装置23とが通信可能に接続されている。しかし、情報処理装置10の内部に分析装置23を備える形態であってもよいし、分析装置23の内部に情報処理装置10を備える形態であってもよい。更に、不揮発メモリなどの記録媒体を介して分析結果(スペクトル情報)を分析装置23から情報処理装置10へ受け渡す形態でもよい。
本実施形態における分析装置23はスペクトル情報を取得できるものであれば限定されず、化学的な分析手法や、物理的な分析手法を用いた装置を利用できる。本実施形態において、化学的な分析手法を用いた装置は、例えば、液体クロマトグラフィーやガスクロマトグラフィー等のクロマトグラフィー、及びキャピラリー電気泳動で構成される群から選択される少なくとも一種の手法を用いる。本実施形態において、物理的な分析手法を用いた装置は、例えば、光電子分光法、赤外吸収分光法、核磁気共鳴分光法、蛍光分光法、蛍光X線分光法、可視・紫外線吸収分光法、ラマン分光法、原子吸光法、フレーム発光分光法、発光分光法、X線吸収分光法、X線回折法、常磁性共鳴吸収等を利用した電子スピン共鳴分光法、質量分析法、熱分析法で構成される群から選択される少なくとも一種の手法を用いる。
例えば、液体クロマトグラフィーでは、移動相容器、送液ポンプ、試料注入部、カラム、検出器、A/D変換機を備える。検出器としては、紫外線、可視光線、赤外線などを用いた電磁波の検出器をはじめ、電気化学検出器、イオン検出器等が用いられる。この場合、得られるスペクトル情報は時間に対する検出器からの出力強度となる。
情報処理装置10は、その機能的な構成として、通信IF31、ROM32、RAM33、記憶部34、操作部35、表示部36、制御部37を具備する。
通信IF(Interface)31は、例えば、LANカード及びUSBのインターフェースカードで実現される。通信IF31は、LAN21とUSBを介した外部装置(例えば、データベース22と分析装置23)と情報処理装置10との間の通信を司る。ROM(Read Only Memory)32は、不揮発性のメモリ等で実現され、各種プログラム等を記憶する。RAM(Random Access Memory)33は、揮発性のメモリ等で実現され、各種情報を一時的に記憶する。記憶部34は、例えば、HDD(Hard Disk Drive)等で実現され、各種情報を記憶する。操作部35は、例えば、キーボードやマウス等で実現され、ユーザーからの指示を装置内に入力する。表示部36は、例えば、ディスプレイ等で実現され、各種情報をユーザーに向けて表示する。操作部35や表示部36は、制御部37からの制御によりGUI(Graphical User Interface)としての機能を提供する。
(制御部)
制御部37は、例えば、少なくとも1つのCPU(Central Processing Unit)等で実現され、情報処理装置10における処理を統括制御する。制御部37は、その機能的な構成として、スペクトル情報取得部41、学習モデル生成部42、学習モデル取得部43、推定部44、情報取得部45、表示制御部46を具備する。
(スペクトル情報取得部)
スペクトル情報取得部41は、被検物質と夾雑物とを少なくとも含む試料の分析結果、具体的には試料のスペクトル情報を分析装置23から取得する。なお、あらかじめ分析結果が格納されたデータベース22から、試料のスペクトル情報を取得してもよい。また、同様に被検物質のスペクトル情報を取得する。この被検物質のスペクトル情報は、被検物質が単一で存在した場合のスペクトル情報である。そして、スペクトル情報取得部41は、取得した試料のスペクトル情報を、推定部44に出力する。また、取得した被検物質のスペクトル情報を学習モデル生成部42に出力する。以下では、資料に含まれる被検物質が複数種類の場合について説明をするが、被検物質が1種類であってもよい。
(分割部)
本実施形態に係るスペクトル情報取得部41は、更に試料のスペクトル情報を分割する分割部(不図示)を有していても良い。分割部では被検物質と夾雑物を含む試料のスペクトル情報を、被検物質毎のスペクトル情報に分割する事ができる。
試料のスペクトル情報を複数に分割する手法の一例は、ユーザーがスペクトル情報の分割箇所を指定する方法である。例えば、被検物質毎のスペクトルの範囲を指定する方法や、被検物質毎のスペクトルの中心を指定し、中心から前後一定範囲を抽出する方法などがある。中心を指定する方法では、予め抽出する範囲を設定しておく方法と、スペクトル情報の位置(スペクトル情報がクロマトグラムであればリテンションタイム)によって自動的に抽出する範囲が決まる方法がある。例えば液体クロマトグラフィーによってクロマトグラムを得る場合は、リテンションタイムが遅いほどクロマトグラムがブロードになり易いので、抽出する範囲を広くすると良い。すなわち、クロマトグラムのリテンションタイムに応じて、クロマトグラムから抽出する範囲を変えればよい。例えば、クロマトグラムのリテンションタイムが遅い位置にピークが現れる被検物質を扱う場合は、クロマトグラムから抽出する範囲を広くするとよい。
試料のスペクトル情報を複数に分割する手法の他の例は、自動的にスペクトル情報の分割箇所が決まる方法である。例えば、スペクトル情報に対して閾値を設け、閾値を超えた場合、そこに被検物質のスペクトル情報があると判断できる。例えば、ガウス分布状のスペクトル情報であれば、閾値を超えた2点の中点がスペクトル情報のピーク中央となる。そこからピーク高さ、半値全幅から標準偏差(σ)を求める事ができる。この際、σを元に、ピーク中央から抽出の範囲を設定すると良い。抽出範囲は±2σから±4σ程度が好ましい。
スペクトル情報を抽出する範囲に関しては、被検物質の種類によっても最適な範囲が変わる可能性が高い。そこで、抽出範囲を決定した後、後述する生成部で学習モデルを作成し、精度を確認してから抽出範囲を訂正しても良い。具体的には、抽出範囲決定後、その範囲でスペクトル情報を抽出し、後述する生成部で学習モデルを作成する。作成した学習モデルに対して、抽出したスペクトル情報(A)にノイズを加算したもの(B)を入力として、出力CとAの情報(ピーク高さ、ピーク面積など)の相関係数を求める。抽出範囲を変更し、同様の手法で相関係数を確認、相関係数の変化から抽出範囲を広げるべきか、縮めるべきか判断できる。
さらに、スペクトル情報を分割する際に、機械学習を用いても良い。様々なスペクトル情報に対する分割箇所を学習させる事で、被検物質毎のスペクトル情報に分割する事ができる。
(学習モデル生成部)
学習モデル生成部42は、スペクトル情報取得部41が取得した被検物質のスペクトル情報を用いて教師データを生成する。そして、学習モデル生成部42は、教師データを用いて深層学習を実行し、学習モデルを生成する。教師データの生成及び学習モデルの生成に関する詳細な説明は、後述する。そして、学習モデル生成部42は、生成した学習モデルを学習モデル取得部43へ出力する。なお、学習モデル生成部42は、生成した学習モデルをデータベース22へ出力してもよい。
ここで、学習モデルの生成方法の一例を説明する。まず、被検物質を含む分析結果から各被検物質の情報がどこに含まれているか抽出する。抽出する方法は前述の分割部での分割の手段と同様である。その為、分割部で予めスペクトル情報を分割している場合は、改めて抽出する必要はない。分割していない場合は、スペクトル情報の中から分割部と同様の手段で被検物質毎のスペクトルを抽出する。抽出した各被検物質の情報(ピーク位置)を元に各被検物質の情報量を増減させたデータを生成する。例えば3つの被検物質A、B、Cのピークがあった場合、被検物質Aのピーク高さを元々のピーク高さに対して0倍、0.2倍、0.4倍、0.6倍、0.8倍、1.2倍、1.4倍、1.6倍、1.8倍したピーク形状を生成する。同様に被検物質B、Cについてもピーク形状を生成する。この例では各被検物質のピーク形状が10種類生成される。生成するピーク形状は、予想される被検物質量が含まれる範囲であることが好ましい。また、生成するピーク形状の数は多いほど、学習モデルの精度は向上する。
ここからの学習モデル生成方法には大きく分けて2通りの方法がある。
1つは生成した各被検物質のピークを組み合わせた教師データを用いる方法である。前記例では被検物質A、B、Cの3成分なので全組み合わせ10×10×10の1000通りとなる。これに対して乱数で生成させた任意の波形を加算し、入力用データとする。出力用データとして入力用データに用いた各被検物質のピーク高さを用意し、これらをもって教師データとする。この場合生成する学習モデルは1つとなる。
もう1つは生成した各被検物質のピーク毎に学習モデルを生成する方法である。被検物質毎に用意したピークの高さを出力とし、入力用データは被検物質毎に用意したピーク形状に乱数で生成させた任意の波形を加算したものを用意する。これらをもって教師データとする。この場合生成する学習モデルは被検物質毎に1つとなるので、前記例では3つの学習モデルを生成する。
いずれの方法においても、乱数で生成する任意の波形は、各分析方法で得られる情報に基づいたものとする。例えば、液体クロマトグラフィーでは得られるスペクトル情報はガウス分布をしたものが多い。その場合は、ピーク高さ、中央値、標準偏差を乱数で決定したガウス曲線を複数足し合わせ、さらに前記被検物質の分析結果も足し合わせたものを入力とし、前記被検物質の分析結果を出力とした教師データとすると良い。出力は得たい情報、例えばピーク高さのみでも良い。より具体的には、加算する数はクロマトグラム上で分離できずピークが重複してしまう可能性がある数が好ましいが、通常は1つの被検物質に対して2から8個程度で十分である。8個を超えると被検物質ピークの形状予測が難しくなり、定量精度が低下する。3個以下では分離不十分のクロマトグラムに対して精度よく定量できない。好ましくは3から6個、4から5個であればさらに良い。任意の波形の形状は式1に示すガウス関数とする。
Figure 2020101524
ここで、aは想定される被検物質のピーク高さに対して0からx%の値、bはトリミングした範囲に対してx%までの値の範囲で乱数によって決定する。例えば被検物質のピーク中央に対して±3σの範囲をトリミングした場合、bは−8σ×x%から+8σ×x%の範囲の任意の値とすることができる。xは100から300、好ましくは100から250、100から200であればさらに良い。cは被検物質ピークの標準偏差の0.1倍から10倍、より好ましくは0.2倍から8倍、さらに好ましくは0.5倍から5倍の値の範囲、で乱数によって決定するのが好ましい。各被検物質に対して任意の波形を複数個加算したら、求めたい値(例えば複数の被検物質のピーク高さ)とセットにして1組の教師データとする。1000から2000組程度の教師データを用意し、同じ被検物質の組み合わせで含有量が異なるピークに対しても同様の教師データを作成する。含有量が異なる被検物質5から10種類程度、5000から20000程度の教師データを揃えると良い。
さらに、乱数で生成する任意の波形は、追加するスペクトル情報の位置に合わせたものを用意しても良い。例えば、液体クロマトグラフィーではリテンションタイムが遅いピークほどブロードになる傾向がある。乱数で生成する任意の波形の標準偏差を時間の関数とし、時間が遅いほど標準偏差が大きくなるようにすると、より精度の高い学習モデルを作る事ができる。
(学習モデル取得部)
学習モデル取得部43は、学習モデル生成部42が生成した学習モデルを取得する。なお、学習モデルがデータベース22に格納されている場合には、学習モデル取得部43は、データベース22から学習モデルを取得する。そして、学習モデル取得部43は、取得した学習モデルを推定部44へ出力する。
(推定部)
推定部44は、学習モデル取得部43が取得した学習モデルに、スペクトル情報取得部41が取得した試料のスペクトル情報を入力することにより、試料に含まれる被検物質の定量的な情報を学習モデルに推定させる。そして、推定部44は、推定された定量的な情報を、情報取得部45へ出力する。推定部44は、試料のスペクトル情報を学習モデルに入力することにより、被検物質の定量的な情報を推定する推定手段の一例に相当する。
情報取得部45は、学習モデルが推定した定量的な情報を取得する。すなわち、情報取得部45は、被検物質と夾雑物とを含む試料のスペクトル情報を学習モデルに入力することにより推定された、前記被検物質の定量的な情報を取得する情報取得手段の一例に相当する。そして、情報取得部45は、取得した定量的な情報を表示制御部46へ出力する。
(表示制御部)
表示制御部46は、情報取得部45が取得した定量的な情報を表示部36に表示させる。表示制御部46は、表示制御手段の一例に相当する。
なお、制御部37が具備する各部の少なくとも一部は、独立した装置として実現してもよい。また、夫々が機能を実現するソフトウェアとして実現してもよい。この場合、機能を実現するソフトウェアは、クラウドをはじめとするネットワークを介したサーバ上で動作してもよい。本実施形態では各部はローカル環境におけるソフトウェアにより夫々実現されているものとする。
なお、図1に示す情報処理システムの構成はあくまで一例である。例えば、情報処理装置10の記憶部34がデータベース22の機能を具備し、記憶部34が各種情報を保持してもよい。
次に図2を用いて、本実施形態における処理手順を説明する。図2は、学習モデルの生成に関する処理手順のフローチャートである。
(S201)(被検物質単体を分析)
ステップS201では、分析装置23は、被検物質単体を分析し、被検物質のスペクトル情報を取得する。分析条件は、感度や分析時間などの観点から適宜選択すればよい。その際、分析装置23は、被検物質の濃度を何通りか変化させて分析する。どの程度の数が必要であるかは、物質の性質などによっても異なるが、一般的に3点以上変化させることが望ましい。被検物質の分析は、被検物質ごとにそれぞれ分析しても、同時に分析してもよい。そして、分析装置23は、取得したスペクトル情報を情報処理装置10に出力する。情報処理装置10は分析装置23からスペクトル情報を受信し、RAM33又は記憶部34に保持する。スペクトル情報取得部41は、こうして保持されたスペクトル情報を取得する。なお、前述したように、分析結果であるスペクトル情報は、データベース22が保持してもよい。この場合、スペクトル情報取得部41は、データベース22からスペクトル情報を取得する。また、分析装置23が被検物質を分析するタイミングは、ステップS202における教師データの生成よりも前に実行されれば、どのようなタイミングであってもよい。
(S202)(教師データを生成)
ステップS202では、学習モデル生成部42は、スペクトル情報取得部41が取得した、被検物質のスペクトル情報を用いて、複数の教師データを生成する。教師データの生成方法について、具体的に説明する。教師データは、被検物質のスペクトル情報に乱数で生成した任意の波形を加算することで生成される。例えば、液体クロマトグラフィーでは、スペクトル情報(クロマトグラム)が示す波形はガウス分布であることが多い。そのため、学習モデル生成部42は、ピークの高さ、中央値、標準偏差を乱数で決定した複数のガウス曲線(ガウス関数)を足し合わせて、複数のランダムノイズを生成する。そして、学習モデル生成部42は、この複数のランダムノイズそれぞれと被検物質のスペクトル情報が示す波形とを足し合わせた複数の波形を生成する。こうして生成された複数の波形は、被検物質と夾雑物とを含む仮想的な試料のスペクトル情報(学習用スペクトル情報)として用いられる。つまり、生成された複数のスペクトル情報を、教師データを構成する入力データとして決定する。更に、学習モデル生成部42は、生成されたスペクトル情報の基となった、被検物質のスペクトル情報から特定されるピークの高さ(定量的な情報)を、教師データを構成する正解データとして決定する。このようにして、学習モデル生成部42は、入力データと正解データの組である複数の教師データを生成する。そして、ステップS201において、学習モデル生成部42は、被検物質の濃度に応じたスペクトル情報を取得しているので、この濃度ごとに複数の教師データを生成する。なお、クロマトグラムの波形は、リテンションタイムが大きくなるにつれて、ピークの幅が大きくなる傾向にあることを踏まえて、学習モデル生成部42は、生成する波形の幅を広くしてもよい。
特許文献3では検体のマススペクトルデータを癌の有無と紐付けて機械学習させる方法が開示されている。しかし、機械学習の精度を上げる為には多量の教師データを必要とする。特許文献3では教師データとして9万種のデータを用意している。つまり、機械学習は複雑な分析結果に対して精度良く解析できるが、多量の教師データを用意する必要がある点が難点である。本実施形態では、機械学習の難点である教師データを多量に用意する必要がないため、ユーザーの負担を軽減することができる。
なお、このようにして教師データを生成したが、複数の試料を分析装置23で分析することで、学習用の試料のスペクトル情報を取得し、被検物質の定量的な情報と併せて教師データとしてもよい。また、前述した方法とは異なる方法で、仮想的な試料のスペクトル情報を生成してもよい。
(S203)(学習モデルを生成)
ステップS203では、学習モデル生成部42は、ステップS202で濃度ごとに生成した複数の教師データを用いて、所定のアルゴリズムに従った機械学習を実施することにより、学習モデルを生成する。本実施形態では、所定のアルゴリズムとして、ニューラルネットワークを用いる。学習モデル生成部42は、複数の教師データを用いてニューラルネットワークに学習をさせることにより、試料のスペクトル情報の入力に基づいて、試料に含まれる被検物質の定量的な情報を推定する学習モデルを生成する。なお、ニューラルネットワークの学習方法は、周知技術であるため、本実施形態では詳細な説明を省略する。また、所定のアルゴリズムとして、例えば、SVM(サポートベクターマシン)、DNN(ディープニューラルネットワーク)を用いても良い。その他のアルゴリズムとして、CNN(コンボリューショナルニューラルネットワーク)等を用いてもよい。被検物質が複数種類ある場合は、それぞれの物質に対して学習モデルを構築する。そして、学習モデル生成部42は、RAM33、記憶部34、又はデータベース22に、生成した学習モデルを格納する。
以上のようにして、試料のスペクトル情報に基づいて、試料に含まれる被検物質の定量的な情報を推定する学習モデルを生成する。
(S301)(試料を分析)
ステップS301では、分析装置23は、目的の試料を分析し、試料のスペクトル情報を取得する。分析条件は、前述したステップS201と同一の条件とする。そして、分析装置23は、取得したスペクトル情報を情報処理装置10に出力する。情報処理装置10は分析装置23からスペクトル情報を受信し、RAM33又は記憶部34に保持する。スペクトル情報取得部41は、こうして保持されたスペクトル情報を取得する。なお、前述したように、分析結果であるスペクトル情報は、データベース22が保持してもよい。この場合、スペクトル情報取得部41は、データベース22からスペクトル情報を取得する。また、分析装置23が試料を分析するタイミングは、ステップS302における定量的な情報の推定よりも前に実行されれば、どのようなタイミングであってもよい。
(S302)(定量的な情報を推定)
ステップS302では、学習モデル取得部43は、RAM33、記憶部34、又はデータベース22に格納された学習モデルを取得する。そして、推定部44は、取得された学習モデルに、ステップS301で取得された試料のスペクトル情報を入力することにより、試料に含まれる被検物質の定量的な情報を推定させる。また、必要に応じて、推定部44は、推定された定量的な情報を、表示部36において表示する形式に換算する。表示部36において表示する形式としては、g/L、mol/Lなどの濃度でもよいし、基準量(標準量)に対する割合でもよい。学習モデルにより推定される値がこれらの表示形式であれば、換算する必要はない。そして、情報取得部45は、推定された定量的な情報を推定部44から取得し、RAM33又は記憶部34に格納する。
このように、被検物質のピークと夾雑物のピークが完全に分離できていなくても機械学習で得られる学習モデルを利用することで、分析に関する複雑で高度な知識が無くても精度よく被検物質の定量的な情報を得ることができる。
その結果、熟練者でなくとも簡易に高精度で被検物質の定量分析を行うことができる。
(S303)(定量的な情報を表示)
ステップS304では、表示制御部46は、ステップS302で学習モデルにより推定された、試料に含まれる被検物質の定量的な情報を、表示部36に表示させる。その際、グラフ形式や表形式に整理して表示してもよい(データ解析方法)。
次に、図4を参照して、算出装置における処理をより詳細に説明する。図4は試料中の被検物質の量を算出する処理のフローチャートである。
まず、分析部は被検物質を分析する(ステップS401)。分析条件は、感度や測定時間などの観点から適宜選択すればよい。その際、被検物質の濃度を何通りか変化させて測定しても良い。
続いて、分析部は被検物質を含む目的試料を分析する(ステップS402)。測定条件は前記ステップS401と同一条件に設定する。
続いて、生成部は、ステップS401で得られた被検物質の測定結果を用いて教師データを生成する。生成した教師データを用いて、所定のアルゴリズムに従った機械学習を実施して学習モデルを構築する(ステップS403)。具体的な学習の手法としては例えば、一般的な機械学習手法としてニューラルネットワークやサポートベクターマシンなどを用いてもよい。また、隠れ層が多層になった深層学習手法として、DNN(ディープニューラルネットワーク)やCNN(コンボリューショナルニューラルネットワーク)などを用いてもよい。
続いて、算出部は上記ステップS403において生成された学習モデルを、ステップS402において得られた測定データに適用して、被検物質の量を算出する(ステップS404)。その際、量は表示部において表示する形式に換算する。表示部において表示する形式としては、g/L、mol/Lなどの濃度でもよいし、標準量に対する割合でもよい。
次いで、表示部は上記ステップS404において算出された被検物質の量を表示し、ユーザーに提示する(S405)。その際、グラフ形式や表形式に整理して表示してもよい。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読み出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
以下に、実施例および比較例を挙げて本発明をより詳細に説明するが、本発明は以下の実施例に限定されるものではない。
(第二の実施形態)
図7は第二の実施形態に係る算出装置の概略ブロック図である。
(算出装置の構成)
本実施形態に係る算出装置700は、被検物質701を含む試料702に対して、被検物質単体の分析結果を受け付ける受付部703と、被検物質の分析結果に関する学習モデルを取得する取得部704を有する。さらに、試料の分析結果と学習モデルを用いて前記被検物質の定量的な情報を算出する算出部705を備えている。
近年、複雑な分析結果に対しては機械学習を用いた解析手法も発展している。特許文献3では検体のマススペクトルデータを癌の有無と紐付けて機械学習させる方法が開示されている。しかし、機械学習の精度を上げる為には多量の教師データを必要とする。特許文献3では教師データとして9万種のデータを用意している。つまり、機械学習は複雑な分析結果に対して精度良く解析できるが、多量の教師データを用意する必要がある点が難点である。
本実施形態では被検物質のピークと夾雑物のピークが完全に分離できていなくても機械学習で得られる学習モデルを利用する事で分析に関する複雑で高度な知識が無くても精度良く被検物質のピーク情報を得る事ができる。また、機械学習の難点である教師データを多量に用意する必要もない。
また、従来、被検物質のピークと夾雑物のピークが完全に分離できない場合は、前処理や分析条件の最適化など、分析に関する複雑で高度な知識を要する作業が必要とされてきた。本実施形態に係る算出装置によれば、夾雑物を分離するための前処理や、ピーク分割法などの演算処理を得なくても、スペクトル情報から被検物質の情報を得ることができる。
その結果、熟練者でなくとも簡易に高精度で被検物質の定量分析を行うことができる。
本実施形態に係る算出装置は、さらに、試料を分析する分析部706を有していても良い。分析部を有していなくても、別途用意した分析部707の分析結果を取得してきてもよいし、データベース(DB1)708から取得してきてもよい。また、学習モデルは生成部709で生成しても、データベース(DB2)710から取得してきてもよい。
以下、本実施形態に係る算出装置について詳細を述べる。
(受付部)
受付部では試料の分析結果、具体的には試料のスペクトル情報に関する情報を受け付ける。分析結果を得るために、本実施形態に係る算出装置が、後述する分析部を有する場合、分析部から試料のスペクトル情報を取得することができる。また、本実施形態に係る算出装置が分析部を有していない場合、予め分析結果を格納したデータベース(図中のDB1)を用意し、データベースから分析結果、すなわち試料のスペクトル情報を取得してもよい。データベースは算出装置に内蔵された記憶装置内や、前記算出装置に外付けされた記憶装置内、またはネットワークを介したクラウド上に存在しても良い。
(取得部)
取得部では、受付部で得られた試料の分析結果を基にして学習モデルを取得する。学習モデルは後述する生成部で生成してもよい。また、予め被検物質の学習モデルを格納したデータベース(図中のDB2)を用意し、データベースから学習モデルを得てもよい。データベースは算出装置に内蔵された記憶装置内や、算出装置に外付けされた記憶装置内、またはネットワークを介したクラウド上に存在しても良い。
(学習モデル)
本実施形態において学習モデルは、深層学習などの機械学習によって生成されたものを用いることができる。
機械学習アルゴリズムに教師データを用いて学習を行い、適切な予測が行えるように構築したものをここでは学習モデルと呼ぶ。学習モデルに用いる機械学習アルゴリズムには様々な種類がある。例えば、ニューラルネットワークを用いた深層学習を使うことができる。ニューラルネットワークは入力層、出力層、複数の隠れ層から構成され、各層は活性化関数と呼ばれる計算式で結合されている。ラベル(入力に対応する出力)付き教師データを用いる場合、入力と出力の関係が成り立つように活性化関数の係数を決定していく。複数の教師データを用いて係数を決定して行く事で、高い精度で入力に対する出力を予測できる学習モデルを作成する事ができる。
本実施形態における学習モデルとして例えば、被検物質が単一で存在した場合のスペクトル情報(被検物質のスペクトル情報)とランダムノイズとを含む情報を用いることができる。ランダムノイズは特に限定されないが、複数のガウス関数を組み合わせた波形を用いることができる。また、クロマトグラムの波形は、リテンションタイムが大きくなるにつれて、ピークの幅が大きくなる傾向にあることを踏まえて、生成する波形の幅を広くしてもよい。
(スペクトル情報)
本実施形態において、スペクトル情報とは、クロマトグラム、光電子スペクトル、赤外線吸収スペクトル、核磁気共鳴スペクトル、蛍光X線スペクトル、可視・紫外線吸収スペクトル、ラマンスペクトルで構成される群から選択される少なくとも一種である。また、原子吸光スペクトル、フレーム発光スペクトル、発光分光スペクトル、X線吸収スペクトル、X線回折スペクトル、常磁性共鳴吸収スペクトル、質量スペクトル、熱分析スペクトルで構成される群から選択される少なくとも一種である。
(算出部)
算出部では取得部で得られた学習モデルを前記試料の分析結果に対して適用し、前記試料中の前記被検物質の定量的な情報を算出する。
(分析部)
本実施形態における分析部は前記試料、前記被検物質の分析結果を得るための各種分析機である。分析部は算出装置の他部分の少なくとも一つと同じコンピュータ内に備えられている形態の他、無線および有線のインターネット網を介し接続する形態、さらに不揮発メモリなどの記録媒体を介して分析結果を受け渡す形態でもよい。
本実施形態における分析部は、クロマトグラフィー、キャピラリー電気泳動、光電子分光、赤外吸収分光、核磁気共鳴分光、蛍光X線分光、可視・紫外線吸収分光、ラマン分光で構成される群から選択される少なくとも一種の手法を用いる。また、原子吸光法、フレーム発光法、発光分光法、X線吸収分光、X線回折、常磁性共鳴吸収、質量分析、熱分析で構成される群から選択される少なくとも一種の手法を用いる。
分析に用いられる機器は様々であるが、例えば可視・紫外線吸収スペクトル(UV/Visスペクトル)、赤外線吸収スペクトル(IRスペクトル)、核磁気共鳴スペクトル(NMRスペクトル)、ラマンスペクトル分析などがある。ほかに、蛍光スペクトル分析、原子吸光分析、原子吸光スペクトル、フレーム分析、フレーム蛍光スペクトル、発光分光分析、発光分光スペクトル、発光X線分析、X線回析、蛍光X線回析などがある。さらに、蛍光X線スペクトル、常磁性共鳴吸収スペクトル、質量スペクトル分析、熱分析、ガスクロマトグラフィー、液体クロマトグラフィー、光電子スペクトル、などがある。
例えば、液体クロマトグラフィーでは移動相容器、送液ポンプ、試料注入部、カラム、検出器、A/D変換機を備える。検出器は紫外線や可視光線、赤外線などを用いた電磁波検出器をはじめ、電気化学検出器、イオン検出器等が用いられる。この場合、得られるスペクトル情報は時間に対する検出器からの出力強度となる。
(生成部)
生成部では被検物質の分析結果を元に教師データを作成し、深層学習を行うことにより学習モデルを生成する。教師データは被検物質の分析結果に乱数で生成させた任意の波形を加算する事で生成する。例えば、液体クロマトグラフィーでは得られるスペクトル情報はガウス分布をしたものが多い。その場合は、ピーク高さ、中央値、標準偏差を乱数で決定したガウス曲線を複数足し合わせ、さらに前記被検物質の分析結果も足し合わせたものを入力とし、被検物質の分析結果を出力とした教師データとすると良い。出力は得たい情報、例えばピーク高さのみでも良い。より具体的には、被検物質のピークを中央にしてトリミングしたデータを用意する。トリミングする範囲が広いほど、後の算出部で定量する際の精度は上がるが、精度を上げるために必要となる教師データの数は増える。トリミングする範囲は被検物質のピークの標準偏差(σ)の6倍から30倍程度である。好ましくは被検物質のピークの標準偏差(σ)の10倍から20倍であり、14倍から18倍であればさらに良い。次に、トリミングしたデータに任意の波形を加算する。加算する数はクロマトグラム上で分離できずピークが重複してしまう可能性がある数が好ましいが、通常は2個から8個程度で十分である。8個を超えると被検物質のピークの形状予測が難しくなり、定量精度が低下することがある。また、3個以下では分離不十分のクロマトグラムに対して精度よく定量できないことがある。好ましくは3個から6個、4個から5個であればさらに良い。任意の波形の形状は式1に示すガウス関数とすることができる。
Figure 2020101524
ここで、aは想定される被検物質のピーク高さに対して0からx%の値、bはトリミングした範囲に対してx%までの値の範囲で乱数によって決定する。例えば被検物質のピーク中央に対して±3σの範囲をトリミングした場合、bは−8σ×x%から+8σ×x%の範囲の任意の値とすることができる。の範囲で乱数によって決定する。xは100から300、好ましくは100から250、さらに好ましくは100から200である。cは被検物質ピークの標準偏差の0.1倍から10倍、より好ましくは0.2倍から8倍、さらに好ましくは0.5倍から5倍の値の範囲、で乱数によって決定することが好ましい。任意の波形を複数個加算したら、求めたい値(例えば被検物質のピーク高さ)とセットにして1組の教師データとすることができる。1つの被検物質ピークに対して1000個から2000個程度の教師データを用意し、同じ被検物質で含有量が異なるピークに対しても同様の教師データを作成する。含有量が異なる被検物質を5種類から10種類程度、5000個から20000個程度の教師データを揃えると良い。
(記憶部)
本実施形態に係る算出装置はさらに上記学習モデルが保存された記憶部を有していてもよい。その際、上記取得部は記憶部から学習モデルを取得することができる。
(表示制御部)
本実施形態に係る算出装置は、定量的な情報の表示の制御を行う表示制御部をさらに有していてもよい。
(試料)
試料としては複数種類の化合物を含み構成される混合物であれば、特に限定されない。また、混合物の成分特定されている必要はなく、未知の成分が含有されていても良い。例えば、血液、尿、唾液等の生体由来の混合物でも良いし、飲食物でも良い。生体由来のサンプルの分析はサンプル提供者の栄養や健康状態を知るための手がかりを含むため、その分析は医学的にも栄養学的にも価値がある。例えば尿中ビタミンB3は糖質、脂質、タンパク質の代謝、エネルギー産生に関与しているため、その尿中代謝物であるN1−メチル−2−ピリドン−5−カルボキサミドの測定は健康維持のための栄養指導に役立つ。
(被検物質)
本実施形態における被検物質は前記試料中に含まれる1つ以上の既知の成分である。例えば、タンパク質、DNA、ウイルス、菌類、水溶性ビタミン類、脂溶性ビタミン類、有機酸類、脂肪酸類、アミノ酸類、糖類、農薬、環境ホルモンで構成される群から選択される少なくとも一種である。
例えば、栄養素の量を知りたいのであれば被検物質としては、チアミン(ビタミンB1)、リボフラビン(ビタミンB2)、ビタミンB3代謝物であるN1−メチルニコチンアミド、N1−メチル−2−ピリドン−5−カルボキサミドなどある。ほかに、N1−メチル−4−ピリドン−3−カルボキサミド、パントテン酸(B5)、4−ピリドキシン酸(B6)、ビオチン(B7)、プテロイルモノグルタミン酸(B9)、アスコルビンサン(C)等の水溶性ビタミンがある。ほかに、L−トリプトファン、リシン、メチオニン、フェニルアラニン、トレオニン、バリン、ロイシン、イソロイシン、L−ヒスチジン等のアミノ酸がある。ほかに、ナトリウム、カリウム、カルシウム、マグネシウム、リン等のミネラル、葉酸、シアノコバラミン等、アスコルビン酸が挙げられる。
(定量的な情報)
前記被検物質が前記試料に含まれる量、前記被検物質が前記試料に含まれる濃度、前記試料中の前記被検物質の有無で構成される群から選択される少なくとも一つである。また、前記被検物質の基準量に対して前記試料に含まれる濃度あるいは量の比率、前記被検物質の前記試料に含まれる量あるいは濃度の比率で構成される群から選択される少なくとも一つである。
(算出方法)
本実施形態に係る算出方法は、少なくとも以下の工程を有する。
(1)被検物質を含む試料のスペクトル情報を受け付ける受付工程。
(2)被検物質のスペクトル情報に関する学習モデルを取得する取得工程。
(3)試料のスペクトル情報と、学習モデルとに基づき、被検物質の定量的な情報を算出する算出工程。
ここで、スペクトル情報は、前述の情報が例示される。
さらに、試料のスペクトル情報を取得するための分析を行う分析工程を有していてもよく、前述の分析が例示される。
また、学習モデルを生成する生成工程をさらに有し、取得工程は、生成工程で生成した前記学習モデルを取得する工程を有してもよい。学習モデルは、被検物質のスペクトル情報とランダムノイズと、を含む情報であってもよい。ここで、ランダムノイズは、複数のガウス関数の組み合わせによって得られる波形であってもよい。
被検物質は、前述の物質が例示される。定量的な情報は、前述の情報が例示される。
学習モデルは、深層学習などの機械学習によって生成されたものであってよい。
算出方法は、定量的な情報の表示の制御を行う表示制御工程をさらに有してもよい。
以下、本発明の実施形態に係る算出方法の一例を詳細に説明する。
(データ解析方法)
次に、図8を参照して、算出装置における処理をより詳細に説明する。図8は試料中の被検物質の量を算出処理する処理のフローチャートである。
(ステップS801)
まず、分析部は被検物質単体を分析する(ステップS801)。分析条件は、感度や測定時間などの観点から適宜選択すればよい。その際、被検物質の濃度を何通りか変化させて測定する。どの程度の数が必要であるかは、物質の性質などによっても異なるが、一般的に3点以上変化させることが望ましい。被検物質が複数種類ある場合は、それぞれ測定することが望ましいが、被検物質同士の信号が十分分離できている場合は、同時に測定してもよい。
(ステップS802)
続いて、分析部は被検物質を含む目的試料を分析する(ステップS802)。測定条件は前記ステップS801と同一条件に設定する。
続いて、生成部は、ステップS801で得られた被検物質単体の測定結果を用いて複数の教師データを生成する。生成した教師データを用いて、所定のアルゴリズムに従った機械学習を実施して学習モデルを構築する(ステップS803)。具体的な学習の手法としては例えば、一般的な機械学習手法としてニューラルネットワークやサポートベクターマシンなどを用いてもよい。また、隠れ層が多層になった深層学習手法として、DNN(ディープニューラルネットワーク)やCNN(コンボリューショナルニューラルネットワーク)などを用いてもよい。被検物質が複数種類ある場合は、それぞれの物質に対して学習モデルを構築する。
(ステップS803)
続いて、算出部は上記ステップS3において生成された学習モデルを、ステップS802において得られた測定データに適用して、被検物質の量を算出する(ステップS804)。その際、量は表示部において表示する形式に換算する。表示部において表示する形式としては、g/L、mol/Lなどの濃度でもよいし、基準量(標準量)に対する割合でもよい。
(ステップS804)
次いで、表示部は上記ステップS804において算出された被検物質の量を表示し、ユーザーに提示する。その際、グラフ形式や表形式に整理して表示してもよい。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読み出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
以下に、実施例および比較例を挙げて本発明をより詳細に説明するが、本発明は以下の実施例に限定されるものではない。
(実施例1)
図9は被検物質3種類(501、502、503)を含むクロマトグラムである。閾値504として0.1を設定し、閾値とクロマトグラムの交点から各被検物質のピーク位置を抽出した。例えばピーク501であれば閾値とクロマトグラムの交点505の中央値506をピーク501の位置とした。同様にピーク502、503のピーク位置を特定した。各ピーク位置は100、250、400となった。
それぞれのピークに対してピーク位置±75の範囲を0から1.8(0.2刻み)の値で乗算し、被検物質毎に10種類のピーク高さが異なる波形を得た。被検物質501、502、503のピーク高さが異なる波形を組み合わせて10×10×10の1000通りの波形を生成した。以下、被検物質データとする。各被検物質データに対して、中央値、標準偏差、ピーク高さを乱数で設定した5つの正規分布波形を加算したものを試料データとした。加算した正規分布波形はピーク高さ(式1のa)0.0から1.5、中央値(式1のb)10から490、標準偏差(式1のc)10から100までの範囲で乱数により決定した。試料データは1つの被検物質データに対して100種類用意した。各試料データとそこに含まれる被検物質データのピーク高さを組みにして100000の教師データとし、機械学習を行うことにより学習モデルを生成した。機械学習の手法として、全結合ニューラルネットワークを用い、活性化関数としてrelu関数、およびlinear関数を用いた。損失関数として平均二乗誤差を用い、最適化アルゴリズムにはAdamを用いた。十分な定量精度を得るには、20エポック程度の繰り返し演算が必要であった。
図10は図9の被検物質3種類の他に複数の異なる成分を加えたクロマトグラムの一例である。被検物質3種類の量は任意の量に調整してある。このように被検物質3種類の他に複数の異なる成分を加えたクロマトグラムを前記学習モデルに適用し、算出された被検物質のピーク高さ(予測値)と任意に調整した被検物質のピーク高さ(正解値)を比較したものが図11である。正解値に対して相関係数0.7〜0.9程度で予測する事ができた。
(実施例2)
実施例1と同様に図9のクロマトグラムを被検物質3種類に分け、それぞれを0から1.8(0.2刻み)の値で乗算し、被検物質毎に10種類のピーク高さが異なる被検物質データを得た。各被検物質データに対して、中央値、標準偏差、ピーク高さを乱数で設定した4つの正規分布波形を加算したものを試料データとした。試料データは1つの被検物質データに対して1000種類用意した。各試料データとそこに含まれる被検物質データのピーク高さを組みにして10000の教師データとし、被検物質毎に機械学習を行うことにより学習モデルを生成した。機械学習の手法として、全結合ニューラルネットワークを用い、活性化関数としてrelu関数、およびlinear関数を用いた。損失関数として平均二乗誤差を用い、最適化アルゴリズムにはAdamを用いた。十分な定量精度を得るには、100エポック程度の繰り返し演算が必要であった。
実施例1と同様に任意の量を含む被検物質3種類の他に複数の異なる成分を加えたクロマトグラムを用意した。そして、図12に示すように前記被検物質データ(501、502、503)と同じクロマトグラムの領域で分けた。そして、各被検物質に対応した領域のクロマトグラム(601、602、603)を被検物質毎に作成した前記学習モデルに適用し、各被検物質のピーク高さを算出した(予測値)。任意に調整した被検物質のピーク高さを正解値として比較したものが図13である。正解値に対して相関係数0.8〜0.9程度で予測する事ができた。
(実施例3)
実施例2の被検物質データに対して加算した正規分布波形の標準偏差をクロマトグラムの傾向から以下のように設定した。
標準偏差=(乱数0〜5)+時間×0.2+5
それ以外は実施例2の通りに行い、正解値と予測値を比較した(図14)。相関係数0.9程度で予測する事ができた。
(実施例4)
実施例1から3は最終的な出力としてピーク高さを求めていたが、ここではピーク高さから関連する情報を予測する手段について実施する。被検物質501から503はその量の比率によって試料のメーカー元を推定できる事が分かっている。予め各メーカーの試料中の被検物質501から503の量とメーカー元(本実施例ではAからEの5種類)を教師データとして機械学習した学習モデルを用意する。図15は学習モデルの例で全結合ニューラルネットワークを用いたものである。1101は入力層で被検物質501から503の量に相当する情報を入力する。1102は中間層である。本実施例では1層だが、被検物質や分類の数によっては複数層用意しても良い。また、ノードの数も適宜変更して良い。1103は出力層で、分類AからEは各メーカーを意味している。中間層から出力層を繋ぐ活性化関数はSoftmax関数とし、出力を確率とする。実施例1から3で得られた各被検物質の量(ピーク高さから算出する)を本実施例の学習モデルに適用する事で、被検物質を含む試料がどのメーカーの確率が高いかを表示させた。結果の一例を図16に示す。
(実施例5)
まず、上述したデータ処理の手法の効果を評価するために該手法をシミュレーションデータに適用した例について説明する。
被検物質データとして、中央値250、標準偏差20、ピーク高さ0.0から1.0まで0.1刻みの正規分布波形のデータを11種類用意した。データの範囲(トリミング範囲)は0から500とした。
各被検物質データに対して、中央値、標準偏差、ピーク高さを乱数で設定した4つの正規分布波形を加算したものを試料データとした。ピーク高さ(式1のa)は0.0から1.5、中央値(式1のb)は10から490(被検物質のピーク中央値に対して±240)、標準偏差(式1のc)は10から100までの範囲で乱数により決定した。試料データは1つの被検物質データに対して1000種類用意した。各試料データとそこに含まれる被検物質データのピーク高さを組みにして11000の教師データとし、機械学習を行うことにより学習モデルを生成した。機械学習の手法として、全結合ニューラルネットワークを用い、活性化関数としてrelu関数、およびlinear関数を用いた。損失関数として平均二乗誤差を用い、最適化アルゴリズムにはAdamを用いた。十分な定量精度を得るには、100エポック程度の繰り返し演算が必要であった。
試料データと同様の手法で作成したデータを、得られた学習モデルに適用し、試料データに含まれる被検物質のピーク高さを求めた。図17は横軸が試料データ作成時に用いた被検物質のピーク高さ(正解値)、縦軸が学習モデルを用いて得られた被検物質のピーク高さ(予測値)である。正解値と予測値の相関係数は0.99であった。
また、前記試料データと同様の手法で作成したデータに対して、従来のピーク分割法(ベースラインを設ける方法(図5))を適用したものを比較例として図18に示す。正解値と予測値の相関係数は0.68であった。
(実施例6)
上述したデータ処理の手法の効果を評価するために、該手法を尿中に含まれる、ビタミンB3の代謝物の一種である1,6−ジヒドロ−1−メチル−6−オキソ−3−ピリジンカルボアミド(以下、2pyと呼ぶ)の定量に適用した例について説明する。2py(0.0μg/mL、2.5μg/mL、5.0μg/mL、7.5μg/mL、10μg/mL)をHPLCで測定した実測波形を用意した。リテンションタイム100から400の範囲でトリミングし、2pyをHPLCで実測した波形に対して、中央値、標準偏差、ピーク高さを乱数で設定した4つの正規分布波形を加算し試料データを作成した。2pyのピーク中央値が250、標準偏差が10程度、想定する最大ピーク高さが500であった。これを踏まえて、ピーク高さ(式1のa)は0から750、中央値(式1のb)は130から370、標準偏差(式1のc)は5から50までの範囲で乱数により決定した。試料データは1つの2pyデータに対して1000種類用意した。各試料データとそこに含まれる2pyデータのピーク高さを組みにして5000の教師データとし、機械学習を行うことにより学習モデルを生成した。機械学習の手法は実施例5と同様である。
次に、2py(0.0μg/mL、2.5μg/mL、5.0μg/mL、7.5μg/mL、10μg/mL)とその他夾雑物を含む試料をHPLCで分析し、図19のクロマトグラムを得た。その他の夾雑物には(a:尿酸、b:trans−ウロカニン酸、c:N1−メチル−4−ピリドン−3−カルボキサミド、d:アデノシン)が含まれる。各クロマトグラムを生成した学習モデルに適用し、2pyに対応するピークの高さを予測したところ、正解値と予測値の相関係数は0.99だった(図20)。2pyは上記夾雑物(c)のピークと接していたが、問題なく予測できた。
(実施例7)
より夾雑物が多い実施例として、該手法をキリン株式会社の「無添加野菜48種の濃い野菜100%(以下、野菜ジュース)」中に添加した2pyの定量に適用した例について説明する。2pyに関しては実施例6と同様に予めHPLCで波形を測定し、学習モデルを生成した。リテンションタイムが0から200の範囲でトリミングした。そして、ピーク高さ(式1のa)は0.0から1.5、中央値(式1のb)は0から290、標準偏差(式1のc)は10から100までの範囲で乱数により決定し、4つの正規分布波形を加算し試料データを作成した。上記野菜ジュースは予め0.8μmのフィルターで粗大粒子を除き、GLサイエンス株式会社のモノスピンC18で前処理を行った。前処理は10000rpmで遠心分離する事で行った。前処理後の野菜ジュースに対して2py(0.0μg/mL、2.5μg/mL、5.0μg/mL、7.5μg/mL、10μg/mL)を添加し、HPLCで分析して図21のクロマトグラムを得た。図中の矢印で示した部分が2pyのリテンションタイムである。実施例6と同様に各クロマトグラムを生成した学習モデルに適用し2pyに対応するピークの高さを予測したところ、正解値と予測値の相関係数は0.99だった(図22)。夾雑物が多く、ベースラインが0にならない系においても、被検物質である2pyのピークの高さを問題なく予測できることがわかった。
10 情報処理装置
21 LAN
22 データベース
23 分析装置
31 通信IF
32 ROM
33 RAM
34 記憶部
35 操作部
36 表示部
37 制御部
41 スペクトル情報取得部
42 学習モデル生成部
43 学習モデル取得部
44 推定部
45 情報取得部
46 表示制御部
700 算出装置
701 被検物質
702 試料
703 受付部
704 取得部
705 算出部
706,707 分析部
708 データベース
709 生成部
710 データベース

Claims (41)

  1. 被検物質と夾雑物とを含む試料のスペクトル情報を学習モデルに入力することにより推定された、前記被検物質の定量的な情報を取得する情報取得手段を有し、前記学習モデルは、前記被検物質のスペクトル情報に基づいて生成された学習用スペクトル情報に基づいて生成されることを特徴とする情報処理装置。
  2. 前記試料に含まれる前記被検物質が複数種類であることを特徴とする、請求項1に記載の情報処理装置。
  3. 前記情報取得手段は、前記試料のスペクトル情報を、前記被検物質毎のスペクトル情報に分割する分割部を更に有することを特徴とする、請求項2に記載の情報処理装置。
  4. 前記分割部は、前記スペクトル情報のうちユーザーが指定する分割箇所で、前記スペクトル情報を分割することを特徴とする、請求項2または3に記載の情報処理装置。
  5. 前記分割部は、前記スペクトル情報のうちユーザーが指定する位置及び、前記位置を含む一定範囲を抽出して分割することを特徴とする、請求項3または4に記載の情報処理装置。
  6. 前記分割部は、前記スペクトル情報のうち、予め設けた閾値を超えた範囲を抽出して分割することを特徴とする、請求項3乃至5の何れか1項に記載の情報処理装置。
  7. 前記取得された定量的な情報を表示部に表示させる表示制御手段を更に有することを特徴とする、請求項1乃至6の何れか1項に記載の情報処理装置。
  8. 前記試料に含まれる前記被検物質が複数種類であり、
    前記表示制御手段は、前記複数種類の被検物質の定量的な情報から、ユーザーが指定する情報を選択して表示することを特徴とする請求項7に記載の情報処理装置。
  9. 前記学習モデルは、前記被検物質のスペクトル情報に基づいて生成された学習用スペクトル情報と、前記被検物質のスペクトル情報に基づいて特定される、前記被検物質の定量的な情報との複数の組を教師データとして用いて学習された学習モデルであることを特徴とする、請求項1乃至8の何れか1項に記載の情報処理装置。
  10. 前記学習用スペクトル情報は、前記被検物質のスペクトル情報とランダムノイズとを用いて生成されることを特徴とする、請求項9に記載の情報処理装置。
  11. 前記ランダムノイズは、複数のガウス関数の組み合わせによって得られる波形であることを特徴とする、請求項10に記載の情報処理装置。
  12. 前記ランダムノイズが、乱数、及び前記被検物質のスペクトル情報の中から選択される一部のスペクトル情報を用いて生成されるものであり、前記ランダムノイズは、前記一部のスペクトル情報に基づいて決まることを特徴とする請求項10または11に記載の情報処理装置。
  13. 前記試料のスペクトル情報を前記学習モデルに入力することにより、前記被検物質の定量的な情報を推定する推定手段を更に有することを特徴とする、請求項1乃至12の何れか1項に記載の情報処理装置。
  14. 前記スペクトル情報は、クロマトグラム、光電子スペクトル、赤外線吸収スペクトル、核磁気共鳴スペクトル、蛍光スペクトル、蛍光X線スペクトル、紫外/可視吸収スペクトル、ラマンスペクトル、原子吸光スペクトル、フレーム発光スペクトル、発光分光スペクトル、X線吸収スペクトル、X線回折スペクトル、常磁性共鳴吸収スペクトル、電子スピン共鳴スペクトル、質量スペクトル、及び熱分析スペクトルで構成される群から選択される少なくとも一種であることを特徴とする、請求項1乃至13の何れか1項に記載の情報処理装置。
  15. 前記試料のスペクトル情報を取得するための分析を行う分析手段を更に有することを特徴とする、請求項1乃至14の何れか1項に記載の情報処理装置。
  16. 前記分析手段は、クロマトグラフィー、キャピラリー電気泳動、光電子分光法、赤外吸収分光法、核磁気共鳴分光法、蛍光分光法、蛍光X線分光法、可視・紫外線吸収分光法、ラマン分光法、原子吸光法、フレーム発光分光法、発光分光法、X線吸収分光法、X線回折法、電子スピン共鳴分光法、質量分析法、及び熱分析法で構成される群から選択される少なくとも一種の手法を用いることを特徴とする請求項1乃至15の何れか1項に記載の情報処理装置。
  17. 前記被検物質は、タンパク質、DNA、ウイルス、菌類、水溶性ビタミン類、脂溶性ビタミン類、有機酸類、脂肪酸類、アミノ酸類、糖類、農薬、及び環境ホルモンで構成される群から選択される少なくとも一種であることを特徴とする、請求項1乃至16の何れか1項に記載の情報処理装置。
  18. 前記被検物質は、チアミン、リボフラビン、N1−メチルニコチンアミド、N1−メチル−2−ピリドン−5−カルボキサミド、N1−メチル−4−ピリドン−3−カルボキサミド、パントテン酸、ピリドキシン、4−ピリドキシン酸、ビオチン、シアノコバラミン、及びアスコルビン酸で構成される群から選択される少なくとも一種であることを特徴とする、請求項1乃至17の何れか1項に記載の情報処理装置。
  19. 前記定量的な情報は、前記被検物質が前記試料に含まれる量、前記被検物質が前記試料に含まれる濃度、前記試料中の前記被検物質の有無、前記被検物質の基準量に対する前記試料に含まれる前記被検物質の濃度あるいは量の比率、及び前記被検物質が前記試料に含まれる量あるいは濃度の比率で構成される群から選択される少なくとも一種であることを特徴とする、請求項1乃至18の何れか1項に記載の情報処理装置。
  20. 被検物質と夾雑物とを含む試料のスペクトル情報を学習モデルに入力することにより推定された、前記被検物質の定量的な情報を取得する情報取得工程を有し、前記学習モデルは、前記被検物質のスペクトル情報に基づいて生成された学習用スペクトル情報に基づいて生成されることを特徴とする情報処理装置の制御方法。
  21. 前記試料に含まれる前記被検物質が複数種類であることを特徴とする、請求項20に記載の情報処理装置の制御方法。
  22. 前記情報取得工程は、前記試料のスペクトル情報を、前記被検物質毎のスペクトル情報に分割する分割工程を更に有することを特徴とする、請求項21に記載の情報処理装置の制御方法。
  23. 前記分割工程は、前記スペクトル情報のうちユーザーが指定する分割箇所で、前記スペクトル情報を分割する工程を含むことを特徴とする、請求項21又は22に記載の情報処理装置の制御方法。
  24. 前記分割工程は、前記スペクトル情報のうちユーザーが指定する位置及び、前記位置を含む一定範囲を抽出して分割する工程を含むことを特徴とする、請求項22又は23に記載の情報処理装置の制御方法。
  25. 前記分割工程は、前記スペクトル情報のうち、予め設けた閾値を超えた範囲を抽出して分割する工程を含むことを特徴とする、請求項22乃至24の何れか1項に記載の情報処理装置の制御方法。
  26. 前記取得された前記被検物質の定量的な情報を表示部に表示させる表示制御工程を有することを特徴とする、請求項21乃至25の何れか1項に記載の情報処理装置の制御方法。
  27. 前記表示制御工程は、前記被検物質の定量的な情報から、ユーザーが指定する情報を選択して表示する工程を含むことを特徴とする請求項21乃至26の何れか1項に記載の情報処理装置の制御方法。
  28. 前記学習モデルは、前記被検物質のスペクトル情報に基づいて生成された学習用スペクトル情報と、前記被検物質のスペクトル情報に基づいて特定される、前記被検物質の定量的な情報との複数の組を教師データとして用いて学習された学習モデルであることを特徴とする、請求項21乃至27の何れか1項に記載の情報処理装置の制御方法。
  29. 前記学習用スペクトル情報は、前記被検物質のスペクトル情報とランダムノイズとを用いて生成されることを特徴とする、請求項28に記載の情報処理装置の制御方法。
  30. 前記ランダムノイズは、複数のガウス関数の組み合わせによって得られる波形であることを特徴とする、請求項29に記載の情報処理装置の制御方法。
  31. 前記ランダムノイズが、乱数、及び前記被検物質のスペクトル情報の中から選択される一部のスペクトル情報を用いて生成されるものであり、前記ランダムノイズは、前記一部のスペクトル情報に基づいて決まることを特徴とする請求項29又は30に記載の情報処理装置の制御方法。
  32. 前記試料のスペクトル情報を前記学習モデルに入力することにより、前記被検物質の定量的な情報を推定する推定工程を更に有することを特徴とする、請求項21乃至31の何れか1項に記載の情報処理装置の制御方法。
  33. 前記スペクトル情報は、クロマトグラム、光電子スペクトル、赤外線吸収スペクトル(IRスペクトル)、核磁気共鳴スペクトル(NMRスペクトル)、蛍光スペクトル、蛍光X線スペクトル、紫外/可視吸収スペクトル(UV/Visスペクトル)、ラマンスペクトル、原子吸光スペクトル、フレーム発光スペクトル、発光分光スペクトル、X線吸収スペクトル、X線回折スペクトル、常磁性共鳴吸収スペクトル、電子スピン共鳴スペクトル、質量スペクトル、及び熱分析スペクトルで構成される群から選択される少なくとも一種であることを特徴とする、請求項21乃至32の何れか1項に記載の情報処理装置の制御方法。
  34. 前記試料のスペクトル情報を取得するための分析を行う分析工程を更に有することを特徴とする、請求項21乃至33の何れか1項に記載の情報処理装置の制御方法。
  35. 前記分析工程は、クロマトグラフィー、キャピラリー電気泳動、光電子分光法、赤外吸収分光法、核磁気共鳴分光法、蛍光分光法、蛍光X線分光法、可視・紫外線吸収分光法、ラマン分光法、原子吸光法、フレーム発光分光法、発光分光法、X線吸収分光法、X線回折法、電子スピン共鳴分光法、質量分析法、及び熱分析法で構成される群から選択される少なくとも一種の手法を行うことを特徴とする請求項21乃至34の何れか1項に記載の情報処理装置の制御方法。
  36. 前記被検物質は、タンパク質、DNA、ウイルス、菌類、水溶性ビタミン類、脂溶性ビタミン類、有機酸類、脂肪酸類、アミノ酸類、糖類、農薬、及び環境ホルモンの少なくとも1つであることを特徴とする、請求項21乃至35の何れか1項に記載の情報処理装置の制御方法。
  37. 前記被検物質は、チアミン、リボフラビン、N1−メチルニコチンアミド、N1−メチル−2−ピリドン−5−カルボキサミド、N1−メチル−4−ピリドン−3−カルボキサミド、パントテン酸、ピリドキシン、4−ピリドキシン酸、ビオチン、シアノコバラミン、及びアスコルビン酸の少なくとも1つであることを特徴とする、請求項21乃至36の何れか1項に記載の情報処理装置の制御方法。
  38. 前記定量的な情報は、前記被検物質が前記試料に含まれる量、前記被検物質が前記試料に含まれる濃度、前記試料中の前記被検物質の有無、前記被検物質の基準量に対する前記試料に含まれる前記被検物質の濃度あるいは量の比率、及び前記被検物質が前記試料に含まれる量あるいは濃度の比率で構成される群から選択される少なくとも一種であることを特徴とする、請求項21乃至37の何れか1項に記載の情報処理装置の制御方法。
  39. 請求項1乃至38の何れか1項に記載の情報処理装置の各手段としてコンピュータを機能させることを特徴とするプログラム。
  40. 被検物質を含む試料のスペクトル情報を受け付ける受付部と、
    前記被検物質のスペクトル情報に関する学習モデルを取得する取得部と、
    前記試料のスペクトル情報と、前記学習モデルとに基づき、前記被検物質の定量的な情報を算出する算出部と、を有する算出装置。
  41. 被検物質を含む試料のスペクトル情報を受け付ける受付工程と、
    前記被検物質のスペクトル情報に関する学習モデルを取得する取得工程と、
    前記試料のスペクトル情報と、前記学習モデルとに基づき、前記被検物質の定量的な情報を算出する算出工程と、を有する算出方法。
JP2019208332A 2018-11-19 2019-11-18 情報処理装置、情報処理装置の制御方法、プログラム、算出装置、及び算出方法 Pending JP2020101524A (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2018216857 2018-11-19
JP2018216857 2018-11-19
JP2018243766 2018-12-26
JP2018243766 2018-12-26

Publications (1)

Publication Number Publication Date
JP2020101524A true JP2020101524A (ja) 2020-07-02

Family

ID=70773592

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019208332A Pending JP2020101524A (ja) 2018-11-19 2019-11-18 情報処理装置、情報処理装置の制御方法、プログラム、算出装置、及び算出方法

Country Status (5)

Country Link
US (1) US20210248417A1 (ja)
EP (1) EP3865872A4 (ja)
JP (1) JP2020101524A (ja)
CN (1) CN113056672A (ja)
WO (1) WO2020105566A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11796495B2 (en) 2020-09-03 2023-10-24 Rigaku Corporation Total reflection X-ray fluorescence spectrometer and estimation method

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021064924A1 (ja) * 2019-10-02 2021-04-08 株式会社島津製作所 波形解析方法及び波形解析装置
JP7342629B2 (ja) * 2019-11-06 2023-09-12 株式会社島津製作所 試料成分推定方法、試料成分推定装置、試料成分推定プログラム、学習方法および学習プログラム
JP7226388B2 (ja) * 2020-04-24 2023-02-21 トヨタ自動車株式会社 車両制御装置、車両制御方法及び車両制御用コンピュータプログラム
WO2021240939A1 (ja) * 2020-05-29 2021-12-02 株式会社島津製作所 データ処理装置、データ処理方法、データ処理プログラムおよび分析装置
CN115997219A (zh) * 2020-06-23 2023-04-21 株式会社岛津制作所 数据生成方法及装置、以及识别器的生成方法及装置
EP4141440A1 (de) * 2021-08-26 2023-03-01 Siemens Aktiengesellschaft Ki-beschleunigtes analyseverfahren, auswertungseinheit, gaschromatograph, analysesystem und computerprogrammprodukt

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5218529A (en) * 1990-07-30 1993-06-08 University Of Georgia Research Foundation, Inc. Neural network system and methods for analysis of organic materials and structures using spectral data
JP3130139B2 (ja) * 1992-09-17 2001-01-31 株式会社日立製作所 クロマトグラム解析方法及びクロマトグラフ装置
JP3071085B2 (ja) 1993-03-15 2000-07-31 株式会社日立製作所 クロマトグラム解析表示方法及びその装置
JP3391862B2 (ja) * 1993-10-05 2003-03-31 株式会社日立製作所 クロマトグラム解析方法
JP3583771B2 (ja) * 2002-10-10 2004-11-04 株式会社日立製作所 クロマトグラム解析方法
US7410763B2 (en) * 2005-09-01 2008-08-12 Intel Corporation Multiplex data collection and analysis in bioanalyte detection
JP3888389B2 (ja) * 2006-03-27 2007-02-28 株式会社日立製作所 クロマトデータ処理装置,クロマトデータ処理方法、及びクロマトグラフ分析装置
EP1967846A1 (en) * 2007-03-05 2008-09-10 National University of Ireland Galway En ensemble method and apparatus for classifying materials and quantifying the composition of mixtures
US20100266185A1 (en) * 2009-04-21 2010-10-21 Sloan Kettering Institute of Cancer Malignant tissue recognition model for the prostate
US20140012504A1 (en) * 2012-06-14 2014-01-09 Ramot At Tel-Aviv University Ltd. Quantitative assessment of soil contaminants, particularly hydrocarbons, using reflectance spectroscopy
JP6036304B2 (ja) * 2013-01-08 2016-11-30 株式会社島津製作所 クロマトグラフ質量分析用データ処理装置
US10416134B2 (en) * 2014-09-03 2019-09-17 Shimadzu Corporation Chromatogram data processing method and chromatogram data processing apparatus
US10591388B2 (en) * 2015-04-27 2020-03-17 Virtual Fluid Monitoring Services LLC Fluid analysis and monitoring using optical spectroscopy
WO2018020652A1 (ja) * 2016-07-29 2018-02-01 株式会社島津製作所 質量分析データ解析装置及び解析方法
JP6280997B1 (ja) * 2016-10-31 2018-02-14 株式会社Preferred Networks 疾患の罹患判定装置、疾患の罹患判定方法、疾患の特徴抽出装置及び疾患の特徴抽出方法
WO2018117129A1 (ja) * 2016-12-19 2018-06-28 株式会社ユカシカド 尿検査装置および尿検査方法
WO2018134952A1 (ja) * 2017-01-19 2018-07-26 株式会社島津製作所 分析データ解析方法および分析データ解析装置
JP6729455B2 (ja) 2017-03-15 2020-07-22 株式会社島津製作所 分析データ解析装置及び分析データ解析方法
WO2019060298A1 (en) * 2017-09-19 2019-03-28 Neuroenhancement Lab, LLC METHOD AND APPARATUS FOR NEURO-ACTIVATION
US11302039B2 (en) * 2017-11-09 2022-04-12 Shimadzu Corporation Waveform analyzer
US11841373B2 (en) * 2019-06-28 2023-12-12 Canon Kabushiki Kaisha Information processing apparatus, method for controlling information processing apparatus, and program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11796495B2 (en) 2020-09-03 2023-10-24 Rigaku Corporation Total reflection X-ray fluorescence spectrometer and estimation method

Also Published As

Publication number Publication date
CN113056672A (zh) 2021-06-29
EP3865872A1 (en) 2021-08-18
EP3865872A4 (en) 2022-08-10
WO2020105566A1 (ja) 2020-05-28
US20210248417A1 (en) 2021-08-12

Similar Documents

Publication Publication Date Title
WO2020105566A1 (ja) 情報処理装置、情報処理装置の制御方法、プログラム、算出装置、及び算出方法
Checa et al. Lipidomic data analysis: tutorial, practical guidelines and applications
JP7483367B2 (ja) 情報処理装置、情報処理装置の制御方法、及びプログラム
Carmel et al. A feature extraction method for chemical sensors in electronic noses
JP5496650B2 (ja) サンプル内の個々の要素を識別及び定量化するために分光測定データを分析するシステム、方法及びコンピュータプログラム製品
Jimenez-Carvelo et al. Data mining/machine learning methods in foodomics
US20160216244A1 (en) Method and electronic nose for comparing odors
JP2014532187A (ja) 時および/または空間系列ファイルの多成分回帰/多成分分析
Karaman et al. Sparse multi-block PLSR for biomarker discovery when integrating data from LC–MS and NMR metabolomics
US20220252531A1 (en) Information processing apparatus and control method for information processing apparatus
Walach et al. Robust biomarker identification in a two-class problem based on pairwise log-ratios
Hategan et al. The improvement of honey recognition models built on 1H NMR fingerprint through a new proposed approach for feature selection
US11841373B2 (en) Information processing apparatus, method for controlling information processing apparatus, and program
Ju et al. Identification of rice varieties and adulteration using gas chromatography-ion mobility spectrometry
JP2020106340A (ja) 情報処理装置、情報処理装置の制御方法、及びプログラム
JP2021009135A (ja) 情報処理装置、情報処理装置の制御方法、及びプログラム
JP4873483B2 (ja) 信号強度の時系列情報の解析方法、解析プログラム、並びに解析装置
JP2018054305A (ja) 検量装置、及び、検量線作成方法
Millioni et al. Operator-and software-related post-experimental variability and source of error in 2-DE analysis
Soh et al. A comparison between the human sense of smell and neural activity in the olfactory bulb of rats
WO2013150291A1 (en) A method for measuring performance of a spectroscopy system
Euceda et al. Prediction of clinical endpoints in breast cancer using NMR metabolic profiles
JP2018054307A (ja) 検量装置、検量線作成方法、及び、独立成分分析方法
Üstündağ et al. Comparative application of PLS and PCR methods to simultaneous quantitative estimation and simultaneous dissolution test of zidovudine-lamivudine tablets
Mohammadkhani et al. Effect of different pretreatment methods on classification of serum samples measured with 1 H-NMR

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231114

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20231213

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240109

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240326

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240524