JP2020139914A - 物質構造分析装置、方法及びプログラム - Google Patents

物質構造分析装置、方法及びプログラム Download PDF

Info

Publication number
JP2020139914A
JP2020139914A JP2019037758A JP2019037758A JP2020139914A JP 2020139914 A JP2020139914 A JP 2020139914A JP 2019037758 A JP2019037758 A JP 2019037758A JP 2019037758 A JP2019037758 A JP 2019037758A JP 2020139914 A JP2020139914 A JP 2020139914A
Authority
JP
Japan
Prior art keywords
neural network
data
structural
spectral
substance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019037758A
Other languages
English (en)
Inventor
大資 本木
Daisuke Motoki
大資 本木
孝祐 中郷
Kosuke Nakago
孝祐 中郷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Preferred Networks Inc
Original Assignee
Preferred Networks Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Preferred Networks Inc filed Critical Preferred Networks Inc
Priority to JP2019037758A priority Critical patent/JP2020139914A/ja
Priority to US16/784,717 priority patent/US20200279148A1/en
Publication of JP2020139914A publication Critical patent/JP2020139914A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/40Searching chemical structures or physicochemical data
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Chemical & Material Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • General Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

【課題】機械学習を利用した任意の物質の全体構造を予測するための物質構造分析手法を提供することである。
【解決手段】本開示の一態様は、プロセッサにより実行されるステップからなる物質構造分析方法であって、物質の構造を表す構造データと物質のスペクトルを表すスペクトルデータとを取得するステップと、前記構造データを第1のニューラルネットワークに入力し、前記第1のニューラルネットワークから構造特徴量を取得するステップと、前記スペクトルデータを第2のニューラルネットワークに入力し、前記第2のニューラルネットワークからスペクトル特徴量を取得するステップと、前記構造特徴量と前記スペクトル特徴量とに基づき、前記構造データに対応する物質と前記スペクトルデータに対応する物質との一致度を決定するステップと、を有する物質構造分析方法に関する。
【選択図】図1

Description

本開示は、物質構造分析に関する。
物質、材料などの化学構造を分析及び決定するための化学の一分野として物質構造分析がある。物質構造分析では、例えば、CASE(Computer Assisted Structure Elusidation)システムなどのように、物質から得られたスペクトルデータがコンピュータによって分析され、当該物質の化学構造が予測される。
ディープラーニングなどの近年の機械学習技術の進展によって、機械学習を利用した物質構造分析に対するアプローチも提案されるようになってきた。例えば、機械学習を利用して、測定されたスペクトルデータに基づき分析対象の物質が所定種類の部分構造を有しているか判定する物質構造分析アプローチが提案されている。また、機械学習を利用して、分析対象の物質のスペクトルデータが事前に定義されたクラスの何れに分類されるか判定する物質構造分析アプローチが提案されている。また、物質構造分析の基礎となるスペクトル測定結果は、測定時の環境状態、物質状態、測定手法などに依存して変動することが当業者によく知られている。
特開平11−108833号公報
"Joint Neural Network Interpretation of Infrared and Mass Spectra", Christoph Klawun and Charles L. Wilkins, J. Chem, Inf. Comput. Sci., 1996, 36(2), pp 249-257 "Deep Convolutional Neural Networks for Raman Spectrum Recognition: A Unified Solution", Jinchao Liu, Margarita Osadchy, Lorna Ashton, Michael Foster, Christopher J. Solomon, Stuart J. Gibson, arXiv: 1708.09022
本開示の課題は、機械学習を利用した任意の物質の全体構造を予測するための物質構造分析手法を提供することである。
上記課題を解決するため、本開示の一態様は、プロセッサにより実行されるステップからなる物質構造分析方法であって、物質の構造を表す構造データと物質のスペクトルを表すスペクトルデータとを取得するステップと、前記構造データを第1のニューラルネットワークに入力し、前記第1のニューラルネットワークから構造特徴量を取得するステップと、前記スペクトルデータを第2のニューラルネットワークに入力し、前記第2のニューラルネットワークからスペクトル特徴量を取得するステップと、前記構造特徴量と前記スペクトル特徴量とに基づき、前記構造データに対応する物質と前記スペクトルデータに対応する物質との一致度を決定するステップと、を有する物質構造分析方法に関する。
本開示によると、機械学習を利用した任意の物質の全体構造を予測するための物質構造分析手法を提供することができる。
本開示の一実施例による物質構造分析装置の概略を示す図である。 本開示の一実施例による物質構造分析装置の機能構成を示すブロック図である。 本開示の一実施例による物質構造分析装置のニューラルネットワークの学習処理を示すフローチャートである。 本開示の一実施例による物質構造分析装置の概略を示す図である。 本開示の一実施例による物質構造分析装置の機能構成を示すブロック図である。 本開示の一実施例による物質構造分析装置のニューラルネットワークの学習処理を示すフローチャートである。 本開示の一実施例による物質構造分析装置の概略を示す図である。 本開示の一実施例による物質構造分析装置の機能構成を示すブロック図である。 本開示の一実施例による物質構造分析装置のニューラルネットワークの学習処理を示すフローチャートである。 本開示の一実施例による物質構造分析装置の概略を示す図である。 本開示の一実施例による物質構造分析装置の概略を示す図である。 本開示の一実施例による物質構造分析装置の機能構成を示すブロック図である。 本開示の一実施例による物質構造分析装置のニューラルネットワークの学習処理を示すフローチャートである。 本開示の一実施例による物質構造分析装置の概略を示す図である。 本開示の一実施例による物質構造分析装置の機能構成を示すブロック図である。 本開示の一実施例による物質構造分析装置のニューラルネットワークの学習処理を示すフローチャートである。 本開示の一実施例による物質構造分析装置のハードウェア構成を示すブロック図である。
以下の実施例では、機械学習を利用した物質構造分析装置が開示される。
本開示を概略すると、一実施例による物質構造分析装置は、物質の構造を表す構造データから構造特徴量を抽出する構造データ用ニューラルネットワーク(例えば、グラフ畳み込みニューラルネットワークにより実現される)と、物質のスペクトルを表すスペクトルデータからスペクトル特徴量を抽出するスペクトルデータ用ニューラルネットワーク(例えば、畳み込みニューラルネットワークにより実現される)とを利用して、入力された構造データ及びスペクトルデータから構造特徴量及びスペクトル特徴量を取得し、取得した構造特徴量とスペクトル特徴量とに基づき構造データに対応する物質とスペクトルデータに対応する物質との一致度を決定する。
本実施例によると、例えば、分析対象の物質のスペクトルデータが与えられたとき、物質構造分析装置は、当該物質の候補物質の構造データ(例えば、SMILES(Simplified Molecular Input Line Entry System)記法、InChI(International Chemical Identifier)記法などによって記述されたデータ)と与えられたスペクトルデータとに対して上述した処理を実行し、分析対象物質と候補物質との一致度を決定する。ユーザは、物質構造分析装置によって決定された各候補物質の一致度に基づき、何れの候補物質が分析対象の物質に該当するか予測することができる。
まず、図1及び2を参照して、本開示の一実施例による物質構造分析装置を説明する。図1は、本開示の一実施例による物質構造分析装置の概略を示す図である。
図1に示されるように、物質構造分析装置100は、構造データ用ニューラルネットワーク110及びスペクトルデータ用ニューラルネットワーク120を有する。しかしながら、本開示による物質構造分析装置100は、構造データ用ニューラルネットワーク110及びスペクトルデータ用ニューラルネットワーク120の全て又は一部を必ずしも有さなくてもよく、外部装置(図示せず)に格納されている構造データ用ニューラルネットワーク110及びスペクトルデータ用ニューラルネットワーク120の全て又は一部にアクセスすることによって、これらを利用してもよい。
構造データ用ニューラルネットワーク110は、物質の構造を表す構造データから構造特徴量を抽出する。当該構造データは、例えば、SMILES記法、InChI記法などで記述されている物質の構造をグラフ構造に変換したものであってもよい。構造データ用ニューラルネットワーク110は、以降において詳細に説明される学習処理によって学習され、入力された構造データを当該物質の構造を表す構造特徴量に変換する。例えば、構造データ用ニューラルネットワーク110は、任意のデータサイズの構造データを処理可能なグラフ畳み込みニューラルネットワークであってもよく、構造特徴量としてn次元のベクトルを出力してもよい。
スペクトルデータ用ニューラルネットワーク120は、物質のスペクトルを表すスペクトルデータからスペクトル特徴量を抽出する。当該スペクトルデータは、典型的には、1次元の波形データであり、質量分析法によるマススペクトル、赤外線(IR)スペクトル、X線スペクトル、Raman分光法によるスペクトル、核磁気共鳴分光法によるNMR(Nuclear Magnetic Resonance)スペクトル、LIBS(Laser−Induced Breakdown Spectroscopy)によるスペクトルなど、物質の構造分析に利用される何れかのスペクトルを示すものであってもよい。スペクトルデータ用ニューラルネットワーク120は、以降において詳細に説明される学習処理によって学習され、入力されたスペクトルデータを当該物質のスペクトルを表すスペクトル特徴量に変換する。例えば、スペクトルデータ用ニューラルネットワーク120は、畳み込みニューラルネットワークであってもよく、スペクトル特徴量としてn次元のベクトルを出力してもよい。
図2は、本開示の一実施例による物質構造分析装置の機能構成を示すブロック図である。図2に示されるように、物質構造分析装置100は、構造特徴量抽出部110A、スペクトル特徴量抽出部120A及び一致度決定部130Aを有する。
構造特徴量抽出部110Aは、構造データ用ニューラルネットワーク110によって物質の構造を表す構造データから構造特徴量を抽出する。すなわち、構造特徴量抽出部110Aは、取得した構造データを構造データ用ニューラルネットワーク110に入力し、構造データ用ニューラルネットワーク110から構造特徴量を取得する。取得した構造特徴量は、一致度決定部130Aにわたされる。
スペクトル特徴量抽出部120Aは、スペクトルデータ用ニューラルネットワーク120によって物質のスペクトルを表すスペクトルデータからスペクトル特徴量を抽出する。すなわち、スペクトル特徴量抽出部120Aは、取得したスペクトルデータをスペクトルデータ用ニューラルネットワーク120に入力し、スペクトルデータ用ニューラルネットワーク120からスペクトル特徴量を取得する。取得したスペクトル特徴量は、一致度決定部130Aにわたされる。
一致度決定部130Aは、構造特徴量とスペクトル特徴量とに基づき、構造データに対応する物質とスペクトルデータに対応する物質との一致度を決定する。すなわち、一致度決定部130Aは、構造特徴量抽出部110A及びスペクトル特徴量抽出部120Aから構造特徴量及びスペクトル特徴量をそれぞれ取得すると、取得した構造特徴量とスペクトル特徴量との間のメトリック(例えば、相違度、類似度など)に基づき、入力された構造データに対応する物質と入力されたスペクトルデータに対応する物質との間の一致度を決定する。
当該メトリックは、例えば、コサイン類似度、contrastive lossなどのベクトル間の類似度又は相違度を表す何れかの指標であってもよく、一致度は、例えば、算出されたメトリックを0から1の範囲などの所定の範囲内に正規化したものであってもよい。
例えば、分析対象の物質のスペクトルデータと当該物質の1つ以上の候補物質の構造データとが与えられたとき、物質構造分析装置100は、各候補物質の構造データと分析対象物質のスペクトルデータとに対して上述した処理を実行することによって各候補物質と分析対象物質との間の一致度を算出し、最も大きな一致度を有する候補物質を分析対象物質として決定してもよい。
本実施例による構造データ用ニューラルネットワーク110及びスペクトルデータ用ニューラルネットワーク120は、図3に示されるような学習処理に従って学習されてもよい。なお、当該学習処理は、物質構造分析装置100によって実行されてもよいし、あるいは、外部装置(図示せず)によって実行され、学習済みの構造データ用ニューラルネットワーク110及びスペクトルデータ用ニューラルネットワーク120が物質構造分析装置100に提供されてもよい。以下では、物質構造分析装置100が学習処理を実行する実施例を説明する。
ステップS101において、物質構造分析装置100は、訓練用の構造データ及びスペクトルデータの組み合わせを取得する。例えば、訓練用の構造データ及びスペクトルデータの組み合わせは、同一物質の構造データ及びスペクトルデータの組み合わせ(ポジティブデータ)であってもよいし、異なる物質の構造データ及びスペクトルデータの組み合わせ(ネガティブデータ)であってもよい。
ステップS102において、物質構造分析装置100は、取得した訓練用の構造データ及びスペクトルデータを学習対象の構造データ用ニューラルネットワーク110及びスペクトルデータ用ニューラルネットワーク120に入力する。例えば、構造データ用ニューラルネットワーク110は、任意のデータサイズの構造データを処理可能なグラフ畳み込みニューラルネットワークであってもよく、スペクトルデータ用ニューラルネットワーク120は、1次元波形データを処理可能な畳み込みニューラルネットワークであってもよい。
ステップS103において、物質構造分析装置100は、構造データ用ニューラルネットワーク110及びスペクトルデータ用ニューラルネットワーク120から構造特徴量及びスペクトル特徴量をそれぞれ取得し、取得した構造特徴量とスペクトル特徴量との間のメトリック及び/又は一致度を算出する。
ステップS104において、物質構造分析装置100は、算出したメトリック又は当該メトリックから算出された一致度に基づき構造データ用ニューラルネットワーク110及びスペクトルデータ用ニューラルネットワーク120を学習する。
一実施例では、構造データ用ニューラルネットワーク110及びスペクトルデータ用ニューラルネットワーク120は、ポジティブペアに対する一致度が大きくなり、ネガティブペアに対する一致度が小さくなるよう学習されてもよい。
すなわち、入力された訓練データが同一物質の構造データ及びスペクトルデータの組み合わせ(ポジティブデータ)である場合、物質構造分析装置100は、メトリック(相違度又は距離)が小さくなるように、すなわち、一致度(類似度)が高くなるように、誤差逆伝播法に従って構造データ用ニューラルネットワーク110及びスペクトルデータ用ニューラルネットワーク120のパラメータを更新してもよい。他方、入力された訓練データが異なる物質の構造データ及びスペクトルデータの組み合わせ(ネガティブデータ)である場合、物質構造分析装置100は、メトリック(相違度又は距離)が大きくなるように、すなわち、一致度(類似度)が低くなるように、誤差逆伝播法に従って構造データ用ニューラルネットワーク110及びスペクトルデータ用ニューラルネットワーク120のパラメータを更新してもよい。
また、他の実施例では、構造データ用ニューラルネットワーク110及びスペクトルデータ用ニューラルネットワーク120は、ポジティブペアに対する一致度とネガティブペアに対する一致度との間の差が大きくなるよう学習されてもよい。
具体的には、物質構造分析装置100は、物質Aのスペクトルデータに対するポジティブデータ、すなわち、物質Aの構造データ及び物質Aのスペクトルデータの組み合わせと、物質Aのスペクトルデータに対するネガティブデータ、すなわち、物質Bの構造データ及び物質Aのスペクトルデータの組み合わせとを利用して、物質Aの構造特徴量、物質Bの構造特徴量及び物質Aのスペクトル特徴量に基づき、構造データ用ニューラルネットワーク110及びスペクトルデータ用ニューラルネットワーク120を学習してもよい。この場合、物質構造分析装置100は、物質Aの構造特徴量と物質Aのスペクトル特徴量との間のメトリック又は当該メトリックから算出される一致度と、物質Bの構造特徴量と物質Aのスペクトル特徴量との間のメトリック又は当該メトリックから算出される一致度との間の差が大きくなるように、誤差逆伝播法に従って構造データ用ニューラルネットワーク110及びスペクトルデータ用ニューラルネットワーク120のパラメータを更新してもよい。
あるいは、物質構造分析装置100は、物質Aの構造データに対するポジティブデータ、すなわち、物質Aの構造データ及び物質Aのスペクトルデータの組み合わせと、物質Aの構造データに対するネガティブデータ、すなわち、物質Aの構造データ及び物質Bのスペクトルデータの組み合わせとを利用して、物質Aの構造特徴量、物質Aのスペクトル特徴量及び物質Bのスペクトル特徴量に基づき、構造データ用ニューラルネットワーク110及びスペクトルデータ用ニューラルネットワーク120を学習してもよい。この場合、物質構造分析装置100は、物質Aの構造特徴量と物質Aのスペクトル特徴量との間のメトリック又は当該メトリックから算出される一致度と、物質Aの構造特徴量と物質Bのスペクトル特徴量との間のメトリック又は当該メトリックから算出される一致度との間の差が大きくなるように、誤差逆伝播法に従って構造データ用ニューラルネットワーク110及びスペクトルデータ用ニューラルネットワーク120のパラメータを更新してもよい。
あるいは、物質構造分析装置100は、構造データ用ニューラルネットワーク110及びスペクトルデータ用ニューラルネットワーク120の出力を確率分布とみなし、事前分布(Gaussianなどを用いてもよい)とのKL(Kullback−Leibler)ダイバージェンスを損失関数として利用して、構造データ用ニューラルネットワーク110及びスペクトルデータ用ニューラルネットワーク120のパラメータを更新してもよい。
ステップS105において、物質構造分析装置100は、終了条件が充足されているか判断する。終了条件としては、例えば、所定数の訓練データが処理されたこと、パラメータの更新量が収束したことなどであってもよい。
終了条件が充足された場合(S105:YES)、物質構造分析装置100は、当該学習処理を終了し、最終的に取得された構造データ用ニューラルネットワーク110及びスペクトルデータ用ニューラルネットワーク120を学習済み構造データ用ニューラルネットワーク110及びスペクトルデータ用ニューラルネットワーク120として保持する。
他方、終了条件が充足されていない場合(S105:NO)、物質構造分析装置100は、ステップS101に戻って次の訓練データを処理する。
次に、図4〜6を参照して、本開示の他の実施例による物質構造分析装置を説明する。本実施例では、スペクトルデータ用ニューラルネットワーク120が、スペクトルデータ復元用ニューラルネットワーク121と一緒になってオートエンコーダを構成し、入力されたスペクトルデータを復元可能な情報量を有したスペクトル特徴量を生成する。図4は、本開示の一実施例による物質構造分析装置の概略を示す図である。
図4に示されるように、物質構造分析装置100は、上述した構造データ用ニューラルネットワーク110及びスペクトルデータ用ニューラルネットワーク120に加えて、スペクトルデータ復元用ニューラルネットワーク121を更に有する。しかしながら、本開示による物質構造分析装置100は、構造データ用ニューラルネットワーク110、スペクトルデータ用ニューラルネットワーク120及びスペクトルデータ復元用ニューラルネットワーク121の全て又は一部を必ずしも有さなくてもよく、外部装置(図示せず)に格納されている構造データ用ニューラルネットワーク110、スペクトルデータ用ニューラルネットワーク120及びスペクトルデータ復元用ニューラルネットワーク121の全て又は一部にアクセスすることによって、これらを利用してもよい。本実施例による構造データ用ニューラルネットワーク110及びスペクトルデータ用ニューラルネットワーク120とメトリック及び一致度の計算は、上述した実施例と同様であり、説明の重複を避けるため、それらの説明は省く。
スペクトルデータ復元用ニューラルネットワーク121は、物質のスペクトル特徴量から当該物質のスペクトルデータを復元する。すなわち、スペクトルデータ用ニューラルネットワーク120とスペクトルデータ復元用ニューラルネットワーク121とは、オートエンコーダを構成する。以降で詳細に説明されるように、オートエンコーダとして学習されたスペクトルデータ用ニューラルネットワーク120は、以降においてスペクトルデータ復元用ニューラルネットワーク121によって復元可能な情報量を有するスペクトル特徴量を生成する。なお、学習処理の終了後、物質構造分析装置100は、スペクトルデータ復元用ニューラルネットワーク121を利用してスペクトルデータを復元してもよいし、学習処理のためにのみ利用してもよい。
図5は、本開示の一実施例による物質構造分析装置の機能構成を示すブロック図である。図5に示されるように、物質構造分析装置100は、構造特徴量抽出部110B、スペクトル特徴量抽出部120B、一致度決定部130B及びスペクトルデータ復元部121Bを有する。なお、構造特徴量抽出部110B、スペクトル特徴量抽出部120B及び一致度決定部130Bは、図2を参照して上述した構造特徴量抽出部110A、スペクトル特徴量抽出部120A及び一致度決定部130Aと同様であり、説明の重複を避けるため、それらの説明は省く。
スペクトルデータ復元部121Bは、取得した物質のスペクトルデータから抽出されたスペクトル特徴量から当該物質のスペクトルデータを復元する。すなわち、スペクトルデータ復元部121Bは、スペクトル特徴量抽出部120Bと一緒になってオートエンコーダを構成し、スペクトル特徴量抽出部120Bから取得したスペクトル特徴量をスペクトルデータ復元用ニューラルネットワーク121に入力し、スペクトルデータ復元用ニューラルネットワーク121からスペクトルデータを取得する。スペクトルデータ復元部121B及びスペクトルデータ復元用ニューラルネットワーク121を配置することによって、スペクトル特徴量抽出部120Bから抽出されるスペクトル特徴量は、当該スペクトル特徴量から元のスペクトルデータを復元可能な情報量を有するものとすることができる。
本実施例による構造データ用ニューラルネットワーク110、スペクトルデータ用ニューラルネットワーク120及びスペクトルデータ復元用ニューラルネットワーク121は、図6に示されるような学習処理に従って学習されてもよい。なお、当該学習処理は、物質構造分析装置100によって実行されてもよいし、あるいは、外部装置(図示せず)によって実行され、学習済みの構造データ用ニューラルネットワーク110、スペクトルデータ用ニューラルネットワーク120及びスペクトルデータ復元用ニューラルネットワーク121が物質構造分析装置100に提供されてもよい。以下では、物質構造分析装置100が学習処理を実行する実施例を説明する。なお、ステップS201〜S203,S206はそれぞれステップS101〜S103,S105と同様であり、説明の重複を避けるため、それらの説明は省く。
ステップS204において、物質構造分析装置100は、取得したスペクトル特徴量をスペクトルデータ復元用ニューラルネットワーク121に入力する。ここで、スペクトルデータ用ニューラルネットワーク120は、畳み込みニューラルネットワークであってもよく、スペクトルデータ復元用ニューラルネットワーク121と一緒になってオートエンコーダを構成する。
ステップS205において、物質構造分析装置100は、スペクトルデータ復元用ニューラルネットワーク121から復元されたスペクトルデータを取得し、復元されたスペクトルデータと入力された訓練用のスペクトルデータとの誤差を算出する。そして、物質構造分析装置100は、構造特徴量及びスペクトル特徴量から算出したメトリック又は当該メトリックから算出された一致度と、復元されたスペクトルデータ及び訓練用のスペクトルデータから算出された誤差とに基づき、構造データ用ニューラルネットワーク110、スペクトルデータ用ニューラルネットワーク120及びスペクトルデータ復元用ニューラルネットワーク121を学習する。具体的には、物質構造分析装置100は、算出した誤差及びメトリックが小さくなるように、あるいは、算出した誤差が小さくなると共に一致度が高くなるように、誤差逆伝播法に従って構造データ用ニューラルネットワーク110、スペクトルデータ用ニューラルネットワーク120及びスペクトルデータ復元用ニューラルネットワーク121のパラメータを更新する。
次に、図7〜9を参照して、本開示の他の実施例による物質構造分析装置を説明する。本実施例では、構造データ用ニューラルネットワーク110が、構造データ復元用ニューラルネットワーク111と一緒になってオートエンコーダを構成し、入力された構造データを復元可能な情報量を有した構造特徴量を生成する。図7は、本開示の一実施例による物質構造分析装置の概略を示す図である。
図7に示されるように、物質構造分析装置100は、上述した構造データ用ニューラルネットワーク110及びスペクトルデータ用ニューラルネットワーク120に加えて、構造データ復元用ニューラルネットワーク111を更に有する。しかしながら、本開示による物質構造分析装置100は、構造データ用ニューラルネットワーク110、スペクトルデータ用ニューラルネットワーク120及び構造データ復元用ニューラルネットワーク121の全て又は一部を必ずしも有さなくてもよく、外部装置(図示せず)に格納されている構造データ用ニューラルネットワーク110、スペクトルデータ用ニューラルネットワーク120及び構造データ復元用ニューラルネットワーク111の全て又は一部にアクセスすることによって、これらを利用してもよい。本実施例による構造データ用ニューラルネットワーク110及びスペクトルデータ用ニューラルネットワーク120とメトリック及び一致度の計算は、上述した実施例と同様であり、説明の重複を避けるため、それらの説明は省く。
構造データ復元用ニューラルネットワーク111は、物質の構造特徴量から当該物質の構造データを復元する。すなわち、構造データ用ニューラルネットワーク110と構造データ復元用ニューラルネットワーク111とは、オートエンコーダを構成する。以降で詳細に説明されるように、オートエンコーダとして学習された構造データ用ニューラルネットワーク110は、構造データ復元用ニューラルネットワーク111によって復元可能な情報量を有する構造特徴量を生成する。グラフ復元用のアルゴリズムとしては、GraphVAE、Junction Tree VAEなどが利用可能である。なお、学習処理の終了後、物質構造分析装置100は、構造データ復元用ニューラルネットワーク111を利用して構造データを復元してもよいし、学習処理のためにのみ利用してもよい。
図8は、本開示の一実施例による物質構造分析装置の機能構成を示すブロック図である。図8に示されるように、物質構造分析装置100は、構造特徴量抽出部110C、スペクトル特徴量抽出部120C、一致度決定部130C及び構造データ復元部111Cを有する。なお、構造特徴量抽出部110C、スペクトル特徴量抽出部120C及び一致度決定部130Cは、図2を参照して上述した構造特徴量抽出部110A、スペクトル特徴量抽出部120A及び一致度決定部130Aと同様であり、説明の重複を避けるため、それらの説明は省く。
構造データ復元部111Cは、取得した物質の構造データから抽出された構造特徴量から当該物質の構造データを復元する。すなわち、構造データ復元部111Cは、構造特徴量抽出部110Cと一緒になってオートエンコーダを構成し、構造特徴量抽出部110Cから取得した構造特徴量を構造データ復元用ニューラルネットワーク111に入力し、構造データ復元用ニューラルネットワーク111から構造データを取得する。構造データ復元部111C及び構造データ復元用ニューラルネットワーク111を配置することによって、構造特徴量抽出部110Cから抽出される構造特徴量は、当該構造特徴量から元の構造データを復元可能な情報量を有するものとすることができる。
本実施例による構造データ用ニューラルネットワーク110、スペクトルデータ用ニューラルネットワーク120及び構造データ復元用ニューラルネットワーク111は、図9に示されるような学習処理に従って学習されてもよい。なお、当該学習処理は、物質構造分析装置100によって実行されてもよいし、あるいは、外部装置(図示せず)によって実行され、学習済みの構造データ用ニューラルネットワーク110、スペクトルデータ用ニューラルネットワーク120及び構造データ復元用ニューラルネットワーク111が物質構造分析装置100に提供されてもよい。以下では、物質構造分析装置100が学習処理を実行する実施例を説明する。なお、ステップS301〜S303,S306はそれぞれステップS101〜S103,S105と同様であり、説明の重複を避けるため、それらの説明は省く。
ステップS304において、物質構造分析装置100は、取得した構造特徴量を構造データ復元用ニューラルネットワーク111に入力する。ここで、構造データ用ニューラルネットワーク110は、グラフ畳み込みニューラルネットワークであってもよく、構造データ復元用ニューラルネットワーク111と一緒になってオートエンコーダを構成する。
ステップS305において、物質構造分析装置100は、構造データ復元用ニューラルネットワーク111から復元された構造データを取得し、復元された構造データと入力された訓練用の構造データとの誤差を算出する。そして、物質構造分析装置100は、構造特徴量及びスペクトル特徴量から算出したメトリック又は当該メトリックから算出された一致度と、復元された構造データ及び訓練用の構造データから算出された誤差とに基づき、構造データ用ニューラルネットワーク110、スペクトルデータ用ニューラルネットワーク120及び構造データ復元用ニューラルネットワーク111を学習する。具体的には、物質構造分析装置100は、算出した誤差及びメトリックが小さくなるように、あるいは、算出した誤差が小さくなると共に一致度が高くなるように、誤差逆伝播法に従って構造データ用ニューラルネットワーク110、スペクトルデータ用ニューラルネットワーク120及び構造データ復元用ニューラルネットワーク111のパラメータを更新する。
なお、上述した実施例は組み合わせされてもよく、すなわち、図10に示されるように、構造データ用ニューラルネットワーク110と構造データ復元用ニューラルネットワーク111とがオートエンコーダを構成するだけでなく、スペクトルデータ用ニューラルネットワーク120とスペクトルデータ復元用ニューラルネットワーク121ともまたオートエンコーダを構成してもよい。本実施例によると、構造特徴量及びスペクトル特徴量の双方が、構造データ及びスペクトルデータを復元できる程度の情報量を有することが可能になる。
次に、図11〜13を参照して、本開示の一実施例による物質構造分析装置を説明する。本実施例では、物質構造分析装置100は、物質の構造データを取得すると、取得した構造データの物質に対応するスペクトルデータを予測する。図11は、本開示の一実施例による物質構造分析装置の概略を示す図である。
図11に示されるように、物質構造分析装置100は、構造データ用ニューラルネットワーク110及びスペクトルデータ予測用ニューラルネットワーク122を有する。しかしながら、本開示による物質構造分析装置100は、構造データ用ニューラルネットワーク110及びスペクトルデータ予測用ニューラルネットワーク122の全て又は一部を必ずしも有さなくてもよく、外部装置(図示せず)に格納されている構造データ用ニューラルネットワーク110及びスペクトルデータ予測用ニューラルネットワーク122の全て又は一部にアクセスすることによって、これらを利用してもよい。
構造データ用ニューラルネットワーク110は、物質の構造を表す構造データから構造特徴量を抽出する。上述したように、構造データ用ニューラルネットワーク110は、任意のサイズの構造データを処理することを可能にするため、グラフ畳み込みニューラルネットワークであってもよい。
スペクトルデータ予測用ニューラルネットワーク122は、構造特徴量から物質のスペクトルデータを予測する。
図12は、本開示の一実施例による物質構造分析装置の機能構成を示すブロック図である。図12に示されるように、物質構造分析装置100は、構造特徴量抽出部110D及びスペクトルデータ予測部122Dを有する。なお、構造特徴量抽出部110Dは、図2を参照して上述した構造特徴量抽出部110Aと同様であり、説明の重複を避けるため、その説明は省く。
スペクトルデータ予測部122Dは、スペクトルデータ予測用ニューラルネットワーク122によって構造特徴量から予測対象の物質のスペクトルデータを予測する。すなわち、スペクトルデータ予測部122Dは、構造特徴量抽出部110Dから取得した構造特徴量をスペクトルデータ予測用ニューラルネットワーク122に入力し、スペクトルデータ予測用ニューラルネットワーク122からスペクトルデータを取得する。取得されたスペクトルデータは、構造データ用ニューラルネットワーク110に入力された構造データに対応する物質のスペクトルデータである。
一実施例では、物質構造分析装置100は、取得した構造特徴量を微小変動させることによって複数候補の構造特徴量を生成し、生成した構造特徴量から複数のスペクトルデータを生成してもよい。
本実施例による構造データ用ニューラルネットワーク110及びスペクトルデータ予測用ニューラルネットワーク122は、図13に示されるような学習処理に従って学習されてもよい。なお、当該学習処理は、物質構造分析装置100によって実行されてもよいし、あるいは、外部装置(図示せず)によって実行され、学習済みの構造データ用ニューラルネットワーク110及びスペクトルデータ予測用ニューラルネットワーク122が物質構造分析装置100に提供されてもよい。以下では、物質構造分析装置100が学習処理を実行する実施例を説明する。
ステップS401において、物質構造分析装置100は、訓練用の構造データ及びスペクトルデータの組み合わせを取得する。例えば、訓練用の構造データ及びスペクトルデータの組み合わせは、同一物質の構造データ及びスペクトルデータの組み合わせ(ポジティブデータ)であってもよいし、異なる物質の構造データ及びスペクトルデータの組み合わせ(ネガティブデータ)であってもよい。
ステップS402において、物質構造分析装置100は、取得した訓練用の構造データを学習対象の構造データ用ニューラルネットワーク110に入力する。
ステップS403において、物質構造分析装置100は、構造データ用ニューラルネットワーク110から構造特徴量を取得し、取得した構造特徴量をスペクトルデータ予測用ニューラルネットワーク122に入力する。
ステップS404において、物質構造分析装置100は、スペクトルデータ予測用ニューラルネットワーク122から予測されたスペクトルデータを取得し、予測されたスペクトルデータと訓練用のスペクトルデータとの誤差に基づき、誤差逆伝播法に従って構造データ用ニューラルネットワーク110及びスペクトルデータ予測用ニューラルネットワーク122のパラメータを更新する。
ステップS405において、物質構造分析装置100は、終了条件が充足されているか判断する。終了条件としては、例えば、所定数の訓練データが処理されたこと、パラメータの更新量が収束したことなどであってもよい。
終了条件が充足された場合(S405:YES)、物質構造分析装置100は、当該学習処理を終了し、最終的に取得された構造データ用ニューラルネットワーク110及びスペクトルデータ予測用ニューラルネットワーク122を学習済み構造データ用ニューラルネットワーク110及びスペクトルデータ予測用ニューラルネットワーク122として保持する。
他方、終了条件が充足されていない場合(S405:NO)、物質構造分析装置100は、ステップS401に戻って次の訓練データを処理する。
次に、図14〜16を参照して、本開示の一実施例による物質構造分析装置を説明する。本実施例では、物質構造分析装置100は、物質のスペクトルデータを取得すると、取得したスペクトルデータの物質に対応する構造データを予測する。図14は、本開示の一実施例による物質構造分析装置の概略を示す図である。
図14に示されるように、物質構造分析装置100は、スペクトルデータ用ニューラルネットワーク120及び構造データ予測用ニューラルネットワーク112を有する。しかしながら、本開示による物質構造分析装置100は、スペクトルデータ用ニューラルネットワーク120及び構造データ予測用ニューラルネットワーク112の全て又は一部を必ずしも有さなくてもよく、外部装置(図示せず)に格納されているスペクトルデータ用ニューラルネットワーク120及び構造データ予測用ニューラルネットワーク112の全て又は一部にアクセスすることによって、これらを利用してもよい。
スペクトルデータ用ニューラルネットワーク120は、物質のスペクトルを表すスペクトルデータからスペクトル特徴量を抽出する。上述したように、スペクトルデータ用ニューラルネットワーク120は、畳み込みニューラルネットワークであってもよい。
構造データ予測用ニューラルネットワーク112は、スペクトル特徴量から物質の構造データを予測する。
図15は、本開示の一実施例による物質構造分析装置の機能構成を示すブロック図である。図15に示されるように、物質構造分析装置100は、スペクトル特徴量抽出部120E及び構造データ予測部112Eを有する。なお、スペクトル特徴量抽出部120Eは、図2を参照して上述したスペクトル特徴量抽出部120Aと同様であり、説明の重複を避けるため、その説明は省く。
構造データ予測部112Eは、構造データ予測用ニューラルネットワーク112によってスペクトル特徴量から予測対象の物質の構造データを予測する。すなわち、構造データ予測部112Eは、スペクトル特徴量抽出部120Eから取得したスペクトル特徴量を構造データ予測用ニューラルネットワーク112に入力し、構造データ予測用ニューラルネットワーク112から構造データを取得する。取得された構造データは、スペクトルデータ用ニューラルネットワーク120に入力されたスペクトルデータに対応する物質の構造データである。
一実施例では、物質構造分析装置100は、取得したスペクトル特徴量を微小変動させることによって複数候補のスペクトル特徴量を生成し、生成したスペクトル特徴量から複数の構造データを生成してもよい。
本実施例による物質構造分析装置100におけるスペクトルデータ用ニューラルネットワーク120及び構造データ予測用ニューラルネットワーク112は、図16に示されるような学習処理に従って学習されてもよい。なお、当該学習処理は、物質構造分析装置100によって実行されてもよいし、あるいは、外部装置(図示せず)によって実行され、学習済みのスペクトルデータ用ニューラルネットワーク120及び構造データ予測用ニューラルネットワーク112が物質構造分析装置100に提供されてもよい。以下では、物質構造分析装置100が学習処理を実行する実施例を説明する。
ステップS501において、物質構造分析装置100は、訓練用の構造データ及びスペクトルデータの組み合わせを取得する。例えば、訓練用の構造データ及びスペクトルデータの組み合わせは、同一物質の構造データ及びスペクトルデータの組み合わせ(ポジティブデータ)であってもよいし、異なる物質の構造データ及びスペクトルデータの組み合わせ(ネガティブデータ)であってもよい。
ステップS502において、物質構造分析装置100は、取得した訓練用のスペクトルデータを学習対象のスペクトルデータ用ニューラルネットワーク120に入力する。
ステップS503において、物質構造分析装置100は、スペクトルデータ用ニューラルネットワーク120からスペクトル特徴量を取得し、取得したスペクトル特徴量を構造データ予測用ニューラルネットワーク112に入力する。
ステップS504において、物質構造分析装置100は、構造データ予測用ニューラルネットワーク112から予測された構造データを取得し、予測された構造データと訓練用の構造データとの誤差に基づき、誤差逆伝播法に従ってスペクトルデータ用ニューラルネットワーク120及び構造データ予測用ニューラルネットワーク112のパラメータを更新する。
ステップS505において、物質構造分析装置100は、終了条件が充足されているか判断する。終了条件としては、例えば、所定数の訓練データが処理されたこと、パラメータの更新量が収束したことなどであってもよい。
終了条件が充足された場合(S505:YES)、物質構造分析装置100は、当該学習処理を終了し、最終的に取得されたスペクトルデータ用ニューラルネットワーク120及び構造データ予測用ニューラルネットワーク112を学習済みスペクトルデータ用ニューラルネットワーク120及び構造データ予測用ニューラルネットワーク112として保持する。
他方、終了条件が充足されていない場合(S505:NO)、物質構造分析装置100は、ステップS501に戻って次の訓練データを処理する。
一実施例では、物質構造分析装置100は、スペクトルの種別毎にスペクトルデータ用ニューラルネットワーク120を有してもよい。上述したように、処理対象のスペクトルデータは、質量分析法によるマススペクトル、赤外線(IR)スペクトル、X線スペクトル、Raman分光法によるスペクトル、核磁気共鳴分光法によるNMR(Nuclear Magnetic Resonance)スペクトル、LIBS(Laser−Induced Breakdown Spectroscopy)によるスペクトルなど、様々な種別のスペクトル測定結果に関するものであり、上述した実施例では、何れか1つの種別のスペクトルに対してスペクトルデータ用ニューラルネットワーク120などのニューラルネットワークが構成されている。本実施例では、各種別のスペクトルに対応してスペクトルデータ用ニューラルネットワーク120などのニューラルネットワークが備えられ、分析対象の物質に対して複数種別のスペクトルデータが取得された場合、物質構造分析装置100は、取得した種別に対応するスペクトルデータ用ニューラルネットワーク120などのニューラルネットワークを利用して、分析対象の物質と各候補物質とに対して複数の一致度を算出し、算出された複数の一致度から分析対象の物質を予測してもよい。例えば、各種別に対して決定された一致度が共通の範囲に正規化されている場合、上位数パーセントの一致度の候補物質から分析対象の物質を予測してもよい。
他の実施例では、物質構造分析装置100は、複数種別のスペクトルデータを入力とするスペクトルデータ用ニューラルネットワーク120などのニューラルネットワークを有してもよい。すなわち、複数種別のスペクトルデータが1つのスペクトルデータ用ニューラルネットワーク120に入力され、複数種別のスペクトルデータの集合に対応するスペクトル特徴量が抽出されるようにしてもよい。
ここで、物質構造分析装置100は、例えば、図17に示されるように、CPU (Central Processing unit)、GPU (Graphics Processing Unit)などのプロセッサ101、RAM (Random Access Memory)、フラッシュメモリなどのメモリ102、ハードディスク103及び入出力(I/O)インタフェース104によるハードウェア構成を有してもよい。
プロセッサ101は、上述した物質構造分析装置100の各種処理を実行する。
メモリ102は、物質構造分析装置100のための各種データ及びプログラムを一時的に格納するワーキングメモリとして機能する。メモリ102は、上述した各種ニューラルネットワーク及び機能部を実現するデータ及びプログラムをハードディスク103から取得し、プロセッサ101による実行のためロードする。
ハードディスク103は、物質構造分析装置100のための各種データ及びプログラムを格納する。ハードディスク103は、上述した各種ニューラルネットワーク及び機能部を実現するデータ及びプログラムを格納する。
I/Oインタフェース104は、外部装置との間でデータを入出力するためのインタフェースであり、例えば、USB (Universal Serial Bus)、通信回線、キーボード、マウス、ディスプレイなどのデータを入出力するためのデバイスである。
一実施例では、物質構造分析装置100は、相互結合されるプロセッサ101とメモリ102とを有し、メモリ102は、構造データ用ニューラルネットワーク110、構造データ復元用ニューラルネットワーク111、構造データ予測用ニューラルネットワーク112、スペクトルデータ用ニューラルネットワーク120、スペクトルデータ復元用ニューラルネットワーク121及びスペクトルデータ予測用ニューラルネットワーク122の何れか2つ以上の組み合わせを格納し、プロセッサ101は、これらのニューラルネットワークを利用して、上述した構造特徴量抽出部110、スペクトル特徴量抽出部120、一致度決定部130、構造データ復元部111、スペクトルデータ復元部121、構造データ予測部112及びスペクトルデータ予測部122の何れか2つ以上の組み合わせを実現するよう機能してもよい。
しかしながら、本開示による物質構造分析装置100は、上述したハードウェア構成に限定されず、他の何れか適切なハードウェア構成を有してもよい。例えば、上述した物質構造分析装置100による上述した処理の一部又は全ては、これを実現するよう配線化された処理回路又は電子回路により実現されてもよい。
以上、本発明の実施例について詳述したが、本発明は上述した特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
100 物質構造分析装置
101 プロセッサ
102 メモリ
103 ハードディスク
104 I/Oインタフェース
110 構造データ用ニューラルネットワーク
111 構造データ復元用ニューラルネットワーク
112 構造データ予測用ニューラルネットワーク
120 スペクトルデータ用ニューラルネットワーク
121 スペクトルデータ復元用ニューラルネットワーク
122 スペクトルデータ予測用ニューラルネットワーク

Claims (14)

  1. プロセッサにより実行されるステップからなる物質構造分析方法であって、
    物質の構造を表す構造データと物質のスペクトルを表すスペクトルデータとを取得するステップと、
    前記構造データを第1のニューラルネットワークに入力し、前記第1のニューラルネットワークから構造特徴量を取得するステップと、
    前記スペクトルデータを第2のニューラルネットワークに入力し、前記第2のニューラルネットワークからスペクトル特徴量を取得するステップと、
    前記構造特徴量と前記スペクトル特徴量とに基づき、前記構造データに対応する物質と前記スペクトルデータに対応する物質との一致度を決定するステップと、
    を有する物質構造分析方法。
  2. 前記第1のニューラルネットワーク及び前記第2のニューラルネットワークは、同一の物質の構造データとスペクトルデータとのポジティブペアと、異なる物質の構造データとスペクトルデータとのネガティブペアとを利用して、前記ポジティブペアに対する一致度が大きくなり、前記ネガティブペアに対する一致度が小さくなるよう学習される、請求項1記載の物質構造分析方法。
  3. 前記第1のニューラルネットワーク及び前記第2のニューラルネットワークは、同一の物質の構造データとスペクトルデータとのポジティブペアと、異なる物質の構造データとスペクトルデータとのネガティブペアとを利用して、前記ポジティブペアに対する一致度と前記ネガティブペアに対する一致度との間の差が大きくなるよう学習される、請求項1記載の物質構造分析方法。
  4. 前記第1のニューラルネットワークは、グラフ畳み込みニューラルネットワークであり、
    前記第2のニューラルネットワークは、畳み込みニューラルネットワークである、請求項1又は2記載の物質構造分析方法。
  5. 前記第1のニューラルネットワーク及び前記第2のニューラルネットワークは、入力された構造データに対して前記第1のニューラルネットワークによって抽出された構造特徴量から構造データを復元する第1の復元用ニューラルネットワークと共に、前記復元された構造データと前記入力された構造データとの間の誤差と、前記構造特徴量と前記スペクトル特徴量とに基づき決定された一致度とに基づき学習される、請求項1乃至4何れか一項記載の物質構造分析方法。
  6. 前記第1のニューラルネットワーク及び前記第2のニューラルネットワークは、入力されたスペクトルデータに対して前記第1のニューラルネットワークによって抽出されたスペクトル特徴量からスペクトルデータを復元する第2の復元用ニューラルネットワークと共に、前記復元されたスペクトルデータと前記入力されたスペクトルデータとの間の誤差と、前記構造特徴量と前記スペクトル特徴量とに基づき決定された一致度とに基づき学習される、請求項1乃至5何れか一項記載の物質構造分析方法。
  7. 第1のニューラルネットワークによって物質の構造を表す構造データから構造特徴量を抽出する構造特徴量抽出部と、
    第2のニューラルネットワークによって物質のスペクトルを表すスペクトルデータからスペクトル特徴量を抽出するスペクトル特徴量抽出部と、
    前記構造特徴量と前記スペクトル特徴量とに基づき、前記構造データに対応する物質と前記スペクトルデータに対応する物質との一致度を決定する一致度決定部と、
    を有する物質構造分析装置。
  8. 物質の構造を表す構造データと物質のスペクトルを表すスペクトルデータとを取得する処理と、
    前記構造データを第1のニューラルネットワークに入力し、前記第1のニューラルネットワークから構造特徴量を取得する処理と、
    前記スペクトルデータを第2のニューラルネットワークに入力し、前記第2のニューラルネットワークからスペクトル特徴量を取得する処理と、
    前記構造特徴量と前記スペクトル特徴量とに基づき、前記構造データに対応する物質と前記スペクトルデータに対応する物質との一致度を決定する処理と、をプロセッサに実行させるプログラム。
  9. プロセッサにより実行されるステップからなる物質構造分析方法であって、
    予測対象の物質の構造を表す構造データを取得するステップと、
    前記構造データを第1のニューラルネットワークに入力し、前記第1のニューラルネットワークから構造特徴量を取得するステップと、
    前記構造特徴量を第2のニューラルネットワークに入力し、前記第2のニューラルネットワークから前記予測対象の物質のスペクトルデータを取得するステップと、
    を有する物質構造分析方法。
  10. 第1のニューラルネットワークによって予測対象の物質の構造を表す構造データから構造特徴量を抽出する構造特徴量抽出部と、
    第2のニューラルネットワークによって前記構造特徴量から前記予測対象の物質のスペクトルデータを予測するスペクトルデータ予測部と、
    を有する物質構造分析装置。
  11. 予測対象の物質の構造を表す構造データを取得する処理と、
    前記構造データを第1のニューラルネットワークに入力し、前記第1のニューラルネットワークから構造特徴量を取得する処理と、
    前記構造特徴量を第2のニューラルネットワークに入力し、前記第2のニューラルネットワークから前記予測対象の物質のスペクトルデータを取得する処理と、をプロセッサに実行させるプログラム。
  12. プロセッサにより実行されるステップからなる物質構造分析方法であって、
    予測対象の物質のスペクトルを表すスペクトルデータを取得するステップと、
    前記スペクトルデータを第1のニューラルネットワークに入力し、前記第1のニューラルネットワークからスペクトル特徴量を取得するステップと、
    前記スペクトル特徴量を第2のニューラルネットワークに入力し、前記第2のニューラルネットワークから前記予測対象の物質の構造データを取得するステップと、
    を有する物質構造分析方法。
  13. 第1のニューラルネットワークによって予測対象の物質のスペクトルを表すスペクトルデータからスペクトル特徴量を抽出するスペクトル特徴量抽出部と、
    第2のニューラルネットワークによって前記スペクトル特徴量から前記予測対象の物質の構造データを予測する構造データ予測部と、
    を有する物質構造分析装置。
  14. 予測対象の物質のスペクトルを表すスペクトルデータを取得する処理と、
    前記スペクトルデータを第1のニューラルネットワークに入力し、前記第1のニューラルネットワークからスペクトル特徴量を取得する処理と、
    前記スペクトル特徴量を第2のニューラルネットワークに入力し、前記第2のニューラルネットワークから前記予測対象の物質の構造データを取得する処理と、
    をプロセッサに実行させるプログラム。
JP2019037758A 2019-03-01 2019-03-01 物質構造分析装置、方法及びプログラム Pending JP2020139914A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019037758A JP2020139914A (ja) 2019-03-01 2019-03-01 物質構造分析装置、方法及びプログラム
US16/784,717 US20200279148A1 (en) 2019-03-01 2020-02-07 Material structure analysis method and material structure analyzer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019037758A JP2020139914A (ja) 2019-03-01 2019-03-01 物質構造分析装置、方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2020139914A true JP2020139914A (ja) 2020-09-03

Family

ID=72236035

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019037758A Pending JP2020139914A (ja) 2019-03-01 2019-03-01 物質構造分析装置、方法及びプログラム

Country Status (2)

Country Link
US (1) US20200279148A1 (ja)
JP (1) JP2020139914A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220101276A1 (en) * 2020-09-30 2022-03-31 X Development Llc Techniques for predicting the spectra of materials using molecular metadata
CN113241130B (zh) * 2021-06-08 2022-04-22 西南交通大学 一种基于图卷积网络的分子结构预测方法

Also Published As

Publication number Publication date
US20200279148A1 (en) 2020-09-03

Similar Documents

Publication Publication Date Title
Adams et al. Multivariate phylogenetic comparative methods: evaluations, comparisons, and recommendations
US20240185130A1 (en) Normalizing text attributes for machine learning models
WO2019227716A1 (zh) 流感预测模型的生成方法、装置及计算机可读存储介质
CN110912908B (zh) 网络协议异常检测方法、装置、计算机设备和存储介质
US20170372069A1 (en) Information processing method and server, and computer storage medium
CN113705092B (zh) 基于机器学习的疾病预测方法及装置
CN108171010B (zh) 基于半监督网络嵌入模型的蛋白质复合体检测方法与装置
Algamal et al. High dimensional logistic regression model using adjusted elastic net penalty
JPWO2013125482A1 (ja) 文書評価装置、文書評価方法、及びプログラム
US11373760B2 (en) False detection rate control with null-hypothesis
CN113434859A (zh) 入侵检测方法、装置、设备及存储介质
JP2019105871A (ja) 異常候補抽出プログラム、異常候補抽出方法および異常候補抽出装置
Thevenoux et al. Image based species identification of Globodera quarantine nematodes using computer vision and deep learning
Zekany et al. CrystalBall: Statically analyzing runtime behavior via deep sequence learning
JP2020139914A (ja) 物質構造分析装置、方法及びプログラム
CN115296984A (zh) 异常网络节点的检测方法及装置、设备、存储介质
Beltran et al. An automatic representation of peptides for effective antimicrobial activity classification
Mahalunkar et al. Multi-element long distance dependencies: Using SPk languages to explore the characteristics of long-distance dependencies
JPWO2016084326A1 (ja) 情報処理システム、情報処理方法、及び、プログラム
Mello-Roman et al. KPLS optimization with nature-inspired metaheuristic algorithms
CN111159481A (zh) 图数据的边预测方法、装置及终端设备
CN111091194B (zh) 一种基于cavwnb_kl算法的操作***识别方法
JP2019087053A (ja) 解析装置、解析方法およびプログラム
CN113392086B (zh) 基于物联网的医疗数据库构建方法、装置及设备
CN111562943A (zh) 一种基于事件嵌入树及gat网络的代码克隆检测方法和装置