JP2022182628A

JP2022182628A - 情報処理装置、情報処理方法、情報処理プログラム、及び学習モデル生成装置

Info

Publication number: JP2022182628A
Application number: JP2021090287A
Authority: JP
Inventors: 治也石塚; Haruya Ishizuka; 大地持橋; Daichi Mochihashi
Original assignee: Bridgestone Corp
Current assignee: Bridgestone Corp
Priority date: 2021-05-28
Filing date: 2021-05-28
Publication date: 2022-12-08
Also published as: WO2022249518A1

Abstract

【課題】演算資源を抑制しつつ大量のデータに対する可視化精度を向上する。【解決手段】情報処理装置（１）は、推定部（５）と、可視化部（７）とを備える。推定部（５）は、学習モデル（５１）を用いて、高次元データ（４）から次元削減した可視化用の低次元データ（６）を推定する。学習モデル（５１）は高次元データ（４）を入力とし次元削減した可視化用の低次元データ（６）を出力するように学習される。学習モデル（５１）は、高次元データの特徴を反映しつつ高次元データの次元数より低次元の中間データに変換する非線形変換を行うように学習された第１モデルと、中間データの次元数からさらに低次元の低次元データに変換する多様体学習を行う第２モデルとを含む。可視化部（７）は、推定された低次元データ（６）を可視化する。【選択図】図１

Description

本発明は、情報処理装置、情報処理方法、情報処理プログラム、及び学習モデル生成装置に関する。

従来より、大量のデータを分析する場合、大量のデータが表す特徴を可視化することが行われており、例えば、ユーザに直観的な示唆を与える散布図は、有効である。この散布図は、４次元以上の高次元データへの可視化の適用は困難であり、次元削減（次元圧縮）が要求される。この次元削減を行うために、ニューラルネットワークによる非線形変換処理を用いた技術が知られている（例えば、特許文献１参照）。

特開２０１８－１０９９４７公報

しかしながら、非線形変換処理を可能とするニューラルネットワークでは、次元削減を行う場合、ニューラルネットワークの構築時にはユニット数を調整しながら行うために、膨大な演算資源が要求される。

本開示は、演算資源を抑制しつつ大量のデータに対する可視化精度を向上することができる情報処理装置、情報処理方法、情報処理プログラム、及び学習モデル生成装置を提供することを目的とする。

上記目的を達成するために、本開示の一態様は、
高次元データを取得する取得部と、
前記取得部で取得された高次元データを入力とし、前記高次元データの次元数より減少した次元数の可視化用の低次元データを出力するように学習された学習モデルであって、前記高次元データの特徴を反映しつつ前記高次元データの次元数より減少した第１次元数の中間データに次元削減する第１次元削減処理を示す非線形変換を行う非線形変換部を示す第１モデルと、前記中間データを前記第１次元数より減少した第２次元数の低次元データに次元削減する第２次元削減処理を示す多様体学習を行う多様体学習部を示す第２モデルとを含む前記学習モデルに対して、前記取得部で取得された推定対象の高次元データを入力し、前記推定対象の高次元データに対応する低次元データを推定する推定部と、
複数の前記高次元データについて、前記推定部で推定された低次元データの各々を前記推定対象の高次元データの特徴を示すデータとして可視化する可視化部と、
を含む情報処理装置である。

第２態様は、第１態様の情報処理装置において、
前記第１モデルは、多層ニューラルネットワークを用いて学習されることで生成されたモデルであり、
前記第２モデルは、前記多様体学習部として主成分分析を行うように学習されることで生成されたモデルである。

第３態様は、第２態様の情報処理装置において、
前記多層ニューラルネットワークは、ガウス過程に従った教師なしニューラルネットワークである。

第４態様は、
コンピュータが
高次元データを入力とし、前記高次元データの次元数より低次元の次元数の可視化用の低次元データを出力するように学習された学習モデルであって、前記高次元データの特徴を反映しつつ前記高次元データの次元数より低次元でかつ前記低次元データの次元数より高次元の中間データに次元削減する第１次元削減処理を示す非線形変換を行うように学習された非線形変換部を示す第１モデルと、前記中間データの次元数を前記可視化用の低次元データの次元数に次元削減する第２次元削減処理を示す多様体学習を行うように学習された多様体学習部を示す第２モデルとを含む前記学習モデルを用いて、推定対象の複数の高次元データに対応する複数の可視化用の低次元データを推定し、
推定された前記複数の低次元データの各々を前記推定対象の複数のデータの特徴を示すデータとして可視化する制御を行う
情報処理方法である。

第５態様は、
コンピュータに
高次元データを入力とし、前記高次元データの次元数より低次元の次元数の可視化用の低次元データを出力するように学習された学習モデルであって、前記高次元データの特徴を反映しつつ前記高次元データの次元数より低次元でかつ前記低次元データの次元数より高次元の中間データに次元削減する第１次元削減処理を示す非線形変換を行うように学習された非線形変換部を示す第１モデルと、前記中間データの次元数を前記可視化用の低次元データの次元数に次元削減する第２次元削減処理を示す多様体学習を行うように学習された多様体学習部を示す第２モデルとを含む前記学習モデルを用いて、推定対象の複数の高次元データに対応する複数の可視化用の低次元データを推定し、
推定された前記複数の低次元データの各々を前記推定対象の複数のデータの特徴を示すデータとして可視化する制御を行う
処理を実行させるための情報処理プログラムである。

第６態様は、
高次元データを入力とし、前記高次元データの次元数より低次元の次元数の可視化用の低次元データを出力するように学習された学習モデルであって、前記高次元データの特徴を反映しつつ前記高次元データの次元数より低次元でかつ前記低次元データの次元数より高次元の中間データに次元削減する第１次元削減処理を示す非線形変換を行うように学習された非線形変換部を示す第１モデルと、前記中間データの次元数を前記可視化用の低次元データの次元数に次元削減する第２次元削減処理を示す多様体学習を行うように学習された多様体学習部を示す第２モデルとを含む前記学習モデルを生成する学習モデル生成部
を含む学習モデル生成装置である。

本開示によれば、演算資源を抑制しつつ大量のデータに対する可視化精度を向上することができる、という効果を有する。

実施形態に係る情報処理装置の構成の一例を示す図である。実施形態に係る学習処理に関する図である。実施形態に係る学習処理部における学習処理に関する図である。実施形態に係る学習処理部における学習処理に関する図である。実施形態に係る学習処理の流れの一例を示すフローチャートである。実施形態に係る情報処理装置の構成の一例を示す図である。実施形態に係る推定処理の流れの一例を示すフローチャートである。実施形態に係る情報処理装置で用いられるデータの一例を示す図である。実施形態に係る情報処理装置で用いられるデータの一例を示す図である。実施形態に係る情報処理装置で得られたデータを可視化した散布図の一例を示す図である。次元削減に関する検証結果を示す図である。次元削減に関する検証結果を示す図である。実施形態に係る情報処理装置による次元削減に関する検証結果を示す図である。

以下、図面を参照して本開示の技術を実現する実施形態を詳細に説明する。
なお、作用、機能が同じ働きを担う構成要素及び処理には、全図面を通して同じ符合を付与し、重複する説明を適宜省略する場合がある。また、本開示は、以下の実施形態に何ら限定されるものではなく、本開示の目的の範囲内において、適宜変更を加えて実施することができる。

ところで、高次元データ（観測値）を散布図等で可視化するにあたり、次元削減（次元圧縮）に機械学習の技術が用いられており、可視化手法には、多様体学習を用いた次元削減の手法及び確率モデルを用いた次元削減の手法が知られている。

多様体学習を用いた次元削減の手法は、高次元データ（観測値）の全てのペアと、データから推定される低次元データの全てのペアとでそれぞれ独立に類似度を定義し、観測値間の類似度と低次元データ間の類似度の差が小さくなる様に低次元データを推定するように学習する。例えば、高次元データを２次元や３次元等の低次元データに変換して可視化するための手法として、ｔ－ＳＮＥ（t-Distributed Stochastic Neighbor Embedding）が知られている（文献Ａ参照）。また、多様体学習を用いた次元削減の手法の他例としては、周知の主成分分析の手法が挙げられる。ところが、多様体学習を用いた次元削減の手法では、観測値間の類似度を適切に表現することが可視化の条件のため、観測値のデータ表現が不適切な場合には類似度の評価が困難となり、可視化の精度が低下する。
文献Ａ：「Visualizing Data using t-SNE」Journal of Machine Learning Research 9 (2008) 2579-2605

また、確率モデルを用いた次元削減の手法は、観測値よりも低次元かつランダムに値が変動する潜在変数を仮定し、データからそれらを推定することで次元削減を行う。例えば、深層潜在変数モデル（Deep Latent Variable Model：以下、ＤＬＶＭという。）と呼ばれる確率モデルでは、多層ニューラルネットワーク（Deep Neural Network : 以下、ＤＮＮという。）による非線形変換をモデル中に導入することで、データの特徴をよく反映する様にデータを圧縮可能である。ＤＬＶＭは、クロスセクションデータや時系列といった構造化データに加え、画像やテキストなど非構造化データ解析においても、クラスタリングや次元削減などのタスクで多くの成果が報告されている。ところが、ＤＬＶＭでは、モデルの性能を最大化する為にＤＮＮのユニット数の調整が要求される。このタスクでは、ユニット数を数十から数千等の広範囲に変化させる等のようにユニット調整を行いながら演算精度を向上させるため、多くの計算時間を必要とする。

本開示において「可視化」とは、ユーザが目視等により確認可能な空間上の低次元のデータを生成することを含む概念であり、生成されたデータをユーザが目視等により確認可能に表示等によって提供することを含む。可視化により提供されるデータの一例には、２次元空間及び３次元空間等の低次元空間上にデータを分布させる線図、及び散布図等のグラフとして提供するデータが挙げられる。

そこで、本開示の情報処理装置は、推定部と、可視化部とを備える。推定部は、学習モデルを用いて、高次元データから次元削減した可視化用の低次元データを推定する。学習モデルは、高次元データを入力とし、次元削減した可視化用の低次元データを出力するように学習される。学習モデルは、高次元データの特徴を反映しつつ高次元データから次元削減した第１次元数の中間データに変換する非線形変換を行う第１モデルと、中間データからさらに次元削減した第２次元数の低次元データに変換する多様体学習を行う第２モデルとを含む。可視化部は、推定された低次元データを可視化する。

図１に、本開示の情報処理装置としての情報処理装置１の構成の一例を示す。

情報処理装置１における推定処理は、観測事象における観測値を示す物理量（すなわち、高次元データ）を入力として学習を行った学習済みの学習モデルを用いて、観測値に対応する未知の可視化用の物理量（すなわち、低次元データ）を推定し、出力する。

図１に示すように、情報処理装置１は、推定部５及び可視化部７を備えている。推定部５には、観測事象３において観測された高次元の観測値（高次元データ）を表す入力データ４が入力される。また、推定部５は、推定結果として与えられた観測事象３における観測値の特徴を示す物理量（低次元データ）を表す出力データ６を出力する。推定部５は、学習済みの学習モデル５１を含んでいる。

学習モデル５１は、観測事象３において観測された観測値（入力データ４）から、観測値の特徴を示すデータ（出力データ６）を導出する学習を済ませたモデルである。学習モデル５１は、例えば、学習済みのニューラルネットワークを規定するモデルであり、ニューラルネットワークを構成するノード（ニューロン）同士の間の結合の重み（強度）の情報の集合として表現される。

学習モデル５１は、学習処理部５２（図２）の学習処理により生成される。学習処理部５２は、観測事象３において観測された観測値（入力データ４）を複数用いて学習処理を行う。観測値は、観測事象３において観測された所定個数（例えばＤ（＞２）個）の異なる性質を示す複数の個別データのペア、すなわち高次元（Ｄ次元）のデータである。観測値は、観測事象３において観測された状態の特徴を含んでいる。学習モデル５１は、観測値（高次元の入力データ４）から、観測値の特徴を示すデータ（低次元の出力データ６）を導出するように学習される。例えば、観測値の特徴をラベルとして観測事象３において観測された高次元の観測値を大量に含むデータを学習データとする。学習データは、高次元の観測値（入力データ４）である個別データのペアを大量に含む。なお、観測値には、観測値が観測された観測事象３における観測状態（例えば、観測方法、観測値の性質や観測値、観測対象の種類や構造等）をラベルとして対応付けることが可能である。また、観測値は、観測事象３を時系列に観測した複数の観測値であってもよい。

次に、図３を参照して、学習処理部５２について説明する。
学習処理部５２は、生成器５４と演算器５６とを含む。生成器５４は、入力データ４である高次元の観測値間の類似性等を考慮して、次元削減した低次元の出力データを生成する機能を有する。学習処理部５２は、学習用データとして、観測事象３において観測された高次元の入力データ４（観測値）を多数保持している。

図３に示す例では、生成器５４は、入力層５４０、中間層５４２、および出力層５４４を含んで、公知のニューラルネットワーク（ＮＮ：Neural Network）を構成している。ニューラルネットワーク自体は公知の技術であるため詳細な説明は省略するが、中間層５４２は、ノード間結合およびフィードバック結合を有するノード群（ニューロン群）を多数含む。その中間層５４２には、入力層５４０からのデータが入力され、中間層５４２の演算結果のデータは、出力層５４４へ出力される。

生成器５４は、入力された高次元（Ｄ次元）の入力データ４（観測事象３において観測された観測値）から、可視化用に次元削減した低次元（Ｒ次元）の生成出力データ６Ａを生成するニューラルネットワークである。生成出力データ６Ａは、高次元の入力データ４（観測値）から、観測値の特徴を推定、すなわち観測値を可視化用に低次元に次元削減されたデータである。生成器５４は、入力データ４（観測値）から、可視化用に次元削減した生成出力データを生成する。生成器５４は、多数の入力データ４（観測値）を用いて学習することで、より観測値の特徴に近い可視化用の生成出力データ６Ａを生成できるようになる。

詳細には、生成器５４は、可視化用の生成出力データ６Ａを出力するために、隠れ層である中間層５４２として、第１中間層５４２Ａ及び第２中間層５４２Ｂを含む。第１中間層５４２Ａは、確率モデルを用いて次元削減を行う層であり、第２中間層５４２Ｂは、多様体学習を用いて次元削減を行う層である。

第１中間層５４２Ａ及び第２中間層５４２Ｂは、一部のユニットが共通とされる。図３に示す例では、第１中間層５４２Ａが第１層５４３Ａ及び第２層５４３Ｂにより構成され、第２中間層５４２Ｂが第２層５４３Ｂ及び第３層５４３Ｃにより構成されて、第２層５４３Ｂが共通にされている。第２層５４３Ｂは、中間層５４２において高次元（Ｄ次元）の入力データ４（観測値）から次元削減した中間次元（Ｑ次元：Ｄ＞Ｑ）の中間データを導出するユニットを含む層に対応する。

具体的には、第１中間層５４２Ａは、確率モデルを用い、高次元の入力データ４（観測値）の特徴を維持しつつ次元削減する機能を有する中間層である。第１中間層５４２Ａは、確率モデルを用いた次元削減として、観測値よりも低次元かつランダムに値が変動する潜在変数を仮定し、複数の観測値が示すデータから潜在変数を推定することで次元削減を行う。本実施形態では、第１中間層５４２Ａの一例として多層ニューラルネットワーク（ＤＮＮ：Deep Neural Network）が適用される。第１中間層５４２Ａは、高次元（Ｄ次元）の入力データ４（観測値）から可視化用に次元削減した中間次元（Ｑ次元：Ｄ＞Ｑ）の中間データを出力するネットワークとして機能する。別の側面では、入力層５４０を第１の入力層、第１中間層５４２Ａにおける第１層５４３Ａを第１の中間層、及び第２層５４３Ｂを第１の出力層として捉えた構成を確率モデルの無限ＤＮＮと考えることが可能となる。

また、第１中間層５４２Ａには、所謂、教師なし無限ユニットＤＮＮ（以下、無限ＤＮＮという。）を適用する。無限ＤＮＮは、公知の技術であるため詳細な説明は省略するが、ノンパラメトリックベイズモデルの一例であるガウス過程（Gaussian process）と、ＤＮＮとの数学的同値性を適用したＤＮＮである、教師データを要求せずに学習可能でかつ、中間層のユニット数を無限個数まで拡張可能な構成として考えられたものである。第１中間層５４２Ａに無限ＤＮＮを用いることで、適切なラベルが対応付けられていない高次元の観測値について、複数の観測値の間の類似度や規則性に基づく分類を可能とし、複数の観測値について主要な構造や分布等の可視化のための特徴を示す特徴データとして、次元削減した中間次元（Ｑ次元：Ｄ＞Ｑ）の中間データを推定可能になる。第１中間層５４２Ａは、本開示の非線形変換部を示す第１モデルの一例であり、後述するように、高次元データの特徴を反映しつつ前記高次元データの次元数より低次元でかつ前記低次元データの次元数より高次元の中間データに次元削減する第１次元削減処理を示す非線形変換を行うように学習される。

第２中間層５４２Ｂは、多様体学習を用い、高次元の入力データ４（観測値）から、可視化のための特徴が反映されるように次元削減された中間次元（Ｑ次元：Ｄ＞Ｑ）の中間データから、さらに次元削減する機能を有する中間層である。多様体学習は、公知の技術であるため詳細な説明は省略するが、入力側の高い次元の空間について局所的に線形空間として見なすことで次元削減する手法である。具体的には、複数の観測値に対応する中間データの全てのペアと、推定される低次元データの全てのペアとの各々の類似度から低次元データを推定するモデルである。本実施形態では、第２中間層５４２Ｂの一例としてｔ－ＳＮＥが適用される。第２中間層５４２Ｂは、中間次元（Ｑ次元）の中間データから、さらに次元削減した低次元（Ｒ次元：Ｑ＞Ｒ）の生成出力データを出力するネットワークとして機能する。別の側面では、第２中間層５４２Ｂにおける第２層５４３Ｂを第２の入力層、第３層５４３Ｃを第２の中間層、及び出力層５４４を第２の出力層として捉えた構成を多様体学習を用いた確率モデルのネットワークと考えることが可能となる。第２中間層５４２Ｂは、本開示の多様体学習部を示す第２モデルの一例であり、後述するように、中間データの次元数を可視化用の低次元データの次元数に次元削減する第２次元削減処理を示す多様体学習を行うように学習される。

なお、本実施形態では、第２中間層５４２Ｂの一例としてｔ－ＳＮＥを適用する場合を説明するが、主成分分析手法によって多様体学習を行う構成としてもよい。

上述した第１中間層５４２Ａに無限ＤＮＮを用いることで、高次元の観測値から観測値が示す特徴を効果的に抽出することが可能となる。よって、観測値のデータ表現が不適切な場合に可視化精度が低下することはない。また、無限ＤＮＮは、ニューラルネットワークを構成するユニットに関する層構成や個数を考慮することが要求されないため、ユニット数等のネットワークのチューニングが不要になる。また、第２中間層５４２Ｂに多様体学習による次元削減を可能とする手法を用いることで、第１中間層５４２Ａにおいて観測値が示す特徴を反映した中間データからさらに次元削減し、観測値が示す特徴を維持しつつ低次元データに次元削減された可視化用のデータを推定することが可能となる。

演算器５６は、生成出力データ６Ａと、生成出力データ６Ａを得るためのデータ４Ａとを比較し、その比較結果の誤差を演算する演算器である。学習処理部５２は、生成出力データ６Ａ、およびデータ４Ａを演算器５６に入力する。演算器５６は、生成出力データ６Ａと、データ４Ａとの誤差を演算し、その演算結果を示す信号を出力する。本実施形態では、教師データを用いないため、データ４Ａは、観測値を示すデータ及び観測値から導出されるデータ（例えば、中間層５４２における中間データ）が適用される（詳細は後述）。

学習処理部５２は、演算器５６で演算された誤差に基づいて、生成器５４におけるノード間の結合の重みパラメータをチューニングすることで、生成器５４の学習を行う。具体的には、生成器５４における入力層５４０と中間層５４２とのノード間の結合の重みパラメータ、中間層５４２内のノード間の結合の重みパラメータ、および中間層５４２と出力層５４４とのノード間の結合の重みパラメータの各々を、例えば勾配降下法や誤差逆伝搬法等の手法を用いて、生成器５４にフィードバックする。すなわち、データ４Ａと、生成出力データ６Ａとの誤差を最小化するように全てのノード間の結合を最適化する。

次に、図４を参照して、学習処理部５２における学習処理について説明する。なお、図４では、第１中間層５４２Ａ、及び第２中間層５４２Ｂにおける第２層５４３Ｂを、第１中間層５４２Ａにおける出力層５４３Ｂａと、第２中間層５４２Ｂにおける入力層５４３Ｂｂとして示す。

学習処理部５２における学習処理では、中間次元（Ｑ次元：Ｄ＞Ｑ）の中間データを出力する第１中間層５４２Ａと、低次元（Ｒ次元：Ｑ＞Ｒ）のデータを出力する第２中間層５４２Ｂとが連携して学習（訓練）される。

例えば、第１中間層５４２Ａでは、観測値よりも低次元である中間次元（Ｑ次元：Ｄ＞Ｑ）の潜在変数を定め、複数の観測値が示すデータから潜在変数を推定することで、Ｄ次元からＱ次元に次元削減する学習を行う。演算器５６Ａは、観測側の物理量と中間側の物理量とを導出し、観測側の物理量と中間側の物理量との対応関係を最適化する。図４に示す例では、観測側の物理量は、高次元（Ｄ次元）である推定対象の第１の観測値と、他の観測値である第２の観測値との類似度や規則性を示すデータ（データ４Ａａ）を適用する。中間側の物理量は、中間次元（Ｑ次元）である推定対象の第１の中間データと、他の中間データである第２の中間データとの類似度や規則性を示すデータ（データ６Ａａ）を適用する。最適化では、観測側の物理量と中間側の物理量とを用いた周知の損失関数や誤差関数を定め、損失関数や誤差関数によるデータ（損失値や誤差）が最小になるように学習（訓練）すればよい。損失関数や誤差関数の一例には、平均二乗誤差関数等が挙げられる。

また、第２中間層５４２Ｂでは、多様体学習を用いて中間次元のＱ次元からさらに次元削減されたＲ次元に次元削減する学習を行う。演算器５６Ｂは、観測値に対応する中間側の物理量と出力側の物理量とを導出し、中間側の物理量と出力側の物理量との対応関係を最適化する。中間側の物理量は、上述した中間次元（Ｑ次元）第１及び第２の中間データの類似度や規則性を示すデータ（データ６Ａａ）を適用する。出力側の物理量は、推定対象の観測値に対応する低次元（Ｒ次元）である第１の出力データと、他の観測値に対応する第２の出力データとの類似度や規則性を示すデータ（データ４Ａｂ）を適用する。最適化では、中間側の物理量と出力側の物理量とを用いた周知の損失関数や誤差関数を定め、損失関数や誤差関数によるデータ（損失値や誤差）が最小になるように学習（訓練）すればよい。

学習モデル５１は、学習処理部５２の学習処理により生成される。学習モデル５１は、学習処理部５２による学習結果のノード間の結合の重みパラメータ（重み又は強度）の情報の集合として表現される。

上述した学習処理部５２は、図示しないＣＰＵを含むコンピュータを含んで構成し、学習処理を実行することが可能である。例えば、図５に学習処理の一例を示すように、学習処理部５２は、ステップＳ１１０で、入力データ４である高次元（Ｄ次元）の観測値を学習データとして取得する。学習処理部５２は、ステップＳ１１２で、学習データを用いて学習モデル５１を生成する。すなわち、上記のようにして多数の学習データを用いて学習した学習結果のノード間の結合の重みパラメータ（重み又は強度）の情報の集合を得る。そして、ステップＳ１１４で、学習結果のノード間の結合の重みパラメータ（重み又は強度）の情報の集合として表現されるデータを学習モデル５１として記憶する。

情報処理装置１では、以上に例示した手法により生成した学習済みの生成器５４（すなわち、学習結果のノード間の結合の重みパラメータの情報の集合として表現されるデータ）を学習モデル５１として用いる。十分に学習した学習モデル５１を用いれば、高次元（Ｄ次元）の観測値から低次元データを推定することも不可能ではない。

上述の情報処理装置１は、例えば、コンピュータに上述の各機能を表すプログラムを実行させることにより実現可能である。

図６に、情報処理装置１の各種機能を実現する処理を実行する実行装置としてコンピュータを含んで構成した場合の一例を示す。

情報処理装置１として機能するコンピュータは、図６に示すコンピュータ本体１００を備えている。コンピュータ本体１００は、ＣＰＵ１０２、揮発性メモリ等のＲＡＭ１０４、ＲＯＭ１０６、ハードディスク装置（ＨＤＤ）等の補助記憶装置１０８、及び入出力インターフェース（Ｉ／Ｏ）１１０を備えている。これらのＣＰＵ１０２、ＲＡＭ１０４、ＲＯＭ１０６、補助記憶装置１０８、及び入出力Ｉ／Ｏ１１０は、相互にデータ及びコマンドを授受可能にバス１１２を介して接続された構成である。また、入出力Ｉ／Ｏ１１０には、外部装置と通信するための通信インタフェース（Ｉ／Ｆ）１１４、マウスやキーボード等の操作部１１６、ディスプレイ等の表示部１１８が接続されている。通信Ｉ／Ｆ１１４は、外部装置との間で、例えば、入力データ４（観測値）を取得する機能する。操作部１１６は、コンピュータ本体１００への操作を指示する機器である。表示部１１８は、高次元データ（Ｄ次元の観測値）から次元削減した低次元データを可視化してユーザに提示するための機器である。

補助記憶装置１０８には、コンピュータ本体１００を本開示の情報処理装置の一例として情報処理装置１として機能させるための制御プログラム１０８Ｐが記憶される。ＣＰＵ１０２は、制御プログラム１０８Ｐを補助記憶装置１０８から読み出してＲＡＭ１０４に展開して処理を実行する。これにより、制御プログラム１０８Ｐを実行したコンピュータ本体１００は、本開示の情報処理装置の一例として情報処理装置１として動作する。

なお、補助記憶装置１０８には、学習モデル５１を含む学習モデル１０８Ｍ、及び各種データを含むデータ１０８Ｄが記憶される。制御プログラム１０８Ｐは、ＣＤ－ＲＯＭ等の記録媒体により提供するようにしても良い。

次に、コンピュータにより実現された情報処理装置１における推定処理について説明する。

図７に、コンピュータ本体１００において、実行される制御プログラム１０８Ｐによる推定処理の流れの一例を示す。
図７に示す推定処理は、コンピュータ本体１００に電源投入されると、ＣＰＵ１０２により実行される。すなわち、ＣＰＵ１０２は、制御プログラム１０８Ｐを補助記憶装置１０８から読み出し、ＲＡＭ１０４に展開して処理を実行する。

まず、ＣＰＵ１０２は、ステップＳ２００で、補助記憶装置１０８の学習モデル１０８Ｍから学習モデル５１を読み出し、ＲＡＭ１０４に展開することで、学習モデル５１を取得する。具体的には、学習モデル５１として表現された重みパラメータによるノード間の結合となるネットワークモデルを、ＲＡＭ１０４に展開する。よって、重みパラメータによるノード間の結合が実現された学習モデル５１が構築される。

次に、ＣＰＵ１０２は、ステップＳ２０２で、観測事象３において観測された観測値を示す高次元（Ｄ次元）の未知の入力データ４を、通信Ｉ／Ｆ１１４を介して取得する。

次に、ＣＰＵ１０２は、ステップＳ２０４で、ステップＳ２００で取得した学習モデル５１を用いて、ステップＳ２０２において取得した入力データ４（観測値）に対応するＱ次元の中間データを推定する。

次に、ＣＰＵ１０２は、ステップＳ２０６で、ステップＳ２００で取得した学習モデル５１を用いて、ステップＳ２０４において推定した入力データ４（観測値）に対応するＱ次元の中間データからＲ次元の出力データ６を推定する。

そして、次のステップＳ２０８で、推定結果の出力データ６を、例えば散布図等の可視化可能なデータ表現形式に変換して表示部１１８へ出力することで、可視化して、本処理ルーチンを終了する。

上述した推定処理では、図８に示すように、Ｄ次元で表現された複数の観測値の各々が、中間次元（Ｑ次元：Ｄ＞Ｑ）の中間データに変換され、さらに低次元（Ｒ次元：Ｑ＞Ｒ）のデータに変換されて出力される。図８では、観測値は、識別子ＩＤ（ｉｄ１～ｉｄｎ）により識別された複数（ｎ個）の観測値の各々について、高次元データであるＤ次元のデータ（Ｙ１～Ｙｄ）として示されている。例えば、第１の観測値は、識別子ｉｄ１として、データｙ１１～ｙｄ１として示されている。観測値の次元数から次元削減されたＱ次元の中間データは、データ（Ｋ１～Ｋｑ）として示され、例えば、第１の観測値は、識別子ｉｄ１として、データｋ１１～ｋｑ１として示されている。Ｑ次元の中間データから次元削減されたＲ次元の出力データは、２次元データとしてデータ（Ｘ１、Ｘ２）で示され、例えば、第１の観測値は、識別子ｉｄ１として、データｘ１１～ｘ２１として示されている。これらの各データは、高次元データから低次元データにデータの次元数を次元削減するための学習データとしても利用される。

本実施形態に係る情報処理装置１では、Ｄ次元で表現された複数の観測値の各々が、中間次元（Ｑ次元：Ｄ＞Ｑ）の中間データを介して、図９に示すように、低次元（Ｒ次元：Ｑ＞Ｒ）のデータに変換されて出力される。

なお、図７に示す推定処理は、本開示の情報処理方法で実行される処理の一例である。

以上説明したように、本開示によれば、上述した第１中間層５４２Ａに無限ＤＮＮを用いることで、高次元の観測値から観測値が示す特徴を反映した中間データを導出することができる。よって、観測値のデータ表現が不適切な場合に可視化精度が低下することはない。また、無限ＤＮＮは、ニューラルネットワークを構成するユニットに関する層構成や個数を考慮することが要求されないため、ユニット数等のネットワークのチューニングが不要になり、演算資源の増加を抑制できる。

また、第２中間層５４２Ｂに多様体学習による次元削減を可能とする手法を用いることで、第１中間層５４２Ａにおいて観測値が示す特徴を反映した中間データからさらに次元削減し、観測値が示す特徴を維持しつつ低次元データに次元削減された可視化用のデータを推定することが可能となる。

図１０に、上述した情報処理装置１を用いて、高次元データから次元削減した低次元データを推定し、可視化した散布図の一例を示す。図１０では、高次元データに対して付与されたラベルとして、ｐ０からｐ９の１０種類のラベルに相違する形状で打点し、可視化した散布図が示されている。図１０に示すように、本開示の情報処理装置によれば、高次元データに対してラベルごとに適切なクラスタに分離可能であることが確認された。

次に、上述した情報処理装置１を用いて、オイルフローデータの可視化に関して検証した検証結果を説明する。

図１１Ａ、図１１Ｂ、及び図１１Ｃに、各種の手法によって、送油ポンプに対する観測データを観測値として入力した際の観測値を可視化した散布図を示す。観測データは、送油ポンプの油、水及びガスの各層の各位置における割合を示すデータ（oilflowデータ）であり、ガンマ線で測定された１２個の変数と、油と水の含有率及び総配置を表す３種のラベルからなる。１２個の変数は平均０，分散１に標準化した。また、１２個の変数の各々はガンマ線で測定した経路長を含み、油と水の含有率及び総配置は油と水の割合及び油、水及びガスの各層の相構成（配置）を含む。

図１１Ａには、多様体学習を用いた次元削減の手法例としてｔ－ＳＮＥのみの手法によって、高次元の観測値を可視化した散布図が示されている。図１１Ｂには、確率モデルを用いた次元削減の手法例のＤＬＶＭとして、ＶＳＢ－ＤＬＶＭ（Variational Stick-Breaking DLVM）のみの手法によって、高次元の観測値を可視化した散布図が示されている。図１１Ｃには、上述した情報処理装置１を用いて、高次元の観測値を可視化した散布図が示されている。

各散布図上の各点は各観測値を二次元に次元削減して得られた低次元データを示している。各散布図における各点はラベルの相違を打点の形状で示した。第１ラベルを四角形の打点とし、第２ラベルを三角形の打点とし、第３ラベルを星形の打点とした。

ＶＳＢ－ＤＬＶＭによる可視化では（図１１Ｂ）、第２ラベルの点はある程度分離されていると確認可能であるものの、第１ラベルの打点と第３ラベルの打点が混在し、分類が困難である。これは、ラベルの違いを上手く反映した次元削減が困難であったことを示している。ｔ－ＳＮＥによる可視化では（図１１Ａ）、ＶＳＢ－ＤＬＶＭと比較して、赤、青が分離した低次元データを推定できているが、第１ラベルの打点と第３ラベルの打点の各々で分類されたクラスタが近接している。これに対して、本開示の情報処理装置１では、第１ラベル、第２ラベル、及び第３ラベルの各々の打点により分類されるクラスタが独立して分離可能である。すなわち、ラベルの違いを反映して可視化が行われたことを確認できる。

上述したように、本開示では、中間層５４２の一例として、第１中間層５４２Ａ及び第２中間層５４２Ｂを含む一体構成を適用した場合を説明したが、第１中間層５４２Ａ及び第２中間層５４２Ｂを一体構成とした中間層５４２に限定されないことは勿論である。

また、本開示の技術的範囲は上記実施形態に記載の範囲には限定されない。要旨を逸脱しない範囲で上記実施形態に多様な変更または改良を加えることができ、当該変更または改良を加えた形態も本開示の技術的範囲に含まれる。

また、上記実施形態では、検査処理を、フローチャートを用いた処理によるソフトウエア構成によって実現した場合について説明したが、これに限定されるものではなく、例えば各処理をハードウェア構成により実現する形態としてもよい。

また、情報処理装置の一部、例えば学習モデル等のニューラルネットワークを、ハードウェア回路として構成してもよい。

(ＰＣＴ／日外想定の記載用)
さらに、本明細書に記載された全ての文献、特許出願、及び技術規格は、個々の文献、特許出願、及び技術規格が参照により取り込まれることが具体的かつ個々に記された場合と同程度に、本明細書中に参照により取り込まれる。

１情報処理装置
３観測事象
４入力データ
５推定部
６出力データ
６Ａ生成出力データ
７可視化部
５１学習モデル
５２学習処理部
５４生成器
５６演算器
５６Ａ、５６Ｂ演算器
１００コンピュータ本体
１０８補助記憶装置
１０８Ｄデータ
１０８Ｍ学習モデル
１０８Ｐ制御プログラム
１１４通信Ｉ／Ｆ
１１６操作部
１１８表示部
５４０入力層
５４２中間層
５４２Ａ第１中間層
５４２Ｂ第２中間層
５４３Ａ第１層
５４３Ｂ第２層
５４３Ｂａ出力層
５４３Ｂｂ入力層
５４３Ｃ第３層
５４４出力層

Claims

高次元データを入力とし、前記高次元データの次元数より低次元の次元数の可視化用の低次元データを出力するように学習された学習モデルであって、前記高次元データの特徴を反映しつつ前記高次元データの次元数より低次元でかつ前記低次元データの次元数より高次元の中間データに次元削減する第１次元削減処理を示す非線形変換を行うように学習された非線形変換部を示す第１モデルと、前記中間データの次元数を前記可視化用の低次元データの次元数に次元削減する第２次元削減処理を示す多様体学習を行うように学習された多様体学習部を示す第２モデルとを含む前記学習モデルを備え、推定対象の複数の高次元データに対応する複数の可視化用の低次元データを推定する推定部と、
前記推定部で推定された前記複数の低次元データの各々を前記推定対象の複数のデータの特徴を示すデータとして可視化する可視化部と、
を含む情報処理装置。
前記第１モデルは、多層ニューラルネットワークを用いて学習されることで生成されたモデルであり、
前記第２モデルは、前記多様体学習部として主成分分析を行うように学習されることで生成されたモデルである
請求項１に記載の情報処理装置。
前記多層ニューラルネットワークは、ガウス過程に従った教師なしニューラルネットワークである、
請求項２に記載の情報処理装置。
コンピュータが
高次元データを入力とし、前記高次元データの次元数より低次元の次元数の可視化用の低次元データを出力するように学習された学習モデルであって、前記高次元データの特徴を反映しつつ前記高次元データの次元数より低次元でかつ前記低次元データの次元数より高次元の中間データに次元削減する第１次元削減処理を示す非線形変換を行うように学習された非線形変換部を示す第１モデルと、前記中間データの次元数を前記可視化用の低次元データの次元数に次元削減する第２次元削減処理を示す多様体学習を行うように学習された多様体学習部を示す第２モデルとを含む前記学習モデルを用いて、推定対象の複数の高次元データに対応する複数の可視化用の低次元データを推定し、
推定された前記複数の低次元データの各々を前記推定対象の複数のデータの特徴を示すデータとして可視化する制御を行う
情報処理方法。
コンピュータに
高次元データを入力とし、前記高次元データの次元数より低次元の次元数の可視化用の低次元データを出力するように学習された学習モデルであって、前記高次元データの特徴を反映しつつ前記高次元データの次元数より低次元でかつ前記低次元データの次元数より高次元の中間データに次元削減する第１次元削減処理を示す非線形変換を行うように学習された非線形変換部を示す第１モデルと、前記中間データの次元数を前記可視化用の低次元データの次元数に次元削減する第２次元削減処理を示す多様体学習を行うように学習された多様体学習部を示す第２モデルとを含む前記学習モデルを用いて、推定対象の複数の高次元データに対応する複数の可視化用の低次元データを推定し、
推定された前記複数の低次元データの各々を前記推定対象の複数のデータの特徴を示すデータとして可視化する制御を行う
処理を実行させるための情報処理プログラム。
高次元データを入力とし、前記高次元データの次元数より低次元の次元数の可視化用の低次元データを出力するように学習された学習モデルであって、前記高次元データの特徴を反映しつつ前記高次元データの次元数より低次元でかつ前記低次元データの次元数より高次元の中間データに次元削減する第１次元削減処理を示す非線形変換を行うように学習された非線形変換部を示す第１モデルと、前記中間データの次元数を前記可視化用の低次元データの次元数に次元削減する第２次元削減処理を示す多様体学習を行うように学習された多様体学習部を示す第２モデルとを含む前記学習モデルを生成する学習モデル生成部
を含む学習モデル生成装置。