JP2008152619A

JP2008152619A - データ処理装置およびデータ処理プログラム

Info

Publication number: JP2008152619A
Application number: JP2006341144A
Authority: JP
Inventors: Shinichiro Serizawa; 慎一郎芹澤; Tomoyuki Ito; 朋之伊藤
Original assignee: Fuji Xerox Co Ltd
Current assignee: Fujifilm Business Innovation Corp
Priority date: 2006-12-19
Filing date: 2006-12-19
Publication date: 2008-07-03
Also published as: US20080147576A1; CN101206727A; CN101206727B; US8001061B2; EP1939796A3; EP1939796A2

Abstract

【課題】いわゆる「教師あり学習」の学習精度向上を図る場合であっても処理負荷増大を抑制する。
【解決手段】第１データ群２１に対して教師なし学習によるデータ分類を行って当該第１データ群２１のデータ次元数を縮約した第１分類データ群２３を得る第１の教師なし学習処理手段１３と、第２データ群２２に対して教師なし学習によるデータ分類を行って当該第２データ群２２のデータ次元数を縮約した第２分類データ群２４を得る第２の教師なし学習処理手段１４と、前記第１の教師なし学習処理手段１３が得た第１分類データ群２３および前記第２の教師なし学習処理手段１４が得た第２分類データ群２４を教師にした教師あり学習により当該第１分類データ群２３と当該第２分類データ群２４との写像関係を特定する教師あり学習処理手段１５とを備えて、データ処理装置を構成する。
【選択図】図２

Description

本発明は、データ処理装置およびデータ処理プログラムに関する。

近年、生体の神経網を模擬した工学的情報処理機構であるニューラルネットワーク（神経回路網）が、様々な分野の情報処理に利用されている。ニューラルネットワークによる情報処理には、入出力の対応関係を学習するための「学習計算」と、入力値と学習した対応関係に基づいて出力値を生成する「出力計算」という２つの動作モードがある（例えば、特許文献１参照）。そして、「学習計算」には、「教師あり学習」と「教師なし学習」があることが広く知られている。

「教師あり学習」とは、目標または正解となるデータが「教師データ」として与えられる場合の学習をいう。具体的には、図７（ａ）に示すように、「教師あり学習」に対応した機能部分（以下、機能部分のことを「モジュール」という）３１は、「学習計算」の動作モードにて、教師データとなる第１データ群３２および第２データ群３３が与えられると、例えば誤差逆伝播学習法（バックプロパゲーション）を用いてこれらの写像関係を学習する。そして、学習後には、図７（ｂ）のように、「出力計算」の動作モードにて、例えば第１データ群に属する未知データ３４が与えられると、学習した写像関係に基づいて、第２データ群に属する推定データ３５を導き出すのである。

一方、「教師なし学習」は、「教師データ」が与えられない点で、「教師あり学習」とは異なる。すなわち、「教師なし学習」は、「出力すべきもの」が予め決まっていないという点で「教師あり学習」とは大きく異なり、データの背後に存在する本質的な構造を抽出するために用いられる。具体的には、例えばデータの類似度を基準にして当該データの分類を行う、いわゆるクラスター解析が、「教師なし学習」の代表例として挙げられる。

このような「教師あり学習」および「教師なし学習」を利用したニューラルネットワークとしては、「教師なし学習」に対応したモジュールにより、入力データを分類し、その分類結果に応じて複数の「教師あり学習」に対応したモジュールを使い分けるように構成されたものがある（例えば、特許文献２参照）。また、その他にも、例えば図８に示すように、「教師なし学習」に対応したモジュール４１が、「教師あり学習」に必要な教師データとなるデータ群４２について、何らかのパターンに分類して、分類毎に異なる意味付けの分類データ４３を得ることを可能にしたものがある（例えば、特許文献３参照）。

特開平６−３４８６７６号公報特開平８−３２９０３２号公報特開２００５−２９３２６４号公報

ところで、「教師あり学習」において、その学習精度の向上を図るためには、「教師データ」の数を増大させればよい。しかしながら、「教師データ」の数を増大させると、特に当該「教師データ」が大規模データ列である場合には、「学習計算」のための処理時間が膨大になってしまう。つまり、「教師あり学習」における学習精度向上は、必ずしも実用的であるとは言えない。

そこで、本発明は、「教師あり学習」の学習精度を向上するために「教師データ」の数を増大させた場合であっても処理負荷増大を抑制することのできるデータ処理装置およびデータ処理プログラムを提供することを目的とする。

本発明は、上記目的を達成するために案出されたデータ処理装置およびデータ処理プログラムである。
請求項１に係る発明は、第１データ群に対して教師なし学習によるデータ分類を行って、当該第１データ群のデータ次元数を縮約した第１分類データ群を得る第１の教師なし学習処理手段と、第２データ群に対して教師なし学習によるデータ分類を行って、当該第２データ群のデータ次元数を縮約した第２分類データ群を得る第２の教師なし学習処理手段と、前記第１の教師なし学習処理手段が得た第１分類データ群および前記第２の教師なし学習処理手段が得た第２分類データ群を教師にした教師あり学習により、当該第１分類データ群と当該第２分類データ群との写像関係を特定する教師あり学習処理手段とを備えることを特徴とするデータ処理装置である。ここで、「縮約」とは、規模を縮小して簡潔にすることをいう。したがって、データの「縮約」であれば、多次元情報を尺度化によって整理して集約された情報として纏めることをいう。
請求項２に係る発明は、前記第１データ群に属するデータを入力するデータ入力手段と、前記第２データ群に属するデータで前記データ入力手段に入力されたデータに対応するものを出力するデータ出力手段を備え、前記第１の教師なし学習処理手段でのデータ分類、前記教師あり学習処理手段が特定する写像関係および前記第２の教師なし学習処理手段でのデータ分類を基にして、前記データ入力手段に入力されたデータから前記データ出力手段で出力するデータを導き出すことを特徴とする請求項１記載のデータ処理装置である。
請求項３に係る発明は、前記第２データ群に属するデータを入力するデータ入力手段と、前記第１データ群に属するデータで前記データ入力手段に入力されたデータに対応するものを出力するデータ出力手段を備え、前記第１の教師なし学習処理手段でのデータ分類、前記教師あり学習処理手段が特定する写像関係および前記第２の教師なし学習処理手段でのデータ分類を基にして、前記データ入力手段に入力されたデータから前記データ出力手段で出力するデータを導き出すことを特徴とする請求項１または２記載のデータ処理装置である。
請求項４に係る発明は、前記第１データ群と前記第２データ群との少なくとも一方についての特徴量抽出を行う特徴量抽出手段を備えることを特徴とする請求項１、２または３記載のデータ処理装置である。
請求項５に係る発明は、前記第１データ群と前記第２データ群とは、シミュレーション処理の入力値と出力値の関係にあることを特徴とする請求項１〜４のいずれか１項に記載のデータ処理装置である。
請求項６に係る発明は、前記第１データ群と前記第２データ群とは、理論値と実測値の関係にあることを特徴とする請求項１〜４のいずれか１項に記載のデータ処理装置である。
請求項７に係る発明は、コンピュータを、第１データ群に対して教師なし学習によるデータ分類を行って、当該第１データ群のデータ次元数を縮約した第１分類データ群を得る第１の教師なし学習処理手段と、第２データ群に対して教師なし学習によるデータ分類を行って、当該第２データ群のデータ次元数を縮約した第２分類データ群を得る第２の教師なし学習処理手段と、前記第１の教師なし学習処理手段が得た第１分類データ群および前記第２の教師なし学習処理手段が得た第２分類データ群を教師にした教師あり学習により、当該第１分類データ群と当該第２分類データ群との写像関係を特定する教師あり学習処理手段として機能させることを特徴とするデータ処理プログラムである。

請求項１または請求項７に係る発明によれば、教師あり学習にあたり、データ次元数を縮約した第１、第２分類データ群を教師とするので、当該縮約を行わない場合に比べて、学習計算のための処理負荷を軽減することができる。つまり、教師あり学習の学習精度の向上を図る場合であっても、そのための処理負荷増大の抑制を実現することが可能なデータ処理装置またはデータ処理プログラムを構築することができる。
請求項２または請求項３に係る発明によれば、教師あり学習処理手段が教師あり学習を行った後であれば、ある写像関係にあるデータ同士について、基となるデータからこれに対応するデータを導き出したり、あるいはこれとは逆に対応データからその基になるデータを導き出したりすることを、本構成を有していない場合に比較して容易かつ高精度で行うことができる。
請求項４に係る発明によれば、第１の教師なし学習処理手段でのデータ分類、または第２の教師なし学習処理手段でのデータ分類の際に、抽出した特徴量に着目したデータ分類を行うことが可能となり、当該データ分類の精度向上が図れるようになる。
請求項５に係る発明では、本構成を有さない場合と比較してシミュレーション処理における計算処理の負荷軽減を通じて、当該シミュレーション処理の迅速化（時間短縮化）が図れる。
請求項６に係る発明では、データ群の対応関係の明確化を通じて、例えば理論値から実測値（現実の値）を予測する、といったことが容易に実現可能となる。

以下、図面に基づき本発明に係るデータ処理装置およびデータ処理プログラムについて説明する。

先ず、データ処理装置のハードウエア構成について説明する。図１は、データ処理装置のハードウエア構成例を示すブロック図である。

ここで例に挙げるデータ処理装置は、コンピュータとしての機能を有したものである。具体的には、パーソナルコンピュータやシミュレーション実行に特化したシミュレーション装置等を用いることが考えられる。

コンピュータとしての機能は、図１に示すハードウエア構成によって実現される。すなわち、データ処理装置１は、ＣＰＵ（Central Processing Unit）２、ＲＡＭ（Random Access Memory）３、ＲＯＭ（Read Only Memory）４、ＨＤＤ（Hard Disk Drive、これに類する記憶装置であってもよい）５、通信インターフェース（以下、インターフェースを「Ｉ／Ｆ」と略す）６、ユーザＩ／Ｆ７およびこれらを互いに接続する内部バス８を備えて構成されている。このうち、通信Ｉ／Ｆ６には、通信回線９が接続される。通信回線９としては、インターネット等の広域ネットワークを構築するための回線網が挙げられるが、ローカルエリアネットワーク（ＬＡＮ）を構築するためのものであっても、あるいはファクシミリ通信を行うための公衆電話回線網であってもよい。また、ユーザＩ／Ｆ７は、情報表示ディスプレイおよび操作スイッチ等によって構成することが考えられるが、ＣＲＴ（Cathode Ray Tube）や液晶パネル等のディスプレイ装置およびキーボードやマウス等の操作装置と接続するためのものであってもよい。
であってもよい。

続いて、データ処理装置１の機能構成について説明する。図２は、データ処理装置の機能構成例を示すブロック図である。

データ処理装置１は、ニューラルネットワークによる情報処理、すなわち「学習計算」および「出力計算」という２つの動作モードの情報処理を行うものである。そのために、データ処理装置１は、図例のように、データ入出力手段１１、特徴量抽出手段１２、第１の教師なし学習処理手段１３、第２の教師なし学習処理手段１４および教師あり学習処理手段１５としての機能を備えている。

データ入出力手段１１は、複数のデータの集合である第１データ群２１と、当該第１データ群２１とは別の複数のデータの集合である第２データ群２２とについて、当該データ群２１、２２を構成する各データの入力および出力を行うものである。第１データ群２１および第２データ群２２については、詳細を後述する。入力および出力は、通信Ｉ／Ｆ６またはユーザＩ／Ｆ７のいずれかを利用して行うことが考えられる。また、データ入出力手段１１としては、第１データ群２１および第２データ群２２のそれぞれについての入力および出力の両方に対応した１つの機能部分を設けることが考えられるが、第１データ群２１についての入力、第１データ群２１についての出力、第２データ群２２についての入力、第２データ群２２についての出力のそれぞれの対応した各機能部分を個別に設けても構わない。

特徴量抽出手段１２は、データ入出力手段１１より入力されたデータ群２１、２２の少なくとも一方について、その特徴量抽出を行うものである。「少なくとも一方」であるから、第１データ群２１と第２データ群２２との両方の特徴量抽出を行うものであってもよい。特徴量およびその抽出については、詳細を後述する。

第１の教師なし学習処理手段１３は、データ入出力手段１１より入力された第１データ群２１に対して、「教師なし学習」によるデータ分類を行って、当該第１データ群２１のデータ次元数を縮約した第１分類データ群２３を得るものである。
一方、第２の教師なし学習処理手段１４は、データ入出力手段１１より入力された第２データ群２２に対して、「教師なし学習」によるデータ分類を行って、当該第２データ群２２のデータ次元数を縮約した第２分類データ群２４を得るものである。
すなわち、第１の教師なし学習処理手段１３および第２の教師なし学習処理手段１４は、いずれも、「教師なし学習」に対応したモジュールを構成するものである。なお、「データ次元数」、第１分類データ群２３および第２分類データ群２４については、詳細を後述する。

教師あり学習処理手段１５は、第１分類データ群２３および第２分類データ群２４を教師にした「教師あり学習」により、当該第１分類データ群２３と当該第２分類データ群２４との写像関係を特定するものであり、また当該写像関係に基づいて、あるデータからこれに対応するデータを導き出すものである。すなわち、教師あり学習処理手段１５は、「教師あり学習」に対応したモジュールを構成するものである。

以上のようなデータ処理装置１を構成する各手段１１〜１５は、当該データ処理装置１におけるコンピュータとしての機能（ハードウエア構成）が、所定プログラムを実行することによって実現されるものである。その場合に、当該所定プログラムは、データ処理装置１内へのインストールに先立ち、コンピュータ読み取り可能な記憶媒体に格納されて提供されるものであっても、または有線若しくは無線による通信手段を介して配信されるものであってもよい。つまり、上述した機能構成のデータ処理装置１は、そのデータ処理装置１にインストール可能なデータ処理プログラムによっても実現することが可能である。

次に、以上のように構成されたデータ処理装置（データ処理プログラムによって実現される場合を含む）１における処理動作例について説明する。

ここで、先ず、データ処理装置１にて処理されるデータ群の具体例について説明する。図３は、処理されるデータ群の具体例を示す説明図である。

例えば、図３（a）に示す入力とそれに対して図３（ｂ）に示す出力とを持つ制御システムに適用した場合を考える。図３（a），（ｂ）は、いずれも、図中の横軸パラメータ（例えば時間）の値と縦軸パラメータ（例えば電圧）の値とが所定関係にあり、かつ、一方のパラメータ値の変化に応じて他方のパラメータ値が非線形に変化するデータの集まりを示している。そして、図３（a）に示すデータの集まり（＝データ群）と図３（ｂ）に示すデータの集まり（＝データ群）には、何らかの写像関係が存在している。

これらのデータ群では、当該データ群を構成する各データのそれぞれが１つの次元を構成する。したがって、例えば１０００個のデータ（図中における１０００個の点）が集まって構成されるデータ群であれば、当該データ群のデータ次元数は「１０００」となる。

ところで、図３（a），（ｂ）に示したデータ群を「教師データ」とし、従来技術を用いて「教師あり学習」を行うと、当該「教師あり学習」のための処理時間に５時間程度を要することが考えられる。したがって、その学習精度の向上を図るべく、図３（a），（ｂ）に示したデータ群をそれぞれ５０例用意すると、「教師あり学習」のための処理時間が（５×５０）時間となってしまい、実用的であるとは言えない。

そこで、上述した構成されたデータ処理装置１では、「学習計算」の動作モードにおいて、図３（a），（ｂ）に示したデータ群がそれぞれ第１データ群２１および第２データ群２２としてデータ入出力手段１１より入力されると、以下に述べるような処理動作を行う。

データ処理装置１では、第１データ群２１および第２データ群２２が入力されると、それぞれについて、特徴量抽出手段１２が特徴量抽出を行う。特徴量抽出を行えば、その後に行う「教師なし学習」によるデータ分類を、抽出した特徴量に着目して行うことができるからである。ただし、特徴量抽出手段１２による特徴量抽出は、必須の処理ではない。したがって、第１データ群２１および第２データ群２２が入力されても特徴量抽出を行わなかったり、あるいはいずれか一方に特徴量抽出を行うようにしても構わない。

ここで、特徴量抽出手段１２による特徴量抽出について、具体例を挙げて説明する。図４は、特徴量抽出の具体例を示す説明図である。
第１データ群２１の特徴量を抽出する場合を例に挙げると、特徴量抽出手段１２は、図４（ａ）に示すように、当該第１データ群２１に対してＦＦＴ（高速フーリエ変換）を用いて低周波成分のみを取り出して分類に用い、その分類結果を特徴量とすることが考えられる。
また、特徴量抽出手段１２は、図４（ｂ）に示すように、ある曲線のピーク値に着目し、その着目部分を特徴量とするものであってもよい。
このように、特徴量抽出手段１２は、特徴量抽出を行う場合には、公知の手法を利用しつつ当該特徴量抽出を行う。

その後、データ処理装置１では、第１データ群２１（特徴量抽出手段１２が特徴量抽出を行った場合は当該特徴量抽出後のもの）に対して、第１の教師なし学習処理手段１３が「教師なし学習」によるデータ分類を行う。また、第２データ群２２（特徴量抽出手段１２が特徴量抽出を行った場合は当該特徴量抽出後のもの）に対して、第２の教師なし学習処理手段１４が「教師なし学習」によるデータ分類を行う。「教師なし学習」によるデータ分類は、例えば自己組織化マップでの分類のように、公知の手法を利用して行えばよい。その結果、第１の教師なし学習処理手段１３および第２の教師なし学習処理手段１４は、それぞれ、第１分類データ群２３および第２分類データ群２４を得ることになる。

図３（ｃ），（ｄ）には、図３（a），（ｂ）に示した第１データ群２１および第２データ群２２のそれぞれについて、自己組織化マップで分類した結果、すなわち第１分類データ群２３および第２分類データ群２４の具体例を示している。

例えば、図３（ｃ）の第１分類データ群２３は、仮想的なＸＹ座標平面上にマッピングされたデータの集まりによって表現されるデータ群であり、図３（a）に示した第１データ群２１を構成する各データのそれぞれが、当該ＸＹ座標平面上のいずれかの座標点にマッピングされている。そして、各座標点におけるデータのベクトル類似度が、ユークリッドノルムの差によって、例えば差が大きければ濃色で差が小さければ淡色といったように、視認し得る態様で表現されている。

このような自己組織化マップによる分類、すなわち「教師なし学習」によるデータ分類を経ることによって、第１データ群２１および第２データ群２２は、いずれも、例えばデータ次元数が「１０００」のものが５０例用意された場合であっても、これらの全てがＸＹ座標平面上にマッピングされた態様の第１分類データ群２３および第２分類データ群２４に変換される。つまり、「教師なし学習」によるデータ分類を行うことで、第１データ群２１および第２データ群２２のそれぞれから、第１分類データ群２３および第２分類データ群２４が得られる。

これら第１分類データ群２３および第２分類データ群２４は、いずれも、ＸＹ座標平面上にマッピングされたデータ群である。したがって、当該データ群のデータ次元数は、Ｘ軸方向の座標値とＹ軸方向の座標値との「２」となる。換言すると、第１分類データ群２３および第２分類データ群２４は、第１データ群２１および第２データ群２２のデータ次元数（例えば、「１０００次元」×「５０例」＝「５００００次元」）を、ＸＹ座標平面上へのマッピングに対応したデータ次元数である「２」に縮約したものである。

なお、ここでは、ＸＹ座標平面上へのマッピングによってデータ次元数を「２」に縮約する場合を例に挙げたが、第１の教師なし学習処理手段１３および第２の教師なし学習処理手段１４は、１軸上へのマッピングによってデータ次元数を「１」に縮約するものであっても、あるいはＸＹＺ座標空間上へのマッピングによってデータ次元数を「３」に縮約するものであってもよい。このように、第１分類データ群２３および第２分類データ群２４は、元のデータ次元数には全く関わりなく、そのデータ次元数が縮約されたものである。

このようにして得た第１分類データ群２３および第２分類データ群２４には、何らかの写像関係が存在している。これらは第１データ群２１および第２データ群２２から得たものであり、元になった第１データ群２１および第２データ群２２には何らかの写像関係が存在しているからである。

このことから、第１分類データ群２３および第２分類データ群２４を得た後、データ処理装置１では、教師あり学習処理手段１５が、これら第１分類データ群２３および第２分類データ群２４を教師にした「教師あり学習」を行って、当該第１分類データ群２３と当該第２分類データ群２４との写像関係を特定する。具体的には、例えば、第１分類データ群２３におけるＸＹ座標と第２分類データ群２４におけるＸＹ座標との対応関係を特定する。このときの「教師あり学習」は、誤差逆伝播法等といった公知の手法を利用して行えばよい。

以上のような手順の処理動作を行うことで、データ処理装置１では、「学習計算」の動作モードにおいて、第１分類データ群２３と第２分類データ群２４の写像関係を介して、第１データ群２１と第２データ群２２の写像関係を学習することができる。そして、当該学習、特に第１分類データ群２３および第２分類データ群２４についての「教師あり学習」のための処理時間は、「教師なし学習」によるデータ次元数の縮約を経ているので、十数分程度である。

「学習計算」の動作モードを行った後は、データ処理装置１では、その「学習計算」の結果を利用して、「出力計算」の動作モードを実行することが可能となる。

「出力計算」には、「順問題解析」と「逆問題解析」がある。ここでは、第１データ群２１から第２データ群２２を導き出す「出力計算」を「順問題解析」といい、第２データ群２２から第１データ群２１を導き出す「出力計算」を「逆問題解析」という。

図５は、順問題解析の一具体例の示す説明図である。「順問題解析」を行う場合には、先ず、データ入出力手段１１にて第１データ群２１に属するデータが入力される（ステップ１０１、以下ステップを「Ｓ」と略す）。以下、このデータを「未知データ」という。そして、「未知データ」が入力されると、第１の教師なし学習処理手段１３が当該「未知データ」についての分類を行う（Ｓ１０２）。これにより、第１分類データ群２３のＸＹ座標平面上にて、当該「未知データ」に対応する座標点が特定されることになる（Ｓ１０３）。座標点が特定されると、その後は、教師あり学習処理手段１５で学習済みの写像関係を基に、当該座標点に対応する、第２分類データ群２４のＸＹ座標平面上での座標点を特定する（Ｓ１０４，Ｓ１０５）。そして、その座標点に対して、第２の教師なし学習処理手段１４が、逆データ分類を行う（Ｓ１０６）。これにより、データ入出力手段１１からは、第２データ群２２に属するデータで、データ入出力手段１１にて入力された「未知データ」に対応するもの（以下、このデータを「推定データ」という）が出力されることになる（Ｓ１０７）。つまり、教師あり学習処理手段１５が教師あり学習を行った後であれば、第２データ群２２に属するデータが不明であっても、第１データ群２１に属する「未知データ」について、第１の教師なし学習処理手段１３でのデータ分類、教師あり学習処理手段１５が特定する写像関係および第２の教師なし学習処理手段１４でのデータ分類を基にすることで、当該不明のデータを「推定データ」として「未知データ」から容易に導き出すことができるのである。

図６は、逆問題解析の一具体例の示す説明図である。「逆問題解析」を行う場合には、先ず、データ入出力手段１１にて第２データ群２２に属するデータが入力される（Ｓ２０１）。以下、このデータを「所望データ」という。そして、「所望データ」が入力されると、第２の教師なし学習処理手段１４が当該「所望データ」についての分類を行う（Ｓ２０２）。これにより、第２分類データ群２４のＸＹ座標平面上にて、当該「所望データ」に対応する座標点が特定されることになる（Ｓ２０３）。座標点が特定されると、その後は、教師あり学習処理手段１５で学習済みの写像関係を基に、当該座標点に対応する、第１分類データ群２３のＸＹ座標平面上での座標点を特定する（Ｓ２０４，Ｓ２０５）。そして、その座標点に対して、第１の教師なし学習処理手段１３が、逆データ分類を行う（Ｓ２０６）。これにより、データ入出力手段１１からは、第１データ群２１に属し、データ入出力手段１１にて入力された「所望データ」に対応するもの（以下、このデータを「基礎データ」という）が出力されることになる（Ｓ２０７）。つまり、教師あり学習処理手段１５が教師あり学習を行った後であれば、第１データ群２１に属するデータが不明であっても、第２データ群２２に属する「所望データ」について、第１の教師なし学習処理手段１３でのデータ分類、教師あり学習処理手段１５が特定する写像関係および第２の教師なし学習処理手段１４でのデータ分類を基にすることで、当該不明のデータを「基礎データ」として「所望データ」から容易に導き出すことができるのである。

以上のような「出力計算」の動作モードを行うデータ処理装置１では、第１データ群２１と第２データ群２２とが、例えばシミュレーション処理の入力値と出力値の関係にあれば、「学習計算」の動作モードでの学習結果を使って、当該シミュレーション処理において、未知の入力からこれに対応する出力を推定することができる。なお、シミュレーション処理は、特に限定されることはなく、様々な分野のシミュレーション処理に適用可能である。

また、第１データ群２１と第２データ群２２とが、例えば理論値と実測値の関係にあれば、「学習計算」の動作モードでの学習結果を使って、理論値からこれに対応する実測値を導き出し、これにより机上計算で得た理論値を実情に沿うように補正するといったことが実現可能となる。

なお、本実施形態では、本発明の好適な実施具体例について説明したが、本発明はその内容に限定されるものではなく、その要旨を逸脱しない範囲で適宜変更することが可能である。

例えば、本実施形態では、第１分類データ群２３および第２分類データ群２４が仮想的なＸＹ座標平面上に展開され、「教師あり学習」によってそれぞれのＸＹ座標同士の対応関係を特定する場合を例に挙げて説明したが、現実には当該ＸＹ座標平面がＲＡＭ３またはＨＤＤ５内のメモリ空間に形成されるため、ＸＹ座標同士を対応付けるのではなく、当該メモリ空間のメモリアドレス同士を対応付けるようにしても構わない。このことは、１軸上へのマッピングやＸＹＺ座標空間へのマッピング等の場合についても当て嵌まる。

また、本実施形態では、第１データ群２１と第２データ群２２とが、シミュレーション処理の入力値と出力値の関係または理論値と実測値の関係にあることを例示したが、例えば実測値と実測値（いわゆる生データ同士）の関係にある場合にも、本発明を適用することが可能である。

さらに、本実施形態では、１台のデータ処理装置１を用いる場合について説明したが、例えば複数台のデータ処理装置１を組み合わせて用いることも考えられる。具体的には、例えば２台のデータ処理装置１を用意し、一方のデータ処理装置１で処理する第２データ群２２を、他方のデータ処理装置１が処理する第１データ群２１とし、それぞれのデータ処理装置１に本実施形態で説明した一連の処理動作を行わせる。この場合、２つのデータ処理装置１の組み合わせを１つのデータ処理システムと考えると、他方のデータ処理装置１が処理するデータ群は、システム全体から見て第２データ群と第３データ群に相当することになる。つまり、ｎ（ｎは２以上の自然数）台のデータ処理装置１を用意し、それぞれのデータ処理装置１を用いて、システム全体から見て第１〜第（ｎ＋１）データ群を処理するのである。このようにすれば、例えば、第１データ群２１に属する未知データから第（ｎ＋１）データ群に属する推定データを導き出したり、あるいはその逆の処理を行ったりすることが実現可能となる。

本発明に係るデータ処理装置のハードウエア構成例を示すブロック図である。本発明に係るデータ処理装置の機能構成例を示すブロック図である。本発明に係るデータ処理装置にて処理されるデータ群の具体例を示す説明図である。本発明に係るデータ処理装置における特徴量抽出の具体例を示す説明図である。本発明に係るデータ処理装置における順問題解析の一具体例の示す説明図である。本発明に係るデータ処理装置における逆問題解析の一具体例の示す説明図である。従来における教師あり学習の概念の一例を示す模式図である。従来における教師なし学習の概念の一例を示す模式図である。

符号の説明

１…データ処理装置、２…ＣＰＵ、３…ＲＡＭ、４…ＲＯＭ、５…ＨＤＤ、６…通信Ｉ／Ｆ、７…ユーザＩ／Ｆ、８…内部バス、９…通信回線、１１…データ入出力手段、１２…特徴量抽出手段、１３…第１の教師なし学習処理手段、１４…第２の教師なし学習処理手段、１５…教師あり学習処理手段、２１…第1データ群、２２…第２データ群、２３…第１分類データ群、２４…第２データ分類データ群

Claims

第１データ群に対して教師なし学習によるデータ分類を行って、当該第１データ群のデータ次元数を縮約した第１分類データ群を得る第１の教師なし学習処理手段と、
第２データ群に対して教師なし学習によるデータ分類を行って、当該第２データ群のデータ次元数を縮約した第２分類データ群を得る第２の教師なし学習処理手段と、
前記第１の教師なし学習処理手段が得た第１分類データ群および前記第２の教師なし学習処理手段が得た第２分類データ群を教師にした教師あり学習により、当該第１分類データ群と当該第２分類データ群との写像関係を特定する教師あり学習処理手段と
を備えることを特徴とするデータ処理装置。
前記第１データ群に属するデータを入力するデータ入力手段と、
前記第２データ群に属するデータで前記データ入力手段に入力されたデータに対応するものを出力するデータ出力手段を備え、
前記第１の教師なし学習処理手段でのデータ分類、前記教師あり学習処理手段が特定する写像関係および前記第２の教師なし学習処理手段でのデータ分類を基にして、前記データ入力手段に入力されたデータから前記データ出力手段で出力するデータを導き出すことを特徴とする請求項１記載のデータ処理装置。
前記第２データ群に属するデータを入力するデータ入力手段と、
前記第１データ群に属するデータで前記データ入力手段に入力されたデータに対応するものを出力するデータ出力手段を備え、
前記第１の教師なし学習処理手段でのデータ分類、前記教師あり学習処理手段が特定する写像関係および前記第２の教師なし学習処理手段でのデータ分類を基にして、前記データ入力手段に入力されたデータから前記データ出力手段で出力するデータを導き出すことを特徴とする請求項１または２記載のデータ処理装置。
前記第１データ群と前記第２データ群との少なくとも一方についての特徴量抽出を行う特徴量抽出手段を備えることを特徴とする請求項１、２または３記載のデータ処理装置。
前記第１データ群と前記第２データ群とは、シミュレーション処理の入力値と出力値の関係にあることを特徴とする請求項１〜４のいずれか１項に記載のデータ処理装置。
前記第１データ群と前記第２データ群とは、理論値と実測値の関係にあることを特徴とする請求項１〜４のいずれか１項に記載のデータ処理装置。
コンピュータを、
第１データ群に対して教師なし学習によるデータ分類を行って、当該第１データ群のデータ次元数を縮約した第１分類データ群を得る第１の教師なし学習処理手段と、
第２データ群に対して教師なし学習によるデータ分類を行って、当該第２データ群のデータ次元数を縮約した第２分類データ群を得る第２の教師なし学習処理手段と、
前記第１の教師なし学習処理手段が得た第１分類データ群および前記第２の教師なし学習処理手段が得た第２分類データ群を教師にした教師あり学習により、当該第１分類データ群と当該第２分類データ群との写像関係を特定する教師あり学習処理手段
として機能させることを特徴とするデータ処理プログラム。