JP5984153B2

JP5984153B2 - 情報処理装置、プログラム、及び情報処理方法

Info

Publication number: JP5984153B2
Application number: JP2014192511A
Authority: JP
Inventors: 孝行勝木; 祐真篠原
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 2014-09-22
Filing date: 2014-09-22
Publication date: 2016-09-06
Anticipated expiration: 2034-09-22
Also published as: US10289964B2; US20170140303A1; US9928468B2; JP2016062544A; US11907809B2; US20180114146A1; US20160196505A1; US10282679B2; US20190171971A1; US9922292B2; US20180101792A1

Description

本発明は、機械学習を行う情報処理装置、プログラム、及び情報処理方法に関する。

車両に搭載した機器で路面等を撮影し、交通状況及び道路状態を分析する方法として、特許文献１及び２が知られている。また、ドライブレコーダに記録された動画等から導出した道路の特徴に基づき、区間ごとの道路の健全性を示すＭＣＩ（道路の維持管理指数）を推測することが知られている（非特許文献１）。しかし、道路全体の特徴がまんべんなくＭＣＩに反映されるとは限らず、道路全体の特徴からＭＣＩを予測する従来の回帰分析を用いた手法では、ＭＣＩを正確に予測することができなかった。
［特許文献１］特開２０１２−７９２２号公報
［特許文献２］特開平１０−２０４８２１号公報
［非特許文献１］社会インフラの効率的な維持管理の実現、村上茂之等、Ｐ．３０〜６３７、ＦＵＪＩＴＳＵ．６４，６、１１，２０１３
（http://img.jp.fujitsu.com/downloads/jp/jmag/vol64-6/paper04.pdfを参照。）

例えば、ドライブレコーダで記録された道路の動画のような区間ごとのデータセットから、データセットに対応するＭＣＩ等のラベルをより正確に予測可能な予測モデルを提供することを目的とする。

本発明の第１の態様においては、複数の学習対象のデータセットとそれぞれの学習対象のデータセットに割り付けられた学習用のラベルとからなる学習データを用いて、予測対象のデータセットに割り付けるべきラベルを予測する予測モデルを学習する情報処理装置であって、学習データにおける複数の学習対象のデータセットのそれぞれから複数のサブセットを抽出する抽出部と、複数の学習対象のデータセットのそれぞれにおいて、複数のサブセットのそれぞれを重みづけてラベルの予測に反映する予測モデルを学習する学習処理部と、を備える情報処理装置、当該情報処理装置に用いるプログラム、及び、当該情報処理を提供する。

なお、上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではない。また、これらの特徴群のサブコンビネーションもまた、発明となりうる。

道路状態及びＭＣＩの関係の一例を示す。本実施形態の情報処理装置１０のブロック図を示す。本実施形態の情報処理装置１０による学習処理のフローを示す。本実施形態に係るデータセット及びサブセットの一例を示す。本実施形態の情報処理装置１０によるラベル予測の処理フローを示す。本実施形態の情報処理装置１０による予測精度を示す。コンピュータ１９００のハードウェア構成の一例を示す。

以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。

図１は、道路状態及びＭＣＩの関係の一例を示す。ＭＣＩは、修繕等の目安とするために、区間ごとの舗装路面の状態を定量的に評価した値である。ＭＣＩは、路面のひびわれ率、わだち掘れ量、及び／又は縦断凹凸量に基づいて算出される値であり、例えば、５未満となる場合に道路の修繕が通常必要と考えられている。

ＭＣＩは、専用の測定機器を搭載した測定車等により正確な値が定期的に測定される。一方で、例えば汎用の乗用車のドライブレコーダの動画等を分析してＭＣＩを推測することにより、道路状態を簡易的に適宜評価することができる。この前提として、専用の測定車で測定した正確なＭＣＩと、ドライブレコーダの動画等との関係を予め学習することが望ましい。

図１（ａ）〜（ｄ）は、学習に用いられる区間ごとの道路の路面状態の例と、各道路に対応して付与されるＭＣＩの一例とを示す。図１（ａ）は、区間全体で比較的大きな凹凸が多数発生しており、その結果ＭＣＩが３となる道路を示す。図１（ｂ）は、区間中の１か所に大きな穴が空いているが、他の区間は平坦であり、その結果ＭＣＩが３．１となる道路を示す。図１（ｃ）は、区間中の２か所に大きな穴が空いているが、他の区間は平坦であり、その結果ＭＣＩが２．９となる道路を示す。図１（ｄ）は、区間中に大きな凹凸及び穴もなく、その結果ＭＣＩが６となる道路を示す。

ここで、図１（ａ）ではまんべんなく欠陥が生じているのに対し、図１（ｂ）〜（ｃ）では一部のみに欠陥が生じており、両者の道路の特徴は全体的に似ていない。従って、図１（ａ）及び図１（ｂ）又は（ｃ）の道路からは、全く異なった特徴が抽出される。しかし、ＭＣＩの学習においては、全く異なる図１（ａ）〜（ｃ）の特徴からほぼ同一の値のＭＣＩを予測する予測モデルを学習する必要がある。

一方で、図１（ｂ）〜（ｃ）のような一部にのみ欠陥を含む道路と、図１（ｄ）のような欠陥がほぼ無い道路とは道路の大部分において特徴が類似する。従って、図１（ｂ）又は（ｃ）と図１（ｄ）の道路からは、類似した特徴が抽出される。しかし、ＭＣＩの学習においては、類似する図１（ｂ）〜（ｄ）の特徴から全く異なる値のＭＣＩを予測する予測モデルを学習する必要がある。

このように、ＭＣＩを算出する計算ルールは非線形かつ煩雑であり、ドライブレコーダのような簡易的な測定データを学習データとしてＭＣＩを正確に予測する予測モデルを生成することは困難であった。本発明に係る情報処理装置は、このような簡易的に測定されたデータセットとラベル割り付けとの非線形な関係をより正確に学習する。

図２は、本実施形態に係る情報処理装置１０のブロック図を示す。情報処理装置１０は、複数の学習対象のデータセットとそれぞれの前記学習対象のデータセットに対して予め割り付けられた学習用のラベルとを有する学習データを用いて、予測対象のデータセットに割り付けるべきラベルを予測する予測モデルを学習し、学習した予測モデルに基づいて予測対象データからラベルを予測する。情報処理装置１０は、特徴量取得部１１０、抽出部１３０、ベクトル生成部１５０、学習処理部１７０、及び、予測部１９０を備える。

取得部１１０は、情報処理装置１０の処理に用いるデータを取得する。例えば、取得部１１０は、外部のデータベース２０等から複数の学習対象のデータセットに対して学習用のラベルが割り付けられた学習データを取得する。一例として、情報処理装置１０は、複数のデータセットとしてドライブレコーダで撮影した複数の区間ごとの道路の動画を含み、ラベルとして各区間の測定済みのＭＣＩを含む学習データを取得する。

また、例えば、取得部１１０は、外部のデータベース２０等から予測対象となる複数の予測対象のデータセットを有する予測対象データを取得してよい。取得部１１０は、取得した学習データ及び予測対象データを抽出部１３０に供給する。

抽出部１３０は、学習データ及び予測対象データにおける複数のデータセットのそれぞれから複数のサブセットを抽出する。例えば、抽出部１３０は、複数のデータセットとして取得した区間ごとの道路の動画等を予め定められた時間で分割したものを、複数のサブセットとして抽出する。抽出部１３０は、複数のデータセットについて抽出した複数のサブセットを、ベクトル生成部１５０に供給する。

ベクトル生成部１５０は、学習データ及び予測対象データに係るサブセットのそれぞれについて、サブセットの特徴を表す複数の特徴量を含む特徴ベクトルを生成する。例えば、ベクトル生成部１５０は、各サブセットに含まれる道路の動画のデータ（例えば、道路の輝度情報等）を複数の特徴量に変換し、複数の特徴量を含む特徴ベクトルをサブセットごとに生成する。ベクトル生成部１５０の具体的な処理内容は後述する。ベクトル生成部１５０は、学習データについて生成した特徴ベクトルを学習処理部１７０に供給し、予測対象データについて生成した特徴ベクトルを予測部１９０に供給する。

学習処理部１７０は、複数の学習対象のデータセットのそれぞれにおいて、複数のサブセットのそれぞれを重みづけてラベルの予測に反映する予測モデルを学習する。これにより、学習処理部１７０は、ラベルの予測に重く反映させるサブセット、及び、ラベルの予測にあまり反映させないサブセットを区別した上で、複数のサブセットからラベルを予測する予測モデルを構築する。学習処理部１７０の具体的な処理内容は後述する。学習処理部１７０は、学習した結果得られた予測モデルを予測部１９０に供給する。

予測部１９０は、学習処理部１７０が学習した予測モデルに基づき、予測対象データのデータセットに対応するラベルを予測する。例えば、予測部１９０は、予測対象データの複数のデータセットについて生成された特徴ベクトルを予測モデルに適用し、予測対象データのデータセットに対応するラベルを予測する。予測部１９０の具体的な処理内容は後述する。

このように、情報処理装置１０は、ラベル割り付けの対象となるデータセットから複数のサブセットを抽出し、サブセットごとに異なる重みづけをして予測モデルを生成する。これにより、情報処理装置１０は、サブセットのうち、ラベルにより大きな影響を与える部分をより大きな割合で予測に用いることができ、データセット全体を均等に予測に用いる方法よりも正確な予測モデルを学習することができる。

図３は、本実施形態の情報処理装置１０の学習処理部１７０による学習処理のフローを示す。情報処理装置１０は、学習処理に用いる学習データとして、一定の手順に従って複数のサブセットが抽出可能なデータセット、及び、データセットに対して割り当てられるべきラベルを用いる。以下の説明では、一例として、情報処理装置１０が、データセットとしてドライブデコーダから取得した道路の動画等を用い、ラベルとして専用の測定機器で予め測定されたＭＣＩを用いた場合について説明する。これ以外にも、情報処理装置１０は、製品の製造工程の画像と製品の欠陥度等の、様々なデータセットとラベルとの非線形な組を学習データとして用いることができる。

まず、Ｓ１１０において、取得部１１０が、学習データとして、複数の学習対象のデータセット、及び、データセットのそれぞれに割り付けるべき学習用のラベルを取得する。例えば、取得部１１０は、まず、情報処理装置１０の外部又は内部に設けられたデータベース２０から乗用車に搭載されたドライブレコーダで撮影した動画、同乗用車に搭載された加速度センサが測定した時系列上の加速度データ、及び、同乗用車に搭載されたＧＰＳによる位置データを取得する。

次に、取得部１１０は、各時刻における乗用車の位置をＧＰＳから取得し、一のＭＣＩが予め割り当てられた道路の第１区間長さ（例えば１００ｍ）ごとに、動画及び加速度データを分割する。取得部１１０は、複数個（例えば、Ｎ個）に分割された動画及び加速度データを、複数のデータセットとし、各区間に対応する予め測定されたＭＣＩを割り付けるべきラベルとする。取得部１１０は、取得した学習データを抽出部１３０に供給する。

次に、Ｓ１２０において、抽出部１３０が、学習データにおける複数のデータセットのそれぞれから複数のサブセットを抽出する。例えば、抽出部１３０は、経時的に観測される時系列データセットから複数のサブセットとして時系列上で連続する複数のデータ列を抽出する。一例として、抽出部１３０は、道路の第２区間長さ（例えば１０ｍ）ごとに、データセットの動画及び加速度データを時系列上で分割し、第２区間ごとの複数のデータ列から、各サブセットとして予め定められた数（例えば、３個）のデータ列を抽出する。

ここで、抽出部１３０は、スライディングウィンドウを用いて、時系列上で互いに一部が重複する又は重複しない複数のデータ列を抽出してよい。例えば、抽出部１３０は、それぞれのデータセットに含まれる動画及び加速度データから、時間的な重複を含む複数（例えばＤ個）のサブセットを抽出する。

抽出部１３０は、データ列として複数の説明変数の値の組を抽出してよい。一例として、抽出部１３０は、それぞれのデータ列として、第２区間長さごとの動画に含まれる道路画像の輝度情報及び輝度の勾配（エッジ）情報等、及び、加速度データ中に含まれるＸＹＺ軸上の加速度等を抽出してよい。抽出部１３０は、抽出した複数のサブセットをベクトル生成部１５０に供給する。

次に、Ｓ１３０において、ベクトル生成部１５０は、サブセットのそれぞれについて、複数の特徴量を含む特徴ベクトルを生成する。例えば、ベクトル生成部１５０は、ｎ番目（ｎ∈Ｎ）のデータセットにおける、ｄ番目（ｄ∈Ｄ）のサブセットに含まれる複数のデータ列に基づいて、複数の特徴量を要素として含む特徴ベクトルｘ_ｎ，ｄを生成する。

例えば、ベクトル生成部１５０は、サブセット中のデータ列に含まれる輝度情報及び輝度の勾配（エッジ）情報等、並びに、ＸＹＺ軸上の加速度等の説明変数の基本統計量（平均、及び／又は、標準偏差等）を算出し、取得した値を特徴量とする特徴ベクトルｘ_ｎ，ｄを生成してよい。

これに代えて、ベクトル生成部１５０は、サブセット中の複数のデータ列からＢａｇｏｆＷｏｒｄｓに基づいて特徴ベクトルｘ_ｎ，ｄを生成してよい。例えば、ベクトル生成部１５０は、サブセット中の説明変数において、予め定められた値の複数種のパターンを定義し、サブセット中で検出された複数種のパターンの出現頻度（ヒストグラム）を特徴量として有する特徴ベクトルｘ_ｎ，ｄを生成してよい。ベクトル生成部１５０は、生成した特徴ベクトルを学習処理部１７０に供給する。

次に、Ｓ１４０において、学習処理部１７０は、複数のデータセットのそれぞれにおいて、複数のサブセットのそれぞれを重みづけてラベルの予測に反映する予測モデルを学習する。例えば、学習処理部１７０は、サブセットごとに異なる重み係数η_ｎ，ｄを割り当て、当該サブセットごとの重み係数η_ｎ，ｄと、特徴ベクトルｘ_ｎ，ｄと、複数の特徴量のそれぞれに対応する複数の回帰係数を含む回帰ベクトルｗとを用いて予測モデルを学習する。これにより、学習処理部１７０は、サブセットごとに重みづけてラベルの予測結果に反映させる予測モデルを学習する。

ここで、学習処理部１７０は、回帰ベクトルｗ及び重み係数η_ｎ，ｄの事前分布と、及び、学習データＤを用いて重み付きのベイズ推定を実行し、回帰ベクトルｗ及び重み係数η_ｎ，ｄの事後確率分布を学習結果として出力してよい。

一例として、学習処理部１７０は、数式１に示す予測モデルに基づいて、回帰ベクトルｗ及び重み係数η_ｎ，ｄを学習してよい。

ここで、ｐ（Ｙ｜χ，ｗ，β，η）は、Ｎ個のデータセットＸ_ｎの全体からなる集合χ、ｗ、β及びηの値を所与としたときの、Ｎ個のラベルｙ_ｎの全体からなる集合Ｙの確率分布を示す。集合Ｘ_ｎは学習データにおけるｎ番目のデータセットを示し、Ｄ_ｎはｎ番目のデータセットから抽出されるサブセットの個数を示し、ベクトルｘ_ｎ，ｄはＸ_ｎにおけるｄ番目のサブセットに対応する特徴ベクトルを示し、ｙ_ｎは学習データでＸ_ｎに割り付けられるラベルを示し、η_ｎ，ｄはη_ｎ，１〜η_ｎ，Ｄの総和が１となる各サブセットの重み係数を示し、βはノイズの精度を示す。また、Ｌ（・）は誤差関数であり、例えば、Ｌ（ａ，ｂ）＝（ａ−ｂ）^２となる二乗誤差であってよい。

数式１に示すように、学習処理部１７０は、特徴ベクトルｘ_ｎ，ｄ及び回帰ベクトルｗに基づいてサブセットｄごとに予測されるラベル（ｗ^Ｔｘ_ｎ，ｄ）と、学習データの対応するデータセットに割り付けられたラベルｙ_ｎとの誤差を示す項Ｌ（ｙ_ｎ，ｗ^Ｔｘ_ｎ，ｄ）に、重み係数η_ｎ，ｄを乗じた値のｎ∈Ｎ及びｄ∈Ｄの総和に応じた数を指数とする指数関数の値を、学習データにおけるラベルｙ_ｎの集合Ｙの確率分布ｐ（Ｙ｜χ，ｗ，β，η）とする予測モデルを用いてよい。

学習処理部１７０は、上記予測モデルを用いて、ｎ∈Ｎのデータ全体を所与としたときの回帰ベクトルｗの事後確率分布ｐ（ｗ｜χ，Ｙ）及び重み係数の事後確率分布ｐ（η｜χ，Ｙ）を算出する。例えば、学習処理部１７０は、学習データ集合におけるラベルＹの確率分布ｐ（Ｙ｜χ，ｗ，β，η）に回帰ベクトルｗの事前確率分布ｐ（ｗ）を乗じ、不要なパラメータβ，ηについて周辺化したものを、正規化定数となるラベルＹの周辺分布ｐ（Ｙ|χ）で除することにより、回帰ベクトルｗの事後確率分布ｐ（ｗ｜χ，Ｙ）を算出してよい。一例として、学習処理部１７０は、回帰ベクトルｗの事後確率分布をｐ（ｗ｜χ，Ｙ）＝［∫ｐ（Ｙ｜χ，ｗ，β，η）×ｐ（ｗ，β，η）ｄβｄη］／［∫ｐ（Ｙ｜χ，ｗ，β，η）×ｐ（ｗ，β，η）ｄｗｄβｄη］を用いて算出してよい。

また、例えば、学習処理部１７０は、学習データ集合におけるラベルｙ_ｎの集合Ｙの確率分布ｐ（Ｙ｜χ，ｗ，β，η）に重み係数ηの事前確率分布ｐ（η）を乗じ、不要なパラメータｗ，βについて周辺化したものを、正規化定数となるＹの周辺分布ｐ（Ｙ｜χ）で除することにより、重み係数ηの事後確率分布ｐ（η｜χ，Ｙ）を算出してよい。一例として、学習処理部１７０は、重み係数ηの事後確率分布をｐ（η｜χ，Ｙ）＝［∫ｐ（Ｙ｜χ，ｗ，β，η）×ｐ（ｗ，β，η）ｄβｄｗ］／［∫ｐ（Ｙ｜χ，ｗ，β，η）×ｐ（ｗ，β，η）ｄｗｄβｄη］を用いて算出してよい。

学習処理部１７０は、変分ベイズ法を用いて高速に回帰ベクトルｗ及び重み係数ηを算出してよく、これに加えて／代えて、マルコフ連鎖モンテカルロ法（ＭＣＭＣ法）等のサンプリングにより回帰ベクトルｗ及び重み係数ηを算出してもよい。

また、学習処理部１７０は、ＡＲＤ（ＡｕｔｏｍａｔｉｃＲｅｌｅｖａｎｃｅＤｅｔｅｒｍｉｎａｔｉｏｎ）を用いて、説明変数の選択を同時に行ないながら、予測モデルを構築してもよい。例えば、学習処理部１７０は、回帰ベクトルｗの事前分布ｐ（ｗ）に疎なモデル（ＡＲＤ事前分布）を用いることにより、複数の説明変数のうちラベルの予測に用いるものと用いないものを区別することができる。これにより、学習処理部１７０は、ラベルの予測に害をなす冗長な説明変数の影響（多重共線性等の悪い影響）を排除することができる。

また、学習処理部１７０は、数式１に示す線形な予測モデルを用いることに代えて、非線形な予測モデルを用いてよい。例えば、学習処理部１７０は、特徴ベクトルｘ_ｎ，ｄの代わりに、特徴ベクトルｘ_ｎ，ｄを基底関数に入力したベクトルφ（ｘ_ｎ，ｄ）を用いてよい。これにより、学習処理部１７０は、非線形な予測モデルを学習することが可能となる。一例として、学習処理部１７０は、数式２に示す予測モデルに基づいて、回帰ベクトルｗ及び重み係数η_ｎ，ｄを学習してよい。

ここで、学習処理部１７０は、カーネル法を用いて非線形な予測モデルを学習してよい。例えば、学習処理部１７０は、基底関数φ（ｘ_ｎ，ｄ）として、φ（ｘ_ｎ，ｄ）＝（ｅｘｐ（｜ｘ_ｎ，ｄ−ｘ_（１）｜）^２、ｅｘｐ（｜ｘ_ｎ，ｄ−ｘ_（２）｜）^２、…ｅｘｐ（｜ｘ_ｎ，ｄ−ｘ_（Ｍ）｜）^２）を用いてよい。ここでベクトルｘ_（１）、ｘ_（２）…ｘ_（Ｍ）は、予め定められたパターンの値を有するベクトルであり、例えば、過去に測定された道路の動画特徴及び加速度の値に対応したパターンであってよい。

学習処理部１７０は、特徴ベクトルｘ_ｎ，ｄと過去の測定結果に対応するベクトルｘ_（１）、ｘ_（２）…ｘ_（Ｍ）とを比較し、両者が一致する成分を回帰ベクトルｗに適用する基底関数φ（ｘ_ｎ，ｄ）として出力する。これにより、学習処理部１７０は、過去に測定された道路の動画等に基づいて適切な回帰ベクトルｗを学習することができる。

別の一例として、学習処理部１７０は、φ（ｘ_ｎ，ｄ）＝（α_１ｘ_１＋α_２ｘ_１ ^２＋α_３ｘ_１ ^３＋…α_Ｚｘ_１ ^Ｚ，α_１ｘ_２＋α_２ｘ_２ ^２＋α_３ｘ_２ ^３＋…α_Ｚｘ_２ ^Ｚ，…α_１ｘ_Ｍ＋α_２ｘ_Ｍ ^２＋α_３ｘ_Ｍ ^３＋…α_Ｚｘ_Ｍ ^Ｚ）（α_１、α_２…α_Ｚは定数でｘ_１、ｘ_２…ｘ_Ｍは特徴ベクトルｘ_ｎ，ｄの各要素）等を用いることで、線形モデルと非線形モデルの混合モデルとなる予測モデルを用いてよい。

更に、学習処理部１７０は、既に学習済みの学習データに加えて追加で入力された学習データを更に用いて、回帰ベクトル及び重み係数を学習してよい。例えば、学習処理部１７０は、学習データに基づき出力した回帰ベクトル及び重み係数の事後確率分布を事前分布として用い、追加で入力された学習データに対する回帰ベクトル及び重み係数の事後確率分布を出力してよい。

学習処理部１７０は、重み付きのベイズ推定を用いる代わりに、重み付きの最小二乗法又は重み付き最尤推定法等により、回帰ベクトルｗ及び重み係数ηを学習してもよい。

次に、Ｓ１５０において、学習処理部１７０は、学習の結果を出力する。例えば、学習処理部１７０は、学習の結果得られた回帰ベクトルｗ及び重み係数ηを情報処理装置１０の表示画面に表示し、及び／又は、情報処理装置１０の内部／外部の記憶装置に格納してよい。また、学習処理部１７０は、学習の結果得られた回帰ベクトルｗ及び重み係数ηを予測部１９０に供給する。

このように情報処理装置１０は、ラベル付けの対象となるデータセットから複数のサブセットを抽出し、データセット及びサブセットごとの重み係数η_ｎ，ｄと回帰ベクトルｗとを同時に学習する。これにより、情報処理装置１０は、各サブセットのラベルへの影響の度合い（すなわち、重み係数η_ｎ，ｄ）を学習する。

すなわち、情報処理装置１０は、データセットのうち割り当てられるラベルに与える影響が大きい部分を特定する。これにより、情報処理装置１０は、ラベルへの影響が少ないサブセットによるラベルの予測への誤差を低減するので、より正確に回帰ベクトルｗを学習することができる。

例えば、情報処理装置１０によると、道路のうち割り当てられたＭＣＩを代表する部分を特定することができる。一例として、情報処理装置１０によると、図１（ａ）については区間全体をＭＣＩを代表する部分として特定し、図１（ｂ）及び（ｃ）については穴の空いた部分をＭＣＩを代表する部分として特定する。これにより、情報処理装置１０は、全く異なる図１（ａ）〜（ｃ）の特徴からほぼ同一の値のＭＣＩを予測する予測モデルを学習し、類似する図１（ｂ）〜（ｄ）の特徴から全く異なる値のＭＣＩを予測する予測モデルを学習することができる。情報処理装置１０によると、ＭＣＩが低いデータセットのうち、重み係数η_ｎ，ｄが大きい部分を実際に修理が必要な部分として特定することができるので、道路の検査負担を低減することができる。

図４は、本実施形態に係る学習データのデータセット及びサブセットの一例を示す。取得部１１０は、図示するように、データセット１、データセット２、…データセットＮを含むＮ個のデータセットを取得してよい。取得部１１０は、各データセットとして、説明変数の組をデータ列ごとに取得する。例えば、道路のＭＣＩを学習する場合、一のデータセットが１０個のデータ列を含むとすると、取得部１１０は、各データセットとして、Ｖ個の説明変数（道路の輝度情報等）を含むデータ列を第２区間長さ（例えば１０ｍ）ごとに１０個取得する。

抽出部１２０は、各データセット（例えば、データセット１）から、サブセット１、サブセット２、サブセット３、…サブセットＤを含むＤ個のサブセットを抽出する。抽出部１２０は、各サブセット１〜ＤとしてＶ個の説明変数からなるデータ列をＬ個取得してよい。例えば、抽出部１２０は、連続する３個のデータ列（例えば、１０ｍ×３の道路に対応）に係る説明変数の組を各サブセットとして取得する。

ここで、抽出部１２０は、互いに重複するデータ列を含む説明変数の組を各サブセットとして取得してよい。例えば、図示するように、抽出部１２０は、１〜３番目のデータ列に係る説明変数ｄ_１，１〜ｄ_３，ｖの組をサブセット１として取得し、２〜４番目のデータ列に係る説明変数ｄ_２，１〜ｄ_４，ｖの組をサブセット２として取得し、３〜５番目のデータ列に係る説明変数ｄ_３，１〜ｄ_５，ｖの組をサブセット３として取得し、…Ｄ〜Ｄ＋２番目のデータ列に係る説明変数ｄ_Ｄ，１〜ｄ_{Ｄ＋２，ｖ}の組をサブセットＤして取得してよい。

図５は、本実施形態の情報処理装置１０の予測部１９０によるラベル予測の処理フローを示す。本実施形態において、情報処理装置１０は、Ｓ２１０〜Ｓ２５０の処理を実行することにより、予測モデルに基づくシミュレーションを実行する。

まず、Ｓ２１０において、取得部１１０が、予測対象となる複数のデータセットを有する予測対象データを取得する。ここで、取得部１１０は、Ｓ１１０で複数のデータセットを取得したのと同様の手法により、予測対象の複数のデータセットを取得してよい。取得部１１０は、取得した予測対象データを抽出部１３０に供給する。

次に、Ｓ２２０において、抽出部１３０が、予測対象データにおける複数のデータセットのそれぞれから予測対象の複数のサブセットを抽出する。抽出部１３０は、Ｓ１２０における学習データからの複数のサブセットの抽出と同様の手法により、予測対象の複数のサブセットを抽出してよい。抽出部１３０は、抽出した予測対象の複数のサブセットをベクトル生成部１５０に供給する。

次に、Ｓ２３０において、ベクトル生成部１５０は、予測対象のサブセットのそれぞれについて、複数の特徴量を含む特徴ベクトルを生成する。ベクトル生成部１５０は、Ｓ１３０における同様の手法により、予測対象のサブセットについて特徴ベクトルを生成してよい。ベクトル生成部１５０は、生成した特徴ベクトルを予測部１９０に供給する。

Ｓ２４０において、予測部１９０は、学習処理部１７０が学習した予測モデルに基づき予測対象データの複数の予測対象のデータセットに対応するラベルを予測する。例えば、予測部１９０は、数式３の予測モデルに基づき、学習された回帰ベクトルｗを用いて、予測対象のデータセットＸ_ｎ'に対応するラベルｙ_ｎ'及び重み係数η_ｎ'，ｄを同時に予測してよい。

例えば、予測部１９０は、学習されたｗとβを入力した確率ｐ（ｙ_ｎ'｜Ｘ_ｎ',ｗ，β，η）に最大値を与えるラベルｙ_ｎ'及び重み係数η_ｎ'，ｄの組におけるラベルｙ_ｎ'を予測対象データのデータセットＸ_ｎ'から予測されるラベルとしてよい。

また、例えば、予測部１９０は、学習結果に含まれる回帰ベクトルｗの事後確率分布をｐ（ｗ|Ｙ，χ）とし、重み係数η_ｎ，ｄの事前確率分布をｐ（η）とすることにより、回帰ベクトルｗ及び重み係数ηを周辺化し、数式４により、ラベルｙ_ｎ'の確率分布ｐ（ｙ_ｎ'｜Ｘ_ｎ'，Ｙ，χ，β）を算出してもよい。また、予測部１９０は、ノイズパラメータβの事後確率分布をｐ（β｜Ｙ，χ）とし、回帰ベクトルｗ、重み係数η、及びノイズパラメータβの１つ、２つ、又は全て（例えば、重み係数ηとノイズパラメータβ）を周辺化してもよい。

また、予測部１９０は、重み係数η_ｎ'，ｄを予測せずにラベルｙ_ｎ'のみを予測することで、簡易的な予測をしてもよい。例えば、予測部１９０は、各サブセット毎の予測値（ｗＸ_ｎ'，ｄ）のｎ＝１からｎ＝Ｎにおける平均値及び／又は中央値等を予測値とし、ラベルｙ_ｎ'を予測してよい。

次にＳ２５０において、予測部１９０は、予測結果を出力する。例えば、予測部１９０は、予測により得られたラベルｙ_ｎを情報処理装置１０の表示画面に表示し、及び／又は、情報処理装置１０の内部／外部の記憶装置に格納してよい。

また、予測部１９０は、予測対象データが得られる度に予測対象データ、及び、予測対象データから予測したラベルｙ_ｎ'を学習処理部１７０に供給してもよい。学習処理部１７０は、予測部が予測対象データ及び予測対象データに対応して予測したラベルを追加の学習データとし、追加の学習データに基づいて更に予測モデルを学習してよい。これにより、情報処理装置１０は、予測対象データを用いて、予測結果が更に正確になるように予測モデルを更新することができる。

このように情報処理装置１０は、学習処理部１７０が学習した重み係数η_ｎ，ｄ及び回帰ベクトルｗを用いて、予測対象データＸ_ｎ'から対応するラベルｙ_ｎ'を予測する。これにより、情報処理装置１０は、サブセットごとのラベルへの影響を考慮して回帰された回帰ベクトルｗを用いて、より正確にラベルｙ_ｎ'を予測することができる。

図６は、本実施形態の情報処理装置１０による予測精度を示す。図６には、ドライブレコーダ等から得られた異なる４個のデータセット１〜４に対して、従来の疎な線形回帰法によりラベル（ＭＣＩ）を予測した場合のＡＵＣ（ＡｒｅａＵｎｄｅｒＣｕｒｖｅ）と、本実施形態の情報処理装置１０でフルベイズなモデリングで、ＡＲＤ事前分布及び変分ベイズ実装により予測モデルを構築した場合のＡＵＣとを交差検定で評価した結果が示される。ＡＵＣは、ＭＣＩが５以上か５未満を正確に予測できた割合を示す。

データセットに含まれる説明変数として、加速度センサから得られる７変数×１秒毎のデータ及びドライブレコーダ（カメラ）から得られる９０変数×０．１秒毎のデータを用い、ラベルとして１００ｍ単位に記録される５００個のＭＣＩ値を用いた。データセット１〜２に対応するＭＣＩとデータセット３〜４では、対応するＭＣＩの算出に異なる算出式を用いた。また、データセット１及び３には、ヒューリスティクスを用いた前処理をし、データセット２及び４には前処理をしていない。

図示するように、データセット１〜４のいずれにおいても、本実施形態の方法によると、従来の線形回帰と比較して数％程度高いＡＵＣが得られる。従って、本実施形態の情報処理装置１０は従来の方法と比較して高い精度でラベルを予測できることが示される。

上記本実施形態では、情報処理装置１０は、学習データ及び予測対象データから１種類の特徴ベクトルｘ_ｎ，ｄを生成し、学習データ及び予測対象データに対して１種類の重み係数η_ｎ，ｄを用いた。これに代えた変形例として、情報処理装置１０は、複数種類の特徴ベクトルｘ^１ _ｎ，ｄ及びｘ^２ _ｎ，ｄ…、及び、対応する複数種類の重み係数η^１ _ｎ，ｄ、η^２ _ｎ，ｄ…を用いてもよい。例えば、情報処理装置１０は、ドライブレコーダの動画の特徴をベクトル化した特徴ベクトルｘ^１ _ｎ，ｄを生成し、加速度センサの測定値の特徴をベクトル化した特徴ベクトルｘ^２ _ｎ，ｄを生成し、それぞれの特徴ベクトルごとに重み係数η^１ _ｎ，ｄ、η^２ _ｎ，ｄを学習してよい。

これにより、情報処理装置１０は、データセットに含まれる説明変数のグループごとに異なる重みづけをして、ラベルを学習することができる。例えば、情報処理装置１０は、データセットのある部分ではドライブレコーダの動画がラベルに対して大きく影響するが、別の部分では加速度の値がラベルに大きく影響するような場合に、より正確に学習データに対するラベルを学習することができる。

図７は、情報処理装置１０として機能するコンピュータ１９００のハードウェア構成の一例を示す。本実施形態に係るコンピュータ１９００は、ホスト・コントローラ２０８２により相互に接続されるＣＰＵ２０００、ＲＡＭ２０２０、グラフィック・コントローラ２０７５、及び表示装置２０８０を有するＣＰＵ周辺部と、入出力コントローラ２０８４によりホスト・コントローラ２０８２に接続される通信インターフェイス２０３０、ハードディスクドライブ２０４０、及びＣＤ−ＲＯＭドライブ２０６０を有する入出力部と、入出力コントローラ２０８４に接続されるＲＯＭ２０１０、フレキシブルディスク・ドライブ２０５０、及び入出力チップ２０７０を有するレガシー入出力部を備える。

ホスト・コントローラ２０８２は、ＲＡＭ２０２０と、高い転送レートでＲＡＭ２０２０をアクセスするＣＰＵ２０００及びグラフィック・コントローラ２０７５とを接続する。ＣＰＵ２０００は、ＲＯＭ２０１０及びＲＡＭ２０２０に格納されたプログラムに基づいて動作し、各部の制御を行う。グラフィック・コントローラ２０７５は、ＣＰＵ２０００等がＲＡＭ２０２０内に設けたフレーム・バッファ上に生成する画像データを取得し、表示装置２０８０上に表示させる。これに代えて、グラフィック・コントローラ２０７５は、ＣＰＵ２０００等が生成する画像データを格納するフレーム・バッファを、内部に含んでもよい。

入出力コントローラ２０８４は、ホスト・コントローラ２０８２と、比較的高速な入出力装置である通信インターフェイス２０３０、ハードディスクドライブ２０４０、ＣＤ−ＲＯＭドライブ２０６０を接続する。通信インターフェイス２０３０は、有線又は無線によりネットワークを介して他の装置と通信する。また、通信インターフェイスは、通信を行うハードウェアとして機能する。ハードディスクドライブ２０４０は、コンピュータ１９００内のＣＰＵ２０００が使用するプログラム及びデータを格納する。ＣＤ−ＲＯＭドライブ２０６０は、ＣＤ−ＲＯＭ２０９５からプログラム又はデータを読み取り、ＲＡＭ２０２０を介してハードディスクドライブ２０４０に提供する。

また、入出力コントローラ２０８４には、ＲＯＭ２０１０と、フレキシブルディスク・ドライブ２０５０、及び入出力チップ２０７０の比較的低速な入出力装置とが接続される。ＲＯＭ２０１０は、コンピュータ１９００が起動時に実行するブート・プログラム、及び／又は、コンピュータ１９００のハードウェアに依存するプログラム等を格納する。フレキシブルディスク・ドライブ２０５０は、フレキシブルディスク２０９０からプログラム又はデータを読み取り、ＲＡＭ２０２０を介してハードディスクドライブ２０４０に提供する。入出力チップ２０７０は、フレキシブルディスク・ドライブ２０５０を入出力コントローラ２０８４へと接続するとともに、例えばパラレル・ポート、シリアル・ポート、キーボード・ポート、マウス・ポート等を介して各種の入出力装置を入出力コントローラ２０８４へと接続する。

ＲＡＭ２０２０を介してハードディスクドライブ２０４０に提供されるプログラムは、フレキシブルディスク２０９０、ＣＤ−ＲＯＭ２０９５、又はＩＣカード等の記録媒体に格納されて利用者によって提供される。プログラムは、記録媒体から読み出され、ＲＡＭ２０２０を介してコンピュータ１９００内のハードディスクドライブ２０４０にインストールされ、ＣＰＵ２０００において実行される。

コンピュータ１９００にインストールされ、コンピュータ１９００を情報処理装置１０として機能させるプログラムは、取得モジュール、抽出モジュール、ベクトル生成モジュール、学習処理モジュール、及び、予測モジュールを備える。これらのプログラム又はモジュールは、ＣＰＵ２０００等に働きかけて、コンピュータ１９００を、特徴量取得部１１０、抽出部１３０、ベクトル生成部１５０、学習処理部１７０、及び、予測部１９０としてそれぞれ機能させてよい。

これらのプログラムに記述された情報処理は、コンピュータ１９００に読込まれることにより、ソフトウェアと上述した各種のハードウェア資源とが協働した具体的手段である特徴量取得部１１０、抽出部１３０、ベクトル生成部１５０、学習処理部１７０、及び、予測部１９０として機能する。そして、これらの具体的手段によって、本実施形態におけるコンピュータ１９００の使用目的に応じた情報の演算又は加工を実現することにより、使用目的に応じた特有の情報処理装置１０が構築される。

一例として、コンピュータ１９００と外部の装置等との間で通信を行う場合には、ＣＰＵ２０００は、ＲＡＭ２０２０上にロードされた通信プログラムを実行し、通信プログラムに記述された処理内容に基づいて、通信インターフェイス２０３０に対して通信処理を指示する。通信インターフェイス２０３０は、ＣＰＵ２０００の制御を受けて、ＲＡＭ２０２０、ハードディスクドライブ２０４０、フレキシブルディスク２０９０、又はＣＤ−ＲＯＭ２０９５等の記憶装置上に設けた送信バッファ領域等に記憶された送信データを読み出してネットワークへと送信し、もしくは、ネットワークから受信した受信データを記憶装置上に設けた受信バッファ領域等へと書き込む。このように、通信インターフェイス２０３０は、ＤＭＡ（ダイレクト・メモリ・アクセス）方式により記憶装置との間で送受信データを転送してもよく、これに代えて、ＣＰＵ２０００が転送元の記憶装置又は通信インターフェイス２０３０からデータを読み出し、転送先の通信インターフェイス２０３０又は記憶装置へとデータを書き込むことにより送受信データを転送してもよい。

また、ＣＰＵ２０００は、ハードディスクドライブ２０４０、ＣＤ−ＲＯＭドライブ２０６０（ＣＤ−ＲＯＭ２０９５）、フレキシブルディスク・ドライブ２０５０（フレキシブルディスク２０９０）等の外部記憶装置に格納されたファイルまたはデータベース等の中から、全部または必要な部分をＤＭＡ転送等によりＲＡＭ２０２０へと読み込ませ、ＲＡＭ２０２０上のデータに対して各種の処理を行う。そして、ＣＰＵ２０００は、処理を終えたデータを、ＤＭＡ転送等により外部記憶装置へと書き戻す。このような処理において、ＲＡＭ２０２０は、外部記憶装置の内容を一時的に保持するものとみなせるから、本実施形態においてはＲＡＭ２０２０及び外部記憶装置等をメモリ、記憶部、または記憶装置等と総称する。

例えば、情報処理装置１０の記憶部は、特徴量取得部１１０、抽出部１３０、ベクトル生成部１５０、学習処理部１７０、及び、予測部１９０から受け取った／へ提供するデータを適宜記憶してよい。例えば、記憶部は、取得部１１０から入力されたデータを受け取って記憶してよい。また、記憶部は、学習処理部１７０が学習した結果等を記憶してよい。

なお、本実施形態の説明において、一の構成要素（例えば、取得部１１０）から別の構成要素（例えば、抽出部１２０）に情報（例えば、複数のデータセット）を供給したと記載するときは、一の構成要素から別の構成要素に直接情報を受け渡すことだけでなく、記憶部への情報の格納及び情報の読み出しを介して情報を渡すことをも含んでよい。

本実施形態における各種のプログラム、データ、テーブル、データベース等の各種の情報は、このような記憶装置上に格納されて、情報処理の対象となる。なお、ＣＰＵ２０００は、ＲＡＭ２０２０の一部をキャッシュメモリに保持し、キャッシュメモリ上で読み書きを行うこともできる。このような形態においても、キャッシュメモリはＲＡＭ２０２０の機能の一部を担うから、本実施形態においては、区別して示す場合を除き、キャッシュメモリもＲＡＭ２０２０、メモリ、及び／又は記憶装置に含まれるものとする。

また、ＣＰＵ２０００は、ＲＡＭ２０２０から読み出したデータに対して、プログラムの命令列により指定された、本実施形態中に記載した各種の演算、情報の加工、条件判断、情報の検索・置換等を含む各種の処理を行い、ＲＡＭ２０２０へと書き戻す。例えば、ＣＰＵ２０００は、条件判断を行う場合においては、本実施形態において示した各種の変数が、他の変数または定数と比較して、大きい、小さい、以上、以下、等しい等の条件を満たすか否かを判断し、条件が成立した場合（又は不成立であった場合）に、異なる命令列へと分岐し、またはサブルーチンを呼び出す。

また、ＣＰＵ２０００は、記憶装置内のファイルまたはデータベース等に格納された情報を検索することができる。例えば、第１属性の属性値に対し第２属性の属性値がそれぞれ対応付けられた複数のエントリが記憶装置に格納されている場合において、ＣＰＵ２０００は、記憶装置に格納されている複数のエントリの中から第１属性の属性値が指定された条件と一致するエントリを検索し、そのエントリに格納されている第２属性の属性値を読み出すことにより、所定の条件を満たす第１属性に対応付けられた第２属性の属性値を得ることができる。

以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。

特許請求の範囲、明細書、および図面中において示した装置、システム、プログラム、および方法における動作、手順、ステップ、および段階等の各処理の実行順序は、特段「より前に」、「先立って」等と明示しておらず、また、前の処理の出力を後の処理で用いるのでない限り、任意の順序で実現しうることに留意すべきである。特許請求の範囲、明細書、および図面中の動作フローに関して、便宜上「まず、」、「次に、」等を用いて説明したとしても、この順で実施することが必須であることを意味するものではない。

１０情報処理装置、２０データベース、１１０取得部、１３０抽出部、１５０ベクトル生成部、１７０学習処理部、１９０予測部、１９００コンピュータ、２０００ＣＰＵ、２０１０ＲＯＭ、２０２０ＲＡＭ、２０３０通信インターフェイス、２０４０ハードディスクドライブ、２０５０フレキシブルディスク・ドライブ、２０６０ＣＤ−ＲＯＭドライブ、２０７０入出力チップ、２０７５グラフィック・コントローラ、２０８０表示装置、２０８２ホスト・コントローラ、２０８４入出力コントローラ、２０９０フレキシブルディスク、２０９５ＣＤ−ＲＯＭ

Claims

複数の学習対象のデータセットとそれぞれの前記学習対象のデータセットに割り付けられた学習用のラベルとを有する学習データを用いて、予測対象のデータセットに割り付けるべきラベルを予測する予測モデルを学習する情報処理装置であって、
前記学習データにおける前記複数の学習対象のデータセットのそれぞれから複数のサブセットを抽出する抽出部と、
前記複数の学習対象のデータセットのそれぞれにおいて、前記複数のサブセットのそれぞれを重みづけてラベルの予測結果に反映する前記予測モデルを学習する学習処理部と、
を備える情報処理装置。
前記学習処理部は、前記サブセットごとに異なる重み係数を割り当てることにより、前記サブセットごとに重みづけて前記ラベルの予測結果に反映させる予測モデルを学習する、
請求項１に記載の情報処理装置。
前記サブセットのそれぞれについて、複数の特徴量を含む特徴ベクトルを生成する特徴ベクトル生成部を更に備え、
前記学習処理部は、前記特徴ベクトルの前記複数の特徴量のそれぞれに対応する複数の回帰係数を含む回帰ベクトルと、前記サブセットごとの前記重み係数とを用いる予測モデルを学習する、
請求項２に記載の情報処理装置。
前記学習処理部は、前記回帰ベクトル及び前記重み係数の事前分布と前記学習データとを用いてベイズ推定を実行し、前記回帰ベクトル及び前記重み係数の事後確率分布を学習結果として出力する、
請求項３に記載の情報処理装置。
前記学習処理部は、前記特徴ベクトル及び前記回帰ベクトルに基づいて前記サブセットごとに予測されるラベルと、前記学習データの対応する前記学習対象のデータセットに割り付けられた学習用のラベルとの誤差を示す項に、前記重み係数を乗じる予測モデルを用いる、
請求項４に記載の情報処理装置。
前記学習処理部は、出力された前記回帰ベクトル及び前記重み係数の事後確率分布を事前分布として用いて、追加で入力された学習データに対する前記回帰ベクトル及び前記重み係数の事後確率分布を出力する、
請求項４又は５に記載の情報処理装置。
前記複数の学習対象のデータセットのそれぞれは、経時的に観測される時系列データセットであり、前記抽出部は、前記複数のサブセットとして時系列上で連続する複数のデータ列を抽出する、
請求項１から６のいずれか１項に記載の情報処理装置。
前記抽出部は、複数の区間における複数の説明変数の値の組を含む前記データ列を抽出する、
請求項７に記載の情報処理装置。
前記抽出部は、時系列上で互いに一部が重複する前記複数のデータ列を抽出する、
請求項７又は８に記載の情報処理装置。
複数の前記予測対象のデータセットを有する予測対象データを取得する取得部と、
前記予測モデルに基づき、前記予測対象のデータセットに対応するラベルを予測する予測部とを更に備える、
請求項１から９のいずれか１項に記載の情報処理装置。
前記学習処理部は、前記予測部が前記予測対象データが得られる度前記予測対象データに基づいて更に予測モデルを学習する、
請求項１０に記載の情報処理装置。
コンピュータを、請求項１から１１のいずれか１項に記載の情報処理装置として機能させるプログラム。
コンピュータにより実行される、複数の学習対象のデータセットとそれぞれの前記学習対象のデータセットに割り付けられた学習用のラベルとを有する学習データを用いて、予測対象のデータセットに割り付けるべきラベルを予測する予測モデルを学習する情報処理方法であって、
前記学習データにおける前記複数の学習対象のデータセットのそれぞれから複数のサブセットを抽出する抽出段階と、
前記複数の学習対象のデータセットのそれぞれにおいて、前記複数のサブセットのそれぞれを重みづけてラベルの予測に反映する前記予測モデルを学習する学習処理段階と、
を備える情報処理方法。