JP6850723B2

JP6850723B2 - 顔表情識別システム、顔表情識別方法及び顔表情識別プログラム

Info

Publication number: JP6850723B2
Application number: JP2017527431A
Authority: JP
Inventors: 麻樹杉本; 克俊正井; 正泰尾形; 鈴木　克洋; 克洋鈴木; 中村　文彦; 中村　　文彦; 稲見　昌彦; 昌彦稲見; 裕太杉浦
Original assignee: Keio University
Current assignee: Keio University
Priority date: 2015-07-03
Filing date: 2016-07-01
Publication date: 2021-03-31
Anticipated expiration: 2036-07-01
Also published as: JPWO2017006872A1; WO2017006872A1

Description

本発明は、人物の顔表情を識別する顔表情識別システム、顔表情識別方法及び顔表情識別プログラムに関する。

他人やコンピュータとのより豊かなコミュニケーションの実現等のため、人物の顔表情を自動的に識別する技術が重要となってきている。従来の顔表情識別システムとしては、カメラを用いて人物を撮像し、撮像画像に含まれる特徴量に基づいて顔表情を識別する手法が知られている（特許文献１参照）。

特開２０１０−４１５０３号公報

しかしながら、特許文献１に記載のカメラを用いたシステムは高価であり、計算量も膨大となる。更に、カメラで人物の顔を撮像可能な位置・方向は制限されるため、顔表情を継続的（日常的）に識別することは困難である。

上記問題点を鑑み、本発明は、安価且つ簡易な構成で、人物の顔表情を継続的（日常的）に識別可能な顔表情識別システム、顔表情識別方法及び顔表情識別プログラムを提供することを目的とする。

本発明の第１の態様は、（ａ）人物の頭部に装着可能な装着装置と、（ｂ）装着装置の人物の顔面に対向する複数箇所にそれぞれ配置され、装着装置を装着したときの顔面と装着装置間の距離を複数箇所でそれぞれ検出する、複数の検出装置と、（ｃ）複数の検出装置による過去の検出結果のデータと顔表情との対応関係を機械学習して得られた学習データを記憶する記憶装置と、（ｄ）学習データを記憶装置から読み出し、複数の検出装置による検出結果を入力データとして人物の顔表情を識別する顔表情識別部とを備える顔表情識別システムであることを要旨とする。

本発明の第２の態様は、（ａ）装着装置の複数箇所にそれぞれ配置された複数の検出装置が、装着装置を人物の頭部に装着したときの人物の顔面と装着装置間の距離を複数箇所で検出するステップと、（ｂ）記憶装置に記憶された、複数の検出装置による過去の検出結果のデータと顔表情との対応関係を機械学習して得られた学習データを記憶装置から読み出し、顔表情識別部が複数の検出装置による検出結果のデータを入力データとして人物の顔表情を識別するステップとを含む顔表情識別方法であることを要旨とする。

本発明の第３の態様は、（ａ）装着装置の複数箇所にそれぞれ配置された複数の検出装置に、装着装置を人物の頭部に装着したときの人物の顔面と装着装置間の距離を複数箇所で検出させる手順と、（ｂ）記憶装置に記憶された、複数の検出装置による過去の検出結果のデータと顔表情との対応関係を機械学習して得られた学習データを記憶装置から読み出させ、複数の検出装置による検出結果のデータを入力データとして人物の顔表情を顔表情識別部に識別させる手順とを含む一連の処理をコンピュータに実行させる顔表情識別プログラムであることを要旨とする。

本発明によれば、安価且つ簡易な構成で、人物の顔表情を継続的（日常的）に識別可能な顔表情識別システム、顔表情識別方法及び顔表情識別プログラムを提供することができる。

本発明の第１の実施形態に係る顔表情識別システムの一例を示すブロック図である。本発明の第１の実施形態に係る装着装置の一例を示す概略図である。図３（ａ）は、本発明の第１の実施形態に係る装着装置を頭部に装着した人物が無表情の様子を示す概略図であり、図３（ｂ）は、本発明の第１の実施形態に係る装着装置を頭部に装着した人物が笑っている様子を示す概略図である。本発明の第１の実施形態に係る顔表情識別システムが識別する顔表情の種類を示す概略図である。本発明の第１の実施形態に係る検出装置による過去の検出結果と顔表情との対応関係を表すグラフである。本発明の第１の実施形態に係る顔表情識別システムにより作成された顔表情マップの一例を示す概略図である。本発明の第１の実施形態に係る顔表情識別方法の一例を説明するためのフローチャートである。本発明の第１の実施形態に係る推薦情報表示方法の一例を説明するためのフローチャートである。本発明の第２の実施形態に係る顔表情識別システムの一例を示すブロック図である。本発明の第２の実施形態に係る顔表情識別システムにより算出された顔表情分布の一例を示す概略図である。本発明の第２の実施形態に係る顔表情識別方法の一例を説明するためのフローチャートである。本発明の第２の実施形態に係る顔表情分布表示方法の一例を説明するためのフローチャートである。本発明のその他の実施形態に係る装着装置の一例を示す概略図である。本発明のその他の実施形態に係る装着装置の表示部に表示された映像の一例を示す概略図である。本発明の第３の実施形態に係る顔表情識別システムの一例を示すブロック図である。本発明の第３の実施形態に係る装着装置の一例を示す概略図である。本発明の第３の実施形態に係る装着装置をユーザが装着した様子を示す概略図である。図１８（ａ）及び図１８（ｂ）は、本発明の第３の実施形態に係る装着装置の表示部の表示画像の一例をそれぞれ示す概略図である。本発明の第３の実施形態に係る前処理前後の距離とセンサ値の関係を示すグラフである。本発明の第３の実施形態に係る学習フェーズのニューラルネットワークの一例を示す概略図である。本発明の第３の実施形態に係る学習フェーズの回帰ニューラルネットワークの一例を示す概略図である。本発明の第３の実施形態に係る識別フェーズのニューラルネットワークの一例を示す概略図である。本発明の第３の実施形態に係る機械学習データ生成方法を含む機械学習方法の一例を説明するためのフローチャートである。本発明の第３の実施形態に係る顔表情識別方法の一例を説明するためのフローチャートである。本発明の第３の実施形態に係るセンサ値の主成分分析結果の一例を示すグラフである。図２６（ａ）〜図２６（ｃ）は、本発明の第３の実施形態に係る眉を動かした場合のセンサ値をそれぞれ示すグラフである。図２７（ａ）〜図２７（ｃ）は、本発明の第３の実施形態に係る目を開閉した場合のセンサ値をそれぞれ示すグラフである。図２８（ａ）及び図２８（ｂ）は、本発明の第３の実施形態に係る目を開閉した場合のクラスタ分類結果及び真値をそれぞれ示すグラフである。図２９（ａ）〜図２９（ｃ）は、本発明の第３の実施形態に係る口を動かした場合のセンサ値をそれぞれ示すグラフである。図３０（ａ）及び図３０（ｂ）は、本発明の第３の実施形態に係る口を動かした場合のセンサ値をそれぞれ示すグラフである。図３１（ａ）及び図３１（ｂ）は、本発明の第３の実施形態に係る口を動かした場合のクラスタ分類結果と真値をそれぞれ示すグラフである。図３２（ａ）〜図３２（ｃ）は、本発明の第３の実施形態に係る分類ネットワークのための訓練データセットを示すグラフである。図３３（ａ）及び図３３（ｂ）は、本発明の第３の実施形態に係る回帰ネットワークのための訓練データセットを示すグラフである。図３４（ａ）は、本発明の第３の実施形態に係るターゲットとする顔表情を示すグラフであり、図３４（ｂ）は、マルチクラス分類の結果を示すグラフである。図３５（ａ）〜図３５（ｄ）は、本発明の第３の実施形態に係るマルチクラス分類器をマージした回帰の結果をそれぞれ示すグラフである。本発明の第４の実施形態に係る顔表情識別システムの一例を示すブロック図である。本発明の第４の実施形態に係る装着装置を前後方向にずらしたときの種々の顔表情に対するセンサ値の変化を示すグラフである。図３７のセンサ値の一部から回帰により求めたずれ量を示すグラフである。図３９（ａ）は、本発明の第４の実施形態に係る装着装置を前後方向にずらしたときの顔表情が「無表情」に対するセンサ値の変化を示すグラフであり、図３９（ｂ）は、本発明の第４の実施形態に係る装着装置を前後方向にずらしたときの顔表情が「喜び」に対するセンサ値の変化を示すグラフである。図４０（ａ）は、本発明の第４の実施形態に係る装着装置を前後方向にずらしたときの顔表情が「嫌悪」に対するセンサ値の変化を示すグラフであり、図４０（ｂ）は、本発明の第４の実施形態に係る装着装置を前後方向にずらしたときの顔表情が「怒り」に対するセンサ値の変化を示すグラフである。図４１（ａ）は、本発明の第４の実施形態に係る装着装置を前後方向にずらしたときの顔表情が「驚き」に対するセンサ値の変化を示すグラフであり、図４１（ｂ）は、本発明の第４の実施形態に係る装着装置を前後方向にずらしたときの顔表情が「恐怖」に対するセンサ値の変化を示すグラフである。図４２（ａ）は、本発明の第４の実施形態に係る装着装置を前後方向にずらしたときの顔表情が「悲しみ」に対するセンサ値の変化を示すグラフであり、図４２（ｂ）は、本発明の第４の実施形態に係る装着装置を前後方向にずらしたときの顔表情が「軽蔑」に対するセンサ値の変化を示すグラフである。本発明の第４の実施形態に係る顔表情識別方法の一例を説明するためのフローチャートである。本発明の第５の実施形態に係る顔表情識別システムの一例を示すブロック図である。本発明の第６の実施形態に係る顔表情識別システムの一例を示すブロック図である。本発明の第６の実施形態に係る光センサの発光強度の調整方法の一例を説明するためのフローチャートである。

次に、図面を参照して、本発明の第１〜第６の実施形態を説明する。以下の図面の記載において、同一又は類似の部分には同一又は類似の符号を貼付している。但し、図面は模式的なものであり、厚みと平面寸法との関係、厚みの比率等は現実のものとは異なることに留意すべきである。また、図面相互間においても互いの寸法の関係や比率が異なる部分が含まれていることは勿論である。また、以下に示す実施形態は、本発明の技術的思想を具体化するための装置や方法を例示するものであって、本発明の技術的思想は、構成部品の材質、形状、構造、配置等を下記のものに特定するものではない。本発明の技術的思想は、特許請求の範囲に記載された請求項が規定する技術的範囲内において、種々の変更を加えることができる。

（第１の実施形態）
＜顔表情識別システム＞
本発明の第１の実施形態に係る顔表情識別システムは、図１に示すように、中央演算処理装置（ＣＰＵ）１、記憶装置２、装着装置（ウェアラブルデバイス）３、複数の検出装置（光センサ）４ａ，４ｂ，４ｃ，４ｄ，４ｅ，４ｆ，４ｇ，４ｈ，４ｉ，４ｊ，４ｋ，４ｌ，４ｍ，４ｎ，４ｏ，４ｐ，４ｑ、入力装置５及び出力装置６を備える。ＣＰＵ１と、記憶装置２、検出装置４ａ〜４ｑ、入力装置５及び出力装置６とは有線又は無線で信号を送受信可能である。

装着装置３としては、人物の頭部に装着可能な眼鏡型のデバイスやヘッドマウントディスプレイ（ＨＭＤ）が使用可能であり、市販の眼鏡であってもよい。複数の検出装置４ａ〜４ｑは、装着装置３に設けられ、装着装置３を頭部に装着したときの人物の顔面と装着装置３間の距離を複数箇所で検出する。複数の検出装置４ａ〜４ｑとしては、反射型光センサ（フォトリフレクタ）や、焦電センサ、近接センサ、距離センサ等が使用可能である。例えば、フォトリフレクタは、装着装置３を装着した人物の顔面に赤外光を照射する発光ダイオード（ＬＥＤ）からなる発光部と、人物の顔面からの反射光を検出するフォトトランジスタからなる受光部とを有する。

装着装置３は、例えば図２に示すような眼鏡型のデバイスである。検出装置４ａ〜４ｑは、装着装置３のレンズ部分の周囲であって、装着装置３を装着した時に人物の顔面と対向する位置に設けられている。検出装置４ａ〜４ｑは、例えば、人物の顔表情が変化した際に変動し易い部位である瞼や頬、眉間、目尻等と対向する位置に配置されることが好ましい。なお、検出装置４ａ〜４ｑの配置位置は特に限定されず、識別したい顔表情の種類等に応じて適宜設定可能である。

また、図２では１７個の検出装置４ａ〜４ｑを示すが、検出装置４ａ〜４ｑの個数は特に限定されず、少なくとも２個以上あればよく、顔表情の分類の種類や数、要求される識別精度等に応じて適宜選択可能である。例えば、図２に示した１６個の検出装置４ａ〜４ｑのうち、８個の検出装置４ｂ，４ｈ，４ｊ，４ｋ，４ｌ，４ｏ，４ｐ，４ｑのみを用いて後述する７つの顔表情を識別可能である。

本発明の第１の実施形態に係る顔表情識別システムは、図３に示すように、「無表情」、「微笑み」、「笑い」、「嫌悪」、「怒り」、「驚き」、「悲しみ」の７つの顔表情を識別する。なお、顔表情の分類の種類及び個数は特に限定されず、表情による差異が検出装置４ａ〜４ｑで検出できるもので学習データ記憶部２０に学習データが格納できるものであればよい。例えば顔表情としては他にも「喜び」や「恐怖」等が挙げられる。

本発明の第１の実施形態に係る顔表情識別システムは、人物の顔表情が変化する際の顔面筋の変動に起因する３次元的な皮膚変形を利用して顔表情を識別する。人物の顔表情が変化すると、人物の顔面の瞼や頬、眉間、目尻等の部位が変動し、個人差はあるが、人物の顔表情毎に各部位の変動量には共通した傾向が見られる。

例えば図３（ａ）及び図３（ｂ）に、装着装置３を頭部に装着した人物が無表情の様子及び笑っている様子をそれぞれ示す。なお、図３（ａ）及び図３（ｂ）では、眼鏡型である装着装置３のテンプル部分は便宜的に省略し、検出装置４ａ，４ｊを模式的に示す。図３（ａ）に示すように、人物が無表情の場合に人物の瞼や頬があまり膨らまず、瞼や頬と検出装置４ａ，４ｊとの距離Ｄ１，Ｄ２が相対的に遠くなり、検出装置４ａ，４ｊにより検出される反射光の照度が低下する。一方、図３（ｂ）に示すように、人物が笑っている場合に瞼及び頬が膨らみ、瞼や頬と検出装置４ａ，４ｊとの距離Ｄ１，Ｄ２が相対的に近くなり、検出装置４ａ，４ｊにより検出される反射光の照度が増大する。このように、検出装置４ａ〜４ｑは、人物の顔面と検出装置４ａ〜４ｑとの距離に応じた検出結果（例えば電流値）をＣＰＵ１に出力する。なお、検出装置４ａ〜４ｑの対向する顔面の部位によって反射の度合いが異なるため、検出装置４ａ〜４ｑの配置位置に応じて検出装置４ａ〜４ｑによる検出結果を適宜補正してもよい。また、識別したい顔表情の種類等に応じて検出装置４ａ〜４ｑによる検出結果を適宜重み付けしてもよい。

図１に示したＣＰＵ１は、機械学習部１０、顔表情識別部１１、地理情報取得部１２、顔表情マップ作成部１３及び推薦情報抽出部１４を備え、更に、顔表情識別システム全体を制御する制御回路、演算回路、データを一時記憶するレジスタ等を有する。なお、ＣＰＵ１の機能の一部又は全部が、装着装置３等に内蔵されていてもよい。

機械学習部１０は、検出装置４ａ〜４ｑによる過去の検出結果と顔表情との対応関係を教師データとして用いて機械学習を行うことにより学習データを生成する。機械学習部１０による機械学習の手法としては、公知のサポートベクターマシン（ＳＶＭ）やニューラルネットワーク等が使用可能である。

図４は、機械学習部１０の機械学習に用いる検出装置４ａ〜４ｑによる過去の検出結果と顔表情との対応関係の一例を示す。各プロットは、多数の人物が装着装置３を装着し、検出装置４ａ〜４ｑによる検出結果を多数サンプリングして、各検出結果を顔表情毎に分類することで得られる。なお、ここでは多数の人物のサンプリング結果を示すが、顔表情の識別対象となるユーザ本人のサンプリング結果が含まれていてもよく、他者のみのサンプリング結果であってもよい。また、顔表情の識別対象となるユーザ本人或いは他者の単体のみのサンプリング結果を機械学習に用いてもよい。図４の縦軸は、各プロットにおいて検出装置４ａ〜４ｑの出力値の多数のサンプリングの値の範囲が０から１となるように正規化した平均正規化値を示し、横軸のセンサ番号の１番〜１６番は図２に示した検出装置４ａ〜４ｑの順番に一致する。

顔表情識別部１１は、例えば図４に示した検出装置４ａ〜４ｑによる過去の検出結果と顔表情との対応関係を教師データとして用いて、ＳＶＭにより、検出装置４ａ〜４ｑによる新たな検出結果を７つの顔表情に対応する領域（クラスタ）に分類するための超平面（境界面）を含む情報を学習データとして生成する。機械学習部１０により生成された学習データは、記憶装置２の学習データ記憶部２０に格納される。

図１に示した顔表情識別部１１は、記憶装置２の学習データ記憶部２０に予め記憶された学習データを用いて、測定対象の人物に対する検出装置４ａ〜４ｑによる検出結果に基づいて、測定対象の人物の顔表情を「無表情」、「微笑み」、「笑い」、「嫌悪」、「怒り」、「驚き」、「悲しみ」の７つの顔表情のいずれかに識別（分類）する。顔表情識別部１１は、例えば、検出装置４ａ〜４ｑによる検出結果のパターンが、学習データ記憶部２０に記憶された学習データの７つのクラスタのうちどのクラスタに最も近いかを判定し、最も近いクラスタに対応する顔表情に分類する。顔表情識別部１１による顔表情の識別結果は、記憶装置２の顔表情記憶部２１に格納される。

なお、顔表情識別部１１による識別結果を良好なものとするためには、顔表情の識別対象となる個人毎に学習データを記録し機械学習を行なうことが望ましいが、簡易的に他者で記録した学習データを別のユーザの顔表情の識別に用いることも可能である。また、他者で記録した学習データと比較して、計測結果が類似していた場合には、他者で記録した学習データを利用することで、個人毎のデータを学習する過程を簡便化することもできる。

地理情報取得部１２は、全地球測位システム（ＧＰＳ）等から、顔表情識別部１１により顔表情を識別した時点における現在位置等の地理情報及び年月日等の時刻情報を取得し、記憶装置２の地理情報記憶部２２に格納する。

顔表情マップ作成部１３は、顔表情識別部１１により識別された顔表情と、地理情報取得部１２により取得された地理情報及び時刻情報とを関連付けた顔表情マップを作成する。顔表情マップは、例えば図６に示すように、時刻情報及び地理情報毎に、７つの顔表情の割合（頻度）を示す。なお、顔表情マップは図６に示した態様に特に限定されず、例えば表形式の代わりに、地理情報に対応する地図上の位置に時刻情報や顔表情情報を配置する形式でもよい。また、顔表情マップは、複数の人物についての時刻情報、地理情報及び顔表情の識別結果を一括して纏めてもよく、顔表情情報も多数の人物の累積値であってもよい。顔表情マップ作成部１３により作成された顔表情マップは、顔表情マップ記憶部２３に格納される。

推薦情報抽出部１４は、入力装置５を介して入力された顔表情、時刻情報、地理情報等の検索キーに基づいて、顔表情マップ作成部１３により作成された顔表情マップを検索し、検索キーに適合する顔表情、時刻情報、地理情報等を推薦情報として抽出する。例えば、検索キーとして入力された顔表情が「笑い」や「微笑み」であった場合、図６に示した顔表情マップから、「笑い」や「微笑み」の割合が相対的に高い「場所Ｂ」を推薦情報として抽出する。

記憶装置２としては、例えば半導体メモリや磁気ディスク、光ディスク等が使用可能である。記憶装置２は、機械学習部１０により生成された学習データを記憶する学習データ記憶部２０、顔表情識別部１１による顔表情の識別結果を記憶する顔表情記憶部２１、地理情報取得部１２により取得された地理情報を記憶する地理情報記憶部２２、顔表情マップ作成部１３により作成された顔表情マップを記憶する顔表情マップ記憶部２３を有する。記憶装置２は更に、ＣＰＵ１が実行する顔表情識別プログラムやプログラムの実行に必要な各種データを記憶する。

入力装置５としては、キーボードやマウス、タッチパネル、音声認識装置等が使用可能である。入力装置５は、ユーザからの顔表情、時刻情報、地理情報等の検索キーを受け付ける。出力装置６としては、液晶ディスプレイ（ＬＣＤ）等の表示装置やタブレット端末等が使用可能である。出力装置６は、顔表情識別部１１による顔表情の識別結果や、顔表情マップ作成部１３により作成された顔表情マップ、推薦情報抽出部１４により抽出された推薦情報を適宜出力（表示）する。

＜顔表情識別方法＞
次に、図７のフローチャートを参照しながら、本発明の第１の実施形態に係る顔表情マップ作成方法を含む顔表情識別方法の一例を説明する。なお、以下に示す顔表情識別方法はあくまでも一例であり、この手順に限定されるものではない。

ステップＳ１０において、機械学習部１０が、図４に示したような検出装置４ａ〜４ｑによる過去の検出結果と顔表情との対応関係を用いて機械学習を行うことにより学習データを生成し、学習データ記憶部２０に格納しておく。

ステップＳ１１において、複数の検出装置４ａ〜４ｑが、装着装置３を頭部に装着した測定対象となる人物の顔面と装着装置３間の距離を複数箇所で検出する。ステップＳ１２において、顔表情識別部１１が、学習データ記憶部２０に予め記憶された学習データを用いて、複数の検出装置４ａ〜４ｑにより検出された現在の検出結果のパターン識別を行い、測定対象の人物の顔表情を、図４に示した７つの顔表情のいずれか（例えば「微笑み」）に識別する。

ステップＳ１２において、地理情報取得部１２が、顔表情識別部１１による識別結果が得られた時点における現在位置等の地理情報をＧＰＳ等から取得する。地理情報取得部１２は更に、顔表情識別部１１による識別結果が得られた時点の時刻情報を取得する。ステップＳ１３において、顔表情マップ作成部１３が、顔表情識別部１１による識別結果と、地理情報取得部１２により取得された地理情報及び時刻情報とを対応付けて顔表情マップを作成する。顔表情マップ作成部１３により作成された顔表情マップは顔表情マップ記憶部２３に格納される。

次に、図７のステップＳ１３において顔表情マップ作成部１３により作成された顔表情マップを用いた推薦情報表示方法の一例を、図８のフローチャートを参照しながら説明する。なお、図７及び図８に示した一連の処理は連続して行ってもよく、互いに並列で行ってもよい。

ステップＳ２１において、推薦情報抽出部１４が、出力装置６に検索メニューを表示させる。そして、検索メニューからユーザにより選択された顔表情、地理情報及び時刻情報等の検索キーを入力装置５が受け付ける。ステップＳ２２において、推薦情報抽出部１４が、入力装置５が受け付けた検索キーに基づいて、顔表情マップ記憶部２３に記憶された顔表情マップを検索し、検索キーに適合する顔表情、地理情報及び時刻情報等を推薦情報として抽出する。ステップＳ２３において、出力装置６が、推薦情報抽出部１４により抽出された推薦情報を画面に表示する。

＜顔表情識別プログラム＞
本発明の第１の実施形態に係る顔表情識別プログラムは、図７及び図８に示した顔表情識別の手順をＣＰＵ１に実行させる。即ち、本発明の第１の実施形態に係る顔表情識別プログラムは、（ａ）複数の検出装置４ａ〜４ｑが、装着装置３を頭部に装着した人物の顔面と、装着装置３との距離を検出する手順、（ｂ）記憶装置２に予め記憶された、複数の検出装置４ａ〜４ｑによる過去の検出結果と顔表情との対応関係を機械学習して得られた学習データを用いて、複数の検出装置４ａ〜４ｑによる検出結果に基づいて人物の顔表情を識別する手順、（ｃ）複数の検出装置４ａ〜４ｑによる検出結果が得られた時点での地理情報を取得する手順、（ｄ）顔表情の識別結果と地理情報とを対応付けた顔表情マップを作成する手順等をＣＰＵ１等のコンピュータに実行させる。本発明の第１の実施形態に係る顔表情識別プログラムは、図１に示した記憶装置２等の記憶手段に記憶される。

以上説明したように、本発明の第１の実施形態によれば、装着型の複数の検出装置４ａ〜４ｑを用いて人物の顔表情を識別することにより、安価且つ簡潔な構成で、継続的（日常的）に低消費電力で顔表情を識別することが実現可能となる。更に、検出装置４ａ〜４ｑは眼鏡用のフレームやＨＭＤの内部に取り付けることができるので、日常的な環境下や、ＨＭＤ装着時のように人物の顔が遮蔽される場合等のカメラでの撮像が難しい条件下においても、継続的且つ容易に顔表情を識別できる。したがって、ユーザに過大な負担をかけずに継続的にユーザの顔表情を識別して、顔表情マップを作成することができる。更に、作成した顔表情マップを用いて、ユーザの検索キーに応じた推薦情報を抽出・表示することにより、顔表情に関連した推薦情報をユーザに提示できる。

（第２の実施形態）
本発明の第２の実施形態に係る顔表情識別システムは、図９に示すように、ＣＰＵ１が機械学習部１０、顔表情識別部１１に加え、時刻情報取得部１５及び顔表情分布算出部１６を備え、図１に示した地理情報取得部１２、顔表情マップ作成部１３及び推薦情報抽出部１４を備えない点が、図１に示したＣＰＵ１の構成と異なる。また、記憶装置２が、学習データ記憶部２０、顔表情記憶部２１に加え、時刻情報記憶部２４及び顔表情分布記憶部２５を備え、図１に示した地理情報記憶部２２及び顔表情マップ記憶部２３を備えない点が、図１に示した記憶装置２の構成と異なる。

ＣＰＵ１の時刻情報取得部１５は、顔表情識別部１１により顔表情を識別した時点での時刻情報を顔表情と対応付けて取得する。時刻情報取得部１５により取得された時刻情報は時刻情報記憶部２４に格納される。

顔表情分布算出部１６は、例えば図１０に示すように、顔表情識別部１１による識別結果と、時刻情報取得部１５により取得された時刻情報とを関連付けた顔表情分布を算出する。図１０では、一日単位で７つの顔表情の割合（頻度）が示されている。なお、顔表情分布は図１０に示す態様に限定されず、例えば過去数日間の顔表情の割合を算出して配列してもよく、週単位又は月単位で顔表情の割合を算出してもよい。顔表情分布算出部１６により算出された顔表情分布は顔表情分布記憶部２５に格納される。

本発明の第２の実施形態に係る顔表情識別システムの他の構成は、本発明の第１の実施形態に係る顔表情識別システムの構成と同様であるので、重複した説明を省略する。

本発明の第２の実施形態に係る顔表情識別方法の一例を図１１のフローチャートに示す。ステップＳ３０〜ステップＳ３２の手順は、図７のステップＳ１０〜ステップＳ１２の手順と同様であるので重複した説明を省略する。ステップＳ３３において、時刻情報取得部１５が、顔表情識別部１１により顔表情を識別した時点の時刻情報を取得し、時刻情報記憶部２４に格納する。

次に、本発明の第２の実施形態に係る顔表情分布表示方法の一例を図１２のフローチャートに示す。ステップＳ４１において、顔表情分布算出部１６が、出力装置６に入力画面を表示させる。ユーザから入力装置５を介して確認したいユーザ情報が入力される。ステップＳ４２において、顔表情分布算出部１６が、顔表情識別部１１にユーザ情報に適合した人物の一日当たりの顔表情分布を算出する。ステップＳ４３において、出力装置６が、顔表情分布算出部１６により算出された顔表情分布を出力する。なお、図１１及び図１２に示した一連の処理は連続して又は互いに並列で行ってもよい。

本発明の第２の実施形態によれば、本発明の第１の実施形態と同様に、装着型の検出装置４ａ〜４ｑを用いて人物の顔表情を識別することにより、安価且つ簡潔な構成で、継続的（日常的）に低消費電力で顔表情を識別することが実現可能となる。更に、検出装置４ａ〜４ｑは眼鏡用のフレームやＨＭＤの内部に取り付けることができるので、日常的な環境下や、ＨＭＤ装着時のように人物の顔が遮蔽される場合等のカメラでの撮像が難しい条件下においても、継続的且つ容易に顔表情を識別できる。したがって、ユーザに過大な負担をかけずに継続的にユーザの顔表情を識別して、顔表情分布を作成することができる。

更に、顔表情分布算出部１６が、顔表情識別部１１による識別結果と時刻情報取得部１５により取得された時刻情報とを関連付けた顔表情分布を算出して出力装置６に表示させることにより、ユーザは顔表情分布から遠隔地に居住又は滞在する家族等の人物の様子を推測することができ、遠隔地に居住又は滞在する家族等の人物をネットワーク経由で見守ることができる。

なお、本発明の第１及び第２の実施形態において、装着装置３が眼鏡型のデバイスである場合を主に例示したが、例えば、図１３に示すように、装着装置３がバーチャルリアリティ環境において視覚情報を提示可能なＨＭＤであってもよい。図示を省略するが、装着装置３の内側には、例えば図２に示した検出装置４ａ〜４ｑと同様の１７個の検出装置と表示部とが設けられている。

図１４に示すように、装着装置３の内側の表示部４０には、装着装置３を装着したユーザのバーチャルアバター４１と、装着装置３と同様の装着装置を装着した他者のバーチャルアバター４２とがオンラインサービス上で表示されている。顔表情識別部１１は、第１及び第２の実施形態と同様にユーザ及び他者の顔表情をそれぞれ識別する。顔表情識別部１１は更に、顔表情の識別結果をネットワーク上へ伝送し、伝送された顔表情の識別結果に応じて、バーチャルアバター４１，４２の顔表情をそれぞれ変化させることにより、ユーザ及び他者の顔表情とバーチャルアバター４１，４２の顔表情とをそれぞれ同期させることができる。これにより、没入型オンラインゲーム等においての表情コミュニケーションが実現可能となる。

なお、装着装置３が眼鏡型のデバイス等である場合にも、顔表情識別部１１が顔表情の識別結果をネットワーク上へ伝送し、伝送された識別結果に応じて出力装置６の画面に表示されたオンラインサービス上のアバターの顔表情を変化させてもよい。

（第３の実施形態）
本発明の第３の実施形態に係る顔表情識別システムは、図１５に示すように、ＣＰＵ１、記憶装置２、装着装置３、入力装置５及び出力装置６を備える。ＣＰＵ１と、記憶装置２、装着装置３、入力装置５及び出力装置６とは、有線又は無線で信号やデータを互いに送受信可能である。

本発明の第３の実施形態では、装着装置３がＨＭＤである場合を例示する。ＨＭＤを用いたバーチャルリアリティ（ＶＲ）は、没入型ゲームや、遠隔地とのコミュニケーション等の幅広い用途での利用が期待されている。ＨＭＤを用いたＶＲでは、バーチャル環境にユーザが実際に存在するかのような没入感をユーザに与えることができる。更には、ユーザの分身としてのバーチャルアバター（以下、単に「アバター」と称する）を介してコミュニケーションを図ることにより、ＨＭＤでユーザの顔の上部が覆われている場合でも円滑なコミュニケーションを実現でき、プライバシーの観点からバーチャル環境に実際の顔が露出することを好まない人間にとっても好適である。

ここで、アバターを用いた顔表情コミュニケーションを実現するために、ＨＭＤを装着しているユーザの顔表情を適切に識別し、ユーザの顔表情をアバターの顔画像に適切に反映させることが重要となる。なお、アバターとは、バーチャル環境においてユーザの分身となる２次元又は３次元のキャラクタを意味する。アバターは、人間の姿を模擬していてもよく、動物やロボットの姿を模擬していてもよいが、本明細書中ではユーザの複数種の顔表情に対応する複数種の顔表情を表現可能なキャラクタが採用可能である。

装着装置３は、複数（１６個）の検出装置（光センサ）６１ａ，６１ｂ，６１ｃ，６１ｄ，６１ｅ，６１ｆ，６１ｇ，６１ｈ，６１ｉ，６１ｊ，６１ｋ，６１ｌ，６１ｍ，６１ｎ，６１ｏ，６１ｐ及び表示部６２を備える。光センサ６１ａ〜６１ｐは、図１に示した検出装置４ａ〜４ｑと同様の装置が使用可能であり、例えば反射型光センサ（フォトリフレクタ）等が使用可能である。光センサ６１ａ〜６１ｐは、装着装置３を装着したときにユーザの顔面と対向する複数箇所にそれぞれ配置されている。光センサ６１ａ〜６１ｐは、装着装置３を装着したユーザの顔面と装着装置３の間の距離を複数箇所で検出する。

図１６は、頭部に装着する側から見た装着装置３の一例を示す。装着装置３の本体部７１にはフレキシブル回路基板７２が固定されている。フレキシブル回路基板７２のユーザの両目と対向する位置には２つの開口部が設けられ、２つの開口部の位置には一対のレンズ７３ａ，７３ｂが配置されている。フレキシブル回路基板７２には、１６個の光センサ６１ａ〜６１ｐが配置されている。このうち、１４個の光センサ６１ａ〜６１ｆ，６１ｈ〜６１ｎ，６１ｐは、一対のレンズ７３ａ，７３ｂの周囲に配置されている。

具体的には、光センサ６１ａは、装着装置３を装着したユーザの眉間近傍と対向する。光センサ６１ｂ〜６１ｄは、ユーザの左眉近傍と対向する。光センサ６１ｅは、ユーザの左目尻近傍と対向する。光センサ６１ｆ，６１ｈは、ユーザの左目の下近傍と対向する。光センサ６１ｉは、ユーザの眉間近傍と対向する。光センサ６１ｊ〜６１ｌは、ユーザの右眉近傍と対向する。光センサ６１ｍは、ユーザの右目尻近傍と対向する。光センサ６１ｎ，６１ｐは、ユーザの右目の下近傍と対向する。

フレキシブル回路基板７２は、本体部７１の下部に突出した２つの部分を有し、突出した２つの部分に２個の光センサ６１ｇ，６１ｏがそれぞれ配置されている。２個の光センサ６１ｇ，６１ｏは、装着装置３を装着したユーザの頬近傍と対向する。頬の筋肉は口の筋肉と連結されているので、頬の動きを測定することで口周辺の状態を推定することができる。

図１７は、ユーザが装着装置３を装着した様子を示す。図１７では模式的に、装着装置３の本体部７１を透過して光センサ６１ａ〜６１ｐが見えるように示している。光センサ６１ａ〜６１ｐは、ユーザの目や頬等の顔面と、装着装置３との間の距離Ｄ（矢印で図示）を複数箇所で検出する。なお、光センサ６１ａ〜６１ｐの配置位置や数は特に限定されず、識別したい顔表情の種類等に応じて適宜設定可能である。

図１５に示した表示部６２は、図１６に示した本体部７１のレンズ７３ａ，７３ｂの奥側に配置されている。本発明の第３の実施形態では、表示部６２として没入型（非透過型）の構造を例示するが、ハーフミラー等を用いて現実環境とアバターが重畳して視認可能な透過型の構造であってもよく、単眼のみに画像を投影する構造であってもよい。

図１５に示したＣＰＵ１は、アバター表示制御部３１、学習データ生成部３２及び顔表情識別部３３を備え、更に、顔表情識別システム全体を制御する制御回路、演算回路、データを一時記憶するレジスタ等を有する。なお、ＣＰＵ１の機能の一部が他の装置により実現されてもよく、ＣＰＵ１の機能の一部又は全部が、装着装置３に内蔵されたマイクロプロセッサ等で実現されてもよい。

記憶装置２は、アバターデータ記憶部５０、学習データ記憶部５１、光センサデータ記憶部５２及び識別結果記憶部５３を備える。アバターデータ記憶部５０は、アバターの顔画像を含むアバターに関する情報を記憶する。学習データ記憶部５１は、学習データ生成部３２により生成される機械学習用のデータセットや、顔表情識別部３３が機械学習して得られる学習データ（識別関数等）を記憶する。光センサデータ記憶部５２は、光センサ６１ａ〜６１ｐにより検出された検出結果のデータ（センサ値）を記憶する。識別結果記憶部５３は、顔表情識別部３３による顔表情の識別結果を記憶する。記憶装置２は更に、ＣＰＵ１が実行する顔表情識別プログラムやプログラムの実行に必要な各種データを記憶する。記憶装置２が記憶する全部又は一部の情報が、装着装置３に内蔵されたメモリに記憶されていてもよい。

本発明の第３の実施形態においては、機械学習用のデータセットの生成方法を含む機械学習方法（学習フェーズ）と、機械学習により得られた学習データを用いた顔表情識方法（識別フェーズ）について説明するが、学習フェーズ及び識別フェーズで同一のアバターを使用してもよく、異なるアバターを使用してもよい。アバターデータ記憶部５０は、学習フェーズ及び識別フェーズで使用する単数又は複数のアバターに関する情報を格納する。

アバターデータ記憶部５０は、アバターの複数種の顔表情（顔画像）のデータを記憶している。アバターの顔画像は、例えば図４に模式的に示したように、「無表情」、「微笑み」、「笑い」、「嫌悪」、「怒り」、「驚き」、「悲しみ」等の人間の顔表情を模擬している。アバターの種類にもよるが、例えば、「無表情」は口を横に結ぶことで、「微笑み」は口角を持ち上げることで、「笑い」は目を細めて口を開くことでそれぞれ表現し得る。「嫌悪」は眉間に皺を寄せて目尻を上げることで、「怒り」は「嫌悪」よりも更に眉間に皺を寄せ、眉尻を上げることでそれぞれ表現し得る。「驚き」は目を見開いて口を開くことで、「悲しみ」は眉尻を下げることでそれぞれ表現し得る。アバターデータ記憶部５は更に、眉の上下、両目又は固めの開閉、口の開閉等の部分的に変化させた顔画像のデータを記憶していてもよい。アバターデータ記憶部５０に記憶されるアバターの顔画像の数及び種類は特に限定されない。

アバター表示制御部３１は、学習フェーズにおいて、入力装置５を介して入力された指示情報等に基づいて、アバターデータ記憶部５０に格納されたアバターの複数の顔画像のデータから、機械学習によって識別したい顔表情に対応するアバターの顔画像のデータを抽出する。アバター表示制御部３１は、図１８（ａ）に示すように、抽出した顔表情のアバター１００の画像を表示するように装着装置３の表示部６２を制御する。図１８（ａ）ではアバター１００の顔画像が「笑い」である場合を例示する。

アバター表示制御部３１は、アバターデータ記憶部５０に格納されたアバターの複数の顔画像のデータから、機械学習によって識別したい顔表情に対応するアバターの顔画像のデータを順次抽出し、図１８（ｂ）に示すように、表示部６２に表示されるアバター１００の顔画像を、抽出した顔画像に順次更新していく。図１８（ｂ）ではアバター１００の顔画像が「微笑み」である場合を例示する。アバター１００の顔画像を更新するタイミングは適宜設定可能である。例えば、所定の時間が経過後のタイミングや、光センサ６１ａ〜６１ｐにより所定のフレーム数を検出後のタイミング、ユーザから入力装置５を介して入力された指示情報に応じたタイミング等であってもよい。

アバター表示制御部３１は、アバター１００の顔画像の表示前、表示後、又は表示と同時に、図１８（ａ）及び図１８（ｂ）に示すように、「アバターの顔画像を真似て下さい」等の文字情報を表示部６２に表示させ、ユーザにアバター１００の表情を真似るように促す。表示部６２に文字情報を表示する代わりに、装着装置３に取り付けられている図示を省略したヘッドフォンやスピーカ等による音声情報を使用してもよい。なお、アバター表示制御部３１は、ユーザにアバター１００の表情を真似るように継続的又は断続的に促してもよいが、アバター１００の顔画像を最初に表示する際に、ユーザにアバター１００の表情を真似るように促した後は、文字情報や音声情報の提示を停止してもよい。また、アバターの顔画像に対応する文字情報や音声情報を補助的に提示してもよい。例えば、アバターの顔画像が「笑い」の場合には、「笑って下さい」等の文字情報や音声情報を補助的に提示してもよい。

光センサ６１ａ〜６１ｐは、装着装置３を装着したユーザがアバターの顔画像を真似したときの顔面と装着装置３の間の距離を所定のフレーム数検出する。アバター表示制御部３１がユーザにアバターの顔画像を真似るように促してから、或いは表示部６２にアバターを表示してから、ユーザがアバターの顔画像の種類を認識し、ユーザの顔表情がアバターの顔画像に対応する顔表情に変化するまでにはタイムラグが発生する。このため、光センサ６１ａ〜６１ｐは、ユーザにアバターの顔画像を真似るように促してから、或いは表示部６２にアバターを表示してから所定時間経過後に検出のタイミングや、入力装置５を介して入力された指示情報に応じたタイミングで検出を開始してもよい。

光センサ６１ａ〜６１ｐにより検出される検出結果のデータ（センサ値）は、同一の顔表情をした場合でも個人差があるため、個人間で平衡をとるように前処理（キャリブレーション）が行われる。例えば、顔表情が「無表情」のときに検出されたセンサ値の平均値を０．５、複数種の顔表情のときに検出されたセンサ値のうちのそれぞれにおいて最大値を１、最小値を０として正規化を行う。センサ値は、例えば図１９に示すように、距離とセンサ値が線形的関係を実現するように線形補完される。

学習データ生成部３２は、学習フェーズにおいて、光センサ６１ａ〜６１ｐからのセンサ値を入力データとして、機械学習用のデータセットを生成する。例えば、学習データ生成部３２は、光センサ６１ａ〜６１ｐからのセンサ値を顔表情毎の部分集合（クラスタ）に分類するクラスタリング処理を行う。

学習データ生成部３２は更に、分類されたクラスタに、アバター表示制御部３１により抽出され、センサ値を検出するときに表示部６２に表示していたアバターの顔画像の種類（例えば「微笑み」、「悲しみ」等）に対応するラベルを付与するラベリング処理を行い、ラベルを付与されたクラスタを機械学習用のデータセット（サンプリング結果）として学習データ記憶部５１に格納する。このように、機械学習用のデータセットが生成され、これを個人毎に学習データ記憶部５１に格納していくことで、顔表情認識のための学習データベースを構築することができる。

顔表情識別部３３は、学習フェーズにおいて、学習データ記憶部５１に格納された機械学習用のデータセットを入力データとして、ニューラルネットワークやサポートベクタマシン等により、装着装置３を装着したユーザの顔表情を識別するための機械学習を行う。顔表情識別部３３は、例えば図２０に模式的に示すように、入力層Ｌ１１、隠れ層Ｌ１２及び出力層Ｌ１３を含む多層パーセプトロンで構成されたニューラルネットワークを用いて、誤差伝播法（ＢＰ）により機械学習を行う。

図２０に示したニューラルネットワークにおいて、マルチクラス分類問題であるため、例えば活性化関数には正規化線形関数を採用し、誤差関数には交差エントロピー法を採用し、出力層Ｌ３の活性化関数にはソフトマックス（softmax）関数を採用する。この場合、ニューラルネットワークは、入力層Ｌ１１に入力された顔表情と、この顔表情に対応する教師信号が付与された複数の訓練した表情のそれぞれとの類似度を出力層Ｌ１３から出力し、類似度が最も高い顔表情を識別結果とする。誤差逆伝播法（ＢＰ）では、出力層Ｌ１３から出力される各テンプレート表情に対する類似度のうち、正解の表情に対する類似度が高くなるように（換言すれば、正解の表情に対する類似度の最大値との誤差が小さくなるように）、出力層Ｌ１３から入力層Ｌ１１にかけて、誤差の勾配を逆伝播させることで重みを修正する。

また、人間の顔表情は、例えば「無表情」から「笑い」に瞬間的に変化するのではなく、「無表情」から「笑い」に遷移する途中に中間表情が存在し、徐々に連続的に（滑らかに）変化するものである。この顔表情の連続的な変化の識別と、識別結果に応じたアバターの顔表情の連続的な変化を実現するため、顔表情識別部３３は、図２１に示すように、入力層Ｌ２１、隠れ層Ｌ２２、出力層Ｌ２３で構成された回帰ニューラルネットワークを実装してもよい。

図２１に示した回帰ニューラルネットワークにおいて、例えば活性化関数には正規化線形関数を採用し、誤差関数には平均二乗関数を採用し、出力層Ｌ２３の活性化関数には双曲線タンジェント（hyperbolic tangent）関数を採用する。図２１に示すように、例えば顔表情が「笑い」の回帰ニューラルネットワークの場合には、「無表情」に対する類似度を最小値の０、「笑い」に対する類似度を最大値の１と設定する。図２１に示した回帰ニューラルネットワークと同様の回帰ニューラルネットワークが、識別したい顔表情数だけ実装され、図２０に示したニューラルネットワークのマルチクラス分類の結果に依存するように使用される。

アバターデータ記憶部５０は、「無表情」や「笑い」等の代表的な顔表情間の中間表情を記憶していてもよい。中間表情は、例えばアバターのテクスチャ・ジオメトリのモーフィングにより生成可能である。アバター表示制御部３１は、学習フェーズにおいて、アバター１００の顔画像のデータから、「無表情」や「笑い」等の代表的な顔表情と、その顔表情間の中間表情を抽出する。そして、アバター表示制御部３１は、抽出した代表的な顔表情及びその中間表情を連続的に装着装置３の表示部６２に表示する。これにより、中間表情も識別するための機械学習用のデータセットを生成可能となる。

顔表情識別部３３は、識別フェーズにおいて、図２２に示すように、学習データであるマルチクラス分類器８０を用いて、光センサ６１ａ〜６１ｐからのセンサ値を入力データとして、装着装置３を装着したユーザの顔表情を識別する。顔表情識別部３３は、例えば、訓練した複数種のテンプレート表情に対する類似度を算出し、類似度が最も高い表情を顔表情として識別する。例えば、図２２に示すように、訓練した表情として「微笑み」、「怒り」、「驚き」、「悲しみ」の４種類があり、「微笑み」に対する類似度が０．８、「怒り」に対する類似度が０．２、「驚き」に対する類似度が０．１、「悲しみ」に対する類似度が０．１といった類似度として識別する。

顔表情識別部３３は更に、図２２に示すように、学習データである「微笑み」、「怒り」、「驚き」、「悲しみ」の回帰ネットワーク８１〜８４を用いて、光センサ６１ａ〜６１ｐからのセンサ値を入力データとして、装着装置３を装着したユーザの中間表情を識別してもよい。

アバター表示制御部３１は、識別フェーズにおいて、顔表情識別部３３による識別結果に基づいて、アバターデータ記憶部５０から、ユーザの顔表情に対応するアバターの顔画像のデータを抽出する。アバター表示制御部３１は更に、抽出したアバターの顔画像のデータを伝送し、装着装置３の表示部６２、ディスプレイ等の出力装置６、或いは通信ネットワークを介した通信相手が装着している装着装置の表示部等に表示させる。例えば、装着装置３の表示部６２に、図１４に示した表示画像と同様に、ユーザ本人のアバターの顔画像と通信相手のアバターの顔画像が表示される。

アバター表示制御部３１は、コミュニケーション相手がコンピュータである場合には、ユーザの顔表情に対応したアバターの顔画像を表示する代わりに、ユーザの顔表情の識別結果に応じた他の表示をしてもよい。例えば、ユーザの顔表情が「怒り」と識別された場合に、「驚き」や「不安」を模擬した顔画像のキャラクタを装着装置３の表示部６２に表示したり、「どうしましたか？」、「大丈夫ですか？」等の文字情報や音声情報を提示したりしてもよい。

本発明の第３の実施形態に係る顔表情識別システムの他の構成は、図１に示した第１の実施形態に係る顔表情識別システムと同様であるので、重複した説明を省略する。

＜機械学習方法＞
次に、図２３のフローチャートを参照しながら、本発明の第３の実施形態に係る顔表情識別システムを用いた機械学習方法（学習フェーズ）の一例を説明する。

ステップＳ５１において、アバター表示制御部３１は、入力装置５を介して入力された指示情報等に基づいて、アバターデータ記憶部５０から、機械学習によって識別したい顔表情に対応するアバターの顔画像のデータを抽出する。そして、アバター表示制御部３１は、抽出した顔表情のアバターを装着装置の表示部６２に表示させるとともに、装着装置３を装着したユーザにアバターの顔画像を真似るように促す。ステップＳ５２において、光センサ６１ａ〜６１ｐが、装着装置３を装着したユーザがアバターの顔画像を真似したときのセンサ値を取得する。

ステップＳ５３において、アバター表示制御部３１は、機械学習によって識別したい所定の顔表情数についてのセンサ値を取得したか否かを判定する。所定の顔表情数のセンサ値を取得していないと判定された場合、ステップＳ５０に戻り、残りの顔表情について同様の処理を繰り返す。例えば、５種類の顔表情について、１００フレームずつ、１０セットで合計５０００セットのデータセットを取得する。ステップＳ５３において所定の顔表情数のセンサ値を取得したと判定された場合、ステップＳ５４に移行する。

ステップＳ５４において、学習データ生成部３２が、光センサ６１ａ〜６１ｐのセンサ値を顔表情毎のクラスタに分類する。ステップＳ５５において、学習データ生成部３２が、分類されたクラスタに、アバター表示制御部３１により生成されたアバターの顔画像に対応するラベルを付与することにより、機械学習用のデータセットを生成する。学習データ生成部３２が、生成した機械学習用のデータセットを学習データ記憶部５１に格納する。ステップＳ５５において、顔表情識別部３３は、学習データ記憶部５１に格納された機械学習用のデータセットを用いて、顔表情を識別するための機械学習を行う。

＜顔表情識別方法＞
次に、図２４のフローチャートを参照しながら、本発明の第３の実施形態に係る顔表情識別方法（識別フェーズ）の一例を説明する。

ステップＳ６１において、装着装置３がユーザの頭部に装着されている状態で、光センサ６１ａ〜６１ｐがセンサ値を取得する。ステップＳ６２において、顔表情識別部３３は、光センサ６１ａ〜６１ｐからのセンサ値を入力データとして、学習データ記憶部５１に格納された学習データを読み込んで、装着装置３を装着したユーザの顔表情を識別する。

ステップＳ６３において、アバター表示制御部３１は、顔表情識別部３３による識別結果に基づいて、装着装置３を装着したユーザの顔表情に対応するアバターの顔画像のデータをアバターデータ記憶部５０から抽出する。アバター表示制御部３１は、抽出したアバターの顔画像を、装着装置３の表示部６２や、通信相手の装着装置の表示部等に表示させる。

＜実験例＞
学習フェーズにおいて、装着装置３の表示部６２に４種類のアバターの顔画像を周期的に表示し、装着装置３を装着したユーザがアバターの顔画像を真似たときに光センサ６１ａ〜６１ｐがセンサ情報を１００フレームずつ取得した。図２５は、得られた光センサ６１ａ〜６１ｐのセンサ値に対して主成分分析による第１主成分の算出結果を示す。

図２６（ａ）〜図２６（ｃ）は、眉を動かした場合のセンサ値の変化を示す。図２６（ａ）〜図２６（ｃ）の左側は、眉を上げた状態、眉が通常の状態、眉を下げた状態をそれぞれ模式的に示し、図２６（ａ）〜図２６（ｃ）の右側には、各状態のときのセンサ値を示す。図２６（ａ）〜図２６（ｃ）の右側のグラフの縦軸はセンサ値の平均正規化値を示し、横軸のセンサ番号は、図１５〜図１７に示した光センサ６１ａ〜６１ｐに順次対応する（例えば、センサ番号の１番が光センサ６１ａに対応する。以降の図２７（ａ）〜図２７（ｃ）、図２９（ａ）〜図２９（ｃ）、図３０（ａ）及び図３０（ｂ）も同様である。）。但し、２番のセンサ値はデータが欠落している。図２６（ａ）〜図２６（ｃ）に示すように、３番や１２番等の眉の位置に近いセンサ値は各状態で大きく変動しており、眉の動きが反映されていることが分かる。一方、６番や１４番等の眉の位置と離れたセンサ値は変動が少ないことが分かる。

図２７（ａ）〜図２７（ｃ）は、目を開閉した場合のセンサ値の変化を示す。図２７（ａ）〜図２７（ｃ）の左側は、右目だけ閉じた状態、左目だけ閉じた状態、両目を閉じた（強くつぶった）状態をそれぞれ模式的に示し、図２７（ａ）〜図２７（ｃ）の右側には、各状態のときのセンサ値を示す。図２７（ａ）に示すように、右目だけ閉じた状態では右目部分にある１２番のセンサ値が他に比べて変動していることが分かる。また、図２７（ｂ）に示すように、左目だけ閉じた状態では３，４，５番のセンサ値が他に比べて変動していることが分かる。また、図２７（ｃ）に示すように、両目を閉じた状態では、１番や９番のセンサ値が変動していることが分かる。

図２８（ａ）には、図２７（ａ）〜図２７（ｃ）の各状態に通常状態（両目を開けた状態）を加えたクラスタの分類結果を示し、図２８（ｂ）には、図２８（ａ）に対応する真値を示す。図２８（ａ）及び図２８（ｂ）に示すように、目の開閉については、通常状態、右目だけ閉じた状態、左目だけ閉じた状態、両目を閉じた状態でそれぞれ、大部分のデータを正しいクラスに分類できていることが分かる。

図２９（ａ）〜図２９（ｃ）、図３０（ａ）及び図３０（ｂ）は、口の動きを変化させた場合のセンサ値を示す。図２９（ａ）〜図２９（ｃ）、図３０（ａ）及び図３０（ｂ）の左側は、ユーザの口を「ア」「イ」「ウ」「エ」「オ」を発声するときの形に変化させた状態をそれぞれ模式的に示し、図２９（ａ）〜図２９（ｃ）、図３０（ａ）及び図３０（ｂ）の右側には、各状態のときのセンサ値を示す。図２９（ａ）〜図２９（ｃ）、図３０（ａ）及び図３０（ｂ）に示すように、７番目及び１５番目の頬の位置に近いセンサ値が変動していることが分かる。

図３１（ａ）には、図２９（ａ）〜図２９（ｃ）、図３０（ａ）及び図３０（ｂ）の各状態のクラスタの分類結果を示し、図３１（ｂ）には、図３１（ａ）に対応する真値を示す。図３１（ａ）及び図３１（ｂ）に示すように、「エ」、「オ」等を中心に混ざってしまったが、「ウ」の口の動きだけが他の動きに比べてクラス間距離が離れており、良好に分類できていることが分かる。また、「ア」及び「イ」の状態、「エ」の状態、「ウ」及び「オ」の状態の３つのクラスタに分類可能であることが分かる。

図３２（ａ）は、「無表情」、「微笑み」、「怒り」、「驚き」、「悲しみ」の５種類の顔表情の分類ネットワークの訓練データを示し、図３２（ｂ）は、主成分分析による第１主成分を示し、図３２（ｃ）は、主成分分析による第２主成分を示す。図３２（ａ）〜図３２（ｃ）から、ユーザがアバターの顔画像を真似したときに、センサ値が変化していることが分かる。

図３３（ａ）は、「微笑み」、「怒り」、「驚き」、「悲しみ」の４種類の顔表情を徐々に変化させたときの回帰ネットワークの訓練データを示し、図３３（ｂ）は、主成分分析による第１主成分を示す。図３４（ａ）は、ターゲットとする顔表情を示し、図３４（ｂ）は、マルチクラス分類の結果を示す。図３５（ａ）〜図３５（ｄ）は、図３４（ｂ）に示したマルチクラス分類をマージした、「微笑み」、「怒り」、「驚き」、「悲しみ」の回帰結果をそれぞれ示す。図３５（ａ）〜図３５（ｄ）から、各回帰の出力が線形に変化していることが分かる。

以上説明したように、本発明の第３の実施形態によれば、学習フェーズにおいて、装着装置３の表示部６２にアバターを表示し、表示したアバターの表情をユーザが真似したときの光センサ６１ａ〜６１ｐからのセンサ値から機械学習用のデータセットを生成することにより、機械学習用のデータセットを短時間で効率的に収集することができる。この際、ユーザはアバターの顔画像を真似すればよいので、アバターの表情を直感的に把握して真似ることができ、音声情報で顔表情を指示する場合よりもユーザの負担を低減することができる。更に、表示したアバターの顔画像の時系列を考慮して記録したデータに対して、ラベリングを行ない機械学習のための訓練データとするが、提示しているアバターとユーザの顔表情の間に時間的なずれが発生することがある。これに対して、クラスタリングよる分類又は推定モデルを参照することで時間的なずれを補正してラベリングを行うことができる。

更に、識別フェーズにおいて、ユーザの顔表情の識別結果に基づいてアバターの顔画像を変化させる際に、学習フェーズでユーザが真似したアバターと同一又は類似のアバターを使用すれば、例えば口の開閉の程度や、眉の上下の程度等の部位の細かい動きについてもユーザが想定するようにアバターの顔画像を適切に変化させることができ、ユーザの感情をより鮮明に表現することができる。

（第４の実施形態）
本発明の第４の実施形態に係る顔表情識別システムは、図３６に示すように、装着装置３がずれセンサ６３を更に備える点と、ＣＰＵ１がずれ量算出部３４及び修正提示部３５を更に備える点と、記憶装置２がずれデータ記憶部５５を更に備える点が、図１５に示した第３の実施形態に係る顔表情識別システムと異なる。他の構成は図１５に示した第３の実施形態に係る顔表情識別システムと同様であるので、重複した説明を省略する。

ずれセンサ６３としては、変位センサや測長センサが使用可能である。ずれセンサ６３は、装着装置３の光センサ６１ａ〜６１ｐとは異なる位置に配置されている。ずれセンサ６３は１つのみ配置されていてもよく、複数個配置されていてもよい。ずれセンサ６３は、装着位置３を装着したユーザの目等のランドマークに基づいて、装着位置３を正常に装着したときの位置を基準位置として、基準位置に対する前後方向、上下方向、左右方向の少なくとも１方向のずれを検出する。ずれセンサ６３による検出結果はずれデータ記憶部５５に格納される。なお、ずれセンサ６３を個別に備えていなくても、顔表情検出のための距離検出に使用している光センサ６１ａ〜６１ｐのセンサ値をずれの検出に用いることもできる。

ずれ量算出部３４は、ずれセンサ６３による検出結果又は光センサ６１ａ〜６１ｐのセンサ値の分布から、基準位置に対するずれ量及びずれ方向を検出する。例えば、図３７は、装着装置３を前後方向のずらしたときの種々の顔表情に対する光センサ６１ａ〜６１ｐのセンサ値の変化を示すグラフである。レベル１〜４でずれ量を変化させており、レベルの数値が高いほど装着装置３と人物の顔面との距離が遠くにずれている。ずれ量算出部３４は、図３７に示した光センサ６１ａ〜６１ｐのセンサ値の一部を用いて、回帰により、図３８に示すように装着装置３の前後方向のずれ量を算出する。

図３９（ａ）〜図４２（ｂ）は、図３７に示した種々の顔表情に対するセンサ値の変化を、顔表情毎に分けたグラフである。図３９（ａ）は「無表情」、図３９（ｂ）は「喜び」、図４０（ａ）は「嫌悪」、図４０（ｂ）は「怒り」、図４１（ａ）は「驚き」、図４１（ｂ）は「恐怖」、図４２（ａ）は「悲しみ」、図４２（ｂ）は「軽蔑」に対するセンサ値の変化をそれぞれ示す。図３９（ａ）〜図４２（ｂ）に示すように、レベルの数値が高く装着装置３と人物の顔面との距離が遠いほど、センサ値は全体的に低下する傾向がある。

修正提示部３５は、ずれ量算出部３４により算出されたずれ量が所定の閾値以上の場合に、装着装置３を装着したユーザにずれの修正内容を提示し、ずれを修正するようにユーザに促す。所定の閾値は適宜設定可能であり、ずれデータ記憶部５５に予め格納されていてもよい。修正提示部３５は、ユーザにずれの修正内容を提示する際には、例えば「装着装置が右上方向にずれています」、「装着装置を左下方向に修正して下さい」等の修正方向を示す文字情報や、矢印等の修正方向を示す画像を表示部６２に表示してもよい。また、文字情報や画像の代わりに、音声情報を出力してもよく、或いは装着装置３のずれの修正方向が直感的に分かるように振動等でユーザの触覚に対して提示してもよい。

本発明の第４の実施形態に係る顔表情識別システムを用いた機械学習方法の一例は、図２３に示した本発明の第３の実施形態に係る機械学習方法と基本的には同様とし、ステップＳ５２において、光センサ６１ａ〜６１ｐによる検出と同時に、ずれセンサ６３がずれを検出する。また、ステップＳ５５において、学習データ生成部３２は、光センサ６１ａ〜６１ｐによるセンサ値に対して、顔表情及びずれに対応するラベルを付与することにより機械学習用のデータセットを生成する。ずれに対応するラベルの情報は、例えば入力装置５を介して入力されてもよい。

次に、図４３のフローチャートを参照しながら、本発明の第４の実施形態に係る顔表情識別方法の一例を説明する。

ステップＳ７１において、光センサ６１ａ〜６１ｐが、装着装置３を装着したユーザの顔面と装着装置３の間の距離を検出する。ステップＳ７２において、ずれセンサ６３がずれを検出する。ずれ量算出部３４が、ずれセンサ６３の検出結果に基づいて、ずれ量及びずれ方向を算出する。ステップＳ７３において、修正提示部３５は、ずれ量算出部３４により算出されたずれ量が所定の閾値以上か否かを判定する。ずれ量が所定の閾値以上の場合に、ステップＳ７４に移行して、修正提示部３５は、ずれを修正するようにユーザに修正内容を提示する。

一方、ステップＳ７３において、ずれ量が所定の閾値未満の場合には、ステップＳ７６に移行し、顔表情識別部３３は、ずれに応じたラベルが付与された学習データを選択し、選択した学習データを用いてユーザの顔表情を識別する。ステップＳ７６において、アバター表示制御部１１が、顔表情識別部３３による識別結果に基づいて、アバターの顔画像を抽出し、抽出した顔表情のアバターを装着装置３の表示部６２等に表示する。

以上説明したように、本発明の第４の実施形態によれば、装着装置３を装着したときのずれを検出して、ずれに応じたラベルが付与された学習データを選択することにより、顔表情を適切に識別することができる。また、装着装置３を装着したときのずれを検出して、ユーザに対してずれを修正するように促すことにより、装着装置３のずれを適切に修正することができる。

（第５の実施形態）
本発明の第５の実施形態に係る顔表情識別システムは、図４４に示すように、装着装置３が血流センサ６４を更に備える点と、記憶装置２が血流データ記憶部５６を更に備える点が、図１５に示した第３の実施形態に係る顔表情識別システムと異なる。他の構成は図１５に示した第３の実施形態に係る顔表情識別システムと同様であるので、重複した説明を省略する。

血流センサ６４は、装着装置３を装着したユーザの血流量を検出する。血流センサ６４は、多波長の光を発光する光源と、多波長の反射光の光強度を検出する検出部とを備える。血流センサ６４は、頬等の顔色を計測し易い位置に多波長の光を照射し、反射光の光強度に基づいて血流量を検出する。例えば、血液中の赤血球に含まれるヘモグロビンは緑色の光を吸収する性質を持っており、血流量が増大するほどヘモグロビンが増え、多波長の光を照射したときに緑色の光が吸収されやすくなることを利用し、反射光のうちの緑色の波長の光強度に基づいて血流量を検出可能である。血流センサ６４により検出された血流量は、血流データ記憶部５６に記憶される。

顔表情識別部３３は、血流センサ６４により検出された血流量を所定の閾値と比較することにより、ユーザの顔色を識別する。例えば、血流センサ６４により検出された血流量が第１の閾値以上の場合、顔表情識別部３３は、ユーザの顔色を「赤面」と識別する。また、血流センサ６４により検出された血流量が、第１の閾値未満である第２の閾値未満の場合、顔表情識別部３３は、ユーザの顔色を「蒼白」と識別する。血流センサ６４により検出された血流量が第１の閾値未満かつ第２の閾値以上の場合、顔表情識別部３３は、ユーザの顔色を「通常」と識別する。

アバター表示制御部３１は、顔表情識別部３３によるユーザの顔表情及び顔色の識別結果に基づいて、アバターの顔画像を変化させる。アバター表示制御部３１は、例えばアバターの顔画像として、「赤面」且つ「怒り」の顔画像を表示したり、「蒼白」且つ「驚き」の顔画像を表示したりすることができる。

以上説明したように、本発明の第５の実施形態によれば、装着装置３を装着したユーザの顔表情に加えて顔色も識別することにより、ユーザの感情をより詳細に識別することができる。更に、ユーザの顔色の識別結果に応じてアバターの顔色も変化させることにより、ＶＲ環境での表情コミュニケーションの自由度を向上させることができる。

（第６の実施形態）
本発明の第６の実施形態に係る顔表情識別システムは、図４５に示すように、ＣＰＵ１が光センサ調整部３７を更に備える点が、図１５に示した第３の実施形態に係る顔表情識別システムと異なる。他の構成は図１５に示した第３の実施形態に係る顔表情識別システムと同様であるので、重複した説明を省略する。

光センサ調整部３７は、学習フェーズ又は識別フェーズのキャリブレーション時等において、光センサ６１ａ〜６１ｐのセンサ値に応じて、光センサ６１ａ〜６１ｐの発光強度及び感度を調整する。例えば、光センサ調整部３７は、光センサ６１ａ〜６１ｐのセンサ値のうち、最大値及び最小値を抽出する。光センサ調整部３７は、抽出した最大値及び最小値を所定の閾値と比較することにより、光センサ６１ａ〜６１ｐの発光強度及び感度の調整が必要か否かを判定する。

光センサ６１ａ〜６１ｐの発光強度及び感度の調整が必要と判定された場合に、光センサ調整部３７は、光センサ６１ａ〜６１ｐの可変抵抗の値を調整することにより、発光強度及び感度を調整する。例えば、光センサ６１ａ〜６１ｐのセンサ値の最大値が第１の閾値以上と判定された場合、光センサ６１ａ〜６１ｐの可変抵抗の値を大きくすることにより、光センサ６１ａ〜６１ｐの発光強度及び感度を低減する。また、光センサ６１ａ〜６１ｐのセンサ値の最小値が、第１の閾値よりも小さい第２の閾値未満と判定された場合、光センサ６１ａ〜６１ｐの可変抵抗の値を小さくすることにより、光センサ６１ａ〜６１ｐの発光強度及び感度を増大する。

次に、図４６のフローチャートを参照しながら、本発明の第６の実施形態に係る顔表情識別システムを用いた光センサの発光強度の調整方法の一例を説明する。なお、本発明の第６の実施形態に係る顔表情識別システムを用いた光センサの発光強度の調整方法は、例えば学習フェーズ又は識別フェーズのキャリブレーション時に実行される。

ステップＳ８１において、光センサ６１ａ〜６１ｐがセンサ値（反射強度）を取得する。ステップＳ８２において、光センサ調整部３７は、光センサ６１ａ〜６１ｐにより取得されたセンサ値（反射強度）の最大値及び最小値を抽出する。

ステップＳ８３において、光センサ調整部３７は、抽出した最大値及び最小値を所定の閾値と比較することにより、光センサ６１ａ〜６１ｐの発光強度及び感度を調整する必要が有るか否かを判定する。光センサ６１ａ〜６１ｐの発光強度及び感度の調整が必要と判定された場合には、ステップＳ８４に移行し、光センサ６１ａ〜６１ｐの可変抵抗を調整することにより、光センサ６１ａ〜６１ｐの発光強度及び感度を調整する。一方、ステップＳ８３において光センサ６１ａ〜６１ｐの発光強度及び感度の調整が不要と判定された場合には、処理を完了する。

以上説明したように、本発明の第６の実施形態によれば、光センサ６１ａ〜６１ｐの反射強度情報に基づいて光センサ６１ａ〜６１ｐの発光強度及び感度を調整することにより、適切なレンジでセンサ値を検出することができる。

（その他の実施形態）
上記のように、本発明は第１〜第６の実施形態によって記載したが、この開示の一部をなす論述及び図面は本発明を限定するものであると理解すべきではない。この開示から当業者には様々な代替実施の形態、実施例及び運用技術が明らかとなろう。

例えば、本発明の第１〜第６の実施形態において、装着装置３が、装着装置３を装着したユーザの顔面の皮膚の移動量を検出する反射型イメージセンサを更に備えていてもよい。或いは、装着装置３が、光センサ６１ａ〜６１ｐを用いる代わりに、装着装置３を装着したユーザの顔面の皮膚の移動量を検出する反射型イメージセンサを備えていてもよい。反射型イメージセンサとしては、例えばＣＭＯＳイメージセンサやＣＣＤイメージセンサが使用可能である。反射型イメージセンサは、例えば１次元又は２次元の顔面の皮膚の移動量を検出する。表情識別部３３は、光センサ６１ａ〜６１ｐからのセンサ値と、反射型イメージセンサからの移動量に基づいて、装着装置３を装着したユーザの顔表情を識別する。これにより、ユーザの顔表情の識別精度を更に向上させることができる。

また、本発明の第１〜第６の実施形態において、装着装置３を装着しているユーザ本人の学習データが学習データ記憶部５１に格納されている場合には、顔表情識別部３３は、ユーザ本人の学習データを読み出して、顔表情を識別してもよい。一方、装着装置３を装着しているユーザ本人の学習データが学習データ記憶部５１に格納されていない場合には、顔表情識別部３３は、学習データ記憶部５１に格納されている他者の学習データを用いてよい。

この場合、顔表情識別部３３は、光センサ６１ａ〜６１ｐのセンサ値と、装着装置３を装着しているユーザの現在の顔表情に対応するラベルを入力データとして、他者の学習データ毎に、ユーザの現在の顔表情に対応するラベルと同一のラベルが付与された（同一の顔表情の）テンプレート表情に対する類似度を算出する。顔表情識別部３３は更に、類似度が最も高い他者の学習データを読み込んで、ユーザの顔表情を識別する。

これにより、装着装置３を装着しているユーザ本人の学習データが無い場合であっても、ユーザと類似する他者の学習データを利用して、適切に顔表情を識別することができる。なお、ユーザの顔表情に対応するラベルは、入力装置５を介して入力されたものを使用してもよい。また、本発明の第３の実施形態のように、アバター表示制御部３１により抽出されたアバターの顔画像をユーザが真似て光センサ６１ａ〜６１ｐのセンサ値を検出している場合には、アバター表示制御部３１により抽出されたアバターの顔画像のデータに基づいてラベルを生成してもよい。

また、第１〜第６の実施形態に係る顔表情識別システムの各構成を互いに組み合わせてもよい。例えば、図１に示したＣＰＵ１が、図９に示した時刻情報取得部１５及び顔表情分布算出部１６を更に備え、図１に示した記憶装置２が、図９に示した地理情報記憶部２２及び顔表情マップ記憶部２３を更に備えていてもよい。また、第１〜第６の実施形態に係る機械学習方法（学習フェーズ）の処理と、第１〜第６の実施形態に係る顔表情識別方法（識別方法）の処理とを、互いに異なる実施形態同士で組み合わせてもよい。

本発明は、自動的に顔表情を識別する顔表情識別システム、顔表情識別方法及び顔表情識別プログラムに利用可能である。

１…中央演算処理装置（ＣＰＵ）
２…記憶装置
３…装着装置
４ａ，４ｂ，４ｃ，４ｄ，４ｅ，４ｆ，４ｇ，４ｈ，４ｉ，４ｊ，４ｋ，４ｌ，４ｍ，４ｎ，４ｏ，４ｐ，４ｑ…検出装置
５…入力装置
６…出力装置
１０…機械学習部
１１…顔表情識別部３３
１２…地理情報取得部
１３…顔表情マップ作成部
１４…推薦情報抽出部
１５…時刻情報取得部
１６…顔表情分布算出部
２０…学習データ記憶部
２１…顔表情記憶部
２２…地理情報記憶部
２３…顔表情マップ記憶部
２４…時刻情報記憶部
２５…顔表情分布記憶部
３１…アバター表示制御部
３２…学習データ生成部
３３…顔表情識別部
４０…表示部
４１，４２…アバター
５０…アバターデータ記憶部
５１…学習データ記憶部
５２…光センサデータ記憶部
５３…識別結果記憶部
６１ａ，６１ｂ，６１ｃ，６１ｄ，６１ｅ，６１ｆ，６１ｇ，６１ｈ，６１ｉ，６１ｊ，６１ｋ，６１ｌ，６１ｍ，６１ｎ，６１ｏ，６１ｐ…検出装置
６２…表示部
７１…本体部
７２…フレキシブル回路基板
７３ａ，７３ｂ…レンズ
８０…マルチクラス分類器
８１〜８４…回帰ネットワーク
１００…アバター

Claims

人物の頭部に装着可能な装着装置と、
前記装着装置の前記人物の顔面に対向する複数箇所にそれぞれ配置され、前記装着装置を装着したときの前記顔面と前記装着装置間の距離を前記複数箇所でそれぞれ検出する、複数の検出装置と、
前記複数の検出装置による過去の検出結果のデータと顔表情との対応関係を機械学習して得られた学習データを記憶する記憶装置と、
前記学習データを前記記憶装置から読み出し、前記複数の検出装置による検出結果を入力データとして前記人物の顔表情を識別する顔表情識別部と、
前記複数の検出装置による検出結果が得られた時点での地理情報を取得する地理情報取得部と、
前記顔表情識別部による識別結果と、前記地理情報取得部により取得された地理情報とを対応付けた顔表情マップを作成する顔表情マップ作成部と、
を備えることを特徴とする顔表情識別システム。
人物の頭部に装着可能な装着装置と、
前記装着装置の前記人物の顔面に対向する複数箇所にそれぞれ配置され、前記装着装置を装着したときの前記顔面と前記装着装置間の距離を前記複数箇所でそれぞれ検出する、複数の検出装置と、
前記複数の検出装置による過去の検出結果のデータと顔表情との対応関係を機械学習して得られた学習データを記憶する記憶装置と、
前記装着装置に備えられ、前記人物の顔面の皮膚の移動量を検出するイメージセンサと、
前記学習データを前記記憶装置から読み出し、前記複数の検出装置による検出結果及び前記イメージセンサにより検出された移動量を入力データとして前記人物の顔表情を識別する顔表情識別部と、
を備えることを特徴とする顔表情識別システム。
人物の頭部に装着可能な装着装置と、
前記装着装置の前記人物の顔面に対向する複数箇所にそれぞれ配置され、前記装着装置を装着したときの前記顔面と前記装着装置間の距離を前記複数箇所でそれぞれ検出する、複数の検出装置と、
前記複数の検出装置による検出結果を入力データとして、前記装着装置を装着したときのずれ量を算出するずれ量算出部と、
前記複数の検出装置による過去の検出結果のデータと、顔表情と、前記ずれ量とを対応付けることにより、機械学習のためのデータセットを生成する学習データ生成部と、
前記データセットに基づいて、前記機械学習を行うことにより、前記ずれ量それぞれに対応した学習データを得る機械学習部と、
前記学習データを記憶する記憶装置と、
前記複数の検出装置による検出結果が得られた時点での前記ずれ量に対応する前記学習データを前記記憶装置から読み出し、前記複数の検出装置による検出結果を入力データとして前記人物の顔表情を識別する顔表情識別部と、
を備えることを特徴とする顔表情識別システム。
装着装置の複数箇所にそれぞれ配置された複数の検出装置が、前記装着装置を人物の頭部に装着したときの前記人物の顔面と前記装着装置間の距離を前記複数箇所で検出するステップと、
記憶装置に記憶された、前記複数の検出装置による過去の検出結果のデータと顔表情との対応関係を機械学習して得られた学習データを前記記憶装置から読み出し、顔表情識別部が前記複数の検出装置による検出結果を入力データとして前記人物の顔表情を識別するステップと、
地理情報取得部が、前記複数の検出装置による検出結果が得られた時点での地理情報を取得するステップと、
顔表情マップ作成部が、前記顔表情識別部による識別結果と、前記地理情報取得部により取得された地理情報とを対応付けた顔表情マップを作成するステップと、
を含むことを特徴とする顔表情識別方法。
装着装置の複数箇所にそれぞれ配置された複数の検出装置が、前記装着装置を人物の頭部に装着したときの前記人物の顔面と前記装着装置間の距離を前記複数箇所で検出するステップと、
前記装着装置が備えるイメージセンサが、前記人物の顔面の皮膚の移動量を検出するステップと、
記憶装置に記憶された、前記複数の検出装置による過去の検出結果のデータと顔表情との対応関係を機械学習して得られた学習データを前記記憶装置から読み出し、顔表情識別部が前記複数の検出装置による検出結果及び前記イメージセンサにより検出された移動量を入力データとして前記人物の顔表情を識別するステップと、
を含むことを特徴とする顔表情識別方法。
装着装置の複数箇所にそれぞれ配置された複数の検出装置が、前記装着装置を人物の頭部に装着したときの前記人物の顔面と前記装着装置間の距離を前記複数箇所で検出するステップと、
ずれ量算出部が、前記複数の検出装置による検出結果を入力データとして、前記装着装置を装着したときのずれ量を算出するステップと、
学習データ生成部が、前記複数の検出装置による過去の検出結果のデータと、顔表情と、前記ずれ量とを対応付けることにより、機械学習のためのデータセットを生成するステップと、
機械学習部が、前記データセットに基づいて、前記機械学習を行うことにより、前記ずれ量それぞれに対応した学習データを得るステップと、
記憶装置が、前記学習データを記憶するステップと、
前記複数の検出装置による検出結果が得られた時点での前記ずれ量に対応する前記学習データを前記記憶装置から読み出し、顔表情識別部が前記複数の検出装置による検出結果を入力データとして前記人物の顔表情を識別するステップと、
を含むことを特徴とする顔表情識別方法。
装着装置の複数箇所にそれぞれ配置された複数の検出装置が、前記装着装置を人物の頭部に装着したときの前記人物の顔面と前記装着装置間の距離を前記複数箇所で検出する処理と、
記憶装置に記憶された、前記複数の検出装置による過去の検出結果のデータと顔表情との対応関係を機械学習して得られた学習データを前記記憶装置から読み出し、顔表情識別部が前記複数の検出装置による検出結果を入力データとして前記人物の顔表情を識別する処理と、
地理情報取得部が、前記複数の検出装置による検出結果が得られた時点での地理情報を取得する処理と、
顔表情マップ作成部が、前記顔表情識別部による識別結果と、前記地理情報取得部により取得された地理情報とを対応付けた顔表情マップを作成する処理と、
を含む一連の処理をコンピュータに実行させることを特徴とする顔表情識別プログラム。
装着装置の複数箇所にそれぞれ配置された複数の検出装置が、前記装着装置を人物の頭部に装着したときの前記人物の顔面と前記装着装置間の距離を前記複数箇所で検出する処理と、
前記装着装置が備えるイメージセンサが、前記人物の顔面の皮膚の移動量を検出する処理と、
記憶装置に記憶された、前記複数の検出装置による過去の検出結果のデータと顔表情との対応関係を機械学習して得られた学習データを前記記憶装置から読み出し、顔表情識別部が前記複数の検出装置による検出結果及び前記イメージセンサにより検出された移動量を入力データとして前記人物の顔表情を識別する処理と、
を含む一連の処理をコンピュータに実行させることを特徴とする顔表情識別プログラム。
装着装置の複数箇所にそれぞれ配置された複数の検出装置が、前記装着装置を人物の頭部に装着したときの前記人物の顔面と前記装着装置間の距離を前記複数箇所で検出する処理と、
ずれ量算出部が、前記複数の検出装置による検出結果を入力データとして、前記装着装置を装着したときのずれ量を算出する処理と、
学習データ生成部が、前記複数の検出装置による過去の検出結果のデータと、顔表情と、前記ずれ量とを対応付けることにより、機械学習のためのデータセットを生成する処理と、
機械学習部が、前記データセットに基づいて、前記機械学習を行うことにより、前記ずれ量それぞれに対応した学習データを得る処理と、
記憶装置が、前記学習データを記憶する処理と、
前記複数の検出装置による検出結果が得られた時点での前記ずれ量に対応する前記学習データを前記記憶装置から読み出し、顔表情識別部が前記複数の検出装置による検出結果を入力データとして前記人物の顔表情を識別する処理と、
を含む一連の処理をコンピュータに実行させることを特徴とする顔表情識別プログラム。