JP5927797B2 - ロボット制御装置、ロボットシステム、ロボット装置の行動制御方法、及びプログラム - Google Patents

ロボット制御装置、ロボットシステム、ロボット装置の行動制御方法、及びプログラム Download PDF

Info

Publication number
JP5927797B2
JP5927797B2 JP2011163517A JP2011163517A JP5927797B2 JP 5927797 B2 JP5927797 B2 JP 5927797B2 JP 2011163517 A JP2011163517 A JP 2011163517A JP 2011163517 A JP2011163517 A JP 2011163517A JP 5927797 B2 JP5927797 B2 JP 5927797B2
Authority
JP
Japan
Prior art keywords
action
robot
conscious
reaction
correlation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011163517A
Other languages
English (en)
Other versions
JP2013027937A (ja
Inventor
金岡 利知
利知 金岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2011163517A priority Critical patent/JP5927797B2/ja
Publication of JP2013027937A publication Critical patent/JP2013027937A/ja
Application granted granted Critical
Publication of JP5927797B2 publication Critical patent/JP5927797B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Manipulator (AREA)

Description

本明細書で議論される実施態様は、ロボット装置の行動を制御する技術に関するものである。
ロボット装置とは各種の作業を人の代わりに行う装置である。ロボット装置は、人の指示に対し、作業を自律的に行うことが重要とされてきた。また、近年では、決まったタスクを行うという以外に、擬人的・擬生物的な要素を持たせて、人との関わりにより、エンターテイメント、癒し、コミュニケーション、情報等を提供するロボット装置が提案されている。このようなロボット装置は、生物的な行動やユーザからの反応に、あたかも人や動物と接しているかのような感覚を与えることで、所望の機能を提供している。しかしながら、このようなロボット装置のうち、ユーザの個性やユーザとロボット装置との相互作用の状況に関わらず一様な行動を行うものは、ユーザ側の感情をロボット装置の振る舞いに合わせる必要があり、ユーザによっては感情移入が難しい。
ところで、ロボット装置に、生物的な振る舞いを生成するための情動システム、ユーザからの働きかけ(例えば接触)に対しての反応システム、時間経過や働きかけに対し予め用意されている振る舞いを切り替えていく状態遷移システムを有しているものがある。このようなロボット装置は、例えば感情に相当するような装置自身の内部状態を有しており、時間経過や人との関わり方に応じて内部状態を変化させることで、生き物感の創造を行う。
このようなロボット装置に関し、例えば、ロボット装置が遭遇した人物の特定を行って、人物毎の過去の感情値に応じた行動を行うというロボット装置が知られている。
また、例えば、順次供給される入力情報に応じたロボット装置の現在の行動と、次に供給される入力情報とに基づいて、当該ロボット装置の現在の行動に続く次の行動を決定するというロボット装置が知られている。
また、ロボット装置の行動に対して、内部状態と外部刺激とに基づいた実行優先度を算出し、ユーザにより選択された行動の実行優先度が負の欲求を有している場合には、選択された行動とは異なる行動を出力するというロボット装置が知られている。
特開2003−117866号公報 特開2010−149276号公報 特開2004−283958号公報
ロボット装置には、ユーザからの働きかけ(刺激)に基づいてユーザとの関係性を類推し、ユーザに合わせたインタラクションを行う(例えば、親密度が高い人には喜びを表す反応行動を行う)ものがある。しかし、このような、行動とその行動に対して期待されるユーザの反応行動(期待反応)との関係は、ロボット装置の開発者が定義していたものであるために、その関係が必ずしもユーザの実際の反応行動(現実反応)と一致するとは限らない。例えば、ロボット装置の“手を前に出す行動”に対し、開発者は“握手の要求”を期待反応として想定していたのに対し、あるユーザは、現実反応として“抱っこ”をした場合を考える。この場合のように期待反応と現実反応とが不一致となると、ロボット装置では欲求不満に相当する感情情報が生成される結果、ロボット装置とユーザとの関係を悪化させてしまうことがある。
上述した問題に鑑み、本明細書で後述するロボット制御装置は、ユーザの現実反応が予め定義していた期待反応と一致しないことがあっても、ユーザとの親和的な関係性をロボット装置が構築できるようにする。
本明細書で後述するロボット制御装置は、ロボット装置の行動制御を行うものである。このロボット制御装置のひとつに、センサと、予測適応部と、相関検出部と、結果行動制御部とを備えるというものがある。ここで、センサは、ロボット装置が行った行動に対する当該ロボット装置のユーザの反応に対応する物理量を検出する。予測適応部は、このセンサにより検出される、ロボット装置が行った行動に対するユーザの現実の反応である現実反応に対応する物理量に基づいて、当該行動に対して期待される当該ユーザの反応である期待反応に対する予測適応を行う。相関検出部は、このロボット装置が行った行動に対する上述の期待反応と、前述の現実反応との相関の高さを検出する。そして、結果行動制御部は、相関検出部による上述の相関の高さの検出結果に応じた行動内容の行動である結果行動をロボット装置に行わせる。
また、本明細書で後述するロボット装置の行動の制御方法のひとつは、まず、ロボット装置が行った行動に対して期待される当該ロボット装置のユーザの反応である期待反応に対する予測適応を行う。なお、この予測適応は、ロボット装置が行った行動に対する当該ロボット装置のユーザの反応に対応する物理量を検出するセンサが検出した、当該行動に対するユーザの現実の反応である現実反応に対応する物理量に基づいて行う。次に、ロボット装置が行った行動に対する上述の期待反応と前述の現実反応との相関の高さを検出する。そして、この相関の高さの検出結果に応じた行動内容の行動である結果行動をロボット装置に行わせる。
また、本明細書で後述するプログラムは、ロボット装置の行動の制御をコンピュータに実行させるものである。このプログラムのひとつは、以下の処理をコンピュータに行わせる。この処理は、まず、ロボット装置が行った行動に対して期待される当該ロボット装置のユーザの反応である期待反応に対する予測適応を行う。なお、この予測適応は、ロボット装置が行った行動に対する当該ロボット装置のユーザの反応に対応する物理量を検出するセンサが検出した、当該行動に対するユーザの現実の反応である現実反応に対応する物理量に基づいて行う。次に、ロボット装置が行った行動に対する上述の期待反応と前述の現実反応との相関の高さを検出する。そして、この相関の高さの検出結果に応じた行動内容の行動である結果行動をロボット装置に行わせる。
本明細書で後述するロボット制御装置を用いてロボット装置の行動制御を行うことで、ユーザの現実反応が予め定義していた期待反応と一致しないことがあっても、ユーザとの親和的な関係性をロボット装置が構築できるようになる。
ロボットシステムの一実施例の機能ブロック図である。 期待反応テーブルの一例である。 ロボット制御装置の一実施例の機能ブロック図である。 結果アクションDBのデータ構造例である。 アクション予測パラメータDBのデータ構造例である。 意識的アクションDBのデータ構造例である。 予測適応処理の処理手順を図解したフローチャートである。 意識的アクションの制御手法を説明する図である。 意識的アクション制御部の機能ブロック図である。 意識的アクション発生頻度演算処理の処理手順を図解したフローチャートである。 意識的アクション種別選択部の機能ブロック図である。 意識的アクション種別選択処理の処理手順を図解したフローチャートである。 予測適応処理の変形列を説明する図である。 コンピュータの構成例を図解した図である。
まず図1について説明する。図1は、ロボットシステムの一実施例の機能ブロック図である。
図1のロボットシステムは、ロボット装置1と、このロボット装置1の行動制御を行うロボット制御装置10とを備えている。
ロボット制御装置10は、センサ11、第一行動制御部12、適応部13、相関検出部14、及び第二行動制御部15を備えている。
センサ11は、ユーザ2の現実の反応に対応する物理量を検出する。
第一行動制御部12は、ロボット装置1に第一の行動を行わせる。
適応部13は、ロボット装置1が行った第一の行動に対してユーザ2に期待されていた反応を、当該第一の行動に伴ってセンサ11により検出された物理量に基づいて適応させる。
相関検出部14は、ロボット装置1が行った第一の行動に対して期待されていた反応と当該第一の行動に伴ってセンサ11により検出された物理量との相関の高さを検出する。
第二行動制御部15は、相関検出部14による上述の相関の高さの検出結果に応じた内容の第二の行動をロボット装置1に行わせる。
このロボット制御装置10を用いてロボット装置1の制御を行うことにより、現実反応(第一の行動に伴ってセンサ11により検出された物理量)に基づいた期待反応(第一の行動に対してユーザ2に期待されていた反応)の適応が行われる。従って、ユーザ2の現実反応が予め定義していた期待反応と一致しなくても、適応によって期待反応が現実反応に近づけられることで両者の相関が高くなる。すると、ロボット制御装置10は、この相関が高い場合の結果行動をロボット装置1に行わせる。従って、この相関が高い場合の結果行動として、好意的な感情が込められている行動をロボット装置1に行わせることで、ロボット装置1に対する愛着心をユーザ2に抱かせることができるようになる。このようにして、ユーザ2との親和的な関係性をロボット装置1が構築できるようになる。
なお、ここで、適応部13は、例えば、ロボット装置1が行った第一の行動に対する過去の適応の結果と、当該第一の行動に伴ってセンサ11により検出された物理量との重み付け加算によって、この適応を行う。
このようにすることで、適応部13は、ロボット装置1が行った行動に対するユーザ2の現実反応に対応する物理量に基づいた、期待反応の適応を行うことができる。
なお、ロボット制御装置10は、ロボット装置1により行われる行動と当該行動に対する適応の結果とを対応付けて記憶する記憶部16を更に備えていてもよい。
図2について説明する。図2は、記憶部16に記憶されている期待反応テーブルの一例である。
図2の期待反応テーブル例では、「行動名称」と「期待反応適応値」とが対応付けられている。なお、このテーブルは、名称が「ユーザAA」であるユーザ2についてのものである。
「行動名称」は、ロボット装置1により行われる各種の行動を個別に識別するために付されている名称である。また、「期待反応適応値」は、「行動名称」で特定されるロボット装置1の行動に対する期待反応の適応の結果であり、ロボット制御装置10に備えられている各々のセンサ11について期待されていた出力の適応値が示されている。
記憶部16は、この期待反応テーブルをユーザ2毎に記憶しておいてもよい。この場合においては、適応部13は、センサ11による上述の物理量の検出対象であるユーザ2についての期待反応テーブルにおいて、ロボット装置1が行った第一の行動に対応付けられている期待反応の適応値を用いて、前述の適応を行うようにする。
このようにすることで、ユーザ2が複数人でロボット装置1を共用していても、期待反応の適応に他人の現実反応が影響を受けて、ユーザ2との親和的な関係性が損なわれることがない。
また、ロボット制御装置10は、第三行動制御部17を更に備えていてもよい。第三行動制御部17は、ロボット装置1に行わせる第三の行動を、ロボット装置1の前述した第一の行動についての相関検出部14による上述の相関の高さの検出結果に基づいて決定し、当該決定された第三の行動をロボット装置1に行わせる。
なお、この場合においては、適応部13は、更に、第三の行動に対してユーザ2に期待されていた反応を、当該第三の行動に伴ってセンサ11により検出された物理量に基づいて適応させるようにする。
このようにして第一の行動に続く第三の行動をロボット装置1に行わせることで、ロボット装置1の行動に対するユーザの反応と、その反応に応じたロボット装置1の次の行動とが交互に繰り返されて両者間に良好なインタラクションが形成される。この結果、両者間の関係性はより緊密なものとなる。
なお、ここで、第三行動制御部17は、センサ11による上述の物理量の検出値が所定値以上となる単位時間当たりの頻度に応じた頻度で、第三の行動をロボット装置1に行わせるようにしてもよい。
ロボット装置1の行動に対するユーザの反応が多いほど、ユーザ2は、ロボット装置1に対する姿勢が積極的であると推定することができる。そこで、このような場合には、前述のようにして、高い頻度で第三の行動をロボット装置1に行わせるようにしてロボット装置1のユーザ2に対する積極的な姿勢を表現する。このようにすることで、ユーザ2との親和的な関係性を更に高めることができる。
また、前述したように、ロボット制御装置10は、ロボット装置1により行われる行動と当該行動に対する適応の結果とを対応付けて記憶する記憶部16を更に備えていてもよい。この場合において、相関検出部14は、更に、記憶部16に記憶されている適応の結果の各々と第一の行動に対して期待されていた反応との相関の高さを検出するようにしてもよい。なお、この場合には、第三行動制御部17は、第一の行動についての相関検出部14による上述の相関の高さの検出結果が所定の閾値よりも高い相関を表している場合には、第三の行動の決定を、次のようにして行う。
すなわち、この場合、第三行動制御部17は、記憶部16に記憶されているロボット装置1により行われる行動のうちから、当該行動に対する適応の結果と第一の行動に対して期待されていた反応との相関の高さが高い行動を所定の確率で選択するようにする。なお、この所定の確率は、第一の行動についての相関検出部14による上述の相関の高さの検出結果が当該所定の閾値よりも低い相関を表している場合よりも高い確率とする。
このようにすることで、第一の行動における期待反応の予測適応値と現実反応とが近い場合には、第一の行動と期待反応が類似している行動が、第三の行動として選択される。従って、ユーザ2から期待通りの反応が得られている場合に、同様の反応をせがむような行動を第三の行動として選択してロボット装置1に行わせることができる。
また、図1のロボット制御装置10において、相関検出部14は、更に、ロボット装置1により行われる行動に対して予め設定されている、ユーザ2に期待されていた反応の初期値とユーザ2の現実の反応との相関の高さを検出するようにしてもよい。なお、この場合、第二行動制御部15は、期待されていた反応と現実の反応との相関の高さと、期待されていた反応の初期値と現実の反応との相関の高さとのうちの高い相関を表しているものに応じた内容の第二の行動をロボット装置1に行わせる。
このようにする場合には、期待反応の適応が不十分な状況であっても、現実反応が期待反応の初期値に近いものであれば、この相関が高い場合の結果行動として、好意的な感情が込められている行動をロボット装置1に行わせる。このようにすることで、ロボット装置1に対する愛着心をユーザ2に抱かせることができるようになる。
また、図1のロボット制御装置10において、第二行動制御部15は、第二の行動の内容を、更に、センサ11による上述の物理量の検出値が所定値以上となる単位時間当たりの頻度にも応じて決定するようにしてもよい。
前述したように、ロボット装置1の行動に対するユーザの反応が多いほど、ユーザ2は、ロボット装置1に対する姿勢が積極的であると推定することができる。そこで、このような場合には、前述のようにして、ユーザ2に対してより好意的な第二の行動をロボット装置1に行わせるようにしてロボット装置1のユーザ2に対する好意的な姿勢を表現する。このようにすることで、ユーザ2との親和的な関係性を更に高めることができる。
次に図3について説明する。図3は、ロボットシステムの別の一実施例の機能ブロック図である。
図3のロボットシステムも、ロボット装置1とロボット装置1の行動制御を行うロボット制御装置20とを備えている。このうちのロボット装置1は図1のシステムと同様のものである。また、ロボット制御装置20も、図1のシステムにおけるロボット制御装置10と同様の機能的を提供する。
ロボット制御装置20は、ロボット装置1に行わせた、ロボット装置1のユーザ2へ働きかける振る舞いに対して期待されるユーザ2の反応を、意識的アクションに対する実際のユーザ2の反応に基づいて予測適応する。ここで、ロボット装置1のユーザ2へ働きかける振る舞いを「意識的アクション」と称することとする。また、意識的アクションに対して期待されるユーザ2の反応を「期待リアクション」と称することとし、意識的アクションに対する実際のユーザ2の反応を「現実リアクション」と称することとする。なお、前述した図1の説明において、ロボット装置1が行う行動は意識的アクションに対応する。従って、ユーザ2の期待反応及び現実反応は、それぞれ期待リアクション及び現実リアクションに対応する。
また、ロボット制御装置20は、ユーザ2からの現実リアクションの頻度や期待リアクションとの一致状態、更には現実リアクションの内容等を加味してロボット装置1の行動の制御を行って、ユーザ2への様々な意識的アクションを実行させる。
より詳細には、ロボット制御装置20は、以下のような動作を行う。
[1]まず、ロボット制御装置20は、ロボット装置1に実行させる各種の意識的アクションの各々に、意識的アクションについての期待リアクションを対応付けておく。
[2]次に、ロボット制御装置20は、ユーザ2を検出すると、ロボット装置1に意識的アクションを実行させると共に、この意識的アクションに対するユーザ2の現実リアクションを取得する。そして、上述の[1]でこの意識的アクションに対応付けておいた期待リアクションに対し、取得した現実リアクションに基づいた予測適応処理を施す。
[3]なお、ロボット制御装置20は、ユーザ2の識別を行って、[2]の予測適応処理をユーザ2毎に個々に行う。
[4]また、ロボット制御装置20は、次の意識的アクションの実行開始とその意識的アクションの行動内容の選択とを、ロボット装置1とユーザ2との間でのインタラクション(相互作用)の状況に基づいて決定する。
より具体的には、ロボット制御装置20は、その直近にロボット装置1に実行させた意識的アクションに対するユーザ2の現実リアクションの頻度が高いほど(単位時間当たりの反応の多さ)、高い確率で次の意識的アクションをロボット装置1に実行開始させる。
また、次の意識的アクションの行動内容の選択では、直近意識的アクションに対応付けられている期待リアクションと現実リアクションとの一致性、及び、直近意識的アクションに対しユーザ2が現実リアクションを起こすまでの反応速度に基づいて決定される。すなわち、ロボット制御装置20は、この一致性が高く且つこの反応速度が速いほど、直近意識的アクションとの間で期待リアクションの類似性が高い意識的アクションを次の意識的アクションとして選択する。その一方、ロボット制御装置20は、この一致性が低く且つこの反応速度が低いほど、直近意識的アクションとの間で期待リアクションの類似性が低い意識的アクションを次の意識的アクションとして選択する。
ロボット制御装置20が以下のような動作を行うことで、個々のユーザ2に適した意識的アクションをロボット装置1に実行させることができるので、ロボット装置1とユーザ2との効果的な相互作用を生み出し、愛着を形成することができる。その結果、ユーザ2がロボット装置1に感情移入しやすくなり、ユーザ2が癒し効果を体感することで、ロボット装置1による生活支援を円滑に行うことができるようになる。
図3に図解されているように、ロボット制御装置20は、機能ブロックとして、センサ11、リアクション予測適応部21、結果アクション制御部22、意識的アクション制御部23、及びアクション選択部24を備えている。更に、ロボット制御装置20は、データベース(DB)として、結果アクションDB31、アクション予測パラメータDB32、及び意識的アクションDB33を備えている。
センサ11は、ユーザ2の反応に対応する物理量を検出するものであり、図1のロボット制御装置10が備えているものと同一のものである。このセンサ11は、より具体的には、例えば、動物の触覚、視覚、及び聴覚に相当する感覚機能をロボット装置1に持たせるためにロボット装置1に内蔵される圧力センサ、マイク、カメラである。これらのセンサ11により、例えば、ユーザ2が触れたロボット装置1の部位や力(押圧力)、ユーザ2の発声の音量や周波数、発話の内容、ユーザ2の顔部品(口や目等)の形状、視線の方向の各情報や、これらの変化量の情報などが物理量として得られる。
センサ11から出力される物理量の検出結果(リアクション)は、リアクション予測適応部21及び意識的アクション制御部23に入力される。
リアクション予測適応部21は、まず、入力されたリアクションが現実リアクションであるか否か、すなわち、ロボット装置1が実行した意識的アクションに対するユーザ2の反応を表しているものであるか否かを判定する。ここで、リアクション予測適応部21は、入力されたリアクションが現実リアクションであったと判定した場合には、この現実リアクションが、ロボット装置1が実行した意識的アクションについての期待リアクションに近いものであるか否かを判定する。そして、この判定結果を結果アクション制御部22と意識的アクション制御部23とに送付する。
結果アクション制御部22は、現実リアクションと期待リアクションとが近いものであるか否かの判定結果に基づき、結果アクションの選択を行う。なお、結果アクションとは、意識的アクションに対する期待リアクションに応じてロボット装置1に実行させる行動(アクション)であって、この判定結果に予め対応付けられているものである。
結果アクションDB31には、結果アクションをロボット装置1に実行させるために必要な制御情報が結果アクション毎に格納されている。図4Aは、この結果アクションDB31のデータ構造例を図解したものである。
結果アクションDB31では、「結果アクション名」、「意識的アクション名」、「選択条件」、及び「制御情報」の各データが対応付けられている。
「結果アクション名」は、結果アクションを識別するために個別に与えられている名称である。
「意識的アクション名」は、ロボット装置1が実行した意識的アクションを識別するために個別に与えられている名称であり、「結果アクション名」により特定される結果アクションが、どの意識的アクションについてのものであるかを特定するためのものである。
「選択条件」は、「結果アクション名」により特定される結果アクションの選択条件を表している。ここで、『一致』とは、「結果アクション名」により特定される結果アクションが、現実リアクションと期待リアクションとが一致していると判定されたときに選択されることを表している。一方、『不一致』とは、「結果アクション名」により特定される結果アクションが、現実リアクションと期待リアクションとが不一致であると判定されたときに選択されることを表している。
「制御情報」は、「結果アクション名」により特定される結果アクションをロボット装置1に実行させるために必要な制御情報データである。
結果アクション制御部22は、選択した結果アクションをロボット装置1に実行させるための制御情報を、結果アクションDB31から読み出してアクション選択部24に送付する。
なお、結果アクション制御部22は、図1のロボット制御装置10における第二行動制御部15に相当する機能を提供する。
更に、リアクション予測適応部21は、センサ11から入力されたリアクションが現実リアクションであったと判定した場合には、この現実リアクションに基づいた予測適応処理をリアクション予測パラメータに対して行って当該パラメータの更新を行う。
なお、リアクション予測パラメータは、ロボット装置1が実行した意識的アクションに対応付けられているパラメータであって、ユーザ2の期待リアクションの具体例である。アクション予測パラメータDB32には、ユーザ2毎に、このリアクション予測パラメータが当該意識的アクションを特定する情報に対応付けられて格納されている。図4Bは、このアクション予測パラメータDB32のデータ構造例を図解したものである。
この図4Bのデータ例は、名称が「ユーザAA」であるユーザ2についてのもののである。アクション予測パラメータDB32では、図4Bに例示するようなデータが、ユーザ2毎に格納されている。
アクション予測パラメータDB32では、「意識的アクション名」と「リアクション予測パラメータ」とのデータが対応付けられている。
「意識的アクション名」は、ロボット装置1が実行した意識的アクションを識別するために個別に与えられている名称であり、結果アクションDB31において用いられているものと同一のものである。
「リアクション予測パラメータ」は、「意識的アクション名」で特定される意識的アクションについてのリアクション予測パラメータである。
リアクション予測適応部21は、アクション予測パラメータDB32に格納されている、ロボット装置1が実行した意識的アクションに対応付けられているリアクション予測パラメータを更新する。なお、この更新は、センサ11が現実リアクションを取得したユーザ2についてのリアクション予測パラメータに対して行われる。
なお、リアクション予測適応部21は、図1のロボット制御装置10における適応部13及び相関検出部14に相当する機能を提供する。また、アクション予測パラメータDB32は、図1のロボット制御装置10における記憶部16に相当するものである。
意識的アクション制御部23は、センサ11から受け取る現実リアクションと、リアクション予測適応部21が更新したリアクション予測パラメータとに基づいて、ロボット装置1に次に実行させる意識的アクションの選択と、その実行開始の決定とを行う。
意識的アクションDB33には、意識的アクションをロボット装置1に実行させるために必要な制御情報が意識的アクション毎に格納されている。図4Cは、この意識的アクションDB33のデータ構造例を図解したものである。
意識的アクションDB33では、「意識的アクション名」と「制御情報」とのデータが対応付けられている。
「意識的アクション名」は、ロボット装置1が実行した意識的アクションを識別するために個別に与えられている名称であり、結果アクションDB31及びアクション予測パラメータDB32において用いられているものと同一のものである。
「制御情報」は、「意識的アクション名」により特定される意識的アクションをロボット装置1に実行させるために必要な制御情報データである。
意識的アクション制御部23は、次の意識的アクションの実行開始を決定したときに、選択した意識的アクションをロボット装置1に実行させるための制御情報を、意識的アクションDB33から読み出してアクション選択部24に送付する。
なお、意識的アクション制御部23は、図1のロボット制御装置10における、第一行動制御部12及び第三行動制御部17に相当する機能を提供する。
アクション選択部24は、結果アクション制御部22から結果アクションの制御情報を受け取った場合には、その制御情報をロボット装置1に与えて結果アクションを実行させる。また、アクション選択部24は、意識的アクション制御部23から意識的アクションの制御情報を受け取ったときは、その制御情報をロボット装置1に与えて意識的アクションを実行させる。なお、アクション選択部24は、結果アクションの制御情報と意識的アクションの制御情報とを同時に受け取った場合には、即時性が要求されている結果アクションを優先して選択して結果アクションの制御情報をロボット装置1に与える。
次に、ロボット制御装置20により行われる期待リアクションの予測適応処理について説明する。
前述したように、ロボット制御装置20のリアクション予測適応部21は、ロボット装置1がユーザ2に対して意識的アクションを実行したときにおいて、期待リアクションをユーザ2からの現実リアクションをもとに適応させる。
ここで図5について説明する。図5は、ロボット制御装置20において行われる予測適応処理の処理手順を図解したフローチャートである。
図5の処理は、ユーザ2の存在が、センサ11の出力に基づいて認識されると開始される。
まず、S101では、センサ11の出力に基づいて認識されたユーザ2を識別する処理をリアクション予測適応部21が行う。
次に、S102では、意識的アクションをロボット装置1に実行させる処理を意識的アクション制御部23及びアクション選択部24が行う。なお、このS102の処理が初めて実行される場合には、意識的アクション制御部23は、予め定めておいた意識的アクションをロボット装置1に実行させるようにする。また、その後にS102の処理が実行される場合における意識的アクション制御部23の動作内容については後述する。
次に、S103では、現実リアクションの取得処理をリアクション予測適応部21が行う。この処理では、まず、S102の処理によってロボット装置1に意識的アクションを実行させてから所定時間以内にセンサ11がリアクションを取得したか否かを判定する処理をリアクション予測適応部21が行う。ここで、意識的アクションを実行させてから所定時間以内にリアクションが取得されたと判定した場合には、このリアクションを現実リアクションとして取得する処理をリアクション予測適応部21が行う。
次に、S104では、S102の処理でロボット装置1に実行させた意識的アクションについての期待リアクションについての予測適応処理をリアクション予測適応部21が行う。本実施例では、センサ11から出力されるセンサ情報(すなわち現実アクション)に基づいた下記の[数1]式の計算を行って、期待リアクションの具体例であるリアクション予測パラメータを更新する処理が行われる。
Figure 0005927797
なお、[数1]式において、『.*』は、行列の単なる乗算ではなく、行列の要素毎の乗算を表している。例えば、『mA .*XA 』におけるi行j列の計算結果は、mA (i,j)×XA (i,j)となる。
[数1]式において、mA は、意識的アクションAについての更新直前のリアクション予測パラメータであり、m’A は意識的アクションAについての更新後のリアクション予測パラメータである。なお、リアクション予測パラメータは、[数2]式に示すa行b列の行列で表される。
Figure 0005927797
また、sはセンサ情報、すなわち、すなわち、センサ11で検出された各種の物理量であり、[数3]式に示すa行b列の行列で表される。
Figure 0005927797
この[数3]式の行列の各要素は、0、1、…、a−1の計a個のセンサ11の各々が時刻t=0、1、…、b−1の各時刻において検出した物理量を表している。
また、XA は、意識的アクションAについての禁則パラメータであり、[数4]式に示すa行b列の行列で表される。
Figure 0005927797
この禁則パラメータXA の各要素の値は「0」又は「1」に設定される。ここで、この要素の値が「0」に設定されると、リアクション予測パラメータの対応する要素の値は、更新前の値には基づかずに、現実リアクションの値のみに基づいて更新されるようになる。
また、定数αは更新係数であり、その値は、0.0から1.0までのいずれかの値が予め設定される。
リアクション予測適応部21は、S104において、S102の処理でロボット装置1に実行させた意識的アクションについてのリアクション予測パラメータをアクション予測パラメータDB32から読み出して前掲の[数1]式に基づく更新処理を行う。なお、リアクション予測パラメータは、S101の処理により識別されたユーザ2についてのものをアクション予測パラメータDB32から読み出す。そして、アクション予測パラメータDB32におけるリアクション予測パラメータの読み出し位置に、更新後のリアクション予測パラメータを上書きして格納する。
例えば、意識的アクションAについての現実リアクション(すなわちセンサ11による物理量の検出結果)として、視覚、触覚、及び聴覚の3つのセンサ情報を得ている場合には、リアクション予測パラメータm’A として、下記の[数5]式のような行列が得られる。
Figure 0005927797
なお、[数5]式の行列の数値例において、各要素の数値はセンサ情報の値(正規化した値)である。また、各行は、それぞれ視覚、触覚、及び聴覚のセンサ情報を表しており、各列は、意識的アクションAがロボット装置1で実行されてからの経過時間毎(例えば0秒から0.5秒まで、0.5秒から1.0秒まで、1.0秒から1.5秒まで)のセンサ情報を表している。
以上のように、リアクション予測適応部21は、意識的アクションに対しての期待リアクションの過去の予測適応値と、センサ11により検出された現実リアクションとの重み付け加算によって、期待リアクションの予測適応を行う。
次に、S105では、相関閾値Thの値の設定処理をリアクション予測適応部21が行う。なお、この相関閾値Thの値の設定の手法については後述する。
次に、S106では、リアクション判定処理をリアクション予測適応部21が行う。
このS106の処理では、まず、S104の処理により得られた更新後のリアクション予測パラメータm’A (すなわち更新後の期待リアクション)と、センサ11により得られたセンサ情報s(すなわち現実リアクション)との相関の高さの算出が行われる。本実施例では、両者の正規化相互相関を与える下記の[数6]式の計算を行うことで、この相関の高さを表す値の算出が行われる。
Figure 0005927797
次に、算出された両者の正規化相互相関値Rと、S105の処理で設定された相関閾値Thとの大小比較が行われる。ここで、リアクション予測適応部21は、正規化相互相関値Rが相関閾値Th以上であるときには、現実リアクションが期待リアクションに一致しているとの判定を下し、この判定結果を結果アクション制御部22に伝えてS107に処理を進める。一方、リアクション予測適応部21は、ここで、正規化相互相関値Rが相関閾値Th未満であるときには、現実リアクションは期待リアクションとは不一致であるとの判定を下し、この判定結果を結果アクション制御部22に伝えてS108に処理を進める。なお、リアクション予測適応部21は、このリアクションの判定結果を、意識的アクション制御部23にも通知する。
S107では、好意的な感情を表現している結果リアクションをロボット装置1に実行させる処理を結果アクション制御部22が行う。この処理では、まず、S102の処理で実行された意識的アクションについての結果リアクションのうち、現実リアクションが期待リアクションに一致している場合のものについての制御情報を結果アクションDB31から読み出す。そして、読み出した制御情報を、アクション選択部24を介してロボット装置1に送付する。その後はS109に処理が進む。
一方、S108では、不満な感情を表現している結果リアクションをロボット装置1に実行させる処理を結果アクション制御部22が行う。この処理では、まず、S102の処理で実行された意識的アクションについての結果リアクションのうち、現実リアクションが期待リアクションとは不一致の場合のものについての制御情報を結果アクションDB31から読み出す。そして、読み出した制御情報を、アクション選択部24を介してロボット装置1に送付する。
S109では、ユーザ2の存在が、センサ11の出力に基づいて依然として認識されているか否かを判定する処理をリアクション予測適応部21が行う。ここで、リアクション予測適応部21は、ユーザ2の存在が認識されていると判定したとき(判定結果かYesのとき)には、S102に処理を戻して上述した処理を繰り返す。一方、リアクション予測適応部21は、ユーザ2の存在が認識されなくなったと判定したとき(判定結果かNoのとき)には、この図5の予測適応処理を終了する。
以上までの処理が予測適応処理である。
次に、S105の処理における相関閾値Thの値の設定手法について説明する。
この相関閾値Thは、固定値を設定するようにしてもよいが、本実施例においては、下記の[数7]式の計算を行ってその値を決定する。
Figure 0005927797
なお、[数7]式において、Thmax 及びThmin は、それぞれ、この相関閾値Thの最大値及び最小値であり、どちらも、0.0から1.0までの間の値を予め定めておく。
また、Pは、意識的アクション発生確率であり、0.0から1.0までの間の値をとる。詳しくは後で説明するが、この意識的アクション発生確率は、意識的アクションをロボット装置1に実行させる決定に使用する確率であり、意識的アクション制御部23において算出されてリアクション予測適応部21に送られてくる。この確率は、センサ11によって物理量が検出される(すなわち、物理量の検出値が0よりも大きくなる)単位時間当たりの頻度の高さに応じて高くなる。
従って、ユーザ2によるロボット装置1とのインタラクションへの熱中度が高いほど、現実レスポンスの単位時間当たりのレスポンス量が多くなり、その結果として、相関閾値Thの値は小さくなる。この相関閾値Thの値が小さくなると、現実リアクションと期待リアクションとの相関がそれほど高くなくても、両者は一致しているとリアクション予測適応部21が判定するようになる。
このようにすることで、ユーザ2によるロボット装置1とのインタラクションへの熱中度が高いときは、現実リアクションと期待リアクションとの相関がそれほど高くなくても、好意的な結果リアクションをロボット装置1が実行するようになる。従って、このようにして相関閾値Thの値を変化させようにすることで、ユーザ2のロボット装置1への愛着感の増加が期待できる。
また、上述したようにして意識的アクション発生確率に基づき相関閾値Thの値を小さくしたにもかかわらず、現実リアクションと期待リアクションとの相関が顕著に低いために、両者は不一致であるとリアクション予測適応部21が判定する場合がある。この場合に、結果アクション制御部22は、S108の処理において、不満な感情を、他の場合に比べて顕に表現している結果リアクションをロボット装置1に実行させる処理を行うようにしてもよい。なお、このようにするために、現実リアクションが期待リアクションとは不一致の場合のものについての結果リアクションを、不満な感情の大きさに応じて複数用意しておき、その各々についての制御情報を、結果アクションDB31に格納しておくようにする。
また、図5のS107及びS108における結果アクション制御部22の処理を、以下のように行うようにしてもよい。
まず、現実リアクションと期待リアクションとが一致している場合についての結果リアクションを、好意的な感情の大きさに応じて複数用意しておき、両者が不一致の場合についての結果リアクションについても、不満な感情の大きさに応じて複数用意しておく。そして、これらの結果リアクションの各々についての制御情報を、結果アクションDB31に格納しておく。
ここで、結果アクション制御部22は、現実リアクションと期待リアクションとが一致していると判定されてS107の処理を始めて実行する場合には、好意的な感情の大きさが最大の結果リアクションをロボット装置1に実行させる。その後、結果アクション制御部22は、このS107の処理の繰り返し数に応じて、好意的な感情の大きさが小さい結果リアクションをロボット装置1に実行させるようにして、両リアクションの一致に対する慣れの感情を表現する。
また、結果アクション制御部22は、現実リアクションと期待リアクションとが不一致であると判定されてS108の処理を始めて実行する場合には、不満な感情の大きさが最小の結果リアクションをロボット装置1に実行させる。その後、結果アクション制御部22は、このS108の処理の繰り返し数に応じて、不満な感情の大きさが大きい結果リアクションをロボット装置1に実行させるようにして、両リアクションがいつまでも不一致であることに対する不満の感情の増大を表現する。
図5のS107及びS108における結果アクション制御部22の処理を、以上のように行うようにしてもよい。
次に、ロボット制御装置20の意識的アクション制御部23による、意識的アクションをロボット装置1に実行させるための制御動作について説明する。
意識的アクション制御部23では、ユーザ2とのインタラクション状況に応じて、多様な意識的アクションをロボット装置1に実行させる。
例えば、ユーザ2がロボット装置1とのインタラクションに熱中していて盛り上がっているときには、同じような意識的アクションをロボット装置1に繰り返し実行させる。これは、あたかも子供がはしゃいでいるときのような、同じことを何度もせがむような振る舞いを模すためのものである。その一方で、ユーザ2がロボット装置1とのインタラクションの盛り上がりが感じられず、現実リアクションが単調なものであるような場合は、別の現実リアクションを引き出すための意識的アクションをロボット装置1に実行させる。
まず、本実施例における意識的アクションの制御手法の概要について、図6を参照しながら説明する。
図6のグラフは、時間経過に伴うセンサ情報相関期待値Rdの変化の様子の一例を表したものである。
センサ情報相関期待値Rdは、ロボット装置1に実行させる意識的アクションを選択するために意識的アクション制御部23内で生成される指標である。このセンサ情報相関期待値Rdは、0.0から1.0までの範囲の値をとる。
意識的アクション制御部23は、このRdの値が1.0に近いほど、期待リアクションが、直近に実行された意識的アクションに対する現実リアクションとの相関が高い意識的アクションを高い確率で選択する。その一方、意識的アクション制御部23は、このRdの値が0.0に近いほど、期待リアクションが、直近に実行された意識的アクションに対する現実リアクションとの相関が低い意識的アクションを高い確率で選択する。
図6のグラフにおいて、ロボット装置1とユーザ2とのインタラクションが開始されると、意識的アクション制御部23は、まず、予め定められていた意識的アクションAをロボット装置1に実行させる。このとき、前述したセンサ情報相関期待値Rdに、意識的アクション制御部23は、初期値「1.0」を与える。
その後、意識的アクション制御部23は、時間経過に応じて、センサ情報相関期待値Rdを減少させる。本実施例では、意識的アクション制御部23は、下記の[数8]式の計算を行って、時刻tにおけるセンサ情報相関期待値Rd(t)を、時刻t−1におけるセンサ情報相関期待値Rd(t−1)から減衰率γ(<1.0)で減衰させた値とする。
Figure 0005927797
本実施例では、この減衰率γの値を「0.9」とし、センサ情報相関期待値Rd(t)の更新間隔を5秒とする。従って、この場合には、5秒毎に、センサ情報相関期待値Rdに「0.9」が乗じられて新たなセンサ情報相関期待値Rdが得られる。
その後、意識的アクション制御部23は、ロボット装置1に実行させた意識的アクションAに対して得られた現実リアクションが、意識的アクションと一致するか否かの判定結果をリアクション予測適応部21から取得する。ここで、両者が一致したとの判定結果を取得した場合には、意識的アクション制御部23は、センサ情報相関期待値Rdを所定値rp だけ大きくする。一方、両者は不一致であるとの判定結果を取得した場合には、意識的アクション制御部23は、センサ情報相関期待値Rdを所定値rm だけ小さくする。
図6のグラフでは、まず、意識的アクションAの実行後に得られた現実リアクションが、意識的アクションAについての期待リアクションと一致したことで、センサ情報相関期待値Rdが所定値(ここでは0.2)だけ大きくされて、ほぼ1.0の値となっている。このような値の場合には、意識的アクション制御部23は、次の意識的アクションとして、期待リアクションがこのときの現実リアクションに近いものを選択する。ここでは、この結果として意識的アクションBが選択されている。
意識的アクション制御部23は、ここで、この意識的アクションBをロボット装置1に実行させる。
図6のグラフでは、この意識的アクションBの実行に応じて得られた現実リアクションが、意識的アクションBについての期待リアクションとは不一致であった場合を表している。従って、この場合には、センサ情報相関期待値Rdが所定値(ここでは0.2)だけ小さくされて、0.5程度の値となっている。このような値の場合には、意識的アクション制御部23は、次の意識的アクションとして、期待リアクションが意識的アクションBの現実リアクションとは余り近くないものを選択する。ここでは、この結果として意識的アクションCが選択されている。
意識的アクション制御部23は、ここで、この意識的アクションCをロボット装置1に実行させる。
図6のグラフでは、まず、意識的アクションCの実行後に得られた現実リアクションが、意識的アクションCについての期待リアクションと一致したことで、センサ情報相関期待値Rdが所定値だけ大きくされて、0.5程度の値となっている。従って、このような値の場合には、意識的アクション制御部23は、前述の場合と同様に、次の意識的アクションとして、期待リアクションが意識的アクションBの現実リアクションとは余り近くないものを選択する。
但し、図6のグラフでは、このときにはユーザ2によるロボット装置1とのインタラクションへの熱中度が低下してしまい、意識的アクション発生確率が低くなってしまった場合を想定している。このために、意識的アクション制御部23が、上述のようにして選択された次の意識的アクションをロボット装置1に実行させなかった結果、センサ情報相関期待値Rdが時間経過に応じて0.0に向かって減衰している。
意識的アクション制御部23の動作の詳細について、図7を用いて説明する。図7は、意識的アクション制御部23の機能ブロック図である。
意識的アクション制御部23は、意識的アクション発生頻度演算部41と意識的アクション種別選択部42とを備えている。
意識的アクション発生頻度演算部41は、意識的アクションを実行する頻度とその実行タイミングの制御を行う。
意識的アクション種別選択部42は、前述したセンサ情報相関期待値Rdを算出し、この値を用いて次の意識的アクションの選択を行う。
以下、これらの意識的アクション制御部23の構成要素について更に詳しく説明する。
まず、意識的アクション発生頻度演算部41の動作について、図8を参照しながら説明する。図8は、意識的アクション発生頻度演算部41によって行われる、意識的アクション発生頻度演算処理の処理手順を図解したフローチャートである。
意識的アクション発生頻度演算部41は、センサ11によって取得されるセンサ情報(すなわち現実リアクション)を入力とし、アクション発生フラグを出力とする。
図8において、まず、S201では、意識的アクション発生頻度演算部41は、意識的アクション発生確率の算出処理を行う。
本実施例では、意識的アクション発生確率を、単位時間アクション発生確率に基づいて算出する。単位時間アクション発生確率とは、単位時間当りでの、センサ11によるセンサ情報の検出頻度(センサ11による物理量の検出値が所定値(例えば「0.0」)よりも大きな値を出力する頻度)を表す確率である。本実施例では、意識的アクション発生頻度演算部41は、単位時間アクション発生確率pe を、下記の[数9]式の計算を行うことによって算出する。
Figure 0005927797
なお、[数9]式において、s0 は、単位時間当たりにセンサ11の各々が検出したセンサ情報の検出頻度であり、0.0から1.0までの範囲の値をとる。また、wは、単位時間アクション発生確率の生成における、センサ11の各々に対する重み付け量である。例えば、視覚、触覚、及び聴覚の3つのセンサ情報を得ている場合には、これらの値は、例えば以下の[数10]式のような値となる。
Figure 0005927797
この[数10]式の各列の要素の値は、それぞれ、視覚、触覚、及び聴覚のセンサ情報の各々についての、単位時間当たりの検出頻度と、単位時間アクション発生確率の生成における重み付け量である。
次に、意識的アクション発生頻度演算部41は、時刻tにおける意識的アクション発生確率P(t)を、時刻t−1における意識的アクション発生確率P(t−1)と、以上のようにして算出された単位時間アクション発生確率pe とに基づき算出する。意識的アクション発生頻度演算部41は、この意識的アクション発生確率P(t)を、単位時間アクション発生確率pe の減衰付き移動平均を表している下記の[数11]式の計算を行うことによって算出する。
Figure 0005927797
従って、意識的アクション発生確率P(t)は、ユーザ2がロボット装置1に対して積極的にインタラクションを行うほど高くなり、逆の場合には低くなる。
なお、[数11]式において、βは、意識的アクション発生確率P(t)を時間の経過に応じて減衰させるための定数値であり、1.0よりも小さな正の値が予め設定される。なお、本実施例では、このβの値を「0.999」とする。また、意識的アクション発生確率P(t)(及びP(t−1))は、0.0から1.0までの値をとり、初期値は1.0とする。
次に、S202において、意識的アクション発生頻度演算部41は、S201の処理によって算出された意識的アクション発生確率P(t)に従って、アクション発生フラグを生成する処理を行う。例えば、意識的アクション発生確率P(t)が1.0であった場合には、アクション発生フラグが必ず生成される一方、意識的アクション発生確率P(t)が0.0であった場合には、アクション発生フラグが生成されることはない。
次に、S203において、意識的アクション発生頻度演算部41は、S202の処理によってアクション発生フラグを生成したか否かを判定する処理を行う。ここで、意識的アクション発生頻度演算部41は、アクション発生フラグを生成したと判定したとき(判定結果がYesのとき)にはS204に処理を進める。一方、意識的アクション発生頻度演算部41は、アクション発生フラグを生成しなかったと判定したとき(判定結果がNoのとき)にはS205に処理を進める。
次に、S204において、意識的アクション発生頻度演算部41は、S202の処理によって生成したアクション発生フラグを意識的アクション種別選択部42に出力する処理を行う。
次に、S205において、意識的アクション発生頻度演算部41は、S201の処理により算出した意識的アクション発生確率P(t)を、リアクション予測適応部21に送付する処理を行う。リアクション予測適応部21は、この意識的アクション発生確率を、前述した相関閾値Thの設定に使用する。
その後、意識的アクション発生頻度演算部41は、上述したS205の処理を終えたときには、S201に処理を戻して、上述した手順で各処理の実行を繰り返す。
以上までの処理が意識的アクション発生頻度演算処理である。意識的アクション発生頻度演算部41は、この処理を行うことで、意識的アクションを実行する頻度とその実行タイミングの制御を行う。
次に、意識的アクション種別選択部42の動作について説明する。
意識的アクション種別選択部42は、センサ11によって取得されるセンサ情報、アクション予測パラメータDB32に格納されているリアクション予測パラメータ、及び、前述のアクション発生フラグを入力とする。そして、意識的アクション種別選択部42は、意識的アクションの制御情報を、結果アクションDB31から読み出して出力とする。
ここで図9及び図10について説明する。図9は、意識的アクション種別選択部42の機能ブロック図であり、図10は、意識的アクション種別選択部42によって行われる、意識的アクション種別選択処理の処理手順を図解したフローチャートである。
図9に図解されているように、意識的アクション種別選択部42は、センサ情報相関計算部51、センサ情報相関期待値算出部52、距離計算部53、及び意識的アクション選択部54を備えている。
以下、図10のフローチャートで図解されている処理手順に従って、意識的アクション種別選択部42の各構成要素の動作を説明する。
まず、S301において、意識的アクションDB33に格納されている全ての意識的アクションについてのセンサ情報相関値Riを算出する処理をセンサ情報相関計算部51が行う。
センサ情報相関値とは、意識的アクションのリアクション予測パラメータ(期待リアクション)と、センサ11によってこの時点で取得されているセンサ情報(現実リアクション)との相関の高さを表す指標である。センサ情報相関計算部51は、リアクション予測適応部21においても行われていた、この両者の正規化相互相関を与える前掲の[数6]式の計算を行うことによって、このセンサ情報相関値を算出する。なお、このセンサ情報相関値をリアクション予測適応部21において行うようにしてもよい。
次に、S302において、前述したセンサ情報相関期待値Rdの算出処理をセンサ情報相関期待値算出部52が行う。
すなわち、センサ情報相関期待値算出部52は、まず、意識的アクションの実行開始からの経過時間に応じて前掲した[数8]式の計算を行って、センサ情報相関期待値Rdを算出する。更に、センサ情報相関期待値算出部52は、算出したセンサ情報相関期待値Rdに対して、リアクション予測適応部21から通知されるリアクションの判定結果に基づき、前述した所定値rp の加算若しくは所定値rm の減算を行う。
次に、S303において、意識的アクションDB33に格納されている全ての意識的アクションのセンサ情報相関値Riについての、S302の処理で算出されたセンサ情報相関期待値Rdとの距離を算出する処理を距離計算部53が行う。
すなわち、距離計算部53は、センサ情報相関計算部51により算出された、全ての意識的アクションについてのセンサ情報相関値Riと、センサ情報相関期待値算出部52によるセンサ情報相関期待値Rdとの距離を算出する。意識的アクションxについてのセンサ情報相関値Ri(x)と、センサ情報相関期待値Rdとの距離D(x)は、下記の[数12]式の計算を行うことによって算出される。
Figure 0005927797
意識的アクション選択部54は、距離計算部53により意識的アクション毎に算出された距離に基づいて、ロボット装置1に次に実行させる意識的アクションを意識的アクションDB33から選択して、ロボット装置1に実行させる。そのために、以下のS304からS307にかけての処理を行う。
まず、S304において、意識的アクション選択部54は、距離計算部53により意識的アクション毎に算出された距離に基づき、意識的アクションDB33に格納されている全ての意識的アクションについての選択確率を算出する処理を行う。
このために、意識的アクション選択部54は、まず、下記の[数13]式の計算を行って、意識的アクションxについての選択頻度F(x)の算出を、意識的アクションDB33に格納されている全ての意識的アクションについて行う。
Figure 0005927797
次に、意識的アクション選択部54は、下記の[数14]式の計算を行って、全ての意識的アクションに対する、意識的アクションxについての選択確率P(x)の算出を行う。
Figure 0005927797
なお、[数14]式において、Nは、意識的アクションDB33に制御情報が格納されている意識的アクションの個数である。
次に、S305において、意識的アクション選択部54は、意識的アクション発生頻度演算部41が意識的アクション発生確率に応じて出力したアクション発生フラグを受け取ったか否かを判定する処理を行う。ここで、意識的アクション選択部54は、アクション発生フラグを受け取ったと判定したとき(判定結果がYesのとき)にはS306に処理を進める。一方、意識的アクション選択部54は、ここで、アクション発生フラグを受け取っていないと判定したとき(判定結果がNoのとき)には、次の意識的アクションをロボット装置1に行わせることなくS301へ処理を戻して、上述した処理を繰り返す。
次に、S306では、意識的アクション選択部54は、意識的アクションDB33に制御情報が格納されている意識的アクションのうちの1つを、S304の処理により算出された選択確率に従って選択する処理を行う。
次に、S307では、意識的アクション選択部54は、S306の処理により選択された意識的アクションをロボット装置1に実行させる処理を行う。このために、意識的アクション選択部54は、選択された意識的アクションについての制御情報を意識的アクションDB33から読み出してアクション選択部24を介してロボット装置1に送付する。
その後、意識的アクション選択部54は、S307の処理を終えると、S301へ処理を戻して上述した処理を繰り返す。
以上の意識的アクション選択部54による次の意識的アクションの選択動作について、更に説明する。
前掲した[数13]式及び[数14]式より、意識的アクションxについての選択確率P(x)は、距離D(x)が短いほど高くなることが分かる。また、[数12]式より、距離D(x)が短くなる場合とは、センサ情報相関期待値Rdとセンサ情報相関値Ri(x)とが近い場合であることが分かる。
ここで、センサ情報相関期待値Rdが1.0に近い場合において距離D(x)が短くなるのは、センサ情報相関値Ri(x)も1.0に近い場合である。この場合とは、すなわち、意識的アクションDB33に格納されている意識的アクションxのリアクション予測パラメータと、センサ11によってこの時点で取得されているセンサ情報との相関が高い場合である。従って、センサ情報相関期待値Rdが1.0に近い場合には、リアクション予測パラメータと、センサ11によってこの時点で取得されているセンサ情報との相関が高い意識的アクションxが、高い選択確率で選択されて、ロボット装置1で実行される。
一方、センサ情報相関期待値Rdが0.0に近い場合では、距離D(x)が短くなるのは、センサ情報相関値Ri(x)も0.0に近い場合である。この場合とは、すなわち、意識的アクションDB33に格納されている意識的アクションxのリアクション予測パラメータと、センサ11によってこの時点で取得されているセンサ情報との相関が低い場合である。従って、センサ情報相関期待値Rdが0.0に近い場合には、リアクション予測パラメータと、センサ11によってこの時点で取得されているセンサ情報との相関が低い意識的アクションxが、高い確率で選択されて、ロボット装置1で実行される。
以上までの処理が意識的アクション種別選択処理である。
なお、前述した意識的アクション選択部54の動作では、ロボット装置1に次に行わせる意識的アクションの選択確率に基づく選択を、意識的アクションDB33に格納されている全ての意識的アクションから行うようにしていた。この代わりに、まず、意識的アクションDB33に格納されている全ての意識的アクションから、距離算出部53が算出した距離が短い順に所定数個を抽出する。そして、抽出された所定数個の意識的アクションから1つを選択する選択確率を当該距離に基づいて算出し、その算出された選択確率に従って意識的アクションを1つ選択するようにしてもよい。
意識的アクション種別選択部42の各部は以上のように動作する。この結果、前述したように、ユーザ2がロボット装置1とのインタラクションに熱中していて盛り上がっているときには、意識的アクション制御部23は、同じような現実リアクションが期待される意識的アクションをロボット装置1に実行させる。その一方で、ユーザ2がロボット装置1とのインタラクションの盛り上がりを感じられないような場合は、意識的アクション制御部23は、別の現実リアクションを引き出すような意識的アクションをロボット装置1に実行させる。
図3のロボットシステムのロボット制御装置20は、以上のように動作する。従って、ロボット装置1の意識的アクションに対し、開発者が当初想定していた期待リアクションと異なる現実リアクションをユーザ2が行っても、この現実リアクションが繰り返されると期待リアクションが更新されて現実リアクションに近づけられる。従って、開発者の意図とは異なっていても、ロボット装置1とユーザ2との間での良好なインタラクションの成立が可能になる。また、開発者が当初想定していた期待リアクションをユーザが行えないような場合(例えば、開発者が想定していた期待リアクションは“握手の要求”であったのに対し、ユーザ2が身体的理由のためロボット装置1に触れることが難しい場合など)が考えられる。このような場合でも、ユーザ2からの現実リアクション(例えば、“笑顔を見せて応える”など)を学習して期待リアクションを更新することで、ロボット装置1とユーザ2との間での良好なインタラクションの成立が可能になる。また、ユーザ2に適応した期待リアクションを用いることで、ロボット装置1が次に行う意識的アクションとして、ロボット装置1側で期待するリアクションをユーザ2に行ってもらうことができるような意識的アクションを選択することも可能になる。
なお、前述の説明では、アクション予測適応部21によるリアクション判定処理(図5のS106)において、現実リアクションと、それまでの現実リアクションに応じて更新された期待リアクションとの相関の高さに基づいて両アクションの一致判定を行っていた。ここで、このリアクション判定処理における一致判定を、更に、現実リアクションと、期待リアクションの初期値(現実リアクションに応じた更新を行わない固定値)との相関の高さにも基づいて行うようにしてもよい。そして、このようにする場合には、2つの一致判定のうちの少なくとも一方が一致した場合には、その判定結果を一致とし、2つの一致判定の両方ともが不一致の場合には、その判定結果を不一致とする。
より具体的には、図5に処理手順を図解した予測適応処理におけるS108の処理の直前に、図11に図解したS401の処理を挿入して、このS401の処理を、アクション予測適応部21が更に行うようにする。
すなわち、図5のS106の処理において、現実リアクションが期待リアクションとは不一致であるとの判定を下したときには、アクション予測適応部21は、図11のS401に処理を進める。なお、この場合には、アクション予測適応部21は、このS106の判定結果の結果アクション制御部22及び意識的アクション制御部23への通知は行わない。
そして、S401において、初期値とのリアクション判定処理をリアクション予測適応部21が行う。
この処理では、まず、図5のS102の処理でロボット装置1に実行させた意識的アクションについてのリアクション予測パラメータの初期値と、センサ11により得られたセンサ情報sとの相関の高さの算出が、図5のS106の処理と同様にして行われる。そして、算出された正規化相互相関値Rと、S105の処理で設定された相関閾値Thとの大小比較が行われる。ここで、リアクション予測適応部21は、正規化相互相関値Rが相関閾値Th以上であるときには、現実リアクションが期待リアクションに一致しているとの判定を下し、この判定結果を結果アクション制御部22に伝えてS107に処理を進める。一方、リアクション予測適応部21は、ここで、正規化相互相関値Rが相関閾値Th未満であるときには、現実リアクションは期待リアクションとは不一致であるとの判定を下し、この判定結果を結果アクション制御部22に伝えてS108に処理を進める。なお、リアクション予測適応部21は、このリアクションの判定結果を、意識的アクション制御部23にも通知する。
以上の処理をアクション予測適応部21が行うようにすると、現実リアクションが更新後の期待リアクションと異なっていても、開発者が当初想定していたものと一致すれば、好意的な感情を表現している結果リアクションをロボット装置1に実行させるようになる。従って、ロボット装置1とユーザ2との間での良好なインタラクションの成立が可能になる。
なお、図1に図解したロボット制御装置10や図3に図解したロボット制御装置20を、標準的な構成のコンピュータを用いて構成してもよい。
ここで図12について説明する。図12には、コンピュータの構成の一例が図解されている。
このコンピュータ60は、MPU61、ROM62、RAM63、ハードディスク装置64、入力装置65、表示装置66、インタフェース装置67、及び記録媒体駆動装置68を備えている。なお、これらの構成要素はバスライン69を介して接続されており、MPU61の管理の下で各種のデータを相互に授受することができる。
MPU(Micro Processing Unit)61は、このコンピュータ60全体の動作を制御する演算処理装置である。
ROM(Read Only Memory)62は、所定の基本制御プログラムが予め記録されている読み出し専用半導体メモリである。MPU61は、この基本制御プログラムをコンピュータ60の起動時に読み出して実行することにより、このコンピュータ60の各構成要素の動作制御が可能になる。
RAM(Random Access Memory)63は、MPU61が各種の制御プログラムを実行する際に、必要に応じて作業用記憶領域として使用する、随時書き込み読み出し可能な半導体メモリである。
ハードディスク装置64は、MPU61によって実行される各種の制御プログラムや各種のデータを記憶しておく記憶装置である。MPU61は、ハードディスク装置64に記憶されている所定の制御プログラムを読み出して実行することにより、各種の制御処理を行えるようになる。
入力装置65は、例えばキーボード装置やマウス装置であり、例えば図1や図3のロボットシステムの管理者により操作されると、その操作内容に対応付けられている管理者からの各種情報の入力を取得し、取得した入力情報をMPU61に送付する。
表示装置66は例えば液晶ディスプレイであり、MPU61から送付される表示データに応じて各種のテキストや画像を表示する。
インタフェース装置67は、このコンピュータ60に接続される各種機器との間での各種情報の授受の管理を行う。
記録媒体駆動装置68は、可搬型記録媒体70に記録されている各種の制御プログラムやデータの読み出しを行う装置である。MPU61は、可搬型記録媒体70に記録されている所定の制御プログラムを、記録媒体駆動装置68を介して読み出して実行することによって、後述する各種の制御処理を行うようにすることもできる。なお、可搬型記録媒体70としては、例えばCD−ROM(Compact Disc Read Only Memory)やDVD−ROM(Digital Versatile Disc Read Only Memory)、USB(Universal Serial Bus)規格のコネクタが備えられているフラッシュメモリなどがある。
このようなコンピュータ60を用いて図1や図3のロボット制御装置10及び20を構成するには、例えば、これらを構成している各構成要素において行われる前述した各種の処理をMPU61に行わせるための制御プログラムを作成する。作成された制御プログラムはハードディスク装置64若しくは可搬型記録媒体70に予め格納しておく。また、このプログラムでは、例えば、ハードディスク装置64を、記憶部16、結果アクションDB31、アクション予測パラメータDB32、及び意識的アクションDB33などとして機能させるようにしておく。また、コンピュータ60のインタフェース装置67にはセンサ11を接続して、センサ11から出力されるセンサ情報をコンピュータ40に取り込めるようにしておく。更に、このインタフェース装置67にはロボット装置1を接続して、コンピュータ60から制御情報を送付することで各種の意識的アクションや結果アクションをロボット装置1が実行できるようにしておく。そして、MPU61に所定の指示を与えてこの制御プログラムを読み出させて実行させる。こうすることで、図1や図3のロボット制御装置10及び20を構成している各構成要素が有している機能のコンピュータ60での提供が可能となり、コンピュータ60をロボット制御装置10及び20として機能させることができるようになる。
1 ロボット装置
2 ユーザ
10、20 ロボット制御装置
11 センサ
12 第一行動制御部
13 適応部
14 相関検出部
15 第二行動制御部
16 記憶部
17 第三行動制御部
21 リアクション予測適応部
22 結果アクション制御部
23 意識的アクション制御部
24 アクション選択部
31 結果アクションDB
32 アクション予測パラメータDB
33 意識的アクションDB
41 意識的アクション発生頻度演算部
42 意識的アクション種別選択部42
51 センサ情報相関計算部
52 センサ情報相関期待値算出部
53 距離計算部
54 意識的アクション選択部
60 コンピュータ
61 MPU
62 ROM
63 RAM
64 ハードディスク装置
65 入力装置
66 表示装置
67 インタフェース装置
68 記録媒体駆動装置
69 バスライン
70 可搬型記録媒体

Claims (11)

  1. ロボット装置の行動制御を行うロボット制御装置であって、
    ユーザの現実の反応に対応する物理量を検出するセンサ、
    前記ロボット装置による前記ユーザへ働きかける行動である意識的アクションを前記ロボット装置に行わせる第一行動制御部、
    前記意識的アクションに対して前記ユーザに期待されていた反応を、前記第一行動制御部が前記ロボット装置に行わせた前記意識的アクションに伴って前記センサにより検出された前記物理量に基づいて適応させる適応部、
    前記意識的アクションに対して期待されていた前記反応と前記第一行動制御部が前記ロボット装置に行わせた前記意識的アクションに伴って検出された前記物理量との相関の高さを検出する相関検出部、及び
    前記ロボット装置による行動である結果アクションであって前記意識的アクションに対応付けられている該結果アクションから前記相関検出部による前記相関の高さの検出結果に応じた結果アクションを選択して前記ロボット装置に行わせる第二行動制御部、
    を備えることを特徴とするロボット制御装置。
  2. 前記適応部は、前記意識的アクションに対する過去の適応の結果と前記第一行動制御部が前記ロボット装置に新たに行わせた前記意識的アクションに伴って検出された前記物理量との重み付け加算によって、前記適応を行うことを特徴とする請求項1に記載のロボット制御装置。
  3. 前記ユーザは複数であり、
    前記ロボット制御装置は、前記ユーザ毎に前記ロボット装置により行われる行動と該行動に対する前記適応の結果とを対応付けて記憶する記憶部を更に備え、
    前記適応部は、前記センサによる前記物理量の検出対象であるユーザ、及び、前記ロボット装置が行った前記意識的アクションに対応付けて前記記憶部に記憶されている前記適応の結果を用いて、前記適応を行う、
    ことを特徴とする請求項1又は2に記載のロボット制御装置。
  4. 前記相関検出部による前記相関の高さの検出結果に基づいて、前記ロボット装置に次に行わせる意識的アクションである新規意識的アクションを決定し、該決定された新規意識的アクションを該ロボット装置に行わせる第三行動制御部を更に備え、
    前記適応部は、更に、前記新規意識的アクションに対して前記ユーザに期待されていた反応を、前記第三行動制御部が前記ロボット装置に行わせた前記新規意識的アクションに伴って前記センサにより検出された前記物理量に基づいて適応させる、
    ことを特徴とする請求項1又は2に記載のロボット制御装置。
  5. 前記第三行動制御部は、前記センサによる前記物理量の検出値が所定値以上となる単位時間当たりの頻度に応じた頻度で、前記新規意識的アクションを前記ロボット装置に行わせることを特徴とする請求項4に記載のロボット制御装置。
  6. 前記ロボット装置により行われる行動と該行動に対する前記適応の結果とを対応付けて記憶する記憶部を更に備え、
    前記相関検出部は、更に、前記記憶部に記憶されている前記適応の結果の各々と前記意識的アクションに対して期待されていた前記反応との相関の高さを検出し、
    前記第三行動制御部は、前記意識的アクションについての前記相関の高さの検出結果が所定の閾値よりも高い相関を表している場合には、該検出結果が該所定の閾値よりも低い相関を表している場合よりも高い確率で、前記記憶部に記憶されている前記ロボット装置により行われる行動のうちから該行動に対する前記適応の結果と前記意識的アクションに対して期待されていた前記反応との相関の高さが高い行動を選択して、前記新規意識的アクションに決定する、
    ことを特徴とする請求項4又は5に記載のロボット制御装置。
  7. 前記相関検出部は、更に、前記ロボット装置により行われる行動に対して予め設定されている前記ユーザに期待されていた反応の初期値と該ユーザの現実の反応との相関の高さを検出し、
    前記第二行動制御部は、前記意識的アクションに対応付けられている前記結果アクションのうちから、前記期待されていた反応と前記現実の反応との相関の高さと、前記期待されていた反応の初期値と前記現実の反応との相関の高さとのうちの高い相関を表しているものに応じた結果アクションを選択して前記ロボット装置に行わせる、
    ことを特徴とする請求項1から6のうちのいずれか一項に記載のロボット制御装置。
  8. 前記第二行動制御部は、前記結果アクションの選択を、更に、前記センサによる前記物理量の検出値が所定値以上となる単位時間当たりの頻度にも応じて行うことを特徴とする請求項1から7のうちのいずれか一項に記載のロボット制御装置。
  9. ロボット装置と、
    前記ロボット装置の行動制御を行う、請求項1から8に記載のロボット制御装置と、
    を備えることを特徴とするロボットシステム。
  10. ロボット装置の行動の制御方法であって、
    前記ロボット装置によるユーザへ働きかける行動である意識的アクションを前記ロボット装置に行わせ、
    前記ユーザの現実の反応に対応する物理量を検出するセンサにより、前記ロボット装置に行わせた前記意識的アクションに伴って検出された物理量に基づいて、前記意識的アクションに対して該ユーザに期待されていた反応を適応させ、
    前記意識的アクションに対して期待されていた前記反応と前記ロボット装置に行わせた前記意識的アクションに伴って検出された前記物理量との相関の高さを検出し、
    前記ロボット装置による行動である結果アクションであって前記意識的アクションに対応付けられている該結果アクションから前記相関の高さの検出結果に応じた結果アクションを選択して前記ロボット装置に行わせる、
    ことを特徴とするロボット装置の行動制御方法。
  11. ロボット装置の行動の制御をコンピュータに実行させるプログラムであって、
    前記ロボット装置によるユーザへ働きかける行動である意識的アクションを前記ロボット装置に行わせ、
    前記ユーザの現実の反応に対応する物理量を検出するセンサにより、前記ロボット装置に行わせた前記意識的アクションに伴って検出された物理量に基づいて、前記意識的アクションに対して該ユーザに期待されていた反応を適応させ、
    前記意識的アクションに対して期待されていた前記反応と前記ロボット装置に行わせた前記意識的アクションに伴って検出された前記物理量との相関の高さを検出し、
    前記ロボット装置による行動である結果アクションであって前記意識的アクションに対応付けられている該結果アクションから前記相関の高さの検出結果に応じた結果アクションを選択して前記ロボット装置に行わせる、
    処理を前記コンピュータに実行させるプログラム。
JP2011163517A 2011-07-26 2011-07-26 ロボット制御装置、ロボットシステム、ロボット装置の行動制御方法、及びプログラム Expired - Fee Related JP5927797B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011163517A JP5927797B2 (ja) 2011-07-26 2011-07-26 ロボット制御装置、ロボットシステム、ロボット装置の行動制御方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011163517A JP5927797B2 (ja) 2011-07-26 2011-07-26 ロボット制御装置、ロボットシステム、ロボット装置の行動制御方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2013027937A JP2013027937A (ja) 2013-02-07
JP5927797B2 true JP5927797B2 (ja) 2016-06-01

Family

ID=47785511

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011163517A Expired - Fee Related JP5927797B2 (ja) 2011-07-26 2011-07-26 ロボット制御装置、ロボットシステム、ロボット装置の行動制御方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP5927797B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6053847B2 (ja) * 2014-06-05 2016-12-27 Cocoro Sb株式会社 行動制御システム、システム及びプログラム
WO2016132729A1 (ja) * 2015-02-17 2016-08-25 日本電気株式会社 ロボット制御装置、ロボット、ロボット制御方法およびプログラム記録媒体
WO2017169826A1 (ja) 2016-03-28 2017-10-05 Groove X株式会社 お出迎え行動する自律行動型ロボット

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003340760A (ja) * 2002-05-20 2003-12-02 Sony Corp ロボット装置およびロボット制御方法、記録媒体、並びにプログラム
JP2005238422A (ja) * 2004-02-27 2005-09-08 Sony Corp ロボット装置、並びにその状態遷移モデル構築方法及び行動制御方法
KR20110002757A (ko) * 2009-07-02 2011-01-10 삼성전자주식회사 감성 모델 장치, 감성 모델의 성향 학습 장치 및 방법

Also Published As

Publication number Publication date
JP2013027937A (ja) 2013-02-07

Similar Documents

Publication Publication Date Title
US20190347566A1 (en) Predictive controller for applications
CN103445793B (zh) 通过人机接口来估计认知负荷的方法和对话***
US11580378B2 (en) Reinforcement learning for concurrent actions
EP3647936B1 (en) Electronic apparatus and control method thereof
GB2571199A (en) Method and system for training a chatbot
WO2015200153A1 (en) Leveraging user signals for initiating communications
JP7125539B2 (ja) ゲーム内リソースサーフェシングプラットフォーム
KR20120047577A (ko) 대화형 행동모델을 이용한 로봇 인터랙션 서비스 제공 장치 및 방법
US11115359B2 (en) Method and apparatus for importance filtering a plurality of messages
CN111656757A (zh) 电子设备和用于控制电子设备的方法
WO2018006378A1 (zh) 智能机器人控制***、方法及智能机器人
KR20180109633A (ko) 음성 인식 서비스 운용 방법, 이를 지원하는 전자 장치 및 시스템
JP7031603B2 (ja) 情報処理装置及び情報処理方法
US10665032B2 (en) Real-time motion feedback for extended reality
JP5927797B2 (ja) ロボット制御装置、ロボットシステム、ロボット装置の行動制御方法、及びプログラム
KR102396794B1 (ko) 전자 장치 및 이의 제어 방법
KR20190105175A (ko) 전자 장치 및 이의 자연어 생성 방법
KR20180049791A (ko) 복수 개의 메시지들을 필터링하는 방법 및 이를 위한 장치
US9827498B2 (en) Dynamic gaming experience adjustments
US9324245B2 (en) Apparatus and method for creating artificial feelings
CN113934295A (zh) 宠物机器人的养成方法、***及存储介质
EP3828884A1 (en) Electronic apparatus and control method thereof
CN117112742A (zh) 一种对话模型优化方法、装置、计算机设备和存储介质
EP3663986A1 (en) Simulated human-like affect-driven behavior by a virtual agent
KR20100070773A (ko) 성격 변화 장치 및 그 방법과, 그를 이용한 행동 다양화 장치 및 그 방법과, 그 로봇 시스템

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140404

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150203

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150303

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150609

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150806

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160119

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160307

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160329

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160411

R150 Certificate of patent or registration of utility model

Ref document number: 5927797

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees