WO2001070468A1

WO2001070468A1 - Determination de l'action d'un robot et robot

Info

Publication number: WO2001070468A1
Application number: PCT/JP2001/002419
Authority: WO
Inventors: Tsuyoshi Takagi; Masahiro Fujita; Rika Hasegawa; Kotaro Sabe; Craig Ronald Arkin
Original assignee: Sony Corporation
Priority date: 2000-03-24
Filing date: 2001-03-26
Publication date: 2001-09-27
Also published as: US6650965B2; EP1247624A1; US20020156751A1; CN1372506A; KR20020026165A

Description

明細書ロボット装置の行動決定方法及びロポット装置技術分野本発明は、ロボット装置の行動決定方法及びロボット装置に関し、特に、自律的に行動するロボット装置及びそのようなロボット装置の行動を決定するロボット装置の行動決定方法に関する。背景技術近年、動物を摸した形状とされたロボヅト装置、いわゆるぺヅトロボヅトが提案されている。このようなロボット装置は、一般家庭において飼育される犬や猫に似た形状を有し、ユーザ（飼い主）からの「叩く」や「撫でる」といった働きかけや、周囲の環境等に応じて自律的に行動する。例えば、自律的な行動として、実際の動物と同様に、「吠える」、「寝る」等といった行動をする。

ところで、ロボット装置が実際の動物のような行動に、より近づくことができれば、ロボット装置の生物感が一層増し、ュ一ザ（飼い主）は、ロボット装置に一層の親近感や満足感を感じる。これにより、ロボヅト装置のアミューズメント性が向上する。

例えば、実際の動物のような行動に行動をさせるものとして、動物行動学的なアプローチからロボット装置の行動決定をするようなことが考えられる。

動物行動的なアプローチからなされた行動研究の成果として、例えば、物行動学者の Sibly, Mcfarland らが動機付け空間表象の状態を 1975年に論文で発表している（ "動物コミュニケーション" 西村書店）。また、 Ludlowは、 1976年に行動の競合モデルについて発表している。そして、これらの成果を Bruce Mitchel l B lumberg (Bruce of Arts, Amherst Col lege, 1977, Master of Siencs, Sloan School of Management, MIT, 1981 ) が「01d Tricks, New Dogs : Ethology and Interactive Creatures」（1997年 4月）【こおレヽて検証してヽる。 Bruce Mitchel l Blumbergは、 3 0の0 0 (コンピュータグラフイク）の犬に対して上述した理論を適用し、行動選択メカニズムとして検証している。

ところで、 Bruce Mitchel l Blumbergは、 C Gモデルにて動物の行動選択メカ二ズムについて検証しており、実世界で存在するロボヅト装置に適応したものではない。

C Gなどのコンピュータシステムのディスプレイ等に表示される仮想生物では、行動選択と行動実現とを直接結びつけること（行動選択 =行動実現）が可能であるため、行動の選択による動機へのフィードバックが可能であるが、実際のロボットでは、行動選択と行動実現とを直接結びつけることができるとは限らない (すなわち、行動選択 =行動実現となるとは限らない）。これは、以下のようなことが理由として挙げられる。

反射行動などの計画された行動とは無関係に実行される行動によって、打ち消される可能性がある。

センサからの入力のフィ一ドバヅクを使用しないと、行動が真の意味で実現できたか分からない場合がある。

■ このような理由において後者の具体的な例としては "足でボ一ルを蹴る"の行動を、ボールとの距離が蹴ることが可能な距離に到達した時点で行動が選択され、行動命令が出力されたとしても、ボールが置かれているところに傾斜があったりすると、蹴れない場合が存在する。 "足でボールを蹴る"の行動結果としての"ボールを蹴れた" を認識するためには、ボールとロボット装置が接触し、ボールが前方に進んだことを認識して、初めて "蹴れた" とできるのである。すなわち、ロボット装置が有するセンサのセンサ情報を使用して行動に対する評価を行い、ロボット装置の内部状態を変化させることが必要になる。

このように、上述したような Bruce Mitchel l Blumbergが提唱する技術だけでは、実世界での存在であるロボツト装置の行動を決定することは不可能である。発明の開示本発明は、上述の実情に鑑みてなされたものであり、より生物感が向上されたロボット装置及びロボット装置の行動決定方法の提供を目的としている。

本発明に係るロボット装置は、上述の課題を解決するために、動作部を制御して行動を出現させるロボット装置であって、外部又は内部情報を検出する検出手段と、検出手段が検出した外部又は内部情報であって、行動に影響する情報とされる原因因子を取得する原因因子取得手段と、原因因子取得手段が取得した原因因子に基づいて、当該原因因子に影響される行動の出現傾向を取得する出現傾向取得手段と、出現傾向取得手段が取得した 2つ以上の行動に対応する出現傾向であって、同一グループとされる出現傾向を比較する出現傾向比較手段と、出現傾向比較手段による出現傾向の比較結果に基づいて、一の行動を選択する行動選択手段と、行動選択手段が選択した行動に基づいて、動作部を制御して、当該選択された行動を出現させる動作部制御手段とを備え、行動選択手段が選択した一の行動の出現傾向が、当該行動の実際の出現により変化する原因因子に応じて変化する。

このような構成を備えたロボット装置は、外部又は内部情報を検出手段により検出し、検出手段が検出した外部又は内部情報であって、行動に影響する情報とされる原因因子を原因因子取得手段により取得し、原因因子取得手段が取得した原因因子に基づいて、当該原因因子に影響される行動の出現傾向を出現傾向取得手段により取得する。

' そして、ロボット装置は、出現傾向取得手段が取得した 2つ以上の行動に対応する出現傾向であって、同一グループとされる出現傾向を出現傾向比較手段により比較し、出現傾向比較手段による出現傾向の比較結果に基づいて、一の行動を行動選択手段により選択し、行動選択手段が選択した行動に基づいて、動作部を動作部制御手段により制御して、当該選択された行動を出現させる。そして、行動選択手段が選択した一の行動の出現傾向は、当該行動の実際の出現により変化する原因因子に応じて変化する。

このようなロボット装置は、原因因子に影響されて決定される出現傾向について比較することで、一の行動を選択しており、動物行動学的なアプローチとしての行動を出現するようになる。また、本発明に係るロボット装置の行動決定方法は、上述の課題を解決するために、ロボット装置の外部又は内部情報を検出手段により検出する情報検出工程と、情報検出工程にて検出した外部又は内部情報のロボット装置の行動に影響する情報とされる原因因子を取得する原因因子取得工程と、原因因子取得工程にて取得した原因因子に基づいて、当該原因因子に影響される行動の出現傾向を取得する出現傾向取得工程と、出現傾向取得工程にて取得した 2つ以上の行動に対応する出現傾向であって、同一グループとされる出現傾向を比較する出現傾向比較工程と、出現傾向比較工程における出現傾向の比較結果に基づいて、一の行動を選択する行動選択工程と、行動選択工程にて選択された行動に基づいて、ロボット装置の動作部を制御して、当該ロボット装置に選択された行動を出現させる動作部制御工程とを有し、行動選択工程にて選択された一の行動の出現傾向が、当該行働の実際の出現により変化する原因因子に応じて変化する。 .

このようなロボヅト装置の行動決定方法は、ロボット装置の外部又は内部の情報とされる外部又は内部情報を情報検出工程にて検出手段により検出し、情報検出工程にて検出した外部又は内部情報のロボット装置の行動に影響する情報とされる原因因子を原因因子取得工程にて取得し、原因因子取得工程にて取得した原因因子に基づいて、当該原因因子に影響される行動の出現傾向を出現傾向取得ェ程にて取得する。

そして、ロボット装置の行動決定方法は、出現傾向取得工程にて取得した 2つ以上の行動に対応する出現傾向であって、同一グループとされる出現傾向を出現傾向比較工程にて比較し、出現傾向比較工程における出現傾向の比較結果に基づいて、一の行動を行動選択工程にて選択し、行動選択工程にて選択された行動に基づいて、ロボット装置の動作部を動作部制御工程にて制御して、当該ロボット装置に選択された行動を出現させる。そして、行動選択工程にて選択された一の行動の出現傾向は、当該行動の実際の出現により変化する原因因子に応じて変化する。

このようなロボット装置の行動決定方法により、ロボット装置は、原因因子に影響されて決定される出現傾向について比較することで、一の行動を選択しており、動物行動学的なアプローチとしての行動を出現するようになる。図面の簡単な説明図 1は、本発明の実施の形態であるロポツト装置の外観構成を示す斜視図である。

図 2は、上述のロボヅト装置の回路構成を示すプロック図である。

図 3は、上述のロボヅト装置のソフトウエア構造を示すプロヅク図である。図 4は、上述のロボヅト装置のソフトウエアのミドル ' ウェア · レイヤの構成を示すプロヅクである。

図 5は、上行動決定システムの構成を示すプロック図である。

図 6 A，図 6 Bは、上記動物行動学的なアプローチによる行動決定をするロボット装置を説明するために使用した図である。

図 7は、行動選択部における構築された、複数の行動が階層構造とされた行動選システムを示す図である。

図 8は、上述の行動決定システムを構成する各部の機能を説明するために使用した前半の図である。 ·

. 図 9は、上述の行動決定システムを構成する各部の機能を説明するために使用した後半の図である。

図 1 0は、動物行動学的なァプロ一チによって、知覚及び動機により行動を決定する場合について説明するために使用したプロック図である。

図 1 1 A〜図 1 1 Cは、原因因子によって構成される原因因子状態空間と、原因因子状態空間により規定された行動の出現傾向が写像される出現傾向空間とを示す特性図である。

図 1 2は、因因子状態空間を説明するために使用した図である。

図 1 3 A , 図 1 3 Bは、動物行動学的なアプローチを数式化する説明に使用した摂食行動及び摂氷行動の原因因子状態空間を示す特性図である。

図 1 4は、動物行動学的なアプローチを数式化する説明に使用した摂食傾向と摂食傾向とから構成される出現傾向空間を示す特性図である。

図 1 5 Aは原因因子状態空間から写像された値が摂食行動選択領域にある場合を、図 1 5 Bは原因因子状態空間から写像された値が摂水行動選択領域にある場合をそれぞれ示す特性図である。

図 1 6は、排他制御を説明するために使用した図である。

図 1 7は、動物行動学的なアプローチによる計算式によって実現される行動の選択を説明するために使用した出現傾向空間を示す特性図である。

図 1 8は、ロボット装置の実際の処理による行動の選択を説明するために使用した出現傾向空間を示す特性図である。

図 1 9は、行動選択部を構成する知覚情報取得部と、動機情報取得部と、行動情報選択部との間の情報の流れを示すブロック図である。

図 2 0は、排他制御前の出現傾向の算出を説明するために使用した図である。図 2 1は、排他制御によるの出現傾向の算出を説明するために使用した図である。

図 2 2は、出現傾向の算出手順を示すフローチヤ一トである。

図 2 3は、知覚情報取得部の構成を示すブロック図である。

図 2 4は、上述の知覚情報取得部における処理手順を示すフローチャートである。

図 2 5は、動機情報取得部を説明するために使用した図である。

図 2 6 A , 図 2 6 Bは、ロボット装置の他の実施の形態であって、階層構造とされた行動選択システムにおいて下位層における行動の選択が動機によって影響されない場合を説明するために使用した図である。

図 2 7は、上述の他の実施の形態のロボット装置の行動選択演算部及び動作生成部の機能を説明するために使用した図である。

図 2 8は、上述の他の実際の形態のロボット装置の行動決定システムの構成を示すプロック図である。

図 2 9は、動作生成部の構成を示すブロック図である。

図 3 0は、オブジェクトとされた複数の行動選択部を示すプロツク図である。図 3 1は、サブシステム層、モード層、モジュール層における各行動グループ構成の前半の具体例を示す図である。

図 3 2は、サブシステム層、モード層、モジュール層における各行動グループ構成の後半の具体例を示す図である。発明を実施するための最良の形態以下、本発明の実施の形態について図面を用いて詳しく説明する。この実施の形態は、本発明を、外的要因及び内的要因に基づいて本能及び感情の状態を変化させて、この本能及び感情の状態に応じて行動をするロボット装置に適用したものである。

実施の形態では、先ず、ロボヅト装置の構成について説明して、その後、ロボット装置における本発明の適用部分について詳細に説明する。

( 1 ) 本実施の形態によるロボット装置の構成

図 1に示すように、「犬」を模した形状のいわゆるぺットロボヅトとされ、胴体部ユニット 2の前後左右にそれそれ脚部ユニット 3 A， 3 B， 3 C， 3 Dが連結されると共に、胴体部ュニット 2の前端部及ぴ後端部にそれそれ頭部ュニット 4及び尻尾部ュニット 5が連結されて構成されている。

胴体部ユニット 2には、図 2に示すように、 C P U (Central Processing ノ Uni t) l 0、 D R A M ( Dynamic Random Access Memory) 1 1、フラヅシュ R O M (Read O nly Memory) 1 2、 P C (Personal Computer) カードイン夕一フエース回路 1 3及び信号処理回路 1 4が内部バス 1 5を介して相互に接続されることにより形成されたコントロール部 1 6と、このロボット装置 1の動力源としてのバヅテリ 1 7とが収納されている。また胴体部ユニット 2には、ロボヅト装置 1の向きや動きの加速度を検出するための角速度センサ 1 8及び加速度センサ 1 9なども収納されている。

また、頭部ュニヅト 4には、外部の状況を撮像するための C C D (Charge Coupled Devi ce) カメラ 2 0と、ユーザからの「撫でる」や「叩く」といった物理的な働きかけにより受けた圧力を検出するための夕ヅチセンサ 2 1と、前方に位置する物体までの距離を測定するための距離センサ 2 2と、外部音を集音するためのマイクロホン 2 3と、鳴き声等の音声を出力するためのスピーカ 2 4と、ロボヅト装置 1の「目」に相当する L E D (Light Emitting Diode) (図示せず）となどがそれそれ所定位置に配置されている。

さらに、各脚部ュニヅト 3 A〜 3 Dの関節部分や各脚部ュニット 3 A〜3 D及び胴体部ュニット 2の各連結部分、頭部ュニット 4及び胴体部ュニット 2の連結部分、並びに尻尾部ュニット 5の尻尾 5 Aの連結部分などにはそれそれ自由度数分のァクチユエ一夕 2 5 2 5₂， · · '及びポテンショメ一夕 2 6 ， 2 6₂, · · •が配設されている。例えば、ァクチユエ一夕 2 5 ^ 2 5 · ·はサーボモー夕を構成として有している。サーボモ一夕の駆動により、脚部ユニット 3 A〜 3 Dが制御されて、目標の姿勢或いは動作に遷移する。

そして、これら角速度センサ 1 8、加速度センサ 1 9、タヅチセンサ 2 1、距離センサ 2 2、マイクロホン 23、スピーカ 24及び各ポテンショメ一夕 2 6 2 6₂, · · 'などの各種センサ並びに LED及び各ァクチユエ一夕 2 5 2 5₂， • · ·は、. それそれ対応するハブ 27 〜 27„を介してコントロール部 1 6の信号処理回路 14と接続され、 C CDカメラ 20及びバッテリ.1 7は、それそれ信号処理回路 14と直接接続されている。

信号処理回路 14は、上述の各センサから供給されるセンサデ一夕や画像データ及び音声データを順次取り込み、これらをそれぞれ内部バス 1 5を介じて DR AM 1 1·内の所定位置に順次格納する。また信号処理回路 14は、 .これと共にバッテリ 1 7から供給されるバッテリ残量を表すバッテリ残量データを順次取り込み、これを DRAM 1 1内の所定位置に格納する。

このようにして DRAM 1 1に格納された各センサデータ、 '画像デ一夕、音声デ一夕及びバヅテリ残量デ一夕は、この後 CP U 1 0がこのロボヅト装置 1の動作制御を行う際に利用される。

実際上 CPU 1 0は、ロボット装置 1の電源が投入された初期時、胴体部ュニヅト 2の図示しない P C力一ドスロヅトに装填されたメモリカード 2 8又はフラヅシュ R OM 1 2に格納された制御プログラムを P Cカードィン夕'一フェース回路 1 3を介して又は直接読み出し、これを DRAM 1 1に格納する。

また、 CPU 1 0は、この後上述のように信号処理回路 14より D RAM 1 1 に順次格納される各センサデータ、画像データ、音声データ及びバッテリ残量デ一夕に基づいて自己及び周囲の状況や、ユーザからの指示及び働きかけの有無などを判断する。

さらに、 C P U 1 0は、この判断結果及び D R A M 1 1に格納しだ制御ブ nグラムに基づいて続く行動を決定すると共に、当該決定結果に基づいて必要なァクチユエ一夕 2 5 ^ 2 5 2， · · · を駆動させることにより、頭部ュニヅト 4を上下左右に振らせたり、尻尾部ユニット 5の尻尾 5 Aを動かせたり、各脚部ユニット 3 A〜 3 Dを駆動させて歩行させるなどの行動を行わせる。

またこの際 C P U 1 0は、必要に応じて音声デ一夕を生成し、これを信号処理 • 回路 1 4を介して音声信号としてスピーカ 2 4に与えることにより当該音声信号に基づく音声を外部に出力させたり、上述の L E Dを点灯、消灯又は点滅させる ₍ このようにしてこのロボヅト装置 1においては、自己及び周囲の状況や、ユーザからの指示及び働きかけに応じて自律的に行動し得るようになされている。

( 2 ) 制御プログラムのソフトウェア構成 .

ここでロボヅト装置 1 における上述の制御プログラムのソフトウエア構成は、図 3に示すようになる。この図 3において、デバイス · ドライバ · レイヤ 3 0は、この制御プログラムの最下位層に位置し、複数のデバイス · ドライバからなるデバイス · ドライバ .' セット 3 1から構成されている。この場合各デバイス ' ドラィバは、 C C Dカメラ 2 0 (図 2 ) やタイマ等の通常のコンピュータで用いられるハードウエアに直接アクセスするごとを許されたオブジェクトであり、対応するハードウエアからの割り込みを受けて処理を行う。

また、ロボティヅク · サ一バ · オブジェクト 3 2は、デバイス · ドライノ、 ' · レィャ 3 0の最下位層に位置し、例えば上述の各種センサゃァクチユエ一夕 2 5 2 5 ₂ , · · ·等のハードウェアにアクセスするためのイン夕一フェースを提供するソフトウェア群でなるバーチャル · ロボット 3 3と、電源の切り換えなどを管理するソフトウェア群でなるパワーマネージャ 3 4と、他の種々のデバイス - ドライバを管理するソフトウエア群でなるデバイス * ドライノ、' · マネージャ 3 5と、ロボヅト装置 1の機構を管理するソフトウエア群でなるデザインド · ロボット 3 6 とから構成されている。

マネージャ · オブジェクト 3 7は、オブジェクト · マネージャ 3 8及びサービス · マネージャ 3 9から構成されている。この場合オブジェクト 'マネージャ 3 8は、ロボティヅク · サーバ . オブジェクト 3 2、ミドル · ウェア . レイヤ 4 0 - 及びアプリケーション · レイヤ 4 1に含まれる各ソフトウエア群の起動や終了を管理するソフトウェア群であり、サービス · マネージャ 3 9は、メモリカード 2 8 (図 2 ) に格納されたコネクションファイルに記述されている各オブジェクト間の接続情報に基づいて各ォブジェクトの接続を管理するソフトウエア群である, ミドル · ウエア · レイヤ 4 0は、ロボティヅク · サ一バ · オブジェクト 3 2の上位層に位置し、画像処理や音声処理などのこのロボット装置 1の基本的な機能を提供するソフトウエア群から構成されている。また、アプリケーション · レイャ 4 1は、ミドル . ウェア . レイヤ 4 0の上位層に位置し、当該ミドル · ウェア - レイヤ 4 0を構成する各ソフトウヱァ群によって処理された処理結果に基づいてロボット装置 1の行動を決定するためのソフトウエア群から構成されている。なおミドル ' ウェア · レイヤ 4 0及びアプリケーション · レイヤ 4 1の具体なソフトウエア構成をそれそれ図 4に示す。

ミドル · ウェア · レイヤ 4 0においては、図 4に示すように、騒音検出用、温度検出用、明るさ検出用、音階認識用、距離検出用、姿勢検出用、タツチセンサ用、動き検出用及び色認識用の各信号処理モジュール 5 0〜 5· 8並びに入力セマンティクスコンバ一夕モジュール 5 9などを有する認識系 6 0と、出力セマンテイクスコンバータモジュール 6 8並びに姿勢管理用、トラッキング用、モーション再生用、歩行用、転倒復帰用、 L E D点灯用及び音再生用の各信号処理モジュール 6 1 '〜 6 7などを有する認識系 6 0とから構成されている。

認識系 6 0の各信号処理モジュール 5 0〜 5 8は、ロボティヅク · サーバ · ォブジェクト 3 2のバーチャル · ロボット 3 3により D R A M 1 1 (図 2 ) から読み出される各センサデータや画像データ及び音声データのうちの対応するデータを取り込み、当該データに基づいて所定の処理を施して、処理結果を入力セマンティクスコンバ一夕モジュール 5 9に与える。ここで、例えば、バーチャル . 口ボット 3 3は、所定の通信規約によって、信号の授受或いは変換をする部分として構成されている。

入力セマンティクスコンパ一夕モジュール 5 9は、これら各信号処理モジユール 5 0〜 5 8から与えられる処理結果に基づいて、「うるさい」、「暑い」、「明るい」、「ボールを検出した」、「転倒を検出した」、「撫でられた」、「叩かれた」、「ドミソの音階が聞こえた」、「動く物体を検出した」又は「障害物を検出した」などの自己及び周囲の状況や、ユーザからの指令及び働きかけを認識し、認識結果をアプリケーション ' レイヤ 4 1 (図 2 ) に出力する。なお、アプリケーション · レイヤ 4 1には、後述する行動決定のための行動決定システムが構築されている。

一方、出力系 6 9では、出力セマンティクスコンバータモジュール 6 8が、行動情報に基づいて、各信号処理モジュール 6 1 ~ 6 7を制御する。 .すなわち、例えば、認識系 6 0の認識結果に応じて、「うるさい」、「暑い」、「明るい」、「ボールを検出した」、「転倒を検出した」、「撫でられた」、「叩かれた」、「ドミソの音階が聞こえた」、「動く物体を検出した」又は「障害物を検出した」などの自己及び周囲の状況や、ユーザからの指令及び働きかけなどに対応して制御情報（コマンド）を各信号処理モジュール 6 ：！〜 6 7に出力する。

出力セマンティクスコンバ一夕モジュール 6 8に入力される行動情報は、「前進」、「喜ぶ」、「鳴く」又は「トラッキング（ボールを追いかける）」といつた抽象的な行動コマンドであって、出力セマンティクスコンバ夕モジュール 6 8は、それらの行動コマンドを対応する各信号処理モジュール 6 1〜 6 7に与える。そして、出力セマンティクスコンバータモジュール 6 8に入力される行動情報は、上位の情報処理部とされる行動決定システムからのものであるが、本発明に係る要部であり、後で詳述するところである。 '

そして、各信号処理モジュール 6 1〜 6 7は、出力セマンティクスコンバ一夕モジュール 6 8からの行動コマンドに基づいて、各デバイスを制御する制御信号を、バーチャル · ロボット 3 3に出力する。具体的には、信号処理モジュール 6 1〜 6 7は、行動コマンドが与えられると当該行動コマンドに基づいて、その行動を行うために対応するァクチユエ一夕 2 5 _{1 5} 2 5 ₂ , · · · (図 2 ) に与えるベきサーボ指令値や、スピーカ 2 4 (図 2 ) から出力する音の音声デ一夕及び又は「目」の L E Dに与える駆動データを生成し、これらのデ一夕をロボティヅク - サーバ ·オブジェクト 3 2のバ一チャルロボヅト 3 3及び信号処理回路 1 4 (図 2 ) を順次介して対応するァクチユエ一夕 2 5 ^ 2 5 ' ·又はスピー力 2 4 又は L E Dに順次送出する。

各デバイスがバーチャル · 口ボット 3 3からの信号（コマンド）に基づいて制御されることにより、口ポット装置 1により、所定の行動の出現がなされるようになる。

次に、入力セマンティクスコンバータモジュール 5 9からの認識結果に基づいて次の行動（遷移する行動或いは目的の行動）を決定し、当該決定した行動の情報を出力セマンティクスコンバ一夕モジュール 6 8に出力する行動決定システムについて説明する。 ·

( 3 ) ロボット装置の行動決定システムの構成

ロボツト装置 1は、図 5に示すような行動決定システム 7 0により行動を決定している。行動決定システム 7 0は、入力セマンティクスコンバ一タモジュール 5 9·からの認識結果に基づいて行動を決定し、その行動を出力セ.マンティクスコンバー夕モジュール 6 8に出力している。具体的には、ロボヅト装置 1は、行動選択部 8 0、内的状態モデル部 7 1及びモジユレ一夕 Ί 2を備えている。

行動選択部 8 0は、複数の行動から所望の行動を選択する。具体的には、行動選択部 8 0は、入力セマンティクスコンバータモジュール 5 9の認識結果に基づいて所望の行動を選択する。例えば、行動選択部 8 0は、知覚情報取得部 9 0、動機情報取得部 8 1及び行動選択演算部 8 2を備え、行動の選択をする。

このような行動決定システム 7 0において、知覚情報取得部 9 0及び動機情報取得部 8 1は、 C C Dカメラ 2 0、距離センサ 2 2、マイクロホン 2 3等の外部又は内部情報を検出する検出手段が検出した外部又は内部情報であって、行動に影響する情報とされる原因因子を取得する原因因子取得手段及び原因因子取得手段として取得した原因因子に基づいて、当該原因因子に影響される行動の出現傾向を取得する出現傾向取得手段を構成し、行動選択演算部 8 2は、知覚情報取得部 9 0及び動機情報取得部 8 1が取得した 2つ以上の行動に対応する出現傾向であって、同一グループとされる出現傾向を比較する出現傾向比較手段及び出現傾向比較手段による出現傾向の比較結果に基づいて、一の行動を選択する行動選択手段を構成し、出力セマンティクスコンバータモジュール 6 8は、行動選択演算部 8 2が選択した行動に基づいて、動作部を制御して、当該選択された行動を出現させる動作部制御手段を構成する。

ここで、行動選択部 8 0は、知覚情報取得部 9 0が認識結果から取得した知覚情報と、動機情報取得部 8 1が内的状態モデル部 7 1からの内.的状態情報から取得した動機情報とに基づいて、行動選択演算部 8 2において行動を選択する。この行動選択部 8 0については、後で詳述する。

—方、内的状態モデル部 7 1は、外的要因や内的要因に応じてロボット装置 1 の本能及び感情の状態（内的状態）を変化させる内部状態モデルを有している。ここで、外的要因とは、例えば、叩かれた情報、撫でられた情報、或いはユーザからの命令などである。また、内的要因は、バッテリ残量が少ないや体温が上昇しているなどの情報である。

具体的には、内的状態モデル部 7 1は、入力セマンティクスコンバータモジュール 5_ 9の認識結果に基づいて、内的状態を変化させており、 .内的状態の情報を行動選択部 8 0及びモジユレ一夕 7 2に出力している。

動機情報取得部 8 1では、この内的状態情報に基づいて動機情報を取得する。これについては、後で詳述する。

一方、モジユレ一夕 7 2は、最終的に出現させる行動情報（行動コマンド） .を生成する部分である。具体的には、モジユレ一夕 7 2は、行動選択部 8 0にて達択された行動と、内的状態モデル部 7 1からの内的状態の情報とから最終的に出現させる行動情報を生成し、出力セマンティクスコンパ一夕モジュール 6 8に出力する。

このモジュレーダ 7 2により、行動選択部 8 0により決定（選択）された行動に、内的状態モデル部 7 1により得られる本能や感情の状態を付加させたものとして、ロボット装置 1に行動を出現させることができるようになる。すなわち、例えば、行動選択部 8 0では認識結果等から次の行動どして「リンゴを食べる」といった行動が選択され、一方、内的状態モデル部 7 1では、認識結果により現在のロボヅト装置 1の内的状態として例えば「怒っている」が取得される。そして、モジユレ一夕 7 2では、それらの情報に基づいて、「リンゴを食べる」の行動に「怒っている」の内的状態を付加させて、「不機嫌にリンゴを食べる」の行動の情報を生成して、その情報を出力セマンティクスコンバ一夕モジュール 6 8 に出力する。出力セマンティクスコンパ一夕モジュ一ル 6 8は、各信号処理モジュ一ル ·6 1〜6 7に信号を送り、各デバイスを制御して動作部を制御するので、これにより、ロボヅト装置 1は、次の行動（目的の行動）として不機嫌にリンゴを食べる行動を出現させるようになる。

また、内的状態モデル部 7 1において生成される本能や感情の状態を示す内的状態情報にあっては、ロボット装置 1が行動を決定（選択）する際の情報としても使用され、さらに、決定された行動に対しても表出ざれる（付加される）かたちで使用されている。

このように行動決定システム 7 0は、認識結果に基づいて行動を決定している < 以下、この行動決定システム 7 0を構成する各部についてさらに詳しく説明する ₍ ( 3— 1 ) 内的状態モデル部の構成

内的状態モデル部 7 1は、外的要因及び内的要因に応じて本能及び感情といつた内的状態を変化させている。そして、内的状態モデル部 7 1によって得られる本能及び感情の状態は、上述したように、ロボット装置 1が行動を決定する際の情報として使用され、さらに、決定された行動に対しても表出される（付加される）かたちでも使用される。

この内的状態モデル部 7 1は、外的要因や内的要因に応じて変化する本能（欲求）や性格に関わる要素を複数有して構成されている。

具体的には、内的状態モデル部 7 1は、疲れ（fatigue) 、熱或いは体内温度 (temperature) 、痛み (pain) 、食欲或いは飢え（hunger) 、乾き (thifst) 、愛情 (affection) 、好奇心 (curiosity) 、 *** (el imination) 及び*** (sex. ual ) 等といった 9個の本能的要素と、幸せ（happiness) 、悲しみ（sadness) 、怒り（anger) 、驚き（surprise) 、嫌悪（disgust) 、恐れ（fear) 、苛立ち (frustration) 、返屈 (boredom) 、睡眠 (somnolence; 、社交性 (gregarious ness) 、根気（patience) 、緊張（tense) 、リラッケス（relaxed) 、警戒（al ertness) 、罪 (gui lt) 、悪意 (spite) 、誠実さ ( loyalty) 、服従性 (submis sion) 及び嫉妬（jealousy) 等といった 1 8個の情動的要素とを有し、全体として 2 7個の内的状態を示す要素を持っている。

情動的要素は、各情動毎にその情動の強さを表すパラメ一夕を保持している。そして、内的状態モデル部 7 1では、これらの各要素のパラメ一夕値を、それそれ入力セマンティクスコンバータモジュール 5 9から与えられる「叩かれた」及び「撫でられた」などの特定の認識結果と、経過時間などに基づいて周期的に変更する。

具体的には、情動的要素は、入力セマンティクスコンパ'一夕モジュール 5 9から与えられる認識結果と、そのときのロボット装置 1の行動と、前回更新してからの経過時間となどに基づいて所定の演箅式により箅出されるそのときのその情動の変動量を Δ Ε [ t ] 、現在のその情動のパラメ一夕値を E [ t ] 、その情動の感度を表す係数を k _eとして、（ 1 ) 式によって次の周期におけるその情動のパラメ一夕値 E [ t + 1 ] を算出し、これを現在のその情動のパラメ一夕値 E

[七 ] と置き換えるようにしてその情動のパラメータ値を更新する。

E[t+l]=E[t]+k_e ΧΔΕ[ί] . . . (] )

内的状態モデル部 7 1は、このように示される（ 1 ) 式により上述の「幸せ」などの全て情動のパラメ一夕値を更新する。

なお、各認識結果や出力セマンティクスコンバータモジュール 6 8からの通知が各情動のパラメータ値の変動量厶 Ε [七 ] にどの程度の影響を与えるかは予め決められており、例えば「叩かれた」といった認識結果は「怒り」の情動のパラメ一夕値の変動量厶 Ε [ t ] に大きな影響を与え、「撫でられた」といった認識結果は「喜び」の情動のパラメ一夕値の変動量 Δ Ε [ t ] に大きな影響を与えるようになっている。

ここで、出力セマンティクスコンバータモジュ一ル 6 8からの通知とは、いわゆる行動のフィ一ドバック情報（行動完了情報）であり、行動の出現結果の情報であり、内的状態モデル部 7 1は、このような情報によっても感情を変化させる _c なお、内的状態モデル部 7 1は、同様に、後述する本能も変化させる。

これは、例えば、「吠える」といった行動により怒りの感情レベルが下がるといったようなことである。なお、行動結果のフィ一ドバックは、モジユレ一夕 7 2の出力（感情が付加された行動）によりなされるものであってもよい。

一方、本能的要素は、欲求（本能）ごとにその欲求の強さを表すパラメ一夕を保持している。そして、本能的¾:素は、これら欲求のパラメータ値を、それそれ入力セマンティクスコンバータモジュール 59から与えられる認識結果や、経過時間及び出力セマンティクスコンバータモジュール 68からの通知などに基づいて周期的に更新する。

具体的に本能的要素は、「疲れ」、「愛情」、及び、「好奇心」'、「***」、「***」の認識結果、経過時間及び出力セマンティクスコンバータモジュール 6 8からの通知などに基づいて所定の演算式により算出されるそのときのその欲求の変動量を厶1 [k] 、现在のその欲求のパラメ一夕値を I [k] 、その欲求の感度を表す係数 kiとして、所定周期で（2) 式を用いて次の周期におけるその欲求のパラメ一夕値 I [k+ 1] を算出し、この演算結果を現在のその欲求のパラメ一夕値 I [k] と置き換えるようにしてその欲求のパラメ一夕値を更新する。

I「k+l]=I[k]+ki xAI[k] ' · ' (²)

内的状態モデル部 7 1は、この（2) 式により上述の疲れなどの全て本能（欲求）のパラメ一夕値を更新する。

なお、認識結果及び出力セマンティクスコンバータモジュール 68からの通知などが各本能的要素の各欲求のパラメータ値の変動量 ΔΙ [k] にどの程度の影響を与えるかは予め決められており、例えば出力セマンティクスコンバータモジユール 68からの通知は、「疲れ」のパラメータ値の変動量 ΔΙ [k] に大きな影響を与えるようになつている。

また、以下に示すように、所定の欲求のパラメ一タ値を決定することもできる。本能的要素のうち、「痛み」については、ミドル ' ウェア ' レイヤ 40の姿勢検出用の信号処理モジュール 55と、入力セマンティクスコンバ一夕モジュール 59を介して通知される異常姿勢の回数に基づいて、回数を Nとし、痛みの強さを Kiとし、痛みが減少する速度の定数を K₂とし、（3) 式により、「痛み」のパラメ一タ値 I [k] を算出し、この演算結果を現在の痛みのパラメ一夕値 I [k] と置き換えるようにして当該「痛み」のパラメ一タ値を変更する。ただし、 I [k] く 0のときは I [k] = 0、 t = 0、 N= 0とする。

I [k] = K_l x N - K. x t … (3)

また、「熱」については、入力セマンティクスコンパ'一夕モジュール 59を介して与えられる温度検出用の信号処理モジュール 5 1からの温度データに基づいて、温度を Tとし、外気温を T。とし、温度上昇係数 K₃として、（4) 式により、「熱」のパラメ一夕値 I [k] を算出し、この演算結果を現在の熱のパラメ一夕値 I [k] と @き換えるようにして当該「熱」のパラメ一夕値を更新する。 T— To< 0のときには、 I [k] =0とする。

また、「食欲」については、入力セマンティクスコンバータモジュール 59を介して与えられるバヅテリ残量デ一タ（図示しなぃバヅテリ残量検出用のモジュ —ルが得た情報）に基づいて、バヅテリ残量を B_Lとして、所定周期で、（5) 式により、「食欲」のパラメータ値 I [k] を算出し、この演算結果を現在の食欲パラメ一夕値 I [k] と置き換えることにようにして当該「食欲」のパラメ一夕値を更新する。

I[k] = 100— B_L · · - (5)

また、「乾き」については、入力セマンティクスコンバ一夕モジュール 59を介して与えられるバテリ残 fi変化速度に基づいて、時刻 tにおけるバッテリ残 Sを B _L (七）とし、今時刻 t >と t 2でバヅテリ残量データを取得したとすると、

( 6 ) 式により、「乾き」のパラメータ値 I [ k ] を算出し、この演算結果を現在の乾きパラメータ値 I [ k ] と匿き換えるようにして当該「乾き」のパラメ一タを更新する。

なお、本実施の形態においては、各情動及び各欲求（本能）のパラメ一夕値がそれそれ 0から 100までの範 Hで変動するように规制されており、また係数 k _e、 k iの値も各情動及び各欲求ごとに個別に設定されている。

以上述べたように内的状態モデル部 7 1が構成され、ロボット装置 1は、この内的状態モデル部 7 1により、自己及び周囲の状況や、ユーザからの指示及び働きかけに応じて、本能（欲求）や感情の状態（パラメ一夕）を変化させて自律的な行動を行うことができるようになされている。

( 3 - 2 ) 環境に応じた本能及び感情の変化

かかる構成に加えてこのロボット装置 1の場合、例えば、周囲が「明るい」ときには陽気になり、これに対して周西が「暗い」ときには物静かになるなど、周 Hの環境のうちの「騒音」、「温度」及び「照度」の 3つの条件（以下、環境条件という。）の度合いに応じて感情 ·本能を変化させるようになされている。すなわち、このロボット装置 1には、周西の状況を検出するための外部センサとして、上述した C C Dカメラ 2 0、距離センサ 2 2 s 夕ヅチセンサ 2 1及びマイク口ホン 2 3などに加えて周囲の温度を検出するための温度センサ（図示せず）が所定位置に設けられている。対応する構成として、ミドル，ウェア ' レイャ 4 0の認識系 6 0には、騒音検出用、温度検出用及び明るさ検出用の各信号処理モジュール 5 0 ~ 5 2が設けられている。

そして、騒音検出用の信号処理モジュール 5 0は、ロボティヅク · サーバ · ォブジェクト 3 2のバーチャル ' ロボヅト 3 3を介して与えられるマイクロホン 2 3 (図 2 ) からの音声データに基づいて周囲の騒音レベルを検出し、検出結果を入力セマンティクスコンバ一夕モジュール 5 9に出力するようになされている。また、温度検出用の信号処理モジュール 5 1は、パーチャル · ロボット 3 3を介して与えられる温度センサからのセンサデ一夕に基づいて周囲の温度を検出し、検出結果を入力セマンティクスコンバ一夕モジュール 5 9に出力する。

さらに、明るさ検出用の信号処理モジュール 5 2は、バ一チャル . ロボット 3 3を介して与えられる C C Dカメラ 2 0 (図 2 ) からの画像データに基づいて周囲の照度を検出し、検出結果を入力セマンティクスコンバータモジュール 5 9に出力する。

入力セマンティクスコンバ一タモジュール 5 9は、これら各信号処理モジユール 5 0〜 5 2の出力に基づいて周囲の「騒音」、「温度」及び「照度」の度合いを認識し、当該認識結果を上述のようにアプリケーション ·モジュール 4 1 (図 5 ) の内的状態モデル部 7 1に出力する。

具体的に、入力セマンティクスコンバータモジュール 5 9.は、騒音検出用の信号処理モジュール 5 0の出力に基づいて周囲の「騒音」の度合いを認識し、「うるさい」又は「静か」といった認識結果を内的状態モデル部 7 1に出力する。また、入力セマンティクスコンバータモジュール 5 9は、温度検出用の信号処理モジュール 5 1の出力に基づいて周囲の「温度」の度合いを認識し、. 「暑い」又は「寒い」といった認識結果を内的状態モデル部 7 1及び知覚情報取得部 9 0 に出力する。

ざらに、入力セマンティクスコンバ一夕モジュール 5 9は、明るさ検出用の信号処理モジュール 5 2の出力に基づいて周囲の「照度」の度合いを認識し、「明るい」又は「暗い」といった認識結果を、内的状態モデル部 7 1等に出力する。内的状態モデル部 7 1は、上述のように、入力セマンティクスコンバータモジユール 5 9から与えられる各種認識結果に基づき（ 1 ) 式に従って各パラメ一夕値を周期的に変更する。

そして、内的状態モデル部 7 1は、入力セマンティクスコンバータモジュール 5 9から与えられる「騒音」、「温度」及び「照度」についての認識結果に基づいて、予め定められた対応する情動についての（ 1 ) 式の係数 k eの値を増減させる。具体的には、内的状態モデル部 7 1は、例えば「うるさい」といった認識結果が与えられた場合には「怒り」の情動に対する係数 k eの値を所定数増加させ、これに対して「静か」といった認識結果が与えられた場合には「怒り」の情動に対する係数 k eの値を所定数減少させる。これにより、周囲の「騒音」に影響されて「怒り」のパラメ一タ値が変化することになる。

また、内的状態モデル部 7 1は、「暑い」といった認識結果が与えられた場合には「喜び」の情動に対する係数 k eの値を所定数減少させ、これに対して「寒い」といった認識結果が与えられた場合には「悲しみ」の情動に対する係数 k eの値を所定数增加させる。これにより、周囲の「温度」に影響されて「悲しみ」のパラメ一夕値が変化することになる。

さらに、内的状態モデル部 7 1は、「明るい」といった認識結果が与えられた場合には「喜び」の情動に対する係数 k _eの値を所定数増加させ、これに対して [.暗い」といった認識結果が与えられた場合には「恐れ」の情動に対する係数 k _eの値を所定数増加させる。これにより、周囲の「照度」に影響されて「恐れ」のパラメ一夕値が変化することになる。

これと同様にして、内的状態モデル部 7 1は、上述のょに、入力セマンティ . クスコンバ一夕モジュール 5 9から与えられる各種認識結果等に基づき（2 ) 式 . 〜（ 6 ) 式に従って各欲求のパラメ一夕値を周期的に変更する。

また、内的状態モデル部 7 1は、入力セマンティクスコンバータモジュール 5 9から与えられる「騒音」、「温度」及び「照度」の度合いについての認識結果に基づいて、予め定められた対応する欲求の（2 ) 式の係数 k iの値を増減させる _c 具体的に内的状態モデル部 7 1は、例えば「うるさい」や「明るい」といった認識結果が与えられた場合には、「疲れ」に対する係数 k iの値を所定数減少させ、これに対して「静か」や「暗い」といった認識結果が与えられた場合には「疲れ」に対する係数 k iの値を所定数増加させる。また、内的状態モデル部 7 1は、「暑い」又は「寒い」といった認識結果が与えられた場合には「疲れ」に対する係数 k iの値を所定数増加させる。

この結果このロボヅト装置 1においては、例えば周西が「うるさい」ときには、「怒り」のパラメ一夕値が増加しやすく、「疲れ」のパラメータ値が減少しやすくなるために、全体として行動が「いらいら」したような行動となり、これに対して周囲が「静か」なときには、「怒り」のパラメータ値が減少しやすく、「疲れ」のパラメ一夕値が増加しやすくなるために、全体として行動が「おちついた」行動となる。

また、周囲が「暑い」ときには、「喜び」のパラメータ値が減少しやすく、「疲れ」のパラメ一夕値が増加しやすくなるために、全体として行動が「だらけた」ような行動となり、これに対して周囲が「寒い」ときには、「悲しみ」のパラメ一夕値が増加しやすく、「疲れ」のパラメ一夕値が増加しやすくなるために、全体として行動が「寒がっている」行動となる。

また、周囲が「明るい」ときには、「喜び」のパラメータ値が増加しやすく、「疲れ」のパラメータ値が減少しやすくなるために、全体として行動が「陽気」な行動となり、これに対して周囲が「暗い」ときには、「喜び」のパラメータ値が増加しやすく、「疲れ」のパラメータ値が増加しやすくなるために、全体として行動が「物静か」な行動となる。

このようにしてロボット装置 1は、内的状態モデル部 7 1により、環境（外的要因や内的要因）に応じて本能及び感情の状態を変化させる'ことができ、この本能や感情を行動に表出させることができる。さらに、内的状態モデル部 7 1によつて得られる本能及び感情の状態は、行動選択部 8 0において行動を選択するための情報としても使用される。

( 3 - 3 ) 行動選択部の構成 ' 行動選択部 8 0は、予め用意されている複数の行動から一の行動を選択する。この行動選択部 8 0は、動物行動学的なアプローチにより行動選択（決定）をするように構築されている。

一般的には、動物は、行動に影響する複数の外的原因因子及び内的原因因子 (以下、まとめて原因因子という。）に基づいて行動を決定していると考えられ、さらにはそれら因子が複雑に絡み合つた状態において行動を決定している。ロボヅト装置 1は、そのような一般的な動物の行動決定のメカニズムを取り入れて、その行動を決定するようになされている。

行動決定のメカニズムが動物行動学なアプローチにより構築されたロボツト装置 1は、例えば、図 6 Aに示すように、目の前に水たまりがあるとき次のような手順により出現させる行動を決定する。

ロボット装置 1は、「水を発見」、「水までは 1 0 c m」という外的原因因子 (外的知覚要素、例えば、知覚に基づくもの）を知覚し認識する（評価する）。一方で、ロボット装置 1は、例えば、内的原因因子（内的動機要素、例えば、本能や感情にもとづくもの）としての動機が「のどの乾きが高く」、「中程度に怒つている」の状態にある。なお、動機は、上述した内的状態モデル部 7 1のパラメータ値を使用して取得されるものである。これは、後で詳述する。

ここで、動物行動学的なアプローチによればその行動決定において少なくとも次のような判断がなされる。

「のどの乾きが高い」の状態にあり、かつ「水を発見」の場合にあっても、例えば、水への距離が長いときには水をとる行動（摂水行動）を起こすとは限らない。例えば、水までの距離が遠い場合には、体力もそれだけ消費することになり、のどが乾きがさらにひどくなるといったことが本能的に処理されるからである。逆に、「のどの乾きが低い」の状態にあり、かつ「永が目の前にある」のときは、摂水行動をすることもある。このように、「のどの乾き」といった内的原因因子から一概に摂水行動がなされるか否かが判断されるものではなく、「水がある」また「水が目の前にある」といった外的原因因子から行動決定の判断なされるものである。すなわち、行動は、複数の外的原因因子及び内的原因因子に基づいて決定され、それら因子が複雑に絡み合った状態において決定される。

また、この際、他の行動と比較して、最終的に行動が決定される。例えば、「水を飲みたい」かつ「食物を食べたい」の状態にある場合には、「水を飲みたい」の度合い或いはその実現可能性と、「食物を食べたい」の度合い或いはその実現可能性とを比較して、一の行動として例えば、摂水行動を選択する。

このような動物行動学的なアプローチにより、ロボット装置 1は最終的に行動を決定している。すなわち、ロボット装置 1は、「のどの乾きが高い」といった状況下の「水の発見」、さらには「水までは 1 0 c m」とあること等の情報から総合的に判断し、「摂食行動 j 等の他の行動を排除して、「摂水行動」を出現させる。また、ロボット装置 1は、「中程度に怒っている」の状態として、怒っている動作を伴い摂水行動を出現させる。これは、上述したモジユレ一夕 7 2によって実現されるものである。そして、例えば、口ポヅト装置 1は、内部状態として、水を発見したことにより、その「怒り」のレベルを低下させる。これは、上述した出力セマンティクスコンバ一夕モジュール 6 8から内的状態モデル部 7 1への行動完了情報のフィードバ、ソクにより実現される。

図 6 Bには、上述したような動物行動学的なアプローチにより、「摂永行動」の具体的な行動として「前方へ歩く」を選択するまでの手順を示している。

先ず、ロボット装置 1は、上述の図 6 Aに示すような状態におかれた場合、複数の行動から「摂取行動」を選択する。選択されなかった他の行動としては、例えば、「闘争行動」、「探索行動」等が挙げられる。例えば、ロボット装置 1は、このような「摂取行動」、「闘争行動」及び「探索行動」等が選択可能な行動グループとされて.、サブシステム（サブシステム層）として保持している。

ここで、行動グループは、上位の行動を具現化する複数の下位の行動群からなり、例えば、下位の行動は、互いに抑制しあう関係にある。以下、同様である。次に、'ロポット装置 1は、選択した摂取行動内から一の行動として「摂水行動」を選択する,。選択されなかった他の摂取行動としては、例えば「摂食行動」. が挙げられる。例えば、ロボット装置 1は、このような Γ摂水行動」や「摂食行動」等が選択可能な行動グループとされて、モード（モード層）として保持している。すなわち、「摂水行動」や「摂食行動」を行動グループとし、「摂取行動」の下位行動として保持している。

次に、選択した摂水行動内から一の行動として「水に近づく」を選択する。他の摂水行動としては、例えば「水を口に入れる」が挙げられる。例えば、ロボット装置 1は、このような「水に近づく」や「水を口に入れる」等が選択可能なグループとされて、モジュール（モジュール層）として保持している。

次に、「水に近づく」の具体的行動として「前進する」を選択して、実際の行動として出現させる。なお、選択されなかった他の「水に近づく j の行動としては、例えば「後進する」、「右に曲がる」及び「左に曲がる j が挙げられる。例えば、ロボヅト装置 1は、このような「前進する」、「後進する」、「右に曲がる」及び「左に曲がる」等が選択可能なグループとされて、モー夕コマンド（モ一夕コマンド層）として保持している。

このような手順により、ロボット装置 1は、動物行動学的なアプローチから「前方へ歩く」といった最下位層の行動を上位の行動を規定する「摂取行動」の最終的な行動として出現させている。

図 7には、ロボット装置 1の有する行動決定のために構築されている行動選択システムを示す。この行動選択システムは、例えば、行動選択部 8 0において構築されている。

行動選択システムは、複数の行動が階層構造（ツリー構造）とされて構築されている。この階層構造とされる行動選択システムでは、下位の行動が複数個からなる行動グループが、上位を具現化する行動群から構成されている。例えば、上位の行動が「闘争行動」といった場合には、下位の行動が「戦い ·捕食行動」、「防御 ·逃避行動」といった行動からなるようにである。

例えば、この行動選択システムは、各行動の情報をデ一タ形態（例えば、デ一夕べ一ス形態）として保持することとしてもよく、オブジェクト指向として設計されてもよい。例えば、オブジェクト指向として行動選択部が設計された場合、行動選択システムは、各行動が独立してオブジェクトの.単位として構成され、各オブジェクト単位で行動選択のための各種処理がなされるようになる。

この図 7に示すように複数の行動が階層構造とされ構築されている行動選択システムでは、より上位層の行動が願望のような抽象的な行動とされ、下位層の行動がそのような願望を実現するための具体的な行動とされている。 .

このような行動選択システムでは、下位の層に進みながら行動を選んでいき、すなわち、上位の行動を実現化する行動を選んでいき、最終的な行動の選択がなされる。すなわち、中間層における行動について言えば、最上位の行動から最下位の行動が選択されるまでの選択された経路上の情報を示すものとなる。

このように上位の層から下位の層に進むなかで各層において行動の選択がなされていく際に、各層では、上述したような外的原因因子や内的原因因子によって一の行動の選択がなされていくのである。.

行動選択部 8 0は、具体的には、図 5に示したように、知覚情報取得部 9 0、動機情報取得部 8 1及び行動選択演算部 8 2を有している。この行動選択部 8 0 を構成する各部は、概略として、図 8及び図 9に示すように機能する。 ·

知覚情報取得部 9 0は、行動ごとに、知覚情報を取得する。例えば、知覚情報の取得として、後述するリリースメカニズム（Release Mechanism) における知覚の評価を示す R M値を計算する。例えば、この知覚情報取得部 9 0により、水が発見され、水までの距離が 1 0 c mであることの認識がなされる。これにより、摂取行動（摂水行動）の値が高くなる、すなわち選択可能性が高くなる。 ' 動機情報取得部 8 1は、内的状態に基づいて、行動ごとの動機情報を取得する。例えば、行動ごとの動機情報の取得として、上述本能値、感情値に基づいて、行動ごとの動機を計算する。具体的には、後述するモチベーションクリエ一夕における動機の状態を示す M o t値を計算する。例えば、動機情報取得部 8 1により、のどが乾きの状態が取得される。これにより、摂食行動の動機値が高くなり、摂食行動のうち、摂水行動がさらに高くなる。

行動選択演算部 8 2は、行動ごとに、動機情報取得部 8 1からの動機情報（動機値）と、知覚情報取得部 9 0からの知覚情報（値）とから、所望の行動を選択する。そして、行動選択演算部 8 2は、所望の行動の選択の際に、同一グループ . (行動グループ） .内の他の行動を排他的に制御する。例えば、この行動選択演算部 8 2により、サブシステム層では摂取行動が選択され、さらに摂取行動内の摂水行動が選択ざれる。

また、行動選択演算部 8 2は、選択された行動に基づいて、 ·実際の動作群の計画をする。例えば、「前方へ移動（Move- forward) 」を選択する、といったようにである。

なお、内的状態モデル部 7 1は、上述したように、体内の本能や感情の状態等の内的状態についての情報を取得する。例えば、内的状態の情報の取得として、本能値や感情値を算出する。具体的には、上述した本能（欲求）のパラメ一夕値や情動のパラメータ値、或いは後述する I E値を算出する。例えば、この内的状態モデル部 7 1では、動いたため、のどが乾いているといった状態の情報が取得される。

また、出力セマンティクスコンパ一夕モジュール 6 8は、図 8に示すように、行動をロボヅト装置 1のタイプに応じた動作列に変換するモジュールである。例えば、出力セマンティクスコンバータモジュール 6 8は、今、ロボヅト装置 1のタイプが 4足ロボットであることを認識し、入力されてくる行動及び感情状態に応じて動作列に変換する。すなわち、出力セマンティクスコンパ '一夕モジュール 6 8は、上位の行動決定システム 7 0からの行動のコマンドから、対応する各信号処理モジュール 6 1〜 6 7にコマンドを送る。

なお、図 9に示すようなモジユレ一夕 7 2、姿勢管理モジュール等については、後で詳述する。なお、図 9において、「input」の欄は入力されるコマンドの形態を示し、「output」の欄は出力されるコマンドの形態を示す。

以上のように、行動選択部 8 0が構成されている。次に、行動選択部 8 0が行動選択のシステムとして採用する動物行動学的なアプローチについてさらに詳し <説明する。

( 3 - 4 ) 動物行動学的なアプローチによる行動選択

一般的には、動物の行動の決定（選択）は、上述のように、複数の因子が複雑に絡み合ってなされるものである。単純な例としては、図 1 0に示すように、知覚と動機とから行動が決定される。 .

ここで、知覚は、行動に影響する外部からの情報であり、入力されてくる外界環境によって誘発若しくは制約される条件と考えることができる。また、動機は、「お腹がすいた」等の内部の情報であり、内的状態を表現しており、その行動を起こしたいという内的意図と考えることができる。このように、知覚や動機といつたものを原因として、その作用として行動の決定がなされているとすることができる。

知覚及び動機に基づく行動決定は、具体的には次のようにしてなされる。なお、次に説明する行動決定（選択）のための原理は、 81113 と^ ) 1 11(1 ( 1975) が提唱した状態空間アプローチによるものである。

Si lbyと Mrfarland ( 1975) は、まず動物は最も出現傾向の高い活動（行動）を遂行する、との仮定から理論を出発している。出現傾向の配列をはっきりと表す 1つの方向としてベクトル空間がある。そこで、ベクトルの大きさは、ある共通性をもった指標に基づいたいわゆる出現傾向の強さを示している。出現傾向とは、例えば、摂食行動が出現される傾向（度合い）ゃ摂水行動が出現される傾向（度合い）等がある。そして、全ての出現傾向の状態は、この出現傾向空間上の点として表される。

そして、この空間は、出現傾向の最も高い行動がどれかという領域毎に分けられ、その境界線が「切り換え境界線（スイッチングライン、 switching l ine) 」となる。

—方、出現傾向はさまざまな原因因子に依存している。例えば、摂食傾向は、食物制限、摂食機会、補食の可能性等に依存しているのである。これら全ての原因因子をはっきりと表す方法は、もう 1つのべクトル空間を用いることである。原因因子から出現傾向を決めるというのは、次のような表現と同義になる。すなわち、原因因子の状態空間から出現傾向空間への写像があり、そこで原因因子のいかなる状態に対しても対応する出現傾向の状態空間が存在するようになつている。そして、どの行動が行われるかの決定ができるようになつているというものである。原因因子と出現傾向との関連性を図 1 1 A〜Cを用いて説明する。

図 1 1 A及び図 1 1 Cは、原因因子の状態を示す原因因子状態空間を示すものである。この原因因子状態空間は、ある行動が導かれることに影響する原因因子によって構成される。原因因子としては、上述した「知覚」、「動機」が挙げられる。なお、この図 1 1 A〜Cでは、単純化のために 2次元空間だけを検討したものであるが、実際には、行動の出現傾向の多くは、 3次元以上の原因因子状態空間によって決定されるものである。

図' 1 1 Aは、具体的には、摂食の行動が出現される傾向、すなわち「摂食行動」の出現傾向（以下、摂食傾向という。）を示すもので、原因因子とされる「動機」として「空腹」を横軸にとり、原因因子とされる「知覚」として「おいしさ」を縦軸にとっている。また、図 1 1 Cは、摂水の行動が出現される傾向、 ' すなわち「摂水行動」の出現傾向（以下、摂水傾向という。）を示すもので、「動機」として「のどのかわき」を横軸にとり、「知覚」として「水への距離」を縦軸にとっている。

また、図 1 1 Bは、図 1 1. A及び図 1 1 Cにおける原因因子の状態に基づく「摂食傾向」及び「摂水傾向」の出現傾向の空間を示す。すなわち、原因因子により影響される行動の出現傾向が写像され、これらの出現傾向の比較が可能とされる空間を示す。

先ず、原因因子状態空間について、図 1 2を用いて具体的に説明する。この図 1 2に示す原因因子状態空間は、上述の図 1 1 Aに示す「摂食行動」の原因因子状態空間である。

図 1 2に示すように、すごくおいしいものがあって（m ₂状態）、でもそんなにお腹がすいていない状態（原因状態）にあるとき（11 !状態）、一方、 'ものすごくお腹がすいているが（η ₂ ( > η ι ) 状態）、あまりおいしくない食物がある状態 (原因状態）にあるとき（nn ( < m ₂ ) 状態）に、摂食行動が出現される。すなわち、一概に、動機とされる「空腹」にのみ依存して摂食行動が出現されるのではなく、また、知覚とされる「おいしさ」にのみ依存して摂食行動が出現されるものでもなく、「空腹」と「おいしさ」とが相互に作用して、摂食行動が出現される。

言い換えれば、「空腹」の程度が異なっている場合であっても、摂食行動は出現され、「空腹」と「おいしさ」との状態によっては、原因因子状態空間内に摂食行動が出現される度合いが同じ原因状態、すなわち摂食傾向を同程度と.する原 · 因状態が複数点に存在する。例えば、空腹でないときにとてもおいしい食物を与えたりしたときに、或いは非常に空腹であるときにあまりおいしくない食物を与えたりしたときに、同程度の摂食傾向が存在するということである。

例えば、摂食行動では、「空腹」と「おいしさ」とを原因因子としてみた場合、その出現傾向が同程度とされるには、「空腹」が高い（多い）ときには「おいしさ」が低く（少なく）、また、「空腹」が低い（少ない）ときには「おいしさ」が高い（多い）。よって、摂食傾向を同程度とすることを考えた場合、「空腹」と「おいしさ」とは反比例の関係となり、摂食傾向が同程度とされる点を結ぶと、図 1 2において例えばそれが曲線として示される。すなわち、図 1 2に示すように、摂食傾向のいわゆる強さ（ベクトルの強さ） yを同程度とするような原因因子の状態が複数存在して、それらは原因因子状態空間において曲線として示される。 .

さらに、原因因子状態空間には、異なる複数の摂食傾向の強さ y y ₂， · · - が存在し、図 1 2に示すように、それが摂食傾向の強さの分布として、いわゆる等高線として示される。 '

なお、図 1 2において、原因因子状態空間における右上方向に行くほど、摂食の強さは強くなることを示す。これは、すごくお腹がすいており、さらに目の前にはすごくおいしい食物があれば、誰しもが摂食行動をとるようになる、といつたようなことをいうものである。 ' このように、原因因子により摂食傾向の強さを定義づけることができ、同様にして、摂水傾向の強さを定義づけることができる。

すなわち、摂水行動は、のどのかわきが激しいときには水（水のある場所）への距離が遠くても出現され、また、のどのかわきが少ないときでも水への距離が近い場合に出現され、「のどのかわき」と「水への距離」とが相互に作用して、摂水行動が出現される。 .

言い換えれば、「のどのかわき」の程度が異なっている場合であっても、摂水行動は出現され、「のどのかわき」と「水への距離」との状態によっては、原因因子状態空間内に摂水傾向を同程度とする原因状態が複数点に存在する。例えば、水が欠乏していないときに水が目の前にあったり、或いは水が非常に欠乏しているときに水が遠くにあったりしたときに同程度とする摂水傾向が存在するということである。

そして、摂水傾向を同程度とすることを考えた場合、「のどのかわき」と「水への距離」とは反比例の関係にあり、摂水傾向が同程度と'される点を結ぶと、例えば図 1 1 Cにおいて原因因子状態空間内において曲線として示される。すなわち、図 1 1 Cに示すように、摂水傾向のいわゆる強さ Xが同程度とされるような原因因子の状態が複数存在して、それらは原因因子状態空間において曲線として示される。そして、図 1 1 Cに示すように、原因因子状態空間には、異なる摂水傾向の強さ X X 2 , · · ·が等高線として示される。

以上述べたように、「摂食傾向」の強さと、「摂水傾向」の強さとが、各原因因子の状態に基づいて求められ、これらの強さの基づいてその比較がなされ、一の行動の袂定（選択）がなされる。そして、そのような出現傾向が比較されるのが、図 1 1 Bに示す出現傾向空間においてである。出現傾向空間は、出現可能な行動の傾向から構成されている。

例えば、ある原因状態において、ある摂食傾向の強さとある摂水傾向の強さ X ₂とが得られた場合、図 1 1 Bに示すように、原因因子状態空間から写像された摂食傾向の強さと摂水傾向の強さ X ₂とが出現傾向空間上において組み合わされて比較される。具体的には、次のようにして行動の選択がなされる。

図 1 1 Bに示すように、切り換え境界線の設定によって、出現傾向空間が 2つの領域に分割される。 y = 0 (摂水傾向を示す X軸) と切り換え境界線とで囲まれる領域（以下、摂水行動選択領域という。）と、 x = 0 (摂食傾向を示す y 軸）と切り換え境界線とで囲まれる領域（以下、摂食行動選択領域という。）とが形成される。

このように出現傾向空間にて切り換え境界線の設定により形成される各領域に、原因因子状態空間から写像された値（x， y ) の位置によって一の行動が決定される。すなわち、値（x， y ) が摂水行動選択領域内にある場合には、摂水行動が選択され、また、値（x， y ) が摂食行動選択領域内にある場合には、摂食行動が選択されるようになる。よって、図 1 1 Cに示す例では、値（χ ₂ , y が ■摂水行動選択領域になることから摂水行動が選択されることになる。 .

なお、単純化のため、原因因子の状態空間を、摂食と摂水それぞれに関与する状態変数（原因因子）に分けて示しているが、実際には 1つの状態変数は複数の行動の出現傾向に影響を及ぼす。原因因子空間の曲線は、特定の行動の出現傾向と同一のレベルをもたらす状態につながつている。

また、最終的に選択された行動によって、それに関わる原因因子やそれ以外の複数の原因因子に影響を及ぼす可能性がある。このようなことから、情報の排他処理がなされている。

以上のような動物行動学的なアプローチとして、原因因子を用いた行動決定 (選択）の手法は、例えば Silbyと Mcfarland ( 1975の論文）や Ludlow (競合モデルとして）が提唱している。

( 3 - 5 ) 動物行動学的なアプローチによる行動決定を実現する計算式

. 上述したような行動決定への動物行動学的なアプローチはあくまでも理論であり、実際のロボット装置 1に適用するためには、上述した動物行動学的なァプローチをデータベース等としての情報化、或いは数式化する必要がある。そこで、本 ¾明を実現するために、上述した動物行勅学的なアブローチからの行動決定を次のように数式化した。

図 1 3 Aに示すように、「摂食行動」の原因因子とされる「空腹」の状態（度合い）を Mo t [0] とおき、「おいしさ」の評価を RM [0] とおく。そして、ある Mo t [0]及び RM [0] がある値における摂食傾向（傾向の強さ）を B e [0] とおく。 '

同様に、図 1 3 Bに示すように、摂水行動の原因因子とされる「のどのかわき」の状態（度合い）を Mo t [ 1 ] とおき、「水への距離」の評価を RM

[ 1 ] とおく。そして、 . Mo t [ 1 ] 及び RM [ 1 ] がある値における摂水傾向 (傾向の強さ）を B e [0] とおく。これらの関係は、次に示す表のようになる ₍

なお、本例では、比較する出現傾向が「摂食行動」及び「摂水行動」の 2つなので、知覚については RM [0 ] 、 RM [ 1 ] の 2値とし、動機については Mo 七 [◦ ] 、 Mo t [ 1 ] の 2値としているが、多くの出現傾向についても比較することは可能である。このようなことから、知覚（外的知的要素）を RM [i] 、動機（内的勳機要素）を Mo t [i] 及び出現傾向を B e [i] とし、ここで i を整数として、一般化する。以下、特に出現される行動の種類を言及しないときには、これら一般化したものを示す。

なお、上述した例で、「摂食行動」についてみた場合、同程度の出現傾向は、「空腹」とおいしさ」とが反比例の関係の下で成立することについて述べているが、同程度の出現傾向とされるためには、出現傾向に作用する原因因子が必ず反比例の関係にあるとは限らない。すなわち、 B e [ i ] と RM [i ] と Mo t C i ] とは（7) 式のような関係として示すことができるが、 RM [ i ] と Mo t [i] との関係が必ず反比例の関係になるとは限らない。要は、出現傾向は、動機（内的動機要素）にのみ影響を受けるのではなく、知覚（外的知的要素）の影響をも受けるということである。

Be[i] = func(RM[i],Mot[i]) ... (7)

また、「おいしさ」や「水への距離」といった知覚評価 RM [ i] は、知覚情報取得部 90において取得されるものであり、また、「空腹」や .「のどのかわき」といった動機 Mo t [ i] は、動機情報取得部 8 1において取得されるものである。知覚情報取得部 90及び動機情報取得部 8 1におけるこれらの情報の取得のための具体的な処理等については、後で詳述する。

そして、上述したように知覚（外的知的要素）と動機（内的動機要素）とから得られた摂食傾向及び摂水傾向は、図 14に示すような出現傾向空間上に示される。

ここで、この図 14に示す出現傾向空間は、第 1の切り換え境界線（y=« X) と第 2の切り換え境界線（y = ?x) といった 2本の切り換え境界線が設定されている。すなわち、出現傾向空間が 3つの領域に分割されている。一方、上述の図 1 1 Bに示した出現傾向空間では、切り換え線が 1本であった。これは次のような理由からである。

理論的には、上述したように、切り換え境界線が 1本でも異なる行動の間で選択は可能である。しかし、実際のロボット装置 1にそのような理論をそのまま適用した場合、各行動の出現傾向が設定した切り換え境界線付近に存在すると、今選択した行動と他方の行動との選択の切り替わりがせわしくなり、ロボット装置 1の行動に落ち着きがなくなる。このような現象は、行動が選択されて実施された場合に当該行動の出現傾向が他の行動に対して相対的に小さくなるといったことが前提とされて発生する。すなわち、動機（願望）が達成されれば、その動機の程度が小さくなり、結果としてその動機に影響される行動の出現傾向が小さくなるというようなことからである。

このように、 2本の切り換え境界線により領域を分割することで、「摂食行動」が選択される領域（摂食行動選択領域）、「摂水行動」が選択される領域

(摂水行動選択領域）、「摂食行動」又は「摂水行動」のいずれかが選択される領域（以下、摂食又は摂水行動選択領域という。）の 3つ行動選択の領域が形成される。これにより、ロボット ¾蘆 1の行動に落ち着きがなくなることを防止することができる。このように、 2本の切り換え境界線を設定することで、ロボット装置 1の行動に落ち着きがなくなることが防止される理由については、後で詳述する。

この図 14に示す出現傾向空間において、出現傾向の最も強い行動が次のような関係から選択される。

図 14に示す出現傾向空間は、摂食傾向 B e [0] .を X軸におき、摂水傾向 B e [ 1 ] を y軸におき、摂食傾向 B e [0] と摂水傾向 B e [1] とから構成されている。そして、このような出現傾向空間において、第 1及び第 2の切り換え境界線をそれぞれ y = «x及び. y = /?xとして設定する。例えば、傾き係数ひ， ?は、任意の値として決定し、例えば、ロボット装置 1の成長などに応じて決定することができる。

ここで、摂食傾向 B e [0] は、図 13 Aに示す「空腹」 Mo t [0] 及び「おいしさ」 RM [0] により決定される値であり、摂水傾向 B e [1] は、図 13 Bに示す「のどのかわき」 Mo t [ 1 ] 、「水への距離」 RM [ 1 ] により決定される値である。，，

このような出現傾向空間において、図 14に示すように、原因因子状態空間から写像された値（a， a' ) が摂食行動選択領域にある場合（点 C) には、一の行動として摂食行動が選択され、一方、値（a, a， ) が摂水行動選択領域にある場合（点り）には、一の行動として摂水行動が選択される。

そして、値（a, a，）は、例えば、図 13 Aに示すように、「空腹」が Mo 七 [0] =n。、「おいしさ」が RM [0] =πι₀の状態にあり、このとき「摂食傾向」 B e [0] が aとされ、さらに、図 13 Bに示すように、「のどのかわき」が Mo七 [ 1 ] =ηκ 「水への距離」が RM [ 1 ] ^πηの状態にあり、このとき「摂水傾向」 B e [ 1] が a' とされた場合である。

以上のような行動の選択は、次のような数式化により実現することができる。先ず、 a， /a (B e [ l] /B e [0] ) の値として考える。 x = 0と第 2 の切り換え境界線（y = ?x) とによって囲まれる摂水行動選択領域に値（a， a' ) が位置される条件は、 ∞>a， /a> ?である。また、 = 0と第 1の切り換え境界線（y =ひ X) とによって囲まれる摂食行勐選択領域に値（a， a

， ) が位置される条件は、ひ >a， /a>0である。

このような関係式から以下のような式が導き出せる。ひ >a' /a> 0の場合、すなわち値（a， a' ) が摂食行動選択領域にある場合には、図 1 5 Aに示すようになり、（ 8 ) 式及び（ 9 ) 式が成り立つ。

a«-a〉0 (8)

ここで、第 1の切り換え境界線の傾き αは（ 1 0) 式のような関係の ' として示すことができる。なお、ひ，は、後述するように、摂水傾向 B e [ 1] から摂食傾向 B e [0] に対する排他制御ゲイン（> 1 ) となる。

Be [0] (10)

— α

このような関係から、「摂食行動」が選択されるための条件は（1 1 ) 式を満たすものであることが導き出される。 a― a' ' > 0 · , ·

次に、図 1 5 Bは摂水行動の場合を示しており、第 2の切り換え境界線の傾き ?は（ 1 2) 式として与えられる。なお、 ?は、後述するように、摂食傾向 B e [ 0 ] から摂水傾向 B e [ 1 ] に対する排他制御ゲイン（ > 1 ) となる。

このような関係から、「摂水行動」が選択されるための条件は（ 1 3) 式を満たすものであることが導き出される。

なお、上述の条件を満たすのは、（ 14) 式かつ（ 1 5) 式である場合である, したがって、摂食行動をとるようになるときには、（14) 式を満たし、摂水行動をとるようになるときには、（ 1 5) 式が満たされる。

a- a'a' > 0 (U) a' - a β > 0 (15) ここで、上述のような（a— a，ひ， ) 及び（a， -a 3) を行列として記述すると（ 1 6) 式のようになる。 Be[0] a 0 a' a (16)

Be[l] a' β 0 a'

また、これを離散的に計算するものとすると、時刻 tにおける出現傾向 B e _t [ i ] と時刻七一 1における出 ¾傾向 B e "- υ [i] とを用いて記述すると（ 1 7 ) 式のようになる。，

(17)

ここで、ひ，は、摂水傾向 B e [ 1] から摂食傾向 B et [0] に対する排他制御ゲイン（> 1 ) を示し、また、 ^は、摂食傾向 B e* [0] から摂水傾向 B et [ 1 ] に対する排他制御ゲイン（> 1) を示すものとなる。例えば、イメージ的には、図 1 6に示すように、 α' が摂食傾向 B et [0] に対する排他制御ゲインとして働き、また、 ?が摂食傾向 B et [1] に対する排他制御ゲインとして働くこのように、複数の行動についての出現傾向を行列式として示すことができるようになる。そして、行列式の左辺における行列中に正となる B e_t [i] があるとき、当該出現傾向 B e t [i] に対応される行動が一の行動として選択される。なお、上述のような行列式の場合には、一方の出現傾向の値が負となっているので、負となっている当該出現傾向については、 0を代入して、再帰的に計算をする。

上述の（ 17) 式を用いて排他制御を再帰的に行うことにより、図 1 7に示すような行動の選択がなされるようになる。

ここで、前提として、選択された一の行動が実行されると、当該一の行動に対する原因因子の影響が少なくなり、当該実行された一の行動の出現傾向が小さくなるとする。すなわち、例えば、「摂食行動」がーの行動として選択された場合、摂食行動が実現されて摂食に対する動機等が満たされるので、当該「摂食行動」に対する原因因子（動機）の影響が少なくなり、その結果、摂食傾向が小さく (弱く）なるということである。（1 7) 式を用いて排他制御を再帰的に行うことにより次のように行動の選択がなされる。

図 17に示すように、例えば、（摂食傾向 B e [0] ，摂水傾向 [ 1 ] ) = (a， a' ) が摂食行動選択領域内（y= 0と y = o:xとで囲まれる領域）.にある場合は、値（a, a' ) が当該摂食行動選択領域にある限り、一の行動として摂食行動が選択される。ここで、値（a， a， ) が摂食行動選択領域にある場合、上述の（ 17) 式の左辺の摂食傾向 B et [0] は正を示す。

そして、摂食行動が選択され続けると、上述したように当該摂食行動の実現により原因因子の影響が小さくなることから摂食傾向 B'e.t [0] は.小さく（弱ぐ）なっていく。摂食傾向 B e_tが小さくなつていくと、値（a, a，）は摂食又は摂水選択領域に至る。すなわち、図 17に示すグラフ中において矢印 P に示すように値（a, a， ) が変化する。

摂食又は摂水行動選択領域では、摂食行動が選択ざれる。また、上述の（ 1 7) 式にて左辺の摂食傾向 B e_t [0] も正を示す。そして、摂食行動が選択され続けると、当該摂食行動の実現により原因因子の影響が小さくなることから摂食傾向 B et [0] は小さくなつていく。そして、値（a, a，）は摂食又は摂水行動選択領域から摂水領域（x= 0と y = ?xとで囲まれる領域）に至る。すなわち、図 1 7に示すグラフ中において矢印 P ₂に示すように値（a, a⁵ ) が変化する。

摂水選択領域では、摂水行動が選択される。ここで、値（a， a' ) が摂水行動選択領域にある場合、上述の（17) 式の左辺の摂水傾向 B e_t [ 1] が今度は正を示す。

そして、摂水行動が選択され続けると、当該摂水行動選択領域では、当該摂水行動の実現により原因因子の影響が小さくなることから摂水傾向 B e_t [ 1 ] は小さくなつていく。そして、値（a， a' ) は摂水行動選択領域から摂食又は摂水行動選択領域に至る。摂食又は摂水行動選択領域では、摂水行動が選択され、上述の（ 17) 式にて左辺の摂食傾向 B et [ 1 ] も正を示す。さらに、摂水行動が選択され続けると、摂水傾向 B et [1] は減少し、値（a, a' ) は摂食又は摂水行動選択領域から摂食行動選択領域に至る。摂食行動選択領域では再び摂食行動が選択されるようになる。すなわち、摂水行動選択領域から摂食行動選択領域への値（a, a ' ) の変化は、図 17に示すグラフ中において矢印 P ₃に示すようになる。そして、以後、このように行動が選択されて、行動が切り換えられていく。

また、 .出現傾向空間において、 2本の切り換え境界線を設定することで、行動が頻繁に切り替わることが防止されたものとなり、行動に落ち着きがなくなることが防止される。

以上のように、摂食傾向 B et [0] と摂水傾向 B et [ 1] とが変化することにより、それらの値の関係から値（a, a， ) = (B et [0] , B e t [1 ] ) が出現傾向空間上に特定されて、一の行動が選択され.る。そして、このとき、

( 1 7) 式においては、摂食傾向 B et [0] 、摂水傾向 B et [ 1] の何れかが正の値を示し、正を示した出現傾向が選択される一の行動となる。このような行動決定を図 5に示す決定選択部 7 1により行っている。

なお、上述した実施の形態では、摂食傾向 B et [0] 及び摂水傾向 B et

[ 1 ] により摂食行動及び摂水行動の 2つの行動が切り換えられる場合について説明した。しかし、実際にはさらに多くの行動（n個の行動）を出現傾向空間上において比較して一の行動を選択する。すなわち n次元によって示される出現傾向空間により一の行動の選択がなされる。 n個の行動から一の行動を選択する場合については、（ 1 8) 式に示すような行列式になる。

[以下余白]

(1 8)

ここで、 G [ i ] [ j ] は、ある行動の出現傾向 B e t [ j ] に対するある行動の出現傾向 B e _t [ i ] の排他制御ゲインとなる。

以上のような数式化により、知覚や動機といった原因因子に基づいて各行動の出現傾向を求め、出現傾向の強さ（大きさ）から一の行動の決定（或いは選択）がなされるような動物行動学的なアプローチによる行動決定が可能になる。

なお、例えば、上述の図 1 7に示しように行動が選択されていった場合には、最終的に出現傾向が 0、すなわち、摂食傾向 B e [ 0 ] 及び摂水傾向 B e [ 1 ] が 0 (原点）に収束してしまうようにも考えられる。これは、上述したように行動が実現されていくと、そのままでは、当該行動に対しての原因因子（例えば、動機) の影響が限りなく無に近づくからである。

しかし、選択された一の行動が実行されている間に、選択されなかった他の行動に対しての原因因子の影響が大きくなるので問題はないといえる。すなわち、例えば、摂水行動が実行されている間に、選択されていない摂食行動についての原因因子である例えば「お腹がすいた」の状態が変化して、これにより「空腹」の評価が変化することで、摂食傾向が高くなるからである。「寝る」或いは「歩く」ことなどにより、食欲が回復するようにである。すなわち、選択された行動が実行されている間に選択されなかつた行動の出現傾向がいわゆる回復され、これを図示すると、例えば、図 1 8に示すようになる。

また、第 1及び第 2の切り換え境界線の傾き、 ?については、任意に決定することができる。これにより、例えば、成長段階に合わせて、或いは性格に合わせて設定することにより、そのような行動を適切に示すことができるようになる < 例えば、ロボ.ツト装置 1は成長段階に応じて出現させる行動を変化させる成長行動モデルを備えており、その成長モデルにおける成長段階が「幼児」のときには、第 1の切り換え境界線の傾きひと第 2の切り換え境界線の傾き/?とを近い値として、摂食又は摂水行動選択領域を狭める。また、成長段階が「成人」のときには、摂食又は摂氷行動選択領域が広くなるように、第 1の切り換え境界線の傾きひと第 2の切り換え境界線の傾き/?とを設定する。 .

これにより、ロボット装置 1は、「幼児」のときには、摂食行動と摂水行動との切り換えが頻繁に行い、あまり落ち着きがない行動を出現するようになり、また、「成人」のときには、摂食行動と摂氷行動との切り換えが適当な間隔で選択して、落ち着きのある行動を出現するようになる。

また、出現傾向のいわゆる回復速度といったものを可変にすることもできる。例えば、成長レベルが低いときには回復速度を早くし、成長レベルが高いときには回復速度を遅くするといつたように成長レベルに応じて回復速度を設定する。このように設定した場合には、「幼児」のときには、摂食行動と摂水行動との切り換えが頻繁に行われるようになり、「成人」のときには、.摂食行動と摂水行動との切り換えが適当になされるようになり、前述の例と同様な効果を得ることができる。

なお、上述したように、出現傾向の回復を利用して収束しないようになされるが、これを計算上で操作して同様に収束を防止することとしてもよい。

以上、動物行動学的なアプローチによる行動決定を現実のロボット装置 1において実現するための計算式について説明した。そして、行動選択部 8 0がこのような計算式により行動の選択を行っている。 ' ( 3— 6 ) 行動選択部における具体的な処理

以下、行動選択部 8 0における具体的な処理について説明する。

行動選択部 8 0は、図 1 9に示すように、知覚情報（R M) を取得する知覚情報取得部（Release Mechanism, リリースメカニズム） 9 0と、動機情報（M o t ) を取得する動機情報取得部（モーションクリエ一夕、 Motivation Creater) 8 1と、知覚情報（RM) と動機情報（Mo t) とに基づいて一の行動を選択する行動選択演算部 82を備えている。

(3 - 6 - 1) 出現傾向の取得手順

' 知覚評価（知覚情報） RM [i] と動機状態（動機情報） Mo t [i] とに基づいて、出現傾向 B et [i] を求める手順について説明する。出現傾向 B e _t

[i] を求める手順は、排他制御前の値の算出と、排他制御をした値の算出とに大別される。すなわち、上述した（ 1 8) 式の右辺の第 1項の出現傾向 B e t

[i] の算出と、（ 1 8) 式の左辺の出現傾向 B et [i] の算出とに大別される, 前者の計算と後者の計算について、 3つの異なる行動の出現傾向 B e _t [i] を取得する場合を例として説明する。 3つの異なる行動は、同一行動グループである。例えば、図 20に示すように、 3つの各行動について、 3つの第 1乃至第 3 の知覚評価 RM [0] ， RM [ 1] ， RM [2] と、 3つの第 1乃至第 3の動機状態 Mo七 [0] ， Mo t [ 1 ] ， Mo t [2] とから、対応される第 1乃至第 3の出現傾向 B et [0] , B et [ 1 ] , B e_t [2] を取得するというような場合である。

例えば、比較対象となる 3つの行動としては、「摂食行動」、「摂水行動」及び「***行動」が挙げられる。第 1の行動とされる「摂食行動」については、第 1の知覚評価 RM [0] として「おいしさ」が挙げられ、第 1の動機状態 Mo七

[0 ] として「空腹」が挙げられる。また、第 2の行動とされる「摂水行動」については、'第 2の知覚評価 RM [ 1] として「水への距離」が挙げられ、第 2の動機状態 Mo t [ 1 ] として「のどのかわき」が挙げられる。また、第 3の行動とされる「***行動」については、第 3の知覚評価 RM [2] として「トイレへの距離」が挙げられ、第 1の動機状態 Mo t [2] として「糞又は尿がつまつた」が挙げられる。そして、出現傾向空間は、これら摂食傾向 B et [0] 、摂水傾向 B et [ 1] 、 ***傾向 B et [2] により構成される。

各知覚評価 RM [i] 及び動機状態 Mo t [i] に基づく、「摂食行動」、「摂水行動」及び「***行動」に対応される各出現傾向 B e_t [i] の算出は次のようになる。

知覚評価 RM [i] と動機状態 Mo七 [i] とから、（ 1 9) 式に示すように出現傾向 B e _t [i] を算出する Bet[i] = RM[i]xMot [i] (19)

ここで、知覚評価 RM [ i] と動機状態 Mo七 [i] との間に反比例の関係がある埸合には、その関係を例えば（ 2 0) 式のように示すことができる。

A

RM「 (20)

Mot [i | この知覚評価 RM [i] を、（ 1 9) 式に代入すると、 A [ i ] が B e _t [ i] として算出される。すなわち、知覚評価 RM [ i] と動機状態 Mo t [i] との間に反比例の関係がある場合には、その係数 A [ i ] が出現傾向 B et [i] として箅出されるのである。

このような計算により、排他制御前の出現傾向 B e _t [ i ] を算出することができる。そして、排他制御が考慮された出現傾向 B e _t [i] については（2 1 ) 式により算出することができる。

0 G lj 0j G|2j[0j

G刚 0 G[2][l] ^Bet _MW (21)

G[0][2] G[l][2] 0

ィメージ的には、図 2 1に示すように、排他制御ゲイン G [ i ] [ j ] ( i = 0 , 1， 2、 j =0 , 1 , 2) により、第 1乃至第 3の行動の出現傾向 B eい . 「0] , B et [ 1 ] , B e t [2] が排他制御として算出がなされる。以上のように、排他制御前の出現傾向と、その排他前の出現傾向を使用し、排他制御が考慮された出現傾向との算出がなされる。

例えば、図 2 2に示すような手順により、これら一連の計算がなされる。，先ず、ステップ S 1に示すように、 t = 0， B e (t-i) [i] = 0として各値を初期化する。そして、ステヅプ S 2〜ステヅプ S 6において、 B e_t [ 0 ] 〜： B e t [2] までの（2 1 ) 式の右辺第 1項の値が算出される。すなわち、排他制御前の出現傾向 B e_t [i] が算出される。ステップ S 2〜ステップ S 6の処理は具体的には次のようになる。

ステップ S 2では、 i = 0とされる。これにより、 B e_t [0] についての計算が開始される。

続く、ステップ S 3にて、知覚評価 RM [0] と、動機状態 Mo t [0] とが算出される。すなわち、例えば「おいしさ」の評価 RM [0] を取得し、. 「空腹」の状態 Mo t [ 1 ] を取得する。

続く、ステップ S 4では、（2 1 ) 式の右辺第 1項の値として、「摂食行動」の出現傾向 B e_t [0] を算出する。

そして、ステ.ヅプ S 5において、 i = 3か否かについての判別がなされる。すなわち、比較対象となる全ての出現傾向 B e_t [ 0 ] ~ B e t [2] の値が算出されたか否かの判別がなされる。

ここで、 i = 3ではないとき、ステヅプ S 6において i = i + 1とされ、再び、ステヅプ S 3からの処理を開始する。

このようなステップ S 1〜ステヅプ S 6の処理により、排他制御前の値として、摂食傾向 B et [0] に続いて、摂水行動傾向 B e t [ 1 ] 及び***傾向 B e七 [2] が算出されるようになる。

そして、ステヅプ S 5において、 i = 3とされたとき、ステヅプ S 7の処理を実行する。ステップ S 7では、（2 1) 式の左辺の出現傾向 B et [i] ( i = 0 〜2 ) が算出される。すなわち、（2 1 ) 式により、排他制御が考慮された出現傾向 B et [i] が算出される。

続く、ステップ S 8において、 B e_t [i] の何れかが正の値となっているか否か判断がなされる。ここで、 B et [i] の何れもが正の値となっていない場合には、ステップ S 9において t = t + 1として、再びステヅプ S 1からの処理を実行する。これにより、（2 1 ) 式に示すような再帰的な計算がなされようになる。すなわち、前処理により得られた B e t [i] が B e tt-υ [i] とされて計算がなされる。

一方、ここで、出現傾向 B e_t [i] の何れかが正の値となっている場合には、当該出現傾向 B et [i] に対応される行動を実際に出現させる一の行動として選択して、行動の選択処理を終了する。

以上のように、知覚評価（知覚情報） RM [i] と動機状態（動機情報） Mo 七 [i] とに基づいて、出現傾向 B et [i] を求めることができる。

( 3 - 6 - 2 ) 知覚情報取得部における処理

次に、知覚評価 RM [i] を取得する知覚情報取得部 9 0と、動機状態 Mo t [ i] を取得する動機情報取得部 8 1との具体的な構成について説明する。先ず、知覚情報取得部 90について説明する。

知覚情報取得部 90は、外部又は内部の情報（認識結果）に応じて、行動の原因因子とされる知覚情報（評価）を取得する。この知覚情報取得部 9 0は、図 2 3に示すように、行動記憶器 9 1、対象物名記憶器 9 2、対象物決定器 9 3、対象物情報記憶器 94及び知覚情報演算器 9 5を備えている。

行動記憶器 9 1は、選択可能とされる複数の行動が記憶されている。例えば、複数の行動がデータベースとして記憶されている。

そして、この行動記憶器 9 1は、行動グループ番号 ' (信号) が入力されること 'により、比較対象とされる複数の行動を 1つの行動グループとして対象物決定器 93に出力する。

例えば、「リンゴを食べる（リンゴの摂食行動）」について例を挙げると次のようになる。

「リンゴを食べる」の行動を具現化する行動としては、例えば、「リンゴに近づく」、「リンゴのにおいをかぐ」、「リンゴを口に入れる」、「リンゴに触る」等が挙げられる。例えば、「近づく」は、対象物との距離を短くする行動であり、また、「においをかぐ」は、対象物に対して例えば鼻を近づけるという行動であり、「口に入れる」は、対象物を口の中に運ぶという行動、「触る」は、対象物に手（脚）を接触させる行動である。これら「近づく」、「においをかぐ」、「口に入れる」及び「触る」等に対応する行動は、対象物一般に適用可能な行動とされる。すなわち、対象物が「ミカン」の場合において、その距離を短くする行動は、「ミカンに近づく」の行動になり、また、鼻を近づける行動は、「ミカンのにおいをかぐ」の行動になり、口に運ぶ行動は、「ミカンを口にいれる」の行動になり、また、手を接触させる行動は、「ミカンに ¾1}る」の行動になる。

行動記憶器 9 1は、このような「近づく」等の対象物一般に適用可能な複数の行動情報を 1つの行動グループとして対象物決定器 9 3に出力している。すなわち、行動記憶器 9 1は、このような「リンゴを食べる」等の上位の行動を具現化する下位の行動の対象物の情報を抜いて規定された行動名情報を対象物決定器 9 3に出力している。そして、この行動記憶器 9 1から出力される行動名情報は、行動選択演算部 8 2において出現傾向が比較される行動に対応されるものである。よって、互いに抑制する関係にある行動となる。

このように対象物一般に適用可能な情報としての行動名情報を保持しているのは、対象物が異なる同じ動作について信号（コマンド）を複数定義する必要をなくし、各対象物毎の行動を規定した場合の例えばデータベース等のシステムの肥大を防止して、逆に同様な行動を起こす場合に対象物毎に所作自体に大きな差異はないことによる。なお、特別の行動については、対象物の情報を含めて改めて行動を規定すればよい。

一方、対象物名記憶器 9 2には、対象物名が記憶されている。この対象物名記憶器 9 2に記憶される対象物名は、上位の行動において選択された対象物名である。例えば、上位の行動として「リンゴを食べる（リンゴの摂食行動）」が選択された場合には、ロボット装置 1がリンゴの存在を認識した場合であり、この場合、「リンゴ」が対象物名として対象物名記憶器 9 2に記憶される。そして、対象物名記憶器 9 2は、対象物名情報（対象物信号）を対象物決定器 9 3に出力する。

上述の行動記憶器 9 1では、下位の行動について対象物一般に適用可能な行動情報を対象物決定器 9 3に出力しており、この対象物名記憶器 9 2は、その対象物名を対象物決定器 9 3に出力するものである。よって、対象物決定器 9 3では、行動記憶器 9 1から出力される情報（行動名信号）と対象物名記憶器 9 2から出力される情報（対象物信号）とから、比較対象とされる複数の行動が完全な情報として形成される。

対象物決定器 9 3は、そのように比較可能な形態として複数の行動情報（行動グループ信号）を知覚情報演算器 9 5に出力する。すなわち、対象物決定器 9 3 は、行動記憶器 9 1により取得した行動名と、対象物名記憶器 9 2により取得した対象物名とを対応した形（ペア）として知覚情報演算器 9 5に出力する。

なお、比較対象となる複数の行動の全てが対象物を必要とする行動であるとは限らない。このような場合には、対象物名記憶器 9 2からは、そのような行動に対応して「対象物はない」といった情報を対象物決定器 9 3に出力するようにする。これにより、対象物決定器 9 3では、対象物がない行動の情報として、行動記憶器 9 1から出力された行動の情報を知覚情報演算器 9 5に出力する。

このように構成されている行動記憶器 9 1、対象物名記憶器 9 2及び対象物決定器 9 3は例えば次のように処理をする。例えば、行動記憶器 9 1は、行動グル —プ番号" 1 " が入力されると、行動グループ" 1 " を構成する" 行動（Behavi or) 0 " 、 "行動 1 ".、 " 行動 2 " 、 " 行動 3 " を対象物決定器 9 3に出力する _c 一方、対象物名記憶器 9 2は、 " 行動 0 " に対応して"食物" を出力し、 " 行動 1 " に対応して" 水" を出力し、行動グループ" 2 " に対応して" 対象物なし" を出力し、 "行動 3 " に対応して" 対象物なし" を出力する。例えば、このような例は、上位の行動が「摂取行動」である場合であり、上述したように、上位の行動が「リンゴを食べる」であれば、この対象物名記憶器 9 2からは" リンゴ" のみが出力される。そして、対象物決定器 9 3では、行動記憶器 9 1から出力された各" 行動" と、対象物名記憶器 9 2から出力された" 対象物名" とをペアとして、意味のある行動情報として、知覚情報演算器 9 5に出力する。

入力セマンティクスコンパ一夕モジュール 5 9は、対象物情報記憶器 9 4に対して、 Dボット装置 1に入力されてきた知覚に関する情報を出力しており、対象物情報記憶器.9 4では、入力セマンティクスコンバ一夕モジュール 5 9から送られてくる知覚に関する情報が記憶される。すなわち、例えば、対象物情報記憶器 9 4には、対象物とされる「リンゴ」、「リンゴまでの距離」、「リンゴのある方向」'等といった、出現傾向の算出に使用する知覚評価のためのパラメータが記憶される。

知覚情報演算器 9 5は、対象物情報記億器 9 4からの対象物情報（対象物情報信号）と、対象物決定器 9 3からの行動グループ情報（行動グループ情報信号）とに基づいて、行動選択演算部 8 2において出現傾向が比較される各行動に対応した知覚評価 R M [ i ] を取得する。すなわち、例えば、「リンゴまでの距離」を用いて、「リンゴを食べる（リンゴの摂食行動）」についての知覚評価をしたり、「リンゴに近づく」について知覚評価をしたりする。

そして、このように知覚情報演算器 9 5により取得された知覚評価 R M [ i ] が行動選択演算部 8 2に出力される。例えば、知覚評価 R M [ i ] は、図 1 9に示すように、べクトル量と.して知覚情報取得部 9 0から行動選択演算部 8 2.に出力される。

なお、対象物決定器 9 3から同期信号を対象物情報記憶器 9 4に出力することもできる。同期信号により対象物決定器 9 3の出力と対象物情報記憶器 9 4の出力の同期を取ることができるようになり、これにより、知覚情報演算器 9 5には、対象物決定器 9 3からの行動に対応されるパラメータが所定のタイミングで入力させることができるようになる。

また、基本的には、ロボット装置 1は、この知覚情報取得部 9 0を 1つだけ備えるものである。しかし、知覚情報取得部 9 0を、各行動それそれについてそれそれに備えることもできる。このような場合には、知覚情報取得部 9 0が 1つの行動で対象物一般に適用することのみを考慮すればよいことになることから、行動記憶器 9 1を備える必要がなくなる。例えば、このような例は、後述するような行動選択部を複数のオブジェクトとして構成する場合である。

この知覚情報取得部 9 0における処理の手順について図 2 4を用いて説明する。先ず、ステップ S 1 1において、行動グループ名の取得がなされる。行動グループ名の取得とは、「リンゴを食べる」の下位行動である「リンゴに近づく」、「リンゴのにおいをかぐ」等を示す行動グループ名の取得である。

続いて対象物選択ルーチンが実行される。対象物選択ルーチンでは、ステップ S 1 2にて、計算する行動名群の取得がなされる。この行動名群の取得により、行動記憶器 9 1に複数の行動（対象物一般に適用可能な形態の行動情報）が記憶される。例えば、「近づく」、「においをかぐ」等の行動名を規定する情報である。

また、ステヅプ S 1 3にて、対象物名の取得がなされる。この対象物名の取得により、対象物名記憶器 9 2に上位の行動において取得された対象物名称が記憶される。例えば、「リンゴ」等の対象物の情報である。

このように対象物選択ルーチンにおいて、行動名群の取得及び対象物名の取得がなされる。続くステヅプ S 1 4において、選択された全ての行動に対して、知覚情報演算器 9 5における知覚評価 R M [ i ] の計算を行ったか否かの判別がなされる。選択された全ての行動に対して知覚評価 R M [ i ] の計算が終了している場合には、当該処理を終了して、選択された全ての行動に対して知覚評価 R M [ i ] の計算が終了していない場合には、知覚評価算出ルーチンが実行される。知覚評価算出ルーチンは、知覚情報演算器 9 5において実行されるもので次のような処理からなる。

ステヅプ S 1 5において、対象物が存在するか否かについての判別がなされる。対象物が存在する場合には、ステップ S 1 6に進み、対象物が存在しない場合には、ステップ S 1 8に進む。

ステップ S 1 6において、知覚情報演算器 9 5は、対象物情報記憶器 9 4からの対象物についての距離及び方向（知覚評価取得のためのパラメ一夕）を取得して、ステップ S 1 7で知覚評価（Value) R M [ i ] を算出する。すなわち、例えば、リンゴまでの距離」から、「リンゴに近づく」の評価 R M [ i ] を算出する。なお、距離は距離センサ 2 2により検出し、方向は C C Dカメラ 2 0の撮像画像等を利用して検出する。

一方、ステップ S 1 8において、知覚情報取得器 9 5は、対象物がない状態にて知覚評価（Value) R M [ i ] を算出する。例えば、この処理は、知覚評価をする行動が対象物を要しない場合に対応される。

このような知覚評価算出ルーチンは、上述のステップ S 1 4の判別処理において、比較対象とされる全ての行動（行動グループを構成する複数の行動）について、知覚評価 RM [i] の計算を行ったと判断されるまで実行される。すなわち、ステップ S 14の処理と知覚評価算出ルーチンとで、行動グル一プ内の全ての行動につい.ての知覚評価 RM [i] が算出される。

ステップ S 14にて、行動グループ内の全ての行動の知覚評価 RM [i] が算出されたと判断されると、当該処理が終了する。

以上のように知覚情報取得部 90が構成されており、この知覚情報取得部 90 により、行動グループにおける比較対象の複数の行動についての知覚評価 RM [ i ] を取得することができる。

( 3 - 6 - 3 ) 動機情報取得部における処理

動機情報取得部 81は、外部又は内部の情報（認識結果）に応じて変化する本能及び感情の状態に基づいて、行動の原因因子の 1つである動機を取得する。この動機情報取得部 8 1は、図 2 5に示すように、本能 .感情パラメ一夕 I E

[P] を複個数（本能 ·感情パラメ一夕群）を有し、これにより複数個の行動の動機 Mo t [i] を取得している。具体的には、次のようにして行動の動機を取得する。

本能 '感情パラメ一夕群 I E [p] は、本能や感情に影響される情報によって構成されており、具体的には、上述したような内的状態モデルによって決定される複数のパラメ一夕から構成されている。すなわち、本能 ·感情パラメータとして、例えば、「疲れ」、「体内温度」、「痛み」、「飢え」、「乾き」、「愛情」、「服従性」、「好奇心 j 、「***」、「幸せ」、「悲しみ」、「怒りぶ、「驚き」、「嫌悪」、「恐れ」、「苛立ち」、「退屈」、「眠気」、「社交心」、「根気」、「緊張 ' リラヅクス」、「警戒」、「罪」、「悪意」、「誠実さ」、「***」、「嫉妬」等が挙げられる。

また、行動の動機群 Mo t [ i] は、同一の行動グループ内における複数の行動に対応される動機群である。例えば、「摂食行動」についての「空腹」等や「摂水行動」についての「のどのかわき」等である。

この動機情報取得部 8 1は、このような本能 ·感情パラメ一夕 I E [p] をマヅビングして各行動についての動機 Mo t [i] を算出する。具体的には、（2 2 ) 式により算出する。 Mot [0] ,[o] K[O]W K[0][m] ffi[0]

Mot [l] ゆ M κ[ι]Η IE[1]

(22)

Mot [2] K[i][。] 尋] K[i]H IE [m]

この（22) 式により、本能 .感情パラメ一夕 I E [p] に係数 K [ i]

[ρ] を掛け合わせて、線形和としてのマッピングにより.各行動の動機 Mo t [i] を算出する。このような行列式として箅出された動機動機 Mo七 [i] は、図 19に示すように、ベクトル量として動機情報取得部 8 1から行動選択演算部

82に出力される。

例えば、「探索」、「ねだる」、「休む」の動機を例に挙げて具体的に説明する。「探索」の動機 Mo t [0] 、「ねだる」の動機 Mo t [ 1 ] 及び「休む」の動機 M 0 t [ 2 ] は（ 23 ) 式として与えられる。

また、 K [i] [p] を（24) 式に示すように与える

また、本能 ·感情パラメ一夕 I E [p] は（25) 式に示すように与える

IE[p]= 好^疲

(25)

心欲

このような関係から、「探索」、「ねだる」、「休む」の各動機は、（26) 式のように示される。

、

-10 10 0 疲れ

0 0 15 X 好奇心 (26)

休む

10 一 5 0 f情欲

この（26) 式では、「探索」は、「疲れ」がマイナス因子として作用し、. · 「好奇心」がプラス因子として作用する本能 ·感情パラメ一夕の関数となることを示す。また、「ねだる」は、「愛情欲」がプラス因子として作用する本能 ·感情パラメ一夕の関数となることを示す。また、「休む」は、「疲れ」がプラス因子として作用し、「好奇心」がマイナス因子として作用する本能 ·感情パラメ一夕の関数となることを示す。

ここで、第 1の例として、本能 ·感情パラメ一夕 I E [p] が [ 10， 50， 20] の場合について考えてみる。例えば、このようなような状態は、好奇心が高い状態をいう。このような状態では、「探索」 Mo t [0] が400 (=- 1 00 + 500 + 0) となり、「ねだる」 Mo t [1] が 300 (= 0 + 0 + 30 0 ) となり、「休む」 Mo t [2] がー 1 50 (= 100 -2 50 + 0) となる, 第 2の例として、本能 .感情パラメ一夕 I E [p] が [70， 10， 30] の場合について考えてみる。例えば、このようなような状態は、探し疲れた状態をいう。このような状態では、「探索」 Mo t [0] がー 600 (ニー 700 + 1 00 + 0) となり、「ねだる」 Mo t [1] が 450 (= 0 + 0 + 450) となり、「休む」 Mo t [2] が 650 (= 700- 50 + 0) となる。

第 3の例として、本能 ·感情パラメ一夕 I E [p] が [30， 20， 60] の場合について考えてみる。例えば、このようなような状態は、疲れがちょっと回復し、愛情欲が高い状態をいう。このような状態では、「探索」 Mo t [0] が - 1 00 ( = -300 + 200 + 0) となり、「ねだる j Mo t [ 1 ] が 300 (= 0 + 0 + 300) となり、「休む」 Mo t [2] が 200 (=300— 1 0 0 + 0) となる。

このようにして、本能 '感情パラメータ群 I E [ρ] と係数 K [i] [m] とから、行動の動機 Mo t [i] を取得することができる。そして、本能 .感情パラメ一夕群 K [i] [p] のマヅビングを適切に設定することにより、出現傾向 RM [ i ] の取得のための所望の動機 Mo t [i] を得ることができる。すなわち、例えば、上述の例でいう「のどのかわき」、「空腹」といった動機をも得ることができる。

以上のように動機情報取得部 8 1が構成されており、この動機情報取得部 8 1 により、各行動についての動機 Mo t [i] を取得することができる。この動機情報取得部 8 1により得ちれる動機は、本能や感情のパラメ一夕値の変化に応じて変化するものであって、結果として、選択された行動に反映される。例えば、上述の例では次のように、動機が行動に反映されることとなる。

欲求は、基本的には、時間増加であるため、満たされないと増加する。好奇心が高くなると、ロボヅト装置 1は探索を始める（上述の第 1の例) 。探索することで歩き回るため、歩いた分だけ疲れが蓄積される。また、好奇心自体も探索することによって減少してくる。しばらく歩き回っても何も入力されないと、好奇心が減少し、疲れが増大することによって、休む行動にスイッチする（上述の第 2の例）。しばらくして休むことによって疲れが減少し、時間によって増加してきた愛情欲によってロボット装置 1の行動はねだるにスィツチされる（上述の第 3の例）。このように、動機が、選択された行動に反映されることがわかる。なお、上述した係数 K [i] [p] の値については、任意に設定することができる。例えば、任意に設定することにより、動機 Mo t [ i] の取得のための本能 '感情パラメ一夕 I E [p] によるマッピングを種々変化することができるようになる。これにより、係数 K [i] [p] の設定によっては、ロボヅト装置 1 に適用する動物の種類や成長レベル等に対応して、マヅビングすることができるようになる。

以上、知覚評価 RM [i] を取得する知覚情報取得部 90及び動機状態 Mo t [i] を取得する動機情報取得部 8 1との具的な構成について説明した。以上のような知覚情報取得部 90及び動機情報取得部 8 1によって取得された知覚評価 RM [i] 及び動機状態 Mo t [ i ] により、行動選択演算部 82のおいて一の行動の選択がなされる。

そして、このような行動の選択処理が、最下位の行動層における行動の選択がなされるまで実行される。すなわち、上述の図 7に示したように行動選択のためのシステムを階層構造として構築しており、最下位の行動（実際に出力する行動）を決定するまで、各層において上述したように、知覚評価 RM [i] と動機情報 Mo七 [i] とによる行動選択処理を実行する。すなわち、図 6 Bに示すように、「摂取行動」はサブシステム層においてした知覚評価 RM [i] と動機情報 M 0七 [ i ] と.に基づぐ行動選択の結果であり、「摂水行動」は、さらに具現化した行動群からなるモード層においてした知覚評価 RM [i] と動機情報 Mo t [i] とに基づく行動選択の結果であり、「水に近づく」は、またさらに具現化した行動群からなるモジュール層においてした知覚評価 RM [i] と動機情報 Mo t [i] とに基づく行動選択の結果であり、「前進する」は、またさらに具現化した行動群からなるモータコマンド層においてした知覚評価 [ i] と動機情報 Mo t [i] とに基づく行動選択の結果である。このような選択処理により、抽象的な行動（願望としての行動）である「摂食行動」が、「前進する」といった実際の行動によって実現されることになる。 '

なお、各層における行動の選択において、上述したように、知覚や動機等の原因因子によってその出現傾向が算出されて、それに基づいて一の行動が選択されているが、出現傾向を算出する際に使用する動機情報を全ての層において一律のものを使用してもよい。すなわち.、例えば、「摂取行動」が上位の行動とされている場合には、その下位の行動は全て「摂取行動」を実現するためのものであることを考えれば、当該下位の行動は、「飢え（乾き）」の状態を満たすための行動となる。よって、「摂取行動」を実現するための下位の行動は、' 「飢え（乾き）」の状態が動機の情報（原因因子）となる。

なお、知覚については、必ずしもそのような関係にはならない。「水に近づく」の知覚情報（外部知的要素）として「水への距離」が挙げられるが、その「水に近づく」の下位の「前進する」の知覚情報としては、「水のある方向」が最適である場合もあるからである。

( 3 - 7 ) モジユレ一夕における処理

モジユレ一夕 7 2及び後述する出力セマンティクスコンバ一夕モジュール 6 8 により、上述したように、行動選択演算部 8 2にて選択された一の行動を実際に出現するための処理がなされる。

モジユレ一夕 7 2は、行動選択部 8 0において選択された一の行動と、内的 _:状態モデル部 7 1から出力された代表感情情報（代表感情信号）とから最終的に出現させる行動を決定する。

ここで、内的感情モデル部 7 1から出力される代表感情情報は、ロボット装置 1の.現在の感情状態を示すものである。例えば、'内的感情モデル部 7 1は、本能 (欲求）又は感情のパラメータ値の一番大きい本能又は感情を代表感情情報として出力する。

モジユレ一夕 7 2は、このような代表感情に基づいて、行動選択部 8 0において選択された一の行動をいわゆる変調するものである。すなわち、モジユレ一夕 7 2の処理により、行動において感情が表出されるようになる。

れにより、例えば、現在の感情をロボット装置 1の行動として直接出現させる必要はないが、感情表現を含ませて行動を出現させる場合に有効なものとなるすなわち、例えば、本当に怒っていない状態であるが、少し怒っているような場合に、行動選択部 8 0により選択された行動に「不機嫌さ」を伴わせる（付加させる）ような場合である。

モジユレ一夕 7 2は、上述のような感情により変調された選択された一の行動についての情報を、出力セマンティクスコンバ一夕モジュール 6 8に出力する。例えば、モジユレ一夕 7 2は、行動の情報を抽象的な行動コマンドとして出力セマンティクスコンバ一夕モジュール 6 8に出力する。

出カセマンティクスコンバータモジュール 6 8は、モジユレ一タ 7 2からの行動情報に対応する出力を信号処理モジュール 6 1〜 6 7に与える。これにより、ロボヅト装置 1は、行動決定システム 7 0において決定された行動を実際のものとして出力する。

以上、行動決定システム 7 0について説明した。上述のような行動決定システム 7 0により、入力セマンティクスコンバータモジュール 5 9における認識結果に基づいて内的状態モデル部 7 1では、ロボヅト装置 1の本能及び感情の状態などの内的状態を変化させることができる。また、行動選択部 8 0では、認識結果に基づいて、複数の行動からロボット装置 1が出現する一の行動を選択することができる。

そして、モジユレ一夕 7 2により、内的状態モデル部 7 1により得られた内的状態と行動選択部 8 0.により得られた一の行動とに基づいて、感情が付加された行動情報の生成がなされる。そしてモジュレー夕 7 2により、感情が付加された行動情報が出力セマンティクスコンバータモジュール 6 8に出力される。

( 4 ) 出力セマンティクスコンバータモジュールにおける処理

出力セマンティクスコンバ一夕モジュール 6 8は、ロボヅト装置 1の夕ィプ (例えば、二足歩行型や四足歩行型等）や形状等の情報を保持しており、この情報に応じてモジユレ一夕 7 2からの行動情報を各信号処理モジュール 6 1〜 6 7 を制御する。例えば、 4足により歩行する本実施の形態のロボット装置 1の場合には、出力セマンティクスコンパ'一夕モジュール 6 8は、四足歩行型のロボヅト装置 1であることを把握していることから、「前進する」といった行動情報がモジユレ一夕 7 2から送られてきたときには、その「前進する」を実現するために 4本の脚を制御する信号処理モジュールにコマンドを出力する。ここで、出力セマンティクスコンバ一夕モジュール 6 8は、モジユレ一夕 7 2からの抽象的な行動コマンドによりそのように対応される各信号処理モジュール 6 1〜 6 7にコマンドを送る。

各信号処理モジュール 6 1〜 6 7は、出力セマンティクスコンバー夕モジユール 6 8からのコマンドに基づいて、対応するデバイスを制御する。これにより、上述のような行動決定システム 7 0において決定（選択）された行動が、実際のものとしてロボット装置 1の行動として出現されたことになる。

また、このようなロボット装置 1の行動の出現は、姿勢と動作の管理がされたもとにおいてなされている。ロボット装置 1の各部は原則的には独立として動作することはできるが、姿勢と動作を管理することにより所定の動作を独立して動作させることを禁止している。

• ロボット装置 1は、図 1に示したように、胴体部ユニット 2に対して、脚部ュニット 3 A〜 3 D、頭部ュニット 4及び尻尾部ュニヅト 5が連結されて構成されている。これにより、基本的には、ロボット装置 1は、選択された行動に応じて、各信号処理モジユールが個別に制御することで各部が独立して動作することができるようになされている。しかし、場合によっては、各ユニットの動作の干渉により、不適切な動作となる場合もある。また、目的とする姿勢或いは動作への遷移が、現在の姿勢から無理なときもある。

そこで、ロボット装置 1は、無理な姿勢や、部位（各ユニット）同士の干渉が起こることを防止すべく、各ユニット間の整合をとり、姿勢と動作の管理をしている。ロボット装置 1は、このような姿勢や動作を.、図 4に示す姿勢管理モジュール 6 1により管理している。 .

具体的には、姿勢管理モジュール 6 1は、ロボヅト装置 1は座っている場合において、 "前へ歩け" というような命令を受信したときには、「座り状態」から「歩く状態」への'遷移させる姿勢遷移経路を探索する。例えば、複数の姿勢や動作を経由して、「座り状態」から「歩く状態」への遷移経路を探索する。そして、「座り状態」から「歩く状態」への遷移経路探索の結果に基づいて、そのような遷移経路上にある姿勢や動作を実行すべく、遷移させる経路の順番に応じて命令を、各信号処理モジュールに出力する。これにより、ロボット装置 1は、無理な姿勢や、部位同士の干渉を防止して、目的とする所望の姿勢や動作、すなわち、上述した行動決定システム 7 0において決定された行動に到達することができる。以上、ロボット装置 1の構成及びその処理について説明した。上述したような構成を備えることにより、ロボット装置 1は、動物行動学的なアプローチによつて決定された行動を出現させることができるようになる。これにより、ロボット装置 1の生物感が一層増し、ユーザ（飼い主）は、ロボット装置 1に一層の親近感ゃ満足感を感じるようになる。

( 4 ) 他の実施の形態

以上、ロボヅト装置 1について最良の実際の形態について説明した。しかし、本発明は、次に述べるような他の実施の形態としても実現することができる。上述の実施の形態では、行動決定システム 7 0が最終段の行動の選択を、動機情報をも参照して決定している。例えば、図 6 Bに示す例では、「前進する」が動機情報が参照されて選択されているものである。しかし、最終段の.行動選択については、動機情報を除いて決定してもよい。

すなわち、例えば，図 2 6 A及び図 2 6 Bに示すように、「摂取行動」の下位の行動（動作）となる「水に近づく」さらには、その下位の行動（動作）の「前進する」の選択を、動機情報を除いた情報、例えば対象物までの距離等の知覚情報を参照して選択するものとする。例えば、ある行動（例えば、 .漠然とした行動）をしょうとする場合には、動機がその行動選択に大きく作用し、そして、したい行動をある程度絞り込んだ後は、動機とは切り離して、行動の選択処理（選 • 択思考）がそのような行動を実現するためのものにスィッチするようなものである。すなわち、最終的に選択される動作は、動機の影響を受けることなく決定される点がポイントとなる。そして、そのような最終的に動作を決定する場合に、例えば、知覚情報を使用するということである。なお、モード層の階層は 0階層以上であり、モジュール層の階層は 1階層であるものとして定義しても良い。例えば、上述したような動機情報に基づくことなく動作を決定する部分として、例えば図 2 7及び図 2 8に示すように、動作生成部 1 0 0を備える。動作生成部 1 0 0は、行動選択演算部によって選択された行動から、知覚情報等に基づいて、「水に近づく」やその下位の動作とされる「前進丄を行動を実現する動作の選択をする。そして、動作生成部 1 0 0は、選択した動作を、モジユレ一夕 7 2に出力する。モジユレ一夕 7 2では、先に説明したように、内的状態モデル部 7 1から送られてくる感情により変調した行動を出力する。

具体的には、動作生成部 1 0 0は、図 2 9に示すように、知覚情報取得部 9 0、行動選択演算部 1 0 2を備えて構成する。例えば、出力セマンティクスコンパ一タモジュール 6 8からの各種情報が蓄積される対象物情報記憶部 9 4を利用して、行動選択演算部 1 0 2において動作の選択をする。これにより、 '動作生成部 1 0 0は、例えば、「前進する」の際には、対象物情報記憶器 9 4に記憶されている情報である対象物まで距離（例えば、対象物までの距離が 1 0 c mである情報）や方向（例えば、対象物が右方向にある情報）の情報のみを利用して、行動選択演算部 1 0 2において動作の選択を行う。

また、上述の実施の形態では、行動選択部 8 0によって複数の行動から一の行動を選択している場合について説明した。例えば、行動選択部 8 0では複数の行動の情報を保持しており、これら行動のデータに基づいて一の行動を決定している。しかし、これに限定されるものではない。

例えば、行動決定システム 7 0は、行動決定する部分をオブジェクト指向により設計することができる。なお、オブジェクト指向として行動決定するシステムを構築する場合でも、上位の行動と下位の行動といった.ような階層構造としての関係はそのまま用いる。そして、行動の選択は、オブジェクト単位として構成される行動グループから当該オブジェクト単位で一の行動を選択するようにする。具体的には、図 3 0に示すように、行動システムにおいて行動の選択を複数の行動選択部（オブジェクト或いはスレッド） 8 0 ^ . 8 0 2 , 8 0 ₃を階層構造として備えるようにする。

本例では、図 3 0に示すように、オブジェクトとされる行動選択部が 2階層とされてシステムが構築されているが、これに限定されないことはいうまでもない。各行動選択部 8 0 _{1 5} 8 0 2 , 8 0 sは、上述した行動決定システム 7 0が唯一として備える行動選択部 8 0と同様に、知覚情報取得部 9 0、動機情報取得部 8 1 及び行動選択演算部 8 2を備える。

このように構成した場合、上位の行動選択部 8 0！が選択した行動に基づいて、下位の行動選択部部 8 0 ₂， 8 0 ₃において行動の選択を行う。ここで、上位の行動の選択は、下位層の一の行動選択部の選択となる。そして、選択された一の行動選択部は、更に下位の行動の選択を行う。

そして、このような複数の行動選択部 8 0 8. 0 ₂， 8 0 ₃からなるシステムの最下位に位置される行動選択部が、選択した行動の情報を、上述したような動作生成部 1 0 0に引き渡す。

このような、オブジェクト指向として行動決定のためのシステムを構築することにより、行動選択のために常にシステム全体についての処理或いは把握をする必要がなくなり、行動選択の処理負担が軽減されるようになる。また、後に新たな行動を加える場合であっても、そのような新たなオブジェクトを加えるだけで済み、行動選択のためのデータを全て書き換えるといったような手間もかからない。例えば、新たな行動を加える場合とは、学習によって新たな行動を取得した場合や、成長レベルの変化により新たな行動が加わる場合をいう。

また、図 6 B或いは図 2 6 Bに示したサブシステム層（SUBSYSTEM) 、モード層 (MODE 1 , M0DE2 ) 、モジュール層（MODULE) における各行動グループ構成の具体例は、図 3 1及び図 3 2に示すようになる。

以上説明したようなロボット装置は、外部又は内部情報を検出手段により検出し、検出手段が検出した外部又は内部情報であって、行動に影響する情報とされる原因因子を原因因子取得手段により取得し、原因因子取得手段が取得した原因因子に基づいて、当該原因因子に影響される行動の出現傾向を出現傾向取得手段 • により取得し、出現傾向取得手段が取得した 2つ以上の行動に対応する出現傾向であって、同一グループとされる出現傾向を出現傾向比較手段により比較し、出現傾向比較手段による出現傾向の比較結果に基づいて、一の行動を行動選択手段により選択し、行動選択手段が選択した行動に基づいて、動作部を動作部制御手段により制御して、当該選択された行動を出現させることにより、原因因子に影響されて決定される出現傾向について比較することで、一の行動を選択しており、動物行動学的なアプローチとしての行動を出現するようになる。

このようなロボット装置の行動決定方法は、ロボ、ソト装置の外部又は内部情報を情報検出工程にて検出手段により検出し、情報検出工程にて検出した外部又は内部情報のロボット装置の行動に影響する情報とされる原因因子を原因因子取得工程にて取得し、原因因子取得工程にて取得した原因因子に基づいて、当該原因因子に影響される行動の出現傾向を出現傾向取得工程にて取得し、出現傾向取得工程にて取得した 2つ以上の行動に対応する出現傾向であって、同一グループとされる出現傾向を出現傾向比較工程にて比較し、出現傾向比較工程における出現傾向の比較結果に基づいて、一の行動を行動選択工程にて選択し、行動選択工程にて選択された行動に基づいて、ロボット装置の動作部を動作部制御工程にて制御して、当該ロボット装置に選択された行動を出現させることにより、ロボット装置は、原因因子に影響されて決定される出現傾向について比較することで、一の行動を選択しており、動物行動学的なアプローチとしての行動を出現するようになる。

Claims

請求の範囲

1 . 動作部を制御して行動を出現させるロボット装置であって、

外部又は内部情報を検出する検出手段と、

上記検出手段が検出した外部又は内部情報であって、行動に影響する情報とされる原因因子を取得する原因因子取得手段と、

上記原因因子取得手段が取得した原因因子に基づいて、当該原因因子に影響される行動の出現傾向を取得する出現傾向取得手段と、

上記出現傾向取得手段が取得した 2つ以上の行動に対応する出現傾向であって、同一グループとされる出現傾向を比較する出現傾向比較手段と、

上記出現傾向比較手段による出現傾向の比較結果に基づいて、一の行動を選択する行動選択手段と、

上記行動選択手段が選択した行動に基づいて、動作部を制御して、当該選択された行動を出現させる動作部制御手段とを備え、

上記行動選択手段が選択した一の行動の出現傾向は、当該行動の実際の出現により変化する原因因子に応じて変化すること

を特徴とするロボット装置。

2 . 上記原因因子取得手段は、少なくとも知覚に関する原因因子及び動機に関する原因因子を取得すること · '

を特徴とする請求の範囲第 1項記載のロボット装置。

3 . 上記原因因子取得手段は、上記動機に関する原因因子として、少なくとも本能的要素又は情動的要素からなるものを取得すること

を特徴とする請求の範囲第 2項記載のロボット装置。

4 . 上記本能的要素が、疲れ（fatigue) 、熱或いは体内温度（temperature) 、痛み (pain) 、食欲或いは飢え (hunger) 、乾き (thirst)、愛情 (affection) 好奇心 ( curiosity) 、 *** (el imination) 又は*** (sexual) のうちの少なくとも 1つであり、上記情動的要素が、幸せ（happiness) 、悲しみ（sadness) 、怒り（anger) 、驚き（surprise) 、嫌悪（disgust) 、恐れ（fear) 、苛立ち (frustration) 、退屈 (boredom) 、睡眠 (somnolence) 、社交性 (gregarious ness) 、根気（patience) 、緊張（tense) 、リラックス（relaxed) 、警戒（al ertness) 、罪 (gui lt) 、悪意 (spite) 、誠実さ ( loyalty) 、服従性 .（submis s ion) 又は嫉妬（jealousy) の内の少なくとも 1つであること

を特徴とする請求の範囲第 3項記載のロボット装置。

5 . 出現可能とされる複数の行動が階層構造として構築され、同一グループとされる複数の下位の行動が上位の行動の具体的な行動を示す行動選択システムを有し、

上記出現傾向比較手段は、上記上位の行動に対応されるグループ内の複数の下位の行動について出現傾向を比較し、

上記行動選択手段は、上記出現傾向比較手段による出現傾向の比較結果に基づいて、一の下位の行動を選択し、

上記動作部制御手段は、上記行動選択手段が選択した行動が最下位の行動であるときに、当該最下位の行動に基づいて、動作部を制御すること

を特徴とする請求の範囲第 1項記載のロボット装置。

6 . 上記原因因子取得手段は、知覚に関する原因因子及び動機に関する原因因子を取得していき、

上記出現傾向取得手段は、少なくとも最下位層の行動については、上記知覚に関する原因因子に基づいて、当該最下位層の行動の出現傾向を取得することを特徴とする請求の範囲第 5項記載のロボット装置。

7 . 各行動に対応して、行動選択のための複数のオブジェクトを有しており、上記原因因子取得手段、上記出現傾向取得手段及び上記行動選択手段は、各ォブジェクトにより実現していること

を特徴とする請求の範囲第 1項記載のロボット装置。

8 . 上記出現傾向比較手段は、比較する行動の出現傾向の間で排他処理をして、複数の出現傾向を比較すること

を特徴とする請求の範囲第 1項記載のロボット装置。

9 . 上記検出手段はセンサであること

を特徴とする請求の範囲第 1項記載のロボット装置。

1 0 . 上記原因因子取得手段は、上記センサが検出した外部又は内部情報とされるセンサ情報から、行動を評価するための原因因子を取得すること

を特徴とする請求の範囲第 9項記載のロボット装置。. ■

1 1 . ロボット装置の外部又は内部情報を検出手段により検出する情報検出工程と、

上記情報検出工程にて検出した外部又は内部情報のロボット装置の行動に影響する情報とされる原因因子を取得する原因因子取得工程と、

上記原因因子取得工程にて取得した原因因子に基づいて、当該原因因子に影響される行動の出現傾向を取得する出現傾向取得工程と、

上記出現傾向取得工程にて取得した 2つ以上の行動に対応する出現傾向であつて、同一グループとされる出現傾向を比較する出現傾向比較工程と、

上記出現傾向比較工程における出現傾向の比較結果に基づいて、一の行動を選択する行動選択工程と、

上記行動選択工程にて選択された行動に基づいて、上記ロボット装置の動作部を制御して、当該ロボット装置に上記選択された行動を出現させる動作部制御ェ程とを有し、 ' - 上記行動選択工程にて選択された一の行動の出現傾向は、当該行動の実際の.出現により変化する原因因子に応じて変化すること

を特徴とするロボット装置の行動決定方法。

1 2 . 上記原因因子取得工程では、少なくとも知覚に関する原因因子及び動機に関する原因因子を取得すること

を特徴とする請求の範囲第 1 1項記載のロボット装置の行動決定方法。

1 3 . 上記原因因子取得工程では、上記動機に関する原因因子として、少なくとも本能的要素又は情動的要素からなるものを取得すること

• を特徴とする請求の範囲第 1 2項記載のロボヅト装置の行動決定方法。

1 . 上記本能的要素が、疲れ（fatigue) 、熱或いは体内温度（temperature) 、痛み (pain) 、食欲或いは飢え (hunger) 、乾き (thirst) 、愛情 (affection) 好奇心 ( curiosity) 、 *** (el imination) 又は*** (sexual) のうちの少なくとも 1つであり、上記情動的要素が、幸せ（happiness) 、悲しみ（sadness) 、怒り (anger) 、驚き (surprise) 、嫌悪 (disgust) 、恐れ (fear) 、苟立ち

(frustration) 、退屈 (boredom) 、睡眠 (somnolence) 、社交性 (gregarious ness) 、根気（patience) 、緊張 (tense) 、リラヅクス（relaxed) ヽ. 警戒（al ertness) 、罪 (guilt) 、悪意 (spite) 、誠実さ ( loyalty) 、服従性 (submis sion) 又は嫉妬（jealousy) の内の少なくとも 1つであること

を特徴とする請求の範囲第 1 3項記載のロボット装置の行動決定方法。

1 5 . 上記ロボット装置が、出現可能とされる複数の行動の情報を階層構造として構築され、同一グループとされる複数の下位の行動が上位の行動の具体的な行動を示す行動選択システムを有し、

上記出現傾向取得工程では、上記上位の行動に対応されるグループ内の複数の下位の行動について出現傾向を比較し、

上記行動選択工程では、下位の行動の出現傾向の比較結果に基づいて、一の下位の行動を選択し、

上記動作部制御工程では、上記行動選択工程にて選択された行動が最下位の行動であるときに、当該最下位の行動に基づいて、口ポット装置の動作部を制御すること

1 6 . 上記原因因子取得工程では、知覚に関する原因因子及び動機に関する原因因子を取得し、

上記出現傾向取得工程では、少なくとも最下位層の行動については、上記知覚に関する原因因子に基づいて、当該最下位層の行動の出現傾向を取得すること . を特徴とする請求の範囲第 1 5項記載のロポット装置の行動決定方法。

1 7 . ロボット装置が、各行動に対応して、行動選択のための複数のオブジェクトを有しており、

上記原因因子取得工程、上記出現傾向取得工程及び上記行動選択工程は、各ォブジェクトにより実行されること

1 8 . 上記出現傾向比較工程では、比較する行動の出現傾向の間で排他処理をして、複数の出現傾向を比較することを特徴とする請求の範囲第 1 1項記載のロボット装置の行動決定方法。

1 9 . 上記検出手段がセンサであること

2 0 . 上記原因因子取得工程では、上記センサが検出した外部又は内部情報とされるセンサ情報から、行動を評価するための原因因子を取得すること

を特徴とする請求の範囲第 1 9項記載のロボット装置の行動決定方法。