JP2009140348A - 行動決定装置、行動学習装置、及びロボット装置 - Google Patents

行動決定装置、行動学習装置、及びロボット装置 Download PDF

Info

Publication number
JP2009140348A
JP2009140348A JP2007317453A JP2007317453A JP2009140348A JP 2009140348 A JP2009140348 A JP 2009140348A JP 2007317453 A JP2007317453 A JP 2007317453A JP 2007317453 A JP2007317453 A JP 2007317453A JP 2009140348 A JP2009140348 A JP 2009140348A
Authority
JP
Japan
Prior art keywords
words
network
word
behavior
instruction information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007317453A
Other languages
English (en)
Inventor
Kaiken Ri
海妍 李
Tetsuya Inamura
哲也 稲邑
Masayuki Inaba
雅幸 稲葉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP2007317453A priority Critical patent/JP2009140348A/ja
Priority to US12/329,252 priority patent/US20090150142A1/en
Publication of JP2009140348A publication Critical patent/JP2009140348A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/008Artificial life, i.e. computing arrangements simulating life based on physical entities controlled by simulated intelligence so as to replicate intelligent life forms, e.g. based on robots replicating pets or humans in their appearance or behaviour
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/39Robotics, robotics to robotics hand
    • G05B2219/39441Voice command, camera detects object, grasp, move
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Robotics (AREA)
  • Manipulator (AREA)

Abstract

【課題】入力情報から一つの情報空間に各々モジュール化した知能的判断システムを構築することができる行動学習装置及び方法、それによって生成された学習結果を使用した行動決定装置及び方法、これらの装置を搭載したロボット装置を提供すること。
【解決手段】ロボットは、外部からの指示情報から単語を抽出する知識取得部21と、抽出した単語によりネットワークを構築し、単語間の重みを更新するネットワーク構築部22と、単語の関係性をネットワーク上で重み付けした単語ネットワークに基づき、行動を決定する行動決定部23とを有する。
【選択図】図3

Description

本発明は、行動決定装置及び方法、行動学習装置及び方法、ロボット装置並びにプログラムに関し、特に、自律動作が可能なロボット装置に搭載するに好適な行動決定装置及び方法、行動学習装置及び方法並びにプログラム、及びそれを搭載したロボット装置に関する。
従来、ロボットの動作決定方法として、動作をモデル化した動作モデルを記憶し、過去の経験に基づく動作モデルから次の動作を決定する技術が知られている(例えば特許文献1参照)。
特許文献1に記載のロボット装置は、ロボット装置の外部又は内部の状況を入力する状況入力手段と、内部状態ベクトルを管理する内部状態管理手段と、外部又は内部の状況に応じた状況ベクトルに基づき予想内部状態変化ベクトルを算出する連想記憶手段と、内部状態管理手段によって管理されている現在の内部状態ベクトルと連想記憶手段によって算出された予想内部状態変化ベクトルとに基づきロボット装置の情報を生成する情報生成手段とを備える。
連想記憶手段は、顔・人物認識器からの人物IDや物体認識器からの物体ID、その他各種センサ情報などから構成される状況ベクトルを入力とし予想内部状態変化ベクトルを出力とするニューラルネットワークにより構築され、状況ベクトルとそのときの実際の内部状態変化ベクトルとの組を学習サンプルとして学習される。同様の状況ベクトルが得られた場合、連想記憶手段から情動生成手段へと過去の経験に基づいた予想内部状態変化ベクトルが供給される。情動生成手段は、この予想内部状態変化ベクトルと内部状態ベクトルとに基づいて情動を生成し、行動選択手段は、この情動に応じた行動を選択する。
特開2005−297105号公報
しかしながら、特許文献1に記載の技術では、動作モデルとして記憶された範囲での動作しか生成できないという問題点がある。従来の技術においては、周りの状況に応じたロボット自身の動きを生成することをターゲットとしているものであった。そのため、タスク遂行への目的意識はなく、過去と同じ状況で同じような教示した動きを行なう経験抽出にそのフォーカスが向けられていた。
すなわち、従来のロボット(機械)の知能における記憶空間は、ロボット自身の動きからなる環境の変化、又は静的物体情報に対する取るべき行動など、限られた情報に対して、決められた動作のみを行なうものである。これに対し、自律的ロボットにおいては、時間をかけて得られた膨大な情報を分類し、関連付ける技術が必要である。そして、そのような情報を1つの情報空間に各々モジュール化し、集めることができれば、複雑な情報を用いた動作(反応)を生成することができる。
本発明は、このような問題点を解決するためになされたものであり、入力情報から一つの情報空間に各々モジュール化した知能的判断システムを構築することができる行動学習装置及び方法、それによって生成された学習結果を使用した行動決定装置及び方法、これらの装置を搭載したロボット装置を提供することを目的とする。
本発明にかかる行動生成装置は、外部からの指示情報から単語を抽出する単語抽出部と、単語間の関係性をネットワーク上で重み付けした単語ネットワークと、前記単語抽出部が抽出した単語に基づき、行動を決定する行動決定部とを有するものである。
本発明においては、単語間の関係性をネットワーク上で重み付けした単語ネットワークに基づき行動を決定するため、外部からの指示情報と関連性が高い単語からなる動作を決定することができる。
また、前記行動決定部は、前記ネットワーク上で重み順に単語を順次抽出して行動を生成することができ、最も関連性が高い順に単語を抽出して行動決定することができる。
さらに、前記行動決定部にて決定された行動を出力した後、当該行動が正しいか否かをユーザに確認する行動確認部を更に有するものとすることができる。これにより、ユーザが正しい行動を教示することができる。
さらにまた、前記行動確認部にて確認した結果に基づき前記単語ネットワークの重みを更新するネットワーク更新部を更に有することができる。ユーザからの教示により単語ネットワークを更新することができる。
また、前記ネットワーク更新部は、前記ネットワーク更新部は、外部から与えられるか又は検出手段により検出した認識情報と前記単語ネットワークの単語とを関連づけた総合的知的ネットワークを生成することができる。画像やタグ情報などの認識情報(センサ情報)又は当該認識情報に基づき生成された認識情報ネットワークの各錦情報と、単語ネットワークの単語とを関連づけて、ネットワークを拡大し、総合的知能ネットワークを生成することができる。
本発明にかかる行動学習装置は、外部からの指示情報から単語を抽出する単語抽出部と、前記単語抽出部が抽出した単語とその関係性に基づき単語間を重みで関連づけたネットワークを構築すると共に前記指示情報に基づき単語間の重みを更新するネットワーク構築部とを有するものである。
本発明においては、外部からの指示情報を使用して単語間の重みが規定されたネットワークを生成、学習することができる。
また、前記単語抽出部は、正しい指示情報及び誤った指示情報を入力し、前記ネットワーク構築部は、前記正しい指示情報から抽出した単語間の重みを大きくし、前記誤った指示情報から抽出した単語間の重みを小さくすることができ、正しい指示のみならず、誤った指示を入力することで重みの更新をより効率的にすることができる。
さらに、前記ネットワーク構築部は、前記単語間の重みが予め定められた第1の値以上又は予め定められた第2の値以下になった時点で重みの更新を停止することができ、重みがある値に達したら更新を停止するようにしてもよい。
本発明にかかる行動生成方法は、外部からの指示情報から単語を抽出する単語抽出工程と、単語間の関係性をネットワーク上で重み付けした単語ネットワークと、前記単語抽出工程にて抽出した単語に基づき、行動を決定する行動決定工程とを有するものである。
本発明にかかる行動学習方法は、外部からの指示情報から単語を抽出する単語抽出工程と、前記単語抽出工程にて抽出した単語とその関係性に基づき単語間を重みで関連づけたネットワークを構築すると共に前記指示情報に基づき単語間の重みを更新するネットワーク構築工程とを有するものである。
本発明にかかるロボット装置は、外部からの指示に応じて動作を発現するロボット装置であって、外部からの指示情報から単語を抽出する単語抽出部と、単語間の関係性をネットワーク上で重み付けした単語ネットワークと、前記単語抽出部が抽出した単語に基づき、行動を決定する行動決定部とを有するものである。
また、前記抽出した単語によりネットワークを構築し、単語間の重みを更新するネットワーク構築部を更に有することができ、自ら単語ネットワークを学習することができる。
本発明にかかる他のロボット装置は、外部からの指示情報から単語を抽出する単語抽出部と、前記単語抽出部が抽出した単語とその関係性に基づき単語間を重みで関連づけたネットワークを構築すると共に前記指示情報に基づき単語間の重みを更新するネットワーク構築部とを有するものである。
また、本発明に係るプログラムは、上述した行動生成処理、又は行動学習処理をコンピュータに実行させるものである。
本発明によれば、入力情報から一つの情報空間に各々モジュール化した知能的判断システムを構築することができる行動学習装置及び方法、それによって生成された学習結果を使用した行動決定装置及び方法、これらの装置を搭載したロボット装置を提供することができる。
以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。図1は、本発明の実施の形態にかかる2足歩行タイプのロボットを示す斜視図である。図1に示すように、ロボット1は、体幹部ユニット1cの所定の位置に頭部ユニット1a、左右2つの腕部ユニット1b、左右2つの脚部ユニット1dが連結されている。なお、本実施の形態においては、2足歩行タイプのロボットとして説明するが、4足歩行等であってもよく、又は脚部は、車輪等からなるものであってもよい。
図2は、本実施の形態にかかるロボットを示すブロック図である。ロボット1は、制御部101、入出力部102、駆動部103、電源部104、及び外部記憶部105などを有している。
入出力部102は、周囲の映像を取得するためのCCD(Charge Coupled Device)などからなるカメラ121、周囲の音を集音するための1又は複数の内蔵マイク122、音声を出力してユーザと対話等を行なうためのスピーカ123、ユーザへの応答や感情等を表現するためのLED124、タッチセンサなどからなるセンサ部125などを備える。
また、駆動部103は、モータ131及びモータを駆動するドライバ132などを有し、ユーザの指示などに従って脚部ユニット1dや腕部ユニット1bを動作させる。電源部104は、バッテリ141及びその放充電を制御するバッテリ制御部142を有し、各部に電源を供給する。
外部記憶部105は、着脱可能なHDD、光ディスク、光磁気ディスク等からなり、各種プログラムや制御パラメータなどを記憶し、そのプログラムやデータを必要に応じて制御部101内のメモリ(不図示)等に供給する。
制御部は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)、無線通信用のインターフェースなどを有し、ロボット1の各種動作を制御する。そして、この制御部101は、例えばROMに格納された制御プログラムに従って、カメラ121により取得した映像を解析する画像認識モジュール12、画像認識結果に基づき、経路探索を行なう経路探索モジュール13、各種認識結果に基づきとるべき行動を選択する行動決定モジュール14、音声認識を行なう音声認識モジュール15、タグ情報などを認識するタグ情報認識モジュール16等を有する。特に、本実施の形態においては、行動決定モジュール14において、タグ情報認識モジュール16や画像認識モジュール12からの情報等を使用して入力情報から一つの情報空間に各々モジュール化した単語ネットワーク(知識ネットワーク)を生成する。単語ネットワークを用いて行動生成することでより自然な動作を表出する。
ここで、本実施の形態にかかるロボット1は、人間の指示情報を受け取ると、過去の指示情報からその関係性が高い単語を抽出して行動を決定する行動決定モジュール(行動決定装置)を搭載している。これにより、人の指示情報が不十分な場合にも指示者の意図する行動を正確に決定することができる。次に、ロボット装置に搭載される行動決定装置について詳細に説明する。
なお、ここでは、行動決定モジュールを行動決定装置として説明するが、各ブロックの処理は、CPUにコンピュータプログラムを実行させることにより実現することが可能である。この場合、コンピュータプログラムは、記録媒体に記録して提供することも可能であり、また、インターネットその他の伝送媒体を介して伝送することにより提供することも可能である。知識ネットワークの拡大・更新などもインターネット等で最新版を入手することができる。
図3は、本実施の形態にかかる行動決定装置を示す図である。本実施の形態にかかる行動決定装置20は、人間の指示情報に含まれる単語を抽出すると共に記憶・蓄積して単語の関係性をネットワーク上で重み付けする。そして、指示情報を受け取るとその重み付きネットワークに基づいて行動を決定する。これを実現するため、動作決定装置20は、知識取得部21、ネットワーク構築部22及び行動決定部23を有する。
知識取得部21は、ユーザ等の外部から指示情報に含まれる単語を抽出する(知識獲得機能)。指示情報は、「タオルを洗って」のような音声情報の他、ユーザの手に持ったタオルの画像認識結果等であってもよい。
ネットワーク構築部22は当該単語を記憶・蓄積して(蓄積機能)、単語の関係性をネットワーク上で重み付けする。以下、このネットワークを単語ネットワークという。この場合、例えば、正しいケース、誤ったケースを外部より入力し、単語の関連性を学習させる。正しいケースの単語ネットワークにおける単語間の重みを入力される毎に例えば0.01乃至0.1増加させ、正しくないケースの単語ネットワークにおける単語間の重みを例えば0.01乃至0.1減少させるなどする。単語ネットワークにおける単語間の重みの初期値は0.5などとすればよい。
行動決定部23は、ユーザの指示情報を受けると、過去の情報である単語ネットワークからその関係性が高い単語を抽出して行動を決定する。単語ネットワークから関連性が高い単語を抽出して行動を生成するため、ユーザの指示情報が不十分な場合にも、指示者の意図する正確な行動を決定することができる。
ロボットが様々なタスクを遂行するためには、様々なタスクを教わり、その経験を自律的に蓄積する必要がある。本実施の形態においては、人間の発達過程のように、ロボットにも様々な経験をさせ、その知識の蓄積からロボットが知識を自律的に関連づけるようにすることで、経験していないタスクに関しても推測が可能になる。
次に、本実施の形態にかかる行動決定装置について更に詳細に説明する。人間の認知・発達において、その経験の蓄積、記憶、記憶からの参照は、最も基本的な知的判断能力である。その構造を擬似化し、ロボットの知能的判断システムを構築する。本行動決定装置(行動決定モジュール)には、以下のような機能が搭載されている。
1)短編的知識、経験の獲得機能
知識取得部21は、状況から短編的知識(単語レベル)を獲得する。この場合、人間が正しいケース、正しくないケースを教え、知識を獲得させる。正しい・正しくないケースを教えることで、経験値の反映をより早く収束できるようにする。
例えば、
タオルを洗濯機に入れて→○
タオルで拭いて→○
タオルを洗って→○
靴を洗濯機に入れて→×
タオルを靴に入れて→×
タオル、洗濯機、靴などをインデクスでレベル獲得し(概念を含まず)、それらの関係を表現していく。
2)ネットワーク構築機能
蓄積した知識ベースを構築し、カテゴリ化された知識ベース学習(経験ベース)する。本実施の形態においては、ロボットの動きはシンボル化された(抽象化された)ものであることを前提とする。さらに、登場する物体に関しは、認識できたことを前提としインデクスしている。
1)で獲得した短編的知識を蓄積し、そのつながりを元にネットワークを構成する。繰り返し同様の指示情報を入力するなどにより、ネットワークをあるレベルまで収束させる。例えば、単語ネットワークの重みが0.99以上になったら当該単語間の重みを更新するのを停止する。また、重みが0.1以下になったら当該単語の重みを更新するのを停止する。その結果、無意味に集めた経験情報とそのつながりを用いてカテゴリにする。さらに、新規で追加された情報に関しても、カテゴリをベースに実際の単語ネットワークに収束させる。これにより、ユーザからの「タオルを洗濯機に入れて洗剤で洗って」という指示により、1)ではつながりがなかった新たなつながり(洗濯機−洗剤)が生成される。
3)知識の抽出
行動決定部23は、問題解決のための推測(判断)機能を有する。2)の学習、経験の積み上げで収束を続けている単語ネットワークから、タスク実行のための不足情報に関する推論を行なう。
ex1)推測機能
人間の「タオル洗っておいてね」の指示に対し、指示には抜けている「洗濯機」、及び「洗剤」などの情報をロボット自身で推測し、結果として「タオルを洗濯機により洗剤を使用して洗う」という行動を出力する。
ex2)エラー防止機能
人の「革靴、洗濯機で洗ってね」の指示に対し、靴と洗濯機との間の重みが小さく、よって靴を洗濯機で洗ってはいけないことを知識ベースで有するため、これをそのまま実行するようなことをせず、例えば人間に、革靴を洗濯機で洗ってよいか否かの確認を行なうようにする。
次に、本実施の形態にかかる行動決定装置の動作について説明する。図4は、本実施の形態にかかる単語ネットワークを示す図である。図5は、本実施の形態における単語ネットワーク構築方法を示すフローチャートである。図6は、本実施の形態にかかる行動決定方法を示すフローチャートである。先ず、ロボット装置が、図4に示すような単語ネットワークを構築する方法について説明する。単語ネットワークは、単語間の結びつき(関連性)と、単語間の結びつきの強さ(関連性の強さ)を数値化したものである。図4の例においては、タオルと靴とは両者間の重みが0.15であり関連性が低く、タオルと洗濯機とは両者間の重みが0.99であり関連性が強い。
このような単語ネットワークを構築するため、ロボット1の行動決定装置20における知識取得部21は、人間から常識情報を取得する(ステップS1)。これは、上述したように、「タオルを洗濯機に入れて」、「タオルで拭いて」、「タオルを洗って」、「靴を洗濯機に入れて」、「タオルを靴に入れて」などであり、「タオル」、「洗濯機」、「拭く」、「洗う」、「靴」などの単語が抽出される。
次に、ネットワーク構築部22は、現在の単語ネットワークに当該単語が含まれているか否かを検索する(ステップS2)。図4に示す例では、いずれの単語も登録されているため、(ステップS2:Yes)、関連した単語、例えばタオル−洗濯機、タオル−拭く、タオル−洗う、の関連性が高いものとして、そのノード間の重みが大きくなるように更新する。一方、抽出した単語がネットワークに存在しない場合は、新たにその単語ノードを追加し、他の単語との重みを初期値に設定する。ここで、単語間の関連性を示す重みが一定値以上、及び一定値以下になったら重み更新を停止するように設定しておくことができる。例えば、図4に示すように、タオル−洗濯機の重みは0.99であり、靴−タオルの重みは0.15であり、このような場合、すなわち重みが例えば0.99以上、0.15以下になったら重み更新を停止するようにしてもよい。これにより、無駄な学習がなくなる。
次に、行動生成について説明する。先ず、ユーザからのタスクの指示を受け取る(ステップS11)。行動決定部23は、単語ネットワーク上に、当該タスクの中に含まれる単語に一致又は類似するものを検索する(ステップS12)。一致する単語があれば(ステップS13:Yes)、隣接ノード間の重みを調べる(ステップS14)。そして最も重みが大きい単語を選択し、さらに当該単語に接続する最も重みが大きい単語を選択するというような処理を繰り返し、最終的なタスク実行の重みのトータルが最大になるよう単語を抽出していく(ステップS15)。
例えば、ユーザが「タオル」と言ったら、図4に示す単語ネットワークに従って、タオル−洗濯機−洗剤−洗う、という単語が抽出され、「タオルを洗濯機により洗剤を使用して洗いましょうか」などの確認をユーザに行なうことができる。
図7は、単語ネットワークの使用方法を説明する図である。例えば、ユーザより「タオル洗って」という抽象的な指示が出された場合、ロボットは、各単語間の重みに応じて行動を生成する。ここで、
1)タオル→洗う(0.7)
2)タオル→洗濯機(0.99)→洗剤(0.7)→洗う(0.99)
となっており、「タオル」から「洗う」までの重み(例えば平均)は、1)より2)の方が高い。このような場合は、最終の推測による結果は、2)を選択することになる。
一方、与えられた単語が単語ネットワークに含まれていない場合、例えば「ベット」と言われた場合、「何をいたしましょうか」などの質問をユーザに返すようにする(ステップS16)ことで、誤動作を防止する。すなわち、行動決定部23にて決定された行動を出力した後、当該行動が正しいか否かをユーザに確認する行動確認部を有するものとしてもよい。これにより、ユーザがロボットに正しい行動を教示することができる。この場合、ネットワーク構築部22は、行動確認部にて確認した結果に基づき単語ネットワークの重みを更新する。これにより、ユーザからの教示により単語ネットワークを更新することができる。さらに、ネットワーク構築部22は、外部から与えられるか又はセンサ部125により検出した認識情報に基づき単語ネットワークを更新又は拡大することができる。ネットワーク構築部22は、例えば認識情報(センサ情報)から構築されたネットワークを単語ネットワークとつなげて総合的知能ネットワークを生成することができる。これにより、ロボットはさらに多彩な行動を発現することができる。
また、単語ネットワークは、タオル、洗剤等をノードとするが、各ノードにはその類似語を登録したり、類似語辞典等を準備するようにしてもよい。例えばタオルの類似語をハンカチとした場合、ユーザがハンカチを差し出せば図4に示すネットワークを使用してハンカチを洗濯機により洗剤で洗う動作を決定することができる。
本実施の形態においては、ユーザが教えた正しいケース・正しくないケースから単語ネットワークを構築し、この単語ネットワークを使用して行動を決定する。正しいケースのみならず正しくないケースを教示することにより、経験値の反映をより早く収束することができるようにする。また、単語ネットワークを使用することにより、ユーザの指示に含まれていない動作も推測できるようになる。さらに、膨大な情報をネットワークにより関連付けて記憶することにより、多数の単語・行動を1つの情報空間に集めることができ、複雑な情報を用いた動作・反応を生成することができる。更に、人間の不完全なタスク指示に対し、ロボットが自律的にタスクの実行のための情報を集めることで、人間はロボットに対し、簡単にタスクを指示することができる。
なお、本発明は上述した実施の形態のみに限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能であることは勿論である。
本発明の実施の形態にかかる2足歩行タイプのロボットを示す斜視図である。 本発明の実施の形態にかかるロボットを示すブロック図である。 本発明の実施の形態にかかる行動決定装置を示す図である。 本発明の実施の形態にかかる単語ネットワークを示す図である。 本発明の実施の形態における単語ネットワーク構築方法を示すフローチャートである。 本発明の実施の形態にかかる行動決定方法を示すフローチャートである。 本発明の実施の形態にかかる単語ネットワークの使用方法を説明する図である。
符号の説明
1a 頭部ユニット
1b 腕部ユニット
1c 体幹部ユニット
1d 脚部ユニット
12 画像認識モジュール
13 経路探索モジュール
14 行動決定モジュール
15 音声認識モジュール
20 行動決定装置
21 知識取得部
22 ネットワーク構築部
23 行動決定部
101 制御部
102 入出力部
103 駆動部
104 電源部
105 外部記憶部
121 カメラ
122 内蔵マイク
123 スピーカ
125 センサ部
131 モータ
132 ドライバ
141 バッテリ
142 バッテリ制御部

Claims (18)

  1. 外部からの指示情報から単語を抽出する単語抽出部と、
    単語間の関係性をネットワーク上で重み付けした単語ネットワークと、前記単語抽出部が抽出した単語に基づき、行動を決定する行動決定部とを有する行動生成装置。
  2. 前記行動決定部は、前記ネットワーク上で重み順に単語を順次抽出して行動を生成する
    ことを特徴とする請求項1記載の行動生成装置。
  3. 前記行動決定部にて決定された行動を出力した後、当該行動が正しいか否かをユーザに確認する行動確認部を更に有する
    ことを特徴とする請求項1又は2項記載の行動生成装置。
  4. 前記行動確認部にて確認した結果に基づき前記単語ネットワークの重みを更新するネットワーク更新部を更に有する
    ことを特徴とする請求項3記載の行動生成装置。
  5. 前記ネットワーク更新部は、外部から与えられるか又は検出手段により検出した認識情報と前記単語ネットワークの単語とを関連づけた総合的知的ネットワークを生成する
    ことを特徴とする請求項4項記載の行動生成装置。
  6. 外部からの指示情報から単語を抽出する単語抽出部と、
    前記単語抽出部が抽出した単語とその関係性に基づき単語間を重みで関連づけたネットワークを構築すると共に前記指示情報に基づき単語間の重みを更新するネットワーク構築部とを有する行動学習装置。
  7. 前記単語抽出部は、正しい指示情報及び誤った指示情報を入力し、
    前記ネットワーク構築部は、前記正しい指示情報から抽出した単語間の重みを大きくし、前記誤った指示情報から抽出した単語間の重みを小さくする
    ことを特徴とする請求項6記載の行動学習装置。
  8. 前記ネットワーク構築部は、前記単語間の重みが予め定められた第1の値以上又は予め定められた第2の値以下になった時点で重みの更新を停止する
    ことを特徴とする請求項6又は7記載の行動学習装置。
  9. 外部からの指示情報から単語を抽出する単語抽出工程と、
    単語間の関係性をネットワーク上で重み付けした単語ネットワークと、前記単語抽出工程にて抽出した単語に基づき、行動を決定する行動決定工程とを有する行動生成方法。
  10. 前記行動決定工程では、前記ネットワーク上で重み順に単語を順次抽出して行動を生成する
    ことを特徴とする請求項9記載の行動生成方法。
  11. 外部からの指示情報から単語を抽出する単語抽出工程と、
    前記単語抽出工程にて抽出した単語とその関係性に基づき単語間を重みで関連づけたネットワークを構築すると共に前記指示情報に基づき単語間の重みを更新するネットワーク構築工程とを有する行動学習方法。
  12. 前記単語抽出工程では、正しい指示情報及び誤った指示情報を入力し、
    前記ネットワーク構築工程では、前記正しい指示情報から抽出した単語間の重みを大きくし、前記誤った指示情報から抽出した単語間の重みを小さくする
    ことを特徴とする請求項11記載の行動学習方法。
  13. 前記ネットワーク構築工程では、前記単語間の重みが予め定められた第1の値以上又は予め定められた第2の値以下になった時点で重みの更新を停止する
    ことを特徴とする請求項11又は12記載の行動学習方法。
  14. 外部からの指示に応じて動作を発現するロボット装置であって、
    外部からの指示情報から単語を抽出する単語抽出部と、
    単語間の関係性をネットワーク上で重み付けした単語ネットワークと、前記単語抽出部が抽出した単語に基づき、行動を決定する行動決定部とを有するロボット装置。
  15. 前記抽出した単語によりネットワークを構築し、単語間の重みを更新するネットワーク構築部を更に有する
    ことを特徴とする請求項14記載のロボット装置。
  16. 外部からの指示情報から単語を抽出する単語抽出部と、
    前記単語抽出部が抽出した単語とその関係性に基づき単語間を重みで関連づけたネットワークを構築すると共に前記指示情報に基づき単語間の重みを更新するネットワーク構築部とを有するロボット装置。
  17. 所定の動作をコンピュータに実行させるためのプログラムであって、
    外部からの指示情報から単語を抽出する単語抽出工程と、
    単語間の関係性をネットワーク上で重み付けした単語ネットワークと、前記単語抽出工程にて抽出した単語に基づき、行動を決定する行動決定工程とを有するプログラム。
    行動生成方法。
  18. 所定の動作をコンピュータに実行させるためのプログラムであって、
    外部からの指示情報から単語を抽出する単語抽出工程と、
    前記単語抽出工程にて抽出した単語とその関係性に基づき単語間を重みで関連づけたネットワークを構築すると共に前記指示情報に基づき単語間の重みを更新するネットワーク構築工程とを有するプログラム。
JP2007317453A 2007-12-07 2007-12-07 行動決定装置、行動学習装置、及びロボット装置 Pending JP2009140348A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007317453A JP2009140348A (ja) 2007-12-07 2007-12-07 行動決定装置、行動学習装置、及びロボット装置
US12/329,252 US20090150142A1 (en) 2007-12-07 2008-12-05 Behavior determination apparatus and method, behavior learning apparatus and method, robot apparatus, and medium recorded with program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007317453A JP2009140348A (ja) 2007-12-07 2007-12-07 行動決定装置、行動学習装置、及びロボット装置

Publications (1)

Publication Number Publication Date
JP2009140348A true JP2009140348A (ja) 2009-06-25

Family

ID=40722528

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007317453A Pending JP2009140348A (ja) 2007-12-07 2007-12-07 行動決定装置、行動学習装置、及びロボット装置

Country Status (2)

Country Link
US (1) US20090150142A1 (ja)
JP (1) JP2009140348A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011170789A (ja) * 2010-02-22 2011-09-01 Osamu Hasegawa 問題解決システム、問題解決支援装置及び問題解決方法
JP2020533708A (ja) * 2017-09-12 2020-11-19 深▲せん▼前海達闥雲端智能科技有限公司Cloudminds (Shenzhen) Robotics Systems Co., Ltd. ロボットの動的学習方法、システム、ロボット及びクラウドサーバ
JPWO2021171558A1 (ja) * 2020-02-28 2021-09-02

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1131156A (ja) * 1997-07-14 1999-02-02 Toshiba Corp 文書検索装置及び方法
WO2006083596A2 (en) * 2005-01-28 2006-08-10 Honda Motor Co., Ltd. Responding to situations using knowledge representation and inference

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5715374A (en) * 1994-06-29 1998-02-03 Microsoft Corporation Method and system for case-based reasoning utilizing a belief network
JP3884160B2 (ja) * 1997-11-17 2007-02-21 富士通株式会社 用語付きデータを扱うデータ処理方法,データ処理装置およびプログラム記憶媒体
CA2272739C (en) * 1999-05-25 2003-10-07 Suhayya Abu-Hakima Apparatus and method for interpreting and intelligently managing electronic messages
US6404438B1 (en) * 1999-12-21 2002-06-11 Electronic Arts, Inc. Behavioral learning for a visual representation in a communication environment
US7403890B2 (en) * 2002-05-13 2008-07-22 Roushar Joseph C Multi-dimensional method and apparatus for automated language interpretation
US7428521B2 (en) * 2005-06-29 2008-09-23 Microsoft Corporation Precomputation of context-sensitive policies for automated inquiry and action under uncertainty

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1131156A (ja) * 1997-07-14 1999-02-02 Toshiba Corp 文書検索装置及び方法
WO2006083596A2 (en) * 2005-01-28 2006-08-10 Honda Motor Co., Ltd. Responding to situations using knowledge representation and inference

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
細川 健一郎 KENICHIRO HOSOKAWA: "対話型情報検索システムにおける提案要求表現の適応的理解 Adaptive Understanding of Proposal-Requestin", 電子情報通信学会論文誌 (J88−D−II) 第3号 THE IEICE TRANSACTIONS ON INFORMATION AND SYST, vol. 第J88-D-II巻 第3号, JPN6009051870, 1 March 2005 (2005-03-01), JP, pages 619 - 628, ISSN: 0001435423 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011170789A (ja) * 2010-02-22 2011-09-01 Osamu Hasegawa 問題解決システム、問題解決支援装置及び問題解決方法
JP2020533708A (ja) * 2017-09-12 2020-11-19 深▲せん▼前海達闥雲端智能科技有限公司Cloudminds (Shenzhen) Robotics Systems Co., Ltd. ロボットの動的学習方法、システム、ロボット及びクラウドサーバ
JP7085788B2 (ja) 2017-09-12 2022-06-17 達闥機器人股▲分▼有限公司 ロボットの動的学習方法、システム、ロボット及びクラウドサーバ
US11580454B2 (en) 2017-09-12 2023-02-14 Cloudminds Robotics Co., Ltd. Dynamic learning method and system for robot, robot and cloud server
JPWO2021171558A1 (ja) * 2020-02-28 2021-09-02
JP7416199B2 (ja) 2020-02-28 2024-01-17 日本電気株式会社 制御装置、制御方法及びプログラム

Also Published As

Publication number Publication date
US20090150142A1 (en) 2009-06-11

Similar Documents

Publication Publication Date Title
JP4551473B2 (ja) 分散知識からの家事プラン構築
US8644990B2 (en) Apparatus and method for providing robot interaction services using interactive behavior model
EP3591521A1 (en) Assistance system, method, and program for assisting a user in fulfilling a task
JP6328793B2 (ja) ロボット上のソフトウェアアプリケーションの実行
Cruz et al. Multi-modal integration of dynamic audiovisual patterns for an interactive reinforcement learning scenario
US11492741B2 (en) Electronic device
JP2005115654A (ja) 情報処理装置および方法、プログラム格納媒体、並びにプログラム
Beuls et al. Diagnostics and repairs in fluid construction grammar
EP3667549A1 (en) Laundry scheduling device
EP2363251A1 (en) Robot with Behavioral Sequences on the basis of learned Petri Net Representations
Liu et al. Controlllm: Augment language models with tools by searching on graphs
JP2009140348A (ja) 行動決定装置、行動学習装置、及びロボット装置
JP2013058120A (ja) 情報処理装置、情報処理方法、及び、プログラム
Xiao et al. Robot learning in the era of foundation models: A survey
Zheng et al. Steve-eye: Equipping llm-based embodied agents with visual perception in open worlds
Araki et al. Long-term learning of concept and word by robots: Interactive learning framework and preliminary results
Pineda et al. Ioca: Interaction-oriented cognitive architecture
Mokhtari et al. Gathering and conceptualizing plan-based robot activity experiences
CN117193582A (zh) 交互控制方法及***、电子设备
Van Trijp Grammaticalization and semantic maps: evidence from artificial language evolution.
Goertzel et al. Cognitive synergy between procedural and declarative learning in the control of animated and robotic agents using the opencogprime agi architecture
Awaad et al. Challenges in finding ways to get the job done
Cederborg et al. A social learning formalism for learners trying to figure out what a teacher wants them to do
Guan et al. Review of the techniques used in motor‐cognitive human‐robot skill transfer
JP2006285898A (ja) 制御装置および方法、並びにプログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091013

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100817

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101018

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110712