JP2003255991A

JP2003255991A - 対話制御システム、対話制御方法及びロボット装置

Info

Publication number: JP2003255991A
Application number: JP2002060428A
Authority: JP
Inventors: Kazumi Aoyama; 一美青山; Hideki Shimomura; 秀樹下村; Keiichi Yamada; 敬一山田
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2002-03-06
Filing date: 2002-03-06
Publication date: 2003-09-10
Also published as: US20030220796A1

Abstract

(57)【要約】【課題】本発明は、エンターテイメント性を向上させ得
る対話制御システム、対話制御方法及びロボット装置を
実現しようとするものである。【解決手段】ロボット及び情報処理装置がネットワーク
を介して接続された対話制御システムにおいて、ロボッ
トとユーザとの間で言葉遊びによる対話をする際、ユー
ザの発話内容のうち言葉遊びに関する履歴データを生成
して情報処理装置に送信し、当該情報処理装置が記憶手
段から当該履歴データに基づいてユーザに最適な内容デ
ータを選択的に読み出して元のロボットに提供するよう
にした。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は対話制御システム、
対話制御方法及びロボット装置に関し、例えばエンター
テイメントロボットに適用して好適なものである。

【０００２】

【従来の技術】近年、一般家庭向けのエンターテイメン
トロボットが多くの企業等において開発され、商品化さ
れている。そしてこのようなエンターテイメントロボッ
トの中には、ＣＣＤ（Charge Coupled Device）カメラ
やマイクロホン等の各種外部センサが搭載され、これら
外部センサの出力に基づいて外部状況を認識し、認識結
果に基づいて自律的に行動し得るようになされたものな
どもある。

【０００３】かかるロボットとユーザとが音声による対
話を行う音声対話システムを構築する場合、例えばテレ
フォンショッピングの受け付けや、電話番号案内など、
あるタスクを達成することを目的とした音声対話システ
ムが考えられる。

【０００４】

【発明が解決しようとする課題】ところが、ロボットと
人間が日常的に会話する場面を想定したとき、ロボット
は、タスク達成のための対話のほかに、雑談や言葉遊び
など、毎日会話しても飽きないような会話ができなけれ
ばならないのであるが、上述のようなタスクの遂行を目
的とする対話システムでは、システム内の電話番号リス
トやショッピングアイテムリストなどのデータが特定内
容に固定されているため、ロボットの会話に面白みを持
たせることができず、さらにはシステムを使用する個人
の好みに応じて当該システム内のデータを変更すること
もできなかった。

【０００５】特に、ロボットと人間が日常的な会話とし
て、なぞなぞや山手線ゲーム（特定の事項に関連する内
容の言葉を互いに重複しないように順番に言い合う遊
び）等の言葉遊びによる対話を行う場合、ユーザを飽き
させないためには、ロボットは大量の対話内容（コンテ
ンツ）を表すデータ（以下、これをコンテンツデータと
呼ぶ）を保持する必要がある。

【０００６】そこで近年では、インターネット上に分散
する各サーバ内の各種情報を相互に関連付けて検索可能
にした情報網であるＷｅｂ（すなわちＷＷＷ：World Wi
de Web）が、情報サービスとして幅広く利用されてお
り、かかるＷｅｂを利用して、大量のコンテンツを保有
するコンテンツサーバが、ロボットとの間で当該ロボッ
トが持つべきコンテンツデータのやり取りを行うことに
より、当該ロボットと対面するユーザが日常的な会話を
行うことができると考えられる。

【０００７】かかるコンテンツサーバは、大量のコンテ
ンツデータを利用可能な全てのロボットが共有できるデ
ータベースに格納しており、必要に応じて当該データベ
ースから対応するコンテンツデータを読み出してネット
ワークを介してロボットに発話させ得るように構築され
ている。

【０００８】しかし、実際にロボットとユーザとの間で
言葉遊びを行う際には、個々のユーザはそれぞれ好みや
難易度に対するスキルが多種多様であるため、該当する
ロボットがデータベースに格納されている大量のコンテ
ンツデータの中からランダムにコンテンツデータを取得
する手法では、全てのユーザのニーズに十分に応えられ
ないといった問題があった。

【０００９】この問題を解決する一つの方法として、ユ
ーザの好みやレベルを表すプロファイル情報と、コンテ
ンツに付随する内容の分類情報とを、データベースに格
納しておき、コンテンツサーバがロボットからの要求に
応じてデータベースからユーザが所望するコンテンツデ
ータを取得するときに、プロファイル情報及び分類情報
に関連のあるコンテンツデータを選択するようにする方
法が考えられる。

【００１０】ところが、なぞなぞや山手線ゲーム等の言
葉遊びを目的とする対話では、ロボットとユーザとの間
に、会話のリズムや面白さといったものが要求されるの
であるが、現在の音声認識処理の技術では、ユーザの発
話に対する認識間違いを避けることができず、ロボット
がいちいちユーザの発話内容を確認的に発するのでは、
ユーザとの会話が不自然な状態になってしまうおそれが
ある。

【００１１】例えばロボットが「２回食べると元気にな
る食べ物なんだ？」というなぞなぞを出題したときに、
ユーザが「のり」と答えた場合、ロボットが「答えはのり
ですね」というように直接的な確認をする旨の発現をし
てしまうのは、会話の流れを止めると同時に面白みに欠
けてしまう。

【００１２】これに対してロボットがユーザの発話内容
を無視して会話を続けるのでは、ユーザ自身が自分の発
話内容をロボットがどのように認識したのかを確認する
ことできず、会話中に不安感を与えるおそれがあった。

【００１３】本発明は以上の点を考慮してなされたもの
で、エンターテイメント性を格段的に向上させ得る対話
制御システム、対話制御方法及びロボット装置を提案し
ようとするものである。

【００１４】

【課題を解決するための手段】かかる課題を解決するた
め本発明においては、ロボット及び情報処理装置がネッ
トワークを介して接続された対話制御システムにおい
て、ロボットには、人間と対話するための機能を有し、
当該対話を通じて対象とするユーザの発話を認識する対
話手段と、対話手段によるユーザの発話内容のうち、言
葉遊びに関する履歴データを生成する生成手段と、生成
手段により生成された履歴データを、言葉遊びを通じて
得られるユーザの発言内容に応じて更新する更新手段
と、言葉遊びの開始の際には、履歴データをネットワー
クを介して情報処理装置に送信する通信手段とを設け、
また情報処理装置には、複数の言葉遊びの内容を表す内
容データを記憶する記憶手段と、通信手段を介して送信
された履歴データを検出する検出手段と、検出手段によ
って検出された履歴データに基づいて、記憶手段から内
容データを選択的に読み出してネットワークを介して元
のロボットに送信する通信制御手段とを設けるようにし
た。そしてロボットの対話手段は、情報処理装置の通信
制御手段から送信された内容データに基づく言葉遊びの
内容を出力するようにした。

【００１５】この結果、この対話制御システムでは、ロ
ボットとユーザとの間で言葉遊びによる対話をする際、
ユーザの発話内容のうち言葉遊びに関する履歴データを
生成して情報処理装置に送信し、当該情報処理装置が記
憶手段から当該履歴データに基づいてユーザに最適な内
容データを選択的に読み出して元のロボットに提供する
ようにしたことにより、ユーザとの間でロボットの会話
に面白みやリズムを持たせることができ、あたかも人間
同士が会話しているかのごとく自然な日常会話に近づけ
ることができる。

【００１６】また本発明においては、ロボット及び情報
処理装置がネットワークを介して接続された対話制御方
法において、ロボットでは、人間との対話を通じて対象
とするユーザの発話を認識し、当該ユーザの発話内容の
うち、言葉遊びに関する履歴データを生成し、当該生成
された履歴データを、言葉遊びを通じて得られるユーザ
の発言内容に応じて更新しながら、言葉遊びの開始の際
にはネットワークを介して情報処理装置に送信する第１
のステップと、情報処理装置では、予め記憶された複数
の言葉遊びの内容を表す内容データのうち、ロボットか
ら送信された履歴データに基づいて選択した内容データ
を読み出して、ネットワークを介して元のロボットに送
信する第２のステップと、ロボットでは、情報処理装置
から送信された内容データに基づく言葉遊びの内容を出
力する第３のステップとを設けるようにした。

【００１７】この結果、この対話制御方法では、ロボッ
トとユーザとの間で言葉遊びによる対話をする際、ユー
ザの発話内容のうち言葉遊びに関する履歴データを生成
して情報処理装置に送信し、当該情報処理装置が履歴デ
ータに基づいてユーザに最適な内容データを複数の内容
データの中から選択的に読み出して元のロボットに提供
するようにしたことにより、ユーザとの間でロボットの
会話に面白みやリズムを持たせることができ、あたかも
人間同士が会話しているかのごとく自然な日常会話に近
づけることができる。

【００１８】さらに本発明においては、情報処理装置と
ネットワークを介して接続されたロボット装置におい
て、人間と対話するための機能を有し、当該対話を通じ
て対象とするユーザの発話を認識する対話手段と、対話
手段によるユーザの発話内容のうち、言葉遊びに関する
履歴データを生成する生成手段と、生成手段により生成
された履歴データを、言葉遊びを通じて得られるユーザ
の発言内容に応じて更新する更新手段と、言葉遊びの開
始の際には、履歴データをネットワークを介して情報処
理装置に送信する通信手段とを設け、情報処理装置にお
いて予め記憶された複数の言葉遊びの内容を表す内容デ
ータのうち、通信手段から送信された履歴データに基づ
いて選択された内容データがネットワークを介して送信
されたとき、対話手段は、当該内容データに基づく言葉
遊びの内容を出力するようにした。

【００１９】この結果、このロボット装置では、ロボッ
トとユーザとの間で言葉遊びによる対話をする際、ユー
ザの発話内容のうち言葉遊びに関する履歴データを生成
して情報処理装置に送信し、当該情報処理装置から履歴
データに基づくユーザに最適な内容データを選択的に取
得するようにしたことにより、ユーザとの間でロボット
の会話に面白みやリズムを持たせることができ、あたか
も人間同士が会話しているかのごとく自然な日常会話に
近づけることができる。

【００２０】

【発明の実施の形態】以下図面について、本発明の一実
施の形態を詳述する。

【００２１】（１）本実施の形態によるロボットの構成図１及び図２において、１は全体として本実施の形態に
よる２足歩行型のロボットを示し、胴体部ユニット２の
上部に頭部ユニット３が配設されると共に、当該胴体部
ユニット２の上部左右にそれぞれ同じ構成の腕部ユニッ
ト４Ａ、４Ｂがそれぞれ配設され、かつ胴体部ユニット
２の下部左右にそれぞれ同じ構成の脚部ユニット５Ａ、
５Ｂがそれぞれ所定位置に取り付けられることにより構
成されている。

【００２２】胴体部ユニット２においては、体幹上部を
形成するフレーム１０及び体幹下部を形成する腰ベース
１１が腰関節機構１２を介して連結することにより構成
されており、体幹下部の腰ベース１１に固定された腰関
節機構１２の各アクチュエータＡ１、Ａ２をそれぞれ駆
動することによって、体幹上部を図３に示す直交するロ
ール軸１３及びピッチ軸１４の回りにそれぞれ独立に回
転させることができるようになされている。

【００２３】また頭部ユニット３は、フレーム１０の上
端に固定された肩ベース１５の上面中央部に首関節機構
１６を介して取り付けられており、当該首関節機構１６
の各アクチュエータＡ３、Ａ４をそれぞれ駆動すること
によって、図３に示す直交するピッチ軸１７及びヨー軸
１８の回りにそれぞれ独立に回転させることができるよ
うになされている。

【００２４】さらに各腕部ユニット４Ａ、４Ｂは、それ
ぞれ肩関節機構１９を介して肩ベース１５の左右に取り
付けられており、対応する肩関節機構１９の各アクチュ
エータＡ５、Ａ６をそれぞれ駆動することによって図３
に示す直交するピッチ軸２０及びロール軸２１の回りに
それぞれ独立に回転させることができるようになされて
いる。

【００２５】この場合、各腕部ユニット４Ａ、４Ｂは、
それぞれ上腕部を形成するアクチュエータＡ７の出力軸
に肘関節機構２２を介して前腕部を形成するアクチュエ
ータＡ８が連結され、当該前腕部の先端に手部２３が取
り付けられることにより構成されている。

【００２６】そして各腕部ユニット４Ａ、４Ｂでは、ア
クチュエータＡ７を駆動することによって前腕部を図３
に示すヨー軸２４の回りに回転させ、アクチュエータＡ
８を駆動することによって前腕部を図３に示すピッチ軸
２５の回りにそれぞれ回転させることができるようにな
されている。

【００２７】これに対して各脚部ユニット５Ａ、５Ｂに
おいては、それぞれ股関節機構２６を介して体幹下部の
腰ベース１１にそれぞれ取り付けられており、それぞれ
対応する股関節機構２６の各アクチュエータをＡ９〜Ａ
１１それぞれ駆動することによって、図３に示す互いに
直交するヨー軸２７、ロール軸２８及びピッチ軸２９の
回りにそれぞれ独立に回転させることができるようにな
されている。

【００２８】この場合各脚部ユニット５Ａ、５Ｂは、そ
れぞれ大腿部を形成するフレーム３０の下端に膝関節機
構３１を介して下腿部を形成するフレーム３２が連結さ
れると共に、当該フレーム３２の下端に足首関節機構３
３を介して足部３４が連結されることにより構成されて
いる。

【００２９】これにより各脚部ユニット５Ａ、５Ｂにお
いては、膝関節機構３１を形成するアクチュエータＡ１
２を駆動することによって、下腿部を図３に示すピッチ
軸３５の回りに回転させることができ、また足首関節機
構３３のアクチュエータＡ１３、Ａ１４をそれぞれ駆動
することによって、足部３４を図３に示す直交するピッ
チ軸３６及びロール軸３７の回りにそれぞれ独立に回転
させることができるようになされている。

【００３０】一方、胴体部ユニット２の体幹下部を形成
する腰ベース１１の背面側には、図４に示すように、当
該ロボット１全体の動作制御を司るメイン制御部４０
と、電源回路及び通信回路などの周辺回路４１と、バッ
テリ４５（図５）となどがボックスに収納されてなる制
御ユニット４２が配設されている。

【００３１】そしてこの制御ユニット４２は、各構成ユ
ニット（胴体部ユニット２、頭部ユニット３、各腕部ユ
ニット４Ａ、４Ｂ及び各脚部ユニット５Ａ、５Ｂ）内に
それぞれ配設された各サブ制御部４３Ａ〜４３Ｄと接続
されており、これらサブ制御部４３Ａ〜４３Ｄに対して
必要な電源電圧を供給したり、これらサブ制御部４３Ａ
〜４３Ｄと通信を行ったりすることができるようになさ
れている。

【００３２】また各サブ制御部４３Ａ〜４３Ｄは、それ
ぞれ対応する構成ユニット内の各アクチュエータＡ１〜
Ａ１４と接続されており、当該構成ユニット内の各アク
チュエータＡ１〜Ａ１４をメイン制御部４０から与えら
れる各種制御コマンドに基づいて指定された状態に駆動
し得るようになされている。

【００３３】さらに頭部ユニット３には、図５に示すよ
うに、このロボット１の「目」として機能するＣＣＤ
（Charge Coupled Device ）カメラ５０及び「耳」とし
て機能するマイクロホン５１及びタッチセンサ５２など
からなる外部センサ部５３と、「口」として機能するス
ピーカ５４となどがそれぞれ所定位置に配設され、制御
ユニット４２内には、バッテリセンサ５５及び加速度セ
ンサ５６などからなる内部センサ部５７が配設されてい
る。

【００３４】そして外部センサ部５３のＣＣＤカメラ５
０は、周囲の状況を撮像し、得られた画像信号Ｓ１Ａを
メイン制御部に送出する一方、マイクロホン５１は、ユ
ーザから音声入力として与えられる「歩け」、「伏せ」
又は「ボールを追いかけろ」等の各種命令音声を集音
し、かくして得られた音声信号Ｓ１Ｂをメイン制御部４
０に送出するようになされている。

【００３５】またタッチセンサ５２は、図１及び図２に
おいて明らかなように頭部ユニット３の上部に設けられ
ており、ユーザからの「撫でる」や「叩く」といった物
理的な働きかけにより受けた圧力を検出し、検出結果を
圧力検出信号Ｓ１Ｃとしてメイン制御部４０に送出す
る。

【００３６】さらに内部センサ部５７のバッテリセンサ
５５は、バッテリ４５のエネルギ残量を所定周期で検出
し、検出結果をバッテリ残量検出信号Ｓ２Ａとしてメイ
ン制御部４０に送出する一方、加速度センサ５６は、３
軸方向（ｘ軸、ｙ軸及びｚ軸）の加速度を所定周期で検
出し、検出結果を加速度検出信号Ｓ２Ｂとしてメイン制
御部４０に送出する。

【００３７】メイン制御部部４０は、外部センサ部５３
のＣＣＤカメラ５０、マイクロホン５１及びタッチセン
サ５２等からそれぞれ供給される画像信号Ｓ１Ａ、音声
信号Ｓ１Ｂ及び圧力検出信号Ｓ１Ｃ等（以下、これらを
まとめて外部センサ信号Ｓ１と呼ぶ）と、内部センサ部
５７のバッテリセンサ５５及び加速度センサ等からそれ
ぞれ供給されるバッテリ残量検出信号Ｓ２Ａ及び加速度
検出信号Ｓ２Ｂ等（以下、これらをまとめて内部センサ
信号Ｓ２と呼ぶ）に基づいて、ロボット１の周囲及び内
部の状況や、ユーザからの指令、ユーザからの働きかけ
の有無などを判断する。

【００３８】そしてメイン制御部４０は、この判断結果
と、予め内部メモリ４０Ａに格納されている制御プログ
ラムと、そのとき装填されている外部メモリ５８に格納
されている各種制御パラメータとに基づいて続く行動を
決定し、決定結果に基づく制御コマンドを対応するサブ
制御部４３Ａ〜４３Ｄに送出する。この結果、この制御
コマンドに基づき、そのサブ制御部４３Ａ〜４３Ｄの制
御のもとに、対応するアクチュエータＡ１〜Ａ１４が駆
動され、かくして頭部ユニット３を上下左右に揺動させ
たり、腕部ユニット４Ａ、４Ｂを上にあげたり、歩行す
るなどの行動がロボット１により発現されることとな
る。

【００３９】またこの際メイン制御部４０は、必要に応
じて所定の音声信号Ｓ３をスピーカ５４に与えることに
より当該音声信号Ｓ３に基づく音声を外部に出力させた
り、外見上の「目」として機能する頭部ユニット３の所
定位置に設けられたＬＥＤに駆動信号を出力することに
よりこれを点滅させる。

【００４０】このようにしてこのロボット１において
は、周囲及び内部の状況や、ユーザからの指令及び働き
かけの有無などに基づいて自律的に行動することができ
るようになされている。

【００４１】（２）本実施の形態による対話制御システ
ムの構成ここで図６は、ユーザが所有する複数の上述したロボッ
ト１と、情報提供側６０が配置したコンテンツサーバ６
１とがネットワーク６２を介して接続されることにより
構成される本実施の形態による対話制御システム６３を
示すものである。

【００４２】各ロボット１においては、ユーザからの指
令や周囲の環境に応じて自律的に行動する一方、コンテ
ンツサーバ６１とネットワーク６２を介して通信するこ
とにより必要なデータを送受信したり、当該通信により
得られたコンテンツデータ等に基づく音声をスピーカ５
４（図５）を介して放音することができるようになされ
ている。

【００４３】実際に各ロボット１には、例えばＣＤ（Co
mpact Disc）−ＲＯＭに記録されて提供される、この対
話制御システム６３全体としてかかる機能を発揮させる
ためのアプリケーションソフトウェアがインストールさ
れると共に、例えばブルートゥース（Bluetooth）等の
所定の無線通信規格に対応した無線ＬＡＮカード（図示
せず）が胴体部ユニット２（図１）内の所定部位に装着
されるようになされている。

【００４４】またコンテンツサーバ６１は、情報提供側
６０が提供する後述のような各種サービスに関する各種
処理を行うＷｅｂサーバ及びデータベースサーバであ
り、ネットワーク６２を介してアクセスしてきたロボッ
ト１と通信して必要なデータを送受信することができる
ようになされている。

【００４５】なおコンテンツサーバ６１の構成を図７に
示す。この図７からも明らかなように、コンテンツサー
バ６１は、コンテンツサーバ６１全体の制御を司るＣＰ
Ｕ６５と、各種ソフトウェアが格納されたＲＯＭ６６
と、ＣＰＵ６５のワークメモリとしてのＲＡＭ６７と、
各種データが格納されたハードディスク装置６８と、Ｃ
ＰＵ６５がネットワーク６２（図６）を介して外部と通
信するためのインターフェースであるネットワークイン
ターフェース部６９とを有し、これらがバス７０を介し
て相互に接続されることにより構成されている。

【００４６】この場合ＣＰＵ６５は、ネットワーク６２
を介してアクセスしてきたロボット１から与えられるデ
ータやコマンドをネットワークインターフェース部６９
を介して取り込み、当該データやコマンドと、ＲＯＭ６
６に格納されているソフトウェアとに基づいて各種処理
を実行する。このネットワークインターフェース部６９
は、例えばブルートゥース（Bluetooth）等の無線ＬＡ
Ｎ方式で各種データをやり取りするＬＡＮ制御部（図示
せず）を有する。

【００４７】そしてＣＰＵ６５は、この処理結果とし
て、例えばハードディスク装置６８から読み出した所定
のＷｅｂページの画面データや、他のプログラム又はコ
マンドなどのデータをネットワークインターフェース部
６９を介して対応するロボット１に送出する。

【００４８】このようにしてコンテンツサーバ６１にお
いては、アクセスしてきたロボット１に対してＷｅｂペ
ージの画面データや、この他の必要なデータを送受信す
ることができるようになされている。

【００４９】なおコンテンツサーバ６１内のハードディ
スク装置６８内にはそれぞれ複数のデータベース（図示
せず）が格納されており、各種処理を実行するときに対
応するデータベースから必要な情報を読み出し得るよう
になされている。

【００５０】このうち一のデータベースには、なぞなぞ
等の言葉遊びに必要な大量のコンテンツデータが格納さ
れている。かかるコンテンツデータには、言葉遊びに使
用する実際の内容を表すデータに加えて、当該言葉遊び
に付随して得られる種々の内容を表すオプションデータ
が付加されている。

【００５１】例えば言葉遊びとして「なぞなぞ」が指定さ
れた場合、コンテンツデータは「なぞなぞ」の問題及び
その解答並びにその理由を表し、当該コンテンツデータ
に付加されたオプションデータは、当該問題の難易度や
その問題が出題された回数から得られる人気の指標等を
表す。

【００５２】そしてロボット１は、ユーザとの対話にお
いて、マイクロホン５１を介して集音したユーザの発話
内容を後述する音声認識処理を実行することにより認識
し、当該認識結果をユーザに関連する種々のデータと共
にネットワーク６２を介してコンテンツサーバ６１に送
信する。

【００５３】続いてコンテンツサーバ６１は、ロボット
１から得られた認識結果等に基づいて、データベースに
格納されている大量のコンテンツデータの中から最適な
コンテンツデータを抽出し、当該コンテンツデータを元
のロボット１の送信する。

【００５４】かくしてロボット１は、コンテンツサーバ
６１から取得したコンテンツデータに基づく音声をスピ
ーカ５４を介して放音することにより、あたかも人間同
士で対話しているかのごとく、自然な感じでユーザと
「なぞなぞ」の言葉遊びをすることができるようになされ
ている。

【００５５】（３）名前学習機能に関するメイン制御部
４０の処理次にこのロボット１に搭載された名前学習機能について
説明する。

【００５６】このロボット１には、人との対話を通して
その人の名前を取得し、当該名前を、マイクロホン５１
の出力に基づいて検出したその人の声の音響的特徴のデ
ータと関連付けて記憶すると共に、これら記憶した各デ
ータに基づいて、名前を取得していない新規な人の登場
を認識し、その新規な人の名前や声の音響的特徴を上述
と同様にして取得し記憶するようにして、人の名前をそ
の人と対応付けて取得（以下、これを名前の学習と呼
ぶ）学習していく名前学習機能が搭載されている。なお
以下においては、その人の声の音響的特徴と対応付けて
名前を記憶し終えた人を『既知の人』と呼び、記憶し終
えていない人を『新規な人』と呼ぶものとする。

【００５７】そしてこの名前学習機能は、メイン制御部
４０における各種処理により実現されている。

【００５８】ここで、かかる名前学習機能に関するメイ
ン制御部４０の処理内容を機能的に分類すると、図８に
示すように、人が発声した言葉を認識する音声認識部８
０と、人の声の音響的特徴を検出すると共に当該検出し
た音響的特徴に基づいてその人を識別して認識する話者
認識部８１と、人との対話制御を含む新規な人の名前学
習のための各種制御や、既知の人の名前及び声の音響的
特徴の記憶管理を司る対話制御部８２と、対話制御部８
２の制御のもとに各種対話用の音声信号Ｓ３を生成して
スピーカ５４（図５）に送出する音声合成部８３とに分
けることができる。

【００５９】この場合、音声認識部８０においては、マ
イクロホン５１（図５）からの音声信号Ｓ１Ｂに基づき
所定の音声認識処理を実行することにより当該音声信号
Ｓ１Ｂに含まれる言葉を単語単位で認識する機能を有す
るものであり、認識したこれら単語を文字列データＤ１
として対話制御部８２に送出するようになされている。

【００６０】また話者認識部８１は、マイクロホン５１
から与えられる音声信号Ｓ１Ｂに含まれる人の声の音響
的特徴を、例えば“Segregation of Speakers for Reco
gnition and Speaker Identification（CH2977-7/91/00
00~0873 S1.00 1991 IEEE）”に記載された方法等を利
用した所定の信号処理により検出する機能を有してい
る。

【００６１】そして話者認識部８１は、通常時には、こ
の検出した音響的特徴のデータをそのとき記憶している
全ての既知の人の音響的特徴のデータと順次比較し、そ
のとき検出した音響的特徴がいずれか既知の人の音響的
特徴と一致した場合には当該既知の人の音響的特徴と対
応付けられた当該音響的特徴に固有の識別子（以下、こ
れをＳＩＤと呼ぶ）を対話制御部８２に通知する一方、
検出した音響的特徴がいずれの既知の人の音響的特徴と
も一致しなかった場合には、認識不能を意味するＳＩＤ
（=−１）を対話制御部８２に通知するようになされて
いる。

【００６２】また話者認識部８１は、対話制御部８２が
新規な人であると判断したときに当該対話制御部８２か
ら与えられる新規学習の開始命令及び学習終了命令に基
づいて、その間その人の声の音響的特徴を検出し、当該
検出した音響的特徴のデータを新たな固有のＳＩＤと対
応付けて記憶すると共に、このＳＩＤを対話制御部８２
に通知するようになされている。

【００６３】なお話者認識部８１は、対話制御部８２か
らの追加学習の開始命令及び終了命令に応じて、その人
の声の音響的特徴のデータを追加的に収集する追加学習
を行い得るようになされている。

【００６４】音声合成部８３は、対話制御部８２から与
えられる文字列データＤ２を音声信号Ｓ３に変換する機
能を有し、かくして得られた音声信号Ｓ３をスピーカ５
４（図５）に送出するようになされている。これにより
この音声信号Ｓ３に基づく音声をスピーカ５４から出力
させることができるようになされている。

【００６５】対話制御部８２においては、図９に示すよ
うに、既知の人の名前と、話者認識部８１が記憶してい
るその人の声の音響的特徴のデータに対応付けられたＳ
ＩＤとを関連付けて記憶するメモリ８４（図８）を有し
ている。

【００６６】そして対話制御部８２は、所定のタイミン
グで所定の文字列データＤ２を音声合成部８３に与える
ことにより、話し相手の人に対して名前を質問し又は名
前を確認するための音声等をスピーカ５４から出力させ
る一方、このときのその人の応答等に基づく音声認識部
８０及び話者認識部８１の各認識結果と、メモリ８４に
格納された上述の既知の人の名前、ＳＩＤの関連付けの
情報とに基づいてその人が新規な人であるか否かを判断
するようになされている。

【００６７】そして対話制御部８２は、その人が新規な
人であると判断したときには、話者認識部８１に対して
新規学習の開始命令及び終了命令を与えることにより、
これら話者認識部８１にその新規な人の声の音響的特徴
のデータを収集及び記憶させると共に、この結果として
これら話者認識部８１から与えられるその新規な人の声
の音響的特徴のデータに対応付けられたＳＩＤを、かか
る対話により得られたその人の名前と関連付けてメモリ
８４に格納するようになされている。

【００６８】また対話制御部８２は、その人が既知の人
であると判断したときには、必要に応じて話者認識部８
１に追加学習の開始命令を与えることにより話者認識部
８１に追加学習を行わせる一方、これと共に音声合成部
８３に所定の文字列データＤ２を所定のタイミングで順
次送出することにより、話者認識部８１が追加学習をす
るのに必要な相当量のデータを収集できるまでその人と
の対話を長引かせるような対話制御を行うようになされ
ている。

【００６９】（４）名前学習機能に関する対話制御部８
２の具体的処理次に、名前学習機能に関する対話制御部８２の具体的な
処理内容について説明する。

【００７０】対話制御部８２は、外部メモリ５８（図
５）に格納された制御プログラムに基づいて、図１０及
び図１１に示す名前学習処理手順ＲＴ１に従って新規な
人の名前を順次学習するための各種処理を実行する。

【００７１】すなわち対話制御部８２は、マイクロホン
５１からの音声信号Ｓ１Ｂに基づき話者認識部８１が人
の声の音声的特徴を認識することにより当該話者認識部
８１からＳＩＤが与えられると名前学習処理手順ＲＴ１
をステップＳＰ０において開始し、続くステップＳＰ１
において、メモリ８４に格納された既知の人の名前と、
これに対応するＳＩＤとを関連付けた情報（以下、これ
を関連付け情報と呼ぶ）に基づいてそのＳＩＤから対応
する名前を検索できるか否か（すなわちＳＩＤが認識不
能を意味する「−１」でないか否か）を判断する。

【００７２】ここでこのステップＳＰ１において肯定結
果を得ることは、その人が、話者認識部８１がその人の
声の音声的特徴のデータを記憶しており、当該データと
対応付けられたＳＩＤがその人の名前と関連付けてメモ
リ８４に格納されている既知の人であることを意味す
る。ただしこの場合においても、話者認識部８１が新規
の人を既知の人と誤認識したことも考えられる。

【００７３】そこで対話制御部８２は、ステップＳＰ１
において肯定結果を得た場合には、ステップＳＰ２に進
んで所定の文字列データＤ２を音声合成部８３に送出す
ることにより、例えば図１２に示すように、「○○さん
ですよね。」といったその人の名前がＳＩＤから検索さ
れた名前（上述の○○に当てはまる名前）と一致するか
否かを確かめるための質問の音声をスピーカ５４から出
力させる。

【００７４】次いで対話制御部８２は、ステップＳＰ３
に進んで、かかる質問に対するその人の「はい、そうで
す。」や「いいえ、違います。」といった応答の音声認
識結果が音声認識部８０から与えられるのを待ち受け
る。そして対話制御部８２は、やがて音声認識部８０か
らかかる音声認識結果が与えられ、また話者認識部８１
からそのときの話者認識結果であるＳＩＤが与えられる
と、ステップＳＰ４に進んで、音声認識部８０からの音
声認識結果に基づき、その人の応答が肯定的なものであ
るか否かを判断する。

【００７５】ここでこのステップＳＰ４において肯定結
果を得ることは、ステップＳＰ１において話者認識部８
１から与えられたＳＩＤに基づき検索された名前がその
人の名前と一致しており、従ってその人は対話制御部８
２が検索した名前を有する本人であるとほぼ断定できる
状態にあることを意味する。

【００７６】かくしてこのとき対話制御部８２は、その
人は当該対話制御部８２が検索した名前を有する本人で
あると断定し、ステップＳＰ５に進んで話者認識部６１
に対して追加学習の開始命令を与える。

【００７７】そして対話制御部８２は、この後ステップ
ＳＰ６に進んで例えば図１２のように「今日はいい天気
ですね。」などといった、その人との対話を長引かせる
ための雑談をさせるための文字列データＤ２を音声合成
部８３に順次送出し、この後追加学習に十分な所定時間
が経過すると、ステップＳＰ７に進んで話者認識部８１
に対して追加学習の終了命令を与えた後、ステップＳＰ
２０に進んでその人に対する名前学習処理を終了する。

【００７８】一方、ステップＳＰ１において否定結果を
得ることは、話者認識部８１により声認識された人が新
規の人であるか、又は話者認識部８１が既知の人を新規
の人と誤認識したことを意味する。またステップＳＰ４
において否定結果を得ることは、最初に話者認識部８１
から与えられたＳＩＤから検索された名前がその人の名
前と一致していないことを意味する。そして、これらい
ずれの場合においても、対話制御部８２がその人を正し
く把握していない状態にあるといえる。

【００７９】そこで対話制御部８２は、ステップＳＰ１
において否定結果を得たときや、ステップＳＰ４におい
て否定結果を得たときには、ステップＳＰ８に進んで音
声合成部８３に文字列データＤ２を与えることにより、
例えば図１３に示すように、「あれ、名前を教えてくだ
さい。」といった、その人の名前を聞き出すための質問
の音声をスピーカ５４から出力させる。

【００８０】そして対話制御部８２は、この後ステップ
ＳＰ９に進んで、かかる質問に対するその人の「○○で
す。」といった応答の音声認識結果（すなわち名前）
と、当該応答時における話者認識部８１の話者認識結果
（すなわちＳＩＤ）とがそれぞれ音声認識部８０及び話
者認識部８１から与えられるのを待ち受ける。

【００８１】そして対話制御部８２は、やがて音声認識
部８０から音声認識結果が与えられ、話者認識部８１か
らＳＩＤが与えられると、ステップＳＰ１０に進んで、
これら音声認識結果及びＳＩＤに基づいて、その人が新
規な人であるか否かを判断する。

【００８２】ここでこの実施の形態の場合、かかる判断
は、音声認識部８０の音声認識により得られた名前と、
話者認識部８１からのＳＩＤとでなる２つの認識結果の
多数決により行われ、いずれか一方でも否定的な認識結
果が得られれば保留することとする。

【００８３】例えば、話者認識部８１からのＳＩＤが認
識不能を意味する「−１」で、かつステップＳＰ９にお
いて音声認識部８０からの音声認識結果に基づき得られ
たその人の名前がメモリ８４においてどのＳＩＤとも関
連付けられていない場合には、その人が新規な人である
と判断する。既知のどの顔又はどの声とも似つかない人
が全く新しい名前をもっているという状況であるので、
そのような判断ができる。

【００８４】また対話制御部８２は、話者認識部８１か
らのＳＩＤがメモリ８４において異なる名前と関連付け
られており、かつステップＳＰ９において音声認識部８
０からの音声認識結果に基づき得られたその人の名前が
メモリ８４に格納されてない場合にも、その人が新規な
人であると判断する。これは、各種認識処理において、
新規カテゴリを既知カテゴリのどれかと誤認識するのは
起こり易いことであり、また音声認識された名前が登録
されていないことを考えれば、かなり高い確信度をもっ
て新規の人と判断できるからである。

【００８５】これに対して対話制御部８２は、話者認識
部８１からのＳＩＤがメモリ８４において同じ名前と関
連付けられており、かつステップＳＰ９において音声認
識部８０からの音声認識結果に基づき得られたその人の
名前がそのＳＩＤが関連付けられた名前である場合に
は、その人が既知の人であると判断する。

【００８６】また対話制御部８２は、話者認識部８１か
らのＳＩＤがメモリ８４において異なる名前と関連付け
られており、かつステップＳＰ９において音声認識部８
０からの音声認識結果に基づき得られたその人の名前が
かかるＳＩＤが関連付けられた名前である場合には、そ
の人が既知の人であるか又は新規の人であるかを判断し
ない。このケースでは、音声認識部８０及び話者認識部
８１のいずれか又は両方の認識が間違っていることも考
えられるが、この段階ではそれを判定することができな
い。従ってこの場合には、かかる判断を保留する。

【００８７】そして対話制御部８２は、このような判断
処理により、ステップＳＰ１０において、かかる人が新
規の人であると判断した場合には、ステップＳＰ１１に
進んで新規学習の開始命令を話者認識部８１に与え、こ
の後ステップＳＰ１２に進んで例えば図１３のように
「私はロボットです。よろしくお願いします。」又は
「○○さん、今日はいい天気ですね。」などのその人と
の対話を長引かせる雑談をするための文字列データＤ２
を音声合成部８３に送出する。

【００８８】また対話制御部８２は、この後ステップＳ
Ｐ１３に進んで話者認識部８１における音響的特徴のデ
ータの収集が十分量に達したか否かを判断し、否定結果
を得るとステップＳＰ１２に戻って、この後ステップＳ
Ｐ１３において肯定結果を得るまでステップＳＰ１２−
ＳＰ１３−ＳＰ１２のループを繰り返す。

【００８９】そして対話制御部８２は、やがて話者認識
部８１における音響的特徴のデータの収集が十分量に達
することによりステップＳＰ１３において肯定結果を得
ると、ステップＳＰ１４に進んで、これら話者認識部８
１に新規学習の終了命令を与える。この結果、話者認識
部８１において、その音響的特徴のデータが新たなＳＩ
Ｄと対応付けられて記憶される。

【００９０】また対話制御部８２は、この後ステップＳ
Ｐ１５に進んで、話者認識部８１からかかるＳＩＤが与
えられるのを待ち受け、やがてこれが与えられると、例
えば図１４に示すように、これらをステップＳＰ９にお
いて音声認識部８０からの音声認識結果に基づき得られ
たその人の名前と関連付けてメモリ８４に登録する。そ
して対話制御部８２は、この後ステップＳＰ２０に進ん
でその人に対する名前学習処理を終了する。

【００９１】これに対して対話制御部８２は、ステップ
ＳＰ１０において、かかる人が既知の人であると判断し
た場合には、ステップＳＰ１６に進んで、話者認識部８
１がその既知の人を正しく認識できていた場合（すなわ
ち話者認識部８１が、関連付け情報としてメモリ８４に
格納されたその既知の人に対応するＳＩＤと同じＳＩＤ
を認識結果として出力していた場合）には、その話者認
識部８１に対して追加学習の開始命令を与える。

【００９２】具体的には、対話制御部８２は、ステップ
ＳＰ９において得られた話者認識部６１からのＳＩＤ
と、最初に話者認識部８１から与えられたＳＩＤとがメ
モリ８４において同じ名前と関連付けられており、かつ
ステップＳＰ９において音声認識部８０からの音声認識
結果に基づき得られた名前がそのＳＩＤが関連付けられ
た名前であることによりステップＳＰ１０においてその
人が既知の人であると判断したときには、話者認識部８
１に対して追加学習の開始命令を与える。

【００９３】そして対話制御部８２は、この後ステップ
ＳＰ１７に進んで、例えば図１５に示すように、「ああ
○○さんですね。思い出しましたよ。今日はいい天気で
すね。」、「前回はえーと、いつ会いましたっけ。」な
どのその人との対話を長引かせるための雑談をさせるた
めの文字列データＤ２を音声合成部８３に順次送出し、
この後追加学習に十分な所定時間が経過すると、ステッ
プＳＰ１８に進んで話者認識部８１に対して追加学習の
終了命令を与えた後、ステップＳＰ２０に進んでその人
に対する名前学習処理を終了する。

【００９４】また話者認識部８１は、ステップＳＰ９に
おいて得られた話者認識部８１からのＳＩＤと、最初に
話者認識部８１から与えられたＳＩＤとがメモリ６５に
おいて異なる名前と関連付けられており、かつステップ
ＳＰ９において音声認識部８０からの音声認識結果に基
づき得られた名前がかかるＳＩＤが関連付けられた名前
であることによりステップＳＰ１０においてその人が既
知の人であるとも新規の人であるとも判定できないと判
断した場合、ステップＳＰ１９に進んで、例えば図１６
に示すように、「ああそうですか。元気ですか。」など
の雑談をさせるための文字列データＤ２を音声合成部８
３に順次送出する。

【００９５】そしてこの場合には、対話制御部８２は、
新規学習又は追加学習の開始命令及びその終了命令を話
者認識部８１に与えず（すなわち新規学習及び追加学習
のいずれも話者認識部８１に行わせず）、所定時間が経
過すると、ステップＳＰ２０に進んでその人に対する名
前学習処理を終了する。

【００９６】このようにして対話制御部８２は、音声認
識部８０及び話者認識部８１の各認識結果に基づいて、
人との対話制御や話者認識部８１の動作制御を行うこと
により、新規な人の名前を順次学習することができるよ
うになされている。

【００９７】このようにこのロボット１では、新規な人
との対話を通してその人の名前を取得し、当該名前を、
マイクロホン５１の出力に基づいて検出したその人の声
の音響的特徴のデータと関連付けて記憶すると共に、こ
れら記憶した各種データに基づいて、名前を取得してい
ないさらに新規な人の登場を認識し、その新規な人の名
前や声の音響的特徴及び顔の形態的特徴を上述と同様に
して取得し記憶するようにして、人の名前を学習するこ
とができる。

【００９８】従って、このロボット１は、音声コマンド
の入力やタッチセンサの押圧操作等のユーザからの明示
的な指示による名前登録を必要とすることなく、人間が
普段行うように、通常の人との対話を通して新規な人物
や物体等の名前を自然に学習することができる。

【００９９】（５）音声認識部８０の具体的構成次に、図１７において、上述のような名前学習機能を具
現化するための音声認識部８０の具体的構成について説
明する。

【０１００】この音声認識部８０においては、マイクロ
ホン５１からの音声信号Ｓ１ＢをＡＤ（Analog Digita
l）変換部９０に入力する。ＡＤ変換部９０は、供給さ
れるアナログ信号である音声信号Ｓ１Ｂをサンプリン
グ、量子化し、ディジタル信号である音声データにＡ／
Ｄ変換する。この音声データは、特徴抽出部９１に供給
される。

【０１０１】特徴抽出部９１は、そこに入力される音声
データについて、適当なフレームごとに、例えば、ＭＦ
ＣＣ（Mel Frequency Cepstrum Cofficient）分析を行
い、その分析の結果得られるＭＦＣＣを、特徴ベクトル
（特徴パラメータ）として、マッチング部９２と未登録
語区間処理部９６に出力する。なお、特徴抽出部９１で
は、その後、例えば線形予測係数、ケプストラム係数、
線スペクトル対、所定の周波数ごとのパワー（フイルタ
バンクの出力）等を、特徴ベクトルとして抽出すること
が可能である。

【０１０２】マッチング部９２は、特徴抽出部９１から
の特徴ベクトルを用いて、音響モデル記憶部９３、辞書
記憶部９４及び文法記憶部９５を必要に応じて参照しな
がら、マイクロホン５１に入力された音声（入力音声）
を、例えば、連続分布ＨＭＭ（Hidden Markov Model）
法に基づいて音声認識する。

【０１０３】すなわち音響モデル記憶部９３は、音声認
識する音声の言語における個々の音素や、音節、音韻な
どのサブワードについて音響的な特徴を表す音響モデル
（例えば、ＨＭＭの他、ＤＰ（Dynamic Programing）マ
ッチングに用いられる標準パターン等を含む）を記憶し
ている。なお、ここでは連続分布ＨＭＭ法に基づいて音
声認識を行うことをしているので、音響モデルとしては
ＨＭＭ（Hidden Markov Model）が用いられる。

【０１０４】辞書記憶部９４は、認識対象の各単位ごと
にクラスタリングされた、その単語の発音に関する情報
（音響情報）と、その単語の見出しとが対応付けられた
単語辞書を認識している。

【０１０５】ここで、図１８は、辞書記憶部９４に記憶
された単語辞書を示している。

【０１０６】図１８に示すように、単語辞書において
は、単語の見出しとその音韻系列とが対応付けられてお
り、音韻系列は、対応する単語ごとにクラスタリングさ
れている。図１８の単語辞書では、１つのエントリ（図
１６の１行）が、１つのクラスタに相当する。

【０１０７】なお、図１８において、見出しはローマ字
と日本語（仮名漢字）で表してあり、音韻系列はローマ
字で表してある。ただし、音韻系列における「Ｎ」は、撥
音「ん」を表す。また、図１８では、１つのエントリに１
つの音韻系列を記述してあるが、１つのエントリには複
数の音韻系列を記述することも可能である。

【０１０８】図１７に戻り、文法記憶部９５は、辞書記
憶部９４の単語辞書に登録されている各単語がどのよう
に連鎖する（つながる）かを記述した文法規則を記憶し
ている。

【０１０９】ここで、図１９は、文法記憶部９５に記憶
された文法規則を示している。なお、図１９の文法規則
は、ＥＢＮＦ（Extended Backus Naur Form）で記述さ
れている。

【０１１０】図１９においては、行頭から最初に現れる
「；」までが１つの文法規則を表している。また先頭に
「＄」が付されたアルファベット（列）は変数を表し、
「＄」が付されていないアルファベット（列）は単語の見
出し（図１８に示したローマ字による見出し）を表す。
さらに［］で囲まれた部分は省略可能であることを表
し、「｜」は、その前後に配置された見出しの単語（ある
いは変数）のうちのいずれか一方を選択することを表
す。

【０１１１】従って、図１９において、例えば、第１行
（上から１行目）の文法規則「＄col＝［Kono｜sono］ir
o wa；」は、変数＄colが、「このいろ（色）は」または
「そのいろ（色）は」という単語列であることを表す。

【０１１２】なお、図１９に示した文法規則において
は、変数＄silと＄garbageが定義されていないが、変数
＄silは、無音の音響モデル（無音モデル）を表し、変
数＄garbageは、基本的には、音韻どうしの間での自由
な遷移を許可したガーベジモデルを表す。

【０１１３】再び図１７に戻り、マッチング部９２は、
辞書記憶部９４の単語辞書を参照することにより、音響
モデル記憶部９３に記憶されている音響モデルを接続す
ることで、単語の音響モデル（単語モデル）を構成す
る。さらにマッチング部９２は、幾つかの単語モデルを
文法記憶部９５に記憶された文法規則を参照することに
より接続し、そのようにして接続された単語モデルを用
いて、特徴ベクトルに基づき、連続分布ＨＭＭ法によっ
て、マイクロホン５１に入力された音声を認識する。す
なわちマッチング部９２は、特徴抽出部９１が出力する
時系列の特徴ベクトルが観測されるスコア（尤度）が最
も高い単語モデルの系列を検出し、その単語モデルの系
列に対応する単語列の見出しを、音声の認識結果として
出力する。

【０１１４】より具体的には、マッチング部９２は、接
続された単語モデルに対応する単語により接続し、その
ようにして接続された単語モデルを用いて、特徴ベクト
ルに基づき、連続分布ＨＭＭ法によって、マイクロホン
５１に入力された音声を認識する。すなわちマッチング
部９２は、特徴抽出部９１が出力する時系列の特徴ベク
トルが観測されるスコア（尤度）が最も高い単語モデル
の系列を検出し、その単語モデルの系列に対応する単語
列の見出しを音声認識結果として出力する。

【０１１５】より具体的には、マッチング部９２は、接
続された単語モデルに対応する単語列について、各特徴
ベクトルの出現確率（出力確率）を累積し、その累積値
をスコアとして、そのスコアを最も高くする単語列の見
出しを音声認識結果として出力する。

【０１１６】以上のようにして出力されるマイクロホン
５１に入力された音声認識結果は、文字列データＤ１と
して対話制御部８２に出力される。

【０１１７】ここで図１９の実施の形態では、第９行
（上から９行目）にガーベジモデルを表す変数＄garbag
eを用いた文法規則（以下、適宜、未登録語用規則とい
う）「＄pat1＝＄colorl $garbage ＄color2；」がある
が、マッチング部９２は、この見登録語用規則が適用さ
れた場合には、変数＄garbageに対応する音声区間を未
登録語の音声区間として検出する。さらに、マッチング
部９２は、未登録語用規則が適用された場合における変
数＄garbageが表すガーベジモデルにおける音韻の遷移
としての音韻系列を未登録語の音韻系列として検出す
る。そしてマッチング部９２は、未登録語用規則が適用
された音声認識結果が得られた場合に検出される未登録
語の音声区間と音韻系列を未登録語区間処理部９６に供
給する。

【０１１８】なお上述の未登録語用規則「＄pat1＝＄col
orl $garbage ＄color2；」によれば、変数＃color1で表
される単語辞書に登録されている単語（列）の音韻系列
と、変数＄color2で表される単語辞書に登録されている
単語（列）の音韻系列との間にある１つの未登録語が検
出されるが、この実施の形態においては、発話に複数の
未登録語が含まれている場合や、未登録語が単語辞書に
登録されている単語（列）間に挟まれていない場合であ
っても適用可能である。

【０１１９】未登録語区間処理部９６は、特徴抽出部９
１から供給される特徴ベクトルの系列（特徴ベクトル系
列）を一時記憶する。さらに、未登録語区間処理部９６
は、マッチング部９２から未登録語の音声区間と音韻系
列を受信すると、その音声区間における音声の特徴ベク
トル系列を、一時記憶している特徴ベクトル系列から検
出する。そして未登録語区間処理部９６は、マッチング
部９２からの音韻系列（未登録語）にユニークなＩＤ
（identification）を付し、未登録語の音韻系列と、そ
の音声区間における特徴ベクトル系列とともに、特徴ベ
クトルバッファ９７に供給する。

【０１２０】特徴ベクトルバッファ９７は、例えば、図
２０に示すように、未登録語区間処理部９６から供給さ
れる未登録語のＩＤ、音韻系列及び特徴ベクトル系列を
対応付けて一時記憶する。

【０１２１】ここで図２０においては、未登録語に対し
て１からのシーケンシャルな数時がＩＤとして付されて
いる。従って、例えばいま、特徴ベクトルバッファ９７
において、Ｎ個の未登録語のＩＤ、音韻系列及び特徴ベ
クトル系列が記憶されている場合において、マッチング
部９２が未登録語の音声区間と音韻系列を検出すると、
未登録語区間処理部９６では、その未登録語に対してＮ
＋１がＩＤとして付され、特徴ベクトルバッファ９７で
は、図２０に点線で示すように、その未登録語のＩＤ、
音韻系列及び特徴ベクトル系列が記憶される。

【０１２２】再び図１７に戻り、クラスタリング部９８
は、特徴ベクトルバッファ９７に新たに記憶された未登
録語（以下、適宜、新未登録語という）について、特徴
ベクトルバッファ７７に既に記憶されている他の未登録
語（以下、適宜、既記憶未登録語という）それぞれに対
するスコアを計算する。

【０１２３】すなわちクラスタリング部９８は、新未登
録語を入力音声とし、かつ既記憶未登録語を単語辞書に
登録されている単語とみなして、マッチング部７９２に
おける場合と同様にして、新未登録語について、各既記
憶未登録語に対するスコアを計算する。具体的には、ク
ラスタリング部９８は、特徴ベクトルバッファ９７を参
照することで新未登録語の特徴ベクトル系列を認識する
とともに、既記憶未登録語の音韻系列にしたがって音響
モデルを接続し、その接続された音響モデルから新未登
録語の特徴ベクトル系列が観測される尤度としてのスコ
アを計算する。

【０１２４】なお、音響モデルは、音響モデル記憶部９
３に記憶されているものが用いられる。

【０１２５】クラスタリング部９８は、同様にして、各
既記憶未登録語について、新未登録語に対するスコアも
計算し、そのスコアによってスコアシート記憶部９９に
記憶されたスコアシートを更新する。

【０１２６】さらにクラスタリング部９８は、更新した
スコアシートを参照することにより、既に求められてい
る未登録語（既記憶未登録語）をクラスタリングしたク
ラスタの中から、新未登録語を新たなメンバとして加え
るクラスタを検出する。さらにクラスタリング部９８
は、新未登録語を検出したクラスタの新たなメンバと
し、そのクラスタをそのクラスタのメンバに基づいて分
割し、その分割結果に基づいて、スコアシート記憶部９
９に記憶されているスコアシートを更新する。

【０１２７】スコアシート記憶部９９は、新未登録語に
ついての既記憶未登録語に対するスコアや、既記憶未登
録語についての新未登録語に対するスコア等が登録され
たスコアシートを記憶する。

【０１２８】ここで、図２１は、スコアシートを示して
いる。

【０１２９】スコアシートは、未登録語の「ＩＤ」、「音
韻系列」、「クラスタナンバ」、「代表メンバＩＤ」及び「ス
コア」が記述されたエントリで構成される。

【０１３０】未登録語の「ＩＤ」と「音韻系列」としては、
特徴ベクトルバッファ９７に記憶されたものと同一のも
のがクラスタリング部９８によって登録される。「クラ
スタナンバ」は、そのエントリの未登録語がメンバとな
っているクラスタを特定するための数字で、クラスタリ
ング部９８によって付され、スコアシートに登録され
る。「代表ナンバＩＤ」は、そのエントリの未登録語がメ
ンバとなっているクラスタを代表する代表メンバとして
の未登録のＩＤであり、この代表メンバＩＤによって、
未登録語がメンバとなっているクラスタの代表メンバを
認識することができる。なお、クラスタの代表メンバ
は、クラスタリング部９８によって求められ、その代表
メンバのＩＤがスコアシートの代表メンバＩＤに登録さ
れる。「スコア」は、そのエントリの未登録語についての
他の未登録語それぞれに対するスコアであり、上述した
ように、クラスタリング部９８によって計算される。

【０１３１】例えば、いま、特徴ベクトルバッファ９７
において、Ｎ個の未登録語のＩＤ、音韻系列及び特徴ベ
クトル系列が記憶されているとすると、スコアシートに
は、そのＮ個の未登録語のＩＤ、音韻系列、クラスタナ
ンバ、代表ナンバＩＤ及びスコアが登録されている。

【０１３２】そして特徴ベクトルバッファ９７に、新未
登録語のＩＤ、音韻系列、および特徴ベクトル系列が新
たに記憶されると、クラスタリング部９８では、スコア
シートが図２１において点線で示すように更新される。

【０１３３】すなわちスコアシートには、新未登録語の
ＩＤ、音韻系列、クラスタナンバ、代表メンバＩＤ、新
未登録語についての既記憶未登録語それぞれに対するス
コア（図１９におけるスコアｓ（Ｎ+１，１）、ｓ
（２、Ｎ+１）、…ｓ（Ｎ+１、Ｎ）が追加される。さら
にスコアシートには、既記憶未登録語それぞれについて
の新未登録語に対するスコア（図２１におけるｓ（Ｎ+
１，１）、ｓ（２、Ｎ+１）、…ｓ（Ｎ+１、Ｎ））が追
加される。さらに後述するように、スコアシートにおけ
る未登録語のクラスタナンバと代表メンバＩＤが必要に
応じて変更される。

【０１３４】なお、図２１の実施の形態においては、Ｉ
Ｄがｉの未登録語（の発話）についての、ＩＤがｊの未
登録語（の音韻系列）に対するスコアを、s（ｉ、ｊ）
として表してある。

【０１３５】またスコアシート（図２１）には、ＩＤが
ｉの未登録語（の発話）についての、ＩＤがｉの未登録
語（の音韻系列）に対するスコアｓ（ｉ、ｊ）も登録さ
れる。ただし、このスコアｓ（ｉ、ｊ）は、マッチング
部９２において、未登録語の音韻系列が検出されるとき
に計算されるため、クラスタリング部９８で計算する必
要はない。

【０１３６】再び図１７に戻り、メンテナンス部１００
は、スコアシートに記憶部９９における更新後のスコア
シートに基づいて、辞書記憶部９４に記憶された単語辞
書を更新する。

【０１３７】ここで、クラスタの代表メンバは、次のよ
うに決定される。すなわち、例えば、クラスタのメンバ
となっている未登録語のうち、他の未登録語それぞれに
ついてのスコアの総和（その他、例えば、総和を他の未
登録語の数で除算した平均値でも良い）を最大にするも
のがそのクラスタの代表メンバとされる。従って、この
場合、クラスタに属するメンバのメンバＩＤをｋで表す
こととすると、次式

【０１３８】

【数１】

【０１３９】で示される値ｋ（∈ｋ）をＩＤとするメン
バが代表メンバとされることになる。

【０１４０】ただし、（１）式において、maxｋ{}
は、{}内の値を最大にするｋを意味する。またｋ３は、
ｋと同様に、クラスタに属するメンバのＩＤを意味す
る。さらに、Σは、ｋ３をクラスタに属するメンバすべ
てのＩＤに亘って変化させての総和を意味する。

【０１４１】なお上述のように代表メンバを決定する場
合、クラスタのメンバが１または２つの未登録語である
ときには、代表メンバを決めるにあたってスコアを計算
する必要はない。すなわちクラスタのメンバが１つの未
登録語である場合には、その１つの未登録語が代表メン
バとなり、クラスタのメンバが２つの未登録語である場
合には、その２つの未登録語のうちのいずれを代表メン
バとしても良い。

【０１４２】また代表メンバの決定方法は、上述したも
のに限定されるものではなく、その他、例えばクラスタ
のメンバとなっている未登録語のうち、他の未登録語そ
れぞれとの特徴ベクトル空間における距離の総和を最小
にするもの等をそのクラスタの代表メンバとすることも
可能である。

【０１４３】以上のように構成される音声認識部８０で
は、マイクロホン５１に入力された音声を認識する音声
認識処理と、未登録語に関する未登録語処理が図２２に
示す音声認識処理手順ＲＴ２に従って行われる。

【０１４４】実際上、音声認識部８０では、人が発話を
行うことにより得られた音声信号Ｓ１Ｂがマイクロホン
５１からＡＤ変換部９０を介して音声データとされて特
徴抽出部９１に与えられるとこの音声認識処理手順ＲＴ
２がステップＳＰ３０において開始される。

【０１４５】そして続くステップＳＰ３１において、特
徴抽出部９１が、その音声データを所定のフレーム単位
で音響分析することにより特徴ベクトルを抽出し、その
特徴ベクトルの系列をマッチング部９２及び未登録語区
間処理部９６に供給する。

【０１４６】マッチング部９６は、続くステップＳ３２
において、特徴抽出部９１からの特注オベクトル系列に
ついて、上述したようにスコア計算を行い、この後ステ
ップＳ３３において、スコア計算の結果得られるスコア
に基づいて、音声認識結果となる単語列の見出しを求め
て出力する。

【０１４７】さらにマッチング部９２は、続くステップ
Ｓ３４において、ユーザの音声に未登録語が含まれてい
たかどうかを判定する。

【０１４８】ここで、このステップＳ３４において、ユ
ーザの音声に未登録語が含まれていないと判定された場
合、すなわち上述の未登録語用規則「＄pat1＝＄colorl
＄garbage ＄color2；」が適用されずに音声認識結果が
得られた場合、ステップＳ３５に進んで処理が終了す
る。

【０１４９】これに対してステップＳ３４において、ユ
ーザの音声に未登録語が含まれていると判定された場
合、すなわち未登録語用規則「＄pat1＝＄colorl ＄garb
age ＄color2；」が適用されて音声認識結果が得られた
場合、マッチング部９２は、続くステップＳ３５におい
て、未登録語用規則の変数＄garbageに対応する音声区
間を未登録語の音声区間として検出するとともに、その
変数＄garbageが表すガーベジモデルにおける音韻の遷
移としての音韻系列を未登録語の音韻系列として検出
し、その未登録語の音声区間と音韻系列を未登録語区間
処理部９６に供給して、処理を終了する（ステップＳＰ
３６）。

【０１５０】一方、未登録語機関処理部９６は、特徴抽
出部９１から供給される特徴ベクトル系列を一時記憶し
ており、マッチング部９２から未登録語の音声区間と音
韻系列が供給されると、その音声区間における音声の特
徴ベクトル系列を検出する。さらに未登録語区間処理部
９６は、マッチング部９２からの未登録語（の音韻系
列）にＩＤを付し、未登録語の音韻系列と、その音声区
間における特徴ベクトル系列とともに、特徴ベクトルバ
ッファ９７に供給する。

【０１５１】以上のようにして、特徴ベクトルバッファ
９７に新たな未登録語（新未登録語）のＩＤ、音韻系列
及び特徴ベクトル系列が記憶されると、この後、未登録
語の処理が図２３に示す未登録語処理手順ＲＴ３に従っ
て行われる。

【０１５２】すなわち音声認識部８０においては、上述
のように特徴ベクトルバッファ９７に新たな未登録語
（新未登録語）のＩＤ、音韻系列及び特徴ベクトル系列
が記憶されるとこの未登録語処理手順ＲＴ３がステップ
ＳＰ４０において開始され、まず最初にステップＳ４１
において、クラスタリング部９８が、特徴ベクトルバッ
ファ９７から新未登録語のＩＤと音韻系列を読み出す。

【０１５３】次いでステップＳ４２において、クラスタ
リング部９８が、スコアシート記憶部９９のスコアシー
トを参照することにより、既に求められている（生成さ
れている）クラスタが存在するかどうかを判定する。

【０１５４】そしてこのステップＳ４２において、すで
に求められているクラスタご存在しないと判定された場
合、すなわち新未登録語が初めての未登録語であり、ス
コアシートに既記憶未登録語のエントリが存在しない場
合には、ステップＳ４３に進み、クラスタリング部９８
が、その新未登録語を代表メンバとするクラスタを新た
に生成し、その新たなクラスタに関する情報と、親身登
録語に関する情報とをスコアシート記憶部９９のスコア
シートに登録することにより、スコアシートを更新す
る。

【０１５５】すなわちクラスタリング部９８は、特徴ベ
クトルバッファ９７から読み出した新未登録語のＩＤお
よび音韻系列をスコアシート（図２１）に登録する。さ
らにクラスタリング部９８は、ユニークなクラスタナン
バを生成し、新未登録語のクラスタナンバとしてスコア
シートに登録する。またクラスタリング部９８は、新未
登録語のＩＤをその新未登録語の代表ナンバＩＤとし
て、スコアシートに登録する。従ってこの場合は、新未
登録語は、新たなクラスタの代表メンバとなる。

【０１５６】なお、いまの場合、新未登録語とのスコア
を計算する既記憶未登録語が存在しないため、スコアの
計算は行われない。

【０１５７】かかるステップＳ４３の処理後は、ステッ
プＳ５２に進み、メンテナンス部１００は、ステップＳ
４３で更新されたスコアシートに基づいて、辞書記憶部
９４の単語辞書を更新し、処理を終了する（ステップＳ
Ｐ５４）。

【０１５８】すなわち、いまの場合、新たなクラスタが
生成されているので、メンテナンス部１００は、スコア
シートにおけるクラスタナンバを参照し、その新たに生
成されたクラスタを認識する。そしてメンテナンス部１
００は、そのクラスタに対応するエントリを辞書記憶部
９４の単語辞書に追加し、そのエントリの音韻系列とし
て、新たなクラスタの代表メンバの音韻系列、つまりい
まの場合は、新未登録語の音韻系列を登録する。

【０１５９】一方、ステップＳ４２において、すでに求
められているクラスタが存在すると判定された場合、す
なわち新未登録語が初めての未登録語ではなく、従って
スコアシート（図２１）に、既記憶未登録語のエントリ
（行）が存在する場合、ステップＳ４４に進み、クラス
タリング部９８は、新未登録語について、各既記憶未登
録語それぞれに対するスコアを計算すると共に、各既記
憶未登録語それぞれについて、新未登録語に対するスコ
アを計算する。

【０１６０】すなわち、例えば、いま、ＩＤが１乃至Ｎ
個の既記憶未登録語が存在し、新未登録語のＩＤをＮ+
１とすると、クラスタリング部９８では、図２１におい
て点線で示した部分の新未登録語についてのＮ個の既記
憶未登録語それぞれに対するスコアｓ（Ｎ+１、１）、
ｓ（Ｎ+１、２）…、ｓ（Ｎ、Ｎ+１）と、Ｎ個の既記憶
未登録語それぞれについての新未登録語に対するスコア
ｓ（１、Ｎ+１）、ｓ（２、Ｎ+１）…、ｓ（Ｎ、Ｎ+
１）が計算される。なおクラスタリング部９８におい
て、これらのスコアを計算するにあたっては、新未登録
語とＮ個の既記憶未登録語それぞれの特徴ベクトル系列
が必要となるが、これらの特徴ベクトル系列は、特徴ベ
クトルバッファ９７を参照することで認識される。

【０１６１】そしてクラスタリング部９８は、計算した
スコアを新未登録語のＩＤ及び音韻系列とともにスコア
シート（図２１）に追加し、ステップＳ４５に進む。

【０１６２】ステップＳ４５では、クラスタリング部９
８はスコアシート（図２１）を参照することにより、新
未登録語についてのスコアｓ（Ｎ+１、ｉ）（ｉ＝１、
２、…、Ｎ）を最も高く（大きく）する代表メンバを有
するクラスタを検出する。即ち、クラスタリング部９８
は、スコアシートの代表メンバＩＤを参照することによ
り、代表メンバとなっている既記憶未登録語を認識し、
さらにスコアシートのスコアを参照することで、新未登
録語についてのスコアを最も高くする代表メンバとして
の既記憶未登録語を検出する。そしてクラスタリング部
９８は、その検出した代表メンバとしての既記憶未登録
語のクラスタナンバのクラスタを検出する。

【０１６３】その後、ステップＳ４６に進み、クラスタ
リング部９８は、新未登録語をステップＳ４５で検出し
たクラスタ（以下、適宜、検出クラスタという）のメン
バに加える。すなわちクラスタリング部９８は、スコア
シートにおける新未登録語のクラスタナンバとして、検
出クラスタの代表メンバのクラスタナンバを書き込む。

【０１６４】そしてクラスタリング部９８は、ステップ
Ｓ４７において、検出クラスタを例えば２つのクラスタ
に分割するクラスタ分割処理を行い、ステップＳ４８に
進む。ステップＳ４８では、クラスタリング部９８は、
ステップＳ４７のクラスタ分割処理によって、検出クラ
スタを２つのクラスタに分割することができたかどうか
判定し、分割することができた判定した場合、ステップ
Ｓ４９に進む。ステップＳ４９では、クラスタリング部
９８は、検出クラスタの分割により得られる２つのクラ
スタ（この２つのクラスタを、以下、適宜、第１の子ク
ラスタと第２の子クラスタという）同士の間のクラスタ
間距離を求める。

【０１６５】ここで、第１及び第２の子クラスタ同士間
のクラスタ間距離とは、例えば次のように定義される。

【０１６６】すなわち第１の子クラスタと第２の子クラ
スタの両方の任意のメンバ（未登録語）のＩＤを、ｋで
表すとともに、第１と第２の子クラスタの代表メンバ
（未登録語）のＩＤを、それぞれｋ１またはｋ２で表す
こととすると、次式

【０１６７】

【数２】

【０１６８】で表される値Ｄ（ｋ１，ｋ２）を第１と第
２の子クラスタ同士の間のクラスタ間距離とする。

【０１６９】ただし、（２）式において、abs（）は、
（）内の値の絶対値を表す。また、maxvalｋ{}は、ｋを
変えて求められる{}内の値の最大値を表す。またlog
は、自然対数又は常用対数を表す。

【０１７０】いま、ＩＤがｉのメンバをメンバ＃Ｉと表
すこととすると、（２）式におけるスコアの逆数１／ｓ
（ｋ，ｋ１）は、メンバ＃ｋと代表メンバｋ１との距離
に相当し、スコアの逆数１／ｓ（ｋ，ｋ２）は、メンハ゛＃
ｋと代表メンバｋ２との距離に相当する。従って、
（２）式によれば、第１と第２の子クラスタのメンバの
うち、第１の子クラスタの代表メンバ＃ｋ１との距離
と、第２の子クラスタの代表メンバ＃ｋ２との差の最大
値が、第１と第２の子クラスタ同士の間の子クラスタ間
距離とされることになる。

【０１７１】なおクラスタ間距離は、上述したものに限
定されるものではなく、その他、例えば、第１の子クラ
スタの代表メンバと、第２の子クラスタの代表メンバと
のＤＰマッチングを行うことにより、特徴ベクトル空間
における距離の積算値を求め、その距離の積算値を、ク
ラスタ間距離とすることも可能である。

【０１７２】ステップＳ４９の処理後は、ステップＳ５
０に進み、クラスタリング部９８は、第１と第２の子ク
ラスタ同士のクラスタ逢間距離が、所定の閾値ξより大
である（あるいは、閾値ξ以上である）かどうかを判定
する。

【０１７３】ステップＳ５０において、クラスタ間距離
が所定の閾値ξより大であると判定された場合、すなわ
ち検出クラスタのメンバとしての複数の未登録後が、そ
の音響的特徴からいって、２つのクラスタにクラスタリ
ングすべきものであると考えられる場合、ステップＳ５
１に進み、クラスタリング部９８は、第１と第２の子ク
ラスタをスコアシート記憶部９９のスコアシートに登録
する。

【０１７４】すなわちクラスタリング部９８は、第１と
第２の子クラスタにユニークなクラスタナンバを割り当
て、検出クラスタのメンバのうち、第１の子クラスタに
クラスタリングされたもののクラスタナンバを第１の子
クラスタのクラスタナンバにすると共に、第２の子クラ
スタにクラスタリングされたもののクラスタナンバを第
２の子クラスタのクラスタナンバにするように、スコア
シートを更新する。

【０１７５】さらにクラスタリング部９８は、第１の子
クラスタにクラスタリングされたメンバの代表メンバＩ
Ｄを第１の子クラスタの代表メンバのＩＤにすると共
に、第２の子クラスタにクラスタリングされたメンバの
代表メンバＩＤを第２の子クラスタの代表メンバのＩＤ
にするように、スコアシートを更新する。

【０１７６】なお、第１と第２の子クラスタのうちいず
れか一方には、検出クラスタのクｒスタナンバを割り当
てるようにすることが可能である。

【０１７７】クラスタリング部９８が以上のようにして
第１と第２の子クラスタをスコアシートに登録すると、
ステップＳ５１からＳ５２に進み、メンテナンス部１０
０が、スコアシートに基づいて、辞書記憶部９４の単語
辞書を更新し、処理を終了する（ステップＳＰ５４）。

【０１７８】すなわち、いまの場合、検出クラスタが第
１と第２の子クラスタに分割されたため、メンテナンス
部１００は、まず単語辞書における検出クラスタに対応
するエントリを削除する。さらにメンテナンス部１００
は、第１と第２の子クラスタそれぞれに対応する２つの
エントリを単語辞書に追加し、第１の子クラスタに対応
するエントリの音韻系列として、その第１の子クラスタ
の代表メンバの音韻系列を登録すると共に、第２の子ク
ラスタに対応するエントリの音韻系列として、その第２
の子クラスタの代表メンバの音韻系列を登録する。

【０１７９】一方、ステップＳ４８において、ステップ
Ｓ４７のクラスタ分割処理によって、検出クラスタを２
つのクラスタに分割することができなかったと判定され
た場合、又はステップＳ５０において、第１と第２の子
クラスタのクラスタ間距離が所定の閾値ξより大でない
と判定された場合、従って、検出クラスタのメンバとし
ての複数の未登録後の音響的特徴が第１と第２の子クラ
スタにクラスタリングするほど似ていないものではない
場合）、ステップＳ５３に進み、クラスタリング部９８
は、検出クラスタの新たな代表メンバを求め、スコアシ
ートを更新する。

【０１８０】すなわちクラスタリング部９８は、新未登
録後をメンバとして加えた検出クラスタの各メンバにつ
いて、スコアシート記憶部９９のスコアシートを参照す
ることにより、（１）式の計算に必要なスコアｓ（ｋ
３，ｋ）を認識する。さらに、クラスタリング９８は、
その認識したスコアｓ（ｋ３，ｋ）を用い、（１）式に
基づき、検出クラスタの新たな代表メンバとなるメンバ
のＩＤを求める。そしてクラスタリング部９８は、スコ
アシート（図２１）における検出クラスタの各メンバの
代表メンバＩＤを、検出クラスタの新たな代表メンバの
ＩＤに書き換える。

【０１８１】その後、ステップＳ５２に進み、メンテナ
ンス部１００が、スコアシートに基づいて辞書記憶部９
４の単語辞書を更新し、処理を終了する（ステップＳＰ
５４）。

【０１８２】すなわち、いまの場合、メンテナンス部１
００は、スコアシートを参照することにより、検出クラ
スタの新たな代表メンバを認識し、さらにそのダ表メン
バの音韻系列を認識する。そしてメンテナンス部１００
は、単語辞書における検出クラスタに対応するエントリ
の音韻系列を、検出クラスタの新たな代表メンバの音韻
系列に変更する。

【０１８３】ここで、図２３のステップＳＰ４７のクラ
スタ分割処理は、図２４に示すクラスタ分割処理手順Ｒ
Ｔ４に従って行われる。

【０１８４】すなわち音声認識部８０では、図２４のス
テップＳＰ４６からステップＳＰ４７に進むとこのクラ
スタ分割処理手順ＲＴ４をステップＳＰ６０において開
始し、まず最初にステップＳ６１において、クラスタリ
ング部９８が、新未登録後がメンバとして加えられた検
出クラスタから、まだ選択していない任意の２つのメン
バの組み合わせを選択し、それぞれを仮の代表メンバと
する。ここで、この２つの仮の代表メンバを、以下、適
宜、第１の仮代表メンバと第２の仮代表メンバという。

【０１８５】そして、続くステップＳ６２において、ク
ラスタリング部９８は、第１の仮代表メンバ及び第２の
仮代表メンバをそれぞれ代表メンバとすることができる
ように、検出クラスタのメンバを２つのクラスタに分割
することができるかどうかを判定する。

【０１８６】ここで、第１又は第２の仮代表メンバを代
表メンバとすることができるかどうかは（１）式の計算
を行う必要があるが、この計算に用いられるスコアｓ
（ｋ’，ｋ）は、スコアシートを参照することで認識さ
れる。

【０１８７】ステップＳ６２において、第１の仮代表メ
ンバ及び第２の仮代表メンバをそれぞれ代表メンバとす
ることができるように、検出クラスタのメンバを２つの
クラスタに分割することができないと判定された場合、
ステップＳ６２をスキップして、ステップＳ６４に進
む。

【０１８８】また、ステップＳ６２において、第１の仮
代表メンバと、第２の仮代表メンバをそれぞれ代表メン
バとすることができるように、検出クラスタのメンバを
２つのクラスタに分割することができると判定された場
合、ステップＳ６３に進み、クラスタリング部９８は、
第１の仮代表メンバと、第２の仮代表メンバがそれぞれ
代表メンバとなるように、検出クラスタのメンバを２つ
のクラスタに分割し、その分割後の２つのクラスタの組
を、検出クラスタの分割結果となる第１及び第２の子ク
ラスタの候補（以下、適宜、候補クラスタの組という）
として、ステップＳ６４に進む。

【０１８９】ステップＳ６４では、クラスタリング部９
８は、検出クラスタのメンバの中で、まだ第１と第２の
仮代表メンバの組として選択していない２つのメンバの
組があるかどうかを判定し、あると判定した場合、ステ
ップＳ６１に戻り、まだ第１と第２の仮代表メンバの組
として選択していない検出クラスタの２つのメンバの組
が選択され、以下、同様の処理が繰り返される。

【０１９０】またステップＳ６４において、第１と第２
の仮代表メンバの組として選択していない検出クラスタ
の２つのメンバの組がないと判定された場合、ステップ
Ｓ６５に進み、クラスタリング部９８は、候補クラスタ
の組が存在するかどうかを判定する。

【０１９１】ステップＳ６５において、候補クラスタの
組が存在しないと判定された場合、ステップＳ６６をス
キップして、リターンする。この場合は、図２３のステ
ップＳ４８において、検出クラスタを分割することがで
きなかったと判定される。

【０１９２】一方、ステップＳ６５において、候補クラ
スタの組が存在すると判定された場合、ステップＳ６６
に進み、クラスタリング部９８は、候補クラスタの組が
複数存在するときには、各候補クラスタの組の２つのク
ラスタ同士の間のクラスタ間距離を求める。そして、ク
ラスタリング部９８は、クラスタ間距離が最小の候補ク
ラスタの組を求め、その候補クラスタの組を検出クラス
タの分割結果をして、すなわち第１と第２の子クラスタ
として、リターンする。なお、候補クラスタの組が１つ
だけの場合は、その候補クラスタの組がそのまま第１と
第２の子クラスタとされる。

【０１９３】この場合は、図２３のステップＳ４８にお
いて、検出クラスタを分割することができたと判定され
る。

【０１９４】以上のように、クラスタリング部９８にお
いて、既に求められている未登録語をクラスタリングし
たクラスタの中から、新未登録語を新たなメンバとして
加えるクラスタ（検出クラスタ）を検出し、新未登録語
をその検出クラスタの新たなメンバとして、検出クラス
タをその検出クラスタのメンバに基づいて分割するよう
にしたので、未登録語をその音響的特徴が近似している
もの同士に容易にクラスタリングすることができる。

【０１９５】さらにメンテナンス部１００において、そ
のようなクラスタリング結果に基づいて単語辞書を更新
するようにしたので、単語辞書の大規模化を避けなが
ら、未登録語の単語辞書への登録を容易に行うことがで
きる。

【０１９６】また、例えば、仮に、マッチング部９２に
おいて、未登録語の音声区間の検出を誤ったとしても、
そのような未登録語は、検出クラスタの分割によって、
音声区間が正しく検出された未登録語とは別のクラスタ
にクラスタリングされる。そして、このようなクラスタ
に対応するエントリが単語辞書に登録されることになる
が、このエントリの音韻系列は正しく検出されなかった
音声区間に対応するものとなるから、その後の音声認識
において大きなスコアを与えることはない。従って、仮
に、未登録語の音声区間の検出を誤ったとしても、その
誤りはその後の音声認識にはほとんど影響しない。

【０１９７】ここで、図２５は、未登録語の発話を行っ
て得られたクラスタリング結果を示している。なお、図
２５においては、各エントリ（各行）が１つのクラスタ
を表している。また、図２５の左欄は、各クラスタの代
表メンバ（未登録語）の音韻系列を表しており、図２５
の右欄は、各クラスタのメンバとなっている未登録語の
発話内容と数を表している。

【０１９８】すなわち図２５において、例えば第１行の
エントリは、未登録語「風呂」の１つの発話だけがメンバ
となっているクラスタを表しており、その代表メンバの
音韻系列は、「doroa：」（ドロアー）になっている。ま
た、例えば第２行のエントリは、未登録語「風呂」の３つ
の発話がメンバとなっているクラスタを表しており、そ
の代表メンバの音韻系列は、「kuro」（クロ）になってい
る。

【０１９９】さらに、例えば第７行のエントリは、未登
録語「本」の４つの発話がメンバとなっているクラスタを
表しており、その代表メンバの音韻系列は、「NhoNde：s
u」（ンホンテース）になっている。また、例えば第８行
のエントリは、未登録語「オレンジ」の１つの発話と、未
登録語「本」の１９の発話がメンバとなっているクラスタ
を表しており、その代表メンバの音韻系列は、「ohoＮ」
（オホン）になっている。他のエントリも同様のことを
表している。

【０２００】図２５によれば、同一の未登録語の発話に
ついて、良好にクラスタリングされていることが分か
る。

【０２０１】なお、図２５の第８行のエントリにおいて
は、未登録語「オレンジ」の１つの発話と、未登録語「本」
の１９の発話が、同一のクラスタにクラスタリングされ
ている。このクラスタはそのメンバとなっている発話か
ら、未登録語「本」のクラスタとなるべきであると考えら
れるが、未登録語「オレンジ」の発話も、そのクラスタの
メンバとなっている。しかしながらこのクラスタも、そ
の後に未登録語「本」の発話がさらに入力されていくと、
クラスタ分割され、未登録語「本」の発話だけをメンバと
するクラスタと、未登録語「オレンジ」の発話だけをメン
バとするクラスタにクラスタリングされると考えられ
る。

【０２０２】（５）対話制御システムを用いたユーザと
ロボットとの対話（５−１）言葉遊びにおけるコンテンツデータの取得及
び提供実際に図６に示す対話制御システム６３では、ユーザが
ロボット１との間で言葉遊びによる対話を行う場合、ユ
ーザからの要求に応じてロボット１が言葉遊びの具体的
な内容（例えば「なぞなぞ」）を表すコンテンツデータを
コンテンツサーバ６１内のデータベースから取得して、
当該コンテンツデータに基づく問題等をユーザに対して
発話することができるようになされている。

【０２０３】この対話制御システムにおいて、ロボット
１は、ユーザから例えば「なぞなぞをしよう」という発
話をスピーカ５４を介して集音すると、図２６に示すコ
ンテンツデータ取得処理手順ＲＴ５をステップＳＰ７０
から開始し、続くステップＳＰ７１において、ユーザの
発話内容を音声認識処理した後、ユーザごとに対応して
作成しておいたプロファイルデータをメイン制御部４０
内のメモリ４０Ａから読み出してロードする。

【０２０４】かかるプロファイルデータは、メイン制御
部４０内のメモリ４０Ａに格納されており、図２７に示
すように、ユーザごとに既に行った言葉遊びの種類が記
述され、さらに当該種類ごとにそれぞれ問題の難易度
（レベル）、既に遊んだＩＤ及び当該遊んだ回数が記述
されている。

【０２０５】具体的には、まずユーザ名が「○田△子」の
ユーザでは、言葉遊びのうち「なぞなぞ」について、レベ
ルが「２」、既に遊んだＩＤが「１、３、…」及び遊んだ回
数が「１０」であり、「山手線ゲーム」について、レベルが
「４」、既に遊んだＩＤが「１、２、…」及び遊んだ回数が
「５」である。またユーザ名が「□山×男」のユーザでは、
言葉遊びのうち「なぞなぞ」について、レベルが「５」、既
に遊んだＩＤが「３、４、…」及び遊んだ回数が「３０」で
あり、「山手線ゲーム」について、レベルが「２」、既に遊
んだＩＤが「２、５、…」及び遊んだ回数が「２」である。

【０２０６】そしてこのプロファイルデータは、コンテ
ンツサーバ６１に送出する一方、当該コンテンツサーバ
６１からフィードバックされることにより適宜更新され
るようになされている。具体的には、言葉遊びのうち
「なぞなぞ」について、正解すれば難易度（レベル）を上
げると共に、人気がなければ面白くない問題であったと
判断してそのタイプの問題を避けるようにプロファイル
データを更新する。

【０２０７】そしてロボット１は、ステップＳＰ７２に
おいて、言葉遊びのうち「なぞなぞ」を要求するデータを
ネットワーク６２を介してコンテンツサーバ６１に送信
した後、ステップＳＰ７３に進む。

【０２０８】コンテンツサーバ６１は、ロボット１から
要求データを受信すると、コンテンツデータ提供処理手
順ＲＴ６をステップＳＰ８０から開始し、続くステップ
ＳＰ８１において、該当するロボット１との間で通信可
能な接続状態を確立する。

【０２０９】ここでコンテンツサーバ６１内のデータベ
ースには、言葉遊びの種類（例えば「なぞなぞ」や「山手
線ゲーム」等）ごとにコンテンツデータが生成され、当
該コンテンツデータは、その種類に合わせて設定された
複数の出題内容がＩＤ番号を付して記述されている。

【０２１０】例えば図２８に示すように、言葉遊びのう
ち「なぞなぞ」について４個の出題内容が順次ＩＤ番号が
割り当てられて記述されている（以下、これらを第１〜
第４の出題内容ＩＤ１〜ＩＤ４という）。これら第１〜
第４の出題内容ＩＤ１〜ＩＤ４は、それぞれ問題と、当
該問題に対する答えと、当該答えに対する理由とが順次
記述されたものである。

【０２１１】まず第１の出題内容ＩＤ１では、問題が
「４歳と５歳の子供しか住んでいない外国の都市は？」、
答えが「シカゴ」、及び理由が「４歳と５歳でシかゴだよ」
として記述されている。また第２の出題内容ＩＤ２で
は、問題が「少ししか人が乗っていないのに一杯な車は
なんだ？」、答えが「救急車」、及び理由が「キュウキュウ
で一杯だよ」として記述されている。さらに第３の出題
内容ＩＤ３では、問題が「家の中で暖房が効かない場所
はどこだ？」、答えが「玄関」、及び理由が「厳しい寒さで
厳寒だよ」として記述されている。さらに第４の出題内
容ＩＤ４では、問題が「落ち込んでいても２回食べると
元気になるのは？」、答えが「海苔」、及び理由が「２回で
のりのりだよ」として記述されている。

【０２１２】そしてコンテンツデータには、言葉遊びの
種類に応じて設定されるオプションデータが付加されて
おり、第１〜第４の出題内容ＩＤ１〜ＩＤ４に対応して
それぞれ問題の難易度及び出題回数に応じた人気度が数
値化されて記述されている。このオプションデータはロ
ボット１からのアクセス回数やユーザの解答結果等に基
づいて内容が逐次更新されるようになされている。

【０２１３】続いてコンテンツサーバ６１は、ロボット
１に対して「なぞなぞ」についてのコンテンツデータに付
加されたオプションデータを送信した後、ステップＳＰ
８３に進む。

【０２１４】やがてロボットは、ステップＳＰ７３にお
いて、コンテンツサーバ６１から送信されたオプション
データを受信すると、当該オプションデータとユーザに
対応するプロファイルデータとを比較する。そしてロボ
ット１は、コンテンツデータの中から該当するユーザに
最も合った出題内容を選択して、当該出題内容を要求す
る旨のデータをネットワーク６２を介してコンテンツサ
ーバ６１に送信する。

【０２１５】具体的には上述した図２７に示すように、
例えばユーザ名が「○田△子」のユーザが言葉遊びのうち
「なぞなぞ」をする場合、このユーザについてのプロファ
イルデータをコンテンツサーバ６１に送信して、当該プ
ロファイルデータに基づく「なぞなぞ」のレベル「２」に相
当する出題内容を表すコンテンツデータを要求する。

【０２１６】コンテンツサーバ６１は、ステップＳＰ８
３において、ロボット１から送信されたデータに基づい
て、データベースから対応するコンテンツデータを読み
出した後、ネットワーク６２を介してロボット１に送信
し、ステップＳＰ８４に進む。

【０２１７】具体的にはロボット１から得られたプロフ
ァイルデータが「なぞなぞ」のレベルが「２」を表す場合、
そのレベルに合った問題、すなわち図２８に示すオプシ
ョンデータのうち難易度「２」に相当する出題内容を表す
コンテンツデータを選択してロボット１に送信する。こ
の場合、コンテンツデータのうち第１及び第４の出題内
容ＩＤ１、ＩＤ４が該当するが、ユーザ名「○田△子」
における既に遊んだＩＤが「１」を含むため、第１の出題
内容ＩＤ１ではなく、未だ遊んだことのない第４の出題
内容ＩＤ４をコンテンツサーバ６１はロボット１に送信
する。

【０２１８】そしてステップＳＰ７４において、ロボッ
ト１は、コンテンツサーバ６１から取得したコンテンツ
データをロードした後、ステップＳＰ７５に進んで、コ
ンテンツサーバ６１に対して通信接続の切断要求を表す
旨のデータをネットワーク６２を介して送信し、ステッ
プＳＰ７６に進んで当該コンテンツデータ取得処理手順
ＲＴ５を終了する。

【０２１９】一方、コンテンツサーバ６１は、ステップ
ＳＰ８４において、ロボット１から送信されたデータに
基づいて、当該ロボット１との間で確立されている通信
接続を切断した後、ステップＳＰ８５に進んで当該コン
テンツデータ提供処理手順ＲＴ６を終了する。

【０２２０】このようにしてコンテンツデータ取得処理
手順ＲＴ５においては、ロボット１は、ユーザと言葉遊
びをする際、当該言葉遊びのうちユーザによって特定の
種類（なぞなぞ等）が指定されたとき、当該種類を構成
する複数の出題内容の中からユーザに最適な出題内容を
コンテンツサーバ６１から取得することができる。

【０２２１】またコンテンツデータ提供処理手順ＲＴ６
においては、コンテンツサーバ６１は、ロボット１から
の要求に応じて、データベースに格納されている複数の
コンテンツデータのうちユーザに最適な出題内容を含む
コンテンツデータを選択してロボット１に提供すること
ができる。

【０２２２】（５−２）ロボットとユーザとの言葉遊び
による対話シーケンスここでロボット１のメイン制御部４０内のメモリ４０Ａ
には、ロボット１とユーザとが言葉遊びによる対話を行
う場合に、当該言葉遊びの種類ごとに、ロボット１とユ
ーザとの対話のやり取りを表す対話モデルが予め決めら
れており、当該対話モデルに基づいて、言葉遊びの種類
が同一であれば（例えば「なぞなぞ」に関する限り）、
コンテンツデータを入れ替えるだけで、新たに異なる出
題内容等をユーザに提供することができるようになされ
ている。

【０２２３】実際にロボット１はユーザから言葉遊びを
行う旨の発話を受け取ると、図２９に示すように、ロボ
ット１のメモリ制御部４０がこの言葉遊びの種類に対応
する対話モデルに基づいて、ユーザとの対話のときに次
のロボット１による発話内容を順次決定していくように
なされている。

【０２２４】かかる対話モデルでは、ロボット１がとり
得る発話をそれぞれノードＮＤＢ１〜ＮＤＢ７として、
遷移可能なノード間を発話を表す有向アークで結び、か
つ１つのノード間で完結する発話を自己発話アークとし
て表現する有向グラフを用いる。

【０２２５】このためメモリ４０Ａには、このような有
向グラフの元となる、当該ロボット１が発話できる全て
の発話をデータベース化したファイルが格納されてお
り、このファイルに基づいて有向グラフを生成する。

【０２２６】ロボット１のメイン制御部４０は、ユーザ
から言葉遊びを行う旨の発話を受け取ると、対応する有
向グラフを用いて、有向アークの向きに従いながら現在
のノードから指定された発話が対応付けられた有向アー
ク若しくは自己動作アークに至る経路を探索し、当該探
索した経路上の各有向アークにそれぞれ対応付けられた
発話を順次行わせるような指令を次々と出力するように
なされている。

【０２２７】実際にユーザとロボット１との間で言葉遊
びの種類のうち「なぞなぞ」による対話を行う場合を説
明する。まずロボット１が例えば「４歳と５歳の子供し
か住んでいない外国の都市はどこでしょう？」という出
題内容を表すコンテンツデータをコンテンツサーバ６１
から取得して（ノードＮＤ１）、当該出題内容をユーザ
に向けて発話する（ノードＮＤ２）。

【０２２８】そしてロボット１はユーザからの応答を待
ち（ノードＮＤ３）、ユーザの発話が正解である「シカ
ゴ」であれば、「あたり〜！」と発話して（ノードＮＤ
４）、その理由である「４と５でシカゴだよ」と発話する
（ノードＮＤ７）。

【０２２９】またユーザの発話が不正解であれば、「ち
がうよ。答え聞く？」と発話した後（ノードＮＤ５）、
ユーザから「はい」という返事が得られれば「答えはね
え、シカゴ！」と答えを発話した後（ノードＮＤ６）、
さらにその理由である「４と５でシカゴだよ」と発話する
（ノードＮＤ７）一方、「きかない」という返事が得ら
れれば、再度ユーザからの応答を待つ（ノードＮＤ
３）。

【０２３０】さらにユーザの発話が「こうさん」であれ
ば、「答えはねえ、シカゴ！」と答えを発話した後（ノ
ードＮＤ６）、さらにその理由である「４と５でシカゴ
だよ」と発話する（ノードＮＤ７）。また一定時間が経
過しても、ユーザから何も発話されないときには、ロボ
ット１は「ねえねえ、まだ？」と発話して（ノードＮＤ
３）、ユーザからの応答を促すようにする。

【０２３１】このようにロボット１はユーザの発話に関
連する応答として、単に正解を発話するのみならず、正
解の理由をも発話することにより、ユーザにとってロボ
ット１と「なぞなぞ」をするときの面白さを増大させる
ことができる。

【０２３２】さらにこのように正解の理由をもロボット
１が発話することにより、ロボット１がユーザの発話内
容を誤認識した場合でもそのことをユーザは知ることが
できる。

【０２３３】これはゲームなので、ユーザがあえてロボ
ット１の音声認識の誤りを訂正する必要は特にはない
が、ロボット１がユーザの発話内容を誤認識した場合で
も、それを間接的にユーザに伝えることで、言葉遊びの
ゲームをスムーズに進行させることができる。

【０２３４】（５−３）オプションデータの更新図６に示す対話制御システム６３では、上述したコンテ
ンツデータ取得処理手順ＲＴ５及びコンテンツデータ提
供処理手順ＲＴ６（図２６）において述べたように、ロ
ボット１がコンテンツサーバ６１からコンテンツデータ
を取得すると、どのデータを取得したのかの情報がその
コンテンツデータに付加されたオプションデータに反映
される。

【０２３５】例えば、ロボット１が言葉遊びのうち何の
種類さらには何の出題内容を何回取得したかの指標とな
る人気のデータの値が変更される。

【０２３６】またロボット１がユーザに言葉遊びを出題
したときに、その出題内容に対してユーザが正解したか
否かのデータも、ネットワーク６２を介してコンテンツ
サーバ６１にフィードバックされ、当該問題の難易度に
反映されるようにその値が更新される。

【０２３７】このようにロボット１からコンテンツサー
バ６１内のデータベースへのフィードバックは、ユーザ
が意識することなくロボット１によって自動的に行われ
るものもあるが、例えばロボット１との対話によってコ
ンテンツサーバ６１へのフィードバックをユーザから直
接取得するようにしても良い。

【０２３８】ここでコンテンツサーバ６１において、ロ
ボット１からフィードバックされたコンテンツデータに
基づいて、当該コンテンツデータに付加されたオプショ
ンデータを更新する場合について説明する。

【０２３９】ロボット１がコンテンツサーバ６１からコ
ンテンツデータを取得すると、どのデータを取得したの
かの情報がそのコンテンツデータに付加されたオプショ
ンデータに反映される。

【０２４０】実際に図６に示す対話制御システム６３で
は、ユーザがロボット１との間で言葉遊びによる対話を
行った後、ロボット１が人気指標を更新すると自発的又
はユーザからの発話に応じて決定すると、図３０に示す
人気指標集計処理手順ＲＴ７をステップＳＰ９０から開
始し、続くステップＳＰ９１において、コンテンツサー
バ６１に対してアクセス要求を表すデータを送信する。

【０２４１】コンテンツサーバ６１は、ロボット１から
要求データを受信すると、オプションデータ更新処理手
順ＲＴ８をステップＳＰ１００から開始し、続くステッ
プＳＰ１０１において、該当するロボット１との間で通
信可能な接続状態を確立する。

【０２４２】そしてロボット１は、ステップＳＰ９２に
進んで、「今の問題面白かった？」といった質問をユーザ
に対して発話した後、ステップＳＰ９３に進む。

【０２４３】このステップＳＰ９３において、ロボット
１は、ユーザからの応答を待った後、当該応答を受け取
ったときステップＳＰ９４に進む。このステップＳＰ９
４において、ロボット１は、ユーザからの応答の内容が
「つまんなかった」又は「おもしろかった」のいずれか
を判断し、「つまんなかった」と判断した場合にはステ
ップＳＰ９５に進んで、人気のレベル値をデクリメント
（減少）させるように要求する旨の要求データをネット
ワーク６２を介してコンテンツサーバ６１に送信した
後、ステップＳＰ９７に進む。

【０２４４】これに対してステップＳＰ９４において、
ロボット１は、ユーザからの応答の内容が「おもしろか
った」と判断した場合にはステップＳＰ９６に進んで、
人気のレベル値をインクリメント（増加）させるように
要求する旨の要求データをネットワーク６２を介してコ
ンテンツサーバ６１に送信した後、ステップＳＰ９７に
進む。

【０２４５】コンテンツサーバ６１は、ステップＳＰ１
０２において、ロボット１から送信された要求データに
基づいて、データベースから対応するコンテンツデータ
に付加されたオプションデータを読み出した後、当該オ
プションデータの記述内容のうち「人気度」の値を減少又
は増加させる。

【０２４６】そしてコンテンツサーバ６１は、ステップ
ＳＰ１０３において、オプションデータの更新が終了し
た旨の応答データをネットワーク６２を介してロボット
１に送信した後、ステップＳＰ１０４に進む。

【０２４７】ロボット１は、コンテンツサーバ６１から
送信された応答データに基づいて、オプションデータが
更新された旨を確認した後、当該コンテンツサーバ６１
に対して通信接続の切断要求を表す旨の要求データをネ
ットワーク６２を介してコンテンツサーバ６１に送信
し、そのままステップＳＰ９８に進んで当該人気指標集
計処理手順ＲＴ７を終了する。

【０２４８】コンテンツサーバ６１は、ステップＳＰ１
０４において、ロボット１から送信された要求データに
基づいて、当該ロボット１との間で確立されている通信
接続を切断した後、ステップＳＰ１０５に進んで当該オ
プションデータ更新処理手順ＲＴ８を終了する。

【０２４９】このようにして人気指標集計処理手順ＲＴ
７においては、ロボット１は、ユーザに出題したコンテ
ンツデータに基づく出題内容について、その面白さの是
非を当該ユーザに問うことにより、その問題の人気の有
無を確認することができる。

【０２５０】またオプションデータ更新処理手順ＲＴ８
においては、ロボット１から得られたコンテンツデータ
に基づく出題内容についての人気の有無に基づいて、当
該コンテンツデータに付加されたオプションデータの記
述内容を更新することにより、そのユーザにとって当該
出題内容の面白さや好み等を次回の際に反映させること
ができる。

【０２５１】（５−４）コンテンツデータの登録ここでコンテンツサーバ６１内のデータベースに格納さ
れている言葉遊びの種類ごとに登録されているコンテン
ツデータは、当該コンテンツデータに基づく出題内容及
びその答え並びにその答えの理由（以下、単に出題内容
等と呼ぶ）を、各ユーザが発話することによりロボット
１を介して間接的にコンテンツサーバ６１に登録させる
場合と、各ユーザがロボット１を介することなく、自己
の個人端末等を用いて直接的にコンテンツサーバ６１に
登録させる場合の２通りがある。以下にそれぞれの場合
について説明する。

【０２５２】（５−４−１）ロボット１を介して間接的
に出題内容等を追加登録させる場合図６に示す対話制御システム６３では、ユーザの発話に
より出題内容等を受け取ったロボット１は、当該出題内
容等をネットワーク６２を介してコンテンツサーバ６１
に送信することにより、当該コンテンツデータ内のデー
タベースに追加登録させるようになされている。

【０２５３】この対話制御システム６３において、ロボ
ット１は、ユーザから新しい出題内容等を表す発話をス
ピーカ５４を介して集音すると、図３１に示すコンテン
ツ収集処理手順ＲＴ９をステップＳＰ１１０から開始
し、続くステップＳＰ１１１において、コンテンツサー
バ６１に対してアクセス要求を表す要求データを送信す
る。

【０２５４】そしてコンテンツサーバ６１は、ロボット
１から要求データを受信すると、コンテンツデータ追加
登録処理手順ＲＴ１０をステップＳＰ１２０から開始
し、続くステップＳＰ１２１において、該当するロボッ
ト１との間で通信可能な接続状態を確立する。

【０２５５】そしてロボット１は、ステップＳＰ１１２
に進んで、ユーザから取得した出題内容等を表す取得デ
ータをネットワーク６２を介してコンテンツサーバ６１
に送信した後、ステップＳＰ１１３に進む。

【０２５６】コンテンツサーバ６１は、ステップＳＰ１
２２において、ロボット１から送信された取得データに
基づいて、当該取得データをコンテンツデータとしてＩ
Ｄ番号を割り当てた後、ステップＳＰ１２３に進む。

【０２５７】このステップＳＰ１２３では、コンテンツ
サーバ６１は、データベースにおいて該当するユーザに
対応しかつ言葉遊びの種類に対応する記憶位置に、当該
ＩＤ番号を割り当てた出題内容等を登録する。この結
果、データベースには、該当するユーザにおける言葉遊
びの該当する種類において、第Ｎ（Ｎは自然数）の出題
内容ＩＤＮが追加して記述されることとなる。

【０２５８】そしてコンテンツサーバ６１は、ステップ
ＳＰ１２４に進んで、コンテンツデータの追加登録が終
了した旨の応答データをネットワーク６２を介してロボ
ット１に送信した後、ステップＳＰ１２５に進む。

【０２５９】ロボット１は、コンテンツサーバ６１から
送信された応答データに基づいて、コンテンツデータが
追加登録された旨を確認した後、当該コンテンツサーバ
６１に対して通信接続の切断要求を表す旨の要求データ
をネットワーク６２を介してコンテンツサーバ６１に送
信し、そのままステップＳＰ１１４に進んで当該コンテ
ンツ収集処理手順ＲＴ９を終了する。

【０２６０】コンテンツサーバ６１は、ステップＳＰ１
２５において、ロボット１から送信された要求データに
基づいて、当該ロボット１との間で確立されている通信
接続を切断した後、ステップＳＰ１２６に進んで当該コ
ンテンツデータ追加登録処理手順ＲＴ１０を終了する。

【０２６１】このようにしてコンテンツ収集処理手順Ｒ
Ｔ９においては、ロボット１は、ユーザから発話した新
しい出題内容等を、コンテンツサーバ６１内のデータベ
ースにそのユーザに応じたコンテンツデータとして追加
登録させることができる。

【０２６２】またコンテンツデータ追加登録処理手順Ｒ
Ｔ１０においては、ロボット１から得られた出題内容等
に基づいて、当該出題内容等をコンテンツデータとして
そのユーザに関する記述内容に追加して登録することに
より、当該ユーザのみならず他のユーザにとってもコン
テンツの種類が増大した分より一層面白さを増すことが
できる。

【０２６３】このことは新たな出題内容等を発話したユ
ーザにとっても、コンテンツサーバ６１にアクセスして
データベースに格納されているオプションデータを読み
出すことにより、自分が提案した出題内容等がどの程度
他のユーザに使用されているかなどを知ることができ、
出題内容等の登録そのものに楽しみを持たせることがで
きる。

【０２６４】ここで上述した対話モデルを用いて、実際
にロボット１がユーザの発話により出題内容等を受け取
ると、図３１に示すように、ロボット１のメモリ制御部
４０がこの言葉遊びの種類に対応する対話モデルに基づ
いて、ユーザとの対話のときに次のロボット１による発
話内容を順次決定していくようになされている。

【０２６５】まずロボット１が「面白い問題教えて」と
ユーザに向けて発話する。そしてロボット１はユーザか
らの応答を待ち（ノードＮＤ１０）、ユーザの発話が
「いいよ」であれば、「問題を言ってよ」と発話した後
（ノードＮＤ１１）、さらにユーザからの応答を待つ。

【０２６６】一方、ユーザの発話が「いやだ」であれ
ば、「う〜ん、残念」と発話した後（ノードＮＤ１
２）、かかる対話シーケンスを終了する。

【０２６７】やがてロボット１は、ユーザから問題とし
て例えば「落ち込んでいても２回食べると元気になる食
べ物は？」という発話を受け取ると、その音声認識結果
（問題の言葉）を繰り返し発話する（ノードＮＤ１
３）。

【０２６８】この発話を聞いたユーザが「そうだよ」と
発話した場合には、ロボット１は「答えは？」とその問
題の答えを要求する発話を行う一方（ノードＮＤ１
４）、ユーザが「ちがうよ」と発話した場合には、ロボ
ット１は「もう一回問題を言ってよ」と再度問題を要求
する発話を行う（ノードＮＤ１１）。

【０２６９】そしてユーザから答えである「海苔」とい
う発話を受け取ると、その音声認識結果（答えの言葉）
を繰り返し発話する（ノードＮＤ１５）。この発話を聞
いたユーザが「そうだよ」と発話した場合には、ロボッ
トは「理由は？」とその答えの理由を要求する発話を行
う一方（ノードＮＤ１６）、ユーザが「ちがうよ」と発
話した場合には、ロボットは「もう一回答えを言って
よ」と再度答えを要求する発話を行う（ノードＮＤ１
４）。

【０２７０】そしてユーザから理由である「２回でノリ
ノリだよ」という発話を受け取ると、その音声認識結果
（理由の言葉）を繰り返し発話する（ノードＮＤ１
７）。この発話を聞いたユーザが「そうだよ」と発話し
た場合には、ロボットは「じゃ、登録するね」と発話す
る一方（ノードＮＤ１８）、ユーザが「ちがうよ」と発
話した場合には、ロボットは「もう一回理由を言って
よ」と再度理由を要求する発話を行う（ノードＮＤ１
６）。

【０２７１】この後ロボット１はユーザから取得した問
題及びその答え並びにその答えの理由をネットワーク６
２を介してコンテンツサーバ６１内のデータベースにコ
ンテンツデータとして追加登録する。

【０２７２】このようにロボット１は、ユーザから新た
に取得した出題内容等をコンテンツデータとしてそのユ
ーザに関する記述内容に追加して登録することにより、
ユーザに対してより一層多くのコンテンツを提供するこ
とができる。

【０２７３】（５−４−２）ロボットを介さずに直接的
に出題内容等を修正させる場合また図６に示す対話制御システム６３では、上述のコン
テンツ収集処理手順ＲＴ９及びコンテンツデータ追加登
録処理手順ＲＴ１０のように、ユーザがロボット１を介
して新たな出題内容等をコンテンツサーバ６１内のデー
タベースに追加登録させた後に、ユーザが作成した出題
内容等のうち例えば問題の答えに対する理由が、ユーザ
の発話に関連する応答（すなわち暗に問題の解答の確
認）にならない場合や、当該出題内容等の問題が難しす
ぎて誰も答えられない場合がある。

【０２７４】これらの場合には、ユーザが自己のパーソ
ナルコンピュータ等の端末装置を用いてネットワーク６
２を介してコンテンツサーバ６１にアクセスし、データ
ベース内の対応するコンテンツデータの記述内容を修正
することができるようになされている。

【０２７５】具体的には、ユーザが登録した出題内容等
について、例えばその問題が「落ち込んでいても２回食
べると元気になるのは？」であり、その答え「海苔」に
対する理由が「２回食べると元気になるからだよ」となっ
ている場合には、答えである「海苔」を連想させることが
できない。

【０２７６】このためコンテンツサーバ６１は、ユーザ
から「理由がよくわからない」などのフィードバックを受
けると、ユーザが自己の端末装置を用いてデータベース
にアクセスして当該コンテンツデータに基づく出題内容
等のうちの理由を「２回でのりのりだよ」と書き換えるこ
とで、当該コンテンツデータを修正することができる。

【０２７７】なお、コンテンツデータの修正は、データ
ベースにアクセスできるユーザのみならず、データベー
スの管理者が修正しても良い。さらに部分的にコンテン
ツデータを更新するのみならず、コンテンツデータを全
て作成し直すようにしても良い。

【０２７８】（６）本実施の形態の動作及び効果以上の構成において、この対話制御システム６３では、
ロボット１とユーザとの間で言葉遊びによる対話をする
際、ユーザから言葉遊びの種類（なぞなぞ等）が指定さ
れたとき、ロボットは、当該ユーザについてのプロファ
イルデータを読み出して、ネットワーク６２を介してコ
ンテンツサーバ６１に送信する。

【０２７９】コンテンツサーバは、ロボット１から受信
したプロファイルデータに基づいて、データベースに格
納されている複数のコンテンツデータの中からユーザに
最適な出題内容等を含むコンテンツデータを選択した
後、当該コンテンツデータをロボット１に提供すること
ができる。

【０２８０】その際、ロボット１とユーザとの言葉遊び
の際に、ロボットが発話した出題内容についてユーザが
答えた後、ロボットがその答えの理由を一言述べるよう
にしたことにより、対話自体が知的に見えてより面白く
させることができるのみならず、ロボットがどう認識し
たのかをユーザに提示することとなり、ユーザが自己の
発話と同じである場合にはユーザに安心感を与えること
ができる一方、ユーザが自己の発話と異なる場合にもそ
の旨をユーザに認識させることができる。

【０２８１】このようにロボット１がユーザの発話内容
をいちいち確認しないため、ユーザとの会話の流れやリ
ズムを止めることがなく、あたかも人間同士が会話して
いるかのごとく自然な日常会話を実現することができ
る。

【０２８２】また対話制御システム６３では、ロボット
１は、ユーザに出題したコンテンツデータに基づく出題
内容について、その面白さの是非を当該ユーザに問いか
け、その結果をコンテンツサーバにフィードバックさせ
るようにしたことにより、当該コンテンツサーバではそ
の出題内容の人気の有無等について統計的な評価をとる
ことができる。

【０２８３】さらにコンテンツサーバは、その出題内容
についての統計的な評価に基づいて、コンテンツデータ
に付加されたオプションデータの記述内容を更新するこ
とにより、当該ユーザのみならず他のユーザにとっても
その出題内容の面白さや好み等を次回の際に反映させる
ことができる。

【０２８４】さらに対話制御システム６３では、ロボッ
ト１がユーザから新たに取得した出題内容等をコンテン
ツサーバに送信して、当該コンテンツサーバにおいてデ
ータベースに追加して登録するようにしたことにより、
ユーザに対してより一層多くのコンテンツを提供するこ
とができ、その分ユーザに飽きさせることなくロボット
との対話を広く普及させることができる。

【０２８５】以上の構成によれば、この対話制御システ
ム６３において、ロボット１とユーザとの間で言葉遊び
による対話をする際、ユーザから言葉遊びの種類（なぞ
なぞ等）が指定されたとき、ロボットは当該ユーザにつ
いてのプロファイルデータをコンテンツサーバ６１に送
信し、当該コンテンツサーバ６１がデータベースからユ
ーザに最適な出題内容等を含むコンテンツデータを選択
してロボット１に提供するようにしたことにより、ロボ
ットの会話に面白みを持たせることができ、かくしてエ
ンターテイメント性を格段的に向上させることができ
る。

【０２８６】（７）他の実施の形態なお上述のように本実施の形態においては、本発明を図
１〜図３のように構成された２足歩行型のロボット１に
適用するようにした場合について述べたが、本発明はこ
れに限らず、例えば４脚歩行型のロボットなど、この他
種々の形態のペットロボットに広く適用することができ
る。

【０２８７】また上述の実施の形態においては、ロボッ
ト１において、人間と対話するための機能を有し、当該
対話を通じて対象とするユーザの発話を認識する対話手
段として、胴体部ユニット２内のメイン制御部４０（対
話制御部８２）を適用するようにした場合について述べ
たが、本発明はこれに限らず、この他種々の構成からな
る対話手段に広く適用するようにしても良い。

【０２８８】さらに上述の実施の形態においては、ロボ
ット１において、ユーザの発話内容のうち、言葉遊びに
関するプロファイルデータ（履歴データ）を生成する生
成手段と、当該生成されたプロファイルデータ（履歴デ
ータ）を、言葉遊びを通じて得られるユーザの発言内容
に応じて更新する更新手段とを、メイン制御部４０から
構成すると共に、当該プロファイルデータ（履歴デー
タ）をメイン制御部４０内のメモリ４０Ａに格納してお
くようにした場合について述べたが、本発明はこれに限
らず、生成手段及び更新手段は一体又は別体にかかわら
ずこの他種々の構成のものに広く適用するようにしても
良い。

【０２８９】また言葉遊びとして、本実施の形態におい
ては、なぞなぞや山手線ゲームを適用したが、これ以外
にも、尻取り、しゃれ、語呂あわせ、アナグラム（言葉
の綴りの順番を変えて別の意味にする遊び）及び早口言
葉など、要するに言葉の発音・リズム・意味などを利用
した種々の遊びに広く適用することができる。

【０２９０】さらに上述の実施の形態においては、ロボ
ット１において、言葉遊びの開始の際には、履歴データ
をネットワークを介してコンテンツサーバ（情報処理装
置）６１に送信する通信手段として、胴体部ユニット２
内に装着した所定の無線通信規格に対応した無線ＬＡＮ
カード（図示せず）を適用するようにした場合について
述べたが、本発明はこれに限らず、その他の無線通信回
線網のみならず、一般公衆回線やＬＡＮ等の有線通信回
線網をも適用するようにしても良い。

【０２９１】さらに上述の実施の形態においては、コン
テンツサーバ（情報処理装置）６１において、複数の言
葉遊びの内容を表すコンテンツデータ（内容データ）を
記憶する記憶手段として、コンテンツサーバ６１内のハ
ードディスク装置６８に格納されたデータベースを適用
するようにした場合について述べたが、本発明はこれに
限らず、コンテンツデータ（内容データ）を、必要に応
じて複数のロボット１が共有できるようにデータベース
管理することができれば、種々の構成からなる記憶手段
に広く適用するようにしても良い。

【０２９２】さらに上述の実施の形態においては、コン
テンツサーバ（情報処理装置）６１において、ロボット
１からネットワーク６２を介して送信されたプロファイ
ルデータ（履歴データ）を検出する検出手段として、Ｃ
ＰＵ６５を適用するようにした場合について述べたが、
本発明はこれに限らず、この他種々の構成の検出手段を
適用するようにしても良い。

【０２９３】さらに上述の実施の形態においては、コン
テンツサーバ（情報処理装置）において、検出したプロ
ファイルデータ（履歴データ）に基づいて、データベー
ス（記憶手段）からコンテンツデータ（内容データ）を
選択的に読み出してネットワーク６２を介して元のロボ
ット１に送信する通信制御手段として、ＣＰＵ６５及び
ネットワークインターフェイス部６９を適用するように
した場合について述べたが、本発明はこれに限らず、こ
の他種々の構成の通信制御手段を適用するようにしても
良い。

【０２９４】さらに上述の実施の形態においては、ロボ
ット１では、ユーザに出力したコンテンツデータ（内容
データ）に基づく言葉遊びの内容に関する評価を当該ユ
ーザの発話から認識した後、プロファイルデータ（履歴
データ）を評価に応じて更新し、当該更新されたプロフ
ァイルデータ（履歴データ）をコンテンツサーバ（情報
処理装置）６１に送信する。そしてコンテンツサーバ
（情報処理装置）６１では、言葉遊びのコンテンツデー
タ（内容データ）に付随するオプションデータ（付随デ
ータ）を当該コンテンツデータ（内容データ）に関連付
けてデータベース（記憶手段）に記憶しておき、選択さ
れたコンテンツデータ（内容データ）に付随するオプシ
ョンデータ（付随データ）について、プロファイルデー
タ（履歴データ）に基づく評価に関連するデータ部分を
更新するようにした場合について述べたが、本発明はこ
れに限らず、要は、オプションデータ（付随データ）を
更新することで、コンテンツデータ（内容データ）を当
該ユーザのみならず他のユーザにとってもその出題内容
の面白さや好み等を次回の際に反映させることができれ
ば、付随データとして他のデータを用いても良く、その
更新方法も種々の方法を適用するようにしても良い。

【０２９５】さらに上述のように本実施の形態において
は、ロボットでは、ユーザに出力した新たな言葉遊びの
内容を当該ユーザの発話から認識した後、言葉遊びの内
容を表す新規内容データをコンテンツサーバ（情報処理
装置）６１に送信する。そしてコンテンツサーバ（情報
処理装置）６１では、対応するユーザについての内容デ
ータに追加して、新規内容データをデータベース（記憶
手段）に記憶するようにした場合について述べたが、本
発明はこれに限らず、要は、ユーザに対してより一層多
くのコンテンツを提供することによって、その分ユーザ
に飽きさせることなくロボット１との対話を広く普及さ
せることができれば、新規内容データの追加方法として
は他の方法を用いるようにしても良い。

【０２９６】

【発明の効果】上述のように本発明によれば、ロボット
及び情報処理装置がネットワークを介して接続された対
話制御システムにおいて、ロボットとユーザとの間で言
葉遊びによる対話をする際、ユーザの発話内容のうち言
葉遊びに関する履歴データを生成して情報処理装置に送
信し、当該情報処理装置が記憶手段から当該履歴データ
に基づいてユーザに最適な内容データを選択的に読み出
して元のロボットに提供するようにしたことにより、ユ
ーザとの間でロボットの会話に面白みやリズムを持たせ
ることができ、あたかも人間同士が会話しているかのご
とく自然な日常会話に近づけることができ、かくしてエ
ンターテイメント性を格段的に向上させ得る対話制御シ
ステムを実現できる。

【０２９７】また本発明によれば、ロボット及び情報処
理装置がネットワークを介して接続された対話制御方法
において、ロボットとユーザとの間で言葉遊びによる対
話をする際、ユーザの発話内容のうち言葉遊びに関する
履歴データを生成して情報処理装置に送信し、当該情報
処理装置が履歴データに基づいてユーザに最適な内容デ
ータを複数の内容データの中から選択的に読み出して元
のロボットに提供するようにしたことにより、ユーザと
の間でロボットの会話に面白みやリズムを持たせること
ができ、あたかも人間同士が会話しているかのごとく自
然な日常会話に近づけることができ、あたかも人間同士
が会話しているかのごとく自然な日常会話に近づけるこ
とができ、かくしてエンターテイメント性を格段的に向
上させ得る対話制御方法を実現できる。

【０２９８】さらに本発明によれば、情報処理装置とネ
ットワークを介して接続されたロボット装置において、
人間と対話するための機能を有し、当該対話を通じて対
象とするユーザの発話を認識する対話手段と、対話手段
によるユーザの発話内容のうち、言葉遊びに関する履歴
データを生成する生成手段と、生成手段により生成され
た履歴データを、言葉遊びを通じて得られるユーザの発
言内容に応じて更新する更新手段と、言葉遊びの開始の
際には、履歴データをネットワークを介して情報処理装
置に送信する通信手段とを設け、情報処理装置において
予め記憶された複数の言葉遊びの内容を表す内容データ
のうち、通信手段から送信された履歴データに基づいて
選択された内容データがネットワークを介して送信され
たとき、対話手段は、当該内容データに基づく言葉遊び
の内容を出力するようにしたことにより、ユーザとの間
でロボットの会話に面白みやリズムを持たせることがで
き、あたかも人間同士が会話しているかのごとく自然な
日常会話に近づけることができ、かくしてエンターテイ
メント性を格段的に向上させ得るロボット装置を実現で
きる。

【図面の簡単な説明】

【図１】本発明を適用したロボットの外観構成を示す斜
視図である。

【図２】本発明を適用したロボットの外観構成を示す斜
視図である。

【図３】本発明を適用したロボットの外観構成を示す斜
視図である。

【図４】ロボットの内部構成を示すブロック図である。

【図５】ロボットの内部構成を示すブロック図である。

【図６】本実施の形態による対話制御システムの構成を
示す略線図である。

【図７】図６に示すコンテンツサーバの構成を示すブロ
ック図である。

【図８】メイン制御部４０の処理の説明に供するブロッ
ク図である。

【図９】メモリにおけるＳＩＤと名前との関連付けの説
明に供する概念図である。

【図１０】名前学習処理手順を示すフローチャートであ
る。

【図１１】名前学習処理手順を示すフローチャートであ
る。

【図１２】名前学習処理時における対話例を示す略線図
である。

【図１３】名前学習処理時における対話例を示す略線図
である。

【図１４】ＳＩＤと名前との新規登録の説明に供する概
念図である。

【図１５】名前学習時における対話例を示す略線図であ
る。

【図１６】名前学習処理時における対話例を示す略線図
である。

【図１７】音声認識部の構成を示すブロック図である。

【図１８】単語辞書の説明に供する概念図である。

【図１９】文法規則の説明に供する概念図である。

【図２０】特徴ベクトルバッファの記憶内容の説明に供
する概念図である。

【図２１】スコアシートの説明に供する概念図である。

【図２２】音声認識処理手順を示すフローチャートであ
る。

【図２３】未登録語処理手順を示すフローチャートであ
る。

【図２４】クラスタ分割処理手順を示すフローチャート
である。

【図２５】シミュレーション結果を示す概念図である。

【図２６】コンテンツデータ取得処理手順及びコンテン
ツデータ提供処理手順を示すフローチャートである。

【図２７】プロファイルデータの説明に供する概念図で
ある。

【図２８】コンテンツデータの説明に供する概念図であ
る。

【図２９】言葉遊びによる対話シーケンスの説明に供す
る概念図である。

【図３０】人気指標集計処理手順及びオプションデータ
更新処理手順を示すフローチャートである。

【図３１】コンテンツ収集処理手順及びコンテンツデー
タ追加登録処理手順を示すフローチャートである。

【図３２】言葉遊びによる対話シーケンスの説明に供す
る概念図である。

【符号の説明】

１……ロボット、４０……メイン制御部、５１……マイ
クロホン、５４……スピーカ、６１……コンテンツサー
バ、６２……ネットワーク、６３……対話制御システ
ム、６５……ＣＰＵ、６８……ハードディスク装置、６
９……ネットワークインターフェース部、８０……音声
認識部、８１……話者認識部、８２……対話制御部、８
３……音声合成部、８４……メモリ、Ｓ１Ｂ、Ｓ３……
音声信号、ＲＴ５……コンテンツデータ取得処理手順、
ＲＴ６……コンテンツデータ提供処理手順、ＲＴ７……
人気指標集計処理手順、ＲＴ８……オプションデータ更
新処理手順、ＲＴ９……コンテンツ収集処理手順、ＲＴ
１０……コンテンツデータ追加登録処理手順。

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩテーマコート゛(参考）Ｇ１０Ｌ 15/00 Ｇ１０Ｌ 3/00 ５５１Ａ 15/06 Ｒ 15/20 ５３１Ｐ 17/00 ５２１Ｊ５４５Ａ (72)発明者山田敬一東京都品川区北品川６丁目７番35号ソニー株式会社内Ｆターム(参考） 2C150 BA11 CA01 CA02 DA04 DA05 DA24 DA26 DA27 DA28 DF03 DF04 DF06 DF33 ED10 ED42 ED47 ED52 EF03 EF07 EF09 EF13 EF16 EF17 EF22 EF23 EF28 EF29 EF33 EF36 3C007 AS36 CS08 JS03 KS39 MT14 WA03 WA13 WB19 WC01 WC03 WC07 5D015 KK02 KK04 LL02 5D045 AB11

Claims

【特許請求の範囲】

【請求項１】ロボット及び情報処理装置がネットワーク
を介して接続された対話制御システムにおいて、上記ロボットに設けられ、人間と対話するための機能を有し、当該対話を通じて対
象とするユーザの発話を認識する対話手段と、上記対話手段による上記ユーザの発話内容のうち、言葉
遊びに関する履歴データを生成する生成手段と、上記生成手段により生成された上記履歴データを、上記
言葉遊びを通じて得られる上記ユーザの発言内容に応じ
て更新する更新手段と、上記言葉遊びの開始の際には、上記履歴データを上記ネ
ットワークを介して上記情報処理装置に送信する通信手
段とを具え、上記情報処理装置に設けられ、複数の上記言葉遊びの内容を表す内容データを記憶する
記憶手段と、上記通信手段を介して送信された上記履歴データを検出
する検出手段と、上記検出手段によって検出された上記履歴データに基づ
いて、上記記憶手段から上記内容データを選択的に読み
出して上記ネットワークを介して元の上記ロボットに送
信する通信制御手段とを具え、上記ロボットの上記対話
手段は、上記情報処理装置の上記通信制御手段から送信
された上記内容データに基づく上記言葉遊びの内容を出
力するを具えることを特徴とする対話制御システム。
【請求項２】上記ロボットでは、上記対話手段は、上記ユーザに出力した上記内容データ
に基づく上記言葉遊びの内容に関する評価を当該ユーザ
の発話から認識し、上記更新手段は上記履歴データを上記評価に応じて更新
し、上記通信手段は、上記更新手段によって更新された上記
履歴データを上記情報処理装置に送信し、上記情報処理装置では、上記記憶手段は、上記言葉遊びの内容データに付随する
付随データを当該内容データに関連付けて記憶してお
き、上記通信制御手段は、上記選択された上記内容データに
付随する上記付随データについて、上記通信手段から送
信された上記履歴データに基づく評価に関連するデータ
部分を更新することを特徴とする請求項１に記載の対話
制御システム。
【請求項３】上記ロボットでは、上記対話手段は、上記ユーザに出力した新たな言葉遊び
の内容を当該ユーザの発話から認識し、上記通信手段は、上記言葉遊びの内容を表す新規内容デ
ータを上記情報処理装置に送信し、上記情報処理装置では、上記記憶手段は、対応する上記ユーザについての上記内
容データに追加して、上記通信手段から送信された上記
新規内容データを記憶することを特徴とする請求項１に
記載の対話制御システム。
【請求項４】上記記憶手段は、複数の上記ロボットが共
有できるようになされたデータベースであることを特徴
とする請求項１に記載の対話制御システム。
【請求項５】ロボット及び情報処理装置がネットワーク
を介して接続された対話制御方法において、上記ロボットでは、人間との対話を通じて対象とするユ
ーザの発話を認識し、当該ユーザの発話内容のうち、言
葉遊びに関する履歴データを生成し、当該生成された履
歴データを、上記言葉遊びを通じて得られる上記ユーザ
の発言内容に応じて更新しながら、上記言葉遊びの開始
の際には上記ネットワークを介して上記情報処理装置に
送信する第１のステップと、上記情報処理装置では、予め記憶された複数の上記言葉
遊びの内容を表す内容データのうち、上記ロボットから
送信された上記履歴データに基づいて選択した上記内容
データを読み出して、上記ネットワークを介して元の上
記ロボットに送信する第２のステップと、上記ロボットでは、上記情報処理装置から送信された上
記内容データに基づく上記言葉遊びの内容を出力する第
３のステップとを具えることを特徴とする対話制御方
法。
【請求項６】上記第１のステップでは、上記ユーザに出力した上記内容データに基づく上記言葉
遊びの内容に関する評価を当該ユーザの発話から認識し
た後、当該評価に応じて上記履歴データを更新し、当該
更新された履歴データを上記情報処理装置に送信し、上記第２のステップでは、上記言葉遊びの内容データに付随する付随データを当該
内容データに関連付けて記憶しておき、上記選択された
上記内容データに付随する上記付随データについて、上
記送信された上記履歴データに基づく評価に関連するデ
ータ部分を更新することを特徴とする請求項５に記載の
対話制御方法。
【請求項７】上記第１のステップでは、上記ユーザに出力した新たな言葉遊びの内容を当該ユー
ザの発話から認識した後、上記言葉遊びの内容を表す新
規内容データを上記情報処理装置に送信し、上記第２の
ステップでは、対応する上記ユーザについての上記内容データに追加し
て、上記通信手段から送信された上記新規内容データを
記憶することを特徴とする請求項５に記載の対話制御方
法。
【請求項８】上記第２のステップでは、予め記憶された
複数の上記言葉遊びの内容を表す内容データを、複数の
上記ロボットが共有できるようにデータベース管理する
ことを特徴とする請求項５に記載の対話制御方法。
【請求項９】情報処理装置とネットワークを介して接続
されたロボット装置において、人間と対話するための機能を有し、当該対話を通じて対
象とするユーザの発話を認識する対話手段と、上記対話手段による上記ユーザの発話内容のうち、言葉
遊びに関する履歴データを生成する生成手段と、上記生成手段により生成された上記履歴データを、上記
言葉遊びを通じて得られる上記ユーザの発言内容に応じ
て更新する更新手段と、上記言葉遊びの開始の際には、上記履歴データを上記ネ
ットワークを介して上記情報処理装置に送信する通信手
段とを具え、上記情報処理装置において予め記憶された複数の上記言
葉遊びの内容を表す内容データのうち、上記通信手段か
ら送信された上記履歴データに基づいて選択された上記
内容データが上記ネットワークを介して送信されたと
き、上記対話手段は、当該内容データに基づく上記言葉
遊びの内容を出力するを具えることを特徴とするロボッ
ト装置。
【請求項１０】上記対話手段は、上記ユーザに出力した
上記内容データに基づく上記言葉遊びの内容に関する評
価を当該ユーザの発話から認識し、上記更新手段は上記履歴データを上記評価に応じて更新
し、上記通信手段は、上記更新手段によって更新された上記
履歴データを上記情報処理装置に送信し、上記情報処理装置では、予め記憶された上記言葉遊びの
内容データに付随しかつ当該内容データに関連付けられ
た付随データのうち、上記選択された上記内容データに
付随する上記付随データについて、上記通信手段から送
信された上記履歴データに基づく評価に関連するデータ
部分が更新されることを特徴とする請求項９に記載のロ
ボット装置。
【請求項１１】上記対話手段は、上記ユーザに出力した
新たな言葉遊びの内容を当該ユーザの発話から認識し、上記通信手段は、上記言葉遊びの内容を表す新規内容デ
ータを上記情報処理装置に送信し、上記情報処理装置では、対応する上記ユーザについての
上記内容データに追加して、上記通信手段から送信され
た上記新規内容データが記憶されることを特徴とする請
求項９に記載のロボット装置。