JP4475628B2

JP4475628B2 - 会話制御装置、会話制御方法並びにこれらのプログラム

Info

Publication number: JP4475628B2
Application number: JP2003393282A
Authority: JP
Inventors: 洋介林
Original assignee: Universal Entertainment Corp
Current assignee: Universal Entertainment Corp
Priority date: 2003-11-25
Filing date: 2003-11-25
Publication date: 2010-06-09
Anticipated expiration: 2023-11-25
Also published as: JP2005157602A

Description

本発明は、会話制御装置、会話制御方法並びにこれらのプログラムに関し、より詳しくは自動的に新しい言葉などを学習することにより会話データベースの充実を図ることが可能な、会話制御装置、会話制御方法並びにこれらのプログラムに関する。

近年、コンピュータを中心とした情報処理の手段として開発され進展してきたディジタル信号処理、高集積度ＬＳＩ製造技術、ＤＶＤなどディスクメディアの微細精密加工製造技術の高度化を背景にして、機械が自然な音声を話すようになったり、人の発する言葉を理解して適切な回答を返すことができる会話制御技術が提供されるようになってきている。

このような会話制御技術においては、会話の履歴、話題の推移などが加味された人間同士の会話と同様な自然な対話を実現可能な会話制御装置が提案されている（特許文献１）。
特開２００２−３５８３０４号公報

一般に、上記のような会話制御装置は、ユーザの発話とこの発話に対応する回答文を予め記憶・登録する会話データベース手段を用意しておき、ユーザの発話に応じて、会話データベース手段からこれに対応する回答文を検索してユーザに返すことにより、会話制御装置に発話に意味認識を行わせ、この意味認識に基づいてユーザと会話制御装置間の会話を成立させるようになっている。従って、ユーザと会話制御装置間の会話の内容は、会話データベース手段に記憶・登録されている内容に依存しており、会話データベース手段に記憶・登録されている内容が多岐多様な単語、言葉であればあるほど、ユーザと会話制御装置間の会話の内容も変化に富んだ充実したものとなる。

現状の会話制御装置の構築においては、会話制御装置の意味認識を完成させるに当たり、言葉、単語等の意味を個別にオペレータ（人間）による入力作業により会話データベース手段に登録することにより行っている。このような会話データベース手段に登録作業は、どのような言葉、単語を登録するのか、その言葉、単語についてどのような内容を登録するかを準備しておく必要があり、会話データベース手段を充実したものとするためには登録すべき言葉、単語数が数千から数万となるため、登録の準備に必要な作業及びオペレータによる入力作業は膨大な量となり、結果として会話制御装置の製品化の障害となっていた。

本発明の目的は、自動的に新しい言葉などを学習することにより会話データベースの充実を図ることが可能なユーザと会話制御可能な会話制御装置並びに会話制御方法を提供することにある。

上記課題を解決するための手段として、本発明は以下のような特徴を有する。

本発明の第１の態様は、ユーザからの発話に応答する回答を出力することが可能な会話制御装置として提案される。

この会話制御装置は、複数の話題特定情報を記憶する会話データベース手段（会話データベース）と、従前の会話及び従前の回答により定まる談話履歴を記憶し、この談話履歴により定まる話題特定情報と発話情報とを照合して回答文を選択する会話制御手段（会話制御部）と、利用者の発話に含まれる語が、会話データベース手段に記憶された話題特定情報の内いずれにも相当しない場合、その語を新たな話題特定情報として会話データベース手段に記憶させるとともに、利用者にその語の意味を質問する文を出力し、利用者から返された返答をその話題特定情報に対応する意味情報文として会話データベース手段に記憶させる新単語登録手段（新単語登録部）とを有することを特徴としている。

この会話制御装置によれば、利用者と会話を行うことにより新たな語を会話データベース手段に追加登録することが可能となり、オペレータによる新語登録処理などの労力を要することなく、より記憶内容の豊富な会話制御装置を作成することが可能となる。

上記の会話制御装置において、新単語登録手段は、ある話題特定情報について記憶された意味情報文を用いて、その話題特定情報の意味情報文の検証を行うための検証質問文を生成し、利用者がこの検証質問文に対して肯定する返答を返した場合には、その意味情報文の信頼度を示す数値を増加させ、次回検証質問文を生成する場合には、信頼度を示す数値が最も大きい意味情報文を用いて、その意味情報文の検証を行うための検証質問文を生成するようにしてもよい。
この会話制御装置によれば、自動的に新たに登録する語の意味内容を検証し、最も適切な意味をその語の意味として登録することが可能となる。

また、上記の会話制御装置において、新単語登録手段は、ある話題特定情報について記憶された意味情報文を用いてその意味情報文の検証を行うための検証質問文を生成し、利用者がこの検証質問文に対して否定する返答を返した場合には、その話題特定情報の意味を問いただすための問い合わせ質問文を生成し、利用者がこの問い合わせ質問文に対する返答を返した場合に、その返答をその話題特定情報の新たな意味情報文として会話データベース手段に記憶させるようにしてもよい。

かかる会話制御装置によれば、利用者から提供される意味を複数登録しておき、のちにこの複数登録されたものの中から、最適のものをその語の意味として登録することが可能となる。

本発明の第２の態様は、ユーザからの発話に応答する回答を出力することが可能な会話制御方法として提案される。

この会話制御方法は、複数の話題特定情報を予め記憶させるステップと、利用者の発話に含まれる語が話題特定情報として未だ登録されていない場合、その語について、利用者に意味を問い合わせる問い合わせ質問文を出力するステップと、問い合わせ質問に対する利用者の回答を取得するステップと、この語を新たな話題特定情報として記憶させるとともに、回答をその話題特定情報の意味情報文として記憶させるステップとを有することを特徴としている。
この会話制御方法によれば、利用者と会話を行うことにより新たな語を追加登録することが可能となり、オペレータによる新語登録処理などの労力を要することなく、より記憶内容の豊富な会話制御方法を実現することが可能となる。

上記の会話制御方法は、ある話題特定情報について記憶された意味情報文を用いて、その話題特定情報の意味情報文の検証を行うための検証質問文を生成し、出力するステップと、利用者がこの検証質問文に対して肯定する返答を返した場合には、その意味情報文の信頼度を示す数値を増加させるステップと、話題特定情報について次に検証質問文を生成する場合には、信頼度を示す数値（肯定回数情報）が最も大きい意味情報文を用いて、その意味情報文の検証を行うための検証質問文を生成するステップとをさらに有するようにしてもよい。
この会話制御方法によれば、自動的に新たに登録する語の意味内容を検証し、最も適切な意味をその語の意味として登録することが可能となる。

また、上記の会話制御方法は、ある話題特定情報について記憶された意味情報文を用いてその意味情報文の検証を行うための検証質問文を生成し、出力するステップと、利用者がこの検証質問文に対して否定する返答を返した場合には、その話題特定情報の意味を問いただすための問い合わせ質問文を生成し、出力するステップと、利用者がこの問い合わせ質問文に対する返答を返した場合に、その返答をその話題特定情報の新たな意味情報文として記憶させるステップとをさらに有していてもよい。

本発明によれば、自動的に新しい言葉などを学習することにより会話データベースの充実を図ることが可能なユーザと会話制御可能な会話制御装置並びに会話制御方法及びこれらのプログラムを提供することが可能となる。

以下に図面を参照しながら本発明の第１の実施の形態を説明する。
本実施の形態は、話者の発話内容及び／又は発話内容に対する回答文を出力可能な会話制御装置に関する。

［１．会話制御装置の構成例］
［１．１．全体構成］
図１は、本実施の形態に係る学習機能を有する会話制御装置１の概略構成図である。

会話制御装置１は、たとえばコンピュータ、ワークステーションなどの情報処理装置であって、演算処理装置（ＣＰＵ）、主メモリ（ＲＡＭ）、読出し専用メモリ（ＲＯＭ）、入出力装置（Ｉ／Ｏ）、ハードディスク装置等の外部記憶装置を具備している装置で構成されている。前記ＲＯＭ、もしくは外部記憶装置などに情報処理装置を会話制御装置１として機能させるためのプログラム、もしくは会話制御方法をコンピュータに実行させるためのプログラムが記憶されており、該プログラムを主メモリ上に載せ、ＣＰＵがこれを実行することにより会話制御装置１が実現される。また、上記プログラムは必ずしも当該装置内の記憶装置に記憶されていなくともよく、磁気ディスク、光ディスク、光磁気ディスク、ＣＤ（Compact Disc）、ＤＶＤ（Digital Video Disc）などのコンピュータ読み取り可能なプログラム記録媒体や、外部の装置（例えば、ＡＳＰ（アプリケーション・サービス・プロバイダ）のサーバなど）から提供され、これを主メモリに乗せる構成であっても良い。

図１に示すように、会話制御装置１は、入力部１００と、音声認識部２００と、会話制御部３００と、文解析部４００と、会話データベース５００と、出力部６００と、音声認識辞書記憶部７００と、新単語登録部８００を備えている。

［入力部］
入力部１００は、利用者から入力された入力情報を取得するものである。この入力部１００は、例えば、マイクロホンが挙げられる。入力部１００は、取得した発話内容に対応する音声を音声信号として音声認識部２００に出力する。

［音声認識部］
音声認識部２００は、入力部１００で取得した発話内容に基づいて、発話内容に対応する文字列を特定するものである。具体的には、入力部１００から音声信号が入力された音声認識部２００は、入力された音声信号に基づいて、この音声信号を、音声認識辞書記憶部７００に格納されている辞書および会話データベース５００と照合して、音声信号から推測される音声認識結果を出力する。なお、図３に示す構成例では、音声認識部２００は、会話制御部３００に会話データベース５００の記憶内容の取得を要求し、会話制御部３００が要求に応じて取得した会話データベース５００の記憶内容を受け取るようになっているが、音声認識部２００が直接会話データベース５００の記憶内容を取得して音声信号との比較を行う構成であってもかまわない。

［音声認識部の構成例］
図２に、音声認識部２００の構成例を示す機能ブロック図を示す。音声認識部２００は、特徴抽出部２００Ａと、バッファメモリ（ＢＭ）２００Ｂと、単語照合部２００Ｃと、バッファメモリ（ＢＭ）２００Ｄと、候補決定部２００Ｅと、単語仮説絞込部２００Ｆを有している。単語照合部２００Ｃ及び単語仮説絞込部２００Ｆは音声認識辞書記憶部７００に接続されており、候補決定部２００Ｅは会話制御部３００に接続されている。

単語照合部２００Ｃに接続された音声認識辞書記憶部７００は、音素隠れマルコフモデル（以下、隠れマルコフモデルをＨＭＭという。）を記憶している。音素ＨＭＭは、各状態を含んで表され、各状態はそれぞれ以下の情報を有する。（ａ）状態番号、（ｂ）受理可能なコンテキストクラス、（ｃ）先行状態、及び後続状態のリスト、（ｄ）出力確率密度分布のパラメータ、及び（ｅ）自己遷移確率及び後続状態への遷移確率から構成されている。なお、本実施形態において用いる音素ＨＭＭは、各分布がどの話者に由来するかを特定する必要があるため、所定の話者混合ＨＭＭを変換して生成する。ここで、出力確率密度関数は３４次元の対角共分散行列をもつ混合ガウス分布である。また、単語照合部２００Ｃに接続された音声認識辞書記憶部７００は単語辞書を記憶している。単語辞書は、音素ＨＭＭの各単語毎にシンボルで表した読みを示すシンボル列を格納する。

話者の発声音声はマイクロホンなどに入力されて音声信号に変換された後、特徴抽出部２００Ａに入力される。特徴抽出部２００Ａは、入力された音声信号をＡ／Ｄ変換した後、特徴パラメータを抽出し、これを出力する。特徴パラメータを抽出し、これを出力する方法としては様々なものが考えられるが、例えば一例としては、ＬＰＣ分析を実行し、対数パワー、１６次ケプストラム係数、Δ対数パワー及び１６次Δケプストラム係数を含む３４次元の特徴パラメータを抽出する方法などが挙げられる。抽出された特徴パラメータの時系列はバッファメモリ（ＢＭ）２００Ｂを介して単語照合部２００Ｃに入力される。

単語照合部２００Ｃは、ワン−パス・ビタビ復号化法を用いて、バッファメモリ２００Ｂを介して入力される特徴パラメータのデータに基づいて、音声認識辞書記憶部７００に記憶された音素ＨＭＭと単語辞書とを用いて単語仮説を検出し、尤度を計算して出力する。ここで、単語照合部２００Ｃは、各時刻の各ＨＭＭの状態毎に、単語内の尤度と発声開始からの尤度を計算する。尤度は、単語の識別番号、単語の開始時刻、先行単語の違い毎に個別にもつ。また、計算処理量の削減のために、音素ＨＭＭ及び単語辞書とに基づいて計算される総尤度のうちの低い尤度のグリッド仮説を削減するようにしてもよい。単語照合部２００Ｃは、検出した単語仮説とその尤度の情報を発声開始時刻からの時間情報（具体的には、例えばフレーム番号）とともにバッファメモリ２００Ｄを介して候補決定部２００Ｅ及び単語仮説絞込部２００Ｆに出力する。

候補決定部２００Ｅは、会話制御部３００を参照して、検出した単語仮説と所定の談話空間内の話題特定情報とを比較し、検出した単語仮説の内、所定の談話空間内の話題特定情報と一致するものがあるか否かを判定し、一致するものがある場合は、その一致する単語仮説を認識結果として出力し、一方一致するものがない場合は、単語仮説絞込部２００Ｆに単語仮説の絞込を行うよう要求する。

候補決定部２００Ｅの動作例を説明する。今、単語照合部２００Ｃが複数の単語仮説「カンタク」「カタク」「カントク」およびその尤度（認識率）を出力し、所定の談話空間は「映画」に関するものでありその話題特定情報には「カントク（監督）」は含まれているが、「カンタク（干拓）」及び「カタク（仮託）」は含まれていないとする。また「カンタク」「カタク」「カントク」の尤度（認識率）は「カンタク」が最も高く「カントク」は最も低く、「カタク」は両者の中間であったとする。

上記の状況において、候補決定部２００Ｅは、検出した単語仮説と所定の談話空間内の話題特定情報とを比較して、単語仮説「カントク」が、所定の談話空間内の話題特定情報と一致するものであると判定し、単語仮説「カントク」を認識結果として出力し、会話制御部に渡す。このように処理することにより、現在扱われている話題「映画」に関連した「カントク（監督）」が、より上位の尤度（認識率）を有する単語仮説「カンタク」「カタク」に優先されて選択され、その結果会話の文脈に即した音声認識結果を出力することが可能となる。

一方、一致するものがない場合は、候補決定部２００Ｅからの単語仮説の絞込を行う要求に応じて単語仮説絞込部２００Ｆが認識結果を出力するよう動作する。単語仮説絞込部２００Ｆは、単語照合部２００Ｃからバッファメモリ２００Ｄを介して出力される複数個の単語仮説に基づいて、音声認識辞書記憶部７００に記憶された統計的言語モデルを参照して、終了時刻が等しく開始時刻が異なる同一の単語の単語仮説に対して、当該単語の先頭音素環境毎に、発声開始時刻から当該単語の終了時刻に至る計算された総尤度のうちの最も高い尤度を有する１つの単語仮説で代表させるように単語仮説の絞り込みを行った後、絞り込み後のすべての単語仮説の単語列のうち、最大の総尤度を有する仮説の単語列を認識結果として出力する。本実施形態においては、好ましくは、処理すべき当該単語の先頭音素環境とは、当該単語より先行する単語仮説の最終音素と、当該単語の単語仮説の最初の２つの音素とを含む３つの音素並びをいう。

単語仮説絞込部２００Ｆによる単語絞込処理の例を図３を参照しながら説明する。図３は、単語仮説絞込部２００Ｆの処理の一例を示すタイミングチャートである。
例えば（ｉ−１）番目の単語Ｗi-１の次に、音素列ａ１，ａ２，…，ａnからなるｉ番目の単語Ｗiがくるときに、単語Ｗi-１の単語仮説として６つの仮説Ｗａ，Ｗｂ，Ｗｃ，Ｗｄ，Ｗｅ，Ｗｆが存在しているとする。ここで、前者３つの単語仮説Ｗａ，Ｗｂ，Ｗｃの最終音素は／ｘ／であるとし、後者３つの単語仮説Ｗｄ，Ｗｅ，Ｗｆの最終音素は／ｙ／であるとする。終了時刻ｔeにおいて単語仮説Ｗａ，Ｗｂ，Ｗｃを前提とする３つの仮説と、単語仮説Ｗｄ，Ｗｅ，Ｗｆを前提とする１の仮説が残っているものとすると、先頭音素環境が等しい前者３つ仮説のうち、総尤度が最も高い仮説一つを残し、その他を削除する。

なお、単語仮説Ｗｄ，Ｗｅ，Ｗｆを前提とする仮説は先頭音素環境が他の３つの仮説と違うため、すなわち、先行する単語仮説の最終音素がｘではなくｙであるため、この単語仮説Ｗｄ，Ｗｅ，Ｗｆを前提とする仮説は削除しない。すなわち、先行する単語仮説の最終音素毎に１つのみ仮説を残す。

以上の実施形態においては、当該単語の先頭音素環境とは、当該単語より先行する単語仮説の最終音素と、当該単語の単語仮説の最初の２つの音素とを含む３つの音素並びとして定義されているが、本発明はこれに限らず、先行する単語仮説の最終音素と、最終音素と連続する先行する単語仮説の少なくとも１つの音素とを含む先行単語仮説の音素列と、当該単語の単語仮説の最初の音素を含む音素列とを含む音素並びとしてもよい。
以上の実施の形態において、特徴抽出部２００Ａと、単語照合部２００Ｃと、候補決定部２００Ｅと、単語仮説絞込部２００Ｆとは、例えば、デジタル電子計算機などのコンピュータで構成され、バッファメモリ２００Ｂ，２００Ｄと、音声認識辞書記憶部７００とは、例えばハードディスク、メモリなどの記憶装置で構成される。

以上の実施の形態においては、単語照合部２００Ｃ、単語仮説絞込部２００Ｆとを用いて音声認識を行っているが、本発明はこれに限られず、例えば、音素ＨＭＭを参照する音素照合部と、例えばＯｎｅ
ＰａｓｓＤＰアルゴリズムを用いて統計的言語モデルを参照して単語の音声認識を行う音声認識部とで構成してもよい。
また、本実施の形態では、音声認識部２００は会話制御装置１の一部分として説明するが、音声認識部２００、音声認識辞書記憶部７００、及び会話データベース５００より構成される、独立した音声認識装置とすることも可能である。

［音声認識部の動作例］
つぎに図４を参照しながら音声認識部２００の動作について説明する。図４は、音声認識部２００の動作例を示すフロー図である。入力部１００より音声信号を受け取ると、音声認識部２００は入力された音声の特徴分析を行い、特徴パラメータを生成する（ステップＳ４０１）。次に、この特徴パラメータと音声認識辞書記憶部７００に記憶された音素ＨＭＭ及び言語モデルとを比較して、所定個数の単語仮説及びその尤度を取得する（ステップＳ４０２）。次に、音声認識部２００は、取得した所定個数の単語仮説と検出した単語仮説と所定の談話空間内の話題特定情報とを比較し、検出した単語仮説の内、所定の談話空間内の話題特定情報と一致するものがあるか否かを判定する（ステップＳ４０３、Ｓ４０４）。一致するものがある場合は、音声認識部２００はその一致する単語仮説を認識結果として出力する（ステップＳ４０５）。一方、一致するものがない場合は、音声認識部２００は取得した単語仮説の尤度に従って、最大尤度を有する単語仮説を認識結果として出力する（ステップＳ４０６）。

［音声認識辞書記憶部］
再び、図１に戻って、会話制御装置１の構成例の説明を続ける。
音声認識辞書記憶部７００は、標準的な音声信号に対応する文字列を格納するものである。この照合をした音声認識部２００は、その音声信号に対応する単語仮説に対応する文字列を特定し、その特定した文字列を文字列信号として会話制御部３００に出力する。

［文解析部］
次に、図５を参照しながら文解析部４００の構成例について説明する。図５は、会話制御装置１の部分拡大ブロック図であって、会話制御部３００及び文解析部４００の具体的構成例を示すブロック図である。なお、図５においては、会話制御部３００、文解析部４００、および会話データベース５００のみ図示しており、その他の構成要素の表示は省略されている。

文解析部４００は、入力部１００又は音声認識部２００で特定された文字列を解析するものである。この文解析部４００は、本実施の形態では、図５に示すように、文字列特定部４１０と、形態素抽出部４２０と、形態素データベース４３０と、入力種類判定部４４０と、発話種類データベース４５０とを有している。文字列特定部４１０は、入力部１００及び音声認識部２００で特定された一連の文字列を一文節毎に区切るものである。この一文節とは、文法の意味を崩さない程度に文字列をできるだけ細かく区切った一区切り文を意味する。具体的に、文字列特定部４１０は、一連の文字列の中に、ある一定以上の時間間隔があるときは、その部分で文字列を区切る。文字列特定部４１０は、その区切った各文字列を形態素抽出部４２０及び入力種類判定部４４０に出力する。尚、以下で説明する「文字列」は、一文節毎の文字列を意味するものとする。

［形態素抽出部］
形態素抽出部４２０は、文字列特定部４１０で区切られた一文節の文字列に基づいて、その一文節の文字列の中から、文字列の最小単位を構成する各形態素を第一形態素情報として抽出するものである。ここで、形態素とは、本実施の形態では、文字列に現された語構成の最小単位を意味するものとする。この語構成の最小単位としては、例えば、名詞、形容詞、動詞などの品詞が挙げられる。
各形態素は、図６に示すように、本実施の形態ではm１,m２,m３…,と表現することができる。図６は、文字列とこの文字列から抽出される形態素との関係を示す図である。図６に示すように、文字列特定部４１０から文字列が入力された形態素抽出部４２０は、入力された文字列と、形態素データベース４３０に予め格納されている形態素群(この形態素群は、それぞれの品詞分類に属する各形態素についてその形態素の見出し語・読み・品詞・活用形などを記述した形態素辞書として用意されている)とを照合する。その照合をした形態素抽出部４２０は、その文字列の中から、予め記憶された形態素群のいずれかと一致する各形態素(m１,m２、…)を抽出する。この抽出された各形態素を除いた要素(n１,n２,n３…)は、例えば助動詞等が挙げられる。

この形態素抽出部４２０は、抽出した各形態素を第一形態素情報として管理部３１０に出力する。なお、第一形態素情報は構造化されている必要はない。ここで「構造化」とは、文字列の中に含まれる形態素を品詞等に基づいて分類し配列することをいい、たとえば発話文である文字列を、「主語＋目的語＋述語」などの様に、所定の順番で形態素を配列してなるデータに変換することを言う。もちろん、構造化した第一形態素情報を用いたとしても、それが本実施の形態を実現を妨げることはない。

［入力種類判定部］
入力種類判定部４４０は、文字列特定部４１０で特定された文字列に基づいて、発話内容の種類(発話種類)を判定するものである。この発話種類は、発話内容の種類を特定する情報であって、本実施の形態では、例えば図７に示す「発話文のタイプ」を意味する。図７は、「発話文のタイプ」と、その発話文のタイプを表す二文字のアルファベット、及びその発話文のタイプに該当する発話文の例を示す図である。

ここで、「発話文のタイプ」は、本実施の形態では、図７に示すように、陳述文(D ; Declaration)、時間文(T ; Time)、場所文(L ; Location)、反発文(N ; Negation)などから構成される。この各タイプから構成される文は、肯定文又は質問文で構成される。「陳述文」とは、利用者の意見又は考えを示す文を意味するものである。この陳述文は本実施の形態では、図７に示すように、例えば"私は佐藤が好きです"などの文が挙げられる。「場所文」とは、場所的な概念を伴う文を意味するものである。「時間文」とは、時間的な概念を伴う文を意味するものである。「反発文」とは、陳述文を否定するときの文を意味する。「発話文のタイプ」についての例文は図７に示す通りである。

入力種類判定部４４０が「発話文のタイプ」を判定するには、入力種類判定部４４０は、本実施の形態では、図８に示すように、陳述文であることを判定するための定義表現辞書、反発文であることを判定するための反発表現辞書等を用いる。具体的に、文字列特定部４１０から文字列が入力された入力種類判定部４４０は、入力された文字列に基づいて、その文字列と発話種類データベース４５０に格納されている各辞書とを照合する。その照合をした入力種類判定部４４０は、その文字列の中から、各辞書に関係する要素を抽出する。

この入力種類判定部４４０は、抽出した要素に基づいて、「発話文のタイプ」を判定する。例えば、入力種類判定部４４０は、ある事象について陳述している要素が文字列の中に含まれる場合には、その要素が含まれている文字列を陳述文として判定する。入力種類判定部４４０は、判定した「発話文のタイプ」を回答取得部３５０に出力する。

［会話データベース］
次に、会話データベース５００が記憶するデータのデータ構成例について図９を参照しながら説明する。図９は、会話データベース５００が記憶するデータのデータ構成の一例を示す概念図である。

前記会話データベース５００は、図９に示すように、話題を特定するための話題特定情報８１０を予め複数記憶する。又、それぞれの話題特定情報８１０は、他の話題特定情報と関連づけられていてもよく、例えば、図９に示す例では、話題特定情報Ｃが特定されると、この話題特定情報Ｃに関連づけられている他の話題特定情報Ａ、Ｂ，Ｄが定まるように記憶されている。
具体的には、話題特定情報８１０は、本実施の形態では、利用者から入力されると予想される入力内容又は利用者への回答文に関連性のある「キーワード」を意味する。

話題特定情報８１０には、一又は複数の話題タイトル８２０が対応付けられて記憶されている。話題タイトル８２０は、一つの文字、複数の文字列又はこれらの組み合わせからなる形態素により構成されている。各話題タイトル８２０には、利用者への回答文８３０が対応付けられて記憶されている。また、回答文８３０の種類を示す複数の回答種類は、回答文８３０に対応付けられている。

次に、ある話題特定情報と他の話題特定情報との関連づけについて説明する。図１０は、ある話題特定情報８１０Ａと他の話題特定情報８１０Ｂ、８１０Ｃ_１〜８１０Ｃ_４、８１０Ｄ_１〜８１０Ｄ_３…との関連付けを示す図である。なお、以下の説明において「関連づけされて記憶される」とは、ある情報Ｘを読み取るとその情報Ｘに関連づけられている情報Ｙを読み取りできることをいい、例えば、情報Ｘのデータの中に情報Ｙを読み出すための情報（例えば、情報Ｙの格納先アドレスを示すポインタ、情報Ｙの格納先物理メモリアドレス、論理アドレスなど）が格納されている状態を、「情報Ｙが情報Ｘに『関連づけされて記憶され』ている」というものとする。

図１０に示す例では、話題特定情報は他の話題特定情報との間で上位概念、下位概念、同義語、対義語（本図の例では省略）が関連づけされて記憶させることができる。本図に示す例では、話題特定情報８１０Ａ(＝「映画」)に対する上位概念の話題特定情報として話題特定情報８１０Ｂ(＝「娯楽」)が話題特定情報８１０Ａに関連づけされて記憶されており、たとえば話題特定情報(「映画」)に対して上の階層に記憶される。

また、話題特定情報８１０Ａ(＝「映画」)に対する下位概念の話題特定情報８１０Ｃ_１（＝「監督」）、話題特定情報８１０Ｃ_２（＝「主演」）、話題特定情報８１０Ｃ_３（＝「配給会社」）、話題特定情報８１０Ｃ_４（＝「上映時間」）、および話題特定情報８１０Ｄ_１（＝「七人の侍」）、話題特定情報８１０Ｄ_２（＝「乱」）、話題特定情報８１０Ｄ_３（＝「用心棒」）、…、が話題特定情報８１０Ａに関連づけされて記憶されている。

又、話題特定情報８１０Ａには、同義語９００が関連づけられている。この例では、話題特定情報８１０Ａであるキーワード「映画」の同義語として「作品」、「内容」、「シネマ」が記憶されている様子を示している。このような同意語を定めることにより、発話にはキーワード「映画」は含まれていないが「作品」、「内容」、「シネマ」が発話文等に含まれている場合に、話題特定情報８１０Ａが発話文等に含まれているものとして取り扱い、またその逆の取り扱いをすることを可能とする。

本実施の形態にかかる会話制御装置１は、会話データベース５００の記憶内容を参照することにより、ある話題特定情報を特定するとその話題特定情報に関連づけられて記憶されている他の話題特定情報及びその話題特定情報の話題タイトル、回答文などを高速で検索・抽出することが可能となる。

次に、話題タイトル（「第二形態素情報」ともいう）のデータ構成例について、図１１を参照しながら説明する。図１１は、話題タイトルのデータ構成例を示す図である。

話題特定情報８１０Ｄ_１、８１０Ｄ_２、８１０Ｄ_３、…はそれぞれ複数の異なる話題タイトル８２０_１、８２０_２、…、話題タイトル８２０_３、８２０_４、…、話題タイトル８２０_５、８２０_６、…、…を有している。本実施の形態では、図１１に示すように、それぞれの話題タイトル８２０は、第一特定情報１００１と、第二特定情報及１００２と、第三特定情報１００３によって構成される情報である。
ここで、第一特定情報１００１は、本実施の形態では、話題を構成する主要な形態素を意味するものである。第一特定情報の例としては、例えば文を構成する主語が挙げられる。また、第二特定情報１００２は、本実施の形態では、第一特定情報１００１と密接な関連性を有する形態素を意味するものである。この第二特定情報１００２は、例えば目的語が挙げられる。更に、第三特定情報１００３は、本実施の形態では、ある対象についての動きを示す形態素、又は名詞等を修飾する形態素を意味するものである。この第三特定情報１００３は、例えば動詞、副詞又は形容詞が挙げられる。なお、第一特定情報１００１、第二特定情報１００２、第三特定情報１００３それぞれの意味は上述の内容に限定される必要はなく、別の意味を第一特定情報１００１、第二特定情報１００２、第三特定情報１００３に与えても、これらから文の内容を把握可能な限り、本実施の形態は成立する。

例えば、主語が「七人の侍」、形容詞が「面白い」である場合には、図１１に示すように、話題タイトル（第二形態素情報）８２０_２は、第一特定情報１００１である形態素「七人の侍」と、第三特定情報１００３である形態素「面白い」とから構成されることになる。なお、この話題タイトル８２０_２には第二特定情報である形態素は含まれておらず、該当する形態素がないことを示すための記号「＊」が第二特定情報として格納されている。

なお、この話題タイトル８２０_２（七人の侍；＊；面白い）は、「七人の侍は面白い」の意味を有する。この話題タイトル８２０を構成する括弧内は、以下では左から第一特定情報１００１、第二特定情報１００２、第三特定情報１００３の順番となっている。また、話題タイトル８２０のうち、第一から第三特定情報に含まれる形態素がない場合には、その部分については、「＊」を示すことにする。

なお、上記話題タイトル８２０を構成する特定情報は、上記のような第一から第三特定情報のように三つに限定されるものではなく、話題タイトル８２０は更に他の特定情報（第四特定情報、又はそれ以上）を有する構成としてもよい。

次に、回答文８３０について図１２を参照しながら説明する。本実施の形態では、回答文８３０は、図１２に示すように、利用者から発話された発話文のタイプに対応した回答をするために、陳述(D ; Declaration)、時間(T ; Time)、場所(L ; Location)、否定(N ; Negation)などのタイプ(回答種類)に分類され、タイプを示す情報を附されている。また、回答文８３０について肯定文は「Ａ」とし、質問文は「Ｑ」とする。

次に、話題特定情報、およびこの話題特定情報に対応付けされた話題タイトル，回答文の関係について説明する。図１３は、ある話題特定情報「佐藤」に対応付けされた話題タイトル，回答文の具体例を示す図である。
例えば、話題タイトル（８２０）１−１が(佐藤；＊；好き){これは、「佐藤が好きです」に含まれる形態素を抽出したもの}である場合には、その話題タイトル（８２０）１−１に対応する回答文（８３０）１−１は、(DA；陳述肯定文「私も佐藤が好きです」)、(TA；時間肯定文「私は打席に立ったときの佐藤が好きです」)など各回答種類に対応した回答文の集合として準備されている。後述する回答取得部３５０は、その話題タイトル８２０に対応付けられた回答文８３０、すなわち各回答種類に対応した回答文の集合からいずれか一を取得する。

［会話制御部］
ここで図５に戻り、会話制御部３００の構成例を説明する。
会話制御部３００は、会話制御装置１内の各構成要素（音声認識部２００，文解析部４００、会話データベース５００，出力部６００，新単語登録部８００）間のデータの受け渡しを制御するとともに、発話に応答する回答文の決定、出力を行う機能を有する。

前記会話制御部３００は、本実施の形態では、図５に示すように、管理部３１０と、話題特定情報検索部３２０と、省略文補完部３３０と、話題検索部３４０と、回答取得部３５０とを有している。

［管理部］
管理部３１０は、会話制御部３００の全体の動作を管理・制御する機能を有する。また、管理部３１０は談話履歴を記憶し、且つ必要に応じて更新する機能を有する。管理部３１０は話題特定情報検索部３２０と、省略文補完部３３０と、話題検索部３４０と、回答取得部３５０からの要求に応じて、記憶している談話履歴の全部又は一部をこれら各部に渡す機能を有する。

「談話履歴」とは、ユーザと会話制御装置１間の会話の話題や主題を特定する情報であって、後述する談話履歴は「着目話題特定情報」「着目話題タイトル」「利用者入力文話題特定情報」「回答文話題特定情報」の少なくともいずれか一つを含む情報である。また、談話履歴に含まれる「着目話題特定情報」「着目話題タイトル」「回答文話題特定情報」は直前の会話によって定められたものに限定されず、過去の所定期間の間に着目話題特定情報」「着目話題タイトル」「回答文話題特定情報」となったもの、若しくはそれらの累積的記録であってもよい。

また、管理部３１０は音声認識部２００からの出力を受け取ると、これを文解析部４００に渡し、文解析部４００が返す第一形態素情報を新単語登録部８００に渡す。新単語登録部８００が新単語登録処理を行う場合は、この第一形態素情報に対する回答出力処理等は、新単語登録部８００により行われる。一方、新単語登録部８００が新単語登録処理を行わない場合は、新単語登録部８００が管理部３１０に会話制御処理を行うよう通知し、管理部３１０はこの通知に応答して、第一形態素情報を話題特定情報検索部３２０にこの第一形態素情報を渡すように動作する。

以下、会話制御部３００を構成する管理部３１０以外の各部について説明する。

［話題特定情報検索部］
話題特定情報検索部３２０は、第一形態素情報と談話範囲に属する各話題特定情報とを照合し、各話題特定情報の中から、第一形態素情報を構成する形態素と一致する話題特定情報を検索するものである。具体的に、話題特定情報検索部３２０は、管理部３１０を経由して形態素抽出部４２０から入力された第一形態素情報が「佐藤」及び「好き」の二つの形態素で構成される場合には、入力された第一形態素情報と話題特定情報群とを照合する。

この照合をした話題特定情報検索部３２０は、着目話題タイトル８２０focus（前回までに検索された話題タイトル）に第一形態素情報を構成する形態素（例えば「佐藤」）が含まれているときは、その着目話題タイトル８２０focusを回答取得部３５０に出力する。一方、着目話題タイトル８２０focusに第一形態素情報を構成する形態素が含まれていないときは、話題特定情報検索部３２０は、第一形態素情報に基づいて利用者入力文話題特定情報を決定し、入力された第一形態素情報及び利用者入力文話題特定情報を省略文補完部３３０に出力する。なお、「利用者入力文話題特定情報」は、第一形態素情報に含まれる形態素の内、利用者が話題としている内容に該当する形態素に相当する話題特定情報、若しくは第一形態素情報に含まれる形態素の内、利用者が話題としている内容に該当する可能性がある形態素に相当する話題特定情報をいう。

［省略文補完部］
省略文補完部３３０は、前記第一形態素情報を、前回までに検索された話題特定情報８１０（以下、「着目話題特定情報」）及び前回の回答文に含まれる話題特定情報８１０（以下、「回答文話題特定情報」という）を利用して、補完することにより複数種類の補完された第一形態素情報を生成する。例えば発話文が「好きだ」という文であった場合、省略文補完部３３０は、着目話題特定情報「佐藤」を、第一形態素情報「好き」に含めて、補完された第一形態素情報「佐藤、好き」を生成する。

すなわち、第一形態素情報を「Ｗ」、着目話題特定情報や回答文話題特定情報の集合を「Ｄ」とすると、省略文補完部３３０は、第一形態素情報「Ｗ」に集合「Ｄ」の要素を含めて、補完された第一形態素情報を生成する。

これにより、第一形態素情報を用いて構成される文が、省略文であって日本語として明解でない場合などにおいて、省略文補完部３３０は、集合「Ｄ」を用いて、その集合「Ｄ」の要素（例えば、”佐藤”）を第一形態素情報「Ｗ」に含めることができる。この結果、省略文補完部３３０は、第一形態素情報「好き」を補完された第一形態素情報「佐藤、好き」に置換する。なお、補完された第一形態素情報「佐藤、好き」は、「佐藤が好きだ」という発話内容に対応する。

すなわち、省略文補完部３３０は、利用者の発話内容が省略文である場合などであっても、集合「Ｄ」を用いて省略文を補完することができる。この結果、省略文補完部３３０は、第一形態素情報から構成される文が省略文であっても、その文が適正な日本語となるようにすることができる。

また、省略文補完部３３０が、前記集合「Ｄ」に基づいて、補完後の第一形態素情報に一致する話題タイトル８２０を検索する。補完後の第一形態素情報に一致する話題タイトル８２０を発見した場合は、省略文補完部３３０はこの話題タイトル８２０を回答取得部３５０に出力する。回答取得部３５０は、省略文補完部３３０で検索された適切な話題タイトル８２０に基づいて、利用者の発話内容に最も適した回答文８３０を出力することができる。

尚、省略文補完部３３０は、集合「Ｄ」の要素を第一形態素情報に含めるだけに限定されるものではない。この省略文補完部３３０は、着目話題タイトルに基づいて、その話題タイトルを構成する第一特定情報、第二特定情報又は第三特定情報のいずれかに含まれる形態素を、抽出された第一形態素情報に含めても良い。

［話題検索部］
話題検索部３４０は、省略文補完部３３０で話題タイトル８２０が決まらなかったとき、第一形態素情報と、利用者入力文話題特定情報に対応する各話題タイトル８２０とを照合し、各話題タイトル８２０の中から、第一形態素情報に最も適する話題タイトル８２０を検索するものである。
具体的に、省略文補完部３３０から検索命令信号が入力された話題検索部３４０は、入力された検索命令信号に含まれる利用者入力文話題特定情報及び第一形態素情報に基づいて、その利用者入力文話題特定情報に対応付けられた各話題タイトル８２０の中から、その第一形態素情報に最も適した話題タイトル８２０を検索する。話題検索部３４０は、その検索した話題タイトル８２０を検索結果信号として回答取得部３５０に出力する。

図１３は、ある話題特定情報８１０（＝「佐藤」）に対応付けされた話題タイトル８２０，回答文８３０の具体例を示す図である。図１３に示すように、例えば、話題検索部３４０は、入力された第一形態素情報「佐藤、好き」に話題特定情報８１０（＝「佐藤」）が含まれるので、その話題特定情報８１０（＝「佐藤」）を特定し、次に、その話題特定情報８１０（＝「佐藤」）に対応付けられた各話題タイトル（８２０）１-１,１-２,…と入力された第一形態素情報「佐藤、好き」とを照合する。

話題検索部３４０は、その照合結果に基づいて、各話題タイトル（８２０）１-１〜１-２の中から、入力された第一形態素情報「佐藤、好き」と一致する話題タイトル（８２０）１-１(佐藤；＊；好き)を特定する。話題検索部３４０は、検索した話題タイトル（８２０）１-１(佐藤；＊；好き)を検索結果信号として回答取得部３５０に出力する。

［回答取得部］
回答取得部３５０は、話題検索部３４０で検索された話題タイトル８２０に基づいて、その話題タイトル８２０に対応付けられた回答文８３０および感情フラグ８４０を取得する。また、回答取得部３５０は、話題検索部３４０で検索された話題タイトル８２０に基づいて、その話題タイトル８２０に対応付けられた各回答種類と、入力種類判定部４４０で判定された発話種類とを照合する。その照合をした回答取得部３５０は、各回答種類の中から、判定された発話種類と一致する回答種類を検索する。

図１３に示すように、例えば、回答取得部３５０は、話題検索部３４０で検索された話題タイトル８２０が話題タイトル１-１（佐藤；＊；好き）である場合には、その話題タイトル１-１に対応付けられている回答文１-１（DA,TAなどの拡開投手類語とに用意された回答文の集合）の中から、入力種類判定部４４０で判定された「発話文のタイプ」（例えばDA）と一致する回答種類（DA）に対応する回答文を特定する。この回答種類(DA)に対応する回答文を特定した回答取得部３５０は、特定した回答種類（DA）に対応付けされた回答文「私も佐藤が好きです。」を取得する。
ここで、上記"DA"、"TA"等のうち、"A"は、肯定形式を意味する。従って、発話種類及び回答種類に"A"が含まれているときは、ある事柄について肯定することを示している。また、発話種類及び回答種類には、"DQ"、"TQ"等の種類を含めることもできる。この"DQ"、"TQ"等のうち"Q"は、ある事柄についての質問を意味する。

回答種類が上記質問形式(Q)からなるときは、この回答種類に対応付けられる回答文は、肯定形式(A)で構成される。この肯定形式(A)で作成された回答文としては、質問事項に対して回答する文等が挙げられる。例えば、発話文が「あなたはスロットマシンを操作したことがありますか?」である場合には、この発話文についての発話種類は、質問形式(Q)となる。この質問形式(Q)に対応付けられる回答文は、例えば「私はスロットマシンを操作したことがあります」(肯定形式(A))が挙げられる。

一方、発話種類が肯定形式(A)からなるときは、この回答種類に対応付けられる回答文は、質問形式(Q)で構成される。この質問形式(Q)で作成された回答文としては、発話内容に対して聞き返す質問文、又は特定の事柄を聞き出す質問文等が挙げられる。例えば、発話文が「私はスロットマシンで遊ぶのが趣味です」である場合には、この発話文についての発話種類は、肯定形式(A)となる。この肯定形式(A)に対応付けられる回答文は、例えば"パチンコで遊ぶのは趣味ではないのですか?"(特定の事柄を聞き出す質問文(Q))が挙げられる。

回答取得部３５０は、取得した回答文８３０を回答文信号として管理部３１０に出力する。回答取得部３５０から回答文信号が入力された管理部３１０は、入力された回答文信号を出力部６００に出力する。

出力部６００は、回答取得部３５０で取得された回答文を出力するものである。この出力部６００は、例えば、スピーカ、ディスプレイなどが挙げられる。具体的に、管理部３１０から回答文が入力された出力部６００は、入力された回答文に基づいて、音声をもってその回答文、例えば、「私も佐藤が好きです」を出力する。

［新単語登録部］
次に、新単語登録部８００について、図１，図１４を参照しながら説明する。図１４は、新単語登録部８００の構成例を示す機能ブロック図である。
図１に示すように、新単語登録部８００は、会話制御部３００、会話データベース５００とデータ交換可能に接続されているとともに、出力部６００に出力可能に接続されている。

図１４に示すように、新単語登録部８００は、登録確認部１４０１と、この登録確認部１４０１に接続された意味問い合わせ部１４０２及び意味検証部１４０３と、意味問い合わせ部１４０２に接続された登録処理部１４０４とを有している。登録確認部１４０１，意味検証部１４０３，登録処理部１４０４は会話データベース５００に接続されており、意味問い合わせ部１４０２，意味検証部１４０３は出力部６００に接続されている。

［登録確認部］
登録確認部１４０１は、会話制御部３００から渡された第一形態素情報を受け取り、この第一形態素情報に含まれる形態素が会話データベース５００に話題特定情報８１０として登録されているか否か、及びその形態素が話題特定情報８１０として登録されている場合にその話題特定情報８１０の意味情報８４０（その形態素の定義、又は定義に相当する説明、解釈などをいう）が確定しているか否かを調べる。会話データベース５００を調べた結果、その形態素が会話データベース５００に話題特定情報８１０として未だ登録されていない場合は、登録確認部１４０１は意味問い合わせ部１４０２に意味問い合わせ処理を行うよう要求する。一方、その形態素が会話データベース５００に話題特定情報８１０として登録されてはいるが、その意味情報が確定していない場合は、登録確認部１４０１は意味検証部１４０３にその話題特定情報（形態素）８１０の意味検証処理を行うよう要求する。

なお、ここで第一形態素情報に含まれる形態素であって、新単語登録部８００の処理対象となる形態素は、第一特定情報１００１に限定されてもよいし、第一から第三までのすべての特定情報１００１〜１００３を処理対象としてもよい。

［意味問い合わせ部、登録処理部］
意味問い合わせ部１４０２は、登録確認部１４０１から意味問い合わせ処理を行うよう要求されると、その形態素（話題特定情報）について、話者に意味を問い合わせる問い合わせ質問文を出力する。例えば、その形態素が「佐藤」であれば、意味問い合わせ部１４０２はその形態素「佐藤」と予め用意してある問い合わせ質問文テンプレートを用いて「佐藤って何ですか？」という問い合わせ質問文を生成する。生成された問い合わせ質問文は出力部６００に渡され、出力部６００により話者に提示される。

話者がこの問い合わせ質問文に対する回答を会話制御装置１に返すと、この回答は入力部１００，音声認識部２００、会話制御部３００、文解析部４００を介して新単語登録部８００に渡される。登録確認部１４０１はこの回答を意味問い合わせ部１４０２にそのまま渡す。意味問い合わせ部１４０２は、この回答を登録確認部１４０１を介して受け取り、回答が前述の問い合わせ質問文に対する回答であるか否かを判定する。例えば「知らないな」「わからない」など回答でないものと判断した場合は、意味問い合わせ部１４０２は別の問い合わせ質問文を生成して、出力する。一方、それが回答であると判定した場合は、その話題特定情報（形態素）及び回答を登録処理部１４０４に渡す。登録処理部１４０４はその話題特定情報（形態素）及び回答を会話データベース５００に新たな話題特定情報８１０及びその意味情報８４０として登録する。なお、この時点では意味情報８４０は確定した意味情報８４０ではなく、意味検証部１４０３の意味検証処理を受ける必要のある意味情報（未確定の意味情報）である。

［意味検証部］
意味検証部１４０３は、登録確認部１４０１から意味検証処理を行うよう要求されると、会話データベース５００からその話題特定情報の意味情報８４０を取り出し、この意味情報の正否・適否を話者に問いただす検証質問文を生成、出力する。出力された検証質問文は出力部６００に渡され、話者（ユーザ）に提示される。例えば、話題特定情報８１０が「佐藤」、その未確定の意味情報８４０が「ねばり強いバッティングで人気のプロ野球選手」として、会話データベース５００に登録されている場合、意味検証部１４０３は「佐藤は、ねばり強いバッティングで人気のプロ野球選手ですよね？」という検証質問文を生成し、出力するように動作する。なお、その話題特定情報８１０について複数の未確定の意味情報８４０が存在している場合は、所定の条件を満たす一の意味情報８４０を選択して、検証質問文の生成を行う。「所定の条件」は例えば後述の肯定回数情報が最大であること、などである。

話者はこの検証質問文に対する回答を会話制御装置１に返すと、この回答は入力部１００，音声認識部２００、会話制御部３００、文解析部４００を介して新単語登録部８００に渡される。登録確認部１４０１はこの回答を意味検証部１４０３にそのまま渡す。意味検証部１４０３は、この回答を登録確認部１４０１を介して受け取り、回答が前述の検証質問文に対する肯定か否かを判定する。例えば回答として受け取った話者の発話が「そうだよ」「うん」「ＹＥＳ」などであれば肯定と判定して、前述の意味情報の肯定回数情報を増加するよう会話データベース５００を更新する。一方、肯定でないと判定した場合は、その意味情報の肯定回数を増加させないか、或いは減少させるよう会話データベース５００を更新する。

［２．会話制御装置の動作（会話制御方法の実行）］
上記構成を有する会話制御装置１が動作することにより会話制御方法が実行されることとなる。図１５は、本実施の形態に係る会話制御装置１の動作により実行される会話制御方法の手順を示すフロー図である。
先ず、入力部１００が、利用者からの発話内容を取得するステップを行う（ステップＳ１５０１）。具体的には、入力部１００は、利用者の発話内容を構成する音声を取得する。入力部１００は、取得した音声を音声信号として音声認識部２００に出力する。なお、入力部１００は、利用者からの音声ではなく、利用者から入力された文字列(例えば、テキスト形式で入力された文字データ)を取得してもよい。

次いで、音声認識部２００が、入力部１００で取得した発話内容に基づいて、発話内容に対応する文字列を特定するステップを行う（ステップＳ１５０２）。具体的には、入力部１００から音声信号が入力された音声認識部２００は、入力された音声信号に基づいて、その音声信号に対応する単語仮説（候補）を特定する。音声認識部２００は、特定した単語仮説（候補）に対応付けられた文字列を取得し、取得した文字列を文字列信号として会話制御部３００に出力する。

そして、文字列特定部４１０が、音声認識部２００で特定された一連の文字列を一文毎に区切るステップを行う(ステップＳ１５０３)。具体的には、管理部３１０から文字列信号（あるいは形態素信号）が入力された文字列特定部４１０は、その入力された一連の文字列の中に、ある一定以上の時間間隔があるときは、その部分で文字列を区切る。文字列特定部４１０は、その区切った各文字列を形態素抽出部４２０及び入力種類判定部４４０に出力する。なお、文字列特定部４１０は、入力された文字列がキーボードから入力された文字列である場合には、句読点又はスペース等のある部分で文字列を区切るのが好ましい。

その後、形態素抽出部４２０が、文字列特定部４１０で特定された文字列に基づいて、文字列の最小単位を構成する各形態素を第一形態素情報として抽出するステップを行う(ステップＳ１５０４)。具体的に、文字列特定部４１０から文字列が入力された形態素抽出部４２０は、入力された文字列と、形態素データベース４３０に予め格納されている形態素群とを照合する。なお、その形態素群は、本実施の形態では、それぞれの品詞分類に属する各形態素について、その形態素の見出し語・読み・品詞・活用形などを記述した形態素辞書として準備されている。

この照合をした形態素抽出部４２０は、入力された文字列の中から、予め記憶された形態素群に含まれる各形態素と一致する各形態素(m１,m２、…)を抽出する。形態素抽出部４２０は、抽出した各形態素を第一形態素情報として管理部３１０に出力する。管理部３１０は、第一形態素情報を新単語登録部８００に渡す。

新単語登録部８００は、第一形態素情報に含まれる形態素が話題特定情報８１０として登録済みであり、且つその意味情報８４０が確定しているかを判定する（ステップＳ１５０５）。

形態素が話題特定情報８１０として登録されていないか、又は形態素が話題特定情報８１０として登録されているがその意味情報８４０が確定してしない場合は、新単語登録部８００は新単語登録処理を実行する（ステップＳ１５０６）。図１６に、新単語登録処理の処理例を示す。

まず、新単語登録部８００は、第一形態素情報の全部又は一部を入力として受け付ける（ステップＳ１６００）。
ステップ１５０６における判定の結果、この第一形態素情報に含まれる形態素が会話データベース５００に話題特定情報８１０として未だ登録されていない場合（ステップＳ１６０１、ＮＯ）は、新単語登録部８００は意味問い合わせ処理を行う（ステップＳ１６０２）。すなわち、新単語登録部８００はその形態素（話題特定情報）について、話者に意味を問い合わせる問い合わせ質問文を出力する。生成された問い合わせ質問文は出力部６００に渡され、出力部６００により話者に提示される。

話者がこの問い合わせ質問文に対する回答を会話制御装置１に返すと、この回答は入力部１００，音声認識部２００、会話制御部３００、文解析部４００を介して新単語登録部８００に渡され、返答受付処理（ステップＳ１６０３）が行われる。

新単語登録部８００は、返答受付処理（ステップＳ１６０３）において取得した回答が前述の問い合わせ質問文に対する回答であるか否かを判定し、回答でないものと判断した場合（ステップＳ１６０４、ＮＯ）は、新単語登録部８００は別の問い合わせ質問文を生成して、出力し、（ステップＳ１６０２）、さらに返答受付を行う（ステップＳ１６０３）。一方、それが回答であると判定した場合（ステップＳ１６０４、ＹＥＳ）は、その話題特定情報（形態素）及び回答を会話データベース５００に新たな話題特定情報８１０及びその意味情報８４０として登録する（ステップＳ１６０５）。この後図１５に示すフローに戻り、ステップＳ１５０１において受け付けた発話についての会話制御処理を終了する。

一方、ステップＳ１６０１においてその形態素が会話データベース５００に話題特定情報８１０として登録されてはいるが、その意味情報が確定していない場合（ステップＳ１６０１、ＹＥＳ）は、新単語登録部８００は、その話題特定情報（形態素）８１０の意味検証処理を行う。すなわち、新単語登録部８００は会話データベース５００の記憶内容を参照して、話題特定情報（形態素）８１０の意味情報を読み取り、最もＹＥＳと回答された回数が多い意味情報文、すなわち肯定回数情報が最大である意味情報文を検証質問文として取得する（ステップＳ１６０６）。図１７は、ある話題特定情報８１０であって、意味情報８４０が未確定の状態である話題特定情報８１０のデータ構成を示している。この例では、意味情報は複数の意味情報文１７０１，１７０２，１７０３、…が登録されている。意味情報文１７０１，１７０２，１７０３、…にはそれぞれ、ＹＥＳと回答された回数を示す肯定回数情報「１０」、「７」、「３」、…が記憶されている。この例では、ステップＳ１６０６で選択される意味情報文は、意味情報文１７０１「ねばり強いバッティングで人気のプロ野球選手」が選択され、検証質問文の生成に用いられる。

図１６に戻り新単語登録処理の説明を続ける。ステップＳ１６０６で出された検証質問文に対して話者が回答を会話制御装置１に返すと、この回答は入力部１００，音声認識部２００、会話制御部３００、文解析部４００を介して新単語登録部８００に渡され、返答受付処理（ステップＳ１６０７）が行われる。

新単語登録部８００はこの回答が検証質問文の内容を肯定しているか否かを判定し（ステップＳ１６０８）、肯定していると判定する場合（ステップＳ１６０８、ＹＥＳ）は、新単語登録部８００は、ステップＳ１６０６において選択された意味情報文の肯定回数情報をインクリメントするよう、会話データベース５００の内容を更新する（ステップＳ１６０９）。例えば、意味情報文１７０１について肯定された場合、その肯定回数情報「１０」は「１１」に更新されることとなる。ステップＳ１６０９の実行後、図１５に示すフローに戻り、ステップＳ１５０１において受け付けた発話についての会話制御処理を終了する。

一方、ステップＳ１６０８において、肯定していないと判定した場合（ステップＳ１６０８、ＮＯ）は、新単語登録部８００は、その話題特定情報８１０についての別の意味情報文を取得するよう、ステップＳ１６０２からステップＳ１６０５の処理を行う。ここで新たに取得された意味情報文は、意味情報８４０に追加されて登録される。ステップＳ１６０５の処理実行後、図１５に示すフローに戻り、ステップＳ１５０１において受け付けた発話についての会話制御処理を終了する。
以上で新単語登録処理（ステップ１５０７）の説明を終了する。

続いて、図１５に戻り、会話制御処理の残りの部分について説明する。
ステップＳ１５０６において、第一形態素情報に含まれる形態素が話題特定情報８１０として登録済みであり、且つその意味情報８４０が確定していると判定される場合（ステップＳ１５０６、ＹＥＳ）は、新単語登録部８００は会話制御部３００の管理部３００に、会話制御処理を続行するよう要求する。この要求に応じて管理部３１０は、文解釈部４００に発話文のタイプの判定を行うよう要求するとともに、第一形態素情報を話題特定情報検索部３２０に渡す。
発話文のタイプの判定を行うよう要求されると、文解釈部４００の入力種類判定部４４０が、文字列特定部４１０で特定された一文を構成する各形態素に基づいて、「発話文のタイプ」を判定するステップを行う（ステップＳ１５０７）。具体的には、文字列特定部４１０から文字列が入力された入力種類判定部４４０は、入力された文字列に基づいて、その文字列と発話種類データベース４５０に格納されている各辞書とを照合し、その文字列の中から、各辞書に関係する要素を抽出する。この要素を抽出した入力種類判定部４４０は、抽出した要素に基づいて、その要素がどの「発話文のタイプ」に属するのかを判定する。入力種類判定部４４０は、判定した「発話文のタイプ」（発話種類）を回答取得部３５０に出力する。

そして、話題特定情報検索部３２０が、形態素抽出部４２０で抽出された第一形態素情報と着目話題タイトル８２０focusとを比較するステップを行う(ステップＳ１５０８)。
第一形態素情報を構成する形態素と着目話題タイトル８２０focusとが一致する場合、話題特定情報検索部３２０は、その話題タイトル８２０を回答取得部３５０に出力する。一方、話題特定情報検索部３２０は、第一形態素情報を構成する形態素と話題タイトル８２０とが一致しなかった場合には、入力された第一形態素情報及び利用者入力文話題特定情報を検索命令信号として省略文補完部３３０に出力する。

その後、省略文補完部３３０が、話題特定情報検索部３２０から入力された第一形態素情報に基づいて、着目話題特定情報及び回答文話題特定情報を、入力された第一形態素情報に含め、省略文を保管するステップを行う(ステップＳ１５０９)。具体的には、第一形態素情報を「Ｗ」、着目話題特定情報及び回答文話題特定情報の集合を「Ｄ」とすると、省略文補完部３３０は、第一形態素情報「Ｗ」に話題特定情報「Ｄ」の要素を含めて、補完された第一形態素情報を生成し、この補完された第一形態素情報と集合「Ｄ」に関連づけされたすべての話題タイトル８２０とを照合し、補完された第一形態素情報と一致する話題タイトル８２０があるか検索する。補完された第一形態素情報と一致する話題タイトル８２０がある場合は、省略文補完部３３０は、その話題タイトル８２０を回答取得部３５０に出力する。一方、補完された第一形態素情報と一致する話題タイトル８２０を発見しなかった場合は、省略文補完部３３０は、第一形態素情報と利用者入力文話題特定情報とを話題検索部３４０に渡す。

次いで、話題検索部３４０は、第一形態素情報と、利用者入力文話題特定情報とを照合し、各話題タイトル８２０の中から、第一形態素情報に適した話題タイトル８２０を検索するステップを行う(ステップＳ１５１０)。具体的には、省略文補完部３３０から検索命令信号が入力された話題検索部３４０は、入力された検索命令信号に含まれる利用者入力文話題特定情報及び第一形態素情報に基づいて、その利用者入力文話題特定情報に対応付けられた各話題タイトル８２０の中から、その第一形態素情報に適した話題タイトル８２０を検索する。話題検索部３４０は、その検索の結果得られた話題タイトル８２０を検索結果信号として回答取得部３５０に出力する。

次いで、回答取得部３５０が、話題特定情報検索部３２０、省略文補完部３３０，あるいは話題検索部３４０で検索された話題タイトル８２０に基づいて、判定された利用者の発話種類と話題タイトル８２０に対応付けられた各回答種類とを照合する。この照合をした回答取得部３５０は、各回答種類の中から、判定された発話種類と一致する回答種類を検索する(ステップＳ１５１１)。

具体的に、話題検索部３４０から検索結果信号と、入力種類判定部４４０から「発話文のタイプ」とが入力された回答取得部３５０は、入力された検索結果信号に対応する「話題タイトル」と、入力された「発話文のタイプ」とに基づいて、その「話題タイトル」に対応付けられている回答種類群の中から、「発話文のタイプ」(DAなど)と一致する回答種類を特定する。

この回答取得部３５０は、会話データベース５００から、特定した回答種類に対応付けられた回答文８３０を取得する。回答取得部３５０は、管理部３１０を介して、取得した回答文８３０を出力部６００に出力する。管理部３１０から回答文が入力された出力部６００は、入力された回答文８３０を出力する(ステップＳ１５１２)。

［３．利点］
本会話制御装置１によれば、会話制御装置１が話者と会話を行うことにより、自動的に会話データベース５００の記憶内容に新しい単語、言葉が追加蓄積されるため、オペレータの単語の意味の入力作業を必要とすることなく、会話データベース５００の記憶内容の向上を図ることが可能となる。

［４．変形例］
（１）会話制御装置１の音声認識部２００、会話制御部３００、文解析部４００の構成及び動作は、第１の実施の形態において説明したものに限られず、会話データベース手段を利用して利用者の発話内容に応じた回答を返すものであれば、第１の実施の形態において説明したもの以外のどのような音声認識部２００、会話制御部３００、文解析部４００であっても、本発明に係る会話制御装置１の構成要素として使用可能である。

（２）上記実施の形態の説明では、会話制御装置１への発話の入力は音声によるものとして説明したが、会話制御装置１への発話の入力は音声に限られるものではなく、キーボード、タッチパネル、ポインティングデバイスなどの文字入力手段による文字列データとして会話制御装置１へ発話を入力し、会話制御装置１がこの文字列データとして入力された発話に対して会話データベース５００を用いて回答文を出力する構成としても本発明は成立する。

［５．その他］
上記実施の形態では、特定話題情報８１０及びその意味情報文８４０を自動的に登録するものとしたが、これらに加えて話題タイトル８２０、回答文８３０を話者の発話から抽出して会話制御装置１が自動的に登録する構成としてもよいし、或いは特定話題情報８１０及びその意味情報文８４０のみ会話制御装置１が自動的に登録し、のちにオペレータが登録された特定話題情報８１０及びその意味情報文８４０を参照して話題タイトル８２０、回答文８３０を追加するようにしてもよい。

会話制御装置の構成例を示す機能ブロック図音声認識部の構成例を示す機能ブロック図単語仮説絞込部の処理を示すタイミングチャート音声認識部の動作例を示すフロー図会話制御装置の部分拡大ブロック図文字列とこの文字列から抽出される形態素との関係を示す図「発話文のタイプ」と、その発話文のタイプを表す二文字のアルファベット、及びその発話文のタイプに該当する発話文の例を示す図文のタイプとそのタイプを判定するための辞書の関係を示す図会話データベースが記憶するデータのデータ構成の一例を示す概念図ある話題特定情報と他の話題特定情報との関連付けを示す図話題タイトル（「第二形態素情報」ともいう）のデータ構成例を示す図回答文のデータ構成例を説明するための図ある話題特定情報に対応付けされた話題タイトル，回答文の具体例を示す図新単語登録部の構成例を示す機能ブロック図会話制御方法の手順例を示すフロー図新単語登録処理の手順例を示すフロー図未確定の意味情報のデータ構成例を示す図

符号の説明

１ … 会話制御装置
１００ … 入力部
２００ … 音声認識部
３００ … 会話制御部
４００ … 文解析部
５００ … 会話データベース
６００ … 出力部
７００ … 音声認識辞書記憶部
８００ … 新単語登録部
１４０１ … 登録確認部
１４０２ … 意味問い合わせ部
１４０３ … 意味検証部
１４０４ … 登録処理部

Claims

ユーザからの発話に応答する回答を出力することが可能な会話制御装置において、
複数の話題特定情報を記憶する会話データベース手段と、
従前の会話及び従前の回答により定まる談話履歴を記憶し、この談話履歴により定まる話題特定情報と発話情報とを照合して回答文を選択する会話制御手段と、
ユーザの発話に含まれる語が、前記会話データベース手段に記憶された話題特定情報の内いずれにも相当しない場合、その語を新たな話題特定情報として会話データベース手段に記憶させるとともに、ユーザにその語の意味を質問する文を出力し、ユーザから返された返答をその話題特定情報に対応する意味情報文として会話データベース手段に記憶させる新単語登録手段と、
を有し、
前記新単語登録手段は、前記会話データベース手段に記憶された話題特定情報に関する意味情報の正否をユーザに問い質す検証質問文を生成して出力する処理を含み、該検証質問文を生成する際に、その話題特定情報について記憶された複数の意味情報文のうちの１つを選択して使用し、ユーザがこの検証質問文に対して肯定する返答を返した場合には、選択したその意味情報文の信頼度を示す数値を増加させ、次回検証質問文を生成する場合には、信頼度を示す数値が最も大きい意味情報文を選択することを特徴とする会話制御装置。
ユーザからの発話に応答する回答を出力することが可能な会話制御装置において、
複数の話題特定情報を記憶する会話データベース手段と、
従前の会話及び従前の回答により定まる談話履歴を記憶し、この談話履歴により定まる話題特定情報と発話情報とを照合して回答文を選択する会話制御手段と、
ユーザの発話に含まれる語が、前記会話データベース手段に記憶された話題特定情報の内いずれにも相当しない場合、その語を新たな話題特定情報として会話データベース手段に記憶させるとともに、ユーザにその語の意味を質問する文を出力し、ユーザから返された返答をその話題特定情報に対応する意味情報文として会話データベース手段に記憶させる新単語登録手段と、
を有し、
前記新単語登録手段は、前記会話データベース手段に記憶された話題特定情報に関する意味情報の正否をユーザに問い質す検証質問文を生成して出力する処理を含み、該検証質問文を生成する際に、その話題特定情報について記憶された複数の意味情報文のうちの１つを選択して使用し、ユーザがこの検証質問文に対して否定する返答を返した場合には、その話題特定情報の意味を問い質すための問い合わせ質問文を生成し、ユーザがこの問い合わせ質問文に対する返答を返した場合に、その返答をその話題特定情報の新たな意味情報文として会話データベース手段に記憶させることを特徴とする会話制御装置。
前記新単語登録手段は、ユーザの発話に含まれる語が前記会話データベース手段に話題特定情報として記憶されているか否かを確認するとともに、ユーザの発話に含まれる語が前記会話データベース手段に話題特定情報として記憶されている場合にその話題特定情報の意味情報が確定しているか否かを確認する登録確認部と、ユーザの発話に含まれる語が前記会話データベース手段に話題特定情報として記憶されていないことが前記登録確認部で確認される場合にその話題特定情報の意味を問い質すための問い合わせ質問文を出力する意味問い合わせ部と、会話データベース手段に記憶される話題特定情報の意味情報が確定していない場合にその意味情報を前記会話データベース手段から取り出してその意味情報の正否をユーザに問い質す検証質問文を出力する意味検証部とを有し、前記意味情報が確定しているか否かは、前記話題特定情報を構成する１つの文字、複数の文字列又はこれらの組み合わせからなる形態素の定義、または、その定義に相当する説明、解釈が確定しているか否かを調べることによって確認されることを特徴とする請求項１または請求項２に記載の会話制御装置。
ユーザからの発話を受け付ける入力手段と、
前記入力手段により受け付けられたユーザからの発話を当該ユーザからの発話情報として受け取って認識する認識部と、
前記ユーザからの発話情報を、１つの文字、複数の文字列又はこれらの組み合わせからなる形態素に抽出する形態素抽出部と、
を更に備え、
前記会話制御手段は、ユーザとの間の会話の話題や主題を特定する情報である談話履歴を記憶する手段を有し、
前記会話データベース手段は、前記形態素により構成され且つユーザへの回答文を対応付けて成る話題タイトルが対応付けられるとともに前記談話履歴により定まる複数の話題特定情報を記憶し、
前記会話制御手段は、前記形態素抽出部で抽出された形態素情報と前記会話データベース手段に記憶された話題特定情報とを照合し、各話題特定情報の中から形態素情報を構成する形態素と一致する話題特定情報を選択することによりユーザに対する前記回答文を選択する手段を有し、
前記新単語登録手段は、前記形態素抽出部で抽出された形態素情報が、前記会話データベース手段に記憶された話題特定情報の内いずれにも相当しない場合、その語を、回答文および話題タイトルが対応付けられることになる新たな話題特定情報として会話データベース手段に記憶させるとともに、ユーザにその語の意味を質問する文を出力し、ユーザから返された返答をその話題特定情報に対応する意味情報文として会話データベース手段に記憶させることを特徴とする請求項１ないし請求項３のいずれか１項に記載の会話制御装置。
前記新単語登録手段は、ユーザが前記検証質問文に対して否定する返答を返した場合、その話題特定情報の意味を問い質すための問い合わせ質問文を生成し、ユーザがこの問い合わせ質問文に対する返答を返した場合に、その返答をその話題特定情報の新たな意味情報文として会話データベース手段に記憶させることを特徴とする請求項４に記載の会話制御装置。
前記新単語登録手段は、ユーザの発話に含まれる語が前記会話データベース手段に話題特定情報として記憶されているか否かを確認するとともに、ユーザの発話に含まれる語が前記会話データベース手段に話題特定情報として記憶されている場合にその話題特定情報の意味情報が確定しているか否かを確認する登録確認部と、ユーザの発話に含まれる語が前記会話データベース手段に話題特定情報として記憶されていないことが前記登録確認部で確認される場合にその話題特定情報の意味を問い質すための問い合わせ質問文を出力する意味問い合わせ部と、会話データベース手段に記憶される話題特定情報の意味情報が確定していない場合にその意味情報を前記会話データベース手段から取り出してその意味情報の正否をユーザに問い質す検証質問文を出力する意味検証部とを有し、前記意味情報が確定しているか否かは、前記話題特定情報を構成する１つの文字、複数の文字列又はこれらの組み合わせからなる形態素の定義、または、その定義に相当する説明、解釈が確定しているか否かを調べることによって確認されることを特徴とする請求項４または請求項５に記載の会話制御装置。
ユーザからの発話を受け付ける入力手段と、ユーザからの発話に応答する回答文を出力する会話処理部とを有し、前記会話処理部が、ユーザと会話処理部との間の会話の話題や主題を特定する情報である談話履歴を記憶する手段を有し、１つの文字、複数の文字列又はこれらの組み合わせからなる形態素により構成され且つユーザへの回答文を対応付けて成る話題タイトルが対応付けられるとともに前記談話履歴により定まる複数の話題特定情報を記憶する会話データベース手段が更に設けられて成る会話制御装置を用いた会話制御方法において、
前記入力手段に接続された認識部が、前記入力手段により受け付けられたユーザからの発話を当該ユーザからの発話情報として受け取って認識するステップと、
前記会話処理部の形態素抽出部が、前記ユーザからの発話情報を、１つの文字、複数の文字列又はこれらの組み合わせからなる形態素に抽出するステップと、
前記会話処理部および前記会話データベース手段に接続された新単語登録手段が、前記形態素抽出部で抽出された形態素情報が前記会話データベース手段に記憶された話題特定情報の内いずれにも相当しない場合に、その語を、回答文および話題タイトルが対応付けられることになる新たな話題特定情報として会話データベース手段に記憶させるとともに、ユーザにその語の意味を質問する文を出力し、ユーザから返された返答をその話題特定情報に対応する意味情報文として会話データベース手段に記憶させるステップと、
を含み、
前記新単語登録手段は、前記会話データベース手段に記憶された話題特定情報に関する意味情報の正否をユーザに問い質す検証質問文を生成して出力する処理を含み、該検証質問文を生成する際に、その話題特定情報について記憶された複数の意味情報文のうちの１つを選択して使用し、ユーザがこの検証質問文に対して肯定する返答を返した場合には、選択したその意味情報文の信頼度を示す数値を増加させ、次回検証質問文を生成する場合には、信頼度を示す数値が最も大きい意味情報文を選択することを特徴とする会話制御方法。
ユーザからの発話を受け付ける入力手段と、ユーザからの発話に応答する回答文を出力する会話処理部とを有し、前記会話処理部が、ユーザと会話処理部との間の会話の話題や主題を特定する情報である談話履歴を記憶する手段を有し、１つの文字、複数の文字列又はこれらの組み合わせからなる形態素により構成され且つユーザへの回答文を対応付けて成る話題タイトルが対応付けられるとともに前記談話履歴により定まる複数の話題特定情報を記憶する会話データベース手段が更に設けられて成る会話制御装置を用いた会話制御方法において、
前記入力手段に接続された認識部が、前記入力手段により受け付けられたユーザからの発話を当該ユーザからの発話情報として受け取って認識するステップと、
前記会話処理部の形態素抽出部が、前記ユーザからの発話情報を、１つの文字、複数の文字列又はこれらの組み合わせからなる形態素に抽出するステップと、
前記会話処理部および前記会話データベース手段に接続された新単語登録手段が、前記形態素抽出部で抽出された形態素情報が前記会話データベース手段に記憶された話題特定情報の内いずれにも相当しない場合に、その語を、回答文および話題タイトルが対応付けられることになる新たな話題特定情報として会話データベース手段に記憶させるとともに、ユーザにその語の意味を質問する文を出力し、ユーザから返された返答をその話題特定情報に対応する意味情報文として会話データベース手段に記憶させるステップと、
を含み、
前記新単語登録手段は、前記会話データベース手段に記憶された話題特定情報に関する意味情報の正否をユーザに問い質す検証質問文を生成する処理を含み、該検証質問文を生成する際に、その話題特定情報について記憶された複数の意味情報文のうちの１つを選択して使用し、ユーザがこの検証質問文に対して否定する返答を返した場合には、その話題特定情報の意味を問い質すための問い合わせ質問文を生成し、ユーザがこの問い合わせ質問文に対する返答を返した場合に、その返答をその話題特定情報の新たな意味情報文として会話データベース手段に記憶させることを特徴とする記載の会話制御方法。
前記形態素抽出部で抽出された形態素情報が前記会話データベース手段に記憶されている場合には、
前記会話処理部の話題特定情報検索部が、前記形態素抽出部で抽出された形態素情報と前記会話データベース手段に記憶された話題特定情報とを照合し、各話題特定情報の中から形態素情報を構成する形態素と一致する話題特定情報を検索するステップと、
前記会話処理部の回答取得部が、話題特定情報検索部で検索された話題特定情報に対応付けられた回答文を取得するステップと、
を更に含むことを特徴とする請求項７または請求項８に記載の会話制御方法。
請求項７ないし請求項９のいずれか１項に記載の処理をコンピュータに実行させるためのプログラム。