JP4475628B2 - 会話制御装置、会話制御方法並びにこれらのプログラム - Google Patents

会話制御装置、会話制御方法並びにこれらのプログラム Download PDF

Info

Publication number
JP4475628B2
JP4475628B2 JP2003393282A JP2003393282A JP4475628B2 JP 4475628 B2 JP4475628 B2 JP 4475628B2 JP 2003393282 A JP2003393282 A JP 2003393282A JP 2003393282 A JP2003393282 A JP 2003393282A JP 4475628 B2 JP4475628 B2 JP 4475628B2
Authority
JP
Japan
Prior art keywords
information
topic
conversation
unit
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003393282A
Other languages
English (en)
Other versions
JP2005157602A (ja
Inventor
洋介 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Universal Entertainment Corp
Original Assignee
Universal Entertainment Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Universal Entertainment Corp filed Critical Universal Entertainment Corp
Priority to JP2003393282A priority Critical patent/JP4475628B2/ja
Publication of JP2005157602A publication Critical patent/JP2005157602A/ja
Application granted granted Critical
Publication of JP4475628B2 publication Critical patent/JP4475628B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Description

本発明は、会話制御装置、会話制御方法並びにこれらのプログラムに関し、より詳しくは自動的に新しい言葉などを学習することにより会話データベースの充実を図ることが可能な、会話制御装置、会話制御方法並びにこれらのプログラムに関する。
近年、コンピュータを中心とした情報処理の手段として開発され進展してきたディジタル信号処理、高集積度LSI製造技術、DVDなどディスクメディアの微細精密加工製造技術の高度化を背景にして、機械が自然な音声を話すようになったり、人の発する言葉を理解して適切な回答を返すことができる会話制御技術が提供されるようになってきている。
このような会話制御技術においては、会話の履歴、話題の推移などが加味された人間同士の会話と同様な自然な対話を実現可能な会話制御装置が提案されている(特許文献1)。
特開2002−358304号公報
一般に、上記のような会話制御装置は、ユーザの発話とこの発話に対応する回答文を予め記憶・登録する会話データベース手段を用意しておき、ユーザの発話に応じて、会話データベース手段からこれに対応する回答文を検索してユーザに返すことにより、会話制御装置に発話に意味認識を行わせ、この意味認識に基づいてユーザと会話制御装置間の会話を成立させるようになっている。従って、ユーザと会話制御装置間の会話の内容は、会話データベース手段に記憶・登録されている内容に依存しており、会話データベース手段に記憶・登録されている内容が多岐多様な単語、言葉であればあるほど、ユーザと会話制御装置間の会話の内容も変化に富んだ充実したものとなる。
現状の会話制御装置の構築においては、会話制御装置の意味認識を完成させるに当たり、言葉、単語等の意味を個別にオペレータ(人間)による入力作業により会話データベース手段に登録することにより行っている。このような会話データベース手段に登録作業は、どのような言葉、単語を登録するのか、その言葉、単語についてどのような内容を登録するかを準備しておく必要があり、会話データベース手段を充実したものとするためには登録すべき言葉、単語数が数千から数万となるため、登録の準備に必要な作業及びオペレータによる入力作業は膨大な量となり、結果として会話制御装置の製品化の障害となっていた。
本発明の目的は、自動的に新しい言葉などを学習することにより会話データベースの充実を図ることが可能なユーザと会話制御可能な会話制御装置並びに会話制御方法を提供することにある。
上記課題を解決するための手段として、本発明は以下のような特徴を有する。
本発明の第1の態様は、ユーザからの発話に応答する回答を出力することが可能な会話制御装置として提案される。
この会話制御装置は、複数の話題特定情報を記憶する会話データベース手段(会話データベース)と、従前の会話及び従前の回答により定まる談話履歴を記憶し、この談話履歴により定まる話題特定情報と発話情報とを照合して回答文を選択する会話制御手段(会話制御部)と、利用者の発話に含まれる語が、会話データベース手段に記憶された話題特定情報の内いずれにも相当しない場合、その語を新たな話題特定情報として会話データベース手段に記憶させるとともに、利用者にその語の意味を質問する文を出力し、利用者から返された返答をその話題特定情報に対応する意味情報文として会話データベース手段に記憶させる新単語登録手段(新単語登録部)とを有することを特徴としている。
この会話制御装置によれば、利用者と会話を行うことにより新たな語を会話データベース手段に追加登録することが可能となり、オペレータによる新語登録処理などの労力を要することなく、より記憶内容の豊富な会話制御装置を作成することが可能となる。
上記の会話制御装置において、新単語登録手段は、ある話題特定情報について記憶された意味情報文を用いて、その話題特定情報の意味情報文の検証を行うための検証質問文を生成し、利用者がこの検証質問文に対して肯定する返答を返した場合には、その意味情報文の信頼度を示す数値を増加させ、次回検証質問文を生成する場合には、信頼度を示す数値が最も大きい意味情報文を用いて、その意味情報文の検証を行うための検証質問文を生成するようにしてもよい。
この会話制御装置によれば、自動的に新たに登録する語の意味内容を検証し、最も適切な意味をその語の意味として登録することが可能となる。
また、上記の会話制御装置において、新単語登録手段は、ある話題特定情報について記憶された意味情報文を用いてその意味情報文の検証を行うための検証質問文を生成し、利用者がこの検証質問文に対して否定する返答を返した場合には、その話題特定情報の意味を問いただすための問い合わせ質問文を生成し、利用者がこの問い合わせ質問文に対する返答を返した場合に、その返答をその話題特定情報の新たな意味情報文として会話データベース手段に記憶させるようにしてもよい。
かかる会話制御装置によれば、利用者から提供される意味を複数登録しておき、のちにこの複数登録されたものの中から、最適のものをその語の意味として登録することが可能となる。
本発明の第2の態様は、ユーザからの発話に応答する回答を出力することが可能な会話制御方法として提案される。
この会話制御方法は、複数の話題特定情報を予め記憶させるステップと、利用者の発話に含まれる語が話題特定情報として未だ登録されていない場合、その語について、利用者に意味を問い合わせる問い合わせ質問文を出力するステップと、問い合わせ質問に対する利用者の回答を取得するステップと、この語を新たな話題特定情報として記憶させるとともに、回答をその話題特定情報の意味情報文として記憶させるステップとを有することを特徴としている。
この会話制御方法によれば、利用者と会話を行うことにより新たな語を追加登録することが可能となり、オペレータによる新語登録処理などの労力を要することなく、より記憶内容の豊富な会話制御方法を実現することが可能となる。
上記の会話制御方法は、ある話題特定情報について記憶された意味情報文を用いて、その話題特定情報の意味情報文の検証を行うための検証質問文を生成し、出力するステップと、利用者がこの検証質問文に対して肯定する返答を返した場合には、その意味情報文の信頼度を示す数値を増加させるステップと、話題特定情報について次に検証質問文を生成する場合には、信頼度を示す数値(肯定回数情報)が最も大きい意味情報文を用いて、その意味情報文の検証を行うための検証質問文を生成するステップとをさらに有するようにしてもよい。
この会話制御方法によれば、自動的に新たに登録する語の意味内容を検証し、最も適切な意味をその語の意味として登録することが可能となる。
また、上記の会話制御方法は、ある話題特定情報について記憶された意味情報文を用いてその意味情報文の検証を行うための検証質問文を生成し、出力するステップと、利用者がこの検証質問文に対して否定する返答を返した場合には、その話題特定情報の意味を問いただすための問い合わせ質問文を生成し、出力するステップと、利用者がこの問い合わせ質問文に対する返答を返した場合に、その返答をその話題特定情報の新たな意味情報文として記憶させるステップとをさらに有していてもよい。
かかる会話制御装置によれば、利用者から提供される意味を複数登録しておき、のちにこの複数登録されたものの中から、最適のものをその語の意味として登録することが可能となる。
本発明によれば、自動的に新しい言葉などを学習することにより会話データベースの充実を図ることが可能なユーザと会話制御可能な会話制御装置並びに会話制御方法及びこれらのプログラムを提供することが可能となる。
以下に図面を参照しながら本発明の第1の実施の形態を説明する。
本実施の形態は、話者の発話内容及び/又は発話内容に対する回答文を出力可能な会話制御装置に関する。
[1.会話制御装置の構成例]
[1.1.全体構成]
図1は、本実施の形態に係る学習機能を有する会話制御装置1の概略構成図である。
会話制御装置1は、たとえばコンピュータ、ワークステーションなどの情報処理装置であって、演算処理装置(CPU)、主メモリ(RAM)、読出し専用メモリ(ROM)、入出力装置(I/O)、ハードディスク装置等の外部記憶装置を具備している装置で構成されている。前記ROM、もしくは外部記憶装置などに情報処理装置を会話制御装置1として機能させるためのプログラム、もしくは会話制御方法をコンピュータに実行させるためのプログラムが記憶されており、該プログラムを主メモリ上に載せ、CPUがこれを実行することにより会話制御装置1が実現される。また、上記プログラムは必ずしも当該装置内の記憶装置に記憶されていなくともよく、磁気ディスク、光ディスク、光磁気ディスク、CD(Compact Disc)、DVD(Digital Video Disc)などのコンピュータ読み取り可能なプログラム記録媒体や、外部の装置(例えば、ASP(アプリケーション・サービス・プロバイダ)のサーバなど)から提供され、これを主メモリに乗せる構成であっても良い。
図1に示すように、会話制御装置1は、入力部100と、音声認識部200と、会話制御部300と、文解析部400と、会話データベース500と、出力部600と、音声認識辞書記憶部700と、新単語登録部800を備えている。
[入力部]
入力部100は、利用者から入力された入力情報を取得するものである。この入力部100は、例えば、マイクロホンが挙げられる。入力部100は、取得した発話内容に対応する音声を音声信号として音声認識部200に出力する。
[音声認識部]
音声認識部200は、入力部100で取得した発話内容に基づいて、発話内容に対応する文字列を特定するものである。具体的には、入力部100から音声信号が入力された音声認識部200は、入力された音声信号に基づいて、この音声信号を、音声認識辞書記憶部700に格納されている辞書および会話データベース500と照合して、音声信号から推測される音声認識結果を出力する。なお、図3に示す構成例では、音声認識部200は、会話制御部300に会話データベース500の記憶内容の取得を要求し、会話制御部300が要求に応じて取得した会話データベース500の記憶内容を受け取るようになっているが、音声認識部200が直接会話データベース500の記憶内容を取得して音声信号との比較を行う構成であってもかまわない。
[音声認識部の構成例]
図2に、音声認識部200の構成例を示す機能ブロック図を示す。音声認識部200は、特徴抽出部200Aと、バッファメモリ(BM)200Bと、単語照合部200Cと、バッファメモリ(BM)200Dと、候補決定部200Eと、単語仮説絞込部200Fを有している。単語照合部200C及び単語仮説絞込部200Fは音声認識辞書記憶部700に接続されており、候補決定部200Eは会話制御部300に接続されている。
単語照合部200Cに接続された音声認識辞書記憶部700は、音素隠れマルコフモデル(以下、隠れマルコフモデルをHMMという。)を記憶している。音素HMMは、各状態を含んで表され、各状態はそれぞれ以下の情報を有する。(a)状態番号、(b)受理可能なコンテキストクラス、(c)先行状態、及び後続状態のリスト、(d)出力確率密度分布のパラメータ、及び(e)自己遷移確率及び後続状態への遷移確率から構成されている。なお、本実施形態において用いる音素HMMは、各分布がどの話者に由来するかを特定する必要があるため、所定の話者混合HMMを変換して生成する。ここで、出力確率密度関数は34次元の対角共分散行列をもつ混合ガウス分布である。また、単語照合部200Cに接続された音声認識辞書記憶部700は単語辞書を記憶している。単語辞書は、音素HMMの各単語毎にシンボルで表した読みを示すシンボル列を格納する。
話者の発声音声はマイクロホンなどに入力されて音声信号に変換された後、特徴抽出部200Aに入力される。特徴抽出部200Aは、入力された音声信号をA/D変換した後、特徴パラメータを抽出し、これを出力する。特徴パラメータを抽出し、これを出力する方法としては様々なものが考えられるが、例えば一例としては、LPC分析を実行し、対数パワー、16次ケプストラム係数、Δ対数パワー及び16次Δケプストラム係数を含む34次元の特徴パラメータを抽出する方法などが挙げられる。抽出された特徴パラメータの時系列はバッファメモリ(BM)200Bを介して単語照合部200Cに入力される。
単語照合部200Cは、ワン−パス・ビタビ復号化法を用いて、バッファメモリ200Bを介して入力される特徴パラメータのデータに基づいて、音声認識辞書記憶部700に記憶された音素HMMと単語辞書とを用いて単語仮説を検出し、尤度を計算して出力する。ここで、単語照合部200Cは、各時刻の各HMMの状態毎に、単語内の尤度と発声開始からの尤度を計算する。尤度は、単語の識別番号、単語の開始時刻、先行単語の違い毎に個別にもつ。また、計算処理量の削減のために、音素HMM及び単語辞書とに基づいて計算される総尤度のうちの低い尤度のグリッド仮説を削減するようにしてもよい。単語照合部200Cは、検出した単語仮説とその尤度の情報を発声開始時刻からの時間情報(具体的には、例えばフレーム番号)とともにバッファメモリ200Dを介して候補決定部200E及び単語仮説絞込部200Fに出力する。
候補決定部200Eは、会話制御部300を参照して、検出した単語仮説と所定の談話空間内の話題特定情報とを比較し、検出した単語仮説の内、所定の談話空間内の話題特定情報と一致するものがあるか否かを判定し、一致するものがある場合は、その一致する単語仮説を認識結果として出力し、一方一致するものがない場合は、単語仮説絞込部200Fに単語仮説の絞込を行うよう要求する。
候補決定部200Eの動作例を説明する。今、単語照合部200Cが複数の単語仮説「カンタク」「カタク」「カントク」およびその尤度(認識率)を出力し、所定の談話空間は「映画」に関するものでありその話題特定情報には「カントク(監督)」は含まれているが、「カンタク(干拓)」及び「カタク(仮託)」は含まれていないとする。また「カンタク」「カタク」「カントク」の尤度(認識率)は「カンタク」が最も高く「カントク」は最も低く、「カタク」は両者の中間であったとする。
上記の状況において、候補決定部200Eは、検出した単語仮説と所定の談話空間内の話題特定情報とを比較して、単語仮説「カントク」が、所定の談話空間内の話題特定情報と一致するものであると判定し、単語仮説「カントク」を認識結果として出力し、会話制御部に渡す。このように処理することにより、現在扱われている話題「映画」に関連した「カントク(監督)」が、より上位の尤度(認識率)を有する単語仮説「カンタク」「カタク」に優先されて選択され、その結果会話の文脈に即した音声認識結果を出力することが可能となる。
一方、一致するものがない場合は、候補決定部200Eからの単語仮説の絞込を行う要求に応じて単語仮説絞込部200Fが認識結果を出力するよう動作する。単語仮説絞込部200Fは、単語照合部200Cからバッファメモリ200Dを介して出力される複数個の単語仮説に基づいて、音声認識辞書記憶部700に記憶された統計的言語モデルを参照して、終了時刻が等しく開始時刻が異なる同一の単語の単語仮説に対して、当該単語の先頭音素環境毎に、発声開始時刻から当該単語の終了時刻に至る計算された総尤度のうちの最も高い尤度を有する1つの単語仮説で代表させるように単語仮説の絞り込みを行った後、絞り込み後のすべての単語仮説の単語列のうち、最大の総尤度を有する仮説の単語列を認識結果として出力する。本実施形態においては、好ましくは、処理すべき当該単語の先頭音素環境とは、当該単語より先行する単語仮説の最終音素と、当該単語の単語仮説の最初の2つの音素とを含む3つの音素並びをいう。
単語仮説絞込部200Fによる単語絞込処理の例を図3を参照しながら説明する。図3は、単語仮説絞込部200Fの処理の一例を示すタイミングチャートである。
例えば(i−1)番目の単語Wi-1の次に、音素列a1,a2,…,anからなるi番目の単語Wiがくるときに、単語Wi-1の単語仮説として6つの仮説Wa,Wb,Wc,Wd,We,Wfが存在しているとする。ここで、前者3つの単語仮説Wa,Wb,Wcの最終音素は/x/であるとし、後者3つの単語仮説Wd,We,Wfの最終音素は/y/であるとする。終了時刻teにおいて単語仮説Wa,Wb,Wcを前提とする3つの仮説と、単語仮説Wd,We,Wfを前提とする1の仮説が残っているものとすると、先頭音素環境が等しい前者3つ仮説のうち、総尤度が最も高い仮説一つを残し、その他を削除する。
なお、単語仮説Wd,We,Wfを前提とする仮説は先頭音素環境が他の3つの仮説と違うため、すなわち、先行する単語仮説の最終音素がxではなくyであるため、この単語仮説Wd,We,Wfを前提とする仮説は削除しない。すなわち、先行する単語仮説の最終音素毎に1つのみ仮説を残す。
以上の実施形態においては、当該単語の先頭音素環境とは、当該単語より先行する単語仮説の最終音素と、当該単語の単語仮説の最初の2つの音素とを含む3つの音素並びとして定義されているが、本発明はこれに限らず、先行する単語仮説の最終音素と、最終音素と連続する先行する単語仮説の少なくとも1つの音素とを含む先行単語仮説の音素列と、当該単語の単語仮説の最初の音素を含む音素列とを含む音素並びとしてもよい。
以上の実施の形態において、特徴抽出部200Aと、単語照合部200Cと、候補決定部200Eと、単語仮説絞込部200Fとは、例えば、デジタル電子計算機などのコンピュータで構成され、バッファメモリ200B,200Dと、音声認識辞書記憶部700とは、例えばハードディスク、メモリなどの記憶装置で構成される。
以上の実施の形態においては、単語照合部200C、単語仮説絞込部200Fとを用いて音声認識を行っているが、本発明はこれに限られず、例えば、音素HMMを参照する音素照合部と、例えばOne
Pass DPアルゴリズムを用いて統計的言語モデルを参照して単語の音声認識を行う音声認識部とで構成してもよい。
また、本実施の形態では、音声認識部200は会話制御装置1の一部分として説明するが、音声認識部200、音声認識辞書記憶部700、及び会話データベース500より構成される、独立した音声認識装置とすることも可能である。
[音声認識部の動作例]
つぎに図4を参照しながら音声認識部200の動作について説明する。図4は、音声認識部200の動作例を示すフロー図である。入力部100より音声信号を受け取ると、音声認識部200は入力された音声の特徴分析を行い、特徴パラメータを生成する(ステップS401)。次に、この特徴パラメータと音声認識辞書記憶部700に記憶された音素HMM及び言語モデルとを比較して、所定個数の単語仮説及びその尤度を取得する(ステップS402)。次に、音声認識部200は、取得した所定個数の単語仮説と検出した単語仮説と所定の談話空間内の話題特定情報とを比較し、検出した単語仮説の内、所定の談話空間内の話題特定情報と一致するものがあるか否かを判定する(ステップS403、S404)。一致するものがある場合は、音声認識部200はその一致する単語仮説を認識結果として出力する(ステップS405)。一方、一致するものがない場合は、音声認識部200は取得した単語仮説の尤度に従って、最大尤度を有する単語仮説を認識結果として出力する(ステップS406)。
[音声認識辞書記憶部]
再び、図1に戻って、会話制御装置1の構成例の説明を続ける。
音声認識辞書記憶部700は、標準的な音声信号に対応する文字列を格納するものである。この照合をした音声認識部200は、その音声信号に対応する単語仮説に対応する文字列を特定し、その特定した文字列を文字列信号として会話制御部300に出力する。
[文解析部]
次に、図5を参照しながら文解析部400の構成例について説明する。図5は、会話制御装置1の部分拡大ブロック図であって、会話制御部300及び文解析部400の具体的構成例を示すブロック図である。なお、図5においては、会話制御部300、文解析部400、および会話データベース500のみ図示しており、その他の構成要素の表示は省略されている。
文解析部400は、入力部100又は音声認識部200で特定された文字列を解析するものである。この文解析部400は、本実施の形態では、図5に示すように、文字列特定部410と、形態素抽出部420と、形態素データベース430と、入力種類判定部440と、発話種類データベース450とを有している。文字列特定部410は、入力部100及び音声認識部200で特定された一連の文字列を一文節毎に区切るものである。この一文節とは、文法の意味を崩さない程度に文字列をできるだけ細かく区切った一区切り文を意味する。具体的に、文字列特定部410は、一連の文字列の中に、ある一定以上の時間間隔があるときは、その部分で文字列を区切る。文字列特定部410は、その区切った各文字列を形態素抽出部420及び入力種類判定部440に出力する。尚、以下で説明する「文字列」は、一文節毎の文字列を意味するものとする。
[形態素抽出部]
形態素抽出部420は、文字列特定部410で区切られた一文節の文字列に基づいて、その一文節の文字列の中から、文字列の最小単位を構成する各形態素を第一形態素情報として抽出するものである。ここで、形態素とは、本実施の形態では、文字列に現された語構成の最小単位を意味するものとする。この語構成の最小単位としては、例えば、名詞、形容詞、動詞などの品詞が挙げられる。
各形態素は、図6に示すように、本実施の形態ではm1,m2,m3…,と表現することができる。図6は、文字列とこの文字列から抽出される形態素との関係を示す図である。図6に示すように、文字列特定部410から文字列が入力された形態素抽出部420は、入力された文字列と、形態素データベース430に予め格納されている形態素群(この形態素群は、それぞれの品詞分類に属する各形態素についてその形態素の見出し語・読み・品詞・活用形などを記述した形態素辞書として用意されている)とを照合する。その照合をした形態素抽出部420は、その文字列の中から、予め記憶された形態素群のいずれかと一致する各形態素(m1,m2、…)を抽出する。この抽出された各形態素を除いた要素(n1,n2,n3…)は、例えば助動詞等が挙げられる。
この形態素抽出部420は、抽出した各形態素を第一形態素情報として管理部310に出力する。なお、第一形態素情報は構造化されている必要はない。ここで「構造化」とは、文字列の中に含まれる形態素を品詞等に基づいて分類し配列することをいい、たとえば発話文である文字列を、「主語+目的語+述語」などの様に、所定の順番で形態素を配列してなるデータに変換することを言う。もちろん、構造化した第一形態素情報を用いたとしても、それが本実施の形態を実現を妨げることはない。
[入力種類判定部]
入力種類判定部440は、文字列特定部410で特定された文字列に基づいて、発話内容の種類(発話種類)を判定するものである。この発話種類は、発話内容の種類を特定する情報であって、本実施の形態では、例えば図7に示す「発話文のタイプ」を意味する。図7は、「発話文のタイプ」と、その発話文のタイプを表す二文字のアルファベット、及びその発話文のタイプに該当する発話文の例を示す図である。
ここで、「発話文のタイプ」は、本実施の形態では、図7に示すように、陳述文(D ; Declaration)、時間文(T ; Time)、場所文(L ; Location)、反発文(N ; Negation)などから構成される。この各タイプから構成される文は、肯定文又は質問文で構成される。「陳述文」とは、利用者の意見又は考えを示す文を意味するものである。この陳述文は本実施の形態では、図7に示すように、例えば"私は佐藤が好きです"などの文が挙げられる。「場所文」とは、場所的な概念を伴う文を意味するものである。「時間文」とは、時間的な概念を伴う文を意味するものである。「反発文」とは、陳述文を否定するときの文を意味する。「発話文のタイプ」についての例文は図7に示す通りである。
入力種類判定部440が「発話文のタイプ」を判定するには、入力種類判定部440は、本実施の形態では、図8に示すように、陳述文であることを判定するための定義表現辞書、反発文であることを判定するための反発表現辞書等を用いる。具体的に、文字列特定部410から文字列が入力された入力種類判定部440は、入力された文字列に基づいて、その文字列と発話種類データベース450に格納されている各辞書とを照合する。その照合をした入力種類判定部440は、その文字列の中から、各辞書に関係する要素を抽出する。
この入力種類判定部440は、抽出した要素に基づいて、「発話文のタイプ」を判定する。例えば、入力種類判定部440は、ある事象について陳述している要素が文字列の中に含まれる場合には、その要素が含まれている文字列を陳述文として判定する。入力種類判定部440は、判定した「発話文のタイプ」を回答取得部350に出力する。
[会話データベース]
次に、会話データベース500が記憶するデータのデータ構成例について図9を参照しながら説明する。図9は、会話データベース500が記憶するデータのデータ構成の一例を示す概念図である。
前記会話データベース500は、図9に示すように、話題を特定するための話題特定情報810を予め複数記憶する。又、それぞれの話題特定情報810は、他の話題特定情報と関連づけられていてもよく、例えば、図9に示す例では、話題特定情報Cが特定されると、この話題特定情報Cに関連づけられている他の話題特定情報A、B,Dが定まるように記憶されている。
具体的には、話題特定情報810は、本実施の形態では、利用者から入力されると予想される入力内容又は利用者への回答文に関連性のある「キーワード」を意味する。
話題特定情報810には、一又は複数の話題タイトル820が対応付けられて記憶されている。話題タイトル820は、一つの文字、複数の文字列又はこれらの組み合わせからなる形態素により構成されている。各話題タイトル820には、利用者への回答文830が対応付けられて記憶されている。また、回答文830の種類を示す複数の回答種類は、回答文830に対応付けられている。
次に、ある話題特定情報と他の話題特定情報との関連づけについて説明する。図10は、ある話題特定情報810Aと他の話題特定情報810B、810C〜810C、810D〜810D…との関連付けを示す図である。なお、以下の説明において「関連づけされて記憶される」とは、ある情報Xを読み取るとその情報Xに関連づけられている情報Yを読み取りできることをいい、例えば、情報Xのデータの中に情報Yを読み出すための情報(例えば、情報Yの格納先アドレスを示すポインタ、情報Yの格納先物理メモリアドレス、論理アドレスなど)が格納されている状態を、「情報Yが情報Xに『関連づけされて記憶され』ている」というものとする。
図10に示す例では、話題特定情報は他の話題特定情報との間で上位概念、下位概念、同義語、対義語(本図の例では省略)が関連づけされて記憶させることができる。本図に示す例では、話題特定情報810A(=「映画」)に対する上位概念の話題特定情報として話題特定情報810B(=「娯楽」)が話題特定情報810Aに関連づけされて記憶されており、たとえば話題特定情報(「映画」)に対して上の階層に記憶される。
また、話題特定情報810A(=「映画」)に対する下位概念の話題特定情報810C(=「監督」)、話題特定情報810C(=「主演」)、話題特定情報810C(=「配給会社」)、話題特定情報810C(=「上映時間」)、および話題特定情報810D(=「七人の侍」)、話題特定情報810D(=「乱」)、話題特定情報810D(=「用心棒」)、…、が話題特定情報810Aに関連づけされて記憶されている。
又、話題特定情報810Aには、同義語900が関連づけられている。この例では、話題特定情報810Aであるキーワード「映画」の同義語として「作品」、「内容」、「シネマ」が記憶されている様子を示している。このような同意語を定めることにより、発話にはキーワード「映画」は含まれていないが「作品」、「内容」、「シネマ」が発話文等に含まれている場合に、話題特定情報810Aが発話文等に含まれているものとして取り扱い、またその逆の取り扱いをすることを可能とする。
本実施の形態にかかる会話制御装置1は、会話データベース500の記憶内容を参照することにより、ある話題特定情報を特定するとその話題特定情報に関連づけられて記憶されている他の話題特定情報及びその話題特定情報の話題タイトル、回答文などを高速で検索・抽出することが可能となる。
次に、話題タイトル(「第二形態素情報」ともいう)のデータ構成例について、図11を参照しながら説明する。図11は、話題タイトルのデータ構成例を示す図である。
話題特定情報810D、810D、810D、…はそれぞれ複数の異なる話題タイトル820、820、…、話題タイトル820、820、…、話題タイトル820、820、…、…を有している。本実施の形態では、図11に示すように、それぞれの話題タイトル820は、第一特定情報1001と、第二特定情報及1002と、第三特定情報1003によって構成される情報である。
ここで、第一特定情報1001は、本実施の形態では、話題を構成する主要な形態素を意味するものである。第一特定情報の例としては、例えば文を構成する主語が挙げられる。また、第二特定情報1002は、本実施の形態では、第一特定情報1001と密接な関連性を有する形態素を意味するものである。この第二特定情報1002は、例えば目的語が挙げられる。更に、第三特定情報1003は、本実施の形態では、ある対象についての動きを示す形態素、又は名詞等を修飾する形態素を意味するものである。この第三特定情報1003は、例えば動詞、副詞又は形容詞が挙げられる。なお、第一特定情報1001、第二特定情報1002、第三特定情報1003それぞれの意味は上述の内容に限定される必要はなく、別の意味を第一特定情報1001、第二特定情報1002、第三特定情報1003に与えても、これらから文の内容を把握可能な限り、本実施の形態は成立する。
例えば、主語が「七人の侍」、形容詞が「面白い」である場合には、図11に示すように、話題タイトル(第二形態素情報)820は、第一特定情報1001である形態素「七人の侍」と、第三特定情報1003である形態素「面白い」とから構成されることになる。なお、この話題タイトル820には第二特定情報である形態素は含まれておらず、該当する形態素がないことを示すための記号「*」が第二特定情報として格納されている。
なお、この話題タイトル820(七人の侍;*;面白い)は、「七人の侍は面白い」の意味を有する。この話題タイトル820を構成する括弧内は、以下では左から第一特定情報1001、第二特定情報1002、第三特定情報1003の順番となっている。また、話題タイトル820のうち、第一から第三特定情報に含まれる形態素がない場合には、その部分については、「*」を示すことにする。
なお、上記話題タイトル820を構成する特定情報は、上記のような第一から第三特定情報のように三つに限定されるものではなく、話題タイトル820は更に他の特定情報(第四特定情報、又はそれ以上)を有する構成としてもよい。
次に、回答文830について図12を参照しながら説明する。本実施の形態では、回答文830は、図12に示すように、利用者から発話された発話文のタイプに対応した回答をするために、陳述(D ; Declaration)、時間(T ; Time)、場所(L ; Location)、否定(N ; Negation)などのタイプ(回答種類)に分類され、タイプを示す情報を附されている。また、回答文830について肯定文は「A」とし、質問文は「Q」とする。
次に、話題特定情報、およびこの話題特定情報に対応付けされた話題タイトル,回答文の関係について説明する。図13は、ある話題特定情報「佐藤」に対応付けされた話題タイトル,回答文の具体例を示す図である。
例えば、話題タイトル(820)1−1が(佐藤;*;好き){これは、「佐藤が好きです」に含まれる形態素を抽出したもの}である場合には、その話題タイトル(820)1−1に対応する回答文(830)1−1は、(DA;陳述肯定文「私も佐藤が好きです」)、(TA;時間肯定文「私は打席に立ったときの佐藤が好きです」)など各回答種類に対応した回答文の集合として準備されている。後述する回答取得部350は、その話題タイトル820に対応付けられた回答文830、すなわち各回答種類に対応した回答文の集合からいずれか一を取得する。
[会話制御部]
ここで図5に戻り、会話制御部300の構成例を説明する。
会話制御部300は、会話制御装置1内の各構成要素(音声認識部200,文解析部400、会話データベース500,出力部600,新単語登録部800)間のデータの受け渡しを制御するとともに、発話に応答する回答文の決定、出力を行う機能を有する。
前記会話制御部300は、本実施の形態では、図5に示すように、管理部310と、話題特定情報検索部320と、省略文補完部330と、話題検索部340と、回答取得部350とを有している。
[管理部]
管理部310は、会話制御部300の全体の動作を管理・制御する機能を有する。また、管理部310は談話履歴を記憶し、且つ必要に応じて更新する機能を有する。管理部310は話題特定情報検索部320と、省略文補完部330と、話題検索部340と、回答取得部350からの要求に応じて、記憶している談話履歴の全部又は一部をこれら各部に渡す機能を有する。
「談話履歴」とは、ユーザと会話制御装置1間の会話の話題や主題を特定する情報であって、後述する談話履歴は「着目話題特定情報」「着目話題タイトル」「利用者入力文話題特定情報」「回答文話題特定情報」の少なくともいずれか一つを含む情報である。また、談話履歴に含まれる「着目話題特定情報」「着目話題タイトル」「回答文話題特定情報」は直前の会話によって定められたものに限定されず、過去の所定期間の間に着目話題特定情報」「着目話題タイトル」「回答文話題特定情報」となったもの、若しくはそれらの累積的記録であってもよい。
また、管理部310は音声認識部200からの出力を受け取ると、これを文解析部400に渡し、文解析部400が返す第一形態素情報を新単語登録部800に渡す。新単語登録部800が新単語登録処理を行う場合は、この第一形態素情報に対する回答出力処理等は、新単語登録部800により行われる。一方、新単語登録部800が新単語登録処理を行わない場合は、新単語登録部800が管理部310に会話制御処理を行うよう通知し、管理部310はこの通知に応答して、第一形態素情報を話題特定情報検索部320にこの第一形態素情報を渡すように動作する。
以下、会話制御部300を構成する管理部310以外の各部について説明する。
[話題特定情報検索部]
話題特定情報検索部320は、第一形態素情報と談話範囲に属する各話題特定情報とを照合し、各話題特定情報の中から、第一形態素情報を構成する形態素と一致する話題特定情報を検索するものである。具体的に、話題特定情報検索部320は、管理部310を経由して形態素抽出部420から入力された第一形態素情報が「佐藤」及び「好き」の二つの形態素で構成される場合には、入力された第一形態素情報と話題特定情報群とを照合する。
この照合をした話題特定情報検索部320は、着目話題タイトル820focus(前回までに検索された話題タイトル)に第一形態素情報を構成する形態素(例えば「佐藤」)が含まれているときは、その着目話題タイトル820focusを回答取得部350に出力する。一方、着目話題タイトル820focusに第一形態素情報を構成する形態素が含まれていないときは、話題特定情報検索部320は、第一形態素情報に基づいて利用者入力文話題特定情報を決定し、入力された第一形態素情報及び利用者入力文話題特定情報を省略文補完部330に出力する。なお、「利用者入力文話題特定情報」は、第一形態素情報に含まれる形態素の内、利用者が話題としている内容に該当する形態素に相当する話題特定情報、若しくは第一形態素情報に含まれる形態素の内、利用者が話題としている内容に該当する可能性がある形態素に相当する話題特定情報をいう。
[省略文補完部]
省略文補完部330は、前記第一形態素情報を、前回までに検索された話題特定情報810(以下、「着目話題特定情報」)及び前回の回答文に含まれる話題特定情報810(以下、「回答文話題特定情報」という)を利用して、補完することにより複数種類の補完された第一形態素情報を生成する。例えば発話文が「好きだ」という文であった場合、省略文補完部330は、着目話題特定情報「佐藤」を、第一形態素情報「好き」に含めて、補完された第一形態素情報「佐藤、好き」を生成する。
すなわち、第一形態素情報を「W」、着目話題特定情報や回答文話題特定情報の集合を「D」とすると、省略文補完部330は、第一形態素情報「W」に集合「D」の要素を含めて、補完された第一形態素情報を生成する。
これにより、第一形態素情報を用いて構成される文が、省略文であって日本語として明解でない場合などにおいて、省略文補完部330は、集合「D」を用いて、その集合「D」の要素(例えば、”佐藤”)を第一形態素情報「W」に含めることができる。この結果、省略文補完部330は、第一形態素情報「好き」を補完された第一形態素情報「佐藤、好き」に置換する。なお、補完された第一形態素情報「佐藤、好き」は、「佐藤が好きだ」という発話内容に対応する。
すなわち、省略文補完部330は、利用者の発話内容が省略文である場合などであっても、集合「D」を用いて省略文を補完することができる。この結果、省略文補完部330は、第一形態素情報から構成される文が省略文であっても、その文が適正な日本語となるようにすることができる。
また、省略文補完部330が、前記集合「D」に基づいて、補完後の第一形態素情報に一致する話題タイトル820を検索する。補完後の第一形態素情報に一致する話題タイトル820を発見した場合は、省略文補完部330はこの話題タイトル820を回答取得部350に出力する。回答取得部350は、省略文補完部330で検索された適切な話題タイトル820に基づいて、利用者の発話内容に最も適した回答文830を出力することができる。
尚、省略文補完部330は、集合「D」の要素を第一形態素情報に含めるだけに限定されるものではない。この省略文補完部330は、着目話題タイトルに基づいて、その話題タイトルを構成する第一特定情報、第二特定情報又は第三特定情報のいずれかに含まれる形態素を、抽出された第一形態素情報に含めても良い。
[話題検索部]
話題検索部340は、省略文補完部330で話題タイトル820が決まらなかったとき、第一形態素情報と、利用者入力文話題特定情報に対応する各話題タイトル820とを照合し、各話題タイトル820の中から、第一形態素情報に最も適する話題タイトル820を検索するものである。
具体的に、省略文補完部330から検索命令信号が入力された話題検索部340は、入力された検索命令信号に含まれる利用者入力文話題特定情報及び第一形態素情報に基づいて、その利用者入力文話題特定情報に対応付けられた各話題タイトル820の中から、その第一形態素情報に最も適した話題タイトル820を検索する。話題検索部340は、その検索した話題タイトル820を検索結果信号として回答取得部350に出力する。
図13は、ある話題特定情報810(=「佐藤」)に対応付けされた話題タイトル820,回答文830の具体例を示す図である。図13に示すように、例えば、話題検索部340は、入力された第一形態素情報「佐藤、好き」に話題特定情報810(=「佐藤」)が含まれるので、その話題特定情報810(=「佐藤」)を特定し、次に、その話題特定情報810(=「佐藤」)に対応付けられた各話題タイトル(820)1-1,1-2,…と入力された第一形態素情報「佐藤、好き」とを照合する。
話題検索部340は、その照合結果に基づいて、各話題タイトル(820)1-1〜1-2の中から、入力された第一形態素情報「佐藤、好き」と一致する話題タイトル(820)1-1(佐藤;*;好き)を特定する。話題検索部340は、検索した話題タイトル(820)1-1(佐藤;*;好き)を検索結果信号として回答取得部350に出力する。
[回答取得部]
回答取得部350は、話題検索部340で検索された話題タイトル820に基づいて、その話題タイトル820に対応付けられた回答文830および感情フラグ840を取得する。また、回答取得部350は、話題検索部340で検索された話題タイトル820に基づいて、その話題タイトル820に対応付けられた各回答種類と、入力種類判定部440で判定された発話種類とを照合する。その照合をした回答取得部350は、各回答種類の中から、判定された発話種類と一致する回答種類を検索する。
図13に示すように、例えば、回答取得部350は、話題検索部340で検索された話題タイトル820が話題タイトル1-1(佐藤;*;好き)である場合には、その話題タイトル1-1に対応付けられている回答文1-1(DA,TAなどの拡開投手類語とに用意された回答文の集合)の中から、入力種類判定部440で判定された「発話文のタイプ」(例えばDA)と一致する回答種類(DA)に対応する回答文を特定する。この回答種類(DA)に対応する回答文を特定した回答取得部350は、特定した回答種類(DA)に対応付けされた回答文「私も佐藤が好きです。」を取得する。
ここで、上記"DA"、"TA"等のうち、"A"は、肯定形式を意味する。従って、発話種類及び回答種類に"A"が含まれているときは、ある事柄について肯定することを示している。また、発話種類及び回答種類には、"DQ"、"TQ"等の種類を含めることもできる。この"DQ"、"TQ"等のうち"Q"は、ある事柄についての質問を意味する。
回答種類が上記質問形式(Q)からなるときは、この回答種類に対応付けられる回答文は、肯定形式(A)で構成される。この肯定形式(A)で作成された回答文としては、質問事項に対して回答する文等が挙げられる。例えば、発話文が「あなたはスロットマシンを操作したことがありますか?」である場合には、この発話文についての発話種類は、質問形式(Q)となる。この質問形式(Q)に対応付けられる回答文は、例えば「私はスロットマシンを操作したことがあります」(肯定形式(A))が挙げられる。
一方、発話種類が肯定形式(A)からなるときは、この回答種類に対応付けられる回答文は、質問形式(Q)で構成される。この質問形式(Q)で作成された回答文としては、発話内容に対して聞き返す質問文、又は特定の事柄を聞き出す質問文等が挙げられる。例えば、発話文が「私はスロットマシンで遊ぶのが趣味です」である場合には、この発話文についての発話種類は、肯定形式(A)となる。この肯定形式(A)に対応付けられる回答文は、例えば"パチンコで遊ぶのは趣味ではないのですか?"(特定の事柄を聞き出す質問文(Q))が挙げられる。
回答取得部350は、取得した回答文830を回答文信号として管理部310に出力する。回答取得部350から回答文信号が入力された管理部310は、入力された回答文信号を出力部600に出力する。
出力部600は、回答取得部350で取得された回答文を出力するものである。この出力部600は、例えば、スピーカ、ディスプレイなどが挙げられる。具体的に、管理部310から回答文が入力された出力部600は、入力された回答文に基づいて、音声をもってその回答文、例えば、「私も佐藤が好きです」を出力する。
[新単語登録部]
次に、新単語登録部800について、図1,図14を参照しながら説明する。図14は、新単語登録部800の構成例を示す機能ブロック図である。
図1に示すように、新単語登録部800は、会話制御部300、会話データベース500とデータ交換可能に接続されているとともに、出力部600に出力可能に接続されている。
図14に示すように、新単語登録部800は、登録確認部1401と、この登録確認部1401に接続された意味問い合わせ部1402及び意味検証部1403と、意味問い合わせ部1402に接続された登録処理部1404とを有している。登録確認部1401,意味検証部1403,登録処理部1404は会話データベース500に接続されており、意味問い合わせ部1402,意味検証部1403は出力部600に接続されている。
[登録確認部]
登録確認部1401は、会話制御部300から渡された第一形態素情報を受け取り、この第一形態素情報に含まれる形態素が会話データベース500に話題特定情報810として登録されているか否か、及びその形態素が話題特定情報810として登録されている場合にその話題特定情報810の意味情報840(その形態素の定義、又は定義に相当する説明、解釈などをいう)が確定しているか否かを調べる。会話データベース500を調べた結果、その形態素が会話データベース500に話題特定情報810として未だ登録されていない場合は、登録確認部1401は意味問い合わせ部1402に意味問い合わせ処理を行うよう要求する。一方、その形態素が会話データベース500に話題特定情報810として登録されてはいるが、その意味情報が確定していない場合は、登録確認部1401は意味検証部1403にその話題特定情報(形態素)810の意味検証処理を行うよう要求する。
なお、ここで第一形態素情報に含まれる形態素であって、新単語登録部800の処理対象となる形態素は、第一特定情報1001に限定されてもよいし、第一から第三までのすべての特定情報1001〜1003を処理対象としてもよい。
[意味問い合わせ部、登録処理部]
意味問い合わせ部1402は、登録確認部1401から意味問い合わせ処理を行うよう要求されると、その形態素(話題特定情報)について、話者に意味を問い合わせる問い合わせ質問文を出力する。例えば、その形態素が「佐藤」であれば、意味問い合わせ部1402はその形態素「佐藤」と予め用意してある問い合わせ質問文テンプレートを用いて「佐藤って何ですか?」という問い合わせ質問文を生成する。生成された問い合わせ質問文は出力部600に渡され、出力部600により話者に提示される。
話者がこの問い合わせ質問文に対する回答を会話制御装置1に返すと、この回答は入力部100,音声認識部200、会話制御部300、文解析部400を介して新単語登録部800に渡される。登録確認部1401はこの回答を意味問い合わせ部1402にそのまま渡す。意味問い合わせ部1402は、この回答を登録確認部1401を介して受け取り、回答が前述の問い合わせ質問文に対する回答であるか否かを判定する。例えば「知らないな」「わからない」など回答でないものと判断した場合は、意味問い合わせ部1402は別の問い合わせ質問文を生成して、出力する。一方、それが回答であると判定した場合は、その話題特定情報(形態素)及び回答を登録処理部1404に渡す。登録処理部1404はその話題特定情報(形態素)及び回答を会話データベース500に新たな話題特定情報810及びその意味情報840として登録する。なお、この時点では意味情報840は確定した意味情報840ではなく、意味検証部1403の意味検証処理を受ける必要のある意味情報(未確定の意味情報)である。
[意味検証部]
意味検証部1403は、登録確認部1401から意味検証処理を行うよう要求されると、会話データベース500からその話題特定情報の意味情報840を取り出し、この意味情報の正否・適否を話者に問いただす検証質問文を生成、出力する。出力された検証質問文は出力部600に渡され、話者(ユーザ)に提示される。例えば、話題特定情報810が「佐藤」、その未確定の意味情報840が「ねばり強いバッティングで人気のプロ野球選手」として、会話データベース500に登録されている場合、意味検証部1403は「佐藤は、ねばり強いバッティングで人気のプロ野球選手ですよね?」という検証質問文を生成し、出力するように動作する。なお、その話題特定情報810について複数の未確定の意味情報840が存在している場合は、所定の条件を満たす一の意味情報840を選択して、検証質問文の生成を行う。「所定の条件」は例えば後述の肯定回数情報が最大であること、などである。
話者はこの検証質問文に対する回答を会話制御装置1に返すと、この回答は入力部100,音声認識部200、会話制御部300、文解析部400を介して新単語登録部800に渡される。登録確認部1401はこの回答を意味検証部1403にそのまま渡す。意味検証部1403は、この回答を登録確認部1401を介して受け取り、回答が前述の検証質問文に対する肯定か否かを判定する。例えば回答として受け取った話者の発話が「そうだよ」「うん」「YES」などであれば肯定と判定して、前述の意味情報の肯定回数情報を増加するよう会話データベース500を更新する。一方、肯定でないと判定した場合は、その意味情報の肯定回数を増加させないか、或いは減少させるよう会話データベース500を更新する。
[2.会話制御装置の動作(会話制御方法の実行)]
上記構成を有する会話制御装置1が動作することにより会話制御方法が実行されることとなる。図15は、本実施の形態に係る会話制御装置1の動作により実行される会話制御方法の手順を示すフロー図である。
先ず、入力部100が、利用者からの発話内容を取得するステップを行う(ステップS1501)。具体的には、入力部100は、利用者の発話内容を構成する音声を取得する。入力部100は、取得した音声を音声信号として音声認識部200に出力する。なお、入力部100は、利用者からの音声ではなく、利用者から入力された文字列(例えば、テキスト形式で入力された文字データ)を取得してもよい。
次いで、音声認識部200が、入力部100で取得した発話内容に基づいて、発話内容に対応する文字列を特定するステップを行う(ステップS1502)。具体的には、入力部100から音声信号が入力された音声認識部200は、入力された音声信号に基づいて、その音声信号に対応する単語仮説(候補)を特定する。音声認識部200は、特定した単語仮説(候補)に対応付けられた文字列を取得し、取得した文字列を文字列信号として会話制御部300に出力する。
そして、文字列特定部410が、音声認識部200で特定された一連の文字列を一文毎に区切るステップを行う(ステップS1503)。具体的には、管理部310から文字列信号(あるいは形態素信号)が入力された文字列特定部410は、その入力された一連の文字列の中に、ある一定以上の時間間隔があるときは、その部分で文字列を区切る。文字列特定部410は、その区切った各文字列を形態素抽出部420及び入力種類判定部440に出力する。なお、文字列特定部410は、入力された文字列がキーボードから入力された文字列である場合には、句読点又はスペース等のある部分で文字列を区切るのが好ましい。
その後、形態素抽出部420が、文字列特定部410で特定された文字列に基づいて、文字列の最小単位を構成する各形態素を第一形態素情報として抽出するステップを行う(ステップS1504)。具体的に、文字列特定部410から文字列が入力された形態素抽出部420は、入力された文字列と、形態素データベース430に予め格納されている形態素群とを照合する。なお、その形態素群は、本実施の形態では、それぞれの品詞分類に属する各形態素について、その形態素の見出し語・読み・品詞・活用形などを記述した形態素辞書として準備されている。
この照合をした形態素抽出部420は、入力された文字列の中から、予め記憶された形態素群に含まれる各形態素と一致する各形態素(m1,m2、…)を抽出する。形態素抽出部420は、抽出した各形態素を第一形態素情報として管理部310に出力する。管理部310は、第一形態素情報を新単語登録部800に渡す。
新単語登録部800は、第一形態素情報に含まれる形態素が話題特定情報810として登録済みであり、且つその意味情報840が確定しているかを判定する(ステップS1505)。
形態素が話題特定情報810として登録されていないか、又は形態素が話題特定情報810として登録されているがその意味情報840が確定してしない場合は、新単語登録部800は新単語登録処理を実行する(ステップS1506)。図16に、新単語登録処理の処理例を示す。
まず、新単語登録部800は、第一形態素情報の全部又は一部を入力として受け付ける(ステップS1600)。
ステップ1506における判定の結果、この第一形態素情報に含まれる形態素が会話データベース500に話題特定情報810として未だ登録されていない場合(ステップS1601、NO)は、新単語登録部800は意味問い合わせ処理を行う(ステップS1602)。すなわち、新単語登録部800はその形態素(話題特定情報)について、話者に意味を問い合わせる問い合わせ質問文を出力する。生成された問い合わせ質問文は出力部600に渡され、出力部600により話者に提示される。
話者がこの問い合わせ質問文に対する回答を会話制御装置1に返すと、この回答は入力部100,音声認識部200、会話制御部300、文解析部400を介して新単語登録部800に渡され、返答受付処理(ステップS1603)が行われる。
新単語登録部800は、返答受付処理(ステップS1603)において取得した回答が前述の問い合わせ質問文に対する回答であるか否かを判定し、回答でないものと判断した場合(ステップS1604、NO)は、新単語登録部800は別の問い合わせ質問文を生成して、出力し、(ステップS1602)、さらに返答受付を行う(ステップS1603)。一方、それが回答であると判定した場合(ステップS1604、YES)は、その話題特定情報(形態素)及び回答を会話データベース500に新たな話題特定情報810及びその意味情報840として登録する(ステップS1605)。この後図15に示すフローに戻り、ステップS1501において受け付けた発話についての会話制御処理を終了する。
一方、ステップS1601においてその形態素が会話データベース500に話題特定情報810として登録されてはいるが、その意味情報が確定していない場合(ステップS1601、YES)は、新単語登録部800は、その話題特定情報(形態素)810の意味検証処理を行う。すなわち、新単語登録部800は会話データベース500の記憶内容を参照して、話題特定情報(形態素)810の意味情報を読み取り、最もYESと回答された回数が多い意味情報文、すなわち肯定回数情報が最大である意味情報文を検証質問文として取得する(ステップS1606)。図17は、ある話題特定情報810であって、意味情報840が未確定の状態である話題特定情報810のデータ構成を示している。この例では、意味情報は複数の意味情報文1701,1702,1703、…が登録されている。意味情報文1701,1702,1703、…にはそれぞれ、YESと回答された回数を示す肯定回数情報「10」、「7」、「3」、…が記憶されている。この例では、ステップS1606で選択される意味情報文は、意味情報文1701「ねばり強いバッティングで人気のプロ野球選手」が選択され、検証質問文の生成に用いられる。
図16に戻り新単語登録処理の説明を続ける。ステップS1606で出された検証質問文に対して話者が回答を会話制御装置1に返すと、この回答は入力部100,音声認識部200、会話制御部300、文解析部400を介して新単語登録部800に渡され、返答受付処理(ステップS1607)が行われる。
新単語登録部800はこの回答が検証質問文の内容を肯定しているか否かを判定し(ステップS1608)、肯定していると判定する場合(ステップS1608、YES)は、新単語登録部800は、ステップS1606において選択された意味情報文の肯定回数情報をインクリメントするよう、会話データベース500の内容を更新する(ステップS1609)。例えば、意味情報文1701について肯定された場合、その肯定回数情報「10」は「11」に更新されることとなる。ステップS1609の実行後、図15に示すフローに戻り、ステップS1501において受け付けた発話についての会話制御処理を終了する。
一方、ステップS1608において、肯定していないと判定した場合(ステップS1608、NO)は、新単語登録部800は、その話題特定情報810についての別の意味情報文を取得するよう、ステップS1602からステップS1605の処理を行う。ここで新たに取得された意味情報文は、意味情報840に追加されて登録される。ステップS1605の処理実行後、図15に示すフローに戻り、ステップS1501において受け付けた発話についての会話制御処理を終了する。
以上で新単語登録処理(ステップ1507)の説明を終了する。
続いて、図15に戻り、会話制御処理の残りの部分について説明する。
ステップS1506において、第一形態素情報に含まれる形態素が話題特定情報810として登録済みであり、且つその意味情報840が確定していると判定される場合(ステップS1506、YES)は、新単語登録部800は会話制御部300の管理部300に、会話制御処理を続行するよう要求する。この要求に応じて管理部310は、文解釈部400に発話文のタイプの判定を行うよう要求するとともに、第一形態素情報を話題特定情報検索部320に渡す。
発話文のタイプの判定を行うよう要求されると、文解釈部400の入力種類判定部440が、文字列特定部410で特定された一文を構成する各形態素に基づいて、「発話文のタイプ」を判定するステップを行う(ステップS1507)。具体的には、文字列特定部410から文字列が入力された入力種類判定部440は、入力された文字列に基づいて、その文字列と発話種類データベース450に格納されている各辞書とを照合し、その文字列の中から、各辞書に関係する要素を抽出する。この要素を抽出した入力種類判定部440は、抽出した要素に基づいて、その要素がどの「発話文のタイプ」に属するのかを判定する。入力種類判定部440は、判定した「発話文のタイプ」(発話種類)を回答取得部350に出力する。
そして、話題特定情報検索部320が、形態素抽出部420で抽出された第一形態素情報と着目話題タイトル820focusとを比較するステップを行う(ステップS1508)。
第一形態素情報を構成する形態素と着目話題タイトル820focusとが一致する場合、話題特定情報検索部320は、その話題タイトル820を回答取得部350に出力する。一方、話題特定情報検索部320は、第一形態素情報を構成する形態素と話題タイトル820とが一致しなかった場合には、入力された第一形態素情報及び利用者入力文話題特定情報を検索命令信号として省略文補完部330に出力する。
その後、省略文補完部330が、話題特定情報検索部320から入力された第一形態素情報に基づいて、着目話題特定情報及び回答文話題特定情報を、入力された第一形態素情報に含め、省略文を保管するステップを行う(ステップS1509)。具体的には、第一形態素情報を「W」、着目話題特定情報及び回答文話題特定情報の集合を「D」とすると、省略文補完部330は、第一形態素情報「W」に話題特定情報「D」の要素を含めて、補完された第一形態素情報を生成し、この補完された第一形態素情報と集合「D」に関連づけされたすべての話題タイトル820とを照合し、補完された第一形態素情報と一致する話題タイトル820があるか検索する。補完された第一形態素情報と一致する話題タイトル820がある場合は、省略文補完部330は、その話題タイトル820を回答取得部350に出力する。一方、補完された第一形態素情報と一致する話題タイトル820を発見しなかった場合は、省略文補完部330は、第一形態素情報と利用者入力文話題特定情報とを話題検索部340に渡す。
次いで、話題検索部340は、第一形態素情報と、利用者入力文話題特定情報とを照合し、各話題タイトル820の中から、第一形態素情報に適した話題タイトル820を検索するステップを行う(ステップS1510)。具体的には、省略文補完部330から検索命令信号が入力された話題検索部340は、入力された検索命令信号に含まれる利用者入力文話題特定情報及び第一形態素情報に基づいて、その利用者入力文話題特定情報に対応付けられた各話題タイトル820の中から、その第一形態素情報に適した話題タイトル820を検索する。話題検索部340は、その検索の結果得られた話題タイトル820を検索結果信号として回答取得部350に出力する。
次いで、回答取得部350が、話題特定情報検索部320、省略文補完部330,あるいは話題検索部340で検索された話題タイトル820に基づいて、判定された利用者の発話種類と話題タイトル820に対応付けられた各回答種類とを照合する。この照合をした回答取得部350は、各回答種類の中から、判定された発話種類と一致する回答種類を検索する(ステップS1511)。
具体的に、話題検索部340から検索結果信号と、入力種類判定部440から「発話文のタイプ」とが入力された回答取得部350は、入力された検索結果信号に対応する「話題タイトル」と、入力された「発話文のタイプ」とに基づいて、その「話題タイトル」に対応付けられている回答種類群の中から、「発話文のタイプ」(DAなど)と一致する回答種類を特定する。
この回答取得部350は、会話データベース500から、特定した回答種類に対応付けられた回答文830を取得する。回答取得部350は、管理部310を介して、取得した回答文830を出力部600に出力する。管理部310から回答文が入力された出力部600は、入力された回答文830を出力する(ステップS1512)。
[3.利点]
本会話制御装置1によれば、会話制御装置1が話者と会話を行うことにより、自動的に会話データベース500の記憶内容に新しい単語、言葉が追加蓄積されるため、オペレータの単語の意味の入力作業を必要とすることなく、会話データベース500の記憶内容の向上を図ることが可能となる。
[4.変形例]
(1) 会話制御装置1の音声認識部200、会話制御部300、文解析部400の構成及び動作は、第1の実施の形態において説明したものに限られず、会話データベース手段を利用して利用者の発話内容に応じた回答を返すものであれば、第1の実施の形態において説明したもの以外のどのような音声認識部200、会話制御部300、文解析部400であっても、本発明に係る会話制御装置1の構成要素として使用可能である。
(2) 上記実施の形態の説明では、会話制御装置1への発話の入力は音声によるものとして説明したが、会話制御装置1への発話の入力は音声に限られるものではなく、キーボード、タッチパネル、ポインティングデバイスなどの文字入力手段による文字列データとして会話制御装置1へ発話を入力し、会話制御装置1がこの文字列データとして入力された発話に対して会話データベース500を用いて回答文を出力する構成としても本発明は成立する。
[5.その他]
上記実施の形態では、特定話題情報810及びその意味情報文840を自動的に登録するものとしたが、これらに加えて話題タイトル820、回答文830を話者の発話から抽出して会話制御装置1が自動的に登録する構成としてもよいし、或いは特定話題情報810及びその意味情報文840のみ会話制御装置1が自動的に登録し、のちにオペレータが登録された特定話題情報810及びその意味情報文840を参照して話題タイトル820、回答文830を追加するようにしてもよい。
会話制御装置の構成例を示す機能ブロック図 音声認識部の構成例を示す機能ブロック図 単語仮説絞込部の処理を示すタイミングチャート 音声認識部の動作例を示すフロー図 会話制御装置の部分拡大ブロック図 文字列とこの文字列から抽出される形態素との関係を示す図 「発話文のタイプ」と、その発話文のタイプを表す二文字のアルファベット、及びその発話文のタイプに該当する発話文の例を示す図 文のタイプとそのタイプを判定するための辞書の関係を示す図 会話データベースが記憶するデータのデータ構成の一例を示す概念図 ある話題特定情報と他の話題特定情報との関連付けを示す図 話題タイトル(「第二形態素情報」ともいう)のデータ構成例を示す図 回答文のデータ構成例を説明するための図 ある話題特定情報に対応付けされた話題タイトル,回答文の具体例を示す図 新単語登録部の構成例を示す機能ブロック図 会話制御方法の手順例を示すフロー図 新単語登録処理の手順例を示すフロー図 未確定の意味情報のデータ構成例を示す図
符号の説明
1 … 会話制御装置
100 … 入力部
200 … 音声認識部
300 … 会話制御部
400 … 文解析部
500 … 会話データベース
600 … 出力部
700 … 音声認識辞書記憶部
800 … 新単語登録部
1401 … 登録確認部
1402 … 意味問い合わせ部
1403 … 意味検証部
1404 … 登録処理部

Claims (10)

  1. ユーザからの発話に応答する回答を出力することが可能な会話制御装置において、
    複数の話題特定情報を記憶する会話データベース手段と、
    従前の会話及び従前の回答により定まる談話履歴を記憶し、この談話履歴により定まる話題特定情報と発話情報とを照合して回答文を選択する会話制御手段と、
    ユーザの発話に含まれる語が、前記会話データベース手段に記憶された話題特定情報の内いずれにも相当しない場合、その語を新たな話題特定情報として会話データベース手段に記憶させるとともに、ユーザにその語の意味を質問する文を出力し、ユーザから返された返答をその話題特定情報に対応する意味情報文として会話データベース手段に記憶させる新単語登録手段と、
    を有し、
    前記新単語登録手段は、前記会話データベース手段に記憶された話題特定情報に関する意味情報の正否をユーザに問い質す検証質問文を生成して出力する処理を含み、該検証質問文を生成する際に、その話題特定情報について記憶された複数の意味情報文のうちの1つを選択して使用し、ユーザがこの検証質問文に対して肯定する返答を返した場合には、選択したその意味情報文の信頼度を示す数値を増加させ、次回検証質問文を生成する場合には、信頼度を示す数値が最も大きい意味情報文を選択することを特徴とする会話制御装置。
  2. ユーザからの発話に応答する回答を出力することが可能な会話制御装置において、
    複数の話題特定情報を記憶する会話データベース手段と、
    従前の会話及び従前の回答により定まる談話履歴を記憶し、この談話履歴により定まる話題特定情報と発話情報とを照合して回答文を選択する会話制御手段と、
    ユーザの発話に含まれる語が、前記会話データベース手段に記憶された話題特定情報の内いずれにも相当しない場合、その語を新たな話題特定情報として会話データベース手段に記憶させるとともに、ユーザにその語の意味を質問する文を出力し、ユーザから返された返答をその話題特定情報に対応する意味情報文として会話データベース手段に記憶させる新単語登録手段と、
    を有し、
    前記新単語登録手段は、前記会話データベース手段に記憶された話題特定情報に関する意味情報の正否をユーザに問い質す検証質問文を生成して出力する処理を含み、該検証質問文を生成する際に、その話題特定情報について記憶された複数の意味情報文のうちの1つを選択して使用し、ユーザがこの検証質問文に対して否定する返答を返した場合には、その話題特定情報の意味を問い質すための問い合わせ質問文を生成し、ユーザがこの問い合わせ質問文に対する返答を返した場合に、その返答をその話題特定情報の新たな意味情報文として会話データベース手段に記憶させることを特徴とする会話制御装置。
  3. 前記新単語登録手段は、ユーザの発話に含まれる語が前記会話データベース手段に話題特定情報として記憶されているか否かを確認するとともに、ユーザの発話に含まれる語が前記会話データベース手段に話題特定情報として記憶されている場合にその話題特定情報の意味情報が確定しているか否かを確認する登録確認部と、ユーザの発話に含まれる語が前記会話データベース手段に話題特定情報として記憶されていないことが前記登録確認部で確認される場合にその話題特定情報の意味を問い質すための問い合わせ質問文を出力する意味問い合わせ部と、会話データベース手段に記憶される話題特定情報の意味情報が確定していない場合にその意味情報を前記会話データベース手段から取り出してその意味情報の正否をユーザに問い質す検証質問文を出力する意味検証部とを有し、前記意味情報が確定しているか否かは、前記話題特定情報を構成する1つの文字、複数の文字列又はこれらの組み合わせからなる形態素の定義、または、その定義に相当する説明、解釈が確定しているか否かを調べることによって確認されることを特徴とする請求項1または請求項2に記載の会話制御装置。
  4. ユーザからの発話を受け付ける入力手段と、
    前記入力手段により受け付けられたユーザからの発話を当該ユーザからの発話情報として受け取って認識する認識部と、
    前記ユーザからの発話情報を、1つの文字、複数の文字列又はこれらの組み合わせからなる形態素に抽出する形態素抽出部と、
    を更に備え、
    前記会話制御手段は、ユーザとの間の会話の話題や主題を特定する情報である談話履歴を記憶する手段を有し、
    前記会話データベース手段は、前記形態素により構成され且つユーザへの回答文を対応付けて成る話題タイトルが対応付けられるとともに前記談話履歴により定まる複数の話題特定情報を記憶し、
    前記会話制御手段は、前記形態素抽出部で抽出された形態素情報と前記会話データベース手段に記憶された話題特定情報とを照合し、各話題特定情報の中から形態素情報を構成する形態素と一致する話題特定情報を選択することによりユーザに対する前記回答文を選択する手段を有し、
    前記新単語登録手段は、前記形態素抽出部で抽出された形態素情報が、前記会話データベース手段に記憶された話題特定情報の内いずれにも相当しない場合、その語を、回答文および話題タイトルが対応付けられることになる新たな話題特定情報として会話データベース手段に記憶させるとともに、ユーザにその語の意味を質問する文を出力し、ユーザから返された返答をその話題特定情報に対応する意味情報文として会話データベース手段に記憶させることを特徴とする請求項1ないし請求項3のいずれか1項に記載の会話制御装置。
  5. 前記新単語登録手段は、ユーザが前記検証質問文に対して否定する返答を返した場合、その話題特定情報の意味を問い質すための問い合わせ質問文を生成し、ユーザがこの問い合わせ質問文に対する返答を返した場合に、その返答をその話題特定情報の新たな意味情報文として会話データベース手段に記憶させることを特徴とする請求項4に記載の会話制御装置。
  6. 前記新単語登録手段は、ユーザの発話に含まれる語が前記会話データベース手段に話題特定情報として記憶されているか否かを確認するとともに、ユーザの発話に含まれる語が前記会話データベース手段に話題特定情報として記憶されている場合にその話題特定情報の意味情報が確定しているか否かを確認する登録確認部と、ユーザの発話に含まれる語が前記会話データベース手段に話題特定情報として記憶されていないことが前記登録確認部で確認される場合にその話題特定情報の意味を問い質すための問い合わせ質問文を出力する意味問い合わせ部と、会話データベース手段に記憶される話題特定情報の意味情報が確定していない場合にその意味情報を前記会話データベース手段から取り出してその意味情報の正否をユーザに問い質す検証質問文を出力する意味検証部とを有し、前記意味情報が確定しているか否かは、前記話題特定情報を構成する1つの文字、複数の文字列又はこれらの組み合わせからなる形態素の定義、または、その定義に相当する説明、解釈が確定しているか否かを調べることによって確認されることを特徴とする請求項4または請求項5に記載の会話制御装置。
  7. ユーザからの発話を受け付ける入力手段と、ユーザからの発話に応答する回答文を出力する会話処理部とを有し、前記会話処理部が、ユーザと会話処理部との間の会話の話題や主題を特定する情報である談話履歴を記憶する手段を有し、1つの文字、複数の文字列又はこれらの組み合わせからなる形態素により構成され且つユーザへの回答文を対応付けて成る話題タイトルが対応付けられるとともに前記談話履歴により定まる複数の話題特定情報を記憶する会話データベース手段が更に設けられて成る会話制御装置を用いた会話制御方法において、
    前記入力手段に接続された認識部が、前記入力手段により受け付けられたユーザからの発話を当該ユーザからの発話情報として受け取って認識するステップと、
    前記会話処理部の形態素抽出部が、前記ユーザからの発話情報を、1つの文字、複数の文字列又はこれらの組み合わせからなる形態素に抽出するステップと、
    前記会話処理部および前記会話データベース手段に接続された新単語登録手段が、前記形態素抽出部で抽出された形態素情報が前記会話データベース手段に記憶された話題特定情報の内いずれにも相当しない場合に、その語を、回答文および話題タイトルが対応付けられることになる新たな話題特定情報として会話データベース手段に記憶させるとともに、ユーザにその語の意味を質問する文を出力し、ユーザから返された返答をその話題特定情報に対応する意味情報文として会話データベース手段に記憶させるステップと、
    を含み、
    前記新単語登録手段は、前記会話データベース手段に記憶された話題特定情報に関する意味情報の正否をユーザに問い質す検証質問文を生成して出力する処理を含み、該検証質問文を生成する際に、その話題特定情報について記憶された複数の意味情報文のうちの1つを選択して使用し、ユーザがこの検証質問文に対して肯定する返答を返した場合には、選択したその意味情報文の信頼度を示す数値を増加させ、次回検証質問文を生成する場合には、信頼度を示す数値が最も大きい意味情報文を選択することを特徴とする会話制御方法。
  8. ユーザからの発話を受け付ける入力手段と、ユーザからの発話に応答する回答文を出力する会話処理部とを有し、前記会話処理部が、ユーザと会話処理部との間の会話の話題や主題を特定する情報である談話履歴を記憶する手段を有し、1つの文字、複数の文字列又はこれらの組み合わせからなる形態素により構成され且つユーザへの回答文を対応付けて成る話題タイトルが対応付けられるとともに前記談話履歴により定まる複数の話題特定情報を記憶する会話データベース手段が更に設けられて成る会話制御装置を用いた会話制御方法において、
    前記入力手段に接続された認識部が、前記入力手段により受け付けられたユーザからの発話を当該ユーザからの発話情報として受け取って認識するステップと、
    前記会話処理部の形態素抽出部が、前記ユーザからの発話情報を、1つの文字、複数の文字列又はこれらの組み合わせからなる形態素に抽出するステップと、
    前記会話処理部および前記会話データベース手段に接続された新単語登録手段が、前記形態素抽出部で抽出された形態素情報が前記会話データベース手段に記憶された話題特定情報の内いずれにも相当しない場合に、その語を、回答文および話題タイトルが対応付けられることになる新たな話題特定情報として会話データベース手段に記憶させるとともに、ユーザにその語の意味を質問する文を出力し、ユーザから返された返答をその話題特定情報に対応する意味情報文として会話データベース手段に記憶させるステップと、
    を含み、
    前記新単語登録手段は、前記会話データベース手段に記憶された話題特定情報に関する意味情報の正否をユーザに問い質す検証質問文を生成する処理を含み、該検証質問文を生成する際に、その話題特定情報について記憶された複数の意味情報文のうちの1つを選択して使用し、ユーザがこの検証質問文に対して否定する返答を返した場合には、その話題特定情報の意味を問い質すための問い合わせ質問文を生成し、ユーザがこの問い合わせ質問文に対する返答を返した場合に、その返答をその話題特定情報の新たな意味情報文として会話データベース手段に記憶させることを特徴とする記載の会話制御方法。
  9. 前記形態素抽出部で抽出された形態素情報が前記会話データベース手段に記憶されている場合には、
    前記会話処理部の話題特定情報検索部が、前記形態素抽出部で抽出された形態素情報と前記会話データベース手段に記憶された話題特定情報とを照合し、各話題特定情報の中から形態素情報を構成する形態素と一致する話題特定情報を検索するステップと、
    前記会話処理部の回答取得部が、話題特定情報検索部で検索された話題特定情報に対応付けられた回答文を取得するステップと、
    を更に含むことを特徴とする請求項7または請求項8に記載の会話制御方法。
  10. 請求項7ないし請求項9のいずれか1項に記載の処理をコンピュータに実行させるためのプログラム。
JP2003393282A 2003-11-25 2003-11-25 会話制御装置、会話制御方法並びにこれらのプログラム Expired - Fee Related JP4475628B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003393282A JP4475628B2 (ja) 2003-11-25 2003-11-25 会話制御装置、会話制御方法並びにこれらのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003393282A JP4475628B2 (ja) 2003-11-25 2003-11-25 会話制御装置、会話制御方法並びにこれらのプログラム

Publications (2)

Publication Number Publication Date
JP2005157602A JP2005157602A (ja) 2005-06-16
JP4475628B2 true JP4475628B2 (ja) 2010-06-09

Family

ID=34719683

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003393282A Expired - Fee Related JP4475628B2 (ja) 2003-11-25 2003-11-25 会話制御装置、会話制御方法並びにこれらのプログラム

Country Status (1)

Country Link
JP (1) JP4475628B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008139924A (ja) * 2006-11-30 2008-06-19 Tamotsu Koyama 記憶ストックシステム
US8566097B2 (en) * 2009-06-02 2013-10-22 Honda Motor Co., Ltd. Lexical acquisition apparatus, multi dialogue behavior system, and lexical acquisition program
JP5993421B2 (ja) * 2014-09-22 2016-09-14 ソフトバンク株式会社 会話処理システム及びプログラム
JP2016126452A (ja) * 2014-12-26 2016-07-11 株式会社小学館ミュージックアンドデジタルエンタテイメント 会話処理ステム、会話処理方法、及び会話処理プログラム
CN109791766A (zh) * 2016-10-06 2019-05-21 夏普株式会社 对话装置、对话装置的控制方法及控制程序
JP6134043B1 (ja) * 2016-11-04 2017-05-24 株式会社カプコン 音声生成プログラムおよびゲーム装置
CN113535926B (zh) * 2021-07-26 2023-11-10 深圳市优必选科技股份有限公司 主动对话方法、装置及语音终端

Also Published As

Publication number Publication date
JP2005157602A (ja) 2005-06-16

Similar Documents

Publication Publication Date Title
JP4849663B2 (ja) 会話制御装置
JP4846336B2 (ja) 会話制御装置
JP4849662B2 (ja) 会話制御装置
JP4888996B2 (ja) 会話制御装置
US11380330B2 (en) Conversational recovery for voice user interface
JP2007114621A (ja) 会話制御装置
US10917758B1 (en) Voice-based messaging
US7415406B2 (en) Speech recognition apparatus, speech recognition method, conversation control apparatus, conversation control method, and programs for therefor
KR100577387B1 (ko) 음성 대화 시스템에서의 음성 인식 오류 처리 방법 및 장치
EP2317507B1 (en) Corpus compilation for language model generation
JP2005157494A (ja) 会話制御装置及び会話制御方法
US11195522B1 (en) False invocation rejection for speech processing systems
JP2003036093A (ja) 音声入力検索システム
JP2002524776A (ja) 音声認識および自然言語処理を使用した対話型ユーザ・インタフェース
Furui Recent progress in corpus-based spontaneous speech recognition
Moyal et al. Phonetic search methods for large speech databases
JP2004198597A (ja) 音声認識装置および文分類装置としてコンピュータを動作させるコンピュータプログラム、階層化された言語モデルを作成する方法を実現する様にコンピュータを動作させるコンピュータプログラム、および記憶媒体
JP4475628B2 (ja) 会話制御装置、会話制御方法並びにこれらのプログラム
Huang et al. Spoken document retrieval using multilevel knowledge and semantic verification
JP2005275348A (ja) 音声認識方法、この方法を実施する装置、プログラムおよび記録媒体
JP4204044B2 (ja) ゲーム機、ゲームの実行方法、並びにこれらのためのプログラム
JP4204043B2 (ja) ゲーム機、ゲームの実行方法、並びにプログラム
JP2005122549A (ja) 会話制御装置及び会話制御方法
JP4204042B2 (ja) ゲーム機、ゲームの実行方法、並びにプログラム
JP4204041B2 (ja) ゲーム機、ゲームの実行方法、並びにプログラム

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20060811

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061013

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080204

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080404

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081104

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081226

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090928

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091225

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20100113

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100304

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100308

R150 Certificate of patent or registration of utility model

Ref document number: 4475628

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130319

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130319

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140319

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees