JPH1031497A

JPH1031497A - 音声対話制御方法および音声対話システム

Info

Publication number: JPH1031497A
Application number: JP8189060A
Authority: JP
Inventors: Toshiyuki Odaka; 俊之小高; Zuhaeru Toraberushi; ズハエルトラベルシ; Akio Amano; 明雄天野; Nobuo Hataoka; 信夫畑岡
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1996-07-18
Filing date: 1996-07-18
Publication date: 1998-02-03
Anticipated expiration: 2016-07-18
Also published as: JP3700266B2

Abstract

(57)【要約】（修正有）【課題】対話的な音声データ入力では、文単位に認識
するシステムでは誤認識時の再入力の認識に高いレベル
が要求され、また再入力時の誘導が困難である。単語認
識のシステムでは必要なやりとりが長くなる。【解決手段】次にすべきガイダンスの内容（例えば所
属の質問）と最新のキーワード（なし）とから質問文が
生成され、質問“所属をどうぞ”が生成される。回答の
音声認識の際には「所属」を認識するための認識語彙が
補足される。認識結果はキーワード（「資材課」）であ
るかコマンド（「違います」）であるか判別され、キー
ワード（「資材課」）の場合はスタックに置かれる。次
のガイダンス内容（名前の質問）とＰＯＰされた最新の
キーワード（「資材課」）とから次の質問“資材課の誰
ですか”が生成される。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、情報検索などを行
なうために利用する計算機システムに係り、特に、マイ
クとスピーカあるいは電話などの音声入出力インタフェ
ースを備え、誰でも容易に利用することができる音声対
話システムに関するものである。

【０００２】

【従来の技術】音声対話システムでは一般に、利用者の
システムに対するデータ入力において音声認識の技術を
用いている。音声によるデータ入力は、電話を通して使
う場合、あるいは車の運転中などのいわゆるハンズアイ
ビジーの状況下使う場合、非常に有効である。

【０００３】普通は複数の項目（例えば、電話番号検索
のアプリケーションでは相手の所属と名前、チケットの
予約のアプリケーションでは月日、時間、大人または子
供、枚数等）に対してデータを入力する。しかし一方、
音声認識において１００％の認識率を実現することは不
可能であり、利用者の入力に対して、入力項目毎にシス
テムの認識結果を確認することが必須である。例えば、
文または文節単位の音声認識が可能な音声対話システム
での対話例は、システム：「相手の所属と名前をどうぞ」利用者：「資材課の佐藤さん」システム：「資材課の佐藤ですね」利用者：「はい」となる。この例のように、文または文節単位の音声認識
が可能なシステムで認識が正しく行われた場合は、入力
時間も短く利用効率が良くなる。しかし、文または文節
単位の認識の場合、複数のキーワード（ここでの例では
相手の所属と名前）の組合せ分だけ認識対象の種類が多
くなるばかりでなく、助詞も含めた表現のバラエティが
多様になるという点で、単語認識に比較して認識性能が
低くなる。さらに、認識を間違えた場合は、次のような
問題も発生する。

【０００４】システム：「相手の所属と名前をどうぞ」利用者：「資材課の佐藤さん」システム：「資材課の加藤ですね」利用者：「いいえ」システム：「相手の所属と名前をどうぞ」最初のシステムの質問に、所属と名前という２つのキー
ワードが含まれている。この場合、システム側でこのや
りとりだけからでは、利用者が否定したことが所属と名
前のどちらか片方だけを誤認識したことを意味するの
か、あるいは両方誤認識したことを意味するのか、が特
定できない。したがって、所属と名前の両方のキーワー
ドが正しく認識されるまで、同じ質問を繰り返すことに
なる。この場合は、時間がかかるという問題がある。ま
た別な対処方法として、利用者に誤認識された方だけ再
入力してもらう方法も考えられる。この場合は、所属か
名前かわからない発声を認識しなければならないので、
音声認識の性能に対する要求が現状で対応可能なレベル
より高くなるという問題がある上、そのように利用者の
発声を誘導するにはどうすれば良いかという、解決が非
常に困難な課題が生じる。

【０００５】これに対して、単語認識の場合は認識対象
の表現のバラエティが抑えられ、現状レベルでもほぼ満
足のいく認識性能が得られる。また、項目を１つずつ質
問し、確認するために、確実に１項目ずつのデータ入力
が行える。例えば、次のようになる。

【０００６】システム：「相手の所属をどうぞ」利用者：「資材課」システム：「資材課ですか」利用者：「はい」システム：「相手の名前をどうぞ」利用者：「佐藤」システム：「佐藤ですか」利用者：「はい」ただし、ここに示したようにやりとりが長くなり全体に
時間がかかる傾向になるという大きな問題が残る。

【０００７】

【発明が解決しようとする課題】上記のような従来の音
声対話システムにおいて、現状の音声認識性能と時間的
な利用効率は相反するパラメータであった。

【０００８】本発明の目的は、現状で可能な音声認識性
能の範囲で、最も効率良くデータ入力が行え、利用者と
システムとの間で円滑な対話を実現できる音声対話シス
テムを提供することにある。

【０００９】

【課題を解決するための手段】本発明によれば、以下の
ような手段による対話制御方法および以下のような手段
を設けた音声対話システムが提供される。

【００１０】タスク管理手段に要求を出しその返答結果
に応じて、応答生成手段、認識語彙補足手段、キーワー
ド判定手段、およびキーワード保持手段を制御し、また
認識語彙補足手段を介して音声認識手段を、さらに応答
生成手段を介して音声合成手段を制御し、システムと利
用者の間の対話を進行させる対話制御手段の元で、前記
キーワード保持手段は、前記対話制御手段の要求に基づ
き、キーワードの保持、削除、最新のキーワードの通知
を行い、前記対話制御手段は、タスク管理手段に対話の
進行上における次のアクションを促すガイダンス内容を
要求して該ガイダンス内容を受け取り、また前記キーワ
ード保持手段に最新のキーワードを要求して該最新のキ
ーワードを受け取り、前記ガイダンス内容と前記最新の
キーワード、およびそれらを用いて応答文を生成させる
指示を応答生成手段へ通知し、前記応答生成手段は、前
記対話制御手段から受け取った指示に従い、対話の進
行上における次のアクションを促すガイダンス文の中
に、同時に受け取った前段階の認識結果でもある最新の
キーワードを含めた応答文を生成し、音声合成手段へ出
力し、次に前記対話制御手段は、タスク管理手段に対話
の進行上における次の認識語彙を要求して該認識語彙を
受け取り、タスクに依存したキーワードからなる該認識
語彙を認識語彙補足手段へ送り、前記認識語彙補足手段
は、前記対話制御手段より受け取った認識語彙に、「取
消」「ヘルプ」「ストップ」「もう一度」「わからな
い」「任意」などのタスクから独立なコマンドを表す単
語を補足して、音声認識手段およびキーワード判定手段
に渡し、前記キーワード判定手段は、前記認識語彙補足
手段より得た補足後の認識語彙と前記音声認識手段より
得た認識結果とを比較し、該認識結果が前記タスクから
独立なコマンドか、タスクに依存したキーワードかを判
定し、その判定結果を対話制御手段へ送り、さらに次に
前記対話制御手段は、前記キーワード判定手段の判定結
果を元に、該判定結果がキーワードである場合は、それ
をキーワード保持手段に送ると共に該キーワードをタス
ク管理手段に送り、前記判定結果がコマンドである場
合は、各コマンドに対する処理を行う。

【００１１】

【発明の実施の形態】以下図を用いて本発明の実施例を
説明する。

【００１２】図１は本発明による音声対話システムの一
実施例を示すブロック図である。音声対話システムは、
あるタスクを遂行することを目的として、利用者とシス
テムが音声を使ってやりとりをするようなシステムであ
る。本発明による音声対話システムは、対話制御手段
（５）の制御の元に動作する。対話制御手段（５）の動
作については、後で詳述する。

【００１３】タスク管理手段（１０）は、タスクに依存
した処理を全て担当する。タスクに依存した情報（タス
ク遂行の手順、場面毎の入力待ち語彙、等）を管理した
り、対話制御手段からのタスクの進行等についての問い
合わせなどに返答したりする。

【００１４】音声認識手段（２）は、与えられた認識語
彙の範囲内で、入力される音声（１）を認識し、認識結
果を１つの単語あるいは複数の単語の列として出力す
る。音声認識手段（２）の実現方法としては様々な手法
が考えられ、本発明はその方法を限定しない。例えば、
ＨＭＭ（ＨｉｄｄｅｎＭａｒｋｏｖＭｏｄｅｌ）という
確率モデルを用いる手法が扱いやすい。この方法を用い
れば、任意の認識語彙をテキストとして与えるだけで、
音声認識できる構成にすることができる。詳細は、“中
川聖一：”確率モデルによる音声認識、電子情報通信学
会、１９８８”他の文献に詳しいので、本明細書では省
略する。

【００１５】認識語彙補足手段（３）は、対話制御手段
（５）より受け取った認識語彙に、特にタスクから独立
なコマンドを表す単語等を補足して、音声認識手段に渡
す。ここで、コマンドとしては、「違います」「違
う」「いいえ」「取消」「キャンセル」などの否定ある
いは取消を意味する単語、「ヘルプ」などの助言要求
を意味する単語、「ストップ」「停止」「中止」など
のシステムの処理の停止要求を意味する単語、「もう一
度」「リピート」などの直前のシステム応答の再出力要
求を意味する単語、などがある。さらに、「わかりませ
ん」「わからない」などの不明を意味する単語、「問わ
ない」「何でも良い」「任意」などの任意を意味する単
語なども認識語彙補足手段（３）で補足され得る単語と
する。図３に認識語彙の例を示しており、人名の認識語
彙を例に取り、補足前（ａ）と補足後（ｂ）の認識語彙
を示している。

【００１６】キーワード判定手段（６）は、音声認識手
段（２）より得られた認識結果がタスクから独立なコマ
ンドか、タスクに依存したキーワードかを判定し、その
結果を対話制御手段へ送る。ここで、判定結果は、例え
ば図４に示すように表現される。図４に示した例では、
１つの判定結果が、２つの値の組み合わせで表現され
る。左側が判定結果の種類を表しており、「ＣＭＤ」は
コマンド、「ＫＷ」はキーワードを表す。また、「Ｃ
ＭＤ」と組み合わされている「ＣＡＮＣＥＬ」、「ＨＥ
ＬＰ」はコマンドの種類を表している。さらに「ＫＷ」
と組み合わされている“資材課”や“佐藤”は実データ
値を示している。

【００１７】キーワード保持手段（６）は、対話制御手
段の指示に従って、渡されたキーワードをスタック形式
で保持したり、スタックに積まれているキーワードを対
話制御手段に通知したりする。

【００１８】応答生成手段（７）は、対話制御手段
（５）からの指示に従い、タスクを遂行するために必要
な項目の内容（名前などの実データ値）を質問するよう
な応答文を生成する。

【００１９】音声合成手段（８）は、応答生成手段
（７）から得られる応答文を音声波形に変換してスピー
カなどの電気信号から音波へ変換するデバイスにより空
間中を伝播する音声（９）として出力する。

【００２０】図２は対話制御手段の処理フローを示す図
である。簡単のために、本発明による音声対話システム
でデータ入力のみが行われる場合のフローを示してい
る。実際のタスクにおいては、利用者に対する結果のみ
の提示なども含まれることになる。

【００２１】次に、図２のフローに従って、電話接続サ
ービスなどをタスクとして、所属名に‘資材課’、人名
に‘佐藤’を入力する場合を仮定して処理手順を説明す
る。

【００２２】同タスク管理手段に対話の進行上における
次のアクションを促すガイダンス内容を要求し、まずサ
ービスが開始された時点では、対話制御手段（５）は、
タスク管理手段（１０）へ対話の進行上における次の
アクションを促すガイダンス内容を要求する。この要求
に対する返答は、次のガイダンス内容が「所属の質
問」である、として得られる。次に、対話制御手段
（５）は、キーワード保持手段から最新のキーワードを
受理しようとする。システム利用開始直後は、キーワー
ド保持手段はからであり、その旨が対話制御手段へ通知
される。次に、対話制御手段（５）は、次のガイダンス
内容（「所属の質問」）と、あれば最新のキーワード
（この段階では「なし」）を応答生成手段（７）に送
り、応答文を生成するように指示する。応答生成手段
（７）では、ガイダンス内容が「所属の質問」である
ので、例えば“所属をどうぞ”というような質問文を生
成して、音声出力手段（８）に送る。続いて、対話制御
手段（５）は、「所属」を音声認識するための認識語彙
を、認識語彙補足手段（３）へ送る。ここでの認識語彙
は、先の、次のアクションを促すガイダンス内容を要求
した際に、タスク管理手段（１０）より一緒に受け取る
こととする。あるいは、この段階であらためて、タスク
管理手段に問い合わせて、受理しても良い。この後、認
識語彙補足手段（３）で補足された認識語彙は、音声認
識手段（２）に送られる。そして、利用者の発声に対す
る音声認識手段（２）よる認識結果は、キーワード判定
手段（４）を介してコマンドかキーワードかの判定が付
加され、図４に示したような形式で対話制御手段（５）
に戻される。今の仮定では、ここでの受理結果は「Ｋ
Ｗ］＋「資材課」である。すなわち、対話制御手段
（５）はキーワードをキーワード保持手段（６）のスタ
ックにキーワードをＰＯＰし、さらに、タスク管理手段
（１０）に対してキーワードを通知する。この時点で、
タスク管理手段（１０）は、内部でタスクの進行状態が
更新される。

【００２３】ここで、図２のフローの最初に戻り、対話
制御手段（５）は、再びタスク管理手段（１０）へ、対
話の進行上における次のアクションを促すガイダンス内
容を要求する。この要求に対する返答は、次のガイダン
ス内容が「名前の質問」であるである、として得られ
る。次に、対話制御手段（５）は、キーワード保持手段
から最新のキーワードを問い合わせ、先ほどＰＯＰされ
たばかりの「資材課」が得られる。そして、対話管理手
段（５）は、次のガイダンス内容（「名前の質問」）と
最新のキーワード（「資材課」）を応答生成手段（７）
に送り、応答文を生成するように指示する。応答生成手
段（７）では、「資材課」を含めて、かつ、「名前」
を問い合わせるような質問文、例えば“資材課で名前は
何ですか”とか“資材課の誰ですか”というような質問
文を生成して、音声出力手段（８）に送る。続いて、対
話制御手段（５）は、「名前」を音声認識するための認
識語彙を、認識語彙補足手段（３）へ送る。そしてま
た、音声認識手段（２）による認識結果は、キーワード
判定手段（４）を介してコマンドかキーワードかの判定
が付加され、図４に示したような形式で対話制御手段
（５）に戻される。今の仮定では、ここでの受理結果は
「ＫＷ］＋「佐藤」となる。以上の繰り返しで、基本的
な対話が進行していく。

【００２４】次に、利用者の「資材課」の発声が誤認識
されて、認識結果が「施設課」になったと仮定した場合
の例を説明する。先の“資材課の誰ですか”の代わりに
“施設課の誰ですか”というシステム出力になっている
はずであり、それに対して、利用者は“違います”と答
えたとする。キーワード判定手段（４）より受け取った
結果が「ＫＷ」＋「佐藤」でなく、「ＣＭＤ」＋「ＣＡ
ＮＣＥＬ」となる。この場合、対話制御手段（５）はキ
ーワード保持手段（６）に対して、キーワードを１つ
（今の場合「資材課」）ＰＯＰするように指示する。さ
らに、タスク管理手段（１０）に対して、ＰＯＰされた
「資材課」を取り消すように通知する。ここで、対話制
御手段（５）の処理は図２のフローの最初に戻り、タス
ク管理手段（１０）、キーワード保持手段（６）への問
い合わせをし、次のアクションを促すガイダンス内容が
「所属の質問」であり、最新のキーワードは「なし」で
あることを応答生成手段（７）に送り、応答生成手段
（７）で再び、“所属をどうぞ”というような質問文が
生成される。

【００２５】最後に、本発明による音声対話システムを
利用した場合の、対話例を示す。タスクを電話の接続サ
ービスとした場合の例である。

【００２６】システム：「相手の所属をどうぞ」利用者：「資材課」システム：「資材課の誰ですか」利用者：「佐藤」システム：「佐藤さんに電話をつなぎます」次に、１番目の項目で誤認識した場合の対話例を示す。

【００２７】システム：「相手の所属をどうぞ」利用者：「資材課」システム：「施設課の誰ですか」利用者：「違います」システム：「もう一度、相手の所属をどうぞ」利用者：「資材課」システム：「資材課の誰ですか」：（以下省略）次に、２番目以降の項目で誤認識した場合の対話例を示
す。

【００２８】：（途中まで省略）システム：「資材課の誰ですか」利用者：「佐藤」システム：「加藤さんに電話をつなぎます」利用者：「違います」システム：「もう一度、資材課の誰ですか」利用者：「佐藤」システム：「佐藤さんに電話をつなぎます」図１において、利用者とシステムとの間のメディアとし
て、音声のみしか描いていないが、文字、画像、など他
のメディアも含めた対話システムでも良い。また、ボタ
ン入力を用意し、取消などをボタン入力するようにして
も良い。遠隔地の電話機から利用している際には、取消
などにタッチトーン信号を用いても良い。

【００２９】図１におけるタスク管理手段はタスクに特
有の処理も含んでいる。例えば、遠隔地の電話機からシ
ステムを利用する形態の場合、電話回線の制御などが考
えられる。

【００３０】

【発明の効果】本発明によれば、複数項目のデータ入力
を音声で行う音声対話システムにおいて、音声認識を利
用する際に必須の確認に関して、確認のみのシステム出
力を省略し、認識結果を次のガイダンス文に含めて提示
することでやりとりの数を減少させることにより、単
語音声認識程度の音声認識能力しか持たない音声対話シ
ステムでも、利用者とシステムとの間で効率良く音声対
話が進行できる効果が得られる。

【図面の簡単な説明】

【図１】本発明による音声対話システムの構成の一実施
例を示すブロック図である。

【図２】対話制御手段の処理手順を示すフローチャート
である。

【図３】認識語彙の一例を示す図である。

【図４】キーワード判定手段から対話制御手段に渡され
るデータ構造の一例を示す図である。

【図５】キーワード保持手段に保持されるデータの一例
を示す図である。

【符号の説明】

１…利用者の音声、２…音声認識手段、３…認識語彙補
足手段、４…キーワード判定手段、５…対話制御手段、
６…キーワード保持手段、７…応答生成手段、８…音声
出力手段、９…システムの出力音声、１０…タスク管理
手段。

フロントページの続き (72)発明者畑岡信夫東京都国分寺市東恋ケ窪一丁目280番地株式会社日立製作所中央研究所内

Claims

【特許請求の範囲】

【請求項１】タスク管理手段の管理している対話の進行
上における次のアクションを促すガイダンス内容と、キ
ーワード保持手段が保持している前段階の認識結果であ
る最新のキーワードを用いて、対話の進行上における
次のアクションを促すガイダンス文の中に、前記最新の
キーワードを含めた応答文を応答生成手段で生成し、出
力させると共に、認識語彙補足手段において、タスク管
理手段の管理している対話の進行上における次の場面で
の認識語彙に、タスクから独立なコマンドを表す単語を
補足し、その補足後の認識語彙の範囲内で、音声認識手
段において利用者の発話した音声を認識させ、キーワー
ド判定手段において、その認識結果が前記タスクから独
立なコマンドか、それ以外のタスクに依存したキーワー
ドかを判定し、その判定結果がコマンドである場合は、
各コマンドに対する処理を行い、さらに前記判定結果が
前記キーワードである場合は、該判定結果であるキーワ
ードを新たに最新のキーワードとしてキーワード保持手
段へ保持させると同時に、さらに該判定結果であるキー
ワードをタスク管理手段へ通知する、以上を繰り返すこ
とにより音声を進行させることを特徴とする音声対話制
御方法。
【請求項２】前記請求項１記載の音声対話制御方法にお
いて、前記コマンドは、少なくとも「違います」「違
う」「いいえ」「取消」「キャンセル」などの否定ある
いは取消を意味する単語を含み、前記判定結果が該否
定あるいは取消を意味する単語である場合に、前記キー
ワード保持手段に最新のキーワードを１つ削除するよう
に指示し、同時に前記タスク管理手段に１つ前の要求項
目の内容が取り消されたことを通知することを特徴とす
る音声対話制御方法。
【請求項３】前記請求項１記載の音声対話制御方法にお
いて、前記コマンドは、少なくとも「ヘルプ」などの助
言要求を意味する単語を含み、前記判定結果が該助言
要求を意味する単語である場合に、応答生成手段におい
て、使い方についてのメッセージ文を出力させることを
特徴とする音声対話制御方法。
【請求項４】前記請求項１記載の音声対話制御方法にお
いて、前記コマンドは、少なくとも「ストップ」「停
止」「中止」「中断」などのシステムの処理の停止要求
を意味する単語を含み、前記判定結果が該停止要求を意
味する単語である場合に、対話進行を停止することを特
徴とする音声対話制御方法。
【請求項５】前記請求項１記載の音声対話制御方法にお
いて、前記応答生成手段は１つ以上の応答文を蓄積
し、後で参照できる手段を持ち、前記コマンドは、少な
くとも「もう一度」「リピート」などの直前のシステム
応答の再出力要求を意味する単語を含み、前記判定結果
が該再出力要求を意味する単語である場合に、応答生成
手段において直前に出力した応答文の再出力させること
を特徴とする音声対話制御方法。
【請求項６】前記請求項１記載の音声対話制御方法にお
いて、前記コマンドは、少なくとも「わかりません」
「わからない」などの不明を意味する単語を含み、前記
判定結果が該不明を意味する単語である場合に、前記タ
スク管理手段に１つ前の要求項目の内容が不明であるこ
とを通知し、同時に同タスク管理手段に対話の進行上に
おける次のアクションを促すガイダンス内容を要求し、
その返答内容に従って対話進行することを特徴とする音
声対話制御方法。
【請求項７】前記請求項１記載の音声対話制御方法にお
いて、前記コマンドは、少なくとも「問わない」「何で
も良い」「任意」などの任意を意味する単語を含み、前
記判定結果が該任意を意味する単語である場合に、タス
ク管理手段に要求項目の内容が任意であることを通知
し、同時に同タスク管理手段に対話の進行上における次
のアクションを促すガイダンス内容を要求し、その返
答内容に従って対話進行することを特徴とする音声対話
制御方法。
【請求項８】タスクに依存した対話の進行状況を管理
し、対話の進行上における次のアクションを促すガイダ
ンス内容のように、タスクに依存した対話の進行状況に
関連した情報提供の要求を受け、その要求に対する情報
を返答するタスク管理手段と、前記タスク管理手段に要
求を出しその返答結果に応じて、認識語彙補足手段、キ
ーワード判定手段、キーワード保持手段、および応答生
成手段を制御し、システムと利用者の間の対話を進行さ
せる対話制御手段と、前記対話制御手段より受け取った
認識語彙に新たな単語を補足して、補足した結果を音声
認識手段へ渡す認識語彙補足手段と、該認識語彙補足手
段の出力により指定された認識語彙の範囲内で、利用者
の発話した音声を認識して一つまたは複数の単語系列を
出力する音声認識手段と、前記一つまたは複数の単語系
列を判定するキーワード判定手段と、前記対話制御手段
より渡されたキーワードを保持したり、保持しているキ
ーワードの中で最新のキーワードを削除、あるいは対話
制御手段に通知したりするキーワード保持手段と、前記
対話制御手段からの指示に従い、場合によっては前記対
話制御手段からのデータを用いて、応答文を生成する応
答生成手段と、該応答生成手段から得られる応答文を音
声波形に変換して出力する音声合成手段とから構成さ
れ、特に、前記対話制御手段は、タスク管理手段に対話
の進行上における次のアクションを促すガイダンス内容
を要求して該ガイダンス内容を受け取り、また前記キー
ワード保持手段に最新のキーワードを要求して該最新の
キーワードを受け取り、前記ガイダンス内容と前記最新
のキーワード、およびそれらを用いて応答文を生成させ
る指示を応答生成手段へ通知し、前記応答生成手段は、
前記対話制御手段から受け取った指示に従い、対話の
進行上における次のアクションを促すガイダンス文の中
に、同時に受け取った前段階の認識結果でもある最新の
キーワードを含めた応答文を生成し、音声合成手段へ出
力し、次に前記対話制御手段は、タスク管理手段に対話
の進行上における次の認識語彙を要求して該認識語彙を
受け取り、タスクに依存したキーワードからなる該認識
語彙を認識語彙補足手段へ送り、前記認識語彙補足手段
は、前記対話制御手段から受け取った認識語彙に、タス
クから独立なコマンドを表す単語を補足して、前記音声
認識手段およびキーワード判定手段に渡し、前記キーワ
ード判定手段は、前記認識語彙補足手段より得た補足後
の認識語彙と前記音声認識手段より得た認識結果とを比
較し、該認識結果が前記タスクから独立なコマンドか、
タスクに依存したキーワードかを判定し、その判定結果
を対話制御手段へ送り、さらに次に前記対話制御手段
は、前記キーワード判定手段の判定結果を元に、該判定
結果がコマンドである場合は、各コマンドに対する処理
を行い、前記判定結果がキーワードである場合は、該判
定結果であるキーワードをキーワード保持手段に送ると
同時に、該キーワードをタスク管理手段に送ることを特
徴とする音声対話システム。
【請求項９】前記請求項２記載の音声対話システムにお
いて、前記コマンドは、少なくとも「違います」「違
う」「いいえ」「取消」「キャンセル」などの否定ある
いは取消を意味する単語を含み、前記判定結果が該否
定あるいは取消を意味する単語である場合に、前記対話
制御手段は前記キーワード保持手段に最新のキーワード
を１つ削除するように指示し、同時に前記タスク管理手
段に１つ前の要求項目の内容が取り消されたことを通知
することを特徴とする音声対話システム。
【請求項１０】前記請求項２記載の音声対話システムに
おいて、前記コマンドは、少なくとも「ヘルプ」などの
助言要求を意味する単語を含み、前記キーワード判定
手段の判定結果が該助言要求を意味する単語である場合
に、前記対話制御手段は応答生成手段にヘルプ応答を指
示し、該指示に従い前記応答生成手段は使い方などのメ
ッセージ文を出力することを特徴とする音声対話システ
ム。
【請求項１１】前記請求項２記載の音声対話システムに
おいて、前記コマンドは、少なくとも「ストップ」「停
止」「中止」「中断」などのシステムの処理の停止要求
を意味する単語を含み、前記キーワード判定手段の判定
結果が該停止要求を意味する単語である場合に、前記対
話制御手段は対話進行を停止することを特徴とする音声
対話システム。
【請求項１２】前記請求項２記載の音声対話システムに
おいて、前記応答生成手段は１つ以上の応答文を蓄積
し、後で参照できる手段を持ち、前記コマンドは、少な
くとも「もう一度」「リピート」などの直前のシステム
応答の再出力要求を意味する単語を含み、前記キーワー
ド判定手段の判定結果が該再出力要求を意味する単語で
ある場合に、前記対話制御手段は応答生成手段に直前に
出力した応答文の再出力する指示を出すことを特徴とす
る音声対話システム。
【請求項１３】前記請求項２記載の音声対話システムに
おいて、前記コマンドは、少なくとも「わかりません」
「わからない」などの不明を意味する単語を含み、前記
キーワード判定手段の判定結果が該不明を意味する単語
である場合に、前記対話制御手段は前記タスク管理手段
に１つ前の要求項目の内容が不明であることを通知し、
同時に同タスク管理手段に対話の進行上における次のア
クションを促すガイダンス内容を要求し、その返答内容
に従って対話進行することを特徴とする音声対話システ
ム。
【請求項１４】前記請求項２記載の音声対話システムに
おいて、前記コマンドは、少なくとも「問わない」「何
でも良い」「任意」などの任意を意味する単語を含み、
前記キーワード判定手段の判定結果が該任意を意味する
単語である場合に、前記対話制御手段は、タスク管理手
段に要求項目の内容が任意であることを通知し、同時に
同タスク管理手段に対話の進行上における次のアクショ
ンを促すガイダンス内容を要求し、その返答内容に従
って対話進行することを特徴とする音声対話システム。
【請求項１５】請求項８、９、１０、１１、１２、１
３、および１４記載の前記タスクの内容が電話番号の検
索サービス、あるいは電話回線の接続サービスである音
声対話システム。
【請求項１６】請求項８、９、１０、１１、１２、１
３、および１４記載の前記タスクの内容が交通機関、催
し物、あるいは施設の検索サービス、あるいは予約サー
ビスである音声対話システム。
【請求項１７】請求項８、９、１０、１１、１２、１
３、および１４記載の前記タスクの内容が商品の検索サ
ービス、販売サービス、あるいはサポートサービスであ
る音声対話システム。
【請求項１８】請求項８、９、１０、１１、１２、１
３、および１４記載の前記タスクの内容が経路情報提供
サービス、あるいは経路誘導サービスである音声対話シ
ステム。