JP2004145014A

JP2004145014A - 自動音声応答装置及び自動音声応答方法

Info

Publication number: JP2004145014A
Application number: JP2002310066A
Authority: JP
Inventors: Kiyouko Okuyama; 奥山　鏡子
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2002-10-24
Filing date: 2002-10-24
Publication date: 2004-05-20
Anticipated expiration: 2022-10-24
Also published as: JP4206253B2

Abstract

【課題】文法と辞書の管理を容易に行なうことができ、且つ、入力された音声に忠実に応答を行ない得る自動音声応答装置及び自動音声応答方法を提供することにある。
【解決手段】音声認識処理部１、プロンプト情報を作成する対話処理部２、音声合成処理を行なう音声合成処理部３及び複数の単語が音声認識用読み及び音声合成用読みと共に登録されている共通読みデータベース１２とで自動音声応答装置を構成する。音声認識処理部１に、共通読みデータベース１２に登録された単語の音声合成用読みを特定するための識別子が含まれた認識情報を作成させる。対話処理部２に、識別子に基づいて、認識した単語の音声合成用読みを抽出させ、抽出した音声合成用読みが含まれたプロンプト情報を作成させる。
【選択図】　図１

Description

【０００１】
【発明の属する技術分野】
本発明は、音声認識処理と音声合成処理とを行なって、入力された音声に自動で応答を行なう自動音声応答装置、及び自動音声応答方法に関する。
【０００２】
【従来の技術】
近年、音声認識技術や音声合成技術の発達により、利用者からの音声に自動で応答する自動音声応答装置が実用化されている（例えば特許文献１参照）。自動音声応答装置は、音声ポータルやカーナビゲーションシステムといった自動応答サービスが必要とされる種々の分野で利用されている。
【０００３】
図４は、従来の自動音声応答装置の構成を示す図である。図４に示すように、自動音声応答装置は、主に、音声認識処理部２１と、対話処理部２２と、音声合成処理部２３とで構成されている。
【０００４】
音声認識処理部２１は、音声が入力されると、音響情報を保持する音響モデル２４と文法情報部２５とを利用して音声認識処理を行なう。また、音声認識処理部２１は、認識した単語とこれに対応するスロット情報とを認識情報として、対話処理部２２に出力する。なお、音響モデル２４と文法情報部２５とを利用した音声認識処理は、音声認識処理の一例であるが、近年最も利用されている。
【０００５】
音響モデル２４は、ある音声がいずれの文字に対応するかを決定するために参照される音響情報が登録されたデータベースである。文法情報部２５は、音声認識用の文法を登録した文法辞書であり、ユーザが発声すると予想される単語又は単語列を登録している。単語列が登録されている場合は、文法情報部２５には、単語の順番情報が状態遷移情報として更に登録される。
【０００６】
また、文法情報部２５には、単語毎に設定されたスロット情報が登録されている。スロット情報は、ある単語が発声された場合に音声認識の結果として返される戻り値であり、後述するアプリケーションデータベース２６の識別子として利用される。
【０００７】
対話処理部２２は、スロット情報が入力されると、音声認識処理部２１の識別結果に応じたプロンプトを決定し、プロンプトデータベース２７から、決定されたプロンプトに対応するプロンプ文を抽出する。更に、対話処理部２２は、アプリケーションデータベース２６を参照して、このプロンプト文に含まれる変数を認識結果に対応する具体的な値に置き換える。プロンプト文はテキストデータであり、音声合成処理部２３に入力される。
【０００８】
音声合成処理部２３は、ユーザ読み辞書２８、基本読み辞書２９、波形辞書３０及び言語辞書３１を備えている。音声合成処理部２３は、プロンプト文が入力されると、出力音声を作成する。具体的には、音声合成処理部２３は、言語辞書３１を用いてプロンプト文を形態素解析し、基本読み辞書２９及びユーザ読み辞書２８を参照してプロンプト文に抑揚情報やポーズ情報、アクセント情報を付与し、更に、波形辞書に登録されている音声データを抽出して出力音声を作成する。
【０００９】
なお、基本読み辞書２９及びユーザ読み辞書２８には、下記の表５に示すように、テキスト（主に単語）、それに対応するアクセント記号付きの発音、及び品詞情報が格納されている。
【００１０】
【表５】

【００１１】
なお、基本読み辞書は２９、一般的なテキスト（主に単語）が登録された辞書であり、音声合成の開発者から予め提供される。また、ユーザ読み辞書２８は、基本読み辞書に登録されていないテキストが登録された辞書であり、ユーザが個別な事情に対応して作成する。通常、音声合成処理部２３は、ユーザ読み辞書２８を、基本読み辞書２９よりも優先して参照する。
【００１２】
【特許文献１】
特開２０００−２４２２８９号公報
【００１３】
【発明が解決しようとする課題】
しかしながら、上記図４で示す自動音声応答装置を用いた自動応答サービスでは、入力された音声を認識し、これを音声出力するためには、音声認識用の文法情報部２５と音声合成用の基本読み辞書２９又はユーザ読み辞書２８とに、認識させたい音声を登録する必要がある。
【００１４】
例えば、「富士通研（フジツウケン）」を音声認識させたい場合、音声認識用の文法情報部２５に、読みである単語「フジツウケン」を登録し、更に、ユーザ読み辞書２８に、文字「富士通研」と読み「フジツーケン」とを登録する必要がある。なお、基本読み辞書２９に、「富士通研」が既に登録されている場合は、ユーザ読み辞書２８に登録する必要はないと考えられるが、音声合成処理部２３による音声出力の正確さを高める点からは、ユーザ読み辞書２８にも登録する必要がある。
【００１５】
このように、上記図４で示す自動音声応答装置を用いて自動応答サービスを行なう場合は、運用管理上、辞書を二重に管理しなければならないという問題がある。
【００１６】
また、上記図４で示す自動音声応答装置を用いた自動応答サービスでは、漢字の読み間違えの問題もある。例えば、人名の「長田さん」は、「ナガタさん」、「オサダさん」の二通りの読み方があるが、上記図４で示す自動音声応答装置では、その構成上、一つの漢字に対して一つの読みしか、基本読み辞書２８又はユーザ読み辞書２９に登録できないこととなっている。また、基本読み辞書２８とユーザ読み辞書２９それぞれに違う読みを登録しても、ユーザ読み辞書が優先されてしまう。
【００１７】
このため、ユーザが「長田（ナガタ）さん」と発声し、音声認識処理部２１で「ナガタさん」と認識されても、ユーザ読み辞書２８に「長田さん（オサダさん）と登録されていれば、音声合成処理部２３で「オサダさん」と出力されてしまう。
【００１８】
また、上記図４で示す自動音声応答装置では、音声認識処理部２１と音声合成処理部２３との間では直接情報のやり取りは行なわれておらず、これらの間には対話処理部２２が介在している。
【００１９】
このため、ユーザが「長田（ナガタ）さん」と発声し、音声認識処理で「ナガタさん」と認識されても、対話処理部２２が、アプリケーションデータベース２６を参照してプロンプト文に含まれる変数を置き換える際に、「長田さん」と置き換えてしまうと、「オサダさん」と出力される場合がある。
【００２０】
本発明の目的は、文法と辞書の管理を容易に行なうことができ、且つ、入力された音声に忠実に音声応答を行ない得る自動音声応答装置及び自動音声応答方法を提供することにある。
【００２１】
【課題を解決するための手段】
上記目的を達成するために本発明にかかる自動音声応答装置は、音声認識処理を行なって、認識情報を出力する音声認識処理部と、前記認識情報に対応するプロンプトを決定し、前記認識情報と決定した前記プロンプトからプロンプト情報を作成する対話処理部と、前記プロンプト情報に基づいて音声合成処理を行なう音声合成処理部と、一又は複数の単語が音声認識用読み及び音声合成用読みと共に登録されている共通読みデータベースとを少なくとも有し、前記音声認識処理部は、前記共通読みデータベースに登録された単語を認識した場合に、前記認識した単語の音声合成用読みを前記共通読みデータベースの中から特定するための識別子が含まれた前記認識情報を出力し、前記対話処理部は、前記識別子に基づいて、前記認識した単語の音声合成用読みを抽出し、抽出した音声合成用読みが含まれたプロンプト情報を作成することを特徴とする。
【００２２】
上記本発明にかかる自動音声応答装置においては、前記音声認識処理部が、前記認識した単語の音声合成用読みを前記共通読みデータベースの中から特定するための識別子が含まれた認識情報を出力する代わりに、前記認識した単語の音声合成用読みを含んだ前記認識情報を出力し、前記対話処理部が、前記認識した単語の音声合成用読みを抽出し、抽出した音声合成用読みが含まれたプロンプト情報を作成する代わりに、前記認識情報に含まれた単語の音声合成用読みを含んだプロンプト情報を作成する態様とすることもできる。
【００２３】
また、上記本発明にかかる自動音声応答装置は、前記共通読みデータベースに登録されている音声認識用読みを用いて音声認識用の文法を作成し、前記音声認識用読みに対応する音声合成用読みを前記共通読みデータベースの中から特定するための識別子を前記文法に付加する文法生成部を有し、音声認識処理部が、前記文法生成部が生成した文法を用いることによって、前記認識した単語の音声合成用読みを前記共通読みデータベースの中から特定するための識別子が含まれた前記認識情報を作成する態様とすることもできる。
【００２４】
更に、前記共通読みデータベースに登録されている音声認識用読みを用いて音声認識用の文法を作成し、前記音声認識用読みに対応する音声合成用読みを前記文法に付加する文法生成部を有し、音声認識処理部が、前記文法生成部が生成した文法を用いることによって、前記認識した単語の音声合成用読みを含んだ前記認識情報を作成する態様とすることもできる。
【００２５】
また、上記本発明にかかる自動音声応答装置においては、前記共通読みデータベースの内容を編集するための編集手段を有しているのが好ましい。
【００２６】
次に、上記目的を達成するために本発明にかかる自動音声応答方法は、音声認識処理を行ない、前記音声認識処理によって得られた認識情報に対応するプロンプトを決定し、前記認識情報と決定した前記プロンプトからプロンプト情報を作成し、前記プロンプト情報に基づいて音声合成処理を行なう自動音声応答方法であって、（ａ）前記音声認識処理において認識された単語が、一又は複数の単語が音声認識用読み及び音声合成用読みと共に登録されている共通読みデータベースに登録された単語である場合に、前記音声認識処理において認識された単語の音声合成用読みを前記共通読みデータベースの中から特定するための識別子が含まれた前記認識情報を出力する工程と、（ｂ）前記識別子に基づいて、前記音声認識処理において認識された単語の音声合成用読みを抽出し、抽出した音声合成用読みが含まれたプロンプト情報を作成する工程とを少なくとも有することを特徴とする。
【００２７】
上記本発明にかかる自動音声応答方法においては、前記（ａ）の工程において、前記音声認識処理において認識された単語の音声合成用読みを前記共通読みデータベースの中から特定するための識別子が含まれた認識情報を出力する代わりに、前記音声認識処理において認識された単語の音声合成用読みを含んだ認識情報を出力し、前記（ｂ）の工程において、前記認識した単語の音声合成用読みを抽出し、抽出した音声合成用読みが含まれたプロンプト情報を作成する代わりに、前記認識情報に含まれた単語の音声合成用読みを含んだプロンプト情報を作成する態様とすることもできる。
【００２８】
本発明は、上記の本発明にかかる自動音声応答方法を具現化するためのプログラムであっても良い。このプログラムをコンピュータにインストールして実行することにより、本発明にかかる案内仲介方法を実行できる。
【００２９】
このように、上記本発明にかかる自動音声応答装置及び自動音声応答方法においては、音声認識用の文法と、音声合成用の辞書を一本化するテーブル、即ち共通読みデータベースを用意することで、上記問題の解決を図っている。ここで、共通読みデータベースについて説明する。共通読みデータベースの内容の一例を下記の表１に示す。
【００３０】
【表１】

【００３１】
上記表１に示す共通読みデータベースは、識別番号毎の複数の名称で構成されており、名称ｉ（１≦ｉ≦Ｎ）は、テキスト▲１▼、音声認識用読み▲２▼、音声合成用読み▲３▼で構成されている。音声認識用読み▲２▼は、テキスト▲１▼の音声認識用の文法に記載する読みを記述したものである。音声合成用読み▲３▼は、テキスト▲１▼の音声合成用読みを記述したものである。
【００３２】
日本語の場合は、音声認識用読み▲２▼はひらがな又はカタカナで記述される。また、音声合成用読み▲３▼は、アクセント記号と共にひらがな又はカタカナで記述される。英語の場合は、音声認識用読み▲２▼は、ＩＰＡ（Ｉｎｔｅｒｎａｔｉｏｎａｌ　Ｐｈｏｎｅｔｉｃ　Ａｌｐｈａｂｅｔ）等で記述される。また、音声合成用読み▲３▼は、アクセント記号と共にＩＰＡで記述される。
【００３３】
また、識別番号１〜３から分るように、共通読みデータベースにおいては、テキスト▲１▼が同じであっても、音声認識用読み▲２▼が異なる場合は、名称を分けて記述される。一方、識別番号３から分るように、音声認識用読み▲２▼は複数登録（例：ぶちょう、ぶっちょう）が可能であるが、音声合成用読み▲３▼は一つ（ブチョー）しか登録できないようになっている。
【００３４】
なお、通常は、一つの単語に対して、音声認識用読み▲２▼と音声合成用読み▲３▼との両方が登録される。但し、一般に自動音声応答装置が備えている基本読み辞書に登録されている音声合成用読みと、音声合成用読み▲３▼とが同じである場合は、識別番号１の名称２のように、音声合成用読み▲３▼の欄は空欄として、基本読み辞書に登録された読みが登録されているとみなされる。
【００３５】
【発明の実施の形態】
以下、本発明の自動音声応答装置及び自動音声応答方法の一例について、図面を参照しながら説明する。最初に、図１を用いて本発明の自動音声応答装置の構成を説明する。図１は、本発明の自動音声応答装置の一例を示す構成図である。
【００３６】
図１に示すように、本発明の自動音声応答装置は、音声認識処理部１、対話処理部２及び音声合成処理部３を有しており、この点で従来の自動音声応答装置と同様である。また、本発明の自動音声応答装置は、音響モデル４、文法情報部５、アプリケーションデータベース６、プロンプトデータベース７、波形辞書９、基本読み辞書８及び言語辞書１０を有している点でも、従来の自動音声応答装置と同様である。
【００３７】
但し、本発明の自動音声応答装置は、ユーザ読み辞書の代わりに、共通読みデータベース１２と、編集手段１１と、文法生成部１３とを有しており、この点で、従来の自動音声応答装置と異なっている。また、このために、音声認識処理部１及び対話処理部２における処理も、従来の自動音声応答装置と異なっている。
【００３８】
共通読みデータベース１２は、上記表１で示したように、テキスト、音声認識用読み及び音声合成用読みで構成されている。編集手段１１は、共通読みデータベース１２の内容を編集するための手段である。自動音声応答装置の管理者は、対話例を想定し、編集手段１１を用いて共通読みデータベース１２の内容の追加、削除及び修正を行なう。
【００３９】
文法生成部１３は、共通読みデータベース１２に登録された内容に基づいて文法を生成し、これを文法情報部５に登録する。なお、文法生成部１３で行なわれる処理については後述の図２で具体的に説明する。
【００４０】
次に、本発明の自動音声応答装置における処理及び本発明の自動音声応答方法について、具体的な対話例を挙げて説明する。なお、本発明の自動音声応答方法は、図１に示す自動音声応答装置を動作させることによって実行することができる。また、以下の説明では適宜図１を参照する。
【００４１】
対話例は以下の通りである。
［対話例］
自動音声応答装置：「どなたの連絡先ですか？　名前をおっしゃってください。」
ユーザ　　　　　：「長田（ながた）さん」
自動音声応答装置：「はい、長田（ながた）さんの連絡先は、○○○−△△△△−□□□□です。」
上記の対話例を実現するために、予め、自動音声応答装置の管理者は、編集手段１１を用いて、以下の表２に示すテキスト▲１▼、音声認識用読み▲２▼及び音声合成用読み▲３▼を共通読みデータベース１２に入力する。
【００４２】
【表２】

【００４３】
文法生成部１３は、表１に示す内容に基づいて、文法を作成し、作成した文法を文法情報部５に登録する。この点について図２を用いて説明する。図２は、本発明の自動音声応答装置を構成する文法生成部における処理の一例を示す図である。
【００４４】
図２に示すように、最初に、文法生成部１３は、共通読みデータベース１２から、名称１〜２及び識別番号１〜３に対応する音声認識用読みを抽出し、エントリ情報を設定する（ステップＳ１）。
【００４５】
エントリ情報は、抽出した音声認識用読みに対応する音声合成用読みを、共通読みデータベースの中から特定するための識別子である。本例では、エントリ情報は、共通読みデータベース１２の名前、名称番号及び識別番号を組み合わせて設定している。
【００４６】
次に、文法生成部１３は、抽出した音声認識用読みを音声認識処理で使用する単語として文法情報部５に登録し、更に、エントリ情報をこの音声認識用の読みが認識された場合のスロット情報（戻り値）として文法情報部５に登録する（ステップＳ２）。以下の表３に、文法情報部５に登録された単語及びスロット情報の例を示す。
【００４７】
【表３】

【００４８】
なお、本例では、共通読みデータベース１２の名前を「ｕｓｅｒ」と設定している。このため、例えば「（ｔａｂｌｅｎｏ　　ｕｓｅｒ−１−１）」は、共通読みデータベース「ｕｓｅｒ」における名称１の識別番号１を意味する。
【００４９】
このように、本発明においては、共通読みデータベース１２に新たに登録された単語について、文法生成部１３が文法を生成する。このため、この新たに登録された単語を用いて音声認識処理が行なわれ、上記の対話例が実現される。上記の対話例を実現するために、自動音声応答装置で行なわれる処理について図３を用いて説明する。
【００５０】
図３は、本発明の自動音声応答装置における処理の一例を示す図である。図３に示すように、最初に、上記の対話例で挙げた入力音声（ユーザ：「長田（ながた）さん」）が受信されると（ステップＳ１１）、音声認識処理部１は音声認識処理を行ない、以下の表４に示す認識情報を対話処理部２に出力する（ステップＳ１２）。
【００５１】
【表４】

【００５２】
上記表３から分るように、音声認識処理部１によって認識された単語は「長田（ながた）」であり、これは共通読みデータベース１２に登録された単語である。このため、認識情報として出力されるスロット情報は、上記したエントリ情報を含むものとなる。なお、音声認識処理部１によって認識された単語が、共通読みデータベース１２に登録されていない単語である場合は、スロット情報として従来と同様の戻り値が出力される。
【００５３】
次に、認識情報が入力された対話処理部２は、認識情報に対応するプロンプトを決定する（ステップＳ１３）。具体的には、対話処理部２は、スロット情報「ｔａｂｌｅｎｏ　　ｕｓｅｒ−１−１」から、ユーザが要求する電話番号の相手方の名前「長田」を取得し、更に、アプリケーションデータベース６を参照して「長田」の電話番号情報を取得する。対話処理部２は、この得られた情報に基づいてプロンプトを決定する。
【００５４】
次いで、対話処理部２は、決定したプロンプトに対応するプロンプト文をプロンプトデータベースから抽出する（ステップＳ１４）。なお、本例では、プロンプトデータベース７には雛型となる複数のプロンプト文が登録されており、そこから該当するプロンプト文が抽出されているが、対話処理部２が一から日本語を組み立ててプロンプト文を作成する態様とすることもできる。なお、プロンプトデータベース７から抽出されたばかりのプロンプト文は、「はい、［ユーザ名］の連絡先は、［電話番号］です。」といったものであり、「ユーザ名」や「電話番号」は変数で記述されている。
【００５５】
次に、本例ではスロット情報に共通読みデータベース１２のエントリ情報が含まれているため、対話処理部２は、スロット情報からエントリ情報を抽出する（ステップＳ１５）。また、対話処理部２は、アプリケーションデータベース２６を参照して、プロンプト文の［電話番号］を具体的な値に置き換える。
【００５６】
更に、対話処理部２は、抽出したエントリ情報「ｕｓｅｒ−１−１」に基づいて、共通読みデータベース「ｕｓｅｒ」から、名称番号１及び識別番号１として登録された音声合成用読み「ナガタ」を抽出し、これをプロンプト文に追加する（ステップＳ１６）。
【００５７】
この場合、プロンプト文は、例えば「はい、長田（発声：ナガタ）の連絡先は、○○○−△△△△−□□□□です。」のようになり、単語の読みが合成音声に対応した読みに置換されたものとなる（合成音声読み置換処理）。このプロンプト文は、プロンプト情報として音声合成処理部３へと出力される。なお、上記プロンプト文における「長田（発声：ナガタ）」の記述は、音声合成エンジンにおける単語の読みの記述方法によって異なるので、使用する音声合成エンジンに対応するように記述すれば良い。
【００５８】
その後、音声合成処理部３は、プロンプト情報に基づいて音声合成処理を行ない（ステップＳ１７）、出力音声を送信する（ステップＳ１８）。この結果、ユーザに対して応答がなされたことになる。
【００５９】
このように、本発明においては、音声認識用の文法と音声合成用の辞書とを一本化しているため、辞書を二重に管理する必要がなく、共通読みデータベースの管理のみを行なえば良い。また、共通読みデータベースに、例えば「長田（ながた）さん」と「長田（おさだ）さん」との両方を登録しておけば、入力された音声と対応する音声合成用読み▲３▼を特定するエントリ情報に基づいて、対話処理部がプロンプト情報を作成するため、入力音声に忠実に応答を行なうことが可能となる。
【００６０】
また、本例においては、エントリ情報を含むスロット情報が認識情報として出力されているが、本発明においては、エントリ情報の代わりに、共通読みデータベース１２に登録された音声合成用読みを含むスロット情報を認識情報として出力することもできる。この場合、対話処理部２は、図３に示すステップＳ１６のように共通読みデータベース１２にアクセスしなくても、プロンプト文に音声合成用読みを追加することができるので、処理速度の向上を図ることができる。また、この場合、文法生成部１３は、図２で示すステップＳ１において、音声合成用読みを含むスロット情報を設定する。
【００６１】
本発明の自動音声応答装置は、コンピュータに、図２に示すステップＳ１〜Ｓ２及び図３に示すＳ１１〜Ｓ１８を具現化させるプログラムをインストールし、このプログラムを実行することによって、実現することができる。この場合、コンピュータのＣＰＵ（ｃｅｎｔｒａｌ　　ｐｒｏｃｅｓｓｉｎｇ　　ｕｎｉｔ）によって、音声認識処理部１、対話処理部２、音声合成処理部３及び文法生成部１３における処理が行われる。
【００６２】
また、本発明では、音響モデル４、文法情報部５、アプリケーションデータベース６、プロンプトデータベース７、基本読み辞書８、波形辞書９、言語辞書１０及び共通読みデータベース１２は、コンピュータに備えられたハードディスク等の記憶装置に、これらを構成するデータファイルを格納することによって、又はこのデータファイルが格納された記録媒体をコンピュータと接続された読取装置に搭載することによって実現されている。
【００６３】
なお、共通読みデータベース１２は、データ構造が複雑ではないので、テキストファイルとして記述することが可能である。この場合、編集手段としては、通常のテキストエディタを用いることができる。
【００６４】
【発明の効果】
以上のように，本発明によれば、音声合成用の辞書と音声認識用の文法とを一元的に管理することが出来るようになり、管理コストを削減できる。また、ユーザが“長田（ながた）さん”と言えば、“長田（ながた）さん”と応答し、“長田（おさだ）さん”といえば、“長田（おさだ）さん”と応答する、というように、入力された音声に忠実に音声応答を行ないえる自動音声応答装置を提供することができる。
【図面の簡単な説明】
【図１】本発明の自動音声応答装置の一例を示す構成図である。
【図２】本発明の自動音声応答装置を構成する文法生成部における処理の一例を示す図である。
【図３】本発明の自動音声応答装置における処理の一例を示す図である。
【図４】従来の自動音声応答装置の構成を示す図である。
【符号の説明】
１　音声認識処理部
２　対話処理部
３　音声合成処理部
４　音響モデル
５　文法情報部
６　アプリケーションデータベース
７　プロンプトデータベース
８　基本読み辞書
９　波形辞書
１０　言語辞書
１１　編集手段
１２　共通読みデータベース１２
１３　文法生成部

Claims

音声認識処理を行なって、認識情報を出力する音声認識処理部と、前記認識情報に対応するプロンプトを決定し、前記認識情報と決定した前記プロンプトからプロンプト情報を作成する対話処理部と、前記プロンプト情報に基づいて音声合成処理を行なう音声合成処理部と、一又は複数の単語が音声認識用読み及び音声合成用読みと共に登録されている共通読みデータベースとを少なくとも有し、
前記音声認識処理部は、前記共通読みデータベースに登録された単語を認識した場合に、前記認識した単語の音声合成用読みを前記共通読みデータベースの中から特定するための識別子が含まれた前記認識情報を出力し、
前記対話処理部は、前記識別子に基づいて、前記認識した単語の音声合成用読みを抽出し、抽出した音声合成用読みが含まれたプロンプト情報を作成することを特徴とする自動音声応答装置。
前記音声認識処理部が、前記認識した単語の音声合成用読みを前記共通読みデータベースの中から特定するための識別子が含まれた認識情報を出力する代わりに、前記認識した単語の音声合成用読みを含んだ前記認識情報を出力し、
前記対話処理部が、前記認識した単語の音声合成用読みを抽出し、抽出した音声合成用読みが含まれたプロンプト情報を作成する代わりに、前記認識情報に含まれた単語の音声合成用読みを含んだプロンプト情報を作成する請求項１記載の自動音声応答装置。
前記共通読みデータベースに登録されている音声認識用読みを用いて音声認識用の文法を作成し、前記音声認識用読みに対応する音声合成用読みを前記共通読みデータベースの中から特定するための識別子を前記文法に付加する文法生成部を有し、
音声認識処理部が、前記文法生成部が生成した文法を用いることによって、前記認識した単語の音声合成用読みを前記共通読みデータベースの中から特定するための識別子が含まれた前記認識情報を作成する請求項１記載の自動音声応答装置。
前記共通読みデータベースに登録されている音声認識用読みを用いて音声認識用の文法を作成し、前記音声認識用読みに対応する音声合成用読みを前記文法に付加する文法生成部を有し、
音声認識処理部が、前記文法生成部が生成した文法を用いることによって、前記認識した単語の音声合成用読みを含んだ前記認識情報を作成する請求項２記載の自動音声応答装置。
前記共通読みデータベースの内容を編集するための編集手段を有している請求項１または２記載の自動音声応答装置。
音声認識処理を行ない、前記音声認識処理によって得られた認識情報に対応するプロンプトを決定し、前記認識情報と決定した前記プロンプトからプロンプト情報を作成し、前記プロンプト情報に基づいて音声合成処理を行なう自動音声応答方法であって、
（ａ）前記音声認識処理において認識された単語が、一又は複数の単語が音声認識用読み及び音声合成用読みと共に登録されている共通読みデータベースに登録された単語である場合に、前記音声認識処理において認識された単語の音声合成用読みを前記共通読みデータベースの中から特定するための識別子が含まれた前記認識情報を出力する工程と、
（ｂ）前記識別子に基づいて、前記音声認識処理において認識された単語の音声合成用読みを抽出し、抽出した音声合成用読みが含まれたプロンプト情報を作成する工程とを少なくとも有することを特徴とする自動音声応答方法。
前記（ａ）の工程において、前記音声認識処理において認識された単語の音声合成用読みを前記共通読みデータベースの中から特定するための識別子が含まれた認識情報を出力する代わりに、前記音声認識処理において認識された単語の音声合成用読みを含んだ認識情報を出力し、
前記（ｂ）の工程において、前記認識した単語の音声合成用読みを抽出し、抽出した音声合成用読みが含まれたプロンプト情報を作成する代わりに、前記認識情報に含まれた単語の音声合成用読みを含んだプロンプト情報を作成する請求項６記載の自動音声応答方法。
音声認識処理を行ない、前記音声認識処理によって得られた認識情報に対応するプロンプトを決定し、前記認識情報と決定した前記プロンプトからプロンプト情報を作成し、前記プロンプト情報に基づいて音声合成処理を行なう自動音声応答方法をコンピュータに実行させるためのプログラムであって、
（ａ）前記音声認識処理において認識された単語が、一又は複数の単語が音声認識用読み及び音声合成用読みと共に登録されている共通読みデータベースに登録された単語である場合に、前記音声認識処理において認識された単語の音声合成用読みを前記共通読みデータベースの中から特定するための識別子が含まれた前記認識情報を出力するステップと、
（ｂ）前記識別子に基づいて、前記音声認識処理において認識された単語の音声合成用読みを抽出し、抽出した音声合成用読みが含まれたプロンプト情報を作成するステップとを少なくとも有することを特徴とするコンピュータに実行させるためのプログラム。
前記（ａ）のステップにおいて、前記音声認識処理において認識された単語の音声合成用読みを前記共通読みデータベースの中から特定するための識別子が含まれた認識情報を出力する代わりに、前記音声認識処理において認識された単語の音声合成用読みを含んだ認識情報を出力し、
前記（ｂ）のステップにおいて、前記認識した単語の音声合成用読みを抽出し、抽出した音声合成用読みが含まれたプロンプト情報を作成する代わりに、前記認識情報に含まれた単語の音声合成用読みを含んだプロンプト情報を作成する請求項８記載のコンピュータに実行させるためのプログラム。