JP3949356B2

JP3949356B2 - 音声対話システム

Info

Publication number: JP3949356B2
Application number: JP2000211551A
Authority: JP
Inventors: 明人永井; 泰石川
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2000-07-12
Filing date: 2000-07-12
Publication date: 2007-07-25
Anticipated expiration: 2020-07-12
Also published as: JP2002024212A

Description

【０００１】
【発明の属する技術分野】
この発明は、利用者の自然言語入力を理解して情報提供サービスの自動応答を行なう音声対話システムに関するものである。
【０００２】
【従来の技術】
情報システムにおけるマンマシンインタフェース技術として、従来から、利用者と自然言語による対話を行なって自動応答システムを実現する対話技術があり、特に、利用者と音声による対話を行なって実現する音声対話技術への要求が高まっている。音声対話技術の応用システムとして、例えば、受付、注文、予約などの各種サービス代行や、利用者が要求する情報の提供を行なう電話音声自動応答装置が知られており、２４時間サービス化、業務の効率化、省力化などの点で有用性が高い。
【０００３】
このような電話系サービスの分野では、ＣＴＩ（ＣｏｍｐｕｔｅｒＴｅｌｅｐｈｏｎｙＩｎｔｅｇｒａｔｉｏｎ）システムの導入が最近急速に進んでいる。この分野では、顧客の満足度を向上させるために、発信呼通知によって顧客を特定し、過去の顧客情報を利用して、顧客個人にあった情報提供や応対のサービスが試みられている。特に、音声自動応答装置を用いて業務の自動化を図るＣＴＩシステムでは、人間のオペレータ代行に伴うサービスの質の低下に対し、いかにして顧客の満足度を向上させるかが大きな課題となっており、顧客個人に適応した応対を実現する音声対話技術が必要となる。
【０００４】
音声対話技術により構築される音声対話システムでは、一般的な構成として、利用者の発話を認識する音声認識部、認識された発話文をシステムへのコマンドへ翻訳する音声理解部、コマンドで表現された利用者の要求に応じて、データベース検索や予約などを行なうアプリケーションを制御し、利用者とシステムとの対話を管理して、システムの応答を決定する対話管理部、システムの応答を音声で通知する音声合成部を備えている。
【０００５】
個人性を考慮した応対を実現する音声対話技術としては、従来から、音声合成部からのシステムの応答に対する利用者の入力のタイミングにより、システムに対する利用者の習熟度を推定し、音声ガイダンスの内容を習熟度に合わせて変更する技術（特開平４−３４４９３０号）、利用者の発話に対する音声認識部での音響尤度と、対話管理部による認識結果の確認対話で判明する認識失敗回数とを用いて、利用者の音声が認識しやすいか否かを推定し、認識のしやすさに応じて確認対話の制御方法を変更する技術（特開平７−１８１９９４号）、発信呼の電話番号により利用者を特定した後に、利用者の年齢（大人、子供）や国籍（言語）に合わせて、ガイダンスの文体や言語を変更する技術（特開平８−１１６５７２号）などがある。
【０００６】
【発明が解決しようとする課題】
しかし、上記のような音声対話システムでは、利用者の発話文をシステムへのコマンドへ翻訳する音声理解技術において、個人性が考慮された翻訳がなされてなく、利用者から入力された発話文の翻訳結果は、全ての利用者に関して差異のない翻訳結果となっていた。
【０００７】
例えば、ホテルの検索のような情報検索型のサービスにおける対話では、利用者が希望条件に合うホテルを探すときに、「横浜で安いホテルを教えて下さい」といった、漠然と料金の希望を指定する発話が頻繁に生じる。このような「安い」という曖昧な単語に対しては、一般的に、設計者が予め想定した固定の値、例えば６０００円以下という値を一律に用いてコマンドへ翻訳する。
【０００８】
このために、１００００円程度が安くて手頃だと思って探している利用者に対して、システムは「横浜の安いホテルは、Ａホテル４５００円、Ｂホテル５５００円、Ｃホテル６０００円、があります」のような応答を行ない、利用者は再度、「もう少し高めのホテルが良いのですが」といった発話が必要になるため、検索が効率的でないという課題があった。また、利用者の料金に対する感覚に一致していないために、利用者に違和感を生じさせるという課題があった。
【０００９】
この発明は、上記課題を解決するためになされたもので、利用者の曖昧語を含む自然言語の入力に対して、効率的な検索ができる音声対話システムを提供することを目的とする。
また、この発明は、利用者から入力される自然言語に含まれている曖昧語に対応する意味を推定して、効率的かつ柔軟な検索ができる音声対話システムを提供することを目的とする。
また、この発明は、利用者が対話システムを利用した回数が少ない場合でも、利用者の感覚に合致した自然な情報提示を行なうことができ、情報検索の効率化、及び利用者の利便性を向上させることができる音声対話システムを提供することを目的とする。
また、この発明は、曖昧な語が表わす値を利用者の発話履歴から学習して、利用者に応じて自動的に設定して翻訳できるようにし、情報検索の効率化、及び利用者の感覚に合致した自然な情報提示を行なうことで、利用者の利便性を向上させる音声対話システムを提供することを目的とする。
【００１０】
【課題を解決するための手段】
この発明に係る音声対話システムは、対話システム動作に対応して定義されたコマンド意図、対話システム動作のパラメータの種類を定義した項目、及び項目に対応する値である項目値からなる表現を対話システムのコマンドとし、自然言語をコマンドへ変換するための変換知識をコマンド知識として記憶するコマンド知識記憶手段と、自然言語において項目値へ一意に変換できない語を曖昧語とし、曖昧語、曖昧語の項目、及び曖昧語に対応する意味標識を曖昧語辞書として記憶する曖昧語辞書記憶手段と、曖昧語辞書記憶手段に記憶された曖昧語辞書を参照して、利用者が入力した自然言語に含まれる曖昧語を曖昧語に対応する意味標識に置換して、曖昧語の項目と意味標識の対を作成し、コマンド知識記憶手段に記憶されたコマンド知識を参照して、入力された自然言語を、曖昧語の項目と意味標識の対を含んだコマンドに変換するコマンド変換手段と、曖昧語に対応する意味標識の値を推定するための推定値情報を利用者を特定する利用者識別子とともに記憶する推定値情報記憶手段と、コマンド変換手段から入力される曖昧語の項目と意味標識の対を含んだコマンドに対し、推定値情報記憶手段に記憶された利用者識別子に対応した推定値情報を参照して、曖昧語に対応する意味標識の推定値を決定してコマンドとともに出力する曖昧語翻訳手段と、前記意味標識に対応する推定値同士の関係を関数として規定し、補間モデルとして記憶した補間モデル記憶手段と、曖昧語翻訳手段からの利用者識別子及び曖昧語の意味標識を入力とし、利用者識別子に対応した推定値情報における曖昧語のうち、入力された意味標識の推定値情報が未学習である曖昧語に対して、上記補間モデル記憶手段の補間モデルを用いて、学習済の曖昧語の意味標識に対する推定値情報から、未学習の意味標識の推定値を算出して曖昧語翻訳手段へ出力する推定値補間手段とを備えたものである。
【００１２】
この発明に係る音声対話システムは、対話システム動作に対応して定義されたコマンド意図、対話システム動作のパラメータの種類を定義した項目、及び項目に対応する値である項目値からなる表現を対話システムのコマンドとし、自然言語をコマンドへ変換するための変換知識をコマンド知識として記憶するコマンド知識記憶手段と、自然言語において項目値へ一意に変換できない語を曖昧語とし、曖昧語、曖昧語の項目、及び曖昧語に対応する意味標識を曖昧語辞書として記憶する曖昧語辞書記憶手段と、上記曖昧語辞書記憶手段に記憶された曖昧語辞書を参照して、利用者が入力した自然言語に含まれる曖昧語を曖昧語に対応する意味標識に置換して、曖昧語の項目と意味標識の対を作成し、上記コマンド知識記憶手段に記憶されたコマンド知識を参照して、入力された自然言語を、上記曖昧語の項目と意味標識の対を含んだコマンドに変換するコマンド変換手段と、曖昧語に対応する意味標識の値を推定するための推定値情報を利用者を特定する利用者識別子とともに記憶する推定値情報記憶手段と、上記コマンド変換手段から入力される曖昧語の項目と意味標識の対を含んだコマンドに対し、上記推定値情報記憶手段に記憶された利用者識別子に対応した推定値情報を参照して、曖昧語に対応する意味標識の推定値を決定してコマンドとともに出力する曖昧語翻訳手段と、全ての利用者に対する推定値情報を記憶する全利用者推定値情報記憶手段と、曖昧語翻訳手段からの利用者識別子及び曖昧語の意味標識を入力とし、利用者識別子に対応した推定値情報における曖昧語のうち、入力された意味標識の推定値情報が未学習である曖昧語に対して、上記全利用者推定値情報記憶手段に記憶された全ての利用者に対する推定値情報を参照して、学習済の曖昧語の意味標識に対する推定値情報との一致度が高い他の利用者の推定値情報を利用し、未学習の意味標識の推定値を選択して曖昧語翻訳手段へ出力する推定値選択手段とを備えたものである。
【００１３】
この発明に係る音声対話システムにおいて、項目及び項目値が付与された検索対象データの集合を記憶するデータベースと、入力されたコマンドに対応して、所定の対話システム動作を実行してシステムと利用者との対話を管理するとともにデータベースを検索し、利用者へ通知する応答文の意味内容を表わす応答意味表現を生成する対話管理手段とを備えたものである。
【００１５】
【発明の実施の形態】
以下、この発明の実施の一形態を説明する。
実施の形態１．
図１は、この発明の実施の形態１における音声対話システムの機能ブロック構成図であり、図において、１はコマンド知識記憶部（コマンド知識記憶手段）、２はコマンド変換部（コマンド変換手段）、３はデータベース、４は応答履歴記憶部（応答履歴記憶手段）、５は対話管理部（対話管理手段）、６は曖昧語辞書記憶部（曖昧語辞書記憶手段）、７は推定値情報記憶部（推定値情報記憶手段）、８は曖昧語翻訳部（曖昧語翻訳手段）、９は曖昧語記憶部（曖昧語記憶手段）、１０は推定知識記憶部（推定知識記憶手段）、１１は推定値適応部（推定値適応手段）である。
【００１６】
次に動作について説明する。
まず、利用者からの自然言語がコマンド変換部２へ入力される。入力される自然言語は、利用者の発話を音声認識した結果のテキストである。ただし入力可能なものとしては利用者からの自然言語に限定するものではない。キーボードやＧＵＩなどの別の手段から入力されたテキストであっても構わない。さらに、入力された自然言語に対し、コマンド変換の前段階として、形態素解析や構文解析、意味解析などの言語処理が施された結果の、意味的な構造を持った表現形式である意味表現であってもよい。
【００１７】
次に、コマンド変換部２は、コマンド知識記憶部１に記憶されたコマンド知識に従って、入力された自然言語を対話システムへのコマンドに変換する。コマンド知識記憶部１には、自然言語とコマンドとの対応を記述したコマンド知識が記憶されている。コマンドの定義の一例としては、コマンド＝意図：（項目１、項目値１）、（項目２、項目値２）、…、（項目ｎ、項目値ｎ）、のように表現し、コマンドを、意図と、そのパラメータとなる項目及び項目値の対の組み合わせで表現する。ここで、意図は対話システムの動作に対応して定義し、項目は検索対象データに関する検索条件の種類に対応して定義する。項目値は項目に属する具体的な値である。例えば、ホテル予約の場合、意図としては、＜意図：検索要求＞、＜意図：予約要求＞、＜意図：項目質問＞、＜意図：項目値確認＞、＜意図：項目値表明＞、＜意図：肯定＞、＜意図：否定＞、などであり、項目及び項目値の対としては、（＜場所＞、横浜）、（＜料金＞、６０００≧）、（＜部屋タイプ＞、シングル）、（＜人数＞、２）、（＜対象＞、ホテル）、などである。
【００１８】
コマンド知識記憶部１に記憶されているコマンド知識は、上記のコマンド表現と、自然言語との対応関係を規定するための知識である。例えば、「教えて下さい」、「ありますか」、「探しているのですが」、などの自然言語に対しては、＜意図：検索要求＞が対応し、「どこですか」、「いくらですか」、に対しては、＜意図：項目質問＞が対応する。また、例えば、「横浜で」に対しては、項目及び項目値の対として、（＜場所＞、横浜）が対応し、「６０００円以下の」に対しては、（＜料金＞、６０００≧）が対応する。コマンド知識は、これらの対応関係について、自然言語に関する形態素情報や助詞、助動詞などの意味的な情報を用いて、対応表や変換規則などの形式で表現する。
【００１９】
さらに、コマンド変換部２は、「安い」、「近い」などのような項目値が一意に決定できない曖昧語に対して、曖昧語辞書記憶部６に記憶された、曖昧語と、曖昧語の項目と、曖昧語に対応する意味標識の対応関係を参照し、入力に含まれる曖昧語を、曖昧語に対応する意味標識に置換して、曖昧語の項目と意味標識の対を作成する。さらに、コマンド知識を参照して、入力された自然言語を、上記曖昧語の項目と意味標識の対を含んだコマンドの表現に変換する。
【００２０】
図２に曖昧語辞書記憶部６に記憶する対応関係の例を示す。例えば、項目＜料金＞に関しては、曖昧語「自立語（安い）」に対して意味標識「＄ｃｈｅａｐ１」が対応している。コマンド変換部２は、入力された自然言語に曖昧語「安い」が含まれていれば、上記の対応関係を参照して、（＜料金＞、＄ｃｈｅａｐ１）に変換する。以上より、例えば、「横浜で安いホテルを教えて下さい」という自然言語は、コマンド変換部２により、「＜意図：検索要求＞：（＜場所＞、横浜）、（＜料金＞、＄ｃｈｅａｐ１）、（＜対象＞、ホテル）」というコマンドに変換される。
【００２１】
曖昧語翻訳部８は、コマンド変換部２から入力されたコマンド中に曖昧語の意味標識が含まれている場合には、推定値情報記憶部７で記憶されている利用者毎の推定値情報から、現在システムを対話している利用者の利用者識別子に対応する推定値情報を参照し、曖昧語の推定値を決定してコマンド中の曖昧語の意味標識を決定された推定値に置き換え、対話管理部５へ出力する。
【００２２】
推定値情報記憶部７は、曖昧語と曖昧語に対応する意味標識の推定値情報を利用者毎に記憶する。推定値情報は、利用者が過去の対話で曖昧語をどんな値として用いたかの情報を記録したものであり、利用者とシステムとの対話の履歴を利用して、後述する推定値適応部１１により学習される。なお、利用者が初めてシステムと対話する場合には、曖昧語の意味標識に対して初期に設定された値が推定値情報として用いられる。
【００２３】
対話管理部５は、コマンドが入力されると、設定された所定の対話手順に基づいて、コマンドに対応したシステムの動作を実行し、システムと利用者との対話を管理する。所定の対話手順の一例としては、例えば、コマンドの意図が検索要求であれば、対話管理部５は、コマンドのパラメータである項目及び項目値の対を用いて検索式を作成してデータベース３の検索を行ない、検索結果を利用者へ通知するための応答の意味表現を出力する。データベース３は、項目及び項目値が付与された検索対象データの集合を記憶する。図３はデータベース３に記憶される検索対象データの例であり、各対象名に対し、項目と項目値のデータが与えられている。
【００２４】
あるいは、所定の対話手順についての他の例としては、コマンドの意図が予約要求である場合、予約に必須の項目、例えば、＜対象名＞、＜予約日＞、＜人数＞、＜部屋タイプ＞、などに対する項目値が全て得られていれば、予約動作の確認を利用者に行なって、確認後に予約動作の実行を行ない、全て得られていない場合には、不足している項目の項目値を利用者に質問するための応答の意味表現を出力する。
【００２５】
応答の意味表現は、システムが利用者へ通知する応答文を生成するための表現形式である。一般的な音声自動応答装置では、応答の意味表現から応答文を生成する文生成手段と、文生成手段から受け取った応答文を合成音声へ変換する音声合成手段とを備えており、対話管理部５から出力される応答の意味表現は音声として利用者に通知される。
【００２６】
例えば、この応答の意味表現としては、利用者の「横浜駅で６０００円以下のホテルを教えて下さい」という入力に対してシステムがデータベース検索を行なった結果が、Ａホテル４５００円、Ｂホテル５５００円、Ｃホテル６０００円、の３件である場合、その応答の意味表現は、「＜検索結果提示＞：（対象名Ａホテル（＜料金＞４５００円））、（対象名Ｂホテル（＜料金＞５５００円））、（対象名Ｃホテル（＜料金＞６０００円））」のような形式となる。
【００２７】
さらに、対話管理部５は、利用者が対話を開始してからの応答の意味表現を、対話の開始から応答順に付与される応答識別番号とともに応答履歴記憶部４に記録する。
以上が、推定値情報記憶部７に記憶された利用者個人に対応した推定値情報を利用して、曖昧語の推定値を決定する場合の動作例である。
【００２８】
次に、推定値情報記憶部７に記憶される推定値情報を学習する場合の動作例について説明する。
曖昧語記憶部９は、曖昧語の意味標識を曖昧語の項目とともに記憶するものであり、対話の開始時からの入力識別番号が付与された形式で記憶する。例えば、対話の３番目の発話で入力されたコマンドが、「＜意図：検索要求＞：（＜場所＞、横浜）、（＜料金＞、＄ｃｈｅａｐ１）、（＜対象＞、ホテル）」の場合、（３：＜料金＞、＄ｃｈｅａｐ１）という形式のデータが、曖昧語記憶部９に登録される。推定値適応部１１は、コマンド変換部２から入力されたコマンドに曖昧語の意味標識が含まれる場合に、まず、曖昧語記憶部９へ曖昧語の意味標識を上記の形式で登録する。
【００２９】
次に、推定値適応部１１は、上記コマンドに対する対話管理部５の応答が利用者に対して通知された後に、この応答に対する利用者の発話内容から、曖昧語記憶部９に登録された曖昧語の意味標識に対する推定値を推定する。次に推定の方法を具体例とともに説明する。例えば、利用者の発話が「横浜で安いホテルを教えて下さい」であって、これに対する対話管理部５の応答が、「横浜の安いホテルは、Ａホテル４５００円、Ｂホテル５５００円、Ｃホテル６０００円、があります」であったとする。この応答に対する利用者の発話は、例えば、以下の３通りが考えられる。
（１）「１００００円くらいが良いのですが」
（２）「もう少し高くても構いません」
（３）「Ｃホテルの最寄駅はどこですか」
【００３０】
（１）は、応答中に示された金額を受け入れられず、利用者が明示的に自分が想定している金額を表明している場合である。このときは、「安い」という曖昧語の推定値は、入力されたコマンド中の１００００円程度であると推定できる。
（２）は、応答中に示された金額を受け入れられず、利用者がシステムに対し再度、検索要求の意図の発話をしている場合である。このときは、入力されたコマンド中の「高い」という別の曖昧語により、「安い」という曖昧語の推定値は、提示した金額の最高値である６０００円より高い金額であると推定できる。
（３）は、発話の意図が、項目＜料金＞以外の項目＜最寄駅＞を尋ねる＜項目質問＞の意図であることから、応答中に示された金額のうち、Ｃホテルの金額を受け入れたと考えられる。そこで、「安い」という曖昧語の推定値は、６０００円程度であると推定できる。
【００３１】
以上のような推定を行なうために、推定知識記憶部１０は、応答履歴記憶部４に記憶された応答意味表現と、コマンド変換部２から入力されたコマンドとの関係から判定するための推定知識を曖昧語の推定値として記憶する。推定値適応部１１は、入力されたコマンド及び応答履歴記憶部４の応答の意味表現を参照して、推定知識記憶部１０の推定知識に基づいて、曖昧語の推定値を決定する。これより、利用者識別子に対応した推定値情報記憶部７の推定値情報を更新して学習し、学習の対象とした曖昧語の意味標識を曖昧語記憶部９から削除する。図４に推定値情報記憶部７に記憶されたデータ構造を示す。
【００３２】
推定知識記憶部１０に記憶された推定知識は、例えば、上記（１）〜（３）の場合分けができるような条件判定部を持つ知識として、ｉｆ〜ｔｈｅｎ〜形式のルールで以下のように記述する。
（１）ｉｆ（応答履歴記憶部４の応答中に＜検索結果提示＞の項目値Ａが存在するａｎｄ現在のコマンド中に＜意図：項目値表明＞とともに項目値Ｂが存在する）ｔｈｅｎ（推定値を項目値Ｂとする）
（２）ｉｆ（応答履歴記憶部４の応答中に＜検索結果提示＞の項目値Ａが存在するａｎｄ現在のコマンド中に＜意図：検索要求＞とともに項目値Ａに対応する項目に関する曖昧語の意味標識が存在する）ｔｈｅｎ（次のコマンド入力を待つ）
（３）ｉｆ（応答履歴記憶部４の応答中に＜検索結果提示＞の項目値Ａが存在するａｎｄ現在のコマンド中に項目値Ａと対応しない項目に関する＜意図：項目質問＞とともに直前の応答中の対象名が存在する）ｔｈｅｎ（推定値を直前の応答中の対象名に対応する項目値Ａとする）
【００３３】
推定値適応部１１は、上記のようにして求めた推定値を推定値情報記憶部７における推定値情報として記録する。推定値情報は、例えば、各項目の各曖昧語の意味標識に関して、各推定値の頻度情報を記録しておけばよい。
【００３４】
以上のように上記実施の形態１によれば、利用者の曖昧語を含む自然言語の入力に対して、意図、項目、及び項目値からなる表現でコマンドに変換し、曖昧語に対応する意味標識の推定値を決定してコマンドとともに出力することにより、効率的かつ柔軟な検索ができるという効果が得られる。
また、曖昧な語が表わす値を利用者の発話履歴から学習して、利用者に応じて自動的に設定して翻訳することにより、情報検索の効率化、及び利用者の感覚に合致した自然な情報提示を行なうことができ、利用者の利便性を向上させることができるという効果が得られる。
【００３５】
なお、上記実施の形態１において、複数の検索対象がある場合には、項目＜料金＞をそれぞれ別な項目として定義する。例えば、検索項目がホテル及びレストランである場合には、ホテルは、Ｓｅａｒｃｈ［ｈｏｔｅｌ］：＜料金（ホテル）＞＝＄ｃｈｅａｐｈｏｔｅｌとなり、レストランは、Ｓｅａｒｃｈ［ｒｅｓｔａｕｒａｎｔ］：＜料金（レストラン）＞＝＄ｃｈｅａｐｒｅｓｔａｕｒａｎｔとなる。
【００３６】
実施の形態２．
図５はこの発明の実施の形態２における音声対話システムの機能ブロック構成図であり、図において、１２は補間モデル記憶部（補間モデル記憶手段）、１３は推定値補間部（推定値補間手段）である。他の構成は図１に示した実施の形態１の構成と同じであり、同一の符号で表されている。
次に動作について説明する。
この実施の形態２は、利用者が対話システムを利用した回数が少ない場合に、推定値情報記憶部７に記憶される推定値情報の学習において、推定値情報が未学習である曖昧語の意味標識に対して、他の学習済の曖昧語の推定値情報を用いて、未学習の曖昧語の意味標識の推定値を補間して算出するものである。
【００３７】
補間モデル記憶部１２は、曖昧語の意味標識と、該意味標識に対応する推定値との関係を関数として規定し、補間モデルとして記憶する。補間モデルとして用いる上記関数は、曖昧語の意味標識が与えられたときにその推定値を補間して算出できるものであればよい。例えば、図２に示すように、＜料金＞という同一項目に対する複数の曖昧語の意味標識として、＄ｃｈｅａｐｅｓｔ（曖昧語：できるだけ安い）、＄ｃｈｅａｐ１（曖昧語：安い）、＄ｃｈｅａｐ２（曖昧語：できれば安い）、＄ｎｏｔ＿ｓｏ＿ｅｘｐ（曖昧語：あまり高くない）、＄ｅｘｐ（曖昧語：少し高くても良い）、などが定義されている場合、これらの推定値を順に、ｖ１、ｖ２、ｖ３、ｖ４、ｖ５、とすれば、ｖ１＝ｖ２−１０００、ｖ１＝ｖ３−２０００、ｖ１＝ｖ４−３０００、ｖ１＝ｖ５−４０００、などのように、推定値同士の差分を規定する関数を記憶しておく。
【００３８】
推定値補間部１３は、曖昧語翻訳部８からの利用者識別子及び曖昧語の意味標識を入力とし、推定値情報記憶部７に記憶されている利用者識別子に対応した推定値情報を参照して、入力された曖昧語の意味標識に対する推定値情報が未学習の場合に、補間モデル記憶部１２の補間モデルを用いて、学習済の曖昧語の意味標識に対する推定値情報から、未学習の該意味標識の推定値を算出して曖昧語翻訳部８へ出力する。例えば、曖昧語の意味標識＄ｃｈｅａｐｅｓｔ（曖昧語：できるだけ安い）の推定値ｖ１が未学習であり、＄ｃｈｅａｐ１（曖昧語：安い）の推定値ｖ２が学習済であって、ｖ２＝６０００であるとする。このとき、推定値補間部１３は、補間モデル記憶部１２に記憶された上記推定値同士の差分を規定する関数を参照して、ｖ１＝ｖ２−１０００＝５０００、のように、未学習の推定値ｖ１を算出する。
【００３９】
以上のように、上記実施の形態２によれば、未学習の曖昧語の推定値を学習済の曖昧語の推定値情報から補間して算出できるようにしたので、利用者が対話システムを利用した回数が少ない場合でも、曖昧語の項目値を推定して、情報検索の効率化、及び利用者の感覚に合致した自然な情報提示を行なうことができ、利用者の利便性を向上させることができるという効果が得られる。
【００４０】
実施の形態３．
図６はこの発明の実施の形態３における音声対話システムの機能ブロック構成図であり、図において、１４は全利用者推定値情報記憶部（全利用者推定値情報記憶手段）、１５は推定値選択部（推定値選択手段）である。他の構成については図１に示した実施の形態１の構成と同じであり、同一の符号で表されている。
【００４１】
次に動作について説明する。
この実施の形態３は、利用者が対話システムを利用した回数が少ない場合に、推定値情報記憶部７に記憶される推定値情報が未学習である曖昧語の意味標識に対して、推定値情報の一致度が高い他の利用者の学習済の曖昧語の推定値情報を用いて、未学習の曖昧語の意味標識を推定して算出するものである。
【００４２】
全利用者推定値情報記憶部１４は、全ての利用者に対する推定値情報を利用者識別子に対応して記憶する。全利用者推定値情報記憶部１４におけるデータ構造は、図４に示したデータ構造にさらに利用者識別子を付加したものになる。推定値選択部１５は、曖昧語翻訳部８からの利用者識別子及び曖昧語の意味標識を入力とし、推定値情報記憶部７に記憶されている利用者識別子に対応した推定値情報を参照して、入力された曖昧語の意味標識に対する推定値情報が未学習の場合に、全利用者推定値情報記憶部１４を参照する。そして、現在システムを利用している利用者Ａの推定値情報と、他の利用者Ｂの推定値情報との、推定値情報の一致度を算出する。一致度は、例えば、利用者Ａ、利用者Ｂともに学習済の曖昧語の推定値を比較し、推定値の差がある一定の範囲内であれば、その曖昧語の推定値が一致しているとし、一致した曖昧語の数を一致度として定義する。
【００４３】
推定値選択部１５は、全利用者推定値情報記憶部１４に記憶された全ての利用者に対する推定値情報を参照して、利用者Ａで未学習である曖昧語の推定値情報を有する利用者の内、利用者Ａとの一致度が最も高い利用者Ｃを選択し、利用者Ｃの学習済の曖昧語の推定値情報を、利用者Ａの未学習の意味標識の推定値として曖昧語翻訳部８へ出力する。
【００４４】
以上のように、上記実施の形態３によれば、未学習の曖昧語の推定値を、推定値情報の一致度が高い他の利用者の推定値で代用するようにしたので、利用者が対話システムを利用した回数が少ない場合でも、曖昧語の推定値を推定して、情報検索の効率化、及び利用者の感覚に合致した自然な情報提示を行なうことができ、利用者の利便性を向上させることができるという効果が得られる。
【００４５】
なお、上記各実施の形態においては、音声対話システムの発明について説明したが、この発明の音声対話システム及び電話回線を含む統合的なコンピュータシステムを構築して、電話回線を介して入力された利用者すなわち顧客の曖昧語を含む自然言語を理解して、顧客が要望する情報を安い料金で提供するビジネスを展開することができる。その他、例えば、受付、注文、予約などの各種サービス代行や、利用者が要求する情報の提供を行なう電話音声自動応答装置にもこの発明の音声対話システムを適用することにより著しい効果が得られる。あるいは、発明の音声対話システムを適用することにより、顧客の曖昧語を含む自然言語を理解する自動販売機を実現できるという効果が得られる。
【００４６】
【発明の効果】
以上のように、この発明によれば、音声対話システムを、対話システム動作に対応して定義されたコマンド意図、対話システム動作のパラメータの種類を定義した項目、及び項目に対応する値である項目値からなる表現を対話システムのコマンドとし、自然言語をコマンドへ変換するための変換知識をコマンド知識として記憶するコマンド知識記憶手段と、自然言語において項目値へ一意に変換できない語を曖昧語とし、曖昧語、曖昧語の項目、及び曖昧語に対応する意味標識を曖昧語辞書として記憶する曖昧語辞書記憶手段と、曖昧語辞書記憶手段に記憶された曖昧語辞書を参照して、利用者が入力した自然言語に含まれる曖昧語を曖昧語に対応する意味標識に置換して、曖昧語の項目と意味標識の対を作成し、コマンド知識記憶手段に記憶されたコマンド知識を参照して、入力された自然言語を、曖昧語の項目と意味標識の対を含んだコマンドに変換するコマンド変換手段と、曖昧語に対応する意味標識の値を推定するための推定値情報を利用者を特定する利用者識別子とともに記憶する推定値情報記憶手段と、コマンド変換手段から入力される曖昧語の項目と意味標識の対を含んだコマンドに対し、推定値情報記憶手段に記憶された利用者識別子に対応した推定値情報を参照して、曖昧語に対応する意味標識の推定値を決定してコマンドとともに出力する曖昧語翻訳手段と、前記意味標識に対応する推定値同士の関係を関数として規定し、補間モデルとして記憶した補間モデル記憶手段と、曖昧語翻訳手段からの利用者識別子及び曖昧語の意味標識を入力とし、利用者識別子に対応した推定値情報における曖昧語のうち、入力された意味標識の推定値情報が未学習である曖昧語に対して、上記補間モデル記憶手段の補間モデルを用いて、学習済の曖昧語の意味標識に対する推定値情報から、未学習の意味標識の推定値を算出して曖昧語翻訳手段へ出力する推定値補間手段とを備えるように構成したので、利用者の曖昧語を含む自然言語の入力に対して、意図、項目、及び項目値からなる表現でコマンドに変換し、曖昧語に対応する意味標識の推定値を決定してコマンドとともに出力することにより、効率的かつ柔軟な検索ができるという効果がある。また、利用者が対話システムを利用した回数が少ない場合でも、曖昧語の項目値を推定して、情報検索の効率化、及び利用者の感覚に合致した自然な情報提示を行なうことができ、利用者の利便性を向上させることができるという効果がある。
【００４８】
この発明における音声対話システムは、対話システム動作に対応して定義されたコマンド意図、対話システム動作のパラメータの種類を定義した項目、及び項目に対応する値である項目値からなる表現を対話システムのコマンドとし、自然言語をコマンドへ変換するための変換知識をコマンド知識として記憶するコマンド知識記憶手段と、自然言語において項目値へ一意に変換できない語を曖昧語とし、曖昧語、曖昧語の項目、及び曖昧語に対応する意味標識を曖昧語辞書として記憶する曖昧語辞書記憶手段と、上記曖昧語辞書記憶手段に記憶された曖昧語辞書を参照して、利用者が入力した自然言語に含まれる曖昧語を曖昧語に対応する意味標識に置換して、曖昧語の項目と意味標識の対を作成し、上記コマンド知識記憶手段に記憶されたコマンド知識を参照して、入力された自然言語を、上記曖昧語の項目と意味標識の対を含んだコマンドに変換するコマンド変換手段と、曖昧語に対応する意味標識の値を推定するための推定値情報を利用者を特定する利用者識別子とともに記憶する推定値情報記憶手段と、上記コマンド変換手段から入力される曖昧語の項目と意味標識の対を含んだコマンドに対し、上記推定値情報記憶手段に記憶された利用者識別子に対応した推定値情報を参照して、曖昧語に対応する意味標識の推定値を決定してコマンドとともに出力する曖昧語翻訳手段と、全ての利用者に対する推定値情報を記憶する全利用者推定値情報記憶手段と、曖昧語翻訳手段からの利用者識別子及び曖昧語の意味標識を入力とし、利用者識別子に対応した推定値情報における曖昧語のうち、入力された意味標識の推定値情報が未学習である曖昧語に対して、上記全利用者推定値情報記憶手段に記憶された全ての利用者に対する推定値情報を参照して、学習済の曖昧語の意味標識に対する推定値情報との一致度が高い他の利用者の推定値情報を利用し、未学習の意味標識の推定値を選択して曖昧語翻訳手段へ出力する推定値選択手段とを備えるように構成したので、利用者が対話システムを利用した回数が少ない場合でも、曖昧語の推定値を推定して、情報検索の効率化、及び利用者の感覚に合致した自然な情報提示を行なうことができ、利用者の利便性を向上させることができる効果がある。
【００４９】
この発明における音声対話システムにおいて、項目及び項目値が付与された検索対象データの集合を記憶するデータベースと、入力されたコマンドに対応して、所定の対話システム動作を実行してシステムと利用者との対話を管理するとともにデータベースを検索し、利用者へ通知する応答文の意味内容を表わす応答意味表現を生成する対話管理手段とを備えるように構成したので、利用者の曖昧語を含む自然言語の入力に対して、意図、項目、及び項目値からなる表現でコマンドに変換してデータベースを検索し、利用者の入力に適応した応答ができるという効果がある。
【図面の簡単な説明】
【図１】この発明の実施の形態１における音声対話システムの機能ブロック構成図である。
【図２】この発明の各実施の形態における曖昧語辞書記憶部に記憶される項目、曖昧語、及び意味標識の対応関係の例を示す図である。
【図３】この発明の各実施の形態におけるデータベースに記憶される検索対象データの例を示す図である。
【図４】この発明の実施の形態１における推定情報記憶部に記憶されるデータ構造を示す図である。
【図５】この発明の実施の形態２における音声対話システムの機能ブロック構成図である。
【図６】この発明の実施の形態３における音声対話システムの機能ブロック構成図である。
【符号の説明】
１コマンド知識記憶部（コマンド知識記憶手段）、２コマンド変換部（コマンド変換手段）、３データベース、４応答履歴記憶部（応答履歴記憶手段）、５対話管理部（対話管理手段）、６曖昧語辞書記憶部（曖昧語辞書記憶手段）、７推定値情報記憶部（推定値情報記憶手段）、８曖昧語翻訳部（曖昧語翻訳手段）、９曖昧語記憶部（曖昧語記憶手段）、１０推定知識記憶部（推定知識記憶手段）、１１推定値適応部（推定値適応手段）、１２補間モデル記憶部（補間モデル記憶手段）、１３推定値補間部（推定値補間手段）、１４全利用者推定値情報記憶部（全利用者推定値情報記憶手段）、１５推定値選択部（推定値選択手段）。

Claims

対話システム動作に対応して定義されたコマンド意図、対話システム動作のパラメータの種類を定義した項目、及び項目に対応する値である項目値からなる表現を対話システムのコマンドとし、自然言語をコマンドへ変換するための変換知識をコマンド知識として記憶するコマンド知識記憶手段と、
自然言語において項目値へ一意に変換できない語を曖昧語とし、曖昧語、曖昧語の項目、及び曖昧語に対応する意味標識を曖昧語辞書として記憶する曖昧語辞書記憶手段と、
上記曖昧語辞書記憶手段に記憶された曖昧語辞書を参照して、利用者が入力した自然言語に含まれる曖昧語を曖昧語に対応する意味標識に置換して、曖昧語の項目と意味標識の対を作成し、上記コマンド知識記憶手段に記憶されたコマンド知識を参照して、入力された自然言語を、上記曖昧語の項目と意味標識の対を含んだコマンドに変換するコマンド変換手段と、
曖昧語に対応する意味標識の値を推定するための推定値情報を利用者を特定する利用者識別子とともに記憶する推定値情報記憶手段と、
上記コマンド変換手段から入力される曖昧語の項目と意味標識の対を含んだコマンドに対し、上記推定値情報記憶手段に記憶された利用者識別子に対応した推定値情報を参照して、曖昧語に対応する意味標識の推定値を決定してコマンドとともに出力する曖昧語翻訳手段と、
前記意味標識に対応する推定値同士の関係を関数として規定し、補間モデルとして記憶した補間モデル記憶手段と、
曖昧語翻訳手段からの利用者識別子及び曖昧語の意味標識を入力とし、利用者識別子に対応した推定値情報における曖昧語のうち、入力された意味標識の推定値情報が未学習である曖昧語に対して、上記補間モデル記憶手段の補間モデルを用いて、学習済の曖昧語の意味標識に対する推定値情報から、未学習の意味標識の推定値を算出して曖昧語翻訳手段へ出力する推定値補間手段と、
を備えた音声対話システム。
対話システム動作に対応して定義されたコマンド意図、対話システム動作のパラメータの種類を定義した項目、及び項目に対応する値である項目値からなる表現を対話システムのコマンドとし、自然言語をコマンドへ変換するための変換知識をコマンド知識として記憶するコマンド知識記憶手段と、
自然言語において項目値へ一意に変換できない語を曖昧語とし、曖昧語、曖昧語の項目、及び曖昧語に対応する意味標識を曖昧語辞書として記憶する曖昧語辞書記憶手段と、
上記曖昧語辞書記憶手段に記憶された曖昧語辞書を参照して、利用者が入力した自然言語に含まれる曖昧語を曖昧語に対応する意味標識に置換して、曖昧語の項目と意味標識の対を作成し、上記コマンド知識記憶手段に記憶されたコマンド知識を参照して、入力された自然言語を、上記曖昧語の項目と意味標識の対を含んだコマンドに変換するコマンド変換手段と、
曖昧語に対応する意味標識の値を推定するための推定値情報を利用者を特定する利用者識別子とともに記憶する推定値情報記憶手段と、
上記コマンド変換手段から入力される曖昧語の項目と意味標識の対を含んだコマンドに対し、上記推定値情報記憶手段に記憶された利用者識別子に対応した推定値情報を参照して、曖昧語に対応する意味標識の推定値を決定してコマンドとともに出力する曖昧語翻訳手段と、
全ての利用者に対する推定値情報を記憶する全利用者推定値情報記憶手段と、
曖昧語翻訳手段からの利用者識別子及び曖昧語の意味標識を入力とし、利用者識別子に対応した推定値情報における曖昧語のうち、入力された意味標識の推定値情報が未学習である曖昧語に対して、上記全利用者推定値情報記憶手段に記憶された全ての利用者に対する推定値情報を参照して、学習済の曖昧語の意味標識に対する推定値情報との一致度が高い他の利用者の推定値情報を利用し、未学習の意味標識の推定値を選択して曖昧語翻訳手段へ出力する推定値選択手段と、
を備えたことを特徴とする音声対話システム。
項目及び項目値が付与された検索対象データの集合を記憶するデータベースと、
入力されたコマンドに対応して、所定の対話システム動作を実行してシステムと利用者との対話を管理するとともに上記データベースを検索し、利用者へ通知する応答文の意味内容を表わす応答意味表現を生成する対話管理手段と、
を備えたことを特徴とする請求項１または請求項２のいずれか１項記載の音声対話システム。