JP5044783B2

JP5044783B2 - 自動回答装置および方法

Info

Publication number: JP5044783B2
Application number: JP2007012882A
Authority: JP
Inventors: 浩郷野村
Original assignee: Kyushu Institute of Technology NUC
Current assignee: Kyushu Institute of Technology NUC
Priority date: 2007-01-23
Filing date: 2007-01-23
Publication date: 2012-10-10
Anticipated expiration: 2027-01-23
Also published as: JP2008180801A

Description

本発明は、音声認識および文章解析の誤り訂正機能を有する自動回答装置に関する。

今日、インターネットや電子メールの利用により、パソコンが家庭の中に急速に普及してきている。パソコンを操作する際、ユーザはキーボードやマウスを使ってパソコンと対話するが、人間同士の対話とは違い、ユーザがキーボードでコマンドを入力したり、マウスでクリックするなどしてパソコンに要求を伝え、パソコンはその要求にしたがって処理をし、その結果を表示するというように、その対話方法は何も知らない初心者にとってはまだまだ困難なものと言える。パソコンを操作する上で、こうした基本的な技術や知識すら必要とせずに、誰でも容易かつ手軽にパソコンと対話するには、やはり人間が用いる自然言語でコンピュータと対話でき、さらに、入力インターフェースとしてキーボードではなく音声認識を用いることが望ましい。
そこで、適切な対話を行うための音声認識方法が、特開２００３−０１５６８８号公報に開示されている。

本発明の音声認識方法は、入力した単語の音声データと単語辞書内の音声パターンとの類似度を計算し、類似度の高い順に複数の音声パターンを単語認識候補とし、前記単語認識候補を音声で出力することにより入力操作の確認を行う際に、類似度が基準よりも高いか低いかによって出力される音声の表現内容を変えることを特徴するものである。
特開２００３−０１５６８８号公報

前記背景技術の音声認識方法によれば、入力した単語の音声データと単語辞書内の音声パターンとの類似度の計算は、通常はゼロから９９９９通りの計算結果が得られ、得点数が高いほど類似度が高くなる。そこで、例えば３０００点を基準として、３０００点以下の場合には誤認識の可能性が高くなり、３０００点を越えると誤認識の可能性が低くなることが経験的に知られているので、この点数を基準としてトークバックによる表現内容を変えることにより、ユーザは、装置がきちんと判断を行っていると理解し、装置に対する信頼性を高めることができる。

しかしながら、背景技術の音声認識方法では、音声パターンの類似度の計算が単語辞書内の範囲での誤認識の判定に限定されるという課題を有する。また、音声による自然言語対話を行うためには、入力された音声を音声認識部で文字情報に変換し、入力解析部で文章解析し、問題解決部で応答情報収集や対話制御処理などにより応答内容を決定し、発話生成部で生成した応答文を音声出力部を用いて出力するといった処理が必要である。このとき、音声認識部では認識誤り、入力解析部では文章解析誤りが起こる可能性があり、これらの誤りによって問題解決に失敗してしまい、適切な応答が困難になるという問題がある。
ここで、音声による自然言語対話を実現する際に生じる音声認識誤り及び文章解析誤りについて、以下に説示する。

[１．音声認識誤り]
キーボードを使った文字入力では、誤字・脱字、仮名漢字変換誤り等の文字を打ち間違えたり文法的な間違いがあったときには、ユーザが入力前にある程度訂正して入力することができるが、音声入力では思いつくままに発話したものがそのまま認識され、入力されてしまうので、認識誤りや文法誤りなどを含む可能性が高くなる。音声認識に誤りがあると、次の文章解析でも誤った入力に基づいた解析で誤りが拡大してしまい、問題解決に大きな障害となる。以下に音声認識誤りの例を示す。
発話文：電源が入りません。
認識結果：電源がはよません。
音声認識の誤り方には以下のようなものがある。

（１）音声認識の誤りによる誤認識として、ユーザの発音やマイクの不調が原因で音の一部ないしは全部がなかった場合。

（２）音素列に混入した雑音音素による誤認識として、ユーザの意図していない発声や周囲の雑音により誤認識が起きた場合。

（３）似た音素の誤認識として、母音が同じ音で、音素が似ているため誤認識が起きた場合。

（４）音素列の不適切な区切りによる誤認識として、音声を単語に変換するときに単語の境界を間違ってしまった場合や、例えば１つの語の発声の途中に空白が入った場合。

（５）同音異義語の変換の誤りの場合。

[２．文章解析誤り]
文章解析としては、形態素解析、構文解析、意味解析、文脈解析、談話解析などがあげられる。現在、形態素解析、構文解析はかなりの技術が確立しており、日本語の構文解析としては係り受け解析がよく使われている。形態素解析器ではＪＵＭＡＮ、ＣｈａＳｅｎ、ＭｅＣａｂ、係り受け解析器ではＫＮＰ、ＣａｂｏＣｈａなどが広く利用されている。これらはかなりの精度で処理するが、誤りも少なくない。質問応答といったような意味のある対話をしようとすると、形態素解析、構文解析に続いて、意味解析なども行わなければならない。形態素解析で誤ると構文解析に影響し、構文解析で誤ると意味解析に影響するため、これらの精度がかなり高いとは言え、現実に起こる誤りを無視することはできない
図１０にＣａｂｏＣｈａでの解析誤りの例を示す。この例では「メールの」は「最初の」に係っているが、文の意味を考えると「メールの」は「設定法を」に係るはずである。係り受け解析の誤りは、一般に文が「連体修飾語句」、「挿入句」「従属節」、「並列構造」の要素を持つとき起こりやすい。

なお、音声認識と文章解析で共通して問題なのが、それぞれの精度を上げたとしてもそれ単体では１００％の精度は得られないだろうという点である。なぜなら、自然言語は本来曖昧さを含むものであり、意味や文脈を考慮しなければ、音声認識や形態素解析、構文解析時には決定できない部分が残るからである。また、人間が自由に入力できる以上、入力文自体が文法的に間違っている可能性もある。よって、自然言語対話には、対話をしながらこれらの誤りを訂正する仕組みが必要となる。そして、音声対話システムを実現するにあたっては、それぞれの誤りに対する誤り訂正機能が必要である。

本発明は、前記課題を解決するためになされたものであり、自然言語対話において、音声認識や文章解析での誤りに対して、それらを訂正する対話を自然な形の対話の一部に組み込み、入力の誤りを訂正しながら対話を適切に進行させる対話処理が可能な自動回答装置を提供することを目的とする。

[対話の制御]
話し手が聞き手に対してどのような発話で情報を伝達すべきかという原則として、一般的に以下に示すＧｒｉｃｅの公準が知られている。（１）量の公準として、過不足のない情報を伝える。（２）質の公準として、根拠のある真実や真であると思うことを告げる。（３）関係の公準として、話し手と聞き手のお互いの関連した事柄を話す。（４）様態の公準として、明瞭に簡潔に順序立てて話す。これを誤り訂正の対話での発話に当てはめ、次のよう考える。（１ａ）量の公準に対応して、音声認識や文章解析の誤りを訂正するために必要であると判断する情報を過不足なく伝える。（２ａ）質の公準に対応して、入力文について、音声認識や文章解析の誤りではない、または誤りであると判断できた部分を告げる。（３ａ）関係の公準に対応して、入力文に対する音声認識、文章解析の誤りについて話す。（４ａ）様態の公準に対応して、入力文のどの部分に対して、誤りと判断しているかがはっきりと伝わるように話す。

本発明における誤り訂正対話では、上述の条件を満たすように発話を作成する。例えば、「電源がはよません」という音声認識の誤りに対して、入力文を全部用いて「電源がはよませんといいましたか？」「電源がはよまないのですか？」等の発話は量の公準や質の公準を満たさない、この場合、正しいと判断される「電源が」を用いて「電源がどうしました？」「電源がなにですか？」等の発話が望ましい。

本発明に係る自動回答装置は、入力された文を形態素解析する形態素解析手段と、前記形態素解析された文中の品詞が一定の条件を満たす語を取り出す第１の語抽出手段と、前記抽出された各語について他の語との共起度の和を求める共起度和計算手段と、前記共起度の和の数値が所定の閾値より低い単語を入力誤りの語と判定する閾値判定手段と、入力誤りと判定された語がある場合に言い直し要求文を作成する訂正文作成手段と、前記訂正文作成手段が作成した言い直し要求文に従って言い直された入力文を入力し、元の入力文と言い直された入力文とを比較して異なった語があるか否かを判定する訂正文比較判定手段と、前記訂正文比較判定手段が、元の入力文と言い直された入力文とを比較して異なった語がないと判定した場合に、前記入力誤りと判定された語に対してＹｅｓ又はＮｏで返事することができる語尾を付加した確認文を作成する確認文作成手段と、前記確認文作成手段が作成した前記確認文に対する返事、又は、前記訂正文比較判定手段の判断結果に従って、前記言い直された入力文に誤りがあるか否かを判定するＹｅｓ／Ｎｏ判定手段と、前記Ｙｅｓ／Ｎｏ判定手段が、誤りがないと判定した前記言い直された入力文に対して、係り受け解析する係り受け解析手段と、前記言い直された入力文の品詞が一定の条件を満たす一の語を取り出す第２の語抽出手段と、前記一の語と他の語の組を作り係り受け度を求める係り受け度計算手段と、前記組同士の係り受け度の大小関係を判定する係り受け関係判定手段と、係り受け度の低い語の組について、係り受けが適切かどうかを確認する係り受け確認文をＹｅｓ又はＮｏで返事することができる語尾を付加して作成する係り受け訂正文作成手段と、前記係り受け確認文が誤りであるか否かを判定するＹｅｓ／Ｎｏ判定手段とを備え、前記係り受け訂正文作成手段が、前記係り受け確認文に従ってなされた返事が、当該係り受け確認文が誤りであることを示す返事である場合に、前記係り受け度の低い語の組よりも係り受け度が高い語の組について、Ｙｅｓ又はＮｏで返事することができる語尾を付加して再度係り受け確認文を作成するものである。ここで、「入力された文」とは、例えば、音声入力後に音声認識された文、キーボード等により書かれた文などを含む。「入力誤り」とは、例えば、音声認識の誤り、書かれた文の誤りなどを含む。なお、書かれた文の誤りとは、誤字・脱字、仮名漢字変換誤りなどがある。「前記形態素解析された文中の品詞が一定の条件を満たす語」の品詞が一定の条件を満たす場合とは、名詞、動詞、形容詞のもので非自立でなく数でもない語などを含む。また、「訂正文」とは、認識誤りがある場合の言い直し要求文、言い直し要求文に対する確認文、言い直し要求に従って語が置換された入力誤りの訂正文を含む。
これにより、音声認識等による入力における対話文中の不自然な単語の存在を簡易かつ正確に発見、訂正することができる。また、音声認識の誤りの判定において、統計的な処理がなされるため、話者との対話からの文例数が増加するに従って、共起度の和の数値の信頼性も増加し、入力誤りの訂正の精度も向上する。
また、音声認識等の入力の誤りに対して、それらを訂正する対話を自然な形の対話の一部に組み込み、音声認識等の入力の誤りを訂正しながら対話を適切に進行させることができる。
さらに、対話文中の不自然な単語の係り受けの存在を簡易かつ正確に発見、訂正することができる。文章解析の誤りの判定において、統計的な処理がなされるため、話者との対話からの文例数が増加するに従って、係り受け度の数値の信頼性も増加し、文章解析誤りの訂正の精度も向上する。
さらにまた、文章解析の誤りに対して、それらを訂正する対話を自然な形の対話の一部に組み込み、入力の誤りを訂正しながら対話を適切に進行させることができる。

本発明に係る自動回答装置は必要に応じて、前記言い直し要求文は、共起度を計算した語のうち入力誤りと判定された語の１つ前の語までの文に、予め登録された言い直しを要求する文における文末表現のテンプレートを繋げて作成されるものである。
これにより、入力文のどこで認識誤りが起こったかがはっきり分かる。また、入力の誤りに対して、それらを訂正する対話を自然な形の対話の一部に組み込み、入力の誤りを訂正しながら対話を適切に進行させることができる。

本発明に係る自動回答プログラムは、入力された文を形態素解析する形態素解析手段、前記形態素解析された文中の品詞が一定の条件を満たす語を取り出す第１の語抽出手段、前記抽出された各語について他の語との共起度の和を求める共起度和計算手段、前記共起度の和の数値が所定の閾値より低い単語を入力誤りの語と判定する閾値判定手段、入力誤りと判定された語がある場合に言い直し要求文を作成する訂正文作成手段、前記訂正文作成手段が作成した言い直し要求文に従って言い直された入力文を入力し、元の入力文と言い直された入力文とを比較して異なった語があるか否かを判定する訂正文比較判定手段、前記訂正文比較判定手段が、元の入力文と言い直された入力文とを比較して異なった語がないと判定した場合に、前記入力誤りと判定された語に対してＹｅｓ又はＮｏで返事することができる語尾を付加した確認文を作成する確認文作成手段、前記確認文作成手段が作成した前記確認文に対する返事、又は、前記訂正文比較判定手段の判断結果に従って、前記言い直された入力文に誤りがあるか否かを判定するＹｅｓ／Ｎｏ判定手段、前記Ｙｅｓ／Ｎｏ判定手段が、誤りがないと判定した前記言い直された入力文に対して、係り受け解析する係り受け解析手段、前記言い直された入力文の品詞が一定の条件を満たす一の語を取り出す第２の語抽出手段、前記一の語と他の語の組を作り係り受け度を求める係り受け度計算手段、前記組同士の係り受け度の大小関係を判定する係り受け関係判定手段、係り受け度の低い語の組について、係り受けが適切かどうかを確認する係り受け確認文をＹｅｓ又はＮｏで返事することができる語尾を付加して作成する係り受け訂正文作成手段、前記係り受け確認文が誤りであるか否かを判定するＹｅｓ／Ｎｏ判定手段としてコンピュータを機能させ、前記係り受け訂正文作成手段が、前記係り受け確認文に従ってなされた返事が、当該係り受け確認文が誤りであることを示す返事である場合に、前記係り受け度の低い語の組よりも係り受け度が高い語の組について、Ｙｅｓ又はＮｏで返事することができる語尾を付加して再度係り受け確認文を作成するものである。

本発明に係る自動回答方法は、コンピュータが、入力された文を形態素解析する形態素解析ステップと、前記形態素解析された文中の品詞が一定の条件を満たす語を取り出す第１の語抽出ステップと、前記抽出された各語について他の語との共起度の和を求める共起度和計算ステップと、前記共起度の和の数値が所定の閾値より低い単語を入力誤りの語と判定する閾値判定ステップと、入力誤りと判定された語がある場合に言い直し要求文を作成する訂正文作成ステップと、前記訂正文作成手段が作成した言い直し要求文に従って言い直された入力文を入力し、元の入力文と言い直された入力文とを比較して異なった語があるか否かを判定する訂正文比較判定ステップと、前記訂正文比較判定ステップが、元の入力文と言い直された入力文とを比較して異なった語がないと判定した場合に、前記入力誤りと判定された語に対してＹｅｓ又はＮｏで返事することができる語尾を付加した確認文を作成する確認文作成ステップと、前記確認文作成ステップが作成した前記確認文に対する返事、又は、前記訂正文比較判定ステップの判断結果に従って、前記言い直された入力文に誤りがあるか否かを判定するＹｅｓ／Ｎｏ判定ステップと、前記Ｙｅｓ／Ｎｏ判定手段が、誤りがないと判定した前記言い直された入力文に対して、係り受け解析する係り受け解析ステップと、前記言い直された入力文の品詞が一定の条件を満たす一の語を取り出す第２の語抽出ステップと、前記一の語と他の語の組を作り係り受け度を求める係り受け度計算ステップと、前記組同士の係り受け度の大小関係を判定する係り受け関係判定ステップと、係り受け度の低い語の組について、係り受けが適切かどうかを確認する係り受け確認文をＹｅｓ又はＮｏで返事することができる語尾を付加して作成する係り受け訂正文作成ステップと、前記係り受け確認文が誤りであるか否かを判定するＹｅｓ／Ｎｏ判定ステップとを実行し、前記係り受け訂正文作成ステップが、前記係り受け確認文に従ってなされた返事が、当該係り受け確認文が誤りであることを示す返事である場合に、前記係り受け度の低い語の組よりも係り受け度が高い語の組について、Ｙｅｓ又はＮｏで返事することができる語尾を付加して再度係り受け確認文を作成するものである。

（本発明の第１の実施形態）
ここで、本発明は多くの異なる形態で実施可能である。したがって、下記の実施形態の記載内容のみで解釈すべきではない。
実施形態では、主に装置について説明するが、所謂当業者であれば明らかな通り、本発明は、コンピュータで使用可能なプログラムとしても実施できる。また、本発明では、ハードウェア、ソフトウェア、または、ソフトウェア及びハードウェアの実施形態で実施可能である。プログラムは、ハードディスク、ＣＤ―ＲＯＭ、ＤＶＤ−ＲＯＭ、光記憶装置または磁気記憶装置等の任意のコンピュータ可読媒体に記録できる。さらに、プログラムはネットワークを介した他のコンピュータに記録することが出来る。

本発明に係る第１の実施形態では、対話のドメインとして、パソコン技術サポートを行うコールセンターでの質問応答を一例として取上げ、メールコールセンターでの約３年間の実務により集計された約３５，０００件の質問および回答のメールデータから取得したドメイン知識などを適用して誤り訂正を対話で行う対話処理について適用する。

[１．ハードウェア構成図.]
図１に本発明の第１の実施形態における自動回答装置のハードウェア構成図を示す。コンピュータ１は、例えば、ＣＰＵ（Central processing Unit）２、メインメモリ３、ＨＤＤ（Hard Disk Drive）４、ビデオカード５、マウス６、キーボード７、光学ディスク８等により構成される。なお、音声認識に必要な入力装置としてマイク、出力装置としてスピーカなどを外部接続することができる。また、音声認識エンジンとしては、市販のＰＣ用音声認識ソフトウェアを使用することができる。対話方式は、音声のみだけでなく画像なども使うマルチモーダル対話方式を利用することができる。

[２．ブロック構成図]
図２に本発明の第１の実施形態における自動回答装置のブロック構成図を示す。話者の音声データは、音声入力部１０から入力される。入力された音声データは、音声記憶部２０に記憶される。ここで、音声記憶部２０は、メインメモリ３やＨＤＤ４等が稼動する。なお、記録は、磁気記憶、光記憶、半導体記憶等で行うこともできる。そして、音声記憶部２０から読み出された音声データは、音声認識部３０において認識され、入力解析部５０において文章解析される。音声データは、音声認識誤りや文章解析誤りがない場合に問題解決部７０に送られる。問題解決部７０では、話者からの質問文に対して適切な回答文を選択する。適切な回答文の音声データは、発話生成部８０、音声出力部９０において処理される。なお、音声データに限らず、キーボード等で書かれた文のデータも処理することができる。

[２．１音声認識誤りの訂正]
音声認識において誤りがある場合には、音声認識誤りの訂正を行うために誤認識訂正部４０で処理が行われる。音声認識の誤りを訂正する対話は、語の共起を使って誤りがあるかどうかの判定をし、誤りがある場合は対話の制御に基づく応答として、言い直しを要求するという手法をとる。なお、音声認識だけでなく、書かれた文に対する誤りも同様に訂正することができる。

まず、誤認識判定部４１においては、音声データが形態素解析部４１１、誤認識語抽出部４１２、共起度和計算部４１３、閾値計算部４１４に送られ、音声認識に誤りがあるか否かを判定する。

具体的な例では、約１６，５００件のメールデータから質問文を抽出し、４６，２２４文について、形態素解析器ＭｅＣａｂを用いて形態素解析を行い、品詞が名詞、動詞、形容詞のもので非自立語ではなく、かつ数でない語の同文中での他の語と共起度Ｃを調べたところ、１３，９４２語についての共起度が得られた。ここで、１文中において、ある語ａの他の語ｂとの共起度Ｃ（ａ，ｂ）は、全質問文中の共起頻度ｃｆ（ａ，ｂ）、語ａと共起した語の数ｃｎ（ａ）を用いて、次式のように定義する。

この値は語ａの他の語ｂとの同じ文中での出現しやすさを表しているので、入力文中の各語ｘについて、文中の他の語Ｗｉとの共起度の和

を求めると、Ｃ（ｘ）が低いものは、音声認識誤りによって発話とは違う語が認識された可能性が高く、逆にＣ（ｘ）が高いものは、正確に認識できている可能性が高いと推測できる。

そこで、音声認識された質問文を形態素解析部４１１が形態素解析し、誤認識語抽出部４１２において品詞が名詞、動詞、形容詞のもので非自立ではなく、かつ数でない語を取り出す。共起度和計算部４１３が取り出した各語について他の語との共起度の和Ｃ（ｘ）を前述の方法で計算し、閾値計算部４１４が共起度の和の数値が閾値より低い語を認識誤りの語と判定する。なお、閾値は便宜的に０．０１とするが、統計処理における経験的な数値を適用することもできる。

一例として「パソコンの動作がとても遅い」という入力文に対しては、形態素解析の結果が図３のようになり、品詞が名詞、動詞、形容詞で非自立ではなく、かつ数でない「パソコン」「動作」「遅い」が取り出される。「パソコン」について他の２語との共起度の和を計算すると、
Ｃ（パソコン）＝Ｃ（パソコン、動作）＋Ｃ（パソコン、遅い）
＝０．１３９９５４７９０
となり、同様に「動作」「遅い」についても計算すると、
Ｃ（動作）＝０．０８９２５８３６８０９９９１７３
Ｃ（遅い）＝０．０７６４６２１６４５８８８８４５
という結果になる。この場合どの値も閾値以上なので、正しく認識された語と判断できる。

音声認識の誤りの判定においては、統計的な処理がなされるため、話者との対話からの文例数が増加するに従って、共起度の和の数値の信頼性も増加し、音声認識誤りの精度も向上する。
誤認識判定部４１により認識誤りがあると判定された場合に、訂正文作成部４２、訂正文比較判定部４３及び誤認識Ｙ／Ｎ判定部４４において行われる処理について以下に説示する。

音声認識誤りと判定された語がある場合は、訂正文作成部４２が言い直し要求文を作成する。言い直しでは、余計な音声認識誤りを避けるために、正しく認識できた語の再入力を排し、誤り部分を含み、できるだけ前の入力より短い文であるほうがよい。よって作成する要求文は、質問のどこで認識誤りが起こったかがはっきり分かるものである必要がある。そこで、共起度を計算した語のうち、誤りと判定された語の１つ前の語までの入力文を使い、その後ろに「何ですか？」等と付け加えて言い直し要求文を作成する。また、誤りと判定された語の１つ前の語の品詞が名詞の場合、その直後に助詞がある時は言い直し要求文が自然な形になるようにその後も付け加える。

例えば「検索ワードの履歴を削除する方法を教えて下さい」という発話が「検索ワードの履歴を作物方法を教えて下さい」と誤認識された場合、図４に示すように形態素解析され、Ｃ（作物）＝０．０になり名詞「作物」が誤りと判定されるので、「作物」の１つ前の語までの入力文「検索ワードの履歴」と名詞「履歴」の直後の助詞「を」使って、「検索ワードの履歴の何をですか？」という言い直し要求文が作成される。この言い直し要求文には、例えば「検索ワードの履歴がどうしましたか？」等、対話の制御に従って決まる色々な表現がある。この言い直し要求文に従って言い直された入力文を、訂正文比較判定部４３が元の入力文と比較し、誤りと判定されていた語が異なっていた場合は訂正文作成部４２が語を置換して訂正文を作成し、対話を次に進める。同じ場合はその語だけを使って「ですか？」または「と言いましたか？」と付け加えてＹｅｓ／Ｎｏで返事ができる確認文を訂正文作成部４２が作成する。ここで、言い直し要求文や確認文における文末表現をテンプレート化することもできる。誤認識Ｙ／Ｎ判定部４４において返事がＹＥＳであればそのまま対話を次に進め、Ｎｏであれば言い直し要求文からやり直す。

図５に本発明の第１の実施形態に係る自動回答装置の音声認識誤りの訂正対話例を示す。
まず、ユーザ（話者）が、「文字を入力している途中にいきなり文字がへんてこなところに飛びます」と音声入力する。しかし、システム（コンピュータ１）が「文字を入力してる途中にいきなり文字がへんでもなところに飛びます」と誤認識する。そこで、システム（コンピュータ１）が「文字を入力してる途中にいきなり文字が何ですか？」と言い直し要求文を作成する。ユーザ（話者）が「変なところに飛びます」と訂正文を音声入力する。その結果、システム（コンピュータ１）が「文字を入力してる途中にいきなり文字が変なところに飛びます」と音声入力文を訂正することができる。

[２.２文章解析誤りの訂正]
文章解析において誤りがある場合には、文章解析誤りの訂正を行うために誤解析訂正部６０で処理が行われる。文章解析誤りの訂正については、語の係り受け度を使って、入力文の係り受け解析結果で誤りの可能性がある係り受け関係を探し、見つかった場合は係り受けを確認するという手法をとる。その方法を以下に詳説する。

まず、誤解析判定部６１においては、音声データが係り受け解析部６１１、誤解析語抽出部６１２、係り受け度計算部６１３、係り受け関係判定部６１４で処理され、文章解析に誤りがあるかを判定する。

具体的な例を挙げると、質問文４６，２２４文に対して、係り受け解析器ＣａｂｏＣｈａを用いて係り受け解析を行った。その解析結果から、品詞が名詞、動詞、形容詞、のもので非自立ではなく、かつ数でない語について、ある語ａが語ｂに係っているとき、語ａの語ｂとの係りやすさを係り受け度Ｄ（ａ，ｂ）として調べた。係り受け度Ｄ（ａ，ｂ）は全質問中で語ａと語ｂが係り受け関係として出現した頻度ｄｆ（ａ，ｂ）、ａと係り受け関係になった語の数ｄｎ（ａ）を用いて、次式のように定義する。

このとき語ａの品詞が名詞で、その直後に助詞ｃがあるときは、語ｂに助詞ｃを加えて考え、助詞が違う係り受け関係は別のものとして扱った。Ｄ（ａ，ｂ）は語ａ（まはた語ａと助詞ｃ）の語ｂとの係りやすさを表しているので、入力文を係り受け解析したときに、Ｄ（ａ，ｂ）が低いものは、係り受け解析が誤っている可能性があり、逆にＤ（ａ，ｂ）が高いものは、正確に係り受け解析ができている可能性が高いと推測できる。

前述のように係り受け解析は誤っている可能性があるので、この値を過度に信用することはできないが、大量の文を解析して、頻度を調べているので、係り受け解析の精度から言って誤りが大量に出てくることはないと期待して、どの語を係り受け解析誤りの訂正対象にするかの判断材料として使う。

係り受け解析部６１１が入力文を係り受け解析し、誤解析語抽出部６１２が入力文の各文節に対して、品詞が名詞、動詞、形容詞のもので非自立、数でない語を取り出す、このとき、文節内で名詞が連続しているときは、名詞として１つにまとめ、名詞の後に動詞「する」があるものは合わせて動詞とする。また、名詞の後に助詞があるものはその助詞も取り出しておく。さらにその文節が係っている文節内でも同様に名詞、動詞、形容詞の語を取り出し、係り受けの組を作る。係り受け度計算部６１３が係り受けの組について、前述の係り受け度Ｄ（ａ，ｂ）を求め、さらに係り受け関係判定部６１４が語ａの文中に出てくる他の語ＷｉとのＤ（ａ、Ｗｉ）が存在する際は語ａと語ｂの係り受けを確認するような発話を行う。

例えば、「メールの最初の設定が分からない」という入力に対しては、図６に示す係り受け解析の結果となり、Ｄ（メールの，最初），Ｄ（最初の，設定）、Ｄ（設定が，分かる）が計算される。「メールの」に対してはＤ（メールの，設定）、Ｄ（メールの，分かる）が計算され、
Ｄ（メールの，最初）＝０．０
Ｄ（メールの，設定）＝０．０１７７９９３５２７５０８０９１
Ｄ（メールの，分かる）＝０．０
となり、「メールの」が「設定に」係るほうが係り受け度が大きいことが分かる。

文章解析の誤りの判定においては、統計的な処理がなされるため、話者との対話からの文例数が増加するに従って、係り受け関係の数値の信頼性も増加し、文章解析識誤りの精度も向上する。誤解析判定部４１により解析誤りがあると判定された場合に、係り受け文作成部６２及び誤解析Ｙ／Ｎ判定部６３において処理される内容を以下に示す。

前述の係り受け解析より「メールの」が「設定に」係るほうが係り受け度が大きいことから「メールの最初ですか？」というＹｅｓ／Ｎｏで返事ができる確認文を係り受け文作成部６２が作成する。誤解析Ｙ／Ｎ判定部６３が返事がＹｅｓであればそのまま次の対話へ、Ｎｏの場合は「メールの設定です」といった訂正を含む返事ならば「メールの」係り先を「設定」に直して次の対話へ進む。訂正を含まない返事ならば、メールの係り受け度の高かった「設定」を用い、「メールの設定ですか？」という確認文を係り受け文作成部６２が作成する。

図７に本発明の第１の実施形態に係る自動回答装置の文章解析誤りの訂正対話例を示す。
まず、ユーザ（話者）が、「子供がインストールしてあったアプリケーションを削除してしまった」と音声入力する。しかし、システム（コンピュータ１）が、音声認識後の文章解析において、「子供が」が「インストールする」に係るという解析結果を出す。そこで、システム（コンピュータ１）が「子供がインストールしてあったのですか？」と係り受けの確認文を作成する。ユーザ（話者）が「子供が削除してしまったんです」と確認文を音声入力する。その結果、システム（コンピュータ１）が「子供が」の係り先を「削除する」に訂正を行う。

[３．フローシート]
図８及び図９に本発明の第１の実施形態における自動回答装置のフローシートを示す。話者は、マイク等から音声を入力する（Ｓ１００）。メインメモリ３やＨＤＤ４等の音声記憶部２０が音声を記憶する（Ｓ２００）。ＣＰＵ２が記憶された音声の中から１文章を取り出す（Ｓ３００）。音声認識部３０が音声を認識する（Ｓ４００）。誤認識判定部４１が音声認識に誤りがあるか否かを判定する（Ｓ５００）。音声認識に誤りがない場合には、入力解析部５０が入力解析を行う（Ｓ６００）。

音声認識に誤りがある場合に訂正文作成部４２が言い直し要求文を作成する（Ｓ５０１）。音声出力部９０が言い直し要求文を音声出力する（Ｓ５０２）。話者は言い直し要求文に対して、言い直し文の音声入力をする（Ｓ５０３）。音声認識部３０が言い直し文の音声認識をする（Ｓ５０４）。訂正文比較判定部４３が元の入力文との比較を行い（Ｓ５０５）、語が異なっているか否かの判定をする（Ｓ５０６）。語が異なっている場合は、訂正文作成部が語の置換を行い訂正文を作成する（Ｓ５０７）。語が異なっていない場合は、訂正文文作成部４２が確認文を作成する（Ｓ５０８）。音声出力部９０が音声出力をする（Ｓ５０９）。話者は確認文に対してＹｅｓ又はＮｏの音声入力をする（Ｓ５１０）。音声認識部３０がＹｅｓ又はＮｏの音声認識をする（Ｓ５１１）。誤認識Ｙ／Ｎ判定部４４がＹｅｓ又はＮｏの判定を行う（Ｓ５１２）。Ｎｏの場合には訂正文作成部４２が言い直し要求文を改めて作成する（Ｓ５０１）。Ｙｅｓの場合には入力解析部５０が入力解析を行う（Ｓ６００）。

誤解析判定部６１が係り受けに誤りがあるか否かを判定する（Ｓ７００）。係り受けに誤りがある場合に係り受け文作成部６２が係り受け確認文を作成する（Ｓ７０１）。音声出力部９０が係り受け確認文を音声出力する（Ｓ７０２）。話者は係り受け確認文に対して、Ｙｅｓ又はＮｏの音声入力をする（Ｓ７０３）。音声認識部３０がＹｅｓ又はＮｏの音声認識をする（Ｓ７０４）。誤解析Ｙ／Ｎ判定部６３がＹｅｓ又はＮｏの判定を行う（Ｓ７０５）。Ｎｏの場合には係り受け文作成部６２が係り受け確認文を改めて作成する（Ｓ７０１）。Ｙｅｓの場合には、係り受け文作成部６２が係り受け訂正文を作成する（Ｓ７０６）。そして、入力解析部５０が改めて入力解析を行う（Ｓ６００）。

係り受けに誤りがない場合は、入力解析部６０が次の文章があるか否かを判定する（Ｓ８００）。次の文章がある場合には、音声認識部３０が１文章を取り出す（Ｓ３００）。次の文章がない場合には、問題解決部７０が返答バターンの抽出を行う（Ｓ９００）。音声出力部９０が音声出力する（Ｓ１０００）。
なお、上述の記載の音声に該当する部分は、音声だけに限られず、キーボード等で書かれた文なども含むものとする。

以上の前記各実施形態により本発明を説明したが、本発明の技術的範囲は実施形態に記載の範囲には限定されず、これら各実施形態に多様な変更又は改良を加えることが可能である。そして、かような変更又は改良を加えた実施の形態も本発明の技術的範囲に含まれる。このことは、特許請求の範囲及び課題を解決する手段からも明らかなことである。

本発明の第１の実施形態に係る自動回答装置のハードウエア構成図である。本発明の第１の実施形態に係る自動回答装置のブロック構成図である。本発明の第１の実施形態に係る自動回答装置の形態素解析の結果（１）である。本発明の第１の実施形態に係る自動回答装置の形態素解析の結果（２）である。本発明の第１の実施形態に係る自動回答装置の音声認識誤りの訂正対話例である。本発明の第１の実施形態に係る自動回答装置の係り受け解析の結果である。本発明の第１の実施形態に係る自動回答装置の文章解析誤りの訂正対話例である。本発明の第１の実施形態に係る自動回答装置のフローシート（１）である。本発明の第１の実施形態に係る自動回答装置のフローシート（２）である。ＣａｂｏＣｈａでの解析誤りの例である。

符号の説明

１コンピュータ
２ＣＰＵ
３メインメモリ
４ＨＤＤ
５ビデオカード
６マウス
７キーボード
８光学ディスク
１０音声入力部
２０音声記憶部
３０音声認識部
４０誤認識訂正部
４１誤認識判定部
４２訂正文作成部
４３訂正文比較判定部
４４誤認識Ｙ／Ｎ判定部
５０入力解析部
６０誤解析訂正部
６１誤解析判定部
６２係り受け文作成部
６３誤解析Ｙ／Ｎ判定部
７０問題解決部
８０発話生成部
９０音声出力部
４１１形態素解析部
４１２誤認識語抽出部
４１３共起度和計算部
４１４閾値計算部
６１１係り受け解析部
６１２誤解析語抽出部
６１３係り受け度計算部
６１４係り受け関係判定部

Claims

自然言語対話において、入力された対話における誤りに対して当該誤りを一文章ごとに訂正した訂正対話を前記自然言語対話の一部に組み込んで、前記誤りを訂正しながら前記自然言語対話を進行させる対話処理を行う自動回答装置であって、
入力された文を形態素解析する形態素解析手段と、
前記形態素解析された文中の品詞が一定の条件を満たす語を取り出す第１の語抽出手段と、
前記抽出された各語について他の語との共起度の和を求める共起度和計算手段と、
前記共起度の和の数値が所定の閾値より低い単語を入力誤りの語と判定する閾値判定手段と、
入力誤りと判定された語がある場合に言い直し要求文を作成する訂正文作成手段と、
前記訂正文作成手段が作成した言い直し要求文に従って言い直された入力文を入力し、元の入力文と言い直された入力文とを比較して異なった語があるか否かを判定する訂正文比較判定手段と、
前記訂正文比較判定手段が、元の入力文と言い直された入力文とを比較して異なった語がないと判定した場合に、前記入力誤りと判定された語に対してＹｅｓ又はＮｏで返事することができる語尾を付加した確認文を作成する確認文作成手段と、
前記確認文作成手段が作成した前記確認文に対する返事、又は、前記訂正文比較判定手段の判断結果に従って、前記言い直された入力文に誤りがあるか否かを判定するＹｅｓ／Ｎｏ判定手段と、
前記Ｙｅｓ／Ｎｏ判定手段が、誤りがないと判定した前記言い直された入力文に対して、係り受け解析する係り受け解析手段と、
前記言い直された入力文の品詞が一定の条件を満たす一の語を取り出す第２の語抽出手段と、
前記一の語と他の語の組を作り係り受け度を求める係り受け度計算手段と、
前記組同士の係り受け度の大小関係を判定する係り受け関係判定手段と、
係り受け度の低い語の組について、係り受けが適切かどうかを確認する係り受け確認文をＹｅｓ又はＮｏで返事することができる語尾を付加して作成する係り受け訂正文作成手段と、
前記係り受け確認文が誤りであるか否かを判定するＹｅｓ／Ｎｏ判定手段とを備え、
前記係り受け訂正文作成手段が、前記係り受け確認文に従ってなされた返事が、当該係り受け確認文が誤りであることを示す返事である場合に、前記係り受け度の低い語の組よりも係り受け度が高い語の組について、Ｙｅｓ又はＮｏで返事することができる語尾を付加して再度係り受け確認文を作成する自動回答装置。
請求項１に記載の自動回答装置において、
前記言い直し要求文は、共起度を計算した語のうち入力誤りと判定された語の１つ前の語までの文に、予め登録された言い直しを要求する文における文末表現のテンプレートを繋げて作成される自動回答装置。
自然言語対話において、入力された対話における誤りに対して当該誤りを一文章ごとに訂正した訂正対話を前記自然言語対話の一部に組み込んで、前記誤りを訂正しながら前記自然言語対話を進行させる対話処理を行う自動回答プログラムであって、
入力された文を形態素解析する形態素解析手段、
前記形態素解析された文中の品詞が一定の条件を満たす語を取り出す第１の語抽出手段、
前記抽出された各語について他の語との共起度の和を求める共起度和計算手段、
前記共起度の和の数値が所定の閾値より低い単語を入力誤りの語と判定する閾値判定手段、
入力誤りと判定された語がある場合に言い直し要求文を作成する訂正文作成手段、
前記訂正文作成手段が作成した言い直し要求文に従って言い直された入力文を入力し、元の入力文と言い直された入力文とを比較して異なった語があるか否かを判定する訂正文比較判定手段、
前記訂正文比較判定手段が、元の入力文と言い直された入力文とを比較して異なった語がないと判定した場合に、前記入力誤りと判定された語に対してＹｅｓ又はＮｏで返事することができる語尾を付加した確認文を作成する確認文作成手段、
前記確認文作成手段が作成した前記確認文に対する返事、又は、前記訂正文比較判定手段の判断結果に従って、前記言い直された入力文に誤りがあるか否かを判定するＹｅｓ／Ｎｏ判定手段、
前記Ｙｅｓ／Ｎｏ判定手段が、誤りがないと判定した前記言い直された入力文に対して、係り受け解析する係り受け解析手段、
前記言い直された入力文の品詞が一定の条件を満たす一の語を取り出す第２の語抽出手段、
前記一の語と他の語の組を作り係り受け度を求める係り受け度計算手段、
前記組同士の係り受け度の大小関係を判定する係り受け関係判定手段、
係り受け度の低い語の組について、係り受けが適切かどうかを確認する係り受け確認文をＹｅｓ又はＮｏで返事することができる語尾を付加して作成する係り受け訂正文作成手段、
前記係り受け確認文が誤りであるか否かを判定するＹｅｓ／Ｎｏ判定手段としてコンピュータを機能させ、
前記係り受け訂正文作成手段が、前記係り受け確認文に従ってなされた返事が、当該係り受け確認文が誤りであることを示す返事である場合に、前記係り受け度の低い語の組よりも係り受け度が高い語の組について、Ｙｅｓ又はＮｏで返事することができる語尾を付加して再度係り受け確認文を作成する自動回答プログラム。
自然言語対話において、入力された対話における誤りに対して当該誤りを一文章ごとに訂正した訂正対話を前記自然言語対話の一部に組み込んで、前記誤りを訂正しながら前記自然言語対話を進行させる対話処理を行う自動回答方法であって、
コンピュータが、
入力された文を形態素解析する形態素解析ステップと、
前記形態素解析された文中の品詞が一定の条件を満たす語を取り出す第１の語抽出ステップと、
前記抽出された各語について他の語との共起度の和を求める共起度和計算ステップと、
前記共起度の和の数値が所定の閾値より低い単語を入力誤りの語と判定する閾値判定ステップと、
入力誤りと判定された語がある場合に言い直し要求文を作成する訂正文作成ステップと、
前記訂正文作成手段が作成した言い直し要求文に従って言い直された入力文を入力し、元の入力文と言い直された入力文とを比較して異なった語があるか否かを判定する訂正文比較判定ステップと、
前記訂正文比較判定ステップが、元の入力文と言い直された入力文とを比較して異なった語がないと判定した場合に、前記入力誤りと判定された語に対してＹｅｓ又はＮｏで返事することができる語尾を付加した確認文を作成する確認文作成ステップと、
前記確認文作成ステップが作成した前記確認文に対する返事、又は、前記訂正文比較判定ステップの判断結果に従って、前記言い直された入力文に誤りがあるか否かを判定するＹｅｓ／Ｎｏ判定ステップと、
前記Ｙｅｓ／Ｎｏ判定手段が、誤りがないと判定した前記言い直された入力文に対して、係り受け解析する係り受け解析ステップと、
前記言い直された入力文の品詞が一定の条件を満たす一の語を取り出す第２の語抽出ステップと、
前記一の語と他の語の組を作り係り受け度を求める係り受け度計算ステップと、
前記組同士の係り受け度の大小関係を判定する係り受け関係判定ステップと、
係り受け度の低い語の組について、係り受けが適切かどうかを確認する係り受け確認文をＹｅｓ又はＮｏで返事することができる語尾を付加して作成する係り受け訂正文作成ステップと、
前記係り受け確認文が誤りであるか否かを判定するＹｅｓ／Ｎｏ判定ステップとを実行し、
前記係り受け訂正文作成ステップが、前記係り受け確認文に従ってなされた返事が、当該係り受け確認文が誤りであることを示す返事である場合に、前記係り受け度の低い語の組よりも係り受け度が高い語の組について、Ｙｅｓ又はＮｏで返事することができる語尾を付加して再度係り受け確認文を作成する自動回答方法。