JP4171323B2

JP4171323B2 - 認識誤り訂正方法、装置、およびプログラム

Info

Publication number: JP4171323B2
Application number: JP2003051645A
Authority: JP
Inventors: 隆明長谷川; 林　　良彦
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2003-02-27
Filing date: 2003-02-27
Publication date: 2008-10-22
Anticipated expiration: 2023-02-27
Also published as: JP2004258531A

Description

【０００１】
【発明の属する技術分野】
本発明は、録画・録音された音声ドキュメントに対して音声認識を適用することにより文字化を行う音声認識装置に関する。
【０００２】
【従来の技術】
増大するマルチメディアコンテンツの高度な利用を目的として、音声認識などのメディア認識技術の研究開発が行われている。音声認識装置はコンテンツ中の発声部分を文字化する装置であり、文字化が行われた後はさまざまな処理が可能となることから、重要な要素として位置づけられている。現在の音声認識装置においては、その性能を引き出すために、認識対象に対する適応が不可欠である。これには、認識辞書への単語の登録や、発話されやすい単語の組み合わせを言語モデルとして組み込むことが含まれる。しかしながら、これらをむやみに増やすことは、処理速度の低下だけではなく、認識精度の低下を招く。よって、認識辞書へ登録すべき単語は、認識対象と同等の性質を持つと思われる文書集合などから慎重に選択する必要がある。
【０００３】
【非特許文献１】
“Dynamic Programming Algorithm (DPA) for edit-Distance”，
http://www.csse.monash.edu.au/-lloyd/tildeAlgDS/Dynamic/Edit/
【０００４】
【発明が解決しようとする課題】
上記に述べたように、認識辞書へ登録すべき単語は慎重に選択する必要があり、実際の認識対象に含まれうる単語を１００％カバーすることは不可能である。特に、新語や、人名、地名、製品名といった固有名詞については数多くの単語が出現する可能性があり、認識対象外となること（Out of Vocabulary問題：ＯＯＶ問題）が起こる。現状の音声認識装置においては、認識辞書に登録されていない単語は絶対に認識されることはないため、認識精度の低下につながる。
【０００５】
本発明の目的は、このようなＯＯＶ問題に起因する認識誤りのうち、固有名詞に関連する認識誤りを訂正することにより、音声認識の精度向上を図った認識誤り訂正方法、装置、およびプログラムを提供することである。
【０００６】
【課題を解決するための手段】
上記の目的を達成するために、本発明の認識誤り訂正装置は、
音声認識結果を、単語の品詞情報、信頼度とともに出力する音声認識手段と、
前記音声認識結果に対し、そこに含まれる固有名詞区間に固有名詞のクラスを付加する手段と、
前記固有名詞のクラスが付加された音声認識結果と、固有名詞のクラスに応じた信頼度の閾値を記述した音声認識誤り訂正条件を照合し、信頼度が閾値よりも低い固有名詞区間を誤り訂正対象の区間として抽出する手段と、
品詞に応じた信頼度を記述した関連情報検索キー単語抽出条件にしたがって、前記固有名詞のクラスが付与された音声認識結果から、信頼度が閾値よりも高い単語集合を抽出する手段と、
該単語集合を検索条件として、所定数以下の関連文書を検索し、該関連文書中に含まれる固有名詞区間、固有名詞のクラスを得て音声認識誤り訂正候補として抽出する手段と、
それぞれの誤り訂正対象区間に対して、同じ固有名詞のクラスを持つ誤り訂正候補を選択し、当該誤り訂正対象区間と選択された誤り訂正候補とのマッチングを行い、最大のマッチ度を与える誤り訂正候補を選択し、前記誤り訂正対象の区間の誤り訂正を行う手段と
を有する。
【０００７】
通常の音声認識装置において認識精度低下の原因のひとつであるＯＯＶ問題（Out Of Vocabulary問題）のうち、例えば固有名詞に関わる認識誤りを訂正することにより、認識精度を向上させることが可能となる。
【０００８】
【発明の実施の形態】
次に、本発明の実施の形態について図面を参照して説明する。
【０００９】
図１に示すように、本発明の一実施形態の認識誤り訂正装置は入力部１００と音声認識部２００と音声認識誤り訂正部３００と音声認識誤り訂正条件テーブル３１０と固有名詞区間同定部４００と音声認識誤り訂正候補抽出部５００と関連情報検索キー単語抽出条件テーブル５１０と関連情報検索部６００と音声認識誤り訂正候補抽出条件テーブル６１０と出力部７００から構成される。
【００１０】
入力部１００は音声ドキュメントを入力する。音声認識部２００は入力された音声ドキュメントを音声認識し、その結果を信頼度とともに出力する。音声認識誤り訂正部３００は音声認識結果を入力し、あらかじめ定められた音声認識誤り訂正条件にしたがって、音声認識誤りを訂正する。音声認識誤り訂正条件テーブル３１０は音声認識誤り訂正条件を予め格納している。固有名詞区間同定部４００は入力された単語列から、そこに含まれる固有名詞区間の同定を行う。音声認識誤り訂正候補抽出部５００は音声認識誤り訂正候補である固有名詞区間を関連情報より抽出する。関連情報検索キー単語抽出条件テーブル５１０は関連情報検索キー単語抽出条件を格納している。関連情報検索部６００はあらかじめ定められた関連情報検索条件にしたがって外部データベースにおける関連文書を検索する。音声認識誤り訂正候補抽出条件テーブル６１０は、あらかじめ定められた音声認識誤り訂正候補抽出条件を格納している。
【００１１】
なお、各処理部１００、２００、３００、４００、５００、６００、７００はＣＰＵ等の制御手段で実行される。各テーブル３１０、５１０、６１０、は記憶装置に記憶される。また、各処理部からの出力を一時的に格納する記憶装置（不図示）も設けられている。
【００１２】
以下、具体例を用いて、本実施形態の音声認識誤り訂正装置の動作を説明する。
【００１３】
図２は、入力部１００から入力され、音声認識部２００により文字化された音声認識結果の一部を示している。ここで実際の発声は、「ＩＴベンチャーの中谷製作所の田中祐市部長は、新プロジェクトのシリウス・ダッシュの概要を発表した。」であったとするが、音声認識の誤りのために、「ＩＴベンチャーのなかったり製作所の田中唯一部長は、新プロジェクトのシリウス・ダッシュの概要を発表した。」のように文字化されたものとする。
【００１４】
図２に例示する音声認識部２００の出力は、ＸＭＬ（eXtensible Markup Language）言語によって構造化されている。すなわち、音声ドキュメントｄｏｃは、発声単位であるｐｈｒａｓｅの集合として表現される。各発話単位は、そこに含まれる単語ｗｏｒｄの集合として表現される。各発話単位、および、そこに含まれる各単語に対しては、その開始時刻と終了時刻がそれぞれｂｅｇｉｎ、ｅｎｄという属性を用いて記録される。さらに、各単語に対しては、音声認識により文字化された単語表記がＸＭＬ要素の内容部分に記録されるだけでなく、該単語の品詞情報、読み情報と音声認識の信頼度がそれぞれｐｏｓ、ｒｅａｄｉｎｇ、ｃｏｎｆという属性を用いて記録される。なお、図２に例示した音声認識結果は、本発明の説明に必要な概念を例示するためのものであり、ＸＭＬのタグ構造も含めて、このデータ形式に限る必要はない。また、音声認識部２００としては、このような情報を出力可能な任意の音声認識装置を適用することが可能である。
【００１５】
図３は、あらかじめ設定する音声認識誤り訂正条件を格納する音声認識誤り訂正条件テーブル３１０のエントリ例を示す。図３に示す例においては、音声認識の信頼度スコアと後述する固有名詞クラスに関する複合条件を記述している。条件の適用の仕方については後述する。なお、これらの条件は、音声認識部２００に適用する音声認識装置に応じて経験的に設定する。
【００１６】
音声認識誤り訂正部３００は、図２に示すような音声認識部２００からの出力を入力し、図３に示すような、あらかじめ定められた音声認識誤り訂正条件に基づいて、音声認識結果に含まれる音声認識誤りの訂正を行う。音声認識誤り訂正部３００は、まず、入力された音声認識結果を固有名詞区間同定部４００へと転送する。固有名詞区間同定部４００は、図２に示すような入力された音声認識結果に対し、固有名詞が発声されたと判断される区間を同定し、図４に例示するようなデータ形式を持つ処理結果を音声認識誤り訂正部３００へと返却する。
【００１７】
図４は、図２の音声認識結果に対する固有名詞区間同定部４００の処理結果を示す。図４のデータは、図２に例示する音声認識結果と同様のＸＭＬ形式であるが、固有名詞区間同定の結果がｗｏｒｄタグ中のｎｅ−ｃｌａｓｓという属性により付加されている。すなわち、ｎｅ−ｃｌａｓｓという属性の属性値がｎｉｌ以外のものは、固有名詞区間に含まれることを示しており、ｎｉｌ以外の属性値は、人名、地名といった固有名詞のクラスを示す。図４において、ｐｅｒｓｏｎという属性値は人名を、ｏｒｇａｎｉｚａｔｉｏｎという属性値は組織名を示すものとする。
【００１８】
なお、本発明においては、固有名詞区間同定部４００の具体的構成については規定しないが、図２に示すようなＸＭＬ形式による構造化されたデータ、文字列としてのテキストデータを処理可能な入力インタフェースを備えており、固有名詞区間同定の処理は、例えば、特許文献１に示される方法・装置により実現されることを想定する。また、図４に例示した固有名詞区間同定結果は、本発明の説明に必要な概念を例示するためのものであり、ＸＭＬのタグ構造も含めて、このデータ形式に限る必要はない。
【００１９】
図４に示すような固有名詞区間同定の結果が付加された音声認識結果は音声認識誤り訂正部３００へ返却される。
【００２０】
音声認識誤り訂正部３００は、固有名詞区間同定の結果が付加された入力された音声認識結果と、音声認識誤り訂正条件テーブル３１０に格納された音声認識誤り訂正条件を照合し、音声認識の誤りが含まれている可能性がある区間（低い音声認識信頼度を持つ単語を含む）、かつ、それが訂正されうる区間（何らかの固有名詞クラスを有する固有名詞区間であると同定されている）を抽出する。ここで、抽出される区間は、「固有名詞クラスが音声認識誤り訂正条件に指定された条件を満たす単語」からなる最長の部分単語列であって、「該部分単語列中に含まれる単語に対する認識信頼度の中で最小のものが音声認識誤り訂正条件に指定されている条件を満たす」ものとする。
【００２１】
図４の固有名詞区間同定の結果が付加された音声認識結果に対して、図３の音声認識誤り訂正条件を照合させると、音声認識誤りを訂正するべき区間として、次の二つを得る。ここで、／は単語境界を表し、カッコ内は該区間が持つ固有名詞クラスを示す。
・［訂正対象１］な／かったり／製作所（ｏｒｇａｎｉｚａｔｉｏｎ）
・［訂正対象２］田中／唯一／部長（ｐｅｒｓｏｎ）
音声認識誤り訂正部３００は、次に、図４の固有名詞区間同定の結果が付加された音声認識結果を音声認識誤り訂正候補抽出部５００へと送信する。
【００２２】
音声認識誤り訂正候補抽出部５００は、関連情報検索キー単語抽出条件テーブル５１０にあらかじめ格納された関連情報検索キー単語抽出条件にしたがって、図４に示すような固有名詞区間同定の結果が付加された音声認識結果から、関連情報検索部６００によって外部データベースから関連文書検索を行うための検索条件となる単語集合を抽出する。次に、これらの単語集合を検索条件として、あらかじめ音声認識誤り訂正候補抽出条件テーブル６１０に格納された音声認識誤り訂正候補抽出条件にしたがって、関連情報検索部６００により外部データベースから関連文書を検索し、音声認識誤り訂正候補の固有名詞区間を抽出する。ここで、検索結果の文書に含まれる固有名詞区間を同定するためには、固有名詞区間同定部４００を呼び出す。抽出された音声認識誤り訂正候補は、音声認識誤り訂正候補抽出部５００へと返却する。
【００２３】
図５は、関連文書検索キー単語抽出条件テーブル５１０におけるエントリ例を示す。図５に示す例は、品詞と認識信頼度に関する三通りの条件が設定されている。図５の例に示すように、音声認識の信頼度を考慮することにより、正しく認識されている可能性の高い単語を抽出する。また、名詞や動詞などの品詞を有する単語を抽出することにより、関連情報検索部６００によって、関連する文書を外部データベースから検索する際にキーワードとなりうる単語を抽出する。なお、これらの条件は、音声認識部２００に適用する音声認識装置に応じて経験的に設定する。
【００２４】
図５に示す関連情報検索キー単語抽出条件にしたがって、図４に示す固有名詞区間同定の結果が付加された音声認識結果から、関連情報検索部６００によって外部データベースから関連文書検索を行うための検索条件となる単語集合を抽出すると、以下のような単語集合が得られる。
・［検索条件単語集合］（ベンチャー、プロジェクト、シリウス、ダッシュ）
図６は、関連情報検索条件テーブル５１０におけるエントリ例を示す。図６に示すように関連情報検索条件は、３つのエントリからなる。第１のエントリは、関連情報検索部６００が検索対象とすべき外部データベースの識別子である。図６の例では、インターネット上に存在するニュース検索サイトｆｏｏ−ｎｅｗｓ．ｃｏｍが指定されている。第２のエントリは、音声認識誤り訂正候補を抽出する対象となる文書の最大数を指定する。通常のインターネットのサイト検索やデータベース検索においては、検索要求に対する適合度順に複数の文書が返却されるため、この上位から指定された数の文書を対象とする。図６の例では、上位の二件の文書のみを拡張単語の対象とすることが指定されている。第３のエントリは、実際に音声認識誤り訂正候補として抽出する固有名詞区間の最大数を指定する。図６の例では、最大５つの固有名詞区間を抽出することが指定されている。
【００２５】
上記に抽出した単語集合を検索条件とし、図６に示す関連情報検索条件によって、関連情報検索部６００による関連文書検索を行った結果、次に示すような内容を持つ関連文書１件が抽出されるものとする。
・［関連文書内容］
ベンチャー業界注目の新規プロジェクト「シリウス・ダッシュ」がいよいよスタートする。参加企業を代表する田中祐市部長（中谷製作所）、鈴木一朗取締役（株式会社ダッシュ）の両氏は、昨夜開いた記者会見の会場で、その計画の概要を公表した。
【００２６】
この文書内容は、関連情報検索部６００から音声認識誤り訂正候補抽出部５００に返却される。
【００２７】
音声認識誤り訂正候補抽出部５００は、上記のような文書内容を固有名詞区間同定部４００を起動することにより、文書中に含まれる固有名詞区間を得る。上記の例においては、以下の５つの固有名詞区間（／の後は読み、カッコ内は固有名詞クラス）が得られるものとする。
・［訂正候補ａ］シリウス／しりうす（ｏｒｇａｎｉｚａｔｉｏｎ）
・［訂正候補ｂ］田中祐市部長／たなかゆういちぶちょう（ｐｅｒｓｏｎ）
・［訂正候補ｃ］中谷製作所／なかたにせいさくしょ（ｏｒｇａｎｉｚａｔｉｏｎ）
・［訂正候補ｄ］鈴木一朗取締役／すずきいちろうとりしまりやく（ｐｅｒｓｏｎ）
・［訂正候補ｅ］株式会社シリウス／かぶしきがいしゃしりうす（ｏｒｇａｎｉｚａｔｉｏｎ）
上記のごとく得られた音声認識誤り訂正候補は、音声認識誤り訂正候補抽出部５００から音声認識誤り訂正部３００へと送信される。音声認識誤り訂正部３００は，［訂正対象１］、［訂正対象２］のような誤り訂正対象となる固有名詞区間と、［訂正候補ａ−ｅ］のような誤り訂正候補群とのマッチングを行い、誤り訂正を試みる。
【００２８】
各訂正対象に対する訂正候補群とのマッチング手順は、以下のように行う。
・［ステップ１］該訂正対象と同じ固有名詞クラスを持つ訂正候補を訂正候補群から選択する
・［ステップ２］該訂正対象と選択された訂正候補それぞれとのマッチ度を計算する
・［ステップ３］該訂正対象に対して最大のマッチ度を与える訂正候補を選択する
上記の手順において、ステップ１とステップ３は自明であるので、ステップ２について説明する。
【００２９】
訂正対象と訂正候補のマッチ度の計算としては、例えば、「読み」のひらがな文字列の類似度を用いることができる。本発明で対象とするのは音声認識の誤りであるので、訂正対象である音声認識の誤り箇所の読みは、本来発声されたであろう正解の読みと類似していることが想定されるため、この方法には妥当性がある。
【００３０】
文字列間の類似度の計算方法としては様々なものが提案されているが、代表的な手法として「編集距離」を用いる方法があり、動的計画法を用いた効率のよい処理アルゴリズム（非特許文献１）も確立しているので、例えばこの手法を用いればよい。また、この方法においては、文字列を「編集」する際のコストを定義することができるが、あらかじめ音声認識誤りの傾向が分かっていれば、これをコストに反映させておくことにより、適切に類似度を計算することができる。
【００３１】
上記の例においては、訂正対象１の「なかったり製作所」に対しては、固有名詞クラスがｏｒｇａｎｉｚａｔｉｏｎで一致していて、読みがこれと類似していると計算される「中谷製作所」が訂正候補として選択される。また、訂正対象２の「田中唯一部長」に対しては、同様にして「田中祐市部長」が訂正候補として選択される。
【００３２】
このようにして求められた訂正候補は、図４に示すような音声認識結果へと反映される。
【００３３】
図７は、図４に示す固有名詞区間同定結果を含む音声認識結果に対して、上記に示した誤り訂正候補により誤り訂正を行った後の音声認識結果の例を示す。なお、上記のごとく誤り訂正された部分については、必要に応じ、音声認識の信頼度を適当な定数（図７においては５００としている）と置き換えればよい。また、誤りの訂正によって、上記の例のごとく単語の数が変わる場合があり、ｂｅｇｉｎ、ｅｎｄの属性によって記録されている発声時間の情報を調整する必要がある。この段階において、正確な発声時間を補うことは不可能であるが、訂正の対象となった区間の始まりと終了の時間が初期の音声認識結果の時間情報と矛盾しないような適当な時間をとるようにすればよい。例えば、図７における「中谷」「製作所」の例では、「中谷」の開始時間を初期の音声認識結果である「な」の開始時間とし、終了時間を初期の音声認識結果である「かったり」の終了時間としている。
【００３４】
このような誤り訂正された音声認識結果は、音声認識誤り訂正部３００から出力部７００へと送信される。
【００３５】
図８は特願２００２-３５５２８４号に記載されている、固有名詞区間同定部４００の処理を示す流れ図ある。音声データが入力されると（ステップ８０１）、大語彙連続音声認識を行い予め指定した個数の形態素の並びの候補を出力する（ステップ４０２）。始端と終端を含めて隣接する形態素の時刻が連続でない、つまりある形態素の終了時刻とつきの形態素の開始時刻が一致しない場合は、連続でない時間帯、つまりある形態素の終了時刻を開始時刻とし、次の形態素の開始時刻を終了時刻とする時刻情報を付加した読点等の形態素情報を挿入する（ステップ８０３、８０４）。また、信頼度スコアや形態素情報がある条件を満たす場合、形態素を元雄形態素情報を保持して別の形態素に置換変形する（ステップ８０５、８０６）。例えば、また、信頼度スコアが予め設定されている閾値より小さい場合に、表記、読み、品詞の先頭にそれぞれ「ε；」を付与する。複数候補の形態素の並びから、各形態素が有する時刻情報に基づいて単語グラフを作成する（ステップ８０７）。単語グラフは、各ノードが時刻情報を持つ形態素であり、ノード間のリンクはある時刻において形態素が隣接する形態素と接続可能であることを示す。単語グラフの時刻を先頭から進めていき、単語グラフの各時刻で終わる形態素候補が存在する限り（ステップ８０８）、後続の１形態素について想定されるすべての固有表現クラスが付与された場合を仮定して（ステップ８０９）、すでに学習された言語モデル、例えば固有表現付き単語ｂｉｇｒａｍの出現頻度に基づいて各固有表現クラス付きの形態素が接続した場合の対数確率を計算する（ステップ８１０）。例えば、直前の固有表現クラスＮＣ_-1と直前の形態素ｗ_-1が与えられたときに現在の固有表現クラスＮＣが選択される確率Ｐ（ＮＣ｜ＮＣ_-1，ｗ_-1）と現在と直前の固有表現クラスが与えられたときに、現在の固有表現クラスの中で最初の単語ｗ_firstが生成される確率Ｐ（ｗ_first｜ＮＣ_-1，ｗ_-1）と、直前の形態素と現在の固有表現クラスが与えられたときに２番目以降の形態素が生成される確率Ｐ（ｗ｜ｗ_-1，ＮＣ）を下記の計算式により固有表現付きの単語ｂｉｇｒａｍ頻度Ｃから計算する。文末まで以上のステップを繰り返す。
【００３６】
【数１】

このとき置換変形されている形態素は表記、読み、品詞とも「ε」を用いて対数確率を計算する。その時刻において、それまでの累積の対数確率が最大となる固有表現クラス付き形態素を選択し、経路を保持する（ステップ８１１）。ここで、「経路を保持する」のは、後の処理で文末から後ろ向きに局所的に最大の対数確率を持つ経路をたどれるようにしておくためである。単語グラフのノードの時刻を進めて（ステップ８１２）、同様の処理を行う。文末に達したら、今度は文末から最大の対数確率（最尤）を持った経路を選択することにより、選択された経路の各形態素について固有表現クラスを出力する（ステップ２１３）。置換変形されている形態素は、例えば表記、読み、品詞に含まれる「ε；」を削除するなどして元の形態素に復元して出力する。
【００３７】
なお、本発明は専用のハードウェアにより実現されるもの以外に、その機能を実現するためのプログラムを、コンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行するものであってもよい。コンピュータ読み取り可能な記録媒体とは、フロッピーディスク、光磁気ディスク、ＣＤ−ＲＯＭ等の記録媒体、コンピュータシステムに内蔵されるハードディスク装置等の記憶装置を指す。さらに、コンピュータ読み取り可能な記録媒体は、インターネットを介してプログラムを送信する場合のように、短時間の間、動的にプログラムを保持するもの（伝送媒体もしくは伝送波）、その場合のサーバとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含む。
【００３８】
【発明の効果】
以上説明したように、本発明によれば、通常の音声認識装置において認識精度低下の原因のひとつであるＯＯＶ問題（Out Of Vocabulary問題）のうち、例えば固有名詞に関わる認識誤りを訂正することにより、認識精度を向上させることが可能となる。また、人名、地名、製品名などの固有名詞を正しく認識することは、例えば、音声認識を適用した音声ドキュメント検索システムの検索精度を向上させることにつながる。
【図面の簡単な説明】
【図１】本発明の一実施形態の音声認識装置のブロック図である。
【図２】音声認識部２００により文字化された音声認識結果の一例を示す図である。
【図３】音声認識誤り訂正条件を格納する音声認識誤り訂正条件テーブル３１０のエントリ例を示す図である。
【図４】図２の音声認識結果に対する固有名詞区間同定部４００の処理結果を示す図である。
【図５】関連文書検索キー単語抽出条件テーブル５１０におけるエントリ例を示す図である。
【図６】音声認識誤り訂正候補抽出条件テーブル６１０におけるエントリ例を示す図である。
【図７】図４に示す固有名詞区間同定結果を含む音声認識結果に対して誤り訂正候補により誤り訂正を行った後の音声認識結果の例を示す図である。
【図８】固有名詞区間同定部４００の処理例のフローチャートである。
【符号の説明】
１００入力部
２００音声認識部
３００音声認識誤り訂正部
３１０音声認識誤り訂正条件テーブル
４００固有名詞区間同定部
５００音声認識誤り訂正候補抽出部
５１０関連情報検索キー単語抽出条件テーブル
６００関連情報検索部
６１０音声認識誤り訂正候補抽出条件テーブル
７００関連情報検索キー単語抽出条件テーブル
８０１〜８１２ステップ

Claims

音声認識結果を、単語の品詞情報、信頼度とともに出力する音声認識ステップと、
前記音声認識結果に対し、そこに含まれる固有名詞区間に固有名詞のクラスを付加するステップと、
前記固有名詞のクラスが付加された音声認識結果と、固有名詞のクラスに応じた信頼度の閾値を記述した音声認識誤り訂正条件を照合し、信頼度が閾値よりも低い固有名詞区間を誤り訂正対象の区間として抽出するステップと、
品詞に応じた信頼度を記述した関連情報検索キー単語抽出条件にしたがって、前記固有名詞のクラスが付与された音声認識結果から、信頼度が閾値よりも高い単語集合を抽出するステップと、
該単語集合を検索条件として、所定数以下の関連文書を検索し、該関連文書中に含まれる固有名詞区間、固有名詞のクラスを得て音声認識誤り訂正候補として抽出するステップと、
それぞれの誤り訂正対象区間に対して、同じ固有名詞のクラスを持つ誤り訂正候補を選択し、当該誤り訂正対象区間と選択された誤り訂正候補とのマッチングを行い、最大のマッチ度を与える誤り訂正候補を選択し、前記誤り訂正対象の区間の誤り訂正を行うステップと
を有する認識誤り訂正方法。
音声認識結果を、単語の品詞情報、信頼度とともに出力する音声認識手段と、
前記音声認識結果に対し、そこに含まれる固有名詞区間に固有名詞のクラスを付加する手段と、
前記固有名詞のクラスが付加された音声認識結果と、固有名詞のクラスに応じた信頼度の閾値を記述した音声認識誤り訂正条件を照合し、信頼度が閾値よりも低い固有名詞区間を誤り訂正対象の区間として抽出する手段と、
品詞に応じた信頼度を記述した関連情報検索キー単語抽出条件にしたがって、前記固有名詞のクラスが付与された音声認識結果から、信頼度が閾値よりも高い単語集合を抽出する手段と、
該単語集合を検索条件として、所定数以下の関連文書を検索し、該関連文書中に含まれる固有名詞区間、固有名詞のクラスを得て音声認識誤り訂正候補として抽出する手段と、
それぞれの誤り訂正対象区間に対して、同じ固有名詞のクラスを持つ誤り訂正候補を選択し、当該誤り訂正対象区間と選択された誤り訂正候補とのマッチングを行い、最大のマッチ度を与える誤り訂正候補を選択し、前記誤り訂正対象の区間の誤り訂正を行う手段と
を有する認識誤り訂正装置。
請求項１に記載の認識誤り訂正方法の各ステップをコンピュータに実行させるための認識誤り訂正プログラム。