JP2013109125A

JP2013109125A - 単語追加装置、単語追加方法、およびプログラム

Info

Publication number: JP2013109125A
Application number: JP2011253615A
Authority: JP
Inventors: Shoko Yamahata; 祥子山畠; Yoshikazu Yamaguchi; 義和山口
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2011-11-21
Filing date: 2011-11-21
Publication date: 2013-06-06
Anticipated expiration: 2031-11-21
Also published as: JP5670293B2

Abstract

【課題】少量の関連文書からでも、入力音声のタスクに関連した未登録単語を効果的に選択することで、認識辞書の語彙数の増大を抑え、認識精度を向上することができる単語追加装置を提供する。
【解決手段】本発明の単語追加装置１０は、未登録単語抽出部１００が、認識辞書を用いて、未登録単語を抽出する。未登録単語特徴量抽出部２００が、未登録単語を特徴づける共起頻度ベクトルを生成する。認識結果特徴量抽出部３００が、認識結果を特徴づける単語頻度ベクトルを生成する。タスク関連度算出部４００が、タスク関連度を算出する。未登録単語頻度算出部５００が、未登録単語の関連文書における出現頻度である未登録単語頻度を算出する。登録優先度算出部６００が、登録優先度を算出する。認識辞書登録部７００が、予め設定された閾値を用いて、追加登録単語を抽出し、認識辞書に追加登録単語を追加して拡張認識辞書を生成する。
【選択図】図１

Description

本発明は、音声認識システムに用いる認識辞書に単語を追加する単語追加装置、単語追加方法、およびプログラムに関する。

音声認識システムに用いる認識辞書に単語を追加する方法には、入力音声のタスクに関連した音声認識結果を用いてＷｅｂ上から関連文書を収集し、関連文書に含まれる認識辞書に登録されていない未登録単語を全て、ないしは頻度やｔｆ−ｉｄｆ値に応じて登録するものがある（非特許文献１および非特許文献２参照）。

また、入力音声のタスクに関連した音声認識結果と、単語同士の意味の近さを表す語彙データベースを用いて、音声認識結果に出現する各単語と未登録単語の関連度を求め、関連度が高い未登録単語を辞書に登録するもの（特許文献１参照）や、入力音声のタスクに関連した音声認識結果の特徴を表すベクトルを概念ベースから求め、単語の特徴を表すベクトルが格納されている語彙データベースを用いて、音声認識結果の特徴ベクトルと語彙データベース中に存在する未登録単語を辞書に登録するもの（特許文献２参照）がある。特許文献１，２では、未登録単語の特徴を適切にとらえるために、語彙データベースや概念ベースの構築に、大規模なコーパスを用いることを想定している。

特開２００５−２５００７１号公報特開２００５−１４９０１４号公報

C.E.Liu, K.Thambiratnam, F.Seide, "Online Vocabulary Adaptation using Limited Adaptation Data", InterSpeech2007, pp. 1822-1824. 増村亮, 咸聖俊, 伊藤彰則, "教師なし言語モデル適応のためのWeb Documentを用いた単語のトピック表現", 情報処理学会研究報告, Vol.82, No.18, pp.1-6.

しかしながら、非特許文献１，２に記載された方法において、関連文書中の認識辞書未登録単語を全て、ないしは頻度やｔｆ−ｉｄｆ値に応じて登録する場合には、入力音声のタスクに関連しない単語が登録されてしまう。その結果、認識辞書の語彙数の増大を招き、認識精度が劣化することがある。

また、特許文献１，２に記載された方法において、新たな単語を含む関連文書が少量ずつ得られ、頻繁に認識辞書の更新を行いたい場合には、更新の度に、既存の大規模なコーパスと新たに得られた関連文書の両方を用いて、概念ベースや語彙データベースを構築し直さなければいけないため、更新の度に多大な計算コストがかかることになる。また、新たに得られた関連文書にしか出現しない未登録単語は、既存の大規模なコーパスに存在する未登録単語と比較して、関連度の信頼性が低くなってしまう。ここで、少量の関連文書としては、入力音声のタスクに関連がありそうな単語をクエリとして指定したＷｅｂ検索文書、人手で収集したマニュアル、ＷｅｂＦＡＱ、ニュース文書などが考えられる。

本発明はこのような点に鑑みてなされたものであり、少量の関連文書からでも、入力音声のタスクに関連した未登録単語を効果的に選択することで、認識辞書の語彙数の増大を抑え、認識精度を向上することができる単語追加装置を提供することを目的とする。

上記の課題を解決するために、本発明の単語追加装置は、認識結果記憶部と関連文書記憶部と認識辞書記憶部と拡張認識辞書記憶部と未登録単語記憶部と未登録単語抽出部と未登録単語特徴量抽出部と認識結果特徴量抽出部とタスク関連度算出部と未登録単語頻度算出部と登録優先度算出部と認識辞書登録部を備える。認識結果記憶部には、入力音声を音声認識した認識結果が記憶される。関連文書記憶部には、入力音声のタスクに関連のある関連文書が記憶される。認識辞書記憶部には、認識辞書が記憶される。拡張認識辞書記憶部には、認識辞書に追加登録単語を追加した拡張認識辞書が記憶される。未登録単語記憶部には、認識辞書に登録されていない未登録単語が記憶される。未登録単語抽出部は、関連文書から、認識辞書を用いて、未登録単語を抽出する。未登録単語特徴量抽出部は、未登録単語と関連文書から、当該未登録単語を特徴づける共起頻度ベクトルを生成する。認識結果特徴量抽出部は、認識結果から、当該認識結果を特徴づける単語頻度ベクトルを生成する。タスク関連度算出部は、共起頻度ベクトルと単語頻度ベクトルから、未登録単語ごとに、タスク関連度を算出する。未登録単語頻度算出部は、未登録単語と関連文書から、当該未登録単語の関連文書における出現頻度である未登録単語頻度を算出する。登録優先度算出部は、タスク関連度と未登録単語頻度から、未登録単語ごとに、登録優先度を算出する。認識辞書登録部は、未登録単語と登録優先度から、予め設定された閾値を用いて、追加登録単語を抽出し、認識辞書に追加登録単語を追加して拡張認識辞書を生成する。

本発明によれば、入力音声のタスクに関連した未登録単語を効果的に選択して登録することで、認識辞書の語彙数が必要以上に増大することがなく、不要な単語が誤認識を起こす湧き出しを抑えることができ、認識精度を向上することができる。

また、大規模なコーパスを用いた概念ベースや語彙データベースを使用せず、少量の関連文書と音声認識結果のみを用いても、入力音声のタスクに必要な単語を選択できるため、未登録単語を認識辞書に追加する際の計算コストを抑えることができる。

さらに、関連文書が少量であり関連度を適切に求めることができないような単語であっても、人手により収集した関連文書であれば入力音声のタスクと関連していることがあらかじめ保証することができるため、その関連文書に多く出現する単語は入力音声のタスクに重要であると考えられ、登録すべき単語として適切に選択することができる。

実施例１の単語追加装置の構成を示すブロック図。実施例１の単語追加装置の動作を示すフローチャート。未登録単語特徴量抽出部の抽出する共起窓の例。実施例２の単語追加装置の構成を示すブロック図。実施例３の単語追加装置の構成を示すブロック図。実施例４の単語追加装置の構成を示すブロック図。実施例５の単語追加装置の構成を示すブロック図。実施例６の単語追加装置の構成を示すブロック図。

以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。

図１、図２を参照して、本発明の実施例１に係る単語追加装置１０の動作を詳細に説明する。図１は本発明の実施例１に係る単語追加装置１０の構成を示すブロック図である。図２は本発明の実施例１に係る単語追加装置１０の動作を示すフローチャートである。

以下、実際に行われる手続きの順に説明してゆく。本実施例の単語追加装置１０は、未登録単語抽出部１００、未登録単語特徴量抽出部２００、認識結果特徴量抽出部３００、タスク関連度算出部４００、未登録単語頻度算出部５００、登録優先度算出部６００、認識辞書登録部７００、認識結果記憶部９１０、関連文書記憶部９２０、認識辞書記憶部９３０、未登録単語記憶部９４０、拡張認識辞書記憶部９５０を備える。

認識結果記憶部９１０には、入力音声のタスクに関連した音声認識結果が、あらかじめ記憶されている。

関連文書記憶部９２０には、入力音声のタスクに関連のある関連文書が、あらかじめ記憶されている。

認識辞書記憶部９３０には、既存単語が単語クラスごとに登録されている認識辞書が、あらかじめ記憶されている。

未登録単語抽出部１００は、関連文書記憶部９２０に記憶されている関連文書を形態素解析する。この際、形態素解析済みの関連文書を、例えば関連文書記憶部９２０に記憶してもよい。次に、解析した形態素から、認識辞書記憶部９３０に記憶されている認識辞書に登録されていない形態素を抽出する。そして、抽出した未登録の形態素を未登録単語ｏとして未登録単語記憶部９４０へ記憶する。（Ｓ１００）。この際、未登録の形態素の他に、関連文書に対して固有表現抽出を行い、得られた単語を未登録単語ｏとして未登録単語記憶部９４０へ記憶してもよい。

未登録単語特徴量抽出部２００は、共起窓抽出手段２１０、共起頻度ベクトル生成手段２２０を備える。共起窓抽出手段２１０は、関連文書記憶部９２０に記憶されている関連文書を形態素解析し、未登録単語記憶部９４０に記憶されている未登録単語ｏと形態素解析済みの関連文書から、未登録単語ｏが含まれる文とその前後ｎ文を共起窓Ｗ_ｏとして、未登録単語ｏが出現するすべての箇所について共起窓Ｗ_ｏを抽出する（Ｓ２１０）。未登録単語抽出部１００で形態素解析済みの関連文書を記憶している場合には、記憶されている形態素解析済みの関連文書を用いてもよい。すべての共起窓Ｗ_ｏの集合をＷ_{ｏ＿ａｌｌ}と表す。図３に共起窓の例を示す。共起頻度ベクトル生成手段２２０は、共起窓の集合Ｗ_{ｏ＿ａｌｌ}に含まれる単語である共起単語ｄｔ_ｉ（以下、ｉは１からＩまでの整数、Ｉは共起窓の集合Ｗ_{ｏ＿ａｌｌ}に含まれる単語の種類の数、を表す。）をすべて抽出する。次に、すべての共起単語ｄｔ_ｉについて、共起窓の集合Ｗ_{ｏ＿ａｌｌ}における出現頻度である共起頻度ｄｆ_ｄｔ＿ｉを求める。そして、未登録単語ｏの共起頻度ベクトルｖ_ｏを、式（１）のように生成する。（Ｓ２２０）。

認識結果特徴量抽出部３００は、発話窓抽出手段３１０、単語頻度ベクトル算出手段３２０を備える。発話窓抽出手段３１０は、認識結果記憶部９１０に記憶されている認識結果がＭ発話からなるとして、認識結果をｍ発話ごとに分割して発話窓Ｗ_ｕ＿ｋ（以下、ｋは１からＭ／ｍ（小数点以下繰り上げ）の整数を表す。）を生成する（Ｓ３１０）。単語頻度ベクトル算出手段３２０は、すべての発話窓Ｗ_ｕ＿ｋについて、発話窓Ｗ_ｕ＿ｋに含まれる単語である発話単語ｗｔ_ｊ（以下、ｊは１からＪまでの整数、Ｊは発話窓Ｗ_ｕ＿ｋに含まれる単語の種類の数、を表す。）をすべて抽出する。次に、すべての発話単語ｗｔ_ｊについて、発話窓Ｗ_ｕ＿ｋにおける出現頻度である単語頻度ｗｆ_ｗｔ＿ｊを求める。そして、発話窓Ｗ_ｕ＿ｋに対する単語頻度ベクトルｖ_ｕ＿ｋを、式（２）のように生成する（Ｓ３２０）。

タスク関連度算出部４００は、コサイン距離算出手段４１０、線形二乗和計算手段４２０を備える。コサイン距離算出手段４１０は、すべての発話窓Ｗ_ｕ＿ｋについて、未登録単語ｏを特徴づける共起頻度ベクトルｖ_ｏと発話窓Ｗ_ｕ＿ｋを特徴づける単語頻度ベクトルｖ_ｕ＿ｋのコサイン距離を算出する（Ｓ４１０）。線形二乗和計算手段４２０は、すべての未登録単語ｏについて、コサイン距離算出手段４１０の算出したコサイン距離の線形二乗和を計算して、未登録単語ｏのタスク関連度Ｒ_ｏを算出する（Ｓ４２０）。

未登録単語頻度算出部５００は、関連文書記憶部９２０に記憶されている関連文書を形態素解析し、未登録単語記憶部９４０に記憶されているすべての未登録単語ｏについて、形態素解析済みの関連文書における未登録単語ｏの出現頻度である未登録単語頻度ｆ_ｏを算出する（Ｓ５００）。未登録単語抽出部１００で形態素解析済みの関連文書を記憶している場合には、記憶されている形態素解析済みの関連文書を用いてもよい。

登録優先度算出部６００は、すべての未登録単語ｏについて、タスク関連度Ｒ_ｏと未登録単語頻度ｆ_ｏから、登録優先度Ｐ_ｏを式（３）のように算出する（Ｓ６００）。

認識辞書登録部７００は、未登録単語ｏと登録優先度Ｐ_ｏから、予め設定された閾値θを用いて、追加登録単語を抽出する。次に、認識辞書記憶部９３０に記憶された認識辞書に、抽出した追加登録単語を追加して拡張認識辞書を生成する。そして、生成した拡張認識辞書を拡張認識辞書記憶部９５０へ記憶する（Ｓ７００）。未登録単語ｏを追加登録単語として抽出する条件は、例えば、未登録単語ｏの登録優先度Ｐ_ｏが予め設定した閾値θ以上とすることができる。また、登録優先度Ｐ_ｏの高い順に並べた上位θ位までとすることもできる。

このように、本実施例の単語追加装置１０は、入力音声のタスクに関連した未登録単語を効果的に選択して登録することで、認識辞書の語彙数が必要以上に増大することがなく、不要な単語が誤認識を起こす湧き出しを抑えることができ、認識精度を向上することができる。

図４を参照して、本発明の実施例２に係る単語追加装置２０の動作を詳細に説明する。図４は本発明の実施例２に係る単語追加装置２０の構成を示すブロック図である。

実施例２の単語追加装置２０は、実施例１の単語追加装置１０と比較して、共起頻度ベクトル算出手段２２０の替わりに、共起ｔｆ−ｉｄｆベクトル算出手段２２１を備える点が相違する。

共起ｔｆ−ｉｄｆベクトル算出手段２２１は、共起窓抽出手段２１０の抽出する共起窓の集合Ｗ_{ｏ＿ａｌｌ}に含まれる単語である共起単語ｄｔ_ｉをすべて抽出する。次に、すべての共起単語ｄｔ_ｉについて、共起窓の集合Ｗ_{ｏ＿ａｌｌ}における出現頻度である共起頻度ｄｔｆ_ｄｔ＿ｉを求める。さらに、関連文書記憶部９２０の記憶する関連文書のうち共起単語ｄｔ_ｉが含まれる文書数ｄｄｆ_ｄｔ＿ｉを求める。そして、共起単語ｄｔ_ｉの共起ｔｆ−ｉｄｆ値ｄｔｆｉｄｆ_ｄｔ＿ｉを、式（４）のように生成する。

ここで、Ｄは関連文書の総数を表す。
そして、未登録単語ｏの共起頻度ベクトルｖ_ｏを、式（５）のように生成する。

本発明の実施例２は、このような構成とすることにより、未登録単語ｏの共起頻度ベクトルｖ_ｏを構成する共起単語ｄｔ_ｉについて、どの未登録単語ｏの共起頻度ベクトルｖ_ｏにも出現するような単語はベクトル成分の値が低くなり、各未登録単語ｏに特有の単語はベクトル成分の値が高くなるため、より各未登録単語ｏの特徴を際立たせることができる。

図５を参照して、本発明の実施例３に係る単語追加装置３０の動作を詳細に説明する。図５は本発明の実施例３に係る単語追加装置３０の構成を示すブロック図である。

実施例３の単語追加装置３０は、実施例１の単語追加装置１０と比較して、単語頻度ベクトル算出手段３２０の替わりに、単語ｔｆ−ｉｄｆベクトル算出手段３２１を備える点が相違する。

単語ｔｆ−ｉｄｆベクトル算出手段３２１は、発話窓抽出手段３１０の抽出する発話窓Ｗ_ｕ＿ｋに含まれる単語である発話単語ｗｔ_ｊをすべて抽出する。次に、すべての発話単語ｗｔ_ｊについて、発話窓Ｗ_ｕ＿ｋにおける出現頻度である単語頻度ｗｔｆ_ｗｔ＿ｊを求める。さらに、発話窓Ｗ_ｕ＿ｋのうち発話単語ｗｔ_ｊが含まれる発話窓数ｗｄｆ_ｗｔ＿ｊを求める。そして、発話単語ｗｔ_ｊの単語ｔｆ−ｉｄｆ値ｗｔｆｉｄｆ_ｗｔ＿ｊを、式（６）のように生成する。

ここで、Ｗは発話窓の総数を表す。
そして、発話窓Ｗ_ｕ＿ｋに対する単語頻度ベクトルｖ_ｕ＿ｋを、式（７）のように生成する。

本発明の実施例３は、このような構成とすることにより、発話窓Ｗ_ｕ＿ｋに対する単語頻度ベクトルｖ_ｕ＿ｋを構成する発話単語ｗｔ_ｊについて、どの発話窓Ｗ_ｕ＿ｋに対する単語頻度ベクトルｖ_ｕ＿ｋにも出現するような単語はベクトル成分の値が低くなり、各発話窓Ｗ_ｕ＿ｋに特有の単語はベクトル成分の値が高くなるため、より各発話窓Ｗ_ｕ＿ｋの特徴を際立たせることができる。

図６を参照して、本発明の実施例４に係る単語追加装置４０の動作を詳細に説明する。図６は本発明の実施例４に係る単語追加装置４０の構成を示すブロック図である。

実施例４の単語追加装置４０は、実施例１の単語追加装置１０と比較して、登録優先度算出部６００の替わりに、登録優先度算出部６０１を備える点が相違する。

登録優先度算出部６０１は、未登録単語ｏをタスク関連度Ｒ_ｏの高い順に並べた場合の順位ｒａｎｋ_ｏｒと、未登録単語ｏを未登録単語頻度ｆ_ｏの高い順に並べた場合の順位ｒａｎｋ_ｏｆから、すべての未登録単語ｏについて、登録優先度Ｐ_ｏを式（８）のように算出する。

本発明の実施例１では、例えばタスク関連度Ｒ_ｏは未登録単語ｏごとに顕著に差が出たが、未登録単語頻度ｆ_ｏはタスク関連度Ｒ_ｏほどの差が出なかった場合、登録優先度Ｐ_ｏはタスク関連度Ｒ_ｏの寄与が大きくなり、未登録単語頻度ｆ_ｏの寄与が薄れてしまう。

本発明の実施例４は、このような構成とすることにより、それぞれの順位の逆数をとることで、タスク関連度Ｒ_ｏや未登録単語頻度ｆ_ｏ自体の値の影響をなくすことができるため、タスク関連度Ｒ_ｏと出現頻度ｆ_ｏの両者の特徴を公平に反映した登録優先度Ｐ_ｏを算出することができ、両者の特徴を効果的に加味して登録すべき単語を選択することができる。

図７を参照して、本発明の実施例５に係る単語追加装置５０の動作を詳細に説明する。図７は本発明の実施例５に係る単語追加装置５０の構成を示すブロック図である。

実施例５の単語追加装置５０は、実施例１の単語追加装置１０と比較して、未登録単語頻度算出部５００の替わりに、未登録単語ｔｆ−ｉｄｆ算出部５０１を備え、登録優先度算出部６００の替わりに、登録優先度算出部６０２を備える点が相違する。

未登録単語ｔｆ−ｉｄｆ算出部５０１は、関連文書記憶部９２０に記憶されている関連文書を形態素解析し、未登録単語記憶部９４０に記憶されているすべての未登録単語ｏについて、形態素解析済みの関連文書における未登録単語ｏの出現頻度である未登録単語頻度ｆ_ｏを算出する。未登録単語抽出部１００で形態素解析済みの関連文書を記憶している場合には、記憶されている形態素解析済みの関連文書を用いてもよい。さらに、未登録単語ｏが含まれる関連文書数ｄｆ_ｏを生成する。そして、未登録単語ｏの未登録単語ｔｆ−ｉｄｆ値ｔｆｉｄｆ_ｏを、式（９）のように生成する。

ここで、Ｄは関連文書の総数を表す。

登録優先度算出部６０２は、すべての未登録単語ｏについて、タスク関連度Ｒ_ｏと未登録単語ｔｆ−ｉｄｆ値ｔｆｉｄｆ_ｏから、登録優先度Ｐ_ｏを式（１０）のように算出する。

出現頻度が高い未登録単語は、関連文書中だけでなく、入力音声のタスクに関係のない関連文書にも出現する可能性が高い。

本発明の実施例５は、このような構成とすることにより、どの関連文書にも出現するような未登録単語の影響を抑え、それぞれの関連文書に特有な未登録単語がより際立つようになる。このため、それぞれの関連文書に特有な未登録単語の登録優先度が高くなり、これらの未登録単語を登録すべき単語として効果的に選択することができる。

図８を参照して、本発明の実施例６に係る単語追加装置６０の動作を詳細に説明する。図８は本発明の実施例６に係る単語追加装置６０の構成を示すブロック図である。

実施例６の単語追加装置６０は、実施例１の単語追加装置１０と比較して、発話窓抽出手段３１０の替わりに、発話窓抽出手段３１１を備える点が相違する。

発話窓抽出手段３１１は、認識結果記憶部９１０に記憶されている認識結果をトピック境界で分割して、発話窓Ｗ_ｕ＿ｈ（以下、ｈは１以上の整数を表す。）を生成する。

トピック境界の検出方法は、例えば、「嶋江聡，山内勝也，山下優，松永昭一，“音声認識結果と単語出現頻度を用いたニューストピック分割”，日本音響学会研究発表会講演論文集，2010.9，pp.189-190」に記載されている方法を用いることができる。

この発明の実施例６は、このように、認識結果をトピック境界で分割して発話窓を生成することにより、認識結果の各話題の特徴をより効果的に反映した単語頻度ベクトルを生成することができる。

＜プログラム、記録媒体＞
上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。

また、上述の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。

この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。

また、このプログラムの流通は、例えば、そのプログラムを記録したＤＶＤ、ＣＤ−ＲＯＭ等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。

このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるＡＳＰ（Application Service Provider）型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの（コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等）を含むものとする。

また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

本発明は、音声認識システムに用いる認識辞書に単語を追加するために利用することができる。

１０，２０，３０，４０，５０，６０単語追加装置
１００未登録単語抽出部
２００，２０１未登録単語特徴量抽出部
２１０共起窓抽出手段２２０共起頻度ベクトル算出手段
２２１共起ｔｆ−ｉｄｆベクトル算出手段
３００，３０１認識結果特徴量抽出部
３１０発話窓抽出手段３２０単語頻度ベクトル算出手段
３２１単語ｔｆ−ｉｄｆベクトル算出手段
４００タスク関連度算出部
４１０コサイン距離算出手段４２０線形二乗和計算手段
５００未登録単語頻度算出部５０１未登録単語ｔｆ−ｉｄｆ算出部
６００，６０１，６０２登録優先度算出部
７００認識辞書登録部
９１０認識結果記憶部９２０関連文書記憶部
９３０認識辞書記憶部９４０未登録単語記憶部
９５０拡張認識辞書記憶部

Claims

入力音声を音声認識した認識結果が記憶された認識結果記憶部と、
前記入力音声のタスクに関連のある関連文書が記憶された関連文書記憶部と、
認識辞書が記憶された認識辞書記憶部と、
前記認識辞書に追加登録単語を追加した拡張認識辞書を記憶する拡張認識辞書記憶部と、
前記認識辞書に登録されていない未登録単語を記憶する未登録単語記憶部と、
前記関連文書から、前記認識辞書を用いて、前記未登録単語を抽出する未登録単語抽出部と、
前記未登録単語と前記関連文書から、当該未登録単語を特徴づける共起頻度ベクトルを生成する未登録単語特徴量抽出部と、
前記認識結果から、当該認識結果を特徴づける単語頻度ベクトルを生成する認識結果特徴量抽出部と、
前記共起頻度ベクトルと前記単語頻度ベクトルから、前記未登録単語ごとに、タスク関連度を算出するタスク関連度算出部と、
前記未登録単語と前記関連文書から、当該未登録単語の前記関連文書における出現頻度である未登録単語頻度を算出する未登録単語頻度算出部と、
前記タスク関連度と前記未登録単語頻度から、前記未登録単語ごとに、登録優先度を算出する登録優先度算出部と、
前記未登録単語と前記登録優先度から、予め設定された閾値を用いて、前記追加登録単語を抽出し、前記認識辞書に前記追加登録単語を追加して前記拡張認識辞書を生成する認識辞書登録部と、
を備えることを特徴とする単語追加装置。
請求項１に記載の単語追加装置であって、
前記未登録単語特徴量抽出部は、
前記未登録単語と前記関連文書から、当該未登録単語が含まれる文とその前後ｎ文を含む共起窓を抽出する共起窓抽出手段と、
前記共起窓に含まれるすべての共起単語を抽出し、当該共起単語の前記共起窓における出現頻度である共起頻度を算出して、前記共起頻度ベクトルを生成する共起頻度ベクトル生成手段を有し、
前記認識結果特徴量抽出部は、
前記認識結果を所定の発話数で分割して発話窓を生成する発話窓抽出手段と、
前記発話窓ごとに、当該発話窓に含まれるすべての発話単語を抽出し、当該発話単語の当該発話窓における出現頻度である単語頻度を算出して、前記単語頻度ベクトルを生成する単語頻度ベクトル生成手段を有し、
前記タスク関連度算出部は、
前記共起頻度ベクトルと前記単語頻度ベクトルとのコサイン距離を算出するコサイン距離算出手段と、
前記未登録単語ごとに、前記コサイン距離の線形二乗和を計算して、前記タスク関連度を算出する線形二乗和計算手段を有し、
前記登録優先度算出部は、
前記未登録単語ごとに、前記タスク関連度と前記未登録単語頻度を乗算して、前記登録優先度を算出する
ことを特徴とする単語追加装置。
請求項２に記載の単語追加装置であって、
ｄｔ_ｉはｉ番目の前記共起単語を表し、ｄｔｆ_ｄｔ＿ｉは前記共起単語ｄｔ_ｉの前記共起頻度を表し、ｄｄｆ_ｄｔ＿ｉは前記共起単語ｄｔ_ｉが含まれる前記関連文書の数を表し、Ｄは前記関連文書の総数を表すとして、
前記共起頻度ベクトル算出手段は、

を計算することにより、前記共起頻度ベクトルを生成する
ことを特徴とする単語追加装置。
請求項２または３に記載の単語追加装置であって、
ｗｔ_ｊはｊ番目の前記発話単語を表し、ｗｔｆ_ｗｔ＿ｊは前記発話単語ｗｔ_ｊの前記単語頻度を表し、ｗｄｆ_ｗｔ＿ｊは前記発話単語ｗｔ_ｊが含まれる前記発話窓の数を表し、Ｗは前記発話窓の総数を表すとして、
前記単語頻度ベクトル算出手段は、

を計算することにより、前記単語頻度ベクトルを生成する
ことを特徴とする単語追加装置。
請求項１から４のいずれかに記載の単語追加装置であって、
ｏは前記未登録単語を表し、ｆ_ｏは前記未登録単語ｏの前記未登録単語頻度を表し、ｄｆ_ｏは前記未登録単語ｏが含まれる前記関連文書の数を表し、Ｄは前記関連文書の総数を表すとして、
前記未登録単語頻度算出部は、

を計算することにより、前記未登録単語頻度を生成する
ことを特徴とする単語追加装置。
請求項１から５のいずれかに記載の単語追加装置であって、
ｒａｎｋ_ｏｒは前記未登録単語を前記タスク関連度の高い順に並べた順位を表し、ｒａｎｋ_ｏｆは前記未登録単語を前記未登録単語頻度の高い順に並べた順位を表すとして、
前記登録優先度算出部は、

を計算することにより、前記登録優先度を求める
ことを特徴とする単語追加装置。
請求項２から６のいずれかに記載の単語追加装置であって、
前記発話窓抽出手段は、
前記認識結果をトピック境界で分割して前記発話窓を生成する
ことを特徴とする単語追加装置。
認識結果記憶部に、入力音声を音声認識した認識結果が記憶されており、
関連文書記憶部に、前記入力音声のタスクに関連のある関連文書が記憶されており、
認識辞書記憶部に、認識辞書が記憶されており、
未登録単語抽出部が、前記関連文書から、前記認識辞書を用いて、前記未登録単語を抽出する未登録単語抽出ステップと、
未登録単語特徴量抽出部が、前記未登録単語と前記関連文書から、当該未登録単語を特徴づける共起頻度ベクトルを生成する未登録単語特徴量抽出ステップと、
認識結果特徴量抽出部が、前記認識結果から、当該認識結果を特徴づける単語頻度ベクトルを生成する認識結果特徴量抽出ステップと、
タスク関連度算出部が、前記共起頻度ベクトルと前記単語頻度ベクトルから、前記未登録単語ごとに、タスク関連度を算出するタスク関連度算出ステップと、
未登録単語頻度算出部が、前記未登録単語と前記関連文書から、当該未登録単語の前記関連文書における出現頻度である未登録単語頻度を算出する未登録単語頻度算出ステップと、
登録優先度算出部が、前記タスク関連度と前記未登録単語頻度から、前記未登録単語ごとに、登録優先度を算出する登録優先度算出ステップと、
認識辞書登録部が、前記未登録単語と前記登録優先度から、予め設定された閾値を用いて、追加登録単語を抽出し、前記認識辞書に前記追加登録単語を追加して前記拡張認識辞書を生成する認識辞書登録ステップと、
を有することを特徴とする単語追加方法。
請求項１から７のいずれかに記載の単語追加装置としてコンピュータを機能させるためのプログラム。