JP3748429B2 - 音声入力型複合名詞の検索装置および音声入力型複合名詞の検索方法 - Google Patents

音声入力型複合名詞の検索装置および音声入力型複合名詞の検索方法 Download PDF

Info

Publication number
JP3748429B2
JP3748429B2 JP2002322547A JP2002322547A JP3748429B2 JP 3748429 B2 JP3748429 B2 JP 3748429B2 JP 2002322547 A JP2002322547 A JP 2002322547A JP 2002322547 A JP2002322547 A JP 2002322547A JP 3748429 B2 JP3748429 B2 JP 3748429B2
Authority
JP
Japan
Prior art keywords
noun
recognition
search
nouns
search word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2002322547A
Other languages
English (en)
Other versions
JP2004157748A (ja
Inventor
久美子 大森
正信 東田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2002322547A priority Critical patent/JP3748429B2/ja
Publication of JP2004157748A publication Critical patent/JP2004157748A/ja
Application granted granted Critical
Publication of JP3748429B2 publication Critical patent/JP3748429B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、利用者が音声入力した複合名詞の検索語について、音声認識装置を利用し、データベースから検索し、利用者の入力を確定する検索装置および検索方法に関するものである。
【0002】
【従来の技術】
音声認識技術を用い、利用者が入力した検索語を特定するシステムにおいて、対話処理実時間内に音声認識処理可能な語彙数には限界があり、認識対象となる語彙数が多ければ多い程、認識精度が低下するという認識技術の現状の課題から、利用者による音声入力を、一意に短時間で確定することは、非常に困難であることが知られている。
【0003】
現状、利用者は、認識処理が終了し結果が提示されるまで待機し、認識結果の正誤は利用者に確認を行う以外に方策はなく、認識装置が出力する認識スコアの高い順に確認し、正解を確認することができるまで、候補の提示が繰り返される(たとえば、非特許文献1)。
【0004】
【非特許文献1】
大森久美子、東田正信 「大語彙の複合名詞を対象とする音声対話による確定率向上に関する検討」、情報処理学会 第64回(平成14年)全国大会 講演論文集(2)、平成14年3月12日、p.2−275,2−276
【0005】
【発明が解決しようとする課題】
利用者の音声入力について音声認識装置を利用し、入力を特定する従来システムは、認識対象である検索語が大規模であればある程、認識処理に時間がかかり、精度の低下が避けられない。利用者にとって、待機時間、候補提示の繰り返しは、ストレスに繋がり、オペレータ対応のシステムと比較すると、利用者満足度が得られず、音声ポータル等、現在の音声応答サービスを、繰り返し使いたいとはユーザが思わないのが現状である。
【0006】
そこで、利用者にストレスを与えず、短時間かつ自然な対話の流れの中で入力を特定する手法として、検索語が名詞の複合語で構成されている場合、構成名詞の頻度を利用して検索補助データベースを作成し、この作成された検索補助データベースを用い、使用頻度の高い構成名詞を優先認識対象として予め定め、認識対象を予め絞り込むことによって、待機時間の減少、精度向上を目指すことが考えられる。
【0007】
しかし、1つの検索語を構成する各名詞の使用頻度に偏りがある場合、または、非常に似通った構成名詞が多数、同じ構成順序に使用されている場合には、該当する構成名詞が、上記検索補助データベースに含まれている優先認識対象名詞リスト(使用頻度が高い名詞のリストであり、優先的に認識対象とする名詞のリスト)に登録されていないことがあり、そうであると、実在する検索語が存在しないという結果に繋がる。
【0008】
また、該当する構成名詞が、上記優先認識対象名詞リストに登録されていたとしても、認識結果として、似通った単語が多数出力されるので、正解構成単語が、出力結果中に出現せず、実在検索語リスト作成処理の結果、実在する検索語が存在しないという結果に繋がる。
【0009】
また、部分的に抽出でき、しかも有力と思われる単名詞(複合名詞を構成する単一の名詞)を付加情報とし、複合名詞を構成する複数の単名詞のうちで、部分的に認識尤度が高い単名詞を含む検索語を、検索データベースから抽出する部分一致検索語処理を行い、これと並行し、上記部分一致検索語処理の時間を利用し、認識処理が終了していない各順序の前方検索補助データベース(検索語である複合名詞を構成する複数の単名詞の前からn番目の単名詞を認識した単名詞群毎に作成されている検索補助データベース)と、後方検索補助データベース(検索語である複合名詞を構成する複数の単名詞の後からn番目の単名詞を認識した単名詞群毎に作成されている検索補助データベース)とを認識対象とし、各単名詞の認識処理を継続し、利用者への提示をする度に、その時点での出力結果をマージする処理を繰り返すことが考えられる。
【0010】
上記音声認識装置を利用した音声入力型の検索において、音声認識技術のみを利用し、利用者による音声入力について、確定するので、認識装置の出力結果を利用者に提示し、確認すること以外に確定の手法がなく、認識対象語数が大規模になればなる程、また似通った対象が多ければ多い程、認識処理時間が長くなり、さらに認識精度が低下し、したがって、利用者を待機させた上、誤認識による提示確認の繰り返しに繋がる。
【0011】
現状では、音声認識装置を利用した音声入力型検索において、利用者満足度を獲得するためには、限られた分野や地域への適用と、階層的な構成をしている情報に対して種類数の少ない上位階層から順に、確実に確定しながら、順にグループ化し、絞り込むこととによって、認識対象数を減少させなければ、利用者に許容される範囲である速度と精度とを得ることが困難である。
【0012】
さらに、周囲の雑音レベルも、様々な場所からの不特定多数話者の入力による音声認識は非常に難しく、このような場合では、最も容易であると言われている単語認識においても、実用レベルで扱える単語数は、数百が限度であると言われている。
【0013】
本発明は、検索対象がどんなに大規模であっても、利用者が音声で入力した検索語を、検索データベース中から検索し確定する場合、オペレータ対応の検索装置のように、迅速かつ自然に検索処理を実現することができる音声入力型複合名詞の検索装置および音声入力型複合名詞の検索方法を提供することを目的とするものである。
【0014】
【課題を解決するための手段】
本発明は、利用者が音声入力した検索語を構成する複数の単名詞のうちで、一部の単名詞のみの認識尤度が所定の閾値を超える場合、上記閾値を超える認識尤度を具備する上記単名詞を備え、上記検索語を構成する単名詞の数と同じ数の単名詞を備えている部分一致検索語候補を、検索データベースから抽出する部分一致検索語候補抽出手段と、上記抽出された部分一致検索語候補を対象として音声認識し、しかも、上記抽出された部分一致検索語候補を構成する単名詞毎に、上記入力された音声を再認識する再認識手段と、上記再認識手段が再認識した結果の認識尤度を、所定の演算方法で演算することによって、統合尤度を演算する統合尤度演算手段とを有する音声対話型複合名詞の検索装置である。
【0015】
【発明の実施の形態および実施例】
図1は、本発明の一実施例である音声対話型複合名詞の検索装置1を示すブロック図である。
【0016】
音声対話型複合名詞の検索装置1は、音声入力部2と、音声認識部3と、音声認識用ソフトウェア3Sと、音声認識結果出力部4と、検索語候補リスト作成部5と、対話制御部6と、音声出力部7と、音声出力用ソフトウェア7Sと、システムデータベース8とによって構成されている。
【0017】
検索語候補リスト作成部5は、実在検索語リスト作成部51と、部分一致検索語リスト作成部52とによって構成されている。
【0018】
また、対話制御部6は、検索語候補選定対話部61と、部分一致検索語候補選定対話部62とによって構成されている。音声認識部3において、入力音声に対する音声認識処理の際、システムデータベース8を利用する。
【0019】
システムデータベース8は、検索データベース81と、検索補助データベース82と、YES/NOデータベース83とによって構成されている。
【0020】
検索データベース81は、複数の単名詞で構成されている複合名詞が検索語として登録され、しかも、上記検索語が各単名詞に区切られて登録されているデータベースである。
【0021】
検索補助データベース82は、上記登録されている各複合名詞のn番目(nは整数値)に表記されている単名詞の群を、「n番目表記の単名詞集合群」と呼び、上記n番目表記の単名詞集合群が、その頻度の高い順に登録され、しかも、この頻度の高い順に登録されている単名詞が、その頻度の高い方から順に、所定の数毎にまとめられ、複数のサブ集合群が形成されているデータベースである。
【0022】
音声認識部3は、音声認識装置を使用し、音声出力部7は、音声出力の際に、音声出力装置を使用する。
【0023】
図2は、検索データベース81の全体像の一例を示す図である。
【0024】
図3は、検索補助データベース82の全体像の一例を示す図である。
【0025】
検索データベース81は、対話処理実時間内に音声認識処理不可能な数の検索語を保持し、各検索語は、図2に示すように、構成名詞に分割された状態で記録されている。検索補助データベース82は、検索データベース81中の全検索語について、上記n番目表記の単名詞群の中で、その単名詞の使用頻度が算出され、この算出された使用頻度順に、上記単名詞が並べられている状態(順位付けられている状態)で、格納されている。
【0026】
検索補助データベース82は、検索語を構成する単名詞の最大数をpとすると、1番目表記の単名詞用の検索補助データベースから、p番目表記の単名詞検索用の検索補助データベースまで存在する。
【0027】
各検索補助データベース82が保持している単名詞(構成名詞)の数は、検索データベース81が保持している全ての検索語数よりも少ないことが予想され、対話処理実時間内には処理不可能な数であるとする。
【0028】
各検索補助データベースは、検索装置1が予め既定した対話処理実時間内に処理可能な語数毎に、使用頻度が高い単名詞から順に、複数の単名詞を細分化した形で格納されている。第n検索補助データベースが格納している複数の単名詞のうちで、使用頻度が最も高い単名詞のグループを、「第1サブ集合群」と呼ぶ。
【0029】
音声対話型複合名詞の検索装置1は、音声入力部2を介して入力された利用者の音声を、音声認識部3へ送る。
【0030】
音声認識部3は、音声認識装置を利用し、利用者入力音声について、認識処理を行う。音声認識部3が、複合名詞を単名詞(構成名詞)単位に分割し、構成名詞毎に認識結果を出力する機能を保持していない場合、単名詞毎に区切って入力することを、利用者に指示する。音声力された音声信号を、音声認識部3が、構成名詞単位(単名詞単位)で分割し、単名詞毎に認識結果を出力する機能を保持している場合、利用者は、検索したい複合名詞を一連で音声入力する。
【0031】
また、音声認識部3は、音声力された音声信号を、音声認識部3が、単名詞単位(構成名詞単位)で分割し、単名詞毎に認識結果を出力する機能を保持していない場合、利用者Pcに、単名詞毎(単語毎)に区切って音声入力するように指示する。
【0032】
音声認識部3は、検索装置1の処理状況に合わせて、認識対象とするデータベースを、システムデータベース8から選択する。検索語が入力された場合、検索補助データベース82を参照し、利用者への正誤確認に対する応答を認識する場合は、YES/NOデータベース83を参照する。
【0033】
音声認識結果出力部4は、認識結果を、検索語候補リスト作成部5へ送る。
【0034】
この時点で、まだ認識処理が終了していないサブ集合群が、各検索補助データベース82中に存在する場合、音声認識部32は、サブ集合群に対する認識処理を再びスタートさせ、音声認識結果出力部43は、認識結果を出力し、検索語候補リスト作成部5へ送る処理を繰り返す。
【0035】
検索語候補リスト作成部5において、実在検索語候補リスト作成部51は、認識結果の中から、有力構成名詞候補を選択し、有力構成名詞候補の組み合わせを作成し、検索データベース81を参照しながら、実在する検索語を抽出した実在検索語候補リストを作成し、この作成された実在検索語候補リストを対話制御部6へ送る。
【0036】
実在検索語を抽出する場合、有力構成名詞の全組み合わせを作成し、検索データベース81を参照し、実在するか否かをチェックする。
【0037】
また、有力構成名詞候補を1つずつ組み合わせる度に、該当する有力構成名詞の繋がりを有する検索語が実在するか否かを、検索データベース81を使用して、チェックし、実在することが確認された有力構成名詞候補の組み合わせについてのみ、他の構成順序の有力構成名詞を組み合わせ、再び検索データベース81をチェックようにしてもよい。
【0038】
さらに、有力構成名詞を組み合わせる順序として、先頭から順に組み合わせるようにしてもよく、また、検索時間が最短になるように組み合わせを選択するようにしてもよい。
【0039】
実在検索語リストを作成している間に、部分一致検索語リスト作成部52は、認識結果から選択された有力構成名詞候補を部分的に含む検索語を、「部分一致検索語候補」として、検索データベース81から抽出し、「部分一致尤度」を算出し、既定閾値以上の部分一致尤度を有する部分一致検索語について、認識処理を行う。
【0040】
検索語を単名詞毎に区切り、利用者が音声入力した場合、構成名詞数が同じである検索語のみを、検索データベース81から選択し、部分一致検索語全体について、最初に入力された音声を利用して認識処理すると同時に、有力構成名詞を抽出することができない箇所のみについて、認識対象名詞リストを作成し、最初に音声入力された音声の中で、該当番目表記の単名詞のみについて、認識処理する。つまり、単名詞毎に音声認識を再度実行する。
【0041】
音声入力された音声信号を単名詞毎に分割し、認識する機能を、音声認識装置が有する場合は、部分一致検索語候補を使って、利用者が音声入力した音声信号を認識処理する。この認識処理の結果を対話制御部6へ送る。
【0042】
対話制御部6は、実在検索語候補と部分一致検索語候補とを利用し、検出候補選定対話を実行する。このときに、部分一致検索語リスト作成部52から送られた部分一致検索語に対する結果を利用し、各検索語候補について、部分一致尤度を算出する。
【0043】
部分一致検索語全体について認識処理を行った場合、それまでの部分一致尤度を利用せずに、算出された認識尤度を、部分一致尤度として利用するようにしてもよく、部分一致している有力構成名詞毎の認識尤度の和と、算出された認識尤度とを加え、「部分一致した構成名詞数+1」で除算することによって、部分一致尤度を求めるようにしてもよく、また、ただ和や積をとることによって、部分一致尤度を求めるようにしてもよい。
【0044】
また、有力構成名詞が出力されていない箇所のみを対象にして、単名詞を認識した場合、予め算出されている有力構成名詞毎の尤度と、加算または乗算し、構成名詞数で除算するようにしてもよく、また、各尤度の積をとり(各認識尤度を互いに掛け合い)、これを、構成名詞数で除算するようにしてもよい。
【0045】
そして、実在検索語候補リスト中の検索語候補が、利用者との確認処理のみで検索語を特定可能な検索装置の規定条件を満たす場合は、確認処理ガイダンスの出力命令を音声出力部7へ送る。
【0046】
実在検索語候補リスト中の検索語候補が、利用者との確認処理のみでは検索語を特定可能な条件を満たさない場合、または、実在検索語候補が抽出されない場合は、部分一致検索語処理の結果、算出された新たな部分一致尤度が利用者との確認処理のみで検索語を特定可能な検索装置の規定条件を満たす場合は、確認処理ガイダンスの出力命令を、音声出力部7へ送る。
【0047】
確認処理のみで特定可能な検索語候補が、実在検索語候補からも、部分一致検索語候補を利用した部分一致検索語処理からも、抽出されない場合、この時点で、認識処理を終了する。
【0048】
使用頻度が次に高いサブ集合群についての認識処理の結果得られた有力構成名詞候補を利用し、実在検索語候補リストと部分一致検索語リストとを更新し、上記検索語候補選定対話と、上記部分一致検索語処理とを繰り返す。
【0049】
音声出力部7は、確認処理ガイダンス出力命令が送られてきた場合、検索語候補と指定された候補との正誤確認を行うガイダンスを、利用者に出力する。
【0050】
そして、確認処理ガイダンスに対する利用者からの応答が、音声入力部2から再び入力されると、音声認識部3は、YES/NOデータベース83を参照し、利用者の応答を認識し、音声認識結果出力部4が認識結果を出力し、利用者から肯定を表す応答が得られた場合、検索語特定が完了した旨を利用者へガイダンスする命令を、対話制御部6が、音声出力部7へ送る。
【0051】
検索語が特定できるまで、上記検索語候補リストの更新、上記検索語候補選定対話、上記部分一致検索語処理を繰り返す。
【0052】
検索補助データベース82中の全ての単名詞集合群について認識処理が終了し、実在検索語候補リストをそれ以上更新不可能な場合、対話制御部6は、単名詞単位(構成名詞単位)で、利用者に再入力を要求し、入力された構成順序の単名詞の認識結果に基づいて、該当構成名詞を含む検索語を、検索データベース81から抽出し、音声認識を再度繰り返す。
【0053】
検索装置1は、実在検索語候補リストの更新と検索語候補選定対話とが行われている間、優先認識対象名詞群以外の構成名詞集合群の少なくとも1集合(規定数からなる集合の1つ分)に対しては、認識処理が終了しているように構成名詞数を規定する。
【0054】
次に、上記実施例の動作をより具体的に説明する。
【0055】
なお、以下の説明では、複合名詞で構成されている電話帳掲載の法人企業名を検索する場合を例にとって説明する。
【0056】
電話帳に掲載されている法人名義は、日本全国で2,200万件存在する。現行の音声認識技術をそのまま適用したのでは、2,200万件を対話処理実時間内で認識処理することは不可能であり、精度は非常に低いことが知られている。
【0057】
図4は、電話帳に登録されている2,200万件の法人名義データを、それを構成する単名詞(構成名詞)で区切り、この単名詞で区切られた法人名義データが、検索データベース81に登録されている例を示す図である。
【0058】
検索データベース81に登録されている法人名義について、法人名義を構成する各単名詞の頻度を、単名詞毎に調べ、頻度の高い順に、検索補助データベース82に登録する。
【0059】
法人名義2,200万件を構成する複合名詞のうちで、最長構成単語数が7である場合、1番目表記の単名詞の総数は、約360万種類であり、2番目表記の単名詞の総数が、約250万種類であり、3番目表記の単名詞の総数が、約270万種類であり、4番目表記の単名詞の総数が、約100万種類であり、……、対話処理実時間内では、各単名詞に対しても認識処理は不可能であり、精度が低いことが予想される。
【0060】
図5は、上記実施例において、検索補助データベース82の一例を示す図である。
【0061】
検索装置1は、各構成順序の検索補助データベース82中の単名詞を、単名詞毎に、使用頻度が高い順に並べ、使用頻度が高い方からq個ずつに細分化し(区分けし)、第n表記の単名詞集合群を構成する(1≦n≦7)。
【0062】
使用する音声認識装置の性能に応じて、上記qを規定し、本実施例では、q=500であるとする。そして、n番目表記の単名詞集合群の中で、使用頻度が最も高い500個の単名詞のグループを、「第1サブ集合群」と定める。
【0063】
また、本実施例において使用する認識装置は、入力された単名詞を分割し、単名詞単位で認識処理し、構成順序毎に、単名詞に認識尤度を算出し、出力する機能を有していない場合を想定している。したがって、検索目的である法人名義(複合名詞)を、その単名詞毎に区切って発話することを、利用者に要求する。
【0064】
なお、入力された単名詞を分割し、単名詞単位で認識処理し、構成順序毎に、単名詞の認識尤度を算出し、出力する機能を有する場合に、本実施例を適用するようにしてもよい。
【0065】
ここで、「東京(とうきょう)/卸売(おろしうり)/市場(しじょう)」を、検索語として、利用者Pcが音声入力した場合について考える。
【0066】
音声入力された「東京」について、1番目表記の単名詞集合群Gc1の第1サブ集合群Gc1−1に属する単名詞の中から認識し、音声入力された「卸売」について、2番目表記の単名詞集合群Gc2の第1サブ集合群Gc2−1に属する単名詞の中から認識し、音声入力された「市場」について、3番目表記の単名詞集合群Gc3の第1サブ集合群Gc3−1に属する単名詞の中から認識する。
【0067】
前方検索補助データベース82、後方検索補助データベース82のそれぞれについて、認識処理し、この認識処理された結果をマージする。そして、認識装置が出力する認識スコアの大きい順に、認識結果のそれぞれを出力する。
【0068】
図6は、上記実施例において、前方検索補助データベース82と後方検索補助データベース82とを用いて、各単名詞を認識し、この認識の結果をマージした状態を示す図である。
【0069】
図6に示すマージ結果において、1番目表記の単名詞である「東京」は、1番目表記の単名詞集合群Gc1の中の第1サブ集合群Gc1−1に含まれ、3番目表記の単名詞である「市場」は、3番目表記の単名詞集合群Gc3の中の第1サブ集合群Gc3−1に含まれているが、2番目表記の単名詞である「卸売」は、2番目表記の単名詞集合群Gc2の中の第1サブ集合群Gc2−1には含まれていない。
【0070】
本実施例では、認識尤度80以上を出力した単名詞を、「有力構成名詞候補」と定め、図6において、有力構成名詞候補を網点で示してある。
【0071】
図6に示すマージ結果では、音声入力した「東京」について、「東京」、「東急」の2候補が、有力構成名詞候補として選択され、音声入力した「卸売」については、有力構成名詞候補が選択されず、音声入力された「市場」については、「地所」の1候補が、有力構成名詞候補として選択されている。
【0072】
図6に示すマージ結果に基づいて、実在検索語候補リスト作成処理を行うが、音声入力した「卸売」については、有力構成名詞候補が選択されていないので、実在する検索語が存在せず、したがって、検索装置1は、各番目表記の単名詞集合群の第1サブ集合群に対する認識処理が終了次第、残っている認識対象としての集合群のうちで、次に使用頻度が高い集合群(第2サブ集合群)(単名詞500個で構成されている集合群)について、認識処理する。そして、この認識処理の後に、部分一致検索処理を行う。
【0073】
1番目表記の単名詞の有力構成名詞候補「東京」、「東急」を含む検索語と、3番目表記の単名詞の有力構成名詞候補「地上」を含む検索語とを、検索データベース81から抽出する。
【0074】
本実施例において、各有力構成名詞候補の認識尤度の和を、部分一致尤度とする。
【0075】
図7は、上記実施例において、部分一致検索語処理した結果と、その結果を利用した検索語候補選定対話の一例とを示す図である。
【0076】
図8は、上記実施例において、部分一致尤度と、部分一致検索語候補との関係を示す図である。
【0077】
図8に示すように、1番目表記の単名詞である「東京」を含み、3番目表記の単名詞である「地所」を含む検索語の部分一致尤度が、最大になる。部分一致検索語処理として抽出した部分一致検索語全体を、認識対象とし、初めに発話された利用者の音声を、単名詞毎に、再度音声認識する。
【0078】
このように、単名詞毎に、音声認識を再度実行するので、単名詞「東京」について、図7に示す認識尤度と、図8に示す認識尤度とが異なる。これと同様に、単名詞「東急」、「地所」、「市場」のそれぞれについても、図7に示す認識尤度と、図8に示す認識尤度とが異なる。また、単名詞毎に音声認識するので、認識精度が高くなる。
【0079】
同時に抽出した部分一致検索語を構成し、1番目表記の単名詞のリスト、2番目表記の単名詞のリスト、3番目表記の単名詞のリストを、それぞれ作成し、単名詞で区切って利用者が発話した単名詞を再認識し、各順序について出力された認識結果を、部分一致検索語の有力構成名詞候補を抽出することができなかった番目表記の単名詞に嵌め込み、部分一致検索語尤度を再度計算し、図8(2)に示すように、実在候補のみを残す。
【0080】
この際、部分一致検索語尤度を算出する場合、各単名詞の認識尤度の和をとることによって、部分一致検索語尤度を算出するようにしてもよく、また、積をとることによって、部分一致検索語尤度を算出するようにしてもよく、各単名詞の認識尤度の和を、複合名詞を構成する単名詞の数で除算することによって、部分一致検索語尤度を算出するようにしてもよい。
【0081】
本実施例においては、各単名詞の認識尤度の和をとることによって、部分一致検索語尤度を算出することにし、この時点で認識処理が終了している部分一致検索語全体に対する認識結果と、マージし、また、この時点で認識処理が終了していると思われる次に使用頻度が高い第nサブ集合群の認識結果を用いた実在検索語候補作成処理の結果との間で、マージする。
【0082】
このマージの結果、図8(2)に示すように、「東京/卸売/市場」に対する認識尤度が、既定閾値240を超えるので、「東京/卸売/市場」が実在候補として残る。
【0083】
また、本実施例において、検索データベース81として、電話帳データベースを利用しているので、住所が予め分かっていれば、その住所に実在する法人企業名、または個人を特定することができる。
【0084】
本実施例は、検索語が複合名詞であることに着目し、単名詞毎に使用頻度を調べ、単名詞毎に認識処理するので、検索対象語が実時間処理不可能な大語彙であっても、利用者に対して迅速かつ正確に検索処理することができる。
【0085】
本実施例は、検索語を構成する単名詞の頻度に偏りがある場合、非常に似通った単名詞が存在する場合にも、単名詞の認識結果について、音声入力された複合名詞を構成する複数の単名詞のうちで、部分的な単名詞が有力構成名詞候補である検索語を、部分一致検索語候補として検索データベース81から抽出し、この抽出された部分一致検索語候補を対象として、単名詞毎に音声認識するので、全部を音声認識対象に定め実時間内に正しく認識処理することが不可能であった大語彙検索語の中から、迅速かつ正確に有力候補を絞り込むことができる。
【0086】
これによって、利用者を待機させることなく、検索処理することができると考えられる。
【0087】
なお、上記実施例において、検索データベースが、電話帳データベースのような個人姓名である場合、苗字と名前とを、上記複合名詞の構成単位とし、上記検索補助データベースには、上記1番目表記の単名詞として、上記苗字を登録し、上記2番目表記の単名詞として、上記名前を登録することによって、個人姓名を確定するようにしてもよい。
【0088】
また、検索補助データベース中の全ての構成単語集合群に対する認識処理が終了し、実在検索語候補リスト、部分一致検索語候補リストのそれぞれを、それ以上更新不可能、かつ候補が特定できない場合は、先頭の構成名詞、または末尾の構成名詞を具体的に利用者に入力要求し、この入力要求に応じて入力された情報を獲得し、組み合わせることによって、検索語を特定するようにしてもよい。
【0089】
つまり、上記実施例は、複数の単名詞で構成されている複合名詞が検索語として登録され、しかも、上記検索語が各単名詞に区切られて登録されている検索データベースと、上記登録されている各複合名詞のn番目(nは整数値)に表記されている単名詞の群を、n番目表記の単名詞集合群と呼び、上記n番目表記の単名詞集合群が、その頻度の高い順に登録され、しかも、この頻度の高い順に登録されている単名詞が、その頻度の高い方から順に、所定の数毎にまとめられ、複数のサブ集合群が形成されている検索補助データベースと、利用者が上記検索語を単名詞毎に音声入力すると、上記複合名詞のn番目表記の単名詞については、上記n番目表記の単名詞集合群で認識し、しかも上記n番目表記の単名詞集合群のうちで、最も頻度が高い単名詞を含む第1サブ集合群の範囲内で認識処理し、認識尤度を対応させて、認識結果リストを作成する認識結果リスト作成手段と、上記認識処理された単名詞である構成名詞候補と、上記構成名詞候補についての認識尤度との組が認識尤度順に並べられている認識結果リストを、上記音声入力された単名詞のそれぞれについて作成し、上記認識結果リストに記載されている構成名詞候補のうちで、所定の第1の閾値を超える認識尤度を具備する構成名詞候補を、有力構成名詞候補として選出する有力構成名詞候補選出手段と、上記検索語を構成する複数の単名詞のうちで一部の単名詞のみの認識尤度が上記第1の所定の閾値を超える場合、上記第1の閾値を超える認識尤度を具備する上記単名詞を備え、上記検索語を構成する単名詞の数と同じ数の単名詞を備えている部分一致検索語候補を、上記検索データベースから抽出する部分一致検索語候補抽出手段と、上記抽出された部分一致検索語候補を対象として音声認識し、しかも、上記抽出された部分一致検索語候補を構成する単名詞毎に、上記入力された音声を再認識する再認識手段と、上記再認識手段が再認識した結果の認識尤度を、所定の演算方法で演算することによって、統合尤度を演算する統合尤度演算手段とを有する音声対話型複合名詞の検索装置の例である。
【0090】
また、上記実施例は、複数の単名詞で構成されている複合名詞が検索語として登録され、しかも、上記検索語が各単名詞に区切られて登録されている検索データベースと、上記登録されている各複合名詞のn番目(nは整数値)に表記されている単名詞の群を、n番目表記の単名詞集合群と呼び、上記n番目表記の単名詞集合群が、その頻度の高い順に登録され、しかも、この頻度の高い順に登録されている単名詞が、その頻度の高い方から順に、所定の数毎にまとめられ、複数のサブ集合群が形成されている検索補助データベースと、利用者が上記検索語である複合名詞を単名詞毎に区切らずに、一連で音声入力すると、上記音声入力された検索語である複合名詞を単名詞毎に区切る検索語区切り手段と、上記利用者が上記検索語である複合名詞を一連で音声入力すると、上記複合名詞のn番目表記の単名詞については、上記n番目表記の単名詞集合群で認識し、しかも上記n番目表記の単名詞集合群のうちで、最も頻度が高い単名詞を含む第1サブ集合群の範囲内で認識処理し、認識尤度を対応させて、認識結果リストを作成する認識結果リスト作成手段と、上記認識処理された単名詞である構成名詞候補と、上記構成名詞候補についての認識尤度との組が認識尤度順に並べられている認識結果リストを、上記音声入力された単名詞のそれぞれについて作成し、上記認識結果リストに記載されている構成名詞候補のうちで、所定の第1の閾値を超える認識尤度を具備する構成名詞候補を、有力構成名詞候補として選出する有力構成名詞候補選出手段と、上記検索語を構成する複数の単名詞のうちで一部の単名詞のみの認識尤度が上記第1の所定の閾値を超える場合、上記第1の閾値を超える認識尤度を具備する上記単名詞を備え、上記検索語を構成する単名詞の数と同じ数の単名詞を備えている部分一致検索語候補を、上記検索データベースから抽出する部分一致検索語候補抽出手段と、上記抽出された部分一致検索語候補を対象として音声認識し、しかも、上記抽出された部分一致検索語候補を構成する単名詞毎に、上記入力された音声を再認識する再認識手段と、上記再認識手段が再認識した結果の尤度を、所定の演算方法で演算することによって、統合尤度を演算する統合尤度演算手段とを有する音声対話型複合名詞の検索装置の例である。
【0091】
【発明の効果】
本発明によれば、法人企業名や辞書中の四文字熟語等、検索対象がどんなに大規模であっても、利用者が音声で入力した検索語を、検索データベース中から検索し確定する場合オペレータ対応の検索装置のように、迅速かつ自然に検索処理を実現することができるという効果を奏する。
【図面の簡単な説明】
【図1】本発明の一実施例である音声対話型複合名詞の検索装置1を示すブロック図である。
【図2】検索データベース81の全体像の一例を示す図である。
【図3】検索補助データベース82の全体像の一例を示す図である。
【図4】電話帳に登録されている2,200万件の法人名義データを、それを構成する単名詞(構成名詞)で区切り、この単名詞で区切られた法人名義データが、検索データベース81に登録されている例を示す図である。
【図5】上記実施例において、検索補助データベース82の一例を示す図である。
【図6】上記実施例において、前方検索補助データベース82と後方検索補助データベース82とを用いて、各単名詞を認識し、この認識の結果をマージした状態を示す図である。
【図7】上記実施例において、部分一致検索語処理した結果と、その結果を利用した検索語候補選定対話の一例とを示す図である。
【図8】上記実施例において、部分一致尤度と、部分一致検索語候補との関係を示す図である。
【符号の説明】
1…音声対話型複合名詞の検索装置、
2…音声入力部、
3…音声認識部、
4…音声認識結果出力部、
5…検索語候補リスト作成部、
6…対話制御部、
7…音声出力部、
8…システムデータベース、
81…検索データベース、
82…検索補助データベース。

Claims (6)

  1. 複数の単名詞で構成されている複合名詞が検索語として登録され、しかも、上記検索語が各単名詞に区切られて登録されている検索データベースと;
    上記登録されている各複合名詞のn番目(nは整数値)に表記されている単名詞の群を、n番目表記の単名詞集合群と呼び、上記n番目表記の単名詞集合群が、その頻度の高い順に登録され、しかも、この頻度の高い順に登録されている単名詞が、その頻度の高い方から順に、所定の数毎にまとめられ、複数のサブ集合群が形成されている検索補助データベースと;
    利用者が上記検索語を単名詞毎に音声入力すると、上記複合名詞のn番目表記の単名詞については、上記n番目表記の単名詞集合群で認識し、しかも上記n番目表記の単名詞集合群のうちで、最も頻度が高い単名詞を含む第1サブ集合群の範囲内で認識処理し、認識尤度を対応させて、認識結果リストを作成する認識結果リスト作成手段と;
    上記認識処理された単名詞である構成名詞候補と、上記構成名詞候補についての認識尤度との組が認識尤度順に並べられている認識結果リストを、上記音声入力された単名詞のそれぞれについて作成し、上記認識結果リストに記載されている構成名詞候補のうちで、所定の第1の閾値を超える認識尤度を具備する構成名詞候補を、有力構成名詞候補として選出する有力構成名詞候補選出手段と;
    上記検索語を構成する複数の単名詞のうちで一部の単名詞のみの認識尤度が上記第1の所定の閾値を超える場合、上記第1の閾値を超える認識尤度を具備する上記単名詞を備え、上記検索語を構成する単名詞の数と同じ数の単名詞を備えている部分一致検索語候補を、上記検索データベースから抽出する部分一致検索語候補抽出手段と;
    上記抽出された部分一致検索語候補を対象として音声認識し、しかも、上記抽出された部分一致検索語候補を構成する単名詞毎に、上記入力された音声を再認識する再認識手段と;
    上記再認識手段が再認識した結果の認識尤度を、所定の演算方法で演算することによって、統合尤度を演算する統合尤度演算手段と;
    を有することを特徴とする音声対話型複合名詞の検索装置。
  2. 複数の単名詞で構成されている複合名詞が検索語として登録され、しかも、上記検索語が各単名詞に区切られて登録されている検索データベースと;
    上記登録されている各複合名詞のn番目(nは整数値)に表記されている単名詞の群を、n番目表記の単名詞集合群と呼び、上記n番目表記の単名詞集合群が、その頻度の高い順に登録され、しかも、この頻度の高い順に登録されている単名詞が、その頻度の高い方から順に、所定の数毎にまとめられ、複数のサブ集合群が形成されている検索補助データベースと;
    利用者が上記検索語である複合名詞を単名詞毎に区切らずに、一連で音声入力すると、上記音声入力された検索語である複合名詞を単名詞毎に区切る検索語区切り手段と;
    上記利用者が上記検索語である複合名詞を一連で音声入力すると、上記複合名詞のn番目表記の単名詞については、上記n番目表記の単名詞集合群で認識し、しかも上記n番目表記の単名詞集合群のうちで、最も頻度が高い単名詞を含む第1サブ集合群の範囲内で認識処理し、認識尤度を対応させて、認識結果リストを作成する認識結果リスト作成手段と;
    上記認識処理された単名詞である構成名詞候補と、上記構成名詞候補についての認識尤度との組が認識尤度順に並べられている認識結果リストを、上記音声入力された単名詞のそれぞれについて作成し、上記認識結果リストに記載されている構成名詞候補のうちで、所定の第1の閾値を超える認識尤度を具備する構成名詞候補を、有力構成名詞候補として選出する有力構成名詞候補選出手段と;
    上記検索語を構成する複数の単名詞のうちで一部の単名詞のみの尤度が上記第1の所定の閾値を超える場合、上記第1の閾値を超える尤度を具備する上記単名詞を備え、上記検索語を構成する単名詞の数と同じ数の単名詞を備えている部分一致検索語候補を、上記検索データベースから抽出する部分一致検索語候補抽出手段と;
    上記抽出された部分一致検索語候補を対象として音声認識し、しかも、上記抽出された部分一致検索語候補を構成する単名詞毎に、上記入力された音声を再認識する再認識手段と;
    上記再認識手段が再認識した結果の認識尤度を、所定の演算方法で演算することによって、統合尤度を演算する統合尤度演算手段と;
    を有することを特徴とする音声対話型複合名詞の検索装置。
  3. 請求項1または請求項2において、
    検索補助データベース中の全ての構成単語集合群に対する認識処理が終了し、実在検索語候補リスト、部分一致検索語候補リストのそれぞれを、それ以上更新不可能、かつ候補が特定できない場合は、先頭の構成名詞、または末尾の構成名詞を具体的に利用者に入力要求し、この入力要求に応じて入力された情報を獲得し、組み合わせることによって、検索語を特定することを特徴とする音声対話型複合名詞の検索装置。
  4. 請求項1または請求項2において、
    検索データベースが、個人姓名である場合、苗字と名前とを上記複合名詞の構成単位とし、上記検索補助データベースには、上記1番目表記の単名詞として、上記苗字を登録し、上記2番目表記の単名詞として、上記名前を登録することによって、個人姓名を確定することを特徴とする複合名詞検索装置。
  5. 複数の単名詞で構成されている複合名詞が検索語として登録され、しかも、上記検索語が各単名詞に区切られて登録されている検索データベースと、上記登録されている各複合名詞のn番目(nは整数値)に表記されている単名詞の群を、n番目表記の単名詞集合群と呼び、上記n番目表記の単名詞集合群が、その頻度の高い順に登録され、しかも、この頻度の高い順に登録されている単名詞が、その頻度の高い方から順に、所定の数毎にまとめられ、複数のサブ集合群が形成されている検索補助データベースとを使用し、複合名詞を検索する方法において、
    利用者が上記検索語を単名詞毎に音声入力すると、上記複合名詞のn番目表記の単名詞については、上記n番目表記の単名詞集合群で認識し、しかも上記n番目表記の単名詞集合群のうちで、最も頻度が高い単名詞を含む第1サブ集合群の範囲内で認識処理し、認識尤度を対応させて、認識結果リストを作成する認識結果リスト作成段階と;
    上記認識処理された単名詞である構成名詞候補と、上記構成名詞候補についての認識尤度との組が認識尤度順に並べられている認識結果リストを、上記音声入力された単名詞のそれぞれについて作成し、上記認識結果リストに記載されている構成名詞候補のうちで、所定の第1の閾値を超える認識尤度を具備する構成名詞候補を、有力構成名詞候補として選出する有力構成名詞候補選出段階と;
    上記検索語を構成する複数の単名詞のうちで一部の単名詞のみの認識尤度が上記第1の所定の閾値を超える場合、上記第1の閾値を超える認識尤度を具備する上記単名詞を備え、上記検索語を構成する単名詞の数と同じ数の単名詞を備えている部分一致検索語候補を、上記検索データベースから抽出する部分一致検索語候補抽出段階と;
    上記抽出された部分一致検索語候補を対象として音声認識し、しかも、上記抽出された部分一致検索語候補を構成する単名詞毎に、上記入力された音声を再認識する再認識段階と;
    上記再認識段階で音声認識された結果の尤度を、所定の演算方法で演算することによって、統合尤度を演算する統合尤度演算段階と;
    を有することを特徴とする音声対話型複合名詞の検索方法。
  6. 複数の単名詞で構成されている複合名詞が検索語として登録され、しかも、上記検索語が各単名詞に区切られて登録されている検索データベースと、上記登録されている各複合名詞のn番目(nは整数値)に表記されている単名詞の群を、n番目表記の単名詞集合群と呼び、上記n番目表記の単名詞集合群が、その頻度の高い順に登録され、しかも、この頻度の高い順に登録されている単名詞が、その頻度の高い方から順に、所定の数毎にまとめられ、複数のサブ集合群が形成されている検索補助データベースとを使用し、複合名詞を検索する方法において、
    利用者が上記検索語である複合名詞を単名詞毎に区切らずに、一連で音声入力すると、上記音声入力された検索語である複合名詞を単名詞毎に区切る検索語区切り段階と;
    上記利用者が上記検索語である複合名詞を一連で音声入力すると、上記複合名詞のn番目表記の単名詞については、上記n番目表記の単名詞集合群で認識し、しかも上記n番目表記の単名詞集合群のうちで、最も頻度が高い単名詞を含む第1サブ集合群の範囲内で認識処理し、認識尤度を対応させて、認識結果リストを作成する認識結果リスト作成段階と;
    上記認識処理された単名詞である構成名詞候補と、上記構成名詞候補についての認識尤度との組が認識尤度順に並べられている認識結果リストを、上記音声入力された単名詞のそれぞれについて作成し、上記認識結果リストに記載されている構成名詞候補のうちで、所定の第1の閾値を超える認識尤度を具備する構成名詞候補を、有力構成名詞候補として選出する有力構成名詞候補選出段階と;
    上記検索語を構成する複数の単名詞のうちで一部の単名詞のみの尤度が上記第1の所定の閾値を超える場合、上記第1の閾値を超える錦尤度を具備する上記単名詞を備え、上記検索語を構成する単名詞の数と同じ数の単名詞を備えている部分一致検索語候補を、上記検索データベースから抽出する部分一致検索語候補抽出段階と;
    上記抽出された部分一致検索語候補を対象として音声認識し、しかも、上記抽出された部分一致検索語候補を構成する単名詞毎に、上記入力された音声を再認識する再認識段階と;
    上記再認識段階で音声認識された結果の認識尤度を、所定の演算方法で演算することによって、統合尤度を演算する統合尤度演算段階と;
    を有することを特徴とする音声対話型複合名詞の検索方法。
JP2002322547A 2002-11-06 2002-11-06 音声入力型複合名詞の検索装置および音声入力型複合名詞の検索方法 Expired - Lifetime JP3748429B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002322547A JP3748429B2 (ja) 2002-11-06 2002-11-06 音声入力型複合名詞の検索装置および音声入力型複合名詞の検索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002322547A JP3748429B2 (ja) 2002-11-06 2002-11-06 音声入力型複合名詞の検索装置および音声入力型複合名詞の検索方法

Publications (2)

Publication Number Publication Date
JP2004157748A JP2004157748A (ja) 2004-06-03
JP3748429B2 true JP3748429B2 (ja) 2006-02-22

Family

ID=32802711

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002322547A Expired - Lifetime JP3748429B2 (ja) 2002-11-06 2002-11-06 音声入力型複合名詞の検索装置および音声入力型複合名詞の検索方法

Country Status (1)

Country Link
JP (1) JP3748429B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4736962B2 (ja) * 2006-06-01 2011-07-27 日産自動車株式会社 キーワード選択方法、音声認識方法、キーワード選択システム、およびキーワード選択装置
WO2009057278A1 (ja) 2007-10-29 2009-05-07 Panasonic Corporation 脳波インタフェースシステムに組み込まれる補正装置、方法およびコンピュータプログラム

Also Published As

Publication number Publication date
JP2004157748A (ja) 2004-06-03

Similar Documents

Publication Publication Date Title
US8700397B2 (en) Speech recognition of character sequences
US8364487B2 (en) Speech recognition system with display information
US20030125948A1 (en) System and method for speech recognition by multi-pass recognition using context specific grammars
US7702512B2 (en) Natural error handling in speech recognition
US7925507B2 (en) Method and apparatus for recognizing large list of proper names in spoken dialog systems
US20140244258A1 (en) Speech recognition method of sentence having multiple instructions
JP2004534268A (ja) 自動アテンダントによって使用される情報を前処理するシステムと方法
US20150339390A1 (en) System and method to perform textual queries on voice communications
JPWO2008114811A1 (ja) 情報検索システム、情報検索方法及び情報検索用プログラム
JP4930379B2 (ja) 類似文検索方法、類似文検索システム及び類似文検索用プログラム
US20070016420A1 (en) Dictionary lookup for mobile devices using spelling recognition
US20090292530A1 (en) Method and system for grammar relaxation
US5987410A (en) Method and device for recognizing speech in a spelling mode including word qualifiers
US20170270923A1 (en) Voice processing device and voice processing method
KR101424496B1 (ko) 음향 모델 학습을 위한 장치 및 이를 위한 방법이 기록된 컴퓨터 판독 가능한 기록매체
JP3748429B2 (ja) 音声入力型複合名詞の検索装置および音声入力型複合名詞の検索方法
Seide et al. Towards an automated directory information system.
JP3846896B2 (ja) 音声入力された複合名詞の検索装置、検索方法およびデータベース
JP3682958B2 (ja) 音声入力された複合名詞の検索装置、検索方法およびデータベース
US11361752B2 (en) Voice recognition dictionary data construction apparatus and voice recognition apparatus
JP4282354B2 (ja) 音声認識装置
JP4056546B2 (ja) 音声入力された複合名詞の検索装置、検索方法およびデータベース
JPH06161488A (ja) 音声認識装置
JP3663012B2 (ja) 音声による入力装置
KR20040008546A (ko) 연속 음성인식 기기의 오인식 수정 방법

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20051125

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20051125

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 3748429

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091209

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101209

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101209

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111209

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111209

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121209

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121209

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131209

Year of fee payment: 8

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term