JP2002372988A - 認識辞書作成装置及び棄却辞書及び棄却辞書の生成方法 - Google Patents

認識辞書作成装置及び棄却辞書及び棄却辞書の生成方法

Info

Publication number
JP2002372988A
JP2002372988A JP2001180707A JP2001180707A JP2002372988A JP 2002372988 A JP2002372988 A JP 2002372988A JP 2001180707 A JP2001180707 A JP 2001180707A JP 2001180707 A JP2001180707 A JP 2001180707A JP 2002372988 A JP2002372988 A JP 2002372988A
Authority
JP
Japan
Prior art keywords
word
rejection
recognition
vocabulary
rejected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001180707A
Other languages
English (en)
Inventor
Toru Iwazawa
透 岩沢
Takashi Tonomura
孝史 外村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2001180707A priority Critical patent/JP2002372988A/ja
Publication of JP2002372988A publication Critical patent/JP2002372988A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】離散単語認識を用いた音声認識において音声認
識の利用形態に応じ雑音や認識単語以外の発話を棄却
し、認識単語を発話した場合のみ正しい音声認識結果を
返す音声認識辞書を構築することを目的とする。また、
構築した棄却辞書の中から雑音による棄却語彙と利用者
の発話による棄却語彙を区別し利用するための枠組みを
提供することも併せて目的とする。 【構成】棄却すべき棄却単語の集合は棄却単語データベ
ース5に格納される。実際に音声認識に使用する棄却単
語は、棄却単語除去部6において認識単語格納部41に
格納される認識単語と正解音声入力部8より入力された
認識単語の正解音声を棄却単語に誤認識した際の認識結
果を類似語生成部7において生成された類似語を含め棄
却単語データベース5中の棄却単語から除去し、雑音棄
却単語データベースに含まれる単語は雑音棄却単語格納
部422へ、含まれないものは発話棄却単語421へ格
納される。音声認識利用時は、認識単語格納部41と発
話棄却単語格納部421と雑音棄却単語格納部422に
含まれる単語を含めた辞書に対し音声認識を行なう。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は音声認識システムに
おいて、機械雑音や話し声などの周囲雑音や文法外の発
話を棄却する技術に関する。
【0002】
【従来の技術】音声認識を利用したシステムにおける大
きな問題点として、雑音や周囲の話し声を認識単語と誤
認識してしまい誤動作をするという問題がある。また、
雑音ばかりではなく利用者が認識単語以外の語彙を発話
した際にも同様に誤認識をしてしまう問題がある。
【0003】このような誤認識を防ぐ方法として、雑音
を認識単語以外の音声として棄却する方法がある。従来
の雑音棄却の方法として、特開平11−288295号
公報には、単語辞書部は、1回の発声の認識対象単語を
複数登録してあり、認識させる単語データを登録した単
語記憶部と、雑音に近い雑音単語データを登録してある
雑音単語記憶部によって構成されている。
【0004】単語データは認識対象単語を複数単語登録
した単語群で、実際に発声される単語と同じ単語群が登
録されている。雑音単語データは除去対象とする雑音に
近い雑音単語を複数登録した単語群で、雑音で誤認識さ
れやすい単語が複数登録されている。つまり一度雑音を
認識させることで選りすぐった単語を使用し、その音声
環境や認識させたい単語データ9との類似性により、必
要な種類の単語を登録したものである。
【0005】例えば「あ」、「う」などの単音節とその
単音節を2つ組み合わせた単語「ああ」、「あう」等を
単語データとして単語記憶部に登録し、真の雑音、例え
ば、物音や紙をめくる音、人が歩く音等を認識し、その
結果認識した単語を拾いだし、雑音単語データとして雑
音単語記憶部3に登録している。
【0006】一方、特開平2−89100号公報などに
おいてはマイクへ混入したノイズと辞書に登録された認
識語の参照について述べられている。
【0007】
【発明が解決しようとする課題】しかしながら、ロボッ
トのように不特定の話者が不定の位置からロボットへ語
りかけた言葉を認識するためには単に雑音を認識単語と
してあらかじめ登録し棄却する方法は、登録できる語彙
に限界があり十分な棄却性能が得られない場合があっ
た。また、利用者が認識単語以外の発話をした場合の誤
認識には対応できなかった。
【0008】本発明は、あらかじめ音節ネットを用いた
膨大な棄却辞書を構築し、音声認識に利用する認識単語
に影響を及ぼす棄却単語のみを除去していくことで雑音
や認識単語以外の発話を棄却し、認識単語を発話した場
合のみ正しい音声認識結果を返す音声認識辞書を構築す
ることを目的とする。また、構築した棄却辞書の中から
雑音による棄却語彙と利用者の発話による棄却語彙を区
別し利用するための枠組みを提供することも併せて目的
とする。
【0009】また、本手法を利用することで、音声認識
の利用形態に適応した雑音棄却語彙を含む音声認識辞書
を構築可能となることが期待できる。
【0010】
【課題を解決するための手段】人間の音声を入力し音声
認識結果を返すシステムにおいて、人間の音声発話を受
理し、音声入力信号を出力する音声入力部と、音声入力
信号を元に音声認識結果をテキスト形式で出力する音声
認識部と、音声認識結果を外部出力装置や別プログラム
へ出力する音声出力部と、認識単語を格納する認識単語
格納部と無効な音声発話や雑音を棄却するための語彙を
格納する棄却単語格納部からなり、音声認識部において
音声認識時に利用される認識辞書部と、棄却単語を網羅
的に格納する棄却単語データベースと、認識単語格納部
から受け渡された認識語彙にマッチする語彙を棄却単語
データベースから除去し残った語彙を棄却単語格納部へ
格納する棄却単語除去部を備えることを特徴とし、棄却
単語格納部が発話棄却単語格納部と雑音棄却単語格納部
から構成され、周囲の話し声や機械雑音、環境雑音に対
応する棄却語彙を格納する雑音棄却単語データベース
と、棄却単語除去部より受け渡された棄却単語が雑音棄
却単語データベースに含まれる場合は雑音棄却単語格納
部へ、含まれない場合は発話棄却単語格納部へ棄却単語
を格納する棄却単語判定部を備えることを特徴とし、棄
却単語データベースから、認識語彙にマッチする棄却単
語を除去するステップと、認識語彙の類似語彙にマッチ
する棄却語彙を除去するステップと、複数の認識語彙発
音データを利用した棄却語彙を除去するステップとから
なることを特徴とする。
【0011】
【発明の実施の形態】本発明の実施の形態について図面
を参照しながら詳細に説明する。
【0012】図1は、本発明の音声認識用雑音棄却装置
の第1の実施の形態の構成図である。
【0013】第1の実施の形態の音声認識用雑音棄却装
置は、人間の音声発話を受理し、音声入力信号を出力す
る音声入力部1と、入力された音声入力信号を元に音声
認識結果をテキスト形式等で出力する音声認識部2と、
得られた音声認識結果を外部出力装置や別プログラム等
へ出力する音声出力部3で構成されている。
【0014】認識辞書4は、認識単語を格納する認識単
語格納部41と無効な音声発話や雑音を棄却するための
語彙を格納する棄却単語格納部42からなり音声認識部
2において音声認識時に利用される。
【0015】更に、認識辞書部4は、棄却単語を網羅的
に格納する棄却単語データベース5と、認識単語格納部
41から受け渡された認識語彙にマッチする語彙を棄却
単語データベース5から除去し残った語彙を棄却単語格
納部42へ格納する棄却単語除去部6とから構成され
る。
【0016】音声入力部1において入力された音声は、
認識辞書部4に格納される認識語彙を元に音声認識部2
で音声認識され、結果が音声認識結果出力部3へ出力さ
れる。認識辞書部4は認識単語格納部41と棄却単語格
納部42からなり音声認識結果出力部3において得られ
た結果が認識単語か棄却単語か区別することが可能であ
る。その結果、音声認識結果が棄却単語格納部42に含
まれるものである場合は、棄却したり誤認識反応を返す
などの対応が可能となる。
【0017】次に棄却単語格納部42に格納される棄却
語彙の生成方法について説明する。
【0018】図6に音声認識語彙(「おはよう」「こん
にちは」「こんばんは」)は「◆」で空間にマッピング
されており,周囲の点線の円で囲われた音声認識空間を
音声認識エンジンが正しい認識結果と解釈するものとす
る。なお,図2中の「こんにちは」「こんばんは」のよ
うに円に重なりがある場合は,距離の近い方の音声認識
語彙が認識結果となる.この点線円の半径が音声認識結
果を返すための閾値であり,棄却判定閾値が低いほど半
径が大きくなる.これに対し,円の内部にある実線枠で
囲われた空間は正しく音声認識すべき発話音声の空間を
意味する。
【0019】不特定話者かつ近距離発声から遠距離発声
まで様々な距離からの発話音声が正しく認識すべき対象
に含まれるため実線枠の空間が必然的に大きくなる.こ
の実線枠の空間を吸収するためには閾値を下げ半径を大
きくする必要があり,その結果として不要音声が点線円
の内部に入りやすくなるため誤認識が多くなる。
【0020】尚、環境雑音と発話音声は区別可能であ
り、環境雑音は比較的短い音節数で吸収可能であり、棄
却辞書構築後の音声認識空間のイメージ図を図7に示
す。
【0021】棄却単語の散布により音声認識語彙の周囲
以外の空間が棄却単語の音声認識範囲により覆われてい
るというのが棄却辞書構築のイメージである。そして,
音声認識空間が環境雑音が認識される領域とそれ以外の
主に人間の発話音声が認識される領域に分かれており,
環境雑音領域をカバーする雑音棄却単語(図中の×)か
らなる雑音棄却辞書とそれ以外の領域をカバーする発話
棄却単語(図中の●)からなる発話棄却辞書を別々に構
築することが可能である。
【0022】図8に棄却単語データベース5の一例を示
す。音声認識語彙として「こんにちは」を例として示
す。
【0023】棄却単語データベース5は、1文字から数
文字の音節をつなぎ合わせた音節ネットの形状をしてい
る。図6では4文字を例として用いた。
【0024】棄却単語データベースの音節ネットの文字
数に関しては、短すぎると十分な棄却性能が得られな
い、また長すぎると認識単語格納部41及び棄却単語格
納部42の認識辞書4に登録される単語数が莫大となり
音声認識に時間がかかるなどの問題があり日本語の場合
4文字程度が適当と考えられる。
【0025】一方、記憶容量と計算機の計算速度との向
上があるので特に4文字にこだわる必要はないが、で棄
却辞書を作ると効果的である。
【0026】図9に棄却単語除去部6の動作をフローチ
ャートで示す。
【0027】まず、棄却単語除去部6は棄却単語データ
ベース5に含まれる棄却単語を全てコピーする(S1)。次
に認識単語格納部41から受け渡された全ての認識単語
を棄却単語から除去し(S2)た後残った棄却単語を出力す
る(S3)。
【0028】図9の認識単語格納部41から受け渡され
た全ての認識単語を棄却単語から除去する(S2)のステッ
プを詳細に説明する。
【0029】棄却辞書は、4文字からなる文字列全てを
含む棄却単語データベースから、過程1 音声認識語彙
にマッチする棄却単語の除去過程2 音声認識語彙の類
似語彙にマッチする棄却語彙の除去過程3 複数話者の
音声認識語彙発声データを利用した棄却語彙の除去する
ことで構成することができる。
【0030】ここで過程2における類似語彙は、「こん
にちは」の先頭4文字「こんにち」の「こ」=「ko」の
kとhの子音が誤認識しやすいことから「ほんにち」が
除去される。
【0031】過程3では、正解音声を音声認識辞書で認
識させ、棄却単語に誤認識した場合に、そのその棄却単
語を除去した音声辞書を再構築し再び認識させる処理を
繰り返す。
【0032】図6では、棄却単語「こんいち」「こんい
ひ」「ほんいち」が誤認識された後正しい「こんにち
は」が認識された例である。
【0033】過程3は、ある程度の誤認識を許容する場
合は省略しても構わない。
【0034】図6では音声語彙の棄却辞書について説明
したが、環境雑音に関しても音声語彙の棄却辞書と同様
の方法をもちいることができる。
【0035】この際文字列は音声語彙で用いた文字列よ
りも少なくても構わない。
【0036】尚、環境雑音は音声語彙のデーターベース
よりも少ない文字数であっても問題がない。更に、認識
辞書に、発話音声以外に、環境雑音、例えばドアをノッ
クする音や、火災報知器の音を認識語として入れておく
と次に図2を用いて、本発明の第2の実施の形態につい
て説明する。
【0037】第2の実施の形態における音声認識用雑音
棄却装置は、図1に示した第1の実施の形態の構成図に
加えて、認識単語格納部41から受け渡された認識単語
の類似語を生成し棄却単語除去部6へ出力する類似語生
成部7を含み構成される。類似語生成部7では、受け渡
された認識単語そのものを含め認識単語の類似語を生成
し棄却単語除去部6へ出力する。
【0038】音声認識においては、利用者の発話を音響
通りに認識し期待通りの結果になることはまれである。
従って、認識単語をベースに棄却単語を除去する場合
は、認識単語の類似語を生成し除去しておく必要があ
る。
【0039】類似語の生成には様々な方法が考えられる
が、ここでは2種類の類似語生成方法について説明す
る。
【0040】一つは音響的な類似語生成であり、もう一
つは部分マッチを利用した類似語生成である。まず、音
響的な類似語生成は、音素レベルで誤認識を起こしやす
いペアをあらかじめピックアップしておき、それらの音
素を子音とする同じ母音を持つ音節(これを類似音節と
呼ぶ)に対し認識単語の類似語を生成する。例えば、'
K'(カ行)と'H'(ハ行)の音素が類似音素として登録され
ていて、認識単語にカ行の音節がある場合にその音節を
類似音節と交換したものを類似語として登録する。
【0041】図10に1つの認識単語に対し類似語を生
成するアルゴリズムのフローチャートを示す。まず、認
識単語を類似語として登録する(S4)。認識単語の最初の
音節を切り出し(S5)、その音節に対し類似音節が存在す
る場合は(S6)全ての登録済の類似語に対し該当する類似
音節を入れ替えたものを類似語として追加する(S7)。上
記S6, S7の処理を認識単語の全ての音節に対して(S8)音
節を切り出し行う(S9)。
【0042】このアルゴリズムを利用し、'K'(カ行)と'
H'(ハ行)の音素が類似音素として登録されている場合に
認識単語として「けんかい(見解)」が類似語生成部に
入力されると、「けんかい」「へんかい」「けんはい」
「へんはい」の4つが類似語として生成される。
【0043】次に部分マッチを用いた類似語生成の方法
について説明する。部分マッチを利用した類似語とは、
認識単語に対しある固定長の連続した部分音節を固定し
残りの音節を任意の音節に変化させたものである。図1
1に「けんかい」という認識語彙に対する1文字固定、
2文字固定の部分マッチを利用した類似語を示す。
【0044】なお、認識単語の音節数が棄却単語データ
ベースの最大音節数より長い場合は認識単語の1文字目
から最大音節数の長さの文字列を切り出し利用する。
【0045】固定する部分音節長は、短くするほど多く
の類似語が生成され、結果として棄却語彙を除去するこ
とが可能となる反面、棄却性能が劣化する。逆に部分音
節長を長くすると類似語が少なく棄却性能が強すぎるこ
とになる。固定する部分音節長は、認識語彙数に応じて
決定するのが良いと考えられる。
【0046】なお、音響的な類似語と部分マッチによる
類似語は組み合わせで生成することも可能である。
【0047】次に図3を用いて、本発明の第3の実施の
形態について説明する。第3の実施の形態の音声認識用
雑音棄却装置は、図2に示した第2の実施の形態の構成
図に加えて、認識単語を正しく発声した正解音声を音声
認識部2へ入力する正解音声入力部8と、正解音声を入
力した際の認識結果を音声認識結果出力部3から取得
し、その認識結果が棄却単語であった場合に認識結果を
棄却単語除去部へ出力する棄却単語判定部9を含み構成
される。
【0048】第3の実施の形態は、認識単語を元にした
棄却単語除去では対応しきれない棄却単語を利用者の音
声ベースで除去するものである。正解音声入力部8で
は、認識単語のみを対象にした音声認識で正解が得られ
た音声(これを正解音声と呼ぶ)を事前に収録したもの
が再生される。この正解音声の音声認識結果は音声認識
結果出力部3から棄却単語判定部9へと受け渡される。
受け渡された音声認識結果が正解とはならず棄却単語格
納部42に含まれる語彙に誤認識された場合は、その音
声認識結果が棄却単語除去部6へ受け渡される。棄却単
語除去部6では、図9に示したフローチャートに従い認
識単語とその類似語と音声認識結果を棄却単語データベ
ース5から除去したものを棄却単語格納部42へ格納す
る。なお、実際には正解音声を連続で再生し棄却単語に
誤認識された語彙を除去する必要があるため、棄却単語
除去判定部9において過去に除去された棄却単語を全て
格納しておき、新規に除去する棄却単語を含め棄却単語
除去部6へ受け渡す必要がある。
【0049】正解音声は、特定話者による音声認識であ
れば特定話者の正解音声があればよいが、不特定話者の
音声認識を行う場合は老若男女のバランスの取れた大人
数の正解音声を利用するのが望ましい。
【0050】次に図4を用いて、本発明の第4の実施の
形態について説明する。
【0051】第4の実施の形態の音声認識用雑音棄却装
置は、図3に示した第3の実施の形態の構成図におい
て、棄却単語判定部9において認識結果を棄却単語除去
部6ではなく類似語生成部7へ出力し、除去すべき棄却
単語の類似語を生成した後棄却単語除去部6へ出力する
ことを特徴とする。
【0052】棄却単語に誤認識された語彙の類似語彙を
あらかじめ除去しておくことで、正解音声入力による棄
却単語除去の手間を軽減できる反面正解音声入力に支障
のない棄却単語も除去してしまい棄却性能を弱める可能
性がある。
【0053】第4の実施の形態の手法は、実施の形態3
の正解音声を利用した棄却単語除去に膨大な時間がかか
る場合に有効であると考えられる。
【0054】次に図5を用いて、本発明の第5の実施の
形態について説明する。
【0055】第5の実施の形態の音声認識用雑音棄却装
置は、第3または第4の実施の形態の構成図に加えて、
棄却単語格納部42が発話棄却単語格納部421と雑音
棄却単語格納部422から構成され、周囲の話し声や機
械雑音、環境雑音に対応する棄却語彙を格納する雑音棄
却単語データベース10と、棄却単語除去部6より受け
渡された棄却単語が雑音棄却単語データベース10に含
まれる場合は雑音棄却単語格納部422へ、含まれない
場合は発話棄却単語格納部421へ棄却単語を格納する
棄却単語判定部11とを含んで構成される。
【0056】雑音棄却単語データベース10は、棄却単
語データベースの全ての語彙を対象とした音声認識辞書
に対し事前に収録した雑音音声を入力してその認識結果
を収集、格納することで構築される。入力する雑音音声
は、音声認識を行う環境を想定し様々な雑音源を含んだ
ものであることが望ましい。
【0057】なお、雑音音声には、利用者が認識単語以
外の発話をした場合の音声は収録しない。棄却単語判定
部11では、棄却単語除去部6より受け渡された棄却語
彙が雑音棄却単語データベース10に含まれているかど
うかを調べ含まれる場合は雑音棄却単語格納部422
へ、含まれない場合は発話棄却単語格納部421へ格納
する。
【0058】このような棄却単語の振り分けを行うこと
により、雑音音声の殆どは雑音棄却単語格納部に含まれ
る語彙に、認識単語以外の誤発話は発話棄却単語格納部
に含まれる語彙に認識されやすくなる。
【0059】
【発明の効果】本発明は、あらかじめ音節ネットを利用
した膨大な棄却単語データベースの中から音声認識に必
要な認識単語に影響を及ぼす語彙を除去し生成された棄
却単語を音声認識辞書に組み込むことにより、雑音や認
識単語以外の発話を棄却し認識単語が正しく発話された
場合のみ正しい認識結果を返すことが可能となる。
【0060】また、正解音声を認識させた結果を元に棄
却単語除去を行うことにより、近距離ではっきり発話す
ることを前提とした音声認識インタフェースのみでなく
音声認識の利用形態に適応した雑音棄却辞書を生成する
ことが可能となる。
【0061】さらに、棄却単語を雑音棄却単語と発話棄
却単語に分けることにより雑音音声と認識単語以外の誤
発話を区別することが可能である。その結果として雑音
音声は無視し、誤発話に対してはその旨を利用者に対し
教示するようなインタフェースを構築することが可能と
なる。
【図面の簡単な説明】
【図1】 本発明の第1の実施の形態の構成図である。
【図2】 本発明の第2の実施の形態の構成図である。
【図3】 本発明の第3の実施の形態の構成図である。
【図4】 本発明の第4の実施の形態の構成図である。
【図5】 本発明の第5の実施の形態の構成図である。
【図6】 音声認識空間のイメージを示す図である。
【図7】 棄却辞書構築後の音声認識空間イメージを示
す図である。
【図8】 雑音棄却データベースの例を示す図である。
【図9】 棄却単語除去部の動作を示すフローチャート
である。
【符号の説明】
1 音声入力部 2 音声認識部 3 音声認識結果出力部 4 認識辞書部 41 認識単語格納部 42 棄却単語格納部 421 発話棄却単語格納部 422 雑音棄却単語格納部 5 棄却単語データベース 6 棄却単語判定部 7 類似語生成部 8 正解音声入力部 9 棄却単語判定部 10 雑音棄却単語データベース 11 棄却単語判定部

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 音声を入力し、音声入力信号を出力する
    音声入力手段と、前記音声入力信号を元に音声認識結果
    を出力する音声認識手段と、前記音声認識結果を出力す
    る音声出力部と、前記音声認識手段において音声認識時
    に利用される認識辞書部とを有する音声認識システムで
    あって、 前記認識辞書は、認識単語を格納する認識単語格納部と
    無効な音声発話や雑音を棄却するための語彙を格納する
    棄却単語格納部からなり、 前記棄却単語を網羅的に格納する棄却単語データベース
    と、前記認識単語格納部から受け渡された前記認識語彙
    にマッチする語彙を前記棄却単語データベースから除去
    し残った語彙を前記棄却単語格納部へ格納する棄却単語
    除去部を備えることを特徴とする認識辞書作成装置。
  2. 【請求項2】 前記認識単語格納手段から受け渡された
    前記認識単語の類似語を生成し前記棄却単語除去手段へ
    出力する類似語生成手段を備えることを特徴とする請求
    項1記載の認識辞書作成装置。
  3. 【請求項3】 前記認識単語を正しく発声した正解音声
    を前記音声認識手段へ入力する正解音声入力手段と、 前記正解音声を入力した際の前記認識結果を前記音声認
    識結果出力手段から取得し、前記認識結果が前記棄却単
    語であった場合に前記認識結果を前記棄却単語除去手段
    へ出力する棄却単語判定手段を備えることを特徴とする
    請求項2に記載の認識辞書作成装置。
  4. 【請求項4】 前記棄却単語判定手段において前記認識
    結果を棄却単語除去手段ではなく類似語生成手段へ出力
    し、前記類似語を生成した後前記棄却単語除去手段へ出
    力することを特徴とする請求項3に記載の認識辞書作成
    装置。
  5. 【請求項5】 前記棄却単語格納手段が発話棄却単語格
    納手段と雑音棄却単語格納手段から構成され、周囲の話
    し声や機械雑音、環境雑音に対応する前記棄却語彙を格
    納する雑音棄却単語データベースと、 前記棄却単語除去手段より受け渡された前記棄却単語が
    前記雑音棄却単語データベースに含まれる場合は前記雑
    音棄却単語格納手段へ、含まれない場合は前記発話棄却
    単語格納手段へ前記棄却単語を格納する棄却単語判定手
    段を備えることを特徴とする請求項3又は4に記載の認
    識辞書作成装置。
  6. 【請求項6】 音声認識に使用される認識辞書であっ
    て、前記認識辞書は、認識単語を格納する認識単語格納
    部と無効な音声発話や雑音を棄却するための語彙を格納
    する棄却単語格納部からなり、 前記棄却単語格納部が、認識単語を格納する認識単語格
    納部と無効な音声発話や雑音を棄却するための語彙を格
    納する発話棄却単語格納部と環境雑音棄却単語格納領域
    からなることを特徴とする単語辞書。
  7. 【請求項7】 棄却単語データベースから、 認識語彙にマッチする棄却単語を除去するステップと、 認識語彙の類似語彙にマッチする棄却語彙を除去するス
    テップとからなる棄却辞書の生成方法。
  8. 【請求項8】 棄却単語データベースから、 認識語彙にマッチする棄却単語を除去するステップと、 認識語彙の類似語彙にマッチする棄却語彙を除去するス
    テップと、 複数の認識語彙発音データを利用した棄却語彙を除去す
    るステップとからなる棄却辞書の生成方法。
JP2001180707A 2001-06-14 2001-06-14 認識辞書作成装置及び棄却辞書及び棄却辞書の生成方法 Pending JP2002372988A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001180707A JP2002372988A (ja) 2001-06-14 2001-06-14 認識辞書作成装置及び棄却辞書及び棄却辞書の生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001180707A JP2002372988A (ja) 2001-06-14 2001-06-14 認識辞書作成装置及び棄却辞書及び棄却辞書の生成方法

Publications (1)

Publication Number Publication Date
JP2002372988A true JP2002372988A (ja) 2002-12-26

Family

ID=19021084

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001180707A Pending JP2002372988A (ja) 2001-06-14 2001-06-14 認識辞書作成装置及び棄却辞書及び棄却辞書の生成方法

Country Status (1)

Country Link
JP (1) JP2002372988A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005292346A (ja) * 2004-03-31 2005-10-20 Nec Corp 音声認識用棄却辞書生成システム、音声認識用棄却語彙生成方法及び音声認識用棄却語彙生成プログラム
JP2006154658A (ja) * 2004-12-01 2006-06-15 Nec Corp 音声認識辞書作成システム、音声認識辞書作成方法、音声認識システムおよびロボット
JP2008033198A (ja) * 2006-08-01 2008-02-14 Nec System Technologies Ltd 音声対話システム、音声対話方法、音声入力装置、プログラム
JP2008129263A (ja) * 2006-11-20 2008-06-05 Fujitsu Ltd 音声認識装置、音声認識方法、および、音声認識プログラム
JP2010020102A (ja) * 2008-07-10 2010-01-28 Fujitsu Ltd 音声認識装置、音声認識方法及びコンピュータプログラム
JP2016206580A (ja) * 2015-04-28 2016-12-08 四郎丸 功 音声認識装置及び音声認識システム

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005292346A (ja) * 2004-03-31 2005-10-20 Nec Corp 音声認識用棄却辞書生成システム、音声認識用棄却語彙生成方法及び音声認識用棄却語彙生成プログラム
JP2006154658A (ja) * 2004-12-01 2006-06-15 Nec Corp 音声認識辞書作成システム、音声認識辞書作成方法、音声認識システムおよびロボット
JP4539313B2 (ja) * 2004-12-01 2010-09-08 日本電気株式会社 音声認識辞書作成システム、音声認識辞書作成方法、音声認識システムおよびロボット
JP2008033198A (ja) * 2006-08-01 2008-02-14 Nec System Technologies Ltd 音声対話システム、音声対話方法、音声入力装置、プログラム
JP2008129263A (ja) * 2006-11-20 2008-06-05 Fujitsu Ltd 音声認識装置、音声認識方法、および、音声認識プログラム
US7962338B2 (en) 2006-11-20 2011-06-14 Fujitsu Limited Speech recognition apparatus, speech recognition method and recording medium having speech recognition software program recorded thereon
JP2010020102A (ja) * 2008-07-10 2010-01-28 Fujitsu Ltd 音声認識装置、音声認識方法及びコンピュータプログラム
US8271282B2 (en) 2008-07-10 2012-09-18 Fujitsu Limited Voice recognition apparatus, voice recognition method and recording medium
JP2016206580A (ja) * 2015-04-28 2016-12-08 四郎丸 功 音声認識装置及び音声認識システム

Similar Documents

Publication Publication Date Title
US10365887B1 (en) Generating commands based on location and wakeword
US10074363B2 (en) Method and apparatus for keyword speech recognition
US5333275A (en) System and method for time aligning speech
EP2048655B1 (en) Context sensitive multi-stage speech recognition
JP2002304190A (ja) 発音変化形生成方法及び音声認識方法
WO2006083020A1 (ja) 抽出された音声データを用いて応答音声を生成する音声認識システム
JP2018013549A (ja) 発話内容認識装置
JP2001188779A (ja) 情報処理装置および方法、並びに記録媒体
JP5257680B2 (ja) 音声認識装置
JP2000172294A (ja) 音声認識方法、その装置及びプログラム記録媒体
JP2002372988A (ja) 認識辞書作成装置及び棄却辞書及び棄却辞書の生成方法
JP2745562B2 (ja) ノイズ適応形音声認識装置
JP2001195087A (ja) 音声認識システム
JP5300000B2 (ja) 調音特徴抽出装置、調音特徴抽出方法、及び調音特徴抽出プログラム
US11043212B2 (en) Speech signal processing and evaluation
JP2011039468A (ja) 電子辞書で音声認識を用いた単語探索装置及びその方法
JP5476760B2 (ja) コマンド認識装置
JP6517417B1 (ja) 評価システム、音声認識装置、評価プログラム、及び音声認識プログラム
JP2001188556A (ja) 音声認識方法及び装置
JP3299170B2 (ja) 音声登録認識装置
Raj et al. Design and implementation of speech recognition systems
JP3110025B2 (ja) 発声変形検出装置
JP2000242295A (ja) 音声認識装置および音声対話装置
JP3357752B2 (ja) パターンマッチング装置
KR100445907B1 (ko) 음성언어 식별 장치 및 방법

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20050317

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060406

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20070117

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070227