JP3478171B2 - 音声認識装置及び音声認識方法 - Google Patents

音声認識装置及び音声認識方法

Info

Publication number
JP3478171B2
JP3478171B2 JP13409499A JP13409499A JP3478171B2 JP 3478171 B2 JP3478171 B2 JP 3478171B2 JP 13409499 A JP13409499 A JP 13409499A JP 13409499 A JP13409499 A JP 13409499A JP 3478171 B2 JP3478171 B2 JP 3478171B2
Authority
JP
Japan
Prior art keywords
word
voice recognition
registered
voice
speech recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP13409499A
Other languages
English (en)
Other versions
JP2000322085A (ja
Inventor
剛 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP13409499A priority Critical patent/JP3478171B2/ja
Publication of JP2000322085A publication Critical patent/JP2000322085A/ja
Application granted granted Critical
Publication of JP3478171B2 publication Critical patent/JP3478171B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声認識装置及び
音声認識方法に関し、特にサービスシナリオに対応した
辞書の登録のやり直しを不要とする場合に好適な音声認
識装置及び音声認識方法に関する。
【0002】
【従来の技術】従来から、不特定話者の利用を考慮した
音声認識装置が開発されている。この種の音声認識装置
の一例が、特開平11−7292号公報の第2実施形態
の変形例に記載されている。同公報は、種々の形態の付
加語に対し高い認識性能を保持することを目的としたも
のであり、入力音声の一定時間(フレーム)毎の特徴量
を抽出する音声分析部と、認識対象単語または単語列の
前または後または前後に付加語モデルを接続した標準パ
タンと、前記標準パタンと前記特徴量とのパタンマッチ
ングを前記フレーム毎に行い、前記単語または単語列中
で最適な単語系列(最適列)を選択し、その尤度を算出
する尤度算出部と、前記最適列と前記尤度より最適認識
結果を決定し出力する出力部とを備え、前記付加語モデ
ルが背景雑音と任意音声の両者を受理するモデルである
ことを特徴とする音声認識装置が開示されている。
【0003】即ち、連続音節認識のための文法は、予め
既知の付加語(認識対象語の前後に付加される「えー」
や「です」等の語)とそれに挟まれた認識対象語からな
り、この文法を用いることによって付加語を除去し所望
の認識を完了する。例えば図12に示すように、この従
来のワードスポッティングを用いた音声認識装置は、認
識対象となる連続文法の前後に付加語を認識するモデル
を接続したモデルを接続し認識する。このような構成を
有する従来のワードスポッティングを用いた音声認識装
置は次のように動作する。即ち、指定された連続文法に
従って前置不要語を認識し、指定されたキーワード単語
群の中から最もよいキーワード単語を認識し、後置不要
語を認識し、認識されたキーワード単語を認識結果とし
て出力し、認識を終了する。
【0004】また、上記の音声認識に関する他の従来例
としては、例えば特許第2818362号に記載の技術
が提案されている。同特許は、複数の利用者のための話
者独立型連続音声認識を目的としたものであり、データ
処理手段、音声入力手段、及び文字ストリング使用出力
装置に結合したメモリと、上記メモリ上の、第2の複数
の音素を含む第1の複数の単語を含む第1のコンテキス
ト区画と、上記メモリ上の、第4の複数の音素を含む第
3の複数の単語を含む第2のコンテキスト区画と、上記
メモリ上の、第5の複数の音素パタン・マッチングデー
タ装置を含むパタン・マッチング区画と、上記第2の複
数の音素の各々を、上記第5の複数のパタン・マッチン
グ・データ装置の各々に関係づける、第2の複数のポイ
ンタを含む第1のポインタ・マップと、上記第4の複数
の音素の各々を、上記第5の複数のパタン・マッチング
・データ装置の各々に関係づける、第4の複数のポイン
タを含む第2のポインタ・マップと、上記第1のコンテ
キスト区画と上記第1のポインタ・マップあるいは、上
記第2のコンテキスト区画と上記第2のポインタ・マッ
プを選択するためと、上記入力手段から受け取られた音
声入力情報を上記文字ストリング使用装置への文字スト
リング出力情報に変換するために、上記メモリに結合し
ている選択手段とを備え、音声認識適用業務のコンテキ
ストが、上記メモリ上に新しいパタン・マッチング・デ
ータ装置をロードすることなしに切り換えられうる音声
認識装置上の瞬間コンテキスト切換えシステムが開示さ
れている。
【0005】
【発明が解決しようとする課題】しかしながら、上述し
た従来例においては次のような問題点があった。
【0006】上記特開平11−7292号公報記載の従
来例における第1の問題点は、サービスの場面によって
必要/不必要な認識対象の単語や付加語が異なることが
あるため、入力が一回ですまないようなサービスの場
合、認識制御文法を取り換えなければならない。従っ
て、再びメモリ上にロードし直さなければならない(後
述の本発明の実施形態で用いる図2を参照すると、音声
認識に際しては、標準パタンをロードし文法ファイルを
ロードし音声認識処理を行う)。
【0007】第2の問題点は、例えば局におかれるよう
な多回線型システムの場合、接続された呼それぞれの認
識単位毎にサービスに応じ辞書をロードし直すことによ
ってI/Oアクセスが増大しシステムの負荷が増大する
ため、連続運転型のサービスを提供するような多回線型
音声認識装置の場合、辞書情報をサービス毎に頻繁にロ
ードしなおすとシステムの負荷が増える。
【0008】即ち、従来の手段では地名単語のスポッテ
ィングが終わると、次に人名単語のスポッティングを起
動するために、メモリ上にある文法ファイルを取り換え
なければならないため、上位装置などからコマンドが流
れてくるような大きなシステムにおいて、サービス進行
のスムーズさを妨げるおそれがある。
【0009】また、上記特許第2818362号記載の
従来例では、「音声認識装置のコンテキスト切り替えシ
ステム及び方法」として、新たにパタンマッチング用デ
ータをロードせずにサービスが切り替わることを謳って
いるが、各サービスに対するネットワーク情報を個々に
持ち、そのネットワークは標準パタンへのポインタを持
つことによって標準パタンの重複ロードがさけられると
しており、後述する本発明における認識制御用文法の重
複ロードをさけるといった目的とは本質的に異なる。ま
た、後述する本発明のように予め制御情報を登録してお
けばキーボードセレクタの様な外部から命令を送ること
なく切り替え可能であが、従来例では実現することはで
きない。
【0010】本発明の目的は、特に、連続運転しなくて
はならないようワードスポッティングを用いた音声認識
において文法の変更のためにシステムの停止を伴うこと
のない音声認識装置及び音声認識方法を提供するもので
ある。
【0011】
【課題を解決するための手段】本発明は、音声認識対象
語の前後に付加される不要語を除去して音声認識を行う
音声認識装置において、音声情報の標準パタンが登録さ
れた標準パタン登録手段と、使用が想定される全ての
記不要語を保持した連続文法が登録された不用語登録手
段と、前記標準パタン登録手段及び前記不用語登録手段
を参照し音声認識を行う音声認識手段と、該音声認識手
段による前記不用語登録手段の探索空間をサービスシナ
リオに合わせて適宜縮小する制御手段とを具備すること
を特徴とする。
【0012】 また、本発明の音声認識装置は、図1を
参照しつつ説明すれば、音声認識対象語の前後に付加さ
れる不要語を除去して音声認識を行う音声認識装置にお
いて、音声情報の標準パタンが登録された標準パタン登
録手段(図1の131)と、使用が想定される全ての
記不要語を保持した連続文法が登録された不用語登録手
段(図1の132)と、前記標準パタン登録手段及び前
記不用語登録手段を参照し音声認識を行う音声認識手段
(図1の120)と、該音声認識手段による前記不用語
登録手段の探索空間をサービスシナリオに合わせて適宜
縮小する制御手段(図1の140)とを具備している。
【0013】[作用]本発明の音声認識装置は、予め考
えられる不要語候補を一度に登録しておきサービスの場
面場面においてその小集合に分割し用いるように制御し
ている。このため、想定されるサービスシナリオに対応
した辞書を音声認識装置にただ一回登録しておけば、登
録をやり直すことなくサービスを進行させることができ
る。また、ただ考えられる不要語を全て登録するのでは
他の単語による湧き出し誤りが頻発することが予想され
るが、サービスシーンに応じ不要語の集合を適時切り替
えていくことにより、不必要な認識候補を排除できるよ
うに制御している。このため、想定されるサービスシナ
リオにおいて認識率の向上が期待できる。また、予めよ
く使用する文法制御情報をパタンとして登録することに
より、効率よくワードスポッティングを用いた認識を切
り替えることができる。
【0014】
【発明の実施の形態】[第1実施形態]次に、本発明の
実施形態について図面を参照して詳細に説明する。
【0015】(1)構成の説明 図1は本発明の第1実施形態の音声認識装置の構成例を
示すブロック図である。図1において、本発明の第1実
施形態の音声認識装置は、音声入力部100と、音声分
析部110と、距離計算部120と、標準パタン辞書1
31及び汎用ワードスポッティング用文法辞書132を
有するデータ部130と、選別手段141及び特化手段
142を有する文法制御部140とを具備している。
【0016】上記各部の構成を説明すると、音声入力部
100は、認識対象の音声を入力する。音声分析部11
0は、音声入力部100から入力された音声の分析を行
い距離計算部120へ送出する。距離計算部120は、
データ部130の標準パタン辞書131及び汎用ワード
スポッティング用文法辞書132を参照しパラメータ化
された音声を認識する。データ部130の標準パタン辞
書131には、予め音声情報の標準的なパタンが格納さ
れている。データ部130の汎用ワードスポッティング
用文法辞書132には、予めサービスシナリオの開始か
ら終わりまでで使用が想定される不要語が全て登録され
ている。
【0017】ここで、サービスシナリオとは、音声認識
のサービスの流れを示し、契約加入者がこのサービスシ
ステムに接続して、認識処理を用いて、サービスを享受
してから接続を切断するまでの一連の音声認識サービス
の流れをいう。本実施形態では、サービスシナリオは予
めロードした文法ファイルとなる。ただし、人名、地名
に限らず、サービスによっては、人名又は地名、又はそ
の他の名詞を入力ということも考えられるので、一連の
呼の接続が切断されるまでに、入力される発声を全て網
羅したような文法ファイルともなる。
【0018】また、文法制御部140は、汎用ワードス
ポッティング用文法辞書132の探索空間をサービスシ
ナリオに合わせ適宜縮小する。文法制御部140の選別
手段141は、データ部130の汎用ワードスポッティ
ング用文法辞書132をサービス毎に合わせ選別する。
文法制御部140の特化手段142は、汎用ワードスポ
ッティング用文法辞書132を具体的に特化する。
【0019】上記構成を有する音声認識装置において、
音声入力部100から入力された音声は、音声分析部1
10で分析され距離計算部120に送られる。距離計算
部120では、予めデータ部130にロードしておいた
標準パタン辞書131と汎用ワードスポッティング用文
法辞書132を用いてパラメータ化された音声を認識す
る。汎用ワードスポッティング文法辞書132には、サ
ービスシナリオの開始から終わりまでで使用が想定され
る不要語が全て登録されており、距離計算部120は、
サービスシナリオの進行に応じ適宜必要な不要語のみを
選択し、キーワード音声の音声の認識を行う。これによ
って、不要語を含む文法辞書132をロードし直すこと
なくサービスを完了することができるようにしている。
【0020】更に、上記要部の構成を詳述すると、標準
パタン辞書131は、音声の情報の標準的なパタンを格
納したものであり、汎用ワードスポッティング用文法辞
書132は、所望のサービスシナリオ完了までに必要と
する不要語が全て含まれた前置語、後置語を保持してい
る連続文法であり、距離計算部120での計算方法を制
御するものである。文法制御部140は、上述した如
く、汎用ワードスポッティング用文法辞書132をサー
ビス毎に合わせ選別する選別手段141と、具体的な特
化手段142から構成されているこれらを用いて文法制
御部140は、汎用ワードスポッティング用文法辞書1
32の探索空間をサービスシナリオに合わせ適宜縮小す
る。
【0021】文法制御部140の選別手段141は概略
次のように動作する。即ち、選別手段141は、サービ
スシナリオの要請によって汎用ワードスポッティング用
文法辞書132に登録された不要語の集合の中から必要
な不要語からのパスを特化手段142によって抽出し、
その他の不要語を距離計算部120で計算されることの
ないように汎用ワードスポッティング用文法辞書132
から取り除く。
【0022】文法制御部140の特化手段142は、概
略次のように動作する。即ち、特化手段142は、例え
ば、不要語候補を削減するためには、不必要な候補の初
期スコアに、そこからの遷移が無効となるようなペナル
ティ的なスコアを与えてもよいし、計算量を削減するた
めに予め必要/不必要のフラグを用意し、計算候補のル
ープから外すことが考えられる。
【0023】ここで、初期スコアは、距離計算部120
において、単語毎の距離計算を開始するときの距離スコ
アの初期値をいい、この初期値に後述するペナルティ的
値をセットすることによって、距離の値が莫大に大きく
なり、認識候補として上位にくるのを押さえることがで
きる。また、ペナルティは認識候補と挙がらないように
するような十分大きな値のことをいい、例えば、B2に
ある無限大(正の値で計算するとき)のことをいう。
【0024】(2)動作の説明 次に、本発明の第1実施形態の動作について図1〜図9
を参照して詳細に説明する。図2、図3は第1実施形態
の音声認識処理を示すフローチャート、図4は第1実施
形態の地名/人名入力処理を示すフローチャート、図
5、図6は第1実施形態の累積距離計算処理を示すフロ
ーチャート、図7〜図9は第1実施形態の音声認識の具
体例を示す説明図である。
【0025】音声認識装置では、上述したように、デー
タ部130に標準パタン辞書131をロードすると共に
(図2のステップS21)、汎用ワードスポッティング
用文法辞書132をロードし(図2のステップS2
2)、距離計算部120で標準パタン辞書131及び汎
用ワードスポッティング用文法辞書132を用いて音声
認識を行う(図2のステップS23)。
【0026】上記処理を更に詳述すると、先ず、音声認
識装置の指定のアドレスに標準パタン辞書131をロー
ドする(図3のステップA1)。次に、汎用ワードスポ
ッティング用文法辞書132をロードする(図3のステ
ップA2)。更に、サービスで必要な不要語を文法制御
部140で選別手段141を用いて選択する(図3のス
テップA3)。ステップA3での情報を元に、汎用ワー
ドスポッティング用文法辞書132から制限された文法
を特化手段142で作成する(図3のステップA4)。
この後、距離計算部120で認識処理を行う(図3のス
テップA5)。
【0027】文法制御部140の選別手段141は、サ
ービスで必要な不要語を確認し情報をセットする(図5
のステップB1、ステップB2、または図6のステップ
B1、ステップC1)。文法制御部140の特化手段1
42は、選別手段141でセットされた情報を用い、サ
ービスで必要としない不要語候補を文法から削除または
無効にする(図5のステップB2、または図6のステッ
プC2、ステップC3、ステップC4)。
【0028】次に、具体例を用いて本発明の第1実施形
態の動作を説明する。図7に示すように、例えば、汎用
ワードスポッティング(以下WS)用文法辞書132の
前置不要語候補1〜m(この場合、m=7)には、「あ
ー」、「あのー」、「えっとー」、「えー」、「う
ー」、「そのー」、またはナル単語φが登録され、後置
不要語候補1〜n(この場合、n=8)には、「か
ら」、「まで」、「です」、「さん」、「部長」、「主
任」、「くん」、またはナル単語φが登録されているも
のとする。
【0029】但し、ここでいうナル単語φとはシンボル
の出力を伴わない状態遷移をする単語という意味であ
り、内容が空の単語をいう。アルゴリズム上は、単語と
同一に扱うが、実際には、前後の単語をトンネルしてつ
なげるパスとして動作する。例えば、次の文を受理する
文法は、Nをナル単語とすると、「私はこの本を読
む。」、「私は本を読む。」に対して、文法は、「私→
は→N→|この|→本→を→読む。」となる。この文法
で、認識処理を行うと、「私は(N)本を読む。」とい
うように認識されるが、実際の処理では、「は〜本」の
間はトンネルされて直接接続されているので、「私は本
を読む。」というようになる。従って、後述する図8の
場合では、発声内容「やまだくん」(32に「やまだ」
があるとする)となるが、実際には、ナル単語なので、
前の不要語はなかったと判断され、答えは「やまだ く
ん」となる。
【0030】サービスシナリオS01では最初に主に地
名単語の入力(図4のステップS41)を必要とし、次
に人名単語の入力(図4のステップS42)を必要する
ものとする(図4のシーケンスS01)。文法制御部1
40はサービスアプリケーションからの情報を元に汎用
WS用文法辞書132に文法制御情報を伝える。選別手
段141は前記文法制御情報を元に汎用WS用文法辞書
132内の前置不要語集合31からWS対象単語32を
通り後置不要語集合33への遷移の許されるパスを変更
する。
【0031】変更方法には特化手段142が用いられ
る。特化手段142は、例えば、サービスパタンが地名
入力であると確認したときは、前置不要語の「あー」と
後置不要語「さん」、「部長」、「主任」、「くん」の
累積距離計算テーブルの初期値に無限大を代入して実行
的に計算から外す(図5のステップB1、ステップB
2)か、選別手段141でセットされた累積距離計算の
実行を管理するテーブルのフラグを見て、フラグがつい
ていないものは文法からないものとして計算のループか
ら取り除く(図5のステップB2、図6のステップC
2、ステップC3、ステップC4)。
【0032】結果として、地名単語入力の場合は図8に
示すような連続文法の形をとり、人名単語入力の場合は
図9に示すような連続文法の形をとる。各音声入力にお
いては、図8、図9で示す連続文法を用いて認識処理が
行われる。
【0033】本発明の第1実施形態によれば、想定され
るサービスシナリオに対応した辞書を音声認識装置にた
だ一回登録しておけば、登録をやり直すことなくサービ
スを進行させることができる、想定されるサービスシナ
リオにおいて認識率の向上が期待できる、効率よく汎用
ワードスポッティング用文法辞書を用いた認識を切り替
えることができるという効果がある。
【0034】[第2実施形態]次に、本発明の第2実施
形態について図面を参照して詳細に説明する。
【0035】(1)構成の説明 本発明の第2実施形態の音声認識装置は、上記図1に示
したように、音声入力部100と、音声分析部110
と、距離計算部120と、標準パタン辞書131及び汎
用ワードスポッティング用文法辞書132を有するデー
タ部130と、選別手段141及び特化手段142を有
する文法制御部140とを具備している。各部について
は第1実施形態で説明したため省略するものとする。
【0036】本発明の第2実施形態は、キーワード単語
についても同様に始めに全て登録しておき、あとから除
くことを可能としたものである。図10を参照すると、
第2実施形態においてはキーワード対象単語群が更に複
数個のグループに分割されている点が、上記第1実施形
態の図7に示した汎用WS用文法辞書と異なる。前記分
割されたキーワード対象単語群は、図1の文法制御部1
40によって制御可能であり、サービスシナリオに対し
て最適なキーワードグループに分類されている。
【0037】(2)動作の説明 次に、本発明の第2実施形態の動作について上記図1・
図7・図9、図10〜図12を参照して詳細に説明す
る。
【0038】図10に示すように、例えば、汎用ワード
スポッティング(以下WS)用文法辞書132の前置不
要語候補1〜mには「あー」、「あのー」、「えっと
ー」、「えー」、「うー」、「そのー」またはナル単語
φが登録され、後置不要語候補1〜nには「から」、
「まで」、「です」、「さん」、「部長」、「主任」、
「くん」またはナル単語φが登録されているものとす
る。但し、ここでいうナル単語とはシンボルの出力を伴
わない状態遷移をする単語という意味である。
【0039】また、キーワード対象単語群62、63に
はサービス毎に最適なグループに分類されたキーワード
単語群A、B(例えば2つの場合)が格納されている。サ
ービスシナリオS01では最初に主に地名単語の入力を
必要とし、次に人名単語の入力を必要するものとする。
【0040】文法制御部140は、サービスアプリケー
ションからの情報を元に汎用WS用文法辞書132に文
法制御情報を伝える。前記文法制御情報を元に汎用WS
用文法辞書132内の前置不要語集合31からWS対象
単語32を通り後置不要語集合33への遷移の許される
パスは変更される。このとき、WS対象単語32は図1
0の62、63のように複数個の単語グループに予め分
類されているので、前置不要語集合31から後置不要語
集合33への遷移の許されるパスは、キーワードスポッ
ティング62、63の中で更に分類さえ制限されたもの
となる。
【0041】結果として、地名単語入力の場合は図11
に示すような連続文法の形をとり、人名単語入力の場合
は図9に示すような連続文法の形をとる。各音声入力に
おいては、図11、図12で示す連続文法を用いて最適
な認識処理が行われる。
【0042】本発明の第2実施形態によれば、図10に
示すように、キーワードスポッティング対象単語のグル
ープを複数個から構成することにより、キーワード単語
の候補をより少ない候補の中から抽出することができ、
認識率を更に上げるという新たな効果を生ずる。
【0043】
【発明の効果】以上説明したように本発明によれば、次
のような効果が得られる。
【0044】第1の効果は、予め考えられる不要語候補
を一度に登録しておきサービスの場面場面においてその
小集合に分割し用いるため、想定されるサービスシナリ
オに対応した辞書を音声認識装置にただ一回登録してお
けば、登録をやり直すことなくサービスを進行させるこ
とができる。
【0045】第2の効果は、ただ考えられる不要語を全
て登録するのでは他の単語による湧き出し誤りが頻発す
ることが予想されるが、本発明のようにサービスシーン
に応じ不要語の集合を適時切り替えていくことにより、
不必要な認識候補を排除できるため、想定されるサービ
スシナリオにおいて認識率の向上が期待できる。
【0046】第3の効果は、予めよく使用する文法制御
情報をパタンとして登録することにより、効率よくワー
ドスポッティングを用いた認識を切り替えることができ
る。
【図面の簡単な説明】
【図1】本発明の第1及び第2実施形態の音声認識装置
の構成例を示すブロック図である。
【図2】本発明の第1実施形態の音声認識処理を示すフ
ローチャートである。
【図3】本発明の第1実施形態の音声認識処理を示すフ
ローチャートである。
【図4】本発明の第1実施形態の地名/人名入力処理を
示すフローチャートである。
【図5】本発明の第1実施形態の累積距離計算処理を示
すフローチャートである。
【図6】本発明の第1実施形態の累積距離計算処理を示
すフローチャートである。
【図7】本発明の第1実施形態の音声認識の具体例を示
す説明図である。
【図8】本発明の第1実施形態の音声認識の具体例を示
す説明図である。
【図9】本発明の第1実施形態の音声認識の具体例を示
す説明図である。
【図10】本発明の第2実施形態の音声認識の具体例を
示す説明図である。
【図11】本発明の第2実施形態の音声認識の具体例を
示す説明図である。
【図12】本発明の第2実施形態の音声認識の具体例を
示す説明図である。
【符号の説明】
100 音声入力部 110 音声分析部 120 距離計算部 130 データ部 131 標準パタン辞書 132 汎用ワードスポッティング用文法辞書 140 文法制御部 141 選別手段 142 特化手段

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】 音声認識対象語の前後に付加される不要
    語を除去して音声認識を行う音声認識装置において、 音声情報の標準パタンが登録された標準パタン登録手段
    と、使用が想定される全ての前置不用語及び後置不用語
    を保持した連続文法が登録された不用語登録手段と、前
    記標準パタン登録手段及び前記不用語登録手段を参照し
    音声認識を行う音声認識手段と、該音声認識手段による
    前記不用語登録手段の探索空間をサービスシナリオに合
    わせて適宜縮小する制御手段とを備え、 前記制御手段は、予め登録された文法制御情報に基づき
    前記前置不用語集合から音声認 識対象語群を通り前記後
    置不用語集合への遷移が許可される経路を変更して、前
    記音声認識手段による音声認識に際し、登録されている
    前記前置不用語及び後置不用語の候補を削減することを
    特徴とする音声認識装置。
  2. 【請求項2】 前記音声認識対象語群は、音声認識要求
    毎に最適なグループに分類された複数の音声認識対象語
    群から成ることを特徴とする請求項1に記載の音声認識
    装置。
  3. 【請求項3】 前記制御手段は、地名単語入力及び人名
    単語入力などの名詞単語入力に基づくサービスシナリオ
    に合わせ前記音声認識手段による前記不用語登録手段の
    探索空間を適宜縮小することを特徴とする請求項1に記
    載の音声認識装置。
  4. 【請求項4】 音声認識対象語の前後に付加される不要
    語を除去して音声認識を行う音声認識方法において、 予め登録された音声情報の標準パタン及び予め登録され
    た使用が想定される全ての前置不用語及び後置不用語を
    保持した連続文法に基づき音声認識を行う際に、前記登
    録された使用が想定される前記前置不用語及び後置不用
    の探索空間をサービスシナリオに合わせて適宜縮小
    るために前記前置不用語集合から音声認識対象語群
    通り前記後置不用語集合への遷移が許可される経路を変
    して、前記音声認識に際し、登録されている前記前
    不用語及び後置不用語の候補を削減することを特徴とす
    る音声認識方法。
JP13409499A 1999-05-14 1999-05-14 音声認識装置及び音声認識方法 Expired - Lifetime JP3478171B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP13409499A JP3478171B2 (ja) 1999-05-14 1999-05-14 音声認識装置及び音声認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP13409499A JP3478171B2 (ja) 1999-05-14 1999-05-14 音声認識装置及び音声認識方法

Publications (2)

Publication Number Publication Date
JP2000322085A JP2000322085A (ja) 2000-11-24
JP3478171B2 true JP3478171B2 (ja) 2003-12-15

Family

ID=15120303

Family Applications (1)

Application Number Title Priority Date Filing Date
JP13409499A Expired - Lifetime JP3478171B2 (ja) 1999-05-14 1999-05-14 音声認識装置及び音声認識方法

Country Status (1)

Country Link
JP (1) JP3478171B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007226117A (ja) * 2006-02-27 2007-09-06 Mitsubishi Electric Corp 音声認識装置、音声認識プログラム、及び音声認識方法
JP2009116075A (ja) * 2007-11-07 2009-05-28 Xanavi Informatics Corp 音声認識装置
JP4941494B2 (ja) * 2009-03-30 2012-05-30 株式会社デンソー 音声認識システム

Also Published As

Publication number Publication date
JP2000322085A (ja) 2000-11-24

Similar Documents

Publication Publication Date Title
EP1143415B1 (en) Generation of multiple proper name pronunciations for speech recognition
JP3672800B2 (ja) 音声入力通信システム
JP3426176B2 (ja) 音声認識装置、方法、コンピュータ・システム及び記憶媒体
JP2001005488A (ja) 音声対話システム
JP2006048058A (ja) 多言語による名称の音声認識のための方法とシステム
JPH06214587A (ja) 事前指定ワードスポッティングサブシステム及び事前ワードスポッティング方法
JP2002014693A (ja) 音声認識システム用辞書提供方法、および音声認識インタフェース
JP3478171B2 (ja) 音声認識装置及び音声認識方法
JP4595415B2 (ja) 音声検索システムおよび方法ならびにプログラム
JP3058125B2 (ja) 音声認識装置
JP2655086B2 (ja) 電話回線音声入力システム
KR102141150B1 (ko) 화자종속 언어모델을 이용한 화자인식 장치 및 화자인식 방법
CA2597826C (en) Method, software and device for uniquely identifying a desired contact in a contacts database based on a single utterance
WO2002027535A1 (en) Method and system for expanding a word graph to a phone graph based on a cross-word acoustical model to improve continuous speech recognition
JP2880436B2 (ja) 音声認識装置
JP3535688B2 (ja) 音声認識方法
Sugamura et al. Speech processing technologies and telecommunications applications at NTT
KR20030010979A (ko) 의미어단위 모델을 이용한 연속음성인식방법 및 장치
JP2905686B2 (ja) 音声認識装置
JP3881155B2 (ja) 音声認識方法及び装置
JPH10254479A (ja) 音声認識装置
JPH08248979A (ja) 音声認識装置
KR101002135B1 (ko) 음절 음성인식기의 음성인식결과 전달 방법
JP4445371B2 (ja) 認識語彙の登録装置と音声認識装置および方法
JP3009709B2 (ja) 日本語音声認識方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071003

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081003

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091003

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091003

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101003

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111003

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121003

Year of fee payment: 9