JPH06149287A

JPH06149287A - 音声認識装置

Info

Publication number: JPH06149287A
Application number: JP29591092A
Authority: JP
Inventors: Hiroyuki Fujimoto; 博之藤本; Kazuya Sako; 和也佐古; Shoji Fujimoto; 昇治藤本
Original assignee: Denso Ten Ltd
Current assignee: Denso Ten Ltd
Priority date: 1992-11-05
Filing date: 1992-11-05
Publication date: 1994-05-27

Abstract

(57)【要約】【目的】本発明は音声を認識することにより機器の制
御を行うための音声認識装置に関し、認識した音声を話
者に戻し確認するトークバックの演算量を削減し認識時
間の短縮を図ることを目的とする。【構成】入力音声と予め登録された複数の単語と比較
し、最も類似した前記単語から順に再生出力し話者にト
ークバックして入力音声と一致するかを判断する音声認
識装置に、値が小さい程前記入力音声と登録単語とが類
似していることを示す認識距離が所定値以下であるかを
判定する認識距離判定部１３と、認識距離が所定値以下
の登録単語のみをトークバックするための候補出力１４
を設ける。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は音声を認識することによ
り機器の制御を行うための音声認識装置に関し、特に本
発明では認識した音声を話者に戻し確認するトークバッ
クの演算量を削減し認識時間の短縮を図ることに関す
る。

【０００２】

【従来の技術】従来このような分野の技術として以下に
説明するものがあった。図４は従来の音声認識装置を用
いた制御システムを示す図である。本図に示すように、
音声認識装置を用いた制御システムは、車両の車室３０
０内の話者の音声を捕捉する二つのマイクロフォン２０
０と、該マイクロフォン２００からの音声の方向、音源
からの距離から話者を識別する話者方向・距離判定部２
０１と、該話者方向・距離判定部２０１に接続され話者
を識別した音声信号から雑音を消去する適応形処理さら
に自動利得制御（ＡＧＣ）を行う音声認識の前処理部２
０２と、該前処理部２０２に接続され音声を登録された
どの単語に一致するかを認識する音声認識装置２０３
と、該音声認識装置２０３で認識された単語に基づき制
御信号を形成する各種制御部２０４と、該各種制御部２
０４を介して認識された単語を音声に合成する音声合成
部２０５と、該音声合成部２０５に接続され合成された
音声を再生するスピーカ２０６と、前記各種制御部２０
４により制御されるオーディオ２０７と、エアコンデシ
ョナー２０８と、電話２０９と、ナビゲーション２１０
と、オートドライブ２１１等を含む。

【０００３】すなわち、マイクロフォン２００で捕捉さ
れた音声は、話者方向距離判定部２０１、前処理部２０
２を介して音声認識装置２０３により認識され、この認
識結果を各種制御部２０４、音声合成部２０５を介して
スピーカ２０６により話者に伝え、話者の確認を行うト
ークバックにより行われこの確認後に各種制御部２０４
によりオーディオ２０７等のそれぞれにつき制御が実行
される。さらに音声認識装置２０３には制御、例えば制
御対象、制御動作等に必要な単語（文章）が登録されて
おり、入力音声はこの全ての単語とパターンマッチング
により比較される。例えばこの比較された単語は、類似
の程度を示す認識距離に基づく順番で制御対象、制御動
作の候補として記憶され、この候補となった単語を各種
制御部２０４、音声合成部２０５を介してスピーカ２０
６にトークバックしている。このトークバックされる制
御対象、制御動作等の単語の候補により話者は前記認識
が正しいかを判断した後に、各種制御の実行は開始する
ようにしてある。このトークバックは入力音声に最も近
い順になされるので入力音声の確認が迅速に行われる。

【０００４】

【発明が解決しようとする課題】しかしながら従来の音
声認識装置２０３では、入力音声に対応する制御動作等
の候補が上位の候補になるとは限らないので、原則とし
て登録されている全ての単語について順番をつけ、順番
をつけられた候補が順次トークバックされるようにして
いる。このため登録単語が多くなると認識時間が長くか
かるだけでなく演算処理量が増大しているという問題が
ある。

【０００５】したがって本発明は上記問題点に鑑みトー
クバックについて認識時間の短縮、演算量の削減を図れ
る音声認識装置を提供することを目的とする。

【０００６】

【課題を解決するための手段】本発明は前記問題点を解
決するために、入力音声と予め登録された複数の単語と
を比較し、入力音声に最も類似した前記単語から順に再
生出力し話者にトークバックして入力音声と一致するか
を判断する音声認識装置に認識距離判定部及び候補出力
を設ける。

【０００７】前記認識距離判定部は例えば値が小さい程
前記入力音声と登録単語とが類似していることを示す認
識距離が所定値以下であるかを判定する。前記候補出力
は前記認識距離が所定値以下の登録単語のみを入力音声
に対する候補としてトークバックする。

【０００８】

【作用】本発明の音声認識装置によれば、値が小さい程
前記入力音声と登録単語とが類似していることを示す認
識距離が例えば所定値以下であるかを判定し、すなわち
認識距離の大きいものは入力音声と登録単語とがあまり
類似しておらずこのような単語（文書）が正解である可
能性が低いと判定する。前記認識距離が所定値以下の登
録単語のみを入力音声に対する候補として順次トークバ
ックすることにより、トークバック候補の数が絞り込ま
れるようになった。すなわち正解である可能性が低いと
判定されるものがトークバック候補から省かれるので、
登録単語が多くなっても認識時間が短縮され、演算処理
量が削減される。

【０００９】

【実施例】以下本発明の実施例について図面を参照して
説明する。図１は本発明の実施例に係る音声認識装置を
示す図である。なお、全図を通じて同様の構成要素につ
いては同一の参照番号又は記号をもって表す。本図に示
す音声認識装置２２０は、車両の車室３００内の話者の
音声がマイクロフォン２００によって捕捉され、音声の
方向、音源からの距離から話者を識別する話者方向・距
離判定部２０１及び話者を識別した音声信号から雑音を
消去する適応形処理さらに自動利得制御（ＡＧＣ）を行
う音声認識の前処理部２０２を介して入力される特徴抽
出部１０を具備する。該特徴抽出部１０は入力パターン
がパターン固有の性質をもつ特徴量とか特徴パターンと
かを取り出す。

【００１０】さらに前記装置に単語登録部１１が設けら
れている。該単語登録部１１は、例えば、自動車の制
御、例えば制御対象、制御動作等に必要な単語（文章）
の音声パターンが記憶されている。また前記装置にパタ
ーンマッチング部１２が設けられている。該パターンマ
ッチング部１２は前記単語登録部の音声パターンと前記
特徴抽出部１０により抽出された入力パターンとを比較
し、前記単語登録部に記憶されている全ての単語につい
て類似の程度を示す認識距離を算出する。

【００１１】前記装置にパターンマッチング１２の後段
に認識距離判定部１３が設けられる。該認識距離判定部
１３はしきい値を有し、前記パターンマッチング部１２
で算出された認識距離が前記しきい値を越えるかを判定
する。前記認識装置判定部１３の後段に設けられる候補
出力部１４は認識距離がしきい値以下の候補のみを前記
各種制御部２０７に出力する。

【００１２】この候補は音声合成部２０５を介してスピ
ーカ２０６から音声として再生され話者にトークバック
される。図２は図１の音声認識装置２２０におけるトー
クバック候補を形成する一連の信号処理を説明するフロ
ーチャートである。本図に示すように、ステップ１で
は、音声認識装置の特徴抽出部１０に話者の音声を入力
する。

【００１３】ステップ２では、特徴抽出部１２により入
力音声のスペクトルパターンが求められる。ステップ３
では、音声認識装置２２０のパターンマッチング１２に
より、予め単語登録部１１のメモリ内に格納された登録
単語（文書）のスペクトルパターンと入力音声のスペク
トルパターンが比較される。

【００１４】ステップ４では、前記比較では認識距離の
算出は、例えばＤＰ（Dynamic Programming)法が用いら
れ、スペクトルパターンの類似度が定量化され認識距離
ｘ（小さい程類似している）が導出される。ステップ５
では、前記認識距離判定部１３により、予め決めておい
た認識距離のしきい値ｙと上記認識距離ｘが比較され
る。

【００１５】ステップ６では、候補出力部１４により、
ｘ≦ｙの条件を満たす単語（文章）だけが認識結果の候
補とし出力され、その他は出力から除外される。ステッ
プ７では、但し、上記ステップ６の候補数が予め決めて
いる最大認識候補数ｎより少なければ全てを候補とし、
ｎより多ければ認識距離の近いものかｎ個を選択しこれ
を最終認識候補とする。

【００１６】図３は図１の各種制御部２０７の制御動作
を説明するフローチャートである。本図に示すステップ
１１では、先ず各種制御部２０７の初期化を行う。ステ
ップ１２では、候補出力部１４から出力される候補が、
例えば「ＯＫ」、「よし」等の機器の制御以外の音声で
あってトークバック候補が正しいとの判断に伴う合図で
あるかを判断する。

【００１７】ステップ１３では、もし候補がＯＫ等の合
図でなければ、つぎにトークバック候補が、例えば「Ｎ
Ｏ」、「だめ」等の間違っているとの判断に伴う合図で
あるかを判断する。ステップ１４では、トークバック候
補が制御のための単語であるので、これを保存する。

【００１８】ステップ１５では、音声合成２０５を介し
てスピーカ２０６より、トークバック候補が再生出力さ
れる。そしてステップ１２に戻り、「ＯＫ」の有無を判
断する。ステップ１６では、「ＯＫ」があれば、図４に
示すオーディオ２０７等の制御対象等の制御の実行を開
始する。なお、ステップ１３で、「ＮＯ」の合図であれ
ば各種制御部２０４の動作を終了し音声の認識を最初か
らやり直す。

【００１９】本実施例によれば、従来の音声認識装置に
おいて常に登録された単語の全てについてトークバック
の候補としていたが、認識距離の大きいものは入力音声
と登録単語とがあまり類似しておらずこのような単語
（文書）が正解である可能性が低いからトークバック候
補から省き、トークバック候補の数が絞り込まれるよう
になった。

【００２０】

【発明の効果】以上説明したように本発明によれば、値
が小さい程前記入力音声と登録単語とが類似しているこ
とを示す認識距離が所定値以下であるかを判定し、認識
距離が所定値以下の登録単語のみをトークバックするよ
うにしたので、トークバック候補の数が絞り込まれるよ
うになった。すなわち正解である可能性が低いと判定さ
れるものがトークバック候補から省かれるので、登録単
語が多くなっても認識時間が短縮され、演算処理量が削
減される。

【図面の簡単な説明】

【図１】本発明の実施例に係る音声認識装置を示す図で
ある。

【図２】図１の音声認識装置におけるトークバック候補
を形成する一連の信号処理を説明するフローチャートで
ある。

【図３】図１の各種制御部２０７の制御動作を説明する
フローチャートである。

【図４】従来の音声認識装置を用いた制御システムを示
す図である。

【符号の説明】

１０…特徴抽出部１１…パターンマッチング１３…認識距離判定部１４…候補出力部２００…マイクロフォン２０４…各種制御部２０６…スピーカ２２０…音声認識装置

Claims

【特許請求の範囲】

【請求項１】入力音声と予め登録された複数の単語と
を比較し、前記入力音声の最も類似した前記単語から順
に再生出力し話者にトークバックして入力音声と一致す
るかを判断する音声認識装置であって、値が小さい程前記入力音声と登録単語とが類似している
ことを示す認識距離が所定値以下であるかを判定する認
識距離判定部（１３）と、前記認識距離が所定値以下の登録単語のみを前記入力音
声に対する候補として順次トークバックするための候補
出力（１４）とを備えることを特徴とする音声認識装
置。