JPS5814199A

JPS5814199A - 音声認識装置

Info

Publication number: JPS5814199A
Application number: JP56112726A
Authority: JP
Inventors: 宏樹大西
Original assignee: Sanyo Electric Co Ltd; Sanyo Denki Co Ltd
Current assignee: Sanyo Electric Co Ltd; Sanyo Denki Co Ltd
Priority date: 1981-07-17
Filing date: 1981-07-17
Publication date: 1983-01-26

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】本発明は１人間の音声を認識する事のできる音声認識装
置に関する。

一般に、この種音声認識装置は、登録した話者の音声だ
けを認識対象とする特定話者用の装置と多数の人の音声
をも認識対象とする不特定話者用の装置と、に大別され
る。

しかしながら、現在いかなる人の音声にも完全に対応で
きる不特定話者用装置はなく、音声の個人差を代表する
特定多数の音声な予じめ登録しておき、これ等の登録音
声と入力音声との比較を行なう特定多数話者用の音声認
識装置が不特定話者用の装置に代用されており、これ等
特定、不特定話者用認識装置には格別の違いが無いもの
である。

第１図に不特定話者を対象として特定多数話者の音声が
登録されている音声認識装置を示す。同図に於いて１１
）は音声を電気信号に変換するマイクロフオン、（２）
は該電気信号から８つのスペクトル値ｘｉ（ｉ＝１＋２
＋・・・８）を抽出する８並列のバンドパスフィルタ群
であり、夫々の通過帯域は音声帯域（１００Ｈｚ　〜４
００（ＩＨｚ　　程度）を８分割したものである。（３
）は音声パターン作成回路であり該バンドパスフィルタ
群（２）から得られる８つのスペクトル値、２７ｔ　を
サンプリング処理して、入力音声の存在範囲について１
６サンプルを網集するものである。（４）は入カバター
ンメモリであり、上記バンドパスフィルタ群（田からの
８つのスペクトル□ 値ｘｉの１６サンプルからなる入力音声）（ターンＣｘ
１ｊ　　）　　＋　　（ｉｚｔ　　１　２　、−、　　
ｓ　　　　）°　ｅ　　ｌ　　、　　２　　、　　Ｉ＋
　　。

１６）が貯えられる。（５）は参照パターンメモリであ
り、予じめ登録された多数話者Ｍ人の複数のＮ語につい
ての参照音者パターン〔ｙＬｊ）ｒＩＬｒＬ。

（ｍ−１、２，−、Ｍ　　ｎ−］　、　２．−．・、Ｎ
）か格納されている。＋６１は距離算出回路であり、上
記参照ノくターンメモリ（５）の参照音者パターンＣｙ
ｉｊ〕ｍｎと上記入カバターンメモリ（４）の入力音声
パターンとの距離が算出される。（７）は認識処理部であり、上記距離算
出回路（６）に依って得られた距＠　ｄ　（ｍ　、　ｒ
Ｌ）が最小となる時のルを検出し、この時の入力音声が
第１番目の認識語であると認識する。斯様な音声認識装
置は、距離算出回路（６）に於いて行列パターンＣＭｉ
ｊ　）とＣｙｉｊ”：Ｊ　との距離Ｄ（ｍ、ｎ）をＫＮ
Ｎ個算する事になり、更に多人数の音声に対応しようと
して、又、認識率の向上を計ろうとしてＭを増加すれば
、大量の計算処理が必要となり、実時間での音声認識が
困難となる恐れがあった。

本発明は斯る実情に鑑みて為されたものであり、認識の
為の計算処理の簡略化を計った音声認識装置を提供する
ものである。

第２図に本発明の音声認識装置を示す。同図に於いて、
（１）〜〔４）は第１図の従来装置と同様にマイクロフ
ォン−入カバターンメモリを示している。

（８）は標準音声パターンメモリであり、予じめＮ個の
各認識語について、Ｓ準的な標準音声パターンＣ９’ｊ
′Ｉｎ、（ｔｓ＝１．２．−Ａ’）が貯えられている。

（９）は距離算出回路であり、上記標準パターンメモリ
（８）の各標準パターン〔７番）〕ルと入カバターンメ
モ９　（４）の入力音声パターンとの距離を算出する。

（１（Ｉは該距離算出回路（８）から得られる距離へ’
ｌ　）ルｇ）＝（ｄｌｌｌ、　ｄ（２）、−、ｄ（Ｍ）
ｔｒＸ貯えられる距離ベクトルメモリである。０１）は
参照距離ベクトルメモリであり、予じめＭ人の特定多数
話者のＮ語の音声パターンについて、その各音声バター
’Ｃ’／’）　〕、−”　、（ｍ−１＋　２　ｍ”幸１
Ｍ　　ｎ−１，２，・・・、Ｎ）と上記標準パターンメ
モリ（７）の標準音声パターン〔ｙす〕ル、（ｎ＋ｗｌ
　ｌ　２　＊・・・、Ｎ）との距離からなる距離ベクトル［＋）　ｍｎ−（ｄＶ’ｌ？、　
ｄ（舊几・・・、ｄ恥。

（ｍ＝１　、２　、・・、Ｍ　ｎ−１、２、・・・Ｎ）
がｍｎが列のマトリクス状に格納されている。■は上記
誤差算出回路であり、上記参照距離ベクトルメモリ０１
１の各参照距離ベクトルＩＤｍｎと上記距離ベクトルメ
モリＧＯの距離ベクトルのとの誤差 δ（扉、ｒＬ）　−０）　−ｒＤｍ　ｎ　　が算出され
る。α３は認識処理部であり、上記誤差算出回路０２か
ら得られる誤差δ（ｍ　、　ｎ　）が最小となる時のル
を検出する事に依って、この時マイクロフォン＋１１に
入力された音声が第ｎ番目の認識語であると決定される
。

斯る構成の音声認識装置は、その距離算出回路（９）に
依って、入力音声パターン〔Ｘす°〕を１語に１つづつ
割り合てられた標準パターンメモリ（８）のＮ個の標準
音声パターンＣｙす°〕がとこの入力音声パターン〔Ｘ
す′〕間の距離ｄ　（ｙｚｌで表現されるＮ次元（７）
ｆｆｉｌｌｌへ’７　）　ル１）＝　（ｄｌｌｌ、　ｄ
（２＋、　・、　ｄ（／Ｖ））ｃ変換しておく。そして
、参照距離ペクト７レメモリａ１１には、予じめ１Ｍ人
Ｎ語の各音声パターン〔ｙｉｊ）ｍｎをＮ個の標準音声
ｔ＜ｙ−ｙ（いｊ〕ｎを用いて音声の個人差の値を示す
Ｎ次元ベクトルに変換された参照距離ペクトｌし［Ｄ　
７７１　ｎ　−ｔ　ｄ’ＴｒＶ、　ｄｌ？。

・・・、　ｄＭ＞がマトリゲス的に格納されており、誤
差算出回路囮に依って、これ等参照距離ベクトルｐｔｎ
ｎと入力音声に対応する前記の距離ベクトルのとの誤差
δ（ｍ　、ｎ　）　＊即ち、音声の個人差の成分を含め
た類似度、が算出され、認識処理部（２）で最小のδ（
ｍ　、　ｎ　）となるルが検出される。

この様にマトリクス状の音声パターンＣｘ１ｊ）。

Ｃｙｉｊ〕ｒｎｎを標準音声パターン（ｙ　ｉ　ｊ）　
ｎに依って、音声の個人差の値を示す距離ベクトルρ。

ｒＤｍｎに変換してから、これ等ｐとｌｐ　ｙｘ　ａの
マツチングを行なっているので、上記音声パターン〔Ｘ
す゛）、（ｙｉｊ　）ｍｎ　を直接マツチングするのと
等価な認識処理が為される事になる。そして、この認識
時の演算処理は、距離算出回路（９）に於いてｔ行ノ゛
列のマトリクスパターン間の距離ｄ　ｌｎｌがＮ回算出
されるので、すＮ回の減算が行なわれ。

誤差算出回路０に於いては１Ｍ個の成分からなる距離ベ
クトル間の誤差がＫＮＮ回算出れるので、ＫＮ”回の減
算が行なわれ、合計り゛Ｎ十Ｍ／回の減算が為される。

この減算回数は合計ｉｊＭ締の減算が為される第１図に
示した従来例に比べると、近似的に（す°−Ｎ）ＭＷの
減算回数が軽減されている。即ち、実施例の如く、ｉ　
−３、ｊ−１６とした場合、認識語数Ｎを１２８語以下
とする場合に減算回数の軽減が計れる事が明らかである
。

本発明は以上の説明から明らかな如く、パターン作成回
路から得られる入力音声パターンを距離算出回路に依っ
て標準パターンメモリの標準音声パターンとの距離ベク
トルに変換し、この距離ベグルトと、予じめ特定多数話
者の複数の音声バター誤差算出回路に依って算出し、こ
の誤差が最も小Ｉ −さ′い時の参照距離メモリの距離ベクトルに対応する
倉声なこの時の入力音声と認識するものであるので、従
来装置の如くマトリクス状の参照音声パターンと入力音
再パターンとを直接マツチングするのに比べ、演算処理
量を大巾に軽減する事ができ、しかもメモリ容量の低減
が計れるう従って、実時間の応答を計りながら、登録話
者を増加せしめる事に依って、高い認識率で不特定話者
に対応できる音声認識装置が実現できる。

【図面の簡単な説明】

第１図は従来の音声認識装置の構成を示すブロック図、
第２図は本発明の音声認識装置を示すブロック図、であ
り、（２）はバンドパスフィルタ群・（３）はパターン
作成回路、（４）は入カバターンメモリ１６）＋９１は
距離算出回路、　１７１（１３は認識処理部、（８）は
標準ハターンメモリ、αＯは距離ベクトルメモリ、ａｌ
ｌは参照距離ベクトルメモリ、紛は誤差算出回路。を夫々示している。第１図

Claims

【特許請求の範囲】

（１）　　入力音声の音声信号に基づいて音声の特徴パ
ターンを作成するパターン作成回路と、予じめ複数の音
声について標準的な標準音声パターンを貯えた標準パタ
ーンメモリと、これとは別に予じめ特定多数話者の複数
の音声パターンについて。この各音声パターンと上記標準パターンの複数の標準音
声パターンとの複数の距離からなる距離ベクトルを・特
定多数話者の複数音声に対応する如くマトリゲス的に貯
えた参照距離メモリと、上記パターン作成回路から得ら
れる音声バダーンと上記標準パターンメモリの複数の標
準パターンとの距離を算出する距離算出回路と、該距離
算出回路に依って得られる複数の距離からなる距離ベク
トルと上記参照距離メモリの各距離ベクトルとの誤差を
算出する距離誤差算出回路と、からなり、上記距離誤差
算出回路から得られる誤差を最小とならしめる上記参照
距離メモリの距離ベクトルな検出し、この距離ベクトル
に対応する音声をこの時の入力音声と認識する事を特徴
とする音声認識装置。