JPS5814199A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS5814199A
JPS5814199A JP56112726A JP11272681A JPS5814199A JP S5814199 A JPS5814199 A JP S5814199A JP 56112726 A JP56112726 A JP 56112726A JP 11272681 A JP11272681 A JP 11272681A JP S5814199 A JPS5814199 A JP S5814199A
Authority
JP
Japan
Prior art keywords
distance
memory
pattern
standard
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP56112726A
Other languages
English (en)
Inventor
宏樹 大西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Sanyo Denki Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Sanyo Denki Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd, Sanyo Denki Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP56112726A priority Critical patent/JPS5814199A/ja
Publication of JPS5814199A publication Critical patent/JPS5814199A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は1人間の音声を認識する事のできる音声認識装
置に関する。
一般に、この種音声認識装置は、登録した話者の音声だ
けを認識対象とする特定話者用の装置と多数の人の音声
をも認識対象とする不特定話者用の装置と、に大別され
る。
しかしながら、現在いかなる人の音声にも完全に対応で
きる不特定話者用装置はなく、音声の個人差を代表する
特定多数の音声な予じめ登録しておき、これ等の登録音
声と入力音声との比較を行なう特定多数話者用の音声認
識装置が不特定話者用の装置に代用されており、これ等
特定、不特定話者用認識装置には格別の違いが無いもの
である。
第1図に不特定話者を対象として特定多数話者の音声が
登録されている音声認識装置を示す。同図に於いて11
)は音声を電気信号に変換するマイクロフオン、(2)
は該電気信号から8つのスペクトル値xi(i=1+2
+・・・8)を抽出する8並列のバンドパスフィルタ群
であり、夫々の通過帯域は音声帯域(100Hz 〜4
00(IHz  程度)を8分割したものである。(3
)は音声パターン作成回路であり該バンドパスフィルタ
群(2)から得られる8つのスペクトル値、27t を
サンプリング処理して、入力音声の存在範囲について1
6サンプルを網集するものである。(4)は入カバター
ンメモリであり、上記バンドパスフィルタ群(田からの
8つのスペクトル□ 値xiの16サンプルからなる入力音声)(ターンCx
1j  )  +  (izt  1 2 、−、  
s    )° e  l  、  2  、  I+
  。
16)が貯えられる。(5)は参照パターンメモリであ
り、予じめ登録された多数話者M人の複数のN語につい
ての参照音者パターン〔yLj)rILrL。
(m−1、2,−、M  n−] 、 2.−.・、N
)か格納されている。+61は距離算出回路であり、上
記参照ノくターンメモリ(5)の参照音者パターンCy
ij〕mnと上記入カバターンメモリ(4)の入力音声
パターンとの距離 が算出される。(7)は認識処理部であり、上記距離算
出回路(6)に依って得られた距@ d (m 、 r
L)が最小となる時のルを検出し、この時の入力音声が
第1番目の認識語であると認識する。斯様な音声認識装
置は、距離算出回路(6)に於いて行列パターンCMi
j )とCyij”:J との距離D(m、n)をKN
N個算する事になり、更に多人数の音声に対応しようと
して、又、認識率の向上を計ろうとしてMを増加すれば
、大量の計算処理が必要となり、実時間での音声認識が
困難となる恐れがあった。
本発明は斯る実情に鑑みて為されたものであり、認識の
為の計算処理の簡略化を計った音声認識装置を提供する
ものである。
第2図に本発明の音声認識装置を示す。同図に於いて、
(1)〜〔4)は第1図の従来装置と同様にマイクロフ
ォン−入カバターンメモリを示している。
(8)は標準音声パターンメモリであり、予じめN個の
各認識語について、S準的な標準音声パターンC9’j
′In、(ts=1.2.−A’)が貯えられている。
(9)は距離算出回路であり、上記標準パターンメモリ
(8)の各標準パターン〔7番)〕ルと入カバターンメ
モ9 (4)の入力音声パターンとの距離を算出する。
(1(Iは該距離算出回路(8)から得られる距離へ’
l )ルg)=(dlll、 d(2)、−、d(M)
trX貯えられる距離ベクトルメモリである。01)は
参照距離ベクトルメモリであり、予じめM人の特定多数
話者のN語の音声パターンについて、その各音声バター
’C’/’) 〕、−” 、(m−1+ 2 m”幸1
M  n−1,2,・・・、N)と上記標準パターンメ
モリ(7)の標準音声パターン〔yす〕ル、(n+wl
 l 2 *・・・、N)との距離 からなる距離ベクトル[+) mn−(dV’l?、 
d(舊几・・・、d恥。
(m=1 、2 、・・、M n−1、2、・・・N)
がmnが列のマトリクス状に格納されている。■は上記
誤差算出回路であり、上記参照距離ベクトルメモリ01
1の各参照距離ベクトルIDmnと上記距離ベクトルメ
モリGOの距離ベクトルのとの誤差 δ(扉、rL) −0) −rDm n  が算出され
る。α3は認識処理部であり、上記誤差算出回路02か
ら得られる誤差δ(m 、 n )が最小となる時のル
を検出する事に依って、この時マイクロフォン+11に
入力された音声が第n番目の認識語であると決定される
斯る構成の音声認識装置は、その距離算出回路(9)に
依って、入力音声パターン〔Xす°〕を1語に1つづつ
割り合てられた標準パターンメモリ(8)のN個の標準
音声パターンCyす°〕がとこの入力音声パターン〔X
す′〕間の距離d (yzlで表現されるN次元(7)
ffilllへ’7 ) ル1)= (dlll、 d
(2+、 ・、 d(/V))c変換しておく。そして
、参照距離ペクト7レメモリa11には、予じめ1M人
N語の各音声パターン〔yij)mnをN個の標準音声
t<y−y(いj〕nを用いて音声の個人差の値を示す
N次元ベクトルに変換された参照距離ペクトlし[D 
771 n −t d’TrV、 dl?。
・・・、 dM>がマトリゲス的に格納されており、誤
差算出回路囮に依って、これ等参照距離ベクトルptn
nと入力音声に対応する前記の距離ベクトルのとの誤差
δ(m 、n ) *即ち、音声の個人差の成分を含め
た類似度、が算出され、認識処理部(2)で最小のδ(
m 、 n )となるルが検出される。
この様にマトリクス状の音声パターンCx1j)。
Cyij〕rnnを標準音声パターン(y i j) 
nに依って、音声の個人差の値を示す距離ベクトルρ。
rDmnに変換してから、これ等pとlp yx aの
マツチングを行なっているので、上記音声パターン〔X
す゛)、(yij )mn を直接マツチングするのと
等価な認識処理が為される事になる。そして、この認識
時の演算処理は、距離算出回路(9)に於いてt行ノ゛
列のマトリクスパターン間の距離d lnlがN回算出
されるので、すN回の減算が行なわれ。
誤差算出回路0に於いては1M個の成分からなる距離ベ
クトル間の誤差がKNN回算出れるので、KN”回の減
算が行なわれ、合計り゛N十M/回の減算が為される。
この減算回数は合計ijM締の減算が為される第1図に
示した従来例に比べると、近似的に(す°−N)MWの
減算回数が軽減されている。即ち、実施例の如く、i 
−3、j−16とした場合、認識語数Nを128語以下
とする場合に減算回数の軽減が計れる事が明らかである
本発明は以上の説明から明らかな如く、パターン作成回
路から得られる入力音声パターンを距離算出回路に依っ
て標準パターンメモリの標準音声パターンとの距離ベク
トルに変換し、この距離ベグルトと、予じめ特定多数話
者の複数の音声バター誤差算出回路に依って算出し、こ
の誤差が最も小I −さ′い時の参照距離メモリの距離ベクトルに対応する
倉声なこの時の入力音声と認識するものであるので、従
来装置の如くマトリクス状の参照音声パターンと入力音
再パターンとを直接マツチングするのに比べ、演算処理
量を大巾に軽減する事ができ、しかもメモリ容量の低減
が計れるう従って、実時間の応答を計りながら、登録話
者を増加せしめる事に依って、高い認識率で不特定話者
に対応できる音声認識装置が実現できる。
【図面の簡単な説明】
第1図は従来の音声認識装置の構成を示すブロック図、
第2図は本発明の音声認識装置を示すブロック図、であ
り、(2)はバンドパスフィルタ群・(3)はパターン
作成回路、(4)は入カバターンメモリ16)+91は
距離算出回路、 171(13は認識処理部、(8)は
標準ハターンメモリ、αOは距離ベクトルメモリ、al
lは参照距離ベクトルメモリ、紛は誤差算出回路。 を夫々示している。 第1図

Claims (1)

    【特許請求の範囲】
  1. (1)  入力音声の音声信号に基づいて音声の特徴パ
    ターンを作成するパターン作成回路と、予じめ複数の音
    声について標準的な標準音声パターンを貯えた標準パタ
    ーンメモリと、これとは別に予じめ特定多数話者の複数
    の音声パターンについて。 この各音声パターンと上記標準パターンの複数の標準音
    声パターンとの複数の距離からなる距離ベクトルを・特
    定多数話者の複数音声に対応する如くマトリゲス的に貯
    えた参照距離メモリと、上記パターン作成回路から得ら
    れる音声バダーンと上記標準パターンメモリの複数の標
    準パターンとの距離を算出する距離算出回路と、該距離
    算出回路に依って得られる複数の距離からなる距離ベク
    トルと上記参照距離メモリの各距離ベクトルとの誤差を
    算出する距離誤差算出回路と、からなり、上記距離誤差
    算出回路から得られる誤差を最小とならしめる上記参照
    距離メモリの距離ベクトルな検出し、この距離ベクトル
    に対応する音声をこの時の入力音声と認識する事を特徴
    とする音声認識装置。
JP56112726A 1981-07-17 1981-07-17 音声認識装置 Pending JPS5814199A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56112726A JPS5814199A (ja) 1981-07-17 1981-07-17 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56112726A JPS5814199A (ja) 1981-07-17 1981-07-17 音声認識装置

Publications (1)

Publication Number Publication Date
JPS5814199A true JPS5814199A (ja) 1983-01-26

Family

ID=14593993

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56112726A Pending JPS5814199A (ja) 1981-07-17 1981-07-17 音声認識装置

Country Status (1)

Country Link
JP (1) JPS5814199A (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5672499A (en) * 1979-11-19 1981-06-16 Hitachi Ltd Pretreatment for voice identifier

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5672499A (en) * 1979-11-19 1981-06-16 Hitachi Ltd Pretreatment for voice identifier

Similar Documents

Publication Publication Date Title
Davis et al. Automatic recognition of spoken digits
JPS58100199A (ja) 音声認識及び再生方法とその装置
US3588363A (en) Word recognition system for voice controller
JPS5814199A (ja) 音声認識装置
US3225141A (en) Sound analyzing system
JPS6312312B2 (ja)
EP0484455A1 (en) A method and apparatus for language and speaker recognition
JPS59111699A (ja) 話者認識方式
Jokic et al. Towards enabling measurement of similarity of acoustical environments using mobile devices
JP2989231B2 (ja) 音声認識装置
JPS605960B2 (ja) 音声認識方式
US20080262831A1 (en) Method for the Natural Language Recognition of Numbers
JPS6328315B2 (ja)
JPS63109500A (ja) パタ−ン認識装置
JPS60169900A (ja) 単語登録方式
JPH03236100A (ja) 音声検出方式
JPS63187376A (ja) パタ−ン認識装置
JPH04109300A (ja) 衝撃音識別装置
JPS62111295A (ja) 音声認識装置
JPS6026399A (ja) 単語認識装置
KR950004013A (ko) 시간지연 신경망(tdnn)을 이용한 특징어 인식 시스템
JPS59124388A (ja) 単語音声認識処理方式
JPH0494000A (ja) 音声認識装置
JPS62232698A (ja) 音声認識方法
JPS61213900A (ja) 不特定話者音声認識方式