JPS58125098A - パタンマツチング装置 - Google Patents

パタンマツチング装置

Info

Publication number
JPS58125098A
JPS58125098A JP57007081A JP708182A JPS58125098A JP S58125098 A JPS58125098 A JP S58125098A JP 57007081 A JP57007081 A JP 57007081A JP 708182 A JP708182 A JP 708182A JP S58125098 A JPS58125098 A JP S58125098A
Authority
JP
Japan
Prior art keywords
calculated
similarity
output
formula
calculate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57007081A
Other languages
English (en)
Inventor
藤本 好司
次男 高橋
栗野 清道
秀司 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP57007081A priority Critical patent/JPS58125098A/ja
Publication of JPS58125098A publication Critical patent/JPS58125098A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明はバタンマツチング装置(二係り、詳しくは、音
声のごとく特徴ベクトルの時系列として表現される2個
のバタンを比較し、その類似性を評価する尺度すなわち
類似度を計算する装置の改良(′″−関する。
標準の音声バタンと入力の音声バタンとの類似度を用い
て認識を行なう音声認識装置において、標準音声と入力
音声の発声速度の相違を吸収するために、動的計画法(
Dynamic programming )を利用し
た時間軸正規化マツチング法が良く用いられる。さらに
最近では、このD P (Dynamic Pr。
grarryning)マツチングに対して、マツチン
グ領域を限定する傾斜制限が導入され、これによって、
入力音声バタンの時間軸に対して、連続的にマツチング
を行ない類似性を計算できる連続DPマツチングが提案
されている(特開昭55−2205 )。
この連続DPマツチングは、離散発声の単語音声だけで
なく連続発声の単語音声を認識することができる。すな
わら、人力バタンの任意の時間における類似度を連続的
に求めることができるので、入力バタンの部分系列と標
準パタンとのマツチングを取ることができ、これ(−よ
って、連続発声の音声認識が可能となる。しかしながら
、従来の傾斜制限を適用した連続DPマツチング法では
、漸化式の計算のために、過去に計算した結電を多数保
持しておく必要があり、これをハードウェアにて実現す
る際には、大容緻の作業用メモリが必要になるという欠
点があった。
本発明の目的は、バタンマツチング装置(−おける正規
化類似度を計算する漸化式を変形することにより、記憶
しなければならない計算値の数を削減し、作業用レジス
タあるいはメモリの容量を大幅(二節約することにある
正規化類似度を計算する順化式において、積分量g(i
、j)の漸化式は先に計算済みのd (k。
t)   g  (m、   n  )  l   (
i  −K<k、   m(i、   j−L<z、n
<J)を変数とする荷重和で与えられるが、本発明はこ
の順化式を隣接する添字の変数から構成される部分和に
分解し、これを繰上、げて、g(i、 J)の計算と同
時に計算することにより、保持しておかなければならな
い変数の数を削減するものである。
一般に音声バタンは特徴ベクトルの時系列として、 A=11.、爪2’l”’l帽、 ・= aVI(11
のように表現される。こ5で、aiは音声の時間点1に
おける特命を示すベクトルで、 ff1i=(ati 、 a2i + −api + 
・−api )   121のように表わされる。ap
lとしては、−例としてPチャイ、ルのバンドパスフィ
ルタの一つの出力と考えることができる。
(1)式のように表現される音声バタンAを入力バタン
とし、標準バタンを B−N)1.b2.・・、bj、・・・To J   
   (31として、AとBの類似度を連続DPマツチ
ングによt)求めることを考える。いま例として、数字
゛2゜3.4”(/旧san yon /)の連続発声
ハタンヲ人カバタンAとし、数字の”3″″(/San
/)の発声バタンを標準パタンBとする。
第1図は、この入力バタンAと標準パタンBの対応づけ
を示した図である。第1図に示すように、連続発声の場
合には、入力バタンのどの部分と標準パタンとか最も良
く整合するかを調べる。この整合は、入力バタンと標準
パタンの発声速度が異るので、音韻毎に伸縮させながら
整合を取る必要がある。これを行なうのが連続DPマツ
チングで、第2図に示すように、1軸(二人カバタンA
を、J軸(=標準バタンBを配列し、点(Is、1)よ
り点(lz、 J )に至る点列について、例えばで定
義されろ歯と51間の距離の総和を最小にする最適な点
列203を求めると同時に点(iE、J)における距離
の総和の最小値を求める。これを順化式で書くと次のよ
うになる。
g(0,j)=g(−1,j)=M  j=1.・・・
、 J +51g(i、1)二d(I、1)    l
−1,・・、 I +61この順化式から入力バタンA
と標準パタンBどの時間正規化類似度SAB+’)は で与えられる。
とXで、(8)式は、第3図ta)に示すように、g(
1−1,J−2)1g(I−1,J−1)1g(1−2
,J−1)のいずれか\ら計算され、それに対応して3
つのぎ」算経路が存在する。この計算経路を継ぐと、第
2図の点(I S、 l )から点(ig、 J)まで
の最適経路が求まる。この最適経路の通り得る範囲は、
第3図(a)より分るように、第2図の直線201と直
線202で囲まれる領域である。このように、(8)式
によって、最適経路の通り得る範囲を限定することを傾
斜制限という(第3図は、この傾斜4口11限を示した
ものである)。したがって、傾斜制限を変更する場合に
は、(8)式の順化式を変更することになるが、いくつ
かの例を以下に示す。
(10)式の経路は、第3図(b)に対応する。
α1)式の経路は、第3図の(C)に対応する。
こ\で、手記順化式の計算手順を考えると、へカバタン
である西は時間の経過に伴って逐次入力されてくるので
、認識をリアルタイムで行なうためには、必然的に、1
つの昆、が入力されると次の21+1が人力されるまで
にj=1.2.・・、Jについて順次計算することにな
る。したがって、例えば(8)式、叫式の順化式を計p
−するためには、計鼻済みのg(i−2,J−1)、g
(i〜1. j−1)、 g (皇−1,J−2)、 
d (i、 j−1)、 d (i−1,J)を記憶し
ておく必要がある。しかし、潅、が入力される毎にg(
i、i)をJ−1,2,・・、Jについて計算するため
、g(i−2,j−1)、 g(i−1,J−11゜g
(i−1,J−2)、 d(i−1,J)については、
g(’−2+ J)+ g(’  1+ J)+ dい
−1,J)の値を」−1,2,・・、Jについて、3]
個の値を記憶しておく必要がある。また、0])式の漸
化式については、g(’−31J)l g(’  2+
 J)I g(’  11 Juld(’  L N+
d(’  1+ 4)+J−1+ 2+・・、Jの5]
個の値を記憶しておかなければならない。
さら(−1標準パタンは必ず2個以上存在し、各標準バ
タン毎(二上記の値を記憶しなければならないので、記
憶しておかなければならない値の数は、標準パタンの数
に比例して増大する。
この記憶しておかなければならない値の数を減らすには
、i−3,i−2,i−1等の添字を持つ変数の数を減
らす必要がある。本発明では、(8)、ilG、(l]
)式の漸化式をi−1の添字しか含まない漸化式f、い
+ ])+ f2(’+ J)+・・に分解することに
より、記憶しなければならない値の数を削減する。
すなわら、(8)式は次のように分解する。
また、00)式は次のように分解する。
これら、(2)、0:1式では、gい−1,i)、f+
(i −1、J)、  J=1.2.・・、Jの2]個
の値を記憶しておけば良< 、[81,Q[1式に比べ
て2/3に減少する。
また、αη式については、次のように分解される。
このθ→式では、gい−1,j)、 rl(i−11j
)、 r2(夏−1,J)、j−1,2,・・、Jの3
d個の値を記憶しておけば良<、(11)式に比べて記
憶しなければならない値の数は315に減少する。
以上の様に順化式を分解した時の計算経路を第4図に示
す。こメで、02式が第4図(a)(−103式が第4
図(b)に、(1→式が第4図(C)に対応する。
次に本発明の一実施例を0諦式の順化式を例に詳述する
第5図は+41 、 +51 、 +61 、 QJ式
の計算を実現する・・−ドウエアの構成図である。第5
図において、500は入カパタ:/A= (all 、
 J2 、− J 、 −51)を計算する特徴抽出回
路で、時間の経過にともなって31を逐次出力線501
より出力する。出力のタイミングは、590の制御部よ
り信号線503によって与えられる。510は標準パタ
ンB= (To、、 l+2゜・・、わ3.・・・II
IJ )を記憶しておく記憶装置であり、b、を逐次読
出し出力線511より出力する。該記憶装置510から
読出す番地およびタイミングは、制御信号線512を通
し制御部590より与えられる。
特徴抽出回路500および記憶装置510からの2つの
出力は、ベクトル間類似度割算器520に入力され、(
41式にもとづいて計算が行なわれ、黒とl)1間の類
似度d(i、J)を521に出力する。この出力のタイ
ミングは制御信号線522 Eより与えられる。ベクト
ル間類似度計算器520の出力は遅延レジスタ525に
入力され、次のJまで記憶される。
すなりら、遅延レジスタ525の出力はdい、」−1)
を与える。遅延レジスタ525の出力のタイミングは制
御信号線527によって力えられる。
OR,570は前に計算済みの積分1g(i−1,i)
を記憶しておく汎用レジスタ(記憶装置)で、その読み
出すべきデータのアドレスおよび読出しのタイミングは
、制御信号線572によって与えられる。G R570
より読出されたg(i−LJ)は遅延レジスタ560 
、565を順次経由し、g(i〜1.J−1)、g(i
〜1.j−2)が出力線561 、566に各々出力さ
れる。出力のタイミングは、1制御信号562゜567
によって与えられる。一方、F’ R580は計算済み
のfI(i  1.J)を記憶しておく汎用レジスタ(
記憶装置)で、その読み出すべき番地およびタイミング
は、信号線582によって与えられる。
このようにして得られたd(i、 j)、 d (i、
 j −1)、 g(i −L 」−1)+ g(i−
1,j−2)、 fl (i−1,J)はG演算器53
0に入力され、(2)式によってg(i、 j )が計
算され、出力線31から汎用レジスタG R570に格
納される。g(i、 j)の格納番地はg(i−1,j
)を読み出した番地と同じである。
一方、g (i−1,j −1)、 d (i、 j 
)はF演算器540に入力され、0才式によってf、い
、J)が計算され、出力線541から汎用レジスタF 
R580に格納される。fI(i、j)の格納番地もf
l(’  1.j)を読み出した番地と同じ所である。
このようにして制御部590の制御のもとにg(i、 
j)、 r、 (i、 j)が」(二ついて計算され、
J−Jとなった所で、g(i、J)は除算器595に人
力され、制御部590より出力線591経由で与えられ
るJ−4−iE−i5の値によって除算が行なわれ、(
9)式の正規化類似度SAB (i)が出力線569に
出力゛される。
第6図にG演算器530の詳細図を示す。第5図で説明
したように、ベクトル間類似度計算器520、遅延レジ
スタ525の出力線521 、526は、各々d(it
 J)+ d (it J−t )を与える。また、汎
用レジスタ570、遅延レジスタ560 、565の出
力線571 、561 、566は、各々g(i−1,
j)、 g(i −1、J−1)、g(i −L J−
2)を与え、汎用レジスタ580の出力線581はfl
(’  IIJ)を馬える。G演算器530は2倍乗算
器600、加算器601 、602゜605および最小
値検出器604よりなる。2倍乗算器600は遅延レジ
スタ525の出力であるd(’IJ−1)を2倍し、2
d(i、j−1)を出力する。加算器601はベクトル
間類似度計算器520の出力d(1、J)と遅延レジス
タ560の出力g(i−Li−1)を加算してg(i−
1,J  1)+d(1,J)を出力し、また、加算器
602は2倍乗算器600の出力2dい+j−1)と遅
延レジスタ565の出力g(i−1,j−2)を加算し
てg (i−1,j−2N−2d (i、j−1)を出
力する。最小値検出器604は、加算器601のg (
i−1,J−1)+d (i、 j lと、加算器60
2のgい−1,」−2)+2d (i、 j−1)と、
さらに汎用レジスタ580のr、(+t、、+)との、
3人力から最小値を検出しで出力する回路である。
この最小値検出器604で得られた最小値とベクトル間
類似兜計算器520で計算されたd(i、i)を加算器
605で加算することにより、g(i、J)が求まる。
第7図はF演算器540の詳細図で゛、ベクトル間類似
度計算器520の出力d(i、J)を2倍乗算器700
(二人力して2d(i、J)を得、該2倍乗算器700
の出力2d(i、j)と遅延レジスタ562の出力g 
(i −1、j −1)を加算器701で加算すること
により、h (i、 J)=g(i−1,J−1)+2
d (i。
J)を求める。
以上説明した如く、本発明によれば、傾斜制限をもっD
Pマツチングにおいて、順化式を分解すること(二より
、記憶しておかなければならない変数の数を大巾(−減
らすことができるので、これを実現する場合(′″−−
必要業用記憶装置を大巾に削減することができろ。
【図面の簡単な説明】
第1図はへカバタンと標準バタンの対応づけを示す図、
第2図は連続DPマツチングのマツチングパスとマツチ
ング範囲を示す図、第3図は傾斜制限を示す図、第4図
は本発明の漸化式を分解したときの計算経路を示す図、
第5図は本発明の一実施例の・・−ドウエア構成図、第
6図は第5図におけるG演算器の詳細図、第7図は第5
図における171演算器の詳細図である。 500・・特徴抽出回路、510・・標準バタン記憶装
置、520・ベクトル間類似度計算器、525・・遅延
レンスタ、530 、540  ・演算器、560 、
565・・遅延レジスタ、570 、580・・汎用レ
ジスタ、590・・・制御部、595・・除算器。 代理人 弁理士 鈴 木   誠 第1図 第3図 ((1)        (b) (Q) ’j(i−t、 I−i) ′+−、ト     も 26区 才5図 5デb

Claims (1)

  1. 【特許請求の範囲】 1、特徴量aliの系列として表現される第1のバタン
    Aと特徴量1+jの系列として表現される第2のパタン
    Bに対して、あらかじめ定められた順序により指定され
    る浅lとljの間の類似度d(i。 J)を距離等の尺度により評価するベクトル間類似度計
    算法が定義されており、このベクトル間類似度d(i、
    j)と、先に計算済みのd(k、1)(i−K(k(i
    、j−L(z<J)と、先に計算済みの積分量g(m、
    n)(i−K<m<i 、j−L<n<j )の荷重和
    を複数個計算し、その最小値(または最大値)を積分量
    g(i、j)として算出し、この積分量を正規化係数で
    除してパタンAとBの時間正規化類似度を得るバタンマ
    ツチング装置において、計算済み積分量g(’−1+ 
    n)(n−1+ 21・・・、N)とg (1,n >
     (j−L(n(j >を1若持する手段と、演算済み
    の類似度d(i −1゜t)(t=1.2.・・・、N
    )とd(i、tlj−L<t<j)を保持する手段と、
    前記保持されている積分量g(i−1,n+とg (’
     +n)と類似度d (i−1,7)、d (i、 t
    )から計算される順化式「] (ll Jl l  f
    2(’。 J)、・・、 fJ (’+ J )について計算済み
    のf] (’  1+ ’J)+  f2(’  1+
     J)、・・。 fhl(l−1,」)を保持する手段と、前記保持され
    ている類似度d (i−1,t)、d(蔦。 t)とrr  (i−1,J  )  (r<h)から
    計算されるfh (! 、  J) (ht +1<1
    1<hk )についてfh (i−1,j ) (hl
    +1<h<:hk )を保持する手段と、新しく算出さ
    れたd(l、J)と各保持手段から読み出されるg(i
    −1,n)(”=i+ 21  ・+ N)、g (i
    t n )<J−L<n<j )、d (i−1,/=
    )(t=1.2゜・・ N)、d (i、 t)(j 
    −L<:t<J )およびfh(1<h(hk)等の加
    重和を複数個計算し、その最小値(または最大値)を積
    分量g(I、J)として算出する手段とを有しているこ
    とを特徴とするバタンマツチング装置。
JP57007081A 1982-01-20 1982-01-20 パタンマツチング装置 Pending JPS58125098A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57007081A JPS58125098A (ja) 1982-01-20 1982-01-20 パタンマツチング装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57007081A JPS58125098A (ja) 1982-01-20 1982-01-20 パタンマツチング装置

Publications (1)

Publication Number Publication Date
JPS58125098A true JPS58125098A (ja) 1983-07-25

Family

ID=11656130

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57007081A Pending JPS58125098A (ja) 1982-01-20 1982-01-20 パタンマツチング装置

Country Status (1)

Country Link
JP (1) JPS58125098A (ja)

Similar Documents

Publication Publication Date Title
CA2190631C (en) Method of training neural networks used for speech recognition
US5903863A (en) Method of partitioning a sequence of data frames
US5073939A (en) Dynamic time warping (DTW) apparatus for use in speech recognition systems
JPH0355869B2 (ja)
JPS6131477B2 (ja)
JPH07334184A (ja) 音響カテゴリ平均値計算装置及び適応化装置
US4882756A (en) Pattern matching system using dynamic programming
JPS58132298A (ja) 窓制限付パタンマツチング装置
JPS5885499A (ja) 連続音声認識装置
JP2980026B2 (ja) 音声認識装置
CA2190619A1 (en) Speech-recognition system utilizing neural networks and method of using same
JPS58125098A (ja) パタンマツチング装置
US6499012B1 (en) Method and apparatus for hierarchical training of speech models for use in speaker verification
CN110287284A (zh) 语义匹配方法、装置及设备
EP1099998A2 (en) Coprocessor for synthesizing signals based upon quadratic polynomial sinusoids
EP1290543A2 (en) Method and apparatus for iterative training of a classification system
JP2964881B2 (ja) 音声認識装置
JPS5855520B2 (ja) レンゾクオンセイニンシキソウチ
CA1270568A (en) Formant pattern matching vocoder
JPH0552517B2 (ja)
JPS59124387A (ja) 連続単語音声認識方法
JPS59200A (ja) パタ−ンマツチング装置
JP3298658B2 (ja) 音声認識方式
Gupta et al. Quantizing mixture-weights in a tied-mixture HMM
JPH0223876B2 (ja)