JPH0465393B2 - - Google Patents

Info

Publication number
JPH0465393B2
JPH0465393B2 JP62061732A JP6173287A JPH0465393B2 JP H0465393 B2 JPH0465393 B2 JP H0465393B2 JP 62061732 A JP62061732 A JP 62061732A JP 6173287 A JP6173287 A JP 6173287A JP H0465393 B2 JPH0465393 B2 JP H0465393B2
Authority
JP
Japan
Prior art keywords
time
pattern
equation
word
distance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP62061732A
Other languages
Japanese (ja)
Other versions
JPS63226693A (en
Inventor
Hiroaki Sekoe
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP62061732A priority Critical patent/JPS63226693A/en
Publication of JPS63226693A publication Critical patent/JPS63226693A/en
Publication of JPH0465393B2 publication Critical patent/JPH0465393B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Image Processing (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は人間が発声した音声を自動認識する音
声認識におけるパターンマツチング方式に関する
ものである。
DETAILED DESCRIPTION OF THE INVENTION (Field of Industrial Application) The present invention relates to a pattern matching method in speech recognition for automatically recognizing speech uttered by a human.

(従来の技術) 音声認識のパターンマツチング方式に関しては
種々の技術が開発されているが、それらの中で最
も確立され重用されているものの一つとして「日
本音響学会誌第42巻9号(昭和61年9月発行)の
第725頁」に記載されるがごときDPマツチング法
がある。これは音声の時間軸歪を整合する手法と
して極めて有効とされている。またDPマツチン
グ法を連続単語認識に拡張したものとして、特願
昭56−199098号明細書に記載されるか如きクロツ
クワイズDP法が知られている。この手法は構文
制御を有する連続単語認識法として説明されてい
るが、当然離散単語認識にも適用可能である。こ
こでは説明を簡単にするため、離散単語認識の形
成で、クロツクワイズDP法の要部を説明する。
(Prior art) Various technologies have been developed regarding pattern matching methods for speech recognition, but one of the most established and heavily used among them is the one described in ``Journal of the Acoustical Society of Japan, Vol. 42, No. 9''. There is a DP matching method such as that described in "Page 725 of ``Published September 1986.'' This is considered to be extremely effective as a method for matching time axis distortion of audio. Furthermore, as an extension of the DP matching method to continuous word recognition, the clockwise DP method as described in Japanese Patent Application No. 199098/1982 is known. Although this method has been described as a continuous word recognition method with syntactic control, it is of course also applicable to discrete word recognition. To simplify the explanation, here, we will explain the main parts of the Clockwise DP method using the formation of discrete word recognition.

単語名を番号nで指定することとして {n|n=1、2、…N} なる単語セツトを認識対象とする。各単語に標準
パターン Bn=〓n 1、…〓n 2、…〓n j…〓n Jn と考える。ここにjは時刻を示し、〓n jは標準パ
ターンBnの時刻jの特徴を意味する。入力音声
パターンを同様に A=a1a2…ai…aI と示す。
Assuming that word names are designated by numbers n, a set of words {n|n=1, 2, . . . N} is to be recognized. Consider standard patterns B n =〓 n 1 , ...〓 n 2 , ...〓 n j ...〓 n J n for each word. Here, j indicates time, and 〓 n j means the characteristic of standard pattern B n at time j. The input voice pattern is similarly expressed as A=a 1 a 2 ...a i ...a I.

音声認識は、入力パターンAと標準パターン
Bnとのパターン間距離D(A、Bn)を求め、それ
が最小となるnを定めて認識結果とすることによ
つて行なわれる。DPマツチングではこの距離の
計算を次のような漸化式計算によつて行なう。
Speech recognition uses input pattern A and standard pattern
This is done by finding the inter-pattern distance D (A, B n ) with respect to B n , determining the minimum n, and using this as the recognition result. In DP matching, this distance is calculated using the following recurrence formula calculation.

Γ初期条件 gn(1、1)=dn(1、1) ……(1) Γ漸化式 gn(i、j)=dn(i、j)+mingn(i−j
、j) gn(i−1、j−1) gn(i−1、j−2)……(2) i=1、2、…I j=1、2、…Jn Γパターン間距離 D(A、Bn)=gn(I、Jn) ……(3) ここにdn(i、j)は特徴aiとbn jの距離dn(i、
j)=‖ai−〓n j‖である。これに対して(2)式で計
算されるgn(i、j)を最適累積距離と呼ぶ。
Γ initial condition g n (1, 1) = d n (1, 1) ...(1) Γ recurrence formula g n (i, j) = d n (i, j) + ming n (i-j
, j) g n (i-1, j-1) g n (i-1, j-2)...(2) i=1, 2,...I j=1, 2,...J n Γ patterns Distance D (A, B n ) = g n (I, J n ) ...(3) Here, d n ( i , j ) is the distance d n (i,
j)=‖ai−〓 n j ‖. On the other hand, g n (i, j) calculated using equation (2) is called the optimal cumulative distance.

このDPマツチング処理は当初、単語ごとに実
行されていたが、クロツクワイズDP法では各単
語に対して並列的に実行する形式に改良された。
Initially, this DP matching process was executed for each word, but in the Crotwise DP method, it has been improved to a format in which it is executed for each word in parallel.

第5図a,bは従来方式を説明する図である。
すなわち、第5図aのような、i,j,nが関係
する空間において、入力パターンの各時刻iにお
いて、各標準パターンBnの指定nとそれらの中
の時刻jのすべての組み合わせで指定されるn,
jに対してgn(i,j)なる最適累積距離を計算
し、しかる後に時刻iを進めて処理を続行すると
いう方式となつている。
FIGS. 5a and 5b are diagrams explaining the conventional method.
That is, in the space where i, j, and n are related, as shown in Figure 5a, at each time i of the input pattern, all combinations of the designation n of each standard pattern B n and the time j therein are specified. n to be done,
The method is to calculate the optimal cumulative distance g n (i, j) for j, and then advance time i and continue processing.

実際の計算は、gn(j)=gn(i、j)、g^n(j)=gn
(i−1、j)なる表示を考え、これらを保持す
るため、第5図aに参照数字1で示す2列のメモ
リを用意する。これらのメモリの間で、第5図b
に示すごとく gn(j)=dn(j)+ming^n(j) g^n(j−1) g^n(j−2) ……(4) なる演算を行なつて、(2)式の漸化式計算を実行す
る。
The actual calculation is g n (j)=g n (i, j), g^ n (j)=g n
Considering the display (i-1, j), two columns of memories indicated by reference numeral 1 in FIG. 5a are prepared in order to hold these. Between these memories, Figure 5b
As shown in the figure, by performing the operation g n (j)=d n (j) + ming^ n (j) g^ n (j−1) g^ n (j−2) ……(4), we obtain (2 ) performs recurrence formula calculation.

ここに、 dn(j)=dn(i、j) ……(5) である。すべてのn,jの組み合せに対して、(4)
式の計算を実行し終了と時刻iを1クロツク進
め、g^n(j)をgn(j)として以上の処理を繰り返す。か
くしてi・Iまでの処理が終了した時点で、パタ
ーン間距離は D(A、Bn)=gn(Jn) として、各nに対して並列的に求まる。クロツク
ワイズDPによる連続単語認識においてもまつた
く同様な処理が行なわれる。
Here, d n (j)=d n (i, j)...(5). For all combinations of n, j, (4)
The calculation of the formula is completed, the time i is advanced by one clock, and the above process is repeated with g^ n (j) set to g n (j). Thus, when the processing up to i and I is completed, the inter-pattern distance is found in parallel for each n as D(A, B n )=g n (J n ). A very similar process is performed in continuous word recognition using Clockwise DP.

(発明が解決しようとする問題点) このような方法は入力パターンの時刻iに同期
して処理を進めることができるので、発声と並行
して処理を進めることができ、実時間性が良いと
されている。しかし、この方法を大語いの音声認
識に適用しようとすると計算量が大となるという
問題がある。すなわち、(4)式の漸化式計算は、j
とnのすべての組み合せについて実行しなくては
ならない。標準パターン長がJn=30で、1000語を
認識しようとすると、3×104点で(4)式を計算す
ることになる。1点あたり10μsで実行したとして
も300msを要する。通常の音声認識では入力パ
ターンの特徴aiをサンプリングする周期は20ms
以下であるので、このような大語いではとても実
時間実行は不可能である。
(Problems to be Solved by the Invention) This method can proceed with processing in synchronization with time i of the input pattern, so it is possible to proceed with processing in parallel with the utterance, and has good real-time performance. has been done. However, when this method is applied to speech recognition of large words, there is a problem in that the amount of calculation becomes large. In other words, the recurrence formula calculation of equation (4) is j
must be executed for all combinations of and n. If the standard pattern length is J n =30 and an attempt is made to recognize 1000 words, equation (4) will be calculated using 3×10 4 points. Even if it is executed at 10 μs per point, it will take 300 ms. In normal speech recognition, the sampling period for input pattern features a i is 20ms.
Since the following is true, real-time execution is impossible with such big words.

本発明はクロツクワイズ型のDPマツチングが
有する、計算量が多いという上記欠点を改良し
て、高速でありながら低価格な音声認識装置のパ
ターンマツチング方式を提供することを目的とし
たものである。
An object of the present invention is to improve the above-mentioned disadvantage of the large amount of calculation that the clockwise type DP matching has, and to provide a pattern matching method for a speech recognition device that is high speed and inexpensive.

(問題点を解決する手段) 本発明による音声認識のパターンマツチング方
式は、各単語nの標準パターンを特徴の時系列
Bn=〓n 1…〓n j…〓n Jnとして記憶する手段と、入
力音声パターンの特徴aiを一時保持する手段と、
それぞれの単語nに対応して前記特徴aiと〓n j
の距離dn(i、j)の最適累積値gn(i、j)を動
的計画法の漸化式によつて算出する手段を有する
方式において、時刻(i、1)までの最適累積値
gn(i−1、j)を各単語n及び時刻jに対応し
てg^n(j)の形で記憶する手段と、時刻iまでの最適
累積値gn(i、j)に対応するgn(j)なる量を記憶
する手段とを備え、時刻iにて、g^n(j)の値が所定
の枝刈り条件を満足する(n、j)のセツトに対
してのみ、g^n(j)に距離dn(j)=dn(i、j)を加算
して新たな数値gとする第1の処理を行ない、こ
のjの近傍のjに対応するgn(j)との大小比較を行
ない、g<gn(j)のときgを新たなgn(j)として転写
する第2の処理を行ない、時刻iが1クロツク進
行するごとにgn(j)を新たなg^n(j)として前記第1、
第2の処理を進行する方式である。
(Means for solving the problem) The pattern matching method for speech recognition according to the present invention uses a standard pattern of each word n as a time series of features.
means for storing as B n =〓 n 1 ...〓 n j ...〓 n J n; means for temporarily holding characteristics a i of the input speech pattern;
For each word n, calculate the optimal cumulative value g n (i, j) of the distance d n (i, j) between the features a i and 〓 n j using the recurrence formula of dynamic programming. In a method having a means to
Means for storing g n (i-1, j) in the form g^ n (j) corresponding to each word n and time j, and corresponding to the optimal cumulative value g n (i, j) up to time i and a means for storing a quantity g n (j), and only for the set (n, j) for which the value of g^ n (j) satisfies a predetermined pruning condition at time i, The first process is to add the distance d n ( j)=d n (i, j) to g^ n (j) to obtain a new value g, and then calculate g n ( j), and when g<g n (j), a second process is performed in which g is transferred as a new g n (j), and each time i advances by one clock, g n (j ) as the new g^ n (j),
This is a method for proceeding with the second process.

(作用) 本発明の第1の特徴はg^n(j)がある基準より小な
n,jのみを対象として(4)式(等価的に(2)式)の
動的計画法漸化式を実行するという枝刈りの考え
方を導入した点である。DPマツチングの動的計
画法漸化式(2)あるいは(4)は最小値を探索する形式
のものであるので、g^n(j)が大であるということ
は、そのjが最適経路上に存在する可能性が低い
ことを意味する。そこで、このようなg^n(j)は無視
しようという考え方を導入したのである。これに
より、(4)式の計算は第1図にハツチを付して示し
たg^n(j)の近辺で行なえばよいことになり大幅な計
算量低減が見込まれる。しかし、(4)式の漸化式を
そのままの形で実行するのは、せつかくの枝刈り
の効果が薄い。なぜならば(2)式の計算が省略でき
るのは、右辺のg^n(j)、g^n(j−1)、g^n(j−2)
が総て大きかつた場合である。このため、3個の
値それぞれの大きさを判定しなくてはならず、か
つ3個とも大きいという条件の論理積が満足され
る確率は小さくなる。
(Operation) The first feature of the present invention is dynamic programming recurrence of equation (4) (equivalently, equation (2)) only for n, j where g^ n (j) is smaller than a certain standard. The point is that it introduces the idea of pruning, which is the execution of formulas. Since the dynamic programming recurrence formula (2) or (4) for DP matching searches for the minimum value, the fact that g^ n (j) is large means that j is on the optimal path. This means that there is a low possibility that it exists. Therefore, we introduced the idea of ignoring such g^ n (j). As a result, the calculation of equation (4) can be performed in the vicinity of g^ n (j) indicated by hatching in FIG. 1, and a significant reduction in the amount of calculation is expected. However, executing the recurrence formula (4) in its original form has little effect on pruning. This is because the calculation of equation (2) can be omitted for g^ n (j), g^ n (j-1), g^ n (j-2) on the right side.
This is the case when all are large and large. Therefore, it is necessary to determine the magnitude of each of the three values, and the probability that the logical product of the condition that all three values are large is satisfied becomes small.

そこで、本発明では(4)式の計算を以下に述べる
ように、前向きの条件付代入処理として実行する
ことを第2の特徴とする。第2図はその処理を説
明するための図である。ここではg^n(j)は g^n(j)=mingn(i−1、j) gn(i−1、j−1) gn(i−1、j−2) ……(6) と定義され、d(i、j)が加算されていない、
1時刻前(i−1)までの累積最適距離に対応し
ている。以下の処理に先立つてgn(j)には充分大き
な数値∞が初期セツトされているとする。特定の
n、jに対する処理は次のようである。
Therefore, the second feature of the present invention is that the calculation of equation (4) is executed as a forward conditional assignment process, as described below. FIG. 2 is a diagram for explaining the processing. Here, g^ n (j) is g^ n (j)=ming n (i-1, j) g n (i-1, j-1) g n (i-1, j-2) ……( 6) is defined as d(i, j) is not added,
This corresponds to the cumulative optimal distance up to one time before (i-1). It is assumed that g n (j) is initially set to a sufficiently large value ∞ prior to the following processing. The processing for specific n and j is as follows.

(1) if g^n(j)≧θ(i)、go to(4) (2) g^n+dn(j)→g (3−1)if g<gn(j)、g→gn(j) (3−2)if g<gn(j+1)、g→gn(j+1) (3−3)if g<gn(j+2)、g→gn(j+2) (4) j+1→j ……(7) この手続きが(j−2)からjまで繰り返され
るとgn(j)に対して次の処理が行なわれたことにな
る。
(1) if g^ n (j)≧θ(i), go to(4) (2) g^ n +d n (j)→g (3-1) if g<g n (j), g→ g n (j) (3-2) if g<g n (j+1), g→g n (j+1) (3-3) if g<g n (j+2), g→g n (j+2) (4) j+1→j...(7) When this procedure is repeated from (j-2) to j, the following processing has been performed on g n (j).

(j−2)において (j−2)において min(g^n(j−2)+dn(j−2)、gn(j)(=∞)→g
n(j) (j−1)において min′(g^n(j−1)+dn(j−1)、gn(j)→gn(j) jにおいて min(g^n(j)+dn(j)、gn(j)→gn(j) ……(8) g^n(j−2)+dn(j−2)=gn(i、j−2) g^n(j−1)+dn(j−1)=gn(i、j−1) g^n(j)+dn(j)=gn(i、j) であることを考慮して(8)式を総合すると gn(j)=mingn(i、j) gn(i、j−1) gn(i、j−2) ……(9) と、(6)式のiが1クロツク進んだものが計算され
たことになる。このことをまとめると、(7)式の条
件付代入処理によつて g^n(j)=dn(j)+migg^n(j) g^n(j−1) g^n(j−2) ……(10) なる漸化式計算が達成できたことになるが、この
g^n(j)は(6)の定義より、gn(i、j)と gn(i、j)=dn(j)+g^n(j) なる関係で結ばれているので、g^n(j)を求める(7)式
の処理はgn(i、j)を求める(2)式の計算と等価
なことになる。
At (j-2), at (j-2), min(g^ n (j-2) + d n (j-2), g n (j) (=∞) → g
min '(g^ n (j-1) + d n (j-1) at n (j) (j-1), g n (j)→g n (j) min(g^ n (j) +d n (j), g n (j) → g n (j) ...(8) g^ n (j-2) + d n (j-2) = g n (i, j-2) g^ n Considering that (j-1)+d n (j-1)=g n (i, j-1) g^ n (j)+d n (j)=g n (i, j), (8 ), g n (j) = ming n (i, j) g n (i, j-1) g n (i, j-2) ...(9), and i in equation (6) This means that the value advanced by one clock is calculated.To summarize this, by the conditional substitution process of equation (7), g^ n (j) = d n (j) + migg^ n (j) g ^ n (j−1) g^ n (j−2) ……(10) This means that we have achieved the recursion equation calculation, but this
From the definition of (6), g^ n (j) is connected to g n (i, j) by the relationship g n (i, j) = d n (j) + g^ n (j), so The processing of equation (7) to obtain g^ n (j) is equivalent to the calculation of equation (2) to obtain g n (i, j).

このように、動的計画法の計算を前向きに実行
すると枝刈りに関して次のような高能率化が達成
される。枝刈りの判定は(7)式(1)のg^n(j)のみのテス
トで実行されるので効率がよい。これによつて枝
刈りと判定された場合には(2)、(3−1)、(3−
2)、(3−3)という漸化式計算に必要な処理が
総べて省略できる。
In this way, when dynamic programming calculations are performed forward, the following high efficiency of pruning can be achieved. The pruning decision is efficient because it is executed by testing only g^ n (j) in equation (7) and (1). If pruning is determined by this, (2), (3-1), (3-
2) and (3-3) necessary for calculating the recurrence formula can all be omitted.

以上の第1と第2の特徴によつて本発明による
パターンマツチング方式は極めて効率良いものと
なる。
The above first and second features make the pattern matching method according to the present invention extremely efficient.

本発明は(7)式の手続きを各時刻iで各単語n中
のj=1、2、…Jnまでそれぞれ実行し、時刻i
のサイクルを進めるという方式である。なお、(7)
式(1)の枝刈りの条件には種々の変形が考えられ
る。最も簡単な1例はiの増加とともに最適累積
距離gn(j)が増加することを考慮し、θ(i)をiの1
次関数(単調増加)として(7)式(1)を適用する方法
である。別にはg^n(j)の最小値gminを定め、これ
にαなる余裕を持たせ、θ(i)=gmin+αとして
(7)式(1)を適用することも考えられる。さらに別の
例としては閾値を用いるのではなく、全g^n(j)の中
で小さいものから何位以下という条件で枝刈りを
行なつてもよい。
The present invention executes the procedure of equation (7) at each time i until j = 1, 2, ...J n in each word n, and
The method is to advance the cycle of Furthermore, (7)
Various modifications can be considered to the pruning conditions in equation (1). The simplest example is to consider that the optimal cumulative distance g n (j) increases as i increases, and set θ(i) to 1 of i.
This is a method of applying equation (7) and (1) as the next function (monotonically increasing). Separately, determine the minimum value gmin of g^ n (j), add a margin of α to this, and set θ(i) = gmin + α.
(7) It is also possible to apply equation (1). As another example, instead of using a threshold value, pruning may be performed based on the condition of the smallest value among all g^ n (j).

(実施例) 第3図は本発明の実施した単語音声認識装置の
ブロツク図である。マイクロホン10より入力さ
れた音声信号は分析部20によつて周波数分析さ
れたのち標本化、デイジタル化され特徴ベクトル
aiとしてマイクロプロセツサ30に送られる。こ
のマイクロプロセツサにはメモリとして標準パタ
ーン記憶部40と、Gメモリ50が接続されてい
る。標準パターン記憶部40には各単語nの標準
パターンBnが特徴ベクトル〓nの時系列として記
憶されている。Gメモリ50は第1図、第2図に
示したg^n(j)gn(j)のためのワークメモリである。こ
れらの標準パターン記憶部40、Gメモリ50は
マイクロプロセツサの主記憶内にあつて区別され
るメモリエリアとして定義されてもよい。
(Embodiment) FIG. 3 is a block diagram of a word speech recognition device according to the present invention. The audio signal input from the microphone 10 is subjected to frequency analysis by the analysis section 20, and then sampled and digitized into a feature vector.
It is sent to the microprocessor 30 as ai . A standard pattern storage section 40 and a G memory 50 are connected to this microprocessor as memories. The standard pattern storage unit 40 stores a standard pattern B n of each word n as a time series of feature vectors 〓 n . The G memory 50 is a work memory for g^ n (j)g n (j) shown in FIGS. 1 and 2. These standard pattern storage section 40 and G memory 50 may be defined as distinct memory areas within the main memory of the microprocessor.

認識処理はマイクロプロセツサ30のプログラ
ムによつて実行される。入力パターンの先頭のベ
クトルa1が入力されると次のような初期設定が各
nに対して行なわれる。
The recognition process is executed by the program of the microprocessor 30. When the first vector a1 of the input pattern is input, the following initial settings are performed for each n.

g^n(1)=dn(1)=‖a1−bn j‖ g^n(j)=∞(2≦j≦Jn) gn(j)=∞(1≦j≦Jn′) ……(11) これは(1)式の初期条件に対応したものである。g^ n (1)=d n (1)=‖a 1 −b n j ‖ g^ n (j)=∞ (2≦j≦J n ) g n (j)=∞ (1≦j≦J n ′) ...(11) This corresponds to the initial condition of equation (1).

以下、入力パターンの特徴ベクトルaiが入力さ
れるごとの第4図のフローチヤートに示すごとく
処理がマイクロプロセツサ30によつて実行され
る。図中の101のブロツクは(7)式の(2)の枝刈り
判定に対応する。同様にして102の2個のブロ
ツクは(1)の処理に、103は(3−1)、(3−
2)、(3−3)の処理にそれぞれ対応する。10
4のブロツクはgn(j)と値をすべてg^n(j)として切り
換えることを意味する。この処理はgn(j)を記憶す
るエリアとg^n(j)を記憶するエリアとの番地切り換
えで実現される。105のブロツクはgn(j)のエリ
アを充分大な数値∞でリセツトすることを意味す
る。
Thereafter, the microprocessor 30 executes processing as shown in the flowchart of FIG. 4 each time the feature vector ai of the input pattern is input. Block 101 in the figure corresponds to the pruning determination in equation (2) of equation (7). Similarly, the two blocks 102 are processed in (1), and the blocks 103 are processed (3-1) and (3-1).
This corresponds to the processes 2) and (3-3), respectively. 10
Block 4 means switching g n (j) and all values as g^ n (j). This process is realized by switching addresses between the area for storing g n (j) and the area for storing g^ n (j). Block 105 means resetting the area of g n (j) to a sufficiently large value ∞.

以上の処理が終了すると、入力パターンの時刻
が1クロツク増加され、次の特徴ベクトルa1の入
力を待つて同様の処理が行なわれる。音声パター
ンが終了して最後の特徴ベクトルaIが入力された
とき、マイクロプロセツサ30の内部では次のよ
うな処理が行なわれる。この時点でGメモリ50
に記憶されている。g^n(Jn)は(6)式より g^n(Jn)=mingn(I−1、Jn) gn(I−1、Jn−1) gn(I−1、Jn−2) ……(12) であることから、 D(A、Bn)=g(I、J)=g^n(Jn)+d(I、J

……(13) として、各単語nごとにパターン間距離D(A、
Bn)を得る。これらを順次比較することによつ
て、最小値を求め、これに対応するn=n^を認識
結果とし出力する。
When the above processing is completed, the time of the input pattern is incremented by one clock, and the same processing is performed after waiting for the input of the next feature vector a1 . When the voice pattern ends and the last feature vector a I is input, the following processing is performed inside the microprocessor 30. At this point G memory 50
is stored in g^ n (J n ) is obtained from equation (6), g^ n (J n ) = ming n (I-1, J n ) g n (I-1, J n -1) g n (I-1, J n −2) ... (12) Therefore, D (A, B n ) = g (I, J) = g^ n (J n ) + d (I, J
)
...(13) Assuming that for each word n, the inter-pattern distance D(A,
B n ) is obtained. By sequentially comparing these values, the minimum value is determined, and the corresponding n=n^ is output as the recognition result.

以上本発明を実施例に基づき説明したがこれら
の記載は本発明の範囲を限定するものではない。
特に以上の記載ではパターン間の類似性を距離に
よつて評価するとしたが、これと大小関係が逆な
量によつてもよい。その場合は(7)式等の大小関係
の判定を逆に行なうことになる。また、本実施例
では特徴ai、bjをベクトルであるとしたが、ベク
トル量子化を行なつた場合のコードブツク中のベ
クトルを指定する番号のようなスカラ量であつて
もよい。また、説明を簡単にするため単語認識装
置に適用した例を述べたが、クロツクワイズDP
式の連続音声認識装置にも本パターンマツチング
方式は利用できることは自明である。
Although the present invention has been described above based on Examples, these descriptions do not limit the scope of the present invention.
In particular, in the above description, the similarity between patterns is evaluated by distance, but it may also be evaluated by a quantity whose magnitude is opposite to this. In that case, the determination of the magnitude relationship, such as in equation (7), will be performed in reverse. Furthermore, although the features a i and b j are vectors in this embodiment, they may be scalar quantities such as numbers that designate vectors in a codebook when vector quantization is performed. In addition, to simplify the explanation, we have given an example of application to a word recognition device, but Kurotswize DP
It is obvious that this pattern matching method can also be used in continuous speech recognition devices of the type.

(発明の効果) 以上述べた枝刈りの効果及び、漸化式計算を前
向きの条件付代入処理によつて実行するという本
発明によつて、DPマツチングの処理量を大幅に
低減し、小型かつ低価格な音声認識装置の実現が
可能となつた。
(Effects of the Invention) The above-mentioned effects of pruning and the present invention, in which recurrence formula calculation is executed by forward conditional assignment processing, greatly reduce the amount of processing for DP matching, making it compact and easy to use. It has become possible to realize a low-cost speech recognition device.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図、第2図は本発明の原理説明図、第3図
は本発明の一実施例を示すブロツク図、第4図は
要部の処理を示すフローチヤート、第5図a,b
は従来技術説明図である。 10……マイクロホン、20……分析部、30
……マイクロプロセツサ、40……標準パターン
記憶部、50……Gメモリー。
Fig. 1 and Fig. 2 are diagrams explaining the principle of the present invention, Fig. 3 is a block diagram showing an embodiment of the invention, Fig. 4 is a flowchart showing the main processing, and Fig. 5 a and b.
is a diagram illustrating the prior art. 10...Microphone, 20...Analysis department, 30
...Microprocessor, 40...Standard pattern storage unit, 50...G memory.

Claims (1)

【特許請求の範囲】[Claims] 1 各単語nの標準パターンを特徴の時系列Bn
=〓n 1…〓n j…〓n Jnとして記憶する手段と、入力
音声パターンの特徴aiを一時保持する手段と、そ
れぞれの単語nに対応して前記特徴aiと〓n jとの
距離dn(i、j)の最適累積値gn(i、j)を動的
計画法の漸化式によつて算出する手段とを有する
音声認識のパターンマツチング方式において、時
刻(i−1)までの最適累積値gn(i、1、j)
を各単語n及各時刻jに対応してg^n(j)の形で記憶
する手段と、時刻iまでの最適累積値gn(i、j)
に対応するgn(j)なる量を記憶する手段とを備え、
時刻iにて、g^n(j)の値が所定の枝刈り条件を満足
する(n、j)のセツトに対してのみg^n(j)にdn(j)
=dn(i、j)を加算して新たな数値gとする第
1の処理を行ない、このjの近傍のjに対応する
gn(j)との大小比較を行ない、g<gn(j)のときgを
新たなgn(j)として転写する第2の処理を行ない、
時刻iが1クロツク進行するごとにgn(j)を新たな
g^n(j)として前記第1、第2の処理を進行すること
を特徴とする音声認識のパターンマツチング方
式。
1 Time series B n featuring the standard pattern of each word n
=〓 n 1 ...〓 n j ...〓 n J n ; means for temporarily holding the feature a i of the input speech pattern; In the pattern matching method of speech recognition, which has means for calculating the optimal cumulative value g n (i, j) of the distance d n (i, j) of the distance d n (i, j) by a recurrence formula of dynamic programming, −1) to the optimal cumulative value g n (i, 1, j)
means for storing g^ n (j) corresponding to each word n and each time j, and an optimal cumulative value g n (i, j) up to time i.
means for storing a quantity g n (j) corresponding to
At time i, set g^ n (j) to d n (j) only for the set of (n, j) for which the value of g^ n (j) satisfies the predetermined pruning condition.
Perform the first process of adding =d n (i, j) to create a new value g, which corresponds to j in the vicinity of this j.
Compare the magnitude with g n (j), and when g < g n (j), perform a second process of transferring g as a new g n (j),
Each time time i advances by one clock, g n (j) is
A pattern matching method for speech recognition, characterized in that the first and second processes are performed as g^ n (j).
JP62061732A 1987-03-16 1987-03-16 Pattern matching system for voice recognition Granted JPS63226693A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62061732A JPS63226693A (en) 1987-03-16 1987-03-16 Pattern matching system for voice recognition

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62061732A JPS63226693A (en) 1987-03-16 1987-03-16 Pattern matching system for voice recognition

Publications (2)

Publication Number Publication Date
JPS63226693A JPS63226693A (en) 1988-09-21
JPH0465393B2 true JPH0465393B2 (en) 1992-10-19

Family

ID=13179671

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62061732A Granted JPS63226693A (en) 1987-03-16 1987-03-16 Pattern matching system for voice recognition

Country Status (1)

Country Link
JP (1) JPS63226693A (en)

Also Published As

Publication number Publication date
JPS63226693A (en) 1988-09-21

Similar Documents

Publication Publication Date Title
US5930753A (en) Combining frequency warping and spectral shaping in HMM based speech recognition
JPH0159600B2 (en)
GB2384901A (en) Speech recognition circuit using parallel processors
EP0049283A1 (en) Continuous speech recognition system.
JPH07146699A (en) Voice recognizing method
US4488243A (en) Dynamic time warping arrangement
JPH096394A (en) Voice recognition device and method therefor
JP2980026B2 (en) Voice recognition device
US5369727A (en) Method of speech recognition with correlation of similarities
JPH05197393A (en) Method and apparatus for recognizing word sequence of audio signal
US5121465A (en) Pattern matching system
CN110648655A (en) Voice recognition method, device, system and storage medium
JPH0465393B2 (en)
JP4275353B2 (en) Speech recognition apparatus and speech recognition method
JP2002123286A (en) Voice recognizing method
JPS6123560B2 (en)
CN115762521A (en) Keyword identification method and related device
JPH0465394B2 (en)
JP3813491B2 (en) Continuous speech recognition apparatus and program thereof
US8099280B2 (en) Speech recognition method and speech recognition apparatus
JPH0887294A (en) Voice recognition device
JP3583299B2 (en) Search device for continuous speech recognition and search method for continuous speech recognition
JPH0465397B2 (en)
JP3352144B2 (en) Voice recognition device
JP2790808B2 (en) Voice recognition device