JPS5811998A - Voice recognizer - Google Patents

Voice recognizer

Info

Publication number
JPS5811998A
JPS5811998A JP10926581A JP10926581A JPS5811998A JP S5811998 A JPS5811998 A JP S5811998A JP 10926581 A JP10926581 A JP 10926581A JP 10926581 A JP10926581 A JP 10926581A JP S5811998 A JPS5811998 A JP S5811998A
Authority
JP
Japan
Prior art keywords
data
speech
input
standard pattern
dissimilarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10926581A
Other languages
Japanese (ja)
Other versions
JPS6332400B2 (en
Inventor
能勢 勇
水野 金儀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP10926581A priority Critical patent/JPS5811998A/en
Priority to US06/373,147 priority patent/US4520500A/en
Publication of JPS5811998A publication Critical patent/JPS5811998A/en
Publication of JPS6332400B2 publication Critical patent/JPS6332400B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 本発明は、音声認識装置において、認識率の向上を計る
ことができる重み何升類似度演算に関するものである。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a weighted similarity calculation that can improve the recognition rate in a speech recognition device.

従来の音声認識装置のブロック図を第1図に示す。第1
図において、  11は入力端子、  12は周波数分
析部、  13は音声区間検出部、14は音声区間の始
端検出信号、15は音声区間の終端検出信号、16はス
ペクトル変換部、17は非類似度演算部118は判定部
の如く構成されてhv以下谷部の説明をする。
A block diagram of a conventional speech recognition device is shown in FIG. 1st
In the figure, 11 is an input terminal, 12 is a frequency analysis section, 13 is a voice section detection section, 14 is a voice section start detection signal, 15 is a voice section end detection signal, 16 is a spectrum conversion section, and 17 is a degree of dissimilarity. The calculation unit 118 is configured like a determination unit and explains the valley below hv.

周波数分析部12は第2図に示す如く構成され。The frequency analysis section 12 is constructed as shown in FIG.

入力音声信号21 [前置増幅器22によって増幅され
約200 Hz〜6000 ’Hzの間で中心周波数が
対数で等間隔となるように設定された帯域p波器群23
−1 、23−2 、・・・、 23−?L、全波整流
器群24−1 、24−2、・・・、 24−n及び低
域沖波器群25−1 、25−2 、・・・。
Input audio signal 21 [band p-wave amplifier group 23 which is amplified by a preamplifier 22 and set so that the center frequency is logarithmically evenly spaced between approximately 200 Hz and 6000' Hz.
-1, 23-2,..., 23-? L, full-wave rectifier groups 24-1, 24-2, . . . , 24-n and low-frequency wave rectifier groups 25-1, 25-2, .

25−nによって分析され多重化器26ヲ通してアナロ
グ・ディジタル変換器27によってあらかじめ設定され
た時間間隔(以下サンプル周期と記す)毎に量子化され
、対数変換器28全通して出力端子29に出力される。
25-n, passed through the multiplexer 26, quantized by the analog-to-digital converter 27 at preset time intervals (hereinafter referred to as sample period), and passed through the logarithmic converter 28 to the output terminal 29. Output.

周波数分析部12で分析された結果は音声区間検出部】
3.及びスペクトル変換部16に送られる。
The results analyzed by the frequency analysis section 12 are sent to the voice section detection section]
3. and sent to the spectrum conversion section 16.

音声区間検出部]3は音声区間の始端及び終端を検出し
非類似度演算部に始端検出信号14及び終端検出信号1
5ヲ送るものであり、簡易的な検出法としてはサンプル
周期毎の周波数分析部12からのn個の分析データの平
均値全求めその値があらかじめ設定された閾値を最初に
越えた時点を始点とし、最後に閾値以下になった時点全
終端とする検出法がある。
Speech section detection section] 3 detects the start and end of a speech section and sends a start end detection signal 14 and an end detection signal 1 to the dissimilarity calculation section.
A simple detection method is to calculate the average value of n pieces of analysis data from the frequency analyzer 12 for each sampling period and start from the point in time when the value first exceeds a preset threshold. There is a detection method in which the end point is defined as the end point when the value finally falls below the threshold value.

スペクトル変換部16は1話者による音源特性及びパワ
ーの正規化の方法として、論文”非線形スペクトルマツ
チングによる単語音声認識の一方式″小原他(電子通信
学会技術研究報告PRL 79−46)に発表されたも
のでIず計算方法を説明する。
The spectrum conversion unit 16 was published in the paper "A method of word speech recognition using nonlinear spectral matching" (IEICE technical research report PRL 79-46) as a method for normalizing sound source characteristics and power by one speaker. The calculation method will be explained below.

周波数分析部12で、ある時刻に分析されたn個のデー
タ’fr:x、7(i=I〜n)とすると、スベク(3
) れる。
If n data 'fr: x, 7 (i=I~n) analyzed at a certain time in the frequency analysis unit 12, then
) can be done.

x・−x −(Ai十B)     −−(IJt (1)式に2いてA、Bはそれぞれxi(i=l−n)
の最小2乗近似UNflJの傾き及び切片を意味するも
のでそれぞれ次式によって求められる。
x -
These mean the slope and intercept of the least squares approximation UNflJ, and are determined by the following equations.

i=t xi2は定数となり従って(2)、(3)式の分母も定
数1=1 (4) (4,) 、 +57式から明らかなように入力データ
力1らりA、Hの値を求めることができ、さらに(1)
式によりスペクトル変換データ2Xi(t−1〜tL)
を求めることができる。
i=t xi2 is a constant, so the denominator of equations (2) and (3) is also a constant 1=1 (4) (4,) +57 As is clear from equation can be obtained, and further (1)
Spectral conversion data 2Xi (t-1 to tL) by the formula
can be found.

第3図にスペクトル変換部16のフ゛ロック図を示し以
下図にそって説明する。
FIG. 3 shows a block diagram of the spectrum conversion section 16, and will be explained below with reference to the figure.

入力端子31から入力された入力データzi(i−1〜
n)と、入力データと同期して計算するカウンタ32に
よって発生したiとの積を乗算器33によって求めさら
に加算器34とレジスタ35によりi−x・の埴を累積
させることによりレジスタ′f、た。加算器36 とレ
ジスタ37により同様に。
Input data zi (i-1 to
n) and i generated by the counter 32 which calculates in synchronization with the input data is calculated by the multiplier 33, and the adder 34 and the register 35 accumulate the values of i−x·, thereby register 'f, Ta. Similarly with adder 36 and register 37.

きる。Wear.

次にマルチプレクサ38 、39において、それぞれy
、C,の値を選択することにより乗算器40ではAの値
ヲレジスタ43にセットする。同様にマルチプレクサ3
8.39においてそれぞれCI、C2を選択させ乗算器
40.41及び減算除算器44を使用してその結果すな
わちBの値全レジスタ45にセットする。
Next, in multiplexers 38 and 39, y
, C, the multiplier 40 sets the value of A in the register 43. Similarly multiplexer 3
At step 8.39, CI and C2 are selected respectively, and the result, that is, the value of B, is set in the total register 45 using the multipliers 40 and 41 and the subtraction divider 44.

続いてカウンタ46によりiを発生させ乗算器47によ
f) 、4 e iを求めざらに7Jl]算器48によ
りAi十13’c求めることができる。次に遅延回路4
9により遅延した入カテータxi、l!ニアIl]算器
48で求めたAi十Bの減算全減算器50によって行え
はスペクトル変換データX・が出力端子に出力される。
Subsequently, the counter 46 generates i, the multiplier 47 calculates f), 4 e i, and the multiplier 48 calculates Ai 113'c. Next, delay circuit 4
9 delayed input caterator xi,l! The spectral conversion data X.subtracted by the full subtractor 50 is outputted to the output terminal.

次に、非類似度演算部17の構成を第4図に示し以下図
にそって説明する。第4図において、101は音声区間
の始端検出信号、102は音声区間の終端検出信号、1
03はスペクトル変換部17からの入力データ、  1
04I/′X、入力メモリ制御回路、105は入力メモ
リ、106は標準パターンメモリ制御回路。
Next, the configuration of the dissimilarity calculating section 17 is shown in FIG. 4 and will be described below with reference to the figure. In FIG. 4, 101 is a voice section start detection signal, 102 is a voice section end detection signal, 1
03 is input data from the spectrum conversion unit 17, 1
04I/'X, input memory control circuit; 105, input memory; 106, standard pattern memory control circuit;

107は標準パターンメモIL108は差分絶対値演算
回路、109は加算器、110はレジスタである。
107 is a standard pattern memo IL 108 is an absolute difference calculation circuit, 109 is an adder, and 110 is a register.

音声区間の始端検出信号101が発生してから音声区間
の終端検出信号102が発生する1での間入カテータ1
03は入力メモリ制御回路104により入力メモリ−0
5に格納される。音声区間の入力データ103の格納が
終了すると、入力メモリ−O5とあ(7) らかしめ分析され標準パターンメモリ107に格納され
ている所望の標準パターンとの非類似度の演算を順次行
なう。
Intermediate cutter 1 at 1 where the voice section end detection signal 102 is generated after the voice section start detection signal 101 is generated.
03 is input memory -0 by the input memory control circuit 104.
It is stored in 5. When the storage of the input data 103 of the voice section is completed, the degree of dissimilarity with the desired standard pattern that has been subjected to calibration analysis and stored in the standard pattern memory 107 is sequentially calculated in the input memory O5 (7).

非類似度の演算方法では動的計画法を用いて入力データ
と標準パターンとを非線形に対応させる方法が一般的に
用いられているが、説明の簡略化の為、以下線形対応を
用いた方法で説明する。しかしながら本発明は非線形対
応に対しても適用できる事は明らかである。
A commonly used method for calculating dissimilarity is to use dynamic programming to make nonlinear correspondences between input data and standard patterns, but for the sake of simplicity, we will use a method using linear correspondence below. I will explain. However, it is clear that the present invention can also be applied to nonlinear correspondences.

入力メモリ制御回路104及び標準パターンメモリ制御
部1()6を介して入力データ及び標準パターンそれぞ
れの対応する要素を読出し、差分絶対値回路108によ
って両者の差分の絶対値の演X+行い、さらにその結果
とレジスタ110との加算を加算器110で行い加算結
果を再びレジスタ110に入れる。
The corresponding elements of the input data and the standard pattern are read out via the input memory control circuit 104 and the standard pattern memory control unit 1()6, and the absolute value of the difference between the two is calculated by the absolute difference circuit 108. Addition of the result and register 110 is performed by adder 110, and the addition result is input into register 110 again.

この演算を対応する要素すべてについて繰υ返丁ことに
より入力データとある標準パターンとの非類似度の演算
ができる。このようにして、標準パターンメモリ107
に格納されている全て又は−(8) 部の標準パターンとの非類似度の演算を行う。
By repeating this calculation for all corresponding elements, it is possible to calculate the degree of dissimilarity between the input data and a certain standard pattern. In this way, standard pattern memory 107
The degree of dissimilarity between all or -(8) parts stored in the standard pattern is calculated.

但シ、レジスタll0U、ある標準パターンとの非類似
度演算を始める時の初期値はOとしておく必要がある。
However, it is necessary to set the initial value of the register ll0U to O when starting the dissimilarity calculation with a certain standard pattern.

即ち、ある認識語の標準パターンPと入力データQとの
非類似度演算に2いて両者の対応する要素があらかじめ
正規化されているものとして(6)式(6)式にてiは
対応する要素に付された番号でありlu標標準パターン
上入力データQとの音声区間長の正規化後の時系列に付
された番号である。
That is, in the dissimilarity calculation between the standard pattern P of a certain recognition word and the input data Q, assuming that the corresponding elements of both have been normalized in advance, i corresponds in equation (6). This is a number assigned to an element, and is a number assigned to a time series after normalization of the voice interval length with respect to the input data Q on the lu standard pattern.

判定部18では非類似度演算部17の結果によp最も非
類似度の低かった。すなわち類似度の最も高かった標準
パターンと同じ音声が入力されたものと判断して、結果
を出力する。
In the determination unit 18, the result of the dissimilarity calculation unit 17 was that p had the lowest dissimilarity. In other words, it is determined that the same voice as the standard pattern with the highest degree of similarity has been input, and the result is output.

しかしながら、上記従来の技術では、音声は話者による
変化はもちろんのこと同一話者においても発声毎に変化
するため1分析結果の似ている語間の誤認識が生ずると
いう欠点があった。
However, the above-mentioned conventional technology has the disadvantage that speech changes not only depending on the speaker, but also from one utterance to another even by the same speaker, resulting in erroneous recognition between words that have similar results in one analysis.

従って本発明は従来の技術の上記欠点を改善するもので
、その目的は音声認識装置の認識率を向上させることに
あり、標準パターンメモリに重み領域データを付加し、
さらに、非類似度演算部における重みの大きさを、入カ
バターンと標準パターンの符号を含めたレベルの相互関
係によって判断する機能全付加したものである。
Therefore, the present invention aims to improve the above-mentioned drawbacks of the prior art, and its purpose is to improve the recognition rate of a speech recognition device, by adding weight area data to a standard pattern memory,
Furthermore, a complete function is added to determine the magnitude of the weight in the dissimilarity calculating section based on the correlation between the levels including the sign of the input pattern and the standard pattern.

すなわち、短時間スペクトルを目視した場合は明らかに
異なるパターンであると認識できるものであっても、全
体の卵類0!度としては小さな値になり、誤認識される
ことがある。
In other words, even if the spectra can be clearly recognized as different patterns when visually observing the spectrum for a short period of time, the total number of eggs is 0! This value may be small and may be misrecognized.

このように、一定の非類似度の演算のみでは類似してし
1う小数の音声を識別するための一つM力な手法は、ス
ペクトル変換データを要素とする標準パターンの特定領
域に非類似度を増す方向の重みをつけることである。
In this way, one powerful method for identifying a small number of voices that are similar only by calculating a certain degree of dissimilarity is to identify dissimilarities in a specific region of a standard pattern using spectral transformation data as an element. It is to add weight in the direction of increasing degree.

本発明は、このような重みうけによる非類似度の演算を
、短時間スペクトルにpける山や谷の位置を考慮して行
わせるものであり、特に短時間スベクトルにおける山や
谷が、スペクトル変換データにおける1負の符号及びデ
ータの絶対値の太きさとして現われるの全利用するもの
である。
The present invention calculates the degree of dissimilarity by weighting in consideration of the positions of peaks and valleys in the short-time spectrum. In particular, the peaks and valleys in the short-time vector are It makes full use of the 1 negative sign in the converted data and the thickness of the absolute value of the data.

第5図は本発明の笑怖例のブロック図であり。FIG. 5 is a block diagram of an example of the present invention.

11は入力端子、12は周波数分析部、13は音声区間
検出部、  14は音声区間の始端検出信号、15は音
声区間の終端検出信号、]6はスペクトル変換部、55
は重み何升類似度演算部、  18は判定部の如く構成
されている。重み何升類似屁演算部55以外は第1図の
構成と同じであるので、以下重み何升類似肝演算部55
について第6図によって詳細に説明する。
11 is an input terminal, 12 is a frequency analysis section, 13 is a voice section detection section, 14 is a voice section start detection signal, 15 is a voice section end detection signal,] 6 is a spectrum conversion section, 55
18 is constructed as a weight similarity calculation section, and a determination section 18. Since the configuration is the same as that shown in FIG. 1 except for the weight similar fart calculation unit 55, the following weight calculation unit 55 is the same as the configuration shown in FIG.
This will be explained in detail with reference to FIG.

第6図において■旧は音声区間の始端検出信号。In Fig. 6, ■Old indicates the start end detection signal of the voice section.

】02は音声区間の終端検出信号、103はスペクトル
変換部16からの入力データ、  104U人カメモリ
制御回路、105は入力メモ1,1,108は差分絶対
値演算回路、203は標準パターンメモリ制御回路。
02 is a voice section end detection signal, 103 is input data from the spectrum converter 16, 104 is a human memory control circuit, 105 is an input memo 1, 1, and 108 is a difference absolute value calculation circuit, and 203 is a standard pattern memory control circuit. .

204は標準パターンメモ!J、201i11人カメモ
リの出力信号線、205は標準パターンメモリのパター
ンデータに関する出力信号線、207は標準パターンメ
モリの重み計算指定に関する出力信号線。
204 is a standard pattern memo! 201i is an output signal line of the 11-person memory, 205 is an output signal line related to pattern data of the standard pattern memory, and 207 is an output signal line related to weight calculation designation of the standard pattern memory.

208 、209はレベル変換回路、  2]0,2]
]はレベル変換回路208 、209の出力信号線、2
12はテーブルメモリ、213は乗算器、109は刀0
算器、J10はレジスタの如く構成されている。
208 and 209 are level conversion circuits, 2]0,2]
] are the output signal lines of the level conversion circuits 208 and 209, 2
12 is table memory, 213 is multiplier, 109 is sword 0
The calculator J10 is configured like a register.

音声区間の始端検出信号101が発生してから音声区間
の終端検出信号102が発生する互での間入カテータ1
03は入力メモリ制御回路104により人力メモリ10
5に格納される。
An intermediate cutter 1 in which a voice section start detection signal 101 is generated and a voice section end detection signal 102 is generated.
03 is the manual memory 10 by the input memory control circuit 104.
It is stored in 5.

入力データ103の格納が終了すると、入力メモリ10
5とあらかじめ分析され標準パターンメモリ2(J4に
格納されている碑準パターンとの重み何升類似度の演算
を順次行う。
When the input data 103 has been stored, the input memory 10
5 and the standard pattern previously analyzed and stored in the standard pattern memory 2 (J4).

重み何升類似度演算に2いては、標準パターンは、(J
)式で示されるスペクトル変換データZZ と重み演算
部ケ示す重み指定データPi との時系列で記述されて
いて、−万人カテータは(1)式で示されるスペクトル
変換データ(以下標準パターンとの区別の為Ziで記述
する)のみであジ、各々のスペクトル変換データは差分
絶対値演算回路108(11) の入力部とレベル変換器W5209 、208の入力部
へ出力信号線205 、2旧を介して出力されると同時
に重み指定データがテーブルメモリのアドレス入力線の
一部207を介して出力される。
If the weight is 2 for the similarity calculation, the standard pattern is (J
) The spectral conversion data ZZ shown by the equation (1) and the weight designation data Pi shown by the weight calculation section are described in time series. Each spectrum conversion data is connected to the input part of the absolute difference calculation circuit 108 (11) and the input part of the level converter W5209 (W5209, 208) through the output signal line 205 (2). At the same time, weight designation data is output via a portion 207 of the address input line of the table memory.

レベル変換回路208 、209は対数変換器27の出
力データのビット数が大きい為(8ビツト以上)。
The level conversion circuits 208 and 209 are used because the number of bits of the output data of the logarithmic converter 27 is large (8 bits or more).

ビット低減全行いテーブルメモリ212の容量が大きく
ならない様にしている。通常レベル変換回路208 、
209の出力ビツト数は2〜4ビット程度で変換される
。例えば2ビツトの場合入力データを9となる。
The capacity of the bit reduction all-do table memory 212 is prevented from increasing. Normal level conversion circuit 208,
The number of output bits of 209 is converted to about 2 to 4 bits. For example, in the case of 2 bits, the input data is 9.

レベル変換回路208 、209の変換出力に信号線(
12) 2]、0 、2]1 ’e介してテーブルメモリ212
のアドレス入力の一部となっている。テーブルメモリ2
12には重みが格納されていて1重み指定Pi二〇の場
合は無条件に重みWi−1が出力されるが、Pi=1の
場合は変換量ブ月直の組み合わせで重みが変化する。
The signal line (
12) 2], 0, 2] 1 'e via table memory 212
is part of the address input. table memory 2
12 stores weights, and when 1 weight designation Pi20, the weight Wi-1 is output unconditionally, but when Pi=1, the weight changes depending on the combination of conversion amounts and months.

前記2ピツトの場合の例を示す。入力データの変換出力
′fr:Xi、標準パターンデータの変換出力kYiと
すると1次のようになる。
An example of the above-mentioned 2-pit case will be shown. If the conversion output of input data 'fr:Xi and the conversion output of standard pattern data kYi are expressed as follows.

但し H’1< W2< Ws 通常WI = 4 、 W2” 2 、 Ws = 1
程度の値をもつ0差分絶対値演算回路108では17)
式の演lI1.を行う。
However, H'1<W2< Ws Normal WI = 4, W2" 2, Ws = 1
17) in the zero difference absolute value calculation circuit 108 with a value of
Performance of the ceremony lI1. I do.

d、−1工1−Zil        ・・・・・・(
7)を 重みつき非類似度演算は1重みwi と差分絶対値d・
の時系列W・(ll 、 di(1)に対し2乗算器2
13.加Z             Z 算器1o9.レジスタ]、IOによQ (8)式は(6)式に対して重み何升類似度演算を示し
ており1重み指定は標準パターンにpいて特に強調した
い(他の標準パターンとの区別に有効な)部分に設定さ
れ1重みWiはスペクトル変換データの極性の違いが強
調されるようにつけられている。
d, -1technique 1-Zil ・・・・・・(
7), the weighted dissimilarity calculation uses 1 weight wi and the absolute difference value d・
2 multiplier 2 for the time series W・(ll, di(1))
13. Addition Z Z calculator 1o9. Register], IO Q Equation (8) shows the weight similarity calculation for Equation (6), and the 1 weight specification is particularly important for the standard pattern (to distinguish it from other standard patterns). A weight Wi of 1 is set to the effective) portion so that the difference in polarity of the spectrum conversion data is emphasized.

なお識別ハ(8)式の非類似全全ての標準パターンに対
して求め、最小値を示す認識語を出力する。
It should be noted that the identification word is determined for all dissimilar standard patterns of formula (8) and outputs the recognition word that shows the minimum value.

以上説明したように標準パターンに重み領域を設定しそ
の領域内でスペクトル概形の山と谷の部分がマツチング
されると重みが大きくなる様に設定されているので、安
定な重み演算ができ誤認識を起し易い語の標準パターン
に特有な領域部に重みを付けることにより1発声毎に変
化する差計よび話者による差の影響を重み付によってさ
ほど増大させることなく誤認識を起し易い語の標準パタ
ーンとの非類似度を増大させることができるという利点
がある。
As explained above, a weight region is set in the standard pattern, and the weight is set so that when the peaks and valleys of the spectrum outline are matched within that region, the weight becomes larger. By weighting areas specific to the standard pattern of words that are likely to cause recognition, it is possible to easily cause misrecognition without significantly increasing the effects of differences between speakers and differences that change with each utterance. This has the advantage that the degree of dissimilarity with the standard pattern of words can be increased.

本発明に重みつき非類似度演算全極性の差、データ値等
を考慮して行っているので安定かつ有効な類似屁演算が
できる利点があり、不特定話者等のバラツキの多い音声
データを取り扱う音声認識装置に利用することができる
Since the weighted dissimilarity calculation is performed in consideration of all polarity differences, data values, etc., the present invention has the advantage of being able to perform stable and effective similarity fart calculations, and can handle widely varying speech data such as from unspecified speakers. It can be used for voice recognition devices that we handle.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は従来の音声認識装置の構成ブロック図。 第2図は第1図に2ける周波数分析部の詳細ブロック図
、第3図は第1図におけるスペクトル変換部の詳細ブロ
ック図、第4図は第1図における非類似度演算部の詳細
ブロック図、第5図は本発明の構成ブロック図、第6図
は本発明の重み付非類似度演算部の詳細ブロック図であ
る。 11・・・入力端子、12・・・周波数分析部、13・
・・音声区間検出部、14・・・始端検出信号、15・
・・終端検出信号。 16・・・スペクトル変換部、17・・・非類似度演算
、18・・・判定部、 21・・・入力音声信号、22
・・・前置増幅器。 2L1+ 23−2i・・23−n・・・帯域F波器群
、24−1゜24−2.・・・24−n・・・全波整流
器群、  25−1.25−2.・・・25−n・・・
低域F波器群、26・・・多重化器、27川アナログテ
イジタル変換器、28・・・対数変換器、29・・出力
端子、31・・・入力端子、  32.46・・・カウ
ンタ、33゜42.44.47・・・乗算器、  34
,36.48・・劾l算器、35゜37.43.45・
・・レジスタ、  38.39・・・マルチプレクサ。 42 、43・・・減算除算器、49・・・遅延回路、
50・・・減算。 51・・・出力端子、55・・・重み付非類似度演算部
。 101・・・始端検出信号、102・・・終端検出信号
、103・・・入カテータ、104・・・入力メモリ制
御N路、】05・・・入力メモリ、106・・・標準パ
ターンメモリ制御回路、107・・・標準パターンメモ
リ、108・・・差分絶対値演算回路、109・・・7
JI]算器、110・・・レジスタ。 203・・・標準パターンメモリ制御回路、204・・
・標準パターンメモリ、201・・・入力メモリ出力信
号線。 205・・・標準パターンデータ出力信号線、207・
・・重み指定データ出力信号線、  208,209・
・・レベル変換回路、  210,211・・・変換出
力信号線、212・・・テーブルメモIJ、213・・
・乗算器。 特許出願人 沖電気工業株式会社 特許出願代理人 弁理士  山 本 恵 − 手続補正書(自発) 昭和57年2月ンタ日 特許庁長官  島 1)春 樹 殿 1、事件の表示 昭和56年 特 許願第109265号2、発明の名称 音声認識装置 3、補正をする者 事件との関係 特許出願人 名 称  (029)沖電気工業株式会社明細書の発明
の詳細な説明の欄 [又(最小値は負数でMIN又最大値は正数でMAXと
すると、M I Nりyi<;:MAX )とすると変
換出力は次表のとおりとなる。 レベル変換回路208,209の変換出力は信号線」以
FIG. 1 is a block diagram of a conventional speech recognition device. Fig. 2 is a detailed block diagram of the frequency analysis section 2 in Fig. 1, Fig. 3 is a detailed block diagram of the spectrum conversion section in Fig. 1, and Fig. 4 is a detailed block diagram of the dissimilarity calculation section in Fig. 1. 5 is a block diagram of the configuration of the present invention, and FIG. 6 is a detailed block diagram of the weighted dissimilarity calculating section of the present invention. 11... Input terminal, 12... Frequency analysis section, 13.
...Voice section detection unit, 14...Start detection signal, 15.
...Termination detection signal. 16... Spectrum conversion unit, 17... Dissimilarity calculation, 18... Judgment unit, 21... Input audio signal, 22
...Preamplifier. 2L1+ 23-2i...23-n...Band F wave device group, 24-1°24-2. ...24-n...Full wave rectifier group, 25-1.25-2. ...25-n...
Low-frequency F wave device group, 26... Multiplexer, 27 Analog digital converter, 28... Logarithmic converter, 29... Output terminal, 31... Input terminal, 32.46... Counter, 33°42.44.47... Multiplier, 34
, 36.48...Gai l calculator, 35°37.43.45.
...Register, 38.39...Multiplexer. 42, 43... Subtraction divider, 49... Delay circuit,
50...subtraction. 51... Output terminal, 55... Weighted dissimilarity calculation unit. 101... Start end detection signal, 102... End detection signal, 103... Input cutter, 104... Input memory control N path, ]05... Input memory, 106... Standard pattern memory control circuit , 107...Standard pattern memory, 108...Difference absolute value calculation circuit, 109...7
JI] calculator, 110... register. 203...Standard pattern memory control circuit, 204...
- Standard pattern memory, 201... Input memory output signal line. 205...Standard pattern data output signal line, 207...
・Weight designation data output signal line, 208, 209・
... Level conversion circuit, 210, 211 ... Conversion output signal line, 212 ... Table memo IJ, 213 ...
- Multiplier. Patent Applicant Oki Electric Industry Co., Ltd. Patent Application Agent Megumi Yamamoto - Procedural Amendment (Spontaneous) February 1981 Commissioner of the Japan Patent Office Shima 1) Haruki Tono1, Indication of Case 1988 Patent Application No. 109265 2, Name of the invention Speech recognition device 3, Relationship with the case of the person making the amendment Patent applicant name (029) Detailed description of the invention in the Oki Electric Industry Co., Ltd. specification [Also, the minimum value is a negative number If the MIN or maximum value is a positive number and MAX, then if MIN = yi<;:MAX), the conversion output will be as shown in the following table. The conversion output of the level conversion circuits 208 and 209 is above the signal line.

Claims (2)

【特許請求の範囲】[Claims] (1)入力音声を周波数分析する手段と、その出力に接
続される音声区間検出手段及びスペクトル変換手段と、
スペクトル変換手段の出力に接続され音声区間検出手段
によシ与えられる音声の始端と終端の間で入力音声を標
準パターンと比較して非類似度を演算する非類似度演算
手段と、その出力に接続されて音声全認識する判定手段
とを有する音声認識装置に2いて、あらかじめ設定され
た重み領域における非類似度演算に重み領域を解釈し、
かつデータの性質により重みの大きさを判断して非類似
度の演算を行うことを特徴とする音声g識装置。
(1) A means for frequency analyzing input speech, a speech section detection means and a spectrum conversion means connected to the output thereof,
a dissimilarity calculating means connected to the output of the spectrum converting means and calculating a degree of dissimilarity by comparing the input speech with a standard pattern between the start and end of the speech given by the speech section detecting means; 2, the speech recognition device is connected to a speech recognition device having a determination means for recognizing all speech;
A speech g recognition device characterized in that the magnitude of the weight is determined according to the nature of the data and the degree of dissimilarity is calculated.
(2)重みの大きさを入力データと標準パターンデータ
の2種のデータの符号の一致、不一致及びデータの絶対
値の大きさによって判断する特許請求の範囲第1項記載
の音声認識装置。
(2) The speech recognition device according to claim 1, wherein the magnitude of the weight is determined based on the coincidence or mismatch of signs of two types of data, input data and standard pattern data, and the magnitude of the absolute value of the data.
JP10926581A 1981-05-07 1981-07-15 Voice recognizer Granted JPS5811998A (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP10926581A JPS5811998A (en) 1981-07-15 1981-07-15 Voice recognizer
US06/373,147 US4520500A (en) 1981-05-07 1982-04-29 Speech recognition system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10926581A JPS5811998A (en) 1981-07-15 1981-07-15 Voice recognizer

Publications (2)

Publication Number Publication Date
JPS5811998A true JPS5811998A (en) 1983-01-22
JPS6332400B2 JPS6332400B2 (en) 1988-06-29

Family

ID=14505781

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10926581A Granted JPS5811998A (en) 1981-05-07 1981-07-15 Voice recognizer

Country Status (1)

Country Link
JP (1) JPS5811998A (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5525091A (en) * 1978-08-14 1980-02-22 Nippon Electric Co Voice characteristic pattern comparator

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5525091A (en) * 1978-08-14 1980-02-22 Nippon Electric Co Voice characteristic pattern comparator

Also Published As

Publication number Publication date
JPS6332400B2 (en) 1988-06-29

Similar Documents

Publication Publication Date Title
US7711123B2 (en) Segmenting audio signals into auditory events
EP1393300B1 (en) Segmenting audio signals into auditory events
JPS5844500A (en) Voice recognition system
JPS5811998A (en) Voice recognizer
US5425127A (en) Speech recognition method
JP2992324B2 (en) Voice section detection method
JPH0556520B2 (en)
JPS61230199A (en) Voice recognition
JPH0738114B2 (en) Formant type pattern matching vocoder
JPS63213899A (en) Speaker collation system
JP3298658B2 (en) Voice recognition method
JPS6126680B2 (en)
JPH0451840B2 (en)
JPS60254100A (en) Voice recognition system
JPS58136097A (en) Recognition pattern collation system
JPH0426480B2 (en)
JPS62116997A (en) Word voice recognition equipment
JPS6258515B2 (en)
JPS6054000A (en) Sound/soundless discrimination of voice
JPH0546558B2 (en)
JPS5837695A (en) Voice recognition unit
JPS6157995A (en) Voice recognition equipment
JPH0316038B2 (en)
Chaudhuri et al. Automatic Recognition of Isolated Spoken Words with New Features
JPS625299A (en) Voice recognition equipment