JPH0259928A - Memory address control circuit for dp operation - Google Patents
Memory address control circuit for dp operationInfo
- Publication number
- JPH0259928A JPH0259928A JP63212720A JP21272088A JPH0259928A JP H0259928 A JPH0259928 A JP H0259928A JP 63212720 A JP63212720 A JP 63212720A JP 21272088 A JP21272088 A JP 21272088A JP H0259928 A JPH0259928 A JP H0259928A
- Authority
- JP
- Japan
- Prior art keywords
- counter
- register
- address
- frame number
- memory
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001228 spectrum Methods 0.000 claims abstract description 5
- 230000003595 spectral effect Effects 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 claims description 14
- 238000013139 quantization Methods 0.000 claims description 8
- 239000011159 matrix material Substances 0.000 description 13
- 238000000034 method Methods 0.000 description 6
- 230000001186 cumulative effect Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 1
Abstract
Description
【発明の詳細な説明】
[産業上の利用分野]
この発明は、ベクトル量子化に基づく単語音声認識にお
いて、ダイナミックプログラミング(以下DPと呼ぶ)
演算を高速に行うためのメモリアドレス制御回路に関す
るものである。[Detailed Description of the Invention] [Industrial Application Field] This invention uses dynamic programming (hereinafter referred to as DP) in word speech recognition based on vector quantization.
The present invention relates to a memory address control circuit for performing calculations at high speed.
「従来の技術J
単語単位の認識方式において、単語辞書の表現にベクト
ル量子化の手法を導入することにより、単語辞書の記憶
量と認識の処理量の削減が可能となる。ベクトル量子化
手法を導入した認識方式では、DP演算に先立ち、ベク
トル量子化手法により予め作成されている数百程度の代
表的なスペクトルパタン(以下擬音素標準バタンと呼ぶ
)と入力音声の各フレームのスペクトルパタンとのスペ
クトル距離を計算し、距離マトリクスを作成する。``Conventional Technology J'' Introducing a vector quantization method to the representation of a word dictionary in a word-by-word recognition method, it is possible to reduce the storage amount of the word dictionary and the amount of recognition processing.Vector quantization method In the introduced recognition method, prior to the DP calculation, the spectral pattern of each frame of the input speech is compared with about several hundred representative spectral patterns (hereinafter referred to as onomatopoeic standard patterns) created in advance using the vector quantization method. Calculate spectral distances and create a distance matrix.
DP演算時には上記距離マトリクスの中からDP演算の
漸化式に従い、必要な距離値を読みだし累積加算を行う
、この時、上記距離マトリクスをランダムにアクセスす
る必要がある。汎用信号処理プロセッサ等で用いられて
いるメモリアドレス制御部では、メモリアクセス用にu
p/downカウンタを持っているだけであり、ランダ
ムアクセスの場合には必要なアドレスを論理演算部で一
度計算した後アドレスカウンタに設定する必要がある。During DP calculation, necessary distance values are read from the distance matrix according to the recurrence formula of DP calculation and cumulative addition is performed. At this time, it is necessary to randomly access the distance matrix. The memory address control unit used in general-purpose signal processing processors etc. uses u for memory access.
It only has a p/down counter, and in the case of random access, it is necessary to calculate the necessary address once in the logical operation unit and then set it in the address counter.
このため、メモリアクセスの頻繁なりP演算ではアドレ
ス生成のオーバヘンドが大きくなり、処理時間の増大を
まねく欠点があった。Therefore, due to frequent memory access, the overhead of address generation becomes large in P operations, resulting in an increase in processing time.
「課題を解決するための手段」
この発明においては、上記問題点を解決しDP演算時の
メモリアクセスを高速に行うことを目的とする。"Means for Solving the Problems" The present invention aims to solve the above-mentioned problems and speed up memory access during DP calculations.
入力音声の時間情報を示すフレーム番号が格納でき、か
つup/downが可能なカウンタと、ベクトル量子化
された擬音素標準パタンの番号を格納するレジスタと、
DP演算に必要な擬音素標準パタンの番号を退避してお
くバッファメモリと、上記カウンタへの入力音声フレー
ム番号の設定及びカウンタのup/down制御、上記
レジスタへの擬音素標準バタン番号の設定、上記バッフ
ァメモリからの擬音素標準バタン番号の読みだしを行う
制御部とを持ち、上記カウンタが距離マトリクスメモリ
の上位側アドレス、上記レジスタが下位側アドレスを示
すように構成し、入力音声のフレーム番号の変更時には
制御部からの信号により、カウンタをup/downL
/、擬音素標準バタン番号の変更時には上記バッファメ
モリに格納されている擬音素標準バタン番号を上記レジ
スタに設定できるようにすることにより、DP演算時の
距離マトリクスメモリアクセスのためのアドレス生成を
高速に行う。a counter that can store a frame number indicating time information of input speech and that can be up/down; a register that stores a vector quantized onomatopoeic standard pattern number;
A buffer memory for saving the number of the onomatopoeic standard pattern necessary for DP calculation, setting the input audio frame number to the counter and controlling up/down of the counter, setting the onomatopoeic standard pattern number to the above register, a control unit that reads out the standard onomatopoeic bang number from the buffer memory, the counter is configured to indicate the upper address of the distance matrix memory, the register indicates the lower address, and the frame number of the input voice When changing, the counter is up/down by a signal from the control section.
/, When changing the onomatopoeic standard baton number, the onomatopoeic standard baton number stored in the buffer memory can be set in the above register, thereby speeding up address generation for distance matrix memory access during DP calculation. to be done.
「実施例J
以下、図面に基づいて説明する。第1図は単語辞書とベ
クトル量子化に基づ(単語音声認識において作成される
距離マトリクスとの関係を示す。Embodiment J A description will be given below based on the drawings. FIG. 1 shows the relationship between a word dictionary and a distance matrix created based on vector quantization (word speech recognition).
第1図の距離マトリクスは各入力音声フレームと全凝音
素標準バタンとのスペクトル距離値が格納される。ここ
でd、″は入力音声フレーム番号iのスペクトルパタン
とn番目の擬音素標準バタンとのスペクトル距離を表す
。擬音素標準バタン数は計算の容易性から2のベキ乗(
256,512,1024等)個が選択される。スペク
トル距離としては、例えばLPCケプストラム距離、ス
ペクトルのピークを重視したWLR距離、WLR距離に
パワー項を付加したPWLR距離等種々の距離尺度が用
いられる。The distance matrix shown in FIG. 1 stores spectral distance values between each input speech frame and all the phoneme standard bangs. Here, d,'' represents the spectral distance between the spectral pattern of the input speech frame number i and the n-th onomatopoeic standard bang.The number of onomatopoeic standard bangs is a power of 2 (
256, 512, 1024, etc.) are selected. Various distance measures are used as the spectral distance, such as LPC cepstral distance, WLR distance that emphasizes the peak of the spectrum, and PWLR distance that adds a power term to the WLR distance.
ある一つの単語辞書のjフレーム目と入力音声iフレー
ム目とのスペクトル距離値d ijは、以下の様にして
距離マトリクスから読み出すことが出来る。The spectral distance value d ij between the j-th frame of one word dictionary and the i-th frame of input audio can be read from the distance matrix as follows.
単語辞書からjフレーム目に格納されている擬音素番号
:n、を読みだす。次に距離値マトリクスから入力音声
フレーム番号iと擬音素番号n。The onomatopoeic phoneme number: n stored in the jth frame is read from the word dictionary. Next, input speech frame number i and onomatopoeic phoneme number n are obtained from the distance value matrix.
で示される距離値d、njを読みだす。上記d 、RJ
が入力音声iフレーム目と単語辞書」フレーム目とのス
ペクトル距離dijとなる。Read out the distance values d and nj indicated by . d above, RJ
is the spectral distance dij between the i-th frame of the input audio and the word dictionary frame.
次にDP演算に関して漸化式(1)を用いて説明する。Next, the DP calculation will be explained using recurrence formula (1).
漸化式(])を用いても、以降に述べるこの本発明の特
徴に関して一般性を失うものではない。(1)式におけ
るDP64算の概念を第2図に示す。The use of the recurrence formula ( ) does not result in any loss of generality with respect to the features of the invention described below. The concept of DP64 calculation in equation (1) is shown in FIG.
・・・・・・(1)
但しG(k);累積距離値
G + 、前の累積距離値
d ij :入力音声iフレームと単語辞書jフレー
ム(擬音素番号nj)とのスペ
クトル距離値
漸化式(1)より一累積点の計算には、距離値データd
i−L J−2、di−1+j−1、d i+j−1
、ト1.4、d ijが必要となる。・・・・・・(1) However, G(k): cumulative distance value G + , previous cumulative distance value d ij : spectral distance value gradual between input speech i frame and word dictionary j frame (onomatopoeic number nj) From formula (1), to calculate one cumulative point, distance value data d
i-L J-2, di-1+j-1, di+j-1
, 1.4, and d ij are required.
それぞれの距離値は入力音声フレーム番号i。Each distance value is the input audio frame number i.
i−1,i−2、擬音素番号n=−z、ni−+、nJ
からアクセス可能である。i-1, i-2, onomatopoeic number n=-z, ni-+, nJ
It is accessible from.
距離値データdi−2ri−2、d 1−1n j−1
+ d i+ j−1、d l−1+ J 、d IJ
を高速にアクセスし、DP演算を効率よく処理するため
に考案したこの発明の実施例を第3図に示す。Distance value data di-2ri-2, d 1-1n j-1
+ d i+ j-1, d l-1+ J, d IJ
FIG. 3 shows an embodiment of the present invention devised for high-speed access to DP operations and efficient processing of DP operations.
1は入力音声フレーム番号が格納でき、かつup/do
wn可能なカウンタ、2は擬音素標準バタン番号を格納
するレジスタ、3はDP演算に必要な擬音素標準バタン
番号を退避しておくバッファメモリ、4はカウンタIへ
の入力音声フレーム番号の設定及びカウンタ1のup/
doivnill?I、レジスタ2への凝音素標準バ
タン番号の設定、バッファメモリ3からの擬音素標準バ
タン番号の読みだしを行う制御部、5は生成されたアド
レスの出力端子である。1 can store the input audio frame number and up/do
wn possible counter, 2 is a register that stores the onomatopoeic standard bang number, 3 is a buffer memory that saves the onomatopoeic standard bang number necessary for DP calculation, 4 is the setting of the input audio frame number to counter I, and Counter 1 up/
Doivnill? I is a control unit that sets the phoneme standard bang number in the register 2 and reads the onomatopoeic standard bang number from the buffer memory 3; 5 is an output terminal for the generated address;
ここで入力音声フレーム番号を距離マトリクスのベース
アドレス(上位側アドレス)とし、擬音素標準バタン番
号をオフセットアドレス(下位側アドレス)とすること
によりDP演算に必要な距離値を格納した距離マトリク
ス上のアドレスを示すことができる。例えば擬音素数を
256、距離マトリクスの先頭アドレスをO番地とした
場合、人力音声フレーム番号に対応する距離値マトリク
スのベースアドレスは、0.256 Xi 、 256
X2゜・・・・・・、 256 X(i−1) :
(ただしiは入力音声フレーム番号)と変化する。仮
にメモリアドレスのビット幅を16ビツトとした場合、
上位8ピントを入力音声フレーム番号、下位8ピントを
擬音素番号とし、それぞれ第3図のカウンタ1、レジス
タ2に格納しておく。DP演算の漸化式(1)とDP演
算の概念図第2図とにより、ある−点の累積点を計算す
る場合、入力音声フレーム番号は連続する3値が必要と
なる。この値は入力音声フレーム番号を格納してあるカ
ウンタ1をup/down制御することにより生成する
ことが出来る。従ってベースアドレスの変更時には制御
部4からのカウンタ1のup / downIII′4
1を行い、オフ上4ツトアドレスノ変更時にはバッファ
メモリ3に格納されている擬音素番号をレジスタ2に設
定することによりアドレスの変更が可能となる。カウン
タI、レジスタ2により示されるアドレスは端子5を通
して出力される。Here, the input audio frame number is used as the base address (upper address) of the distance matrix, and the onomatopoeic standard baton number is used as the offset address (lower side address). Address can be shown. For example, if the onomatopoeic prime is 256 and the start address of the distance matrix is address O, the base address of the distance value matrix corresponding to the human voice frame number is 0.256 Xi, 256
X2゜..., 256 X(i-1):
(where i is the input audio frame number). If the bit width of the memory address is 16 bits,
The upper 8 pintos are the input audio frame numbers and the lower 8 pintos are the onomatopoeic phoneme numbers, which are stored in the counter 1 and register 2 in FIG. 3, respectively. According to the recurrence formula (1) of the DP calculation and the conceptual diagram of the DP calculation in FIG. 2, when calculating the cumulative score of a certain point, three consecutive input audio frame numbers are required. This value can be generated by controlling up/down the counter 1 that stores the input audio frame number. Therefore, when changing the base address, the counter 1 is up/down III'4 from the control unit 4.
1, and when changing the off-upper four address, the address can be changed by setting the onomatopoeic phoneme number stored in the buffer memory 3 in the register 2. The address indicated by counter I and register 2 is output through terminal 5.
この実施例によるアドレス生成例を第4図に示す。図は
d i−2,J−L d i−1+ j−1、d IJ
、d i−1+ jを順次アクセスする例を示している
。各サイクルでの処理内容は以下の通りである。なおり
ウンタ1には入力音声フレーム番号i−2が設定されて
いる状態を想定している。FIG. 4 shows an example of address generation according to this embodiment. The diagram shows d i-2, J-L d i-1+ j-1, d IJ
, d i-1+j are sequentially accessed. The processing contents in each cycle are as follows. It is assumed that the input audio frame number i-2 is set in the naori counter 1.
サイクル1;バッファメモリ3より擬音素番号n=−z
を読み出し本サイクルの最
後でレジスタ2に設定する。Cycle 1; Onomatopoeic number n=-z from buffer memory 3
is read and set in register 2 at the end of this cycle.
サイクル2;出力@5よりdi−t+j−1のアドレス
を出力する。Cycle 2: Output the address of di-t+j-1 from output @5.
バッファメモリ3より擬音素番号 nj−1を読み出し本サイクルの最 後でレジスタ2に設定する。Onomatopoeic number from buffer memory 3 Read nj-1 and set it at the end of this cycle. Set it in register 2 later.
カウンタlを本サイクルの最後で カウントup(+1)する。Counter l at the end of this cycle Count up (+1).
サイクル3;出力端5よりd i−1+ j−1のアド
レスを出力する。Cycle 3: The address of d i-1+j-1 is output from the output terminal 5.
バッファメモリ3より擬音素番号 nJを読み出し本サイクルの最後 でレジスタ2に設定する。Onomatopoeic number from buffer memory 3 Read nJ at the end of this cycle Set in register 2 with .
カウンタlを本サイクルの最後で カウントup(+1)する。Counter l at the end of this cycle Count up (+1).
サイクル4;出力端5よりd、Jのアドレスを出力する
。Cycle 4: Addresses d and J are output from output terminal 5.
カウンタ2を本サイクルの最後で カウントdo鍔n(−1)する。Counter 2 at the end of this cycle Count dotsuba n(-1).
サイクル5;出力端5よりdi−1,jのアドレスを出
力する。Cycle 5: The address of di-1,j is output from the output terminal 5.
以上の処理により連続的に距離値d i−2,j−2、
d i−1+ j−1,d ij、d i−1+ jが
アクセス可能となる。Through the above processing, distance values d i-2, j-2,
d i-1+ j-1, d ij, and d i-1+ j become accessible.
「発明の効果」
以上説明したように、この発明によれば簡単な回路構成
によりヘクトル量子化手法に基づいた単語音声認識にお
いて距離値を−aitサイクルなしに高速に読み出すこ
とができ、メモリアクセスの頻繁なりP演算において、
距離値アドレス生成のオーバヘッドを削減でき認識処理
時間の短縮を図ることが出来る。"Effects of the Invention" As explained above, according to the present invention, distance values can be read out at high speed without -ait cycles in word speech recognition based on the hector quantization method with a simple circuit configuration, and memory access can be performed quickly. In the frequent P operation,
The overhead of distance value address generation can be reduced, and the recognition processing time can be shortened.
第1図は単語辞書とベクトル量子化に基づく単語認識に
おいて作成される距離マトリクスとの関係を示す図、第
2図はDP演算の一例を示す概念図、第3図はこの発明
の一実施例を示すブロック図、第4図はアドレス生成の
一実施例を示す図である。
特許出願人 日本電信電話株式会社Fig. 1 is a diagram showing the relationship between a word dictionary and a distance matrix created in word recognition based on vector quantization, Fig. 2 is a conceptual diagram showing an example of DP calculation, and Fig. 3 is an embodiment of the present invention. FIG. 4 is a block diagram showing an example of address generation. Patent applicant Nippon Telegraph and Telephone Corporation
Claims (1)
されたスペクトルパタンの番号系列で表現し、その単語
辞書と入力音声とのダイナミックプログラミング(DP
)マッチングにより、単語認識を行う認識系において、 入力音声の時間情報を示すフレーム番号が格納でき、か
つup/down可能なカウンタと、ベクトル量子化さ
れたスペクトルパタンの番号を格納するレジスタと、 演算に必要なスペクトルパタンの番号を退避しておくバ
ッファメモリと、 上記カウンタへの入力音声フレーム番号の設定及びカウ
ンタのup/down制御、上記レジスタへのスペクト
ルパタン番号の設定、上記バッファメモリからのスペク
トルパタン番号の読みだしを行う制御部とを持ち、 DP演算に用いる距離値データを格納してあるデータメ
モリのアクセスに際して、上記カウンタが上記データメ
モリの上位側アドレス、上記レジスタが下位側アドレス
を示すよう構成し、 入力音声のフレーム番号の変更時には制御部からの信号
により、上記カウンタをup/downし、スペクトル
パタン番号の変更時には上記バッファメモリに格納され
ているスペクトルパタン番号を上記レジスタに設定でき
るようにした事を特徴とするDP演算用メモリアドレス
制御回路。(1) A word dictionary to be recognized is expressed as a number series of spectral patterns created by vector quantization, and dynamic programming (DP) is applied to the word dictionary and input speech.
) In a recognition system that performs word recognition by matching, a counter that can store a frame number indicating time information of input speech and that can be up/down, a register that stores a vector quantized spectrum pattern number, and an operation. A buffer memory for saving the spectral pattern numbers necessary for the above, setting of the input audio frame number to the above counter and up/down control of the counter, setting of the spectral pattern number to the above register, and inputting the spectrum from the above buffer memory. and a control unit that reads a pattern number, and when accessing a data memory storing distance value data used for DP calculation, the counter indicates the upper address of the data memory, and the register indicates the lower address. When the frame number of the input audio is changed, the counter is up/down by a signal from the control section, and when the spectral pattern number is changed, the spectral pattern number stored in the buffer memory can be set in the register. A memory address control circuit for DP operation, characterized in that:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63212720A JPH0616262B2 (en) | 1988-08-26 | 1988-08-26 | Memory address control circuit for DP operation |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63212720A JPH0616262B2 (en) | 1988-08-26 | 1988-08-26 | Memory address control circuit for DP operation |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0259928A true JPH0259928A (en) | 1990-02-28 |
JPH0616262B2 JPH0616262B2 (en) | 1994-03-02 |
Family
ID=16627316
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP63212720A Expired - Lifetime JPH0616262B2 (en) | 1988-08-26 | 1988-08-26 | Memory address control circuit for DP operation |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0616262B2 (en) |
-
1988
- 1988-08-26 JP JP63212720A patent/JPH0616262B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH0616262B2 (en) | 1994-03-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS5885499A (en) | Continuous voice recognition method and apparatus | |
JPS6024597A (en) | Voice registration system | |
JP2980026B2 (en) | Voice recognition device | |
JPH0673080B2 (en) | Continuous speech recognition method | |
JPS60211498A (en) | Continuous voice recognition equipment | |
JPH0259928A (en) | Memory address control circuit for dp operation | |
JPH0887294A (en) | Voice recognition device | |
EP0138166B1 (en) | Pattern matching apparatus | |
JPS61145599A (en) | Continuous voice recognition equipment | |
JPS592954B2 (en) | pattern luigi dokeisan sochi | |
JPS59172696A (en) | Voice pattern analogy computing system | |
JPH01138596A (en) | Voice recognition equipment | |
JP2000267691A (en) | Recognition dictionary selecting method in voice recognition system | |
KR20010076625A (en) | Synthesis units reduction method for corpus-based TTS system | |
JPS62161200A (en) | Continuous voice recognition equipment | |
JPH0577078B2 (en) | ||
JPS62221000A (en) | Continuous voice recognition equipment | |
JPS60182494A (en) | Voice recognition equipment | |
JPH0736489A (en) | Speech recognition device | |
JPS6183598A (en) | Voice pattern matching system | |
JPS6167896A (en) | Voice recognition method | |
JPH0594198A (en) | Method and device for recognizing voice | |
JPS61252593A (en) | Voice recognition equipment | |
JPH01279299A (en) | Sound input-output device | |
JPS61235899A (en) | Voice recognition equipment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090302 Year of fee payment: 15 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090302 Year of fee payment: 15 |