JPH11119799A - Method and device for voice encoding - Google Patents

Method and device for voice encoding

Info

Publication number
JPH11119799A
JPH11119799A JP9280079A JP28007997A JPH11119799A JP H11119799 A JPH11119799 A JP H11119799A JP 9280079 A JP9280079 A JP 9280079A JP 28007997 A JP28007997 A JP 28007997A JP H11119799 A JPH11119799 A JP H11119799A
Authority
JP
Japan
Prior art keywords
search
audio signal
codebook
synthesis filter
term
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9280079A
Other languages
Japanese (ja)
Inventor
Takahiro Kondo
孝宏 近藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP9280079A priority Critical patent/JPH11119799A/en
Publication of JPH11119799A publication Critical patent/JPH11119799A/en
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

PROBLEM TO BE SOLVED: To reduce the increase in operation quantity regarding address generation when a fixed code book search process of an ACELP(algebraic code excitation linear prediction) voice encoding system is actualized by a signal processing LSI such as a DSP. SOLUTION: This device is equipped with a threshold calculating means 101 which calculates a threshold for controlling the frequency of search of an algebraic code book in the fixed code book search process, a narrowing-down search approach means 102, which narrows down a search place of the algebraic code book according to the threshold, and a pulse position search means 103 which searches an algebraic code book on the basis of the result of the narrowing-down search approach means 102.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、音声符号化方法お
よび音声符号化装置に関し、特に低ビットレートで自然
な品質の音声を実現したCELP(符号励振線形予測:
Code Excited Linear Predi
ction)方法等の音声符号化方法および音声符号化
装置に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a speech coding method and a speech coding apparatus, and more particularly to a CELP (Code Excited Linear Prediction: CELP) realizing natural quality speech at a low bit rate.
Code Excited Linear Predi
ction) method and the like, and a speech encoding device.

【0002】[0002]

【従来の技術】音声の符号化技術は音声波形をディジタ
ル符号に変換して伝送したり、記録する際に情報量を削
減する技術である。そして、近年のLSI技術の急速な
進展とともに、圧縮効率の高い高能率符号化方法が実現
可能となり、ディジタル移動通信や多様なマルチメディ
ア通信に適用されている。
2. Description of the Related Art A speech encoding technique is a technique for converting an audio waveform into a digital code and transmitting or recording the information, thereby reducing the amount of information. With the rapid progress of LSI technology in recent years, a high-efficiency encoding method with high compression efficiency has become feasible and has been applied to digital mobile communications and various multimedia communications.

【0003】ここで、高能率符号化方法の1つであるC
ELP方法、その中で固定コードブックに代数コードブ
ックを用いるACELP(代数符号励振線形予測:Al
gebraic CELP)方法について説明する。こ
のACELP方法については、標準化されている符号化
方式ITU−TG.729およびITU−TG.72
3.1の勧告書に記載されている手法を参考として、以
下に説明する。
Here, C, which is one of the high-efficiency coding methods, is used.
ELLP method, in which ACELP (Algebraic code excitation linear prediction: Al
Gebric CELP) method will be described. Regarding this ACELP method, a standardized coding method ITU-TG. 729 and ITU-TG. 72
The method is described below with reference to the method described in the 3.1 recommendation.

【0004】符号器側では、まずあるフレーム毎に符号
化対象の音声信号に対し線形予測分析を行い、短期合成
フィルタ係数を抽出する。上記の線形予測分析というの
は、現時刻におけるサンプル値を、過去のサンプル値の
線形結合として予測する線形予測モデルを用いて、現サ
ンプル値と予測値の誤差が最小となるように線形式の係
数を求め、それを分析値とする音声信号の分析方法であ
る。また、短期合成フィルタというのは、線形予測分析
より求められた係数をフィルタ係数とするフィルタであ
り、音声の周波数特性を表すフィルタである。
[0004] On the encoder side, first, a linear prediction analysis is performed on a speech signal to be encoded for each certain frame to extract short-term synthesis filter coefficients. The linear prediction analysis described above uses a linear prediction model that predicts the sample value at the current time as a linear combination of the past sample values, and uses a linear formula to minimize the error between the current sample value and the predicted value. This is an audio signal analysis method in which a coefficient is obtained and used as an analysis value. Further, the short-term synthesis filter is a filter that uses a coefficient obtained by the linear prediction analysis as a filter coefficient, and is a filter that represents a frequency characteristic of voice.

【0005】つぎに、音声信号に対し、短期合成フィル
タに基づいて与えられる聴覚重み付けフィルタにより聴
覚重み付けを行い、聴覚重み付き音声信号が生成され
る。そして、聴覚重み付き音声信号より、後述の適応コ
ードブック探索時の演算量を削減するためのピッチ周期
が予備選択される。上記の聴覚重み付けフィルタという
のは、以下のようなフィルタである。すなわち、音声信
号のホルマント領域での量子化雑音がマスキング効果に
より小さく感じられるという効果を利用し、聴感上の雑
音感を低減するためのフィルタである。
Next, perceptual weighting is performed on the voice signal by a perceptual weighting filter provided based on a short-term synthesis filter to generate a perceptual weighted voice signal. Then, a pitch period for reducing the amount of computation at the time of searching for an adaptive codebook, which will be described later, is preliminarily selected from the auditory weighted audio signal. The above auditory weighting filter is the following filter. In other words, the filter is a filter for reducing the noise perception by utilizing the effect that the quantization noise in the formant region of the audio signal is perceived to be small due to the masking effect.

【0006】ここで、上記フレームはさらに幾つかのサ
ブフレームに分割され、以降の処理はサブフレーム毎に
実行される。そしてまず、音声信号から短期合成フィル
タによる短期予測寄与分を減算した線形予測残差信号に
対し、ピッチ周期に基づき適応コードブック探索を行う
ことによりピッチパラメータおよび利得を抽出し、長期
合成フィルタを生成する。上記の短期予測寄与分という
のは、{入力音声信号−(1/短期合成フィルタ)×入
力音声信号}に等しい。ただし、(1/短期合成フィル
タ)は、短期合成フィルタの逆フィルタである。また、
音声信号には声帯の振動による周期的な成分が含まれて
おり、そのときの周期をピッチ周期とする。ここでは、
音声信号(聴覚重み付き)から直接抽出した周期をピッ
チ周期と呼び、さらに、より正確な周期を得るために音
声信号から上記短期予測寄与分を差し引いた線形予測残
差信号から抽出した周期をピッチパラメータとしてい
る。また、適用コードブックというのは、パラメータと
して上記線形予測残差信号のピッチパラメータと利得を
有するコードブックである。また、長期合成フィルタと
いうのは、上記適応コードブックパラメータ(ピッチパ
ラメータと利得)により構成されるフィルタであり、過
去の線形予測残差信号から現在の線形予測残差信号を予
測するものである。
Here, the frame is further divided into several sub-frames, and the subsequent processing is executed for each sub-frame. First, a pitch parameter and a gain are extracted by performing an adaptive codebook search based on a pitch period for a linear prediction residual signal obtained by subtracting a short-term prediction contribution by a short-term synthesis filter from an audio signal, and a long-term synthesis filter is generated. I do. The short-term prediction contribution is equal to {input speech signal− (1 / short-term synthesis filter) × input speech signal}. Here, (1 / short-term synthesis filter) is an inverse filter of the short-term synthesis filter. Also,
The voice signal includes a periodic component due to the vibration of the vocal cords, and the cycle at that time is defined as a pitch cycle. here,
The period directly extracted from the audio signal (with auditory weights) is called the pitch period, and the period extracted from the linear prediction residual signal obtained by subtracting the short-term prediction contribution from the audio signal to obtain a more accurate period is the pitch. Parameters. The applied codebook is a codebook having, as parameters, a pitch parameter and a gain of the linear prediction residual signal. The long-term synthesis filter is a filter configured by the adaptive codebook parameters (pitch parameter and gain), and predicts a current linear prediction residual signal from a past linear prediction residual signal.

【0007】つぎに、線形予測残差信号から長期合成フ
ィルタによる長期予測寄与分を減算した残差信号が固定
コードブック探索において最適励振信号の確定に用いら
れる。固定コードブック探索処理は聴覚重み付き音声信
号と聴覚重み付き再生音声信号との間の平均自乗誤差を
最小化することにより行われ、以下の手順で実現され
る。上記の長期予測寄与分というのは、(長期合成フィ
ルタ×過去の線形予測残差信号)に等しい。また、固定
コードブックというのは、パラメータとしてあらかじめ
数種類の音源信号が登録されたコードブックであり、固
定コードブック探索では線形予測残差信号から長期予測
寄与分を減じた残差信号とコードブックに登録された音
源信号の誤差電力が最小となるような最適な音源信号が
選択される。
Next, the residual signal obtained by subtracting the long-term prediction contribution by the long-term synthesis filter from the linear prediction residual signal is used to determine the optimal excitation signal in the fixed codebook search. The fixed codebook search processing is performed by minimizing the mean square error between the auditory weighted audio signal and the auditory weighted reproduced audio signal, and is realized by the following procedure. The above-described long-term prediction contribution is equal to (long-term synthesis filter × past linear prediction residual signal). A fixed codebook is a codebook in which several types of sound source signals are registered in advance as parameters.In a fixed codebook search, a residual signal obtained by subtracting a long-term prediction contribution from a linear prediction residual signal and a codebook are used. An optimal sound source signal that minimizes the error power of the registered sound source signal is selected.

【0008】まず、残差信号x[n]および短期合成フ
ィルタと聴覚重み付けフィルタとの縦続接続で構成され
る聴覚重み付き合成フィルタのインパルス応答h[n]
の相関信号d[n]を(数1)に基づいて算出する。
(数1)のnは各信号の時間領域の連続するサンプル番
号であり、n=0,1,2,3,…,N−1である。ま
た、同式のiとjは、各信号の時間領域の連続するサン
プル番号である。
First, an impulse response h [n] of a perceptually weighted synthesis filter composed of a cascade connection of a residual signal x [n] and a short-term synthesis filter and a perceptual weighting filter.
Is calculated based on (Equation 1).
N in (Equation 1) is a continuous sample number in the time domain of each signal, and n = 0, 1, 2, 3,..., N−1. Also, i and j in the same expression are successive sample numbers in the time domain of each signal.

【0009】[0009]

【数1】 (Equation 1)

【0010】つぎに、聴覚重み付き合成フィルタのイン
パルス応答h[n]の相関を含む行列Φを(数2)に基
づいて算出する。
Next, a matrix Φ including the correlation of the impulse response h [n] of the auditory weighted synthesis filter is calculated based on (Equation 2).

【0011】[0011]

【数2】 (Equation 2)

【0012】ck をk番目の固定コードブックベクトル
とするとき、コードブックは(数3)を最大にするkを
求めることにより探索される。なお、Ck はスカラ量を
表し、ck はベクトルを表している。
When ck is the k-th fixed codebook vector, the codebook is searched for by finding k that maximizes (Equation 3). Note that C k represents a scalar amount, and c k represents a vector.

【0013】[0013]

【数3】 (Equation 3)

【0014】上記の(数3)において、ck は固定コー
ドブックに登録されたk番目の音源ベクトルであり、c
k t は音源ベクトルck の転置ベクトルである。c
k [n]は音源ベクトルck のn番目の要素である。C
k 2 およびEk はそれぞれ(数3)の右辺の分子および
分母を便宜上1個の変数に割り当てただけものである。
ここで、Nはサブフレーム長を示す。また、固定コード
ブックは、代数的構造を持つため、探索手順の簡略化が
可能であり、(数3)の分子の相関および分母のエネル
ギーは(数4)および(数5)で示される。
In the above (Equation 3), c k is the k-th sound source vector registered in the fixed codebook, and c k
k t is the transpose vector of the excitation vector c k. c
k [n] is the n-th element of the sound source vector c k . C
Each of k 2 and E k is obtained by assigning the numerator and denominator on the right side of (Equation 3) to one variable for convenience.
Here, N indicates the subframe length. Further, since the fixed codebook has an algebraic structure, the search procedure can be simplified, and the numerator correlation and the denominator energy in (Equation 3) are expressed by (Equation 4) and (Equation 5).

【0015】[0015]

【数4】 (Equation 4)

【0016】[0016]

【数5】 (Equation 5)

【0017】ここで、Mはパルス本数、mi はi番目の
パルス位置、si はその振幅を示す。つぎに、(数3)
と(数4)および(数5)の関係について詳しく説明す
る。まず、(数3)の分子と(数4)の関係について説
明する。(数3)の分子はそのまま計算すると、 Ck =d[0]・ck [0]+d[1]・ck [1]+
…+d[N−1]・ck [N−1] となる。なお、二乗の部分は省略している。しかし、固
定コードブックが代数的構造を持つ場合には、固定コー
ドブックに登録される音源ベクトルck [n]は、ある
決められたパルス数(ここでは、M本)だけ零でないパ
ルスを持ち、他は全て零となる。
[0017] Here, M is the pulse number, m i is the i th pulse position, s i represents the amplitude. Next, (Equation 3)
The relationship between (Equation 4) and (Equation 5) will be described in detail. First, the relationship between the numerator of (Equation 3) and (Equation 4) will be described. If the numerator of (Equation 3) is directly calculated, C k = d [0] · c k [0] + d [1] · c k [1] +
.. + D [N−1] · c k [N−1]. Note that the squared portion is omitted. However, when the fixed codebook has an algebraic structure, the sound source vector c k [n] registered in the fixed codebook has non-zero pulses by a predetermined number of pulses (here, M). , All others are zero.

【0018】例として、パルス本数M=4であり、0,
1,2,3番目のパルス位置をそれぞれm0 ,m1 ,m
2 ,m3 (m0 <m1 <m2 <m3 )とすると、音源ベ
クトルck [n]は、ck [m0 ]、ck [m1 ]、c
k [m2 ]、ck [m3 ]のみ非零で、その他の音源ベ
クトルck [n](nはm0 、m1 、m2 、m3 以外)
は全て零となる。したがって、(数3)の分子は、 Ck = d[0]・0+…+d[m0 −1]・0 +d[m0 ]・ck [m0 ] +d[m0 +1]・0+…+d[m1 −1]・0 +d[m1 ]・ck [m1 ] +d[m1 +1]・0+…+d[m2 −1]・0 +d[m2 ]・ck [m2 ] +d[m2 +1]・0+…+d[m3 −1]・0 +d[m3 ]・ck [m3 ] +d[m3 +1]・0+…+d[N−1]・0 = d[m0 ]・ck [m0 ]+d[m1 ]・ck [m1 ] +d[m2 ]・ck [m2 ]+d[m3 ]・ck [m3 ] となる。そこで、音源信号ck [mi ]の振幅をs
i (i=0,1,2,3)とすると、 Ck = d[m0 ]・s0 +d[m1 ]・s1+d[m
2 ]・s2 +d[m3 ]・s3 となり、(数4)のM=4の場合の結果となる。
As an example, when the number of pulses M = 4, 0,
The first, second, and third pulse positions are m 0 , m 1 , and m, respectively.
2 , m 3 (m 0 <m 1 <m 2 <m 3 ), the sound source vector c k [n] is c k [m 0 ], c k [m 1 ], c
Only k [m 2 ] and c k [m 3 ] are non-zero, and other sound source vectors c k [n] (n is other than m 0 , m 1 , m 2 and m 3 )
Are all zero. Therefore, the numerator of (Equation 3) can be expressed as follows: C k = d [0] · 0 +... + D [m 0 −1] · 0 + d [m 0 ] · c k [m 0 ] + d [m 0 +1] · 0 +. + d [m 1 -1] · 0 + d [m 1] · c k [m 1] + d [m 1 +1] · 0 + ... + d [m 2 -1] · 0 + d [m 2] · c k [m 2 ] + d [m 2 +1] · 0 + ... + d [m 3 -1] · 0 + d [m 3] · c k [m 3] + d [m 3 +1] · 0 + ... + d [N-1] · 0 = d a [m 0] · c k [ m 0] + d [m 1] · c k [m 1] + d [m 2] · c k [m 2] + d [m 3] · c k [m 3]. Therefore, the amplitude of the sound source signal c k [m i ] is defined as s
Assuming that i (i = 0, 1, 2, 3), C k = d [m 0 ] · s 0 + d [m 1 ] · s 1 + d [m
2 ] · s 2 + d [m 3 ] · s 3 , which is the result of (Equation 4) when M = 4.

【0019】また、(数3)の分母と(数5)の関係
も、上記要因を考慮すると、同様に成立する。なお、パ
ルス本数については、上述したように、固定コードブッ
クに登録された音源ベクトルで非零の要素がいくつある
かを意味し、実際の本数は、このACELP方法を用い
た様々な符号化方式によって異なると考えられる。
Also, the relationship between the denominator of (Equation 3) and (Equation 5) is similarly established in consideration of the above factors. Note that, as described above, the number of pulses means the number of non-zero elements in the excitation vector registered in the fixed codebook, and the actual number is determined by various encoding methods using this ACELP method. It is thought to be different.

【0020】また、(数1),(数2)のn,i,j
は、前述したように、各信号(d[]等)の時間領域で
の連続するサンプル番号を示すが、(数4)以降の数式
のm i は、i番目のパルス位置を示し、例えばd[n]
(n=0,1,2,…,N−1)の中のある任意の位置
を表す。例えば、d[n](n=a)とd[mi ](m
i =a)は等値である。したがって、各数式中のmi
とりうる値は、n,i,jがとりうる値(0,1,2,
…,N−1)であり、整数である。mj も同様である。
Further, n, i, j of (Equation 1) and (Equation 2)
Is in the time domain of each signal (d [] etc.) as described above.
Indicates the consecutive sample numbers of the following equation.
M iIndicates the i-th pulse position, for example, d [n]
An arbitrary position in (n = 0, 1, 2,..., N-1)
Represents For example, d [n] (n = a) and d [mi] (M
i= A) are equivalent. Therefore, m in each formulaiBut
Possible values are n, i, j (0, 1, 2,
..., N-1), which are integers. mjThe same is true for

【0021】例えば、(数4)のd[mi ]は、d
[n](n=0,1,2,…,N−1)のn==mi
あった場合を示す。また、(数5)のΦ(mi ,mj
はΦ(i,j)(i=0,1,2,…,N−1、j=
i,…,N−1)のi==mi ,j==mj であった場
合を示す。また、M本のパルス位置はM重ループにより
一本ずつ逐次的に探索されることから、探索手順をさら
に簡略化するために絞り込み探索アプローチが使用され
る。本アプローチでは最終ループに入る前に、事前に算
出されたしきい値とその時点での(数4)で示される相
関値とを比較し、しきい値を越えた場合のみ最終ループ
に入る。さらに、最終ループに入ることができる回数の
上限を設定することにより、コードブック探索回数を抑
えることができる。
For example, d [m i ] in (Equation 4) is d
[N] (n = 0,1,2, ..., N-1) shows a case was of n == m i. Also, Φ (m i , m j ) of (Equation 5)
Is Φ (i, j) (i = 0, 1, 2,..., N−1, j =
i,..., N−1), i == m i , j == m j . Further, since the M pulse positions are sequentially searched one by one by an M-fold loop, a narrow search approach is used to further simplify the search procedure. In this approach, before entering the final loop, the threshold calculated in advance is compared with the correlation value shown in (Equation 4) at that time, and only when the threshold is exceeded, the final loop is entered. Further, by setting the upper limit of the number of times that the apparatus can enter the final loop, the number of times of codebook search can be reduced.

【0022】以上の手順で固定コードブックの探索が行
われた後、線形予測分析で抽出された短期予測符号およ
び適応コードブック探索で抽出された長期予測符号、そ
して固定コードブック探索で抽出されたパルス位置、利
得情報が復号器側へ伝送される。上記の短期予測符号と
いうのは短期合成フィルタ係数を符号化して得られる短
期予測符号のことであり、長期予測符号というのは線形
予測残差信号のピッチパラメータおよび利得を符号化し
て得られる長期予測符号のことである。
After the fixed codebook search is performed in the above procedure, the short-term prediction code extracted by the linear prediction analysis, the long-term prediction code extracted by the adaptive codebook search, and the fixed codebook search are extracted. The pulse position and gain information are transmitted to the decoder side. The short-term prediction code is a short-term prediction code obtained by encoding a short-term synthesis filter coefficient, and the long-term prediction code is a long-term prediction code obtained by encoding a pitch parameter and a gain of a linear prediction residual signal. It is a sign.

【0023】[0023]

【発明が解決しようとする課題】しかし、ACELP音
声符号化方法における従来の固定コードブック探索処理
では、絞り込み探索アプローチ処理とパルス位置探索処
理が同時に行われており、M本のパルス位置を探索する
際のM重ループ内では(数4)、(数5)で示されるd
[mi ]およびΦ(mi ,mi )、Φ(mi ,mj )の
合計M2 +M−(1+2+・・・+(M−1))個のデ
ータを扱う必要がある。そのため、この探索処理をDS
P(Digital Signal Processo
r)等の信号処理用LSIで実現させた場合には、メモ
リ上に格納された各データを扱うためにM2 +M−(1
+2+・・・+(M−1))本のアドレスポインタが必
要となる。
However, in the conventional fixed codebook search processing in the ACELP speech coding method, the narrowing search approach processing and the pulse position search processing are performed simultaneously, and the M pulse positions are searched. D in Equation (4) and (Equation 5)
It is necessary to handle a total of M 2 + M− (1 + 2 +... + (M−1)) data of [m i ], φ (m i , m i ), and φ (m i , m j ). Therefore, this search processing is performed by DS
P (Digital Signal Processo)
r) and the like, the M 2 + M− (1) is used to handle each data stored in the memory.
.. + (M-1)) address pointers are required.

【0024】ここで、ACELP音声符号化方法におけ
る従来の固定コードブック探索処理の処理フローを図4
に示す。図4において、101は代数コードブックの探
索方法を制御するしきい値の計算を行うしきい値計算手
段、418はしきい値を基に代数コードブックの探索箇
所を絞り込む絞り込み探索アプローチ処理とその結果を
基に代数コードブックの探索を行うパルス位置探索処理
を行う絞り込み探索アプローチ・パルス位置探索手段で
ある。また、図4は、探索する代数コードブックのパル
ス数Mが4本である場合について示している。まず、し
きい値計算手段101のステップ400において、(数
6)に示すしきい値thresを算出する。
FIG. 4 shows a processing flow of a conventional fixed codebook search process in the ACELP speech coding method.
Shown in In FIG. 4, reference numeral 101 denotes a threshold value calculating means for calculating a threshold value for controlling a method of searching an algebraic codebook, and 418 denotes a narrowing-down search approach process for narrowing down a search location of an algebraic codebook based on a threshold value. It is a refined search approach / pulse position search means for performing a pulse position search process for searching an algebraic codebook based on the result. FIG. 4 shows a case where the number of pulses M of the algebraic codebook to be searched is four. First, in step 400 of the threshold value calculating means 101, a threshold value thres shown in (Equation 6) is calculated.

【0025】[0025]

【数6】 (Equation 6)

【0026】ここで、maxは最初の3パルスによる相
関値の絶対値の最大値、aveは最初の3パルスによる
相関値の平均値、Kは0≦K≦1の定数を示す。つぎ
に、絞り込み探索アプローチ・パルス位置探索手段41
8に移り、ステップ402で(数7)に示す相関値C
0、(数8)に示すエネルギーE0、ステップ404で
(数9)に示す相関値C1、(数10)に示すエネルギ
ーE1、ステップ406で(数11)に示す相関値C
2、(数12)に示すエネルギーE2を算出する。な
お、ステップ401は第1パルス位置m0 探索ループス
タートステップであり、ステップ403は第2パルス位
置m1 探索ループスタートステップであり、ステップ4
05は第3パルス位置m2 探索ループスタートステップ
である。
Here, max is the maximum absolute value of the correlation values of the first three pulses, ave is the average value of the correlation values of the first three pulses, and K is a constant satisfying 0 ≦ K ≦ 1. Next, the narrowing-down search approach / pulse position searching means 41
8 and in step 402, the correlation value C shown in (Expression 7)
0, energy E0 shown in (Equation 8), correlation value C1 shown in (Equation 9) in step 404, energy E1 shown in (Equation 10), and correlation value C shown in (Equation 11) in step 406.
2. The energy E2 shown in (Equation 12) is calculated. Step 401 is a first pulse position m 0 search loop start step, and step 403 is a second pulse position m 1 search loop start step.
05 is a third pulse position m 2 search loop start step.

【0027】[0027]

【数7】 (Equation 7)

【0028】[0028]

【数8】 (Equation 8)

【0029】[0029]

【数9】 (Equation 9)

【0030】[0030]

【数10】 (Equation 10)

【0031】[0031]

【数11】 [Equation 11]

【0032】[0032]

【数12】 (Equation 12)

【0033】ここで、d[ ]は入力音声信号から短期
予測寄与分および長期予測寄与分を減じた残差信号と、
聴覚重み付き合成フィルタのインパルス応答との相関信
号、mi はi番目のパルス位置、si はその振幅、Φ′
は(数2)に示す聴覚重み付き合成フィルタのインパル
ス応答の相関を含む行列Φに前記相関信号d[ ]の極
性情報を付加したものを示す。つぎに、ステップ407
において、ステップ400で算出したしきい値thre
sと相関値C2を比較する。そして、相関値C2がしき
い値thres以下である場合には、つぎのパルス位置
に対して探索を行う(ステップ415、416、41
7)。また、相関値C2がしきい値thresより大き
い場合には、ステップ408に移り、第4パルス位置m
3 の探索をスタートし、ステップ409で(数13)に
示す相関値C3、(数14)に示すエネルギーE3を算
出する。
Where d [] is the residual signal obtained by subtracting the short-term prediction contribution and the long-term prediction contribution from the input speech signal;
Correlation signal with the impulse response of the perceptually weighted synthesis filter, m i is the i th pulse position, s i is its amplitude, [Phi '
Indicates a matrix Φ including the correlation of the impulse response of the auditory weighted synthesis filter shown in (Equation 2) to which the polarity information of the correlation signal d [] is added. Next, step 407
, The threshold thre calculated in step 400
s is compared with the correlation value C2. When the correlation value C2 is equal to or smaller than the threshold value thres, a search is performed for the next pulse position (steps 415, 416, and 41).
7). If the correlation value C2 is larger than the threshold value thres, the process proceeds to step 408, where the fourth pulse position m
The search of 3 is started, and in step 409, the correlation value C3 shown in (Equation 13) and the energy E3 shown in (Equation 14) are calculated.

【0034】[0034]

【数13】 (Equation 13)

【0035】[0035]

【数14】 [Equation 14]

【0036】そして、ステップ410において、(数
3)に示す式を最大にする最適パルス位置を探索するた
めに、C32 ・Emax とCmax ・E3の比較を行う。C
max およびEmax はそれぞれ最適パルスによる相関値お
よびエネルギーである。ここで、Cmax ・E3がC32
・Emax 以上である場合には、次のパルス位置に対して
探索を行う(ステップ412)。逆に、Cmax ・E3が
C32 ・Emax より小さい場合には、ステップ411に
おいて、そのときの全パルス位置m0 ,m1 ,m 2 ,m
3 を最適パルスによる相関値およびエネルギーとして保
存更新し、つぎのパルス位置に対して探索を行う(ステ
ップ412)。なお、ステップ412は、第4パルス位
置探索ループ終了ステップである。そして、探索すべき
全ての第4パルス位置の探索が終了したら、ステップ4
13において、第4パルス位置の探索を行った回数をカ
ウントするカウンタをインクリメントし、ステップ41
4においてそのカウンタが第4パルス位置の探索を行う
回数の上限である最大探索回数より大きければパルス位
置探索処理を終了する。また、カウンタが最大探索回数
以下であれば、つぎのパルス位置に対して探索を行う
(ステップ415)。絞り込み探索アプローチ・パルス
位置探索手段418では、上記一連の処理をカウンタが
最大探索回数より大きくなるか、または探索すべき全て
の第1,第2,第3パルス位置の探索が終了するまで繰
り返す。なお、ステップ415は、第3パルス位置探索
ループ終了ステップ、ステップ416は第2パルス位置
探索ループ終了ステップ、ステップ417は第1パルス
位置探索ループ終了ステップである。これから明らかな
ように、探索する代数コードブックのパルス数が4本で
ある固定コードブック処理を絞り込み探索アプローチ・
パルス位置探索手段418で同時に行う場合、4重ルー
プ内では、(数7)〜(数14)で示されるd[ ]お
よびΦ′( )の合計14個のデータを扱う必要があ
る。
Then, in step 410, (number
Search for the optimal pulse position that maximizes the expression shown in 3)
In order, C3Two・ EmaxAnd Cmax・ Compare E3. C
maxAnd EmaxAre the correlation values and
And energy. Where Cmax・ E3 is C3Two
・ EmaxIf this is the case, the next pulse position
A search is performed (step 412). Conversely, Cmax・ E3
C3Two・ EmaxIf smaller, go to step 411
Where, all pulse positions m at that time0, M1, M Two, M
ThreeAs the correlation value and energy from the optimal pulse.
Search for the next pulse position (step
412). Step 412 is performed at the fourth pulse level.
This is the end step of the location search loop. And should be searched
When the search for all fourth pulse positions is completed, step 4
In 13, the number of times the search for the fourth pulse position has been performed is counted.
The counter to be counted is incremented, and step 41 is executed.
At 4, the counter searches for the fourth pulse position.
Pulse position if it is larger than the maximum number of searches, which is the upper limit of the number of times
The location search processing ends. Also, the counter is the maximum number of searches
If below, search for the next pulse position
(Step 415). Refine search approach pulse
In the position searching means 418, the above series of processing is performed by a counter.
Everything greater than the maximum number of searches or to be searched
Until the search for the first, second, and third pulse positions is completed.
Return. Step 415 is the third pulse position search.
Loop end step, step 416 is the second pulse position
Search loop end step, step 417 is the first pulse
This is a position search loop end step. Obvious from this
So, if the number of pulses in the algebraic codebook to search is four,
A search approach that narrows down a fixed codebook process
When the pulse position search means 418 performs the operation simultaneously,
In the group, d [] and (
And Φ '() need to handle a total of 14 data
You.

【0037】これは、例えば代数コードブックのパルス
数Mが4本の場合では、アドレスポインタが14本必要
となることを意味する。しかし、通常DSPを用いた探
索処理で使用できるアドレスポインタ本数には制限があ
り、これまではアドレスポインタの内容をメモリ上に退
避、復帰しながら処理を行っていたため、演算量が増大
するという問題を有していた。
This means that, for example, when the pulse number M of the algebraic codebook is 4, 14 address pointers are required. However, there is a limit to the number of address pointers that can be normally used in search processing using a DSP, and the processing has been performed while saving and restoring the contents of the address pointer in the memory so far, resulting in an increase in the amount of calculation. Had.

【0038】本発明は上記従来の問題点を解決するもの
で、DSP等の信号処理用LSIを用いてACELP音
声符号化方法を実現する場合の固定コードブック探索処
理における演算量を削減することができる音声符号化方
法および音声符号化装置を提供することを目的とする。
The present invention solves the above-mentioned conventional problems. An object of the present invention is to reduce a calculation amount in a fixed codebook search process when an ACELP speech encoding method is realized using a signal processing LSI such as a DSP. It is an object of the present invention to provide a voice coding method and a voice coding device capable of performing the above.

【0039】[0039]

【課題を解決するための手段】この目的を達成するため
に、本発明の請求項1記載の音声符号化方法は、あるフ
レーム長の音声信号に対し線形予測分析を行い短期合成
フィルタを生成し、音声信号に対し聴覚重み付けを行い
聴覚重み付き音声信号を生成し、聴覚重み付き音声信号
を基に長期合成フィルタを生成し、短期合成フィルタに
よる短期予測寄与分と長期合成フィルタによる長期予測
寄与分を音声信号より減算した残差信号を基に残差信号
と再生音声信号の平均自乗誤差が最小となるように代数
コードブックの探索を行う方法であり、代数コードブッ
クの探索方法を制御するしきい値の計算を行い、しきい
値を基に代数コードブックの探索箇所を絞り込み、絞り
込みの結果を基に代数コードブックの探索を行うことを
特徴とする。
In order to achieve this object, a speech encoding method according to the first aspect of the present invention performs a linear prediction analysis on a speech signal having a certain frame length to generate a short-term synthesis filter. Audience weighting is applied to the audio signal to generate an auditory weighted audio signal, a long-term synthesis filter is generated based on the auditory weighted audio signal, and a short-term prediction contribution by the short-term synthesis filter and a long-term prediction contribution by the long-term synthesis filter. Is a method of searching for an algebraic codebook based on a residual signal obtained by subtracting the following from an audio signal so that the mean square error between the residual signal and the reproduced audio signal is minimized. The method is characterized in that a threshold value is calculated, a search location of an algebraic codebook is narrowed down based on a threshold value, and an algebraic codebook search is performed based on the narrowed-down result.

【0040】この方法によると、ACELP音声符号化
方法の固定コードブック探索処理においてコードブック
の探索箇所を絞り込む絞り込み探索アプローチ処理と代
数コードブックのパルス位置を探索するパルス位置探索
処理を分離することにより、固定コードブック探索処理
をDSP等の信号処理用LSIで実現する場合に必要と
なるアドレスポインタ数を低減することができ、アドレ
ス発生に伴うアドレスポインタの内容の退避、復帰処理
が減少することから、アドレス発生に関する演算量の増
加を抑えることが可能となる。
According to this method, in the fixed codebook search processing of the ACELP speech coding method, the narrowing search approach processing for narrowing the codebook search location and the pulse position search processing for searching the pulse position of the algebraic codebook are separated. Therefore, the number of address pointers required when the fixed codebook search process is realized by a signal processing LSI such as a DSP can be reduced, and the process of saving and restoring the contents of the address pointer due to the address generation is reduced. In addition, it is possible to suppress an increase in the amount of operation related to address generation.

【0041】本発明の請求項2記載の音声符号化装置
は、あるフレーム長の音声信号に対し線形予測分析を行
い短期合成フィルタを生成する線形予測分析手段と、音
声信号に対し聴覚重み付けを行い聴覚重み付き音声信号
を生成する聴覚重み付け手段と、聴覚重み付き音声信号
を基に長期合成フィルタを生成する適応コードブック探
索手段と、短期合成フィルタによる短期予測寄与分と長
期合成フィルタによる長期予測寄与分を音声信号より減
算した残差信号を基に残差信号と再生音声信号の平均自
乗誤差が最小となるように代数コードブックの探索を行
う固定コードブック探索手段とを備えた音声符号化装置
であり、固定コードブック探索手段が、代数コードブッ
クの探索方法を制御するしきい値の計算を行うしきい値
計算手段と、しきい値を基に代数コードブックの探索箇
所を絞り込む絞り込み探索アプローチ手段と、絞り込み
探索アプローチ手段の結果を基に代数コードブックの探
索を行うパルス位置探索手段とを備えたことを特徴とす
る。
According to a second aspect of the present invention, there is provided a speech encoding apparatus for performing linear prediction analysis on a speech signal having a certain frame length to generate a short-term synthesis filter, and performing auditory weighting on the speech signal. Perceptual weighting means for generating a perceptually weighted speech signal, adaptive codebook search means for generating a long-term synthesis filter based on the perceptually weighted speech signal, short-term prediction contribution by a short-term synthesis filter, and long-term prediction contribution by a long-term synthesis filter A fixed codebook search means for searching for an algebraic codebook so as to minimize the mean square error between the residual signal and the reproduced audio signal based on the residual signal obtained by subtracting the minutes from the audio signal. A fixed codebook searching means for calculating a threshold value for controlling a method of searching an algebraic codebook; Characterized by comprising a narrowing search approach means to narrow down the search portion of the algebraic codebooks based on, and a pulse position search means for performing a search of the algebraic codebook based on the result of narrowing the search approach means.

【0042】この構成によると、ACELP音声符号化
方法の固定コードブック探索処理においてコードブック
の探索箇所を絞り込む絞り込み探索アプローチ処理と代
数コードブックのパルス位置を探索するパルス位置探索
処理を分離することにより、固定コードブック探索処理
をDSP等の信号処理用LSIで実現する場合に必要と
なるアドレスポインタ数を低減することができ、アドレ
ス発生に伴うアドレスポインタの内容の退避、復帰処理
が減少することから、アドレス発生に関する演算量の増
加を抑えることが可能となる。
According to this configuration, in the fixed codebook search processing of the ACELP speech coding method, the narrowing search approach processing for narrowing the codebook search location and the pulse position search processing for searching the pulse position of the algebraic codebook are separated. Therefore, the number of address pointers required when the fixed codebook search process is realized by a signal processing LSI such as a DSP can be reduced, and the process of saving and restoring the contents of the address pointer due to the address generation is reduced. In addition, it is possible to suppress an increase in the amount of operation related to address generation.

【0043】本発明の請求項3記載の音声符号化装置
は、あるフレーム長の音声信号に対し線形予測分析を行
い短期合成フィルタを生成する線形予測分析処理部と、
音声信号に対し聴覚重み付けを行い聴覚重み付き音声信
号を生成する聴覚重み付け処理部と、聴覚重み付き音声
信号を基に長期合成フィルタを生成する適応コードブッ
ク探索処理部と、短期合成フィルタによる短期予測寄与
分と長期合成フィルタによる長期予測寄与分を音声信号
より減算した残差信号を基に残差信号と再生音声信号の
平均自乗誤差が最小となるように代数コードブックの探
索を行う固定コードブック探索処理部とを備えた音声符
号化装置であり、固定コードブック探索処理部が、代数
コードブックの探索方法を制御するしきい値の計算を行
うしきい値計算処理部と、しきい値を基に代数コードブ
ックの探索箇所を絞り込む絞り込み探索アプローチ処理
部と、絞り込み探索アプローチ処理部で絞り込まれた代
数コードブックの探索箇所に関する情報を保存するコー
ドブック探索箇所情報格納用メモリと、コードブック探
索箇所情報格納用メモリに保存された情報を基に代数コ
ードブックの探索を行うパルス位置探索処理部とを備え
たことを特徴とする。
According to a third aspect of the present invention, there is provided a speech encoding apparatus for performing a linear prediction analysis on a speech signal having a certain frame length to generate a short-term synthesis filter;
An auditory weighting processor that generates an auditory weighted audio signal by performing auditory weighting on an audio signal, an adaptive codebook search processor that generates a long-term synthesis filter based on the auditory weighted audio signal, and a short-term prediction using a short-term synthesis filter A fixed codebook that searches the algebraic codebook so that the mean square error between the residual signal and the reproduced audio signal is minimized based on the residual signal obtained by subtracting the contribution and the long-term prediction contribution from the long-term synthesis filter from the audio signal. A fixed codebook search processing unit for calculating a threshold value for controlling a method of searching for an algebraic codebook; A narrowing search approach processing unit that narrows the search location of the algebraic codebook based on the algebraic codebook based on the algebraic codebook narrowed down by the narrowing search approach processing unit A codebook search location information storage memory for storing information related to a search location; and a pulse position search processing unit for searching for an algebraic codebook based on the information stored in the codebook search location information storage memory. It is characterized by.

【0044】この構成によると、ACELP音声符号化
方法の固定コードブック探索処理においてコードブック
の探索箇所を絞り込む絞り込み探索アプローチ処理と代
数コードブックのパルス位置を探索するパルス位置探索
処理を分離することにより、固定コードブック探索処理
をDSP等の信号処理用LSIで実現する場合に必要と
なるアドレスポインタ数を低減することができ、アドレ
ス発生に伴うアドレスポインタの内容の退避、復帰処理
が減少することから、アドレス発生に関する演算量の増
加を抑えることが可能となる。
According to this configuration, in the fixed codebook search processing of the ACELP speech coding method, the narrow search approach processing for narrowing the codebook search location and the pulse position search processing for searching the pulse position of the algebraic codebook are separated. Therefore, the number of address pointers required when the fixed codebook search process is realized by a signal processing LSI such as a DSP can be reduced, and the process of saving and restoring the contents of the address pointer due to the address generation is reduced. In addition, it is possible to suppress an increase in the amount of operation related to address generation.

【0045】また、本発明の媒体は、コンピュータに請
求項1記載の音声符号化方法を実現する各手段を実行さ
せるプログラムを記録したものである。この構成による
と、この媒体を用いてコンピュータを動作させると、請
求項1と同様な作用効果を達成することができる。
Further, the medium of the present invention stores a program for causing a computer to execute each means for realizing the voice encoding method according to the first aspect. According to this configuration, when the computer is operated using the medium, the same operation and effect as those of the first aspect can be achieved.

【0046】[0046]

【発明の実施の形態】以下、本発明の実施の形態につい
て、図1、図2および図3を用いて説明する。 (第1の実施の形態)以下、本発明の第1の実施の形態
について、図1および図2を参照しながら説明する。
DESCRIPTION OF THE PREFERRED EMBODIMENTS Embodiments of the present invention will be described below with reference to FIGS. (First Embodiment) Hereinafter, a first embodiment of the present invention will be described with reference to FIGS.

【0047】図1は本発明の第1の実施の形態における
ACELP音声符号化方法における固定コードブック探
索手段100の基本構成を示すブロック図である。図1
において、101は代数コードブックの探索方法を制御
するしきい値の計算を行うしきい値計算手段、102は
しきい値を基に代数コードブックの探索箇所を絞り込む
絞り込み探索アプローチ手段、103は絞り込み探索ア
プローチ手段の結果を基に代数コードブックの探索を行
うパルス位置探索手段である。
FIG. 1 is a block diagram showing a basic configuration of the fixed codebook search means 100 in the ACELP speech coding method according to the first embodiment of the present invention. FIG.
, 101 is a threshold value calculating means for calculating a threshold value for controlling a search method of an algebraic codebook, 102 is a narrowing-down search approach means for narrowing down a search location of an algebraic codebook based on a threshold value, and 103 is a narrowing-down search approach means. Pulse position searching means for searching the algebraic codebook based on the result of the search approach means.

【0048】図2は本発明の第1の実施の形態のACE
LP音声符号化方法における固定コードブック探索処理
の処理フローを示したフローチャートである。なお、こ
の実施の形態で示すしきい値計算手段101、絞り込み
探索アプローチ手段102およびパルス位置探索手段1
03の前段の処理は従来と同様の処理方法で処理が行わ
れ、この実施の形態で扱う各データは用意されているも
のとする。また、この実施の形態では、探索する代数コ
ードブックのパルス数が4本であるものとする。
FIG. 2 shows an ACE according to the first embodiment of the present invention.
It is the flowchart which showed the processing flow of the fixed codebook search processing in an LP audio | voice coding method. It should be noted that the threshold value calculating means 101, the narrow-down search approach means 102, and the pulse position searching means 1 shown in this embodiment
It is assumed that the processing of the preceding stage of 03 is performed by the same processing method as the conventional one, and each data handled in this embodiment is prepared. Further, in this embodiment, it is assumed that the number of pulses of the algebraic codebook to be searched is four.

【0049】図2に示すように、この実施の形態におい
ては、まずしきい値計算手段101のステップ200に
おいて(数6)に示したしきい値thresを算出す
る。ここで、maxは最初の3パルスによる相関値の絶
対値の最大値、aveは最初の3パルスによる相関値の
平均値、Kは0≦K≦1の定数を示す。つぎに、絞り込
み探索アプローチ手段102に移り、最後の第4パルス
位置を探索するための第1、第2、第3パルス位置をし
きい値thresを用いて予備選択する。絞り込み探索
アプローチ手段102では、1本逐次的に第1、第2、
第3のパルス位置の探索を行い、ステップ204で(数
15)に示す相関値Cを算出する。なお、ステップ20
1は第1パルス位置m0 探索ループスタートステップで
あり、ステップ202は第2パルス位置m1 探索ループ
スタートステップであり、ステップ203は第3パルス
位置m2 探索ループスタートステップである。
As shown in FIG. 2, in this embodiment, first, in step 200 of the threshold value calculating means 101, the threshold value thres shown in (Equation 6) is calculated. Here, max is the maximum absolute value of the correlation values of the first three pulses, ave is the average of the correlation values of the first three pulses, and K is a constant of 0 ≦ K ≦ 1. Next, the process proceeds to the narrowing-down search approach means 102, and first, second, and third pulse positions for searching for the last fourth pulse position are preliminarily selected using the threshold value thres. In the narrowing-down search approach means 102, the first, second,
A search for the third pulse position is performed, and a correlation value C shown in (Equation 15) is calculated in step 204. Step 20
1 is a first pulse position m 0 search loop start step, step 202 is a second pulse position m 1 search loop start step, and step 203 is a third pulse position m 2 search loop start step.

【0050】[0050]

【数15】 (Equation 15)

【0051】ここで、d[ ]は入力音声信号から短期
予測寄与分および長期予測寄与分を減じた残差信号と聴
覚重み付き合成フィルタのインパルス応答との相関信
号、m i はi番目のパルス位置、si はその振幅を示
す。つぎに、ステップ205において、ステップ200
で算出したしきい値thresと相関値Cを比較する。
そして、相関値Cがしきい値thres以下である場合
には、つぎのパルス位置に対して探索を行う(ステップ
209,210,211)。また、相関値Cがしきい値
thresよりも大きい場合は、ステップ206に移
り、そのときの第1、第2、第3パルス位置m0
1 ,m2 および相関値Cを保存する。そして、第1か
ら第3パルス位置を選択し保存した回数をカウントする
カウンタが、第4パルス位置の探索を行う回数の上限で
ある最大探索回数以上であれば絞り込み探索アプローチ
手段102を終了する。また、カウンタが最大探索回数
よりも小さい場合には、ステップ208においてカウン
タを1インクリメントし、次のパルス位置に対して探索
を行う。絞り込み探索アプローチ手段102では、上記
一連の処理をカウンタが最大探索回数以上になるか、ま
たは探索すべき全ての第1、第2、第3パルス位置の探
索が終了するまで繰り返す。なお、ステップ209は第
3パルス位置探索ループ終了ステップであり、ステップ
210は第2パルス位置探索ループ終了ステップであ
り、ステップ211は第1パルス位置探索ループ終了ス
テップである。
Here, d [] is a short term from the input voice signal.
The residual signal and the acoustic signal with the predicted contribution and the long-term predicted contribution reduced
Correlation Signal with Impulse Response of Perceptually Weighted Synthesis Filter
Number, m iIs the i-th pulse position, siIndicates its amplitude
You. Next, in step 205, step 200
The threshold value thres calculated in the above is compared with the correlation value C.
When the correlation value C is equal to or smaller than the threshold thres
Search for the next pulse position (step
209, 210, 211). The correlation value C is a threshold
If it is larger than thres, the process proceeds to step 206.
And the first, second, and third pulse positions m at that time.0,
m1, MTwoAnd the correlation value C are stored. And the first
Counts the number of times the third pulse position is selected and saved
At the upper limit of the number of times the counter searches for the fourth pulse position
If more than a certain maximum number of searches, narrow search approach
The means 102 ends. Also, the counter is the maximum number of searches
If it is less than
Increment by 1 and search for the next pulse position
I do. In the narrowing search approach means 102, the above
A series of processing is performed until the counter exceeds the maximum number of searches.
Or search for all first, second and third pulse positions to be searched.
Repeat until the search is finished. Step 209 is the
3 pulse position search loop end step
210 is a second pulse position search loop end step.
Step 211 is the end of the first pulse position search loop.
This is Tep.

【0052】つぎに、パルス位置探索手段103に移
る。パルス位置探索手段103では、まずステップ21
3において(数16)に示す絞り込み探索アプローチ手
段102で選択した第1、第2、第3パルス位置に関す
るエネルギーE1を算出する。
Next, the operation proceeds to the pulse position searching means 103. In the pulse position searching means 103, first, in step 21
In step 3, the energy E1 relating to the first, second, and third pulse positions selected by the narrowing-down search approach means 102 shown in (Expression 16) is calculated.

【0053】[0053]

【数16】 (Equation 16)

【0054】ここで、Φ′は(数2)に示す聴覚重み付
き合成フィルタのインパルス応答の相関を含む行列Φに
前記相関信号d[ ]の極性情報を付加したものを示
し、m 0 ,m1 ,m2 は絞り込み探索アプローチ手段1
02で選択した第1、第2、第3パルス位置を示す。ま
た、C1にパルス位置が前記m0 〜m2 である第1、第
2、第3パルスによる相関値Cを読み出す。
Here, Φ ′ is the auditory weighting shown in (Equation 2)
Matrix Φ containing the correlation of the impulse response of the synthesis filter
Indicates that the polarity information of the correlation signal d [] is added.
Then m 0, M1, MTwoIs a narrow search approach 1
02 indicates the first, second, and third pulse positions selected. Ma
Also, the pulse position at C1 is m0~ MTwoThe first and second
2. Read the correlation value C by the third pulse.

【0055】上記の(数16)のΦ′と(数2)のΦと
の関係は、 Φ′(i,j)=sign〔d[i]〕・sign〔d[j]〕
・Φ(i,j) (i=0,1,…,n−1) ここで、sign〔X〕は変数Xの極性(+または−)を表
す。なお、ステップ212は、コードブック探索ループ
スタートステップである。
The relationship between Φ ′ in (Equation 16) and Φ in (Equation 2) is as follows: Φ ′ (i, j) = sign [d [i]] · sign [d [j]]
Φ (i, j) (i = 0, 1,..., N−1) Here, sign [X] represents the polarity (+ or −) of the variable X. Step 212 is a codebook search loop start step.

【0056】そして、第4パルス位置m3 探索ループス
タートステップ214から第4パルス位置の探索をスタ
ートし、ステップ215で(数17)、(数18)に示
すエネルギーE2および相関値C2を算出する。
Then, the search for the fourth pulse position is started from the fourth pulse position m 3 search loop start step 214, and the energy E2 and the correlation value C2 shown in (expression 17) and (expression 18) are calculated in step 215. .

【0057】[0057]

【数17】 [Equation 17]

【0058】[0058]

【数18】 (Equation 18)

【0059】ここで、m3 は第4パルス位置、s3 はそ
の振幅を示す。そして、ステップ216において(数
3)に示す式を最大にする最適パルス位置を探索するた
めに、C22 ・Emax とCmax ・E2の比較を行う。C
max 、E max はそれぞれ最適パルスによる相関値および
エネルギーである。ここで、Cma x ・E2がC22 ・E
max 以上である場合には、次のパルス位置に対して探索
を行う。逆に、Cmax ・E2がC22 ・Emax より小さ
い場合には、ステップ217においてそのときの全パル
ス位置m0 、m1 、m2 、m3 を最適パルス位置とし
て、またC22 、E2を最適パルスによる相関値および
エネルギーとして保存更新し、つぎのパルス位置に対し
て探索を行う。ステップ218は第4パルス1探索ルー
プエンドステップを示している。
Here, mThreeIs the fourth pulse position, sThreeHaso
Shows the amplitude of Then, in step 216, (number
Search for the optimal pulse position that maximizes the expression shown in 3)
In order, C2Two・ EmaxAnd Cmax・ Compare E2. C
max, E maxAre the correlation value by the optimal pulse and
Energy. Where Cma x・ E2 is C2Two・ E
maxIf so, search for the next pulse position
I do. Conversely, Cmax・ E2 is C2Two・ EmaxSmaller
If not, in step 217, the
Position m0, M1, MTwo, MThreeIs the optimal pulse position
And C2 againTwo, E2 are the correlation values by the optimal pulse and
Save and update as energy, and for the next pulse position
To search. Step 218 is the fourth pulse1Search Lou
Shows the pre-end step.

【0060】そして、第4パルス位置の全探索が終了し
たら、絞り込み探索アプローチ手段102で選択された
つぎの第1から第3パルス位置m0 、m1 、m2 に対し
て同様に第4パルス位置の探索を行う。パルス位置探索
手段103では、上記一連の処理を絞り込み探索アプロ
ーチ手段102で選択した全パルス位置に対して行う。
When the entire search for the fourth pulse position is completed, the fourth pulse position is similarly set for the next first to third pulse positions m 0 , m 1 , and m 2 selected by the narrow-down search approach means 102. Perform a location search. The pulse position searching means 103 performs the above-described series of processing for all the pulse positions selected by the narrowing search approach means 102.

【0061】ここで、上記処理をDSP等の信号処理用
LSIで実現する場合、絞り込み探索アプローチ手段1
02において扱うデータはd[m0 ]、d[m1 ]、d
[m 2 ]のみであり、必要となるアドレスポインタは、
前記d[m0 ]〜d[m2 ]を扱う3本と、パルス位置
等の保存を行うために使用する1本の計4本である。ま
た、パルス位置探索手段103において必要なアドレス
ポインタは、第4パルス位置探索時にΦ′(m3
3 )、Φ′(m0 ,m3 )、Φ′(m1 ,m3 )、
Φ′(m2 ,m3 )およびd[m3 ]を扱うための計5
本である。なお、パルス位置探索手段103でエネルギ
ーE1を算出する際に扱うΦ′(m0 ,m0 )〜Φ′
(m1 ,m2 )については、前述の5本のアドレスポイ
ンタと共用可能であり、新たにアドレスポインタが必要
となることは無い。
Here, the above processing is performed for signal processing of a DSP or the like.
In the case of realizing by LSI, narrowing search approach means 1
02 is d [m0], D [m1], D
[M Two], And the required address pointer is
The d [m0] To d [mTwo] And pulse position
, Etc., which are used for storing the data, etc. Ma
Also, the address required in the pulse position searching means 103
The pointer indicates Φ ′ (mThree,
mThree), Φ '(m0, MThree), Φ '(m1, MThree),
Φ '(mTwo, MThree) And d [mThree5]
It is a book. Note that the pulse position searching means 103
Φ '(m0, M0) ~ Φ '
(M1, MTwo)), The above five address points
Address pointer and a new address pointer is required.
It does not become.

【0062】以上のように、この実施の形態によれば、
固定コードブック探索処理時に必要なアドレスポインタ
は5本のみであり、アドレスポインタを5本以上備えた
DSPを用いて処理をさせる場合には、アドレスポイン
タの内容の退避、復帰を一度も行う必要が無く、アドレ
ス発生に関する演算量の増加を引き起こさない。また、
例え5本未満のアドレスポインタしか備えていないDS
Pを用いて処理をさせる場合においても、アドレスポイ
ンタの内容の退避、復帰を必要とする回数が従来と比較
して減少するため、アドレス発生に関する演算量の増加
を抑えることが可能となる。
As described above, according to this embodiment,
Only five address pointers are required at the time of the fixed codebook search processing. When processing is performed using a DSP having five or more address pointers, it is necessary to save and restore the contents of the address pointers at least once. And does not cause an increase in the amount of operation related to address generation. Also,
DS with less than 5 address pointers
Even when processing is performed using P, the number of times that the contents of the address pointer need to be saved and restored is reduced as compared with the related art, so that it is possible to suppress an increase in the amount of operation related to address generation.

【0063】(第2の実施の形態)以下、本発明の第2
の実施の形態について、図3を参照しながら説明する。
図3は本発明の第2の実施の形態を示すブロック構成図
である。図3において、301は絞り込み探索アプロー
チ処理で使用するしきい値を計算するしきい値計算処理
部、302はしきい値を基にコードブックの探索箇所を
絞り込む絞り込み探索アプローチ処理部、303は絞り
込み探索アプローチ処理部302で絞り込まれたコード
ブックの探索箇所に関する情報を保存するコードブック
探索箇所情報格納用メモリ、304は絞り込み探索アプ
ローチ処理部302で絞り込まれたコードブック探索箇
所をコードブック探索箇所情報格納用メモリ303に保
存された情報を基に探索するパルス位置探索処理部であ
る。なお、この実施の形態で示すしきい値計算処理部3
01、絞り込み探索アプローチ処理部302およびパル
ス位置探索処理部304の前段の処理は従来と同様の処
理方法で処理が行われ、この実施の形態で扱う各データ
は用意されているものとする。
(Second Embodiment) Hereinafter, a second embodiment of the present invention will be described.
The embodiment will be described with reference to FIG.
FIG. 3 is a block diagram showing a second embodiment of the present invention. In FIG. 3, reference numeral 301 denotes a threshold value calculation processing unit that calculates a threshold value used in the narrowing down search approach process, 302 denotes a narrowing down search approach processing unit that narrows down a code book search location based on the threshold value, and 303 denotes a narrowing down search approach unit. A codebook search location information storage memory for storing information related to codebook search locations narrowed down by the search approach processing unit 302, and a codebook search location information 304 indicating codebook search locations narrowed down by the narrow search approach processing unit 302. A pulse position search processing unit that searches based on information stored in the storage memory 303. The threshold value calculation processing unit 3 shown in this embodiment
01, the processing at the preceding stage of the narrowing-down search approach processing unit 302 and the pulse position search processing unit 304 is performed by the same processing method as in the related art, and it is assumed that each data handled in this embodiment is prepared.

【0064】また、この実施の形態では、探索する代数
コードブックのパルス数が4本であるものとし、以下に
その処理形態を述べる。まず、しきい値計算処理部30
1において、(数6)に示したしきい値thresを算
出する。ここで、maxは最初の3パルスによる相関値
の絶対値の最大値、aveは最初の3パルスによる相関
値の平均値、Kは0≦K≦1の定数を示す。つぎに絞り
込み探索アプローチ処理部302において、最後の第4
パルス位置を探索するための第1、第2、第3パルス位
置をしきい値thresを用いて予備選択する。絞り込
み探索アプローチ処理部302では、1本逐次的に第
1、第2、第3のパルス位置の探索を行い、まず(数1
5)に示した相関値Cを算出する。
In this embodiment, it is assumed that the number of pulses of the algebraic codebook to be searched is four, and the processing form will be described below. First, the threshold calculation unit 30
In step 1, the threshold value thres shown in (Equation 6) is calculated. Here, max is the maximum absolute value of the correlation values of the first three pulses, ave is the average of the correlation values of the first three pulses, and K is a constant of 0 ≦ K ≦ 1. Next, in the narrowed-down search approach processing unit 302, the last fourth
First, second, and third pulse positions for searching for pulse positions are preliminarily selected using the threshold value thres. The narrow-down search approach processing unit 302 sequentially searches the first, second, and third pulse positions one by one, and first, (Equation 1)
The correlation value C shown in 5) is calculated.

【0065】ここで、d[ ]は入力音声信号から短期
予測寄与分および長期予測寄与分を減じた残差信号と、
聴覚重み付き合成フィルタのインパルス応答との相関信
号、mi はi番目のパルス位置、si はその振幅を示
す。つぎに、しきい値計算処理部301で算出したしき
い値thresと相関値Cを比較する。そして、相関値
Cがしきい値thres以下である場合には、次のパル
ス位置に対して探索を行う。また、相関値Cがしきい値
thresよりも大きい場合は、そのときの第1、第
2、第3パルス位置m0 、m1 、m2 および相関値Cを
コードブック探索箇所情報格納用メモリ303に保存す
る。そして、第1〜第3パルス位置を選択し保存した回
数が、第4パルス位置の探索を行う回数の上限である最
大探索回数以上であれば絞り込み探索アプローチ処理を
終了する。また第1〜第3パルス位置を選択し保存した
回数が最大探索回数よりも小さい場合には、つぎのパル
ス位置に対して探索を行う。絞り込み探索アプローチ処
理部302では、上記一連の処理を第1〜第3パルス位
置を選択し保存した回数が最大探索回数以上になるか、
または探索すべき全ての第1、第2、第3パルス位置の
探索が終了するまで繰り返す。つぎにパルス位置探索処
理部304に移る。パルス位置探索処理部304では、
まずコードブック探索箇所情報格納用メモリ303に保
存された情報を基に(数16)に示した絞り込み探索ア
プローチ処理部302で選択した第1、第2、第3パル
ス位置に関するエネルギーE1を算出する。
Here, d [] is the residual signal obtained by subtracting the short-term prediction contribution and the long-term prediction contribution from the input speech signal,
Correlation signal with the impulse response of the perceptually weighted synthesis filter, m i is the i th pulse position, s i represents the amplitude. Next, the threshold value thres calculated by the threshold value calculation processing unit 301 is compared with the correlation value C. When the correlation value C is equal to or smaller than the threshold value thres, a search is performed for the next pulse position. If the correlation value C is larger than the threshold value thres, the first, second, and third pulse positions m 0 , m 1 , and m 2 and the correlation value C at that time are stored in the codebook search location information storage memory. 303. If the number of times the first to third pulse positions have been selected and stored is equal to or greater than the maximum number of times of searching for the fourth pulse position, the narrowed search approach process is terminated. If the number of times the first to third pulse positions are selected and stored is smaller than the maximum number of searches, the search is performed for the next pulse position. The refined search approach processing unit 302 determines whether the number of times that the above series of processing has selected and stored the first to third pulse positions is equal to or greater than the maximum number of searches,
Alternatively, the process is repeated until the search for all the first, second, and third pulse positions to be searched is completed. Next, the process proceeds to the pulse position search processing unit 304. In the pulse position search processing unit 304,
First, based on the information stored in the codebook search location information storage memory 303, the energy E1 relating to the first, second, and third pulse positions selected by the narrowing search approach processing unit 302 shown in (Equation 16) is calculated. .

【0066】ここで、Φ′は(数2)に示す聴覚重み付
き合成フィルタのインパルス応答の相関を含む行列Φに
前記相関信号d[ ]の極性情報を付加したもの、
0 、m 1 、m2 は絞り込み探索アプローチ処理部30
2で選択した第1、第2、第3パルス位置を示す。また
C1にパルス位置が前記m0 〜m2 である第1、第2、
第3パルスによる相関値Cをコードブック探索箇所情報
格納用メモリ303から読み出す。そして第4パルス位
置の探索をスタートし、(数17)、(数18)に示す
エネルギーE2および相関値C2を算出する。
Here, Φ ′ is the auditory weight given by (Equation 2)
Matrix Φ containing the correlation of the impulse response of the synthesis filter
A signal obtained by adding polarity information of the correlation signal d [],
m0, M 1, MTwoIs the narrow search approach processing unit 30
2 shows the first, second, and third pulse positions selected. Also
The pulse position at C1 is m0~ MTwoThe first, second,
Correlation value C by the third pulse is used as codebook search location information
The data is read from the storage memory 303. And the fourth pulse
Start the search for the position, as shown in (Equation 17) and (Equation 18)
The energy E2 and the correlation value C2 are calculated.

【0067】ここで、m3 は第4パルス位置、s3 はそ
の振幅を示す。そして、(数3)に示す式を最大にする
最適パルス位置を探索するために、C22 ・Emax とC
max ・E2の比較を行う。Cmax 、Emax はそれぞれ最
適パルスによる相関値およびエネルギーである。ここ
で、Cmax ・E2がC22 ・Ema x 以上である場合に
は、つぎのパルス位置に対して探索を行う。逆に、C
max ・E2がC22 ・Emax より小さい場合には、その
ときの全パルス位置m0 、m1、m2 、m3 を最適パル
ス位置として、またC22 、E2を最適パルスによる相
関値およびエネルギーとして保存更新し、つぎのパルス
位置に対して探索を行う。
Here, m 3 is the fourth pulse position, and s 3 is its amplitude. Then, to search for the optimal pulse position that maximizes the equation shown in equation (3), C2 2 · E max and C
Compare max · E2. C max and E max are respectively the correlation value and the energy by the optimum pulse. Here, when C max · E2 is C2 2 · E ma x above, to search against the next pulse position. Conversely, C
When max · E2 is smaller than C2 2 · E max , all the pulse positions m 0 , m 1 , m 2 , and m 3 at that time are set as optimum pulse positions, and C2 2 and E2 are set as correlation values by the optimum pulse and The energy is stored and updated, and the next pulse position is searched.

【0068】そして、第4パルス位置の全探索が終了し
たら、絞り込み探索アプローチ処理部302で選択され
たつぎの第1〜第3パルス位置m0 、m1 、m2 に対し
て同様に第4パルス位置の探索を行う。パルス位置探索
処理部304では、上記一連の処理を絞り込み探索アプ
ローチ処理部302で選択した全パルス位置に対して行
う。
When the full search for the fourth pulse position is completed, the fourth to third pulse positions m 0 , m 1 , and m 2 selected by the narrow search approach processing unit 302 are similarly processed. Search for the pulse position. The pulse position search processing unit 304 performs the above-described series of processing for all the pulse positions selected by the narrowing search approach processing unit 302.

【0069】ここで、上記各処理部をDSP等の信号処
理用LSIで実現した場合、絞り込み探索アプローチ処
理部302において扱うデータはd[m0 ]、d
[m1 ]、d[m2 ]のみであり、必要となるアドレス
ポインタは、前記d[m0 ]〜d[m2 ]を扱う3本
と、パルス位置等の情報をコードブック探索箇所情報格
納用メモリ303に保存するために使用する1本の計4
本である。また、パルス位置探索処理部304において
必要なアドレスポインタは、第4パルス位置探索時に
Φ′(m3 ,m3 )、Φ′(m0 ,m3 )、Φ′
(m1 ,m3 )、Φ′(m2 ,m 3 )およびd[m3
を扱うための計5本である。なお、パルス位置探索処理
部304でエネルギーE1を算出する際に扱うΦ′(m
0 ,m0 )〜Φ′(m1 ,m2 )については、前述の5
本のアドレスポインタと共用可能であり、新たにアドレ
スポインタが必要となることは無い。
Here, each of the above processing units is processed by a signal processor such as a DSP.
In the case of realizing with a LSI, a narrow search approach
The data handled by the processing unit 302 is d [m0], D
[M1], D [mTwo] Is the only required address
The pointer is the d [m0] To d [mTwo] To handle three
And information such as pulse position
One total of 4 used to save in the delivery memory 303
It is a book. In the pulse position search processing unit 304,
The necessary address pointer is used when searching for the fourth pulse position.
Φ '(mThree, MThree), Φ '(m0, MThree), Φ '
(M1, MThree), Φ '(mTwo, M Three) And d [mThree]
There are a total of five cables to handle. The pulse position search processing
Φ ′ (m
0, M0) ~ Φ '(m1, MTwo) For 5
It can be shared with the address pointer of a book, and a new address
No pointer is needed.

【0070】以上のように、この実施の形態によれば、
固定コードブック探索処理時に必要なアドレスポインタ
は5本のみであり、アドレスポインタを5本以上備えた
DSPを用いて処理をさせる場合には、アドレスポイン
タの内容の退避、復帰を一度も行う必要が無く、アドレ
ス発生に関する演算量の増加を引き起こさない。また、
例え5本未満のアドレスポインタしか備えていないDS
Pを用いて処理をさせる場合においても、アドレスポイ
ンタの内容の退避、復帰を必要とする回数が従来と比較
して減少するため、アドレス発生に関する演算量の増加
を抑えることが可能となる。
As described above, according to this embodiment,
Only five address pointers are required at the time of the fixed codebook search processing. When processing is performed using a DSP having five or more address pointers, it is necessary to save and restore the contents of the address pointers at least once. And does not cause an increase in the amount of operation related to address generation. Also,
DS with less than 5 address pointers
Even when processing is performed using P, the number of times that the contents of the address pointer need to be saved and restored is reduced as compared with the related art, so that it is possible to suppress an increase in the amount of operation related to address generation.

【0071】なお、本発明は、記録媒体へも適用でき
る。すなわち、この媒体は、コンピュータに前述の第1
の実施の形態の音声符号化方法を実現する各手段をコン
ピュータに実行させるプログラムを記録したものであ
る。この構成によると、この媒体を用いてコンピュータ
を動作させると、請求項1と同様な作用効果を達成する
ことができる。
The present invention can be applied to a recording medium. That is, this medium is stored in the computer in the first format.
A program for causing a computer to execute each means for realizing the speech encoding method according to the embodiment is recorded. According to this configuration, when the computer is operated using the medium, the same operation and effect as those of the first aspect can be achieved.

【0072】[0072]

【発明の効果】以上のように、本発明によれば、ACE
LP音声符号化方法の固定コードブック探索処理におい
てコードブックの探索箇所を絞り込む絞り込み探索アプ
ローチ処理と代数コードブックのパルス位置を探索する
パルス位置探索処理を分離することにより、固定コード
ブック探索処理をDSP等の信号処理用LSIで実現す
る場合に必要となるアドレスポインタ数を低減すること
ができ、アドレス発生に伴うアドレスポインタの内容の
退避、復帰処理が減少することから、アドレス発生に関
する演算量の増加を抑えることが可能となる。
As described above, according to the present invention, the ACE
In the fixed codebook search processing of the LP speech encoding method, the fixed codebook search processing is performed by the DSP by separating the narrow search search processing for narrowing the codebook search location and the pulse position search processing for searching the pulse position of the algebraic codebook. The number of address pointers required in the case of realizing with a signal processing LSI such as the above can be reduced, and the number of operations for saving and restoring the contents of the address pointer due to the generation of the address is reduced. Can be suppressed.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の第1の実施の形態の音声符号化装置に
おける固定コードブック探索手段の基本的な構成を示す
ブロック図である。
FIG. 1 is a block diagram illustrating a basic configuration of a fixed codebook search unit in a speech encoding device according to a first embodiment of the present invention.

【図2】本発明の第1の実施の形態の音声符号化装置に
おける固定コードブック探索の処理を示すフローチャー
トである。
FIG. 2 is a flowchart showing a fixed codebook search process in the speech encoding device according to the first embodiment of the present invention.

【図3】本発明の第2の実施の形態の音声符号化装置に
おける固定コードブック探索処理部の構成を示すブロッ
ク図である。
FIG. 3 is a block diagram illustrating a configuration of a fixed codebook search processing unit in a speech encoding device according to a second embodiment of the present invention.

【図4】従来の固定コードブック探索処理フローを示す
フローチャートである。
FIG. 4 is a flowchart showing a conventional fixed codebook search processing flow.

【符号の説明】[Explanation of symbols]

100 固定コードブック探索手段 101 しきい値計算手段 102 絞り込み探索アプローチ手段 103 パルス位置探索手段 200〜219 処理の各ステップ 300 固定コードブック探索処理部 301 しきい値計算処理部 302 絞り込み探索アプローチ処理部 303 コードブック探索箇所情報格納用メモリ 304 パルス位置探索処理部 400〜417 処理の各ステップ 418 絞り込み探索アプローチ・パルス位置探索手段 REFERENCE SIGNS LIST 100 Fixed codebook search means 101 Threshold calculation means 102 Narrow search approach means 103 Pulse position search means 200 to 219 Each step of processing 300 Fixed codebook search processing unit 301 Threshold calculation processing unit 302 Narrow search approach processing unit 303 Codebook search location information storage memory 304 Pulse position search processing unit 400 to 417 Each step of processing 418 Narrowing search approach / pulse position search means

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】 あるフレーム長の音声信号に対し線形予
測分析を行い短期合成フィルタを生成し、前記音声信号
に対し聴覚重み付けを行い聴覚重み付き音声信号を生成
し、前記聴覚重み付き音声信号を基に長期合成フィルタ
を生成し、前記短期合成フィルタによる短期予測寄与分
と前記長期合成フィルタによる長期予測寄与分を前記音
声信号より減算した残差信号を基に前記残差信号と再生
音声信号の平均自乗誤差が最小となるように代数コード
ブックの探索を行う音声符号化方法であって、 前記代数コードブックの探索方法を制御するしきい値の
計算を行い、前記しきい値を基に前記代数コードブック
の探索箇所を絞り込み、絞り込みの結果を基に代数コー
ドブックの探索を行うことを特徴とする音声符号化方
法。
1. A short-term synthesis filter is generated by performing a linear prediction analysis on an audio signal of a certain frame length, an auditory weight is applied to the audio signal to generate an auditory weighted audio signal, and the audio signal with an auditory weight is generated. A long-term synthesis filter is generated based on the residual signal obtained by subtracting the short-term prediction contribution by the short-term synthesis filter and the long-term prediction contribution by the long-term synthesis filter from the audio signal. A speech coding method for searching for an algebraic codebook so that a mean square error is minimized, comprising calculating a threshold value for controlling a search method for the algebraic codebook, and based on the threshold value. A speech coding method characterized by narrowing down a search location of an algebraic codebook and searching for an algebraic codebook based on a result of the narrowing down.
【請求項2】 あるフレーム長の音声信号に対し線形予
測分析を行い短期合成フィルタを生成する線形予測分析
手段と、前記音声信号に対し聴覚重み付けを行い聴覚重
み付き音声信号を生成する聴覚重み付け手段と、前記聴
覚重み付き音声信号を基に長期合成フィルタを生成する
適応コードブック探索手段と、前記短期合成フィルタに
よる短期予測寄与分と前記長期合成フィルタによる長期
予測寄与分を前記音声信号より減算した残差信号を基に
前記残差信号と再生音声信号の平均自乗誤差が最小とな
るように代数コードブックの探索を行う固定コードブッ
ク探索手段とを備えた音声符号化装置であって、 前記固定コードブック探索手段が、前記代数コードブッ
クの探索方法を制御するしきい値の計算を行うしきい値
計算手段と、前記しきい値を基に前記代数コードブック
の探索箇所を絞り込む絞り込み探索アプローチ手段と、
前記絞り込み探索アプローチ手段の結果を基に代数コー
ドブックの探索を行うパルス位置探索手段とを備えたこ
とを特徴とする音声符号化装置。
2. A linear prediction analysis means for performing a linear prediction analysis on an audio signal having a certain frame length to generate a short-term synthesis filter, and an auditory weighting means for applying an auditory weight to the audio signal to generate an audio signal with an auditory weight. An adaptive codebook search means for generating a long-term synthesis filter based on the auditory weighted audio signal; and subtracting the short-term prediction contribution by the short-term synthesis filter and the long-term prediction contribution by the long-term synthesis filter from the audio signal. A speech codec comprising fixed codebook search means for searching for an algebraic codebook so that a mean square error between the residual signal and the reproduced audio signal is minimized based on the residual signal. Code book search means for calculating a threshold value for controlling the algebraic code book search method; threshold value calculation means; And narrowing the search approach means to narrow down the search portion of the algebraic codebook based on,
And a pulse position searching means for searching an algebraic codebook based on a result of the narrowing search approach means.
【請求項3】 あるフレーム長の音声信号に対し線形予
測分析を行い短期合成フィルタを生成する線形予測分析
処理部と、前記音声信号に対し聴覚重み付けを行い聴覚
重み付き音声信号を生成する聴覚重み付け処理部と、前
記聴覚重み付き音声信号を基に長期合成フィルタを生成
する適応コードブック探索処理部と、前記短期合成フィ
ルタによる短期予測寄与分と前記長期合成フィルタによ
る長期予測寄与分を前記音声信号より減算した残差信号
を基に前記残差信号と再生音声信号の平均自乗誤差が最
小となるように代数コードブックの探索を行う固定コー
ドブック探索処理部とを備えた音声符号化装置であっ
て、 前記固定コードブック探索処理部が、前記代数コードブ
ックの探索方法を制御するしきい値の計算を行うしきい
値計算処理部と、前記しきい値を基に前記代数コードブ
ックの探索箇所を絞り込む絞り込み探索アプローチ処理
部と、前記絞り込み探索アプローチ処理部で絞り込まれ
た前記代数コードブックの探索箇所に関する情報を保存
するコードブック探索箇所情報格納用メモリと、前記コ
ードブック探索箇所情報格納用メモリに保存された情報
を基に代数コードブックの探索を行うパルス位置探索処
理部とを備えたことを特徴とする音声符号化装置。
3. A linear prediction analysis processing unit for performing a linear prediction analysis on an audio signal having a certain frame length to generate a short-term synthesis filter, and an auditory weighting for applying an auditory weight to the audio signal to generate an auditory-weighted audio signal. A processing unit; an adaptive codebook search processing unit that generates a long-term synthesis filter based on the auditory weighted audio signal; and a short-term prediction contribution by the short-term synthesis filter and a long-term prediction contribution by the long-term synthesis filter. A fixed codebook search processing unit that searches for an algebraic codebook based on the residual signal obtained by subtracting the residual signal and the reproduced audio signal so as to minimize the mean square error. A fixed-value codebook search processing unit that calculates a threshold value that controls a search method of the algebraic codebook; A narrowing search approach processing unit that narrows down the search location of the algebraic codebook based on the threshold value, and codebook search location information that stores information about the search location of the algebraic codebook narrowed down by the narrowing search approach processing unit A speech encoding apparatus comprising: a storage memory; and a pulse position search processing unit that searches an algebraic codebook based on information stored in the codebook search location information storage memory.
【請求項4】 コンピュータに請求項1記載の音声符号
化方法を実現する各手段を実行させるプログラムを記録
した媒体。
4. A medium on which a program for causing a computer to execute each means for realizing the speech encoding method according to claim 1 is recorded.
JP9280079A 1997-10-14 1997-10-14 Method and device for voice encoding Pending JPH11119799A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9280079A JPH11119799A (en) 1997-10-14 1997-10-14 Method and device for voice encoding

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9280079A JPH11119799A (en) 1997-10-14 1997-10-14 Method and device for voice encoding

Publications (1)

Publication Number Publication Date
JPH11119799A true JPH11119799A (en) 1999-04-30

Family

ID=17620025

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9280079A Pending JPH11119799A (en) 1997-10-14 1997-10-14 Method and device for voice encoding

Country Status (1)

Country Link
JP (1) JPH11119799A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001024166A1 (en) * 1999-09-30 2001-04-05 Stmicroelectronics Asia Pacific Pte Ltd G.723.1 audio encoder
WO2012172750A1 (en) * 2011-06-15 2012-12-20 パナソニック株式会社 Pulse location search device, codebook search device, and methods therefor
JP2013050732A (en) * 2007-07-11 2013-03-14 Huawei Technologies Co Ltd Fixed codebook search method, search device, and computer-readable medium

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001024166A1 (en) * 1999-09-30 2001-04-05 Stmicroelectronics Asia Pacific Pte Ltd G.723.1 audio encoder
US6738733B1 (en) 1999-09-30 2004-05-18 Stmicroelectronics Asia Pacific Pte Ltd. G.723.1 audio encoder
JP2013050732A (en) * 2007-07-11 2013-03-14 Huawei Technologies Co Ltd Fixed codebook search method, search device, and computer-readable medium
WO2012172750A1 (en) * 2011-06-15 2012-12-20 パナソニック株式会社 Pulse location search device, codebook search device, and methods therefor
CN103098128A (en) * 2011-06-15 2013-05-08 松下电器产业株式会社 Pulse location search device, codebook search device, and methods therefor
JPWO2012172750A1 (en) * 2011-06-15 2015-02-23 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America Pulse position search device, codebook search device, and methods thereof
US9230553B2 (en) 2011-06-15 2016-01-05 Panasonic Intellectual Property Corporation Of America Fixed codebook searching by closed-loop search using multiplexed loop

Similar Documents

Publication Publication Date Title
US7200553B2 (en) LPAS speech coder using vector quantized, multi-codebook, multi-tap pitch predictor and optimized ternary source excitation codebook derivation
JP3042886B2 (en) Vector quantizer method and apparatus
JPS63113600A (en) Method and apparatus for encoding and decoding voice signal
JP3180762B2 (en) Audio encoding device and audio decoding device
JPH0990995A (en) Speech coding device
JP3180786B2 (en) Audio encoding method and audio encoding device
JP3357795B2 (en) Voice coding method and apparatus
JPH11119799A (en) Method and device for voice encoding
JP3268750B2 (en) Speech synthesis method and system
JPH06282298A (en) Voice coding method
JP3263347B2 (en) Speech coding apparatus and pitch prediction method in speech coding
JP3299099B2 (en) Audio coding device
JP2943983B1 (en) Audio signal encoding method and decoding method, program recording medium therefor, and codebook used therefor
JPH113098A (en) Method and device of encoding speech
JP3552201B2 (en) Voice encoding method and apparatus
JP3089967B2 (en) Audio coding device
JP3192051B2 (en) Audio coding device
JP3024467B2 (en) Audio coding device
JP2003323200A (en) Gradient descent optimization of linear prediction coefficient for speech coding
JP3199128B2 (en) Audio encoding method
JP3103108B2 (en) Audio coding device
JP3229784B2 (en) Audio encoding / decoding device and audio decoding device
JP2000242299A (en) Weight code book and its generating method, setting method for initial value of ma prediction coefficient in learning in code book designing, encoding method and decoding method for sound signal, computer-readable storage medium storing encoding program and computer- readable storage medium storing decording program
JPH08202398A (en) Voice coding device
JPH0511799A (en) Voice coding system