JP3101376B2 - Audio coding method - Google Patents

Audio coding method

Info

Publication number
JP3101376B2
JP3101376B2 JP03323367A JP32336791A JP3101376B2 JP 3101376 B2 JP3101376 B2 JP 3101376B2 JP 03323367 A JP03323367 A JP 03323367A JP 32336791 A JP32336791 A JP 32336791A JP 3101376 B2 JP3101376 B2 JP 3101376B2
Authority
JP
Japan
Prior art keywords
signal power
signal
codebook
code
optimum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP03323367A
Other languages
Japanese (ja)
Other versions
JPH05158496A (en
Inventor
雅子 加藤
智彦 谷口
秀明 栗原
恭士 大田
文雄 天野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP03323367A priority Critical patent/JP3101376B2/en
Publication of JPH05158496A publication Critical patent/JPH05158496A/en
Application granted granted Critical
Publication of JP3101376B2 publication Critical patent/JP3101376B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

PURPOSE:To prevent characteristics from being degraded when inputting fine voice signals by selecting a zero vector as an optimum code word again when error signal power exceeds input voice signal power. CONSTITUTION:When preparing a code notebook by generating a noise sequence, a vector (defined as C0), for which all the elements of the code word are zero, is given to a noise code notebook 2. When the optimum code word is completely retrieved, an error power evaluation part 5 calculates error signal power Ec<2> of an auditive sense weighted regenerative signal obtained by the optimum code word and a quantized optimum code gain and the input voice signal and judges the levels of this error signal power Ec<2> and input voice signal power (AX)<2>. When the error signal power Ec<2> exceeds the input voice signal power (AX)<2>, the selected code word C is abandonned and the code vector Co, for which all the elements are zero, is selected as the optimum code word again. Thus, noise generation is prevented.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は音声符号化方式に関し、
特に音声信号の情報圧縮伝送を行うためのCELP型音
声符号化方式に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a speech coding system,
In particular, the present invention relates to a CELP-type speech coding system for performing information compression transmission of a speech signal.

【0002】近年、ディジタル信号処理技術の発展に伴
いディジタル通信網の発達及び普及には目覚ましいもの
がある。特に、ディジタル移動無線システム、企業内通
信システムなどにおいては、音声品質を劣化させること
なく情報の高能率な圧縮を行う音声符号化方式が要求さ
れている。
In recent years, with the development of digital signal processing technology, the development and spread of digital communication networks have been remarkable. In particular, in a digital mobile radio system, an in-company communication system, and the like, a speech coding scheme for performing efficient compression of information without deteriorating speech quality is required.

【0003】音声の予測符号化方式では、フレーム毎に
短期予測分析により抽出された短期予測係数と、長期予
測分析により抽出されたピッチ予測係数及びピッチ周期
とを入力信号にその短期予測フィルタ及び長期予測フィ
ルタの逆特性フィルタ(逆フィルタ)を施して得た予測
残差信号と共に多重化して伝送する方式が一般的であ
る。
In the speech predictive coding method, a short-term prediction coefficient extracted by a short-term prediction analysis for each frame and a pitch prediction coefficient and a pitch period extracted by a long-term prediction analysis are input to an input signal as a short-term prediction filter and a long-term prediction filter. In general, a method of multiplexing and transmitting a prediction residual signal obtained by applying an inverse characteristic filter (inverse filter) of the prediction filter is used.

【0004】この予測残差信号情報を効率的に伝送する
ために、予測残差ベクトルをベクトル量子化して、その
インデックスを伝送したり(コード駆動線型予測符号化
方式(Code Excited Linear Prediction):CEL
P)、予測残差ベクトルを有限個のパルス列でモデル化
し、最適なパルス位置、及びパルス振幅を伝送する方式
(マルチパルス駆動符号化方式:MPC)等のいくつか
の方式があるが、伝送効率の点で特に前者のCELP方
式が注目を集めている。但し、このような音声符号化方
式では、雑音系列を音源とすることに起因する特性劣化
が見られ、そのような特性劣化を克服するための改善手
法が求められている。
In order to efficiently transmit the prediction residual signal information, the prediction residual vector is vector-quantized and its index is transmitted (Code Excited Linear Prediction: CEL).
P), there are several schemes such as a scheme (multi-pulse drive encoding scheme: MPC) that models the prediction residual vector with a finite number of pulse trains and transmits the optimal pulse position and pulse amplitude. In particular, the former CELP system has attracted attention. However, in such a speech coding method, characteristic deterioration due to using a noise sequence as a sound source is seen, and an improvement method for overcoming such characteristic deterioration is required.

【0005】[0005]

【従来の技術】CELP方式は、入力音声データをフレ
ーム毎にベクトル量子化を行う音声符号化方式であり、
図4にその一般的な構成を示す。
2. Description of the Related Art The CELP system is a speech coding system for performing vector quantization of input speech data for each frame.
FIG. 4 shows the general configuration.

【0006】CELP型音声符号器は、適応符号帳1及
び雑音符号帳2の二つの符号帳を持っており、適応符号
帳1は、入力音声の周期性成分の同定を行うためのもの
であり、前フレームの再生音声信号によって毎フレーム
更新されて行き、雑音符号帳2は、雑音系列、即ち非周
期性成分の音源情報の同定を行うためのものであり、予
め発生させた雑音系列を固定で持っている。
The CELP type speech coder has two codebooks, an adaptive codebook 1 and a noise codebook 2, and the adaptive codebook 1 is for identifying a periodic component of the input speech. The noise codebook 2 is updated for each frame by the reproduced audio signal of the previous frame, and is used to identify the noise sequence, that is, the excitation information of the non-periodic component, and fixes the noise sequence generated in advance. Have.

【0007】適応符号帳1のコードワード、即ちピッチ
ベクトルをP、ピッチゲインをbとし、雑音符号帳2の
コードワード、即ちコードベクトルをC、コードゲイン
をgとする。各符号帳のコードワード(P、C)に各々
のゲイン(b、g)を乗じて加算器3で加算することに
より駆動音源信号(bP+gC)を生成し、更にこれを
聴覚重み付け(声道特性の擬似化)フィルタ4を通すこ
とにより重み付け再生信号(bAP+gAC)が得られ
る。
The codeword of the adaptive codebook 1, that is, the pitch vector is P, the pitch gain is b, the codeword of the noise codebook 2, that is, the code vector is C, and the code gain is g. The driving sound source signal (bP + gC) is generated by multiplying the codeword (P, C) of each codebook by the respective gains (b, g) and adding the result by the adder 3, and furthermore, the driving excitation signal (bP + gC) is weighted by hearing (vocal tract characteristics). By passing through a filter 4 to obtain a weighted reproduction signal (bAP + gAC).

【0008】この重み付け再生信号と、聴覚重み付けさ
れた入力信号であるターゲットベクトル(AX)との間
の誤差信号の電力(E)を誤差電力評価部5で求め、誤
差電力評価部5ではこれを全てのコードワードについて
検索して行くことにより該誤差信号電力を最小にする駆
動音源信号を最適駆動音源信号として決定する。
The error power evaluator 5 obtains the power (E) of the error signal between the weighted reproduced signal and the target vector (AX) which is the input signal weighted by the auditory sense. The drive excitation signal that minimizes the error signal power by searching for all codewords is determined as the optimal drive excitation signal.

【0009】この検索の結果得られた最適駆動音源信号
(bP+gC)を、フレーム遅延器6を通して適応符号
帳1に入力することで、次フレームのための適応符号帳
1の更新が行われる。
By inputting the optimal driving excitation signal (bP + gC) obtained as a result of the search to adaptive codebook 1 through frame delay unit 6, adaptive codebook 1 for the next frame is updated.

【0010】そして、符号化器としては、この最適駆動
音源信号を構成する適応符号帳1及び雑音符号帳2のコ
ードワードのインデックス、及び各符号帳のゲイン
(b、g)、及びLPC分析パラメータを量子化して復
号器側へ伝送する。
[0010] As an encoder, the index of the codeword of the adaptive codebook 1 and the noise codebook 2 constituting the optimal driving excitation signal, the gain (b, g) of each codebook, and the LPC analysis parameter Is quantized and transmitted to the decoder side.

【0011】復号器側でも適応符号帳と雑音符号帳とが
用意されており、伝送されてきたインデックスを基に各
符号帳の検索を行い、これを音源信号として、他に伝送
されてきた各符号帳のゲイン(b、g)やLPC分析パ
ラメータによって形成される合成系により再生信号を得
る。
An adaptive codebook and a random codebook are also prepared on the decoder side, and each codebook is searched based on the transmitted index, and each of the codebooks is used as a sound source signal, and each of the other transmitted codebooks is searched for. A reproduction signal is obtained by a synthesis system formed by the gains (b, g) of the codebook and the LPC analysis parameters.

【0012】図5は誤差電力評価部5における雑音符号
帳2の探索方式の構成を示したもので、ここでは雑音符
号帳2のコードワードと入力音声ベクトルとの間で最適
コードワード探索処理が行われ、最適コードワード
(C)が決定される。
FIG. 5 shows a configuration of a search method for the random codebook 2 in the error power evaluation unit 5. Here, an optimum codeword search process is performed between the codeword of the random codebook 2 and the input speech vector. Is performed to determine the optimal codeword (C).

【0013】即ち、まずコードワード(C)にコードゲ
イン(g)を掛けて振幅調整し、重み付けフィルタ4を
通して、聴覚重み付けされた信号(AC)を生成する。
この信号と、重み付け入力信号であるターゲットベクト
ル(AX)との間の誤差信号の電力(EC )を評価し、
誤差を最小にするようなコードワードを最適コードワー
ドとして決定する。
That is, first, the code word (C) is multiplied by the code gain (g) to adjust the amplitude, and through the weighting filter 4, an auditory weighted signal (AC) is generated.
Evaluate the power (E C ) of the error signal between this signal and the target vector (AX), which is the weighted input signal,
The codeword that minimizes the error is determined as the optimal codeword.

【0014】また、コードゲインgは、コードゲイン算
出部7において、コードワード(C)とターゲットベク
トル(AX)の相関値により算出される。
The code gain g is calculated by the code gain calculator 7 based on the correlation value between the code word (C) and the target vector (AX).

【0015】また聴覚重み付けフィルタ処理は、周波数
領域において人間の聴覚特性にもとづいた強調処理を音
声データに施す処理のことであり、フィルタの伝達関数
は次式によって表される。 H(Z) = 1/A'(Z) A'(Z)= 1−Σαi γi -i (γ=0.9) (1)
The auditory weighting filter process is a process of applying an emphasis process based on human auditory characteristics to audio data in the frequency domain. The transfer function of the filter is represented by the following equation. H (Z) = 1 / A '(Z) A' (Z) = 1-Σα i γ i z -i (γ = 0.9) (1)

【0016】ここで、最適コードワード選択処理は、誤
差信号電力(EC )の評価式(次式(2) )の最小化問題
に帰着できる。 EC 2 =(AX−gAC)2 (2) 但し、 AX:重み付け入力音声ベクトル AC:重み付け雑音系列(ストカスティック)コードベ
クトル g:コードゲイン
Here, the optimal codeword selection processing can be reduced to a problem of minimizing the evaluation expression (the following expression (2)) of the error signal power (E C ). E C 2 = (AX−gAC) 2 (2) where AX: weighted input speech vector AC: weighted noise sequence (stochastic) code vector g: code gain

【0017】ここで、最適コードゲインgopt は、式
(2) をgで微分して=0と置くことにより求められる。 dEC 2 /dg ={(AX)T (AX)−2g(AX)T (AC) +g2 (AC)T (AC)}/dg =−2(AX)T (AC)+2g(AC)T (AC) = 0 尚、 Tは転置行列を示す。
Here, the optimum code gain g opt is given by the following equation.
(2) is obtained by differentiating g with g and setting = 0. dE C 2 / dg = {( AX) T (AX) -2g (AX) T (AC) + g 2 (AC) T (AC)} / dg = -2 (AX) T (AC) + 2g (AC) T (AC) = 0 Note that T indicates a transposed matrix.

【0018】これにより、 ∴gopt =(AX)T (AC)/(AC)T (AC) (3) となる。Thus, ∴g opt = (AX) T (AC) / (AC) T (AC) (3)

【0019】この式(3) を式(2) に代入することにより
次式(4)を得る。
The following equation (4) is obtained by substituting equation (3) into equation (2).

【0020】この式(4) は図6に示す雑音符号帳探索の
演算ブロック図の如く最大値評価部50(これは誤差電
力評価部5と等価なものである。)において演算される
こととなる。
This equation (4) is to be calculated in the maximum value evaluation section 50 (which is equivalent to the error power evaluation section 5) as shown in the operation block diagram of the random codebook search shown in FIG. Become.

【0021】ここで式(4) を最小にするコードワードC
の選択について考えると、第一項はコードワードCの検
索中一定であるため、第二項を最大にするCを選択する
ことにより誤差信号電力EC 2 を最小にできるというこ
とが分かる。
Here, the code word C that minimizes the expression (4)
Considering the choice of, it can be seen that the error signal power E C 2 can be minimized by selecting C, which maximizes the second term, since the first term is constant during the search for the codeword C.

【0022】そこで、式(4) の第二項を、EV と置く
と、 となる。
Therefore, if the second term of equation (4) is set as E V , Becomes

【0023】そして、自己相関係数(AC)T (AC)
をRcc、相互相関係数(AX)T (AC)をRcxと書く
ことにすると、式(5) は次のように書き改められる。 EV =(Rcx)2 /(Rcc) (6)
The autocorrelation coefficient (AC) T (AC)
Is written as Rcc and the cross-correlation coefficient (AX) T (AC) is written as Rcx, Equation (5) can be rewritten as follows. E V = (Rcx) 2 / (Rcc) (6)

【0024】以上より、雑音符号帳探索では、最大値評
価部50において式(6) の計算及び最大値評価を行うこ
とにより、最適コードワードを得ることができ、このよ
うに、各コードベクトルを用いて一旦音声信号を再生し
て、最も誤差の小さかったものを選ぶ方法は、合成によ
る分析手法(Analysis-by-Synthesis: A-b-S法)として
知られている。
As described above, in the random codebook search, the maximum code evaluation unit 50 calculates the expression (6) and evaluates the maximum value, thereby obtaining the optimum codeword. The method of reproducing the audio signal once and selecting the one with the smallest error is known as an analysis method by synthesis (Analysis-by-Synthesis: AbS method).

【0025】[0025]

【発明が解決しようとする課題】上記の最適コードワー
ド検索処理において、式(5) (式(4) の右辺第二項)は
常に正となり、従って次の式(7) が成立する。 EC 2 =(AX−gAC)2 ≦ (AX)2 (7) 但し、等号成立はAX⊥ACのときである。
In the above-mentioned optimum code word search processing, equation (5) (the second term on the right side of equation (4)) is always positive, and therefore the following equation (7) is established. E C 2 = (AX−gAC) 2 ≦ (AX) 2 (7) However, the equality holds when AX⊥AC.

【0026】ところが、最適コードゲインgを量子化し
てg' とした場合、誤差信号電力E C は、 EC 2 =(AX)T (AX)−2g' (AX)T (AC) +g'2(AC)T (AC) (8) となり、gの量子化が粗い場合には、 −2g' (AX)T (AC)+g'2(AC)T (AC)>0 (9) すなわち、 EC 2 >(AX)2 (10) となる場合が考えられ、これにより微小入力時であって
も、雑音符号帳2の非周期性成分ACを用いたことで、
却って誤差電力が大きくなり、再生音声の特性が劣化す
るという問題が生ずる。
However, when the optimal code gain g is quantized,
, The error signal power E CIs EC Two = (AX)T(AX) -2g '(AX)T(AC) + g 'Two(AC)T(AC) (8) When the quantization of g is coarse, −2g ′ (AX)T(AC) + g 'Two(AC)T(AC)> 0 (9) That is, EC Two> (AX)Two (10) can be considered.
Also uses the non-periodic component AC of the random codebook 2,
On the contrary, the error power increases and the characteristics of the reproduced sound deteriorate.
Problem arises.

【0027】従って本発明は、入力音声信号の周期性成
分及び非周期性成分をそれぞれ同定するための適応符号
帳及び雑音符号帳を用いて聴覚重み付けされた再生信号
を生成し、該再生信号と聴覚重み付けした入力音声信号
との誤差信号電力が最小となる該適応符号帳及び該雑音
符号帳の各最適コードワードのインデックス並びに各々
の最適コードゲインの量子化値を伝送する音声符号化方
式において、微小音声信号入力時の特性劣化を防ぐこと
を目的とする。
Accordingly, the present invention generates a perceptually weighted reproduction signal using an adaptive codebook and a noise codebook for identifying a periodic component and an aperiodic component of an input speech signal, respectively. In an audio coding system for transmitting an index of each optimal codeword of the adaptive codebook and the noise codebook and a quantization value of each optimal code gain in which an error signal power with an input audio signal weighted by hearing is minimized, It is an object of the present invention to prevent characteristic deterioration when a minute audio signal is input.

【0028】[0028]

【課題を解決するための手段及び作用】雑音符号帳は予
め発生させた雑音系列を持つ符号帳である。本発明に係
る音声符号化方式の符号器では、図1に示すように、雑
音系列を発生させて符号帳を作成する際に、コードワー
ドの全要素が零であるようなベクトル(C0 とする)を
雑音符号帳2に与えておくこととする。
The noise codebook is a codebook having a noise sequence generated in advance. As shown in FIG. 1, in the encoder of the speech coding system according to the present invention, when a noise sequence is generated to create a codebook, a vector (C 0 and C 0) in which all elements of a codeword are zero is generated. ) Is given to the random codebook 2.

【0029】最適コードワードの検索終了後に、誤差電
力評価部5は、最適コードワード及び量子化された最適
コードゲインとによって得られる聴覚重み付けされた再
生信号と入力音声信号との誤差信号電力EC 2 を求める
と共に、この誤差信号電力E C 2 と入力音声信号電力
(AX)2 との大小判定を行う。
After the search for the optimum code word is completed, the error
The force evaluator 5 determines the optimal codeword and the quantized optimal
Auditory weighted re-gain obtained by code gain
Error signal power E between the raw signal and the input audio signalC TwoAsk for
And the error signal power E C TwoAnd input audio signal power
(AX)TwoIs determined.

【0030】この結果、上記の式(10)に示すように、誤
差信号電力EC 2 が入力音声信号電力(AX)2 を上回
った場合には、入力音声信号は微小入力信号であり、こ
のままコードワードを選択することは雑音を発生させて
しまう。
As a result, when the error signal power E C 2 exceeds the input audio signal power (AX) 2, as shown in the above equation (10), the input audio signal is a minute input signal. Choosing a codeword creates noise.

【0031】このため本発明の符号器では、選択された
コードワードCを棄却し、全要素零であるコードベクト
ルC0 を最適コードワードとして選択し直すことによ
り、雑音発生を防止する。
Therefore, in the encoder of the present invention, the occurrence of noise is prevented by rejecting the selected code word C and re-selecting the code vector C 0 having all the elements zero as the optimum code word.

【0032】このとき、復号器側へは、C0 のインデッ
クスと、量子化コードゲインg' を伝送する。
At this time, the index of C 0 and the quantized code gain g ′ are transmitted to the decoder side.

【0033】そして、復号器でも符号器側と同じ雑音符
号帳が用意されており、送られてきたコードベクトルC
0 のインデックスにより雑音符号帳からコードベクトル
0 を取り出し、これに量子化コードゲインg’を逆量
子化して得られたコードゲインgを掛け、これらと適応
符号帳のインデックス及び量子化コードゲインとにより
駆動音源信号を生成し、この駆動音源信号を再生フィル
タを通して再生音声信号を生成することができる。
In the decoder, the same noise codebook as that of the encoder side is prepared, and the transmitted code vector C
The code vector C 0 is extracted from the noise codebook by an index of 0, and the obtained code vector is multiplied by the code gain g obtained by inversely quantizing the quantized code gain g ′, and these are multiplied by the adaptive codebook index and the quantized code gain. , A driving sound source signal is generated, and the driving sound source signal can be generated through a reproduction filter to generate a reproduced sound signal.

【0034】[0034]

【実施例】本発明に係る音声符号化方式に用いる符号器
の実施例が図2に示されており、この実施例の構成は、
雑音符号帳2に一個だけ全要素零のコードベクトルC0
を与えておき、以下の如く誤差電力評価部5において異
なった探索処理を行う点が図5の従来例と異なってい
る。
FIG. 2 shows an embodiment of an encoder used for a speech coding system according to the present invention.
In the random codebook 2, only one code vector C 0 of all element zeros
Is different from the conventional example of FIG. 5 in that a different search process is performed in the error power evaluation unit 5 as described below.

【0035】このような雑音符号帳2から得られる聴覚
重み付けした再生ベクトル信号(gAC)と聴覚重み付
けされた入力音声ベクトル(AX)との誤差信号電力E
C が最小となる最適コードベクル(Copt )を上記の式
(4) に対応する次の式(11)に従って誤差電力評価部5が
探索する。
The error signal power E between the perceptually weighted reproduced vector signal (gAC) obtained from the noise codebook 2 and the perceptually weighted input speech vector (AX)
The optimal code vector (C opt ) that minimizes C is calculated using the above equation.
The error power evaluation unit 5 searches according to the following equation (11) corresponding to (4).

【0036】最適コードベクトル(Copt )が選択され
た後、上記の式(3) に対応する次の式(12)に従って最適
コードゲイン(gopt ) が求められる。 gopt =(AX)T (ACopt )/(ACopt T (ACopt ) (12)
After the optimum code vector (C opt ) is selected, the optimum code gain (g opt ) is obtained according to the following equation (12) corresponding to the above equation (3). g opt = (AX) T (AC opt ) / (AC opt ) T (AC opt ) (12)

【0037】そして、この最適コードゲイン(gopt )
を量子化することにより、量子化最適コードゲイン(g
opt ' )が得られ、これらのgopt ' とCopt を用い
て、上記の式(10)の判定(誤差信号電力EC 2 が入力音
声信号電力(AX)2 を超える値になっていないかどう
かの判定)を行うが、この式(10)の判定は式(9) の判定
を行うことであるので、この式(9) に対応する次の式(1
3)の正負判定を行う。
Then, the optimum code gain (g opt )
Is quantized to obtain a quantization optimum code gain (g
opt ′), and using these g opt ′ and C opt , the determination of the above equation (10) (error signal power E C 2 does not exceed input audio signal power (AX) 2 ) (10) is determined by the equation (9). Therefore, the following equation (1) corresponding to the equation (9) is used.
Perform the positive / negative judgment in 3).

【0038】 −2gopt ' ( AX)T (ACopt )+gopt '2(ACopt T (ACopt ) (13)−2g opt (AX) T (AC opt ) + g opt2 (AC opt ) T (AC opt ) (13)

【0039】これは、次式(14)が成立しているかどうか
と等価である。 g'2・Rcc−2g' ・Rcx<0 (14)
This is equivalent to whether the following equation (14) holds. g ' 2 · Rcc-2g' · Rcx <0 (14)

【0040】そして、式(14)が成立していることが判明
した場合は、選択された最適コードワード(Copt )の
インデックスと、量子化最適コードゲインgopt ' を復
号器へ伝送するが、次式(15)のように、 gopt '2・Rcc−2gopt ' ・Rcx>0 (15) となった場合は、誤差信号電力EC 2 が入力音声信号電
力(AX)2 をこえてしまっており雑音を発生させてし
まうので、誤差電力評価部5は、選択されたコードワー
ド(Copt )を棄却し、全要素零であるコードベクトル
(C0 )を最適コードワードとして選択し直して、復号
器側へはコードベクトル(C0 )のインデックスと、量
子化最適コードゲイン(gopt ' )を伝送する。
If it is found that the equation (14) holds, the index of the selected optimum codeword (C opt ) and the quantization optimum code gain g opt ′ are transmitted to the decoder. If g opt ' 2 · Rcc−2g opt ' · Rcx> 0 (15) as in the following equation (15), the error signal power E C 2 exceeds the input voice signal power (AX) 2 . Therefore, the error power evaluator 5 rejects the selected codeword (C opt ) and selects a code vector (C 0 ) having all zeros as the optimal code word. Then, the index of the code vector (C 0 ) and the quantization optimum code gain (g opt ′) are transmitted to the decoder side.

【0041】尚、雑音の発生を防止するためには、コー
ドゲイン(g' )を零にする方法と、最適コードワード
(Copt )を零にする方法の二つが考えられるが、ゲイ
ン量子化器は量子化感度が高く、この量子化レベルに対
して零レベルを設けることは量子化の効率を下げること
につながるので、選択されたコードワード(Copt )を
棄却し、全要素零であるコードベクトル(C0 )を最適
コードワードとして選択し直すこととしている。
In order to prevent the generation of noise, there are two methods, a method of making the code gain (g ') zero and a method of making the optimum code word (C opt ) zero. Since the detector is highly sensitive to quantization and providing a zero level for this quantization level reduces the efficiency of quantization, the selected codeword (C opt ) is rejected and all elements are zero. The code vector (C 0 ) is to be selected again as the optimum code word.

【0042】図3は復号器の構成が示されており、この
復号器においても符号器と同じ適応符号帳1と雑音符号
帳2とが用意されており、図2に示した符号器から送ら
れて来た各符号帳1,2の最適コードワードのインデッ
クスにより最適コードワードPopt 及びCopt が選択さ
れ、同様にして送られてきた各コードゲインの量子化値
b’,g’により得られるコードゲインb,gに最適コ
ードワードPopt 及びCopt をそれぞれ乗じて得られる
opt opt 及びgopt opt を加算器10で加算して
駆動音源信号Xを生成し、これをLPC再生フィルタ
(聴覚重み付けフィルタ)11を通すことにより再生音
声信号が得られることとなる。尚、適応符号帳1は符号
器と同じようにフレーム遅延器12により前フレームの
周期性成分で更新される。
FIG. 3 shows the configuration of a decoder. In this decoder, the same adaptive codebook 1 and noise codebook 2 as those of the encoder are prepared, and transmitted from the encoder shown in FIG. The optimum codewords P opt and C opt are selected by the index of the optimum code word of each of the codebooks 1 and 2 obtained, and are obtained by the quantized values b ′ and g ′ of each code gain transmitted in the same manner. B opt P opt and g opt C opt obtained by multiplying the obtained code gains b and g by the optimum code words P opt and C opt , respectively, are added by an adder 10 to generate a driving sound source signal X, which is reproduced by LPC By passing through a filter (auditory weighting filter) 11, a reproduced audio signal is obtained. Note that the adaptive codebook 1 is updated by the frame delay unit 12 with the periodicity component of the previous frame, similarly to the encoder.

【0043】[0043]

【発明の効果】以上述べたように、本発明に係る音声符
号化方式によれば、雑音符号帳が1個の零ベクトルを含
み、最適コードワードの検索終了後に、最適コードワー
ド及び量子化された最適コードゲインを用いて誤差信号
電力と入力音声信号電力との大小判定を行い、該誤差信
号電力が該入力音声信号電力を上回った場合には、該零
ベクトルを最適コードワードとして選択し直すように構
成したので、微小音声入力時における誤差電力の増大を
抑制することができ、再生音声の特性の劣化を防止する
ことができる。
As described above, according to the speech coding method of the present invention, the random codebook includes one zero vector, and after the search for the optimum codeword is completed, the optimum codeword and the quantized codeword are quantized. The magnitude of the error signal power and the input voice signal power are determined using the optimized code gain, and when the error signal power exceeds the input voice signal power, the zero vector is selected again as the optimal codeword. With such a configuration, it is possible to suppress an increase in error power when a minute voice is input, and to prevent deterioration in characteristics of a reproduced voice.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明に係る音声符号化方式の符号化原理を示
したブロック図である。
FIG. 1 is a block diagram showing an encoding principle of a speech encoding method according to the present invention.

【図2】本発明に係る音声符号化方式における符号器の
一実施例を示したブロック図である。
FIG. 2 is a block diagram showing one embodiment of an encoder in a speech encoding system according to the present invention.

【図3】本発明に係る音声符号化方式における復号器の
一実施例を示したブロック図である。
FIG. 3 is a block diagram showing an embodiment of a decoder in the speech coding system according to the present invention.

【図4】従来より知られたCELP型音声符号器を示し
たブロック図である。
FIG. 4 is a block diagram showing a conventionally known CELP type speech encoder.

【図5】従来より知られたCELP型音声符号化方式に
おける雑音符号帳の探索処理部分を示したブロック図で
ある。
FIG. 5 is a block diagram showing a noise codebook search processing part in a conventionally known CELP type speech coding scheme.

【図6】従来より知られたCELP型音声符号化方式に
おける雑音符号帳の探索演算過程を説明するためのブロ
ック図である。
FIG. 6 is a block diagram for explaining a noise codebook search operation process in a conventionally known CELP-type speech coding scheme.

【符号の説明】[Explanation of symbols]

1 適応符号帳 2 雑音符号帳 4 聴覚重み付けフィルタ 5 誤差電力評価部 7 コードゲイン算出部 図中、同一符号は同一又は相当部分を示す。 DESCRIPTION OF SYMBOLS 1 Adaptive codebook 2 Noise codebook 4 Auditory weighting filter 5 Error power evaluation part 7 Code gain calculation part In the figure, the same code shows the same or corresponding part.

───────────────────────────────────────────────────── フロントページの続き (72)発明者 大田 恭士 神奈川県川崎市中原区上小田中1015番地 富士通株式会社内 (72)発明者 天野 文雄 神奈川県川崎市中原区上小田中1015番地 富士通株式会社内 (56)参考文献 特開 平3−33900(JP,A) 特開 平3−101800(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 19/00 - 19/14 H03M 7/30 H04B 14/04 JICSTファイル(JOIS)──────────────────────────────────────────────────続 き Continuing on the front page (72) Inventor Kyoji Ota 1015 Uedanaka, Nakahara-ku, Kawasaki City, Kanagawa Prefecture Inside Fujitsu Limited (72) Inventor Fumio Amano 1015 Uedanaka, Nakahara-ku, Kawasaki City, Kanagawa Prefecture Fujitsu Limited (56) References JP-A-3-33900 (JP, A) JP-A-3-101800 (JP, A) (58) Fields investigated (Int. Cl. 7 , DB name) G10L 19/00-19 / 14 H03M 7/30 H04B 14/04 JICST file (JOIS)

Claims (2)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 入力音声信号の周期性成分及び非周期性
成分をそれぞれ同定するための適応符号帳及び雑音符号
帳を用いて聴覚重み付けされた再生信号を生成し、該再
生信号と聴覚重み付けした入力音声信号との誤差信号電
力が最小となる該適応符号帳及び該雑音符号帳の各最適
コードワードのインデックス並びに各々の最適コードゲ
インの量子化値を伝送する音声符号化方式において、 該雑音符号帳が1個の零ベクトルを含み、最適コードワ
ードの検索終了後に、該最適コードワード及び該量子化
された最適コードゲインを用いて該誤差信号電力と入力
音声信号電力との大小判定を行い、該誤差信号電力が該
入力音声信号電力を上回った場合には、該零ベクトルを
最適コードワードとして選択し直すことを特徴とした音
声符号化方式。
1. An audio-weighted reproduction signal is generated using an adaptive codebook and a noise codebook for identifying a periodic component and an aperiodic component of an input audio signal, respectively, and the reproduction signal and the audio-weighting are generated. An audio coding system for transmitting an index of each optimal codeword of the adaptive codebook and the noise codebook and a quantization value of each optimal code gain, in which an error signal power with respect to an input audio signal is minimized. The book includes one zero vector, and after the search for the optimal codeword is completed, the magnitude of the error signal power and the input speech signal power are determined using the optimal codeword and the quantized optimal code gain, When the error signal power exceeds the input voice signal power, the zero vector is selected again as an optimal codeword.
【請求項2】 請求項1に記載の音声符号化方式と同じ
適応符号帳と雑音符号帳とを有し、該符号化側から伝送
された各符号帳のインデックス及び各最適コードゲイン
の量子化値により最適駆動音源信号を生成し、該最適駆
動音源信号を再生フィルタにより再生音声信号とするこ
とを特徴とした音声復号化方式。
2. A quantization apparatus according to claim 1, further comprising an adaptive codebook and a noise codebook which are the same as those of the speech coding method according to claim 1, wherein the index of each codebook and the optimum code gain transmitted from the encoding side are quantized. A speech decoding method characterized by generating an optimum driving sound source signal based on a value, and using the optimum driving sound source signal as a reproduction sound signal by a reproduction filter.
JP03323367A 1991-12-06 1991-12-06 Audio coding method Expired - Fee Related JP3101376B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03323367A JP3101376B2 (en) 1991-12-06 1991-12-06 Audio coding method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03323367A JP3101376B2 (en) 1991-12-06 1991-12-06 Audio coding method

Publications (2)

Publication Number Publication Date
JPH05158496A JPH05158496A (en) 1993-06-25
JP3101376B2 true JP3101376B2 (en) 2000-10-23

Family

ID=18153979

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03323367A Expired - Fee Related JP3101376B2 (en) 1991-12-06 1991-12-06 Audio coding method

Country Status (1)

Country Link
JP (1) JP3101376B2 (en)

Also Published As

Publication number Publication date
JPH05158496A (en) 1993-06-25

Similar Documents

Publication Publication Date Title
US6594626B2 (en) Voice encoding and voice decoding using an adaptive codebook and an algebraic codebook
JP3346765B2 (en) Audio decoding method and audio decoding device
JP3180762B2 (en) Audio encoding device and audio decoding device
JP2626223B2 (en) Audio coding device
JP3357795B2 (en) Voice coding method and apparatus
JPH09152896A (en) Sound path prediction coefficient encoding/decoding circuit, sound path prediction coefficient encoding circuit, sound path prediction coefficient decoding circuit, sound encoding device and sound decoding device
JP2002268686A (en) Voice coder and voice decoder
JP2970407B2 (en) Speech excitation signal encoding device
JP3179291B2 (en) Audio coding device
JP3101376B2 (en) Audio coding method
JP3579276B2 (en) Audio encoding / decoding method
JP3003531B2 (en) Audio coding device
JPH08292797A (en) Voice encoding device
JP3153075B2 (en) Audio coding device
JP3552201B2 (en) Voice encoding method and apparatus
JP3490325B2 (en) Audio signal encoding method and decoding method, and encoder and decoder thereof
JP3319396B2 (en) Speech encoder and speech encoder / decoder
JPH0519795A (en) Excitation signal encoding and decoding method for voice
JP3252285B2 (en) Audio band signal encoding method
JP2658794B2 (en) Audio coding method
JP3578933B2 (en) Method of creating weight codebook, method of setting initial value of MA prediction coefficient during learning at the time of codebook design, method of encoding audio signal, method of decoding the same, and computer-readable storage medium storing encoding program And computer-readable storage medium storing decryption program
JP3089967B2 (en) Audio coding device
JP3256215B2 (en) Audio coding device
JP3192051B2 (en) Audio coding device
JP3024467B2 (en) Audio coding device

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20000808

LAPS Cancellation because of no payment of annual fees