JPH0792999A - Method and device for encoding excitation signal of speech - Google Patents

Method and device for encoding excitation signal of speech

Info

Publication number
JPH0792999A
JPH0792999A JP5236390A JP23639093A JPH0792999A JP H0792999 A JPH0792999 A JP H0792999A JP 5236390 A JP5236390 A JP 5236390A JP 23639093 A JP23639093 A JP 23639093A JP H0792999 A JPH0792999 A JP H0792999A
Authority
JP
Japan
Prior art keywords
phase
codebook
vector
adaptive
noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5236390A
Other languages
Japanese (ja)
Other versions
JP3199142B2 (en
Inventor
Kazunori Mano
一則 間野
Takehiro Moriya
健弘 守谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP23639093A priority Critical patent/JP3199142B2/en
Publication of JPH0792999A publication Critical patent/JPH0792999A/en
Application granted granted Critical
Publication of JP3199142B2 publication Critical patent/JP3199142B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

PURPOSE:To provide the excitation signal encoding method and device for the speech which generate a noise code spectrum corresponding to the pitch peak position of an adaptive code vector. CONSTITUTION:The method and device for speech excitation signal encoding are equipped with a phase search part 11 which detects the phase phi from the start point to the peak position of the adaptive code vector obtained from an adaptive code book 4a, a phase adaption part 12 which adapts the phase of a stored vector obtained from a noise code book 5a on the basis of the phase phi detected by the phase search part 11, and a cycle part 6 which puts the phase- adapted noise code vector obtained from the phase adaption part 12 in pitch cycles, and switches and operates the cycle part 6 and phase search part 11 with a pitch cycle signal L.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】この発明は、音声の励振信号符号
化方法および装置に関し、特に、符号励振線形予測符号
化を採用して音声の信号系列を少ない情報量でディジタ
ル符号化する音声の励振信号符号化方法および装置に関
する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a speech excitation signal coding method and apparatus, and more particularly to a speech excitation signal coding method which employs code excitation linear predictive coding to digitally encode a speech signal sequence with a small amount of information. The present invention relates to a signal coding method and apparatus.

【0002】[0002]

【従来の技術】ディジタル移動通信、音声蓄積サービス
の如き技術分野においては、電波或は記憶媒体の効率的
利用を図るために種々の高能率音声符号化方法が採用さ
れている。例えば符号励振線形予測符号化(Code Excit
ed Linear Prediction,CELP)、ベクトル和励振線形予
測符号化(Vector Sum Excited Linear Prediction,VSE
LP)といった音声符号化方法が知られている。それぞれ
の技術については、M.R.Schroeder and B.S.Atal: “Co
de-Excited Linear Prediction(CELP):High-quality Sp
eech at Very Low Bit Rates”, Proc.ICASSP-85,25.1.
1,pp.937-940,1985年)および、I.A.Gerson and M.A.Ja
siuk:“Vector Sum Excited Linear Prediction(VSELP)
Speech Coding at 8kbps ”, Proc.ICASSP-90,S9.3,pp.
461-464,1990年)に述べられている。これらの方法は、
5msから50ms程度を1フレームとし、過去の励振
信号からなるピッチ適応符号帳中の一つの適応符号ベク
トルと、予め蓄積しておいた固定的な雑音またはパルス
列からなる雑音符号帳の雑音符号ベクトルの重み付き和
を励振信号とする。この励振信号を線形予測合成フィル
タに通した合成波形と入力音声との間の聴覚重みつき波
形歪みを最小とする様に、線形予測パラメータ、適応符
号、雑音符号、利得符号を決定する。
2. Description of the Related Art In the technical fields such as digital mobile communication and voice storage service, various high-efficiency voice coding methods have been adopted in order to efficiently use radio waves or storage media. For example, code-excited linear predictive coding (Code Excit
ed Linear Prediction, CELP), Vector Sum Excited Linear Prediction, VSE
LP) is known as a voice coding method. MR Schroeder and BSAtal: “Co
de-Excited Linear Prediction (CELP): High-quality Sp
eech at Very Low Bit Rates ”, Proc.ICASSP-85,25.1.
1, pp.937-940, 1985) and IAGerson and MAJa
siuk: “Vector Sum Excited Linear Prediction (VSELP)
Speech Coding at 8kbps ”, Proc.ICASSP-90, S9.3, pp.
461-464, 1990). These methods are
About 5 ms to 50 ms is set as one frame, and one adaptive code vector in the pitch adaptive codebook consisting of past excitation signals and the noise code vector of the noise codebook consisting of fixed noise or pulse train accumulated in advance The weighted sum is used as the excitation signal. A linear prediction parameter, an adaptive code, a noise code, and a gain code are determined so as to minimize the perceptual weighted waveform distortion between the synthesized waveform obtained by passing the excitation signal through the linear prediction synthesis filter and the input speech.

【0003】雑音符号帳は、適応符号ベクトルで表現し
きれなかった励振信号の残差波形を更に符号化するもの
である。この雑音符号帳の構成には、当初、8kbit
/s程度の符号化においては、ガウス雑音その他のラン
ダムな時系列ベクトルを生成し、これを使用していた。
しかし、4kbit/s以下の低ビットレート化におい
ては、ベクトル当りのビット割当を減らしたり、ベクト
ルの次元数を増加したりする必要があり、この場合、雑
音符号帳で表現する残差信号は、必ずしもランダムなも
のではなく、ピッチ周期性を有し、そしてパルスを多く
含んだ信号となるので、雑音符号帳の表現の多様化が重
要になってきた。
The noise codebook is for further encoding the residual waveform of the excitation signal that cannot be expressed by the adaptive code vector. Initially, the configuration of this random codebook was 8 kbit.
In the coding of about / s, a Gaussian noise or other random time series vector was generated and used.
However, in order to reduce the bit rate to 4 kbit / s or less, it is necessary to reduce the bit allocation per vector or increase the number of dimensions of the vector. In this case, the residual signal represented by the random codebook is Since the signal is not necessarily random but has pitch periodicity and contains many pulses, diversification of the representation of the random codebook has become important.

【0004】雑音励振源の多様化技術として、ピッチ同
期雑音励振源符号化方法(Pitch Synchronous Innovati
on-CELP:PSI-CELP) がある。この技術については、間
野、守谷、三樹、大室:“自動車電話用ハーフレートコ
ーデックの検討”、電子情報通信学会、技術報告SP9
2−133(1993年2月)に述べられている。これ
は、適応符号帳から得られるピッチ周期を用いて、雑音
符号帳も適応符号帳と同様に、固定雑音ベクトルを先頭
から周期化した雑音符号化ベクトルを用いる手法であ
る。
As a technique for diversifying noise excitation sources, a pitch synchronous noise excitation source coding method (Pitch Synchronous Innovati
on-CELP: PSI-CELP). Regarding this technology, Mano, Moriya, Miki, Omuro: "Study on half-rate codecs for mobile phones", IEICE, Technical Report SP9
2-133 (February 1993). This is a method of using a noise coded vector obtained by periodicizing a fixed noise vector from the beginning, as in the adaptive codebook, using a pitch period obtained from the adaptive codebook.

【0005】PSI−CELP符号化装置の従来例を図
5を参照して具体的に説明する。図5は、PSI−CE
LP符号化装置の基本的なブロック図である。先ず、音
声入力部1から音声を入力する。線形予測分析部2にお
いて音声の線形予測分析を行い、ここにおいて量子化さ
れた予測係数Aが合成フィルタ部3における係数とな
る。
A conventional example of the PSI-CELP coding apparatus will be specifically described with reference to FIG. FIG. 5 shows PSI-CE.
It is a basic block diagram of an LP encoding device. First, a voice is input from the voice input unit 1. The linear predictive analysis unit 2 performs linear predictive analysis of speech, and the quantized predictive coefficient A becomes a coefficient in the synthesis filter unit 3.

【0006】第1の符号帳4は適応符号帳4aおよび固
定符号帳4bから成り、これら符号帳のうちのベクトル
の合成波形歪みの小さい方が選択される。適応符号帳4
aには直前の過去の合成フィルタへの入力として使用さ
れた励振音源がバッファとして蓄えられている。そし
て、図6(1)に示される如くに、このバッファ中のベ
クトルから、合成波形歪み最小となる様に、ピッチ周期
Lにより繰り返して適応符号ベクトルとする。固定符号
帳4bは、ピッチ周期性のない場合に、適応符号帳4a
の代わりに予め設定した固定雑音符号帳であり、図6
(2)の様に、周期化せずにそのまま使用される。適応
符号帳4aが選択された場合は、ピッチ周期に相当する
Lが第1の符号帳の符号になり、固定符号帳4bが選択
された場合は、固定符号帳のベクトル番号Fが第1の符
号帳の符号となる。主として、入力音声にピッチ周期性
がある有声部の場合は適応符号帳4aが選択され、周期
性のない無音、無声区間、遷移区間の場合は固定符号帳
4bが選択される。
The first codebook 4 comprises an adaptive codebook 4a and a fixed codebook 4b, and one of these codebooks having a smaller vector composite waveform distortion is selected. Adaptive codebook 4
The excitation sound source used as an input to the immediately preceding past synthesis filter is stored in a as a buffer. Then, as shown in FIG. 6 (1), the adaptive code vector is repeated from the vector in this buffer by the pitch period L so as to minimize the synthetic waveform distortion. The fixed codebook 4b is adapted to the adaptive codebook 4a when there is no pitch periodicity.
6 is a fixed noise codebook set in advance instead of
As in (2), it is used as it is without periodicization. When the adaptive codebook 4a is selected, L corresponding to the pitch period is the code of the first codebook, and when the fixed codebook 4b is selected, the vector number F of the fixed codebook is the first codebook. It becomes the code of the codebook. Mainly, the adaptive codebook 4a is selected in the case of a voiced part having pitch periodicity in the input speech, and the fixed codebook 4b is selected in the case of a silent, unvoiced section, or transition section having no periodicity.

【0007】図5の5は第2の符号帳であり、固定符号
帳4bと同様の雑音符号帳により構成されている。適応
符号帳4aが選択された場合は、第2の符号帳5の雑音
符号帳の格納ベクトルはピッチ周期化部6において周期
化される。これは、図6(3)に示される様に、各格納
ベクトルの先頭から、適応符号ベクトルと同様にピッチ
周期Lで周期化される。固定符号帳4bが選択された場
合は、第2の符号帳5の格納ベクトルがそのまま使用さ
れる。
Reference numeral 5 in FIG. 5 is a second codebook, which is composed of a noise codebook similar to the fixed codebook 4b. When the adaptive codebook 4a is selected, the storage vector of the random codebook of the second codebook 5 is periodicized by the pitch periodicization unit 6. As shown in FIG. 6 (3), this is made periodic from the beginning of each stored vector with the pitch period L as with the adaptive code vector. When the fixed codebook 4b is selected, the storage vector of the second codebook 5 is used as it is.

【0008】利得部7および利得部8の利得符号G0お
よび利得符号G1は、適応符号帳4aまたは固定符号帳
4bの第1の符号帳のベクトルと第2の符号帳5の符号
帳ベクトルとに対して、波形歪み最小となる様に最適化
される。9は入力波形と合成波形の聴覚重み付きの歪み
を求める歪み計算部であり、符号帳検索部10により最
適な符号検索を制御し、送出符号を決定する。
The gain code G0 and the gain code G1 of the gain section 7 and the gain section 8 correspond to the first codebook vector of the adaptive codebook 4a or the fixed codebook 4b and the codebook vector of the second codebook 5, respectively. On the other hand, it is optimized so as to minimize the waveform distortion. Reference numeral 9 is a distortion calculation unit that obtains a distortion of the input waveform and the synthesized waveform with auditory weighting. The codebook search unit 10 controls the optimum code search to determine the transmission code.

【0009】[0009]

【発明が解決しようとする課題】上述の通りのPSI−
CELP符号化装置においては、適応符号ベクトルにピ
ッチ周期性がある場合、ピッチピーク位置近傍に大きな
パワーの残差が偏って分布する。しかし、この従来技術
における雑音符号帳自体は固定されたものであり、適応
符号ベクトルのピッチ周期にあわせて雑音符号ベクトル
をピッチ周期化する手法を適用しても、雑音符号ベクト
ルと適応符号ベクトルの位相に関して考慮されていない
ので、ピッチピーク位置近傍にあるパワー成分の偏りに
関する情報を使用することができず、雑音符号帳に含ま
れる符号ベクトルには、選択される可能性が非常に小さ
い、ピークの分布が全く異なったものが多く含まれてい
るので、符号化効率を充分上げることができない。
As described above, the PSI-
In the CELP encoder, when the adaptive code vector has pitch periodicity, large power residuals are unevenly distributed near the pitch peak position. However, the noise codebook itself in this conventional technique is fixed, and even if a method of pitch-coding the noise code vector according to the pitch cycle of the adaptive code vector is applied, the noise code vector and the adaptive code vector Since it is not considered regarding the phase, it is not possible to use the information about the bias of the power component in the vicinity of the pitch peak position, and the code vector included in the noise codebook has a very low possibility of being selected. Since many of them have completely different distributions, the coding efficiency cannot be improved sufficiently.

【0010】この発明は、新たな伝送情報を増やすこと
なしに、各フレームにあった雑音符号ベクトルを多く含
む様な適応化機能を雑音符号帳にもたせて励振音源を多
様化した高品質音声を再生する音声の励振信号符号化方
法および装置を提供するものである。
The present invention provides a high-quality speech in which the excitation sound source is diversified by providing the noise codebook with an adaptation function that includes a large number of noise code vectors in each frame without increasing new transmission information. An excitation signal coding method and apparatus for reproducing sound is provided.

【0011】[0011]

【課題を解決するための手段】適応符号帳から得られる
過去の駆動音源ベクトルをピッチ周期で繰り返した適応
符号ベクトルと雑音符号帳から得られる雑音符号ベクト
ルとにより合成フィルタを駆動して音声信号を合成し、
入力音声信号との間の歪みを最小とする様に符号を決定
する音声の励振信号符号化方法において、適応符号ベク
トルにピッチ周期性のある場合、雑音符号帳の格納ベク
トルをその所定の基準点の位相を適応符号ベクトルから
得られるピッチピーク位置に合わせる様にずらして切り
出し、この切り出したベクトルをピッチ繰り返し周期毎
に周期化させてこれを雑音符号ベクトルとする音声の励
振信号符号化方法を構成した。
[Solution] To synthesize a speech signal by driving a synthesis filter with an adaptive code vector obtained by repeating a past drive excitation vector obtained from an adaptive codebook in a pitch cycle and a noise code vector obtained from a noise codebook. Synthesize
In a voice excitation signal coding method for determining a code so as to minimize distortion with an input voice signal, when the adaptive code vector has pitch periodicity, the storage vector of the noise codebook is set to a predetermined reference point. The phase of is extracted by shifting so as to match the pitch peak position obtained from the adaptive code vector, and the extracted vector is made periodic for each pitch repetition period, and this is used as a noise code vector to construct a speech excitation signal coding method. did.

【0012】そして、上述の音声の励振信号符号化法に
おいて、適応符号ベクトルにピッチ周期性のない場合、
雑音符号ベクトルは雑音符号帳の格納ベクトルそのもの
とする音声の励振信号符号化方法を構成した。また、適
応符号帳4から得られる過去の駆動音源ベクトルをピッ
チ周期で繰り返した適応符号ベクトルと雑音符号帳5か
ら得られる雑音符号ベクトルとにより合成フィルタ3を
駆動して音声信号を合成し、入力音声信号1との間の歪
みを最小とする様に符号を決定する音声の励振信号符号
化装置において、適応符号帳4から得られる適応符号ベ
クトルの始点からピーク位置までの位相φを検出する位
相探索部11を具備し、雑音符号帳5から得られる格納
ベクトルの位相を位相探索部11により検出される位相
φに基づいて位相適応化する位相適応部12を具備し、
位相適応部12から得られる位相適応化された雑音符号
ベクトルをピッチ周期化する周期化部6を具備し、周期
化部6および位相探索部11をピッチ周期信号Lにより
切り替え動作せしめる音声の励振信号符号化装置を構成
した。
Then, in the above speech excitation signal coding method, when the adaptive code vector has no pitch periodicity,
The noise code vector is the stored vector of the noise codebook itself, and the excitation signal coding method for speech is constructed. In addition, the synthesis filter 3 is driven by the adaptive code vector obtained by repeating the past driving excitation vector obtained from the adaptive codebook 4 in the pitch cycle and the noise code vector obtained from the noise codebook 5, and the speech signal is synthesized and input. A phase for detecting a phase φ from a start point to a peak position of an adaptive code vector obtained from an adaptive codebook 4 in a speech excitation signal coding apparatus that determines a code so as to minimize distortion with the speech signal 1. The search unit 11 is provided, and the phase adaptation unit 12 that adapts the phase of the stored vector obtained from the random codebook 5 based on the phase φ detected by the phase search unit 11 is provided.
An excitation signal of a voice, which is provided with a periodization unit 6 that makes the phase adaptation noise code vector obtained from the phase adaptation unit 12 into a pitch period, and causes the periodization unit 6 and the phase search unit 11 to perform switching operation by the pitch period signal L. An encoding device was constructed.

【0013】更に、上述の音声の励振信号符号化装置に
おいて、適応符号ベクトルにピッチ周期性のない場合、
雑音符号ベクトルは雑音符号帳5の格納ベクトルそのも
のとする音声の励振信号符号化装置をも構成した。
Further, in the above speech excitation signal coding apparatus, when the adaptive code vector has no pitch periodicity,
The random code vector is also the storage vector itself of the random codebook 5, and also constitutes a voice excitation signal coding apparatus.

【0014】[0014]

【実施例】この発明の実施例を図1を参照して説明す
る。図1に示されるこの発明の実施例は、図5に示され
る従来例と比較して、第2の符号帳5を構成する符号帳
が雑音符号帳が5aおよび雑音符号帳5bの2種類であ
るところと、位相探索部11および位相適応部12が新
たに付加されたところが相違している。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENT An embodiment of the present invention will be described with reference to FIG. The embodiment of the present invention shown in FIG. 1 is different from the conventional example shown in FIG. 5 in that there are two types of codebooks constituting the second codebook 5, a random codebook 5a and a random codebook 5b. The difference is that the phase search unit 11 and the phase adaptation unit 12 are newly added.

【0015】先ず、音声入力部1から音声を入力する。
線形予測分析部2において音声の線形予測分析を行い、
ここにおいて量子化された予測係数Aが合成フィルタ3
の係数となる。第1の符号帳4は適応符号帳4aおよび
固定符号帳4bより成り、これら符号帳のベクトルのう
ちの合成波形歪みの小さい何れか一方が選択される。適
応符号帳4aには直前の過去の合成フィルタへの入力と
して使用された励振音源がバッファとして蓄えてある。
そして、このバッファ中のベクトルから、合成波形歪み
最小となる様に、ピッチ周期Lで周期化した適応符号ベ
クトルを求める。固定符号帳4bはピッチ周期性のない
場合に選択される固定雑音符号帳であり、周期化せずに
そのまま使用される。適応符号帳4aが選択された場合
はピッチ周期に相当するLが第1の符号帳の符号にな
り、固定符号帳4bが選択された場合は固定符号帳のベ
クトル番号Fが第1の符号帳の符号となる。
First, a voice is input from the voice input unit 1.
The linear predictive analysis unit 2 performs a linear predictive analysis of speech,
Here, the quantized prediction coefficient A is the synthesis filter 3
It becomes the coefficient of. The first codebook 4 is composed of an adaptive codebook 4a and a fixed codebook 4b, and one of the vectors of these codebooks having a small synthetic waveform distortion is selected. In the adaptive codebook 4a, the excitation sound source used as an input to the immediately preceding past synthesis filter is stored as a buffer.
Then, from the vectors in this buffer, an adaptive code vector that is periodic with the pitch period L so as to minimize the synthetic waveform distortion is obtained. The fixed codebook 4b is a fixed noise codebook selected when there is no pitch periodicity, and is used as it is without being periodicized. When the adaptive codebook 4a is selected, L corresponding to the pitch period is the code of the first codebook, and when the fixed codebook 4b is selected, the vector number F of the fixed codebook is the first codebook. Is the sign of.

【0016】5は第2の符号帳であり、雑音符号帳が5
aおよび雑音符号帳5bの2種類より成り、これらは固
定符号帳4bと同様の雑音符号帳である。適応符号帳4
aが選択された場合は、雑音符号帳5aが使用される。
位相探索部11で得られる位相を使用して、雑音符号帳
5aの格納ベクトルから、位相適応部12において位相
分だけずらせたベクトルを抽出する。この抽出されたベ
クトルに対して、ピッチ周期化部6において適応符号帳
4aと同様にピッチ周期化を行う。なお、周期化部6お
よび位相探索部11はピッチ周期信号Lにより切り替え
動作せしめられるものである。第1の符号帳の固定符号
帳4bが選択された場合は、第2の雑音符号帳5は雑音
符号帳5bが使用される。この場合は、雑音符号帳の格
納ベクトルが位相適応化されたり、周期化されたりする
ことはなく、そのまま雑音符号ベクトルとして使用され
る。
5 is a second codebook, and the random codebook is 5.
a and a random codebook 5b, which are similar to the fixed codebook 4b. Adaptive codebook 4
When a is selected, the random codebook 5a is used.
The phase obtained by the phase search unit 11 is used to extract a vector shifted by the phase in the phase adaptation unit 12 from the stored vector of the noise codebook 5a. The pitch cycler 6 performs pitch cycler on the extracted vector as in the adaptive codebook 4a. The cycler 6 and the phase searcher 11 are switched by the pitch cycle signal L. When the fixed codebook 4b of the first codebook is selected, the random codebook 5b is used as the second random codebook 5. In this case, the stored vector of the random codebook is not phase-adapted or periodicized, and is used as it is as the random code vector.

【0017】その後、適応符号帳4aまたは固定符号帳
4bからの第1の符号帳ベクトル、および雑音符号帳5
aまたは雑音符号帳5bからの第2の符号帳ベクトルに
対して、利得部7の利得G0および利得部8の利得G1
が波形歪み最小となる様に符号化される。9は入力波形
と合成波形の聴覚重み付きの歪みを計算する歪み計算部
であり、符号帳探索部10により最適な符号探索を制御
し、送出符号を決定する。
Thereafter, the first codebook vector from the adaptive codebook 4a or the fixed codebook 4b and the random codebook 5 are obtained.
a or the second codebook vector from the random codebook 5b, the gain G0 of the gain unit 7 and the gain G1 of the gain unit 8
Is encoded so that waveform distortion is minimized. Reference numeral 9 denotes a distortion calculation unit that calculates the distortion of the input waveform and the combined waveform with auditory weighting. The codebook search unit 10 controls the optimum code search to determine the transmission code.

【0018】図2は、図1の位相探索部11における適
応符号ベクトルと抽出すべき位相の関係を示した図であ
る。図2(1)は、適応符号帳4aから得られる適応符
号ベクトルである。1フレーム内においてはピッチ周期
がほぼLであると仮定し、図2(2)の様に、周期Lの
ピッチピークを後で説明される如くして捉える。そし
て、フレームの始点から最初のピッチピーク位置までの
ずれを位相φとして位相探索部の出力とし、これが位相
適応部12において使用される。
FIG. 2 is a diagram showing the relationship between the adaptive code vector and the phase to be extracted in the phase search unit 11 of FIG. FIG. 2 (1) shows an adaptive code vector obtained from the adaptive codebook 4a. It is assumed that the pitch period is approximately L in one frame, and the pitch peak of the period L is captured as described later, as shown in FIG. Then, the shift from the start point of the frame to the first pitch peak position is set as the phase φ and is set as the output of the phase search unit, and this is used in the phase adaptation unit 12.

【0019】適応符号ベクトルが与えられた場合の位相
φの抽出方法は、これまでに種々のものが考えられてい
る。図3にその例を示す。図3(0)は、図1の適応符
号帳4aから得られた適応符号ベクトルである。第1の
方法は図3(1)の様に始点から位相候補φだけオフセ
ットをとり、そこから周期Lのインパルス列を作り、こ
のインパルス列を合成フィルタに通した波形と、適応符
号ベクトルを合成フィルタに通した波形の間の歪み最小
となる場合の位相φを使用する手法である。第2の方法
は、図3(2)aに示される様に、適応符号ベクトルの
バワー包絡をとり、長さLごとに区切った区間のφだけ
ずらした場所のパワーの総和が最大になる場合の位相を
使用するものである。この実施例においては、この何れ
を使用してもよく、符号器、復号器の何れでも計算可能
なバックワード構成である。
Various methods of extracting the phase φ when an adaptive code vector is given have been considered so far. FIG. 3 shows an example thereof. FIG. 3 (0) is an adaptive code vector obtained from the adaptive codebook 4a in FIG. In the first method, as shown in FIG. 3 (1), the phase candidate φ is offset from the starting point, an impulse train with a period L is created from the offset, and the waveform obtained by passing the impulse train through a synthesis filter and the adaptive code vector are synthesized. It is a method that uses the phase φ when the distortion between the filtered waveforms is minimal. In the second method, as shown in FIG. 3 (2) a, when the power envelope of the adaptive code vector is taken and the total sum of powers at positions deviated by φ in sections divided for each length L becomes maximum. The phase of is used. In this embodiment, any of these may be used, and the backward configuration is such that either the encoder or the decoder can calculate.

【0020】図4は、図1の雑音符号帳5a、位相適応
部12、周期化部6の処理の流れを示したものである。
図4(1)は雑音符号帳5aの格納ベクトルの例を示し
ている。この格納ベクトルの長さは、最終的に得られる
符号ベクトル長Nより長いN+Mとする。そして、この
格納ベクトルは、図の基準点0に適応符号ベクトルのピ
ッチピーク位置がくると仮定し、切り出す長さNのベク
トルの始点が〔−M,0〕の範囲で可変となる様に雑音
符号帳5aは設計されているものとする。図1の位相適
応部12においては、図4(1)の格納ベクトルから、
図1の位相探索部11で得られたベクトルの始点からピ
ーク位置までの位相ずれφだけずれた点から、ベクトル
を切りだす。これが図4(2)の位相適応化ベクトルで
ある。そして、図1のピッチ周期化部6において、図4
(2)の位相適応化ベクトルを、先頭からピッチ周期L
で周期化する。以上の処理により、図4(3)の様な位
相適応化とピッチ周期化を行ったベクトルを発生するこ
とができる。
FIG. 4 shows the processing flow of the random codebook 5a, the phase adaptation unit 12, and the periodicization unit 6 of FIG.
FIG. 4 (1) shows an example of the storage vector of the random codebook 5a. The length of this stored vector is N + M, which is longer than the finally obtained code vector length N. Then, assuming that the pitch peak position of the adaptive code vector comes to the reference point 0 in the figure, this stored vector is noise so that the starting point of the vector of the cut-out length N is variable in the range of [-M, 0]. It is assumed that the codebook 5a is designed. In the phase adaptation unit 12 of FIG. 1, from the stored vector of FIG.
A vector is cut out from a point shifted by a phase shift φ from the start point of the vector obtained by the phase search unit 11 in FIG. 1 to the peak position. This is the phase adaptation vector of FIG. 4 (2). Then, in the pitch cycle unit 6 of FIG.
The phase adaptation vector of (2) is set to the pitch period L from the beginning.
To cycle. By the above processing, it is possible to generate a vector that has been phase-adapted and pitch-periodized as shown in FIG.

【0021】以上において雑音符号帳5aは、適応符号
ベクトルのピッチピーク位置は基準点0にくるものと仮
定したが、雑音符号ベクトル5aの基準点の位置が必ず
しも振幅の高い波形とは限らず、適応符号ベクトル4a
のLが必ずしもピッチ周期とは限らないので、雑音符号
ベクトル5aは学習によって設計することが重要であ
る。ここにおいては、位相適応を考慮した一般化Llo
ydアルゴリズムに基づく量子化符号帳学習を行う。
In the above, the noise codebook 5a assumes that the pitch peak position of the adaptive code vector comes to the reference point 0, but the position of the reference point of the noise code vector 5a is not always a waveform with high amplitude, Adaptive code vector 4a
It is important that the noise code vector 5a is designed by learning, since L is not necessarily the pitch period. Here, a generalized Llo considering phase adaptation
Quantization codebook learning based on the yd algorithm is performed.

【0022】この実施例で示した励振構造によって、適
応符号帳4aが選択された場合に、そのピッチピーク位
置の位相φに適応した雑音符号ベクトルを構成すること
ができ、符号化効率を高めることができる。
With the excitation structure shown in this embodiment, when the adaptive codebook 4a is selected, a noise code vector adapted to the phase φ at the pitch peak position can be constructed, and the coding efficiency can be improved. You can

【0023】[0023]

【発明の効果】この発明を要約するに、雑音符号帳に格
納されているベクトルに予め与えておいた基準点に、適
応符号ベクトルからバックワード的に得られるピッチピ
ーク位置のずれ、即ち、位相を合わせるために、ベクト
ルの始点をずらせて、基準点がピッチピークに対応する
様に位相シフトした後、ピッチ繰り返し周期と同じ周期
でベクトルを周期化させた雑音符号ベクトルを使用する
ことをこの発明の特徴としている。この様にすることに
より、得られる雑音符号ベクトルが適応符号ベクトルの
ピッチピーク位置に適応することとなる。
In summary of the present invention, the deviation of the pitch peak position obtained backward from the adaptive code vector, that is, the phase, at the reference point given in advance to the vector stored in the random codebook In order to match the present invention, it is possible to shift the start point of the vector and phase-shift it so that the reference point corresponds to the pitch peak, and then use a random code vector in which the vector is made periodic at the same period as the pitch repetition period. It is a feature of. By doing so, the obtained noise code vector is adapted to the pitch peak position of the adaptive code vector.

【0024】適応符号ベクトルからピッチピーク位置を
検出し、雑音符号帳ベクトルの基準点をこのピッチピー
ク位置に合わせることにより、常にピッチピーク周辺に
雑音符号ベクトルの大きなパワーの偏りのある時系列を
適応化させることができる。これを、更に周期化させる
ことにより、フレーム内における雑音ベクトルとしてピ
ッチの各繰り返しピーク付近にパワーの偏りを持ち、且
つ、ピッチ周期性のある雑音符号ベクトルを適応的に作
り出すことができる。また、上述の操作は、適応符号帳
が決まれば行えるバックワード構成を採用しているの
で、新たな情報を伝送することなしに、符号器と復号器
で同じ処理が可能である。
By detecting the pitch peak position from the adaptive code vector and aligning the reference point of the noise codebook vector with this pitch peak position, a time series with a large power bias of the noise code vector is always applied around the pitch peak. Can be transformed. By further periodicizing this, it is possible to adaptively generate a noise code vector having a pitch bias and a power bias near each repeating peak of the pitch as a noise vector in the frame. Further, since the above-described operation adopts the backward configuration that can be performed if the adaptive codebook is determined, the same processing can be performed by the encoder and the decoder without transmitting new information.

【0025】以上の通りであって、この発明は、雑音符
号ベクトルをバックワードで適応符号ベクトルから得ら
れるピッチピークの位相に適応させた後、更に、ピッチ
周期化を行う雑音符号ベクトルを構成することにより、
従来不可能であった適応符号ベクトルのピッチピーク位
置に対応した雑音符号ベクトルを生成することができ
る。従って、新たな伝送情報を増やさずに、各フレーム
に対応した雑音符号ベクトルを多く含ませる機能を雑音
符号帳に取り入れて励振音源を多様化し、符号化効率を
高め、低ビットレートでも高品質な音声符号化をするこ
とができる。
As described above, according to the present invention, the noise code vector is adapted to the phase of the pitch peak obtained from the adaptive code vector in the backward direction, and then the noise code vector is further subjected to pitch periodicization. By
It is possible to generate a noise code vector corresponding to the pitch peak position of the adaptive code vector, which has been impossible in the past. Therefore, without increasing new transmission information, a function to include many noise code vectors corresponding to each frame is incorporated into the noise codebook to diversify the excitation source, improve coding efficiency, and achieve high quality even at low bit rates. It can be voice coded.

【図面の簡単な説明】[Brief description of drawings]

【図1】この発明の音声符号化装置のブロック図。FIG. 1 is a block diagram of a voice encoding device according to the present invention.

【図2】ピッチピーク位置と位相の関係を説明する図。FIG. 2 is a diagram illustrating a relationship between a pitch peak position and a phase.

【図3】位相抽出を説明する図。FIG. 3 is a diagram illustrating phase extraction.

【図4】この発明の音声符号化装置の励振信号生成部を
説明する図。
FIG. 4 is a diagram explaining an excitation signal generation unit of the speech encoding device of the present invention.

【図5】音声符号化装置の従来例のブロック図。FIG. 5 is a block diagram of a conventional example of a voice encoding device.

【図6】音声符号化装置の従来例の励振信号生成部を説
明する図。
FIG. 6 is a diagram illustrating a conventional excitation signal generation unit of a speech encoding device.

【符号の説明】[Explanation of symbols]

1 音声入力部 2 線形予測分析部 3 合成フィルタ 4 第1の符号帳 4a 適応符号帳 4b 固定符号帳 5 第2の符号帳 5a 雑音符号帳 5b 雑音符号帳 6 周期化部 9 歪み計算部 10 符号帳探索部 11 位相探索部 12 位相適応部 1 Speech Input Unit 2 Linear Prediction Analysis Unit 3 Synthesis Filter 4 First Codebook 4a Adaptive Codebook 4b Fixed Codebook 5 Second Codebook 5a Noise Codebook 5b Noise Codebook 6 Periodicizer 9 Distortion Calculator 10 Code Book search unit 11 Phase search unit 12 Phase adaptation unit

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】 適応符号帳から得られる過去の駆動音源
ベクトルをピッチ周期で繰り返した適応符号ベクトルと
雑音符号帳から得られる雑音符号ベクトルとにより合成
フィルタを駆動して音声信号を合成し、入力音声信号と
の間の歪みを最小とする様に符号を決定する音声の励振
信号符号化方法において、適応符号ベクトルにピッチ周
期性のある場合、雑音符号帳の格納ベクトルをその所定
の基準点の位相を適応符号ベクトルから得られるピッチ
ピーク位置に合わせる様にずらして切り出し、この切り
出したベクトルをピッチ繰り返し周期毎に周期化させて
これを雑音符号ベクトルとすることを特徴とする音声の
励振信号符号化方法。
1. A synthesis filter is driven by an adaptive code vector obtained by repeating a past driving excitation vector obtained from the adaptive codebook in a pitch cycle and a noise code vector obtained from the noise codebook to synthesize a speech signal, and input. In a voice excitation signal coding method that determines a code so as to minimize distortion with a voice signal, when the adaptive code vector has pitch periodicity, the storage vector of the noise codebook is set to a predetermined reference point. A voice excitation signal code characterized by shifting out the phase so as to match the pitch peak position obtained from the adaptive code vector, making the cut out vector periodic at each pitch repetition period, and using this as a noise code vector. Method.
【請求項2】 請求項1に記載される音声の励振信号符
号化法において、適応符号ベクトルにピッチ周期性のな
い場合、雑音符号ベクトルは雑音符号帳の格納ベクトル
そのものとすることを特徴とする音声の励振信号符号化
方法。
2. The speech excitation signal coding method according to claim 1, wherein when the adaptive code vector has no pitch periodicity, the noise code vector is the storage vector itself of the noise codebook. Speech excitation signal coding method.
【請求項3】 適応符号帳から得られる過去の駆動音源
ベクトルをピッチ周期で繰り返した適応符号ベクトルと
雑音符号帳から得られる雑音符号ベクトルとにより合成
フィルタを駆動して音声信号を合成し、入力音声信号と
の間の歪みを最小とする様に符号を決定する音声の励振
信号符号化装置において、適応符号帳から得られる適応
符号ベクトルの始点からピーク位置までの位相を検出す
る位相探索部を具備し、雑音符号帳から得られる格納ベ
クトルの位相を位相探索部により検出される位相に基づ
いて位相適応化する位相適応部を具備し、位相適応部か
ら得られる位相適応化された雑音符号ベクトルをピッチ
周期化する周期化部を具備し、周期化部および位相探索
部をピッチ周期信号により切り替え動作せしめることを
特徴とする音声の励振信号符号化装置。
3. A synthesis filter is driven by an adaptive code vector obtained by repeating a past driving excitation vector obtained from the adaptive codebook in a pitch cycle and a noise code vector obtained from the noise codebook to synthesize a speech signal, and input. In a voice excitation signal coding apparatus that determines a code so as to minimize distortion with a voice signal, a phase search unit that detects a phase from a start point to a peak position of an adaptive code vector obtained from an adaptive codebook is provided. A phase adaptive noise code vector obtained from the phase adaptation unit, comprising a phase adaptation unit for phase-adapting the phase of the stored vector obtained from the noise codebook based on the phase detected by the phase search unit. A voice excitation characterized by comprising a periodization unit for making a pitch period, and switching the periodization unit and the phase search unit by a pitch period signal. Swing signal encoder.
【請求項4】 請求項3に記載される音声の励振信号符
号化装置において、適応符号ベクトルにピッチ周期性の
ない場合、雑音符号ベクトルは雑音符号帳の格納ベクト
ルそのものとすることを特徴とする音声の励振信号符号
化装置。
4. The excitation signal coding apparatus for speech according to claim 3, wherein when the adaptive code vector has no pitch periodicity, the noise code vector is the storage vector itself of the noise codebook. Audio excitation signal encoder.
JP23639093A 1993-09-22 1993-09-22 Method and apparatus for encoding excitation signal of speech Expired - Lifetime JP3199142B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP23639093A JP3199142B2 (en) 1993-09-22 1993-09-22 Method and apparatus for encoding excitation signal of speech

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP23639093A JP3199142B2 (en) 1993-09-22 1993-09-22 Method and apparatus for encoding excitation signal of speech

Publications (2)

Publication Number Publication Date
JPH0792999A true JPH0792999A (en) 1995-04-07
JP3199142B2 JP3199142B2 (en) 2001-08-13

Family

ID=17000067

Family Applications (1)

Application Number Title Priority Date Filing Date
JP23639093A Expired - Lifetime JP3199142B2 (en) 1993-09-22 1993-09-22 Method and apparatus for encoding excitation signal of speech

Country Status (1)

Country Link
JP (1) JP3199142B2 (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998006091A1 (en) * 1996-08-02 1998-02-12 Matsushita Electric Industrial Co., Ltd. Voice encoder, voice decoder, recording medium on which program for realizing voice encoding/decoding is recorded and mobile communication apparatus
WO2000008633A1 (en) * 1998-08-06 2000-02-17 Matsushita Electric Industrial Co., Ltd. Exciting signal generator, voice coder, and voice decoder
US6345246B1 (en) 1997-02-05 2002-02-05 Nippon Telegraph And Telephone Corporation Apparatus and method for efficiently coding plural channels of an acoustic signal at low bit rates
US6594626B2 (en) 1999-09-14 2003-07-15 Fujitsu Limited Voice encoding and voice decoding using an adaptive codebook and an algebraic codebook
US7089179B2 (en) 1998-09-01 2006-08-08 Fujitsu Limited Voice coding method, voice coding apparatus, and voice decoding apparatus
US7228272B2 (en) 2001-06-29 2007-06-05 Microsoft Corporation Continuous time warping for low bit-rate CELP coding
JP2010506221A (en) * 2006-10-06 2010-02-25 クゥアルコム・インコーポレイテッド Frame erasure recovery system, method and apparatus

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998006091A1 (en) * 1996-08-02 1998-02-12 Matsushita Electric Industrial Co., Ltd. Voice encoder, voice decoder, recording medium on which program for realizing voice encoding/decoding is recorded and mobile communication apparatus
US6226604B1 (en) 1996-08-02 2001-05-01 Matsushita Electric Industrial Co., Ltd. Voice encoder, voice decoder, recording medium on which program for realizing voice encoding/decoding is recorded and mobile communication apparatus
US6421638B2 (en) 1996-08-02 2002-07-16 Matsushita Electric Industrial Co., Ltd. Voice encoding device, voice decoding device, recording medium for recording program for realizing voice encoding/decoding and mobile communication device
US6549885B2 (en) 1996-08-02 2003-04-15 Matsushita Electric Industrial Co., Ltd. Celp type voice encoding device and celp type voice encoding method
US6687666B2 (en) 1996-08-02 2004-02-03 Matsushita Electric Industrial Co., Ltd. Voice encoding device, voice decoding device, recording medium for recording program for realizing voice encoding/decoding and mobile communication device
US6345246B1 (en) 1997-02-05 2002-02-05 Nippon Telegraph And Telephone Corporation Apparatus and method for efficiently coding plural channels of an acoustic signal at low bit rates
WO2000008633A1 (en) * 1998-08-06 2000-02-17 Matsushita Electric Industrial Co., Ltd. Exciting signal generator, voice coder, and voice decoder
US7089179B2 (en) 1998-09-01 2006-08-08 Fujitsu Limited Voice coding method, voice coding apparatus, and voice decoding apparatus
US6594626B2 (en) 1999-09-14 2003-07-15 Fujitsu Limited Voice encoding and voice decoding using an adaptive codebook and an algebraic codebook
US7228272B2 (en) 2001-06-29 2007-06-05 Microsoft Corporation Continuous time warping for low bit-rate CELP coding
JP2010506221A (en) * 2006-10-06 2010-02-25 クゥアルコム・インコーポレイテッド Frame erasure recovery system, method and apparatus
US8825477B2 (en) 2006-10-06 2014-09-02 Qualcomm Incorporated Systems, methods, and apparatus for frame erasure recovery

Also Published As

Publication number Publication date
JP3199142B2 (en) 2001-08-13

Similar Documents

Publication Publication Date Title
AU2002221389B2 (en) Indexing pulse positions and signs in algebraic codebooks for coding of wideband signals
JP3346765B2 (en) Audio decoding method and audio decoding device
JP4005359B2 (en) Speech coding and speech decoding apparatus
US6055496A (en) Vector quantization in celp speech coder
EP3214619B1 (en) System and method for mixed codebook excitation for speech coding
WO2001052241A1 (en) Multi-mode voice encoding device and decoding device
EP1141947A2 (en) Variable rate speech coding
JPH11327597A (en) Voice coding device and voice decoding device
JP3343082B2 (en) CELP speech encoder
JP3746067B2 (en) Speech decoding method and speech decoding apparatus
WO2002071394A1 (en) Sound encoding apparatus and method, and sound decoding apparatus and method
EP1103953B1 (en) Method for concealing erased speech frames
JP3199142B2 (en) Method and apparatus for encoding excitation signal of speech
JP3292227B2 (en) Code-excited linear predictive speech coding method and decoding method thereof
JP3583945B2 (en) Audio coding method
JP4800285B2 (en) Speech decoding method and speech decoding apparatus
JP3232701B2 (en) Audio coding method
JPH0519795A (en) Excitation signal encoding and decoding method for voice
JPH0519796A (en) Excitation signal encoding and decoding method for voice
JP3410931B2 (en) Audio encoding method and apparatus
JP2002073097A (en) Celp type voice coding device and celp type voice decoding device as well as voice encoding method and voice decoding method
JP3563400B2 (en) Audio decoding device and audio decoding method
Park et al. On a time reduction of pitch searching by the regular pulse search technique in the CELP vocoder
WO2001009880A1 (en) Multimode vselp speech coder
JP2001265396A (en) Multimode voice coding device and decoding device

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090615

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090615

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100615

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100615

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110615

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120615

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130615

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140615

Year of fee payment: 13