JP2853126B2 - Multi-pulse encoder - Google Patents

Multi-pulse encoder

Info

Publication number
JP2853126B2
JP2853126B2 JP63075023A JP7502388A JP2853126B2 JP 2853126 B2 JP2853126 B2 JP 2853126B2 JP 63075023 A JP63075023 A JP 63075023A JP 7502388 A JP7502388 A JP 7502388A JP 2853126 B2 JP2853126 B2 JP 2853126B2
Authority
JP
Japan
Prior art keywords
pulse
pitch
quantization
interval
multipulse
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63075023A
Other languages
Japanese (ja)
Other versions
JPH01246600A (en
Inventor
哲 田口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP63075023A priority Critical patent/JP2853126B2/en
Publication of JPH01246600A publication Critical patent/JPH01246600A/en
Application granted granted Critical
Publication of JP2853126B2 publication Critical patent/JP2853126B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

PURPOSE:To allow the lower bit of multipulse interval quantization in the state of improving the degradation in coding efficiency by the various lengths of pitch periods by controlling the multipulse interval quantization range by pitch information. CONSTITUTION:A pulse quantizer 112 executes the quantization of the multipulse trains for prediction. Thus quantization is executed with respect to the max. amplitude of the pulses included in the multipulse train for prediction, the normalization expression value of the other pulse amplitude with respect to the max. amplitude and the intervals of the respective pulses. The quantization of the pulse intervals is so controlled in this case that the limitation of the quantization range is imparted in the form of setting the min. section in accordance with the pitch information outputted by a pitch extractor 111. The number of quantization pitches is thereby decreased and the coding efficiency is improved.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明はマルチパルス符号化装置に関し、特にピッチ
予測型のマルチパルス符号化装置に関する。
Description: BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a multi-pulse coding device, and more particularly to a pitch prediction type multi-pulse coding device.

〔従来の技術〕 入力音声を複数個のパルスからなる、いわゆるマルチ
パルスで表現し、これを音声合成フィルタの入力として
供給するマルチパルス符号化装置はよく知られている。
2. Description of the Related Art A multi-pulse encoding apparatus that expresses input speech as a so-called multi-pulse consisting of a plurality of pulses and supplies the input speech as an input to a speech synthesis filter is well known.

マルチパルスの検索方法としても種種あり、有力な音
源情報の一要素であるピッチ情報を検索処理に利用して
行なうものと然らざるものとがあり、また利用するピッ
チ情報も配分ビットレートが少なくてすむピッチ予測処
理によって求める場合と然らざる場合とがある。
There are various types of multi-pulse search methods. Some search methods use pitch information, which is one element of powerful sound source information, for search processing. There are cases where it is obtained by the use of a pitch prediction process and cases where it is not.

いずれにせよ、検索したマルチパルスは、その振幅情
報とパルス間隔情報を分析側から合成側に符号化伝送す
る必要があるが、マルチパルスの振幅と位置情報の量子
化におけるビットレートの割当て配分は直接合成音の品
質を左右し、特に振幅情報に比して著しく多くのビット
配分を必要とするパルス間隔の量子化は、合成すべき音
声品質との効率的トレードオフを運用目的に応じて最適
設定することが必要である。
In any case, in the searched multipulse, it is necessary to encode and transmit the amplitude information and the pulse interval information from the analysis side to the synthesis side. Quantization of the pulse interval, which directly affects the quality of synthesized speech and requires a significantly larger number of bits compared to the amplitude information, optimizes the efficient trade-off with the speech quality to be synthesized according to the operation purpose It is necessary to set.

一般的に言って、入力音声を符号化して分析側から合
成側から合成側に伝送する手法には大別して2つの手法
があり、その1つはPCMの如く再生音質の比重を大とし
波形自体の符号化を行なう波形符号化手法であり、他の
1つは再生音質の多少の劣化は招くものの運用目的の許
容範囲でより強く低ビット化を狙うもので、マルチパル
ス符号化の如く音声スペクトルの符号化という形式で行
なうスペクトル符号化手法である。前者の場合、たとえ
ばPCM手法においては64Kb/s(キロビット/秒)の処理
ビットレートを必要とするのに対し、後者のスペクトル
符号化は著しく低ビットレート化が可能であり、運用目
的と符号化手法との組合せでは10数Kb/sから数Kb/s程度
の低ビット化が進んでいる。
Generally speaking, there are roughly two methods for encoding input speech and transmitting it from the analysis side to the synthesis side, one of which is to increase the specific gravity of the reproduced sound quality and increase the waveform itself as in PCM. The other is a waveform encoding method that performs encoding of the audio signal. The other method aims to reduce the number of bits as much as possible within the allowable range of the operation purpose, although the reproduced sound quality is slightly deteriorated. This is a spectrum encoding method performed in the form of encoding. In the former case, for example, the PCM method requires a processing bit rate of 64 Kb / s (kilobits / second), whereas the latter uses remarkably lower bit rates in spectral coding. In combination with the method, bit reduction of about 10 several Kb / s to several Kb / s is progressing.

ピッチ予測型マルチパルス符号化装置は、上述したス
ペクトル符号化に対してピッチ予測手法を適用しさらに
低ビットレート化を図ったものである。
The pitch prediction type multi-pulse coding apparatus is configured to apply a pitch prediction method to the above-described spectrum coding and further reduce the bit rate.

このようなピッチ予測型マルチパルス符号化装置にあ
っては、合成側で音声再生に必要とする音源情報として
必要なマルチパルスを分析フレームごとにすべて送出す
る代りに、ピッチ情報によってその繰返し周期が実用上
ほぼ明確に決定される有声区間に対しては、ピッチ情報
による繰返し周期とこの繰返し周期に含まれるマルチパ
ルスのみを分析側から合成側に伝送し、合成側では巡回
型ディジタルフィルタ等で繰返し性を利用して予測再生
するものである。
In such a pitch prediction type multi-pulse encoding apparatus, instead of sending out all the multi-pulses required as sound source information required for sound reproduction on the synthesis side for each analysis frame, the repetition period is determined by the pitch information. For a voiced section that is determined almost clearly in practice, only the repetition period based on the pitch information and the multi-pulses included in this repetition period are transmitted from the analysis side to the synthesis side, and the synthesis side repeats it using a cyclic digital filter or the like. Predictive reproduction is performed using the characteristics.

このようなピッチ予測型マルチパルス符号化装置にあ
っても、低ビット化と再生音質のトレードオフは当然の
課題であり、たかだか数Kb/s程度の低ビットで極力波形
符号化に近接した品質に近接する符号化が一つの目標と
なっている。
Even in such a pitch prediction type multi-pulse coding apparatus, the trade-off between low bit rate and reproduction sound quality is a matter of course, and the quality is as low as several Kb / s at most as close to waveform coding as possible. Encoding is one goal.

かかる低ビット化を実現するためには、パルス間隔量
子化ビット数の削減が極め手となるが、この場合の量子
化ビット数は、量子化する時間的範囲と量子化精度に依
存し、従来の量子化範囲の設定では、パルス間隔を1〜
2Nにわたって量子化している。ここでNはパルス間隔量
子化において付与したビット数であり、1〜2Nは、たと
えばタイムスロットの1番目から2N番目まで設定して間
隔を表現することを意味する。
In order to realize such a reduction in the number of bits, reduction of the number of pulse interval quantization bits is extremely important. However, the number of quantization bits in this case depends on the time range of quantization and the quantization precision, In setting the quantization range of
Quantization over 2 N. Where N is the number of bits assigned in the pulse interval quantization, 1 to 2 N is meant to represent the spacing, for example, set from the first time slot to the 2 N th.

〔発明が解決しようとする課題〕[Problems to be solved by the invention]

上述して従来のピッチ予測型マルチパルス符号化装置
にあっては、ピッチ情報を提供する大多数のマルチパル
スが本質的に1ピッチ周期区間に集中し、従ってピッチ
周期の長短により平均パルス間隔が異る。
As described above, in the conventional pitch prediction type multi-pulse coding apparatus, the majority of multi-pulses providing pitch information are essentially concentrated in one pitch period section. Different.

従来は、このようなピッチ周期の特徴を考慮すること
なくマルチパルス間隔の量子化を行なっており、従って
符号化効率がその分低下するという欠点がある。
Conventionally, quantization of the multi-pulse interval is performed without considering such a characteristic of the pitch period, and therefore, there is a disadvantage that the coding efficiency is reduced accordingly.

本発明の目的は上述した欠点を除去し、マルチパルス
間隔量子化範囲をピッチ情報に対応して制御することに
より、著しく符号化効率を改善しうるピッチ予測型マル
チパルス符号化装置を提供することにある。
SUMMARY OF THE INVENTION An object of the present invention is to provide a pitch prediction type multi-pulse coding apparatus which can improve coding efficiency remarkably by controlling the multi-pulse interval quantization range in accordance with pitch information by eliminating the above-mentioned disadvantages. It is in.

〔課題を解決するための手段〕[Means for solving the problem]

本発明の装置は、ピッチ予測型のマルチパルス符号化
装置いおいて、マルチパルスを検索するマルチパルス検
索手段と、音源のピッチ情報を抽出するピッチ抽出手段
と、前記マルチパルス検索手段で検索したマルチパルス
のパルス間隔の量子化範囲を前記ピッチ情報にもとづい
て制御する制御手段を備え、前記制御手段は前記ピッチ
情報にもとづいて前記量子化範囲から除外される最小間
隔を最小区間の設定により行なうことを特徴としてい
る。
In the pitch prediction type multi-pulse encoding apparatus, the apparatus of the present invention includes a multi-pulse search means for searching for a multi-pulse, a pitch extraction means for extracting pitch information of a sound source, and a multi-pulse searched for by the multi-pulse search means. Control means for controlling a quantization range of a pulse interval of a pulse based on the pitch information, wherein the control means sets a minimum interval excluded from the quantization range based on the pitch information by setting a minimum interval. It is characterized by.

〔実施例〕〔Example〕

次に図面を参照して本発明を詳細に説明する。 Next, the present invention will be described in detail with reference to the drawings.

第1図は本発明の一実施例のブロック図である。第1
図に示す実施例は、マルチパルスを分析フレームごとに
検索し、有声区間にあってはピッチ情報による繰返し性
を利用して合成側で再現しうる代表データとしての予測
化マルチパルスの符号化データと、入力音声のLPC(Lin
ear Prediction Coding)係数を符号化したデータと、
ピッチデータとを多重化して送出する分析側(符号化
側)1と、分析側1から伝送路3を介して送出されるマ
ルチパルスとLPC係数とピッチデータと復号して入力音
声を合成する合成側(復号化側)2から成る。
FIG. 1 is a block diagram of one embodiment of the present invention. First
In the embodiment shown in the figure, the multi-pulse is searched for each analysis frame, and in the voiced section, the encoded data of the predicted multi-pulse as representative data that can be reproduced on the synthesis side by using the repeatability by the pitch information and , Input voice LPC (Lin
ear Prediction Coding)
An analysis side (encoding side) 1 for multiplexing and transmitting pitch data, and a synthesis for synthesizing an input voice by decoding a multi-pulse, LPC coefficient and pitch data transmitted from the analysis side 1 via a transmission path 3 (Decoding side) 2.

分析側1は、A−Dコンバータ101,窓処理器102,103,
104,LPC分析器105,量子化器106,復号化器107,K/α変換
器108,減衰係数乗算器109,マルチパルス分析器110,ピッ
チ抽出器111,パルス量子化器112,最小間隔データ発生器
113および多重化器114を備えて構成され、また、合成側
2は、多重化分離器201,復号化器202,パルス復号化器20
3,最小間隔データ発生器204,K/α変換器205,ピッチ予測
器206,LPC合成器207およびD−Aコンバータ208を備え
て構成される。
The analysis side 1 includes an AD converter 101, window processors 102 and 103,
104, LPC analyzer 105, quantizer 106, decoder 107, K / α converter 108, attenuation coefficient multiplier 109, multi-pulse analyzer 110, pitch extractor 111, pulse quantizer 112, minimum interval data Generator
113 and a multiplexer 114. The combining side 2 includes a demultiplexer 201, a decoder 202, and a pulse decoder 20.
3. It comprises a minimum interval data generator 204, a K / α converter 205, a pitch predictor 206, an LPC synthesizer 207 and a DA converter 208.

次に、第1図の実施例の動作について説明する。 Next, the operation of the embodiment shown in FIG. 1 will be described.

第1図に示す分析側1は、パルス量子化器112と最小
間隔データ発生器113による処理内容が従来のピッチ予
測型マルチパルス符号化装置との主たる相違点であり、
また合成側2は、パルス復号化器203と最小間隔データ
発生器204による動作内容が従来との主たる相違点であ
る。
The analysis side 1 shown in FIG. 1 is different from the conventional pitch prediction type multi-pulse encoding apparatus in the processing performed by the pulse quantizer 112 and the minimum interval data generator 113.
The operation of the synthesizing side 2 by the pulse decoder 203 and the minimum interval data generator 204 is the main difference from the conventional operation.

分析側1では、入力音声がA−Dコンバータ101の内
蔵LPF(Low Pass Filter)によって所定の帯域制限を受
けたのち8KHzのサンプリング周波数で標本化され所定の
ビット数の量子化データとして窓処理器102,103および1
04に供給される。これら各窓処理器はそれぞれ、窓処理
器101はLPC分析、窓処理器103はマルチパルス分析、窓
処理器104はピッチ抽出を目的とする所定の窓関数との
乗算処理による切出しを行ない、窓処理器101はハミン
グ関数、窓処理器102および103はいずれも矩形関数を窓
関数として30mSECごとのデータ切出しを行ない、これが
分析フレームとなる。
On the analysis side 1, the input voice is subjected to a predetermined band limitation by a built-in LPF (Low Pass Filter) of the A / D converter 101, and then sampled at a sampling frequency of 8 KHz to obtain a window processor as quantized data of a predetermined number of bits. 102,103 and 1
Supplied to 04. Each of these window processors performs LPC analysis by the window processor 101, multi-pulse analysis by the window processor 103, and cutout by multiplication with a predetermined window function for the purpose of pitch extraction. The processor 101 extracts data every 30 mSEC using the Hamming function and the window processors 102 and 103 using the rectangular function as the window function, and this becomes an analysis frame.

LPC分析器105は、分析フレームごとの量子化データに
対してLPC分析を施し、所定の次数のKパラメータ(PAP
COR係数)をスペクトル包絡を表わすデータとして量子
化器106に供給、量子化器106はこれを所定の内容で量子
化し、多重化器114に供給するとともに復号化器107に供
給する。
The LPC analyzer 105 performs LPC analysis on the quantized data for each analysis frame, and obtains a K parameter (PAP
The COR coefficient) is supplied to the quantizer 106 as data representing a spectral envelope, and the quantizer 106 quantizes the quantized data with predetermined contents, supplies the quantized data to the multiplexer 114, and supplies the data to the decoder 107.

復号化器107は、入力した量子化Kパラメータを一旦
復号化し、量子化誤差による影響を合成側2におけるK
パラメータ復号化状態と同程度とする。
The decoder 107 once decodes the input quantized K parameter, and determines the effect of the quantization error on the
The same as the parameter decoding state.

K/α変換器108は、復号化Kパラメータをαパラメー
タに変換し減衰係数乗算器109に供給するとともにマル
チパルス分析器110にもこれを供給する。
The K / α converter 108 converts the decoded K parameter into an α parameter and supplies it to the attenuation coefficient multiplier 109, and also supplies this to the multi-pulse analyzer 110.

減衰係数乗算器109は、入力したαパラメータに減衰
係数γを乗じたγαパラメータをマルチパルス分析器11
0に供給する。
The attenuation coefficient multiplier 109 multiplies the input α parameter by the attenuation coefficient γ to obtain a γα parameter.
Supply 0.

マルチパルス分析器110は、窓処理器103から入力した
量子化音声に対して聴感重み付け処理を実施したあとマ
ルチパルスの検索を行なう。上述したαパラメータおよ
びγαパラメータは、この聴感重み付けのために利用さ
れる。
The multi-pulse analyzer 110 performs a perceptual weighting process on the quantized speech input from the window processor 103 and then searches for a multi-pulse. The above-mentioned α parameter and γα parameter are used for this auditory sense weighting.

聴感重み付け処理は、入力する量子化音声の量子化雑
音スペクトルを入力音声のスペクトルに近似せしめるこ
とにより、人間の聴覚特性のひとつとしてマスキング
(masking)効果を確保し等価的に雑音を低減するため
に行なう雑音の有色化で、次の(1)式に示す伝達関数
を有するフィルタを通すことによって処理される。
The perceptual weighting process is to reduce the noise equivalently by securing the masking effect as one of the human auditory characteristics by approximating the quantization noise spectrum of the input quantized voice to the spectrum of the input voice. The colorization of the noise is performed by passing the noise through a filter having a transfer function represented by the following equation (1).

(1)式において、γは0<γ<1の範囲で適宜選定
される。
In the equation (1), γ is appropriately selected in the range of 0 <γ <1.

このようにして聴感重み付けを実施してS/N(Signal/
Noise)を改善するノイズシェーピングを行なったあと
マルチパルスの検索を行なう。
In this way, weighting of auditory perception is performed and S / N (Signal /
After performing noise shaping to improve noise, search for multipulses.

マルチパルスの検索はA−b−S(Analysis-by-Synt
hesis)法と呼ばれる波形領域評価や、相関係数を利用
する相関領域評価などがあるが、本実施例では処理量が
低減できる相関領域評価を利用して検索を行なってい
る。
Search for multipulse is AbS (Analysis-by-Synt)
There are a waveform area evaluation called a hesis method, a correlation area evaluation using a correlation coefficient, and the like. In the present embodiment, the search is performed using the correlation area evaluation that can reduce the processing amount.

マルチパルスの相関領域評価は、基本的には次の
(2)式によって行なわれる。
The evaluation of the correlation area of the multipulse is basically performed by the following equation (2).

(2)式において、Rhhは音声合成フィルタのインパ
ルス応答の自己相関係数、ψhsは検索すべき音声入力波
形と前記インパルス応答との相互相関係数である。
(2)式は、時間位置miにたてるパルスの振幅としては
gi(mi)が最適であるということである。このgi(mi)を求
めるには、パルスが決定されるごとにψhs(mi)から
(2)式の分子第2項の減算を実施しつつ補正を行な
い、遅れ時間0における自己相関係数Rhh(0)で正規化
し、その最大値を検索する形式で次次に求められる。ま
た、(2)式の分子第2項は、直前に検索した最大値の
振幅geと位置情報ml最大値からの遅れ時間|ml‐mi|に
おける自己相関係数Rhh(|ml‐mi|)か求められる。
In the equation (2), R hh is an autocorrelation coefficient of an impulse response of a speech synthesis filter, and ψ hs is a cross-correlation coefficient between a speech input waveform to be searched and the impulse response.
Equation (2) gives the amplitude of the pulse at time position mi
g i (mi) is optimal. In order to obtain g i (mi) , each time a pulse is determined, correction is performed while subtracting the second term of the numerator of equation (2) from ψ hs (mi), and the self-phase relation at a delay time of 0 is obtained. Normalized by the number R hh (0) , the maximum value is obtained in the form of a next search. Further, (2) molecular second term of equation, position and amplitude g e of the maximum value previously search information m l delay time from the maximum value | m l -mi | autocorrelation in the coefficient R hh (| m l -mi |) is required.

こうして得られたマルチパルスは、次にピッチ予測処
理にもとづき、パルス圧縮を受ける。
The multipulse thus obtained is subjected to pulse compression based on the pitch prediction processing.

さて、ピッチ抽出器111は、マルチパルス分析器110,
ピッチ予測器206等とともに分析側1および合成側2に
またがるピッチ予測系を形成し、窓処理器104から供給
される分析フレームごとの量子化音声からピッチ周期を
抽出しつつ、これをマルチパルス分析器110、最小間隔
データ発生器113および多重化器114に供給する。
Now, the pitch extractor 111 is a multi-pulse analyzer 110,
A pitch prediction system is formed over the analysis side 1 and the synthesis side 2 together with the pitch predictor 206 and the like. The pitch period is extracted from the quantized speech for each analysis frame supplied from the window processor 104, and this is subjected to multi-pulse analysis. , A minimum interval data generator 113 and a multiplexer 114.

マルチパルス分析器110は、検索したマルチパルス列
に対し、ピッチ抽出器111から提供されるピッチデータ
を利用してピッチ予測分析を行ない、マルチパルス列を
繰返し性で表現しうる1つの予測化マルチパルス列に限
定してパルス量子化器112に供給する。
The multi-pulse analyzer 110 performs a pitch prediction analysis on the searched multi-pulse sequence using the pitch data provided from the pitch extractor 111, and converts the multi-pulse sequence into one predicted multi-pulse sequence capable of expressing the multi-pulse sequence with repeatability. A limited amount is supplied to the pulse quantizer 112.

パルス量子化器112は、入力した予測化マルチパルス
列の量子化を行なう。この量子化は、予測化マルチパル
ス列に含まれるパルスの最大振幅、およびこの最大振幅
に対する他のパルス振幅の正規化表現値ならびに各パル
スの間隔について行なわれ、かつこの場合、パルス間隔
の量子化についてはピッチ抽出器111の出力するピッチ
情報にもとづいて量子化範囲の制限を最小区間の設定と
いう形式で付与するように制御する。
The pulse quantizer 112 quantizes the input predicted multi-pulse train. This quantization is performed for the maximum amplitude of the pulses included in the predicted multi-pulse train, and the normalized expression value of other pulse amplitudes with respect to this maximum amplitude, and the interval of each pulse, and in this case, the quantization of the pulse interval is performed. Controls the quantization range based on the pitch information output from the pitch extractor 111 so as to give a limit in the form of setting a minimum section.

上述したパルス間隔量子化における量子化範囲の制限
は次の根拠にもとづく量子化ビット数の低減を目的とし
て実施するものである。
The limitation of the quantization range in the pulse interval quantization described above is implemented for the purpose of reducing the number of quantization bits based on the following grounds.

すなわち、ピッチ予測型のマルチパルス列は、大多数
のパルスが1ピッチ周期区間に集中してピッチ周期によ
って平均的パルス間隔が異り、しかも第1パルスが検索
される時間的位置は、パルス間隔量子化に付与している
タイムスロットの始点から存在することは稀で、かなり
遅れてデッドタイムを発生することが多いので、デッド
タイムに相当する冗長性を排除したいことと、さらにピ
ッチ周期の長短を考慮せずパルス間隔量子化を行なって
いるビット数の無駄使いの排除を考慮してのことによ
る。このような配慮にもとづいて、本実施例ではピッチ
周期の1/3をパルス間隔量子化における最小間隔として
設定し、予測化マルチパルス列の間隔量子化においては
この1/3ピッチ周期分を量子化対象から除外して低ビッ
トレート化を実現している。
That is, in the pitch prediction type multi-pulse train, a large number of pulses are concentrated in one pitch period section, the average pulse interval differs depending on the pitch period, and the temporal position at which the first pulse is searched is determined by the pulse interval quantum. It rarely exists from the start of the time slot assigned to the system, and dead time often occurs with a considerable delay.Therefore, we want to eliminate redundancy corresponding to the dead time and further shorten the pitch period. This is because the elimination of the waste of the number of bits for which the pulse interval quantization is performed is considered without consideration. Based on such considerations, in the present embodiment, 1/3 of the pitch period is set as the minimum interval in the pulse interval quantization, and in the interval quantization of the predicted multi-pulse train, this 1/3 pitch period is quantized. The bit rate is reduced by excluding it from the target.

このことを数値例で示すと次のようになる。たとえ
ば、間隔量子化に対して5ビットを割当てた場合を考え
てみると、従来は最大から最小のピッチ周期のものすべ
てを1〜32(25)のタイムスロットで表現するという観
点でマルチパルスの時間位置を量子化していた。本実施
例にあっては、たとえばピッチ周期がタイムスロット換
算で60であるとすると、このうち1/3の20は切捨てて21
〜52のタイムスロットとして利用し、またピッチ周期が
タイムスロットで81の場合には1/3の27を切捨ててこれ
を28〜59に対応させて利用し、これによって区間量子化
に割当てるべきビット数の削減とピッチ周期の相違によ
る平均パルス間隔の不同からくる間隔量子化の効率の悪
化の改善を図っている。なお上述した1/3カット処理は
すべて有声区間を対象とし、無声区間に対しては適用し
ない。
This is illustrated by a numerical example as follows. For example, consider the case where 5 bits are allocated to the interval quantization. Conventionally, all pulses having the minimum to maximum pitch periods are represented by multi-pulses in terms of 1 to 32 ( 25 ) time slots. Time position was quantized. In this embodiment, for example, assuming that the pitch period is 60 in terms of a time slot, 20 of 1/3 of this is rounded down to 21
When the pitch period is 81 and the pitch period is 81, 1/3 of 27 is truncated and this is used in correspondence with 28 to 59. The reduction of the number and the improvement of the efficiency of the interval quantization resulting from the difference of the average pulse interval due to the difference of the pitch period are improved. Note that the above-described 1/3 cut processing is performed only on voiced sections, and is not applied on unvoiced sections.

最小間隔データ発生器113は、分析フレームごとに提
供されるピッチデータにもとづいてパルス量子化器112
にピッチ周期の1/3に関する時間情報を提供し、パルス
量子化器112に上述した低ビット化のパルス間隔量子化
を実行させる。
The minimum interval data generator 113 generates a pulse quantizer 112 based on the pitch data provided for each analysis frame.
, And provides the pulse quantizer 112 with the above-described pulse interval quantization of lower bits.

多重化器114は、こうして供給されるKパラメータ,
マルチパルスおよびピッチデータを受け、ピッチデータ
を量子化したうえそれぞれ適宜組合わせて所定の形式で
多重化し、伝送路3を介して合成側2に送出する。
Multiplexer 114 provides the K parameters thus supplied,
The multi-pulse and the pitch data are received, the pitch data is quantized, multiplexed in an appropriate combination with each other in a predetermined format, and transmitted to the combining side 2 via the transmission path 3.

合成側2では、分析側から供給された多重化信号を多
重化分離器201で多重化分離し、Kパラメータは復号化
器202、マルチパルスに関するデータは復号化器203に、
またピッチデータは復号化のうえ最小間隔データ発生器
204とピッチ予測器206にそれぞれ供給する。
On the synthesis side 2, the multiplexed signal supplied from the analysis side is demultiplexed and demultiplexed by the demultiplexer 201, the K parameter is transmitted to the decoder 202, the data related to the multipulse is transmitted to the decoder 203,
The pitch data is decoded and the minimum interval data generator
And a pitch predictor 206.

復号化器202は入力した符号化Kパラメータを復号化
し、K/α変換器205に供給する。
The decoder 202 decodes the input coded K parameter and supplies it to the K / α converter 205.

K/α変換器205は、Kパラメータをαパラメータに変
換し、LPC合成器207の音声合成フィルタのフィルタ係数
として供給する。
The K / α converter 205 converts the K parameter into an α parameter, and supplies it as a filter coefficient of a speech synthesis filter of the LPC synthesizer 207.

パルス復号化器203は、マルチパルスに関する復号化
データ、すなわち予測化マルチパルスの最大振幅,各パ
ルスの正規化振幅,最小間隔を設定したパルス間隔に関
する各復号化データを受けてこれらを復号化する。さら
に、復号化ののち、分析側で切捨てたピッチ周期の1/3
のデータを分析フレームごとに追加付与し、分析側1の
マルチパルス分析器110の出力する予測化マルチパスル
を復元してピッチ予測器206に供給する。
The pulse decoder 203 receives and decodes the decoded data related to the multi-pulse, that is, the decoded data related to the maximum amplitude of the predicted multi-pulse, the normalized amplitude of each pulse, and the pulse interval for which the minimum interval is set. . Furthermore, after decoding, 1/3 of the pitch period truncated on the analysis side
Is additionally provided for each analysis frame, and the predicted multipulse output from the multipulse analyzer 110 on the analysis side 1 is restored and supplied to the pitch predictor 206.

最小間隔データ発生器204は、ピッチデータを受けて
分析フレームごとにパルス復号化器203に供給すべき最
小間隔データを発生する。
The minimum interval data generator 204 receives the pitch data and generates the minimum interval data to be supplied to the pulse decoder 203 for each analysis frame.

ピッチ予測器206は、パルス復号化器203から受ける予
測化マルチパルスと、多重化分離器201から受けるピッ
チデータとを利用し、ピッチデータの提供する予測化マ
ルチパルスの繰返し性にもとづいてディジタルフィルタ
等によって分析フレームごとのマルチパルス列を再生す
る。こうして再生されるマルチパルス列は、分析側1の
マルチパルス分析器110で分析フレームごとに検索され
たマルチパルス列をほぼ再生したものとなる。
The pitch predictor 206 uses the predicted multi-pulse received from the pulse decoder 203 and the pitch data received from the demultiplexer 201, and generates a digital filter based on the repeatability of the predicted multi-pulse provided by the pitch data. For example, the multi-pulse train for each analysis frame is reproduced. The multi-pulse train reproduced in this manner is almost the same as the multi-pulse train searched for each analysis frame by the multi-pulse analyzer 110 on the analysis side 1.

LPC合成器207は、こうして受けるαパラメータをフィ
ルタ係数とする音声合成フィルタをマルチパルスを音源
として駆動することによりディジタルの入力音声を再生
しこれをD−Aコンバータ208に供給する。
The LPC synthesizer 207 reproduces digital input voice by driving a voice synthesis filter having the α parameter received as a filter coefficient as a sound source using a multi-pulse as a sound source, and supplies the digital input voice to the DA converter 208.

D−Aコンバータ208は、ディジタル形式の合成音声
をアナログ化したうえ所定の通過特性を有するLPFを通
して出力音声として送出する。
The D / A converter 208 converts the digital synthesized voice into an analog signal, and sends it out as an output voice through an LPF having a predetermined pass characteristic.

〔発明の効果〕〔The invention's effect〕

以上説明した如く本発明によれば、マルチパルス間隔
量子化範囲をピッチ情報によって制御することにより、
ピッチ周期の長短による符号化効率の低下を著しく改善
した状態でマルチパルス間隔量子化の著しい低ビット化
が図れるピッチ予測型マルチパルス符号化装置が実現で
きるという効果がある。
According to the present invention as described above, the multi-pulse interval quantization range is controlled by the pitch information,
There is an effect that a pitch prediction type multi-pulse coding apparatus capable of remarkably reducing bits in multi-pulse interval quantization can be realized in a state in which a decrease in coding efficiency due to a length of a pitch cycle is significantly improved.

【図面の簡単な説明】[Brief description of the drawings]

第1図は本発明の一実施例のブロック図である。 1……分析側、2……合成側、101……A−Dコンバー
タ、102,103,104……窓処理器、105……LPC分析器、106
……量子化器、107……復号化器、108……K/α変換器、
109……減衰係数乗算器、110……マルチパルス分析器、
111……ピッチ抽出器、112……パルス量子化器、113…
…最小間隔データ発生器、114……多重化器、201……多
重化分離器、202……復号化器、203……パルス復号化
器、204……最小間隔データ発生器、205……K/α変換
器、206……ピッチ予測器、207……LPC合成器、208……
D−Aコンバータ。
FIG. 1 is a block diagram of one embodiment of the present invention. 1 ... Analysis side, 2 ... Synthesis side, 101 ... A / D converter, 102,103,104 ... Window processor, 105 ... LPC analyzer, 106
…… Quantizer, 107 …… Decoder, 108 …… K / α converter,
109 ... Attenuation coefficient multiplier, 110 ... Multi-pulse analyzer,
111… Pitch extractor, 112… Pulse quantizer, 113…
... Minimum interval data generator, 114 ... Multiplexer, 201 ... Demultiplexer, 202 ... Decoder, 203 ... Pulse decoder, 204 ... Minimum interval data generator, 205 ... K / α converter, 206 ... Pitch predictor, 207 ... LPC synthesizer, 208 ...
DA converter.

Claims (1)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】ピッチ予測型のマルチパルス符号化装置に
おいて、マルチパルスを検索するマルチパルス検索手段
と、音源のピッチ情報を抽出するピッチ抽出手段と、前
記マルチパルス検索手段で検索したマルチパルスのパル
ス間隔の量子化範囲を前記ピッチ情報にもとづいて制御
する制御手段を備え、前記制御手段は前記ピッチ情報に
もとづいて前記量子化範囲から除外される最小間隔を最
小区間の設定により行なうことを特徴とするマルチパル
ス符号化装置。
1. A multi-pulse coding apparatus of a pitch prediction type, comprising: a multi-pulse search means for searching for a multi-pulse; a pitch extraction means for extracting pitch information of a sound source; Control means for controlling a quantization range of a pulse interval based on the pitch information, wherein the control means performs a minimum interval excluded from the quantization range based on the pitch information by setting a minimum interval. Multi-pulse encoding device.
JP63075023A 1988-03-28 1988-03-28 Multi-pulse encoder Expired - Lifetime JP2853126B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63075023A JP2853126B2 (en) 1988-03-28 1988-03-28 Multi-pulse encoder

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63075023A JP2853126B2 (en) 1988-03-28 1988-03-28 Multi-pulse encoder

Publications (2)

Publication Number Publication Date
JPH01246600A JPH01246600A (en) 1989-10-02
JP2853126B2 true JP2853126B2 (en) 1999-02-03

Family

ID=13564168

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63075023A Expired - Lifetime JP2853126B2 (en) 1988-03-28 1988-03-28 Multi-pulse encoder

Country Status (1)

Country Link
JP (1) JP2853126B2 (en)

Also Published As

Publication number Publication date
JPH01246600A (en) 1989-10-02

Similar Documents

Publication Publication Date Title
US5018200A (en) Communication system capable of improving a speech quality by classifying speech signals
US7590532B2 (en) Voice code conversion method and apparatus
JPS6046440B2 (en) Audio processing method and device
US5027405A (en) Communication system capable of improving a speech quality by a pair of pulse producing units
CA2006487C (en) Communication system capable of improving a speech quality by effectively calculating excitation multipulses
JP3144009B2 (en) Speech codec
JP2586043B2 (en) Multi-pulse encoder
JP2853126B2 (en) Multi-pulse encoder
JP2900431B2 (en) Audio signal coding device
JPH028900A (en) Voice encoding and decoding method, voice encoding device, and voice decoding device
JPH0411040B2 (en)
JP2853170B2 (en) Audio encoding / decoding system
JP2581050B2 (en) Voice analysis and synthesis device
JP2560860B2 (en) Multi-pulse type speech coding and decoding device
JP2615862B2 (en) Voice encoding / decoding method and apparatus
JP2560486B2 (en) Multi-pulse encoder
JP2639118B2 (en) Multi-pulse speech codec
JP2754558B2 (en) Multi-pulse quantization method for multi-pulse encoder
JPH0481199B2 (en)
JPH077275B2 (en) Audio signal coding system and its equipment
JPH0738115B2 (en) Speech analysis / synthesis device
JPH0833756B2 (en) Speech signal encoding method and apparatus
JPH0683149B2 (en) Speech band signal encoding / decoding device
JPH05136697A (en) Voice coding system
JPH0437999B2 (en)