JPS63118199A - Voice analyzer/synthesizer - Google Patents

Voice analyzer/synthesizer

Info

Publication number
JPS63118199A
JPS63118199A JP61122689A JP12268986A JPS63118199A JP S63118199 A JPS63118199 A JP S63118199A JP 61122689 A JP61122689 A JP 61122689A JP 12268986 A JP12268986 A JP 12268986A JP S63118199 A JPS63118199 A JP S63118199A
Authority
JP
Japan
Prior art keywords
pulse
amplitude
analysis
subframe
synthesis device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP61122689A
Other languages
Japanese (ja)
Other versions
JPH0738115B2 (en
Inventor
哲 田口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP61122689A priority Critical patent/JPH0738115B2/en
Priority to CA000534620A priority patent/CA1323934C/en
Publication of JPS63118199A publication Critical patent/JPS63118199A/en
Priority to US07/421,314 priority patent/US4991215A/en
Publication of JPH0738115B2 publication Critical patent/JPH0738115B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Abstract] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は音声分析合成装置に関し、籍にボコーダ(VO
CODER)なみの低符号化速匿で、マルチパルスを音
源情報として利用する線形予測形式の音声分析合成装置
に関する。
[Detailed Description of the Invention] [Field of Industrial Application] The present invention relates to a speech analysis and synthesis device, and particularly relates to a vocoder (VO).
The present invention relates to a linear prediction type speech analysis and synthesis device that uses multipulses as sound source information and has low coding speed similar to CODER.

〔従来の技術〕[Conventional technology]

ボコーダは音声を極めて狭帯域で符号化し5るもので、
線形予測分析(Linear Prediction 
Cod −ing 、以下LPCと略称する)によって
求めるスベクトル包絡パラメータとしてのLPC係数と
ともに分析側から合成側に伝送すべき音源情報は、ピッ
チ周期に対応する時系列のパルスもしくは雑音によって
それぞれ有声/き声状態音を表現するという単純なモデ
ルが利用され分析フレームごとの音源情報を生成してい
る。
A vocoder encodes audio in an extremely narrow band.
Linear Prediction Analysis
The sound source information to be transmitted from the analysis side to the synthesis side together with the LPC coefficients as vector envelope parameters obtained by Cod-ing (hereinafter abbreviated as LPC) is voiced/voiced by time-series pulses or noise corresponding to the pitch period. A simple model that represents voice state sounds is used to generate sound source information for each analysis frame.

〔発明が解決しようとする問題点〕[Problem that the invention seeks to solve]

ボコーダは極めて狭帯域に音声を符号化しうる待機をも
つものであるが、音源生成モデルの単純さ、ならびにこ
の音源生成モデルの前提とする正確なピッチ抽出の難し
さといった点で合成音質には自ら限度がある。
Although a vocoder has a standby system that can encode speech in an extremely narrow band, it is not suitable for synthesized sound quality due to the simplicity of the sound source generation model and the difficulty of accurate pitch extraction, which is a prerequisite for this sound source generation model. There are limits.

ボコーダの弱点とする上述した問題を解決するものとし
て発明されたものにマルチパルス形ボコーダがある。こ
れは、音源を有坤/無声にかかわりなく複数のパルス、
すなわちマルチパルスによって表現し、これによってL
PC合成フィルタを駆動せしめるものであり、7音源の
もつ波形情報もかなり忠実に反映し、従りて合成音質も
著しく改善されたものとなるが、パルス量子化のため符
号化速度が増大するという問題がある。この符号化速度
の増大はA D P CM (Adaptive Di
fferPrItialPCM)やA P C(Ada
ptive Predictive Coding )
はどではないがボコーダの領域をはるかに越えたものと
なってしまい低ビ、トレードでオU用できるというボコ
ーダの特徴が著しく減殺されてしまうという問題がある
0 本発明の目的は上述した欠点を除去し、本来の分析フレ
ームを複数のサブフレームに分割し、各サブフレームご
とに最大限1個の音源パルスを、少なくともパルス位置
自由に設定するという条件のもとで選択するどい5手段
を備えることにより、ボコーダなみの低と、トレードで
合成音質の著しい改善の図れる音声分析合成装置ケ提供
することにある0 〔問題点を解決するための手段〕 本発明の装置は、線形予測形式の音声分析合成装置にお
いて、位置と振幅のうち少なくとも位置の自由度をもつ
マルチパルスを音源情報とレズ利用しかつこのマルチパ
ルスは1分析フレームを入力音声の最小ピッチ周期よシ
も短い区間単位で分割したサブフレームのそれぞれに対
して最大限1個を越えない条件のもとで設定する手段を
備えて構成される。
A multi-pulse vocoder was invented to solve the above-mentioned problems that are the weaknesses of vocoders. This allows the sound source to contain multiple pulses, regardless of whether they are voiced or silent.
In other words, it is expressed by multi-pulses, and L
This drives the PC synthesis filter, and reflects the waveform information of the seven sound sources fairly faithfully, resulting in a marked improvement in synthesized sound quality, but the encoding speed increases due to pulse quantization. There's a problem. This increase in encoding speed is achieved by ADPCM (Adaptive Di
offerPrItialPCM) and APC(Ada
Ptive Predictive Coding)
Although it is not limited to the above, there is a problem in that it goes far beyond the realm of vocoders, and the characteristics of the vocoder, such as being able to be used in low-vibration and high-speed trades, are significantly diminished.The purpose of the present invention is to address the above drawbacks. , divides the original analysis frame into a plurality of subframes, and selects at most one sound source pulse for each subframe under the condition that at least the pulse position is freely set. Therefore, it is an object of the present invention to provide a speech analysis and synthesis device that can achieve a low performance comparable to that of a vocoder and a remarkable improvement in synthesized sound quality. In the analysis/synthesis device, a multi-pulse that has at least a degree of freedom in position and amplitude is used in conjunction with sound source information, and this multi-pulse divides one analysis frame into intervals shorter than the minimum pitch period of the input voice. It is configured to include means for setting conditions under at most one condition for each subframe.

〔実M例〕[Actual M example]

次に図面を参照して本発明の詳細な説明する。 Next, the present invention will be described in detail with reference to the drawings.

第1図は本発明の音声分析合成装置の分析側の一実施例
を示すプロ、り図、第2図は本発明の音声分析合成装置
の合成側の一実施例を示すプロ、り図である。
FIG. 1 is a diagram showing an embodiment of the analysis side of the speech analysis and synthesis device of the present invention, and FIG. 2 is a diagram showing an embodiment of the synthesis side of the speech analysis and synthesis device of the invention. be.

第1および第2図に示す実施例の分析側および合成91
Ilは、利用すべきマルチパルスの振幅は@0”を宮む
3値の論理値で童子化し、振幅零をパルス位置の符号化
に包含し、マルチパルスのパルス位置はサブフレームご
とに符号化を実施した場合を例としているが、これらマ
ルチパルスの3[m埋置化、蛋幅零のパルス位置符号化
組入れ、およびサブフレームごとのパルス位置符号化は
そのすべて、もしくは1部の実施を除去したものとして
構成することも容易に実施しうろことは明らかである0 @1図の分析側はA/Dコンバータ1.窓処理器2.ノ
イズ冨み付フィルタ3.LPG分析器4゜重子化器5部
復号化器6.に/αパラメータ変換器7.減衰係数印加
器8.インパルス応答算出器9、相互相関算出器10.
自己相関真出器11゜−時メモリ12.相互相関補正6
13.最大値恢索器14.サブフレームステータスメモ
リ15゜マルチパルス−時メモリ16.パルス址子化符
号化器17.マルチプレクサ18から構成され、他に伝
送路30を併記して示す。
Analysis side and synthesis 91 of the examples shown in FIGS. 1 and 2
In Il, the amplitude of the multi-pulse to be used is converted into a three-value logical value with @0'' included, zero amplitude is included in the encoding of the pulse position, and the pulse position of the multi-pulse is encoded for each subframe. This is an example of a case in which 3 [m embedding of multi-pulses, zero-width pulse position encoding, and pulse position encoding for each subframe can be implemented in whole or in part. It is clear that it would be easy to configure it as having been removed.0 @1 The analysis side in the figure is an A/D converter 1. Window processor 2. Noise enrichment filter 3. LPG analyzer 4. Decoder 6./α parameter converter 7. Attenuation coefficient applicator 8. Impulse response calculator 9, cross-correlation calculator 10.
Autocorrelation calculator 11°-time memory 12. Cross correlation correction 6
13. Maximum value searcher 14. Subframe status memory 15° multi-pulse time memory 16. Pulse embossing encoder 17. It is composed of a multiplexer 18, and a transmission line 30 is also shown.

また、第2図に示す合成側は、デマルチプレクサ21.
復号化器22〜24.マルチパルス発生器25.L、P
C合成器26.D/Aコンバータ27を備え′″CC傳
成る0 第1図において、λ/Dコンバータ1は音声入力を受け
るとL P F’ (Low Pa5s Filter
 )で高域遮断周波数3.4kHzフイルタリングを行
なったのち、A / D コニyバータで8 kHzの
す711ノ/グ周波数で標本化し、所定の12ビツトの
童子化音声信号として窓処理器2に供給する。
Furthermore, on the combining side shown in FIG. 2, there is a demultiplexer 21.
Decoders 22-24. Multi-pulse generator 25. L, P
C synthesizer 26. In FIG. 1, the λ/D converter 1 is equipped with a D/A converter 27 and converts L P F' (Low Pa5s Filter
), the signal is filtered at a high cut-off frequency of 3.4 kHz, and then sampled at a 711-degree frequency of 8 kHz using an A/D converter and sent to the window processor 2 as a predetermined 12-bit doji-ized audio signal. supply to.

窓処理器2は、こうして供給される童子化音声信号を2
2.5m5ECの分析フレーム周期でノイズ重み付フィ
ルタ3に供給するとともに、また、入力する童子化音声
信号を一旦内部メモリに一定時間長分、たとえば30m
5ECふん、すなわち240サンプルずつを格納し、こ
れにハミング関数、あるいは矩形pA数等のあらかじめ
設定する窓関数を乗算する窓処理’&22.5m5EC
ごとに実施しつつ、これをLPC分析器4に供給する。
The window processor 2 converts the thus supplied doji-ized audio signal into 2
It is supplied to the noise weighting filter 3 at an analysis frame period of 2.5m5EC, and the input doji-ized audio signal is temporarily stored in the internal memory for a certain length of time, for example, 30m.
Window processing '&22.5m5EC' stores 5EC values, that is, 240 samples each, and multiplies them by a preset window function such as a Hamming function or a rectangular pA number.
This is then supplied to the LPC analyzer 4.

LPG分析器4は、入力する童子化音声信号に対し分析
フレーム準位でLPG分析を冥施し、所定の次数、内容
のLPC係数を抽出する。本実施例ではLPG係数とし
て10次のにパラメータ、すなわち10次のPA几C0
R(偏自己相関)9fS数に1〜に16を抽出しこれを
童子化器5に供給し所定の量子化内容で量子化したあと
、さらに所定の形式で符号化し、これらにパラメータを
マルチブレフサ18と復号化器6とに出力する。
The LPG analyzer 4 performs LPG analysis on the input doji-ized audio signal at the analysis frame level, and extracts LPC coefficients of a predetermined order and content. In this embodiment, the 10th order parameter is used as the LPG coefficient, that is, the 10th order PA C0
After extracting R (partial autocorrelation) 9fS numbers from 1 to 16 and supplying it to the doji generator 5 and quantizing it with a predetermined quantization content, it is further encoded in a predetermined format, and the parameters are added to the multi-bleph generator 18. and is output to the decoder 6.

復号化器6に供給されたにパラメータは復号化されてに
/αパラメータ変換器7に提供され10次のαパラメー
タα1〜α1oに変換され、その出力はノイズ重み付フ
ィルタ3と減衰係数付加器8に供給される。こうして得
られるαパラメータは、Kパラメータの符号化、復号化
の際に受ける童子化雑音レベルとほぼ同一レベルの量子
化雑音を付与したものとなる。
The parameters supplied to the decoder 6 are decoded and provided to the /α parameter converter 7 where they are converted into 10th order α parameters α1 to α1o, and the output thereof is sent to the noise weighting filter 3 and the attenuation coefficient adder. 8. The α parameter obtained in this way is added with quantization noise of approximately the same level as the doji noise level received during encoding and decoding of the K parameter.

さて、ノイズ恵み付フィルタ3は、窓処理器2から受け
る量子化音声信号に対し分析フレームごとに聴覚特性に
もとづく重み付けを行なう。この聴覚特性にもとづく重
み付けは、入力する量子化音声信号の重子化雑音スペク
トルを音声信号のスペクトルに近接するように処理し、
マスキック効果による聴覚上の雑音低減を行なうもので
、このために利用するノイズ重み付フィルタの伝達関数
W(Z)は次の(1)式で示される。
Now, the noise grace filter 3 weights the quantized audio signal received from the window processor 2 based on auditory characteristics for each analysis frame. This weighting based on auditory characteristics processes the multiplexed noise spectrum of the input quantized audio signal so that it approaches the spectrum of the audio signal,
This is to reduce auditory noise by mass kicking effect, and the transfer function W(Z) of the noise weighting filter used for this purpose is expressed by the following equation (1).

・・・・・・・・(1) (1)式において、αiはαパラメータで、Pは分析次
数、またrは重み付係数で0(r(1の範囲で決定され
、本実施例ではγ=0.9としている。
...... (1) In equation (1), αi is the α parameter, P is the analysis order, or r is the weighting coefficient, which is determined in the range of 0 (r (1), and in this example γ=0.9.

K/αパラメータ変換器7は(1)式の分子側の係数α
1(i=1・・・、P)を算出したうえこれをノイズ恵
み付フィルタ3と減衰係数印加器8に供給する0 減衰係数印加器8は、こうして受けたに/αパラメータ
変換器7の出力に減衰減数rlの乗算。
The K/α parameter converter 7 converts the coefficient α on the numerator side of equation (1).
1 (i=1..., P) and supplies it to the noise grace filter 3 and the attenuation coefficient applicator 8. Multiply the output by the damping subtraction rl.

印加を行なって(1)式分母側の係数戸α1(i===
1・・・。
The coefficient α1 (i===
1...

P)を得てこれをノイズ重み付フィルタ3およびインパ
ルス応答算出器9に供給する。
P) is obtained and supplied to the noise weighting filter 3 and impulse response calculator 9.

ノイズ恵み付フィルタ3は、入力するαi、γiα1を
利用して伝達関数WZ)を算出し、これと窓処理器2か
ら受ける入力との畳み込み乗算を実施して聴覚重み付け
を行ないその出力を相互相関算出器10に供給する。
The noise grace filter 3 uses the input αi and γiα1 to calculate a transfer function WZ), performs convolution multiplication with the input received from the window processor 2, performs perceptual weighting, and cross-correlates the output. is supplied to the calculator 10.

インパルス応其算出器9からパルス電子化符号化器17
までは、ノイズ重み付フィルタ3から出力された聴覚重
み付童子化音声信号を利用してマルチパルスを検索し出
力する部分で、本実施例の場合このマルチパルス検索は
22.5m5ECの分析フレームを細分割したサブフレ
ームを対象として行なわれる。
From the impulse response calculator 9 to the pulse electronic encoder 17
Up to this point, the multi-pulse search is performed using the auditory weighted doji-formed audio signal output from the noise weighted filter 3, and in this embodiment, this multi-pulse search is performed using an analysis frame of 22.5m5EC. This is performed on subframes that have been subdivided.

一般的に、マルチパルスを求めるには、A−b−S (
Analysis by 5ynthesis )手法
の名によって知られるスペクトル領域評価や、音声入力
と合成フィルタのインパルス応答との相互相関および前
記インパルス応答の自己相関を利用して求める相関領域
評価が利用され、後者の評価手法が前者よりも効率的処
理を行ない得るものとして知られており、本実施例でも
相関領域評価による手法を利用している。
Generally, to find a multipulse, A-b-S (
Spectral domain evaluation known as Analysis by 5 synthesis) method and correlation domain evaluation obtained by using the cross-correlation between the speech input and the impulse response of the synthesis filter and the autocorrelation of the impulse response are used, and the latter evaluation method It is known that the former method can perform more efficient processing than the former method, and this embodiment also uses a method based on correlation region evaluation.

K(Iffiのパルスによって合成された合成信号と音
声入力との差5は次の(2)式で示される。
The difference 5 between the synthesized signal synthesized by the pulses of K(Iffi and the audio input) is expressed by the following equation (2).

・・・・・・・・・・・・(2) (2)式においてNは分析フレーム長、 gl、rJk
2iれぞれ分析フレーム内のi番目のパルスの振幅なら
びに位置を示す。εを最小とするパルスのmr4および
位置は(2)式をgiについて偏微分して零とおくこと
によって得られる(3)式が最大となる点と・・・・・
・・・・・・(3) (3)式においてFLhhは合成フィルタの、インパル
ス応答の自己相関、ψhaは音声入力と前記イアパルス
応答との相互相関である。
・・・・・・・・・・・・(2) In equation (2), N is the analysis frame length, gl, rJk
2i each indicates the amplitude and position of the i-th pulse within the analysis frame. mr4 and the position of the pulse that minimizes ε are obtained by partially differentiating equation (2) with respect to gi and setting it to zero, and the point where equation (3) is maximized.
(3) In equation (3), FLhh is the autocorrelation of the impulse response of the synthesis filter, and ψha is the cross-correlation between the audio input and the ear pulse response.

(3)式の慧味するところは、位置miにパルスをたて
る場合には#R幅gi(mi)が最適であるということ
である。このg i(m i)を求めるには、マルチパ
ルスが決だされるごとに相互相関ψha(mi)から(
3)式分子の第(2)項を減算しつつ相互相関補正を行
ない、しかるのち遅れ時間零における自己相関几hh(
o)で正規化したうえその絶対値の最大値を検索する形
式で次次に得られる。この場合、(3)式分子の第2項
に、直前に検索された最大値の糸幅ならびに位置情報、
その最大値からの遅れ時間1me−milにおける自己
相関Rhh(1m e−m i l )。
The advantage of equation (3) is that #R width gi(mi) is optimal when generating a pulse at position mi. To find this g i (m i), we calculate (
3) Perform cross-correlation correction while subtracting the term (2) in the numerator of the equation, and then calculate the autocorrelation value at zero delay time hh(
o), and then search for the maximum absolute value. In this case, the second term of the numerator of formula (3) includes the yarn width and position information of the maximum value retrieved immediately before,
Autocorrelation Rhh (1me-mil) at a delay time of 1me-mil from its maximum value.

および検索すべきパルスの分析7レーム内の位置情報等
にもとづいて求められる。相互相関補正器13は、−時
メモリ12からは相互相関ψhs。
It is determined based on the position information within the analysis 7 frames of the pulse to be searched, etc. The cross-correlation corrector 13 receives the cross-correlation ψhs from the -time memory 12.

最大値検索器14からは最大値の振幅と位置に関する情
報を、自己相関算出器11からは自己相関に関する情報
を、また、サブフレームステータスメモリ15からは検
索すべきパルスの分析7レーム内の位置情報を得て上述
した(3)式の分子に示す相互相関補正を行ない、その
おとRhh (o)による正規化を施したものの絶対1
直KK換した相互相関補正データとして一時メモリに最
大値検索ごとに提供する。
The maximum value searcher 14 provides information regarding the amplitude and position of the maximum value, the autocorrelation calculator 11 provides information regarding the autocorrelation, and the subframe status memory 15 provides information regarding the position within the analysis 7 frames of the pulse to be retrieved. After obtaining the information, we performed the cross-correlation correction shown in the numerator of equation (3) above, and then normalized it by Rhh (o) to obtain the absolute 1.
It is provided to the temporary memory as direct KK converted cross-correlation correction data for each maximum value search.

最大値検索器14は一時メモリ】2から相互相関ψhs
  の初期値を入力したあとは1次欠に相互相関補正デ
ータを受けつつその最大値を検索し、これをマルチパル
スとして相互相関補正器13およびマルチパルス−時メ
モリ16に供給する。
The maximum value searcher 14 uses the temporary memory ]2 to cross-correlation ψhs
After inputting the initial value of , the maximum value is retrieved while receiving cross-correlation correction data on a primary basis, and this is supplied as a multi-pulse to the cross-correlation corrector 13 and multi-pulse time memory 16.

この一連の最大値検索は分析フレームごとに次次に実施
されるが、本実鳳の場合、この分析フレームが12個の
サブフレームに分割され、マルチパルスはこのサブフレ
ームに対して検索、設定される。検索、設定されたサブ
フレームは次次に検索対象から除外しつつ、マルチパル
スのたりていないサブフレームのみを対象として実施さ
れる0なお、サブフレームの間数12は、入力音声とし
て考えられる最小ピッチ周期よりも短く設定されている
。本+m例の場合は分析7レーム長が22−5m S 
E Cであり、従ってサブフレーム長は22.5/12
=1.875 (msEc)とナシ、周maで言うと約
533Hzとなる。これは入力音声の最高ピッチ周期よ
りも十分に短く、従って12個のサブフレームには多く
て] 1vAのパルスがたてられるか、もしくは1個も
たてられないかのいずれかの条件でパルス設定が行なわ
れることとなる0サテ、サブフレームステータスメモリ
15は、12個のサブフレームのそれぞれがマルチパル
スがたてられているか否かのスティタスを最大値検索器
】4に提供し、マルチパルスが立てられていないサブフ
レームの対応時間領域、いわゆるタイムスロットだけを
対象として最大値検索を行なわしめるものであり、12
個のサブフレームをfUEする12ワードを格納するR
AMとして構成される。12ワードはO番地から11番
地までのアドレスに格納され、それぞれ1〜15.16
〜30゜・・・・・・166〜180のタイムスロット
な指定する。
This series of maximum value searches is performed one after another for each analysis frame, but in the case of Honjitsuo, this analysis frame is divided into 12 subframes, and the multipulse is searched and set for this subframe. be done. The search and set subframes are successively excluded from the search target, and the search is performed only on subframes with no multipulses.The number of subframe intervals, 12, is the minimum number of subframes that can be considered as input audio. It is set shorter than the pitch period. In the case of this + m example, the analysis 7 frame length is 22-5 m S
E C, so the subframe length is 22.5/12
= 1.875 (msEc), which is approximately 533Hz in ma. This is sufficiently shorter than the highest pitch period of the input audio, so there are more than 12 subframes. The subframe status memory 15 for which the settings are to be made provides the maximum value searcher 4 with the status of whether or not a multipulse is generated in each of the 12 subframes, and The maximum value search is performed only in the time domain corresponding to the subframe in which the subframe is not set, so-called time slot.
R to store 12 words fUE the subframes
Configured as AM. The 12 words are stored in addresses from O to 11, and are respectively 1 to 15.16.
~30°...Specify a time slot between 166 and 180.

これらタイムスロットは1分析フレーム22.5m、9
ECの8kHzのサンプリング周波数によるサンプリン
グポイント180個を12分割した151固ずつの時間
領域である。
These time slots are 1 analysis frame 22.5 m, 9
It is a time domain of 151 pieces each divided into 12 by dividing 180 sampling points by 8 kHz sampling frequency of EC.

マルチパルス−時メモリ16は、分析フレームごとのイ
ニクアライズでアドレス内容が一旦オール@0”にされ
、マルチパルスが検索されるとその番地は@1”にされ
て最大値検索対象から除外される。最大値検索器14は
サブフレームステータスメモリ15からこのようなサブ
フレームステータス情報を受けつつ最大値を検索する0
こうして、最大値検索単位は分析フレーム単位であるが
、検索処理自体は実効的にサブフレームごとに実施され
、検索されるパルスの個数が所定の設定範囲に入るまで
分析フレームごとに繰返される。こうして検索されたマ
ルチパルスの位置と蛋輸に関する情報はマルチパルス−
時メモリ16に供給される。
In the multi-pulse time memory 16, the address contents are once set to all @0'' during initialization for each analysis frame, and when a multi-pulse is searched, the address is changed to @1'' and excluded from the maximum value search target. The maximum value searcher 14 searches for the maximum value while receiving such subframe status information from the subframe status memory 15.
In this way, although the maximum value search unit is an analysis frame unit, the search process itself is effectively performed for each subframe, and is repeated for each analysis frame until the number of pulses to be searched falls within a predetermined setting range. The information about the position and transport of the multipulse thus retrieved is
time memory 16.

マルチパルス−時メモリ16に格納されたマルチパルス
は、次にパルス童子化符号化器17に読出され分析フレ
ームごとに所定の形式で童子化。
The multipulse stored in the multi-pulse-time memory 16 is then read out to a pulse doji-forming encoder 17 and is doji-ized in a predetermined format for each analysis frame.

符号化される。encoded.

第3図は第1図の実施例における童子化符号化器170
部分を詳細に示すプロ、り図で、最大振幅パルス検索器
171.パルス撮幅正規(1fi172゜パルス符号化
器173.振幅量子化器174.復号化器175,3f
[を子化器176等を備えて構成される。
FIG. 3 shows a doji encoding encoder 170 in the embodiment of FIG.
A detailed diagram showing the maximum amplitude pulse searcher 171. Pulse imaging width normal (1fi 172° Pulse encoder 173. Amplitude quantizer 174. Decoder 175, 3f
It is configured with a child converter 176 and the like.

ところで、本実施例では、入力音声を4800bpsの
ビットレードで分析処理して合成側に送出しており、従
って、1分析フレーム艮22.5m5ECに対しては1
08ビ、トが提供される。本芙施で)1この108ビ、
トの割当て配分を次のように設定している。
By the way, in this embodiment, the input audio is analyzed and processed at a bit rate of 4800 bps and sent to the synthesis side. Therefore, for one analysis frame of 22.5 m5 EC,
08 bits and gs are provided. In this fuse) 1 this 108 bi,
The allocation distribution for these items is set as follows.

すなわち、パルス位置拳極性はサブフレームあたシ5ビ
、ト、従って1分析フレームあたシロ0ビ、ト、分析フ
レームごとのパルス最大振幅には7ビ、ト、LPC係数
(Ks 〜Kto) kt 40ビ。
That is, the pulse position polarity is 5 bits per subframe, therefore 0 bits per analysis frame, and the maximum pulse amplitude for each analysis frame is 7 bits.LPC coefficient (Ks ~ Kto) kt 40 bi.

ト、さらにフレーム同期ビットとして1ビ、ト計】08
ビ、トである。
+1 bit as frame synchronization bit, total]08
B, G.

マルチパルス−時メモリ16から読出されるマルチパル
スは、最大振幅パルス検索器171、パルスSl$la
正規化器172およびパルス符号化器】73に供給され
る。
Multi-pulse - The multi-pulse read out from the time memory 16 is determined by the maximum amplitude pulse searcher 171, the pulse Sl$la
It is supplied to a normalizer 172 and a pulse encoder 73.

最大振幅パルス検索器171は、サブフレームにによつ
て指定されるタイムスロット範囲ごとに最大111i1
個、りまシ有るか無いかという設定条件のもとでたてら
れたマルチパルス列を入力しつつ、分析フレームごとに
その最大値を検索しこれを瓜幅量子化器174に供給す
る。
Maximum amplitude pulse searcher 171 searches for up to 111i1 per time slot range specified by subframe
While inputting a multi-pulse train created under the setting condition of whether or not there is a distortion, the maximum value is searched for each analysis frame and this is supplied to the width quantizer 174.

振幅重子化器174は、入力する分析フレームごとの最
大値を非線形圧縮状態で量子化するため変換公式μ−1
awを利用する対数圧縮を行ない、マルチパルスで表現
されるべき音源振幅のダイナミックレ/ジの圧縮を図っ
ている。この場合、圧縮パラメータμ=255とし、か
つ最大振幅情報のみを対象とすればよいのでμ−1ow
による正側圧縮だけでよく、このぶん1ビ、トだけ省略
でき7ビ、トで振幅量子化を行なっている。
The amplitude multipletizer 174 uses a conversion formula μ-1 to quantize the maximum value of each input analysis frame in a nonlinear compression state.
Logarithmic compression using aw is performed to compress the dynamic range of the sound source amplitude that should be expressed by multipulses. In this case, the compression parameter μ=255 and only the maximum amplitude information needs to be targeted, so μ−1ow
Only the positive side compression is required, which means that only 1 bit can be omitted, and amplitude quantization is performed using 7 bits.

去幅童子化器174の出力する最大振幅情報は所定の形
式で符号化されマルチプレクサ18および復号化器17
5に供給される。
The maximum amplitude information outputted by the left width doji converter 174 is encoded in a predetermined format and sent to the multiplexer 18 and the decoder 17.
5.

復号化器175は、符号化最大振幅情報を復号化してこ
れをパルス振幅正規化器172に供給する0 パルス振幅正規化器172は、分析フレームごとの非線
形圧縮最大振幅を指数延伸して原振@状態に戻したうえ
これを基準値とする分析フレーム内マルチパルスの正規
化を行ないその出力を3籠重子化器176に供給する0 3値童子化器176は、こうして入力する正規化マルチ
パルス奈幅に対し次のように3値量子化を施す。
The decoder 175 decodes the encoded maximum amplitude information and supplies it to the pulse amplitude normalizer 172. The pulse amplitude normalizer 172 exponentially stretches the nonlinearly compressed maximum amplitude of each analysis frame to obtain the original amplitude. After returning to the @ state, the multi-pulse within the analysis frame is normalized using this as a reference value, and its output is supplied to the 3-value doji converter 176. Three-level quantization is applied to the width as follows.

第4図は3値層子化の内存を説明するための3値量子化
特性図である。
FIG. 4 is a ternary quantization characteristic diagram for explaining the existence of ternary layering.

横軸で表示する入力はパルス振幅正規化器】72から提
供される正規化マルチパルス振幅であシ、マルチパルス
の極性と振幅に対応し+1.0から−1,0の範囲にわ
たりて分布する。3値重子化は、この範囲を3分割した
それぞれを論理値11#。
The input displayed on the horizontal axis is the normalized multipulse amplitude provided by the pulse amplitude normalizer 72, which corresponds to the polarity and amplitude of the multipulse and is distributed over a range of +1.0 to -1.0. . In ternary multiplexing, this range is divided into three parts, each of which has a logical value of 11#.

″0#″″−1#の3値で量子化するものである。Quantization is performed using three values: "0#""-1#.

本実施例では入力範囲中+0.333から−0,333
まで、すなわち零を中心とした全体の1/3の範囲の正
規化レベルのものはすべて論理値°0#とする。これは
、振幅がある程度以下で、音声合成においても殆んど不
要と考えられるものについてはこれを量子化の対象から
除外するためである。
In this example, the input range is +0.333 to -0,333.
All normalization levels up to 1/3 of the entire range centered on zero are set to logical value °0#. This is to exclude from quantization objects whose amplitude is below a certain level and which are considered to be almost unnecessary in speech synthesis.

次に入力が+0.333から+1.0までのものは、す
べてこれらを論理値″″1#で表現する。また入力が−
0,333から−1,0のものについては、すべてこれ
らを論理値@−1”で表現する。第3図の縦軸は入力に
対応して表現される3(1Mの論理値の範囲を示し、こ
れら入力と3値範囲との曲係を3値化特性線に示す。
Next, all inputs from +0.333 to +1.0 are expressed by the logical value ""1#. Also, the input is -
All values from 0,333 to -1,0 are expressed as logical values @-1''.The vertical axis in Fig. The curvature between these inputs and the ternary value range is shown in the ternary characteristic line.

こうして3値量子化したマルチパルスの振幅は、パルス
符号化器173に供給される。
The amplitude of the multi-pulse thus ternary quantized is supplied to the pulse encoder 173.

パルス符号化器173にはマルチパルスの位[情報も提
供され、パルス符号化器173はこれら入力を所定の形
式の3値化マルチパルスとしてマルチプレクサ18に供
給する。
The pulse encoder 173 is also provided with information on the order of the multipulses, and the pulse encoder 173 supplies these inputs to the multiplexer 18 as ternary multipulses in a predetermined format.

上述したパルスを子化符号化において、3匝化マルチパ
ルスの符号化は位置情報に4ビ、ト利用し、振幅情報と
してはlビ、ト利用して全体として5ビ、トでマルチパ
ルスの正規化、かつ3値化の振幅と位置に関する情報を
表現している0位置悄@は分析フレーム内の各サブフレ
ームごとに決定するものとし、4ビツトで表現される0
〜15の1庫のうち1〜15の15個の数は各サブフレ
ームの1番目から15査目のタイムスロットに対応させ
てマルチパルスがたてられたタイムスロット、つまりマ
ルチパルスの位置を指定せしめ、残った1個のOは振幅
が3値の論理値′″′Omをとる場合にこれを指定する
ために利用する0 また、振幅用に割当てた1ビ、トは、Oが3値の論理値
”1#りまシ極性が正であることを、また1は3値の論
理値@−11つまり極性が負であることを指定するのに
利用される。
In the above-mentioned pulse encoding, the encoding of the triple multi-pulse uses 4 bits for position information and 1 bit for amplitude information, resulting in a total of 5 bits for encoding the multipulse. The 0 position, which represents information regarding the amplitude and position of normalization and ternarization, is determined for each subframe within the analysis frame, and the 0 position is expressed in 4 bits.
The 15 numbers 1 to 15 in one storage of ~15 correspond to the time slots from the 1st to the 15th scan of each subframe, and specify the time slots where multi-pulses are generated, that is, the positions of the multi-pulses. The remaining one O is used to specify the amplitude when it takes a three-value logical value ''''Om.In addition, the one bit allocated for the amplitude is The logical value of ``1#'' is used to specify that the polarity is positive, and 1 is used to specify that the ternary logical value @-11, that is, the polarity is negative.

マルチプレクサ18には、こうして10次のにパラメー
タとマルチパルスの最大虫幅ならびに3値の論理値によ
っ【表現された正規化マルチパルス、すなわち3値化マ
ルチパルスが供Nされ、マルチプレクサ18は、これら
入力を適宜所定の形式で組合せて多重化し4800 b
psのビットレードで伝送路30を介して合成側に送出
する。
The multiplexer 18 is thus supplied with a normalized multipulse, that is, a ternary multipulse, expressed by the 10th order parameter, the maximum width of the multipulse, and the ternary logical value, and the multiplexer 18 These inputs are appropriately combined and multiplexed in a predetermined format, and 4800 b
It is sent to the combining side via the transmission line 30 at a bit rate of ps.

第5図は分析側の音声パラメータ符号化におけるビット
割当説明図である。
FIG. 5 is an explanatory diagram of bit allocation in speech parameter encoding on the analysis side.

分析フレームごとにその同期と、トとしてのフレーム1
町期ビットSが■ビット目の1ビツト、続いてLPC係
数ビ、トにとして■ビット目から0ビツト目までの40
と、トが10矢のにパラメータ用に割当てられる。マル
チパルスの最大振幅用としてはOビット目から@ビット
目の7ビ、トフんが割当てられる。さらに、12イ固の
サブフレームに立てられるべきマルチパルスに対しては
、たとえば第1番目のサブフレーム、5UBIK対して
は、パルス位置情報として@ビット目からOビ、ト目ま
での4ビ、トが利用され、さらに、この4ビ、トで表現
される数値の5ちOは損幅零を指定するために利用され
る。80B1の振幅はOビ、トの1ビ、トによる1、0
で+1もしくは−1を表現し、これが12査目のサブフ
レーム5UB12の振幅ビ、トマで全体として108ビ
ツト利用して電子化、符号化される0 こうして4800bpsという低と、トレードのもとて
マルチパルス分析を前提としての音声分析が可能となる
synchronization for each analysis frame and frame 1 as
The period bit S is the 1st bit of the ■th bit, followed by the LPC coefficient bit, and then the 40th bit from the ■th bit to the 0th bit.
, G is assigned to 10 arrows for parameters. For the maximum amplitude of the multi-pulse, the 7th bit from the 0th bit to the @bit is assigned. Furthermore, for a multi-pulse that should be set in a 12-bit subframe, for example, the first subframe, and for 5 UBIK, the pulse position information is 4 bits from @ bit to O bit to G bit, Furthermore, the 5th O of the numerical value expressed by these 4 bits and t is used to specify the loss margin of zero. The amplitude of 80B1 is O bit, 1 bit of G, 1 due to G, 0
This represents +1 or -1, and this is the amplitude bit of subframe 5UB12 of the 12th scan, which is digitized and encoded using a total of 108 bits. Speech analysis based on pulse analysis becomes possible.

次に第2図に示す合成側について、その処理内容を説明
する。
Next, the details of the processing on the compositing side shown in FIG. 2 will be explained.

デマルチプレクサ21は分析側から伝送路30を介して
伝送されてきた多重化信号を受けるとこの多重化分離を
行ない、分析フレームごとのにパラメータは復号化器2
2に%また、分析フレームごとのマルチパルス最大振幅
は復号化器23に、さらに、分析フレームごとの3値化
マルチパルスの位置および振幅情報は復号化器24にそ
れぞれ供給される。
When the demultiplexer 21 receives the multiplexed signal transmitted from the analysis side via the transmission line 30, it demultiplexes the signal, and the parameters for each analysis frame are transferred to the decoder 2.
Furthermore, the multipulse maximum amplitude for each analysis frame is supplied to the decoder 23, and the position and amplitude information of the ternary multipulse for each analysis frame is supplied to the decoder 24.

復号化器22は、入力した符号化にパラメータの復号化
を行ない、この10次のにパラメータ。
The decoder 22 performs parameter decoding on the input encoding and converts the parameters to this 10th order.

Kl−に1・をLPC合成器26に供給する。1. is supplied to Kl- to the LPC synthesizer 26.

LPC合成器26は、全極型ディジタ174ルタを利用
する音声合成器で、入力したにパラメータをそのフィル
タ係数として利用する。
The LPC synthesizer 26 is a speech synthesizer that uses an all-pole digital 174 router, and uses input parameters as its filter coefficients.

復号化器23は、入力した符号化最大振幅の復号化を行
なったうえこれを指数延伸して非直線圧縮前の原最大蚤
幅情報を復元しこれをマルチパルス発生器25に供給す
る。
The decoder 23 decodes the input encoded maximum amplitude and then performs exponential stretching to restore the original maximum flea width information before non-linear compression, and supplies this to the multi-pulse generator 25.

復号化器24は、入力した符号化3値化マルチパルスの
復号化を行ない、これと復号化器23から受ける最大振
幅に関する情報を利用して正規化の解除を行なって、分
析フレームごとのパルス振幅最大値を振幅としサブフレ
ームごとに最大(11L1個の設定条件で検索、設定さ
れたパルス位置にたてられる形式でのマルチパルス列を
発生し、これをLPG合成器26に供給する。
The decoder 24 decodes the input coded ternary multi-pulse, denormalizes it using this and the information regarding the maximum amplitude received from the decoder 23, and generates pulses for each analysis frame. A multi-pulse train is generated in a format in which the maximum amplitude value is set as the amplitude and is set at the maximum (11L1) setting conditions for each subframe, and the multi-pulse train is generated at the set pulse position, and this is supplied to the LPG synthesizer 26.

LPC合成器26はマルチパルス発生器25から受ける
マルチパルス列によって駆動され、ディジタル音声入力
を再生し、これをD/Aコンバータ27に供給する。
LPC synthesizer 26 is driven by a multi-pulse train received from multi-pulse generator 25 to reproduce the digital audio input and supplies it to D/A converter 27 .

D/Aコンバータ27は、入力のアナログ化を行なった
のちLPFで不要な高周波成分を除去し音声出力として
送出する。
The D/A converter 27 converts the input into an analog signal, removes unnecessary high frequency components using an LPF, and sends the signal as an audio output.

こうして、分析フレームを複数のサブフレームに分割し
、各サブフレームごとに1個を越えない条件でマルチパ
ルスを選択したうえ、さらに、これら選択されたマルチ
パルスを@0”を含む@1”。
In this way, the analysis frame is divided into a plurality of subframes, multipulses are selected under the condition that no more than one multipulse is selected for each subframe, and these selected multipulses are further divided into @1'' including @0''.

′″−1”の3値の論理値で量子化する手段を有するこ
とによって4800bpsという低ビツトレートのもと
でも著しく音質の良好な合成音が得られるが、その理由
を要約すると次のとおりである。
By having a means for quantizing with the three-value logical value of '''-1'', a synthesized sound with extremely good sound quality can be obtained even at a low bit rate of 4800 bps, and the reason for this can be summarized as follows. .

その1は、独特なマルチパルス列による音源情報を利用
するため、正確など、チ抽出の困難性に伴なう問題を基
本的に回避しうろことである。また、その2は、マルチ
パルスと同様な検索技術によってサブフレームごとに選
択したパルス列を音源情報としているため、これらパル
ス列には極性が与えられておシ、無極性のパルス列や白
色雑音を有声/無声情報と関連(せてモデル化する従来
のボコーダに比し、最低限のS/N (Signal 
/No1se )が保証される。その3は、10#を含
む量子化を実施することによシ、サブフレームを設定し
、かつ極性のみ付与されるパルス列利用する場合に問題
となる不要な群小パルスを除去できること等である。
First, since sound source information based on a unique multi-pulse train is used, problems associated with accuracy and other difficulties in chi extraction can be basically avoided. In addition, in the second method, pulse trains selected for each subframe are used as sound source information using a search technique similar to multi-pulse, so these pulse trains are given polarity, and non-polar pulse trains and white noise are voiced/voiced. Compared to conventional vocoders, which model unvoiced information and related information, the minimum S/N (Signal
/No1se) is guaranteed. Thirdly, by performing quantization including 10#, it is possible to remove unnecessary group small pulses, which are a problem when setting subframes and using a pulse train to which only polarity is given.

なお、上述した実施例では、マルチパルスをサブフレー
ムに対して設定する場合、(3)式にもとづく演算処理
にもとづいて、どのサブフレームかに次次のマルチパル
スがたてられることとなるが、このような基本的検索に
代えて時間的に古いサブフレームから新しいサブフレー
ムへと次次に検索していくことも容易に実施しうろこと
は明らかである。
In the above embodiment, when setting multipulses for subframes, the next multipulse is set in which subframe based on the calculation process based on equation (3). It is clear that instead of such a basic search, it would be easy to search sequentially from the oldest subframe to the newest subframe.

〔発明の効果〕〔Effect of the invention〕

以上説明したように本発明によれば、線形予測形式の音
声分析合成装置において、分析フレームを複数のサブフ
レームに分割し、各サブフレームごとに最大限1個を越
えない設定条件で選択したマルチパルス列を“0”を含
む3値の論理値で量子化する手段を備えることによシ、
ボコーダなみの低ビツトレートで著しく音質改善の図れ
る音声分析合成装置が実現できるという効果がある。
As explained above, according to the present invention, in a linear prediction-type speech analysis and synthesis device, an analysis frame is divided into a plurality of subframes, and a multi-channel By providing means for quantizing the pulse train with three logical values including "0",
This has the effect of realizing a speech analysis and synthesis device that can significantly improve sound quality at a low bit rate comparable to that of a vocoder.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の音声分析合成装置の分析側の一実施例
を示すプロ、り図、第2図は本発明の音声分析合成装置
の合成側の一実施例を示すプロ。 り図、第3図は第1図の実施例におけるパルス量子化符
号化器17の部分を詳細に示すプロ、り図、1・・・・
・・A/Dコンバータ、2・・・・・・窓処理器、3・
・・・・・ノイズ重み付フィルタ、4・・・・・・LP
C分析器、5・・・・・・量子化器、6・・・・・・復
号化器、7・・・・・K/αパラメータ変換器、8・・
・・・減衰係数印加器、9・・・・・・インパルス応答
算出器、10・・・・・・相互相関算出器、11・・・
・・・自己相関算出器、12・・・・・・−時メモリ、
13・・・・・・相互相関補正器、14・・・・・・最
大値検累器、15・・・・・・サブフレームステータス
メモリ、16・・・・・・マルチパルス−時メモリ、1
7・・・・・・パルス量子化符号化器、18・・・・・
・マルチブレフサ、21・・・・・・デマルチプレクサ
、22〜24・・・・・復号化器、25・・・・・・マ
ルチパルス発生!、26・・・・・・LPC合成り、2
7・・・・・D/Aコンバータ、30・・・・・・伝送
路0 代理人 9P理士  内 原   晋 〃 ¥Z面 第 3 暮 茅 ψ 図 3−・−−−−フL−ム阿期ヒ゛−ト K・・・ −・lf’c4糸数ビット 51/B/ ヘEl/812−− −−− Tア7L−
ムナシバー■〜Cリーーーーー・ビート 茅ダ則 手続補正書(自発) 62.5.13 昭和  年 双懇  日
FIG. 1 is a diagram showing an embodiment of the analysis side of the speech analysis and synthesis apparatus of the present invention, and FIG. 2 is a diagram showing an embodiment of the synthesis side of the speech analysis and synthesis apparatus of the invention. Figure 3 shows a detailed diagram of the pulse quantization encoder 17 in the embodiment shown in Figure 1.
...A/D converter, 2...Window processor, 3.
...Noise weighted filter, 4...LP
C analyzer, 5... quantizer, 6... decoder, 7... K/α parameter converter, 8...
... Attenuation coefficient applicator, 9... Impulse response calculator, 10... Cross correlation calculator, 11...
...Autocorrelation calculator, 12...-time memory,
13... Cross-correlation corrector, 14... Maximum value accumulator, 15... Sub-frame status memory, 16... Multi-pulse-time memory, 1
7... Pulse quantization encoder, 18...
・Multiple pulser, 21...Demultiplexer, 22-24...Decoder, 25...Multi-pulse generation! , 26...LPC synthesis, 2
7...D/A converter, 30...Transmission line 0 Agent 9P Physician Susumu Uchihara ¥Z side No. 3 Kuraya ψ Figure 3--------Frame A Period bit K... ---lf'c4 Thread count bit 51/B/H El/812-- --- T a7L-
Munashiba ■ ~ C Lee Beat Kaya Rules Procedural Amendment (Voluntary) 62.5.13 Showa 1920 Souken-Japan

Claims (6)

【特許請求の範囲】[Claims] (1)線形予測形式の音声分析合成装置であって、位置
と振幅のうち少なくとも位置の自由度をもつマルチパル
スを音源情報として利用しかつこのマルチパルスは1分
析フレームを入力音声の最小ピッチ周期よりも短い区間
単位で分割したサブフレームのそれぞれに対し最大限1
個を越えない条件のもとで設定したものであることを特
徴とする音声分析合成装置。
(1) A linear prediction-type speech analysis and synthesis device that uses multipulses that have at least a degree of freedom in position and amplitude as sound source information, and that uses one analysis frame as the minimum pitch period of the input speech. Maximum 1 for each subframe divided into sections shorter than
A speech analysis and synthesis device characterized in that the speech analysis and synthesis device is set under conditions that do not exceed the number of individuals.
(2)マルチパルスの振幅が零を含む3値の論理値で量
子化されたものであることを特徴とする特許請求範囲第
(1)項記載の音声分析合成装置。
(2) The speech analysis and synthesis device according to claim (1), wherein the amplitude of the multi-pulse is quantized using three logical values including zero.
(3)量子化によって得られる振幅零をパルス位置の符
号化に包含するものであることを特徴とする特許請求範
囲第(2)項記載の音声分析合成装置。
(3) The speech analysis and synthesis device according to claim (2), characterized in that the zero amplitude obtained by quantization is included in the encoding of the pulse position.
(4)マルチパルスのパルス位置の符号化を前記サブフ
レームごとに実施することを特徴とする特許請求範囲第
(1)項記載の音声分析合成装置。
(4) The speech analysis and synthesis apparatus according to claim (1), wherein encoding of the pulse position of the multi-pulse is performed for each subframe.
(5)マルチパルスの振幅が零を含む3値の論理値で量
子化したものであることを特徴とする特許請求範囲第(
4)項記載の音声分析合成装置。
(5) The amplitude of the multi-pulse is quantized using three logical values including zero.
4) The speech analysis and synthesis device described in section 4).
(6)量子化によって得られる振幅零をパルス位置の符
号化に包含するものであることを特徴とする特許請求範
囲第(5)項記載の音声分析合成装置。
(6) The speech analysis and synthesis device according to claim (5), characterized in that the zero amplitude obtained by quantization is included in the encoding of the pulse position.
JP61122689A 1986-04-15 1986-05-27 Speech analysis / synthesis device Expired - Lifetime JPH0738115B2 (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP61122689A JPH0738115B2 (en) 1986-05-27 1986-05-27 Speech analysis / synthesis device
CA000534620A CA1323934C (en) 1986-04-15 1987-04-14 Speech processing apparatus
US07/421,314 US4991215A (en) 1986-04-15 1989-10-13 Multi-pulse coding apparatus with a reduced bit rate

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61122689A JPH0738115B2 (en) 1986-05-27 1986-05-27 Speech analysis / synthesis device

Publications (2)

Publication Number Publication Date
JPS63118199A true JPS63118199A (en) 1988-05-23
JPH0738115B2 JPH0738115B2 (en) 1995-04-26

Family

ID=14842184

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61122689A Expired - Lifetime JPH0738115B2 (en) 1986-04-15 1986-05-27 Speech analysis / synthesis device

Country Status (1)

Country Link
JP (1) JPH0738115B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02144598A (en) * 1988-11-25 1990-06-04 Nippon Telegr & Teleph Corp <Ntt> Sound coding method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02144598A (en) * 1988-11-25 1990-06-04 Nippon Telegr & Teleph Corp <Ntt> Sound coding method

Also Published As

Publication number Publication date
JPH0738115B2 (en) 1995-04-26

Similar Documents

Publication Publication Date Title
US6006174A (en) Multiple impulse excitation speech encoder and decoder
DE60126149T2 (en) METHOD, DEVICE AND PROGRAM FOR CODING AND DECODING AN ACOUSTIC PARAMETER AND METHOD, DEVICE AND PROGRAM FOR CODING AND DECODING SOUNDS
JP2626223B2 (en) Audio coding device
JPS60239798A (en) Voice waveform coder/decoder
JP2586043B2 (en) Multi-pulse encoder
US5235670A (en) Multiple impulse excitation speech encoder and decoder
JPS63118199A (en) Voice analyzer/synthesizer
JP3916934B2 (en) Acoustic parameter encoding, decoding method, apparatus and program, acoustic signal encoding, decoding method, apparatus and program, acoustic signal transmitting apparatus, acoustic signal receiving apparatus
JPS6162100A (en) Multipulse type encoder/decoder
JPH0258100A (en) Voice encoding and decoding method, voice encoder, and voice decoder
JP2560860B2 (en) Multi-pulse type speech coding and decoding device
JPH07168596A (en) Voice recognizing device
JP2898641B2 (en) Audio coding device
JP2639118B2 (en) Multi-pulse speech codec
JPH043878B2 (en)
JPS61215599A (en) Lsp pattern matching vocoder
JPH0242240B2 (en)
JPS6087400A (en) Multipulse type voice code encoder
JPH07160295A (en) Voice encoding device
JPH10105200A (en) Voice coding/decoding method
JPH11184499A (en) Voice encoding method and voice encoding method
JPH043876B2 (en)
JPH043560B2 (en)
JPH043880B2 (en)
JPS63181517A (en) Multipulse encoder