JP2904427B2 - Missing voice interpolation device - Google Patents

Missing voice interpolation device

Info

Publication number
JP2904427B2
JP2904427B2 JP3273503A JP27350391A JP2904427B2 JP 2904427 B2 JP2904427 B2 JP 2904427B2 JP 3273503 A JP3273503 A JP 3273503A JP 27350391 A JP27350391 A JP 27350391A JP 2904427 B2 JP2904427 B2 JP 2904427B2
Authority
JP
Japan
Prior art keywords
long
term prediction
signal
interpolation
short
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP3273503A
Other languages
Japanese (ja)
Other versions
JPH0588697A (en
Inventor
隆裕 野村
陽太郎 八塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KEI DEI DEI KK
Original Assignee
KEI DEI DEI KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KEI DEI DEI KK filed Critical KEI DEI DEI KK
Priority to JP3273503A priority Critical patent/JP2904427B2/en
Publication of JPH0588697A publication Critical patent/JPH0588697A/en
Application granted granted Critical
Publication of JP2904427B2 publication Critical patent/JP2904427B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、送信側で入力された音
声信号を符号化した音声符号化情報を受信側で離散的に
受信するシステムにおいて、音声符号化情報を受信しな
い時間区間における聴感上の通話品質の改善を図るため
に有効である欠落音声補間装置に関わるものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a system for discretely receiving audio encoded information obtained by encoding an audio signal inputted on a transmitting side on a receiving side, in a time interval in which no audio encoded information is received. The present invention relates to a missing voice interpolation device which is effective for improving the above communication quality.

【0002】[0002]

【従来の技術】音声信号を標本化し一定の時間長のフレ
ームに分割し符号化した音声符号化情報(これを以下パ
ケットと呼ぶ)を伝送する通信網においては、例えば網
内で生じる不規則な遅延のために受信側にパケットが一
定時間内に到達せずにパケットの紛失を生じることがあ
り、そのために受信側において音声信号の一部を再生で
きなくなり、聴感上の音声品質の劣化を生ずる。従っ
て、欠落した再生音声信号を何らかの方法で補間する必
要がある。この問題を解決するために、従来よりいくつ
か欠落音声の補間方法が提案されている。
2. Description of the Related Art In a communication network for transmitting voice coded information (hereinafter referred to as a packet) obtained by sampling a voice signal, dividing the frame into frames of a fixed time length, and transmitting, for example, irregularities generated in the network. Due to the delay, the packet may not be able to reach the receiving side within a certain period of time, and the packet may be lost. As a result, a part of the audio signal cannot be reproduced on the receiving side, resulting in deterioration of the audible sound quality. . Therefore, it is necessary to interpolate the missing reproduced audio signal by some method. In order to solve this problem, interpolation methods for some missing voices have been conventionally proposed.

【0003】まず、如何なる音声符号化方式にも適用で
きる欠落音声補間方式について説明する。第一に、欠落
音声部分に零値を挿入する方法(以下、零値挿入方法と
呼ぶ)及び欠落音声部分に1つ前のパケットの再生音声
信号をそのまま挿入する方法(以下、直前パケット挿入
方法と呼ぶ)がある。これらは如何なる音声符号化方式
に対しても適用でき補間処理も容易である利点がある
が、音声の性質を無視した方法のため補間した再生音声
品質が悪く、更に零値もしくは前パケットの音声信号を
挿入するための補間処理回路の付加が必要である。ま
た、零値挿入方法や直前パケット挿入方法と同様に如何
なる音声符号化方式にも適用できる補間方法として、過
去の再生音声信号に対してパターンマッチングやピッチ
検出を行うことにより抽出した類似信号を、欠落音声信
号の代用として挿入する方法(以下、各々パターンマッ
チング補間方法及びピッチ検出補間方法と呼ぶ)があ
る。これは、前の2つの補間方法に比べ再生音声品質は
比較的よいが、送信側で入力された音声信号に対してで
はなく符号化歪を含む再生音声に対してパターンマッチ
ングやピッチ検出を行うため補間音声品質が劣化し、更
にパターンマッチングやピッチ検出のための処理計算量
及び処理回路の付加量が増大する。以上の4種類の補間
方式の欠点は、如何なる音声符号化方式にも適用可能を
するために起こったとも言える。
First, a description will be given of a missing voice interpolation system applicable to any voice coding system. First, a method of inserting a zero value into a missing voice part (hereinafter, referred to as a zero value insertion method) and a method of inserting the reproduced voice signal of the immediately preceding packet as it is into the missing voice part (hereinafter, the immediately preceding packet inserting method) There is). These have the advantage that they can be applied to any audio coding method and the interpolation processing is easy. It is necessary to add an interpolation processing circuit for inserting. In addition, as an interpolation method applicable to any audio encoding method like the zero value insertion method or the immediately preceding packet insertion method, a similar signal extracted by performing pattern matching or pitch detection on a past reproduced audio signal, There is a method (hereinafter, referred to as a pattern matching interpolation method and a pitch detection interpolation method, respectively) that is inserted as a substitute for the missing voice signal. Although the reproduction voice quality is relatively good as compared with the previous two interpolation methods, the pattern matching and the pitch detection are performed not on the voice signal input on the transmission side but on the reproduction voice including coding distortion. As a result, the quality of the interpolated voice deteriorates, and the amount of processing calculations and the amount of additional processing circuits for pattern matching and pitch detection increase. It can be said that the above-mentioned drawbacks of the four types of interpolation methods have occurred because they can be applied to any audio coding method.

【0004】次に、音声符号化方式に依存した欠落音声
補間方式について説明する。代表的な音声符号化方式の
1つである適応差分PCM(ADPCM)方式に対する
補間方法としては、復号器側で受信された前パケットま
での符号化情報により再生 れた残差信号に対してピッ
チ検出を行いその再生された残差信号から抽出された疑
似信号を欠落パケットに対応する残差信号の代用として
用い通常の復号処理を行う方法も提案されている。この
構成も上記の4種類の補間方式に比べて再生音声品質は
比較的よいが、上記と同様に原音声信号ではなく量子化
雑音を含む再生された残差信号に対してパターンマッチ
ングやピッチ検出を行い補間のための疑似信号を生成し
ているので、再生音声品質が劣化し、更にパターンマッ
チングやピッチ検出のための処理計算量及び処理回路の
付加量も増大する結果となる。
[0004] Next, a description will be given of a missing voice interpolation system depending on the voice coding system. As an interpolation method for the adaptive difference PCM (ADPCM) system, which is one of the typical voice coding systems, a residual signal reproduced on the basis of coding information up to the previous packet received at the decoder side is used. method of performing normal decoding processing is used as a substitute of the residual signal corresponding pseudo signal extracted from the reproduced residual signal performs pitch detection to the missing packet has been proposed. this
Configuration is also reproduced speech quality is relatively good in comparison with the four interpolation method described above, the pattern matching and pitch detection for the the reproduced residual signal including quantization noise instead of the original speech signal as well generating a pseudo-signal for the line have interpolation
As a result, the quality of reproduced voice is degraded, and the amount of processing calculations for pattern matching and pitch detection and the amount of additional processing circuits are increased.

【0005】一方、代表的な音声符号化方式の1つであ
る適応予測符号化(APC)方式に対するパケット欠落
補間装置について以下に図を用いて説明する。まず、A
PC符号化方式においては送信側の符号器により入力音
声信号の短時間スペクトルエンベロープを表す短時間相
関(フォルマント相関)を短時間予測器(フォルマント
予測器)を用いて取り除くために短時間予測器の出力で
ある短時間予測信号(フォルマント予測信号)を入力音
声信号から差し引いて短時間予測残差信号(フォルマン
ト予測残差信号)を作成し、更に有声音などにおいてピ
ッチ周期毎に波形が繰り返されるという長時間相関(ピ
ッチ相関)を長時間予測器(ピッチ予測器)を用いて取
り除くため、長時間予測器の出力である長時間予測信号
(ピッチ予測信号)を短時間予測残差信号から差し引
き、その結果の長時間予測残差信号(ピッチ予測残差信
号)と呼ばれる信号を量子化・符号化し短時間予測器内
の短時間予測係数及び長時間予測器内の長時間予測係数
からなる予測情報と共に受信側に伝送している。
[0005] On the other hand, a packet loss interpolation apparatus for an adaptive predictive coding (APC) system, which is one of the typical speech coding systems, will be described below with reference to the drawings. First, A
Correlation briefly representing the short-time spectral envelope of the input speech signal by the encoder in the transmitting-end PC coding scheme (formant correlation) short predictor (formant predictor) predicted short time to take dividing Kutame using At the output of the vessel
Input a short-term prediction signal (formant prediction signal)
Short-term prediction residual signal (Formman
And a long-term correlation (pitch correlation) in which a waveform is repeated for each pitch period in a voiced sound or the like using a long-term predictor (pitch predictor). removing the camera in order LTP signal output from the LTP
(Pitch prediction signal) is subtracted from the short-term prediction residual signal
Come, the LTP residual signal results (pitch prediction residual Sashin
Signal ) is quantized and coded into the short-time predictor
Short-term prediction coefficient and long-term prediction coefficient in long-term predictor
Is transmitted to the receiving side together with the prediction information consisting of

【0006】図8はAPC符号化方式の復号器における
欠落音声補間装置を説明するための図である。図中、1
は端子、2は音声符号化情報分離手段として用いられる
多重分離回路、3は雑音発生器、4は残差信号電力復号
器、5は逆量子化器、6は長時間予測係数復号化手段と
して用いられる長時間予測係数復号器、7は短時間予測
係数復号化手段として用いられる短時間予測係数復号
器、8は切り換えスイッチ、9は長時間合成フィルタ手
段として用いられる長時間合成フィルタ、10は短時間
合成フィルタ手段として用いられる短時間合成フィル
タ、11は加算器、12は長時間合成フィルタ手段とし
て用いられる長時間予測器、13は加算器、14は短時
間予測器、15は端子、16は端子である。音声符号化
情報は端子1に受信され、長時間予測残差信号電力と、
符号化された正規化残差信号の情報(長時間予測残差信
号量子化情報)、長時間予測係数(ピッチ係数とピッチ
周期)及び短時間予測係数(フォルマント予測係数)
らなる符号化パラメータの情報は多重分離回路2により
各々分離される。残差信号電力復号器4からの残差信号
電力を基に逆量子化器5のステップサイズを設定し、符
号化された正規化長時間予測残差信号から逆量子化長時
間予測残差信号を長時間予測残差信号復号化手段として
用いられる逆量子化器5において再生する。端子15か
らの欠落検出信号により音声符号化情報の欠落を検出し
ない場合には、切り換えスイッチ8を介して加算器11
と逆量子化器5が接続される。この結果、逆量子化長時
間予測残差信号は長時間予測器12と加算器11からな
る長時間合成フィルタ9に長時間予測残差信号(ピッチ
予測残差信号)として入力され、その後、更に短時間予
測器14と加算器13からなり短時間合成フィルタ手段
として用いられる短時間合成フィルタ10に短時間予測
残差信号(フォルマント予測残差信号)として入力され
る。これらの構成はAPC復号器として動作するもので
短時間合成フィルタ10の出力として再生されたディジ
タル音声信号が得られる。長時間予測係数復号器6は送
信側から伝送されてきた長時間予測係数に関する情報か
ら長時間予測係数を復号するもので、復号された係数を
長時間予測器12に設定する。同様に、短時間予測係数
復号器7は送信側から伝送されてきた短時間予測係数に
関する情報から短時間予測係数を復号し、復号された係
数を短時間予測器14に設定する。尚、残差信号電力、
長時間予測係数及び短時間予測係数からなる符号化パラ
メータの情報はフレームあるいはサブフレーム毎に伝送
されている。次に、端子15からの欠落検出信号により
音声符号化情報(符号化パラメータの情報及び符号化さ
れた正規化残差信号の情報)の欠落を検出した場合に
は、端子1には通常の符号化情報が伝送されてこないこ
とになる。従って、切り換えスイッチ8を介して雑音発
生器3と加算器11が接続される。長時間予測器12及
び短時間予測器14には前フレームの長時間予測係数及
び短時間予測係数をそのまま設定しておき、動作させ
る。更に残差信号電力復号器4からの前フレームの残差
信号電力をそのまま用いて同一の電力を持った雑音を雑
音発生器3から送出する。この雑音を逆量子化器5によ
り再生された逆量子化残差信号と見なし長時間合成フィ
ルタ9に加え、上記のように通常のAPC復号を行うこ
とにより短時間合成フィルタ10の出力として再生ディ
ジタル音声信号が補間される。この補間方式では、残差
信号は相関が殆ど取り除かれた雑音であると仮定してい
る。ところが、実際には音声信号から相関を取り除くこ
とは難しく結局のところ残差信号にも相関が残ってしま
うこと、及び残差信号の代わりとして用いる雑音の位相
が本来の再生された逆量子化残差信号の位相と異なるこ
とから、補間された音声信号の品質があまりよくない。
更に、逆量子化残差信号(逆量子化器5により再生され
た残差信号)の代わりとなる雑音を生成する回路、即ち
雑音発生器3の付加が必要である。
FIG. 8 is a diagram for explaining a missing voice interpolation device in a decoder of the APC encoding system. In the figure, 1
Is a terminal, 2 is a demultiplexing circuit used as speech coded information separating means , 3 is a noise generator, 4 is a residual signal power decoder, 5 is an inverse quantizer, and 6 is a long-term prediction coefficient. Decryption means and
Long-term prediction coefficient decoder used for short-term prediction
Short-term prediction coefficient decoder used as coefficient decoding means , 8 is a changeover switch, 9 is a long-time synthesis filter
Long time synthesis filter used as a stage , 10 short time
Short-time synthesis filter used as synthesis filter means , 11 is an adder, and 12 is long-time synthesis filter means.
LTP used Te, 13 an adder, 14 a short time predictor, 15 terminal, 16 is a terminal. The speech coded information is received at terminal 1 and the long-term predicted residual signal power ,
Information on the coded normalized residual signal (long-term prediction residual signal
No. quantization information) , long-term prediction coefficient (pitch coefficient and pitch)
The information of the encoding parameter including the period) and the short-term prediction coefficient (formant prediction coefficient) is separated by the demultiplexing circuit 2. The step size of the inverse quantizer 5 is set based on the residual signal power from the residual signal power decoder 4, and the inverse quantized length is calculated from the encoded normalized long-term prediction residual signal.
Inter prediction residual signal as long-term prediction residual signal decoding means
The reproduction is performed by the used inverse quantizer 5. When the loss of the voice coded information is not detected by the loss detection signal from the terminal 15, the adder 11
And the inverse quantizer 5 are connected. As a result, when the inverse quantization length is
The long-term prediction residual signal (pitch ) is sent to a long-term synthesis filter 9 comprising a long-term predictor 12 and an adder 11.
Is input as the prediction residual signal), then further short predictor 14 and adder 13 Tona Ri short synthesis filter means
-Time prediction in short- time synthesis filter 10 used as
It is input as a residual signal (formant prediction residual signal) . These components operate as an APC decoder, and a reproduced digital audio signal is obtained as an output of the short-time synthesis filter 10. The long-term prediction coefficient decoder 6 decodes the long-term prediction coefficient from the information about the long-term prediction coefficient transmitted from the transmission side, and sets the decoded coefficient in the long-term prediction unit 12. Similarly, the short-term prediction coefficient decoder 7 decodes the short-term prediction coefficients from the information on the short-term prediction coefficients transmitted from the transmission side, and sets the decoded coefficients in the short-term prediction unit 14. Note that the residual signal power,
The information of the coding parameter including the long-term prediction coefficient and the short-term prediction coefficient is transmitted for each frame or subframe. Next, speech coded information (information of coding parameters and coded
In this case, the normal encoded information is not transmitted to the terminal 1 when the missing of the normalized residual signal information is detected. Therefore, the noise generator 3 and the adder 11 are connected via the changeover switch 8. The long-term predictor 12 and the short-term predictor 14 are set and operated with the long-term prediction coefficient and the short-term prediction coefficient of the previous frame as they are. Further, using the residual signal power of the previous frame from the residual signal power decoder 4 as it is, a noise having the same power is transmitted from the noise generator 3. This noise is generated by the inverse quantizer 5.
The reproduced digital audio signal is interpolated as an output of the short-time synthesis filter 10 by performing normal APC decoding as described above in addition to the long-time synthesis filter 9 assuming that the reproduced digital audio signal is an inversely quantized residual signal. In this interpolation method, it is assumed that the residual signal is noise from which the correlation has almost been removed. However, in practice, it is difficult to remove the correlation from the audio signal, and eventually the correlation remains in the residual signal, and the phase of the noise used as a substitute for the residual signal is reduced by the originally reproduced inverse quantization residual. The quality of the interpolated audio signal is not very good because it is different from the phase of the difference signal.
Further, an inverse quantization residual signal (reproduced by the inverse quantizer 5)
It is necessary to add a circuit that generates noise instead of the residual signal , that is, a noise generator 3.

【0007】[0007]

【発明が解決しようとする課題】以上のように従来技術
には、如何なる音声符号化方式にも適用可能なように再
生音声信号を用いることにより補間信号を生成する方式
の場合には、処理計算量及び処理回路の付加量の増大を
伴うわりには補間信号の品質がよくなく、また音声符号
化方式に依存した方式の場合においても、処理回路の付
加量の増大のわりには補間信号の品質があまりよいとは
言えないという欠点があった。
As described above, in the prior art, in the case of a system in which an interpolation signal is generated by using a reproduced audio signal so as to be applicable to any audio encoding system, a processing calculation is performed. The quality of the interpolated signal is not good in spite of the increase in the amount of the processing circuit and the additional amount of the processing circuit. There was a drawback that it was not very good.

【0008】本発明は、上記の欠点を解決するためのも
ので、適用可能な音声符号化方式は限定されるものの、
処理回路の付加が殆どなく補間信号の品質が格段に良好
な欠落音声補間装置を提供するものである。更に、本発
明の回路構成のみを一般の音声符号化方式に適用するこ
とにより、従来より補間のための回路の付加量が少なく
従来と同じ補間品質が得られる欠落音声補間装置を提供
するものである。
The present invention has been made to solve the above-mentioned drawbacks, and although applicable speech coding systems are limited,
An object of the present invention is to provide a missing voice interpolation apparatus in which the quality of an interpolation signal is remarkably excellent without adding a processing circuit. Furthermore, by applying only the circuit configuration of the present invention to a general speech coding method, a missing speech interpolation apparatus is provided in which the amount of additional circuits for interpolation is smaller than before and the same interpolation quality can be obtained as before. is there.

【0009】[0009]

【課題を解決するための手段】この課題を解決するため
本発明は、送信側で入力された音声信号を符号化し音声
符号化情報として受信側へ伝送し、該受信側で該音声符
号化情報を離散的に受信し、前記音声符号化情報を受信
しない時間区間には生成した補間信号を出力する欠落音
声補間方式である。 (1) さらに、具体的には本願第1の発明は、音声符
号化情報分離手段(2),残差信号復号化手段(19,
20),長時間予測係数復号/選択手段(18),短時
間予測係数復号化手段(7),長時間合成/補間フィル
タ手段(17),短時間合成フィルタ手段(10),端
子(15)を備える欠落音声補間装置であって、 音声符
号化情報分離手段(2)は、入力される音声符号化情報
を長時間予測係数情報,短時間予測係数情報,残差信号
量子化情報に分離し、 残差信号復号化手段(19,2
0)は、残差信号量子化情報を復号化して残差信号を出
力し、 長時間予測係数復号/選択手段(18)は、長時
間予測係数情報を復号化して得られる長時間予測係数を
長時間合成/補間フィルタ手段(17)に出力するとと
もに、端子(15)からの欠落検出信号を検出した場合
には、過去の長時間予測係数から得た補間用長時間予測
係数を長時間予測係数として長時間合成/補間フィルタ
手段(17)に出力し、 短時間予測係数復号化手段
(7)は、短時間予測係数情報を復号して得られる短時
間予測係数を出力し、 長時間合成/補間フィルタ手段
(17)は、切り換え手段(21),長時間合成/フィ
ルタ(11,12)を備え、 切り換え手段(21)は、
端子(15)からの欠落検出信号の検出の有無に対応し
て残差信号復号化手段(19,20)と長時間合成/フ
ィルタ(11,12)との相互間を切断又は接続し、
時間合成/フィルタ(11,12)は、フィードバック
状に接続された長時間予測手段(12)からなり、切り
換え手段(21)からの残差信号を入力とし 、長時間予
測係数を用いて短時間予測残差信号を合成して出力し、
短時間合成フィルタ手段(10)は、短時間予測係数と
短時間予測残差信号とから再生音声信号を合成し出力す
欠落音声補間装置である。 (2) 次に、本願第2の発明は、音声符号化情報分離
手段(2),残差信号復号化手段(4,5),短時間予
測係数復号化手段(7),長時間予測係数復号/選択手
段(18),短時間合成フィルタ手段(10),長時間
合成/補間フィルタ手段(17),端子(15)を備え
る欠落音声補間装置であって、 音声符号化情報分離手段
(2)は、入力される音声符号化情報を長時間予測係数
情報,短時間予測係数情報,残差信号量子化情報に分離
し、 残差信号復号化手段(4,5)は、残差信号量子化
情報を復号化して残差信号を出力し、 長時間予測係数復
号/選択手段(18)は、長時間予測係数情報を復号化
して得られる長時間予測係数を長時間合成/補間フィル
タ手段(17)に出力するとともに、端子(15)から
の欠落検出信号を検出した場合には、過去の長時間予測
係数から得た補間用長時間予測係数を長時間予測係数と
して長時間合成/補間フィルタ手段(17)に出力し、
短時間予測係数復号化手段(7)は、短時間予測係数情
報を復号して得られる短時間予測係数を出力し、 短時間
合成フィルタ手段(10)は、短時間予測係数と残差信
号とから長時間予測残差信号を合成して出力し、 長時間
合成/補間フィルタ手段(17)は、切り換え手段(2
1),長時間合成/フィルタ(11,12)を備え、
り換え手段(21)は、端子(15)からの欠落検出信
号の検出の有無に対応して短時間合成フィルタ手段(1
0)と長時間合成/フィルタ(11,12)との相互間
を切断又は接続し、 長時間合成/フィルタ(11,1
2)は、フィードバック状に接続された長時間予測手段
(12)からなり、切り換え手段(21)からの長時間
予測残差信号を入力とし、長時間予測係数を用いて再生
音声信号を合成して出力する欠落音声補間装置である。 (3) また、本願第3の発明は、音声復号化手段(3
3),補間用フィルタ手段(34),ピッチ情報検出手
段(37),端子(39)を備える欠落音声補間装置で
あって、 音声復号化手段(33)は、入力される音声符
号化情報を復号化して得られる再生音声信号を出力し、
補間用フィルタ手段(34)は、切り換え手段(3
5),補間用長時間予測手段(36)を備え、切り換え
手段(35)の出力を補間再生音声信号として出力し、
切り換え手段(35)は、端子(39)からの欠落検出
信号を検出しない場合には、音声復号化手段(33)か
らの再生音声信号を補間再生音声信号として出力し、欠
落検出信号を検出した場合には、補間用長時間予測手段
(36)からの長時間予測信号を補間再生音声信号とし
て出力し、 補間用長時間予測手段(36)は、ピッチ情
報検出手段(37)からの長時間予測係数に基づいて切
り換え手段(35)の出力する補間再生音声信号から長
時間予測信号を合成して出力し、 ピッチ情報検出手段
(37)は、補間再生音声信号から長時間予測係数を抽
出して補間用長時間予測手段(36)に出力する欠落音
声補間装置である。
SUMMARY OF THE INVENTION In order to solve this problem, the present invention encodes a speech signal input on a transmission side, transmits the encoded speech signal to a reception side as speech encoded information, and transmits the speech encoded information on the reception side. Is a discrete speech interpolation method in which the generated interpolation signal is output in a time period in which the speech coding information is not received and the generated speech signal is not received. (1) More specifically, the first invention of the present application is a voice code
Encoding information separating means (2), residual signal decoding means (19,
20), long-term prediction coefficient decoding / selection means (18), short time
Inter prediction coefficient decoding means (7), long time synthesis / interpolation file
Filter means (17), short-time synthesis filter means (10), end
A lost audio interpolation apparatus including a child (15), sound marks
Encoding information separating means (2) for inputting audio encoded information;
Is the long-term prediction coefficient information, short-term prediction coefficient information, residual signal
It is separated into quantized information, and the residual signal decoding means (19, 2)
0) decodes the residual signal quantization information and outputs a residual signal.
The long-term prediction coefficient decoding / selection means (18)
The long-term prediction coefficient obtained by decoding the
Output to the long-time synthesis / interpolation filter means (17)
When a missing detection signal from terminal (15) is detected
Contains long-term interpolation predictions obtained from past long-term prediction coefficients.
Long-term synthesis / interpolation filter with coefficients as long-term prediction coefficients
Means (17) for decoding the short-term prediction coefficient
(7) is a short time obtained by decoding the short-time prediction coefficient information.
Output inter prediction coefficient, and long time synthesis / interpolation filter means
(17) Switching means (21), long-time synthesizing / filtering
(11, 12), and the switching means (21)
Corresponding to the presence or absence of the missing detection signal from the terminal (15)
And a long-time synthesis / processing with the residual signal decoding means (19, 20).
The mutual disconnection or connection between the filter (11, 12), the length
Time synthesis / filters (11, 12) are feedback
Long time prediction means (12) connected in a
Receiving the residual signal from the changing means (21) ,
The short-term prediction residual signal is synthesized using the
The short-time synthesis filter means (10) includes a short-time prediction coefficient and
Synthesizes and outputs the reproduced audio signal from the short-term prediction residual signal
It is a missing voice interpolation apparatus that. (2) Next, the second invention of the present application is a method for separating speech encoded information.
Means (2), residual signal decoding means (4, 5),
Measurement coefficient decoding means (7), long-term prediction coefficient decoding / selection means
Stage (18), short-time synthesis filter means (10), long time
Equipped with synthesis / interpolation filter means (17) and terminal (15)
Lost speech interpolation device, comprising speech encoded information separation means
(2) converts the input speech coding information into a long-term prediction coefficient
Information, short-term prediction coefficient information, and residual signal quantization information
The residual signal decoding means (4, 5) performs residual signal quantization.
Decode the information and output the residual signal, and then perform long-term prediction coefficient decoding.
Signal / selection means (18) decodes long-term prediction coefficient information
Long-term prediction coefficient obtained by long-term synthesis / interpolation fill
Output to the terminal means (17) and from the terminal (15)
If a missing detection signal is detected, a long time
The long-term prediction coefficient for interpolation obtained from the coefficient is
And outputs it to the long-time synthesis / interpolation filter means (17).
The short-term prediction coefficient decoding means (7) outputs the short-term prediction coefficient information.
Outputs short prediction coefficients obtained by decoding the broadcast, short
The synthesis filter means (10) includes a short-term prediction coefficient and a residual signal.
And it outputs the synthesized prediction residual signal long from the items, long
The synthesizing / interpolating filter means (17) includes switching means (2)
1), with long synthetic / filter (11, 12), switching
The replacement means (21) is provided with a missing detection signal from the terminal (15).
Short-time synthesis filter means (1
0) and the long-time synthesis / filter (11, 12)
Is disconnected or connected, and the synthesis / filter (11, 1
2) long-term prediction means connected in a feedback manner
(12), a long time from the switching means (21)
Inputs the prediction residual signal and plays back using the long-term prediction coefficient
This is a missing voice interpolation device that synthesizes and outputs a voice signal . (3) Further, the third invention of the present application is the audio decoding device (3
3), interpolation filter means (34), pitch information detecting means
A missing voice interpolation device having a stage (37) and a terminal (39)
The voice decoding means (33) is adapted to input the voice code
Output a reproduced audio signal obtained by decoding the encoded information,
The interpolation filter means (34) is provided with a switching means (3
5), provided with interpolation long time prediction means (36), switching
Outputting the output of the means (35) as an interpolation reproduction audio signal;
The switching means (35) detects missing from the terminal (39).
If no signal is detected, the voice decoding means (33)
These playback audio signals are output as interpolation playback audio signals,
If a falling detection signal is detected, the interpolation long time prediction means
The long-term prediction signal from (36) is used as the interpolated reproduction audio signal.
The interpolation long time prediction means (36) outputs the pitch information.
Based on the long-term prediction coefficient from the alarm detection means (37).
From the interpolated reproduced audio signal output by the switching means (35).
A time prediction signal is synthesized and output, and pitch information detection means
(37) extracts a long-term prediction coefficient from the interpolated reproduced audio signal.
This is a missing voice interpolation device that outputs a signal to the interpolation long time prediction means (36) .

【0010】[0010]

【実施例1】まず本発明は、APC方式、マルチパルス
駆動型線形予測符号化(MPEC)方式もしくはコード
駆動型線形予測符号化(CELP)方式等のピッチ分析
を持つ音声符号化方式に適用可能な欠落音声補間方式で
ある。以下に図を用いて本発明を詳細に説明する。尚、
以下の説明では従来方式(図8)と同一機能を持つ構成
要素については同一番号を付して説明の重複を省く。図
1は本発明を上記の音声符号化方式へ適用した一実施例
であり、送信側で入力された音声信号を符号化し音声符
号化情報として受信側へ送信し受信側でそれを離散的に
受信し、音声符号化情報を受信しない時間区間には受信
側で生成した補間信号を出力する欠落音声補間装置の概
略図である。同図中、17は長時間合成フィルタ手段と
して用いられる長時間合成/補間フィルタであり、長時
間予測器12と加算器11とからなり、短時間予測残差
信号を出力又は補間出力とする。、18は長時間係数復
号化手段とし用いられる長時間予測係数復号/選択器、
19は残差信号電力復号器、20は長時間予測残差信号
復号化手段として用いられる逆量子化器、21は加算器
11への入力をしゃ断制御する接続しゃ断スイッチであ
る。図2は図1中の長時間予測係数復号化手段として用
いられる長時間予測係数復号/選択器18の構成概略図
である。同図中、22は長時間予測係数復号器、23は
補間用長時間予測係数生成器、24は切り換えスイッチ
である。
First Embodiment First, the present invention is applicable to a speech coding system having a pitch analysis such as an APC system, a multi-pulse driven linear predictive coding (MPEC) system or a code driven linear predictive coding (CELP) system. This is a missing voice interpolation method. Hereinafter, the present invention will be described in detail with reference to the drawings. still,
In the following description, components having the same functions as those of the conventional system (FIG. 8) are assigned the same reference numerals, and the description will not be repeated. FIG. 1 shows an embodiment in which the present invention is applied to the above-described speech coding method. A speech signal inputted on the transmission side is encoded and transmitted to the reception side as speech coded information, which is discretely received on the reception side. FIG. 3 is a schematic diagram of a missing voice interpolation device that outputs an interpolation signal generated on the receiving side during a time period in which reception is performed and voice coding information is not received. In the figure, reference numeral 17 denotes a long-time synthesis filter means.
A long synthesis / interpolation filter used to, when the length
A short-time prediction residual consisting of an inter prediction unit 12 and an adder 11
The signal is output or interpolated output. , 18 is a long-term coefficient recovery
Long-term prediction coefficient decoder / selector used as encoding means ,
19 is a residual signal power decoder, 20 is a long-term predicted residual signal
Dequantizer used as decoding means , 21 is an adder
This is a connection cutoff switch that cuts off the input to 11 . FIG. 2 is used as a long-term prediction coefficient decoding means in FIG.
FIG. 2 is a schematic diagram of a configuration of a long-term prediction coefficient decoding / selector 18 to be used. In the figure, 22 is a long-term prediction coefficient decoder, 23 is a long-term prediction coefficient generator for interpolation, and 24 is a changeover switch.

【0011】この実施例の動作を説明する。端子15か
らの欠落検出信号が音声符号化情報の欠落を指示しない
場合には、従来方式と同様な動作をする。即ち、まず端
子15から音声符号化情報の欠落を検出していないこと
を示す欠落検出信号が接続しゃ断スイッチ21及び切り
換えスイッチ24に入力される。接続しゃ断スイッチ2
を介して長時間予測残差信号復号化手段として用いら
れる逆量子化器20から長時間予測残差信号が出力され
加算器11へ長時間予測残差信号として入力され、一方
切り換えスイッチ24により長時間予測係数復号器22
の出力が長時間予測器12へ長時間予測係数(ピッチ係
数とピッチ周期)として入力されることにより、図8と
全く同じ動作となって音声信号を再生することになる。
尚、残差信号電力復号器19、逆量子化器20及び長時
間予測係数復号器22はそれぞれ残差信号電力復号器
4、逆量子化器5及び長時間予測係数復号器6と全く同
じである。
The operation of this embodiment will be described. When the loss detection signal from the terminal 15 does not indicate the loss of the voice coded information, the same operation as the conventional method is performed. That is, first, a loss detection signal indicating that the loss of the voice coded information is not detected from the terminal 15 is output from the connection cutoff switch 21 and the disconnection switch.
Input to the change switch 24. Connection cutoff switch 2
1 as a means for decoding a long-term prediction residual signal.
A long-term prediction residual signal is output from the inverse quantizer 20 to be input to the adder 11 as a long-term prediction residual signal.
Is output to the long-term predictor 12 by a long-term prediction coefficient (pitch-related
By inputting as ( number and pitch period), the operation is exactly the same as in FIG. 8 and the audio signal is reproduced.
The residual signal power decoder 19, the inverse quantizer 20, and the long-term prediction coefficient decoder 22 are exactly the same as the residual signal power decoder 4, the inverse quantizer 5, and the long-term prediction coefficient decoder 6, respectively. is there.

【0012】逆に、端子15からの欠落検出信号が音声
符号化情報の欠落を指示した場合における欠落した音声
信号の補間方法について、以下に詳細に説明する。この
場合には、端子1には通常の符号化情報が伝送されてこ
ないことになり、接続しゃ断スイッチ21を介して逆量
子化器20と加算器11とが切り放され、一方切り換え
スイッチ24を介して補間用長時間予測係数生成器23
補間用長時間予測係数と短時間予測残差信号を用いて
長時間予測信号を生成する長時間予測器12が接続され
る。尚、補間用長時間予測係数生成器23における補間
用の長時間予測係数としては、(1)予め数値が設定さ
れおり、常に一定の値を出力する場合、もしくは(2)
長時間予測係数復号器22から得た前フレームの長時間
予測係数に応じた補間用の長時間予測係数を出力する場
合などがある。また短時間予測係数と再生音声信号とを
用いて短時間予測信号を生成する短時間予測器14には
前フレームの短時間予測係数をそのまま設定する。この
ようにすると、長時間合成/補間フィルタ17は何の入
力もされずに長時間予測信号を短時間予測残差信号の補
間信号としたフィードバックループによる自己駆動の動
作をすることから、長時間予測信号であるその出力信号
短時間予測残差信号として短時間合成フィルタ(1
0)内の加算器13に入力することになる。そして上記
のように従来の通常の合成処理を行うことにより短時間
合成フィルタ10の出力として再生ディジタル音声信号
が補間される。
Conversely, a method of interpolating the missing audio signal when the missing detection signal from the terminal 15 indicates the lack of the audio coding information will be described in detail below. In this case, normal encoded information is not transmitted to the terminal 1, the inverse quantizer 20 and the adder 11 are cut off via the disconnection switch 21, and the switch 24 is turned off. Interpolated long-term prediction coefficient generator 23
Using long-term prediction coefficient for interpolation and short-term prediction residual signal
A long-term predictor 12 for generating a long-term prediction signal is connected. As the long-term prediction coefficient for interpolation in the interpolation long-term prediction coefficient generator 23, (1) a numerical value is set in advance and a constant value is always output, or (2)
In some cases, a long-term prediction coefficient for interpolation corresponding to the long-term prediction coefficient of the previous frame obtained from the long-term prediction coefficient decoder 22 is output. Also, the short-term prediction coefficient and the reproduced audio signal
The short-term prediction coefficient of the previous frame is set as it is in the short-term predictor 14 that generates a short- term prediction signal using the same. In this way, the long-time synthesis / interpolation filter 17 does not input anything and converts the long-term prediction signal to the short-term prediction residual signal.
Movement of self-driven by between signals and the feedback loop
Since the work, a short time synthesis filter its output signal is a long prediction signal as a short prediction residual signal (1
0) is input to the adder 13. As described above, the reproduced digital audio signal is interpolated as the output of the short-time synthesis filter 10 by performing the conventional ordinary synthesis processing.

【0013】尚、一般に長時間予測係数にはピッチ周期
とピッチ係数がある。式(1)に、長時間予測器12が
1タップフィルタである場合の伝達関数P(z)を示
す。 P(z)=b・z-p (1) 同式中、bはピッチ係数(0≦b≦1)、pはピッチ周
期を示す。シミュレーションの結果、補間用長時間予測
係数生成器23がピッチ周期pとして前フレームの値を
そのまま出力しまたピッチ係数bとして1を出力する
ことが、補間信号の聴感的品質上最適であった。
In general, the long-term prediction coefficients include a pitch period and a pitch coefficient. Equation (1) shows the transfer function P (z) when the long-term predictor 12 is a one-tap filter. P (z) = b · z −p (1) In the equation, b represents a pitch coefficient (0 ≦ b ≦ 1), and p represents a pitch period. Simulation results interpolation LTP coefficient generator 23 directly outputs the value of the previous frame as the pitch period p, also be output 1 as pitch coefficient b, was optimal on perceptual quality of the interpolation signal .

【0014】[0014]

【実施例2】実施例1の等価構成として図3に示す構成
概略図がある。尚、以下の説明では実施例1(図1)と
同一機能を持つ構成要素については同一番号を付して説
明の重複を省く。同図中、25は切り換えスイッチ、2
6は補間用長時間合成フィルタ、27は補間用長時間予
測器である。その他については図8に示す従来技術の復
号化構成に等しい。まず、端子15からの欠落検出信号
が音声符号化情報の欠落を指示しない場合には、従来方
式と同様な動作をする。即ち、端子15から音声符号化
情報の欠落を検出していないことを示す欠落検出信号が
切り換えスイッチ25に入力される。切り換えスイッチ
25を介して加算器11と加算器13が接続されること
により、図9と全く同じ動作となって音声信号を再生す
ることになる。逆に、端子15からの欠落検出信号が音
声符号化情報の欠落を指示した場合には、切り換えスイ
ッチ25を介して補間用長時間合成フィルタ26(また
は補間用長時間予測器27の出力)と加算器13が接続
される。又、長時間予測器12のディレイバッファの内
容が長時間予測器27へコピーされ設定される。尚、補
間用長時間予測器27が1タップフィルタの場合にはそ
の伝達関数は式(1)に等しく、また補間用の長時間予
測係数は実施例1と同様に設定される。このようにする
と、実施例1と同様に、何の入力もされることなくフィ
ードバックループにより自己駆動する補間用長時間合成
フィルタ26の長時間予測信号である出力信号が短時間
予測残差信号として短時間合成フィルタ10内の加算器
13に入力されることになる。そして上記のように通常
合成処理を行うことにより短時間合成フィルタ10の
出力として再生ディジタル音声信号が補間される。尚、
補間開始以降は、必要に応じて、長時間予測器27のデ
ィレイバッファの内容が長時間予測器12へコピーされ
設定される。
[Embodiment 2] FIG. 3 is a schematic diagram showing an equivalent configuration of the first embodiment. In the following description, components having the same functions as those of the first embodiment (FIG. 1) will be assigned the same reference numerals, and redundant description will be omitted. In the figure, 25 is a changeover switch, 2
Reference numeral 6 denotes a long-time synthesis filter for interpolation, and 27 denotes a long-time predictor for interpolation. Others are the same as the conventional decoding configuration shown in FIG. First, when the loss detection signal from the terminal 15 does not indicate the loss of the audio coded information, the same operation as the conventional method is performed. In other words, a loss detection signal indicating that no loss of the audio coded information has been detected is input from the terminal 15 to the changeover switch 25. When the adder 11 and the adder 13 are connected via the changeover switch 25, the operation is exactly the same as in FIG. 9 and the audio signal is reproduced. Conversely, when the missing detection signal from the terminal 15 indicates the lack of the voice coded information, the interpolation long-time synthesis filter 26 (or the output of the interpolation long-time predictor 27) via the changeover switch 25. The adder 13 is connected. Also, the contents of the delay buffers of the LTP 12 Ru is set are copied to the LTP 27. When the interpolation long-term predictor 27 is a one-tap filter, the transfer function is equal to the equation (1), and the interpolation long-term prediction coefficient is set as in the first embodiment. In this way, in the same manner as in Example 1, without Rukoto is any input Fi
The over-back loop output signal, a long-predicted signal for a long time for interpolation for self-driven synthesis filter 26 is a short time
The prediction residual signal is input to the adder 13 in the short-time synthesis filter 10 . Then, the reproduced digital audio signal is interpolated as the output of the short-time synthesis filter 10 by performing the normal synthesis processing as described above. still,
After the start of the interpolation, the contents of the delay buffer of the long time predictor 27 are copied to the long time predictor 12 as necessary.
Ru is set.

【0015】[0015]

【実施例3】図4は本発明の欠落音声補間方式をピッチ
分析を持つ音声符号化方式に適用した別の実施例の概略
図である。尚、同図は、図1での長時間合成/補間フィ
ルタ17と短時間合成フィルタ10を入れ換えた構成と
なっている。まず、端子15からの欠落検出信号が音声
符号化情報の欠落を指示しない場合には、従来方式と同
様な動作をする。即ち、端子15から音声符号化情報の
欠落を検出していないことを示す欠落検出信号が接続し
ゃ断スイッチ21及び切り換えスイッチ24に入力され
ると、接続しゃ断スイッチ21を介して加算器13と加
算器11が接続され、一方切り換えスイッチ24により
長時間予測係数復号器22の出力が長時間予測器12へ
入力されることにより、図8と全く同じ動作となって音
声信号を再生することになる。逆に、端子15からの欠
落検出信号が音声符号化情報の欠落を指示した場合に
は、端子1には通常の符号化情報が伝送されてこないこ
とになるので、接続しゃ断スイッチ21により加算器1
3と加算器11とが切り放され、一方長時間予測係数復
号/選択器18内の長時間予測器12が切り換えスイッ
チ24を介して補間用長時間予測係数生成器23と接
される。尚、補間用長時間予測係数生成器23は実施例
1と同様に動作し、短時間予測器14には前フレームの
短時間予測係数をそのまま設定されている。このように
すると、長時間合成/補間フィルタ17何の入力もさ
れず、フィードバックループによる自己駆動することに
より、その出力が再生ディジタル音声信号として補間さ
れる。
Embodiment 3 FIG. 4 is a schematic diagram of another embodiment in which the missing speech interpolation system of the present invention is applied to a speech encoding system having pitch analysis. In this figure, the long-time synthesis / interpolation filter 17 and the short-time synthesis filter 10 in FIG. 1 are replaced. First, when the loss detection signal from the terminal 15 does not indicate the loss of the audio coded information, the same operation as the conventional method is performed. That is, a loss detection signal indicating that the loss of the audio coded information is not detected is connected from the terminal 15.
When input to the disconnection switch 21 and the changeover switch 24, the adder 13 and the adder 11 are connected via the connection cutoff switch 21. When the signal is input to the device 12, the operation is exactly the same as that of FIG. Conversely, if the dropout detection signal from the terminal 15 instructs the missing speech coding information, since the normal encoded information is not come transmitted to the terminal 1, the adder by connecting cutoff switch 21 1
3 an adder 11 and is split off, whereas LTP coefficient decoding / selector 18 LTP 12 in is Connect the interpolation LTP coefficient generator 23 through the changeover switch 24. The interpolation long-term prediction coefficient generator 23 operates in the same manner as in the first embodiment, and the short-term prediction coefficient of the previous frame is set as it is in the short-term prediction unit 14. In this way, no input is made to the long-time synthesis / interpolation filter 17 and the output is interpolated as a reproduced digital audio signal by self-driving by the feedback loop .

【0016】[0016]

【実施例4】実施例3の等価構成として図5に示す構成
概略図がある。尚、以下の説明では実施例3(図4)と
同一機能を持つ構成要素については同一番号を付して説
明の重複を省く。まず、端子15からの欠落検出信号が
音声符号化情報の欠落を指示しない場合には、従来方式
と同様な動作をする。即ち、端子15から音声符号化情
報の欠落を検出していないことを示す欠落検出信号が切
り換えスイッチ29に入力される。切り換えスイッチ2
9を介して長時間合成フィルタ9の出力が再生音声とし
て端子16に出力されることにより、図8と全く同じ動
作となって音声信号を再生することになる。また、逆
に、端子15からの欠落検出信号が音声符号化情報の欠
落を指示した場合には、長時間予測器12のディレイバ
ッファの内容が長時間予測器27へコピーされ設定され
る。切り換えスイッチ29を介して補間用長時間合成フ
ィルタ26(または補間用長時間予測器27)の出力が
補間音声として端子16に出力される。尚、長時間予測
器27における長時間予測係数は実施例3と同様に設定
される。また、長時間予測器27が1タップフィルタの
場合にはその伝達関数は式(1)に等しい。このように
すると、実施例3と同様に、何の入力もされず、フィー
ドバックループにより自己駆動する補間用長時間合成フ
ィルタ26の長時間予測信号である出力信号により再生
ディジタル音声信号が補間される。尚、補間開始以降
は、必要に応じて、長時間予測器27のディレイバッフ
ァの内容が長時間予測器12へコピーされ設定される。
[Embodiment 4] FIG. 5 is a schematic diagram showing an equivalent configuration of the embodiment 3. As shown in FIG. In the following description, components having the same functions as those of the third embodiment (FIG. 4) are denoted by the same reference numerals, and the description will not be repeated. First, when the loss detection signal from the terminal 15 does not indicate the loss of the audio coded information, the same operation as the conventional method is performed. That is, a loss detection signal indicating that the loss of the audio coded information has not been detected is input to the switch 29 from the terminal 15. Changeover switch 2
When the output of the long-time synthesis filter 9 is output to the terminal 16 as the reproduced sound via the terminal 9, the operation is exactly the same as that of FIG. 8 and the sound signal is reproduced. Conversely, when the loss detection signal from the terminal 15 indicates the loss of the audio coding information, the contents of the delay buffer of the long time predictor 12 are copied to the long time predictor 27 and set. > The output of the interpolation long-time synthesis filter 26 (or the interpolation long-time predictor 27) is output to the terminal 16 as the interpolation sound via the changeover switch 29. The long-term prediction coefficient in the long-term predictor 27 is set in the same manner as in the third embodiment. When the long-term predictor 27 is a one-tap filter, its transfer function is equal to the equation (1). In this case, as in the third embodiment, no input is made , and
The reproduced digital audio signal is interpolated by the output signal which is the long-term prediction signal of the long- time interpolation filter for interpolation 26 which is self-driven by the feedback loop . Incidentally, interpolation start thereafter, if necessary, the contents of the delay buffers of the LTP 27 Ru is set are copied to the LTP 12.

【0017】[0017]

【実施例5】図6は本発明の欠落音声補間方式の回路構
成を一般の音声符号化方式に適用した一実施例であり、
従来方式と比較してより簡単な回路構成で同様な効果が
得られるものである。同図中、32は端子、33は音声
復号化手段として用いられる復号器、34は補間用フィ
ルタ、35は切り換えスイッチ、36は補間用長時間予
測手段として用いられる補間用長時間予測器、37はピ
ッチ情報検出器、38は端子、39は端子である。ま
ず、端子39からの欠落検出信号が音声符号化情報の欠
落を指示しない場合には、通常の音声信号の復号化が行
われる。即ち、端子39から音声符号化情報の欠落を検
出していないことを示す欠落検出信号が切り換えスイッ
チ35に入力されると、切り換えスイッチ35により復
号器33の出力信号が端子38を介して再生音声信号と
して出力される。一方、復号器33の出力は補間用長時
間予測器36及びピッチ情報検出器37へ入力される。
補間用長時間予測器36では再生音声信号を一定時間蓄
積しておく。またピッチ情報検出器37では再生音声信
号からピッチ情報(ピッチ周期及びピッチ係数)を検出
し補間用長時間予測器36に出力する。逆に、端子39
からの欠落検出信号が音声符号化情報の欠落を指示した
場合における欠落音声信号の補間方法について、以下に
詳細に説明する。この場合には、端子32に音声符号化
情報が伝送されてこないことになるので、切り換えスイ
ッチ35により補間用長時間予測器36の出力信号が再
生音声信号の補間信号として端子38を介して出力され
る。同時にその出力信号が再び補間用長時間予測器36
に入力される。尚、補間用長時間予測器36は、ピッチ
情報検出器37において補間すべき音声信号の直前まで
の再生音声信号から求められたピッチ情報(長時間予測
係数)を用いて、その出力信号として長時間予測信号
生成する。即ち、補間用フィルタ34は切り換えスイッ
チ35により復号器33からの入力がしゃ断され、補間
用長時間予測器36を自己駆動することにより再生音声
出力信号を生成している。ここで補間用長時間予測器3
6が1タップフィルタである場合には、その伝達関数は
式(1)に等しく、補間時に使用されるピッチ係数は1
が補間音声品質上よい。
Embodiment 5 FIG. 6 shows an embodiment in which the circuit configuration of the missing speech interpolation system of the present invention is applied to a general speech encoding system.
Similar effects can be obtained with a simpler circuit configuration as compared with the conventional method. In the figure, 32 is a terminal, 33 is a voice.
A decoder used as a decoding means , 34 is an interpolation filter, 35 is a changeover switch, and 36 is a long time interpolation interpolation.
Reference numeral 37 denotes a pitch information detector, reference numeral 38 denotes a terminal, and reference numeral 39 denotes a terminal. First, when the loss detection signal from the terminal 39 does not indicate the loss of the voice coded information, the normal voice signal is decoded. That is, when a loss detection signal indicating that the loss of the audio coded information is not detected is input from the terminal 39 to the changeover switch 35, the output signal of the decoder 33 is output by the changeover switch 35 via the terminal 38 to the reproduced sound. Output as a signal. On the other hand, the output of the decoder 33 is input to the long time predictor for interpolation 36 and the pitch information detector 37.
In the interpolation long time predictor 36, the reproduced audio signal is accumulated for a certain period of time. The pitch information detector 37 detects pitch information (pitch cycle and pitch coefficient) from the reproduced audio signal and outputs it to the interpolation long time predictor 36. Conversely, terminal 39
A method of interpolating a missing audio signal when the missing detection signal from the device indicates a lack of audio encoded information will be described in detail below. In this case, since the audio coded information is not transmitted to the terminal 32, the output signal of the interpolation long time predictor 36 is output via the terminal 38 as the interpolation signal of the reproduced audio signal by the changeover switch 35. Is done. At the same time, the output signal is again supplied to the interpolation long time predictor 36.
Is input to Note that the interpolation long time predictor 36 generates the pitch information (long time prediction) obtained from the reproduced sound signal immediately before the sound signal to be interpolated by the pitch information detector 37.
) , A long-term prediction signal is generated as the output signal. That is, the interpolation filter 34 is switched by the switching switch.
The input from the decoder 33 is cut off by the switch 35 and interpolation is performed.
The self-driving of the long time predictor 36 generates a reproduced sound output signal. Here, interpolation long time predictor 3
If 6 is a one-tap filter, its transfer function is equal to equation (1), and the pitch coefficient used during interpolation is 1
Is good in terms of interpolation voice quality.

【0018】[0018]

【実施例6】図7は本発明の欠落音声補間方式の回路構
成をDPCMやADPCM等のピッチ分析を行っていな
い音声符号化方式へ適用した場合の一実施例であり、従
来方式と比較してより簡単な回路構成で同様な効果が獲
られるものである。同図中、40は端子、41は逆量子
化器、7は短時間予測係数復号器、42は補間用フィル
タ、43は切り換えスイッチ、44は補間用長時間予測
器、45はピッチ情報検出器、46は短時間合成フィル
タ、47は加算器、48は短時間予測器、49は端子、
50は端子である。図7において、多重分離回路を省略
したものを示す。なお、端子40には符号化された正規
化残差信号の情報を、端子51には符号化された短時間
予測係数情報を入力する。まず、端子50からの欠落検
出信号が音声符号化情報の欠落を指示しない場合には、
通常の音声信号の復号化が行われる。即ち、まず端子4
0からの音声符号化情報を入力した逆量子化器41は残
差信号を出力する。端子50から音声符号化情報の欠落
を検出していないことを示す欠落検出信号が切り換えス
イッチ43に入力されると、残差信号が切り換えスイッ
チ43を介して加算器47に入力され、更に短時間予測
器48の出力である短時間予測信号と足し加えられて、
再生音声信号として端子49を介して出力される。同時
に、逆量子化器41の出力は補間用長時間予測器44及
びピッチ情報検出器45へ、また加算器47の出力は短
時間予測器48へそれぞれ入力される。そして短時間予
測器48では、短時間予測係数復号器7からの短時間予
測係数に基づいて短時間予測器48の係数を推定し短時
間予測信号を生成・出力する。一方、補間用長時間予測
器44では逆量子化器41にて再生された短時間予測
差信号を一定時間蓄積しておき、またピッチ情報検出器
45では前記短時間予測残差信号からピッチ情報(ピッ
チ周期及びピッチ係数)を検出し補間用長時間予測器4
4に出力する。 逆に、端子50からの欠落検出信号が
音声符号化情報の欠落を指示した場合における欠落音声
信号の補間方法について、以下に詳細に説明する。この
場合には、端子40に音声符号化情報が伝送されてこな
いことになるので、切り換えスイッチ43により補間用
長時間予測器44の出力信号が、前記の短時間予測残差
信号の補間信号として加算器47に入力される同時
再び補間用長時間予測器44に入力され自己駆動さ
る。尚、補間用長時間予測器44は、ピッチ情報検出
器45において補間すべき短時間予測残差信号の直前ま
での短時間予測残差音声信号から求められたピッチ情報
を用いて、長時間予測信号としてのその出力信号を生成
する。即ち、補間用フィルタ42は自己駆動することに
より補償信号としての短時間予測残差信号を生成してい
る。ここで補間用長時間予測器44が1タップフィルタ
である場合には、その伝達関数は式(1)に等しく、補
間時に使用されるピッチ係数は1が補間音声品質上よ
い。
Embodiment 6 FIG. 7 shows an embodiment in which the circuit configuration of the missing voice interpolation system of the present invention is applied to a voice coding system such as DPCM or ADPCM which does not perform pitch analysis. A similar effect can be obtained with a simpler circuit configuration. In the figure, 40 is a terminal, 41 is an inverse quantizer, 7 is a short-term prediction coefficient decoder, 42 is an interpolation filter, 43 is a changeover switch, 44 is an interpolation long-time predictor, and 45 is a pitch information detector. , 46 are short-time synthesis filters, 47 is an adder, 48 is a short-time predictor, 49 is a terminal,
50 is a terminal. In FIG. 7, the demultiplexing circuit is omitted.
This is shown. It should be noted that the encoded normal
The information of the encoded residual signal is input to
Enter prediction coefficient information. First, when the loss detection signal from the terminal 50 does not indicate the loss of the audio coding information,
Normal audio signal decoding is performed. That is, first, terminal 4
The inverse quantizer 41 which has inputted the speech coding information from 0 outputs a residual signal. When a loss detection signal indicating that the loss of the voice coded information is not detected is input from the terminal 50 to the changeover switch 43, the residual signal is input to the adder 47 via the changeover switch 43, and the time is shorter. The short-term prediction signal output from the predictor 48 is added, and
The signal is output via the terminal 49 as a reproduced audio signal. At the same time, the output of the inverse quantizer 41 is input to the interpolation long time predictor 44 and the pitch information detector 45, and the output of the adder 47 is input to the short time predictor 48. Then, the short-term predictor 48 outputs the short-term prediction from the short-term prediction coefficient decoder 7.
The coefficient of the short-term predictor 48 is estimated based on the measurement coefficients, and a short-term prediction signal is generated and output. On the other hand, the interpolation long time predictor 44 accumulates the short time prediction residual signal reproduced by the inverse quantizer 41 for a certain period of time, and the pitch information detector 45 calculates the pitch from the short time prediction residual signal. Information (pitch period and pitch coefficient) is detected and a long time predictor 4 for interpolation is used.
4 is output. Conversely, a method of interpolating the missing audio signal when the missing detection signal from the terminal 50 indicates the lack of the encoded audio information will be described in detail below. In this case, since the speech coded information is not transmitted to the terminal 40, the output signal of the interpolation long time predictor 44 is changed by the changeover switch 43 as the interpolation signal of the short time prediction residual signal. a is input simultaneously <br/> to an adder 47, a self-drive is entered again interpolation LTP 44
Re that. Incidentally, interpolation LTP 44 uses pitch information obtained from the short-time prediction residual speech signal just before the short prediction residual signal to be interpolated at pitch information detector 45, LTP Generate its output signal as a signal. That is, the interpolation filter 42 generates a short-time prediction residual signal as a compensation signal by self-driving. Here, when the interpolation long time predictor 44 is a one-tap filter, its transfer function is equal to the equation (1), and the pitch coefficient used at the time of interpolation is 1 which is good in terms of interpolation voice quality.

【0019】[0019]

【発明の効果】以上詳細に説明したように本発明は、送
信側で入力された音声信号を符号化し音声符号化情報と
して受信側へ伝送し、該受信側で該音声符号化情報を離
散的に受信し、該音声符号化情報を受信しない時間区間
には生成した補間信号を出力する欠落音声補間装置にお
いて、 (1) 音声符号化情報分離手段(2),残差信号復号
化手段(19,20),長時間予測係数復号/選択手段
(18),短時間予測係数復号化手段(7),長時間合
成/補間フィルタ手段(17),短時間合成フィルタ手
段(10),端子(15)を備える欠落音声補間装置で
あって、 音声符号化情報分離手段(2)は、入力される
音声符号化情報を長時間予測係数情報,短時間予測係数
情報,残差信号量子化情報に分離し、 残差信号復号化手
段(19,20)は、残差信号量子化情報を復号化して
残差信号を出力し、 長時間予測係数復号/選択手段(1
8)は、長時間予測係数情報を復号化して得られる長時
間予測係数を長時間合成/補間フィルタ手段(17)に
出力するとともに、端子(15)からの欠落検出信号を
検出した場合には、過去の長時間予測係数から得た補間
用長時間予測係数を長時間予測係数として長時間合成/
補間フィルタ手段(17)に出力し、 短時間予測係数復
号化手段(7)は、短時間予測係数情報を復号して得ら
れる短時間予測係数を出力し、 長時間合成/補間フィル
タ手段(17)は、切り換え手段(21),長時間合成
/フィルタ(11,12)を備え、 切り換え手段(2
1)は、端子(15)からの欠落検出信号の検出の有無
に対応して残差信号復号化手段(19,20)と長時間
合成/フィルタ(11,12)との相互間を切断又は接
続し、 長時間合成/フィルタ(11,12)は、フィー
ドバック状に接続された長時間予測手段(12)からな
り、切り換え手段(21)からの残差信号を入力とし、
長時間予測係数を用いて短時間予測残差信号を合成して
出力し、 短時間合成フィルタ手段(10)は、短時間予
測係数と短時間予測残差信号とから再生音声信号を合成
し出力するように構成するか、もしくは、 (2) 音声符号化情報分離手段(2),残差信号復号
化手段(4,5),短時間予測係数復号化手段(7),
長時間予測係数復号/選択手段(18),短時間合成フ
ィルタ手段(10),長時間合成/補間フィルタ手段
(17),端子(15)を備える欠落音声補間装置であ
って、 音声符号化情報分離手段(2)は、入力される音
声符号化情報を長時間予測係数情報,短時間予測係数情
報,残差信号量子化情報に分離し、 残差信号復号化手段
(4,5)は、残差信号量子化情報を復号化して残差信
号を出力し、 長時間予測係数復号/選択手段(18)
は、長時間予測係数情報を復号化して得られる長時間予
測係数を長時間合成/補間フィルタ手段(17)に出力
するとともに、端子(15)からの欠落検出信号を検出
した場合には、過去の長時間予測係数から得た補間用長
時間予測係数を長時間予測係数として長時間合成/補間
フィルタ手段(17)に出力し、 短時間予測係数復号化
手段(7)は、短時間予測係数情報を復号して得られる
短時間予測係数を出力し、 短時間合成フィルタ手段(1
0)は、短時間予測係数と残差信号とから長時間予測残
差信号を合成して出力し、 長時間合成/補間フィルタ手
段(17)は、切り換え手段(21),長時間合成/フ
ィルタ(11,12)を備え、 切り換え手段(21)
は、端子(15)からの欠落検出信号の検出の有無に対
応して短時間合成フィルタ手段(10)と長時間合成/
フィルタ(11,12)との相互間を切断又は接続し、
長時間合成/フィルタ(11,12)は、フィードバッ
ク状に接続された長時間予測手段(12)からなり、切
り換え手段(21)からの長時間予測残差信号を入力と
し、長時間予測係数を用いて再生音声信号を合成して出
力するように構成することにより、従来方式に比べて欠
落音声信号の補間のために必要な回路の付加が殆どない
にも関わらず格段に良好な補間信号の品質を実現するこ
とができる。更に、本発明は、APC方式のみならずフ
レーム単位に符号化処理を行っている殆ど全ての音声符
号化方式にも適用可能であり、その効果は極めて大であ
る。また、 (3) 音声復号化手段(33),補間用フィルタ手段
(34),ピッチ情報検出手段(37),端子(39)
を備える欠落音声補間装置であって、 音声復号化手段
(33)は、入力される音声符号化情報を復号化して得
られる再生音声信号を出力し、 補間用フィルタ手段(3
4)は、切り換え手段(35),補間用長時間予測手段
(36)を備え、切り換え手段(35)の出力を補間再
生音声信号として出力し、 切り換え手段(35)は、端
子(39)からの欠落検出信号を検出しない場合には、
音声復号化手段(33)からの再生音声信号を補間再生
音声信号として出力し、欠落検出信号を検出した場合に
は、補間用長時間予測手段(36)からの長時間予測信
号を補間再生音声信号として出力し、 補間用長時間予測
手段(36)は、ピッチ情報検出手段(37)からの長
時間予測係数に基づいて切り換え手段(35)の出力す
る補間再生音声信号から長時間予測信号を合成して出力
し、 ピッチ情報検出手段(37)は、補間再生音声信号
から長時間予測係数を抽出して補間用長時間予測手段
(36)に出力するように構成することにより、従来方
式に比べて欠落音声信号の補間のために必要な付加回路
が殆どないにも関わらず同じ程度の補間信号の品質を実
現でき、また如何なる音声符号化方式にも適用可能であ
り、その効果は極めて大である。
As described above in detail, according to the present invention, a speech signal input on the transmission side is encoded and transmitted as speech encoded information to the receiving side, and the speech encoded information is discretely encoded on the receiving side. And a missing speech interpolator for outputting a generated interpolation signal in a time interval in which the speech coded information is not received.
Means (19, 20), long-term prediction coefficient decoding / selection means
(18), short-term prediction coefficient decoding means (7),
Synthesis / interpolation filter means (17), short-time synthesis filter
A missing voice interpolation device having a stage (10) and a terminal (15)
Then, the speech coded information separating means (2) is inputted.
Speech coding information is long-term prediction coefficient information, short-term prediction coefficient
Information and residual signal quantization information, and the residual signal
Stages (19, 20) decode the residual signal quantization information and
The residual signal is output, and the long-term prediction coefficient decoding / selection means (1
8) is a long time obtained by decoding the long-term prediction coefficient information
Inter prediction coefficient to long-time synthesis / interpolation filter means (17)
Output and the missing detection signal from the terminal (15)
If detected, the interpolation obtained from past long-term prediction coefficients
Long-term prediction coefficient as long-term prediction coefficient
Outputs the interpolation filter means (17), a short time prediction coefficient restored
The decoding means (7) decodes the short-term prediction coefficient information to obtain
And outputs a short time prediction coefficient that is, for a long time synthesis / interpolation fill
Switching means (21), long-time synthesis
/ Filters (11, 12) and switching means (2
1) The presence or absence of detection of a missing detection signal from the terminal (15)
And the residual signal decoding means (19, 20)
Cutting / connecting with the synthesis / filter (11, 12)
The long time synthesis / filters (11, 12)
The long-term prediction means (12) connected in a
Input the residual signal from the switching means (21),
Combining short-term prediction residual signals using long-term prediction coefficients
The short-time synthesis filter means (10) outputs
Synthesizes reproduced audio signal from measurement coefficient and short-term prediction residual signal
Or configured to output, or, (2) the speech encoded information separation means (2), the residual signal decoding
Decoding means (4, 5), short-term prediction coefficient decoding means (7),
Long-term prediction coefficient decoding / selection means (18), short-time synthesis
Filter means (10), long-time synthesis / interpolation filter means
(17) A missing voice interpolation device having a terminal (15).
Thus, the speech coded information separating means (2)
The voice coded information is converted to long-term prediction coefficient information and short-term prediction coefficient information.
Information and residual signal quantization information, and the residual signal decoding means
(4, 5) decodes the residual signal quantization information to obtain the residual signal.
And a long-term prediction coefficient decoding / selection means (18)
Is the long-term prediction obtained by decoding the long-term prediction coefficient information.
Outputs measurement coefficients to long-time synthesis / interpolation filter means (17)
And also detects the missing detection signal from the terminal (15).
The interpolation length obtained from past long-term prediction coefficients.
Long-term synthesis / interpolation using long-term prediction coefficients as long-term prediction coefficients
Output to the filter means (17) and decode the short-term prediction coefficients
The means (7) is obtained by decoding the short-term prediction coefficient information.
The short-term prediction coefficient is output, and the short-time synthesis filter means (1
0) is the long-term prediction residual from the short-term prediction coefficient and the residual signal.
The difference signal is synthesized and output, and a long time synthesis / interpolation filter
The stage (17) comprises a switching means (21), a long-time synthesis /
Filter (11, 12), switching means (21)
Indicates whether or not the missing detection signal is detected from the terminal (15).
In response, the short-time synthesis filter means (10) and the long-time synthesis /
Disconnecting or connecting between the filters (11, 12),
The long-time synthesis / filters (11, 12)
It consists of long-term prediction means (12) connected in a
The long-term prediction residual signal from the switching means (21) is input and
And synthesizes the reproduced audio signal using the long-term prediction coefficient.
With such a configuration, significantly better quality of the interpolated signal can be realized as compared with the conventional method, even though there is almost no additional circuit required for interpolation of the missing audio signal. Further, the present invention is applicable not only to the APC system but also to almost all audio coding systems that perform encoding processing in units of frames, and the effect is extremely large. (3) speech decoding means (33), interpolation filter means
(34), pitch information detecting means (37), terminal (39)
A lost audio interpolation apparatus comprising a speech decoding means
(33) is obtained by decoding the input speech encoded information.
The reproduced audio signal is output and the interpolation filter means (3
4) is a switching means (35), interpolation long time predicting means
(36), and the output of the switching means (35) is interpolated again.
The signal is output as a raw audio signal, and the switching means (35)
When the missing detection signal from the child (39) is not detected,
Interpolation reproduction of the reproduced audio signal from the audio decoding means (33)
Output as an audio signal, and when a missing detection signal is detected
Is a long-term prediction signal from the interpolation long-term prediction means (36).
Signal as an interpolated playback audio signal, and a long time prediction for interpolation
The means (36) is provided with a length information from the pitch information detecting means (37).
The output of the switching means (35) is output based on the time prediction coefficient.
Synthesizes and outputs a long-term prediction signal from the interpolated playback audio signal
The pitch information detecting means (37) outputs the interpolated reproduced audio signal
Long-term prediction means for interpolation by extracting long-term prediction coefficients from
By providing the output to (36), the same level of interpolated signal quality can be realized despite the fact that there is almost no additional circuit required for interpolating missing audio signals as compared with the conventional method. The present invention is also applicable to a speech encoding method, and the effect is extremely large.

【図面の簡単な説明】[Brief description of the drawings]

【図1】ピッチ分析を持つ音声符号化方式の復号器へ本
発明の欠落音声補間装置を適用した1つの実施例の構成
概略図である。
FIG. 1 is a schematic diagram of a configuration of an embodiment in which a missing speech interpolation device of the present invention is applied to a speech coding type decoder having pitch analysis.

【図2】図1中の長時間予測係数復号/選択器18の構
成概略図である。
FIG. 2 is a schematic diagram of a configuration of a long-term prediction coefficient decoding / selector 18 in FIG.

【図3】図1の等価構成概略図である。FIG. 3 is a schematic diagram of an equivalent configuration of FIG. 1;

【図4】ピッチ分析を持つ音声符号化方式の復号器へ本
発明の欠落音声補間装置を適用したもう1つの実施例の
構成概略図である。
FIG. 4 is a schematic structural diagram of another embodiment in which the missing speech interpolation device of the present invention is applied to a speech coding type decoder having pitch analysis.

【図5】図4の等価構成概略図である。FIG. 5 is a schematic diagram of an equivalent configuration of FIG. 4;

【図6】本発明の欠落音声補間装置を一般の音声符号化
方式の復号器に適用した1つの実施例の構成概略図であ
る。
FIG. 6 is a schematic structural diagram of one embodiment in which the missing speech interpolation device of the present invention is applied to a decoder of a general speech coding system.

【図7】本発明の欠落音声補間装置をDPCMやADP
CMへ適用した1つの実施例の構成概略図である。
FIG. 7 shows a missing voice interpolation device of the present invention using DPCM or ADP.
It is a schematic diagram of a configuration of one embodiment applied to a CM.

【図8】APC符号化方式の復号器における従来の欠落
音声補間方式の構成概略図である。
FIG. 8 is a schematic configuration diagram of a conventional missing voice interpolation system in a decoder using the APC encoding system.

【符号の説明】[Explanation of symbols]

1 端子 2 多重分離回路 3 雑音発生器 4 残差信号電力復号器 5 逆量子化器 6 長時間予測係数復号器 7 短時間予測係数復号器 8 切り換えスイッチ 9 長時間合成フィルタ 10 短時間合成フィルタ 11 加算器 12 長時間予測器 13 加算器 14 短時間予測器 15 端子 16 端子 17 長時間合成/補間フィルタ 18 長時間予測係数復号/選択器 19 残差信号電力復号器 20 逆量子化器 21 接続しゃ断スイッチ 22 長時間予測係数復号器 23 補間用長時間予測係数生成器 24 切り換えスイッチ 25 切り換えスイッチ 26 補間用長時間合成フィルタ 27 補間用長時間予測器 29 切り換えスイッチ 32 端子 33 復号器 34 補間用フィルタ 35 切り換えスイッチ 36 補間用長時間予測器 37 ピッチ情報検出器 38 端子 39 端子 40 端子 41 逆量子化器 42 補間用フィルタ 43 切り換えスイッチ 44 補間用長時間予測器 45 ピッチ情報検出器 46 短時間合成フィルタ 47 加算器 48 短時間予測器 49 端子 50 端子 51 端子Reference Signs List 1 terminal 2 demultiplexing circuit 3 noise generator 4 residual signal power decoder 5 inverse quantizer 6 long-term prediction coefficient decoder 7 short-time prediction coefficient decoder 8 changeover switch 9 long-time synthesis filter 10 short-time synthesis filter 11 Adder 12 Long time predictor 13 Adder 14 Short time predictor 15 Terminal 16 Terminal 17 Long time synthesis / interpolation filter 18 Long time prediction coefficient decoding / selector 19 Residual signal power decoder 20 Inverse quantizer 21 Disconnection Switch 22 Long-term prediction coefficient decoder 23 Long-term prediction coefficient generator for interpolation 24 Changeover switch 25 Changeover switch 26 Long-time synthesis filter for interpolation 27 Long-time prediction unit 29 for interpolation 29 Switch 32 Terminal 33 Decoder 34 Interpolation filter 35 Changeover switch 36 Long-time predictor for interpolation 37 Pitch information detector 38 Terminal 39 terminal 40 terminal 41 inverse quantizer 42 interpolation filter 43 changeover switch 44 interpolation long time predictor 45 pitch information detector 46 short time synthesis filter 47 adder 48 short time predictor 49 terminal 50 terminal 51 terminal

───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平2−1661(JP,A) 特開 平3−245199(JP,A) 特開 平3−51900(JP,A) 特開 平1−248200(JP,A) 特開 昭60−67999(JP,A) (58)調査した分野(Int.Cl.6,DB名) G10L 9/14 G10L 9/18 ────────────────────────────────────────────────── ─── Continuation of the front page (56) References JP-A-2-1661 (JP, A) JP-A-3-245199 (JP, A) JP-A-3-51900 (JP, A) JP-A-1- 248200 (JP, A) JP-A-60-67999 (JP, A) (58) Fields investigated (Int. Cl. 6 , DB name) G10L 9/14 G10L 9/18

Claims (3)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 音声符号化情報分離手段(2),残差信
号復号化手段(19,20),長時間予測係数復号/選
択手段(18),短時間予測係数復号化手段(7),長
時間合成/補間フィルタ手段(17),短時間合成フィ
ルタ手段(10),端子(15)を備える欠落音声補間
装置であって、 音声符号化情報分離手段(2)は、入力される音声符号
化情報を長時間予測係数情報,短時間予測係数情報,残
差信号量子化情報に分離し、 残差信号復号化手段(19,20)は、残差信号量子化
情報を復号化して残差信号を出力し、 長時間予測係数復号/選択手段(18)は、長時間予測
係数情報を復号化して得られる長時間予測係数を長時間
合成/補間フィルタ手段(17)に出力するとともに、
端子(15)からの欠落検出信号を検出した場合には、
過去の長時間予測係数から得た補間用長時間予測係数を
長時間予測係数として長時間合成/補間フィルタ手段
(17)に出力し、 短時間予測係数復号化手段(7)は、短時間予測係数情
報を復号して得られる短時間予測係数を出力し、 長時間合成/補間フィルタ手段(17)は、切り換え手
段(21),長時間合成/フィルタ(11,12)を備
え、 切り換え手段(21)は、端子(15)からの欠落検出
信号の検出の有無に対応して残差信号復号化手段(1
9,20)と長時間合成/フィルタ(11,12)との
相互間を切断又は接続し、 長時間合成/フィルタ(11,12)は、フィードバッ
ク状に接続された長時間予測手段(12)からなり、切
り換え手段(21)からの残差信号を入力とし、長時間
予測係数を用いて短時間予測残差信号を合成して出力
し、 短時間合成フィルタ手段(10)は、短時間予測係数と
短時間予測残差信号とから再生音声信号を合成し出力す
欠落音声補間装置。
1. A speech coded information separating means (2), a residual signal
Decoding means (19, 20), long-term prediction coefficient decoding / selection
Selection means (18), short-term prediction coefficient decoding means (7), length
Time synthesis / interpolation filter means (17), short-time synthesis filter
Missing voice interpolation with filter means (10) and terminal (15)
A speech encoding information separating unit (2) for receiving an inputted speech code;
The long-term prediction coefficient information, short-term prediction coefficient information,
The signal is separated into quantized difference signal information, and the residual signal decoding means (19, 20) performs quantization of the residual signal.
The long-term prediction coefficient decoding / selection means (18) decodes the information and outputs a residual signal,
Long-term prediction coefficients obtained by decoding coefficient information
Output to the synthesis / interpolation filter means (17),
When a missing detection signal from the terminal (15) is detected,
Interpolated long-term prediction coefficients obtained from past long-term prediction coefficients
Long-term synthesis / interpolation filter means as long-term prediction coefficients
(17), and the short-term prediction coefficient decoding means (7) outputs the short-term prediction coefficient information.
The long-term synthesis / interpolation filter means (17) outputs a short-term prediction coefficient obtained by decoding the report.
Equipped with a stage (21) and a long-time synthesis / filter (11, 12)
The switching means (21) detects missing from the terminal (15).
Residual signal decoding means (1
9, 20) and long-time synthesis / filter (11, 12)
Disconnect or connect each other, and the long-time synthesis / filters (11, 12) provide feedback.
It consists of long-term prediction means (12) connected in a
Receiving the residual signal from the switching means (21) for a long time
Combining and outputting short-term prediction residual signals using prediction coefficients
And the short-time synthesis filter means (10)
Synthesizes and outputs the reproduced audio signal from the short-term prediction residual signal
Lost audio interpolation apparatus that.
【請求項2】 音声符号化情報分離手段(2),残差信
号復号化手段(4,5),短時間予測係数復号化手段
(7),長時間予測係数復号/選択手段(18 ),短時
間合成フィルタ手段(10),長時間合成/補間フィル
タ手段(17),端子(15)を備える欠落音声補間装
置であって、 音声符号化情報分離手段(2)は、入力される音声符号
化情報を長時間予測係数情報,短時間予測係数情報,残
差信号量子化情報に分離し、 残差信号復号化手段(4,5)は、残差信号量子化情報
を復号化して残差信号を出力し、 長時間予測係数復号/選択手段(18)は、長時間予測
係数情報を復号化して得られる長時間予測係数を長時間
合成/補間フィルタ手段(17)に出力するとともに、
端子(15)からの欠落検出信号を検出した場合には、
過去の長時間予測係数から得た補間用長時間予測係数を
長時間予測係数として長時間合成/補間フィルタ手段
(17)に出力し、 短時間予測係数復号化手段(7)は、短時間予測係数情
報を復号して得られる短時間予測係数を出力し、 短時間合成フィルタ手段(10)は、短時間予測係数と
残差信号とから長時間予測残差信号を合成して出力し、 長時間合成/補間フィルタ手段(17)は、切り換え手
段(21),長時間合成/フィルタ(11,12)を備
え、 切り換え手段(21)は、端子(15)からの欠落検出
信号の検出の有無に対応して短時間合成フィルタ手段
(10)と長時間合成/フィルタ(11,12)との相
互間を切断又は接続し、 長時間合成/フィルタ(11,12)は、フィードバッ
ク状に接続された長時間予測手段(12)からなり、切
り換え手段(21)からの長時間予測残差信号を入力と
し、長時間予測係数を用いて再生音声信号を合成して出
力する 欠落音声補間装置。
2. A speech coded information separating means (2), a residual signal
Decoding means (4, 5), short-term prediction coefficient decoding means
(7), long-term prediction coefficient decoding / selection means (18 ), short time
Intermediate synthesis filter means (10), long time synthesis / interpolation filter
Missing voice interpolation device provided with data means (17) and terminal (15)
The encoded speech information separating means (2)
The long-term prediction coefficient information, short-term prediction coefficient information,
The residual signal quantization means (4, 5) separates the residual signal quantized information into quantized residual signal information.
And outputs a residual signal, and the long-term prediction coefficient decoding / selecting means (18)
Long-term prediction coefficients obtained by decoding coefficient information
Output to the synthesis / interpolation filter means (17),
When a missing detection signal from the terminal (15) is detected,
Interpolated long-term prediction coefficients obtained from past long-term prediction coefficients
Long-term synthesis / interpolation filter means as long-term prediction coefficients
(17), and the short-term prediction coefficient decoding means (7) outputs the short-term prediction coefficient information.
And outputs a short- term prediction coefficient obtained by decoding the information, and the short-time synthesis filter means (10) outputs the short-term prediction coefficient
A long-time prediction residual signal is synthesized from the residual signal and output, and the long-time synthesis / interpolation filter means (17) performs a switching operation.
Equipped with a stage (21) and a long-time synthesis / filter (11, 12)
The switching means (21) detects missing from the terminal (15).
Short-time synthesis filter means corresponding to the presence or absence of signal detection
Phase of (10) and long-time synthesis / filter (11, 12)
Disconnect or connect each other, and the long-time synthesis / filter (11, 12)
It consists of long-term prediction means (12) connected in a
The long-term prediction residual signal from the switching means (21) is input and
And synthesizes the reproduced audio signal using the long-term prediction coefficient.
A missing speech interpolator to power .
【請求項3】 音声復号化手段(33),補間用フィル
タ手段(34),ピッチ情報検出手段(37),端子
(39)を備える欠落音声補間装置であって、 音声復号化手段(33)は、入力される音声符号化情報
を復号化して得られる再生音声信号を出力し、 補間用フィルタ手段(34)は、切り換え手段(3
5),補間用長時間予測手 段(36)を備え、切り換え
手段(35)の出力を補間再生音声信号として出力し、 切り換え手段(35)は、端子(39)からの欠落検出
信号を検出しない場合には、音声復号化手段(33)か
らの再生音声信号を補間再生音声信号として出力し、欠
落検出信号を検出した場合には、補間用長時間予測手段
(36)からの長時間予測信号を補間再生音声信号とし
て出力し、 補間用長時間予測手段(36)は、ピッチ情報検出手段
(37)からの長時間予測係数に基づいて切り換え手段
(35)の出力する補間再生音声信号から長時間予測信
号を合成して出力し、 ピッチ情報検出手段(37)は、補間再生音声信号から
長時間予測係数を抽出して補間用長時間予測手段(3
6)に出力する 欠落音声補間装置。
3. A speech decoding means (33), an interpolation filter
(34), pitch information detecting means (37), terminal
(39), wherein the speech decoding means (33) comprises:
The interpolation filter means (34) outputs a reproduced audio signal obtained by decoding the
5), provided with a long interpolation prediction hand stage (36), switching
The output of the means (35) is output as an interpolated reproduction audio signal, and the switching means (35) detects the loss from the terminal (39).
If no signal is detected, the voice decoding means (33)
These playback audio signals are output as interpolation playback audio signals,
If a falling detection signal is detected, the interpolation long time prediction means
The long-term prediction signal from (36) is used as the interpolated reproduction audio signal.
The interpolation long time predicting means (36) comprises a pitch information detecting means.
Switching means based on the long-term prediction coefficient from (37)
A long-term prediction signal from the interpolated reproduction audio signal output from (35)
The pitch information detecting means (37) outputs the synthesized signal from the interpolated and reproduced audio signal.
A long-term prediction coefficient is extracted and a long-term prediction means for interpolation (3
6) A missing voice interpolation device for outputting to (6) .
JP3273503A 1991-09-26 1991-09-26 Missing voice interpolation device Expired - Fee Related JP2904427B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3273503A JP2904427B2 (en) 1991-09-26 1991-09-26 Missing voice interpolation device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3273503A JP2904427B2 (en) 1991-09-26 1991-09-26 Missing voice interpolation device

Publications (2)

Publication Number Publication Date
JPH0588697A JPH0588697A (en) 1993-04-09
JP2904427B2 true JP2904427B2 (en) 1999-06-14

Family

ID=17528804

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3273503A Expired - Fee Related JP2904427B2 (en) 1991-09-26 1991-09-26 Missing voice interpolation device

Country Status (1)

Country Link
JP (1) JP2904427B2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3937799B2 (en) * 2001-10-26 2007-06-27 松下電工株式会社 On-premises communication system
US7519535B2 (en) * 2005-01-31 2009-04-14 Qualcomm Incorporated Frame erasure concealment in voice communications
JP2009063928A (en) * 2007-09-07 2009-03-26 Fujitsu Ltd Interpolation method and information processing apparatus
JP6133454B2 (en) * 2016-02-01 2017-05-24 株式会社Nttドコモ Audio signal processing method and audio signal processing apparatus
JP6352487B2 (en) * 2017-04-19 2018-07-04 株式会社Nttドコモ Audio signal processing method and audio signal processing apparatus

Also Published As

Publication number Publication date
JPH0588697A (en) 1993-04-09

Similar Documents

Publication Publication Date Title
JPH07123242B2 (en) Audio signal decoding device
JP2904427B2 (en) Missing voice interpolation device
JP4831138B2 (en) Audio signal transmission device, audio signal reception device, and audio signal transmission system
JP4367450B2 (en) Audio signal transmission method and audio signal decoding method
JP4597360B2 (en) Speech decoding apparatus and speech decoding method
JPH10308708A (en) Voice encoder
JP4367455B2 (en) Audio signal transmission method and audio signal decoding method
JP3856323B2 (en) Audio signal transmission method, audio signal decoding method, and audio encoding method
JP4367445B2 (en) Audio signal transmission method and audio signal decoding method
JP4367451B2 (en) Audio signal transmission method and audio signal decoding method
JPH05175916A (en) Voice transmission system
JP4367453B2 (en) Audio signal transmission method and audio signal decoding method
JP4367449B2 (en) Audio signal transmission method and audio signal decoding method
JP4367446B2 (en) Audio signal transmission method, audio signal decoding method, and audio encoding method
JP4367452B2 (en) Audio signal transmission method and audio signal decoding method
JP4367447B2 (en) Audio signal transmission method, audio signal decoding method, and audio encoding method
JP4367454B2 (en) Audio signal transmission method and audio signal decoding method
JP4367448B2 (en) Audio signal transmission method and audio signal decoding method
JPH05335968A (en) Encoder and decoder
JPS6251827A (en) Voice coding system
JPH02246625A (en) Predictive coding method for voice signal
JPH02214900A (en) Sound encoding device
JPH08274726A (en) Method and device for encoding and decoding sound signal
JP2005227793A (en) Voice coding method and voice decoding method
JP2005208668A (en) Voice encoding method and voice decoding method

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080326

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110326

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees