JP2659605B2 - Audio decoding device and audio encoding / decoding device - Google Patents

Audio decoding device and audio encoding / decoding device

Info

Publication number
JP2659605B2
JP2659605B2 JP2108484A JP10848490A JP2659605B2 JP 2659605 B2 JP2659605 B2 JP 2659605B2 JP 2108484 A JP2108484 A JP 2108484A JP 10848490 A JP10848490 A JP 10848490A JP 2659605 B2 JP2659605 B2 JP 2659605B2
Authority
JP
Japan
Prior art keywords
lsp
unit
decoded
parameter
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2108484A
Other languages
Japanese (ja)
Other versions
JPH045700A (en
Inventor
裕久 田崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2108484A priority Critical patent/JP2659605B2/en
Publication of JPH045700A publication Critical patent/JPH045700A/en
Application granted granted Critical
Publication of JP2659605B2 publication Critical patent/JP2659605B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、音声復号化装置及び音声符号化・復号化装
置に関し、特に、音声信号を一定時間(例えば20ms)の
分析フレームごとにスペクトル包絡情報を表わすLSPパ
ラメータと音源情報とに分離してディジタル伝送するた
めに好適な音声復号化装置及び音声符号化・復号化装置
に関する。
Description: BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an audio decoding device and an audio encoding / decoding device, and more particularly, to a spectral envelope of an audio signal for each analysis frame of a fixed time (for example, 20 ms). The present invention relates to a speech decoding apparatus and a speech encoding / decoding apparatus suitable for digital transmission by separating into LSP parameters representing information and sound source information.

[従来の技術] 一般、スペクトル包絡を表わすパラメータとして線形
予測係数やLSP等のLPC分析に基づくパラメータを用いる
場合は、LPC分析での極のバンド幅の過小推定、パラメ
ータの量子化誤差及び伝送誤り等により、復号音声の振
幅が入力音声に比べて異常に大きくなったり、スペクト
ル歪が大きくなるという問題がある。
[Prior Art] Generally, when parameters based on LPC analysis such as linear prediction coefficients and LSP are used as parameters representing a spectral envelope, underestimation of the pole bandwidth in LPC analysis, quantization errors of parameters and transmission errors For example, there is a problem that the amplitude of the decoded voice is abnormally large compared to the input voice, and the spectrum distortion is large.

従来から、LPC分析時の極のバンド幅の過小推定の影
響を軽減する方法として、文献「PARCOR分析時における
スペクトル平滑化ウインドの検討」(東倉、板倉、橋本
共著、日本音響学会研究発表会講演論文集、P393〜39
4、1977年4月刊)に示されているラグ窓処理が知られ
ている。一方、スペクトラパラメータとしてLSPを用い
る場合に量子化誤差と伝送誤り影響とを軽減する方法と
しては、文献「LSP分析合成系における量子化法と伝送
路雑音の影響」(管材、ナリマン 共著、電子情報通信
学会技術研究報告編、SP87−122、1988年2月刊)に示
されているLSPパラメータの順序関係を利用した量子化
方法及びLSPの順序関係と良好な補間特性を利用した伝
送誤り補正方法が知られている。
Conventionally, as a method to reduce the influence of underestimation of the pole bandwidth during LPC analysis, a document "Study of spectrum smoothing window during PARCOR analysis" (Higashikura, Itakura, Hashimoto co-authored, Lecture presentation at the Acoustical Society of Japan) Transactions, pp. 393-39
4, April 1977) is known. On the other hand, as a method for reducing the quantization error and the effect of transmission error when using LSP as a spectrum parameter, see the document "Quantization method and effect of transmission line noise in LSP analysis / synthesis system" (Tube and Nariman, Electronic Information, The quantization method using the order relation of LSP parameters and the transmission error correction method using the order relation of LSP and good interpolation characteristics, which are shown in the Technical Report of the Communication Society, SP87-122, published February 1988) Are known.

第2図は上記各文献に記載された音声信号の符号化並
びに復号化とラグ窓処理とを組み合わせた従来の音声符
号化・復号化装置のブロック図である。図において、符
号化部1は、入力された入力音声信号3を符号化し、符
号化音源情報13や、この符号化音源情報13の符号化に関
連するLSP情報を含む符号化LSP情報7を送出する。復号
化部2は、符号化LSP情報7に基づいて符号化音源情報1
3を復号化して復号音声信号19を出力する。符号化部1
において、自己相関分析手段4は、入力音声信号3の分
析フレーム毎に自己相関を分析して自己相関係数を出力
する。自己相関分析手段4から出力された自己相関係数
は、ラグ窓手段20によってラグ窓処理が加えられ、補正
自己相関係数が算出される。ラグ窓手段20から出力され
た補正自己相関係数には、LSP分析手段5によってLSP分
析が実施され、その補正自己相関係数はLSPパラメータ
に変換される。出力されたLSPパラメータは、LSP符号化
手段6によって分析結果の符号化が行なわれ、この符号
化に基づいて符号化LSP情報7が出力される。次元間比
較手段21は、LSP符号化手段6における符号化後のLSPパ
ラメータの次元間の順序関係が満足されているか否かの
判定を行なう。LSP複号化手段8は、符号化LSP情報7を
復号化して復号化LSPパラメータに変換する。LSP逆フィ
ルタ手段11は、符号化部1においてLSP復号化手段8か
らの復号化LSPパラメータを用いて入力音声信号3を逆
フィルタリングして音源信号を出力する。音源符号化手
段12は、LSP逆フィルタ手段11からの音源信号の符号化
を行ない符号化音源情報13を出力する。
FIG. 2 is a block diagram of a conventional audio encoding / decoding apparatus which combines encoding and decoding of audio signals and lag window processing described in each of the above documents. In the figure, an encoding unit 1 encodes an input input audio signal 3 and sends out encoded excitation information 13 and encoded LSP information 7 including LSP information related to encoding of the encoded excitation information 13. I do. The decoding unit 2 encodes the encoded excitation information 1 based on the encoded LSP information 7.
3 and outputs a decoded audio signal 19. Encoding unit 1
, The autocorrelation analysis means 4 analyzes the autocorrelation for each analysis frame of the input speech signal 3 and outputs an autocorrelation coefficient. The autocorrelation coefficient output from the autocorrelation analysis means 4 is subjected to lag window processing by the lag window means 20 to calculate a corrected autocorrelation coefficient. The corrected autocorrelation coefficient output from the lag window means 20 is subjected to LSP analysis by the LSP analysis means 5, and the corrected autocorrelation coefficient is converted into LSP parameters. The output LSP parameter is subjected to encoding of the analysis result by the LSP encoding means 6, and encoded LSP information 7 is output based on the encoding. The inter-dimensional comparison means 21 determines whether or not the order relation between the dimensions of the LSP parameters after encoding in the LSP encoding means 6 is satisfied. The LSP decoding means 8 decodes the encoded LSP information 7 and converts it into decoded LSP parameters. The LSP inverse filter means 11 performs inverse filtering on the input speech signal 3 using the decoded LSP parameter from the LSP decoding means 8 in the encoding unit 1 and outputs a sound source signal. Excitation encoding means 12 encodes the excitation signal from LSP inverse filter means 11 and outputs encoded excitation information 13.

復号化部2において、音源復号化手段17は、符号化部
1からの符号化音源情報13を復号化する。LSP復号化手
段14は、符号化部1からの符号LSP情報7を復号化す
る。復号化されたLSPパラメータは、次元間比較手段22
によって、次元間の順序関係に逆転が起こっていないか
否かが判定される。LSP補間手段23は、次元間比較手段2
2が次元間の順序関係が逆転していると判定した場合
に、LSPを前後のフレーム間で補間する。LSP合成フィル
タ18は、LSP復号化手段14及びLSP補間手段23を通じて得
られたLSPパラメータと、音源復号化手段17からの音源
信号とを用いて復号音声信号19を生成出力する。
In the decoding unit 2, the excitation decoding unit 17 decodes the encoded excitation information 13 from the encoding unit 1. The LSP decoding means 14 decodes the encoded LSP information 7 from the encoding unit 1. The decoded LSP parameter is used as the
Thus, it is determined whether or not the order relation between the dimensions is reversed. LSP interpolation means 23
If 2 determines that the order relation between the dimensions is reversed, the LSP is interpolated between the preceding and succeeding frames. The LSP synthesis filter 18 generates and outputs a decoded speech signal 19 using the LSP parameters obtained through the LSP decoding means 14 and the LSP interpolation means 23 and the sound source signal from the sound source decoding means 17.

次に上記構成の動作を説明する。先ず、符号化部1に
おいて自己相関分析手段4は分析フレーム毎に入力音声
信号3の自己相関分析を行ない、自己相関係数r(k)
を算出する。ここで、k=0〜Mであり、Mは分析次数
である。ラグ窓手段20は自己相関分析手段4で得られた
r(k)にラグ窓関数w(k)を乗ずることにより補正
自己相関係数rw(k)を算出する。ちなみに、 である。但し、nはラグ窓の効果の強さを決める定数で
ある。また、 rw(k)=r(k)f×w(k) ……(2) である。但し、k=0〜Mである。LSP分析手段5は補
正自己相関係数rw(k)をLSPパラメータω(k)に変
換する。但し、k=1〜Mである。LSP符号化手段6は
次元間比較手段21を用いて符号化後のLSPパラメータ
が、 0<ω(1)ω(2)<・・・<ω(M)<π ……(3) の次元間の順序関係を満足することを確認しつつその条
件下で量子化歪が最小になるように符号化を行ない、i
ω(k)で表わされる符号化LSP情報7を算出し出力す
る。ちなみに、k=1〜Mである。このようにして得ら
れた符号化LSP情報7は復合化部に送出されると共に符
号化部1においてLSP復号化手段8に与えられる。
Next, the operation of the above configuration will be described. First, in the encoding unit 1, the autocorrelation analysis means 4 performs an autocorrelation analysis of the input speech signal 3 for each analysis frame, and an autocorrelation coefficient r (k)
Is calculated. Here, k = 0 to M, and M is the analysis order. The lag window means 20 calculates a corrected autocorrelation coefficient rw (k) by multiplying r (k) obtained by the autocorrelation analysis means 4 by a lag window function w (k). By the way, It is. Here, n is a constant that determines the strength of the effect of the lag window. Rw (k) = r (k) f × w (k) (2) However, k = 0 to M. The LSP analysis means 5 converts the corrected autocorrelation coefficient rw (k) into an LSP parameter ω (k). However, k = 1 to M. The LSP encoding means 6 uses the inter-dimensional comparison means 21 to encode the LSP parameters as follows: 0 <ω (1) ω (2) <... <Ω (M) <π (3) Encoding is performed so as to minimize the quantization distortion under the conditions while confirming that the order relation between i and i is satisfied.
The coded LSP information 7 represented by ω (k) is calculated and output. Incidentally, k = 1 to M. The coded LSP information 7 obtained in this way is sent to the decoding unit and supplied to the LSP decoding means 8 in the coding unit 1.

LSP復号化手段8は、LSP符号化手段6からの符号化LS
P情報7を復号化して復号化LSPパラメータω′(k)に
変換する。但し、k=1〜Mである。LSP逆フィルタ手
段11な復号化LSPパラメータを用いて入力音声信号3を
逆フィルタリングして音源信号を発生する。音源符号化
手段12はこの音源信号を符号化して復号化部2に送出す
る。
The LSP decoder 8 encodes the encoded LS from the LSP encoder 6.
The P information 7 is decoded and converted into a decoded LSP parameter ω ′ (k). However, k = 1 to M. The LSP inverse filter means 11 inversely filters the input speech signal 3 using the decoded LSP parameter to generate a sound source signal. Excitation encoding means 12 encodes this excitation signal and sends it to decoding section 2.

一方、復号化部2において、LSP復号化手段14は、符
号化LSP情報7を復号化して復号化LSPパラメータを算出
し、次元間比較手段22及びLSP補間手段23に出力する。
次元間比較手段22が復号化LSPパラメータの次元間の順
序関係に逆転が起こっていないと判断すると、LSP補間
手段23は、復号化LSPパラメータをそのままLSP合成フィ
ルタ18に出力する。一方、逆転が起こっていると判断さ
れた場合には、逆転しているどちらかの次元のLSPパラ
メータが誤っていると判断して、LSP補間手段23は、両
方の次元の復号化LSPパラメータを前後のフレームの値
で補間したり、前フレームの値に置換したりして補正を
行なう。補正された復号化LSPパラメータはLSP合成フィ
ルタ18に出力される。音源復号化手段17は、符号化部1
からの符号化音源情報13を復号化して得られた音源信号
をLSP合成フィルタ18に出力する。LSP合成フィルタ18
は、入力された復号化LSPパラメータと音源信号を用い
て復号音声信号19を生成し出力する。
On the other hand, in the decoding unit 2, the LSP decoding means 14 decodes the coded LSP information 7 to calculate a decoded LSP parameter, and outputs it to the inter-dimensional comparison means 22 and the LSP interpolation means 23.
If the inter-dimensional comparison means 22 determines that the order relation between the dimensions of the decoded LSP parameters has not been reversed, the LSP interpolation means 23 outputs the decoded LSP parameters to the LSP synthesis filter 18 as they are. On the other hand, when it is determined that inversion has occurred, it is determined that the LSP parameter of one of the reversed dimensions is incorrect, and the LSP interpolation means 23 calculates the decoded LSP parameter of both dimensions. The correction is performed by interpolating with the values of the preceding and succeeding frames or replacing the values with the values of the previous frame. The corrected decoded LSP parameter is output to LSP synthesis filter 18. The sound source decoding means 17 includes the encoding unit 1
And outputs the excitation signal obtained by decoding the encoded excitation information 13 to the LSP synthesis filter. LSP synthesis filter 18
Generates and outputs a decoded audio signal 19 using the input decoded LSP parameters and the excitation signal.

このように従来の音声符号化・復号化装置では、符号
化部において自己相関係数に対してラグ窓を乗ずること
で分析時の極のバンド幅の過小推定による影響を軽減
し、合成フィルタの安定条件を与えるLSPパラメータの
順序関係を利用して符号化部で順序関係を満たすように
量子化することで量子化誤差の影響を軽減し、復号化部
では復号化結果が順序関係を満たさない場合に伝送誤り
と判断して補正を行なうようにすることで伝送誤りの影
響を軽減するようにしているが、極のバンドが本来狭い
ためにバンド幅の過小推定が強い場合には定数nを変化
させてラグ窓の結果を強くしないと過小推定の影響を十
分に除去できず、この時には他の極のバンド幅も必要以
上に広がってしまうため、結果的に不明瞭な合成音を出
力してしまうという、解決すべき大きな課題がある。ま
た、量子化誤差の影響についてはLSPパラメータの次元
間の順序関係を満足するようにすることで極端な合成音
振幅の増大は除去できるが、順序の逆転は起こらないま
でも2つの次元間の距離が近づきすぎた場合には、合成
音の振幅が入力音声と比べてかなり増加し、フレーム間
での不自然なパワー変動が発生するという別の問題があ
り、更に伝送誤りによって2つの次元間の距離が近づき
すぎた場合にも同様の解決すべき課題がある。
As described above, in the conventional speech encoding / decoding device, the influence of the underestimation of the pole bandwidth at the time of analysis is reduced by multiplying the autocorrelation coefficient by the lag window in the encoding unit, and the The effect of the quantization error is reduced by using the order relation of the LSP parameter that gives the stability condition so as to satisfy the order relation in the encoding unit, and the decoding result does not satisfy the order relation in the decoding unit In this case, the influence of the transmission error is reduced by judging that the transmission error has occurred, but the effect of the transmission error is reduced. The effect of underestimation cannot be sufficiently removed unless the result of the lag window is increased by changing the lag window, and at this time, the bandwidth of the other poles is unnecessarily widened, and as a result, an unclear synthesized sound is output. Solution There is a big problem should do. In addition, regarding the influence of the quantization error, an extreme increase in the amplitude of the synthesized sound can be removed by satisfying the order relation between the dimensions of the LSP parameter, but the order between the two dimensions can be eliminated even if the order is not reversed. If the distance is too close, the amplitude of the synthesized sound increases considerably compared to the input voice, and there is another problem that unnatural power fluctuation occurs between frames. There is a similar problem to be solved when the distance is too short.

[発明が解決しようとする課題] 隣接する次元間の距離が近付きすぎることを回避しな
がら、LPC分析における極のバンド幅の過小推定の影響
を軽減する方法としては、特開昭58−181096号公報に開
示された2つの方法がある。1つは、音声信号を分析し
てLSPパラメータを算出した後、このLSPパラメータの各
次元の値を、平坦なスペクトル包絡を表す等分割のLSP
パラメータの値に線形的に近似させる方法である。もう
1つは、算出されたLSPパラメータの隣接次元間の距離
を算出し、この距離が所定の閾値より小さい部分の間隔
のみを広げ、各間隔の比率が変化しないように比例的に
全体の間隔を戻す方法である。いずれの方法でも、LPC
分析における極のバンド幅の過小推定の影響を軽減する
ことができる一方で、スペクトル包絡のピークの位置が
ずれることから、復合音声の声の特徴が変形されてしま
うといった問題が生じる。
[Problems to be Solved by the Invention] As a method for reducing the influence of underestimation of the pole bandwidth in LPC analysis while avoiding the distance between adjacent dimensions becoming too close, Japanese Patent Application Laid-Open No. 58-181096 discloses a method. There are two methods disclosed in the gazette. One is to analyze an audio signal and calculate an LSP parameter, and then convert the values of each dimension of the LSP parameter into equal-division LSPs representing a flat spectral envelope.
This is a method of linearly approximating the value of the parameter. The other is to calculate the distance between adjacent dimensions of the calculated LSP parameter, expand only the interval of the portion where this distance is smaller than a predetermined threshold, and proportionally increase the entire interval so that the ratio of each interval does not change. Is a way to return. In either case, LPC
While the influence of underestimation of the pole bandwidth in the analysis can be reduced, the position of the peak of the spectral envelope shifts, which causes a problem that the voice characteristics of the decoded speech are deformed.

このような問題を伴うことなく隣接する次元間の距離
が近付きすぎることを回避しながら、LPC分析における
極のバンド幅の過小推定の影響を軽減することができる
方法として、特開昭62−25800号公報に開示されたもの
がある。この方法では、算出されたLSPパラメータの隣
接次元間の距離を算出し、この距離が所定の閾値より小
さい部分の間隔のみを広げ、得られたLSPパラメータを
そのまま用いている。
As a method that can reduce the influence of underestimation of the pole bandwidth in LPC analysis while avoiding the distance between adjacent dimensions becoming too close without such a problem, Japanese Patent Application Laid-Open No. Sho 62-25800 Is disclosed in Japanese Patent Application Laid-Open Publication No. HEI 9-203 (1995). In this method, a distance between adjacent dimensions of the calculated LSP parameter is calculated, only an interval of a portion where the distance is smaller than a predetermined threshold is widened, and the obtained LSP parameter is used as it is.

特開昭62−25800号公報に開示された方法を用いて、
隣接する次元間の距離が近付きすぎることを回避する場
合には、極のバンド幅の過小推定によってLSPパラメー
タの隣接する次元間の距離が小さくなっている部分を選
択的に広げることができるので、他の極のバンド値を不
必要に広げることがない。そのため、図2に示される構
成に伴う問題点を解消することができるが、その一方
で、補正されたLSPパラメータを量子化した場合、量子
化歪みによって再び次元間距離が小さくなったり、伝送
誤りによって次元間距離が小さくなったりし、不自然な
パワー変動が発生してしまうという課題は残る。
Using the method disclosed in JP-A-62-25800,
In order to avoid that the distance between adjacent dimensions is too close, it is possible to selectively widen the portion where the distance between adjacent dimensions of the LSP parameter is small by underestimating the bandwidth of the pole, It does not unnecessarily widen the band values of the other poles. Therefore, the problem associated with the configuration shown in FIG. 2 can be solved. On the other hand, when the corrected LSP parameter is quantized, the inter-dimensional distance is reduced again due to quantization distortion, or transmission error is reduced. However, there remains a problem that the inter-dimensional distance is reduced and unnatural power fluctuation occurs.

本発明は、上記従来技術の残された課題を解決して、
非常に簡単な構成で、量子化誤差と伝送誤りに起因する
合成音振幅の変動を防止して安定した合成音の出力を得
ることが可能な音声符号化・復号化装置ならびに音声符
号化装置や音声復号化装置を提供することを目的とす
る。
The present invention solves the above-mentioned problems of the prior art,
With a very simple configuration, a speech encoding / decoding device and a speech encoding device capable of preventing fluctuations in synthesized speech amplitude due to quantization errors and transmission errors to obtain a stable synthesized speech output, An object of the present invention is to provide an audio decoding device.

[課題を解決するための手段] 上記目的を達成するために、第1の発明によれば、LS
P入力部(50)、音源情報入力部(55)、LSP復号化部
(51)、LSP補正部(52)、復号音声信号発生部(5
6)、音声信号出力部(59)からなる音声復号化装置で
あって、LSP入力部(50)には、伝送路より符号化LSPパ
ラメータが入力され、LSP復号化部(51)に供給され、
音源情報入力部(55)には、補正されたLSPパラメータ
を用いて音声信号より生成された符号化音源情報が伝送
路より入力され、復号音声信号発生部(56)に供給さ
れ、LSP復号化部(51)は、符号化LSPパラメータを復号
化し、復号化LSPパラメータとしてLSP補正部(52)に供
給し、LSP補正部(52)は、音源情報入力部(55)に入
力される符号化音源情報を生成する際に用いられたLSP
パラメータの補正と同様に補正し、補正LSPパラメータ
として復号音声信号発生部(56)に供給し、復号音声信
号発生部(56)は、符号化音情報を復号化して復号化音
源情報を得るとともに、この復号化音源情報と補正LSP
パラメータより復号音声信号を生成し、この復号音声信
号を復号音声信号出力部(59)に出力する音声復号化装
置が提供される。
[Means for Solving the Problems] To achieve the above object, according to the first invention, an LS
P input unit (50), sound source information input unit (55), LSP decoding unit (51), LSP correction unit (52), decoded audio signal generation unit (5
6) An audio decoding device including an audio signal output unit (59), in which an LSP input unit (50) receives an encoded LSP parameter from a transmission path and supplies it to an LSP decoding unit (51). ,
The coded excitation information generated from the audio signal using the corrected LSP parameter is input to the excitation information input unit (55) from the transmission path, and is supplied to the decoded audio signal generation unit (56) for LSP decoding. The unit (51) decodes the encoded LSP parameter and supplies it as a decoded LSP parameter to the LSP correction unit (52). The LSP correction unit (52) encodes the input LSP parameter into the sound source information input unit (55). LSP used to generate sound source information
The correction is performed in the same manner as the correction of the parameter, and is supplied as a corrected LSP parameter to the decoded audio signal generator (56). The decoded audio signal generator (56) decodes the encoded sound information to obtain decoded excitation information. , This decoded sound source information and the corrected LSP
An audio decoding device that generates a decoded audio signal from parameters and outputs the decoded audio signal to a decoded audio signal output unit (59) is provided.

また、第2の発明によれば、LSP補正部(52)は、復
号化LSPパラメータの隣接する次元間距離を算出する次
元間距離算出手段(54)と、算出した次元間距離が予め
定められた閾値を下回る場合には、閾値に応じて復号化
LSPパラメータを補正し、補正LSPパラメータとして出力
するLSP補正手段(53)を備えた音声復号化装置が提供
される。
According to the second invention, the LSP correction unit (52) includes an inter-dimensional distance calculating unit (54) for calculating an inter-dimensional distance between adjacent decoding LSP parameters, and the calculated inter-dimensional distance is predetermined. If it falls below the threshold,
There is provided a speech decoding device including an LSP correction unit (53) for correcting an LSP parameter and outputting the corrected LSP parameter as a corrected LSP parameter.

更に、第3の発明によれば、音声信号入力部(30)、
LSP生成部(31)、LSP符号化部(34)、LSP出力部(4
2)、第1のLSP復号化部(35)、第1のLSP補正部(3
6)、符号化音源情報発生部(39)、音源情報出力部(4
3)からなる符号化装置(1)であって、音声信号入力
部(30)は外部から入力される音声信号をLSP生成部(3
1)と符号化音源情報発生部(39)に供給し、LSP生成部
(31)は音声信号からLSPパラメータを生成し、LSP符号
化部(34)に供給し、LSP符号化部(34)はLSPパラメー
タを符号化し、符号化LSPパラメータとして第1のLSP復
号化部(35)に供給すると共に、LSP出力部(42)に出
力し、第1のLSP復号化部(35)は符号化LSPパラメータ
を復号化し、復号化LSPパラメータとして第1のLSP補正
部(36)に供給し、第1のLSP補正部(36)は復号化LSP
パラメータを補正し、補正LSPパラメータとして符号化
音源情報発生部(39)に供給し、符号化音源情報発生部
(39)は、補正LSPパラメータと音声信号により音源情
報を得るとともに、この音源情報を符号化した符号化音
源情報を音源情報出力部(43)に出力する符号化装置
(1)と、LSP入力部(50)、音源情報入力部(55)、
第2のLSP復号化部(51)、第2のLSP補正部(52)、復
号音声信号発生部(56)、音声信号出力部(59)からな
る復号化装置(2)であって、LSP入力部(50)は、伝
送路より入力される符号化入力パラメータを第2のLSP
復号化部(51)に供給し、第2のLSP復号化部(51)
は、符号化LSPパラメータを復号化し、復号化LSPパラメ
ータとして第2のLSP補正部(52)に供給し、第2のLSP
補正値(52)は、復号化LSPパラメータを第1のLSP補正
部(36)と同様に補正し、補正LSPパラメータとして復
号音声信号発生部(56)に供給し、音源情報入力部(5
5)は、伝送路より入力される符号化音源情報を復号音
声信号発生部(56)に供給し、復号音声信号発生部(5
6)は、符号化音源情報を復号化して復号化音源情報を
得るとともに、この復号化音源情報と補正LSPパラメー
タより復号音声信号を生成し、この復号音声信号を復号
音声信号出力部(59)に出力する復号化装置(2)とか
らなる音声符号化・復号化装置が提供される。
Further, according to the third invention, an audio signal input unit (30),
LSP generator (31), LSP encoder (34), LSP output (4
2), a first LSP decoder (35), a first LSP corrector (3
6), coded excitation information generation unit (39), excitation information output unit (4
An audio signal input unit (30) is an encoding device (1) comprising an LSP generation unit (3).
1) and the coded excitation information generating unit (39), and the LSP generating unit (31) generates the LSP parameter from the audio signal, and supplies the generated LSP parameter to the LSP coding unit (34), and the LSP coding unit (34) Encodes the LSP parameter, supplies it to the first LSP decoding unit (35) as an encoded LSP parameter, and outputs it to the LSP output unit (42). The first LSP decoding unit (35) The LSP parameter is decoded and supplied to the first LSP correction unit (36) as a decoded LSP parameter, and the first LSP correction unit (36)
The parameters are corrected and supplied as a corrected LSP parameter to the coded excitation information generation unit (39). The coded excitation information generation unit (39) obtains the excitation information from the corrected LSP parameter and the audio signal, and An encoding device (1) for outputting encoded encoded excitation information to an excitation information output unit (43); an LSP input unit (50); an excitation information input unit (55);
A decoding apparatus (2) including a second LSP decoding section (51), a second LSP correction section (52), a decoded audio signal generation section (56), and an audio signal output section (59), The input unit (50) converts the coded input parameter input from the transmission path into the second LSP
A second LSP decoding unit (51) which supplies the data to the decoding unit (51)
Decodes the encoded LSP parameter and supplies it as a decoded LSP parameter to the second LSP correction unit (52).
The correction value (52) corrects the decoded LSP parameter in the same manner as the first LSP correction unit (36), supplies the corrected LSP parameter to the decoded audio signal generation unit (56) as a corrected LSP parameter, and outputs the sound source information input unit (5
5) supplies the encoded sound source information input from the transmission path to the decoded speech signal generation unit (56), and supplies the decoded speech signal generation unit (5).
6) decodes the encoded excitation information to obtain decoded excitation information, generates a decoded audio signal from the decoded excitation information and the corrected LSP parameter, and outputs the decoded audio signal to a decoded audio signal output unit (59). And a decoding device (2) for outputting the audio signal to the audio encoding / decoding device.

更に、第4の発明によれば、第1のLSP補正部(36)
は、復号化LSPパラメータの隣接する次元間距離を算出
する第1の次元間距離算出手段(38)と、算出した次元
間距離が予め定められた閾値を下回る場合には、閾値に
応じて復号化LSPパラメータを補正し、補正復号化LSPパ
ラメータとして出力する第1のLSP補正手段(37)から
なり、第2のLSP補正部(52)は、復号化LSPパラメータ
の隣接する次元間距離を算出する第2の次元間距離算出
手段(54)と、算出した次元間距離が予め定められた閾
値を下回る場合には、閾値に応じて復号化LSPパラメー
タを補正し、補正復号化LSPパラメータとて出力する第
2のLSP補正手段(54)からなる音声符号化・復号化装
置が提供される。
Further, according to the fourth invention, the first LSP correction unit (36)
A first inter-dimension distance calculating means (38) for calculating an inter-dimension distance between adjacent LSP parameters, and decoding according to the threshold if the calculated inter-dimension distance is smaller than a predetermined threshold. A first LSP correction unit (37) that corrects the decoded LSP parameter and outputs the corrected LSP parameter as a corrected decoding LSP parameter, and the second LSP correction unit (52) calculates the distance between adjacent dimensions of the decoded LSP parameter. A second inter-dimension distance calculating means (54) for correcting the decoding LSP parameter according to the threshold when the calculated inter-dimension distance is smaller than a predetermined threshold; An audio encoding / decoding device comprising a second LSP correcting means (54) for outputting is provided.

[作用] 本発明によれば、音声信号は送信側である符号化装置
において、符号化LSPパラメータと符号化音源情報とに
分離されて伝送路に送出される。そして、この両情報を
受信した復号化装置はそれぞれ復号化されたLSPパラメ
ータと音源信号を合成して復号音声信号を発生する。本
発明において特徴的なことは、このような伝送路を介し
て送受信される音声信号に対して、符号化装置での量子
化誤差に起因する合成音振幅の変動と、伝送路における
伝送誤りに起因する合成音振幅の変動を効果的に防止し
たことにある。そして、符号化装置では符号化音源情報
に対して前記量子化誤差に起因する変動の防止を行い、
一方において復号化装置においてはLSPパラメータに対
して量子化誤差及び伝送誤りの両者に起因する合成音振
幅の変動を防止する補正を行っている。
[Operation] According to the present invention, the audio signal is separated into the encoded LSP parameter and the encoded excitation information in the encoding device on the transmitting side, and transmitted to the transmission path. Then, the decoding device that has received both pieces of information combines the decoded LSP parameter and the excitation signal to generate a decoded speech signal. What is characteristic of the present invention is that, for a speech signal transmitted and received via such a transmission path, fluctuations in the synthesized sound amplitude due to a quantization error in the encoding device and transmission errors in the transmission path. This is to effectively prevent the fluctuation of the amplitude of the synthesized sound caused by the fluctuation. Then, in the encoding device, to prevent fluctuation due to the quantization error for the encoded excitation information,
On the other hand, in the decoding device, the LSP parameter is corrected to prevent the fluctuation of the amplitude of the synthesized sound caused by both the quantization error and the transmission error.

このように、本発明によれば、量子化誤差と伝送誤り
の両者に対してそれぞれ変動防止の補正を符号化装置と
復号化装置とに分けて分担させたことにより、伝送路に
送り込まれるデータ量を増大させることなく、きわめて
効果的に前記誤差に対処することが可能となる。
As described above, according to the present invention, both the quantization error and the transmission error are separately divided into the encoding device and the decoding device to perform the variation prevention correction, so that the data sent to the transmission path is divided. The error can be dealt with very effectively without increasing the amount.

そして、本発明の構成によれば、符号化装置において
LSP符号化部が音声信号のLSPパラメータを量子化する。
また、次元間距離算出手段によって、量子化されたLSP
パラメータから互いに隣接する次元のLSPパラメータ間
の距離を算出し、この算出結果に基づき、LSP補正手段
により前記LSPパラメータを補正する。補正されたLSPパ
ラメータに基づいて音声信号より符号化音源情報が生成
される。この結果、符号化装置から送出される符号化音
源情報は量子化誤差に起因する変動が防止された情報と
なる。
According to the configuration of the present invention,
An LSP encoder quantizes the LSP parameters of the audio signal.
Also, the LSP quantized by the inter-dimensional distance calculation means.
The distance between the LSP parameters of adjacent dimensions is calculated from the parameters, and the LSP correction means corrects the LSP parameters based on the calculation result. Encoded excitation information is generated from the audio signal based on the corrected LSP parameters. As a result, the encoded excitation information transmitted from the encoding device becomes information in which fluctuation due to a quantization error is prevented.

更に、本発明の構成によれば、算出されたLSPパラメ
ータ間の距離が予め定められた閾値を下回る場合にLSP
補正手段によって前記LSPパラメータを前記閾値に応じ
て補正する。
Further, according to the configuration of the present invention, when the distance between the calculated LSP parameters is less than a predetermined threshold, the LSP
The correction means corrects the LSP parameter according to the threshold.

更に、本発明の構成によれば、復号化装置において、
LSP復号化部が、音声信号の符号化LSPパラメータを復号
化する。また、次元間距離算出手段によってLSPパラメ
ータから互いに隣接する次元のLSPパラメータ間の距離
を算出し、この算出結果に基づき、LSP補正手段により
前記LSPパラメータを補正する。補正されたLSPパラメー
タに基づいて音声の復号化が行われる。この結果、復号
化装置では、LSPパラメータに対して量子化誤差及び伝
送誤りに起因する変動の防止が行われる。
Further, according to the configuration of the present invention, in the decoding device,
An LSP decoding unit decodes an encoded LSP parameter of the audio signal. The distance between the LSP parameters of adjacent dimensions is calculated from the LSP parameters by the inter-dimensional distance calculating means, and the LSP correction means corrects the LSP parameters based on the calculation result. Speech decoding is performed based on the corrected LSP parameters. As a result, the decoding device prevents fluctuations in the LSP parameters due to quantization errors and transmission errors.

更に、本発明の構成によれば、算出されたLSPパラメ
ータ間の距離が予め定められた閾値を下回る場合にLSP
補正手段によって前記LSPパラメータを前記閾値に応じ
て補正する。
Further, according to the configuration of the present invention, when the distance between the calculated LSP parameters is less than a predetermined threshold, the LSP
The correction means corrects the LSP parameter according to the threshold.

[実施例] 以下、図面を参照しながら本発明の実施例を説明す
る。
Embodiment An embodiment of the present invention will be described below with reference to the drawings.

第1図は本発明の一実施例に係る音声符号化・復号化
装置のブロック図を示す。符号化装置1において、LSP
生成部31は自己相関分析手段32とLSP分析手段33を含
み、自己相関分析手段32は音声信号入力部30から入力さ
れた入力音声信号の分析フレーム毎に自己相関を分析し
て自己相関係数を出力し、LSP分析手段33から出力され
た自己相関係数に対してLSP分析を実施してLSPパラメー
タに変換する。LSP符号化部34は、LSP分析手段33のLSP
パラメータ出力から分析結果の符号化を行ない符号化LS
Pパラメータを出力する。LSP符号化部34から符号化LSP
パラメータを受けた第1のLSP復号化部35はLSP復号化を
行ない復号化LSPパラメータを第1のLSP補正部36の第1
のLSP補正手段37及び第1の次元間距離算出手段38の両
者へ出力する。
FIG. 1 is a block diagram of a speech encoding / decoding device according to an embodiment of the present invention. In the encoding device 1, the LSP
The generation unit 31 includes an autocorrelation analysis unit 32 and an LSP analysis unit 33. The autocorrelation analysis unit 32 analyzes the autocorrelation for each analysis frame of the input audio signal input from the audio signal input unit 30, and calculates the autocorrelation coefficient. And performs an LSP analysis on the autocorrelation coefficient output from the LSP analysis means 33 to convert it into LSP parameters. The LSP encoding unit 34 is an LSP
Encoding LS by encoding analysis results from parameter output
Outputs P parameters. LSP encoding unit 34 to encode LSP
The first LSP decoding unit 35 having received the parameter performs the LSP decoding, and outputs the decoded LSP parameter to the first LSP correcting unit 36.
To the LSP correction means 37 and the first inter-dimensional distance calculation means 38.

符号化装置1では、第1の次元間距離算出手段38は、
第1のLSP復号化部35の出力から復号化LSPパラメータの
隣接する次元間の距離を算出する。第1のLSP補正手段3
7は、第1の次元間距離算出手段38で算出された次元間
距離に基づいて、第1のLSP復号化部35からの復号化LSP
パラメータに補正を与え、補正復号化LSPパラメータを
出力する。符号化装置1に設けられている符号化音源情
報発生部39は前記補正復号化LSPパラメータ及び前記音
声信号入力部30からの音声信号の両者が入力されるLSP
逆フィルタ手段40と音源符号化手段41とを含む。LSP逆
フィルタ手段40は前記補正復号化LSPパラメータを用い
て入力音声信号を逆フィルタリングし、この音源情報が
音源符号化手段41によって符号化され、符号化音源情報
として音源情報出力部43から伝送路に出力される。
In the encoding device 1, the first inter-dimensional distance calculating means 38
The distance between adjacent dimensions of the decoded LSP parameter is calculated from the output of the first LSP decoding unit 35. First LSP correction means 3
7 denotes a decoding LSP from the first LSP decoding unit 35 based on the inter-dimensional distance calculated by the first inter-dimensional distance calculating means 38.
The parameter is corrected, and the corrected decoding LSP parameter is output. The encoded excitation information generating unit 39 provided in the encoding device 1 is an LSP to which both the corrected decoding LSP parameter and the audio signal from the audio signal input unit 30 are input.
It includes inverse filter means 40 and excitation coding means 41. The LSP inverse filter means 40 performs inverse filtering of the input speech signal using the corrected decoding LSP parameter, and the excitation information is encoded by the excitation encoding means 41, and is transmitted from the excitation information output section 43 as encoded excitation information to the transmission path. Is output to

復号化装置2では、第2のLSP復号化部51は、符号化
装置1から伝送路を介してLSP入力部50に入力された符
号化LSPパラメータを復号化して復号化LSPパラメータを
出力する。復号化LSPパラメータは第2のLSP補正部52を
構成する第2のLSP補正手段53及び第2の次元間距離算
出手段54の両者に入力され、第2の次元間距離算出手段
54は、復号化されたLSPパラメータの隣接する次元間の
距離を算出する。この第2の次元間距離算出手段54で算
出された次元間距離に基づいて、第2のLSP補正手段53
は、第2のLSP復号化部51からの復号化LSPパラメータを
補正して補正復号化LSPパラメータを出力する。復号化
装置2は復号音声信号発生部56を含み、この復号音声信
号発生部56は音源復号化手段57とLSP合成フィルタ58と
を含み、音源情報入力部55から伝送路を介して供給され
た符号化音源情報が音源復号化手段57に供給されてい
る。音源復号化手段57は符号化音源情報を復号化して復
号化音源情報を出力する。LSP合成フィルタ58は、第2
のLSP補正手段53からの補正復号化LSPパラメータと音源
復号化手段57からの復号化音源情報とを用いて復号音声
信号を生成し音声信号出力部59へ出力する。
In the decoding device 2, the second LSP decoding unit 51 decodes the encoded LSP parameter input from the encoding device 1 to the LSP input unit 50 via the transmission path, and outputs the decoded LSP parameter. The decoded LSP parameter is input to both the second LSP correcting means 53 and the second inter-dimensional distance calculating means 54 constituting the second LSP correcting unit 52, and the second inter-dimensional distance calculating means
54 calculates the distance between adjacent dimensions of the decoded LSP parameter. Based on the inter-dimensional distance calculated by the second inter-dimensional distance calculating means 54, the second LSP correcting means 53
Corrects the decoded LSP parameter from the second LSP decoding unit 51 and outputs a corrected decoded LSP parameter. The decoding device 2 includes a decoded speech signal generation unit 56, which includes a sound source decoding unit 57 and an LSP synthesis filter 58, and is supplied from the sound source information input unit 55 via a transmission path. The encoded excitation information is supplied to excitation decoding means 57. Excitation decoder 57 decodes the encoded excitation information and outputs decoded excitation information. The LSP synthesis filter 58
Using the corrected decoding LSP parameter from the LSP correction unit 53 and the decoded excitation information from the excitation decoding unit 57, a decoded audio signal is generated and output to the audio signal output unit 59.

以上のような構成において、次にその動作を説明す
る。先ず、符号化装置1において、LSP生成部31の自己
相関分析手段32は分析フレーム毎に入力音声信号の自己
相関分析を行ない、自己相関係数r(k)を算出する。
ここで、k=0〜Mであり、Mは分析次数である。LSP
分析手段33は、このr(k)をLSPパラメータω(k)
に変換する。ここで、k=1〜Mである。LSP符号化部3
4はスカラ量子化やベクトル・スカラ量子化等の量子化
法を用いて、(3)式に示した 0<ω(1)<ω(2)<・・・<ω(M)<π の各パラメータの順序関係を満足することを確認しつつ
LSPパラメータの符号化を行ない、iω(k)で表わさ
れる符号化LSPパラメータを算出し出力する。ちなみ
に、ここでk=1〜Mがある。このようにして得られた
符号化LSPパラメータは符号化装置1のLSP出力部42から
伝送路を介して復号化装置2のLSP入力部50に送出され
ると共に符号化装置1においては第1のLSP復号化部35
に与えられる。
Next, the operation of the above configuration will be described. First, in the encoding device 1, the autocorrelation analysis means 32 of the LSP generation unit 31 performs an autocorrelation analysis of an input speech signal for each analysis frame, and calculates an autocorrelation coefficient r (k).
Here, k = 0 to M, and M is the analysis order. LSP
The analysis means 33 converts this r (k) into the LSP parameter ω (k)
Convert to Here, k = 1 to M. LSP encoder 3
4 is a value of 0 <ω (1) <ω (2) <... <Ω (M) <π shown in equation (3) using a quantization method such as scalar quantization or vector / scalar quantization. While confirming that the order of each parameter is satisfied
The LSP parameter is encoded, and an encoded LSP parameter represented by iω (k) is calculated and output. Incidentally, there are k = 1 to M here. The encoded LSP parameter obtained in this way is sent from the LSP output unit 42 of the encoding device 1 to the LSP input unit 50 of the decoding device 2 via a transmission line, and the encoding device 1 performs the first LSP decoding unit 35
Given to.

第1のLSP復号化部35は、LSP符号化部34からの符号化
LSPパラメータを復号化して復号化LSPパラメータω′
(k)に変換し、これを第1の次元間距離算出手段38及
び第1のLSP補正手段37に出力する。但し、ここでk=
1〜Mである。第1の次元間距離算出手段38は、次式に
基づいて、 d(k)=ω′(k+1)−ω′(k) ……(4) 隣接する次元の2つの復号化LSPパラメータ間の距離を
算出する。但し、k=1〜M−1である。第1の次元間
距離算出手段38はこのようにして得た距離d(k)を次
元毎に順次第1のLSP補正手段37に出力する。第1のLSP
補正手段37は距離d(k)があらかじめ与えられた閾値
Dを下回る場合に補正復号化LSPパラメータω′(k)
を ω′(k)={ω′(k)+ω′(k+1)}/2−D/2 ……(5) と補正し、補正復号化LSPパラメータω′(k+1)を ω′(k+1)={ω′(k)+ω′(k+1)}/2−D/2 ……(6) と補正することにより、2つの復号化LSPパラメータ間
の距離を閾値Dまで広げる。LSP逆フィルタ手段40は、
補正復号化LSPパラメータを用いて入力音声信号を逆フ
ィルタリングして音源情報を発生する。音源符号化手段
41はこの音源情報を符号化して符号化装置1の音源情報
出力部43から伝送路を介して復号化装置2の音源情報入
力部55に送出する。
The first LSP decoding unit 35 performs the encoding from the LSP encoding unit 34
Decode the LSP parameter and decode the LSP parameter ω '
(K), and outputs this to the first inter-dimensional distance calculation means 38 and the first LSP correction means 37. Where k =
1 to M. The first dimension distance calculating means 38 calculates d (k) = ω ′ (k + 1) −ω ′ (k) (4) based on the following equation: Calculate the distance. However, k = 1 to M-1. The first inter-dimensional distance calculating means 38 sequentially outputs the distance d (k) thus obtained to the first LSP correcting means 37 for each dimension. First LSP
When the distance d (k) is smaller than a predetermined threshold D, the correction means 37 corrects the decoded LSP parameter ω ′ (k).
Ω ′ (k) = {ω ′ (k) + ω ′ (k + 1)} / 2−D / 2 (5), and the corrected decoding LSP parameter ω ′ (k + 1) is corrected to ω ′ (k + 1) = {Ω ′ (k) + ω ′ (k + 1)} / 2−D / 2 (6) The distance between the two decoding LSP parameters is increased to a threshold value D. The LSP inverse filter means 40
The input speech signal is inversely filtered using the corrected decoding LSP parameter to generate sound source information. Excitation coding means
Reference numeral 41 encodes the excitation information and sends it from an excitation information output unit 43 of the encoding device 1 to an excitation information input unit 55 of the decoding device 2 via a transmission path.

復号化装置2において、第2のLSP復号化部51は、符
号化LSPパラメータを復号化して復号化LSPパラメータを
算出する。第2の次元間距離算出手段54と第2のLSP補
正手段53は、符号化装置1の第1の次元間距離算出手段
38及び第1のLSP補正手段37と同様の処理を実施して復
号化LSPパラメータの補正を行なう。第2のLSP補正部は
補正復号化LSPパラメータをLSP合成フィルタ58に出力す
る。音源復号化手段57は符号化装置1からの符号化音源
情報を復号化して得られた復号化音源情報をLSP合成フ
ィルタ58に出力する。LSP合成フィルタ58は、入力され
た補正復号化LSPパラメータと復号化音源情報を用いて
復号音声信号を生成し音声信号出力部59へ出力する。
In the decoding device 2, the second LSP decoding unit 51 decodes the encoded LSP parameter and calculates the decoded LSP parameter. The second inter-dimensional distance calculating means 54 and the second LSP correcting means 53 are the first inter-dimensional distance calculating means of the encoding device 1.
The same processing as that of the first and second LSP correction means 37 is performed to correct the decoding LSP parameter. The second LSP correction unit outputs the corrected decoding LSP parameter to the LSP synthesis filter 58. The excitation decoding means 57 outputs the decoded excitation information obtained by decoding the encoded excitation information from the encoding device 1 to the LSP synthesis filter 58. The LSP synthesis filter 58 generates a decoded audio signal using the input corrected decoding LSP parameter and the decoded excitation information, and outputs the decoded audio signal to the audio signal output unit 59.

なお、上記実施例では閾値をあらかじめ定めた固定値
とする場合を例示したが、次元k毎に用意した値を用い
たり、入力音声の実際の振幅の平均値に基づく可変の値
を用いてもよい。また、ラグ窓手段を併用することで極
のバンド幅の過小推定の影響を更に低減することも可能
である。
In the above embodiment, the case where the threshold is set to a predetermined fixed value is exemplified. However, a value prepared for each dimension k may be used, or a variable value based on the average value of the actual amplitude of the input voice may be used. Good. Also, by using the lag window means together, it is possible to further reduce the influence of the underestimation of the pole bandwidth.

また、上記実施例ではLSPパラメータの符号化、復号
化を行なう構成を例示したが、LSP以外のLSC分析に基づ
くスペクトルパラメータを用いる場合も、LPC分析時の
極のバンド幅の過小推定による影響、量子化誤差、伝送
誤りの影響を軽減する目的で、一旦LSPに変換してから
処理するような構成とすることができる。
Further, in the above embodiment, the configuration for encoding and decoding the LSP parameter is exemplified.However, even when using a spectrum parameter based on the LSC analysis other than the LSP, the influence of the underestimation of the pole bandwidth at the time of the LPC analysis, For the purpose of reducing the effects of quantization errors and transmission errors, it is possible to adopt a configuration in which the data is once converted to LSP and then processed.

[発明の効果] 以上のように、本発明によれば、伝送路を介して送受
信される音声信号に対して、符号化装置では符号化音源
情報に対して前記量子化誤差に起因する変動の防止を行
い、一方において復号化装置においてはLSPパラメータ
に対して量子化誤差及び伝送誤りの両者に起因する合成
音声振幅の変動を防止する補正を行い、量子化誤差と伝
送誤りの両者に対してそれぞれ変動防止の補正を符号化
装置と復号化装置とに分けて分担させたことにより、伝
送路に送り込まれるデータ量を増大させることなく、き
わめて効果的に前記誤差に対処することが可能となる。
[Effects of the Invention] As described above, according to the present invention, for an audio signal transmitted / received via a transmission path, the encoding device generates a variation in fluctuation due to the quantization error with respect to encoded excitation information. On the other hand, in the decoding device, on the other hand, the LSP parameter is corrected to prevent the fluctuation of the synthesized voice amplitude caused by both the quantization error and the transmission error, and the correction is performed on both the quantization error and the transmission error. Since the correction of the fluctuation prevention is separately shared between the encoding device and the decoding device, the error can be dealt with very effectively without increasing the amount of data sent to the transmission path. .

即ち、特許請求の範囲(1)に記載された本発明に係
る音声復号化装置によれば、復号化装置に設けられたLS
P補正部は、音源情報入力部に入力される符号化音源情
報を生成する際に用いられたLSPパラメータの補正と同
様に補正し、この補正LSPパラメータを復号音声信号発
生部に供給することによって、伝送される音声信号のデ
ータ量を増大させることなく量子化誤差及び伝送誤りに
対処することが可能となる。
That is, according to the speech decoding apparatus according to the present invention described in claim (1), the LS provided in the decoding apparatus
The P correction unit performs correction in the same manner as the correction of the LSP parameter used when generating the encoded excitation information input to the excitation information input unit, and supplies the corrected LSP parameter to the decoded speech signal generation unit. In addition, it is possible to deal with quantization errors and transmission errors without increasing the data amount of transmitted audio signals.

また、特許請求の範囲(3)に記載された本発明に係
る音声符号化・復号化装置によれば、符号化装置におけ
る第1のLSP補正部が復号化LSPパラメータを補正し、こ
の補正LSPパラメータを符号化音源情報発生部に供給す
るとともに、復号化装置に設けられた第2のLSP補正部
が、復号化LSPパラメータを第1のLSP補正部と同様に補
正し、この補正LSPパラメータを復号音声信号発生部に
供給することによって、量子化誤差と伝送誤りの両者に
対してそれぞれ変動防止の補正を符号化装置と復号化装
置とに分けて分担させ、伝送路に送り込まれるデータ量
を増大させることなく、前記誤差に対処することが可能
となる。
According to the speech encoding / decoding device according to the present invention described in claim (3), the first LSP correction unit in the encoding device corrects the decoding LSP parameter, and the corrected LSP The parameters are supplied to the encoded excitation information generation unit, and the second LSP correction unit provided in the decoding device corrects the decoded LSP parameters in the same manner as the first LSP correction unit, and outputs the corrected LSP parameters. By supplying the data to the decoded audio signal generation unit, the correction of fluctuation prevention for both the quantization error and the transmission error is separately shared between the encoding device and the decoding device, and the amount of data sent to the transmission path is reduced. It is possible to deal with the error without increasing it.

更に、特許請求の範囲(2)及び(4)に記載された
発明によれば、量子化誤差によってLSPの2つの次元間
の距離が、合成音振幅の増大を引き起こさない最小の限
界値、すなわち所定の閾値を下回るまでに近付きすぎた
場合に、その次元間の距離を選択的に広げることができ
るので、合成音の振幅がフレーム間で不自然に変動する
といった問題を解消することができる。
Furthermore, according to the inventions described in claims (2) and (4), the distance between the two dimensions of the LSP due to the quantization error is the minimum limit value that does not cause an increase in the synthesized sound amplitude, that is, If the distance is too close to fall below a predetermined threshold, the distance between the dimensions can be selectively increased, so that the problem that the amplitude of the synthesized sound fluctuates unnaturally between frames can be solved.

また、通信路で発生する伝送誤りで符号化LSP情報に
誤りが生じたため、復号された2つの次元間の距離が、
合成音振幅の増大を引き起こさない最小の限界値、すな
わち所定の閾値を下回るまでに近付きすぎた場合に、そ
の次元間の距離を選択的に広げることができるので、合
成音の振幅がフレーム間で不自然に変動するといった問
題を解消することができる。
In addition, since an error has occurred in the encoded LSP information due to a transmission error occurring in the communication channel, the distance between the two decoded dimensions is
When the minimum limit value that does not cause an increase in the synthesized sound amplitude, i.e., when approaching too far below a predetermined threshold, the distance between the dimensions can be selectively increased, so that the amplitude of the synthesized sound is increased between frames. The problem of unnatural fluctuation can be solved.

【図面の簡単な説明】[Brief description of the drawings]

第1図は本発明の一実施例に係る音声符号化・復号化装
置のブロック図、第2図は従来の音声符号化・復号化装
置のブロック図である。 1……符号化装置、2……復号化装置、30……音声信号
入力部、31……LSP生成部、32……自己相関分析手段、3
3……LSP分析手段、34……LSP符号化部、35……第1のL
SP復号化部、36……第1のLSP補正部、37……第1のLSP
補正手段、38……第1の次元間距離算出手段、39……符
号化音源情報発生部、40……LSP逆フィルタ手段、41…
…音源符号化手段、42……LSP出力部、43……音源情報
出力部、50……LSP入力部、51……第2のLSP復号化部、
52……第2のLSP補正部、53……第2のLSP補正手段、54
……第2の次元間距離算出手段、55……音源情報入力
部、56……復号音声信号発生部、57……音源復号化手
段、58……LSP合成フィルタ、59……音声信号出力部。
FIG. 1 is a block diagram of a speech encoding / decoding device according to an embodiment of the present invention, and FIG. 2 is a block diagram of a conventional speech encoding / decoding device. DESCRIPTION OF SYMBOLS 1 ... Encoding device, 2 ... Decoding device, 30 ... Audio signal input part, 31 ... LSP generation part, 32 ... Autocorrelation analysis means, 3
3 LSP analysis means, 34 LSP encoding section, 35 first L
SP decoding unit, 36 first LSP correction unit, 37 first LSP
Correcting means, 38: First dimension distance calculating means, 39: Encoded excitation information generating section, 40: LSP inverse filter means, 41:
... Exciter encoding means, 42 ... LSP output unit, 43 ... Exciter information output unit, 50 ... LSP input unit, 51 ... Second LSP decoding unit
52... Second LSP correction unit, 53... Second LSP correction unit, 54
... Second dimension distance calculating means 55 55 sound source information input section 56 decoded voice signal generating section 57 sound source decoding section 58 LSP synthesis filter 59 voice signal output section .

Claims (4)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】LSP入力部(50)、音源情報入力部(5
5)、LSP復号化部(51)、LSP補正部(52)、復号音声
信号発生部(56)、音声信号出力部(59)からなる音声
復号化装置であって、 LSP入力部(50)には、伝送路より符号化LSPパラメータ
が入力され、LSP復号化部(51)に供給され、 音源情報入力部(55)には、補正されたLSPパラメータ
を用いて音声信号より生成された符号化音源情報が伝送
路より入力され、復号音声信号発生部(56)に供給さ
れ、 LSP復号化部(51)は、符号化LSPパラメータを復号化
し、復号化LSPパラメータとしてLSP補正部(52)に供給
し、 LSP補正部(52)は、音源情報入力部(55)に入力され
る符号化音源情報を生成する際に用いられたLSPパラメ
ータの補正と同様に補正し、補正LSPパラメータとして
復号音声信号発生部(56)に供給し、 復号音声信号発生部(56)は、符号化音源情報を復号化
して復号化音源情報を得るとともに、この復号化音源情
報と補正LSPパラメータより復号音声信号を生成し、こ
の復号音声信号を復号音声信号出力部(59)に出力する 音声復号化装置。
An LSP input unit (50), a sound source information input unit (5)
5) An audio decoding device comprising an LSP decoding section (51), an LSP correction section (52), a decoded audio signal generation section (56), and an audio signal output section (59), and an LSP input section (50) , An encoded LSP parameter is input from a transmission path and supplied to an LSP decoding unit (51), and a sound source information input unit (55) receives a code generated from a speech signal using the corrected LSP parameter. The encoded sound source information is input from the transmission path and supplied to the decoded speech signal generation unit (56). The LSP decoding unit (51) decodes the encoded LSP parameter, and the LSP correction unit (52) as the decoded LSP parameter. The LSP correction unit (52) corrects the LSP parameter in the same way as the correction of the LSP parameter used when generating the encoded excitation information input to the excitation information input unit (55), and decodes it as a corrected LSP parameter. The decoded audio signal is supplied to the audio signal generator (56). To obtain decoded excitation information, generate a decoded audio signal from the decoded excitation information and the corrected LSP parameter, and output the decoded audio signal to a decoded audio signal output unit (59).
【請求項2】LSP補正部(52)は、復号化LSPパラメータ
の隣接する次元間距離を算出する次元間距離算出手段
(54)と、算出した次元間距離が予め定められた閾値を
下回る場合には、閾値に応じて復号化LSPパラメータを
補正し、補正LSPパラメータとして出力するLSP補正手段
(53)からなる 請求項1に記載の音声復号化装置。
2. An inter-dimensional distance calculating means (54) for calculating an inter-dimensional distance between adjacent decoding LSP parameters, wherein the inter-dimensional distance is smaller than a predetermined threshold value. The speech decoding device according to claim 1, further comprising an LSP correction unit (53) that corrects a decoding LSP parameter according to a threshold value and outputs the corrected LSP parameter as a corrected LSP parameter.
【請求項3】音声信号入力部(30)、LSP生成部(3
1)、LSP符号化部(34)、LSP出力部(42)、第1のLSP
復号化部(35)、第1のLSP補正部(36)、符号化音源
情報発生部(39)、音源情報出力部(43)からなる符号
化装置であって、 音声信号入力部(30)は外部から入力される音声信号を
LSP生成部(31)と符号化音源情報発生部(39)に供給
し、 LSP生成部(31)は音声信号からLSPパラメータを生成
し、LSP符号化部(34)に供給し、 LSP符号化部(34)はLSPパラメータを符号化し、符号化
LSPパラメータとして第1のLSP復号化部(35)に供給す
ると共に、LSP出力部(42)に出力し、 第1のLSP復号化部(35)は符号化LSPパラメータを復号
化し、復号化LSPパラメータとして第1のLSP補正部(3
6)に供給し、 第1のLSP補正部(36)は復号化LSPパラメータを補正
し、補正LSPパラメータとして符号化音源情報発生部(3
9)に供給し、 符号化音源情報発生部(39)は、補正LSPパラメータと
音声信号により音声情報を得るとともに、この音源情報
を符号化した符号化音源情報を音源情報出力部(43)に
出力する符号化装置(1)と、 LSP入力部(50)、音源情報入力部(55)、第2のLSP復
号化部(51)、第2のLSP補正部(52)、復号音声信号
発生部(56)、音声信号出力部(59)からなる復号化装
置(2)であって、 LSP入力部(50)は、伝送路より入力される符号化入力
パラメータを第2のLPS復号化部(51)に供給し、 第2のLSP復号化部(51)は、符号化LSPパラメータを復
号化し、復号化LSPパラメータとして第2のLSP補正部
(52)に供給し、 第2のLSP補正部(52)は、復号化LSPパラメータを第1
のLSP補正部(36)と同様に補正し、補正LSPパラメータ
として復号音声信号発生部(56)に供給し、 音源情報入力部(55)は、伝送路より入力される符号化
音源情報を復号音声信号発生部(56)に供給し、 復号音声信号発生部(56)は、符号化音源情報を復号化
して復号化音源情報を得るとともに、この復号化音源情
報と補正LSPパラメータより復号音声信号を生成し、こ
の復号音声信号を復号音声信号出力部(59)に出力する
復号化装置(2)とからなる 音声符号化・復号化装置。
3. An audio signal input unit (30), an LSP generation unit (3)
1), LSP encoding unit (34), LSP output unit (42), first LSP
An encoding device comprising a decoding unit (35), a first LSP correction unit (36), an encoded excitation information generation unit (39), and an excitation information output unit (43), wherein an audio signal input unit (30) Is used to input audio signals
The LSP generation unit (31) and the coded excitation information generation unit (39) are supplied. The LSP generation unit (31) generates LSP parameters from the audio signal and supplies the generated LSP parameters to the LSP encoding unit (34) to perform LSP coding. The unit (34) encodes and encodes the LSP parameters
It is supplied to the first LSP decoding unit (35) as an LSP parameter and is output to the LSP output unit (42). The first LSP decoding unit (35) decodes the coded LSP parameter and outputs the decoded LSP. The first LSP correction unit (3
6), the first LSP correction unit (36) corrects the decoded LSP parameter, and outputs the corrected LSP parameter as a coded excitation information generation unit (3
9), the coded excitation information generation unit (39) obtains audio information based on the corrected LSP parameter and the audio signal, and outputs coded excitation information obtained by encoding the excitation information to the excitation information output unit (43). Encoding device (1) to be output, LSP input unit (50), excitation information input unit (55), second LSP decoding unit (51), second LSP correction unit (52), decoded audio signal generation A decoding device (2) comprising a unit (56) and an audio signal output unit (59), wherein an LSP input unit (50) converts a coded input parameter input from a transmission path into a second LPS decoding unit. (51), the second LSP decoding unit (51) decodes the encoded LSP parameter, and supplies the decoded LSP parameter to the second LSP correction unit (52) as a decoded LSP parameter. The unit (52) sets the decoding LSP parameter to the first
The LSP correction unit (36) corrects the signal and supplies it as a corrected LSP parameter to the decoded speech signal generation unit (56). The excitation information input unit (55) decodes the encoded excitation information input from the transmission path. The decoded audio signal is supplied to an audio signal generator (56). The decoded audio signal generator (56) decodes the encoded excitation information to obtain decoded excitation information, and decodes the decoded audio signal from the decoded excitation information and the corrected LSP parameter. And a decoding device (2) for outputting the decoded voice signal to a decoded voice signal output section (59).
【請求項4】第1のLSP補正部(36)は、復号化LSPパラ
メータの隣接する次元間距離を算出する第1の次元間距
離算出手段(38)と、算出した次元間距離が予め定めら
れた閾値を下回る場合には、閾値に応じて復号化LSPパ
ラメータを補正し、補正復号化LSPパラメータとして出
力する第1のLSP補正手段(37)からなり、 第2のLSP補正部(52)は、復号化LSPパラメータの隣接
する次元間距離を算出する第2の次元間距離算出手段
(54)と、算出した次元間距離が予め定められた閾値を
下回る場合には、閾値に応じて復号化LSPパラメータを
補正し、補正復号化LSPパラメータとして出力する第2
のLSP補正手段(54)からなる 請求項3に記載の音声符号化・復号化装置。
4. A first LSP correction unit (36) comprising: a first inter-dimensional distance calculating means (38) for calculating a distance between adjacent dimensions of a decoded LSP parameter; If the value is lower than the threshold value, the first LSP correction unit (37) corrects the decoding LSP parameter according to the threshold value and outputs the corrected LSP parameter as a corrected decoding LSP parameter. Means for calculating a distance between adjacent dimensions of the decoding LSP parameter (54), and decoding when the calculated distance between dimensions is smaller than a predetermined threshold, according to the threshold. Second to correct the decoded LSP parameter and output it as a corrected decoded LSP parameter
The speech encoding / decoding device according to claim 3, comprising an LSP correction unit (54).
JP2108484A 1990-04-23 1990-04-23 Audio decoding device and audio encoding / decoding device Expired - Lifetime JP2659605B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2108484A JP2659605B2 (en) 1990-04-23 1990-04-23 Audio decoding device and audio encoding / decoding device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2108484A JP2659605B2 (en) 1990-04-23 1990-04-23 Audio decoding device and audio encoding / decoding device

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP8278422A Division JP2905155B2 (en) 1996-10-21 1996-10-21 Audio coding device

Publications (2)

Publication Number Publication Date
JPH045700A JPH045700A (en) 1992-01-09
JP2659605B2 true JP2659605B2 (en) 1997-09-30

Family

ID=14485930

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2108484A Expired - Lifetime JP2659605B2 (en) 1990-04-23 1990-04-23 Audio decoding device and audio encoding / decoding device

Country Status (1)

Country Link
JP (1) JP2659605B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100446594B1 (en) * 1997-04-15 2005-06-02 삼성전자주식회사 Apparatus and method for encoding / decoding voice line spectrum frequency
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
TR201900472T4 (en) * 2014-04-24 2019-02-21 Nippon Telegraph & Telephone Frequency domain parameter array generation method, coding method, decoding method, frequency domain parameter array forming apparatus, coding apparatus, decoding apparatus, program and recording medium.

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60186900A (en) * 1984-03-06 1985-09-24 富士通株式会社 Stable discriminative compensation system for lsp voice synthesization
JPS6225800A (en) * 1985-07-26 1987-02-03 株式会社日立製作所 Voice analysis/synthesization system

Also Published As

Publication number Publication date
JPH045700A (en) 1992-01-09

Similar Documents

Publication Publication Date Title
KR100814673B1 (en) audio coding
JP3522012B2 (en) Code Excited Linear Prediction Encoder
US7016831B2 (en) Voice code conversion apparatus
KR101023460B1 (en) Signal processing method, processing apparatus and voice decoder
JPH0863196A (en) Post filter
KR100813193B1 (en) Method and device for quantizing a data signal
JP3364825B2 (en) Audio encoding device and audio encoding / decoding device
JPH06202696A (en) Speech decoding device
JP4558205B2 (en) Speech coder parameter quantization method
EP1096476B1 (en) Speech signal decoding
US6424942B1 (en) Methods and arrangements in a telecommunications system
KR100848370B1 (en) Audio Encoding
JPH07129195A (en) Sound decoding device
JP2659605B2 (en) Audio decoding device and audio encoding / decoding device
JP2905155B2 (en) Audio coding device
JP3219467B2 (en) Audio decoding method
JP3095340B2 (en) Audio decoding device
EP1199710A1 (en) Device for encoding/decoding voice and for voiceless encoding, decoding method, and recorded medium on which program is recorded
JP3303580B2 (en) Audio coding device
JP3050978B2 (en) Audio coding method
WO2004090869A1 (en) Code conversion method and device
JPH0990997A (en) Speech coding device, speech decoding device, speech coding/decoding method and composite digital filter
JP2000242298A (en) Lsp correcting device, voice encoding device, and voice decoding device
JP3130673B2 (en) Audio coding device
JP2001265390A (en) Voice coding and decoding device and method including silent voice coding operating with plural rates

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080606

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080606

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090606

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100606

Year of fee payment: 13

EXPY Cancellation because of completion of term