JP3158434B2 - Digital audio decoder with post-filter having reduced spectral distortion - Google Patents

Digital audio decoder with post-filter having reduced spectral distortion

Info

Publication number
JP3158434B2
JP3158434B2 JP51307390A JP51307390A JP3158434B2 JP 3158434 B2 JP3158434 B2 JP 3158434B2 JP 51307390 A JP51307390 A JP 51307390A JP 51307390 A JP51307390 A JP 51307390A JP 3158434 B2 JP3158434 B2 JP 3158434B2
Authority
JP
Japan
Prior art keywords
filter
component
signal
post
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP51307390A
Other languages
Japanese (ja)
Other versions
JPH05500573A (en
Inventor
アラン ジャーソン・イラ
アントニ ジャシウク・マーク
Original Assignee
モトローラ・インコーポレーテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by モトローラ・インコーポレーテッド filed Critical モトローラ・インコーポレーテッド
Publication of JPH05500573A publication Critical patent/JPH05500573A/en
Application granted granted Critical
Publication of JP3158434B2 publication Critical patent/JP3158434B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Filters That Use Time-Delay Elements (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

An adaptive spectral postfilter (108) in a synthesized speech platform has a denominator characteristic that corresponds to a preceding LPC filter stage (106) and a numerator characteristic that is developed as a function of the denominator characteristic through application of spectral smoothing techniques. This allows the numerator to track the denominator without the introduction of spectral distortion that would otherwise affect the processing in an adverse way.

Description

【発明の詳細な説明】 技術分野 この発明は一般的には音声コーダに関し、かつより特
定的には音声品質を改善するためにポストフィルタを使
用するデジタル音声コーダに関する。
Description: TECHNICAL FIELD The present invention relates generally to audio coders, and more particularly to digital audio coders that use post filters to improve audio quality.

発明の背景 音声コーダおよびデコーダが技術上知られている。い
くつかの音声コーダはアナログ音声サンプルをデジタル
化された表現に変換し、かつその後リニア予測符号化を
用いることによりスペクトル音声情報を表わす。他の音
声コーダは通常のリニア予測符号化(linear predicti
ve coding:LPC)技術に対し元の音声信号に関係する励
起信号(excitation signal)を提供することにより改
善を行なう。
BACKGROUND OF THE INVENTION Speech coders and decoders are known in the art. Some audio coders convert analog audio samples into a digitized representation and then represent the spectral audio information by using linear predictive coding. Other speech coders use conventional linear predictive coding (linear predicti
An improvement is made to ve coding (LPC) technology by providing an excitation signal related to the original speech signal.

米国特許第4,817,157号は改善されたベクトル励起源
を有するデジタル音声コーダおよびデコーダを開示して
おり、これはコードブック励起ベクトルのコードブック
が利用可能な情報に最も適合するコードブック励起信号
を選択するためにアクセスされ、かつオリジナルを忠実
に表現するLPCフィルタから合成された音声信号を与え
るために使用される。
U.S. Pat.No. 4,817,157 discloses a digital speech coder and decoder having an improved vector excitation source, which selects a codebook excitation signal whose codebook of codebook excitation vectors best fits the available information. Used to provide an audio signal that has been accessed and synthesized from an LPC filter that faithfully represents the original.

いったん合成された音声信号が出力されると、種々の
ポストLPCフィルタがしばしば使用されてさらに該信号
を調整する。1つのそのようなフィルタは適応スペクト
ルポストフィルタであり(これは典型的には合成音声の
知覚的な品質を増大することを意図している)、そして
他のものはポストエンファシス・フィルタである(これ
は合成音声結果に対するブライトネス(brightness)に
寄与する)。
Once the synthesized audio signal is output, various post-LPC filters are often used to further condition the signal. One such filter is an adaptive spectral postfilter (which is typically intended to increase the perceived quality of the synthesized speech), and the other is a post-emphasis filter ( This contributes to the brightness of the synthesized speech result).

適応スペクトルポストフィルタは典型的には次の一般
式で表わされる。
An adaptive spectral postfilter is typically represented by the following general formula:

(z)={1−A(z/η)}/{1−A(z/ν)} この場合、0≦η≦ν<1であり、かつ 1/{1−A(z)}は関連するLPCフィルタを表わす。 (Z) = {1-A (z / η)} / {1-A (z / ν)} In this case, 0 ≦ η ≦ ν <1 and 1 / {1-A (z)} is Represents the associated LPC filter.

上のポストフィルタ表現における分母項は合成信号ス
ペクトラムにおけるホルマントを強調し、一方でスペク
トルの谷を減衰する。(2つの極端な場合には、ν=0
のセッティングはオールパスフィルタとなり、一方ν=
1のセッティングは関連するLPCフィルタと同じ分母項
を生ずる結果となる。)分子項は分母によって導入され
る一般的なスペクトル形状を打ち消すよう作用する。従
来技術の用途においては、νはしばしばおよそ0.8にセ
ットされ、かつηはおよそ0.5にセットされる。
The denominator term in the above postfilter representation enhances the formants in the composite signal spectrum, while attenuating spectral valleys. (In the two extreme cases, ν = 0
Is an all-pass filter, while ν =
A setting of 1 results in the same denominator term as the associated LPC filter. 2.) The numerator term acts to counteract the general spectral shape introduced by the denominator. In prior art applications, ν is often set to about 0.8 and η is set to about 0.5.

実際には、分子の多項式は分母のスペクトル形状を追
跡する上でほんの部分的にしか成功せず(実際には、フ
ィルタのスペクトル特性は時間とともに傾斜する)、そ
してその食い違いは典型的にはポストフィルタによりろ
波された音声のブライトネスの時間的に変化する変調と
して表われる。
In practice, the numerator polynomial is only partially successful in tracking the spectral shape of the denominator (actually, the spectral characteristics of the filter will slope over time), and the discrepancy is typically Appears as a time-varying modulation of the brightness of the sound filtered by the filter.

従って、音声のブライトネスに対する有害な影響を最
小にしながら、同時に合成音声の知覚的な品質を向上す
る合成音声のポストフィルタリングの方法の必要性が存
在する。同様に音声のブライトネスそれ自体もよりよく
制御できることが好ましい。
Accordingly, a need exists for a method of post-filtering synthesized speech that minimizes the detrimental effect on speech brightness while at the same time improving the perceived quality of the synthesized speech. Similarly, it is preferred that the brightness of the sound itself be better controllable.

発明の概要 これらの必要性および他のものは実質的にここに開示
されたポストフィルタの装置により満たされる。この発
明によれば、あるポストフィルタ(postfilter)が提供
でき、該ポストフィルタは第1および第2の成分または
構成要素(component)によって特徴付けられる。第1
の構成要素は1組の係数を含む。これらの係数は代わり
のドメインの組のパラメータに変換され、かつ次に修正
された組のパラメータを与えるために操作される。これ
らは次の前記第2の構成要素を特徴付ける1組の係数を
提供するために使用される。
SUMMARY OF THE INVENTION These needs and others are substantially satisfied by the post-filter apparatus disclosed herein. According to the present invention, a postfilter can be provided, wherein the postfilter is characterized by first and second components or components. First
Include a set of coefficients. These coefficients are converted to an alternate set of domain parameters and then manipulated to provide a modified set of parameters. These are used to provide a set of coefficients that characterize the second component:

1つの実施例においては、前記第1の構成要素を表わ
すZ変換(フィルタ係数が自己相関ドメインに変換され
る。帯域幅拡張機能を用いるスペクトル平滑技術が次に
自己相関シーケンスに適用され、かつ第2の構成要素の
多項式の係数がレビンソン(Levinson)の帰納法を用い
て修正された自己相関シーケンスから計算される。上に
述べたフィルタ特性において第1の構成要素が次に分母
として使用され、かつ第2の構成要素が分子として使用
される。
In one embodiment, a Z-transform representing the first component (the filter coefficients are transformed into the autocorrelation domain. A spectral smoothing technique using a bandwidth extension function is then applied to the autocorrelation sequence, and The coefficients of the two-component polynomial are calculated from the modified autocorrelation sequence using Levinson's induction.In the filter characteristics described above, the first component is then used as the denominator; And the second component is used as a molecule.

このプロセスにより、分子の多項式はA(z/ν)多項
式のスペクトル的に平滑化されたものによって置き代え
られる。フォーマットの帯域幅拡張は平滑化されたスペ
クトルのエンベロープを変えない。従って、A(z/ν)
多項式のスペクトル的に平滑化された帯域幅が拡張され
たものは実効的に時間的に変化するスペクトルの傾斜を
最小化し、かつ分子が分母の概略的なスペクトル形状を
適応的に追跡しかつそれを打ち消すことができるように
する。
By this process, the numerator polynomial is replaced by a spectrally smoothed version of the A (z / ν) polynomial. Format bandwidth extension does not change the envelope of the smoothed spectrum. Therefore, A (z / ν)
An extended spectrally smoothed bandwidth of the polynomial effectively minimizes the time-varying spectral slope, and the numerator adaptively tracks the general spectral shape of the denominator and To be able to negate.

他の実施例においては、付加的なポストエンファシス
フィルタが使用されポストフィルタがかけられた音声の
ブライトネスにより一層の制御を与えることができるよ
うにする。このフィルタは次の式で表わされる一次フィ
ルタである。
In another embodiment, an additional post-emphasis filter is used to provide more control over the brightness of the post-filtered audio. This filter is a first-order filter represented by the following equation.

(z)=1−uz-1 なお、この場合典型的には、0.2≦u≦0.5である。(Z) = 1-uz -1 In this case, typically, 0.2 ≦ u ≦ 0.5.

図面の簡単な説明 第1図は、本発明に従って構成された無線機のブロッ
ク図である。
BRIEF DESCRIPTION OF THE DRAWINGS FIG. 1 is a block diagram of a wireless device configured according to the present invention.

第2図は、本発明に従った適応スペクトルポストフィ
ルタの特徴を表すフローチャートである。
FIG. 2 is a flowchart illustrating the features of the adaptive spectral postfilter according to the present invention.

発明を実施するための最良の形態 1989年3月28日に、イラ ジャーソン(Ira Gerso
n)に発行された、「改良されたベクトル励起源を有す
るデジタル音声コーダ」と題する、米国特許第4,817,15
7号はデジタル音声コーダおよびデコーダにつきかなり
詳細に述べている。この参照文献に詳細に述べられてい
るように、この発明はモトローラ社のDSP56000型ファミ
リ装置のような適切なデジタル信号プロセッサを使用す
る音声コーダ(またはデコーダ)において実施できる。
BEST MODE FOR CARRYING OUT THE INVENTION On March 28, 1989, Ira Gerso
US Patent No. 4,817,15 entitled "Digital Speech Coder with Improved Vector Excitation Source"
No. 7 describes the digital audio coder and decoder in considerable detail. As described in detail in this reference, the present invention can be implemented in an audio coder (or decoder) using a suitable digital signal processor, such as a Motorola DSP56000 family device.

第1図において、本発明を実施する無線機(100)
は、音声符号化無線周波(RF)信号(101)を受信する
ためのアンテナ(102)を含む。RFユニット(103)は受
信した信号を処理して音声符号化情報を復元する。この
情報は種々の後続の処理のための制御パラメータを出力
するパラメータデコーダ(105)に提供される。上に述
べた励起源(excitation source)(104)はそれに与
えられたパラメータを利用して励起信号を生成する。励
起源(104)から得られた励起信号はLPCフィルタ(10
6)に提供され、該LPCフィルタ(106)は符号化情報に
従って合成された音声信号を生成する。合成された音声
信号は次にピッチポストフィルタ(107)によりろ波さ
れかつスペクトルポストフィルタ(108)によりろ波さ
れて再構成または再現された音声の品質を向上させる。
もし必要であれば、ポストエンファシスフィルタ(10
9)を含むことができさらに音声信号品質を向上させ
る。(スペクトルポストフィルタ(108)およびポスト
エンファシスフィルタ(109)に関するこれ以上の詳細
については後に説明する。) 音声信号は次にオーディオ処理ユニット(111)にお
いて処理されかつオーディオ変換器(112)により可聴
的にされる。励起源(104)、LPCフィルタ(106)、ピ
ッチポストフィルタ(107)、適応スペクトルポストフ
ィルタ(108)、そしてポストエンファシスフィルタ(1
09)はすべてDSP(113)の適切なプログラミングによっ
て提供できる。
In FIG. 1, a wireless device (100) for implementing the present invention
Includes an antenna (102) for receiving a speech coded radio frequency (RF) signal (101). The RF unit (103) processes the received signal to restore the audio coded information. This information is provided to a parameter decoder (105) that outputs control parameters for various subsequent processing. The above mentioned excitation source (104) utilizes the parameters given to it to generate an excitation signal. The excitation signal obtained from the excitation source (104) is
6), the LPC filter (106) generates a synthesized speech signal according to the encoding information. The synthesized speech signal is then filtered by a pitch post-filter (107) and filtered by a spectral post-filter (108) to improve the quality of the reconstructed or reproduced speech.
If necessary, use a post-emphasis filter (10
9) can further improve the audio signal quality. (More details regarding the spectral post-filter (108) and the post-emphasis filter (109) will be described later.) The audio signal is then processed in an audio processing unit (111) and is audible by an audio converter (112). To be. Excitation source (104), LPC filter (106), pitch postfilter (107), adaptive spectral postfilter (108), and post-emphasis filter (1
09) can all be provided by appropriate programming of the DSP (113).

この発明によれば、適応スペクトルポストフィルタ
(108)は第1の構成要素(LPCフィルタ(106)のフィ
ルタ特性に関係する分母)および第2の構成要素(前記
分母の概略的なスペクトル形状を適応的に追跡しそれに
よりそれを打ち消す分子)により特徴付けられる。その
ようなフィルタの一般的な形式は、音響、音声、および
信号処理に関する国際会議紀要の1987年4月版の、ペー
ジ2185−2188に見られる、chenおよびGershoによる、
「適応ポストフィルタリングを備えた4800bpsの実時間
ベクトルAPC音声コーディング)と題する論文に述べら
れている。
According to the present invention, the adaptive spectral post-filter (108) adapts the first component (the denominator related to the filter characteristics of the LPC filter (106)) and the second component (the approximate spectral shape of the denominator). Molecules that track and thereby counteract it). The general form of such a filter is described by chen and Gersho, found in the April 1987 edition of the Bulletin of the International Conference on Sound, Speech, and Signal Processing, pages 2185-2188.
"4800bps real-time vector APC speech coding with adaptive post-filtering).

この発明によれば、前記分子は分母の多項式にスペク
トル平滑技術を適用することにより出力される。そのよ
うな技術は音響、音声、および信号処理に関するIEEE紀
要の1978年12月版に見られる、トークラ、イタクラ、お
よびハシモトによる、「PARCOR音声分析−合成における
スペクトル平滑技術」と題する論文に述べられている。
According to the invention, the numerator is output by applying a spectral smoothing technique to the denominator polynomial. Such a technique is described in a paper by Tokla, Itakura and Hashimoto entitled "PARCOR Speech Analysis-Spectral Smoothing Techniques in Synthesis", found in the December 1978 edition of the IEEE Bulletin of Sound, Speech, and Signal Processing. ing.

1つの実施例においては、分母を表わすZ変換係数は
自己相関ドメインに変換される。(そのような変換の例
はMarkel,J.D.Gray,A.H.,Jr、音声のリニア予測(Sprin
ger−Verlag,Berlin,Heidelberg,New York,1976)に見
ることができる。)スペクトル平滑技術の帯域幅拡張機
能が次に自己相関シーケンスに適用され、分子の多項式
の係数はレビンソン帰納法によって前記修正された自己
相関シーケンスから計算される。1つの実施例において
は、自己相関係数は以下のファクタによって乗算され結
果的に分子係数を提供する。
In one embodiment, the Z transform coefficients representing the denominator are transformed into the autocorrelation domain. (Examples of such transformations are Markel, JDGray, AH, Jr, linear prediction of speech (Sprin
ger-Verlag, Berlin, Heidelberg, New York, 1976). 2.) The bandwidth extension function of the spectral smoothing technique is then applied to the autocorrelation sequence and the numerator polynomial coefficients are calculated from the modified autocorrelation sequence by Levinson induction. In one embodiment, the autocorrelation coefficients are multiplied by the following factors, resulting in numerator coefficients.

表 1 自己相関の遅れ スペクトル平滑ファクタ 0 1.0000000 1 0.9230769 2 0.7252747 3 0.4835164 4 0.2719780 5 0.1279896 6 4.9773753E−02 7 1.5718028E−02 8 3.9294070E−03 9 7.4847753E−04 10 1.0206513E−04 分母および分子は次に適応スペクトルポストフィルタ
(108)を特徴付けるために使用される。
Table 1 Autocorrelation delay spectrum smoothing factor 0 1.0000000 1 0.9230769 2 0.7252747 3 0.4835164 4 0.2719780 5 0.1279896 6 4.9773753E-02 7 1.5718028E-02 8 3.9294070E-03 9 7.4847753E-04 10 1.0206513E-04 The denominator and numerator are It is then used to characterize the adaptive spectral postfilter (108).

勿論、LPCフィルタ情報を直接使用しかつ同様のプロ
セスによってそこから分子項を出力することも可能であ
り、これはLPCフィルタ情報が上に述べた分母項を出力
するのに使用されるからである。
Of course, it is also possible to use the LPC filter information directly and output the numerator terms therefrom by a similar process, since the LPC filter information is used to output the denominator terms mentioned above. .

この処理により、分子多項式が分母多項式のスペクト
ル的に平滑化されたものにより提供される。分母多項式
のスペクトル的に平滑化された帯域幅拡張版は実効的に
時間的に変化するスペクトルの傾きを最小にしかつ分子
が適応的に分母の概略的なスペクトル形状を追跡してそ
れを打ち消すことを可能にする。リスニング試験に基づ
き、約1200Hzの帯域幅拡張ファクタ(これは分母に対し
て行なわれる平滑の程度を特定する)が使用された。
With this processing, the numerator polynomial is provided by the spectrally smoothed version of the denominator polynomial. A spectrally smoothed bandwidth extension of the denominator polynomial effectively minimizes the time-varying spectral slope and the numerator adaptively tracks and cancels the approximate spectral shape of the denominator Enable. Based on listening tests, a bandwidth extension factor of about 1200 Hz, which specifies the degree of smoothing performed on the denominator, was used.

第2図のフローチャートは、上記の適応スペクトルポ
ストフィルタの特徴の理解に役立つ。前述したように、
適応スペクトルポストフィルタは、第1の構成要素すな
わち分母と、第2の構成要素すなわち分子とによって特
徴づけられる。第1の構成要素は、工程202に示すよう
に、以下の式で表現できる。
The flowchart of FIG. 2 helps to understand the characteristics of the above-mentioned adaptive spectral post-filter. As previously mentioned,
The adaptive spectral postfilter is characterized by a first component or denominator and a second component or numerator. The first component can be represented by the following equation, as shown in step 202.

1−A(z/ν) 続く工程203において、第1の構成要素を表すZ変換
係数を自己相関ドメインに変換する。工程204におい
て、スペクトル平滑帯域幅拡張を自己相関順列に適用す
る。続く工程205において、工程204で変形された自己相
関順列から、レビンソン帰納法を使用して分子(第2の
構成要素)多項係数を計算する。この分子すなわち第2
の構成要素は、以下の式で表現できる。
1-A (z / ν) In the following step 203, the Z-transform coefficient representing the first component is transformed into the autocorrelation domain. In step 204, a spectral smoothing bandwidth extension is applied to the autocorrelation permutation. In the subsequent step 205, a numerator (second component) polynomial coefficient is calculated from the autocorrelation permutated in the step 204 using Levinson induction. This molecule, the second
Can be expressed by the following equation.

1−B(z) 最後の工程206において、第1および第2の構成要素
(分母および分子)を用いて、適応スペクトルポストフ
ィルターを特徴づける(以下の式で表現できる)。
1-B (z) In a final step 206, the adaptive spectral postfilter is characterized using the first and second components (denominator and numerator) (which can be expressed by the following equation).

{1−B(z)}/{1−A(z/ν)} ポストエンファシスフィルタ(109)はポストフィル
タによりろ波された音声のブライトネスに対しより一層
の制御を可能にするため提供される。該フィルタは次の
形式の一次のフィルタである。
{1-B (z)} / {1-A (z / ν)} A post-emphasis filter (109) is provided to allow more control over the brightness of the audio filtered by the post-filter. . The filter is a primary filter of the form:

(z)=1−uz-1 この場合、典型的には、0.2≦u≦0.5である。(Z) = 1-uz -1 In this case, typically 0.2 ≦ u ≦ 0.5.

フロントページの続き (56)参考文献 特開 昭64−13200(JP,A) 特公 昭58−51280(JP,B2) 特公 昭59−41597(JP,B2) 特公 昭59−24439(JP,B2) 欧州特許570362(EP,B1) 米国特許4301329(US,A) Proceedings of 1987 IEEE Internationa l Conference on Ac oustics,Speech and Signal Processin g,Vol.4,Juin−Hwey Chen et al,”Real−T ime Vector APC Spe ech Coding at 4800 b ps with Adaptive P ostifiltering”,p. 2185−2188,April 1987 Proceedings of 1988 IEEE Internationa l Conference on Ac oustics,Speech and Signal Processin g,Vol.1,D.J Zarkia dis et al,”A 16KB/S APC System with A daptive Postfilter and Evaluation of its Perfomance”, p.631−634 Advances in Speec h Coding,IEEE Work shop on Speech Cod ing for Telecommni cations 1991,J.Gerso n,”Vector Sum Exci ted Linear Predict ion”,p.69−79,Vancove r Canada (58)調査した分野(Int.Cl.7,DB名) G10L 11/00 - 13/08 G10L 19/00 - 21/06 IEEE/IEE Electroni c Library Online JICSTファイル(JOIS)Continuation of the front page (56) References JP-A-64-13200 (JP, A) JP-B-58-51280 (JP, B2) JP-B-59-41597 (JP, B2) JP-B-59-24439 (JP, A) , B2) European Patent 570362 (EP, B1) US Patent 4,301,329 (US, A) Proceedings of 1987 IEEE International Conference on Acoustics, Speech and Signal Processing, Vol. 4, Juin-Hway Chen et al, "Real-Time Vector APC Speech Coding at 4800 bps with Adaptive Pose Filtering", p. Signal Processing, Vol. 1, D. J Zarkia dis et al, "A 16KB / S APC System with A Adaptive Postfilter and Evaluation of Performances Performance", p. 631-634 Advances in Speech Coding, IEEE Work shop on Speech Coding for Telecommunications 1991, J. Am. Gerson, "Vector Sum Excited Linear Prediction", p. 69-79, Vancover Canada (58) Fields investigated (Int. Cl. 7 , DB name) G10L 11/00-13/08 G10L 19/00-21/06 IEEE / IEEE Electronic Library Online JICST file (JOIS )

Claims (7)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】合成音声信号を生成する方法であって: A)励起信号をLPCフィルタに提供する段階; B)前記LPCフィルタから、合成音声信号を提供する段
階; C)第1の構成要素および第2の構成要素を必要とする
音声合成ポストフィルタを提供する段階; D)第1の組の係数を含む前記第1の構成要素を提供す
る段階; E)少なくともいくつかの前記第1の組の係数を自己相
関ドメインの組のパラメータに変換する段階; F)前記自己相関ドメインの組のパラメータにスペクト
ル平滑演算を行って修正された第1の組の係数を提供す
る段階; G)前記修正された第1の組の係数を用いて、前記音声
合成ポストフィルタにより使用するための前記第2の構
成要素を提供する段階; H)前記第1の構成要素および前記第2の構成要素を使
用して音声合成ポストフィルタにおいて合成音声信号を
濾波し、濾波された合成音声信号を提供する段階;およ
び I)前記濾波された合成音声信号を可聴にする段階; を備えたことを特徴とする方法。
1. A method for generating a synthesized speech signal, comprising: A) providing an excitation signal to an LPC filter; B) providing a synthesized speech signal from the LPC filter; C) a first component. Providing a speech synthesis postfilter requiring a second component and a second component; D) providing the first component comprising a first set of coefficients; E) at least some of the first components. Converting the set of coefficients to autocorrelation domain set parameters; F) performing a spectral smoothing operation on the autocorrelation domain set parameters to provide a modified first set of coefficients; Using the modified first set of coefficients to provide the second component for use by the speech synthesis postfilter; H) providing the first component and the second component; use Wherein further comprising a; step of audible a and I) said filtered synthesized speech signal; filters the synthesized speech signal in the speech synthesis postfilter stage provides a filtered synthesized speech signal Te.
【請求項2】請求項1に記載の合成音声信号を生成する
方法であって、さらに: J)符号化音声情報を含むRF信号を受信する段階; K)前記符号化音声情報から励起信号を復元する段階;
および L)該励起信号をLPCフィルタに提供する段階; を備え、第1の構成要素が前記音声合成ポストフィルタ
により使用されることを特徴とするもの。
2. The method for generating a synthesized speech signal according to claim 1, further comprising: J) receiving an RF signal including encoded speech information; K) extracting an excitation signal from the encoded speech information. Restoring;
And L) providing the excitation signal to an LPC filter, wherein a first component is used by the speech synthesis post-filter.
【請求項3】前記LPCフィルタは少なくとも部分的に次
の式、 1/{1−A(z)} により定義される、請求項1または2に記載の方法。
3. The method according to claim 1, wherein the LPC filter is defined at least in part by the following equation: 1 / {1-A (z)}.
【請求項4】前記音声合成ポストフィルタの第1の構成
要素はZ変換表記法により次の式、 1/A(z/ν) で表される、請求項1または2に記載の方法。
4. The method according to claim 1, wherein the first component of the speech synthesis post-filter is expressed by the following formula in Z-transform notation: 1 / A (z / ν).
【請求項5】さらに、 M)前記合成音声信号をZ変換表記法で、 H(z)=1−uz-1 ただし0.2≦u≦0.5、で実質的に定義されるポストエン
ファシスフィルタによって濾波する段階; を含む、請求項1または2に記載の方法。
5. In addition, M) the synthesized speech signal in Z transform notation, is filtered by H (z) = 1-uz -1 However 0.2 ≦ u ≦ 0.5 in the post emphasis filter substantially defined, 3. The method according to claim 1 or 2, comprising the step of:
【請求項6】前記演算を行う段階は乗算手段を含む請求
項1または2に記載の方法。
6. The method according to claim 1, wherein the step of performing an operation includes a multiplication means.
【請求項7】請求項1に記載の方法であって: 前記音声合成ポストフィルタの第2構成要素は 1−B(z)の形式であり、 前記音声合成ポストフィルタは (1−B(z))/(1−A(z/ν))の形式である、 ことを特徴とする方法。7. The method of claim 1, wherein: the second component of the speech synthesis postfilter is of the form 1-B (z); and the speech synthesis postfilter is (1-B (z )) / (1-A (z / ν)).
JP51307390A 1989-10-17 1990-09-17 Digital audio decoder with post-filter having reduced spectral distortion Expired - Lifetime JP3158434B2 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US42292689A 1989-10-17 1989-10-17
US422,926 1989-10-17

Publications (2)

Publication Number Publication Date
JPH05500573A JPH05500573A (en) 1993-02-04
JP3158434B2 true JP3158434B2 (en) 2001-04-23

Family

ID=23676980

Family Applications (1)

Application Number Title Priority Date Filing Date
JP51307390A Expired - Lifetime JP3158434B2 (en) 1989-10-17 1990-09-17 Digital audio decoder with post-filter having reduced spectral distortion

Country Status (8)

Country Link
EP (1) EP0570362B1 (en)
JP (1) JP3158434B2 (en)
CN (1) CN1078371C (en)
AT (1) ATE177867T1 (en)
AU (1) AU635342B2 (en)
DE (1) DE69033011T2 (en)
ES (1) ES2131498T3 (en)
WO (1) WO1991006093A1 (en)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2729246A1 (en) * 1995-01-06 1996-07-12 Matra Communication SYNTHETIC ANALYSIS-SPEECH CODING METHOD
FR2729244B1 (en) * 1995-01-06 1997-03-28 Matra Communication SYNTHESIS ANALYSIS SPEECH CODING METHOD
FR2729247A1 (en) * 1995-01-06 1996-07-12 Matra Communication SYNTHETIC ANALYSIS-SPEECH CODING METHOD
JP2993396B2 (en) * 1995-05-12 1999-12-20 三菱電機株式会社 Voice processing filter and voice synthesizer
DE19643900C1 (en) * 1996-10-30 1998-02-12 Ericsson Telefon Ab L M Audio signal post filter, especially for speech signals
US6137844A (en) * 1998-02-02 2000-10-24 Oki Telecom, Inc. Digital filter for noise and error removal in transmitted analog signals

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4301329A (en) * 1978-01-09 1981-11-17 Nippon Electric Co., Ltd. Speech analysis and synthesis apparatus
US4617676A (en) * 1984-09-04 1986-10-14 At&T Bell Laboratories Predictive communication system filtering arrangement
JP2535833B2 (en) * 1986-07-03 1996-09-18 日本電気株式会社 Integrated circuit
US4852169A (en) * 1986-12-16 1989-07-25 GTE Laboratories, Incorporation Method for enhancing the quality of coded speech
US4969192A (en) * 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
US4817157A (en) * 1988-01-07 1989-03-28 Motorola, Inc. Digital speech coder having improved vector excitation source

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Advances in Speech Coding,IEEE Workshop on Speech Coding for Telecommnications 1991,J.Gerson,"Vector Sum Excited Linear Prediction",p.69−79,Vancover Canada
Proceedings of 1987 IEEE International Conference on Acoustics,Speech and Signal Processing,Vol.4,Juin−Hwey Chen et al,"Real−Time Vector APC Speech Coding at 4800 bps with Adaptive Postifiltering",p.2185−2188,April 1987
Proceedings of 1988 IEEE International Conference on Acoustics,Speech and Signal Processing,Vol.1,D.J Zarkiadis et al,"A 16KB/S APC System with Adaptive Postfilter and Evaluation of its Perfomance",p.631−634

Also Published As

Publication number Publication date
ATE177867T1 (en) 1999-04-15
JPH05500573A (en) 1993-02-04
EP0570362B1 (en) 1999-03-17
AU635342B2 (en) 1993-03-18
ES2131498T3 (en) 1999-08-01
AU6411490A (en) 1991-05-16
DE69033011D1 (en) 1999-04-22
CN1078371C (en) 2002-01-23
EP0570362A1 (en) 1993-11-24
EP0570362A4 (en) 1993-07-01
WO1991006093A1 (en) 1991-05-02
DE69033011T2 (en) 2001-10-04
CN1051101A (en) 1991-05-01

Similar Documents

Publication Publication Date Title
JP3653826B2 (en) Speech decoding method and apparatus
JP3678519B2 (en) Audio frequency signal linear prediction analysis method and audio frequency signal coding and decoding method including application thereof
JP4843124B2 (en) Codec and method for encoding and decoding audio signals
JP4550289B2 (en) CELP code conversion
JP3566652B2 (en) Auditory weighting apparatus and method for efficient coding of wideband signals
AU714752B2 (en) Speech coder
JP3321971B2 (en) Audio signal processing method
JP3483958B2 (en) Broadband audio restoration apparatus, wideband audio restoration method, audio transmission system, and audio transmission method
EP0732686B1 (en) Low-delay code-excited linear-predictive coding of wideband speech at 32kbits/sec
JP4040126B2 (en) Speech decoding method and apparatus
JP2008519990A (en) Signal coding method
US5241650A (en) Digital speech decoder having a postfilter with reduced spectral distortion
JP2588004B2 (en) Post-processing filter
JP4928703B2 (en) Method and apparatus for performing spectrum enhancement
JP3158434B2 (en) Digital audio decoder with post-filter having reduced spectral distortion
KR100428697B1 (en) Speech synthesis method and device
JP3612260B2 (en) Speech encoding method and apparatus, and speech decoding method and apparatus
JP3230791B2 (en) Wideband audio signal restoration method
JP3319556B2 (en) Formant enhancement method
JPH10143195A (en) Post filter
JP3230790B2 (en) Wideband audio signal restoration method
JP3520955B2 (en) Acoustic signal coding
JP3468862B2 (en) Audio coding device
JPH09167000A (en) Speech encoding device
JPH0736484A (en) Sound signal encoding device

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080216

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090216

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100216

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100216

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110216

Year of fee payment: 10

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110216

Year of fee payment: 10