JP3384523B2 - 音響信号処理方法 - Google Patents

音響信号処理方法

Info

Publication number
JP3384523B2
JP3384523B2 JP23379996A JP23379996A JP3384523B2 JP 3384523 B2 JP3384523 B2 JP 3384523B2 JP 23379996 A JP23379996 A JP 23379996A JP 23379996 A JP23379996 A JP 23379996A JP 3384523 B2 JP3384523 B2 JP 3384523B2
Authority
JP
Japan
Prior art keywords
frequency
frequency characteristic
frequency domain
coefficient
spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP23379996A
Other languages
English (en)
Other versions
JPH1078797A (ja
Inventor
直樹 岩上
和永 池田
健弘 守谷
明夫 神
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP23379996A priority Critical patent/JP3384523B2/ja
Publication of JPH1078797A publication Critical patent/JPH1078797A/ja
Application granted granted Critical
Publication of JP3384523B2 publication Critical patent/JP3384523B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明はオーディオ信号、
特に符号化・復号化された音声信号に含まれる雑音感を
低減させる信号処理方法に関する。
【0002】
【従来の技術】この発明は復号化音響信号以外の音響信
号に適用できるが、復号化音響信号に適用の際の適用個
所の理解のため従来の音響信号変換符号化・復号化法を
図3を参照して説明する。符号化器10においては、入
力端子11よりの入力音響信号を、時間−周波数変換部
12によって周波数領域係数に変換する。この変換の方
法としては、MDCT(Modified Discrete Cosine Tra
nsformation,変形離散コサイン変換)や、DCT(Disc
rete Cosine Transformation, 離散コサイン変換),D
FT(Discrete Fourier Transformation,離散フーリエ
変換)などを用いることができる。なお、時間−周波数
変換部12では、前処理として、入力信号サンプル列の
フレーム分割と窓掛けが必要である。フレーム分割は、
MDCTの場合入力サンプルがN点入力されるごとにこ
れを含む過去2N点のサンプルを1フレームとして分割
する。DCTとDFTの場合入力サンプルがN点ごとに
これを含む過去N+α点のサンプルを1フレームとして
分割する。窓掛けは従来行われている手法により行い、
いずれの変換方法でも、N点の周波数領域係数が得られ
る。
【0003】概形計算部13で周波数領域係数の概形を
抽出する。この概形抽出方法としては、前処理された音
響信号を入力として線形予測分析をする方法、周波数領
域係数を入力としてスケールファクタを計算する方法、
周波数領域係数をリフタリングする方法などを用いるこ
とができる。線形予測分析をする方法では、入力信号を
線形予測分析し、線形予測係数を求め、この係数のスペ
クトル振幅の逆数を周波数特性概形とする。線形予測の
次数は、20次程度にするのが効果的である。
【0004】スケールファクタを計算する方法では、周
波数領域係数を複数の小帯域に分割し、小帯域ごとにス
ケールファクタを計算し、これを周波数特性概形とす
る。小帯域に分割する方法は、周波数スケールで等間隔
としてもよいし、バークスケールで等間隔(つまり聴覚
的に等間隔)としてもよい。小帯域の数は30程度に設
定するのが効果的である。スケールファクタは小帯域内
のサンプルの振幅の平均値でもよいし、振幅の最大値で
もよい。
【0005】周波数領域係数をリフタリングする方法で
は、周波数領域係数をケプストラム分析し、ケプストラ
ム係数の低次部分のみのスペクトル振幅を周波数特性概
形とする。また、周波数領域係数の概形は、上記の方法
の併用により求めてもよい。たとえば、線形予測分析と
スケールファクタを併用する場合、線形予測分析による
線形予測スペクトルを決定した後、これに掛け合わせた
際に実際の周波数特性にもっとも近い形状になるように
スケールファクタを決定するなどの方法をとる。
【0006】この周波数特性概形を概形量子化部14で
量子化して、そのインデックスIn1を得る。周波数特性
概形を線形予測分析により求めた場合、線形予測係数を
線スペクトル対(LSP)に変換し、これを量子化する
方法が能率がよい。スケールファクタを量子化する場
合、各々のスケールファクタをスカラー量子化してもよ
いし、いくつかのスケールファクタをまとめてベクトル
量子化してもよい。ベクトル量子化をする際、インタリ
ーブベクトル量子化の技術を使うと、能率良く量子化が
可能である。ケプストラム係数を量子化する場合、ケプ
ストラム係数をスカラー量子化してもよいし、ベクトル
量子化してもよい。
【0007】いずれの方法も、予測量子化を行うとさら
に高い能率が得られる。予測の方法としては、AR予
測、MA予測などを用いることができる。複数方法で周
波数特性概形を求めた場合、用いたすべての方法につい
て量子化を行う。量子化した周波数特性概形を概形再生
部15で復号化し、周波数特性概形を再生する。線スペ
クトル対を量子化した場合、復号化して得られた再生線
スペクトル対を再生線形予測係数に変換し、再生線形予
測係数のスペクトル振幅の逆数を再生周波数特性概形と
する。スケールファクタを量子化した場合、復号化した
再生スケールファクタを再生周波数特性概形とする。ケ
プストラム係数を量子化した場合、復号化された再生ケ
プストラム係数のスペクトル振幅を再生周波数特性概形
とする。
【0008】平坦化部16において周波数領域係数を再
生周波数特性概形で平坦化する。ここでは、各々の周波
数領域係数をこれに対応する周波数特性概形で割ること
によって平坦化周波数領域係数(残差周波数係数)が得
られる。この平坦化周波数係数を残差量子化部17でベ
クトル量子化してインデックスIn2を得る。この量子化
方法として、重み付きベクトル量子化による変換符号化
法(TC−WVQ,Transform Coding with Weighted V
ector Quantization),周波数領域重み付けインタリー
ブベクトル量子化法(TWINVQ,Transform-domain
Weighted Interleave Vector Quantization)などがあ
る。それぞれの技術については、T.Moriya,H.Sud
a :“An,8kbit/s transform coder fornoisy channe
ls," Proc.ICASSP '89 pp196−199および
岩上、守谷、三樹、“周波数領域重みづけインタリーブ
ベクトル量子化(TwinVQ)によるオーディオ符号
化、”日本音響学会講演論文集 平成6年10月〜11
月pp.339−340に述べられている。
【0009】復号化器20において、量子化された平坦
化された周波数領域係数のインデックスIn2を再生部2
1で復号再生する。量子化した周波数特性概形のインデ
ックスIn1を再生部22で復号化し、再生周波数特性概
形を再生する。線スペクトル対を量子化した場合、復号
化して得られた再生線スペクトル対を再生線形予測係数
に変換し、再生線形予測係数のスペクトル振幅の逆数を
再生周波数特性概形とする。スケールファクタを量子化
した場合、復号化した再生スケールファクタを再生周波
数特性概形とする。ケプストラム係数を量子化した場
合、復号化された再生ケプストラム係数のスペクトル振
幅を再生周波数特性概形とする。
【0010】なお、予測量子化を行った場合、同じ予測
合成を用いて再生を行う。複数方法の量子化を行った場
合、すべての方法について再生を行い、たとえば各々で
再生した概形を互いに掛け合わせるなどの方法により再
生周波数特性概形を得る。再生された平坦化周波数領域
係数を、再生周波数特性概形を用いて逆平坦化部23で
逆平坦化する。ここでは、各々の再生された平坦化周波
数領域係数と、これに対応する再生周波数特性概形を掛
け合わせることによって逆平坦化が行われ、再生周波数
領域係数が得られる。
【0011】周波数−時間変換部24によって再生周波
数領域係数を出力音響信号に変換出力する。変換の方法
としては、IMDCT(Inverse Modified Discrete Co
sineTransformation, 逆変形離散コサイン変換)や、I
DCT(Inverse DiscreteCosine Transformation,逆
離散コサイン変換)、IDFT(Inverse DiscreteFou
rier Transformation,逆離散フーリエ変換)などを用
いることができる。なお、周波数−時間変換部では、後
処理として、出力信号サンプル列の窓掛けとフレーム結
合が必要である。窓掛けは従来の手法と同様に行う。
【0012】更に符号化音声の雑音感を低減するために
スペクトルの山谷を強調するポストフィルタ25に変換
部24よりの復号化音声信号を入力することが知られて
いる。このポストフィルタ25の典型としては線形予測
係数αに基づく以下の形式がある。
【0013】
【数1】 ここでμはスペクトルの傾斜を補正する定数で例えば0.
4,γ1 ,γ2 はスペクトルの山を強調するための1以
下の正定数で例えばそれぞれ0.5と0.8である。この手
法は畳み込みの処理を必要とするため大きな演算量を必
要とする。また詳細なスペクトル強調処理を行うために
は線形予測の次数を高くする必要があり、演算量と演算
精度の点からも問題がある。
【0014】
【発明が解決しようとする課題】この発明の目的は、オ
ーディオ信号、特に符号化・復号化された音声信号に含
まれる雑音感を低減させる信号処理方法を小さな演算量
で詳細に実現することを目的とする。
【0015】
【課題を解決するための手段】この発明では、入力信号
の周波数特性の概形が取り除かれた周波数領域係数と、
そのスペクトルの包絡を求め、そのスペクトル包絡形状
を強調し、その強調されたスペクトル包絡により周波数
領域係数を逆平坦化する。特にスペクトル包絡形状を求
める際バーク尺度(聴覚上で周波数分解能が同一とな
る)の周波数軸で等分解能をもたせるとより高い能率で
処理を行うことができる。
【0016】雑音感の多い音響信号は、スペクトルの大
小を強調することにより雑音感を低減することができ
る。この発明ではこの処理を周波数領域で行うので、少
ない演算量で詳細な処理が可能である。この発明を変換
符号化方式の復号器に組み込む場合には、この発明の処
理過程の一つである周波数−時間変換処理を共有できる
ので演算量の点で特に有利である。
【0017】
【発明の実施の形態】図1にこの発明の第1実施例を示
す。この実施例では平坦化された周波数領域係数とスペ
クトル包絡とが端子51,52にそれぞれ入力され、端
子53から時間領域信号を出力とする。平坦化周波数領
域係数は、例えば図3中の符号化器10で説明したよう
に入力音響信号を時間−周波数変換した後、スペクトル
包絡を用いて平坦化することによって求めてもよいし、
図3中の復号化器20に示したように変換符号化方法の
復号器において、残差再生部21より再生された平坦化
周波数領域係数を用いてもよい。時間−周波数変換は、
先に述べたように離散フーリエ変換(Discrete Fourier
Transformation,DCT),離散コサイン変換(Discre
te Cosine Transformation, DCT),変形離散コサイ
ン変換(Modified Discrete Cosine Transformation,M
DCT)などを用いることができる。これらの変換は、
入力Nサンプルごとに行う。Nの値は例えば入力信号の
サンプリング周波数が48kHz の場合512ないし40
96程度が良好である。
【0018】スペクトル包絡は変換符号化方法の復号器
において、図3の周波数特性概形再生部22により再生
されたスペクトル包絡を用いてもよいし、入力音響信号
を時間−周波数変換して周波数領域係数を求め、その周
波数領域係数の概形を求めてもよい。スペクトル包絡の
表現方法として先に述べたように、スケールファクタ、
線形予測スペクトルなどを用いることができる。スケー
ルファクタは、周波数領域係数を複数の周波数バンドご
とにまとめた各バンドごとの代表値である。代表値はバ
ント内の係数の振幅の最大値でもよいし平均値でもよ
い。また各周波数のバンド幅は、線形スケール(Hzスケ
ール)で一定幅でもよいし、非線形スケール(例えばバ
ークスケール)で一定幅としてもよい。特にバークスケ
ールで一定幅とした場合には、聴感的に高能率な処理が
可能である。線形予測スペクトルは、線形予測係数を周
波数分析し、その逆数を求めることにより与えられる。
線形予測係数は入力音響信号を線形予測分析して求めて
もよいし、符号化方法の復号器において、再生された線
形予測係数を用いてもよい。 端子52に入力されたス
ペクトル包絡はスペクトル包絡強調部54で強調処理が
なされる。この強調処理では、値が大きいときには更に
大きく、値が小さいときには更に小さくすることを行
う。例えば式(2)のような変形を行う。
【0019】 w(i)′=w0 (w(i)/w0 q (2) ここで、w(i)′は変形後のスペクトル包絡、w
(i)は入力スペクトル包絡、w0 は変形の基準値、q
は1以上の定数、例えば2〜4,iはスペクトル包絡の
サンプル番号である。基準値w0 は任意に選ぶことがで
きるが、スペクトル包絡の平均値とすると効果的であ
る。また、式(2)の変形を一律に行うのではなく、基
準値w0 よりもスペクトル包絡の値wが小さいときのみ
変形を行ってもよい。
【0020】次に、端子51に入力された平坦化周波数
領域係数を強調されたスペクトル包絡を用いて逆平坦化
部55で逆平坦化する。この際、強調されたスペクトル
包絡のサンプル点数は平坦化周波数領域係数のサンプル
点数と一致している必要がある。一致していない場合に
は、補間・間引きなどの処理によりサンプル点数を一致
させる。逆平坦化は次式(3)に従って行う。
【0021】 y(j)=w(j)′x(j) (3) ただし、yは逆平坦化して得られた周波数領域係数、x
は平坦化周波数領域係数、jはサンプル番号である。最
後に、逆平坦化して得られた周波数領域係数を変換部5
6で周波数−時間変換して音響信号出力を得る。周波数
−時間変換の方法として、逆離散フーリエ変換(Invers
e Discrete Fourier Transformation,IDFT),逆離
散コサンイン変換(Inverse Discrete Cosine Transfo
rmation,IDCT),逆変形離散コサンイン変換(Inve
rse Modified Discrete Cosine Transformation,IMD
CT)などを用いることができる。
【0022】図2にこの発明の第2実施例を示す。スペ
クトル包絡強調、逆平坦化の手法は図1に示した第1実
施例と同様である。第1実施例との違いは、複数のスペ
クトル包絡を用い、別々に強調処理を行うことである。
端子61よりの微細スペクトル包絡は端子62よりの大
局的スペクトル包絡よりもより細かい。例えばそれぞれ
バークスケール上で等間隔に分割したスケールファクタ
と線形予測スペクトルなどを用いる。どちらのスペクト
ル包絡も第1実施例で述べた種類のスペクトル包絡を用
いることができる。また微細スペクトル包絡として、ピ
ッチ包絡を用いてもよい。ピッチ包絡は、基本周波数の
整数倍ごとに鋭いピークを持つ包絡であり、入力音響信
号を分析して求めてもよいし、符号化方法の復号器にお
いて、再生されたピッチ包絡を用いたり、あるいは再生
されたピッチ情報からピッチ包絡を用いてもよい。
【0023】大局的スペクトル包絡はスペクトル包絡強
調部63で第1実施例と同様に強調処理が行われ、また
微細スペクトル包絡もスペクトル包絡強調部64で同様
に強調処理が行われる。端子51よりの平坦化周波数領
域係数は逆平坦化部65でスペクトル包絡強調部63よ
りの強調処理された大局的スペクトル包絡により逆平坦
化処理がなされ、この逆平坦化された周波数領域係数
は、逆平坦化部66でスペクトル包絡強調部64で強調
処理された微細スペクトル包絡により平坦化処理され、
その平坦化処理された周波数領域係数が変換部56で周
波数−時間変換がなされて出力される。
【0024】なお、スペクトル包絡強調−逆平坦化の組
み合わせは第2実施例のように2つに限定する必要はな
く、更に多い組み合わせを用意してもよい。
【0025】
【発明の効果】以上述べたように、この発明によれば周
波数領域で音響信号のスペクトル包絡の強調処理を行
い、スペクトル包絡の強弱を強調することにより、スペ
クトルの谷間に歪みがあるために聞こえる雑音感を低減
することができる。この処理を時間領域でなく周波数領
域で行うことにより、時間領域で必要だった畳み込み演
算を行う必要がなく、詳細な処理でも小さな演算量で行
うことができる。また、この発明を変換符号化方法の復
号器と組み合わせる場合、例えば図3中の逆平坦化部2
3を、この発明の逆平坦化部53または65と共有する
ことができ、また周波数−時間変換部56を図3中の周
波数−時間変換部24と共有でき、演算量とメモリ規模
の点で特に有利である。
【図面の簡単な説明】
【図1】この発明の第1実施例の機能構成を示すブロッ
ク図。
【図2】この発明の第2実施例の機能構成を示すブロッ
ク図。
【図3】従来の音響信号変換符号化・復号化方法におけ
る機能構成例を示すブロック図。
フロントページの続き (72)発明者 神 明夫 東京都新宿区西新宿三丁目19番2号 日 本電信電話株式会社内 (56)参考文献 特開 昭61−286900(JP,A) 特開 平6−318876(JP,A) 特開 平7−107053(JP,A) 特開 平7−248794(JP,A) 特開 平8−110796(JP,A) 特表 昭62−500138(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 13/00 G10L 21/02

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 フレーム単位に、音響信号の周波数特性
    の概形が取り除かれた周波数領域係数を得る第1の段階
    と、 上記周波数特性の概形を得る第2の段階と、上記周波数特性の概形の各サンプルの値が大きいサンプ
    ルは更に値を大きくしてその 周波数特性の概形の形状を
    強調する第3の段階と、 上記第3の段階で得られた強調された周波数特性の概形
    を用いて第1の段階で得られた周波数領域係数に周波数
    特性を付加して逆平坦化する第4の段階と、を有するこ
    とを特徴とする音響信号処理方法。
  2. 【請求項2】 フレーム単位に、音響信号の周波数特性
    の概形が取り除かれた周波数領域係数を得る第1の段階
    と、 上記周波数特性の概形を得る第2の段階と、上記周波数特性の概形の各サンプルの値が小さいサンプ
    ルは更に値を小さくしてその 周波数特性の概形の形状を
    強調する第3の段階と、 上記第3の段階で得られた強調された周波数特性の概形
    を用いて第1の段階で得られた周波数領域係数に周波数
    特性を付加して逆平坦化する第4の段階と、を有するこ
    とを特徴とする音響信号処理方法。
  3. 【請求項3】 上記第2の段階は、周波数特性の概形と
    して、バークスケール上で等間隔の周波数分解能を持つ
    スケールファクタを含むことを特徴とする請求項1又は
    記載の音響信号処理方法。
JP23379996A 1996-09-04 1996-09-04 音響信号処理方法 Expired - Lifetime JP3384523B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP23379996A JP3384523B2 (ja) 1996-09-04 1996-09-04 音響信号処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP23379996A JP3384523B2 (ja) 1996-09-04 1996-09-04 音響信号処理方法

Publications (2)

Publication Number Publication Date
JPH1078797A JPH1078797A (ja) 1998-03-24
JP3384523B2 true JP3384523B2 (ja) 2003-03-10

Family

ID=16960767

Family Applications (1)

Application Number Title Priority Date Filing Date
JP23379996A Expired - Lifetime JP3384523B2 (ja) 1996-09-04 1996-09-04 音響信号処理方法

Country Status (1)

Country Link
JP (1) JP3384523B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1892702A4 (en) 2005-06-17 2010-12-29 Panasonic Corp POST-FILTER, DECODER AND POST-FILTRATION METHOD
US8271277B2 (en) 2006-03-03 2012-09-18 Nippon Telegraph And Telephone Corporation Dereverberation apparatus, dereverberation method, dereverberation program, and recording medium
US7590523B2 (en) * 2006-03-20 2009-09-15 Mindspeed Technologies, Inc. Speech post-processing using MDCT coefficients

Also Published As

Publication number Publication date
JPH1078797A (ja) 1998-03-24

Similar Documents

Publication Publication Date Title
CN1838238B (zh) 一种用于增强信源解码器的设备
EP0698876A2 (en) Method of decoding encoded speech signals
US6678655B2 (en) Method and system for low bit rate speech coding with speech recognition features and pitch providing reconstruction of the spectral envelope
JPH1020898A (ja) オーディオ信号圧縮方法,およびオーディオ信号圧縮装置
JPH0869299A (ja) 音声符号化方法、音声復号化方法及び音声符号化復号化方法
US6593872B2 (en) Signal processing apparatus and method, signal coding apparatus and method, and signal decoding apparatus and method
JP3765171B2 (ja) 音声符号化復号方式
JP3186007B2 (ja) 変換符号化方法、復号化方法
US6052658A (en) Method of amplitude coding for low bit rate sinusoidal transform vocoder
JP3353868B2 (ja) 音響信号変換符号化方法および復号化方法
EP0919989A1 (en) Audio signal encoder, audio signal decoder, and method for encoding and decoding audio signal
JP3384523B2 (ja) 音響信号処理方法
JP3092653B2 (ja) 広帯域音声符号化装置及び音声復号装置並びに音声符号化復号装置
JP3353266B2 (ja) 音響信号変換符号化方法
JP3353267B2 (ja) 音響信号変換符号化方法及び復号化方法
JP3237178B2 (ja) 符号化方法及び復号化方法
JP3348759B2 (ja) 変換符号化方法および変換復号化方法
JPH09127987A (ja) 信号符号化方法及び装置
JP2002049399A (ja) ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体
JP3472974B2 (ja) 音響信号符号化方法および音響信号復号化方法
JP4618823B2 (ja) 信号符号化装置及び方法
JP2000259190A (ja) オーディオ信号圧縮方法及びオーディオ信号復号方法とオーディオ信号圧縮装置
JP3376830B2 (ja) 音響信号符号化方法および音響信号復号化方法
JP3297750B2 (ja) 符号化方法
JP3186020B2 (ja) 音響信号変換復号化方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071227

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081227

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091227

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101227

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101227

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111227

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111227

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121227

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121227

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131227

Year of fee payment: 11

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term