JPH09261063A - 信号符号化方法および装置 - Google Patents

信号符号化方法および装置

Info

Publication number
JPH09261063A
JPH09261063A JP8062966A JP6296696A JPH09261063A JP H09261063 A JPH09261063 A JP H09261063A JP 8062966 A JP8062966 A JP 8062966A JP 6296696 A JP6296696 A JP 6296696A JP H09261063 A JPH09261063 A JP H09261063A
Authority
JP
Japan
Prior art keywords
signal
gain control
waveform
circuit
masking
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP8062966A
Other languages
English (en)
Inventor
Shinji Miyamori
慎二 宮森
Masatoshi Ueno
正俊 上野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP8062966A priority Critical patent/JPH09261063A/ja
Priority to US08/816,090 priority patent/US5825320A/en
Publication of JPH09261063A publication Critical patent/JPH09261063A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

(57)【要約】 【課題】 プリエコーとポストエコーの発生を抑制す
る。 【解決手段】 ゲイン制御位置決定回路102におい
て、端子100より入力されたオーディオ信号のアタッ
ク部とリリース部を検出する。聴覚モデル適用回路11
0においては、入力信号の聴覚心理モデルに基づいてマ
スキングレベルを求める。ゲイン制御量決定回路111
は、マスキングレベルに従って、適応的に選択したゲイ
ン制御量を決定する。ゲイン制御回路103において
は、このゲイン制御量に対応して、端子100より入力
されたオーディオ信号のゲインを制御する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ディジタルデータ
などの入力信号をいわゆる高能率符号化によって符号化
する信号符号化方法および装置に関する。
【0002】
【従来の技術】従来より、オーディオ或いは音声等の信
号の高能率符号化の手法および装置には種々あるが、例
えば、時間軸の信号を所定の時間単位でフレーム化し
て、このフレーム毎の時間軸の信号を周波数軸上の信号
に変換(スペクトル変換)して複数の周波数領域に分割
し、各帯域毎に符号化する、いわゆる変換符号化方式
や、時間軸上のオーディオ信号等をフレーム化しない
で、複数の周波数帯域に分割して符号化する、いわゆる
帯域分割符号化(サブ・バンド・コーディング(SB
C))方式等を挙げることができる。また、上述の帯域
分割符号化と変換符号化とを組み合わせた高能率符号化
の手法および装置も考えられており、この場合には、例
えば、上記帯域分割符号化方式で帯域分割を行った後、
各帯域毎の信号を周波数軸上の信号にスペクトル変換
し、このスペクトル変換された各帯域毎に符号化が施さ
れる。
【0003】上述した帯域分割符号化方式に使用される
帯域分割用フィルタとしては、例えばQMF(Quadratur
e Mirror Filter)等のフィルタがあり、これは、例えば
文献「ディジタル・コーディング・オブ・スピーチ・イ
ン・サブバンズ」("Digitalcoding of speech in subba
nds" R.E.Crochiere, Bell Syst.Tech.J., Vol.55,No.
8 1976) に述べられている。このQMFのフィルタは、
帯域を等しい帯域幅で2分割するものであり、このフィ
ルタにおいては、上記分割した帯域を後に合成する際に
いわゆるエリアシングが発生しないことが特徴となって
いる。
【0004】また、文献「ポリフェーズ・クワドラチュ
ア・フィルターズ −新しい帯域分割符号化技術」("Po
lyphase Quadrature filters -A new subband coding t
echnique", Joseph H. Rothweiler ICASSP 83, BOSTON)
には、等しい帯域幅のフィルタ分割手法が述べられてい
る。このポリフェーズ・クワドラチュア・フィルタは、
信号を等しい幅の複数の帯域に分割する際に一度に分割
できることが特徴となっている。
【0005】また、上述したスペクトル変換としては、
例えば、入力オーディオ信号を所定の単位時間でフレー
ム化し、そのフレーム毎に離散フーリエ変換(DF
T)、離散コサイン変換(DCT)、又はモディファイ
ド離散コサイン変換(MDCT)等を行うことで、時間
軸を周波数軸に変換するようなスペクトル変換がある。
なお、上記MDCTについては、文献「時間領域エリア
シング・キャンセルを基礎とするフィルタ・バンク設計
を用いたサブバンド/変換符号化」("Subband/Transfor
m Coding Using Filter Bank Designs Based on Time D
omain Aliasing Cancellation," J.P.Princen A.B.Bra
dley, Univ. of Surrey Royal Melbourne Inst. of Tec
h. ICASSP 1987)に述べられている。
【0006】このように、フィルタやスペクトル変換に
よって、帯域毎に分割された信号を量子化することによ
り、量子化雑音が発生する帯域を制御することができ、
いわゆるマスキング効果などの性質を利用して、聴覚的
により高能率な符号化を行うことができる。また、ここ
で量子化を行う前に、各帯域毎に、例えばその帯域にお
ける信号成分の絶対値の最大値で正規化を行うようにす
れば、さらに高能率な符号化を行うことができる。
【0007】周波数帯域に分割された各周波数成分(以
下、スペクトル成分と呼ぶ)を量子化する場合の周波数
分割幅としては、例えば人間の聴覚特性を考慮した帯域
幅を用いることが多い。例えば、一般に高域ほど帯域幅
が広くなるような臨界帯域(クリティカルバンド)と呼
ばれている帯域幅で、オーディオ信号が複数(例えば2
5バンド)の帯域に分割される。また、この時の各帯域
毎のデータを符号化する際には、各帯域毎の所定のビッ
ト配分、或いは、各帯域毎の適応的なビット割り当て
(ビットアロケーション)による符号化が行われる。例
えば、上記MDCT処理されて得られた係数データを上
記ビットアロケーションによって符号化する際には、上
記各フレーム毎のMDCT処理により得られる各帯域毎
のMDCT係数データに対して、適応的な割当てビット
数で符号化が行われることになる。
【0008】上記ビット配分手法としては、次の2手法
が知られている。
【0009】例えば、文献「音声信号の適応変換符号
化」("Adaptive Transform Coding of Speech Signal
s", R.Zelinski, P.Noll, IEEE Transactions of Accou
stics,Speech, and Signal Processing, vol.ASSP-25,
No.4, August 1977 )では、各帯域毎の信号の大きさを
もとに、ビット割り当てを行っている。この方式では、
量子化雑音スペクトルが平坦となり、雑音のエネルギが
最小となるが、聴感覚的にはマスキング効果が利用され
ていないために、実際の聴感上の雑音感は最適ではな
い。
【0010】また、例えば文献「臨界帯域符号化器 −
聴覚システムの知覚要求に関するディジタル符号
化」("The critical band coder --digital encoding
of the perceptual requirements of the auditory sys
tem", M.A.Kransner MIT, ICASSP 1980)では、聴覚マ
スキングを利用することで、各帯域毎に必要な信号対雑
音比を得て、固定的なビット割り当てを行う手法が述べ
られている。しかし、この手法では、サイン波入力で特
性を測定する場合でも、ビット割り当てが固定的である
ために、特性値がそれほど良い値とならない。
【0011】これらの問題を解決するために、ビット割
り当てに使用できる全ビットを、上記各帯域或いは各帯
域をさらに小分割したブロック毎にあらかじめ定められ
た固定の割り当てパターン分と、各ブロック内の信号の
大きさに依存したビット配分を行う分とに分割して使用
すると共に、その分割比を入力信号に関係する信号に依
存させ、例えば信号のスペクトル分布が滑らかなときほ
ど上記固定のビット割り当てパターン分への分割比率を
大きくするような高能率符号化装置が提案されている。
【0012】この方法によれば、例えばサイン波入力の
ように特定のスペクトル成分にエネルギが集中する場合
には、そのスペクトル成分を含むブロックに対して多く
のビットを割り当てるようにすることによって、全体の
信号対雑音特性を著しく改善することができる。一般
に、急峻なスペクトル分布をもつ信号に対する人間の聴
覚は、極めて敏感であるため、このような方法を用いる
ことで信号対雑音特性を改善することは、単に測定上の
数値を向上させるばかりでなく、聴感上の音質を改善す
るのに有効である。
【0013】なお、ビット割り当ての方法にはこの他に
も数多くの方式が提案されており、さらに聴覚に関する
モデルが精緻化され、符号化装置の能力が向上すれば聴
覚的にみてより高能率な符号化が可能になる。
【0014】時間領域のディジタルオーディオ信号のよ
うな波形要素(サンプルデータ)からなる波形信号をス
ペクトル変換する方法として、上述したDFTやDCT
を使用した場合には、例えばM個のサンプルデータ毎に
ブロックを構成し、このブロック毎にDFTやDCTの
スペクトル変換を施すことになる。このようなブロック
に対してスペクトル変換を行うと、M個の独立な実数デ
ータ(DFT係数データ或いはDCT係数データ)が得
られることになる。このようにして得られたM個の実数
データは、その後量子化して符号化され、符号化データ
となされる。
【0015】この符号化データを復号化して再生波形信
号を再現する場合には、上記符号化データを復号化して
逆量子化し、得られた実数データに対して、符号化時の
ブロックに対応するブロック毎に逆DFTや逆DCTに
よる逆スペクトル変換を施して波形要素信号を得、この
波形要素信号からなるブロックを接続することで、波形
信号を再現する。
【0016】このようにして生成した再生波形信号に
は、ブロックの接続の際の接続歪みが残り、聴感上好ま
しくないものとなる。このようなことから、上述したブ
ロック間の接続歪みを軽減することを目的として、実際
の符号化の際には、DFTやDCTを使用したスペクト
ル変換を行うに際し、相互に隣接するブロックでそれぞ
れM1個ずつのサンプルデータをオーバーラップさせて
スペクトル変換を施すようにしている。
【0017】しかし、このように相互に隣接するブロッ
クでそれぞれM1個ずつのサンプルデータをオーバーラ
ップさせてスペクトル変換を行った場合、平均して(M
−M1)個のサンプルデータに対してM個の実数データ
が得られることになり、実際にスペクトル変換に用いた
元のサンプルデータの数よりも、スペクトル変換により
得られた実数データの個数の方が増加することになる。
この実数データは、その後量子化して符号化することに
なるため、このように、元のサンプルデータの数に対し
てスペクトル変換によって得られる実数データの個数が
増加することは、符号化効率上好ましくない。
【0018】これに対し、同じくディジタルオーディオ
信号等のサンプルデータからなる波形信号をスペクトル
変換する方法として、前述したMDCTを使用した場合
は、ブロック間の接続歪みを軽減するために、相互に隣
接するブロックでそれぞれM個ずつのサンプルデータを
オーバーラップさせた2M個のサンプルデータを用いて
スペクトル変換を行い、独立したM個の実数データ(M
DCT係数データ)を得るようにしている。このため、
MDCTのスペクトル変換では、平均してM個のサンプ
ルデータに対してM個の実数データが得られることにな
り、前述したDFTやDCTを使用したスペクトル変換
の場合よりも効率の良い符号化を行うことが可能とな
る。
【0019】なお、上述のMDCTのスペクトル変換を
用い、得られた実数データを量子化し符号化した符号化
データを、復号化して再生波形信号を生成する場合に
は、その符号化データを復号化して逆量子化し、得られ
た実数データに対して逆MDCTによる逆スペクトル変
換を施してブロック内の波形要素を得、このブロック内
の波形要素を互いに干渉させながら加え合わせることに
より、波形信号を再構成することになる。
【0020】一般に、スペクトル変換のためのブロック
の長さ(ブロックの時間方向の大きさ)を長くすれば、
周波数分解能が高まり、例えばディジタルオーディオ信
号のような波形信号をこのような長いブロックでスペク
トル変換すると、特定のスペクトル成分にエネルギが集
中するようになる。また、前述したように、相互に隣接
するブロック同士で十分長いオーバーラップを持たせた
ブロックに対してスペクトル変換を施すようにすれば、
波形信号のブロック間歪みを良好に軽減することができ
る。さらに、スペクトル変換の手法として、上述のよう
に相互に隣接するブロックでそれぞれ半分の個数ずつサ
ンプルデータをオーバーラップさせたブロックに対して
スペクトル変換を施し、しかもこのスペクトル変換によ
り得られた実数データの個数が、元の波形信号のサンプ
ルデータの個数に対して増加しないMDCTを使用すれ
ば、前述したDFTやDCTを使用したスペクトル変換
の場合よりも効率の良い符号化を行うことが可能とな
る。
【0021】ところで、上述したように波形信号をブロ
ック化して、このブロック毎にスペクトル成分(前述の
例ではスペクトル変換により得られる実数データ)に分
解する処理を行い、得られたスペクトル成分を量子化し
て符号化する方法を用いると、後にその符号化されたス
ペクトル成分の信号を復号化し、さらにブロック毎に合
成して得られた波形信号には量子化雑音が発生すること
になる。
【0022】もしも、元々の波形信号に、信号成分が急
激に変化する部分(波形要素のレベルが急激に変化する
過渡的な部分)が含まれているような場合において、こ
の波形信号を一旦符号化してその後復号化すると、その
過渡的な部分に起因する大きな量子化雑音が、この過渡
的な部分以外の元の波形信号の部分にも拡がってしまう
ことがある。
【0023】符号化されるオーディオ信号として、例え
ば図10(A)に示すように、変化が少なく、かつ、レ
ベルの小さな準定常的な信号FLの次に、上記過渡的な
部分として音が急激に大きくなるアタック部ATが存在
し、その後は大きなレベルの信号が続くような波形信号
SW1を用いた場合を想定する。このような波形信号S
W1を、単位時間幅でブロック化すると共に、このブロ
ック内の信号成分をスペクトル変換し、得られたスペク
トル成分を量子化して符号化し、さらにその後に逆スペ
クトル変換と復号化および逆量子化を施すと、再現され
た波形信号SW11は、図10(C)に示すように、ブ
ロック全体に渡ってアタック部ATに起因する大きな量
子化雑音QN1がのったものとなってしまう。この場
合、アタック部ATの時間的に前の準定常的な信号FL
の部分にも、このアタック部ATに起因する大きな(例
えば準定常的な信号FLよりもレベル的に大きな)量子
化雑音QN1が現れることになる。
【0024】このようなアタック部ATの時間的に前の
準定常的な信号FLの部分に現れる量子化雑音QN1
は、アタック部ATによる同時マスキングによっても遮
蔽されないため、聴感上の障害になる。上述のように、
音が急激に大きくなるアタック部ATの前に現れる量子
化雑音QN1は、一般にプリエコーと呼ばれている。な
お、ブロック内の信号成分をスペクトル変換する際に
は、そのブロックに対して、例えば図10(B)に示す
ように、アタック部ATにおいてピークを有し、その前
後の部分がなだらかに変化する特性曲線を有する変換ウ
ィンドウ関数(窓関数)TWをかけてからスペクトル変
換を行うことで、スペクトル分布が広範囲に拡がらない
ようにする。
【0025】特に、前述したように周波数分解能を高め
るために、波形信号を長いブロックでスペクトル変換し
た場合には、時間分解能が悪くなり、長い期間にわたっ
てプリエコーが発生してしまうことがある。
【0026】そこで、スペクトル変換の際のブロックの
長さを短くすれば、上述の量子化雑音の発生期間も短く
なる。このため、例えば上記アタック部ATの近辺で、
スペクトル変換されるブロックの長さを短くすれば、プ
リエコーが発生する期間を短くすることができ、プリエ
コーによる聴感上の障害を軽減することができる。
【0027】次に、このようにアタック部ATの近辺で
ブロックの長さを短くすることでプリエコーを防止する
方法について説明する。図11(A)に示すような準定
常的な信号FLとアタック部ATとを含む波形信号SW
に対して、アタック部ATのような音の大きさが急激に
変化する過渡的な部分の近辺では、スペクトル変換のた
めのブロックの長さを短くし、この短いブロック内の信
号成分に対してスペクトル変換を施すようにすれば、こ
の短いブロック内だけでプリエコーが発生し、プリエコ
ーの期間を十分短くすることができるようになる。この
ように、短いブロック内でプリエコーの発生期間を十分
短くすることができれば、アタック部ATによるいわゆ
る逆向マスキング効果による聴感上の障害を少なくする
ことが可能となる。なお、この短いブロックの場合も、
ブロック内の信号成分をスペクトル変換する際には、例
えば図11(B)に示すような短い変換ウィンドウ関数
(短変換ウィンドウ関数TWS )をかけてからスペク
トル変換する。
【0028】一方、準定常的な信号FLの部分やアタッ
ク部AT以降の信号部分に対しても同様に、スペクトル
変換のためのブロックの長さを短くすると、周波数分解
能が悪くなり、これらの部分における符号化効率が悪く
なってしまう。このため、これらの部分に対しては、ス
ペクトル変換のためのブロックの長さを長くした方が、
特定のスペクトル成分に対してエネルギが集中すること
になって符号化効率が高くなり、望ましい。
【0029】これらのことから、実際には、波形信号S
Wの各部分の性質に応じて、スペクトル変換のためのブ
ロックの長さを選択的に切り換えることが行われる。な
お、このようなブロックの長さの選択的な切り換えを行
う場合、変換ウィンドウ関数TWもブロックの長さの選
択に応じて切り換えるようにする。例えば、図11
(B)に示すように、アタック部ATの近傍の部分を除
いた準定常的な信号FLからなるブロックに対しては長
い変換ウィンドウ関数(長変換ウィンドウ関数TWL)
を用い、また、アタック部ATの近傍の部分の短いブロ
ックに対しては短い変換ウィンドウ関数(短変換ウィン
ドウ関数TWS)を用いるように、選択的に切り換える
ことが行われる。
【0030】しかしながら、上述したように、スペクト
ル変換の際のブロックの長さを、波形信号の各部分の性
質(特性)に応じて選択的に切り換える方法を実際の装
置上で実現しようとすると、異なる長さのブロックでの
スペクトル変換に対応できるスペクトル変換装置を符号
化装置に設ける必要があり、また、復号化装置側にも、
異なる長さのブロックに対応できる逆スペクトル変換が
可能な逆スペクトル変換装置を設ける必要がある。
【0031】さらに、スペクトル変換の際のブロックの
長さを変えるようにすると、スペクトル変換によって得
られるスペクトル成分の数も、ブロックの長さに比例す
るようになり、これらスペクトル成分を例えば臨界帯域
毎にまとめて符号化しようとした場合には、各臨界帯域
毎に含まれるスペクトル成分の数もブロックの長さによ
って異なることになる。このため、その後の符号化の処
理や、さらに復号化の処理も煩雑になってしまう。
【0032】このように、スペクトル変換の際のブロッ
クの長さを可変する方法では、符号化装置と復号化装置
が両方とも複雑になってしまうという欠点がある。
【0033】このため、前述したDFTやDCT等によ
りスペクトル変換を行う場合において、スペクトル変換
の際のブロックの長さを十分な周波数分解能を確保でき
るような一定の長さに保ったまま、プリエコーの発生を
有効に防止できるようにするための方法として、例えば
特開昭61−201526号公報や特開昭63−702
3号公報にて既に開示されている技術が知られている。
【0034】これら特開昭61−201526号公報や
特開昭63−7023号公報には、符号化装置において
入力信号波形を複数サンプルデータからなるブロック毎
に切り出し、さらにこのブロックにウィンドウ関数を掛
けた後、アタック部を検出し、このアタック部の直前の
小振幅の波形信号(すなわち準定常的な信号)を増幅し
てから、DFTやDCT等を用いたスペクトル変換によ
ってスペクトル成分(実数データ)を得、これを符号化
する方法が開示されている。これに対応する復号化の際
には、復号化されたスペクトル成分に逆DFT(Invers
e DFT(IDFT)) や逆DCT(Inverse DCT(IDCT))
等による逆スペクトル変換を施してから、符号化の際に
行ったアタック部の直前の信号の増幅に対する補正処理
を施す。これにより、プリエコーの発生が防止されるよ
うになる。この方法を用いるとスペクトル変換されるブ
ロックの長さは、常に一定にすることができるため、符
号化装置と復号化装置の構成を簡単にすることができ
る。
【0035】このように、上記公報記載の技術によれ
ば、符号化時に行うアタック部の直前の小振幅信号に対
するゲイン制御処理と、復号化時に行う符号化の際のア
タック部の直前の信号に対して行われたゲイン制御に対
応するゲイン制御補正処理とによって、スペクトル変換
の際のブロックの長さを一定にしたままでプリエコーの
発生を防止することが可能となる。
【0036】また、例えば、特願平7−258655号
として、本出願人は、プリエコーだけでなく、ポストエ
コーの発生を防止する方法を、既に提案している。な
お、この提案においては、波形信号の波形要素のレベル
が急激に大きくなるアタック部を検出し、波形信号の波
形要素のレベルが急激に小さくなるリリース部を検出
し、少なくとも上記アタック部以前の波形要素とリリー
ス部の波形要素に対して、複数のゲイン制御量の中から
波形信号の特性に応じて適応的にゲイン制御量を選択
し、選択したゲイン制御量を用いて、少なくとも上記ア
タック部以前の波形要素とリリース部の波形要素に対し
てゲイン制御を行い、上記波形信号を複数の周波数成分
に変換し、上記波形信号から聴覚心理モデルに基づくマ
スキングレベルを求め、そのマスキングレベルを用いて
上記複数の周波数成分を符号化すると共に、上記ゲイン
制御のための制御情報を符号化するようにしている。
【0037】すなわち、この提案によれば、符号化時に
は、波形信号からアタック部とリリース部を検出し、ア
タック部以前の部分とリリース部の波形要素に対して
は、波形信号の特性に応じて適応的に選択したゲイン制
御量でゲイン制御を行ってから符号化し、復号化時に
は、符号化の際にゲイン制御された部分のゲイン制御補
正を行うようにしているため、波形信号を符号化および
復号化したときにアタック部以前の部分とリリース部に
発生する雑音のエネルギを、人間が知覚し難いレベルま
で低下させることができる。
【0038】
【発明が解決しようとする課題】しかしながら、上述し
たゲイン制御およびゲイン制御補正を利用してプリエコ
ーとポストエコーの発生を防止する先の提案の方法にお
いては、アタック部以前の部分とリリース部の波形要素
に対して、時間軸上の波形信号の特性に応じて単に適応
的にゲイン制御量を選択しているだけなので、人間の聴
覚特性に適応して効率的に符号化を行うことが困難であ
る課題がある。
【0039】このことを、例えば、上記プリエコーが発
生する波形信号の例として、図12(A)に示されてい
る波形信号SWのように、準定常的な信号FLの次にア
タック部ATが存在するようなものを例に挙げて説明す
る。この図12(A)の波形信号SWに対し、例えばア
タック部ATの直前の部分の波形要素とアタック部AT
の部分の波形要素から決定される図12(B)に示すゲ
イン制御関数GCに従って、アタック部ATの直前の部
分の信号成分(波形信号FL)に対するゲイン制御量
を、アタック部AT以降の部分のRa倍とするゲイン制
御を行うようにすると、実際には図12(C)に示され
ている波形信号SW11を符号化することになる。
【0040】一方、例えば図12(A)に示したような
波形信号FLの部分を、図12(D)に示すような、ア
タック部ATの直前と直後の係数が、それぞれ1または
0であるウィンドウ関数を用いて図12(A)の波形信
号SWから切り出した波形信号が図12(E)に示した
ような波形信号SW21であるとし、図12(A)に示
したようなアタック部AT以降の部分を、図12(F)
に示すような、アタック部ATの直前と直後の係数が、
それぞれ0または1であるウィンドウ関数を用いて切り
出した波形信号が図12(G)に示したような波形信号
SW22であるとする。
【0041】また、図12(E)の波形信号SW21を
スペクトル変換した各スペクトル成分に対して、聴覚心
理モデルを用いて求められたマスキングカーブが図13
(H)に点線で示すカーブMCaであるとし、図12
(G)の波形信号SW22をスペクトル変換した各スペ
クトル成分に対して、聴覚心理モデルを用いて求められ
たマスキングカーブが図13(J)に点線で示すカーブ
MCbであるとする。なお、図12(E)の波形信号S
W21には図12(B)に示したようなゲイン制御関数
GCがかけられるので、マスキングカーブもRa倍さ
れ、図13(H)に実線で示すマスキングカーブMCR
aとなる。
【0042】実際に符号化に用いる波形信号SW11を
スペクトル変換した各スペクトル成分に対するマスキン
グカーブについては、本出願人が上記特願平7−258
655号にて、既に提案しているように、図13(H)
に示すマスキングカーブMCRaと、図13(J)に示
すマスキングカーブMCbの最小値を選択した、図13
(K)に示すマスキングカーブMCcを用いるのが適切
である。
【0043】ここで、上記ゲイン制御量Raの代わり
に、Raより大きいゲイン制御量Rbでゲイン制御を行
うことを考える。この場合、波形信号SW21にゲイン
制御を施した波形信号をスペクトル変換した各スペクト
ル成分に対して、聴覚心理モデルを用いて求められたマ
スキングカーブが図14(L)の実線で示すカーブMC
Rbとなる。上記波形信号SW11をスペクトル変換し
た各スペクトル成分に対するマスキングカーブとして
は、図14(L)に示すマスキングカーブMCRbと、
図13(J)に示すマスキングカーブMCbの最小値を
選択した、図14(M)に示すマスキングカーブMCm
を用いるのが適切である。
【0044】図14(N)は、図13(K)と図14
(M)を重ねて描いたものである。実際に符号化される
各スペクトル成分はマスキングカーブよりも大きい部分
であり、スペクトル成分のマスキングカーブよりも大き
い部分が小さいほど、そのスペクトルを符号化する際に
必要なビット数は小さくなる。図14(N)において、
マスキングカーブMCcで各スペクトルを符号化する方
が、マスキングカーブMCmで各スペクトルを符号化す
るよりもビット数が多くなる。すなわちマスキングカー
ブMCcを用いる符号化は効率が悪いことが判る。
【0045】本発明は、このような状況に鑑みなされた
もので、聴覚心理モデルを適用してゲイン制御を行うこ
とによって、プリエコーとポストエコーの発生を有効に
防止でき、かつ、より効率的なゲイン制御による符号化
が可能な信号符号化方法および装置を提供することを目
的とする。
【0046】
【課題を解決するための手段】本発明の信号符号化方法
および装置は、波形信号の波形要素のレベルが急激に大
きくなるアタック部と急激に小さくなるリリース部を検
出し、上記アタック部およびリリース部の検出位置情報
を用いて波形信号から聴覚心理モデルに基づいたマスキ
ングレベルを求め、そのマスキングレベルを用いて複数
のゲイン制御量の中から適応的にゲイン制御量を選択
し、そのゲイン制御量を用いて、少なくともアタック部
以前の波形要素とリリース部の波形要素に対してゲイン
制御を行い、さらに、上記波形信号を複数の周波数成分
に変換し、ゲイン制御のための制御情報と上記複数の周
波数成分とを符号化することにより、上述の課題を解決
する。
【0047】すなわち、本発明においては、聴覚心理モ
デルに基づいたマスキングレベルから選択されたゲイン
制御を行うことで、プリエコーとポストエコーの発生を
防止すると共に、より効率的な符号化を行うようにして
いる。
【0048】
【発明の実施の形態】以下、本発明の好ましい構成例に
ついて、図面を参照しながら説明する。
【0049】図1には、本発明の信号符号化方法が適用
される第1の構成例の信号符号化装置を示している。
【0050】すなわち本発明の信号符号化装置は、端子
100より入力された入力信号を符号化ブロック毎に切
り出して変換ウィンドウ関数をかけるウィンドウ回路1
01を有している。ウィンドウ回路101の出力は、ウ
ィンドウによって切り出された波形信号のゲイン制御を
施すべき位置を決定するゲイン制御位置決定回路102
と、ゲイン制御関数に応じてゲイン制御処理を行うゲイ
ン制御回路103に入力されている。ゲイン制御位置決
定回路102の出力は、ゲイン制御位置に応じて長さの
変わる聴覚モデル用ブロック毎に、端子100より入力
される入力信号を切り出して変換ウィンドウ関数をかけ
る聴覚モデル用ウィンドウ回路108と、ゲイン制御位
置とマスキングレベルから最適なゲイン制御量とゲイン
制御関数を決定し、ゲイン制御量とマスキングレベルか
ら符号化ブロック用のマスキングレベルを計算するゲイ
ン制御量決定回路111に入力されている。聴覚モデル
用ウィンドウ回路108の出力は、聴覚モデル用ブロッ
ク毎に切り出された信号を、周波数成分に変換する聴覚
モデル用変換回路109に入力され、その出力は、周波
数成分に聴覚心理モデルを適用し、マスキングレベルを
算出する聴覚モデル適用回路110と、ゲイン制御量決
定回路111に供給されている。
【0051】ゲイン制御回路103によりゲイン制御さ
れた信号を周波数成分に変換する変換回路104の出力
は、周波数成分に正規化を施す正規化回路105と、符
号化ブロック用マスキングレベルを用いて、周波数成分
に変換された信号から量子化の精度を決定する量子化精
度決定回路112に供給されている。聴覚モデル適用回
路110の出力は、ゲイン制御量決定回路111に供給
され、その出力が、ゲイン制御回路103と量子化精度
決定回路112に供給されている。
【0052】正規化回路105により決定された精度で
正規化された周波数成分を量子化する量子化回路106
には、量子化精度決定回路112の出力が入力されてい
る。量子化回路106の出力は、符号列生成回路107
に入力され、そこにおいては、量子化された周波数成分
と正規化の際の正規化係数情報、および量子化精度情報
から符号列信号が生成される。
【0053】また、図1の装置にはまた、符号化装置に
より生成された符号列信号を、情報記録媒体としての光
ディスク116に記録するために、符号列生成回路10
7の出力に誤り検出訂正符号を付加するECCエンコー
ダ113、ECCエンコーダ113の出力を変調する変
調回路114、および、変調回路114の出力を光ディ
スク116に記録する記録ヘッド115とが設けられて
いる。
【0054】この図1の実施例においては、端子100
に例えばディジタルオーディオ信号等の音響信号(波形
信号)が供給される。この音響信号は、ウィンドウ回路
101に送られる。このウィンドウ回路101では、供
給された信号を、所定の周波数帯域に分割し、各帯域の
信号を一定の長さの符号化ブロック毎に切り出すと共
に、信号を相互に隣接する符号化ブロックでそれぞれオ
ーバーラップさせ、さらに各符号化ブロックに対して変
換ウィンドウ関数をかける。
【0055】ゲイン制御位置決定回路102は、ウィン
ドウ回路101で変換ウィンドウ関数がかけられた符号
化ブロック内にアタック部があるか否かを検出し、ま
た、リリース部があるか否かを検出する。そして検出し
たアタック部或いはリリース部に対応するゲイン制御位
置の決定を行う。ゲイン制御位置決定回路102はゲイ
ン制御位置情報を、聴覚モデル用ウィンドウ回路108
に送ると共に、ゲイン制御量決定回路111にも送る。
なお、ゲイン制御位置検出回路102からは、符号化ブ
ロック毎の信号成分の符号化ブロック内のアタック部や
リリース部の位置を示す位置情報の他、これらが存在す
ることを示すアタック/リリース部検出フラグも出力さ
れる。
【0056】一方、端子100に供給された音響信号
は、聴覚モデル用ウィンドウ回路108にも送られる。
聴覚モデル用ウィンドウ回路108では、ゲイン制御位
置決定回路102からのアタック/リリース部検出フラ
グを見て、アタック部およびリリース部の両方がないと
きには、供給された音響信号を、ウィンドウ回路101
の符号化ブロックと同一の長さの聴覚モデル用ブロック
毎に切り出すと共に、相互に隣接する聴覚モデル用ブロ
ックをそれぞれオーバーラップさせ、さらに各聴覚モデ
ル用ブロックに対して変換ウィンドウ関数をかける。な
お、このときは聴覚モデル用ウィンドウ回路108の出
力はウィンドウ回路101の出力と同一になるので、ウ
ィンドウ回路101の出力を聴覚モデル用ウィンドウ回
路108の出力としても良い。
【0057】また、聴覚モデル用ウィンドウ回路108
は、ゲイン制御位置決定回路102からのアタック/リ
リースフラグを見て、アタック部もしくはリリース部が
存在するときには、供給された音響信号を、ウィンドウ
回路101の符号化ブロックよりも短い聴覚モデル用ブ
ロック毎に切り出すと共に、相互に隣接する聴覚モデル
用ブロックをそれぞれオーバーラップさせ、さらに各聴
覚モデル用ブロックに対して変換ウィンドウ関数をかけ
る。
【0058】聴覚モデル用変換回路109は、聴覚モデ
ル用ウィンドウ回路108で変換ウィンドウ関数がかけ
られた聴覚モデル用ブロック毎の信号成分に対して、D
FTやDCT等のスペクトル変換を施す。このスペクト
ル変換は、変換回路104と同一手法による変換とする
ことが、符号化に沿った聴覚心理モデルの適用が可能と
なるため、より好ましい。このスペクトル変換により得
られたスペクトル成分は、聴覚モデル適用回路110に
送られる。
【0059】聴覚モデル適用回路110は、聴覚モデル
用変換回路109によって得られた信号周波数の個々の
スペクトル成分に対応する周波数毎、或いは信号周波数
を分割した帯域毎に、例えば最小可聴レベルや、供給さ
れたスペクトル成分からマスキング特性やラウドネス特
性を用いて求められるマスキングレベルを計算する。
【0060】ゲイン制御量決定回路111は、聴覚モデ
ル適用回路110より供給されたマスキングレベル、ゲ
イン制御位置決定回路102より供給されたゲイン制御
位置情報、および聴覚モデル用変換回路109から供給
されたスペクトル成分を用いて複数のゲイン制御量のそ
れぞれの値について、その符号化ブロック内における符
号化に必要となる総ビット数を計算し、最も総ビット数
の少なくなるゲイン制御量を見つけることで、最適なゲ
イン制御量およびゲイン制御関数を算出し、その結果を
ゲイン制御回路103に送る。さらにゲイン制御量決定
回路111は、ゲイン制御関数を用いてマスキングを変
換することにより、ゲイン制御を行ったときのスペクト
ル成分に対する適切な符号化ブロック用マスキングレベ
ルを計算し、その結果を量子化精度決定回路112に送
る。なお、符号化ブロック内にアタック部もしくはリリ
ース部が存在する場合のゲイン制御量決定回路111の
詳細な処理については後述する。
【0061】ゲイン制御回路103は、ウィンドウ回路
101で変換ウィンドウ関数がかけられた符号化ブロッ
ク毎の信号成分に対して、ゲイン制御量決定回路111
から供給されるゲイン制御関数を適用して、ブロック内
のアタック部以前の小振幅の信号(準定常的な信号)を
増幅するゲイン制御処理、或いはブロック内のリリース
部の信号を増幅するゲイン制御処理を行う。なお、ゲイ
ン制御回路103は、アタック部或いはリリース部がな
い場合には、その符号化ブロックの信号成分に対して信
号増幅の処理は行わない。ゲイン制御回路103より出
力された符号化ブロック毎の信号成分(波形要素)は、
変換回路104に送られる。
【0062】変換回路104は、供給された符号化ブロ
ック毎の信号成分に対して、DFTやDCT、MDCT
等のスペクトル変換を施し、さらに、このスペクトル変
換により得られたスペクトル成分を帯域毎にグループ化
する。ここで、スペクトル変換後のスペクトル成分を帯
域毎にグループ化する際の幅(すなわち帯域の幅)は、
例えば均一な帯域幅としたり、また例えば臨界帯域幅に
合わせるように不均一な帯域幅としたりすることができ
る。
【0063】正規化回路105は、変換回路104から
供給されたスペクトル成分の信号を所定の帯域毎に正規
化し、量子化回路106に送る。一方、量子化精度決定
回路112は、変換回路104から供給されるスペクト
ル成分と、ゲイン制御量決定回路111から供給される
符号化ブロック用マスキングレベル情報とを用いて、量
子化精度を決定して、この量子化精度情報を量子化回路
106に送る。
【0064】量子化回路106は、量子化精度決定回路
112によって計算された量子化精度に基づいて、正規
化回路105からの信号に対して量子化を施し、正規化
情報と量子化情報、さらに量子化された信号を、符号列
生成回路107に送る。
【0065】符号列生成回路107は、量子化回路10
6から供給された量子化された信号を、同時に供給され
る量子化情報に基づいて、符号列信号に変換する。な
お、この符号列生成回路107からの出力信号には、量
子化回路106によって量子化された信号に加え、正規
化回路105における正規化係数情報や量子化精度決定
回路112における量子化精度情報、さらには、符号化
ブロック内にアタック部やリリース部が存在することを
示すアタック/リリース部検出フラグとこれらの位置を
示す位置情報、ゲイン制御情報およびゲイン制御関数も
含まれている。
【0066】符号列生成回路107によって生成された
符号列信号は、ECCエンコーダ113に送られる。E
CCエンコーダ113は、符号列生成回路107から供
給される符号列信号に対して、誤り訂正符号を付加す
る。ECCエンコーダ113からの出力は、変調回路1
14によって、例えばいわゆる8−14変調などの変調
が施され、記録ヘッド115に供給される。この記録ヘ
ッド115は、変調回路114から入力された符号列を
ディスク116に記録する。ディスク116としは、例
えば光磁気ディスクや相変化ディスク等を用いることが
できる。また、ディスク116の代わりにICカード等
を用いることもできる。もちろん、変調信号をディスク
116に記録するのではなく、所定の伝送媒体に伝送す
るようにしてもよい。
【0067】図2は、図1に示した符号化装置により生
成され、ディスク116に記録された(或いは伝送媒体
に伝送された)符号列信号を、復号化してディジタルオ
ーディオ信号を復元する復号化装置の基本的な構成を示
す。
【0068】この図2に示す復号化装置は、情報記録媒
体としての光ディスク116に記録された符号列信号を
再生するための構成として、再生ヘッド201と、再生
ヘッド201の出力を復調する復調回路202と、復調
回路202の出力の誤り訂正を行うECCデコーダ20
3とを有している。この装置はまた、ECCデコーダ2
03の出力する符号列信号から量子化信号、量子化精度
情報、および正規化係数情報を取り出す符号列分離回路
204、得られた量子化信号、量子化精度情報、および
正規化係数情報から、信号成分を構成する信号成分構成
回路205、信号成分にゲイン制御補正処理を行うゲイ
ン制御補正回路206、並びにオーバーラップしている
隣接符号化ブロック毎の信号を合成して波形信号を再構
成して端子208から出力する隣接ブロック合成回路2
07とを有するものである。
【0069】この図2において、光ディスク116から
再生ヘッド201によって再生された信号は、復調回路
202に送られる。復調回路202は、再生ヘッド20
1によって光ディスク116から再生された信号が例え
ば8−14変調されているため、これを復調する。この
復調回路202からの出力信号は、ECCデコーダ20
3に送られる。このECCデコーダ203では、エラー
訂正が行われる。このエラー訂正された信号は、符号列
信号であり、この符号列信号が符号列分離回路204に
送られる。符号列信号は、量子化信号、正規化係数情
報、および量子化精度情報からなるものである。
【0070】符号列分離回路204は、供給された符号
列信号から、例えば図1で説明した量子化信号、正規化
係数情報、および量子化精度情報とを分離し、信号成分
構成回路205に送る。
【0071】この信号成分構成回路205は、量子化精
度情報を用いて量子化信号を逆量子化し、また正規化係
数情報を用いて正規化の解除を行う。さらに、この信号
成分構成回路205は、正規化の解除により得られた信
号に対して図1の符号化装置にて行われた周波数成分へ
の分解(すなわちスペクトル変換)に対応する再構成処
理(すなわち逆スペクトル変換)を施すことで、サンプ
ルデータを復元する。信号成分構成回路205からのサ
ンプルデータは、ゲイン制御補正回路206に送られ
る。
【0072】ゲイン制御補正回路206は、符号化ブロ
ック内にアタック部やリリース部が存在することを示す
アタック/リリース部検出フラグ、これらの位置を示す
位置情報、およびゲイン制御関数に基づいて、アタック
部以前の小振幅の準定常的な信号やリリース部の信号を
減衰するゲイン制御補正処理を行う。このゲイン制御補
正回路206におけるゲイン制御補正処理は、符号化時
に用いられたゲイン制御関数の逆数であるゲイン制御補
正関数を乗算する処理である。
【0073】このように、符号化時に増幅された信号を
減衰するようにすると、先の信号成分構成回路205に
おいて周波数領域から時間領域へ逆スペクトル変換した
段階で、符号化ブロック内に略均等に拡がっていた量子
化雑音のうち、アタック部の前後に発生した量子化雑音
は低いレベルに抑えられるようになる。このため、プリ
エコーやポストエコーによる聴感上の障害も抑制される
ことになる。一方、ゲイン制御補正回路206は、アタ
ック部やリリース部が存在せずに符号化時に増幅処理が
施されなかった符号化ブロックに対しては、その符号化
ブロック内の信号成分に対する信号減衰の処理は行わな
い。ゲイン制御補正回路206より出力された符号化ブ
ロック毎の信号成分は、隣接ブロック合成回路207に
送られる。
【0074】隣接ブロック合成回路207は、符号化ブ
ロック毎にオーバーラップした符号化ブロック内のサン
プル信号を、お互いに干渉させながら加え合わせること
により合成する処理を行う。これにより、隣接ブロック
合成回路207からは、合成された波形信号(デジタル
オーディオ信号)が出力される。ディジタルオーディオ
信号は、出力端子208から出力され、例えばアンプで
増幅された後に、スピーカやヘッドホン或いはイアホン
等の放音部に送られたり、音声ライン出力端子等から出
力されることになる。
【0075】次に、符号化ブロック内にアタック部もし
くはリリース部が存在するときのゲイン制御量決定回路
111の処理について説明する。
【0076】まず、ゲイン制御位置決定回路102にお
いては、プリエコーとポストエコーが発生する波形信号
に対して、アタック部を検出し、ゲイン制御を施すべき
位置の決定を行う。なお、符号化ブロック内のアタック
部AT内の検出の方法については、本出願人が、特願平
7−38266号にて既に提案している。さらに、本発
明では、聴覚心理モデルを用いて最適なゲイン制御を行
うために、聴覚モデル用に別個にウィンドウ回路を用い
て、マスキングレベル計算を行う。すなわち、通常のウ
ィンドウ回路101において分析する分析長、つまり、
符号化するためにオーバーラップして切り出される入力
信号の長さをLとすると、聴覚モデル用ウィンドウ回路
108では、分析長がL/2^n(nは自然数)の長さ
のウィンドウを用いて複数のエリアに分けて分析する。
【0077】図3(A)は、通常のウィンドウ回路10
1において入力信号にかける長さLのウィンドウの様子
を示し、図3(A)のW0,W1,W2は、それぞれオ
ーバーラップを持った各分析ブロック(符号化ブロッ
ク)を示している。例えば、このW1の部分を符号化す
るものとすると、聴覚モデル用ウィンドウ回路108で
は、図3(B)乃至(D)に示すように、分析長がL/
2,L/4,L/8といった長さのウィンドウをかけ、
以降の聴覚心理モデルを用いた計算は、個々のブロック
毎(聴覚モデル用ブロック毎)にそれぞれ行われる。す
なわち、例えば図3(B)は、分析長L/2のウィンド
ウをかけることで、聴覚モデルを3回に分割して分析す
ることを示している。同様に、図3(C)は、分析長L
/4のウィンドウをかけることで、聴覚モデルを7回に
分割して分析することを、また、図3(D)は、分析長
L/8のウィンドウをかけることで、聴覚モデルの分析
を15回に分割して行うことを示している。
【0078】聴覚モデル用変換回路109は、聴覚モデ
ル用ウィンドウ回路108において分割した聴覚モデル
用ブロックそれぞれに対してスペクトル変換を施す。聴
覚モデル用ウィンドウ回路108における分割が1/2
^n単位なのは、ここでのスペクトル変換を容易にする
ためである。
【0079】聴覚モデル適用回路110は、聴覚モデル
用変換回路109からのスペクトル成分に対して聴覚心
理モデルを適用する。すなわち、例えば、図4(A)に
示すように、準定常的な信号の次にアタック部ATが続
く入力信号SWを処理する場合を考える。このとき、図
4(C)のような分析長L/2のウィンドウをかけると
すると、聴覚モデル用変換回路109の出力として、例
えば図4(D)乃至(F)に示すように、それぞれm個
のスペクトルからなる3つのスペクトル分布が得られ
る。そこで、個々のスペクトル分布に対して最小可聴レ
ベルやマスキング特性、ラウドネス特性などの聴覚心理
モデルを適用し、それぞれの聴覚モデル用ブロックのマ
スキングレベルを計算すると、例えば図4(D)乃至
(F)の図中点線で示したようなマスキングカーブMC
d,MCe,MCfが得られる。
【0080】ゲイン制御量決定回路111では、ゲイン
制御位置決定回路102からのゲイン制御位置情報を用
いて、複数のパターンのゲイン制御量を変数と見立て
て、それぞれのゲイン制御量に対して、聴覚モデル用変
換回路109からのスペクトル成分と聴覚モデル適用回
路110からのマスキングカーブとを適用して符号化に
必要な総ビット数を計算し、最も総ビット数が少なくな
るゲイン制御量を選択することで複数のパターンのゲイ
ン制御量の中から最適なゲイン制御量を決定する。
【0081】すなわち、例えば、図4(A)のような入
力信号SWを用い、アタック部ATの直前の部分の信号
成分に対して、図4(B)のゲイン制御関数GCのよう
なゲイン制御量がRa倍のゲイン制御をかける場合を考
える。ただし、ゲイン制御量Raは変数である。このと
き、前述したように、聴覚モデル用変換回路109から
は、例えば図4(D)乃至(F)のような、それぞれm
個のスペクトルからなる3つのスペクトル分布が得ら
れ、聴覚モデル適用回路110からは、例えば図4
(D)乃至(F)の図中点線で示したようなマスキング
カーブMCd,MCe,MCfが得られる。
【0082】ここで、図4(D)乃至(F)のそれぞれ
m個あるスペクトルのk番目のスペクトルのレベルの絶
対値を、それぞれ、Sd(k),Se(k),Sf
(k)とし、図4(D)乃至(F)のk番目のスペクト
ルに対するマスキングレベルをそれぞれ、MCd
(k),MCe(k),MCf(k)とすると、例え
ば、図4(D)のk番目のスペクトルを符号化するのに
必要なビット数は、Sd(k)> MCd(k)のと
き、 log2(Sd(k)/MCd(k))[ビット] Sd(k)≦ MCd(k)のとき、 0 [ビット] となる。ただし、log2は2を底とする対数である。
ここで、簡単のために関数baf(a,b)を baf(a,b)= 0 ;a≦bのとき = log2(a/b) ;a>bのとき と定義すると、図4(D)のk番目のスペクトルを符号
化するのに必要なビット数はbaf(Sd(k),MC
d(k))となる。
【0083】聴覚モデル用ブロックのマスキングレベル
はまだゲイン制御されていないため、図4(D),
(E)においては、聴覚モデル用ブロックのマスキング
レベルは小さく、図4(F)においては、聴覚モデル用
ブロックのマスキングレベルは大きい。次に、聴覚モデ
ル用ブロックのマスキングレベルを、それぞれに対応す
る信号部分のゲイン制御関数の最小値分だけ増幅する。
例えば、図4(D)と(E)においてはマスキングレベ
ルがRa倍され、図4(F)においては1倍される。す
なわち、この倍率分だけ、符号化される信号のレベルが
ゲイン制御によって増幅されるので、聴覚モデル用ブロ
ックのマスキングカーブのレベルも同じ割合だけ増幅さ
せる。
【0084】図4(G)と(H)の図中点線で示した聴
覚モデル用ブロックのマスキングカーブMCg,MCh
は、図4(D)と(E)の聴覚モデル用ブロックのマス
キングカーブMCd,MCeを、それぞれゲイン制御分
だけそのレベルを持ち上げたものである。よって、図4
(F),(G),(H)の図中点線で示した3つのマス
キングカーブMCf,MCg,MChは、それぞれ聴覚
モデル用ブロック毎のマスキングレベルを表すから、符
号化ブロック全体の符号化ブロック用マスキングレベル
は、聴覚モデル用ブロックのマスキングレベルの最小値
を用いるのが適切である。これにより、図4(J)の図
中太い点線で示すような、図4(F),(G),(H)
の各マスキングカーブMCf,MCg,MChの最小値
をとる符号化ブロック用マスキングカーブMCjが得ら
れる。
【0085】ここで、k番目のスペクトルに対する符号
化ブロックのためのマスキングレベルをMCj(k)と
し、マスキングカーブMCgとMChのk番目のスペク
トルに対するマスキングレベルをそれぞれMCg
(k),MCh(k)とすれば、 MCj(k)= min(MCg(k),MCh(k),MCf(k)) = min(Ra・MCd(k),Ra・MCe(k), MCf(k)) と表すことができる。ここで、min(a,b,c)は
a,b,cのうちの最小の値を返す関数である。
【0086】次に、符号化ブロック全体のスペクトル成
分は、図1の変換回路104から得られるスペクトル成
分であるが、このスペクトル成分は、図1のウィンドウ
回路101によって符号化ブロックに切り出された信号
を、図1のゲイン制御回路103においてゲイン制御処
理を行ない、変換回路104で変換されたものであり、
ゲイン制御量の決定に際してゲイン制御量を変化させる
たびに同様の処理を繰り返す必要がある。勿論、このよ
うな繰り返し処理で得られるスペクトル成分を用いて必
要総ビット数の計算を行うことは可能であるが、一般的
に、変換回路104の処理は時間がかかるため、変調回
路104での処理を繰り返し行うことは負担が大きい。
そこで、本発明の構成例においては、この負担を軽くす
るために、ゲイン制御量決定回路111でスペクトルの
レベルを決定するのに、変換回路104から得られるス
ペクトルの代わりに、各聴覚モデル用ブロック毎のスペ
クトルを用いるようにする。そして、k番目のスペクト
ルのレベルの絶対値を、次式より求めるようにする。 Ra・Sd(k)+Ra・Se(k)+Sf(k)
【0087】従って、ゲイン制御量の総数がN個である
とし、そのうちのi番目のゲイン制御量をR(i)とす
ると、ゲイン制御量Ra=R(i)のときの符号化ブロ
ックにおける全スペクトルの符号化に必要とされる総ビ
ット数NB(i)は、次のようになる。
【数1】 ここで、 S(k,i)= R(i)・Sd(k)+R(i)・S
e(k)+Sf(k) MCj(k,i)=min(R(i)・MCd(k),
R(i)・MCe(k),MCf(k)) である。この計算をiが1からNになるまで繰り返し、
総ビット数NB(i)を最小とするR(i)を求めるこ
とにより、最適ゲイン制御量を決定することができる。
【0088】以上のゲイン制御量を求める例では、同一
符号化ブロック内にアタック部とアタック部以前の微小
信号部分がある場合を例としたが、同一符号化ブロック
内にアタック部とアタック部以前の微小信号部分以外
に、さらにリリース部がある場合には、それぞれ別個に
上記に述べた方法により計算を行えば良い。すなわち、
先ず、リリース部についてはゲイン制御がかかっていな
いものとして、アタック部とリリース部を含めてアタッ
ク部と見なし、アタック部とアタック部以前の微小信号
部分について上述した方法を適用し、アタック部以前の
微小信号部分についての最適ゲイン制御量を求める。次
に、アタック部以前の微小信号部分にはゲイン制御がか
かっていないものとして、アタック部以前の微小信号部
分とアタック部とをアタック部と見なし、アタック部と
リリース部について上述した方法を適用し、リリース部
の信号成分についての最適ゲイン制御量を求める。これ
によって、アタック部以前の微小信号部分とリリース部
のそれぞれの最適ゲイン制御量を求めることができる。
【0089】以上のようにして求めた最適ゲイン制御量
は、ゲイン制御位置情報をもとにゲイン制御関数に変換
され、ゲイン制御回路103へ送られる。また、最適ゲ
イン制御量における符号化ブロック用マスキングカーブ
が量子化精度決定回路112に送られ、そこにおいて、
変換回路104から供給されるスペクトル成分と、符号
化ブロック用マスキングレベルとを用いて量子化精度が
計算される。さらに、量子化回路106では、この量子
化精度情報を用いて、正規化回路105からの信号を量
子化する。
【0090】なお、符号化ブロックの聴覚モデル用ブロ
ックへの細分化は、細かく分けるほどゲイン制御による
聴覚心理モデルへの影響が小さくなるため、ゲイン制御
の分析長程度までマスキングの分割分析長を短くするの
が望ましい。ただし、細分化して分析長が短くなると、
それに比例して、マスキング分析の周波数分解能が落ち
るため、マスキングの分析に影響が出ない程度に細分化
するのが好ましい。
【0091】ところで、上述した図1の構成例の信号符
号化装置では、スペクトルを、オーバーラップした複数
の聴覚モデル用ブロックに分割し、各ブロック毎にマス
キングレベルを計算して符号化するようにしており、分
割した各聴覚モデル用ブロックのマスキングレベルを求
める際に、各聴覚モデル用ブロックにおけるゲイン制御
量を用いている。しかしながら、一般的に、ゲイン制御
レベルの切り替わる位置と聴覚モデル用ブロックの分割
位置は必ずしも一致するわけではない。そこで両者が一
致していない場合は、例えば、聴覚モデル用ブロックの
ゲイン制御量の最小値を用いている。従って、ゲイン制
御レベルの切り替わる位置によって最適なマスキングレ
ベルの変換を行うには、複雑な処理を行う必要がある。
【0092】また、符号化ブロックの分割数を増やして
聴覚モデル用ブロックの長さを短くすることにより、ゲ
イン制御レベルの切り替わる位置と聴覚モデル用ブロッ
クの分割位置が異なる可能性を低下させることができる
が、分割数を増やすとマスキング分析の周波数分解能が
落ちるため、分割数には限度がある。従って、上述した
第1の手法では上記2つの位置を一致させるには複雑な
処理が必要となる。
【0093】そこで、本発明の第2の信号符号化方法で
は、入力信号からゲイン制御位置に適応した聴覚モデル
分析用信号を生成し、この分析用信号からマスキングレ
ベルを計算し、そのマスキングレベルよりゲイン制御量
を決定することで、ゲイン制御位置に適応したゲイン制
御量を求めることを実現可能としている。
【0094】図5には、本発明の第2の信号符号化方法
が適用される信号符号化装置の概略構成を示している。
なお、この図5において、前述した図1と対応する各構
成要素には同一の符号を付しており、説明上必要な部分
を除いてそれらの説明は省略する。
【0095】すなわち本発明の第2の信号符号化装置で
は、前記図1の構成における聴覚モデル用ウィンドウ回
路108乃至ゲイン制御量決定回路111の代わりに、
入力信号から聴覚モデル分析用信号を生成する聴覚モデ
ル用波形生成回路118、聴覚モデル分析用信号を聴覚
モデル分析用周波数成分に変換する聴覚モデル用変換回
路119、聴覚モデル分析用周波数成分に聴覚心理モデ
ルを適用し、その分析結果であるマスキングレベルを出
力する聴覚モデル適用回路120、並びに、ゲイン制御
位置決定回路102から得られるゲイン制御位置情報、
聴覚心理モデル分析用周波数成分、およびマスキングレ
ベルから最適なゲイン制御量を決定するゲイン制御量決
定回路121とを備えてなるものである。その他の構成
は、図1における場合と同様である。
【0096】以下、図5の信号符号化装置について、主
に、図1と異なる部分の動作について説明する。
【0097】端子100に供給された音響信号は、ウィ
ンドウ回路101以降の構成に送られると共に、聴覚モ
デル用波形生成回路118にも送られる。また、聴覚モ
デル用波形生成回路118には、ゲイン制御位置決定回
路102により求められたゲイン制御位置情報も送られ
るようになっている。
【0098】この聴覚モデル用波形生成回路118は、
まず、端子100より供給された音響信号を、それぞれ
一定の長さのブロック毎に切り出すと共に、相互に隣接
するブロックをそれぞれオーバーラップさせ、さらに各
ブロックに対して変換ウィンドウ関数をかける。次に、
ゲイン制御回路102から送られたゲイン制御位置情報
を元に、聴覚モデル分析用の複数の波形信号を生成し
て、これらを個々に聴覚モデル用変換回路119に送
る。また、ゲイン制御回路102から送られたゲイン制
御位置情報が信号増幅の処理を行わないものだった場
合、聴覚モデル用波形生成回路118は、ブロック毎の
切り出し後に、変換ウィンドウ関数をかけ、そのまま聴
覚モデル用変換回路119に送る。なお、聴覚モデル用
波形生成回路118の詳細な処理については後述する。
【0099】聴覚モデル用変換回路119は、聴覚モデ
ル用波形生成回路118から送られる1或いは複数の聴
覚モデル分析用の信号波形に対して、変換回路104と
同一或いは異なる手法によってスペクトル変換を施す。
このスペクトル変換により得られたスペクトル成分は、
聴覚モデル適用回路120およびゲイン制御量決定回路
121に送られる。
【0100】聴覚モデル適用回路120は、聴覚モデル
用変換回路119から送られる1或いは複数のスペクト
ル成分に対して聴覚心理モデルを適用し、個々のスペク
トル成分それぞれに対して適切なマスキングレベルを計
算する。すなわち、聴覚モデル適用回路120において
は、例えば最小可聴レベルや供給されたスペクトル成分
からマスキング特性やラウドネス特性を用いて求めたマ
スキングレベルを、聴覚モデル用変換回路119によっ
て得られた信号周波数個々のスペクトル成分に対応する
周波数毎に計算する。このマスキングレベルの情報はゲ
イン制御量決定回路121に送られる。
【0101】ゲイン制御量決定回路121は、聴覚モデ
ル適用回路120から送られるマスキングレベルの情報
が複数の場合には、複数のマスキングレベル、聴覚モデ
ル用変換回路119から送られる複数のスペクトル成
分、およびゲイン制御位置決定回路102から送られた
ゲイン制御位置情報を用いて、複数のゲイン制御量のそ
れぞれの値についてスペクトルの符号化において必要と
なる総ビット数を計算し、最も総ビット数の少なくなる
ゲイン制御量を見つけることで最適なゲイン制御量およ
びゲイン制御関数を算出し、その結果をゲイン制御回路
103に送る。
【0102】さらにゲイン制御量決定回路121は、ゲ
イン制御関数を用いてマスキングを変換することによ
り、ゲイン制御を行ったときのスペクトル成分に対する
適切な符号化ブロック用マスキングレベルを計算し、そ
の結果を量子化精度決定回路112に送る。また、聴覚
モデル適用回路120から送られるマスキングレベルの
情報が1個の場合には、受け取ったマスキングレベルの
情報を符号化ブロック用マスキングレベルとしてそのま
ま量子化精度決定回路112へ送る。なお、ゲイン制御
量決定回路121の詳細な処理については後述する。
【0103】量子化精度決定回路112は、変換回路1
04から供給される各帯域のスペクトル成分と、ゲイン
制御量決定回路121から供給される符号化ブロック用
マスキングレベル情報とを用いて、量子化精度を決定し
て、この量子化精度情報を量子化回路106に送る。
【0104】この図5に示した符号化装置により生成さ
れ、情報記録媒体に記録或いは伝送媒体に伝送された符
号列信号を、復号化してディジタルオーディオ信号を復
元する復号化装置の基本的な構成は、前述の図2の構成
と同様であるため、その説明は省略する。
【0105】次に、聴覚モデル用波形生成回路118の
処理について説明する。
【0106】まず、ゲイン制御位置決定回路102にお
いては、前述の図1における場合と同様に、プリエコー
とポストエコーが発生する波形信号に対して、アタック
部の前後でゲイン制御を施すべき位置の決定を行う。
【0107】さらに、図5に示す本発明の構成では、聴
覚モデル用波形生成回路118は、ゲイン制御位置を参
照し、聴覚モデル分析用にゲイン制御レベル毎に波形信
号を作成するようなウィンドウをかけて分割し、個々の
波形信号毎にマスキングレベル計算を行う。
【0108】図5の入力端子100に、例えば図6
(A)に示すような波形信号SWが入力され、それに対
してゲイン制御位置決定回路102において、例えば図
6(B)に示すように、準定常的な信号のFL部分、ア
タック部分AT、およびリリース部分REの3つの部分
に分けて、それぞれについてゲイン制御を施すようにゲ
イン制御位置が決定されたとする。このとき聴覚モデル
用波形生成回路118は、まず入力信号からブロックを
切り出し、相互に隣接するブロックをオーバーラップさ
せて、変換ウィンドウ関数をかけ、図6(A)の波形信
号SWの信号成分を切り出させる。次にこの信号に対し
て、図6の(C1)乃至(C3)に示すような分割のウ
ィンドウ関数をかける。すなわち、ゲイン制御関数の変
化部分の位置とレベルの変化部分の位置が一致する分割
ウィンドウをかけて、FL部分、AT部分、およびRE
部分の波形成分をそれぞれ分割する。
【0109】この分割のウィンドウ関数のうち、例え
ば、FL部分を分割するウィンドウC1は、FL部はそ
のままで、FL部以外の部分、すなわちAT部分やRE
部分のレベルを0に抑えるものである。AT部分を分割
するウィンドウC2とRE部分を分割するウィンドウC
3も、それぞれ同様に、対応する部分以外の部分のレベ
ルを0に抑えるものである。またウィンドウのレベルの
変化点は、ゲイン制御関数のレベル変化点と一致するよ
うにする。すなわち、両者のレベルの変化開始位置と変
化終了位置が一致するようにする。その結果、図6
(A)の波形信号が、例えば図6(D)乃至(F)に示
すように、3つの波形信号SWd,SWe,SWfに分
割される。以上のように求めた複数の波形成分は、聴覚
モデル用変換回路119に送られる。
【0110】以上のように、分割ウィンドウをかけて聴
覚モデル用の分析信号をゲイン制御レベル毎に分割して
レベルを補正することにより、入力信号のゲイン制御レ
ベルの切り替わり位置に拘らず、各ゲイン制御位置それ
ぞれの信号におけるマスキングレベルの計算が可能とな
る。
【0111】次に、ゲイン制御量決定回路121の処理
について図7を用いて説明する。
【0112】まず、上述の聴覚モデル用変換回路119
においては、聴覚モデル用波形生成回路118において
得られた1或いは複数の波形信号それぞれに対してスペ
クトル変換を施して、聴覚モデル適用回路120および
ゲイン制御量決定回路121に送る。例えば、聴覚モデ
ル用変換回路119に、図7(A)乃至(C)に示すよ
うに、ゲイン制御レベル毎に3つに分割された波形信号
SWa,SWb,SWc(なお、これら波形信号は、図
6(D)乃至(F)に示した波形信号SWd,SWe,
SWfに対応する)が入力されると、図7(D)乃至
(F)に示すような、それぞれm個のスペクトル成分か
らなる3つのスペクトル分布が出力される。
【0113】聴覚モデル適用回路120は、聴覚モデル
用変換回路119から送られた1又は複数のスペクトル
成分に対して聴覚心理モデルを適用する。すなわち、例
えば、図7(D)乃至(F)のようなスペクトル分布が
得られたとすると、まずこれに対して聴覚心理モデルを
適用して、マスキングレベルを求める。この求めたマス
キングレベルから、例えば図7(D)乃至(F)の図中
点線で示すようなマスキングカーブMCd,MCe,M
Cfが得られる。
【0114】ゲイン制御量決定回路121は、聴覚モデ
ル用変換回路119から得られた1或いは複数のスペク
トル分布と、聴覚モデル適用回路120から得られた1
或いは複数のマスキングレベルを用いて、最適なゲイン
制御量とゲイン制御関数を決定し、これをゲイン制御回
路103へ送ると共に、符号化ブロックに適用すべき最
適な符号化ブロック用マスキングレベルを決定し、これ
を量子化精度決定回路112へ送る。
【0115】すなわち、それぞれm個のスペクトルから
なる図7(D)乃至(F)のような3つのスペクトル分
布のk番目のスペクトルのレベルの絶対値を、それぞれ
Sd(k),Se(k),Sf(k)とし、図7(D)
乃至(F)の図中点線で示される3つのマスキングカー
ブのk番目のスペクトルに対するマスキングレベルがそ
れぞれMCd(k),MCe(k),MCf(k)であ
るとすると、ゲイン制御量決定回路121ではまず、ア
タック部以前の微小信号部分、すなわち、例えば図7
(A)に示す信号SWaに施すべき最適なゲイン制御量
Raを、複数あるゲイン制御量の中から決定する。ここ
で、全部でN個あるゲイン制御量のうち、i番目のゲイ
ン制御量をR(i)とすると、ゲイン制御量がR(i)
のとき符号化ブロック内のスペクトルを符号化するのに
必要な総ビット数をNA(i)は、次のようになる。
【数2】 ここで、 S(k,i)= R(i)・Sd(k)+Se(k)+
Sf(k) MC(k,i)= min(R(i)・MCd(k),
MCe(k),MCf(k)) である。上記計算をiが1からNになるまで繰り返し、
総ビット数NA(i)を最小とするR(i)を求めるこ
とにより、図7(A)に示す信号SWaに施すべき最適
ゲイン制御量Raを決定することができる。
【0116】次に、リリース部、すなわち図7(C)に
示す信号SWcに施すべき最適なゲイン制御量Rrを決
定するためには、ゲイン制御量がR(i)のとき符号化
ブロック内のスペクトルを符号化するのに必要な総ビッ
ト数をNC(i)は、次のようなる。
【数3】 ここで、 S(k,i)= Sd(k)+Se(k)+R(i)・
Sf(k) MC(k,i)= min(MCd(k),MCe
(k),R(i)・MCf(k)) である。上記計算をiが1からNになるまで繰り返し、
総ビット数NC(i)を最小とするR(i)を求めるこ
とにより、図7(C)に示す信号SWcに施すべき最適
なゲイン制御量Rrを決定することができる。
【0117】このように決定されたゲイン制御量と、ゲ
イン制御位置決定回路102から得られるゲイン制御位
置情報とを用いてゲイン制御関数が計算され、ゲイン制
御回路103へ送られる。
【0118】さらに、ゲイン制御量決定回路121で
は、符号化ブロックに適用する符号化ブロック用マスキ
ングカーブの計算を行うために、決定された各ゲイン制
御レベルに対応して聴覚モデル適用回路120から得ら
れたマスキングレベルをゲイン制御レベル分だけ増幅す
る。すなわち、例えば図7(D)のマスキングカーブM
CdについてはRa倍、図7(E)のマスキングカーブ
MCeについては1倍、図7(F)のマスキングカーブ
MCfについてはRr倍の倍率で(図6(B)参照)、
それぞれマスキングレベルを増幅する。符号化ブロック
用マスキングレベルは、分割され、ゲイン制御量分増幅
されたマスキングレベルの最小値を用いるのが適切であ
るから、図7(G)に示すようにゲイン制御されて増幅
されたスペクトルに対しては、マスキングカーブRa・
MCd,MCe,Rr・MCfの最小値をとる図7
(G)の図中に太い点線で示すようなマスキングカーブ
MCgを用いるのが望ましい。
【0119】以上のようにして求めた符号化ブロック用
マスキングレベルは、量子化精度決定回路112に送ら
れ、ここで符号化ブロックの量子化精度を計算して、量
子化回路106において量子化される。すなわち、量子
化回路106において、聴覚心理モデルを適用した符号
化が可能となる。
【0120】以上のように、図5の構成例では、各ゲイ
ン制御位置毎のスペクトル成分でマスキングレベルを計
算し、スペクトル成分とマスキングレベルとを用いて符
号化ブロック内のスペクトル成分を符号化するのに必要
な総ビット数の最も少なくなるゲイン制御量を決定して
いるので、入力信号のゲイン制御レベルの切り替わり位
置に拘らず、適切なゲイン制御量の決定が可能となる。
【0121】ところで、上述した図1および図5の構成
例の信号符号化装置では、端子100に供給される信号
は全周波数帯域の信号である。しかし、一般にオーケス
トラの演奏におけるような音響信号等においては、例え
ば、ある楽器の演奏が小さくなっていくと同時にそれを
引き継ぐように、その楽器とはその占有する周波数帯域
の異なる別の楽器が演奏を始めるというように、周波数
帯域毎にその包絡線の時間的な変化が異なるような信号
となっていることがあるため、周波数帯域毎に異なる位
置および異なる量のゲイン制御を施すことが望ましいこ
とがある。しかし、上述した図1および図5の構成例で
は、このような周波数帯域毎に異なるゲイン制御を施す
ことはできない。
【0122】そこで、本発明の第3の信号符号化方法で
は、波形信号を帯域分割フィルタを用いて分割すること
により、各分割帯域毎に好ましいゲイン制御を施し、な
おかつ、各分割帯域毎に最適なゲイン制御量を決定する
ことを実現可能としている。
【0123】図8には、本発明の第3の信号符号化方法
が適用される信号符号化装置の概略構成を示している。
なお、この図8において、前述した図1および図5と対
応する各構成要素には同一の符号(但し、重複する構成
要素については識別のため指示符号にa,bの添え字を
付している)を付しており、必要な部分を除いてそれら
の説明は省略する。
【0124】すなわち図8に示す本発明の第3の信号符
号化装置は、図5の構成における符号列生成回路107
を除くすべての構成要素を2系統備え(その2系統の中
で対応する構成要素の符号には図5と同一の符号の後
に、a,bの添え字を付けることにより区別をしてい
る)、図5の構成におけるウィンドウ回路101の前段
に、帯域分割フィルタ801と、図5の構成における量
子化回路106の後段に、符号列生成回路802とを備
えるものである。
【0125】以下、図8の信号符号化装置について、主
に異なる部分の動作について説明する。
【0126】図8において、端子100には例えばデジ
タルオーディオ信号等の音響信号(波形信号)が供給さ
れる。この波形信号は、例えばポリフェーズ・クワドラ
チュア・フィルタなどが適用される帯域分割フィルタ8
01によって、例えば2つの帯域に分割される。帯域分
割フィルタ801によって2つの帯域に分割された各帯
域の波形信号は、それぞれウィンドウ回路101a,1
01bおよび聴覚モデル用波形生成回路118a,11
8bに送られる。なお、図8の例では、帯域分割フィル
タ801からは、入力信号を2つの帯域に分けて出力す
るようにしており、2つの帯域毎に好ましいゲイン制御
を施すことができるが、勿論帯域分割フィルタの帯域分
割数をもっと多くすることにより、もっと多くの帯域毎
に好ましいゲイン制御を施すことが可能である。
【0127】ウィンドウ回路101a,101bから量
子化回路106a,106bまでの処理、聴覚モデル用
波形生成回路118a,118bからゲイン制御量決定
回路121a,121bまでの処理、および量子化精度
決定回路112a,112bまでの処理は、図5の例と
同一なので、その説明は省略する。
【0128】符号列生成回路802は、量子化回路10
6a,106bから供給された各帯域の量子化された信
号を、同時に供給される量子化情報に基づいて、符号化
列に変換する。なお、この符号列生成回路802からの
出力信号には、量子化回路106a,106bによって
量子化された信号に加え、正規化回路105a,105
bにおける正規化係数情報、量子化精度決定回路112
a,112bにおける量子化精度情報、さらには、符号
化ブロック内にアタック部やリリース部が存在すること
を示すアタック/リリース部検出フラグ、これらの位置
を示す位置情報、ゲイン制御情報およびゲイン制御関数
なども含まれている。
【0129】ECCエンコーダ113からディスク11
6までの処理については図5の例と同一なので、その説
明は省略する。
【0130】次に、図9には図8に示した第3の符号化
装置により生成され、ディスク116に記録(或いは伝
送媒体に伝送)された符号列信号を、復号化してディジ
タルオーディオ信号を復元する復号化装置の基本的な構
成を示す。なお、この図9において、前述した図2と対
応する各構成要素には同一の符号(但し、重複する構成
要素については識別のため符号にa,bの添え字を付し
ている)を付しており、異なる部分を除いてそれらの説
明は省略する。
【0131】すなわち、図9においては、符号列分離回
路901は、ECCデコーダ203から供給される符号
列信号から、例えば図8で説明した2つの帯域に対応す
る各帯域毎の量子化信号、正規化係数情報、および量子
化精度情報を分離し、それぞれを信号成分構成回路20
5a,205bに送る。
【0132】波形信号合成回路902では、ゲイン制御
補正回路206a,206bから送られてくる各帯域毎
の信号を合成する処理を行う。これにより波形信号合成
回路902からは合成されたディジタルオーディオ信号
が出力される。
【0133】以上のように、入力された波形信号は周波
数帯域分割フィルタによって複数の周波数帯域に分割さ
れ、各周波数帯域毎のゲイン制御位置決定回路によって
各周波数帯域毎にゲイン制御位置が決定され、各周波数
帯域毎のゲイン制御量決定回路によって、各周波数帯域
毎に最適なゲイン制御量が決定されることで、例えば、
周波数帯域毎にその包絡線の時間的な変化が異なるよう
な信号に対しても、各周波数帯域毎に好ましい位置およ
び好ましい量のゲイン制御を施すことが可能となる。
【0134】以上、波形信号としてオーディオ信号を量
子化した場合における量子化雑音を目立たなくさせるゲ
イン制御におけるゲイン制御量の決定法に関して説明を
行なったが、本発明の方法は他の種類の信号の量子化雑
音の発生を目立たせなくする上でも有効であり、例えば
画像信号にも適用することが可能である。しかし、オー
ディオ信号におけるアタック部分でのプリエコーやポス
トエコーは、聴感上の大きな障害となるため、本発明を
オーディオ信号に適用することは非常に有効である。ま
た、本発明の方法は勿論多チャネルのオーディオ信号に
対しても適用可能である。
【0135】
【発明の効果】本発明によれば、アタック部とリリース
部を検出し、複数のゲイン制御量の中から波形信号の聴
覚心理モデルに基づいて求めたマスキングレベルに従っ
て適応的に選択したゲイン制御量を用いて、少なくとも
アタック部以前の波形要素とリリース部の波形要素に対
してゲイン制御を行うようにしているため、プリエコー
とポストエコーの発生が防止可能となる。また、本発明
では、ゲイン制御量を選択する際に符号化に要するビッ
ト数を最も少なくするようにしているため、効率的な符
号化が可能である。
【図面の簡単な説明】
【図1】本発明の信号符号化装置の第1の構成例の概略
構成を示すブロック図である。
【図2】本発明の信号復号化装置の第1および第2の構
成例の概略構成を示すブロック図である。
【図3】図1の聴覚モデル用ウィンドウ回路の処理技術
について説明するための図である。
【図4】図1の聴覚モデル適用回路の処理技術について
説明するための図である。
【図5】本発明の信号符号化装置の第2の構成例の概略
構成を示すブロック図である。
【図6】図5の聴覚モデル用波形生成回路の処理技術に
ついて説明するための図である。
【図7】図5の聴覚モデル適用回路の処理技術について
説明するための図である。
【図8】本発明の信号符号化装置の第3の構成例の概略
構成を示すブロック図である。
【図9】本発明の信号復号化装置の第3の構成例におけ
る概略構成を示すブロック図である。
【図10】変換符号化によってプリエコーが発生する動
作原理を説明するための図である。
【図11】プリエコーの発生を防止するための従来のウ
ィンドウ化処理技術について説明するための図である。
【図12】プリエコーの発生を防止するための従来のゲ
イン制御処理技術について説明するための図である。
【図13】プリエコーの発生を防止するための従来の処
理技術における聴覚心理モデルの状況を示す図である。
【図14】プリエコーの発生を防止するための従来の処
理技術における聴覚心理モデルの状況を示す図である。
【符号の説明】
101 ウィンドウ回路, 102 ゲイン制御位置決
定回路, 103 ゲイン制御回路, 104 変換回
路, 105 正規化回路, 106 量子化回路,
107,802 符号列生成回路, 108 聴覚モデ
ル用ウィンドウ回路, 109,119 聴覚モデル用
変換回路, 110,120 聴覚モデル適用回路,
111,121 ゲイン制御量決定回路, 112 量
子化精度決定回路, 113 ECCエンコーダ, 1
14 変調回路, 115 記録ヘッド, 116 デ
ィスク, 118 聴覚モデル用波形生成回路, 20
1再生ヘッド, 202 復調回路, 203 ECC
デコーダ, 204,901 符号列分離回路, 20
5 信号成分構成回路, 206 ゲイン制御補正回
路, 207 隣接ブロック合成回路, 801 帯域
分割フィルタ, 902 波形信号合成回路

Claims (18)

    【特許請求の範囲】
  1. 【請求項1】 波形信号の波形要素のレベルが急激に大
    きくなるアタック部を検出し、 上記波形信号の波形要素のレベルが急激に小さくなるリ
    リース部を検出し、 上記波形信号、並びに上記アタック部およびリリース部
    の検出位置情報を用いて聴覚心理モデルに基づくマスキ
    ングレベルを求め、 少なくとも上記マスキングレベルを用いて複数のゲイン
    制御量の中から適応的にゲイン制御量を選択し、 上記選択したゲイン制御量を用いて、少なくとも上記ア
    タック部以前の波形要素とリリース部の波形要素に対し
    てゲイン制御を行い、 上記ゲイン制御された波形信号を複数の周波数成分に変
    換し、 上記ゲイン制御のための制御情報と上記複数の周波数成
    分とを符号化することを特徴とする信号符号化方法。
  2. 【請求項2】 上記マスキングレベルは、上記波形信号
    をスペクトル変換して得た周波数成分より求めることを
    特徴とする請求項1記載の信号符号化方法。
  3. 【請求項3】 上記波形信号をオーバーラップした複数
    の分析エリアに分割し、 上記複数の分析エリアから上記マスキングレベルを求め
    ることを特徴とする請求項1記載の信号符号化方法。
  4. 【請求項4】 上記波形信号を検出したゲイン制御位置
    毎に複数の波形信号に分割し、 上記複数の分割波形信号から上記マスキングレベルを求
    めることを特徴とする請求項1記載の信号符号化方法。
  5. 【請求項5】 上記ゲイン制御量の選択において、複数
    のゲイン制御量の少なくとも一部について上記符号化に
    必要なビット数をそれぞれ計算し、 上記必要ビット数が最も小さくなるゲイン制御量を選択
    することを特徴とする請求項1記載の信号符号化方法。
  6. 【請求項6】 上記ビット数の計算には、上記波形信号
    にゲイン制御を施し、上記ゲイン制御が施された波形信
    号をスペクトル変換して得た周波数成分を用いることを
    特徴とする請求項5記載の信号符号化方法。
  7. 【請求項7】 上記ビット数の計算には、上記波形信号
    をオーバーラップした複数の分割エリアに分割し、上記
    複数の分析エリアから得られる複数の波形信号をそれぞ
    れスペクトル変換して得られた周波数成分を用いること
    を特徴とする請求項5記載の信号符号化方法。
  8. 【請求項8】 上記ビット数の計算には、上記波形信号
    を検出したゲイン制御位置毎に複数の波形信号に分割
    し、上記複数の分割波形信号をそれぞれスペクトル変換
    して得られた周波数成分を用いることを特徴とする請求
    項5記載の信号符号化方法。
  9. 【請求項9】 上記入力信号は音響信号であることを特
    徴とする請求項1記載の信号符号化方法。
  10. 【請求項10】 波形信号の波形要素のレベルが急激に
    大きくなるアタック部を検出するアタック部検出手段
    と、 波形信号の波形要素のレベルが急激に小さくなるリリー
    ス部を検出するリリース部検出手段と、 上記波形信号、並びに上記アタック部およびリリース部
    の検出位置情報を用いて聴覚心理モデルに基づくマスキ
    ングレベルを演算する演算手段と、 少なくとも上記マスキングレベルを用いて複数のゲイン
    制御量の中から適応的にゲイン制御量を選択する選択手
    段と、 上記選択したゲイン制御量を用いて、少なくとも上記ア
    タック部以前の波形要素とリリース部の波形要素に対し
    てゲイン制御を行うゲイン制御手段と、 上記ゲイン制御された波形信号を複数の周波数成分に変
    換する変換手段と、 上記ゲイン制御のための制御情報と上記複数の周波数成
    分を符号化する符号化手段とを有することを特徴とする
    信号符号化装置。
  11. 【請求項11】 上記マスキングレベルは、上記波形信
    号をスペクトル変換して得た周波数成分より求めること
    を特徴とする請求項10記載の信号符号化装置。
  12. 【請求項12】 上記波形信号をオーバーラップした複
    数の分析エリアに分割し、上記複数の分析エリアから上
    記マスキングレベルを求めることを特徴とする請求項1
    0記載の信号符号化装置。
  13. 【請求項13】 上記波形信号を検出したゲイン制御位
    置毎に複数の波形信号に分割し、上記複数の分割波形信
    号から上記マスキングレベルを求めることを特徴とする
    請求項10記載の信号符号化装置。
  14. 【請求項14】 上記ゲイン制御量の選択において、複
    数のゲイン制御量の少なくとも一部について上記符号化
    に必要なビット数をそれぞれ計算し、上記必要ビット数
    が最も小さくなるゲイン制御量を選択することを特徴と
    する請求項10記載の信号符号化装置。
  15. 【請求項15】 上記ビット数の計算には、上記波形信
    号にゲイン制御を施し、上記ゲイン制御が施された波形
    信号をスペクトル変換して得た周波数成分を用いること
    を特徴とする請求項14記載の信号符号化装置。
  16. 【請求項16】 上記ビット数の計算には、上記波形信
    号をオーバーラップした複数の分割エリアに分割し、上
    記複数の分析エリアから得られる複数の波形信号をそれ
    ぞれスペクトル変換して得られた周波数成分を用いるこ
    とを特徴とする請求項14記載の信号符号化装置。
  17. 【請求項17】 上記ビット数の計算には、上記波形信
    号を検出したゲイン制御位置毎に複数の波形信号に分割
    し、上記複数の分割波形信号をそれぞれスペクトル変換
    して得られた周波数成分を用いることを特徴とする請求
    項14記載の信号符号化装置。
  18. 【請求項18】 上記入力信号は音響信号であることを
    特徴とする請求項10記載の信号符号化装置。
JP8062966A 1996-03-19 1996-03-19 信号符号化方法および装置 Withdrawn JPH09261063A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP8062966A JPH09261063A (ja) 1996-03-19 1996-03-19 信号符号化方法および装置
US08/816,090 US5825320A (en) 1996-03-19 1997-03-13 Gain control method for audio encoding device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8062966A JPH09261063A (ja) 1996-03-19 1996-03-19 信号符号化方法および装置

Publications (1)

Publication Number Publication Date
JPH09261063A true JPH09261063A (ja) 1997-10-03

Family

ID=13215595

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8062966A Withdrawn JPH09261063A (ja) 1996-03-19 1996-03-19 信号符号化方法および装置

Country Status (1)

Country Link
JP (1) JPH09261063A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002103683A1 (fr) * 2001-06-15 2002-12-27 Sony Corporation Appareil et procede de codage
WO2011048798A1 (ja) * 2009-10-20 2011-04-28 パナソニック株式会社 符号化装置、復号化装置およびこれらの方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002103683A1 (fr) * 2001-06-15 2002-12-27 Sony Corporation Appareil et procede de codage
US6850179B2 (en) 2001-06-15 2005-02-01 Sony Corporation Encoding apparatus and encoding method
WO2011048798A1 (ja) * 2009-10-20 2011-04-28 パナソニック株式会社 符号化装置、復号化装置およびこれらの方法
CN102576539A (zh) * 2009-10-20 2012-07-11 松下电器产业株式会社 编码装置、解码装置及其方法
US8977546B2 (en) 2009-10-20 2015-03-10 Panasonic Intellectual Property Corporation Of America Encoding device, decoding device and method for both

Similar Documents

Publication Publication Date Title
US5825320A (en) Gain control method for audio encoding device
US10529347B2 (en) Methods, apparatus and systems for determining reconstructed audio signal
US5960390A (en) Coding method for using multi channel audio signals
KR100402189B1 (ko) 오디오신호압축방법
KR100550399B1 (ko) 다중 오디오 채널을 저 비트율로 부호화 및 복호화하기위한 장치와 그 방법
JP3186412B2 (ja) 情報符号化方法、情報復号化方法、及び情報伝送方法
JP3804968B2 (ja) 適応配分式符号化・復号装置及び方法
JP3134455B2 (ja) 高能率符号化装置及び方法
JP3278900B2 (ja) データ符号化装置及び方法
US6415251B1 (en) Subband coder or decoder band-limiting the overlap region between a processed subband and an adjacent non-processed one
WO1995021489A1 (fr) Methode et appareil de codage de donnees, methode et appareil de decodage de donnees, support d'enregistrement de donnees et mode de transmission de donnees
JPH06232761A (ja) 高能率符号化又は復号化方法及び装置
JPH08223049A (ja) 信号符号化方法及び装置、信号復号化方法及び装置、情報記録媒体並びに情報伝送方法
JP3557674B2 (ja) 高能率符号化方法及び装置
JPH06242797A (ja) 変換符号化装置のブロックサイズ決定法
JPH09101799A (ja) 信号符号化方法及び装置
JPH09261063A (ja) 信号符号化方法および装置
JP3263881B2 (ja) 情報符号化方法及び装置、情報復号化方法及び装置並びに情報記録媒体及び情報伝送方法
JP3341440B2 (ja) 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体
JPH09160593A (ja) 信号符号化方法及び装置
JPH11330974A (ja) エンコード方法、デコード方法、エンコード装置、デコード装置、ディジタル信号記録方法、ディジタル信号記録装置、記録媒体、ディジタル信号送信方法及びディジタル信号送信装置
JP3134383B2 (ja) ディジタルデータの高能率符号化方法及び装置
JPH07336231A (ja) 信号符号化方法及び装置、信号復号化方法及び装置、並びに記録媒体
JPH08237130A (ja) 信号符号化方法及び装置、並びに記録媒体
JPH07106977A (ja) 情報復号化装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20030603