JP2000151413A - オーディオ符号化における適応ダイナミック可変ビット割り当て方法 - Google Patents

オーディオ符号化における適応ダイナミック可変ビット割り当て方法

Info

Publication number
JP2000151413A
JP2000151413A JP10319074A JP31907498A JP2000151413A JP 2000151413 A JP2000151413 A JP 2000151413A JP 10319074 A JP10319074 A JP 10319074A JP 31907498 A JP31907498 A JP 31907498A JP 2000151413 A JP2000151413 A JP 2000151413A
Authority
JP
Japan
Prior art keywords
bits
unit
bit
peak energy
frequency component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10319074A
Other languages
English (en)
Inventor
Mei Shen Shen
メイ・シェン シェン
Hon Neo Sua
ホン・ネオ スア
Pen Tan Aa
ペン・タン アー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP10319074A priority Critical patent/JP2000151413A/ja
Publication of JP2000151413A publication Critical patent/JP2000151413A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 隣接するブロックにまたがるDCT型領域に
別の種類の冗長性が存在する。それは、それの以前の隣
接係数ブロックからの予測を使用することによって大幅
に除去または低減することができる。 【解決手段】 ブロックサンプリングを施した後、入力
画像は、8×8ブロックDCT変換に入力され、量子化
され、結果として得られた8×8DCT係数ブロックは
DCT領域予測を施され、異なった予測DCT係数ブロ
ックを形成する。これらの予測係数ブロックは、エント
ロピー符号化され、最もビット使用量が少ないそれらの
1つが選択され、これと同時に、指示ビットが割り付け
られる。最後に、元々の係数ブロックの代わりに、選択
された予測係数ブロックが、指示ビットとともに符号化
される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、オーディオ符号化
における適応ダイナミック可変ビット割り当て方法に関
し、オーディオ信号のディジタル符号化に使用すること
ができる。
【0002】
【従来の技術】サブバンド符号化および変換符号化の組
み合わせは、ミニディスク(MD)符号化およびISO
/IEC13818−3 MPEG2アドバンストオー
ディオ符号化(AAC)のような最近の応用分野におい
て広く使用されている。このような応用分野において優
れたオーディオ符号器システムを設計するためには、ダ
イナミックかつ適応性のあるビット割り当て方式はきわ
めて重要である。オーディオ信号を変換した後、周波数
成分のグループが周波数領域に配分される。通常、これ
らの周波数成分は、心理聴覚分析に基づいて多くのユニ
ットにグループ化される。周波数成分の量子化のために
ビットがそれぞれのユニットに割り当てられる。
【0003】オーディオ信号のフレームごとに総ビット
数は制限されているかまたは固定であるので、それぞれ
の周波数成分に割り当てられるビット数は良好な音質を
提供するために注意深く決定されなければならない。1
つのユニットの周波数成分ごとに同一ビット数すなわち
同一ワード長を使用するいくつかのオーディオ符号化方
式がある。例えば、図8に示されるように、1つのユニ
ットに64の周波数成分が存在し、3ビットがこのユニ
ットのそれぞれの周波数成分に割り当てられる。したが
って、使用される総ビット数は、3×64=192とな
る。
【0004】図9に示されるように状態が変化し、か
つ、固定長のビット割り当てがそのまま使用されるなら
ば、これらの64の周波数成分の中には多くのゼロ値が
存在するので多くのビットが無駄となる。図9に示され
るように、62のゼロ値と2つのゼロでない値が存在す
る。このような場合、可変長符号化によってゼロ値を有
するこれらの周波数成分に1ビットのみ割り当てられる
としても、使用される総ビット数は、62×1+2×3
=68となる。ユニットにおける周波数成分の配分は、
オーディオ入力とともに変化する。周波数成分は、その
時々で、一方のユニットにおいては他方のユニットより
も均一に配分される。ゆえに、固定ビット割り当てかま
たは可変ビット割り当てかを効果的に選択することが、
適応ダイナミックビット割り当てには必要である。
【0005】もし適応可変ビット割り当てが使用される
ならば、多くのビットを節約することができる。そのよ
うな柔軟性のあるビット割り当て方式は、音質を低下さ
せることなくより低いビットレートによる符号化を実現
することができる。きわめて低いビットレートによる符
号化を実現するには、完璧な適応ダイナミック可変ビッ
ト割り当て符号化方式を確立するための、効率的なビッ
ト割り当て、量子化ステップの決定、そして、使用可能
なビットの最も重要な周波数成分への割り当てなどが必
要となる。
【0006】
【発明が解決しようとする課題】ブロック符号化を用い
たオーディオ符号化における多くの既存のビット割り当
て方式では、周波数成分の大きさがユニット内で不均一
に配分されていても、このユニットのどの周波数成分の
符号化にも同じ数のビットがつねに割り当てられる。も
し情報を表現する高いエントロピーが存在する信号セグ
メントに同じ数のビットが割り当てられるならば、低い
符号化効率が発生する。例えば、ミニディスクシステム
で使用されるATRAC圧縮アルゴリズムにおいては、
固定された数のビットがユニットの周波数成分に割り当
てられる。このアルゴリズムの詳細については、199
2年9月にSONY社から発行された「MD syst
em description document(ミ
ニディスクシステム説明書)」の第10章から知ること
ができる。このアルゴリズムは、約5:1の圧縮比によ
ってCDに近い音質を達成するためのものである。した
がって、符号化ビットレートは約146Kbit/sで
あり、44.1KHzのサンプリングレートおよび16
ビットのサンプル深度(sample depth)で
1チャンネルステレオサウンドとして706Kbit/
sのオリジナルサウンドから圧縮される。
【0007】周波数成分は、一方のユニットにおいては
均一に配分されるが、他方のユニットにおいては均一に
配分されない場合があることが知られている。もしどの
周波数成分にも同じ数のビットがつねに割り当てられる
ならば、ハフマン可変長符号化(VLC符号化)のよう
な効率的なエントロピー符号化に比較して途方もなく大
きな冗長性をもたらすであろう。それとは逆に、もし可
変数のビットがつねに割り当てられるならば、周波数成
分がユニットに均一に配分されている場合、同様に、符
号化効率は減少するであろう。したがって、高い符号化
効率を達成するためには、固定数ビット割り当てまたは
可変数ビット割り当てのいずれを選択するかの適応性の
ある選択方式が望まれている。固定長符号化または可変
長符号化の概念に基づいてすべての使用可能なビットを
最も重要な周波数成分に的確に割り当てるためには、効
果的なフィードバックシステムが必要である。
【0008】
【課題を解決するための手段】例えば、30〜80Kb
its/sのきわめて低い符号化ビットレートで同じC
D音質を実現するためには、圧縮処理において冗長性が
相当に低減されなければならない。周波数領域における
周波数成分のユニットがMDCTのような変換によって
得られた後には、優れたビット割り当て方式を有する設
計が重要な段階となる。1つのオーディオフレームに存
在する周波数成分のユニットごとの判定基準に基づい
て、固定ビット割り当てと可変ビット割り当てとの間で
の適応性のある切り換えがなされる。すなわち、1つの
オーディオフレームの周波数成分からなるユニットそれ
ぞれにおいて、固定ビット割り当てかまたは可変ビット
割り当てのどちらを選択するかはそれぞれで異なっても
よい。あるいは、1つのオーディオフレームにおける周
波数成分のすべてのユニットに対する1つの判定基準に
基づいて、固定ビット割り当てと可変ビット割り当てと
の間で適応性のある切り換えがなされる。1つのオーデ
ィオフレームの周波数成分からなるユニットそれぞれに
おいては、固定ビット割り当てまたは可変ビット割り当
ての選択は、同じものが選択されなければならない。
【0009】固定ビット割り当てと仮定して初期要求ビ
ットレートが評価され、それに続いて、固定ビット割り
当ておよび可変ビット割り当ての両方を用いてビット割
り当てが続行される。固定ビット割り当ての場合の反復
ループにおいては、ワード長を増加させることによっ
て、ビット総使用量が次第に計算および更新される。こ
れに対して、可変ビット割り当ての場合の反復ループに
おいては、量子化ステップを増加させることによって、
余分のビットが計算され、ビット総使用量が次第に更新
される。本発明は、オーディオ符号化システムにおける
周波数成分の効率的な符号化のための完璧なビット割り
当て方式である。
【0010】周波数成分は、ハイブリッドサブバンドフ
ィルタリングとそれに続くMDCTのような変換から得
られる。心理聴覚分析に基づいて、周波数バンド全体が
多くの周波数ユニットに分割される。ユニットごとにピ
ークエネルギーが計算される。固定長ビット割り当てを
用いて初期要求ビットが評価され、その結果として、周
波数成分のユニットごとに初期固定ワード長が得られ
る。この初期固定ワード長から初期量子化ステップが得
られる。上述の初期量子化ステップをそれぞれのユニッ
トに適用することによって、実際のビット使用量に基づ
いて固定長割り当てまたは可変長割り当てのいずれかが
選択される。
【0011】ユニットごとにかまたはすべてのユニット
に対して固定長割り当てかまたは可変長割り当てかを指
示するフラグが復号器に伝送される。可変長割り当ての
場合には1つのフレームにただ1つのフラグが伝送され
る。使用可能ビットが、最も大きな残存ピークエネルギ
ーを有するユニットに継続的に割り当てられる。しかし
ながら、固定長ビット割り当ておよび可変長ビット割り
当てのいずれの場合にも割り当てられたビット数が総使
用可能ビット数を上回ることはできない。
【0012】固定長ビット割り当ての場合には、後に割
り当てられる増やされたビット数に応じて、ユニットご
とに初期量子化ステップが更新される。これに対して、
可変長ビット割り当ての場合には、増やされた量子化ス
テップを用いて可変長符号化(VLC符号化)から、ユ
ニットごとに余分なビット数が計算される。ユニットご
との最終的な量子化ステップが符号化され、フラグとと
もに復号器に送られる。
【0013】本発明による第1の観点は、オーディオ信
号を符号化するための適応ダイナミック可変ビット割り
当て方法であって、各フレームがオーディオチャンネル
ごとのいくつかのサンプルからなるフレームに入力オー
ディオデータを分割するステップと、前記フレームのい
くつかのサンプルにサブバンドフィルターのようなフィ
ルター処理を施すステップと、前記フレームの前記フィ
ルタリングされたサンプルを個々のバンドに分割するス
テップと、前記個々のバンドの前記フィルタリングされ
たサンプルに変形離散コサイン変換(MDCT)のよう
な変換を施して周波数成分を得るステップと、心理聴覚
モデルと同一音質を得るための最小限のビット使用量と
に基づいて、前記バンドに適応させて各周波数成分にビ
ットを割り当てるステップと、各周波数成分に割り当て
られたビット数に応じて量子化ステップを決定するステ
ップと、前記決定された量子化ステップを用いて各周波
数成分を量子化および正規化するステップと、前記量子
化された周波数成分を固定長符号化または可変長符号化
するステップと、符号化されたビットをビットストリー
ムにパッキングするステップと、を備えた方法である。
【0014】本発明による第2の観点は、各周波数成分
にビットを割り当てる第1の観点に記載の方法であっ
て、上記変換処理の後、より低い周波数成分から開始し
てより高い周波数成分までの周波数領域のバンド全体に
各前記バンドを配置するステップと、心理聴覚モデルに
基づいて、前記周波数バンド全体をいくつかのバンドユ
ニットに分割するステップと、各ユニットの周波数成分
のピーク値を検出し、オーディオ信号のダイナミックレ
ンジ内に一定間隔で配置される前記ユニットのスケール
ファクターを計算または選択するステップと、前記スケ
ールファクターから前記ユニットごとに初期ピークエネ
ルギーを得るステップと、前記ユニットごとの心理聴覚
静寂しきい値を用いて、有効バンド幅を計算して前記初
期ピークエネルギーを調整するステップと、残存ビット
数と符号化されるべき周波数成分の残存数とをフィード
バックすることによって、まず最初に固定ワード長を前
記有効バンドに割り当てるステップと、前記ワード長を
前記ユニットごとに使用される初期量子化ステップに変
換するステップと、前記初期量子化ステップを用いて可
変ビット符号化かまたは固定ビット符号化かを前記ユニ
ットごとに決定し、それぞれの対応するユニットを符号
化するステップと、を備えた方法である。
【0015】本発明による第3の観点は、前記初期量子
化ステップを用いて可変ビット符号化かまたは固定ビッ
ト符号化かを前記ユニットごとに決定してそれぞれの対
応するユニットを符号化する第2の観点に記載の方法で
あって、前記初期量子化ステップと、上記スケールファ
クターとを用いて、各前記ユニットの各周波数成分を量
子化および正規化するステップと、 a)固定長符号テーブルを参照して同じユニットの周波
数成分ごとに固定ビット割り当て、あるいは、 b)可変長符号テーブルを参照して同じユニットの周波
数成分ごとに可変ビット割り当て、をなす2つの場合に
おいて使用される総ビット数を計算するステップと、前
記周波数バンド全体または各ユニットを符号化するのに
ビット使用量が最小限となる状態を選択することによっ
て、可変長符号化かまたは固定長符号化かを比較および
決定するステップと、現在のオーディオフレームまたは
現在のユニットに対して可変長符号化または固定長符号
化のどちらが選択されたかを指示するフラグを復号器に
送るステップと、を備えた方法である。
【0016】本発明による第4の観点は、第3の観点に
おいて決定がなされた後、すべての使用可能ビットが使
い尽くされるまで、可変ビット符号化かまたは固定ビッ
ト符号化を使用して各前記ユニットの各周波数成分を符
号化する方法であって、 a)もしフラグが固定ビット符号化に設定されていれ
ば、前記初期量子化ステップに基づいて、固定ビット割
り当てに使用されるべき総ビット数を得るステップと、
総使用可能ビット数から前記総ビット数を引き算するこ
とによって、残存ビット数を計算するステップと、残存
ビットをより高いピークエネルギーレベルを有するユニ
ットに割り当てるためのループを設定するステップと、
より高いピークエネルギーレベルを有するユニットに対
して前記最後のステップで割り当てられたビット数に応
じて前記ワード長を増やすステップと、前記ワード長を
それの対応する量子化ステップに変換するステップと、
前記最後のステップで得られた最終的な量子化ステップ
を符号化して復号器に送出するステップと、を備え、 b)もしフラグが可変ビット符号化に設定されていれ
ば、前記初期量子化ステップに基づいて、可変ビット割
り当てに使用されるべき総ビット数を得るステップと、
総使用可能ビット数から前記総ビット数を引き算するこ
とによって、残存ビット数を計算するステップと、残存
ビットをより高いピークエネルギーを有するユニットに
割り当てるためのループを設定するステップと、最も高
いピークエネルギーを有する前記ユニットに対する前記
初期量子化ステップを増やすステップと、前記増やされ
た量子化ステップを用いて前記ユニットを符号化するの
に必要な余分のビット数を計算するステップと、すべて
の残存ビットが使い尽くされるまで、前記余分なビット
数を引き算することによって総残存ビット数を更新する
ステップと、得られた最終的な増加量子化ステップを符
号化して復号器に送出するステップと、を備えた方法で
ある。
【0017】本発明による第5の観点は、前記ユニット
ごとの心理聴覚静寂しきい値を用いて、有効バンド幅を
計算して前記ピークエネルギーを調整する第2の観点に
記載の方法であって、もしユニットに対する前記スケー
ルファクターがゼロでなければ、そのユニットごとに得
られた前記初期ピークエネルギーから静寂しきい値を引
き算することによって、前記ピークエネルギーを調整す
るステップと、ゼロよりも小さい調整されたピークエネ
ルギーの数を計算するステップと、もし前記ゼロよりも
小さい調整されたピークエネルギーの数が所定の値を越
えていれば、前記静寂しきい値をあるレベルにシフトダ
ウンさせるステップと、前記初期ピークエネルギーから
新しい静寂しきい値を引き算することによって、ピーク
エネルギーを再調整するステップと、更新されたピーク
エネルギーを用いてバンド幅を計算するステップと、を
備えた方法である。
【0018】本発明による第6の観点は、残存ビット数
と周波数成分の残存数とをフィードバックすることによ
って、まず最初に固定ワード長を前記有効バンドに割り
当てる第2の観点に記載の方法であって、有効バンド幅
内のユニットごとに平均ピークエネルギーを計算するス
テップと、ビットを割り当てられなければならない周波
数成分の総数を計算するステップと、前記平均ピークエ
ネルギーに対するピークエネルギーの比をユニットごと
に計算するステップと、総使用可能ビット数から割り当
てられたビット数を引き算することによって残存ビット
数を更新するステップと、符号化されるべき前記周波数
成分の総数からこれまでに符号化された周波数成分の数
を引き算することによって周波数成分の残存数を更新す
るステップと、これまでの前記残存ビット数と前記周波
数成分の残存数とに基づいて、現在のユニットに使用さ
れるべきビット数を評価するステップと、前記ステップ
で評価された前記ビット数に前記比を重み付けすること
によって、ワード長を得るステップと、使用されたビッ
トの総数と符号化された周波数成分の数とを更新するス
テップと、を備えた方法である。
【0019】本発明による第7の観点は、前記ワード長
を前記ユニットごとに使用される量子化ステップに変換
する第2の観点に記載の方法であって、前記ワード長情
報が周波数成分のダイナミックレンジを決定し、それに
対して、量子化ステップそのものが周波数成分のダイナ
ミックレンジを表現する方法である。
【0020】
【発明の実施の形態】以下、図1から図7を参照して本
発明の好ましい実施の形態を説明する。図1には、ハイ
ブリッドオーディオ符号化に一般的に使用されるオーデ
ィオ符号器が示され、このオーディオ符号器は、サブバ
ンドフィルター部11、MDCTのような変換部12、
適応ダイナミック可変ビット割り当て部13、周波数成
分ごとの量子化および正規化部14、および、ビットス
トリームパッキング部15からなる。
【0021】例えば、図1において、サブバンドフィル
タリングの後、様々な周波数レンジに対応して、周波数
成分がMDCTによって形成および変換される。周波数
成分の配分に基づいてビット割り当てがなされる。そし
て、それぞれの周波数成分は、Qstepという量子化
ステップ、そして、適応ダイナミック可変ビット割り当
て部13から出力されるスケールファクターを使用する
ことによって量子化および正規化される。次に、ビット
ストリームパッキング部15において、すべての符号化
されたデータは、例えば、Qstep、scale f
actor、そして、いくつかのフラグのような他のサ
イド情報とともに、ビットストリームにパックされる。
【0022】図2は、ハイブリッドオーディオ復号器シ
ステムの概略的なブロック構成図である。入力オーディ
オビットストリームは、まず最初に、ビットストリーム
アンパッキング部21によって処理される。アンパック
されたcoded data、そして、Flagおよび
Qstepなどのその他のサイド情報は、逆量子化部2
2に送られる。そして、逆量子化された周波数成分は、
IMDCTすなわち逆MDCT部23に送られる。最後
に、サブバンドフィルター部24を通過した後、オーデ
ィオ信号が再生される。
【0023】図3には、図1に示す適応ダイナミック可
変ビット割り当て部13のより詳細な内容を示すフロー
チャートである。ステップ31において、図1のブロッ
ク12によるMDCTの後の周波数成分に関する情報に
基づいて、固定ワード長符号化と仮定することによって
初期要求ビット数が評価される。ステップ32におい
て、ステップ31において生成された初期量子化ステッ
プに従って、固定長符号化かまたは可変長符号化の選択
がなされる。ここで、選択は、ユニットごとに異なった
選択がなされてもよく、あるいは、1つのオーディオフ
レームにおけるすべてのユニットに対して同じ選択がな
されてもよい。異なるユニットに対して選択が異なる場
合には、ユニットごとのフラグを復号器に伝送すること
が必要となるが、1つのオーディオフレームにおけるす
べてのユニットに対して選択が同じ場合には、すべての
ユニットに対してただ1つのフラグだけでよい。
【0024】もし固定長符号化が選択されたならば、ス
テップ33において、固定ビット割り当て方式が続行さ
れ、もしそうでなければ、ステップ34において、可変
ビット割り当て方式が続行される。ステップ36におい
て、ユニットのそれぞれの周波数成分は、ステップ35
から出力された最終的な量子化ステップを用いて量子化
される。最後に、ステップ37において、これらの量子
化された周波数成分は、固定長符号化かまたは可変長符
号化を用いて符号化される。
【0025】図3のステップ31の動作が、図4におい
てさらに詳細に説明される。ステップ41において、す
べてのユニットにおける周波数成分のピーク値が探索お
よび計算される。それと同時に、ユニットごとのスケー
ルファクターおよび初期ピークエネルギーがそれのピー
ク値から計算される。ステップ42において、効率的な
バンド幅が計算され、心理聴覚による静寂しきい値(q
uiet threshold)に基づいて初期ピーク
エネルギーが調整される。ステップ43において、もし
ゼロ値を有する多くのピークエネルギーが存在するなら
ば、バンド幅および初期ピークエネルギーの再調整がな
される。ゼロピークエネルギーの数を決定するために
は、所定のしきい値が使用される。
【0026】ステップ44において、すべてのユニット
について平均ピークエネルギーが計算され、符号化され
るべき周波数成分の総数が得られる。それと同時に、初
期残存使用可能ビット数が得られ、さらに、符号化され
るべき周波数成分の残存数が得られる。
【0027】ステップ45において、ステップ44で得
られた現在のユニットのピークエネルギーおよび情報に
基づいて、現在のユニットに割り当てられるべき平均ビ
ット数が評価される。それは図4の式で表される。 Num bit est=(P energy/P e
nergy ave)×(num bit sofar
/num fre sofar)
【0028】ここで、Num bit estは、ユニ
ットごとの評価されたビット数であり、P energ
yは、現在のユニットのピークエネルギーであり、P
energy aveは、現在のフレームにおけるすべ
ての有効ユニットの平均ピークエネルギーであり、nu
m bit sofarは、更新された残存ビット数で
あり、num fre sofarは、更新された周波
数成分の残存数である。ステップ46において、残存ビ
ット数および残存周波数成分数が更新される。最後に、
ステップ47において、評価されたビット数が初期量子
化ステップに変換される。
【0029】図3のステップ32の動作が、図5におい
てさらに詳細に説明される。このステップは、固定ビッ
ト割り当てかまたは可変ビット割り当てのどちらかを選
択する。ステップ51において、初期固定ビット割り当
ての場合の評価された総ビット数が得られる。可変ビッ
ト割り当ての場合には、総ビット数は、ステップ54に
おいて、以下のステップを用いて計算することができ
る。
【0030】−−ステップ52において、図4から得ら
れた初期量子化ステップを用いてユニットの各周波数成
分を量子化する。 −−ステップ53において、VLCハフマン符号化を用
いて、量子化された周波数成分を符号化する。
【0031】ステップ55において、Total Us
edBits VLCをTotalUsedBits
Fixと比較することによって選択がなされる。ステッ
プ56および57に示されるように、もしTotal
UsedBits VLCがより小さければ、Vari
able Bit Flagに1がセットされ、もしそ
うでなければ、Fixed Bit Flagに1がセ
ットされる。固定ビット割り当ての詳細な動作が図6に
示される。これは、Fixed Bit Flag=1
の場合に残存ビットをユニットに割り当てる手順を説明
する。
【0032】ステップ61において、ここではBank
によって表現される総使用可能ビット数および初期固定
ビット割り当てに使用された総ビット数に基づいて、残
存ビット数が計算される。ステップ62において、最も
大きなピークエネルギーを有するユニットが探索および
検出される。ステップ63において、このユニットに割
り当てられるべきビット数を増加させる。ステップ64
において、このユニットのピークエネルギーが、あるレ
ベルに減少させることによって更新される。
【0033】ステップ65において、使用された総ビッ
ト数が更新され、必然的に、残存ビット数もまた更新さ
れる。ステップ66に示されるように、もし残存ビット
数が、0または1またはその他の小さい数よりも大きけ
れば、残存ビット数が0になるかまたはきわめて小さい
値になってしまうまでこのループが反復される。最後
に、ステップ67において、割り当てられたビット数が
最終的な量子化ステップに変換される。可変ビット割り
当ての詳細な動作が図7に示され、Variable
BitFlag=1の場合に、残存ビットのユニットへ
の割り当てがどのようにして続行されるかを説明する。
ステップ71において、ここではBankで表現される
総使用可能ビット数および図5においてVLCハフマン
符号化によって得られた使用された総ビット数に基づい
て、残存使用可能ビット数が計算される。
【0034】ステップ72において、最も大きなピーク
エネルギーを有するユニットが探索および検出される。
ステップ73において、このユニットに対して、量子化
ステップが増やされる。なぜなら、量子化ステップが大
きければ大きいほど、量子化された周波数成分のダイナ
ミックレンジも大きくなるからである。ステップ74に
おいて、新しい量子化ステップを用いて、このユニット
の各周波数成分が量子化される。そして、ステップ75
において、量子化された周波数成分は、VLCハフマン
符号化を用いて符号化される。ステップ76において、
新しい量子化ステップに基づいて、このユニットに対す
る余分のビット数が計算される。ステップ77におい
て、このユニットに対するピークエネルギーが、あるレ
ベルに減少させることによって更新される。最後に、ス
テップ78において、使用された総ビット数が更新さ
れ、残存ビット数もまた更新される。
【0035】ステップ79において、もし残存ビット数
が0または1またはある小さい数よりも大きければ、残
存ビット数が0になるかまたはきわめて小さい値になる
まで反復処理が繰り返される。最後に、ステップ710
において、最終的な量子化ステップが出力される。
【0036】
【発明の効果】本発明は、周波数領域において量子化さ
れた周波数成分の冗長性を低減または除去するのにきわ
めて有効である。可変長ビット割り当てと固定長ビット
割り当てとの間での適応性のある切り換え、最終的な量
子化ステップを調整するための実際のビット使用量から
の正確なダイナミックフィードバックシステム、そし
て、すべての使用可能なビットを最大限に利用するため
の短い反復ループを用いた技術が開示された。単なる固
定ビット割り当て方式に比較すれば、本発明は、符号化
効率を大きく改善することができる。さらに、本発明
は、可変長符号化が可能でありさえすれば、一般的なオ
ーディオ符号化のための完璧で効率的なビット割り当て
方式を提供する。
【図面の簡単な説明】
【図1】 ハイブリッドオーディオ符号器の概略ブロッ
ク図。
【図2】 ハイブリッドオーディオ復号器の概略ブロッ
ク図。
【図3】 適応ダイナミック可変ビット割り当ての概略
フローチャート。
【図4】 固定ビット割り当ての初期評価の詳細なフロ
ーチャート。
【図5】 可変ビット割り当てかまたは固定ビット割り
当てを選択する動作の詳細なフローチャート。
【図6】 固定ビット割り当ての場合のビット割り当て
の続行の詳細なフローチャート。
【図7】 可変ビット割り当ての場合のビット割り当て
の続行の詳細なフローチャート。
【図8】 ユニットに均一に分散した周波数成分の例を
示すグラフ。
【図9】 ユニットに不均一に分散した周波数成分の例
を示すグラフ。
【符号の説明】
11…サブバンドフィルター部 12…変換部 13…適応ダイナミック可変ビット割り当て部 14…周波数成分ごとの量子化および正規化部 15…ビットストリームパッキング部 21…ビットストリームアンパッキング部 22…逆量子化部 23…逆MDCT部 24…サブバンドフィルター部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 スア ホン・ネオ シンガポール534415シンガポール、タイ・ セン・アベニュー、ブロック1022、04− 3530番、タイ・セン・インダストリアル・ エステイト、パナソニック・シンガポール 研究所株式会社内 (72)発明者 アー ペン・タン シンガポール534415シンガポール、タイ・ セン・アベニュー、ブロック1022、04− 3530番、タイ・セン・インダストリアル・ エステイト、パナソニック・シンガポール 研究所株式会社内 Fターム(参考) 5D045 DA20 5J064 AA00 BA09 BA13 BA16 BB03 BC01 BC11 BC17 BC18 BD03

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 オーディオ信号を符号化するための適応
    ダイナミック可変ビット割り当て方法であって、 各フレームがオーディオチャンネルごとのいくつかのサ
    ンプルからなるフレームに入力オーディオデータを分割
    するステップと、 前記フレームのいくつかのサンプルにサブバンドフィル
    ターのようなフィルター処理を施すステップと、 前記フレームの前記フィルタリングされたサンプルを個
    々のバンドに分割するステップと、 前記個々のバンドの前記フィルタリングされたサンプル
    に変形離散コサイン変換(MDCT)のような変換を施
    して周波数成分を得るステップと、 心理聴覚モデルと同一音質を得るための最小限のビット
    使用量とに基づいて、前記バンドに適応させて各周波数
    成分にビットを割り当てるステップと、 各周波数成分に割り当てられたビット数に応じて量子化
    ステップを決定するステップと、 前記決定された量子化ステップを用いて各周波数成分を
    量子化および正規化するステップと、 前記量子化された周波数成分を固定長符号化または可変
    長符号化するステップと、 符号化されたビットをビットストリームにパッキングす
    るステップと、 を備えた方法。
  2. 【請求項2】 各周波数成分にビットを割り当てる請
    求項1に記載の方法であって、 上記変換処理の後、より低い周波数成分から開始してよ
    り高い周波数成分までの周波数領域のバンド全体に各前
    記バンドを配置するステップと、 心理聴覚モデルに基づいて、前記周波数バンド全体をい
    くつかのバンドユニットに分割するステップと、 各ユニットの周波数成分のピーク値を検出し、オーディ
    オ信号のダイナミックレンジ内に一定間隔で配置される
    前記ユニットのスケールファクターを計算または選択す
    るステップと、 前記スケールファクターから前記ユニットごとに初期ピ
    ークエネルギーを得るステップと、 前記ユニットごとの心理聴覚静寂しきい値を用いて、有
    効バンド幅を計算して前記初期ピークエネルギーを調整
    するステップと、 残存ビット数と符号化されるべき周波数成分の残存数と
    をフィードバックすることによって、まず最初に固定ワ
    ード長を前記有効バンドに割り当てるステップと、 前記ワード長を前記ユニットごとに使用される初期量子
    化ステップに変換するステップと、 前記初期量子化ステップを用いて可変ビット符号化かま
    たは固定ビット符号化かを前記ユニットごとに決定し、
    それぞれの対応するユニットを符号化するステップと、 を備えた方法。
  3. 【請求項3】 前記初期量子化ステップを用いて可変
    ビット符号化かまたは固定ビット符号化かを前記ユニッ
    トごとに決定してそれぞれの対応するユニットを符号化
    する請求項2に記載の方法であって、 前記初期量子化ステップと上記スケールファクターとを
    用いて、各前記ユニットの各周波数成分を量子化および
    正規化するステップと、 a)固定長符号テーブルを参照して同じユニットの周波
    数成分ごとに固定ビット割り当て、あるいは、 b)可変長符号テーブルを参照して同じユニットの周波
    数成分ごとに可変ビット割り当て、 をなす2つの場合において使用される総ビット数を計算
    するステップと、 前記周波数バンド全体または各ユニットを符号化するの
    にビット使用量が最小限となる状態を選択することによ
    って、可変長符号化かまたは固定長符号化かを比較およ
    び決定するステップと、 現在のオーディオフレームまたは現在のユニットに対し
    て可変長符号化または固定長符号化のどちらが選択され
    たかを指示するフラグを復号器に送るステップと、 を備えた方法。
  4. 【請求項4】 請求項3において決定がなされた後、
    すべての使用可能ビットが使い尽くされるまで、可変ビ
    ット符号化かまたは固定ビット符号化を使用して各前記
    ユニットの各周波数成分を符号化する方法であって、 a)もしフラグが固定ビット符号化に設定されていれ
    ば、 前記初期量子化ステップに基づいて、固定ビット割り当
    てに使用されるべき総ビット数を得るステップと、 総使用可能ビット数から前記総ビット数を引き算するこ
    とによって、残存ビット数を計算するステップと、 残存ビットをより高いピークエネルギーレベルを有する
    ユニットに割り当てるためのループを設定するステップ
    と、 より高いピークエネルギーレベルを有するユニットに対
    して前記最後のステップで割り当てられたビット数に応
    じて前記ワード長を増やすステップと、 前記ワード長をそれの対応する量子化ステップに変換す
    るステップと、 前記最後のステップで得られた最終的な量子化ステップ
    を符号化して復号器に送出するステップと、 を備え、 b)もしフラグが可変ビット符号化に設定されていれ
    ば、 前記初期量子化ステップに基づいて、可変ビット割り当
    てに使用されるべき総ビット数を得るステップと、 総使用可能ビット数から前記総ビット数を引き算するこ
    とによって、残存ビット数を計算するステップと、 残存ビットをより高いピークエネルギーを有するユニッ
    トに割り当てるためのループを設定するステップと、 最も高いピークエネルギーを有する前記ユニットに対す
    る前記初期量子化ステップを増やすステップと、 前記増やされた量子化ステップを用いて前記ユニットを
    符号化するのに必要な余分のビット数を計算するステッ
    プと、 すべての残存ビットが使い尽くされるまで、前記余分な
    ビット数を引き算することによって総残存ビット数を更
    新するステップと、 得られた最終的な増加量子化ステップを符号化して復号
    器に送出するステップと、 を備えた方法。
  5. 【請求項5】 前記ユニットごとの心理聴覚静寂しき
    い値を用いて、有効バンド幅を計算して前記ピークエネ
    ルギーを調整する請求項2に記載の方法であって、 もしユニットに対する前記スケールファクターがゼロで
    なければ、そのユニットごとに得られた前記初期ピーク
    エネルギーから静寂しきい値を引き算することによっ
    て、前記ピークエネルギーを調整するステップと、 ゼロよりも小さい調整されたピークエネルギーの数を計
    算するステップと、 もし前記ゼロよりも小さい調整されたピークエネルギー
    の数が所定の値を越えていれば、前記静寂しきい値をあ
    るレベルにシフトダウンさせるステップと、 前記初期ピークエネルギーから新しい静寂しきい値を引
    き算することによって、ピークエネルギーを再調整する
    ステップと、 更新されたピークエネルギーを用いてバンド幅を計算す
    るステップと、 を備えた方法。
  6. 【請求項6】 残存ビット数と周波数成分の残存数と
    をフィードバックすることによって、まず最初に固定ワ
    ード長を前記有効バンドに割り当てる請求項2に記載の
    方法であって、 有効バンド幅内のユニットごとに平均ピークエネルギー
    を計算するステップと、 ビットを割り当てられなければならない周波数成分の総
    数を計算するステップと、 前記平均ピークエネルギーに対するピークエネルギーの
    比をユニットごとに計算するステップと、 総使用可能ビット数から割り当てられたビット数を引き
    算することによって残存ビット数を更新するステップ
    と、 符号化されるべき前記周波数成分の総数からこれまでに
    符号化された周波数成分の数を引き算することによって
    周波数成分の残存数を更新するステップと、 これまでの前記残存ビット数と前記周波数成分の残存数
    とに基づいて、現在のユニットに使用されるべきビット
    数を評価するステップと、 前記ステップで評価された前記ビット数に前記比を重み
    付けすることによって、ワード長を得るステップと、 使用されたビットの総数と符号化された周波数成分の数
    とを更新するステップと、 を備えた方法。
  7. 【請求項7】 前記ワード長を前記ユニットごとに使
    用される量子化ステップに変換する請求項2に記載の方
    法であって、前記ワード長情報が周波数成分のダイナミ
    ックレンジを決定し、それに対して、量子化ステップそ
    のものが周波数成分のダイナミックレンジを表現する方
    法。
JP10319074A 1998-11-10 1998-11-10 オーディオ符号化における適応ダイナミック可変ビット割り当て方法 Pending JP2000151413A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10319074A JP2000151413A (ja) 1998-11-10 1998-11-10 オーディオ符号化における適応ダイナミック可変ビット割り当て方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10319074A JP2000151413A (ja) 1998-11-10 1998-11-10 オーディオ符号化における適応ダイナミック可変ビット割り当て方法

Publications (1)

Publication Number Publication Date
JP2000151413A true JP2000151413A (ja) 2000-05-30

Family

ID=18106219

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10319074A Pending JP2000151413A (ja) 1998-11-10 1998-11-10 オーディオ符号化における適応ダイナミック可変ビット割り当て方法

Country Status (1)

Country Link
JP (1) JP2000151413A (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004078183A (ja) * 2002-06-24 2004-03-11 Agere Systems Inc オーディオ信号のマルチチャネル/キュー符号化/復号化
JP2008511848A (ja) * 2004-09-03 2008-04-17 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 符号化されたマルチチャネル信号を発生するための装置および方法並びに符号化されたマルチチャネル信号を復号化するための装置および方法
JP2008147884A (ja) * 2006-12-07 2008-06-26 Canon Inc 画像処理装置、記録装置、画像処理方法、プログラム、および記憶媒体
JP2008536182A (ja) * 2005-04-13 2008-09-04 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. 符号化効率向上のためのパラメータの適応グループ化
EP1989707A2 (fr) * 2006-02-24 2008-11-12 France Telecom Procede de codage binaire d'indices de quantification d'une enveloppe d'un signal, procede de decodage d'une enveloppe d'un signal et modules de codage et decodage correspondants
US7903824B2 (en) 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
US7941320B2 (en) 2001-05-04 2011-05-10 Agere Systems, Inc. Cue-based audio coding/decoding
US8204261B2 (en) 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
US8340306B2 (en) 2004-11-30 2012-12-25 Agere Systems Llc Parametric coding of spatial audio with object-based side information
WO2024055829A1 (zh) * 2022-09-15 2024-03-21 抖音视界有限公司 音频编码方法、装置、设备及存储介质

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8200500B2 (en) 2001-05-04 2012-06-12 Agere Systems Inc. Cue-based audio coding/decoding
US7941320B2 (en) 2001-05-04 2011-05-10 Agere Systems, Inc. Cue-based audio coding/decoding
JP2004078183A (ja) * 2002-06-24 2004-03-11 Agere Systems Inc オーディオ信号のマルチチャネル/キュー符号化/復号化
JP2008511848A (ja) * 2004-09-03 2008-04-17 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 符号化されたマルチチャネル信号を発生するための装置および方法並びに符号化されたマルチチャネル信号を復号化するための装置および方法
JP4856641B2 (ja) * 2004-09-03 2012-01-18 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 符号化されたマルチチャネル信号を発生するための装置および方法並びに符号化されたマルチチャネル信号を復号化するための装置および方法
US8238562B2 (en) 2004-10-20 2012-08-07 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
US8204261B2 (en) 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
US8340306B2 (en) 2004-11-30 2012-12-25 Agere Systems Llc Parametric coding of spatial audio with object-based side information
US7903824B2 (en) 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
JP2008536182A (ja) * 2005-04-13 2008-09-04 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. 符号化効率向上のためのパラメータの適応グループ化
EP1989707A2 (fr) * 2006-02-24 2008-11-12 France Telecom Procede de codage binaire d'indices de quantification d'une enveloppe d'un signal, procede de decodage d'une enveloppe d'un signal et modules de codage et decodage correspondants
JP2009527785A (ja) * 2006-02-24 2009-07-30 フランス テレコム 信号包絡線の量子化インデックスをバイナリ符号化する方法、信号包絡線を復号化する方法、および、対応する符号化および復号化モジュール
KR101364979B1 (ko) * 2006-02-24 2014-02-20 오렌지 신호 엔벨로프의 양자화 인덱스들의 이진 코딩 방법과 신호엔벨로프의 디코딩 방법, 및 대응하는 코딩 모듈과 디코딩모듈
JP4732316B2 (ja) * 2006-12-07 2011-07-27 キヤノン株式会社 画像処理装置、記録装置、画像処理方法、プログラム、および記憶媒体
JP2008147884A (ja) * 2006-12-07 2008-06-26 Canon Inc 画像処理装置、記録装置、画像処理方法、プログラム、および記憶媒体
WO2024055829A1 (zh) * 2022-09-15 2024-03-21 抖音视界有限公司 音频编码方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
JP5175028B2 (ja) デジタル信号の符号化方法及び装置ならびに復号化方法及び装置
JP4212591B2 (ja) オーディオ符号化装置
EP2282310B1 (en) Entropy coding by adapting coding between level and run-length/level modes
JP3297240B2 (ja) 適応的符号化システム
KR20010021226A (ko) 디지털 음향 신호 부호화 장치, 디지털 음향 신호 부호화방법 및 디지털 음향 신호 부호화 프로그램을 기록한 매체
JP2000004163A (ja) オーディオ符号化のための動的ビット割り当て方法及び装置
JP4055336B2 (ja) 音声符号化装置及びそれに用いる音声符号化方法
JP2005328542A (ja) 複数のルックアップテーブルを利用したデジタル信号の符号化方法、デジタル信号の符号化装置及び複数のルックアップテーブル生成方法
US8149927B2 (en) Method of and apparatus for encoding/decoding digital signal using linear quantization by sections
KR20030068716A (ko) 웨이브렛 패킷 변환을 이용한 오디오 압축 방법 및 그시스템
JP2000151413A (ja) オーディオ符号化における適応ダイナミック可変ビット割り当て方法
KR20010034370A (ko) 오디오 인코더를 위한 적응성 비트 할당 시스템 및 방법
Truman et al. Efficient bit allocation, quantization, and coding in an audio distribution system
US6678653B1 (en) Apparatus and method for coding audio data at high speed using precision information
JPH08307281A (ja) 非線形量子化方法及び非線形逆量子化方法
JPH0537395A (ja) 帯域分割符号化方法
JP3465341B2 (ja) オーディオ信号符号化方法
JP3297238B2 (ja) 適応的符号化システム及びビット割当方法
JP4024185B2 (ja) デジタルデータ符号化装置
JP2001148632A (ja) 符号化装置、符号化方法、及びその記録媒体
JPH08167851A (ja) 高能率符号化方法及び装置、並びに伝送媒体
KR970006827B1 (ko) 오디오신호 부호화장치
JP2003271199A (ja) オーディオ信号の符号化方法及び符号化装置
JP3389849B2 (ja) 量子化装置
JPH06291670A (ja) ディジタルオーディオ信号の符号化方法