JPH09274500A - ディジタルオーディオ信号の符号化方法 - Google Patents

ディジタルオーディオ信号の符号化方法

Info

Publication number
JPH09274500A
JPH09274500A JP8086203A JP8620396A JPH09274500A JP H09274500 A JPH09274500 A JP H09274500A JP 8086203 A JP8086203 A JP 8086203A JP 8620396 A JP8620396 A JP 8620396A JP H09274500 A JPH09274500 A JP H09274500A
Authority
JP
Japan
Prior art keywords
units
unit
bit allocation
audio signal
bits
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8086203A
Other languages
English (en)
Inventor
Sua Hon Neo
ネオ・スア・ホン
Oo Pen Tan
タン・オー・ペン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP8086203A priority Critical patent/JPH09274500A/ja
Publication of JPH09274500A publication Critical patent/JPH09274500A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Abstract

(57)【要約】 【課題】 高い圧縮率において高いオーディオ品質と良
好な全高調波歪みと雑音の和の値を両立させる方法を提
供する。 【解決手段】 ステップ11,12で最大のエネルギー
レベルのつサブバンドユニットと、その隣のユニットと
を特定し、ステップ13でこれらを重要なユニットとし
てマークする。ステップ14で重要なユニット以外のサ
ブバンドユニットのエネルギーレベルを固定のしきい値
レベルによって負の値になるまで減算する。ステップ1
5で重要なユニットの要求ビット数を既定のビット割り
当てテーブルに基づいて計算する。ステップ17で全要
求ビット数はフレーム当りの最大許容ビット数より大き
いか否かをチェックし、yesであればステップ18で
全範囲ビット割り当てテーブルを、noであればステッ
プ19でデフォルトの既定のビット割り当てテーブルを
用いる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ディジタルオーデ
ィオ信号を伝送するため、または記録媒体へディジタル
記録を行うためなどに用いる情報符号化を最適化するデ
ィジタルオーディオ信号の符号化方法に関する。
【0002】
【従来の技術】近年、ディジタルコンパクトカセット
(DCC)、ミニディスク(MD)、ビデオコンパクト
ディスク(ビデオCD)等の新しい記録再生方式におい
ては、信号圧縮技術を用いて限られた容量の記録媒体に
長時間のオーディオ信号を記録できるようになってい
る。これらの新しい記録再生方式に用いられるオーディ
オ信号圧縮符号化技術は、まずオーディオ信号の周波数
変換を行い、引き続いて量子化を行う。変換された係数
は、一般的にあらかじめ決められた量子化可能な組合せ
によって量子化することができる。この圧縮技術に用い
られる動的なビット割り当て方法が、得られるオーディ
オ品質に大きな影響を与える。図4は従来技術の圧縮符
号化の処理装置のブロック図を示す。
【0003】図において入力ディジタルオーディオ信号
21は、まず周波数変換部22において数学的周波数変
換が行われる。一般に周波数変換には変形離散コサイン
変換、帯域分割フィルタ分析やウエーブレット変換等の
方法を用いる。周波数変換され出力された係数23は、
次いで正規化部24で正規化されて出力25となり、量
子化部41aで量子化され符号化された出力42aとな
る。量子化の方法は線形でも非線形でもよい。
【0004】量子化レベルの数は通常2つの組み合わせ
がある。その1つは、すべてのユニットまたはサブバン
ドユニットにわたって、すべてのまたはほとんどすべて
の量子化レベルを許容するものであり、他の1つの方法
は低い周波数のサブバンドにはすべてまたはほとんどす
べての量子化レベルを許容し、高い周波数のサブバンド
になるにしたがって量子化レベル数を低減するものであ
る。
【0005】後者の方法は多くのオーディオ信号は高い
周波数に向かうにつれてエネルギーレベルが低くなって
いるという事実に基づいている。したがって小さい量子
化レベル数のいくつかの種類から選択する。このような
2つの量子化方法はISO/IEC規格(以下規格と略称)111
72-3レイヤIおよびレイヤIIに示されている。さらに
この規格のレイヤIIは量子化レベルの小さいものの他
にオプションとして量子化レベルの最大可能値も規定し
ている。この量子化レベルの最大可能値は他の方法での
粗いステップ量では良好なマスキング効果が得られない
場合に用いられる。実施の煩雑さを避けるために各ユニ
ット、各周波数サブバンドユニットの量子化方法は固定
されている。
【0006】ビット割り当て方法による符号化の方法は
良好なオーディオ品質を得るために重要である。上述の
規格は、人間の耳がどのように音を聴き取るかという聴
覚心理モデルに基づいて作られている。このような数学
モデルを用いたビット割り当て方法は知覚的ビット割り
当て方法と呼ばれ、上記規格における音響心理学的モデ
ルIと音響心理学的モデルIIがある。このような音響
心理学的モデルにおいては、音響スペクトル成分が調べ
られ、音に対するマスキングとノイズに対するマスキン
グとの同時マスキングがモデル化され、各周波数帯域の
サブバンドユニットのスペクトル成分のそれぞれに対す
るマスキングのしきい値が導かれる。計算の煩雑さを軽
減するためにマスキングしきい値は少数の周波数サブバ
ンドユニットにおいて概算してもよい。このようにそれ
ぞれが多くの信号成分を持つ所定のユニットまたは周波
数帯域に対する信号対マスキングしきい値比を計算でき
る。こうして求めた信号対マスキングしきい値比は動的
なビット割り当て方法に反復して用いることができる。
【0007】従来の知覚的ビット割り当て方法では、ビ
ット割り当ては各ユニットまたは各サブバンドユニット
における信号エネルギーに基づいている。知覚的ビット
割り当て方法は透明に近いオーディオ品質を達成するの
に役立つ。圧縮符号化された信号はオリジナルの信号と
聴き分けることができないくらいである。
【0008】しかしながら従来の知覚的ビット割り当て
方法は、全高調波ひずみおよびノイズの和(以下THD
+Nと略称)の値をより良くすることを考えていない。
従来の知覚的ビット割り当て方法は信号対雑音比を最大
にすることによって結果的にTHD+N値を良くしよう
としているが、この方法だけでは圧縮された信号から良
好なオーディオ品質を得ることはできない。
【0009】
【発明が解決しようとする課題】主観的な試聴評価は圧
縮符号化を行なったオーディオ信号の品質を評価するた
めの主要な評価基準として尊重しなければならないが、
THD+Nの測定値も符号化を行なうためのオーディオ
装置の性能を示す重要な品質基準であることを忘れては
ならない。THD+Nの測定値は、その測定がなされて
いる周波数の上または下における全周波数帯域のノイズ
の量、交流電源関係のハムおよびその他のさまざまな干
渉信号の大きさを示すものであり、スタジオ用等のプロ
フェショナルオーディオ装置において特に重要である。
【0010】低ビット符号化技術が開発されつつある現
在、これまでの量子化可能性決定法およびこれまでのビ
ット割り当て手順は優れたTHD+N値の性能を確保す
るには十分ではない。単純に知覚的要素だけを考えた、
すなわち信号対マスク信号の比のみに基づいたビット割
り当て方法は、THD+N値について何の考慮もしない
でビット割り当てを行う。低圧縮率の場合には、従来の
知覚的ビット割り当て方法は、透明に近いオーディオ品
質ならびに比較的良好なTHD+N値の測定結果をもた
らす。しかし圧縮率が高くなると、スペクトル変換係数
を量子化するために使える全ビット数は減少する。そこ
で視聴試験で良いオーディオ品質が得られていてもTH
D+N値の測定値は著しく悪化する。
【0011】信号の変化や信号のエネルギーによってビ
ットを割り当てる従来のビット割り当て方法において
は、高い方の周波数におけるユニットまたはサブバンド
ユニットにおいて可能な量子化の組み合わせが少なくな
ると、高圧縮率の場合にはTHD+N特性は最適化され
ない。たとえば前記規格のレイヤIIによる符号化の場
合に圧縮率が10以上になるとこれが顕著になる。
【0012】従来の単純な知覚的ビット割り当て方法を
用いた場合のTHD+N値の測定結果を図6に示す。こ
れは前記規格のビデオCDのオーディオ圧縮符号化方法
を用い44.1kHzサンプリングのステレオ信号に対
してビットレート128kb/sで知覚的ビット割り当
て方法を用いて圧縮符号化した信号についての測定結果
である。この結果を見るとさまざまな周波数において値
が悪化している。この主な原因はどのような入力信号に
対しても知覚的ビット割り当て方法が動作するからであ
る。
【0013】THD+N特性が低下する他の理由は、量
子化可能性がある程度強制的になされるからである。量
子化可能性は、低いビットレートの制限の中で、THD
+N特性が最大になるように割り当てるべきである。
【0014】そこで本出願人は、先に特願平6−310
956号の出願においてこのTHD+N特性を改善する
ために動的ビット割り当て方法を選択する手段を提案し
た。以下上記出願を提案と略称する。この提案の動的な
ビット割り当て制御部は、従来の信号のエネルギーまた
は信号の変化に基づくビット割り当て方法に代わって、
それほど微妙でないオーディオ信号を検出するために用
いられる。
【0015】図5は上記提案の動的ビット割り当て制御
部および非知覚的ビット割り当て制御部を組込んだ符号
化処理装置のブロック図を示す。従来の全範囲のビット
割り当て方法のパラメータは非知覚的処理部31bに設
定されている。知覚的ビット割り当てのためのパラメー
タは知覚的処理部35に設定されている。
【0016】あらかじめサンプリングされたディジタル
オーディオ信号入力21のフレームは、最初周波数変換
部22でサブバンドフィルタ、変形離散コサイン変換、
またはウェーブレット変換のような数学的周波数変換を
受けて、スペクトル成分を導出する。これらのスペクト
ル成分の得た精細度によって,スペクトル成分は周波数
帯域または時間領域にわたってグループ分けを行ないユ
ニットまたはサブバンドユニットにグループ化された出
力23を出力する。スペクトル成分が高精細の、たとえ
ば512点の変形離散コサイン変換によって得られたも
のであるとき、スペクトル成分が周波数領域におけるユ
ニットにグループ分けされる。または他の方法ではスペ
クトル成分は時間領域に一様な32のサブバンドユニッ
トにグループ分けされる。このようにスペクトル成分は
ユニットサイズでグループ分けしなければならない。ユ
ニットサイズは一様でも非一様でもよいが、量子化ビッ
ト数がそれぞれに割り当てられるべきユニットサイズと
同一でなければならない。
【0017】正規化部24は、量子化に先だって同一ユ
ニットに属するスペクトル成分値を±1の範囲内になる
ように縮小する。このようにして得た縮小値は正規化さ
れたスペクトル成分25として量子化部41bに出力さ
れる。正規化はまず最も大きい振幅を持つスペクトル成
分を見出して、そのユニットのすべてのスペクトル成分
値をこの最大振幅で割るか、またはこの最大振幅を1と
するための縮小率と等しいかまたはわずかだけこれより
大きい値の縮小率を掛けて得られる。
【0018】量子化部41bにおいては、一般には一様
な線形量子化が使用されるが、非線形量子化を用いても
よい。一様な線形量子化を用いたときは、量子化のため
のビット数が追加されたときに量子化ノイズの軽減や信
号対雑音比の向上を確認するのが容易である。正規化さ
れたスペクトル成分を量子化するときにビット数が多け
れば多いほど量子化ノイズを軽減できる。
【0019】動的ビット割り当て制御部26bは、ユニ
ットまたはサブバンドユニットにグループ分けされたス
ペクトル成分23を入力してオーディオ信号のフレーム
が臨界帯域外の非臨界か、臨界帯域内の臨界かによっ
て、非知覚的処理を行なうか、知覚的処理を行うかを決
定し、その結果によってスイッチ28および29を切り
換えて非臨界の場合は非知覚的処理部31bを、または
臨界の場合は知覚的処理部35を選択する。この選択方
法は提案に詳細に説明している。
【0020】非知覚的処理部31bを選択したときはオ
リジナルのスペクトル成分23が十分高精細でなくとも
入力オーディオ信号に対してさらに平行に周波数変換さ
せる必要はない。信号内容に複雑な解析を行う必要は何
もない。信号のエネルギーまたは信号の変動は非知覚的
処理部31bより出力44として得られる。
【0021】知覚的処理部35を選択したときは、知覚
的処理部35でマスキングしきい値を計算する必要があ
る。この方法にはかなり高い周波数精細度のスペクトル
成分を使わなければならない。スペクトル成分23の周
波数精細度が十分高くないときには、より高い精細度の
別途の周波数変換が、入力オーディオ信号フレームに対
して平行に行われなければならない。信号対マスキング
しきい値比として知覚的処理部35から出力36が得ら
れる。
【0022】非知覚的処理部31bの出力44と知覚的
処理部35の出力36のいずれかがスイッチ29で選択
されて反復ビット割り当て部39bに入力される。
【0023】反復ビット割り当て部39bは反復して利
用可能な全てのビットを割り当てるように探索して、信
号エネルギーまたは信号対マスキングしきい値比が最も
高いスペクトル成分を持ったユニットに割り当てを優先
する。
【0024】反復ビット割り当て部39bの出力である
ビット数の組み合わせ40bは量子化部41bに与えら
れ、ここで正規化部24で正規化されて入力されたスペ
クトル成分のユニットまたはサブバンドユニットのそれ
ぞれを量子化するために割り当てられる。
【0025】割当てられたビット数に基づき量子化部4
1bは正規化された入力スペクトル成分を符号化し、量
子化または符号化された出力42bを発生する。
【0026】以上の提案の装置によってTHD+N値は
かなり改善されたが、本発明はTHD+N値をさらに改
善する、より進んだ方法を提案しようとするものであ
る。
【0027】
【課題を解決するための手段】上記課題を解決するため
の本発明のディジタルオーディオ信号の符号化方法は、
オーディオ信号の各フレームをスペクトル成分に変換す
るステップと、前記スペクトル成分をあらかじめ定めた
バンド幅またはユニットにグループ分けするステップ
と、前記のあらかじめ定めたバンド幅またはユニットの
すべてにわたってスペクトルエネルギー分布の解析を行
うステップと、前記スペクトルエネルギー分布およびそ
の他の測定値に基づいて初期設定の既定のビット割り当
てテーブルか、全範囲ビット割り当てテーブルかを選択
するステップと、オーディオ信号を前記スペクトルエネ
ルギー分布に基づいて臨界帯域内の信号か臨界帯域外の
信号かに選別するステップと、臨界帯域外のオーディオ
信号には拡張非知覚的処理方法に基づいて処理を行い、
臨界帯域内のオーディオ信号には知覚的処理方法に基づ
いて処理を行うステップとを有する。
【0028】本発明はこの各ステップによって、各フレ
ームをスペクトル成分に変換し、あらかじめ定めたバン
ド幅のサブバンドユニットまたはユニットにグループ分
けしたディジタルオーディオ信号に対して最大のエネル
ギーレベルのサブバンドユニットと、その隣のユニット
とを特定し、これらを重要なユニットとしてマークし、
重要なユニット以外のサブバンドユニットのエネルギー
レベルを固定のしきい値レベルによって負の値になるま
で減算する。
【0029】重要なユニットの要求ビット数を既定のビ
ット割り当てテーブルに基づいて計算し、全要求ビット
数はフレーム当りの最大許容ビット数より大きいか否か
をチェックし、大きければ全範囲ビット割り当てテーブ
ルを、大きくなければデフォルトの既定のビット割り当
てテーブルを用いる。
【0030】このような作用により低いビットレート、
高い圧縮率においても良好なオーディオ品質を保ちなが
ら特に臨界帯域外の非知覚的オーディオ信号に対する高
調波歪とノイズとの和の値の改善を行うことができる。
【0031】
【発明の実施の形態】本発明の請求項1のディジタルオ
ーディオ信号の符号化方法は、オーディオ信号の各フレ
ームをスペクトル成分に変換するステップと、前記スペ
クトル成分をあらかじめ定めたバンド幅またはユニット
にグループ分けするステップと、前記のあらかじめ定め
たバンド幅またはユニットのすべてにわたってスペクト
ルエネルギー分布の解析を行うステップと、前記スペク
トルエネルギー分布およびその他の測定値に基づいて初
期設定の既定のビット割り当てテーブルか、全範囲ビッ
ト割り当てテーブルかを選択するステップと、オーディ
オ信号を前記スペクトルエネルギー分布に基づいて臨界
帯域内の信号か臨界帯域外の信号かに選別するステップ
と、臨界帯域外のオーディオ信号には拡張非知覚的処理
方法に基づいて処理を行い、臨界帯域内のオーディオ信
号には知覚的処理方法に基づいて処理を行うステップと
を有する。
【0032】本発明の請求項2の発明は、請求項1の発
明において、スペクトルエネルギー分布およびその他の
測定値に基づいて初期設定の既定のビット割り当てテー
ブルか、全範囲ビット割り当てテーブルかを選択するス
テップは、さらに、最も高いスペクトルエネルギーレベ
ルを有するサブバンドユニットとそれに隣接するサブバ
ンドユニットとを含む重要なユニットの要求するビット
数を計算するステップと、量子化されたオーディオサン
プルと随伴情報とを含むオーディオ信号の処理中のフレ
ームが要求する全要求ビット数を計算するステップと、
すべての要求されるビット数と与えられたビットレート
において使用可能なビット数との比較に基づいてビット
割り当てテーブルの選択を決定するステップとを有する
ものである。
【0033】本発明の請求項3の発明は、請求項1の発
明において、臨界帯域外のオーディオ信号には拡張非知
覚的処理方法に基づいて処理を行い、臨界帯域内のオー
ディオ信号には知覚的処理方法に基づいて処理を行うス
テップは、臨界帯域外のオーディオ信号に対して拡張非
知覚的処理方法に基づいて処理を行うときに、最も高い
エネルギーのスペクトル成分のサブバンドユニットまた
はユニットを区別するステップと、重要なユニット以外
のサブバンドユニットのすべてに負の値のエネルギーレ
ベルをもたらすような固定の値のしきい値を選定し、最
も高いスペクトルエネルギーを持つサブバンドユニット
とその隣接サブバンドユニットとを除くすべてのサブバ
ンドユニットのスペクトルエネルギーレベルを上記の固
定のしきい値を単位に減少させていくステップと、ビッ
ト数は最も高いエネルギーを持つサブバンドユニットま
たはユニットに反復的に割り当てられ、線形量子化の場
合、1ビットの追加割り当てによってスペクトルエネル
ギーが約6dB減少するように処理するステップとを有
するものである。
【0034】本発明は上記の方法により、オーディオ信
号の各フレームをスペクトル成分に変換した後、このス
ペクトル成分をあらかじめ定めたバンド幅のサブバンド
ユニットまたはユニットにグループ分けする。
【0035】このサブバンドユニットまたはユニットに
対して最大のエネルギーレベルのサブバンドユニット
と、その隣のユニットとを特定し、これらを重要なユニ
ットとしてマークする。つぎに重要なユニット以外のサ
ブバンドユニットのエネルギーレベルを固定のしきい値
レベルによって負の値になるまで減算する。
【0036】重要なユニットの要求ビット数を既定のビ
ット割り当てテーブルに基づいて計算し、全要求ビット
数はフレーム当りの最大許容ビット数より大きいか否か
をチェックし、大きければ全範囲ビット割り当てテーブ
ルを、大きくなければデフォルトの既定のビット割り当
てテーブルを用いる。
【0037】以下本発明のディジタルオーディオ信号の
符号化方法について図面を参照しながら説明する。図2
は本発明の一実施形態のディジタルオーディオ信号の符
号化方法を用いた装置のブロック図である。
【0038】図2に示すように拡張非知覚的処理部31
が先の提案の図5の非知覚的処理部31bの代わりに用
いられる。この拡張非知覚的処理部31は臨界帯域外の
スペクトルエネルギー分布を修正して、その結果よりよ
いTHD+N値を得る手段を有している。また本発明は
ビットレートとスペクトルエネルギー分布とに基づいて
使用される可能な量子化のテーブルを選択するビット割
り当てテーブル選択部を有する。上述の本出願人による
提案の図5と同一機能のものには同一の符号を付けて構
成要素の説明は省略する。
【0039】あらかじめサンプリングされたディジタル
オーディオ信号入力21のフレームは、最初周波数変換
部22で数学的周波数変換を受けて、スペクトル成分を
導出する。これらのスペクトル成分は周波数帯域または
時間領域にわたってグループ分けを行ないユニットまた
はサブバンドユニットにグループ化された出力23を出
力する。正規化部24は、量子化に先だって同一ユニッ
トに属するスペクトル成分値を±1の範囲内になるよう
に縮小して出力する。ここまでの処理は提案例の図5と
同様であり細部の説明は省略する。
【0040】動的ビット割り当て制御部26は、ユニッ
トまたはサブバンドユニットにグループ分けされたスペ
クトル成分23を入力してオーディオ信号のフレームが
臨界帯域外の非臨界か、臨界帯域内の臨界かによって、
拡張非知覚的処理を行なうか、知覚的処理を行なうかを
決定し、その結果によってスイッチ28および29を切
り換えて拡張非知覚的処理部31か、または知覚的処理
部35かのいずれかを選択する。この選択方法の詳細は
提案と同様である。
【0041】拡張非知覚的処理部31は最も高いスペク
トルエネルギーを持つサブバンドユニットを区別する手
段と、反復のビット割り当て処理過程で反復ビット割り
当て部に最も高いエネルギーを持つサブバンドユニット
とその隣接サブバンドユニットとに高い優先権を与える
ように指示する手段と、すべての要求されたビット数と
用いているビットレートに基づいて可能な量子化のテー
ブルを選択する手段とを有している。
【0042】非臨界と識別されたオーディオ信号のフレ
ームに対しては拡張非知覚的処理部31が選択され、臨
界と識別されたオーディオ信号のフレームに対しては知
覚的処理部35が選択される。拡張非知覚的処理部31
を選択したときはオリジナルのスペクトル成分23が十
分高精細でなくとも入力オーディオ信号に対してさらに
平行に周波数変換させる必要はない。信号内容に複雑な
解析を行う必要は何もない。拡張非知覚的処理部31に
はビットレート情報32が入力されている。信号のエネ
ルギーまたは信号の変動は拡張非知覚的処理部31より
出力33として得られる。
【0043】知覚的処理部35が選択されたときは、知
覚的処理部35でマスキングしきい値を計算する必要が
ある。この方法にはかなり高い周波数精細度のスペクト
ル成分を使わなければならない。信号対マスキングしき
い値比として知覚的処理部35から出力36が得られ
る。ビット割り当てテーブル選択部37はスイッチ30
により拡張非知覚的処理部31からの指示信号34か、
または知覚的処理部35からの指示信号43かを受け
る。拡張非知覚的処理部31からの指示信号34は全範
囲ビット割り当てテーブルまたはデフォルトの既定のビ
ット割り当てテーブルを指示することができる。知覚的
処理部35からの指示信号43は常に知覚的符号化に最
適化されたデフォルトの既定のビット割り当てテーブル
を指示することができる。反復ビット割り当て部39は
反復して利用可能な全てのビットを割り当てるように探
索して、信号エネルギーまたは信号対マスキングしきい
値比が最も高いスペクトル成分を持ったユニットに優先
的にビットを割り当てる。各々すべてのスペクトル単位
に割り当てられるビットの組み合わせは出力40として
量子化部41に与えられる。割当てられたビット数に基
づき量子化部41は正規化された入力スペクトル成分を
符号化し、量子化または符号化された出力42を発生す
る。
【0044】量子化部41においては、一般には一様な
線形量子化が使用されるが、非線形量子化も用いてもよ
い。一様な線形量子化を用いたときは、量子化のための
ビット数が追加されたときに量子化ノイズの軽減や信号
対雑音比の向上を確認するのが容易である。正規化され
たスペクトル成分を量子化するときにビット数が多けれ
ば大きいほど量子化ノイズを軽減できる。
【0045】図1は本発明のディジタルオーディオ信号
符号化のための動的ビット割り当てのステップを示すフ
ローチャートである。拡張非知覚的処理部は分割された
各帯域のスペクトルエネルギーを修正してTHD+Nが
より良い特性を得るようにする。この修正は原信号の実
際のスペクトルエネルギー分布に影響を与えるものでな
く、反復のビット割り当てに影響を与えるためにのみに
用いられる。
【0046】処理をスタートすると、まずステップ11
においてすべてのサブバンドユニット中で最高のエネル
ギーレベルのスペクトル成分を持つサブバンドを探す。
シングルトーン信号の主スペクトル成分は常に最も高い
エネルギーレベルのスペクトル成分を持つサブバンドユ
ニット中に存在する。
【0047】つぎにステップ12において最も高いエネ
ルギーのスペクトル成分を持つサブバンドユニットに近
接したサブバンドユニットを見分ける。ステップ13で
最も高いエネルギーのサブバンドユニットと、そのすぐ
隣のサブバンドユニットとは重要なユニットとしてマー
クする。ステップ14では記録された重要なユニットを
除くすべてのサブバンドユニットのエネルギーレベルは
固定のしきい値レベルによって減小される。減少された
エネルギーレベルが負の値になるまで、どのような固定
のしきい値も用いることができる。反復のビット割り当
てはまず正のエネルギーレベルを持ったサブバンドユニ
ットにビットを割り当てることから始まる。残った余分
のビットがあれば次に他の負のエネルギーのサブバンド
ユニットに与える。このようにしてビット割り当ての過
程において重要なユニットでないユニットに負のエネル
ギーレベルを強制することにより、重要でないユニット
に対して重要なユニットが高い優先順位を与えられるこ
とになる。
【0048】ステップ15で、重要なユニットの要求す
るビットがデフォルトの既定のビット割り当てテーブル
に基づいて計算される。その要求ビットとは重要なユニ
ットの各々すべてに割り当てられた個々の信号対雑音比
がそれらの対応するスペクトル成分のエネルギーレベル
に等しいかそれより余裕を持ってより高いかを保証する
ために必要なビット数ということである。割り当てられ
た1ビットについて信号対雑音比は6dB増加する。よ
り良いTHD+N特性を得るためにそれらの要求ビット
は反復のビット割り当てにより十分に満足されなければ
ならない。随伴情報を含んだそれらの要求ビットは、ス
テップ16で、その時点の信号フレームの総要求ビット
を形成する。
【0049】ステップ17で、いったん全要求ビットが
計算されると、それは与えられたビットレートに基づい
て導かれた信号の1フレーム当たりの最大許容ビット数
より大きいかどうかがチェックされる。その結果は使用
するビット割り当てテーブルを決めるために、ビット割
り当てテーブル選択部に与えられる。ステップ18で、
もし総要求ビット数が最大許容ビット数より大であるな
らば、全範囲ビット割り当てテーブルを選択する。もし
そうでなければステップ19でデフォルトの既定のビッ
ト割り当てテーブルを用いる。全範囲ビット割り当てテ
ーブルは各々およびすべてのサブバンドユニットに全範
囲の量子化レベルを与える。デフォルトの既定のビット
割り当てテーブルの場合は、低い方の周波数のサブバン
ドユニットのみが全範囲の量子化レベルを与えられ、高
い方の周波数のサブバンドユニットは限定された範囲の
量子化レベルを与えられる。全要求ビット数が利用可能
ビット数を上回るきわめて低いビットレート符号化の状
態においては、特に高い周波数の領域においては、既定
のビット割り当てテーブルではより良好なTHD+N測
定値特性を得るのには不適当である。それ故にスイッチ
を切り換えて全範囲のビット割り当てテーブルを用いる
ことが必要となる。
【0050】図3は拡張非知覚的処理部31とビット割
り当てテーブル選択部37を用い本実施形態によるTH
D+N値の測定結果を示す。測定条件は同一である。従
来の技術の測定結果の図6でTHD+N値の測定結果が
悪かったすべての周波数にわたって大幅な改善が得られ
るとともに試聴試験においても気になるような音質の低
下はなかった。
【0051】なお全範囲のビット割り当てテーブルや知
覚的ビット割り当てテーブルは拡張非知覚的処理部31
や知覚的処理部35に設定しておいてもよいが、別のも
のとして用意して必要に応じて切り換えて使用してもよ
い。また非知覚的処理部31や知覚的処理部35は別個
のものとして説明したが、これらは一体のものであって
もよい。さらに本発明の方法の一部または全部をコンピ
ュータのソフトウエアで実現してもよい。
【0052】
【発明の効果】本発明のディジタルオーディオ信号の符
号化方法は、臨界帯域外のオーディオ信号には拡張非知
覚的処理方法に基づいて処理を行い、臨界帯域外のオー
ディオ信号には知覚的処理方法に基づいて処理を行うス
テップと初期設定の既定のビット割り当てテーブルか、
全範囲ビット割り当てテーブルかを選択するステップと
を有することによって、低いビットレート、高い圧縮率
においても良好なオーディオ品質を保ちながら特に臨界
帯域外の非知覚的オーディオ信号に対する高調波歪とノ
イズとの和の値の改善を行うことができ、ディジタルオ
ーディオ圧縮符号化方法のためのより適切な動的ビット
割り当て方法を行うことができる。
【図面の簡単な説明】
【図1】本発明の実施形態のディジタルオーディオ信号
の符号化方法を示すフローチャート
【図2】本発明の実施形態のディジタルオーディオ信号
の符号化方法を用いた装置のブロック図
【図3】本発明の実施形態のディジタルオーディオ信号
の符号化方法を用いた装置による全高調波歪とノイズの
和を示す周波数特性図
【図4】本出願人が先に提案したディジタルオーディオ
信号の符号化装置のブロック図
【図5】従来技術のディジタルオーディオ信号の符号化
装置のブロック図
【図6】従来技術の装置による全高調波歪とノイズの和
を示す周波数特性図
【符号の説明】
21 ディジタルオーディオ信号入力 22 周波数変換部 24 正規化部 26 動的ビット割当て制御部 28,29,30 スイッチ 31 拡張非知覚的処理部 35 知覚的処理部 37 ビット割り当てテーブル選択部 39 反復ビット割り当て部 41 量子化部 42 符号化された出力

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 オーディオ信号の各フレームをスペクト
    ル成分に変換するステップと、 前記スペクトル成分をあらかじめ定めたバンド幅または
    ユニットにグループ分けするステップと、 前記のあらかじめ定めたバンド幅またはユニットのすべ
    てにわたってスペクトルエネルギー分布の解析を行うス
    テップと、 前記スペクトルエネルギー分布およびその他の測定値に
    基づいて初期設定の既定のビット割り当てテーブルか、
    全範囲ビット割り当てテーブルかを選択するステップ
    と、 オーディオ信号を前記スペクトルエネルギー分布に基づ
    いて臨界帯域内の信号か臨界帯域外の信号かに選別する
    ステップと、 臨界帯域外のオーディオ信号には拡張非知覚的処理方法
    に基づいて処理を行い、臨界帯域内のオーディオ信号に
    は知覚的処理方法に基づいて処理を行うステップとを有
    するディジタルオーディオ信号の符号化方法。
  2. 【請求項2】 スペクトルエネルギー分布およびその他
    の測定値に基づいて初期設定の既定のビット割り当てテ
    ーブルか、全範囲ビット割り当てテーブルかを選択する
    ステップは、さらに、 最も高いスペクトルエネルギーレベルを有するサブバン
    ドユニットとそれに隣接するサブバンドユニットとを含
    む重要なユニットの要求するビット数を計算するステッ
    プと、 量子化されたオーディオサンプルと随伴情報とを含むオ
    ーディオ信号の処理中のフレームが要求する全要求ビッ
    ト数を計算するステップと、 すべての要求されるビット数と与えられたビットレート
    において使用可能なビット数との比較に基づいてビット
    割り当てテーブルの選択を決定するステップとを有する
    請求項1に記載のディジタルオーディオ信号の符号化方
    法。
  3. 【請求項3】 臨界帯域外のオーディオ信号には拡張非
    知覚的処理方法に基づいて処理を行い、臨界帯域内のオ
    ーディオ信号には知覚的処理方法に基づいて処理を行う
    ステップは、臨界帯域外のオーディオ信号に対して拡張
    非知覚的処理方法に基づいて処理を行うときに、 最も高いエネルギーのスペクトル成分のサブバンドユニ
    ットまたはユニットを区別するステップと、 重要なユニット以外のサブバンドユニットのすべてに負
    の値のエネルギーレベルをもたらすような固定の値のし
    きい値を選定し、最も高いスペクトルエネルギーを持つ
    サブバンドユニットとその隣接サブバンドユニットとを
    除くすべてのサブバンドユニットのスペクトルエネルギ
    ーレベルを上記の固定のしきい値を単位に減少させてい
    くステップと、 ビット数は最も高いエネルギーを持つサブバンドユニッ
    トまたはユニットに反復的に割り当てられ、線形量子化
    の場合、1ビットの追加割り当てによってスペクトルエ
    ネルギーが約6dB減少するように処理するステップと
    を有する請求項1に記載のディジタルオーディオ信号の
    符号化方法。
JP8086203A 1996-04-09 1996-04-09 ディジタルオーディオ信号の符号化方法 Pending JPH09274500A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8086203A JPH09274500A (ja) 1996-04-09 1996-04-09 ディジタルオーディオ信号の符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8086203A JPH09274500A (ja) 1996-04-09 1996-04-09 ディジタルオーディオ信号の符号化方法

Publications (1)

Publication Number Publication Date
JPH09274500A true JPH09274500A (ja) 1997-10-21

Family

ID=13880229

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8086203A Pending JPH09274500A (ja) 1996-04-09 1996-04-09 ディジタルオーディオ信号の符号化方法

Country Status (1)

Country Link
JP (1) JPH09274500A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6658381B1 (en) * 1999-10-15 2003-12-02 Telefonaktiebolaget Lm Ericsson (Publ) Methods and systems for robust frame type detection in systems employing variable bit rates
JP2005523480A (ja) * 2002-04-22 2005-08-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 空間的オーディオのパラメータ表示
JP2005523479A (ja) * 2002-04-22 2005-08-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ パラメータによるマルチチャンネルオーディオ表示
JP2007534986A (ja) * 2004-04-20 2007-11-29 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 知覚コーディングのビット割り当てにおける複雑さを軽減した計算方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6658381B1 (en) * 1999-10-15 2003-12-02 Telefonaktiebolaget Lm Ericsson (Publ) Methods and systems for robust frame type detection in systems employing variable bit rates
JP2005523480A (ja) * 2002-04-22 2005-08-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 空間的オーディオのパラメータ表示
JP2005523479A (ja) * 2002-04-22 2005-08-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ パラメータによるマルチチャンネルオーディオ表示
JP2009271554A (ja) * 2002-04-22 2009-11-19 Koninkl Philips Electronics Nv 空間的オーディオのパラメータ表示
JP4714416B2 (ja) * 2002-04-22 2011-06-29 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 空間的オーディオのパラメータ表示
JP4714415B2 (ja) * 2002-04-22 2011-06-29 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ パラメータによるマルチチャンネルオーディオ表示
JP2012161087A (ja) * 2002-04-22 2012-08-23 Koninkl Philips Electronics Nv 空間的オーディオのパラメータ表示
US8498422B2 (en) 2002-04-22 2013-07-30 Koninklijke Philips N.V. Parametric multi-channel audio representation
JP2007534986A (ja) * 2004-04-20 2007-11-29 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 知覚コーディングのビット割り当てにおける複雑さを軽減した計算方法
JP4903130B2 (ja) * 2004-04-20 2012-03-28 ドルビー ラボラトリーズ ライセンシング コーポレイション 知覚コーディングのビット割り当てにおける複雑さを軽減した計算方法

Similar Documents

Publication Publication Date Title
JP3274285B2 (ja) オーディオ信号の符号化方法
JP2756515B2 (ja) 可聴信号の知覚符号化方法および音声信号伝送方法
AU648656B2 (en) High efficiency digital data encoding and decoding apparatus
JP3336618B2 (ja) 高能率符号化方法及び高能率符号化信号の復号化方法
US7548850B2 (en) Techniques for measurement of perceptual audio quality
JP3762579B2 (ja) デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
JP2906646B2 (ja) 音声帯域分割符号化装置
JP5175028B2 (ja) デジタル信号の符号化方法及び装置ならびに復号化方法及び装置
JP3153933B2 (ja) データ符号化装置及び方法並びにデータ復号化装置及び方法
JP3186292B2 (ja) 高能率符号化方法及び装置
US7650278B2 (en) Digital signal encoding method and apparatus using plural lookup tables
JP4021124B2 (ja) デジタル音響信号符号化装置、方法及び記録媒体
JPH09134200A (ja) ディジタル・オーディオ符号化方法及びその装置
JPH0816195A (ja) ディジタルオーディオ符号化方法及び装置
JPH09274500A (ja) ディジタルオーディオ信号の符号化方法
JP2000151413A (ja) オーディオ符号化における適応ダイナミック可変ビット割り当て方法
KR100300957B1 (ko) 룩업테이블을이용한디지탈오디오부호화방법및장치
JPH08123488A (ja) 高能率符号化方法、高能率符号記録方法、高能率符号伝送方法、高能率符号化装置及び高能率符号復号化方法
JP3291948B2 (ja) 高能率符号化方法及び装置、並びに伝送媒体
JP3297238B2 (ja) 適応的符号化システム及びビット割当方法
JP2001267928A (ja) オーディオデータ圧縮装置、及び記憶媒体
JPH08167878A (ja) デジタルオーディオ信号符号化装置
JP2993324B2 (ja) 音声高能率符号化装置
KR100300956B1 (ko) 룩업테이블을이용한디지탈오디오부호화방법및장치
KR100590340B1 (ko) 디지털 오디오 부호화 방법 및 장치