JP2004252068A - デジタルオーディオ信号の符号化装置及び方法 - Google Patents
デジタルオーディオ信号の符号化装置及び方法 Download PDFInfo
- Publication number
- JP2004252068A JP2004252068A JP2003041260A JP2003041260A JP2004252068A JP 2004252068 A JP2004252068 A JP 2004252068A JP 2003041260 A JP2003041260 A JP 2003041260A JP 2003041260 A JP2003041260 A JP 2003041260A JP 2004252068 A JP2004252068 A JP 2004252068A
- Authority
- JP
- Japan
- Prior art keywords
- spectrum
- encoding
- intensity stereo
- positive integer
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【課題】知覚され難い量子化雑音のレベルを許容するために、必要な量子化ビット数が大きく、符号化に必要なビットの量が多いフレームが連続する場合で、符号化に使用可能なビットの量が低減するときには、量子化及び符号化によりスペクトルが欠落することがある。この場合、符号化信号を復号化したときの再生信号の歪み感が増大して音質が劣化するという問題が生じる。
【解決手段】ビットリザーバー制御手段16により、符号化に使用可能なビットの量を設定する。インテンシティステレオ帯域設定手段17Aを設け、フレーム毎の使用可能なビットの量が所定のしきい値ATH(ATHは正整数)より小さい場合に、インテンシティ(強度)ステレオ符号化を行なう部分周波数領域を増大させる。
【選択図】 図1
【解決手段】ビットリザーバー制御手段16により、符号化に使用可能なビットの量を設定する。インテンシティステレオ帯域設定手段17Aを設け、フレーム毎の使用可能なビットの量が所定のしきい値ATH(ATHは正整数)より小さい場合に、インテンシティ(強度)ステレオ符号化を行なう部分周波数領域を増大させる。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、複数のチャンネルのデジタルオーディオ信号を伝送又は記憶する際に情報量を減少するデジタルオーディオ信号の符号化装置に関する。
【0002】
【従来の技術】
近年のデジタルオーディオの分野では、従来のコンパクトディスク(CD)に比べて10分の1以下の低いビットレートで、高品位の音質を伝送又は記憶を可能にする様々なデジタルオーディオ信号の符号化技術が多く使われている。
【0003】
これらのオーディオ信号符号化技術には、ミニディスク(MD)で採用されているATRAC(Adaptive Transform Acoustic Coding)方式や、衛星デジタル放送で採用されている国際標準化機構(ISO:International Organization for Standardization)のMPEG(Motion Picture Experts Group)で規格化されているMPEG2−AACなどの各種方式がある。
【0004】
これらのデジタルオーディオ信号の符号化技術を用いた符号化装置では、まず入力されるデジタルオーディオ信号の時系列で連続するn個(nは正整数)のサンプルをまとめた単位をフレームとするとき、このフレームを単位として周波数軸上の成分を表すサブバンド信号あるいはスペクトルに変換する。変換にはQMF(Quadrature Mirror Filter)などの帯域分割フィルタ処理や、MDCT(Modified Discrete Cosine Transform)などの周波数変換処理といった公知のフィルタバンクあるいは変換プロセスが使用される。
【0005】
次に、最小可聴しきい値や同時マスキングなどの人間の聴覚心理特性に基づいて聴感上知覚されない、もしくは知覚され難い量子化雑音のレベルを許容して、サブバンド信号あるいはスペクトルを量子化するために量子化ビット数が割当てられる。このようなサブバンド信号あるいはスペクトルは、割当てられた量子化ビット数で量子化され、復号化時の量子化雑音は知覚されない、もしくは知覚され難いレベルに抑えられる。これにより音質を高品位に保ちながら、聴感上はあまり知覚されない部分の情報量を削減し、ビットレートの大幅な低減を実現している。
【0006】
量子化されたサブバンド信号あるいはスペクトルは、符号化されて所定の語長からなるビット列に変換されるとともに、量子化ビット数などの符号化補助情報が多重化されて、符号化ビット列として伝送又は記憶される。更に、符号化において公知のエントロピー符号化である可変長のハフマン符号を使用して、符号化効率を向上させる場合もある。符号化装置から出力、即ち伝送又は記憶された符号化ビット列は、復号化装置もしくは復号化方法で逆の処理を行って、デジタルオーディオ信号に復元されて出力される。
【0007】
このように人間の聴覚心理特性を利用することは、全体のビットレートの低減には大きな効果をもたらす。しかしながら、フレーム毎においては人間の聴覚心理特性に対して入力されるデジタルオーディオ信号の様態は異なるために、削減される情報量も異なる。すなわち、知覚され難い量子化雑音のレベルを許容するために必要な量子化ビット数が大きくて削減できる情報量の少ないフレームと、逆に必要な量子化ビット数が小さくて削減できる情報量の多いフレームとが存在する。このため、フレーム毎の符号化ビット列の情報量は一定にならない。
【0008】
その一方で、符号化ビット列を伝送もしくは記憶する装置及び方法、あるいは符号化ビット列を受信し復号する装置及び方法に対して、前記の両方の信号処理を簡単にするために符号化ビット列のビットレートを一定にすることが多い。この要求を満たすとともに、所定のビットレートに基づくフレーム毎のビットの量に対して、少ないビットの量で符号化される場合には余剰ビットの量を蓄えておく。また所定のビットレートに基づくフレーム毎のビットの量に対して、符号化に必要なビットの量が多い場合には、蓄えている余剰ビットの量を加え、使用可能なビットの量を部分的に増大して音質の劣化を低減する方法がある。このような方法のために、余剰ビットを蓄えるバッファを設ける場合もある。
【0009】
更に、上記のようなデジタルオーディオ信号の符号化技術において、符号化効率を改善する方法として複数のチャンネルからなるデジタルオーディオ信号の双対となる(例えば左と右のチャンネルの)ステレオ信号に対して、ステレオ符号化と呼ばれる技術が用いられる。最も一般的なステレオ符号化は、センター/サイド(MS)ステレオ符号化と、インテンシティ(強度)ステレオ符号化である。
【0010】
MSステレオ符号化は、ステレオ信号の和で求められるセンター信号と、差で求められるサイド信号とを生成し、ステレオ信号の代わりにセンター信号とサイド信号とを符号化する。これにより、ステレオ信号が同符号で類似する場合にはサイド信号の振幅が小さくなり、逆に異符号で類似する場合にはセンター信号の振幅が小さくなる。このような方法によれば、符号化時の量子化ビット数が小さくなるために、ステレオ信号を直接符号化する場合に比べて、符号化効率を改善することができる。(例えば、非特許文献1参照。)
【0011】
一方、インテンシティ(強度)ステレオ符号化は、ステレオ信号から統合信号を生成し、左/右の分布を示す付加的な強度情報を生成するものである。これにより、統合信号を符号化するので、ステレオ信号を符号化する場合に比べて大幅に符号化効率を改善することができる。以下の説明では、「インテンシティ(強度)ステレオ」を単にインテンシティステレオと呼ぶ。(例えば、非特許文献2参照。)
【0012】
図7は、インテンシティステレオ符号化と、余剰ビットを蓄えるバッファ(以下の説明では「ビットリザーバー」と呼ぶ)を用いた従来のデジタルオーディオ信号の符号化装置の構成を示すブロック図である。
【0013】
図7において、一連の符号化プロセスは、時系列上のn個(nは正整数)のサンプルをまとめたフレームを単位として実行される。時間/周波数変換手段10及び11は、時間軸上で連続するサンプルの左/右チャンネルの入力信号SINLとSINRを、各々スペクトルSPCL1とSPCR1とに変換するものである。
【0014】
変換ブロック長設定手段12及び13は、フレーム毎の時系列のサンプルの個数をm(mは正整数)とするとき、mの値をm=n及びm<nのいずれか一方となるようサブブロックを単位として変換するものである。以下の説明では、m=nとなるサブブロックを「長ブロック」と呼び、m<nとなるサブブロックを「短ブロック」と呼ぶ。例えばmはn=m×k(kは正整数)式で成り立ち、短ブロックに設定された場合は1フレームの期間にm個のサンプルから成るサブブロックをk個包含する。変換ブロック長の設定は入力信号の様態に応じて設定される。
【0015】
このような変換ブロック長の切り替えにおいて、例えば振幅の変化量が著しく増大する入力信号を長ブロックでスペクトルに変換し、量子化及び符号化を行なったときには、復号化時に量子化雑音がフレームの全てのサンプルに重畳されて出現する。この場合、信号振幅が小さいときに量子化雑音が知覚される。
【0016】
この現象を防ぐために、短ブロックを選択することにより、量子化雑音がブロック内のサンプルのみに重畳される。この場合、継時マスキングと呼ばれる人間の聴覚心理特性により、量子化雑音が知覚され難くなる。但し、時間軸の分解能が高い短ブロックでスペクトルに変換することにより、全周波数領域に亘るスペクトルの総数は少なくなり、すなわち周波数軸の分解能は低くなる。
【0017】
インテンシティステレオ符号化手段14は、スペクトルSPCL1とSPCR1とから統合モノラルスペクトルSPCi1を生成するものである。MPEG2−AAC方式のインテンシティステレオ符号化では、複数のスペクトルをまとめたバンド毎の左/右チャンネルにおけるスペクトルの2乗の累算で求められるエネルギーの比に基づいて、左/右の分布を示す付加的な強度情報を求める。そして、左/右のスペクトルの和にエネルギーの比の2乗根を乗じて統合スペクトルを求める。(非特許文献3を参照。)
【0018】
インテンシティステレオ符号化は、所定の部分周波数領域のスペクトルを包含するバンドに対して行なわれる。左チャンネルのスペクトルSPCL1のインテンシティステレオ符号化を行なうバンドのスペクトルは、統合スペクトルSPCi1に置換されてスペクトルSPCL2として出力される。また、右チャンネルのスペクトルSPCR1のインテンシティステレオ符号化を行なうバンドのスペクトルは、ゼロに置換されてスペクトルSPCR2として出力される。これにより、インテンシティステレオ符号化によりゼロに置換された右チャンネルのスペクトルは、削除され伝送又は記憶されない。このために、情報量の大幅な削減が期待される。
【0019】
MPEG2−AAC方式の規格書では、標準的な信号に対してはインテンシティステレオ符号化を行なう部分周波数領域の下限周波数を6kHzとするのが適当であると記載されている。但し、インテンシティステレオ符号化が行なわれるためには、全周波数領域に亘る左/右チャンネルのスペクトルが同一の数で構成されていなければならない。すなわち、時間/周波数変換を行なう際の左/右チャンネルの変換ブロック長は同一でなければならない。左/右チャンネルの変換ブロック長が異なる場合は、インテンシティステレオ符号化は行なわれない。
【0020】
更に、付加的な強度情報を複数のスペクトルをまとめたバンド毎に算出し、これを符号化補助情報に包含して伝送又は記憶する場合を考える。短ブロックで時間/周波数変換が行われる場合においては、複数のサブブロックをグループ化して共通の付加的な強度情報として情報量の削減をして符号化効率の向上を図る。この場合には、左/右チャンネルにおけるサブブロックのグループ化の構成がやはり同一でなければならない。
【0021】
量子化及び符号化手段15は、左/右チャンネルのスペクトルSPCL2とSPCR2とを人間の聴覚心理特性と、後述のビットリザーバー制御手段16により設定されるフレーム毎の使用可能なビットの量に基づいて量子化と符号化を行ない、ビット列に変換する。そして量子化及び符号化手段15は、符号化補助情報を多重化して符号化ビット列を生成する。
【0022】
ビットリザーバー制御手段16は、所定のビットレートに基づくフレーム毎のビットの量に対して少ないビットの量で符号化される場合には余剰ビットの量を蓄えておき、所定のビットレートに基づくフレーム毎のビットの量に対して符号化に必要なビットの量が多い場合には蓄えている余剰ビットの量を加え、使用可能なビットの量を部分的に増大して音質の劣化を低減するための余剰ビットを蓄える。ビットリザーバー制御手段16はビットリザーバーを備え、全体の符号化ビット列が所定のビットレートになるようにビットリザーバーに蓄えるビットの量を制御する。
【0023】
図8は、インテンシティステレオ符号化による符号化効率の改善を表す説明図である。図8の縦軸はスペクトルの振幅を示し、横軸はスペクトルの周波数を示す。また、説明を簡単にするために全周波数に亘るスペクトルの総数は24本とし、隣接するスペクトルを4本ずつまとめて6つのバンドから構成されるとしている。インテンシティステレオ符号化は、横軸に示す周波数f0より高い周波数の領域のスペクトルに対して行なうものとする。
【0024】
図8において、(a1)は左チャンネルのスペクトルSPCL1を示し、(a2)は右チャンネルのスペクトルSPCR1を示す。また図9の(a3)は(a1)の左チャンネルのスペクトルSPCL1と(a2)の右チャンネルのスペクトルSPCR1とを量子化し、符号化した場合の情報量の総和を示す模式図である。
【0025】
図9の(a3)において、DL1は(a1)の左チャンネルにおけるスペクトルSPCL1中の周波数f0より低い周波数領域のスペクトルの情報量を示す。DL2は図8の(a1)の左チャンネルにおけるスペクトルSPCL1中の周波数f0より高い周波数領域のスペクトルの情報量を示す。DR1は図8の(a2)の右チャンネルSPCR1のスペクトル中の周波数f0より低い周波数領域のスペクトルの情報量を示す。DR2は図8の(a2)の右チャンネルにおけるスペクトルSPCR1中の周波数f0より高い周波数領域のスペクトルの情報量を示す。これらの情報量は各スペクトルを量子化及び符号化した場合の情報量である。情報量の総和T1は、図9の(a3)に示すようにT1=DL1+DL2+DR1+DR2で表わされる。
【0026】
また、図8の(b1)はインテンシティステレオ符号化を行なった場合のスペクトルSPCL2を示す。(b2)は右チャンネルのスペクトルSPCR2を示す。インテンシティステレオ符号化を行なうことにより、(b1)の左チャンネルにおけるスペクトルSPCL2中の周波数f0より高い周波数のインテンシティステレオ符号化が施されるスペクトルは、統合スペクトルSPCi1に置換されている。
【0027】
また、図8の(b2)に示すように、右チャンネルSPCR2の周波数f0より高い周波数のインテンシティステレオ符号化が施されるスペクトルはゼロに置換されている。また、図9の(b3)は図8の(b1)の左チャンネルのスペクトルSPCL2と、図8の(b2)の右チャンネルSPCR2のスペクトルを量子化し、符号化した場合の情報量の総和を示す。
【0028】
図9の(b3)において、DL1は左チャンネルにおけるスペクトルSPCL2中の周波数f0より低い周波数領域のスペクトルの情報量を示す。Di1は(b1)の左チャンネルにおけるスペクトルSPCL2中の周波数f0より高い周波数の領域の統合スペクトルSPCi1に置換されたスペクトルの情報量を示す。DR1は(b2)の右チャンネルにおけるスペクトルSPCR2中の周波数f0より低い周波数領域のスペクトルの情報量を示す。これらの情報量は各スペクトルを量子化及び符号化した場合の情報量である。情報量の総和T2は、図9の(b3)に示すようにT2=DL1+DR1+Di1で表わされる。
【0029】
図8の(b2)に示すように、右チャンネルの周波数f0より高い周波数領域においては、インテンシティステレオ符号化が施されるスペクトルはゼロに置換される。このため、伝送又は記憶されないので情報量として加算されない。これにより、インテンシティステレオ符号化を行なう場合の情報量の総和T2は、インテンシティステレオ符号化を行なわない場合の情報量の総和T1に比べて少なくなり、符号化効率を改善することができる。但し、この例では図9の(b3)に示すように、インテンシティステレオを行なわない周波数f0より低い周波数の領域では、この領域のスペクトルを量子化及び符号化した場合の情報量DL1が、(a3)の同じ符号で表されるDL1と同じ情報量となるようにしている。
【0030】
また、図9の(b3)に示すインテンシティステレオを行なわない周波数f0より低い周波数の領域では、この領域のスペクトルを量子化及び符号化した場合の情報量DR1が、(a3)の同じ符号で表される情報量DR1と同じになるようにしている。また、図8の(a1)に示す左チャンネルの周波数f0より高い周波数領域のスペクトルを量子化及び符号化による情報量DL2と、(b1)に示すインテンシティステレオ符号化を行なう周波数f0より高い周波数の統合スペクトルSPCi1を量子化及び符号化した場合の情報量Di1とが同じになるようにしている。
【0031】
図10は、図7に示す符号化装置でインテンシティステレオ符号化を用いて生成された符号化ビット列を復号する復号化装置の構成を示すブロック図である。図10において、復号化及び逆量子化手段61は入力される符号化ビット列に包含される符号化補助情報を分解するとともに、復号化及び逆量子化を行って左チャンネルのスペクトルSPCL3と、右チャンネルのスペクトルSPCR3を出力するものである。復号化及び逆量子化手段61から出力され、左チャンネルにおけるスペクトルSPCL3の中のインテンシティステレオ符号化が施されている部分周波数領域のスペクトルは、統合化スペクトルSPCi2からなる。
【0032】
インテンシティステレオ処理手段62は、左チャンネルにおけるスペクトルSPCL3の中の統合スペクトルSPCi2と、分解された符号化補助情報の中の左/右の分布を示す付加的な強度情報とを用いて、右チャンネルにおけるスペクトルSPCR3の中のインテンシティステレオ符号化を行なう周波数f0より高い部分の伝送又は記憶されない周波数領域のスペクトルを生成する。またインテンシティステレオ処理手段62は、スペクトルSPCR3のインテンシティステレオ符号化を行う周波数f0より低い周波数のスペクトルと周波数f0より高い周波数のスペクトルとを合成し、スペクトルSPCR4を出力する。
【0033】
また、インテンシティステレオ処理手段62は、復号化及び逆量子化手段61から出力される左チャンネルのスペクトルSPCL3をスペクトルSPCL4として出力する。周波数/時間変換手段63と64は、周波数軸上の右チャンネルのスペクトルSPCL4と、右チャンネルのスペクトルSPCR4とをそれぞれ時系列のデジタルオーディオ信号のサンプルSOUTL及びSOUTRに変換して出力する。
【0034】
図11は、図10に示す復号化装置における各手段のスペクトルを示す説明図である。図11では、縦軸はスペクトルの振幅を示し、横軸はスペクトルの周波数を示す。また、説明を簡単にするために、全周波数に亘るスペクトルの総数は24本とし、隣接するスペクトルを4本ずつまとめて6つのバンドから構成されるとしている。インテンシティステレオ符号化は周波数f0より高い周波数領域のスペクトルに対して行なうものとする。
【0035】
図11において、(c1)は復号化及び逆量子化手段61から出力される統合スペクトルSPCi2を包含する左チャンネルのスペクトルSPCL3を示す。(c2)は復号化及び逆量子化手段61から出力される右チャンネルのスペクトルSPCR3を示す。(d1)はインテンシティステレオ処理手段62から出力される左チャンネルのスペクトルSPCL4であり、(c1)のSPCL3と同じである。(d2)はインテンシティステレオ復号化手段62から出力される左チャンネルのスペクトルSPCR2を示す。(d2)は(c2)のSPCR3に対して(c1)の左チャンネルのスペクトルSPCL3に包含される統合スペクトルSPCi2を変換すべく、左/右の分布を示す付加的な強度情報を用いて擬似スペクトルを生成した後に結合して出力されたものである。
【0036】
【非特許文献1】
J.D.Johnston著「広帯域ステレオ信号の知覚変換符号化(Perceptual Transform Coding of Wideband Stereo Signals)」IEEE/ICASSP、1989年、p.1993−1993
【非特許文献2】
R.V.R.Vanderwaal著「ステレオフォニックデジタル信号のサブバンド符号化(Subband Coding of stereophonic digital signals)」IEEE/ICASSP、1991年、p.3601−3604
【非特許文献3】
「Advanced Audio Coding ANNEX B Informative Part」ISO/IEC、IS−13818−7
【0037】
【発明が解決しようとする課題】
しかしながら、上記の従来の技術におけるデジタルオーディオ信号の符号化装置及び方法では、符号化に必要なビットの量が多いフレームや、短ブロックの変換ブロック長で時間/周波数変換を行うフレームが短い期間の間に集中する場合において、ビットリザーバーに蓄えている余剰ビットの量が著しく低減し、符号化に使用可能なビットの量が低減する。このような状態では、所定のビットレートを保ちながら使用可能なビットの量を増大させることができなくなる。このような場合、量子化及び符号化によりスペクトルが欠落して、符号化信号を復号化したときの再生信号の歪み感が増大して音質が劣化するという問題があった。
【0038】
本発明は、このような従来の問題点に鑑みてなされたものであって、符号化に必要なビットの量が多いフレームや、短ブロックの変換ブロック長で時間/周波数変換を行うフレームが短い期間の間に集中し、符号化に使用可能なビットの量が低減する場合に、量子化及び符号化によりスペクトルが欠落することを阻止し、符号化信号を復号化したときの再生信号の歪み感が無くし、音質が劣化しないデジタルオーディオ信号の符号化装置及び方法を実現することを目的とする。
【0039】
【課題を解決するための手段】
本願の請求項1の発明は、Nチャンネル(Nは2以上の正整数)のデジタルオーディオ信号の時系列のn個(nは正整数)のサンプルをまとめたフレーム毎に周波数軸上のスペクトルに変換し、スペクトルを量子化した後にエントロピー符号化により符号化し、符号化情報を多重化して符号化ビット列を生成して出力する際に、スペクトルにインテンシティステレオ符号化を行なって情報量を減少するデジタルオーディオ信号の符号化装置であって、各チャンネルの時系列のサンプルを周波数領域のスペクトルに変換する時間/周波数変換手段と、前記時間/周波数変換手段で時系列のサンプルを、サブブロックを単位として周波数領域のスペクトルに変換するとき、サンプルの個数m(mは正整数)をm=n及びm<nのいずれか一方となるよう設定する変換ブロック長設定手段と、Nチャンネルのスペクトルの部分周波数領域に対してインテンシティステレオ符号化を行なうインテンシティステレオ処理手段と、前記インテンシティステレオ処理手段から出力されたスペクトルを量子化し、フレーム毎の使用可能なビット量に基づいて符号化し、符号化補助情報を多重して符号化ビット列を生成する量子化及び符号化手段と、フレーム毎の余剰ビット量をビットリザーバーに蓄えると共に、前記ビットリザーバーに蓄えられているビット量と出力ビットレートとを用いてフレーム毎の使用可能なビット量を設定するビットリザーバー制御手段と、フレーム毎の使用可能なビット量が所定のしきい値ATH(ATHは正整数)より小さい場合に、インテンシティステレオ符号化を行なう部分周波数領域を増大させるインテンシティステレオ帯域設定手段と、を具備することを特徴とするものである。
【0040】
本願の請求項2の発明は、請求項1のデジタルオーディオ信号の符号化装置において、前記インテンシティステレオ帯域設定手段は、時系列の連続するL個(Lは2以上の正整数)のフレームの使用可能なビット量が所定のしきい値ATH(ATHは正整数)より小さいフレームを帯域制御対象フレームとするとき、前記帯域制御対象フレームの数が所定のしきい値BTH(BTHはL以下の正整数)より大きい場合に、インテンシティステレオ符号化を行なう部分周波数領域を増大させることを特徴とするものである。
【0041】
本願の請求項3の発明は、請求項1のデジタルオーディオ信号の符号化装置において、前記インテンシティステレオ帯域設定手段は、時系列の連続するL個(Lは2以上の正整数)のフレームの前記変換ブロック長設定手段の設定する変換ブロック長を記憶保持し、記憶保持するL個の変換ブロック長のうちm<nのサブブロックで変換するフレームの数が所定のしきい値CTH(CTHはL以下の正整数)より大きい場合に、インテンシティステレオ符号化を行なう部分周波数領域を増大させることを特徴とするものである。
【0042】
本願の請求項4の発明は、Nチャンネル(Nは2以上の正整数)のデジタルオーディオ信号の時系列のn個(nは正整数)のサンプルをまとめたフレーム毎に周波数軸上のスペクトルに変換し、スペクトルを量子化した後にエントロピー符号化により符号化し、符号化情報を多重化して符号化ビット列を生成して出力する際に、スペクトルにインテンシティステレオ符号化を行なって情報量を減少するデジタルオーディオ信号の符号化方法であって、各チャンネルの時系列のサンプルを、サブブロックを単位として周波数領域のスペクトルに変換するとき、変換するサンプルの個数m(mは正整数)をm=n及びm<nのいずれか一方となるよう設定し、Nチャンネルのスペクトルの部分周波数領域にインテンシティステレオ符号化を行ない、前記インテンシティステレオ処理により出力されたスペクトルを量子化し、フレーム毎の使用可能なビット量に基づいて符号化すると共に、符号化補助情報を多重して符号化ビット列を生成し、フレーム毎の余剰ビット量をビットリザーバーに蓄えると共に、前記ビットリザーバーに蓄えられているビット量と出力ビットレートとを用いてフレーム毎の使用可能なビット量を設定し、フレーム毎の使用可能なビット量が所定のしきい値ATH(ATHは正整数)より小さい場合に、インテンシティステレオ符号化を行なう部分周波数領域を増大させることを特徴とするものである。
【0043】
本願の請求項5の発明は、請求項4のデジタルオーディオ信号の符号化方法において、前記インテンシティステレオ符号化における帯域設定は、時系列の連続するL個(Lは2以上の正整数)のフレームの使用可能なビット量が所定のしきい値ATH(ATHは正整数)より小さいフレームを帯域制御対象フレームとするとき、前記帯域制御対象フレームの数が所定のしきい値BTH(BTHはL以下の正整数)より大きい場合に、インテンシティステレオ符号化を行なう部分周波数領域を増大させることを特徴とするものである。
【0044】
本願の請求項6の発明は、請求項4のデジタルオーディオ信号の符号化方法において、前記インテンシティステレオ符号化における帯域設定は、時系列の連続するL個(Lは2以上の正整数)のフレームにおけるおける変換ブロック長を記憶保持し、記憶保持するL個の変換ブロック長のうちm<nのサブブロックで変換するフレームの数が、所定のしきい値CTH(CTHはL以下の正整数)より大きい場合に、インテンシティステレオ符号化を行なう部分周波数領域を増大させることを特徴とするものである。
【0045】
【発明の実施の形態】
本発明の各実施の形態におけるデジタルオーディオ信号の符号化装置及び方法について、図面を参照しつつ説明する。以下の説明において一連の符号化プロセスは、時系列のデジタルオーディオ信号に対し、n個(nは正整数)のサンプルをまとめたフレームを単位として実行される。
【0046】
(実施の形態1)
図1は、本発明の実施の形態1におけるデジタルオーディオ信号の符号化装置の構成を示すブロック図である。以下に、各構成ブロックとその動作について説明する。時間/周波数変換手段10及び11は、時系列のn個のサンプルで構成される左チャンネルの入力信号SINLと右チャンネルの入力信号SINRとを、各々左チャンネルのスペクトルSPCL1と右チャンネルのスペクトルSPCR1とに変換する。時間/周波数変換手段10及び11は、左/右チャンネルにおけるフレーム毎のn個のサンプルを、後述する変換ブロック長設定手段12及び13から通知されるフラグFL又はFRに従って、短ブロック又は長ブロックのサブブロック毎にスペクトルSPCL1とSPCR1に変換して出力する。
【0047】
変換ブロック長設定手段12及び13は、フレーム毎の時系列のサンプルを個数m(mは正整数)の値をm=n及びm<nのいずれか一方となるようサブブロックを単位として変換する。以下の説明では、m=nとなるサブブロックを「長ブロック」と呼び、m<nとなるサブブロックを「短ブロック」と呼ぶ。例えばmはn=m×k(kは正整数)式で成り立ち、短ブロックに設定された場合は1フレームの期間にm個のサンプルから成るサブブロックをk個包含する。変換ブロック長の設定は入力信号の様態に応じて設定される。このような変換ブロック長の切り替えについては、従来のデジタルオーディオ信号の符号化装置の構成を示す図7の変換ブロック長設定手段12及び13と同じである。
【0048】
変換ブロック長設定手段12及び13は、入力されるデジタルオーディオ信号の時系列の左/右チャンネルにおけるフレーム毎のn個のサンプルで構成される左チャンネルの入力信号SINLと、右チャンネルの入力信号SINRとを解析する。そして、振幅の変化量が大きい信号(例えば、カスタネットなどの打楽器による信号)は短ブロックで時間/周波数変換するように、あるいはそれ以外の振幅の変化量が小さい信号は長ブロックで時間/周波数変換するように、時間/周波数変換手段10及び11に対して変換ブロック長を設定するフラグFL又はFRを出力する。
【0049】
インテンシティステレオ処理手段14は、左チャンネルのスペクトルSPCL1と右チャンネルのスペクトルSPCR1とから統合モノラルスペクトルSPCI1を生成する。インテンシティステレオ処理手段を実現する方法の例としては、従来のデジタルオーディオ信号の符号化装置を示す図7のインテンシティステレオ処理手段14と同じである。左チャンネルのスペクトルSPCL1と右チャンネルのスペクトルSPCR1に対して、設定され得る周波数fiより高い周波数の領域のスペクトルに対して、インテンシティステレオ符号化が行なわれる。
【0050】
また、左チャンネルにおけるスペクトルSPCL1中の周波数fiより高い周波数の領域は、統合スペクトルSPCi1に置換されてスペクトルSPCL2として出力される。また、右チャンネルにおけるスペクトルSPCR1中の周波数fiより高い周波数の領域のスペクトルは、ゼロに置換されてスペクトルSPCR2として出力される。更に、インテンシティステレオ符号化が行われる部分周波数領域の右/左の分布を示す付加的な強度情報も算出される。但し、インテンシティステレオが行なわれるためには、従来のデジタルオーディオ信号の符号化装置を示す図7のインテンシティステレオ処理手段14と同様の条件でなければならない。
【0051】
また、上記のインテンシティステレオ処理手段14の動作の説明は、設定され得る周波数fiより高い周波数のスペクトルに対してインテンシティステレオ符号化を行なう例を対象としている。しかし、インテンシティステレオ符号化を行なう部分周波数領域の設定に別の方法を用いることも可能である。
【0052】
量子化及び符号化手段15は、インテンシティステレオ処理手段14から出力される左チャンネルのスペクトルSPCL2と右チャンネルのスペクトルSPCR2とに対して、人間の聴覚心理特性と、後述のビットリザーバー制御手段16により設定されるフレーム毎の使用可能なビットの量とに基づいて量子化と符号化を行なう。そして量子化及び符号化手段15は量子化と符号化の結果をビット列に変換するとともに、符号化補助情報を多重化して符号化ビット列を生成する。
【0053】
ビットリザーバー制御手段16は、所定のビットレートに基づくフレーム毎のビットの量に対して、少ないビットの量で符号化される場合には余剰ビットの量RBITをビットリザーバーに蓄えておく。またビットリザーバー制御手段16は、所定のビットレートに基づくフレーム毎のビットの量に対して、符号化に必要なビットの量が多い場合にはビットリザーバーに蓄えている余剰ビットの量を加え、使用可能なビットの量ABITを部分的に増大して音質の劣化を低減する。
こうしてビットリザーバー制御手段16は、全体の符号化ビット列が所定のビットレートになるように、ビットリザーバーに蓄えるビットの量を制御する。
【0054】
インテンシティステレオ帯域設定手段17Aは、ビットリザーバー制御手段16の出力するフレーム毎の使用可能ビットの量ABITを用いて、インテンシティステレオ符号化を行なう部分周波数領域を設定する。ビットリザーバー制御手段16から出力されるフレーム毎の使用可能なビットの量ABITが所定のしきい値ATH(ATHは正整数)より大きい場合には、インテンシティステレオ帯域設定手段17Aはインテンシティステレオ符号化を行なう部分周波数領域の下限の周波数fiを所定のf0に設定する。逆にフレーム毎の使用可能なビットの量ABITが所定のしきい値ATH(ATHは正整数)より小さいフレームを帯域制御対象フレームとすると、帯域制御対象フレームの場合には、インテンシティステレオ帯域設定手段17Aはインテンシティステレオ符号化を行なう部分周波数領域の下限の周波数fiを、インテンシティステレオ符号化を行う部分周波数範囲を増大させるべく、所定のf1(f1<f0)に設定する。
【0055】
インテンシティステレオ帯域設定手段17Aは、次のような方法で帯域を設定してもよい。すなわち、インテンシティステレオ帯域設定手段17Aは、時系列の連続するL個(Lは2以上の正整数)のフレーム毎にビットリザーバー制御手段16から出力される使用可能なビットの量をABITとすると、このABITを記憶保持するバッファを備えるものとする。そしてこのビット量ABITが所定のしきい値ATHより小さいフレームの数が、所定のしきい値BTH(BTHはL以下の正整数)より小さい場合には、インテンシティステレオ符号化を行なう部分周波数領域の下限の周波数fiを所定のf0に設定する。またビット量ABITが所定のしきい値ATHより小さいフレームの数が、所定のしきい値BTHより大きい場合には、インテンシティステレオ符号化を行なう部分周波数領域の下限の周波数fiを所定のf1(f1<f0)に設定する。
【0056】
上記のインテンシティステレオ帯域設定手段17Aの動作の説明では、設定され得る周波数fiより高い周波数のスペクトルに対してインテンシティステレオ符号化を行なう例を対象とした。しかし、インテンシティステレオ符号化を行なう部分周波数領域を増大させるには別の方法を用いることも可能である。また、上記のインテンシティステレオ帯域設定手段17Aは、設定され得る周波数fiをf0又はf1の2つの設定のどちらかに切り替えるようにした。しかし、2つ以上の複数の設定値を用意して、この中のいずれかの設定値を選択するように切り替える方法を用いることも可能である。
【0057】
図2は、図1のデジタルオーディオ信号の符号化装置において、部分周波数領域のスペクトルに対してインテンシティステレオ符号化を行なった場合の符号化効率の改善を表す説明図である。詳しくはビットリザーバー制御手段16から出力されるフレーム毎の使用可能なビットの量ABITと所定のしきい値ATHとの大小関係に基づき、インテンシティステレオ帯域設定手段17Aで設定される所定の周波数をf0あるいはf1(f1<f0)に設定する例を示している。また図3は左チャンネルのスペクトルSPCL1と右チャンネルのスペクトルSPCR1とを量子化し、符号化した場合の情報量の総和を示す模式図である。
【0058】
図2において、縦軸はスペクトルの振幅を示し、横軸はスペクトルの周波数を示す。また、説明を簡単にするために全周波数に亘るスペクトルの総数は24本とし、隣接するスペクトルを4本ずつまとめ、6つのバンドから構成されるものとする。図2の(b1)及び(b2)と図3の(b3)は、インテンシティステレオ符号化による符号化効率の改善を表す図8及び図9の説明図と内容が同じである。
【0059】
また、図2において(e1)は、インテンシティステレオ帯域設定手段17Aで設定される所定の周波数f1(f1<f0)より高い部分周波数領域のスペクトルに対して、インテンシティステレオ符号化を行なった場合のスペクトルSPCL2を示し、(e2)は右チャンネルのスペクトルSPCR2を示す。本実施の形態のインテンシティステレオ符号化を行なうことにより、(e1)の左チャンネルのスペクトルSPCL2において、周波数f1より高い周波数のインテンシティステレオ符号化を施されるスペクトルが統合スペクトルSPCi1に置換されている。
【0060】
また、(e2)の右チャンネルにおけるスペクトルSPCR2において、周波数f1より高い周波数のインテンシティステレオ符号化を施されるスペクトルがゼロに置換されている。また図3の(e3)は、図2における(e1)の左チャンネルのスペクトルと(e2)の右チャンネルのスペクトルとを量子化して符号化した場合の情報量の総和を示す。
【0061】
図3の(e3)において、DL3は左チャンネルにおけるスペクトルSPCL2の中の周波数f1より低い周波数領域のスペクトルの情報量である。Di2は(e1)の左チャンネルにおけるスペクトルSPCL2の中の周波数f1より高い周波数領域の統合スペクトルに置換されたスペクトルの情報量である。DR3は(e2)の右チャンネルにおけるスペクトルSPCR2の中の周波数f1より低い周波数領域のスペクトルの情報量である。これらの情報量は各スペクトルが量子化及び符号化された場合の値である。これらの情報量の総和T3は、T3=DL3+DR3+Di2で示される。
【0062】
図2の(e2)に示すように、右チャンネルのスペクトルSPCR2の周波数f1より高い周波数領域において、インテンシティステレオ符号化を施されるスペクトルはゼロに置換され、伝送又は記憶されないので、情報量として加算されない。これにより、インテンシティステレオ符号化を行なう場合の情報量の総和T3は、図9に示すインテンシティステレオ符号化を行なわない場合の情報量の総和T1に比べて少なくすることができ、符号化効率を更に改善することができる。
【0063】
また、周波数f0より高い部分周波数領域のスペクトルに対してインテンシティステレオ符号化を行なう場合と比較して、周波数f1より高い部分周波数領域のスペクトルにインテンシティステレオ符号化を行なうと、右チャンネルのインテンシティステレオ符号化によりゼロに置換されるスペクトルの数が増大する。このために、右チャンネルのスペクトルの情報量DR3が情報量DR1より低減される。これにより、周波数f1より高い部分周波数領域のスペクトルに対して、インテンシティステレオ符号化を行なう場合の情報量の総和T3は、周波数f0より高い部分周波数領域のスペクトルにインテンシティステレオ符号化を行なう場合の情報量の総和T2に比べて少なくなる。このため、符号化効率を改善することができる。
【0064】
図4は、本発明の実施の形態1において、フレーム毎のインテンシティステレオ符号化を行う部分周波数帯域の設定範囲の変化を示すタイムチャートである。図4の横軸は時系列に連続するフレーム番号を示し、上段のタイムチャートの縦軸は、ビットリザーバー制御手段16から出力されるフレーム毎の使用可能なビットの量ABITを表す。ATHは、インテンシティステレオ帯域設定手段17Aにより、インテンシティステレオ符号化を行う部分周波数帯域の下限の周波数をf0もしくはf1に切り替える基準となる所定のしきい値である。下段のタイムチャートの縦軸は周波数を表す。
【0065】
図4に示すように、インテンシティステレオ帯域設定手段17Aは、ビットリザーバー制御手段16から出力される使用可能なビットの量ABITの値が所定のしきい値ATHより小さくなる第3フレーム及び第5フレームにおいて、インテンシティステレオ符号化を行う部分周波数帯域の下限の周波数をf1に設定するようにしている。
【0066】
これにより、フレーム毎の使用可能なビットの量ABITが所定のしきい値ATH(ATHは正整数)より小さい場合で、使用可能なビットの量ABITが著しく減少して量子化及び符号化でスペクトルが欠落する可能性があるとき、インテンシティステレオ符号化を行なう部分周波数領域の範囲を増大させる。すなわちインテンシティステレオを行なう部分周波数領域の下限の周波数を、f0からf1(f1<f0)に移すことで、符号化効率が改善され少ないビットの量で量子化及び符号化を行うことができる。この場合、量子化及び符号化でスペクトルが欠落する可能性を低減でき、音質の劣化を阻止することができる。
【0067】
尚、上記の実施の形態1で述べられた一連の符号化プロセスは、ソフトウェアプログラム言語によってコンピュータ又はデジタルシグナルプロセッサ(DSP)上で実現することも可能である。
【0068】
(実施の形態2)
次に本発明の実施の形態2におけるデジタルオーディオ信号の符号化装置について説明する。図5は実施の形態2におけるデジタルオーディオ信号の符号化装置の構成を示すブロック図である。なお、実施の形態1と同一のブロックは同一の符号を付け、各ブロックの動作について説明する。
【0069】
図5において、時間/周波数変換手段10及び11、変換ブロック長設定手段12及び13、インテンシティステレオ符号化手段14、量子化及び符号化手段15、及びビットリザーバー制御手段16は、図1のデジタルオーディオ信号の符号化装置における各手段と機能が同じである。
【0070】
インテンシティステレオ帯域設定手段17Bは、時系列の連続するL個(Lは2以上の正整数)のフレーム毎の変換ブロック長設定手段12及び13から出力される変換ブロック長を設定するフラグFL又はFRを記憶保持し、記憶保持したL個のフレーム毎のフラグFL又はFRに基づいて、インテンシティステレオ符号化を行なう部分周波数領域を設定する。インテンシティステレオ帯域設定手段17Bは、変換ブロック長設定手段12及び13から出力されるL個のフレーム毎の変換ブロック長を設定するフラグFL又はFRを記憶保持するためのバッファを備える。インテンシティステレオ帯域設定手段17Bは、バッファに記憶保持されるL個のフレーム毎の変換ブロック長を設定するフラグFL又はFRを参照し、短ブロックが設定されるフレーム数が、所定のしきい値CTH(CTHはL以下の正整数)より小さい場合には、インテンシティステレオ符号化を行なう部分周波数領域の下限の周波数fiを所定のf0に設定する。またインテンシティステレオ帯域設定手段17Bはバッファに記憶保持されるL個のフレーム毎の変換ブロック長を設定するフラグFL又はFRを参照し、短ブロックが設定されるフレーム数が所定のしきい値CTHより大きい場合には、インテンシティステレオ符号化を行なう部分周波数領域の下限の周波数fiを所定のf1(f1<f0)に設定する。
【0071】
上記のインテンシティステレオ帯域設定手段17Bの動作説明では、設定され得る周波数fiより高い周波数のスペクトルに対してインテンシティステレオ符号化を行なう例を対象としたが、インテンシティステレオ符号化を行なう部分周波数領域を増大させるには、別の方法を用いることも可能である。また、上記のインテンシティステレオ帯域設定手段17Bは、設定され得る周波数fiをf0又はf1の2つの設定のどちらかに切り替えたが、2つ以上の複数の設定値を用意して、この中のいずれかの設定値を選択するように切り替える方法を用いることもできる。
【0072】
変換ブロック長の切り替えは、図7の従来のデジタルオーディオ信号の符号化装置における変換ブロック長設定手段12及び13と同様の方法で行なわれる。複数の隣接するスペクトルをまとめたバンド毎に量子化及び符号化が行なわれるために、フレーム毎の量子化及び符号化されるバンド毎の符号化補助情報が伝送又は記憶されることになる。
【0073】
ここで、各バンドに包含されるスペクトルの数は予め定められている。一般的には低い周波数のスペクトルを包含するバンドのスペクトルの本数に比べて、高い周波数のスペクトルを包含するバンドのスペクトルの本数の方が多く設定される。また、各バンドのスペクトルの本数は人間の聴覚特性に基づいて設定される。伝送又は記憶される有効な周波数領域の範囲を一定にすると、短ブロックが選択される場合の伝送又は記憶されるバンドの数が長ブロックが選択される場合に比べて大きくなるために、符号化補助情報の伝送に多くのビットを要する。
【0074】
また、振幅の変化量が大きい信号に対しても量子化ノイズを知覚されないレベルに抑えるために量子化ビット数が大きくなる。このため、短ブロックのフレームは長ブロックのフレームに比べて多くのビットを消費する。このため、短ブロックのフレームが連続して出現する場合には、使用可能なビットの量ABITが著しく減少する可能性がある。
【0075】
図6は、本発明の実施の形態2におけるフレーム毎のインテンシティステレオ符号化を行う部分周波数帯域の設定範囲の変化を示すタイムチャートである。図6の横軸は時系列に連続するフレームを示す。上段のタイムチャートは、インテンシティステレオ帯域設定手段14に記憶保持されるフレーム毎の時間/周波数変換を行う際の変換ブロック長を示す。
【0076】
図6に示す例では、時系列に連続する3つのフレームの変換ブロック長を記憶保持し、F0が第nフレームの変換ブロック長であり、F1が第(n−1)フレームの変換ブロック長であり、F2が第(n−2)フレームの変換ブロック長であるとする。例えば、第4フレームの符号化処理を行う場合には、F0に第4フレームの変換ブロック長として短ブロックを示すフラグを記憶保持し、F1に第3フレームの変換ブロック長として短ブロックを示すフラグを記憶保持し、F2に第2フレームの変換ブロック長として長ブロックを示すフラグを記憶保持する。
【0077】
図6の下段のタイムチャートにおける縦軸は周波数を表す。図6に示すように、インテンシティステレオ帯域設定手段17Bは、変換ブロック長設定手段12及び13から出力される時系列で連続する3つのフレームの変換ブロック長を記憶保持する。インテンシティステレオ帯域設定手段17Bは記憶保持した3つのフレームの変換ブロック長のうち、所定のしきい値CTH(図6においては、CTH=2としている。)が短ブロックとなる第4フレーム及び第5フレームにおいて、インテンシティステレオ符号化を行う部分周波数帯域の下限の周波数をf1に設定する。
【0078】
変換ブロック長が時系列に連続して、あるいは短い期間の間に集中して短ブロックになることで、使用可能なビットの量ABITが著しく減少し、量子化及び符号化でスペクトルが欠落する場合を考える。このとき、インテンシティステレオ帯域設定手段17Bは時系列の連続するL個のフレーム毎の変換ブロック長を記憶保持し、記憶保持した変換ブロック長に基づいてインテンシティステレオを行なう部分周波数領域の下限の周波数をf0からf1(f1<f0)に移す。そして、インテンシティステレオ符号化を行なう部分周波数領域の範囲を増大することにより、符号化効率を改善し、少ないビットの量で量子化及び符号化を可能にする。こうすれば量子化及び符号化でスペクトルが欠落する可能性を低減でき、音質の劣化を阻止することができる。
【0079】
尚、上記の実施の形態2の説明にある一連の符号化プロセスは、ソフトウェアプログラム言語によってコンピュータ又はデジタルシグナルプロセッサ(DSP)上で実現することも可能である。
【0080】
【発明の効果】
本発明のデジタルオーディオ信号の符号化装置及び方法によれば、量子化及び符号化に使用可能なビットの量、及び時間/周波数変換の変換ブロック長に基づいて、インテンシティステレオ符号化を行なう部分周波数領域の範囲を適応的に変化させることにより、使用可能なビットの量が著しく減少した場合でも量子化及び符号化によりスペクトルが欠落するのを防ぐことができる。そしてスペクトルが欠落することによる歪み感の増大や、音質の劣化を阻止することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態1におけるデジタルオーディオ信号の符号化装置の構成を示すブロック図である。
【図2】実施の形態1におけるインテンシティステレオ符号化による符号化効率の改善効果を表す説明図(その1)である。
【図3】実施の形態1におけるインテンシティステレオ符号化による符号化効率の改善効果を表す説明図(その2)である。
【図4】実施の形態1において、フレーム毎のインテンシティステレオ符号化を行う部分周波数帯域の設定範囲の変化を示すタイムチャートである。
【図5】本発明の実施の形態2におけるデジタルオーディオ信号の符号化装置の構成を示すブロック図である。
【図6】実施の形態2において、フレーム毎のインテンシティステレオ符号化を行う部分周波数帯域の設定範囲の変化を示すタイムチャートである。
【図7】従来のデジタルオーディオ信号の符号化装置の構成を示すブロック図である。
【図8】従来のインテンシティステレオ符号化による符号化効率の改善効果を表す説明図(その1)である。
【図9】従来のインテンシティステレオ符号化による符号化効率の改善効果を表す説明図(その2)である。
【図10】インテンシティステレオ符号化を用いて生成された符号化ビット列を復号する復号化装置の構成を示すブロック図である。
【図11】インテンシティステレオ符号化を用いて生成された符号化ビット列を復号する復号化装置において、各ブロックのスペクトルを示す説明図である。
【符号の説明】
10、11 時間/周波数変換手段
12、13 変換ブロック長設定手段
14 インテンシティステレオ処理手段
15 量子化及び符号化手段
16 ビットリザーバー制御手段
17A、17B インテンシティステレオ帯域設定手段
61 復号化及び逆量子化手段
62 インテンシティステレオ処理手段
63、64 周波数/時間変換手段
【発明の属する技術分野】
本発明は、複数のチャンネルのデジタルオーディオ信号を伝送又は記憶する際に情報量を減少するデジタルオーディオ信号の符号化装置に関する。
【0002】
【従来の技術】
近年のデジタルオーディオの分野では、従来のコンパクトディスク(CD)に比べて10分の1以下の低いビットレートで、高品位の音質を伝送又は記憶を可能にする様々なデジタルオーディオ信号の符号化技術が多く使われている。
【0003】
これらのオーディオ信号符号化技術には、ミニディスク(MD)で採用されているATRAC(Adaptive Transform Acoustic Coding)方式や、衛星デジタル放送で採用されている国際標準化機構(ISO:International Organization for Standardization)のMPEG(Motion Picture Experts Group)で規格化されているMPEG2−AACなどの各種方式がある。
【0004】
これらのデジタルオーディオ信号の符号化技術を用いた符号化装置では、まず入力されるデジタルオーディオ信号の時系列で連続するn個(nは正整数)のサンプルをまとめた単位をフレームとするとき、このフレームを単位として周波数軸上の成分を表すサブバンド信号あるいはスペクトルに変換する。変換にはQMF(Quadrature Mirror Filter)などの帯域分割フィルタ処理や、MDCT(Modified Discrete Cosine Transform)などの周波数変換処理といった公知のフィルタバンクあるいは変換プロセスが使用される。
【0005】
次に、最小可聴しきい値や同時マスキングなどの人間の聴覚心理特性に基づいて聴感上知覚されない、もしくは知覚され難い量子化雑音のレベルを許容して、サブバンド信号あるいはスペクトルを量子化するために量子化ビット数が割当てられる。このようなサブバンド信号あるいはスペクトルは、割当てられた量子化ビット数で量子化され、復号化時の量子化雑音は知覚されない、もしくは知覚され難いレベルに抑えられる。これにより音質を高品位に保ちながら、聴感上はあまり知覚されない部分の情報量を削減し、ビットレートの大幅な低減を実現している。
【0006】
量子化されたサブバンド信号あるいはスペクトルは、符号化されて所定の語長からなるビット列に変換されるとともに、量子化ビット数などの符号化補助情報が多重化されて、符号化ビット列として伝送又は記憶される。更に、符号化において公知のエントロピー符号化である可変長のハフマン符号を使用して、符号化効率を向上させる場合もある。符号化装置から出力、即ち伝送又は記憶された符号化ビット列は、復号化装置もしくは復号化方法で逆の処理を行って、デジタルオーディオ信号に復元されて出力される。
【0007】
このように人間の聴覚心理特性を利用することは、全体のビットレートの低減には大きな効果をもたらす。しかしながら、フレーム毎においては人間の聴覚心理特性に対して入力されるデジタルオーディオ信号の様態は異なるために、削減される情報量も異なる。すなわち、知覚され難い量子化雑音のレベルを許容するために必要な量子化ビット数が大きくて削減できる情報量の少ないフレームと、逆に必要な量子化ビット数が小さくて削減できる情報量の多いフレームとが存在する。このため、フレーム毎の符号化ビット列の情報量は一定にならない。
【0008】
その一方で、符号化ビット列を伝送もしくは記憶する装置及び方法、あるいは符号化ビット列を受信し復号する装置及び方法に対して、前記の両方の信号処理を簡単にするために符号化ビット列のビットレートを一定にすることが多い。この要求を満たすとともに、所定のビットレートに基づくフレーム毎のビットの量に対して、少ないビットの量で符号化される場合には余剰ビットの量を蓄えておく。また所定のビットレートに基づくフレーム毎のビットの量に対して、符号化に必要なビットの量が多い場合には、蓄えている余剰ビットの量を加え、使用可能なビットの量を部分的に増大して音質の劣化を低減する方法がある。このような方法のために、余剰ビットを蓄えるバッファを設ける場合もある。
【0009】
更に、上記のようなデジタルオーディオ信号の符号化技術において、符号化効率を改善する方法として複数のチャンネルからなるデジタルオーディオ信号の双対となる(例えば左と右のチャンネルの)ステレオ信号に対して、ステレオ符号化と呼ばれる技術が用いられる。最も一般的なステレオ符号化は、センター/サイド(MS)ステレオ符号化と、インテンシティ(強度)ステレオ符号化である。
【0010】
MSステレオ符号化は、ステレオ信号の和で求められるセンター信号と、差で求められるサイド信号とを生成し、ステレオ信号の代わりにセンター信号とサイド信号とを符号化する。これにより、ステレオ信号が同符号で類似する場合にはサイド信号の振幅が小さくなり、逆に異符号で類似する場合にはセンター信号の振幅が小さくなる。このような方法によれば、符号化時の量子化ビット数が小さくなるために、ステレオ信号を直接符号化する場合に比べて、符号化効率を改善することができる。(例えば、非特許文献1参照。)
【0011】
一方、インテンシティ(強度)ステレオ符号化は、ステレオ信号から統合信号を生成し、左/右の分布を示す付加的な強度情報を生成するものである。これにより、統合信号を符号化するので、ステレオ信号を符号化する場合に比べて大幅に符号化効率を改善することができる。以下の説明では、「インテンシティ(強度)ステレオ」を単にインテンシティステレオと呼ぶ。(例えば、非特許文献2参照。)
【0012】
図7は、インテンシティステレオ符号化と、余剰ビットを蓄えるバッファ(以下の説明では「ビットリザーバー」と呼ぶ)を用いた従来のデジタルオーディオ信号の符号化装置の構成を示すブロック図である。
【0013】
図7において、一連の符号化プロセスは、時系列上のn個(nは正整数)のサンプルをまとめたフレームを単位として実行される。時間/周波数変換手段10及び11は、時間軸上で連続するサンプルの左/右チャンネルの入力信号SINLとSINRを、各々スペクトルSPCL1とSPCR1とに変換するものである。
【0014】
変換ブロック長設定手段12及び13は、フレーム毎の時系列のサンプルの個数をm(mは正整数)とするとき、mの値をm=n及びm<nのいずれか一方となるようサブブロックを単位として変換するものである。以下の説明では、m=nとなるサブブロックを「長ブロック」と呼び、m<nとなるサブブロックを「短ブロック」と呼ぶ。例えばmはn=m×k(kは正整数)式で成り立ち、短ブロックに設定された場合は1フレームの期間にm個のサンプルから成るサブブロックをk個包含する。変換ブロック長の設定は入力信号の様態に応じて設定される。
【0015】
このような変換ブロック長の切り替えにおいて、例えば振幅の変化量が著しく増大する入力信号を長ブロックでスペクトルに変換し、量子化及び符号化を行なったときには、復号化時に量子化雑音がフレームの全てのサンプルに重畳されて出現する。この場合、信号振幅が小さいときに量子化雑音が知覚される。
【0016】
この現象を防ぐために、短ブロックを選択することにより、量子化雑音がブロック内のサンプルのみに重畳される。この場合、継時マスキングと呼ばれる人間の聴覚心理特性により、量子化雑音が知覚され難くなる。但し、時間軸の分解能が高い短ブロックでスペクトルに変換することにより、全周波数領域に亘るスペクトルの総数は少なくなり、すなわち周波数軸の分解能は低くなる。
【0017】
インテンシティステレオ符号化手段14は、スペクトルSPCL1とSPCR1とから統合モノラルスペクトルSPCi1を生成するものである。MPEG2−AAC方式のインテンシティステレオ符号化では、複数のスペクトルをまとめたバンド毎の左/右チャンネルにおけるスペクトルの2乗の累算で求められるエネルギーの比に基づいて、左/右の分布を示す付加的な強度情報を求める。そして、左/右のスペクトルの和にエネルギーの比の2乗根を乗じて統合スペクトルを求める。(非特許文献3を参照。)
【0018】
インテンシティステレオ符号化は、所定の部分周波数領域のスペクトルを包含するバンドに対して行なわれる。左チャンネルのスペクトルSPCL1のインテンシティステレオ符号化を行なうバンドのスペクトルは、統合スペクトルSPCi1に置換されてスペクトルSPCL2として出力される。また、右チャンネルのスペクトルSPCR1のインテンシティステレオ符号化を行なうバンドのスペクトルは、ゼロに置換されてスペクトルSPCR2として出力される。これにより、インテンシティステレオ符号化によりゼロに置換された右チャンネルのスペクトルは、削除され伝送又は記憶されない。このために、情報量の大幅な削減が期待される。
【0019】
MPEG2−AAC方式の規格書では、標準的な信号に対してはインテンシティステレオ符号化を行なう部分周波数領域の下限周波数を6kHzとするのが適当であると記載されている。但し、インテンシティステレオ符号化が行なわれるためには、全周波数領域に亘る左/右チャンネルのスペクトルが同一の数で構成されていなければならない。すなわち、時間/周波数変換を行なう際の左/右チャンネルの変換ブロック長は同一でなければならない。左/右チャンネルの変換ブロック長が異なる場合は、インテンシティステレオ符号化は行なわれない。
【0020】
更に、付加的な強度情報を複数のスペクトルをまとめたバンド毎に算出し、これを符号化補助情報に包含して伝送又は記憶する場合を考える。短ブロックで時間/周波数変換が行われる場合においては、複数のサブブロックをグループ化して共通の付加的な強度情報として情報量の削減をして符号化効率の向上を図る。この場合には、左/右チャンネルにおけるサブブロックのグループ化の構成がやはり同一でなければならない。
【0021】
量子化及び符号化手段15は、左/右チャンネルのスペクトルSPCL2とSPCR2とを人間の聴覚心理特性と、後述のビットリザーバー制御手段16により設定されるフレーム毎の使用可能なビットの量に基づいて量子化と符号化を行ない、ビット列に変換する。そして量子化及び符号化手段15は、符号化補助情報を多重化して符号化ビット列を生成する。
【0022】
ビットリザーバー制御手段16は、所定のビットレートに基づくフレーム毎のビットの量に対して少ないビットの量で符号化される場合には余剰ビットの量を蓄えておき、所定のビットレートに基づくフレーム毎のビットの量に対して符号化に必要なビットの量が多い場合には蓄えている余剰ビットの量を加え、使用可能なビットの量を部分的に増大して音質の劣化を低減するための余剰ビットを蓄える。ビットリザーバー制御手段16はビットリザーバーを備え、全体の符号化ビット列が所定のビットレートになるようにビットリザーバーに蓄えるビットの量を制御する。
【0023】
図8は、インテンシティステレオ符号化による符号化効率の改善を表す説明図である。図8の縦軸はスペクトルの振幅を示し、横軸はスペクトルの周波数を示す。また、説明を簡単にするために全周波数に亘るスペクトルの総数は24本とし、隣接するスペクトルを4本ずつまとめて6つのバンドから構成されるとしている。インテンシティステレオ符号化は、横軸に示す周波数f0より高い周波数の領域のスペクトルに対して行なうものとする。
【0024】
図8において、(a1)は左チャンネルのスペクトルSPCL1を示し、(a2)は右チャンネルのスペクトルSPCR1を示す。また図9の(a3)は(a1)の左チャンネルのスペクトルSPCL1と(a2)の右チャンネルのスペクトルSPCR1とを量子化し、符号化した場合の情報量の総和を示す模式図である。
【0025】
図9の(a3)において、DL1は(a1)の左チャンネルにおけるスペクトルSPCL1中の周波数f0より低い周波数領域のスペクトルの情報量を示す。DL2は図8の(a1)の左チャンネルにおけるスペクトルSPCL1中の周波数f0より高い周波数領域のスペクトルの情報量を示す。DR1は図8の(a2)の右チャンネルSPCR1のスペクトル中の周波数f0より低い周波数領域のスペクトルの情報量を示す。DR2は図8の(a2)の右チャンネルにおけるスペクトルSPCR1中の周波数f0より高い周波数領域のスペクトルの情報量を示す。これらの情報量は各スペクトルを量子化及び符号化した場合の情報量である。情報量の総和T1は、図9の(a3)に示すようにT1=DL1+DL2+DR1+DR2で表わされる。
【0026】
また、図8の(b1)はインテンシティステレオ符号化を行なった場合のスペクトルSPCL2を示す。(b2)は右チャンネルのスペクトルSPCR2を示す。インテンシティステレオ符号化を行なうことにより、(b1)の左チャンネルにおけるスペクトルSPCL2中の周波数f0より高い周波数のインテンシティステレオ符号化が施されるスペクトルは、統合スペクトルSPCi1に置換されている。
【0027】
また、図8の(b2)に示すように、右チャンネルSPCR2の周波数f0より高い周波数のインテンシティステレオ符号化が施されるスペクトルはゼロに置換されている。また、図9の(b3)は図8の(b1)の左チャンネルのスペクトルSPCL2と、図8の(b2)の右チャンネルSPCR2のスペクトルを量子化し、符号化した場合の情報量の総和を示す。
【0028】
図9の(b3)において、DL1は左チャンネルにおけるスペクトルSPCL2中の周波数f0より低い周波数領域のスペクトルの情報量を示す。Di1は(b1)の左チャンネルにおけるスペクトルSPCL2中の周波数f0より高い周波数の領域の統合スペクトルSPCi1に置換されたスペクトルの情報量を示す。DR1は(b2)の右チャンネルにおけるスペクトルSPCR2中の周波数f0より低い周波数領域のスペクトルの情報量を示す。これらの情報量は各スペクトルを量子化及び符号化した場合の情報量である。情報量の総和T2は、図9の(b3)に示すようにT2=DL1+DR1+Di1で表わされる。
【0029】
図8の(b2)に示すように、右チャンネルの周波数f0より高い周波数領域においては、インテンシティステレオ符号化が施されるスペクトルはゼロに置換される。このため、伝送又は記憶されないので情報量として加算されない。これにより、インテンシティステレオ符号化を行なう場合の情報量の総和T2は、インテンシティステレオ符号化を行なわない場合の情報量の総和T1に比べて少なくなり、符号化効率を改善することができる。但し、この例では図9の(b3)に示すように、インテンシティステレオを行なわない周波数f0より低い周波数の領域では、この領域のスペクトルを量子化及び符号化した場合の情報量DL1が、(a3)の同じ符号で表されるDL1と同じ情報量となるようにしている。
【0030】
また、図9の(b3)に示すインテンシティステレオを行なわない周波数f0より低い周波数の領域では、この領域のスペクトルを量子化及び符号化した場合の情報量DR1が、(a3)の同じ符号で表される情報量DR1と同じになるようにしている。また、図8の(a1)に示す左チャンネルの周波数f0より高い周波数領域のスペクトルを量子化及び符号化による情報量DL2と、(b1)に示すインテンシティステレオ符号化を行なう周波数f0より高い周波数の統合スペクトルSPCi1を量子化及び符号化した場合の情報量Di1とが同じになるようにしている。
【0031】
図10は、図7に示す符号化装置でインテンシティステレオ符号化を用いて生成された符号化ビット列を復号する復号化装置の構成を示すブロック図である。図10において、復号化及び逆量子化手段61は入力される符号化ビット列に包含される符号化補助情報を分解するとともに、復号化及び逆量子化を行って左チャンネルのスペクトルSPCL3と、右チャンネルのスペクトルSPCR3を出力するものである。復号化及び逆量子化手段61から出力され、左チャンネルにおけるスペクトルSPCL3の中のインテンシティステレオ符号化が施されている部分周波数領域のスペクトルは、統合化スペクトルSPCi2からなる。
【0032】
インテンシティステレオ処理手段62は、左チャンネルにおけるスペクトルSPCL3の中の統合スペクトルSPCi2と、分解された符号化補助情報の中の左/右の分布を示す付加的な強度情報とを用いて、右チャンネルにおけるスペクトルSPCR3の中のインテンシティステレオ符号化を行なう周波数f0より高い部分の伝送又は記憶されない周波数領域のスペクトルを生成する。またインテンシティステレオ処理手段62は、スペクトルSPCR3のインテンシティステレオ符号化を行う周波数f0より低い周波数のスペクトルと周波数f0より高い周波数のスペクトルとを合成し、スペクトルSPCR4を出力する。
【0033】
また、インテンシティステレオ処理手段62は、復号化及び逆量子化手段61から出力される左チャンネルのスペクトルSPCL3をスペクトルSPCL4として出力する。周波数/時間変換手段63と64は、周波数軸上の右チャンネルのスペクトルSPCL4と、右チャンネルのスペクトルSPCR4とをそれぞれ時系列のデジタルオーディオ信号のサンプルSOUTL及びSOUTRに変換して出力する。
【0034】
図11は、図10に示す復号化装置における各手段のスペクトルを示す説明図である。図11では、縦軸はスペクトルの振幅を示し、横軸はスペクトルの周波数を示す。また、説明を簡単にするために、全周波数に亘るスペクトルの総数は24本とし、隣接するスペクトルを4本ずつまとめて6つのバンドから構成されるとしている。インテンシティステレオ符号化は周波数f0より高い周波数領域のスペクトルに対して行なうものとする。
【0035】
図11において、(c1)は復号化及び逆量子化手段61から出力される統合スペクトルSPCi2を包含する左チャンネルのスペクトルSPCL3を示す。(c2)は復号化及び逆量子化手段61から出力される右チャンネルのスペクトルSPCR3を示す。(d1)はインテンシティステレオ処理手段62から出力される左チャンネルのスペクトルSPCL4であり、(c1)のSPCL3と同じである。(d2)はインテンシティステレオ復号化手段62から出力される左チャンネルのスペクトルSPCR2を示す。(d2)は(c2)のSPCR3に対して(c1)の左チャンネルのスペクトルSPCL3に包含される統合スペクトルSPCi2を変換すべく、左/右の分布を示す付加的な強度情報を用いて擬似スペクトルを生成した後に結合して出力されたものである。
【0036】
【非特許文献1】
J.D.Johnston著「広帯域ステレオ信号の知覚変換符号化(Perceptual Transform Coding of Wideband Stereo Signals)」IEEE/ICASSP、1989年、p.1993−1993
【非特許文献2】
R.V.R.Vanderwaal著「ステレオフォニックデジタル信号のサブバンド符号化(Subband Coding of stereophonic digital signals)」IEEE/ICASSP、1991年、p.3601−3604
【非特許文献3】
「Advanced Audio Coding ANNEX B Informative Part」ISO/IEC、IS−13818−7
【0037】
【発明が解決しようとする課題】
しかしながら、上記の従来の技術におけるデジタルオーディオ信号の符号化装置及び方法では、符号化に必要なビットの量が多いフレームや、短ブロックの変換ブロック長で時間/周波数変換を行うフレームが短い期間の間に集中する場合において、ビットリザーバーに蓄えている余剰ビットの量が著しく低減し、符号化に使用可能なビットの量が低減する。このような状態では、所定のビットレートを保ちながら使用可能なビットの量を増大させることができなくなる。このような場合、量子化及び符号化によりスペクトルが欠落して、符号化信号を復号化したときの再生信号の歪み感が増大して音質が劣化するという問題があった。
【0038】
本発明は、このような従来の問題点に鑑みてなされたものであって、符号化に必要なビットの量が多いフレームや、短ブロックの変換ブロック長で時間/周波数変換を行うフレームが短い期間の間に集中し、符号化に使用可能なビットの量が低減する場合に、量子化及び符号化によりスペクトルが欠落することを阻止し、符号化信号を復号化したときの再生信号の歪み感が無くし、音質が劣化しないデジタルオーディオ信号の符号化装置及び方法を実現することを目的とする。
【0039】
【課題を解決するための手段】
本願の請求項1の発明は、Nチャンネル(Nは2以上の正整数)のデジタルオーディオ信号の時系列のn個(nは正整数)のサンプルをまとめたフレーム毎に周波数軸上のスペクトルに変換し、スペクトルを量子化した後にエントロピー符号化により符号化し、符号化情報を多重化して符号化ビット列を生成して出力する際に、スペクトルにインテンシティステレオ符号化を行なって情報量を減少するデジタルオーディオ信号の符号化装置であって、各チャンネルの時系列のサンプルを周波数領域のスペクトルに変換する時間/周波数変換手段と、前記時間/周波数変換手段で時系列のサンプルを、サブブロックを単位として周波数領域のスペクトルに変換するとき、サンプルの個数m(mは正整数)をm=n及びm<nのいずれか一方となるよう設定する変換ブロック長設定手段と、Nチャンネルのスペクトルの部分周波数領域に対してインテンシティステレオ符号化を行なうインテンシティステレオ処理手段と、前記インテンシティステレオ処理手段から出力されたスペクトルを量子化し、フレーム毎の使用可能なビット量に基づいて符号化し、符号化補助情報を多重して符号化ビット列を生成する量子化及び符号化手段と、フレーム毎の余剰ビット量をビットリザーバーに蓄えると共に、前記ビットリザーバーに蓄えられているビット量と出力ビットレートとを用いてフレーム毎の使用可能なビット量を設定するビットリザーバー制御手段と、フレーム毎の使用可能なビット量が所定のしきい値ATH(ATHは正整数)より小さい場合に、インテンシティステレオ符号化を行なう部分周波数領域を増大させるインテンシティステレオ帯域設定手段と、を具備することを特徴とするものである。
【0040】
本願の請求項2の発明は、請求項1のデジタルオーディオ信号の符号化装置において、前記インテンシティステレオ帯域設定手段は、時系列の連続するL個(Lは2以上の正整数)のフレームの使用可能なビット量が所定のしきい値ATH(ATHは正整数)より小さいフレームを帯域制御対象フレームとするとき、前記帯域制御対象フレームの数が所定のしきい値BTH(BTHはL以下の正整数)より大きい場合に、インテンシティステレオ符号化を行なう部分周波数領域を増大させることを特徴とするものである。
【0041】
本願の請求項3の発明は、請求項1のデジタルオーディオ信号の符号化装置において、前記インテンシティステレオ帯域設定手段は、時系列の連続するL個(Lは2以上の正整数)のフレームの前記変換ブロック長設定手段の設定する変換ブロック長を記憶保持し、記憶保持するL個の変換ブロック長のうちm<nのサブブロックで変換するフレームの数が所定のしきい値CTH(CTHはL以下の正整数)より大きい場合に、インテンシティステレオ符号化を行なう部分周波数領域を増大させることを特徴とするものである。
【0042】
本願の請求項4の発明は、Nチャンネル(Nは2以上の正整数)のデジタルオーディオ信号の時系列のn個(nは正整数)のサンプルをまとめたフレーム毎に周波数軸上のスペクトルに変換し、スペクトルを量子化した後にエントロピー符号化により符号化し、符号化情報を多重化して符号化ビット列を生成して出力する際に、スペクトルにインテンシティステレオ符号化を行なって情報量を減少するデジタルオーディオ信号の符号化方法であって、各チャンネルの時系列のサンプルを、サブブロックを単位として周波数領域のスペクトルに変換するとき、変換するサンプルの個数m(mは正整数)をm=n及びm<nのいずれか一方となるよう設定し、Nチャンネルのスペクトルの部分周波数領域にインテンシティステレオ符号化を行ない、前記インテンシティステレオ処理により出力されたスペクトルを量子化し、フレーム毎の使用可能なビット量に基づいて符号化すると共に、符号化補助情報を多重して符号化ビット列を生成し、フレーム毎の余剰ビット量をビットリザーバーに蓄えると共に、前記ビットリザーバーに蓄えられているビット量と出力ビットレートとを用いてフレーム毎の使用可能なビット量を設定し、フレーム毎の使用可能なビット量が所定のしきい値ATH(ATHは正整数)より小さい場合に、インテンシティステレオ符号化を行なう部分周波数領域を増大させることを特徴とするものである。
【0043】
本願の請求項5の発明は、請求項4のデジタルオーディオ信号の符号化方法において、前記インテンシティステレオ符号化における帯域設定は、時系列の連続するL個(Lは2以上の正整数)のフレームの使用可能なビット量が所定のしきい値ATH(ATHは正整数)より小さいフレームを帯域制御対象フレームとするとき、前記帯域制御対象フレームの数が所定のしきい値BTH(BTHはL以下の正整数)より大きい場合に、インテンシティステレオ符号化を行なう部分周波数領域を増大させることを特徴とするものである。
【0044】
本願の請求項6の発明は、請求項4のデジタルオーディオ信号の符号化方法において、前記インテンシティステレオ符号化における帯域設定は、時系列の連続するL個(Lは2以上の正整数)のフレームにおけるおける変換ブロック長を記憶保持し、記憶保持するL個の変換ブロック長のうちm<nのサブブロックで変換するフレームの数が、所定のしきい値CTH(CTHはL以下の正整数)より大きい場合に、インテンシティステレオ符号化を行なう部分周波数領域を増大させることを特徴とするものである。
【0045】
【発明の実施の形態】
本発明の各実施の形態におけるデジタルオーディオ信号の符号化装置及び方法について、図面を参照しつつ説明する。以下の説明において一連の符号化プロセスは、時系列のデジタルオーディオ信号に対し、n個(nは正整数)のサンプルをまとめたフレームを単位として実行される。
【0046】
(実施の形態1)
図1は、本発明の実施の形態1におけるデジタルオーディオ信号の符号化装置の構成を示すブロック図である。以下に、各構成ブロックとその動作について説明する。時間/周波数変換手段10及び11は、時系列のn個のサンプルで構成される左チャンネルの入力信号SINLと右チャンネルの入力信号SINRとを、各々左チャンネルのスペクトルSPCL1と右チャンネルのスペクトルSPCR1とに変換する。時間/周波数変換手段10及び11は、左/右チャンネルにおけるフレーム毎のn個のサンプルを、後述する変換ブロック長設定手段12及び13から通知されるフラグFL又はFRに従って、短ブロック又は長ブロックのサブブロック毎にスペクトルSPCL1とSPCR1に変換して出力する。
【0047】
変換ブロック長設定手段12及び13は、フレーム毎の時系列のサンプルを個数m(mは正整数)の値をm=n及びm<nのいずれか一方となるようサブブロックを単位として変換する。以下の説明では、m=nとなるサブブロックを「長ブロック」と呼び、m<nとなるサブブロックを「短ブロック」と呼ぶ。例えばmはn=m×k(kは正整数)式で成り立ち、短ブロックに設定された場合は1フレームの期間にm個のサンプルから成るサブブロックをk個包含する。変換ブロック長の設定は入力信号の様態に応じて設定される。このような変換ブロック長の切り替えについては、従来のデジタルオーディオ信号の符号化装置の構成を示す図7の変換ブロック長設定手段12及び13と同じである。
【0048】
変換ブロック長設定手段12及び13は、入力されるデジタルオーディオ信号の時系列の左/右チャンネルにおけるフレーム毎のn個のサンプルで構成される左チャンネルの入力信号SINLと、右チャンネルの入力信号SINRとを解析する。そして、振幅の変化量が大きい信号(例えば、カスタネットなどの打楽器による信号)は短ブロックで時間/周波数変換するように、あるいはそれ以外の振幅の変化量が小さい信号は長ブロックで時間/周波数変換するように、時間/周波数変換手段10及び11に対して変換ブロック長を設定するフラグFL又はFRを出力する。
【0049】
インテンシティステレオ処理手段14は、左チャンネルのスペクトルSPCL1と右チャンネルのスペクトルSPCR1とから統合モノラルスペクトルSPCI1を生成する。インテンシティステレオ処理手段を実現する方法の例としては、従来のデジタルオーディオ信号の符号化装置を示す図7のインテンシティステレオ処理手段14と同じである。左チャンネルのスペクトルSPCL1と右チャンネルのスペクトルSPCR1に対して、設定され得る周波数fiより高い周波数の領域のスペクトルに対して、インテンシティステレオ符号化が行なわれる。
【0050】
また、左チャンネルにおけるスペクトルSPCL1中の周波数fiより高い周波数の領域は、統合スペクトルSPCi1に置換されてスペクトルSPCL2として出力される。また、右チャンネルにおけるスペクトルSPCR1中の周波数fiより高い周波数の領域のスペクトルは、ゼロに置換されてスペクトルSPCR2として出力される。更に、インテンシティステレオ符号化が行われる部分周波数領域の右/左の分布を示す付加的な強度情報も算出される。但し、インテンシティステレオが行なわれるためには、従来のデジタルオーディオ信号の符号化装置を示す図7のインテンシティステレオ処理手段14と同様の条件でなければならない。
【0051】
また、上記のインテンシティステレオ処理手段14の動作の説明は、設定され得る周波数fiより高い周波数のスペクトルに対してインテンシティステレオ符号化を行なう例を対象としている。しかし、インテンシティステレオ符号化を行なう部分周波数領域の設定に別の方法を用いることも可能である。
【0052】
量子化及び符号化手段15は、インテンシティステレオ処理手段14から出力される左チャンネルのスペクトルSPCL2と右チャンネルのスペクトルSPCR2とに対して、人間の聴覚心理特性と、後述のビットリザーバー制御手段16により設定されるフレーム毎の使用可能なビットの量とに基づいて量子化と符号化を行なう。そして量子化及び符号化手段15は量子化と符号化の結果をビット列に変換するとともに、符号化補助情報を多重化して符号化ビット列を生成する。
【0053】
ビットリザーバー制御手段16は、所定のビットレートに基づくフレーム毎のビットの量に対して、少ないビットの量で符号化される場合には余剰ビットの量RBITをビットリザーバーに蓄えておく。またビットリザーバー制御手段16は、所定のビットレートに基づくフレーム毎のビットの量に対して、符号化に必要なビットの量が多い場合にはビットリザーバーに蓄えている余剰ビットの量を加え、使用可能なビットの量ABITを部分的に増大して音質の劣化を低減する。
こうしてビットリザーバー制御手段16は、全体の符号化ビット列が所定のビットレートになるように、ビットリザーバーに蓄えるビットの量を制御する。
【0054】
インテンシティステレオ帯域設定手段17Aは、ビットリザーバー制御手段16の出力するフレーム毎の使用可能ビットの量ABITを用いて、インテンシティステレオ符号化を行なう部分周波数領域を設定する。ビットリザーバー制御手段16から出力されるフレーム毎の使用可能なビットの量ABITが所定のしきい値ATH(ATHは正整数)より大きい場合には、インテンシティステレオ帯域設定手段17Aはインテンシティステレオ符号化を行なう部分周波数領域の下限の周波数fiを所定のf0に設定する。逆にフレーム毎の使用可能なビットの量ABITが所定のしきい値ATH(ATHは正整数)より小さいフレームを帯域制御対象フレームとすると、帯域制御対象フレームの場合には、インテンシティステレオ帯域設定手段17Aはインテンシティステレオ符号化を行なう部分周波数領域の下限の周波数fiを、インテンシティステレオ符号化を行う部分周波数範囲を増大させるべく、所定のf1(f1<f0)に設定する。
【0055】
インテンシティステレオ帯域設定手段17Aは、次のような方法で帯域を設定してもよい。すなわち、インテンシティステレオ帯域設定手段17Aは、時系列の連続するL個(Lは2以上の正整数)のフレーム毎にビットリザーバー制御手段16から出力される使用可能なビットの量をABITとすると、このABITを記憶保持するバッファを備えるものとする。そしてこのビット量ABITが所定のしきい値ATHより小さいフレームの数が、所定のしきい値BTH(BTHはL以下の正整数)より小さい場合には、インテンシティステレオ符号化を行なう部分周波数領域の下限の周波数fiを所定のf0に設定する。またビット量ABITが所定のしきい値ATHより小さいフレームの数が、所定のしきい値BTHより大きい場合には、インテンシティステレオ符号化を行なう部分周波数領域の下限の周波数fiを所定のf1(f1<f0)に設定する。
【0056】
上記のインテンシティステレオ帯域設定手段17Aの動作の説明では、設定され得る周波数fiより高い周波数のスペクトルに対してインテンシティステレオ符号化を行なう例を対象とした。しかし、インテンシティステレオ符号化を行なう部分周波数領域を増大させるには別の方法を用いることも可能である。また、上記のインテンシティステレオ帯域設定手段17Aは、設定され得る周波数fiをf0又はf1の2つの設定のどちらかに切り替えるようにした。しかし、2つ以上の複数の設定値を用意して、この中のいずれかの設定値を選択するように切り替える方法を用いることも可能である。
【0057】
図2は、図1のデジタルオーディオ信号の符号化装置において、部分周波数領域のスペクトルに対してインテンシティステレオ符号化を行なった場合の符号化効率の改善を表す説明図である。詳しくはビットリザーバー制御手段16から出力されるフレーム毎の使用可能なビットの量ABITと所定のしきい値ATHとの大小関係に基づき、インテンシティステレオ帯域設定手段17Aで設定される所定の周波数をf0あるいはf1(f1<f0)に設定する例を示している。また図3は左チャンネルのスペクトルSPCL1と右チャンネルのスペクトルSPCR1とを量子化し、符号化した場合の情報量の総和を示す模式図である。
【0058】
図2において、縦軸はスペクトルの振幅を示し、横軸はスペクトルの周波数を示す。また、説明を簡単にするために全周波数に亘るスペクトルの総数は24本とし、隣接するスペクトルを4本ずつまとめ、6つのバンドから構成されるものとする。図2の(b1)及び(b2)と図3の(b3)は、インテンシティステレオ符号化による符号化効率の改善を表す図8及び図9の説明図と内容が同じである。
【0059】
また、図2において(e1)は、インテンシティステレオ帯域設定手段17Aで設定される所定の周波数f1(f1<f0)より高い部分周波数領域のスペクトルに対して、インテンシティステレオ符号化を行なった場合のスペクトルSPCL2を示し、(e2)は右チャンネルのスペクトルSPCR2を示す。本実施の形態のインテンシティステレオ符号化を行なうことにより、(e1)の左チャンネルのスペクトルSPCL2において、周波数f1より高い周波数のインテンシティステレオ符号化を施されるスペクトルが統合スペクトルSPCi1に置換されている。
【0060】
また、(e2)の右チャンネルにおけるスペクトルSPCR2において、周波数f1より高い周波数のインテンシティステレオ符号化を施されるスペクトルがゼロに置換されている。また図3の(e3)は、図2における(e1)の左チャンネルのスペクトルと(e2)の右チャンネルのスペクトルとを量子化して符号化した場合の情報量の総和を示す。
【0061】
図3の(e3)において、DL3は左チャンネルにおけるスペクトルSPCL2の中の周波数f1より低い周波数領域のスペクトルの情報量である。Di2は(e1)の左チャンネルにおけるスペクトルSPCL2の中の周波数f1より高い周波数領域の統合スペクトルに置換されたスペクトルの情報量である。DR3は(e2)の右チャンネルにおけるスペクトルSPCR2の中の周波数f1より低い周波数領域のスペクトルの情報量である。これらの情報量は各スペクトルが量子化及び符号化された場合の値である。これらの情報量の総和T3は、T3=DL3+DR3+Di2で示される。
【0062】
図2の(e2)に示すように、右チャンネルのスペクトルSPCR2の周波数f1より高い周波数領域において、インテンシティステレオ符号化を施されるスペクトルはゼロに置換され、伝送又は記憶されないので、情報量として加算されない。これにより、インテンシティステレオ符号化を行なう場合の情報量の総和T3は、図9に示すインテンシティステレオ符号化を行なわない場合の情報量の総和T1に比べて少なくすることができ、符号化効率を更に改善することができる。
【0063】
また、周波数f0より高い部分周波数領域のスペクトルに対してインテンシティステレオ符号化を行なう場合と比較して、周波数f1より高い部分周波数領域のスペクトルにインテンシティステレオ符号化を行なうと、右チャンネルのインテンシティステレオ符号化によりゼロに置換されるスペクトルの数が増大する。このために、右チャンネルのスペクトルの情報量DR3が情報量DR1より低減される。これにより、周波数f1より高い部分周波数領域のスペクトルに対して、インテンシティステレオ符号化を行なう場合の情報量の総和T3は、周波数f0より高い部分周波数領域のスペクトルにインテンシティステレオ符号化を行なう場合の情報量の総和T2に比べて少なくなる。このため、符号化効率を改善することができる。
【0064】
図4は、本発明の実施の形態1において、フレーム毎のインテンシティステレオ符号化を行う部分周波数帯域の設定範囲の変化を示すタイムチャートである。図4の横軸は時系列に連続するフレーム番号を示し、上段のタイムチャートの縦軸は、ビットリザーバー制御手段16から出力されるフレーム毎の使用可能なビットの量ABITを表す。ATHは、インテンシティステレオ帯域設定手段17Aにより、インテンシティステレオ符号化を行う部分周波数帯域の下限の周波数をf0もしくはf1に切り替える基準となる所定のしきい値である。下段のタイムチャートの縦軸は周波数を表す。
【0065】
図4に示すように、インテンシティステレオ帯域設定手段17Aは、ビットリザーバー制御手段16から出力される使用可能なビットの量ABITの値が所定のしきい値ATHより小さくなる第3フレーム及び第5フレームにおいて、インテンシティステレオ符号化を行う部分周波数帯域の下限の周波数をf1に設定するようにしている。
【0066】
これにより、フレーム毎の使用可能なビットの量ABITが所定のしきい値ATH(ATHは正整数)より小さい場合で、使用可能なビットの量ABITが著しく減少して量子化及び符号化でスペクトルが欠落する可能性があるとき、インテンシティステレオ符号化を行なう部分周波数領域の範囲を増大させる。すなわちインテンシティステレオを行なう部分周波数領域の下限の周波数を、f0からf1(f1<f0)に移すことで、符号化効率が改善され少ないビットの量で量子化及び符号化を行うことができる。この場合、量子化及び符号化でスペクトルが欠落する可能性を低減でき、音質の劣化を阻止することができる。
【0067】
尚、上記の実施の形態1で述べられた一連の符号化プロセスは、ソフトウェアプログラム言語によってコンピュータ又はデジタルシグナルプロセッサ(DSP)上で実現することも可能である。
【0068】
(実施の形態2)
次に本発明の実施の形態2におけるデジタルオーディオ信号の符号化装置について説明する。図5は実施の形態2におけるデジタルオーディオ信号の符号化装置の構成を示すブロック図である。なお、実施の形態1と同一のブロックは同一の符号を付け、各ブロックの動作について説明する。
【0069】
図5において、時間/周波数変換手段10及び11、変換ブロック長設定手段12及び13、インテンシティステレオ符号化手段14、量子化及び符号化手段15、及びビットリザーバー制御手段16は、図1のデジタルオーディオ信号の符号化装置における各手段と機能が同じである。
【0070】
インテンシティステレオ帯域設定手段17Bは、時系列の連続するL個(Lは2以上の正整数)のフレーム毎の変換ブロック長設定手段12及び13から出力される変換ブロック長を設定するフラグFL又はFRを記憶保持し、記憶保持したL個のフレーム毎のフラグFL又はFRに基づいて、インテンシティステレオ符号化を行なう部分周波数領域を設定する。インテンシティステレオ帯域設定手段17Bは、変換ブロック長設定手段12及び13から出力されるL個のフレーム毎の変換ブロック長を設定するフラグFL又はFRを記憶保持するためのバッファを備える。インテンシティステレオ帯域設定手段17Bは、バッファに記憶保持されるL個のフレーム毎の変換ブロック長を設定するフラグFL又はFRを参照し、短ブロックが設定されるフレーム数が、所定のしきい値CTH(CTHはL以下の正整数)より小さい場合には、インテンシティステレオ符号化を行なう部分周波数領域の下限の周波数fiを所定のf0に設定する。またインテンシティステレオ帯域設定手段17Bはバッファに記憶保持されるL個のフレーム毎の変換ブロック長を設定するフラグFL又はFRを参照し、短ブロックが設定されるフレーム数が所定のしきい値CTHより大きい場合には、インテンシティステレオ符号化を行なう部分周波数領域の下限の周波数fiを所定のf1(f1<f0)に設定する。
【0071】
上記のインテンシティステレオ帯域設定手段17Bの動作説明では、設定され得る周波数fiより高い周波数のスペクトルに対してインテンシティステレオ符号化を行なう例を対象としたが、インテンシティステレオ符号化を行なう部分周波数領域を増大させるには、別の方法を用いることも可能である。また、上記のインテンシティステレオ帯域設定手段17Bは、設定され得る周波数fiをf0又はf1の2つの設定のどちらかに切り替えたが、2つ以上の複数の設定値を用意して、この中のいずれかの設定値を選択するように切り替える方法を用いることもできる。
【0072】
変換ブロック長の切り替えは、図7の従来のデジタルオーディオ信号の符号化装置における変換ブロック長設定手段12及び13と同様の方法で行なわれる。複数の隣接するスペクトルをまとめたバンド毎に量子化及び符号化が行なわれるために、フレーム毎の量子化及び符号化されるバンド毎の符号化補助情報が伝送又は記憶されることになる。
【0073】
ここで、各バンドに包含されるスペクトルの数は予め定められている。一般的には低い周波数のスペクトルを包含するバンドのスペクトルの本数に比べて、高い周波数のスペクトルを包含するバンドのスペクトルの本数の方が多く設定される。また、各バンドのスペクトルの本数は人間の聴覚特性に基づいて設定される。伝送又は記憶される有効な周波数領域の範囲を一定にすると、短ブロックが選択される場合の伝送又は記憶されるバンドの数が長ブロックが選択される場合に比べて大きくなるために、符号化補助情報の伝送に多くのビットを要する。
【0074】
また、振幅の変化量が大きい信号に対しても量子化ノイズを知覚されないレベルに抑えるために量子化ビット数が大きくなる。このため、短ブロックのフレームは長ブロックのフレームに比べて多くのビットを消費する。このため、短ブロックのフレームが連続して出現する場合には、使用可能なビットの量ABITが著しく減少する可能性がある。
【0075】
図6は、本発明の実施の形態2におけるフレーム毎のインテンシティステレオ符号化を行う部分周波数帯域の設定範囲の変化を示すタイムチャートである。図6の横軸は時系列に連続するフレームを示す。上段のタイムチャートは、インテンシティステレオ帯域設定手段14に記憶保持されるフレーム毎の時間/周波数変換を行う際の変換ブロック長を示す。
【0076】
図6に示す例では、時系列に連続する3つのフレームの変換ブロック長を記憶保持し、F0が第nフレームの変換ブロック長であり、F1が第(n−1)フレームの変換ブロック長であり、F2が第(n−2)フレームの変換ブロック長であるとする。例えば、第4フレームの符号化処理を行う場合には、F0に第4フレームの変換ブロック長として短ブロックを示すフラグを記憶保持し、F1に第3フレームの変換ブロック長として短ブロックを示すフラグを記憶保持し、F2に第2フレームの変換ブロック長として長ブロックを示すフラグを記憶保持する。
【0077】
図6の下段のタイムチャートにおける縦軸は周波数を表す。図6に示すように、インテンシティステレオ帯域設定手段17Bは、変換ブロック長設定手段12及び13から出力される時系列で連続する3つのフレームの変換ブロック長を記憶保持する。インテンシティステレオ帯域設定手段17Bは記憶保持した3つのフレームの変換ブロック長のうち、所定のしきい値CTH(図6においては、CTH=2としている。)が短ブロックとなる第4フレーム及び第5フレームにおいて、インテンシティステレオ符号化を行う部分周波数帯域の下限の周波数をf1に設定する。
【0078】
変換ブロック長が時系列に連続して、あるいは短い期間の間に集中して短ブロックになることで、使用可能なビットの量ABITが著しく減少し、量子化及び符号化でスペクトルが欠落する場合を考える。このとき、インテンシティステレオ帯域設定手段17Bは時系列の連続するL個のフレーム毎の変換ブロック長を記憶保持し、記憶保持した変換ブロック長に基づいてインテンシティステレオを行なう部分周波数領域の下限の周波数をf0からf1(f1<f0)に移す。そして、インテンシティステレオ符号化を行なう部分周波数領域の範囲を増大することにより、符号化効率を改善し、少ないビットの量で量子化及び符号化を可能にする。こうすれば量子化及び符号化でスペクトルが欠落する可能性を低減でき、音質の劣化を阻止することができる。
【0079】
尚、上記の実施の形態2の説明にある一連の符号化プロセスは、ソフトウェアプログラム言語によってコンピュータ又はデジタルシグナルプロセッサ(DSP)上で実現することも可能である。
【0080】
【発明の効果】
本発明のデジタルオーディオ信号の符号化装置及び方法によれば、量子化及び符号化に使用可能なビットの量、及び時間/周波数変換の変換ブロック長に基づいて、インテンシティステレオ符号化を行なう部分周波数領域の範囲を適応的に変化させることにより、使用可能なビットの量が著しく減少した場合でも量子化及び符号化によりスペクトルが欠落するのを防ぐことができる。そしてスペクトルが欠落することによる歪み感の増大や、音質の劣化を阻止することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態1におけるデジタルオーディオ信号の符号化装置の構成を示すブロック図である。
【図2】実施の形態1におけるインテンシティステレオ符号化による符号化効率の改善効果を表す説明図(その1)である。
【図3】実施の形態1におけるインテンシティステレオ符号化による符号化効率の改善効果を表す説明図(その2)である。
【図4】実施の形態1において、フレーム毎のインテンシティステレオ符号化を行う部分周波数帯域の設定範囲の変化を示すタイムチャートである。
【図5】本発明の実施の形態2におけるデジタルオーディオ信号の符号化装置の構成を示すブロック図である。
【図6】実施の形態2において、フレーム毎のインテンシティステレオ符号化を行う部分周波数帯域の設定範囲の変化を示すタイムチャートである。
【図7】従来のデジタルオーディオ信号の符号化装置の構成を示すブロック図である。
【図8】従来のインテンシティステレオ符号化による符号化効率の改善効果を表す説明図(その1)である。
【図9】従来のインテンシティステレオ符号化による符号化効率の改善効果を表す説明図(その2)である。
【図10】インテンシティステレオ符号化を用いて生成された符号化ビット列を復号する復号化装置の構成を示すブロック図である。
【図11】インテンシティステレオ符号化を用いて生成された符号化ビット列を復号する復号化装置において、各ブロックのスペクトルを示す説明図である。
【符号の説明】
10、11 時間/周波数変換手段
12、13 変換ブロック長設定手段
14 インテンシティステレオ処理手段
15 量子化及び符号化手段
16 ビットリザーバー制御手段
17A、17B インテンシティステレオ帯域設定手段
61 復号化及び逆量子化手段
62 インテンシティステレオ処理手段
63、64 周波数/時間変換手段
Claims (6)
- Nチャンネル(Nは2以上の正整数)のデジタルオーディオ信号の時系列のn個(nは正整数)のサンプルをまとめたフレーム毎に周波数軸上のスペクトルに変換し、スペクトルを量子化した後にエントロピー符号化により符号化し、符号化情報を多重化して符号化ビット列を生成して出力する際に、スペクトルにインテンシティステレオ符号化を行なって情報量を減少するデジタルオーディオ信号の符号化装置であって、
各チャンネルの時系列のサンプルを周波数領域のスペクトルに変換する時間/周波数変換手段と、
前記時間/周波数変換手段で時系列のサンプルを、サブブロックを単位として周波数領域のスペクトルに変換するとき、サンプルの個数m(mは正整数)をm=n及びm<nのいずれか一方となるよう設定する変換ブロック長設定手段と、
Nチャンネルのスペクトルの部分周波数領域に対してインテンシティステレオ符号化を行なうインテンシティステレオ処理手段と、
前記インテンシティステレオ処理手段から出力されたスペクトルを量子化し、フレーム毎の使用可能なビット量に基づいて符号化し、符号化補助情報を多重して符号化ビット列を生成する量子化及び符号化手段と、
フレーム毎の余剰ビット量をビットリザーバーに蓄えると共に、前記ビットリザーバーに蓄えられているビット量と出力ビットレートとを用いてフレーム毎の使用可能なビット量を設定するビットリザーバー制御手段と、
フレーム毎の使用可能なビット量が所定のしきい値ATH(ATHは正整数)より小さい場合に、インテンシティステレオ符号化を行なう部分周波数領域を増大させるインテンシティステレオ帯域設定手段と、を具備することを特徴とするデジタルオーディオ信号の符号化装置。 - 前記インテンシティステレオ帯域設定手段は、
時系列の連続するL個(Lは2以上の正整数)のフレームの使用可能なビット量が所定のしきい値ATH(ATHは正整数)より小さいフレームを帯域制御対象フレームとするとき、前記帯域制御対象フレームの数が所定のしきい値BTH(BTHはL以下の正整数)より大きい場合に、インテンシティステレオ符号化を行なう部分周波数領域を増大させるものであることを特徴とする請求項1記載のデジタルオーディオ信号の符号化装置。 - 前記インテンシティステレオ帯域設定手段は、
時系列の連続するL個(Lは2以上の正整数)のフレームの前記変換ブロック長設定手段の設定する変換ブロック長を記憶保持し、記憶保持するL個の変換ブロック長のうちm<nのサブブロックで変換するフレームの数が所定のしきい値CTH(CTHはL以下の正整数)より大きい場合に、インテンシティステレオ符号化を行なう部分周波数領域を増大させるものであることを特徴とする請求項1記載のデジタルオーディオ信号の符号化装置。 - Nチャンネル(Nは2以上の正整数)のデジタルオーディオ信号の時系列のn個(nは正整数)のサンプルをまとめたフレーム毎に周波数軸上のスペクトルに変換し、スペクトルを量子化した後にエントロピー符号化により符号化し、符号化情報を多重化して符号化ビット列を生成して出力する際に、スペクトルにインテンシティステレオ符号化を行なって情報量を減少するデジタルオーディオ信号の符号化方法であって、
各チャンネルの時系列のサンプルを、サブブロックを単位として周波数領域のスペクトルに変換するとき、変換するサンプルの個数m(mは正整数)をm=n及びm<nのいずれか一方となるよう設定し、
Nチャンネルのスペクトルの部分周波数領域にインテンシティステレオ符号化を行ない、
前記インテンシティステレオ処理により出力されたスペクトルを量子化し、フレーム毎の使用可能なビット量に基づいて符号化すると共に、符号化補助情報を多重して符号化ビット列を生成し、
フレーム毎の余剰ビット量をビットリザーバーに蓄えると共に、前記ビットリザーバーに蓄えられているビット量と出力ビットレートとを用いてフレーム毎の使用可能なビット量を設定し、
フレーム毎の使用可能なビット量が所定のしきい値ATH(ATHは正整数)より小さい場合に、インテンシティステレオ符号化を行なう部分周波数領域を増大させることを特徴とするデジタルオーディオ信号の符号化方法。 - 前記インテンシティステレオ符号化における帯域設定は、
時系列の連続するL個(Lは2以上の正整数)のフレームの使用可能なビット量が所定のしきい値ATH(ATHは正整数)より小さいフレームを帯域制御対象フレームとするとき、前記帯域制御対象フレームの数が所定のしきい値BTH(BTHはL以下の正整数)より大きい場合に、インテンシティステレオ符号化を行なう部分周波数領域を増大させることを特徴とする請求項4記載のデジタルオーディオ信号の符号化方法。 - 前記インテンシティステレオ符号化における帯域設定は、
時系列の連続するL個(Lは2以上の正整数)のフレームにおけるおける変換ブロック長を記憶保持し、記憶保持するL個の変換ブロック長のうちm<nのサブブロックで変換するフレームの数が、所定のしきい値CTH(CTHはL以下の正整数)より大きい場合に、インテンシティステレオ符号化を行なう部分周波数領域を増大させることを特徴とする請求項4記載のデジタルオーディオ信号の符号化方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003041260A JP2004252068A (ja) | 2003-02-19 | 2003-02-19 | デジタルオーディオ信号の符号化装置及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003041260A JP2004252068A (ja) | 2003-02-19 | 2003-02-19 | デジタルオーディオ信号の符号化装置及び方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004252068A true JP2004252068A (ja) | 2004-09-09 |
Family
ID=33024890
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003041260A Pending JP2004252068A (ja) | 2003-02-19 | 2003-02-19 | デジタルオーディオ信号の符号化装置及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004252068A (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007079483A (ja) * | 2005-09-16 | 2007-03-29 | Nippon Telegr & Teleph Corp <Ntt> | ステレオ信号符号化装置、ステレオ信号復号化装置、ステレオ信号符号化方法、ステレオ信号復号化方法、プログラム及び記録媒体 |
JPWO2006046546A1 (ja) * | 2004-10-26 | 2008-05-22 | 松下電器産業株式会社 | 音声符号化装置および音声符号化方法 |
WO2008132850A1 (ja) * | 2007-04-25 | 2008-11-06 | Panasonic Corporation | ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法 |
JP2009501948A (ja) * | 2005-07-19 | 2009-01-22 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | パラメトリックマルチチャネルオーディオ符号化とマトリックスサラウンドマルチチャネル符号化との間のギャップを埋めるための概念 |
CN109328382A (zh) * | 2016-06-22 | 2019-02-12 | 杜比国际公司 | 用于将数字音频信号从第一频域变换到第二频域的音频解码器及方法 |
US10573324B2 (en) | 2016-02-24 | 2020-02-25 | Dolby International Ab | Method and system for bit reservoir control in case of varying metadata |
-
2003
- 2003-02-19 JP JP2003041260A patent/JP2004252068A/ja active Pending
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2006046546A1 (ja) * | 2004-10-26 | 2008-05-22 | 松下電器産業株式会社 | 音声符号化装置および音声符号化方法 |
US8326606B2 (en) | 2004-10-26 | 2012-12-04 | Panasonic Corporation | Sound encoding device and sound encoding method |
JP5100124B2 (ja) * | 2004-10-26 | 2012-12-19 | パナソニック株式会社 | 音声符号化装置および音声符号化方法 |
JP2009501948A (ja) * | 2005-07-19 | 2009-01-22 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | パラメトリックマルチチャネルオーディオ符号化とマトリックスサラウンドマルチチャネル符号化との間のギャップを埋めるための概念 |
US8180061B2 (en) | 2005-07-19 | 2012-05-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding |
JP2007079483A (ja) * | 2005-09-16 | 2007-03-29 | Nippon Telegr & Teleph Corp <Ntt> | ステレオ信号符号化装置、ステレオ信号復号化装置、ステレオ信号符号化方法、ステレオ信号復号化方法、プログラム及び記録媒体 |
JP4512016B2 (ja) * | 2005-09-16 | 2010-07-28 | 日本電信電話株式会社 | ステレオ信号符号化装置、ステレオ信号符号化方法、プログラム及び記録媒体 |
WO2008132850A1 (ja) * | 2007-04-25 | 2008-11-06 | Panasonic Corporation | ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法 |
US10573324B2 (en) | 2016-02-24 | 2020-02-25 | Dolby International Ab | Method and system for bit reservoir control in case of varying metadata |
US11195536B2 (en) | 2016-02-24 | 2021-12-07 | Dolby International Ab | Method and system for bit reservoir control in case of varying metadata |
CN109328382A (zh) * | 2016-06-22 | 2019-02-12 | 杜比国际公司 | 用于将数字音频信号从第一频域变换到第二频域的音频解码器及方法 |
CN109328382B (zh) * | 2016-06-22 | 2023-06-16 | 杜比国际公司 | 用于将数字音频信号从第一频域变换到第二频域的音频解码器及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100917464B1 (ko) | 대역 확장 기법을 이용한 디지털 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치 | |
RU2197776C2 (ru) | Способ и устройство масштабируемого кодирования-декодирования стереофонического звукового сигнала (варианты) | |
CN101253557B (zh) | 立体声编码装置及立体声编码方法 | |
JP3336617B2 (ja) | 信号符号化又は復号化装置,及び信号符号化又は復号化方法,並びに記録媒体 | |
KR101967122B1 (ko) | 신호 처리 장치 및 방법, 및 프로그램 | |
JP4296752B2 (ja) | 符号化方法及び装置、復号方法及び装置、並びにプログラム | |
US6415251B1 (en) | Subband coder or decoder band-limiting the overlap region between a processed subband and an adjacent non-processed one | |
Quackenbush et al. | Noiseless coding of quantized spectral components in MPEG-2 Advanced Audio Coding | |
JP2012163969A5 (ja) | ||
JP4296753B2 (ja) | 音響信号符号化方法及び装置、音響信号復号方法及び装置、並びにプログラム及び記録媒体 | |
KR20070061876A (ko) | 멀티채널 디지털 오디오 코딩을 위한 장치 및 방법 | |
EP1618686A1 (en) | Support of a multichannel audio extension | |
JP5355387B2 (ja) | 符号化装置および符号化方法 | |
KR100968057B1 (ko) | 부호화 방법 및 장치, 및 복호 방법 및 장치 | |
US5781586A (en) | Method and apparatus for encoding the information, method and apparatus for decoding the information and information recording medium | |
JP3964860B2 (ja) | ステレオオーディオの符号化方法、ステレオオーディオ符号化装置、ステレオオーディオの復号化方法、ステレオオーディオ復号化装置及びコンピュータで読み取り可能な記録媒体 | |
KR101015497B1 (ko) | 디지털 데이터의 부호화/복호화 방법 및 장치 | |
WO2004044891A1 (ja) | 音楽情報符号化装置及び方法、並びに音楽情報復号装置及び方法 | |
JP3189401B2 (ja) | 音声データ符号化方法及び音声データ符号化装置 | |
JP4308229B2 (ja) | 符号化装置および復号化装置 | |
JP2004252068A (ja) | デジタルオーディオ信号の符号化装置及び方法 | |
JP4973397B2 (ja) | 符号化装置および符号化方法、ならびに復号化装置および復号化方法 | |
JPH09135176A (ja) | 情報符号化装置および方法、情報復号化装置および方法、並びに情報記録媒体 | |
KR100923301B1 (ko) | 대역 확장 기법을 이용한 오디오 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치 | |
JP4297078B2 (ja) | 復号方法及び装置 |