JPWO2005081229A1 - オーディオエンコーダ及びオーディオデコーダ - Google Patents

オーディオエンコーダ及びオーディオデコーダ Download PDF

Info

Publication number
JPWO2005081229A1
JPWO2005081229A1 JP2006519336A JP2006519336A JPWO2005081229A1 JP WO2005081229 A1 JPWO2005081229 A1 JP WO2005081229A1 JP 2006519336 A JP2006519336 A JP 2006519336A JP 2006519336 A JP2006519336 A JP 2006519336A JP WO2005081229 A1 JPWO2005081229 A1 JP WO2005081229A1
Authority
JP
Japan
Prior art keywords
signal
encoded signal
encoded
code amount
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006519336A
Other languages
English (en)
Inventor
宮阪 修二
修二 宮阪
良明 高木
良明 高木
一任 阿部
一任 阿部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Publication of JPWO2005081229A1 publication Critical patent/JPWO2005081229A1/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)

Abstract

マルチチャネル信号をもとに、ステレオ信号を生成するオーディオエンコーダであって、ダウンミックス部100は、2チャネルを超えるマルチチャネル信号を、2チャネルのステレオ信号にダウンミックスする。第1符号化部101は、ダウンミックスされたステレオ信号を符号化し、第1符号化信号を生成する。第2符号化部102は、ダウンミックスされたステレオ信号をマルチチャネル信号に戻すための情報を符号化し、第2符号化信号を生成する。符号量算出部103は、第2符号化信号の符号量を算出する。第1多重化部104は、第1符号化信号または第2符号化信号とのいずれかと、算出された符号量とを多重化する。これにより、デコーダは、上記符号量に基づいてマルチチャネル信号の符号化信号を簡単に抜き取れるので、ダウンミックス信号のみを再生するデコーダを安価に構成することができる。

Description

本発明は、マルチチャネル信号を符号化するオーディオエンコーダに関する。特に、エンコードされたマルチチャネル信号を安価なデコーダで再生できるような符号化信号を生成するオーディオエンコーダに関する。
また、本発明は、そのようなオーディオエンコーダでエンコードされた符号化信号をデコードするオーディオデコーダに関する。特にマルチチャネル信号を2チャネルで再生するようなオーディオデコーダに関する。
従来から、マルチチャネル信号を安価な再生装置、とりわけ2チャネルの再生装置で再生することができるような符号化信号を生成するオーディオエンコーダの研究開発が行われている。例えば、MPEG2オーディオ規格(ISO13818−3)では、マルチチャネル信号を2チャネルにダウンミックスした信号と、当該ダウンミックスされた信号をマルチチャネル信号に戻すための信号とを分けて、それぞれ第1符号化信号、第2符号化信号として符号化し、安価なデコーダでは上記第1符号化信号のみを復号化することができる技術が開示されている(非特許文献1参照)。
MPEG2オーディオ規格(ISO13818−3)
しかしながら、MPEG2オーディオ規格では、上記第1符号化信号と、上記第2符号化信号とを分離することが容易ではないという課題があった。
図1は、MPEG2オーディオ規格における符号化信号(ビットストリーム)の構造を示したものである。図1において、フレームヘッダ情報900は、1152サンプルごとに符号化された1フレームの符号化情報の開始位置を示している。第1符号化信号901は、マルチチャネル信号を2チャネルにダウンミックスしたステレオ信号を符号化した符号化信号である。第2符号化信号902は、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号化して得られる符号化信号である。
さてここで、第1符号化信号901のみをデコードしたいと欲する、例えば、2チャネル再生のみを前提として設計された携帯電話機などのデコーダは、第1符号化信号901を取得し復号化した後、第2符号化信号902を読み飛ばしたいと欲するが、以下の理由によって容易には第2符号化信号902の量を取得することができず、従って、容易には第2符号化信号902を読み飛ばすことができない。なぜならば、各フレームのフレームサイズは各フレームのフレームヘッダ情報900を解析することで容易に取得することができるが、第1符号化信号901の符号量は図に例示したようにフレームごとに可変であるので、必然的に第2符号化信号902の符号量も可変となる。従って、第2符号化信号902の符号量は、当該フレームのフレームサイズから当該フレームの第1符号化信号901の符号量を引くことによってしか知ることができない。従って第1符号化信号901をデコードする際、第1符号化信号901の符号量をいちいち算出しなければならないこととなり、このことに多大の演算資源を費やさなければならないという課題がある。
また、従来の技術では、以下のような課題もある。
MPEG2オーディオ規格では、復号化されたダウンミックス信号は、サンプル時刻ごとに所定のマトリックス演算によってダウンミックスされているので、もともとのマルチチャネル信号の空間情報が失われているという。従って、元の空間情報を再現した上で、2チャネルダウンミックスした信号を再生せんと欲した場合、つまり、仮想サラウンド処理を施した2チャネル信号を再生せんと欲した場合、一旦、第1符号化信号901と第2符号化信号902とを用いてマルチチャネル信号を復号した後、頭部伝達関数に基づいて空間情報をフィルタ処理する必要があり、そのことに多大の演算資源を費やさなければならないという課題がある。
本発明は、このような従来の問題点に鑑みてなされたものであって、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号化した符号化信号の符号量を簡単に知りえるような符号化信号を生成するオーディオエンコーダを提供することを目的とする。
さらに、本発明は、ダウンミックス信号を再生するだけで元のマルチチャネルの空間情報が再生できるような符号化情報を生成するオーディオエンコーダを提供することを第2の目的とする。
また、そのようなオーディオエンコーダで符号化された符号化信号を少ない演算量で復号化するオーディオデコーダを提供することを目的とする。
上記の課題を解決するため、本発明のオーディオエンコーダは、2チャネルを超えるマルチチャネル信号を、2チャネルのステレオ信号にダウンミックスするダウンミックス手段と、前記ダウンミックスされたステレオ信号を符号化し、第1符号化信号を生成する第1符号化手段と、前記ダウンミックスされたステレオ信号をマルチチャネル信号に戻すための情報を符号化し、第2符号化信号を生成する第2符号化手段と、前記第2符号化信号の符号量を算出する符号量算出手段と、前記第1符号化信号、前記第2符号化信号および算出された前記符号量を表す信号を多重化する多重化手段とを備えることを特徴とする。
また、前記多重化手段は、前記符号量算出手段で算出された符号量と、前記第2符号化信号とを多重化する第1多重化部と、前記第1符号化信号と、前記符号量が多重化された前記第2符号化信号とを多重化する第2多重化部とを備えるとしてもよい。
さらに、前記第1多重化部は、前記符号量算出手段で算出された前記符号量を、前記第2符号化信号の先頭に配置して多重化するとしてもよい。
また、前記第1多重化部は、前記符号量算出手段で算出された前記符号量を、前記第2符号化信号の開始を識別する記号の直後に配置するように多重化するとしてもよい。
さらに、前記第1多重化部は、前記符号量算出手段で算出された前記符号量を表す信号を可変長で記述し、前記第2符号化信号に多重化するとしてもよい。
また、前記ダウンミックス手段は、前記マルチチャネル信号に頭部伝達関数を用いた演算を行い、ダウンミックス処理を行うとしてもよい。
また、前記ダウンミックス手段は、周波数軸上で、前記マルチチャネル信号に頭部伝達関数を用いた演算を行うとしてもよい。
さらに、前記第2符号化信号は無効なデータを含み、前記符号量算出手段は、前記無効なデータを含む前記第2符号化信号の符号量を算出するとしてもよい。
上記の課題を解決するため、本発明のオーディオデコーダは、2チャネルを超えるマルチチャネル信号からダウンミックスされた2チャネルのステレオ信号が符号化されて得られる第1符号化信号と、前記ステレオ信号からマルチチャネル信号を生成するための情報が符号化されて得られたものである第2符号化信号と、前記第2符号化信号の符号量を表す信号とを含む符号化信号を取得する取得手段と、取得された前記符号化信号を復号化してステレオ信号を出力する復号化手段とを備える。
また、前記復号化手段は、取得された前記符号化信号から、前記第1符号化信号を読み出す第1符号化信号読み出し部と、前記第2符号化信号の符号量を表す信号を、前記符号化信号から読み出す符号量読み出し部と、前記第1符号化信号読み出し部によって読み出された前記第1符号化信号を復号化して、前記ステレオ信号を出力する第1復号化部とを備え、前記第1符号化信号読み出し部は、前記符号量読み出し部によって読み出された前記符号量を表す信号に基づいて、第2符号化信号を読み飛ばすとしてもよい。
また、前記第1符号化信号は、頭部伝達関数を用いた演算によりあらかじめ仮想サラウンド効果が付与されたステレオ信号が符号化されたものであり、前記第1復号化部は、仮想サラウンド効果の付与されたステレオ信号を出力するとしてもよい。
また、前記オーディオデコーダは、さらに、前記第2符号化信号を前記符号化信号から読み出す第2符号化信号読み出し部と、読み出された前記第1符号化信号と前記第2符号化信号とに基づいて、マルチチャネル信号を復号化する第2復号化部と、前記復号化されたマルチチャネル信号に対し、頭部伝達関数に基づくフィルタ処理を施し、仮想サラウンド効果が付与されたステレオ信号を出力するフィルタ部と、前記第1復号化部から出力される前記ステレオ信号と、前記フィルタ部から出力される前記仮想サラウンド効果が付与されたステレオ信号とのいずれかを選択する選択部とを備えるとしてもよい。
さらに、前記第1復号化部は、前記ステレオ信号の周波数軸信号を生成し、前記フィルタ部は、前記ステレオ信号の周波数軸信号から復元されたマルチチャネル信号の周波数軸信号に対し、頭部伝達関数に基づくフィルタ処理を行い2チャネルの周波数軸信号を生成した後、前記周波数軸信号を時間軸信号に変換するとしてもよい。
また、前記オーディオデコーダは、さらに、少なくとも前記第2復号化部を駆動する為の電力を供給する電力供給部を備え、前記選択部は、前記電力供給部からの電力供給量が所定の値を下回った場合、前記第1復号化部からのステレオ信号を選択するとしてもよい。
さらに、前記符号量読み出し部によって読み出される前記第2符号化信号の符号量を表す信号は、無効なデータを含む前記第2符号化信号の符号量を表す信号であるとしてもよい。
本発明によれば、ダウンミックス信号をマルチチャネル信号に戻すために必要な情報を符号化して得られる第2符号化信号の符号量を、オーディオデコーダで簡単に知りえるような符号化信号を生成することができることとなる。従って、ダウンミックス信号のみを再生する再生装置においても、容易にダウンミックス信号のみを復号化して再生することができる。
本発明によれば、前記第2符号化信号の符号量を表す信号を、前記第2符号化信号の開始位置の直後から入手することができることとなる。
本発明によれば、前記第2符号化信号の符号量を表す信号を、その値の大きさに応じて可変符号長で多重化できるので、符号量を表す信号多重化のためのビット数を節約することができることとなる。
さらに、本発明によれば、ダウンミックス処理を周波数軸上で行うことができるので、前記第2符号化手段が周波数軸上の信号に対し符号化処理を行う場合、前記ダウンミックス処理と前記第2符号化の処理とが効率的に実施できることとなる。
本発明によれば、第1符号化手段が、1/2以下の帯域の信号を扱うことになるので、圧縮率が向上できることとなる。また、第1符号化手段で符号化された符号化信号のみを再生する場合、1/2以下の帯域の信号を扱うことになるので復号化の演算量が少なくて済むこととなる。また、近年広く研究開発が行われている帯域拡大技術(ISO/IEC14496−3)が1/2帯域の以下の帯域の信号を拡大する技術であるので、その技術とのインターフェースがとり易くなることとなる。
また、本発明によれば、ダウンミックス信号が、頭部伝達関数のフィルタ処理された信号となり、第1符号化信号のみを再生した場合でも、もともとのマルチチャネルの空間情報が反映されることとなる。
さらに、本発明によれば、ダウンミックス信号が、頭部伝達関数のフィルタ処理された信号となり、第1符号化信号のみを再生した場合でも、もともとのマルチチャネルの空間情報が反映されることとなる。しかも頭部伝達関数の処理を周波数軸上で実施するので、近年主流のオーディオ圧縮方式、例えば、AAC方式(ISO/IEC13818−7)やAAC−SBR方式(ISO/IEC14496−3)と組み合わせたとき、少ない演算量で処理が実行できることとなる。なぜならば、それらの方式が、周波数軸上の信号を圧縮符号化している方式であるからである。
また、本発明によれば、ダウンミックス信号のみを復号化したいと欲する場合、簡単な処理でマルチチャネル化のために情報を取り去ることができることとなる。
さらに、本発明によれば、ダウンミックス信号の再生音と、マルチチャネル信号に対し、頭部伝達関数に基づくフィルタ処理を施した再生音とを選択できることとなる。
また、本発明によれば、周波数軸上で頭部伝達関数に基づくフィルタ処理を行い2チャネルの周波数軸信号を生成した後、当該周波数軸信号を時間軸信号に変換することができるので、近年主流のオーディオ圧縮方式、例えば、AAC方式(ISO/IEC13818−7)やAAC−SBR方式(ISO/IEC14496−3)と組み合わせたとき、少ない演算量で処理が実行できることとなる。なぜならば、それらの方式が、周波数軸上の信号を圧縮符号化している方式であるからである。
さらに、本発明によれば、オーディオデコーダを駆動する為の電力が低下した場合、例えば電池寿命がつきかけている場合、自動的にダウンミックス信号の復号化のモードに入るので、電池寿命が延長することとなる。また、聴取者は音質の変化によって電池寿命がつきかけていることを検知することができることとなる。
[図1]図1は、MPEG2オーディオ規格における符号化信号(ビットストリーム)の構造を示したものである。
[図2]図2は、本実施の形態1におけるオーディオエンコーダの構成を示すブロック図である。
[図3]図3(a)は、ダウンミックスの変換マトリックスを示す図である。図3(b)は、ダウンミックス信号を元のマルチチャネル信号に戻すための信号を生成するマトリックスを示す図である。図3(c)は、ダウンミックス信号を元のマルチチャネル信号に戻すためのマトリックスを示す図である。
[図4]図4(a)は、図3(b)に示したマトリックスを頭部伝達関数に基づいて算出した場合のマトリックスの一例を示す図である。図4(b)は、図4(a)の逆行列であり、ダウンミックス信号を元のマルチチャネル信号に戻すためのマトリックスの一例を示す図である。
[図5]図5は、図2の符号量算出部103で算出された符号量を符号化信号に記述するための記述方法の一例を示す図である。
[図6]図6は、図5に示した記述方法で符号量を符号化信号に記述する際のフローチャートである。
[図7]図7は、本実施の形態1、2で生成される符号化信号のデータ構成を示す図である。
[図8]図8は、本実施の形態2におけるオーディオエンコーダの構成を示す図である。
[図9]図9は、本実施の形態3におけるオーディオデコーダの構成を示す図である。
[図10]図10は、図5に示した符号量記述方法で記述されている符号量を表す信号をオーディオデコーダで読み取る場合の手順を示すフローチャートである。
[図11]図11は、本実施の形態4におけるオーディオデコーダの構成を示す図である。
[図12]図12は、本実施の形態4におけるオーディオデコーダのもう1つの構成を示す図である。
[図13]図13(a)は、本発明のオーディオデコーダを内蔵するモバイルテレビの外観の一例を示す図である。図13(b)は、本発明のオーディオデコーダを内蔵する携帯電話機の外観の一例を示す図である。
符号の説明
100,500 ダウンミックス部
101,501 第1符号化部
102,502 第2符号化部
103,503 符号量算出部
104,504 第1多重化部
105,505 第2多重化部
600,700,800 第1符号化信号取り出し部
601,701,801 第2符号化信号取り出し部
602,702,802 第1復号化部
603,703,803 符号量取り出し部
604,704,804 実体信号取り出し部
705,805 第2復号化部
706,806 フィルタ部
707,807 選択部
900 フレームヘッダ情報
901 第1符号化信号
902 第2符号化信号
(実施の形態1)
以下、本発明の実施の形態1におけるオーディオエンコーダについて図面を参照しながら説明する。図2は本実施の形態1におけるオーディオエンコーダの構成を示す図である。図2に示す実施の形態1のオーディオエンコーダは、1フレームがそれぞれ可変長の第1符号化信号と第2符号化信号とからなるフレームごとに、第2符号化信号の先頭部に当該第2符号化信号の符号量を表す信号を記述しておくオーディオエンコーダであって、ダウンミックス部100、第1符号化部101、第2符号化部102、符号量算出部103、第1多重化部104および第2多重化部105を備える。第1符号化信号は、マルチチャネル信号をダウンミックスして得られる2チャネルのステレオ信号を符号化して得られる。第2符号化信号は、第1符号化信号から元のマルチチャネル信号を復元するための情報を符号化して得られる。ダウンミックス部100は、Mチャネル(MはM>2を満たす自然数)のマルチチャネル信号をステレオ信号にダウンミックスする。なお、以下では、マルチチャネル信号をダウンミックスして得られたステレオ信号のことを「ダウンミックス信号」という。第1符号化部101は、ダウンミックス信号を符号化し、第1符号化信号を生成する。第2符号化部102は、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号化する。符号量算出部103は、第2符号化部102で符号化された信号の符号量を算出する。第1多重化部104は、符号量算出部103で算出された符号量と第2符号化部102で生成された信号とを多重化し、第2符号化信号を生成する。第2多重化部105は、第1符号化信号と第2符号化信号とを多重化する。
以上のように構成されたオーディオエンコーダの動作について以下説明する。まず、ダウンミックス部100は、本実施の形態では4チャネル(前左ch、前右ch、後左ch、後右ch)のマルチチャネル信号を入力とし、ステレオ信号にダウンミックスする。その方法は例えば、図3(a)に示したマトリックス演算を実行し、(前左ch+後左ch)を新たに左chとし、(前右ch+後右ch)を新たに右chとする、というような変換マトリックスを用いる方法が一般的である。または、MPEG2オーディオ規格で定められているように、入力の各チャネルの信号をフィルタバンクを用いて周波数軸信号に変換し、それぞれの周波数帯域ごとに定められた変換マトリックスに従ってダウンミックスしてもよい。または、入力の各チャネルの信号をFFT(Fast Fourier Transform)など直交変換方式を用いて周波数係数に変換し周波数係数ごとに定められた変換マトリックスに従ってダウンミックスしてもよい。この場合、各周波数係数は、フーリエ係数のように、複素数であってもよい。
次に第1符号化部101は、周波数軸上または時間軸上でダウンミックスされたダウンミックス信号を符号化し、第1符号化信号を生成する。ここで第1符号化部101による符号化は、例えばMPEG規格などで規定された符号化方式でよい。
次に第2符号化部102は、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号化する。例えば、ダウンミックスに用いた変換マトリックス演算に対する逆変換マトリックス演算を成立させる為の補助マトリックス演算によって生成された信号を符号化する。最も単純な例を図3(b)に示した。すなわち、図3(b)の網掛け部分のマトリックス演算によって算出された左’ch、右’chの信号を符号化する。このような信号が符号化され、ダウンミックス信号を符号化した信号とともに伝送、または蓄積されていれば、図3(c)に示した逆マトリックス演算によって、もとの4チャネル(前左ch、前右ch、後左ch、後右ch)のマルチチャネル信号にもどすことができるからである。図4(a)は、図3(b)に示したマトリックスを頭部伝達関数HRTFに基づいて算出された係数からなるマトリックスの一例を示す図である。図4(b)は、図4(a)の逆行列であり、ダウンミックス信号を元のマルチチャネル信号に戻すためのマトリックスの一例を示す図である。図4(a)および(b)のa,b,c,d,e,f,g,h,i,j,k,l,m,n,o,pは、頭部伝達関数HRTFに基づいて算出された係数である。このような頭部伝達関数に基づくマトリックスを用いることによって、左chおよび右chによって表される2チャネルのステレオ信号に、もともとのマルチチャネルの空間情報が反映されることとなる。このような処理は入力の時間軸信号に対して行われても良いが、入力の時間軸信号をフィルタバンクなどを用いて周波数軸信号に変換し、それぞれの周波数帯域ごとに定められた変換マトリックスに従って行われてもよい。または、入力の時間軸信号をFFTなど直交変換方式を用いて周波数係数に変換し周波数係数ごとに定められた変換マトリックスに従って行われてもよい。この場合、各周波数係数は、フーリエ係数のように、複素数であってもよい。
次に符号量算出部103は、第2符号化部102で符号化された信号の符号量を算出する。ただし、符号量算出部103は、第2符号化部102で符号化された信号を記述すべき領域が、第2符号化部102で符号化された信号以外の無効なデータ、例えば、nullなどを含む場合には、その無効なデータを含んだ符号量を算出する。すなわち、請求項およびここでいう符号量とは、第2符号化部102で符号化された信号を記述すべき領域が、無効なデータを含む場合には、その無効なデータを含んだ符号量をいう。
次に第1多重化部104は、符号量算出部103で算出された符号量と、第2符号化部102で生成された信号とを多重化し、第2符号化信号を生成する。図5は、図2の符号量算出部103で算出された符号量を符号化信号に記述するための記述方法の一例を示す図である。図6は、図5に示した記述方法で符号量を符号化信号に記述する際のフローチャートである。ここで、符号量算出部103で算出された符号量は、例えば図5に示すようにAビット、または(A+B)ビットの可変長のビットフィールドで表現される。具体的には、算出された符号量がAビットで表されるのであれば、size_of_extだけで記述され、符号量がAビットを超える場合には、size_of_extとsize_of_escとの2つのフィールドで表される。例えば、Aが4、Bが8、符号量sumが14バイトの場合、14は2進数1110の4ビットで表すことができるので(S401)、size_of_extという4ビットのフィールドに、sum=14を表す2進数1110が書かれる(S402)。この条件を表すif文では、size_of_extの値14が、(1<<4)−1すなわち、1を4ビット左へシフトした値16から1を減算して得られる15より小さいので、size_of_escという8ビットのフィールドは存在しない。すなわちこの場合4ビットのビットフィールドで符号量を表す信号を多重化する。
また、例えば、Aが4、Bが8、符号量sumが100バイトの場合には(S401)、size_of_extという4ビットのフィールドに、2進数1111が書かれる(S403)。この条件を表すif文では、size_of_extの値が、(1<<4)−1すなわち15と等しいので、size_of_escという8ビットのフィールドに、sum−size_of_ext+1=100−(15−1)の値が書かれる(S404)。すなわちこの場合12ビットのビットフィールドで符号量を表す信号が多重化される。
最後に第2多重化部105で、第1符号化信号901と第2符号化信号902とを多重化する。この処理を、逐次オーディオフレームごとに行うことによって、図7に示すような、第1符号化信号901と第2符号化信号902とが交互に多重化され、且つ、第2符号化信号902の先頭部に符号量を表す信号が多重化されたような符号化信号が生成される。
上記のように、本実施の形態によれば、Mチャネル(M>2)のマルチチャネル信号をステレオ信号にダウンミックスするダウンミックス部と、ダウンミックス信号を符号化し第1符号化信号を生成する第1符号化部101と、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号化する第2符号化部102と、第2符号化部102で符号化された信号の符号量を算出する符号量算出部103と、符号量算出部103で算出された符号量と第2符号化部102で生成された信号とを多重化し第2符号化信号を生成する第1多重化部104と、第1符号化信号と第2符号化信号とを多重化する第2多重化部105とを備え、第1多重化部104は、符号量を表す信号が第2符号化信号の先頭に配置されるように、符号量を表す信号を多重化することによって、第1符号化信号のみを復号化しダウンミックス信号のみを再生せんと欲するデコーダにとっては、第2符号化信号の符号量を示す情報が第2符号化信号に含まれているので、容易に第2符号化信号を全体の符号化信号から取り除くことができることとなる。
勿論ここで、符号量を表す信号は、第2符号化信号の開始を識別する記号の直後に配置するように、符号量を表す信号を多重化することが望ましい。なぜならば、第1符号化信号のみを復号化しダウンミックス信号のみを再生せんと欲するデコーダにとっては、第2符号化信号の符号量を示す情報が、第2符号化信号の先頭に配置されていれば、容易に第2符号化信号を全体の符号化信号から取り除くことができるからである。なお、この第2符号化信号の符号量は、MPEG2の符号化信号のFill Elementに記述されてもよい。この場合、第2符号化信号の開始を識別する記号とは、Fill Elementの開始を示す記号である。
また、算出された符号量を、当該符号量を表すためのビット量に応じた可変長のビットフィールドに多重化することによって、当該符号量を表す信号を多重化するためのビット数を削減できることとなる。
また、本実施の形態では、マルチチャネル信号のチャネル数は説明の簡単化のために4としたが、4でなくてもよく、一般的に広く普及している5.1チャネルであっても良いことはいうまでもない。
なお、算出された符号量を表す信号は、第2符号化信号の先頭に記述されることが好ましいが、本発明はこれに限定されない。例えば、フレームヘッダ情報の中に記述されてもよい。また、フレームヘッダ情報の中に第1符号化信号の符号量を表す信号が記述されるとしてもよい。なぜなら、フレームヘッダ情報の中にはフレーム全体の符号量が記述されているので、第2符号化信号の符号量は簡単に算出することができるからである。
(実施の形態2)
以下本発明の実施の形態2におけるオーディオエンコーダについて図面を参照しながら説明する。図8は本実施の形態2におけるオーディオエンコーダの構成を示す図である。図8のオーディオエンコーダは、入力された時間軸上の4チャネル信号を周波数軸上の信号に変換した後、ダウンミックスするオーディオエンコーダであって、ダウンミックス部500、第1符号化部501、第2符号化部502、符号量算出部503、第1多重化部504および第2多重化部505を備える。これにおいて、第2符号化部502、符号量算出部503、第1多重化部504および第2多重化部505は、実施の形態1で示したものと同様のものである。実施の形態1で示したものと異なるものは、ダウンミックス部500が、第2符号化部502の処理過程で生成される各入力チャネルの周波数軸信号を入力とし、該各入力チャネルの周波数軸信号の一部、または帯域の周波数軸信号をダウンミックスするように構成されている点と、第1符号化部501が、ダウンミックス部500でダウンミックスされた信号を入力として当該信号を符号化するように構成されている点である。
以上のように構成されたオーディオエンコーダの動作について以下に説明する。まず、第2符号化部502は、入力された4チャネル信号を時間軸上の信号のサンプル数と同数のサンプル数からなる周波数軸信号に変換する。これはフィルタバンクを用いても良いし、FFTのような直交変換方式を用いて周波数係数に変換してもよい。この場合、各周波数係数は、フーリエ係数のように、複素数であってもよい。この各チャネルの周波数軸信号をダウンミックス部500に対し送出し、ダウンミックス部500で所定の方法でダウンミックス処理が行われる。ここで、各チャネルの対応する周波数軸信号同士に対して実施されるダウンミックス処理は、実施の形態1で述べたようなマトリックス演算によって実施すればよい。一方第2符号化部502では、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号化する。この方法も、実施の形態1で示した方法と同様でよい。
ここで本実施の形態では、ダウンミックス部500は、受け取った各チャネルの周波数軸信号の一部の帯域のみに対しダウンミックス処理を実施するようにしてもよい。例えば、全周波数帯域の高域側の一部を取り除いた信号をダウンミックスする。このことによって、第1符号化信号のみを復号化しダウンミックス信号のみを再生せんと欲するデコーダにとっては、符号化信号の周波数帯域が狭いので復号化に際しての演算量が少なくてすむことになる。また、全周波数帯域の1/2以下の周波数帯域の信号をダウンミックスすることとすれば、以下に示す理由によって、更に利便性を享受できる。すなわち、第1符号化部501は、例えばMPEG規格などで規定された符号化方式でよいが、特に、ここで、周波数帯域が全周波数帯域の1/2以下の周波数帯域であれば近年MPEG4規格で検討されている帯域拡大技術(ISO/IEC14496−3)が前提としている周波数帯域と合致するので、当該技術とのインターフェースがとり易くなるからである。
以降、符号量算出部503の処理、第1多重化部504の処理、第2多重化部505の処理は、実施の形態1で述べたのと同様でよい。
また、ダウンミックス部500では、周波数成分に分解された信号に対し頭部伝達関数に基づいたフィルタ処理を実施しながらダウンミックスしてもよい。周波数成分に分解された信号に対する頭部伝達関数に基づいたフィルタ処理は、特開平11−032400号公報で述べられているような方法でよい。そうすることによって、第1符号化部501で符号化された符号化信号のみを再生した場合でも、もともとのマルチチャネルの空間情報が反映されることとなるからである。勿論このことは、本実施の形態2での処理過程のみに適応されるわけではなく、先の実施の形態1での処理過程で実施しても良いことは言うまでもない。
上記のように、本実施の形態によれば、Mチャネル(M>2)のマルチチャネル信号をステレオ信号にダウンミックスするダウンミックス部500と、ダウンミックス信号を符号化し第1符号化信号を生成する第1符号化部501と、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号化する第2符号化部502と、第2符号化部502で符号化された信号の符号量を算出する符号量算出部503と、符号量算出部503で算出された符号量を表す信号と第2符号化部502で生成された信号とを多重化し第2符号化信号を生成する第1多重化部504と、第1符号化信号と第2符号化信号とを多重化する第2多重化部505と、を有し、ダウンミックス部500は、マルチチャネル信号をそれぞれ周波数軸信号に変換し該周波数軸信号の一部または全部の周波数帯域の信号をステレオ信号にダウンミックスすることによって、ダウンミックス処理を周波数軸上で行うことができるので、第2符号化部502が周波数軸上の信号に対し符号化処理を行う場合、ダウンミックス処理と第2符号化の処理とが効率的に実施できることとなる。また、一部または全部の周波数帯域の信号をステレオ信号にダウンミックスすれば、ダウンミックス処理を少ない演算量で行えることとなると同時に、第1符号化部501が、狭い帯域の信号を扱うことになるので、圧縮率が向上できることとなる。また、第1符号化部501で符号化された符号化信号のみを再生する場合、狭い帯域の信号を扱うことになるので復号化の演算量が少なくて済むこととなる。また、ダウンミックス処理を、もともとの周波数帯域の1/2の帯域で処理すれば、第1符号化部501が、1/2以下の帯域の信号を扱うことになるので、圧縮率がさらに向上できることとなると同時に、第1符号化部501で符号化された符号化信号のみを再生する場合、1/2以下の帯域の信号を扱うことになるので復号化の演算量が少なくて済むこととなる。また、近年広く研究開発が行われている帯域拡大技術(ISO/IEC14496−3)が1/2帯域の以下の帯域の信号を拡大する技術であるので、その技術とのインターフェースがとり易くなることとなる。
また、上記ダウンミックス処理時に、頭部伝達関数のフィルタ処理も実施しておけば、第1符号化部501で符号化された符号化信号のみを再生した場合でも、もともとのマルチチャネルの空間情報が反映されることとなる。
勿論、上記頭部伝達関数のフィルタ処理は周波数軸上で行わず、時間軸上で行ってもよいことは言うまでもない。
また、本実施の形態では、マルチチャネル信号のチャネル数は説明の簡単化のために4としたが、4でなくてもよく、一般的に広く普及している5.1チャネルであっても良いことはいうまでもない。
(実施の形態3)
以下本発明の実施の形態3におけるオーディオデコーダについて図面を参照しながら説明する。本オーディオデコーダは、実施の形態1または実施の形態2で符号化された符号化信号を復号化するオーディオデコーダである。すなわち、Mチャネル(M>2)のマルチチャネル信号をダウンミックスしたステレオ信号を符号化した第1符号化信号と、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号化した第2符号化信号とが多重化された符号化信号を復号化するオーディオデコーダである。ここで、第2符号化信号には、当該第2符号化信号の符号量を示す値が多重化されているものとする。
図9は本実施の形態3におけるオーディオデコーダの構成を示す図である。図9において、オーディオデコーダは、第1符号化信号取り出し部600、第2符号化信号取り出し部601、第1復号化部602、符号量取り出し部603、および実体信号取り出し部604を備える。第1符号化信号取り出し部600は、第1符号化信号を取り出す。第2符号化信号取り出し部601は、第2符号化信号を取り出す。第1復号化部602は、第1符号化信号に基づいて、ダウンミックス信号を復号化する。符号量取り出し部603は、第2符号化信号に含まれている当該第2符号化信号の符号量を表す信号を取り出す。実体信号取り出し部604は、符号量取り出し部603によって取り出された符号量を表す信号に基づいて、符号化信号から第2符号化信号を取り出す。
以上のように構成されたオーディオデコーダの動作について、以下に説明する。まず、第1符号化信号取り出し部600は、4チャネルのマルチチャネル信号をダウンミックスしたステレオ信号を符号化した第1符号化信号と、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号化した第2符号化信号とが多重化された符号化信号から、第1符号化信号を取り出す。ここで、第1符号化信号は、実施の形態1、または実施の形態2の第1符号化部で生成された符号化信号であるので、当該第1符号化信号取り出し部600では、第1符号化信号の符号化フォーマットに則って第1符号化信号を取り出せばよい。例えば、第1符号化部が、MPEG規格AAC方式に則った符号化部なのであれば、当該第1符号化信号取り出し部600では、AAC符号化フォーマットに則って第1符号化信号を取り出せばよい。
次に、第1復号化部602で第1符号化信号に基づいて、ダウンミックス信号を復号化する。ここでの復号化の方法も、第1符号化信号の符号化規格に則って復号化すればよい。
図10は、図5に示した符号量記述方法で記述されている符号量を表す信号をオーディオデコーダで読み取る場合の手順を示すフローチャートである。次に、第2符号化信号取り出し部601に内蔵されている符号量取り出し部603で、第2符号化信号に含まれている当該第2符号化信号の符号量を表す信号を取り出す(S501)。ここで当該符号量sumは、図5に示したAビットまたは(A+B)ビットで表現されているものとする。例えば、図5に示したsize_of_extが4ビット、size_of_escが8ビット、size_of_extの値が2進数で1010であるとする。この場合、size_of_extの値が10であり、(1<<4)−1=15に等しくないので(S502)、size_of_escの8ビットは存在せず、符号量sumは10バイトということになる(S505)。また例えば、size_of_extが4ビット、size_of_escが8ビット、size_of_extの値が2進数で1111の場合、size_of_extの値が(1<<4)−1=15なので(S502)、size_of_escの8ビットが存在することになる。符号量取り出し部603は、さらに8ビットのsize_of_escを取り出す(S503)。ここで、size_of_escの値が2進数で00001000の場合、符号量sumは、sum=size_of_ext+size_of_esc−1=15+8−1となり、22バイトとなる(S504)。
最後に、実体信号取り出し部604で、符号量取り出し部603によって取り出された符号量を表す信号に基づいて、符号化信号から第2符号化信号を取り出す。例えば、符号量が、20バイトなのであれば、以降の20バイトの信号が、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号化した第2符号化信号の符号量と分かり、当該第2符号化信号は、ダウンミックス信号のみを再生するデコーダにとっては不要なものであるので、そのサイズ分だけ、符号化信号を読み飛ばせばよいことになる。
ここで、当該第2符号化信号に多重化されている当該符号量に応じた値は、必ずしも、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号化した信号の符号量と丁度一致している必要はなく、それと同じかそれより大きな値であればよい。例えば、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号化した信号の正味の符号量が18バイトの場合でも、例えば2バイトの付加的な情報を追加した場合は(これは実質的に無意味な情報でもよいが)、当該第2符号化信号に多重化されている当該符号量に相当する値は20となっているべきである。すなわち、第2符号化信号が付加的な情報または無意味な情報である2バイトを含んでいるとした場合と同じである。そうすることによって、実体信号取り出し部は、符号化信号の内容については一切関知する必要がなくなるからである。
以上の様に、本実施の形態のオーディオデコーダは、Mチャネル(M>2)のマルチチャネル信号をダウンミックスしたステレオ信号を符号化した第1符号化信号と、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号化した第2符号化信号とが多重化された符号化信号に対し、第1符号化信号を取り出す第1符号化信号取り出し部600と、第2符号化信号を取り出す第2符号化信号取り出し部601と、第1符号化信号に基づいて、ダウンミックス信号を復号化する第1復号化部602とを有し、第2符号化信号取り出し部601は、第2符号化信号に含まれる符号量を表す信号を取り出す符号量取り出し部603と、符号量取り出し部603によって取り出された符号量を表す信号に基づいて、符号化信号から第2符号化信号を取り出す実体信号取り出し部604をさらに備える。これによって、ダウンミックス信号のみを復号化したいと欲するオーディオデコーダの場合、簡単な処理でマルチチャネル化のための情報を取り去るまたは読み飛ばすことができることとなる。
勿論ここで、符号量を表す信号は、第2符号化信号の先頭に配置されることが望ましい。なぜならば、第1符号化信号のみを復号化しダウンミックス信号のみを再生せんと欲するデコーダにとっては、第2符号化信号の符号量を示す情報が、第2符号化信号の先頭に配置されていれば、容易に第2符号化信号を全体の符号化信号から取り除くことができるからである。
またここで、第1符号化信号が、先に述べた実施の形態2のように、予め頭部伝達関数に基づくフィルタ処理によって本来のマルチチャネル信号が2チャネル信号にダウンミックスされていれば、第1符号化信号のみを復号化しダウンミックス信号のみを再生せんと欲するデコーダにとっては、単に第1符号化信号を復号化するだけで、もともとのマルチチャネルの空間情報が反映されたオーディオを再生できることとなる。
また、本実施の形態では、マルチチャネル信号のチャネル数は説明の簡単化のために4としたが、4でなくてもよく、一般的に広く普及している5.1チャネルであっても良いことはいうまでもない。
(実施の形態4)
以下、本発明の実施の形態4におけるオーディオデコーダについて図面を参照しながら説明する。
本オーディオデコーダは、実施の形態1または実施の形態2で符号化された符号化信号を復号化するオーディオデコーダである。すなわち、Mチャネル(M>2)のマルチチャネル信号をダウンミックスしたステレオ信号を符号化した第1符号化信号と、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号化した第2符号化信号とが多重化された符号化信号を復号化するオーディオデコーダである。ここで、第2符号化信号には、当該第2符号化信号の符号量を示す値が多重化されているものである。
図11は、本実施の形態4におけるオーディオデコーダの構成を示す図である。図11に示すように、実施の形態4のオーディオデコーダは、第1符号化信号取り出し部700、第2符号化信号取り出し部701、第1復号化部702、符号量取り出し部703、実体信号取り出し部704、第2復号化部705、フィルタ部706および選択部707を備える。このうち、実施の形態3と異なるのは、第1符号化信号と第2符号化信号とに基づいて、マルチチャネル信号を復号化する第2復号化部705と、復号化されたマルチチャネル信号に対し、頭部伝達関数に基づくフィルタ処理を施すフィルタ部706と、第1復号化部702で生成された信号か、フィルタ部706で生成された信号かを選択する選択部707とを備えたところである。それ以外の第1符号化信号取り出し部700、第2符号化信号取り出し部701、第1復号化部702、符号量取り出し部703および実体信号取り出し部704は、実施の形態3で述べたものと同様である。
以上のように構成されたオーディオデコーダの動作について、以下に説明する。まず、第1符号化信号取り出し部700は、4チャネルのマルチチャネル信号をダウンミックスしたステレオ信号を符号化した第1符号化信号と、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号化した第2符号化信号とが多重化された符号化信号から、第1符号化信号を取り出す。この動作は、実施の形態3と同様である。
次に、第1復号化部702で第1符号化信号に基づいて、ダウンミックス信号を復号化する。この動作も、実施の形態3と同様である。
次に、第2符号化信号取り出し部701に内蔵されている符号量取り出し部703で、第2符号化信号に含まれている当該第2符号化信号の符号量を表す信号を取り出す。この動作は、実施の形態3と同様である。
次に符号量取り出し部703によって取り出された符号量を表す信号に基づいて、実体信号取り出し部704が、符号化信号から第2符号化信号を取り出す。この動作は、実施の形態3と同様である。
次に、第2復号化部705で、第1符号化信号と第2符号化信号とに基づいて、マルチチャネル信号を復号化する。
ここで、第1符号化信号と第2符号化信号は、実施の形態1、または実施の形態2のオーディオエンコーダで生成された符号化信号であるので、当該第2復号化部705では、その符号化フォーマットに則って第1符号化信号と第2符号化信号とを復号しマルチチャネル信号を生成すればよい。
次にフィルタ部706で、復号化されたマルチチャネル信号に対し、頭部伝達関数に基づくフィルタ処理を施す。
最後に、選択部707で、第1復号化部で生成された信号か、フィルタ部で生成された信号かを選択する。
以上の様に、本実施の形態では、Mチャネル(M>2)のマルチチャネル信号をダウンミックスしたステレオ信号を符号化した第1符号化信号と、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号化した第2符号化信号とが多重化された符号化信号に対し、第1符号化信号を取り出す第1符号化信号取り出し部700と、第2符号化信号を取り出す第2符号化信号取り出し部701と、第1符号化信号に基づいて、ダウンミックス信号を復号化する第1復号化部702と、第2符号化信号に含まれる符号量を表す信号を取り出す符号量取り出し部703と、符号量取り出し部703によって取り出された符号量を表す信号に基づいて、符号化信号から第2符号化信号を取り出す実体信号取り出し部704と、第1符号化信号と第2符号化信号とに基づいて、マルチチャネル信号を復号化する第2復号化部705と、復号化されたマルチチャネル信号に対し、頭部伝達関数に基づくフィルタ処理を施すフィルタ部706と、第1復号化部で生成された信号か、フィルタ部706で生成された信号かを選択する選択部707とを備えることによって、ダウンミックス信号の再生音と、マルチチャネル信号に対し頭部伝達関数に基づくフィルタ処理を施した再生音とを利用者が選択できることとなる。
上記の処理において、第2復号化部705では各マルチチャネル信号の周波数軸信号を生成するようにし、当該各マルチチャネル信号の周波数軸信号に対し周波数軸上で頭部伝達関数に基づくフィルタ処理を行い2チャネルの周波数軸信号を生成した後、当該周波数軸信号を時間軸信号に変換するようにしてもよい。例えば、特開平11−032400号公報で述べられているような方法でもよい。そうすることによって、例えば、AAC方式(ISO/IEC13818−7)やAAC−SBR方式(ISO/IEC14496−3)と組み合わせたとき、演算量が大幅に削減できることになる。なぜならば、それらの方式が、周波数軸上の信号を圧縮符号化している方式であるので、周波数軸信号を時間軸信号に変換する処理が内蔵されているが、周波数軸上でダウンミックスすることによって、周波数軸信号を時間軸信号に変換する処理が2チャネル分のみで済むことになるからである。
また、本実施の形態では、マルチチャネル信号のチャネル数は説明の簡単化のために4としたが、4でなくてもよく、一般的に広く普及している5.1チャネルであっても良いことはいうまでもない。
また、本実施の形態では、第2復号化部は、第1符号化信号と第2符号化信号とを入力とし、それらを用いてマルチチャネル信号を復号化したが、第1復号化部で復号化した信号を用いて、マルチチャネル信号を復号化するようにしてもよい。図12は、本実施の形態4におけるオーディオデコーダの他の構成を示す図である。その場合、図12に示すような構成になる。
また、当該オーディオデコーダを駆動する為の電力が低下した場合、例えば電池寿命がつきかけている場合、そのことを検出し、自動的に上記選択部を、第1復号化部で生成された信号で出力するように制御すれば、バッテリーがつきかけているときに、自動的にダウンミックス信号の復号化のモードに入るので、電池寿命が延長することとなる。また、聴取者は音質の変化によって電池寿命がつきかけていることを検知することができることとなる。
図13は、本発明のオーディオデコーダを備えるモバイルオーディオ機器の外観の一例を示す図である。(a)は、本発明のオーディオデコーダを内蔵するモバイルテレビの一例を示す図である。(b)は、本発明のオーディオデコーダを内蔵する携帯電話機の一例を示す図である。同図に示すような携帯型の機器では、単位時間あたりの演算量が大きいと、演算処理の並列化などのために回路規模が大きくなってしまう。そして、モバイルオーディオ機器では、いまだに2チャネル再生が主流である。従って、同図に示すようなモバイルオーディオ機器では、本発明のオーディオエンコーダによって符号化された符号化信号を復号化し、再生することによって、符号化信号の不要な部分を読み飛ばし、頭部伝達関数を用いてフィルタリングされた仮想サラウンドオーディオを、低い負荷で再生することができる。
本発明にかかるオーディオエンコーダは、マルチチャネル信号を符号化するオーディオエンコーダであるが、エンコードされたマルチチャネル信号を安価なデコーダで再生できるような符号化信号を生成するので、特に機器の小型化が必要な携帯機器に応用できる。
本発明にかかるオーディオデコーダは、マルチチャネル信号を符号化した符号化信号を2チャネルの再生部、例えば、ヘッドホンで再生するのに適しているので、特に機器の小型化が必要な携帯機器、例えば、モバイルテレビ、MD、SDおよび携帯電話機などに応用できる。
本発明は、マルチチャネル信号を符号化するオーディオエンコーダに関する。特に、エンコードされたマルチチャネル信号を安価なデコーダで再生できるような符号化信号を生成するオーディオエンコーダに関する。
また、本発明は、そのようなオーディオエンコーダでエンコードされた符号化信号をデコードするオーディオデコーダに関する。特にマルチチャネル信号を2チャネルで再生するようなオーディオデコーダに関する。
従来から、マルチチャネル信号を安価な再生装置、とりわけ2チャネルの再生装置で再生することができるような符号化信号を生成するオーディオエンコーダの研究開発が行われている。例えば、MPEG2オーディオ規格(ISO13818−3)では、マルチチャネル信号を2チャネルにダウンミックスした信号と、当該ダウンミックスされた信号をマルチチャネル信号に戻すための信号とを分けて、それぞれ第1符号化信号、第2符号化信号として符号化し、安価なデコーダでは上記第1符号化信号のみを復号化することができる技術が開示されている(非特許文献1参照)。
MPEG2オーディオ規格(ISO13818−3)
しかしながら、MPEG2オーディオ規格では、上記第1符号化信号と、上記第2符号化信号とを分離することが容易ではないという課題があった。
図1は、MPEG2オーディオ規格における符号化信号(ビットストリーム)の構造を示したものである。図1において、フレームヘッダ情報900は、1152サンプルごとに符号化された1フレームの符号化情報の開始位置を示している。第1符号化信号901は、マルチチャネル信号を2チャネルにダウンミックスしたステレオ信号を符号化した符号化信号である。第2符号化信号902は、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号化して得られる符号化信号である。
さてここで、第1符号化信号901のみをデコードしたいと欲する、例えば、2チャネル再生のみを前提として設計された携帯電話機などのデコーダは、第1符号化信号901を取得し復号化した後、第2符号化信号902を読み飛ばしたいと欲するが、以下の理由によって容易には第2符号化信号902の量を取得することができず、従って、容易には第2符号化信号902を読み飛ばすことができない。なぜならば、各フレームのフレームサイズは各フレームのフレームヘッダ情報900を解析することで容易に取得することができるが、第1符号化信号901の符号量は図に例示したようにフレームごとに可変であるので、必然的に第2符号化信号902の符号量も可変となる。従って、第2符号化信号902の符号量は、当該フレームのフレームサイズから当該フレームの第1符号化信号901の符号量を引くことによってしか知ることができない。従って第1符号化信号901をデコードする際、第1符号化信号901の符号量をいちいち算出しなければならないこととなり、このことに多大の演算資源を費やさなければならないという課題がある。
また、従来の技術では、以下のような課題もある。
MPEG2オーディオ規格では、復号化されたダウンミックス信号は、サンプル時刻ごとに所定のマトリックス演算によってダウンミックスされているので、もともとのマルチチャネル信号の空間情報が失われているという。従って、元の空間情報を再現した上で、2チャネルダウンミックスした信号を再生せんと欲した場合、つまり、仮想サラウンド処理を施した2チャネル信号を再生せんと欲した場合、一旦、第1符号化信号901と第2符号化信号902とを用いてマルチチャネル信号を復号した後、頭部伝達関数に基づいて空間情報をフィルタ処理する必要があり、そのことに多大の演算資源を費やさなければならないという課題がある。
本発明は、このような従来の問題点に鑑みてなされたものであって、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号化した符号化信号の符号量を簡単に知りえるような符号化信号を生成するオーディオエンコーダを提供することを目的とする。
さらに、本発明は、ダウンミックス信号を再生するだけで元のマルチチャネルの空間情報が再生できるような符号化情報を生成するオーディオエンコーダを提供することを第2の目的とする。
また、そのようなオーディオエンコーダで符号化された符号化信号を少ない演算量で復号化するオーディオデコーダを提供することを目的とする。
上記の課題を解決するため、本発明のオーディオエンコーダは、2チャネルを超えるマルチチャネル信号を、2チャネルのステレオ信号にダウンミックスするダウンミックス手段と、前記ダウンミックスされたステレオ信号を符号化し、第1符号化信号を生成する第1符号化手段と、前記ダウンミックスされたステレオ信号をマルチチャネル信号に戻すための情報を符号化し、第2符号化信号を生成する第2符号化手段と、前記第2符号化信号の符号量を算出する符号量算出手段と、前記第1符号化信号、前記第2符号化信号および算出された前記符号量を表す信号を多重化する多重化手段とを備えることを特徴とする。
また、前記多重化手段は、前記符号量算出手段で算出された符号量と、前記第2符号化信号とを多重化する第1多重化部と、前記第1符号化信号と、前記符号量が多重化された前記第2符号化信号とを多重化する第2多重化部とを備えるとしてもよい。
さらに、前記第1多重化部は、前記符号量算出手段で算出された前記符号量を、前記第2符号化信号の先頭に配置して多重化するとしてもよい。
また、前記第1多重化部は、前記符号量算出手段で算出された前記符号量を、前記第2符号化信号の開始を識別する記号の直後に配置するように多重化するとしてもよい。
さらに、前記第1多重化部は、前記符号量算出手段で算出された前記符号量を表す信号を可変長で記述し、前記第2符号化信号に多重化するとしてもよい。
また、前記ダウンミックス手段は、前記マルチチャネル信号に頭部伝達関数を用いた演算を行い、ダウンミックス処理を行うとしてもよい。
また、前記ダウンミックス手段は、周波数軸上で、前記マルチチャネル信号に頭部伝達関数を用いた演算を行うとしてもよい。
さらに、前記第2符号化信号は無効なデータを含み、前記符号量算出手段は、前記無効なデータを含む前記第2符号化信号の符号量を算出するとしてもよい。
上記の課題を解決するため、本発明のオーディオデコーダは、2チャネルを超えるマルチチャネル信号からダウンミックスされた2チャネルのステレオ信号が符号化されて得られる第1符号化信号と、前記ステレオ信号からマルチチャネル信号を生成するための情報が符号化されて得られたものである第2符号化信号と、前記第2符号化信号の符号量を表す信号とを含む符号化信号を取得する取得手段と、取得された前記符号化信号を復号化してステレオ信号を出力する復号化手段とを備える。
また、前記復号化手段は、取得された前記符号化信号から、前記第1符号化信号を読み出す第1符号化信号読み出し部と、前記第2符号化信号の符号量を表す信号を、前記符号化信号から読み出す符号量読み出し部と、前記第1符号化信号読み出し部によって読み出された前記第1符号化信号を復号化して、前記ステレオ信号を出力する第1復号化部とを備え、前記第1符号化信号読み出し部は、前記符号量読み出し部によって読み出された前記符号量を表す信号に基づいて、第2符号化信号を読み飛ばすとしてもよい。
また、前記第1符号化信号は、頭部伝達関数を用いた演算によりあらかじめ仮想サラウンド効果が付与されたステレオ信号が符号化されたものであり、前記第1復号化部は、仮想サラウンド効果の付与されたステレオ信号を出力するとしてもよい。
また、前記オーディオデコーダは、さらに、前記第2符号化信号を前記符号化信号から読み出す第2符号化信号読み出し部と、読み出された前記第1符号化信号と前記第2符号化信号とに基づいて、マルチチャネル信号を復号化する第2復号化部と、前記復号化されたマルチチャネル信号に対し、頭部伝達関数に基づくフィルタ処理を施し、仮想サラウンド効果が付与されたステレオ信号を出力するフィルタ部と、前記第1復号化部から出力される前記ステレオ信号と、前記フィルタ部から出力される前記仮想サラウンド効果が付与されたステレオ信号とのいずれかを選択する選択部とを備えるとしてもよい。
さらに、前記第1復号化部は、前記ステレオ信号の周波数軸信号を生成し、前記フィルタ部は、前記ステレオ信号の周波数軸信号から復元されたマルチチャネル信号の周波数軸信号に対し、頭部伝達関数に基づくフィルタ処理を行い2チャネルの周波数軸信号を生成した後、前記周波数軸信号を時間軸信号に変換するとしてもよい。
また、前記オーディオデコーダは、さらに、少なくとも前記第2復号化部を駆動する為の電力を供給する電力供給部を備え、前記選択部は、前記電力供給部からの電力供給量が所定の値を下回った場合、前記第1復号化部からのステレオ信号を選択するとしてもよい。
さらに、前記符号量読み出し部によって読み出される前記第2符号化信号の符号量を表す信号は、無効なデータを含む前記第2符号化信号の符号量を表す信号であるとしてもよい。
本発明によれば、ダウンミックス信号をマルチチャネル信号に戻すために必要な情報を符号化して得られる第2符号化信号の符号量を、オーディオデコーダで簡単に知りえるような符号化信号を生成することができることとなる。従って、ダウンミックス信号のみを再生する再生装置においても、容易にダウンミックス信号のみを復号化して再生することができる。
本発明によれば、前記第2符号化信号の符号量を表す信号を、前記第2符号化信号の開始位置の直後から入手することができることとなる。
本発明によれば、前記第2符号化信号の符号量を表す信号を、その値の大きさに応じて可変符号長で多重化できるので、符号量を表す信号多重化のためのビット数を節約することができることとなる。
さらに、本発明によれば、ダウンミックス処理を周波数軸上で行うことができるので、前記第2符号化手段が周波数軸上の信号に対し符号化処理を行う場合、前記ダウンミックス処理と前記第2符号化の処理とが効率的に実施できることとなる。
本発明によれば、第1符号化手段が、1/2以下の帯域の信号を扱うことになるので、圧縮率が向上できることとなる。また、第1符号化手段で符号化された符号化信号のみを再生する場合、1/2以下の帯域の信号を扱うことになるので復号化の演算量が少なくて済むこととなる。また、近年広く研究開発が行われている帯域拡大技術(ISO/IEC14496−3)が1/2帯域の以下の帯域の信号を拡大する技術であるので、その技術とのインターフェースがとり易くなることとなる。
また、本発明によれば、ダウンミックス信号が、頭部伝達関数のフィルタ処理された信号となり、第1符号化信号のみを再生した場合でも、もともとのマルチチャネルの空間情報が反映されることとなる。
さらに、本発明によれば、ダウンミックス信号が、頭部伝達関数のフィルタ処理された信号となり、第1符号化信号のみを再生した場合でも、もともとのマルチチャネルの空間情報が反映されることとなる。しかも頭部伝達関数の処理を周波数軸上で実施するので、近年主流のオーディオ圧縮方式、例えば、AAC方式(ISO/IEC13818−7)やAAC−SBR方式(ISO/IEC14496−3)と組み合わせたとき、少ない演算量で処理が実行できることとなる。なぜならば、それらの方式が、周波数軸上の信号を圧縮符号化している方式であるからである。
また、本発明によれば、ダウンミックス信号のみを復号化したいと欲する場合、簡単な処理でマルチチャネル化のために情報を取り去ることができることとなる。
さらに、本発明によれば、ダウンミックス信号の再生音と、マルチチャネル信号に対し、頭部伝達関数に基づくフィルタ処理を施した再生音とを選択できることとなる。
また、本発明によれば、周波数軸上で頭部伝達関数に基づくフィルタ処理を行い2チャネルの周波数軸信号を生成した後、当該周波数軸信号を時間軸信号に変換することができるので、近年主流のオーディオ圧縮方式、例えば、AAC方式(ISO/IEC13818−7)やAAC−SBR方式(ISO/IEC14496−3)と組み合わせたとき、少ない演算量で処理が実行できることとなる。なぜならば、それらの方式が、周波数軸上の信号を圧縮符号化している方式であるからである。
さらに、本発明によれば、オーディオデコーダを駆動する為の電力が低下した場合、例えば電池寿命がつきかけている場合、自動的にダウンミックス信号の復号化のモードに入るので、電池寿命が延長することとなる。また、聴取者は音質の変化によって電池寿命がつきかけていることを検知することができることとなる。
(実施の形態1)
以下、本発明の実施の形態1におけるオーディオエンコーダについて図面を参照しながら説明する。図2は本実施の形態1におけるオーディオエンコーダの構成を示す図である。図2に示す実施の形態1のオーディオエンコーダは、1フレームがそれぞれ可変長の第1符号化信号と第2符号化信号とからなるフレームごとに、第2符号化信号の先頭部に当該第2符号化信号の符号量を表す信号を記述しておくオーディオエンコーダであって、ダウンミックス部100、第1符号化部101、第2符号化部102、符号量算出部103、第1多重化部104および第2多重化部105を備える。第1符号化信号は、マルチチャネル信号をダウンミックスして得られる2チャネルのステレオ信号を符号化して得られる。第2符号化信号は、第1符号化信号から元のマルチチャネル信号を復元するための情報を符号化して得られる。ダウンミックス部100は、Mチャネル(MはM>2を満たす自然数)のマルチチャネル信号をステレオ信号にダウンミックスする。なお、以下では、マルチチャネル信号をダウンミックスして得られたステレオ信号のことを「ダウンミックス信号」という。第1符号化部101は、ダウンミックス信号を符号化し、第1符号化信号を生成する。第2符号化部102は、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号化する。符号量算出部103は、第2符号化部102で符号化された信号の符号量を算出する。第1多重化部104は、符号量算出部103で算出された符号量と第2符号化部102で生成された信号とを多重化し、第2符号化信号を生成する。第2多重化部105は、第1符号化信号と第2符号化信号とを多重化する。
以上のように構成されたオーディオエンコーダの動作について以下説明する。まず、ダウンミックス部100は、本実施の形態では4チャネル(前左ch、前右ch、後左ch、後右ch)のマルチチャネル信号を入力とし、ステレオ信号にダウンミックスする。その方法は例えば、図3(a)に示したマトリックス演算を実行し、(前左ch+後左ch)を新たに左chとし、(前右ch+後右ch)を新たに右chとする、というような変換マトリックスを用いる方法が一般的である。または、MPEG2オーディオ規格で定められているように、入力の各チャネルの信号をフィルタバンクを用いて周波数軸信号に変換し、それぞれの周波数帯域ごとに定められた変換マトリックスに従ってダウンミックスしてもよい。または、入力の各チャネルの信号をFFT(Fast Fourier Transform)など直交変換方式を用いて周波数係数に変換し周波数係数ごとに定められた変換マトリックスに従ってダウンミックスしてもよい。この場合、各周波数係数は、フーリエ係数のように、複素数であってもよい。
次に第1符号化部101は、周波数軸上または時間軸上でダウンミックスされたダウンミックス信号を符号化し、第1符号化信号を生成する。ここで第1符号化部101による符号化は、例えばMPEG規格などで規定された符号化方式でよい。
次に第2符号化部102は、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号化する。例えば、ダウンミックスに用いた変換マトリックス演算に対する逆変換マトリックス演算を成立させる為の補助マトリックス演算によって生成された信号を符号化する。最も単純な例を図3(b)に示した。すなわち、図3(b)の網掛け部分のマトリックス演算によって算出された左’ch、右’chの信号を符号化する。このような信号が符号化され、ダウンミックス信号を符号化した信号とともに伝送、または蓄積されていれば、図3(c)に示した逆マトリックス演算によって、もとの4チャネル(前左ch、前右ch、後左ch、後右ch)のマルチチャネル信号にもどすことができるからである。図4(a)は、図3(b)に示したマトリックスを頭部伝達関数HRTFに基づいて算出された係数からなるマトリックスの一例を示す図である。図4(b)は、図4(a)の逆行列であり、ダウンミックス信号を元のマルチチャネル信号に戻すためのマトリックスの一例を示す図である。図4(a)および(b)のa, b, c, d, e, f, g, h, i, j, k, l, m, n, o, pは、頭部伝達関数HRTFに基づいて算出された係数である。このような頭部伝達関数に基づくマトリックスを用いることによって、左chおよび右chによって表される2チャネルのステレオ信号に、もともとのマルチチャネルの空間情報が反映されることとなる。このような処理は入力の時間軸信号に対して行われても良いが、入力の時間軸信号をフィルタバンクなどを用いて周波数軸信号に変換し、それぞれの周波数帯域ごとに定められた変換マトリックスに従って行われてもよい。または、入力の時間軸信号をFFTなど直交変換方式を用いて周波数係数に変換し周波数係数ごとに定められた変換マトリックスに従って行われてもよい。この場合、各周波数係数は、フーリエ係数のように、複素数であってもよい。
次に符号量算出部103は、第2符号化部102で符号化された信号の符号量を算出する。ただし、符号量算出部103は、第2符号化部102で符号化された信号を記述すべき領域が、第2符号化部102で符号化された信号以外の無効なデータ、例えば、nullなどを含む場合には、その無効なデータを含んだ符号量を算出する。すなわち、請求項およびここでいう符号量とは、第2符号化部102で符号化された信号を記述すべき領域が、無効なデータを含む場合には、その無効なデータを含んだ符号量をいう。
次に第1多重化部104は、符号量算出部103で算出された符号量と、第2符号化部102で生成された信号とを多重化し、第2符号化信号を生成する。図5は、図2の符号量算出部103で算出された符号量を符号化信号に記述するための記述方法の一例を示す図である。図6は、図5に示した記述方法で符号量を符号化信号に記述する際のフローチャートである。ここで、符号量算出部103で算出された符号量は、例えば図5に示すようにAビット、または(A+B)ビットの可変長のビットフィールドで表現される。具体的には、算出された符号量がAビットで表されるのであれば、size_of_extだけで記述され、符号量がAビットを超える場合には、size_of_extとsize_of_escとの2つのフィールドで表される。例えば、Aが4、Bが8、符号量sumが14バイトの場合、14は2進数1110の4ビットで表すことができるので(S401)、size_of_extという4ビットのフィールドに、sum=14を表す2進数1110が書かれる(S402)。この条件を表すif文では、size_of_extの値14が、(1<<4)−1すなわち、1を4ビット左へシフトした値16から1を減算して得られる15より小さいので、size_of_escという8ビットのフィールドは存在しない。すなわちこの場合4ビットのビットフィールドで符号量を表す信号を多重化する。
また、例えば、Aが4、Bが8、符号量sumが100バイトの場合には(S401)、size_of_extという4ビットのフィールドに、2進数1111が書かれる(S403)。この条件を表すif文では、size_of_extの値が、(1<<4)−1すなわち15と等しいので、size_of_escという8ビットのフィールドに、sum − size_of_ext +1=100−(15−1)の値が書かれる(S404)。すなわちこの場合12ビットのビットフィールドで符号量を表す信号が多重化される。
最後に第2多重化部105で、第1符号化信号901と第2符号化信号902とを多重化する。この処理を、逐次オーディオフレームごとに行うことによって、図7に示すような、第1符号化信号901と第2符号化信号902とが交互に多重化され、且つ、第2符号化信号902の先頭部に符号量を表す信号が多重化されたような符号化信号が生成される。
上記のように、本実施の形態によれば、Mチャネル(M>2)のマルチチャネル信号をステレオ信号にダウンミックスするダウンミックス部と、ダウンミックス信号を符号化し第1符号化信号を生成する第1符号化部101と、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号化する第2符号化部102と、第2符号化部102で符号化された信号の符号量を算出する符号量算出部103と、符号量算出部103で算出された符号量と第2符号化部102で生成された信号とを多重化し第2符号化信号を生成する第1多重化部104と、第1符号化信号と第2符号化信号とを多重化する第2多重化部105とを備え、第1多重化部104は、符号量を表す信号が第2符号化信号の先頭に配置されるように、符号量を表す信号を多重化することによって、第1符号化信号のみを復号化しダウンミックス信号のみを再生せんと欲するデコーダにとっては、第2符号化信号の符号量を示す情報が第2符号化信号に含まれているので、容易に第2符号化信号を全体の符号化信号から取り除くことができることとなる。
勿論ここで、符号量を表す信号は、第2符号化信号の開始を識別する記号の直後に配置するように、符号量を表す信号を多重化することが望ましい。なぜならば、第1符号化信号のみを復号化しダウンミックス信号のみを再生せんと欲するデコーダにとっては、第2符号化信号の符号量を示す情報が、第2符号化信号の先頭に配置されていれば、容易に第2符号化信号を全体の符号化信号から取り除くことができるからである。なお、この第2符号化信号の符号量は、MPEG2の符号化信号のFill Elementに記述されてもよい。この場合、第2符号化信号の開始を識別する記号とは、Fill Elementの開始を示す記号である。
また、算出された符号量を、当該符号量を表すためのビット量に応じた可変長のビットフィールドに多重化することによって、当該符号量を表す信号を多重化するためのビット数を削減できることとなる。
また、本実施の形態では、マルチチャネル信号のチャネル数は説明の簡単化のために4としたが、4でなくてもよく、一般的に広く普及している5.1チャネルであっても良いことはいうまでもない。
なお、算出された符号量を表す信号は、第2符号化信号の先頭に記述されることが好ましいが、本発明はこれに限定されない。例えば、フレームヘッダ情報の中に記述されてもよい。また、フレームヘッダ情報の中に第1符号化信号の符号量を表す信号が記述されるとしてもよい。なぜなら、フレームヘッダ情報の中にはフレーム全体の符号量が記述されているので、第2符号化信号の符号量は簡単に算出することができるからである。
(実施の形態2)
以下本発明の実施の形態2におけるオーディオエンコーダについて図面を参照しながら説明する。図8は本実施の形態2におけるオーディオエンコーダの構成を示す図である。図8のオーディオエンコーダは、入力された時間軸上の4チャネル信号を周波数軸上の信号に変換した後、ダウンミックスするオーディオエンコーダであって、ダウンミックス部500、第1符号化部501、第2符号化部502、符号量算出部503、第1多重化部504および第2多重化部505を備える。これにおいて、第2符号化部502、符号量算出部503、第1多重化部504および第2多重化部505は、実施の形態1で示したものと同様のものである。実施の形態1で示したものと異なるものは、ダウンミックス部500が、第2符号化部502の処理過程で生成される各入力チャネルの周波数軸信号を入力とし、該各入力チャネルの周波数軸信号の一部、または帯域の周波数軸信号をダウンミックスするように構成されている点と、第1符号化部501が、ダウンミックス部500でダウンミックスされた信号を入力として当該信号を符号化するように構成されている点である。
以上のように構成されたオーディオエンコーダの動作について以下に説明する。まず、第2符号化部502は、入力された4チャネル信号を時間軸上の信号のサンプル数と同数のサンプル数からなる周波数軸信号に変換する。これはフィルタバンクを用いても良いし、FFTのような直交変換方式を用いて周波数係数に変換してもよい。この場合、各周波数係数は、フーリエ係数のように、複素数であってもよい。この各チャネルの周波数軸信号をダウンミックス部500に対し送出し、ダウンミックス部500で所定の方法でダウンミックス処理が行われる。ここで、各チャネルの対応する周波数軸信号同士に対して実施されるダウンミックス処理は、実施の形態1で述べたようなマトリックス演算によって実施すればよい。一方第2符号化部502では、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号化する。この方法も、実施の形態1で示した方法と同様でよい。
ここで本実施の形態では、ダウンミックス部500は、受け取った各チャネルの周波数軸信号の一部の帯域のみに対しダウンミックス処理を実施するようにしてもよい。例えば、全周波数帯域の高域側の一部を取り除いた信号をダウンミックスする。このことによって、第1符号化信号のみを復号化しダウンミックス信号のみを再生せんと欲するデコーダにとっては、符号化信号の周波数帯域が狭いので復号化に際しての演算量が少なくてすむことになる。また、全周波数帯域の1/2以下の周波数帯域の信号をダウンミックスすることとすれば、以下に示す理由によって、更に利便性を享受できる。すなわち、第1符号化部501は、例えばMPEG規格などで規定された符号化方式でよいが、特に、ここで、周波数帯域が全周波数帯域の1/2以下の周波数帯域であれば近年MPEG4規格で検討されている帯域拡大技術(ISO/IEC14496−3)が前提としている周波数帯域と合致するので、当該技術とのインターフェースがとり易くなるからである。
以降、符号量算出部503の処理、第1多重化部504の処理、第2多重化部505の処理は、実施の形態1で述べたのと同様でよい。
また、ダウンミックス部500では、周波数成分に分解された信号に対し頭部伝達関数に基づいたフィルタ処理を実施しながらダウンミックスしてもよい。周波数成分に分解された信号に対する頭部伝達関数に基づいたフィルタ処理は、特開平11−032400号公報で述べられているような方法でよい。そうすることによって、第1符号化部501で符号化された符号化信号のみを再生した場合でも、もともとのマルチチャネルの空間情報が反映されることとなるからである。勿論このことは、本実施の形態2での処理過程のみに適応されるわけではなく、先の実施の形態1での処理過程で実施しても良いことは言うまでもない。
上記のように、本実施の形態によれば、Mチャネル(M>2)のマルチチャネル信号をステレオ信号にダウンミックスするダウンミックス部500と、ダウンミックス信号を符号化し第1符号化信号を生成する第1符号化部501と、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号化する第2符号化部502と、第2符号化部502で符号化された信号の符号量を算出する符号量算出部503と、符号量算出部503で算出された符号量を表す信号と第2符号化部502で生成された信号とを多重化し第2符号化信号を生成する第1多重化部504と、第1符号化信号と第2符号化信号とを多重化する第2多重化部505と、を有し、ダウンミックス部500は、マルチチャネル信号をそれぞれ周波数軸信号に変換し該周波数軸信号の一部または全部の周波数帯域の信号をステレオ信号にダウンミックスすることによって、ダウンミックス処理を周波数軸上で行うことができるので、第2符号化部502が周波数軸上の信号に対し符号化処理を行う場合、ダウンミックス処理と第2符号化の処理とが効率的に実施できることとなる。また、一部または全部の周波数帯域の信号をステレオ信号にダウンミックスすれば、ダウンミックス処理を少ない演算量で行えることとなると同時に、第1符号化部501が、狭い帯域の信号を扱うことになるので、圧縮率が向上できることとなる。また、第1符号化部501で符号化された符号化信号のみを再生する場合、狭い帯域の信号を扱うことになるので復号化の演算量が少なくて済むこととなる。また、ダウンミックス処理を、もともとの周波数帯域の1/2の帯域で処理すれば、第1符号化部501が、1/2以下の帯域の信号を扱うことになるので、圧縮率がさらに向上できることとなると同時に、第1符号化部501で符号化された符号化信号のみを再生する場合、1/2以下の帯域の信号を扱うことになるので復号化の演算量が少なくて済むこととなる。また、近年広く研究開発が行われている帯域拡大技術(ISO/IEC14496−3)が1/2帯域の以下の帯域の信号を拡大する技術であるので、その技術とのインターフェースがとり易くなることとなる。
また、上記ダウンミックス処理時に、頭部伝達関数のフィルタ処理も実施しておけば、第1符号化部501で符号化された符号化信号のみを再生した場合でも、もともとのマルチチャネルの空間情報が反映されることとなる。
勿論、上記頭部伝達関数のフィルタ処理は周波数軸上で行わず、時間軸上で行ってもよいことは言うまでもない。
また、本実施の形態では、マルチチャネル信号のチャネル数は説明の簡単化のために4としたが、4でなくてもよく、一般的に広く普及している5.1チャネルであっても良いことはいうまでもない。
(実施の形態3)
以下本発明の実施の形態3におけるオーディオデコーダについて図面を参照しながら説明する。本オーディオデコーダは、実施の形態1または実施の形態2で符号化された符号化信号を復号化するオーディオデコーダである。すなわち、Mチャネル(M>2)のマルチチャネル信号をダウンミックスしたステレオ信号を符号化した第1符号化信号と、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号化した第2符号化信号とが多重化された符号化信号を復号化するオーディオデコーダである。ここで、第2符号化信号には、当該第2符号化信号の符号量を示す値が多重化されているものとする。
図9は本実施の形態3におけるオーディオデコーダの構成を示す図である。図9において、オーディオデコーダは、第1符号化信号取り出し部600、第2符号化信号取り出し部601、第1復号化部602、符号量取り出し部603、および実体信号取り出し部604を備える。第1符号化信号取り出し部600は、第1符号化信号を取り出す。第2符号化信号取り出し部601は、第2符号化信号を取り出す。第1復号化部602は、第1符号化信号に基づいて、ダウンミックス信号を復号化する。符号量取り出し部603は、第2符号化信号に含まれている当該第2符号化信号の符号量を表す信号を取り出す。実体信号取り出し部604は、符号量取り出し部603によって取り出された符号量を表す信号に基づいて、符号化信号から第2符号化信号を取り出す。
以上のように構成されたオーディオデコーダの動作について、以下に説明する。まず、第1符号化信号取り出し部600は、4チャネルのマルチチャネル信号をダウンミックスしたステレオ信号を符号化した第1符号化信号と、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号化した第2符号化信号とが多重化された符号化信号から、第1符号化信号を取り出す。ここで、第1符号化信号は、実施の形態1、または実施の形態2の第1符号化部で生成された符号化信号であるので、当該第1符号化信号取り出し部600では、第1符号化信号の符号化フォーマットに則って第1符号化信号を取り出せばよい。例えば、第1符号化部が、MPEG規格AAC方式に則った符号化部なのであれば、当該第1符号化信号取り出し部600では、AAC符号化フォーマットに則って第1符号化信号を取り出せばよい。
次に、第1復号化部602で第1符号化信号に基づいて、ダウンミックス信号を復号化する。ここでの復号化の方法も、第1符号化信号の符号化規格に則って復号化すればよい。
図10は、図5に示した符号量記述方法で記述されている符号量を表す信号をオーディオデコーダで読み取る場合の手順を示すフローチャートである。次に、第2符号化信号取り出し部601に内蔵されている符号量取り出し部603で、第2符号化信号に含まれている当該第2符号化信号の符号量を表す信号を取り出す(S501)。ここで当該符号量sumは、図5に示したAビットまたは(A+B)ビットで表現されているものとする。例えば、図5に示したsize_of_extが4ビット、size_of_escが8ビット、size_of_extの値が2進数で1010であるとする。この場合、size_of_extの値が10であり、(1<<4)−1=15に等しくないので(S502)、size_of_escの8ビットは存在せず、符号量sumは10バイトということになる(S505)。また例えば、size_of_extが4ビット、size_of_escが8ビット、size_of_extの値が2進数で1111の場合、size_of_extの値が(1<<4)−1=15なので(S502)、size_of_escの8ビットが存在することになる。符号量取り出し部603は、さらに8ビットのsize_of_escを取り出す(S503)。ここで、size_of_escの値が2進数で00001000の場合、符号量sumは、sum = size_of_ext + size_of_esc−1=15+8−1となり、22バイトとなる(S504)。
最後に、実体信号取り出し部604で、符号量取り出し部603によって取り出された符号量を表す信号に基づいて、符号化信号から第2符号化信号を取り出す。例えば、符号量が、20バイトなのであれば、以降の20バイトの信号が、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号化した第2符号化信号の符号量と分かり、当該第2符号化信号は、ダウンミックス信号のみを再生するデコーダにとっては不要なものであるので、そのサイズ分だけ、符号化信号を読み飛ばせばよいことになる。
ここで、当該第2符号化信号に多重化されている当該符号量に応じた値は、必ずしも、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号化した信号の符号量と丁度一致している必要はなく、それと同じかそれより大きな値であればよい。例えば、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号化した信号の正味の符号量が18バイトの場合でも、例えば2バイトの付加的な情報を追加した場合は(これは実質的に無意味な情報でもよいが)、当該第2符号化信号に多重化されている当該符号量に相当する値は20となっているべきである。すなわち、第2符号化信号が付加的な情報または無意味な情報である2バイトを含んでいるとした場合と同じである。そうすることによって、実体信号取り出し部は、符号化信号の内容については一切関知する必要がなくなるからである。
以上の様に、本実施の形態のオーディオデコーダは、Mチャネル(M>2)のマルチチャネル信号をダウンミックスしたステレオ信号を符号化した第1符号化信号と、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号化した第2符号化信号とが多重化された符号化信号に対し、第1符号化信号を取り出す第1符号化信号取り出し部600と、第2符号化信号を取り出す第2符号化信号取り出し部601と、第1符号化信号に基づいて、ダウンミックス信号を復号化する第1復号化部602とを有し、第2符号化信号取り出し部601は、第2符号化信号に含まれる符号量を表す信号を取り出す符号量取り出し部603と、符号量取り出し部603によって取り出された符号量を表す信号に基づいて、符号化信号から第2符号化信号を取り出す実体信号取り出し部604をさらに備える。これによって、ダウンミックス信号のみを復号化したいと欲するオーディオデコーダの場合、簡単な処理でマルチチャネル化のための情報を取り去るまたは読み飛ばすことができることとなる。
勿論ここで、符号量を表す信号は、第2符号化信号の先頭に配置されることが望ましい。なぜならば、第1符号化信号のみを復号化しダウンミックス信号のみを再生せんと欲するデコーダにとっては、第2符号化信号の符号量を示す情報が、第2符号化信号の先頭に配置されていれば、容易に第2符号化信号を全体の符号化信号から取り除くことができるからである。
またここで、第1符号化信号が、先に述べた実施の形態2のように、予め頭部伝達関数に基づくフィルタ処理によって本来のマルチチャネル信号が2チャネル信号にダウンミックスされていれば、第1符号化信号のみを復号化しダウンミックス信号のみを再生せんと欲するデコーダにとっては、単に第1符号化信号を復号化するだけで、もともとのマルチチャネルの空間情報が反映されたオーディオを再生できることとなる。
また、本実施の形態では、マルチチャネル信号のチャネル数は説明の簡単化のために4としたが、4でなくてもよく、一般的に広く普及している5.1チャネルであっても良いことはいうまでもない。
(実施の形態4)
以下、本発明の実施の形態4におけるオーディオデコーダについて図面を参照しながら説明する。
本オーディオデコーダは、実施の形態1または実施の形態2で符号化された符号化信号を復号化するオーディオデコーダである。すなわち、Mチャネル(M>2)のマルチチャネル信号をダウンミックスしたステレオ信号を符号化した第1符号化信号と、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号化した第2符号化信号とが多重化された符号化信号を復号化するオーディオデコーダである。ここで、第2符号化信号には、当該第2符号化信号の符号量を示す値が多重化されているものである。
図11は、本実施の形態4におけるオーディオデコーダの構成を示す図である。図11に示すように、実施の形態4のオーディオデコーダは、第1符号化信号取り出し部700、第2符号化信号取り出し部701、第1復号化部702、符号量取り出し部703、実体信号取り出し部704、第2復号化部705、フィルタ部706および選択部707を備える。このうち、実施の形態3と異なるのは、第1符号化信号と第2符号化信号とに基づいて、マルチチャネル信号を復号化する第2復号化部705と、復号化されたマルチチャネル信号に対し、頭部伝達関数に基づくフィルタ処理を施すフィルタ部706と、第1復号化部702で生成された信号か、フィルタ部706で生成された信号かを選択する選択部707とを備えたところである。それ以外の第1符号化信号取り出し部700、第2符号化信号取り出し部701、第1復号化部702、符号量取り出し部703および実体信号取り出し部704は、実施の形態3で述べたものと同様である。
以上のように構成されたオーディオデコーダの動作について、以下に説明する。まず、第1符号化信号取り出し部700は、4チャネルのマルチチャネル信号をダウンミックスしたステレオ信号を符号化した第1符号化信号と、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号化した第2符号化信号とが多重化された符号化信号から、第1符号化信号を取り出す。この動作は、実施の形態3と同様である。
次に、第1復号化部702で第1符号化信号に基づいて、ダウンミックス信号を復号化する。この動作も、実施の形態3と同様である。
次に、第2符号化信号取り出し部701に内蔵されている符号量取り出し部703で、第2符号化信号に含まれている当該第2符号化信号の符号量を表す信号を取り出す。この動作は、実施の形態3と同様である。
次に符号量取り出し部703によって取り出された符号量を表す信号に基づいて、実体信号取り出し部704が、符号化信号から第2符号化信号を取り出す。この動作は、実施の形態3と同様である。
次に、第2復号化部705で、第1符号化信号と第2符号化信号とに基づいて、マルチチャネル信号を復号化する。
ここで、第1符号化信号と第2符号化信号は、実施の形態1、または実施の形態2のオーディオエンコーダで生成された符号化信号であるので、当該第2復号化部705では、その符号化フォーマットに則って第1符号化信号と第2符号化信号とを復号しマルチチャネル信号を生成すればよい。
次にフィルタ部706で、復号化されたマルチチャネル信号に対し、頭部伝達関数に基づくフィルタ処理を施す。
最後に、選択部707で、第1復号化部で生成された信号か、フィルタ部で生成された信号かを選択する。
以上の様に、本実施の形態では、Mチャネル(M>2)のマルチチャネル信号をダウンミックスしたステレオ信号を符号化した第1符号化信号と、ダウンミックス信号をマルチチャネル信号に戻すための情報を符号化した第2符号化信号とが多重化された符号化信号に対し、第1符号化信号を取り出す第1符号化信号取り出し部700と、第2符号化信号を取り出す第2符号化信号取り出し部701と、第1符号化信号に基づいて、ダウンミックス信号を復号化する第1復号化部702と、第2符号化信号に含まれる符号量を表す信号を取り出す符号量取り出し部703と、符号量取り出し部703によって取り出された符号量を表す信号に基づいて、符号化信号から第2符号化信号を取り出す実体信号取り出し部704と、第1符号化信号と第2符号化信号とに基づいて、マルチチャネル信号を復号化する第2復号化部705と、復号化されたマルチチャネル信号に対し、頭部伝達関数に基づくフィルタ処理を施すフィルタ部706と、第1復号化部で生成された信号か、フィルタ部706で生成された信号かを選択する選択部707とを備えることによって、ダウンミックス信号の再生音と、マルチチャネル信号に対し頭部伝達関数に基づくフィルタ処理を施した再生音とを利用者が選択できることとなる。
上記の処理において、第2復号化部705では各マルチチャネル信号の周波数軸信号を生成するようにし、当該各マルチチャネル信号の周波数軸信号に対し周波数軸上で頭部伝達関数に基づくフィルタ処理を行い2チャネルの周波数軸信号を生成した後、当該周波数軸信号を時間軸信号に変換するようにしてもよい。例えば、特開平11−032400号公報で述べられているような方法でもよい。そうすることによって、例えば、AAC方式(ISO/IEC13818−7)やAAC−SBR方式(ISO/IEC14496−3)と組み合わせたとき、演算量が大幅に削減できることになる。なぜならば、それらの方式が、周波数軸上の信号を圧縮符号化している方式であるので、周波数軸信号を時間軸信号に変換する処理が内蔵されているが、周波数軸上でダウンミックスすることによって、周波数軸信号を時間軸信号に変換する処理が2チャネル分のみで済むことになるからである。
また、本実施の形態では、マルチチャネル信号のチャネル数は説明の簡単化のために4としたが、4でなくてもよく、一般的に広く普及している5.1チャネルであっても良いことはいうまでもない。
また、本実施の形態では、第2復号化部は、第1符号化信号と第2符号化信号とを入力とし、それらを用いてマルチチャネル信号を復号化したが、第1復号化部で復号化した信号を用いて、マルチチャネル信号を復号化するようにしてもよい。図12は、本実施の形態4におけるオーディオデコーダの他の構成を示す図である。その場合、図12に示すような構成になる。
また、当該オーディオデコーダを駆動する為の電力が低下した場合、例えば電池寿命がつきかけている場合、そのことを検出し、自動的に上記選択部を、第1復号化部で生成された信号で出力するように制御すれば、バッテリーがつきかけているときに、自動的にダウンミックス信号の復号化のモードに入るので、電池寿命が延長することとなる。また、聴取者は音質の変化によって電池寿命がつきかけていることを検知することができることとなる。
図13は、本発明のオーディオデコーダを備えるモバイルオーディオ機器の外観の一例を示す図である。(a)は、本発明のオーディオデコーダを内蔵するモバイルテレビの一例を示す図である。(b)は、本発明のオーディオデコーダを内蔵する携帯電話機の一例を示す図である。同図に示すような携帯型の機器では、単位時間あたりの演算量が大きいと、演算処理の並列化などのために回路規模が大きくなってしまう。そして、モバイルオーディオ機器では、いまだに2チャネル再生が主流である。従って、同図に示すようなモバイルオーディオ機器では、本発明のオーディオエンコーダによって符号化された符号化信号を復号化し、再生することによって、符号化信号の不要な部分を読み飛ばし、頭部伝達関数を用いてフィルタリングされた仮想サラウンドオーディオを、低い負荷で再生することができる。
本発明にかかるオーディオエンコーダは、マルチチャネル信号を符号化するオーディオエンコーダであるが、エンコードされたマルチチャネル信号を安価なデコーダで再生できるような符号化信号を生成するので、特に機器の小型化が必要な携帯機器に応用できる。
本発明にかかるオーディオデコーダは、マルチチャネル信号を符号化した符号化信号を2チャネルの再生部、例えば、ヘッドホンで再生するのに適しているので、特に機器の小型化が必要な携帯機器、例えば、モバイルテレビ、MD、SDおよび携帯電話機などに応用できる。
図1は、MPEG2オーディオ規格における符号化信号(ビットストリーム)の構造を示したものである。 図2は、本実施の形態1におけるオーディオエンコーダの構成を示すブロック図である。 図3(a)は、ダウンミックスの変換マトリックスを示す図である。図3(b)は、ダウンミックス信号を元のマルチチャネル信号に戻すための信号を生成するマトリックスを示す図である。図3(c)は、ダウンミックス信号を元のマルチチャネル信号に戻すためのマトリックスを示す図である。 図4(a)は、図3(b)に示したマトリックスを頭部伝達関数に基づいて算出した場合のマトリックスの一例を示す図である。図4(b)は、図4(a)の逆行列であり、ダウンミックス信号を元のマルチチャネル信号に戻すためのマトリックスの一例を示す図である。 図5は、図2の符号量算出部103で算出された符号量を符号化信号に記述するための記述方法の一例を示す図である。 図6は、図5に示した記述方法で符号量を符号化信号に記述する際のフローチャートである。 図7は、本実施の形態1、2で生成される符号化信号のデータ構成を示す図である。 図8は、本実施の形態2におけるオーディオエンコーダの構成を示す図である。 図9は、本実施の形態3におけるオーディオデコーダの構成を示す図である。 図10は、図5に示した符号量記述方法で記述されている符号量を表す信号をオーディオデコーダで読み取る場合の手順を示すフローチャートである。 図11は、本実施の形態4におけるオーディオデコーダの構成を示す図である。 図12は、本実施の形態4におけるオーディオデコーダのもう1つの構成を示す図である。 図13(a)は、本発明のオーディオデコーダを内蔵するモバイルテレビの外観の一例を示す図である。図13(b)は、本発明のオーディオデコーダを内蔵する携帯電話機の外観の一例を示す図である。
符号の説明
100,500 ダウンミックス部
101,501 第1符号化部
102,502 第2符号化部
103,503 符号量算出部
104,504 第1多重化部
105,505 第2多重化部
600,700,800 第1符号化信号取り出し部
601,701,801 第2符号化信号取り出し部
602,702,802 第1復号化部
603,703,803 符号量取り出し部
604,704,804 実体信号取り出し部
705,805 第2復号化部
706,806 フィルタ部
707,807 選択部
900 フレームヘッダ情報
901 第1符号化信号
902 第2符号化信号

Claims (19)

  1. 2チャネルを超えるマルチチャネル信号を、2チャネルのステレオ信号にダウンミックスするダウンミックス手段と、
    前記ダウンミックスされたステレオ信号を符号化し、第1符号化信号を生成する第1符号化手段と、
    前記ダウンミックスされたステレオ信号をマルチチャネル信号に戻すための情報を符号化し、第2符号化信号を生成する第2符号化手段と、
    前記第2符号化信号の符号量を算出する符号量算出手段と、
    前記第1符号化信号、前記第2符号化信号および算出された前記符号量を表す信号を多重化する多重化手段と
    を備えることを特徴とするオーディオエンコーダ。
  2. 前記多重化手段は、
    前記符号量算出手段で算出された符号量と、前記第2符号化信号とを多重化する第1多重化部と、
    前記第1符号化信号と、前記符号量が多重化された前記第2符号化信号とを多重化する第2多重化部と
    を備えることを特徴とする請求項1記載のオーディオエンコーダ。
  3. 前記第1多重化部は、前記符号量算出手段で算出された前記符号量を、前記第2符号化信号の先頭に配置して多重化する
    ことを特徴とする請求項2記載のオーディオエンコーダ。
  4. 前記第1多重化部は、前記符号量算出手段で算出された前記符号量を、前記第2符号化信号の開始を識別する記号の直後に配置するように多重化する
    ことを特徴とする請求項2記載のオーディオエンコーダ。
  5. 前記第1多重化部は、前記符号量算出手段で算出された前記符号量を可変長で記述し、前記第2符号化信号に多重化する
    ことを特徴とする請求項2記載のオーディオエンコーダ。
  6. 前記ダウンミックス手段は、前記マルチチャネル信号に頭部伝達関数を用いた演算を行い、ダウンミックス処理を行う
    ことを特徴とする請求項1記載のオーディオエンコーダ。
  7. 前記ダウンミックス手段は、周波数軸上で、前記マルチチャネル信号に頭部伝達関数を用いた演算を行う
    ことを特徴とする請求項6に記載のオーディオエンコーダ。
  8. 前記第2符号化信号は無効なデータを含み、
    前記符号量算出手段は、前記無効なデータを含む前記第2符号化信号の符号量を算出する
    ことを特徴とする請求項1記載のオーディオエンコーダ。
  9. 符号化信号を復号化するオーディオデコーダであって、
    2チャネルを超えるマルチチャネル信号からダウンミックスされた2チャネルのステレオ信号が符号化されて得られる第1符号化信号と、前記ステレオ信号からマルチチャネル信号を生成するための情報が符号化されて得られたものである第2符号化信号と、前記第2符号化信号の符号量を表す信号とを含む符号化信号を取得する取得手段と、
    取得された前記符号化信号を復号化してステレオ信号を出力する復号化手段と
    を備えることを特徴とするオーディオデコーダ。
  10. 前記復号化手段は、
    取得された前記符号化信号から、前記第1符号化信号を読み出す第1符号化信号読み出し部と、
    前記第2符号化信号の符号量を表す信号を、前記符号化信号から読み出す符号量読み出し部と、
    前記第1符号化信号読み出し部によって読み出された前記第1符号化信号を復号化して、前記ステレオ信号を出力する第1復号化部とを備え、
    前記第1符号化信号読み出し部は、前記符号量読み出し部によって読み出された前記符号量に基づいて、第2符号化信号を読み飛ばす
    ことを特徴とする請求項9記載のオーディオデコーダ。
  11. 前記第1符号化信号は、頭部伝達関数を用いた演算によりあらかじめ仮想サラウンド効果が付与されたステレオ信号が符号化されたものであり、
    前記第1復号化部は、仮想サラウンド効果の付与されたステレオ信号を出力する ことを特徴とする請求項10記載のオーディオデコーダ。
  12. 取得された前記符号化信号から読み出される前記第2符号化信号の符号量を表す信号は、無効なデータを含む前記第2符号化信号の符号量を表す信号である
    ことを特徴とする請求項9記載のオーディオデコーダ。
  13. 前記復号化手段は、さらに、
    取得された前記符号化信号から、前記第1符号化信号を読み出す第1符号化信号読み出し部と、
    前記第1符号化信号読み出し部によって読み出された前記第1符号化信号を復号化して、前記ステレオ信号を出力する第1復号化部と、
    前記第2符号化信号を前記符号化信号から読み出す第2符号化信号読み出し部と、
    読み出された前記第1符号化信号と前記第2符号化信号とに基づいて、マルチチャネル信号を復号化する第2復号化部と、
    前記復号化されたマルチチャネル信号に対し、頭部伝達関数に基づくフィルタ処理を施し、仮想サラウンド効果が付与されたステレオ信号を出力するフィルタ部と、
    前記第1復号化部から出力される前記ステレオ信号と、前記フィルタ部から出力される前記仮想サラウンド効果が付与された前記ステレオ信号とのいずれかを選択する選択部とを備える
    ことを特徴とする請求項9記載のオーディオデコーダ。
  14. 前記第1復号化部は、前記ステレオ信号の周波数軸信号を生成し、
    前記フィルタ部は、前記ステレオ信号の周波数軸信号から復元されたマルチチャネル信号の周波数軸信号に対し、頭部伝達関数に基づくフィルタ処理を行い2チャネルの周波数軸信号を生成した後、前記周波数軸信号を時間軸信号に変換する
    ことを特徴とする請求項13記載のオーディオデコーダ。
  15. 前記オーディオデコーダは、さらに、
    少なくとも前記第2復号化部を駆動する為の電力を供給する電力供給部を備え、
    前記選択部は、前記電力供給部からの電力供給量が所定の値を下回った場合、前記第1復号化部からのステレオ信号を選択する
    ことを特徴とする請求項14記載のオーディオデコーダ。
  16. 2チャネルを超えるマルチチャネル信号を、2チャネルのステレオ信号にダウンミックスし、
    ダウンミックスされた前記ステレオ信号を符号化し、第1符号化信号を生成し、
    ダウンミックスされた前記ステレオ信号をマルチチャネル信号に戻すための情報を符号化し、第2符号化信号を生成し、
    前記第2符号化信号の符号量を算出し、
    前記第1符号化信号、前記第2符号化信号および算出された符号量を表す信号を多重化する
    ことを特徴とするオーディオ符号化方法。
  17. 符号化信号を復号化するオーディオ復号化方法であって、
    2チャネルを超えるマルチチャネル信号からダウンミックスされた2チャネルのステレオ信号が符号化されて得られる第1符号化信号と、前記ステレオ信号からマルチチャネル信号を生成するための情報が符号化されて得られたものである第2符号化信号と、前記第2符号化信号の符号量を表す信号とを含む符号化信号を取得し、
    取得された前記符号化信号を復号化してステレオ信号を出力する
    ことを特徴とするオーディオ復号化方法。
  18. オーディオエンコーダのためのプログラムであって、コンピュータを
    2チャネルを超えるマルチチャネル信号を、2チャネルのステレオ信号にダウンミックスするダウンミックス手段と、前記ダウンミックスされたステレオ信号を符号化し、第1符号化信号を生成する第1符号化手段と、前記ダウンミックスされたステレオ信号をマルチチャネル信号に戻すための情報を符号化し、第2符号化信号を生成する第2符号化手段と、前記第2符号化信号の符号量を算出する符号量算出手段と、前記第1符号化信号、前記第2符号化信号および算出された前記符号量を表す信号を多重化する多重化手段との各手段として機能させるプログラム。
  19. 符号化信号を復号化するオーディオデコーダのためのプログラムであって、コンピュータを
    2チャネルを超えるマルチチャネル信号からダウンミックスされた2チャネルのステレオ信号が符号化されて得られる第1符号化信号と、前記ステレオ信号からマルチチャネル信号を生成するための情報が符号化されて得られたものである第2符号化信号と、前記第2符号化信号の符号量を表す信号とを含む符号化信号を取得する取得手段と、取得された前記符号化信号を復号化してステレオ信号を出力する復号化手段との各手段として機能させるプログラム。
JP2006519336A 2004-02-25 2005-02-09 オーディオエンコーダ及びオーディオデコーダ Pending JPWO2005081229A1 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2004049650 2004-02-25
JP2004049650 2004-02-25
PCT/JP2005/001968 WO2005081229A1 (ja) 2004-02-25 2005-02-09 オーディオエンコーダ及びオーディオデコーダ

Publications (1)

Publication Number Publication Date
JPWO2005081229A1 true JPWO2005081229A1 (ja) 2007-10-25

Family

ID=34879555

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006519336A Pending JPWO2005081229A1 (ja) 2004-02-25 2005-02-09 オーディオエンコーダ及びオーディオデコーダ

Country Status (4)

Country Link
US (1) US7613306B2 (ja)
JP (1) JPWO2005081229A1 (ja)
CN (1) CN1906664A (ja)
WO (1) WO2005081229A1 (ja)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2396608C2 (ru) * 2004-04-05 2010-08-10 Конинклейке Филипс Электроникс Н.В. Способ, устройство, кодирующее устройство, декодирующее устройство и аудиосистема
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
KR100818268B1 (ko) * 2005-04-14 2008-04-02 삼성전자주식회사 오디오 데이터 부호화 및 복호화 장치와 방법
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
WO2006126844A2 (en) 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding an audio signal
ATE433182T1 (de) * 2005-07-14 2009-06-15 Koninkl Philips Electronics Nv Audiokodierung und audiodekodierung
CN101253556B (zh) * 2005-09-02 2011-06-22 松下电器产业株式会社 能量整形装置以及能量整形方法
JP4740335B2 (ja) * 2005-09-14 2011-08-03 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
WO2007032646A1 (en) * 2005-09-14 2007-03-22 Lg Electronics Inc. Method and apparatus for decoding an audio signal
US7974713B2 (en) 2005-10-12 2011-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Temporal and spatial shaping of multi-channel audio signals
TWI333642B (en) * 2006-01-19 2010-11-21 Lg Electronics Inc Method and apparatus for processing a media signal
JP5054035B2 (ja) * 2006-02-07 2012-10-24 エルジー エレクトロニクス インコーポレイティド 符号化/復号化装置及び方法
BRPI0707969B1 (pt) 2006-02-21 2020-01-21 Koninklijke Philips Electonics N V codificador de áudio, decodificador de áudio, método de codificação de áudio, receptor para receber um sinal de áudio, transmissor, método para transmitir um fluxo de dados de saída de áudio, e produto de programa de computador
KR100754220B1 (ko) 2006-03-07 2007-09-03 삼성전자주식회사 Mpeg 서라운드를 위한 바이노럴 디코더 및 그 디코딩방법
KR20080086549A (ko) * 2006-04-03 2008-09-25 엘지전자 주식회사 미디어 신호 처리 방법 및 장치
ES2390181T3 (es) * 2006-06-29 2012-11-07 Lg Electronics Inc. Procedimiento y aparato para procesar una señal de audio
KR20090013178A (ko) 2006-09-29 2009-02-04 엘지전자 주식회사 오브젝트 기반 오디오 신호를 인코딩 및 디코딩하는 방법 및 장치
EP2083584B1 (en) * 2008-01-23 2010-09-15 LG Electronics Inc. A method and an apparatus for processing an audio signal
US8615316B2 (en) * 2008-01-23 2013-12-24 Lg Electronics Inc. Method and an apparatus for processing an audio signal
MY178597A (en) 2008-07-11 2020-10-16 Fraunhofer Ges Forschung Audio encoder, audio decoder, methods for encoding and decoding an audio signal, and a computer program
US8639368B2 (en) * 2008-07-15 2014-01-28 Lg Electronics Inc. Method and an apparatus for processing an audio signal
US8452430B2 (en) * 2008-07-15 2013-05-28 Lg Electronics Inc. Method and an apparatus for processing an audio signal
US8615398B2 (en) * 2009-01-29 2013-12-24 Qualcomm Incorporated Audio coding selection based on device operating condition
CN101556799B (zh) * 2009-05-14 2013-08-28 华为技术有限公司 一种音频解码方法和音频解码器
KR101756838B1 (ko) 2010-10-13 2017-07-11 삼성전자주식회사 다채널 오디오 신호를 다운 믹스하는 방법 및 장치
US8804971B1 (en) * 2013-04-30 2014-08-12 Dolby International Ab Hybrid encoding of higher frequency and downmixed low frequency content of multichannel audio
AU2017357453B2 (en) 2016-11-08 2021-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multichannel signal using a side gain and a residual gain
US10891960B2 (en) * 2017-09-11 2021-01-12 Qualcomm Incorproated Temporal offset estimation
IL307898A (en) 2018-07-02 2023-12-01 Dolby Laboratories Licensing Corp Methods and devices for encoding and/or decoding embedded audio signals

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5781237A (en) * 1994-03-25 1998-07-14 Matsushita Electric Industrial Co., Ltd. Video coding apparatus and video coding method
JP3149673B2 (ja) * 1994-03-25 2001-03-26 松下電器産業株式会社 映像符号化装置、映像符号化方法、映像再生装置及び光ディスク
JP2000295698A (ja) * 1999-04-08 2000-10-20 Matsushita Electric Ind Co Ltd バーチャルサラウンド装置
JP2001100792A (ja) * 1999-09-28 2001-04-13 Sanyo Electric Co Ltd 符号化方法、符号化装置およびそれを備える通信システム
JP3913664B2 (ja) * 2001-11-14 2007-05-09 松下電器産業株式会社 符号化装置、復号化装置およびこれらを用いたシステム
EP1374230B1 (en) 2001-11-14 2006-06-21 Matsushita Electric Industrial Co., Ltd. Audio coding and decoding

Also Published As

Publication number Publication date
US20070162278A1 (en) 2007-07-12
WO2005081229A1 (ja) 2005-09-01
US7613306B2 (en) 2009-11-03
CN1906664A (zh) 2007-01-31

Similar Documents

Publication Publication Date Title
JPWO2005081229A1 (ja) オーディオエンコーダ及びオーディオデコーダ
KR101086347B1 (ko) 부가정보 비트스트림 변환을 포함하는 다양한 채널로구성된 다객체 오디오 신호의 부호화 및 복호화 장치 및방법
CA2603027C (en) Device and method for generating a data stream and for generating a multi-channel representation
JP4601669B2 (ja) マルチチャネル信号またはパラメータデータセットを生成する装置および方法
JP4685925B2 (ja) 適応残差オーディオ符号化
KR101158698B1 (ko) 복수-채널 인코더, 입력 신호를 인코딩하는 방법, 저장 매체, 및 인코딩된 출력 데이터를 디코딩하도록 작동하는 디코더
JP2010515099A5 (ja)
JP2007526687A (ja) 可変ブロック長信号の復号化スキーム
KR20100089772A (ko) 오디오 신호의 부호화 및 복호화 방법 및 그 장치
CA3146169A1 (en) Encoding and decoding ivas bitstreams
JP4359499B2 (ja) オーディオ信号の編集
JP3761639B2 (ja) オーディオ復号装置
KR20080071971A (ko) 미디어 신호 처리 방법 및 장치
JP4213708B2 (ja) オーディオ復号装置
RU2383941C2 (ru) Способ и устройство для кодирования и декодирования аудиосигналов