JP5340261B2 - ステレオ信号符号化装置、ステレオ信号復号装置およびこれらの方法 - Google Patents

ステレオ信号符号化装置、ステレオ信号復号装置およびこれらの方法 Download PDF

Info

Publication number
JP5340261B2
JP5340261B2 JP2010503779A JP2010503779A JP5340261B2 JP 5340261 B2 JP5340261 B2 JP 5340261B2 JP 2010503779 A JP2010503779 A JP 2010503779A JP 2010503779 A JP2010503779 A JP 2010503779A JP 5340261 B2 JP5340261 B2 JP 5340261B2
Authority
JP
Japan
Prior art keywords
signal
encoding
layer
stereo
monaural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010503779A
Other languages
English (en)
Other versions
JPWO2009116280A1 (ja
Inventor
利幸 森井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2010503779A priority Critical patent/JP5340261B2/ja
Publication of JPWO2009116280A1 publication Critical patent/JPWO2009116280A1/ja
Application granted granted Critical
Publication of JP5340261B2 publication Critical patent/JP5340261B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、ステレオ音声の符号化に用いられるステレオ信号符号化装置、ステレオ信号復号装置およびこれらの方法に関する。
移動体通信においては、伝送帯域の有効利用のために音声や画像のディジタル情報の圧縮符号化が必須である。その中でも携帯電話で広く利用される音声符号化装置(符号化/復号化)技術に対する期待は大きく、圧縮率の高い従来の高効率符号化に対してさらなる音質の要求が強まっている。
近年、通信ネットワークのブロードバンド化に伴い、音声通信に対して臨場感や音質の高さが求められるようになり、このニーズに応えるために、ステレオ音声の符号化技術を用いた音声通信システムの開発が進められている。
従来から、ステレオ音声を符号化する方法として、左チャネル信号と右チャネル信号との和であるモノラル信号と、左チャネル信号と右チャネル信号との差であるサイド信号とを求め、モノラル信号とサイド信号とをそれぞれ符号化する方法が知られている(特許文献1参照)。
左チャネル信号と右チャネル信号とは、人間の左右の両耳に入る音を表す信号であり、モノラル信号によって左チャネル信号と右チャネル信号との共通成分を表すことができ、サイド信号によって左チャネル信号と右チャネル信号との空間的な違いを表すことができる。
左チャネル信号と右チャネル信号との相関性が高いことから、これらの信号をモノラル信号とサイド信号とに変換してから符号化する方が、直接符号化するよりも、モノラル信号とサイド信号との特徴に応じた適切な符号化が可能になり、冗長性が少なく、低ビットレートで高品質な符号化を実現することができる。
また近年、多層構造を有するスケーラブル符号化装置の標準化がITU−T(International Telecommunication Union Telecommunication Standardization Sector)、MPEG(Moving Picture Expert Group)などで検討されており、より効率的で高品質な音声符号化装置が求められている。
例えば、ITU−T G.729.1に基づくスケーラブル符号化装置は、コアレイヤではITU−T標準G.729の8kbpsの符号化を行い、さらに拡張レイヤの符号化を行うことにより、8kbps、12kbps、14kbps、16kbps、18kbps、20kbps、22kbps、24kbps、26kbps、28kbps、30kbps、32kbpsなど12種のビットレートの符号化を行うことができる。このスケーラビリティは、下位レイヤでの符号化歪みを、上位レイヤにおいて順次符号化していくことによって実現される。すなわち、G.729.1のスケーラブル符号化装置は、ビットレート8kbpsのコアレイヤ1個と、ビットレート4kbpsの拡張レイヤ1個と、ビットレート2kbpsの拡張レイヤ10個から構成される。
また、ステレオ信号に対してスケーラブル符号化を行う技術としては、特許文献2記載のステレオ信号符号化装置が挙げられる。このステレオ信号符号化装置は、各レイヤに対
応する付加情報を所定数のビットで表現し、重要度がより高いビットシーケンスから重要度がより低いビットシーケンスの順に従って、所定の確率モデルを用いて算術符号化を行う。なお、このようなステレオ信号符号化装置は、左チャネル信号と右チャネル信号とを所定のルールで交替しながら符号化することを特徴とする。
特開2001−255892号公報 特開平11−317672号公報
しかしながら、特許文献2記載のステレオ信号符号化装置は上述したように、左チャネル信号と右チャネル信号とを所定のルールで交替しながら符号化するものであり、このような符号化は左チャネル信号と右チャネル信号との相関や情報の重要性に応じた符号化ではない。また、スケーラブル符号化を行うステレオ信号符号化装置では、モノラル符号化を行うレイヤとステレオ符号化を行うレイヤとをユーザの意志により設定した方が好ましいのに対し、特許文献2記載のステレオ信号符号化装置には、このような設定が不可能であるという問題点がある。
本発明の目的は、左チャネル信号と右チャネル信号との相関や情報の重要性に応じたスケーラブル符号化を行うことができ、またモノラル符号化を行うレイヤとステレオ符号化を行うレイヤとを設定することができるステレオ信号符号化装置、ステレオ信号復号装置、およびこれらの方法を提供することである。
本発明のステレオ信号符号化装置は、ステレオ信号を構成する第1チャネル信号と第2チャネル信号との和に関するモノラル信号を生成し、前記第1チャネル信号と前記第2チャネル信号との差に関するサイド信号を生成する和差計算手段と、モノラル符号化またはステレオ符号化のいずれかの符号化モードを示すモード情報をレイヤ毎に生成するモード情報生成手段と、前記モード情報に基づき、前記モノラル信号に関する情報を用いて第i(i=1,2,…,N、Nは2以上の整数)レイヤのモノラル符号化を行うか、または前記モノラル信号に関する情報と前記サイド信号に関する情報との両方を用いて第iレイヤのステレオ符号化を行い、第iレイヤ符号化情報を得る第1から第Nレイヤ符号化手段と、を具備する構成をとる。
本発明のステレオ信号復号装置は、ステレオ信号を構成する第1チャネル信号と第2チャネル信号とを用いた符号化を行うステレオ信号符号化装置の第i(i=1,2,…,N、Nは2以上の整数)レイヤの符号化処理においてモノラル符号化またはステレオ符号化のいずれかを行ったかを示すモード情報と、前記第1から第Nレイヤの符号化処理により得られた第1から第Nレイヤ符号化情報と、を受信する受信手段と、前記モード情報に基づき、前記第iレイヤ符号化情報を用いてモノラル復号またはステレオ復号を行い、前記第1チャネル信号と前記第2チャネル信号との和に関するモノラル信号の第iレイヤの復号結果と、前記第1チャネル信号と前記第2チャネル信号との差に関するサイド信号の第iレイヤの復号結果とを得る第1から第Nレイヤ復号手段と、前記モノラル信号の第Nレイヤの復号結果と、前記サイド信号の第Nレイヤの復号結果とを用いて、第1チャネル復号信号と第2チャネル復号信号とを算出する和差計算手段と、を具備する構成をとる。
本発明のステレオ信号符号化方法は、ステレオ信号を構成する第1チャネル信号と第2チャネル信号との和に関するモノラル信号を生成し、前記第1チャネル信号と前記第2チャネル信号との差に関するサイド信号を生成するステップと、モノラル符号化またはステレオ符号化のいずれかの符号化モードを示すモード情報をレイヤ毎に生成するステップと、前記モード情報に基づき、前記モノラル信号に関する情報を用いて第i(i=1,2,
…,N、Nは2以上の整数)レイヤのモノラル符号化を行うか、または前記モノラル信号に関する情報と前記サイド信号に関する情報との両方を用いて第iレイヤのステレオ符号化を行い、第iレイヤ符号化情報を得るステップと、を有するようにした。
本発明のステレオ信号復号方法は、ステレオ信号を構成する第1チャネル信号と第2チャネル信号とを用いた符号化を行うステレオ信号符号化装置の第i(i=1,2,…,N、Nは2以上の整数)レイヤの符号化処理においてモノラル符号化またはステレオ符号化のいずれかを行ったかを示すモード情報と、前記第1から第Nレイヤの符号化処理により得られた第1から第Nレイヤ符号化情報と、を受信するステップと、前記モード情報に基づき、前記第iレイヤ符号化情報を用いてモノラル復号またはステレオ復号を行い、前記第1チャネル信号と前記第2チャネル信号との和に関するモノラル信号の第iレイヤの復号結果と、前記第1チャネル信号と前記第2チャネル信号との差に関するサイド信号の第iレイヤの復号結果とを得るステップと、前記モノラル信号の第Nレイヤの復号結果と、前記サイド信号の第Nレイヤの復号結果とを用いて、第1チャネル復号信号と第2チャネル復号信号とを算出するステップと、を有するようにした。
本発明によれば、ステレオ信号のL信号とR信号とから算出されるモノラル信号(M信号)とサイド信号(S信号)に対してスケーラブル符号化を行い、モード情報に基づきスケーラブル符号化の各レイヤの符号化モードを設定することにより、左チャネル信号と右チャネル信号との相関や情報の重要性に応じてスケーラブル符号化を行うことができる。また、本発明によれば、モノラル符号化を行うレイヤとステレオ符号化を行うレイヤとを設定することができ、符号化精度の制御の自由度を向上することができる。
以下、本発明の実施の形態について図面を参照しながら説明する。
(実施の形態1)
図1は、本発明の実施の形態1に係るステレオ信号符号化装置100の主要な構成を示すブロック図である。本発明の実施の形態1に係るステレオ信号符号化装置100としては、1つのコアレイヤと3つの拡張レイヤとを備える場合を例にとって説明する。なお以下、ステレオ信号としては、左チャネル信号(以下、L信号と記す)と右チャネル信号(以下、R信号と記す)とからなる場合を例にとって説明する。
図1において、ステレオ信号符号化装置100は、和差計算部101、モード設定部102、コアレイヤ符号化部103、第1拡張レイヤ符号化部104、第2拡張レイヤ符号化部105、第3拡張レイヤ符号化部106、および多重化部107を備える。
和差計算部101は、入力されるステレオ信号を構成するLチャネル信号およびRチャネル信号を用いて、下記の式(1)および(2)に従って、モノラル信号の和信号(以下、M信号と記す)およびサイド信号の差信号(以下、S信号と記す)を求め、コアレイヤ符号化部103に出力する。ここで、L信号とR信号とは、人間の左右の両耳に入る音を表す信号であり、M信号によってはL信号とR信号との共通成分を表すことができ、S信号によってはL信号とR信号との空間的な違いを表すことができる。
=L+R …(1)
=L−R …(2)
式(1)および式(2)において、下付のiは各信号のサンプル番号を示し、iを省略して信号を示す場合もある。例えば、M信号を単にM信号と示す場合がある。
モード設定部102は、コアレイヤ符号化部103、第1拡張レイヤ符号化部104、第2拡張レイヤ符号化部105、および第3拡張レイヤ符号化部106の各符号化部の符号化モードを設定するためのモード情報を、予めユーザの操作により入力し、入力したモード情報を上記各符号化部および多重化部107に出力する。ここで、ユーザの操作としては、キーボード、ディップスイッチ、ボタンなどからの入力、またはPC(Personal Computer)等からのダウンロードなどが挙げられる。
各符号化部の符号化モードとは、M信号に関する情報のみを符号化するモノラル符号化モード、またはM信号に関する情報およびS信号に関する情報の両方を符号化するステレ
オ符号化モードを言う。M信号に関する情報とは、代表的には、M信号自体または各レイヤにおけるM信号に関する符号化歪みを言う。また、S信号に関する情報とは、代表的には、S信号自体または各レイヤにおけるS信号に関する符号化歪みを言う。
以下、モード情報の各ビットを用いて、各レイヤの符号化モードを示す。すなわち、各ビットにおける「0」の値はモノラル符号化モードを示し、「1」の値はステレオ符号化モードを示す。具体的には、4ビットのモード情報の各ビットを用いて、順次、コアレイヤ符号化部103、第1拡張レイヤ符号化部104、第2拡張レイヤ符号化部105、および第3拡張レイヤ符号化部106の符号化モードを表す。
例えば、「0000」という4ビットのモード情報は、すべてのレイヤにおいてモノラル符号化を行うことを意味する。この場合、ステレオ信号符号化装置100としては、M信号を最大限の高品質で符号化することができる。また、例えば、モード情報「0011」は、コアレイヤ符号化部103および第1拡張レイヤ符号化部104の符号化モードはモノラル符号化モードであり、第2拡張レイヤ符号化部105および第3拡張レイヤ符号化部106の符号化モードはステレオ符号化モードであることを意味する。また、例えば、モード情報「1111」は、すべてのレイヤにおいてステレオ符号化を行うことを意味する。この場合、ステレオ信号符号化装置100としては、M信号およびS信号の両方を平等の重み付けで符号化することができる。このように、4ビットのモード情報により、4つの符号化部に対して、16通りの符号化モードを示すことができる。
本実施の形態においては、モード設定部102から出力されるモード情報は、各符号化部及び多重化部107に対して、同じ4ビットのモード情報として入力される。そして、それぞれの符号化部において、入力される4ビットのうち符号化モードの設定に必要な1つのビットのみを参照して、符号化モードを設定する。すなわち、入力される4ビットのモード情報に対して、コアレイヤ符号化部103は1ビット目を、第1拡張レイヤ符号化部104は2ビット目を、第2拡張レイヤ符号化部105は3ビット目を、そして第3拡張レイヤ符号化部106は4ビット目を参照する。
しかし、各符号化部に対してすべて同じ4ビットのモード情報を入力せずに、各符号化部において符号化モードの設定に必要な1つのビットを、モード設定部102においてあらかじめ振り分けて、モード設定部102がそれぞれの符号化部に対して1ビットずつ出力するようにしてもよい。すなわちモード設定部102は、4ビットのモード情報のうち、1ビット目のみをコアレイヤ符号化部103に、2ビット目のみを第1拡張レイヤ符号化部104に、3ビット目のみを第2拡張レイヤ符号化部105に、そして4ビット目のみを第3拡張レイヤ符号化部106に入力するようにしてもよい。
なお、いずれの場合においても、モード設定部102から多重化部107に入力されるモード情報は、4ビットのモード情報が入力される。
コアレイヤ符号化部103は、モード設定部102から入力されるモード情報に基づき、モノラル符号化モードまたはステレオ符号化モードのいずれかに設定される。コアレイヤ符号化部103をモノラル符号化モードに設定した場合には、コアレイヤ符号化部103は、和差計算部101から入力されるM信号のみを符号化し、得られるモノラル符号化情報をコアレイヤ符号化情報として多重化部107に出力する。また、コアレイヤ符号化部103は、和差計算部101から入力されたM信号のコアレイヤ符号化歪みを求めてコアレイヤにおけるM信号に関する情報として第1拡張レイヤ符号化部104に出力するとともに、和差計算部101から入力されたS信号をそのままコアレイヤにおけるS信号に関する情報として第1拡張レイヤ符号化部104に出力する。一方、コアレイヤ符号化部103をステレオ符号化モードに設定した場合には、コアレイヤ符号化部103は、和差
計算部101から入力されたM信号およびS信号の両方を符号化し、得られるステレオ符号化情報をコアレイヤ符号化情報として多重化部107に出力する。また、コアレイヤ符号化部103は、和差計算部101から入力されたM信号のコアレイヤ符号化歪みおよび和差計算部101から入力されたS信号のコアレイヤ符号化歪みを求めて、それぞれ、コアレイヤにおけるM信号に関する情報およびコアレイヤにおけるS信号に関する情報として、第1拡張レイヤ符号化部104に出力する。なお、コアレイヤ符号化部103の詳細については後述する。
第1拡張レイヤ符号化部104は、モード設定部102から入力されるモード情報に基づき、モノラル符号化モードまたはステレオ符号化モードのいずれかに設定される。第1拡張レイヤ符号化部104をモノラル符号化モードに設定した場合には、第1拡張レイヤ符号化部104は、コアレイヤ符号化部103から入力された、コアレイヤにおけるM信号に関する情報を符号化し、得られるモノラル符号化情報を第1拡張レイヤ符号化情報として多重化部107に出力する。また、第1拡張レイヤ符号化部104は、コアレイヤ符号化部103から入力された、コアレイヤにおけるM信号に関する情報を用いて、M信号に関する第1拡張レイヤ符号化歪みを求めて第1拡張レイヤにおけるM信号に関する情報として第2拡張レイヤ符号化部105に出力するとともに、コアレイヤ符号化部103から入力された、コアレイヤにおけるS信号に関する情報をそのまま第1拡張レイヤにおけるS信号に関する情報として第2拡張レイヤ符号化部105に出力する。
一方、第1拡張レイヤ符号化部104をステレオ符号化モードに設定した場合には、第1拡張レイヤ符号化部104は、コアレイヤ符号化部103から入力された、コアレイヤにおけるM信号に関する情報とコアレイヤにおけるS信号に関する情報との両方を符号化し、得られるステレオ符号化情報を第1拡張レイヤ符号化情報として多重化部107に出力する。また、第1拡張レイヤ符号化部104は、コアレイヤ符号化部103から入力された、コアレイヤにおけるM信号に関する情報およびコアレイヤにおけるS信号に関する情報を用いて、M信号に関する第1拡張レイヤ符号化歪みおよびS信号に関する第1拡張レイヤ符号化歪みを求めて、それぞれ、第1拡張レイヤにおけるM信号に関する情報および第1拡張レイヤにおけるS信号に関する情報として、第2拡張レイヤ符号化部105に出力する。なお、第1拡張レイヤ符号化部104の詳細については後述する。
第2拡張レイヤ符号化部105は、モード設定部102から入力されるモード情報に基づき、モノラル符号化モードまたはステレオ符号化モードのいずれかに設定される。第2拡張レイヤ符号化部105をモノラル符号化モードに設定した場合には、第2拡張レイヤ符号化部105は、第1拡張レイヤ符号化部104から入力された、第1拡張レイヤにおけるM信号に関する情報を符号化し、得られるモノラル符号化情報を第2拡張レイヤ符号化情報として多重化部107に出力する。また、第2拡張レイヤ符号化部105は、第1拡張レイヤ符号化部104から入力された、第1拡張レイヤにおけるM信号に関する情報を用いて、M信号に関する第2拡張レイヤ符号化歪みを求めて第2拡張レイヤにおけるM信号に関する情報として第3拡張レイヤ符号化部106に出力するとともに、第1拡張レイヤ符号化部104から入力された、第1拡張レイヤにおけるS信号に関する情報をそのまま第2拡張レイヤにおけるS信号に関する情報として第3拡張レイヤ符号化部106に出力する。
一方、第2拡張レイヤ符号化部105をステレオ符号化モードに設定した場合には、第2拡張レイヤ符号化部105は、第1拡張レイヤ符号化部104から入力された、第1拡張レイヤにおけるM信号に関する情報と第1拡張レイヤにおけるS信号に関する情報との両方を符号化し、得られるステレオ符号化情報を第2拡張レイヤ符号化情報として多重化部107に出力する。また、第2拡張レイヤ符号化部105は、第1拡張レイヤ符号化部104から入力された、第1拡張レイヤにおけるM信号に関する情報および第1拡張レイ
ヤにおけるS信号に関する情報を用いて、M信号に関する第2拡張レイヤ符号化歪みおよびS信号に関する第2拡張レイヤ符号化歪みを求めて、それぞれ、第2拡張レイヤにおけるM信号に関する情報および第2拡張レイヤにおけるS信号に関する情報として、第3拡張レイヤ符号化部106に出力する。なお、第2拡張レイヤ符号化部105の詳細については後述する。
第3拡張レイヤ符号化部106は、モード設定部102から入力されるモード情報に基づき、モノラル符号化モードまたはステレオ符号化モードのいずれかに設定される。第3拡張レイヤ符号化部106をモノラル符号化モードに設定した場合には、第3拡張レイヤ符号化部106は、第2拡張レイヤ符号化部105から入力された、第2拡張レイヤにおけるM信号に関する情報を符号化し、得られるモノラル符号化情報を第3拡張レイヤ符号化情報として多重化部107に出力する。
一方、第3拡張レイヤ符号化部106をステレオ符号化モードに設定した場合には、第3拡張レイヤ符号化部106は、第2拡張レイヤ符号化部105から入力された、第2拡張レイヤにおけるM信号に関する情報と第2拡張レイヤにおけるS信号に関する情報との両方を符号化し、得られるステレオ符号化情報を第3拡張レイヤ符号化情報として多重化部107に出力する。なお、第3拡張レイヤ符号化部106の詳細については後述する。
多重化部107は、モード設定部102から入力されるモード情報、コアレイヤ符号化部103から入力されるコアレイヤ符号化情報、第1拡張レイヤ符号化部104から入力される第1拡張レイヤ符号化情報、第2拡張レイヤ符号化部105から入力される第2拡張レイヤ符号化情報、および第3拡張レイヤ符号化部106から入力される第3拡張レイヤ符号化情報を多重化し、ステレオ信号復号装置に伝送されるビットストリームを生成する。
ステレオ信号符号化装置100において、コアレイヤ符号化部103、第1拡張レイヤ符号化部104、および第2拡張レイヤ符号化部105は、同様な構成を有して基本的に同様な動作を行い、入力信号および出力信号のみが相違する。第3拡張レイヤ符号化部106は、符号化歪みを求めるための構成が不要であるため、上記3つの符号化部とは一部構成が異なる。すなわち、第3拡張レイヤ符号化部106は、図2に示す構成からモノラル復号部303、ステレオ復号部306、スイッチ307、加算器308、加算器309、スイッチ310を省いた構成となる。同様な構成を有する上記3つの符号化部については、例えば、コアレイヤ符号化部103は、M信号とS信号とを入力信号とし、モノラル符号化を行う場合には、M信号に関する情報であるM信号のコアレイヤ符号化歪みとS信号に関する情報であるS信号自体とを、第1拡張レイヤ符号化部104への出力信号とし、ステレオ符号化を行う場合には、M信号に関する情報であるM信号のコアレイヤ符号化歪みとS信号に関する情報であるS信号のコアレイヤ符号化歪みとを、第1拡張レイヤ符号化部104への出力信号とする。
また、第1拡張レイヤ符号化部104および第2拡張レイヤ符号化部105は、前段のレイヤにおける、M信号に関する情報とS信号に関する情報とを入力信号とし、モノラル符号化を行う場合には、前段のレイヤにおけるM信号に関する情報をさらに符号化した符号化歪みと、前段のレイヤにおけるS信号に関する情報自体とを、後段のレイヤの符号化部への出力信号とし、ステレオ符号化を行う場合には、前段のレイヤにおけるM信号に関する情報をさらに符号化した符号化歪みと、前段のレイヤにおけるS信号に関する情報をさらに符号化した符号化歪みとを、後段のレイヤの符号化部への出力信号とする。以下、コアレイヤ符号化部103を例にとり、これらの各符号化部の構成および動作を説明する。
図2は、コアレイヤ符号化部103の内部の主要な構成を示すブロック図である。
図2において、コアレイヤ符号化部103は、スイッチ301、モノラル符号化部302、モノラル復号部303、スイッチ304、ステレオ符号化部305、ステレオ復号部306、スイッチ307、加算器308、加算器309、スイッチ310、およびスイッチ311を備える。
スイッチ301は、モード設定部102から入力されるモード情報の1ビット目の値が「0」である場合には、和差計算部101から入力されるM信号をモノラル符号化部302に出力し、モード設定部102から入力されるモード情報の1ビット目の値が「1」である場合には、和差計算部101から入力されるM信号をステレオ符号化部305に出力する。
モノラル符号化部302は、スイッチ301から入力されるM信号を用いて符号化を行い(モノラル符号化)、得られるモノラル符号化情報をモノラル復号部303およびスイッチ311に出力する。なお、モノラル符号化部302の詳細については後述する。
モノラル復号部303は、モノラル符号化部302から入力されるモノラル符号化情報を復号し、得られる復号信号(モノラル復号M信号)をスイッチ307に出力する。なお、モノラル復号部303の詳細については後述する。
スイッチ304は、モード設定部102から入力されるモード情報の1ビット目の値が「1」である場合には、和差計算部101から入力されるS信号をステレオ符号化部305に出力する。
ステレオ符号化部305は、スイッチ301から入力されるM信号およびスイッチ304から入力されるS信号を用いて符号化を行い(ステレオ符号化)、得られるステレオ符号化情報をステレオ復号部306およびスイッチ311に出力する。なお、ステレオ符号化部305の詳細については後述する。
ステレオ復号部306は、ステレオ符号化部305から入力されるステレオ符号化情報を復号して得られる2つの復号信号、すなわちステレオ復号M信号とステレオ復号S信号とを、それぞれスイッチ307と加算器309とに出力する。
スイッチ307は、モード設定部102から入力されるモード情報の1ビット目の値が「0」である場合には、モノラル復号部303から入力されるモノラル復号M信号を加算器308に出力し、モード設定部102から入力されるモード情報の1ビット目の値が「1」である場合には、ステレオ復号部306から入力されるステレオ復号M信号を加算器308に出力する。
加算器308は、和差計算部101から入力されるM信号と、スイッチ307から入力されるモノラル復号M信号またはステレオ復号M信号のいずれかと、の差をM信号のコアレイヤ符号化歪みとして算出する。加算器308は、このM信号のコアレイヤ符号化歪みを、コアレイヤにおけるM信号に関する情報として第1拡張レイヤ符号化部104に出力する。
加算器309は、和差計算部101から入力されるS信号と、ステレオ復号部306から入力されるステレオ復号S信号と、の差をS信号のコアレイヤ符号化歪みとして算出する。加算器309は、このS信号のコアレイヤ符号化歪みをスイッチ310に出力する。
スイッチ310は、モード設定部102から入力されるモード情報の1ビット目の値が「0」である場合には、和差計算部101から入力されるS信号そのものを、コアレイヤにおけるS信号に関する情報として第1拡張レイヤ符号化部104に出力する。スイッチ310は、モード設定部102から入力されるモード情報の1ビット目の値が「1」である場合には、加算器309から入力されるS信号のコアレイヤ符号化歪みを、コアレイヤにおけるS信号に関する情報として第1拡張レイヤ符号化部104に出力する。
スイッチ311は、モード設定部102から入力されるモード情報の1ビット目の値が「0」である場合には、モノラル符号化部302から入力されるモノラル符号化情報をコアレイヤ符号化情報として多重化部107に出力する。スイッチ311は、モード設定部102から入力されるモード情報の1ビット目の値が「1」である場合には、ステレオ符号化部305から入力されるステレオ符号化情報をコアレイヤ符号化情報として多重化部107に出力する。
図3は、コアレイヤ符号化部103が、モード設定部102から入力されるモード情報の1ビット目の「0」という値に基づき、モノラル符号化モードに設定された場合の動作を説明するための図である。
図3に示すように、コアレイヤ符号化部103がモノラル符号化モードに設定された場合には、ステレオ符号化部305、ステレオ復号部306、および加算器309は動作せず、モノラル符号化部302およびモノラル復号部303は動作する。なお、加算器308は、スイッチ307を介してモノラル復号部303から入力されるモノラル復号M信号と、和差計算部101から入力されるM信号と、の残差信号をM信号のコアレイヤ符号化歪みとして求める。また、スイッチ310は、和差計算部101から入力されるS信号をそのまま第1拡張レイヤ符号化部104へ出力する。スイッチ311は、モノラル符号化部302から入力されるモノラル符号化情報をコアレイヤ符号化情報として多重化部107に出力する。
図4は、コアレイヤ符号化部103が、モード設定部102から入力されるモード情報の1ビット目の「1」という値に基づき、ステレオ符号化モードに設定された場合の動作を説明するための図である。
図4に示すように、コアレイヤ符号化部103がステレオ符号化モードに設定された場合には、モノラル符号化部302およびモノラル復号部303は動作せず、ステレオ符号化部305、ステレオ復号部306、および加算器309は動作する。なお、加算器308は、ステレオ復号部306から入力されるステレオ復号M信号と、和差計算部101から入力されるM信号と、の残差信号をM信号のコアレイヤ符号化歪みとして求める。また、スイッチ310は、加算器309から入力されるS信号のコアレイヤ符号化歪みを第1拡張レイヤ符号化部104に出力する。スイッチ311は、ステレオ符号化部305から入力されるステレオ符号化情報をコアレイヤ符号化情報として多重化部107に出力する。
図5は、モノラル符号化部302の内部の主要な構成を示すブロック図である。
図5において、モノラル符号化部302は、LPC(Linear Prediction Coefficients)分析部321、LPC量子化部322、LPC逆量子化部323、逆フィルタ324、MDCT(Modified Discrete Cosine Transform)部325、スペクトル符号化部326、および多重化部327を備える。スペクトル符号化部326は、シェイプ量子化部111およびゲイン量子化部112を備え、シェイプ量子化部111は、区間探索部121および全体探索部122を備える。
LPC分析部321は、スイッチ301を介して和差計算部101から入力されるM信号を用いて線形予測分析を行い、M信号のスペクトルの概形を示すLPCパラメータ(線形予測パラメータ)を得てLPC量子化部322に出力する。
LPC量子化部322は、LPC分析部321から入力される線形予測パラメータをLSP(Line Spectrum Pair、またはLine Spectral Pair)やISP(Immittance Spectrum Pair)などの補完性の良いパラメータに変換し、さらにベクトル量子化(VQ:Vector
Quantization)、予測ベクトル量子化(予測VQ:Predictive Vector Quantization)、多段ベクトル量子化(多段VQ:Multi-Stage Vector Quantization)、スプリットベクトル量子化(スプリットVQ:Split Vector Quantization)などの量子化方法で量子化する。LPC量子化部322は、量子化により得られるLPC量子化データをLPC逆量子化部323および多重化部327に出力する。
LPC逆量子化部323は、LPC量子化部322から入力されるLPC量子化データを用いて逆量子化を行い、得られるLSPやISPなどのパラメータをさらにLPCパラメータに逆変換する。
逆フィルタ324は、スイッチ301を介して和差計算部101から入力されるM信号に対し、LPC逆量子化部323から入力されるLPCパラメータを用いて逆フィルタリングを施すことにより、スペクトルの概形の特徴が取り除かれてフラットになったフィルタリング後のM信号をMDCT部325に出力する。ここで、逆フィルタ324の機能は下記の式(3)により示される。
Figure 0005340261
式(3)において、下付のiは各信号のサンプル番号を示す。また、xは逆フィルタ324の入力信号を示す。yは逆フィルタ324の出力信号を示す。αはLPC量子化部322およびLPC逆量子化部323により量子化および逆量子化が施された後のLPCパラメータを示し、Jは線形予測の次数を示す。
MDCT部325は、逆フィルタ324から入力される逆フィルタリング後のM信号に対してMDCTを行い、時間領域のM信号を周波数領域のM信号スペクトルに変換する。なお、MDCTの代わりにFFT(Fast Fourier Transform:高速フーリエ変換)を用いても良い。MDCT部325は、MDCTにより得られるM信号スペクトルをスペクトル符号化部326に出力する。
スペクトル符号化部326は、MDCT部325から入力されるM信号スペクトルを入力スペクトルとし、スペクトルのシェイプとゲインに分けて入力スペクトルを量子化し、得られるパルス符号とゲイン符号とを多重化部327に出力する。シェイプ量子化部111は、入力スペクトルのシェイプを少数のパルスの位置、極性で量子化し、ゲイン量子化部112は、シェイプ量子化部111によって探索されたパルスのゲインをバンド毎に算出して量子化する。スペクトル符号化部326は、探索されたパルスの位置および極性を表すパルス符号と、探索されたパルスのゲインを表すゲイン符号とを多重化部327に出力する。なお、シェイプ量子化部111、ゲイン量子化部112の詳細については後述する。
多重化部327は、LPC量子化部322から入力されるLPC量子化データ、スペク
トル符号化部326から入力されるパルス符号およびゲイン符号を多重化してモノラル符号化情報を得、モノラル復号部303およびスイッチ311に出力する。
次に、シェイプ量子化部111、ゲイン量子化部112の詳細について説明する。シェイプ量子化部111は、所定の探索区間を複数に区切ったバンド毎にパルスを探索する区間探索部121と、この探索区間全体に渡ってパルスを探索する全体探索部122と、を備える。
探索の基準となる式は下記の式(4)である。なお、式(4)において、Eは符号化歪、sは入力スペクトル、gは最適ゲイン、δはデルタ関数、pはパルスの位置である。
Figure 0005340261
コスト関数を最小にするパルスの位置は、上記式(4)より、各々のバンドの中で入力スペクトルの絶対値|s|が最大になる位置であり、極性は、そのパルスの位置の入力スペクトルの値の極性である。
以下、入力スペクトルのベクトル長が80サンプル、バンド数が5であって、各バンドで1本のパルスと全体で3本のパルスとの計8本のパルスでスペクトルを符号化する場合を例に説明する。この場合、各バンドの長さは16サンプルとなる。なお、探索されるパルスの振幅は「1」に固定で、極性は「+−」である。
区間探索部121は、バンド毎に、エネルギが最大の位置、極性(+−)を探索し、1本ずつパルスを立てる。本例では、バンド数が5で、バンド毎に、パルスの位置を示すために4ビット(位置のエントリ:16)、極性を示すために1ビット(+−)必要であるので、合計25ビットの情報ビットとなる。
区間探索部121の探索アルゴリズムのフローを図6に示す。なお、図6のフロー図で用いられる記号の内容は以下の通りである。
i:位置
b:バンドの番号
max:最大値
c:カウンタ
pos[b]:探索結果(位置)
pol[b]:探索結果(極性)
s[i]:入力スペクトル
図6に示すように、区間探索部121は、バンド毎(0≦b≦4)に、各サンプル(0≦c≦15)の入力スペクトルs[i]を計算して、最大値maxを求める。
区間探索部121において探索されたパルスで表現されたスペクトルの例を図7に示す。図7に示すように、バンド幅16サンプルの5つのバンドに、振幅「1」、極性「+−」のパルスが1本ずつ立てられる。
全体探索部122は、探索区間全体に渡って、3本のパルスを立てる位置を探索し、パルスの位置と極性を符号化する。全体探索部122における探索では、少ない情報ビットで且つ少ない計算量で正確な位置を符号化するために、以下の4つの条件で探索を行う。(1)同じ位置に2つ以上のパルスを立てない。本例では、区間探索部121においてバンド毎に立てたパルスの位置にも立てないこととする。この工夫により、振幅成分の表現
に情報ビットを使わないので効率的に情報ビットを使用することができる。
(2)パルスを1本ずつ順番に開ループで探索する。探索の途中では(1)のルールに従い、既に決定されたパルスの位置については探索の対象外とする。
(3)位置の探索では、パルスが立たない方が良い場合も1つの位置として符号化する。(4)ゲインをバンド毎に符号化することを考慮して、バンド毎の理想ゲインによる符号化歪を評価しながらパルスを探索する。
全体探索部122は、入力スペクトル全体に渡って、1本のパルスの探索を、次の2段階のコスト評価で行う。まず、第1段階として、全体探索部122は、各バンドでのコストを評価し、最もコスト関数が小さくなる位置と極性を求める。そして、第2段階として、全体探索部122は、上記探索が1つのバンド内を終了する毎に全体のコストを評価し、これが最小になるパルスの位置と極性を最終結果として保存する。この探索を各バンドで順番に行っていく。この探索は、上記(1)ないし(4)の条件に合うように行われる。そして、1本のパルスの探索が終わると、そのパルスが探索位置にあるとして、次のパルスの探索を行う。これを繰り返して所定の本数(本例では、3本)になるまで探索を行う。
全体探索部122の探索アルゴリズムのフローを図8に示す。図8は、前処理のフロー図であり、図9は、本探索のフロー図である。なお、図9のフロー図に、上記(1)(2)(4)の条件に対応する部分について示す。
図8のフロー図で用いられる記号の内容は以下の通りである。
c:カウンタ
pf[*]:パルス有無フラグ
b:バンドの番号
pos[*]:検索結果(位置)
n_s[*]:相関値
n_max[*]:相関値最大
n2_s[*]:相関値2乗
n2_max[*]:相関値2乗最大
d_s[*]:パワ値
d_max[*]:パワ値最大
s[*]:入力スペクトル
図9のフロー図で用いられる記号の内容は以下の通りである。
i:パルス番号
i0:パルス位置
cmax:コスト関数の最大値
pf[*]:パルス有無フラグ(0:無、1:有)
ii0:バンド内の相対的パルス位置
nom:スペクトル振幅
nom2:分子項(スペクトルパワ)
den:分母項
n_s[*]:相関値
d_s[*]:パワ値
s[*]:入力ベクトル
n2_s[*]:相関値2乗
n_max[*]:相関値最大
n2_max[*]:相関値2乗最大
idx_max[*]:各パルスの探索された結果(位置)
(なお、idx_max[*]の0〜4までは図6のpos(b)と同一である。)
fd0、fd1、fd2:一時記憶用バッファ(実数型)
id0,id1:一時記憶用バッファ(整数型)
id0_s、id1_s:一時記憶用バッファ(整数型)
>>:ビットシフト(右へシフト)
&:ビット列としてのアンド
なお、図8、図9の探索において、idx_max[*]が「−1」のままである場合が、上記条件(3)のパルスが立たない方が良い場合である。この具体的事象としては、バンド毎に探索したパルスや全範囲で探索したパルスでスペクトルを十分近似できており、これ以上同じ大きさのパルスを立ててもかえって符号化歪が大きくなってしまう場合などが挙げられる。
探索したパルスの極性は、入力スペクトルのその位置の極性であり、全体探索部122は、この極性を3(本)×1=3ビットで符号化する。なお、位置が「−1」の場合、すなわちパルスが立たない場合には極性はどちらでもよい。ただし、ビット誤りの検出に用いられる場合もあるため、通常どちらかに固定される。
また、全体探索部122は、パルスの位置情報を、パルスの位置の組み合わせの数で符号化する。本例では、入力スペクトルが80サンプルで、バンド毎に5パルスが既に立っているので、パルスを立てない場合も考慮すると、位置のヴァリエーションは下記の式(5)の計算により17ビットで表すことができる。
Figure 0005340261
なお、同じ位置に2つのパルスが立たないようにするというルールによって、組み合わせの数を少なくすることができ、このルールの効果は、全体で探索するパルス数が多い程大きくなる。
ここで、全体探索部122において探索したパルスの位置を符号化する方法について詳細に述べる。
(1)3本のパルスの位置をその大きさでソーティングし、小さい数値から大きな数値に並べる。なお、「−1」についてはそのままにしておく。
(2)バンド毎に立つパルスの位置の分だけ左に詰めて、位置の数値を小さくする。これで求まる数値を「位置数」と呼ぶ。なお、「−1」についてはそのままにしておく。例えば、パルスの位置が66で、これより小さい位置には、0〜15、16〜31、32〜47、48〜64に1本ずつパルスがあったとすると、位置数は「66−4=62」になる。
(3)「−1」を「そのパルスの最大の値+1」の位置数に設定する。この場合、実際にパルスが存在する位置数と混同しないように調整しながら値の順番を決める。これにより、パルス#0の位置数は0から73まで、パルス#1の位置数はパルス#0の位置数から74まで、パルス#2の位置数はパルス#1の位置数から75までの範囲に限定され、下位の位置数が上位の位置数を超えないようになる。
(4)そして、組み合わせの符号を求める下記の式(6)に示す統合処理により、位置数(i0,i1,i2)を統合して符号(c)を得る。この統合処理は大きさの順番がある場合に全ての組み合わせを統合する計算処理である。
Figure 0005340261
(5)そして、このcの17ビットと極性の3ビットを合わせて20ビットの符号を得る。
なお、上記位置数の中で、パルス#0が「73」、パルス#1が「74」、パルス#2が「75」の場合が、そのパルスが立たない場合を示す位置数となる。例えば3つの位置数が(73、−1、−1)という場合は、前の1つの位置数と「立たない場合」の位置数の関係から、(−1、73、−1)と順番を変え、(73、73、74)とされる。
このように、本例のように、入力スペクトルを8本のパルス列(バンド毎5本、全体3本)で表すモデルの場合、情報ビット45ビットで符号化することができる。
区間探索部121および全体探索部122で探索されたパルスで表現されたスペクトルの例を図10に示す。なお、図10において、より太く表現されたパルスが全体探索部122において探索されたパルスである。
ゲイン量子化部112は、各バンドのゲインを量子化する。8本のパルスは各バンドに配置されているので、ゲイン量子化部112は、そのパルスと入力スペクトルとの相関を分析してゲインを求める。
ゲイン量子化部112は、理想ゲインを求めてからスカラ量子化やベクトル量子化で符号化する場合、まず、下記の式(7)で理想ゲインを求める。なお、式(7)において、gはバンドnの理想ゲイン、s(i+16n)はバンドnの入力スペクトル、v(i)はバンドnのシェイプを復号したベクトルである。
Figure 0005340261
そして、ゲイン量子化部112は、理想ゲインをスカラ量子化(SQ)する、または、5つのゲインをまとめてベクトル量子化により符号化する。ベクトル量子化する場合には、予測量子化、多段VQ、スプリットVQ等により効率良く符号化することができる。また、ゲインは、聴感的には対数で聞こえるため、ゲインを対数変換してからSQ、VQすれば聴感的に良好な合成音が得られる。
なお、理想ゲインを求めるのではなく、符号化歪を直接評価する方法もある。例えば、5つのゲインをVQする場合、下記の式(8)を最小にする。なお、式(8)において、Eはk番目のゲインベクトルの歪み、s(i+16n)はバンドnの入力スペクトル、g (k)はk番目のゲインベクトルのn番目の要素、v(i)はバンドnのシェイプを復号したシェイプベクトルである。
Figure 0005340261
図11は、モノラル復号部303の内部の主要な構成を示すブロック図である。図11に示すモノラル復号部303は、分離部331、LPC逆量子化部332、スペクトル復号部333、IMDCT(Inverse Modified Discrete Cosine Transform)部334、および合成フィルタ335を備える。
図11において、分離部331は、モノラル符号化部302から入力されるモノラル符号化情報をLPC量子化データ、パルス符号、およびゲイン符号に分離し、LPC量子化データをLPC逆量子化部332に出力し、パルス符号およびゲイン符号をスペクトル復号部333に出力する。
LPC逆量子化部332は、分離部331から入力されるLPC量子化データを逆量子化し、得られるLPCパラメータを合成フィルタ335に出力する。
スペクトル復号部333は、分離部331から入力されるパルス符号およびゲイン符号を用い、図5に示したスペクトル符号化部326の符号化方法に対応する方法によってシェイプベクトルおよび復号ゲインを復号する。また、スペクトル復号部333は、復号したシェイプベクトルに復号ゲインを乗ずることによって復号スペクトルを得、復号スペクトルをIMDCT部334に出力する。
IMDCT部334は、スペクトル復号部333から入力される復号スペクトルに対して図5に示したMDCT部325の逆の変換を行い、変換によって得られた時系列のM信号を合成フィルタ335に出力する。
合成フィルタ335は、LPC逆量子化部332から入力されるLPCパラメータを用い、IMDCT部334から入力される時系列のM信号に対して合成フィルタを掛け、モノラル復号M信号を得る。
次に、スペクトル復号部333における、全体で探索した3本のパルスの位置の復号方法について説明する。
スペクトル符号化部326の全体探索部122では、上記式(5)を用いて、位置数(i0,i1,i2)を1つの符号に統合した。スペクトル復号部333では、この逆の処理を行うことになる。すなわち、スペクトル復号部333では、統合式の値を、各位置数を動かしながら順番に計算し、その値を下回る場合にその位置数を固定し、これを低次の位置数から上位に向かって1つずつ行っていくことによって復号する。図12は、スペクトル復号部333の復号アルゴリズムを示すフロー図である。
なお、図12において、エラー処理となっているステップへ進むのは、入力である統合された位置の符号kがビットエラーで異常になってしまった場合である。したがって、この場合には、所定のエラー処理により位置を求めなくてはならない。
また、復号器での計算量は、ループ処理がある分、符号器よりも増えることになる。ただし、それぞれのループは開ループであるので符号化装置の処理の全体量から見れば、復号器の計算量は余り大きなものではない。
図13は、ステレオ符号化部305の内部の主要な構成を示すブロック図である。図13に示すステレオ符号化部305は、図5に示したモノラル符号化部302と基本的に同様な構成を有し、基本的に同様な動作を行う。このため、図5と図13とで、互いに同じ動作を行う部位の符号には、図13の方の部位の符号にaを付加する。例えば、図5のLPC分析部321に対応する図13における部位は、LPC分析部321aと表す。なお、図13のステレオ符号化部305は、逆フィルタ351、MDCT部352、および統合部353をさらに具備する点において、図5のモノラル符号化部302と相違する。また、図13のステレオ符号化部305におけるスペクトル符号化部356は、図5のモノラル符号化部302におけるスペクトル符号化部326と入力信号が相違するため、異なる符号を付す。
逆フィルタ351は、和差計算部101から入力されるS信号に対し、LPC逆量子化部323aから入力されるLPCパラメータを用いて逆フィルタリングを施すことにより、スペクトルの概形の特徴を平滑にし、フィルタリング後のS信号としてMDCT部352に出力する。ここで、逆フィルタ324aの機能は上記の式(3)により示される。厳密に言えば、M信号から得られるLPC係数はS信号のスペクトルの概形とは整合しないが、一般的にM信号とS信号のスペクトルの概形が似ていることと、S信号のLPC分析、量子化、および逆量子化に必要な計算量およびROM容量を節約することとを考慮し、LPC逆量子化部323aから入力されるLPCパラメータを逆フィルタ351の逆フィルタリング処理に用いる。
MDCT部352は、逆フィルタ351から入力される逆フィルタリング後のS信号に対してMDCTを行い、時間領域のS信号を周波数領域のS信号スペクトルに変換する。なお、MDCTの代わりにFFTを用いても良い。MDCT部352は、MDCTにより得られるS信号スペクトルを統合部353に出力する。
統合部353は、同一周波数のスペクトルが隣り合うように、MDCT部325aから入力されるM信号スペクトルと、MDCT部352から入力されるS信号スペクトルとを統合し、得られる統合スペクトルをスペクトル符号化部356に出力する。
図14は、統合部353においてM信号スペクトルとS信号スペクトルとを統合する様子を示す図である。スペクトル符号化部356は、2つのスペクトルを図14に示すように統合して得られた統合スペクトルを1つの符号化対象スペクトルとして扱うため、M信号スペクトルおよびS信号のスペクトルの符号化において重要な部分により多くのビットを割り当てる。
再び図13に戻り、スペクトル符号化部356は、統合部353から入力される統合スペクトルを入力スペクトルとする点がスペクトル符号化部326と相違する。またスペクトル符号化部356は、入力スペクトルの全体で探索するパルスの数がスペクトル符号化部326の場合と相違する。
全体で探索するパルスの数に関連して、スペクトル符号化部356のビットアロケーションについて図15を参照しながら説明する。
スペクトル符号化部356は、統合スペクトルを入力スペクトルとするため、入力スペクトルのサンプル数は、スペクトル符号化部326の入力スペクトルの2倍となり、入力スペクトルを同じく5バンドに区切って得られる各バンドのサンプル数もスペクトル符号化部326の場合の2倍となる。モノラル符号化部302においてシェイプ符号のビット数の合計が45ビットであることを考慮し、スペクトル符号化部356においては図15に示すようなビットアロケーションを行う。図15に示すように、スペクトル符号化部3
56は、全体で探索するパルスの数が「2」であり、スペクトル符号化部326が全体で探索するパルスの数「3」と相違する。また、図15に示すように、スペクトル符号化部356のスペクトル符号化に用いるビット数の合計「46」と、スペクトル符号化部326のスペクトル符号化に用いるビット数の合計「45」とも相違する。
ここで、スペクトル符号化部356のスペクトル符号化に用いるビット数の合計と、スペクトル符号化部326のスペクトル符号化に用いるビット数の合計とを完全に同じくすることも可能である。例えば、スペクトル符号化部356が全体で探索する2本のパルスのうち1本の探索範囲を0〜159サンプルから0〜50サンプルに制限すれば良い。これにより、160×51<8192種の探索結果を13ビットで表すことが可能となり、スペクトル符号化に用いるビット数の合計を45ビットに納めることが可能となる。ほかにも、例えばバンド毎のパルスの探索において、第5バンド(最も高域のバンド)の探索範囲を0〜31サンプルから0〜15サンプルに制限することによっても、スペクトル符号化部356のスペクトル符号化に用いるビット数の合計と、スペクトル符号化部326のスペクトル符号化に用いるビット数の合計とを完全に同じくすることが可能である。この場合、5バンドのバンド毎のパルスの位置を5×4+4=24のビット数で表すことが可能であるからである。
スペクトル符号化部356がM信号スペクトルとS信号スペクトルとが統合された統合スペクトルを符号化することにより、M信号およびS信号の特徴に応じたビット配分を自動的に行うこととなり、情報の重要性に応じた効率的な符号化を行うことができる。
例えば、L信号とR信号とが全く同じである場合には、S信号のスペクトルは「0」となり、統合スペクトルのうちM信号スペクトルからなる位置にのみパルスが立つため、M信号スペクトルが高精度で符号化される。
逆にL信号とR信号が逆位相に近い場合には、S信号スペクトルが大きくなり、統合スペクトルのうちS信号スペクトルからなる位置により多くのパルスが立つため、S信号スペクトルが高精度で符号化される。このように、特別な判断や場合分けを行わなくても、自動的にビットアロケーションが行われ、M信号スペクトルとS信号スペクトルとが効率的に符号化される。
また、ある周波数に大きな成分があって、かつL信号とR信号とが逆位相に近くない場合には、M信号スペクトルとS信号スペクトルとのいずれかに大きい成分が存在する傾向がある。ここで、同じ周波数成分のM信号スペクトルとS信号スペクトルとは隣り合わせて統合スペクトルに統合され、スペクトル符号化部356は統合スペクトルを複数のバンドに区切って符号化するため、大きな成分が存在する周波数のM信号スペクトルまたはS信号スペクトルのいずれか一方のみが探索され符号化される。これにより、同じ周波数成分の2つのパルスを符号化することを回避し、効率的な符号化を実現することができる。
図16は、ステレオ復号部306の内部の主要な構成を示すブロック図である。ステレオ復号部306は、図11に示したモノラル復号部303の分離部331、LPC逆量子化部332、スペクトル復号部333、IMDCT部334、および合成フィルタ335と同様な動作を行う、分離部331a、LPC逆量子化部332a、スペクトル復号部333a、IMDCT部334a、および合成フィルタ335aを備える。そしてさらにステレオ復号部306は、分解部361、IMDCT部362、および合成フィルタ363を備える。なお、図16においては、合成フィルタ335aの出力信号がステレオ復号M信号であり、合成フィルタ363の出力信号がステレオ復号S信号である。
分解部361は、スペクトル復号部333aから入力される復号スペクトルを、図13
の統合部353と逆の処理によって復号M信号スペクトルおよび復号S信号スペクトルに分解する。分解部361は、復号M信号スペクトルをIMDCT部334aに出力し、復号S信号スペクトルをIMDCT部362に出力する。
IMDCT部362は、分解部361から入力される復号S信号スペクトルに対して図13に示したMDCT部352と逆の変換を行い、変換によって得られた時系列のS信号を合成フィルタ363に出力する。
合成フィルタ363は、LPC逆量子化部332aから入力されるLPCパラメータを用い、IMDCT部362から入力される時系列のS信号に対して合成フィルタを掛け、ステレオ復号S信号を得る。
次に、図1に示したステレオ信号符号化装置100に対応するステレオ信号復号装置の構成および動作について説明する。
図17は、ステレオ信号符号化装置100に対応するステレオ信号復号装置200の主要な構成を示すブロック図である。
図17において、ステレオ信号復号装置200は、分離部201、モード設定部202、コアレイヤ復号部203、第1拡張レイヤ復号部204、第2拡張レイヤ復号部205、第3拡張レイヤ復号部206、および和差計算部207を備える。
分離部201は、ステレオ信号符号化装置100から入力されるビットストリームを、モード情報、コアレイヤ符号化情報、第1拡張レイヤ符号化情報、第2拡張レイヤ符号化情報、および第3拡張レイヤ符号化情報に分離し、モード設定部202、コアレイヤ復号部203、第1拡張レイヤ復号部204、第2拡張レイヤ復号部205、および第3拡張レイヤ復号部206にそれぞれ出力する。
モード設定部202は、分離部201から入力される、コアレイヤ復号部203、第1拡張レイヤ復号部204、第2拡張レイヤ復号部205、および第3拡張レイヤ復号部206の復号モードを設定するためのモード情報を上記各復号部に出力する。
ここで、各復号部の復号モードとは、M信号に関する情報のみを復号するモノラル復号モード、またはM信号に関する情報とS信号に関する情報との両方を復号するステレオ復号モードを言う。M信号に関する情報とは、代表的には、M信号自体または各レイヤにおけるM信号に関する符号化歪みを言う。また、S信号に関する情報とは、代表的には、S信号自体または各レイヤにおけるS信号に関する符号化歪みを言う。
以下、モード情報の各ビットを用いて、各レイヤの復号モードを示す。すなわち、各ビットにおける「0」の値はモノラル復号モードを示し、「1」の値はステレオ復号モードを示す。具体的には、4ビットのモード情報の各ビットを用いて、順次、コアレイヤ復号部203、第1拡張レイヤ復号部204、第2拡張レイヤ復号部205、および第3拡張レイヤ復号部206の復号モードを表す。例えば、「0000」という4ビットのモード情報は、各復号部のすべてにおいてモノラル復号を行うことを意味する。また、例えば、モード情報「0011」は、コアレイヤ復号部203および第1拡張レイヤ符号化部204はモノラル復号を行い、第2拡張レイヤ復号部205および第3拡張レイヤ復号部206はステレオ復号を行うことを意味する。このように、4ビットのモード情報により、4つの復号部に対して、16通りの復号モードを示すことができる。
本実施の形態においては、モード設定部202から出力されるモード情報は、各復号部
に対して、同じ4ビットのモード情報として入力される。そして、それぞれの復号部において、入力される4ビットのうち復号モードの設定に必要な1つのビットのみを参照して、復号モードを設定する。すなわち、入力される4ビットのモード情報に対して、コアレイヤ復号部203は1ビット目を、第1拡張レイヤ復号部204は2ビット目を、第2拡張レイヤ復号部205は3ビット目を、そして第3拡張レイヤ復号部206は4ビット目を参照する。
しかし、各復号部に対してすべて同じ4ビットのモード情報を入力せずに、各復号部において復号モードの設定に必要な1つのビットを、モード設定部202においてあらかじめ振り分けて、モード設定部202がそれぞれの復号部に対して1ビットずつ出力するようにしてもよい。すなわちモード設定部202は、4ビットのモード情報のうち、1ビット目のみをコアレイヤ復号部203に、2ビット目のみを第1拡張レイヤ復号部204に、3ビット目のみを第2拡張レイヤ復号部205に、そして4ビット目のみを第3拡張レイヤ復号部206に入力するようにしてもよい。
なお、いずれの場合においても、分離部201からモード設定部202に入力されるモード情報は、4ビットのモード情報が入力される。
コアレイヤ復号部203は、モード設定部202から入力されるモード情報に基づき、モノラル復号モードまたはステレオ復号モードのいずれかに設定される。具体的には、コアレイヤ復号部203は、モノラル復号モードに設定された場合には、分離部201からコアレイヤ符号化情報として入力されるモノラル符号化情報を復号し、得られるコアレイヤ復号M信号を第1拡張レイヤ復号部204に出力する。この場合、S信号に関する情報は復号されないため、見かけ上、ゼロ信号がコアレイヤ復号S信号として、第1拡張レイヤ復号部204に出力される。
一方、コアレイヤ復号部203は、ステレオ復号モードに設定された場合には、分離部201からコアレイヤ符号化情報として入力されるステレオ符号化情報を復号し、得られるコアレイヤ復号M信号およびコアレイヤ復号S信号を第1拡張レイヤ復号部204に出力する。ただし、コアレイヤ復号部203は、復号を行う前にM信号およびS信号を全てクリア(0の値で埋めること)しておく。なお、コアレイヤ復号部203の詳細については後述する。
第1拡張レイヤ復号部204は、モード設定部202から入力されるモード情報に基づき、モノラル復号モードまたはステレオ復号モードのいずれかに設定される。具体的には、第1拡張レイヤ復号部204は、モノラル復号モードに設定された場合には、分離部201から第1拡張レイヤ符号化情報として入力されるモノラル符号化情報を復号し、M信号のコアレイヤ符号化歪みを得る。第1拡張レイヤ復号部204は、このM信号のコアレイヤ符号化歪みと、コアレイヤ復号部203から入力されるコアレイヤ復号M信号とを加算し、加算結果を第1拡張レイヤ復号M信号として第2拡張レイヤ復号部205に出力する。コアレイヤ復号部203から入力されるコアレイヤ復号S信号は、そのまま第1拡張レイヤ復号S信号として第2拡張レイヤ復号部205に出力される。
一方、第1拡張レイヤ復号部204は、ステレオ復号モードに設定された場合には、分離部201から第1拡張レイヤ符号化情報として入力されるステレオ符号化情報を復号し、M信号のコアレイヤ符号化歪みおよびS信号のコアレイヤ符号化歪みを得る。第1拡張レイヤ復号部204は、M信号のコアレイヤ符号化歪みと、コアレイヤ復号部203から入力されるコアレイヤ復号M信号とを加算し、加算結果を第1拡張レイヤ復号M信号として第2拡張レイヤ復号部205に出力する。また、第1拡張レイヤ復号部204は、S信号のコアレイヤ符号化歪みと、コアレイヤ復号部203から入力されるコアレイヤ復号S
信号とを加算し、加算結果を第1拡張レイヤ復号S信号として第2拡張レイヤ復号部205に出力する。なお、第1拡張レイヤ復号部204の詳細については後述する。
第2拡張レイヤ復号部205は、モード設定部202から入力されるモード情報に基づき、モノラル復号モードまたはステレオ復号モードのいずれかに設定される。具体的には、第2拡張レイヤ復号部205は、モノラル復号モードに設定された場合には、分離部201から第2拡張レイヤ符号化情報として入力されるモノラル符号化情報を復号し、M信号に関する第1拡張レイヤ符号化歪みを得る。第2拡張レイヤ復号部205は、このM信号に関する第1拡張レイヤ符号化歪みと、第1拡張レイヤ復号部204から入力される第1拡張レイヤ復号M信号とを加算し、加算結果を第2拡張レイヤ復号M信号として第3拡張レイヤ復号部206に出力する。第1拡張レイヤ復号部204から入力される第1拡張レイヤ復号S信号は、そのまま第2拡張レイヤ復号S信号として第3拡張レイヤ復号部205に出力される。
一方、第2拡張レイヤ復号部205は、ステレオ復号モードに設定された場合には、分離部201から第2拡張レイヤ符号化情報として入力されるステレオ符号化情報を復号し、M信号に関する第1拡張レイヤ符号化歪みおよびS信号に関する第1拡張レイヤ符号化歪みを得る。第2拡張レイヤ復号部205は、M信号に関する第1拡張レイヤ符号化歪みと、第1拡張レイヤ復号部204から入力される第1拡張レイヤ復号M信号とを加算し、加算結果を第2拡張レイヤ復号M信号として第3拡張レイヤ復号部206に出力する。また、第2拡張レイヤ復号部205は、S信号に関する第1拡張レイヤ符号化歪みと、第1拡張レイヤ復号部204から入力される第1拡張レイヤ復号S信号とを加算し、加算結果を第2拡張レイヤ復号S信号として第3拡張レイヤ復号部206に出力する。なお、第2拡張レイヤ復号部205の詳細については後述する。
第3拡張レイヤ復号部206は、モード設定部202から入力されるモード情報に基づき、モノラル復号モードまたはステレオ復号モードのいずれかに設定される。具体的には、第3拡張レイヤ復号部206は、モノラル復号モードに設定された場合には、分離部201から第3拡張レイヤ符号化情報として入力されるモノラル符号化情報を復号し、M信号に関する第2拡張レイヤ符号化歪みを得る。第3拡張レイヤ復号部206は、このM信号に関する第2拡張レイヤ符号化歪みと、第2拡張レイヤ復号部205から入力される第2拡張レイヤ復号M信号とを加算し、加算結果を第3拡張レイヤ復号M信号として和差計算部207に出力する。第2拡張レイヤ復号部205から入力される第2拡張レイヤ復号S信号は、そのまま第3拡張レイヤ復号S信号として和差計算部207に出力される。
一方、第3拡張レイヤ復号部206は、ステレオ復号モードに設定された場合には、分離部201から第3拡張レイヤ符号化情報として入力されるステレオ符号化情報を復号し、M信号に関する第2拡張レイヤ符号化歪みおよびS信号に関する第2拡張レイヤ符号化歪みを得る。第3拡張レイヤ復号部206は、M信号に関する第2拡張レイヤ符号化歪みと、第2拡張レイヤ復号部205から入力される第2拡張レイヤ復号M信号とを加算し、加算結果を第3拡張レイヤ復号M信号として和差計算部207に出力する。また、第3拡張レイヤ復号部206は、S信号に関する第2拡張レイヤ符号化歪みと、第2拡張レイヤ復号部205から入力される第2拡張レイヤ復号S信号とを加算し、加算結果を第3拡張レイヤ復号S信号として和差計算部207に出力する。なお、第3拡張レイヤ復号部206の詳細については後述する。
和差計算部207は、第3拡張レイヤ復号部206から入力される第3拡張レイヤ復号M信号と第3拡張レイヤ復号S信号とを用いて、下記の式(9)および式(10)により、復号L信号および復号R信号を算出する。
’=(M’+S’)/2 …(9)
’=(M’−S’)/2 …(10)
式(9)および式(10)において、M’は第3拡張レイヤ復号M信号を示し、S’は第3拡張レイヤ復号S信号を示し、L’は復号L信号を示し、R’は復号R信号を示す。
図18は、コアレイヤ復号部203の内部の主要な構成を示すブロック図である。
図18に示すコアレイヤ復号部203は、スイッチ231、モノラル復号部232、ステレオ復号部233、スイッチ234、およびスイッチ235を備える。
スイッチ231は、モード設定部202から入力されるモード情報の1ビット目の値が「0」である場合には、分離部201からコアレイヤ符号化情報として入力されるモノラル符号化情報をモノラル復号部232に出力し、モード設定部202から入力されるモード情報の1ビット目の値が「1」である場合には、分離部201からコアレイヤ符号化情報として入力されるステレオ符号化情報をステレオ復号部233に出力する。
モノラル復号部232は、スイッチ231から入力されるモノラル符号化情報を用いてモノラル復号を行い、得られるコアレイヤ復号M信号をスイッチ234に出力する。なお、モノラル復号部232の内部の構成および動作は図11に示したモノラル復号部303と同様であるため、ここでは詳細な説明を省略する。
ステレオ復号部233は、スイッチ231から入力されるステレオ符号化情報を用いてステレオ復号を行い、得られるコアレイヤ復号M信号をスイッチ234に出力し、コアレイヤ復号S信号をスイッチ235に出力する。なお、ステレオ復号部233の内部の構成および動作は図16に示したステレオ復号部306と同様であるため、ここでは詳細な説明を省略する。
スイッチ234は、モード設定部202から入力されるモード情報の1ビット目の値が「0」である場合には、モノラル復号部232から入力されるコアレイヤ復号M信号を第1拡張レイヤ復号部204に出力する。また、スイッチ234は、モード設定部202から入力されるモード情報の1ビット目の値が「1」である場合には、ステレオ復号部233から入力されるコアレイヤ復号M信号を第1拡張レイヤ復号部204に出力する。
スイッチ235は、モード設定部202から入力されるモード情報の1ビット目の値が「0」である場合には、接続をオフとして信号を出力しないが、等価な表現として、実質的には、値がすべてゼロの信号(ゼロ信号)が、コアレイヤ復号S信号として第1拡張レイヤ復号部204へ出力される。モード設定部202から入力されるモード情報の1ビット目の値が「1」である場合には、ステレオ復号部233から入力されるコアレイヤ復号S信号を第1拡張レイヤ復号部204に出力する。
図19は、第2拡張レイヤ復号部205の内部の主要な構成を示すブロック図である。なお、図17に示した第1拡張レイヤ復号部204、第2拡張レイヤ復号部205、および第3拡張レイヤ復号部206の内部の構成および動作は同様であり、入力信号および出力信号のみが相違するため、ここでは第2拡張レイヤ復号部205のみを例にとって説明する。
図19において、第2拡張レイヤ復号部205は、スイッチ251、モノラル復号部252、ステレオ復号部253、スイッチ254、加算器255、スイッチ256、および加算器257を備える。
スイッチ251は、モード設定部202から入力されるモード情報の3ビット目の値が「0」である場合には、分離部201から第2拡張レイヤ符号化情報として入力されるモノラル符号化情報をモノラル復号部252に出力する。また、スイッチ251は、モード設定部202から入力されるモード情報の3ビット目の値が「1」である場合には、分離部201から第2拡張レイヤ符号化情報として入力されるステレオ符号化情報をステレオ復号部253に出力する。
モノラル復号部252は、スイッチ251から入力されるモノラル符号化情報を用いてモノラル復号を行い、得られるM信号に関する第1拡張レイヤ符号化歪みをスイッチ254に出力する。なお、モノラル復号部252の内部の構成および動作は図11に示したモノラル復号部303と同様であるため、ここでは詳細な説明を省略する。
ステレオ復号部253は、スイッチ251から入力されるステレオ符号化情報を用いてステレオ復号を行い、得られるM信号に関する第1拡張レイヤ符号化歪みをスイッチ254に出力し、S信号に関する第1拡張レイヤ符号化歪みを加算器257に出力する。なお、ステレオ復号部253の内部の構成および動作は図16に示したステレオ復号部306と同様であるため、ここでは詳細な説明を省略する。
スイッチ254は、モード設定部202から入力されるモード情報の3ビット目の値が「0」である場合には、モノラル復号部252から入力されるM信号に関する第1拡張レイヤ符号化歪みを加算器255に出力する。また、スイッチ254は、モード設定部202から入力されるモード情報の3ビット目の値が「1」である場合には、ステレオ復号部253から入力されるM信号に関する第1拡張レイヤ符号化歪みを加算器255に出力する。
加算器255は、スイッチ254から入力されるM信号に関する第1拡張レイヤ符号化歪みと、第1拡張レイヤ復号部204から入力される第1拡張レイヤ復号M信号とを加算し、加算結果を第2拡張レイヤ復号M信号として第3拡張レイヤ復号部206に出力する。
加算器257は、ステレオ復号部253から入力されるS信号に関する第1拡張レイヤ符号化歪みと、第1拡張レイヤ復号部204から入力される第1拡張レイヤ復号S信号とを加算し、加算結果をスイッチ256に出力する。
スイッチ256は、モード設定部202から入力されるモード情報の2ビット目の値が「0」である場合には、第1拡張レイヤ復号部204から入力される第1拡張レイヤ復号S信号をそのまま第2拡張レイヤ復号S信号として第3拡張レイヤ復号部206へ出力する。また、スイッチ256は、モード設定部202から入力されるモード情報の2ビット目の値が「1」である場合には、加算器257から入力される加算結果を、第2拡張レイヤ復号S信号として第3拡張レイヤ復号部206へ出力する。
このように、本実施の形態によれば、ステレオ信号のL信号とR信号とから算出されるモノラル信号(M信号)とサイド信号(S信号)に対してスケーラブル符号化を行うため、L信号とR信号との相関を利用したスケーラブル符号化を行うことができ、また本実施の形態によれば、モード情報に基づきスケーラブル符号化の各レイヤの符号化モードを設定するため、モノラル符号化を行うレイヤとステレオ符号化を行うレイヤとを設定することができ、符号化精度の制御の自由度を向上することができる。
また、本実施の形態によれば、同一周波数のスペクトルが隣り合うようにM信号スペク
トルとS信号スペクトルとを統合して符号化するため、ステレオ符号化において特別な判断や場合分けを必要としない自動的なビットアロケーションを行うことができ、L信号とR信号とにおける情報の重要性に応じた効率的な符号化を行うことができる。
(実施の形態2)
図20は、本発明の実施の形態2に係るステレオ信号符号化装置110の主要な構成を示すブロック図である。図20に示すステレオ信号符号化装置110は、図1に示したステレオ信号符号化装置100と基本的に同様な構成を有し、基本的に同様な動作を行う。このため、図1と図20とで、互いに同じ動作を行う部位の符号には、図20の方の部位の符号にaを付加する。例えば、図1の和差計算部101に対応する図20における部位は、和差計算部101aと表す。なお、図20のステレオ信号符号化装置110は、モード設定部112〜114をさらに具備する点において、図1のステレオ信号符号化装置100と相違する。また、図20のステレオ信号符号化装置110におけるモード設定部111は、図1のステレオ信号符号化装置100におけるモード設定部102と入力信号及び動作が相違するため、異なる符号を付す。ただし、図20に示したモード設定部111〜114の内部の構成および動作は同様であり、入力信号および出力信号のみが相違するため、ここではモード設定部111のみを例にとって説明する。
モード設定部111は、和差計算部101aから入力されるM信号およびS信号のそれぞれのパワを算出し、算出したパワと予め設定された条件式とに基づいて、M信号に関する情報のみを符号化するモノラル符号化モード、またはM信号に関する情報およびS信号に関する情報の両方を符号化するステレオ符号化モードを設定する。例えば、S信号のパワがM信号のパワより大きい場合にはステレオ符号化モードを設定し、S信号のパワがM信号のパワより小さい場合にはモノラル符号化モードを設定する。また、M信号及びS信号共にパワが小さい場合はモノラル符号化モードを設定する。これは、符号器を設計する際、1つの信号を符号化するモノラル信号の符号器よりも、2つの信号を扱うステレオ信号の符号器の方が、ビットレートが高くなるということを考慮している。なお、設定されたモード情報は、コアレイヤ符号化部103aおよび多重化部107aに出力される。
モード設定部111におけるパワ算出は、下記の式(11)及び式(12)の計算により行われる。
Figure 0005340261
式(11)及び式(12)において、iは各信号のサンプル番号を示し、PowMはM信号のパワを示し、MはM信号を示す。また、PowSはS信号のパワを示し、SはS信号を示す。
モード設定部111において予め設定された条件式を下記の式(13)に示す。
Figure 0005340261
式(13)において、αは全パワ判定定数であり、聴覚的に認知されない信号のパワの
上限値が設定されればよい。また、βはS信号パワ判定定数であり、S信号パワ判定定数βの算出方法については後述する。また、mはモードを示す。なお、全パワ判定定数α及びS信号パワ判定定数βはROM等に格納される。
S信号パワ判定定数βについては、L信号とR信号とのうち符号化歪みが少ない方を選択することにすると、モード設定部111〜114においてそれぞれ異なるβを統計的に計算して格納する方法が挙げられる。以下、S信号パワ判定定数βの具体的な算出方法について説明する。
ここでは、モード設定部111におけるS信号パワ判定定数βの算出方法について説明する。まず、多数のステレオ音声データをモード設定部111に学習用として入力し、M信号のパワとS信号のパワとの比を下記の式(14)により求める。
Figure 0005340261
式(14)において、iは各信号のサンプル番号を示し、jは学習用のステレオ音声データの番号を示す。また、MはM信号を示し、SはS信号を示す。また、PowMはj番目の学習用ステレオ音声データのM信号のパワを示し、PowSはj番目の学習用ステレオ音声データのS信号のパワを示す。
次に、コアレイヤ符号化部103aにおいて2つのモードで符号化及び復号化して得られた復号M信号及び復号S信号にダウンミックスの反対処理を行い、復号L信号及び復号R信号を求める。求めた復号L信号及び復号R信号のそれぞれのS/N比(すなわち、ステレオ信号符号化装置110に入力されたL信号とR信号との符号化歪みをノイズとしたときのS/N比)の和E 、E を求める。
次に、βの値を0〜1.0程度まで少しずつ変化させ、下記の式(15)に示す総合S/N比Eβを求める。
Figure 0005340261
上記Eβが最大になるときのβが求める値である。この値をモード設定部111に格納し、S信号パワ判定定数βとして用いる。各モード設定部112〜114においても、モード設定部111と同様に、S信号パワ判定定数βを求めて格納する。
なお、本発明の実施の形態2に係るステレオ信号復号装置は、実施の形態1の図17に示した構成と同様であるため、ここでは詳細な説明を省略する。
このように、本実施の形態によれば、各レイヤにおける符号化処理が進むにつれ、音声の局所的特徴に基づきスケーラブル符号化の各レイヤの符号化モードを設定するため、モノラル符号化を行うレイヤとステレオ符号化を行うレイヤとを自動的に設定することができ、高品質な復号信号を得ることができる。また、モード毎にビットレートが異なる場合
には、伝送レート制御が自動的に行われ、情報ビット数を節約することができる。
以上、本発明の各実施の形態について説明した。
なお、上記各実施の形態では、ステレオ信号を主として音声信号として説明したが、オーディオ信号としても同様であることは言うまでもない。
また、上記各実施の形態では、統合部353が同一周波数のスペクトルが隣り合うようにM信号スペクトルとS信号スペクトルとを統合する場合を例にとって説明したが、本発明はこれに限定されず、統合部353においては単純にS信号スペクトルをM信号スペクトルの前か後に隣接して配置する統合を行っても良い。
また、上記各実施の形態では、左チャネル信号、右チャネル信号という名称を用いて2つのステレオ信号を表したが、より一般的な第1チャネル信号、第2チャネル信号という名称を用いることもできる。また、ビットの値「0」、「1」と符号化モード「モノラル符号化モード」、「ステレオ符号化モード」との対応も限定されない。
また、上記各実施の形態では、本発明をサンプリングレート16kHz、フレーム長を20msの仕様に適用する場合を例にとって説明したが、本発明はこれに限定されず、サンプリングレートが8kHz、24kHz、32kHz、44.1kHz、48kHzなどであり、フレーム長が10ms、30ms、40msなどであるほかの仕様にも本発明を適用できる。本発明はサンプリングレートやフレーム長に依存しない。
また、上記各実施の形態では、スケーラブル符号化を4レイヤの構成にしたが、本発明はこれに限定されず、レイヤ数は4でなくても良い。本発明はレイヤ数に依存しない。
また、上記各実施の形態では、音源信号のスペクトルの符号化にパルスによる符号化を用いる場合を例にとって説明したが、本発明はこれに限定されず、音源信号のスペクトルの符号化にVQ、予測VQ、スプリットVQ、多段VQ、帯域拡張技術、チャネル間予測符号化などを用いても良い。本発明はスペクトルの符号化形態に依存しない。
また、上記各実施の形態では、ステレオ信号を符号化して符号化情報を伝送する場合を例にとって説明したが、本発明はこれに限定されず、符号化情報を記録媒体に格納しても良い。例えば、オーディオ信号の符号化情報をメモリやディスクに蓄積して用いる場合が多く、本発明はこのような場合にも有効である。本発明は符号化情報を伝送するか蓄積するかには依存しない。
また、上記各実施の形態では、ステレオ信号が2チャネルの信号からなる場合を例にとって説明したが、本発明はこれに限定されず、ステレオ信号は5.1chなどの多チャネルからなっても良い。
また、上記各実施の形態では、M信号とS信号とのスペクトルの大きさのみを距離尺度として符号化を行う場合について説明したが、本発明はこれに限定されず、M信号とS信号との位相差や、エネルギ比を距離尺度として符号化を行っても良い。本発明はスペクトル符号化に用いる距離尺度に依存しない。
また、上記各実施の形態では、ステレオ信号復号装置は、ステレオ信号符号化装置が送信したビットストリームを受信して処理を行うとして説明したが、本発明はこれに限定されず、ステレオ信号復号装置が受信し処理するビットストリームは、この復号装置で処理可能なビットストリームを生成可能な符号化装置が送信したものであれば良い。
また、本発明に係るステレオ信号符号化装置およびステレオ信号復号装置は、移動体通信システムにおける通信端末装置および基地局装置に搭載することが可能であり、これにより上記と同様の作用効果を有する通信端末装置、基地局装置、および移動体通信システムを提供することができる。
また、ここでは、本発明をハードウェアで構成する場合を例にとって説明したが、本発明をソフトウェアで実現することも可能である。例えば、本発明に係るアルゴリズムをプログラミング言語によって記述し、このプログラムをメモリに記憶しておいて情報処理手段によって実行させることにより、本発明に係るステレオ信号符号化装置と同様の機能を実現することができる。
また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されても良いし、一部または全てを含むように1チップ化されても良い。
また、ここではLSIとしたが、集積度の違いによって、IC、システムLSI、スーパーLSI、ウルトラLSI等と呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現しても良い。LSI製造後に、プログラム化することが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続もしくは設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
さらに、半導体技術の進歩または派生する別技術により、LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行っても良い。バイオ技術の適用等が可能性としてあり得る。
2008年3月19日出願の特願2008−72497及び2008年10月24日出願の特願2008−274536の日本出願に含まれる明細書、図面及び要約書の開示内容は、すべて本願に援用される。
本発明は、音声信号やオーディオ信号を符号化する符号化装置、および符号化された信号を復号する復号装置等に用いるに好適である。
本発明の実施の形態1に係るステレオ信号符号化装置の主要な構成を示すブロック図 本発明の実施の形態1に係るコアレイヤ符号化部の内部の主要な構成を示すブロック図 本発明の実施の形態1に係るコアレイヤ符号化部がモノラル符号化モードに設定された場合の動作を説明するための図 本発明の実施の形態1に係るコアレイヤ符号化部がステレオ符号化モードに設定された場合の動作を説明するための図 本発明の実施の形態1に係るモノラル符号化部の内部の主要な構成を示すブロック図 本発明の実施の形態1に係る区間探索部の探索アルゴリズムを示すフロー図 本発明の実施の形態1に係る区間探索部において探索されたパルスで表現されたスペクトルの例を示す図 本発明の実施の形態1に係る全体探索部の探索アルゴリズムの前処理を示すフロー図 本発明の実施の形態1に係る全体探索部の探索アルゴリズムの本探索を示すフロー図 本発明の実施の形態1に係る区間探索部および全体探索部で探索されたパルスで表現されたスペクトルの例を示す図 本発明の実施の形態1に係るモノラル復号部の内部の主要な構成を示すブロック図 本発明の実施の形態1に係るスペクトル復号部の復号アルゴリズムを示すフロー図 本発明の実施の形態1に係るステレオ符号化部の内部の主要な構成を示すブロック図 本発明の実施の形態1に係る統合部においてM信号スペクトルとS信号スペクトルとを統合する様子を示す図 本発明の実施の形態1に係るスペクトル符号化部のビットアロケーションについて説明するための図 本発明の実施の形態1に係るステレオ復号部の内部の主要な構成を示すブロック図 本発明の実施の形態1に係るステレオ信号復号装置の主要な構成を示すブロック図 本発明の実施の形態1に係るコアレイヤ復号部の内部の主要な構成を示すブロック図 本発明の実施の形態1に係る第2拡張レイヤ復号部の内部の主要な構成を示すブロック図 本発明の実施の形態2に係るステレオ信号符号化装置の主要な構成を示すブロック図

Claims (13)

  1. ステレオ信号を構成する第1チャネル信号と第2チャネル信号との和に関するモノラル信号を生成し、前記第1チャネル信号と前記第2チャネル信号との差に関するサイド信号を生成する和差計算手段と、
    モノラル符号化またはステレオ符号化のいずれかの符号化モードを示すモード情報をレイヤ毎に生成するモード情報生成手段と、
    前記モード情報に基づき、前記モノラル信号に関する情報を用いて第i(i=1,2,…,N、Nは2以上の整数)レイヤのモノラル符号化を行うか、または前記モノラル信号に関する情報と前記サイド信号に関する情報との両方を用いて第iレイヤのステレオ符号化を行い、第iレイヤ符号化情報を得る第1から第Nレイヤ符号化手段と、
    を具備するステレオ信号符号化装置。
  2. 前記モード情報生成手段は、
    各ビットそれぞれを用いて前記符号化モードを示すNビットの前記モード情報を生成し、
    前記第iレイヤ符号化手段は、
    前記モード情報の第iビットの値に基づき、前記第iレイヤのモノラル符号化または前記第iレイヤのステレオ符号化を行う、
    請求項1記載のステレオ信号符号化装置。
  3. 前記第1レイヤ符号化手段は、
    前記モード情報の第1ビットの値がモノラル符号化を示す場合には、前記モノラル信号を用いて第1レイヤのモノラル符号化を行い、モノラル信号に関する第1レイヤの符号化歪みと前記サイド信号とを前記第2レイヤ符号化手段に出力する第1レイヤモノラル符号化手段と、
    前記モード情報の第1ビットの値がステレオ符号化を示す場合には、前記モノラル信号と前記サイド信号との両方を用いて第1レイヤのステレオ符号化を行い、前記モノラル信号に関する第1レイヤの符号化歪みと、前記サイド信号に関する第1レイヤの符号化歪みとを前記第2レイヤ符号化手段に出力する第1レイヤステレオ符号化手段と、
    を具備する請求項2記載のステレオ信号符号化装置。
  4. 前記第n(n=2,3,…,N−1)レイヤ符号化手段は、
    前記モード情報の第nビットの値がモノラル符号化を示す場合には、前記モノラル信号に関する情報を用いて第nレイヤのモノラル符号化を行い、モノラル信号に関する第nレイヤの符号化歪みと、前記第n−1レイヤ符号化手段から入力された前記サイド信号に関する情報とを第n+1レイヤ符号化手段に出力する第nレイヤモノラル符号化手段と、
    前記モード情報の第nビットの値がステレオ符号化を示す場合には、前記モノラル信号に関する情報と前記サイド信号に関する情報との両方を用いて第nレイヤのステレオ符号化を行い、前記モノラル信号に関する第nレイヤの符号化歪みと前記サイド信号に関する第nレイヤの符号化歪みとを前記第n+1レイヤ符号化手段に出力する第nレイヤステレオ符号化手段と、
    を具備する請求項3記載のステレオ信号符号化装置。
  5. 前記第Nレイヤ符号化手段は、
    前記モード情報の第Nビットの値がモノラル符号化を示す場合には、前記モノラル信号に関する情報を用いて第Nレイヤのモノラル符号化を行う第Nレイヤモノラル符号化手段と、
    前記モード情報の第Nビットの値がステレオ符号化を示す場合には、前記モノラル信号に関する情報と前記サイド信号に関する情報とを用いて第Nレイヤのステレオ符号化を行
    う第Nレイヤステレオ符号化手段と、
    を具備する請求項4記載のステレオ信号符号化装置。
  6. 前記第iレイヤステレオ符号化手段は、
    前記モノラル信号に関する情報を周波数領域に変換して第1スペクトルを得る第1変換手段と、
    前記サイド信号に関する情報を周波数領域に変換して第2スペクトルを得る第2変換手段と、
    前記第1スペクトルと、前記第2スペクトルとを統合して統合スペクトルを得る統合手段と、
    前記統合スペクトルに対してスペクトル符号化を行うスペクトル符号化手段と、
    を具備する請求項5記載のステレオ信号符号化装置。
  7. 前記統合手段は、
    同一周波数のスペクトルが隣り合うように前記第1スペクトルと、前記第2スペクトルとを統合する、
    請求項6記載のステレオ信号符号化装置。
  8. 前記統合手段は、
    前記第1スペクトルを前記第2スペクトルの前か後に隣接して統合する、
    請求項6記載のステレオ信号符号化装置。
  9. 前記モード情報生成手段は、
    前記第iレイヤ符号化手段に入力される前記モノラル信号と前記サイド信号とを用いて、第i+1レイヤに適用する前記モード情報を生成する、
    請求項1記載のステレオ信号符号化装置。
  10. 前記モード情報生成手段は、
    前記第iレイヤ符号化手段に入力される前記モノラル信号のパワと前記サイド信号のパワとを算出し、算出したパワの相対関係に応じたモード情報を生成する、
    請求項9記載のステレオ信号符号化装置。
  11. ステレオ信号を構成する第1チャネル信号と第2チャネル信号とを用いた符号化を行うステレオ信号符号化装置の第i(i=1,2,…,N、Nは2以上の整数)レイヤの符号化処理においてモノラル符号化またはステレオ符号化のいずれかを行ったかを示すモード情報と、前記第1から第Nレイヤの符号化処理により得られた第1から第Nレイヤ符号化情報と、を受信する受信手段と、
    前記モード情報に基づき、前記第iレイヤ符号化情報を用いてモノラル復号またはステレオ復号を行い、前記第1チャネル信号と前記第2チャネル信号との和に関するモノラル信号の第iレイヤの復号結果と、前記第1チャネル信号と前記第2チャネル信号との差に関するサイド信号の第iレイヤの復号結果とを得る第1から第Nレイヤ復号手段と、
    前記モノラル信号の第Nレイヤの復号結果と、前記サイド信号の第Nレイヤの復号結果とを用いて、第1チャネル復号信号と第2チャネル復号信号とを算出する和差計算手段と、
    を具備するステレオ信号復号装置。
  12. ステレオ信号を構成する第1チャネル信号と第2チャネル信号との和に関するモノラル信号を生成し、前記第1チャネル信号と前記第2チャネル信号との差に関するサイド信号を生成するステップと、
    モノラル符号化またはステレオ符号化のいずれかの符号化モードを示すモード情報をレ
    イヤ毎に生成するステップと、
    前記モード情報に基づき、前記モノラル信号に関する情報を用いて第i(i=1,2,…,N、Nは2以上の整数)レイヤのモノラル符号化を行うか、または前記モノラル信号に関する情報と前記サイド信号に関する情報との両方を用いて第iレイヤのステレオ符号化を行い、第iレイヤ符号化情報を得るステップと、
    を有するステレオ信号符号化方法。
  13. ステレオ信号を構成する第1チャネル信号と第2チャネル信号とを用いた符号化を行うステレオ信号符号化装置の第i(i=1,2,…,N、Nは2以上の整数)レイヤの符号化処理においてモノラル符号化またはステレオ符号化のいずれかを行ったかを示すモード情報と、前記第1から第Nレイヤの符号化処理により得られた第1から第Nレイヤ符号化情報と、を受信するステップと、
    前記モード情報に基づき、前記第iレイヤ符号化情報を用いてモノラル復号またはステレオ復号を行い、前記第1チャネル信号と前記第2チャネル信号との和に関するモノラル信号の第iレイヤの復号結果と、前記第1チャネル信号と前記第2チャネル信号との差に関するサイド信号の第iレイヤの復号結果とを得るステップと、
    前記モノラル信号の第Nレイヤの復号結果と、前記サイド信号の第Nレイヤの復号結果とを用いて、第1チャネル復号信号と第2チャネル復号信号とを算出するステップと、
    を有するステレオ信号復号方法。
JP2010503779A 2008-03-19 2009-03-18 ステレオ信号符号化装置、ステレオ信号復号装置およびこれらの方法 Expired - Fee Related JP5340261B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010503779A JP5340261B2 (ja) 2008-03-19 2009-03-18 ステレオ信号符号化装置、ステレオ信号復号装置およびこれらの方法

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
JP2008072497 2008-03-19
JP2008072497 2008-03-19
JP2008274536 2008-10-24
JP2008274536 2008-10-24
PCT/JP2009/001206 WO2009116280A1 (ja) 2008-03-19 2009-03-18 ステレオ信号符号化装置、ステレオ信号復号装置およびこれらの方法
JP2010503779A JP5340261B2 (ja) 2008-03-19 2009-03-18 ステレオ信号符号化装置、ステレオ信号復号装置およびこれらの方法

Publications (2)

Publication Number Publication Date
JPWO2009116280A1 JPWO2009116280A1 (ja) 2011-07-21
JP5340261B2 true JP5340261B2 (ja) 2013-11-13

Family

ID=41090695

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010503779A Expired - Fee Related JP5340261B2 (ja) 2008-03-19 2009-03-18 ステレオ信号符号化装置、ステレオ信号復号装置およびこれらの方法

Country Status (4)

Country Link
US (1) US8386267B2 (ja)
EP (1) EP2254110B1 (ja)
JP (1) JP5340261B2 (ja)
WO (1) WO2009116280A1 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PT2827327T (pt) 2007-04-29 2020-08-27 Huawei Tech Co Ltd Método para codificação de impulsos de excitação
WO2009142017A1 (ja) * 2008-05-22 2009-11-26 パナソニック株式会社 ステレオ信号変換装置、ステレオ信号逆変換装置およびこれらの方法
US8452587B2 (en) * 2008-05-30 2013-05-28 Panasonic Corporation Encoder, decoder, and the methods therefor
JP5544371B2 (ja) * 2009-10-14 2014-07-09 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
EP2357649B1 (en) * 2010-01-21 2012-12-19 Electronics and Telecommunications Research Institute Method and apparatus for decoding audio signal
EP2375410B1 (en) 2010-03-29 2017-11-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. A spatial audio processor and a method for providing spatial parameters based on an acoustic input signal
US9508356B2 (en) * 2010-04-19 2016-11-29 Panasonic Intellectual Property Corporation Of America Encoding device, decoding device, encoding method and decoding method
CN102299760B (zh) 2010-06-24 2014-03-12 华为技术有限公司 脉冲编解码方法及脉冲编解码器
CN103460282B (zh) * 2010-08-25 2015-08-19 弗兰霍菲尔运输应用研究公司 用于利用传送的相位信息产生去相关信号的装置
CN110223701B (zh) 2012-08-03 2024-04-09 弗劳恩霍夫应用研究促进协会 用于从缩混信号产生音频输出信号的解码器和方法
GB2524333A (en) 2014-03-21 2015-09-23 Nokia Technologies Oy Audio signal payload
EP3332557B1 (en) 2015-08-07 2019-06-19 Dolby Laboratories Licensing Corporation Processing object-based audio signals
JP6721977B2 (ja) * 2015-12-15 2020-07-15 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 音声音響信号符号化装置、音声音響信号復号装置、音声音響信号符号化方法、及び、音声音響信号復号方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06289900A (ja) * 1993-04-01 1994-10-18 Mitsubishi Electric Corp オーディオ符号化装置
JPH11317672A (ja) * 1997-11-20 1999-11-16 Samsung Electronics Co Ltd ビット率の調節可能なステレオオーディオ符号化/復号化方法及び装置
JP2003330497A (ja) * 2002-05-15 2003-11-19 Matsushita Electric Ind Co Ltd オーディオ信号の符号化方法及び装置、符号化及び復号化システム、並びに符号化を実行するプログラム及び当該プログラムを記録した記録媒体
JP2005080063A (ja) * 2003-09-02 2005-03-24 Nippon Telegr & Teleph Corp <Ntt> 多段音声画像符号化方法、その装置及びプログラム及びこのプログラムを記録した記録媒体
WO2006118179A1 (ja) * 2005-04-28 2006-11-09 Matsushita Electric Industrial Co., Ltd. 音声符号化装置および音声符号化方法
WO2006129615A1 (ja) * 2005-05-31 2006-12-07 Matsushita Electric Industrial Co., Ltd. スケーラブル符号化装置およびスケーラブル符号化方法

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3335605B2 (ja) 2000-03-13 2002-10-21 日本電信電話株式会社 ステレオ信号符号化方法
US7787632B2 (en) * 2003-03-04 2010-08-31 Nokia Corporation Support of a multichannel audio extension
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
DE602005005640T2 (de) * 2004-03-01 2009-05-14 Dolby Laboratories Licensing Corp., San Francisco Mehrkanalige audiocodierung
SE0400997D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Efficient coding of multi-channel audio
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
WO2006059567A1 (ja) 2004-11-30 2006-06-08 Matsushita Electric Industrial Co., Ltd. ステレオ符号化装置、ステレオ復号装置、およびこれらの方法
EP1905002B1 (en) * 2005-05-26 2013-05-22 LG Electronics Inc. Method and apparatus for decoding audio signal
EP1912206B1 (en) 2005-08-31 2013-01-09 Panasonic Corporation Stereo encoding device, stereo decoding device, and stereo encoding method
EP1946310A4 (en) * 2005-10-26 2011-03-09 Lg Electronics Inc METHOD FOR CODING AND DECODING A MULTI CHANNEL AUDIO SIGNAL AND DEVICE THEREFOR
JP5025485B2 (ja) 2005-10-31 2012-09-12 パナソニック株式会社 ステレオ符号化装置およびステレオ信号予測方法
KR100852223B1 (ko) * 2006-02-03 2008-08-13 한국전자통신연구원 멀티채널 오디오 신호 시각화 장치 및 방법
JPWO2007116809A1 (ja) 2006-03-31 2009-08-20 パナソニック株式会社 ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法
EP2048658B1 (en) 2006-08-04 2013-10-09 Panasonic Corporation Stereo audio encoding device, stereo audio decoding device, and method thereof
JPWO2008016098A1 (ja) 2006-08-04 2009-12-24 パナソニック株式会社 ステレオ音声符号化装置、ステレオ音声復号装置およびこれらの方法
MY145497A (en) * 2006-10-16 2012-02-29 Dolby Sweden Ab Enhanced coding and parameter representation of multichannel downmixed object coding
US20100100372A1 (en) 2007-01-26 2010-04-22 Panasonic Corporation Stereo encoding device, stereo decoding device, and their method
US20100121633A1 (en) 2007-04-20 2010-05-13 Panasonic Corporation Stereo audio encoding device and stereo audio encoding method
JPWO2008132850A1 (ja) 2007-04-25 2010-07-22 パナソニック株式会社 ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法
JP5153791B2 (ja) * 2007-12-28 2013-02-27 パナソニック株式会社 ステレオ音声復号装置、ステレオ音声符号化装置、および消失フレーム補償方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06289900A (ja) * 1993-04-01 1994-10-18 Mitsubishi Electric Corp オーディオ符号化装置
JPH11317672A (ja) * 1997-11-20 1999-11-16 Samsung Electronics Co Ltd ビット率の調節可能なステレオオーディオ符号化/復号化方法及び装置
JP2003330497A (ja) * 2002-05-15 2003-11-19 Matsushita Electric Ind Co Ltd オーディオ信号の符号化方法及び装置、符号化及び復号化システム、並びに符号化を実行するプログラム及び当該プログラムを記録した記録媒体
JP2005080063A (ja) * 2003-09-02 2005-03-24 Nippon Telegr & Teleph Corp <Ntt> 多段音声画像符号化方法、その装置及びプログラム及びこのプログラムを記録した記録媒体
WO2006118179A1 (ja) * 2005-04-28 2006-11-09 Matsushita Electric Industrial Co., Ltd. 音声符号化装置および音声符号化方法
WO2006129615A1 (ja) * 2005-05-31 2006-12-07 Matsushita Electric Industrial Co., Ltd. スケーラブル符号化装置およびスケーラブル符号化方法

Also Published As

Publication number Publication date
EP2254110A4 (en) 2012-12-05
JPWO2009116280A1 (ja) 2011-07-21
US20110004466A1 (en) 2011-01-06
RU2010138572A (ru) 2012-03-27
US8386267B2 (en) 2013-02-26
WO2009116280A1 (ja) 2009-09-24
EP2254110A1 (en) 2010-11-24
EP2254110B1 (en) 2014-04-30

Similar Documents

Publication Publication Date Title
JP5340261B2 (ja) ステレオ信号符号化装置、ステレオ信号復号装置およびこれらの方法
KR101414354B1 (ko) 부호화 장치 및 부호화 방법
JP4963962B2 (ja) マルチチャネル信号符号化装置およびマルチチャネル信号復号装置
KR101363793B1 (ko) 부호화 장치, 복호 장치 및 그 방법
EP1791116B1 (en) Scalable voice encoding apparatus, scalable voice decoding apparatus, scalable voice encoding method, scalable voice decoding method, communication terminal apparatus, and base station apparatus
US8306007B2 (en) Vector quantizer, vector inverse quantizer, and methods therefor
EP2209114B1 (en) Speech coding/decoding apparatus/method
EP2016583B1 (en) Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream
JP5404412B2 (ja) 符号化装置、復号装置およびこれらの方法
WO2009081568A1 (ja) 符号化装置、復号装置および符号化方法
JP5190445B2 (ja) 符号化装置および符号化方法
JP6289613B2 (ja) オブジェクト特有時間/周波数分解能を使用する混合信号からのオーディオオブジェクト分離
KR101414341B1 (ko) 부호화 장치 및 부호화 방법
US8438020B2 (en) Vector quantization apparatus, vector dequantization apparatus, and the methods
EP2439736A1 (en) Down-mixing device, encoder, and method therefor
WO2009125588A1 (ja) 符号化装置および符号化方法
WO2008053970A1 (fr) Dispositif de codage de la voix, dispositif de décodage de la voix et leurs procédés
JP2011008250A (ja) ビット率拡張音声符号化及び復号化装置とその方法
WO2011052221A1 (ja) 符号化装置、復号装置、およびそれらの方法
RU2484542C2 (ru) Устройство кодирования стереофонических сигналов, устройство декодирования стереофонических сигналов и реализуемые ими способы
Petermann et al. Native Multi-Band Audio Coding Within Hyper-Autoencoded Reconstruction Propagation Networks
Ozaydin Residual Lsf Vector Quantization Using Arma Prediction

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120220

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130716

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130806

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees