WO2006041055A1

WO2006041055A1 - スケーラブル符号化装置、スケーラブル復号装置及びスケーラブル符号化方法

Info

Publication number: WO2006041055A1
Application number: PCT/JP2005/018693
Authority: WO
Inventors: Masahiro Oshikiri
Original assignee: Matsushita Electric Industrial Co., Ltd.
Priority date: 2004-10-13
Filing date: 2005-10-11
Publication date: 2006-04-20
Also published as: EP1801785A4; CN101044554A; BRPI0518133A; US8010349B2; JP4606418B2; EP1801785A1; KR20070070174A; JPWO2006041055A1; US20070253481A1

Abstract

　第２レイヤでの符号化効率を改善すると共に、第２レイヤでの符号化信号を用いて復号した原信号の品質を向上させることができるスケーラブル符号化装置等を提供する。この装置において、予測係数符号化部（２０５）は、予測係数の候補が記録された予測係数符号帳を具備し、この予測係数符号帳を探索して、スケールファクタ算出部（２０２）から入力されてくる第１レイヤ復号信号のスケールファクタに乗じることにより、その乗算結果をスケールファクタ算出部（２０４）から入力されてくる原信号のスケールファクタに最も近似させる予測係数を決定し、決定した予測係数を符号化して、その符号化コードを多重化部と予測係数復号化部（２０６）とにそれぞれ入力する。

Description

スケーラブル符号化装置、スケーラブル復号装置及びスケーラブル符号化方法

技術分野

[0001] 本発明は、音声信号等を階層化して符号化するスケーラブル符号化装置等に関する。

背景技術

[0002] 従来、移動体通信システムでは、電波資源等の有効利用のために、音声信号を低ビットレートで圧縮することが要求されている。その一方で、通話音声の品質向上や臨場感の高い通話サービスの実現も望まれており、その実現には、音声信号の高品質ィ匕のみならず、より帯域の広いオーディオ信号等の音声成分以外の信号成分も高品質に符号ィ匕する必要がある。

[0003] このような相反する要求を共に満たす手段として、複数の符号ィ匕技術を階層的に統合するアプローチが有望視されている。具体的には、音声信号に特ィ匕したモデルで音声成分を低ビットレートで符号化する第 1レイヤ符号化部と、音声成分以外の信号成分をより汎用的なモデルで符号化する第 2レイヤ符号化部と、を組み合わせるァブローチが検討されている。このような階層的符号ィ匕方式は、符号化されたビットストリームがスケーラビリティ性 (ビットストリームの一部の情報力もでも復号信号が得られる特性)を有するため、スケーラブル符号ィ匕方式と呼ばれる。

[0004] スケーラブル符号ィ匕方式は、その性質から、ビットレートの異なるネットワーク間の通信に柔軟に対応できる。この特徴は、 IPプロトコルで多様なネットワークが統合されていく今後のネットワーク環境に適したものであると言える。

[0005] スケーラブル符号化の実現手段として、 MPEG— 4 (Moving Picture Experts Grou p phase-4)で規格ィ匕された技術を用いる手段が知られて、る（例えば非特許文献 1 参照)。非特許文献 1に記載の技術では、音声信号に特化した代表的な符号化方式である CELP (Code Excited Linear Prediction :符号励信線形予測）方式を第 1レイヤに適用し、原信号から第 1レイヤ復号信号を減じた残差信号に対してより汎用的な符号化モデルである AAC (Advanced Audio Coder)方式又は TwinVQ (Transform Do main Weighted Interleave Vector Quantization :周波数領域重み付きインターリーブベクトル量子化)方式を第 2レイヤに適用する。この第 2レイヤに適用される 2つの方式は、異なる方式であるものの、基本的には MDCT (Modified Discrete Cosine Tran sform；変形離散コサイン変換)係数の量子化を行う際にスペクトルの大ま力な形状を表すスペクトル概形情報と、残りの細かなスペクトル形状を表すスペクトル微細情報と、に分離し、それぞれ符号化する点で共通する。

非特許文献 1 :三木弼ー編著、「MPEG— 4のすベて」、初版、（株)工業調査会、 19 98年 9月 30日、 p. 126 - 127

発明の開示

発明が解決しょうとする課題

[0006] し力しながら、非特許文献 1に記載の技術では、第 2レイヤにぉ、て、入力信号である原信号からその第 1レイヤ復号信号を減じて得られる残差信号に対して符号ィ匕が行われることになる。このような残差信号の特性は、第 1レイヤ部を介することにより原信号に含まれる主要な情報が取り除かれるため、雑音系列に近い特性となる。このため、非特許文献 1に記載の技術では、第 2レイヤでの符号ィ匕効率が低下すると共に、第 2レイヤでの符号ィヒ信号を用いて原信号を復号しても、その原信号の品質が向上し難いという問題がある。

[0007] よって、本発明の目的は、第 2レイヤでの符号化効率を改善すると共に、第 2レイヤでの符号ィ匕信号を用いて復号した原信号の品質を向上させるスケーラブル符号ィ匕装置等を提供することである。

課題を解決するための手段

[0008] 本発明に係るスケーラブル符号ィ匕装置は、入力信号を符号ィ匕して下位レイヤ符号化パラメータを生成する下位レイヤ符号化手段と、前記下位レイヤ符号ィ匕パラメータを復号して下位レイヤ復号信号を生成する下位レイヤ復号ィヒ手段と、前記入力信号に基づいて前記入力信号のスぺ外ル概形を算出する第 1スペクトル概形算出手段と、前記下位レイヤ復号信号に基づヽて前記下位レイヤ復号信号のスペクトル概形を算出する第 2スぺ外ル概形算出手段と、前記下位レイヤ復号信号のスペクトル概形力前記入力信号のスペクトル概形を予測することにより予測情報を得、この予測情報を符号化して上位レイヤ符号化パラメータを生成する予測情報符号化手段と、前記下位レイヤ符号ィ匕パラメータと前記上位レイヤ符号ィ匕パラメータとを出力する出力手段と、を具備する構成を採る。

[0009] 本発明に係るスケーラブル復号装置は、入力信号をスケーラブル符号化するスケーラブル符号ィ匕装置によって生成された符号ィ匕パラメータを復号するスケーラブル復号装置であって、前記符号ィ匕パラメータを復号して下位レイヤ復号信号を生成する下位レイヤ復号化手段と、前記符号ィヒパラメータを復号することにより、前記入力信号のスぺ外ル概形を予測させる予測情報を生成する予測情報復号化手段と、前記下位レイヤ復号信号と前記予測情報とに基づいて前記入力信号のスペクトル概形を生成するスペクトル生成手段と、を具備する構成を採る。

発明の効果

[0010] 本発明によれば、予測情報符号化手段が、下位レイヤ復号信号のスペクトル概形力入力信号のスペクトル概形を予測させる予測情報を生成して符号ィ匕し、符号化された予測情報を上位レイヤ符号化パラメータとして出力するため、この上位レイヤ符号化パラメータの符号ィ匕効率を改善できると共に、この上位レイヤ符号ィ匕パラメータを用いて復号した入力信号の品質を高めることができる。

図面の簡単な説明

[0011] [図 1]実施の形態 1に係るスケーラブル符号ィ匕装置の主要な構成を示すブロック図 [図 2]実施の形態 1における第 2レイヤ符号ィ匕部の主要な構成を示すブロック図

[図 3]実施の形態 1における予測係数符号ィ匕部の主要な構成を示すブロック図

[図 4]実施の形態 1においてスペクトルとスペクトル概形との関係を説明する図

[図 5]実施の形態 1に係るスケーラブル復号装置の主要な構成を示すブロック図 [図 6]実施の形態 1における第 2レイヤ復号ィ匕部の主要な構成を示すブロック図

[図 7]実施の形態 1における予測係数符号ィ匕部の応用例を示すブロック図

[図 8]実施の形態 1における予測係数符号ィ匕部の応用例を示すブロック図

[図 9A]実施の形態 2において正弦波の符号ィ匕方式と生成されたスペクトルとの関係を説明する図 [図 9B]実施の形態 2において正弦波の符号ィ匕方式と生成されたスペクトルとの関係を説明する図

[図 9C]実施の形態 2において正弦波の符号ィ匕方式と生成されたスペクトルとの関係を説明する図

[図 10]実施の形態 2における第 2レイヤ符号ィ匕部の主要な構成を示すブロック図 [図 11]実施の形態 2におけるスペクトル平滑部の主要な構成を示すブロック図

[図 12]実施の形態 2に係るスケーラブル復号装置の主要な構成を示すブロック図 [図 13]実施の形態 2において MDCTによるスペクトルを平滑ィ匕する前後の態様を示す図

[図 14]実施の形態 3における第 2レイヤ符号ィ匕部の主要な構成を示すブロック図 [図 15]参考例に係る音声符号ィ匕装置における主要な構成要素の構成を示すブロック図

[図 16]参考例に係る音声復号装置における主要な構成要素の構成を示すブロック図

[図 17]実施の形態 2におけるスケールファクタの量子化性能を計算機シミュレーションにより算出した結果の一例を示す図

発明を実施するための最良の形態

[0012] 本発明は、スケーラブル符号ィ匕の第 2レイヤ符号ィ匕部において、入力信号である原信号のスペクトル形状を所定の周波数帯域毎に大まかに捉えたスペクトル概形と、第 1レイヤ復号信号のスペクトル概形と、の間に強い相関があることを利用して、第 1レィャ復号信号のスペクトル概形を用いて原信号のスペクトル概形を予測し、その予測情報を符号ィ匕することにより、入力信号の第 2レイヤ符号ィ匕パラメータを低ビットレート化するものである。

[0013] 以下、本発明の実施の形態について、図を参照しつつ詳細に説明する。なお、各実施の形態では、以下の前提条件の下で、入力信号がスケーラブル符号化されるものとする。

(1)第 1レイヤ（下位レイヤ）と第 2レイヤ (上位レイヤ）との 2階層。

(2)第 2レイヤの符号ィ匕では、周波数領域で符号化を行う (変換符号化)。 (3)第 2レイヤの符号ィ匕における変換方式には、 MDCTを使用する。

(4)第 2レイヤの符号ィ匕では、入力信号帯域を複数のサブバンド (周波数帯域）に分割し、各々のサブバンド単位で符号ィ匕する。

(5)第 2レイヤの符号ィ匕では、各サブバンドに含まれる MDCT係数は、スペクトル概形を表す情報と、スペクトル概形で表しきれな、サブバンド内の細かな MDCT係数の形状を表すスペクトル微細情報と、に分離して符号化される。

(6)第 2レイヤの符号ィ匕では、スペクトル概形を表す情報としてサブバンド毎の平均振幅を用いる。なお、このサブバンド平均振幅のことをスケールファクタと称する。

(7)第 2レイヤの符号ィ匕では、サブバンド分割は、臨界帯域に対応付けて行われ、 Barkスケールで等間隔に分割される。

[0014] (実施の形態 1)

図 1は、本発明の実施の形態 1に係るスケーラブル符号ィ匕装置 100の主要な構成を示すブロック図である。スケーラブル符号ィ匕装置 100は、第 1レイヤ符号ィ匕部 101、遅延部 102、第 1レイヤ復号ィ匕部 103、第 2レイヤ符号ィ匕部 104及び多重化部 105を具備する。

[0015] 第 1レイヤ符号ィ匕部 101は、図示しないマイクロフォン等力も入力されてくる音声信号の原信号を符号ィ匕して第 1レイヤ符号化パラメータを生成し、生成した第 1レイヤ符号化パラメータを第 1レイヤ復号ィ匕部 103及び多重化部 105にそれぞれ入力する

[0016] 遅延部 102は、第 1レイヤ符号ィ匕部 101と第 1レイヤ復号ィ匕部 103との間で生じる時間遅れを補正するため、入力された原信号に所定の長さの遅延を与え、遅延させた原信号を第 2レイヤ符号ィ匕部 104に入力する。

[0017] 第 1レイヤ復号ィ匕部 103は、第 1レイヤ符号ィ匕部 101から入力されてくる第 1レイヤ符号化パラメータを復号して第 1レイヤ復号信号を生成し、生成した第 1レイヤ復号信号を第 2レイヤ符号ィ匕部 104に入力する。

[0018] 第 2レイヤ符号ィ匕部 104は、第 1レイヤ復号ィ匕部 103から入力されてくる第 1レイヤ復号信号と、遅延部 102から入力されてくる所定時間遅延させた原信号と、に基づいて、第 1レイヤ復号信号のスペクトル概形力原信号のスペクトル概形を予測するために必要な予測係数を決定して符号ィ匕し、またこれらのスペクトル概形では表せな!/ヽスペクトル形状を表すために必要なスペクトル微細情報を生成して符号ィ匕し、これらの符号ィ匕パラメータを多重化部 105に入力する。なお、第 2レイヤ符号ィ匕部 104におけるこれらの符号化パラメータの具体的な生成態様については後述する。

[0019] 多重化部 105は、第 1レイヤ符号ィ匕部 101から入力されてくる第 1レイヤ符号化パラメータと、第 2レイヤ符号ィ匕部 104から入力されてくる符号ィ匕パラメータと、を多重してビットストリームとしてスケーラブル符号ィ匕装置 100の外部に出力する。従って、多重化部 105は、本発明における出力手段として機能する。

[0020] 図 2は、スケーラブル符号ィ匕装置 100における第 2レイヤ符号ィ匕部 104の主要な構成を示すブロック図である。第 2レイヤ符号ィ匕部 104は、 MDCT分析部 201、 203、スケールファクタ算出部 202、 204、予測係数符号ィ匕部 205、予測係数復号化部 20 6及びスペクトル微細情報符号ィ匕部 208を具備する。

[0021] MDCT分析部 201は、第 1レイヤ復号ィ匕部 103から入力されてくる第 1レイヤ復号信号の MDCT係数を算出し、算出した第 1レイヤ復号信号の MDCT係数をスケールファクタ算出部 202とスペクトル微細情報符号ィ匕部 208とにそれぞれ入力する。

[0022] スケールファクタ算出部 202は、 MDCT分析部 201から入力されてくる第 1レイヤ復号信号の MDCT係数に基づいて第 1レイヤ復号信号における各サブバンドのスケールファクタを算出する。そして、スケールファクタ算出部 202は、算出した第 1レイヤ復号信号のスケールファクタを予測係数符号ィ匕部 205に入力する。なお、このスケールファクタは、各サブバンドに含まれる MDCT係数の平均振幅を表し、復号信号の音質を左右する重要なパラメータである。また、本実施の形態において、スペクトル概形とは、各サブバンドのスケールファクタを周波数方向に連結したときの形状である。

[0023] MDCT分析部 203は、遅延部 102から入力されてくる原信号の MDCT係数を算出し、算出した原信号の MDCT係数をスケールファクタ算出部 204とスペクトル微細情報符号ィ匕部 208とにそれぞれ入力する。

[0024] スケールファクタ算出部 204は、 MDCT分析部 203から入力されてくる原信号の M DCT係数に基づいて原信号の各サブバンドのスケールファクタを算出し、算出した原信号のスケールファクタを予測係数符号ィ匕部 205に入力する。

[0025] 予測係数符号ィ匕部 205は、予測係数の候補が記録された予測係数符号帳を具備し、この予測係数符号帳を探索して、スケールファクタ算出部 202から入力されてくる第 1レイヤ復号信号のスケールファクタに乗じることにより、その乗算結果をスケールファクタ算出部 204から入力されてくる原信号のスケールファクタに最も近似させる予測係数を決定し、決定した予測係数を符号ィ匕して、その符号化パラメータを多重化部 105と予測係数復号ィ匕部 206とにそれぞれ入力する。なお、予測係数符号ィ匕部 2 05における予測係数の具体的な決定態様については後述する。

[0026] 予測係数復号ィ匕部 206は、予測係数符号ィ匕部 205から入力されてくる符号化パラメータを用いて予測係数を復号し、復号した予測係数をスぺ外ル微細情報符号ィ匕部 208に入力する。

[0027] スペクトル微細情報符号ィ匕部 208は、 MDCT分析部 201から入力されてくる第 1レィャ復号信号の MDCT係数と、 MDCT分析部 203から入力されてくる原信号の M DCT係数と、予測係数復号ィ匕部 206から入力されてくる復号予測係数と、を用いて、サブバンド内の細かな MDCT係数の形状を表すスペクトル微細情報を生成して符号化し、その符号ィ匕パラメータを多重化部 105に入力する。なお、 MDCT分析部 20 1から入力されてくる第 1レイヤ復号信号の MDCT係数に、予測係数復号ィ匕部 206 力入力されてくる復号予測係数を乗じることにより、原信号のスペクトル概形とほぼ同一のスペクトル形状が生成されるため、スペクトル微細情報符号ィ匕部 208は、この生成したスペクトル形状と MDCT分析部 203から入力されてくる原信号の MDCT係数とを比較することにより、スペクトル微細情報を生成することができる。

[0028] 図 3は、本実施の形態に係るスケーラブル符号ィ匕装置 100における予測係数符号化部 205の主要な構成を示すブロック図である。予測係数符号ィ匕部 205は、乗算器 301、加算器 302、探索部 303及び予測係数符号帳 304を具備する。

[0029] 乗算器 301は、スケールファクタ算出部 202から入力されてくる第 1レイヤ復号信号のスケールファクタに予測係数符号帳 304から入力されてくる予測係数を乗じた後に、その乗算結果を加算器 302に入力する。

[0030] 加算器 302は、スケールファクタ算出部 204力入力されてくる原信号のスケールファクタ力ゝら、乗算器 301から入力されてくる予測係数を乗じられた第 1レイヤ復号信号のスケールファクタを減じることにより、誤差信号を生成し、生成した誤差信号を探索部 303に入力する。

[0031] 探索部 303は、予測係数符号帳 304に対して、その保有する全ての予測係数の候補を順に乗算器 301に入力するように指示する。そして、探索部 303は、乗算器 301 力入力されてくる誤差信号を観察して、その誤差が最小となる予測係数を決定し、決定した予測係数を符号ィ匕して、その符号ィ匕パラメータを多重化部 105に入力する

[0032] 予測係数符号帳 304は、予測係数の候補を保有しており、探索部 303からの指示に従って予測係数を順に乗算器 301に入力する。

[0033] ここで、原信号のスケールファクタの推定値即ち第 1レイヤ復号信号のスケールファクタに予測係数を乗じた値を「X，（m)」、第 1レイヤ復号信号のスケールファクタを「Y (m)」、予測係数を「 a (m)」、サブバンド番号を「m」と表記すると、原信号のスケールファクタの推定値 X， (m)は、次の「式 1」で算出される。

X' (m) = a (m) XY(m) …（式 1)

[0034] そして、式 1で算出された原信号のスケールファクタの推定値 X， (m)を用いて、探索部 303は、次の「式 2」で表される誤差 Eが最小となる予測係数 a (m)を決定し、決定した予測係数を符号ィ匕して、その符号ィ匕パラメータを多重化部 105に出力する。なお、式 2では、原信号のスケールファクタを「X(m)」と表記する。

E= (X(m) -X' (m) ) ² …（式 2)

[0035] 図 4に、原信号のスペクトル及び原信号のスケールファクタ（a)と、第 1レイヤ復号信号のスペクトル及び第 1レイヤ復号信号のスケールファクタ (b)と、の関係の一例を示す。図 4から明らかなように、原信号のスペクトルと第 1レイヤ復号信号のスペクトルとは微細な部分で相違するものの、これらをスケールファクタで比較すると、ほぼ同様の形状を持つことから、これらのスケールファクタ同士では相関が強いと言える。つまり、スケールファクタに代表されるスペクトル概形情報に着目して予測を行えば、スぺタトル微細情報に着目して予測を行うよりも、符号ィ匕効率の改善効果が高い。よって、第 1レイヤ復号信号のスケールファクタと予測係数とを用いれば、原信号のスケールファクタを高精度で生成できることが判る。なお、図 4に記載の原信号のスペクトルと第 1レイヤ復号信号のスペクトルとは、 MDCT係数のスペクトル振幅を算出してプロットしたちのである。

[0036] 図 5は、本実施の形態に係るスケーラブル復号装置 500の主要な構成を示すプロック図である。スケーラブル復号装置 500は、分離部 501、第 1レイヤ復号ィ匕部 502 及び第 2レイヤ復号化部 503を具備する。

[0037] 分離部 501は、スケーラブル符号ィ匕装置 100から送信されてくるビットストリームを分離して、第 1レイヤ符号化パラメータを第 1レイヤ復号ィ匕部 502に入力し、一方で予測係数の符号ィ匕パラメータとスペクトル微細情報の符号化パラメータとを第 2レイヤ復号ィ匕部 503に入力する。

[0038] 第 1レイヤ復号ィ匕部 502は、分離部 501から入力されてくる第 1レイヤ符号ィ匕パラメ一タカ第 1レイヤ復号信号を生成し、この第 1レイヤ復号信号を第 2レイヤ復号ィ匕部 503に入力する。また、この第 1レイヤ復号信号は、直接スケーラブル復号装置 500 の外部にも出力される。これにより、第 1レイヤ復号ィ匕部 502で生成される第 1レイヤ復号信号を出力する必要が生じた場合には、この出力を利用することができる。

[0039] 第 2レイヤ復号ィ匕部 503は、分離部 501から入力されてくる符号ィ匕パラメータと第 1 レイヤ復号ィ匕部 502から入力されてくる第 1レイヤ復号信号とに対して、後述する復号化処理を施し、第 2レイヤ復号信号を生成して出力する。なお、第 1レイヤ復号信号によって再生音声の最低限の品質が担保され、第 2レイヤ復号信号によって再生音声の品質を高めることができる。また、第 2レイヤ復号信号が用いられる力否かは、アプリケーションの設定等に依存する。

[0040] 図 6は、本実施の形態に係るスケーラブル復号装置 500における第 2レイヤ復号ィ匕部 503の主要な構成を示すブロック図である。第 2レイヤ復号ィ匕部 503は、予測係数復号化部 601、 MDCT分析部 602、スペクトル微細情報復号ィ匕部 605、復号スぺクトル生成部 606及び時間領域変換部 607を具備する。

[0041] 予測係数復号ィ匕部 601は、分離部 501から入力されてくる符号ィ匕パラメータを予測係数に復号し、復号した予測係数を復号スペクトル生成部 606に入力する。

[0042] MDCT分析部 602は、第 1レイヤ復号化部 502から入力されてくる時間領域信号である第 1レイヤ復号信号に対して変形離散コサイン変換 (MDCT)による周波数変換を施して MDCT係数を算出し、算出した第 1レイヤ復号信号の MDCT係数を復号スペクトル生成部 606に入力する。

[0043] スペクトル微細情報復号ィ匕部 605は、分離部 501から入力されてくる符号化パラメ一タを復号してスペクトル微細情報を生成し、生成したスペクトル微細情報を復号スベクトル生成部 606に入力する。

[0044] 復号スペクトル生成部 606は、予測係数復号ィ匕部 601から入力されてくる復号した予測係数と、スペクトル微細情報復号ィ匕部 605から入力されてくるスペクトル微細情報と、 MDCT分析部 602から入力されてくる第 1レイヤ復号信号の MDCT係数と、力原信号の復号スペクトルを生成し、生成した原信号の復号スペクトルを時間領域変換部 607に入力する。例えば、復号スペクトル生成部 606は、原信号の復号スぺタトル U (k)を次の「式 3」を用いて算出する。

[数 1]

U{k) = C{k) + ' ( ) · B{k)…(式 3)

[0045] ここで、式 3にお!/、て、「C (k)」はスペクトル微細情報、「 α，（m)」は第 mサブバンドの復号した予測係数、「B (k)」は第 1レイヤ復号信号の MDCT係数を表し、「k」は第 mサブバンドに含まれる周波数を表す。

[0046] 時間領域変換部 607は、復号スペクトル生成部 606から入力されてくる復号スぺクトルを時間領域の信号に変換した後、変換後の信号に対して必要に応じて適切な窓掛けや重ね合わせ加算等の処理を施してフレーム間に生じる不連続を解消することにより、最終的に第 2レイヤ復号信号を生成して出力する。

[0047] このように、原信号のスケールファクタと第 1レイヤ復号信号のスケールファクタとの間には強、相関があり、また第 1レイヤ復号信号のスケールファクタに予測係数を乗じれば、原信号のスケールファクタを高い精度で生成することができる。さらに、この予測係数の符号ィ匕パラメータのデータ量は、従来技術における原信号から第 1レイャ復号信号を減じることによって生成した誤差信号の符号ィ匕パラメータのデータ量に比べて著しく少ない。

[0048] そこで、本実施の形態では、スケーラブル符号ィ匕装置 100が、第 1レイヤ符号化パラメータと共に、この第 1レイヤ符号化パラメータに由来する予測係数の符号ィ匕パラメータをスケーラブル復号装置 500に送信するようにした。

[0049] 従って、本実施の形態によれば、スケーラブル符号ィ匕装置 100が音声信号をスケーラブル符号化してスケーラブル復号装置 500に送信する場合に、この音声信号の送信に要求なビットレートを削減することができる。換言すれば、本実施の形態によれば、音声信号のスケーラブル符号ィ匕において、第 2レイヤの符号ィ匕効率を高めることができる。さらに、本実施の形態によれば、スケーラブル復号装置 500によって再生される音声の品質を高めることができる。

[0050] なお、本実施の形態に係るスケーラブル符号ィ匕装置 100又はスケーラブル復号装置 500につ、て、以下のように変形したり応用したりしてもよ!、。

[0051] 本実施の形態では、予測係数符号ィ匕部 205が、式 2で表される誤差 Eが最小となる予測係数 a (m)の符号化パラメータを多重化部 105に出力する場合について説明したが、本発明はこの場合に限定されるものではなぐ例えば予測係数符号化部 20 5力原信号のスケールファクタ X (m)と第 1レイヤ復号信号のスケールファクタ Y (m) を用いて理想係数 a opt (m)を算出し、この理想係数 a opt (m)を量子化するようにしてもょ、。ここで、理想係数 a opt (m)は、次の「式 4」で表される。

a opt (m) = X (m) /Y (m) · · · (式 4)

[0052] 図 7は、この応用例において、予測係数符号ィ匕部 205の代わりに用いられる予測係数符号ィ匕部 705の主要な構成を示すブロック図である。予測係数符号ィ匕部 705は、探索部 303、予測係数符号帳 304、理想係数算出部 711及び加算器 712を具備する。理想係数算出部 711は、スケールファクタ算出部 202から入力されてくる第 1レイャ復号信号のスケールファクタ Y(m)と、 MDCT分析部 203から入力されてくる原信号のスケールファクタ X (m)と、力も式 4により理想係数 a opt (m)を算出し、算出した理想係数 a opt (m)を加算器 712に入力する。加算器 712は、理想係数算出部 711 から入力されてくる理想係数 ex opt (m)と、予測係数符号帳 304から入力されてくる予測係数と、の差分を示す誤差信号を生成し、この誤差信号を探索部 303に入力する。そして、予測係数符号ィ匕部 705は、加算器 712によって生成される誤差信号の示す差分が最小となる予測係数の符号ィ匕パラメータを多重化部 105に入力する。なお、探索部 303及び予測係数符号帳 304は、予測係数符号化部 205における対応構成要素と同一の動作を行う構成要素であるため、その説明を省略する。

[0053] また、図 8に、本実施の形態における図 7に示す応用例とは異なる応用例を示す。

図 8は、予測係数符号ィ匕部 205の代わりに用いられる予測係数符号ィ匕部 805の主要な構成を示すブロック図である。予測係数符号ィ匕部 805は、乗算器 301、加算器 30 2、 815、探索部 303、予測係数符号帳 304及び残差成分符号帳 814を具備する。残差成分符号帳 814は、残差成分を示す符号帳を保有しており、探索部 303からの指示に従い、保有する残差成分を順に加算器 815に入力する。加算器 815は、乗算器 301から入力されてくる予測係数を乗じられた第 1レイヤ復号信号のスケールファクタに、残差成分符号帳 814から入力されてくる残差成分を加算して、その加算結果を加算器 302に入力する。そして、予測係数符号ィ匕部 805は、加算器 302において生成される誤差信号の示す差分が最小となる予測係数と残差成分との組み合わせを決定し、それらの符号ィ匕パラメータを多重化部 105に入力する。なお、この応用例について、原信号のスケールファクタの推定値 X，（m)は、第 1レイヤ復号信号のスケールファクタ Y(m)、予測係数 a (m)及び残差成分 e (m)を用いて、次の「式 5」で算出される。

X' (m) = a (m) XY(m) +e (m) …（式 5)

[0054] このように、図 8に示す応用例であれば、誤差信号用の符号が別途必要になりビットレートが増加するものの、その一方で原信号のスケールファクタの推定精度が改善される。

[0055] また、さらに別の応用例として、複数のサブバンドの予測係数 a (m)を一つのベタトルとみなし、このベクトルに対して、予測係数ベクトル符号帳に含まれる候補の中で最も適当な候補を探索により決定するようにしてもよい。このようにすれば、複数のサブバンドの予測係数 a (m)がーつの符号ィ匕パラメータで表されるようになり、予測係数 a (m)の符号化パラメータのデータ量が削減され、ビットレートを低下させることができる。

[0056] また、本実施の形態では、スケーラブル符号ィ匕装置 100が、音声信号の第 1レイヤ符号化パラメータと第 2レイヤ符号化パラメータとをビットストリームとして出力する場合について説明した力本発明はこの場合に限定されるものではなぐ例えばスケーラブル符号ィ匕装置 100が、音声信号の第 1レイヤ符号ィ匕パラメータと第 2レイヤ符号ィ匕パラメータとを図示しな、データ保存部等に蓄積し保存するようにしてもょ、。

[0057] また、本実施の形態では、探索部 303が、式 2に表される誤差 Eが最小となる予測係数 a (m)を決定する場合について説明したが、本発明はこの場合に限定されるものではなぐ例えば探索部 303が次の「式 6」に表されるように対数領域で予測係数 a (m)を探索するようにしてもよい。

[数 2]

E = (log₁₀ Χ(πί)一 log₁₀ X'(m)f…(式 6 )

[0058] また、本実施の形態では、探索部 303が、予測係数符号帳 304の保有する予測係数 a (m)の全候補を探索する場合について説明したが、本発明はこの場合に限定されるものではなぐ例えば探索部 303が予測係数符号帳 304の保有する一部の候補に限定して探索するようにしてもょ、。

[0059] (実施の形態 2)

図 9A〜Cに、正弦波信号を高速フーリエ変換（Fast Fourier Transform： FFT)処理又は MDCT処理を用いてスペクトル分析を行う際に、その分析位置を変えたとき各処理によって得られるスペクトル振幅の差異を示す。

[0060] ここで、音声信号は、図 9Aに示すように正弦波であるので、そのスペクトルは 1本の線スペクトルとして表されるはずである。実際に、音声信号を FFT変換してスペクトル分析した場合には、図 9Bに示すように、その分析位置に関わらず、 1本の線スぺタトルとして表されることになる。ところが、 MDCTを用いたスペクトル分析では、図 9Cに示すように、算出されるスペクトルが分析位置に依存して変化する。つまり、 MDCT を用いたスペクトル分析で算出されるスペクトルは、その波形の位相に影響されることになる。そのため、実施の形態 1で示したように、スケールファクタ算出部 202、 204 が MDCT分析部 201、 203から入力されてくる第 1レイヤ復号信号の MDCT係数に基づ、てスケールファクタ (スペクトル概形)を生成する場合には、生成されたスケールファクタは、その基となったスペクトルを忠実に反映していないおそれがある。

[0061] さらに、実施の形態 1に示すスケーラブル符号ィ匕では、第 1レイヤ符号化パラメータ及び第 1レイヤ復号信号の生成において量子化が行われるため、この第 1レイヤ符号化パラメータ又は信号には量子化歪が潜在することになる。従って、実施の形態 1 に示すスケーラブル符号ィ匕では、第 2レイヤ符号ィ匕部 104に入力される原信号と第 1 レイヤ復号信号との位相が同期していないおそれがあり、これは換言すれば、原信号のスペクトル概形と第 1レイヤ復号信号のスペクトル概形との相関を高める余地が残されている、ということである。特に、第 1レイヤに CELP方式のような高能率符号ィ匕法が適用された場合には、このような傾向が強くなる。

[0062] そこで、本発明に係る実施の形態 2では、第 1レイヤに CELP方式のような高能率符号化法が適用された場合でも、原信号のスペクトル概形と第 1レイヤ復号信号のスベクトル概形との相関をより高めることのできる手段を講ずる。

[0063] 図 10は、本実施の形態に係るスケーラブル符号ィ匕装置における第 2レイヤ符号ィ匕部 1004の主要な構成を示すブロック図である。第 2レイヤ符号ィ匕部 1004は、スケーラブル符号ィ匕装置 100において、第 2レイヤ符号ィ匕部 104の代わりに使用されるものであって、第 2レイヤ符号ィ匕部 104における MDCT分析部 201とスケールファクタ算出部 202との間にスペクトル平滑部 1011をさらに具備するものである。従って、第 2 レイヤ符号ィ匕部 1004は第 2レイヤ符号ィ匕部 104の構成要素と同一の機能を有する構成要素を多く具備するため、このような同一の機能を有する構成要素については、重複を避けるため、その説明を省略する。

[0064] スペクトル平滑部 1011は、 MDCT分析部 201から入力されてくる第 1レイヤ復号信号の MDCT係数即ちスペクトルを、分析位置の近傍のスペクトルを用いて平滑ィ匕し、平滑ィ匕したスペクトルをスケールファクタ算出部 202に入力する。なお、本実施の形態では、スケールファクタ算出部 202からスペクトル微細情報符号ィ匕部 208に平滑ィ匕された第 1レイヤ復号信号のスケールファクタが入力されるが、この平滑化された第 1レイヤ復号信号のスケールファクタは参照用に入力されるものであり、スペクトル微細情報符号ィ匕部 208の機能は、実施の形態 1におけるそれとほぼ同様である。

[0065] 図 11は、スペクトル平滑部 1011の主要な構成を示すブロック図である。スペクトル平滑部 1011は、平滑処理部 1121及びエネルギー調整部 1122を具備する。なお、スペクトル平滑部 1011の動作については、後述する。 [0066] 図 12は、本実施の形態に係るスケーラブル復号装置における第 2レイヤ復号ィ匕部 1203の主要な構成を示すブロック図である。第 2レイヤ復号ィ匕部 1203は、スケーラブル復号装置 500において、第 2レイヤ復号ィ匕部 503の代わりに使用されるものであつて、さらに第 2レイヤ復号ィ匕部 503において、復号スペクトル生成部 606の代わりに復号スペクトル生成部 1216を具備し、また MDCT分析部 602と復号スペクトル生成部 606との間にスペクトル平滑部 1212及びスケールファクタ算出部 1213を新たに具備するものである。また、スペクトル平滑部 1212は、スペクトル平滑部 1011と同様に、図 11に示す平滑処理部 1121とエネルギー調整部 1122とを具備する。従って、第 2レイヤ復号ィ匕部 1203は第 2レイヤ復号ィ匕部 503やスペクトル平滑部 1011の構成要素と同一の機能を有する構成要素を多く具備するため、このような同一の機能を有する構成要素については、重複を避けるため、その説明を省略する。

[0067] スペクトル平滑部 1011、 1212は、 MDCT分析部 201又は MDCT分析部 602力ら入力されてくる第 1レイヤ復号信号のスペクトルを平滑ィ匕する際に、着目のスぺタトルとその近傍のスペクトルの重み付き平均値を算出する。例えば、スペクトル平滑部 1011、 1212における平滑処理部 1121は、次の「式 7」に従ってスペクトルの平滑化を行う。

[数 3]

[0068] ここで、 S (k)は平滑化前の MDCTスペクトル、 S ' (k)は平滑化後の MDCTスぺクトル、 β (i)は重み係数、 Lは平均を求める範囲を表す。

[0069] 或いは、スペクトル平滑部 1011、 1212は、 MDCT分析部 201又は MDCT分析部 602から入力されてくる第 1レイヤ復号信号のスペクトルを平滑ィ匕する際に、着目のスペクトルと、その近傍のスペクトルとの差の平均を算出する。例えば、スペクトル平滑部 1011、 1212における平滑処理部 1121は、次の「式 8」に従ってスペクトルの平滑化を行う。

[数 4] S k) = ^l - S²(k) + Y2 - (S(k— 1)一 S(k + 1))² …(式 8)

[0070] ここで、 γ 1、 γ 2は、重み係数を表す。

[0071] そして、スペクトル平滑部 1011、 1212におけるエネルギー調整部 1122は、平滑処理部 1121によって平滑ィ匕された第 1レイヤ復号信号のスペクトルを、その平滑ィ匕の前後でスペクトルエネルギーが一致するように、調整する。

[0072] スケールファクタ算出部 1213は、スケールファクタ算出部 202と同様に機能して、スペクトル平滑部 1212から入力されてくる平滑ィ匕された第 1レイヤ復号信号の MDC Τ係数に基づいて第 1レイヤ復号信号における各サブバンドのスケールファクタを算出する。そして、スケールファクタ算出部 1213は、算出した第 1レイヤ復号信号のスケールファクタを復号スペクトル生成部 1216に入力する。

[0073] 復号スペクトル生成部 1216は、予測係数復号ィ匕部 601から入力されてくる復号された予測係数と、 MDCT分析部 602から入力されてくる第 1レイヤ復号信号の MDC Τ係数と、スケールファクタ算出部 1213から入力されてくる第 1レイヤ復号信号のスケールファクタと、スペクトル微細情報復号ィ匕部 605から入力されてくるスペクトル微細情報と、力原信号の復号スペクトルを生成し、生成した原信号の復号スペクトルを時間領域変換部 607に入力する。例えば、復号スペクトル生成部 1216は、原信号の復号スペクトル U (k)を次の「式 9」を用いて算出する。

[数 5] ひ ( ) = C(k) + a m) · ）… (式 9 )

f m)

[0074] ここで、式 9にお!/、て、「C (k)」はスペクトル微細情報、「 α，（m)」は第 mサブバンドの復号した予測係数、「B (k)」は第 1レイヤ復号信号の MDCT係数を表し、「k」は第 mサブバンドに含まれる周波数を表す。また、「Y(m)」は第 mサブバンドにおける第 1レイヤ復号信号のスケールファクタ、「Z (m)」は第 mサブバンドにおける平滑ィ匕後の第 1レイヤ復号信号のスケールファクタを表す。

[0075] 図 13の左枠 (A)に、図 9に示す正弦波を 4つの分析位置 phO、 phl、 ph2、 ph3で MDCTを用いたスペクトル分析を行ったときのスペクトルを概念的に示す。図 13の左枠 (A)に示すスペクトルに対して、スペクトル平滑部 1011又はスペクトル平滑部 1 212が式 7又は式 8に従う平滑ィ匕処理を行うことにより、図 13の右枠 (B)に示すスぺタトルが算出される。元々、 MDCTを用いるスペクトル分析によって算出されるスぺクトルには、図 13の左枠 (A)に示すようにばらつきが生じている。これに対し、スぺタトル平滑部 1011又はスペクトル平滑部 1212によって平滑化された後のスペクトルでは、図 13の右枠（B)に示すように、このばらつきが少なくなる。 MDCTを用いるスぺタトル分析によって算出されるスペクトルのばらつきが少なくなれば、その平滑化されたスペクトルについては、原信号のスペクトル力大きく乖離してしまう場合が減り、大局的に見れば原信号のスペクトルがより正確に反映されることになる。

[0076] このように、本実施の形態によれば、スペクトル平滑部 1011又はスペクトル平滑部 1212が、第 1レイヤ復号信号のスペクトルに対してスペクトル平滑ィ匕処理を施すため、平滑ィ匕後のスペクトル力算出されるスペクトル概形と、スケールファクタ算出部 20 4によって算出される原信号のスぺ外ル概形と、の相関が一層強くなる。その結果、本実施の形態によれば、予測係数符号ィ匕部 205での符号ィ匕効率が一層向上する。

[0077] 参考として、図 17に、スケールファクタの量子化性能を計算機シミュレーションにより算出した結果の一例を示す。図 17に示す例では、各サブバンドのスケールファクタの予測係数 a (m)は、 4bitのスカラー量子化器を用いて量子化される。また、図 17 に示す例では、量子化前の原信号のスケールファクタ X(m)に対する量子化後のスケールファクタ X (m)を用いて次の「式 10」に従い SNR(SignaH:o- Noise Ratio)を算

q

出する。

[数 6] 网… (式 1 0 )

[0078] 図 17に示すように、平滑化処理のある場合と無い場合とを比較すると、平滑化処理のある場合ではクリーン音声で僅かに SNRが低下して、るものの、オーディオや車内雑音音声では SNRが大きく改善している。従って全体的にみると、スペクトル平滑化による効果は大き、と言える。 [0079] (実施の形態 3)

人間の聴覚特性には、ある信号が聞こえているときに、その信号と周波数の近い音が耳に入ってきても聞こえ難い、という聴覚マスキング特性がある。そこで、本実施の形態では、この聴覚マスキング特性を利用して、第 2レイヤ符号化パラメータの構成要素である予測係数とスペクトル微細情報との符号ィヒ効率の向上を図る。

[0080] 図 14は、本発明の実施の形態 3に係るスケーラブル符号ィ匕装置における第 2レイャ符号ィ匕部 1404の主要な構成を示すブロック図である。第 2レイヤ符号ィ匕部 1404 は、実施の形態 2における第 2レイヤ符号ィ匕部 1004において、予測係数符号ィ匕部 2 05の代わりに予測係数符号ィ匕部 1405を、またスペクトル微細情報符号ィ匕部 208の代わりにスペクトル微細情報符号ィ匕部 1408を、そして新たに聴覚マスキング算出部 1411を具備するものである。従って、第 2レイヤ符号ィ匕部 1404は第 2レイヤ符号ィ匕部 104、 1004の構成要素と同一の機能を有する構成要素を多く具備するため、このような同一の機能を有する構成要素については、重複を避けるため、その説明を省略する。

[0081] 聴覚マスキング算出部 1411は、遅延部 102から入力されてくる原信号について、そのサブバンド毎に予め規定されている聴覚マスキング T(m)を、予測係数符号ィ匕部 1405とスペクトル微細情報符号ィ匕部 1408とにそれぞれ通知する。

[0082] 予測係数符号ィ匕部 1405は、聴覚マスキング算出部 1411から通知される聴覚マスキング T(m)と誤差スケールファクタ E (m)との大きさをサブバンド毎に比較し、誤差スケールファクタ E (m)が聴覚マスキング T(m)を超える場合には、そのサブバンドで生じている量子化歪が人間の聴覚で知覚されうると判定して、そのサブバンドについて予測係数を決定して符号ィ匕し、その符号ィ匕パラメータを多重化部 105に入力する。なお、誤差スケールファクタ E (m)は、原信号のスケールファクタと第 1レイヤ復号信号のスケールファクタとの差として算出される。また、予測係数符号ィ匕部 1405は、サブバンド毎に予測係数を符号ィ匕したか否かを示す情報を符号ィ匕し、その符号化した情報を多重化部 105に入力して、スケーラブル復号装置 500に送信することが好ましい。

[0083] スペクトル微細情報符号ィ匕部 1408も、予測係数符号ィ匕部 1405と同様にして、誤差スケールファクタ E (m)が聴覚マスキング T(m)を超える場合に限り、そのサブバンドで生じている量子化歪が人間の聴覚で知覚されうると判定して、そのサブバンドについてスペクトル微細情報を符号ィ匕して多重化部 105に入力する。また、スペクトル微細情報符号ィ匕部 1408は、サブバンド毎にスペクトル微細情報を符号ィ匕したカゝ否かを示す情報を符号化し、その符号ィ匕した情報を多重化部 105に入力して、スケーラブル復号装置 500に送信することが好ま、。

[0084] このように、本実施の形態によれば、第 2レイヤ符号ィ匕部 1404が、原信号のサブバンド毎に聴覚マスキング効果が有効に奏される状態力判定し、聴覚マスキング効果が有効に奏される状態のサブバンドについては、予測係数とスペクトル微細情報との符号ィ匕を行なわないため、音声信号の第 2レイヤ符号ィ匕パラメータの符号ィ匕効率を改善することができる。その結果、本実施の形態によれば、音声信号のより一層の低ビットレート化と高音質化とを両立できる。

[0085] なお、本実施の形態にぉ、て、予測係数符号ィ匕部 1405又はスペクトル微細情報符号ィ匕部 1408が、聴覚マスキング T(m)と誤差スケールファクタ E (m)をサブバンド毎に比較して、誤差スケールファクタ E (m)が聴覚マスキング T(m)を超える程度に応じて、予測係数又はスペクトル微細情報を符号ィ匕する際のビット数を増やして、そのサブバンドの誤差スケールファクタ E (m)を小さくするようにしてもよい。また、このようにする場合も、予測係数符号ィ匕部 1405又はスペクトル微細情報符号ィ匕部 1408は、サブバンド毎に予測係数又はスペクトル微細情報に配分したビット数を示す情報を、スケーラブル復号装置 500に送信することが好ま、。

[0086] なお、本発明に係るスケーラブル符号ィ匕装置について、以下のように変形したり応用したりしてちよい。

[0087] 本発明に係る各実施の形態では、音声信号を第 1レイヤ（下位レイヤ）と第 2レイヤ（上位レイヤ）との 2階層でスケーラブル符号ィ匕を行う場合について説明したが、本発明はこの場合に限定されるものではなぐ例えば 3階層以上でスケーラブル符号ィ匕を行うようにしてもよい。

[0088] また、本発明において、第 nレイヤにおける信号のサンプリングレートを Fs (n)と表して、 Fs (n)≤Fs (n+ l)の関係が成り立つように、各レイヤのサンプリングレートを調節してもよい。つまり、第 1レイヤ符号ィ匕部 101又は第 1レイヤ復号ィ匕部 502におけるサンプリングレートを、第 2レイヤ符号ィ匕部 104又は第 2レイヤ復号ィ匕部 503におけるサンプリングレートよりも低く設定してもよい。このようにすれば、帯域スケーラブルを実現できることから、ネットワークの状況が良いときやユーザの使用している機器の能力が高いときには、復号信号によって形成される臨場感を一層高めることができる。

[0089] また、本発明の各実施の形態では、 MDCTを用いてスペクトル分析を行う場合について説明したが、本発明はこの場合に限定されるものではなぐ他の方式、例えば DFT、コサイン変換又は Wavelet変換等を用いてスペクトル分析を行うようにしてもよい。

[0090] (参考例）

この参考例では、音声信号のスケーラブル符号ィ匕は行わないものの、過去のフレームのスケールファクタを使って現フレームのスケールファクタを予測する際に、本発明の実施の形態 2で用いたように、スペクトル平滑ィ匕処理を用いてスケールファクタの予測を行う。

[0091] 図 15は、この参考例に係る音声符号化装置 1504の主要な構成を示すブロック図である。音声符号化装置 1504は、第 2レイヤ符号ィ匕部 1004における MDCT分析部 203、スケールファクタ算出部 204、予測係数符号ィ匕部 205、予測係数復号化部 206及びスペクトル微細情報符号ィ匕部 208と同一の機能を有する構成要素を具備し、さらにスペクトル微細情報復号化部 1511、復号スペクトル生成部 1512、バッファ 1 513、スペクトル平滑部 1514及びスケールファクタ算出部 1515を新たに具備する。また、スペクトル微細情報復号ィ匕部 1511は、第 2レイヤ復号ィ匕部 1203におけるスぺタトル微細情報復号ィ匕部 605と同様に機能し、復号スペクトル生成部 1512は復号スベクトル生成部 1216と、スペクトル平滑部 1514は第 2レイヤ符号ィ匕部 1004におけるスペクトル平滑部 1011と、スケールファクタ算出部 1515はスケールファクタ算出部 202と、同様に機能する。以下、音声符号ィ匕装置 1504について説明するが、第 2レィャ符号ィ匕部 1004及び第 2レイヤ復号ィ匕部 1203の構成要素と同様の機能を有する構成要素については、重複を避けるため、その説明を省略する。

[0092] ノッファ 1513は、復号スペクトル生成部 1512から入力されてくる復号スペクトルを 1フレーム分格納して、新たな復号スペクトルが入力されてくると、格納している前フレ一ムの復号スペクトルをスペクトル平滑部 1514、スペクトル微細情報符号ィ匕部 208 及び復号スペクトル生成部 1512に入力する。

[0093] 従って、音声符号化装置 1504では、バッファ 1513に格納されている前フレームの復号スペクトルに対してスペクトル平滑ィ匕が施されてスケールファクタが算出されることになり、その結果、予測係数符号ィ匕部 205では、この前フレームに係るスケールファクタに基づいて現フレームの予測係数が算出されることになる。また、スペクトル微細情報符号ィ匕部 208と復号スペクトル生成部 1512とでは、前フレームの復号スぺクトルを用いて、スペクトル微細情報の符号化と復号スペクトルの生成とがそれぞれ行われる。

[0094] 図 16は、この参考例に係る音声復号装置 1603の主要な構成を示すブロック図である。音声復号装置 1603は、第 2レイヤ復号ィ匕部 1203における予測係数復号ィ匕部 601、スペクトル微細情報復号ィ匕部 605、復号スペクトル生成部 1216及び時間領域変換部 607と同一の機能を有する構成要素を具備し、さらにバッファ 1611、スぺタトル平滑部 1612及びスケールファクタ算出部 1613を新たに具備する。また、スぺタトル平滑部 1612は第 2レイヤ復号ィ匕部 1203におけるスペクトル平滑部 1212と、スケールファクタ算出部 1613はスケールファクタ算出部 1213と、同様に機能する。以下、音声復号装置 1603について説明するが、第 2レイヤ復号ィ匕部 1203の構成要素と同様の機能を有する構成要素については、重複を避けるため、その説明を省略する

[0095] バッファ 1611は、復号スペクトル生成部 1216から入力されてくる復号スペクトルを 1フレーム分格納して、新たな復号スペクトルが入力されてくると、格納している前フレ一ムの復号スペクトルをスペクトル平滑部 1612及び復号スペクトル生成部 1216に入力する。

[0096] 従って、音声復号装置 1603では、バッファ 1611に格納されている前フレームの復号スペクトルに対してスペクトル平滑ィ匕が施されてスケールファクタが算出されることになり、その結果、復号スペクトル生成部 1216では、この前フレームに係るスケールファクタに基づいて現フレームのスケールファクタが予測され、このスケールファクタを使用して復号することになる。

[0097] ちなみに、復号スペクトル生成部 1216は、原信号の復号スペクトル U (k)を次の「式 11」を用いて算出する。

[数 7] ひ (ん） = C(k) + a m) - ^Zp Bprv{k)…(式 11)

Yprv(m)

[0098] ここで、式 11にお!/、て、「C (k)」はスペクトル微細情報、「 α，（m)」は第 mサブバンドの復号した予測係数、「Bprv(k)」は前フレームの MDCT係数を表し、「k」は第 m サブバンドに含まれる周波数を表す。また、「Yprv(m)」は第 mサブバンドにおける前フレームのスケールファクタ、 rzprv(m)」は第 mサブバンドにおける平滑化後の前フレームのスケールファクタを表す。

[0099] このように、この参考例の構成によれば、スペクトル概形の時間的な相関を利用して、スペクトル概形の予測を行うため、スケールファクタの符号ィ匕を効率的に行えると共に、その低ビットレートイ匕を図ることができる。

[0100] 以上、本発明の各実施の形態について説明した。

[0101] 本発明に係るスケーラブル符号化装置等は、上記各実施の形態に限定されず、種々変更して実施することが可能である。例えば、各実施の形態は、適宜組み合わせて実施することが可能である。

[0102] 本発明に係るスケーラブル符号化装置およびスケーラブル復号装置は、移動体通信システムにおける通信端末装置および基地局装置に搭載することが可能であり、これにより上記と同様の作用効果を有する通信端末装置、基地局装置、および移動体通信システムを提供することができる。

[0103] なお、ここでは、本発明をノヽードウエアで構成する場合を例にとって説明したが、本発明をソフトウェアで実現することも可能である。例えば、本発明に係るスケーラブル符号ィ匕方法のアルゴリズムをプログラミング言語によって記述し、このプログラムをメモリに記憶してぉ、て情報処理手段によって実行させることにより、本発明に係るスケーラブル符号ィ匕装置と同様の機能を実現することができる。

[0104] また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路である LSIとして実現される。これらは個別に 1チップ化されても良いし、一部又は全てを含むように 1チップィ匕されても良い。

[0105] ここでは、 LSIとした力集積度の違いにより、 IC、システム LSI、スーパー LSI、ゥノレ卜ラ LSIと呼称されることちある。

[0106] また、集積回路化の手法は LSIに限るものではなぐ専用回路又は汎用プロセッサで実現しても良い。 LSI製造後に、プログラムすることが可能な FPGA (Field Program mable Gate Array)や、 LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブノレ ·プロセッサーを利用しても良、。

[0107] さらには、半導体技術の進歩又は派生する別技術により LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積ィ匕を行っても良い。バイオ技術の適応等が可能性としてありえる。

[0108] 本明細書は、 2004年 10月 13日出願の特願 2004— 298942に基づく。この内容はすべてここに含めておく。

産業上の利用可能性

[0109] 本発明に係るスケーラブル符号ィ匕装置は、第 2レイヤでの符号ィ匕効率を改善すると共に、第 2レイヤでの符号化パラメータを用いて復号した原信号の品質を向上させるという効果を有し、低ビットレートで、かつ、高い再生音質が要求される移動体通信システム等に有用である。

Claims

請求の範囲

[1] 入力信号を符号ィ匕して下位レイヤ符号ィ匕パラメータを生成する下位レイヤ符号ィ匕手段と、

前記下位レイヤ符号化パラメータを復号して下位レイヤ復号信号を生成する下位レィャ復号化手段と、

前記入力信号に基づいて前記入力信号のスペクトル概形を算出する第 1スペクトル概形算出手段と、

前記下位レイヤ復号信号に基づいて前記下位レイヤ復号信号のスペクトル概形を算出する第 2スペクトル概形算出手段と、

前記下位レイヤ復号信号のスペクトル概形力前記入力信号のスペクトル概形を予測することにより予測情報を得、この予測情報を符号ィ匕して上位レイヤ符号ィ匕パラメータを生成する予測情報符号化手段と、

前記下位レイヤ符号化パラメータと前記上位レイヤ符号化パラメータとを出力する出力手段と、

を具備するスケーラブル符号ィ匕装置。

[2] 符号化された前記予測情報を復号する予測情報復号化手段と、

前記下位レイヤ復号信号のスペクトル概形と復号された前記予測情報とに基づいて前記入力信号のスペクトル概形を推定し、前記入力信号のスペクトルと前記下位レィャ復号信号のスペクトルと推定された前記入力信号のスペクトル概形とに基づいて前記入力信号のスペクトル概形に表れない前記入力信号のスペクトルの特徴を示すスペクトル微細情報を生成し符号化するスペクトル微細情報符号化手段と、

をさらに具備し、

前記出力手段は、

符号化された前記予測情報及び前記スペクトル微細情報を上位レイヤ符号化パラメータとして出力する、

ことを特徴とする請求項 1記載のスケーラブル符号ィ匕装置。

[3] 前記第 2スペクトル概形算出手段は、

前記下位レイヤ復号信号に基づいて生成された下位レイヤ復号信号のスペクトルを平滑ィ匕した後に、前記下位レイヤ復号信号のスペクトル概形を算出する、請求項 1記載のスケーラブル符号化装置。

[4] 前記予測情報符号化手段は、

前記下位レイヤ復号信号のスペクトル概形に乗じられたときに、その乗算結果を前記入力信号のスペクトル概形に最も近似させる予測係数を符号ィ匕する、

請求項 1記載のスケーラブル符号化装置。

[5] 前記予測情報符号化手段は、

前記下位レイヤ復号信号のスペクトル概形に乗じられたときに、その乗算結果を前記入力信号のスぺ外ル概形に最も近似させる予測係数が前記入力信号の所定の周波数帯域毎に複数存在する場合に、前記複数の予測係数をまとめてベクトル量子化する、

請求項 4記載のスケーラブル符号化装置。

[6] 前記予測情報符号化手段は、

前記入力信号の所定の周波数帯域毎に聴覚マスキング効果が有効に奏されるか判定し、聴覚マスキング効果が有効に奏されると判定したときに限り、前記下位レイヤ復号信号のスぺ外ル概形力前記入力信号のスぺ外ル概形を予測して予測情報を得、この予測情報を符号ィ匕して上位レイヤ符号ィ匕パラメータを生成する、

請求項 1記載のスケーラブル符号化装置。

[7] 前記予測情報符号化手段は、

前記入力信号の所定の周波数帯域毎に聴覚マスキング効果の有効性を判定し、判定された有効性の程度に応じて符号ィヒビット数を調節することにより、前記下位レィャ復号信号のスペクトル概形力前記入力信号のスペクトル概形を予測して予測情報を得、この予測情報を符号ィ匕して上位レイヤ符号ィ匕パラメータを生成する、請求項 1記載のスケーラブル符号化装置。

[8] 前記下位レイヤ符号ィ匕手段におけるサンプリングレートが、前記第 1スペクトル概形算出手段におけるサンプリングレートよりも低い、

請求項 1記載のスケーラブル符号化装置。

[9] 入力信号をスケーラブル符号ィ匕するスケーラブル符号ィ匕装置によって生成された符号化パラメータを復号するスケーラブル復号装置であって、前記符号化パラメータを復号して下位レイヤ復号信号を生成する下位レイヤ復号化手段と、

前記符号化パラメータを復号することにより、前記入力信号のスペクトル概形を予測させる予測情報を生成する予測情報復号化手段と、

前記下位レイヤ復号信号と前記予測情報とに基づいて前記入力信号のスペクトル概形を生成するスペクトル生成手段と、

を具備するスケーラブル復号装置。

入力信号を符号ィ匕して下位レイヤ符号ィ匕パラメータを生成するステップと、前記下位レイヤ符号化パラメータを復号して下位レイヤ復号信号を生成するステツプと、

前記入力信号に基づいて前記入力信号のスペクトル概形を算出するステップと、前記下位レイヤ復号信号に基づいて前記下位レイヤ復号信号のスペクトル概形を算出するステップと、

前記下位レイヤ復号信号のスペクトル概形力前記入力信号のスペクトル概形を予測することにより予測情報を得、この予測情報を符号ィ匕して上位レイヤ符号ィ匕パラメータを生成するステップと、

を具備するスケーラブル符号化方法。