JP3344944B2 - オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法 - Google Patents

オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法

Info

Publication number
JP3344944B2
JP3344944B2 JP06241398A JP6241398A JP3344944B2 JP 3344944 B2 JP3344944 B2 JP 3344944B2 JP 06241398 A JP06241398 A JP 06241398A JP 6241398 A JP6241398 A JP 6241398A JP 3344944 B2 JP3344944 B2 JP 3344944B2
Authority
JP
Japan
Prior art keywords
quantization
band
unit
audio signal
small
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP06241398A
Other languages
English (en)
Other versions
JPH1130998A (ja
Inventor
峰生 津島
武志 則松
智一 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP06241398A priority Critical patent/JP3344944B2/ja
Priority to PCT/JP1998/002135 priority patent/WO1998052188A1/ja
Priority to CNB988005271A priority patent/CN1144178C/zh
Priority to EP98919600A priority patent/EP0919989A4/en
Priority to US09/227,189 priority patent/US6904404B1/en
Priority to KR1019997001099A priority patent/KR100309727B1/ko
Publication of JPH1130998A publication Critical patent/JPH1130998A/ja
Application granted granted Critical
Publication of JP3344944B2 publication Critical patent/JP3344944B2/ja
Priority to US10/954,589 priority patent/US7243061B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3082Vector coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声信号や音楽信
号などのオーディオ信号を符号化するオーディオ信号符
号化装置、特にオーディオ信号を直交変換等の手法を用
いて時間領域から周波数領域に変換し、その変換した信
号を、源オーディオ信号と比較してできるだけ少ない符
号列で表現することができるよう効率的に符号化する装
置,及び、符号化された信号である符号化列のすべて、
あるいはその一部のみを用いて、高い品質と広帯域なオ
ーディオ信号を復号可能な構成のオーディオ信号復号化
装置,さらにはその符号化復号化を行うオーディオ信
号符号化方法,オーディオ信号復号化方法に関するもの
である。
【0002】
【従来の技術】オーディオ信号を効率的に符号化、およ
び復号化する様々な手法が提案されている。音楽信号な
ど20kHz以上の周波数帯域を有するオーディオ信号
は、特に近年、MPEGオーディオ方式などがある。M
PEG方式に代表される符号化方式は、時間軸のディジ
タルオーディオ信号をコサイン変換などの直交変換を用
いて周波数軸上のデータに変換し、その周波数軸上の情
報を、人間の聴覚的な感度特性を利用して聴覚的に重要
な情報から符号化していく方式であり、聴覚的に重要で
ない情報や冗長な情報は符号化しない方式である。源デ
ィジタル信号の情報量に対して、かなり少ない情報量で
表現しようとする場合、ベクトル量子化の手法を用いた
TC−WVQなどの符号化方式がある。MPEGオーデ
ィオ、およびTC−WVQはそれぞれISO/IEC 標準IS-1
1172-3、およびT.Moriya, H.Suga:An 8 Kbits transfor
m coder for noisy channels, Proc.ICASSP 89,pp196-1
99などに述べられている。ここで図24を用いて従来の
オーディオ符号化装置の構成について説明する。
【0003】図24において、1601は入力信号を周
波数変換するFFT部、1602は周波数変換された入
力信号のうちの特定の帯域を符号化するよう最小可聴限
とマスキング特性算出による適応ビット割り当ての算出
を行う適応ビット割り当て算出部、1603は入力信号
を複数の帯域に分割するサブバンド帯域分割部、160
4は複数に分割された帯域の各成分をスケールファクタ
を用いて正規化するスケールファクタ正規化部、160
5はスケールファクタ正規化部1604の正規化出力
を、上記適応ビット割り当て算出部1602からのビッ
ト割り当てに応じてスカラー量子化するスカラー量子化
部である。
【0004】次に動作について説明する。入力信号は、
FFT部1601と、サブバンド帯域分割部1603に
入力される。FFT部1601では、入力信号を周波数
変換して、その出力を、適応ビット割り当て部1602
に入力する。適応ビット割り当て部1602では、人間
の聴覚特性に基づいて定義された最小可聴限と、マスキ
ング特性とをもとに、ある帯域成分に対してどれくらい
の情報量を与えるべきかを算出し、その帯域ごとの情報
量配分をインデックスに符号化する。
【0005】一方、サブバンド帯域分割部1603で
は、入力信号を、例えば、32の帯域に分割し出力す
る。そしてスケールファクタ正規化部1604では、前
記サブバンド帯域分割部1603で分割されたおのおの
の帯域成分に対して、ある代表値をもって正規化を行
う。該正規化の値はインデックスIND1 として量子化
される。スカラー量子化部1605では、前記適応ビッ
ト割り当て算出部1602で算出されたビット配分をも
とに、スケールファクタ正規化部1604の出力をスカ
ラー量子化し、その量子化値をインデックスIND2
して符号化する。
【0006】
【発明が解決しようとする課題】従来のオーディオ信号
符号化装置は以上のように構成されており、MPEGオ
ーディオ方式は、1チャンネルあたり、64000ビッ
ト/秒以上の情報量で符号化されて使用される方法が一
般で、それ以下の情報量では、再生可能な周波数帯域幅
や復号されたオーディオ信号の主観的な品質が著しく劣
化する場合がある。これは、図22に示した例のよう
に、符号化された情報が、大別して、適応ビット割り当
て部1602によるビット配分,スケールファクタ正規
化部1604による帯域代表値,スカラー量子化部16
05による量子化値の3つからなり、高い圧縮率の場合
には、情報量が量子化値出力に十分に配分されないため
である。また、従来のオーディオ信号の符号化装置にお
いては、符号化する情報量と復号化する情報量とを同じ
にして、符号化装置,及び復号化装置を構成する方法が
一般的である。たとえば、1秒間に128000bit の
情報量に符号化する方法では、その復号化装置では12
8000bit の情報量を復号化するように構成されてい
る。
【0007】しかしながら、以上のようなことから、従
来のオーディオ信号符号化装置,及び復号化装置では、
良好な音質を得るためには固定された情報量で符号化,
及び復号化を行わなければならず、高い圧縮率にて高品
質な音質を得ることはできなかった。
【0008】この発明は以上のような問題点を解消する
ためになされたもので、少ない情報量で符号化,及び復
号化を行っても、高い品質と広い再生周波数帯域が得ら
れ、また符号化,及び復号化時の情報量を、固定の値で
はなくこれを可変とすることのできるオーディオ信号符
号化装置,及びおよび復号化装置,さらにはオーディオ
信号符号化・復号化方法を提供することを目的とする。
さらには、この発明は、量子化効率をさらに大きく向上
することのできるオーディオ信号符号化装置,及び復号
化装置,さらにはオーディオ信号符号化・復号化方法を
提供することを目的とする。
【0009】
【課題を解決するための手段】上記の課題を解決するた
め、本発明の請求項1の発明は、複数の階層の小量子化
部を備え、時間−周波数変換されたオーディオ信号を入
力してインデックス情報を出力するオーディオ信号符号
化装置であって、少なくとも第i階層の小量子化部は、
分割された周波数帯域毎にベクトル量子化による符号化
を行う複数の帯域分割量子化器を備え、第i+1階層以
降の小量子化部は、前階層の一部の帯域分割量子化器の
量子化誤差にベクトル量子化による符号化を行い、イン
デックス情報は、各階層の小量子化部により符号化され
たベクトルを示す階層別インデックスを含み、階層別イ
ンデックスは、複数の帯域分割量子化器により周波数帯
域が分割された符号化が行われた階層においては、分割
された周波数帯域毎の帯域別インデックスを含むことを
特徴とするものである。
【0010】本発明の請求項2の発明は、請求項1に記
載のオーディオ信号符号化装置において、量子化帯域選
択部をさらに備え、量子化帯域選択部は、第i+1階層
以降の小量子化部が符号化を行う一部の帯域分割量子化
器を量子化誤差の大きさに基づいて選出することを特徴
とするものである。
【0011】本発明の請求項3の発明は、複数の階層の
小逆量子化部を備え、インデックス情報をオーディオ信
号に復号化するオーディオ信号復号化装置であって、少
なくとも第i階層の小逆量子化部は、分割された周波数
帯域毎にベクトル逆量子化による復号化を行う複数の帯
域分割逆量子化器を備え、第i+1階層以降の小逆量子
化部は、前階層の一部の帯域分割量子化器の量子化誤差
にベクトル逆量子化による復号化を行い、インデックス
情報は、階層毎のベクトルを示す階層別インデックスを
含み、階層別インデックスは、周波数帯域が分割された
符号化が行われた階層においては、分割された周波数帯
域毎の帯域別インデックスを含むことを特徴とするもの
である。
【0012】本発明の請求項4の発明は、複数の階層の
小量子化ステップを備え、時間−周波数変換されたオー
ディオ信号をインデックス情報に変換するオーディオ信
号符号化方法であって、少なくとも第i階層の小量子化
ステップは、分割された周波数帯域毎にベクトル量子化
による符号化を行う複数の帯域分割量子化ステップを備
え、第i+1階層以降の小量子化ステップは、前階層の
一部の帯域分割量子化ステップの量子化誤差にベクトル
量子化による符号化を行い、インデックス情報は、各階
層の小量子化ステップにより符号化されたベクトルを示
す階層別インデックスを含み、階層別インデックスは、
複数の帯域分割量子化ステップにより周波数帯域が分割
された符号化が行われた階層においては、分割された周
波数帯域毎の帯域別インデックスを含むことを特徴とす
るものである。
【0013】本発明の請求項5の発明は、複数の階層の
小逆量子化ステップを備え、インデックス情報をオーデ
ィオ信号に復号化するオーディオ信号復号化方法であっ
て、少なくとも第i階層の小逆量子化ステップは、分割
された周波数帯域毎にベクトル逆量子化による復号化を
行う複数の帯域分割逆量子化ステップを備え、第i+1
階層以降の小逆量子化ステップは、前階層の一部の帯域
分割量子化ステップの量子化誤差にベクトル逆量子化に
よる復号化を行い、インデックス情報は、各階層のベク
トルを示す階層別インデックスを含み、階層別インデッ
クスは、周波数帯域が分割された符号化が行われた階層
においては、分割された周波数帯域毎の帯域別インデッ
クスを含むことを特徴とするものである。
【0014】
【0015】
【0016】
【0017】
【0018】
【0019】
【0020】
【0021】
【0022】
【0023】
【0024】
【0025】
【0026】
【0027】
【0028】
【0029】
【0030】
【0031】
【0032】
【0033】
【0034】
【0035】
【0036】
【0037】
【0038】
【0039】
【0040】
【0041】
【0042】
【0043】
【0044】
【0045】
【0046】
【0047】
【発明の実施の形態】以下、本発明の実施の形態につい
て、図面を用いて説明する。 実施の形態1. 図1は本発明の実施の形態1によるオーディオ信号符号
化装置,オーディオ信号復号化装置,オーディオ信号符
号化方法,及びオーディオ信号復号化方法の全体の構成
を示す図である。図1において、1は符号化装置であ
り、2は復号化装置である。符号化装置1において、1
01は入力信号を所定の値のフレーム数となるように分
割するフレーム分割部、102は時間軸上で、入力信号
と窓関数とを乗じる窓掛け部、103は変形離散コサイ
ン変換(Modified discrete cosinetransform)を行う
MDCT部、104はフレーム分割部101からの出力
である時間軸の信号と、MDCT部103からの出力で
あるMDCT係数との両者を入力としてそのMDCT係
数を正規化する正規化部、105は正規化されたMDC
T係数を入力として量子化を行う量子化部である。な
お、ここでは、時間周波数変換としてMDCTを用いた
場合について説明するが、これは離散フーリエ変換(D
FT:Discrete Fourier Transform)を用いてもよい。
【0048】復号化装置2において、106は符号化装
置1から出力された信号(インデックスIND2 )を受
けてこれを逆量子化する逆量子化部、107は逆量子化
部106の出力を、符号化装置1の正規化部104から
のインデックスIND1 を用いて、逆正規化する逆正規
化部、108は逆正規化部107の出力を変形離散コサ
イン変換する逆MDCT部、109は逆MDCT部10
8の出力に対して窓掛けを行う窓掛け部、110は窓掛
け部109の出力に対し、フレーム重ね合わせを行うフ
レーム重ね合わせ部である。
【0049】以上のように構成されたオーディオ信号符
号化装置,オーディオ信号復号化装置,オーディオ信号
符号化方法,及びオーディオ信号復号化方法の動作につ
いて述べる。符号化装置1に入力される信号は、時間的
に連続するディジタル信号系列であるとする。例えば、
音声信号を、サンプリング周波数48kHz で、16ビッ
トに量子化したディジタル信号であるとする。この入力
信号は、ある一定のサンプル数に達するまでフレーム分
割部101で蓄積され、蓄積されたサンプル数が規定の
フレーム長に達すると出力を行う。ここで、フレーム分
割部101のフレーム長は、例えば、128,256,
512,1024,2048,4096サンプルなどで
ある。フレーム分割部101では、入力信号の特徴に応
じてフレーム長を可変にして出力することも可能であ
る。また、フレーム分割部101は、あるシフト長ごと
に出力を行う構成のものであり、例えば、フレーム長を
4096サンプルとした場合において、フレーム長の半
分のシフト長を設定すれば、フレーム長が2048サン
プルに到達するに相当する時間ごとに最新の4096サ
ンプルを出力するなどの構成を持つ。当然ながらフレー
ム長やサンプリング周波数が変わっても、同様にシフト
長をフレーム長の半分に設定した構成を持つことは可能
である。
【0050】そしてこのフレーム分割部101からの出
力は、後段の窓掛け部102と正規化部104へとそれ
ぞれ入力される。窓掛け部102では、前記フレーム分
割部101からの出力信号に対して、時間軸上で窓関数
を乗じて、窓掛け部102の出力とする。この様子は、
例えば、数1式で示される。
【0051】
【数1】
【0052】ただし、ここで、xiはフレーム分割部10
1からの出力で、hiは窓関数、hxi は窓掛け部102か
らの出力である。また、i は時間のサフィックスであ
る。なお、数1式で示した窓関数hiは一例であり、窓関
数は必ずしも数1式のものである必要はない。窓関数の
選択は、窓掛け部102に入力される信号の特徴と、フ
レーム分割部101のフレーム長と、時間的に前後に位
置するフレームにおける窓関数の形状に依存する。例え
ば、窓掛け部102に入力される信号の特徴として、フ
レーム分割部101のフレーム長をNとした場合、N/
4ごとに入力される信号の平均パワーを算出して、その
平均パワーが非常に大きく変動する場合は、フレーム長
をNよりも短くして数1式に示した演算を実行するなど
の選択を行う。また、前の時刻のフレームの窓関数の形
状と後ろのフレームの窓関数の形状に応じて、現在の時
刻のフレームの窓関数の形状に歪みがないように適宜選
択するのが望ましい。
【0053】次いで窓掛け部102からの出力は、MD
CT部103に入力され、ここで変形離散コサイン変換
が施され、MDCT係数が出力される。変形離散コサイ
ン変換の一般式は数2式で表される。
【0054】
【数2】
【0055】このようにMDCT部103の出力である
MDCT係数は、数2式のykで表せるとすると、MDC
T部103の出力は周波数特性を示し、ykの変数k が0
に近いほど低い周波数成分に、0から増大してN/2-1 に
近くなるほど高い周波数成分に線形に対応する。正規化
部104では、フレーム分割部101からの出力である
時間軸の信号xiと、MDCT部103からの出力である
MDCT係数ykの両者を入力として、いくつかのパラメ
ータを用いて、MDCT係数を正規化する。ここでMD
CT係数の正規化とは、低域成分と高域成分とで非常に
大きさに違いのあるMDCT係数の大きさのばらつきを
抑圧することを意味し、例えば、低域成分が高域成分に
対して非常に大きい場合などは、低域成分では大きな
値、高域成分では小さな値となるようなパラメータを選
出し、これで上記MDCT係数を除算することによりM
DCT係数の大きさのばらつきを抑圧することをさす。
また正規化部104では、正規化に用いたパラメータを
表現するインデックスIND1 を符号化する。
【0056】量子化部105では、正規化部104で正
規化されたMDCT係数を入力として、MDCT係数の
量子化を行う。この際、該量子化部105は、該量子化
した値と、コードブック中にある複数のコードインデッ
クスに対応する各量子化出力との間の差が,最も小さく
なるような,そのような該コードインデックスを出力す
る。この場合、上記量子化部105で量子化した値と、
該量子化部105から出力されるコードインデックスに
対応する値との差が、量子化誤差である。
【0057】一方、復号化装置2では、符号化装置1の
正規化部104からのインデックスIND1 と、量子化
部105からのインデックスIND2 とを用いて復号を
行う。逆量子化部106では、量子化部105からのイ
ンデックスIND2 を用いて、上記符号化装置1におけ
る,正規化された時点でのMDCT係数の再生を行う。
逆量子化部106では、インデックスのすべてを用いて
もよいし、その一部分を用いてMDCT係数の再生を行
ってもよい。当然ながら、正規化部104からの出力
と、逆量子化部106の出力とは、量子化部105によ
る量子化時に量子化誤差を伴うために、量子化前の状態
と必ずしも一致しない。
【0058】逆正規化部107では、符号化装置1の正
規化部104からのインデックスIND1 から、符号化
装置1で正規化に用いたパラメータの復元を行い、逆量
子化部106の出力と該パラメータとを乗算し、MDC
T係数の復元を行う。逆MDCT部108では、逆正規
化部107からの出力であるMDCT係数から、逆MD
CTを行い、周波数領域の信号から時間領域の信号への
復元を行う。上記逆MDCT計算は、例えば、数3式で
示される。
【0059】
【数3】
【0060】ここで、yyk は逆正規化部107で復元さ
れたMDCT係数で、xx(n) は逆MDCT係数であり、
これを逆MDCT部108の出力とする。窓掛け部10
9では、逆MDCT部108からの出力xx(n) を用いて
窓掛けを行う。窓掛けは、符号化装置1の窓掛け部10
2で用いた窓を用い、たとえば、数4式で示される処理
を行う。
【0061】
【数4】
【0062】ここで、z(i)は、窓掛け部109の出力で
ある。フレーム重ね合わせ部110では、窓掛け部10
9からの出力を用いて、オーディオ信号を再生する。窓
掛け部109からの出力は、時間的に重複した信号とな
っているので、フレーム重ね合わせ部110では、例え
ば、数5式を用いて復号化装置2の出力信号とする。
【0063】
【数5】
【0064】ここで、zm(i) は第m 時刻フレームの第i
番目の窓掛け部109の出力信号z(i)であり、zm-1(i)
は第m-1 時刻フレームの第i番目の窓掛け部109の出
力信号であり、SHIFT は符号化装置のシフト長に相当す
るサンプル数であり、out(i)はフレーム重ね合わせ部1
10の第m 時刻フレームにおける復号化装置2の出力信
号とする。
【0065】次に図2を用いて、上記正規化部104の
詳細な一例を説明する。図2において、201はフレー
ム分割部101とMDCT部103の出力を受ける周波
数概形正規化部、202は周波数概形正規化部201の
出力を受け、帯域テーブル203を参照して正規化を行
う帯域振幅正規化部である。
【0066】次に動作について説明する。周波数概形正
規化部201では、フレーム分割部101からの時間軸
上のデータ出力を用いて、大まかな周波数の概形である
周波数概形を算出し、これでMDCT部103からの出
力であるMDCT係数を除算する。周波数概形を表現す
るのに用いたパラメータはインデックスIND1 として
符号化される。帯域振幅正規化部202では、周波数概
形正規化部201からの出力信号を入力として、帯域テ
ーブル203で示された帯域ごとに正規化を行う。例え
ば、周波数概形正規化部201の出力であるMDCT係
数が、dct(i)(i= 0〜2047) とし、帯域テーブル203
が、例えば、表1に示されるようなものであるとする
と、数6式などを用いて各帯域毎の振幅の平均値を算出
する。
【0067】
【表1】
【0068】
【数6】
【0069】ここで、bjlow,bjhighは帯域テーブル20
3に示されたj 番目の帯域におけるdct(i)が属する最も
低域のインデックスi と、最も高域のインデックスi を
それぞれ示している。また、p は距離計算におけるノル
ムであり、2などが望ましい。avejは、各帯域番号j に
おける振幅の平均値である。帯域振幅正規化部202で
は、avejを量子化して、qavej を算出して、例えば、数
7式を用いて正規化する。
【0070】
【数7】
【0071】avejの量子化はスカラー量子化を用いても
よいし、コードブックを用いてベクトル量子化を行って
もよい。帯域振幅正規化部202では、qavej を表現す
るのに用いたパラメータのインデックスIND1 を符号
化する。
【0072】なお、符号化装置1における正規化部10
4の構成は、図2の周波数概形正規化部201と帯域振
幅正規化部202の両者を用いた構成のものを示した
が、周波数概形正規化部201のみを用いた構成でもよ
く、帯域振幅正規化部202のみを用いた構成でもよ
い。さらに、MDCT部103から出力されるMDCT
係数の低域成分と高域成分とで大きなばらつきがない場
合は、両者を用いない構成で、MDCT部103の出力
信号をそのまま量子化部105に入力する構成としても
よい。
【0073】次に図3を用いて、図2の周波数概形正規
化部201の詳細について説明する。図3において、3
01はフレーム分割部101の出力を受ける線形予測分
析部、302は線形予測分析部301の出力を受ける概
形量子化部、303はMDCT部103の出力を受ける
包絡特性正規化部である。
【0074】次に上記周波数概形正規化部201の動作
について説明する。上記線形予測分析部301では、フ
レーム分割部101からの時間軸上のオーディオ信号を
入力として、線形予測分析(Linear Predictive Codin
g)を行う。線形予測分析の線形予測係数(LPC係
数)は、ハミング窓などの窓掛けされた信号の自己相関
関数を算出し、正規方程式などを解くことで一般に算出
可能である。算出された線形予測係数は、線スペクトル
対係数(LSP(Line Spectrum Pair) 係数)などに変
換され、概形量子化部302で量子化される。ここでの
量子化手法としてはベクトル量子化を用いてもよいし、
スカラー量子化を用いてもよい。そして概形量子化部3
02で量子化されたパラメータが表現する周波数伝達特
性を包絡特性正規化部303で算出し、MDCT部10
3からの出力であるMDCT係数をこれで除算すること
によって正規化する。具体的な算出例としては、概形量
子化部302で量子化されたパラメータと等価な線形予
測係数を、qlpc(i) とすれば、包絡特性正規化部303
で算出される上記周波数伝達特性は、例えば、数8式で
表すことができる。
【0075】
【数8】
【0076】ここでORDER は10〜40くらいが望まし
い。fft( )は高速フーリエ変換を意味する。算出された
周波数伝達特性env(i)を用いて、包絡特性正規化部30
3では、例えば下記に示す数9式を用いて正規化を行
う。
【0077】
【数9】
【0078】ここで、mdct(i) はMDCT部103から
の出力信号で、fdct(i) は正規化された包絡特性正規化
部303からの出力信号である。次に図4を用いて、符
号化装置1における量子化部105の詳細について説明
する。図4において、401は第1の小量子化部、40
2は第1の小量子化部401の出力を受ける第2の小量
子化部、403は第2の小量子化部402の出力を受け
る第3の小量子化部である。
【0079】次に上記量子化部105の動作について説
明する。上記第1の小量子化部401に入力される信号
は符号化装置の正規化部104からの出力であり、正規
化されたMDCT係数である。ただし、正規化部104
を持たない構成では、MDCT部103の出力となる。
第1の小量子化部401では、入力されたMDCT係数
をスカラー量子化、またはベクトル量子化して、量子化
に用いたパラメータを表現するインデックスを符号化す
る。また、量子化による入力MDCT係数に対する量子
化誤差を算出し、それを第2の小量子化部402へ出力
する。ここで、第1の小量子化部401では、すべての
MDCT係数を量子化してもよいし、一部のみを量子化
するようにしてもよい。当然ながら、一部のみを量子化
した場合は、第1の小量子化部401で量子化されない
帯域の量子化誤差は、量子化されない帯域の入力MDC
T係数そのものとなる。
【0080】次いで、第2の小量子化部402では、第
1の小量子化部401のMDCT係数の量子化誤差を入
力として、それをさらに量子化する。このときの量子化
も第1の小量子化部401と同様に、スカラー量子化を
用いてもよいし、ベクトル量子化を用いてもよい。そし
て、第2の小量子化部402では、量子化に用いたパラ
メータを表現するインデックスに符号化する。また、量
子化による量子化誤差を算出し、それを第3の小量子化
部403へと出力する。この第3の小量子化部403
は、上記第2の小量子化部と構成は同じである。ここ
で、上記第1の小量子化部401,第2の小量子化部4
02,第3の小量子化部403が量子化するMDCT係
数の個数、つまり、帯域幅は必ずしも均一である必要は
なく、また、量子化する帯域も同じである必要もない。
このとき、人間の聴覚特性を考慮し、第2の小量子化部
402,第3の小量子化部403は、ともに低域周波数
成分を示すMDCT係数の帯域を量子化するように設定
するのが望ましい。
【0081】このように本実施の形態1によるオーディ
オ信号符号化装置によれば、量子化を行う際に、量子化
部を階層的に設けて、即ち多段量子化手段を構成し、前
段と後段での量子化部が量子化する帯域幅を可変とした
ことにより、入力MDCT係数のうち、任意の帯域、例
えば、人間にとって聴覚的に重要な低域周波数成分に相
当する係数を重点的に量子化するようにしたから、低ビ
ットレート、すなわち高い圧縮率でオーディオ信号を符
号化した場合であっても、受信側において、高品位な音
声の再生を行うようにすることができる。
【0082】実施の形態2 次に図5を用いて、本発明の実施の形態2によるオーデ
ィオ信号符号化装置について説明する。本実施の形態2
では、符号化装置1における量子化部105の構成のみ
が上記実施の形態1と異なるので、ここでは、量子化部
の構成についてのみ説明する。図5において、501は
第1の小量子化部、502は第2の小量子化部、503
は第3の小量子化部である。上記実施の形態1との構成
上の違いは、第1の量子化部501が、入力MDCT係
数を3つの帯域(高域、中域、低域)に分割して独立に
量子化を行う点であり、これら第1の小量子化部501
を構成する各帯域の量子化部が、いわゆる”分割化ベク
トル量子化器”に相当する。一般にベクトル量子化の手
法を用いて量子化を行う場合において、入力MDCT係
数からいくつかの要素を抽出して、ベクトルを構成し、
ベクトル量子化することができる。本実施の形態2の第
1の小量子化部501では、入力MDCT係数からいく
つかの要素を抽出してベクトルを構成する際に、低域の
量子化は低域のみの要素を用いて量子化し、中域の量子
化は中域のみの要素を用いて、高域の量子化は高域のみ
の要素を用いて、それぞれベクトル量子化する構成とな
っている。
【0083】なお、本実施の形態2では、量子化の際
に、低域,中域,高域の3つの帯域に分割する方法を一
例として説明したが、分割する帯域の数は3以外の数で
あってもよい。また、第2の小量子化部502,第3の
小量子化部503についても、第1の量子化部501と
同様に、帯域をいくつかに分割して量子化を行う構成と
してもよい。
【0084】このように本実施の形態2によれば、多段
量子化手段において、まず第1段では、入力MDCT係
数を3つの帯域に分割して独立的に量子化を行うように
したので、聴覚的に重要な帯域を優先的に量子化する等
の処理を、第1回目の量子化時に行うことができ、後段
の量子化部502,503において、さらに段階的に当
該聴覚的に重要な帯域のMDCT係数の量子化を行うよ
うにすることにより、量子化誤差をより低減することが
でき、受信側において、より高品位な音質の再現を可能
とすることができる。
【0085】実施の形態3.次に図6を用いて、本発明
の実施の形態3によるオーディオ信号符号化装置につい
て説明する。本実施の形態3では、符号化装置1におけ
る量子化部105の構成のみが上記実施の形態1と異な
るものであるために、ここでは、量子化部の構成につい
てのみ説明する。図6において、601は第1の小量子
化部、602は第1の量子化帯域選択部、603は第2
の小量子化部、604は第2の量子化帯域選択部、60
5は第3の小量子化部である。上記実施の形態2との構
成上の違いは、第1の量子化帯域選択部602と、第2
の量子化帯域選択部604が加わった点である。
【0086】以下動作について説明する。上記第1の量
子化帯域選択部602では、第1の小量子化部601の
量子化誤差である出力(fdcterr (i))を用いて、第2の
小量子化部602でどの帯域のMDCT係数を量子化す
べきかを算出する。例えば、数10式で与えるesum(j)
を最大とするj を算出し、j * OFFSETからj*OFFSET +BA
NDWIDTHの帯域を量子化すればよい。
【0087】
【数10】
【0088】ここで、OFFSETは定数で、BANDWIDTH は第
2の小量子化部603が量子化する帯域幅に相当する総
サンプルである。第1の量子化帯域選択部602では、
例えば、数10式で、esum(j) の最大値を与えたj など
を、符号化してインデックスIND2 とする。第2の小
量子化部603では、これらのインデックスIND2
受けて、第1の量子化帯域選択部602で選択された帯
域を量子化する。第2の量子化帯域選択部604は、第
2の小量子化部603の量子化誤差である出力をその入
力とし、該第2の量子化帯域選択部604の選択した帯
域を、上記第3の小量子化部605に入力せしめること
を除いては、上記第1の量子化帯域選択部602と同じ
構成でこれを実現することが可能である。
【0089】なお、第1の量子化帯域選択部602,お
よび第2の量子化帯域選択部604では、数10式を用
いて、次の量子化部が量子化すべき帯域を選択する構成
を説明したが、数11式の,正規化部104で正規化に
用いた値、および人間の周波数に対する相対的な聴覚感
度特性を考慮に入れた値,を乗算した値を用いて、量子
化すべき帯域を算出するようにしてもよい。
【0090】
【数11】
【0091】ここで、env(i)はMDCT部103の出力
を正規化部104の出力で除算したものであり、zxc(i)
は人間の周波数に対する相対的な聴覚感度特性を考慮に
入れたテーブルであり、その一例を表2に示した。ま
た、数11式において、zxc(i)はすべて1として考慮に
入れない構成でもよい。
【0092】
【表2】
【0093】さらに、量子化帯域選択部は必ずしも複数
設けなくてもよく、第1の量子化帯域選択部602のみ
を用いた構成、あるいは第2の量子化帯域選択部604
のみを用いた構成としてもよい。
【0094】このように本実施の形態3では、多段量子
化手段により多段的に量子化を行う際に、前段の量子化
部と次段の量子化部との間に量子化帯域選択部を設け、
量子化する帯域を可変として適宜選択するようにするこ
とで、入力信号に応じて適宜、量子化する帯域を変化さ
せることが可能となり、量子化の自由度を向上すること
ができ、量子化の必要な部分を重点的に量子化して、量
子化効率を大きく向上することができる。
【0095】以下に、図1および図13を用いて、上記
実施の形態1〜3の符号化装置1における量子化部10
6の量子化方法の詳細な動作について説明する。各小量
子化部に入力されるMDCT係数1401は、そのMD
CT係数1401から幾つかを抜き出して音源サブベク
トル1403を構成する。同様に、正規化部104にお
いて、正規化部104の入力であるMDCT係数を、正
規化部104の出力であるMDCT係数で割った係数列
を、正規化成分1402とした時、該正規化成分140
2についても、音源サブベクトル1403をMDCT係
数1401から抜き出したのと同じ規則で、該正規化成
分1402から抽出し、重みサブベクトル1404を構
成することができる。このように、音源サブベクトル1
403,および重みサブベクトル1404を、MDCT
係数1401,および正規化成分1402からそれぞれ
抽出する規則は、例えば、数14式で示す方法などがあ
る。
【0096】
【数14】
【0097】ここで、i 番目の音源サブベクトルのj 番
目の要素はsubvector i(j)であり、MDCT係数140
1はvector()であり、MDCT係数1401の総要素数
がTOTAL で、音源サブベクトル1403の要素数がC
R、VTOTALは、TOTAL と同じ値かより大きい値で,VTOT
AL/CR が整数値になるように設定する。例えば、TOTAL
が2048の時、CRが19で,VTOTALが2052、C
Rが23で,VTOTALが2070、CRが21で,VTOTAL
が2079などである。重みサブベクトル1404につ
いても、数14式の手順で抽出可能である。
【0098】ベクトル量子化器1405では、コードブ
ック1409中のコードベクトルの中から、音源サブベ
クトル1403との距離が、重みサブベクトル1404
で重みつけて最も小さくなるものを探し、その最小の距
離を与えたコードベクトルのインデックスIND2 と、
最小の距離を与えたコードベクトルと入力音源サブベク
トル1403との量子化誤差に相当する残差サブベクト
ル1410を出力する。実際の計算手順例としては、該
ベクトル量子化器1405は、距離計算手段1406,
コード決定手段1407,及び残差生成手段1408,
の3つの構成要素を有するものとして説明する。距離計
算手段1406では、例えば、数15式を用いて、i 番
目の音源サブベクトル1403と、コードブック140
9のk 番目のコードベクトルとの距離を算出する。
【0099】
【数15】
【0100】ここでwjは重みサブベクトルのj 番目の要
素、ck(j) はk 番目のコードベクトルのj 番目の要素、
R、Sは距離計算のノルムであり、R、Sの値としては
1, 1.5, 2 などが望ましい。なお、この距離計算のノル
ムRと、Sは同一の値である必要はない。dik はi 番目
の音源サブベクトルに対するk 番目のコードベクトルの
距離を意味する。コード決定手段1407では、数15
式などで算出された距離の中で最小となるコードベクト
ルを選出し、そのインデックスを符号化する(IN
2 )。例えば、diu が最小値の場合、i 番目のサブベ
クトルに対する符号化されるインデックスはu となる。
残差生成手段1408では、コード決定手段1407で
選出したコードベクトルを用いて、数16式を用いて、
残差サブベクトル1410を生成する。
【0101】
【数16】
【0102】ここでi 番目の残差サブベクトル1410
のj 番目の要素は、resi(j) であり、コード決定手段1
407で選出されたu 番目のコードベクトルのj 番目の
要素を、cu(j) とする。残差サブベクトル1410は、
数14式の逆過程などを行うことにより、それ以降の小
量子化部の量子化対象となるMDCT係数として保持さ
れる。ただし、ある帯域の量子化がそれ以降の小量子化
部に影響を与えない帯域の量子化を行っている場合、つ
まり以降の小量子化部が量子化をすることがない場合
は、残差生成手段1408,残差サブベクトル141
0,及びMDCT係数1411の生成は必要ない。なお
コードブック1409が持つコードベクトルの個数はい
くつでもよいが、メモリ容量、計算時間等を考慮する
と、64程度とすることが好ましい。
【0103】なお、上記ベクトル量子化器1405の他
の実施の形態として、以下のような構成も可能である。
すなわち、距離計算手段1406では、数17式を用い
て距離を算出する。
【0104】
【数17】
【0105】ただし、Kはコードブック1409のコー
ド検索に用いるコードベクトルの総数である。コード決
定手段1407では、数17式で算出された距離dik の
最小値を与えるk を選出し、そのインデックスを符号化
する(IND2 )。ただし、k は0から2K-1までの値と
なる。残差生成手段1408では、数18式を用いて残
差サブベクトル1410を生成する。
【0106】
【数18】
【0107】コードブック1409が持つコードベクト
ルの個数はいくつでもよいが、メモリの容量、計算時間
等を考慮すると、64程度とすることが好ましい。ま
た、重みサブベクトル1404としては、これを正規化
成分1402のみから生成する構成について述べたが、
重みサブベクトル1404に、人間の聴覚特性を考慮し
た重みをさらに乗じて、重みサブベクトルを生成するこ
とも可能である。
【0108】以上のような本実施の形態3によれば、第
1の小量子化部と第2の小量子化部との間に第1の量子
化帯域選択部を、第2の小量子化部と第3の小量子化部
との間に第2の量子化帯域選択部を、それぞれ設けて、
上記第2の小量子化部,第3の小量子化部で量子化する
帯域を可変として適宜選択するようにしたので、入力信
号に応じて適宜、量子化する帯域を変化させることが可
能となり、量子化の自由度を向上することができ、量子
化の必要な部分を重点的に量子化して、量子化効率を大
きく向上することができる効果が得られる。
【0109】さらに、上記実施の形態1〜3では、入力
オーディオ信号を周波数変換して得られた周波数特性信
号系列に対し、ベクトル量子化を行い、オーディオ信号
の符号化をするオーディオ信号符号化装置において、上
記周波数特性信号系列,またはその一部をベクトル量子
化する第1段目のベクトル量子化器と、上記第1段目の
ベクトル量子化器による量子化誤差成分をベクトル量子
化する第2段目のベクトル量子化器とを、少なくとも、
有する多段量子化手段を構成するようにするとともに、
該多段量子化手段の各段の量子化手段は、上記周波数特
性信号系列を,少なくとも2つ以上の,複数の段間で重
複する部分を有し得る周波数帯域に,各段毎の分割の仕
方により分割した,複数の周波数帯域のいずれかの帯域
の係数列をベクトル量子化する,少なくとも一つ以上の
分割化ベクトル量子化器を備えた構成とすることがで
き、このような構成により、入力MDCT係数のうち、
任意の帯域、例えば、人間にとって聴覚的に重要な低域
周波数成分に相当する係数を重点的に,所望の深さに量
子化するようにし、一方、復号化側では、複数段階の復
号化された符号を用いて復号を行うことも可能とし、ま
た、復号化の順は、帯域拡張に寄与するものと、品質向
上に寄与するものを交互に復号する構成を採ることも可
能にすることにより、低ビットレート、すなわち高い圧
縮率でオーディオ信号を符号化した場合であっても、ま
た、固定された情報量で符号化、及び復号化を行なわな
くとも、受信側において、高品位な音声の再生を行うよ
うにすることができる効果が得られる。
【0110】実施の形態4.次に図1、図7〜図11を
用いて、本発明の実施の形態4によるオーディオ信号復
号化装置について説明する。符号化装置1からの出力で
あるインデックスは、正規化部104の出力したインデ
ックスIND1 と、量子化部105の出力したインデッ
クスIND2 とに大きく分けられる。
【0111】正規化部104の出力したインデックスI
ND1 は、逆正規化部107で復号し、量子化部105
の出力したインデックスIND2 は逆量子化部106で
復号する。ここで逆量子化部106では、量子化部10
5の出力したインデックスIND2 の一部分のみを用い
て復号することも可能である。
【0112】すなわち、以下に、符号化装置1における
量子化部105の構成を図5に示す構成のものとした場
合に、復号化装置1において、図7の構成を有する逆量
子化部を用いて逆量子化を行う場合について説明する。
図7において、701は第1の低域成分の逆量子化部で
ある。この第1の低域成分の逆量子化部701では、第
1の小量子化部501の低域成分のインデックスIND
21のみを用いて復号化を行う。
【0113】このようにすることで、即ち上記のように
第1の低域成分の逆量子化部701では、第1の小量子
化部501の低域成分のインデックスのみを用いて復号
化を行うようにすることで、符号化装置1から送信され
てくる情報量に関わらず、符号化されたオーディオ信号
の所望の情報量分を復号化することができる。即ち、受
信側で復号化する情報量が制限されている場合において
も、符号化する情報量と復号化する情報量とを異なる値
として、所望の情報量分のみを復号化するようにするこ
とができる。従って、受信者側での通信環境等に応じ
て、復号する情報量を変化させることができ、例えば、
通常の公衆電話網を利用しているような場合において
も、安定に高品位な音質を得ることができるようにな
る。
【0114】図8は逆量子化を2段階で行う際のオーデ
ィオ信号復号化装置の逆量子化部の構成を示す図であ
り、図8において、704は第2の逆量子化部である。
この第2の逆量子化部704では、第2の小量子化部5
02のインデックスIND3 を用いて復号化を行う。従
って、第1の低域成分の逆量子化部701からの出力I
ND21’と、第2の逆量子化部704からの出力IND
3 ’との加算値が、逆量子化部106の出力として出力
されることになる。ただし、ここでの加算は、量子化時
にそれぞれの小量子化部が量子化した帯域と同じ帯域に
加算していく。
【0115】このように、第1の小量子化部(低域)の
インデックスIND21を第1の低域成分の逆量子化部7
01により復号化するとともに、第2の小量子化部のイ
ンデックスIND3 を逆量子化する際に、上記第1の低
域成分の逆量子化部701の出力IND21’をも該逆量
子化の対象に加算して逆量子化を行うようにすることに
より、逆量子化を2段階で行うことができ、多段階で量
子化されたオーディオ信号を正確に復号化することがで
き、より高品質な音質を得ることができるようになる。
【0116】また、図9は逆量子化を2段階で行う際
に、対象となる帯域を拡大して行うようにしたオーディ
オ信号復号化装置の逆量子化部の構成を示す図であり、
図9において、702は第1の中域成分の逆量子化部で
ある。この第1の中域成分の逆量子化部702では、第
1の小量子化部501の中域成分のインデックスIND
22を用いて復号化を行う。従って、第1の低域成分の逆
量子化部701からの出力IND21’と、第2の逆量子
化部704からの出力IND3 ’と、第1の中域成分の
逆量子化部702からの出力IND22’との加算値が、
逆量子化部106の出力として出力されることになる。
ただし、ここでの加算は、量子化時にそれぞれの小量子
化部が量子化した帯域と同じ帯域に加算していく。この
ようにすることで、再生される音の帯域を拡大すること
ができ、より高品質なオーディオ信号の再生を行うこと
ができるようになる。
【0117】また、図10は、図9の構成を有する逆量
子化部において、逆量子化する段数を3段階で行う際の
オーディオ信号復号化装置の逆量子化部の構成を示す図
であり、図10において、705は第3の逆量子化部で
ある。第3の逆量子化部705では、第3の小量子化部
503のインデックスを用いて復号化を行う。従って、
第1の低域成分の逆量子化部701からの出力IN
21’と、第2の逆量子化部704からの出力IN
3 ’と、第1の中域成分の逆量子化部702からの出
力IND22’と、第3の逆量子化部705からの出力I
ND4 ’との加算値が、逆量子化部106の出力として
出力されることになる。ただし、ここでの加算は、量子
化時に、それぞれの小量子化部が量子化した帯域と同じ
帯域に加算していく。
【0118】さらに、図11は、図10の構成を有する
逆量子化部において、逆量子化を3段階で行う際に、対
象となる帯域を拡大して行うようにしたオーディオ信号
復号化装置の逆量子化部の構成を示す図であり、図11
において、703は第1の高域成分の逆量子化部であ
る。第1の高域成分の逆量子化部703では、第1の小
量子化部501の高域成分のインデックスを用いて復号
化を行う。第1の低域成分の逆量子化部701からの出
力IND21’と、第2の逆量子化部704からの出力I
ND3 ’と、第1の中域成分の逆量子化部702からの
出力IND22’と、第3の逆量子化部705からの出力
IND4 ’と、第1の高域成分の逆量子化部703から
の出力IND23’との加算値が、逆量子化部106の出
力として出力されることとなる。ただし、ここでの加算
は、量子化時にそれぞれの小量子化部が量子化した帯域
と同じ帯域に加算していく。
【0119】なお、本実施の形態4では、復号化部10
6が、図5の構成を有する量子化部105によって量子
化された情報を、逆量子化する場合を例に挙げて説明し
たが、量子化部105の構成は、図4や図6に示した構
成でも同様に行うことができる。
【0120】また、量子化部として、上記図5に示され
るような構成の量子化部を用いて符号化を行い、その逆
量子化部として、図11に示すような構成を有する逆量
子化部を用いて復号化する場合には、図15に示すよう
に、第1の小量子化部の低域のインデックスを逆量子化
した後、次段の第2の小量子化部502のインデックス
を逆量子化し、再度第1の小量子化部の中域のインデッ
クスを逆量子化するというように、帯域を拡大するため
の逆量子化と、量子化誤差を低減するための逆量子化と
を交互に繰り返し行うが、図4に示したような構成の量
子化部によって符号化された信号を、図11に示すよう
な構成を有する逆量子化部を用いて復号化する場合に
は、図4の構成においては、分割された帯域がないの
で、順次、次段の逆量子化部にて量子化された係数を、
復号化する処理を行うことになる。
【0121】次に図1および図14を用いて、上記復号
化装置2を構成する逆量子化部106の詳細な動作につ
いて説明する。逆量子化部106は、例えば、図7に示
した逆量子化部を有する場合は、第1の低域の逆量子化
部701から構成され、図8に示した逆量子化部を有す
る場合は、第1の低域の逆量子化部701と、第2の逆
量子化部704,の2つの逆量子化部,から構成され
る。
【0122】ベクトル逆量子化器1501は、符号化装
置1における,ベクトル量子化部105からのインデッ
クスIND2 を用いてMDCT係数の再生を行う。小量
子化部が図7に示した構成を有するものである場合の逆
量子化は、インデックスIND21からインデックス番号
を復号化して、その番号のコードベクトルを、コードブ
ック1502から選出する。コードブック1502は、
符号化装置1におけるコードブックと同様の内容のもの
とする。この選出されたコードベクトルから、再生サブ
ベクトル1503が得られ、これは、数14式の逆過程
で逆量子化されたMDCT係数(i,j )1504とな
る。
【0123】また、小量子化部が図8に示した構成を有
するものである場合の逆量子化は、インデックスIND
21、及びインデックスIND3 からインデックス番号k
を復号して、数19式で算出される番号u のコードベク
トルを、コードブック1502から選出する。
【0124】
【数19】
【0125】再生サブベクトルは、数20式を用いて生
成する。
【0126】
【数20】
【0127】ここでi 番目の再生サブベクトルのj 番目
の要素はresi(j) とする。次に図1、及び図12を用い
て、オーディオ信号復号化装置2を構成する逆正規化部
107の詳細な構成について説明する。図12におい
て、1201は周波数概形逆正規化部、1202は帯域
振幅逆正規化部、1203は帯域テーブルである。周波
数概形逆正規化部1201は、周波数概形正規化部20
1からのインデックスIND11を入力として、周波数概
形を再生し、逆量子化部106からの出力に対して、前
記周波数概形を乗算して出力する。帯域振幅逆正規化部
1202では、帯域振幅正規化部202からのインデッ
クスIND12を入力として、帯域テーブル1203に示
された各帯域ごとの振幅値を、乗算により復元する。帯
域振幅正規化部202からのインデックスIND12を用
いて復元された各帯域ごとの値を、qavej とすると、帯
域振幅逆正規化部1202の演算は、数12式で与えら
れる。
【0128】
【数12】
【0129】ここで、周波数概形逆正規化部1201の
出力を n_dct(i)、帯域振幅逆正規化部1202の出力
をdct(i)とした。また、帯域テーブル1203と図2の
帯域テーブル203は同様である。
【0130】次に図16は復号化装置2を構成する周波
数概形逆正規化部1201の詳細な構成について説明す
る。図16において、1301は概形逆量子化部、13
02は包絡特性逆正規化部である。概形逆量子化部13
01では、符号化装置1における概形量子化部301か
らのインデックスIND13を用いて、周波数概形を表す
パラメータ、例えば、線形予測係数等を復元する。復元
された係数が線形予測係数ならば、例えば、数8式と同
様に算出することにより、量子化された包絡特性E13
復元する。復元された係数が線形予測係数でない場合、
例えば、LSP係数などの場合も、これを周波数特性に
変換して、包絡特性E13を復元する。包絡特性逆量子化
部1302では、数13式で示されるように、復元され
た包絡特性E13と、逆量子化部106からの出力IND
16とを乗算して出力とし、帯域振幅逆正規化部1201
へ入力する。
【0131】
【数13】
【0132】このような本実施の形態4によれば、量子
化手段で量子化する前に、正規化手段を設けて、入力オ
ーディオ信号の正規化を行った後に量子化を行うように
したので、正規化手段と量子化手段とがそれぞれの能力
をフルに発揮した符号化を行って,元オーディオ信号の
もつ情報量を損失することない、量子化誤差の少ない、
量子化効率の良い量子化を行うことができる。また、受
信側での情報量が限られているときには、帯域が狭くて
浅い領域でしか逆量子化を行うことができないが、この
逆量子化を順次、帯域を広くする方向と逆量子化の深さ
を深くする方向とに交互に拡張して、受信側での情報量
を増大していくことにより、符号化装置1から送信され
てくる情報量に関わらず、符号化されたオーディオ信号
の所望の情報量分を復号化することができる。従って、
受信者側での通信環境等に応じて復号する情報量を変化
させるようにすることにより、例えば、通常の公衆電話
網を利用しているような場合においても、安定に高品位
な音質を得ることができるようになる効果が得られる。
【0133】実施の形態5.次に図18を用いて、本発
明の実施の形態5によるオーディオ信号符号化装置につ
いて説明する。本実施の形態5では、符号化装置1にお
ける量子化部105の構成のみが上記実施の形態と異な
るので、ここでは量子化部の構成についてのみ説明し、
他の構成については説明を割愛する。
【0134】図18において、1801は第1の正規化
部、1802は第1の小量子化部、1803は第1の量
子化帯域選択部、1804は第2の正規化部、1805
は第2の小量子化部、1806は第2の量子化帯域選択
部、1807は第3の正規化部、1808は第3の小量
子化部、1809は第3の量子化帯域選択部である。実
施の形態3との構成上の差異は、第2,及び第3の正規
化部1804,1807が付加された点である。
【0135】次に本実施の形態5の各構成要素を説明す
る。第1,第2,第3の正規化部1801,1804,
1807は、実施の形態1の正規化部104と同じ構成
にて実現できる。また、第1,第2,第3の小量子化部
1802,1805,1808は、実施の形態3の第1
の小量子化部601と同じ構成にて実現できる。また、
第1,第2,第3の量子化帯域選択部1803,180
6,1809は、実施の形態3の第1の量子化帯域選択
部602と同じ構成にて実現できる。本実施の形態5で
は、正規化部、小量子化部、量子化帯域選択部の3つか
ら成る組み合わせを3セット有する場合について説明す
るが、この組み合わせは3セットでなくてもよく、4セ
ット以上であっても、2セットであってもよい。また、
最終段のセットの量子化帯域選択部は、必ずしも必要が
ない場合もあり、省略することも可能である。
【0136】次に、図18の本実施の形態5による符号
化装置の動作について説明する。図18において、本実
施の形態5に入力される入力オーディオ信号のMDCT
係数は、まず第1の正規化部1801で正規化処理を施
し、正規化されたMDCT係数を出力する。第1の小量
子化部1802では、第1の正規化部1801からの出
力信号である正規化されたMDCT係数を量子化する。
第1の小量子化部1802では、量子化に用いたパラメ
ータをインデックスとして、さらには、この際の量子化
において生じた量子化誤差を、次段の量子化帯域選択部
1803に出力する。第1の量子化帯域選択部1803
では、第1の小量子化部1802の出力を用いて、第2
の小量子化部1805においてどの帯域のMDCT係数
を量子化すべきかを算出する。
【0137】第2の正規化部1804では、第1の小量
子化部1802の出力であるMDCT係数を、第1の量
子化帯域選択部1803が帯域選択した結果に基づい
て、その選択した帯域に関して正規化する。第2の小量
子化部1805では、第2の正規化部1804の出力を
量子化し、この際の量子化に用いたパラメータをインデ
ックスとして出力するとともに、この際の量子化におい
て生じた量子化誤差をも出力する。第2の量子化帯域選
択部1806では、第2の小量子化部1805の出力を
用いて、第3の小量子化部1808においてどの帯域の
MDCT係数を量子化すべきかを算出する。
【0138】第3の正規化部1807では、第2の小量
子化部1805の出力であるMDCT係数を、第2の量
子化帯域選択部1806が帯域選択した結果に基づい
て、その選択した帯域に関して正規化する。第3の小量
子化部1808では、第3の正規化部1807の出力を
量子化し、この際の量子化に用いたパラメータをインデ
ックスとして出力するとともに、この際の量子化におい
て生じた量子化誤差をも出力する。
【0139】図示する第3の量子化帯域選択部1809
は、この後段にさらに第4の小量子化部(図示せず)が
存在する場合に要するものである。もし第4の小量子化
部が存在するならば、この第3の量子化帯域選択部18
09は、第3の小量子化部1808の出力を用いて、第
4の小量子化部においてどの帯域のMDCT係数を量子
化すべきかを算出する。なお、第1,第2,第3の正規
化部1801,1804,1807は、いずれも実施の
形態1の正規化部105と同様に、正規化に用いたパラ
メータをインデックスとして出力する。
【0140】以下、本実施の形態5の符号化装置の動
作,作用の特徴について、上記実施の形態1〜3の符号
化装置と比較しながら説明する。上記実施の形態1〜3
によるオーディオ信号符号化装置における正規化手段を
有する構成においては、図19(a) に示すように、時間
軸上の音声信号波形を、MDCT,FFTにより周波数
軸上の波形に変換し、正規化手段によりその正規化A、
すなわち、概形抽出と、該抽出した概形の振幅値による
除算とを、図20(a) に示すように該周波数軸上波形の
全周波数範囲について行い、その後、その正規化出力に
対して、上記全周波数範囲を分割した,例えば3つの周
波数領域、即ち低域,中域,高域の各々につき、量子化
x,y,z を行うようにしたもので、これにより、量子化出
力=A(x+y+z)を得る。
【0141】これに対し、本実施の形態5は、図20
(b) に示すように上記分割化した各量子化手段の前段
に、各々正規化手段α,β,γを備え、まず図19(d)
に示すように、周波数軸上の波形を複数の周波数帯域に
分割した後に、各分割した周波数帯域の各々毎に正規
化,及び量子化を行うようにしたもので、その結果、量
子化出力=αx+βy+γzを得るものである。その全
体の様子を、さらに図21に示している。
【0142】一般に、オーディオ信号の周波数特性に非
常にかたよりがある場合、例えば、音声情報のように低
域に集中しているような信号である場合は、これを全体
的におおざっぱに正規化してしまうと、上記低域の特徴
のあるところを重点的に正規化,量子化することができ
ない。すなわち、全体的なおおざっぱな正規化は、信号
変化の細かいところまで信号のエンベロープをとらない
こととなり、該信号変化の細かいところの情報を損失し
てしまうこととなる。従って、このような正規化を行っ
たのち、量子化を行い、ここで量子化器はその自己の能
力をフルに発揮したとしても、信号変化の細かいところ
の情報をひろっていない信号に対して量子化を行なって
いることとなり,あまり意味のない量子化を行ってい
る,いいかえると、正規化,量子化をあわせた効果がで
にくい量子化を行っていることとなる。即ち、正規化手
段を設けるのであれば、正規化手段,量子化手段の両方
が各々の能力をフルに発揮することができるのが望まし
い訳であるが、逆に非常におおざっぱな信号のときに
は、単に全体をおおざっぱに正規化しても、結果はそれ
ほど変わらないものである。
【0143】ここで、図20(a) は、図1に示される正
規化部104を有する,上記実施の形態1〜3のオーデ
ィオ信号符号化装置における,正規化手段と、各量子化
手段との関係を示すものであるが、この構成のように、
正規化手段Aが入力オーディオ信号の周波数特性信号系
列の全体を正規化する構成には、上述したように、入力
オーディオ信号が、例えば低域に集中しているような,
周波数的にかたよりのある信号,の場合には、正規化手
段,量子化手段の両方が各々の能力をフルに発揮するこ
とができる構成ではないと考えられる。
【0144】これに対し、図20(b) に示すように、各
量子化手段x ,y ,z が、その前段に各々正規化手段
α,β,γを備えている,本実施の形態5による構成で
は、各量子化手段が量子化しようとするその対象の信号
毎に、正規化を行うようにしているので、各正規化手段
は、量子化を行おうとする各量子化手段の負荷を考慮し
た最適な正規化,即ち各量子化されるべき信号のレベル
を、各量子化手段がフルにその能力を発揮することので
きるレベルにもってくる正規化,を行うことができ、正
規化手段と量子化手段とを合わせた最大の効果を出すよ
うにすることができるものである。
【0145】即ち、本実施の形態5による符号化装置に
おける正規化部,量子化部の構成は、図20(b) に示す
ように、入力オーディオ信号を周波数変換して得た周波
数特性信号系列、あるいは該周波数特性信号系列の周波
数帯域を分割したある周波数帯域Aの係数列に対して、
まず、第1段目の正規化手段α,量子化手段x により、
正規化,量子化を行い、かつ、2段目の正規化手段β,
量子化手段y により、上記1段目の周波数帯域Aの係数
列に対して隣接する周波数帯域Bの係数列に対して、正
規化,量子化を行い、さらに、第3段目の正規化手段
γ,量子化手段zにより、上記2段目の周波数帯域Bの
係数列に対して隣接する周波数帯域Cの係数列に対し
て、正規化,量子化を行う構成としたものである。
【0146】あるいは、図20(c) に示すように、
第2段目の正規化手段β,量子化手段yは、上記1段目
の周波数帯域Aに対して一部重なりをもって隣接する周
波数帯域Bにて、その重なり部分では1段目の出力であ
る量子化誤差に対して、その他の部分では上記周波数特
性信号系列の該周波数帯域Bの係数列に対して、正規
化,量子化を行う、第3段目の正規化手段γ,量子化手
段z により、上記2段目の周波数帯域Bの係数列に対し
て一部重なりをもって隣接する周波数帯域Cにて、その
重なり部分では2段目の出力である量子化誤差に対し
て、その他の部分では上記周波数特性信号系列の該周波
数帯域Cの係数列に対して、正規化,量子化を行う構成
としたものである。
【0147】以上の図20(b),(c) に示した構成では、
各量子化手段による量子化毎に正規化を行うことによ
り、各正規化手段が、各量子化手段の負荷を考慮した正
規化を行って、各正規化手段,量子化手段がそれらの能
力をフルに発揮した量子化を行うことができ、量子化効
率を大きく向上することができる。なお、図20(b),
(c) における各段の正規化, 量子化手段の処理する周波
数帯域,及び量子化の深さは、これらの例のものに限ら
れるものではなく、さらに任意に調整することができ
る。
【0148】次に、第1段目ないし第3段目の正規化,
量子化手段による,正規化,量子化の手法の一例につい
て、図18,図22を用いて説明する。本実施の形態5
では、第1,第2,第3の各正規化部1801,180
4,1807として、上記実施の形態1の正規化部10
4と同様の構成でも実現可能であるが、正規化のパラメ
ータ算出手法としては、他の手法を用いて実現してもよ
く、例えば、各々の正規化部に入力されるMDCT係数
から直接、LPC係数やLSP係数などを算出し、これ
らを正規化のパラメータとして正規化部を構成すること
もできる。図22において、T1,T2,T3 は各段目の正
規化手段α, β,γがそれぞれ用いる正規化のためのテ
ーブルであり、これらは以下の方法で求める。
【0149】即ち、入力オーディオ信号として入力され
る可能性のある種々の音源信号のMDCT係数に対し
て、LPC(Linear Predictive C
oding) 分析を行い、LSP(Line Spectrum Pa
ir) 係数を求める。そして、この動作を音源毎に繰返
し、すべてのフレーム毎にLSP係数を求める処理を行
い、これらをすべて集めた上で、クラスタ分析をかけ
て、代表的な複数のエンベロープパターンを求め、これ
らを、第1段目の正規化手段αの正規化テーブルT1 と
する。
【0150】こうして得られた複数のエンベロープパタ
ーンを用いて、1段目の正規化,量子化の処理を行い、
その出力に対して上記と同じLPC分析からの処理を行
い、上記と同様にして、複数のエンベロープパターンを
求め、これらを、第2段目の正規化手段βの正規化テー
ブルT2 とする。
【0151】以下、同様にして、第3段目の正規化手段
γの正規化テーブルT3 を求める。このようにして、第
1段目ないし第3段目の各量子化手段による量子化とし
て、各量子化手段の負荷を考慮して、正規化と量子化の
それぞれの能力をフルに発揮した最適の量子化を行うこ
とができるようにするための,正規化手段の正規化テー
ブルT1,T2,T3 を得ることができる。
【0152】このような構成のオーディオ信号符号化装
置では、複数種類の種々の音源信号からなるものと考え
ることのできる入力オーディオ信号が、本装置に入力さ
れると、該入力オーディオ信号は、図19(a) から(b)
に示されるように、時間軸上のデータからMDCT F
FTにより周波数軸上のデータに変換される。そして、
該周波数軸上のデータに変換された信号は、図19(b)
から(c) に示されるように、その概形抽出が行われる。
このときの概形抽出は、第1段目の正規化手段αの正規
化テーブルT1 を用いて行い、結果得られる概形は、例
えば20個位のLSPの多項式でつくられるものであ
る。そして、得られた概形で上記該周波数軸上のデータ
に変換された信号を除算することにより、正規化αが行
われる。そして、該正規化が行われたのちは、これを量
子化手段x により量子化し、第1段の正規化,量子化が
完了する。これにより、上記複数種類の種々の音源信号
の特徴を考慮した効率のよい量子化を行うことができて
いる。
【0153】次に、第2段目の正規化,量子化手段によ
り、第1段目で正規化,量子化の対象とした,周波数特
性信号系列の分割したある周波数領域Aの係数列,と異
なる周波数領域Bの係数列に対して、あるいは上記第1
段目の正規化,量子化の結果である量子化誤差の出力に
対して、上記第2段目の正規化テーブルT2 を用いて、
第2段目の正規化,量子化を行う。これにより、やはり
上記複数種類の種々の音源信号の特徴を考慮した,所要
の周波数帯域に重点をおいた、あるいは所要の周波数帯
域部分の量子化の深さに重点をおいた、効率のよい量子
化を行うことができる。
【0154】さらに、第2段目の正規化,量子化手段に
より、第1段目,第2段目で正規化,量子化の対象とし
た,周波数特性信号系列の分割した各周波数領域の係数
列と異なる周波数領域の係数列に対して、あるいは上記
第2段目の正規化,量子化の結果である量子化誤差の出
力に対して、第3段目の正規化テーブルT3 を用いて、
第3段目の正規化,量子化を行う。これによっても、や
はり上記複数種類の種々の音源信号の特徴を考慮した,
所要の周波数帯域に重点をおいた、あるいは所要の周波
数帯域部分の量子化の深さに重点をおいた、効率のよい
量子化を行うことができる。
【0155】このように、上記で説明したような方法で
作成した,正規化テーブルT1,T2,T3 を用いて、各段
の正規化α,量子化x 、正規化β,量子化y 、正規化
γ,量子化z を行うことにより、量子化されるべき対象
である信号の性質等に応じて、量子化への過度の負担を
軽減するような正規化を行うことができ、量子化効率を
大きく改善することができ、再生側での品質を大きく向
上できるものである。
【0156】また、本実施の形態5による符号化装置に
対する、復号化装置の構成は、図23(b),(c) に示すよ
うに、図20(b),(c) に示した符号化装置側の構成に対
応して、上記オーディオ信号符号化装置の量子化部の各
量子化器からの信号を受けて、上記周波数特性信号系列
の複数の周波数帯域に分割した各周波数帯域の係数列に
相当する信号を、再生する逆量子化部x ’,y ’,z ’
と、該複数の逆量子化部の各々毎に設けられ、その出力
である周波数特性信号系列の係数列と、上記オーディオ
信号符号化装置の出力である正規化に関する符号をもと
に再生した正規化成分とを乗算して、符号化前の周波数
特性信号系列の各係数列に相当する信号を出力する複数
の逆正規化部α’,β’,γ’と、該複数の各逆正規化
部の出力を受けて、元のオーディオ信号に相当する信号
に出力する逆周波数変換部(図示せず)とを備えたもの
となる。
【0157】また、該復号化装置における逆正規化,逆
量子化を、量子化の帯域が広くなる方向と、量子化の深
さが深くなる方向とを交互に行うようにすれば、上記実
施の形態4において説明したのと同様に、符号化装置か
ら送信されてくる情報量に関わらず、符号化されたオー
ディオ信号の所望の情報量分を復号化することができ
る。即ち、受信者側での通信環境等に応じて、復号する
情報量を変化させることができ、例えば、通常の公衆電
話網を利用しているような場合においても、安定に高品
位な音質を得ることができる効果が得られる。
【0158】なお、上記実施の形態5において、第1,
第2,第3の量子化帯域選択部1803,1806,1
809の構成は、各々あらかじめ設定しておいた量子化
すべき周波数帯域を出力する構成としても実現可能であ
る。この場合は、第1,第2,第3の量子化帯域選択部
1803,1806,1809では、量子化すべき帯域
を算出する計算を行うことなく、各々あらかじめ設定し
ておいた量子化すべき周波数帯域を出力することとな
り、構成をより簡素化することができる。
【0159】また、上記実施の形態5における、第1,
第2,第3の量子化帯域選択部1803,1806,1
809の構成は、人間の聴覚特性に基づいて量子化すべ
き周波数帯域を出力として得るために、静寂時の最小可
聴特性と、ある入力周波数成分によってその近傍の周波
数成分の音が聞こえにくくなるマスキング特性との2つ
の特性を用いて、帯域の選択を行うように構成すること
も可能である。
【0160】このような本実施の形態5のオーディオ信
号符号化装置によれば、多段量子化を行う量子化手段の
前段に各々正規化手段を設けて、分割した各周波数毎
に、かつ各段の量子化毎に正規化を行ったのち量子化を
行うようにしたので、周波数領域毎の正規化により各周
波数領域のオーディオ信号のもつ情報量に応じた適切な
符号化を行って、即ち、正規化手段と量子化手段とがそ
れぞれの能力をフルに発揮した符号化を行って,元オー
ディオ信号のもつ情報量を損失することのない、従って
量子化誤差が少なく、量子化効率の良い量子化を行うこ
とができ、安定に高品位な音質を得ることができる。
【0161】なお、上記実施の形態1〜5では、上記多
段量子化手段は、上記周波数特性信号系列,またはその
一部をベクトル量子化する第1段目のベクトル量子化器
と、上記第1段目のベクトル量子化器による量子化誤差
成分をベクトル量子化する第2段目のベクトル量子化器
とを、少なくとも、有するとともに、該多段量子化手段
の各段の量子化手段は、上記周波数特性信号系列を,少
なくとも2つ以上の,複数の段間で重複する部分を有し
得る周波数帯域に,各段毎の分割の仕方により分割し
た,複数の周波数帯域のいずれかの帯域の係数列をベク
トル量子化する,少なくとも一つ以上の分割化ベクトル
量子化器を備えたものとしたが、この多段量子化手段の
各段の量子化手段は、上記周波数特性信号系列,または
前段の量子化手段による量子化誤差成分をすべてベクト
ル量子化する全帯域ベクトル量子化器よりなるものであ
ってもよく、これにより、量子化を多段に行って、上記
と同様に、低ビットレート、すなわち高い圧縮率でオー
ディオ信号を符号化した場合であっても、また、固定さ
れた情報量で符号化、及び復号化を行なわなくとも、受
信側において、高品位な音声の再生を行うようにするこ
とができる効果が得られるものである。
【0162】
【発明の効果】以上のように、本発明に係るオーディオ
信号符号化装置,オーディオ信号復号化装置,オーディ
オ信号符号化方法,及びオーディオ信号復号化方法によ
れば、量子化にはベクトル量子化の手法を用いるなどし
て高い情報圧縮率においても量子化可能な構成を有する
とともに、量子化時の情報量の配分を、再生帯域の拡張
に寄与する情報量と品質向上に寄与する情報量の両者を
交互に配分していくという構成を採用し、まず符号化装
置においては、第1段階として、入力のオーディオ信号
を周波数領域の信号に変換し、変換された周波数信号の
一部を符号化し、第2段階では、符号化されていない周
波数信号の一部と、第1段階の量子化誤差信号を符号化
して、第1段階の符号に付加し、第3段階では、さらに
符号化されていない周波数信号の一部と、第1段階およ
び第2段階の量子化誤差信号の符号化を行って、第1段
階、第2段階の符号に付加し、同様にさらに段階を重ね
て符号化を行い、一方、復号化装置では、第1段階の符
号化された符号のみを用いて復号を行うことも、第1段
階と第2段階の復号化された符号を用いて復号を行うこ
とも、第1段階から第3段階以上の段階の復号化された
符号を用いて復号を行うことも可能とし、復号化の順
は、帯域拡張に寄与するものと、品質向上に寄与するも
のを交互に復号する構成としたので、固定された情報量
で符号化、及び復号化を行なわなくとも、良好な音質を
得ることができ、また、高い圧縮率にて高品質な音を得
ることができるようになる効果が得られる。
【0163】また、本発明に係るオーディオ信号符号化
装置,オーディオ信号復号化装置,オーディオ信号符号
方法,及びオーディオ信号復号化方法によれば、量子
化手段で量子化する前に、正規化手段を設けて、入力オ
ーディオ信号の正規化を行った後に量子化を行うように
したので、正規化手段と量子化手段とがそれぞれの能力
をフルに発揮した符号化を行って,元オーディオ信号の
もつ情報量を損失することない、量子化誤差の少ない、
量子化効率の良い量子化を行うことができ、オーディオ
信号の種類によってはその効果をより大きく発揮するこ
とができるものである。また、上記で説明したように、
量子化時の情報量の配分を、再生帯域の拡張に寄与する
情報量と品質向上に寄与する情報量の両者を交互に配分
していくという構成を採用することにより、受信側での
情報量が限られているときには、帯域が狭くて浅い領域
でしか逆量子化を行うことができないが、この逆量子化
を順次、帯域を広くする方向と逆量子化の深さを深くす
る方向とに交互に拡張して、受信側での情報量を増大し
ていくことにより、符号化装置から送信されてくる情報
量に関わらず、符号化されたオーディオ信号の所望の情
報量分を復号化することができ、このように、受信者側
での通信環境等に応じて復号する情報量を変化させるよ
うにすることにより、例えば、通常の公衆電話網を利用
しているような場合においても、安定に高品位な音質を
得ることができるようになる効果が得られる。
【0164】また、本発明に係るオーディオ信号符号化
装置,オーディオ信号復号化装置,オーディオ信号符号
方法,及びオーディオ信号復号化方法によれば、多段
量子化を行う量子化手段の前段に各々正規化手段を設け
て、分割した各周波数毎に、かつ各段の量子化毎に正規
化を行ったのち量子化を行うようにしたので、周波数領
域毎の正規化により各周波数領域のオーディオ信号のも
つ情報量に応じた適切な符号化、即ち、正規化手段と量
子化手段とがそれぞれの能力をフルに発揮した符号化を
行って,元オーディオ信号のもつ情報量を損失すること
のない、従って量子化誤差が少なく、量子化効率の良い
量子化を行うことができ、オーディオ信号の種類によっ
てはその効果をより大きく発揮することができるもので
ある。また、復号化側の逆正規化,逆量子化を、量子化
の帯域が広くなる方向と、量子化の深さが深くなる方向
とを交互に行うようにすれば、上記と同様に、符号化装
置から送信されてくる情報量に関わらず、符号化された
オーディオ信号の所望の情報量分を復号化することがで
き、即ち、受信者側での通信環境等に応じて、復号する
情報量を変化させることができ、例えば、通常の公衆電
話網を利用しているような場合においても、安定に高品
位な音質を得ることができる効果が得られる。
【図面の簡単な説明】
【図1】 本発明のオーディオ信号符号化装置,オーデ
ィオ信号復号化装置,オーディオ信号符号化方法,及び
オーディオ信号復号化方法の全体的な構成を示す図であ
る。
【図2】 上記オーディオ信号符号化装置を構成する正
規化部の一例を示す構成図である。
【図3】 上記オーディオ信号符号化装置を構成する周
波数概形正規化部の一例を示す構成図である。
【図4】 上記オーディオ信号符号化装置を構成する量
子化部の実施の形態1における構成図である。
【図5】 上記オーディオ信号符号化装置を構成する量
子化部の実施の形態2における構成図である。
【図6】 上記オーディオ信号符号化装置を構成する量
子化部の実施の形態3における構成図である。
【図7】 上記オーディオ信号復号化装置を構成する逆
量子化部の実施の形態4における構成図である。
【図8】 上記オーディオ信号復号化装置を構成する逆
量子化部の実施の形態4における構成図である。
【図9】 上記オーディオ信号復号化装置を構成する逆
量子化部の実施の形態4における構成図である。
【図10】 上記オーディオ信号復号化装置を構成する
逆量子化部の実施の形態4における構成図である。
【図11】 上記オーディオ信号復号化装置を構成する
逆量子化部の実施の形態4における構成図である。
【図12】 逆正規化部の一実施形態の構成図である。
【図13】 周波数概形逆正規化部の一実施形態の構成
図である。
【図14】 上記符号化装置における量子化部の詳細な
動作を説明するための図である。
【図15】 上記復号化装置における逆量子化部の詳細
な動作を説明するための図である。逆量子化の一実施形
態の構成図である。
【図16】 上記実施の形態4における逆量子化部の逆
量子化手順の動作を説明するための図である。
【図17】 従来のオーディオ信号符号化装置の構成を
示す図である。
【図18】 本発明の実施の形態5によるオーディオ信
号符号化装置における量子化部の構成図である。
【図19】 本発明の実施の形態5によるオーディオ信
号符号化装置の動作の全体を説明するための波形図であ
る。
【図20】 本発明の実施の形態1〜4,及び実施の形
態5によるオーディオ信号符号化装置の動作の全体を説
明するための波形図である。
【図21】 本発明の実施の形態5によるオーディオ信
号符号化装置の動作の全体を説明するための波形図であ
る。
【図22】 本発明の実施の形態5によるオーディオ信
号符号化装置における第1段目ないし第3段目の正規
化,量子化手段による,正規化,量子化の手法の一例を
説明する図である。
【図23】 本発明の実施の形態5によるオーディオ信
号符号化装置に対する、オーディオ信号復号化装置の構
成を説明する図である。
【図24】 従来のオーディオ信号符号化装置の構成を
示す図である。
【符号の説明】
101 フレーム分割部 102 窓掛け部 103 MDCT部 104 正規化部 105 量子化部 106 逆量子化部 107 逆正規化部 108 逆MDCT部 109 窓掛け部 110 フレーム重ね合わせ部 201 周波数概形正規化部 202 帯域振幅正規化部 203 帯域テーブル 301 線形予測分析部 302 概形量子化部 303 包絡特性正規化部 401 第1の小量子化部 402 第2の小量子化部 403 第3の小量子化部 501 第1の小量子化部 502 第2の小量子化部 503 第3の小量子化部 601 第1の小量子化部 602 第1の量子化帯域選択部 603 第2の小量子化部 604 第2の量子化帯域選択部 605 第3の小量子化部 701 第1の低域成分の逆量子化部 702 第1の中域成分の逆量子化部 703 第1の高域成分の逆量子化部 704 第2の逆量子化部 705 第3の逆量子化部 1201 周波数概形逆正規化部 1202 帯域振幅逆正規化部 1203 帯域テーブル 1301 概形逆量子化部 1302 包絡特性逆量子化部 1401 ある量子化部の量子化する帯域のMDCT 1402 量子化する帯域の正規化成分 1403 音源サブベクトル 1404 重みサブベクトル 1405 ベクトル量子化器 1406 距離計算手段 1407 コード決定手段 1408 残差生成手段 1409 コードブック 1410 残差サブベクトル 1411 ある量子化部の量子化する帯域のMDCT 1501 ベクトル逆量子化器 1502 コードブック 1503 再生サブベクトル 1504 逆量子化されたMDCT 1601 FFT 1602 適応ビット割り当ての算出部 1603 サブバンド帯域分割部 1604 スケールファクタによる正規化 1605 スカラー量子化部 1801 第1の正規化部 1802 第1の小量子化部 1803 第1の量子化帯域選択部 1804 第2の正規化部 1805 第2の小量子化部 1806 第2の量子化帯域選択部 1807 第3の正規化部 1808 第3の小量子化部 1809 第3の量子化帯域選択部
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI G10L 7/04 F (56)参考文献 特開 平6−77840(JP,A) 特開 平6−169449(JP,A) 特開 平9−34499(JP,A) 特開 平5−165499(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 19/00 G10L 19/02 H03M 7/30 H04B 14/04

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】 複数の階層の小量子化部を備え、時間−
    周波数変換されたオーディオ信号を入力してインデック
    ス情報を出力するオーディオ信号符号化装置であって、少なくとも第i階層の小量子化部は、分割された周波数
    帯域毎にベクトル量子化による符号化を行う複数の帯域
    分割量子化器を備え、 第i+1階層以降の小量子化部は、前階層の一部の帯域
    分割量子化器の量子化誤差にベクトル量子化による符号
    化を行い、 インデックス情報は、各階層の小量子化部により符号化
    されたベクトルを示す階層別インデックスを含み、 階層別インデックスは、複数の帯域分割量子化器により
    周波数帯域が分割された符号化が行われた階層において
    は、分割された周波数帯域毎の帯域別インデックスを含
    オーディオ信号符号化装置。
  2. 【請求項2】 量子化帯域選択部をさらに備え、 量子化帯域選択部は、第i+1階層以降の小量子化部が
    符号化を行う一部の帯域分割量子化器を量子化誤差の大
    きさに基づいて選出する 請求項1に記載の オーディオ信
    号符号化装置。
  3. 【請求項3】 複数の階層の小逆量子化部を備え、イン
    デックス情報をオーディオ信号に復号化するオーディオ
    信号復号化装置であって、 少なくとも第i階層の小逆量子化部は、分割された周波
    数帯域毎にベクトル逆量子化による復号化を行う複数の
    帯域分割逆量子化器を備え、 第i+1階層以降の小逆量子化部は、前階層の一部の帯
    域分割量子化器の量子化誤差にベクトル逆量子化による
    復号化を行い、 インデックス情報は、階層毎のベクトルを示す階層別イ
    ンデックスを含み、 階層別インデックスは、周波数帯域が分割された符号化
    が行われた階層においては、分割された周波数帯域毎の
    帯域別インデックスを含む オーディオ信号号化装置。
  4. 【請求項4】 複数の階層の小量子化ステップを備え、
    時間−周波数変換さ れたオーディオ信号をインデックス
    情報に変換するオーディオ信号符号化方法であって、 少なくとも第i階層の小量子化ステップは、分割された
    周波数帯域毎にベクトル量子化による符号化を行う複数
    の帯域分割量子化ステップを備え、 第i+1階層以降の小量子化ステップは、前階層の一部
    の帯域分割量子化ステップの量子化誤差にベクトル量子
    化による符号化を行い、 インデックス情報は、各階層の小量子化ステップにより
    符号化されたベクトルを示す階層別インデックスを含
    み、 階層別インデックスは、複数の帯域分割量子化ステップ
    により周波数帯域が分割された符号化が行われた階層に
    おいては、分割された周波数帯域毎の帯域別インデック
    スを含む オーディオ信号符号化方法
  5. 【請求項5】 複数の階層の小逆量子化ステップを備
    え、インデックス情報をオーディオ信号に復号化するオ
    ーディオ信号復号化方法であって、 少なくとも第i階層の小逆量子化ステップは、分割され
    た周波数帯域毎にベクトル逆量子化による復号化を行う
    複数の帯域分割逆量子化ステップを備え、 第i+1階層以降の小逆量子化ステップは、前階層の一
    部の帯域分割量子化ステップの量子化誤差にベクトル逆
    量子化による復号化を行い、 インデックス情報は、各階層のベクトルを示す階層別イ
    ンデックスを含み、 階層別インデックスは、周波数帯域が分割された符号化
    が行われた階層においては、分割された周波数帯域毎の
    帯域別インデックスを含む オーディオ信号号化方法
JP06241398A 1996-07-01 1998-03-13 オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法 Expired - Lifetime JP3344944B2 (ja)

Priority Applications (7)

Application Number Priority Date Filing Date Title
JP06241398A JP3344944B2 (ja) 1997-05-15 1998-03-13 オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法
CNB988005271A CN1144178C (zh) 1997-05-15 1998-05-14 音频信号编码装置和译码装置以及音频信号编码和译码方法
EP98919600A EP0919989A4 (en) 1997-05-15 1998-05-14 AUDIO SIGNAL ENCODER, AUDIO SIGNAL DECODER, AND METHOD FOR ENCODING AND DECODING AUDIO SIGNALS
PCT/JP1998/002135 WO1998052188A1 (fr) 1997-05-15 1998-05-14 Codeur de signaux audio, decodeur de signaux audio, et procede de codage et de decodage de signaux audio
US09/227,189 US6904404B1 (en) 1996-07-01 1999-01-08 Multistage inverse quantization having the plurality of frequency bands
KR1019997001099A KR100309727B1 (ko) 1997-05-15 1999-01-15 오디오 신호 부호화 장치 및 복호화 장치와 오디오 신호 부호화 및 복호화 방법
US10/954,589 US7243061B2 (en) 1996-07-01 2004-10-01 Multistage inverse quantization having a plurality of frequency bands

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP12584497 1997-05-15
JP9-125844 1997-05-15
JP06241398A JP3344944B2 (ja) 1997-05-15 1998-03-13 オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法

Publications (2)

Publication Number Publication Date
JPH1130998A JPH1130998A (ja) 1999-02-02
JP3344944B2 true JP3344944B2 (ja) 2002-11-18

Family

ID=26403462

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06241398A Expired - Lifetime JP3344944B2 (ja) 1996-07-01 1998-03-13 オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法

Country Status (5)

Country Link
EP (1) EP0919989A4 (ja)
JP (1) JP3344944B2 (ja)
KR (1) KR100309727B1 (ja)
CN (1) CN1144178C (ja)
WO (1) WO1998052188A1 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6446037B1 (en) 1999-08-09 2002-09-03 Dolby Laboratories Licensing Corporation Scalable coding method for high quality audio
EP1345331B1 (en) 2000-12-22 2008-08-20 Sony Corporation Encoder
DE10102159C2 (de) * 2001-01-18 2002-12-12 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erzeugen bzw. Decodieren eines skalierbaren Datenstroms unter Berücksichtigung einer Bitsparkasse, Codierer und skalierbarer Codierer
DE60204039T2 (de) 2001-11-02 2006-03-02 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zur kodierung und dekodierung von audiosignalen
WO2004042722A1 (en) * 2002-11-07 2004-05-21 Samsung Electronics Co., Ltd. Mpeg audio encoding method and apparatus
FR2852172A1 (fr) * 2003-03-04 2004-09-10 France Telecom Procede et dispositif de reconstruction spectrale d'un signal audio
EP1667109A4 (en) * 2003-09-17 2007-10-03 Beijing E World Technology Co METHOD AND DEVICE FOR QUANTIFYING MULTI-RESOLUTION VECTOR FOR AUDIO CODING AND DECODING
JP5224017B2 (ja) * 2005-01-11 2013-07-03 日本電気株式会社 オーディオ符号化装置、オーディオ符号化方法およびオーディオ符号化プログラム
WO2007114290A1 (ja) * 2006-03-31 2007-10-11 Matsushita Electric Industrial Co., Ltd. ベクトル量子化装置、ベクトル逆量子化装置、ベクトル量子化方法及びベクトル逆量子化方法
CN101325059B (zh) * 2007-06-15 2011-12-21 华为技术有限公司 语音编解码收发方法及装置
CN101350197B (zh) * 2007-07-16 2011-05-11 华为技术有限公司 立体声音频编/解码方法及编/解码器
WO2012026741A2 (ko) * 2010-08-24 2012-03-01 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
SG10201808274UA (en) * 2014-03-24 2018-10-30 Samsung Electronics Co Ltd High-band encoding method and device, and high-band decoding method and device

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03228433A (ja) * 1990-02-02 1991-10-09 Fujitsu Ltd 多段ベクトル量子化方式
JP3114197B2 (ja) * 1990-11-02 2000-12-04 日本電気株式会社 音声パラメータ符号化方法
JP3088163B2 (ja) * 1991-12-18 2000-09-18 沖電気工業株式会社 Lsp係数の量子化方法
JPH0677840A (ja) * 1992-08-28 1994-03-18 Fujitsu Ltd ベクトル量子化装置
JP3239488B2 (ja) * 1992-11-30 2001-12-17 三菱電機株式会社 画像帯域分割符号化装置および画像帯域分割符号化方法
JP3537008B2 (ja) * 1995-07-17 2004-06-14 株式会社日立国際電気 音声符号化通信方式とその送受信装置
JPH09127987A (ja) * 1995-10-26 1997-05-16 Sony Corp 信号符号化方法及び装置
JP3159012B2 (ja) * 1995-10-26 2001-04-23 日本ビクター株式会社 音響信号の符号化装置及び復号化装置
JPH09281995A (ja) * 1996-04-12 1997-10-31 Nec Corp 信号符号化装置及び方法
JP3246715B2 (ja) * 1996-07-01 2002-01-15 松下電器産業株式会社 オーディオ信号圧縮方法,およびオーディオ信号圧縮装置

Also Published As

Publication number Publication date
EP0919989A1 (en) 1999-06-02
WO1998052188A1 (fr) 1998-11-19
KR20000023852A (ko) 2000-04-25
KR100309727B1 (ko) 2001-09-29
JPH1130998A (ja) 1999-02-02
CN1224523A (zh) 1999-07-28
CN1144178C (zh) 2004-03-31
EP0919989A4 (en) 2003-02-26

Similar Documents

Publication Publication Date Title
US6826526B1 (en) Audio signal coding method, decoding method, audio signal coding apparatus, and decoding apparatus where first vector quantization is performed on a signal and second vector quantization is performed on an error component resulting from the first vector quantization
US7243061B2 (en) Multistage inverse quantization having a plurality of frequency bands
JP4506039B2 (ja) 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム
EP1914724B1 (en) Dual-transform coding of audio signals
KR100304092B1 (ko) 오디오 신호 부호화 장치, 오디오 신호 복호화 장치 및 오디오 신호 부호화/복호화 장치
US7599833B2 (en) Apparatus and method for coding residual signals of audio signals into a frequency domain and apparatus and method for decoding the same
EP1914725B1 (en) Fast lattice vector quantization
JP4800645B2 (ja) 音声符号化装置、及び音声符号化方法
KR100904605B1 (ko) 음성부호화장치, 음성복호장치, 음성부호화방법 및음성복호방법
JP3344962B2 (ja) オーディオ信号符号化装置、及びオーディオ信号復号化装置
JPWO2005111568A1 (ja) 符号化装置、復号化装置、およびこれらの方法
JP4736812B2 (ja) 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JP3344944B2 (ja) オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法
JP3765171B2 (ja) 音声符号化復号方式
JP4603485B2 (ja) 音声・楽音符号化装置及び音声・楽音符号化方法
JP2002372996A (ja) 音響信号符号化方法及び装置、音響信号復号化方法及び装置、並びに記録媒体
JPH07261800A (ja) 変換符号化方法、復号化方法
US20090210219A1 (en) Apparatus and method for coding and decoding residual signal
JP2009253706A (ja) 符号化装置、復号装置、符号化方法、復号方法及びプログラム
JP4734859B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP2003110429A (ja) 符号化方法及び装置、復号方法及び装置、伝送方法及び装置、並びに記録媒体
US20120123788A1 (en) Coding method, decoding method, and device and program using the methods
JP3191257B2 (ja) 音響信号符号化方法、音響信号復号化方法、音響信号符号化装置、音響信号復号化装置
JP4274614B2 (ja) オーディオ信号復号方法
JP2002091497A (ja) オーディオ信号符号化方法、復号化方法及びそれらの方法を実行するプログラム記憶媒体

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070830

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080830

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080830

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090830

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090830

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100830

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110830

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110830

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120830

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130830

Year of fee payment: 11

EXPY Cancellation because of completion of term