JP5799824B2 - オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム - Google Patents
オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム Download PDFInfo
- Publication number
- JP5799824B2 JP5799824B2 JP2012008484A JP2012008484A JP5799824B2 JP 5799824 B2 JP5799824 B2 JP 5799824B2 JP 2012008484 A JP2012008484 A JP 2012008484A JP 2012008484 A JP2012008484 A JP 2012008484A JP 5799824 B2 JP5799824 B2 JP 5799824B2
- Authority
- JP
- Japan
- Prior art keywords
- channel
- codebook
- minimum value
- channel signal
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 58
- 238000004590 computer program Methods 0.000 title claims description 13
- 230000005236 sound signal Effects 0.000 claims description 38
- 238000004364 calculation method Methods 0.000 claims description 35
- 238000006243 chemical reaction Methods 0.000 description 26
- 238000010586 diagram Methods 0.000 description 25
- 230000014509 gene expression Effects 0.000 description 24
- 238000013139 quantization Methods 0.000 description 22
- 230000008569 process Effects 0.000 description 12
- 238000001228 spectrum Methods 0.000 description 9
- 230000007423 decrease Effects 0.000 description 7
- 238000010187 selection method Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000012447 hatching Effects 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000002542 deteriorative effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000009527 percussion Methods 0.000 description 1
- 238000012887 quadratic function Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/12—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
Description
(数1)
ここでnは時間を表す変数であり、1フレームのオーディオ信号を時間方向に128等分したときのn番目の時間を表す。なお,フレーム長は、例えば、10〜80msecの何れかとすることができる。またkは周波数帯域を表す変数であり、周波数信号が有する周波数帯域を64等分したときのk番目の周波数帯域を表す。またQMF(k,n)は,時間n,周波数kの周波数信号を出力するためのQMFである。時間周波数変換部11は、QMF(k,n)を入力されたチャネルの1フレーム分のオーディオ信号に乗じることにより、そのチャネルの周波数信号を生成する。なお、時間周波数変換部11は、高速フーリエ変換、離散コサイン変換、修正離散コサイン変換など、他の時間周波数変換処理を用いて、各チャネルの信号をそれぞれ周波数信号に変換してもよい.
(数2)
(数3)
(数4)
(数5)
(数6)
(数7)
(数8)
(数9)
(数10)
ここでIQMF(k,n)は、時間n、周波数kを変数とする複素型のQMFである。
(数11)
ここで、Re(x(k,n))ならびにRe(y(k,n))は、周波数信号x(k,n)、y(k,n)または、チャネル信号x(k,n) 、y(k,n)の実数成分である。Im(x(k,n)) ならびにIm (y(k,n))は、周波数信号x(k,n) 、y(k,n)または、チャネル信号x(k,n) 、y(k,n)の虚数成分である。上述の(数11)は、誤差dを固定値とした場合の分布形状の断面が二次曲線であり、予測係数c1、c2に対する二次曲線であると解釈することが出来る。すなわち、符号帳に含まれる複数の予測係数を適用した場合の誤差dの分布を二次曲面として取り扱うことが可能であることを意味する。
(数12)
なお、上述の(数11)と(数12)の一般式の各変数は以下の様に対応する。
(数13)
(β=0かつγ=0かつε≠0)
または(β=0かつα=0かつδ≠0)
また、次式の条件を満たす場合は双曲線となる。
(数14)
次式の条件を満たす場合は、平行2直線となる。
(数15)
かつ
{(β=0かつγ=0かつε≠0)または(β=0かつα=0かつδ≠0)}以外
次式の条件を満たす場合は、楕円となる。
(数16)
(数17)
この時、εは次式よりε=0を満たすことになる。
(数18)
なお、同様の計算により、α=0と仮定した場合、δ=0を満たすことになる。この様に、放物線になる上述の(数13)の条件は常に満たされることはない。
(数19)
上述の(数19)は,コーシーシュワルツの不等式により、次式を満たすことになる。
(数20)
この様に,双曲線になる上述の(数14)の条件は常に満たされることはない。
(数21)
ここで、上述の(数21)の(iii)を満たしている場合について説明する。上述の(数21)の(iii)は次式の通り表現することが可能である。
(数22)
ただし、sは任意の実数である。上述の(数22)を(数11)の各項に代入すると、誤差dは次式の通り表現することが可能となる。
(数23)
上述の(数23)において、(c1+s・c2)はc1とc2の一次式である。ここで、(数23)の(c1+s・c2)を変数zと置換し、入力信号となる右側周波数信号L0(k,n)、右側周波数信号R0(k,n)、中央チャネルの信号C0(k,n)から一意的に定まる定数をA、B、C、Dに置換すると、(数23)は次式の放物線の一般式で表現できる。
(数24)
(数25)
(数26)
上述の(数26)を整理すると、次式で表現される。
(数27)
上述の(数26)で示される様に、総和の各項が常に0以上であるため、f(L0,L0)は常に0以上の正の値となる。なお、全ての(k,n)においてL0(k,n)=0である場合には、f(L0,L0)は正の値でなく0となるが、この場合は、上述の(数21)の(i)の条件を満たすことになる為、 (iii)の条件を満たす場合おいては、f(L0,L0)は常に正の値となる。
(数28)
c1は任意
(数21)の(ii)の条件を満たしている場合は、放物線柱面型の最小値は次式で表現される直線状となる。
(数29)
c2は任意
(数30)
上述の(数30)により、楕円は誤差dが最小となる中心が(B,D)であり、dが大きくなるほど楕円の半径が大きくなる楕円放物面となる。図7は予測係数c1、c2ならびに誤差dを座標とする楕円放物面の誤差分布形状の概念図である。図7に示す通り誤差dが最小となる中心から、dが大きくなるほど楕円の半径が大きくなる楕円放物面となる。なお、以降、説明の便宜上、楕円放物面の誤差分布形状を楕円放物面型と称する。また、上述の(数30)において、最小値となる(B,D)、換言すると(c1,c2)は次式により算出することが出来る。
(数31)
誤差dの分布を放物線柱面として取り扱う場合において、最小値が符号帳範囲内外のいずれかに存在するかを判定する符号帳範囲判定について説明する。図8(a)は、予測係数c1-c2平面における放物線柱面の最小値が符号帳範囲の内に存在する場合の最適解を示す概念図である。図8(b)は、予測係数c1-c2平面における放物線柱面の最小値が符号帳範囲の外に存在する場合の最適解を示す概念図である。なお、図8(a)ならびに図8(b)の予測係数c1-c2平面上に示されるハッチングは、放物線柱面の曲率を任意の区間で区切って示したものである。図8(a)ならびに図8(b)に示される通り、誤差dの最小値は、予測係数c1-c2平面において直線上に存在する。この最小値を満たす直線の傾きは、上述の(数25)、(数28)、(数29)の性質上、予測係数c1-c2平面において単調増加または単調減少となるか、予測係数c1、c2の軸に対して平行になる。いずれの傾きになるのかは、次式の判定式で判定することが出来る。
(数32)
上述の(数32)において、(i)の条件を満たす場合は、予測係数c1の軸に対して平行となり、(ii)の条件を満たす場合は、予測係数c2の軸に対して平行となる。また、(iii)の条件を満たす場合は、予測係数c1-c2平面において単調減少となり、(iv)の条件を満たす場合は、予測係数c1-c2平面において単調増加となる。いずれの条件を満たすかで符号帳範囲判定に方法が異なる為、以下に説明する。
先ず、放物線柱面における最小値が予測係数c1の軸に対して平行の場合について説明する。最小値は,上述の(数28)により、c2=m2,(c1は任意)と一意的に算出される。このとき、次式の条件を満たす場合は、最小値が符号帳範囲の内に存在すると判定し、次式の条件を満たさない場合は、最小値が符号帳範囲の外に存在すると判定する。
(数33)
cMin≦m2かつ cMax≧m2
上述の(数33)において、cMinは、符号帳に含まれる予測係数の最小係数を示し、cMaxは、符号帳に含まれる予測係数の最大係数を示す。以降の数式においても同義とする。また、符号帳に含まれている予測係数を用いる必要がある為、上述の(数33)ならびに以降の数式においても、cMin≦c1≦cMaxかつcMin≦c2≦cMaxを満たす必要がある。
次に、放物線柱面における最小値が予測係数c1の軸に対して平行の場合について説明する。最小値は,上述の(数29)により、c1=m1(c2は任意)と一意的に算出される。このとき、次式の条件を満たす場合は、最小値が符号帳範囲の内に存在すると判定し、次式の条件を満たさない場合は、最小値が符号帳範囲の外に存在すると判定する。
(数34)
cMin≦m1かつ cMax≧m1
次に、放物線柱面における最小値が予測係数c1-c2平面において単調減少する場合について説明する。最小値は,上述の(数25)により、(c1+s・c2)=m3を満たす直線上の点と一意的に算出される。ただし、上述の(数22)と(数32)の条件によりs>0である。このとき、c2=cMinおよびc2=cMaxの時のc1の値を判定することで、符号帳範囲内を、直線(c1+s・c2)=m3が通っているかを判定することが出来る。具体的には、次式の条件を満たす場合は、最小値が符号帳範囲の内に存在すると判定し、次式の条件を満たさない場合は、最小値が符号帳範囲の外に存在すると判定する。
(数35)
m3−s・cMin≧cMin かつ m3−s・cMax≦cMax
次に、放物線柱面における最小値が予測係数c1-c2平面において単調増加する場合について説明する。最小値は,上述の(数25)により(c1+s・c2)=m3を満たす直線上の点となる。ただし、上述の(数22)と(数32)の条件により、s<0である。このとき、c2=cMinおよびc2=cMaxの時のc1の値を判定することで、符号帳範囲内を直線 (c1+s・c2)=m3が通っているかを判定することが出来る。次式の条件を満たす場合は、最小値が符号帳範囲の内に存在すると判定し、次式の条件を満たさない場合は、最小値が符号帳範囲の外に存在すると判定する。
(数36)
m3−s・cMin≦cMax かつ m3−s・cMax≧cMin
次に、誤差dの分布を楕円放物面として取り扱う場合において、最小値が符号帳範囲内外のいずれかに存在するかを判定する符号帳範囲判定について説明する。図9(a)は、予測係数c1-c2平面における楕円放物面の最小値が符号帳範囲の内に存在する場合の最適解を示す概念図である。図9(b)は、予測係数c1-c2平面における楕円放物面の最小値が符号帳範囲の外に存在する場合の最適解を示す概念図である。なお、図9(a)ならびに図9(b)の予測係数c1-c2平面上に示されるハッチングは、楕円放物面の曲率を任意の区間で区切って示したものである。上述の(数29)により算出される楕円放物面における最小値を (c1,c2)=(m1,m2)とする。(m1,m2)が符号帳範囲の内に存在する場合、次式の条件を満たす場合は、最小値が符号帳範囲の内に存在すると判定し、次式の条件を満たさない場合は、最小値が符号帳範囲の外に存在すると判定する。
(数37)
cMin≦m1 かつcMax≧m1かつcMin≦m2 かつ cMax≧m2
次に、算出した最小値と符号帳範囲判定に基づく符号帳に含まれる予測係数の算出方法について説明する。誤差dの分布を楕円放物面か放物線柱面として取り扱うか、更に、最小値が符号帳範囲の内に存在するか否かで算出方法が異なる。以降、種別毎に説明するが、いずれの場合においても、最小値が符号帳範囲外に存在する場合は、符号帳を用いる制約から、算出した最小値を予測係数として用いることが出来ない。この為、放物線柱面または楕円放物面のいずれかの2次曲線が符号帳範囲の縁辺に接する点を、誤差dが符号帳を用いる制約下における最適解として算出し、該最適にを符号帳に含まれる予測係数とする。また、最小値が符号帳範囲内に存在する場合は、算出した最小値をそのまま最適解、すなわち符号帳に含まれる予測係数とすれば良い。
先ず、誤差dの分布を放物線柱面として取り扱い、放物線柱面の最小値を満たす直線が予測係数c1の軸に対して平行であり、最小値が符号帳範囲の内に存在する場合の最適解の算出方法について説明する。最小値が符号帳範囲の内に存在するため、算出した最小値を最適解とすれば良い。上述の通り、最小値はc2=m2(c1は任意)を満たす。符号帳範囲内であれば、c1は任意であるが、c1=cMinとの交点を算出する場合、最適解は、次式で決定することが出来る。
(数38)
(c1,c2) = (cMin,m1)
次に、誤差dの分布を放物線柱面として取り扱い、放物線柱面の最小値を満たす直線が予測係数c1の軸に対して平行であり、最小値が符号帳範囲の外に存在する場合の最適解の算出方法について説明する。最小値が符号帳範囲の外に存在する為、符号帳範囲内で誤差dが小さくなる点を最適解として算出する必要がある。図6に示す通り、放物線柱面の場合、最小値を満たす直線からの距離が遠いほど誤差dが大きくなるため、符号帳範囲の縁辺と接する点を算出すればよい。最小値は、c2=m2(c1は任意)を満たす。c1は任意であるが、c1=cMinとの交点を算出する場合、最適解は次式で決定することが出来る。
(数39)
m2>cMaxの時 (c1,c2)=(cMin,cMax)
m2<cMinの時 (c1,c2)=(cMin,cMin)
次に、誤差dの分布を放物線柱面として取り扱い、放物線柱面の最小値を満たす直線が予測係数c2の軸に対して平行であり、最小値が符号帳範囲の内に存在する場合の最適解の算出方法について説明する。最小値が符号帳範囲の内に存在するため、算出した最小値を最適解とすれば良い。最小値はc1=m1(c2は任意)を満たす。符号帳範囲内であれば、c2は任意であるが、c2=cMinとの交点を算出する場合、最適解は、次式で決定することが出来る。
(数40)
(c1,c2) = (m1,cMin)
次に、誤差dの分布を放物線柱面として取り扱い、放物線柱面の最小値を満たす直線が予測係数c2の軸に対して平行であり、最小値が符号帳範囲の外に存在する場合の最適解の算出方法について説明する。最小値が符号帳範囲の外に存在する為、符号帳範囲内で誤差dが小さくなる点を最適解として算出する必要がある。図6に示す通り、放物線柱面の場合、最小値を満たす直線からの距離が遠いほど誤差dが大きくなるため、符号帳範囲の縁辺と接する点を算出すればよい。最小値は、c1=m1(c2は任意)を満たす。c2は任意であるが、c2=cMinとの交点を算出する場合、最適解は次式で決定することが出来る。
(数41)
m1>cMaxの時 (c1,c2)=(cMax,cMin)
m1<cMinの時 (c1,c2)=(cMin,cMin)
次に、誤差dの分布を放物線柱面として取り扱い、放物線柱面の最小値を満たす直線が予測係数c1-c2平面において単調減少し、最小値が符号帳範囲の内に存在する場合の最適解の算出方法について説明する。最小値が符号帳範囲の内に存在するため、算出した最小値を最適解とすれば良い。最小値は(c1+s・c2)=m3を満たす。但し、上述の(数22)と(数32)の条件により、s>0である。最小値の条件を満たし、符号帳範囲内であればどの点を最適解としても良いが、c1=cMinあるいは、c2=cMaxのいずれかと最小値の条件との交点を最適解として算出する場合、最適解は、次式で決定することが出来る。
(数42)
m3−s・cMax≧cMinの時 (c1,c2)=(m3-s・cMax,cMax)
m3−s・cMax<cMinの時 (c1,c2)=(cMin,(cMin-m3)/s)
ここで、上述の(数42)の上段の式は、最小値の条件とc2=cMaxの交点を表し、下段の式は最小値の条件とc1=cMinの交点を表す。
次に、誤差dの分布を放物線柱面として取り扱い、放物線柱面の最小値を満たす直線が予測係数c1-c2平面において単調減少し、最小値が符号帳範囲の外に存在する場合の最適解の算出方法について説明する。最小値が符号帳範囲の外に存在する為、符号帳範囲内で誤差dが小さくなる点を最適解として算出する必要がある。図6に示す通り、放物線柱面の場合、最小値を満たす直線からの距離が遠いほど誤差dが大きくなるため、符号帳範囲の縁辺と接する点を最適解とすればよい。最小値は(c1+s・c2)=m3を満たす。ただし、上述の(数22)と(数32)の条件により、s>0である。この時、次式にて符号帳範囲内の最適解を算出することができる。
(数43)
m3−s・cMin<cMin の時 (c1,c2)=(cMin,cMin)
m3−s・cMax>cMax の時 (c1,c2)=(cMax,cMax)
次に、誤差dの分布を放物線柱面として取り扱い、放物線柱面の最小値を満たす直線が予測係数c1-c2平面において単調増加し、最小値が符号帳範囲の内に存在する場合の最適解の算出方法について説明する。最小値が符号帳範囲の内に存在するため、算出した最小値を最適解とすれば良い。最小値は、(c1+s・c2)=m3を満たす。但し、上述の(数22)と(数32)の条件により、s<0である。最小値の条件を満たし、符号帳範囲内であればどの点を最適解としても良いが、c1=cMinあるいは、c2=cMinのいずれかと最小値の条件との交点を最適解として算出する場合、最適解は次式で決定することが出来る。
(数44)
m3−s・cMin≧cMinの時 (c1,c2)=(m3-s・cMin,cMin)
m3−s・cMin<cMinの時 (c1,c2)=(cMin,(cMin-m3)/s)
ここで、上述の(数44)の上段の式は、最小値の条件とc2=cMinの交点を表し、下段の式は最小値の条件とc1=cMinの交点を表す。
次に、誤差dの分布を放物線柱面として取り扱い、放物線柱面の最小値を満たす直線が予測係数c1-c2平面において単調増加し、最小値が符号帳範囲の外に存在する場合の最適解の算出方法について説明する。最小値が符号帳範囲の外に存在する為、符号帳範囲内で誤差dが小さくなる点を最適解として算出する必要がある。図6に示す通り、放物線柱面の場合、最小値を満たす直線からの距離が遠いほど誤差dが大きくなるため、符号帳範囲の縁辺と接する点を最適解とすればよい。最小値は(c1+s・c2)=m3を満たす。ただし、上述の(数22)と(数32)の条件により、s<0である。この時、次式にて符号帳範囲内の最適解を算出することができる。
(数45)
m3−s・cMin>cMax の時 (c1,c2) = (cMax,cMin)
m3−s・cMax<cMin の時 (c1,c2)=(cMin,cMax)
次に、誤差dの分布を楕円放物面として取り扱い、楕円放物面の最小値が符号帳範囲の内に存在する場合の最適解の算出方法について説明する。最小値が符号帳範囲の内に存在する場合は、上述の(数31)にて、最適解を算出することができる。
次に、誤差dの分布を楕円放物面として取り扱い、楕円放物面の最小値が符号帳範囲の外に存在する場合の最適解の算出方法について説明する。最小値が符号帳範囲の外に存在する場合は、符号帳範囲内で誤差が最小になる点となる最適解を求める必要がある。楕円放物面の場合、図7に示す通り、誤差最小点から楕円状に誤差が増えていくため、等高線状で符号帳範囲と最初に接する点において誤差dが最小となる。ここで、上述の(数31)により求めた誤差最小点が(c1,c2)=(m1,m2)とする。この時、図9(a)のようにm1≧cMaxである場合には、上述の(数11)において、c1=cMaxとすることで求めることが出来る。この時c1は固定値となるため、c2を変数とした2次関数である次式となり、この重解を解くことで符号帳範囲内における最適解を求めることが出来る。
(数46)
(付記1)
オーディオ信号に含まれる複数のチャネルに含まれる第1チャネル信号と第2チャネル信号と、符号帳に含まれる複数の予測係数とに基づいて、前記複数のチャネルに含まれる第3チャネル信号を予測符号化するオーディオ符号化装置において、
予測符号化前の前記第3チャネル信号と予測符号化後の前記第3チャネル信号の差分で規定される誤差の分布を、前記第1チャネル信号と前記第2チャネル信号と、前記予測符号化前の前記第3チャネル信号に基づいて所定の曲面として判定する判定部と、
前記所定の曲面から規定される前記誤差の最小値と、前記複数の予測係数の最小係数と最大係数から規定される符号帳範囲とに基づいて、前記符号帳から前記第1チャネルと前記第2チャネルにそれぞれ対応する前記符号帳に含まれる前記予測係数を算出する算出部と、
を備えることを特徴とするオーディオ符号化装置。
(付記2)
前記所定の曲面は放物線柱面または楕円放物面であり、前記判定部は、第1チャネル信号と前記第2チャネル信号と、前記予測符号化前の前記第3チャネル信号に基づいて、前記誤差の分布を、放物線柱面または楕円放物面として判定することを特徴とする付記1に記載のオーディオ符号化装置。
(付記3)
前記算出部は、前記最小値が、前記複数の予測係数の最小係数と最大係数から規定される符号帳範囲の内に存在する否かを判定し、
前記最小値が前記符号帳範囲の内に存在する場合は、前記最小値との差が最小となる前記第1チャネルと前記第2チャネルにそれぞれ対応する前記符号帳に含まれる前記予測係数を算出することを特徴とする付記1または付記2に記載のオーディオ符号化装置。
(付記4)
前記算出部は、前記最小値が、前記複数の予測係数の最小係数と最大係数から規定される符号帳範囲の内に存在する否かを判定し、
前記最小値が前記符号帳範囲の外に存在する場合は、前記符号帳範囲の縁辺と、前記所定の曲面の交点を算出し、該交点との差が最小となる前記第1チャネルと前記第2チャネルにそれぞれ対応する前記符号帳に含まれる前記予測係数を算出することを特徴とする付記1または付記2に記載のオーディオ符号化装置。
(付記5)
前記算出部は、前記最小値との差が最小となる前記第1チャネルと前記第2チャネルにそれぞれ対応する前記予測係数が、前記符号帳の中に複数存在する場合、時間差分符号化量または周波数差分符号化量が最小となる前記予測係数を選択することを特徴とする付記1ないし付記4の何れか1つに記載のオーディオ符号化装置。
(付記6)
オーディオ信号に含まれる複数のチャネルに含まれる第1チャネル信号と第2チャネル信号と、符号帳に含まれる複数の予測係数とに基づいて、前記複数のチャネルに含まれる第3チャネル信号を予測符号化するオーディオ符号化方法において、
予測符号化前の前記第3チャネル信号と予測符号化後の前記第3チャネル信号の差分で規定される誤差の分布を、前記第1チャネル信号と前記第2チャネル信号と、前記予測符号化前の前記第3チャネル信号に基づいて所定の曲面として判定すること、
前記所定の曲面から規定される前記誤差の最小値と、前記複数の予測係数の最小係数と最大係数から規定される符号帳範囲とに基づいて、前記符号帳から前記第1チャネルと前記第2チャネルにそれぞれ対応する前記符号帳に含まれる前記予測係数を算出することを含むオーディオ符号化方法。
(付記7)
前記所定の曲面は放物線柱面または楕円放物面であり、前記判定することは、第1チャネル信号と前記第2チャネル信号と、前記予測符号化前の前記第3チャネル信号に基づいて、前記誤差の分布を、放物線柱面または楕円放物面として判定することを特徴とする付記6に記載のオーディオ符号化方法。
(付記8)
前記算出することは、前記最小値が、前記複数の予測係数の最小係数と最大係数から規定される符号帳範囲の内に存在する否かを判定し、
前記最小値が前記符号帳範囲の内に存在する場合は、前記最小値との差が最小となる前記第1チャネルと前記第2チャネルにそれぞれ対応する前記符号帳に含まれる前記予測係数を算出することを特徴とする付記6または付記7に記載のオーディオ符号化方法。
(付記9)
前記算出することは、前記最小値が、前記複数の予測係数の最小係数と最大係数から規定される符号帳範囲の内に存在する否かを判定し、
前記最小値が前記符号帳範囲の外に存在する場合は、前記符号帳範囲の縁辺と、前記所定の曲面の交点を算出し、該交点との差が最小となる前記第1チャネルと前記第2チャネルにそれぞれ対応する前記符号帳に含まれる前記予測係数を算出することを特徴とする付記6または付記7に記載のオーディオ符号化方法。
(付記10)
前記算出することは、前記最小値との差が最小となる前記第1チャネルと前記第2チャネルにそれぞれ対応する前記予測係数が、前記符号帳の中に複数存在する場合、時間差分符号化量または周波数差分符号化量が最小となる前記予測係数を選択することを特徴とする付記6ないし付記9の何れか1つに記載のオーディオ符号化方法。
(付記11)
オーディオ信号に含まれる複数のチャネルに含まれる第1チャネル信号と第2チャネル信号と、符号帳に含まれる複数の予測係数とに基づいて、前記複数のチャネルに含まれる第3チャネル信号を予測符号化することをコンピュータに実行させるオーディオ符号化用コンピュータプログラムであって、
予測符号化前の前記第3チャネル信号と予測符号化後の前記第3チャネル信号の差分で規定される誤差の分布を、前記第1チャネル信号と前記第2チャネル信号と、前記予測符号化前の前記第3チャネル信号に基づいて所定の曲面として判定すること、
前記所定の曲面から規定される前記誤差の最小値と、前記複数の予測係数の最小係数と最大係数から規定される符号帳範囲とに基づいて、前記符号帳から前記第1チャネルと前記第2チャネルにそれぞれ対応する前記予測係数を選択することを含むオーディオ符号化用コンピュータプログラム。
(付記12)
前記所定の曲面は放物線柱面または楕円放物面であり、前記判定することは、第1チャネル信号と前記第2チャネル信号と、前記予測符号化前の前記第3チャネル信号に基づいて、前記誤差の分布を、放物線柱面または楕円放物面として判定することを特徴とする付記11記載のオーディオ符号化用コンピュータプログラム。
(付記13)
前記算出することは、前記最小値が、前記複数の予測係数の最小係数と最大係数から規定される符号帳範囲の内に存在する否かを判定し、
前記最小値が前記符号帳範囲の内に存在する場合は、前記最小値との差が最小となる前記第1チャネルと前記第2チャネルにそれぞれ対応する前記符号帳に含まれる前記予測係数を算出することを特徴とする付記11または付記12に記載のオーディオ符号化用コンピュータプログラム。
(付記14)
前記算出することは、前記最小値が、前記複数の予測係数の最小係数と最大係数から規定される符号帳範囲の内に存在する否かを判定し、
前記最小値が前記符号帳範囲の外に存在する場合は、前記符号帳範囲の縁辺と、前記所定の曲面の交点を算出し、該交点との差が最小となる前記第1チャネルと前記第2チャネルにそれぞれ対応する前記符号帳に含まれる前記予測係数を算出することを特徴とする付記11または付記12に記載のオーディオ符号化用コンピュータプログラム。
(付記15)
前記選択することは、前記最小値との差が最小となる前記第1チャネルと前記第2チャネルにそれぞれ対応する前記予測係数が、前記符号帳の中に複数存在する場合、時間差分符号化量または周波数差分符号化量が最小となる前記予測係数を選択することを特徴とする付記11ないし付記12の何れか1つに記載のオーディオ符号化用コンピュータプログラム。
11時間周波数変換部
12第1ダウンミックス部
13第2ダウンミックス部
14予測係数符号化部
15判定部
16算出部
17チャネル信号符号化部
18SBR符号化部
19周波数時間変換部
20AAC符号化部
21空間情報符号化部
22多重化部
Claims (6)
- オーディオ信号に含まれる複数のチャネルに含まれる第1チャネル信号と第2チャネル信号と、符号帳に含まれる複数の予測係数とに基づいて、前記複数のチャネルに含まれる第3チャネル信号を予測符号化するオーディオ符号化装置において、
予測符号化前の前記第3チャネル信号と予測符号化後の前記第3チャネル信号の差分で規定される誤差の分布を、前記第1チャネル信号と前記第2チャネル信号と、前記予測符号化前の前記第3チャネル信号に基づいて所定の曲面として判定する判定部と、
前記所定の曲面から規定される前記誤差の最小値と、前記複数の予測係数の最小係数と最大係数から規定される符号帳範囲とに基づいて、前記符号帳から前記第1チャネルと前記第2チャネルにそれぞれ対応する前記符号帳に含まれる前記予測係数を算出する算出部と、
を備えることを特徴とするオーディオ符号化装置。 - 前記所定の曲面は放物線柱面または楕円放物面であり、前記判定部は、第1チャネル信号と前記第2チャネル信号と、前記予測符号化前の前記第3チャネル信号に基づいて、前記誤差の分布を、放物線柱面または楕円放物面として判定することを特徴とする請求項1記載のオーディオ符号化装置。
- 前記算出部は、前記最小値が、前記複数の予測係数の最小係数と最大係数から規定される符号帳範囲の内に存在する否かを判定し、
前記最小値が前記符号帳範囲の内に存在する場合は、前記最小値との差が最小となる前記第1チャネルと前記第2チャネルにそれぞれ対応する前記符号帳に含まれる前記予測係数を算出することを特徴とする請求項1または請求項2記載のオーディオ符号化装置。 - 前記算出部は、前記最小値が、前記複数の予測係数の最小係数と最大係数から規定される符号帳範囲の内に存在する否かを判定し、
前記最小値が前記符号帳範囲の外に存在する場合は、前記符号帳範囲の縁辺と、前記所定の曲面の交点を算出し、該交点との差が最小となる前記第1チャネルと前記第2チャネルにそれぞれ対応する前記符号帳に含まれる前記予測係数を算出することを特徴とする請求項1または請求項2記載のオーディオ符号化装置。 - オーディオ信号に含まれる複数のチャネルに含まれる第1チャネル信号と第2チャネル信号と、符号帳に含まれる複数の予測係数とに基づいて、前記複数のチャネルに含まれる第3チャネル信号を予測符号化するオーディオ符号化方法において、
予測符号化前の前記第3チャネル信号と予測符号化後の前記第3チャネル信号の差分で規定される誤差の分布を、前記第1チャネル信号と前記第2チャネル信号と、前記予測符号化前の前記第3チャネル信号に基づいて所定の曲面として判定すること、
前記所定の曲面から規定される前記誤差の最小値と、前記複数の予測係数の最小係数と最大係数から規定される符号帳範囲とに基づいて、前記符号帳から前記第1チャネルと前記第2チャネルにそれぞれ対応する前記符号帳に含まれる前記予測係数を算出することを含むオーディオ符号化方法。
- オーディオ信号に含まれる複数のチャネルに含まれる第1チャネル信号と第2チャネル信号と、符号帳に含まれる複数の予測係数とに基づいて、前記複数のチャネルに含まれる第3チャネル信号を予測符号化することをコンピュータに実行させるオーディオ符号化用コンピュータプログラムであって、
予測符号化前の前記第3チャネル信号と予測符号化後の前記第3チャネル信号の差分で規定される誤差の分布を、前記第1チャネル信号と前記第2チャネル信号と、前記予測符号化前の前記第3チャネル信号に基づいて所定の曲面として判定すること、
前記所定の曲面から規定される前記誤差の最小値と、前記複数の予測係数の最小係数と最大係数から規定される符号帳範囲とに基づいて、前記符号帳から前記第1チャネルと前記第2チャネルにそれぞれ対応する前記予測係数を選択することを含むオーディオ符号化用コンピュータプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012008484A JP5799824B2 (ja) | 2012-01-18 | 2012-01-18 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
US13/713,487 US9135921B2 (en) | 2012-01-18 | 2012-12-13 | Audio coding device and method |
EP12198522.0A EP2618330B1 (en) | 2012-01-18 | 2012-12-20 | Channel prediction parameter selection for multi-channel audio coding |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012008484A JP5799824B2 (ja) | 2012-01-18 | 2012-01-18 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013148682A JP2013148682A (ja) | 2013-08-01 |
JP5799824B2 true JP5799824B2 (ja) | 2015-10-28 |
Family
ID=47458733
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012008484A Expired - Fee Related JP5799824B2 (ja) | 2012-01-18 | 2012-01-18 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US9135921B2 (ja) |
EP (1) | EP2618330B1 (ja) |
JP (1) | JP5799824B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6094322B2 (ja) * | 2013-03-28 | 2017-03-15 | 富士通株式会社 | 直交変換装置、直交変換方法及び直交変換用コンピュータプログラムならびにオーディオ復号装置 |
JP6303435B2 (ja) | 2013-11-22 | 2018-04-04 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用プログラム、オーディオ復号装置 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19526366A1 (de) * | 1995-07-20 | 1997-01-23 | Bosch Gmbh Robert | Verfahren zur Redundanzreduktion bei der Codierung von mehrkanaligen Signalen und Vorrichtung zur Dekodierung von redundanzreduzierten, mehrkanaligen Signalen |
JP3360046B2 (ja) | 1999-09-28 | 2002-12-24 | 松下電器産業株式会社 | 音声符号化装置、音声復号化装置及び音声符復号化方法 |
SE0402652D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Methods for improved performance of prediction based multi- channel reconstruction |
US8768691B2 (en) * | 2005-03-25 | 2014-07-01 | Panasonic Corporation | Sound encoding device and sound encoding method |
JP2007183528A (ja) | 2005-12-06 | 2007-07-19 | Fujitsu Ltd | 符号化装置、符号化方法、および符号化プログラム |
JP4984983B2 (ja) | 2007-03-09 | 2012-07-25 | 富士通株式会社 | 符号化装置および符号化方法 |
JP5604933B2 (ja) * | 2010-03-30 | 2014-10-15 | 富士通株式会社 | ダウンミクス装置およびダウンミクス方法 |
JP5533502B2 (ja) * | 2010-09-28 | 2014-06-25 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
JP6065452B2 (ja) * | 2012-08-14 | 2017-01-25 | 富士通株式会社 | データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム |
JP6179122B2 (ja) * | 2013-02-20 | 2017-08-16 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム |
-
2012
- 2012-01-18 JP JP2012008484A patent/JP5799824B2/ja not_active Expired - Fee Related
- 2012-12-13 US US13/713,487 patent/US9135921B2/en not_active Expired - Fee Related
- 2012-12-20 EP EP12198522.0A patent/EP2618330B1/en not_active Not-in-force
Also Published As
Publication number | Publication date |
---|---|
US9135921B2 (en) | 2015-09-15 |
EP2618330B1 (en) | 2015-07-29 |
EP2618330A2 (en) | 2013-07-24 |
US20130182854A1 (en) | 2013-07-18 |
EP2618330A3 (en) | 2014-03-26 |
JP2013148682A (ja) | 2013-08-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA2895916C (en) | Frequency segmentation to obtain bands for efficient coding of digital media | |
US7562021B2 (en) | Modification of codewords in dictionary used for efficient coding of digital media spectral data | |
JP2009524108A (ja) | 拡張帯域周波数コーディングによる複素変換チャネルコーディング | |
TWI657434B (zh) | 解碼壓縮高階保真立體音響表示之方法及裝置,及編碼壓縮高階保真立體音響表示之方法及裝置 | |
JP5949270B2 (ja) | オーディオ復号装置、オーディオ復号方法、オーディオ復号用コンピュータプログラム | |
JP5799824B2 (ja) | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム | |
JP6179122B2 (ja) | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム | |
JP5990954B2 (ja) | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム、オーディオ復号装置、オーディオ復号方法ならびにオーディオ復号用コンピュータプログラム | |
JP6051621B2 (ja) | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム、及びオーディオ復号装置 | |
JP6299202B2 (ja) | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム及びオーディオ復号装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140904 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150625 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150728 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150810 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5799824 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |