JP4866484B2 - パラメータ選択方法、パラメータ選択装置、プログラム及び記録媒体 - Google Patents

パラメータ選択方法、パラメータ選択装置、プログラム及び記録媒体 Download PDF

Info

Publication number
JP4866484B2
JP4866484B2 JP2010547533A JP2010547533A JP4866484B2 JP 4866484 B2 JP4866484 B2 JP 4866484B2 JP 2010547533 A JP2010547533 A JP 2010547533A JP 2010547533 A JP2010547533 A JP 2010547533A JP 4866484 B2 JP4866484 B2 JP 4866484B2
Authority
JP
Japan
Prior art keywords
interval
parameter
value
prediction
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010547533A
Other languages
English (en)
Other versions
JPWO2010084951A1 (ja
Inventor
健弘 守谷
登 原田
優 鎌本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2010547533A priority Critical patent/JP4866484B2/ja
Application granted granted Critical
Publication of JP4866484B2 publication Critical patent/JP4866484B2/ja
Publication of JPWO2010084951A1 publication Critical patent/JPWO2010084951A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、時系列信号を予測分析して符号化する技術に関し、特に、予測残差の可変長符号化用パラメータを選択する技術に関する。
音響信号や映像情報などの時系列信号を通信路によって伝送したり、情報記録媒体に記録する場合、時系列信号を圧縮符号に変換してから伝送したり記録する方法が、伝送効率や記録効率の点で有効である。また、近年のブロードバンドの普及や記憶装置の容量増加に伴い、圧縮率の高さを優先する非可逆圧縮符号化方式よりも原信号の完全再生を条件とした可逆圧縮符号化方式が重視されつつある(例えば、非特許文献1参照)。そのような中、隣接する時系列信号を用いた自己相関分析である短期予測分析や、遅延値(ピッチ周期)だけ離れた時系列信号間の自己相関分析である長期予測分析などの技術を用いて音響信号を可逆圧縮符号化する予測符号化方式がMPEG(Moving Picture Expert Group)の国際標準規格「MPEG-4 ALS」として承認されている(例えば、非特許文献2参照)。
図1は、従来における予測符号化方式の符号化装置2100の機能構成を説明するためのブロック図である。図2は、従来における予測符号化方式の復号装置2200の機能構成を説明するためのブロック図である。また、図3Aは、図1に示す残差符号化部2120の機能構成を説明するためのブロック図であり、図3Bは、図2に示す残差復号部2220の機能構成を説明するためのブロック図である。また、図4は、短期予測分析を用いた予測符号化方式における予測次数と符号量の関係を説明するためのグラフである。なお、図4の横軸は予測次数を示し、縦軸は符号量を示す。まず、これらの図を用い、従来の短期予測分析を用いた予測符号化方式を説明する。
<符号化方法>
符号化装置2100(図1)のフレームバッファ2111には、標本化・量子化されたPCM (pulse code modulation)形式の時系列信号x(n)が入力される。なお、nは離散時間を示すインデックスであり、インデックスnに対応する離散時間を「離散時間n」と呼ぶ。また、小さいインデックスnほど先の離散時間を示す。また、時系列信号x(n)は、離散時間nでの時系列信号を意味する。
フレームバッファ2111は、予め定められた時間区間(以下、「フレーム」と呼ぶ)分の時系列信号x(n)(n=0,...,N-1)(Nは予め定められた2以上の整数)をバッファする。なお、離散時間n=0,...,N-1からなる時間区間を「時間区間(0,...,N-1)」と表現する。バッファされた1フレーム分の時系列信号x(n)(n=0,...,N-1)は予測符号化部2110の短期予測分析部2112に送られる。短期予測分析部2112は、短期予測分析によって1次からPopt次までのPARCOR係数k(m)(m=1,2,...,Popt)を算出する。
[短期予測分析と最適予測次数]
短期予測分析では、ある時点nの時系列信号x(n)と、その時点nよりも過去のP個(Pを「予測次数」と呼ぶ)の時点n-1,n-2,...,n-Pの時系列信号x(n-1),x(n-2),...,x(n-P)をそれぞれ係数α(m)(m=1,...,P)(「短期予測係数」と呼ぶ)で重み付けしたものと、予測残差e(n)(「予測誤差」と呼ぶ場合もある)と間に線形1次結合が成り立つと仮定する。この仮定に基づいた線形予測モデルは以下の式(1)のようになる。線形予測分析では、入力された時系列信号x(n)(n=0,...,N-1)に対し、予測残差e(n)(n=0,...,N-1)のエネルギーを最小化する短期予測係数α(m)(m=1,2,...,P)又はそれに変換可能なPARCOR係数k(m)(m=1,2,...,P)などの係数を算出する。
e(n)=x(n)+α(1)・x(n-1)+α(2)・x(n-2)+...+α(P)・x(n-P) …(1)
短期予測分析の具体例としては、レビンソン・ダービン(Levinson-Durbin)法やバーグ(Burg)法などの逐次的方法や、自己相関法や共分散法のように予測次数ごとに連立方程式(予測残差を最小にする短期予測係数を解とする連立方程式)を解く方法などがある。
また、ある時点nの時系列信号y(n)を、その時点nよりも過去のP個の時点n-1,n-2,...,n-Pの時系列信号x(n-1),x(n-2),...,x(n-P)を用いて推定する式(2)の線形FIR(Finite Impulse Response)フィルタを「短期予測フィルタ」と呼ぶ。
y(n)=-{α(1)・x(n-1)+α(2)・x(n-2)+...+α(P)・x(n-P)} …(2)
また、Poptは最適な予測次数Pを示す正の整数であり、これを「最適予測次数」と呼ぶ。非特許文献2の方式では、MDL原理(Minimum Description Length Principle)に基づいて、最適予測次数Poptを決定する。MDL原理では、
(符号語長)=(モデルの記述長)+(そのモデルによるデータの記述長)
を最小にするモデルを最良とする。すなわち、非特許文献2の方式では、
(ロスレスで復号するために必要な符号量)=(PARCOR係数のために必要な符号量)+(予測残差のために必要な符号量) …(3)
を最小にする予測次数Pを最適予測次数Poptとする。
図4の直線4Aで模式的に示すようにPARCOR係数のために必要な符号量は予測次数に比例して増加する。また、一般に予測次数が高くなれば予測残差のエネルギーは小さくなり、予測残差をエントロピー符号化した場合の符号量は、曲線4Bで模式的に示すように対数的に小さくなる。そのため、直線4Aと曲線4Bの和である曲線4Cで模式的に示すように、ロスレスで復号するために必要な符号量は、予測次数が高くなるほど小さくなるのではなく、或る予測次数で最小となる。短期予測分析部2112は、予め定められた最小予測次数Pmin以上かつ最大予測次数Pmax以下のすべての整数を探索範囲とし、ロスレス復号するために必要な符号量が最小となる予測次数を最適予測次数Poptとする。
また、上記のように適応的に最適予測次数Poptを決定するのではなく、最適予測次数Poptを固定値とすることも可能である([短期予測分析と最適予測次数]の説明終わり)。
算出されたPARCOR係数k(m)(m=1,2,...,Popt)は、量子化部2113に送られ、量子化されて量子化PARCOR係数i(m)(m=1,2,...,Popt)が生成される。量子化PARCOR係数i(m)(m=1,2,...,Popt)は、係数符号化部2114に送られ、そこで可変長符号化される。また、量子化PARCOR係数i(m)(m=1,2,...,Popt)は、短期予測係数変換部2115にも送られる。短期予測係数変換部2115にはさらに最適予測次数Poptが送られ、短期予測係数変換部2115は、これらを用いて短期予測係数α(m)(m=1,2,...,Popt)を算出する。次に、短期予測部2116は、1フレーム分の時系列信号x(n)(n=0,...,N-1)と各短期予測係数α(m)(m=1,2,...,Popt)と最適予測次数Poptとを用い、P=Poptでの短期予測フィルタ(式(2))に従って短期予測値y(n)(n=0,...,N-1)を計算する。そして、減算部2117は、時系列信号x(n)から短期予測値y(n)を減算した予測残差e(n)を算出する(予測フィルタ処理)。
予測残差e(n)(n=0,...,N-1)は所定の範囲の整数で表現された値である。例えば、入力された時系列信号x(n)が有限ビット数の整数形式で表現され、小数点以下を四捨五入するなどして整数化された線形予測係数をフィルタ係数とする線形予測フィルタの出力値を線形予測値y(n)とする場合には、時系列信号x(n)から線形予測値y(n)を減算した値を予測残差e(n)とすることで、有限ビット数の整数形式で表現された(所定の範囲の整数で表現された)予測残差e(n)が得られる。また、時系列信号x(n)や線形予測値y(n)が整数形式で表現されたものでない場合には、時系列信号x(n)から線形予測値y(n)を減算した値が有限ビット数の整数形式で表現されたものが、予測残差e(n)とされてもよい。残差符号化部2120(図3A)は、当該整数表現された予測残差e(n)(n=0,...,N-1)をゴロム・ライス符号化(Golomb-Rice Coding)する。ゴロム・ライス符号化では、まず、パラメータ算出部2121が、入力された予測残差e(n)(n=0,...,N-1)を用い、整数であるパラメータs(「ライスパラメータ」と呼ぶ場合もある)を生成する。
[パラメータsの生成]
パラメータsの最適値は、入力された予測残差e(n)(n=0,...,N-1)の振幅に依存する。通常、フレームやそれを複数の時間区分に区分したサブフレームなどの或る離散時間区間毎に予測残差e(n)の振幅が均一であると仮定され、その区間での予測残差e(n)の平均振幅から当該区間でのパラメータsが設定される。
しかし、ランダムアクセスされた離散時間区間(フレームやサブフレームなど)の場合、その離散時間区間の各予測残差e(n)の振幅がすべて均一であるとの仮定は妥当ではない。すなわち、ランダムアクセスされた離散時間区間では、その離散時間区間以前の時系列信号を短期予測フィルタ(式(2))による計算に利用することができない。そのため、離散時間区間の最先からPopt番目までの離散時間では、短期予測フィルタによる計算に利用できる時系列信号数が最適予測次数Popt未満に制限される。その結果、離散時間区間の最先からPopt番目までの離散時間での各予測残差e(n)の振幅が、Popt+1番目以後の離散時間での各予測残差e(n)の振幅よりも大きくなる場合が多い。
そのため、非特許文献2の方法では、以下に例示するように、時系列信号x(n)の表現ビット長から固定的に定まる値が離散時間n=0でのパラメータsとされ、離散時間n=3以後の予測残差e(n)の平均振幅から求めたパラメータに固定値を加算した値が離散時間n=1,2でのパラメータsとされ、離散時間n=3以後の予測残差e(n)の平均振幅から求めたパラメータが離散時間n=3,...N-1でのパラメータsとされる。例えば、「時系列信号x(n)の表現ビット長−4」が離散時間n=0でのパラメータsとされ、「予測残差e(n)の平均振幅から求めたパラメータ+3」が離散時間n=1でのパラメータsとされ、「予測残差e(n)の平均振幅から求めたパラメータ+1」が離散時間n=2でのパラメータsとされ、「予測残差e(n)の平均振幅から求めたパラメータ」が離散時間n=3,...N-1でのパラメータsとされる([パラメータsの生成]の説明終わり)。
次に、符号化部2122の分離演算部2122aに予測残差e(n)(n=0,...,N-1)とパラメータsとが入力される。分離演算部2122aは、これらを用いた所定の除算によって、整数の商q(n)(n=0,...,N-1)とその剰余を特定する情報sub(n)(n=0,...,N-1)とを算出する。この除算は、基本的には予測残差e(n)を2sで割る演算である。しかし、正負が存在する予測残差e(n)を区別して取り扱う必要性や符号長削減等の観点から、単に予測残差e(n)を2sで割る演算から多少変更された演算がなされる場合もある。次に、可変長符号化部2122bが、この商q(n)をアルファ符号化し、情報prefix(n)を生成する。生成された情報prefix(n)と情報sub(n)とは合成部2122cに入力される。合成部2122cは、情報prefix(n)と情報sub(n)のビット結合値prefix(n)|sub(n)を予測残差e(n)に対応する残差符号Ce(n)として出力する。また、残差符号化部2120は、例えば、この残差符号Ce(n)とともにパラメータsを出力する。
短期予測分析部2112で選択された最適予測次数Poptと、予測符号化部2110で生成された係数符号Ckと、残差符号化部2120で生成された残差符号Ce(n)及びパラメータsとは、合成部2130に送られ、そこで合成されて符号Cgが生成される。
<復号方法>
復号装置2200(図2)に入力された符号Cgは、分離部2210で最適予測次数Poptと係数符号Ckと残差符号Ce(n)(n=0,...,N-1)とパラメータsとに分離される。最適予測次数Popt及び係数符号Ckは予測復号部2230に入力され、残差符号Ce(n)(n=0,...,N-1)及びパラメータsは残差復号部2220に入力される。
残差復号部2220(図3B)の分離部2221は、入力された残差符号Ce(n)を情報prefix(n)と情報sub(n)とに分離する。分離された情報prefix(n)は、可変長復号部2222で復号されて商q(n)が生成される。そして、合成演算部2223に情報sub(n)と商q(n)とパラメータsとが入力され、合成演算部2223はこれらを用いて予測残差e(n)を復号する。
一方、係数符号Ckは、予測復号部2230の係数復号部2231に入力される。係数復号部2231は、係数符号Ckを復号して量子化PARCOR係数i(m)(m=1,2,...,Popt)を生成する。量子化PARCOR係数i(m)(m=1,2,...,Popt)は短期予測係数変換部2232に送られる。短期予測係数変換部2232は、量子化PARCOR係数i(m)(m=1,2,...,Popt)を用い、最適予測次数Poptの短期予測フィルタ(式(2))の各短期予測係数α(m)(m=1,2,...,Popt)を算出する。短期予測部2233は、算出された各短期予測係数α(m)(m=1,2,...,Popt)と、過去に加算部2234から出力された時系列信号x(n)とを用い、P=Poptの短期予測フィルタ(式(2))によって、短期予測値y(n)(n=0,...,N-1)を生成する。加算部2234は、当該短期予測値y(n)と、残差復号部2220で復号された予測残差e(n)とを加算して、時系列信号のロスレス復号値x(n)(n=0,...,N-1)を生成する(逆予測フィルタ処理)。
Mat Hans and Ronald W. Schafer, "Lossless Compression of Digital Audio", IEEE SIGNAL PROCESSING MAGAZINE, July 2001, pp.21-32. ISO/IEC 14496-3 AMENDMENT 2: Audio Lossless Coding (ALS), new audio profiles and BSAC extensions.
上述のように特許文献2の方法では、時系列信号の表現ビット長から固定的に定まる値や、予測残差の平均振幅から求めたパラメータに固定値を加算した値を、離散時間区間の先頭付近の予測残差を可変長符号化するためのパラメータとしていた。
しかし、このような方法では最適なパラメータからの乖離が大きくなる場合がある。
本発明では、離散時間区間が含む最先の時間区間を第1区間とし、当該第1区間よりも後の時間区間を第2区間とした場合における、当該第2区間を含む時間区間での予測残差の平均振幅の広義単調増加関数値に相当する正の第2区間パラメータが、第2区間の予測残差の可変長符号化用パラメータとして算出される。さらに、第2区間パラメータと、第2区間を含む時間区間での時系列信号の予測効果を表す指標に対応する正の加算値との和の広義単調増加関数値に相当する値が、第1区間に属する或る離散時間での予測残差の可変長符号化用パラメータとして算出される。
本発明では、予測残差の可変長符号化用パラメータを適切に選択できる。
従来における予測符号化方式の符号化装置の機能構成を説明するためのブロック図。 従来における予測符号化方式の復号装置の機能構成を説明するためのブロック図。 図3Aは、図1に示す残差符号化部の機能構成を説明するためのブロック図であり、図3Bは、図2に示す残差復号部の機能構成を説明するためのブロック図である。 短期予測分析を用いた予測符号化方式における予測次数と符号量の関係を説明するためのグラフ。 図5A、5Bは、ランダムアクセスされたフレームの予測残差e(n)の振幅(|e(n)|)を模式的に例示した図である。 図6A〜6Cは、ランダムアクセスされたフレームの予測残差e(n)の振幅(|e(n)|)を模式的に例示した図である。 第1実施形態の符号化装置の機能構成を説明するためのブロック図。 図7に示した残差符号化部の機能構成を説明するためのブロック図。 第1実施形態の復号装置の機能構成を説明するためのブロック図。 図9に示した残差復号部の機能構成を説明するためのブロック図。 第1実施形態の符号化方法を説明するためのフローチャート。 図11のステップS30の一例を説明するためのフローチャート。 図11のステップS50の詳細を例示するためのフローチャート。 第1実施形態の復号方法を説明するためのフローチャート。 ステップS250の詳細を例示するためのフローチャート。 第2実施形態における符号化装置の残差符号部の機能構成を説明するためのブロック図。 第2実施形態における復号装置の残差復号部の機能構成を説明するためのブロック図。 加算値a(r)を特定する基準の一例を説明するためのフローチャート。 第2実施形態の変形例における符号化装置の残差符号部の機能構成を説明するためのブロック図。 第2実施形態の変形例の符号化方法を説明するためのフローチャート。 図20のステップS630の一例を説明するためのフローチャート。 第3実施形態の符号化装置の機能構成を説明するためのブロック図。 図22に示した残差符号化部の機能構成を説明するためのブロック図。 第3実施形態の復号装置の機能構成を説明するためのブロック図。 図24に示した残差復号部の機能構成を説明するためのブロック図。 第3実施形態の符号化方法を説明するためのフローチャート。 図26のステップS730の一例を説明するためのフローチャート。 第3実施形態の復号方法を説明するためのフローチャート
以下では、本形態の原理を説明した後、各実施形態の説明を行っていく。
〔原理〕
まず、従来方式で予測残差の可変長符号化用のパラメータを選択した場合に、最適なパラメータからの乖離が大きくなる原因を検証する(非公知)。
まず、時系列信号の表現ビット長から固定的に定まる値をパラメータとした場合、予測残差の振幅によっては、最適なパラメータからの乖離が大きくなる場合がある。
また、予測残差の平均振幅から求めたパラメータに固定値を加算して得られる値を、ランダムアクセスされた離散時間区間の先頭付近でのパラメータした場合、当該離散時間区間での短期予測の程度(予測効果の程度)によっては最適な値からの乖離が大きくなる場合がある。すなわち、各時系列信号の自己相関が大きい場合には、予測次数を大きくすることで予測残差を小さくでき、最適予測次数が大きくなる(図4参照)。この場合、短期予測フィルタによる計算に利用できる時系列信号を十分確保(例えば最適予測次数の時系列信号が確保)できる時間区間(以下「時系列信号を十分確保できる時間区間」という)であれば、時系列信号の平均振幅に対する予測残差の平均振幅の比を小さくできる。しかし、短期予測フィルタによる計算に利用できる時系列信号を十分確保できない先頭付近などの区間(以下「時系列信号を十分確保できない時間区間」という)では予測残差を十分小さくすることができない。そのため、各時系列信号の自己相関が大きい場合には、時系列信号を十分確保できる時間区間での予測残差の振幅と、時系列信号を十分確保できない時間区間での予測残差の振幅との差が大きくなる。一方、各時系列信号の自己相関が小さい場合には、予測次数を大きくしても、時系列信号の平均振幅に対する予測残差の平均振幅の比はさほど小さくならないため、最適予測次数は小さくなる(図4参照)。この場合には、そもそも最適予測次数が小さいため、時系列信号を十分確保できる時間区間での予測残差の振幅と、時系列信号を十分確保できない時間区間での予測残差の振幅との差は小さくなる。つまり、各時系列信号の自己相関の大小に応じ、時系列信号を十分確保できる時間区間での予測残差の振幅と、時系列信号を十分確保できない時間区間での予測残差の振幅との差が変動する。そして、最適なパラメータは予測残差の振幅に依存するのであるから、各時系列信号の自己相関の大小、すなわち、時系列信号の平均振幅に対する予測残差の平均振幅の比に応じ、時系列信号を十分確保できる時間区間での最適なパラメータと時系列信号を十分確保できない時間区間での最適なパラメータとの差が変動する。特許文献2の方法では、これらの最適なパラメータの差を固定値とし、時系列信号を十分確保できない時間区間でのパラメータを設定していた。そのため、各時系列信号の自己相関の大きさによっては、時系列信号を十分確保できない時間区間でのパラメータが不適切なものとなる。
同様な問題は、最適予測次数を固定値とした場合でも生じる。すなわち、各時系列信号の自己相関が大きい場合、時系列信号を十分確保できる時間区間であれば予測残差を小さくできるが、時系列信号を十分確保できない時間区間では予測残差を十分小さくすることができない。そのため、各時系列信号の自己相関が大きい場合には、時系列信号を十分確保できる時間区間での予測残差の振幅と、時系列信号を十分確保できない時間区間での予測残差の振幅との差が大きくなる。一方、各時系列信号の自己相関が小さい場合には、短期予測フィルタによる計算に利用できる時系列信号が増加しても予測残差はさほど減少しないため、時系列信号を十分確保できる時間区間での予測残差の振幅と、時系列信号を十分確保できない時間区間での予測残差の振幅との差は小さくなる。この場合も、各時系列信号の自己相関の大小に応じ、時系列信号を十分確保できる時間区間での最適なパラメータと時系列信号を十分確保できない時間区間での最適なパラメータとの差が変動し、特許文献2の方法では、時系列信号を十分確保できない時間区間でのパラメータが不適切となる場合がある。
また、同様な問題は、長期予測分析を用いた予測符号化方式や、短期予測分析と長期予測分析とを組み合わせた予測符号化方式でも生じる。
長期予測分析は、時系列信号の振幅特性が基本周期で繰り返される性質を利用した予測分析である。長期予測分析では、ある時点nの時系列信号x(n)を、その時点nよりもτ+jだけ過去の時点n-τ-jの各時系列信号x(n-τ-j)〔τは基本周期(遅延値)、j=-tap,...,tap(tapは0や1を用いることが多い)〕をそれぞれ係数ρ(j)(「ゲイン」と呼ぶ)で重み付けしたものと、予測残差e(n)と間に線形1次結合が成り立つと仮定した長期予測モデル
e(n)=x(n)+ρ(-tap)・x(n-τ+tap)+...+ρ(tap)・x(n-τ-tap) …(4)
を定める。そして、入力された時系列信号x(n)に対し、予測残差e(n)のエネルギーを最小化するゲインρ(j)や遅延値τが算出される。ここで、
y(n)=-{ρ(-tap)・x(n-τ+tap)+...+ρ(tap)・x(n-τ-tap)} …(5)
の線形FIRフィルタを「長期予測フィルタ」と呼ぶ。
長期予測分析の場合も、基本周期ごとの各時系列信号の自己相関が大きい場合、長期予測フィルタによる計算に利用できる時系列信号を十分確保できる時間区間では予測残差を小さくできるが、時系列信号を十分確保できない時間区間では予測残差を十分小さくすることができない(式(4)参照)。一方、各時系列信号の自己相関が小さい場合には、長期予測フィルタによる計算に利用できる時系列信号が増加しても予測残差はさほど減少しないため、時系列信号を十分確保できる時間区間での予測残差の振幅と、時系列信号を十分確保できない時間区間での予測残差の振幅との差は小さくなる。そのため、各時系列信号の自己相関の大小に応じ、時系列信号を十分確保できる時間区間での最適なパラメータと時系列信号を十分確保できない時間区間での最適なパラメータとの差が変動し、特許文献2の方法では、時系列信号を十分確保できない時間区間でのパラメータが不適切となる場合がある。
また、上述したような問題は、予測残差をゴロム・ライス符号化するためのライスパラメータのみに限定されたものではなく、予測残差を可変長符号化するためのパラメータであって、符号量を最小化するための最適値が当該予測残差の振幅が大きくなるに従って広義単調増加又は単調増加するパラメータに共通する問題である。
本発明の実施形態では、以下のように、このような問題を解決する。
まず、短期予測フィルタを用いて得られた予測残差を符号化する場合を例にとって説明する。
図5A、5B及び図6A〜6Cは、ランダムアクセスされたフレーム(「或る離散時間区間」に相当)の予測残差e(n)の振幅(|e(n)|)を模式的に例示した図である。なお、これらの図における横軸は離散時間nであり、縦軸は予測残差の振幅である。また、フレームは離散時間n=0,...N-1からなる離散時間区間(0,...N-1)であり、T1はフレームの最先の離散時間からL番目の離散時間までの時間区間(第1区間:離散時間区間が含む最先の時間区間)であり、T2はフレームのL+1番目の離散時間から最後の離散時間までの時間区間(第2区間:第1区間よりも後の時間区間)である。なお、Nは予め定められた2以上の整数である。また、Lは離散時間区間(0,...N-1)に属する離散時間数N未満の予め定められた正の整数(1以上の整数)である。短期予測フィルタを用いて得られた予測残差を符号化する場合、Lは短期予測分析の最大予測次数Pmax以下の予め定められた正の整数である。
図5Aは、各時系列信号x(n)(n=0,...,N-1)の自己相関が大きい場合の予測残差e(n)(n=0,...,N-1)の振幅を模式的に例示している。また、図5Bは、各時系列信号x(n)(n=0,...,N-1)の自己相関が小さい場合の予測残差e(n)(n=0,...,N-1)を模式的に例示している。
図5Aに例示するように、各時系列信号x(n)(n=0,...,N-1)の自己相関が大きい場合には、最適予測次数Poptが大きくなるため、時系列信号x(n)を十分確保できない先頭付近の時間区間での予測残差e(n)の振幅が大きくなり、それ以後の時系列信号x(n)を十分確保できる時間区間での予測残差e(n)の振幅が小さくなる。一方、各時系列信号x(n)(n=0,...,N-1)の自己相関が小さい場合には、最適予測次数Poptが小さくなるため、図5Bに例示するように、時系列信号x(n)を十分確保できない時間区間での予測残差e(n)の振幅だけでなく、時系列信号x(n)を十分確保できる時間区間での予測残差e(n)の振幅も大きくなる。このように、各時系列信号x(n)(n=0,...,N-1)の自己相関の大小に応じ、時系列信号x(n)を十分確保できない時間区間での予測残差e(n)の振幅と、時系列信号x(n)を十分確保できる時間区間での予測残差e(n)の振幅との差が変動する。そして、予測残差e(n)(n=0,...,N-1)を可変長符号化するために最適なパラメータは予測残差e(n)(n=0,...,N-1)の振幅に依存するのであるから、各時系列信号x(n)(n=0,...,N-1)の自己相関の大小に応じ、時系列信号x(n)を十分確保できる時間区間で最適なパラメータと、時系列信号x(n)を十分確保できない時間区間で最適なパラメータとの差が変動する。
本形態では、予測残差e(n)(n=0,...,N-1)を可変長符号化するときに、時系列信号x(n)を十分確保できる時間区間で最適なパラメータと、各時系列信号x(n)(n=0,...,N-1)の自己相関が大きくなるに従って広義単調増加する関係にある正の加算値との和又はその補正値(これらは当該加算値の広義単調増加関数値に相当する)を、時系列信号x(n)を十分確保できない時間区間で最適なパラメータとして推定する。
すなわち、図5Aのように、各時系列信号x(n)(n=0,...,N-1)の自己相関が大きく、第2区間T2を含む時間区間での時系列信号x(μ)(μ=μmin,...,μmax、μminmax)の平均振幅に対する予測残差e(μ)(μ=μmin,...,μmax)の平均振幅の比が小さい場合(予測効果が大きい場合)には、時系列信号x(n)を十分確保できる時間区間(第2区間T2を含む時間区間)で最適なパラメータに大きな加算値を加えたもの又はその補正値を、時系列信号x(n)を十分確保できない時間区間(第1区間T1)でのパラメータとして推定する。
一方、図5Bのように、各時系列信号x(n)(n=0,...,N-1)の自己相関が小さく、第2区間T2を含む時間区間での時系列信号x(μ)(μ=μmin,...,μmax)の平均振幅に対する予測残差e(μ)(μ=μmin,...,μmax)の平均振幅の比が大きい場合(予測効果が小さい場合)には、時系列信号x(n)を十分確保できる時間区間(第2区間T2を含む時間区間)で最適なパラメータに小さな加算値(0を含む)を加えたもの又はその補正値を、時系列信号x(n)を十分確保できない時間区間(第1区間T1)でのパラメータとして推定する。
つまり、第2区間T2を含む時間区間で最適なパラメータと、第2区間T2を含む時間区間での時系列信号x(μ)(μ=μmin,...,μmax)の平均振幅に対する予測残差e(μ)(μ=μmin,...,μmax)の平均振幅の比が小さくに従って広義単調増加する関係にある加算値と、の和に対して広義単調増加する関係にある値を、第1区間T1でのパラメータとして推定する。加算値は、第2区間T2を含む時間区間での時系列信号の平均振幅に対する予測残差の平均振幅の比の広義単調減少関数値に相当する。
言い換えると、本形態では、第2区間T2を含む時間区間で最適なパラメータと、第2区間T2を含む時間区間での時系列信号x(μ)(μ=μmin,...,μmax)の予測効果を表す指標に対応する正の加算値との和の広義単調増加関数値に相当する値を、第1区間T1でのパラメータとする。これにより、各時系列信号x(n)(n=0,...,N-1)の自己相関の大小(予測効果の大小)に応じた最適なパラメータを推定できる。
ここで、最適予測次数Poptの短期予測フィルタによる計算に必要なすべての時系列信号x(n)を確保できない時間区間は、先頭からPopt番目までの離散時間からなる時間区間(0,...,Popt-1)である。また、最適予測次数Poptは、最小予測次数Pmin以上かつ最大予測次数Pmax以下の範囲から適応的に選択される。そのため、短期予測フィルタによる計算に必要なすべての時系列信号x(n)を確保できない時間区間となり得るのは、先頭からPmax番目までの離散時間からなる時間区間(0,...,Pmax-1)である。
そこで、本形態では、時間区間(0,...,Pmax-1)のうちの時間区間(0,...,L-1)を第1区間T1とする。また、残りの時間区間(L,...,N-1)を第2区間T2とする。そして、予測残差e(n)を可変長符号化するときに、第2区間T2を含む時間区間での予測残差e(μ)(μ=μmin,...,μmax)の平均振幅が大きくなるに従って広義単調増加する関係にある正の第2区間パラメータsが、第2区間T2の予測残差e(z)を可変長符号化するためのパラメータとして算出される。第2区間パラメータsは、第2区間T2を含む時間区間での予測残差e(μ)(μ=μmin,...,μmax)の平均振幅の広義単調増加関数値に相当する。
さらに、本形態では、第2区間パラメータsと、フレームに属する時系列信号x(n)(n=0,...,N-1)の自己相関が大きくなるに従って広義単調増加する関係にある正の加算値との和又はその補正値である第1区間パラメータが、第1区間T1に属する或る離散時間での予測残差を可変長符号化するためのパラメータとされる。第1区間パラメータは、第2区間パラメータsと、時系列信号x(μ)(μ=μmin,...,μmax)の予測効果を表す指標に対応する正の加算値と、の和の広義単調増加関数値に相当する。 予測残差e(n)の符号を復号するときには、予測残差e(n)を可変長符号化するときと同一の基準に従い、正の加算値が求められる。さらに、第2区間T2を含む時間区間での予測残差の平均振幅が大きくなるに従って広義単調増加する関係にある正の第2区間パラメータと、当該加算値と、の和又はその補正値である第1区間パラメータが、第1区間T1に属する或る離散時間での予測残差の可変長符号を復号するためのパラメータとされる。
なお、本形態では、ランダムアクセスされた或る離散時間区間の一例として、ランダムアクセスされたフレームが例示される。しかしながら、ランダムアクセスされた先頭のサブフレームが「或る離散時間区間」であってもよい。また、本形態で使用する「広義単調増加」は「単調非減少」と同義であり、値γが大きくなるに従って広義単調増加する値(広義単調増加関数値に相当する値)をf(γ)と表現した場合、任意のγ≦γに対してf(γ)≦f(γ)の関係が成り立つ。また、「広義単調減少」は単調非増加と同義であり、値γが大きくなるに従って広義単調減少する値(広義単調減少関数値に相当する値)をg(γ)と表現した場合、任意のγ≦γに対してg(γ)≧g(γ)の関係が成り立つ。
以下に、短期予測フィルタを用いて得られた予測残差を符号化する場合の加算値の設定例を列挙する。
<PARCOR係数の大きさを指標とする例>
フレームに属する時系列信号x(n)の自己相関の大きさを示す指標(時系列信号x(μ)(μ=μmin,...,μmax)の予測効果を表す指標)の一つにPARCOR係数k(m)がある。PARCOR係数k(m)は-1.0≦k(m)≦1.0の値をとり、時系列信号x(n)の自己相関が大きいほど絶対値が大きくなる。そのため、或る次数のPARCOR係数k(m)の大きさを指標とし、その大きさに応じて加算値の値を変化させることで、第1区間T1で最適なパラメータを選択することが可能となる。すなわち、フレームに属する時系列信号に対応する或る次数のPARCOR係数の大きさが第1値である場合に、第2区間パラメータと、正の第1加算値との和の広義単調増加関数値に相当する値を、第1区間T1に属する或る離散時間での予測残差の可変長符号化用のパラメータする。PARCOR係数の大きさが第1値よりも大きな第2値である場合に、第2区間パラメータと、第1加算値以上の第2加算値との和の広義単調増加関数値に相当する値を、第1区間T1に属する或る離散時間での予測残差の可変長符号化用のパラメータとする。なお、PARCOR係数の大きさとは、例えば、PARCOR係数の振幅の大きさ、PARCOR係数の絶対値の大きさ、PARCOR係数のエネルギーの大きさなどである。また、PARCOR係数の写像値の大きさを評価することで、PARCOR係数の大きさが評価されてもよい。
この例では、予測残差e(n)を可変長符号化するときに、フレーム内の時系列信号x(n)(n=0,...,N-1)を短期予測分析して得られた或る次数のPARCOR係数k(m)の絶対値|k(m)|が大きくなるに従って広義単調増加する関係にある値を加算値とし、第1区間T1での最適なパラメータを設定する。この場合の加算値は、或る次数のPARCOR係数k(m)の大きさの広義単調増加関数値に相当する。そして、予測残差e(n)の符号を復号するときには、符号化時に加算値の決定に用いられた次数のPARCOR係数に対応する符号の復号値を用い、符号化時と同じ基準に従って加算値を定め、第1区間T1でのパラメータを算出する。
[例1〜4]
例1〜4はL=3の例である。各加算値a(r)が1次のPARCOR係数k(1)の絶対値|k(1)|の増加に応じて段階的に大きくなるように設定されている。また、加算値a(r)は離散時間rでの加算値であり、各離散時間r=0,1,2での第1区間パラメータはs(r)=s+a(r)(r=0,1,2)となる。なお、第1区間T1の最先からL番目までの離散時間の各インデックスをr(r=0,...,L-1)とし、インデックスrが示す離散時間を「離散時間r」と呼ぶ。なお、フレームの先頭に近い離散時間での予測残差ほど大きさが大きくなる傾向がある。そのため、加算値a(r)は、インデックスrの広義単調減少関数値に相当する値であることが望ましい。
また、例3のように|k(1)|の値に応じ、加算値a(r)が各離散時間r=0,1,2で0とされてもよいし、例4のように|k(1)|の値に応じ、加算値a(r)が各離散時間r=0,1,2で同値とされてもよい。また、例5のように、|k(1)|の値の変化に応じて連続的に変化する関数値を加算値a(r)としてもよい。
《例1》
0.9≦|k(1)|≦1.0のとき:a(0)=3, a(1)=2, a(2)=1
0.6≦|k(1)|<0.9のとき:a(0)=2, a(1)=1, a(2)=0
0≦|k(1)|<0.6のとき :a(0)=1, a(1)=0, a(2)=0
《例2》
0.9≦|k(1)|≦1.0のとき:a(0)=2, a(1)=1, a(2)=0
0≦|k(1)|<0.9のとき :a(0)=1, a(1)=0, a(2)=0
《例3》
0.9≦|k(1)|≦1.0のとき:a(0)=3, a(1)=2, a(2)=1
0.6≦|k(1)|<0.9のとき:a(0)=2, a(1)=1, a(2)=0
0≦|k(1)|<0.6のとき :a(0)=0, a(1)=0, a(2)=0
《例4》
0.9≦|k(1)|≦1.0のとき:a(0)=2, a(1)=2, a(2)=2
0≦|k(1)|<0.9のとき :a(0)=1, a(1)=1, a(2)=1
《例5》
a(0)=2|k(1)|+1, a(1)=2|k(1)|, a(2)=|k(1)|
[例6,7]
例6,7もL=3の例であるが、第1区間T1の一部の離散時間のみに本発明が適用される。この例では、離散時間r=0でのパラメータが固定値(例えば、時系列信号x(n)の表現ビット長−4)とされ、離散時間r=1,2でのパラメータが第1区間パラメータs(r)=s+a(r)(r=1,2)とされる。また、例7では、離散時間r=1での加算値a(1)が|k(1)|の増加に応じて段階的に大きくなるように設定され、離散時間r=2での加算値a(2)が固定値となっている。
《例6》
0.9≦|k(1)|≦1.0のとき:a(1)=3, a(2)=2
0.6≦|k(1)|<0.9のとき:a(1)=2, a(2)=1
0≦|k(1)|<0.6のとき :a(1)=1, a(2)=0
《例7》
0.9≦|k(1)|≦1.0のとき:a(1)=3, a(2)=1
0.6≦|k(1)|<0.9のとき:a(1)=2, a(2)=1
0≦|k(1)|<0.6のとき :a(1)=1, a(2)=1
<最適予測次数を指標とする例>
フレームに属する時系列信号x(n)(n=0,...,N-1)の自己相関の大きさを示す指標(時系列信号x(μ)(μ=μmin,...,μmax)の予測効果を表す指標)として、最適予測次数Poptが用いられてもよい。時系列信号x(n)(n=0,...,N-1)の自己相関が大きいほど(予測効果が大きいほど)、予測次数の増加に伴う予測残差e(n)のエネルギー減少量が大きくなり、適応的に選択される最適予測次数Poptが大きくなる。そのため、最適予測次数Poptを指標とし、その大きさに応じて加算値の値を変化させることで、第1区間T1での最適なパラメータ設定が可能となる。
この例では、予測残差e(n)を可変長符号化するときに、フレームに属する時系列信号x(n)(n=0,...,N-1)の短期予測分析を行う際に適応的に選択された最適予測次数Poptが大きくなるに従って広義単調増加する関係にある値を加算値とし、第1区間T1での最適なパラメータを設定する。この例の場合の加算値は、最適予測次数Poptの広義単調増加関数値に相当する。そして、予測残差e(n)の符号を復号するときには、符号化時に加算値の決定に用いられた最適予測次数Poptを用い、符号化時と同じ基準に従って加算値を定め、第1区間T1でのパラメータを算出する。
[例8,9]
例8はL=3の例である。各加算値a(r)が最適予測次数Poptの増加に応じて段階的に大きくなるように設定されている。各離散時間r=0,1,2での第1区間パラメータはs(r)=s+a(r)(r=0,1,2)となる。なお、フレームの先頭に近い離散時間での予測残差ほど大きさが大きくなる傾向がある。そのため、加算値a(r)はインデックスrの広義単調減少関数値に相当する値であることが望ましい。また、例9はL=2の例である。その他、PARCOR係数を指標とする場合と同様、最適予測次数Poptの値に応じ、加算値a(r)が各離散時間r=0,1,2で0とされてもよいし、加算値a(r)が各離散時間r=0,1,2で同値とされてもよい。また、この例の場合も、第1区間T1の一部の離散時間のみに本発明が適用されてもよい。また、最適予測次数Poptの変化に応じて連続的に変化する関数値が加算値a(r)とされてもよい。
《例8》
16≦Popt≦Pmaxのとき :a(0)=3, a(1)=2, a(2)=1
4≦Popt<16のとき :a(0)=2, a(1)=1, a(2)=0
Pmin≦Popt<4のとき :a(0)=1, a(1)=0, a(2)=0
《例9》
16≦Popt≦Pmaxのとき :a(0)=3, a(1)=2
4≦Popt<16のとき :a(0)=2, a(1)=1
Pmin≦Popt<4のとき :a(0)=1, a(1)=0
<予測残差のエネルギーを指標とする例1>
フレームに属する時系列信号x(n)(n=0,...,N-1)の自己相関が大きい場合(時系列信号x(μ)(μ=μmin,...,μmax)の予測効果が大きい場合)には、フレーム内の予測残差のエネルギーが小さくなる。逆に自己相関が小さい場合(時系列信号x(μ)(μ=μmin,...,μmax)の予測効果が小さい場合)には、フレーム内の予測残差のエネルギーが大きくなる。そのため、フレームに属する時系列信号x(n)(n=0,...,N-1)の自己相関の大きさを示す指標(時系列信号x(μ)(μ=μmin,...,μmax)の予測効果を表す指標)として、フレーム内の予測残差のエネルギーが用いられてもよい。フレーム内の予測残差のエネルギーの総和は、フレーム内の時系列信号x(n)(n=0,...,N-1)を予測次数Pで短期予測分析して得られた1次からP次までの各PARCOR係数k(m)(m=1,...,P)を用いてE(0)・Πm=1 P{1-k(m)2}によって算出できる。なお、E(0)は、フレーム内の時系列信号x(n)(n=0,...,N-1)のエネルギーの総和E(0)=Σn=0 N-1{x(n)}2である。また、予測次数Pが適応的に選択される場合、予測次数Pは最適予測次数Poptとなる。ただ、E(0)は時系列信号x(n)(n=0,...,N-1)の自己相関の大小の指標とはならないため、E(p)=Πm=1 P{1-k(m)2}を指標として用いる。
この例では、予測残差e(n)(n=0,...,N-1)を可変長符号化するときに、E(p)=Πm=1 P{1-k(m)2}が大きくなるに従って広義単調増減少する関係にある値(E(p)の広義単調増減少関数値に相当する値)が加算値とされ、第1区間T1での最適なパラメータが設定される。なお、各予測次数mでの1-k(m)2は、バーグ(Burg)法など短期予測分析の過程で計算される値であるため、その過程で得られた各1-k(m)2をメモリに保存しておけば、各1-k(m)2を再計算することなくE(p)を算出できる。そして、予測残差e(n)の符号を復号するときには、1次からP次までの各PARCOR係数に対応する符号の復号値を用い、符号化時と同じ基準に従って加算値が定められ、第1区間T1でのパラメータが算出される。
[例10,11]
例10はL=3の例である。各加算値a(r)がE(p)の増加に応じて段階的に小さくなるように設定されている。各離散時間r=0,1,2での第1区間パラメータはs(r)=s+a(r)(r=0,1,2)となる。フレームの先頭に近い離散時間での予測残差ほど大きさが大きくなる傾向がある。そのため、加算値a(r)はインデックスrの広義単調減少関数値に相当する値であることが望ましい。また、例11はL=2の例である。その他、PARCOR係数を指標とする場合と同様、E(p)の値に応じ、加算値a(r)が各離散時間r=0,1,2で0とされてもよいし、加算値a(r)が各離散時間r=0,1,2で同値とされてもよい。また、この例の場合も、第1区間T1の一部の離散時間のみに本発明を適用することとしてもよい。また、E(p)の値の変化に応じて連続的に変化する関数値が加算値a(r)とされてもよい。
《例10》
0≦E(p)<0.1のとき :a(0)=3, a(1)=2, a(2)=1
0.1≦E(p)<0.6のとき:a(0)=2, a(1)=1, a(2)=0
0.6≦E(p)≦1のとき :a(0)=1, a(1)=0, a(2)=0
《例11》
0≦E(p)<0.1のとき :a(0)=3, a(1)=2
0.1≦E(p)<0.6のとき:a(0)=2, a(1)=1
0.6≦E(p)≦1のとき :a(0)=1, a(1)=0
<予測残差のエネルギーを指標とする例2>
第1区間T1の先頭の離散時間r=0では、短期予測フィルタによる計算に用いることができる時系列信号が存在しない。そこで、フレーム内の時系列信号x(n)(n=0,...,N-1)の平均エネルギーE(0)/Nを用い、離散時間r=0での予測残差e(0)のエネルギーをE(0)/Nと推定する。また、P>r>0の場合、第1区間T1の離散時間rでの予測残差e(r)のエネルギーは、{E(0)/N}・Πm=1 r{1-k(m)2}と推定される。なお、予測次数Pが適応的に選択される場合、予測次数Pは最適予測次数Poptとなる。また、L≧Pの場合、第2区間T2の離散時間zでの予測残差e(z)(z=L,...,N-1)の各エネルギーは{E(0)/N}・Πm=1 P{1-k(m)2}で推定され、第2区間T2の予測残差e(z)(z=L,...,N-1)の平均エネルギーは{E(0)/N}・Πm=1 P{1-k(m)2}で近似される。
よって、L≧Pの場合、第1区間T1の先頭の離散時間r=0の予測残差e(0)のエネルギーと、第2区間T2の予測残差e(z)(z=L,...,N-1)の平均エネルギーとの差は、
{E(0)/N}{1-Πm=1 P{1-k(m)2}}
で近似される。また、L≧P>r>0の場合、第1区間T1の離散時間rでの予測残差e(r)のエネルギーと、第2区間T2の予測残差e(z)(z=L,...,N-1)の平均エネルギーとの差は、
{E(0)/N}{{Πm=1 r{1-k(m)2}-Πm=1 P{1-k(m)2}}
で近似される。
そのため、この例では、予測残差e(n)を可変長符号化するときに、1-Πm=1 P{1-k(m)2}が大きくなるに従って広義単調増加する関係にある値(1-Πm=1 P{1-k(m)2}の広義単調増加関数値に相当する値)を離散時間r=0での加算値a(0)とする。また、Πm=1 r{1-k(m)2}-Πm=1 P{1-k(m)2}が大きくなるに従って広義単調増加する関係にある値(Πm=1 r{1-k(m)2}-Πm=1 P{1-k(m)2}の広義単調増加関数値に相当する値)を離散時間r(0<r<P)での加算値a(r)とする。そして、これらの加算値を用い、第1区間T1で最適なパラメータが設定される。そして、予測残差e(n)の符号を復号するときには、1次からP次までの各PARCOR係数に対応する符号の復号値を用い、符号化時と同じ基準に従って加算値が求められ、第1区間T1でのパラメータが算出される。
なお、この例の場合、各離散時間r(r=0,...,L-1)での第1区間パラメータは、s(r)=s+a(r)となる。その他、PARCOR係数を指標とする場合と同様、1-Πm=1 P{1-k(m)2}やΠm=1 r{1-k(m)2}-Πm=1 P{1-k(m)2}の値に応じ、加算値a(r)(r=0,...,L-1)が各離散時間r(r=0,...,L-1)で0とされてもよいし、加算値a(r)(r=0,...,L-1)が各離散時間r(r=0,...,L-1)で同値とされてもよい。また、この場合も、第1区間T1の一部の離散時間のみに本発明が適用されてもよい。また、1-Πm=1 P{1-k(m)2}やΠm=1 r{1-k(m)2}-Πm=1 P{1-k(m)2}の値の変化に応じて連続的に変化する関数値が加算値a(r)とされてもよい。
<フレームのサンプル数と加算値との関係の一例>
図6Aは、図5Aよりもフレームに属するサンプル数が少ない場合の予測残差e(n)(n=0,...,N-1)の振幅を模式的に例示している。図5Aと図6Aとを比較すれば分かるように、フレームに属するサンプル数が少ないほど、第2区間T2での予測残差の平均振幅が増加する傾向がある。これは、フレームに属するサンプル数が少ないほど、第2区間T2中に占める「短期予測フィルタによる計算に必要なすべての時系列信号x(n)を確保できない時間区間」の割合が大きくなることに起因する。そのため、加算値は、符号化の処理単位となるランダムアクセスされた離散時間区間に属する時系列信号数が大きくなるに従って広義単調増加する関係にあることが望ましい。言い換えると、加算値は、離散時間区間に属する時系列信号数の広義単調増加関数値に相当する値であることが望ましい。例えば、符号化の処理単位がフレーム又はサブフレームに切り替え可能とされ、サブフレームを処理単位として用いる場合の加算値よりも、フレームを処理単位として用いる場合の加算値が大きくされてもよい。
<第2区間パラメータの大きさと加算値との関係の一例>
図6Bは、フレームに属する予測残差e(n)の振幅が0に近い場合を模式的に例示している。また、図6Cは、フレームに属する予測残差e(n)の振幅が最大振幅値MAXに近い場合を模式的に例示している。
図6Bのように、フレームに属する各予測残差e(n)の振幅が0に近い場合には、そのフレームが無音区間である可能性が高い。この場合、第1区間T1での予測残差e(r)(r=0,...,L-1)の平均振幅と第2区間T2での予測残差e(z)(z=L,...,N-1)の平均振幅との差も0に近くなる。この場合には、各時系列信号x(n)(n=0,...,N-1)の自己相関の大きさの変動(時系列信号x(μ)(μ=μmin,...,μmax)の予測効果の大きさの変動)に対応する、第1区間T1と第2区間T2とでの平均振幅の差の変動幅も小さくなる。
また、図6Cのようにフレームに属する各予測残差e(n)(n=0,...,N-1)の振幅が最大振幅値MAXに近い場合には、各予測残差e(n)(n=0,...,N-1)が飽和する。この場合、第1区間T1での予測残差e(r)(r=0,...,L-1)の平均振幅と第2区間T2での予測残差e(z)(z=L,...,N-1)の平均振幅との差が0に近くなる場合が多い。この場合には、各時系列信号x(n)(n=0,...,N-1)の自己相関の大きさの違いに対応する、第1区間T1と第2区間T2とでの平均振幅の差の違いも小さくなる。
以上より、フレームに属する各予測残差e(n)(n=0,...,N-1)の振幅が0に近い場合や最大振幅値MAXに近い場合には、加算値を小さくする設定が望ましい。具体的には、0以上最大振幅値MAX以下の範囲に所定値TH1と所定値TH2とを設定し(0≦TH1<TH2≦MAX)、第2区間パラメータsが所定値TH1以下である場合の加算値a(r)が、当該第2区間パラメータが当該所定値TH1よりも大きく所定値TH2よりも小さい場合の加算値a(r)以下となるようにしてもよい。すなわち、第2区間パラメータsが所定値TH1以下である場合の加算値が、第2区間パラメータsが所定値TH1よりも大きい場合の加算値よりも小さくてもよい。又は、第2区間パラメータsが所定値TH2以上である場合の加算値a(r)が、当該第2区間パラメータsが所定値TH1よりも大きく当該所定値TH2よりも小さい場合の加算値a(r)以下となるようにしてもよい。すなわち、第2区間パラメータsが所定値TH2以上ある場合の加算値が、第2区間パラメータsが所定値TH2よりも小さい場合の加算値よりも小さくてもよい。又は、これら両方の設定を行ってもよい。
<付加情報>
上述した加算値を特定するために必要なPARCOR係数などの指標は、従来の短期予測符号化方式でも復号装置に与えられるものである。すなわち、本形態の処理を行うにあたり、符号化装置は、符号に新たな情報を付加する必要はない。
しかし、符号化装置が、加算値を特定するための基準を選択できる構成とし、符号化装置が選択した基準を示す補助情報dが符号に含まれてもよい。例えば、符号化装置が、上述した《例1》の基準と《例2》の基準とから1つの基準を選択し、その基準に従って加算値を決定し、選択した基準を示す補助情報dを符号に含めて復号装置に与えてもよい。また、符号化装置が上述したPARCOR係数を指標とする基準と最適予測次数を指標とする基準とから1つの基準を選択し、その基準に従って加算値を決定し、選択した基準を示す補助情報dを符号に含めて復号装置に与えてもよい。
また、第2区間パラメータと加算値との和を第1区間パラメータとするのではなく、第2区間パラメータと加算値との和に対して広義単調増加する関係にある補正値を第1区間パラメータとしてもよい。この場合、符号化装置が、その補正内容を示す補助情報cを符号に含めて復号装置に与えることにしてもよい。補正内容を示す補助情報cの一例は、第1区間T1の予測残差e(r)(r=0,...,L-1)の平均振幅から実際に計算したパラメータと、第2区間パラメータと加算値との和との差である。
<基準の組み合わせ>
上述した基準を組み合わせて加算値a(r)(r=0,...,L-1)が設定されてもよい。例えば、異なる離散時間で異なる基準が用いられてもよい。例えば、離散時間r=1では、上述したPARCOR係数を指標とする基準に従って加算値a(1)が定められ、離散時間r=2では、上述した最適予測次数を指標とする基準に従って加算値a(2)が定められてもよい。
<パラメータ>
なお、本形態で設定を行うパラメータとは、予測残差を可変長符号化するためのパラメータであって、符号量を最小化するための最適値が当該予測残差の振幅が大きくなるに従って広義単調増加又は単調増加する関係にあるパラメータである。このようなパラメータの一例は、予測残差をゴロム・ライス符号化するためのライスパラメータである。しかし、これは本発明を限定するものではない。本発明は、例えば、予測残差又はその絶対値の増加に応じて単調増加する関係にある0以上の整数を被除数とし、当該予測残差が属する時間区間に対して設定されたパラメータに依存する整数を法数とした除算によって得られる整数の商を特定する第1情報と、前記被除数の前記法数に関する剰余を特定する第2情報とを含む情報を予測残差に対応する符号とする、あらゆる可変長符号化方式のパラメータに適用できる。このようなパラメータの例としては、ライスパラメータの他に予測残差をゴロム符号化(Golomb Coding)するためのゴロムパラメータや、ゴロム・ライス符号やゴロム符号のアルファ符号部分をハフマン符号(Huffman Code)に置き換えた可変長符号化方式のパラメータを例示できる。
また、第2区間パラメータsは、第2区間T2を含む時間区間での予測残差e(μ)(μ=μmin,...,μmax)の平均振幅が大きくなるに従って広義単調増加する値である。第2区間パラメータsは、第2区間T2の各予測残差e(z)(z=L,...,N-1)の平均振幅を用いて設定されてもよいし、第1区間T1及び第2区間T2の各予測残差e(n)(n=0,...,N-1)の平均振幅を用いて設定されてもよいし、第1区間T1の一部と第2区間T2の各予測残差の平均振幅を用いて設定されてもよい。また、第2区間T2を含む時間区間の各予測残差e(μ)(μ=μmin,...,μmax)の平均振幅に対して広義単調増加するのであれば、第2区間T2の一部の区間の各予測残差の平均振幅を用いて、第2区間パラメータsが設定されてもよい。
また、前述した予測残差又はその絶対値の増加に応じて単調増加する0以上の整数を被除数とし、当該予測残差が属する時間区間に対して設定されたパラメータに依存する整数を法数とした除算によって得られる整数の商を特定する第1情報と、前記被除数の前記法数に関する剰余を特定する第2情報とを含む情報を予測残差に対応する符号とする、可変長符号化方式の場合、第2区間T2を含む時間区間での予測残差e(μ)(μ=μmin,...,μmax)の符号の平均振幅を最小化するように第2区間パラメータsが算出される。ライスパラメータの場合には、例えば、log2{ln2・(2・D)}(Dは第2区間T2を含む時間区間での予測残差e(μ)(μ=μmin,...,μmax)の平均振幅)が整数に量子化された値が第2区間パラメータsとされる。
<長期予測フィルタを用いて得られた予測残差の符号化>
時系列信号の長期予測分析を行い、長期予測フィルタを用いて得られた予測残差の符号化を行う場合、前述のLは、長期予測分析における遅延値τの最大値以下の予め定められた整数である。前述のように、長期予測分析は、入力された時系列信号x(n)(n=0,...,N-1)に対し、式(4)に示す予測残差e(n)(n=0,...,N-1)のエネルギーを最小化するゲインρ(j)や遅延値τを算出する処理であり、遅延値τは最小遅延値Τmin以上かつ最大遅延値Τmax以下の範囲から適応的に選択される。そのため、長期予測フィルタによる計算に必要なすべての時系列信号x(n)を確保できない時間区間となり得るのは、先頭からΤmax番目までの離散時間からなる時間区間(0,...,Τmax-1)である。そこで、本形態では、この時間区間(0,..., Τmax-1)のうちの時間区間(0,...,L-1)を第1区間T1とする。また、残りの時間区間(L,...,N-1)を第2区間T2とする。そして、予測残差e(n)を可変長符号化するときに、第2区間T2を含む時間区間での予測残差e(μ)(μ=μmin,...,μmax)の平均振幅が大きくなるに従って広義単調増加する正の第2区間パラメータsが、第2区間T2の予測残差e(z)を可変長符号化するためのパラメータとして算出される。また、第2区間パラメータsと、フレームに属する時系列信号x(n)(n=0,...,N-1)の自己相関が大きくなるに従って広義単調増加する関係にある正の加算値(時系列信号x(n)(n=0,...,N-1)の長期予測分析を行った場合の予測効果を表す指標に対応する値)との和又はその補正値である第1区間パラメータが、第1区間T1に属する或る離散時間での予測残差を可変長符号化するためのパラメータとされる。すなわち、第1区間パラメータは、第2区間パラメータsと、時系列信号x(n)(n=0,...,N-1)の長期予測分析を行った場合の予測効果を表す指標に対応する値との和の広義単調増加関数値に相当する値である。
予測残差e(n)の符号を復号するときには、予測残差e(n)を可変長符号化するときと同一の基準に従い、第1区間に属する或る離散時間での予測残差の可変長符号を復号するための第1区間パラメータが算出される。
長期予測フィルタを用いて得られた予測残差を符号化する場合の加算値は、例えば、離散時間区間(0,...,N-1)の時系列信号x(n)(n=0,...,N-1)を長期予測分析して得られた長期予測フィルタの予測係数であるゲインρ(j)の絶対値|ρ(j)|が大きくなるに従って広義単調増加する関係にある値である。この例では、予測残差e(n)を可変長符号化するときに、ゲインρ(j)が大きくなるに従って広義単調増減少する関係にある値が加算値とされ、第1区間T1で最適なパラメータが設定される。そして、予測残差e(n)の符号を復号するときには、ゲインρ(j)に対応する符号の復号値を用い、符号化時と同じ基準に従って加算値が定められ、第1区間T1でのパラメータが算出される。
[例12,13]
例12はL=3の例である。例12では、各加算値a(r)がゲインρ(j)の絶対値|ρ(j)|の増加に応じて段階的に大きくなるように設定されている。各離散時間r=0,1,2での第1区間パラメータはs(r)=s+a(r)(r=0,1,2)となる。フレームの先頭に近い離散時間での予測残差ほど大きさが大きくなる傾向がある。そのため、加算値a(r)は、インデックスrの広義単調減少関数値に相当する値であることが望ましい。また、例13では、各加算値a(r)がゲインρ(-tap),...,ρ(tap)の絶対値の平均値ρaveの増加に応じて段階的に大きくなるように設定されている。その他、ゲインの値に応じ、加算値a(r)が各離散時間r=0,1,2で0とされてもよいし、加算値a(r)が各離散時間r=0,1,2で同値とされてもよい。また、この例の場合も、第1区間T1の一部の離散時間のみに本発明が適用されてもよい。また、ゲインの変化に応じて連続的に変化する関数値が加算値a(r)とされてもよい。
《例12》
|ρ(0)|≧60のとき :a(0)=3, a(1)=2, a(2)=1
60>|ρ(0)|≧40のとき :a(0)=2, a(1)=1, a(2)=0
40>|ρ(0)|のとき :a(0)=1, a(1)=0, a(2)=0
《例13》
ρave≧60のとき :a(0)=3, a(1)=2, a(2)=1
60>ρave≧40のとき :a(0)=2, a(1)=1, a(2)=0
40>ρaveのとき :a(0)=1, a(1)=0, a(2)=0
その他、加算値の具体的な設定方法以外の事項については、上述した短期予測フィルタを用いて得られた予測残差を符号化する場合と同様である。また、短期予測フィルタを用いて得られた予測残差を時系列信号として長期予測分析を行い、長期予測フィルタを用いて得られた予測残差を符号化する場合に本発明を用いてもよい。逆に、長期予測フィルタを用いて得られた予測残差を時系列信号として短期予測分析を行い、短期予測フィルタを用いて得られた予測残差を符号化する場合に本発明を用いてもよい。このように短期予測分析と長期予測分析とを組み合わせる場合の加算値は、上述した短期予測フィルタを用いて得られた予測残差を符号化する場合の加算値と同様であってもよいし、長期予測フィルタを用いて得られた予測残差を符号化する場合の加算値と同様であってもよいし、それらの設定基準を組み合わせて設定された加算値であってもよい。
〔第1実施形態〕
次に、本発明の第1実施形態を説明する。本形態は、短期予測フィルタを用いて得られた予測残差を符号化する形態である。本形態では、PARCOR係数の大きさを指標として加算値を設定する例を説明する。また、具体的な基準として《例1》の基準を用いる場合を例示する。さらに、本形態の例では、0以上最大振幅値MAX以下の範囲に所定値TH1と所定値TH2とを設定し(0≦TH1<TH2≦MAX)、第2区間パラメータsが所定値TH1以下である場合の加算値a(r)が、当該第2区間パラメータが当該所定値TH1よりも大きく所定値TH2よりも小さい場合の加算値a(r)以下となるようにし、第2区間パラメータsが所定値TH2以上である場合の加算値a(r)が、当該第2区間パラメータsが所定値TH1よりも大きく当該所定値TH2よりも小さい場合の加算値a(r)以下となるようにする。ただし、これらは本発明を限定するものではない。
<構成>
図7は、第1実施形態の符号化装置100の機能構成を説明するためのブロック図であり、図8は、図7に示した残差符号化部120の機能構成を説明するためのブロック図である。また、図9は、第1実施形態の復号装置200の機能構成を説明するためのブロック図であり、図10は、図9に示した残差復号部220の機能構成を説明するためのブロック図である。なお、これらの図において図1から図3と同じ構成については、図1から図3と同じ符号を用い、説明を省略する。
図7に示すように、本形態の符号化装置100は、予測符号化部2110、残差符号化部120、及び合成部2130を有する。また、図8に示すように、残差符号化部120は、パラメータ算出部121、及び符号化部122を有する。また、パラメータ算出部121は、第2区間パラメータ算出部121a、加算値決定部121b、及び第1区間パラメータ算出部121cを有する。また、符号化部122は、分離演算部122a、可変長符号化部2122b、及び合成部2122cを有する。
また、図9に示すように、本形態の復号装置200は、分離部2210、残差復号部220、及び予測復号部2230を有する。また、図10に示すように、残差復号部220は、分離部2221、可変長復号部224、合成演算部225、加算値決定部222、及びパラメータ算出部223を有する。
なお、本形態の符号化装置100や復号装置200は、例えば、CPU(central processing unit)、RAM(random-access memory)、ROM(read-only memory)等を備えた公知のコンピュータや専用コンピュータに所定のプログラムが読み込まれ、CPUがそれを実行することによって構成される特別な装置である。すなわち、フレームバッファ2111は、例えば、RAM、キャッシュメモリ、レジスタ等のメモリであり、その他の各処理部は、例えば、CPUが所定のプログラムを実行することで構築される処理部である。また、これらの処理部の少なくとも一部が集積回路等の電子回路によって構成されてもよい。さらに、必要に応じ、符号化装置100や復号装置200に、各処理部の処理によって出力されたデータを格納し、各処理部の別の処理時にデータが読み出される一時メモリを設けてもよい。また、このような各処理部の実現方法は、以下の各実施形態やその変形例でも同様である。
<符号化方法>
図11は、第1実施形態の符号化方法を説明するためのフローチャートである。また、図12は、図11のステップS30の一例を説明するためのフローチャートであり、図13は、図11のステップS50の詳細を例示するためのフローチャートである。以下、これらの図を用いて本形態の符号化方法を説明する。
符号化装置100(図7)の予測符号化部2110には、標本化・量子化されたPCM形式の時系列信号x(n)が入力される。これらの時系列信号x(n)は、線形量子化(「一様量子化」と呼ぶ場合もある)されたものであってもよいし、圧伸量子化(例えば、ITU-T Recommendation G.711, “Pulse Code Modulation (PCM) of Voice Frequencies”参照)のような非線形量子化(「非一様量子化」と呼ぶ場合もある)されたものであってもよい。また、時系列信号x(n)がPCM形式の信号ではなく、量子化されていない信号であってもよい。
フレームバッファ2111でバッファされた1フレーム分の時系列信号x(n)(n=0,...,N-1)は、短期予測分析部2112に送られる。短期予測分析部2112は、時系列信号x(n)(n=0,...,N-1)の短期予測分析を行い、最小予測次数Pmin以上かつ最大予測次数Pmax以下の範囲から最適予測次数Poptを選択するとともに、各予測次数mでの各PARCOR係数k(m)(m=1,...,Popt)をそれぞれ生成する。なお、短期予測分析部2112は、時系列信号x(n)をそのまま短期予測分析する構成であってもよいし、非線形量子化されて入力された時系列信号x(n)を線形量子化や他の非線形量子化にマッピングしてから短期予測分析を行う構成であってもよい。その後、PARCOR係数k(m)(m=1,2,...,Popt)に対応する係数符号Ckが生成されるとともに、前述した予測フィルタ処理によって予測残差e(n)(n=0,...,N-1)が生成される(ステップS10)。
予測残差e(n)(n=0,...,N-1)は、残差符号化部120の第2区間パラメータ算出部121aに入力される。第2区間パラメータ算出部121aは、各予測残差e(n)(n=0,...,N-1)を用い、第2区間(L,...,N-1)を含む時間区間での予測残差e(μ)(μ=μmin,...,μmax)の平均振幅が大きくなるに従って広義単調増加する関係にある正の第2区間パラメータsを、第2区間(L,...,N-1)の予測残差e(n)を可変長符号化するためのパラメータとして算出する。この第2区間パラメータの算出方法は前述の通りである。第2区間パラメータ算出部121aは、例えば、log2{ln2・(2・D)}(Dは第2区間T2を含む時間区間での予測残差e(μ)(μ=μmin,...,μmax)の平均振幅)を整数に量子化した値を第2区間パラメータsとする(ステップS20)。
次に、加算値決定部121bに、ステップS10で生成された1次のPARCOR係数k(1)と、ステップS20で生成された第2区間パラメータsとが入力される。加算値決定部121bは、これらを用い、第2区間(L,...,N-1)を含む時間区間での時系列信号x(μ)(μ=μmin,...,μmax)の平均振幅に対する予測残差e(n)の平均振幅の比が小さくなるに従って広義単調増加する関係にある正の加算値a(r)(r=0,...,L-1)を求める。この例の加算値a(r)は、離散時間区間(0,...,N-1)に属する時系列信号x(n)(n=0,...,N-1)の自己相関が大きくなるに従って広義単調増加する関係にある値である。また、この例の加算値a(r)は、時系列信号x(μ)(μ=μmin,...,μmax)の予測効果を表す指標に対応する(ステップS30)。
[ステップS30の一例]
図12に示す処理はL=3の場合の一例である。この例の場合、まず、加算値決定部121bは、s≦TH1を満たすか否かを判断し(ステップS31)、s≦TH1を満たすのであれば、加算値をa(0)=1,a(1)=0,a(2)=0とする(ステップS32)。また、s≦TH1を満たさないのであれば、加算値決定部121bは、s≧TH2を満たすか否かを判断し(ステップS33)、s≧TH2を満たすのであれば、加算値をa(0)=0,a(1)=0,a(2)=0とする(ステップS34)。さらに、s≧TH2も満たさないのであれば、加算値決定部121bは、|k(1)|≧0.9を満たすか否かを判断し(ステップS35)、|k(1)|≧0.9を満たすのであれば、加算値をa(0)=3,a(1)=2,a(2)=1とする(ステップS36)。また、|k(1)|≧0.9も満たさないのであれば、加算値決定部121bは、|k(1)|≧0.6を満たすか否かを判断し(ステップS37)、|k(1)|≧0.6を満たすのであれば、加算値をa(0)=2,a(1)=1,a(2)=0とする(ステップS38)。|k(1)|≧0.6も満たさないのであれば、加算値決定部121bは、加算値をa(0)=1,a(1)=0,a(2)=0とする(ステップS39)。なお、この例では1次のPARCOR係数k(1)の絶対値|k(1)|を指標にして加算値a(r)を決定している。しかし、1次のPARCOR係数k(1)の量子化誤差が原因となって、符号化装置100で選択された加算値a(r)が復号装置200で選択される加算値a(r)(後述する)と相違してしまうことを防止するために、1次のPARCOR係数k(1)を量子化してから逆量子化して得られた1次のPARCOR係数k(1)の絶対値を指標にし、上述のように加算値a(r)が決定されもよい([ステップS30の一例]の説明終わり)。
次に、第1区間パラメータ算出部121cに、ステップS20で生成された第2区間パラメータsと、ステップS30で生成された加算値a(r)(r=0,...,L-1)とが入力される。第1区間パラメータ算出部121cは、これらを用い、第2区間パラメータsと加算値a(r)(r=0,...,L-1)との和である第1区間パラメータs(r)=s+a(r)を、第1区間(0,...,L-1)に属する離散時間rでの予測残差e(r)を可変長符号化するためのパラメータとして算出する(ステップS40)。
次に、符号化部2122に、ステップS20で生成された第2区間パラメータsと、ステップS40で生成された第1区間パラメータs(r)(r=0,...,L-1)と、予測残差e(n)(n=0,...,N-1)とが入力される。符号化部2122は、第1区間パラメータs(r)(r=0,...,L-1)をそれぞれ用いて第1区間(0,...,L-1)に属する離散時間rでの予測残差e(r)を可変長符号化し、第2区間パラメータsを用いて第2区間(L,...,N-1)に属する離散時間z(z=L,...,N-1)での予測残差e(z)を可変長符号化し、予測残差e(n)に対応する残差符号Ce(n)を生成する(ステップS50)。予測残差e(z)を可変長符号化するための符号化方式の一例は、予測残差e(n)又はその絶対値の増加に応じて単調増加する0以上の整数を被除数とし、当該予測残差e(n)が属する時間区間に対して設定されたパラメータに依存する整数を法数とした除算によって得られる整数の商を特定する第1情報と、前記被除数の前記法数に関する剰余を特定する第2情報とを含む情報を予測残差e(n)に対応する残差符号Ce(n)とする方式である。このような符号化方式としては、ゴロム・ライス符号化方式、ゴロム符号化方式、ゴロム・ライス符号やゴロム符号のアルファ符号部分をハフマン符号に置き換えた可変長符号化方式などを例示できる。
[ステップS50の一例]
図13に示す処理は、予測残差e(n)をゴロム・ライス符号化する場合の一例である。なお、以下では離散時間nについての処理を説明するが、実際は各離散時間n=0,...,N-1についてそれぞれ同様な処理が実行される。
この例では、まず、分離演算部122aがn≦L-1であるか否かを判断する(ステップS51)。これは処理中の離散時間nが第1区間T1に属するか否かの判断である。そして、分離演算部122aは、n≦L-1である場合にw(n)=s(n)とし(ステップS52a)、n>L-1である場合にw(n)=sとする(ステップS52b)。
次に、分離演算部122aは、w(n)が0であるか否かを判定する(ステップS53)。ここで、w(n)=0でなかった場合、分離演算部122aは、入力された予測残差e(n)が0以上であるか否かを判定し(ステップS54a)、e(n)≧0であると判定された場合、
q(n)=floor(e(n)/2w(n)−1) (for e(n)≧0) …(6)
に従って整数の商q(n)を生成し(ステップS55a)、
sub(n)=e(n)−2w(n)−1・q(n)+2w(n)−1 (for e(n)≧0) …(7)
に従って剰余を特定するための情報sub(n)を生成して出力する(ステップS56a)。
一方、ステップS54aでe(n)≧0でないと判定された場合、分離演算部122aは、
q(n)=floor{(−e(n)−1)/2w(n)−1} (for e(n)<0) …(8)
に従って整数の商q(n)を生成し(ステップS55b)、
sub(n)=(−e(n)−1)−2w(n)−1・q(n) (for e(n)<0) …(9)
に従って剰余を特定するための情報sub(n)を生成して出力する((ステップS56b)。
一方、ステップS53でw(n)=0であると判定された場合、分離演算部122aは、入力された予測残差e(n)が0以上であるか否かを判定し(ステップS54b)、e(n)≧0であると判定された場合、
q(n)=2・e(n) (for e(n)≧0) …(10)
に従って商q(n)を生成し(ステップS55c)、sub(n)をnullとして出力する(ステップS56c)。
一方、ステップS54bでe(n)≧0でないと判定された場合、分離演算部122aは、
q(n)=−2・e(n)−1 (for e(n)<0) …(11)
に従って商q(n)を生成し(ステップS55d)、sub(n)をnullとして出力する(ステップS56c)。
次に、分離演算部122aから出力された商q(n)は可変長符号化部2122bに入力される。可変長符号化部2122bは、例えば、アルファ符号化方法等の可変長符号化方法によって商q(n)を符号化し、商q(n)に対応する情報prefix(n)を生成して出力する(ステップS57)。
次に、分離演算部122aから出力された情報sub(n)と、可変長符号化部2122bから出力された情報prefix(n)が合成部2122cに入力される。合成部2122cは、情報prefix(n)と情報sub(n)とを合成し、予測残差e(n)に対応する残差符号Ce(n)を生成する(ステップS58/[ステップS50の一例])の説明終わり)。
その後、係数符号Ckと残差符号Ce(n)(n=0,...,N-1)と第2区間パラメータsと予測次数Poptとが合成部2130に入力され、合成部2130は、これらを合成した符号Cgを生成して出力する(ステップS60)。なお、本形態では、復号装置200で加算値a(r)を復元するためのみに用いる特別な補助情報を符号Cgに付加する必要はない。
<復号方法>
図14は、第1実施形態の復号方法を説明するためのフローチャートである。また、図15は、ステップS250の詳細を例示するためのフローチャートである。以下、これらの図を用いて本形態の復号方法を説明する。
復号装置200(図9)の分離部2210は、復号装置200に入力された符号Cgを分離し、PARCOR係数に対応する係数符号Ckと、予測残差e(n)(n=0,...,N-1)に対応する残差符号Ce(n)(n=0,...,N-1)と、第2区間パラメータsと、最適予測次数Poptを生成する(ステップS210)。
係数符号Ckは係数復号部2231に入力され、係数復号部2231は、係数符号Ckを復号して量子化PARCOR係数i(m)(m=1,...,Popt)を生成する(ステップS220)。
次に、分離部2210から出力された第2区間パラメータsと、係数復号部2231から出力された1次の量子化PARCOR係数i(1)とが、加算値決定部222に入力される。加算値決定部222は、これらを用い、離散時間区間(0,...,N-1)に属する時系列信号x(n)(n=0,...,N-1)の自己相関が大きくなるに従って広義単調増加する関係にある加算値a(r)(r=0,...,L-1)を求める。この例での加算値a(r)の決定は、ステップS30と同一の基準に従って実行される。図12に例示した決定方法に従うのであれば、加算値決定部222は、例えば、1次の量子化PARCOR係数i(1)を逆量子化して1次のPARCOR係数k(1)を復元し、図12に例示した手順に従って加算値a(r)を求める(ステップS230)。なお、この例での加算値a(r)は、時系列信号x(μ)(μ=μmin,...,μmax)の予測効果を表す指標に対応する。
次に、分離部2210から出力された第2区間パラメータsと、加算値決定部222から出力された加算値a(r)(r=0,...,L-1)とが、パラメータ算出部223に入力される。パラメータ算出部223は、第2区間パラメータsと加算値a(r)(r=0,...,L-1)との和である第1区間パラメータs(r)(r=0,...,L-1)を算出する(ステップS240)。
次に、分離部2221、可変長復号部224、及び可変長復号部2222が、第1区間パラメータs(r)(r=0,...,L-1)をそれぞれ用い、第1区間(0,...,L-1)に属する離散時間r(r=0,...,L-1)での残差符号Ce(r)(r=0,...,L-1)を復号し、第2区間パラメータsを用い、第2区間(L,...,N-1)に属する離散時間z(z=L,...,N-1)の残差符号Ce(z)(z=L,...,N-1)を復号し、予測残差e(n)(n=0,...,N-1)を求める(ステップS250)。
[ステップS250の一例]
図15に示す処理は、予測残差e(n)のゴロム・ライス符号を復号する場合の一例である。なお、以下では離散時間nについての処理を説明するが、実際は各離散時間n=0,...,N-1についてそれぞれ同様な処理が実行される。
まず、分離部2221に残差符号Ce(n)が入力される。分離部2221は、残差符号Ce(n)を分離し、情報prefix(n)と、情報sub(n)とを生成する(ステップS251)。情報prefix(n)は、可変長復号部2222に入力される。可変長復号部2222は、当該情報prefix(n)を復号して商q(n)を求める(ステップS252)。
次に、分離部2221から出力された情報sub(n)と、可変長復号部2222から出力された商q(n)と、パラメータ算出部223から出力された第1区間パラメータs(r)(r=0,...,L-1)と、第2区間パラメータsとが、合成演算部225に入力される。
合成演算部225は、まず、n≦L-1であるか否かを判断する(ステップS253)。これは処理中の離散時間nが第1区間T1に属するか否かの判断である。そして、合成演算部225は、n≦L-1である場合にw(n)=s(n)とし(ステップS254a)、n>L-1である場合にw(n)=sとする(ステップS254b)
次に、合成演算部225は、w(n)が0であるか否かを判定する(ステップS255)。ここで、w(n)=0でないと判定された場合、次に合成演算部225は、情報sub(n)が2w(n)−1以上であるか否かを判定する(ステップS256a)。この判定は予測残差e(n)が0以上であるか否かを判定することに相当する。ステップS256aでsub(n)≧2w(n)−1と判定された場合、合成演算部225は、以下の式によって予測残差e(n)を算出する(ステップS257a)。
e(n)=sub(n)+2w(n)−1・q(n)−2w(n)−1 …(12)
一方、ステップS256aでsub(n)<2w(n)−1と判定された場合、合成演算部225は、以下の式によって予測残差e(n)を算出する(ステップS257b)。
e(n)=−sub(n)−1−2w(n)−1・q(n) …(13)
一方、ステップS255でw(n)=0と判定された場合、次に合成演算部225は、情報q(n)が偶数であるか否かを判定する(ステップS256b)。この判定は予測残差e(n)が0以上であるか否かを判定することに相当する。ステップS256bでq(n)が偶数であると判定された場合、合成演算部225は、以下の式によって予測残差e(n)を算出する(ステップS257c)。
e(n)=q(n)/2 …(14)
一方、ステップS256bでq(n)が奇数であると判定された場合、合成演算部225は、以下の式によって予測残差e(n)を算出する(ステップS257d)。
e(n)=−(q(n)+1)/2 …(15)
以上のように生成された予測残差e(n)は、合成演算部225から出力される([ステップS250の一例]の説明終わり)。
その後、短期予測部2233と加算部2234とが、残差復号部220から出力された予測残差e(n)(n=0,...,N-1)と、係数復号部2231から出力された量子化PARCOR係数i(m)(m=1,...,Poptとを用い、時系列信号x(n)(n=0,...,N-1)を生成して出力する(ステップS260)。
〔第1実施形態の変形例〕
本形態では、予測残差e(n)の符号化時に、符号化装置100の加算値決定部121b(図8)が、フレーム内の時系列信号x(n)(n=0,...,N-1)を短期予測分析して得られた或る次数のPARCOR係数の大きさが大きくなるに従って広義単調増加する関係にある加算値a(r)(r=0,...,L-1)を求め、復号時に復号装置200の加算値決定部222が、その次数のPARCOR係数に対応する符号の復号値を用い、その次数のPARCOR係数の絶対値が大きくなるに従って広義単調増加する関係にある加算値a(r)を求めることとした。しかし、前述のように、その他の基準に従って加算値a(r)が求められてもよい。
例えば、予測残差e(n)の符号化時に、符号化装置100の加算値決定部121b(図8)に、フレーム内の時系列信号x(n)(n=0,...,N-1)の短期予測分析を行う際に適応的に選択された最適予測次数Poptが入力され、加算値決定部121bが、この最適予測次数Poptが大きくなるに従って広義単調増加する関係にある加算値a(r)を求めてもよい。この場合の復号時には、復号装置200の加算値決定部222に分離部2210から出力された最適予測次数Poptが入力され、加算値決定部222が、加算値決定部121bと同一の基準に従い、加算値a(r)を求める。
また、例えば、予測残差e(n)の符号化時に、符号化装置100の加算値決定部121b(図8)に、フレーム内の時系列信号x(n)(n=0,...,N-1)を短期予測分析して得られた1次からP次(例えば、P=Popt)までの各PARCOR係数k(m)(m=1,...,P)が入力され、加算値決定部121bがΠm=1 P{1-k(m)2}が大きくなるに従って広義単調減少する関係にある加算値a(r)を求めてもよい。この場合の復号時には、復号装置200の加算値決定部222に係数復号部2231から出力された1次からP次までの各量子化PARCOR係数i(m)(「1次からP次までの各PARCOR係数に対応する符号の復号値」に相当)が入力され、加算値決定部222が、それらを逆量子化して1次からP次までのPARCOR係数k(m)を復元し、加算値決定部121bと同一の基準に従い、加算値a(r)を求める。
また、例えば、予測残差e(n)の符号化時に、符号化装置100の加算値決定部121b(図8)に、フレーム内の時系列信号x(n)(n=0,...,N-1)を短期予測分析して得られた1次からP次までの各PARCOR係数k(m)(m=1,...,P)が入力され、加算値決定部121bが、1-Πm=1 P{1-k(m)2}が大きくなるに従って広義単調増加する関係にある加算値a(r)(r=0)を求め、Πm=1 r{1-k(m)2}-Πm=1 P{1-k(m)2}が大きくなるに従って広義単調増加する関係にある加算値a(r)(0<r<P)を求めてもよい。この場合の復号時には、復号装置200の加算値決定部222に係数復号部2231から出力された1次からP次までの各量子化PARCOR係数i(m)(m=1,...,P)が入力され、加算値決定部222が、それらを逆量子化して1次からP次までのPARCOR係数k(m)(m=1,...,P)を復元し、加算値決定部121bと同一の基準に従い、加算値a(r)(r=0)及びa(r)(0<r<P)を求める。
また、これらの異なる基準が組み合わされて利用されてもよく、例えば、離散時間rごとに異なる基準が用いられ、加算値a(r)が求められてもよい。
また、例えば、フレームが符号化の処理単位である場合と、サブフレームが符号化の処理単位である場合と、の切り替えが可能である場合に、加算値決定部121b,222が、サブフレームが処理単位とされる場合の加算値a(r)よりも、フレームが処理単位とされる場合の加算値a(r)を大きくしてもよい。
また、本実施形態では、0以上最大振幅値MAX以下の範囲に所定値TH1と所定値TH2とを設定し(0≦TH1<TH2≦MAX)、第2区間パラメータsが所定値TH1以下である場合の加算値a(r)が、当該第2区間パラメータが当該所定値TH1よりも大きく所定値TH2よりも小さい場合の加算値a(r)以下となるようにし(下限基準)、第2区間パラメータsが所定値TH2以上である場合の加算値a(r)が、当該第2区間パラメータsが所定値TH1よりも大きく当該所定値TH2よりも小さい場合の加算値a(r)以下となるようにする(上限基準)例を示した。しかし、このような所定値TH1や所定値TH2を用いた基準を用いない構成でもよい。また、例えば、上限基準又は下限基準の何れか一方を用いる構成でもよい。
また、残差符号化部120(図8)に予測残差e(n)を整数値に写像する信号変換部123を設け、残差復号部220(図9)に信号変換部123の逆変換を行う逆変換部226を設けてもよい。この場合、第2区間パラメータ算出部121aは、信号変換部123の出力値を用い、第2区間T2を含む時間区間での予測残差の平均振幅が大きくなるに従って広義単調増加する関係にある第2区間パラメータsを算出し、符号化部2122は、信号変換部123の出力値を符号化する。また、残差復号部220は、合成演算部225の出力値を逆変換部226で逆変換し、復号された予測残差e(n)として出力する。なお、信号変換部123での写像は、予め定められた規則に従って行われる。例えば、信号変換部123は、入力された予測残差e(n)が0以上の場合にはそれを大小関係の順序を保ったまま奇数の整数に写像し、入力された予測残差e(n)が0未満の場合にはそれを絶対値の大小関係の順序を保ったまま偶数の整数に写像する。
また、本形態の符号化装置100の第1区間パラメータ算出部121cは、第2区間パラメータsと加算値a(r)(r=0,...,L-1)との和を第1区間パラメータs(r)(r=0,...,L-1)とし(ステップS40)、復号装置200のパラメータ算出部223は、第2区間パラメータsと加算値a(r)(r=0,...,L-1)との和を第1区間パラメータs(r)(r=0,...,L-1)とすることとした(ステップS240)。しかし、符号化装置100の第1区間パラメータ算出部121cが、第2区間パラメータsと加算値a(r)(r=0,...,L-1)との和に対して広義単調増加する関係にある補正値を第1区間パラメータs(r)(r=0,...,L-1)とし、復号装置200のパラメータ算出部223が、第2区間パラメータsと加算値a(r)(r=0,...,L-1)との和に対して広義単調増加する関係にある補正値を第1区間パラメータs(r)(r=0,...,L-1)としてもよい。この場合、第1区間パラメータ算出部121cが、第1区間パラメータs(r)(r=0,...,L-1)を生成するための補正内容を示す補助情報cを出力し、これを符号Cgに含めて復号装置200に与えてもよい。なお、補助情報cの一例は、第1区間T1の予測残差e(r)(r=0,...,L-1)の平均振幅から実際に計算したライスパラメータなどのパラメータと、第2区間パラメータsと加算値a(r)(r=0,...,L-1)との和との差である。この場合、第1区間パラメータは、s(r)=s+a(r)+cとなる。また、例えば、第2区間パラメータsと加算値a(r)(r=0,...,L-1)との和に定数constを乗じた値を第1区間パラメータs(r)=const・(s+a(r))とする場合など、補正内容が一定である場合には、補助情報cを符号Cgに含める必要はない。
〔第2実施形態〕
次に、本発明の第2実施形態を説明する。本形態では、復号装置200で加算値a(r)を復元するために用いる補助情報を符号Cgに含める。この場合、補助情報分だけ符号Cgの符号量は大きくなるが、加算値a(r)の設定の自由度を広げることができるため、加算値a(r)の設定方法によっては符号Cgの符号量を削減できる。以下では、第1実施形態との相違点を中心に説明し、第1実施形態と共通する事項については説明を省略する。
<構成>
図16は、第2実施形態における符号化装置の残差符号部320の機能構成を説明するためのブロック図である。また、図17は、第2実施形態の復号装置の残差復号部420の機能構成を説明するためのブロック図である。なお、これらの図において第1実施形態と共通する部分については第1実施形態と同じ符号を付し、説明を省略する。
本形態の符号化装置は、第1実施形態の符号化装置100の残差符号化部120を、図16の残差符号部320に置換したものである。残差符号部320の残差符号化部120との相違点は、パラメータ算出部321の加算値決定部321bである。また、本形態の復号装置は、第1実施形態の復号装置200の残差復号部220を、図17の残差復号部420に置換したものである。残差復号部420の残差復号部220との相違点は、加算値決定部422である。
<符号化方法>
第1実施形態との相違点は、加算値決定部321bが行う加算値a(r)の決定処理(ステップS30)と、その求め方を特定するための補助情報dを符号Cgに含める点(ステップS60)である。以下では、これらの相違点のみを説明する。
[加算値a(r)の決定処理]
本形態の加算値決定部321bは、加算値を特定するための複数の基準から選択した基準に従い、加算値a(r)を決定する。
例えば、図12に例示した処理に従って加算値a(r)を特定する基準と、図18に例示する処理に従って加算値a(r)を特定する基準とが設定されているものとし、加算値決定部321bは、図12の基準又は図18の基準を選択し、1次のPARCOR係数k(1)の絶対値などを用いて加算値a(r)を特定する。なお、図18の基準は、ステップS35で|k(1)|≧0.9を満たすと判断されたならば、加算値をa(0)=2,a(1)=1,a(2)=0とし(ステップS38)、|k(1)|≧0.9を満たさないと判断されたならば、加算値をa(0)=1,a(1)=0,a(2)=0とする(ステップS39)点のみが図12の基準と相違し、図12の基準よりも加算値a(r)のとり得る範囲が狭い。この場合の基準の選択は、例えば、フレーム内の時系列信号x(n)(n=0,...,N-1)の平均振幅が予め定められた閾値以上であるか否かによって行われる。例えば、加算値決定部321bは、時系列信号x(n)の平均振幅が予め定められた閾値以上であれば予測残差e(n)(n=0,...,N-1)の振幅の変位も大きいと判定し、図12のように加算値a(r)の撮り得る範囲が広い基準を選択し、そうでなければ予測残差e(n)の振幅の変位が小さいと判定し、図18のように加算値a(r)のとり得る範囲が狭い基準を選択する。これにより、パラメータの設定が適切になる。
また、例えば、加算値決定部321bが、上述したPARCOR係数を指標とする基準と、最適予測次数を指標とする基準とから1つの基準を選択し、選択した基準に必要な1次のPARCOR係数k(1)の絶対値や最適予測次数Poptなどを用いて加算値a(r)を特定してもよい。また、基準の選択内容を外部から加算値決定部321bに与える構成であってもよい。
[補助情報dを符号Cgに含める処理]
加算値決定部321bは、上記のように選択した基準を特定するための補助情報dを合成部2130に出力し、合成部2130は補助情報dを符号Cgに含める。なお、補助情報dは、例えば、0又は1の値をとる1ビットの情報であり、その値が選択した基準に対応している。
<復号方法>
第1実施形態との相違点は、加算値決定部422が行う加算値a(r)の決定処理(ステップS230)である。以下では、この相違点のみを説明する。
加算値決定部422には、符号Cgから分離された補助情報dが入力され、加算値決定部422は、その補助情報dが示す基準に従って加算値a(r)を求める。
例えば、入力された補助情報dが図12の基準を示す場合、加算値決定部422は、入力された1次の量子化PARCOR係数k(1)を逆量子化して1次のPARCOR係数k(1)を復元し、図12の基準に従って加算値a(r)を求める。また、例えば、入力された補助情報dが図18の基準を示す場合、加算値決定部422は、入力された1次の量子化PARCOR係数k(1)を逆量子化して1次のPARCOR係数k(1)を復元し、図18の基準に従って加算値a(r)を求める。
〔第2実施形態の変形例〕
この変形例では、符号化時に、各離散時間rに対して複数ずつの加算値a(r)(予測効果を表す指標に対応する加算値)が定められ、その中から予測残差e(n)の符号量が最小になる加算値a(r)が各離散時間rに対して1つずつ選択され、選択された各加算値a(r)を特定するための補助情報dが符号Cgに含められる例である。以下では、第1,2実施形態との相違点を中心に説明し、第1,2実施形態と共通する事項については説明を省略する。
<構成>
図19は、第2実施形態の変形例における符号化装置の残差符号部520の機能構成を説明するためのブロック図である。なお、この図において第1実施形態と共通する部分については第1実施形態と同じ符号を付し、説明を省略する。
本形態の符号化装置は、第1実施形態の符号化装置100の残差符号化部120を、図19の残差符号部520に置換したものである。残差符号部520の残差符号化部120との相違点はパラメータ算出部521であり、パラメータ算出部521は、第2区間パラメータ算出部121a、加算値決定部521b、第1区間パラメータ算出部521c、符号量比較部521d、及び選択部521eを有する。また、本形態の復号装置は、第2実施形態の復号装置と同様である。
<符号化方法>
図20は、第2実施形態の変形例の符号化方法を説明するためのフローチャートである。また、図21は、図20のステップS630の一例を説明するためのフローチャートである。以下、これらの図を用いて本形態の符号化方法を説明する。
まず、第1実施形態のステップS10,S20の処理が実行される。次に、加算値決定部521bに、ステップS10で生成された1次のPARCOR係数k(1)と、ステップS20で生成された第2区間パラメータsとが入力される。加算値決定部521bは、これらを用い、第2区間(L,...,N-1)を含む時間区間での時系列信号x(μ)(μ=μmin,...,μmax)の平均振幅に対する予測残差e(μ)(μ=μmin,...,μmax)の平均振幅の比が小さくなるに従って広義単調増加する関係にある正の加算値 a(r)(r=0,...,L-1)を各補助情報d(dmaxは予め定められた1以上の整数)について求める(ステップS630)。例えば、dmax=1なのであれば、各離散時間rに2個ずつの加算値a(r)を定める。この例での加算値a(r)も、時系列信号x(μ)(μ=μmin,...,μmax)の予測効果を表す指標に対応する。
[ステップS630の一例]
図21に示す処理はL=2,dmax=1の場合の一例である。この例の場合、まず、加算値決定部521bは、s≦TH1を満たすか否かを判断し(ステップS631)、s≦TH1を満たすのであれば、d=0に対応する加算値をa(0)=1,a(1)=0とし、d=1に対応する加算値をa(0)=0,a(1)=0とする(ステップS632)。また、s≦TH1を満たさないのであれば、加算値決定部521bは、s≧TH2を満たすか否かを判断し(ステップS633)、s≧TH2を満たすのであれば、d=0に対応する加算値をa(0)=1,a(1)=0とし、d=1に対応する加算値をa(0)=0,a(1)=0とする(ステップS634)。さらに、s≧TH2も満たさないのであれば、加算値決定部521bは、|k(1)|≧0.9を満たすか否かを判断し(ステップS635)、|k(1)|≧0.9を満たすのであれば、d=0に対応する加算値をa(0)=3,a(1)=2とし、d=1に対応する加算値をa(0)=2,a(1)=1とする(ステップS636)。また、|k(1)|≧0.9も満たさないのであれば、加算値決定部521bは、|k(1)|≧0.6を満たすか否かを判断し(ステップS637)、|k(1)|≧0.6を満たすのであれば、d=0に対応する加算値をa(0)=2,a(1)=1とし、d=1に対応する加算値をa(0)=1,a(1)=0とする(ステップS638)。|k(1)|≧0.6も満たさないのであれば、加算値決定部521bは、d=0に対応する加算値をa(0)=1,a(1)=0とし、d=1に対応する加算値をa(0)=0,a(1)=0とする(ステップS639)。なお、この例では、1次のPARCOR係数k(1)の絶対値|k(1)|を指標にして加算値a(r)を決定している。しかし、1次のPARCOR係数k(1)の量子化誤差が原因となって、符号化装置で選択された加算値a(r)が復号装置で選択される加算値a(r)と相違してしまうことを防止するために、1次のPARCOR係数k(1)を量子化してから逆量子化して得られた1次のPARCOR係数k(1)の絶対値を指標にし、上述のように加算値a(r)が決定されてもよい([ステップS630の一例]の説明終わり)。
次に、第1区間パラメータ算出部521cに、ステップS20で生成された第2区間パラメータsと、ステップS630で生成された加算値a(r)(r=0,...,L-1)とが入力される。第1区間パラメータ算出部521cは、これらを用い、各補助情報dについて、第2区間パラメータsと加算値a(r)(r=0,...,L-1)との和である第1区間パラメータs(r)=s+a(r)を、第1区間(0,...,L-1)に属する離散時間rでの予測残差e(r)を可変長符号化するためのパラメータとして算出する(ステップS640)。例えば、L=2であって、ステップS630で、d=0に対応する加算値をa(0)=3,a(1)=2とし、d=1に対応する加算値をa(0)=2,a(1)=1としていたのであれば、第1区間パラメータ算出部521cは、d=0に対応する第1区間パラメータs(0)=s+3, s(1)=s+2と、d=1に対応する第1区間パラメータs(0)=s+2, s(1)=s+1とを求める。
次に、符号量比較部521dに、ステップS20で生成された第2区間パラメータsと、ステップS640で生成された各補助情報dについての第1区間パラメータs(r)(r=0,...,L-1)と、予測残差e(n)(n=0,...,N-1)とが入力される。符号量比較部521dは、第1区間パラメータs(r)(r=0,...,L-1)をそれぞれ用いて第1区間(0,...,L-1)に属する離散時間rでの予測残差e(r)を可変長符号化し、第2区間パラメータsを用いて第2区間(L,...,N-1)に属する離散時間z(z=L,...,N-1)での予測残差e(z)を可変長符号化して得られる、残差符号Ce(n)(n=0,...,N-1)の符号量の和(n=0,...,N-1での和)を各補助情報dについて求め、それらの比較結果を出力する。なお、符号量の和の比較は、実際に補助情報dごとに残差符号Ce(n)(n=0,...,N-1)が求められて行われてもよいし、補助情報dごとに残差符号Ce(n)(n=0,...,N-1)の符号量の和や推定符号量の和のみが求められて行われてもよい。選択部521eは、この比較結果を用い、予測残差e(n)(n=0,...,N-1)に対応する残差符号Ce(n)(n=0,...,N-1)の符号量の和を最小にする補助情報dを選択する(ステップS645)。
ステップS20で生成された第2区間パラメータsと、ステップS645で選択された補助情報dに対応する第1区間パラメータs(r)(r=0,...,L-1)とは符号化部122に入力される。符号化部122は、第1実施形態と同様に、入力された第1区間パラメータs(r)(r=0,...,L-1)をそれぞれ用いて第1区間(0,...,L-1)に属する離散時間rでの予測残差e(r)を可変長符号化し、第2区間パラメータsを用いて第2区間(L,...,N-1)に属する離散時間z(z=L,...,N-1)での予測残差e(z)を可変長符号化し、予測残差e(n)に対応する残差符号Ce(n)を生成する(ステップS650)。
その後、合成部2130が、係数符号Ckと、残差符号Ce(n)と、第2区間パラメータsと、予測次数Poptと、選択された補助情報dを合成した符号Cgを生成して出力する(ステップS660)。なお、この変形例での復号方法は、第2実施形態で説明した方法と同様であるため説明を省略する。
また、第2実施形態の他の変形例として、補助情報dごとに、加算値a(r)を特定するための複数の基準(原理の説明で例示したような基準)を設定しておき、ステップS630において、符号化装置の加算値決定部521bが、各補助情報dが特定する基準にしたがって加算値a(r)求めてもよい。また、第2実施形態に対し、第1実施形態の変形例で説明したような変形を行ってもよい。
〔第3実施形態〕
次に、本発明の第3実施形態を説明する。本形態は、長期予測フィルタを用いて得られた予測残差を符号化する形態である。本形態では、ゲインρ(0)の大きさを指標として加算値を設定する例を説明する。また、具体的な基準として《例12》の基準を用いる場合を例示する。さらに、本形態の例では、0以上最大振幅値MAX以下の範囲に所定値TH1と所定値TH2とが設定される(0≦TH1<TH2≦MAX)。そして、第2区間パラメータsが所定値TH1以下である場合の加算値a(r)が、当該第2区間パラメータが当該所定値TH1よりも大きく所定値TH2よりも小さい場合の加算値a(r)以下となるようにする。さらに、第2区間パラメータsが所定値TH2以上である場合の加算値a(r)が、当該第2区間パラメータsが所定値TH1よりも大きく当該所定値TH2よりも小さい場合の加算値a(r)以下となるようにする。ただし、これらは本発明を限定するものではない。また、以下では、第1,2実施形態との相違点を中心に説明し、それらと共通する事項については説明を省略する。
<構成>
図22は、第3実施形態の符号化装置600の機能構成を説明するためのブロック図であり、図23は、図22に示した残差符号化部620の機能構成を説明するためのブロック図である。また、図24は、第3実施形態の復号装置700の機能構成を説明するためのブロック図であり、図25は、図24に示した残差復号部720の機能構成を説明するためのブロック図である。なお、これらの図において、これまで説明したものと同じ構成については、それらと同じ符号を用い、説明を省略する。
図22に示すように、本形態の符号化装置600は、予測符号化部610、残差符号化部620、及び合成部2130を有する。また、図23に示すように、残差符号化部620は、パラメータ算出部621、及び符号化部122を有する。また、パラメータ算出部621は、第2区間パラメータ算出部121a、加算値決定部621b、及び第1区間パラメータ算出部121cを有する。
また、図24に示すように、本形態の復号装置700は、分離部2210、残差復号部720、及び予測復号部730を有する。また、図25に示すように、残差復号部720は、分離部2221、可変長復号部224、合成演算部225、加算値決定部722、及びパラメータ算出部223を有する。
なお、本形態の符号化装置600や復号装置700は、例えば、CPU、RAM、ROM等を備えた公知のコンピュータ又は専用コンピュータに所定のプログラムが読み込まれ、CPUがそれを実行することによって構成される特別な装置である。また、これらの処理部の少なくとも一部が集積回路等の電子回路によって構成されてもよい。さらに、必要に応じ、符号化装置600や復号装置700に、各処理部の処理によって出力されたデータを格納し、各処理部の別の処理時にデータが読み出される一時メモリを設けてもよい。また、このような各処理部の実現方法は、以下の各実施形態やその変形例でも同様である。
<符号化方法>
図26は、第3実施形態の符号化方法を説明するためのフローチャートである。また、図27は、図26のステップS730の一例を説明するためのフローチャートである。以下、これらの図を用いて本形態の符号化方法を説明する。
符号化装置600(図22)の予測符号化部610には、第1実施形態と同様な時系列信号x(n)が入力される。フレームバッファ2111でバッファされた1フレーム分の時系列信号x(n)(n=0,...,N-1)は、長期予測分析部612に送られる。長期予測分析部612は、時系列信号x(n)(n=0,...,N-1)の長期予測分析を行い、式(4)に示した予測残差e(n)(n=0,...,N-1)のエネルギーを最小化するゲインρ(j)(j=-tap,...,tap)や遅延値τ(最小遅延値Τmin≦τ≦最大遅延値Τmax)を算出する。なお、長期予測分析部612は、時系列信号x(n)をそのまま長期予測分析する構成であってもよいし、非線形量子化されて入力された時系列信号x(n)を線形量子化や他の非線形量子化にマッピングしてから長期予測分析を行う構成であってもよい。算出されたゲインρ(j)は量子化部613に送られる。量子化部613は、ゲインρ(j)を量子化して量子化ゲインρ'(j)を生成して出力する。遅延値τと量子化ゲインρ'(j)は係数符号化部614に入力される。係数符号化部614は、遅延値τに対応する遅延符号Cτと、ゲインρ(j)に対応する利得符号Cρとを生成して出力する。また、遅延値τと量子化ゲインρ'(j)と時系列信号x(n)(n=0,...,N-1)とは、長期予測部616にも入力される。長期予測部616は、式(5)の長期予測フィルタを用いてy(n)(n=0,...,N-1)を生成して出力する。そして、減算部617は、時系列信号x(n)から期予測値y(n)を減算した予測残差e(n)(n=0,...,N-1)を算出する(ステップS710)。
予測残差e(n)は、残差符号化部620の第2区間パラメータ算出部121aに入力される。第2区間パラメータ算出部121aは、各予測残差e(n)を用い、第2区間(L,...,N-1)を含む時間区間での予測残差e(μ)(μ=μmin,...,μmax)の平均振幅が大きくなるに従って広義単調増加する関係にある正の第2区間パラメータsを、第2区間(L,...,N-1)の予測残差e(z)(z=L,...,N-1)を可変長符号化するためのパラメータとして算出する(ステップS20)。
次に、加算値決定部621bに、ステップS710で生成された量子化ゲインρ'(0)と、ステップS20で生成された第2区間パラメータsとが入力される。加算値決定部621bは、これらを用い、第2区間(L,...,N-1)を含む時間区間での時系列信号x(μ)(μ=μmin,...,μmax)の平均振幅に対する予測残差e(μ)(μ=μmin,...,μmax)の平均振幅の比が小さくなるに従って広義単調増加する関係にある正の加算値a(r)(r=0,...,L-1)を求める(ステップS730)。この例の加算値a(r)も、時系列信号x(μ)(μ=μmin,...,μmax)の予測効果を表す指標に対応する。
[ステップS730の一例]
図27に示す処理はL=3の場合の一例である。この例の場合、まず、加算値決定部621bは、s≦TH1を満たすか否かを判断し(ステップS31)、s≦TH1を満たすのであれば、加算値をa(0)=1,a(1)=0,a(2)=0とする(ステップS32)。また、s≦TH1を満たさないのであれば、加算値決定部621bは、s≧TH2を満たすか否かを判断し(ステップS33)、s≧TH2を満たすのであれば、加算値をa(0)=0,a(1)=0,a(2)=0とする(ステップS34)。さらに、s≧TH2も満たさないのであれば、加算値決定部621bは、|ρ'(0)|≧60を満たすか否かを判断し(ステップS735)、|ρ'(0)|≧60を満たすのであれば、加算値をa(0)=3,a(1)=2,a(2)=1とする(ステップS36)。また、|ρ'(0)|≧60も満たさないのであれば、加算値決定部621bは、|ρ'(0)|≧40を満たすか否かを判断し(ステップS737)、|ρ'(0)|≧40を満たすのであれば、加算値をa(0)=2,a(1)=1,a(2)=0とする(ステップS38)。|ρ'(0)|≧40も満たさないのであれば、加算値決定部621bは、加算値をa(0)=1,a(1)=0,a(2)=0とする(ステップS39/[ステップS730の一例]の説明終わり)。
次に、第1実施形態のステップS40及びS50と同様な処理が実行された後、遅延符号Cτと利得符号Cρと残差符号Ce(n)(n=0,...,N-1)と第2区間パラメータsとが、合成部2130に入力される。合成部2130は、これらを合成した符号Cgを生成して出力する(ステップS760)。
<復号方法>
図28は、第3実施形態の復号方法を説明するためのフローチャートである。以下、この図を用いて本形態の復号方法を説明する。
復号装置700(図24)の分離部2210は、復号装置700に入力された符号Cgを分離し、遅延符号Cτと利得符号Cρと残差符号Ce(n)(n=0,...,N-1)と第2区間パラメータsを生成する(ステップS810)。
遅延符号Cτと利得符号Cρは、係数復号部731に入力される。係数復号部731は、遅延符号Cτと利得符号Cρを復号して、遅延値τと量子化ゲインρ'(j)を生成する(ステップS820)。
次に、分離部2210から出力された第2区間パラメータsと、係数復号部731から出力された量子化ゲインρ'(0)とが、残差復号部720(図25)の加算値決定部722に入力される。加算値決定部722は、これらを用い、ステップS730と同一の基準に従って、正の加算値a(r)(r=0,...,L-1)を求める(ステップS830)。この例の加算値a(r)も、時系列信号x(μ)(μ=μmin,...,μmax)の予測効果を表す指標に対応する。
次に、第1実施形態のステップS240及びS250と同様な処理が実行された後、長期予測部733及び加算部734が、残差復号部720から出力された予測残差e(n)(n=0,...,N-1)と、係数復号部731から出力された遅延値τと量子化ゲインρ'(j)とを用い、時系列信号x(n)(n=0,...,N-1)を生成して出力する(ステップS860)。
〔第3実施形態の変形例〕
本形態では、前述の《例12》の基準に従って加算値a(r)(r=0,...,L-1)を設定することとした。しかし、《例13》のような、その他の基準に従って加算値a(r)を求める構成であってもよい。また、これらの異なる基準を組み合わせて利用してもよく、例えば、離散時間rごとに異なる基準を用いて加算値a(r)を求めてもよい。
また、例えば、符号化の処理単位をフレーム又はサブフレームに切り替え可能とし、加算値決定部621b,722が、サブフレームが処理単位として用いられる場合の加算値a(r)よりも、フレームが処理単位して用いられる場合の加算値a(r)を大きくする構成であってもよい。
また、本実施形態では、0以上最大振幅値MAX以下の範囲に所定値TH1と所定値TH2とを設定し(0≦TH1<TH2≦MAX)、第2区間パラメータsが所定値TH1以下である場合の加算値a(r)が、当該第2区間パラメータが当該所定値TH1よりも大きく所定値TH2よりも小さい場合の加算値a(r)以下となるようにし(下限基準)、第2区間パラメータsが所定値TH2以上である場合の加算値a(r)が、当該第2区間パラメータsが所定値TH1よりも大きく当該所定値TH2よりも小さい場合の加算値a(r)以下となるようにする(上限基準)例を示した。しかし、このような所定値TH1や所定値TH2を用いた基準を用いない構成でもよい。また、例えば、上限基準又は下限基準の何れか一方を用いる構成でもよい。
また、第1実施形態の変形例として説明したように、第2区間パラメータsと加算値a(r)(r=0,...,L-1)との和に対して広義単調増加する関係にある補正値が第1区間パラメータs(r)(r=0,...,L-1)とされてもよい。その他、第2実施形態で説明したように、復号装置700で加算値a(r)(r=0,...,L-1)を復元するために用いられる補助情報が符号Cgに含まれてもよい。
その他、短期予測分析と長期予測分析とを組み合わせて得られた予測残差を符号化する場合に本発明を用いてもよい。すなわち、入力された時系列信号の短期予測分析を行い、短期予測フィルタを用いて短期予測残差を求め、当該短期予測残差を後段の時系列信号として長期予測分析を行い、長期予測フィルタを用いて長期予測残差を求め、その長期予測残差を符号化する場合に本発明を用いてもよい。逆に、入力された時系列信号の長期予測分析を行い、長期予測フィルタを用いて長期予測残差を求め、当該長期予測残差を後段の時系列信号として短期予測分析を行い、短期予測フィルタを用いて短期予測残差を求め、その短期予測残差を符号化する場合に本発明を用いてもよい。このように短期予測分析と長期予測分析とを組み合わせる場合の加算値は、上述した短期予測フィルタを用いて得られた予測残差を符号化する場合の加算値と同様であってもよいし、長期予測フィルタを用いて得られた予測残差を符号化する場合の加算値と同様であってもよいし、それらの設定基準を組み合わせて設定された加算値であってもよい。
〔その他の変形例〕
なお、本発明は上述の実施の形態に限定されるものではない。例えば、本形態では、ランダムアクセスされたフレームや先頭のサブフレームを「或る離散時間区間」として本発明を適用することとした。しかし、短期予測フィルタによる計算に、処理対象のフレーム(又はサブフレーム)より前の時間区間の時系列信号を用いることができない状況であれば、本発明を適用することで平均符号量を削減できる。
また、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
また、上述の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
本発明の産業上の利用分野としては、例えば、音響信号の可逆圧縮符号化・復号化技術を例示できる。また、本発明は、音響信号以外にも、映像信号、生体信号、地震波信号などの可逆圧縮符号化・復号化技術にも応用可能である。
2100,100,600,800 符号化装置
2200,200,700,900 復号装置

Claims (16)

  1. 或る離散時間区間に属する時系列信号の予測残差の可変長符号化用パラメータを選択するパラメータ選択方法であって、
    (A) 前記離散時間区間が含む最先の時間区間を第1区間とし、当該第1区間よりも後の時間区間を第2区間とした場合における、当該第2区間を含む時間区間での予測残差の平均振幅の単調非減少関数値に相当する正の第2区間パラメータを、前記第2区間の予測残差の可変長符号化用パラメータとするステップと、
    (B) 前記第2区間パラメータと前記第2区間を含む時間区間での時系列信号の予測効果を表す指標に対応する正の加算値との和の単調非減少関数値に相当する値を、前記第1区間に属する或る離散時間での予測残差の可変長符号化用パラメータとするステップと、
    を有するパラメータ選択方法。
  2. 或る離散時間区間に属する時系列信号の予測残差の可変長符号化用パラメータを選択するパラメータ選択方法であって、
    (A) 前記離散時間区間が含む最先の時間区間を第1区間とし、当該第1区間よりも後の時間区間を第2区間とした場合における、当該第2区間を含む時間区間での予測残差の平均振幅の単調非減少関数値に相当する正の第2区間パラメータを、前記第2区間の予測残差の可変長符号化用パラメータとするステップと、
    (B) 前記離散時間区間に属する時系列信号に対応する或る次数のPARCOR係数の大きさが第1値である場合に、前記第2区間パラメータと、正の第1加算値との和の単調非減少関数値に相当する値を、前記第1区間に属する或る離散時間での予測残差の可変長符号化用パラメータとし、前記PARCOR係数の大きさが前記第1値よりも大きな第2値である場合に、前記第2区間パラメータと前記第1加算値以上の第2加算値との和の単調非減少関数値に相当する値を、前記第1区間に属する或る離散時間での予測残差の可変長符号化用パラメータとするステップと、
    を有するパラメータ選択方法。
  3. 或る離散時間区間に属する時系列信号の予測残差の可変長符号化用パラメータを選択するパラメータ選択方法であって、
    (A) 前記離散時間区間が含む最先の時間区間を第1区間とし、当該第1区間よりも後の時間区間を第2区間とした場合における、当該第2区間を含む時間区間での予測残差の平均振幅の単調非減少関数値に相当する正の第2区間パラメータを、前記第2区間の予測残差の可変長符号化用パラメータとするステップと、
    (B) 前記第2区間パラメータと前記離散時間区間の時系列信号の長期予測分析を行った場合の予測効果を表す指標に対応する正の加算値との和の単調非減少関数値に相当する値を、前記第1区間に属する或る離散時間での予測残差の可変長符号化用パラメータとするステップと、
    を有するパラメータ選択方法。
  4. 請求項1のパラメータ選択方法であって、
    前記加算値は、前記第2区間を含む時間区間での時系列信号の平均振幅に対する予測残差の平均振幅の比の単調非増加関数値に相当する、パラメータ選択方法。
  5. 請求項1のパラメータ選択方法であって、
    前記加算値は、前記離散時間区間に属する時系列信号に対応する或る次数のPARCOR係数の大きさの単調非減少関数値に相当する、パラメータ選択方法。
  6. 請求項1のパラメータ選択方法であって、
    前記加算値は、前記離散時間区間の時系列信号の短期予測分析を行う際に適応的に選択される最適予測次数の単調非減少関数値に相当する、パラメータ選択方法。
  7. 請求項1のパラメータ選択方法であって、
    前記加算値は、前記離散時間区間の時系列信号を予測次数Pで短期予測分析して得られる1次からP次までの各PARCOR係数をk(m)(m=1,...,P)とした場合におけるΠm=1 P{1-k(m)2}の単調非増加関数値に相当する、パラメータ選択方法。
  8. 請求項1のパラメータ選択方法であって、
    前記加算値は、前記離散時間区間に属する離散時間数未満の正の整数をLとし、前記第1区間を前記離散時間区間の最先の離散時間からL番目の離散時間までの時間区間とし、前記第1区間の最先からL番目までの離散時間の各インデックスをr(r=0,...,L-1)とした場合における、各インデックスrに対応する各離散時間にそれぞれ設定され、
    インデックスr=0に対応する離散時間での前記加算値は、前記離散時間区間の時系列信号を予測次数Pで短期予測分析して得られる1次からP次までの各PARCOR係数をk(m)(m=1,...,P)とした場合における1-Πm=1 P{1-k(m)2}の単調非減少関数値に相当し、0<r<Pのインデックスrに対応する離散時間での前記加算値は、Πm=1 r{1-k(m)2}-Πm=1 P{1-k(m)2}の単調非減少関数値に相当し、
    前記ステップ(B)は、前記第2区間パラメータと、前記インデックスrに対応する離散時間での前記加算値との和の単調非減少関数値に相当する値を、当該インデックスrに対応する離散時間での予測残差の可変長符号化用パラメータとするステップである、パラメータ選択方法。
  9. 請求項1のパラメータ選択方法であって、
    前記ステップ(B)は、前記第2区間パラメータが所定値よりも大きい場合に実行されるステップであり、
    前記第2区間パラメータが前記所定値以下である場合には、前記第2区間パラメータと前記加算値より小さな正の第2加算値との和の単調非減少関数値に相当する値を、前記第1区間に属する或る離散時間での予測残差の可変長符号化用パラメータとするステップが実行され、
    前記所定値は、0以上であって前記第2区間パラメータの最大振幅値未満の値である、パラメータ選択方法。
  10. 請求項1から3の何れかのパラメータ選択方法であって、
    前記加算値は、前記離散時間区間に属する時系列信号数の単調非減少関数値に相当する、パラメータ選択方法。
  11. 請求項1から3の何れかのパラメータ選択方法であって、
    前記第1区間は、前記離散時間区間の最先の離散時間からL番目の離散時間までの時間区間であり、
    前記第2区間は、前記離散時間区間のL+1番目の離散時間から当該離散時間区間の最後の離散時間までの時間区間であり、
    Lは前記離散時間区間に属する離散時間数未満の正の整数である、パラメータ選択方法。
  12. 或る離散時間区間に属する時系列信号の予測残差の可変長符号化用パラメータを選択する装置であって、
    前記離散時間区間が含む最先の時間区間を第1区間とし、当該第1区間よりも後の時間区間を第2区間とした場合における、当該第2区間を含む時間区間での予測残差の平均振幅の単調非減少関数値に相当する正の第2区間パラメータを、前記第2区間の予測残差の可変長符号化用パラメータとする第2区間パラメータ算出部と、
    前記第2区間パラメータと前記第2区間を含む時間区間での時系列信号の予測効果を表す指標に対応する正の加算値との和の単調非減少関数値に相当する値を、前記第1区間に属する或る離散時間での予測残差の可変長符号化用パラメータとする第1区間パラメータ算出部と、
    を有する装置。
  13. 或る離散時間区間に属する時系列信号の予測残差の可変長符号化用パラメータを選択する装置であって、
    前記離散時間区間が含む最先の時間区間を第1区間とし、当該第1区間よりも後の時間区間を第2区間とした場合における、当該第2区間を含む時間区間での予測残差の平均振幅の単調非減少関数値に相当する正の第2区間パラメータを、前記第2区間の予測残差の可変長符号化用パラメータとする第2区間パラメータ算出部と、
    前記離散時間区間に属する時系列信号に対応する或る次数のPARCOR係数の大きさが第1値である場合に、前記第2区間パラメータと正の第1加算値との和の単調非減少関数値に相当する値を、前記第1区間に属する或る離散時間での予測残差の可変長符号化用パラメータとし、前記PARCOR係数の大きさが前記第1値よりも大きな第2値である場合に、前記第2区間パラメータと前記第1加算値以上の第2加算値との和の単調非減少関数値に相当する値を、前記第1区間に属する或る離散時間での予測残差の可変長符号化用パラメータとする第1区間パラメータ算出部と、
    を有する装置。
  14. 或る離散時間区間に属する時系列信号の予測残差の可変長符号化用パラメータを選択する装置であって、
    前記離散時間区間が含む最先の時間区間を第1区間とし、当該第1区間よりも後の時間区間を第2区間とした場合における、当該第2区間を含む時間区間での予測残差の平均振幅の単調非減少関数値に相当する正の第2区間パラメータを、前記第2区間の予測残差の可変長符号化用パラメータとする第2区間パラメータ算出部と、
    前記第2区間パラメータと前記離散時間区間の時系列信号の長期予測分析を行った場合の予測効果を表す指標に対応する正の加算値との和の単調非減少関数値に相当する値を、前記第1区間に属する或る離散時間での予測残差の可変長符号化用パラメータとする第1区間パラメータ算出部と、
    を有する装置。
  15. 請求項1から3の何れかのパラメータ選択方法の各ステップの処理をコンピュータに実行させるためのプログラム。
  16. 請求項1から3の何れかのパラメータ選択方法の各ステップの処理をコンピュータに実行させるためのプログラムを格納したコンピュータ読み取り可能な記録媒体。
JP2010547533A 2009-01-23 2010-01-22 パラメータ選択方法、パラメータ選択装置、プログラム及び記録媒体 Active JP4866484B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010547533A JP4866484B2 (ja) 2009-01-23 2010-01-22 パラメータ選択方法、パラメータ選択装置、プログラム及び記録媒体

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2009013265 2009-01-23
JP2009013265 2009-01-23
JP2010547533A JP4866484B2 (ja) 2009-01-23 2010-01-22 パラメータ選択方法、パラメータ選択装置、プログラム及び記録媒体
PCT/JP2010/050794 WO2010084951A1 (ja) 2009-01-23 2010-01-22 パラメータ選択方法、パラメータ選択装置、プログラム及び記録媒体

Publications (2)

Publication Number Publication Date
JP4866484B2 true JP4866484B2 (ja) 2012-02-01
JPWO2010084951A1 JPWO2010084951A1 (ja) 2012-07-19

Family

ID=42356001

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010547533A Active JP4866484B2 (ja) 2009-01-23 2010-01-22 パラメータ選択方法、パラメータ選択装置、プログラム及び記録媒体

Country Status (4)

Country Link
US (1) US8576910B2 (ja)
JP (1) JP4866484B2 (ja)
CN (1) CN102282770B (ja)
WO (1) WO2010084951A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103460287B (zh) * 2011-04-05 2016-03-23 日本电信电话株式会社 音响信号的编码方法、解码方法、编码装置、解码装置
CN103294729B (zh) * 2012-03-05 2016-08-17 富士通株式会社 处理、预测包含样本点的时间序列的方法和设备
CN107105247B (zh) 2012-04-13 2021-05-07 佳能株式会社 视频数据的变换单位的子集的编解码的方法、设备和***
PL3462449T3 (pl) * 2014-01-24 2021-06-28 Nippon Telegraph And Telephone Corporation Urządzenie, sposób i program do analizy liniowo-predykcyjnej oraz nośnik zapisu
KR101850523B1 (ko) * 2014-01-24 2018-04-19 니폰 덴신 덴와 가부시끼가이샤 선형 예측 분석 장치, 방법, 프로그램 및 기록 매체
JP6729299B2 (ja) * 2016-10-28 2020-07-22 富士通株式会社 ピッチ抽出装置及びピッチ抽出方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH104557A (ja) * 1996-06-17 1998-01-06 Canon Inc 画像処理装置、及び方法、及びその方法を記憶した記憶媒体
JP2006126810A (ja) * 2004-10-29 2006-05-18 Microsoft Corp 後方適応規則を用いた整数データの無損失適応Golomb−Rice符号化および復号化
JP2008157998A (ja) * 2006-12-20 2008-07-10 Nippon Telegr & Teleph Corp <Ntt> 線形予測係数算出方法、及びその装置とそのプログラムと、その記憶媒体
JP2008185701A (ja) * 2007-01-29 2008-08-14 Nippon Telegr & Teleph Corp <Ntt> Parcor係数算出方法、及びその装置とそのプログラムと、その記憶媒体

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5400075A (en) * 1993-01-13 1995-03-21 Thomson Consumer Electronics, Inc. Adaptive variable length encoder/decoder
US6028963A (en) 1996-06-17 2000-02-22 Canon Kabushiki Kaisha Image encoding based on judgement on prediction error
JP2000333163A (ja) * 1999-05-24 2000-11-30 Sony Corp 復号装置及び方法、符号化装置及び方法、画像処理システム、画像処理方法
BRPI0303661B1 (pt) * 2002-03-27 2016-09-27 Matsushita Electric Indusrial Co Ltd método e dispositivo de codificação de comprimento variável e meio de armazenamento
EP2367358A1 (en) * 2002-04-26 2011-09-21 NTT DoCoMo, Inc. Image encoding apparatus, image decoding apparatus, image encoding method, image decoding method, image encoding program, and image decoding program
US8050915B2 (en) * 2005-07-11 2011-11-01 Lg Electronics Inc. Apparatus and method of encoding and decoding audio signals using hierarchical block switching and linear prediction coding
JP4838773B2 (ja) 2007-07-18 2011-12-14 日本電信電話株式会社 線形予測符号化の予測次数決定方法及びそれを使った予測係数決定方法及び装置、プログラム、その記録媒体
JP4691082B2 (ja) * 2007-09-11 2011-06-01 日本電信電話株式会社 線形予測モデル次数決定装置、線形予測モデル次数決定方法、そのプログラムおよび記録媒体
JP5365518B2 (ja) * 2007-09-12 2013-12-11 ソニー株式会社 画像処理装置及び方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH104557A (ja) * 1996-06-17 1998-01-06 Canon Inc 画像処理装置、及び方法、及びその方法を記憶した記憶媒体
JP2006126810A (ja) * 2004-10-29 2006-05-18 Microsoft Corp 後方適応規則を用いた整数データの無損失適応Golomb−Rice符号化および復号化
JP2008157998A (ja) * 2006-12-20 2008-07-10 Nippon Telegr & Teleph Corp <Ntt> 線形予測係数算出方法、及びその装置とそのプログラムと、その記憶媒体
JP2008185701A (ja) * 2007-01-29 2008-08-14 Nippon Telegr & Teleph Corp <Ntt> Parcor係数算出方法、及びその装置とそのプログラムと、その記憶媒体

Also Published As

Publication number Publication date
US20110274165A1 (en) 2011-11-10
CN102282770B (zh) 2014-04-16
JPWO2010084951A1 (ja) 2012-07-19
CN102282770A (zh) 2011-12-14
US8576910B2 (en) 2013-11-05
WO2010084951A1 (ja) 2010-07-29

Similar Documents

Publication Publication Date Title
JP5863830B2 (ja) フィルタ係数を生成してフィルタを設定する方法、エンコーダ及びデコーダ
KR101569060B1 (ko) 부호화 방법, 복호 방법, 부호화 장치, 복호 장치, 프로그램, 기록 매체
JP5337235B2 (ja) 符号化方法、復号方法、符号化装置、復号装置、プログラム及び記録媒体
JP4866484B2 (ja) パラメータ選択方法、パラメータ選択装置、プログラム及び記録媒体
JP5446013B2 (ja) 適応差分パルス符号変調の符号化装置及び復号化装置
JP5303074B2 (ja) 符号化方法、復号方法、それらの装置、プログラム及び記録媒体
KR20040078760A (ko) 광대역 음성 부호화를 위한 엘에스에프 계수 벡터 양자화기
KR100629997B1 (ko) 오디오 신호의 인코딩 방법
US8502708B2 (en) Encoding method and decoding method, and devices, program and recording medium for the same
JP4918103B2 (ja) 符号化方法、復号方法、それらの装置、プログラム及び記録媒体
JP4848049B2 (ja) 符号化方法、復号方法、それらの装置、プログラム及び記録媒体
JP5057334B2 (ja) 線形予測係数算出装置、線形予測係数算出方法、線形予測係数算出プログラム、および記憶媒体
US9070362B2 (en) Audio quantization coding and decoding device and method thereof
JP5281485B2 (ja) 双方向予測符号化装置、双方向予測復号装置、それらの方法、それらのプログラム及びその記録媒体
KR0174156B1 (ko) 이미지 데이타 압축 장치 및 방법
JPS635926B2 (ja)
JPH05206869A (ja) 量子化制御回路
JPH0445614A (ja) 1ビット/サンプル量子化方法
JP2004170494A (ja) 音声符号化装置,音声符号化方法

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111101

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141118

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4866484

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350