JP5789816B2 - 符号化装置、この方法、プログラム及び記録媒体 - Google Patents

符号化装置、この方法、プログラム及び記録媒体 Download PDF

Info

Publication number
JP5789816B2
JP5789816B2 JP2014502273A JP2014502273A JP5789816B2 JP 5789816 B2 JP5789816 B2 JP 5789816B2 JP 2014502273 A JP2014502273 A JP 2014502273A JP 2014502273 A JP2014502273 A JP 2014502273A JP 5789816 B2 JP5789816 B2 JP 5789816B2
Authority
JP
Japan
Prior art keywords
gain
time interval
index
bits
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014502273A
Other languages
English (en)
Other versions
JPWO2013129439A1 (ja
Inventor
守谷 健弘
健弘 守谷
優 鎌本
優 鎌本
登 原田
登 原田
弘和 亀岡
弘和 亀岡
茂樹 嵯峨山
茂樹 嵯峨山
崇良 大嶋
崇良 大嶋
小野 順貴
順貴 小野
大輔 齋藤
大輔 齋藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
University of Tokyo NUC
Inter University Research Institute Corp Research Organization of Information and Systems
Original Assignee
Nippon Telegraph and Telephone Corp
University of Tokyo NUC
Inter University Research Institute Corp Research Organization of Information and Systems
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp, University of Tokyo NUC, Inter University Research Institute Corp Research Organization of Information and Systems filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2014502273A priority Critical patent/JP5789816B2/ja
Publication of JPWO2013129439A1 publication Critical patent/JPWO2013129439A1/ja
Application granted granted Critical
Publication of JP5789816B2 publication Critical patent/JP5789816B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

この発明は、音声、音楽等の音信号を符号化または復号する技術に関する。特に、CELP等の符号化技術で符号化された周期性成分の利得およびパルス性成分の利得を符号化または復号する技術に関する。
従来は、CELP(Code Excited Linear Prediction)の符号化および復号において用いられる周期性成分の利得およびパルス性成分の利得は、符号誤りに対する耐性を強くするために固定長ビットが割り当てられて符号化および復号されていた(例えば、非特許文献1参照)。パルス性成分の利得については、利得そのものではなく過去のサブフレームからの予測値に対する比を符号化の対象とすることにより、利得の値の時間的な連続性を考慮して符号量の削減を行っていた。
また、特許文献1では、周期性成分の利得から周期性成分の利得の値の時間的な連続性の有無を判定し、時間的な連続性があると予測された場合には周期性成分の利得の値の差分を可変長符号化することにより符号量の削減を行っていた。
WO2006/075605国際公開公報
3rd Generation Partnership Project(3GPP), Technical Specification (TS) 26.090, "AMR speech codec; Transcoding functions", Version 4.0.0 (2001-03)
非特許文献1に記載された符号化方法および復号方法では、周期性成分の利得およびパルス性成分の利得については、固定長での符号化および復号が行われていた。
しかしながら、非特許文献1に記載された符号化方法では、周期性成分の利得およびパルス性成分の利得の頻度に関する冗長性や周期性成分の利得の連続性について考慮することなく符号化および復号されており、符号化および復号の効率が良くないという問題があった。
特許文献1には、周期性成分の利得の値の連続性や頻度を考慮して固定長または可変長の符号化および復号を行う技術が開示されている。
しかしながら、特許文献1に記載された可変長符号化および復号は、平均符号量を少なくすることを目的としたものであり、可変長符号化の際には歪みとインデックスの符号長の双方は考慮されていなかった。
この発明の課題は、CELPなどの符号化方式で得られた利得を、符号帳を参照して符号化する際に、符号の長さ(情報量)と歪みの双方を考慮した、より効率が良い符号化装置、この方法、プログラムおよび記録媒体を提供することである。
符号化においては、利得に対応する符号帳の中から、最も好ましいインデックスを選択するが、この際にこの符号を使うことで生じる波形の歪みだけでなくこの符号に割り当てられた符号長を考慮する。
利得のベクトル量子化のために、予め出現頻度の高いインデックスに短い符号を割り当てるような可変長符号を使い、インデックスを選択する際に、インデックスの符号の長さを歪みに近似的に換算して歪み尺度を変形し、その変形した歪み尺度を利用する。歪みと符号の長さで最も好ましいバランスのインデックスを選択できる。これにより、従来技術よりも小さな平均ビットレートでありながら、平均の波形歪みについては従来技術とほぼ同じにすることができる。また、節約できた平均のビット数を例えばパルス成分符号化に充当することで、従来の符号化方法に比べ、同じ平均ビットレートでありながら、波形歪みを小さくできる。
符号化装置の例の機能ブロック図。 復号装置の例の機能ブロック図。 符号化装置の例の機能ブロック図。
以下、この発明の一実施形態について、詳細に説明する。
[第一実施形態]
<構成>
図1に例示するように、第一実施形態の符号化装置11は、線形予測分析部111、適応符号帳112、固定符号帳113、ピッチ分析部114(「適応符号帳探索部」に相当)、探索部115(「固定符号帳探索部」に相当)、聴覚重み付けフィルタ116、合成フィルタ117、利得量子化部118、およびパラメータ符号化部119を有する。
図2に例示するように、第一実施形態の復号装置12は、適応符号帳122、固定符号帳123、固定符号帳選択部125、合成フィルタ127、およびパラメータ復号部129を有する。
本形態の符号化装置11および復号装置12は、例えば、CPU(central processing unit)、RAM(random-access memory)、ROM(read-only memory)等を備えた公知のコンピュータまたは専用のコンピュータにプログラムやデータが読み込まれることで構成された特別な装置である。また、符号化装置11および復号装置12の処理部の少なくとも一部が集積回路等のハードウェアによって構成されていてもよい。
<符号化>
符号化装置11には、デジタル化され、所定時間区間であるフレームの単位で区分された時系列信号である入力音響信号x(n)(n=0,...,L−1、Lは2以上の整数、各nを「サンプル点」と呼ぶ)が入力される。符号化装置11は、入力音響信号x(n)(n=0,...,L−1)を以下のようにフレームごとに符号化する。
線形予測分析部111は、処理対象のフレーム(「現フレーム」と呼ぶ)に属する各サンプル点n=0,...,L−1での入力音響信号x(n)(n=0,...,L−1)の線形予測分析を行い、当該現フレームでの全極型の合成フィルタ117を特定するための係数の量子化値に対応する符号である線形予測情報LPC info(「予測パラメータ」に含まれる)を出力する。すなわち、線形予測分析部111は、フレームごとに、入力音響信号x(n)(n=0,...,L−1)に対応する線形予測係数またはこれと互換な係数を特定する符号である線形予測情報LPC infoを得て出力する。例えば、線形予測分析部111は、現フレームの入力音響信号x(n)(n=0,...,L−1)に対応する線形予測係数a(m)(m=1,...,P、Pは正の整数である線形予測次数)を算出し、線形予測係数a(m)(m=1,...,P)を線スペクトル対係数LSPに変換し、量子化した線スペクトル対係数LSPに対応する符号を線形予測情報LPC infoとして出力する。
固定符号帳113には、零でない単位パルスとその極性との組み合わせからなる値を持つ1個以上の信号と零値を持つ1個以上の信号とから構成される複数個のパルス系列(「サンプル列」に相当)を特定するための情報が格納される。固定符号帳113は、探索部115の制御に従い、1フレームを区分したサブフレームごとに、入力音響信号x(n)に対応するパルス系列を出力する。ここでは1フレームが4個のサブフレームに等区分される例を示す。すなわち、L個のサンプル点0,...,L−1からなるフレームは、サンプル点Lf(0),...,Lf(1)−1からなる1番目のサブフレーム(第1サブフレーム)、サンプル点Lf(1),...,Lf(2)−1からなる2番目のサブフレーム(第2サブフレーム)、サンプル点Lf(2),...,Lf(3)−1からなる3番目のサブフレーム(第3サブフレーム)、およびサンプル点Lf(3),...,Lf(4)−1からなる4番目のサブフレーム(第4サブフレーム)に区分される。Lf(0),Lf(1),Lf(2),Lf(3),Lf(4)は、Lf(0)=0,Lf(4)=L,Lf(0)<Lf(1)<Lf(2)<Lf(3)<Lf(4)を満たす正整数である。第1−4サブフレームに対応するパルス系列cf1,cf2,cf3,cf4はそれぞれ以下のように表現される。
cf1=(cf1(Lf(0)),...,cf1(Lf(1)-1))
cf2=(cf2(Lf(1)),...,cf2(Lf(2)-1))
cf3=(cf3(Lf(2)),...,cf3(Lf(3)-1))
cf4=(cf4(Lf(3)),...,cf4(Lf(4)-1))
ピッチ分析部114は、サブフレームごとに、入力音響信号x(n)(n=0,...,L−1)に対応するピッチ周期T,T,T,Tを得て、当該ピッチ周期T,T,T,Tと、当該ピッチ周期T,T,T,Tを特定するピッチ符号(周期性成分符号)CT,CT,CT,CTと、を出力する。各サブフレームのピッチ符号CT,CT,CT,CTはそれぞれ均一長であってもよいし、可変長であってもよい。CT,CT,CT,CTそれぞれのビット数は、互いに同一であってもよいし、互いに異なっていてもよい。なお、ピッチ周期はピッチ符号を復号することにより得られる。そのため、ピッチ分析部114がピッチ周期を出力することは必須ではない。ピッチ周期は、サンプル点の間隔の整数倍のみで表現される場合(整数精度)のみならず、サンプル点の間隔の整数倍と小数値(分数値)とを用いて表現される場合(小数精度)もある。また、ピッチ分析部114は、探索部115で用いるために、サブフレームごとに、ピッチ利得gp1,gp2,gp3,gp4を求めて出力してもよい。
入力音響信号x(n)(n=0,...,L−1)に対応するピッチ周期T,T,T,T、当該ピッチ周期T,T,T,Tを特定するピッチ符号CT,CT,CT,CTの探索は、例えば、サブフレームごとに、適応符号帳112に記憶されている過去の各時点で生成された励振信号をピッチ周期の候補で遅延させて得られる信号に線形予測情報LPC infoによって特定される全極型の合成フィルタ117を適用して得られる合成信号と、入力された入力音響信号との差分に、聴覚重み付けフィルタ116を適用した値が最小となるように行われる。
ピッチ利得gp1,gp2,gp3,gp4は、例えば、サブフレームごとに、探索された当該ピッチ周期T,T,T,Tに対応する合成信号と入力された入力音響信号との相互相関値を合成信号の自己相関値で除算した値として求められる。
適応符号帳112には、過去の各時点で生成された励振信号が記憶されている。適応符号帳112は、第1−4サブフレームの各サブフレームで得られるピッチ周期T,T,T,Tに応じて励振信号を遅延させて得られる適応信号成分v(n)(n=0,...,L−1)を出力する。小数精度のピッチ周期を用いて適応信号成分v(n)を表現する場合には、ピッチ周期に応じて遅延させた複数の励振信号に重み付き平均操作を行う補間フィルタが用いられる。
探索部115は、サブフレームごとに、入力音響信号x(n)(n=0,...,L−1)に対応するパルス系列cf1,cf2,cf3,cf4と、当該パルス系列cf1,cf2,cf3,cf4に対応するコードインデックスCf1,Cf2,Cf3,Cf4(入力音響信号x(n)(n=0,...,L−1)に対応するパルス系列cf1,cf2,cf3,cf4を特定するコードインデックス)と、を得て出力する。なお、パルス系列はコードインデックスを復号することにより得られるので、探索部115がパルス系列を出力することは必須ではない。
利得量子化部118には、入力音響信号x(n)(n=0,...,L−1)および合成信号x’(n)(n=0,...,L−1)が入力される。合成信号x’(n)(n=0,...,L−1)からなるサンプル列は、コードインデックスに対応するパルス系列を合成フィルタ117に通して得られるサンプル列のそれぞれのサンプルに、量子化された固定符号帳利得の候補を乗算して得られるサンプル列と、ピッチ符号に対応するピッチ周期に対応するサンプル数だけ過去の励振信号を合成フィルタ117に通して得られるサンプル列のそれぞれのサンプルに、量子化されたピッチ利得の候補を乗算して得られるサンプル列と、を対応するサンプル毎に加算して得られる。利得量子化部118は、これらを用いてベクトル量子化を行い、すなわちサブフレームごとに、入力音響信号と合成信号の歪が最も小さくなるように、量子化されたピッチ利得またはその関数値と量子化された固定符号帳利得またはその関数値との組に対応する符号を得て出力する。以下では、量子化されたピッチ利得を「量子化済ピッチ利得」と表現し、量子化された固定符号帳利得を「量子化済固定符号帳利得」と表現する。また量子化済ピッチ利得gp1^と量子化済固定符号帳利得gc1^の組に対応する符号、量子化済ピッチ利得gp2^と量子化済固定符号帳利得gc2^の組に対応する符号、量子化済ピッチ利得gp3^と量子化済固定符号帳利得gc3^の組に対応する符号、量子化済ピッチ利得gp4^と量子化済固定符号帳利得gc4^の組に対応する符号を「利得符号GAf1,GAf2,GAf3,GAf4」と表現する。すなわち、利得量子化部118は、第1から第4のサブフレームのそれぞれ(第jサブフレーム)について、量子化済ピッチ利得gpj^と量子化済固定符号帳利得gcj^の組を特定する利得符号GAfjを得て出力する。
このようなベクトル量子化には、例えば、量子化済ピッチ利得と量子化済固定符号帳利得との組に対応する利得符号を特定するためのテーブルである利得符号帳が用いられる。利得符号帳の例は、量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補とインデックスとの組が複数個格納されたテーブルである。なお、量子化済ピッチ利得に代えて量子化済ピッチ利得の関数値をベクトル量子化の対象としてもよいし、量子化済固定符号帳利得に代えて量子化済固定符号帳利得の関数値をベクトル量子化の対象としてもよいが、以下では量子化済ピッチ利得そのものと量子化済固定符号帳利得そのものをベクトル量子化の対象とする例について説明する。
量子化済固定符号帳利得の関数値の一例は、過去または現在のサブフレーム(またはフレーム)での固定符号帳113からの信号成分のエネルギーを基に予測された現在のサブフレーム(またはフレーム)での固定符号帳利得の推定値と、現在のサブフレーム(またはフレーム)での固定符号帳利得との比を表す補正係数(correction factor)などである。補正係数の例は、非特許文献1の「5.8.2 Quantization of codebook gains」の欄に記載されたγgcである。例えば、j(j=1,...,4)番目のサブフレームでの量子化済固定符号帳利得gcj^、補正係数γgcの量子化値γgc^、j(j=1,...,4)番目のサブフレームでの固定符号帳利得の推定値の量子化値pgcj^の間には、以下の関係が成り立つ。
gcj^=γgc^×pgcj^
<利得量子化部118が行うベクトル量子化>
利得量子化部118が行うベクトル量子化は、サブフレーム毎に、入力された入力音響信号x(n)(n=0,...,L−1)および合成信号x’(n)(n=0,...,L−1)に対して、利得符号帳に格納された複数個のインデックスのうちの何れか1つを選択し、それを利得符号とするものである。本発明は、この選択する処理に特徴があるので、以下でその[原理]と[具体的な手順の例]について順に説明する。
[原理]
本発明の利得量子化が行うベクトル量子化では、利得符号帳のインデックスとして可変長符号が割り当てられる。本発明でのインデックスの選択は、符号化歪み(以下「歪み」という)を最小とする基準に基づいてなされるのではなく、歪みとインデックスのビット数(符号長,情報量)とのバランスを考慮した基準に基づいてなされる。以下、この基準について説明する。
一般に、N個(N≧1)のサンプルが符号化される場合、歪みDと1サンプルあたりの符号(インデックス)のビット数g/Nとの間には、以下の近似が成り立つ。
Dg=D02(-2g/N) ...(1)
ただし、符号化対象のN個のサンプルと、当該N個のサンプルに対応する符号が復号された場合に得られるN個の復元サンプルとの間の二乗距離を歪みと定義する。Dは1サンプルあたりの符号のビット数が0である場合の歪みである。
このような関係は、サンプルの振幅が一様に分布する場合、1サンプルあたりの符号のビット数g/Nが1ビット増えると歪みDは1/4になること、および、サンプルの振幅がどのような分布に従う場合であっても、符号のビット数gがある程度以上ならほぼ同様のことがいえることに基づく。
よって、歪みの変化率D/Dは以下のように近似できる。
Dg/D0=2(-2g/N) ...(2)
これを底10の対数に変換してdB表現すると以下のようになる。
10log10(Dg/D0)
=10log10(2(-2g/N))
=10(-2g/N)log10(2)
=-6.02(g/N) ...(3)
すなわち、一般的に歪みの変化率D/Dの対数は1個のサンプルあたりの符号のビット数g/Nに比例する。例えばN=64の場合、64個のサンプルあたりの符号のビット数gが1ビット増加すると歪みの変化率D/Dは約0.1dB改善される。実験でもこれと同様な結果が得られる。
以上のように、式(1)は歪みDと1サンプルあたりの符号のビット数g/Nとの一般的な関係を近似している。利得符号帳中のあるインデックスに対応する量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補を使うことによって生ずる歪みをDとし、そのインデックスのビット数をbとする。bが小さいと符号化装置全体として出力するビット数が小さくできたり、符号化装置が出力する符号の平均ビット数またはある時間区間内でビット数が一定である制約のもとに、節約できたビットを後続のフレームで利用して後続フレームの歪みを小さくできるという利点がある。従来はDを最小化する基準で選択したインデックスを利得符号としたが、本願では歪みとビット数を1つの指標値で評価して、最適なインデックスを利得符号として選択する。このために、式(1)の関係とこのフレームで一定のビット数のもとに利得量子化で節約できたビットを入力音響信号の符号化に割り当てることを想定する。利得符号にbビットを使うと、(b−1)ビットの場合より、入力音響信号の符号化で使うビット数は1ビット削減する必要があり、式(1)から歪みは2(2/N)倍だけ増加する。したがって、利得符号にbビットを使うと歪みは2(2b/N)倍だけ増加することになる。このようなビット数の消費を歪みに換算した歪みをDとして式(4)で定義する。
DU=D×2(2b/N) ...(4)
歪みDが小さいほどDは小さくなり、インデックスを指定するビット数bが小さいほどDは小さくなる。Dが最小となる符号を探索することで、歪みDおよびインデックスのビット数bを1つの指標値で評価して利得符号を選択することができる。以下、Dを指標値と呼ぶ。
式(4)の代わりに、以下の指標値Dが最小となる符号が探索されてもよい。
DU=10log10(D×2(2b/N))=10log10(D)+(20b/N)log10(2) ...(5)
式(4)の指数部2b/Nの値は非常に小さいため、式(4)の指数関数部をテイラー展開し(e=1+x+x/2+x/6+...)、それによって得られる多項式の2項以降を省略してもよい近似となる。従って、以下の指標値Dが最小となる符号が探索されてもよい。
Figure 0005789816
式(6)は上記のようないろいろな仮定と近似に基づいており、一般にはγを正の値である定数として式(7)のような指標値とし、γは符号化装置全体の制約や目的に合わせた実験に基づく値とすることが好ましい。
DU=D(1+γb) ...(7)
要するに、指標値Dは上述のものに限定されず、歪みDと、インデックスのビット数bが大きいほど大きくなる係数と、を加算または乗算して得られる値が指標値Dとされ、指標値Dが最小となる符号が探索されればよい。
[具体的な手順の例]
上記の原理に基づいて利得量子化部118が行うベクトル量子化の具体的な手順を例示する。
利得量子化部118は、量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補との組を、可変長符号化(例えばハフマン符号化)し、利得符号であるインデックスを得る。例えば、利得量子化部118は、量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補と可変長符号であるインデックスとの組が複数個格納された利得符号帳を備え、上述の基準に従い、入力音響信号x(n)(n=0,...,L−1)に対応する利得符号であるインデックスを得る。
可変長符号は、例えば、学習用データを量子化した結果から得られる。具体的には、可変長符号は、学習用データのピッチ利得と固定符号帳利得の組をベクトル量子化した際に、量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補との組が選択された頻度に応じて予め割り当てられたものである。選択された頻度の高い量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補との組にはビット数の小さなインデックス(短い符号)が割り当てられ、選択された頻度の低い量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補との組にはビット数の大きなインデックス(長い符号)が割り当てられる。すなわち、利得符号帳に格納された複数個のインデックスにはビット数が異なるものが含まれる。このようなインデックスの例はハフマン符号である。しかしながら、その他の可変長符号がインデックスとして用いられてもよい。なお、各インデックスのビット数を定めるための上記頻度は、学習用データを用いなくても選択される量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補との組の頻度はある程度予想できるため、学習用データを用いることなく上記の頻度を予想して量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補との組に可変長符号を割り当ててもよい。
以下に利得符号帳の具体例を示す。
Figure 0005789816
表1は、インデックスがハフマン符号であり、インデックスのビット数も利得符号帳に格納する場合の利得符号帳の例である。表1ではその一部を省略してあるが、表1の利得符号帳には、量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補とインデックスと当該インデックスのビット数とによる組が32組格納されている。
利得量子化部118は、N個のサンプル点からなるサブフレーム(時間区間)ごとに、コードインデックスに対応するパルス系列(固定符号帳113からのサンプル列)を合成フィルタ117に通して得られるサンプル列Zのそれぞれのサンプルに、量子化済固定符号帳利得の候補βを乗算して得られるサンプル列βZと、ピッチ符号に対応するピッチ周期に対応するサンプル数だけ過去の励振信号を合成フィルタ117に通して得られるサンプル列Yのそれぞれのサンプルに、量子化済ピッチ利得の候補αを乗算して得られるサンプル列αYと、を対応するサンプル毎に加算して得られる合成信号サンプル列αY+βZと入力音響信号Xとの歪みDと、インデックスのビット数bが大きいほど大きくなる係数と、を加算または乗算して得られる指標値Dが最も小さくなるインデックスを、利得符号として得て出力する。例えば、第jサブフレームの合成信号サンプル列αY+βZは、第jサブフレームに属するN個のサンプル点nの合成信号x’(n)=gpj^×v(n)+gcj^×cfj(n)からなるサンプル列である。ただし、gpj^=αかつgcj^=βである。例えば、第jサブフレームの入力音響信号Xは、第jサブフレームに属するN個のサンプル点nの入力音響信号x(n)からなるサンプル列である。例えば、利得量子化部118は、各インデックスに対応するgpj^=αおよびgcj^=βを出力し、第jサブフレームに属するN個のサンプル点nの合成信号x’(n)からなるサンプル列、および、第jサブフレームに属するN個のサンプル点nの入力音響信号x(n)からなるサンプル列を得て、第jサブフレームの指標値Dを各インデックスについて計算し、指標値Dが最も小さくなるインデックスを、第jサブフレームの利得符号として得て出力する。各指標値Dに対応する量子化済ピッチ利得の候補αと量子化済固定符号帳利得の候補βとインデックスとの組は、それぞれ、利得符号帳に格納された量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補とインデックスとの組の何れかである。利得符号帳に量子化ピッチ利得の候補の関数値が格納されている場合は、量子化済ピッチ利得の候補の関数値から求まる量子化済ピッチ利得の候補をαとすればよい。同様に、利得符号帳に量子化済固定符号帳利得の候補の関数値が格納されている場合は、量子化済固定符号帳利得の候補の関数値から求まる量子化済固定符号帳利得の候補をβとすればよい。サンプル列Zに含まれるサンプルの個数、サンプル列Yに含まれるサンプルの個数、および合成信号サンプル列αY+βZに含まれるサンプルの個数は、すべてN個である。合成フィルタ117は、あるサンプル点nのサンプルυ(n)を、そのサンプル点nよりも過去のP個のサンプル点n−1,n−2,...,n−Pのサンプルχ(n−1),χ(n−2),...,χ(n−P)に線形予測係数a(n−1),a(n−2),...,a(n−P)を乗算した値a(n−1)×χ(n−1),a(n−2)×χ(n−2),...,a(n−P)×χ(n−P)の和で表す線形FIR(Finite Impulse Response)フィルタである。以下に合成フィルタ117を表す。
υ(n)=a(1)×χ(n-1)+a(2)×χ(n-2)+...+a(P)×χ(n-P)
例えば、サンプル列Aを合成フィルタ117に通してサンプル列Cが得られる場合、サンプル列Aに含まれるサンプルがχ(n−1),χ(n−2),...,χ(n−P)の少なくとも一部となり、υ(n)がサンプル列Cのサンプル点nでのサンプルとなる。χ(n−1),χ(n−2),...,χ(n−P)の少なくとも一部がサンプル列Aよりも過去のサンプル点に対応する場合、例えば、当該χ(n−1),χ(n−2),...,χ(n−P)の少なくとも一部はサンプル列Aより過去のサンプル列に含まれるサンプルとされる。あるいは、サンプル列Aよりも過去のサンプル列が存在しない場合、当該当該χ(n−1),χ(n−2),...,χ(n−P)の少なくとも一部は0などの定数とされる。
以下に指標値Dの具体例を示す。
サブフレームがN個のサンプル点S,...,S+N−1(Sは0以上の整数)からなり、サブフレームに属する入力音響信号XをベクトルX=(x(S),...,x(S+N−1))と表現し、サンプル列ZをベクトルZ=(z(S),...,z(S+N−1))と表現し、サンプル列YをベクトルY=(y(S),...,y(S+N−1))と表現し、サンプル列αY+βZと入力音響信号Xとの二乗誤差を歪みDと定義すると、歪みDは以下のように表される。ただし、σはσの転置を表す。
Figure 0005789816
例えば、前述した1フレームが4個のサブフレームに等区分される例の場合、第jサブフレーム(j=1,...,4)は、N=Lf(j)−Lf(j−1)個のサンプル点Lf(j−1),...,Lf(j)−1からなる。ここで、第jサブフレームでの入力音響信号XをベクトルX=(x(Lf(j−1)),...,x(Lf(j)−1))と表現する。また、第jサブフレームでの固定符号帳113からのパルス系列cfj=(cfj(Lf(j−1)),...,cfj(Lf(j)−1))を合成フィルタ117に通して得られるサンプル列ZをZ=(z(Lf(j−1)),...,z(Lf(j)−1))と表現する。さらに、第jサブフレームでの適応信号成分(過去の励振信号)v(Lf(j−1)),...,v(Lf(j)−1)を合成フィルタ117に通して得られるサンプル列YをベクトルY=(y(Lf(j−1)),...,y(Lf(j)−1))と表現する。すると、第jサブフレームでの歪みDは以下のように表される。
Figure 0005789816
指標値Dの例は、前述の式(4)または式(5)または式(7)であってもよいし、式(6)で近似された以下の指標値Dであってもよい。
Figure 0005789816
歪みDは符号化歪みであり、Dは歪みと利得符号のビット数b(符号長)の双方を考慮した指標値である。すなわち、歪みDが最小となるインデックスを利得符号として選択するのが従来の選択方法であり、指標値Dが最小となるインデックスを利得符号として選択するのが本発明での選択方法である。本発明では、歪みDと利得符号のビット数b(符号長)の双方を考慮して利得符号が選択される。
なお、表1のように、利得符号帳に各インデックスとそのビット数bとが対応付けられて格納されていれば、利得量子化部118は、インデックスからそのビット数bを算出することなく指標値Dを計算できる。しかしながら、利得符号帳にビット数bが格納されていなくても、利得量子化部118は、インデックスからそのビット数を計算して指標値Dを計算できる。そのため、各インデックスのビット数bを利得符号帳に格納しておくことは必須ではない。
[指標値の変形例1]
或いは、利得量子化部118が、以下の指標値Dを最小にする量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補とに対応するインデックスを利得符号帳から探索し、得られたインデックスを利得符号として出力してもよい。
Figure 0005789816
ただし、Bは利得符号帳に格納された全ての量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補の組を均一長符号化するために必要な符号のビット数である。例えば、表1に例示した利得符号帳は32=2個のインデックスを含み、この場合のBの例は5である。表1に例示した利得符号帳を用いた可変長符号化でビット数がbのインデックスが利得符号とされた場合は、均一長符号化を可変長符号化に変更したことにより余った(B−b)ビットを使って入力音響信号を更に符号化するができ、歪を軽減できることを想定する。実際は(B−b)ビットが正であれば情報の節約ができ、あるいは次のサブフレーム以降で使うことができるが、式(11)は、利得符号帳の選択の基準として均一長符号より可変長符号のほうがビット数が少ないことを歪に換算して評価するものである。式(11)の(2log2)B/Nの項は1と比較して非常に小さい。従って、近似的には式(10)および式(11)の指標値Dの間に大きな違いはない。
[指標値の変形例2]
或いは、利得量子化部118が、以下の指標値Dを最小にする量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補とに対応するインデックスを利得符号帳から探索し、得られたインデックスを利得符号として出力してもよい。
Figure 0005789816
ただし、vは正の係数である。
言い換えると、利得量子化部118が、式(10)の括弧内の第2項、すなわち、インデックスのビット数bが大きくなるほど大きくなる項、に正の値である係数vを乗算して得られる式(12)により求まる指標値Dを最小にする量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補とに対応するインデックスを利得符号帳から探索し、得られたインデックスを利得符号として出力してもよい。
式(12)の指標値Dが用いられる場合、係数vを調整することで、サブフレームごとの利得符号のビット数の大小を調整できる。このような調整は、例えば、パラメータ符号化部119から出力されるビットストリームのビット数がフレームごとに定められている場合などに有効である。このような調整は、所定時間だけ過去の時間区間(例えばサブフレーム)で得られた利得符号のビット数がインデックスの平均ビット数より小さい場合には、現在の時間区間(例えばサブフレーム)のvを1より小さな値とし、所定時間だけ過去の時間区間で得られた利得符号のビット数がインデックスの平均ビット数より大きい場合には、現在の時間区間のvを1より大きな値とすることによって可能である。
例えば、利得量子化部118は、第1サブフレームでv=1とした式(12)により求まる指標値Dを最小とするインデックスを利得符号として選択する。その結果、第1サブフレームでビット数が平均ビット数よりも小さいインデックスが利得符号として選択された場合には、残りのサブフレームに割り当てることができるビット数が平均よりも大きくなる。そこで、第2サブフレームでは、v=0.5とした式(12)により求まる指標値Dを最小とするインデックスが利得符号として選択される。すなわち、第2サブフレームでは、インデックスのビット数を小さくすることよりも歪みDを小さくすることを優先してインデックスが選択される。逆に第1サブフレームでビット数が平均ビット数よりも大きいインデックスが利得符号として選択された場合には、残りのサブフレームに割り当てることができるビット数が平均よりも小さくなる。そこで、第2サブフレームでは、v=2.0とした式(12)により求まる指標値Dを最小とするインデックスが利得符号として選択される。すなわち、第2サブフレームでは、歪みDを小さくすることよりもインデックスのビット数を小さくすることを優先してインデックスが選択される。
係数vが異なれば、それに対応する最適な利得符号帳も異なる。そのため、利得量子化部118が、利得符号帳を複数個備え、各係数vの値ごとに予め定められた利得符号帳を用いて利得符号を得て出力してもよい。例えば、v=1に対応する利得符号帳、v=2に対応する利得符号帳、v=0.5に対応する利得符号帳、の複数個の符号帳を予め利得量子化部118に格納しておき、vの値に対応する利得符号帳が選択され、選択された利得符号帳から指標値Dを最小とするインデックスが選択され、それが利得符号として出力されてもよい。この場合、利得符号帳の選択基準は、符号化装置11と復号装置12との間で同一とする。
式(5)で求まる指標値Dに代えて式(6)で求まる指標値Dを用いることができるのと同様に、式(12)で求まる指標値Dに代えて式(13)で求まる指標値Dを用いることができる。
Du=D(1+vγb) …(13)
ここで、γは正の定数、vは正の係数であるので、vγに相当する正の係数をwとすれば、式(14)で求まる指標値Dを用いることができる。
Du=D(1+wb) …(14)
式(14)の指標値Dが用いられる場合、係数wを調整することで、サブフレームごとの利得符号のビット数の大小を調整できる。この調整は、所定時間だけ過去の時間区間(例えばサブフレーム)で得られた利得符号のビット数がインデックスの平均ビット数より小さい場合には、現在の時間区間(例えばサブフレーム)のwを予め定めた値wより小さな値とし、所定時間だけ過去の時間区間で得られた利得符号のビット数がインデックスの平均ビット数より大きい場合には、現在の時間区間のwを予め定めた値wより大きな値とすることによって可能である。
例えば、利得量子化部118は、第1サブフレームでw=wとした式(14)により求まる指標値Dを最小とするインデックスを利得符号として選択する。その結果、第1サブフレームでビット数が平均ビット数よりも小さいインデックスが利得符号として選択された場合には、残りのサブフレームに割り当てることができるビット数が平均よりも大きくなる。そこで、第2サブフレームでは、w=0.5wとした式(14)により求まる指標値Dを最小とするインデックスが利得符号として選択される。逆に第1サブフレームでビット数が平均ビット数よりも大きいインデックスが利得符号として選択された場合には、残りのサブフレームに割り当てることができるビット数が平均よりも小さくなる。そこで、第2サブフレームでは、w=2.0wとした式(14)により求まる指標値Dを最小とするインデックスが利得符号として選択される。上述した係数vを用いる場合と同様に、係数wを用いる場合も、利得量子化部118が、利得符号帳を複数個備え、各係数wの値ごとに予め定められた利得符号帳を用いて利得符号を得て出力してもよい。この場合も、利得符号帳の選択基準は、符号化装置11と復号装置12との間で同一とする(<利得量子化部118が行うベクトル量子化>の説明終わり)。
利得量子化部118で各サブフレームでの利得符号GAf1,GAf2,GAf3,GAf4が得られると、コードインデックスCf1,Cf2,Cf3,Cf4に対応するパルス系列cf1,cf2,cf3,cf4(固定符号帳113からのサンプル列)に量子化済固定符号帳利得gc1^,gc2^,gc3^,gc4^を乗算して得られるサンプル列と、サブフレームごとにピッチ周期T,T,T,Tに対応するサンプル数だけ過去の励振信号である適応信号成分v(n)(n=0,...,L−1)に量子化済ピッチ利得gp1^,gp2^,gp3^,gp4^を乗算して得られるサンプル列と、を対応するサンプル毎に加算した以下のような励振信号u'(n)(n=0,...,L−1)が、適応符号帳112に追加される。
u'(n)=gp1^×v(n)+gc1^×cf1(n)(n=Lf(0),...,Lf(1)-1)
u'(n)=gp2^×v(n)+gc2^×cf2(n)(n=Lf(1),...,Lf(2)-1)
u'(n)=gp3^×v(n)+gc3^×cf3(n)(n=Lf(2),...,Lf(3)-1)
u'(n)=gp4^×v(n)+gc4^×cf4(n)(n=Lf(3),...,Lf(4)-1)
また、線形予測情報LPC info、ピッチ周期符号CT,CT,CT,CT、コードインデックスCf1,Cf2,Cf3,Cf4、および利得符号GAf1,GAf2,GAf3,GAf4を含む「励振パラメータ」がパラメータ符号化部119に入力される。パラメータ符号化部119は、励振パラメータに対応する符号であるビットストリームBS(符号)を生成して出力する。
<復号>
符号化装置11(図1)のパラメータ符号化部119から出力されたビットストリームBSは、入力符号として復号装置12(図2)のパラメータ復号部129に入力される。パラメータ復号部129は、ビットストリームBSから得られた線形予測情報LPC info、ピッチ周期符号CT,CT,CT,CTを復号して得られたピッチ周期T',T',T',T'、コードインデックスCf1,Cf2,Cf3,Cf4、ならびに利得符号GAf1,GAf2,GAf3,GAf4を復号して得られた復号ピッチ利得gp1^,gp2^,gp3^,gp4^および復号固定符号帳利得gc1^,gc2^,gc3^,gc4^を出力する。なお、パラメータ復号部129は、符号化装置11の利得量子化部118に備えられた利得符号帳と同じ符号帳(例えば、表1)を用いて利得符号GAf1,GAf2,GAf3,GAf4を可変長復号し、復号ピッチ利得gp1^,gp2^,gp3^,gp4^および復号固定符号帳利得gc1^,gc2^,gc3^,gc4^を得る。
固定符号帳123は、固定符号帳選択部125の制御に基づき、入力されたコードインデックスCf1,Cf2,Cf3,Cf4を復号し、当該フレームに対応するパルス系列cf1,cf2,cf3,cf4を得て出力する。適応符号帳122は、入力されたピッチ周期T’,T’,T’,T’で特定される適応信号成分v’(n)(n=0,...,L−1)を出力する。
パルス系列cf1,cf2,cf3,cf4に復号固定符号帳利得gc1^,gc2^,gc3^,gc4^を乗算して得られるサンプル列と、適応信号成分v’(n)(n=0,...,L−1)に復号ピッチ利得gp1^,gp2^,gp3^,gp4^を乗算して得られるサンプル列と、を対応するサンプル毎に加算した以下のような励振信号u’(n)(n=0,...,L−1)が、適応符号帳122に追加される。
u'(n)=gp1^×v'(n)+gc1^×cf1(n)(n=Lf(0),...,Lf(1)-1)
u'(n)=gp2^×v'(n)+gc2^×cf2(n)(n=Lf(1),...,Lf(2)-1)
u'(n)=gp3^×v'(n)+gc3^×cf3(n)(n=Lf(2),...,Lf(3)-1)
u'(n)=gp4^×v'(n)+gc4^×cf4(n)(n=Lf(3),...,Lf(4)-1)
また、励振信号u’(n)(n=0,...,L−1)に、線形予測情報LPC infoによって特定される全極型の合成フィルタ127が適用され、それによって生成された合成信号x’(n)(n=0,...,L−1)が出力される。
<その他の変形例等>
本発明は上述の実施形態に限定されるものではない。例えば、上述の実施形態では、線形予測残差残差信号を固定符号帳と適応符号帳と利得符号帳を用いて符号化する、いわゆるCELP符号化における利得の符号化に本発明を適用する例を示した。しかしながら、線形予測残差信号ではなく入力音響信号そのものを符号化対象とするものであっても、音響信号ではない時系列信号を符号化対象とするものであっても、固定符号帳と適応符号帳の何れかを備えないものであっても、固定符号帳と適応符号帳の何れかを複数備えるものであっても、固定符号帳や適応符号帳を用いる符号化の代わりにその他のサンプル列の符号化方法を採用したものであっても、何らかの方法によりサンプル列に対応する符号である波形情報符号を得られる符号化方法であり、かつ、波形情報符号に対応するサンプル列に量子化された利得(以下「量子化済利得」という)を乗算して得られる波形サンプル列と入力信号とが与えられ、入力信号の可変長の利得符号を得る符号化であれば、本発明を適用できる。入力信号は、例えば時系列信号である。入力信号の例は、音響信号、映像信号、生体信号、地震波信号、センサーアレイ信号などである。入力信号は時間領域の信号であってもよいし、周波数領域の信号であってもよい。すなわち、符号化装置が、量子化済利得の候補またはその関数値とインデックスとの組が複数個格納された利得符号帳を備え、当該複数個のインデックスにはビット数が異なるものが含まれており、時間または周波数区間ごとに、指標値Dが最も小さくなるインデックスを利得符号として得てもよい。
波形情報符号とは、波形情報符号を復号することによりサンプル列を特定することが可能な符号であり、上述の実施形態におけるコードインデックスやピッチ符号やこれらを代替するような符号、たとえば、標本化・量子化されたPCM形式のサンプルを表す符号、である。指標値Dは、歪みDが大きいほど大きくなり、かつ、波形サンプル列を得るための量子化済利得の候補に対応するインデックスのビット数が大きいほど大きくなる値である。歪Dは、波形情報符号に対応するサンプル列に量子化済利得の候補を乗算して得られる波形サンプル列と入力信号との歪みであるか、または、第1から第ΓまでのΓ(Γは2以上の整数)個の、第γ(γは1以上Γ以下の整数)の波形情報符号に対応するサンプル列の各サンプルに上記第γの量子化済利得の候補を乗算して得られる第γの波形サンプル列(Γ個の波形サンプル列)、を対応するサンプル毎に加算して得られる合計波形サンプル列と、入力信号と、の歪みである。波形情報符号に対応するサンプル列は、例えば、波形情報符号を復号することにより得られるサンプル列そのものや、波形情報符号を復号することにより得られるサンプル列を、合成フィルタに通して得られたものである。例えば、指標値Dは、歪みDとインデックスのビット数が大きいほど大きくなる係数とを加算または乗算して得られる値である。インデックスのビット数が大きいほど大きくなる係数の例は、インデックスのビット数が大きいほど大きくなる値を指数に持つ、べき乗値である。指標値Dの具体例は、前述の式(4)(5)(7)(10)(11)などである。
図3に例示する符号化装置21は、Θ個の波形情報符号帳211−1,…,211−Θと符号化部212とを有する。ただし、Θは1以上の整数であり、符号化部212は利得量子化部218を含む。
利得量子化部218は、量子化済利得の候補αθまたはその関数値とインデックスとの組を複数個格納している。ただしθ=1,…,Θである。すなわち、利得量子化部218は、量子化済利得の候補αまたはその関数値、量子化済利得の候補αまたはその関数値、・・・、および量子化済利得の候補αΘまたはその関数値、ならびにインデックスからなる組を複数個格納している。すなわち、Θ=1の場合、利得量子化部218は、量子化済利得の候補αまたはその関数値とインデックスとの組を複数個格納している。Θ=Γ≧2の場合、利得量子化部218は、第1から第Γの量子化済利得の候補αγまたはその関数値の組とインデックスとの組を複数個格納している。当該複数個のインデックスにはビット数が異なるものが含まれている。
符号化部212は、時間区間ごとに、波形情報符号E,…,EΘを得、指標値Dが最も小さくなるインデックスを利得符号として得、波形情報符号E,…,EΘおよび利得符号に対応するビットストリームを出力する。インデックスの選択は、利得量子化部218によって行われる。前述のように、指標値Dは、歪みDが大きいほど大きくなり、かつ、量子化済利得の候補αθ(θ=1,…,Θ)に対応するインデックスのビット数が大きいほど大きくなる値である。ただし、図3の例の歪みDは、波形情報符号Eθに対応するサンプル列Yθのそれぞれのサンプルに量子化済利得の候補αθを乗算して得られるサンプル列αθθについてのα+…+αΘΘと、入力信号Xと、の歪みである。また、波形情報符号Eθに対応するサンプル列Yθの例は、波形情報符号Eθに対する波形情報符号帳211−θからのサンプル列を入力信号Xに対応する合成フィルタに通して得られるサンプル列や、波形情報符号Eθに対する波形情報符号帳211−θからのサンプル列などである。
図3に例示する符号化装置21は、第一実施形態の符号化装置、すなわち、図1に例示した符号化装置11を包含するものである。具体的には、図3の符号化装置21であって、Θ=2であり、かつ、波形情報符号帳211−1が固定符号帳113であり、波形情報符号帳211−2が適応符号帳112であり、利得量子化部218が利得量子化部118である構成は第一実施形態の符号化装置11そのものである。この場合は、利得量子化部218における量子化済利得の候補αは利得量子化部118における量子化済固定符号帳利得の候補βであり、利得量子化部218における量子化済利得の候補αは利得量子化部118における量子化済ピッチ利得の候補αであり、波形情報符号Eは第一実施形態のコードインデックスであり、波形情報符号Eは第一実施形態のピッチ符号であり、入力信号Xは第一実施形態の入力音響信号である。
符号化装置21に対応する復号装置は、量子化済利得の候補αθ(θ=1,…,Θ)またはその関数値とインデックスとの組を複数個格納している。これらの組は、利得量子化部218に格納された組と同一である。復号装置は、入力されたビットストリームが含む波形情報符号E,…,EΘおよび利得符号を用い、時間区間ごとに、波形情報符号Eθに対応するサンプル列Yθのそれぞれのサンプルに利得符号が表す量子化済利得の候補αθを乗算して得られるサンプル列αθθについてのサンプル列α+…+αΘΘを出力する。
上記の実施形態では、サブフレームごとに、指標値Dが最も小さくなるインデックスを利得符号として得た。しかしながら、フレームごとに、指標値Dが最も小さくなるインデックスを利得符号として得てもよいし、複数個のサブフレームまたはフレームごとに、指標値Dが最も小さくなるインデックスを利得符号として得てもよい。
その他、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
また、上述の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体の例は、非一時的な(non-transitory)記録媒体である。このような記録媒体の例は、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等である。
このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録装置に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。
上記実施形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部がハードウェアで実現されてもよい。
11,21 符号化装置
12 復号装置

Claims (24)

  1. 量子化済利得の候補またはその関数値とインデックスとの組が複数個格納された利得符号帳を備え、上記複数個のインデックスにはビット数が異なるものが含まれており、時間または周波数の区間ごとに、波形情報符号に対応するサンプル列の各サンプルに上記量子化済利得の候補を乗算して得られる波形サンプル列と、入力信号と、の歪みDが大きいほど大きくなり、かつ、上記波形サンプル列を得るための上記量子化済利得の候補に対応するインデックスのビット数が大きいほど大きくなる指標値D、が最も小さくなる上記インデックスを、利得符号として得る利得量子化部を有し、
    上記指標値D は、
    所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より小さい場合には、現在の時間区間のwを予め定めた正の値w より小さな値とし、
    上記所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より大きい場合には、上記現在の時間区間のwを予め定めた正の値w より大きな値とし、
    bを上記インデックスのビット数とした
    =D(1+wb)
    により求まる値であり、
    上記所定時間だけ過去の時間区間と上記現在の時間区間とが同一のフレームの時間区間である、符号化装置。
  2. 量子化済利得の候補またはその関数値とインデックスとの組が複数個格納された利得符号帳を備え、上記複数個のインデックスにはビット数が異なるものが含まれており、時間または周波数の区間ごとに、波形情報符号に対応するサンプル列の各サンプルに上記量子化済利得の候補を乗算して得られる波形サンプル列と、入力信号と、の歪みDが大きいほど大きくなり、かつ、上記波形サンプル列を得るための上記量子化済利得の候補に対応するインデックスのビット数が大きいほど大きくなる指標値D 、が最も小さくなる上記インデックスを、利得符号として得る利得量子化部を有し、
    上記指標値D は、
    所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より小さい場合には、現在の時間区間のvを1より小さな値とし、
    上記所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より大きい場合には、上記現在の時間区間のvを1より大きな値とし、
    bを上記インデックスのビット数とし、Nを上記時間区間の入力音響信号のサンプルの個数とした
    =D{1+v(2log2)b/N}
    により求まる値であり、
    上記所定時間だけ過去の時間区間と上記現在の時間区間とが同一のフレームの時間区間である、符号化装置。
  3. 第1から第Γ(Γは2以上の整数)の量子化済利得の候補またはその関数値の組とインデックスとの組が複数個格納された利得符号帳を備え、上記複数個のインデックスにはビット数が異なるものが含まれており、時間または周波数の区間ごとに、第1から第ΓまでのΓ個の、第γ(γは1以上Γ以下の整数)の波形情報符号に対応するサンプル列の各サンプルに上記第γの量子化済利得の候補を乗算して得られる第γの波形サンプル列、を対応するサンプル毎に加算して得られる合計波形サンプル列と、入力信号と、の歪みDが大きいほど大きくなり、かつ、上記合計波形サンプル列を得るための上記量子化済利得の候補に対応するインデックスのビット数が大きいほど大きくなる指標値D、が最も小さくなる上記インデックスを、利得符号として得る利得量子化部を有し、
    上記指標値D は、
    所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より小さい場合には、現在の時間区間のwを予め定めた正の値w より小さな値とし、
    上記所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より大きい場合には、上記現在の時間区間のwを予め定めた正の値w より大きな値とし、
    bを上記インデックスのビット数とした
    =D(1+wb)
    により求まる値であり、
    上記所定時間だけ過去の時間区間と上記現在の時間区間とが同一のフレームの時間区間である、符号化装置。
  4. 第1から第Γ(Γは2以上の整数)の量子化済利得の候補またはその関数値の組とインデックスとの組が複数個格納された利得符号帳を備え、上記複数個のインデックスにはビット数が異なるものが含まれており、時間または周波数の区間ごとに、第1から第ΓまでのΓ個の、第γ(γは1以上Γ以下の整数)の波形情報符号に対応するサンプル列の各サンプルに上記第γの量子化済利得の候補を乗算して得られる第γの波形サンプル列、を対応するサンプル毎に加算して得られる合計波形サンプル列と、入力信号と、の歪みDが大きいほど大きくなり、かつ、上記合計波形サンプル列を得るための上記量子化済利得の候補に対応するインデックスのビット数が大きいほど大きくなる指標値D 、が最も小さくなる上記インデックスを、利得符号として得る利得量子化部を有し、
    上記指標値D は、
    所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より小さい場合には、現在の時間区間のvを1より小さな値とし、
    上記所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より大きい場合には、上記現在の時間区間のvを1より大きな値とし、
    bを上記インデックスのビット数とし、Nを上記時間区間の入力音響信号のサンプルの個数とした
    =D{1+v(2log2)b/N}
    により求まる値であり、
    上記所定時間だけ過去の時間区間と上記現在の時間区間とが同一のフレームの時間区間である、符号化装置。
  5. 上記波形情報符号に対応するサンプル列は、上記波形情報符号を復号することにより得られるサンプル列を、合成フィルタに通して得られたものである、
    請求項1から4何れかの符号化装置。
  6. 所定時間区間ごとに、入力音響信号に対応する、固定符号帳からのサンプル列を特定するコードインデックス、ピッチ周期を特定するピッチ符号、および量子化済固定符号帳利得と量子化済ピッチ利得とに対応する利得符号、を得る符号化装置であって、
    量子化済固定符号帳利得の候補またはその関数値と量子化済ピッチ利得の候補またはその関数値とインデックスとの組が複数個格納された利得符号帳を備え、上記複数個のインデックスにはビット数が異なるものが含まれており、時間区間ごとに、固定符号帳からのサンプル列を合成フィルタに通して得られるサンプル列Zのそれぞれのサンプルに上記量子化済固定符号帳利得の候補βを乗算して得られるサンプル列βZと、過去の励振信号を上記合成フィルタに通して得られるサンプル列Yのそれぞれのサンプルに上記量子化済ピッチ利得の候補αを乗算して得られるサンプル列αYと、を対応するサンプル毎に加算して得られる合成信号サンプル列αY+βZと入力音響信号Xとの歪みDと、インデックスのビット数が大きいほど大きくなる係数と、を加算または乗算して得られる指標値Dが最も小さくなるインデックスを、利得符号として得る利得量子化部を有し、
    上記指標値D は、
    所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より小さい場合には、現在の時間区間のwを予め定めた正の値w より小さな値とし、
    上記所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より大きい場合には、上記現在の時間区間のwを予め定めた正の値w より大きな値とし、
    bを上記インデックスのビット数とした
    =D(1+wb)
    により求まる値であり、
    上記所定時間だけ過去の時間区間と上記現在の時間区間とが同一のフレームの時間区間である、符号化装置。
  7. 所定時間区間ごとに、入力音響信号に対応する、固定符号帳からのサンプル列を特定するコードインデックス、ピッチ周期を特定するピッチ符号、および量子化済固定符号帳利得と量子化済ピッチ利得とに対応する利得符号、を得る符号化装置であって、
    量子化済固定符号帳利得の候補またはその関数値と量子化済ピッチ利得の候補またはその関数値とインデックスとの組が複数個格納された利得符号帳を備え、上記複数個のインデックスにはビット数が異なるものが含まれており、時間区間ごとに、固定符号帳からのサンプル列を合成フィルタに通して得られるサンプル列Zのそれぞれのサンプルに上記量子化済固定符号帳利得の候補βを乗算して得られるサンプル列βZと、過去の励振信号を上記合成フィルタに通して得られるサンプル列Yのそれぞれのサンプルに上記量子化済ピッチ利得の候補αを乗算して得られるサンプル列αYと、を対応するサンプル毎に加算して得られる合成信号サンプル列αY+βZと入力音響信号Xとの歪みDと、インデックスのビット数が大きいほど大きくなる係数と、を加算または乗算して得られる指標値D が最も小さくなるインデックスを、利得符号として得る利得量子化部を有し、
    上記指標値D は、
    所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より小さい場合には、現在の時間区間のvを1より小さな値とし、
    上記所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より大きい場合には、上記現在の時間区間のvを1より大きな値とし、
    bを上記インデックスのビット数とし、Nを上記時間区間の入力音響信号のサンプルの個数とした
    =D{1+v(2log2)b/N}
    により求まる値であり、
    上記所定時間だけ過去の時間区間と上記現在の時間区間とが同一のフレームの時間区間である、符号化装置。
  8. 入力音響信号を所定時間区間ごとに符号化する装置であって、
    時間区間ごとに、上記入力音響信号に対応する線形予測係数またはこれと互換な係数を特定する符号である線形予測情報を得る線形予測分析部と、
    時間区間ごとに、固定符号帳に含まれる複数のサンプル列のうち上記入力音響信号に対応するサンプル列を特定するコードインデックスを得る固定符号帳探索部と、
    時間区間ごとに、上記入力音響信号に対応するピッチ周期を特定するピッチ符号を得る適応符号帳探索部と、
    時間区間ごとに、量子化済固定符号帳利得と量子化済ピッチ利得とに対応する利得符号を得る利得量子化部と、
    上記コードインデックスに対応する固定符号帳からのサンプル列のそれぞれのサンプルに上記量子化済固定符号帳利得を乗算して得られるサンプル列と、上記ピッチ周期に対応するサンプル数だけ過去の励振信号のサンプル列のそれぞれのサンプルに上記量子化済ピッチ利得を乗算して得られるサンプル列と、を対応するサンプル毎に加算した励振信号を格納する適応符号帳と、を少なくとも備えており、
    上記利得量子化部は、
    量子化済固定符号帳利得の候補またはその関数値と量子化済ピッチ利得の候補またはその関数値とインデックスとの組が複数個格納された利得符号帳を備え、
    上記複数個のインデックスにはビット数が異なるものが含まれており、
    時間区間ごとに、上記コードインデックスに対応する固定符号帳からのサンプル列を上記線形予測係数またはこれと互換な係数による合成フィルタに通して得られるサンプル列Zのそれぞれのサンプルに上記量子化済固定符号帳利得の候補βを乗算して得られるサンプル列βZと、上記ピッチ周期に対応するサンプル数だけ過去の励振信号を上記合成フィルタに通して得られるサンプル列Yのそれぞれのサンプルに上記量子化済ピッチ利得の候補αを乗算して得られるサンプル列αYと、を対応するサンプル毎に加算して得られる合成信号サンプル列αY+βZと入力音響信号Xとの歪みDと、インデックスのビット数が大きいほど大きくなる係数と、を加算または乗算して得られる指標値Dが最も小さくなるインデックスを、利得符号として得るものであり、
    上記指標値D は、
    所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より小さい場合には、現在の時間区間のwを予め定めた正の値w より小さな値とし、
    上記所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より大きい場合には、上記現在の時間区間のwを予め定めた正の値w より大きな値とし、
    bを上記インデックスのビット数とした
    =D(1+wb)
    により求まる値であり、
    上記所定時間だけ過去の時間区間と上記現在の時間区間とが同一のフレームの時間区間である、符号化装置。
  9. 入力音響信号を所定時間区間ごとに符号化する装置であって、
    時間区間ごとに、上記入力音響信号に対応する線形予測係数またはこれと互換な係数を特定する符号である線形予測情報を得る線形予測分析部と、
    時間区間ごとに、固定符号帳に含まれる複数のサンプル列のうち上記入力音響信号に対応するサンプル列を特定するコードインデックスを得る固定符号帳探索部と、
    時間区間ごとに、上記入力音響信号に対応するピッチ周期を特定するピッチ符号を得る適応符号帳探索部と、
    時間区間ごとに、量子化済固定符号帳利得と量子化済ピッチ利得とに対応する利得符号を得る利得量子化部と、
    上記コードインデックスに対応する固定符号帳からのサンプル列のそれぞれのサンプルに上記量子化済固定符号帳利得を乗算して得られるサンプル列と、上記ピッチ周期に対応するサンプル数だけ過去の励振信号のサンプル列のそれぞれのサンプルに上記量子化済ピッチ利得を乗算して得られるサンプル列と、を対応するサンプル毎に加算した励振信号を格納する適応符号帳と、を少なくとも備えており、
    上記利得量子化部は、
    量子化済固定符号帳利得の候補またはその関数値と量子化済ピッチ利得の候補またはその関数値とインデックスとの組が複数個格納された利得符号帳を備え、
    上記複数個のインデックスにはビット数が異なるものが含まれており、
    時間区間ごとに、上記コードインデックスに対応する固定符号帳からのサンプル列を上記線形予測係数またはこれと互換な係数による合成フィルタに通して得られるサンプル列Zのそれぞれのサンプルに上記量子化済固定符号帳利得の候補βを乗算して得られるサンプル列βZと、上記ピッチ周期に対応するサンプル数だけ過去の励振信号を上記合成フィルタに通して得られるサンプル列Yのそれぞれのサンプルに上記量子化済ピッチ利得の候補αを乗算して得られるサンプル列αYと、を対応するサンプル毎に加算して得られる合成信号サンプル列αY+βZと入力音響信号Xとの歪みDと、インデックスのビット数が大きいほど大きくなる係数と、を加算または乗算して得られる指標値D が最も小さくなるインデックスを、利得符号として得るものであり、
    上記指標値D は、
    所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より小さい場合には、現在の時間区間のvを1より小さな値とし、
    上記所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より大きい場合には、上記現在の時間区間のvを1より大きな値とし、
    bを上記インデックスのビット数とし、Nを上記時間区間の入力音響信号のサンプルの個数とした
    =D{1+v(2log2)b/N}
    により求まる値であり、
    上記所定時間だけ過去の時間区間と上記現在の時間区間とが同一のフレームの時間区間である、符号化装置。
  10. 上記利得量子化部には、利得符号帳が複数個備えられており、
    上記利得量子化部は、wの値ごとに予め定められた利得符号帳を用いて利得符号を得る、請求項1、3、6、8の何れかに記載の符号化装置。
  11. 上記利得量子化部には、利得符号帳が複数個備えられており、
    上記利得量子化部は、vの値ごとに予め定められた利得符号帳を用いて利得符号を得る、請求項2、4、7、9の何れかに記載の符号化装置。
  12. 量子化済利得の候補またはその関数値とインデックスとの組が複数個格納された利得符号帳を備え、上記複数個のインデックスにはビット数が異なるものが含まれており、時間または周波数の区間ごとに、波形情報符号に対応するサンプル列の各サンプルに上記量子化済利得の候補を乗算して得られる波形サンプル列と、入力信号と、の歪みDが大きいほど大きくなり、かつ、上記波形サンプル列を得るための上記量子化済利得の候補に対応するインデックスのビット数が大きいほど大きくなる指標値D、が最も小さくなる上記インデックスを、利得符号として得る利得量子化ステップを有し、
    上記指標値D は、
    所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より小さい場合には、現在の時間区間のwを予め定めた正の値w より小さな値とし、
    上記所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より大きい場合には、上記現在の時間区間のwを予め定めた正の値w より大きな値とし、
    bを上記インデックスのビット数とした
    =D(1+wb)
    により求まる値であり、
    上記所定時間だけ過去の時間区間と上記現在の時間区間とが同一のフレームの時間区間である、符号化方法。
  13. 量子化済利得の候補またはその関数値とインデックスとの組が複数個格納された利得符号帳を備え、上記複数個のインデックスにはビット数が異なるものが含まれており、時間または周波数の区間ごとに、波形情報符号に対応するサンプル列の各サンプルに上記量子化済利得の候補を乗算して得られる波形サンプル列と、入力信号と、の歪みDが大きいほど大きくなり、かつ、上記波形サンプル列を得るための上記量子化済利得の候補に対応するインデックスのビット数が大きいほど大きくなる指標値D 、が最も小さくなる上記インデックスを、利得符号として得る利得量子化ステップを有し、
    上記指標値D は、
    所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より小さい場合には、現在の時間区間のvを1より小さな値とし、
    上記所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より大きい場合には、上記現在の時間区間のvを1より大きな値とし、
    bを上記インデックスのビット数とし、Nを上記時間区間の入力音響信号のサンプルの個数とした
    =D{1+v(2log2)b/N}
    により求まる値であり、
    上記所定時間だけ過去の時間区間と上記現在の時間区間とが同一のフレームの時間区間である、符号化方法。
  14. 第1から第Γ(Γは2以上の整数)の量子化済利得の候補またはその関数値の組とインデックスとの組が複数個格納された利得符号帳を備え、上記複数個のインデックスにはビット数が異なるものが含まれており、時間または周波数の区間ごとに、第1から第ΓまでのΓ個の、第γ(γは1以上Γ以下の整数)の波形情報符号に対応するサンプル列の各サンプルに上記第γの量子化済利得の候補を乗算して得られる第γの波形サンプル列、を対応するサンプル毎に加算して得られる合計波形サンプル列と、入力信号と、の歪みDが大きいほど大きくなり、かつ、上記合計波形サンプル列を得るための上記量子化済利得の候補に対応するインデックスのビット数が大きいほど大きくなる指標値D、が最も小さくなる上記インデックスを、利得符号として得る利得量子化ステップを有し、
    上記指標値D は、
    所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より小さい場合には、現在の時間区間のwを予め定めた正の値w より小さな値とし、
    上記所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より大きい場合には、上記現在の時間区間のwを予め定めた正の値w より大きな値とし、
    bを上記インデックスのビット数とした
    =D(1+wb)
    により求まる値であり、
    上記所定時間だけ過去の時間区間と上記現在の時間区間とが同一のフレームの時間区間である、符号化方法。
  15. 第1から第Γ(Γは2以上の整数)の量子化済利得の候補またはその関数値の組とインデックスとの組が複数個格納された利得符号帳を備え、上記複数個のインデックスにはビット数が異なるものが含まれており、時間または周波数の区間ごとに、第1から第ΓまでのΓ個の、第γ(γは1以上Γ以下の整数)の波形情報符号に対応するサンプル列の各サンプルに上記第γの量子化済利得の候補を乗算して得られる第γの波形サンプル列、を対応するサンプル毎に加算して得られる合計波形サンプル列と、入力信号と、の歪みDが大きいほど大きくなり、かつ、上記合計波形サンプル列を得るための上記量子化済利得の候補に対応するインデックスのビット数が大きいほど大きくなる指標値D 、が最も小さくなる上記インデックスを、利得符号として得る利得量子化ステップを有し、
    上記指標値D は、
    所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より小さい場合には、現在の時間区間のvを1より小さな値とし、
    上記所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より大きい場合には、上記現在の時間区間のvを1より大きな値とし、
    bを上記インデックスのビット数とし、Nを上記時間区間の入力音響信号のサンプルの個数とした
    =D{1+v(2log2)b/N}
    により求まる値であり、
    上記所定時間だけ過去の時間区間と上記現在の時間区間とが同一のフレームの時間区間である、符号化方法。
  16. 上記波形情報符号に対応するサンプル列は、上記波形情報符号を復号することにより得られるサンプル列を、合成フィルタに通して得られたものである、
    請求項12から15の何れかの符号化方法。
  17. 所定時間区間ごとに、入力音響信号に対応する、固定符号帳からのサンプル列を特定するコードインデックス、ピッチ周期を特定するピッチ符号、および量子化済固定符号帳利得と量子化済ピッチ利得とに対応する利得符号、を得る符号化方法であって、
    量子化済固定符号帳利得の候補またはその関数値と量子化済ピッチ利得の候補またはその関数値とインデックスとの組が複数個格納された利得符号帳を備え、上記複数個のインデックスにはビット数が異なるものが含まれており、時間区間ごとに、固定符号帳からのサンプル列を合成フィルタに通して得られるサンプル列Zのそれぞれのサンプルに上記量子化済固定符号帳利得の候補βを乗算して得られるサンプル列βZと、過去の励振信号を上記合成フィルタに通して得られるサンプル列Yのそれぞれのサンプルに上記量子化済ピッチ利得の候補αを乗算して得られるサンプル列αYと、を対応するサンプル毎に加算して得られる合成信号サンプル列αY+βZと入力音響信号Xとの歪みDと、インデックスのビット数が大きいほど大きくなる係数と、を加算または乗算して得られる指標値Dが最も小さくなるインデックスを、利得符号として得る利得量子化ステップを有し、
    上記指標値D は、
    所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より小さい場合には、現在の時間区間のwを予め定めた正の値w より小さな値とし、
    上記所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より大きい場合には、上記現在の時間区間のwを予め定めた正の値w より大きな値とし、
    bを上記インデックスのビット数とした
    =D(1+wb)
    により求まる値であり、
    上記所定時間だけ過去の時間区間と上記現在の時間区間とが同一のフレームの時間区間である、符号化方法。
  18. 所定時間区間ごとに、入力音響信号に対応する、固定符号帳からのサンプル列を特定するコードインデックス、ピッチ周期を特定するピッチ符号、および量子化済固定符号帳利得と量子化済ピッチ利得とに対応する利得符号、を得る符号化方法であって、
    量子化済固定符号帳利得の候補またはその関数値と量子化済ピッチ利得の候補またはその関数値とインデックスとの組が複数個格納された利得符号帳を備え、上記複数個のインデックスにはビット数が異なるものが含まれており、時間区間ごとに、固定符号帳からのサンプル列を合成フィルタに通して得られるサンプル列Zのそれぞれのサンプルに上記量子化済固定符号帳利得の候補βを乗算して得られるサンプル列βZと、過去の励振信号を上記合成フィルタに通して得られるサンプル列Yのそれぞれのサンプルに上記量子化済ピッチ利得の候補αを乗算して得られるサンプル列αYと、を対応するサンプル毎に加算して得られる合成信号サンプル列αY+βZと入力音響信号Xとの歪みDと、インデックスのビット数が大きいほど大きくなる係数と、を加算または乗算して得られる指標値D が最も小さくなるインデックスを、利得符号として得る利得量子化ステップを有し、
    上記指標値D は、
    所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より小さい場合には、現在の時間区間のvを1より小さな値とし、
    上記所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より大きい場合には、上記現在の時間区間のvを1より大きな値とし、
    bを上記インデックスのビット数とし、Nを上記時間区間の入力音響信号のサンプルの個数とした
    =D{1+v(2log2)b/N}
    により求まる値であり、
    上記所定時間だけ過去の時間区間と上記現在の時間区間とが同一のフレームの時間区間である、符号化方法。
  19. 入力音響信号を所定時間区間ごとに符号化する方法であって、
    時間区間ごとに、上記入力音響信号に対応する線形予測係数またはこれと互換な係数を特定する符号である線形予測情報を得る線形予測ステップと、
    時間区間ごとに、固定符号帳に含まれる複数のサンプル列のうち上記入力音響信号に対応するサンプル列を特定するコードインデックスを得る固定符号帳探索ステップと、
    時間区間ごとに、上記入力音響信号に対応するピッチ周期を特定するピッチ符号を得る適応符号帳探索ステップと、
    時間区間ごとに、量子化済固定符号帳利得と量子化済ピッチ利得とに対応する利得符号を得る利得量子化ステップと、
    上記コードインデックスに対応する固定符号帳からのサンプル列のそれぞれのサンプルに上記量子化済固定符号帳利得を乗算して得られるサンプル列と、上記ピッチ周期に対応するサンプル数だけ過去の励振信号のサンプル列のそれぞれのサンプルに上記量子化済ピッチ利得を乗算して得られるサンプル列と、を対応するサンプル毎に加算した励振信号を適応符号帳に格納するステップと、を少なくとも備えており、
    量子化済固定符号帳利得またはその関数値と量子化済ピッチ利得の候補またはその関数値とインデックスとの組が複数個格納された利得符号帳を備え、
    上記複数個のインデックスにはビット数が異なるものが含まれており、
    上記利得量子化ステップは、
    時間区間ごとに、上記コードインデックスに対応する固定符号帳からのサンプル列を上記線形予測係数またはこれと互換な係数による合成フィルタに通して得られるサンプル列Zのそれぞれのサンプルに上記量子化済固定符号帳利得の候補βを乗算して得られるサンプル列βZと、上記ピッチ周期に対応するサンプル数だけ過去の励振信号を上記合成フィルタに通して得られるサンプル列Yのそれぞれのサンプルに上記量子化済ピッチ利得の候補αを乗算して得られるサンプル列αYと、を対応するサンプル毎に加算して得られる合成信号サンプル列αY+βZと入力音響信号Xとの歪みDと、インデックスのビット数が大きいほど大きくなる係数と、を加算または乗算して得られる指標値Dが最も小さくなるインデックスを、利得符号として得るものであり、
    上記指標値D は、
    所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より小さい場合には、現在の時間区間のwを予め定めた正の値w より小さな値とし、
    上記所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より大きい場合には、上記現在の時間区間のwを予め定めた正の値w より大きな値とし、
    bを上記インデックスのビット数とした
    =D(1+wb)
    により求まる値であり、
    上記所定時間だけ過去の時間区間と上記現在の時間区間とが同一のフレームの時間区間である、符号化方法。
  20. 入力音響信号を所定時間区間ごとに符号化する方法であって、
    時間区間ごとに、上記入力音響信号に対応する線形予測係数またはこれと互換な係数を特定する符号である線形予測情報を得る線形予測ステップと、
    時間区間ごとに、固定符号帳に含まれる複数のサンプル列のうち上記入力音響信号に対応するサンプル列を特定するコードインデックスを得る固定符号帳探索ステップと、
    時間区間ごとに、上記入力音響信号に対応するピッチ周期を特定するピッチ符号を得る適応符号帳探索ステップと、
    時間区間ごとに、量子化済固定符号帳利得と量子化済ピッチ利得とに対応する利得符号を得る利得量子化ステップと、
    上記コードインデックスに対応する固定符号帳からのサンプル列のそれぞれのサンプルに上記量子化済固定符号帳利得を乗算して得られるサンプル列と、上記ピッチ周期に対応するサンプル数だけ過去の励振信号のサンプル列のそれぞれのサンプルに上記量子化済ピッチ利得を乗算して得られるサンプル列と、を対応するサンプル毎に加算した励振信号を適応符号帳に格納するステップと、を少なくとも備えており、
    量子化済固定符号帳利得またはその関数値と量子化済ピッチ利得の候補またはその関数値とインデックスとの組が複数個格納された利得符号帳を備え、
    上記複数個のインデックスにはビット数が異なるものが含まれており、
    上記利得量子化ステップは、
    時間区間ごとに、上記コードインデックスに対応する固定符号帳からのサンプル列を上記線形予測係数またはこれと互換な係数による合成フィルタに通して得られるサンプル列Zのそれぞれのサンプルに上記量子化済固定符号帳利得の候補βを乗算して得られるサンプル列βZと、上記ピッチ周期に対応するサンプル数だけ過去の励振信号を上記合成フィルタに通して得られるサンプル列Yのそれぞれのサンプルに上記量子化済ピッチ利得の候補αを乗算して得られるサンプル列αYと、を対応するサンプル毎に加算して得られる合成信号サンプル列αY+βZと入力音響信号Xとの歪みDと、インデックスのビット数が大きいほど大きくなる係数と、を加算または乗算して得られる指標値D が最も小さくなるインデックスを、利得符号として得るものであり、
    上記指標値D は、
    所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より小さい場合には、現在の時間区間のvを1より小さな値とし、
    上記所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より大きい場合には、上記現在の時間区間のvを1より大きな値とし、
    bを上記インデックスのビット数とし、Nを上記時間区間の入力音響信号のサンプルの個数とした
    =D{1+v(2log2)b/N}
    により求まる値であり、
    上記所定時間だけ過去の時間区間と上記現在の時間区間とが同一のフレームの時間区間である、符号化方法。
  21. 利得符号帳が複数個備えられており、
    上記利得量子化ステップは、wの値ごとに予め定められた利得符号帳を用いて利得符号を得るステップである、請求項12、14、17、19の何れかに記載の符号化方法。
  22. 利得符号帳が複数個備えられており、
    上記利得量子化ステップは、vの値ごとに予め定められた利得符号帳を用いて利得符号を得るステップである、請求項13、15、18、20の何れかに記載の符号化方法。
  23. 請求項1から11の何れかの符号化装置としてコンピュータを機能させるためのプログラム。
  24. 請求項1から11の何れかの符号化装置としてコンピュータを機能させるためのプログラムを格納したコンピュータ読み取り可能な記録媒体。
JP2014502273A 2012-02-28 2013-02-27 符号化装置、この方法、プログラム及び記録媒体 Active JP5789816B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014502273A JP5789816B2 (ja) 2012-02-28 2013-02-27 符号化装置、この方法、プログラム及び記録媒体

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2012041527 2012-02-28
JP2012041527 2012-02-28
PCT/JP2013/055048 WO2013129439A1 (ja) 2012-02-28 2013-02-27 符号化装置、この方法、プログラム及び記録媒体
JP2014502273A JP5789816B2 (ja) 2012-02-28 2013-02-27 符号化装置、この方法、プログラム及び記録媒体

Publications (2)

Publication Number Publication Date
JPWO2013129439A1 JPWO2013129439A1 (ja) 2015-07-30
JP5789816B2 true JP5789816B2 (ja) 2015-10-07

Family

ID=49082634

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014502273A Active JP5789816B2 (ja) 2012-02-28 2013-02-27 符号化装置、この方法、プログラム及び記録媒体

Country Status (2)

Country Link
JP (1) JP5789816B2 (ja)
WO (1) WO2013129439A1 (ja)

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004020676A (ja) * 2002-06-13 2004-01-22 Hitachi Kokusai Electric Inc 音声符号化/復号化方法及び音声符号化/復号化装置
JP4727413B2 (ja) * 2005-12-21 2011-07-20 三菱電機株式会社 音声符号化・復号装置
WO2008072732A1 (ja) * 2006-12-14 2008-06-19 Panasonic Corporation 音声符号化装置および音声符号化方法
EP2077550B8 (en) * 2008-01-04 2012-03-14 Dolby International AB Audio encoder and decoder
US8392179B2 (en) * 2008-03-14 2013-03-05 Dolby Laboratories Licensing Corporation Multimode coding of speech-like and non-speech-like signals
US20120203548A1 (en) * 2009-10-20 2012-08-09 Panasonic Corporation Vector quantisation device and vector quantisation method
JP5395649B2 (ja) * 2009-12-24 2014-01-22 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置及びプログラム
IN2012DN05235A (ja) * 2010-01-08 2015-10-23 Nippon Telegraph & Telephone

Also Published As

Publication number Publication date
WO2013129439A1 (ja) 2013-09-06
JPWO2013129439A1 (ja) 2015-07-30

Similar Documents

Publication Publication Date Title
US11024319B2 (en) Encoding method, decoding method, encoder, decoder, program, and recording medium
US10056088B2 (en) Encoding method, decoding method, encoder apparatus, decoder apparatus, and recording medium for processing pitch periods corresponding to time series signals
JP5613781B2 (ja) 符号化方法、復号方法、符号化装置、復号装置、プログラム及び記録媒体
JP5596800B2 (ja) 符号化方法、周期性特徴量決定方法、周期性特徴量決定装置、プログラム
JP3143956B2 (ja) 音声パラメータ符号化方式
JP2018063458A (ja) 復号装置、及びその方法、プログラム、記録媒体
JP2019091075A (ja) 周波数領域パラメータ列生成方法、周波数領域パラメータ列生成装置、及びプログラム
KR101629661B1 (ko) 복호 방법, 복호 장치, 프로그램 및 그 기록매체
JP5789816B2 (ja) 符号化装置、この方法、プログラム及び記録媒体
JP5714172B2 (ja) 符号化装置、この方法、プログラムおよび記録媒体
JP5395649B2 (ja) 符号化方法、復号方法、符号化装置、復号装置及びプログラム
JP6053145B2 (ja) 符号化装置、復号装置、これらの方法、プログラム、および記録媒体
JP5762636B2 (ja) 符号化装置、復号装置、これらの方法、プログラム、および記録媒体
JP5786044B2 (ja) 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体
WO2013002238A1 (ja) 符号化方法、装置、プログラム及び記録媒体

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150623

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150630

R150 Certificate of patent or registration of utility model

Ref document number: 5789816

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250