JP2006295829A - 量子化装置、量子化プログラム、及び信号処理装置 - Google Patents

量子化装置、量子化プログラム、及び信号処理装置 Download PDF

Info

Publication number
JP2006295829A
JP2006295829A JP2005117360A JP2005117360A JP2006295829A JP 2006295829 A JP2006295829 A JP 2006295829A JP 2005117360 A JP2005117360 A JP 2005117360A JP 2005117360 A JP2005117360 A JP 2005117360A JP 2006295829 A JP2006295829 A JP 2006295829A
Authority
JP
Japan
Prior art keywords
quantization
vector
weighting factor
codebook
distance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005117360A
Other languages
English (en)
Inventor
Eisuke Nakasu
英輔 中須
Yukihiro Nishida
幸博 西田
Masaaki Kurozumi
正顕 黒住
Atsuro Ichigaya
敦郎 市ヶ谷
Naohiro Hara
直弘 原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP2005117360A priority Critical patent/JP2006295829A/ja
Publication of JP2006295829A publication Critical patent/JP2006295829A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】 ブロック歪を低減して低ビットレートでの品質を向上させる。
【解決手段】 画像又は音声信号を複数のサンプル毎にブロック化して得られる入力ベクトルを量子化する量子化装置において、予め設定された複数のベクトルパターンからなるコードブックと、前記入力ベクトルと前記コードブックのベクトルパターンの距離を計算するための重み係数を設定する重み係数設定手段と、前記重み係数設定手段により設定された重み係数により、前記コードブックを探索して対応するベクトルパターンを取得するベクトル量子化手段とを有し、前記重み係数設定手段は、前記サンプルに予め設定された境界からの距離に基づいて重み係数を設定することにより、上記課題を解決する。
【選択図】 図1

Description

本発明は、量子化装置、量子化プログラム、及び信号処理装置に係り、特にブロック歪を低減して低ビットレートでの品質を向上させるための量子化装置、量子化プログラム、及び信号処理装置に関する。
従来より、映像(画像)あるいは音声信号の伝送、蓄積等を行うための高能率符号化技術が各種提案されてきているが、その高能率な帯域圧縮符号化手法の1つとしてベクトル量子化(VQ:Vector Quantization)がある(例えば、非特許文献1、非特許文献2参照。)。
ベクトル量子化は、複数サンプルで構成される入力ベクトルに対し、コードブックと呼ばれる複数のベクトルパターン(コードベクトル)を送信側(量子化側)と受信側(逆量子化側)とで用意しておき、そのコードブック中の候補ベクトルから歪の最も小さいものを選択して符号化する手法である。また、複数サンプルをまとめて量子化することによって、映像あるいは音声信号を効率的に符号化することができる。
また、ブロックサイズに相当するベクトルの次数を十分大きくしていくと、理論的に符号化性能がレート歪み限界と呼ばれる情報圧縮限界に限りなく近づくことが知られている。
Allen Gersho,Robert M.Gray・古井貞煕,田崎三郎,小寺博,渡辺裕共訳、「ベクトル量子化と情報圧縮」、コロナ社、1998. K.R.Rao/P.Yip共著・安田浩,藤原洋共訳、「画像符号化技術−DCTとその国際標準−」、オーム社、1992.
しかしながら、ベクトル量子化では低ビットレートの場合、ブロック境界において顕著なブロック歪が生じるため、品質劣化の主な要因となっている。ここで、ブロック歪を低減する技術として、動画用エンコーダにおける予測ループフィルターや、デコーダ出力におけるデブロッキングフィルターがあるが、何れも低域通過フィルターの適用により画像をぼかしてしまう欠点がある。
また、音声信号等では、ブロック歪を低減するために、境界部でオーバーラップさせて符号化を行う例があるが、符号化すべきサンプル数が増加するため、符号化効率の低下を招くという欠点がある。
本発明は、上述した問題点に鑑みなされたものであり、ブロック歪を低減して低ビットレートでの品質を向上させるための量子化装置、量子化プログラム、及び信号処理装置を提供することを目的とする。
上記課題を解決するために、本件発明は、以下の特徴を有する課題を解決するための手段を採用している。
請求項1に記載された発明は、画像又は音声信号を複数のサンプル毎にブロック化して得られる入力ベクトルを量子化する量子化装置において、予め設定された複数のベクトルパターンからなるコードブックと、前記入力ベクトルと前記コードブックのベクトルパターンの距離を計算するための重み係数を設定する重み係数設定手段と、前記重み係数設定手段により設定された重み係数により、前記コードブックを探索して対応するベクトルパターンを取得するベクトル量子化手段とを有し、前記重み係数設定手段は、前記サンプルに予め設定された境界からの距離に基づいて重み係数を設定することを特徴とする。
請求項1記載の発明によれば、ブロック歪を低減して低ビットレートでの品質を向上させることができる。具体的には、コードブックのレベル数を限定する等、ベクトル量子化において低ビットレートに対応する場合に顕著となるブロック歪の低減を図ることができる。特に、次元数の大きなベクトル量子化で有効であり、大きなサイズの候補ベクトルを効果的に使用できるため、符号化効率の向上を図ることができる。
請求項2に記載された発明は、前記重み係数設定手段は、所定のデータ又は所定のブロック領域の中心からの距離に対応する予め設定される増減量を重み係数として設定することを特徴とする。
請求項2記載の発明によれば、ベクトル量子化のコードブック生成及び探索時に、各データ又はブロック領域の境界部に近いサンプルの重み付けを相対的に大きくして歪測度を評価することができる。これにより、境界部での精度を高めてブロック歪を低減することができる。
請求項3に記載された発明は、前記入力ベクトルを平均値分離し、正規化を行う平均値分離正規化手段を有し、前記重み係数設定手段は、前記平均値分離正規化手段から得られる平均値、標準偏差値、及び振幅のうち少なくとも1つを用いて、重み係数の設定を行うことを特徴とする。
請求項3記載の発明によれば、より高精度に重み係数を設定することができる。これにより、ブロック歪を低減して低ビットレートでの品質を向上させることができる。
請求項4に記載された発明は、前記コードブックは、前記重み係数設定手段により設定される重み付けされた値に基づいて、生成されることを特徴とする。
請求項4記載の発明によれば、重み付けしてブロック境界の周辺部の精度を高めて生成したコードブックを用いることにより、ブロック歪を低減して低ビットレートでも品質を向上させることができる。
請求項5に記載された発明は、画像又は音声信号を複数のサンプル毎にブロック化して得られる入力ベクトルを量子化する量子化処理をコンピュータに実行させるための量子化プログラムにおいて、予め設定された複数のベクトルパターンからなるコードブックと、前記入力ベクトルと前記コードブックのベクトルパターンの距離を計算するための重み係数を予め設定された境界からの距離に基づいて設定する重み係数設定処理と、前記重み係数設定処理により設定された重み係数により、前記コードブックを探索して対応するベクトルパターンを取得するベクトル量子化処理とをコンピュータに実行させる。
請求項5記載の発明によれば、ブロック歪を低減して低ビットレートでの品質を向上させることができる。また、実行プログラムをコンピュータにインストールすることにより、容易に本発明に係る量子化処理を実現することができる。
請求項6に記載された発明は、請求項1乃至請求項4の何れか1項に記載された量子化装置を具備した信号処理装置である。
請求項6記載の発明によれば、ブロック歪を低減して低ビットレートでの品質を向上させることができる。
本発明によれば、ブロック歪を低減して低ビットレートでの品質を向上させることができる。
以下に、上記のような特徴を有する本発明における量子化装置、量子化プログラム、及び信号処理装置を好適に実施した形態について、図面を用いて詳細に説明する。なお、以下に示す実施例については、本発明に係る量子化装置を用いた信号処理装置について説明するが、本発明における量子化装置の適用範囲はこの限りではない。
<第1の実施例>
図1は、第1の実施例における信号処理装置の概略構成の一例を示す図である。図1に示す信号処理装置10は、量子化装置11と、逆量子化装置12とを有するよう構成されている。また、量子化装置11は、ベクトル量子化手段21と、重み係数設定手段22、コードブック23とを有するよう構成されている。また、逆量子化装置12は、ベクトル逆量子化手段24と、コードブック25とを有するよう構成されている。ここで、コードブック23及びコードブック25は、予め同一のベクトルパターン(C={y,y,・・・,y})が蓄積されている。
まず、量子化装置11は、映像(画像)又は音声信号が予め設定されたサンプルに分割された入力ベクトルxを、ベクトル量子化手段21にて入力する。ベクトル入力手段21は、重み係数設定手段22により設定される重み係数を用いた歪測度に基づいて、コードブック23に予め蓄積されている複数のベクトルパターン(コードブックC)を探索して、入力ベクトルxに最も近いベクトルパターンyi(インデックスi)を選択(取得)する。
つまり、重み係数設定手段22は、コードブックを探索する際に、入力ベクトルxとコードブックのベクトルパターンの距離(適合度)を計算するときに用いる重み係数を設定する。なお、重み係数の設定手法については後述する。
また、ベクトル量子化手段21は、そのベクトルパターンに対応するインデックスiを出力する。インデックスiは、実際の映像や音声信号よりもデータ量が少なくなるため、伝送効率の向上や蓄積するときにはデータ量の削減等の効果を有する。
なお、図1では、説明を簡略化するため、量子化装置11は、インデックスiを直接逆量子化装置12に出力するものとするが、例えば、量子化装置11から逆量子化装置12までの経路上でインターネットやLAN(Local Area Network)等に代表される通信ネットワークを介して伝送されたり、量子化装置11又は逆量子化装置12の何れかにハードディスク等に代表される記録手段を設け、インデックスiを一旦蓄積し、逆量子化を行う際に記録手段から読み出すようにしてもよい。
一方、逆量子化装置12は、インデックスiをベクトル逆量子化手段24にて入力する。ベクトル逆量子化手段24は、予め設定されているコードブック25を参照してインデックスiに対応するブロック領域のベクトルを取得する。また、ベクトル逆量子化手段24は、取得したベクトルを出力ベクトルyとして出力する。この出力ベクトルyにより元の映像(画像)又は音声信号が得られる。
<第1の実施例:重み係数の設定>
ここで、重み係数設定手段22における重み係数の設定について説明する。重み係数の設定は、入力されるサンプルにおける予め設定されたデータ境界又はブロック境界からの距離に応じて、歪測度の重み係数wkを変えて設定を行う。
特に、所定のデータ又は所定のブロック領域の中心からの距離に基づいて予め設定される増分量を重み係数wkとして設定することで、ブロック境界部でのブロック歪を防止することができる。
ここで、距離に対する入力ベクトルxと、コードブックのそれぞれのパターンyiとの関係d(x,yi)は、サンプル数をkとすると以下に示す(1)式あるいは(2)式で表される。
Figure 2006295829
つまり、ベクトル量子化手段21は、(1)式で示す差分二乗和、あるいは(2)式に示す差分絶対和を歪測度としてコードブックの探索を行う。
ここで、図2は、重み係数の設定の一例を示す図である。例えば、図2(a)に示すように、重み係数設定手段22は、入力されるサンプルのデータが、例えば音声信号等のように1次元データである場合には、まずデータの中心の所定位置のデータの重み係数wkを1.0とする。なお、1.0は、重み係数を付加していないことを示す。次に、中心のデータから所定の間隔毎に除々に増分値を上げ、歪測度の重み係数wkを1.2,1.4,・・・と設定する。
また、図2(b)に示すように入力されるサンプルのデータが、例えば映像信号(画像信号)等のように2次元ブロックである場合には、そのデータ領域の中心の重み係数wkを1.0とし、中心からの距離が周囲方向に離れていくにしたがって所定の間隔毎に除々に増分値を上げ、歪測度の重み係数wkを1.2,1.4,・・・と設定する。
これにより、データ境界又はブロック境界からの距離に応じて歪測度の重み係数を変えて設定することができる。なお、図2に示す重み係数wkの設定は一例であり、例えば重みを与える中心位置からの距離の範囲や重み係数の値はこれに限定されるものではない。具体的には、例えば動画符号化において、空間−時間の3次元データに対しても同じように適用することができる。また、増分に限定されず、例えば、中心位置から所定の距離が離れる毎に0.8,0.6,・・・と重み係数が減少するように設定してもよい。
上述した第1の実施例により、ブロック歪を低減して低ビットレートでの品質を向上させることができる。具体的には、コードブックのレベル数を限定する等、ベクトル量子化において低ビットレートに対応する場合に顕著となるブロック歪の低減を図ることができる。特に、次元数の大きなベクトル量子化で有効であり、大きなサイズの候補ベクトルを効果的に使用できるため、符号化効率の向上を図ることができる。
<第2の実施例>
次に、第2の実施例について、図を用いて説明する。図3は、第2の実施例における信号処理装置の概略構成の一例を示す図である。図2に示す信号処理装置30は、量子化装置31と、逆量子化装置32とを有するよう構成されている。また、量子化装置31は、平均値分離正規化手段41と、スカラー量子化手段42と、ベクトル量子化手段43と、重み係数設定手段44と、コードブック45とを有するよう構成されている。また、逆量子化装置32は、スカラー逆量子化手段46と、ベクトル逆量子化手段47と、平均値加算逆正規化手段48と、コードブック49とを有するよう構成されている。ここで、コードブック44及びコードブック49は、予め同一のベクトルパターン(C={y,y,・・・,y})が蓄積されている。
第2の実施例では、入力ベクトルxを平均値分離し、標準偏差や振幅等により正規化した後にベクトル量子化を行う例である。つまり、ブロック平均値、標準偏差値、及び振幅のうち少なくとも1つの値に応じて重み係数を変え、その重み係数を用いた歪測度に基づいて入力ベクトルに最も近いコードブックを探索する。
これにより、入力ベクトルのデータの内容に対応した重み係数を設定できるため、より高精度に重み係数を設定することができる。なお、平均値分離正規化を用いたベクトル量子化の場合、例えば入力ベクトルxを平均値0、標準偏差1に正規化してスカラーとベクトルとに分解して量子化を行う。
まず、量子化装置31は、映像(画像)又は音声信号が予め設定されたサンプルに分割された入力ベクトルxを平均値分離正規化手段41にて入力する。平均値分離正規化手段41は、上述した入力ベクトルxを平均値分離し、正規化を行う。ここで、正規化する値σは、以下に示す(3)式、(4)式の標準偏差を用いることができる。
Figure 2006295829
ここで、Kは次元数を示し、kはサンプル数を示し、μは平均値を示している。
また、以下に示すように、正規化する値をσとして、標準偏差の他にも、例えば(5)式に示すように振幅を用いることもできる。
Figure 2006295829
次に、平均値分離正規化手段41は、正規化されたベクトルをスカラー量子化手段42、ベクトル量子化手段43、及び重み係数設定手段44に出力する。スカラー量子化手段42は、それぞれのデータを独立に量子化を行う。つまり、スカラー量子化手段42は、入力に対し予め設定された有限の量子化レベルのうち最も近い量子化レベルを割り当てる。また、スカラー量子化手段42は、量子化されたデータを出力する。
また、ベクトル量子化手段43は、重み係数設定手段44により設定される重み係数を用いた歪測度に基づいてコードブック45に予め蓄積されている複数のベクトルパターンC(コードベクトル)を探索し、対応する最も近いベクトルパターン(インデックスi)を選択(取得)する。また、ベクトル量子化手段43は、そのベクトルパターンに対応するインデックスiを出力する。
重み係数設定手段44は、平均値分離正規化手段41から得られる平均値や標準偏差等の値に基づいて、上述した第1の実施例における重み係数の設定手法を適用して重み係数の設定を行う。つまり、予め設定されたデータ境界又はブロック境界からの距離に応じて、歪測度の重み係数wkを変えて設定を行う。
特に、所定のデータ又は所定のブロック領域の中心からの距離に基づいて予め設定される増分量を重み係数wkとして設定することで、ブロック境界部でのブロック歪を防止することができる。また、入力ベクトルに対して均一に高精度な重み係数を設定することができる。
ここで、スカラー量子化手段42からの出力と、ベクトル量子化手段43からの出力は、上述したように実際の映像や音声信号よりもデータ量が少なくなるため、伝送効率の向上や蓄積するときにはデータ量の削減等の効果を有する。
なお、図3では、説明を簡略化するため、量子化装置31は、それぞれのデータを直接逆量子化装置32に出力するものとするが、例えば、量子化装置31から逆量子化装置32までの経路上でインターネットやLAN等に代表される通信ネットワークを介して伝送されたり、量子化装置31又は逆量子化装置32の何れかにハードディスク等に代表される記録手段を設け、量子化装置31からの信号を一旦蓄積し、逆量子化を行う際に記録手段から読み出すようにしてもよい。
一方、逆量子化装置32では、スカラー量子化手段42からの出力データをスカラー逆量子化手段46にて入力し、ベクトル量子化手段43からのインデックスiをベクトル逆量子化手段47にて入力する。
スカラー逆量子化手段46は、入力データに対して逆量子化を行う。また、スカラー逆量子化手段46は、逆量子化されたデータを平均値加算逆正規化手段48に出力する。
ベクトル逆量子化手段47は、予め設定されているコードブック49を参照してインデックスiに対応するブロック領域のベクトルを取得する。また、ベクトル逆量子化手段47は、取得したベクトルを平均値加算逆正規化手段48に出力する。
平均値加算逆正規化手段48は、スカラー逆量子化手段46から得られる平均値データ及びベクトル逆量子化手段47により得られる平均値データのそれぞれを加算して逆正規化を行う。また、平均値加算逆正規化手段48は、出力ベクトルをyとして出力する。この出力ベクトルyにより元の映像(画像)又は音声信号が得られる。
上述した第2の実施例により、より高精度に重み係数を設定することができる。これにより、ブロック歪を低減して低ビットレートでの品質を向上させることができる。具体的には、コードブックのレベル数を限定する等、ベクトル量子化において低ビットレートに対応する場合に顕著となるブロック歪の低減を図ることができる。特に、次元数の大きなベクトル量子化で有効であり、大きなサイズの候補ベクトルを効果的に使用できるため、符号化効率の向上を図ることができる。
ここで、上述した第1及び第2の実施例に示されているコードブックは、重み付けが設定されていないコードブックを用いているが、例えば重み係数設定手段により設定される重み付けされた歪測度を用いて予めコードブックを生成しておいてもよい。また、このときのコードブックの生成は、例えばLBGアルゴリズム等を用いることができる。
LBGアルゴリズムによる手法は、予め与えた初期コードブックをトレーニングセットと呼ばれる入力ベクトルデータに対して最適になるように逐次的にコードブックの更新を繰り返す収束計算を用いた設計手法である。したがって、この手法により重み係数設定手段で設定される歪測度に基づいてコードブックを更新することができる。
なお、歪測度に基づいてコードブックを生成する手法については、LBGアルゴリズムに限定されることなく、例えば上述の量子化装置にコードブック更新手段等を設け、歪測度に基づいてコードブックを更新する処理を行ってもよい。
これにより、予め重み付けされたコードブックを生成しておくことにより、容易にブロック歪を低減して低ビットレートでの品質を向上させることができる。
<量子化プログラム>
ここで、本発明における信号処理装置10,30は、上述した専用の装置構成等を用いて本発明における量子化処理を行うこともできるが、各構成における処理をコンピュータに実行させることができる実行プログラムを生成し、例えば、汎用のパーソナルコンピュータ、ワークステーション等にそのプログラムをインストールすることにより、量子化処理を実現することができる。
<ハードウェア構成>
ここで、本発明におけるベクトル量子化処理が実行可能なコンピュータのハードウェア構成例について図を用いて説明する。図4は、本発明における量子化処理が実現可能なハードウェア構成の一例を示す図である。
図4におけるコンピュータ本体には、入力装置51と、出力装置52と、ドライブ装置53と、補助記憶装置54と、メモリ装置55と、各種制御を行うCPU(Central Processing Unit)56と、ネットワーク接続装置57とを有するよう構成されており、これらはシステムバスBで相互に接続されている。
入力装置51は、ユーザが操作するキーボード及びマウス等のポインティングデバイスを有しており、ユーザからのプログラムの実行等、各種操作信号を入力する。出力装置52は、本発明における処理を行うためのコンピュータ本体を操作するのに必要な各種ウィンドウやデータ等を表示するディスプレイを有し、CPU56が有する制御プログラムにより量子化処理における実行経過や結果等を表示することができる。
ここで、本発明において、コンピュータ本体にインストールされる実行プログラムは、例えば、CD−ROM等の記録媒体58等により提供される。プログラムを記録した記録媒体58は、ドライブ装置53にセット可能であり、記録媒体58に含まれる実行プログラムが、記録媒体58からドライブ装置53を介して補助記憶装置54にインストールされる。
補助記憶装置54は、ハードディスク等のストレージ手段であり、本発明における実行プログラムや、コンピュータに設けられた制御プログラム等を蓄積し必要に応じて入出力を行うことができる。
CPU56は、OS(Operating System)等の制御プログラム、及びメモリ装置55により読み出され格納されている実行プログラムに基づいて、各種演算や各ハードウェア構成部とのデータの入出力等、コンピュータ全体の処理を制御して、量子化処理における各処理を実現することができる。プログラムの実行中に必要な各種情報等は、補助記憶装置54から取得することができ、また格納することもできる。
ネットワーク接続装置57は、通信ネットワーク等と接続することにより、実行プログラムを通信ネットワークに接続されている他の端末等から取得したり、プログラムを実行することで得られた実行結果又は本発明における実行プログラムを他の端末等に提供することができる。
上述したようなハードウェア構成により、特別な装置構成を必要とせず、低コストで上述した量子化処理を実現することができる。また、プログラムをインストールすることにより、容易に量子化処理を実現することができる。
次に、本発明に係る実行プログラムにおける量子化処理手順についてフローチャートを用いて説明する。
<第1の量子化処理手順>
図5は、本発明における第1の量子化処理を示すフローチャートである。なお、後述する処理においては、上述した第1の実施例に対応する量子化処理である。
映像(画像)又は音声信号が予め設定されたサンプルに分割された入力ベクトルを取得し(S01)、重み係数の設定を行う(S02)。なお、重み係数は、上述したように入力されるサンプルの予め設定されたブロック境界からの距離に応じて歪測度の重み係数を変えて設定を行う。特に、所定のデータ又は所定のブロック領域の中心からの距離に基づいて予め設定される増分量を重み係数として設定する。
次に、S02にて得られる重み係数を基準値としてコードブックに予め蓄積されている複数のベクトルパターン(コードベクトル)を探索し(S03)、対応する最も近いベクトルパターン(インデックス)を選択して(S04)、選択されたインデックスを出力する(S05)。
また、未処理の入力ベクトルが存在するかを判断し(S06)、未処理の入力ベクトルが存在する場合(S06において、YES)、S01に戻り、未処理の入力ベクトルが存在しなくなるまで次の未処理の入力ベクトルを取得し、上述した処理を繰り返し行う。また、未処理の入力ベクトルが存在しない場合(S06にて、NO)、量子化処理を終了する。
上述した第1のベクトル量子化処理手順により得られるインデックスに基づいて逆量子化を行うことにより、ブロック歪を低減して低ビットレートでの品質を向上させることができる。具体的には、コードブックのレベル数を限定する等、ベクトル量子化において低ビットレートに対応する場合に顕著となるブロック歪の低減を図ることができる。特に、次元数の大きなベクトル量子化で有効であり、大きなサイズの候補ベクトルを効果的に使用できるため、符号化効率の向上を図ることができる。また、実行プログラムをコンピュータにインストールすることにより、容易に本発明に係る量子化処理を実現することができる。
<第2の量子化処理手順>
図6は、本発明における第2の量子化処理を示すフローチャートである。なお、後述する処理においては、上述した第2の実施例に対応する量子化処理である。
映像(画像)又は音声信号が予め設定されたサンプルに分割された入力ベクトルを取得する(S11)。また、入力ベクトルを平均値分離し(S12)、正規化を行う(S13)。次に、正規化されたデータに基づいて、スカラー量子化を行う(S14)。一方で、S13により正規化されたデータに基づいて、上述したように重み係数を設定し(S15)、S15にて得られる重み係数を基準値としてコードブックに予め蓄積されている複数のベクトルパターン(コードベクトル)を探索し(S16)、対応する最も近いベクトルパターン(インデックス)を選択する(S17)。次に、S14にて得られるスカラー量子化データと、S17により得られるベクトル量子化データを出力する(S18)。
また、未処理の入力ベクトルが存在するかを判断し(S19)、未処理の入力ベクトルが存在する場合(S19において、YES)、S11に戻り、未処理の入力ベクトルが存在しなくなるまで次の未処理の入力ベクトルを取得し、上述した処理を繰り返し行う。また、未処理の入力ベクトルが存在しない場合(S19にて、NO)、量子化処理を終了する。
上述した第2の量子化処理手順により、より高精度に重み係数を設定することができる。これにより、ブロック歪を低減して低ビットレートでの品質を向上させることができる。また、実行プログラムをコンピュータにインストールすることにより、容易に本発明に係る量子化処理を実現することができる。
上述したように本発明によれば、ブロック歪を低減して低ビットレートでの品質を向上させることができる。具体的には、コードブックのレベル数を限定する等、ベクトル量子化において低ビットレートに対応する場合に顕著となるブロック歪の低減を図ることができる。特に、次元数の大きなベクトル量子化で有効であり、大きなサイズの候補ベクトルを効果的に使用できるため、符号化効率の向上を図ることができる。なお、本発明は、形状・利得ベクトル量子化においても適用することができる。
以上本発明の好ましい実施例について詳述したが、本発明は係る特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形、変更が可能である。
第1の実施例における信号処理装置の概略構成の一例を示す図である。 重み係数の設定の一例を示す図である。 第2の実施例における信号処理装置の概略構成の一例を示す図である。 本発明におけるベクトル量子化処理が実現可能なハードウェア構成の一例を示す図である。 本発明における第1のベクトル量子化処理を示すフローチャートである。 本発明における第2のベクトル量子化処理を示すフローチャートである。
符号の説明
10,30 信号処理装置
11,31 量子化装置
12,32 逆量子化装置
21,43 ベクトル量子化手段
22,44 重み係数設定手段
23,25,45,49 コードブック
24,47 ベクトル逆量子化手段
41 平均値分離正規化手段
42 スカラー量子化手段
46 スカラー逆量子化手段
48 平均値加算逆正規化手段

Claims (6)

  1. 画像又は音声信号を複数のサンプル毎にブロック化して得られる入力ベクトルを量子化する量子化装置において、
    予め設定された複数のベクトルパターンからなるコードブックと、
    前記入力ベクトルと前記コードブックのベクトルパターンの距離を計算するための重み係数を設定する重み係数設定手段と、
    前記重み係数設定手段により設定された重み係数により、前記コードブックを探索して対応するベクトルパターンを取得するベクトル量子化手段とを有し、
    前記重み係数設定手段は、前記サンプルに予め設定された境界からの距離に基づいて重み係数を設定することを特徴とする量子化装置。
  2. 前記重み係数設定手段は、
    所定のデータ又は所定のブロック領域の中心からの距離に対応する予め設定される増減量を重み係数として設定することを特徴とする請求項1に記載の量子化装置。
  3. 前記入力ベクトルを平均値分離し、正規化を行う平均値分離正規化手段を有し、
    前記重み係数設定手段は、前記平均値分離正規化手段から得られる平均値、標準偏差値、及び振幅のうち少なくとも1つを用いて、重み係数の設定を行うことを特徴とする請求項1又は2に記載の量子化装置。
  4. 前記コードブックは、
    前記重み係数設定手段により設定される重み付けされた値に基づいて、生成されることを特徴とする請求項1乃至3の何れか1項に記載の量子化装置。
  5. 画像又は音声信号を複数のサンプル毎にブロック化して得られる入力ベクトルを量子化する量子化処理をコンピュータに実行させるための量子化プログラムにおいて、
    予め設定された複数のベクトルパターンからなるコードブックと、前記入力ベクトルと前記コードブックのベクトルパターンの距離を計算するための重み係数を予め設定された境界からの距離に基づいて設定する重み係数設定処理と、
    前記重み係数設定処理により設定された重み係数により、前記コードブックを探索して対応するベクトルパターンを取得するベクトル量子化処理とをコンピュータに実行させるための量子化プログラム。
  6. 請求項1乃至請求項4の何れか1項に記載された量子化装置を具備した信号処理装置。
JP2005117360A 2005-04-14 2005-04-14 量子化装置、量子化プログラム、及び信号処理装置 Pending JP2006295829A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005117360A JP2006295829A (ja) 2005-04-14 2005-04-14 量子化装置、量子化プログラム、及び信号処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005117360A JP2006295829A (ja) 2005-04-14 2005-04-14 量子化装置、量子化プログラム、及び信号処理装置

Publications (1)

Publication Number Publication Date
JP2006295829A true JP2006295829A (ja) 2006-10-26

Family

ID=37415865

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005117360A Pending JP2006295829A (ja) 2005-04-14 2005-04-14 量子化装置、量子化プログラム、及び信号処理装置

Country Status (1)

Country Link
JP (1) JP2006295829A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008067766A1 (fr) * 2006-12-05 2008-06-12 Huawei Technologies Co., Ltd. Procédé et dispositif de quantification d'un vecteur
JP2011193305A (ja) * 2010-03-16 2011-09-29 Yahoo Japan Corp データ処理装置、データ処理方法及びプログラム

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62234424A (ja) * 1986-04-04 1987-10-14 Mitsubishi Electric Corp 木探索ベクトル量子化器
JPH03222521A (ja) * 1990-01-29 1991-10-01 Matsushita Electric Ind Co Ltd ベクトル量子化装置
JPH06118998A (ja) * 1992-10-01 1994-04-28 Matsushita Electric Ind Co Ltd ベクトル量子化装置
JPH07107294A (ja) * 1993-09-30 1995-04-21 Toshiba Corp 画像符号化装置
JPH07111456A (ja) * 1993-10-08 1995-04-25 Takayama:Kk 音声圧縮方法および装置
JPH07288474A (ja) * 1994-04-20 1995-10-31 Matsushita Electric Ind Co Ltd ベクトル量子化符号化装置と復号化装置
JPH08110799A (ja) * 1994-10-07 1996-04-30 Nippon Telegr & Teleph Corp <Ntt> ベクトル量子化方法及びその復号化器
JPH08123500A (ja) * 1994-10-24 1996-05-17 Matsushita Electric Ind Co Ltd ベクトル量子化装置
JPH08185200A (ja) * 1994-12-28 1996-07-16 Nippon Telegr & Teleph Corp <Ntt> 重み付きベクトル量子化法
JPH08292797A (ja) * 1995-04-20 1996-11-05 Nec Corp 音声符号化装置
JP2003188733A (ja) * 2001-10-30 2003-07-04 Oplayo Oy 符号化方法及び装置

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62234424A (ja) * 1986-04-04 1987-10-14 Mitsubishi Electric Corp 木探索ベクトル量子化器
JPH03222521A (ja) * 1990-01-29 1991-10-01 Matsushita Electric Ind Co Ltd ベクトル量子化装置
JPH06118998A (ja) * 1992-10-01 1994-04-28 Matsushita Electric Ind Co Ltd ベクトル量子化装置
JPH07107294A (ja) * 1993-09-30 1995-04-21 Toshiba Corp 画像符号化装置
JPH07111456A (ja) * 1993-10-08 1995-04-25 Takayama:Kk 音声圧縮方法および装置
JPH07288474A (ja) * 1994-04-20 1995-10-31 Matsushita Electric Ind Co Ltd ベクトル量子化符号化装置と復号化装置
JPH08110799A (ja) * 1994-10-07 1996-04-30 Nippon Telegr & Teleph Corp <Ntt> ベクトル量子化方法及びその復号化器
JPH08123500A (ja) * 1994-10-24 1996-05-17 Matsushita Electric Ind Co Ltd ベクトル量子化装置
JPH08185200A (ja) * 1994-12-28 1996-07-16 Nippon Telegr & Teleph Corp <Ntt> 重み付きベクトル量子化法
JPH08292797A (ja) * 1995-04-20 1996-11-05 Nec Corp 音声符号化装置
JP2003188733A (ja) * 2001-10-30 2003-07-04 Oplayo Oy 符号化方法及び装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008067766A1 (fr) * 2006-12-05 2008-06-12 Huawei Technologies Co., Ltd. Procédé et dispositif de quantification d'un vecteur
US8335260B2 (en) 2006-12-05 2012-12-18 Huawei Technologies Co., Ltd. Method and device for vector quantization
JP2011193305A (ja) * 2010-03-16 2011-09-29 Yahoo Japan Corp データ処理装置、データ処理方法及びプログラム

Similar Documents

Publication Publication Date Title
US8666179B2 (en) Image encoding apparatus and decoding apparatus
US20040233991A1 (en) Video encoding apparatus, video encoding method, video encoding program, video decoding apparatus, video decoding method and video decoding program
US20030058943A1 (en) Dictionary generation method for video and image compression
US20110299788A1 (en) Image encoding and decoding device
JPWO2011099080A1 (ja) 画像符号化装置及び画像復号装置
CN1697328A (zh) 快速视频编解码变换实现
JP2010199959A (ja) 画像符号化装置,画像符号化方法および画像符号化プログラム
WO2002054757A1 (fr) Procede, dispositif et programme de codage de donnees
US20180061428A1 (en) Variable length coding of indices and bit scheduling in a pyramid vector quantizer
CN113795869B (zh) 神经网络模型处理方法、装置和介质
US11749295B2 (en) Pitch emphasis apparatus, method and program for the same
CN115668777A (zh) 用于改进的机器学习压缩的***和方法
JP2006295829A (ja) 量子化装置、量子化プログラム、及び信号処理装置
US9319645B2 (en) Encoding method, decoding method, encoding device, decoding device, and recording medium for a plurality of samples
JP2008519308A (ja) 信号特性を用いた効率的なオーディオ符号化
JP2005124001A (ja) 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、動画像復号装置、動画像復号方法、及び動画像復号プログラム
JP2022078735A (ja) 画像処理装置、画像処理プログラム、画像認識装置、画像認識プログラム及び画像認識システム
US20240048703A1 (en) Encoding device, decoding device, encoding method, decoding method, and program
JP6368287B2 (ja) 適応量子化方法、適応量子化装置及び適応量子化プログラム
CN112639832A (zh) 识别生成网络的显著特征
JP5561611B2 (ja) 画像符号化方法,画像符号化装置および画像符号化プログラム
WO2011087333A2 (ko) 오디오 신호 처리 방법 및 장치
JP2002077920A (ja) 画像圧縮装置及び画像圧縮方法
JP4649770B2 (ja) 画像データ処理装置および方法、記録媒体、並びにプログラム
JP4438655B2 (ja) 符号化装置、復号装置、符号化方法及び復号方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080122

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100112

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100518