JP4003410B2 - 符号化選択装置および符号化装置ならびにその方法 - Google Patents

符号化選択装置および符号化装置ならびにその方法 Download PDF

Info

Publication number
JP4003410B2
JP4003410B2 JP2001175939A JP2001175939A JP4003410B2 JP 4003410 B2 JP4003410 B2 JP 4003410B2 JP 2001175939 A JP2001175939 A JP 2001175939A JP 2001175939 A JP2001175939 A JP 2001175939A JP 4003410 B2 JP4003410 B2 JP 4003410B2
Authority
JP
Japan
Prior art keywords
encoding
code amount
data
prediction
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001175939A
Other languages
English (en)
Other versions
JP2002369198A (ja
Inventor
太郎 横瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2001175939A priority Critical patent/JP4003410B2/ja
Publication of JP2002369198A publication Critical patent/JP2002369198A/ja
Application granted granted Critical
Publication of JP4003410B2 publication Critical patent/JP4003410B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は圧縮の選択技術に関するものであり、特に簡易に可逆符号化と非可逆符号化の選択を行う装置に関するものである。
【0002】
【従来の技術】
画像データは一般にデータ量が膨大になるので、通信、蓄積などを行う際には圧縮してデータ量を削減することが多い。また画像以外の用途でも、特に大きなデータ量を扱う場合には圧縮技術は不可欠の技術といっていい。
【0003】
圧縮を行うための符号化技術には、いくつもの手法が存在する。大別すれば、復号したときに入力を完全に再現する可逆方式と、何らかの損失を伴う非可逆方式がある。さらにこの2つの方式を基本的アルゴリズムやパラメータなどで分類すれば、いくつもの手法に細分できる。これらの圧縮手法を、以下では符号化と称する。
【0004】
このようなさまざまな符号化は、同一の入力であってもそれぞれ異なる符号量を出力する。これを仮に符号化の入力依存性と呼ぶ。どの入力に対しても効率よく圧縮できるような、単一の符号化は原理的に存在しない。そこで、入力依存性を排したシステムが必要な場合には、入力に応じて符号化を使い分ける機構が必要になる。
【0005】
このようなシステムでは事前に符号量を予測して符号化を選択するか、全ての符号化で圧縮してみて符号量を確かめてから選択するかの2つの方法が考えられる。後者は正確だが負荷が重いので、一般的なシステムには向かない。ここにおいて符号化の選択技術は符号量の予測技術に依存することになる。
【0006】
一般に符号量の予測は難しい。特にDCT(Discrete CosineTransform、離散コサイン変換)を使った国際標準JPEG(Joint Photographic Experts Group)のような変換符号化の場合、変換処理なしに符号量を推定することは不可能に近い。これは変換符号化は変換後のデータを符号化対象とするためである。
【0007】
そこでこのような変換符号化を含めた2種類の符号化を選択する従来技術である特開平10−243388号公報の手法を従来例として説明する。この従来例は変換結果を分析することによって、変換符号化と可逆符号化のうちから、最適な符号化を選択する技術である。
【0008】
なお、従来例では非可逆符号化を選択したとき画質が劣化しやすい画像がある旨記述されている。本発明では画質についての観点は持たないので、一見従来例と目的が違うように思われるかもしれない。しかし非可逆符号化では一般に画質と符号量がトレードオフの関係にあることを考えると、従来例が問題としているケースは非可逆符号化で画質を維持しようとしたときの符号量増加の問題でもあることがわかる。つまり、従来例が問題としている点を符号量の問題としてとらえることが可能であり、その場合は本発明が関わる問題と本質的に同一なのである。
【0009】
図11は従来例の符号化選択装置の構成例である。本発明の説明の趣旨に沿うように用語を一部変更しているが、従来例の手法の本質に関わるものではない。図中、10はデータ入力部、30は第1の符号量推定部、40は符号化選択部、50は選択結果出力部、1010はA/D変換器、1020はフレームメモリ、3010はラスターブロック変換部、3020はDCT変換部、110は入力データ、132はブロックデータ、133はDCTデータ、140は選択結果データである。
【0010】
図11の各部について説明する。図11の符号化選択装置は以下の構成よりなる。A/D変換器1010は外部からデータを受け取り、入力データ110としてフレームメモリ1020へ送出する。フレームメモリ1020は入力データ110の全体を格納してから、改めて入力データ110としてラスターブロック変換部3010へ送出する。ラスターブロック変換部3010は入力データのスキャン順を変換してブロック分割を行い、これをブロックデータ132としてDCT変換部3020へ送出する。DCT変換部3020はブロックデータ132にDCT処理を行い、DCTデータ133として符号化選択部40へ送出する。符号化選択部40はDCTデータ133に基づいて最適な符号化を選択し、これを選択結果データ140として選択結果出力部50に送出する。選択結果出力部50は外部に選択結果データ140を送出する。
【0011】
以上の構成の中で、選択結果出力部50は従来例の記載に含まれないが、説明の都合上追加した。また符号化選択部40は従来例では圧縮方式判定器という名前であるが、これも説明の都合上変更した。また従来例には実際の符号化を行う手段も含まれているが、これも従来例の特徴を明瞭にするために便宜上省略した。
【0012】
以上の構成に基づいた従来例の動作について説明する。図12は従来例の符号化選択装置の動作を示すフローチャートである。以下、図12を用いて従来例の動作について説明する。
【0013】
S10ではA/D変換器1010およびフレームメモリ1020においてデータの入力を行う。S31ではラスターブロック変換部3010においてブロック分割を行う。S32ではDCT変換部3020においてDCT処理を行う。S40では符号化選択部40において符号化選択を行う。S50では選択結果出力部50において選択結果の出力を行う。
【0014】
以上の動作の中で、符号化選択部40における符号化選択はDCTデータ133の周波数分布を分析して画像の性質を判別し、最適と思われる符号化を選択する。具体的には高周波成分の量を評価することによって、DCTによる変換符号化とDPCM(Differential Pulse Code Modulation)による可逆符号化を自動的に切り替える。従来例では高周波成分の多い画像ではDCTによる圧縮率を高くすることができないと記述している。これは本発明の観点からすれば、符号量こそ求めていないものの、大まかな符号量予測と同等の処理をしているに他ならない。
【0015】
次に従来例の問題点について述べる。画像圧縮処理の中でも、DCT処理は比較的重い処理である。例えば従来例で選択対象となっているDPCMは1画素につき1度の減算しか必要ないのに対して、8×8のDCTで原理的には1画素あたり16回の乗算と14回の加算を必要とする。実装上の工夫でこの値は減らすことができるが、それでもDPCMに比べると圧倒的に処理が重い。さらにDCTの対象となるブロックを切り出すためにブロックラインメモリが必要となるので、この点でも規模の大きい処理装置が必要となる。
【0016】
従来点の問題は結果的にDPCMが選ばれる画像に対しても、この重いDCT処理を行わなければならない点である。これは符号化の選択にDCT処理の結果を必要とすることに起因する。冒頭に述べたように本発明の観点から言えば、実際に符号量を求めることなしに符号化を切り替えるのは処理負荷を軽くするためであり、これを実現するためにDCT処理を行うのは目的に矛盾する。
【0017】
【発明が解決しようとする課題】
以上で述べてきたように、従来例の問題点として、実際の符号化処理に比較して符号化選択処理そのものの負荷が重くなってしまうことがあげられる。
【0018】
本発明は上述の事情に鑑みてなされたもので、符号化処理に比較して処理の十分軽い符号量予測処理ならびに符号化選択処理を提供することを目的とする。
【0019】
【課題を解決するための手段】
本発明によれば上述の目的を達成するために特許請求の範囲に記載のとおりの構成を採用している。ここでは、特許請求の範囲の記載内容について補充的に説明を行う。
【0020】
本発明の一側面によれば、符号化選択装置において、入力データを入力するデータ入力手段と、上記データ入力手段により入力したデータに基づき少なくとも1つ以上の所定の符号化に関して符号量を推定する第1の符号量推定手段と、少なくとも1つ以上の所定の符号化に関して符号量を推定する第2の符号量推定手段と、上記第1の符号量推定手段および上記第2の符号量推定手段によって推定された符号量の比較に基づいて符号化方式を決定する符号化選択手段と、上記符号化選択手段の結果を外部へ出力する選択結果出力手段とを具備し、上記第2の符号量推定手段における符号量推定処理は上記入力データと無関係に行うようにしている。
【0021】
この構成においては、上記第2の符号量推定手段による符号量推定処理は上記入力データの性質と無関係であるので軽い処理で行うことができる。たとえば、可逆符号化と変換符号化(非可逆符号化)とを選択する場合を考える。この場合、変換符号化の従来の符号量荷推定手法は高い負荷である反面、その符号量は、可逆符号化に比べ入力データの性質に対して比較的安定している。可逆符号化の従来の符号量推定は比較的小さな負荷で済む反面、その符号量は、入力データの性質に対して大幅に変化する。したがって、可逆符号化については通常の符号量推定を行い、変換符号化については入力データに依存しない推定を行い、負荷を抑えながら符号量が増加するのを抑えることができる。
【0022】
また、この構成においては、符号化パラメータを入力するパラメータ入力手段をさらに設け、上記第2の符号量推定手段は上記入力データによらず、上記パラメータ入力手段により入力したパラメータのみに基づいて符号量を推定するようにしてもよい。また、推定符号量の比較には重み付けを行ってもよい。
【0023】
パラメータによらず、一定の符号量(入力データの大きさに比例する)として推定してもよい。あるいは入力データの大きさに依存する関数で推定を行ってもよい。
【0024】
また、上記第1の符号量推定手段で行われる符号量推定処理は、先に述べたように、可逆符号化に対して行うものであってもよい。
【0025】
また、上記第1の符号量推定手段で行われる符号量推定処理は、対象となる符号化のソースコーディングの部分的な処理もしくはその簡略処理の結果に基づいて符号量を推定するものであってもよい。簡易シンボルを用いて推定するようにしてもよい。
【0026】
また、上記第1の符号量推定手段で行われる符号量推定処理は、ソースコーディングの部分的な処理もしくはその簡略処理の結果と符号量の関係を統計的にまとめた結果を表または式などの形式で参照し、必要な場合にはこれを補間を加えて推定符号量を算出するようにしてもよい。
【0027】
また、上記第2の符号量推定手段で行われる符号量推定処理は、先に触れたように、非可逆符号化に対して行うものであってもよい。
【0028】
また、上記第2の符号量推定手段で行われる符号量推定処理は、入力される符号化パラメータと符号量の関係を統計的にまとめた結果を参照し、また必要な場合はこれに補間を加えて推定符号量を算出するようにしてもよい。
【0029】
また、上記パラメータ入力手段において入力されたパラメータに対して四則演算をはじめとする所定の補正を行うことで、いずれかの符号化を優先的に選択させるようにしてもよい。
【0030】
また、上記第1の符号量推定手段または上記第2の符号量推定手段において算出した推定符号量のうち少なくとも1つに対して、四則演算をはじめとする所定の補正を行うことで、いずれかの符号化を優先的に選択させるようにしてもよい。
【0031】
また、上記符号化選択手段で入力された推定符号量のうち少なくとも1つに対して、四則演算をはじめとする所定の補正を行うことで、いずれかの符号化を優先的に選択させるようにしてもよい。
【0032】
また、上記第1の符号量推定手段を、上記データ入力手段によって入力されたデータを予測する予測手段と、上記予測が上記入力データと一致する回数を計数する予測一致計数手段と、上記予測一致回数と符号量との関係を保持する符号量保持手段と、上記符号量保持手段によって与えられる推定符号量に上記予測一致回数に応じた補間を行う補間手段とから構成するようにしてもよい。
【0033】
また、上記第2の符号量推定手段を、上記パラメータ入力手段によって入力されたパラメータと符号量との関係を保持する符号量保持手段と、上記符号量保持手段によって与えられる推定符号量に上記入力パラメータに応じた補間を行う補間手段とから構成するようにしてもよい。
【0034】
また、上記予測手段によって行われる予測は少なくとも2つ以上の予測手法によって行い、上記予測一致計数手段は、上記予測手法のうち1つでも一致したときは予測一致回数として計数するようにしてもよい。
【0035】
また、上記データ入力手段は入力されるデータを部分的に選択して第1の符号量推定手段に送出するようにしてもよい。
【0036】
また、上記第1の符号量推定手段および上記第2の符号量推定手段における上記符号量保持部はそれぞれ対応する符号化を用いて、それぞれ上記入力データ、上記入力パラメータにおける、符号量との関係を事前に統計的に求めた結果を保持するようにしてもよい。
【0037】
また、上記第1の符号量推定手段および上記第2の符号量推定手段における上記符号量保持部に格納するデータは、それぞれ上記入力データ、上記入力パラメータと符号量との関係が特に非線形の部分については細かい間隔で保持するようにしてもよい。
【0038】
また、上記第1の符号量推定手段および上記第2の符号量推定手段における上記符号量保持手段は、それぞれ上記入力データ、上記入力パラメータに対して、最も近いデータか、または内輪と外輪のそれぞれにおいて最も近いデータの両方を選択してそれぞれの上記補間手段に送出するようにしてもよい。
【0039】
また、本発明は符号化装置としても実現できる。
【0040】
また、本発明は装置またはシステムに実装されるのみでなく、方法の態様でも実現可能であり、少なくともその一部をコンピュータプログラムとして構成できることはもちろんである。
【0041】
【発明の実施の形態】
以下本発明の実施例について詳細に説明する。
【0042】
[基本的な原理]
本発明の実施例の具体的な説明の前に、本発明の基本的な原理について述べる。本発明は大きく2つの原理からなる。
【0043】
以下、第1の原理について説明する。本発明は可逆符号化と非可逆符号化の選択に関するものである。そこでまずこの両者の特性の違いについて説明する。可逆符号化には理論的な圧縮限界が存在する。これは一般に情報量などと呼ばれるが、数値としてはエントロピーがその例である。従って入力データが含む情報量によってその限界値が極端に変化し得る。結果として得られる符号量も極端に変化することになる。
【0044】
これに対して非可逆符号化は必ず量子化処理またはその同等処理を内部に含む。例えば前出のJPEGの場合はDCT処理された結果に線形量子化を行う。この量子化は一般に画質に影響が少ないと思われる情報をより粗く量子化するように行われる。JPEGの例でいえば、高周波成分は低周波成分よりもより粗く量子化される。このため例えば画像の情報量が高周波成分に多く含まれる場合には、量子化の効果で符号量が大きくなりづらい。つまり可逆符号化に比較して、より符号量が安定する。
【0045】
非可逆符号化の符号量が大きく変動するのは、符号化パラメータが変化した場合である。このパラメータには量子化処理を制御する値が含まれていることが多い。JPEGの例では量子化テーブルをパラメータとして与えることができる。つまり、符号化パラメータが一定の場合、入力データによらず非可逆符号化の符号量は可逆符号化よりも安定していることが多い、というのがより正確な記述になる。
【0046】
この性質を確かめるために行った実験の結果を図13に示す。可逆符号化には予測符号化の一種を使用した。また非可逆符号化はJPEGを使用し、1から順に量子化を粗くした。この結果、可逆符号化は画像に応じて符号量が100倍以上に変化したが、非可逆符号化は最も変化が激しかった非可逆符号化1でも7倍程度と安定していた。以上が本発明の第1の原理である。
【0047】
本発明の第2の原理を説明するために、可逆符号化の符号量予測について述べる。可逆符号化は情報を欠くことなく復元する必要があるため、誤差を含む可能性のある計算、例えば一般的な周波数変換は処理に含むことができない。これは原理的に可逆符号化は浮動小数による演算をほとんど含まないことを意味する。同様に除算も扱いづらく、一般には入力データそのままか、加減算を加える程度が主である。
【0048】
符号量予測に実際の符号化の一部の処理か、またはそれを簡易化した処理が必要な点では、可逆符号化の事情は非可逆符号化と同様である。しかし上のように可逆符号化は一般に軽い処理が多いので、非可逆符号化と比較すると符号量を比較的簡単に予測することができる。これが本発明を構成する第2の原理である。
【0049】
以上、以下の2原理が明らかとなった。
【0050】
第1の原理:非可逆符号化の符号量は可逆符号化より入力画像への依存性が少ない、
第2の原理:可逆符号化の符号量予測は非可逆符号化のそれより容易である。
【0051】
そこで本発明は、可逆符号化による符号量を符号量予測で推定し、これを画像によらず一定と仮定した非可逆符号化による符号量と比較することにより、より符号量の少ないと思われる符号化を選択する。このとき非可逆符号化の符号量については、事前に統計的に調べた符号化パラメータとの関係を使った補正を加えることで精度を向上する。
【0052】
本発明の具体的な例については実施例において説明する。以下、本発明の実施例として、
(1) 一般的な例
(2) 予測符号化とJPEGの選択に適用した例について述べる。
【0053】
[実施例1]
本発明の実施例1として、まず一般的な例を述べる。以下、実施例1の具体的な説明を行う。図1は実施例1における符号化選択装置を示すブロック図である。図中、図11と同様の部分には同一の符号を付して説明を省略する。図中、20はパラメータ入力部、31は第2の符号量推定部、120はパラメータデータ、130、131は推定符号量データである。
【0054】
図1の各部について説明する。データ入力部10は外部から符号化すべきデータを入力し、入力データ110として第1の符号量推定部30へ送出する。パラメータ入力部20は外部からパラメータを入力し、パラメータデータ120として第2の符号量推定部31へ送出する。第1の符号量推定部30は入力データ110を解析して所定の可逆符号化による符号量を推定し、推定符号量データ130として符号化選択部40へ送出する。第2の符号量推定部31はパラメータデータ120から所定の非可逆符号化による符号量を推定し、推定符号量データ131として符号化選択部40へ送出する。符号化選択部40は推定符号量データ130および131に基づき、符号化手法を選択して選択結果データ140として選択結果出力部50へ送出する。選択結果出力部50は選択結果データ140を外部へ出力する。
【0055】
以上の構成に基づいて本発明の実施例1の動作について説明する。図2は実施例1における符号化動作を示すフローチャートである。図中、図12と同様の部分には同一の符号を付して説明を省略する。ただし若干異なる部分については説明を加える。
【0056】
S10ではデータ入力部10およびパラメータ入力部20において、外部からそれぞれデータとパラメータの入力を受け付ける。S20では第1の符号量推定部30において所定の可逆符号化による符号量を推定する。S30では第2の符号量推定部31において所定の非可逆符号化による符号量を推定する。S40ではS20およびS30で推定された符号量に基づいて、符号化方式を選択する。
【0057】
以上の動作の中で、説明の都合上S10でデータとパラメータを同時に入力するように説明したが、これらはそれぞれの符号量推定処理であるS20およびS30に間に合えば良いので、特に同期を取る必要はない。またS20とS30はS40に間に合えば良いので、実際にはこの順序が逆でも構わないし、あるいは並行して行われても良い。
【0058】
次に第1の符号量推定部30で行われる可逆符号化の符号量推定処理について説明する。符号化処理は一般に前段のソースコーディングと後段のエントロピーコーディングからなる。ごく一般的な定義で言えば、ソースコーディングは入力に対して何らかの仮定あるいはモデリングをした変換処理で、エントロピーコーディングは統計的な圧縮処理である。前出のJPEGの例でいえばソースコーディングはDCTと量子化を、またエントロピーコーディングはハフマン符号化を採用している。
【0059】
一般に符号量推定はソースコーディングの出力を観察することによって得ることが多い。これは入力データの違いによる影響がソースコーディングに出やすいためである。これに対してエントロピーコーディングは入力によらず、比較的安定した圧縮率を示すことが多い。例えばJPEGの場合、量子化の結果0にならなかった変換係数の個数などから符号量を推定する事ができる。第1の符号量推定部30で行われる符号量推定処理も、例えばこのようなソースコーディングの結果に基づくものであってよい。
【0060】
また別の例としてソースコーディング自体ではなく、それを簡略化した処理やその代替処理などの結果から符号量を推定してもよい。このような例については実施例2において詳細に説明する。
【0061】
ソースコーディングの結果から符号量を求めるには、事前に統計的な実験をしておく必要がある。ここでいう統計的な実験とはそのシステムに入力され得る画像を多く集め、これらのソースコーディングの結果と符号量の関係を統計的に処理することを指す。この統計的処理はあるソースコーディングの結果が得られたときに対応する符号量がいくつになるかを推定するのが目的なので、最も単純な場合は平均を用いればよい。もちろん公知の統計的技術によって重み付けや偏差による補正が行われてもよい。
【0062】
このような統計処理の結果は第1の符号量推定部30に保持する必要がある。それは表の形式で保持してもよいし、線形または非線形の式で近似してもよい。もちろんこれらの組み合わせでも構わない。例として代表値を表の形式で持ち、これらの間を補間して求める構成を実施例2において詳細に説明する。またこの部分は入力とすべきデータなどの細部を除いて第2の符号量推定部31と共通する処理なので、以下で改めて説明する。
【0063】
次に第2の符号量推定部31で行われる非可逆符号化の符号量推定処理について説明する。この処理は入力データ110を参照することなく行う。例えば統計結果として図13を得た場合、これら4画像についての推定符号量は統計値、例えば平均、最大値、最小値、最頻値あるいは中間値などから算出しておき、実際の符号量推定処理はこれらを参照して行う。これらの統計値は符号化パラメータ別に求めておき、例えば表のかたちで第2の符号量推定部31に保持する。図3は符号化パラメータが2種類ある場合における、このような表の概念図である。
【0064】
表にないパラメータが入力された場合は、線形もしくは非線形の補間を行って、該当する値を算出する。この場合、表にある中で近いパラメータで代用してもよいが、あまり好ましくない。それは非可逆符号化の符号量がこのようなパラメータへ強く依存するためである。
【0065】
また逆にパラメータを固定して圧縮を運用するような場合がある。例えば画質が厳しく問われるような用途では、結果的にではあるが使えるパラメータの範囲に制限を生じるので、事実上は固定のパラメータで設計してしまっても構わない。このような場合には第2の符号量推定部31はパラメータにも入力画像にもよらない、固定の符号量を送出する。このときパラメータ入力部20は本実施例の構成から省くことができる。
【0066】
最後に符号化選択部40における選択処理は、基本的には推定符号量データ130および131のうち、小さい方に対応する符号化を選択する。しかしこの比較に何らかの重みをつけてもよい。ここでいう重みづけとは、推定符号量に何らかの値を加えたり乗じたりする処理を指す。例えば画質の問題で符号量の差がD以下の場合は可逆符号化を選択したいような場合、推定符号量データ130からDを減じたものを推定符号量データ131と比較する事によって選択処理を行えばよい。
【0067】
このような補正処理はもっと間接的に行うこともできる。例えば第1の符号量推定部30もしくは第2の符号量推定部31にそのような重みづけをする機能を加えてもよい。さらにパラメータ入力部20の内部でパラメータを調整すれば、それ以外の構成を変更しなくても同等の目的を実現することができる。これについて以下に説明する。
【0068】
本実施例は実際の符号化を行う部分とは独立なので、パラメータ入力部20から送出するパラメータデータ120は実際に符号化するときのパラメータでなくても構わない。そこで上述のように可逆符号化を優先したい場合、このパラメータを非可逆符号化の圧縮率が悪くなる方に調整する。この調整の度合いは理論的に算出できることもあるし、それができなくても予め統計処理などで求めておける。すると推定符号量データ131は実際の符号量よりも多めになるので、結局符号化選択部40で行われる選択処理を、見かけ上可逆を優先するような処理にすることができる。パラメータ入力部20は入力インターフェースの部分に実装できるので、例えば本実施例をハードウェアで実装したような場合にも、デバイスドライバなどのハードウェアの制御部分や、ハードウェアを起動するアプリケーションなどでの実装が可能である。
【0069】
以上の説明の中で説明のための便宜上、選択対象となる非可逆符号化および可逆符号化は1つづつであるかのように説明したが、これがそれぞれ2つ以上であっても構わない。そのような場合の本実施例の拡張については、以上の説明より明らかなので説明を省略する。
【0070】
以上で説明したように、実施例1によれば非可逆符号化の符号量を画像によらず一定と仮定するので、符号量予測を可逆符号化についてのみ行えばよく、ごく高速かつ低負荷で符号化選択処理を行うことができる。
【0071】
なお、実施例1の符号化選択装置を用いた符号化装置は図4に示すように構成される。この図では、符号化選択装置(図1)の選択結果出力部50からの選択結果に基づいて符号化部60の第1の符号化ユニット61および第2お符号化ユニット62を選択して利用するようになっている。第1の符号化ユニット61は第1の符号量推定部30に対応し、第2の符号化ユニット62は第2の符号量推定部31に対応する。もちろん、第1符号化ユニット61および第2符号化ユニット62が符号化部60全体に対応してもよいし、その一部のステージに対応してもよい。
【0072】
[実施例2]
本発明の実施例2として、本発明を非可逆符号化であるJPEGと、可逆符号化である特開平09−224253号公報に開示された予測符号化との選択に適用した例について説明する。
【0073】
以下、実施例2の具体的な説明を行う。図5は実施例2における符号化選択装置を示すブロック図である。図中、図1および図11と同様の部分には同一の符号を付して説明を省略する。図中、3030は予測部、3040は予測一致計数部、3050は補間部、3051は符号量保持部、3060は符号量保持部、3070は補間部、134は予測データ、135は予測一致データ、136、137は推定符号量データである。
【0074】
図5の各部について説明する。予測部3030は所定の1つ以上の予測処理を入力データ110に対して行い、その結果を予測データ134として予測一致計数部3040へ送出する。予測一致計数部3040は予測データ134と入力データ110が一致した回数を計数し、その結果を予測一致データ135として補間部部3050および符号量保持部3051へ送出する。符号量保持部3051は各予測一致回数に対応する推定符号量を保持し、予測一致データ135に基づいて適当な推定符号量を推定符号量データ136として補間部3050へ送出する。補間部3050は予測一致データ135に基づいて、必要であれば所定の補間処理を行って推定符号量データ135を符号化選択部40へ送出する。符号量保持部3060は各パラメータに対応する推定符号量を保持し、パラメータデータ120に基づいて適当な推定符号量を推定符号量データ137として補間部3070へ送出する。補間部3070はパラメータデータ120に基づいて、必要であれば所定の補間処理を行って推定符号量データ131を符号化選択部40へ送出する。
【0075】
詳細な動作については実施例1の説明などから明らかなので、省略する。
【0076】
以上の構成において、まず第1の符号量推定部30の詳細について説明する。予測部3030における予測は特開平09−224253号公報に開示された予測符号化において行われる予測のうち、一部または全部を行う。一部の予測を行う場合、どの予測を行うかについては事前に各予測の一致率と符号量との関係を調べ、より相関性が高い予測を優先的に採用すればよい。また予測が複数の場合、予測別に一致を計数してもよいし、いずれかの予測が一致した回数を計数することも考えられる。これらの選択についても、より符号量と相関性が高くなるような値を優先する。
【0077】
これらの相関性は事前に統計的な処理によって求めることができる。もちろん、理論的に算出できるような場合は、そのようにしても構わない。例えば特開平09−224253号公報に開示された技術の場合、複数の予測から一致した予測を選択するように符号化するので、いずれかの予測が一致した回数だけを計数すれば十分と理論的に決めることができる。
【0078】
本実施例において、第1の符号量推定部30で行われる処理は特開平09−224253号公報に開示された符号化処理をごく単純化したものである。つまり実施例1の説明で触れた、ソースコーディングを簡略化した処理で符号量を推定する例にあたる。一般にはこうした符号量の推定は実際にソースコーディングを行って符号量を推定するものほど精度が高くないが、予測一致データ135と実際の符号量との相関が高ければ、本実施例の目的に供せられる程度の精度は確保することができる。図6はこれを確かめる実験結果である。横軸が予測の一致率、縦軸が特開平09−224253号公報に開示された技術による符号量を示している。図6より両者の相関性は明らかに高い。
【0079】
またこの処理をより簡略化するために、画像をサンプリングして処理することが考えられる。例えば画像からNラインのサンプルを取り出して、これについての予測一致率をとるだけでも符号量との相関をある程度とることができる。Nの値は必要とする精度によって異なるが、例えば全ラインの1/10程度でもいいし、さらに高速化が必要な場合は入力画像の解像度が高ければ1/1000程度でも比較的高い相関性を維持できる。またこのサンプルは画像の局所性を避けるために、なるべく画像全体に散っていることが望ましい。
【0080】
なお以上の説明では都合上、本実施例では特開平09−224253号公報に開示された技術を取り上げたが、他の可逆符号化への応用も容易である。例えば差分符号化に関しては、差分をとる対象となる画素値と処理しようとする画素値との相関をとることで符号量推定が可能である。同様にマルコフモデル符号化では各マルコフモデルの出現確率の測定から、ブロックソーティング符号化では条件付き確率の測定から、LZ符号化の場合は周辺画素との相関から、それぞれ符号量の推定が可能である。これらの詳細については本実施例の本質から外れるので省略する。
【0081】
また本実施例では第1の符号量推定部30の処理を簡略化したものについて説明してきたが、処理負荷の増加が許容できるのであれば、前述したソースコーディングそのままでももちろん構わない。この場合の構成は以上の説明から容易に類推可能なので、説明を省略する。
【0082】
なお、以上の説明では補間部3050および符号量保持部3051の詳細について説明していないが、これは以下に述べる補間部3070および符号量保持部3060の詳細から容易に類推可能なので、ここでは説明を省略する。
【0083】
次に第2の符号量推定部31について説明する。符号量保持部3060は保持している推定符号量うち、入力されたパラメータデータ120に近いものを選択する。図3は本実施例においては符号量保持部3060が保持する推定符号量の表に相当するが、簡単のため本実施例では符号化パラメータが1つの場合について詳細に説明する。本実施例で仮定しているJPEGの場合、スケーリングファクタと呼ばれるパラメータをこれに対応させることができる。図7はそのような推定符号量の表の概念図である。いまスケーリングファクタの昇順に、左から並べられているものとする。例えば入力されたパラメータデータ120がSnより大きく、かつSn+1より小さかった場合、Sn、Sn+1、Cn、Cn+1を推定符号量データ137として補間部3070へ送出する。図8はこのときの推定符号量データ137のフォーマット例である。
【0084】
図7におけるスケーリングファクタの間隔は、望ましい符号量の推定精度と保持可能な表のサイズを勘案して決める。スケーリングファクタ間の間隔は一定でなくても構わないので、スケーリングファクタと推定符号量の関係に非線形性が強い部分にサンプル数を多くするのが一般には好ましい。図9はそのような表の一例であるが、これは符号量保持部3051における例であって、図6に例示した予測一致率と符号量との関係を示している。
【0085】
さて以上の説明は上述の通り、符号量保持部3051についても同様にあてはまるが、入力データが異なるので注意が必要である。つまり符号量保持部3060への入力が符号化パラメータであるのに対して、符号量保持部3051への入力は予測の一致回数である。この値は画像の大きさによって異なるので、補正が必要になる。例えば図7のスケーリングファクタを予測の一致率に置き換え、符号量保持部3051の内部で予測一致回数を画像サイズで除することで予測一致確率に正規化すれば、画像サイズによらない参照が可能となる。もちろんこのような正規化を予測一致計数部3040側で行っても構わない。
【0086】
次に補間部3070での補間について述べる。ここで行われる補間は符号量保持部3060が保持する推定符号量が、符号化パラメータに対して十分細かい単位でとられていれば、例えば線形補間のような単純な補間で構わない。この場合、パラメータSに対して次のように推定符号量Cを求める。
【0087】
【数1】
Figure 0004003410
【0088】
推定符号量の表で符号化パラメータの間隔が広く、かつスケーリングファクタと推定符号量の関係が非線形の場合には、もっと複雑な多次の補間式がよい。具体例については公知の技術が多く、また本実施例の本質から外れるので説明を省略する。
【0089】
本実施例の効果を確認するために、コンピュータ上で本実施例のシミュレーションを行った。図10は実験結果である。またこのときの本実施例の処理時間は、JPEGに比較して約1/40、特開平09−224253号公報に開示された予測符号化に比較しても約1/10であった。この結果から本実施例の効果は明らかである。
【0090】
以上で説明したように、実施例2によれば非可逆符号化と可逆符号化の選択を、軽い処理負荷で実現することができる。
【0091】
【発明の効果】
以上の説明から明らかなように、本発明によれば複数の非可逆符号化と可逆符号化から符号量の意味で最適なものを選択する符号化選択装置において、十分な精度でしかも軽い処理負荷の符号化選択処理を実現することができる。
【図面の簡単な説明】
【図1】 本発明の符号化選択装置の実施例1を示す構成図である。
【図2】 本発明の符号化選択装置の実施例1における動作の一例を示すフローチャートである。
【図3】 本発明の符号化選択装置の実施例1の符号量推定処理において保持する推定符号量の表の概念図である。
【図4】 実施例1の符号化選択装置を採用した符号化装置を示す構成図である。
【図5】 本発明の符号化選択装置の実施例2を示す構成図である。
【図6】 本発明の符号化選択装置の実施例2における可逆符号化の予測一致率と符号量の関係の一例を示す説明図である。
【図7】 本発明の符号化選択装置の実施例2の符号量推定処理において保持する推定符号量の表の概念図である。
【図8】 本発明の符号化選択装置の実施例2の符号量推定処理において使用する推定符号量データ137の概念図である。
【図9】 本発明の符号化選択装置の実施例2の符号量推定処理において保持する推定符号量の表の例である。
【図10】 本発明の符号化選択装置の実施例2による実験結果の一例を示す説明図である。
【図11】 従来例の符号化選択装置を示す構成図である。
【図12】 従来例の符号化選択装置の動作の一例を示すフローチャートである。
【図13】 非可逆符号化と可逆符号化との性質の違いを説明する実験結果の説明図である。
【符号の説明】
10 データ入力部
20 パラメータ入力部
30 第1の符号量推定部
31 第2の符号量推定部
40 符号化選択部
50 選択結果出力部
60 符号化部
61 第1の符号化ユニット
62 第2の符号化ユニット
110 入力データ
120 パラメータデータ
130 推定符号量データ
131 推定符号量データ
132 ブロックデータ
133 DCTデータ
134 予測データ
135 予測一致データ
136 推定符号量データ
137 推定符号量データ
140 選択結果データ
1010 A/D変換器
1020 フレームメモリ
3010 ラスターブロック変換部
3020 DCT変換部
3030 予測部
3040 予測一致計数部
3050 補間部
3051 符号量換算部
3060 符号量保持部
3070 補間部

Claims (18)

  1. 予測手段の予測結果を用いて入力データをソース符号化してソース符号化結果をエントロピー符号化する可逆符号化手段と、周波数変換および量子化を用いて入力データをソース符号化してソース符号化結果をエントロピー符号化する非可逆符号化手段とを切り替えて符号化する符号化選択装置において、
    入力データを入力するデータ入力手段と、
    上記データ入力手段により入力したデータに対して上記可逆符号化手段の上記ソース符号化の処理または当該ソース符号化の処理を簡略化した処理を実行しその実行結果に基づいて上記可逆符号化手段による符号化に関して符号量を推定する第1の符号量推定手段と、
    上記データ入力手段により入力されたデータの大きさの関数により、または当該データの大きさおよび上記非可逆符号化手段の量子化を行う部分についての符号化パラメータの関数により、上記非可逆符号化手段による符号化に関して符号量を推定する第2の符号量推定手段と、
    上記第1の符号量推定手段および上記第2の符号量推定手段によって推定された符号量の比較に基づいて符号化方式を決定する符号化選択手段と、
    上記符号化選択手段の結果を外部へ出力する選択結果出力手段とを具備することを特徴とする符号化選択装置。
  2. 上記第2の符号量推定手段は、入力データの大きさの関数に基づいて符号量を推定し、上記関数は単調に増加する一次関数とする請求項1に記載の符号化選択装置。
  3. 上記第1の符号量推定手段で行われる符号量推定処理は、上記ソースコーディングの部分的な処理もしくはその簡略処理の結果と符号量の関係を統計的にまとめた結果を表または式の形式で参照し、必要な場合にはこれに補間を加えて推定符号量を算出することを特徴とする請求項1または2記載の符号化選択装置。
  4. 上記第2の符号量推定手段で行われる符号量推定処理は、入力される上記符号化パラメータと符号量の関係を統計的にまとめた結果を参照し、また必要な場合はこれに補間を加えて推定符号量を算出することを特徴とする請求項1〜3のいずれかに記載の符号化選択装置。
  5. 上記符号化パラメータに対して四則演算をはじめとする所定の補正を行うことで、いずれかの符号化を優先的に選択させることを特徴とする請求項1〜4のいずれかに記載の符号化選択装置。
  6. 上記第1の符号量推定手段または上記第2の符号量推定手段において算出した推定符号量のうち少なくとも1つに対して、四則演算をはじめとする所定の補正を行うことで、いずれかの符号化を優先的に選択させることを特徴とする請求項1〜5のいずれかに記載の符号化選択装置。
  7. 上記符号化選択手段で入力された推定符号量のうち少なくとも1つに対して、四則演算をはじめとする所定の補正を行うことで、いずれかの符号化を優先的に選択させることを特徴とする請求項1〜6のいずれかに記載の符号化選択装置。
  8. 上記第1の符号量推定手段を、
    上記データ入力手段によって入力されたデータを予測する予測手段と、
    上記予測が上記入力データと一致する回数を計数する予測一致計数手段と、
    上記予測一致回数と符号量との関係を保持する符号量保持手段と、
    上記符号量保持手段によって与えられる推定符号量に上記予測一致回数に応じた補間を行う補間手段とから構成することを特徴とする請求項1〜7のいずれかに記載の符号化選択装置。
  9. 上記第2の符号量推定手段を、
    上記符号化パラメータと符号量との関係を保持する符号量保持手段と、
    上記符号量保持手段によって与えられる推定符号量に入力された符号化パラメータに応じた補間を行う補間手段とから構成することを特徴とする請求項4記載の符号化選択装置。
  10. 上記予測手段によって行われる予測は少なくとも2つ以上の予測手法によって行い、上記予測一致計数手段は、上記予測手法のうち1つでも一致したときは予測一致回数として計数することを特徴とする請求項8記載の符号化選択装置。
  11. 上記データ入力手段は入力されるデータを部分的に選択して第1の符号量推定手段に送出することを特徴とする請求項1〜10のいずれかに記載の符号化選択装置。
  12. 上記第2の符号量推定手段における上記符号量保持手段は対応する符号化を用いて、上記入力データ、上記符号化パラメータにおける、符号量との関係を事前に統計的に求めた結果を保持することを特徴とする請求項9記載の符号化選択装置。
  13. 上記第2の符号量推定手段における上記符号量保持手段に格納するデータは、上記入力データ、上記符号化パラメータと符号量との関係が非線形の部分については細かい間隔で保持することを特徴とする請求項9記載の符号化選択装置。
  14. 上記第2の符号量推定手段における上記符号量保持手段は、上記入力データ、上記符号化パラメータに対して、最も近いデータか、または内輪と外輪のそれぞれにおいて最も近いデータの両方を選択してそれぞれの上記補間手段に送出することを特徴とする請求項9記載の符号化選択装置。
  15. 上記第1の符号量推定手段における上記符号量保持手段は対応する符号化を用いて、上記予測一致回数と符号量との関係を事前に統計的に求めた結果を保持することを特徴とする請求項8記載の符号化選択装置。
  16. 上記第1の符号量推定手段における上記符号量保持手段に格納するデータは、上記予測一致回数と符号量との関係が特に非線形の部分については細かい間隔で保持することを特徴とする請求項15記載の符号化選択装置。
  17. 上記第1の符号量推定手段における上記符号量保持手段は、上記予測一致回数に対して、最も近いデータか、または内輪と外輪のそれぞれにおいて最も近いデータの両方を選択してそれぞれの上記補間手段に送出することを特徴とする請求項15または16記載の符号化選択装置。
  18. 予測手段の予測結果を用いて入力データをソース符号化してソース符号化結果をエントロピー符号化する可逆符号化手段と、周波数変換および量子化を用いて入力データをソース符号化してソース符号化結果をエントロピー符号化する非可逆符号化手段とを切り替えて符号化する符号化装置において、
    入力データを入力するデータ入力手段と、
    上記データ入力手段により入力したデータに対して上記可逆符号化手段の上記ソース符号化の部分的な処理または簡略化された処理を実行しその実行結果に基づいて上記可逆符号化手段による符号化に関して符号量を推定する第1の符号量推定手段と、
    上記データ入力手段により入力されたデータの大きさの関数、または当該データの大きさおよび上記非可逆符号化手段の量子化を行う部分についての符号化パラメータの関数により、上記非可逆符号化手段による符号化に関して符号量を推定する第2の符号量推定手段と、
    上記第1の符号量推定手段および上記第2の符号量推定手段によって推定された符号量の比較に基づいて符号化方式を決定する符号化選択手段と、
    上記符号化選択手段の結果を出力する選択結果出力手段と、
    上記符号化選択手段の結果に基づいた符号化方式で上記入力データを符号化する手段とを具備することを特徴とする符号化装置。
JP2001175939A 2001-06-11 2001-06-11 符号化選択装置および符号化装置ならびにその方法 Expired - Fee Related JP4003410B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001175939A JP4003410B2 (ja) 2001-06-11 2001-06-11 符号化選択装置および符号化装置ならびにその方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001175939A JP4003410B2 (ja) 2001-06-11 2001-06-11 符号化選択装置および符号化装置ならびにその方法

Publications (2)

Publication Number Publication Date
JP2002369198A JP2002369198A (ja) 2002-12-20
JP4003410B2 true JP4003410B2 (ja) 2007-11-07

Family

ID=19016996

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001175939A Expired - Fee Related JP4003410B2 (ja) 2001-06-11 2001-06-11 符号化選択装置および符号化装置ならびにその方法

Country Status (1)

Country Link
JP (1) JP4003410B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4418762B2 (ja) 2004-05-07 2010-02-24 キヤノン株式会社 画像符号化装置及び画像復号装置及びそれらの制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
JP4533043B2 (ja) * 2004-08-25 2010-08-25 キヤノン株式会社 画像符号化装置及び方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
JP4393319B2 (ja) 2004-09-08 2010-01-06 キヤノン株式会社 画像符号化装置及び方法、並びにコンピュータプログラム及びコンピュータ可読記憶媒体
US7894679B2 (en) * 2005-06-29 2011-02-22 Xerox Corporation Data transferability predictor
US7925098B2 (en) 2006-03-02 2011-04-12 Canon Kabushiki Kaisha Image encoding apparatus and method with both lossy and lossless means
US8290064B2 (en) * 2006-03-10 2012-10-16 Nec Corporation Intra-forecast mode selecting method, moving picture coding method, and device and program using the same
JP2008042688A (ja) 2006-08-08 2008-02-21 Canon Inc 画像処理装置およびその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
JP5020998B2 (ja) * 2008-06-05 2012-09-05 株式会社東芝 画像処理装置、及び画像処理方法
JPWO2012160626A1 (ja) * 2011-05-20 2014-07-31 富士通株式会社 画像圧縮装置、画像復元装置、及びプログラム

Also Published As

Publication number Publication date
JP2002369198A (ja) 2002-12-20

Similar Documents

Publication Publication Date Title
JP4771288B2 (ja) データ処理装置及びプログラム
EP2124343A1 (en) Video encoding method, video encoding device, and video encoding program
US7499492B1 (en) Video compression and encoding method
KR101314836B1 (ko) 화소 예측치 생성 순서 자동 생성 방법, 화상 부호화 방법, 화상 복호 방법, 그 장치, 그 프로그램 및 그 프로그램을 기록한 기록 매체
JP5421757B2 (ja) 画像符号化装置
JP2007520912A (ja) ビデオ圧縮方法
JP2006222555A (ja) 符号化装置及び符号化方法
JP6681383B2 (ja) エンコーダ、デコーダ、および方法
JP2004032718A (ja) フェーディング推定/補償によりビデオフレームを処理するシステムおよび方法
JP4003410B2 (ja) 符号化選択装置および符号化装置ならびにその方法
JP2000101846A (ja) 画像情報符号化装置
EP1619900B1 (en) Bit rate controller
US8358861B2 (en) Image compression device and image decompression device
JP4691011B2 (ja) 符号化伝送方法、その装置、そのプログラム、およびその記録媒体
WO2012081193A1 (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム、並びに動画像復号装置、動画像復号方法及び動画像復号プログラム
CN113473136B (zh) 视频编码器及其码率控制装置
JP2002368625A (ja) 符号量予測装置、符号化選択装置および符号化装置ならびにその方法
JP5582020B2 (ja) 動画像復号装置、動画像復号方法及び動画像復号プログラム
JP4622843B2 (ja) 画像処理装置及びプログラム
KR20030005222A (ko) 코딩
JP5582019B2 (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム
JP2009017127A (ja) 符号化装置および符号化方法
US11991375B2 (en) Moving image encoding device, moving image compression device, moving image encoding method, and program
JPH10336649A (ja) 動画像符号化方法および装置
JP5131361B2 (ja) データ処理装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040921

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060523

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060707

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061017

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061211

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070731

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070813

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100831

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110831

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120831

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120831

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130831

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees