JP4987086B2 - 画像符号化方法及び復号方法、それらの装置、それらのプログラム並びにプログラムを記録した記録媒体 - Google Patents

画像符号化方法及び復号方法、それらの装置、それらのプログラム並びにプログラムを記録した記録媒体 Download PDF

Info

Publication number
JP4987086B2
JP4987086B2 JP2009539030A JP2009539030A JP4987086B2 JP 4987086 B2 JP4987086 B2 JP 4987086B2 JP 2009539030 A JP2009539030 A JP 2009539030A JP 2009539030 A JP2009539030 A JP 2009539030A JP 4987086 B2 JP4987086 B2 JP 4987086B2
Authority
JP
Japan
Prior art keywords
value
pixel
prediction
image
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009539030A
Other languages
English (en)
Other versions
JPWO2009057506A1 (ja
Inventor
誠之 高村
由幸 八島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2009539030A priority Critical patent/JP4987086B2/ja
Publication of JPWO2009057506A1 publication Critical patent/JPWO2009057506A1/ja
Application granted granted Critical
Publication of JP4987086B2 publication Critical patent/JP4987086B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/94Vector quantisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Description

本発明は、画像(静止画像もしくは映像(動画像))を効率よく符号化・復号する高能率画像符号化方式の技術に関する。
本願は、2007年10月30日に出願された特願2007−281556号に基づき優先権を主張し、その内容をここに援用する。
画像(静止画像もしくは映像)の符号化においては、既に復号された画素を用いて、符号化対象の画素値を、空間方向の予測や時間方向の予測方法により予測する予測符号化方式が主流である。
例えばH.264/AVCでは、4×4ブロックのイントラ水平予測において、符号化対象のAからPまで(以下、A...Pと表記する。他も同様)の4×4ブロックを、既に復号済みの左隣の画素a...dを使い、
→ → → →
a|A B C D
b|E F G H
c|I J K L
d|M N O P
すなわち、
A=B=C=D=a
E=F=G=H=b
I=J=K=L=c
M=N=O=P=d
のように水平方向に予測し、次いで予測残差を、
A−a B−a C−a D−a
E−b F−b G−b H−b
I−c J−c K−c L−c
M−d N−d O−d P−d
のように計算し、その後に直交変換・量子化・エントロピ符号化を施して圧縮符号化することが行われている。
動き補償予測においても同様に、4×4ブロックの動き補償では、A...Pを別フレームにより予測した4×4ブロックA′...P′を
A′ B′ C′ D′
E′ F′ G′ H′
I′ J′ K′ L′
M′ N′ O′ P′
のように作成し、次いで予測残差を、
A−A′ B−B′ C−C′ D−D′
E−E′ F−F′ G−G′ H−H′
I−I′ J−J′ K−K′ L−L′
M−M′ N−N′ O−O′ P−P′
と計算し、その後に直交変換・量子化・エントロピ符号化を施して圧縮符号化することが行われている。
復号器は、復号済みの画素値から、例えばブロック左上の位置については、予測値A′および予測残差の復号値(A−A′)を得て、それらの和として原画素値Aを得る。これは可逆な場合であるが、非可逆の場合にも、復号器は予測残差復号値(A−A′+Δ)(Δは符号化雑音)を得て、予測値A′との和として(A+Δ)を得る。
以上は画素値が4×4の16個の場合であったが、以下、概念的に単純化し一次元で考える。また以下、一般的な8bit画素値の場合を考える。画素値は0から255までの256通りの整数値をとる。なお、8bit以外の画素値についても、以降の議論は同様に適用できる。
符号化対象の画素値をxとし、予測値をx′とする。x′はxの値に近いため、予測残差(x−x′)は−255...255の値を取り得るが、0に近い値に集中し、絶対値の大きな値は相対的に少ない。この関係をグラフにより図1に示す。
偏りのある分布の情報量は、一様な分布の情報量より小さいため、符号化後圧縮が期待できる。従来は、この分布の偏りを利用し、高効率圧縮を実現していた。
なお、非特許文献1には、本発明の実施例の説明で用いるベクトル符号化において、代表ベクトルが空間内に規則的に位置するピラミッドベクトル量子化の技術が記載されている。
また、非特許文献2には、ベクトル量子化において代表ベクトルを学習により最適化し、結果としてそれらを空間的に不規則に配置するLBGアルゴリズムに基づくベクトル量子化の技術が記載されている。
T.R.Fischer,"A pyramid vector quantizer", IEEE Trans. Inform. Theory, vol.IT-32, no.4, pp.568-583, July, 1986. Y.Linde, A.Buzo and R.M.Gray,"An algorithm for vector quantizer design, "IEEE Trans. on Communications, vol.com-28, no.1, pp.84-95, Jan., 1980
従来の方法において、例えば予測値がx′=255であったとする。画素値xは、0...255の値であるので、予測残差はx−x′=−255...0と、0以下の値しか取り得ない。
したがって、予測残差分布において、正方向のほぼ右半分の分布は使われることがない。分布の端(生起確率が極めて低い)を無視して定性的に述べれば、分布は左右対称であるので「右か左のどちらか」という情報に1bit(例えば0が右、1が左)を要する。右半分の分布が使われない(とり得る値の範囲からはみだす部分がある)場合、その1bitは元来不要である。予測値がx′=0の場合も、予測誤差分布の負方向のほぼ左半分は使われることがなく、同様に1bitが元来不要となる。
これらの関係を図2に示す。なお、以下の図において、画素値または予測誤差などの値が取り得る範囲を図中に斜線を付けて表す。
定量的に述べれば、まず左右に広がっている確率分布をpw (d)とする。
Figure 0004987086
である。実際には右半分の値は取り得ないので、誤差dの正しい分布はpw の二倍となる。
c (d)=2pw (d) (d≦0のとき)
c (d)=0 (d>0のとき) (2)
Figure 0004987086
生起確率をpw としたときの平均エントロピHw を見積もると、次のようになる。
Figure 0004987086
正しい生起確率を用いた場合の平均エントロピは、以下のとおりである。
Figure 0004987086
しかしながら、従来は差分値(x−x′)のみを対象として符号化を行っていたので、この不要な1bitの削減が不可能であった。
この理由として、
・(x−x′)からは予測値(x′)の情報が失われていること、
・(多次元の場合であるが)差分値(x−x′)に直交変換を施すため、変換後の空間におけるxの取り得る範囲も同時に変換したものを考慮しなければならず、多次元分布における「(取り得る値の範囲からの)はみだし」の判定が極めて困難となること、
が挙げられる。
以上のような問題に鑑み、本発明は、従来と同様の時間・空間的予測は行うが、原画素値と予測値との差分を求めずに、上述のような分布に関する「はみだし」を考慮した原画素値に対応した分布により原画素値を符号化することにより、予測符号化における符号化効率を改善することを目的とする。
本発明は、上記課題を解決するため、符号化対象の画素の値(画素ブロックに対応づけられる値の場合もある)を、復号済み画像から空間予測や時間予測(動き補償)により生成される予測値を用いて符号化する予測符号化において、画素値の取り得る上下限値を考慮した、画素値の該予測値における条件付き分布を用いて、符号化対象画素(または画素ブロック)の値を、符号化することを主要な特徴とする。
画素値の取り得る上下限とは、デジタル画像における画素の取り得る値の上限と下限である。もっとも広範に用いられている8bit画像では、それぞれ255と0であり、10bit画像では、1023と0となる。
この上限より大きな値(2000など)や下限より小さい値(−1)などを取るような画素は、原画像に存在していないと仮定して問題ない。上下限値の考慮とはこのことを意味しており、本発明はこのような事実を用いて符号化を効率化している。
画素値の該予測値における条件付き分布とは、予測値がx′であるような画素において、原画素値xが実際にはどのような値をとっているのかという確率分布である。
条件付きとは、ここでは予測値がx′であるということと等価である。
数学では、Pr (x|x′)とも書かれる。通常、この形状はx′をピークとする釣鐘状となる。
予測値がx′であるという条件の下でのxの分布も、(当然ながら)そのような条件がない場合のxの分布も、常に画素の上下限内の値(8bit画像では0から255の整数値)しか取らない。
また、本発明は、上記発明において予測を画素ブロック単位で行う場合に、ブロック予測による画素ブロック値の条件付き分布の符号化にベクトル量子化を用いることが可能である。
本発明によれば、従来の、予測値と原画素値の差分を扱う場合の「予測値という重要な情報の欠落」を発生させることなく、余すことなく符号化に利用し、結果としてより少ない符号量で画像(静止画像もしくは映像)を符号化することができるようになる。
画素値差分の分布を示す図である。 予測値が255の場合の画素値差分の分布を示す図である。 単純なベクトル量子化の場合(差分あり)を示す図である。 単純なベクトル量子化の場合(差分なし)を示す図である。 ノルム=4に対応する代表ベクトルを示す図である。 ノルム=4に対応する代表ベクトル(異なる予測値の例)を示す図である。 ピラミッドベクトル量子化の場合(差分あり)を示す図である。 ピラミッドベクトル量子化の代表ベクトルの計数を示す図である。 LBGアルゴリズムによる差分ベクトル量子化の模式図である。 特定の予測値(x1 ′,x2 ′)における差分ベクトル量子化の模式図である。 特定の予測値(x1 ′,x2 ′)における、本発明による手法によるベクトル量子化の模式図である。 本願発明の実施形態における符号化時の処理の流れを示す図である。 原画素値の生起確率が一様である概念を示す図である。 原画素値と予測値の差分分布を示す概念図である。 差分分布を原画素値に対応するものにシフトさせた分布を示す概念図である。 原画素値のとり得る値にクリッピングした分布を示す概念図である。 本実施形態における符号化装置のブロック図である。 本実施形態における復号時の処理の流れを示す図である。 代表ベクトルのはみだし個数が正確に求まらない例を示す図である。
符号の説明
300 信号端子
301 画素値予測器
302 予測値蓄積メモリ
303 差分分布蓄積メモリ
304 加算・クリッピング器
305 代表ベクトル設計器
306 原画素値蓄積メモリ
307 ベクトル量子化器
308 量子化インデックス符号化器
309 出力端子
まず、本発明の概要を具体例かつ簡単に説明する。
例えば、信号dが{−2,−1,1,2}の4通りのいずれをとるかわからない場合(25%で等確率を仮定)、この信号を符号化するには2[bit]が必要である。これを確率分布で表したのが図1(二次元の例は図9)である。
もし「信号dが正である」とわかっているとすると、{1,2}の二通りしか可能性がないので1[bit]で符号化ができてしまう。これを確率分布で表したのが図2(二次元の例は図11)である。
同じことが、静止画像もしくは映像の予測符号化でも起きる。
画像信号x(0≦x)の予測値がx′であったとすると、予測誤差d=x−x′の分布は予測値x′により変化する。
例えば、もしx′=0であれば、0≦d0 つまりdは負の値をとらない。一方、x′=255であれば、d0 ≦0つまりdは正の値をとらない(概念は同じく図2を参照)。
このように、予測値x′の値を手がかりに、符号化・復号の前にdの存在範囲を絞り込んでおくことができる。これはとりもなおさず符号化効率の改善につながる。
dの存在範囲を絞り込む処理は、x′+dの範囲を(8bit画像の場合)0...255に規格化することと等価である。
これは符号化方法では、図12のフローチャートのクリッピングステップ105に、復号方法では、図15のフローチャートのクリッピングステップ405に相当する。
さらに、予測単位のブロック毎に代表ベクトルを設計することで、適応的に最適な代表ベクトルを設計できる(符号化方法では図12のフローチャートの代表ベクトル設計ステップ106に、復号方法では図15のフローチャートの代表ベクトル設計ステップ406に相当する)。
こうして符号化対象信号を狭めた後、通常の符号化を経て従来よりも短い(符号化効率の高い)符号が出力される(図12のフローチャートの量子化インデックス符号化ステップ109)。
画素値の予測は、既存の符号化技術MPEG−1、MPEG−2、MPEG−4、H.264/AVCにおいて「動き補償」あるいは「イントラ予測」として用いられており(符号化方法では図12のフローチャートのステップ101、復号方法では図15のフローチャートのステップ401)、本発明はこのような予測が用いられる場面に広範に適用でき、符号化効率の改善に寄与するものである。
なお、既存の予測符号化技術においては、予測誤差は常に正負いずれも取り得るものとして符号化している(概念図は図9)。
次に、本発明の実施形態における原理的な仕組みについて詳細に説明する。
予測を画素ブロック単位で行い、ブロック予測による画素ブロック値の条件付き分布の符号化にベクトル量子化を用いる例を説明するが、予測値がx′であるような画素において、原画素値xが実際にはどのような値をとっているのかという確率分布を用いて符号化を行うという基本的な考え方は、画素単位で符号化する場合も同様である。
[距離尺度がLノルムの場合]
図3を用い、二次元での量子化・符号化を例にとり説明する。これは二次元の最も単純な格子量子化の模式図である。原点からの距離尺度は、Lノルム(座標絶対値の最大値)に基づき計算される。
例えば点(0,3)と点(−2,−3)は、同一のLノルムを持つ。
図中、点線でつながれた点(ベクトル量子化後、離散データが属する代表ベクトルである)同士が同一のLノルムを持ち、同一ノルムの点同士は同確率で生起することを仮定する。
この図では、隣り合う二画素の原画素値がそれぞれx1 =253、x2 =102であり、予測値がx1 ′=255、x2 ′=100であったとしている。差分値はx1 −x1 ′=−2、x2 −x2 ′=2となる。
原画素値に対応する差分ベクトル(−2,2)が属するLノルム=2の生起確率が、0.3であったとする。
ノルムが2となる代表ベクトルは全部で16個あるので、原画素値を符号化するのに必要な情報量は、
−log2 0.3+log2 16=5.737[bit] (9)
となる。
次に、本発明により、予測誤差を計算しない場合の符号量を見積もる。概念図を図4に示す。
図中に斜線を付けた部分に属する白丸で示される代表ベクトル(○)は、原画素値の可能性があり、斜線の外側に属する黒丸で示される代表ベクトル(●)は、原画素値の可能性がない。
中心は予測値(x1 ′,x2 ′)=(255,100)であり、先と同様に、中心からのLノルムが2となる確率は、0.3であるとする。
これに属する代表ベクトルは9個であるので、原画素値を符号化するのに必要な情報量は、
−log2 0.3+log2 9=4.907[bit] (10)
と、差分を計算した場合(第9式)よりも0.83bit低い値で収まっている。
[ノルム一定面上の代表ベクトル点数]
図5に、二次元、Lノルム=4に対応する代表ベクトルを示す。
次元をL、ノルムをKとすると、代表ベクトルの個数N(L,K)は次式で与えられる:
N(L,K)=(2K+1)L −(2K−1)L (11)
図5に示す例では、
N(2,4)=92 −72 =81−49=32
となる。
符号化において、ノルムが特定された後に、さらに代表ベクトルを特定するために、以下の情報量が必要となる。
log2 N(L,K)[bit] (12)
さらに、図5では、黒丸(●)で示される「はみだし部分」(原画素値の可能性がない部分)が存在する。この個数を差し引いた白丸(○)の個数を求めるには、(x1 、x2 、... 、xL )の各次元において、上限を( p1 p2 、... 、 pL )、下限を(− n1 、− n2 、... 、− nL )とすると、
0≦ ni pi ≦K(i=1... L)
である。はみだしがない場合、Ki (上限、下限)≡Kである。
○の個数をN′(L, K, n1 ,... , nL p1 ,... , pL
とすると、
Figure 0004987086
として求められる。ただし、
f(K,K′)=K′−1 (K′=Kのとき)
f(K,K′)=K′ (K′<Kのとき) (14)
となる。
図5の例では、L=2、K=4、 n1 =4、 n2 =4、 p1 =2、 p2 =4なので、
N′(2,4,4,4,2,4)
=(4+2+1)(4+4+1)−(4−1+2+1)(4−1+4−1+1)
=63−42=21
となる。
本発明の手法によるエントロピ削減の度合いを見積もると、
log2 32−log2 21=0.608[bit]
となる。
次に、異なる予測値の例として、図6の場合を考える。
L=2、K=4、 n1 =4、 n2 =3、 p1 =2、 p2 =3なので、
N′(2,4,4,3,2,3)
=(2+4+1)(3+3+1)−(2+4−1+1)(3+3+1)
=49−42=7
となり、はみだし部分が大幅に削除されている。
[距離尺度がL1 ノルムの場合]
次に、原点からの距離がL1 ノルムに従う、いわゆるピラミッドベクトル量子化の場合を、図7を用いて説明する。先と同様に、点線は等確率面、斜線部は画素値が取り得る範囲(0...255)を示している。
大きな円で示された(x1 ,x2 )が原画素であり、このノルム(図では4)に属する代表ベクトルは、範囲外も含めると16個、範囲内は10個である。
この場合、原画素値と予測値との差分をとらないとき(本発明)のエントロピは、とったとき(従来法)に比べ、
log2 16−log2 10=0、678[bit] (15)
低くなる。
[ノルム一定面上の代表ベクトル点数]
図7のL1 ノルム=4の部分を抜き出したものが図8である。
L次元のピラミッドベクトル量子化の、L1 ノルム=Kである代表ベクトルの点の個数を、先と同様にN(L,K)とする。これは次のように漸化的に求められる(非特許文献1参照)。
・K=1のとき
N(L,K)=2L
・L=1のとき
N(L,K)=2
・それ以外
N(L,K)=N(L,K−1)+N(L−1,K−1)+N(L−1,K)
…(16)
従って、
N(2,4)=N(2,3)+N(1,3)+N(1,4)
=N(2,2)+N(1,2)+N(1,3)+2+2
=N(2,2)+2+2+4
=N(2,1)+N(1,1)+N(1,2)+8
=4+2+2+8
=16
となる。
次に、「はみだし部分」の個数を考える。例えばp1=1により5個、p=3により1個の「はみだし」代表ベクトル(●)が生じている。
まず、簡単のため、p1のみがp1<Kであり、残りは
1,Ki =K(i=2,... ,L)
である場合を考える。
そのような場合のはみ出し代表ベクトル(●)の個数M(L,K)は、第16式のNを用いて、
K=0のとき:M(L,K)=1
L=1のとき:M(L,K)=1
それ以外 :M(L,K)=(N(L,K)+N(L−1,K))/2
…(17)
において、
M(L,K−p1 −1)
から求められる。
図8のようなL=2、K=4、p1=1の場合、
M(2,4−1−1)=M(2,2)
=(N(2,2)+N(1,2))/2
=(8+2)/2=5
となる。
同様の手法は他の次元にも適用でき、例えばp2 =3の場合、
M(2,4−3−1)=M(2,0)=1
のように求められる。
こうして、代表ベクトル総数Nとはみ出し個数Mから、○の個数がN−Mとして求められる。
なお、上記のようにはみ出し量が正確に求まるには、以下の条件を満たしている必要がある:
・i番の座標軸に垂直なxi =Ki 面の、全端点のL1 ノルムが常にK以上であること、
・すなわち、|Kj |、|255−Kj |(j≠i)のうち、最小値を与える座標軸jを残し、それ以外の座標値が全て0であるような点のL1 ノルム(これが全端点の中で最小のL1 ノルムを与える)がK以上であること、
・すなわち、
Figure 0004987086
具体例として、図8における斜線を施した四角部分の4つの角が「全端点」となり、この場合は全ての短点がL1 ノルム=4のライン上もしくはその外側にあり、はみ出し量が正確に求まる。
仮に、この斜線部分が図16のように設定されていると、L1 ノルム=4のラインの内側に存在する端点があり((x1 ,x2 )=(1,1)に存在する端点)、重複カウントされる「はみだし」代表ベクトルが存在してしまう((x1 ,x2 )=(2,2)に存在する代表ベクトル)。
この場合、はみ出し量が正確に求まらない。
[一般のベクトル量子化の場合]
よく知られたLBGアルゴリズム(非特許文献2)などによる、代表ベクトルの配置が規則的でない、一般のベクトル量子化においては、本発明は次のように適用される。
図9が、通常の差分信号(二次元)に対するベクトル量子化の模式図である。差分信号は、各次元−255...255の値をとるため、代表ベクトルの設計においてもこの範囲を網羅するようになされる。画像予測差分信号のように原点(0,0)付近に信号が生起する確率が高い場合、この図のように代表ベクトルも原点付近において密になり、周辺において疎となる。
図10は、従来の符号化方法に対応するもので、予測値(x1 ′,x2 ′)における原信号の符号化を行っている。原信号は0..255の値しか取り得ないため、代表ベクトルはその外にも存在してしまう。したがって、一次元の符号化議論のときと同様に、符号量の無駄が発生する。
図11は、本発明の符号化方法に対応するもので、予測値(x1 ′,x2 ′)に応じて代表ベクトルを設計する。
当然ながら各次元0...255の範囲内で設計するため(即ち、0≦x1 ,x2 ≦255)、従来方法(図10)で生じていたような代表ベクトルの「はみだし」は起きず、符号量の無駄のない符号化が行える。
以下では、本発明の実施形態の一例として、予測を画素ブロック単位で行い、ブロック予測による画素ブロック値の条件付き分布の符号化にベクトル量子化を用いる場合の例を説明する。
本実施形態では、事前の学習用データをもとに、ベクトル量子化の代表ベクトルを作成する。
符号化対象ブロックの予測値x′に対応した学習データのみを用いてもよいが、次元が高い場合にはデータ数が少なくなるので、例えば原画素値との差分値(x−x′)を記憶しておき、学習には差分値に予測値を加えた値を用いる、という構成も可能である。
図12に、本実施形態のフローチャートを示す。実線矢印は処理の流れ、波線矢印はデータの流れを示す。
画素値予測ステップ101において、ブロック単位に動き補償あるいは画面内予測などにより、符号化対象ブロックの画素値予測を行い、予測値102(ベクトル量)を得る。
シフトステップ104において、別途蓄積しておいた差分分布データ103(ベクトル量)における差分値に予測値を加算(シフト)し、次いでクリッピングステップ105において、ベクトルの各要素を0...255にクリッピングする。これが学習の元データとなる。
代表ベクトル設計ステップ106において、例えばLBGアルゴリズムにより、学習の元データを用いて代表ベクトルを設計する(例えば図11のような結果を得る)。
次に、符号化対象ブロックの原画素値108(ベクトル量)を、ベクトル量子化ステップ107により、原画素値最近傍の代表ベクトルへ対応づける。
得られた代表ベクトルのインデックス情報を、その生起確率に基づき、量子化インデックス符号化ステップ109において、算術符号などのエントロピ符号化により符号化し、符号を出力し、終了する。
図13A〜13Dを用いて、図12に示す符号化の処理による作用を簡単な例で説明する。わかりやすく図示するため、図13A〜13Dでは一次元の画素値で示す。原画素値xは0から255までの値を取るものとする。
もし、これらの値の生起確率が一様であるとすると、図13Aに示すように、各値は1/256の確率で生じることになる。このような等確率分布で生じる値の符号化コストは大きい。
しかし、もしこの原画素値xの予測値x′が得られた場合、原画素値xの取り得る確率分布を、既知の予測誤差値の分布から等確率分布ではないものとすることができる。本方式は、この点に着目して符号化効率を改善するものである。
原画素値xと予測値x′の差分である予測誤差x−x′の値(差分値)は、−255から255までの値を取り得るが、この差分分布は、多くのサンプル画像の予測符号化実験などにより求めることができる。この差分分布のデータを予め蓄積し、保持しておく。
差分分布は各予測誤差の値の頻度値もしくは確率値の分布であり、例えば図13Bのような分布となっている。図12の差分分布データ103が、図13Bのような分布を示すデータ(ただしベクトル量)である。
原画素値xを符号化するときに、画素値予測ステップ101では、まず予測値x′を求める。
シフトステップ104では、差分分布データ103の各差分値、すなわち図13Bに示す差分分布における横軸の各予測誤差x−x′の値に予測値x′を加算(シフト)し、この差分分布を、図13Cに示すように原画素値xに対応するものにシフトさせる。
これが、予測値x′が既知の場合の原画素値xの取り得る確率分布に相当するものになる。
図13Cの分布では、原画素値xが−255+x′から255+x′の範囲まで分布するものになっている。しかし、原画素値xは、ここでは0から255までの値しか取らないという前提であるので、続くクリッピングステップ105では、図13Dに示すように、原画素値xの分布における0未満と255の値を超える部分を切り捨て、これにより得られた分布を必要に応じて正規化し、確率分布とする。
この図13Dに示す分布に基づいて原画素値xを符号化すれば、図13Aに示すような等確率分布の下で符号化するよりも高い符号化効率が得られることはもちろん、図13Bに示すような裾の広い確率分布の下で符号化する(従来法に対応)よりも効率は高くなる。
このような確率分布の下で効率よく符号化する一例としてはベクトル量子化があり、さらに本実施形態では、図13Dに示すような確率分布に基づいて、図12に示すステップ106〜109により、量子化代表ベクトルの配置を決め、ベクトル量子化を行っている。
図14に、本実施形態の符号化装置のブロック図を示す。
信号端子300より、映像原信号および復号済み映像信号が入力される。
符号化対象ブロックの原画素値は、原画素値蓄積メモリ306に蓄積される。
画素値予測器301において、ブロック単位に動き補償あるいは画面内予測などにより、符号化対象ブロックの画素値予測を行い、予測値(ベクトル量)を得、予測値蓄積メモリ302に記憶する。
加算・クリッピング器304において、差分分布蓄積メモリ303に別途蓄積しておいた差分分布データベクトルと予測値を加算し、ベクトルの各要素を0...255にクリッピングする。これが学習の元データとなる。
代表ベクトル設計器305において、例えばLBGアルゴリズムにより、学習の元データを用いて代表ベクトルを設計する。
次に、メモリ306に蓄えられた符号化対象ブロックの原画素値(ベクトル量)を、ベクトル量子化器307により、原画素値最近傍の代表ベクトルへ対応づける。
得られた代表ベクトルのインデックス情報を、その生起確率に基づき、量子化インデックス符号化器308において、算術符号などのエントロピ符号化により符号化し、符号を出力端子309へ出力し、終了する。
図15に、本実施形態における復号時のフローチャートを示す。実線矢印は処理の流れ、波線矢印はデータの流れを示す。
画素値予測ステップ401において、ブロック単位に動き補償あるいは画面内予測などにより、符号化対象ブロックの画素値予測を行い、予測値402(ベクトル量)を得る。
加算ステップ404において、別途蓄積しておいた差分分布データベクトルと予測値を加算し、次いでクリッピングステップ405においてベクトルの各要素を0...255にクリッピングする。これが学習の元データとなる。
代表ベクトル設計ステップ406において、例えばLBGアルゴリズムにより、学習の元データを用いて代表ベクトルを設計する。
得られた代表ベクトルのインデックス情報の生起確率に基づき、量子化インデックス復号ステップ407において、インデックスを復号する。
次に、ベクトル逆量子化ステップ408において、インデックスに対応する代表ベクトル値を求めてこれを出力し終了する。
なお、本実施形態の復号装置のブロック構成については、図14に示す符号化装置のブロック図の説明と、図15に示す復号時のフローチャートの説明から容易に類推できるので、図面を用いた説明は省略する。
復号装置の構成も、基本的には図14に示す符号化装置のブロック図と同様であり、図14における原画素値蓄積メモリ306が、復号装置では量子化インデックス符号化データ蓄積メモリになり、ベクトル量子化器307が、復号装置では量子化インデックス復号器になり、量子化インデックス符号化器308が、復号装置ではベクトル逆量子化器になる。
以上の画像・映像符号化および復号の処理は、コンピュータとソフトウェアプログラムとによっても実現することができ、そのプログラムをコンピュータ読み取り可能な記録媒体に記録して提供することも、ネットワークを通して提供することも可能である。
本発明によれば、従来の、予測値と原画素値の差分を扱う場合の「予測値という重要な情報の欠落」を発生させることなく、余すことなく符号化に利用し、結果としてより少ない符号量で画像(静止画像もしくは映像)を符号化することができるようになる。

Claims (12)

  1. 符号化対象の画素の値を、復号済み画像から空間予測または時間予測により生成される予測値を用いて符号化する画像信号の符号化方法であって、
    符号化対象の画素の値の予測を行い、予測値を得るステップと、
    前記得られた予測値に対し、原画素値がどのような値をとっているのかという確率分布のデータを、予め蓄積されている予測符号化における原画素値と予測値との差分の分布データを予測値に応じてシフトさせることにより算出するステップと、
    前記得られた確率分布のデータを原画素値が取り得る下限値から上限値までの範囲にクリッピングするステップと、
    前記クリッピングされた原画素値の下限値から上限値までの確率分布のデータを用いて、符号化対象の画素の値を符号化するステップとを有する
    ことを特徴とする画像符号化方法。
  2. 請求項1に記載の画像符号化方法であって、
    前記符号化対象の画素の値が所定の画素ブロックに対応づけられるように、前記予測を画素ブロック単位で行い、
    前記画素値を符号化するステップでは、ブロック予測による画素ブロック値に対して求められた前記確率分布のデータをもとに、量子化代表ベクトルを定め、前記画素ブロック値をベクトル量子化することにより符号化する
    ことを特徴とする画像符号化方法。
  3. 復号対象の画素の値を、復号済み画像から空間予測または時間予測により生成される予測値を用いて復号する画像信号の復号方法であって、
    復号対象の画素の値の予測を行い、予測値を得るステップと、
    前記得られた予測値に対し、原画素値がどのような値をとっているのかという確率分布のデータを、予め蓄積されている予測符号化における原画素値と予測値との差分の分布データを予測値に応じてシフトさせることにより算出するステップと、
    前記得られた確率分布のデータを原画素値が取り得る下限値から上限値までの範囲にクリッピングするステップと、
    前記クリッピングされた原画素値の下限値から上限値までの確率分布のデータを用いて、復号対象の画素の値を復号するステップとを有する
    ことを特徴とする画像復号方法。
  4. 請求項3に記載の画像復号方法であって、
    前記復号対象の画素の値が所定の画素ブロックに対応づけられるように、前記予測を画素ブロック単位で行い、
    前記画素値を復号するステップでは、ブロック予測による画素ブロック値に対して求められた前記確率分布のデータをもとに量子化代表ベクトルを定め、復号対象のベクトル量子化された画素ブロック値を、前記定められた量子化代表ベクトルに従って復号する
    ことを特徴とする画像復号方法。
  5. 符号化対象の画素の値を、復号済み画像から空間予測または時間予測により生成される予測値を用いて符号化する画像信号の符号化装置であって、
    符号化対象の画素の値の画素値予測を行い、予測値を得る予測手段と、
    前記得られた予測値に対し、原画素値がどのような値をとっているのかという確率分布のデータを、予め蓄積されている予測符号化における原画素値と予測値との差分の分布データを予測値に応じてシフトさせることにより算出する手段と、
    前記得られた確率分布のデータを原画素値が取り得る下限値から上限値までの範囲にクリッピングする手段と、
    前記クリッピングされた原画素値の下限値から上限値までの確率分布のデータを用いて、符号化対象の画素の値を符号化する符号化手段とを備える
    ことを特徴とする画像符号化装置。
  6. 請求項5に記載の画像符号化装置であって、
    前記予測手段は、前記符号化対象の画素の値が所定の画素ブロックに対応づけられるように、前記予測を画素ブロック単位で行い、
    前記符号化手段は、ブロック予測による画素ブロック値に対して求められた前記確率分布のデータをもとに、量子化代表ベクトルを定め、前記画素ブロック値をベクトル量子化することにより符号化する
    ことを特徴とする画像符号化装置。
  7. 復号対象の画素の値を、復号済み画像から空間予測または時間予測により生成される予測値を用いて復号する画像信号の復号装置であって、
    復号対象の画素の値のの画素値予測を行い、予測値を得る予測手段と、
    前記得られた予測値に対し、原画素値がどのような値をとっているのかという確率分布のデータを、予め蓄積されている予測符号化における原画素値と予測値との差分の分布データを予測値に応じてシフトさせることにより算出する手段と、
    前記得られた確率分布のデータを原画素値が取り得る下限値から上限値までの範囲にクリッピングする手段と、
    前記クリッピングされた原画素値の下限値から上限値までの確率分布のデータを用いて、復号対象の画素の値を復号する復号手段とを備える
    ことを特徴とする画像復号装置。
  8. 請求項7に記載の画像復号装置であって、
    前記予測手段は、前記復号対象の画素の値が所定の画素ブロックに対応づけられるように、前記予測を画素ブロック単位で行い、
    前記復号手段では、ブロック予測による画素ブロック値に対して求められた前記確率分布のデータをもとに量子化代表ベクトルを定め、復号対象のベクトル量子化された画素ブロック値を、前記定められた量子化代表ベクトルに従って復号する
    ことを特徴とする画像復号装置。
  9. 請求項1に記載された画像符号化方法を、コンピュータに実行させるための画像符号化プログラム。
  10. 請求項3に記載された画像復号方法を、コンピュータに実行させるための画像復号プログラム。
  11. 請求項1に記載された画像符号化方法を、コンピュータに実行させるための画像符号化プログラムを記録したコンピュータ読み取り可能な記録媒体。
  12. 請求項3に記載され画像復号方法を、コンピュータに実行させるための画像復号プログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2009539030A 2007-10-30 2008-10-23 画像符号化方法及び復号方法、それらの装置、それらのプログラム並びにプログラムを記録した記録媒体 Active JP4987086B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009539030A JP4987086B2 (ja) 2007-10-30 2008-10-23 画像符号化方法及び復号方法、それらの装置、それらのプログラム並びにプログラムを記録した記録媒体

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2007281556 2007-10-30
JP2007281556 2007-10-30
PCT/JP2008/069257 WO2009057506A1 (ja) 2007-10-30 2008-10-23 画像符号化方法及び復号方法、それらの装置、それらのプログラム並びにプログラムを記録した記録媒体
JP2009539030A JP4987086B2 (ja) 2007-10-30 2008-10-23 画像符号化方法及び復号方法、それらの装置、それらのプログラム並びにプログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JPWO2009057506A1 JPWO2009057506A1 (ja) 2011-03-10
JP4987086B2 true JP4987086B2 (ja) 2012-07-25

Family

ID=40590897

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009539030A Active JP4987086B2 (ja) 2007-10-30 2008-10-23 画像符号化方法及び復号方法、それらの装置、それらのプログラム並びにプログラムを記録した記録媒体

Country Status (11)

Country Link
US (1) US8520727B2 (ja)
EP (1) EP2204999B1 (ja)
JP (1) JP4987086B2 (ja)
KR (1) KR101128533B1 (ja)
CN (1) CN101836456B (ja)
BR (1) BRPI0817901A2 (ja)
CA (1) CA2703083C (ja)
ES (1) ES2741924T3 (ja)
RU (1) RU2454823C2 (ja)
TW (2) TWI388218B (ja)
WO (1) WO2009057506A1 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4871246B2 (ja) * 2007-10-30 2012-02-08 日本電信電話株式会社 ベクトル量子化方法,装置およびそれらのプログラムとそれを記録したコンピュータ読み取り可能な記録媒体
US9456111B2 (en) 2010-06-15 2016-09-27 Mediatek Inc. System and method for content adaptive clipping
TWI418220B (zh) * 2010-08-12 2013-12-01 Via Telecom Co Ltd 結合軟硬體實現之視訊處理系統,方法及其電腦程式產品
GB2513111A (en) * 2013-04-08 2014-10-22 Sony Corp Data encoding and decoding
KR102280943B1 (ko) * 2014-02-27 2021-07-22 텔레폰악티에볼라겟엘엠에릭슨(펍) 오디오/비디오 샘플 벡터의 피라미드 벡터 양자화 인덱싱 및 디인덱싱을 위한 방법 및 장치
KR101777994B1 (ko) * 2014-07-28 2017-09-13 텔레폰악티에볼라겟엘엠에릭슨(펍) 피라미드 벡터 양자화기의 형상 검색
EP3280141A4 (en) * 2015-05-12 2018-02-28 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding image
US10484695B2 (en) 2017-10-23 2019-11-19 Google Llc Refined entropy coding for level maps
KR102515684B1 (ko) 2017-11-16 2023-03-30 린텍 가부시키가이샤 반도체 장치의 제조 방법
CN111295739B (zh) 2017-11-16 2023-08-25 琳得科株式会社 半导体装置的制造方法
CN111684802B (zh) * 2017-12-06 2023-12-22 V-诺瓦国际有限公司 用于对字节流进行分级编码和解码的方法和设备
WO2019135655A1 (ko) * 2018-01-08 2019-07-11 삼성전자주식회사 영상 부호화 방법 및 장치, 영상 복호화 방법 및 장치
JP7280242B2 (ja) 2018-03-30 2023-05-23 リンテック株式会社 樹脂シート、樹脂シートの使用方法、及び硬化樹脂層付き硬化封止体の製造方法
US10645381B2 (en) 2018-04-30 2020-05-05 Google Llc Intra-prediction for smooth blocks in image/video
CN113099234B (zh) * 2021-04-09 2022-04-19 中国矿业大学 基于预计算的dna快速编码方法
WO2023101423A1 (ko) * 2021-11-30 2023-06-08 한국전자통신연구원 위상 신호의 주기성에 기반한 영상 부호화 및 복호화 방법 및 장치
CN118101970A (zh) * 2024-04-17 2024-05-28 哈尔滨师范大学 基于深度学习的冰雪项目场地监控图像高效通信方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03145887A (ja) * 1989-10-31 1991-06-21 Victor Co Of Japan Ltd 予測符号化装置
JP2006229623A (ja) * 2005-02-17 2006-08-31 Sony Corp 符号化装置および方法、復号装置および方法、記録媒体、並びにプログラム、画像処理システムおよび方法

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0457362B1 (en) * 1983-09-06 1995-07-05 Mitsubishi Denki Kabushiki Kaisha Vector quantizer
US4885637A (en) * 1986-07-26 1989-12-05 Canon Kabushiki Kaisha Encoder
TW297202B (ja) * 1993-10-13 1997-02-01 Rca Thomson Licensing Corp
JP3196608B2 (ja) * 1995-08-31 2001-08-06 三菱電機株式会社 符号化・復号化装置及び符号化・復号化方法
JPH0984022A (ja) 1995-09-19 1997-03-28 Fujitsu Ltd フレーム間符号化装置
US6865291B1 (en) * 1996-06-24 2005-03-08 Andrew Michael Zador Method apparatus and system for compressing data that wavelet decomposes by color plane and then divides by magnitude range non-dc terms between a scalar quantizer and a vector quantizer
US6125201A (en) * 1997-06-25 2000-09-26 Andrew Michael Zador Method, apparatus and system for compressing data
AR016812A1 (es) * 1997-08-14 2001-08-01 Samsung Electronics Co Ltd Metodo para transmitir informacion de video comprimida, disposiciones de compresion y de grabacion de video y aparato de reproduccion de video
US6909808B2 (en) * 2002-03-08 2005-06-21 Anzus, Inc. Image compression to enhance optical correlation
ES2788534T3 (es) * 2002-05-28 2020-10-21 Dolby Int Ab Método y sistemas para la estimación, comunicación y organización de modos de intra-predicción de imágenes
KR101170629B1 (ko) * 2003-10-06 2012-08-02 디지털 파운튼, 인크. 단일 송신기 또는 다중 송신기를 갖는 통신 시스템의 에러 정정 다중-스테이지 코드 생성기 및 디코더
TWI285055B (en) 2004-09-30 2007-08-01 Nippon Telegraph & Telephone Method for progressive lossless video coding, method for progressive lossless video decoding, progressive lossless video coding apparatus, progressive lossless video decoding apparatus, and recording media of progressive lossless video coding program...
US7983341B2 (en) * 2005-02-24 2011-07-19 Ericsson Television Inc. Statistical content block matching scheme for pre-processing in encoding and transcoding
JP4543971B2 (ja) * 2005-03-07 2010-09-15 ソニー株式会社 符号化方法、符号化装置、符号化処理のプログラム及び符号化処理のプログラムを記録した記録媒体
CN100428634C (zh) * 2005-03-09 2008-10-22 浙江大学 数字信号处理中联合变长编解码的方法和装置
JP4975614B2 (ja) 2005-03-30 2012-07-11 株式会社日立メディコ 磁気共鳴イメージング装置及び方法
EP1732329A1 (en) * 2005-06-06 2006-12-13 STMicroelectronics S.r.l. Method and apparatus for coding moving images
WO2007010690A1 (ja) 2005-07-22 2007-01-25 Mitsubishi Electric Corporation 画像符号化装置、画像復号装置、および画像符号化方法、画像復号方法、画像符号化プログラム、画像復号プログラム、ならびに画像符号化プログラムを記録したコンピュータ読み取り可能な記録媒体、画像復号プログラムを記録したコンピュータ読み取り可能な記録媒体
US9077960B2 (en) * 2005-08-12 2015-07-07 Microsoft Corporation Non-zero coefficient block pattern coding
CN1984336A (zh) * 2005-12-05 2007-06-20 华为技术有限公司 一种二进制化方法及装置
JP4666255B2 (ja) 2005-12-27 2011-04-06 日本電気株式会社 符号化データ選定、符号化データ設定、再符号化データ生成及び再符号化の方法及び装置
JP4793059B2 (ja) 2006-04-03 2011-10-12 セイコーエプソン株式会社 撮像装置及び撮像システム
US8121190B2 (en) * 2006-10-05 2012-02-21 Siemens Aktiengesellschaft Method for video coding a sequence of digitized images

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03145887A (ja) * 1989-10-31 1991-06-21 Victor Co Of Japan Ltd 予測符号化装置
JP2006229623A (ja) * 2005-02-17 2006-08-31 Sony Corp 符号化装置および方法、復号装置および方法、記録媒体、並びにプログラム、画像処理システムおよび方法

Also Published As

Publication number Publication date
KR101128533B1 (ko) 2012-03-27
JPWO2009057506A1 (ja) 2011-03-10
WO2009057506A1 (ja) 2009-05-07
CA2703083A1 (en) 2009-05-07
RU2010115771A (ru) 2011-10-27
EP2204999A1 (en) 2010-07-07
TWI388218B (zh) 2013-03-01
CA2703083C (en) 2014-07-15
ES2741924T3 (es) 2020-02-12
RU2454823C2 (ru) 2012-06-27
CN101836456A (zh) 2010-09-15
US8520727B2 (en) 2013-08-27
EP2204999B1 (en) 2019-05-15
EP2204999A4 (en) 2016-04-27
CN101836456B (zh) 2012-10-10
KR20100058646A (ko) 2010-06-03
TW201244500A (en) 2012-11-01
TW200931987A (en) 2009-07-16
TWI433545B (zh) 2014-04-01
BRPI0817901A2 (pt) 2015-03-31
US20100215102A1 (en) 2010-08-26

Similar Documents

Publication Publication Date Title
JP4987086B2 (ja) 画像符号化方法及び復号方法、それらの装置、それらのプログラム並びにプログラムを記録した記録媒体
EP3038362B1 (en) Decoding method for intra predicting a block by first predicting the pixels at the boundary
US8665951B2 (en) Video compression and encoding method
JP4700491B2 (ja) 適応係数スキャン順序付け
TW201826786A (zh) 用於視訊寫碼之低複雜度符號預測
JP2006511113A (ja) 選択されたマクロブロックにおける動き推定のスキップを伴うビデオエンコーディング
JP2009021775A (ja) 符号化装置及び符号化方法
JP2008011431A (ja) 画像符号化装置
CN112740691A (zh) 用于编码和解码表示至少一个图像的数据流的方法和设备
JP6564315B2 (ja) 符号化装置、復号装置、及びプログラム
JP6992825B2 (ja) 映像符号化装置、映像符号化方法、映像復号装置、映像復号方法、及び映像符号化システム
JP5358485B2 (ja) 画像符号化装置
CN105706447A (zh) 动画图像编码设备、动画图像解码设备、动画图像编码方法、动画图像解码方法以及程序
JP5276957B2 (ja) 動画像符号化方法及び装置

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120417

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120424

R151 Written notification of patent or utility model registration

Ref document number: 4987086

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150511

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350