JPH07212760A - 動画像の動き補償予測符号化方法 - Google Patents

動画像の動き補償予測符号化方法

Info

Publication number
JPH07212760A
JPH07212760A JP285794A JP285794A JPH07212760A JP H07212760 A JPH07212760 A JP H07212760A JP 285794 A JP285794 A JP 285794A JP 285794 A JP285794 A JP 285794A JP H07212760 A JPH07212760 A JP H07212760A
Authority
JP
Japan
Prior art keywords
motion
block
area
image
motion compensation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP285794A
Other languages
English (en)
Inventor
Hirotaka Jiyosawa
裕尚 如沢
Hiroshi Kodera
博 小寺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP285794A priority Critical patent/JPH07212760A/ja
Publication of JPH07212760A publication Critical patent/JPH07212760A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/004Predictors, e.g. intraframe, interframe coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

(57)【要約】 【目的】 無意味な領域分割を禁止して領域形状情報を
軽減し、全体の符号量削減を図る。 【構成】 領域分割オンオフ判定部2は、入力画像1を
複数の矩形ブロックに分割し、各ブロックごとに領域分
割を行うか否か判定する。領域分割部4は、入力画像1
に対し、領域分割オンと判定された領域について被写体
の形状等を考慮して領域分割を行い、領域形状情報5を
出力する。動き補償部10では、領域形状情報5に従
い、局部復号画像9に対して小領域及び残りの矩形ブロ
ックごとに動き情報7を作用させ、動き補償予測画像1
1を生成する。多重化部26は、差分画像符号化デー
タ、領域形状情報符号化データ、動き情報符号化データ
を多重化する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、画像通信、画像記録、
画像編集等に利用される画像信号のディジタル圧縮符号
化方法に関し、詳しくは、動画像について、動き補償予
測画像と入力画像との差分(動き補償予測誤差)を符号
化する予測符号化方法に関する。
【0002】
【従来の技術】従来、動画像のディジタル圧縮符号化に
おいて、動画像信号の時間冗長性を抑圧する手法とし
て、動き補償フレーム間予測がしばしば用いられる。こ
の予測符号化法では、通常、画像を16画素×16ライ
ン等の矩形ブロックに区切り、各ブロック毎に参照フレ
ームとの間の動き量(動きベクトル)を検出し、参照フ
レーム画像を動きベクトル分シフトして生成した予測画
像(動き補償予測画像)と入力画像との差分(動き補償
予測誤差)信号を符号化する。この動き補償により、動
画像のフレーム間の相関度は大幅に向上し、単純フレー
ム間予測に比べ大幅な情報圧縮が得られる。さらに、動
き補償予測誤差信号に対して離散コサイン変換(DC
T:Discrete Cosine Transfrom)やサブバンド分割
を施こすことにより、空間方向の冗長性も抑圧され、一
層の情報圧縮が図られる。このため、テレビ電話/会議
用等のビデオ符号化標準ITU−T H.261や、蓄
積メディア用のビデオ符号化標準ISO/IEC 11
172(MPEG)などでは、動き補償フレーム間予測
による残差信号をDCT符号化するハイブリッド符号化
構成が採用されている。
【0003】ITU−T(前CCITT)勧告H.26
1は、「p×64kb/sオーディオビジュアルサービ
ス用ビデオ符号化方式」と題され、64kb/s(p=
1)から2Mb/s(p=30)までのビットレートを
用いる通信用のビデオ符号化標準で、勧告成立は199
0年12月である。アプリケーションとしてはテレビ電
話、テレビ会議等が挙げられる。H.261は動画像信
号の時間的冗長度を動き補償(MC)予測により抑圧
し、各フレームの空間的冗長度を離散コサイン変換(D
CT)符号化により抑圧する。以下、図4を用いてH.
261の符号化アルゴリズムを説明する。
【0004】まず、入力画像1は動き検出部6に入力さ
れ、1フレームが16画素×16ラインのマクロブロッ
クと称される複数の矩形ブロックに分割される。動き検
出部6では、入力画像中の各マクロブロックごとに、参
照フレーム(H.261ではフレームメモリ8に蓄積さ
れた直前の符号化済フレームを使用)との間の動き量を
検出する。ここで、各マクロブロックの動きは、参照フ
レーム中で着目マクロブロックとのまッチング度が最も
高いブロックの座標と、着目マクロブロックの座標との
変位(動きベクトル)として表される。動きの探索範囲
は、着目マクロブロックの座標とその周囲の±15画素
×±15ラインに制限される。得られた動き情報は、動
き補償部10に送られると共に動き情報符号化部24で
符号化される。
【0005】動き補償部10では、各マクロブロックの
動き情報(動きベクトル)とフレームメモリ8に蓄積さ
れた直前の符号化済フレームから予測画像(動き補償予
測画像)を生成する。ここで得られた予測画像が入力画
像1と共に減算器12に入力され、両者の差分画像とし
て動き補償予測誤差信号が得られる。この動き補償予測
誤差信号に対して、空間的冗長度圧縮部14でDCT/
量子化が施こされる。ここで、DCTのブロックサイズ
は8×8であり、各8×8ブロックのDCT係数が量子
化される。この空間的冗長度部14で得られた多重化イ
ンデックスは、可変長符号化部20でデータ圧縮された
後、多重化部26において、動き情報符号化部24の動
き情報の圧縮データと共に多重されて伝送される。
【0006】一方、復号側と同じ復号画像を該符号側で
も得るため、空間的冗長度圧縮部14で求まった量子化
インデックスは、差分画像伸長部16において、まず、
逆量子化部で量子化代表値に戻され、さらに逆DCT部
を通して復号差分画像となる。この復号差分画像と動き
補償予測画像は加算器18で加算され、局部復号画像と
なる。この局部復号画像はフレームメモリ8に蓄積さ
れ、次の入力画像フレームの符号化時に参照画像として
用いられる。
【0007】ISO/IEC 11172(MPEG
1)は、コンバクトディスク(CD)、ハードディスク
等のディジタル蓄積メディア用のビデオ符号化標準であ
り、国際標準(IS)としての成立は1992年11月
である。アプリケーションとしては、CDカラオケやV
ideoCDに代表されるCD(転送速度1.5MB/
s)へのアミューズメント画像の蓄積、マルチメディア
バーソナルコンピュータやワークステーションへの表示
を目的とした動画像蓄積などが挙げられる。
【0008】MPEG1の符号化アルゴリズムは、動き
補償予測+DCT符号化で、基本的には上記ITU−T
H.261と同様であるが、ランダムアクセス・高速再
生・リバース再生等の特殊機能を実現するため、独立再
生の単位であるGroup ofPictures(GOP)構造が新
たに導入されている。GOPを構成するピクチャとし
て、以下の3つのピクチャタイプがある。
【0009】I−Picture フレーム内符号化画面 P−Picture 片向フレーム間予測符号化画面 時間的に前に位置し、既に復号化されたP(またはI)
−Pictureを参照画像として動き補償を行う。マクロブ
ロックごとにフレーム内符号化モードとフレーム間予測
符号化モードが選択可能である。
【0010】B−Picture 両方向予測符号化画面 時間的に前に位置する復号化済みのP(またはI)−P
icture、時間的に後に位置する復号化済みのP(または
I)−Picture、両方の加算平均(内挿補間)の3種類
を参照画像として、それぞれに動き補償を行う。マクロ
ブロックごとにフレーム内/順方向フレーム間予測/逆
方向フレーム間予測/内挿補間フレーム間予測の4つの
符号化モードが選択可能である。
【0011】P−およびB−Pictureで用いられる動き
補償方法はH.261と同様であるが、1/2画素精度
の補償を可能としている点が異なる。B−Pictureの両
方方向予測は、対象が蓄積用であるため符号化処理にリ
アルタイム性が要求されない点を利用したものである。
【0012】
【発明が解決しようとする課題】上記従来技術における
動き補償は、16画素×16ライン等の矩形ブロックを
1つの剛体とみなし、各ブロックの平行移動の動きのみ
を補償するものである。従って、被写体の形状等は一切
考慮に入れておらず、1ブロック内に動きの異なる物体
が複数個存在すると、正確な動き補償はもはや不可能と
なる。すなわち、このような部分では予測効率は大幅に
低下する。また、特に動きの激しい部分では予測画像に
ブロック状の不連続歪みが顕著に発生する。この不連続
歪みは高周波成分を多分に含むため、符号化効率の低下
を招くという問題があった。
【0013】上記問題を解決する手法として、本出願人
は、先に入力画像を被写体の形状に沿って領域分割し、
得られた小領域ごとに動き補償を行なう領域分割動き補
償予測符号化法を提案した(特願平5−156622
号)。この領域分割動き補償予測符号化法の構成例を図
5に示す。
【0014】以下に、図5の動作を簡単に説明する。入
力画像1はフレーム単位に、領域分割部4において、被
写体の形状等を考慮して任意形状の複数の小領域に分割
される。動き検出部6では、領域分割部4で得られた領
域形状情報に従い、入力画像と参照フレーム画像との間
の動き量を各小領域ごとに検出し、得られた動き情報を
動き補償部10に送る。動き補償部10では、領域形状
情報に従い、フレームメモリ8に蓄積された直前の符号
化済フレーム(局部復号画像)に対して、小領域ごとの
動きを作用させて動き補償予測画像を生成する。これ以
外の動作は、ほぼ図4の場合と同様であるが、領域形状
情報は領域形状情報符号化部22で符号化され、多重化
部26において、差分画像符号化データの付属情報とし
て、動き情報符号化データと共に多重化される。
【0015】この領域分割動き補償予測符号化により、
被写体の形状等を反映した任意形状の小領域ごとの動き
補償が可能となり、異なった動きを持つ複数の被写体が
動き補償の単位領域内に含まれることを回避できる。す
なわち、従来、複数の動物体を含んでいながら一つの領
域として扱われていたブロックが物体の形状に応じて複
数の領域に分割され、それぞれ別々の領域として動き補
償される。このため、特に被写体の境界やエッジにまた
がった部分での動き補償予測効率が向上し、フレーム間
差分信号の符号化に要する符号量を大幅に削減すること
ができる。
【0016】しかし、上記手法では、一定の大きさに区
切られたブロックと異って任意形状の小領域を扱うた
め、領域形状情報を伝送する必要がある。領域形状情報
の符号化には例えばチェイン符号化などが用いられる
が、領域形状が複雑になると非常に莫大な符号量を発生
する。このため、任意形状小領域ごとの動き補償により
予測性能が向上し、フレーム間予測誤差信号の符号量が
削減されても、領域形状情報の符号化データがその削減
分を上回ることも頻繁に起こり得る。
【0017】本発明の目的は、領域分割動き補償予測符
号化法の上記問題点を踏まえ、不要な、あるいは無意味
な領域分割を禁止することによって領域形状情報を節減
し、フレーム間予測誤差信号の符号化に要する符号量と
動き情報とを併せたトータルの符号量の削減を図ること
にある。
【0018】
【課題を解決するための手段】上記目的達成のため、本
発明では、領域分割を行なうに先だって、入力画像を予
め一定の大きさの矩形等の複数ブロックに分割し、領域
分割を行なうか否かを各ブロックごとに判定する領域分
割オンオフ判定手段を設け、領域分割オンオフ判定手段
により領域分割オフと判定されたブロックを領域分割の
対象から除去してブロックごとに動き補償を行ない、そ
れ以外の領域について領域分割を行なって任意形状の小
領域ごとに動き補償することを特徴とする。
【0019】
【作用】画面内には領域分割の不要な部分、あるいは領
域分割が得策でない部分が多々存在する。たとえば、ブ
ロック内分散の非常に小さいブロックは、空や無地の背
景など、領域分割の不要な部分がほとんどである。この
ような部分を敢えて絵領域分割することは無意味な領域
形状情報を増すのみであり、無駄である。逆に、ブロッ
ク内分散の非常に大きいブロックは絵柄が非常に細かい
部分であり、膨大な領域形状情報を必要とする。このた
め、このような部分での領域分割は避けた方が得策であ
る。また、従来の矩形ブロックごとの動き補償により十
分に予測が当たる部分においても、敢えて領域分割を行
なって領域形状情報を増やすことは望ましくない。
【0020】本発明では、このような観点から領域分割
オンオフの判定基準を決めて、領域分割の不要な部分、
あるいは領域分割が得策でない部分は領域分割の対象か
ら除外して矩形等のブロックごとに動き補償を行う。こ
れにより、全画面を対象として領域分割する場合に比
べ、フレーム全体として領域形状情報を削減することが
でき、被写体の形状等を反映した任意形状の小領域ごと
の動き補償による符号量削減効果とあいまって、符号量
削減の一層の高効率化を図ることが可能となる。
【0021】
【実施例】以下、図面により本発明の一実施例を詳細に
説明する。
【0022】図1に本発明の一実施例の構成図を示す。
図1において、図4及び図5と同一あるいは似類の機能
の部分には同じ符号が付されている。以下に図1の動作
を説明する。
【0023】まず始めに、入力画像(1フレーム分)1
は領域分割オンオフ判定部2に入力される。領域分割オ
ンオフ判定部2では、1フレーム分の入力画像を、例え
ば1ブロックが16画素×16ライン等の矩形からなる
複数ブロックに分割して、後述の判定基準に従って領域
分割を行なうか否かを各矩形ブロックごとに判定し、そ
の判定結果である領域分割オンオフ情報3を領域分割部
4に送る。領域分割オンオフ情報は各ブロックと1対1
に対応する複数ビットからなり、各ビットは該当ブロッ
クが領域分割可(領域分割オン)の場合は“1”、領域
分割否(領域分割オフ)の場合は“0”を示す(勿論、
この逆でもよい)。
【0024】領域分割部4では、領域分割オンオフ判定
部2から送られる領域分割オンオフ情報3に基づき、入
力画像1中の領域分割の対象領域について、該入力画像
1に含まれる被写体の形状等を考慮して領域分割を行な
う。領域分割の手法段としては、K平均クラスタリング
やフィルタリング処理による領域抽出などを用いること
ができる(高木幹雄、下田陽久監修「画像解析ハンドブ
ック」、東京大学出版会)。
【0025】K平均クラスタリングは、初期状態として
適当なクラスタを与え、そのメンバ(個体)を組替える
処理を反復的に繰り返すことにより、よりよいクラスタ
を求めていくクラス分け(分類)方法の1つです。以下
に、本処理を画像信号に対して適用し、領域分割を行う
場合の処理の流れを簡単に示す。
【0026】ステップ1;任意の初期クラスタを与え
る。たとえば、画像信号の領域分割に応用する場合に
は、画像を16画素×16ライン等のブロックに分割
し、これを初期クラスタとする。 ステップ2;初期クラスの重心を求める。 ステップ3;個体(画素)と全クラスの重心との間のユ
ークリッド距離を計算し、それぞれの個体(画素)を距
離が最小となるクラスタに配置する。RGB画像の領域
分割の際のユークリッド距離の計算式の一例を以下に示
す。
【0027】
【数1】
【0028】ここで、(R、G、B)は着目する個体の
濃淡値座標、(Rc、Gc、Bc)は距離計算の対象クラ
スタの重心座標を示す。この3次元ユークリッド距離を
用いることにより、明るさや色彩の似た個体(画素)が
1クラスタとして分類される。すなわち、明るさ・色彩
を用いた領域分割が可能となる。
【0029】また、濃淡だけでなく、位置座標(x、
y)も考慮した距離計算もしばしば用いられる。その計
算式の一例を以下に示す。
【0030】
【数2】
【0031】ここで(xc、yc)は距離計算の対象クラ
スタの重心の位置座標である。この5次元ユークリッド
距離を用いることにより、明るさや色彩の似てかつ位置
的に近い個体(画素)が1クラスタとして分類される。
すなわち、明るさ・色彩・位置を用いた領域分割が可能
となる。 ステップ4;再配置後の状態で各クラスタの重心を再計
算する。 ステップ5;再配置のために移動した個体数(画素数)
がある閾値以下であれば収束したとみなし、処理を終了
する。それ以外の場合はステップ3に戻って処理を繰り
返す。
【0032】フィルタリング処理はエッジ検出フィルタ
などを画像に施し、得られたエッジ情報から領域の境界
線を得る方法です。但し、エッジ検出フィルタから得ら
れるエッジは途切られたり、連続でないため、エッジの
つなぎあわせ処理が必要となる。エッジ検出フィルタの
一例を図6に示す。
【0033】図1に戻り、領域分割部4より得られる領
域形状情報5は、動き検出部6および動き補償部10に
入力される。動き検出部6では、領域形状情報5に従
い、入力画像1と参照フレーム画像との間の動き量を、
領域分割の対象領域では、各小領域ごとに検出し、それ
以外の領域では各矩形ブロックごとに検出する。
【0034】動き検出部6で得られた各領域およびそれ
以外の各矩形ブロックごとの動き情報7は、動き補償部
10に入力される。動き補償部10では、領域形状情報
5に従い、フレームメモリ8に蓄積されている参照フレ
ームの局部復号画像9に対して小領域と矩形ブロックご
との動き情報7を作用させ、動き補償予測画像11を生
成する。
【0035】ここで、動き補償の方法としては、平行移
動補償、アフィン変換を用いた平行移動・回転・拡大/
縮小補償等が例として上げられる。
【0036】平行移動補償は、物体の平行移動の動きの
みを補償するもので、現在フレームの座標を(x,
y)、参照フレーム中のマッチング先の座標を(x′,
y)とすると、以下の式により表現される。
【0037】
【数3】
【0038】これは、現在フレームの座標(x,y)に
ある物体は、参照フレーム中の座標を(x,y)から水
平方向にυx、垂直方向にυyだけ平行移動した点
(x′,y′)に存在するという意味である。(υx
υy)は動きベクトルとも呼ばれる。フレーム間予測を
行なうに当たって、単純に前フレームの同じ位置の画像
を予測画像とするのでなく、動きベクトル分シフトした
位置の画像を予測画像とすることにより、予測誤差を大
幅に低減することができる。
【0039】一方、アフイン変換を用いた平行移動・回
転・拡大/縮小補償は次式で表現される。
【0040】
【数4】
【0041】ここで、a=d=1,b=c=0の時は、
上記の平行移動補償と全く同じである。a>1の場合は
水平方向の拡大、0<a<1の場合は縮小となる。同様
に、d>1の場合は垂直方向の拡大、0<d<1の場合
は縮小となる。また、次式
【0042】
【数5】
【0043】の場合には角度θによる回転を表すことが
できる。
【0044】さらに、拡大/縮小、回転さらに平行移動
を組み合わせた補償ももちろん可能であり、平行移動だ
けでは表しきれなかった様々な物体の動きを表現するこ
とが可能となる。これにより、動き補償の性能を大幅に
向上させることができる。
【0045】動き補償予測画像11は入力画像1と共に
減算器12に入力され、それらの差分データすなわち動
き補償予測誤差信号13について、空間冗長度圧縮部1
4において空間冗長度の抑圧が行なわれる。該空間冗長
度圧縮部14より出力される差分画像圧縮データ15
は、現在符号化フレームの局部復号画像19を得るた
め、1差分画像伸長部16にて差分画像伸長データ17
に戻される。この差分画像圧縮データ17は空間冗長度
を抑圧された動き補償予測差信号である。該差分画像圧
縮データ17は加算器18にて動き補償予測画像11と
加算されて、現符号化フレームの局部復号画像19とな
り、これがフレームメモリ8に蓄積され、以降のフレー
ムの符号化にて参照される。
【0046】一方、動き補償予測誤差信号13に対する
差分画像圧縮データ15は可変長冗符号化部(差分画像
符号化部)20にて符号化され、差分画像符号データ2
1となる。領域形状情報5は領域形状情報符号化部22
にて符号化され、領域形状情報符号化データ23とな
る。また、動き情報7は動き情報符号化部24にて符号
化され、動き情報符号化データ25となる。これらの差
分画像符号化データ21、領域形状情報符号化データ2
3、動き情報符号データ25は多重化部26において多
重化され、多重化データ27として伝送または蓄積され
る。
【0047】なお、図1では省略したが、入力画像1は
上記領域分割+動き検出+動き補償の各処理に要する時
間だけ遅延して演算器して入力する必要があり、この時
間調整のためのバッファ手段が演算器12の前等に設け
られる。
【0048】図2は、図1中の領域分割オンオフ判定部
2の第1の実施例を示す構成図である。入力画像1は、
まず、矩形ブロック化部28にて16画素×16ライン
等の複数の矩形ブロックにブロック化され、ブロック情
報29となる。ブロック情報29は分散計算部30に入
力され、各ブロックごとに濃淡値の分散すなわちブロッ
ク内分散値(VAR)31が求められる。座標(x,
y)、ブロックサイズをM画素×Nライン、着目するブ
ロックの濃淡値の平均をAVEとした場合、ブロックの
濃淡値の分散VARは次式で求められます。
【0049】
【数6】
【0050】ブロック内分散値(VAR)31は比較条
件32と共に比較部33に入力される。比較部33の処
理は以下の条件式で表される。
【0051】 if(VAR cond threshold) segment−off() else segment−on() ここで、比較条件32として、例えばcond≦threshold=
MINVARとした場合、ブロック内分散値VARが閾
値MINVARより小さいブロックが領域分割の対象か
ら除去される。これは、空や壁等の濃淡変化が平坦な部
分すなわブロック内分散値の小さい部分を領域分割の対
象から除外する場合に有効である。すなわち、このよう
な平坦部分を領域分割しても、予測効率の向上は期待で
きない上、領域形状情報が増加するために逆効果となる
ことが多いためである。閾値MINVARには、空や壁
等が領域分割から除外されるように経験的に得られた値
を「予め定められた閾値」として用いることができる。
但し、画像全体の分散が小さく、「予め定められた閾
値」ではほとんどの領域が領域分割の対象外となり、任
意形状小領域ごとの動き補償の効果が得られない場合が
起こり得る。また、逆に画像全体の分散が大きく、「予
め定められた閾値」ではほとんどの領域が領域分割の対
象外となり、領域形状情報が増え過ぎて任意形状小領域
ごとの動き補償の効果が相殺されてしまう場合も起こり
得る。このような場合、閾値を入力画像の統計的性質
(分散等)に応じて適宜調整し、常に最適なゲインが得
られるように調整すればよい。
【0052】一方、比較条件32として、cond≧thresh
old=MAXVARとした場合、ブロック内分散値VAR
が閾値MAXVARより大きいブロックが領域分割の対
象から除去される。これは、絵柄が非常に細い部分すな
わちブロック内分散値の大きい部分を領域分割の対象か
ら除外する場合に有効である。すなわち、このような絵
柄の細かい部分を領域分割しても、領域形状が複雑にな
るため、領域形状情報が増え過ぎて、逆効果となること
が多いためである。閾値MAXVARには、絵柄の細か
い部分が領域分割から除去されるように経験的に得られ
た値を「予め定められた閾値」として用いることができ
る。但し画像全体の分散が小さく、「予め定められた閾
値」ではほとんどの領域が領域分割の対象となり、領域
形状情報が過ぎて任意形状小領域ごとの動き補償の効果
が相殺されてしまう場合が起こり得る。また、逆に画像
全体の分散が大きく、「予め定められた閾値」ではほと
んどの領域が領域分割の対象外となり、任意形状小領域
ごとの動き補償の効果が得られない場合も起こり得る。
このような場合、閾値を入力画像の統計的性質(分散
等)に応じて適宜調整し、常に最適なゲインが得られる
ように調整すればよい。
【0053】上記のように、閾値MINVARは空や壁
等の濃淡変化が平坦な部分すなわちブロック内分散値の
小さい部分を領域分割の対象から除去する場合、閾値M
AXVARは絵柄が非常に細かい部分すなわちブロック
内分散値の大きい部分を領域分割の対象から除去する場
合に用いられる。したがって、閾値MINVARは4,
8等の小さい値、閾値MAXVARは300,500等
の大きい値をとる。
【0054】図3は、図1中の領域分割オンオフ判定部
2の第2の実施例を示す構成図である。入力画像(フレ
ーム分)1は、まず矩形ブロック化部28にて図2と同
様にブロック化され、ブロック情報29となる。ブロッ
ク情報29は矩形ブロック動き補償部34に入力され、
各ブロックごとに動き補償予測が行なわれる。ここで、
入力画像1と動き補償予測画像との間の平均2乗予測誤
差(MSE)35がブロックごとに求められて出力され
る。いま、入力画像の座標(x,y)の画素の濃淡値を
I(x,y)、参照画像の座標(x,y)の画素の濃淡
値をI′(x,y)、ブロックサイズをM画素×Nライ
ン、ブロックの動きベクトルを(vx,vy)とした場
合、ブロックの濃淡値の平均2乗予測誤差MSEは次式
で求められる。
【0055】
【数7】
【0056】平均2乗予測誤差35は比較条件36と共
に比較部37に入力される。比較部37の処理は次の条
件式で表される。
【0057】 if(MSE cond threshold2) segment−off() else segment−on() ここで、比較条件36として、例えばcond≦threshold
2=MINMSEとした場合、矩形ブロックごとの動き
補償による平均2乗誤差MSEが閾値MINMSEより
小さいブロックが領域分割の対象から除去される。
【0058】図2のブロック内分散値を利用する方法
は、画像の局所的な内容に応じて領域分割のオンオフを
制御する方法である。これは、平坦部や絵柄の泡かい部
分の領域分割を禁止することにより、無意味な形状情報
の増加を防ぐものである。一方、図3の矩形ブロックと
の動き補償予測による平均2乗誤差を利用する方法は、 (a)矩形ブロックとの動き補償でも十分な予測性能が
得られる部分 (b)静止部分 など、予測効率向上の意味では領域分割の不要な部分の
領域分割を禁止し、形状情報の増加を抑える方法であ
る。それぞれの制御が作用する(効果の現れる)部位は
異なるが、無意味な領域形状情報の増加を抑えるという
点で、いずれも同じ作用効果をもたらすものである。
【0059】次に、図7乃至図11に領域分割オフオン
判定部2および領域分割部4での処理の具体的イメージ
を示す。
【0060】図7は入力画像(1フレーム分)1の一例
である。領域分割オフオン判定部2では、図7の入力画
像を図8のような複数の矩形ブロックに分割し、各矩形
ブロックごとに、図2や図3で説明したような判定基準
に従って領域分割を行うか否か判定する。図9は領域分
割オンオフ判定結果であり、領域分割オンのブロックに
は“1”、領域分割オフのブロックには“0”のビット
(フラグ)を立てる。この矩形ブロックごとの領域分割
オン/オフを示すビットの集合からなる領域分割オンオ
フ情報3が領域分割部4に送られる。
【0061】領域分割部4では、領域分割オンオフ情報
3に基づき、図7の入力画像中、図10に斜線で示す領
域について、入力画像に含まれる被写体の形状等を考慮
して任意形状の小領域に分割し、領域形状情報5を出力
する。図11は最終の領域分割結果であり、図10の斜
線領域が領域1〜4の4つに分割されることを示してい
る。また、図13に、図11の領域分割に対応する領域
形状情報の構成例を示す。図13は領域の輪郭線をチエ
イン符号化した例である。ここで、チエイン符号化は、
2値画像のデータ圧縮法の1つで、白黒領域の境界のア
ドレスを符号化するものである。画像を領域の輪郭まま
たは線分要素に沿って追跡し、その方向を量子化して量
子化された数値を符号とする。通常は図15の例に示す
ように8方向に量子化することが多く、この場合、符号
は0−7の数値列、符号長は3ビートとなる。
【0062】図13の領域形状情報を得る場合、領域分
割部4では、図10の斜線部(領域分割オン領域)に着
目して、例えば画面左上からラスタスキャンしていき、
未符号化の境界線に当った位置から、領域の輪郭線のチ
エイン符号化を開始し、符号化済み境界線または画面の
端、もしくは領域分割オフの矩形ブロックにあたった所
で打ち切る。これを繰り返して、図13のような領域形
状情報が得られる。矩形ブロックの大きさは予め分かっ
ており、動き検出部6では、図13のような領域形状情
報が与えられれば、図11のような領域分割結果を再現
できる。これは、復号側でも同様である。
【0063】図12は、図7の入力画像について、図5
の従来方法を適用した場合の領域分割結果であり、図1
4は、図12に対応する領域形状情報の構成例である。
図13と図14を比較すれば明らかなように、本発明の
ように矩形ブロックを残すことによって(図10、図1
1)、チエイン符号化しなければならない境界線が減少
し、領域形状情報を大幅に削減できる。
【0064】次に、図16に多重化データの構成例を示
す。(A)は図4の場合の例で、ビクチャヘッダ(1画
面の先頭を示す情報)、1画面分の動き情報符号化デー
タ、1画面分の差分画像符号化データがシーケンシャル
に多重化される。(B)は図5の場合の例で、ビクチャ
ヘッダ(1画面の先頭を示す情報)、1画面分の動き情
報符号化データ、1画面分の差分画像符号化データがシ
ーケンシャルに多重化される。(C)は図1の本発明の
場合で、多重化データの構成は(B)と同様であるが、
形状情報符号化データの部分が(B)の場合に比較して
大幅に削減できる。
【0065】
【発明の効果】請求項1の発明によれば、領域分割が不
要な部分あるいは領域分割が得策でない部分は矩形等の
ブロックごとの動き補償が行なわれ、チェイン符号等の
領域形状情報を必要としないため、全ブロックすなわち
全画面対象として領域分割する場合に比べ、フレーム全
体として領域形状情報を削減することができる。これに
より、被写体の形状等を反映した任意形状の小領域ごと
の動き補償による符号量削減効果とあいまって、符号量
削減の一層の高効率化を図ることが可能となる。
【0066】請求項2の発明によれば、ブロック内分散
値が所定閾値より小さいブロックを領域分割の対象から
除外することにより、画面内の空や無地の背景などの部
分における符号量削減に大きく寄与する。
【0067】請求項3の発明によれば、ブロック内分散
値の所定閾値より大きいブロックを領域分割の対象から
除外することにより、逆に、画面内の絵柄が非常に細か
い部分における符号化削減に大きく寄与する。
【0068】請求項4の発明によれば、ブロックを単位
として動き補償予測を行なった際の平均二乗誤差が、あ
る閾値より小さいブロックを領域分割の対象から除外す
ることにより、ブロックごとの動き補償でも十分に予測
性能が得られる部分、静止部における符号量削減に大き
く寄与する。
【図面の簡単な説明】
【図1】本発明の動画像の動き補償予測符号化方法の一
実施例の構成図である。
【図2】図1中の領域分割オンオフ判定部の第1の実施
例の構成図である。
【図3】図1中の領域分割オンオフ判定部の第2の実施
例の構成図である。
【図4】従来の矩形ブロック分割による動画像の動き補
償予測符号化方法の構成図である。
【図5】従来の任意小領域分割による動画像の動き補償
予測符号化方法の構成図である
【図6】領域分割に用いるエッジ検出フィルタの一例で
ある。
【図7】入力画像の具体例である。
【図8】矩形ブロック分割の具体例である。
【図9】領域分割オンオフ判定結果の具体例である。
【図10】領域分割オン領域の具体例である。
【図11】最終の領域分割結果の具体例である。
【図12】図4の従来方法による領域分割結果の具体例
である。
【図13】図11に対応する領域形状情報の構成例であ
る。
【図14】図12に対応する領域形状情報の構成例であ
る。
【図15】チエイン符号化を説明する図である。
【図16】図4、図5、図1に対応する多重化データの
構成例である。
【符号の説明】
1 入力画像 2 領域分割オンオフ判定部 4 領域分割部 6 動き検出部 8 フレームメモリ 10 動き補償部 12 減算器 14 空間冗長度圧縮部 16 差分画像伸長部 18 加算部 20 差分画像符号化部 22 領域形状情報符号化部 24 動き情報符号化部 26 多重化部

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 入力画像を任意形状の小領域に分割し、
    各小領域ごとに参照画像との間の動き量を検出し、該小
    領域ごとの動き量により過去の局部復号画像に対して動
    き補償を行って予測画像を生成し、該予測画像と入力画
    像との差分を符号化する方法において、 領域分割を行なうに先だって、入力画像を予め一定の大
    きさの複数ブロックに分割し、領域分割を行なうか否か
    各ブロックごとに判定し、領域分割オフと判定されたブ
    ロックを領域分割の対象から除外してブロックごとに動
    き補償を行ない、それ以外の領域について領域分割を行
    なって任意形状の小領域ごとに動き補償することを特徴
    とする動画像の動き補償予測符号化方法。
  2. 【請求項2】 請求項1記載の動画像の動き補償予測符
    号化方法において、ブロック内の画素の濃淡の分散値が
    所定閾値より小さいブロックを領域分割の対象から除外
    し、ブロックごとに動き補償を行うことを特徴とする動
    画像の動き補償予測符号化方法。
  3. 【請求項3】 請求項1記載の動画像の動き補償予測符
    号化方法において、ブロック内の画素の濃淡の分散値
    が、所定閾値より大きいブロックを領域分割の対象から
    除外し、ブロックごとに動き補償を行うことを特徴とす
    る動画像の動き補償予測符号化方法。
  4. 【請求項4】 請求項1記載の動画像の領域分割符号化
    方法において、各ブロックを単位として動き補償予測を
    行なった際の平均二乗誤差が、所定閾値より大きいブロ
    ックを領域分割の対象から除外し、ブロックごとに動き
    補償を行なうことを特徴とする動画像の動き補償予測符
    号化方法。
JP285794A 1994-01-14 1994-01-14 動画像の動き補償予測符号化方法 Pending JPH07212760A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP285794A JPH07212760A (ja) 1994-01-14 1994-01-14 動画像の動き補償予測符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP285794A JPH07212760A (ja) 1994-01-14 1994-01-14 動画像の動き補償予測符号化方法

Publications (1)

Publication Number Publication Date
JPH07212760A true JPH07212760A (ja) 1995-08-11

Family

ID=11541061

Family Applications (1)

Application Number Title Priority Date Filing Date
JP285794A Pending JPH07212760A (ja) 1994-01-14 1994-01-14 動画像の動き補償予測符号化方法

Country Status (1)

Country Link
JP (1) JPH07212760A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997044956A1 (en) * 1996-05-17 1997-11-27 Matsushita Electric Industrial Co., Ltd. Picture encoder, picture decoder, picture encoding method, picture decoding method, picture encoding program recording medium, and picture decoding program recording medium
JPH11120363A (ja) * 1997-10-09 1999-04-30 Matsushita Electric Ind Co Ltd 動物体検出方法
WO2000018126A1 (en) * 1998-09-21 2000-03-30 Sony Corporation Coding device and method, and decoding device and method
JP2009247019A (ja) * 1997-04-24 2009-10-22 Mitsubishi Electric Corp 画像復号装置、画像復号方法、画像符号化装置及び画像符号化方法
JP2010532628A (ja) * 2007-06-29 2010-10-07 トムソン ライセンシング 画像中のアーチファクトを低減させる装置および方法
JP2015530649A (ja) * 2012-08-14 2015-10-15 トムソン ライセンシングThomson Licensing ビデオシーケンスの画像の色をサンプル化する方法および色クラスタリングへの適用

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6560372B1 (en) 1996-05-17 2003-05-06 Matsushita Electric Industrial Co., Ltd. Decoding apparatus based on pixel value motion vectors and shape signal motion vectors
WO1997044956A1 (en) * 1996-05-17 1997-11-27 Matsushita Electric Industrial Co., Ltd. Picture encoder, picture decoder, picture encoding method, picture decoding method, picture encoding program recording medium, and picture decoding program recording medium
US6661928B2 (en) 1996-05-17 2003-12-09 Matsushita Electric Industrial Co., Ltd. Image encoding apparatus, image decoding apparatus, image encoding method, image decoding method, image encoding program recording medium and image decoding program recording medium
US6188796B1 (en) 1996-05-17 2001-02-13 Matsushita Electric Industrial Co., Ltd. Picture encoder, picture decoder, picture encoding method, picture decoding method, picture encoding program recording medium, and picture decoding program recording medium
US6445826B1 (en) 1996-05-17 2002-09-03 Matsushita Electric Industrial Co., Ltd. Decoping apparatus for shape and pixel value signal
US6516095B1 (en) 1996-05-17 2003-02-04 Matsushita Electric Industrial Co., Ltd. Decoding apparatus for shape signal
US6597814B2 (en) 1996-05-17 2003-07-22 Matsushita Electric Industrial Co., Ltd. Image coding for transmitting information of shape, pixel value, and coding modes
JP2009247019A (ja) * 1997-04-24 2009-10-22 Mitsubishi Electric Corp 画像復号装置、画像復号方法、画像符号化装置及び画像符号化方法
JPH11120363A (ja) * 1997-10-09 1999-04-30 Matsushita Electric Ind Co Ltd 動物体検出方法
WO2000018126A1 (en) * 1998-09-21 2000-03-30 Sony Corporation Coding device and method, and decoding device and method
JP2010532628A (ja) * 2007-06-29 2010-10-07 トムソン ライセンシング 画像中のアーチファクトを低減させる装置および方法
US8472709B2 (en) 2007-06-29 2013-06-25 Thomson Licensing Apparatus and method for reducing artifacts in images
JP2015530649A (ja) * 2012-08-14 2015-10-15 トムソン ライセンシングThomson Licensing ビデオシーケンスの画像の色をサンプル化する方法および色クラスタリングへの適用
US9911195B2 (en) 2012-08-14 2018-03-06 Thomson Licensing Method of sampling colors of images of a video sequence, and application to color clustering

Similar Documents

Publication Publication Date Title
US5731850A (en) Hybrid hierarchial/full-search MPEG encoder motion estimation
JP4261630B2 (ja) 画像符号化装置及び方法、画像符号化プログラムが記録されたコンピュータ可読記録媒体
US6192079B1 (en) Method and apparatus for increasing video frame rate
US7856059B2 (en) Determining the number of unidirectional and bidirectional motion compensated frames to be encoded for a video sequence and detecting scene cuts in the video sequence
US8325799B2 (en) Moving picture encoding method, device using the same, and computer program
US6108039A (en) Low bandwidth, two-candidate motion estimation for interlaced video
US6415055B1 (en) Moving image encoding method and apparatus, and moving image decoding method and apparatus
US5416522A (en) Motion detection apparatus for moving pictures and encoding and decoding apparatus for picture signals
JPH0879746A (ja) 動画像信号符号化方法、動画像信号符号化装置及び動画像信号記録媒体
US20070092007A1 (en) Methods and systems for video data processing employing frame/field region predictions in motion estimation
US7295711B1 (en) Method and apparatus for merging related image segments
Banh et al. Adaptive dual-cross search algorithm for block-matching motion estimation
US20040234142A1 (en) Apparatus for constant quality rate control in video compression and target bit allocator thereof
JPH07212760A (ja) 動画像の動き補償予測符号化方法
US20050276334A1 (en) Video signal coding method and video signal encoder
JP2755851B2 (ja) 動画像符号化装置及び動画像符号化方法
JPH06133299A (ja) 動きベクトル検出方法
US20040233984A1 (en) Apparatus for variable bit rate control in video compression and target bit allocator thereof
US7133448B2 (en) Method and apparatus for rate control in moving picture video compression
JP4073541B2 (ja) 動画像再符号化装置
JPH07264594A (ja) 動画像の動き補償予測符号化方法
JPH0795536A (ja) 動画像逆再生装置及び方法
JP2883592B2 (ja) 動画像復号化装置及び動画像復号化方法
JP2004015351A (ja) 符号化装置及び方法、プログラム、記録媒体
JPH0366278A (ja) 映像信号の高能率符号化方法