JP2012089905A - 画像符号化装置および画像符号化方法、画像復号化装置および画像復号化方法 - Google Patents

画像符号化装置および画像符号化方法、画像復号化装置および画像復号化方法 Download PDF

Info

Publication number
JP2012089905A
JP2012089905A JP2009004614A JP2009004614A JP2012089905A JP 2012089905 A JP2012089905 A JP 2012089905A JP 2009004614 A JP2009004614 A JP 2009004614A JP 2009004614 A JP2009004614 A JP 2009004614A JP 2012089905 A JP2012089905 A JP 2012089905A
Authority
JP
Japan
Prior art keywords
image
block
prediction
encoding
edge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009004614A
Other languages
English (en)
Inventor
Hiroo Ito
浩朗 伊藤
Muneaki Yamaguchi
宗明 山口
Shohei Saito
昇平 齋藤
Masashi Takahashi
昌史 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2009004614A priority Critical patent/JP2012089905A/ja
Priority to PCT/JP2010/000050 priority patent/WO2010082463A1/ja
Publication of JP2012089905A publication Critical patent/JP2012089905A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】エッジのような画像特徴部分に対して好適にブロックを分割することで、高画質で符号化効率の良い符号化技術及び復号化技術を提供する。
【解決手段】画像符号化装置100は、入力画像を第1のブロックに分割する第1のブロック分割部101と、第1のブロックを更に複数の第2のブロックに分割する第2のブロック分割部111と、第1のブロックまたは第2のブロックに対し、画面内予測または画面間予測により予測画像を生成する予測画像生成部112,113を備える。第2のブロック分割部111は、第1のブロックと同一画面内で隣接する符号化済みのブロックのエッジ情報に基づき第2のブロックのブロック形状を決定する。
【選択図】図1

Description

本発明は、高画質で符号化効率の良い符号化技術及び復号化技術に関する。
TV信号などの動画像データを高能率に符号化して記録あるいは伝送する手法としてMPEG(Moving Picture Experts Group)方式等の符号化方式が策定され、MPEG−1規格、MPEG−2規格、MPEG−4規格等として国際標準の符号化方式となっている。また、さらに圧縮率を向上させる方式として、H.264/AVC(Advanced Video Coding)規格等が定められている。MPEG符号化方式では1画面(1フレーム)をマクロブロック(16画素×16ライン)単位に分割して、それぞれのブロックについて画面内または画面間の相関を利用した予測符号化を行う。H.264/AVC方式では、マクロブロックをさらに16×8、8×16、8×8、8×4、4×8、4×4の小ブロックに分割するモードを有しており、MPEG−1、MPEG−2と比べて符号化を行う際のブロックについて分割種別を増やすことにより予測精度を向上し、高い圧縮率を実現している。
ブロック分割の技術に関し、例えば特許文献1には、入力画像をM×Nサイズの第1のブロックに分割し、さらに第1のブロックをm×nサイズの第2のブロックに分割し、第2のブロックの画像から抽出した特徴情報に基づいて第1のブロックの分割形状を決定することが記載されている。
特開2008−17305号公報
符号化対象の画像内にエッジなどの特徴的部分が存在すると、それを含むブロックの符号量が増大することになる。特許文献1に記載される技術によれば、例えば第2のブロックの特徴情報としてエッジの有無を検出し、エッジが存在すれば第2のブロックの形状に分割し、エッジが存在しなければ分割せず第1のブロックの形状のままとするものである。すなわちエッジの存在しない領域を大きなサイズのブロックとして扱うことで、符号量の削減を行うことができる。しかしながら、特許文献1に記載された技術ではブロックの分割方法が矩形形状に限定されているため、例えば斜め方向のエッジを含む画像においては必ずしも精度よく予測を行うことができず、復号化後の画質が低くなる、あるいは符号量が多くなるという課題がある。これは、従来の各MPEG方式に共通する課題でもある。
本発明は上記課題を鑑みてなされたものであり、その目的は、エッジのような画像特徴部分に対して好適にブロックを分割することで、高画質で符号化効率の良い符号化技術及び復号化技術を提供することにある。
本発明は、入力画像に対し、複数の符号化モードを用いて生成された予測画像との差分画像を符号化する画像符号化装置において、入力画像を所定サイズの第1のブロックに分割する第1のブロック分割部と、前記第1のブロックを更に複数の第2のブロックに分割する第2のブロック分割部と、前記第1のブロックまたは前記第2のブロックに対し、前記複数の符号化モードの中から1つの符号化モードを選択し、画面内予測または画面間予測により予測画像を生成する予測画像生成部と、前記予測画像と前記入力画像の差分画像を算出する減算部と、前記差分画像に対して周波数変換処理と量子化処理と可変長符号化処理を行い符号化ストリームを生成する符号化ストリーム生成部とを備え、前記第2のブロック分割部は、前記第1のブロックと同一画面内で隣接する符号化済みのブロックのエッジ情報に基づき前記第2のブロックのブロック形状を決定する。
本発明は、入力画像に対し、複数の符号化モードを用いて生成された予測画像との差分画像を符号化する画像符号化方法において、入力画像を所定サイズの第1のブロックに分割する第1のブロック分割ステップと、前記第1のブロックを、更に複数の第2のブロックに分割する第2のブロック分割ステップと、前記第1のブロックまたは第2のブロックに対し、前記複数の符号化モードの中から1つの符号化モードを選択し、画面内予測または画面間予測により予測画像を生成する予測画像生成ステップと、前記予測画像と前記入力画像の差分画像を算出する減算ステップと、前記差分画像に対して周波数変換処理と量子化処理と可変長符号化処理を行い符号化ストリームを生成する符号化ストリーム生成ステップとを備え、前記第2のブロック分割ステップは、前記第1のブロックと同一画面内で隣接する符号化済みのブロックのエッジ情報に基づき前記第2のブロックのブロック形状を決定する。
本発明は、符号化ストリームを復号化して復号画像を生成する画像復号化装置において、前記符号化ストリームに対して可変長復号化処理と逆量子化処理と逆周波数変換処理を行い差分画像を生成する差分画像復号化部と、前記符号化ストリームに含まれる符号化モード情報に従い復号化するブロックに分割し、画面内予測または画面間予測により予測画像を生成する予測画像生成部と、前記予測画像と前記差分画像を加算して復号画像を生成する加算部とを備え、前記予測画像生成部は、復号化対象ブロックと同一画面内で隣接する復号化済みのブロックのエッジ情報に基づき前記復号化対象ブロックのブロック形状を決定する。
本発明は、符号化ストリームを復号化して復号画像を生成する画像復号化方法において、前記符号化ストリームに対して可変長復号化処理と逆量子化処理と逆周波数変換処理を行い差分画像を生成する差分画像復号化ステップと、前記符号化ストリームに含まれる符号化モード情報に従い復号化するブロックに分割し、画面内予測または画面間予測により予測画像を生成する予測画像生成ステップと、前記予測画像と前記差分画像を加算して復号画像を生成する加算ステップとを備え、前記予測画像生成ステップは、復号化対象ブロックと同一画面内で隣接する復号化済みのブロックのエッジ情報に基づき前記復号化対象ブロックのブロック形状を決定する。
本発明によれば、高画質で符号化効率の良い画像符号化装置、画像復号化装置及びその方法を提供できる。
本発明の画像符号化装置の一実施例を示す構成ブロック図(実施例1)。 エッジ情報取得部110の動作例を説明する図。 エッジ強度を計算するために用いるフィルタ係数の例。 エッジ強度を算出するために参照する画素値。 第2のブロック分割部111によるブロック分割のモードを示す図。 画面間予測の動作例を示す図。 画面間予測符号化におけるエッジ分割モードの効果を説明する図。 画面間予測符号化におけるエッジ分割モードの効果を説明する図。 従来の画面内予測の動作を示す図。 従来の画面内予測の動作を示す図。 エッジ分割モードによる画面内予測の動作を示す図。 画面内予測符号化におけるエッジ分割モードの効果を説明する図。 画面内予測符号化におけるエッジ分割モードの効果を説明する図。 エッジ情報取得部110の他の動作例を説明する図(実施例2)。 本発明による画像復号化装置の一実施例を示す構成ブロック図(実施例3)。 実施例3の復号化処理手順を示すフローチャート。 図16における画面内予測処理の手順を示すフローチャート。 図16における画面間予測処理の手順を示すフローチャート。
以下、本発明の実施例を画像符号化装置と画像復号化装置に分けて説明する。
図1は、本発明の画像符号化装置の一実施例(実施例1)を示す構成ブロック図である。
画像符号化装置100において、第1のブロック分割部101は、入力画像150を16×16画素で構成される第1の入力画像ブロック151に分割する。減算器102は、第1の入力画像ブロック151と、後述の符号化モード選択部114から出力される予測画像ブロック155との減算処理を行い、差分画像信号152を生成する。周波数変換部103は差分画像信号152に対して、画像ブロック毎に離散コサイン変換(Discrete Cosine Transform=DCT変換)等の周波数変換を行い、周波数変換データを出力する。量子化部104はこのデータを量子化して、量子化データ153を出力する。可変長符号化部105は、量子化データ153を可変長符号化した符号化データに、符号化モード選択部114より出力する符号化モード情報や動きベクトル等の情報157を多重して符号化ストリーム154を生成し、出力する。
逆量子化部106は、量子化部104から出力される量子化データ153を逆量子化し、逆周波数変換部107はこれを逆周波数変換して、差分ブロックデータを出力する。加算器108は、差分ブロックデータと、符号化モード選択部114から出力される予測画像ブロック155を加算して復号画像156を生成する。フレームメモリ109は復号画像156を格納する。
エッジ情報取得部110は、フレームメモリ109から読み出した画像についてエッジ情報を取得する。第2のブロック分割部111は、取得されたエッジ情報に基づいて、第1のブロック分割部101から出力される入力画像ブロック151を更に細かく分割し、第2の入力画像ブロック160を出力する。エッジ情報取得部110と第2のブロック分割部111の詳細動作は後述する。
画面内予測部112は、フレームメモリ109から読み出した参照画像159から画面内予測画像を生成する。画面間予測部113は、フレームメモリ109から読み出した参照画像159から画面間予測画像を生成する。
符号化モード選択部114は、画面内予測部112で生成した予測画像と画面間予測部113で生成した予測画像のいずれか一方を選択し、選択した予測画像155を減算器102および加算器108に出力する。また、符号化モード選択部114で選択された符号化モードとブロック分割の情報157を可変長符号化部105に出力する。
本実施例では、エッジ情報取得部110と第2のブロック分割部111を設けることで、入力画像ブロック151を更に細かい第2の入力画像ブロック160に分割し、画面内予測および画面間予測を行い、最適な予測画像155を作成することに特徴がある。
以下、エッジ情報取得部110と第2のブロック分割部111の動作について詳細に説明する。
図2は、エッジ情報取得部110の動作例を説明する図である。図2において画面210は符号化対象画面であり、第1のブロック分割部101により所定サイズ(16×16画素)の第1のブロックに分割されている。画面中の矢印210aは符号化を行うブロックの順序を示し、次に符号化を行う符号化対象ブロック201、およびエッジ情報取得のために参照する隣接ブロック202〜205を拡大して示す。ここで取り上げた隣接ブロック202〜205は、符号化対象ブロック201と同一画面内で隣接し符号化順序210aに従い既に符号化が完了しているブロックであり、フレームメモリ109から読み出した復号画像である。
エッジ情報取得部110は、図2の隣接ブロック202〜205内の符号化対象ブロック201に近接するエッジ情報算出対象画素P_edge_cal(i)(i=0〜47)を選択する。そしてこれらの画素について、水平エッジ強度f、垂直エッジ強度fを取得し、〔数式1〕によりエッジ強度fを算出する。水平エッジ強度f、垂直エッジ強度fの算出方法は後述する。
Figure 2012089905
次に、画素P_edge_cal(i)(i=0〜47)の中から〔数式1〕で算出したエッジ強度が最大となる時の画素P_edge_cal(i0)を求める。そして、画素P_edge_cal(i0)におけるエッジ角度gを〔数式2〕により算出する。
Figure 2012089905
〔数式2〕で算出したエッジ角度gから、画素P_edge_cal(i0)におけるエッジ直線を〔数式3〕により算出する。なお、x、yは、画面左上端を原点とした時の画素P_edge_cal(i0)の水平、垂直座標とする。
Figure 2012089905
次に、求めたエッジ直線の有効/無効の判定を行う。〔数式3〕で算出したエッジ直線が、図2の直線220のように符号化対象ブロック201と交差する場合は、この時の画素iの座標(x、y)とエッジ角度g(i)を有効とし、これらのエッジ情報を第2のブロック分割部111に出力する。
一方、〔数式3〕で算出したエッジ直線が、図2の直線230のように符号化対象ブロック201と交差しなかった場合は、この時の画素iの座標とエッジ角度を無効とする。そして、画素P_edge_cal(i)(i=0〜47)の中から上記の画素を除いた中でエッジ強度fが最大となる画素を再度算出し、〔数式2〕によりエッジ角度を算出する。そして、再度求めたエッジ直線が符号化対象ブロック201と交差すれば有効とし、この時のエッジ情報を第2のブロック分割部111に出力する。このようにして、求めたエッジ直線が符号化対象ブロック201と交差するエッジ情報が見つかるまで、上記の処理を繰り返す。
ここで、前記〔数式1〕におけるエッジ強度f、fを計算する具体的方法を示す。
図3は、エッジ強度を計算するために用いるフィルタ係数の例で、(a)はソーベルフィルタ、(b)はプレウィットフィルタである。垂直方向フィルタは、垂直エッジ強度fを算出するために水平方向の画素値の差分を求める係数である。水平方向フィルタは、水平エッジ強度fを算出するために垂直方向の画素値の差分を求める係数である。
また図4は、エッジ強度を算出するために参照する画素値を示す。Aは画素値で、i,jは画面左上端を原点とした時の水平、垂直座標を表す。画素A(i,j)が中心画素で、これに隣接する8個の画素を用いる。
例えば、(a)のソーベルフィルタを用いた時の画素A(i,j)における垂直エッジ強度fと水平エッジ強度fは、〔数式4〕と〔数式5〕を用いて算出する。
Figure 2012089905
Figure 2012089905
フィルタ係数として、(b)のプレウィットフィルタを用いる時も同様に算出する。
以下、本実施例の動作を、画面間予測符号化と画面内予測符号化の場合に分けて説明する。
<画面間予測符号化>
画面間予測符号化を行う時の第2のブロック分割部111および画面間予測部113の動作について説明する。まず、第2のブロック分割部111の動作から説明する。
図5は、第2のブロック分割部111によるブロック分割のモードを示す図である。H.264/AVCにおいて画面間予測を行う場合、図5(1)〜(7)に示すように、16×16画素のモード、16×8モード、8×16モード、8×8モードの4通りの分割、および8×8に分割した場合の計4ブロックについて、それぞれ独立に8×8モード、8×4モード、4×8モード、4×4モードの4通りに分割が可能であり、合計7通りの分割モードが設けられている。このうち(1)の16×16モードでは、図1における第1の入力画像ブロック151がそのままのサイズ(16×16)で画面間予測部113に出力される。それ以外のモード、例えば(2)の16×8モードでは、第2のブロック分割部111にて第1の入力画像ブロック151を16×8サイズの2つのブロックに分割して画面間予測部113に出力する。以下では、第2のブロック分割部111で分割された後のブロックをサブブロックと呼ぶ。
本実施例では、第2のブロック分割部111は上記7通りのブロック分割モードに加え、エッジ情報取得部110で取得したエッジ情報に基づき、第1の入力画像ブロック151を分割する新たなモードを設ける。以下、このモードを「エッジ分割モード(edge_base division)」と呼ぶ。例えば、エッジ情報が図2の直線220で示される場合は、図5(8)に示すエッジ分割モードを設けるものである。すなわち、新しいエッジ分割モードでは、エッジ情報に対応する分割線220aに沿って、符号化対象ブロックを2つのサブブロック0,1に分割する。分割線220aはエッジ情報に従い決まるものであるから、ブロック内の任意の位置で、任意の傾きをとりえる。すなわち、2つのサブブロックの形状は矩形だけでなく台形や三角形などを含み、互いに異なる形状となることを許容する。また、符号化対象ブロック201内のすべての画素は、サブブロック0またはサブブロック1のいずれか一方のみに属し、両方のサブブロックに属する画素、またはいずれのサブブロックにも属さない画素はないこととする。
次に、画面間予測部113の動作について説明する。
画面間予測符号化とは、すでに符号化済みの参照画面内の参照画像ブロックを参照し、符号化対象画像との差分を符号化する手法である。H.264/AVCでは、符号化モードを切り替える単位としてIスライス、Pスライス、Bスライスの3種類のスライスを用いており、このうちPスライスおよびBスライスにおいては画面間予測符号化を行うことが可能である。Pスライスでは、符号化済みである時間軸上で過去の画面から参照画像ブロック1つを参照して動き補償画面間予測符号化を行う。またBスライスでは、左記に加えて同様にすでに符号化済みである時間軸上の過去の画面または未来の画面の中から任意の組み合わせで2つの参照画像ブロックを参照して動き補償画面間予測符号化を行う。
図6は、画面間予測の動作例を示す図であり、(a)はブロック分割モードが16×8モードの場合、(b)はエッジ分割モードの場合である。
図6(a)はブロック分割モード=16×8モードの場合であって、画面600は符号化対象画面を、画面610は符号化対象画面600に対して時間軸上で過去の参照画面を、画面620は符号化対象画面600に対して時間軸上で未来の参照画面を示す。符号化対象画面600における符号化対象ブロック601は、16×8サイズ(矩形)の2つのサブブロック602、603で構成される。
符号化対象画面600がPスライスの時、時間軸上で過去の参照画面610の中からサブブロック602、603と類似した領域(16×8サイズ)を探索して予測画像とする。画像間の類似度計算には、例えば二乗誤差和や差分誤差和を用いる。ここでは、サブブロック602、603の予測画像として、ブロック612、613を選んでいる。一方符号化対象画面600がBスライスの時は、サブブロック602、603の予測画像として、上記ブロック612、613に加えて、時間軸上で未来の参照画面620の中からブロック622、623を選んでいる。そして、過去と未来の2つのブロックを参照して、その平均値となる画像を予測画像とすることが可能である。
図6(b)は、本実施例により追加するエッジ分割モードの場合である。画面650は符号化対象画面を、画面660は符号化対象画面650に対して時間軸上で過去の参照画面を、画面670は符号化対象画面650に対して時間軸上で未来の参照画面を示す。符号化対象画面650における符号化対象ブロック651は、エッジ分割による例えば台形状の2つのサブブロック652、653で構成される。
符号化対象画面650がPスライスの時、サブブロック652、653は時間軸上で過去の参照画面660の中から参照画像としてブロック662、663を選ぶ。これらのブロック662、663は、サブブロック652、653のそれぞれの分割形状(ここでは台形)と同一形状を有する領域である。一方符号化対象画面650がBスライスの時、サブブロック652、653は上記ブロック662、663に加えて、時間軸上で未来の参照画面670の中から参照画像としてブロック672、673を選んでいる。これらのブロック672、673も、サブブロック652、653のそれぞれの分割形状と同一形状の領域である。そして、過去と未来の2つのブロックを参照して、その平均値となる画像を参照画像とすることが可能である。
以上のように、本実施例で追加したエッジ分割モードの場合の画面間予測は、サブブロックの形状が異なるものの、従来の矩形形状のブロック分割モードの場合と同様に行うことができる。
画面間予測部113は、図5(1)〜(8)による各ブロック分割モードによる画面間予測の中から最も符号化効率の高くなるブロック分割モードを選択する。ブロック分割モードを選択する際の評価方法としては、例えば、符号化による画質歪みと符号量の関係から最適なモードを選択するRD−Optimization方式を利用する。RD−Optimizationの詳細については次の参考文献1に記載されている。
〔参考文献1〕G. Sullivan and T. Wiegand:”Rate-Distortion Optimization for Video Compression”, IEEE Signal Processing Magazine, vol.15 no.6, pp.74-90, 1998.
図7と図8は、画面間予測符号化におけるエッジ分割モードの効果を具体的に説明する図である。
図7(b)に示す画面700は符号化対象画面であり、ここではPスライスとする。図7(a)に示す画面710は符号化対象画面700に対して時間軸上で過去の参照画面である。符号化対象画面700において、ブロック701は符号化対象ブロックを、ブロック702〜705は符号化対象ブロック701に隣接する符号化済みのブロックを示す。図8は、図7(b)におけるブロック701〜705を拡大して示したものである。これらの画面では、静止する建物751と移動する自動車752(752’)を含む画像を例とする。
図7(b)の符号化対象ブロック701は、背景の建物751と移動する自動車752の双方の一部分が混在する画像であり、建物と自動車の境界(エッジ)は斜め方向となっている。ブロック701と(a)の参照画像710との相関を考える。ブロック701内の建物の部分は静止画像であるため、参照画像710の建物751内の同一空間位置のブロック711と最も良く一致する。一方、自動車の部分は動画像であり、参照画像710の自動車752’内の対応する位置のブロック712(すなわち2つの画面で自動車の動き量だけずらした位置の画像712)と最も良く一致する。ここで、建物と自動車の境界は斜め方向となっているため、従来のH.264/AVCにおける画面間予測時のどのブロック分割方法(図5(1)〜(7))を選択しても、サブブロック内に建物と自動車が混在してしまい、符号化対象画像と予測画像の差分、即ち予測誤差を十分に小さくすることができなかった。
これに対し本実施例によるエッジ分割モードを用いた場合、図2で示した方法により符号化済みの隣接ブロック(ここではブロック702)から背景の建物と前景の自動車との境界(エッジ直線)800を抽出する。このエッジ直線800に沿って、符号化対象ブロック701を台形の形状をした2つのサブブロック801、802に分割する。すなわち建物はサブブロック801に、自動車はサブブロック802に含まれるように分割することで、建物と自動車の両方が混在するサブブロックはなくなる。そして、サブブロック801は参照画面710におけるブロック711を参照して予測画像を生成する。サブブロック802はブロック712を参照して予測画像を生成する。本実施例によれば、建物と自動車の両方が混在するサブブロックが存在しないので、従来のH.264/AVCにおける画面間予測よりも予測誤差を削減することが可能となる。
<画面内予測符号化>
次に、画面内予測符号化を行う時の第2のブロック分割部111および画面内予測部112の動作について説明する。
図9は、H.264/AVCにおける従来の画面内予測の動作を示したものである。ここでは、画面内予測符号化を行う際のブロックサイズが4×4画素単位の場合を示す。H.264/AVCにおける画面内予測では、符号化対象ブロックの左、左上、上、右上に隣接する符号化済みの4個のブロックにおける合計13個の復号化画素を用いて予測を行う。予測には、図9(1)、(2)、(4)〜(9)に示すように、上記13個の復号画素を矢印の方向に伸ばして予測画像を生成するモードと、図9(3)に示すように、隣接する復号画素の平均値から予測画像を生成するモードが存在する。これら合計9種類の予測モード(モード0〜モード8)の中からいずれか1つのモードを選択する。なお、画面内予測符号化を行う際のブロックサイズは、上記以外に8×8画素単位の場合と16×16画素単位の場合が設けられている。8×8画素単位の場合の予測モードは図9と同じく9通りであり、図9の符号化対象ブロックを4×4から8×8に拡張した動作に相当する。
一方図10は、16×16画素単位で画面内予測符号化を行う場合の動作を示したものである。16×16画素単位の場合も4×4画素単位と同様、符号化対象ブロックに隣接する復号画素を矢印の方向に伸ばして予測画像を生成するものであり、図10に示す4種類のモード(モード0〜モード3)からいずれか1つのモードを選択する。
従来のH.264/AVCに対応する動作として、第2のブロック分割部111は画面内予測時に、第1の入力画像ブロック151を3通りのサイズ(16×16画素サイズ、8×8画素サイズ、4×4画素サイズ)のいずれかのサブブロックに分割する処理を行う。また、画面内予測部112は、図9に示す9種類のモード、または図10に示す4種類のモードの中からいずれか1つのモードを選択する処理を行う。
本実施例において第2のブロック分割部111は、上記3通りのブロック分割モード(16×16画素サイズ、8×8画素サイズ、4×4画素サイズ)に加え、エッジ情報取得部110で算出したエッジ情報によって第1の入力画像ブロック151を分割するモード(エッジ分割モード)を新たに設ける。エッジ分割モードに関しては、前記画面間予測符号化時の場合と同様であり、ここでは説明を省略する。
次に、エッジ分割モードにより分割したサブブロックに対する画面内予測符号化の動作について説明する。
図11は、エッジ分割モードによる画面内予測の動作を示したものである。
図11(a)は、エッジ情報取得部110で算出したエッジ情報に基づき、第2のブロック分割部111により、第1の入力画像ブロック151(符号化対象ブロック)をサブブロック1101とサブブロック1102に分割した例を示す。そして画面内予測部112により、分割したサブブロックそれぞれに対して画面内予測を行う。予測モードとして、図10に示した予測モード0と予測モード1のいずれかのモードを適用する。
図11(b)(c)は、サブブロック1101に対する画面内予測動作を示す。サブブロック1101は、上および左に符号化済みのブロックと隣接しているため、符号化済みの上ブロックからの予測(予測モード0)と、符号化済みの左ブロックからの予測(予測モード1)のいずれかを選択する。(b)はサブブロック1101に対して予測モード0を適用した場合である。これは前記図10(1)と類似するが、図10では符号化対象ブロック全体に対して予測を適用させているのに対して、図11(b)ではサブブロック1101に対してのみ予測を適用させる点が異なる。
図11(c)はサブブロック1101に対して予測モード1を適用した場合である。この場合も前記図10(2)と類似するが、図11(c)ではサブブロック1101に対してのみ予測を適用させる点が異なる。ここで、図11(c)における画素群1104はサブブロック1101に接しておらず、画素群1104の位置に該当する復号画像をそのまま予測画像として用いた場合は予測誤差が大きくなることが予想される。これを避けるため、画素群1104およびサブブロック1101の両方に接する画素1103の値を画素群1104に複写した後に、予測画像として用いるのが有効である。
図11(d)はサブブロック1102に対して予測モード1を適用した場合である。サブブロック1102は符号化済みの上ブロックと隣接しておらず、左ブロックのみと隣接しているため、この例にて適用可能な予測モードは予測モード1のみとなる。
図12と図13は、画面内予測符号化におけるエッジ分割モードの効果を具体的に説明する図である。
図12において画面1200は符号化対象画面を、ブロック1201は符号化対象ブロックを、ブロック1202〜1205は符号化対象ブロック1201に隣接する符号化済みのブロックを示す。
また図13は、ブロック1201〜1205を拡大して示したものである。符号化対象ブロック1201は建物1251と自動車1252の一部が混在するブロックであり、建物と自動車の境界が斜め方向となっているため、従来のH.264/AVCにおける画面内予測時のブロック分割モードおよび予測モード(図9(1)〜(9)、図10(1)〜(4))では、予測誤差を十分に小さくすることができなかった。一方、本実施例におけるエッジ分割モードを用いた場合、符号化済みの隣接ブロック1202において建物と自動車とのエッジ直線1300を図2で示した方法により算出する。そして、このエッジ直線1300により符号化対象ブロック1201を台形状のサブブロック1301とサブブロック1302に分割することが可能である。サブブロック1301に対しては図11(b)または図11(c)に示す予測モードで、例えば隣接ブロック1203を参照して予測画像を生成する。サブブロック1302に対しては図11(d)に示す予測モードで、隣接ブロック1202を参照して予測画像を生成する。これより、従来のH.264/AVCにおける画面内予測よりも予測誤差を削減することが可能となる。
以上の結果、画面内予測部112で生成した画面内予測画像と画面間予測部113で生成した画面間予測画像が得られ、両者は符号化モード選択部114に入力する。
符号化モード選択部114は、入力した画面内予測画像と画面間予測画像から最適な予測画像を選択する。選択方法として、例えば前記参考文献1に記載のRD−Optimization方式を用いる。符号化モード選択部114が画面内予測画像を選択した場合には、符号化モードの情報157として、ブロック分割方法(16×16画素ブロック、8×8画素ブロック、4×4画素ブロック、エッジ分割モード)の情報を可変長符号化部105に出力する。その際、ブロック分割方法が16×16画素ブロック、8×8画素ブロック、4×4画素ブロックのいずれかの時には、図9または図10に記載の予測モードの情報を含める。一方、符号化モード選択部114で画面間予測画像を選択した場合には、符号化モードの情報157として、ブロック分割方法(図5(1)〜(8))および動きベクトル情報を可変長符号化部105に出力する。
このように、本実施例におけるサブブロックの分割方法は従来のH.264/AVCにおけるブロック分割方法と比較して、分割形状の種類(台形や三角形)とサイズの自由度が増すために符号化する画像のエッジに合わせて最適な分割が可能となり、予測誤差を削減する効果がある。また、本実施例ではブロック分割方法の追加に伴うモード数の増加は1つのみであり、符号量増加への影響を最低限にとどめることが可能である。本実施例で追加するエッジ分割モードの形状は固定パターンではなく、隣接ブロックのエッジの特徴により導き出すものである。これは、画像の空間方向への相関の強さ、すなわち画像の特徴が空間方向に類似する性質を応用してブロック分割方法を決定するものであり、予測誤差を削減することが可能となる。
以上のように実施例1の画像符号化装置では、入力画像を第1のブロックに分割し更に複数の第2のブロックに分割して符号化を行う符号化装置において、第1のブロックと同一画面内で隣接する符号化済みのブロックのエッジ情報に基づき第2のブロックのブロック形状を決定するものであり、これにより予測誤差を削減し、高画質で符号化効率の良い画像符号化を実現することが可能となる。上記実施例ではエッジ情報に基づきブロックを分割したが、符号量が大きくなる画像特徴部分を抽出しこれに基づきブロックを分割するようにしても同様の効果が得られる。
実施例2では、エッジ情報に基づきブロック分割する際、前記実施例1と異なる方法でエッジ情報を取得する場合を述べる。なお、実施例2の画像符号化装置は、実施例1(図1)の構成と同一のため、その説明は割愛する。実施例1では、図1のエッジ情報取得部110において、図2に示すように符号化対象ブロックと同一画面内で隣接する復号画像ブロックを用いてエッジ情報を算出する処理を行うものであった。これに対し実施例2では、エッジ情報取得部110は符号化対象ブロックに対して時間方向に隣接する符号化済み画面内で同一空間位置のブロックのエッジ情報を算出するものである。
図14は、エッジ情報取得部110の動作例を説明する図である。図14において画面1400は符号化対象画面を、画面1410は符号化対象画面1400より時間的に先行する符号化済みの画面で、これを復号化した復号画像画面である。また符号化対象画面1400において、ブロック1401は符号化対象ブロックを示す。ブロック1411は復号画像画面1410において、ブロック1401と画面内の空間位置が同一となるブロックを示す。
エッジ情報取得部110は、図14のブロック1411のうち、画素P_edge_cal2(i)(i=0〜224)について水平エッジ強度f、垂直エッジ強度fを取得し、実施例1における〔数式1〕によりエッジ強度fを算出する。次に、画素P_edge_cal2(i)(i=0〜224)の中から〔数式1〕で算出したエッジ強度fが最大となる画素P_edge_cal2(i1)を抽出し、実施例1における〔数式2〕により、その画素P_edge_cal2(i1)におけるエッジ角度gを算出する。次に、〔数式2〕で算出したエッジ角度gから、実施例1における〔数式3〕により画素P_edge_cal2(i1)におけるエッジ直線を算出する。〔数式3〕により算出したエッジ直線の情報を符号化対象ブロック1401に適用し、サブブロックに分割するものである。
本実施例におけるサブブロックの分割方法は、実施例1と同様、従来のH.264/AVCにおけるブロック分割方法と比較して分割形状の種類(台形や三角形)とサイズの自由度が増すために符号化する画像のエッジ(特徴)に合わせて最適な分割が可能となり、予測誤差を削減する効果がある。また、本実施例ではブロック分割方法の追加に伴うモード数の増加は1つのみであり、符号量増加への影響を最低限にとどめることが可能である。本実施例で追加するエッジ分割モードの形状は固定パターンではなく、時間的に隣接する画面の画像特徴により導き出すものである。これは、画像の時間方向への相関の強さ、すなわち画像の特徴が時間方向に類似する性質を応用してブロック分割方法を決定するものであり、予測誤差を削減することが可能となる。
以上のように、実施例2の画像符号化装置では、入力画像を第1のブロックに分割し更に複数の第2のブロックに分割して符号化を行う符号化装置において、第1のブロックに対して時間方向に隣接する符号化済み画面における同一空間位置のブロックのエッジ情報に基づき第2のブロックのブロック形状を決定するものであり、これにより予測画素を削減し、高画質で符号化効率の良い画像符号化を実現することが可能となる。上記実施例ではエッジ情報に基づきブロックを分割したが、符号量が大きくなる画像特徴部分を抽出しこれに基づきブロックを分割するようにしても同様の効果が得られる。
図15は、本発明による画像復号化装置の一実施例(実施例3)を示す構成ブロック図である。
画像復号化装置1500において、可変長復号化部1501は、入力した符号化ストリーム1550に対して可変長復号化を行い、予測差分の周波数変換成分である量子化データ1551と、ブロックサイズや動きベクトルなどの予測処理に必要な符号化モード情報1555を取得する。逆量子化部1502は、量子化データ1551を逆量子化し逆量子化データを出力する。逆周波数変換部1503は、逆量子化データを逆周波数変換して差分ブロックデータ1552を出力する。加算器1504は、差分ブロックデータ1552と後述する予測画像ブロック1556を加算し、復号画像1553を出力する。復号画像1553は画像復号化装置1500から出力されるとともに、フレームメモリ1505に格納される。
エッジ情報取得部1506は、フレームメモリ1505から読み出した画像についてエッジ情報1557を出力する。画面内予測部1507は、可変長復号化部1501から取得した符号化モード情報1555が画面内予測符号化モードだった場合に、フレームメモリ1505から読み出した参照画像1554により画面内予測画像を生成し、予測画像ブロック1556として加算器1504に出力する。画面間予測部1508は、可変長復号化部1501から取得した符号化モード情報1555が画面間予測符号化モードだった場合に、フレームメモリ1505から読み出した参照画像1554により画面間予測画像を生成し、予測画像ブロック1556として加算器1504に出力する。
以下、エッジ情報取得部1506と画面内予測部1507及び画面間予測部1508の動作について詳細に説明する。
エッジ情報取得部1506は実施例1または実施例2における動作と同様である。なお、実施例1では図2の画面210を符号化対象画面、ブロック201を符号化対象ブロックとしていたが、本実施例における復号動作では、画面210を復号化対象画面、ブロック201を復号化対象ブロックに読み替える。なお、図2のブロック202〜205は実施例1における動作において復号画像を示しており、本実施例においてもそのまま適用することができる。これにより、復号化対象ブロック201に対するエッジ直線220を取得して、エッジ情報1557を出力する。また実施例2では図14の画面1400を符号化対象画面、ブロック1401を符号化対象ブロックとしていたが、本実施例における復号動作では、画面1400を復号化対象画面、ブロック1401を復号化対象ブロックに読み替える。
次に、画面内予測部1507は、可変長復号化部1501から取得した符号化モード情報1555が画面内予測符号化モードだった場合に予測画像ブロック1556を生成する。画面内予測部1507は、符号化モード情報1555からブロック分割モードと予測モードの情報を取得する。ブロック分割モードは、16×16画素サイズ、8×8画素サイズ、4×4画素サイズ、エッジ分割モード、のいずれかである。ブロック分割モードが16×16画素サイズの場合は、次に符号化モード情報1555から予測モードを取得する。この場合の予測モードは図10に示す予測モード0〜予測モード3のいずれかである。ブロック分割モードが8×8画素サイズまたは4×4画素サイズの場合も、符号化モード情報1555から予測モードを取得する。この場合の予測モードは図9に示す予測モード0〜予測モード8のいずれかである。
ブロック分割モードがエッジ分割モードの場合は、エッジ情報取得部1506で取得したエッジ情報1557に基づいて、復号対象ブロックの各サブブロックの形状を求める。次に符号化モード情報1555から各サブブロックの予測モードを取得する。予測モードは図11に示す予測モード0〜予測モード1のいずれかである。画面内予測部1507は、フレームメモリ1505から読み出した参照画像1554により上記の予測モードに応じた画面内予測画像を生成し、予測画像ブロック1556として出力する。
一方画面間予測部1508は、可変長復号化部1501から取得した符号化モード情報1555が画面間予測符号化モードだった場合に予測画像ブロック1556を生成する。画面間予測部1508は、符号化モード情報1555からブロック分割モードと動きベクトルの情報を取得する。ブロック分割モードは図5(1)〜(8)のいずれかである。ブロック分割モードが図5(1)〜(7)の場合は、次に符号化モード情報1555から各サブブロックの動きベクトル情報を取得する。
ブロック分割モードが図5(8)のエッジ分割モードの場合は、エッジ情報取得部1506で取得したエッジ情報1557に基づいて復号対象ブロックの各サブブロックの形状を求める。次に符号化モード情報1555から各サブブロックの動きベクトル情報を取得する。画面間予測部1508は、フレームメモリ1505から読み出した参照画像1554により上記の予測モードに応じた画面間部予測画像を生成し、予測画像ブロック1556として出力する。
図16は、本実施例における1フレームの復号化処理手順を示すフローチャートである。まず、1フレーム内のすべてのブロックに対して、以下の処理を行う(S1601)。すなわち、入力ストリームに対して可変長復号化処理(S1602)、逆量子化処理(S1603)、および逆周波数変換処理(S1604)を施して予測差分を復号化する。続いて、対象ブロックがどの方法(画面内、画面間)で予測符号化されているかを判定する(S1605)。判定の結果に従い、画面内予測処理(S1606)もしくは画面間予測処理(S1607)を実行して予測画像を生成する。生成した予測画像と逆周波数変換処理(S1604)で生成した予測差分から復号化画像生成処理(S1608)を行う。以上の処理をフレーム中のすべてのブロックに対して実施し(S1609)、画像1フレーム分の復号化が終了する。
図17は、図16に示す画面内予測処理(S1606)の手順を更に詳細に示すフローチャートである。まず、ブロック分割モードがエッジ分割モードかを判定する(S1701)。エッジ分割モードである場合(S1701がYESの時)には、エッジ情報に基づくブロック分割処理(S1702)を行い、図16の可変長復号化処理(S1602)にて復号した符号化モード情報から画面内予測モードを取得する(S1703)。一方、ブロック分割モードがエッジ分割モードでない場合(S1701がNOの時)には、図16の可変長復号化処理(S1602)にて復号した符号化モード情報からブロック分割モードを取得し(S1704)、さらに画面内予測モードを取得する(S1705)。次に、上記いずれかの方法により取得したブロック分割モードと画面内予測モードから画面内予測画像生成処理(S1706)を行い、画面内予測画像の生成処理が終了する。
図18は、図16に示す画面間予測処理(S1607)の手順を更に詳細に示すフローチャートである。まず、ブロック分割モードがエッジ分割モードかを判定する(S1801)。エッジ分割モードである場合(S1801がYESの時)には、エッジ情報に基づくブロック分割処理(S1802)を行い、図16の可変長復号化処理(S1602)にて復号した符号化モード情報から動きベクトルを取得する(S1803)。一方、ブロック分割モードがエッジ分割モードでない場合(S1801がNOの時)には、図16の可変長復号化処理(S1602)にて復号した符号化モード情報からブロック分割モードを取得し(S1804)、さらに動きベクトルを取得する(S1805)。次に、上記いずれかの方法により取得したブロック分割モードと動きベクトル情報から画面間予測画像生成処理(S1806)を行い、画面間予測画像の生成処理が終了する。
このように、復号対象ブロックのブロック分割モードが図5(8)に示すエッジ分割モードである場合は、エッジ情報取得部1506から出力されるエッジ情報1557に基づき、復号対象ブロックを台形や三角形の形状を含むサブブロックに分割し、各サブブロックに対応する予測画像を生成する。この場合、復号化時に取得するエッジ情報は符号化時に取得したエッジ情報と同一になるので、符号化時と同一形状のサブブロックを再度生成することができる。よって画像復号化装置は、復号対象ブロックのブロック分割方法がエッジ分割モードであることを知るだけで、原画像を忠実に復号化することができる。
以上のように、本実施例の画像復号化装置は、入力画像を第1のブロックに分割し更に複数の第2のブロックに分割して符号化された入力ストリームに対し、符号化時と同様に、第1のブロックと同一画面内で隣接する復号化済みのブロックのエッジ情報に基づき第2のブロックの分割形状を決定して復号化するものである。あるいは、符号化時と同様に、第1のブロックに対して時間方向に隣接する符号化済み画面における同一空間位置のブロックのエッジ情報に基づき第2のブロックの分割形状を決定して復号化するものである。よって、画像符号化装置での符号化処理に忠実に対応した復号化処理を行うことができ、高画質の復号画像を得ることが可能となる。上記実施例ではエッジ情報に基づきブロックを分割したが、符号量が大きくなる画像特徴部分を抽出しこれに基づきブロックを分割するようにしても同様の効果が得られる。
100…画像符号化装置
101…第1のブロック分割部
102…減算器
103…周波数変換部
104…量子化部
105…可変長符号化部
106…逆量子化部
107…逆周波数変換部
108…加算器
109…フレームメモリ
110…エッジ情報取得部
111…第2のブロック分割部
112…画面内予測部
113…画面間予測部
114…符号化モード選択部
1500…画像復号化装置
1501…可変長復号化部
1502…逆量子化部
1503…逆周波数変換部
1504…加算器
1505…フレームメモリ
1506…エッジ情報取得部
1507…画面内予測部
1508…画面間予測部。

Claims (16)

  1. 入力画像に対し、複数の符号化モードを用いて生成された予測画像との差分画像を符号化する画像符号化装置において、
    入力画像を所定サイズの第1のブロックに分割する第1のブロック分割部と、
    前記第1のブロックを更に複数の第2のブロックに分割する第2のブロック分割部と、
    前記第1のブロックまたは前記第2のブロックに対し、前記複数の符号化モードの中から1つの符号化モードを選択し、画面内予測または画面間予測により予測画像を生成する予測画像生成部と、
    前記予測画像と前記入力画像の差分画像を算出する減算部と、
    前記差分画像に対して周波数変換処理と量子化処理と可変長符号化処理を行い符号化ストリームを生成する符号化ストリーム生成部とを備え、
    前記第2のブロック分割部は、前記第1のブロックと同一画面内で隣接する符号化済みのブロックのエッジ情報に基づき前記第2のブロックのブロック形状を決定することを特徴とする画像符号化装置。
  2. 入力画像に対し、複数の符号化モードを用いて生成された予測画像との差分画像を符号化する画像符号化装置において、
    入力画像を所定サイズの第1のブロックに分割する第1のブロック分割部と、
    前記第1のブロックを更に複数の第2のブロックに分割する第2のブロック分割部と、
    前記第1のブロックまたは前記第2のブロックに対し、前記複数の符号化モードの中から1つの符号化モードを選択し、画面内予測または画面間予測により予測画像を生成する予測画像生成部と、
    前記予測画像と前記入力画像の差分画像を算出する減算部と、
    前記差分画像に対して周波数変換処理と量子化処理と可変長符号化処理を行い符号化ストリームを生成する符号化ストリーム生成部とを備え、
    前記第2のブロック分割部は、前記第1のブロックに対して時間方向に隣接する符号化済み画面内で同一空間位置のブロックのエッジ情報に基づき前記第2のブロックのブロック形状を決定することを特徴とする画像符号化装置。
  3. 請求項1または2に記載の画像符号化装置において、
    前記エッジ情報として、エッジ情報取得対象画素について水平方向と垂直方向のエッジ強度を求め、エッジ強度が最大となる画素位置とエッジ角度の情報を取得するエッジ情報取得部を備えることを特徴とする画像符号化装置。
  4. 請求項1または2に記載の画像符号化装置において、
    前記符号化ストリームには、前記第2のブロックの分割方法が前記エッジ情報に基づくものであることを示す符号化モード情報を含むことを特徴とする画像符号化装置。
  5. 入力画像に対し、複数の符号化モードを用いて生成された予測画像との差分画像を符号化する画像符号化方法において、
    入力画像を所定サイズの第1のブロックに分割する第1のブロック分割ステップと、
    前記第1のブロックを、該第1のブロックに隣接する符号化済みのブロックのエッジ情報に基づき更に複数の第2のブロックに分割する第2のブロック分割ステップと、
    前記第1のブロックまたは前記第2のブロックに対し、前記複数の符号化モードの中から1つの符号化モードを選択し、画面内予測または画面間予測により予測画像を生成する予測画像生成ステップと、
    前記予測画像と前記入力画像の差分画像を算出する減算ステップと、
    前記差分画像に対して周波数変換処理と量子化処理と可変長符号化処理を行い符号化ストリームを生成する符号化ストリーム生成ステップとを備え、
    前記第2のブロック分割ステップは、前記第1のブロックと同一画面内で隣接する符号化済みのブロックのエッジ情報に基づき前記第2のブロックのブロック形状を決定することを特徴とする画像符号化方法。
  6. 入力画像に対し、複数の符号化モードを用いて生成された予測画像との差分画像を符号化する画像符号化方法において、
    入力画像を所定サイズの第1のブロックに分割する第1のブロック分割ステップと、
    前記第1のブロックを更に複数の第2のブロックに分割する第2のブロック分割ステップと、
    前記第1のブロックまたは前記第2のブロックに対し、前記複数の符号化モードの中から1つの符号化モードを選択し、画面内予測または画面間予測により予測画像を生成する予測画像生成ステップと、
    前記予測画像と前記入力画像の差分画像を算出する減算ステップと、
    前記差分画像に対して周波数変換処理と量子化処理と可変長符号化処理を行い符号化ストリームを生成する符号化ストリーム生成ステップとを備え、
    前記第2のブロック分割ステップは、前記第1のブロックに対して時間方向に隣接する符号化済み画面内で同一空間位置のブロックのエッジ情報に基づき前記第2のブロックのブロック形状を決定することを特徴とする画像符号化方法。
  7. 請求項5または6に記載の画像符号化方法において、
    前記エッジ情報として、エッジ情報取得対象画素について水平方向と垂直方向のエッジ強度を求め、エッジ強度が最大となる画素位置とエッジ角度の情報を取得するエッジ情報取得ステップを備えることを特徴とする画像符号化方法。
  8. 請求項5または6に記載の画像符号化方法において、
    前記符号化ストリームには、前記第2のブロックの分割方法が前記エッジ情報に基づくものであることを示す符号化モード情報を含めることを特徴とする画像符号化方法。
  9. 符号化ストリームを復号化して復号画像を生成する画像復号化装置において、
    前記符号化ストリームに対して可変長復号化処理と逆量子化処理と逆周波数変換処理を行い差分画像を生成する差分画像復号化部と、
    前記符号化ストリームに含まれる符号化モード情報に従い復号化するブロックに分割し、画面内予測または画面間予測により予測画像を生成する予測画像生成部と、
    前記予測画像と前記差分画像を加算して復号画像を生成する加算部とを備え、
    前記予測画像生成部は、復号化対象ブロックと同一画面内で隣接する復号化済みのブロックのエッジ情報に基づき前記復号化対象ブロックのブロック形状を決定することを特徴とする画像復号化装置。
  10. 符号化ストリームを復号化して復号画像を生成する画像復号化装置において、
    前記符号化ストリームに対して可変長復号化処理と逆量子化処理と逆周波数変換処理を行い差分画像を生成する差分画像復号化部と、
    前記符号化ストリームに含まれる符号化モード情報に従い復号化するブロックに分割し、画面内予測または画面間予測により予測画像を生成する予測画像生成部と、
    前記予測画像と前記差分画像を加算して復号画像を算出する加算部とを備え、
    前記予測画像生成部は、復号化対象ブロックに対して時間方向に隣接する復号化済み画面内で同一空間位置のブロックのエッジ情報に基づき前記復号化対象ブロックのブロック形状を決定することを特徴とする画像復号化装置。
  11. 請求項9または10に記載の画像復号化装置において、
    前記エッジ情報として、エッジ情報取得対象画素について水平方向と垂直方向のエッジ強度を求め、エッジ強度が最大となる画素位置とエッジ角度の情報を取得するエッジ情報取得部を備えることを特徴とする画像復号化装置。
  12. 請求項9または10に記載の画像復号化装置において、
    前記予測画像生成部は、前記符号化ストリームに含まれる、符号化時のブロックの分割方法がエッジ情報に基づくものであることを示す符号化モード情報を利用することを特徴とする画像復号化装置。
  13. 符号化ストリームを復号化して復号画像を生成する画像復号化方法において、
    前記符号化ストリームに対して可変長復号化処理と逆量子化処理と逆周波数変換処理を行い差分画像を生成する差分画像復号化ステップと、
    前記符号化ストリームに含まれる符号化モードに従い復号化するブロックに分割し、画面内予測または画面間予測により予測画像を生成する予測画像生成ステップと、
    前記予測画像と前記差分画像を加算して復号画像を生成する加算ステップとを備え、
    前記予測画像生成ステップは、復号化対象ブロックと同一画面内で隣接する復号化済みのブロックのエッジ情報に基づき前記復号化対象ブロックのブロック形状を決定することを特徴とする画像復号化方法。
  14. 符号化ストリームを復号化して復号画像を生成する画像復号化方法において、
    前記符号化ストリームに対して可変長復号化処理と逆量子化処理と逆周波数変換処理を行い差分画像を生成する差分画像復号化ステップと、
    前記符号化ストリームに含まれる符号化モードに従い復号化するブロックに分割し、画面内予測または画面間予測により予測画像を生成する予測画像生成ステップと、
    前記予測画像と前記差分画像を加算して復号画像を算出する加算ステップとを備え、
    前記予測画像生成ステップは、復号化対象ブロックに対して時間方向に隣接する復号化済み画面内で同一空間位置のブロックのエッジ情報に基づき前記復号化対象ブロックのブロック形状を決定することを特徴とする画像復号化方法。
  15. 請求項13または14に記載の画像復号化方法において、
    前記エッジ情報として、エッジ情報取得対象画素について水平方向と垂直方向のエッジ強度を求め、エッジ強度が最大となる画素位置とエッジ角度の情報を取得するエッジ情報取得ステップを備えることを特徴とする画像復号化方法。
  16. 請求項13または14に記載の画像復号化方法において、
    前記予測画像生成ステップは、前記符号化ストリームに含まれる、符号化時のブロックの分割方法がエッジ情報に基づくものであることを示す符号化モード情報を利用することを特徴とする画像復号化方法。
JP2009004614A 2009-01-13 2009-01-13 画像符号化装置および画像符号化方法、画像復号化装置および画像復号化方法 Pending JP2012089905A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2009004614A JP2012089905A (ja) 2009-01-13 2009-01-13 画像符号化装置および画像符号化方法、画像復号化装置および画像復号化方法
PCT/JP2010/000050 WO2010082463A1 (ja) 2009-01-13 2010-01-06 画像符号化装置および画像符号化方法、画像復号化装置および画像復号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009004614A JP2012089905A (ja) 2009-01-13 2009-01-13 画像符号化装置および画像符号化方法、画像復号化装置および画像復号化方法

Publications (1)

Publication Number Publication Date
JP2012089905A true JP2012089905A (ja) 2012-05-10

Family

ID=42339716

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009004614A Pending JP2012089905A (ja) 2009-01-13 2009-01-13 画像符号化装置および画像符号化方法、画像復号化装置および画像復号化方法

Country Status (2)

Country Link
JP (1) JP2012089905A (ja)
WO (1) WO2010082463A1 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018502480A (ja) * 2014-11-14 2018-01-25 ホアウェイ・テクノロジーズ・カンパニー・リミテッド デジタル画像のブロックのマスクベースの処理のためのシステムおよび方法
JP2018509069A (ja) * 2015-02-08 2018-03-29 同済大学 画像符号化方法及び装置並びに画像復号方法及び装置
WO2019039324A1 (en) * 2017-08-22 2019-02-28 Panasonic Intellectual Property Corporation Of America IMAGE ENCODER, IMAGE DECODER, IMAGE ENCODING METHOD, AND IMAGE DECODING METHOD
US10523951B2 (en) 2014-11-14 2019-12-31 Huawei Technologies Co., Ltd. Systems and methods for processing a digital image
US10742976B2 (en) 2014-11-14 2020-08-11 Huawei Technologies Co., Ltd. Systems and methods for processing a block of a digital image

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2360927A3 (en) * 2010-02-12 2011-09-28 Samsung Electronics Co., Ltd. Image encoding/decoding system using graph based pixel prediction and encoding system and method
US20130259121A1 (en) * 2010-12-27 2013-10-03 Nec Corporation Video encoding device, video decoding device, video encoding method, video decoding method, and program
KR102468287B1 (ko) 2011-11-11 2022-11-18 지이 비디오 컴프레션, 엘엘씨 분할 코딩을 이용한 효과적인 예측
EP2777284B1 (en) 2011-11-11 2018-09-05 GE Video Compression, LLC Effective wedgelet partition coding using spatial prediction
IN2014KN01047A (ja) 2011-11-11 2015-10-09 Fraunhofer Ges Forschung
EP2777286B1 (en) 2011-11-11 2017-01-04 GE Video Compression, LLC Effective wedgelet partition coding

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008017305A (ja) * 2006-07-07 2008-01-24 Canon Inc 画像処理装置及び画像処理方法
WO2008016605A2 (en) * 2006-08-02 2008-02-07 Thomson Licensing Adaptive geometric partitioning for video decoding

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018502480A (ja) * 2014-11-14 2018-01-25 ホアウェイ・テクノロジーズ・カンパニー・リミテッド デジタル画像のブロックのマスクベースの処理のためのシステムおよび方法
US10523951B2 (en) 2014-11-14 2019-12-31 Huawei Technologies Co., Ltd. Systems and methods for processing a digital image
US10602186B2 (en) 2014-11-14 2020-03-24 Huawei Technologies Co., Ltd. Systems and methods for mask based processing of a block of a digital image
US10742976B2 (en) 2014-11-14 2020-08-11 Huawei Technologies Co., Ltd. Systems and methods for processing a block of a digital image
US11153564B2 (en) 2014-11-14 2021-10-19 Huawei Technologies Co., Ltd. Systems and methods for processing a block of a digital image
JP2018509069A (ja) * 2015-02-08 2018-03-29 同済大学 画像符号化方法及び装置並びに画像復号方法及び装置
WO2019039324A1 (en) * 2017-08-22 2019-02-28 Panasonic Intellectual Property Corporation Of America IMAGE ENCODER, IMAGE DECODER, IMAGE ENCODING METHOD, AND IMAGE DECODING METHOD

Also Published As

Publication number Publication date
WO2010082463A1 (ja) 2010-07-22

Similar Documents

Publication Publication Date Title
WO2010082463A1 (ja) 画像符号化装置および画像符号化方法、画像復号化装置および画像復号化方法
JP6084731B2 (ja) 映像符号化装置
US7426308B2 (en) Intraframe and interframe interlace coding and decoding
US9047667B2 (en) Methods and apparatuses for encoding/decoding high resolution images
US20240146959A1 (en) Image encoding method using a skip mode, and a device using the method
KR101623124B1 (ko) 비디오 인코딩 장치 및 그 인코딩 방법, 비디오 디코딩 장치 및 그 디코딩 방법, 및 거기에 이용되는 방향적 인트라 예측방법
US20150010243A1 (en) Method for encoding/decoding high-resolution image and device for performing same
US20130089265A1 (en) Method for encoding/decoding high-resolution image and device for performing same
WO2010001917A1 (ja) 画像処理装置および方法
WO2010001916A1 (ja) 画像処理装置および方法
JP2007166617A (ja) 映像のイントラ予測符号化、復号化方法及び装置
JP2014123988A (ja) 画像復号装置及び画像復号方法
JP5795525B2 (ja) 画像符号化方法,画像復号方法,画像符号化装置,画像復号装置,画像符号化プログラムおよび画像復号プログラム
TW201808007A (zh) 畫像解碼裝置、畫像解碼方法、畫像編碼裝置、畫像編碼方法、編碼資料
KR20070027981A (ko) 영상의 부호화 및 복호화 장치와, 그 방법, 및 이를수행하기 위한 프로그램이 기록된 기록 매체
JP2007096679A (ja) 動画像の符号化および復号化方法
CN114830646A (zh) 图像编码方法和图像解码方法
JP2009049969A (ja) 動画像符号化装置及び方法並びに動画像復号化装置及び方法
KR20160106348A (ko) 비디오 부호화 방법 및 그 장치
KR20230169986A (ko) 복수의 dimd 모드 기반 인트라 예측 방법 및 장치
JP2022066678A (ja) イントラ予測装置、符号化装置、復号装置、及びプログラム
KR102125969B1 (ko) 화면 내 예측 방법 및 이러한 방법을 사용하는 장치
CN114830645A (zh) 图像编码方法和图像解码方法
CN114830643A (zh) 图像编码方法和图像解码方法
CN114830641A (zh) 图像编码方法和图像解码方法