JP2012023671A - 画像符号化装置 - Google Patents

画像符号化装置 Download PDF

Info

Publication number
JP2012023671A
JP2012023671A JP2010161899A JP2010161899A JP2012023671A JP 2012023671 A JP2012023671 A JP 2012023671A JP 2010161899 A JP2010161899 A JP 2010161899A JP 2010161899 A JP2010161899 A JP 2010161899A JP 2012023671 A JP2012023671 A JP 2012023671A
Authority
JP
Japan
Prior art keywords
image
pixel
thinned
prediction
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010161899A
Other languages
English (en)
Other versions
JP5578974B2 (ja
Inventor
Masatoshi Kondo
雅俊 近藤
Masanari Hamamoto
真生 濱本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Kokusai Electric Inc
Original Assignee
Hitachi Kokusai Electric Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Kokusai Electric Inc filed Critical Hitachi Kokusai Electric Inc
Priority to JP2010161899A priority Critical patent/JP5578974B2/ja
Priority to PCT/JP2011/056044 priority patent/WO2012008180A1/ja
Publication of JP2012023671A publication Critical patent/JP2012023671A/ja
Application granted granted Critical
Publication of JP5578974B2 publication Critical patent/JP5578974B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】H.264/AVC規格による画像符号化装置の画面内予測(イントラ予測)において、予測精度を向上させ、符号化効率を向上させる。。
【解決手段】符号化対象画素ブロックから、N(Nは2以上の自然数)枚の間引き画像を作成し、第1の間引き画像から第Nの間引き画像を順に処理し、第i(i=2,…,N)の間引き画像の画素の画面内予測の予測画素の生成にあたって、第1の間引き画像の画素から第i−1の間引き画像の画素を参照画素として用いる。このとき、第iの間引き画像の画素の予測画素は、第1の間引き画像の画素から第i−1の間引き画像の画素がその予測画素の周辺にあったときに、その予測画素の周辺にある第1の間引き画像の画素から第i−1の間引き画像の画素を参照画素として生成する。
【選択図】図10

Description

本発明は、画像符号化装置に係り、画素相関を利用して映像データを圧縮する画像符号化技術に関して、特に、画面内における隣接画素間の相関を利用して予測画像の生成をおこなうイントラ予測をおこなうときに、符号化効率を向上させるのに好適な画像符号化装置に関する。
H.264/AVC符号化技術では、ピクチャ内の近傍画素の相関を用いて圧縮をおこなうイントラ予測という手法がある。H.264/AVC符号化に関しては、以下の非特許文献1に定められている。
画面内予測(イントラ予測)は、符号化対象ピクチャ内の符号化処理済み画像(参照画像)を用いて処理対象画像の予測画像を作成し、予測画像と処理対象画像の差分を伝送することで情報量を削減する予測方法である。このようにイントラ予測は、画像の空間的な相関性のみを利用した予測方法であるため、ストリームの伝送エラーなどによって乱れた映像を正常な映像に復帰させることができる。
イントラ予測を用いた符号化方式では、符号化対象となるブロックに対し、その対象ブロックの周辺画素から予測画像を生成し、対象ブロックと予測画像を比較した残差成分を圧縮符号化することで、従来よりも高い符号化効率を実現している。
H.264/AVC符号化方式で規定されるイントラ予測は、予測処理をおこなうブロックサイズとして、4x4、8x8、16x16画素の3種類のブロックサイズから選択して予測処理をおこなうことが可能となっている。
さらに、各ブロックサイズにおいても、複数用意された予測方法の中から最適な方法を選択することができる。4x4,8x8画素ブロックサイズのイントラ予測では、それぞれ9種類の予測方法、16x16画素ブロックサイズのイントラ予測では4種類の予測方法が規定されている。
この複数規定された予測方法から最適な方法を選択する方法は、特に規定されていないが、一般には、最終的に最も符号量が少なくなる予測方法を用いるのが望ましいとされる。
以下、図39ないし図42を用いて4x4画素ブロックサイズのイントラ予測を例に、従来のイントラ予測方法を詳細に説明する。
図39は、対象となる4x4ブロック11と、当該ブロックの予測画像生成に用いる参照画素12の位置関係を示す図である。
図40は、4x4ブロックの9種類の予測方法の概念図である。
図41は、符号化において、ピクチャ内のマクロブロックを処理する順序を示す図である。
図42は、符号化において、マクロブロック内の4x4ブロックを処理する順序を示す図である。
なお、以下では、予測画像生成に用いる画素を「予測参照画素」あるいは、単に「参照画素」と呼ぶことにする。
4x4ブロックのイントラ予測では、図40に示されるように、前述した参照画素12から、9種類の予測方法(以下、「予測モード」と呼ぶ)を用いて予測画像を生成することができる。
例えば、モード0では、上4画素を下方向にコピーすることで予測画像を生成する。モード1では、左4画素を右方向にコピーすることで予測画像を生成する。このようにイントラ予測では左、上、右上の参照画素から、ある決まった方向にしたがって予測画像を生成する。また、モード2では、近傍の8画素の平均値で予測画像を生成する。
H.264/AVC符号化方式では、入力ピクチャを16x16画素のマクロブロック(MB)呼ばれる単位に分割し、MB単位に符号化処理をおこなう。ピクチャ内のMBを処理する順序は、図41のようになっており、ピクチャの左上からラスタスキャンの順序で処理をおこっていく。
さらにMB内は、4x4ブロックに分割して処理をおこない、その処理順序は、図42のようになっている。
ここで予測画素生成に用いる参照画素は、すでに処理済みのブロックの画素である。例えば、図42のブロック4は、すでに処理済みのブロック1,2,3の画素を使用することはできるが、まだ処理されていないブロック5,7,9,10,13は使用できない。
Joint VideoTeam (JVT) of ISO / IEC MPEG & ITU-T VCEG : Text of ISO / IEC 14496-10 Advanced Video Coding 3rd Edition (2004).
上記のように、従来のイントラ予測方式では、図41および図42に示したブロックの処理順序の制約により、右、下等の参照画素を用いることができないという問題点があった。
MPEG2符号化規格では、マクロブロックの処理順序はピクチャ上の左から右へ、上から下への順である。そのため、イントラ予測による予測画像作成処理に使用可能な参照画像は、符号化対象マクロブロックの上方向近接画素および左方向近接画素2方向のみに限定されてしまう。このような参照画像を用いて予測画像作成をおこなうため、従来のイントラ予測方式では、図40のように符号化対象マクロブロックの右下画像ほど予測精度が減衰し、入力画像と予測画像の差分である予測誤差が大きくなるという問題点があった。
また、これに対し、最新の映像圧縮符号化標準であるH.264/AVCでは通常16×16画素のマクロブロックを、8×8画素または4×4画素のサブブロックに分割して符号化処理をおこなうことにより、予測精度向上による予測誤差低減を可能としたが、その反面、サブブロック分割に伴う情報量増大、すなわちマクロブロックヘッダーの情報量増大が発生する課題があった。
このように、もし右、下等の参照画素を用いることができれば、上下の参照画素等から双方向で予測画像を生成可能となり、より高精度な予測画像を生成可能となるが、従来のイントラ予測方式では処理順序の制約により実現できないという問題点があった。
本発明は、上記問題点を解決するためになさたもので、その目的は、H.264/AVC規格による画像符号化装置のイントラ予測において、予測精度を向上させ、符号化効率を向上させることにある。
本発明の画像符号化装置は、画面内予測を用いて符号化対象画素ブロックを符号化するにあたり、符号化対象画素ブロックから、N(Nは2以上の自然数)枚の間引き画像を作成し、第1の間引き画像から第Nの間引き画像を順に処理する。そして、第i(i=2,…,N)の間引き画像の画素の画面内予測の予測画素の生成にあたって、第1の間引き画像の画素から第i−1の間引き画像の画素を参照画素として用いる。
このとき、第iの間引き画像の画素の予測画素は、第1の間引き画像の画素から第i−1の間引き画像の画素がその予測画素の周辺にあったときに、その予測画素の周辺にある第1の間引き画像の画素から第i−1の間引き画像の画素を参照画素として生成される。
例えば、符号化対象画素ブロックを、マクロブロックとして、N=4とする。
本発明の画面内予測をおこなう画像符号化装置によれば、予測対象画素に対し、周辺の9つの参照画素を用意することが可能となり、好適な画面内予測画像が得られ、符号化効率を高くすることができる。
本発明によれば、H.264/AVC規格による画像符号化装置のイントラ予測において、予測精度を向上させ、符号化効率を向上させることができる。
従来技術に係るイントラ予測方法による予測精度が高い画素と予測精度が低い画素とを比較して示した図である。 本発明の第一の実施形態に係るイントラ予測方法による予測精度が高い画素と予測精度が低い画素とを比較して示した図である。 間引き画像作成を説明する図である。 本発明の第一の実施形態に係るイントラ予測方法を用いた画像符号化処理を示すフローチャートである。 第1の間引き画像の再構成画像と、第2の間引き画像の予測画像を示す図である。 第1の間引き画像と、第2の間引き画像の参照関係を示す図である。 第1の間引き画像の再構成画像と、第3の間引き画像の予測画像を示す図である。 第1の間引き画像と、第3の間引き画像の参照関係を示す図である。 第1の間引き画像の再構成画像と、第2の間引き画像の再構成画像と、第4の間引き画像の予測画像を示す図である。 第2の間引き画像と、第3の間引き画像と、第4の間引き画像の参照関係を示す図である。 本発明の第一の実施形態に係る画像符号化装置の構成図である。 本発明の第一の実施形態に係るイントラ予測方法での画像符号化処理の出力として得られるビットストリームの構成図である。 本発明の第一の実施形態に係る画像復号化処理を示すフローチャートである。 間引き画像の復号画像から結合画像を作成する様子を説明する図である。 本発明の第一の実施形態に係る画像復号化装置の構成図である。 本発明の第二の実施形態に係る画像符号化装置の構成図である。 本発明の第二の実施形態に係る画像復号化装置の構成図である。 MBの4x4ブロックへの分割の仕方と、分割したブロックの処理順序を示す図である。 第1ブロックにおける予測対象ブロックと参照画素を示す図である。 図19を書き直して第1ブロックと参照画素の関係を分かりやすく示した図である。 第2ブロックにおける予測対象ブロックと参照画素を示す図である。 第2ブロックにおける画素p周辺の参照画素を示す図である。 周辺画素から参照画素を生成するときの各モードの概念図である。 第3ブロックにおける予測対象ブロックと参照画素を示す図である。 第3ブロックにおける画素o周辺の参照画素を示す図である。 第3ブロックにおける画素p周辺の参照画素を示す図である。 第4ブロックにおける予測対象ブロックと参照画素を示す図である。 第4ブロックにおける画素p周辺の参照画素を示す図である。 スライス境界にあるMBの第2ブロックにおける予測対象ブロックと参照画素を示す図である。 第2ブロックにおける画素a周辺の参照画素を示す図である。 第2ブロックにおける画素b周辺の参照画素を示す図である。 第2ブロックにおける画素e周辺の参照画素を示す図である。 スライス境界にあるMBの第3ブロックにおける予測対象ブロックと参照画素を示す図である。 第3ブロックにおける画素a周辺の参照画素を示す図である。 第3ブロックにおける画素d周辺の参照画素を示す図である。 スライス境界にあるMBの第4ブロックにおける予測対象ブロックと参照画素を示す図である。 第4ブロックにおける画素a周辺の参照画素を示す図である。 第4ブロックにおける画素d周辺の参照画素を示す図である。 対象となる4x4ブロック11と、当該ブロックの予測画像生成に用いる参照画素12の位置関係を示す図である。 4x4ブロックの9種類の予測方法の概念図である。 符号化において、ピクチャ内のマクロブロックを処理する順序を示す図である。 符号化において、マクロブロック内の4x4ブロックを処理する順序を示す図である。
以下、本発明に係る各実施形態を、図1ないし図38を用いて説明する。
〔実施形態1〕
以下、本発明に係る第一実施形態を、図1ないし図15を用いて説明する。
(I)イントラ予測方法の概要
先ず、図1および図2を用いて本発明の第一の実施形態に係るイントラ予測方法の概要を従来技術と対比して説明する。
図1は、従来技術に係るイントラ予測方法による予測精度が高い画素と予測精度が低い画素とを比較して示した図である。
図2は、本発明の第一の実施形態に係るイントラ予測方法による予測精度が高い画素と予測精度が低い画素とを比較して示した図である。
図3は、間引き画像作成を説明する図である。
従来技術に係るイントラ予測方法では、左方向または上方向の参照画素のみを用いて符号化対象マクロブロック201の予測画像を作成していた。そのため、図1に示されるように、参照画素と距離的に近い画素の予測精度は、高いものの、参照画素と距離的に遠い画素の予測精度は、低くなっていた。
本実施形態に係るイントラ予測方法は、符号化対象画素ブロック301を分割して、いくつかの間引き画像の画素の予測をするために、周辺の画素を参照画素として予測するものである。図2に示されるように、参照画素と予測対象画素は、距離的に近いものになり、上下左右の方向の参照画像を用いて高い予測精度を実現可能である。また、従来イントラ予測方法に対し、マクロブロックヘッダー情報を大幅に削減できるため、符号化効率向上に寄与する。さらに、本実施形態に係るイントラ予測方法は、従来イントラ予測方法との併用が可能である。
本実施形態は、スライス単位入力画像として、符号化時に、符号化対象画素ブロック301とし、4分割して、間引き画像の作成をおこなうことにする。
ここで、スライスとは符号化処理および復号化処理の基本単位となる画像領域であり、同一ピクチャ上の各スライスは、他のスライスに依存関係なく符号化処理および復号化処理をおこなうことができる。
本実施形態では、図3に示されるように、スライス単位入力画像501を水平方向および垂直方向に1画素置きにサンプリングした例、すなわち入力画像を四つに分割し、第1間引き画像511、第2間引き画像512、第3間引き画像513、および、第4間引き画像514を作成した例について説明する。
(II)イントラ予測方法を用いた符号化処理の詳細
次に、図4および図10を用いて本発明の第一の実施形態に係るイントラ予測方法を用いた画像符号化処理の詳細な処理について説明する。
図4は、本発明の第一の実施形態に係るイントラ予測方法を用いた画像符号化処理を示すフローチャートである。
図5は、第1の間引き画像の再構成画像と、第2の間引き画像の予測画像を示す図である。
図6は、第1の間引き画像と、第2の間引き画像の参照関係を示す図である。
図7は、第1の間引き画像の再構成画像と、第3の間引き画像の予測画像を示す図である。
図8は、第1の間引き画像と、第3の間引き画像の参照関係を示す図である。
図9は、第1の間引き画像の再構成画像と、第2の間引き画像の再構成画像と、
第4の間引き画像の予測画像を示す図である。
図10は、第2の間引き画像と、第3の間引き画像と、第4の間引き画像の参照関係を示す図である。
先ず、スライス単位の入力画像を取得する(ステップ401)。これは、本実施形態に係るイントラ予測方法は、スライス単位での予測画像作成をおこなうためである。
次に、スライス単位入力画像取得のステップ401で得た画像を元に間引き画像の作成をおこなう(ステップ402)。間引き画像作成は、図3に示したように、間引き画像は、画素を等間隔にサンプリングして、第1間引き画像511、第2間引き画像512、第3間引き画像513、および、第4間引き画像514を作成する。
スライス単位入力画像501の水平画素数をH(Hは偶数)、垂直画素数をV(Vは偶数)、スライス単位入力画像501の座標(x,y)の画素をPi(x,y)とおき、第1間引き画像511の座標(x,y)の画素をPi1(x,y)、第2間引き画像512の座標(x,y)の画素をPi2(x,y)、第3間引き画像513の座標(x,y)の画素をPi3(x,y)、第4間引き画像514の座標(x,y)の画素をPi4(x,y)とおくと、座標(i,j)におけるPi1(i,j)、Pi2(i,j)、Pi3(i,j)、Pi4(i,j)は、次のように表せる。ただし、iは0≦i<(H/2−1)を満たす整数、jは0≦j<(V/2−1)を満たす整数である。
Pi1(i,j)=P(2i,2j) …(式1)
Pi2(i,j)=P(2i+1,2j) …(式2)
Pi3(i,j)=P(2i,2j+1) …(式3)
Pi4(i,j)=P(2i+1,2j+1) …(式4)
次に、第1間引き画像511を符号化処理するために、間引き画像作成処理402で作成した第1間引き画像511について従来イントラ予測方法による符号化処理をおこなう(ステップ403)。従来イントラ予測方法とは、H.264/AVCなどに規定されているイントラ予測手段を用い、第1間引き画像511におけるマクロブロック(16×16画素)ごとに左方向または上方向に隣接する画素を参照し、16×16画素単位、8×8画素単位または4×4画素単位の予測画像を適応的に作成する方法である。
また、符号化処理では、以下のような処理がおこなわれる。
イントラ予測方法などにおいて予測画像を作成する(ステップ411)。
次に、ステップ411で作成した予測画像と入力画像の差分(予測誤差)を算出する(ステップ412)。
次に、ステップ412で算出した予測誤差に直交変換処理をおこない、直交変換後データを得る(ステップ413)。
次に、ステップ413で得た直交変換後データに量子化処理をおこない、量子化後データを得る(ステップ414)。
次に、ステップ414で得た量子化後データについて、エントロピー符号化処理をおこなう(ステップ415)。
本実施形態に係るイントラ予測方法においては、第1間引き画像511の符号化処理は、特に高画質が要求されるため、量子化処理414における量子化ステップを小さく設定することが好適である。
次に、第1間引き画像511の符号化処理のステップ403に続いて、間引き画像作成処理402で作成した第2間引き画像512について予測画像を作成し、符号化処理をおこなう(ステップ404)。
第2間引き画像512の予測画像作成には、図5に示されるように、既に符号化処理済みである第1間引き画像の再構成画像601を参照画像として用いる。ここで、再構成画像は量子化処理414で得た量子化後データについて逆量子化処理、逆直交変換処理をおこない、さらに予測画像作成処理411で作成した予測画像を加算することで作成される画像であり、復号化処理により得られる画像と同一の画像である。
第2間引き画像512は、図6に示されるように、第1間引き画像511に対し、水平方向の補間画素として考えることができる。したがって、第2間引き画像512の予測画像には、第1間引き画像の再構成画像601に水平フィルタを適用して作成した補間画素による画像を適用することが効果的である。ここでは、水平2タップフィルタを用いた補間画素作成による第2間引き画像512の予測画像(以下、第2間引き画像の予測画像611)を作成するものとする。
第2間引き画像の予測画像611の座標(x,y)の画素をPp2(x,y)とおき、第1間引き画像の再構成画像601の座標(x,y)の画素をPr1(x,y)とおくと、第2間引き画像の予測画像611の座標(n,m)の画素Pp2(n,m)612は、以下の(式5)で表せる。すなわち、第2間引き画像の予測画像611の画素の左右両側の第1間引き画像の再構成画像601の平均をとる。ここで、分子で+1をしているのは、末尾のビットを四捨五入するためである。
ただし、nは、0≦n<(H/2−1)を満たす整数、mは0≦m<(V/2−1)を満たす整数である。H、Vはそれぞれスライス単位入力画像501の水平画素数、垂直画素数であり、共に偶数である。(式5)において、n=(H/2−1)のとき、Pr1(H/2,y)の画素、すなわち第1間引き画像の再構成画像601の画面外画素が必要となるが、これはn≧(H/2−1)のとき、Pr1(n,y)=Pr1(H/2−1,y)とする、すなわち、画面端画素をコピーして画面外画素とするなどをおこなえばよい。
Pp2(n,m)=(Pr1(n,m)+Pr1(n+1,m)+1)/2
…(式5)
簡単のため、水平2タップフィルタによる画素補間で説明をおこなったが、より高周波成分を表現できる複数タップフィルタ、または2次元フィルタによる画素補間で第2間引き画像の予測画像611を作成してもよい。
次に、第2間引き画像512の符号化処理のステップ404に続いて、間引き画像作成処理402で作成した第3間引き画像513について予測画像を作成し、符号化処理をおこなう(ステップ405)。
第3間引き画像513の予測画像作成では、図7に示されるように、既に符号化処理済みである第1間引き画像の再構成画像601を参照画像として用いる。
第3間引き画像513は図8に示されるように、、第1間引き画像511に対し、水平方向の補間画素として考えることができる。したがって、第3間引き画像513の予測画像には、第1間引き画像の再構成画像601に垂直フィルタを適用して作成した補間画素による画像を適用することが効果的である。ここでは、垂直2タップフィルタを用いた補間画素作成による第3間引き画像513の予測画像(以下、第3間引き画像の予測画像811)作成するものとする。すなわち、第3間引き画像の予測画像811の画素の上下両側の第1間引き画像の再構成画像601の平均をとる。
第3間引き画像の予測画像811の座標(x,y)の画素をPp3(x,y)とおき、第1間引き画像の再構成画像601の座標(x,y)の画素をPr1(x,y)とおくと、第3間引き画像の予測画像811の座標(n,m)の画素Pp3(n,m)812は、以下の(式6)で表せる。
ただし、nは0≦n<(H/2−1)を満たす整数、mは0≦m<(V/2−1)を満たす整数である。H、Vはそれぞれスライス単位入力画像501の水平画素数、垂直画素数であり、共に偶数である。式(6)において、m=(V/2−1)のとき、Pr1(x,V/2)の画素、すなわち第1間引き画像の再構成画像601の画面外画素が必要となるが、これはm≧(V/2−1)のとき、Pr1(x,m)=Pr1(x,V/2−1)とする、すなわち画面端画素をコピーして画面外画素とするなどをおこなえばよい。
Pp3(n,m)=(Pr1(n,m)+Pr1(n,m+1)+1)/2
…(式6)
簡単のため、第1間引き画像の再構成画像601のみを参照画像として第3間引き画像の予測画像811の作成方法を示したが、第2間引き画像の再構成画像も参照画像として利用してもよい。また、垂直2タップフィルタによる画素補間で説明をおこなったが、より高周波成分を表現できる複数タップフィルタ、または2次元フィルタによる画素補間で第3間引き画像の予測画像811を作成してもよい。
次に、第3間引き画像513の符号化処理のステップ405に続いて、間引き画像作成処理402で作成した第4間引き画像514について予測画像を作成し、符号化処理をおこなう(ステップ406)。
第4間引き画像514の予測画像作成には、図9に示されるように、既に符号化処理済みである第2間引き画像の再構成画像1001および第3間引き画像の再構成画像1002を参照画像として用いる。
第4間引き画像514は、図10に示されるように、第2間引き画像512に対し、垂直方向の補間画素として考えることができ、また第3間引き画像513に対し、水平方向の補間画素として考えることができる。したがって、第4間引き画像514の予測画像には第2間引き画像の再構成画像1001および第3間引き画像の再構成画像1002に2次元フィルタを適用して作成した補間画素による画像を適用することが効果的である。ここでは、水平垂直それぞれ2タップの2次元フィルタを用いた補間画素作成による第4間引き画像514の予測画像(以下、第2間引き画像の予測画像1011)作成するものとする。
第4間引き画像の予測画像1011の座標(x,y)の画素をPp4(x,y)とおき、第2間引き画像の再構成画像1001の座標(x,y)の画素をPr2(x,y)、第3間引き画像の再構成画像1002の座標(x,y)の画素をPr3(x,y)とおくと、第4間引き画像の予測画像1011の座標(n,m)の画素Pp4(n,m)1012は、以下の(式7)で表せる。すなわち、すなわち、第4間引き画像の予測画像1011の画素の上下両側の第2間引き画像の再構成画像1011、および、左右両側の第3間引き画像の再構成画像1002の平均をとる。ここで、分子で+2をしているのは、末尾のビットを四捨五入するためである。
ただし、nは0≦n<(H/2−1)を満たす整数、mは0≦m<(V/2−1)を満たす整数である。H、Vはそれぞれスライス単位入力画像501の水平画素数、垂直画素数であり、共に偶数である。(式7)において、n=(H/2−1)のとき、またはm=(V/2−1)のとき、Pr3(H/2,y)の画素またはPr2(x,V/2)の画素が必要となる。すなわち第2間引き画像の再構成画像1001と第3間引き画像の再構成画像1002の画面外画素が必要となる場合があるが、これはn≧(H/2−1)のときPr3(n,y)=Pr3(H/2−1,y)、m≧(V/2−1)のときPr2(x,m)=Pr2(x,V/2−1)とする、すなわち画面端画素をコピーして画面外画素とするなどをおこなえばよい。
Pp4(n,m)=(Pr2(n,m)+Pr2(n,m+1)+Pr3(n,m)+Pr2(n+1,m)+2)/4
…(式7)
簡単のため、第2間引き画像の再構成画像1001および第3間引き画像の再構成画像1002のみを参照画像として第4間引き画像の予測画像1011の作成方法を示したが、第1間引き画像の再構成画像601も参照画像として利用してもよい。また、水平垂直それぞれ2タップの2次元フィルタによる画素補間で説明を行ったが、より高周波成分を表現できる複数タップフィルタ、または1次元フィルタによる画素補間で第4間引き画像の予測画像1011を作成してもよい。
(III)画像符号化装置の構成
次に、図11を用いて本発明の第一の実施形態に係る画像符号化装置の構成について説明する。
図11は、本発明の第一の実施形態に係る画像符号化装置の構成図である。
本実施形態の画像符号化装置100は、図11に示されるように、間引き画像作成部101、間引き画像バッファ102、第1のイントラ予測画像作成部103、予測誤差算出処理部104、直交変換処理部105、量子化処理部106、逆量子化処理部107、逆直交変換処理部108、再構成画像作成部109、再構成画像バッファ110、第2のイントラ予測画像作成部111、エントロピー符号化処理部112を備えている。
間引き画像作成部101は、間引き画像作成処理402をおこなう処理部であり、入力画像151を元にして、第1間引き画像511から第4間引き画像514までの四つの間引き画像を作成する。
間引き画像バッファ102は、第1間引き画像511、第2間引き画像512、第3間引き画像513、および、第4間引き画像514を一時的に格納し、各間引き画像の出力タイミングを調整するためのバッファであり、第1間引き画像511、第2間引き画像512、第3間引き画像513、第4間引き画像514の順で出力する。第1のイントラ予測処理部103は、第1間引き画像符号化処理のステップ403内の予測処理で述べたように、従来イントラ予測方法による予測画像作成をおこなう処理部である。予測誤差算出処理部104は、入力画像の間引き画像とその予測画像との差分(すなわち予測誤差)を算出する処理部であり、予測誤差算出処理412を実行する処理部である。直交変換処理部105は直交変換処理413を実行する処理部である。量子化処理部106は、量子化処理414を実行する処理部である。逆量子化処理部107は、量子化処理部106から出力された量子化後データに対し、逆量子化処理をおこなう処理部である。逆直交変換処理部108は、逆量子化処理部107から出力された逆量子化後データに対し、逆直交変換処理をおこなう処理部である。再構成画像作成部109は、逆直交変換処理部108から出力された逆直交変換後データと予測誤差算出処理部104へ入力した予測画像を加算し、再構成画像を作成する処理部である。再構成画像バッファ110は、再構成画像作成部109で作成された再構成画像を格納するバッファである。第2のイントラ予測処理部111は、再構成画像バッファ110から必要な間引き画像の再構成画像を取得し、第2間引き画像512、第3間引き画像513、および、第4間引き画像514の予測画像作成をおこなう。すなわち、第2のイントラ予測処理部111は、第2間引き画像符号化処理のステップ404、第3間引き画像符号化処理のステップ405、第4間引き画像符号化処理のステップ406に係る予測画像作成処理をおこなう処理部である。エントロピー符号化処理部112は、エントロピー符号化処理415をおこない、ビットストリーム152を出力する処理部である。
画像符号化装置100において従来の画像符号化装置と大きく異なる点は、上述した間引き画像作成部101、間引き画像バッファ102、再構成画像バッファ110、第2のイントラ予測処理部111を備えることである。
(IV)ビットストリームの構成
次に、図12を用いて本実施形態のイントラ予測方法での画像符号化処理の出力として得られるビットストリームの構成について説明する。
図12は、本発明の第一の実施形態に係るイントラ予測方法での画像符号化処理の出力として得られるビットストリームの構成図である。
本実施形態係るイントラ予測方法は、スライス単位での符号化となるため、図12では、スライスヘッダー以下の構成についてのみ示している。
画像符号化処理の出力として得られるビットストリームは、図12に示されるように、スライスヘッダー情報1201、第1間引き画像に関する符号情報1211、第2間引き画像に関する符号情報1212、第3間引き画像に関する符号情報1213、第4間引き画像に関する符号情報1214から構成される。これらの情報は、スライスヘッダー情報1201、第1間引き画像に関する符号情報1211、第2間引き画像に関する符号情報1212、第3間引き画像に関する符号情報1213、第4間引き画像に関する符号情報1214の順に出力され、第4間引き画像に関する符号情報1214の後に次のスライスヘッダー情報1202が続く形となる。なお、第1間引き画像は、従来イントラ予測方法と同様の方法で符号化処理されるために、第1間引き画像に関する符号情報1211については、マクロブロックヘッダー情報を含んでいる。
本実施形態に係るイントラ予測方法は、スライス単位でのイントラ予測をおこなっているため、マクロブロック単位でのイントラ予測をおこなう従来イントラ予測方法との併用のためには、ビットストリーム中のスライスヘッダー情報にどちらの予測方法であるかを識別する1ビットデータを付加するだけでよく、符号量オーバーヘッドは極めて小さい。
(V)画像復号化処理の詳細
次に、図13および図14を用いて本発明の第一の実施形態に係るイントラ予測方法により符号化した画像の画像復号化処理の詳細な処理について説明する。
図13は、本発明の第一の実施形態に係る画像復号化処理を示すフローチャートである。
図14は、間引き画像の復号画像から結合画像を作成する様子を説明する図である。
先ず、第1間引き画像の復号化処理をおこなう(ステップ1301)。
復号化処理は、以下に示す手順でおこなわれる。
先ず、エントロピー復号化処理として、ビットストリームから量子化後データを作成する(ステップ1311)。
次に、逆量子化処理として、量子化後データから直交変換後データを作成する(ステップ1312)。
次に、逆直交変換処理として、直交変換後データから予測誤差を生成する(ステップ1313)。
次に、予測画像を作成する(ステップ1314)。
次に、予測誤差と予測画像を加算し、復号画像を作成する(ステップ1315)。
特に、第1間引き画像の復号化処理におけるステップ1314の予測画像作成処理では、従来イントラ予測方法による予測画像作成をおこなう。
次に、第1間引き画像の復号化処理に続いて、第2間引き画像の復号化処理をおこなう(ステップ1302)。
特に、第2間引き画像の復号化処理におけるステップ1314の予測画像作成処理では、図4に示したステップ404の第2間引き画像符号化処理におけるステップ411の予測画像作成処理と同一の予測画像作成処理をおこなう。
次に、第2間引き画像の復号化処理に続いて、第3間引き画像の復号化処理をおこなう(ステップ1303)。
特に、第3間引き画像の復号化処理におけるステップ1314の予測画像作成処理では、ステップ405の第3間引き画像符号化処理におけるステップ411の予測画像作成処理と同一の予測画像作成処理をおこなう。
次に、第3間引き画像の復号化処理に続いて、第4間引き画像の復号化処理をおこなう(ステップ1304)。
特に、第4間引き画像の復号化処理におけるステップ1314の予測画像作成処理では、ステップ406の第4間引き画像符号化処理におけるステップ411の予測画像作成処理と同一の予測画像作成処理をおこなう。
第1間引き画像の復号化処理ないし第4間引き画像の復号化処理が終わると、図14に示すように、それぞれの復号化処理で復号化された第1間引き画像の復号画像1401、第2間引き画像の復号画像1402、第3間引き画像の復号画像1403、第4間引き画像の復号画像1404を結合し、結合画像1411を作成する(ステップ1305)。この処理は、間引き画像作成処理402に対し、逆の処理をおこなうことに等しい。なお、本発明に係るイントラ予測方法は、スライスを基本単位としたため、結合画像1411はスライス単位の画像となる。
ステップ1301の第1間引き画像復号化処理1301と、ステップ1302の第2間引き画像復号化処理から第4間引き画像復号化処理1304における違いは、復号化処理の予測画像作成方法および第1間引き画像復号化処理1301でのみマクロブロックヘッダー情報のエントロピー復号化処理が必要な点だけである。
(VI)画像復号化装置の構成
次に、図15を用いて本発明の第一の実施形態に係る画像復号化装置の構成について説明する。
図15は、本発明の第一の実施形態に係る画像復号化装置の構成図である。
画像復号化装置1500は、図15に示されるように、エントロピー復号化処理部1501、逆量子化処理部107、逆直交変換処理部108、再構成画像作成部109、再構成画像バッファ110、第1のイントラ予測処理部103、第2のイントラ予測処理部111、間引き画像バッファ1502、結合画像作成部1503を備える。
逆量子化処理部107、逆直交変換処理部108、再構成画像作成部109、再構成画像バッファ110、第1のイントラ予測処理部103は、図11の画像符号化装置100の説明と同様である。
エントロピー復号化処理部1501は、ビットストリームを復号化し、量子化後データなどを作成する処理部であり、ステップ1311のエントロピー復号化処理に該当する処理をおこなう。間引き画像バッファ1502は、間引き画像の復号画像を一時的に格納するバッファである。結合画像部1503は、ステップ1305の結合画像作成処理で示した結合画像作成をおこなう処理部である。
画像復号化装置1500は、入力されたビットストリーム152について、先ず、図12に示した第1間引き画像に関する符号情報1211をエントロピー復号化処理部1501にて量子化後データなどに変換し、逆量子化処理部107および逆直交変換処理部108にて逆量子化処理、逆直交変換処理をおこない、第1の予測画像作成処理部103で作成した予測画像を加えることにより、第1間引き画像の復号画像を取得し、間引き画像バッファ1502へ格納する。
次に、図12に示した第2間引き画像に関する符号情報1212をエントロピー復号化処理部1501により量子化後データなどに変換し、逆量子化処理部107および逆直交変換処理部108において、それぞれ逆量子化処理、逆直交変換処理をおこない、第2の予測画像作成処理部111で作成した予測画像を加えることにより第2間引き画像の復号画像を取得し、間引き画像バッファ1502へ格納する。
その後、図12に示した第3間引き画像に関する符号情報1213、第4間引き画像に関する符号情報1213についても、第2間引き画像に関する符号情報1212と同様の処理をおこない、取得した第3間引き画像の復号画像および第4間引き画像の復号画像を間引き画像バッファ1502へ格納する。
これらの処理後に、結合画像作成部1503は、間引き画像バッファ1502より全ての間引き画像の復号画像を読出し、結合画像を作成して復号画像1551として出力する。
画像復号化装置1500において、従来の画像復号化装置と大きく異なる点は、上述した再構成画像バッファ110、第2のイントラ予測処理部111、間引き画像バッファ1502、結合画像作成部1503を備えることである。
〔実施形態2〕
以下、本発明に係る第二の実施形態を、図16および図17を用いて説明する。
第一の実施形態では、符号化対象画素ブロックを分割して、いくつかの間引き画像を作成し、それをイントラ予測で予測画像として用いる画像符号化処理を説明した。
本実施形態は、本発明に係るイントラ予測方法と従来イントラ予測方法との併用により、符号化効率向上可能な画像符号化装置および画像復号化装置を説明する。
図16は、本発明の第二の実施形態に係る画像符号化装置の構成図である。
図17は、本発明の第二の実施形態に係る画像復号化装置の構成図である。
画像符号化装置1600は、図16に示されるように、第1画像符号化装置1601、第2画像符号化装置1602、符号化効率統計処理部1606、ストリームバッファ1603、ストリームバッファ1604、出力選択回路1605を備える。
第一形態画像符号化装置100は、図11で説明した第一の実施形態に係るイントラ予測方法を用いた画像符号化装置である。第2画像符号化装置1602は、 H.264/AVCなどの従来イントラ予測方法を用いた画像符号化装置である。符号化効率統計処理部1606は、スライス単位の符号量や画質の指標となる統計データに基づき、第1画像符号化装置1601から得られるビットストリームと第2画像符号化装置から得られるビットストリームのうち、より符号化効率が向上するビットストリームを選択するための制御信号を出力する処理部である。ストリームバッファ1603は、第1画像符号化装置1601が出力するビットストリームを一時的に格納するバッファであり、ビットストリームデータをスライス単位ごとに管理し、出力する機能を有する。ストリームバッファ1604は、第2画像符号化装置1602が出力するビットストリームを一時的に格納するバッファであり、ビットストリームデータをスライス単位ごとに管理し、出力する機能を有する。出力選択処理部1605は、符号化効率統計処理部1606が出力する制御信号に従い、ストリームバッファ1603とストリームバッファ1604が出力するビットストリームのいずれか片方をスライス単位で切り替えて出力する。さらに、ビットストリームのスライスヘッダー情報として第一の実施形態に係るイントラ予測方法と従来イントラ予測方法とを識別するための符号1ビットを付与する機能を有する。
以下、画像符号化装置1600の動作を説明する。画像符号化装置1600は、入力画像1651を第1画像符号化装置1601と第2画像符号化装置1602とで画像符号化処理し、得られたビットストリームをそれぞれストリームバッファ1603、ストリームバッファ1604へ出力する。さらに、第1画像符号化装置1601は、スライス単位の発生符号量および画質の指標となる統計データ1631を符号化効率統計処理部1606へ出力する。また、第2画像符号化装置1602もスライス単位の発生符号量および画質の指標となる統計データ1632を符号化効率統計処理部1606へ出力する。符号化効率統計処理部1606は、入力された統計データをもとに、より符号化効率が向上するビットストリームを選択するための制御情報1633を出力選択処理1605へ出力し、出力選択処理1605は制御情報1633に基づいて、ストリームバッファ1603とストリームバッファ1604が出力するビットストリームのいずれか片方をスライス単位で切り替えてビットストリーム1652として出力する。その際、採用したビットストリームのスライスヘッダーへ第一のイントラ予測方法と従来イントラ予測方法とを識別するための符号1ビットを付与する。
次に、画像復号化装置1700は、図17に示されるように、エントロピー復号化処理部1701、逆量子化処理部107、逆直交変換処理部108、再構成画像作成部109、再構成画像バッファ110、第1のイントラ予測処理部103、第2のイントラ予測処理部111、間引き画像バッファ1502、結合画像作成部1503、出力選択処理部1702、遅延バッファ1703を備える。
逆量子化処理部107、逆直交変換処理部108、再構成画像作成部109、再構成画像バッファ110、第1のイントラ予測処理部103、第2のイントラ予測処理部111は、第一の実施形態の図15で説明したものと同様であり、間引き画像バッファ1502、結合画像作成部1503は、図16で説明したものと同様である。
エントロピー復号化処理部1701は、入力されたビットストリーム1652のスライスヘッダー情報から処理対象とするスライスヘッダー情報以下のビットストリームが第一の実施形態に係るイントラ予測方法であるか従来イントラ予測方法であるかを判定し、その判定結果を判定結果情報1731として出力選択処理部1702へ出力すると共に、当該ビットストリームを復号化して量子化後データなどを出力する機能を有する処理部である。
出力選択処理部1702は、判定結果情報1731に基づいて、遅延バッファ1703の出力と結合画像作成部1503の出力とを選択し、復号画像1751として出力する。
遅延バッファ1703は、第一の実施形態に係るイントラ予測方法のビットストリームより復号画像を得る時の処理遅延時間と従来イントラ予測方法のビットストリームより復号画像を得る時の処理遅延時間との時間差を吸収するためのバッファであり、およそ1スライス分の復号画像データを格納可能な容量を必要とする。
以下、画像復号化装置1700の動作を説明する。画像復号化装置1700のエントロピー復号化処理部1701において、第一の実施形態に係るイントラ予測方法のビットストリームと判定した場合、復号化して得られた量子化後データを逆量子化処理部107、逆直交変換処理部108、再構成画像作成部109、再構成画像バッファ110、第1のイントラ予測処理部103、第2のイントラ予測処理部111、間引き画像バッファ1502、結合画像作成部1503によって画像復号化装置1500と同様に処理して第一の実施形態に係るイントラ予測方法の復号画像を得る。一方、エントロピー復号化処理部1701にて従来イントラ予測方法のビットストリームと判定した場合、復号化して得られた量子化後データを逆量子化処理部107、逆直交変換処理部108、再構成画像作成部109、第1のイントラ予測処理部103によって従来イントラ予測方法の復号画像を作成し、遅延バッファ1703へ格納する。出力選択処理部1702は、判定結果情報1731が第一の実施形態に係るイントラ予測方法と判定する結果であれば、結合画像作成部1503の復号画像を出力し、従来イントラ予測方法と判定する結果であれば、バッファ1703の復号画像を出力する。
〔実施形態3〕
以下、本発明の第三の実施形態を、図18ないし図38を用いて説明する。
第一の実施形態では、スライス単位で画像を入力し、それからいくつの間引き画像に分解し、ある間引き画像のイントラ予測をおこなうために、他の間引き画像から予測画像を作成する方法について説明した。
本実施形態では、第一の実施形態とは、別の仕方で、MBを複数の基本ブロックに分割し、ある基本ブロックの画素のイントラ予測のために、他の基本ブロックの画素を参照して、予測画素を作成する方法について説明する。
先ず、図18を用いてMBの基本ブロックの分割について説明する。
図18は、MBの4x4ブロックへの分割の仕方と、分割したブロックの処理順序を示す図である。
本実施形態では、図18に示されるように、入力した16x16画素のMBを、8x8画素ブロックに区切り、これを以下のように、相当する画素を抽出し、抽出した画素群を4x4ブロックとして構成する。この各々のブロックは、第1ブロックから第4ブロックまでの予測をおこなうための基本ブロックとなる。
第1ブロック:p(2x,2y) … x,y=1,2,3,4
第2ブロック:p(2x−1,2y−1) … x,y=1,2,3,4
第3ブロック:p(2x,2y−1) … x,y=1,2,3,4
第4ブロック:p(2x−1,2y) … x,y=1,2,3,4
なお、p(x,y)は8x8ブロック内の画素位置を示し、x方向に1〜8、y方向に1〜8の位置を取りうるものとする。
8x8ブロック内の処理順序は、第1ブロック、第2ブロック、第3ブロック、第4ブロックの順に処理をおこなう。
次に、図19および図20を用いて第1ブロックにおける予測画像生成方法について説明する。
図19は、第1ブロックにおける予測対象ブロックと参照画素を示す図である。
図20は、図19を書き直して第1ブロックと参照画素の関係を分かりやすく示した図である。
第1ブロックにおける予測対象画素は、図19中、a〜p画素となる。また第1ブロックで参照画素として使用できるのは、A〜H,I〜L,M,N〜U,V〜Yの画素となる。この時点で図19中の白い部分の画素は参照画素として使用できない。参照画素として使用できるA〜H,I〜L,M,N〜U,V〜Yの画素の内で、図20に示すように、一つおきに画素を取り、第一ブロックの参照画素とする。これは、予測対象画素とより距離の近い参照画素を用いるという発想に基づくものである。そして、従来方式のH.264/AVC符号化方式で用いられている9モードによる4x4画素ブロックでのイントラ予測をおこなう。
次に、図21ないし図23を用いて第2ブロックにおける予測画像生成方法について説明する。
図21は、第2ブロックにおける予測対象ブロックと参照画素を示す図である。
図22は、第2ブロックにおける画素p周辺の参照画素を示す図である。
図23は、周辺画素から参照画素を生成するときの各モードの概念図である。
第2ブロックの処理では、第1ブロックに相当する箇所の画素が参照画素として使用可能となる。
ここで、予測対象画素p周辺を例に予測画素生成方法を図22を用いて説明する。
予測対象画素p周辺では、図22のA,C,F,Hは、第1ブロックの画素であり、予測参照画素として使用可能になっている。
本実施形態によるイントラ予測方法では、画素pの予測をおこなう前に、まだ参照画素として使用できないB,D,E,G部分を、第1ブロックの画素であるA,C,F,Hから予測参照画素として生成する。
ここで、各予測参照画素は、周辺の参照画素の平均とし、以下の式で算出する。
B=(A+C+1)>>1
D=(A+F+1)>>1
E=(C+H+1)>>1
G=(F+H+1)>>1
ここで、各画素を表す文字A,B,C…は、画素値も表すこととしている。“+”は、画素値の加算、“>>”は、ビットの右シフトであり、“>>1”は、2で割ることを表している。また、かっこの中で、+1をしているのは、四捨五入を意味している。
上記の式によって、予測参照画素B,D,E,Gを算出することにより、予測対象画素周辺の9画素全てを参照画素として使用可能となる。
本発明では、予測対象画素の周辺9個の参照画素を用いて、予測対象画素の予測をおこなう。
a〜o周辺の予測参照画素についても、対象画素との相対位置に応じて同様に生成する。
次に、周辺9画素を用いた予測画素生成方法を説明する。
予測画素生成のモードは、9種類とし、図23に示されるように、モード0〜モード9を以下の式で求める。
モード0:p=(B+G+1)>>1
モード1:p=(D+E+1)>>1
モード2:p=(A+C+F+H+2)>>2
モード3:p=(C+F+1)>>1
モード4:p=(A+H+1)>>1
モード5:p=(A+B+G+H+2)>>2
モード6:p=(A+D+E+H+2)>>2
モード7:p=(B+C+F+G+2)>>2
モード8:p=(D+F+C+E+2)>>2
“>>2”は、4で割ることを表している。また、かっこの中で、+2をしているのは、四捨五入を意味している。
ここでは、ハードウェアでの実現性の容易さを考慮して、加算とビットシフトで演算可能とした。また、従来方式の拡張を考慮しモード数も9モードとした。
以降説明する第3、4ブロックにおいても、先ず、画素周辺の9個の参照画素を生成したのち、予測対象画素の生成をおこなうため、予測対象画素の生成方法は第3,4ブロックも、上記と同様となる。
次に、図24ないし図26を用いて第3ブロックにおける予測画像生成方法について説明する。
図24は、第3ブロックにおける予測対象ブロックと参照画素を示す図である。
図25は、第3ブロックにおける画素o周辺の参照画素を示す図である。
図26は、第3ブロックにおける画素p周辺の参照画素を示す図である。
第3ブロックの処理では、第1、第2ブロックに相当する箇所の画素が参照画素として使用可能となる。
ここで予測対象画素o,p周辺を例に予測画素生成方法を図25、図26を用いて説明する。
予測対象画素o周辺では、K,B,L,M,G,Hが第1ブロックの画素であり、I,J,D,Eが第2ブロックの画素である。
第2ブロックと同様、まだ参照画素として使えないA,C,F,H部分を予測参照画素として生成する。各予測参照画素は、周辺の参照画素の平均とする。
A=(I+K+B+D+2)>>2
C=(J+B+L+E+2)>>2
F=(2D+M+G+2)>>2
H=(2E+G+N+2)>>2
ここで、Fに関する式は、対称性を利用して、Dを加えて4で割ることした。Hに関する式も同様である。
画素p周辺に関しても同様に、参照画素として使用できない周辺画素C,E,Hを生成する(A,Fは画素o周辺の生成方法で示した)。
C=(A+3B+2)>>2
H=(F+3G+2)>>2
E=(C+H+1)>>1
Cの式では、より近いBの方に3の重みをつけ、Aの方の重みは1とし、より近い画素が反映されるようにしている。Hの式でも同様である。
各予測対象画素周辺の9個の参照画素生成されれば、周辺9個の参照画素を用いた予測画素の生成方法は、第2ブロックと同様となる。
次に、図27および図28を用いて第4ブロックにおける予測画像生成方法について説明する。
図27は、第4ブロックにおける予測対象ブロックと参照画素を示す図である。
図28は、第4ブロックにおける画素p周辺の参照画素を示す図である。
第4ブロックの処理では、第1、第2、第3ブロックに相当する箇所の画素が参照画素として使用可能となる。
ここで予測対象画素p周辺を例に予測画素生成方法を図28を用いて説明する。
予測対象画素pの周辺では、D,Eが第1ブロックの画素であり、Bが第2ブロックの画素であり、A,Cが第2ブロックの画素である。、
第4ブロックの画素p周辺では、F,G,H相当位置の参照画素を生成する必要がある。これまでと同様の考え方により、以下の式で参照画素を生成する。
F=(A+3D+2)>>2
H=(C+3E+2)>>2
G=(F+H+1)>>1
画素m,n,oに対しても、相対位置がF,G,Hに相当する画素の参照画素をpと同様に生成する。
以上では、MB境界の参照画素が使用可能な場合における第1ブロック〜第4ブロックのイントラ予測処理方法について説明した。
次に、例えば対象ブロックがピクチャ上端に位置するような場合は、上側のMBが存在しないため、上、右上、左上の参照画素を使用できない。また、対象ブロックがピクチャ左端に位置する場合は、左側のMBが存在しないため左、左上の参照画素を使用できない。
こうしたMB境界の参照画素が使用できない場合の予測処理方法について説明する。
第1ブロックでは、H.264/AVCと同様の処理、使用可能なモードはモード2(DC)のみであり、DC予測値を中間値(入力画素のビット数が8bitであれば128)として予測する。
次に、図29ないし図32を用いてスライス境界にあるMBの第2ブロックにおける予測画像生成方法について説明する。
図29は、スライス境界にあるMBの第2ブロックにおける予測対象ブロックと参照画素を示す図である。
図30は、第2ブロックにおける画素a周辺の参照画素を示す図である。
図31は、第2ブロックにおける画素b周辺の参照画素を示す図である。
図32は、第2ブロックにおける画素e周辺の参照画素を示す図である。
対象となるMBがスライス境界にある場合には、図29中、太枠の外側の参照画素を使用できない。これらの参照画素を予測方法を、予測対象画素a,b,e周辺を例に図30、図31、図32を用いて説明する。
予測対象画素a周辺の参照画素A〜Gは、全てHと同値とする。
予測対象画素b周辺の参照画素A,B,Cの予測方法は以下のようにおこなう。D,E,Gについては、前述したように両端の画素の平均を取ればよい。
A=F
C=H
B=(A+C+1)>>1
ここで、Aは、対称性を利用して、Aの画素値をコピーしている。Cも同様である。
予測対象画素e周辺の参照画素A,D,Fの予測方法は以下のようにおこなう。B,E、Gについても、前述した両端の画素の平均を取ればよい。
A=C
F=H
D=(A+F+1)>>1
次に、図33ないし図35を用いてスライス境界にあるMBの第3ブロックにおける予測画像生成方法について説明する。
図33は、スライス境界にあるMBの第3ブロックにおける予測対象ブロックと参照画素を示す図である。
図34は、第3ブロックにおける画素a周辺の参照画素を示す図である。
図35は、第3ブロックにおける画素d周辺の参照画素を示す図である。
対象となるMBがスライス境界にある場合には、図33中、太枠の外側の参照画素を使用できない。これらの参照画素を予測方法を、予測対象画素a,d周辺を例に、図34、図35を用いて説明する。
予測対象画素a周辺の参照画素A,B,Cの予測方法は以下のようにおこなう。F,Hは、前述したように周辺画素の平均を取ればよい(例えば、F=(D+G+1)>>1)。
A=D
C=E
B=(A+C+1)>>1
予測対象画素d周辺の参照画素A,B,C,E,Hの予測方法は以下のようにおこなう。Fは、前述した周辺画素の平均を取ればよい。
A=D
B=A
C=(A+3B+2)>>2
H=G
E=H
次に、図36ないし図38を用いてスライス境界にあるMBの第4ブロックにおける予測画像生成方法について説明する。
図36は、スライス境界にあるMBの第4ブロックにおける予測対象ブロックと参照画素を示す図である。
図37は、第4ブロックにおける画素a周辺の参照画素を示す図である。
図38は、第4ブロックにおける画素d周辺の参照画素を示す図である。
スライス境界では、図36中、太枠の外側の参照画素を使用できない。これらの参照画素を予測方法を、予測対象画素a,m周辺を例に図37、図38を用いて説明する。
予測対象画素a周辺の参照画素A,D,Fの予測方法は以下のようにおこなう。
A=(3B+C+2)>>2
F=(3G+H+2)>>2
D=(A+F+1)>>1
予測対象画素m周辺の参照画素A,Dの予測方法は以下のようにおこなう。Fは、前述のように周辺画素の平均を取ればよい。
A=(3B+C+2)>>2
D=A
H=(3E+C+2)>>2
G=H
11…4x4ブロック
12…参照画素
100…映像符号化装置
101…間引き画像作成部
102…間引き画像バッファ
103…第1のイントラ予測処理部
104…予測誤差算出処理部
105…直交変換処理部
106…量子化処理部
107…逆量子化処理部
108…逆直交変換処理部
109…再構成画像作成部
110…再構成画像バッファ
111…第2のイントラ予測画像作成
112…エントロピー符号化処理部
151…入力画像
152…ビットストリーム
201…符号化対象マクロブロック
211…上方向近接画素
212…左方向近接画素
301…符号化対象画素ブロック
501…スライス単位入力画像
511…第1間引き画像
512…第2間引き画像
513…第3間引き画像
514…第4間引き画像
601…第1間引き画像の再構成画像
611…第2間引き画像の予測画像
612…画素Pp2(n,m)
811…第3間引き画像の予測画像
812…画素Pp3(n,m)
1001…第2間引き画像の再構成画像
1002…第3間引き画像の再構成画像
1011…第4間引き画像の予測画像
1012…画素Pp4(n,m)
1201…スライスヘッダー情報
1202…スライスヘッダー情報
1211…第1間引き画像に関する符号情報
1212…第2間引き画像に関する符号情報
1213…第3間引き画像に関する符号情報
1214…第4間引き画像に関する符号情報
1401…第1間引き画像の復号画像
1402…第2間引き画像の復号画像
1403…第3間引き画像の復号画像
1404…第4間引き画像の復号画像
1411…結合画像
1500…画像復号化装置
1501…エントロピー復号化処理部
1502…間引き画像バッファ
1503…結合画像作成部
1551…復号画像
1600…画像符号化処理
1601…第1画像符号化装置
1602…第2画像符号化装置
1603…ストリームバッファ
1604…ストリームバッファ
1605…出力選択回路
1606…符号化効率統計処理部
1631…スライス単位の発生符号量および画質の指標となる統計データ
1632…スライス単位の発生符号量および画質の指標となる統計データ
1633…制御情報
1651…入力画像
1652…ビットストリーム
1700…画像復号化装置
1701…エントロピー復号化処理部
1702…出力選択処理部
1703…遅延バッファ
1731…判定結果情報
1751…復号画像。

Claims (3)

  1. 画像を符号化するにあたり、画面内予測を用いて符号化対象画素ブロックを符号化する画像符号化装置において、
    前記符号化対象画素ブロックから、N(Nは2以上の自然数)枚の間引き画像を作成し、第1の間引き画像から第Nの間引き画像を順に処理し、
    第i(i=2,…,N)の間引き画像の画素の画面内予測の予測画素の生成にあたって、第1の間引き画像の画素から第i−1の間引き画像の画素を参照画素として用いることを特徴とする画像符号化装置。
  2. 第i(i=2,…,N)の間引き画像の画素の予測画素は、第1の間引き画像の画素から第i−1の間引き画像の画素がその予測画素の周辺にあったときに、その予測画素の周辺にある第1の間引き画像の画素から第i−1の間引き画像の画素を参照画素として生成されることを特徴とする請求項1記載の画像符号化装置。
  3. 前記符号化対象画素ブロックが、マクロブロックであることを特徴とする請求項1記載の画像符号化装置。
JP2010161899A 2010-07-16 2010-07-16 画像符号化装置 Active JP5578974B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2010161899A JP5578974B2 (ja) 2010-07-16 2010-07-16 画像符号化装置
PCT/JP2011/056044 WO2012008180A1 (ja) 2010-07-16 2011-03-15 画像符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010161899A JP5578974B2 (ja) 2010-07-16 2010-07-16 画像符号化装置

Publications (2)

Publication Number Publication Date
JP2012023671A true JP2012023671A (ja) 2012-02-02
JP5578974B2 JP5578974B2 (ja) 2014-08-27

Family

ID=45469194

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010161899A Active JP5578974B2 (ja) 2010-07-16 2010-07-16 画像符号化装置

Country Status (2)

Country Link
JP (1) JP5578974B2 (ja)
WO (1) WO2012008180A1 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62269488A (ja) * 1986-05-16 1987-11-21 Mitsubishi Electric Corp 画像符号化伝送装置
JPH0393377A (ja) * 1989-09-06 1991-04-18 Hitachi Ltd 高能率符号化装置
JPH04219074A (ja) * 1990-08-31 1992-08-10 Toshiba Corp 画像符号化装置
JP2007096672A (ja) * 2005-09-28 2007-04-12 Hitachi Kokusai Electric Inc 画像処理装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62269488A (ja) * 1986-05-16 1987-11-21 Mitsubishi Electric Corp 画像符号化伝送装置
JPH0393377A (ja) * 1989-09-06 1991-04-18 Hitachi Ltd 高能率符号化装置
JPH04219074A (ja) * 1990-08-31 1992-08-10 Toshiba Corp 画像符号化装置
JP2007096672A (ja) * 2005-09-28 2007-04-12 Hitachi Kokusai Electric Inc 画像処理装置

Also Published As

Publication number Publication date
WO2012008180A1 (ja) 2012-01-19
JP5578974B2 (ja) 2014-08-27

Similar Documents

Publication Publication Date Title
RU2603543C2 (ru) Способ и устройство для кодирования видео и способ и устройство для декодирования видео
KR101905159B1 (ko) 영상의 부호화 방법 및 장치, 및 복호화 방법 및 장치
KR101774392B1 (ko) 화면 내 예측 방법 및 이러한 방법을 사용하는 장치
CN107257465B (zh) 由编码装置和解码装置执行的内预测方法及可读存储介质
KR102187246B1 (ko) 영상 정보 부호화 방법 및 복호화 방법
JP6807987B2 (ja) 画像符号化装置、動画像復号装置、動画像符号化データ及び記録媒体
JP2020510374A (ja) 映像コーディングシステムにおける変換方法及びその装置
WO2012096150A1 (ja) 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法
KR101614828B1 (ko) 화상 부호화 및 복호 방법, 장치, 프로그램
KR20170108367A (ko) 인트라 예측 기반의 비디오 신호 처리 방법 및 장치
MX2015003512A (es) Dispositivo de codificacion de prediccion de video, metodo de codificacion de prediccion de video, dispositivo de decodificacion de prediccion de video y metodo de decodificacion de prediccion de video.
KR20200139116A (ko) 영상 정보 부호화 방법 및 복호화 방법
KR20180044935A (ko) 비디오 코딩 시스템에서 인트라 예측 방법 및 장치
JP5578974B2 (ja) 画像符号化装置
JP2011049816A (ja) 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、およびプログラム
KR101938389B1 (ko) 화면 내 예측 방법 및 이러한 방법을 사용하는 장치
KR20170125724A (ko) 인트라 예측 부호화 및 복호화 방법과 상기 방법을 수행하는 장치
WO2011064932A1 (ja) 画像符号化装置及び画像復号装置
KR20120008321A (ko) 서브샘플링을 이용한 적응적 스캐닝 및 확장된 템플릿 매칭 방법 및 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130329

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131001

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140304

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140424

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140527

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140603

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140624

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140708

R150 Certificate of patent or registration of utility model

Ref document number: 5578974

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250