JP2015103872A - 画像符号化装置及び画像復号装置及びそれらの制御方法 - Google Patents
画像符号化装置及び画像復号装置及びそれらの制御方法 Download PDFInfo
- Publication number
- JP2015103872A JP2015103872A JP2013241270A JP2013241270A JP2015103872A JP 2015103872 A JP2015103872 A JP 2015103872A JP 2013241270 A JP2013241270 A JP 2013241270A JP 2013241270 A JP2013241270 A JP 2013241270A JP 2015103872 A JP2015103872 A JP 2015103872A
- Authority
- JP
- Japan
- Prior art keywords
- image
- viewpoint
- reference image
- encoding
- decoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
【課題】 ライトフィールドデータから構成される複数の視点画像をより高い圧縮率で符号化することが可能となる。【解決手段】 ライトフィールドデータから構成される複数の視点画像のうちの予め設定された1つを参照画像とし、当該参照画像については単独で画素ブロックを単位に符号化する。また。複数の視点画像のうち、参照画像を除く他の視点画像については、参照画像を参照画像として、予測符号化する。ただし、予測符号化を行う際に、参照画像と符号化対象の着目視点画像との関係が、複数の視点画像の中心位置に対して点対称、又は、前記中心位置を通る線分に対して線対称の関係にあるときには、その参照画像に加え、当該参照画像を前記関係に従って回転又は反転して得られた回転反転画像も予測符号化の際の参照画像として用いる。【選択図】 図1
Description
本発明は多視点画像の符号化技術に関するものである。
プレノプティック(Plenoptic)カメラを用いて、光線の位置と方向(以下、ライトフィールド)を記録する技術が知られている(非特許文献1)。取得したライトフィールド情報を用いると、撮影後に画像のピント位置を変更したり(以下、リフォーカス)、被写界深度を変更するなどの画像処理が可能となる。
撮影後に上記の画像処理を行うためには、ライトフィールドを符号化する必要がある。ライトフィールドの符号化方法の1つとして、ライトフィールドを多視点画像に変換し、符号化する方法がある。多視点画像の符号化方式には、代表的なものとしてH.264/MPEG−4 AVC multiview video coding (以下、MVC)が知られている。MVCでは、対象視点の映像を、参照視点の映像を用いて視差補償予測によって予測し、対象視点の映像と予測画像との差分を符号化することで、対象視点の映像そのものを符号化する場合に比べてデータ量を削減する。ここで、視差補償予測は、動画のフレーム間の相関を利用した圧縮技術として知られている動き補償予測を、異なる視点間の映像に適用したものと考えると分かりやすい。
Ren Ng. "Digital Light Field Photography", PhD thesis, stanford, CA, USA, 2006.
プレノプティックカメラで撮影した多視点画像はそれぞれ、メインレンズの異なる部分を通過した光のみを撮影した画像となる(非特許文献1)。これにより、画像のボケの形状が視点毎に異なるという特性を持つ。その様子を、図3を用いて説明する。図3(a)〜(f)は全て、点光源を撮影した場合に取得できる画像を示している。図3(a)、(c)、(e)は一般的な単視点撮影のカメラで撮影した画像、図3(b)、(d)、(f)はプレノプティックカメラで撮影した16視点の画像である。また図3(a)、(b)は点光源にピントが合っている場合、図3(c)、(d)は点光源からピントがずれている場合、図3(e)、(f)はさらにピントがずれている場合である。単視点撮影のカメラで撮影した画像は、点光源にピントが合った場合は図3(a)で示したように点として撮影され、点光源からピントが外れるほど図3(c)、(e)で示したように、円状のボケが大きくなるという性質を持つ。プレノプティックカメラで撮影した多視点画像では、点光源にピントが合っている場合は、図3(b)で示したように、16視点の画像全ての同一位置に点が撮影される。一方ピントが合っていない場合は、図3(d)、(f)で示したように、円状のボケが各視点に分割して撮影されるという性質がある。図3(b)、(d)、(f)に写る16枚の画像全てを加算平均すると、それぞれ図3(a)、(c)、(e)に一致する。
プレノプティックカメラで撮影した多視点画像を符号化する際には、MVCなどで用いられる視差補償予測を流用することが可能である。しかし、視差補償予測は、ブロック単位の平行移動で予測を行うため、視点毎に異なる形状のボケを持つプレノプティックカメラでは予測精度が下がる。したがって視差補償予測を単純に用いるだけでは、ボケ部の圧縮率が上がらない可能性が高い。
この問題を解決するための手段として、視点間のボケの対称性を利用する方法が考えられる。例えば、図3(f)の305、314の点光源のボケ方を見ると、305のボケ部を時計回りに270度回転させれば314と同じ形のボケになるため、予測精度が高くなる。
このように画像間の回転対称性を利用した予測符号化技術は既に特許文献1で知られている。特許文献1では動画のフレーム間予測を行う際に、回転運動する被写体の予測効率を上げるために、ブロック単位で回転角度を符号化する。しかしこの方法では、ブロック単位に最適な回転方法を探索するための処理時間が増加する。また、回転予測を行うブロックに対して、回転角度を符号化するため、角度情報の符号量が増加し、圧縮率が低下する可能性がある。
本発明は上記の問題に鑑みなされたものである。そして、本明細書では、プレノプティックカメラで撮影した多視点画像のボケ部、特に点光源などによる玉ボケ、を撮影した場合の視点間予測の精度低下を抑えるための技術を提供する。また、その際に発生する最適な回転角度等の探索に必要な処理負荷の低減、および回転角度などの負荷情報のデータ量を抑える技術も提供する。
この課題を解決するため、例えば本発明の画像符号化装置は以下の構成を備える。すなわち、
ライトフィールドデータから構成される複数の視点画像を符号化する画像符号化装置であって、
前記複数の視点画像のうちの予め設定された1つを参照画像とし、当該参照画像を符号化する第1の符号化手段と、
前記複数の視点画像のうち、前記参照画像を除く他の視点画像については、前記参照画像を参照して、画素ブロックを単位に予測符号化する第2の符号化手段とを備え、
前記第2の符号化手段は、
前記参照画像と符号化対象の着目視点画像との関係が、点対称、又は、線対称の関係にあるとき、当該参照画像の画素ブロックを前記関係に従って回転又は反転して得られた回転反転されたブロックを予測符号化の際の参照画像として用いることを特徴とする。
ライトフィールドデータから構成される複数の視点画像を符号化する画像符号化装置であって、
前記複数の視点画像のうちの予め設定された1つを参照画像とし、当該参照画像を符号化する第1の符号化手段と、
前記複数の視点画像のうち、前記参照画像を除く他の視点画像については、前記参照画像を参照して、画素ブロックを単位に予測符号化する第2の符号化手段とを備え、
前記第2の符号化手段は、
前記参照画像と符号化対象の着目視点画像との関係が、点対称、又は、線対称の関係にあるとき、当該参照画像の画素ブロックを前記関係に従って回転又は反転して得られた回転反転されたブロックを予測符号化の際の参照画像として用いることを特徴とする。
本発明によれば、ライトフィールドデータで構成される多視点画像をより高い圧縮率で符号化することができる。
以下、添付図面に従って本発明に係る実施形態を詳細に説明する。なお、以下で説明する各実施形態は、本発明を具体的に実施した例を示すもので、特許請求の範囲に記載の構成の具体的な実施形態の1つである。
[第1の実施形態]
本第1の実施形態では、デジタルカメラに代表される撮像装置に適当した例を説明するが、プレノプティックカメラで撮像したライトフィールドデータで構成される多視点画像を符号化する装置であればよく、カメラ(撮像機能)と一体になっている必要はない。あくまで一例であると認識されたい。
本第1の実施形態では、デジタルカメラに代表される撮像装置に適当した例を説明するが、プレノプティックカメラで撮像したライトフィールドデータで構成される多視点画像を符号化する装置であればよく、カメラ(撮像機能)と一体になっている必要はない。あくまで一例であると認識されたい。
図13は第1の実施形態が適用する撮像装置1300のブロック構成図である。
本装置は、装置全体の制御を司るCPU1301、CPU1302の処理手順であるプログラム並びに各種パラメータを記憶するROM1302、CPU1301のワークメモリとして使用されるRAM1303を有する。また、本装置には、各種メニューを表示したり、撮像中の映像を確認するため、並びに既に記録した画像を表示するための表示部1305と、その表示部1305を制御する表示制御部1304を有する。また、本装置は、ユーザからの指示入力を受け付けるための操作部1306を有する。この操作部1306には、電源On/Offボタンやシャッターボタンなどの物理的なスイッチ、表示部1305の表示画面の前面に設けられた透明なタッチパネルを含む。また、本装置は、光学レンズや絞りを有する光学部1308a、光学部1308aを介して結像した画像を電気信号(画像データ)に変換する撮像部1308bで構成されるプレノプティックカメラ部(又はライトフィールドカメラ部)1307を有する。また、本装置は、プレノプティックカメラ部1307における光学部1308aのフォーカシング、撮像部1308bによる露光制御を行うフォーカシング/露光制御部1309を有する。また、本装置は、撮像した画像を一時的に記憶するための画像バッファ1310、画像バッファ1310に格納された画像データを符号化したり、符号化画像データを復号して画像バッファ1310に展開する符号化/復号部1311を有する。また、本装置は、着脱自在な記憶媒体1313への符号化データの格納、並びに、符号化データを復号するために読み込む記録制御部1312を有する。
本実施形態の装置の特徴とする点は、プレノプティックカメラ部1307で取得した多視点の静止画データに対する、符号化/復号部1311による、ボケ部分の符号化効率を向上する為に回転反転予測を伴う符号化処理にある。なお、本実施形態における、回転反転予測とは、参照画像をブロック単位に、回転もしくは予め設定された線に対する線対称に反転して、対象画像を予測する方式とする。以下では図2Aに示すフローチャートに沿って、符号化/復号部1311における符号化の処理の流れを説明する。
まず、図2AのS201では多視点画像を取得する。本実施形態におけるプレノプティックカメラ部1307は図4に示す光学系を有し、ライトフィールドを取得する。図4において、物体401から発せられる光は、光学部1308aのメインレンズ402によってマイクロレンズ403に集光され、撮像部1308b内のマイクロレンズ403において分離され、同内のセンサ404に受光される。センサ404の一部を拡大したのが405であり、マイクロレンズ403によって分離された光が、4×4画素のセンサに円上に受光される。なお、1つのマイクロレンズに対して4×4画素のセンサが対応するが、この数は一例である点に注意されたい。また、メインレンズとマイクロレンズはF値が同じであるとする。この構成は非特許文献1で知られている光学系と同様の物である。
上記センサ404で撮影された情報から、4×4枚(計16枚)の多視点画像が撮影でき、画像バッファメモリ1310に格納される。以降では各多視点画像をIuvで表す。ここで、u,vは1つのマイクロレンズによるセンサ404への投影範囲の座標を表し、マイクロレンズの中心を通る位置を原点とし、uがその座標の横軸、vが縦軸である。また、マイクロレンズの投影する範囲の外周は直径1の円であるとする。Iuvは、例えばu=u1、v=v1の場合、図4の符号405に示した円状領域に受光された光のうち、u=u1,v=v1の位置にある画素を抜き出して並べることで生成できる。本実施形態では図5に実線の四角形で示した如く、16枚の多視点画像を生成する。なお、図5では、画像Iu1v1の中心が、図中に示した座標軸のu=u1、v=v1の位置になる様に配置している。なお、非特許文献1によると、多視点画像内の各Iuvは、メインレンズの一部(部分開口)を通った光によってできる画像とみなせる。以降では説明の為、各画像Iuvに対応するセンサ上(かつ、メインレンズ上)の座標(u,v)を「視点位置」と呼ぶ。
上記プレノプティックカメラ部1307で点光源からピントをずらして撮影した多視点画像が図3(f)である。実施形態では、多視点画像中の1枚の参照画像を用いて、1枚の符号化対象画像を符号化する例を述べる。説明を分かり易くするために、撮影画像の具体例が必要な場合は、図3(f)の画像302を参照して画像303を予測符号化する例を述べる。なお、以下と同様の手順を繰り返せば、いずれの多視点画像も符号化することが可能である。
図2(a)に戻ってS202では、16枚中の1つを参照画像として符号化する。符号化して得られた符号化データが画像バッファメモリ1310に一時的に格納される。実施形態では画像302をJPEGで符号化する。なお、参照画像の符号化方法はJPEGに限らずPNG、JPEG2000、H264イントラなど様々な方式が考えられる。そして、S203で参照画像を復号する。復号して得られた画像データは画像バッファメモリ1310に格納されるものとする。S202で参照画像を非可逆圧縮した場合は、圧縮により劣化した参照画像が得られる。復号時に得られるのは劣化した参照画像であるため、以下ではこの劣化した参照画像を予測に用いる。
S204〜S211では参照画像を利用して、他の画像301、303〜316を1つずつ予測符号化する。以下では、画像301、302〜316のうち、符号化しようとする画像を対象画像という。
まず、S204では対象画像を1つ選択する。そして、S205にて、画像バッファメモリ1310内に、対象画像に対して回転反転予測が有効となる復号済みの参照画像があるか否かを判定する。図3(f)から分かる様に全ての多視点画像間で、点光源のボケが線対称、もしくは回転対称の関係にあるとは限らない。具体的には画像301、304、313、316の4枚から成るグループ内では、どの画像ペア同士も回転対称もしくは線対称の関係にある。より詳しくは、画像304は画像301に対し、垂直線に対して線対称の画像である。画像313は画像301に対して、水平線に対して線対称の画像である。また、画像316は、画像301に対して180度の回転対象の画像である。
同様に画像302、303、305、308、309、312、314、315のグループ、画像306、307、310、311のグループはそれぞれ、グループ内のどの画像ペア同士も回転もしくは線対称な関係にあることがわかる。一方で、異なるグループ内の画像同士は、回転もしくは線対称な関係が成り立たない。このように回転もしくは線対称な関係が成り立たない画像ペアに対して、回転反転予測を行うと、処理時間が増加する一方で予測精度の向上は見込めない。従ってS204で参照画像と対象画像とが、同一グループであると判定した場合はS209、S210で回転反転を考慮した予測符号化を行い、異なるグループであると判定した場合はS206乃至S208で回転反転予測を考慮しない予測符号化を行う。
各多視点画像が同一グループで有るかどうかは、多視点画像を取得した光学系に依存する。従って同一グループの判定は、撮像装置に同一グループに属する画像の視点番号を記録しておき、符号化時にその情報を読み出すことで行う。図4に示した光学系を持つ撮像装置が保持する、同一グループの視点番号をまとめたテーブル(以下、グループ情報テーブル)を図6に示す。図示では多視点画像は3つのグループI乃至IIIに分類されることを示している。また、図示の視点番号は、左上隅からラスタースキャン順に対応し、図3(f)の画像の参照符号の下2桁に対応する。図6における各グループにおける*印、又は、**印がついた視点番号は、そのグループに属する参照画像(又は準参照画像)となることを示している。そして、**印は、多視点画像の全体の参照画像であることを示し、*印は一次参照画像を参照して符号化する二次参照画像(準参照画像)であることを示す。つまり、視点画像“2”(図3の画像302)はJPEG符号化する。そして、他のグループの準参照画像となる視点画像“1”、“6”は、視点画像“2”を参照して視差補償予測符号化する。こうして各グループの参照画像の符号化を終えると、以降は同じグループ内ではグループ内の参照画像を用いて回転・反転予測符号化する。
多視点画像にける参照画像や準参照画像の決め方は、各グループの中の1つの代表画像を選出して決めれば良い。実施形態では、多視点画像をラスタースキャンした際の、視点画像が最大数となるグループ内の最初に現れる視点番号を参照画像の視点番号として決定する。他のグループにおける準参照画像の視点番号は、多視点画像をラスタースキャンした際の、そのグループ内の最初に現れる視点番号とする。また、上記の通りなので、復号装置での復号処理がスムーズに行われるようにするため、参照画像を最初に符号化し、以降は、多視点画像をラスタースキャンした順に行う。実施形態では、多視点画像として4×4個が生成されるので、符号化する順番は視点番号順で示すと{2、1、3、4、5、6、…、15}の順番となる。よって、先のS202では、視点番号“2”の画像302がJPEG符号化されることになる。
なお、ここで述べたグループ内に1つ(準)参照を設けるのは、あくまで参照順序の一例である。例えば図6のグループIに属する画像群が全て視点番号1の画像を参照する方法だけでなく、視点4が視点1を参照し、視点13は視点4を参照することも可能である。ただしその場合視点13を復号する為に視点4と視点1の両方を復号する必要があるため、視点のランダムアクセス性が低下するというデメリットがある。
さて、初めてS205の判定処理を行うとき、その符号化対象画像は2番目に視点番号“1”で示される画像となる。視点番号“1”の画像は図6に示すようにグループIに属し、一次参照画像である視点番号“2”が属するグループIIとは異なる。一方、この段階で画像バッファメモリ1310に格納されている復号済み参照画像は視点番号“2”の画像であって、グループIに属する。すなわち、両者のグループは一致しない。それ故、処理はS206に進み、一次参照画像を復号して得られた画像データを用いて、対象画像の視差補償予測符号化を行い、得られた符号化データを画像バッファメモリ1310に格納する。
この視差補償予測符号化は、動画像符号化でのフレーム間符号化と同じであると考えると分かりやすい。動画像符号化におけるフレーム間符号化では、対象フレーム内の着目画素ブロックに対する予測ブロックを、参照フレーム内からサーチする。そして、着目画素ブロックと予測ブロック内の画素どうしの差分値を演算し、その差分値を符号化する。実施形態における視差補償予測符号化では、対象画像(着目視点画像)と参照画像との関係は、時間差の代わりに視差の関係にある点が異なるだけである。すなわち、実施形態における差補償予測符号化では、着目視点画像内の各画素ブロックについては、参照画像内から予測ブロックをサーチして予測符号化を行うものとする。従って、これ以上の説明は省略する。
さて、S206の符号化処理を終えると、処理はS207に進み、対象画像は自身が属するグループ内の他の画像に対する参照画像となるか否か、換言すれば、二次参照画像であるか否かを判定する。S206の処理が初めて行われたとき、対象画像は視点番号“1”の画像であってグループIの参照画像である(図6参照)。そこでグループIに属する他の画像の符号化に備えて、S208にて、復号処理を行い、その復号した画像を画像バッファメモリ1310に格納する。
一方、S205にて、画像バッファメモリ1310内に、対象画像に対して回転反転予測が有効となる復号済みの参照画像があると判定した場合、S209に進み、回転反転方法の判定を行う。
特許文献1では、ブロック単位に最適な回転方法を探索し、その回転角度を符号化するが、その方法では回転予測を行うブロック毎に回転角度の符号化が必要になってしまう。また、ブロック単位に最適な角度を調べる為、処理時間も多く必要になる。
本実施形態では、点光源のボケを仮定し、画像単位で反転回転方法を保持する。これにより、回転反転方法は画像単位の付与で良くなり、ブロック単位で保持する場合に比べて符号量を削減できる。また、点光源のボケを仮定すると、参照画像と対象画像の視点位置から最適な回転反転方法が特定できるため、回転反転方法の特定に必要な処理時間も削減できる。
参照視点と対称視点のペアが決まった際の最適な回転反転方法を示した表(以下、回転反転方法テーブル)はグループ情報テーブルと同じく光学系に依存する為、撮影装置が保持しておき、符号化時に読みだす。回転反転は参照視点と対象視点が同一グループにあった場合のみ行う為、回転反転方法テーブルはグループに対して1つ必要である。グループIIの場合の例を図7に示した。グループIIの参照画像は視点番号“2”の画像となる。図7では、参照画像をどのように回転もしくは反転すれば、対象画像の視点の予測に適した画像が得られるかを示している。図中の各マスには、反転か回転を示すフラグと、角度情報が格納されている。フラグ“0”は線対称の反転、“1”は回転対称であることを示している。角度情報は、線対称の反転の場合は反転の軸の角度を、回転対称の場合は回転角度を示した。反転の軸の角度は、画像の水平左方向を0度とし、時計回りに回転した際の角度を示した。
例えば今、対象画像が視点番号“3”であったとする。この場合、図7のテーブルから視点番号“2”と視点番号“3”とで特定されるマスの“0、90度”を得る。これは、反転フラグが“0”であるので反転、反転する際の基準となる線の方向は90度(垂直方向)であることを示す。なお先に説明したように、図7中の視点番号は図3(f)の画像301〜316の下2桁に対応している。図7中の左下半分が斜線になっているのは、視点iを視点jに変換する方法が分かれば、視点jから視点iはその逆変換で可能であるため、図7の右上半分が分かれば左下半分が不要な為である。なお、グループII内には視点番号“2”の画像(図4(f)の画像302)が含まれるが、この視点画像“2”は参照画像(一次参照画像)であって、S204にて既に復号済みである。
なお、グループ情報テーブル、回転反転方法テーブルは上記に示した、撮像装置に保持させる方法以外も考えられる。図4のプレノプティックカメラの光学系において多視点画像のボケ部の対称性に影響するのは、マイクロレンズ403がセンサ404何画素分にまたがるか(以下、分割数と呼ぶ。図4では分割数は16)である。従って、符号化装置に、分割数に応じたグループ情報テーブルと回転反転方法テーブルを数パターン保持しておき、撮像装置から入力された、分割数に応じたテーブルを読み出すことも可能である。もちろん、上記符号化装置が、単独の光学系のみに特化したものであるならば、その光学系の分割数におけるテーブルのみを保持すれば良い。
また、グループ情報テーブル、回転反転方法テーブルを符号化装置、撮像装置のどちらにも保持させずに、光学系に応じて自動生成する方法も考えられる。例えば分割数に応じて、図3(d)もしくは(f)のように円形のボケを分割した多視点画像を作成し、それらの画像ペア毎に最も良く予測できる回転反転方法を求めればよい。その探索方法は、例えば、画像単位に回転反転方法の候補を定め、後のS209で示すように1次元のブロックマッチングを行って参照視点画像から対象画像を予測し、もっとも予測誤差が小さい回転反転方法に決定する。この際、予測誤差が0(もしくは閾値以下)になる回転反転方法が無い画像ペアは、同じグループでは無いと見なす。
さて、回転・反転方法が決定されると、処理はS210に進み、対象画像を、画素ブロック単位に。回転・反転予測混在符号化処理を行う。以下、この符号化処理の手順を図2Bを参照して説明する。
まずS221では対象画像を複数の画素ブロックに分割し、そのうちの1つを選ぶ。通常は画像の左上からラスタースキャン順に画素ブロックを選択すればよい。1つの画素ブロックのサイズは8×8画素とするが、他のサイズであっても良いし、異なるブロックが混在しても構わない。
画素ブロックを選択したとき、その画素ブロックに対する予測画素ブロックを、参照画像からサーチする。このサーチには2通りある。
1つは、S222における視差ベクトル探索である。この処理はMVCなどで行われるのと同様、対象画像のブロックに最も似た領域を参照画像から探す処理である。類似度は差分絶対値和(以下、SAD)が小さいほど似ているという基準を用いれば良い。なお、視差ベクトルの探索範囲は2次元で行っても良いが、多視点画像の特性上、1次元に限定するのが望ましい。1次元の場合、対称視点の符号化対象ブロックを通り、参照画像の視点位置と対象画像の視点位置を結んだ直線と同じ傾きを持つ、直線上を探索する。例えば対象画像が画像303、参照画像が画像302の場合、両者は水平方向に並んでいるので、対象画像内の着目画素ブロックの位置をB(x、y)としたとき、参照画像内のB(x、y)を起点に、左右の水平方向に探索し、予測誤差が最小となる視差ベクトルを求める。なお、先に説明したS206の視差補償予測符号化処理も、ここで説明したのと同じ処理を行ってもよい。この場合、予測ブロックの探索範囲が2次元ではなく、1次元方向に沿ったものとなるので、探索範囲が狭くできる分だけ符号化速度を上げることができる。
もう1つは、S223における回転・反転予測を伴った視差ベクトルの探索である。この詳細を図2Cに示し、以下に説明する。
S231では回転反転予測を行う際の視差ベクトルの候補を選択する。例えば図8において、対象画像303のブロック801を予測する際には、参照画像302の探索範囲802上のブロックを指定するベクトルを1つ選ぶ。探索範囲はS209と同様、視点位置から定まる1次元の線上を調べるのが望ましい。以降ではブロック803を指定する視差ベクトルが選ばれたとする。次にS232では、S2231で選んだ視差ベクトルで指定されるブロックに対して、S205で特定された回転もしくは反転を施して得たブロックを予測画素ブロックとして予測誤差を計算する。図8の例では、視差ベクトルで指定されたブロック803を線対称に反転させてブロック804を得て、ブロック804と対象ブロック801との予測誤差を求める。予測誤差はSADを用いれば良い。
S233ではS231、S232の処理を全ての探索範囲で行ったかを判定する。全ての探索を終えた場合は、S234において、回転反転予測を行う際に最も予測誤差が小さくなる視差ベクトルを選ぶ。
図2Bに戻って、S224では、S222で得た視差ベクトルによる着目ブロックに対する誤差と、S223で得た回転反転を反映した得た視差ベクトルによる着目ブロックに対する誤差とを比較し、誤差の小さい方をそのブロックの予測方法として選ぶ。
S225、S226、S227では、予測方法を特定するための切り替えフラグ、視差ベクトル、および符号化対象ブロックと予測ブロックとの差分、をブロック単位に符号化する。差分情報はブロック単位に離散コサイン変換(以下、DCT)を施した際の係数によって符号化されるのが望ましい。この結果、得られた符号化データは画像バッファメモリ1310に格納される。
S228において、対象画像内の全てのブロックを処理したと判定されれば、ブロック単位の処理を終える。
S229では回転反転情報を符号化する。回転反転情報とは画像単位に与えられる情報で、S204で判定した回転反転予測の有無に加え、回転反転予測有りの場合は回転反転方法(図7で示した回転反転方法テーブルの1マスに対応)である。なお、復号装置にグループ情報と、回転反転方法テーブルを保持する場合には、復号対象画像の視点番号がわかれば、2種類のベクトル探索を行った画像であるのか否かが判明するので、回転反転方法を明示的に符号化する必要はない。つまり、S229の処理は無くても構わない。
以上で、S210の回転反転予測混在符号化の説明を終える。図2Aに戻って、S211では全視点画像の符号化を終えたか否かを判定する。否の場合には、S204以降の処理を繰り返す。一方、全視点画像の符号化を終えたと判断した場合には、画像バッファメモリ1310には、全視点画像の符号化データが格納されていることになる。そこで、CPU1301は、画像のサイズや、多視点の視点の個数や配列など、復号に必要な情報をヘッダにし、それに後続して各視点画像の符号化データを接続し、1つの符号化画像データファイルを作成し、記憶媒体1313に格納する(S212)。
以上が実施形態における画像符号化/復号部1311の処理内容であるが、上記処理で出力する情報を図9に示した。図9では各視点の符号データに含まれるデータ名と、データの付与単位をまとめた。各データの説明は上記フローで述べた通りである。なお、画像単位に付与する、回転反転予測の有無を示すフラグが、「回転反転予測無し」を示している場合は、回転反転方法と予測切り替えフラグは不要となる。
図1は、上記の処理を実現する画像符号化/復号部1311内の符号化部100の構成図である。
符号化部100は、画像バッファメモリ1310に格納された多視点画像が入力される。また多視点画像中の参照画像(復号した画像)も入力される。これは図2のフローチャートのS201〜S204の処理に対応する。
符号化部100は本実施形態の特徴である、回転反転を利用した多視点画像の符号化を行う。この符号化部100は図2のS204〜S221の処理を行う。以下で、符号化部100の各部の詳細を述べる。
回転反転方法判定部102では、対象画像の視点位置、参照画像の視点位置、および撮像装置から読み込むグループ情報テーブル、回転反転方法テーブルを利用して、回転反転が有効かどうか、有効な場合は最適な回転反転方法が何かを判定する。これは図2AのS205の処理に対応する。
回転反転視差ベクトル探索部103では、回転反転を考慮した視差ベクトルの探索を行い、最小誤差の画素ブロックのベクトルを求める。回転反転視差補償予測部104では、回転反転視差ベクトル探索部103で得た回転反転視差ベクトルを利用して予測画素ブロックを出力する。これら回転反転視差ベクトル探索部103、回転反転視差補償予測部104は、S223の処理の一部に当たる。
視差ベクトル探索部105は着目画素ブロックに対する最小の誤差となる視差ベクトルを探索し、視差補償予測部106は視差ベクトルを利用して予測画素ブロックを出力する。これらの処理は、S222に相当する。
判定部110は、回転反転視差ベクトル探索部103、視差ベクトル探索部105が、それぞれベクトルを探索する際に算出した最小誤差を比較し、いずれが小さいかを示す信号を出力する。かかる処理は、S224に相当する。
スイッチ111は、判定部110の判定結果を示す信号に従い、回転・反転視差補償予測部104、視差補償予測部106のいずれか一方からの予測画素ブロックを選択し、加算器112に出力する。加算器112は、対象画像中の注目画素ブロックと、スイッチ111から供給された予測ブロックとの差分を算出し、その差分ブロックをDCT部107に供給する。そして、DCT部107によるDCT変換、量子化部108によるDCT変換係数の量子化処理、更にはエントロピー符号化部109による符号化が行われる。なお、エントロピー符号化部109では、対象画像が、各グループ内での参照画像である場合を除き、判定部110からの判定信号(1ビット)も合わせて符号化し、それを画像の符号化データに付加して出力する。参照画像の場合、スイッチ111は、視差補償予測部106からの予測画素ブロックを選択するものとしているので、いずれの予測ブロックを用いたかを示すフラグが不要であるからである。これらスイッチ111、DCT変換部107、量子化部108、エントロピー符号化部109は、S225乃至S227に相当することになる。
以上実施形態における多視点画像の符号化にかかる説明した。次に、符号化/復号部1311内の復号部1000の画像復号処理を説明する。図10は、復号部1000のブロック構成図である。以下、復号部1000の処理内容を説明する。
CPU1301は、復号処理に先立って、図6、図7に示すテーブルを、エントロピー復号部1002にセットする。エントロピー復号部1002は、これらのテーブルを参照して、復号処理と、復号部1000の各処理部の制御を行う。
先に説明したように、実施形態の場合、符号化データは、視点番号“2、1,3,4、…16”の順番に並んでいる。すなわち、最初に復号するのは、視点番号“2”の画像であり、グループIIに属する画像である。この画像は、参照画像を必要とはせず、単独で復号できるJPEG符号化データでもある。従って、エントロピー復号部1002→逆量子化部1005→逆DCT部1006を経て、視点番号“2”の画像内の各画素ブロックが画像バッファメモリ1310に出力される。
2番目の視点画像は視点番号“1”の画像であり、グループIに属する画像でもある。また、この画像は、視点番号“2”の画像(最初に復号した画像)を参照画像として、視差補償予測符号化された画像である。従って、エントロピー復号部1002は、量子化済みの差分ブロックの符号化データだけでなく、ベクトル情報の復号も行い、予測復号処理を行う。エントロピー復号部1002は、量子化差分ブロックデータを逆量子化部1005に供給すると共に、復号して得られたベクトル情報を視差予測部1004に供給する。また、エントロピー復号部1002は、スイッチ1007に対して、視差予測部1004を選択する制御信号を供給する。視差予測部1004は、そのベクトル情報に基づき、参照画像内の該当する画素ブロックを読み出す。加算器1008は、逆DCT部1006から出力された差分ブロックに、視差予測部1004から供給された予測ブロックを加算し、画素ロックを生成し、画像バッファメモリ1310に出力することになる。
3番目の視点画像は視点番号“3”の画像である。この画像は、視点番号“3”は視点番号“2”と同じグループIIに属するものであるので、最初に復号した画像を参照画像とする、回転反転視差補償予測符号化された画像である。従って、エントロピー復号部1002には、量子化済みの差分ブロックの符号化データだけでなく、ベクトル情報の復号も行う。エントロピー復号部1002は、量子化差分ブロックデータを逆量子化部1005に供給する。また、エントロピー復号部1002は、復号して得られたベクトル情報と、回転反転にかかるパラメータを回転反転視差予測部1003に供給する。また、エントロピー復号部1002は、スイッチ1007に対して、回転反転視差予測部1003を選択する制御信号を供給する。回転反転視差予測部1003は、入力したベクトル情報に基づき、参照画像内の該当する画素ブロックを読み出し、かつ、設定されたパラメータに従って読出した画素ブロックに対して回転・反転を行い、その結果を出力する。加算器1008は、逆DCT部1006から出力された差分ブロックに、回転反転視差予測部1003から供給された予測ブロックを加算し、画素ロックを生成し、画像バッファメモリ1310に出力することになる。
4番目以降の視差画像の復号処理は、上記説明から明らかであろうから、その説明は省略する。
なお、図9の符号データ、及び、図10の復号装置の説明では、回転反転予測の有無、及び回転反転方法が符号データに明示的に含まれている前提で説明した。しかし、符号化処理の説明で述べたように、これらの情報は、対象視点番号と参照視点番号、及び多視点画像を撮影した光学系の分割数が分かれば特定することができる。その特定方法の1つとしては、復号装置にも、分割数に応じたグループ情報テーブルと回転反転方法テーブルを持たせ、分割数に応じて切り替える方法がある。また、別の方法としては、分割数に応じてテーブルを自動生成する方法も考えられる。復号装置がこれらの構成をとる場合には、回転反転予測の有無及び、回転反転方法は、対象視点と参照視点の番号及び分割数の中に陰に符号化されていると考えることができる。
上記実施形態では、多視点画像が4×4個の視点位置の画像の配列であるものとして説明したが、N×M個(N,Mは自然数であって、少なくとも一方は2以上の整数)に一般化できる。この場合の各視点位置画像のグループへの分類は、その配列の中心位置から互いに同じ距離にある画像を1つのグループに分類する、という条件でよい。この結果、同じグループに属する画像は、互いに、多視点配列の中心位置に対して点対称、又は、中心位置を通る線分に対して線対称の関係になる。換言すれば、異なるグループに属する画像どうしは、非点対称かつ非線対称ということができる。例えば、図15に示すように5×5個の視点位置画像があり、それぞれの視点位置の番号を図示のようにラスタースキャン順に割り当てたとき、図示の右側に示すように5つのグループに分類できる。
[第1の実施形態の変形例]
上記の第1の実施形態では、デジタルカメラに代表される撮像装置に適用した例を説明したが、ソフトウェアで実現しても構わない。この場合、このソフトウェアは、PC(パーソナルコンピュータ)等、一般のコンピュータのメモリにインストールされることになる。そしてこのコンピュータのCPUがこのインストールされたソフトウェアを実行することで、このコンピュータは、画像符号化装置や復号装置として機能することになる。即ち、このコンピュータは、上述の画像処理装置に適用することができる。この場合のコンピュータは、例えば図14に示す構成を有することになる。以下は図15を参照した説明である。
上記の第1の実施形態では、デジタルカメラに代表される撮像装置に適用した例を説明したが、ソフトウェアで実現しても構わない。この場合、このソフトウェアは、PC(パーソナルコンピュータ)等、一般のコンピュータのメモリにインストールされることになる。そしてこのコンピュータのCPUがこのインストールされたソフトウェアを実行することで、このコンピュータは、画像符号化装置や復号装置として機能することになる。即ち、このコンピュータは、上述の画像処理装置に適用することができる。この場合のコンピュータは、例えば図14に示す構成を有することになる。以下は図15を参照した説明である。
CPU1501は、RAM1502やROM1503に格納されているコンピュータプログラムやデータを用いて、コンピュータ全体の制御を行うと共に、画像処理装置が行うものとして説明した上述の各処理を実行する。RAM1502は、コンピュータ読み取り可能な記憶媒体の一例である。RAM1502は、外部記憶装置1507や記憶媒体ドライブ1505、更にはネットワークインタフェース1510からロードされたコンピュータプログラムやデータを一時的に記憶するためのエリアを、有する。更に、RAM1502は、CPU1501が各種の処理を実行する際に用いるワークエリアを有する。即ち、RAM1502は、各種のエリアを適宜提供することができる。ROM1503は、コンピュータ読み取り可能な記憶媒体の一例であり、コンピュータの設定データや、ブートプログラムなどが格納されている。キーボード1504、マウス1505は、コンピュータの操作者が操作することで、各種の指示をCPU1501に対して入力することができる。表示装置1506は、CRTや液晶画面などにより構成されており、CPU1501による処理結果を画像や文字などでもって表示することができる。外部記憶装置1507は、コンピュータ読み取り記憶媒体の一例であり、ハードディスクドライブ装置に代表される大容量情報記憶装置である。外部記憶装置1507には、OS(オペレーティングシステム)や、図1に示した各処理をCPU1501に実現させるためのコンピュータプログラムやデータ、上記の各種テーブル、データベース等が保存されている。外部記憶装置1507に保存されているコンピュータプログラムやデータは、CPU1501による制御に従って適宜RAM1502にロードされ、CPU1501による処理対象となる。
記憶媒体ドライブ1508は、CD−ROMやDVD−ROMなどの記憶媒体に記録されているコンピュータプログラムやデータを読み出し、読み出したコンピュータプログラムやデータを外部記憶装置1507やRAM1502に出力する。なお、外部記憶装置1507に保存されているものとして説明した情報の一部若しくは全部をこの記憶媒体に記録させておき、この記憶媒体ドライブ1508に読み取らせても良い。
I/F1509は、外部から多視点画像、光学系のパラメータ等を入力するインタフェースであり、一例として示すのであればUSB(Universal Serial Bus)である。1510は、上述の各部を繋ぐバスである。
上述構成において、本コンピュータの電源がONになると、CPU1501はROM1503に格納されているブートプログラムに従って、外部記憶装置1507からOSをRAM1502にロードする。この結果、キーボード1504、マウス1505を介した情報入力操作が可能となり、表示装置1506にGUIを表示することが可能となる。ユーザが、キーボード1504やマウス1505を操作し、外部記憶装置1507に格納されたアプリケーションプログラムの起動指示を入力すると、CPU1501はこのプログラムをRAM1502にロードし、実行する。これにより、本コンピュータが符号化や復号を行う画像処理装置として機能することになる。
なお、CPU1501が実行する画像処理用のアプリケーションプログラムは、基本的に図1に示す各部に相当する関数を備えることになる。ここで、符号化対象の画像は、I/F1509を介して入力し、一旦、がうぶ記憶装置1507などに格納される。また、画像処理結果(符号化結果)は外部記憶装置1507に保存することになる。なお、このコンピュータは、以降の各実施形態に係る画像処理装置にも同様に適用可能であることは、以下の説明より明らかである。
[第2の実施形態]
本第2の実施形態では、第1の実施形態における、多焦点画像の回転反転予測混在符号化方法を変更した例を説明する。第1の実施形態では、同じグループ内であって、参照画像以外の画像を符号化する場合、その画像中の全ブロックに対し、視差ベクトル探索と回転反転視差ベクトルの両方を探索し、予測誤差の小さい予測方法を選ぶ実施形態を説明した。本実施形態では、各ブロックがボケ部であるかどうかを判定し、回転反転視差ベクトルの探索はボケ部のみに行う例を説明する。
本第2の実施形態では、第1の実施形態における、多焦点画像の回転反転予測混在符号化方法を変更した例を説明する。第1の実施形態では、同じグループ内であって、参照画像以外の画像を符号化する場合、その画像中の全ブロックに対し、視差ベクトル探索と回転反転視差ベクトルの両方を探索し、予測誤差の小さい予測方法を選ぶ実施形態を説明した。本実施形態では、各ブロックがボケ部であるかどうかを判定し、回転反転視差ベクトルの探索はボケ部のみに行う例を説明する。
本第2の実施形態は、図2Aのフローチャートに回転反転予測混在符号化処理(S206)の詳細が、図2Bに代わって、図11A,11Bの処理に変更する以外は第1の実施形態と同様である。従って以下では、図11A,11Bの処理の詳細について説明する。
図11(a)の処理のうち、S1101、S1102以外の処理は、図2Bの該当する処理と同じであるので同符号を付した。
図11(a)のフローの特徴はS1101でボケ部を判定し、その結果に応じてS1102で分岐し、ボケ部と判定されたブロックのみ、回転反転視差ベクトル探索処理(S223)と予測方法選択(S224)を行う点である。それ以外のブロックに対しては視差ベクトル探索S1102による予測のみを行う。
S1101のボケ部判定の詳細を図11(b)に示す。本実施形態におけるボケ部判定は、多視点画像の視差によるボケの判定と、コントラストによるボケの判定を組み合わせている。なお、これらの一方、もしくは別の方法でボケ部の判定を行っても良い。
まずS1112では対象視点画像と、隣接する視点の画像との視差を算出する。視差は視差ベクトルの探索と同様、ブロック単位でSADを計算し、最もSADの低いブロックを選ぶ。なお、適切な視差が見つからない場合がある。例えば、対象ブロックの周辺に類似したテクスチャが周期的に表れるためSAD最小のブロックが一意に決まらない場合や、オクルージョン領域であることから、SADが十分に小さくなる対応ブロックが見つからない場合である。この様な場合はS1112では「視差無し」を出力する。なお、S1112の視差算出処理は、S1102の視差ベクトル探索とほぼ同様の処理を行う。従って、S1102の結果の流用などにより、処理量を減らすことができる。
S1113ではS1112において視差が求まったかどうかによって分岐を行う。視差が求まった場合はS1114に進む。
S1114では視差の絶対値が閾値より大きいかを判定し、閾値以上のブロックはボケ部(S1117)、それ以外は非ボケ部(S1118)と判定する。これは、図3(f)をみれば分かる通り、プレノプティックカメラで撮影した多視点画像間の視差の絶対値が大きいほど、その領域のボケも大きいためである。本実施形態では、視差の絶対値が8以上をボケ部であるとする。視差が8以上ある場合は、多視点画像内の各画像における点光源のボケも8画素にまたがるため、8×8画素ブロック単位の回転反転予測の効果が大きいと考えられるためである。
S1113で視差が求まらなかった場合は、S1115でブロック内のコントラストを算出し、S1116でコントラストが閾値以上かを判定する。閾値以上なら非ボケ部(S1121)、それ以外はボケ部(S1120)と判定する。コントラストはブロック内の輝度最大画素と最低画素との輝度値の比を用いる。なお、コントラストとしてはそれ以外に、ブロック内の輝度の分散などを用いても良い。
以上で、第2の実施形態の処理の説明を終える。本実施形態の特徴はS1103のボケ部判定結果に応じて、S1105の回転反転視差ベクトル探索を行うか否かを切り替える点である。この切り替えにより、全てのブロックに対して回転反転視差ベクトル探索を行う場合に比べて、探索処理の削減が見込める。
[第3の実施形態]
第3の実施形態では回転反転予測をMVCに組み合わせる場合を説明する。第1の実施形態では、プレノプティックカメラ部1307で撮影した多視点の静止画の符号化だったのに対し、本実施形態では動画を扱う。それに伴い、第1の実施形態に加えて、時間軸に沿ったフレーム間相関を利用した予測が加わる。また、MVCの機能である画面内予測も加わる。
第3の実施形態では回転反転予測をMVCに組み合わせる場合を説明する。第1の実施形態では、プレノプティックカメラ部1307で撮影した多視点の静止画の符号化だったのに対し、本実施形態では動画を扱う。それに伴い、第1の実施形態に加えて、時間軸に沿ったフレーム間相関を利用した予測が加わる。また、MVCの機能である画面内予測も加わる。
なお、動画像を撮像する際には、画像バッファメモリ1310には、時系列に撮像された多視点画像が順次格納されることになる。
本第3の実施形態の符号化・復号部1311における符号化部1201のブロック構成図を図12に示す。
図12において、図1と同じ機能を有するものについては同符号を付した。図12では、逆量子化部1211〜動き補償予測部1217が、第1の実施形態の符号化装置に対して、本実施形態で追加したブロックである。これらのブロックはMVCの構成要素として広く知られている。イントラ予測部1213は、対象画像の符号化済みブロックの情報を利用して、まだ符号化していないブロックに対する予測を行う。対象視点の参照画像メモリ1215には、対象視点の動画のうち、対象画像とは別の時刻の画像が格納されている。動きベクトル探索部1216、動き補償予測部1217では、1215に納められている画像を使って、対象画像を予測する処理を行う。対象視点の参照画像メモリへは、異なる4つの予測方式のいずれかによる予測画像と、逆量子化部1211、逆DCT部1212で復号された差分情報とが加算され、デブロッキング・フィルタ1214を施されて入力される。
以上で本実施形態の説明を終える。本第3の実施形態により、回転反転予測は既存の標準技術であるMVCの拡張機能として、容易に追加可能なことが確認できる。
(その他の実施例)
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
Claims (13)
- ライトフィールドデータから構成される複数の視点画像を符号化する画像符号化装置であって、
前記複数の視点画像のうちの予め設定された1つを参照画像とし、当該参照画像を符号化する第1の符号化手段と、
前記複数の視点画像のうち、前記参照画像を除く他の視点画像については、前記参照画像を参照して、画素ブロックを単位に予測符号化する第2の符号化手段とを備え、
前記第2の符号化手段は、
前記参照画像と符号化対象の着目視点画像との関係が、点対称、又は、線対称の関係にあるとき、当該参照画像の画素ブロックを前記関係に従って回転又は反転して得られた回転反転されたブロックを予測符号化の際の参照画像として用いる
ことを特徴とする画像符号化装置。 - 上記第2の符号化手段は、参照視点と着目視点のペアに対して画像単位で1つ、回転または反転の方法を符号化し、
前記着目視点画像内のブロックの符号化データにおいてブロック単位で、回転または反転した予測画素ブロックを予測に用いたかを示す情報を付加して出力する
ことを特徴とする請求項1に記載の画像符号化装置 - 前記複数の視点画像は、N×M個の視点位置の画像の配列であって、当該配列の中心位置から互いに同じ距離にある画像をグループに分類したとき、
前記第1の符号化手段は、最大数の画像を含むグループ内の1つの代表画像を前記参照画像として符号化し、
前記第2の符号化手段は、
前記最大数の画像を含むグループ内の、前記参照画像を除く他の画像については、前記参照画像に対して前記点対称又は前記線対称にあるものとして符号化し、
前記最大数の画像のグループを除く他のグループ内の1つの画像については、前記参照画像に対して非点対称かつ非線対称にある準参照画像として符号化し、
前記最大数の画像のグループを除く他のグループ内の前記準参照画像を除く他の画像については、前記準参照画像に対して前記点対称又は前記線対称にあるものとして符号化する
ことを特徴とする請求項1に記載の画像符号化装置。 - 前記第2の符号化手段は、符号化対象の着目視点画像の画素ブロックを予測符号化するとき、前記着目視点画像の視点位置と前記参照画像の視点位置とを結ぶベクトルに沿って前記参照画像から予測画素ブロックを探索することを特徴とする請求項1乃至3の何れか1項に記載の画像符号化装置。
- 前記第2の符号化手段は、
符号化対象の着目視点画像の画素ブロックがボケているか否かを判定する判定手段を有し、
当該判定手段の判定結果がボケていると判定し、かつ、前記参照画像と前記着目視点画像との関係が、前記複数の視点画像の中心位置に対して点対称、又は、前記中心位置を通る線分に対して線対称の関係あるとき、前記参照画像に加え、当該参照画像を前記関係に従って回転又は反転して得られた回転反転した画像も予測符号化の際の参照画像として用いて符号化することを特徴とする請求項1乃至4のいずれか1項に記載の画像符号化装置。 - 前記判定手段は、多視点画像間の視差と、画像内のコントラストに基づいてボケているか否か判定することを特徴とする請求項5に記載の画像符号化装置。
- ライトフィールドカメラ部と、請求項1乃至5のいずれか1項に記載の画像符号化装置と、符号化したデータを記憶媒体に格納する格納手段とを有することを特徴とする撮像装置。
- ライトフィールドデータを表す複数の視点画像の符号化データを復号する画像復号装置であって、
前記複数の視点画像のうちの予め設定された1つを、単独で符号された画像として画素ブロックを単位に復号する第1の復号手段と、
前記複数の視点画像のうち、前記参照画像を除く他の視点画像については、前記参照画像を参照して、画素ブロックを単位に予測復号する第2の復号手段とを備え、
前記第2の復号手段は、
前記参照画像と復号対象の着目視点画像との関係が、前記複数の視点画像の中心位置に対して点対称、又は、前記中心位置を通る線分に対して線対称の関係にあるとき、前記参照画像に加え、当該参照画像を前記関係に従って回転又は反転して得られた回転反転された画像も予測復号する際の参照画像として用い、
復号して得られた情報に基づいて、前記着目視点画像内の画素ブロックが、いずれの参照画像として符号化されたのかを判定し、判定した一方の参照画像を用いて予測復号する
ことを特徴とする画像復号装置。 - ライトフィールドデータから構成される複数の視点画像を符号化する画像符号化装置の制御方法であって、
第1の符号化手段が、前記複数の視点画像のうちの1つを参照画像とし、当該参照画像を符号化する第1の符号化工程と、
第2の符号化手段が、前記複数の視点画像のうち、前記参照画像を除く他の視点画像については、前記参照画像を参照して、画素ブロックを単位に予測符号化する第2の符号化工程とを備え、
前記第2の符号化工程では、
前記参照画像と符号化対象の着目視点画像との関係が、前記複数の視点画像の中心位置に対して点対称、又は、前記中心位置を通る線分に対して線対称の関係にあるとき、前記参照画像に加え、当該参照画像を前記関係に従って回転又は反転して得られた回転反転された画像も予測符号化の際の参照画像として用いる
ことを特徴とする画像符号化装置の制御方法。 - ライトフィールドデータを表す複数の視点画像の符号化データを復号する画像復号装置の制御方法であって、
第1の復号手段が、前記複数の視点画像のうちの予め設定された1つを、単独で符号された画像として画素ブロックを単位に復号する第1の復号工程と、
第2の復号手段が、前記複数の視点画像のうち、前記参照画像を除く他の視点画像については、前記参照画像を参照して、画素ブロックを単位に予測復号する第2の復号工程とを備え、
前記第2の復号工程では、
前記参照画像と復号対象の着目視点画像との関係が、前記複数の視点画像の中心位置に対して点対称、又は、前記中心位置を通る線分に対して線対称の関係にあるとき、前記参照画像に加え、当該参照画像を前記関係に従って回転又は反転して得られた回転反転された画像も予測復号する際の参照画像として用い、
復号して得られた情報に基づいて、前記着目視点画像内の画素ブロックが、いずれの参照画像として符号化されたのかを判定し、判定した一方の参照画像を用いて予測復号する
ことを特徴とする画像復号装置の制御方法。 - コンピュータに読み込ませ実行させることで、前記コンピュータに請求項9に記載の方法の各工程を実行させるためのプログラム。
- コンピュータに読み込ませ実行させることで、前記コンピュータに請求項10に記載の方法の各工程を実行させるためのプログラム。
- 請求項11又は12に記載のプログラムを格納したことを特徴とするコンピュータが読み取り可能な記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013241270A JP2015103872A (ja) | 2013-11-21 | 2013-11-21 | 画像符号化装置及び画像復号装置及びそれらの制御方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013241270A JP2015103872A (ja) | 2013-11-21 | 2013-11-21 | 画像符号化装置及び画像復号装置及びそれらの制御方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2015103872A true JP2015103872A (ja) | 2015-06-04 |
Family
ID=53379277
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013241270A Pending JP2015103872A (ja) | 2013-11-21 | 2013-11-21 | 画像符号化装置及び画像復号装置及びそれらの制御方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2015103872A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017060111A (ja) * | 2015-09-18 | 2017-03-23 | 日本電信電話株式会社 | 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法 |
CN107027025A (zh) * | 2017-03-28 | 2017-08-08 | 清华大学深圳研究生院 | 一种基于宏像素块自适应预测的光场图像压缩方法 |
JP2018530225A (ja) * | 2015-09-07 | 2018-10-11 | トムソン ライセンシングThomson Licensing | 光照射野ベース画像を符号化及び復号する方法と装置、および対応するコンピュータプログラム製品 |
JP2020017894A (ja) * | 2018-07-26 | 2020-01-30 | 日本電信電話株式会社 | 符号化装置及びプログラム |
EP4319168A4 (en) * | 2021-04-22 | 2024-07-17 | Huawei Tech Co Ltd | METHOD, APPARATUS AND SYSTEM FOR PLAYING VIDEO, AND COMPUTER-READABLE STORAGE MEDIUM |
-
2013
- 2013-11-21 JP JP2013241270A patent/JP2015103872A/ja active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018530225A (ja) * | 2015-09-07 | 2018-10-11 | トムソン ライセンシングThomson Licensing | 光照射野ベース画像を符号化及び復号する方法と装置、および対応するコンピュータプログラム製品 |
JP2017060111A (ja) * | 2015-09-18 | 2017-03-23 | 日本電信電話株式会社 | 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法 |
CN107027025A (zh) * | 2017-03-28 | 2017-08-08 | 清华大学深圳研究生院 | 一种基于宏像素块自适应预测的光场图像压缩方法 |
CN107027025B (zh) * | 2017-03-28 | 2019-06-28 | 清华大学深圳研究生院 | 一种基于宏像素块自适应预测的光场图像压缩方法 |
JP2020017894A (ja) * | 2018-07-26 | 2020-01-30 | 日本電信電話株式会社 | 符号化装置及びプログラム |
EP4319168A4 (en) * | 2021-04-22 | 2024-07-17 | Huawei Tech Co Ltd | METHOD, APPARATUS AND SYSTEM FOR PLAYING VIDEO, AND COMPUTER-READABLE STORAGE MEDIUM |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11539979B2 (en) | Method and apparatus of encoding/decoding image data based on tree structure-based block division | |
JP6901468B2 (ja) | 光照射野ベース画像を符号化及び復号する方法と装置、および対応するコンピュータプログラム製品 | |
US20180027257A1 (en) | Image processing device and image processing method | |
JP5883153B2 (ja) | 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、画像符号化プログラム、画像復号プログラム及び記録媒体 | |
CN107852500B (zh) | 运动矢量场编码方法和解码方法、编码和解码装置 | |
JP6232076B2 (ja) | 映像符号化方法、映像復号方法、映像符号化装置、映像復号装置、映像符号化プログラム及び映像復号プログラム | |
US11831915B1 (en) | Method and apparatus of encoding/decoding image data based on tree structure-based block division | |
KR20140004209A (ko) | 3d 비디오 코딩에서의 텍스처 이미지 압축 방법 및 장치 | |
JP6027143B2 (ja) | 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、画像符号化プログラム、および画像復号プログラム | |
JP6307152B2 (ja) | 画像符号化装置及び方法、画像復号装置及び方法、及び、それらのプログラム | |
JP2015103872A (ja) | 画像符号化装置及び画像復号装置及びそれらの制御方法 | |
JPWO2014168082A1 (ja) | 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、画像符号化プログラム及び画像復号プログラム | |
JP2007166381A (ja) | 多視点画像の圧縮符号化方法及び復号化方法 | |
JP6232075B2 (ja) | 映像符号化装置及び方法、映像復号装置及び方法、及び、それらのプログラム | |
JP5926451B2 (ja) | 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、画像符号化プログラム、および画像復号プログラム | |
KR101750421B1 (ko) | 동화상 부호화 방법, 동화상 복호 방법, 동화상 부호화 장치, 동화상 복호 장치, 동화상 부호화 프로그램, 및 동화상 복호 프로그램 | |
JP2015171097A (ja) | 画像処理装置及びその制御方法 | |
WO2015098827A1 (ja) | 映像符号化方法、映像復号方法、映像符号化装置、映像復号装置、映像符号化プログラム及び映像復号プログラム | |
Guo et al. | Hole-filling map-based coding unit size decision for dependent views in three-dimensional high-efficiency video coding | |
JP2013098740A (ja) | 画像処理装置及びその制御方法 | |
KR20140051790A (ko) | 3차원 영상의 뷰간(inter-view) 움직임 벡터 예측에서의 변이 벡터 유도 방법 | |
JP2013126006A (ja) | 映像符号化方法、映像復号方法、映像符号化装置、映像復号装置、映像符号化プログラム及び映像復号プログラム | |
BR112016020544B1 (pt) | Realce consciente de profundidade para vídeo estéreo | |
JP2014112749A (ja) | 画像符号化装置および画像復号装置 |