JP6028665B2 - 画像対応付け装置および画像対応付け方法 - Google Patents

画像対応付け装置および画像対応付け方法 Download PDF

Info

Publication number
JP6028665B2
JP6028665B2 JP2013083926A JP2013083926A JP6028665B2 JP 6028665 B2 JP6028665 B2 JP 6028665B2 JP 2013083926 A JP2013083926 A JP 2013083926A JP 2013083926 A JP2013083926 A JP 2013083926A JP 6028665 B2 JP6028665 B2 JP 6028665B2
Authority
JP
Japan
Prior art keywords
motion vector
voting
value
image
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013083926A
Other languages
English (en)
Other versions
JP2014207554A (ja
Inventor
一之 宮澤
一之 宮澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2013083926A priority Critical patent/JP6028665B2/ja
Publication of JP2014207554A publication Critical patent/JP2014207554A/ja
Application granted granted Critical
Publication of JP6028665B2 publication Critical patent/JP6028665B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Analysis (AREA)

Description

この発明は、複数の画像間で同一の箇所を見つけて対応付ける画像対応付け装置および方法に関するものである。
複数の画像間で同一の箇所を写している点を見つける画像の対応付けは、映像のブレ補正、パノラマ写真生成、超解像、デプス推定、3次元形状復元など、多くのアプリケーションで必要となる基礎技術である。図19は、一般的な画像の対応付けの一例である。しかし、一般に画像の対応付けに要する演算量は大きく、これらのアプリケーションの適用範囲を狭める原因となっている。
例えば、動画像の撮影に利用されるカメラなども含めた画像符号化装置では、記録時に動画像符号化処理が適用されてデータ量の削減が行われる。従来、MPEGやITU−T H.26x等の国際標準動画像符号化方式では、時間的な相関を利用する画像フレーム間の予測(以下、インター予測という)および空間的な相関を利用する画像フレーム内の予測(以下、イントラ予測という)によって画像ブロック等の単位で予測処理を行い、原画像と予測画像との誤差である予測残差のみを伝送することで情報量を大きく削減している。
ここで、インター予測では、符号化対象となる画像(符号化対象ピクチャ)のブロック(符号化対象ブロック)と似通ったブロック(参照ブロック)をすでに符号化された画像(参照ピクチャ)から探索する処理が符号化時に実施され、2枚の画像間での画像ブロックの移動量を表す動きベクトルを算出する。
図20は、符号化時に複数の参照ブロックに対する動きベクトルの候補が見つかった場合の一例である。ここでは、2つの動きベクトルが候補として見つかった場合を示しており、候補の中から最適な動きベクトルを決定する一般的な方法を説明する。2つの動きベクトルの候補をmvAとmvBとすると、被写体(車)の実際の運動を表しているベクトルはmvAであり、画像の対応付けに利用すべきベクトルといえる。符号化においては、ベクトルを選択する際、各ベクトルに対して評価値が計算される。ベクトルの評価値としては、対応させるブロック内の各画素値の差分絶対値和SAD(Sum of Absolute Differences)と水平方向および垂直方向のベクトルの絶対値の和を計算した符号化コストなどが考えられる(例えば非特許文献1)。例えば、2つのベクトルmvA、mvBの符号化コストは、それぞれ次のように求めることができる。
(mvAのコスト)=SAD+abs(mvA_x)+abs(mvA_y)
=10+30+0=40
(mvBのコスト)=SAD+abs(mvB_x)+abs(mvB_y)
=20+5+5=30
ここで、abs(s)は数値sの絶対値を返す関数であり、またmvA_xとmvB_xおよびmvA_yとmvB_yはそれぞれのベクトルの水平成分および垂直成分である。
このように、符号化時に複数の動きベクトルの候補があるとき、符号化コストが小さいベクトルを選択することが符号化効率を向上させることになるため、この例では被写体の実際の運動を表していないにもかかわらず、mvBが最適な動きベクトルとして選択されてしまう。符号化における動きベクトルの選択は、符号化対象ピクチャと参照ピクチャとの間で画像の対応付けを実施しているといえるが、符号化効率の観点から選択された動きベクトルを単に画像の対応付けに利用するだけでは、追加の演算を必要としない簡易さはあるが、誤った対応関係が導かれてしまうことがある。
大久保榮(監修)、角野眞也、菊池義浩、鈴木輝彦(共著)「H.264/AVC教科書」、インプレスR&D、2006年、p.206〜p.208
従来の画像符号化装置では、動画像を符号化する際に得られる動きベクトルを利用して、画素値の差分のみでなくベクトルの大きさなども考慮して伝送する符号量を最小化するように動きベクトルを決定しているので、動きベクトルをそのまま利用して画像を対応付けようとしたのでは対応付けられる点は必ずしも被写体の同じ点を指し示すことができないという問題があった。
この発明は、上記のような問題点を解決するためになされたもので、階層的な参照構造によって符号化された動画像から得られる複数の動きベクトルの一貫性を評価することで、動きベクトルによる画像間の対応付けの信頼性を推定し、信頼性の高い対応関係のみを利用することで画像間の対応付けの精度を向上させた画像対応付け装置を提供することを目的とする。
この発明に係る画像対応付け装置は、複数の画像が階層的な参照構造で符号化された動画像を符号化する際に得られる動きベクトルを利用して画像の対応付けを行う画像対応付け装置であって、前記複数の画像間における動きベクトルの指示関係を検索する動きベクトル検索部と、符号化情報と画像と前記動きベクトル検索部が検索した前記動きベクトルの指示関係に基づいて、前記動きベクトルの投票値を決定する投票値決定部と、前記投票値決定部が決定した前記動きベクトルの投票値を当該動きベクトルが指す基準画像上の位置に投票し、投票された各位置の合計投票値に基づいて基準画像上の対応点を決定する投票部とを備えた。
このように、この発明に係る画像対応付け装置および方法によれば、複数の画像間における動きベクトルの指示関係を検索する動きベクトル検索部と、複数の画像とそれらの符号化情報と動きベクトル検索部が検索した動きベクトルの指示関係に基づいて、動きベクトルの投票値を決定する投票値決定部と、投票値決定部が決定した動きベクトルの投票値を当該動きベクトルが指す基準画像上の位置に投票し、投票値を集約した各位置の集約投票値に基づいて基準画像上の対応点を決定する投票部とを備え、階層的な参照構造によって符号化された動画像の複数の動きベクトルの一貫性を投票によって定量化することで対応付けるようにしたので、単に一つの動きベクトルを用いて対応付けを行う場合に比べて対応付けの信頼性を向上させることができる。
また、この発明に係る画像対応付け装置および方法によれば、さらに投票部が決定した基準画像上の対応点の集約投票値から対応関係の信頼性を判定し、その判定結果を出力する判定部を備え、階層的な参照構造によって符号化された動画像の複数の動きベクトルの一貫性を投票によって定量化した後、対応付けの信頼性を判定するようにしたので、信頼性の程度を評価して信頼性が低い対応付けを排除することができる。
この発明の実施の形態1に係る画像対応付け装置の構成を示すブロック図である。 動画像を構成するピクチャ間の参照階層構造の一例を示す図である。 この発明の実施の形態1に係る動画像を構成するピクチャ間の動きベクトルを利用した信頼性が高い画像の対応付けの一例を示す図である。 この発明の実施の形態1に係る動画像を構成するピクチャ間の動きベクトルを利用した信頼性が低い画像の対応付けの一例を示す図である。 この発明の実施の形態1に係る画像対応付け装置の動作の一例を示すフローチャートである。 この発明の実施の形態1に係る画像の対応付けを行う座標の指定例を示す図である。 この発明の実施の形態1に係る動画像を構成する階層的なピクチャ間の動きベクトルを利用した画像の対応付けの過程の一例を示す図(その1)である。 この発明の実施の形態1に係る動画像を構成する階層的なピクチャ間の動きベクトルを利用した画像の対応付けの過程の一例を示す図(その2)である。 この発明の実施の形態1に係る動画像を構成する階層的なピクチャ間の動きベクトルを利用した画像の対応付けの過程の一例を示す図(その3)である。 この発明の実施の形態1に係る動画像を構成する階層的なピクチャ間の動きベクトルを利用した画像の対応付けの過程の一例を示す図(その4)である。 この発明の実施の形態1に係る画像の対応ブロックと周囲のブロックの関係の一例を示す図である。 この発明の実施の形態1に係る階層的なピクチャが持つ動きベクトルの投票の過程の一例を示す図(その1)である。 この発明の実施の形態1に係る階層的なピクチャが持つ動きベクトルの投票の過程の一例を示す図(その2)である。 この発明の実施の形態1に係る階層的なピクチャが持つ動きベクトルの投票の過程の一例を示す図(その3)である。 この発明の実施の形態1に係る階層的なピクチャが持つ動きベクトルの投票の過程の一例を示す図(その4)である。 この発明の実施の形態1に係る動きベクトルが指し示す座標と投票の一例を示す説明図である(その1)。 この発明の実施の形態1に係る動きベクトルが指し示す座標と投票の一例を示す説明図である(その2)。 この発明の実施の形態1に係る対応点の追跡の一例を示す概念図である。 一般的な画像の対応付けの一例である。 符号化時に複数の参照ブロックに対する動きベクトルの候補が見つかった場合の一例である。
実施の形態1.
この発明の実施の形態1では、符号化された映像シーケンスを構成する各ピクチャの階層参照関係に基づいて符号化時に選択された動きベクトルの一貫性を利用して信頼性の高い画像の対応付けを行う画像対応付け装置を説明する。
図1は、この発明の実施の形態1に係る画像対応付け装置の構成を示すブロック図である。この発明は、画像符号化装置あるいは画像復号装置の一部として実現してもよいし、画像符号化装置あるいは画像復号装置からの情報を受け取る独立した装置として実現してもよい。この発明の実施の形態1に係る画像対応付け装置は、動きベクトル検索部1、投票値決定部2、係数保持部3、投票部4、判定部5、閾値保持部6から構成される。
図において、動きベクトル検索部1は、複数の画像間における動きベクトルの指示関係を検索する。投票値決定部2は、複数の画像とそれらの符号化情報と動きベクトル検索部が検索した動きベクトルの指示関係に基づいて、動きベクトルの投票値vを決定する。投票部4は、投票値決定部2が決定した動きベクトルの投票値を当該動きベクトルが指す基準画像上の位置に投票し、投票値を集約した各位置の集約投票値に基づいて基準画像上の対応点を決定する。判定部5は、投票部4が決定した基準画像上の対応点の集約投票値から対応関係の信頼性を判定し、その判定結果と基準画像上の対応点の座標を出力する。係数保持部3は、投票値決定部2が決定する投票値vの決定のための係数値やパラメータを保持する。この係数保持部3は、投票値決定部2に内包されてもよい。閾値保持部6は、判定部5が投票値と比較する閾値を保持する。この閾値保持部6は、判定部5に内包されてもよい。
ここで、この発明の実施の形態1に係る画像対応付け装置による画像の対応付けの概念を説明する。
図2は、動画像を構成するピクチャ間の参照階層構造の一例を示す図である。図において、平行四辺形はピクチャ、その内部の数字は符号化順序、また括弧内の数字は出力順序を表している。POC(Picture Order Count)nのピクチャは、n番目(nは0以上の整数)に出力されるピクチャとなる。図中の矢印は、例えば、POC0のピクチャは、POC1、2、4、8の4枚のピクチャから参照される参照ピクチャであることを示す。このような参照の階層構造の構成単位となる一連のピクチャの集合をGOP(Group Of Picture)と呼ぶ。ここでは、POC0はフレーム内符号化画像であるIピクチャ(Intra Picture)、POC1〜POC7は双方向予測符号化画像であるBピクチャ(Bidirectionally Picture)、POC8は順方向予測符号化画像であるPピクチャ(Predictive Picture)またはBピクチャを用いて符号化された動画像として説明する。POC1〜POC7(またはPOC1〜POC8)のBピクチャは、階層的な参照構造を持つ階層Bピクチャをなす。階層BピクチャではBピクチャでのピクチャ参照が入れ子的に行われる。このような階層的な参照構造によって符号化された動画像を利用すれば、POC0とPOC1、POC0とPOC2、POC0とPOC4、POC0とPOC8というように一つの参照ピクチャに対して複数のピクチャに対する動きベクトルを得ることができる。なお、時間的に前方向を指す動きベクトルをL0ベクトル、後方向を指す動きベクトルをL1ベクトルと呼ぶ。なお、ここではPOC0からPOC8のピクチャによる階層的な参照構造を持つ場合について説明するが、この枚数のピクチャによる階層的な参照構造に限るものではない。
ここで、ある2枚の画像間の動きベクトルによる対応付けの信頼性が高ければ、時間的にその2枚の画像の間に存在している画像が持つ動きベクトルも同じ点を一貫して指し続けると考えられる。この発明では、階層的な参照構造によって符号化された動画像から得られる複数の動きベクトルの一貫性を評価することで、動きベクトルによる画像間の対応付けの信頼性を推定し、高信頼な対応関係のみを利用して画像間の対応付けを行う。
図3、図4は、この発明の実施の形態1に係る動画像を構成するピクチャ間の動きベクトルを利用した信頼性の異なる画像の対応付けの一例を示す図である。ここでは、図2に示す階層Bピクチャにおいて、POC0とPOC8の間で動きベクトルを利用した画像の対応付けを実施する場合について説明する。
まず、図3に示すように、例えばPOC8上で任意の点を選択し、その点を含む符号化ブロックをブロックAとする。このブロックAは、POC0を参照ピクチャとして動きベクトルmvA_L0を持ち、mvA_L0が指すPOC0上のブロックをブロックCとする。次に、POC8を参照ピクチャとするPOC4において、ブロックAを指す動きベクトルを持つブロックを検索し、これをブロックBとする。このブロックBは、POC0を参照ピクチャとして動きベクトルmvB_L0を持ち、POC8を参照ピクチャとして動きベクトルmvB_L1を持つとする。
ここで、POC0とPOC8の間の対応関係(ブロックA−C間)の信頼性が高いと判断される場合、図3に示すように、mvB_L0はブロックCを指し、mvB_L1はブロックAを指すように一貫性がある参照構造が閉じた状態で示されることになる。一方、POC0とPOC8の間の対応関係の信頼性が低いと判断される場合、図4に示すように、例えばmvA_L0はブロックC1を指しているのに対して、mvB_L0はブロックC1と著しく異なるブロックC2を指すように一貫性がなく参照構造が閉じない状態で示されることになる。
この発明では、複数の動きベクトルが指す位置の一貫性を評価するため、各動きベクトルが指す位置に対して投票を実施する。そして、投票値によって動きベクトルの一貫性を定量化し、投票値に閾値を設けることで動きベクトルによる対応付けの結果が信頼できるかどうかを判定する。
次に、この発明の実施の形態1に係る画像対応付け装置の各部の詳細な動作について、説明する。図5は、この発明の実施の形態1に係る画像対応付け装置の動作の一例を示すフローチャートである。図2に示す階層Bピクチャにおいて、POC0とPOC8の間で対応付けを行う場合を例として説明する。
最初にステップST101に示す動きベクトル検索部1による動きベクトル検索の動作について説明する。動きベクトル検索部1では、複数の画像間で動きベクトルがどのような指示関係にあるのかを求める。ここで、複数の画像とは、例えば一つあるいは複数のGOP内の全ての画像である。まず、ベクトル追跡部1は、対応付けを行うピクチャ番号(例えばPOC0とPOC8)、対応付けを行う座標(例えばPOC8上の点)、複数の画像間の全ての動きベクトルの情報等を入力として受け取る。対応付けを行うピクチャ番号と座標は、ユーザが指定してもよいし、自動的に指定されたものでもよい。
ここで、対応付けを行うピクチャ番号を自動で指定する一例を説明する。例えば図2で説明したように1単位のGOPの構造が与えられ、複数のGOPが連続して構成される場合、POC0とPOC8、POC8とPOC16、POC16とPOC24、というように等間隔で指定するようにしてもよい。
また、対応付けを行う座標を自動で指定する方法との一例を説明する。図6は、この発明の実施の形態1に係る画像の対応付けを行う座標の指定例を示す図である。例えば、左上図はピクチャ内を一定間隔で走査する指定例であり、右上図は各符号化ブロックの座標を利用する指定例、左下図は事前に求めた特徴点の座標を利用する指定例などのように対応付けを行う座標を指定すればよい。
動きベクトル検索部1に入力される動きベクトルは、符号化された動画像を画像復号装置にて復号した結果として得られたものであってもよいし、動画像の符号化時に決定された情報の一部を画像符号化装置から別途出力することで得られたものでもよい。
図7から図10は、この発明の実施の形態1に係る動画像を構成する階層的なピクチャ間の動きベクトルを利用した画像の対応付けの過程の一例を示す図(順にその1からその4とする)である。
まず、図7において、指定されたPOC8上の点をPとし、そのPOC1上の対応点をP’とする。対応点P’は、点Pが属する符号化ブロックが持つL0ベクトルが指すPOC0上の点として求める。
次に、図8において、POC0とPOC8を参照ピクチャとするPOC4に着目する。そして、POC4に属する符号化ブロックが持つL1ベクトルの中から、点Pに最も近い位置を指しているL1ベクトルを検索する。検索の際には、例えば次式で計算した距離Dを最小化することが考えられる。
D=(Px−MVL1x)+(Py−MVL1y)
ここで、(Px、Py)は点Pの座標、(MVL1x、MVL1y)はPOC4に属する符号化ブロックが持つL1ベクトルが指すPOC8上の点の座標である。POC4に属する符号化ブロックの一部あるいは全てに対して距離Dを計算し、最も距離Dが小さくなる動きベクトルを選択する。
なお、図8に示すように距離Dを最小にする動きベクトルを持つ対応ブロックが2つ以上見つかる場合がある。この場合は、それぞれのブロックが持つL0ベクトルが指すPOC0上の座標を求め、これが点P’に近いものを選択する。つまり、次式で計算した距離D’が小さくなる方を選ぶ。
D’=(P’x−MVL0x)+(P’y−MVL0y)
ここで、(P’x、P’y)は点P’の座標、(MVL0x、MVL0y)はPOC4に属する対応ブロック候補が持つL0ベクトルが指すPOC0上の点の座標である。
続いて、図9において、POC4とPOC8を参照ピクチャとするPOC6に着目し、これまでと同様にしてPOC8を指すL1ベクトルとPOC4を指すL0ベクトルを検索する。以降、同様に検索を繰り返していき、最終的に図10に示すように全ての画像間での動きベクトルの指示関係を求める。なお、これまでに示した動きベクトルの追跡方法はあくまでも一例に過ぎず、着目するPOCの順番や動きベクトルの選択方法などは上記に限定されるものではなく様々な方法が考えられる。
これまで説明した例では、常に全ての符号化ブロックがL0とL1両方向の動きベクトルを持つ場合を仮定していたが、片方向の動きベクトルしか持たない場合もある。その場合、例えばL0ベクトルを利用してL1ベクトルを生成することや、その逆が考えられる。いま、着目しているピクチャのPOCをPOC_CURR、L0方向の参照ピクチャのPOCをPOC_L0、L1方向の参照ピクチャのPOCをPOC_L1とすると、L0方向の動きベクトルMVL0およびL1方向の動きベクトルMVL1は、逆方向の動きベクトルからそれぞれ次式で計算して生成することができる。
MVL0=(POC_CURR−POC_L0)
/(POC_CURR−POC_L1)×MVL1
MVL1=(POC_CURR−POC_L1)
/(POC_CURR−POC_L0)×MVL0
また、このようにして逆方向の動きベクトルから生成する他にも、例えば対応ブロックの周囲のブロックが持つ動きベクトルを利用する方法も考えられる。図11は、この発明の実施の形態1に係る画像の対応ブロックと周囲のブロックの関係の一例を示す図である。図において、A0、A1、B0、B1、B2と示されているそれぞれの座標を含むブロックを周囲ブロックとし、それらのブロックが持つ動きベクトルを対応ブロックの動きベクトルとして利用する。周囲ブロックの動きベクトルが複数利用可能である場合は、それらの重み付き平均や中間値として対応ブロックの動きベクトルを求めてもよいし、例えばA0、A1、B0、B1、B2といった優先順位に従って利用するようにしてもよい。
次に、図5のステップST102に示す投票値決定部2による投票値決定の動作について説明する。まず投票値決定部2は、動きベクトル検索部1から動きベクトル検索結果を受け取る。この動きベクトル検索結果は、図10に示すような複数の画像間の動きベクトルの指示関係およびその動きベクトルをどのようにして生成したか、例えば対応ブロックが持つ動きベクトルをそのまま利用したのか、あるいは逆方向の動きベクトルや周囲ブロックの動きベクトルから生成したのかなどを表す情報である。また、投票値決定部2は、符号化情報と画像を入力として受け取る。ここで、符号化情報とは、例えば符号化ブロックのサイズやビットレート等、動画像符号化の過程で得られるパラメータの一部または全てであり、符号化された動画像を画像復号装置にて復号した結果として得られたものであってもよいし、動画像の符号化時に決定された情報の一部を画像符号化装置から別途出力することで得られたものでもよい。また、画像とは、例えば図2に示すPOC0から8の原画像あるいは復号画像である。
投票値決定部2は、動きベクトル検索部1で検索された動きベクトルのそれぞれが持つ投票値vを決定する。投票値vは、例えば初期値を1として、次のような各指標に基づいて決定される。
(ブロックサイズに基づく補正)
ブロックサイズは、符号化時に最も符号化効率が高くなるように自動的に決定される。その大きさは、例えば64画素×64画素や8画素×8画素など様々であるが、動きベクトルの精度はブロックサイズに大きく影響される。一般に、ブロックサイズが大きい方が安定したベクトルを求められる傾向にある。ブロックサイズが小さいと、ノイズの影響を受けやすく、また、符号化時に被写体の物理的な運動を表すベクトルとは異なるベクトル(例えば図20のmvB)を選択しやすいためである。したがって、画像の対応付けという観点からは、サイズが大きい符号化ブロックが持つ動きベクトルの方が適している。そこで、対応する符号化ブロックのサイズが大きな動きベクトルほど、投票値も大きくなるようにする。ブロックサイズに基づく投票値vの決定は、例えば次式に基づいて行われる。
v=log(BS)×v
ここで、BSはブロックサイズである。
(動きベクトルの生成方法に基づく補正)
動きベクトル検索部1にて、対応ブロックの動きベクトルを生成する際に、そのブロックが持つ動きベクトルをそのまま利用した場合と、逆方向の動きベクトルや周囲ブロックの動きベクトルから生成した場合とでは動きベクトルの信頼性が異なる。当然ながら、後者の方が動きベクトルの信頼性は低く、正しい動きベクトルになっていない可能性が高い。そこで、動きベクトル検索部1における動きベクトルの生成方法に応じて、投票値vを次のように変更する。
v=α×v
ここで、αはあらかじめ設定された定数であり、対応ブロックが持つ動きベクトルをそのまま利用した場合は例えば1.2や1.5などの1以上の値、逆方向の動きベクトルや周囲ブロックの動きベクトルから生成した場合は例えば0.8や0.6などの1未満の値をとる。定数αは、例えば図1の係数保持部3から読み出してもよいし、投票値決定部2があらかじめ保持していてもよい。このようにすることで、動きベクトルをそのまま利用した場合は投票値が高く、逆方向の動きベクトルや周囲ブロックの動きベクトルから生成した場合は投票値が低くなるようにすることが可能である。
(符号量に基づく補正)
符号量とは、符号化時にそのブロックで発生した符号の総量を表す。符号化時に予測の精度が高ければ符号量は小さくなり、予測の精度が低ければ符号量は大きくなる。つまり、符号量の小さなブロックでは精度の高い動き予測が行われており動きベクトルの信頼性が高く、逆に符号量の大きなブロックでは精度の低い動き予測が行われており動きベクトルの信頼性が低いと予想できる。したがって、符号量の小さなブロックが持つ動きベクトルの投票値は大きく、符号量の大きなブロックが持つ動きベクトルの投票値は小さくすることが妥当である。そこで、対応ブロックの符号量に応じて、投票値vを次のように変更する。
v=1/C×v
ただし、Cは符号量である。
(ビットレートに基づく補正)
ビットレートは、動きベクトルの長さ(予測ベクトルとの差分)に影響を与える。ビットレートが高い場合、動きベクトルを決定する際に、ブロック間のSADを最小化することが重視され、動きベクトルの長さは大きな制約を受けない。一方、ビットレートが低い場合、ブロック間のSADが多少大きくても予測ベクトルとの差分が小さな動きベクトルが選択されやすくなる傾向がある。つまり、ビットレートが低い場合は、被写体の物理的な運動を表すベクトルとは異なる動きベクトルが選択されやすくなり、画像の対応付けという観点からは不適切な動きベクトルが得られる傾向にある。したがって、次式を利用することで、ビットレートが高い場合は投票値が大きく、ビットレートが低い場合は投票値が小さくなるようにする。
v=BR×v
ただし、BRはビットレートである。
(参照ピクチャとの時間間隔に基づく補正)
着目しているピクチャとその参照ピクチャとの時間間隔は動きベクトルの精度に影響を与える。例えば図2に示したように参照構造が階層的となる場合、ピクチャによって参照ピクチャとの時間間隔が異なる。一般に、時間間隔が短いほど動きベクトルの精度は高く、時間間隔が長いほど動きベクトルの精度は低くなる。そこで、着目しているピクチャと参照ピクチャとの時間間隔に応じて、次のように投票値vを変更する。
v=1/t×v
ここで、tは着目しているピクチャと参照ピクチャとの時間間隔(絶対値)である。
(ブロックのテクスチャに基づく補正)
符号化ブロックのテクスチャは、動きベクトルの精度に影響を与える。一般に、テクスチャに乏しいブロックでは正確な動き探索は難しく、動きベクトルの信頼性が低い。逆に豊富なテクスチャを持つブロックの動きベクトルは信頼性が高い。そこで、それぞれの動きベクトルのブロックが持つテクスチャを定量化し、複雑なテクスチャを持つブロックの動きベクトルは投票値を大きくし、テクスチャに乏しいブロックの動きベクトルは投票値を小さくする。テクスチャの複雑度は、例えば画素値の分散で定量化することができ、分散が大きいほど複雑なテクスチャとなる。分散を用いた投票値の変更は、例えば次式を利用して行う。
v=1/σ×v
σ=Σ(f−m)/N
ここで、σは画素値の分散、fは画素値、mは画素値の平均値、Nはブロックの画素数である。
なお、動きベクトルの投票値を決定するための各種補正のパラメータや投票値の計算方法はあくまでも一例であり、1つのみ採用してもよく、またこれらを様々に組み合わせることや、他の指標や計算方法に基づいて投票値を求めることも考えられる。また、複数の指標による複数の補正を組み合わせるとき、投票値に組み合わせる各補正を繰り返し適用してもよいし、また組み合わせる各補正を個別に適用した仮投票値に対して重み付けて平均する補正を適用して最終的な投票値としてもよい。
また、投票値決定部2は、必要に応じて投票値の計算に利用する係数などを係数保持部3から読み出してもよい。例えば、先に説明した動きベクトルの生成方法に応じた係数αや複数の指標による補正の組み合わせに対する重み付けの重み値などを係数保持部3から読み出してもよい。
続いて、図5のステップST103に示す投票部4による投票の動作について説明する。投票部4は、投票値決定部2で決定した各動きベクトルの投票値を受け取り、それぞれの動きベクトルが指す位置へ投票を行う。投票は、例えばピクチャと同サイズの2次元配列をピクチャごとに投票平面として定義し、図2に示す参照階層構造の上段に記載のピクチャが持つ動きベクトルから下段に記載のピクチャが持つ動きベクトルへ順に実施していく。
図12から図15は、この発明の実施の形態1に係る階層的なピクチャが持つ動きベクトルの投票の過程の一例を示す図(順にその1からその4とする)である。
図12は、最初に投票を行う最上段の第1階層の動きベクトルを示している。POC1のL0ベクトルによって、POC0に対応する投票平面へ投票を行う場合を例にとって説明する。いま、投票値決定部2で決定したPOC1のL0ベクトルの投票値をv1、POC0に対応する投票平面をvp0とする。このとき、vp0の座標(x、y)における値をvp0(x、y)と表すとすると、投票によってvp0の値は次のように更新される。
vp0(mv1x、mv1y)=vp0(mv1x、mv1y)+v1
ここで、(mv1x、mv1y)は、POC1のL0ベクトルが指すPOC0上の座標である。なお、vp0の値はすべて初期値0を持つものとする。
続いて、図13は、次に投票を行う第2階層の動きベクトルを示している。次の階層に属するピクチャが持つ動きベクトルによって投票を行う。POC2のL0ベクトルによって、POC0に対応する投票平面へ投票を行う場合を例にとって説明する。いま、投票値決定部2で決定したPOC2のL0ベクトルの投票値をv2、POC2に対応する投票平面をvp2とする。このとき、投票によってvp0の値は次のように更新される。
vp0(mv2x、mv2y)=vp0(mv2x、mv2y)
+vp2(mv2x’、mv2y’)+v2
ここで、(mv2x、mv2y)は、POC2のL0ベクトルが指すPOC0上の座標であり、(mv2x’、mv2y’)は、POC2で選択された対応ブロックの座標(POC2のL0ベクトルの起点となる座標)である。ここで、vp0(mv2x、mv2y)にvp2(mv2x’、mv2y’)の値を加算することで、階層参照構造の上位層から下位層に向かって投票値を伝播させていくことができる。
以降も同様にして、第3階層の動きベクトルを示す図14でも投票を行い、最終的に投票を行う第4階層の動きベクトルを示す図15まで投票を繰り返すことで、基準ピクチャ(基準画像)とするPOC0に対応する投票平面vp0に全ての投票面の投票値を集約して集約投票値とする。なお、あらかじめ投票値に対して閾値を設定しておき、ある階層での投票値がその閾値を上回った場合に投票を中止してその値をvp0の値とすることも考えられる。また、ある階層における投票値があらかじめ設定した閾値を下回る場合に投票を中止するようにしてもよい。このようにすることで、必ず全ての投票平面に対して投票を実施する場合に比べて演算量を削減することができる。
図16、図17は、この発明の実施の形態1に係る動きベクトルが指し示す座標と投票の一例を示す説明図である(順にその1、その2とする)。投票において、例えば図16に示すように、単純に動きベクトルが指し示す座標のみに投票値を加算する方法がある。また、図17に示すように、周囲の座標へも投票値を分散させる方法などもある。投票値を分散させる際には、例えばガウス関数などを用いれば分散させる範囲を調整することができる。
また、図5のステップST104に示す判定部5による判定の動作について説明する。判定部5は、投票部4で決定したPOC0上の対応点P’の投票値vp0(P’x、P’y)を受け取る。ここで、(P’x、P’y)は対応点P’の座標である。判定部5は、投票値vp0(P’x、P’y)と閾値との比較を行う。閾値は、例えば図1の閾値保持部6から読み出してもよいし、判定部5があらかじめ保持していてもよい。比較の結果、投票値vp0(P’x、P’y)が閾値を上回れば、POC8上の点PとPOC0上の点P’との対応関係は信頼できると判定として、例えば1を判定結果として出力する。一方、閾値を下回れば、対応関係は信頼できないと判定として、例えば0を出力する。また、併せて、対応点P’の座標も出力する。なお、この信頼の可否を示す判定結果の値の割当ては一例であって、逆の値であってもよいし、他の割当てであってもよい。また、閾値を複数設定することで、例えば高中低の信頼性の程度を示す複数の値として判定してもよい。なお、この信頼性の程度は高中低の3分類に限らない。また、例えば信頼性の程度を0以上1以下の小数値や、0以上100以下の整数値のような数値範囲内の数値として表現してもよい。
なお、図1では、この発明の画像対応付け装置の判定部5が信頼性の判定結果と基準画像上の対応点の座標を出力するものとして示しているが、基準画像上の対応点の座標の出力を投票部4から出力させてもよい。判定部5が信頼性の判定結果と基準画像上の対応点の座標の両方を出力する場合には、対応関係が信頼できないことを示す判定結果であるとき、判定部5が基準画像上の対応点の座標を判定結果とともに出力しないようにしてもよい。一方、投票部4が基準画像上の対応点の座標を出力し、判定部5が信頼性の判定結果を出力する場合には、信頼性の判定結果と基準画像上の対応点の座標を利用する側が判定結果から対応関係の信頼性を判断し、信頼できないことを示す判定結果であったときには基準画像上の対応点の座標を採用しないようにしてもよい。
また、これまで説明した画像間の対応付けは、2枚の画像間での対応付けであるが、これを繰り返すことで動画像における対応点の追跡を行うことが可能である。図18は、この発明の実施の形態1に係る対応点の追跡の一例を示す概念図である。この例では、3つのGOPに対し、まず第1のGOPであるPOC0とPOC8の間で対応付けを実施し、得られた対応点を対応付けの起点として第2のGOPであるPOC8とPOC16の対応付けを実施している。さらにここで得られた対応点を利用して第3のGOPであるPOC16とPOC24の対応付けを行うように繰り返していくことで、POC0から任意の画像まで対応点を追跡していくことができる。
以上のように、この発明は、複数の画像が階層的な参照構造で符号化された動画像を符号化する際に得られる動きベクトルを利用して画像の対応付けを行う画像対応付け装置であって、複数の画像間における動きベクトルの指示関係を検索する動きベクトル検索部と、複数の画像とそれらの符号化情報と動きベクトル検索部が検索した動きベクトルの指示関係に基づいて、動きベクトルの投票値を決定する投票値決定部と、投票値決定部が決定した動きベクトルの投票値を当該動きベクトルが指す基準画像上の位置に投票し、投票値を集約した各位置の集約投票値に基づいて基準画像上の対応点を決定する投票部とを備えた画像対応付け装置であることを説明した。
また、この発明は、さらに投票部が決定した基準画像上の対応点の集約投票値から対応関係の信頼性を判定し、その判定結果を出力する判定部を備えた画像対応付け装置であることを説明した。
なお、この発明に係る画像対応付け装置がコンピュータで構成される場合、各構成要素の手順や方法をコンピュータに機能させるプログラムをメモリ(内部メモリまたは外部メモリ)に格納し、当該コンピュータのCPUが当該メモリに格納されているプログラムを読み出して実行するようにしてもよい。また、各構成要素は、ハードウェア、ソフトウェア、ファームウェアのいずれの形態で実現されてもよく、またこれらの組み合わせで実現してもよい。また、プログラムやデータ情報は、ディスクやメモリなどの記録媒体に記憶されてもよい。
また、この発明に係る画像対応付け装置は、画像符号化装置や画像復号装置の一部として内蔵される構成で実施されても構わない。
このように、この発明に係る画像対応付け装置および方法によれば、複数の画像間における動きベクトルの指示関係を検索する動きベクトル検索部と、複数の画像とそれらの符号化情報と動きベクトル検索部が検索した動きベクトルの指示関係に基づいて、動きベクトルの投票値を決定する投票値決定部と、投票値決定部が決定した動きベクトルの投票値を当該動きベクトルが指す基準画像上の位置に投票し、投票値を集約した各位置の集約投票値に基づいて基準画像上の対応点を決定する投票部とを備え、階層的な参照構造によって符号化された動画像の複数の動きベクトルの一貫性を投票によって定量化することで対応付けるようにしたので、単に一つの動きベクトルを用いて対応付けを行う場合に比べて対応付けの信頼性を向上させることができる。
また、この発明に係る画像対応付け装置および方法によれば、さらに投票部が決定した基準画像上の対応点の集約投票値から対応関係の信頼性を判定し、その判定結果を出力する判定部を備え、階層的な参照構造によって符号化された動画像の複数の動きベクトルの一貫性を投票によって定量化した後、対応付けの信頼性を判定するようにしたので、信頼性の程度を評価して信頼性が低い対応付けを排除することができる。
また、この発明に係る画像対応付け装置および方法によれば、動画像の符号化の過程で得られる動きベクトルを利用して画像間の対応付けを小さな演算量で実現することができるため、映像のブレ補正、パノラマ写真生成、超解像、デプス推定、3次元形状復元といった画像の対応付けを必要とする多くのアプリケーションを従来よりも低減された演算負荷で実現できるようになり、アプリケーションの適用範囲の拡大が期待できる。
1 動きベクトル検索部、2 投票値決定部、3 係数保持部、4 投票部、5 判定部、6 閾値保持部。

Claims (7)

  1. 複数の画像が階層的な参照構造で符号化された動画像を符号化する際に得られる動きベクトルを利用して画像の対応付けを行う画像対応付け装置であって、
    前記複数の画像間における動きベクトルの指示関係を検索する動きベクトル検索部と、
    前記複数の画像とそれらの符号化情報と前記動きベクトル検索部が検索した前記動きベクトルの指示関係に基づいて、前記動きベクトルの投票値を決定する投票値決定部と、
    前記投票値決定部が決定した前記動きベクトルの投票値を当該動きベクトルが指す基準画像上の位置に投票し、投票値を集約した各位置の集約投票値に基づいて基準画像上の対応点を決定する投票部と
    を備えた画像対応付け装置。
  2. 前記投票値決定部は、前記動きベクトルごとの投票値に対して指標に基づく補正を適用して当該動きベクトルの投票値を決定する請求項1に記載の画像対応付け装置。
  3. 前記投票値決定部は、前記動きベクトルごとの投票値に対して複数の指標のそれぞれに基づいて補正し、それらを重み付けて平均する補正を適用して当該動きベクトルの投票値を決定する請求項1に記載の画像対応付け装置。
  4. 前記投票部が決定した前記基準画像上の対応点の集約投票値から対応関係の信頼性を判定し、その判定結果を出力する判定部
    を備えた請求項1ないし請求項3のいずれか1項に記載の画像対応付け装置。
  5. 前記判定部は、前記投票部が決定した前記基準画像上の対応点の集約投票値を閾値と比較して対応関係の信頼性を判定する請求項4記載の画像対応付け装置。
  6. 複数の画像が階層的な参照構造で符号化された動画像を符号化する際に得られる動きベクトルを利用して画像の対応付けを行う画像対応付け方法であって、
    前記複数の画像間における動きベクトルの指示関係を検索する動きベクトル検索ステップと、
    前記複数の画像とそれらの符号化情報と前記動きベクトル検索ステップで検索された前記動きベクトルの指示関係に基づいて、前記動きベクトルの投票値を決定する投票値決定ステップと、
    前記投票値決定ステップで決定された前記動きベクトルの投票値を当該動きベクトルが指す基準画像上の位置に投票し、投票値を集約した各位置の集約投票値に基づいて基準画像上の対応点を決定する投票ステップと
    を有する画像対応付け方法。
  7. 前記投票ステップで決定された前記基準画像上の対応点の集約投票値から対応関係の信頼性を判定し、その判定結果を出力する判定ステップ
    を有する請求項6に記載の画像対応付け方法。
JP2013083926A 2013-04-12 2013-04-12 画像対応付け装置および画像対応付け方法 Expired - Fee Related JP6028665B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013083926A JP6028665B2 (ja) 2013-04-12 2013-04-12 画像対応付け装置および画像対応付け方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013083926A JP6028665B2 (ja) 2013-04-12 2013-04-12 画像対応付け装置および画像対応付け方法

Publications (2)

Publication Number Publication Date
JP2014207554A JP2014207554A (ja) 2014-10-30
JP6028665B2 true JP6028665B2 (ja) 2016-11-16

Family

ID=52120797

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013083926A Expired - Fee Related JP6028665B2 (ja) 2013-04-12 2013-04-12 画像対応付け装置および画像対応付け方法

Country Status (1)

Country Link
JP (1) JP6028665B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6436846B2 (ja) * 2015-04-15 2018-12-12 三菱電機株式会社 移動物体検出装置、映像復号装置および移動物体検出方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4201958B2 (ja) * 2000-04-26 2008-12-24 日本放送協会 動画像のオブジェクト抽出装置
JP3712344B2 (ja) * 2000-05-12 2005-11-02 日本電信電話株式会社 繰り返しビデオ信号符号化方法およびこの方法のプログラムを記録した記録媒体
WO2005050565A1 (ja) * 2003-11-20 2005-06-02 Matsushita Electric Industrial Co., Ltd. 移動物体検出装置及び移動物体検出方法
JP4665737B2 (ja) * 2005-11-30 2011-04-06 カシオ計算機株式会社 画像処理装置及びプログラム
JP2010114474A (ja) * 2007-02-19 2010-05-20 Tokyo Institute Of Technology 動画像の動き情報を利用した画像処理装置及び画像処理方法
JP4893471B2 (ja) * 2007-05-24 2012-03-07 カシオ計算機株式会社 画像処理装置及びプログラム
JP2011002919A (ja) * 2009-06-17 2011-01-06 Seiko Epson Corp 物体検出方法、物体検出装置
JP5290227B2 (ja) * 2010-03-30 2013-09-18 セコム株式会社 対象物検知装置及びその学習装置

Also Published As

Publication number Publication date
JP2014207554A (ja) 2014-10-30

Similar Documents

Publication Publication Date Title
US11178419B2 (en) Picture prediction method and related apparatus
US11350124B2 (en) Image processing method and image processing device
US11546627B2 (en) Moving picture decoding method and moving picture encoding method
JP2017536002A (ja) 画像予測方法および関連装置
KR102059066B1 (ko) 모션 벡터 필드 코딩 방법 및 디코딩 방법, 및 코딩 및 디코딩 장치들
JP5367097B2 (ja) 動きベクトル予測符号化方法、動きベクトル予測復号方法、動画像符号化装置、動画像復号装置およびそれらのプログラム
CN102036067A (zh) 运动图像编码设备及其控制方法
CN114900691B (zh) 编码方法、编码器及计算机可读存储介质
JP5926451B2 (ja) 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、画像符号化プログラム、および画像復号プログラム
WO2014166412A1 (zh) 一种视频编码方法、解码方法和装置
JP6028665B2 (ja) 画像対応付け装置および画像対応付け方法
JP6390275B2 (ja) 符号化回路、符号化方法
WO2012028480A1 (en) Global motion vector estimation
US10075691B2 (en) Multiview video coding method using non-referenced view video group
US10063880B2 (en) Motion detecting apparatus, motion detecting method and program
JP6436846B2 (ja) 移動物体検出装置、映像復号装置および移動物体検出方法
CN118233647A (zh) 视频编码方法、装置、电子设备和存储介质
JP2005318106A (ja) 動画像符号化装置及びプログラム
JP2012124946A (ja) 予測ベクトル生成方法、画像符号化方法、画像復号方法、予測ベクトル生成装置、画像符号化装置、画像復号装置、予測ベクトル生成プログラム、画像符号化プログラムおよび画像復号プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151119

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160909

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160920

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161003

R151 Written notification of patent or utility model registration

Ref document number: 6028665

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees