JP2018182435A

JP2018182435A - 動きベクトル予測装置及びコンピュータプログラム

Info

Publication number: JP2018182435A
Application number: JP2017076238A
Authority: JP
Inventors: 健人宮澤; Takehito Miyazawa; 和也早瀬; Kazuya Hayase; 暁経三反崎; Akinori Misorizaki; 清水　淳; Atsushi Shimizu; 淳清水
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2017-04-06
Filing date: 2017-04-06
Publication date: 2018-11-15

Abstract

【課題】カメラが移動しながら撮影した映像から深度情報を用いずに、動きベクトルの向きと大きさをより精度良く予測すること。【解決手段】符号化済みブロックから予測動きベクトルノルムを取得する予測動きベクトルノルム取得部と、与えられた角度に関連する情報に基づいて、予測動きベクトルの角度を取得する予測動きベクトル角度取得部と、予測動きベクトルノルムと予測動きベクトルの角度とに基づいて、符号化対象ブロックの予測動きベクトルを取得するベクトル取得部と、を備える動きベクトル予測装置。【選択図】図３

Description

本発明は、動きベクトル予測装置及びコンピュータプログラムに関する。

従来の動画像符号化技術では、画面間での被写体の動きをとらえて予測画像を作成し、予測画像と実際の画像との差分（予測差分）を符号化することで大幅にデータ量を削減している。このとき、予測差分とともに、画面間での被写体の動きを表す動きベクトルを符号化する必要がある。このように従来では、符号量削減のために、動きベクトル自体を予測し、差分の符号化が行われている。
従来の動きベクトル予測技術としては、動画像符号化標準規格Ｈ.２６５／ＨＥＶＣにおいて用いられている空間方向予測と時間方向予測がある（例えば、非特許文献１参照）。空間方向予測においては、符号化する対象のブロック（以下「符号化対象ブロック」という。）に隣接した符号化済みブロックから動きベクトルを取得し、取得した動きベクトルを予測動きベクトルとして定める。時間方向予測においては、符号化対象ブロックと略同位置にある時間的に異なる別の画像内のブロックから動きベクトルを取得し、取得した動きベクトルを予測動きベクトルとして定める。
また、上記の動きベクトル予測技術の他に、グローバル動き補償という技術を用いて動きベクトル予測を行う手法が提案されている（例えば、非特許文献２参照）。グローバル動き補償とは、パン・チルト・ズームといったカメラの動作に応じて生じる画面内全体の一様な動きを、カメラ動作ごとに決まったパラメータによって予測する手法である。

"ＩＴＵ−ＴＨ.２６５"、2015年4月、p.141〜145 上倉一人、渡辺裕、"動画像符号化におけるグローバル動き補償法"、電子情報通信学会論文誌 B−I Vol.J76- B−I No.12 pp.944-952 1993年12月.

上記に示した既存の動きベクトル予測技術を、移動するカメラで撮影された映像に対して適用すると予測誤差が多く発生してしまう。
図１１は、カメラが前方方向に移動している場合の動きベクトルの様子を表す図である。なお、図１１では、予測に用いられる画像が時系列順で過去のものであるとしており、画面内の被写体は見かけ上画面奥から画面の周辺へと移動し、動きベクトルが画面奥のある点１に向けて伸びている。この点１を以下の説明では、ＦＯＥ（focus of expansion：拡張焦点、又は、消失点という。）と記載する。動きベクトルは、ＦＯＥの方向を向いているが、その大きさは画面内で一様ではなく、カメラと被写体との距離（深度）に応じて変化する。カメラからの距離が近い被写体は見かけ上の動きが大きい。すなわち、動きベクトルが大きい。これに対し、背景などカメラからの距離が遠い被写体は見かけ上の動きが小さい。すわなち、動きベクトルが相対的に小さい。

カメラが移動している状況下で得られる映像に対して空間方向予測を適用した場合、隣接ブロックと符号化対象ブロックとでは、ブロックサイズの分だけＦＯＥまでの方向に違いが生じてしまう。そのため、この違いの分だけ予測ベクトルの向きに予測誤差が生じてしまう。
また、カメラが移動している状況下で得られる映像に対して時間方向予測を適用した場合、符号化対象ブロック内の被写体が、時間方向予測で選択される別の時間の画像内同一位置のブロック内の被写体と異なるような場合、カメラまでの距離が異なるため、動きベクトルの大きさが異なる。そのため、この違いの分だけ動きベクトルの大きさに予測誤差が生じてしまう。

また、カメラが移動している状況下で得られる映像に対してグローバル動き補償を用いた動きベクトル予測を適用した場合、動きベクトルが被写体とカメラとの距離に応じて変化するため、画面内で同じ位置にあったとしてもベクトルの大きさが大きく異なる。しかし、グローバル動き補償は画面内の位置のみによって動きベクトルを推定するため、図１２に示すように被写体とカメラとの距離による変化を推定できず予測ベクトルの大きさに予測誤差が生じてしまう。
被写体の深度情報がわかれば動きベクトルの大きさを予測可能ではあるが、深度センサといった専用機器を使用しなかった場合、非常に大きな計算コストをかけなければ深度を算出することができない。このように従来の技術では、カメラが移動しながら撮影した映像から深度情報を用いずに、動きベクトルの向きと大きさをより精度良く予測することができないという問題があった。

上記事情に鑑み、本発明は、カメラが移動しながら撮影した映像から深度情報を用いずに、動きベクトルの向きと大きさをより精度良く予測することができる技術の提供を目的としている。

本発明の一態様は、処理済みブロックから予測動きベクトルノルムを取得する予測動きベクトルノルム取得部と、与えられた角度に関連する情報に基づいて、予測動きベクトルの角度を取得する予測動きベクトル角度取得部と、前記予測動きベクトルノルムと前記予測動きベクトルの角度とに基づいて、処理対象ブロックの予測動きベクトルを取得するベクトル取得部と、を備える動きベクトル予測装置である。

本発明の一態様は、上記の動きベクトル予測装置であって、前記予測動きベクトルノルム取得部は、処理対象ブロックと略同じ奥行の処理済みブロックを用いて前記予測動きベクトルノルムを取得する。

本発明の一態様は、上記の動きベクトル予測装置であって、前記予測動きベクトルノルム取得部は、処理対象ブロックの隣接ブロックである処理済みブロックから前記予測動きベクトルノルムを取得する。

本発明の一態様は、上記の動きベクトル予測装置であって、前記与えられた角度に関連する情報は、少なくともＦＯＥ（focus of expansion）座標に基づく情報である。

本発明の一態様は、処理済みブロックから予測動きベクトルノルムを取得する予測動きベクトルノルム取得部と、少なくともＦＯＥ（focus of expansion）座標に基づく情報に基づいて、予測動きベクトルの角度を取得する予測動きベクトル角度取得部と、前記予測動きベクトルノルムと前記予測動きベクトルの角度とに基づいて、処理対象ブロックの予測動きベクトルを取得するベクトル取得部と、を備え、前記予測動きベクトルノルム取得部は、処理対象ブロックの隣接ブロックである処理済みブロックを用いて前記予測動きベクトルノルムを取得する動きベクトル予測装置である。

本発明の一態様は、コンピュータに、処理済みブロックから予測動きベクトルノルムを取得する予測動きベクトルノルム取得ステップと、与えられた角度に関連する情報に基づいて、予測動きベクトルの角度を取得する予測動きベクトル角度取得ステップと、前記予測動きベクトルノルムと前記予測動きベクトルの角度とに基づいて、処理対象ブロックの予測動きベクトルを取得するベクトル取得ステップと、を実行させるためのコンピュータプログラムである。

本発明の一態様は、コンピュータに、処理済みブロックから予測動きベクトルノルムを取得する予測動きベクトルノルム取得ステップと、少なくともＦＯＥ（focus of expansion）座標に基づく情報に基づいて、予測動きベクトルの角度を取得する予測動きベクトル角度取得ステップと、前記予測動きベクトルノルムと前記予測動きベクトルの角度とに基づいて、処理対象ブロックの予測動きベクトルを取得するベクトル取得ステップと、を実行させ、前記予測動きベクトルノルム取得ステップにおいて、処理対象ブロックの隣接ブロックである処理済みブロックを用いて前記予測動きベクトルノルムを取得するためのコンピュータプログラムである。

本発明により、カメラが移動しながら撮影した映像から深度情報を用いずに、動きベクトルの向きと大きさをより精度良く予測することが可能となる。

本発明の第１実施形態における映像符号化装置１の構成を示すブロック図である。インター予測部１９の構成例を示す図である。動きベクトル予測部２１２の構成例を示す図である。ＦＯＥ方向動きベクトル予測部２１２３の構成例を示す図である。ＦＯＥ方向角度導出部２１２３１の処理を説明するための図である。ノルム導出部２１２３２の処理を説明するための図である。ＦＯＥ方向動きベクトル予測部２１２３の処理の流れを示すフローチャートである。第２の実施形態におけるインター予測部１９ａの構成例を示す図である。ＦＯＥ決定部２１４の構成例を示す図である。第１の実施形態及び第２の実施形態における映像符号化装置１が出力する符号化データを受信して映像信号を復号する映像復号装置３の構成を示すブロック図である。映像復号装置３のインター予測処理部３９の内部構成を示すブロック図である。映像復号装置３のインター予測処理部３９の内部構成を示すブロック図である。カメラが前方方向に移動している場合の動きベクトルの様子を表す図である。従来技術の課題を説明するための図である。

以下、本発明の一実施形態を、図面を参照しながら説明する。
まず始めに本発明における前提条件について説明する。
（前提条件）
・車載カメラ映像などのようにカメラ自体が移動しながら撮影した映像を用いる。カメラ自体が移動しながら撮影した映像としては、車載カメラによって撮影された映像、ドローンによって撮影された映像、ウェアラブルカメラによって撮影された映像、通常のカメラをユーザが持ち歩いて移動しながら撮影された映像が挙げられる。
・カメラの速度・角速度及び深度情報は使用できないものとする。

（第１の実施形態）
図１は、本発明の第１実施形態における映像符号化装置１の構成を示すブロック図である。映像符号化装置１は、例えば、ＨＥＶＣ（High Efficiency Video Coding）と呼ばれるＨ．２６５や、Ｈ．２６４等の符号化方式においてエンコーダとして適用される装置である。
映像符号化装置１は、バスで接続されたＣＰＵ（Central Processing Unit）やメモリや補助記憶装置などを備え、プログラムを実行する。映像符号化装置１は、プログラムの実行によって減算器１１、直交変換・量子化部１２、可変長符号化部１３、逆量子化・逆直交変換部１４、加算器１５、イントラ予測部１６、ループフィルタ部１７、復号ピクチャ記憶部１８、インター予測部１９、イントラ／インター切り替えスイッチ２０、インター予測情報記憶部２３を備える装置として機能する。なお、映像符号化装置１の各機能の全て又は一部は、ＡＳＩＣ（Application Specific Integrated Circuit）やＰＬＤ（Programmable Logic Device）やＦＰＧＡ（Field Programmable Gate Array）等のハードウェアを用いて実現されてもよい。プログラムは、コンピュータ読み取り可能な記録媒体に記録されてもよい。コンピュータ読み取り可能な記録媒体とは、例えばフレキシブルディスク、光磁気ディスク、ＲＯＭ、ＣＤ−ＲＯＭ等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置である。プログラムは、電気通信回線を介して送信されてもよい。

減算器１１には、映像符号化装置１に入力された入力画像と、イントラ／インター切り替えスイッチ２０を介してイントラ予測部１６、またはインター予測部１９が出力する予測画像情報との差を算出する。また、減算器１１は、算出した差に基づく差分画像情報を直交変換・量子化部１２に出力する。

直交変換・量子化部１２は、減算器１１が出力する差分画像情報に対して、直交変換と量子化を行い、可変長符号化部１３と逆量子化・逆直交変換部１４に出力する。可変長符号化部１３は、直交変換・量子化部１２が出力する量子化係数を可変長符号化して符号化データを生成し、生成した符号化データを外部に出力する。また、可変長符号化部１３は、インター予測情報記憶部２３に記憶されているインター予測に関する情報を読み出し、可変長符号化して符号化データを生成し、生成した符号化データを外部に出力する。インター予測に関する情報とは、例えば、符号化済み動きベクトルである。

逆量子化・逆直交変換部１４は、直交変換・量子化部１２が出力する量子化係数に対して、逆量子化と逆直交変換を行って差分画像情報を復号して加算器１５に出力する。加算器１５は、逆量子化・逆直交変換部１４が出力する復号差分画像情報と、イントラ／インター切り替えスイッチ２０を介してイントラ予測部１６、またはインター予測部１９が出力する予測画像情報との和を算出する。また、加算器１５は、算出した和に基づく復号画像情報をイントラ予測部１６とループフィルタ部１７に出力する。

イントラ予測部１６は、加算器１５が出力する復号画像情報を参照フレームとして、符号化対象フレームに含まれる符号化対象ブロックのイントラ予測画像情報を生成する。
ループフィルタ部１７は、加算器１５が出力する復号画像情報にループフィルタを適用し、ループフィルタを適用した復号画像情報を復号ピクチャ記憶部１８に書き込んで記憶させる。

復号ピクチャ記憶部１８は、ループフィルタ部１７の出力を格納する。復号ピクチャ記憶部１８に格納された復号画像情報は、インター予測部１９に出力される。復号画像情報は、符号化対象ブロックのインター予測及び動きベクトルの検出時に参照画像として利用される。

インター予測部１９は、入力画像と復号ピクチャ記憶部１８から出力される参照画像（復号画像）とを用いて動きベクトルを検出する。そして、インター予測部１９は、動きベクトルと、参照画像である復号画像とに基づいてインター予測画像情報を生成する。また、インター予測部１９は、動きベクトルの予測を行い、動きベクトルと、予測動きベクトルとの差分を符号化し、符号化した差分と、予測動きベクトルのインデックスとを符号化済み動きベクトルとしてインター予測情報記憶部２３に記憶する。

イントラ／インター切り替えスイッチ２０は、符号化対象ブロックの予測モードに応じて、イントラ予測部１６とインター予測部１９とを切り替えて、イントラ予測部１６が出力するイントラ予測画像情報、またはインター予測部１９が出力するインター予測画像情報を減算器１１と加算器１５に出力する。
インター予測情報記憶部２３は、符号化済み動きベクトルを記憶する。

図２は、インター予測部１９の構成例を示す図である。インター予測部１９は、動きベクトル符号化部２１及びインター予測画像生成部２２を備える。
動きベクトル符号化部２１は、動きベクトルを符号化する。動きベクトル符号化部２１は、動きベクトル探索部２１１、動きベクトル予測部２１２及び動きベクトル予測残差符号化部２１３を備える。
動きベクトル探索部２１１は、符号化対象ブロックの座標と、画像情報とを入力とし、動きベクトルの探索と記録を行う。動きベクトル探索部２１１は、探索した動きベクトルを動きベクトル予測部２１２、動きベクトル予測残差符号化部２１３及びインター予測画像生成部２２に出力する。

動きベクトル予測部２１２は、符号化対象ブロックの座標と、動きベクトル探索部２１１から出力された動きベクトルと、ＦＯＥ座標とを入力とする。動きベクトル予測部２１２は、入力した符号化対象ブロックの座標と、動きベクトルと、ＦＯＥ座標とに基づいて、従来の空間方向予測動きベクトルや時間方向予測動きベクトルと並行して、ＦＯＥ方向予測動きベクトルを導出する。すなわち、動きベクトル予測部２１２は、複数種類の予測動きベクトルを導出する。
動きベクトル予測残差符号化部２１３は、動きベクトル予測部２１２から入力される複数種類の予測動きベクトルと、動きベクトル探索部２１１から入力される実際の動きベクトルとを用いて、動きベクトルの符号化を行う。具体的には、動きベクトル予測残差符号化部２１３は、複数種類の予測動きベクトルの中から１つの予測動きベクトルを選択し、選択した予測動きベクトルと、動きベクトルとの差分ベクトルを取得する。動きベクトル予測残差符号化部２１３は、取得した差分ベクトルと、差分ベクトルの導出に用いた予測動きベクトルがどれかを示すインデックスとを符号化して得られる符号化済み動きベクトルをインター予測情報記憶部２３に出力する。

すなわち、動きベクトル予測残差符号化部２１３による動きベクトル符号化の対象は、動きベクトルから予測動きベクトルを引いた差分ベクトルの成分と、差分ベクトル導出に用いた予測動きベクトルがどれかを示すインデックスである。差分ベクトル導出に用いる予測動きベクトルは、次のように選ぶことができる。例えば、入力された全ての予測動きベクトルを用いて差分ベクトルを計算し、符号化した際に符号量が最も小さくなるものを選んでもよい。また、予め定められた優先順位を予測動きベクトルに適用し、差分ベクトルを計算する候補を制限してもよい。このようにすることで、符号化する際のインデックスを減らすことができる。また、入力された予測動きベクトル間の相対的な違いによって、差分ベクトルを計算する候補を制限してもよい。相対的な違いとしては、ベクトルの大きさや角度の差が閾値よりも小さいあるいは大きいもの、とすることが出来る。また、入力された予測動きベクトルの線型結合を用いてもよい。線形結合としては、平均や、何らかの重み付けを行うことができる。
インター予測画像生成部２２は、動きベクトル探索部２１１から出力された動きベクトルと、参照画像である復号画像とに基づいてインター予測画像を生成する。インター予測画像生成部２２は、生成したインター予測画像をインター予測画像情報として出力する。

図３は、動きベクトル予測部２１２の構成例を示す図である。動きベクトル予測部２１２は、時間方向動きベクトル予測部２１２１、空間方向動きベクトル予測部２１２２及びＦＯＥ方向動きベクトル予測部２１２３を備える。
時間方向動きベクトル予測部２１２１は、別ピクチャ内ブロック動きベクトルと、符号化対象ブロック座標とを入力とし、時間方向予測動きベクトルを導出する。時間方向予測動きベクトルの導出の方法は、既存の技術が用いられる。

空間方向動きベクトル予測部２１２２は、符号化対象ブロック座標と、周辺ブロック動きベクトルとを入力とし、空間方向予測動きベクトルを導出する。空間方向予測動きベクトルの導出の方法は、既存の技術が用いられる。
ＦＯＥ方向動きベクトル予測部２１２３は、動きベクトル予測装置の一例である。ＦＯＥ方向動きベクトル予測部２１２３は、符号化対象ブロック座標と、周辺ブロック動きベクトルと、ＦＯＥ座標とを入力とし、ＦＯＥ方向予測動きベクトルを導出する。具体的には、ＦＯＥ方向動きベクトル予測部２１２３は、符号化対象ブロックからＦＯＥまでの方角と周辺ブロックの動きベクトルの大きさを求め、このふたつの情報を用いることによって符号化対象ブロックの動きベクトルを予測する。

図４は、ＦＯＥ方向動きベクトル予測部２１２３の構成例を示す図である。ＦＯＥ方向動きベクトル予測部２１２３は、ＦＯＥ方向角度導出部２１２３１、ノルム導出部２１２３２及びベクトル導出部２１２３３を備える。
ＦＯＥ方向角度導出部２１２３１は、入力されたＦＯＥ座標と、符号化対象ブロック座標とに基づいて、符号化対象ブロックとＦＯＥとの相対的な位置関係を求め、ＦＯＥ方向予測動きベクトルの向きを決定する。向きの導出は、例えばふたつの座標を結んだ線を斜辺に持つ直角三角形を考え、逆三角関数を用いて画面右方向を基準とした角度を計算する。

符号化対象ブロック座標は、入力されたものを用いてもよいし、適当な補正を加えてもよい。例えば、本発明をＨ.２６５／ＨＥＶＣに適用した場合、入力される符号化対象ブロック座標は符号化対象ブロックの左上画素の座標である（図５）。この場合、符号化対象ブロックのサイズ（縦横の画素数）の半分の値を座標に加えることで、符号化対象ブロックの中心部の座標を算出することもできる。入力された左上画素の座標ではなく中心部の座標を符号化対象ブロックの座標位置とすることで、より精確な向きが求まる。

このように、本実施形態における予測動きベクトルの向き（角度）は、従来技術とは異なり符号化済みブロックの動きベクトルから取得されない。なお、本実施形態における予測動きベクトルの向き（角度）は、符号化済みブロックの動きベクトルから取得されないものの、結果として符号化済みブロックの動きベクトルと同じ角度になる可能性がある。

ノルム導出部２１２３２は、入力された周辺ブロック動きベクトルに基づいて、予測動きベクトルノルムを決定する。ここでノルムとは、ベクトルの長さを示すスカラー値のことである。周辺ブロック動きベクトルは、符号化対象ブロックに隣接した符号化済みブロックにおいて実際に決定された動きベクトルを用いる。このように、ノルム導出部２１２３２は、符号化対象ブロックと略同じ奥行の符号化済みブロックを用いて予測動きベクトルノルムを決定する。動きベクトルを持つ符号化済みブロックが複数存在する場合、ノルム導出部２１２３２は優先順位に従ってひとつを選択してもよいし、それらの線型和を取ってもよい。

優先順位としては、例えば図６に示すようなＨ.２６５／ＨＥＶＣの空間方向予測で採用されているものがある。この場合、ノルム導出部２１２３２は、符号化対象ブロック右上（Ｂ０）、上（Ｂ１）、左上（Ｂ２）の順と、符号化対象ブロック左下（Ａ０）、左（Ａ１）の順に探索し、それぞれ最初に見つかったふたつの動きベクトルを取得する。ノルム導出部２１２３２は、このどちらかの動きベクトル、あるいはその線型和からノルムを求めてもよい。

また、ノルム導出部２１２３２は、他の優先順位を用いてもよい。例えば、人工物が縦方向に垂直であることが多いため、符号化対象ブロックの上にあるブロックが映す被写体と深度が一致していると期待されることから、ノルム導出部２１２３２は、上にあるブロックの動きベクトルを優先してもよい。また、その他の優先順位でもよい。または、画面内における符号化対象ブロックの位置によって、優先順位のつけ方を変えてもよい。例えば、画面両端では上にあるブロックから取得し、路面を映すことが多い画面中央下部では左にあるブロックから取得することにより、精度向上を図ることができる。線型和の方法としては、候補の平均でもよいし、優先順位に応じた重み付けをしてもよい。

ベクトル導出部２１２３３は、ＦＯＥ方向角度導出部２１２３１から入力された予測動きベクトル角度と、ノルム導出部２１２３２から入力された予測動きベクトルノルムとを用いて、ＦＯＥ方向予測動きベクトルを決定する。例えば、ベクトル導出部２１２３３は、通常の三角関数を用いて、角度とノルムからベクトルの縦成分横成分を算出する。

図７は、ＦＯＥ方向動きベクトル予測部２１２３の処理の流れを示すフローチャートである。本実施形態においてＦＯＥ座標はフレーム毎に与えられるものとする。
ＦＯＥ方向動きベクトル予測部２１２３は、入力されたフレームに対するＦＯＥ座標が入力されたか否か判定する（ステップＳ１０１）。ＦＯＥ座標が入力されなかった場合（ステップＳ１０１−ＮＯ）、ＦＯＥ方向動きベクトル予測部２１２３は零ベクトルを出力する（ステップＳ１０２）。

一方、ＦＯＥ座標が入力された場合（ステップＳ１０１−ＹＥＳ）、ＦＯＥ方向動きベクトル予測部２１２３は周辺ブロック動きベクトルが存在するか否か判定する（ステップＳ１０３）。本実施形態では、映像符号化装置１は画面内の各ブロックに対して画面間予測または画面内予測どちらか一方を行っており、画面内予測が選択された場合には動きベクトルを持たない。隣接する符号化済みブロック全てが動きベクトルを持たない場合には、動きベクトル予測部２１２は周辺ブロック動きベクトルが存在しないと判定する。一方、隣接する符号化済みブロック全て又は一部が動きベクトルを持つ場合には、ＦＯＥ方向動きベクトル予測部２１２３は周辺ブロック動きベクトルが存在すると判定する。

周辺ブロック動きベクトルが存在しない場合（ステップＳ１０３−ＮＯ）、ＦＯＥ方向動きベクトル予測部２１２３は零ベクトルを出力する。
一方、周辺ブロック動きベクトルが存在する場合（ステップＳ１０３−ＹＥＳ）、ＦＯＥ方向角度導出部２１２３１は、符号化対象ブロック座標と、ＦＯＥ座標とを用いて予測動きベクトル角度を決定する（ステップＳ１０４）。また、ノルム導出部２１２３２は、決められた優先順位に従って、ノルムを決定するための動きベクトルを選択し、予測動きベクトルノルムを決定する（ステップＳ１０５）。
その後、ベクトル導出部２１２３３は、予測動きベクトル角度と、予測動きベクトルノルムとに基づいてＦＯＥ方向予測動きベクトルを導出する（ステップＳ１０６）。そして、ベクトル導出部２１２３３は、導出したＦＯＥ方向予測動きベクトルを出力する（ステップＳ１０７）。

以上のように構成された映像符号化装置１によれば、カメラが移動しながら撮影した映像から深度情報を用いずに、動きベクトルの向きと大きさをより精度良く予測することが可能になる。従来の映像符号化技術は、被写体の並行移動が前提となっており、それ以外の場合には符号化効率が悪化してしまう。それに対し、本発明では、符号化済のブロックから動きベクトルの大きさだけを取得し、予め与えられる角度に基づいて動きベクトルの角度を取得し、取得した動きベクトルの大きさと角度とに基づいて動きベクトルを予測する。具体的には、映像符号化装置１は、符号化対象ブロックとＦＯＥとの位置関係から予測動きベクトルの向きを、周辺ブロックの動きベクトルから予測動きベクトルの大きさを決定する。これにより、カメラと被写体との距離によって生じる動き量の違いを考慮して予測できる。このように、適切な角度と適切な大きさの情報を取得して予測動きベクトルを生成するため、深度情報を使わなくとも高精度な予測動きベクトルを得ることが可能になる。

（変形例）
本実施形態では、ＦＯＥ座標がフレーム毎に入力される構成を示したが、ＦＯＥ座標は数フレーム毎に入力されてもよい。

（第２の実施形態）
第１の実施形態では、ＦＯＥ座標は予め入力される。それに対し、第２の実施形態では、ＦＯＥ座標を決定し、決定したＦＯＥ座標に基づいてＦＯＥ方向予測動きベクトルを導出する。なお、第２の実施形態では、映像符号化装置が備えるインター予測部の構成が第１の実施形態と異なる。第２の実施形態における映像符号化装置は、その他の構成については第１の実施形態における映像符号化装置が備える各機能部と同様の構成を備える。そこで、以下相違点についてのみ説明する。

図８は、第２の実施形態におけるインター予測部１９ａの構成例を示す図である。インター予測部１９ａは、動きベクトル符号化部２１ａ及びインター予測画像生成部２２を備える。
動きベクトル符号化部２１ａは、ＦＯＥ座標を決定し、動きベクトルを符号化する。動きベクトル符号化部２１ａは、動きベクトル探索部２１１ａ、動きベクトル予測部２１２、動きベクトル予測残差符号化部２１３及びＦＯＥ決定部２１４を備える。動きベクトル予測部２１２及び動きベクトル予測残差符号化部２１３は、第１の実施形態における同名の機能部と同様の処理を行うため説明を省略する。

動きベクトル探索部２１１ａは、符号化対象ブロックの座標と、画像情報とを入力とし、動きベクトルの探索と記録を行う。動きベクトル探索部２１１ａは、探索した動きベクトルを動きベクトル予測部２１２、動きベクトル予測残差符号化部２１３及びＦＯＥ決定部２１４に出力する。
ＦＯＥ決定部２１４は、動きベクトル探索部２１１ａによって得られた動きベクトルを入力し、ＦＯＥ座標の決定を行って動きベクトル予測部２１２に出力する。

図９は、ＦＯＥ決定部２１４の構成例を示す図である。ＦＯＥ決定部２１４は、符号化済み画像ＦＯＥ算出部２１４１、ＦＯＥ記憶装置２１４２及び決定部２１４３を備える。
符号化済み画像ＦＯＥ算出部２１４１は、動きベクトル探索部２１１ａから出力された実際の動きベクトルを入力とし、既に符号化が行なわれた画像のＦＯＥ座標を求める。ＦＯＥ座標は、画面全体の動きベクトルを順方向あるいは逆方向に延長した場合の交点であるが、実際の動画像中で全ての動きベクトルが一点に収束することは稀であるため、近似的に求める必要がある。

画像内の平行ではない動きベクトル二本を選択したとき、順方向あるいは逆方向に延長すれば必ず一点で交わる。これを選択された動きベクトルに関する仮のＦＯＥとする。符号化済み画像ＦＯＥ算出部２１４１は、異なる動きベクトルの組み合わせから仮のＦＯＥ座標を複数算出し、それら座標の中央値を取ることによって符号化済み画像ＦＯＥ座標を算出する。

ここで座標の中央値とは、座標の縦方向成分に関する中央値と、横方向成分に関する中央値をとった値である。異なる動きベクトルの組み合わせは可能な限り多く取ることが望ましいが、計算量の観点から選択的に取ってもよい。例えば、符号化済み画像ＦＯＥ算出部２１４１は、動きベクトルのうち、大きさがある閾値を超える動きベクトル、又は、閾値を下回る動きベクトルのみを選んでもよい。閾値としては、空などカメラの移動が影響しづらく動きベクトルがＦＯＥ方向を向かない箇所の影響を避けられるように定めるのが望ましい。または、画面を特定の区間に区切り、区間内から動きベクトルの代表を一本ずつ選んで組み合わせてもよい。特定の区間としては、画面左右、画面中央下部といった、被写体が実空間内で静止しておりかつ必要以上に遠方に位置しないと予想される箇所を取ることが望ましい。

ＦＯＥ記憶装置２１４２は、符号化済み画像ＦＯＥ算出部２１４１が求めた符号化済み画像ＦＯＥ座標を記録する。符号化済み画像ＦＯＥ座標は、画像一枚に付き一つずつ存在する。
決定部２１４３は、符号化済み画像ＦＯＥ座標と、現在符号化している画像の符号化済みブロックの動きベクトルとを用いて、現在符号化している画像のＦＯＥ座標を決定する。新しい画像の符号化の開始時には、決定部２１４３は、ＦＯＥ記憶装置２１４２に記録された符号化済み画像ＦＯＥ座標を用いて新しい画像のＦＯＥ座標を決定する。

決定の方法としては、例えば直前の画像のＦＯＥ座標を今回の画像のＦＯＥ座標としてもよい。または、直前二枚分の画像のＦＯＥ座標の変化量を求め、直前の画像のＦＯＥに加えることで線形予測を行ってもよい。または、複数枚の画像のＦＯＥ座標の中央値を用いてもよい。中央値を算出する為のＦＯＥ座標は可能な限り多く用意することが望ましいが、カメラ移動の時間的な変化があるため、一定の時間以内に撮影された画像から選択してもよい。現在の画像の符号化が進行するにつれ、現在の画像の実際の動きベクトルが決定部２１４３に入力される。決定部２１４３は、この情報をもとに、現在の画像のＦＯＥ座標に修正を加えてもよい。この場合は、符号化済み画像ＦＯＥ算出部２１４１が行う動作を、限られた動きベクトルから行うことになる。例えば画像を符号化順に分割し、一区間の符号化が終わるごとにＥＯＦを更新するといったことをしてもよい。その後、決定部２１４３は、決定したＦＯＥ座標を動きベクトル予測部２１２に出力する。

以上のように構成された映像符号化装置１によれば、処理の度に符号化対象ブロックのＦＯＥ座標を決定する。これにより、符号化対象ブロック毎に適したＦＯＥ座標を決定し、動きベクトルを予測することができる。また、映像符号化装置１は、符号化対象ブロックとＦＯＥとの位置関係から予測動きベクトルの向きを、周辺ブロックの動きベクトルから予測動きベクトルの大きさを決定する。これにより、カメラと被写体との距離によって生じる動き量の違いを考慮して予測できる。このように、適切な角度と適切な大きさの情報を取得して予測動きベクトルを生成するため、深度情報を使わなくとも高精度な予測動きベクトルを得ることが可能になる。

また、第２の実施形態では、ＦＯＥ座標の算出技術が含まれる。これにより、外部からＦＯＥ座標を与えることなく、従来のエンコーダよりも高効率で圧縮が可能となる。

（映像復号装置）
図１０は、第１の実施形態及び第２の実施形態における映像符号化装置１が出力する符号化データを受信して映像信号を復号する映像復号装置３の構成を示すブロック図である。映像復号装置３は、例えば、ＨＥＶＣやＨ．２６４等の符号化方式においてデコーダとして適用される装置である。
映像復号装置３は、バスで接続されたＣＰＵやメモリや補助記憶装置などを備え、プログラムを実行する。映像復号装置３は、プログラムの実行によってエントロピー復号化処理部３１、逆量子化処理部３２、逆変換処理部３３、復号信号生成部３４、ループフィルタ部３５、復号ピクチャ記憶部３６、イントラ予測部３７、インター予測情報記憶部３８、インター予測部３９、イントラ／インター切り替えスイッチ４０を備える装置として機能する。なお、映像復号装置３の各機能の全て又は一部は、ＡＳＩＣやＰＬＤやＦＰＧＡ等のハードウェアを用いて実現されてもよい。プログラムは、コンピュータ読み取り可能な記録媒体に記録されてもよい。コンピュータ読み取り可能な記録媒体とは、例えばフレキシブルディスク、光磁気ディスク、ＲＯＭ、ＣＤ−ＲＯＭ等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置である。プログラムは、電気通信回線を介して送信されてもよい。

エントロピー復号化処理部３１は、映像符号化装置１の可変長符号化部１３が出力する符号化データを取り込み、符号化データに含まれている予測動きベクトル等のインター予測に関する情報をエントロピー復号して、インター予測情報記憶部３８に書き込んで記憶させる。エントロピー復号化処理部３１は、符号化データに含まれている復号対象ブロックの量子化されている変換係数をエントロピー復号する。

逆量子化処理部３２は、エントロピー復号化処理部３１が出力する量子化されている変換係数を逆量子化して、復号変換係数を出力する。
逆変換処理部３３は、逆量子化処理部３２が出力する復号変換係数を逆直交変換し、予測残差復号信号を出力する。
復号信号生成部３４は、イントラ予測部３７、またはインター予測部３９が出力する予測画像情報と、逆変換処理部３３が出力する予測残差復号信号とを、内部に備える加算器により加算し、復号画像ブロックを生成する。

ループフィルタ部３５は、復号信号生成部３４が出力する復号画像ブロックに対して符号化歪を低減するフィルタリング処理を行い、フィルタリング処理後の復号画像ブロックを復号ピクチャ記憶部３６に書き込んで記憶させる。
復号ピクチャ記憶部３６は、ループフィルタ部３５の出力を格納する。
イントラ予測部３７は、復号ピクチャ記憶部３６に記憶されているフィルタリング処理後の復号画像ブロックを読み出す。また、イントラ予測部３７は、予測モードに基づいて、読み出した復号画像ブロックから予測画像ブロック、すなわち予測画像情報を生成して出力する。
インター予測情報記憶部３８は、インター予測に関する情報を記憶する。インター予測情報記憶部３８が記憶するインター予測に関する情報は、符号化済み動きベクトル（差分ベクトルの成分とインデックス）である。

インター予測部３９は、復号ピクチャ記憶部３６に記憶されているフィルタリング処理後の復号画像ブロックを読み込む。また、インター予測部３９は、インター予測情報記憶部３８に記憶されている符号化済み動きベクトルに基づいて、復号画像ブロックから予測画像ブロック、すなわち予測画像情報を生成して出力する。
イントラ／インター切り替えスイッチ４０は、復号対象ブロックの予測モードに応じて、イントラ予測部３７とインター予測部３９とを切り替えて、イントラ予測部３７が出力するイントラ予測画像情報、またはインター予測部１９が出力するインター予測画像情報を復号信号生成部３４に出力する。

（第１の実施形態及び第２の実施形態のインター予測部の映像復号装置３への適用）
第１の実施形態のインター予測部の構成を映像復号装置３へ適用した場合の構成を図１１に示す。
図１１は、映像復号装置３のインター予測処理部３９の内部構成を示すブロック図である。インター予測処理部３９は、動きベクトル復号部４１及びインター予測画像復号部４２を備える。
動きベクトル復号部４１は、動きベクトルを復号する。動きベクトル復号部４１は、動きベクトル記憶部４１１、動きベクトル予測部４１２及び復号部４１３を備える。

動きベクトル記憶部４１１は、復号対象ブロックの座標と、復号済み動きベクトルとを記憶する。
動きベクトル予測部４１２は、復号対象ブロックの座標と、動きベクトル記憶部４１１に記憶されている復号済み動きベクトルと、ＦＯＥ座標とを入力とする。動きベクトル予測部４１２は、入力した復号対象ブロックの座標と、復号済み動きベクトルと、ＦＯＥ座標とに基づいて、従来の空間方向予測動きベクトルや時間方向予測動きベクトルと並行して、ＦＯＥ方向予測動きベクトルを導出する。なお、動きベクトル予測部４１２は、予測動きベクトルの導出時には、前回の処理（例えば、予測動きベクトルの導出が時刻ｔであれば、時刻ｔ−１の処理）で復号部４１３によって得られた復号済み動きベクトルを用いる。

復号部４１３は、動きベクトル予測部４１２から入力される複数の予測動きベクトルと、符号化済み動きベクトルとを用いて、動きベクトルの復号を行う。具体的には、復号部４１３は、複数種類の予測動きベクトルの中から１つの予測動きベクトルを選択し、選択した予測動きベクトルと、入力された符号化済み動きベクトルを復号して得られる差分ベクトルとを加算して動きベクトルを取得する。復号部４１３は、取得した動きベクトルを復号済み動きベクトルとして動きベクトル記憶部４１１に出力する。なお、復号部４１３は、符号化済み動きベクトルを復号して得られるインデックスで示される予測動きベクトルを、複数種類の予測動きベクトルの中から選択する。

次に、動きベクトル予測部４１２の具体的な構成について説明する。動きベクトル予測部４１２は、動きベクトル予測部２１２と同様の構成を備える。すなわち、動きベクトル予測部４１２は、時間方向動きベクトル予測部、空間方向動きベクトル予測部及びＦＯＥ方向動きベクトル予測部を備える。
時間方向動きベクトル予測部は、別ピクチャ内ブロック動きベクトルと、復号対象ブロック座標とを入力とし、時間方向予測動きベクトルを導出する。時間方向予測動きベクトルの導出の方法は、既存の技術が用いられる。

空間方向動きベクトル予測部は、復号対象ブロック座標と、周辺ブロック動きベクトルとを入力とし、空間方向予測動きベクトルを導出する。空間方向予測動きベクトルの導出の方法は、既存の技術が用いられる。
ＦＯＥ方向動きベクトル予測部は、動きベクトル予測装置の一例である。ＦＯＥ方向動きベクトル予測部は、復号対象ブロック座標と、周辺ブロック動きベクトルと、ＦＯＥ座標とを入力とし、ＦＯＥ方向予測動きベクトルを導出する。具体的には、ＦＯＥ方向動きベクトル予測部は、復号対象ブロックからＦＯＥまでの方角と周辺ブロックの動きベクトルの大きさを求め、このふたつの情報を用いることによって復号対象ブロックの動きベクトルを予測する。なお、動きベクトル予測部４１２が備えるＦＯＥ方向動きベクトル予測部の処理は、ＦＯＥ方向動きベクトル予測部２１２３が用いる符号化対象ブロック座標を復号対象ブロック座標に置き換えればＦＯＥ方向動きベクトル予測部２１２３の処理と同様である。

インター予測画像復号部４２は、復号部４１３から出力された復号済み動きベクトルと、復号ピクチャ記憶部３６に記憶されている復号済み画像とに基づいて、インター予測画像を復号する。インター予測画像復号部４２は、復号したインター予測画像を復号済みインター予測画像情報として出力する。

第２の実施形態のインター予測部の構成を映像復号装置３へ適用した場合の構成を図１２に示す。
図１２は、映像復号装置３のインター予測処理部３９の内部構成を示すブロック図である。インター予測処理部３９は、動きベクトル復号部４１ａ及びインター予測画像復号部４２を備える。動きベクトル復号部４１ａは、ＦＯＥ座標を決定し、動きベクトルを復号する。動きベクトル復号部４１ａは、動きベクトル記憶部４１１、動きベクトル予測部４１２、復号部４１３ａ及びＦＯＥ決定部４１４を備える。動きベクトル記憶部４１１及び動きベクトル予測部４１２は、第１の実施形態のインター予測部の構成を映像復号装置３に適用した場合の同名の機能部と同様の処理を行うため説明を省略する。

ＦＯＥ決定部４１４は、復号部４１３から出力された復号済み動きベクトルを入力し、入力した復号済み動きベクトルに基づいてＦＯＥ座標の決定し、決定したＦＯＥ座標動きベクトル予測部４１２に出力する。なお、ＦＯＥ決定部４１４の処理は、ＦＯＥ決定部２１４が用いる符号化済み画像ＦＯＥ座標及び現在符号化している画像の符号化済みブロックの動きベクトルを復号済み画像ＦＯＥ座標及び現在復号している画像の復号済みブロックの動きベクトルに置き換えればＦＯＥ決定部２１４の処理と同様である。

上述した各実施形態における映像符号化装置１及び映像復号装置３をコンピュータで実現する様にしてもよい。その場合、この機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。なお、ここでいう「コンピュータシステム」とは、ＯＳや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ＲＯＭ、ＣＤ−ＲＯＭ等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。更に「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線の様に、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリの様に、一定時間プログラムを保持しているものも含んでもよい。また上記プログラムは、前述した機能の一部を実現するためのものであってもよく、更に前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよく、ＰＬＤ（Programmable Logic Device）やＦＰＧＡ（Field Programmable Gate Array）等のハードウェアを用いて実現されるものであってもよい。

以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。

１…映像符号化装置，３…映像復号装置，１１…減算器，１２…直交変換・量子化部，１３…可変長符号化部，１４…逆量子化・逆直交変換部，１５…加算器，１６…イントラ予測部，１７…ループフィルタ部，１８…復号ピクチャ記憶部，１９、１９ａ…インター予測部，２０…イントラ／インター切り替えスイッチ，２１、２１ａ…動きベクトル符号化部，２１１、２１１ａ…動きベクトル探索部，２１２…動きベクトル予測部，２１３…動きベクトル予測残差符号化部，２１４…ＦＯＥ決定部，２２…インター予測画像生成部，２３…インター予測情報記憶部，２１２１…時間方向動きベクトル予測部，２１２２…空間方向動きベクトル予測部，２１２３…ＦＯＥ方向動きベクトル予測部，２１２３１…ＦＯＥ方向角度導出部，２１２３２…ノルム導出部，２１２３３…ベクトル導出部，２１４１…符号化済み画像ＦＯＥ算出部，２１４２…ＦＯＥ記憶装置，２１４３…決定部，３１…エントロピー復号化処理部，３２…逆量子化処理部，３３…逆変換処理部，３４…復号信号生成部，３５…ループフィルタ部，３６…復号ピクチャ記憶部，３７…イントラ予測部，３８…インター予測情報記憶部，３９、３９ａ…インター予測部，４０…イントラ／インター切り替えスイッチ，４１、４１ａ…動きベクトル復号部，４１１…動きベクトル記憶部，４１２…動きベクトル予測部，４１３…復号部，４１４…ＦＯＥ決定部，４２…インター予測画像復号部

Claims

処理済みブロックから予測動きベクトルノルムを取得する予測動きベクトルノルム取得部と、
与えられた角度に関連する情報に基づいて、予測動きベクトルの角度を取得する予測動きベクトル角度取得部と、
前記予測動きベクトルノルムと前記予測動きベクトルの角度とに基づいて、処理対象ブロックの予測動きベクトルを取得するベクトル取得部と、
を備える動きベクトル予測装置。
前記予測動きベクトルノルム取得部は、処理対象ブロックと略同じ奥行の処理済みブロックから前記予測動きベクトルノルムを取得する、請求項１に記載の動きベクトル予測装置。
前記予測動きベクトルノルム取得部は、処理対象ブロックの隣接ブロックである処理済みブロックを用いて前記予測動きベクトルノルムを取得する、請求項１に記載の動きベクトル予測装置。
前記与えられた角度に関連する情報は、少なくともＦＯＥ（focus of expansion）座標に基づく情報である、請求項１に記載の動きベクトル予測装置。
処理済みブロックから予測動きベクトルノルムを取得する予測動きベクトルノルム取得部と、
少なくともＦＯＥ（focus of expansion）座標に基づく情報に基づいて、予測動きベクトルの角度を取得する予測動きベクトル角度取得部と、
前記予測動きベクトルノルムと前記予測動きベクトルの角度とに基づいて、処理対象ブロックの予測動きベクトルを取得するベクトル取得部と、
を備え、
前記予測動きベクトルノルム取得部は、処理対象ブロックの隣接ブロックである処理済みブロックを用いて前記予測動きベクトルノルムを取得する動きベクトル予測装置。
コンピュータに、
処理済みブロックから予測動きベクトルノルムを取得する予測動きベクトルノルム取得ステップと、
与えられた角度に関連する情報に基づいて、予測動きベクトルの角度を取得する予測動きベクトル角度取得ステップと、
前記予測動きベクトルノルムと前記予測動きベクトルの角度とに基づいて、処理対象ブロックの予測動きベクトルを取得するベクトル取得ステップと、
を実行させるためのコンピュータプログラム。
コンピュータに、
処理済みブロックから予測動きベクトルノルムを取得する予測動きベクトルノルム取得ステップと、
少なくともＦＯＥ（focus of expansion）座標に基づく情報に基づいて、予測動きベクトルの角度を取得する予測動きベクトル角度取得ステップと、
前記予測動きベクトルノルムと前記予測動きベクトルの角度とに基づいて、処理対象ブロックの予測動きベクトルを取得するベクトル取得ステップと、
を実行させ、
前記予測動きベクトルノルム取得ステップにおいて、処理対象ブロックの隣接ブロックである処理済みブロックを用いて前記予測動きベクトルノルムを取得するためのコンピュータプログラム。