JP2011176570A - マルチ解像度映像復号方法、マルチ解像度映像復号装置、及びプログラム - Google Patents

マルチ解像度映像復号方法、マルチ解像度映像復号装置、及びプログラム Download PDF

Info

Publication number
JP2011176570A
JP2011176570A JP2010038678A JP2010038678A JP2011176570A JP 2011176570 A JP2011176570 A JP 2011176570A JP 2010038678 A JP2010038678 A JP 2010038678A JP 2010038678 A JP2010038678 A JP 2010038678A JP 2011176570 A JP2011176570 A JP 2011176570A
Authority
JP
Japan
Prior art keywords
resolution
setting
video
decoding
sub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010038678A
Other languages
English (en)
Other versions
JP5355449B2 (ja
Inventor
Shinya Shimizu
信哉 志水
Hideaki Kimata
英明 木全
Masayuki Inoue
雅之 井上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2010038678A priority Critical patent/JP5355449B2/ja
Publication of JP2011176570A publication Critical patent/JP2011176570A/ja
Application granted granted Critical
Publication of JP5355449B2 publication Critical patent/JP5355449B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】ユーザからの表示領域の変更に応じて、高速に高品質な映像を復号表示する。
【解決手段】主解像度設定部104は、ユーザの注視領域を復号する主解像度を設定する。操作予測部105は、ユーザの操作を予測する。副解像度設定部106は、注視領域以外を復号する副解像度を設定する。周辺領域設定部107は、副解像度において周辺領域に対応する領域を設定する。復号対象設定部108は、復号する分割映像を決定する。優先順位設定部109は、復号対象の分割映像に優先順位を設定する。分割映像復号部110は、優先順位に従って符号化データから分割映像を復号する。映像拡大部111は、周辺領域に対して復号された映像をアップサンプルする。デブロッキング処理部112は、注視領域と周辺領域との境界領域に対してフィルタ処理を加える。
【選択図】図1

Description

本発明は、マルチ解像度映像の符号化データから復号する際に、ユーザからの表示領域の変更に応じて、高速に高品質な映像を復号表示するマルチ解像度映像復号方法、マルチ解像度映像復号装置、及びプログラムに関する。
ネットワーク技術の発展により、一般家庭において、大容量、かつ双方向の通信が利用可能になったため、インタラクティブ映像サービスが注目を集めている。特に、パノラマ映像のインタラクティブ視聴サービスは、ユーザ毎に異なる欲求を満たすことが可能なサービスとして高い注目を集めている。ここで言うパノラマ映像のインタラクティブ視聴サービスとは、スポーツや、コンサート、舞台などの複数の注目対象が存在するようなコンテンツにおいて、各ユーザが自身の興味に合わせて、全体を見渡せる映像を鑑賞したり、ある対象に注目して一部を拡大して鑑賞したりすることが可能な映像サービスである。
このようなサービスを実現する際には、一般的に、マルチ解像度映像が用いられる。マルチ解像度映像とは、複数の解像度で同じ内容の映像を表現した映像群のことである。例えば、静止画の例であるが、インターネット上で提供されている地図サービスなどでは、同じ領域に対して複数の縮尺の地図を準備し、ユーザからの指示に従って表示する地図の縮尺を変更している。
このようなサービスでは、一般的に、広範囲の撮影空間を取り扱うだけでなく、ユーザの興味に従って拡大表示した際の映像品質を保証するために、マルチ解像度映像には、非常に高解像度の映像が含められる。そのため、全ての解像度の映像全体を同時に処理するには、非常に多くの演算量が必要となり、実時間での処理は、ほぼ不可能である。
この膨大な演算量を削減するために、マルチ解像度映像を空間的に分割して符号化し、ユーザの指定した映像を生成するのに必要な分割映像の符号化データだけを復号処理して表示する方法が用いられている。つまり、ある解像度の一部分の映像データのみを復号処理することで、演算負荷の抑制を行っている。
そのような空間的に分割して符号化したマルチ解像度映像を用いて、インタラクティブ映像サービスを実現する際に、全てのデータを常に取得・復号するのではなく、必要なデータのみを部分的に取得・復号するシステムや、全てのデータを取得するが、復号は必要な部分に対してのみ行うシステムが提案されている。特許文献1では、そのようなシステムにおいて、インタラクティブに表示領域を変更する際のユーザレスポンスを向上するための技術が提案されている。
特開2004−199291号公報(特許第3897691号)
前述のように、マルチ解像度映像を空間的に分割して符号化し、ユーザによって指定された映像を生成するために必要な分割映像の符号化データのみを復号することで、演算負荷を小さく抑え、実時間での動作を実現することが可能となる。
しかしながら、ユーザの指定を受けてから復号対象を決める場合、ユーザの指示を受けた後に、ストリームファイルやサーバから該当する分割映像を読み出して復号するため、その操作が表示に反映されるまでに遅延が発生してしまうという問題がある。このようなフィードバック遅延が存在する場合、システムに自身の操作が正しく受け付けられたのか判断することができなかったり、意図した映像を見ることができなかったりするため、ユーザは、システムに対して不快感を覚えることになる。
容易に考えられる対処方法として、復号映像が得られているかどうかに関わらず、ユーザからの操作に対して表示領域を変更するという方法がある。例えば、インターネット上の地図サービスでは、この方法が取られている。この場合、復号映像が得られていない領域では、空白の映像が表示されることになり、復号映像が得られた時点でその部分の表示が行われることになる。この方法を取ることで、ユーザは、自身の入力が少なくとも正確にシステムに受け付けられたというフィードバックが得られるため、操作に対する不快感は低下すると考えられる。しかしながら、この場合には、ユーザが観たいと思って選んだ時刻、及び領域の映像を提示することができないという問題が残る。
また、上述した特許文献1では、別の対処方法として、低解像度の映像に対するデータを別途受信しておき、ユーザの操作が行われている間は低解像度の映像を復号し、その復号映像を拡大表示することで、ユーザレスポンスを向上させる方法が提案されている。この方法では、常に低解像度の映像に対する分割映像を伝送する必要があるため、より大きな伝送帯域が必要となる。特に、ユーザの注視領域に対しては、高解像度と低解像度との両方の映像を伝送することになるため、無駄に帯域を消費してしまっているという問題がある。更に、ユーザの操作が開始された後に、低解像度の映像を復号するため、操作入力から表示が行われるまでに復号時間分の遅延が発生し、ユーザは、入力が正常に受け付けられたかどうかを即座に確認できないという問題もある。
本発明は、このような事情を考慮してなされたものであり、その目的は、ユーザからの表示領域の変更に応じて、高速に高品質な映像を復号表示することができるマルチ解像度映像復号方法、マルチ解像度映像復号装置、及びプログラムを提供することにある。
上述した課題を解決するために、本発明は、ユーザの注視領域を設定する注視領域設定ステップと、前記注視領域を復号する主解像度を設定する主解像度設定ステップと、ユーザの操作履歴からユーザ操作を予測する操作予測ステップと、前記主解像度よりも低い解像度で、前記注視領域の周辺領域を復号する副解像度を設定する副解像度設定ステップと、前記副解像度に基づいて、前記注視領域の周辺に位置する周辺領域を設定する周辺領域設定ステップと、前記注視領域を含む分割映像と前記周辺領域を含む分割映像とを、復号対象の分割映像として設定する復号対象設定ステップと、前記復号対象に指定された分割映像を復号する分割映像復号ステップと、前記副解像度で復号された分割映像をアップサンプルする映像拡大ステップとを含むことを特徴とするマルチ解像度映像復号方法である。
本発明は、上記の発明において、前記予測されるユーザ操作に基づいて、前記復号対象の分割映像に優先順位を設定する優先順位設定ステップをさらに含み、
前記分割映像復号ステップは、前記優先順位に基づいて、前記復号対象に指定された分割映像を復号することを特徴とする。
本発明は、上記の発明において、前記操作予測ステップは、前記注視領域の中心位置を蓄積しておき、蓄積された中心位置からユーザの操作をモデル化し、そのモデルに従って予測を行うことを特徴とする。
本発明は、上記の発明において、前記操作予測ステップで予測されたユーザ操作における注視領域の移動量に基づいて副解像度を設定することを特徴とする。
本発明は、上記の発明において、前記復号された注視領域を含む分割映像と前記アップサンプルされた周辺領域を含む分割映像との境界部分に対して、デブロッキングフィルタ処理を加える境界フィルタ処理ステップを更に含むことを特徴とする。
また、上述した課題を解決するために、本発明は、同一のシーンを複数の解像度で表現したマルチ解像度映像を空間的に分割して符号化したデータを復号するマルチ解像度映像復号装置であって、ユーザの注視領域を設定する注視領域設定手段と、前記注視領域設定手段により設定されたユーザの注視領域を復号する主解像度を設定する主解像度設定手段と、ユーザの操作履歴からユーザ操作を予測する操作予測手段と、前記主解像度よりも低い解像度で、前記注視領域の周辺領域を復号する副解像度を設定する副解像度設定手段と、前記副解像度設定手段により設定された副解像度に基づいて、前記注視領域の周辺に位置する周辺領域を設定する周辺領域設定手段と、前記注視領域を含む分割映像と前記周辺領域を含む分割映像とを、復号対象の分割映像として設定する復号対象設定手段と、前記操作予測手段により予測されるユーザ操作に基づいて、前記復号対象の分割映像に優先順位を設定する優先順位設定手段と、前記優先順位設定手段により設定された優先順位に基づいて、前記復号対象に指定された分割映像を復号する分割映像復号手段と、前記分割映像復号手段により副解像度で復号された分割映像をアップサンプルする映像拡大手段とを備えることを特徴とするマルチ解像度映像復号装置である。
本発明は、上記の発明において、前記操作予測手段は、前記注視領域の中心位置を蓄積しておき、蓄積された中心位置からユーザの操作をモデル化し、そのモデルに従って予測を行うことを特徴とする。
本発明は、上記の発明において、前記副解像度設定手段は、前記操作予測ステップで予測されたユーザ操作における注視領域の移動量に基づいて副解像度を設定することを特徴とする。
本発明は、上記の発明において、前記分割映像復号手段により復号された、前記注視領域を含む分割映像と前記アップサンプルされた周辺領域を含む分割映像との境界部分に対して、デブロッキングフィルタ処理を加える境界フィルタ処理手段を更に含むことを特徴とする。
また、上述した課題を解決するために、本発明は、同一のシーンを複数の解像度で表現したマルチ解像度映像を空間的に分割して符号化したデータを復号するマルチ解像度映像復号装置のコンピュータに、ユーザの注視領域を設定する注視領域設定機能、前記注視領域を復号する主解像度を設定する主解像度設定機能、ユーザの操作履歴からユーザ操作を予測する操作予測機能、前記主解像度よりも低い解像度で、前記注視領域の周辺領域を復号する副解像度を設定する副解像度設定機能、前記副解像度に基づいて、前記注視領域の周辺に位置する周辺領域を設定する周辺領域設定機能、前記注視領域を含む分割映像と前記周辺領域を含む分割映像とを、復号対象の分割映像として設定する復号対象設定機能、前記予測されるユーザ操作に基づいて、前記復号対象の分割映像に優先順位を設定する優先順位設定機能、前記優先順位に基づいて、前記復号対象に指定された分割映像を復号する分割映像復号機能、前記副解像度で復号された分割映像をアップサンプルする映像拡大機能を実行することを特徴とするプログラムである。
この発明によれば、同一のシーンが複数の解像度で表現されたマルチ解像度映像の符号化データを、ユーザの指定する表示領域に従って復号する際に、複数の解像度の映像を同時に復号することで、ユーザからの表示領域が時間的に変化する場合においても、高速に高品質な映像を復号表示することができる。
本発明の実施形態によるマルチ解像度映像復号装置100の構成を示すブロック図である。 本発明の実施形態によるマルチ解像度映像復号装置100の動作を説明するフローチャートである。 本実施形態による、優先順位の付け方を説明するための概念図である。 本実施形態による、優先順位の付け方を説明するためのフローチャートである。 本実施形態による優先順位の別の付け方を説明するための概念図である。 本実施形態による、デブロッキングフィルタを説明する概念図である。 本実施形態による、副解像度設定部106において周辺領域毎に異なる副解像度を割り当てる処理を説明するフローチャートである。
以下、本発明の一実施形態を、図面を参照して説明する。
帯域や計算資源が限られる状況では、常に全てのデータを伝送または復号することは不可能であるため、従来の手法では、ユーザからの入力を受けてから必要なデータを伝送または復号していた。そのため、ユーザが入力を行ってから表示が行われるまでに遅延が生じてしまっていた。本発明では、ユーザの操作を予測し(後述する図2のステップSa4)、その予測に応じて、注視領域以外の領域に対して、副解像度と周辺領域とを設定し(後述する図2のステップSa5、Sa6)、優先順位をつけて(後述する図2のステップSa8)、注視領域以外の領域に対して、帯域や計算資源が許す限り、データ伝送や復号を行うことより、ユーザが注視領域を変更する場合においても、同時に復号されていた映像を表示することで、ユーザが入力を行った後、すぐに復号した映像を出力することを可能とし、ユーザレスポンスを向上させることを特徴としている。
図1は、本発明の実施形態によるマルチ解像度映像復号装置100の構成を示すブロック図である。図において、マルチ解像度映像復号装置100は、マルチ解像度映像符号化データ入力部101、符号化データメモリ102、注視領域入力部103、主解像度設定部104、操作予測部105、副解像度設定部106、周辺領域設定部107、復号対象設定部108、優先順位設定部109、分割映像復号部110、映像拡大部111、及びデブロッキング処理部112を備えている。
マルチ解像度映像符号化データ入力部101は、復号対象となるマルチ解像度映像を空間的に分割して符号化したデータを入力する。符号化データメモリ102は、入力された符号化データを蓄積する。注視領域入力部103は、ユーザの注視領域を入力する。主解像度設定部104は、注視領域に対する復号解像度を設定する。操作予測部105は、ユーザの操作を予測する。副解像度設定部106は、注視領域以外の復号解像度を設定する。
周辺領域設定部107は、副解像度において周辺領域に対応する領域を設定する。復号対象設定部108は、復号する分割映像を決定する。優先順位設定部109は、復号対象の分割映像に優先順位を設定する。分割映像復号部110は、優先順位に従って符号化データから分割映像を復号する。映像拡大部111は、周辺領域に対して復号された映像をアップサンプルする。デブロッキング処理部112は、注視領域と周辺領域との境界領域に対してフィルタ処理を加える。
図2は、本実施形態によるマルチ解像度映像復号装置100の動作を説明するフローチャートである。このフローチャートに従って、マルチ解像度映像復号装置100が実行する処理について詳細に説明する。
まず、マルチ解像度映像符号化データ入力部101により、マルチ解像度映像を空間的に分割して符号化したデータが入力され、符号化データメモリ102に蓄積される(ステップSa1)。次に、注視領域入力部103によりユーザの注視領域を設定し(ステップSa2)、主解像度設定部104により注視領域を復号する主解像度を設定する(ステップSa3)。主解像度は、ユーザの指示に従って決定されても構わないし、注視領域の大きさと表示領域の物理解像度とから計算して求めても構わない。
そして、指定された注視領域の情報を用いて操作予測部105において、ユーザの操作を予測する(ステップSa4)。予測の方法としては、例えば、注視領域の中心位置を蓄積しておき、該注視領域の中心位置の直前からの変化を予測結果とする方法がある。なお、前回からの変化がない場合に、ユーザの操作を停止と予測しても構わないし、その前の変化をそのまま予測結果としても構わない。本実施形態では、直前から変化がなかった場合には、その前の変化を予測結果とするものとし、中心位置の移動ベクトルと主解像度の変化とを予測結果とするものとする。
その他の操作方法として、中心位置の直前からの変化ではなく数フレーム前からの変化を予測結果してもよい。また、ある時刻の注視領域の中心位置から現在の注視領域の中心位置への変位ベクトルではなく、数フレーム間の注視領域の中心位置の変化から動き及び加速度のモデルを生成し、そのモデルに従って次のフレームもしくは数フレーム後の注視領域の中心位置を予測し、現在の中止領域の中心位置から予測された位置への変位ベクトルを予測結果としてもよい。更に複雑な方法として、注視領域の履歴だけでなく、その注視領域に含まれる映像コンテンツを利用した操作予測を行ってもよい。例えば、注視領域に含まれる被写体を判定し、特定の被写体に追従している場合は、その被写体の動きを予測し、次フレームにおけるその被写体の位置が中心に繰るような操作を予測結果としても構わない。
ここでは、ユーザの操作のうち注視領域の位置の変化のみを予測する場合を説明したが、拡大・縮小による解像度の変化を含めて予測しても構わない。その場合、それぞれを別の情報として扱っても構わないし、X軸を左右方向の位置の変化、Y軸を上下方向の位置の変化、Z軸を解像度の変化として表す三次元ベクトルを用いて、どの部分を中心に拡大・縮小すると予測できるかを示す形で予測結果を返しても構わない。
次に、副解像度設定部106において、注視領域以外の領域において復号する分割映像の解像度を設定する(ステップSa5)。どのような決定方法を用いても構わないが、最も単純な方法としては、常に主解像度よりも1段階だけ小さな解像度を設定する方法である。その他の方法としては、移動ベクトルの大きさに応じて変化させる方法もある。この場合、ベクトルが大きい場合に、より小さな解像度を設定する方法や、逆にベクトルが小さすぎる場合や、カメラを引く操作の場合に、より小さな解像度を設定する方法がある。前者の場合には、ユーザ操作による変化が大きいと予想されるので、それをカバーできるように、より小さな解像度で広範囲を復号できるようにする意味がある。後者の場合には、どの向きに並行移動するか確信できないので、全方位に対して復号を可能にする意味がある。
なお、ユーザの操作の予測として解像度の変化も取り扱う場合、予測結果が拡大や縮小の場合に、予測される解像度を副解像度としても構わないし、拡大・縮小の予測とは関係なく副解像度を決定しても構わない。
副解像度が設定されたら、周辺領域設定部107により、その副解像度において、注視領域の周辺に位置する周辺領域を設定する(ステップSa6)。周辺領域を設定する方法として、注視領域が副解像度において対応する領域に隣接する画素群を周辺画素として設定する方法と、主解像度における注視領域に隣接する画素群を求め、その画素群の副解像度における対応画素群を周辺画素に設定する方法とがある。なお、注視領域が矩形で与えられる場合には、矩形の4頂点に対して副解像度における隣接画素を求め、その頂点を繋ぐ直線を周辺画素とすることが可能である。
主解像度における注視領域の最も外側の画素と、その画素に対して1画素だけ隣の駐英領域には含まれない画素とが、副解像度において同じ画素に対応する場合がある。そのような場合に、注視領域が副解像度において対応する領域を求め、その領域に隣接する画素群を周辺画素とすると、その周辺画素は主解像度において注視領域に隣接しないことになる。このような事態を避けるために、本実施形態では、主解像度において注視領域に隣接する画素群を求め、その画素群が副解像度において対応する画素群を周辺画素とする。
なお、副解像度として主解像度より大きな解像度が設定されている場合、注視領域が副解像度において対応する位置を周辺領域として設定することで、拡大処理を予測に含む場合においても適切な領域を設定することが可能である。
主解像度、副解像度、注視領域、周辺領域が得られた後、復号対象設定部108において、復号対象の分割映像を設定する(ステップSa7)。具体的には、注視領域の画素を含む主解像度における分割映像と、周辺領域の画素を含む副解像度における分割映像とが復号対象の分割映像として設定される。
なお、ある解像度において、1つの画素に対して複数の分割映像が対応する場合には、復号対象となる分割映像数が少なくなるように、分割映像を選択することで、計算資源を節約することが可能である。そのような分割映像群を設定する方法としては、様々なアルゴリズムを用いることが可能であるが、例えば、まず全ての注視(周辺)領域の画素を未カバー集合に設定し、未カバー集合の画素を最も多く含む分割映像を復号対象として設定し、復号対象として設定された分割映像に含まれる画素を未カバー集合から取り除き、未カバー集合が空集合になるまで分割映像の選択を繰り返すというものがある。この方法は、最適性を保証するものではないが、単純な決定手法であるため高速に準最適な集合を求めることが可能である。
復号対象の分割映像の設定が終了したら、操作予測部105で予測された予測ユーザ操作の情報を用いて、優先順位設定部109で、復号対象の分割映像に対して優先順位が設定される(ステップSa8)。優先順位としては、まず、主解像度の分割映像が最も高い優先度となり、副解像度の分割映像については、ユーザ操作で次に選択される可能性の高い方向に対応する分割映像から順に高い優先順位が付けられる。
図3は、本実施形態による、優先順位設定部109での優先順位の付け方を説明するための概念図である。例えば、図3に示すように、周辺領域を上下左右の4グループとして設定し、そのグループ毎に優先順位を設定する。すなわち、予測される予測ユーザ操作が上下左右の場合には、ユーザ操作の方向(ベクトル:図示の矢印)に、最も高い優先順位「1」を設定し、その横方向に優先順位「2」を設定し、その後方に優先順位「4」を設定する。また、予測される予測ユーザ操作が斜め場合には、ユーザ操作の方向(ベクトル:図示の矢印)に、優先順位「1」、「2」を設定し、その後方に優先順位「3」、「4」を設定する。また、予測ユーザ操作が停止(縮小/拡大)の場合には、周辺に優先順位「1」を設定する。
図4は、本実施形態による、優先順位の付け方を説明するためのフローチャートである。最初に、ユーザ操作の予測結果の予測ユーザ操作ベクトルにおけるx成分(横方向)の絶対値とy成分(縦方向)の絶対値とを比較する(ステップSb1)。x成分が大きければ、x成分の正負を判定し(ステップSb2)、正ならば、右グループの優先度を「1」、左グループの優先度を「4」とし(ステップSb3)、負ならば、右グループの優先度を「4」、左グループの優先度を「1」とし(ステップSb4)、0ならば、全てのグループの優先度を「1」として終了する(ステップSb5)。
次に、y成分の正負を判定し(ステップSb6)、正ならば、上グループの優先度を「3」、下グループの優先度を「2」とし(ステップSb7)、負ならば、上グループの優先度を「2」、下グループの優先度を「3」とし(ステップSb8)、0ならば、上下グループともに優先度を「2」として終了する(ステップSb9)。
一方、最初の比較でy成分が大きければ(ステップSb1のNO)、y成分の正負を判定し(ステップSb10)、正ならば、上グループの優先度を「4」、下グループの優先度を「1」とし(ステップSb11)、負ならば、上グループの優先度を「1」、下グループの優先度を「4」とする(ステップSb12)。
次に、x成分の正負を判定し(ステップSb13)、正ならば、右グループの優先度を「2」、左グループの優先度を「3」とし(ステップSb14)、負ならば、右グループの優先度を「3」、左グループの優先度を「2」とし(ステップSb15)、0ならば、左右グループともに優先度を「2」として終了する(ステップSb16)。
なお、この例では、座標軸が水平右方向にx軸、鉛直下方向にy軸と設定されているものとする。また、優先度は、数字が小さいほど高いものとする。そのため、この例では、主解像度の分割映像に対しては、優先度「0」が割り当てられているものとする。複数のグループに所属する4隅の分割映像については、設定された優先順位のうち、高いほうを用いる。
図5は、本実施形態による、優先順位設定部109での優先順位の別の付け方を説明するための概念図である。図5に示すように、分割映像毎に細かく優先順位を設定しても構わない。但し、順位付けのルールが複雑になるため、そのための演算負荷が高くなることになる。
なお、ユーザの予測操作として拡大処理が想定され、副解像度として主解像度よりも大きな解像度が設定されている場合は、拡大中心に近い領域から順に高い優先度を付けることで、ユーザ操作で次に必要になる可能性が高い順に順位付けを行うことができる。
次に、図2に説明を戻すと、復号対象の分割映像に対して優先順位が決定したら、分割映像復号部110で、優先順位に従って符号化データから分割映像を復号する(ステップSa9)。予め定められた個数の分割映像を復号するようにしても構わないし、予め定められた時間が経過するまで順番に復号を行っても構わない。なお、分割映像復号部110は、マルチ解像度映像符号化データを復号できる処理を実現するものであれば、どのようなものでも構わない。例えば、各分割映像がH.264/AVCで符号化されているのであれば、H.264/AVCの復号処理を行う任意のものを用いることができる。
一般に、実時間で映像を表示しようとする場合、復号処理にかけられる時間が限られるため、復号可能な分割映像の数が制限される。本実施形態によれば、ユーザが次の表示が行われるまでに選択しそうな領域を優先的に復号することで、実時間表示を行うシステムにおいても、ユーザの不快感増加を防止できる可能性を高めることができる。
復号終了後、映像拡大部111において、周辺領域に対して復号された分割映像を主解像度と同じ解像度になるようにアップサンプルする(ステップSa10)。次に、得られた分割映像を張り合わせて1つのフレームを生成する(ステップSa11)。このとき、主解像度で復号した分割映像と副解像度で復号した分割映像との間に重複する領域がある場合には、主解像度で復号した分割映像を使用する。そして、注視領域と周辺領域との境界の位置する画素群に対して、デブロッキング処理部112でデブロッキングフィルタを施し(ステップSa12)、その結果がマルチ解像度映像復号装置100の出力となる(ステップSa13)。
なお、副解像度が主解像度よりも解像度が大きい場合、注視領域に対して復号された分割映像を副解像度と同じ解像度になるようにアップサンプルする。また、分割映像を張り合わせる際も、重複部分では副解像度で復号した分割映像を使用する。このように、副解像度と主解像度の大きさによって処理が逆転してしまうため、ステップSa10の前に、主解像度と副解像度とを入れ替え、注視領域と周辺領域とを入れ替えても構わない。この場合、処理の分岐が少なくなるため、回路の規模を小さくすることができる。
図6は、本実施形態による、デブロッキングフィルタを説明する概念図である。本実施形態でいうデブロッキングフィルタとは、図6に示すように、境界領域の画素に対して、その境界をぼかすローパスフィルタを施すことである。図6では、常に境界線に対して90度方向にフィルタを施しているが、境界領域付近の映像のエッジを検出して、エッジと同じ向きにフィルタを施しても構わない。また、境界における輝度値の変化に応じてフィルタ係数を調整しても構わない。
異なる解像度から得られた映像では、それぞれの映像が持つ映像の周波数成分が異なる。そのため、それらを並べた場合、その境界において本来の映像には存在しないブロック境界が発生する。しかしながら、本実施形態によれば、境界領域に対してデブロッキング処理を加えて、境界領域における映像の品質を滑らかにすることでブロック境界を目立たなくすることができる。これによって出力される映像の主観品質が低下してしまうことを防ぐことが可能となる。
図7は、本実施形態による、副解像度設定部106において周辺領域毎に異なる副解像度を割り当てる処理を説明するフローチャートである。本実施形態では、副解像度を1つだけ決定したが、予測ユーザ操作の結果を用いて、方向毎に別の解像度を設定しても構わない。
まず、予測ユーザ操作ベクトルの大きさを求め(ステップSc1)、その大きさに従って最大副解像度max_sub_resを設定する(ステップSc2〜Sc6)。ここでは、まず、ベクトルの大きいが第1の閾値より大きいかどうかを調べ(ステップSc2)、第1の閾値を超えている場合には、移動範囲が広く、出来るだけ広範囲の周辺領域を復号すべきと考え、最大副解像度にmax_sub_res_minを設定する(ステップSc3)。
また、第1の閾値よりも小さい場合には、第2の閾値よりもベクトルのサイズが小さいかどうかを調べる(ステップSc4)。ベクトルのサイズが第2の閾値よりも小さい場合には、ユーザ操作が変化する可能性が高いと考えられ、全方位の周辺領域を復号可能とするために、最大副解像度にmax_sub_res_midを設定する(ステップSc6)。また、ベクトルのサイズが2つの閾値の間になる場合には、最大副解像度にmax_sub_res_normalを設定する(ステップSc5)。なお、各解像度には、どのような値を設定しても構わないが、次式(1)の不等式を満たすように設定するのが一般的である。
Figure 2011176570
ここで、main_resは、主解像度を示す。
次に、得られた最大副解像度に対して、2段階の副解像度sub_res_1とsub_res_2とを設定する(ステップSc7)。このとき、各副解像度は、次式(2)の不等式を満たす。
Figure 2011176570
ここで、min_resは、マルチ解像度映像中の最低解像度を示す。
そして、予測ユーザ操作ベクトルの各成分の正負に従って、各方向の副解像度を設定する(ステップSc8〜Sc15)。x成分が正であれば、右方向にsub_res_1を設定し、左方向にsub_res_2を設定し(ステップSc9)、負であれば、右方向にsub_res_2を設定し、左方向にsub_res_1を設定し(ステップSc10)、ゼロであれば、左右方向共にsub_res_1を設定する(ステップSc11)。
次に、y成分が正であれば、下方向にsub_res_1を設定し、上方向にsub_res_2を設定し(ステップSc13)、負であれば、下方向にsub_res_2を設定し、上方向にsub_res_1を設定し(ステップSc14)、ゼロであれば、上下方向共にsub_res_1を設定する(ステップSc15)。
上述した実施形態によれば、指定解像度よりも低い解像度で注視領域の周辺領域に対する部分映像を復号し、その低解像度の映像を指定解像度へアップサンプリングして用いることによって、演算負荷の増加を抑えながら、大幅な領域変更にも対応した復号処理を実現することが可能となる。
以上説明した処理は、コンピュータとソフトウェアプログラムとによっても実現することができ、そのプログラムをコンピュータ読み取り可能な記録媒体に記録して提供することも、ネットワークを通して提供することも可能である。
また、以上の実施形態では、マルチ解像度映像復号装置を中心に説明したが、これらマルチ解像度映像復号装置の各部の動作に対応したステップによって本発明のマルチ解像度映像復号方法を実現することができる。
以上、図面を参照して本発明の実施の形態を説明してきたが、上記実施の形態は、本発明の例示に過ぎず、本発明が上記実施の形態に限定されるものでないことは明らかである。したがって、本発明の精神及び範囲を逸脱しない範囲で構成要素の追加、省略、置換、その他の変更を行っても良い。
100 マルチ解像度映像復号装置
101 マルチ解像度映像符号化データ入力部
102 符号化データメモリ
103 注視領域入力部
104 主解像度設定部
105 操作予測部
106 副解像度設定部
107 周辺領域設定部
108 復号対象設定部
109 優先順位設定部
110分割映像復号部
111 映像拡大部
112 デブロッキング処理部

Claims (10)

  1. 同一のシーンを複数の解像度で表現したマルチ解像度映像を空間的に分割して符号化したデータを復号するマルチ解像度映像復号方法であって、
    ユーザの注視領域を設定する注視領域設定ステップと、
    前記注視領域を復号する主解像度を設定する主解像度設定ステップと、
    ユーザの操作履歴からユーザ操作を予測する操作予測ステップと、
    前記主解像度よりも低い解像度で、前記注視領域の周辺領域を復号する副解像度を設定する副解像度設定ステップと、
    前記副解像度に基づいて、前記注視領域の周辺に位置する周辺領域を設定する周辺領域設定ステップと、
    前記注視領域を含む分割映像と前記周辺領域を含む分割映像とを、復号対象の分割映像として設定する復号対象設定ステップと、
    前記復号対象に指定された分割映像を復号する分割映像復号ステップと、
    前記副解像度で復号された分割映像をアップサンプルする映像拡大ステップと
    を含むことを特徴とするマルチ解像度映像復号方法。
  2. 前記予測されるユーザ操作に基づいて、前記復号対象の分割映像に優先順位を設定する優先順位設定ステップをさらに含み、
    前記分割映像復号ステップは、前記優先順位に基づいて、前記復号対象に指定された分割映像を復号することを特徴とする請求項1に記載のマルチ解像度映像復号方法。
  3. 前記操作予測ステップは、
    前記注視領域の中心位置を蓄積しておき、蓄積された中心位置からユーザの操作をモデル化し、そのモデルに従って予測を行うことを特徴とする請求項1または2に記載のマルチ解像度映像復号方法。
  4. 前記副解像度設定ステップは、
    前記操作予測ステップで予測されたユーザ操作における注視領域の移動量に基づいて副解像度を設定することを特徴とする請求項1または2に記載のマルチ解像度映像復号方法。
  5. 前記復号された注視領域を含む分割映像と前記アップサンプルされた周辺領域を含む分割映像との境界部分に対して、デブロッキングフィルタ処理を加える境界フィルタ処理ステップを更に含むことを特徴とする請求項1から4のいずれかに記載のマルチ解像度映像復号方法。
  6. 同一のシーンを複数の解像度で表現したマルチ解像度映像を空間的に分割して符号化したデータを復号するマルチ解像度映像復号装置であって、
    ユーザの注視領域を設定する注視領域設定手段と、
    前記注視領域設定手段により設定されたユーザの注視領域を復号する主解像度を設定する主解像度設定手段と、
    ユーザの操作履歴からユーザ操作を予測する操作予測手段と、
    前記主解像度よりも低い解像度で、前記注視領域の周辺領域を復号する副解像度を設定する副解像度設定手段と、
    前記副解像度設定手段により設定された副解像度に基づいて、前記注視領域の周辺に位置する周辺領域を設定する周辺領域設定手段と、
    前記注視領域を含む分割映像と前記周辺領域を含む分割映像とを、復号対象の分割映像として設定する復号対象設定手段と、
    前記操作予測手段により予測されるユーザ操作に基づいて、前記復号対象の分割映像に優先順位を設定する優先順位設定手段と、
    前記優先順位設定手段により設定された優先順位に基づいて、前記復号対象に指定された分割映像を復号する分割映像復号手段と、
    前記分割映像復号手段により副解像度で復号された分割映像をアップサンプルする映像拡大手段と
    を備えることを特徴とするマルチ解像度映像復号装置。
  7. 前記操作予測手段は、
    前記注視領域の中心位置を蓄積しておき、蓄積された中心位置からユーザの操作をモデル化し、そのモデルに従って予測を行うことを特徴とする請求項6に記載のマルチ解像度映像復号装置。
  8. 前記副解像度設定手段は、
    前記操作予測ステップで予測されたユーザ操作における注視領域の移動量に基づいて副解像度を設定することを特徴とする請求項6に記載のマルチ解像度映像復号装置。
  9. 前記分割映像復号手段により復号された、前記注視領域を含む分割映像と前記アップサンプルされた周辺領域を含む分割映像との境界部分に対して、デブロッキングフィルタ処理を加える境界フィルタ処理手段を更に含むことを特徴とする請求項6から8のいずれかに記載のマルチ解像度映像復号装置。
  10. 同一のシーンを複数の解像度で表現したマルチ解像度映像を空間的に分割して符号化したデータを復号するマルチ解像度映像復号装置のコンピュータに、
    ユーザの注視領域を設定する注視領域設定機能、
    前記注視領域を復号する主解像度を設定する主解像度設定機能、
    ユーザの操作履歴からユーザ操作を予測する操作予測機能、
    前記主解像度よりも低い解像度で、前記注視領域の周辺領域を復号する副解像度を設定する副解像度設定機能、
    前記副解像度に基づいて、前記注視領域の周辺に位置する周辺領域を設定する周辺領域設定機能、
    前記注視領域を含む分割映像と前記周辺領域を含む分割映像とを、復号対象の分割映像として設定する復号対象設定機能、
    前記予測されるユーザ操作に基づいて、前記復号対象の分割映像に優先順位を設定する優先順位設定機能、
    前記優先順位に基づいて、前記復号対象に指定された分割映像を復号する分割映像復号機能、
    前記副解像度で復号された分割映像をアップサンプルする映像拡大機能
    を実行することを特徴とするプログラム。
JP2010038678A 2010-02-24 2010-02-24 マルチ解像度映像復号方法、マルチ解像度映像復号装置、及びプログラム Active JP5355449B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010038678A JP5355449B2 (ja) 2010-02-24 2010-02-24 マルチ解像度映像復号方法、マルチ解像度映像復号装置、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010038678A JP5355449B2 (ja) 2010-02-24 2010-02-24 マルチ解像度映像復号方法、マルチ解像度映像復号装置、及びプログラム

Publications (2)

Publication Number Publication Date
JP2011176570A true JP2011176570A (ja) 2011-09-08
JP5355449B2 JP5355449B2 (ja) 2013-11-27

Family

ID=44689027

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010038678A Active JP5355449B2 (ja) 2010-02-24 2010-02-24 マルチ解像度映像復号方法、マルチ解像度映像復号装置、及びプログラム

Country Status (1)

Country Link
JP (1) JP5355449B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015005024A1 (ja) * 2013-07-09 2015-01-15 ソニー株式会社 画像処理装置及び画像処理方法
KR101906066B1 (ko) * 2017-07-31 2018-10-08 서울과학기술대학교 산학협력단 다중 시점 영상의 송신 방법 및 장치
CN110121885A (zh) * 2016-12-29 2019-08-13 索尼互动娱乐股份有限公司 用于利用注视跟踪的vr、低等待时间无线hmd视频流传输的有凹视频链接
CN110572654A (zh) * 2019-09-27 2019-12-13 腾讯科技(深圳)有限公司 视频编码、解码方法和装置、存储介质及电子装置
CN110809889A (zh) * 2018-06-04 2020-02-18 京东方科技集团股份有限公司 处理具有减小的传输带宽的图像数据的方法和显示设备
WO2023047515A1 (ja) * 2021-09-24 2023-03-30 富士通株式会社 符号化装置、復号装置、符号化方法、復号方法、符号化プログラム及び復号プログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004046583A (ja) * 2002-07-12 2004-02-12 Ricoh Co Ltd 画像処理装置、方法、プログラムおよび記録媒体
JP2005012619A (ja) * 2003-06-20 2005-01-13 Mitsubishi Electric Corp パノラマ画像生成装置
JP2006099404A (ja) * 2004-09-29 2006-04-13 Sanyo Electric Co Ltd 画像表示装置
JP2009189541A (ja) * 2008-02-14 2009-08-27 Fujifilm Corp 読影支援装置及び方法、並びに医用ネットワークシステム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004046583A (ja) * 2002-07-12 2004-02-12 Ricoh Co Ltd 画像処理装置、方法、プログラムおよび記録媒体
JP2005012619A (ja) * 2003-06-20 2005-01-13 Mitsubishi Electric Corp パノラマ画像生成装置
JP2006099404A (ja) * 2004-09-29 2006-04-13 Sanyo Electric Co Ltd 画像表示装置
JP2009189541A (ja) * 2008-02-14 2009-08-27 Fujifilm Corp 読影支援装置及び方法、並びに医用ネットワークシステム

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015005024A1 (ja) * 2013-07-09 2015-01-15 ソニー株式会社 画像処理装置及び画像処理方法
CN110121885A (zh) * 2016-12-29 2019-08-13 索尼互动娱乐股份有限公司 用于利用注视跟踪的vr、低等待时间无线hmd视频流传输的有凹视频链接
CN110121885B (zh) * 2016-12-29 2023-07-25 索尼互动娱乐股份有限公司 用于利用注视跟踪的vr、低等待时间无线hmd视频流传输的有凹视频链接
KR101906066B1 (ko) * 2017-07-31 2018-10-08 서울과학기술대학교 산학협력단 다중 시점 영상의 송신 방법 및 장치
CN110809889A (zh) * 2018-06-04 2020-02-18 京东方科技集团股份有限公司 处理具有减小的传输带宽的图像数据的方法和显示设备
CN110809889B (zh) * 2018-06-04 2022-01-18 京东方科技集团股份有限公司 处理具有减小的传输带宽的图像数据的方法和显示设备
US11295709B2 (en) 2018-06-04 2022-04-05 Beijing Boe Optoelectronics Technology Co., Ltd. Method for processing image data with reduced transmission bandwidth for display
CN110572654A (zh) * 2019-09-27 2019-12-13 腾讯科技(深圳)有限公司 视频编码、解码方法和装置、存储介质及电子装置
CN110572654B (zh) * 2019-09-27 2024-03-15 腾讯科技(深圳)有限公司 视频编码、解码方法和装置、存储介质及电子装置
WO2023047515A1 (ja) * 2021-09-24 2023-03-30 富士通株式会社 符号化装置、復号装置、符号化方法、復号方法、符号化プログラム及び復号プログラム

Also Published As

Publication number Publication date
JP5355449B2 (ja) 2013-11-27

Similar Documents

Publication Publication Date Title
JP5355449B2 (ja) マルチ解像度映像復号方法、マルチ解像度映像復号装置、及びプログラム
CN109983757B (zh) 全景视频回放期间的视图相关操作
JP4455364B2 (ja) 解像度変換方法及び装置
KR101557327B1 (ko) 동영상 데이터 생성장치, 동영상 표시장치, 동영상 데이터 생성방법, 동영상 표시방법, 및 동영상 파일의 데이터 구조
JP4987688B2 (ja) 画像高解像度化方法および装置
CN104620581A (zh) 分层时间层级中的基于时间的和/或多维信号的解码和重构
CN101640759B (zh) 图像处理设备和图像处理方法
CN102742260A (zh) 通用平台视频图像稳定化
EP4300985A2 (en) Adaptive panoramic video streaming using composite pictures
CN116647655A (zh) 重新投影全景视频图片的平板投影以通过应用进行渲染
WO2020108091A1 (zh) 视频处理方法、装置、电子设备及存储介质
CN111161660A (zh) 数据处理***
CN104067310A (zh) 显示图像的改进
JP4063306B1 (ja) 画像処理装置、画像処理方法、及びプログラム
EP3525469A1 (en) Time slice image provision server, method and user terminal
CN103702032A (zh) 图像处理方法、装置和终端设备
US20090079836A1 (en) Image processing apparatus, method, and computer program product
CN107945101A (zh) 图像处理方法和装置
CN113660486A (zh) 图像编码、解码、重建、分析方法、***及电子设备
JP2012249145A (ja) 画像処理装置、画像処理方法及びプログラム
WO2013183223A1 (en) Information processor, information processing method, program, and image display device
JP4810088B2 (ja) 画像処理装置、画像処理方法及びそのプログラム
JP6952456B2 (ja) 情報処理装置、制御方法、及びプログラム
KR101751807B1 (ko) 이미지 처리 방법 및 그 시스템
JP4552691B2 (ja) 動画像変換装置、動画像復元装置、および方法、並びにコンピュータ・プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130111

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130528

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130604

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20130605

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20130724

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130805

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130820

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130827

R150 Certificate of patent or registration of utility model

Ref document number: 5355449

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350