JP2014523660A - スケール非依存マップ - Google Patents

スケール非依存マップ Download PDF

Info

Publication number
JP2014523660A
JP2014523660A JP2014512827A JP2014512827A JP2014523660A JP 2014523660 A JP2014523660 A JP 2014523660A JP 2014512827 A JP2014512827 A JP 2014512827A JP 2014512827 A JP2014512827 A JP 2014512827A JP 2014523660 A JP2014523660 A JP 2014523660A
Authority
JP
Japan
Prior art keywords
resolution
specific
region
attribute
pixels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014512827A
Other languages
English (en)
Other versions
JP2014523660A5 (ja
JP6005731B2 (ja
Inventor
ギブンス レッドマン ウィリアム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2014523660A publication Critical patent/JP2014523660A/ja
Publication of JP2014523660A5 publication Critical patent/JP2014523660A5/ja
Application granted granted Critical
Publication of JP6005731B2 publication Critical patent/JP6005731B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering
    • G06T15/04Texture mapping
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/128Adjusting depth or disparity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/139Format conversion, e.g. of frame-rate or size

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Graphics (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Television Systems (AREA)
  • Controls And Circuits For Display Device (AREA)
  • Image Processing (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

さまざまな実装が、解像度不変領域に関する解像度に固有の属性を提供する。いくつかの実装は、スケール不変セルに関するSCMに基づく視差値を提供する。特定の実装は、そのような属性を含む信号または構造を提供する。さらなる実装は、そのような属性にアクセスし、属性を処理する。1つの特定の実装は、ピクチャの領域に関する属性にアクセスする。領域は、特定の解像度において第1の整数個のピクセルと同一の広がりを持ち、第2の解像度において第2の整数個のピクセルと同一の広がりを持つ。属性は、領域に固有であり、特定の解像度と第2の解像度との組み合わせとして決定される組み合わせ解像度に固有である。属性は、特定の解像度に固有の属性をもたらすように変換される。変換された属性は、第1の整数個のピクセルに関連付けられる。その他の実装は、視差情報を使用する、例えば、字幕の配置などの後処理動作で、変換された属性を使用する。

Description

ディジタルピクチャに関する情報を提供することに関連する実装(implementation)が、説明される。さまざまな特定の実装は、ビデオ画像に関する視差(disparity)マップに関する。
関連出願の相互参照
本出願(application)は、以下の米国特許仮出願、すなわち、(i)2011年5月26日に出願された「Scale Independent Disparity Map」と題された第61/490,179号明細書、および(ii)2011年9月27日に出願された「Scale−Independent Maps」と題された第61/626,496号明細書の出願日の利益を主張するものであり、これらの両方は、あらゆる目的でそれらの全体が参照により本明細書に組み込まれている。
2眼式立体ビデオは、左ビデオ画像および右ビデオ画像を含む2つのビデオ画像を提供する。これら2つのビデオ画像に関して、デプスおよび/または視差情報も提供され得る。デプスおよび/または視差情報は、2つのビデオ画像に対するさまざまな処理動作のために使用される可能性がある。
包括的な態様によると、ピクチャの領域に対して属性が決定される。ピクチャは、特定の解像度を有し、属性は、特定の解像度および領域に固有である。ピクチャの領域は、特定の解像度において第1の整数個のピクセルと同一の広がりを持ち、第2の解像度において第2の整数個のピクセルと同一の広がりを持つ。属性は、領域に固有であり、特定の解像度と第2の解像度との組み合わせとして決定される組み合わせ解像度(combination resolution)に固有である属性をもたらすように変換される。
別の包括的な態様によると、信号または構造が属性部分を含む。属性部分は、ピクチャの領域に関する属性を示すデータを含む。属性は、領域および組み合わせ解像度に固有である。組み合わせ解像度は、特定の解像度と第2の解像度との組み合わせとして決定される。ピクチャの領域は、特定の解像度において第1の整数個のピクセルと同一の広がりを持ち、第2の解像度において第2の整数個のピクセルと同一の広がりを持つ。
別の包括的な態様によると、ピクチャの領域に関して、属性がアクセスされる。ピクチャの領域は、特定の解像度において第1の整数個のピクセルと同一の広がりを持ち、第2の解像度において第2の整数個のピクセルと同一の広がりを持つ。属性は、領域に固有であり、特定の解像度と第2の解像度との組み合わせとして決定される組み合わせ解像度に固有である。属性は、領域および特定の解像度に固有の属性をもたらすように変換される。変換された属性は、特定の解像度の第1の整数個のピクセルに関連付けられる。
1または複数の実装の詳細が、添付の図面、および以下の説明で示される。1つの特定の方法で示されたとしても、実装がさまざまな方法で構成または具現化され得ることは明らかであるに違いない。例えば、実装は、方法として実行されるか、または、例えば、一組の動作を実行するように構成された装置、もしくは一組の動作を実行するための命令を記憶する装置などの装置として具現化されるか、または信号で具現化される可能性がある。その他の態様および特徴は、以下の詳細な説明を添付の図面および請求項とあわせて考察することから明らかとなるであろう。
平行なカメラの実際のデプス値の図形表現の図である。 視差値の図形表現の図である。 見かけのデプス(apparent depth)と視差との間の関係の図形表現の図である。 輻湊するカメラの図形表現の図である。 2眼式立体ビデオ画像のペアにおける隠蔽の図形表現の図である。 異なるネイティブフォーマットおよび送信フォーマットを有する実装を示すブロック/フロー図である。 視差値の公倍数表現の一例の表形式の図である。 視差値の公倍数表現の送信および使用のためのプロセスの一例を示すブロック/フロー図である。 異なる解像度のピクセルのいくつかの例のブロック/図形表現の図である。 異なる解像度に関するピクセルグリッドの2つの例のブロック/図形表現の図である。 図10のピクセルグリッドの例のうちの1番目の分離したブロック/図形表現の図である。 図10のピクセルグリッドの例のうちの2番目の分離したブロック/図形表現の図である。 異なる解像度に関するピクセルグリッドの3つのさらなる例のブロック/図形表現の図である。 図13のピクセルグリッドの例のうちの1番目の分離したブロック/図形表現の図である。 図13のピクセルグリッドの例のうちの2番目の分離したブロック/図形表現の図である。 図13のピクセルグリッドの例のうちの3番目の分離したブロック/図形表現の図である。 スケール非依存視差マップ値を処理する一例を示すブロック/フロー図である。 解像度不変領域(resolution−invariant region)に関する解像度に固有の属性を処理する一例を示すブロック/フロー図である。 解像度不変領域に関する解像度に固有の属性を処理する別の例を示すブロック/フロー図である。 1または複数の実装で使用され得る送信システムの一例を示すブロック/フロー図である。 1または複数の実装で使用され得る受信システムの一例を示すブロック/フロー図である。
本出願で示される特徴の一部の事前確認として、少なくとも1つの実装が、対応するセル(複数のピクセル)にそれぞれが当てはまる(apply)1または複数の視差値を与える視差マップの使用を説明する。実際の視差値は、任意の標準的なディスプレイの最大の解像度よりもずっと大きく、非標準解像度と呼ばれる解像度に基づく。本出願において、用語「解像度」は、概して水平解像度を指すが、垂直解像度および/または水平解像度と垂直解像度との両方を指すためにも使用され、例えば、ディスプレイのピクセル数、またはディスプレイのピクセルのブロック数、またはディジタル画像の要素数で計測される。非標準解像度は、いくつかの標準的なディスプレイ解像度のうちの1つまたは複数に容易に変換される整数である。この特定の実装において、有効ディスプレイ解像度は、いくつかの標準的なディスプレイ解像度の最小公倍数である。有効ディスプレイ解像度に対する視差値は、整数フォーマットで表される。視差値は、大きな非ディスプレイ解像度(non−display resolution)に基づいている結果として、潜在的に大きい。さらに、整数表現は、視差値が標準的なディスプレイ解像度にダウンコンバートされるときにサブピクセルの精度をもたらす。加えて、セルのサイズおよび位置は、2つ以上の解像度の整数個のピクセルと同一の広がりを持つ。実際の整数は、異なる解像度において異なる。このサイズおよび位置、ならびにセル全体に対する単一の視差値の使用は、解像度が変更されるときにセルの視差値が同じままであることを可能にする。しかし、視差値は、異なる解像度においてはさまざまな数のピクセルに関連付けられる。
上記事前確認から離れて、図1は、ビデオ画像におけるデプスの概念を示す。図1は、センサー107を有する右カメラ105と、センサー112を有する左カメラ110とを示す。両方のカメラ105、110は、物体115の画像を撮影している。例示を目的として、物体115は物理的な十字であり、十字の右側に位置する任意の詳細116を有する(図2参照)。右カメラ105は、撮影角120を有し、左カメラ110は、撮影角125を有する。2つの撮影角120、125は、3Dステレオ領域(3D stereo area)130において重なる。
物体115は、3Dステレオ領域130内にあるので、両方のカメラ105、110に見えており、したがって、デプスを有すると知覚され得る。物体115は、実際のデプス135を有する。実際のデプス135は、概して、物体115からカメラ105、110までの距離と呼ばれる。より詳細には、実際のデプス135は、物体115から、両方のカメラ105、110の入射瞳平面によって画定される平面であるステレオカメラベースライン(stereo camera baseline)140までの距離と呼ばれる可能性がある。カメラの入射瞳平面は、通常、ズームレンズの中にあり、したがって、通常、物理的にアクセスできない。
また、カメラ105、110は、焦点距離145を有するように示されている。焦点距離145は、射出瞳平面からセンサー107、112までの距離である。例示を目的として、ほとんどの場合、入射瞳平面および射出瞳平面がわずかに離れているとき、それらは一致するものとして示されている。加えて、カメラ105、110は、ベースライン長(baseline length)150を有するものとして示されている。ベースライン長150は、カメラ105、110の入射瞳の中心の間の距離であり、したがって、ステレオカメラベースライン140において計測される。
物体115は、カメラ105および110のそれぞれによって、センサー107および112のそれぞれの上の実像(real image)として撮像される。これらの実像は、センサー107上の詳細116の実像117と、センサー112上の詳細116の実像118とを含む。図1に示されるように、実像は、当技術分野で知られているように反転されている。
デプスは、視差と緊密に関連している。図2は、カメラ110から撮影された左画像205と、カメラ105から撮影された右画像210とを示す。両方の画像205、210は、詳細116を有する物体115の表現を含む。画像210は、詳細116の詳細画像217を含み、画像205は、詳細116の詳細画像218を含む。詳細116の一番右の点は、左画像205の詳細画像218のピクセル220で撮影される、右画像210の詳細画像217のピクセル225で撮影される。ピクセル220およびピクセル225の位置の間の水平の差が、視差230である。物体の画像217、218は、垂直方向に位置合わせされており、したがって、詳細116の画像は両方の画像205、210において垂直方向に同じ位置取りを有すると仮定される。視差230は、左画像205および右画像210がそれぞれ視聴者の左目および右目によって見られるとき、物体215までのデプスの知覚をもたらす。
図3は、視差と知覚されるデプスとの間の関係を示す。3人の観察者305、307、309がそれぞれのスクリーン310、320、330上の物体の2眼式立体映像のペアを見ているところが示されている。
第1の観察者305は、正の視差を有する物体の左の像315および物体の右の像317を見る。正の視差は、物体の左の像315がスクリーン310上で物体の右の像317の左にあるという事実を反映する。正の視差は、知覚されるまたは仮想的な物体319がスクリーン310の平面の後ろにあるように見える結果をもたらす。
第2の観察者307は、視差がゼロである物体の左の像325および物体の右の像327を見る。視差がゼロであることは、物体の左の像325がスクリーン320上で物体の右の像327と同じ水平位置にあるという事実を反映する。視差がゼロであることは、知覚されるまたは仮想的な物体329がスクリーン320と同じデプスにあるように見える結果をもたらす。
第3の観察者309は、負の視差を有する物体の左の像335および物体の右の像337を見る。負の視差は、物体の左の像335がスクリーン330上で物体の右の像337の右にあるという事実を反映する。負の視差は、知覚されるまたは仮想的な物体339がスクリーン330の平面の前にあるように見える結果をもたらす。
ここで、視差およびデプスは、文脈によってそうでないことが示されるかまたは要求されない限り、実装において交換可能なように使用される可能性があることに留意されたい。式1を用いて、我々は、視差がシーンのデプスに反比例することを知る。
Figure 2014523660
ここで、「D」はデプス(図1の135)を示し、「b」は2つのステレオ画像カメラの間のベースライン長(図1の150)であり、「f」は各カメラの焦点距離(図1の145)であり、「d」は2つの対応する特徴点に関する視差(図2の230)である。
上記の式1は、同じ焦点距離を有する平行なカメラに対して有効である。より複雑な式がその他のシナリオに関して定義され得るが、ほとんどの場合、式1が近似として使用され得る。しかし、さらに、当業者に知られているように、以下の式2が、少なくとも、輻湊するカメラのさまざまな構成に対して有効である。
Figure 2014523660
は、無限遠の物体に関する視差の値である。dは、輻湊角および焦点距離に依存し、ピクセル数ではなく(例えば)メートルで表される。焦点距離は、図1および焦点距離145に関連して既に検討された。輻湊角は、図4に示されている。
図4は、図1の平行な構成ではなく輻湊する構成で配置されたカメラ105およびカメラ110を含む。角410は、輻湊するカメラ105、110の視線を示し、角410は、輻湊角と呼ばれる可能性がある。
視差マップが、ビデオ画像に関する視差情報を提供するために使用される。視差マップは、概して、関連するビデオ画像内のピクセルに対応する幾何学図形的配列を有する一組の視差値を指す。
概して、密な視差マップは、通常、関連するビデオ画像の解像度と同一である空間および時間解像度の視差マップを指す。時間解像度は、例えば、フレームレートを指し、例えば、50Hzまたは60Hzのどちらかである可能性がある。したがって、密な視差マップは、概して、ピクセル位置ごとに1つの視差サンプルを有する。通常、密な視差マップの幾何学図形的配列は、対応するビデオ画像の幾何学図形的配列、例えば、以下のピクセル数の水平および垂直サイズを有する長方形と同じである。
(i)1920×1080(もしくは1920×1200)、
(ii)1440×1080(もしくは1440×900)、
(iii)1280×720(もしくは1280×1024、1280×960、1280×900、1280×800)、
(iv)960×640(もしくは960×600、960×576、960×540)、
(v)2048×1536(もしくは2048×1152)、
(vi)4096×3072(もしくは4096×3112、4096×2304、4096×2400、4096×2160、4096×768)、または
(vii)8192×4302(もしくは8192×8192、8192×4096、7680×4320)。
密な視差マップの解像度は、関連する画像の解像度とほぼ同じであるが、異なる可能性がある。1つの実装において、画像の境界の視差情報は、取得するのが難しい。したがって、その実装において、境界ピクセルにおける視差値は、視差マップに含められず、視差マップは、関連する画像よりも小さい。
概して、ダウンサンプリングされた視差マップは、ネイティブのビデオ解像度よりも小さい(例えば、4分の1の)解像度の視差マップを指す。ダウンサンプリングされた視差マップは、例えば、ピクセルのブロックごとに1つの視差値を有する。ブロックは、どちらの方向についても必ずしも整数のピクセル数ではない。1つの実装において、ダウンサンプリングされた視差マップは、水平方向に2.5ピクセルおよび垂直方向に2.5ピクセルであるブロックに関する視差値を提供する。
概して、疎な視差マップは、密でない視差マップを指す。したがって、疎な視差マップは、ダウンサンプリングされた視差マップを含む。多くのアプリケーションにおいて、疎な視差マップは、対応するビデオ画像内で容易に追跡可能と見なされる画像の特徴点に対応する制限された数の(例えば、1000個の)ピクセルに対応する一組の視差を含む。選択される制限された数のピクセルは、概して、内容(content)自体に依存する。しばしば、画像には1または2百万ピクセル以上(1280×720または1920×1080)が存在する。概して、ピクセルのサブセットの選択は、特徴点を検出することができるトラッカーツールによって自動的または準自動的に行われる。トラッカーツールは、容易に入手可能である。特徴点は、例えば、その他の画像において容易に追従され得るピクチャ内のエッジまたはコーナーの点である可能性がある。概して、物体の高コントラストのエッジを表す特徴が、ピクセルのサブセットのために好ましい。
視差マップ、またはより広く、視差情報は、さまざまな処理動作のために使用され得る。そのような動作は、例えば、コンシューマデバイス上の3Dエフェクトの調整、インテリジェントな字幕の配置、VFX、およびグラフィックスの挿入のための像の内挿(interpolation)(レンダリング)を含む。
1つの特定の実装においては、グラフィックスが画像の背景に挿入される。この実装においては、3D表示が、スポーツキャスターとフットボール選手との間の2眼式立体ビデオインタビューを含み、それらの両方は前景にある。背景は、スタジアムの像を含む。この例において、視差マップは、対応する視差値が所定値よりも小さい(つまり、より近い)ときに、2眼式立体ビデオインタビューからのピクセルを選択するために使用される。対照的に、視差値が所定値よりも大きい(つまり、より遠い)場合、ピクセルはグラフィックから選択される。これは、例えば、ディレクターが、実際のスタジアムの背景の前ではなくグラフィック画像の前にインタビューの関係者を示すことを可能にする。その他の変更形態においては、背景が、選手の最も新しい得点を決めたプレーのリプレー中、例えば、競技場などの別の環境で置き換えられる。
1つの実装においては、3Dエフェクトが、ユーザのプリファレンスに基づいて和らげられる(減らされる)。3Dエフェクトを減らす(視差の絶対値を減らす)ために、新しい像が、視差およびビデオ画像を用いて内挿される。例えば、新しい像は、既存の左の像と右の像との間の位置に位置を定められ、左の像および右の像のうちの一方を置き換える。したがって、新しい2眼式立体映像のペアは、より小さなベースライン長を有し、削減された視差を有し、したがって、削減された3Dエフェクトを有する。
別の実装においては、内挿ではなく外挿が、見かけのデプスを強調し、それによって3Dエフェクトを強めるために実行される。この実装においては、元の左の像および右の像のうちの一方に対する延長されたベースライン長を有する仮想カメラに対応する新しい像が、外挿される。
別の例において、視差マップは、視聴者の不快感を和らげるかまたはなくすために、ビデオ画像内の字幕をインテリジェントに配置するために使用される。例えば、字幕は、概して、字幕が隠蔽しているあらゆる物体の前にある知覚されるデプスを有するべきである。しかし、知覚されるデプスは、概して、対象の領域と同程度であり、対象の領域内にある物体から前に離れ過ぎないデプスを有するべきである。
多くの3D処理動作に関して、ダウンサンプリングされた視差マップまたはその他の疎な視差マップよりも密な視差マップが好ましい。例えば、ユーザが制御可能な3Dエフェクトを可能にする(enable)ために視差マップが使用されるときは、概して、ピクセルごとの視差情報が好ましい。疎な視差マップ(例えば、ダウンサンプリングされた視差マップ)を使用することは合成された像の品質を劣化させる可能性があるので、ピクセルごとの視差情報は、概して、より良い結果が実現されることを可能にする。
視差値は、さまざまなフォーマットで表され得る。いくつかの実装は、記憶または送信のために以下のフォーマットを使用して視差値を表現する。
(i)符号付き整数:2の補数
・(a)負の視差値はスクリーンの前のデプスを示す。
・(b)ゼロは、スクリーン平面内の物体に関する視差値のために使用される。
(ii)1/8ピクセル単位
(iii)視差値を表す16ビット
・(a)典型的な視差の範囲は+80ピクセルと−150ピクセルとの間で変わる。これは、概して、1920または2048の解像度を有する40インチ(101.6センチメートル)ディスプレイに対して十分である。
・(b)1/8ピクセルの精度で、範囲は+640単位と−1200単位との間であり、これは、11ビット+符号のための1ビット=12ビットで表され得る。
・(c)(1920または2048ピクセル幅であるディスプレイの水平解像度の約4倍を有する)8kディスプレイで同じ3Dエフェクトを維持するために、我々は、通常、視差を符号化するための2つの追加のビット:12+2=14ビットを必要とする
・(d)これは将来使用するための2ビットを提供する
さらに、上記のフォーマットを使用するさまざまな実装は、密な視差マップも提供する。したがって、そのような実装のための密な視差マップを完成させるために、上記の16ビットのフォーマットが、対応するビデオ画像内のあらゆるピクセル位置に対して与えられる。
視差と、関連するデプスの変化とは、シーンの異なる像の間の隠蔽をもたらす。図5は、視聴者の脳内で組み合わさって3Dシーン530を生じる左の像510および右の像520を示す。左の像510、右の像520、および3Dシーン530は、それぞれ、太い円柱532、楕円534、および細い円柱536を含む3つの物体を含む。しかし、図5に示されるように、3つの物体532、534、536のうちの2つは、像510、520および3Dシーン530のそれぞれで異なる相対位置にある。それらの2つの物体は、太い円柱532および細い円柱536である。楕円534は、像510、520、および3Dシーン530のそれぞれで同じ相対位置にある。
異なる相対位置は、以下の簡潔な検討によって説明されるように隠蔽を生じる。左の像510は、隠蔽された領域545および548も見せる左画像540に示される。隠蔽された領域545および548は、左の像510でのみ可視であり、右の像520では不可視である。これは、(i)隠蔽された領域545に対応する右の像520内の領域が太い円柱532によって覆われており、(ii)隠蔽された領域548に対応する右の像520内の領域が細い円柱536によって覆われているためである。
同様に、右の像520は、2つの隠蔽された領域555および558も見せる右画像550に示される。隠蔽された領域555、558は、右の像520でのみ可視であり、左の像510では不可視である。これは、(i)隠蔽された領域555に対応する左の像510内の領域が太い円柱532によって覆われており、(ii)隠蔽された領域558に対応する左の像510内の領域が細い円柱536によって覆われているためである。
隠蔽が2眼式立体映像のペアに存在する可能性があるとすると、2眼式立体映像のペアに関する2つの視差マップを提供することが有用である。1つのそのような実装においては、左の視差マップが左のビデオ画像に対して与えられ、右の視差マップが右のビデオ画像に対して与えられる。知られているアルゴリズムが、標準的な視差ベクトルの方法を使用して視差値が決定され得ない各画像のピクセル位置に視差値を割当てるために使用される可能性がある。そのとき、隠蔽領域は、左の視差値と右の視差値とを比較することによって判定され得る。
左の視差値と右の視差値とを比較する例として、左目画像および対応する右目画像を考える。ピクセルLは、行Nにあり、左目画像において水平座標xを有する。ピクセルLは、視差値dを有すると判定される。ピクセルRは、対応する右目画像の行Nにあり、x+dに最も近い水平座標を有する。ピクセルRは、約「−d」の視差値dを有すると判定される。そのときは、視差が互いに対応するので、高い信頼度で、LまたはRに隠蔽は存在しない。つまり、ピクセルLおよびRは、両方とも、それらの判定された視差でおおむね互いを指す。
しかし、dが−dとほぼ同じではない場合、隠蔽が存在する可能性がある。例えば、符号を考慮に入れた後、2つの視差値が実質的に異なる場合、概して、隠蔽が存在する高い信頼度が存在する。1つの実装においては、実質的な違いは、|d−d|>1によって示される。加えて、視差値のうちの一方(dRまたはdLのどちらか)が利用できない場合、概して、隠蔽が存在する高い信頼度が存在する。視差値は、例えば、視差値が決定され得ないために利用できない可能性がある。隠蔽は、概して、2つの画像のうちの一方に関する。例えば、より小さい大きさを有する視差に関連するピクセルによって示されるか、または利用できない視差値に対応するピクセルによって示されるシーンの一部は、概して、他方の画像において隠蔽されていると見なされる。
視差値を表現するための1つのあり得る方法は、ビデオ画像の所与のピクセル位置に関する視差のピクセル数を表現するために整数を使用することである。視差値は、ビデオ画像の特定の水平解像度に対する視差のピクセル数を表す。したがって、視差値は、特定の水平解像度に応じて決まる。そのような実装は、有用であり、効果的である可能性がある。
しかし、その他の実装は、視差値にサブピクセルの精度を必要とする。概して、そのような実装は、視差値を表現するために浮動小数点数を使用し、したがって、小数部が視差値に含められ得る。これらの実装のうちのいくつかは、所与の水平解像度に固有の視差値を提供する。これらの実装も、有用であり、効果的である可能性がある。
他の一部の実装は、視差値を百分率の値として表現する。したがって、視差をピクセル数として表現する代わりに、視差は、水平解像度の百分率として表現される。例えば、所与のピクセル位置の視差が10ピクセルであり、水平解像度が1920である場合、百分率の視差値は、(10/1920)*100である。そのような実装は、やはり、視差にサブピクセルの精度を与えることができる。百分率の値の表現は、通常、整数表現ではなく浮動小数点表現である。例えば、水平解像度1920を有するディスプレイの1ピクセルの視差は、1/1920であり、これは0.0005208または.05208%である。
さらに、そのような百分率の視差値は、その他の水平解像度に直接適用(apply)され得る。例えば、(i)ビデオ画像が水平解像度1920を有し、(ii)ビデオ画像がユーザの家に送信され、(iii)ユーザのディスプレイ装置が水平解像度1440を有すると仮定する。このシナリオにおいては、通常、ユーザのディスプレイ装置(またはセットトップボックス、またはルータ、または何らかのその他のプロセッサーもしくは処理デバイス)が、ビデオ画像の水平解像度を1920から1440に変換し、さらに、視差値が水平解像度1440に対応するように視差値を変換する。変換は、例えば、百分率の視差値に水平解像度を掛けることによって実行され得る。例えば、所与のピクセル位置に関する百分率の視差が1/2%であり、水平解像度が1920である場合、絶対的な視差値は1/2*1920/100である。これらの実装のうちのいくつかは、ビデオ画像および視差マップの水平解像度に関係なく、視差値の送信および記憶に、百分率の視差値である単一の視差値を使用する。そのような実装も、有用であり、効果的である可能性がある。
上述のように、送信システムが、ビデオ画像の水平解像度とは異なる送信フォーマットの水平解像度を使用する可能性がある。加えて、受信システムが、ビデオ画像を表示するために異なる水平解像度を使用する可能性がある。したがって、1つの水平解像度から別の水平解像度への変換が、必要とされる可能性がある。そのような変換は、ビデオ画像の解像度を変更するだけではなく、視差値が調整されることも必要とする。概して、そのような変換は、絶対的な視差値に対して必要とされるが、百分率の視差値に対しては必要とされない。
以下の例は、さまざまな実装の間のトレードオフの一部についてのさらなる詳細を示す。
・(i)1つの実装は、視差値を、所与のビデオ解像度に対して、ピクセルの1/8の正確性で、絶対値(ピクセル数)としてフォーマットする(例えば、物体が、1920水平ピクセルを有するビデオコンテンツで10ピクセルの視差を有する可能性がある)。
・(ii)操作の簡潔さおよび容易さを含め、そのようなシステムの多くの利点が存在する。
・(iii)1つのそのようなシステムにおいては、最大で255ピクセルの視差を提供するための整数部分に関する8ビットと、(1/8の正確性または精度を得るための)小数部分に関する3ビットとの11ビットが使用される。符号ビットも使用されるか、またはシステムが+/−127ピクセルの視差値を提供する可能性があることに留意されたい。
・(iv)ビデオ画像が送信中に再フォーマットされる必要がある場合、視差マップも再フォーマットされ、情報の損失につながる可能性がある。例えば、図6を参照すると、実装が、水平解像度1920を有するネイティブのフォーマット610と、水平解像度1280(または別の実装においては1440)を有するようにダウンサンプリングされている送信フォーマット620とを使用する。ビデオ画像と同様に、デプスまたは視差マップが、概して、デプスの詳細の損失につながるサブサンプリングの前に濾波される。濾波は、濾波およびサブサンプリング動作630で行われる。濾波およびサブサンプリング動作は、ビデオ画像および視差画像に適用される。
・(v)さらに、新しい視差値が変換され、概して損なわれる。例えば、視差マップの解像度を下げる(つまり、視差値の数を少なくする)ダウンサンプリングの後、視差値は、送信フォーマットの解像度に変換される。1920から1280になるとき、10ピクセルの視差値は6.6666になる。これは、例えば、小数部分が0.125(1/8)の倍数にしかなれないために、6.625への値の切り下げを引き起こす。
・(vi)送信の後、ディスプレイが1920ピクセルの幅である場合、最終的な視差値は、6.625×1920/1280=9.9375になる。値9.9375は、元の値10と比較して、何らかの歪みを表す。値9.9375は、例えば、切り上げられるか、切り下げられるか、または最も近い整数に丸められるか、または最も近い1/8に丸められる可能性があり、おそらくは情報の損失を生じる。値が切り下げられるとした場合、損失は大きい。
1つの解決策は、すべての水平解像度に共通であることができる百分率の視差を使用することである。上述のそのような実装は、利点および欠点を有する。百分率の視差値の使用は、送信前の変換動作が省略されることを可能にする。
別の解決策は、いずれか1つのよくある解像度に固有ではない整数値を使用することである。(ピクチャは、通常、垂直方向に修正されたと想定され、その他の処理を受けていることに留意されたい。したがって、通常、水平方向の変位の観点で視差について検討すれば十分である。)この解決策は、本出願においてはいくつかの標準的なTVの水平解像度(720、960、1280、1440、1920)の最小公倍数(smallest common multiple)(「SCM」)と呼ばれる11,520ピクセルの基準解像度(reference resolution)(または仮想解像度(virtual resolution))を定義することを提案する。SCMは、さまざまな参考文献において「最小公倍数(lowest common multiple)」または「最小公倍数(least common multiple)」とも呼ばれ、これらは両方ともLCMと略される可能性があることに留意されたい。
このSCMの解決策の少なくとも1つの実装は、以下を含むいくつかの利点を有する(その他の実装がこれらの利点のすべてを有するとは限らない)。
・(i)視差値が整数であるので、視差値の判定および記憶が簡単であり、視差値は操作および処理が容易である。
・(ii)視差値が、もはや完全に絶対的ではなく、相対的な特徴を有し、したがって、ネイティブのビデオ解像度に依存しない。
・(iii)小数部分が必要とされない。
・(iv)視差値が、相対的であり、ネイティブのビデオ解像度に依存しないので、百分率に似ている。しかし、視差値は整数であり、したがって、最小の視差値を示すために0.00868%のような複雑な数を符号化する明確な必要性がない。最小の視差値は1ピクセルであり、1/11,520は0.00868%である。
・(v)視差値が11,520に依拠するので、転送中に視差値をコード変換する明確な必要性が存在しない。
・(vi)SCMに基づく視差値が例えばセットトップボックス(STB)に到着するとき、STBが、例えば、
○(a)解像度1920に関して視差/6
○(b)解像度1440に関して視差/8
○(c)解像度1280に関して視差/9
○(d)解像度960に関して視差/12
などの非常に単純な演算(operation)を実行することによって所与のビデオ解像度に対する真の絶対的な視差を計算する。
・(vii)どのチャネルが使用されるかに関係なく、コード変換がない限り、視差情報が転送中に劣化しない。
・(viii)2k、4k、8kのような比較的新しいコンシューマ解像度に関しても、演算は実施するのが簡単であり、それはSTBの処理ユニットで容易に実施可能である。概して、2kは水平ピクセル解像度2048を有する画像を指し、概して、4kは4096を指し、概して、8kは8192を指すことに留意されたい。演算は、例えば、
○(a)解像度2048に関して視差×8/45
○(b)解像度4096に関して視差×16/45
○(c)解像度8192に関して視差×32/45
である。
実際には、1または複数のSCMの実装は、(1)対応するビデオコンテンツの既存の水平解像度に対する視差値を判定し、(2)単純な乗算および/または除算によってそれらの視差値を11,520のスケールに変換してSCM視差値(SCM disparity value)を生成し、(3)コード変換なしにSCM視差値を記憶し、送信し、(4)単純な乗算および/または除算を用いて、受信されたSCM視差値を出力ディスプレイの解像度に変換する。コード変換が存在しないので、この解決策は、概して、コード変換による情報の損失(例えば、丸めの損失)を被らない。視差マップの解像度は上記プロセスによって変更されないことに留意されたい。むしろ、(既存の解像度に関する)既存の視差値が、実際の解像度とは異なる基準解像度(または仮想解像度)に基づくか、または基準解像度(または仮想解像度)を反映するようにスケール化される。
さまざまな実装は、上述の演算の逆である単純な数学的演算を実行することによって視差値を生成する。例えば、SCM視差値を生成するために、受信された絶対的な視差値に、以下のように、1つまたは2つの整数が乗算および/または除算される。
○(i)1920視差*6=SCM視差
○(ii)1440視差*8=SCM視差
○(iii)1280視差*9=SCM視差
○(iv)960視差*12=SCM視差
○(v)2048視差*45/8=SCM視差
○(vi)4096視差*45/16=SCM視差
○(vii)8192視差*45/32=SCM視差
図7は、さまざまな異なる水平解像度に関する最小公倍数を決定するプロセスのさらなる詳細を示す。列710は、異なる水平解像度を列挙する。列720は、水平解像度の最小の因数を列挙する。例えば、960は、2*3*5と因数分解され、ここで、2は2の6乗である。したがって、960=64*3*5である。水平解像度1280に関して、3は1に等しいことも留意される。
最初の4つの解像度960、1280、1440、および1920の最小公倍数は、2*3*5であり、これは11,520である。解像度11,520は、2の適切な累乗を乗算し、次に、2k、4k、および8kに存在しない因数3および5で除算することによって2k、4k、および8kの解像度で使用される。2の累乗の乗算は、さまざまな実装において、実際の乗算の演算ではなくビット単位の左シフト演算を用いて実行されることに留意されたい。図7は、11,520と列610に示されたさまざまな解像度との間の変換を行うための変換式を与える列730を含む。
列630の変換式は、複数のよくあるディスプレイサイズ(例えば、インチまたはセンチメートルで計測されるディスプレイの物理的なサイズを指すディスプレイサイズ)によってサポートされる解像度に基づいて視差値をスケール化するために使用され得る。図6の例においては、例えば、水平解像度1920に基づく入力視差値が、視差値を水平解像度11,520に基づく新しい視差値に変換するために、因数6によってスケール化される。新しい視差値は、水平解像度960、1280、および1440が解像度11,520によって考慮され、解像度11,520を決定する際に使用されるので、それらにも基づく。
代替的な実装は、単純に、視差の解像度11,520*2=368,640を使用する。この代替的な実装においては、368,640を元の解像度に変換して戻すために乗算が必要とされない。
値11,520が、さまざまな実装のために使用される。しかし、その他の実装においてはその他の値が使用される。1つの実装においては、値11,520が2倍にされて23,040になる。第2の実装においては、値368,640が2倍にされて737,280になる。
代替的に、水平解像度の異なる組が、さまざまな実装で使用され、異なるSCMをもたらす。例えば、別の実装においては、出力解像度1920および1440だけが対象であり、したがって、実装はSCM5,760を使用する。そのとき、SCM視差値を生成するために、解像度1920からの視差値は、因数3を乗算され、解像度1440からの視差値は、因数4を乗算される。
さまざまな実装はSCMの実装ではないことは明らかであるに違いない。例えば、値11,520でさえも、列710に列挙された7つすべての解像度のSCMではない。正しくは、値368,640がSCMである。それでもなお、本出願に記載の実装は、概して、たとえ視差値が水平解像度のすべての最小公倍数ではないとしてもSCMの実装と呼ばれる。
SCMの実装はサブピクセルの精度を提供することに留意されたい。例えば、解像度1920に関して、視差値は、解像度11,520への/からの変換を行うために因数6を使用し、これは1/6ピクセルの精度を提供する。より詳細には、11,520に基づく視差値が83である場合、1920に基づく視差値は13と5/6である。これは、明らかに1/6ピクセルの精度を提供する。これは、品質と、将来のニーズのための余裕との点でさまざまな利点をもたらす。例えば、解像度1920が解像度2kによって置き換えられる場合、11,520に基づく視差値は、それでも、8/45ピクセルの精度のサブピクセルの精度を提供し、これは、1/6(7.5/45)ピクセルよりも若干低い精度であるが、1/5(9/45)ピクセルよりはまだ高い精度である。
SCM解像度(SCM resolution)11,520を使用する少なくとも1つの実装は、2バイト(16ビット)フォーマットで動作する。多くの場合、典型的な視差の範囲は、1920×1080のディスプレイ(解像度)において+80ピクセルと−150ピクセルとの間で変わる。それらの数に6を掛けることは、基準解像度11,520において+480から−900までの範囲をもたらす。1380のこの範囲は、11ビット(211=2048)によって表され得る。代替的な実装は、視差の絶対値を表すための10ビット(視差の最大の絶対値は900である)と、符号を表すための追加のビットとを使用する。
さらに別の実装は、視差の符号が暗黙的であると見なすことによって1ビットを節約する。例えば、左の像のピクセルの視差が、視差の符号とともに符号化される。しかし、対応する右の像の対応するピクセルの視差は、反対の符号を有すると見なされる。
別の実装は、像(左の像と右の像との両方)ごとに1つの密な視差マップを提供し、それにより、隠蔽によって引き起こされる問題を減らすことができるように、密な視差マップが対応する像を示すためのビットを割当てる。別の実装は、画像(左の画像かまたは右の画像かのどちらか)と対応する密な視差マップとの間の暗黙的な関連付けを提供し、したがって、この情報に1ビットを充てる必要がない。これらの実装の変更形態は、その他の種類のマップまたは画像を導入するために1または複数の追加のビットを使用する。1つのそのような実装は、マップが(i)左画像の視差マップであるか、(ii)右画像の視差マップであるか、(iii)隠蔽マップ(occlusion map)であるか、または(iv)透過マップ(transparency map)であるかを示すために2ビットを使用する。1つの実装は、16ビットフォーマットを有し、−900から+480までの範囲を示すための11ビットを使用し、マップの種類を示すために2ビットを使用し、未使用の3ビットを有する。
図8は、1または複数の実装の動作を示すブロック/フロー図を与える。図8は、異なる実装の間のトレードオフの一部も示す。
図8は、ビデオを処理する処理チェーン810を含む。ビデオ画像811は、水平解像度1920を有する。しかし、処理チェーン810の送信フォーマットは、水平解像度1280を有する。したがって、ビデオ画像811は、水平解像度1280を有するビデオ画像813を生成するために動作812において濾波され、ダウンサンプリングされる。濾波およびダウンサンプリングは、処理チェーン810において一緒に実行される。しかし、その他の実装は、濾波およびダウンサンプリングを別々に実行する。濾波は、例えば、ビデオ画像811がダウンサンプリングされるときに折り返しひずみを防止する目的でビデオ画像811を低域通過濾波するために使用される。ビデオ画像813は、送信および/または記憶動作814で搬送される。
チェーン810の受信側は、ビデオ画像813と同じであるか、同様であるか、または異なる可能性がある受信されたビデオ画像815にアクセスする。例えば、1つの実装において、ビデオ画像815は、ビデオ画像813の記憶されたバージョンである。加えて、別の実装においては、ビデオ画像815は、情報源符号化および復号動作(図示せず)の後のビデオ画像813の再構成されたバージョンを表す。さらに、別の実装においては、ビデオ画像815は、(誤り訂正を含む)チャネルの符号化および復号動作(図示せず)の後のビデオ画像813の誤り訂正されたバージョンを表す。ビデオ画像815は、元のビデオ画像811におけるように水平解像度1920を有するビデオ画像817を生成するために、アップサンプリング動作816で処理される。
図8は、チェーン810で処理されるビデオ画像に対応する視差画像を処理する処理チェーン820も含む。視差画像821は、水平解像度1920を有し、解像度11,520に基づく整数値の視差値を含む。概して、視差画像は、例えば、密な視差マップ、ダウンサンプリングされた(疎な)視差マップ、または別の疎な視差マップなどの視差情報の任意の集積を指すことに留意されたい。さらに、視差マップは、例えば、ピクチャ、フレーム、フィールド、スライス、マクロブロック、パーティション、または視差情報の何らかのその他の集まりに対応する可能性がある。
しかし、処理チェーン820の送信フォーマットは、水平解像度1280を有する。したがって、視差画像821は、水平解像度1280を有する視差画像823を生成するために動作822において濾波され、ダウンサンプリングされる。濾波およびダウンサンプリングは、処理チェーン820において一緒に実行される。しかし、その他の実装は、濾波およびダウンサンプリングを別々に実行する。濾波は、例えば、視差画像821がダウンサンプリングされるときに折り返しひずみを防止する目的で視差画像821の視差値を低域通過濾波するために使用される。
視差画像823の視差値は、整数値である。これは、さまざまな手段で実現され得る。1つの実装において、濾波およびダウンサンプリング動作の結果は、最も近い整数に丸められる。別の実装においては、すべての小数部分が単純に切り捨てられる。さらに別の実装は、視差画像823の視差値に浮動小数点表現を使用する。視差値は、濾波およびダウンサンプリングが視差画像823の解像度1280を生成した後でさえも、引き続き解像度11,520に基づくことに留意されたい。
視差画像823は、送信および/または記憶動作824で搬送される。チェーン820の受信側は、受信された視差画像825にアクセスする。視差画像825は、視差画像823と同じであるか、同様であるか、または異なる可能性がある。例えば、1つの実装において、視差画像825は、視差画像823の記憶されたバージョンである。さらに、別の実装においては、視差画像825は、情報源符号化および復号動作(図示せず)の後の視差画像823の再構成されたバージョンを表す。さらに、別の実装においては、視差画像825は、(誤り訂正を含む)チャネルの符号化および復号動作(図示せず)の後の視差画像823の誤り訂正されたバージョンを表す。しかし、視差画像825の視差値は、例えば、必要に応じて丸めを使用することによって整数のままである。
視差画像825は、元の視差画像821におけるように水平解像度1920を有する視差画像827を生成するために、アップサンプリング動作826で処理される。動作826は、例えば、丸めまたは切り捨てを使用して、視差画像827の整数値を生成する。
視差画像827の視差値は、変換動作828で、解像度11,520に基づく状態から、解像度1920に基づく状態に変換される。変換動作828は、上で説明されたように、それぞれの視差値を6で割る。変換動作828は、視差画像829を生成する。視差画像829の視差値は、サブピクセルの精度を保つために浮動小数点数として表される。
処理チェーン820が大きな利点を含むことは明らかであるに違いない。第1に、視差値は、最終的な視差画像829がもたらされるまで、チェーン820全体を通じて整数である。第2に、実際の視差値は、送信フォーマットの水平解像度がネイティブの視差マップ821の水平解像度と異なるという事実にもかかわらず、コード変換されない。したがって、視差値は、さまざまな異なる水平解像度に適用可能である。
そして、受信システムが、視差画像829を使用してビデオ画像817を処理する。処理は、既に説明されたように、3Dエフェクトの調整、字幕の配置、グラフィックスの挿入、またはVFXの実行を含み得る。
図8は、比較を目的として、処理チェーン830も示す。処理チェーン830は、チェーン810で処理されるビデオ画像に対応する視差画像をやはり処理する。処理チェーン830は、処理チェーン820の代わりである。以下で説明されるように、チェーン830全体は、図8を簡潔にするために示されていないことは明らかであるに違いない。
視差画像831は、水平解像度1920を有し、浮動小数点表現を有する百分率に基づく視差値を含む。しかし、処理チェーン830の送信フォーマットは、水平解像度1280を有する。したがって、視差画像831は、水平解像度1280を有する視差画像833を生成するために動作832において濾波され、ダウンサンプリングされる。動作832は、例えば、濾波およびダウンサンプリング動作812または822と類似している可能性がある。視差画像833の百分率に基づく視差値は、引き続き浮動小数点フォーマットで表される。
処理チェーン830の残り(図示せず)は、処理チェーン820の残りと同じである。視差画像833は、送信および/または記憶動作で搬送される。チェーン830の受信側は、受信された視差画像にアクセスする。受信された視差画像が、水平解像度1920にアップサンプリングされ、次に、視差値が、百分率に基づく状態から解像度1920に基づく状態に変換される。変換動作は、上で説明されたように、百分率掛ける1920の操作である。しかし、処理チェーン820とは対照的に、処理チェーン830の視差画像の視差値は、常に浮動小数点フォーマットで表される。
図8は、比較を目的として、処理チェーン840も示す。処理チェーン840は、チェーン810で処理されるビデオ画像に対応する視差画像をやはり処理する。処理チェーン840は、処理チェーン820の代わりである。以下で説明されるように、チェーン840全体は、図8を簡潔にするために示されていないことは明らかであるに違いない。
視差画像841は、水平解像度1920を有し、解像度1920に基づき、浮動小数点表現を有する視差値を含む。しかし、処理チェーン840の送信フォーマットは、水平解像度1280を有する。したがって、視差画像841は、水平解像度1280を有する視差画像843を生成するために動作842において濾波され、ダウンサンプリングされる。動作842は、例えば、濾波およびダウンサンプリング動作812、822、または823と類似している可能性がある。視差画像843の視差値は、引き続き浮動小数点フォーマットで表される。
次に、視差画像843の視差値は、視差画像860を生成するために、変換動作850で変換される。変換動作850は、視差値を、水平解像度1920に基づく状態から水平解像度1280に基づく状態に変換する。視差画像860の視差値は、引き続き浮動小数点フォーマットで表される。
処理チェーン840の残り(図示せず)は、処理チェーン820の残りと同じである。視差画像860は、送信および/または記憶動作で搬送される。チェーン840の受信側は、受信された視差画像にアクセスする。受信された視差画像が、水平解像度1920にアップサンプリングされ、次に、視差値が、解像度1280に基づく状態から解像度1920に基づく状態に変換される。変換動作は、視差値に1920/1280を乗算することをともなう。処理チェーン830と同様に、処理チェーン820とは対照的に、処理チェーン840の視差画像の視差値は、常に浮動小数点フォーマットで表される。
処理チェーン840の別の実装においては、変換動作850が実行されない。したがって、視差画像843の視差値は、水平解像度1920に基づく視差値のままである。しかし、視差画像843の水平解像度は、1280のままである。したがって、この実装は、送信の前の変換を避け、おそらくは、受信または取得後の再変換を避ける。変換および再変換を避けることは、少なくとも一部の実装において、丸め誤差も避ける。この実装は、本出願のすべてのその他の実装と同様に、利点を有し、有用である可能性がある。しかし、視差値は、実装全体を通じて浮動小数点数で表される。
我々は、例えば、解像度11,520が使用されるSCMの実装に再び言及する。幅11,520は、既に説明されたように、一揃いの所定の画像解像度(例えば、960、1280、1440、および1920)の幅(水平軸)の最小公倍数と呼ばれる。11,520は、1280、1440、および1920の最小公倍数でもあることに留意されたい。
SCMを用いる水平視差の1つの計数は、「視差単位(disparity unit)」(DU)、または「水平単位(horizontal unit)」(HU)、または「水平視差単位(horizontal disparity unit)」(HDU)と呼ばれる可能性がある。DUによって視差を表すことは、選択された画像の幅の最小公倍数に関連して視差を効果的に表す。DUによって視差を表すことは、利点を有する。DUによって視差を表す1つのそのような利点は、選択された解像度のうちの1つのステレオ画像のペア内の物体に関して計算された視差が、選択された解像度のうちの異なる1つにスケール化された同じステレオ画像のペアのバージョン内の同じ物体に関して実質的に同じであることである。
例えば、図9を参照すると、同じ領域を表すが、3つの異なる解像度の画像のピクセルの3つの行910、920、および930が示されている。加えて、SCM解像度11,520からの視差単位を示す第4の行940が存在する。
一番上の行910は、1280ピクセル幅であるピクチャからのピクセルの領域を含む。一番上の行910は、示されるように8ピクセルを含む。実際、一番上の行910は、通常、アスペクト比1:1を有するピクセルに対応する画像アスペクト比16:9を有する解像度1280×720である。したがって、一番上の行910のピクセルは、正方形として示される。
第2の行920は、行910と同じピクチャからのピクセルの領域を含む。しかし、行920は、通常、同じ画像アスペクト比16:9を有するが、画素アスペクト比が4:3である解像度1440×1080を有する画像全体をもたらすようにピクチャが1440ピクセル幅になるようにリサイズされた後のピクチャから抜き出される。したがって、行920は、単純に行910のように8ピクセルを含むのではなく、示されるように9ピクセルを含む。
第3の行930は、行910および行920と同じピクチャからのピクセルの領域を含む。しかし、行930は、ピクチャが全体の画像解像度1920×1080の1920ピクセル幅になるようにリサイズされた後のピクチャから抜き出される。ピクチャは、検討されるその他の解像度と同様にアスペクト比16:9を有するが、行910と同じように画素アスペクト比1:1(正方形のピクセル)を有する。したがって、行930は、単純に行910のように8ピクセルを含むか、行920のように9ピクセルを含むのではなく、示されるように12ピクセルを含む。行910、行920、および行930は、すべて、ピクチャの対応する領域を表示し、同じコンテンツを含むことは明らかであるに違いない。
我々は、これらの4つの異なる解像度における視差の違いを示すための一例を与える。1つの実装において、物体は、丁度、ステレオ画像のペアのうちの一方の画像の1280ピクセル幅のバージョンの一番上の行910の一番左のピクセル912に現れ、丁度、ステレオ画像のペアのうちの対応する他方の目の画像の第5のピクセル914に現れる。視差は、一番上の行910の半分ほど、または(ピクセルで表すと)(5−1と計算される)丁度4である。
しかし、第3の行930の再スケール化(rescale)された画像で計測されるとき、物体は、ステレオ画像のペアのうちの一方の画像の一番左のピクセル932に現れ、丁度、ステレオ画像のペアのうちの対応する他方の目の画像の第7のピクセル934に現れる。したがって、第3の行930の半分ほどである視差は、6ピクセルある。
さらに、第2の行920の再スケール化された画像で計測されるとき、物体は、ステレオ画像のペアのうちの一方の画像の一番左のピクセル922に現れる。物体は、ステレオ画像のペアのうちの対応する他方の目の画像の第5のピクセル924の右半分にも現れる。したがって、第2の行920の半分ほどである視差は、4と1/2ピクセルある。
したがって、視差は、行910、920、および930の解像度のそれぞれで異なる。視差は、4ピクセルから、4と1/2ピクセルまで、6ピクセルまで変わる。
しかし、視差がDUで表されるとき、この同じ物体は、3つの解像度すべてにおいて36DUの視差を有する。これは、第4の行940を調べることによって理解され得る。第4の行940の再スケール化された画像で計測されるとき、物体は、ステレオ画像のペアのうちの一方の画像の一番左のDU942に現れ、丁度、ステレオ画像のペアのうちの対応する他方の目の画像の第37のDU944に現れる。したがって、第4の行940の半分ほどである視差は、36DUある。視差を計測するためにピクセルではなくDUを使用することにより、ピクチャが、異なる選択された解像度の間でスケール化されるとき、この物体の視差は、再計測、再計算、またはスケール化される必要がない。
既に説明されたように、密な視差マップは、通常、(ステレオ画像のペアと呼ばれる)2眼式立体映像のペアのうちの一方の画像の各ピクセルの内容に関連する視差値を含む。視差値は、ステレオ画像のペアの他方の画像に関連する。したがって、密な視差マップは、通常、対応する画像がピクセルを有するのと同じ数の視差のエントリを含む。
高解像度(例えば、1920ピクセル幅)の画像に関する第1の密な視差マップから、より低い解像度の画像に関する第2の密な視差マップが、第2の密な視差マップの値に空間的に重なる第1の密な視差マップの値の加重平均(またはその他の関数)によって計算され得る。
1つの実装において、視差のダウンスケール化(downscaling)関数は、加重平均である。この実装において、第2の密な視差マップの値は、積の和に等しい。合計される積は、第1のマップの各ピクセルに対応する視差を、視差値が計算されている第2のマップのピクセルのそれとのその対応するピクセルの交差の(第2のマップのピクセルに正規化された)面積と乗算した積である。
例えば、図10に関連して、2つのピクセルグリッドの重なりの部分が示されている。第1のピクセルグリッドは、マップ1と呼ばれ、比較的高い解像度のピクチャのピクセルグリッドである。第2のピクセルグリッドは、マップ2と呼ばれ、比較的低い解像度のピクチャのピクセルグリッドである。マップ1およびマップ2は図10にそれらの全体が示されていないことは明らかであるに違いない。図10は、マップ1およびマップ2の重なりの部分を示す。
図10のグリッドは、視差マップにやはり対応する。第1の視差マップは、マップ1の各ピクセル位置に関する視差値を与え、マップ1視差マップと呼ばれることがある。第2の視差マップは、マップ2の各ピクセル位置に関する視差値を与え、マップ2視差マップと呼ばれることがある。マップ1視差マップは、比較的高い解像度のピクチャの密な視差マップであり、高解像度視差マップと呼ばれることがある。マップ2視差マップは、比較的低い解像度のピクチャの密な視差マップであり、低解像度視差マップと呼ばれることがある。以降のさまざまな実装において、マップ2視差マップは、マップ1視差マップをダウンスケール化することによって生成され、反対に、マップ1視差マップは、マップ2視差マップをアップスケール化(upscaling)することによって生成される。
図11を参照すると、図10のマップ1が、マップ2なしに分離して図11にやはり示されている。同様に、図12を参照すると、図10のマップ2が、マップ1なしに分離して図12にやはり示されている。視差マップは、概して本出願において使用されるとき、対応するピクチャの視差値を含むことは明らかであるに違いない。視差マップは、通常、対応するピクチャのピクセル(またはピクセルのグループ)に関する視差値を有すると見なされる。したがって、特に、対応するピクチャのあらゆるピクセルに関する視差値を有する密な視差マップに関して、視差マップがピクセルを有すると見なすことが便利であることがある。
(図10と11との両方の)マップ1は、ピクセルP11、ピクセルP12、ピクセルP13、ピクセルP14、ピクセルP15、ピクセルP16、ピクセルP17、ピクセルP18、およびピクセルP19を有する対応するピクチャのピクセルグリッドを示す。(図10と12との両方の)マップ2は、ピクセルP21、ピクセルP22、ピクセルP23、およびピクセルP24を有する対応するピクチャのピクセルグリッドを示す。理解され得るように、マップ1のグリッドのピクセルのサイズは、マップ2のグリッドのピクセルのサイズよりも小さい。サイズの違いは、マップ1がマップ2よりも高い解像度のピクチャに関するものであるという事実を反映している。
マップ1視差マップからマップ2視差マップを形成する少なくとも1つの実装においては、マップ2のピクセルP21に対応する視差値の加重平均が、積の和になる。第1の積は、マップ1のピクセルP11に対応する視差値(d(P11)と呼ばれる)をピクセルP11とピクセルP21との交差の面積に掛けたものである。ピクセルP21の面積が1と見なされることに留意されたい。残りの積は、マップ1視差マップの各視差値に関して同様である。しかし、ピクセルP11、ピクセルP12、ピクセルP14、およびピクセルP15だけが、ピクセルP21との空でない交差を有する。したがって、ピクセルP11、ピクセルP12、ピクセルP14、およびピクセルP15だけが、ピクセルP21に対応する視差に視差を与える。式の形式では、加重平均の視差計算を使用するピクセルP21の視差は、
d(P21)=d(P11)*4/9+d(P12)*2/9+d(P14)*2/9+d(P15)*1/9
である。同様に、ピクセルP24に関して、
d(P24)=d(P15)*1/9+d(P16)*2/9+d(P18)*2/9+d(P19)*4/9
である。ピクセルP22およびピクセルP23の視差は、同様にして計算される。
加重平均ではなく、別の関数が選択される可能性がある。例えば、別の実装は、新しいマップのピクセルの視差に関する視差のダウンスケール化関数を、交わるピクセルに対応する視差のうちの最小値と定義する。式の形式では、この視差の最小値(「または最小視差」)計算を使用するピクセル21の視差は、
d(P21)=min(d(P11),d(P12),d(P14),d(15))
である。
マップ2のそれぞれの特定のピクセル(例えば、ピクセルP21)に関して、この視差の最小値関数は、マップ2のその特定のピクセルに関する視差値に寄与するマップ1視差マップからのいかなる視差値も、マップ2のその特定のピクセルに関する視差値よりも小さくないことを保証する。視差値が小さいほど物体が視聴者に近いことを示すことを思い出されたい。したがって、視差の最小値関数は、物体が、新しい解像度において、必ず、少なくとも古い解像度における視聴者との近さと同じだけ視聴者に近いことを保証する新しい解像度に関する計算された視差マップをもたらす。
反対に、特定の実装においては、視差の最小値関数は、最も小さな負の視差に特別な影響を与える傾向がある。例えば、1つの実装において、マップ1視差マップの視差値は、小さな視差値を有するピクセルP15に対応する視差値を除いてすべて大きい。それにもかかわらず、ピクセルP15に関する視差値は、ピクセルP21、ピクセルP22、ピクセルP23、およびピクセルP24を含む、マップ1のピクセルP15と重なるマップ2のあらゆるピクセルの視差値に影響を与える。マップ1視差マップおよびマップ2視差マップは、ピクチャに関する視差マップであることを思い出されたい。結果は、ピクチャが比較的高い解像度(マップ1のピクセルグリッド)から比較的低い解像度(マップ2のピクセルグリッド)に変更されるときに、ピクセルP15に関連する視差値を有すると見なされるピクチャの部分が9倍に増えることである。その理由は、マップ2の4つのピクセルすべてが、マップ1のピクセルP15と少なくとも部分的に重なり、マップ2の面積が、ピクセルP15の面積の9倍であるからである。
関数は、マップ2の比較的低い解像度からマップ1の比較的高い解像度に変換するためにやはり適用され得る。例えば、加重平均の視差計算および/または視差の最小値計算が、さまざまな実装において使用される。そのような計算は、これらの計算の先の例と同じ原理にしたがう。しかし、この場合、マップ2のピクセルではなくマップ1のピクセルが1と見なされることに留意されたい。
1つのそのような実装においては、ピクセルP11およびピクセルP12の視差を計算するための加重平均の視差計算は、
ピクセルP21がピクセルP11と完全に重なるので、d(P11)=d(P21)を与え、
ピクセルP12がピクセルP21によって半分覆われ、ピクセルP22によって半分覆われているので、d(P12)=d(P21)*1/2+d(P22)*1/2を与える。
別のそのような実装においては、ピクセルP15の視差を計算するための視差の最小値計算は、
d(P15)=min(d(P21),d(P22),d(P23),d(24))
を与える。
図10、11、および12の上記の検討は、すべて、主として密な視差マップを扱う。確かに、特に、2眼式立体映像のペアの見かけのデプスを修正するための画像処理に関連して、許容できる結果のために密な視差マップを必要とする場合がある。
しかし、密な視差マップが必要とされないその他の場合が存在し、それらの場合、(密でない)疎な視差マップが許容され得る。例えば、2眼式立体表示と合成されるべき字幕(またはグラフィック、またはオンスクリーンメニュー)を配置するために、概して、字幕/グラフィック/メニューが重なる領域内の最小の(最も小さな負の)視差以下のそれに関する視差を選択する。
徹底した検査は、密な視差マップからの、字幕/グラフィック/メニューが重なるあらゆるピクセルの視差を調べる可能性がある。しかし、通常、字幕/グラフィック/メニューの視差を疎な視差マップのみと比較することによって高品質な結果が得られる可能性がある。さまざまな実装において、そのような疎な視差マップは、2ピクセルごと、または10ピクセルごと、またはそれよりも多いピクセルごとに1つの視差値を提供する。疎な視差マップの使用は、比較的少ないデータを使用して疎な視差マップを表現する。これは、例えば、記憶または送信するデータをより少なくし、字幕/グラフィック/メニューを配置しようとするときに調べるべきデータをより少なくする。
しかし、前もって、ピクチャが異なる解像度にスケール化されるときに、疎な視差マップは、視差マップで表される視差と、基礎となるピクセルで示される物体の実際の視差とが適切に対応するように再計算または再スケール化される。例えば、あなたが完全なまたは部分的なピクセル単位で表された(密または疎な)視差マップを有し、異なる解像度に変換すると仮定すると、各ピクセル(または領域)がそれが以前覆っていたのとは異なる画像の部分をおそらく覆うので、あなたは、通常、a)視差値を新しい違うサイズのピクセル値にスケール化し、b)新しいスケールに対して適切な視差を決定することになる。これは、例えば、(疎または密な)視差マップが異なる解像度に変換され、例えば、アップサンプリング(アップコンバートとも呼ばれる)またはダウンサンプリング(ダウンコンバートとも呼ばれる)を必要とするときに起こり得る。この変換の例は、例えば、図10〜12に関連して、密な視差マップに関して既に検討されている。例えば、折り返しひずみを防止または軽減するために、さまざまな変換に関して濾波が必要とされる可能性があることにも留意されたい。
密な視差マップの(例えば、マップ2からマップ1に変換する)アップサンプリングおよび(例えば、マップ1からマップ2に変換する)ダウンサンプリングの前の例は、疎な視差マップのアップサンプリングおよびダウンサンプリングにも当てはまることに留意されたい。いくつかの例が、以下に続く。
− さまざまな実装において、疎な視差マップは、選択された、まばらに位置するピクセルに関する視差値のみからなる。しかし、異なる解像度に変換すると、選択された、まばらに位置するピクセルは、異なる解像度のピクセルと重なる面積を有する。したがって、1つの実装において、(例えば)加重平均または最小値関数を使用するアップサンプリングおよび/またはダウンサンプリングが使用される。
− 別の実装において、ピクチャに関する疎な視差マップは、ピクチャからの別個のセル(ピクセルのグループ)にそれぞれが当てはまる視差値からなる。別個のセルは、ピクチャ全体を覆う。しかし、異なる解像度に変換すると、別個のセルは、異なる解像度のセルと重なる面積を有する。したがって、1つの実装において、(例えば)加重平均または最小値関数を使用するアップサンプリングおよび/またはダウンサンプリングが使用される。そのような実装の一例は、ピクセルがセルと見なされ、単一のピクセルと見なされないとき、図10に見られる可能性がある。したがって、例えば、「ピクセル」P11は、そのような実装において、セル(ピクセルのグループ)を表し、単に1つのピクセルを表さず、(d(P11)である)単一の視差値は、セル全体に関連付けられる。
しかし、さまざまな実装において、所定の解像度のうちのいずれかに対応するように視差値が再計算される必要がない特別な疎な視差マップが構築される。このスケール非依存視差マップは、以下で説明されるように、各セルの幅および高さを選択することによって構築される。
視差マップの各セルの幅は、DUまたはその整数倍で計測されるさまざまな解像度のピクセルの幅のSCMに等しくなるように選択される。1つの実装においては、所定の水平解像度1280、1440、および1920に対して、DUでの基準ディスプレイ幅は、それらのSCM11,520である。これは、解像度1280に関して9DUの幅であり、解像度1440に関して8DUの幅であり、解像度1920に関して6DUであるピクセルに対応する。9DU、8DU、および6DUのピクセルの幅のSCMは、72DUである。したがって、72DUの水平間隔で、3つのピクチャの解像度の垂直なピクセル境界が整合する。
同様のプロセスを用いて、各セルの高さが選択され、したがって、垂直軸に対する間隔を与える。この例が構築されるビデオフォーマット(解像度とも呼ばれる)は、1280×720、1440×1080、および1920×1080である。1280×720フォーマットおよび1920×1080フォーマットにおける画素アスペクト比は1:1であるが、1440×1080フォーマットにおいては、ピクセルは、より幅が広い4:3のアスペクト比を有することに留意されたい。したがって、この技術は、非正方ピクセルに対しても、正方ピクセルに対しても機能する。
したがって、垂直解像度は、720および1080の2つだけである。これら2つの解像度のSCMは、2160である。このSCMは、例えば、水平方向のSCMを計算するために既に検討されたのと同じようにして計算され、(i)720=2*3*5、(ii)1080=2*3*5、および(iii)2160=2*3*5であることを示す。したがって、この実装において、これら3つの画像フォーマットは、2160VU(垂直単位(vertical unit))の高さを有する。高さが720ピクセルである画像フォーマットに関して、各ピクセルは、2160/720=高さ3VUである。高さが1080ピクセルであるその他の画像フォーマットに関して、各ピクセルは、2160/1080=高さ2VUである。
視差マップの各セルの高さは、VUまたはその整数倍で計測されるさまざまな解像度のピクセル高さのSCMに等しくなるように選択される。したがって、上記の実装に関して、各セルの高さは、3VUと2VUとのSCMであり、これは6VUである。
我々は、上記の幅および高さの計算を組み合わせることができる。そのような実装においては、セルが、72DU(またはその整数倍)の幅と、6VU(またはその整数倍)の高さとを有する。この実装は、図13〜16に示されており、以下で検討される。
図13〜16を参照すると、3つのピクセルグリッドの一部が示されている。グリッド1と呼ばれ、左斜線で描かれた第1のピクセルグリッドの一部が示されている。グリッド2と呼ばれ、右斜線で描かれた第2のピクセルグリッドの一部が示されている。グリッド3と呼ばれ、交差斜線(つまり、左斜線と右斜線との両方)で描かれた第3のピクセルグリッドの一部が示されている。3つの部分は、同一の広がりを持ち、したがって、ピクチャの同じ部分を表す。3つの部分が同一の広がりを持つという事実が、互いに重なる3つの部分を示す図13に示されている。対照的に、図14〜16は、3つの部分のうちの1つだけを示す。図14は、グリッド1の部分を分離して示す。図15は、グリッド2の部分を分離して示す。図16は、グリッド3の部分を分離して示す。
3つのピクセルグリッドは、3つの異なる解像度を有する。グリッド1は、解像度1920×1080を有する。グリッド2は、解像度1440×1080を有する。グリッド3は、解像度1280×720を有する。したがって、グリッド1は、最も高い水平解像度を有し、さらに、最も高い総解像度を有する。グリッド3は、最も低い(水平、垂直、および総)解像度を有する。グリッド2は、中間の水平解像度および総解像度を有する。ピクセルグリッドのそれぞれにおいて、一部のピクセルは、各グリッドのピッチをよりはっきりと示すために適切な線で斜線が引かれている。「ピッチ」は、概して、ピクセルのサイズおよび位置、ピクセルの間隔、または空間周波数(spatial frequency)を指すと理解される。
図13〜16は、VU単位およびDU単位をそれぞれ示す縦軸および横軸も含む。VU単位およびDU単位は、図13〜16の3つの解像度に関して、既に説明されたように決定される。したがって、グリッド1の各ピクセルは、幅6DU×高さ2VUである。グリッド2の各ピクセルは、幅8DU×高さ3VUである。グリッド3の各ピクセルは、幅9DU×高さ3VUである。
図13から理解され得るように、3つのグリッドすべての垂直なピクセル境界は、6VU(2VUと3VUとのSCM)ごとに整合する。3つのグリッドすべての水平なピクセル境界は、72DU(6DUと、8DUと、9DUとのSCM)ごとに整合する。
したがって、さまざまな実装に関して、視差マップのセルは、高さが6VUの第1の整数倍であり、幅が72DUの第2の整数倍であるものとして定義される。セルの視差値は、グリッド1、グリッド2、またはグリッド3のいずれかのセルに対応するピクセル内の物体の視差を提供する。そのような実装において、セルの視差値は、ピクチャがグリッド1、グリッド2、およびグリッド3の3つの解像度の間で変換されるときに再計算される必要がない。むしろ、セルの視差値は、これら3つの所定のピクチャの解像度のすべてに当てはまる。
セルへと分割された結果として得られた視差マップは、DUで表されたピクチャの幅をDUで表されたセルの幅で割った数に等しい数のセルの列を有する。セルの行の数は、VUで表されたピクチャの高さをVUで表されたセルの高さで割った数に等しい。
図13に示された例において、6VUおよび72DUと乗算される第1の整数と第2の整数とが両方とも「1」である場合、図13に示されるグリッドの部分は、3つのスケール非依存視差マップのセルに対応し、各セルは幅72DUおよび高さ6DUである。これは、高さが低く幅広の視差マップのセルを生じることに留意されたい。これら3つのセルのそれぞれは、図13の幅全体に広がる。第1のセルは、0VUから6VUまで垂直方向に延びる。第2のセルは、6VUから12VUまで垂直方向に延びる。第3のセルは、12VUから18VUまで垂直方向に延びる。
代替的に、第1の整数が「3」であり、第2の整数が「1」である場合、図13に示される3つのグリッドの部分は、単一のスケール非依存視差マップのセルに対応する。この単一のセルの横軸および縦軸は、第1の整数が「1」である上記の例のセルよりも似通った表現を有する。より似通った表現が原因で、この例におけるセルのアスペクト比は、例えば、基礎となるデータのサイズによっては、いくつかの目的のためにより効果的である可能性がある。
DUおよびVUが同じサイズである必要はないことに留意されたい。図13に関連して検討された例において、1つのVUは1つのDUよりも大きい。これは、例えば、72個の水平単位のそれぞれの幅が1DUであり、18個の垂直単位のそれぞれの高さが1VUである図13で理解され得る。1DU×1VUである領域(「マイクロピクセル(micropixel)」と呼ばれる)は、DUおよびVUが同じサイズではないので、この例においては正方形ではない。我々が検討したように、水平解像度のSCMが、いくつのDUが画像の水平幅を構成するかを設定するために使用され得る。同様に、そのような計算が、VUおよび画像の垂直方向の高さに関して行われ得る。概して、仮定されたディスプレイの結果として得られたマイクロピクセルが正方形のマイクロピクセルである必要はない。これは、DUのサイズとVUのサイズとが異なる可能性があるためである。マイクロピクセルが正方形ではないとしても、グリッド1およびグリッド3のピクセルは正方形であり、一方、グリッド2のピクセルは4:3の画素アスペクト比を有することに留意されたい。
視差マップがスケール非依存視差マップとして提供されるとき、視差マップの値は、所定の解像度のいずれかの対応するピクチャに対して変更なしに使用され得る。したがって、例えば、変換プロセスは必要とされない。
さまざまな実装において、スケール非依存視差マップは、セルごとに1つのピクセルだけを含むセルから構成されることに留意されたい。いくつかのそのような実装において、所定の解像度は、互いに整数倍である。これらの実装においては、最も粗い解像度の1ピクセルが、その他の(より粗さの少ない)解像度のそれぞれの整数個のピクセルに対応する。1つの特定の実装においては、最も粗い解像度の1ピクセルが、より細かい(より粗さの少ない)解像度のうちの1つの4ピクセルに対応する。
スケール非依存視差マップのセルは、異なる実装においてさまざまな利点をもたらす。例えば、さまざまな実装において、スケール非依存視差マップのセルは、解像度が変更されるとき、視差値を変換する必要性を完全になくす。別の例として、さまざまな実装において、スケール非依存視差マップのセルは、視差値と視差値が当てはまる関連する内容(例えば、物体)との間の対応を維持する。これらの利点は、以下でさらに検討される。
我々は、最初に、視差値の変換について検討する。再び図10を参照して、ピクセルP11〜P16からなるように定義されたピクセルのグループと同一の広がりを持つようにセルのサイズが選択されると仮定する。マップ2の解像度に変換すると、マップ1のセルの境界がマップ2のいずれのあり得る(完全なピクセルの)セル境界とも完全に一列に揃わないことは明らかである。したがって、例えば、ピクセルP24を含むセルの視差値は、おそらく、P11〜P16に関するマップ1のセルの視差と、ピクセルP18〜P19を含むマップ1のセルの視差とに基づく。そのような変換は、追加の処理リソースを必要とする。
しかし、すべての解像度のピクセル境界で整合するセル境界を提供することによって、すべての解像度のセルの視差値は、セルの外の領域の視差値を考慮する必要がない。加えて、視差値自体が、解像度のSCMに基づいており、したがって、現在の(しかし最終的ではない)解像度を反映するために変換される必要がない。確かに、さまざまな実装において、視差値は、例えば、字幕の配置などの処理の前のいかなる時点においても変換される必要がない。
ここで、我々は、視差値と内容との間の対応について検討する。再び図10を参照して、ピクセルP11〜P19およびピクセルP21〜P24が、すべて、ピクセルではなくセルであると仮定する。セルP15が最も小さな視差を有し、前景の物体を含むピクセルに対応するとさらに仮定する。視差の最小値計算を用いてマップ1からマップ2に変換すると、セルP15の視差が、セルP21〜P24に適用される。逆にマップ2からマップ1に再変換すると、セルP21〜P24の視差が、セルP11〜P19のすべてに適用される。したがって、2つの変換において、セルP15の視差が、セルP11〜P19の領域全体に広がっている。
そのような2つの変換の例は、例えば、典型的な送信環境で起こり得る。1つの実装において、ピクチャは、送信機の処理チェーン(例えば、処理チェーン810の検討を参照)によって使用される解像度に変換される。そして、受信されたピクチャは、逆に元の解像度に変換される(例えば、ビデオ画像817の検討を参照)。実際、その他の実装は、追加の変換を含む。例えば、1つの実装においては、(i)受信され、変換されたピクチャが、ピクチャをより低い解像度に変換する(第3の変換)小型スクリーンデバイス(例えば、セル電話)に提供され、(ii)次に、ユーザが、小型スクリーンデバイスからピクチャを送信し、これは、送信解像度への第4の変換を含み、(iii)ユーザの友人が、送信を受信し、ピクチャを表示する前にピクチャを変換する(第5の変換)。変換の回数が増えるにつれて、最小の視差が次第に広がって、グリッドのうちのますます多くの部分を占める可能性がある。
最小の視差の範囲が広がることの1つの影響は、字幕の配置が換わる可能性があることである。例えば、元のピクチャにおいて、ピクセルP15内の物体は、ほとんど関心のない前景の歩道である可能性がある。ピクセルP12内の人は、背景にいるが、注目の的である可能性がある。元のピクチャにおいて、字幕は、字幕テキストであり、人の見かけのデプスと同様の見かけのデプスで配置されるように意図される可能性がある。しかし、上述の2つの変換の後、ピクセルP12内の人の示される視差は、今や、ピクセルP15の前景の歩道と同じである。したがって、字幕テキストは、人の近くに、ただし、歩道と同じである見かけのデプスで配置されることになる。そのような結果は、視聴者に不快感を与える可能性がある。
上記の複数の変換の実装は、確かにさまざまな利点をもたらすことに留意されたい。加えて、さまざまな実装が、さらなる利点をもたらす可能性がある異なる視差変換関数を使用する。
一部の実装は、それら自体が分離されており、隣接していないセルを使用することに留意されたい。そのような実装においては、視差値は、必ずしも、より大きなセルの領域に関連付けられる必要がない。例えば、セルのサイズが削減される可能性がある。しかし、異なる解像度のセルが境界のすべてで一列に揃わないとすると、通常、基礎となる内容の何らかの不一致が存在する。したがって、そのような実装は、概して、いくつかの利点をもたらすが、必ずしもスケール非依存視差セルの利点のすべてをもたらすとは限らない。
図17を参照すると、プロセス1700が与えられている。プロセス1700は、スケール非依存視差マップの生成および使用のさまざまな態様を扱う。
プロセス1700は、どの解像度をサポートすべきかを決定すること(1705)を含む。例えば、本出願で検討される1または複数の実装においては、解像度1280×720、1440×1080、および1920×1080がサポートされる。
プロセス1700は、スケール非依存セルのサイズを決定すること(1710)を含む。例えば、3つの解像度1280×720、1440×1080、および1920×1080に関して、最も小さなスケール非依存セルのサイズは、SCM解像度11,520×2160に基づいて72DU×6VUである。最も小さなスケール非依存セルのサイズに関する、1または複数の実装において使用される式は、
Figure 2014523660
であり、ここで、この例に関しては、R、R、およびRは、対象の水平解像度かまたは垂直解像度かのどちらかであり、N=3であり、「r」は、(水平が考慮されているのかまたは垂直が考慮されているのかに応じてDUまたはVUでの)単位数である。したがって、例示的な水平解像度1280、1440、および1920に関して、内側の分子は、11,520であるSCM(1280,1440,1920)になり、式は、
Figure 2014523660
になる。
垂直解像度に関する同様の計算は、結果が6になる。したがって、スケール非依存セルのサイズは、(この場合)72DUの整数倍である幅と、(この場合)6VUの整数倍である高さとを用いて選択される可能性がある。
プロセス1700は、例えば、密な視差マップを受信することによって密な視差マップにアクセスすること(1715)を含む。その他の実装は、視差値を推定すること、または受信されるかもしくは推定されるかのどちらかのデプス値に基づいて視差値を計算することによって密な視差マップを生成する。さらに他の実装は、密な視差マップにアクセスしない。
プロセス1700は、1または複数のセルの視差値を決定すること(1720)を含む。セルの視差値は、例えば、密な視差マップからの視差値に対する(本出願に記載の)平均関数または最小値関数を使用することによって決定される。
プロセス1700は、1または複数のセルの視差値をSCM視差値にアップコンバートすること(1725)を含む。1つの実装においては、動作1720において決定されたセルの視差値が、この動作1725においてSCM視差値にアップコンバートされる。異なる実装においては、ピクセルに基づく視差値が、動作1720の前にSCM視差値にアップコンバートされる。したがって、異なる実装においては、動作1720において生成された1または複数のセルの視差値が既にSCM視差値であり、動作1725が省略される。
プロセス1700は、スケール非依存視差マップをフォーマットすること(1730)を含む。スケール非依存視差マップは、異なる実装においてさまざまな異なる方法でフォーマットされる。いくつかの例がこの後に続き、それらのそれぞれは、所与の視差マップのセルのSCMに基づくスケール非依存視差値をフォーマットする。
第1のフォーマットの実装においては、(i)特定の解像度のみがサポートされ、(ii)特定のセルのサイズのみが使用されなければならず、(iii)セルの視差値が特定のセルの順番でフォーマットされなければならないことが理解される。したがって、例えば、セルのサイズのDUおよびVUと、視差マップ内のセルの数とが、決定され得る。この第1のフォーマットの実装においては、スケール非依存視差マップは、以下の擬似コードを用いて形成される。
for(i=0;i<“セルの数”;i++){
cell(i)に関するSCMに基づくスケール非依存視差}
第2のフォーマットの実装においては、異なるセルのサイズがサポートされる。しかし、それぞれのセルのサイズに関して、セルの視差値が、特定のセルの順番でフォーマットされなければならない。したがって、この第2のフォーマットの実装は、セルのサイズを選択し、それが、視差マップ内のセルの数を決定する。セルのサイズの選択は、「セルサイズフラグ(cell size flag)」を用いて示される。例えば、4つの異なるセルのサイズがサポートされる場合、2ビットのフラグが、セルのサイズの選択を指示するために使用される。この第2のフォーマットの実装においては、スケール非依存視差マップは、以下の擬似コードを用いて形成される。
“セルサイズフラグ”;
for(i=0;i<“セルの数”;i++){
cell(i)に関するSCMに基づくスケール非依存視差}
第1のフォーマットの実装の変更形態においては、完全な視差マップが、第1のフォーマットの実装を用いて形成される。しかし、1または複数のセルの視差値を変更する更新は、新しい視差マップ全体を形成することなく形成され得る。この変更形態においては、「更新されるセルの数」と、これらの更新されるセルのそれぞれの「セル番号」とが与えられる。この変更形態においては、スケール非依存視差マップに対する更新は、以下の擬似コードを用いて形成される。
“更新されるセルの数”;
for(i=0;i<“更新されるセルの数”;i++){
“セル番号”(i);
cell(i)に関するSCMに基づくスケール非依存視差}
第3のフォーマットの実装においては、限られた数のセルのみが使用される。特定のセルのサイズが、上述の第1のフォーマットの実装のように使用されると仮定される。しかし、視差値は、例えば、物体のコーナーまたは物体のエッジなどの対象の特徴を含むセルに関してのみ計算される。この第3のフォーマットの実装においては、使用される「セルの数」が決定され、セル識別子も決定される。セル識別子は、この第3のフォーマットの実装の1つの変更形態においては、例えば、例えばDUおよびVUで表された左上隅のピクセルおよび右下隅のピクセルの座標などの各セルの座標である。別の変更形態において、セル識別子は「セル番号」である。この第3のフォーマットの実装のさらに他の変更形態においては、複数のセルのサイズが使用可能であり、「セルサイズフラグ」が、上述の第2のフォーマットの実装で示されたように、選択されたセルのサイズを指示するために使用される。この第3のフォーマットの実装の1つの変更形態においては、スケール非依存視差マップは、以下の擬似コードを用いて形成される。
“セルの数”;
for(i=0;i<“セルの数”;i++){
“セル番号”(i);
cell(i)に関するSCMに基づくスケール非依存視差}
プロセス1700は、スケール非依存視差マップを符号化すること(1735)を含む。スケール非依存視差マップは、例えば、SCMに基づく視差マップ、またはただ1つのディスプレイ解像度に関して生成された視差を提供する視差マップである。
プロセス1700は、スケール非依存視差マップを記憶することおよび/または送信すること(1740)を含む。スケール非依存視差マップは、例えば、符号化されたSCMに基づく視差マップ、符号化されたSCMに基づかない視差マップ、符号化されていないSCMに基づく視差マップ、または符号化されていないSCMに基づかない視差マップである。特定のアプリケーションにおいては、符号化されていない視差マップが記憶され、符号化された視差マップが送信される。したがって、1つのアプリケーションにおいては、動作1730からのフォーマットされた視差マップが記憶され、さらに符号化され、動作1735からの符号化された視差マップが送信される。
プロセス1700は、スケール非依存視差マップにアクセスすること(1745)を含む。1つの実装において、動作1745は、送信された符号化されたスケール非依存視差マップを受信することによってスケール非依存視差マップにアクセスする受信機で行われる。別の実装においては、動作1745は、記憶されたスケール非依存視差マップを取得することによってスケール非依存視差マップにアクセスするポストプロセッサーで行われる。ポストプロセッサーは、例えば、字幕に関する視差および/またはデプスを決定することなど、視差マップを使用する処理を実行するために視差マップを取得する。
プロセス1700は、スケール非依存視差マップを復号すること(1750)を含む。1つの実装において、動作1750は、受信機が、伝送チャネルを介して視差マップを受信した後、符号化されたスケール非依存視差マップを復号することを含む。
プロセス1700は、解像度を選択すること(1755)を含む。1つの実装において、解像度は、いくつかのサポートされる解像度の中から選択される。例えば、水平解像度1920が、1280、1440、および1920の中から選択される。
プロセス1700は、1または複数のSCMに基づく視差値を特定の解像度にダウンコンバートすること(1760)を含む。1つの実装において、SCMに基づくスケール非依存視差マップは、SCMによってサポートされるいくつかの解像度の中から選択された解像度にダウンコンバートされる。例えば、SCM11,520に基づく視差値が、視差値を6で割ることによって水平解像度1920にダウンコンバートされる。
プロセス1700は、1または複数のセルを対応するピクセル位置に関連付けること(1765)を含む。1つの実装においては、SCMに基づくスケール非依存視差セルが、所与の解像度のピクチャ内の対応するピクセル位置にマッピングされる。さらに、所与の解像度は、SCMによってサポートされるいくつかの解像度から選択される。そのような実装は、例えば、特定のセルに関する視差が、対応するピクチャ内の特定のピクセル位置とそれらのピクセル位置に示される物体とによって特定されることを可能にする。1つの実装においては、SCM解像度11,520×2160が、セルのサイズ72DU×6VUとともに使用される。この実装においては、セルは、例えば、(72DU,6VU)で始まるセルのように、その左上のコーナーの(DU,VU)座標によって特定される。そのセルに関連するピクセル位置は、セルの(DU,VU)座標をピクセルの(DU,VU)サイズで割ることによって決定される。解像度1920×1080が選択される場合、既に説明されたように、ピクセルサイズは(6DU,2VU)である。この実装に関して、(72DU,6VU)のセルに関連するピクセル位置は、ピクセル位置(12,3)から始まり、ピクセル位置(24,6)まで延びる(ただしこのピクセル位置を含まない)ピクセルである。
プロセス1700は、1または複数の関連する視差値を使用してピクチャを処理すること(1770)を含む。1つの実装において、視差マップからの視差値は、対応するピクチャ内のピクセル位置に関連付けられる。ピクチャはピクチャのステレオ画像のペアの一部であり、ステレオ画像のペアの各ピクチャは字幕を含む。ステレオ画像のペアのピクチャのうちの少なくとも一方は、字幕のピクセル位置に関連する視差値によって示される視差の量を字幕に与えるように処理される。
図18を参照すると、プロセス1800が示されている。プロセス1800は、解像度不変領域に関する解像度に固有の属性を決定すること(1810)を含む。解像度に固有の属性は、解像度に依存する値を有する属性である。視差は、解像度に依存する属性の例である。
その他の解像度に固有の属性は、例えば、「粒状性(graininess)」または「テクスチャ特性(texture characteristics)」を含む。特定の実装においては、さまざまなテクスチャ特性が、いくつかのピクセルによって定義される。例えば、1つの実装においては、平均粒子サイズ(grain size)および標準偏差が、ピクセルを単位として定義される。別の実装においては、繰り返しの多いテクスチャのピッチが、ピクセルを単位として定義される。
別の解像度に固有の属性は、例えば、ピクセルで表される確実性または信頼性である。1つの実装においては、確実性/信頼性は、ピクセルで計測される予測される誤差を表す。
解像度不変領域は、第1の解像度において第1の整数個のピクセルと同一の広がりを持ち、第2の解像度において第2の整数個のピクセルと同一の広がりを持つ(例えば、ピクチャの)領域である。動作1810は、1つの実装においては、1または複数のセルの視差値を決定する動作1720によって実行される。
プロセス1800は、組み合わせ解像度に関連するように属性を変換すること(1820)を含む。組み合わせ解像度は、第1の解像度と第2の解像度との組み合わせとして決定された解像度である。変換された属性は、領域に固有であり、組み合わせ解像度にも固有である。動作1820は、1つの実装においては、1または複数のセルの視差値をSCM視差値にアップコンバートする動作1725によって実行される。
図19を参照すると、プロセス1900が示されている。プロセス1900は、ピクチャの解像度不変領域に関する組み合わせ解像度に固有の属性にアクセスすること(1910)を含む。属性は、解像度に依存する値を含んでおり、組み合わせ解像度および領域に固有である。加えて、解像度不変領域は、特定の解像度において第1の整数個のピクセルと同一の広がりを持ち、第2の解像度において第2の整数個のピクセルと同一の広がりを持つ(例えば、ピクチャの)領域である。さらに、組み合わせ解像度は、特定の解像度と第2の解像度との組み合わせとして決定された解像度である。動作1910は、1つの実装においては、スケール非依存視差マップにアクセスする動作1745によって実行される。
プロセス1900は、属性が特定の解像度に関連するようにそれを変換すること(1920)を含む。変換された属性は、領域および特定の解像度に固有である。動作1920は、1つの実装においては、1または複数のSCMに基づく視差値を特定の解像度にダウンコンバートする動作1760によって実行される。
プロセス1900は、変換された属性を特定の解像度の領域のピクセルに関連付けること(1930)を含む。変換された属性は、特定の解像度の第1の整数個のピクセルに関連付けられる。動作1930は、1つの実装においては、1または複数のセルを対応するピクセル位置に関連付ける動作1765によって実行される。
ここで図20を参照すると、上述の特徴および原理が適用され得るビデオ送信システムまたは装置2000が示されている。ビデオ送信システムまたは装置2000は、例えば、衛星、ケーブル、電話回線、または地上波放送などのさまざまな媒体のいずれかを使用して信号を送信するための、例えば、ヘッドエンドまたは送信システムである可能性がある。ビデオ送信システムまたは装置2000は、さらに、または代替的に、例えば、記憶するための信号を提供するために使用される可能性がある。送信は、インターネットまたは何らかのその他のネットワークを介して行われ得る。ビデオ送信システムまたは装置2000は、例えば、デプスおよび/または視差値を含む、例えば、デプスのインジケータなどの、例えば、ビデオコンテンツおよびその他のコンテンツを生成し、配信することができる。図20のブロックが、ビデオ送信システムまたは装置のブロック図を提供することに加えて、ビデオ送信プロセスのフロー図を提供することは明らかであるに違いない。
ビデオ送信システムまたは装置2000は、プロセッサー2001から入力ビデオを受信する。1つの実装において、プロセッサー2001は、単純に、視差画像821、831、841、および/またはビデオ画像811などの元の解像度の画像をビデオ送信システムまたは装置2000に与える。しかし、別の実装においては、プロセッサー2001は、例えば、ビデオ画像813および/または視差画像823、833、843などの画像を提供するための動作812、822、832、842に関連して上で説明されたように濾波およびダウンサンプリングを実行するように構成されたプロセッサーである。さらに別の実装においては、プロセッサー2001は、例えば、視差画像860などの変換された視差値を有する視差画像を生成するための、例えば、動作850などの視差変換を実行するように構成される。さらに別の実装においては、プロセッサー2001は、プロセス1700のさまざまな動作、例えば、動作1705〜1730を実行するように構成される。さらに別の実装においては、プロセッサー2001は、プロセス1800のすべてまたは一部を実行するように構成される。さらに、プロセッサー2001は、ビデオ送信システムまたは装置2000にメタデータを提供し、例えば、入力画像の水平解像度と、視差値が基づく水平解像度と、視差値が百分率に基づくのか、または公倍数に基づくのかと、入力画像のうちの1つまたは複数を示すその他の情報とを示す可能性がある。
ビデオ送信システムまたは装置2000は、符号化器2002と、符号化された信号を送信することができる送信機2004とを含む。符号化器2002は、プロセッサー2001からビデオ情報を受信する。ビデオ情報は、例えば、ビデオ画像および/または視差(もしくはデプス)画像を含む可能性がある。符号化器2002は、ビデオ情報および/または視差情報に基づいて(1または複数の)符号化された信号を生成する。符号化器2002は、例えば、AVC符号化器である可能性がある。AVC符号化器は、ビデオ情報と視差情報との両方に適用され得る。AVCは、既存の国際標準化機構/国際電気標準会議(ISO/IEC)の動画専門家グループ−4(MPEG−4:Moving Picture Experts Group−4)パート10 高度ビデオ符号化(AVC:Advanced Video Coding)規格/国際電気通信連合、電気通信部門(ITU−T)H.264勧告(以降、「H.264/MPEG−4 AVC規格」、または「AVC規格」、「H.264規格」、もしくは単に「AVC」または「H.264」などのその変形)を指す。
符号化器2002は、例えば、さまざまな情報を受信し、それらの情報を記憶または送信のための構造化されたフォーマットへと組み立てるための組立ユニットを含むサブモジュールを含む可能性がある。さまざまな情報は、例えば、符号化されたまたは符号化されていないビデオと、符号化されたまたは符号化されていない視差(またはデプス)値と、例えば、動きベクトル、符号化モードインジケータ(coding mode indicator)、および構文要素(syntax element)などの符号化されたまたは符号化されていない要素とを含む可能性がある。一部の実装において、符号化器2002は、プロセッサー2001を含み、したがって、プロセッサー2001の動作を実行する。
送信機2004は、符号化器2002から(1または複数の)符号化された信号を受信し、1または複数の出力信号で(1または複数の)符号化された信号を送信する。送信機2004は、例えば、符号化されたピクチャおよび/またはそれに関連する情報を表す1または複数のビットストリームを有するプログラム信号を送信するように適合され得る。典型的な送信機は、例えば、誤り訂正符号化を行うことと、信号のデータをインターリーブすることと、信号のエネルギーをランダム化することと、変調器2006を使用して信号を1もしくは複数の搬送波に変調することとのうちの1つまたは複数などの機能を実行する。送信機2004は、アンテナ(図示せず)を含むか、またはアンテナ(図示せず)とインターフェースを取ることができる。さらに、送信機2004の実装は、変調器2006に限られる可能性がある。
さらに、ビデオ送信システムまたは装置2000は、記憶ユニット2008に通信可能なように結合される。1つの実装において、記憶ユニット2008は、符号化器2002に結合され、符号化器2002からの符号化されたビットストリームを記憶する。別の実装においては、記憶ユニット2008は、送信機2004に結合され、送信機2004からのビットストリームを記憶する。送信機2004からのビットストリームは、例えば、送信機2004によってさらに処理された1または複数の符号化されたビットストリームを含む可能性がある。記憶ユニット2008は、異なる実装においては、標準的なDVD、ブルーレイディスク、ハードドライブ、または何らかのその他の記憶装置のうちの1つまたは複数である。
ここで図21を参照すると、上述の特徴および原理が適用され得るビデオ受信システムまたは装置2100が示されている。ビデオ受信システムまたは装置2100は、例えば、衛星、ケーブル、電話回線、または地上波放送などのさまざまな媒体を介して信号を受信するように構成され得る。信号は、インターネットまたは何らかのその他のネットワークを介して受信される可能性がある。図21のブロックが、ビデオ受信システムまたは装置のブロック図を提供することに加えて、ビデオ受信プロセスのフロー図を提供することは明らかであるに違いない。
ビデオ受信システムまたは装置2100は、例えば、セル電話、コンピュータ、セットトップボックス、ルータ、テレビ、または符号化されたビデオを受信し、例えば、復号されたビデオ信号を、表示する(例えば、ユーザに対して表示する)ため、処理するため、または記憶するために提供するその他のデバイスである可能性がある。したがって、ビデオ受信システムまたは装置2100は、その出力を、例えば、テレビのスクリーン、コンピュータモニター、(記憶、処理、もしくは表示するための)コンピュータ、または何らかのその他の記憶、処理、もしくはディスプレイ装置に提供することができる。
ビデオ受信システムまたは装置2100は、ビデオ情報を受信し、処理することができ、ビデオ情報は、例えば、ビデオ画像および/または視差(もしくはデプス)画像を含む可能性がある。ビデオ受信システムまたは装置2100は、例えば、本出願の実装で示された信号などの符号化された信号を受信するための受信機2102を含む。受信機2102は、例えば、ビデオ画像815および/もしくは視差画像825のうちの1つもしくは複数を提供する信号、または図20のビデオ送信システム2000から出力された信号を受信することができる。1つの実装において、受信機2102は、動作1730に関連して検討された擬似コードの実装のうちの1つまたは複数にしたがって形成されたデータを提供する信号を受信する。別の実装においては、受信機2102は、プロセス1800の出力からのデータを提供する信号を受信する。
受信機2102は、例えば、符号化されたピクチャを表す複数のビットストリームを有するプログラム信号を受信するように適合され得る。典型的な受信機は、例えば、変調され、符号化されたデータ信号を受信することと、復調器2104を使用して1もしくは複数の搬送波からデータ信号を復調することと、信号のエネルギーのランダム化を解除することと、信号のデータのインターリーブを解除することと、信号を誤り訂正復号することとのうちの1つまたは複数などの機能を実行する。受信機2102は、アンテナ(図示せず)を含むか、またはアンテナ(図示せず)とインターフェースを取ることができる。受信機2102の実装は、復調器2104に限られる可能性がある。
ビデオ受信システムまたは装置2100は、復号器2106を含む。受信機2102は、受信された信号を復号器2106に与える。受信機2102によって復号器2106に与えられる信号は、1または複数の符号化されたビットストリームを含み得る。復号器2106は、例えば、ビデオ情報を含む復号されたビデオ信号などの復号された信号を出力する。復号器2106は、例えば、AVC復号器である可能性がある。
さらに、ビデオ受信システムまたは装置2100は、記憶ユニット2107に通信可能なように結合される。1つの実装において、記憶ユニット2107は、受信機2102に結合され、受信機2102が、記憶ユニット2107からのビットストリームにアクセスする。別の実装においては、記憶ユニット2107は、復号器2106に結合され、復号器2106が、記憶ユニット2107からのビットストリームにアクセスする。記憶ユニット2107からのアクセスされるビットストリームは、異なる実装においては、1または複数の符号化されたビットストリームを含む。記憶ユニット2107は、異なる実装においては、標準的なDVD、ブルーレイディスク、ハードドライブ、または何らかのその他の記憶装置のうちの1つまたは複数である。
1つの実装においては、復号器2106からの出力ビデオが、プロセッサー2108に与えられる。プロセッサー2108は、1つの実装においては、例えば、アップサンプリング動作816および/または826に関連して説明されたアップサンプリングなどのアップサンプリングを実行するように構成されたプロセッサーである。別の実装においては、プロセッサー2108は、例えば、動作1755〜1765のすべてもしくは一部、またはプロセス1900を実行するように構成される。別の実装においては、プロセッサー2108は、例えば、動作1770、または例えばプロセス1900の出力によって与えられた視差値および関連する情報を使用する後処理などの後処理を実行するように構成される。
一部の実装において、復号器2106は、プロセッサー2108を含み、したがって、プロセッサー2108の動作を実行する。その他の実装においては、プロセッサー2108は、例えば、セットトップボックス、ルータ、コンピュータ、タブレットまたはテレビなどのダウンストリームデバイスの一部である。
その他の実装は、本出願において与えられた例によって想定されている。例えば、解像度960×640、1280×720、1440×1080、および1920×1080のSCMは、11,520×17,280である。「17,280」は、例えば、本出願で上述した11,520と同じようにして計算される。「17,280」は、640*27に等しい。このSCMは、ピクセルサイズ12DU×27VU、9DU×24VU、8DU×16VU、および6DU×16VUをそれぞれもたらす。これらのピクセルサイズは、72DU(または整数倍)×432VU(または整数倍)のスケール非依存視差マップのセルサイズをもたらす。
少なくとも1つの実装は2つの視差マップが生成されることを可能にするために特別なビットを使用することに留意されたい。第1の視差マップは、「左の」像に関して計算され、第2の視差マップは、「右の」像に関して計算される。物体が隠蔽される可能性があるとすると、2つの視差マップを有することは、隠蔽の改善された処理を可能にする。例えば、対応する視差値を比較することによって、システムは、隠蔽が存在するかどうかを判定し、存在する場合、結果として生じる穴を埋めるためのステップを行うことができる。さらなる実装は、より多くの視差マップを提供し、視差マップの数に対応するように適切な数のビットを割当てる。例えば、例えばMVC(これは、MVC拡張付きのAVC(Annex G)を指す)などの多視点(multi−view)の状況においては、あらゆる視点からあらゆる他の視点への計算された視差を示す一組の視差マップを送信することが望ましい可能性がある。代替的に、実装は、視点のサブセットに関する視差マップのみを送信する可能性がある。
視差は、例えば、動きベクトルを計算するのと同様にして計算され得る。代替的に、視差は、知られており、上で説明されているように、デプス値から計算され得る。
また、さまざまな実装は、デプス値の代わりに視差値を使用することによる利点を有する。そのような利点は、(1)デプス値が限りなく大きくなる可能性があり、したがって、表現/符号化することがより難しい一方、視差値は有限であること、(2)潜在的に非常に大きなデプス値を表現するために、多くの場合、対数のスケール化が必要とされる一方、視差値は直接表現され得ることを含む可能性がある。加えて、視差からデプスを決定することは概して容易である。焦点距離、ベースライン距離(長さ)、および輻湊平面距離などの情報を提供するために、さまざまな実装にメタデータが含まれる。輻湊平面距離は、カメラが輻湊しているときにカメラの軸が交差する距離である。カメラの軸が交差する地点は、図4において、角410の頂点として見られ得る。カメラが平行であるときは、輻湊平面距離は、無限大の距離にある。
本出願に記載の実装は、さまざまな属性に適用され得る。1つのそのような属性は、視差である。
− しかし、その他の実装は、解像度に固有であるその他の属性を使用する。既に説明されたように、解像度に固有の属性は、解像度に依存する値を有する属性である。視差は、解像度に依存する属性の例である。その他の例は、粒状性および信頼性を含む。
− さまざまな実装は、例えば、解像度に固有ではないデプスなどの属性を使用する。そのような属性は、解像度が変更されるときに修正される必要がないSCMに基づく視差値とある面では似ている。
解像度間の変換中に視差値を決定するために加重平均または最小値関数を使用するさまざまな実装が、記載されている。その他の実装は、例えば、非加重平均、最大値(最大の視差を使用する)、最頻値(mode)、中央値、内挿、またはさまざまな濾波関数のいずれかなどの異なる関数を使用する。
一部の実装は特定の利点または欠点を有することが留意される。しかし、実装の欠点の検討は、その実装の利点を消し去ることはなく、実装が、実現可能であり、さらには推奨される実装ではないことを示すこともない。
さまざまな実装は、信号および/または信号の構造を生成または処理する。そのような信号は、特定の実装において、動作1730の検討で説明された擬似コードなどの擬似コードを使用して形成される。信号は、さまざまな実装において、プロセッサー2001、符号化器2002、送信機2004、受信機2102、復号器2106、またはプロセッサー2108の出力で生成される。信号および/または信号の構造は、さまざまな実装において(例えば、プロセッサー可読媒体で)送信および/または記憶される。
特定の実装において、信号または信号の構造は、ピクチャの領域に関する属性を示すデータを含む属性部分を含む。属性は、領域および組み合わせ解像度に固有である。組み合わせ解像度は、特定の解像度と第2の解像度との組み合わせとして決定される。ピクチャの領域は、特定の解像度において第1の整数個のピクセルと同一の広がりを持ち、第2の解像度において第2の整数個のピクセルと同一の広がりを持つ。
加えて、その他の実装は、セルのサイズ、セルの位置、およびその他のメタデータに関連するデータに関する信号または信号の構造内の部分を含む。そのような信号は、さまざまな実装において、さまざまな方法のいずれかで符号化される。
本出願は、図6、8、および17〜21のブロック/フロー図を含む複数のブロック/フロー図を提供する。本出願のブロック/フロー図は、プロセスを示すフロー図と、装置の機能ブロックを示すブロック図との両方を示すことは明らかであるに違いない。加えて、本出願は、図1〜5の図形表現を含む複数の図形表現を提供する。本出願の図形表現は、(i)例、結果、または出力と、(ii)プロセスを示すフロー図との両方を示すことは明らかであるに違いない。加えて、本出願は、少なくとも、図7の表形式の図を提供する。表形式の図は、データの表を提供し、さらに、異なる解像度における視差値を得るためのプロセスを示すことは明らかであるに違いない。さらに、本出願は、図9〜16のブロック/図形表現を含む複数のブロック/図形表現を提供する。本出願のブロック/図形表現は、さまざまなデータフォーマットおよび解像度の態様を示すブロック図と、コンポーネントとコンポーネントの出力との間の関係を示す図形表現との両方を示すことは明らかであるに違いない。
さらに、本出願で説明された実装の動作、ブロック、入力、または出力のうちの多くは、これらの実装の説明および検討で明確に述べられていないとしても任意である。例えば、既に検討されたように、プロセス1700の動作のいずれかが、さまざまな実装において省略される可能性がある。特定の実装の特徴の単なる説明は、特徴がすべての実装に必須であることを示すものではない。実際は、概して、その反対の結論が通常の解釈であるべきであり、すべての特徴は、そのような特徴が必要とされると述べられていない限り任意であると見なされる。特徴が必要とされると述べられている場合であっても、その必要条件は、その特定の実装にのみ当てはまるように意図されており、その他の実装は、そのような必要条件に縛られないと見なされる。
したがって、我々は、特定の特徴および態様を有する1または複数の実装を提供する。特に、我々は、密な視差マップに関連するいくつかの実装を提供し、疎な視差マップに関連するいくつかの実装も提供する。密な視差マップは、例えば、コンシューマデバイスにおける比較的複雑な3Dエフェクトの調整などのさまざまなアプリケーションを可能にすることができる。疎な視差マップは、例えば、ポストプロダクションでの比較的単純な字幕の配置などのさまざまなアプリケーションを可能にすることができる。しかし、これらの実装の変更形態およびさらなるアプリケーションが想定され、我々の開示の範囲内にあり、記載された実装の特徴および態様は、その他の実装のために適合され得る。
+80ピクセルから−150ピクセルまでの範囲が、1または複数の特定のディスプレイサイズに対して、上述の実装のうちの少なくとも1つで使用されることに留意されたい。しかし、その他の実装においては、それらの特定のディスプレイサイズに対してであっても、範囲の境界値および/または範囲自体のサイズを変更する異なる視差範囲が使用される。1つの実装においては、テーマパークにおける表示が、より劇的な効果のために(例えば、スクリーンから中間を超えて飛び出してくる物体を描くために)負の方向によりいっそう大きな視差を使用する。別の実装においては、業務用のデバイスが、コンシューマデバイスよりも広い視差の範囲をサポートする。
本出願に記載の実装および特徴のうちのいくつかは、AVC規格、および/またはMVC拡張付きのAVC(Annex H)、および/またはSVC拡張付きのAVC(Annex G)に関連して使用され得る。加えて、これらの実装および特徴は、(既存のもしくは将来の)別の規格に関連して使用されるか、または規格とは関係のないところで使用される可能性がある。
本原理の「一実施形態」または「実施形態」または「1つの実装」または「実装」との言及およびそれらの他の変化形は、その実施形態に関連して説明された特定の特徴、構造、特性などが本原理の少なくとも1つの実施形態に含まれることを意味する。したがって、本明細書中のさまざまな場所に現れる表現「一実施形態において」または「実施形態において」または「1つの実装において」または「実装において」および任意のその他の変化形が現れることは、必ずしもすべてが同じ実施形態に言及しているとは限らない。
加えて、本出願またはその請求項は、さまざまな情報を「決定すること」に言及する可能性がある。情報を決定することは、例えば、情報を推定すること、情報を計算すること、情報を評価すること、情報を予測すること、またはメモリから情報を取得することのうちの1つまたは複数を含み得る。
さらに、本出願またはその請求項は、さまざまな情報に「アクセスすること」に言及する可能性がある。情報にアクセスすることは、例えば、情報を受信すること、情報を取得すること(例えば、メモリ)、情報を記憶すること、情報を処理すること、情報を送信すること、情報を移動すること、情報をコピーすること、情報を削除すること、情報を計算すること、情報を決定すること、情報を予測すること、または情報を推定することのうちの1つまたは複数を含み得る。
加えて、本出願またはその請求項は、さまざまな情報を「受信すること」に言及する可能性がある。受信することは、「アクセスすること」と同様に、幅広い用語であるように意図される。情報を受信することは、例えば、情報にアクセスすること、または(例えば、メモリから)情報を取得することのうちの1つまたは複数を含み得る。さらに、「受信すること」は、通常、例えば、情報の記憶、情報の処理、情報の送信、情報の移動、情報のコピー、情報の削除、情報の計算、情報の決定、情報の予測、または情報の推定などの動作中にさまざまな形で含まれる。
さまざまな実装は、「画像」および/または「ピクチャ」に言及する。用語「画像」および「ピクチャ」は、本明細書全体を通じて交換可能なように使用され、幅広い用語であるように意図される。「画像」または「ピクチャ」は、例えば、フレームまたはフィールドのすべてまたは一部である可能性がある。用語「ビデオ」は、一連の画像(またはピクチャ)を指す。画像またはピクチャは、例えば、さまざまなビデオコンポーネントのいずれかまたはそれらの組み合わせを含み得る。そのようなコンポーネントまたはそれらの組み合わせは、例えば、輝度、クロミナンス(chrominance)、(YUVまたはYCbCrまたはYPbPrの)Y、(YUVの)U、(YUVの)V、(YCbCrの)Cb、(YCbCrの)Cr、(YPbPrの)Pb、(YPbPrの)Pr、(RGBの)赤、(RGBの)緑、(RGBの)青、Sビデオ、およびこれらのコンポーネントのいずれかのネガ(negatives)またはポジ(positives)を含む。「画像」または「ピクチャ」は、さらに、または代替的に、例えば、典型的な2次元のビデオ、2Dビデオピクチャに関する視差マップ、2Dビデオピクチャに対応するデプスマップ、またはエッジマップを含む、さまざまな異なる種類の内容を指す可能性もある。
さらに、多くの実装は、「フレーム」に言及する可能性がある。しかし、そのような実装は、「ピクチャ」または「画像」に等しく適用可能であると見なされる。
「デプスマップ」または「視差マップ」または「エッジマップ」または同様の用語も、幅広い用語であるように意図される。概して、マップは、例えば、特定の種類の情報を含むピクチャを指す。しかし、マップは、その名称によって示されないその他の種類の情報を含む可能性がある。例えば、デプスマップは、通常、デプス情報を含むが、例えば、ビデオまたはエッジ情報などのその他の情報も含む可能性がある。
所与のディスプレイは、複数の異なる解像度をサポートする可能性があることが理解される。したがって、所与のディスプレイは、例えば、1280か、1440か、または1920かのどれかの解像度を有するビデオコンテンツを表示することができる可能性がある。それにもかかわらず、所与のディスプレイは、サポートされる最も高い解像度が1920であるので、多くの場合、1920ディスプレイと呼ばれる。大型のディスプレイが小さな解像度の画像を表示しているとき、画像の個々の要素は、複数のピクセルを含む可能性がある。例えば、ディスプレイは、水平解像度800および1920をサポートすることができる場合、通常、少なくとも1920ピクセル幅である。ディスプレイが解像度800の画像を表示しているとき、ディスプレイは、画像の各要素に少なくとも3ピクセル以上の部分を割当てる可能性がある。
さまざまな実装は、視差値の浮動小数点表現を使用する。そのような実装の特定の変更形態は、浮動小数点表現の代わりに、視差値の固定小数点表現を使用する。
例えば、「A/B」、「Aおよび/またはB」、および「AおよびBのうちの少なくとも一方」の場合の以下の「/」、「および/または」、および「〜のうちの少なくとも一方」のいずれかの使用は、1番目に挙げられた選択肢(A)のみの選択、または2番目に挙げられた選択肢(B)のみの選択、または両方の選択肢(AおよびB)の選択を包含するように意図されることを理解されたい。さらなる例として、「A、B、および/またはC」および「A、B、およびCのうちの少なくとも1つ」および「A、B、またはCのうちの少なくとも1つ」の場合、そのような表現法は、1番目に挙げられた選択肢(A)のみの選択、または2番目に挙げられた選択肢(B)のみの選択、または3番目に挙げられた選択肢(C)のみの選択、または1番目および2番目に挙げられた選択肢(AおよびB)のみの選択、または1番目および3番目に挙げられた選択肢(AおよびC)のみの選択、または2番目および3番目に挙げられた選択肢(BおよびC)のみの選択、または3つの選択肢すべて(AおよびBおよびC)の選択を包含するように意図される。これは、当業者にはすぐに分かるように、列挙される項目の数に合わせて拡張され得る。
加えて、多くの実装は、符号化器(例えば、符号化器2002)、復号器(例えば、復号器2106)、復号器からの出力を処理するポストプロセッサー(例えば、プロセッサー2108)、または符号化器に入力を与えるプリプロセッサー(例えば、プロセッサー2001)のうちの1つまたは複数に実装され得る。本出願で検討されたプロセッサーは、さまざまな実装において、例えば、プロセス、機能、または動作を実行するように集合的に構成される複数のプロセッサー(サブプロセッサー)を確かに含む。例えば、さまざまな実装において、プロセッサー2001およびプロセッサー2108は、それぞれのプロセッサー2001および2108の動作を実行するように集合的に構成される複数のサブプロセッサーによってそれぞれが構成される。さらに、その他の実装が、本開示によって想定される。
本明細書に記載の実装は、例えば、方法もしくはプロセス、装置、ソフトウェアプログラム、データストリーム、または信号で実装され得る。1つの形態の実装に関連してだけ検討された(例えば、方法としてだけ検討された)としても、検討された特徴の実装は、その他の形態(例えば、装置またはプログラム)でも実装される可能性がある。装置は、例えば、適切なハードウェア、ソフトウェア、およびファームウェアで実装され得る。例えば、方法は、概して、例えば、コンピュータ、マイクロプロセッサー、集積回路、またはプログラマブルロジックデバイスを含む処理デバイスを指す、例えば、プロセッサーなどの装置で実装され得る。プロセッサーは、例えば、コンピュータ、セル電話、タブレット、ポータブル/携帯情報端末(「PDA」)、およびエンドユーザ間の情報の通信を容易にするその他のデバイスなどの通信デバイスも含む。プロセッサーは、例えば、プロセス、機能、または動作を実行するように集合的に構成される複数のプロセッサーも含み得る。集合的な構成および実行は、例えば、特定のタスクのための専用のサブプロセッサーの使用、または並列処理の使用などの、当技術分野で知られているさまざまな技術のいずれかを使用して実現され得る。
本明細書に記載のさまざまなプロセスおよび特徴の実装は、さまざまな異なる機器またはアプリケーション、例えば特に、データの符号化と、データの復号と、像の生成と、デプスまたは視差の処理と、画像ならびに関連するデプスおよび/または視差マップのその他の処理とに関連する機器またはアプリケーションで具現化され得る。そのような機器の例は、符号化器、復号器、復号器からの出力を処理するポストプロセッサー、符号化器に入力を与えるプリプロセッサー、ビデオ符号化器、ビデオ復号器、ビデオコーデック、ウェブサーバー、セットトップボックス、ルータ、ラップトップ、パーソナルコンピュータ、タブレット、セル電話、PDA、およびその他の通信デバイスを含む。当然明らかであるように、機器は、移動式であり、さらには移動車両に取り付けられる可能性がある。
加えて、方法は、命令がプロセッサーによって(またはそのような命令を実行するように集合的に構成された複数のプロセッサーによって)実行されることによって実施される可能性があり、そのような命令(および/または実装によって生成されるデータ値)は、例えば、集積回路、ソフトウェア担体(carrier)、または例えばハードディスク、コンパクトディスク(「CD」)、(例えば、ディジタルバーサタイルディスクもしくはディジタルビデオディスクと呼ばれることが多いDVDなどの)光ディスク、ランダムアクセスメモリ(「RAM」)、もしくは読み出し専用メモリ(「ROM」)などのその他の記憶装置などのプロセッサー可読媒体に記憶される可能性がある。命令は、プロセッサー可読媒体に有形で具現化されたアプリケーションプログラムを形成することができる。命令は、例えば、ハードウェア、ファームウェア、ソフトウェア、または組み合わせの中にある可能性がある。命令は、例えば、オペレーティングシステム、別個のアプリケーション、または2つの組み合わせに見られる可能性がある。したがって、プロセッサーは、例えば、プロセスを実行するように構成されたデバイスと、プロセスを実行するための命令を有する(記憶装置などの)プロセッサー可読媒体を含むデバイスとの両方として特徴付けられる可能性がある。さらに、プロセッサー可読媒体は、命令に加えて、または命令の代わりに、実装によって生成されたデータ値を記憶する可能性がある。
当業者に明らかであろうように、実装は、例えば、記憶または送信され得る情報を搬送するようにフォーマットされたさまざまな信号を生成することができる。情報は、例えば、方法を実行するための命令、または説明された実装のうちの1つによって生成されたデータを含み得る。例えば、信号は、説明された実施形態の構文を書くまたは読むための規則をデータとして搬送するように、または説明された実施形態によって書かれる実際の構文値(syntax−value)をデータとして搬送するようにフォーマットされる可能性がある。そのような信号は、例えば、(例えば、スペクトルの無線周波数の部分を使用する)電磁波として、またはベースバンド信号としてフォーマットされる可能性がある。フォーマットは、例えば、データストリームの符号化と、符号化されたデータストリームによる搬送波の変調とを含む可能性がある。信号が搬送する情報は、例えば、アナログ情報またはディジタル情報である可能性がある。信号は、知られているように、さまざまな異なる有線または無線リンクを介して送信される可能性がある。信号は、プロセッサー可読媒体に記憶される可能性がある。
いくつかの実装が、説明された。しかしながら、さまざまな修正がなされ得ることが理解されるであろう。例えば、異なる実装の要素が、その他の実装をもたらすように組み合わされるか、補足されるか、修正されるか、または取り除かれる可能性がある。加えて、当業者は、その他の構造およびプロセスが、開示された構造およびプロセスの代わりにされる可能性があり、結果として得られる実装が、開示された実装と少なくとも実質的に同じ(1または複数の)機能を、少なくとも実質的に同じ(1または複数の)方法で実行して、少なくとも実質的に同じ(1または複数の)結果を実現することを理解するであろう。したがって、これらのおよびその他の実装は、本出願によって想定される。

Claims (42)

  1. ピクチャの領域に関する属性を決定するステップであって、前記ピクチャは特定の解像度を有し、前記属性は前記特定の解像度および前記領域に固有であり、前記ピクチャの前記領域は、前記特定の解像度において第1の整数個のピクセルと同一の広がりを持ち、第2の解像度において第2の整数個のピクセルと同一の広がりを持つ、ステップと、
    前記属性を変換して、前記領域に固有であり、前記特定の解像度と前記第2の解像度との組み合わせとして決定される組み合わせ解像度に固有である属性をもたらすステップと、
    を含む、方法。
  2. 前記領域のサイズは、(i)前記特定の解像度におけるピクセルのピクセル寸法と、(ii)前記第2の解像度におけるピクセルのピクセル寸法との組み合わせに基づく、請求項1に記載の方法。
  3. 領域の幅は、前記特定の解像度および前記第2の解像度を含む一組の解像度の中の解像度のピクセルのピクセル幅の倍数に基づき、
    領域の高さは、前記一組の解像度の中の解像度のピクセルのピクセル高さの倍数に基づく、請求項2に記載の方法。
  4. 前記特定の解像度は、特定の水平解像度を含み、
    前記第2の解像度は、第2の水平解像度を含み、
    前記組み合わせ解像度は、組み合わせ水平解像度を含み、
    前記一組の解像度の中の所与の解像度の前記ピクセル幅は、前記組み合わせ水平解像度を前記所与の解像度の水平解像度で割った数に基づく、請求項3に記載の方法。
  5. 前記特定の解像度は、特定の垂直解像度を含み、
    前記第2の解像度は、第2の垂直解像度を含み、
    前記組み合わせ解像度は、組み合わせ垂直解像度を含み、
    前記一組の解像度の中の所与の解像度の前記ピクセル高さは、前記組み合わせ垂直解像度を前記所与の解像度の垂直解像度で割った数に基づく、請求項3に記載の方法。
  6. 前記組み合わせ解像度は、少なくとも前記特定の解像度および前記第2の解像度の倍数に基づく、請求項1に記載の方法。
  7. 前記特定の解像度は、水平解像度、垂直解像度、または水平解像度と垂直解像度との両方を含む、請求項1に記載の方法。
  8. 前記属性を決定するステップは、前記第1の整数個のピクセルのうちの2つ以上のピクセルに関する前記属性の値に基づいて前記領域に関する前記属性を決定するステップを含む、請求項1に記載の方法。
  9. 前記属性は、視差値であり、
    前記属性を決定するステップは、視差マップからの前記属性にアクセスするステップを含む、請求項1に記載の方法。
  10. 前記領域に関する変換された属性を、記憶または送信の少なくとも一方に好適なデータ構造に挿入するステップをさらに含む、請求項1に記載の方法。
  11. 領域のサイズおよび領域の位置を示す情報を前記データ構造に挿入するステップをさらに含む、請求項10に記載の方法。
  12. 領域のサイズおよび領域の位置を決定するステップをさらに含む、請求項1に記載の方法。
  13. 変換された属性を符号化するステップをさらに含む、請求項1に記載の方法。
  14. 領域のサイズおよび領域の位置を示す情報を符号化するステップをさらに含む、請求項1に記載の方法。
  15. 変換するステップは、前記属性に、前記組み合わせ解像度と前記特定の解像度との比を反映する整数を掛けるステップを含む、請求項1に記載の方法。
  16. 前記属性は、デプスのインジケータを含む、請求項1に記載の方法。
  17. デプスの前記インジケータは、視差値である、請求項16に記載の方法。
  18. ピクチャの領域に関する属性を決定することであって、前記ピクチャは特定の解像度を有し、前記属性は前記特定の解像度および前記領域に固有であり、前記ピクチャの前記領域は、前記特定の解像度において第1の整数個のピクセルと同一の広がりを持ち、第2の解像度において第2の整数個のピクセルと同一の広がりを持つ、決定することと、
    前記属性を変換して、前記領域に固有であり、前記特定の解像度と前記第2の解像度との組み合わせとして決定される組み合わせ解像度に固有である属性をもたらすことと、
    を実行するように集合的に構成された1または複数のプロセッサーを備える、装置。
  19. ピクチャの領域に関する属性を決定するための手段であって、前記ピクチャは特定の解像度を有し、前記属性は前記特定の解像度および前記領域に固有であり、前記ピクチャの前記領域は、前記特定の解像度において第1の整数個のピクセルと同一の広がりを持ち、第2の解像度において第2の整数個のピクセルと同一の広がりを持つ、手段と、
    前記属性を変換して、前記領域に固有であり、前記特定の解像度と前記第2の解像度との組み合わせとして決定される組み合わせ解像度に固有である属性をもたらすための手段と、
    を備える、装置。
  20. 1または複数のプロセッサーに、
    ピクチャの領域に関する属性を決定することであって、前記ピクチャは特定の解像度を有し、前記属性は前記特定の解像度および前記領域に固有であり、前記ピクチャの前記領域は、前記特定の解像度において第1の整数個のピクセルと同一の広がりを持ち、第2の解像度において第2の整数個のピクセルと同一の広がりを持つ、決定することと、
    前記属性を変換して、前記領域に固有であり、前記特定の解像度と前記第2の解像度との組み合わせとして決定される組み合わせ解像度に固有である属性をもたらすことと、
    を集合的に実行させるための命令をその上に記憶する、プロセッサー可読媒体。
  21. ピクチャの領域に関する属性を決定することであって、前記ピクチャは特定の解像度を有し、前記属性は前記特定の解像度および前記領域に固有であり、前記ピクチャの前記領域は、前記特定の解像度において第1の整数個のピクセルと同一の広がりを持ち、第2の解像度において第2の整数個のピクセルと同一の広がりを持つ、決定すること、ならびに
    前記属性を変換して、前記領域に固有であり、前記特定の解像度と前記第2の解像度との組み合わせとして決定される組み合わせ解像度に固有である属性をもたらすこと、
    を行うように構成されたプロセッサーと、
    変換された属性を示すデータによって信号を変調するように構成された変調器と、
    を備える、装置。
  22. 情報を含むようにフォーマットされた信号であって、
    ピクチャの領域に関する属性を示すデータを含む属性部分であって、前記属性は前記領域および組み合わせ解像度に固有であり、前記組み合わせ解像度は特定の解像度と第2の解像度との組み合わせとして決定され、前記ピクチャの前記領域は、前記特定の解像度において第1の整数個のピクセルと同一の広がりを持ち、前記第2の解像度おいて第2の整数個のピクセルと同一の広がりを持つ、属性部分
    を含む、前記信号。
  23. ピクチャの領域に関する属性を示すデータを含む属性部分であって、前記属性は前記領域および組み合わせ解像度に固有であり、前記組み合わせ解像度は特定の解像度と第2の解像度との組み合わせとして決定され、前記ピクチャの前記領域は、前記特定の解像度において第1の整数個のピクセルと同一の広がりを持ち、前記第2の解像度おいて第2の整数個のピクセルと同一の広がりを持つ、属性部分
    を含む、信号の構造。
  24. 信号の構造をその上に記憶するプロセッサー可読媒体であって、前記信号の構造は、
    ピクチャの領域に関する属性を示すデータを含む属性部分であって、前記属性は前記領域および組み合わせ解像度に固有であり、前記組み合わせ解像度は特定の解像度と第2の解像度との組み合わせとして決定され、前記ピクチャの前記領域は、前記特定の解像度において第1の整数個のピクセルと同一の広がりを持ち、前記第2の解像度おいて第2の整数個のピクセルと同一の広がりを持つ、属性部分
    を含む、前記プロセッサー可読媒体。
  25. 前記信号の構造は、領域のサイズを示すための部分、前記ピクチャ内の領域の位置を示すための部分、領域番号を示すための部分、または前記ピクチャ内の領域の総数を示すための部分のうちの1つまたは複数をさらに含む、請求項24に記載の媒体。
  26. ピクチャの領域に関する属性にアクセスするステップであって、前記ピクチャの前記領域は、特定の解像度において第1の整数個のピクセルと同一の広がりを持ち、第2の解像度において第2の整数個のピクセルと同一の広がりを持ち、前記属性は、前記領域に固有であり、前記特定の解像度と前記第2の解像度との組み合わせとして決定される組み合わせ解像度に固有である、ステップと、
    前記属性を変換して、前記領域および前記特定の解像度に固有の属性をもたらすステップと、
    変換された属性を、前記特定の解像度の前記第1の整数個のピクセルに関連付けるステップと、
    を含む、方法。
  27. 前記領域のサイズは、(i)前記特定の解像度におけるピクセルのピクセル寸法と、(ii)前記第2の解像度におけるピクセルのピクセル寸法との組み合わせに基づく、請求項26に記載の方法。
  28. 領域の幅は、前記特定の解像度および前記第2の解像度を含む一組の解像度の中の解像度のピクセルのピクセル幅の倍数に基づき、
    領域の高さは、前記一組の解像度の中の解像度のピクセルのピクセル高さの倍数に基づく、請求項27に記載の方法。
  29. 前記特定の解像度は、特定の水平解像度を含み、
    前記第2の解像度は、第2の水平解像度を含み、
    前記組み合わせ解像度は、組み合わせ水平解像度を含み、
    前記一組の解像度の中の所与の解像度の前記ピクセル幅は、前記組み合わせ水平解像度を前記所与の解像度の水平解像度で割った数に基づく、請求項28に記載の方法。
  30. 前記特定の解像度は、特定の垂直解像度を含み、
    前記第2の解像度は、第2の垂直解像度を含み、
    前記組み合わせ解像度は、組み合わせ垂直解像度を含み、
    前記一組の解像度の中の所与の解像度の前記ピクセル高さは、前記組み合わせ垂直解像度を前記所与の解像度の垂直解像度で割った数に基づく、請求項28に記載の方法。
  31. 前記組み合わせ解像度は、少なくとも前記特定の解像度および前記第2の解像度の倍数に基づく、請求項26に記載の方法。
  32. 前記特定の解像度は、水平解像度、垂直解像度、または水平解像度と垂直解像度との両方を含む、請求項26に記載の方法。
  33. 前記属性にアクセスするステップは、前記領域に関する前記属性、および前記ピクチャの1または複数のその他の領域に関する属性を与えるようにフォーマットされたデータを含むビットストリームにアクセスするステップを含む、請求項26に記載の方法。
  34. 変換するステップは、前記属性を、前記組み合わせ解像度と前記特定の解像度との比を反映する整数で割るステップを含む、請求項26に記載の方法。
  35. 前記属性は、視差値である、請求項26に記載の方法。
  36. 前記属性は、符号化された属性を含み、前記方法は、前記符号化された属性を復号するステップをさらに含む、請求項26に記載の方法。
  37. 関連付けるステップは、前記特定の解像度の前記第1の整数個のピクセルに関するピクセル位置を決定するステップを含む、請求項26に記載の方法。
  38. データ構造は、前記第1の数のピクセルのそれぞれに関して別々のフィールドを有し、関連付けるステップは、前記変換された属性を前記別々のフィールドのそれぞれに挿入するステップを含む、請求項26に記載の方法。
  39. ピクチャの領域に関する属性にアクセスすることであって、前記ピクチャの前記領域は、特定の解像度において第1の整数個のピクセルと同一の広がりを持ち、第2の解像度において第2の整数個のピクセルと同一の広がりを持ち、前記属性は、前記領域に固有であり、前記特定の解像度と前記第2の解像度との組み合わせとして決定される組み合わせ解像度に固有である、アクセスすることと、
    前記属性を変換して、前記領域および前記特定の解像度に固有の属性をもたらすことと、
    変換された属性を、前記特定の解像度の前記第1の整数個のピクセルに関連付けることと、
    を実行するように集合的に構成された1または複数のプロセッサーを備える、装置。
  40. ピクチャの領域に関する属性にアクセスするための手段であって、前記ピクチャの前記領域は、特定の解像度において第1の整数個のピクセルと同一の広がりを持ち、第2の解像度において第2の整数個のピクセルと同一の広がりを持ち、前記属性は、前記領域に固有であり、前記特定の解像度と前記第2の解像度との組み合わせとして決定される組み合わせ解像度に固有である、手段と、
    前記属性を変換して、前記領域および前記特定の解像度に固有の属性をもたらすための手段と、
    変換された属性を、前記特定の解像度の前記第1の整数個のピクセルに関連付けるための手段と、
    を備える、装置。
  41. 1または複数のプロセッサーに、
    ピクチャの領域に関する属性にアクセスすることであって、前記ピクチャの前記領域は、特定の解像度において第1の整数個のピクセルと同一の広がりを持ち、第2の解像度において第2の整数個のピクセルと同一の広がりを持ち、前記属性は、前記領域に固有であり、前記特定の解像度と前記第2の解像度との組み合わせとして決定される組み合わせ解像度に固有である、アクセスすることと、
    前記属性を変換して、前記領域および前記特定の解像度に固有の属性をもたらすことと、
    変換された属性を、前記特定の解像度の前記第1の整数個のピクセルに関連付けることと、
    を集合的に実行させるための命令をその上に記憶する、プロセッサー可読媒体。
  42. ピクチャの領域に関する属性を示すデータを含む信号を復調するための復調器であって、前記ピクチャの前記領域は、特定の解像度において第1の整数個のピクセルと同一の広がりを持ち、第2の解像度において第2の整数個のピクセルと同一の広がりを持ち、前記属性は、前記領域に固有であり、前記特定の解像度と前記第2の解像度との組み合わせとして決定される組み合わせ解像度に固有である、復調器と、
    前記属性を変換して、前記領域および前記特定の解像度に固有の属性をもたらし、
    変換された属性を、前記特定の解像度の前記第1の整数個のピクセルに関連付ける
    ように構成されたプロセッサーと、
    を備える、装置。
JP2014512827A 2011-05-26 2011-12-05 スケール非依存マップ Active JP6005731B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201161490179P 2011-05-26 2011-05-26
US61/490,179 2011-05-26
US201161626496P 2011-09-27 2011-09-27
US61/626,496 2011-09-27
PCT/US2011/063223 WO2012161734A1 (en) 2011-05-26 2011-12-05 Scale-independent maps

Publications (3)

Publication Number Publication Date
JP2014523660A true JP2014523660A (ja) 2014-09-11
JP2014523660A5 JP2014523660A5 (ja) 2015-01-29
JP6005731B2 JP6005731B2 (ja) 2016-10-12

Family

ID=45420959

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014512827A Active JP6005731B2 (ja) 2011-05-26 2011-12-05 スケール非依存マップ

Country Status (9)

Country Link
US (1) US9600923B2 (ja)
EP (1) EP2715661B1 (ja)
JP (1) JP6005731B2 (ja)
KR (1) KR101810845B1 (ja)
CN (1) CN103562958B (ja)
AU (1) AU2011368712A1 (ja)
BR (1) BR112013030289A2 (ja)
TW (1) TWI544450B (ja)
WO (1) WO2012161734A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016081088A (ja) * 2014-10-09 2016-05-16 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2906899B1 (fr) * 2006-10-05 2009-01-16 Essilor Int Dispositif d'affichage pour la visualisation stereoscopique.
AU2011234163B2 (en) 2010-03-31 2015-10-29 Interdigital Ce Patent Holdings 3D disparity maps
KR101810845B1 (ko) 2011-05-26 2017-12-22 톰슨 라이센싱 스케일-독립적인 맵
GB2500712A (en) * 2012-03-30 2013-10-02 Sony Corp An Apparatus and Method for transmitting a disparity map
WO2014076524A1 (en) * 2012-11-16 2014-05-22 Data2Text Limited Method and apparatus for spatial descriptions in an output text
US9736467B2 (en) * 2013-08-05 2017-08-15 Samsung Display Co., Ltd. Apparatus and method for adjusting stereoscopic images in response to head roll
TWI497444B (zh) * 2013-11-27 2015-08-21 Au Optronics Corp 二維影像至三維影像的影像轉換方法及影像轉換裝置
US20150206337A1 (en) * 2014-01-17 2015-07-23 Nokia Corporation Method and apparatus for visualization of geo-located media contents in 3d rendering applications
US10311633B2 (en) 2014-01-17 2019-06-04 Nokia Technologies Oy Method and apparatus for visualization of geo-located media contents in 3D rendering applications
TWI556624B (zh) * 2014-07-18 2016-11-01 友達光電股份有限公司 影像顯示方法以及影像顯示裝置
CN105491277B (zh) * 2014-09-15 2018-08-31 联想(北京)有限公司 图像处理方法和电子设备
KR102281184B1 (ko) * 2014-11-20 2021-07-23 삼성전자주식회사 영상 보정 방법 및 장치
US10467347B1 (en) 2016-10-31 2019-11-05 Arria Data2Text Limited Method and apparatus for natural language document orchestrator
KR102351542B1 (ko) * 2017-06-23 2022-01-17 삼성전자주식회사 시차 보상 기능을 갖는 애플리케이션 프로세서, 및 이를 구비하는 디지털 촬영 장치
CN107436500B (zh) * 2017-08-25 2020-04-24 京东方科技集团股份有限公司 光栅及制备方法、驱动方法、裸眼三维显示***
DE102018218986B4 (de) * 2017-11-10 2023-02-16 Denso Corporation Kameramodul
CN108063951B (zh) * 2017-12-14 2021-07-13 Oppo广东移动通信有限公司 非标准分辨率数据的传输方法、装置及电子设备
CN109756723B (zh) * 2018-12-14 2021-06-11 深圳前海达闼云端智能科技有限公司 获取影像的方法和装置,存储介质和电子设备
TWI694434B (zh) * 2019-04-02 2020-05-21 友達光電股份有限公司 具有雙面板的顯示裝置的調整方法
CN113128347B (zh) * 2021-03-24 2024-01-16 北京中科慧眼科技有限公司 基于rgb-d融合信息的障碍物目标分类方法、***和智能终端
US20220319026A1 (en) * 2021-03-31 2022-10-06 Ernst Leitz Labs LLC Imaging system and method

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5926567A (en) * 1995-03-01 1999-07-20 Compaq Computer Corporation Method and apparatus for storing and rapidly displaying graphic data
JP2000321050A (ja) * 1999-05-14 2000-11-24 Minolta Co Ltd 3次元データ取得装置および3次元データ取得方法
JP2008167282A (ja) * 2006-12-28 2008-07-17 Canon Inc 撮像装置及び画像記録方法
JP2009278495A (ja) * 2008-05-16 2009-11-26 Victor Co Of Japan Ltd 動画像階層符号化装置、動画像階層符号化方法、動画像階層符号化プログラム、動画像階層復号化装置、動画像階層復号化方法、および動画像階層復号化プログラム
JP2010098700A (ja) * 2008-10-20 2010-04-30 Canon Inc 画像処理装置および画像処理方法
JP2015505196A (ja) * 2011-12-15 2015-02-16 トムソン ライセンシングThomson Licensing ビデオ品質測定のための方法及び装置

Family Cites Families (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5025325A (en) 1989-10-13 1991-06-18 Hewlett-Packard Company Graphics scaling method for high resolution printers
JPH0818954A (ja) 1994-06-24 1996-01-19 Sharp Corp 画像伝送装置
TW396480B (en) * 1994-12-19 2000-07-01 Matsushita Electric Ind Co Ltd Semiconductor chip and semiconductor wafer with power pads used for probing test
CN1132123A (zh) 1995-03-25 1996-10-02 国营无锡市新峰石化管件厂 短半径弯头加工工艺
US6384859B1 (en) * 1995-03-29 2002-05-07 Sanyo Electric Co., Ltd. Methods for creating an image for a three-dimensional display, for calculating depth information and for image processing using the depth information
JPH11127339A (ja) 1997-10-23 1999-05-11 Fuji Xerox Co Ltd 画像処理装置
US7092003B1 (en) 1999-01-21 2006-08-15 Mel Siegel 3-D imaging arrangements
TW421969B (en) 1999-03-19 2001-02-11 Asustek Comp Inc 3D image processing device and method
US20020145610A1 (en) 1999-07-16 2002-10-10 Steve Barilovits Video processing engine overlay filter scaler
TW452757B (en) 1999-08-17 2001-09-01 Trumpion Microelectronics Inc Image processing device in accordance with the resolution adjustment of flat panel display
JP2001306287A (ja) * 2000-04-25 2001-11-02 Ricoh Co Ltd 異機種間代行印刷システム
JP3736379B2 (ja) 2001-04-19 2006-01-18 ソニー株式会社 電子透かし埋め込み処理装置、電子透かし検出処理装置、および電子透かし埋め込み処理方法、電子透かし検出処理方法、並びにプログラム記憶媒体、およびプログラム
KR100439341B1 (ko) 2002-08-27 2004-07-07 한국전자통신연구원 시각 피로 감소를 위한 스테레오 영상의 초점심도 조정장치 및 그 방법
EP1617684A4 (en) 2003-04-17 2009-06-03 Sharp Kk THREE-DIMENSIONAL IMAGE CREATION DEVICE, THREE-DIMENSIONAL IMAGE REPRODUCING DEVICE, THREE-DIMENSIONAL IMAGE PROCESSING DEVICE, THREE-DIMENSIONAL IMAGE PROCESSING PROGRAM, AND RECORDING MEDIUM CONTAINING THE SAME
JP4251907B2 (ja) 2003-04-17 2009-04-08 シャープ株式会社 画像データ作成装置
JP2005073049A (ja) 2003-08-26 2005-03-17 Sharp Corp 立体映像再生装置および立体映像再生方法
US20050132191A1 (en) 2003-12-16 2005-06-16 Joshi Ajit P. Method for authenticating different rendering devices with different service providers
KR100636221B1 (ko) 2005-01-29 2006-10-19 삼성전자주식회사 컨텐츠를 선택하여 재생/기록하는 방법 및 그 장치
KR100727940B1 (ko) 2005-06-22 2007-06-14 삼성전자주식회사 통신 채널을 이용한 3d 입체 영상의 화질 조정 방법
KR100667810B1 (ko) 2005-08-31 2007-01-11 삼성전자주식회사 3d 영상의 깊이감 조정 장치 및 방법
JP2009516447A (ja) 2005-11-17 2009-04-16 ノキア コーポレイション 3次元画像データを生成、転送および処理するための方法および装置
US7738712B2 (en) 2006-01-04 2010-06-15 Aten International Co., Ltd. Mixing 2-D gradient-difference and interpolation/decimation method and device for scaling a digital image
US8044994B2 (en) 2006-04-04 2011-10-25 Mitsubishi Electric Research Laboratories, Inc. Method and system for decoding and displaying 3D light fields
US7916934B2 (en) 2006-04-04 2011-03-29 Mitsubishi Electric Research Laboratories, Inc. Method and system for acquiring, encoding, decoding and displaying 3D light fields
US7609906B2 (en) 2006-04-04 2009-10-27 Mitsubishi Electric Research Laboratories, Inc. Method and system for acquiring and displaying 3D light fields
WO2008041178A2 (en) 2006-10-04 2008-04-10 Koninklijke Philips Electronics N.V. Image enhancement
KR101311896B1 (ko) 2006-11-14 2013-10-14 삼성전자주식회사 입체 영상의 변위 조정방법 및 이를 적용한 입체 영상장치
US20080136819A1 (en) * 2006-12-11 2008-06-12 Michael Shivas Apparatus and method for screen scaling displays on communication devices
KR20080076628A (ko) 2007-02-16 2008-08-20 삼성전자주식회사 영상의 입체감 향상을 위한 입체영상 표시장치 및 그 방법
KR100778085B1 (ko) 2007-03-14 2007-11-22 주식회사 이시티 주시각 제어를 위한 입체 영상 신호의 처리 방법 및 장치
KR101345303B1 (ko) 2007-03-29 2013-12-27 삼성전자주식회사 스테레오 또는 다시점 영상의 입체감 조정 방법 및 장치
US8390674B2 (en) 2007-10-10 2013-03-05 Samsung Electronics Co., Ltd. Method and apparatus for reducing fatigue resulting from viewing three-dimensional image display, and method and apparatus for generating data stream of low visual fatigue three-dimensional image
WO2009083863A1 (en) 2007-12-20 2009-07-09 Koninklijke Philips Electronics N.V. Playback and overlay of 3d graphics onto 3d video
KR101510099B1 (ko) 2008-01-11 2015-04-08 삼성전자주식회사 디지털 영상 처리 장치에서 다중 심도를 가진 3차원 메뉴디스플레이 방법
CN101680756B (zh) 2008-02-12 2012-09-05 松下电器产业株式会社 复眼摄像装置、测距装置、视差算出方法以及测距方法
JP2009238117A (ja) 2008-03-28 2009-10-15 Toshiba Corp 多視差画像生成装置および方法
WO2010036098A1 (en) 2008-09-25 2010-04-01 Tele Atlas B.V. Method of and arrangement for blurring an image
WO2010064118A1 (en) 2008-12-01 2010-06-10 Imax Corporation Methods and systems for presenting three-dimensional motion pictures with content adaptive information
CA2745021C (en) 2008-12-02 2014-10-28 Lg Electronics Inc. Method for displaying 3d caption and 3d display apparatus for implementing the same
TW201101839A (en) 2009-06-26 2011-01-01 Liao Li Shi System for encoding video and method, system for decoding video and method, system for displaying video and method
KR101678968B1 (ko) * 2009-08-21 2016-11-25 에스케이텔레콤 주식회사 참조 픽처 보간 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치
US8374463B1 (en) 2010-01-06 2013-02-12 Marseille Networks, Inc. Method for partitioning a digital image using two or more defined regions
AU2011234163B2 (en) 2010-03-31 2015-10-29 Interdigital Ce Patent Holdings 3D disparity maps
GB2479784B (en) 2010-04-23 2012-11-07 Nds Ltd Image scaling
US9035939B2 (en) * 2010-10-04 2015-05-19 Qualcomm Incorporated 3D video control system to adjust 3D video rendering based on user preferences
KR101810845B1 (ko) 2011-05-26 2017-12-22 톰슨 라이센싱 스케일-독립적인 맵

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5926567A (en) * 1995-03-01 1999-07-20 Compaq Computer Corporation Method and apparatus for storing and rapidly displaying graphic data
JP2000321050A (ja) * 1999-05-14 2000-11-24 Minolta Co Ltd 3次元データ取得装置および3次元データ取得方法
JP2008167282A (ja) * 2006-12-28 2008-07-17 Canon Inc 撮像装置及び画像記録方法
JP2009278495A (ja) * 2008-05-16 2009-11-26 Victor Co Of Japan Ltd 動画像階層符号化装置、動画像階層符号化方法、動画像階層符号化プログラム、動画像階層復号化装置、動画像階層復号化方法、および動画像階層復号化プログラム
JP2010098700A (ja) * 2008-10-20 2010-04-30 Canon Inc 画像処理装置および画像処理方法
JP2015505196A (ja) * 2011-12-15 2015-02-16 トムソン ライセンシングThomson Licensing ビデオ品質測定のための方法及び装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016081088A (ja) * 2014-10-09 2016-05-16 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
US10332259B2 (en) 2014-10-09 2019-06-25 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and program

Also Published As

Publication number Publication date
US9600923B2 (en) 2017-03-21
WO2012161734A1 (en) 2012-11-29
EP2715661B1 (en) 2017-10-11
BR112013030289A2 (pt) 2016-11-29
KR101810845B1 (ko) 2017-12-22
CN103562958A (zh) 2014-02-05
US20140125660A1 (en) 2014-05-08
EP2715661A1 (en) 2014-04-09
TW201248546A (en) 2012-12-01
AU2011368712A1 (en) 2013-12-05
KR20140038424A (ko) 2014-03-28
JP6005731B2 (ja) 2016-10-12
CN103562958B (zh) 2017-03-29
TWI544450B (zh) 2016-08-01

Similar Documents

Publication Publication Date Title
JP6005731B2 (ja) スケール非依存マップ
AU2011234163B2 (en) 3D disparity maps
US9030530B2 (en) Stereo-image quality and disparity/depth indications
KR101863767B1 (ko) 의사-3d 인위적 원근법 및 장치
EP3700209A1 (en) Method and device for processing video image
EP2235685B1 (en) Image processor for overlaying a graphics object
EP2553932B1 (en) Disparity value indications
CN104272729A (zh) 用于处理3d视频的质量度量
KR20130025395A (ko) 입체적 이미징 시점 쌍을 선택하기 위한 방법, 장치 및 컴퓨터 프로그램
US20150304640A1 (en) Managing 3D Edge Effects On Autostereoscopic Displays
US20190141332A1 (en) Use of synthetic frames in video coding
EP2745520B1 (en) Auxiliary information map upsampling
Ruijters et al. IGLANCE: transmission to medical high definition autostereoscopic displays
US10063845B2 (en) Guided 3D display adaptation
Liu et al. Deinterlacing of depth-image-based three-dimensional video for a depth-image-based rendering system
WO2021136372A1 (en) Video decoding method for decoding bitstream to generate projection-based frame with guard band type specified by syntax element signaling

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141205

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141205

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151130

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20160114

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20160114

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20160114

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20160401

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160627

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20160627

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160818

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160907

R150 Certificate of patent or registration of utility model

Ref document number: 6005731

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250