JP4166679B2 - 3次元オブジェクトデータの符号化及び復号化方法、並びに、その装置 - Google Patents

3次元オブジェクトデータの符号化及び復号化方法、並びに、その装置 Download PDF

Info

Publication number
JP4166679B2
JP4166679B2 JP2003407532A JP2003407532A JP4166679B2 JP 4166679 B2 JP4166679 B2 JP 4166679B2 JP 2003407532 A JP2003407532 A JP 2003407532A JP 2003407532 A JP2003407532 A JP 2003407532A JP 4166679 B2 JP4166679 B2 JP 4166679B2
Authority
JP
Japan
Prior art keywords
node
encoding
object data
dimensional object
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003407532A
Other languages
English (en)
Other versions
JP2004185628A (ja
Inventor
仁 圭 朴
信 俊 李
寅 ▲イック▼ 宋
昌 洙 金
商 郁 李
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Seoul National University Industry Foundation
Original Assignee
Samsung Electronics Co Ltd
Seoul National University Industry Foundation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR10-2003-0083778A external-priority patent/KR100513732B1/ko
Application filed by Samsung Electronics Co Ltd, Seoul National University Industry Foundation filed Critical Samsung Electronics Co Ltd
Publication of JP2004185628A publication Critical patent/JP2004185628A/ja
Application granted granted Critical
Publication of JP4166679B2 publication Critical patent/JP4166679B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/40Tree coding, e.g. quadtree, octree
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • G06T17/005Tree description, e.g. octree, quadtree
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Software Systems (AREA)
  • Image Generation (AREA)
  • Processing Or Creating Images (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明はデータ符号化及び復号化方法、並びに、その装置に係り、さらに詳細にはポイントテクスチャ、ボクセル、八分木構造のデータのうち何れか一つよりなる3次元オブジェクトデータの符号化及び復号化方法、並びに、その装置に関する。
3次元グラフィックに関する研究の初期から研究者の究極的な目標は、実際のイメージのようなリアルなグラフィック画面を生成することである。そこで、レンダリング技術分野において多角形モデルを利用する研究が行われ、その結果として、非常にリアルな3次元環境を提供するために十分なモデリング及びレンダリング技術が開発されてきた。しかし、複雑なモデルを生成するためには、専門家の多くの努力と時間とを必要とする。また、リアルで精巧な環境を表現するには、莫大な量の情報を必要とし、保存及び伝送において低効率を招くという問題がある。
現在、コンピュータグラフィックにおける3次元オブジェクトの表現は、一般的には多角形モデルが採用されている。この技術を用いれば、任意の形状を多色の多角形の集合、すなわち、三角形によって概略的に表現できる。また、ソフトウェアアルゴリズムの急激な進歩と、グラフィックハードウェアの発達とによって、複雑なオブジェクトやシーン(場面)を、リアルタイムで非常にリアルな静止映像(あるいは動映像)多角形モデルに視覚化できる。
しかし、ここ数年間で、さらに他の3次元表現に関する研究が非常に活発に進められている。これは、現実世界のオブジェクトに対する多角形モデルを構成することが難しいだけでなく、レンダリングの複雑性及び写真のようにリアルな場面を生成するには、品質が満足するほどではないということが、このような研究が進められている主な理由である。
3次元オブジェクトを表現するためには、アプリケーションプログラムは、莫大な量の多角形を必要とする。例えば、人体の詳細なモデルは数百万個の三角形を含み、これを扱うのは容易なことではない。例えば、3次元スキャナのように3次元測定技術分野における最近の進歩によって、許容範囲内の誤差で精巧な3次元データを得られるが、オブジェクト全体に対して連続的に完璧な多角形モデルを得ることは、相変らずコストが高くて非常に難しい。さらに、写真のようなリアルなイメージ表現を得るためのレンダリングアルゴリズムは、演算が複雑になり、リアルタイムでのレンダリングが不可能である。
一方、複雑な幾何学的構造を有するオブジェクトを表現する、新しい表現方法及びレンダリング方法として、深さイメージベース表現(Depth Image−Based Representation:以下、DIBRという)がある。このDIBRは、MPEG−4 AFX(Animation Framework eXtension)に採用されている。コンピュータグラフィックでは一般に多角形メッシュでオブジェクトを表現してきたが、DIBRでは3次元オブジェクトを目に見えるオブジェクトの表面を覆い包む参照イメージの集合として表現する。各参照イメージは、相応する深さ情報(depth map)で表現し、その深さ情報は、イメージ平面のピクセルから3次元オブジェクト表面までの距離を配列として表したものである。このDIBRの利点の一つは、多角形モデルを使用せずに参照イメージを用いることでオブジェクトを高品質に表現することができることである。しかも、DIBRで表現された画像(DIBRビュー)をレンダリングする複雑度は、風景(シーン)の複雑性には関係なく、ビューのピクセル数(すなわち、ビューの解像度)だけで決定される。DIBRにおける主な表現形式は、シンプルテクスチャ、ポイントテクスチャ及び八分木イメージである。このポイントテクスチャは、一つのカメラ位置から眺めたピクセルの配列でオブジェクトを表現する。それぞれのポイントテクスチャピクセルは、色、深さ(ピクセルからカメラまでの距離)及びポイントテクスチャレンダリングを補助するいくつかの他の属性によって表現される。各視線に沿って多数のピクセルがあるため、ポイントテクスチャは、通常多数の層で構成される。1次元でのポイントテクスチャの簡単な例が、図1に示されている。ポイントテクスチャは、オブジェクトをリアルに表現するためには、大量のデータを必要とする。概して、よりリアルなイメージ、より高いサンプリング密度の場合には、さらに膨大な量のデータを必要とする。したがって、ポイントテクスチャイメージの圧縮は効率的に行われなければならない。ポイントテクスチャのノード仕様は、図2に示されている。図2のノード仕様で‘depth’(深さ情報)と‘color’(色情報)フィールドが圧縮対象である。
なお、従来、ポイントテクスチャについての研究はほとんどないが、DuanとLiとがポイントテクスチャを基盤とした圧縮方法を提示し、その方法は、階層化された深さイメージ(Layered Depth Image:LDI)の圧縮方法と呼ばれている。(非特許文献1参照)
従来、深さ情報を圧縮するためには、JPEG−LSアルゴリズムが適用されていた。また、色情報は、既存の符号化標準を使用して圧縮される。しかし、このようなアルゴリズムは、プログレシブ(漸進的)な圧縮及び伝送をサポートできない。
また、パターンコード表現(PCR:Pattern Code Representation)を使用して3次元ボクセル表面モデルを圧縮する方法が提案されている。(非特許文献2参照)
しかし、この方法は階層的な八分木構造をとらないため、プログレシブ圧縮を行うことはできない。さらに、MPEG−4 AFX標準で、PPM(Prediction by Partial Matching)方法を利用した八分木圧縮方法が提案された。(非特許文献3参照)しかし、これもプログレシブ(漸進的)ビットストリームを作り出すことができない。
J.Duan J.Li Compression of the Layered Depth Image,IEEE Trans. Image Precessing,vol.12,no.3,pp.365−372,March 2003 C.S.Kim and S.U.Lee,Compact Encoding of 3D Voxel Surface Based on Pattern Code Representation,IEEE Trans.Image Processing,vol.11,no.8,pp.932−943,2002 ISO/IEC JTC1/SC29/WG11 14496−16:2003,Information Technology−Coding of Audio−Visual Objects−Part 16:Animation Framework eXtension(AFX)
本発明が解決しようとする技術的課題は、深さイメージ情報を圧縮するためのより効率的な予測符号化、高い符号化効率及び効率的な損失圧縮を提供する、ポイントテクスチャ、ボクセル、八分木構造のデータのうち何れか一つよりなる3次元オブジェクトデータ符号化/復号化方法及び装置を提供することである。
前記課題を達成するための本発明による、3次元オブジェクトデータの符号化方法は、ポイントテクスチャ、ボクセル、八分木構造のデータのうち何れか一つよりなる3次元オブジェクトデータに対して、ノードの種類を表すラベル付きツリー構造の3次元オブジェクトデータを生成する段階と、前記ラベル付きツリー構造の3次元オブジェクトデータのノードを符号化するノード符号化段階と、このノード符号化段階でノード符号化されたデータを、ビットストリームとして生成するビットストリーム生成段階と、を含むことを特徴とする。
さらに、前記ラベル付きツリー構造の3次元オブジェクトデータを生成する段階は、3次元バウンディングボリュームを使用してボクセルデータに変換してオブジェクトが存在する位置のボクセルと、オブジェクトが存在しない位置のボクセルとを、ラベルを付けて区分することを特徴とする。
また、前記ラベルを付けてボクセルを区分するとは、前記3次元オブジェクトデータを表すツリーのノードが下位ノードで構成される時は‘S(Split)’とラベル付けし、ノード内の下位ボクセルが全てオブジェクトのないボクセルで構成される時は‘W(White)’とラベル付けし、ノード内の下位ボクセルが全てオブジェクトのあるボクセルで構成される時は‘B(Black)’とラベル付けし、ノード内の下位ボクセル値がPPMアルゴリズムによって符号化される時は‘P(PPM)’とラベル付けすることを特徴とする。
また、前記ノード符号化段階は、ノードがSノードであるかPノードであるかに関するノード情報を符号化する段階と、前記ノード情報がSノードであれば、Sノードの詳細情報(Detailed Information Bits:DIB)を符号化し、PノードであればPノードのDIBを符号化する段階と、を含むことを特徴とする。
さらに、前記課題を達成するための本発明による、3次元オブジェクトデータの符号化方法は、ポイントテクスチャ、ボクセル、八分木構造のデータのうち何れか一つよりなる3次元オブジェクトデータに対して、ノードごとにラベル付きツリー構造の3次元オブジェクトデータを生成するツリー構造生成段階と、前記ノードごとにラベル付きツリー構造の3次元オブジェクトデータを、前記ラベルを参照して併合する段階と、前記併合されたノードを符号化するノード符号化段階と、このノード符号化段階でノード符号化されたデータを、ビットストリームとして生成するビットストリーム生成段階と、前記併合段階、ノード符号化段階及びビットストリーム段階を、前記ツリー構造の3次元オブジェクトデータの最上位ノードまで反復する段階と、を含むことを特徴とする。
また、前記ラベル付きツリー構造の3次元オブジェクトデータを生成する段階は、バウンディングボリューム内にオブジェクトがある時とない時とを区別して表すが、ツリーのノードが下位ノードを有する時は‘S’とラベル付けし、ノード内のボクセルが全てオブジェクトのないボクセルで構成される時は‘W’とラベル付けし、ノード内のボクセルが全てオブジェクトのあるボクセルで構成される時は‘B’とラベル付けし、ノード内のボクセル値がPPMアルゴリズムによって符号化される時は‘P’とラベル付けすることを特徴とする。
また、前記併合段階は、ノードのラベルが‘P’であるノードと、下位ノードのラベルが‘W’と‘B’とである‘S’ノードを併合する候補ノードとして選択する段階と、前記候補ノードに対して併合前後の歪曲されたビット数の差ΔDと併合前後のビット数の差ΔRとの比が最小となるノードを最適ノードとして選択する段階と、前記最適ノードのラベルを‘B’とラベル付けする段階と、前記候補ノードで最適ノードとして選択されたノードを除いて前記候補ノードを更新する段階と、を含むことを特徴とする。
そして、前記併合前後の歪曲されたビット数の差ΔDは、
によって計算されることを特徴とする。
また、前記ノード符号化段階は、前記候補ノードがキューに存在しているか否かを表す情報(コンティニューフラグ;continue flag)を符号化する段階と、前記候補ノードを保存するキュー内における位置を示すノード位置情報を符号化する段階と、ノードがSノードであるかPノードであるかを示すノード種類情報を符号化する段階と、前記ノード種類情報がSノードであればSノードのDIBを符号化し、PノードであればPノードのDIBを符号化する段階と、を含むことを特徴とする。
そして、前記Sノードの詳細情報の符号化は、色情報の平均値を符号化する段階と、8つの下位ノードのラベルを符号化する段階とを含むことを特徴とする。前記Pノードの詳細情報の符号化は、深さ情報をPPM符号化する段階と、色情報を符号化する段階とを含むことを特徴とする。
また、前記深さ情報のPPM符号化は、所定数のコンテクストを使用して当該ノード以下の全体下位ノードをラスタースキャン順にPPM符号化することを特徴とする。また、前記色情報符号化は、現在ノードの‘B’ボクセルの色のR、G、B値をDPCM符号化し、適応算術符号化(AAC:Adaptive Arithmetic Coding)することを特徴とする。
さらに、前記課題を達成するための本発明による、3次元オブジェクトデータ符号化装置は、ポイントテクスチャ、ボクセル、八分木構造のデータのうち何れか一つよりなる3次元オブジェクトデータに対して、ノードごとにノードの種類を表すラベル付きツリー構造の3次元オブジェクトデータを生成するツリー構造生成部と、前記ツリー構造の3次元オブジェクトデータのノードを、前記ラベルを参照して併合する併合順序選択部と、前記併合されたノードを符号化するノード符号化部と、このノード符号化部でノード符号化されたデータを、ビットストリームとして生成するビットストリーム生成部と、を含むことを特徴とする。
そして、前記併合順序選択部は、ノードのラベルが‘P’であるノードと、下位ノードのラベルが‘W’と‘B’とである‘S’ノードを、併合する候補ノードとして選択する候補ノード選択部と、前記候補ノードに対して併合前後の歪曲されたビット数の差ΔDと併合前後のビット数の差ΔRとの比が最小となるノードを最適ノードとして選択して前記最適ノードのラベルを‘B’とラベル付けする最適ノード選択部と、前記候補ノードのうち最適ノードとして選択されたノードを除いて前記候補ノードを更新する候補ノード更新部と、を含むことを特徴とする。
また、前記ノード符号化部は、圧縮されたビットストリームが終わりであるか否かを表すコンティニューフラグを符号化するコンティニューフラグ符号化部と、前記候補ノードを保存するキューを備え、前記キュー内における位置を示すノード位置情報を符号化するノード位置符号化部と、ノードがSノードであるかPノードであるかを示すノード種類情報を符号化するノードSOP選択部と、前記ノード種類情報がSノードであれば、SノードのDIBを符号化するSノード符号化部と、前記ノード種類情報がPノードであれば、PノードのDIBを符号化するPノード符号化部と、を含むことを特徴とする。
さらに、前記課題を達成するための本発明による、3次元オブジェクトデータ復号化方法は、符号化された3次元オブジェクトデータのビットストリームでコンティニューフラグ情報を読出して復号化する段階と、符号化された3次元オブジェクトデータのビットストリームに対してノード種類情報を復号化する段階と、前記ノード種類情報がSノードを表せば、Sノードを復号化し、前記ノード種類情報がPPMノードを表せば、PPMノードを復号化する段階と、ノード復号化されたデータをツリー構造に復元する段階と、を含むことを特徴とする。
また、前記課題を達成するための本発明による、3次元オブジェクトデータ復号化方法は、符号化された3次元オブジェクトデータのビットストリームに対してノードを復号化する段階と、前記ノードが復号化されたデータをツリー構造に復元する段階とを含むことを特徴とする。前記ノードを復号化する段階は、符号化された3次元オブジェクトデータのビットストリームでコンティニューフラグを読出して復号化する段階と、現在ノードがキューで何れの候補ノードであるかを示すノード位置情報を読出して復号化する段階と、ノード種類情報を復号化する段階と、前記ノード種類情報がSノードを表せばSノードを復号化する段階と、前記ノード種類情報がPPMノードを表せばPPMノードを復号化する段階と、を含むことを特徴とする。
そして、前記Sノードを復号化する段階は、DIB値で下位8つのノードに対する平均色を復号化し、下位8つのノードを順にBまたはWに復号化することを特徴とする。また、前記PPMノードを復号化する段階は、DIB(Detailed Information Bits)値で現在ノードをPPM復号化し、現在ノードのBボクセルの色であるR、G、B値を逆AACにより復号化し、逆DPCMを行って復号化することを特徴とする。
さらに、前記課題を達成するための本発明による、3次元オブジェクトデータ復号化装置は、符号化された3次元オブジェクトデータのビットストリームを収容するビットストリーム読出し部と、前記ビットストリームを復号化するノード復号化部と、前記復号化されたノードをツリー構造に復元するツリー構造復元部と、を含むことを特徴とする。
また、前記ノード復号化部は、ビットストリームが継続されるか否か表すコンティニューフラグを復号化するコンティニューフラグ復号化部と、符号化された3次元オブジェクトデータのビットストリームから、現在ノードがキューで何れの候補ノードであるかを示すノード位置情報を読出して復号化するノード位置情報復号化部と、ノード種類情報を復号化するノード種類選択部と、前記ノード種類情報がSノードを表せば、DIB値で下位8つのノードに対する平均色を復号化し、下位8つのノードを順にBまたはWに復号化するSノード復号化部と、前記ノード種類情報がPPMノードを表せば、DIB値で現在ノードをPPM復号化し、現在ノードの‘B’ボクセルの色であるR、G、B値に対して逆AACを行って復号化し、逆DPCMを行って復号化するPノード復号化部と、を含むことを特徴とする。
また、前記記載された発明をコンピュータで実行させるためのプログラムを記録したコンピュータで読取れる記録媒体を提供する。
本発明による方法は、汎用符号化方式のLempel−Zivの1つであるWinZipが提供できないプログレシブ(漸進的)な伝送とデコーディングとを支援するという点で効果(意味)がある。伝送やデコーディングにおいては、帯域幅が制限された環境におけるビットストリームへの適応や、3次元モデルのブラウジングが容易になるため、漸進性が望ましいからである。
本発明によるポイントテクスチャのためのプログレシブな圧縮方法において、それぞれのピクセルは、色ベクトル(色情報)だけでなく、深さ情報と関連付けられている。本発明による方法は、PPM方法を八分木構造に統合することによって、深さ情報及び色情報共に効率的に符号化を行う。シミュレーション結果によれば、本発明による方法が、WinZipよりはるかに高い圧縮率を提供することを示している。
以下、本発明によるポイントテクスチャ、ボクセル、八分木構造のデータのうち何れか一つよりなる3次元オブジェクトデータの符号化及び復号化方法、並びに、その装置についてさらに詳細に説明する。
図11は、本発明による3次元オブジェクトデータの符号化装置をブロック図に示したものである。図11に示すように、この符号化装置は、ツリー構造生成部1100、併合順序選択部1110、ノード符号化部1120及びビットストリーム生成部1130を備えている。
ツリー構造生成部1100は、3次元オブジェクトデータを表現しているポイントテクスチャ、ボクセル及びツリー構造のデータのうち何れか一つを入力として、ノードごとにノードの種類を表すラベル付きツリー構造の3次元オブジェクトデータを生成する。本実施例ではツリー構造は、八分木構造を有する。
まず、八分木構造の生成方法について説明する。ポイントテクスチャイメージは、まず、ボリュームデータに変換される。そして、ボリュームデータは、交互に八分木として表現される。これによって、八分木の末端ノードがPPM方式によって効率的に符号化される。したがって、本発明による3次元オブジェクトの符号化及び復号化方法は、ポイントテクスチャモデルと八分木モデルとを圧縮するものと同じである。
また、3次元オブジェクトの深さ情報をボリュームデータに変換するために、バウンディングボリュームが作られる。このバウンディングボリュームは、ポイントテクスチャのような解像度を有する。例えば、もしポイントテクスチャがX×Y解像度のイメージを有し、各ピクセルの深さ情報の解像度がZであれば、X×Y×Zの解像度を有するバウンディングボリュームが生成される。バウンディングボックスの原点は、正面の左側下段コーナーに位置する。右側ボクセルは、左側ボクセルより大きいx値を有し、上段ボクセルは下段ボクセルより大きいy値を有し、背面ボクセルは正面ボクセルより大きいz値を有する。ここで、深さ情報を2進ボリュームデータに変換することは直ちにできる。ボリュームデータの全てのボクセルは、W(white、‘0’)に初期化される。次いで、ボクセルの位置がポイントテクスチャにあるピクセルによって参照されれば、ボクセルはB(black、‘1’)に設定される。したがって、Bボクセルは3次元オブジェクトで点を表し、Wボクセルは透明な背景を表す。
また、ボリュームデータは、八分木によって表現され、八分木の各ノードは、表1における4つのカテゴリーのうち何れか一つに分類される。第一に、もしバウンディングボリュームがオブジェクトを含んでいれば、ルートノードは‘S’と表示(ラベル付け)され、ボリュームは8つの同一サイズのボリュームに細分される。もし細分されたボリュームが、単に‘B’ボクセルまたは‘W’ボクセルだけ含んでいれば、相応するノードは‘B’または‘W’と表示(ラベル付け)される。それ以外の場合、そのノードは‘S’に設定され、ボリュームは8つのさらに小さなボリュームに細分される。この過程は、ツリーがあらかじめ設定された深さに到達するまで反復される。このあらかじめ設定された深さで、もしノードが全て‘B’と‘W’ボクセルを含んでいれば‘P’と表し、そのボクセルの値はPPM方法によって符号化することができる。
図3A〜図3Dは、ラベル付きボリュームデータの八分木表現を表している。説明を容易にするために、本例では2次元の2進イメージとこれらについての四分木表現を使用する。図3Aは、四分木での親−子関係を示している。図3Bは、2進イメージと相応する四分木を表し、あらかじめ設定された深さは2である。この2進イメージは、四分木と3つの‘P’ノードに対するPPM符号化されたデータを使用して無損失に復元されうる。
図12は、併合順序選択部1110(図11)の構成をブロック図に示したものであって、前記併合順序選択部1110は、ツリー構造の3次元オブジェクトデータを、ラベルを参照して併合するものである。図12に示すように、併合順序選択部1110は、候補ノード選択部1200、最適ノード選択部1210及び候補ノード更新部1220を備えている。候補ノード選択部1200は、ノードのラベルが‘P’であるノードと、‘S’ノードとを、併合する候補ノードとして選択する。ここで、‘S’ノードは、下位ノードのラベルが‘W’または‘B’、あるいは‘W’と‘B’とで構成される。そして、最適ノード選択部1210は、併合前の歪曲したビット数と併合後の歪曲したビット数との差ΔDと、併合前のビット数と併合後のビット数との差ΔRとの比が最小となるノードを、最適ノードとして選択する。そして、最適ノード選択部1210は、最適ノードのラベルを‘B’と表す(ラベル付けする)。また、候補ノード更新部1220は、候補ノードのうち最適ノードに選択されたノードを除いて候補ノードを更新する。
以下、図3B乃至図3D、図13及び図14を参照してツリー併合について説明する。図3B乃至図3Dは、ラベル付き八分木表現とツリー併合とを示したものである。最初のツリーは、元来の深さ情報を複数の区分されたレベルで近似化させるために、反復的に併合される。ここで、併合可能なノードは、‘P’と表示されるノードか、全ての子ノードが‘B’または‘W’ノードである‘S’ノードである。例えば、図3Bに、ツリーに太い黒色円で表示された4つの併合可能なノードがある。そのうち何れか一つのノード、すなわち、2進イメージで太い黒色の四角形によって表示されたノードが、‘B’ノードに併合されると仮定する。併合結果となる2進イメージとツリーとは、図3Cに示されている。それにより、3つの併合可能なノードが残り、そのうち何れか一つは、図3Dのように併合される。この段階で、上段左側の四分面に対するノードは併合され、その全ての子は‘B’または‘W’ノードである。この併合過程は、全ノードが一つのルートノードに併合されるまで続けられる。
図13は、前記した過程の候補ノード選択部1200の動作をフローチャートに示したものである。iは、ノードの番号を表し、COUNT(計数)は、候補ノードの数を表す。i値とCOUNT値とを0に初期化し(1300段階)、ノードが‘S’や‘P’であれば(1310段階)、候補ノードとして選択されてキューに保存され、COUNT値を1増加する(1330段階)。ここで、‘S’ノードは、下位ノードが‘W’または‘B’、あるいは、これらが混合されている場合だけ候補ノードとなりうる。もし、ノードが‘S’や‘P’でなければ、次のノードに対して1310段階を行う(1320段階)。前記過程を最後のノードまで反復する(1340段階)。
一方、各段階で併合されているノードは、併合可能なノードのセットで選択され、以下の(1)式のような割合に最小化される。
ここで、ΔR=Ra−Rbは、併合後のビット数Raと併合前のビット数Rb間の差を表す。同様に、ΔD=Da−Dbは、併合前後の歪曲したビット数の差を表す。ノードの併合は、要求されるビットレートは減少させるが、近似化されたモデルの歪曲は増加させることになる。したがって、歪曲の増加を最小化させ、ビットレートの減少を最大化させる併合ノードを捜し出す。
そして、前記併合前後の歪曲されたビット数の差ΔDは、
によって計算する。
ΔRを計算するためには、八分木とそのPPMノードとを表現するために要求されるビット数を計算する必要である。しかし、ビット率(ビットレート)の正確な計算は非常に複雑である。そこで、典型的なツリービットとPPMビットとをいくつかのテストモデルに適用することで、ビット率を計算する。
図14は、併合順序選択部1110の動作をフローチャートに示したものである。候補ノード選択部1200で候補ノードが選択されれば、候補ノード各々に対して、前記(1)式によって計算された値が最小となった候補ノードを最適ノードとして選択し(1410段階)、選択されたノードを‘B’とし(1420段階)、そのノードをキューで除去した後(1430段階)、キューを更新する(1440段階)。そして、この過程を全ノードが併合されるまで続ける(1450段階)。
一方、ノード符号化部1120は、併合されたノードを符号化する。図15は、ノード符号化部1120の構成を示したものである。図15に示すように、ノード符号化部1120は、Continueフラグ符号化部1500、ノード位置符号化部1510、ノードSOP選択部1520、Sノード符号化部1530及びPノード符号化部1540を備えている。
Continueフラグ符号化部(コンティニューフラグ符号化部)1500は、圧縮されたビットストリームが終わりであるか否か表すコンティニューフラグを符号化する。終わりでなければ、‘真’に設定され、終わりであれば‘偽’に設定される。ノード位置符号化部1510は、候補ノードを保存する候補ノードキューを備え、そのキュー内における位置を示すノード位置情報を符号化する。また、ノードSOP選択部1520は、ノードがSノードであるかPノードであるかに関するノード種類情報を符号化する。また、Sノード符号化部1530は、ノード種類情報がSノードであれば、SノードのDIB(詳細情報)を符号化する。Pノード符号化部1540は、ノード種類情報がPノードであれば、PノードのDIBを符号化する。
図16は、前記したノード符号化部1120の動作をフローチャートに示したものである。これを簡単に説明すれば、まず、コンティニュー(Continue)フラグを符号化する(1600段階)。このコンティニューフラグは、圧縮されたビットストリームが終わりであるか否かを表す。終わりでなければ、‘真’を表す。次いで、ノード位置情報(位置情報)を符号化する(1610段階)。次いで、ノードが‘P’ノードであるかを調べて(1620段階)、PノードであればPノードのDIBを符号化(Pノード符号化)し(1630段階)、Pノードでなければ、SノードのDIBを符号化(Sノード符号化)する(1640段階)。この過程を全ノードが符号化されるまで反復する(1650段階)。
そして、図17は、Sノード符号化部1530の動作をフローチャートに示したものである。Sノードの符号化は、カラー情報(色情報)の平均値を符号化し(1700段階)、8つの下位ノードのラベルを符号化する(1710段階)。図18は、Pノード符号化部1540の動作をフローチャートに示したものであって、深さ情報を符号化し(1800段階)、カラー情報をDPCM(Differential Pulse Code Modulation)符号化する(1810段階)。
さらに詳細に説明する。併合過程で、ノードは前記(1)式での優先レベルの順番で併合される。一方、ビットストリームは、その反対の順番で符号化される。すなわち、最も遅く併合されたものが最も先に符号化される。したがって、圧縮されたビットストリームを構文分析すれば、デコーダは最も粗末なモデルから最も精巧なモデル(元来のモデル)まで3次元モデルを復元できる。図4は、前記併合方法を利用して、ビット数−歪曲曲線を示したものである。
以下、ビットストリームの構成を説明する。圧縮されたビットストリームは、八分木のノードデータで構成される。このビットストリームのノードの順序は、前記したように併合されるノードの逆順に与えられる。図5は、ノードのビットストリームの構造を示したものであって、ノードの情報はContinue flag(コンティニューフラグ)、Position(ノード位置情報)、SOP(‘S’or‘P’)、DIB(詳細情報:Detailed Information Bits)で構成される。
第一の、コンティニューフラグ(Continue flag)は、圧縮されたビットストリームが終わりであるか否かを表す。これら全てのデータは、AAC(適応算術符号化:Adaptive Arithmetic Coding)を使用してエントロピー符号化される。第二の、Position(ノード位置情報)は、いかなる‘B’ノードが分離またはPPM符号化されるかを表す。例えば、デコーダがこれまで受信した図3Dに示された近似化されたモデルを復元すると仮定する。図3Dに示された八分木には、4つの‘B’ノードがあり、図3Cのようなさらに精巧なモデルを得るためには、エンコーダはデコーダに左側から2番目の‘B’ノードがPPM符号化されなければならないことを知らせる必要がある。したがって、‘B’ノード候補のうち現在のノード順序は、ノード位置情報として符号化される。もし、一つのB候補ノードだけあれば、Positionは必要なく、したがって符号化されない。第三の、SOPは、現在のノードが8つの子ノードに分けられなければならないか、またはPPM符号化されなければならないかを表す。もし、SOPが現在ノードは‘S’ノードであることを表せば、DIBは現在ノードの平均カラー(平均色:Average color)と子ノードとが、Wノードであるか否かを表す8つのフラグで構成される。Wノードではないノードは、一時的にBノードと見なされ、次のビットストリームのためのB候補ノードを記録しているキューに入れられる。図6は、‘S’ノードの構造を示している。
もし、SOPが、現在ノードは‘P’ノードであることを表せば、現在ノード内にあるBボクセルの深さ情報がPPM符号化され、Bボクセルのカラー情報(色情報)はDPCM符号化される。図7は、‘P’ノードのビットストリーム構造を示したものである。PPMは、元来ファクシミリデータを無損失方式に圧縮するために、ClearyとWittenによって提案されたものである。
ここで、‘P’ノードの符号化を説明する。前記したように、深さ情報は、2進ボクセル値と表現される。Wボクセルは、透明な背景を表現し、Bボクセルは3次元オブジェクトを表す。Pノード内の2進ボクセル値は、隣接するボクセル値をコンテクストとして使用してPPM符号化される。図8A及び図8Bは、コンテクストの例を示したものである。図8Bに示された四角形のボクセルが符号化される。四角形のボクセルを符号化するために、13個の円よりなるボクセルがコンテクストとして使われる。ラスタースキャン順序によってWボクセルは、‘0’にセッティングされ、Bボクセルは‘1’にセッティングされる。この13個のビットは、四角形のボクセルのコンテクストとして使われる。この例で、四角形のボクセルのコンテクストは‘0011101000011’である。しかし、この例でコンテクストの数は213である。これは、演算、処理するにはあまりにも大きすぎる。したがって、コンテクストの数を減らす必要がある。シミュレーションによって全体エントロピーを大きく増加させないボクセルの除去を選択する。まず、二つのボクセルが除去される。次いで、さらに他のボクセルが除去される。除去された3つのボクセルは、図8Aに示されたように‘X’とマーキングされる。このコンテクストを利用して、ボクセルはコンテクストAACによって圧縮される。
図8Bに示された四角形のボクセルが符号化され、図8Aと図8Bとに示された円よりなるボクセルはコンテクストとして使われる。そして、図8Aでは、除去されたボクセルが‘X’とマーキングされた3つのボクセルであることを示す。
深さ情報を符号化した後、現在ノード内にあるBボクセルのR、G、Bカラー値は、ラスタースキャン順序にDPCM符号化される。さらに具体的には、BボクセルのR、G、Bカラー値は、以前のBボクセルそれぞれの値から予測される。そして、予測誤差は算術符号化される。
ビットストリーム生成部1130は、ノード符号化されたデータをビットストリームに生成する。
前記した本発明は、3次元オブジェクトデータの符号化をプログレシブ(漸進的)にするプログレシブ符号化方式を中心に説明したが、無損失符号化方式や損失符号化方式で符号化することもある。全体ビットストリームを全て符号化すれば、無損失符号化方式となり、全体ビットストリームで最初から一部分まで符号化すれば、損失符号化方式となる。
次は、3次元オブジェクトデータの復号化方法及び装置について説明する。
図19は、3次元オブジェクトデータの復号化装置の構成をブロック図に示したものである。図19に示したように、この復号化装置は、ビットストリーム読出し部1900、ノード復号化部1910及びツリー構造復元部1920を備えている。ビットストリーム読出し部1900は、符号化された3次元オブジェクトデータのビットストリームを収容し、ノード復号化部1910はビットストリームを復号化し、ツリー構造復元部1920は復号化されたノードをツリー構造に復元する。
図20は、ノード復号化部1910の構成をブロック図に示したものである。図20に示すように、ノード復号化部1910は、Continueフラグ復号化部2000、ノード位置情報復号化部2010、ノード種類選択部2020、Sノード復号化部2030及びPノード復号化部2040を備えて構成されている。
Continueフラグ復号化部(コンティニューフラグ復号化部)2000は、3次元オブジェクトデータの符号化されたビットストリームからコンティニューフラグを読出して復号化する。ノード位置情報復号化部2010は、符号化された3次元オブジェクトデータのビットストリームから、現在ノードがキューで何れの候補ノードであるかを表すノード位置情報を読出して復号化する。ノード種類選択部2020は、ノード種類情報を復号化する。Sノード復号化部2030は、ノード種類情報がSノードを表せば、DIB値で下位8つのノードに対する平均色を復号化し、下位8つのノードを順に‘B’または‘W’に復号化する。Pノード復号化部2040は、ノード種類情報がPPMノードを表せば、DIB値で現在ノードをPPM復号化して、現在ノードのBボクセルの色であるR、G、B値に対して逆AACを行って復号化し、逆DPCMを行って復号化する。
図21は、ノード復号化部1910の動作をフローチャートに示したものであって、まずコンティニュー(Continue)フラグを復号化し(2100段階)、その次にPosition(ノード位置情報(位置情報))を復号化した後(2110段階)、ノードがPノードであるか調べ(2120段階)、PノードであればPノード復号化し(2130段階)、PノードでなければSノード復号化する(2140段階)。この過程を全モードに対して行う(2150段階)。
図22は、Sノード復号化部2030の動作をフローチャートに示したものであって、平均カラー情報を復号化し(2200段階)、8つの下位ノードラベルを復号化する(2210段階)。図23は、Pノード復号化部2040の動作をフローチャートに示したものであって、PPM深さ情報を復号化し(2300段階)、カラー情報を、逆DPCMを通じて復号化する(2310段階)。さらに具体的に説明すれば、DIB値で現在ノードをPPM復号化し、現在ノードの‘B’ボクセルの色であるR、G、B値を、逆AACにより復号化し、逆DPCMにより復号化する。
これをさらに詳細に説明する。複号化過程は、符号化に似ている。まず、復号化装置は、ビットストリームのコンティニューフラグを読出して、ビットストリームが終わりであるか否かを調べる。次いで、PositionとSOPデータとを読出して、復号化装置はいかなるBノードが分離されなければならないか、またはPPM復号化されなければならないかを捜し出す。‘S’ノードの場合、現在ノードの全てのボクセルのカラー値は、一時的にDIB内でR、G、Bカラー値の平均値に設定される。このカラー値は、子データが受信される時に更新される。‘P’ノードの場合、現在ノードのBボクセルの深さ及びカラー情報は、DIBを使用して損失なく復元される。
前記した3次元オブジェクトデータの復号化は、プログレシブ(漸進的)に復号化するプログレシブ復号化方式を中心に記述した。すなわち、プログレシブ復号化方式を使用すれば、映像データのビットストリームの復号化されるノード別に復号化が進行される。したがって、復号化されたデータが画面にディスプレイされる場合、最上位ノードから始まって下位ノードに復号化が進行されてノード別に画面にディスプレイされる。結局、画面にディスプレイされる映像は、ノードが下位に進行されるほど次第に精密で明確にディスプレイされて最下位の最後のノードまで復号化されれば、最も精密で明確な映像がディスプレイされる。
また、前記した3次元オブジェクトデータの復号化は、プログレシブ復号化方式を中心に記述したが、無損失復号化方式または損失復号化方式に復号化できる。すなわち、全体ビットストリームを全て復号化すれば、無損失復号化方式となり、全体ビットストリームで最初から特定ノードまで復号化すれば、損失復号化方式となる。
本発明はまた、コンピュータで読取れる記録媒体にコンピュータが読取れるコードとして具現できる。コンピュータが読取れる記録媒体は、コンピュータシステムによって読取られるデータが保存される全ての種類の記録装置を含む。コンピュータが読取れる記録媒体の例には、ROM、RAM、CD−ROM、磁気テープ、フロッピー(R)ディスク、光データ保存装置があり、また、キャリヤウェーブ(例えば、インターネットを通じた伝送)状に具現されるものも含む。また、コンピュータが読取れる記録媒体は、ネットワークに連結されたコンピュータシステムに分散されて分散方式にコンピュータが読取れるコードが保存され、かつ、実行されうる。
以上、本発明の望ましい実施例について図示して説明したが、本発明は前記した特定の望ましい実施例に限定されず、特許請求の範囲内で本発明の要旨を外れず、当業者なら、これから多様な変形実施が可能であることが分かる。
本発明による3次元オブジェクトデータの符号化及び復号化方法の性能を、図9に示したテストモデルを使用して評価した。図9(a)〜(e)に示したモデルは、解像度256×256×256を有し、図9(f)〜(h)は512×512×512解像度を有する。
図10A及び図10Bは、ポイントテクスチャイメージ上でのWinZipと本発明による方法の圧縮性能を比較したものを示している。図10Aは、本発明による圧縮効率を示した図である。図10Bは、本発明とWinZipとの圧縮効率を比較した図である。ここで、「O」はオリジナルの2進データのファイルサイズ、「P」は本発明による圧縮後のファイルサイズ、「W」は、WinZipよる圧縮後のファイルサイズ、「R」はP/OまたはP/Wの比率を表している。
深さ情報(DEPTH)に対して、提案されたアルゴリズムは、WinZipにおけるファイルサイズの22−59%の圧縮率である。カラー情報(COLOR)に対して、提案されたアルゴリズムは、WinZipにおけるファイルサイズの59−81%の圧縮率である。圧縮率が悪くなる唯一の例外は‘Plane’モデルである。これは多様でない単色だけで構成されており、このような場合は、事前基盤復号であるWinZipがさらに優れた性能を表す。‘Plane’モデルを除いて、提案されたアルゴリズムは、深さ情報とカラー情報とを共に圧縮するためにWinZipのファイルサイズの49−75%の高圧縮となる。
本発明による3次元オブジェクトデータ符号化及び復号化方法、並びに、その装置は、コンピュータグラフィック、シミュレーション、3次元アニメーションのような3次元オブジェクトデータを取り扱う全ての分野で適用されうる。
LDIに対するポイントテクスチャの例を示す図面である。 ポイントテクスチャのノード仕様を示す図面である。 ラベル付きボリュームデータの八分木表現を示す図面(その1)である。 ラベル付きボリュームデータの八分木表現を示す図面(その2)である。 ラベル付きボリュームデータの八分木表現を示す図面(その3)である。 ラベル付きボリュームデータの八分木表現を示す図面(その4)である。 符号化方法を利用して、ビット量−歪曲曲線を示す図面である。 ノードのビットストリームの構造を示す図面である。 ‘S’ノードのビットストリーム構造を示す図面である。 ‘P’ノードのビットストリーム構造を示す図面である。 コンテクストの例(深さ=k−1)を示す図面である。 コンテクストの例(深さ=k)を示す図面である。 本発明の性能を試験するためのテストモデルを示す図面である。 ポイントテクスチャのテストモデルに対して本発明による圧縮を行った場合の性能を示した図面である。 ポイントテクスチャのテストモデルに対してWinZipと本発明による方法の圧縮性能とを比較した図面である。 本発明による3次元オブジェクトデータの符号化装置の構成を示すブロック図である。 併合順序選択部の構成を示すブロック図である。 候補ノード選択部の動作を示すフローチャートである。 併合順序選択部の動作を示すフローチャートである。 ノード符号化部の構成を示すブロック図である。 ノード符号化部の動作を示すフローチャートである。 Sノード符号化部の動作を示すフローチャートである。 Pノード符号化部の動作を示すフローチャーとである。 本発明による3次元オブジェクトデータの復号化装置の構成を示すブロック図である。 ノード復号化部の構成を示すブロック図である。 ノード復号化部の動作を示すフローチャートである。 Sノード復号化部の動作を示すフローチャートである。 Pノード復号化部の動作を示すフローチャートである。
符号の説明
1100 ツリー構造生成部
1110 併合順序選択部
1120 ノード符号化部
1130 ビットストリーム生成部
1200 候補ノード選択部
1210 最適ノード選択部
1220 候補ノード更新部
1500 Continue(コンティニュー)フラグ符号化部
1510 ノード位置符号化部
1520 ノードSOP選択部
1530 S(‘S’)ノード符号化部
1540 P(‘P’)ノード符号化部
1900 ビットストリーム読出し部
1910 ノード復号化部
1920 ツリー構造復元部
2000 Continue(コンティニュー)フラグ復号化部
2010 ノード位置情報復号化部
2020 ノード種類選択部
2030 S(‘S’)ノード復号化部
2040 P(‘P’)ノード復号化部

Claims (30)

  1. ツリー構造生成手段によって、ポイントテクスチャ、ボクセル、八分木構造のデータのうち何れか一つよりなる3次元オブジェクトデータに対して、ノードの種類を表すラベル付きツリー構造の3次元オブジェクトデータを生成する3次元オブジェクトデータ生成段階と、
    ノード符号化手段によって、前記3次元オブジェクトデータ生成段階で生成された前記ラベル付きツリー構造の3次元オブジェクトデータのノードを符号化するノード符号化段階と、
    ビットストリーム生成手段によって、前記ノード符号化段階でノード符号化されたデータを、ビットストリームとして生成するビットストリーム生成段階と、をコンピュータに実行させることを特徴とする3次元オブジェクトデータの符号化方法。
  2. 前記ラベル付きツリー構造の3次元オブジェクトデータを生成する段階は、
    3次元バウンディングボリュームを使用して前記3次元オブジェクトデータをボクセルデータに変換して、オブジェクトが存在する位置のボクセルと、オブジェクトが存在していない位置のボクセルとを、ラベルを付けて区分することを特徴とする請求項1に記載の3次元オブジェクトデータの符号化方法。
  3. 前記ラベルを付けてボクセルを区分するとは、
    前記3次元オブジェクトデータを表すツリーのノードのうち、注目するノードが、更に、複数のノードに分けられる時は該注目するノードに‘S’をラベル付けし、注目するノードに含まれるボクセルが全てオブジェクトのないボクセルで構成される時は該注目するノードに‘W’をラベル付けし、注目するノードに含まれるボクセルが全てオブジェクトのあるボクセルで構成される時は該注目するノードに‘B’をラベル付けし、注目するノードに含まれるボクセルがPPMアルゴリズムによって符号化される時は該注目するノードに‘P’をラベル付けすることを特徴とする請求項2に記載の3次元オブジェクトデータの符号化方法。
  4. 前記ノード符号化段階は、
    ノードがSノードであるか、またはPノードであるかに関するノード情報を符号化する段階と、
    前記ノード情報がSノードであればSノードの詳細情報を符号化し、PノードであればPノードの詳細情報を符号化する段階と、を含むことを特徴とする請求項3に記載の3次元オブジェクトデータの符号化方法。
  5. 前記ノード符号化段階は、
    ラベル付きツリー構造の3次元オブジェクトデータの開始ノードから特定ノードまでを符号化することを特徴とする請求項1に記載の3次元オブジェクトデータの符号化方法。
  6. 前記ノード符号化段階は、
    ラベル付きツリー構造の3次元オブジェクトデータの全ノードを符号化することを特徴とする請求項1に記載の3次元オブジェクトデータの符号化方法。
  7. ツリー構造生成部によって、ポイントテクスチャ、ボクセル、八分木構造のデータのうち何れか一つよりなる3次元オブジェクトデータに対して、ノードごとにラベル付きツリー構造の3次元オブジェクトデータを生成する段階と、
    併合順序選択部によって、前記ノードごとにラベル付きツリー構造の3次元オブジェクトデータを、前記ラベルを参照して併合する併合段階と、
    ノード符号化部により、前記併合されたノードを符号化するノード符号化段階と、
    ビットストリーム生成部によって、このノード符号化段階でノード符号化されたデータを、ビットストリームとして生成するビットストリーム生成段階と、
    前記併合段階、ノード符号化段階及びビットストリーム生成段階を、前記ツリー構造の3次元オブジェクトデータの最上位ノードまで反復する段階と、をコンピュータに実行させることを特徴とする3次元オブジェクトデータの符号化方法。
  8. 前記ラベル付きツリー構造の3次元オブジェクトデータを生成する段階は、
    注目するノードに他のノードが含まれる時は該注目するノードに‘S’をラベル付けし、注目するノードに含まれるボクセルが全てオブジェクトのないボクセルで構成される時は該注目するノードに‘W’をラベル付けし、注目するノードに含まれるボクセルが全てオブジェクトのあるボクセルで構成される時は該注目するノードに‘B’をラベル付けし、注目するノードに含まれるボクセルがPPMアルゴリズムによって符号化される時は該注目するノードに‘P’をラベル付けすることを特徴とする請求項7に記載の3次元オブジェクトデータの符号化方法。
  9. 前記併合段階は、
    ラベルが‘P’であるノードと、ラベルが‘W’と‘B’とであるノードを含む‘S’ノードとを、併合する候補ノードとして選択する段階と、
    前記候補ノードに対して併合前後の歪曲されたビット数の差ΔDと併合前後のビット数の差ΔRとの比が最小となるノードを最適ノードとして選択する段階と、
    前記最適ノードに‘B’をラベル付けする段階と、
    前記候補ノードのうち最適ノードとして選択されたノードを除いて、前記候補ノードを更新する段階と、を含むことを特徴とする請求項8に記載の3次元オブジェクトデータの符号化方法。
  10. 前記併合前後の歪曲されたビット数の差ΔDは、
    によって計算されることを特徴とする請求項9に記載の3次元オブジェクトデータの符号化方法。
  11. 前記ノード符号化段階は、
    前記候補ノードがキューに存在しているか否かを表す情報であるコンティニューフラグを符号化する段階と、
    前記候補ノードを保存するキュー内における位置を示すノード位置情報を符号化する段階と、
    ノードがSノードであるかPノードであるかを示すノード種類情報を符号化する段階と、
    前記ノード種類情報がSノードであればSノードの詳細情報を符号化し、PノードであればPノードの詳細情報を符号化する段階と、を含むことを特徴とする請求項8または請求項9に記載の3次元オブジェクトデータの符号化方法。
  12. 前記Sノードの詳細情報の符号化は、
    色情報の平均値を符号化する段階と、
    前記Sノードに含まれる8つのノードのラベルを符号化する段階と、を含むことを特徴とする請求項11に記載の3次元オブジェクトデータの符号化方法。
  13. 前記Pノードの詳細情報の符号化は、
    深さ情報を符号化する段階と、
    色情報を符号化する段階と、を含むことを特徴とする請求項11に記載の3次元オブジェクトデータの符号化方法。
  14. 前記深さ情報の符号化は、
    所定数のコンテクストを使用して当該ノードに含まれる全てのノードをラスタースキャン順にPPM符号化することを特徴とする請求項13に記載の3次元オブジェクトデータの符号化方法。
  15. 前記色情報の符号化は、
    現在ノードの‘B’ボクセルの色であるレッド(R)、グリーン(G)、ブルー(B)値をDPCM符号化し、AAC符号化することを特徴とする請求項13に記載の3次元オブジェクトデータの符号化方法。
  16. 前記ノード符号化段階は、
    前記併合されたノードの最上位ノードから特定ノードまで符号化することを特徴とする請求項7に記載の3次元オブジェクトデータの符号化方法。
  17. 前記ノード符号化段階は、前記併合されたノードの全ノードを符号化することを特徴とする請求項7に記載の3次元オブジェクトデータの符号化方法。
  18. ポイントテクスチャ、ボクセル、八分木構造のデータのうち何れか一つよりなる3次元オブジェクトデータに対して、ノードごとにノードの種類を表すラベル付きツリー構造の3次元オブジェクトデータを生成するツリー構造生成部と、
    前記ツリー構造の3次元オブジェクトデータのノードを、前記ラベルを参照して併合する併合順序選択部と、
    前記併合されたノードを符号化するノード符号化部と、
    このノード符号化部でノード符号化されたデータを、ビットストリームとして生成するビットストリーム生成部と、を含むことを特徴とする3次元オブジェクトデータの符号化装置。
  19. 前記併合順序選択部は、
    更に、複数のノードを含むSノード
    複数のノードを併合した候補ノードを選択する候補ノード選択部と、
    前記候補ノードに対して併合前後の歪曲されたビット数の差ΔDと併合前後のビット数の差ΔRとの比が最小となるノードを最適ノードとして選択して前記最適ノードである旨のラベルをラベル付けする最適ノード選択部と、
    前記候補ノードのうち最適ノードとして選択されたノードを除いて、前記候補ノードを更新する候補ノード更新部と、を含むことを特徴とする請求項18に記載の3次元オブジェクトデータの符号化装置。
  20. 前記ノード符号化部は、
    圧縮されたビットストリームが終わりであるか否かを表すコンティニューフラグを符号化するコンティニューフラグ符号化部と、
    前記候補ノードを保存するキューを備え、前記キュー内における位置を示すノード位置情報を符号化するノード位置符号化部と、
    ノードがSノードであるかPノードであるかを示すノード種類情報を符号化するノードSOP選択部と、
    前記ノード種類情報がSノードであれば、Sノードの詳細情報を符号化するSノード符号化部と、
    前記ノード種類情報がPノードであれば、Pノードの詳細情報を符号化するPノード符号化部と、を含むことを特徴とする請求項18または請求項19に記載の3次元オブジェクトデータの符号化装置。
  21. 前記ノード符号化部は、
    前記併合されたノードの最上位ノードから特定ノードまで符号化することを特徴とする請求項18に記載の3次元オブジェクトデータの符号化装置。
  22. 前記ノード符号化部は、
    前記併合されたノードの全ノードを符号化することを特徴とする請求項18に記載の3次元オブジェクトデータの符号化装置。
  23. コンティニューフラグ復号化部によって、符号化された3次元オブジェクトデータのビットストリームからコンティニューフラグ情報を読出して復号化する段階と、
    ノード復号化部によって、符号化された3次元オブジェクトデータのビットストリームに対してノード種類情報を復号化する段階と、
    前記ノード復号化部によって、前記ノード種類情報がSノードを表せばSノードを復号化し、前記ノード種類情報がPPMノードを表せばPPMノードを復号化する段階と、
    ツリー構造復元部によって、ノード復号化されたデータをツリー構造に復元する段階と、をコンピュータにより実行させることを特徴とする3次元オブジェクトデータの復号化方法。
  24. ノード復号化部によって、符号化された3次元オブジェクトデータのビットストリームに対してノードを復号化する段階と、
    ツリー構造復元部によって、前記ノードが復号化されたデータをツリー構造に復元する段階と、をコンピュータに実行させることを特徴とする3次元オブジェクトデータの復号化方法。
  25. 前記ノードを復号化する段階は、
    符号化された3次元オブジェクトデータのビットストリームからコンティニューフラグを読出して復号化する段階と、
    現在ノードがキューで何れの候補ノードであるかを示すノード位置情報を読出して復号化する段階と、
    ノード種類情報を復号化する段階と、
    前記ノード種類情報がSノードを表せばSノードを復号化する段階と、
    前記ノード種類情報がPPMノードを表せばPPMノードを復号化する段階と、を含むことを特徴とする請求項24に記載の3次元オブジェクトデータの復号化方法。
  26. 前記Sノードを復号化する段階は、
    前記Sノードに含まれる8つのノードに対する平均色を復号化し、更に、復号化された前記8つのノードを順にBまたはWに復号化することを特徴とする請求項25に記載の3次元オブジェクトデータの復号化方法。
  27. 前記PPMノードを復号化する段階は、
    詳細情報値で現在ノードをPPM復号化し、現在ノードの‘B’ボクセルの色であるR、G、B値を逆AACにより復号化し、逆DPCMを行って復号化することを特徴とする請求項26に記載の3次元オブジェクトデータの復号化方法。
  28. 符号化された3次元オブジェクトデータのビットストリームを収容するビットストリーム読出し部と、
    前記ビットストリームを復号化するノード復号化部と、
    前記復号化されたノードをツリー構造に復元するツリー構造復元部と、を含むことを特徴とする3次元オブジェクトデータの復号化装置。
  29. 前記ノード復号化部は、
    ビットストリームが継続されるか否かを表すコンティニューフラグを復号化するコンティニューフラグ復号化部と、
    符号化された3次元オブジェクトデータのビットストリームから、現在ノードがキューで何れの候補ノードであるかを示すノード位置情報を読出して復号化するノード位置情報復号化部と、
    ノード種類情報を復号化するノード種類選択部と、
    前記ノード種類情報がSノードを表せば、前記Sノードに含まれる8つのノードに対する平均色を復号化し、更に、復号化された前記8つのノードを順に‘B’または‘W’に復号化するSノード復号化部と、
    前記ノード種類情報がPPMノードを表せば、詳細情報値で現在ノードをPPM復号化し、現在ノードの‘B’ボクセルの色であるR、G、B値に対して逆AACを行って復号化し、逆DPCMを行って復号化するPノード復号化部と、を含むことを特徴とする請求項28に記載の3次元オブジェクトデータの復号化装置。
  30. コンピュータに、
    請求項1乃至請求項17の3次元オブジェクトデータの符号化方法、又は、請求項23乃至請求項27の3次元オブジェクトデータの復号化方法を実行させるためのプログラムを記録したコンピュータで再生できる記録媒体。
JP2003407532A 2002-12-05 2003-12-05 3次元オブジェクトデータの符号化及び復号化方法、並びに、その装置 Expired - Fee Related JP4166679B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US43097602P 2002-12-05 2002-12-05
US48726303P 2003-07-16 2003-07-16
KR10-2003-0083778A KR100513732B1 (ko) 2002-12-05 2003-11-24 3차원 객체 데이터 부호화 및 복호화 방법 및 장치

Publications (2)

Publication Number Publication Date
JP2004185628A JP2004185628A (ja) 2004-07-02
JP4166679B2 true JP4166679B2 (ja) 2008-10-15

Family

ID=32397772

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003407532A Expired - Fee Related JP4166679B2 (ja) 2002-12-05 2003-12-05 3次元オブジェクトデータの符号化及び復号化方法、並びに、その装置

Country Status (4)

Country Link
EP (1) EP1431919B1 (ja)
JP (1) JP4166679B2 (ja)
CN (1) CN1301493C (ja)
RU (1) RU2267161C2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020226605A1 (en) * 2019-05-03 2020-11-12 Hewlett-Packard Development Company, L.P. Temperature values in additive manufacturing

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100519780B1 (ko) * 2004-02-17 2005-10-07 삼성전자주식회사 3차원 체적 데이터 부호화/복호화 방법 및 장치
JP4653538B2 (ja) * 2005-03-30 2011-03-16 富士通株式会社 3次元データ管理装置、3次元データ管理プログラム及び3次元データ管理方法
CN1946180B (zh) * 2006-10-27 2010-05-12 北京航空航天大学 一种基于Octree的三维模型压缩编码方法
EP2201784B1 (en) * 2007-10-11 2012-12-12 Koninklijke Philips Electronics N.V. Method and device for processing a depth-map
US8660402B2 (en) * 2007-12-14 2014-02-25 Koninklijke Philips N.V. 3D mode selection mechanism for video playback
CN104253670B (zh) * 2008-02-12 2018-04-10 艾利森电话股份有限公司 无线通信网络中的方法和装置
KR101487686B1 (ko) 2009-08-14 2015-01-30 삼성전자주식회사 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
JP5859441B2 (ja) * 2009-10-02 2016-02-10 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. 3dビデオにおける追加のビューを生成するための視点の選択
IT1397591B1 (it) * 2009-12-21 2013-01-16 Sisvel Technology Srl Metodo per la generazione, trasmissione e ricezione di immagini stereoscopiche e relativi dispositivi.
US9325964B2 (en) * 2010-02-09 2016-04-26 Koninklijke Philips N.V. 3D video format detection
RU2453922C2 (ru) 2010-02-12 2012-06-20 Георгий Русланович Вяхирев Способ представления исходной трехмерной сцены по результатам съемки изображений в двумерной проекции (варианты)
KR101549644B1 (ko) 2010-04-13 2015-09-03 지이 비디오 컴프레션, 엘엘씨 샘플 영역 병합
KR102481529B1 (ko) 2010-04-13 2022-12-23 지이 비디오 컴프레션, 엘엘씨 평면 간 예측
TWI666882B (zh) 2010-04-13 2019-07-21 美商Ge影像壓縮有限公司 在樣本陣列多元樹細分中之繼承技術
HUE057597T2 (hu) 2010-04-13 2022-05-28 Ge Video Compression Llc Videó kódolás képek többes fa struktúrájú alosztásainak használatával
KR102415787B1 (ko) 2010-05-04 2022-06-30 엘지전자 주식회사 비디오 신호의 처리 방법 및 장치
CN102437855B (zh) * 2011-11-02 2014-03-12 桂林理工大学 一种八叉树三维模型等级归并数据压缩方法
WO2013113170A1 (en) * 2012-02-03 2013-08-08 Thomson Licensing System and method for error controllable repetitive structure discovery based compression
US9188433B2 (en) * 2012-05-24 2015-11-17 Qualcomm Incorporated Code in affine-invariant spatial mask
SG10201803221XA (en) 2013-04-08 2018-06-28 Dolby Int Ab Method for encoding and method for decoding a lut and corresponding devices
RU2602970C2 (ru) * 2014-12-01 2016-11-20 Общество С Ограниченной Ответственностью "Яндекс" Способ организации множества объектов, содержащихся в дереве квадрантов, в односвязный список и компьютер, используемый в нем
EP3429212A1 (en) * 2017-07-13 2019-01-16 Thomson Licensing A method and apparatus for encoding/decoding the geometry of a point cloud representing a 3d object
EP3429207A1 (en) * 2017-07-13 2019-01-16 Thomson Licensing A method and apparatus for encoding/decoding a colored point cloud representing the geometry and colors of a 3d object
EP3429209A1 (en) * 2017-07-13 2019-01-16 Thomson Licensing A method and apparatus for encoding/decoding a point cloud representing a 3d object
EP3467778A1 (en) * 2017-10-06 2019-04-10 Thomson Licensing A method and apparatus for encoding/decoding the geometry of a point cloud representing a 3d object
EP3467777A1 (en) 2017-10-06 2019-04-10 Thomson Licensing A method and apparatus for encoding/decoding the colors of a point cloud representing a 3d object
EP3474233A1 (en) * 2017-10-19 2019-04-24 Thomson Licensing A method and apparatus for encoding/decoding the geometry of a point cloud representing a 3d object
EP3751520A4 (en) * 2018-02-08 2021-03-31 Panasonic Intellectual Property Corporation of America THREE-DIMENSIONAL DATA ENCODING PROCESS, THREE-DIMENSIONAL DATA DECODING PROCESS, THREE-DIMENSIONAL DATA ENCODING DEVICE, AND TRIDIMENSIONAL DATA DECODING DEVICE
WO2019182102A1 (ja) * 2018-03-23 2019-09-26 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置
CA3103454A1 (en) * 2018-06-15 2019-12-19 Panasonic Intellectual Property Corporation Of America Three-dimensional data encoding method, three-dimensional data decoding method, three-dimensional data encoding device, and three-dimensional data decoding device
BR112020024802A2 (pt) * 2018-06-27 2021-03-02 Panasonic Intellectual Property Corporation Of America método de codificação de dados tridimensionais, método de decodificação de dados tridimensionais, dispositivo de codificação de dados tridimensionais e dispositivo de decodificação de dados tridimensionais
WO2020130134A1 (ja) * 2018-12-21 2020-06-25 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置
WO2020184443A1 (ja) * 2019-03-08 2020-09-17 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置
JP7444849B2 (ja) 2019-03-08 2024-03-06 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置
EP4030384A4 (en) * 2019-09-11 2024-03-20 Sony Group Corporation INFORMATION PROCESSING APPARATUS, INFORMATION PROCESSING METHOD, PLAYBACK PROCESSING APPARATUS AND PLAYBACK PROCESSING METHOD

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AUPP366598A0 (en) * 1998-05-22 1998-06-18 Canon Kabushiki Kaisha Deriving polygonal boundaries from quadtree representation

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020226605A1 (en) * 2019-05-03 2020-11-12 Hewlett-Packard Development Company, L.P. Temperature values in additive manufacturing

Also Published As

Publication number Publication date
CN1549206A (zh) 2004-11-24
EP1431919A1 (en) 2004-06-23
RU2267161C2 (ru) 2005-12-27
EP1431919B1 (en) 2010-03-03
CN1301493C (zh) 2007-02-21
JP2004185628A (ja) 2004-07-02
RU2003135434A (ru) 2005-05-27

Similar Documents

Publication Publication Date Title
JP4166679B2 (ja) 3次元オブジェクトデータの符号化及び復号化方法、並びに、その装置
JP4759284B2 (ja) 3次元体積データの符号化/復号化方法及び装置
KR100513732B1 (ko) 3차원 객체 데이터 부호화 및 복호화 방법 및 장치
JP4759291B2 (ja) 適応的2n進ツリーの生成方法、ならびにそれを利用して3次元体積データを符号化/復号化する方法および装置
US7925103B2 (en) Adaptive 2n-ary tree generating method, and method and apparatus for encoding and decoding 3D volume data using it
US8390622B2 (en) Apparatus and method for depth image-based representation of 3-dimensional object
JP4629005B2 (ja) 深さイメージに基づく3次元客体の表現装置、3次元客体の表現方法およびその記録媒体
RU2237283C2 (ru) Устройство и способ представления трехмерного объекта на основе изображений с глубиной
JP4832975B2 (ja) 深さイメージに基づく3次元客体を表現するためのノード構造を記憶させた、コンピュータで読み出し可能な記録媒体
EP4052471A1 (en) Mesh compression via point cloud representation
JP2023544618A (ja) ビデオベースのメッシュ圧縮
US11190803B2 (en) Point cloud coding using homography transform
EP1209626B1 (en) Method and apparatus for data compression
CA2514655C (en) Apparatus and method for depth image-based representation of 3-dimensional object
CN117157671A (zh) 用于编码及解码3d点云的方法、编码器及解码器
Song et al. Progressive compression of PointTexture images

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20061101

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20061107

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061219

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070319

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070417

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070713

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20080116

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080708

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080730

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110808

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110808

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120808

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130808

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees