JP2002183751A

JP2002183751A - グラフィックデータレンダリング方法およびその装置

Info

Publication number: JP2002183751A
Application number: JP2001307645A
Authority: JP
Inventors: Larry D Seiler; ラリー・ディー・シーラー; Stephen R Burgess; ステファン・アール・バージェス; Jeffrey Lussier; ジェフリー・ルシアー; Vishal C Bhatia; ヴィシャル・シー・バティア
Original assignee: TeraRecon Inc Japan Branch
Current assignee: TeraRecon Inc Japan Branch
Priority date: 2000-10-04
Filing date: 2001-10-03
Publication date: 2002-06-28
Also published as: EP1195717A3; EP1195717A2

Abstract

(57)【要約】【課題】画像としてグラフィックデータをレンダリン
グする方法及び装置を提供する。【解決手段】画像に寄与する可能性のあるグラフィッ
クデータが特定される。この特定されたグラフィックデ
ータはレンダリング・パイプラインの中に読み込まれ
る。特定されたグラフィックデータについて、サンプル
が画像に寄与する可能性がある場合にのみ、それらのサ
ンプルはレンダリング・パイプラインの中で生成され
る。これらの特定されたグラフィックデータとサンプル
とは、これらの特定されたグラフィックデータとサンプ
ルとが画像に寄与し続ける限りレンダリング・パイプラ
イン内で処理される。他のすべての特定されたグラフィ
ックデータとサンプルとはパイプラインから廃棄され
る。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明はコンピュータ・グラ
フィックの分野に関連し、特に、並列パイプライン化レ
ンダリング・エンジンを用いるグラフィックデータのレ
ンダリングに関する。

【０００２】

【従来の技術】ボリューム・レンダリングは、視覚化の
ために３次元データを必要とするコンピュータ・グラフ
ィック用アプリケーションでは頻繁に利用される。この
ボリューム・データは、物体のスキャンや医療上のスキ
ャン、あるいは、大気や地球物理学のモデルあるいはそ
の他の科学上のモデルなどであり得る。これらのモデル
で、データの視覚化によりデータで表される基底に在る
現実の世界の構造についての理解が容易になる。

【０００３】ボリューム・レンダリングを用いて、物体
や物理モデルの内部構造並びに外表面の特徴が視覚化さ
れる。ボクセルはボリューム・レンダリングで利用され
る基本的データ項目である。ボクセルとは、物体または
モデルのある特定の３次元部分における値を表すデータ
である。各ボクセルの座標(ｘ,ｙ,z)によって、ボクセ
ルは、表される物体やモデル内の位置に対応づけられ
る。

【０００４】１つのボクセルは物体またはモデル内の或
る特定位置に関連する１以上の値を表す。従来技術のボ
リュームの場合、ボクセル内に含まれる値は、密度、テ
ィッシュ(tissue)タイプ、弾性、あるいは、速度等の１
以上のいくつかの異なるパラメータとすることができ
る。レンダリング中、ボクセル値は、類別と呼ばれる処
理の中で色および不透明度(ＲＧＢα)を示す値に変換さ
れる。これらのＲＧＢα値はブレンドすることができ、
次いで、表示用２次元像面上へ投影される。

【０００５】レンダリング中多用される１つの技術とし
てレイ・キャスティングがある。このレイ・キャスティ
ングでは１組の架空のレイがボクセルの配列を貫通して
キャストされる。このレイはある視点または像面から発
する。次いで、サンプル・ポイントがレイに沿って定義
される。ボクセル値が補間されてサンプル値が決定さ
れ、各レイに沿うサンプル値が組み合わされてピクセル
値が形成される。

【０００６】本明細書に参考文献として取り入れられて
いる、米国特許Ｓｎ.０９/３１５,７４２“ボリューム
・レンダリング集積回路”(１９９９年５月２日、Burge
ss他により出願)には並列パイプラインを用いるレンダ
リング・システムについての記載がある。該レンダリン
グ・システムには、バスによってボリューム・グラフィ
ック・ボード(ＶＧＢ)と接続されたホスト・プロセッサ
が含まれる。ＶＧＢには、ボリューム・レンダリング・
チップ(ＶＲＣ)と接続されたボクセル・メモリとピクセ
ル・メモリとが含まれる。ＶＲＣにはリアルタイムの双
方向ボリューム・レンダリング操作を行うために必要な
すべての論理回路が含まれる。ＶＲＣには４つの相互接
続されたレンダリング・パイプラインが含まれる。実際
に、ＶＧＢによってレンダリング・エンジンすなわち
“グラフィック・アクセラレータ”が設けられる。

【０００７】作動中、ホスト内で処理を実行するアプリ
ケーション・ソフトウェアによってボリューム・データ
がＶＧＢへ転送され、レンダリングが行われる。このア
プリケーション・ソフトウェアによって、パイプライン
によりアクセス可能なレンダリング用レジスタもロード
される。これらのレジスタによってレンダリングの実行
方法が指定される。すべてのデータのロード後、アプリ
ケーションによってレンダリング操作の開始コマンドが
出される。レンダリング操作が完了したとき、出力画像
はピクセルメモリからホストへ、または、３Ｄグラフィ
ックカードへ移され、表示される。

【０００８】

【発明が解決しようとする課題】従来技術によるハード
ウェア・レンダリング・パイプラインに関する１つの問
題点として、パイプライン内に“バブル”が頻繁に出現
することが挙げられる。バブルは、データが任意のクロ
ック・サイクルでは利用できないという事実に起因して
発生する。いったんバブルが入った場合、このバブルは
パイプラインの中をずっと通過していかなければならな
い。その結果、バブルによって時間が空費され、システ
ムのパフォーマンスが低下することになる。

【０００９】従来技術のハードウェア・パイプラインに
関する別の問題として、これらのパイプラインが、一般
に、１データ・セット内のすべてのボクセルを処理する
という問題がある。ボリューム・データの所定の視覚化
を行うために、画像にとって有用な情報に寄与するボク
セル・クラスタもあれば、全く無関係のクラスタも存在
するということは周知の事実である。例えば、医療用の
データ・セットでは、最終画像に寄与しないボクセルの
割合は一般に７０〜９５％の範囲にある。したがって、
不要なボクセル／サンプル処理を除くことにより、作業
の９０％までを除くことが可能となる。

【００１０】したがって、レンダリング・データの複
雑さに対してダイナミックな適合が可能なレンダリング
・システムに対する要望が存在する。さらに、不要デー
タの処理を行わないパイプライン化レンダリング・シス
テムに対する要望が存在する。

【００１１】

【課題を解決するための手段】本発明は、画像としての
グラフィックデータのレンダリングを行う方法及び装置
を提供するものである。画像に寄与する可能性のあるグ
ラフィックデータの特定が行われる。この特定されたグ
ラフィックデータはレンダリング・パイプラインの中へ
読み込まれる。特定されたグラフィックデータ用画像に
寄与する可能性がある場合に限り、レンダリング・パイ
プライン内にサンプルが生成される。この特定されたグ
ラフィックデータとサンプルとが画像に寄与し続ける限
り、これらの特定されたグラフィックデータとサンプル
はレンダリング・パイプライン内で処理される。その他
のすべての特定されたグラフィックデータとサンプルは
パイプラインから廃棄される。

【００１２】

【発明の実施の形態】パイプライン組織図１は、本発明によるコントローラ(ＣＴＲＬ)４００を
用いるボリューム・レンダリング・システム１０の構成
全体を示す。このシステムには、バス１２１によってレ
ンダリング・サブシステム２００と接続されたホスト・
コンピュータ１００が含まれる。１つの利点として、レ
ンダリング・サブシステムは単一ＡＳＩＣとして製造で
きるという点が挙げられる。このホストにはＣＰＵ１１
０とメイン・メモリ１２０が含まれる。

【００１３】図２にも図示のように、レンダリング・サ
ブシステム２００の主要モジュールはメモリ・インター
フェース２１０、バス用論理回路２２０、コントローラ
４００および４つの並列ハードウェア・パイプラインか
らなるレンダリング・パイプライン３００である。すべ
ての４つのパイプラインの範囲にわたる共有スライス・
バッファ２５０を除いて、パイプライン(Ａ、Ｂ、Ｃ、
Ｄ)は互いに独立に作動する。これらのパイプラインは
本発明のレンダリング・エンジンの中核を形成する。

【００１４】メモリ・インターフェースメモリ・インターフェース２１０は、オフチップ・レン
ダリング用メモリ１６０を有する８つのダブル・データ
・レート(ＤＤＲ)同期ＤＲＡＭチャネルの制御を行う。
このレンダリング用メモリは、レンダリングされるボリ
ュームに必要なすべてのデータ２１１(すなわちボクセ
ル、ピクセル、デプス値、ルックアップ・テーブルおよ
びコマンド・キュー)用の統一記憶装置を提供する。メ
モリ・インターフェース２１０は、高帯域アクセスおよ
びオペレーションを行うために、レンダリング用メモリ
１６０へのすべてのアクセスを実行し、バス用論理回路
２２０とコントローラ４００からの要求を仲裁し、モジ
ュールとレンダリング用メモリ１６０にわたって配列デ
ータの配信を行う。

【００１５】バス用論理回路バス用論理回路２２０はホスト・コンピュータ・システ
ム１００とのインターフェースを提供する。ホストがパ
ーソナル・コンピュータ(ＰＣ)またはワークステーショ
ンである場合、このバスは、ＰＣＩ仕様バージョン２.
２に批准する６４ビット、６６ＭＨｚＰＣＩバス１２１
であってもよい。このバス用論理回路は、メモリ・イン
ターフェース２１０を介して、レンダリング用メモリ１
６０から、およびレンダリング用メモリ１６０へデータ
を転送するためのダイレクト・メモリ・アクセス(ＤＭ
Ａ)オペレーションの制御も行う。このＤＭＡオペレー
ションはバースト・モードのデータ転送である。

【００１６】バス用論理回路はコントローラ４００の内
部レジスタ・ファイル２２１へのアクセスも行う。これ
らのアクセスは、ホスト・コンピュータ１００あるいは
ＰＣＩバスと接続した他のデバイスによって開始され
る、個々のレジスタの直接読出し及び／又は書込みであ
る。バス用論理回路２２０はまたデータ転送の効率的制
御を行うためのアクセス・コマンドの解釈も行う。バス
用論理回路はまた、レンダリング操作の制御のために、
コントローラ４００へ直接レジスタ値を送り、コントロ
ーラから戻ってくる状態情報を受け取る。

【００１７】コントローラコントローラ４００は制御信号４０１を用いてボリュー
ム・レンダリング・パイプライン(レンダリング・エン
ジン)３００の作動を制御する。このコントローラはパ
イプラインと並列に接続されることに留意されたい。コ
ントローラが、メモリから何のデータをフェッチするか
を決定し、４つのパイプラインへそのデータを割り当
て、補間重み付け等の制御情報を個々のパイプライン段
へ適時送り、レンダリング操作から出力データと状態情
報とを受ける。

【００１８】コントローラの主要機能はできるだけ多く
のデータを廃棄することである。不要データの廃棄によ
って、レンダリングの大幅な高速化が可能となる。

【００１９】コントローラは、部分的に、多数のレジス
タによって制御される有限状態マシンとして構成され
る。これらは一般にコマンドキューのロード・レジスタ
・コマンドに応じてバス用論理回路２２０によって書込
まれる。内部では、コントローラは、一度に１セクショ
ンずつサンプル空間の中を１ステップずつ処理するため
に必要なカウンタを保持して、サンプル座標をボクセル
座標へ変換し、パイプライン段が必要とする制御情報の
生成を行う。以下さらに詳細にコントローラ４００につ
いて説明する。

【００２０】本コントローラは、時間的にパイプライン
３００よりずっと前に作動するように設計される。これ
によって、コントローラは、どのサンプルとボクセルと
が必要で、廃棄可能なサンプルとボクセルがどれかを決
定することができる。ボリューム・データの或るクラス
内に在るボクセルのうちの９０％ものボクセルが結果と
して得られる画像には影響を与えないことを想起された
い。ボクセルを読み出さないことによりメモリ帯域幅が
節減され、サンプルを処理しないことによりパイプライ
ン・サイクルが節減される。実際、コントローラは、最
低水準までダイナミックにボリューム・データを取り除
くことを試みる。

【００２１】サンプルとボクセルの中には、この決定が
行われる前にパイプラインの初めの段の中に入るものも
ある。その場合、“バブル(bubbles)”を引き起こす可
能性のあるサンプルとボクセルとは後の段で廃棄され
る。しかし、パイプラインの異なる段がバッファされ
て、異なるレートでの作動が可能なため、時としてバブ
ルを搾り出して、ボリュームのレンダリングにかかる時
間量を大幅に低減することができる場合がある。コント
ローラがコマンドを生成するピークレートの方がパイプ
ラインがコマンドを処理する速度より高速なため、パイ
プラインのパフォーマンスの最大化が行われるようにバ
ブルを好ましいデータと置き換えることができる。

【００２２】追加の特徴として、コントローラはパイプ
ラインに関して非同期的に作動することができる。これ
によってタイミング関係が大幅に単純化される。事実、
パイプラインは(サイクルという点から見て)可変長を持
つと考えることができる。いくつかのオペレーションに
ついてはパイプラインが他のオペレーションよりも時間
的に短くなるものもある。コントローラは、たとえ制御
信号がずっと前に生成されても、データと制御信号との
時間整列を行うことが可能である。たとえコントローラ
が、或るデータがどのパイプラインにおいても特定の段
に達するのに何クロック・サイクルを要するかを予め認
知していない場合であっても、信号はそれらがデータに
よって要求されているときに段に到来するようにバッフ
ァされる。

【００２３】パイプライン、ミニブロックおよびスタン
プ図３は、レンダリング・エンジンの４つのレンダリング
・パイプラインをさらに詳細に図示し、パイプライン間
でのデータとレンダリング操作との分配方法も示す。各
パイプラインには、勾配推定器段３０１、類別器−補間
器段３０２、照明器段３０３、合成器段３０４が含まれ
る。

【００２４】ボクセルは、レンダリング用メモリ１６０
内にミニブロック３１０(各々２×２×２のボクセルか
ら成る小さな立方体の配列)として格納される。レンダ
リング中、コントローラ４００はメモリ・インターフェ
ースにミニブロックの流れを読み出させる。ミニブロッ
クは、クロック・サイクル当たり１ミニブロックの速度
でパイプラインに提示される。実際、ミニブロックはコ
ントローラ４００を介してパイプラインへ渡される。

【００２５】ミニブロックは、ボリューム・データ・セ
ットからｘｙｚの順序で読み出される。すなわち、ミニ
ブロックは、ｘ−方向にシーケンシャルに読み出されて
セクションの１列が満たされ、ｙ−方向に一列ずつ読み
出されて１スライスが満たされ、Ｚ方向に１スライスず
つ読み出されて１セクション全体がレンダーされる。各
ミニブロックは１×１×２の配列からなる４つのボクセ
ル３２０に分解される。すなわち、Ｚ方向整列された４
対のボクセル(Ａ、Ｂ、Ｃ、Ｄ)である。一対のボクセル
３２０が図３に図示のように各パイプラインへ送られ
る。

【００２６】各対のボクセルが勾配推定器段３０１の中
を通され、各ボクセルにおける勾配値が得られる。勾配
を得るために使用される中央差分フィルタの結果、出力
ボクセルと勾配とは各次元(方向)に入力値から１単位だ
けオフセットされる。このことはパイプライン間での小
量のデータ交換を必要とする。

【００２７】勾配推定器段から、ボクセルと勾配は類別
器−補間器３０２へ渡される。この段で、ボクセル・フ
ィールドは、勾配と共にＲＧＢα値に変換され、さら
に、レイに沿ったサンプル・ポイントにおける値に応じ
て補間される。補間器はまずＺ方向に補間を行い、次い
で、Ｙ方向とＸ方向に補間を行う。類別と補間ステップ
がいずれの順序でも生じ得る。類別器−補間器が、すべ
ての４つのパイプラインの間で共有される一対のスライ
ス・バッファ２５０、並びに、Ｚ補間に使用されるボク
セル・データを格納する非共有バッファとを有すること
に留意されたい。

【００２８】４つのパイプラインの４つの類別器−補間
器の出力は、スタンプと呼ばれるサンプル空間内の２×
２の配列のポイントにおけるＲＧＢα値と勾配値からな
る配列である。スタンプのポイントは、ボリュームを貫
通してキャストされているレイのうちの４本と、スライ
スとの交点に対応するＸＹ位置において、ボクセル・ス
ラブに平行な平面内に常に存在する。レイが、像面上の
ピクセルを貫通して通るように定義されるとき、これを
ＸＹ画像順と呼ぶことにする。その理由としてレイのｘ
座標とｙ座標が像空間のｘ座標とｙ座標と同じであると
いうことが挙げられる。通常の画像順では、従来技術で
公知のように、ボリューム内のｘｙ平面に対して平行な
平面上ではなく、像面に対して平行な平面上の、サンプ
ル空間内のポイントが選択される。

【００２９】ＲＧＢα値と勾配値のスタンプは次に４つ
の照明器３０３へ渡される。これらの値は反射率マップ
を用いる周知のフォン(Phong)照明に適用される。各パ
イプラインの照明器は、レンダリング中データ交換を行
わないという意味でその他のパイプラインの照明器から
独立している。これらのパイプラインはすべて同じクロ
ックに従って作動する。

【００３０】これらの勾配値は、レンダリング操作によ
って勾配値の出力が指定される場合を除いて照明器段で
使用される。この場合、パイプライン内の赤、緑、青の
カラー成分の代わりに上記３つの勾配成分が用いられ
る。

【００３１】各パイプラインの照明器段の出力値は照明
されるＲＧＢα値であり、このＲＧＢα値がサンプルポ
イントのカラー寄与を表す。ＲＧＢα値は合成器段３０
４へ渡される。この合成器はオンチップ・バッファの中
へレイのＲＧＢα値を蓄積する。あるセクションのレン
ダリングの最後に、４つの合成器段の出力が、一回に１
スタンプだけ読み出され、例えばピクセル値として、レ
ンダリング用メモリ１６０内に格納される。

【００３２】コントローラ−パイプライン・インターフ
ェース図４は、パイプライン３００のそれぞれの段３０１−３
０４と並列に接続されたコントローラ４００を図示す
る。図を明瞭にするために、コントローラとパイプライ
ンとの間の相互接続は抽象的レベルで図示されている。
実際の実現例には多数の並列相互接続ラインとさらの多
くの個々の相互接続ラインが含まれる(詳細の次のレベ
ルについては図９を参照)。

【００３３】レンダリング用メモリ１６０から得られる
ボクセル４０２などの生の入力データはコントローラ４
００の中を通って途中バス４０５を介してパイプライン
３００の中へ入る。段３０１−３０４はボクセル値をサ
ンプル値へ変換し、サンプル値をピクセル値４０３と組
み合わせる。これらのピクセルは、コントローラを介し
てレンダリング用メモリ１６０へ書き戻さる。

【００３４】従来技術とは対照的に、本レンダリング・
エンジンであるレンダリング・パイプライン３００は適
応性があり融通性がある。コントローラ４００はパイプ
ライン３００へ出力制御信号４０１を出す。出力制御信
号はキュー４０４を介して細いパイプラインへ転送され
る。これらは先入れ先出し(ＦＩＦＯ)キューである。こ
の出力制御信号は、パイプライン段３０１−３０４の作
動を制御するために使用される。入力制御信号４２０が
パイプライン段から受信される。コントローラがデータ
の送信を停止できるように、各々の対応するキュー４０
４がまさにいっぱいになる時点がこの入力制御信号によ
って示される。

【００３５】個々にあるいは複数のセットとして、出力
制御信号４０１にはタグが含まれる。このタグについて
以下さらに詳細に説明する。これらのタグは様々なタイ
プのデータ構造の初めと終りを示すものであり、セクシ
ョン、スライス、スラブ等のボリューム・データが組織
化されてこれらのタイプのデータ構造になる。これらの
タイプのデータ構造については以下さらに詳細に説明す
る。これらのタグは、スタック、タイル、スタンプなど
を含むコントローラ内部で処理されるデータの種別もマ
ークするものであり、このデータの種別についても以下
さらに詳細に説明する。

【００３６】キュー４０４内のこれらのタグの目的は、
パイプラインの様々な段の中のデータとの、出力制御信
号４０１の時間整列を行うことである。バッファ４１０
はパイプライン内での融通性を与える。図を明瞭にする
ために、バッファ４１０は段の間に示されているが、好
ましい実施の形態では、補間器のような段のいくつかに
は内部バッファが備えられている。次の段がデータを受
け入れる準備がまだできていないとき、これらのバッフ
ァはデータの格納場所を提供する。これらのバッファこ
そ、部分的にパイプラインに可変長すなわち弾性を与え
るものである。この望ましい実施の形態によって、段の
うちのいくつかの段(特に、類別器／補間器段と照明段
との間などのバッファがバブルの除去に役立たない段)
の間のバッファを取り除くことによりゲートの節減を行
うことができる。

【００３７】作動中、データの利用可能性、バス・ロー
ド、および、計算の複雑さから成る未知の力学に依存す
るが、様々な段によって異なるレートでデータ処理が行
われる。したがって、下流段がまだ混んでいる場合、上
流段は、バッファ４１０の中の１つに対してその出力の
処理と書込みとを続けることができる。次いで、下流段
が前のタスクを完了すると、下流段が必要とする入力デ
ータがすぐに利用可能となる。

【００３８】これらの段が、互いに関して、また、コン
トローラ４００に関して非同期的に作動するときでさ
え、これらのタグによって、データが常に互いに関して
同期することが保証される。合成器３０４内での早めの
レイ終了を示す入力制御ライン４３０のような追加の入
力制御ラインを使用して、コントローラ４００へパイプ
ライン状態情報を返送することが可能である。早めのレ
イ終了とは、ソフトウェア・レンダリング技術において
公知のオペレーションであり、このオペレーションによ
って、蓄積されたカラーが不透明になった後、レイをも
はや処理しなくなるため、さらなるサンプルはそれまで
の結果に影響を与えない。

【００３９】本発明によるコントローラを持ない従来技
術のレンダリング・パイプラインは、一般に、決まりき
った方法で作動し、すべての段は、固定したクロック・
サイクルに従って同時に順方向にデータの移動を行う。
従来技術のパイプラインは一般にコントローラからのコ
マンドをバッファしないため、パイプラインは決まりき
った方法で作動する。その結果、従来技術のパイプライ
ンは、どこかで動かなくなったとき、取り除くことがで
きない“バブル”をパイプラインの中へ注入することに
なる。バブルは、パフォーマンスを低下させる無用のサ
イクルである。

【００４０】ダイナミックな処理状態に応答する本設計
の融通性はパイプの中からバブルを“絞り出す”能力を
持っている。それは、これら様々な段が、本質的に、他
の段が行っていることに無関係に、異なるレートでデー
タ処理を行うという理由による。この結果、レンダリン
グ・エンジンのパフォーマンスが大幅に向上することに
なる。さらに、コントローラは、ボクセル・データがパ
イプラインに入る前および入った後にボリュームを刈り
込み、レンダリング処理の１０倍もの大幅なスピードア
ップを図ることが可能となる。例えば、毎秒５〜５０フ
レーム進むことにより、リアルタイムのボリューム・レ
ンダリングの実現が可能となる。

【００４１】用語の定義本セクションは、本発明の適応型パイプラインとコント
ローラとによって処理される様々なデータ構造の記述に
用いられる基本的用語を紹介する。これらはタグによっ
て同期するデータ構造である。

【００４２】セクション：セクションとは、例えば２４
×２４ピクセルまでを含む像面上の矩形領域である。あ
るいは、セクションとは、１組のレイおよびそれらのレ
イに沿ったすべてのサンプル・ポイントと考えることが
できる。レンダリング・エンジン３００では、各セクシ
ョンはＸＹボクセル平面上に平行四辺形を形成する(下
記図６参照)。好ましい実施の形態では、セクション・
サイズは各方向に４の逓倍である。

【００４３】スライス：スライスとは、セクションから
得られる１組のサンプルであり、この組のサンプルはす
べてが同じサブボクセルＺアドレスを持つ。１つのスラ
イスは像面上へ投影されるとき矩形を形成する。

【００４４】スラブ：スラブとはボリューム・データ・
セット内のミニブロックからなる矩形である。１つのス
ラブはボクセルの２つの平面を含み、この平面は互いに
対して整列し、かつ、ミニブロックの境界に対して整列
している。ミニブロックからなるＮ×Ｍのスラブには２
×２Ｎ×２Ｍのボクセルが含まれる。

【００４５】スタック：スタックとは、１つのグループ
としてコントローラ４００により処理される１グループ
の隣接サンプル・スライスまたはミニブロック・スラブ
である。コントローラは、フラクショナル・ボクセル座
標の最低値と最大値と、デプス値(これはボクセルＺ座
標とは別個のものである)と、スタックの切断面の値と
を決定して、スタックの廃棄が可能かどうかの検査を行
うようにすることができる。コントローラはセクション
部分にわたって迅速にスキップできるように倍数のスタ
ックを検査する。

【００４６】タイル：タイルとは、１つのグループとし
てコントローラによって検査されるスライスまたはスラ
ブの１部分である。好ましい実施の形態では、１スライ
スまたはスラブ当たり１６枚のタイルが存在する。各タ
イルはＸ方向とＹ方向に同数のサンプルを含み、タイル
のサイズはセクションのサイズによって決められる。タ
イルの境界は必ずしもスタンプの境界と整列するとはか
ぎらない。なぜなら、１方向あるいは２方向でタイル・
サイズが奇数となる可能性があるからである。例えば、
１２×２０のセクションの場合、各タイルは３×５とな
る。

【００４７】スタックとタイルコントローラはタイルとスタックとを用いて大きなグル
ープのサンプルとボクセルを検査し、処理を行う。例え
ば、コントローラは、タイルまたはスタック内のサンプ
ルまたはボクセルのいずれも最終画像に寄与しないこと
を決定することができる。この場合、コントローラはそ
のタイルまたはスタック上でのさらなる処理をスキップ
し、このスキップによってコントローラとレンダリング
・パイプラインの双方がさらに効率的になる。例えば、
コントローラによってスタックがスキップされた場合、
レンダリング・エンジン３００はそのスタック内のボク
セルまたはサンプルのいずれの処理も行わない。

【００４８】図５の(ａ)は、最上部スライス５０３の下
に在るレイ整列セクション内のサンプル・スライス５０
２の３つのスタック５０１を図示し、図５の(ｂ)は、最
上部スラブ５０６の下に在るミニブロック・スラブ５０
５からなる３つのスタック５０４を図示する。スライス
またはスラブはコントローラ４００によって個々に検査
される。点線は各スタックのＸ境界とＺ境界とを例示す
る。スタックが同じサイズである必要はないことに留意
されたい。コントローラは変動するサイズのスタックを
検査することができる。好ましい実施の形態では、スタ
ック境界は２のべき乗だけ現在のスライスまたはスタッ
クからオフセットされる。これによってコントローラ
が、乗算の代わりにビット・シフトを利用して、以下に
説明するように、倍数のスライスまたはスタックをスキ
ップするのに必要な増分値を生成することが可能にな
る。

【００４９】スライスとスラブを４×４の配列のタイル
に分割することにより、コントローラとレンダリング・
パイプラインがセクション部分をスキップすることが可
能になる。特に、タイル全体がクリップ領域の外側にあ
る場合、そのタイルをさらに処理する必要はない。サン
プル・スライス・タイルには各レイからの単一サンプル
が含まれる。スラブ・タイルには、そのスラブから得ら
れるボクセルを用いる各レイのセグメントが含まれる。

【００５０】図６の(ａ)、(ｂ)は、１６×１６のサンプ
ル・スライス用として、像面６０１上へ投影されるタイ
ルと、ボクセル平面６０２上へ投影されるタイルとをそ
れぞれを示す。各タイルには４つのスタンプ６０４が含
まれる。図６の(ａ)は、像面上でセクションとタイルが
直交矩形であることを示す。各タイルには同数のサンプ
ルからなる矩形の集合が含まれる。単一のスタンプがタ
イルの境界を横切る場合もある。図６の(ｂ)は、ボクセ
ル平面上でタイルが平行四辺形を形成することを示す。
この図では、平行四辺形は直角を有しているが、直角を
有する必要はない。

【００５１】タイルとスタック範囲コントローラによって、各スタックとタイル用の１組の
範囲が決定される。これらの範囲によって、スタックま
たはタイルが、ＸＹＺ位置やデプスのようなパラメータ
用、あるいは、様々なクリッピング平面用として設定可
能な最小値と最大値とが指定される。

【００５２】サンプル・スライス・タイルは１サンプル
厚である。これに起因して、タイルの最小境界および最
大境界は、タイル内にあるそのスライス内のサンプル・
ポイントの最少境界／最大境界である。ボクセル・スラ
ブ境界は、それらのボクセルを読み出す必要があるサン
プルのすべてに基づいて計算される。したがって、これ
らの境界はレイの長さに沿ったサンプルに対して決定す
る必要がある。スラブ・タイルの最小境界と最大境界
は、スラブ内のボクセルを使用するサンプルの総セット
を反映する必要がある。同様に、スタックにはレイの長
さに沿ったサンプルが含まれ、したがって、各レイに沿
ったサンプルの範囲を考慮する最小境界および最大境界
がスタックによって要求される。視角によってこの問題
はさらに複雑になる。なぜなら、レイ分離が、タイルま
たはスタックを形成するレイ・セグメントの前面と後面
とで異なる場合があるからである。

【００５３】図７の(ａ)、(ｂ)および図８は、様々な角
度でレイ７０２によって交差されるボクセル・スライス
７０１の側面図を図示する。これらの図は、スラブ・タ
イルとスタックの最少／最大境界を見つける方法を定義
するものである。各々の小さな正方形７０３はボクセル
位置を表す。ミニブロック・スラブには、実線によって
リンクされる２つの中央ボクセル・スライス７０５が含
まれる。ミニブロック・スラブの上方または下方に在る
２つのボクセル内のサンプルは、中央差分勾配を計算す
るために、スラブからのボクセルを必要とする。したが
って、スラブから離れる２つのボクセル・スライスまで
のサンプルは、影のついたボックスによって指定される
ような各タイルの中に含まれる。

【００５４】各タイルとスタックはタイルまたはスタッ
クの前面と後面に対して個々の最少／最大範囲を有す
る。水平の点線７０７−７０８はこれらの範囲を表す。
上の点線７０７は前面のサブボクセルＸの最少／最大範
囲であり、下の点線７０８は後面の最少／最大範囲であ
る。各面に対するサブボクセルＺの最少／最大は点線に
よってマークされたボクセル・スライスである。これら
の線は水平である。なぜなら、前述したように好ましい
実施の形態はＸＹ画像順を実現するからである。この同
じ技術を全部の画像順に対して適用することができる。
その場合、点線は像面に対して平行になる。

【００５５】コントローラは、タイルの最少範囲Ｘと最
大範囲Ｙに対して、または、スタックの最少値Ｘと最大
値ＹおよびＺアドレスに対して、範囲フロア(最少範囲
−１)からシーリング(最大範囲＋１)の範囲でボクセル
を読み込む。これは勾配の決定に必要である。サンプル
位置における勾配の計算には、サンプルの周りの２×２
×２領域内に在る各ボクセルにおける勾配計算を必要と
する。次いで、この計算には、その２×２×２領域に隣
接するボクセルの読込みを必要とする。好ましい実施の
形態では中央差分勾配が計算されるが、同じ技術によっ
て３×３×３のSobelフィルタのようなさらに複雑な勾
配関数の計算も可能である。

【００５６】処理対象ボクセル数の削減１つの利点として、本発明のコントローラ４００によっ
て、どのサンプルとボクセルの処理が必要であるかの選
択、および、どのサンプルとボクセルの廃棄が可能であ
るかの選択が行われる。以下のセクションでは、処理の
必要があるボクセルとサンプル数を減らすために、本発
明によるレンダリング・エンジンによって使用されるマ
スク・コードとその他のメカニズムとについて説明す
る。

【００５７】従来技術では、ハードウェア・パイプライ
ンが一般にボリューム・データ・セット内のすべてのサ
ンプルとボクセルとを処理して、最終画像を生成するよ
うになっている。本レンダリング・エンジンでは、最終
画像に寄与できるサンプルのみの処理が試みられる。最
終画像に寄与しないサンプルとボクセルは廃棄される。

【００５８】いくつかの技術を利用して、処理を必要と
するボクセルとサンプル数の最少化と、廃棄対象のボク
セルとサンプル数の最大化が行われる。早めのレイ終了
によって、レイが完全に飽和したとき、あるいはレイが
ほとんど完全に飽和したとき、レイに沿ったボクセルは
廃棄される。すなわち、処理時に、レイに沿った任意の
追加ボクセルは、対応するピクセルの最終的外観を変化
させないか、あるいは、その最終的外観の変化は最小限
にとどまる。クリッピングや空の空間の検出のような他
の技術によって、視野の外側に在るボクセルの廃棄が可
能となる。コントローラはマスク・コードを用いてデー
タを廃棄する。

【００５９】マスク・コードマスク・コードとは、レイ上のサンプル位置がクリップ
領域を関連づける方法を指定する２ビットコードであ
る。クリップ領域を用いてレンダー対象のボリューム・
データ・セット部分が定義される。クリップ領域の外側
のボリューム部分はレンダーされない。１つの利点とし
て、このような領域内のボクセルとサンプルは、レンダ
リング・エンジンによって処理されない。クリップ領域
はクリッピング平面によって定義される。

【００６０】サンプルはクリップ領域内に存在する場合
有効である。クリップ内に存在しない場合には、サンプ
ルは、レイ方向に対して凸型クリップ領域の前または後
にある。非凸型クリップ領域の場合には、サンプルが凸
型クリップ領域の前後のいずれに在るかを特定すること
ができない場合がある。その場合、サンプルは非凸型ク
リップ領域の外側にある。詳細については以下を参照さ
れたい。クリップ領域の前、後、あるいは外側に在るサ
ンプルは無効である。

【００６１】コントローラ４００は各クロック・サイク
ルについて８つの個々のサンプル位置、すなわち、１ク
ロック・サイクル当たり４対の最少／最大位置のいずれ
かを生成することができる。これらの各位置は様々なク
リップ領域の各々を表すそれ自身のマスク・コードを持
っている。

【００６２】マスク・コード解釈表Ａは各２ビットマスク・コードによって表される４つ
のケースを図示する。“有効”は、クリップ領域の範囲
内に存在し、したがって処理すべきサンプル位置を示
す。その他のケースは無効なサンプル位置を示し、これ
らのサンプル位置は、パイプラインに入る前か、あるい
は、合成段３０４に先行するパイプライン内のある時点
のいずれかの時点で廃棄することができる。１つの利点
として、パイプラインからボクセルを廃棄することによ
りパフォーマンスが改善される。マスク・コードに影響
を与え、ボクセルの廃棄を引き起こす可能性がある、早
めのレイ終了のような他の条件が存在することに留意さ
れたい。

【００６３】

【００６４】“前”および“後”はレイ上の無効サンプ
ル位置がそのレイがクリップ領域に入る前に生じるか、
あるいは、そのレイがクリップ領域を出た後に生じるか
を指定するものである。凸型クリップ領域については常
にこの決定を行うことができる。トリム平面は、各方向
に最少／最大境界に対してクリップを行い、それによっ
て凸型クリップ領域を生成する。切断面は、一対の平行
する平面の外側あるいは一対の平行平面の間のいずれか
に在るサンプルをクリップするので、切断面は前者の場
合凸型クリップ領域を生成することになる。“外側”コ
ードは、クリップ領域の前あるいは後のいずれに在るか
を決定できない無効サンプルを指定する。これは、平行
切断面の間の領域をクリップアウトするとき切断面と共
に生じる。

【００６５】従属マスク・コードの合成スライスとスラブ状態マシン(以下説明する)は、時とし
て個々の前面と後面に対する、最小および最大サブボク
セル・アドレスによって表される範囲の検査を行う。こ
の場合、２〜４個の２ビットマスク・コードを組み合わ
せることができる。タイルまたはスタックの最上部と最
下部の双方の最少値／最大値の対を表すためには、スタ
ック用として、また、ボクセル・タイル用として４個の
２ビットマスクが必要である。サンプル・タイルは、１
スライスの厚さしかないので、単一の最少値／最大値の
対しか必要としない。２つのマスク・コードが同じクリ
ップ領域の異なる部分を表すので、これらの最少値／最
大値の対は従属マスク・コードと呼ばれる。

【００６６】表Ｂは従属マスク・コードの組合せ方法を
示す。双方のマスク・コードが同じ値を持っている場
合、結果は同じである。一方のマスク・コードが有効な
場合、その組合せも有効である。その理由として２つの
マスク・コードが最少位置と最大位置を表すということ
が挙げられる：このマスク・コードのうちの一方がクリ
ップ領域内に存在する場合、少なくとも部分的にそれら
の組合せもまたクリップ領域の範囲内に存在するからで
ある。一方のマスク・コードがBeforeであり、他方のマ
スク・コードがAfterである場合、その組み合わされた
結果もまた有効である。なぜならこれは、クリップ領域
の両端にわたって拡がるタイルまたはスタックのケース
を表すからである。括弧内の組合せはこの好ましい実施
の形態の中では生じない。なぜなら、凸型クリップ領域
は外側を使用しないからであり、また、非凸型クリップ
領域は前と後(Before and After)とを使用しないからで
ある。

【００６７】

【００６８】独立マスク対の組合せ下記の表Ｃは、独立
したクリッピング条件のための２個の２ビットマスク・
コード(独立したクリップ検査を表すマスク・コード)の
組合せ方法を示す。例えば、マスク・コードのうちの一
方が切断面クリッピングを示すことができ、別のマスク
・コードがＸ、Ｙ、Ｚトリム平面の中の１つを示すこと
ができる。

【００６９】クリッピング条件のすべてを満すときにの
み１つのサンプルが有効となるので、独立したクリッピ
ング条件の双方が有効なときにのみ、組み合わされた結
果は有効となる。さらに、もしクリッピング条件のいず
れかがAfterである場合、結果はAfterであり、これはこ
のサンプル位置、タイルあるいはスタックがクリップ領
域の中の１つを通過していることを意味する。したがっ
てその単数または複数のレイに沿った処理は完成する。

【００７０】

【００７１】切断面、トリム平面、クロップ・マスク、
および、デプス・マスクは互いにまったく独立している
ことに留意されたい。

【００７２】以下のセクションで、レンダリング・エン
ジンによってデプス・クリッピングを行う方法について
説明する。これは処理対象のボクセル数を減らす別の技
術である。

【００７３】デプス・クリッピングデプス・バッファに対するクリッピングはその他のクリ
ップ検査とは多少異なる。従来技術では、デプス検査
は、レイ／ピクセル当たり単一のデプス値に対するサン
プルのデプス比較によって一般に行われ、サンプルのク
リップを行うか否かの判定を行うために８つの異なる不
等式(＜、＞、＝、≦、≧、≠、常にパス(always)、絶
対にパスしない(never))による比較の１つが選択され
る。本発明のコントローラ４００は公知のものとは異な
る２つの相違点を持っている。

【００７４】第１に、コントローラ４００は２回のデプ
ス検査を実行し、選択可能なブール演算(ＡＮＤ、Ｏ
Ｒ、ＸＯＲ)によってこの２回の検査結果を組み合わせ
る。２回の比較検査の補集合(＜の補集合は≧など)をつ
くることができ、また、これらの補集合を常にパス、ま
たは、常にパスしないと置き換えることができるので、
ド・モルガンの法則を用いて２つの検査の１６通りのす
べてのブールの組合せを生成することができる。

【００７５】第２に、コントローラ４００はクリッピン
グ操作のほんの一部を実行するにすぎない。好ましい実
施の形態では、コントローラ４００はスタック、タイ
ル、サンプルをセクション内の２つのデプス・バッファ
の最小値および最大値と比較する。サンプル当たりのデ
プス検査が合成器３０４内で行われる。その理由は合成
器によってデプス・バッファの修正オペレーションがサ
ポートされているからである。ある代替の実施の形態で
は、修正されたデプス値が必要に応じて合成器からコン
トローラへ伝達される場合、コントローラ内でデプス検
査のすべてが行われる。

【００７６】デプス検査では他のクリップ領域と異なる
処理が要求される。その他のクリップ領域検査では、各
サンプルに対して各々２つの生じ得る結果、すなわちサ
ンプルがクリップ境界の一方の側にあるか、ないかのい
ずれかの結果しか得られない。サンプルが正確にクリッ
プ境界上に存在する可能性があるため、デプス検査では
３通りの生じ得る結果が得られる。これが、１デプス・
バッファ当たり２＃３＝８通りの生じ得る比較検査(絶
対にパスしない(never)、＜、＝、≦、＞、≧、≠、常
にパス(always))が存在する理由である。

【００７７】レンダリング・システムでは、DepthFirst
とDepthLastと呼ばれる２つのデプス・バッファが使用
される。これらの名称によって、それらの典型的用途
(ボリュームからのレンダー対象領域の初めと終りを指
定)が示唆される。しかし、DepthFirstがDepthLastに優
先するという要件は存在しない。したがって、実際に
は、単一の位置における２つのデプス・バッファに対す
る比較を行った場合、サンプル・デプスが２つのデプス
・バッファの各々未満または以上であるかどうかに依存
して、あるいは、そのサンプルが、１つあるいは２つの
バッファのデプス・バッファのクリップ境界に存在する
かしないかに応じて、単一のサンプルの検査結果につい
て６通りの異なる組合せが存在することになる。

【００７８】好ましい実施の形態では、コントローラ４
００は、＝または≠比較を用いるデプス検査用のボクセ
ルまたはサンプルを廃棄しない。代わりに、コントロー
ラは、これらの比較のいずれかの可能性である場合、ス
タックとタイルを有効なものとして常に報告し、合成器
３０４だけがすべての廃棄を行う必要がある。また、コ
ントローラは、比較器のキャリービットを用いることに
より、比較Ａ≦ＢおよびＡ＞ＢをＡ＜Ｂ＋１とＡ≧Ｂ＋
１比較に変換する。このようにして、コントローラ・ク
リップ論理回路は１デプス・バッファ当たりの２つの比
較結果(DepthSample＜DepthBufferおよびDepthSample≧
DepthBuffer)を考えるだけで十分となる。

【００７９】タイルとスタックはある範囲のサンプル・
デプスを持ち、また、デプス・バッファ自身もある範囲
の値を持っているので、各タイルまたはスタックは実際
には、４つのデプス比較のどれがそのタイルまたはスタ
ック内で生じ得るかを示す４ビットの領域番号を必要と
する。単一サンプル位置を各デプス・バッファから得ら
れる１つの値と比較するとき、値１はDepthSample＜双
方のデプス・バッファを示し、値２は、DepthLast≦Dep
thSample＜DepthFirstを示し、値４はDepthFirst≦Dept
hSample＜DepthLastを示し、値８はDepthSample≧双方
を示す。

【００８０】デプス検査の領域番号への組合せコントローラ４００は、各サンプル位置の個々のデプス
検査を２つのデプス範囲の最少値と最大値の双方と組み
合わせることにより４ビットの領域番号を生成する。図
１６の表Ｄは、デプス検査結果を組み合わせて領域番号
に変える方法を示す。ヌル範囲(００００)をカウントに
入れて１０個の有効な(legal)領域番号が存在する。例
えば、１１１０のようなコードは、サンプル位置がDept
hFirst未満またはDepthLast未満となり得ることを表明
しているので無効(illegal)である。なぜならサンプル
位置が同時にDepthFirstとDepthLast双方未満となるこ
とは決してあり得ないからである。したがって、このよ
うなコードは生成されないし、図１６の表Ｄの中に現れ
ることはない。この表の値を生成する方法は、Ｒ＝(Ａ
OR Ｂ)を計算し、Ｒ＝＝ｘ１１ｘまたは１ｘｘ１であれ
ば、Ｒ＝１１１１を出力し、そうでない場合にはＲを出
力させよというものである。

【００８１】コントローラはまた領域番号の第２の集合
も必要とし、この第２の集合は、Afterマスク・コード
を生成するためにコントローラによって使用される。Af
terマスク・コードは、古い領域番号と１０１０とを組
み合わせる新しい領域番号を生成することにより領域番
号から生成される。この生成によって領域番号はDepthF
irstからDepthLastまでの範囲外へ拡がる。After領域番
号を用いてサンプル・スタックまたはタイルがいつデプ
ス・クリップ領域の後に存在するかを決定して、処理の
終了が可能となるようにすることができる。

【００８２】合成器内で行われるデプス検査も、デプス
検査の４通りの組合せのうちのいずれが有効なサンプル
を生成するかを示すために４ビットコードを有する。図
１７に示す表Ｅは、生じ得るデプス検査から結果として
得られるコード及びこれらのコードの組み合わせ方法を
示す。デプス比較が＝または≠である場合、あるいは、
コードが“alwaysPass”コードと組み合わされる場合、
デプス・クリッピングの２ビットマスク・コードは有効
である。上記条件とは異なる場合、領域番号と図１７の
表Ｅから得られるコードとの論理和(ＡＮＤ)がノンゼロ
であれば、マスク・コードは有効である。

【００８３】マスク・コードが無効な場合、そのマスク
・コードがAfterであるか、Outsideであるかを区別する
必要がある。この区別を決定するために、１０００のデ
プス比較結果を領域番号と組み合わせ、次いで、図１７
の表Ｅから得られる４ビットコードとその結果との論理
和(ＡＮＤ)をとる。この論理和の結果がゼロの場合、マ
スク・コードはAfterであり、ゼロでない場合、マスク
・コードはOutsideである。この判定検査は機能する。
なぜなら、現在の位置から可能な最大のデプス値までの
サンプル・デプスがデプス検査に失敗するかどうかがこ
の判定検査によって検査されるからである。

【００８４】コントローラ図９は、本発明によるコントローラ４００のトップ・レ
ベルのブロック図である。コントローラには、マスタ状
態マシン(StateSeq)１０００と、実行ユニットCoordEU
９０２、CutEU９０３、DepthEu９０４と、論理素子Bott
omSeq９２１、TopSeq９２２、ZinterpSeq９２３、Depth
Seq９２４、MaskSeq９２５とが含まれる。実行ユニット
(ＥＵ)(９０２−９０４)については後程説明する。

【００８５】BottomSeq９２１は、合成器段３０４とレ
ンダリング用メモリ１６０との間で画像とデプス・デー
タの転送を行う読出し書込み要求を出す。BottomSeq９
２１は、プログラムされた範囲に基づいて境界外アドレ
スの読出し検査も行い、この境界外アドレスを所定の定
数値と置き換える。

【００８６】DepthSeq９２４は、合成器段３０４によっ
て用いられるデプス・バッファ用デプス値を蓄積する。
DepthSeqは各セクションの最小および最大デプス値の決
定も行う。代替実施の形態は１セクション内の１６枚の
個々のタイルの各々の最少／最大デプス値を生成するこ
とができる。

【００８７】MaskSeq９２５は、コントローラＥＵ９０
２−９０４からMaskSeq９２５へ渡されたデータに基づ
いてマスク・コードを計算する。その他の２つの論理素
子(TopSeq９２２とZinterpSeq９２３)については以下説
明する。

【００８８】コントローラ４００は以下の大きなデータ
・バスを用いる：BottomSeq９２１からメモリ・インタ
ーフェース２１０へのバス９４１、TopSeq９２２からメ
モリ・インターフェース２１０へのバス９４２、MaskSe
q９２５と補間３０２および合成器３０４段との間のバ
ス９４３と、ZinterpSeq９２３から補間段３０２のＺ−
補間器へのバス９４４と、DepthSeq９２４から合成器段
３０４へのバス９４５と、合成器段からMaskSeq９２５
(図４参照)へのバス４３０と、メモリ・インターフェー
ス１６０からDepthSeq９２４へのバス９４６

【００８９】以下の説明で、コントローラが、スタッ
ク、スラブ、スライスなどのような大きなデータ構造を
様々なコントローラ構成要素へ“渡す”あるいは“送
る”と述べられている場合、それは調整アドレスが配信
されることを意味すると理解すべきである。しかし、ボ
クセルとピクセルとは、図４に図示のようにバス４０５
を介してコントローラ経由でパイプラインに出入りす
る。

【００９０】各クロック・サイクル中、StateSeq１００
０は実行ユニットCoordEU９０２、CutEU９０３、DepthE
u９０４の各々に対して１つの命令を出す。これらの実
行ユニットは構造上は同一のものであるが、ＳＩＭＤタ
イプのアーキテクチャを用いて(様々なビット幅を持つ)
様々なデータに対して並列に作用する。マスタ状態マシ
ン１０００は実行ユニット９０２−９０４上で処理を実
行する倍数の個々のスレッドの間での仲裁も行う。これ
らのスレッドは、以下に説明するように、異なる詳細レ
ベルでボリューム・データ・セットの中を１ステップず
つ処理する４つのコルーチンとして実現される。

【００９１】３つの実行ユニットCoordEU９０２、CutEU
９０３、DepthEu９０４は、マスタ状態マシン１０００
によって出される同じ命令を用いて、並行して８つのサ
ンプル位置で各データを決定する。スレッドのすべて
は、同じセットのハードウェア論理素子に対して順に処
理を実行する。このことによって多量の包括的なルーテ
ィングが除去されるが、この除去を行わない場合には、
１つの状態マシンから次の状態マシンへデータを渡すた
めに多量のグローバルなルーティングが必要となる。こ
のグローバルなルーティングの代わりに、ほとんどのデ
ータは、以下に説明するように、実行ユニット内のレジ
スタ・ファイル１５０１を通じて１つのスレッドから次
のスレッドへ渡される。

【００９２】マスタ状態マシン図１０はさらに詳細にマスタ状態マシン(StateSeq)１０
００を図示する。StateSeqには、４つのレイ・キャステ
ィング・スレッド状態マシン(StampState１００１、Sli
ceState１００３、SlabState１００２、SectState１０
０４)が含まれる。マルチプレクサ１０１０とマスタ状
態アービタ１０４０とを用いて、マスタ状態マシンはこ
れらのスレッドの中の１つのスケジューリングを行っ
て、実行ユニット(ＥＵ９０２−９０４)でクロック・サ
イクル毎に処理を実行する。このスケジュールされた状
態マシンは処理の実行準備ができている最高優先順位を
有する状態マシーンである。準備ができるためには、状
態マシーンは処理対象データと、結果を報告するため
の、状態マシーンの出力バッファ内に空間とを持つ必要
がある。

【００９３】状態マシーン１００１−１００４に対して
優先順位を割り当てる方法は実際の実現装置に対応して
決めることができる。例えば、処理対象のデータ量に基
づいて優先させる必要がある場合には、StampState１０
０１は最も高い優先順位を持つようにすることが望まし
い。しかし、その目標が、最長の待ち時間を持つ状態マ
シーンをスキップすることである場合、SlabStateを優
先させることが望ましい。この望ましい実現例ではSlab
Stateに最も高い優先順位が与えられる。

【００９４】ループ・カウンタ１０２０は、個々のセク
ション、セクション内のスラブ／スライス、あるいはス
ライス内のスタンプを通じて１ステップ毎の処理の制御
を行う。ループ・カウンタはまたセクション内のレイ位
置の決定も行う。命令生成器１０３０は、クロック・サ
イクル当たり１命令の割合で現在の状態を命令に変換す
る。この命令は、実行ユニット９０２−９０４の各々に
対して発せられる。

【００９５】以下さらに説明するように図１１は、これ
ら４つの状態マシン１００１−１００４の相互関係と、
これら４つの状態マシンの各々がデータを送る送り先で
あるその他のコントローラ論理素子とバス・インターフ
ェースを例示する。StampState１００１とSectState１
００４の双方は、ＸおよびＹ方向の２次元配列の中を１
ステップずつ処理するのに対して、SliceState１００２
とSlabState１００３とはＺ次元の１次元配列の中を１
ステップずつ処理する。

【００９６】本発明によるコントローラ４００は、レン
ダリング・エンジンがデータを使うことができるよりも
さらに高いレートでデータの生成が可能であることに留
意されたい。このことは意図的なものである。それによ
って、“バブル”がパイプラインの中に現れるとき、特
別のデータを用いてバブルを“絞り”出すことができる
からである。

【００９７】スタンプ状態マシン StampState１００１はサンプル・スライス内のサンプル
のスタンプを処理する。単一のクロック・サイクルで、
StampState１００１はパイプライン当たり２つのサンプ
ルの生成が可能である。すなわち４つのパイプラインに
わたるサンプルの整列した２×２の２つのスタンプの生
成が可能である。StampStateはＸＹ補間キューに対して
サンプルを出す。ＸＹ補間キューが満たされていなく
て、かつ、SliceStateがサンプル・スライスを発見した
とき、StampStateは処理を実行することができる。

【００９８】StampState１００１はまたスタンプの動き
の制御も行う(図１３の(ａ)、(ｂ)参照)。StampState
は、１クロック当たり２つのスタンプを生成し、この２
つのスタンプは図１３に図示のようにセクションを横切
って蛇行パターンで移動する。スタンプ状態マシン１０
０１は、バス９４３を介して補間段３０２と合成器へス
タンプ・データを渡す。

【００９９】スライス状態マシン SliceState１００３はセクション内のサンプル・スライ
スを処理する。SliceStateは各サンプル・スライスを検
査してスライスの廃棄が可能かどうかを決定する。廃棄
が可能でない場合、SliceStateはStampState１００１と
ZinterpSeq９２３とへスライスを渡す。以下に説明する
ように、スタック内のスライスのすべてを廃棄する場
合、SliceStateはスライスのスタックをスキップするこ
とができる。

【０１００】SliceState１００２は、スライスを完全に
は廃棄することができない場合はいつでも、ZinterpSeq
９２３用のスライスを決定する。SliceStateはすべての
スライス・スタックとタイルのＸＹ境界も決定する。そ
の際、どれが廃棄対象のタイルとスタックであるかを示
すマスク・コードが付けられる。

【０１０１】スライス状態マシン１００２はスタンプ状
態マシン１００１へデータを渡す。スライス状態マシン
１００２はまたZinterpSeq９２３へサンプル・スライス
・データを渡す。ZinterpSeq９２３は補間段３０２用の
Ｚ補間データを生成する。

【０１０２】SliceStateが処理対象サンプル・スライス
を見つける度に、ZinterpSeq９２３はCoordEU論理素子
９０２からタイル境界を受け取る。ZinterpSeq９２３は
各ＸＹボクセル位置を検査し、ボクセルが、廃棄されな
かったタイル内に存在するかどうかを決定し、対応する
マスクの有効ビットを適宜設定する。この検査と設定に
よって、ZinterpSeqが補間の必要のないボクセルの廃棄
を行うことが可能となる。有効ボクセルに対して、Zint
erpSeqはマスク・ビットと共に補間段３０２へＺ補間デ
ータを送る。

【０１０３】SliceStateは、ZinterpSeq入力キューが満
たされていないこと、StampState１００１が、それが発
見した最も最近のスライスの処理を開始していること、
SectState１００４が処理対象のセクションを発見して
いること、という３つのイベントが真であるとき、処理
を実行することができる。さらに、現在のセクションに
ついてSlabState１００３を処理しなければならない。
あるいは、SlabState１００３はSliceState１００２の
前方に存在しなければならない。この結果、StampState
とZinterpEUとが最も最近のスライスを処理している
間、SliceStateは無効スライスのスキップが可能とな
り、StampStateは、別の有効スライスの処理の準備がで
きる時までに、それを見つけることができるようにな
る。

【０１０４】スラブ状態マシン SlabState１００３はセクション内のミニブロック・ス
ラブを処理する。SlabStateは各スラブを検査してスラ
ブの廃棄が可能かどうかを決定する。スラブの廃棄が可
能でない場合、SlabStateは図９のTopSeq９２２へスラ
ブを渡す。TopSeqは、バス９４２を介してメモリ・イン
ターフェース２１０へボクセル読出し要求を出す。TopS
eqはまた図３の補間段３０２のスラブ・インターフェー
スへスラブ・アドレスを渡す。スラブのすべてが廃棄さ
れた場合、SlabStateはスラブのスタックをスキップす
ることもできる。

【０１０５】SlabState１００３はバス９４３を介して
補間段３０２とTopSeq９２２とへスラブ・アドレス・デ
ータを渡し、TopSeq９２２はレンダリング・パイプライ
ン３００に入るボクセルを読み取る。TopSeq９２２は、
SlabState１００３が処理対象ミニブロック・スラブを
見つける度に、CoordEU９０２からタイル境界を受け取
る。

【０１０６】次いで、TopSeq９２２は、クロック・サイ
クル当たり２つのミニブロック読出し要求をメモリ・イ
ンターフェース２１０へ渡し、さらに、ＸＹアドレスと
関連情報とを勾配推定器段３０１用入力キューの中へ入
れる。TopSeqはまた、ミニブロック読込み命令とＸＹア
ドレスとが出されたかどうかを制御するマスク・ビット
も生成する。

【０１０７】SlabStateは、TopSeqとスラブ入力キュー
とが満たされていなくて、かつ、SectStateが処理対象
セクションを発見した場合、処理を実行することができ
る。この結果、SlabStateは、最も最近のスラブを処理
しながら、無効スラブをスキップすることができ、それ
によってTopSeqが別の有効スラブを処理する準備ができ
る時までにそれを発見することができるようになる。ま
た、SlabStateは一般にSliceStateよりずっと前に処理
を実行する。これは、補間器３０２が起動できる前に満
たす必要があるバッファが勾配推定器３０１内に存在す
るからである。これは、コントローラが融通性を与える
別の方法である。すなわち、レンダリング・パイプライ
ン３００内でいつマシンのデータが必要とされるかに基
づいて様々な状態マシンが処理を実行する。

【０１０８】セクション状態マシン SectState１００４はセクション処理を行う。セクショ
ンはサンプル空間内に在る矩形であるが、ボクセル空間
では平行四辺形である。SectStateは、各セクションを
検査して、セクションが視野円錐台(view frustum)と交
差するかどうかを調べる。セクションが交差する場合、
SectStateはBottomSeq９２１へセクションを渡す。Bott
emSeqは合成器段３０４のデプス・バッファを初期化
し、ついで、SlabState１００３とSliceState１００２
へもセクションを渡す。レンダリングが開始され、Bott
omSeqキューが満たされていず、かつ、SlabStateとSlic
eStateとが、発見された最も最近のセクション処理を開
始している場合、SectStateは処理を実行することがで
きる。

【０１０９】セクション状態マシン１００４は、スライ
ス状態マシン１００２とスラブ状態マシン１００３とへ
データを渡す。さらに、セクション状態マシンはBottom
Seq９２１へセクション・データを渡し、BottomSeq９２
１によって、合成器３０４のバッファの読出しと書込み
とが各セクションについて行われる。

【０１１０】コマンドと命令マスタ状態マシン１０００は、４つの状態マシン１００
１−１００４によって処理される状態に基づいて命令と
コマンドを出すことにより、コントローラ４００の操作
を行う。コマンドはバス用論理回路２２０からデータを
取得し、コントローラの内部にレジスタをロードする。
命令によって、コントローラの実行ユニットは、それら
の関連するレジスタ・ファイル内の値に対して算術演算
を実行し、他のコントローラ・エレメントへその算術演
算の結果を送信する。命令の中には“タグ”が含まれ
る。タグは、実行ユニットによって生成されたデータを
解釈するためにその他の論理素子９２１−９２４によっ
て使用される。タグはまた、上述のように、パイプライ
ン３００の中を流れる様々なデータ構造にコントローラ
を同期させるためにも使用される。

【０１１１】タグはいくつかの方法で利用される。第１
に、コントローラのＥＵ９０２−９０４の各々は内部で
タグを用いて、マスク・ビットの計算方法を決定するこ
とができる。数クロック・サイクル後、論理素子９２１
−９２５は、実行ユニットによって生成された結果の利
用方法を決定するためにタグを使用することができる。
換言すれば、タグ・フィールドを利用して、コントロー
ラの作動とパイプラインの中を流れるデータ構造との同
期がとられる。

【０１１２】コントローラ・レイ・キャスティングこのセクションではレイ・キャスティングについてさら
に詳細に説明を行う。以下の各セクションで、レイ・キ
ャスティングに責任を負う４つの状態マシン(StampStat
e１００１、SliceState１００２、SlabState１００３、
SectState１００４)の中の１つが説明される。これらの
状態マシンの各々は、１クロック・サイクル中に実行す
べきオペレーション指定命令を出す。実行ユニット９０
２−９０４は結果データと共に論理素子９２１−９２５
へ命令のタグを渡す。

【０１１３】図１２は、生成された順序でデータやシー
ケンシングを指定する命令タグを一般的に示す。点線１
２０１と中かっこ１２０２は反復可能なシーケンスを示
す。“最初”と“最後”の指定によって、コントローラ
が１つのセクションのスラブまたはスライス処理、ある
いは、１つのスライスのスタンプ処理の開始前または開
始後のいずれかに同期処理が行われる。

【０１１４】レンダリングはSectFirstタグ１２１０か
ら始まり、SectLastタグ１２１１で終る。これらの２つ
のタグの間に、レンダーされるセクションの数に応じて
一続きのセクション毎のタグが存在する。各セクション
内のスラブ処理はSlabFirstタグ１２２１とSlabLastタ
グ１２２２とから始まる。各セクション内のスライス処
理はスラブ処理と並行して行われ、SliceFirstタグ１２
２３から始まり、スライスfirstとSliceLastタグ１２２
４で終る。各スライス内のサンプル・スタンプ１２３０
の処理はSampleFirstタグ１２３１から始まり、SampleL
astタグ１２３２で終る。個々のサンプル・スタンプはS
ampleStampタグ１２３０を用いてマークされる。

【０１１５】スタンプ状態マシン各クロック・サイクルで、StampState１００１は１パイ
プライン当たり２つの新しいサンプルまでステップし、
これによって列内に２つの２×２スタンプが形成され
る。StampStateによってＸＹＺボクセル座標、切断面パ
ラメータおよびデプスが決定される。StampStateは、ク
ロップ限度、トリム限度、切断面、デプス最少値／最大
値、および、その他のマスキング機能に対してこれらの
サンプルを検査してサンプルを廃棄するかどうかの決定
を行う。

【０１１６】スタンプの動き図１３の(ａ)、(ｂ)は、コントローラ４００がサンプル
・スライスのスタンプの中を１ステップずつ処理する方
法を示す。各クロック・サイクル中２つのスタンプが生
成される。スタンプ状態マシン１００１は、第１列を横
切って右へ移動し、第２の列を横切って左へ移動するな
どの蛇行スキャンを実行する。各ｘ−方向ステップは水
平方向に２つのスタンプを移動させ、各ｙ−方向ステッ
プは垂直方向に１つのスタンプを移動させる。

【０１１７】スライス状態マシンスライスとは、すべてが同じＺアドレスを持つセクショ
ンから得られる１組のサンプルであることを想起された
い。SliceState１００２は、スライスが廃棄可能な場
合、個々のスライスまたはＮ個のスライスから成るスタ
ックをスキップしながら、１つのセクションの範囲内で
サンプル・スライスの中を１ステップずつ処理する。ス
ライスが廃棄できない場合、SliceStateはStampState１
００１へスライスを出す。

【０１１８】コントローラは、レンダーする必要がある
セクションを発見した後、図５の(ａ)に図示のように、
現在のスライス５０３をチェックしながら、かつ、スラ
イス５０１のスタックの後ろをたどりながら、そのセク
ション内のサンプル・スライスの中を１ステップ処理す
る。図５の(ａ)は１つのセクションの範囲内のスライス
を図示する。点線は、現在のスライス５０６の下に在る
スライスのスタック５０４を示す。刈り込み検査に基づ
いて、現在のサンプル・スライスの処理後、SliceState
は１、４、１６、３２、または、６４スライスをスキッ
プする。現在のスライスを廃棄できない場合、SliceSta
te１００２は、ZinterpSeq９２３とStampState１００１
に対して信号を発生する。ZinterpSeqは補間段３０２の
ためにＺ補間命令を生成し、StampStateはＸＹ補間命令
を生成する。

【０１１９】スライスを処理するために、タイルの境
界、並びに、現在の位置とそのＸＹ増分値とが決定さ
れ、StampState１００１によって使用される。正射影投
影では、これらの増分値はセクションを通じてすべて一
定である。透視投影では、Ｚの増分値は一定であるが、
ＸとＹの増分値は該セクションの下にある各スライスに
ついて一定量ずつ変化する。

【０１２０】スラブ状態マシン SlabState１００３は、スラブが廃棄可能な場合、個々
のスラブまたはＮ個のスラブから成るブロックをスキッ
プしながら、セクションの範囲内でミニブロック・スラ
ブの中を１ステップずつ処理する。スラブを廃棄できな
い場合、SlabStateはレンダリング用メモリ１６０から
スラブのボクセルを読出し、レンダリング・エンジン３
００の中へ入れるために必要なコマンドを生成する。

【０１２１】スラブの動きコントローラ４００は、レンダーする必要があるセクシ
ョンを発見した後、そのセクション内のミニブロック・
スラブの中を、図５の(ｂ)に図示のように、現在のスラ
ブ５０６とスラブ５０４の次のスタックをチェックしな
がら１ステップずつ処理する。図５の(ｂ)はセクション
の範囲内のミニブロック・スラブを図示する。点線は現
在のスラブ５０６の下に在るスタック５０４を示す。刈
り込み検査に基づいて、現在のスラブ５０６を処理後、
SlabState１００３は１、４、８、１６、または、３２
スラブをスキップする。これは、図５の(ａ)に図示のよ
うな、２、８、１６、３２、または、６４ボクセル・ス
ライスに対応する。現在のスラブ５０６を廃棄できない
場合、パイプラインの中にスラブのボクセルを読み込む
ことができるようにSlabState１００３はTopSeq９２２
に通知を行う。

【０１２２】セクション状態マシンセクションとは、例えば２４×２４ピクセルまでを含む
像面内の矩形領域であることを想起されたい。SectStat
e１００４は像面内の次のセクションへ１ステップ処理
する。SectStateは、何らかの有効なサンプルを含む場
合、SlabStateとSliceStateへ各セクションを出す。Bot
tomSeqは、有効なサンプルを含む含まないに関わらず、
各セクション用のデプスバッファと画像バッファの読出
しと書込みを行う。

【０１２３】セクションの動き図１４はセクションの動き１４００を例示する。点線は
視野円錐台をマークし、実線１４０２はセクションをマ
ークする。各セクションは、各方向に４サンプルと２４
サンプルの幅の間にある。したがってこのセクションに
は、４×４の配列のタイル間で平等に分割された、各方
向に２から１６のスタンプが含まれる。

【０１２４】像面を横切るセクションの動きは、サンプ
ル・スライスを横切るスタンプの動きと類似している。
双方とも、Ｘ方向に右と左へ移動し、より高いＹの値の
方へ移動する蛇行スキャンを利用している。その相違と
して、StampState１００１は１状態当たり８個のサンプ
ル位置を決定し、SectState１００４は１状態当たりた
だ１つのセクションを決定するということが挙げられ
る。

【０１２５】正射影投影に関しては、像面を横切って１
ステップずつ処理しながらも、すべての増分値は一定の
ままである。透視投影の下では、ＸとＹの増分値は一定
のままであるが、ＸまたはＹの各ステップに対して、Ｚ
の増分値は一定量ずつ変化する。

【０１２６】SectState１００４は基本平面上でセクシ
ョンを処理する。SectStartは第１のセクションをチェ
ックする。このセクションが視野円錐台１４０１と交差
しない場合、SectStateは第１のセクションを見つける
まで１ステップずつ処理する。このセクションが視野円
錐台１４０１と交差する場合、SectStateによって、Sla
bState１００３とSliceState１００２とはセクションの
中を１ステップずつ処理することが可能になる。SectSt
ateはまたBottomSeq９２１へセクションを出し、該Bott
omSeq９２１は様々なバッファの初期化を行う。BottomS
eqは必要なデプスと画像バッファとを読み出し、合成器
３０４へそれらのデータを送る。同時に、BottomSeqは
視野円錐台に対して各ピクセルを検査して、２４×２４
ビットマスクの初期化を行う。各ビットは、対応するレ
イがまだアクティブであるかどうかを示す。合成器３０
４がセクションを完了したことが信号で送られた後、Bo
ttomSeqは、必要に応じて、メモリ１６０へデータを書
き戻し、視野円錐台の範囲内に存在するピクセルだけの
修正を行う。

【０１２７】コントローラ実行ユニットコントローラ状態マシン４００はCoordEU９０２、CutEU
９０３、DepthEu９０４を直接制御する。これらの各々
には、図１５に例示されている基本論理演算装置の複数
のコピーが含まれる。CoordEUは、実際に、Ｘ、Ｙ、Ｚ
座標を計算するために６つのコピーを含む。CutEU には
４つの切断面を計算するために８つのコピーが含まれ
る。DepthEuにはデプス値を計算するために２つのコピ
ーが含まれる。各々のケースで、予想される数の２倍の
ＥＵが存在する。その理由として、コントローラ４００
が、StampState１００１状態マシン内で一対のスタンプ
を計算し、さらに、その他の３つの状態マシンの最小値
と最大値の双方を計算するということが挙げられる。

【０１２８】図１５に図示のように、コントローラ４０
０の実行ユニット９０２−９０４は、実行ユニット１５
００の複数のＳＩＭＤコピーの中でマイクロコードを実
行する。ＥＵ１５００には、３ポート・レジスタ・ファ
イル１５０１、加算器１５０２、２つのマルチプレクサ
１５０３、シフタ１５０４が含まれる。ＥＵは、３ポー
ト・レジスタ・ファイル１５０１から得られる２つのレ
ジスタの加算または減算のいずれかを行うことができ
る。さらに、ＥＵ入力の１つを６ビットまで左へシフト
して、レジスタ値に６４まで２のべき乗を掛けることが
可能である。これは、スラブまたはスライスのスタック
のスキップにとって有用である。ＥＵの結果１５１０は
レジスタの中に書き戻すことができる。あるいは、ロー
ド・バス１５２０からレジスタをロードすることが可能
である。該ロード・バスは初期化のためにセクション状
態マシン状態によって使用される。

【０１２９】レジスタ・ファイル・エントリの中の１つ
が最適化されて、各クロック・サイクルでこの１つのエ
ントリの更新が可能になる。このレジスタには、スライ
スを横切って１ステップずつ処理しながらスタンプ状態
マシンによって増分される値が含まれる。その他のレジ
スタ・ファイル・エントリは、それらのエントリへの書
込みを行う命令からの３命令遅延と、それらエントリを
読み出す次の命令とを必要とする。これによって、好ま
しい実施の形態でコストの安いレジスタ配列の実現が可
能になる。

【０１３０】ＥＵの各々は実際には４つの異なる値の生
成を必要とする。その理由として各スタンプが４つのサ
ンプルを含み、さらに、各スタックまたはタイルの操作
によって４つのスタックまたはタイルの最少値／最大値
が生成されるということが挙げられる。１つの可能な実
現例では、CoordEU、CutEU、DepthEu内のＥＵの４倍も
のＥＵが用いられる。代わりに、この好ましい実施の形
態では４つの専用加算器と少数の専用レジスタとを用い
て加算器によって生成される各値の４つの関連する値が
生成される。この論理回路によって行われた演算は、命
令に付けられたタグによって選択される。スタック操作
用タグによって、Ｚ内でステップ・サイズの逓倍だけＺ
アドレスが増分される。スタンプ操作またはタイル操作
用タグはＸまたはＹアドレスを増分し、２×２配列で４
つの位置が生成される。

【０１３１】マスク・シーケンサ MaskSeq９２５は、サンプル、タイル、スライス、スラ
ブをいつ廃棄すべきかの決定を行うためにマスク情報を
組み合わせる。MaskSeqは各レイ用の有効な１ビットを
保持する。MaskSeqは、BottomSeq９２１によって行われ
る視野円錐台比較を利用して、視野円錐台と交差したと
き、レイを有効なものとして初期化する。視野円錐台の
外側の任意の位置が無効なものとしてスタートする。Ma
skSeqは、そのレイに沿ったすべての後続サンプルが無
効であることが保証されたとき、有効なレイを無効なも
のとしてマークする。これは２つの異なる方法で行われ
る。第１に、コントローラ内部のサンプル・スタンプ・
クリップ検査によって、Afterマスク・コードの生成が
可能となり、サンプルのレイがクリップ領域の中の１つ
を通り過ぎることが示される。第２に、ライン４３０を
介して合成器段３０４から戻されるレイ処理の終了の結
果、レイを無効なものとして設定することが可能とな
る。タイル内の全てのレイが無効なとき、タイルは無効
なものとしてマークされる。全ての１６タイルが無効と
なった場合、スライスとスラブのセクション処理は完了
する。

【０１３２】合成器段３０４から受信された終了信号は
終了されたレイを無効なものとしてマークする。これと
並行して、StampState１００１はレイを無効なものとし
てマークすることができる。あるいは、SliceState１０
０２はタイル全体を無効としてマークすることが可能と
なる。

【０１３３】最も重要な点は、MaskSeqが３つのコント
ローラ実行ユニット９０２−９０４からマスク・ビット
を統合してタイルとサンプル・マスクとを決定するとい
う点である。MaskSeqはスタック・マスクも統合して、
この情報をマスタ状態マシン９０１へ渡す。マスタ状態
は、セクション全体が無効かどうかを示す別の信号と共
に、スタック・マスクを用いて、SliceState１００２と
SlabState１００３内の状態遷移を制御する。

【０１３４】レイの終了後は、レイが再びアクティブに
なることは決してあり得ないことに留意されたい。これ
は、レイ終了を報告する合成器段３０４の非常に重要な
特徴である。例えば、合成されたアルファ値が所定値を
上回って、サンプルが廃棄される場合レイは終了する
が、その理由として、この合成されたアルファ値が、閾
値を上回った後もずっと、レイの残り部分の間閾値を上
回ることが挙げられる。

【０１３５】MaskMux論理ブロックセクション処理中、合成器３０４からの終了コマンド
は、クロック・サイクル当たり１スタンプの割合で、終
了レイを無効なものとしてマークする。それと並行し
て、StampState１００１は、クロック・サイクル当たり
２スタンプの割合で、レイを無効なものとしてマークす
ること及び／又はSliceState１００２がタイル全体を無
効としてマークすることができる。

【０１３６】MaskSeq９２５はユニット９０２−９０４
エレメントからマスク・ビットを統合して、タイルとサ
ンプル・マスクとを決定する。MaskSeqはスタック・マ
スクも統合して、マスタ状態マシン１０００へこの情報
を渡す。マスタ状態はセクション無効信号と共にスタッ
ク・マスクを使用して、SlabStateとSliceState状態マ
シン内の状態遷移を制御する。

【０１３７】好ましい実施の形態を例として本発明を説
明してきたが、本発明の精神と範囲内で様々な他の適合
化と改変が可能であると理解すべきである。したがっ
て、本発明の真の精神と範囲の中に入るものとして、す
べてのそのような変更例および改変例をカバーすること
が添付の請求項の目的である。

【図面の簡単な説明】

【図１】本発明によるコントローラを用いるパイプラ
イン化されたレンダリング・システムのブロック図であ
る。

【図２】レンダリング・エンジンのブロック図であ
る。

【図３】レンダリング・パイプライン段のブロック図
である。

【図４】レンダリング・パイプラインと接続されたコ
ントローラのブロック図である。

【図５】サンプル・スライスとボクセル・スラブのブ
ロック図である。

【図６】サンプル・スタンプとタイルのブロック図で
ある。

【図７】ボクセルの中を貫通するレイのブロック図で
ある。

【図８】ボクセルの中を貫通するレイのブロック図で
ある。

【図９】本発明によるコントローラのブロック図であ
る。

【図１０】コントローラ状態マシンのブロック図であ
る。

【図１１】コントローラ状態マシンのブロック図であ
る。

【図１２】命令タグのブロック図である。

【図１３】スタンプの動きを示すブロック図である。

【図１４】セクションの動きを示すブロック図であ
る。

【図１５】コントローラ実行ユニットのブロック図で
ある。

【図１６】デプス検査結果を組み合わせて領域番号に
変える方法を説明するための図である。

【図１７】生じ得るデプス検査から結果として得られ
るコード及びこれらのコードの組み合わせ方法を説明す
るための図である。

【符号の説明】

１０ボリューム・レンダリング・システム、１００
ホスト・コンピュータ、１１０ＣＰＵ、１２０メイ
ン・メモリ、１２１ＰＣＩバス、１６０レンダリン
グ用メモリ、２００レンダリング・サブシステム、２
１０メモリ・インターフェース、２２０バス用論理
回路、２２１内部レジスタ・ファイル、２５０共有
スライス・バッファ、３００レンダリング・パイプラ
イン、３０１勾配推定器段、３０２類別器−補間器
段、３０３照明器段、３０４合成器段、３１０ミニ
ブロック、３２０ボクセル、４００コントローラ、
４０１出力制御信号、４０２ボクセル、４０３ピ
クセル、４０４キュー、４１０バッファ、４２０，
４３０入力制御信号。

───────────────────────────────────────────────────── フロントページの続き (72)発明者ジェフリー・ルシアーアメリカ合衆国、マサチューセッツ州、ウォバーン、ケンブリッジ・ロード 36、ユニットナンバー12 (72)発明者ヴィシャル・シー・バティアアメリカ合衆国、マサチューセッツ州、アーリントン、サマー・ストリート 478 Ｆターム(参考） 5B057 AA20 CA08 CA13 CA16 CB08 CB13 CB16 CH05 CH11 CH14 CH16 DA16 5B080 AA17 BA07 CA04 DA06

Claims

【特許請求の範囲】

【請求項１】グラフィックデータを画像としてレンダ
リングする方法であって、前記画像に寄与する可能性のあるグラフィックデータを
特定するステップと、前記特定されたグラフィックデー
タをレンダリング・パイプラインの中へ読み込むステッ
プと、前記特定されたグラフィックデータだけのための画像に
寄与する可能性のあるサンプルを前記レンダリング・パ
イプライン内に生成するステップと、前記特定されたグラフィックデータとサンプルとが前記
画像に寄与し続ける限り、前記特定されたグラフィック
データとサンプルとを前記レンダリング・パイプライン
内で処理し、かつ、他のすべての特定されたグラフィッ
クデータとサンプルとを前記パイプラインから廃棄する
ステップと、を備えたことを特徴とするグラフィックデータレンダリ
ング方法。
【請求項２】前記グラフィックデータが複数のボクセ
ルを含むボリューム・データ・セットであり、かつ、前
記画像が複数のピクセルを含み、前記特定されたサンプルに対してのみ前記ボクセルを補
間するステップと、前記特定されたサンプルが前記画像のピクセルに寄与し
続ける限り前記特定されたサンプルを前記ピクセルの中
へ合成し、かつ、前記パイプラインから他のすべてのサ
ンプルを廃棄するステップと、をさらに備えたことを特徴とする請求項１に記載の方
法。
【請求項３】前記読み込みステップが、前記パイプラ
インのスループットを最大化する前記生成ステップより
低いレートで実行されることを特徴とする請求項１に記
載の方法。
【請求項４】前記グラフィックデータが複数のボクセ
ルを含むボリューム・データ・セットであり、スタンプと、スライスと、スラブと、セクションとに前
記サンプルを分割するステップと、前記スタンプと、スライスと、スラブと、セクションと
に対してそれぞれ１つの状態マシンが存在する、パイプ
ライン・コントローラの複数の状態マシンの中で、前記
スタンプと、スライスと、スラブと、セクションとを個
別に処理するステップと、をさらに有することを特徴と
する請求項１に記載の方法。
【請求項５】前記複数の状態マシンが所定の優先順位
に従って複数の実行ユニットで処理を実行することを特
徴とする請求項４に記載の方法。
【請求項６】メモリ内に格納されているグラフィック
データをレンダリングする方法であって、複数の段を含むレンダリング・パイプラインの中へ前記
グラフィックデータを読み込むステップと、キューによって前記レンダリング・パイプラインの前記
段と並列に接続されたコントローラ内の出力制御信号を
発生するステップと、前記出力制御信号を前記グラフィックデータと同期させ
るステップと、前記レンダリング・パイプラインの前記段において前記
出力制御信号に従って前記グラフィックデータを処理し
て、出力デバイス上の前記グラフィックデータを表す画
像をレンダーするステップと、を備えたことを特徴とするグラフィックデータレンダリ
ング方法。
【請求項７】前記レンダリング・パイプラインの前記
段と直列に接続された複数のバッファ内に前記グラフィ
ックデータをバッファするステップをさらに備えたこと
を特徴とする請求項６に記載の方法。
【請求項８】前記バッファが前記段の間に存在し、か
つ前記段と内部でつながっていることを特徴とする請求
項７に記載の方法。
【請求項９】前記レンダリング・パイプラインの段に
よって使用される前に前記出力制御信号を発生すること
を特徴とする請求項８に記載の方法。
【請求項１０】前記コントローラが前記レンダリング
・パイプラインに関して非同期的に作動することを特徴
とする請求項６に記載の方法。
【請求項１１】前記パイプラインを通して前記グラフ
ィックデータを処理するために必要ないくつかのクロッ
ク・サイクルとして測定される前記レンダリング・パイ
プラインの長さが時間の経過につれて変動することを特
徴とする請求項６に記載の方法。
【請求項１２】前記コントローラが前記出力制御信号
を発生するピーク・レートの方が、前記段が前記出力制
御信号を使用するレートより速いことを特徴とする請求
項６に記載の方法。
【請求項１３】前記グラフィックデータが前記コント
ローラを介して前記レンダリング・パイプラインに読み
込まれることを特徴とする請求項６に記載の方法。
【請求項１４】前記段が、異なるレートで前記グラフ
ィックデータを処理できることを特徴とする請求項６に
記載の方法。
【請求項１５】メモリ内に格納されたグラフィックデ
ータをレンダリングする装置であって、複数の段を含むレンダリング・パイプラインと、複数のキューと、前記キューを介して前記段に並列に接続され、前記キュ
ーを介して前記段へ出力制御信号を発生するように構成
されたコントローラと、前記出力制御信号を前記グラフィックデータと同期させ
つつ、前記出力制御信号に従って前記段で前記グラフィ
ックデータを処理して、出力デバイス上の前記グラフィ
ックデータを表す画像をレンダーする手段と、を備えたことを特徴とするグラフィックデータレンダリ
ング装置。
【請求項１６】前記レンダリング・パイプラインの前
記段と直列に接続された複数のバッファをさらに備えた
ことを特徴とする請求項１５に記載の装置。
【請求項１７】前記バッファが前記段の間に存在し、
かつ前記段と内部でつながっていることを特徴とする請
求項１６に記載の装置。
【請求項１８】前記レンダリング・パイプラインの段
によって使用される前に前記出力制御信号を発生するこ
とを特徴とする請求項１５に記載の装置。
【請求項１９】前記コントローラが前記レンダリング
・パイプラインに関して非同期的に作動することを特徴
とする請求項１５に記載の装置。
【請求項２０】前記パイプラインを通して前記グラフ
ィックデータを処理するために必要ないくつかのクロッ
ク・サイクルとして測定される前記レンダリング・パイ
プラインの長さが時間の経過につれて変動することを特
徴とする請求項１５に記載の装置。
【請求項２１】前記コントローラが前記出力制御信号
を発生するピーク・レートの方が、前記段が前記出力制
御信号を使用するレートより高速であることを特徴とす
る請求項１５に記載の装置。
【請求項２２】前記コントローラを介して前記レンダ
リング・パイプラインからあるいは前記レンダリング・
パイプラインへ前記グラフィックデータが渡されること
を特徴とする請求項１５に記載の装置。
【請求項２３】前記グラフィックデータが複数のミニ
ブロックとして組織化されたボリューム・データ・セッ
トであり、クロック・サイクル当たり１ミニブロックの
レートで前記ミニブロックを読むように構成されたメモ
リ・インターフェースをさらに備えたことを特徴とする
請求項２２に記載の装置。
【請求項２４】前記コントローラが前記レンダリング
・パイプラインから入力制御信号を受信し、前記入力制
御信号が、前記キューの中のいずれか１つがいっぱいに
なりそうなとき、前記レンダリング・パイプラインへグ
ラフィックデータを渡すことを停止するように前記コン
トローラに対して指示することを特徴とする請求項１５
に記載の装置。
【請求項２５】前記入力制御信号が、前記コントロー
ラのためのレンダリング・パイプライン状態情報を含む
ことを特徴とする請求項２４に記載の装置。
【請求項２６】前記段が、異なるレートで前記グラフ
ィックデータを処理できることを特徴とする請求項１５
に記載の装置。
【請求項２７】前記出力制御信号が、前記グラフィッ
クデータを組織化する様々なタイプのデータ構造の開始
と終了を示し、また前記レンダリング・パイプラインの
前記段内で前記データ構造を用いて前記出力制御信号を
時間−整列するタグを含むことを特徴とする請求項１５
に記載の装置。
【請求項２８】前記コントローラが、特定のグラフィ
ックデータが前記画像に寄与しないことが前記コントロ
ーラによって決定されたとき、前記特定のグラフィック
データが前記レンダリング・パイプラインへ渡される前
後に前記特定のグラフィックデータを廃棄する手段をさ
らに有することを特徴とする請求項１５に記載の装置。
【請求項２９】前記特定のグラフィックデータの廃棄
を指示するためにマスク・コードが前記グラフィックデ
ータと関連づけられることを特徴とする請求項２８に記
載の装置。
【請求項３０】前記コントローラが、マスタ状態マシンと、複数の実行ユニットと、互いに接続された複数の論理素子と、をさらに有することを特徴とする請求項１５に記載の装
置。
【請求項３１】前記複数の実行ユニットが、前記レンダリング・パイプラインの合成器段と前記メモ
リとの間でグラフィックデータの読出しと書込みを行う
手段と、前記合成器段によって使用される前記グラフィックデー
タのデプス値を蓄積する手段と、をさらに有することを特徴とする請求項３０に記載の装
置。
【請求項３２】前記コントローラが、各コントローラ
・クロック・サイクル中前記実行ユニットの各々に対し
て１つの命令を発生し、前記実行ユニットが構造上同一
であって、かつ前記グラフィックデータの異なる部分に
対して並列に作用することを特徴とする請求項３１に記
載の装置。
【請求項３３】前記マスタ状態マシンが、前記実行ユ
ニットで実行する倍数のスレッド間で仲裁を行うことを
特徴とする請求項３１に記載の装置。
【請求項３４】前記スレッドが、異なる詳細レベルの
前記グラフィックデータの中を１ステップずつ処理する
４つのコルーチンとして実施されることを特徴とする請
求項３３に記載の装置。
【請求項３５】前記マスタ状態マシンが、４つのレイ
・キャスティング状態マシンをさらに有し、前記マスタ
状態マシンが、前記レイ・キャスティング状態マシンの
中の１つのための前記スレッドの中の１つのスケジュー
リングを行って、マルチプレクサとマスタ状態アービタ
とを用いて、コントローラ・クロック・サイクル毎に前
記実行ユニットで実行を行い、前記スケジュールされた
スレッドと状態マシンとが最高の優先順位を有しかつ実
行準備ができていることを特徴とする請求項３３に記載
の装置。
【請求項３６】前記優先順位がある特定の状態マシン
によって処理するグラフィックデータの量に基づくこと
を特徴とする請求項３５に記載の装置。
【請求項３７】前記優先順位が最長の待ち時間を持つ
特定の状態マシンを先行させることに基づくことを特徴
とする請求項３５に記載の装置。
【請求項３８】前記４つのレイ・キャスティング状態
マシンがスタンプ、セクション、スライス、スラブ状態
マシンを含むことを特徴とする請求項３５に記載の装
置。
【請求項３９】前記コントローラが前記４つのレイ・
キャスティング状態マシンの状態に基づいて命令とコマ
ンドとを発生し、前記コマンドがグラフィックデータ転
送コマンドであり、前記命令が前記実行ユニット内での
算術演算実行命令であることを特徴とする請求項３５に
記載の装置。
【請求項４０】前記コントローラが複数のレンダリン
グ・パイプラインと並列に接続されることを特徴とする
請求項１５に記載の装置。