JP2023508276A

JP2023508276A - 多重解像度ボクセルにおける共分散を含むマップ

Info

Publication number: JP2023508276A
Application number: JP2022537282A
Authority: JP
Inventors: カーステンボッセマイケル; ブラエスパトリック; アダムスデレク; レブサメンブライス
Original assignee: ズークスインコーポレイテッド
Priority date: 2019-12-20
Filing date: 2020-12-15
Publication date: 2023-03-02
Also published as: CN114868154A; WO2021127692A1; EP4078534A1; EP4078534A4

Abstract

キャプチャされた環境データの統計データに基づいてシーンまたはマップを表すための技法が本明細書に述べられる。場合によっては、データ（たとえば、共分散データ、平均データなど）は、複数のセマンティック層を含む多重解像度ボクセル空間として格納されることがある。いくつかの場合には、個々のセマンティック層は、異なる解像度を有する複数のボクセルグリッドを含むことがある。複数の解像度のボクセル空間がマージされて、１つまたは複数の解像度にて検出されたボクセルの共分散に基づいて組み合わされたシーンを生成することがある。

Description

関連出願の相互参照
本出願は、２０１９年１２月２０日に提出され、「MAPS COMPRISING COVARIANCES IN MULTI-RESOLUTION VOXELS」という表題をつけられた米国出願第１６／７２２，５９８号の優先権を主張し、全体が参照により本明細書に組み入れられる。

データは、環境においてキャプチャされ、環境のマップとして表されることが可能である。よくあることだが、上記のマップは、環境内を進む車両によって用いられることが可能であり、マップが、いろいろな目的に対して用いられることが可能である。場合によっては、環境は、２次元マップとして表されることが可能であり、一方、他の場合、環境は、３次元マップとして表されることが可能である。さらに、環境内の表面は、複数のポリゴンまたは三角形を用いて表されることがよくある。

詳細な説明は、添付の図面を参照して説明される。図面において、参照符号の最も左の数字（複数可）は、参照符号が最初に現れる図面を特定する。別の図面における同一の参照符号の使用は、同様のまたはまったく同じのコンポーネントまたは特徴を示す。

本明細書に説明されている多重解像度ボクセル空間の例示的なアーキテクチャを例示する例示的な図である。本明細書に説明されている多重解像度ボクセル空間のセマンティック層の例示的な解像度を例示する例示的な絵入りの図である。本明細書に説明されている図２の多重解像度ボクセル空間についての第１の解像度を例示する例示的な図である。本明細書に説明されている図２の多重解像度ボクセル空間についての第２の解像度を例示する例示的な図である。本明細書に説明されている図２の多重解像度ボクセル空間についての第３の解像度を例示する例示的な図である。本明細書に説明されている物理環境を表すデータをマップデータとアライメントするように構成されたシステムの例示的なデータフローを例示する例示的な処理フロー図である。本明細書に説明されている多重解像度ボクセル空間を生成することに関連付けられた例示的な処理を例示する例示的なフロー図である。本明細書に説明されているターゲット多重解像度ボクセル空間をリファレンス多重解像度ボクセル空間とアライメントすることについての例示的な処理を例示する別のフロー図である。本明細書に説明されている多重解像度ボクセル空間アライメントシステムを実装するための例示的なシステムのブロック図である。本明細書に説明されているキャプチャされたデータの点群表現と比較した図２～４の多重解像度ボクセル空間の例についての絵入りの図である。

本明細書に説明される技法は、物理環境を表すデータの点分布の空間平均、共分散、および重みを格納するボクセルを含んでいる多重解像度ボクセル空間（multi-resolution voxel space）を含むマップデータを、決定することおよび／または用いることに向けられる。マップデータは、異なる解像度または物理的距離にて物理環境を表す複数のボクセルグリッド（voxel grid）またはボクセル層を含むことがある。例として、各々のボクセル層（voxel layer）は、進行している層の２倍の解像度にて物理環境を表すことがある。すなわち、第１の層におけるボクセルが第１の体積（例えば、１０ｃｍ×１０ｃｍ×１０ｃｍ）を表すことがある一方、第２の層におけるボクセルは、第２の体積（例えば、２０ｃｍ×２０ｃｍ×２０ｃｍ）を表すことがある。多重解像度ボクセル空間のボクセルに関連付けられたデータは、複数のコバリアンスの楕円体（covariance ellipsoid）として表されることがある。コバリアンスの楕円体の表現は、個々のボクセルに関連付けられたデータ点の算出された平均値および共分散値に基づいて生成されることがある。場合によっては、ボクセルデータは、例えば、分類および／またはセグメンテーション情報などのセマンティック情報と関連付けられることが可能であり、特定の分類と関連付けられたデータは、特定の分類と関連付けられた特有の多重解像度ボクセル空間と関連付けることが可能である。今述べた例では、各々のボクセルコバリアンスセマンティック層（covariance semantic layer）は、コバリアンスの楕円体として特有のセマンティッククラス（semantic class）（例えば、木、車両、建物など）に関連付けられたデータ点を含むことがある。

場合によっては、多重解像度ボクセル空間によって表されるマップデータは、例えば、ライダー（light detection and ranging）システムの出力など、物理環境を表すデータ点から生成されることがある。例として、システムは、点群として表される複数のライダーポイント（lidar point）またはライダーデータを受信することがある。システムは、ライダーポイントを、車両（例えば、システムがライダーポイントをキャプチャする）の局所的な基準フレームに少なくとも部分的に基づいて、第１の解像度を有するボクセルグリッド（例えば、多重解像度ボクセル空間のボクセルグリッドが最大数のボクセルを有する）のボクセルに割り当てる、ないしは別のやり方により関連付けることがある。システムは、たとえば、集められたデータの平均値、セントロイド、共分散、および同類のものなど、各ボクセルに関連付けられた統計データを決定することがある。次に、システムは、より高いレベルのボクセルグリッドを生成するとき、より低い解像度のグリッドのボクセル（またはボクセルに関連付けられたデータ）をマージする、ないしは別のやり方により組み合わせることがある。例えば、より低い解像度のグリッドにおける３次元近傍（例えば、より高いレベルのボクセルの物理空間に関連付けられたｘ方向、ｙ方向、およびｚ方向のボクセル数）内のボクセル（またはボクセルに関連付けられたデータ）は、次のより高いレベルのボクセルグリッドを形成するとき、マージされることがある。１つの特定の例では、近傍内のボクセルは、より低い解像度のグリッドの各ボクセルについての個々のガウス分布の重み付き和をとることによってマージされる。場合によっては、より低い解像度におけるボクセルをマージして、より高い解像度のグリッドを形成することは、計算的に安価であるだけでなく、基準フレームによりライダーデータをローカライズするのを助けることを、より低い解像度のグリッドに可能にする。

いくつかの実装では、システムは、多重解像度ボクセル空間を利用して、物理環境の複数のスキャンをアライメントして、物理環境のマップおよびシーンを生成する、同様に、マップまたはシーン内の車両のローカライゼーションを助けることがある。例として、多重解像度ボクセル空間（例えば、ターゲット多重解像度ボクセル空間）が物理環境を表す特有のスキャンまたはデータセットに対して生成されると、システムは、生成された多重解像度ボクセル空間を、シーンを表す多重解像度ボクセル空間（例えば、リファレンス多重解像度ボクセル空間）とアライメントすることがある。場合によっては、アライメントは、リファレンス多重解像度ボクセル空間およびターゲット多重解像度ボクセル空間の各解像度におけるボクセル間の対応を実質的に同時に見つけることによって行われることがある。例えば、システムは、ターゲット多重解像度ボクセル空間の特有の解像度の各ボクセルに対して、占められているボクセルに対するリファレンス多重解像度ボクセル空間の対応する特有の解像度における平均ターゲット点を含むしきい値距離内またはしきい値数のボクセル（例えば、ボクセルの近傍）内のボクセル間で検索することがある。セマンティック層を含む例では、システムは、ターゲット多重解像度ボクセル空間における各セマンティック層の特有の解像度の各ボクセルに対して、リファレンス多重解像度ボクセル空間における対応するセマンティック層の特有の解像度における平均ターゲット点を含むボクセルの近傍を検索することがある。

リファレンス多重解像度ボクセル空間の近傍内の識別されたボクセルのうち、システムは、ターゲット多重解像度ボクセル空間のボクセルに近いセントロイドを有するボクセルを選択することがある。次に、システムは、リファレンス多重解像度ボクセル空間における選択されたボクセルの分布を、ターゲット共分散スタック（target covariance stack）のボクセルにより平均することがある。次に、システムは、組み合わされた共分散行列に主成分分析を行い、固有値（例えば、最小の固有値）を、２つのボクセルに対してマッチングした法線ベクトルとして選択することがある。次に、システムは、少なくともいくつかの例では、上記のマッチングした法線ベクトルに少なくとも部分的に基づくことがあるマッチングしたボクセルの各々に対して残差（または誤差など）を決定し、続いて、すべての上記の残差について最適化を行うことがある。最適化は、上記のボクセルセントロイドのペアの間における距離を最小化することがある。このように、２つのボクセルを表すマージされたボクセルは、元のボクセルの両方の共分散（例えば、関連データの）および重みを正確に表す位置のグリッド内に位置されることがある。もちろん、上記のボクセルのマージを、必要としないアプリケーションはある。非限定的の例として、２つのボクセル空間の間の相対変換は、一般に、ボクセルを組み合わせる（マージする）ことなく、ローカライズのために用いられることがある。

アライメントの間、各層が実質的に同時にマージされることがある場合でさえ、より粗い解像度（例えば、より大きなボクセルに対応する解像度）は、より細かい解像度より前のマッチングに帰着することがある。このように、より粗い解像度におけるマッチングは、より細かい解像度が、マッチングをすることを開始し、アライメント処理を完了することができるように、２つの多重解像度ボクセル空間を、より近いアライメントに至らせるのを助けることがある。場合によっては、キャプチャされたセンサーデータを、環境を表す多重解像度ボクセル空間にマージすることによって、車両は、ポリゴンおよび／またはメッシュを含む従来のマップデータを利用するシステムよりも、より正確および／またはより迅速に環境内の位置を初期化する、またはローカライズすることができることがある。加えて、ボクセルを多重解像度ボクセル空間に格納することによって、データが、より容易にインデックス可能な／検索可能なやり方において格納されることにより、処理速度およびスループットを向上させることがある。例えば、粗い解像度が実際のタスクに対して許容し得るならば、粗い層がメモリーにロードされることにより、望ましい動作のためにアクセスされ処理されるデータの量を減らすことがある。

場合によっては、多重解像度ボクセル空間は、空間の各層が環境についての細部の異なる解像度を提供するので、従来のシステムよりも正確に環境を表すことがある。ゆえに、いくつかの状況では、物理環境のより詳細な表現へのアクセスを有することは、自律車両の全体的な安全性を向上させることがある。

図１は、本明細書に説明されている多重解像度ボクセル空間１０２の例示的なアーキテクチャ１００を例示する例示的な図である。現在の例では、多重解像度ボクセル空間１０２は、セマンティック層１０４、１０６、および１０８として例示される複数のセマンティック層から形成される。セマンティック層１０４～１０８の各々は、特有のセマンティッククラスまたはタイプに対するデータを表すことがある。例として、第１のセマンティック層１０４は、樹木を表すデータを含む一方、第２のセマンティック層１０６は、建物を表すデータを含むことがある。ゆえに、複数のセマンティック層１０４～１０８を含む多重解像度ボクセル空間１０２は、図２～５に関して以下に例示されている物理環境のフルピクチャまたはマップとして各セマンティック層１０４～１０８からのデータを表すことがある。場合によっては、いくつかのアプリケーションは、特有のセマンティッククラスのみの識別または意識を必要とすることがある一方、他のアプリケーションは、物理環境全体の詳細な理解を必要とすることがある。多重解像度ボクセル空間１０２をセマンティック層１０４～１０８にセグメンテーションすることによって、各アプリケーションは、環境に対して相当する適切なクラスまたはタイプのデータのみを処理することにより、いくつかのアプリケーションにおいて処理速度を向上させることがある。

さらに、セマンティック層１０４～１０８の各々は、ボクセルコバリアンスグリッド（voxel covariance grid）１１０、１１２、および１１４として例示される、１つまたは複数のボクセルグリッドを含むこともある。ボクセルコバリアンスグリッド１１０-１１４の各々は、対応するセマンティック層１０４～１０８の同一のセマンティックデータ（semantic data）を表すが、異なる解像度においてである。例として、複数のグリッド１１０の第１のボクセルコバリアンスグリッドは、およそ２５センチメートルのサイズを有するボクセルを有することがある一方、複数のグリッド１１０の第２のボクセルコバリアンスグリッドは、およそ１６メートルのサイズを有するボクセルを有する。ゆえに、複数のグリッド１１０～１１４の各々の各ボクセルコバリアンスグリッドは、物理環境の表されたデータのアライメントおよび処理を助けるために、異なる解像度または粗さを有することがある。例えば、いくつかのアプリケーションは、物理環境についての粗い一般的な理解のみを必要とすることがある一方、他のアプリケーションは、物理環境についての詳細な理解を必要とし、各アプリケーションが、ボクセルグリッドを、望ましいまたは適切な解像度にて処理することにより、いくつかのアプリケーションにおける処理速度を向上させることがある。

いくつかの例では、たとえば、図２～５に関して以下に例示されるものなど、多重解像度ボクセル空間１０２のボクセルコバリアンスグリッド１１０～１１４のボクセルに関連付けられたデータは、共分散行列、平均、および点分布を表す重みを格納するボクセルによって表されることがある。場合によっては、グリッド１１０～１１４のボクセルは、コバリアンスの楕円体として視覚的に与えられることがある。コバリアンスの楕円体は、各ボクセルの固有値比の形状パラメーターに少なくとも部分的に基づくことがある。

例示される例では、３つのセマンティック層１０４～１０８とボクセルコバリアンスグリッド１１０～１１４の３つのセットとが示されている。しかしながら、多重解像度ボクセル空間１０２が、セマンティック層をいくらでも含むことがあること、および、各セマンティック層が、ボクセルコバリアンスグリッドをいくらでも含むことがあることは理解されるは、理解されるべきである。いくつかの実装では、各セマンティック層に対してボクセルコバリアンスグリッドの数は同一であり得る一方、他の実装では、各セマンティック層内のボクセルコバリアンスグリッドの数は異なることがある。例として、いくつかのセマンティッククラス、たとえば、群葉（または歩行者）などは、たとえば建物などの他のセマンティッククラスよりも多くの追加の微細な解像度ボクセルコバリアンスグリッドを必要とすることがあり、ゆえに、歩行者クラスを表すセマンティック層は、建物クラスを表すセマンティック層よりも多くのボクセルコバリアンスグリッドを含むことがある。

図２は、本明細書に説明されている多重解像度ボクセル空間２０８のセマンティック層の例示的な解像度２０２、２０４、および２０６を例示する例示的な示す絵入りの図２００である。現在の例では、解像度は説明のためだけに２次元で示され、いくつの次元でも用いられることがある（たとえば現実世界の３次元物理空間を表す３次元など）ことは理解されるべきである。現在の例では、第１の解像度２０２の第１の近傍２１０内のボクセルは、第２の解像度２０４のボクセル２１２を形成するために組み合わされる。同じく、第２の解像度２０４の第１の近傍２１４内のボクセルは、第３の解像度２０６のボクセル２１６を形成するために組み合わされる。以下に述べている第３の解像度のボクセル２１６は、近傍２１４内のボクセル２１８および２２０の各々からの個々のガウス分布の重み付き和に基づいて形成されて、単一のより高い解像度のボクセルを生成することがある。個々のガウス分布の重み付き和を決定することは、処理リソースおよび時間の観点から計算的に安価であり、ゆえに、多重解像度ボクセル空間２０８を構築することは、従来のシステムよりも早く、より少ない処理リソースにより行われることがあることは、理解されるべきである。

現在の例では、２次元の２ｘ２近傍が示される。しかしながら、多重解像度ボクセル空間は、物理空間を表す３次元ボクセルグリッドとして形成されることが可能であること、および、近傍は、たとえば２ｘ２ｘ２、３ｘ３ｘ３、５ｘ５ｘ５など、種々の均一のサイズ、またはたとえば２ｘ３ｘ４、４ｘ３ｘ４、５ｘ１ｘ３など、均一でないサイズを有することがあることは、理解されるべきである。１つの特有の例では、近傍は、各々のより高い解像度の層が、進行している下位層の半分の数のボクセルを有しながら、２ｘ２ｘ２ボクセルサイズを有することがある。

図３～５は、本明細書に説明されている図２の多重解像度ボクセル空間２０８についての複数の解像度２０２、２０４、および２０６を例示する例示的な図である。現在の例では、多重解像度ボクセル空間２０８のセマンティック層の各々は、物理環境のピクチャまたはマップを生成するのに示される。例として、多重解像度ボクセル空間２０８は、自律車両によってキャプチャされた物理環境の複数のライダースキャンをマージする、またはアライメントすることによって形成されることがある。現在の例では、多重解像度ボクセル空間２０８は、異なる解像度２０２、２０４、および２０６にて物理環境を示すのに、ズームインまたはズームアウトされることがある。例として、解像度２０２は、第１の解像度または最も細かい解像度にてボクセルを示す。ゆえに、多重解像度ボクセル空間２０８の解像度２０２は、解像度２０４または２０６の各々よりも多くのボクセルを含み、さらに、物理環境の最も詳細な表現も含む。進行している解像度２０４または２０６の各々は、後続するより粗い解像度のボクセルにより物理環境を示す。例として、解像度２０２の多重解像度ボクセル空間の各ボクセルは２５ｃｍの領域を表すことがある一方、解像度２０６の多重解像度ボクセル空間の各ボクセルは、１６ｍの領域を表すことがある。

場合によっては、特有のセマンティック層に関連付けられたボクセルは、多重解像度ボクセル空間２０８を見るとき、２つのセマンティック層に関連付けられたボクセルを互いに視覚的に区別するために、着色されるまたはテクスチャされることがある。さらに、各ボクセルに関連付けられたデータが、ボクセルの固有値比、形状パラメーター、および空間統計に少なくとも部分的に基づく形状を有するコバリアンスの楕円体として表されるので、図２～５に例示されるデータが、対応する物体の実在の形状を実質的に表す形状を有することは特筆されるべきである。

いくつかの例では、多重解像度ボクセル空間１０２の各々のより高い解像度３００～５００は、先行する低レベルの解像度２００～４００の半分の数のボクセルを有することがある。例として、解像度３００が、およそ４メートルのサイズのボクセルを有するならば、解像度４００のボクセルは、およそ８メートルのサイズ（例えば、解像度３００のボクセルの２倍のサイズ）であり得る。しかしながら、他の例では、各解像度２００～５００のボクセルのサイズおよび／または数は、他の数学的なおよび／または任意の関係を有することがある。

現在の例では、種々のセマンティッククラスが、楕円の模様または色の違いに基づいて示される。例として、楕円体３０２は、群葉に対応することがあり、楕円体３０４は、壁、構造物、または建物に対応することがあり、楕円体３０６は、たとえば草などの地表の被覆に対応することがある。

図６～図８は、図１～図５の多重解像度ボクセル空間に関連付けられた例示的な処理を例示するフロー図である。処理は、ハードウェア、ソフトウェア、またはそれらの組み合わせにおいて実装されることが可能であるいくつかまたはすべての動作のシーケンスを表す、論理的なフロー図におけるブロックの集まりとして例示される。ソフトウェアのコンテキストという状況では、ブロックは、１つまたは複数のプロセッサーによって実行されると、引用される動作を行う、１つまたは複数のコンピューター読取り可能媒体に格納されたコンピューター実行可能な命令を表す。一般に、コンピューター実行可能な命令は、特有の機能を行うまたは特有の抽象データ型を実装するルーチン、プログラム、オブジェクト、コンポーネント、データ構造などを含む。

説明される動作の順は、限定として解釈されるべきではない。説明されるブロックのいくらでも、どんな順でもおよび／または並列に組み合わせて、処理または代替処理を行うことが可能であり、すべてのブロックが実行される必要はない。議論の目的のために、本明細書における処理は、本明細書における例にて説明されるフレームワーク、アーキテクチャ、および環境を参照して説明されるが、処理は、非常に種々様々の他のフレームワーク、アーキテクチャ、または環境にて実装されることがある。

図６は、本明細書に説明されている物理環境を表すデータをシーンとアライメントするように構成されたシステムの例示的なデータフローを例示する例示的な処理フロー図６００である。例示される例では、システムは、シーンを、環境を表すデータも同様に、多重解像度ボクセル空間として格納されるように構成されることがある。上に述べている、多重解像度ボクセル空間は、各セマンティック層が、異なる解像度のコバリアンスの楕円体としてボクセルを表す複数のボクセルグリッドを含む複数のセマンティック層を有することがある。

１つの特有の例では、センサーシステム６０２、たとえば、ライダー、レーダー、ソナー、赤外線、カメラ、または他の画像キャプチャデバイスなどは、システムを取り囲む物理環境を表すデータをキャプチャすることがある。場合によっては、キャプチャされたデータは、たとえばライダースキャンの出力から生成された点群など、複数のデータ点６０４であり得る。今述べた例では、データ点６０４は、多重解像度ボクセル空間生成コンポーネント６０６によって受信されることがある。

多重解像度ボクセル空間生成コンポーネント６０６は、データ点６０４からターゲット多重解像度ボクセル空間６０８を生成するように構成されることがある。場合によっては、多重解像度ボクセル空間生成コンポーネント６０６は、分類および／またはセグメンテーション技法を介してデータ点を処理することがある。例として、多重解像度ボクセル空間生成コンポーネント６０６は、１つまたは複数のニューラルネットワーク（例えば、深層ニューラルネットワーク、畳み込みニューラルネットワーク等）、回帰技法等を用いて、データ点にタイプまたはクラスを割り当てて、データ点６０４をセマンティックラベル（semantic label）により識別し分類することがある。場合によっては、セマンティックラベルは、たとえば、車両、歩行者、サイクリスト、動物、建物、木、路面、縁石、歩道、不明などのクラスまたはエンティティタイプを含むことがある。追加および／または代替の例では、セマンティックラベルは、データ点６０４に関連付けられた１つまたは複数の特性を含むことがある。例えば、特性は、限定されないが、ｘ位置（グローバルおよび／またはローカルポジション）、ｙ位置（グローバルおよび／またはローカルポジション）、ｚ位置（グローバルおよび／またはローカルポジション）、向き（例えば、ロール、ピッチ、ヨー）、エンティティタイプ（例えば、分類）、実体の速度、実体の加速度、速度および／または加速度の変化の割合、実体の範囲（大きさ）などを含むことがある。

いくつかの例では、ターゲット多重解像度ボクセル空間６０８を生成することは、静的オブジェクト（例えば、建物、樹木、群葉など）に関連付けられたデータをターゲット多重解像度ボクセル空間６０８に関連付ける一方、動的オブジェクト（例えば、歩行者、車両などを表す）に関連付けられたデータをフィルタリングすることを含むことがある。

代替の実装では、データ点６０４は、パーセプションパイプラインまたはコンポーネントによって、添付されたセマンティックラベルを有して出力されることがある。例として、データ点６０４は、パーセプションコンポーネントによって出力される散在する物体の状態表現の一部として受信されることがあり、詳細が、全体として本明細書に参照により組み入れられる米国出願シリアル番号１６／５４９，６９４に述べられる。

現在の例では、多重解像度ボクセル空間生成コンポーネント６０６は、セマンティックラベルを付けられたデータ点６０４を、対応するセマンティックラベル（例えば、木、建物、歩行者等）を有するターゲット多重解像度ボクセル空間６０８のセマンティック層に割り当てることがある。例として、多重解像度ボクセル空間生成コンポーネント６０６は、データ点６０４を共通の基準フレームに投影し、次に、共通の基準フレーム内のデータ点６０４を、対応するセマンティッククラスに関連付けられた適切な点群へ多重化することがある。各点群に対して、次に、多重解像度ボクセル空間生成コンポーネント６０６は、各データ点６０４を、各セマンティック層の最も細かい解像度のボクセルグリッド（例えば、ベースボクセルグリッド）のボクセルに割り当てることがある。いくつかの特定の事例では、多重解像度ボクセル空間は、ボクセルの各々のセマンティッククラスを含む複数の統計値を格納する単一の層であり得る。

対応する群に対するデータ点６０４の各々がボクセルに割り当てられると、多重解像度ボクセル空間生成コンポーネント６０６は、セマンティック層の最も細かい解像度のグリッドの各ボクセルに対して空間統計（例えば、空間平均、共分散、およびボクセルに割り当てられたデータ点６０４の重みまたは数）を計算することがある。１つの特有の例では、特有のボクセルの空間統計は、Welford's Online Algorithmを用いて計算されることがある。

セマンティック層のベースまたは最も細かい解像度のボクセルグリッドが完了すると、多重解像度ボクセル空間生成コンポーネント６０６は、セマンティック層の次のより大きい解像度のボクセルグリッドの各々を反復的にまたは再帰的に生成することがある。例として、多重解像度ボクセル空間生成コンポーネント６０６は、先行するより低い解像度のグリッド（ベースのまたは最も細かい解像度のグリッドにより凝視する）を利用し、２ｘ２ｘ２近傍内のボクセルに関連付けられたデータをマージして、次のより高いレベルのボクセルグリッドを形成することがある。１つの特定の例では、より低い解像度ボクセルグリッドの近傍内のボクセルは、近傍内の各ボクセルの個々のガウス分布の重み付き和をとることによってマージされる。ゆえに、多重解像度ボクセル空間のセマンティック層内のボクセルグリッドは、図１～５に関して上により詳細に述べている、各々のより高い解像度のグリッドが、先行するより低い解像度のグリッドよりも少ないボクセルを含む多重解像度ピラミッドを形成することがある。１つの特定の例では、セマンティック層の各々の先行する低い解像度のグリッドは、次のより高い解像度のグリッドの４倍の数のボクセルを有することがある。

ターゲット多重解像度ボクセル空間６０８がデータ点６０４から生成されると、ターゲット多重解像度ボクセル空間６０８は、リファレンス多重解像度ボクセル空間６１０（例えば、シーンを表す多重解像度ボクセル空間）とアライメントされる。例として、例示される例では、多重解像度ボクセル空間アライメントコンポーネント６１２は、新たに生成されたターゲット多重解像度ボクセル空間６０８をリファレンス多重解像度ボクセル空間６１０とアライメントすることがある、またはターゲット多重解像度ボクセル空間６０８とリファレンス多重解像度ボクセル空間６１０との間の変換を決定することであり得る。ターゲット多重解像度ボクセル空間６０８をリファレンス多重解像度ボクセル空間６１０とアライメントするために、多重解像度ボクセル空間アライメントコンポーネント６１２は、ターゲット多重解像度ボクセル空間６０８の各セマンティック層および各解像度に対して、実質的に同時に、各ボクセルを取り、リファレンス多重解像度ボクセル空間６１０の対応する解像度およびセマンティック層における平均ターゲット点を決定することがある。次に、多重解像度ボクセル空間アライメントコンポーネント６１２は、リファレンス多重解像度ボクセル空間６１０の対応する解像度およびセマンティック層のボクセルグリッドの２ｘ２ｘ２近傍を決定し、近傍のボクセルが占めているかどうかを識別することがある。次に、多重解像度ボクセル空間アライメントコンポーネント６１２は、ターゲット多重解像度ボクセル空間６０８からボクセルに最も近いセントロイドを有するボクセルを選択し、選択されたボクセルの分布およびターゲットボクセル（target voxel）からのボクセルの分布を平均する。次に、多重解像度ボクセル空間アライメントコンポーネント６１２は、選択されたボクセルとターゲットからのボクセルとの組み合わされた共分散行列に主成分分析を行い、２つのボクセルに対してマッチングされた法線ベクトルとして最小の固有値を選択することによりターゲット多重解像度ボクセル空間６０８をリファレンス多重解像度ボクセル空間６１０とより近くにアライメントさせることがある。いくつかの場合には、最適化は、マッチングされたボクセルに行われて、リファレンス多重解像度ボクセル空間およびターゲット多重解像度ボクセル空間の間の全体的なアライメントを改善する、および／または、限定されないが、非線形最適化（例えば、非線形最小二乗最適化）を含む相対変換（例えば、ローカライゼーションのために用いられる）を決定することがある。一例として、勾配降下技法、たとえば、以下に述べるガウスニュートン技法などが、利用されることがある。

ガウスニュートン技法では、ターゲット多重解像度ボクセル空間６０８の第１のボクセルｉとリファレンス多重解像度ボクセル空間６１０の第２のボクセルｊとの間のマッチング、マッチングされた残差は、次のとおりに計算されることがある。

ただし、

はマッチングされた法線ベクトルであり、μ_i、はボクセルｉの平均であり、λ₀はマッチング共分散行列の最小の固有値である。上に触れているように、マッチング法線ベクトルは、対応するボクセル共分散行列の重み付き和の最小固有ベクトルから計算される。各残差の重み、ｚ_ijは、Ｍ－エスティメータフレームワーク（M-estimator framework）に従って（例えばコーシー損失関数を用いて）再重み付けされる。次に、リファレンスグリッドとターゲットグリッドの間の変換に関して、マッチング誤差ijのヤコビアン

は、次によって与えられる。
J_ij＝［Ｒｎ_ij ｘμ_j×Ｒｎ_ij］^T
次に、多重解像度ボクセル空間アライメントコンポーネント６１２は、各マッチングｉｊに対して、全勾配と近似のヘシアンとを次のとおりに計算することがある。

ガウスニュートン最適化は、次のとおりに計算される。
ＨδＴ＝－ｇ
さらに、多重解像度ボクセル空間アライメントコンポーネント６１２は、ＳＯ（３）×Ｒ³の要素としてモデリングすることによって、デルタ変換を計算することがあり、更新されたアライメント変換は、次によって与えられる。
ｘⁿ⁺¹＝［ｅｘｐ（δＲ）Ｒⁿ δｐ＋ｐⁿ］^T
ただし、ｅｘｐ（）は、ＳＯ（３）指数写像である。上に与えられた変換が、最適化のさらなるイテレーションにおいて多重解像度ボクセル空間全体に適用されることがあり、最後のイテレーションが、２つのボクセル空間の間の変換を含むことがあることは、理解されるべきである。

アライメント処理は、２つの多重解像度ボクセル空間６０８および６１０が許容誤差またはしきい値内にアライメントされるまで、またはイテレーション（例えば、ボクセルマージ）の予め決められた数が完了するまで、ターゲット多重解像度ボクセル空間６０８の各調整の後、イテレーションを続けることがある。このように、アライメントの間、より粗い解像度（例えば、より大きなボクセルに対応する解像度）は、より細かい解像度が、許容誤差またはしきい値を越えてマッチングをすることを開始し、アライメント処理を完了することができるように、２つの多重解像度ボクセル空間６０８および６１０をより近いアライメントに至らせるより前のマッチングに帰着することがある。しかしながら、いくつかの実装では、動作は、種々のボクセル空間のいくつかまたはすべてをアライメントさせるように決定される単一のデータ変換により、実質的に同時にすべての層および／またはセマンティッククラスにわたって行われることがある。

１つの特有の例では、多重解像度ボクセル空間アライメントコンポーネント６１２は、追加のイテレーションより前にアライメントを初期化するために、第１のイテレーションにおいて各セマンティック層の最も高いまたは最も粗い解像度のみを利用することがある。場合によっては、各々の追加のイテレーションは、アライメント処理に対して別のより細かい解像度を導入することがある。完全にアライメントされた多重解像度ボクセル空間６１４は、次に、多重解像度ボクセル空間アライメントコンポーネント６１２によって出力され、次のリファレンス多重解像度ボクセル空間６１０として用いられることがある。

図７は、本明細書に説明されている多重解像度ボクセル空間の構成に関連付けられた例示的な処理７００を例示する例示的なフロー図である。上に述べている、多重解像度ボクセル空間は、異なる解像度または物理的距離にて物理環境を表す複数のボクセルグリッドまたはボクセル層を含むことがある。例として、各ボクセル層は、進行している層の２倍の解像度（例えば、１フィート、２フィート、４フィートなど）にて物理環境を表すことがある。場合によっては、多重解像度ボクセル空間は、複数のセマンティック層に分離されることがあり、各セマンティック層は、異なる解像度の複数のボクセルグリッドを含む。

７０２において、多重解像度ボクセル空間生成コンポーネントは、物理環境を表すデータを受信することがある。例えば、多重解像度ボクセル空間は、たとえば、ライダーシステムの出力など、物理環境を表すデータ点から生成されることがある。他の例では、データは、レーダー、ソナー、赤外線、カメラ、または他の画像／データキャプチャデバイスの出力を含むことがある。いくつかの例では、多重解像度ボクセル空間生成コンポーネントは、各データ点にセマンティッククラスを割り当てることがある。例として、１つの特定の例では、データ点へのセマンティッククラスの割り当ては、全体として本明細書に参照により組み入れられる米国出願シリアル番号１５／８２０，２４５に述べられる。

７０４において、多重解像度ボクセル空間生成コンポーネントは、物理環境を表すデータからセマンティック点群（semantic point cloud）を生成する。例えば、多重解像度ボクセル空間生成コンポーネントは、物理環境を表すデータから共通フレームにデータ点を投影することがある。

例として、多重解像度ボクセル空間生成コンポーネントまたは別のコンポーネントは、データ点に分類および／またはセグメンテーション技法を適用して、マンティッククラスを割り当てることがある。いくつかの例では、１つまたは複数のニューラルネットワーク（例えば、ディープニューラルネットワーク、畳み込みニューラルネットワークなど）、回帰技法などは、データ点をセマンティッククラスにより識別しおよび分類するのに用いられることがある。場合によっては、セマンティッククラスは、たとえば、車両、歩行者、サイクリスト、動物、建物、木、路面、縁石、歩道、不明などのクラスまたはエンティティタイプを含むことがある。

７０６において、多重解像度ボクセル空間生成コンポーネントは、多重解像度ボクセル空間の第１の解像度に対して、セマンティッククラスごとのボクセルコバリアンスグリッドを生成することがある。いくつかの例では、多重解像度ボクセル空間生成コンポーネントは、データ点を、多重解像度ボクセル空間のマッチしているセマンティック層の対応するボクセルに割り当てて、第１の解像度のグリッドの各々を生成することがある。データ点がセマンティック層のボクセルに割り当てられると、多重解像度ボクセル空間生成コンポーネントは、たとえば、各ボクセルに対する平均および共分散など、ボクセル空間統計を決定することがある。場合によっては、多重解像度ボクセル空間生成コンポーネントは、多重解像度ボクセル空間を形成するとき、最も細かい解像度の層より開始し、そして、各々の次のより粗い層を生成することがある。

７０８において、多重解像度ボクセル空間生成コンポーネントは、生成する追加の解像度があるかどうかを決定する。例えば、多重解像度ボクセル空間生成コンポーネントは、解像度が解像度しきい値より大きいかどうか、および／または、層数が層しきい値より大きいかどうかを決定することがある。追加の解像度があるならば、処理７００は７１０に進む。しかしながら、生成する追加の解像度がないならば、処理７００は７１２に進む。

７１０において、多重解像度ボクセル空間生成コンポーネントは、次のより高い解像度に対して、セマンティッククラスごとのボクセルコバリアンスグリッドを生成することがある。各々のより高い解像度のグリッドは、より低いグリッドのボクセルをマージすることによって、より低い解像度のグリッドに少なくとも一部に基づいて形成されることがある。例として、多重解像度ボクセル空間生成コンポーネントは、セマンティック層内のより低い解像度グリッドからボクセルの近傍（たとえば２ｘ２ｘ２グループなど）を取り、近傍内のボクセルの各々から個々の分布（例えば、ガウス分布）の重み付き和を計算して、単一のより高い解像度ボクセルを生成することがある。このように、各々のより高い解像度は、より低い解像度のグリッドよりも少ないボクセルを有し、多重解像度ボクセル空間は、多重解像度ボクセルピラミッドを形成することがある。

７１２において、多重解像度ボクセル空間生成コンポーネントは、結果の多重解像度ボクセル空間を平滑化することがある。例えば、多重解像度ボクセル空間生成コンポーネントは、多重解像度ボクセル空間のボクセルをガウスカーネルにより畳み込み、ボクセルの法線推定（normal estimate）のノイズを減らすことがある。加えて、ライダーが、物理環境を表すデータを収集するのに用いられるとき、多重解像度ボクセル空間生成コンポーネントは、これらのデータ点が、誤って決定された法線と不十分な統計情報とを有することがあるので、しきい値未満の観測に対応するとき（例えば、単一のライダービームが観測される場合）、ボクセルを取り除くことがある。

７１４において、多重解像度ボクセル空間生成コンポーネントは、最大の重みより大きい重みを有するボクセルを最大の重みに減らし、最小の重みより小さい重みを有するボクセルを取り除くことがある。場合によっては、ボクセルに最大および最小の重み範囲を適用することによって、多重解像度ボクセル空間は、より均一なサンプル密度を維持し、システム（例えば、自律車両）に近いボクセルが、図８に関して以下に述べるアライメント処理に崩壊を引き起こすことを防ぐことがある。他の例では、多重解像度ボクセル空間は、３次元空間内の各ボクセルのロケーションのハッシュとして格納され、次に、ハッシュにインデックスを付け、迅速なメモリーアクセスを提供する（例えば、ボクセルハッシング（voxel hashing）を用いて）ルックアップテーブルを含むことがある。このように、多重解像度ボクセル空間の望ましい部分のみがメモリーにロードされ、多重解像度ボクセル空間をアクセスすることは、より少ない処理リソースを用いて行われることがある。

図８は、本明細書に説明されているターゲット多重解像度ボクセル空間をリファレンス多重解像度ボクセル空間とアライメントすることについての例示的な処理８００を例示する別のフロー図である。例として、上に述べている、多重解像度ボクセル空間アライメントコンポーネントは、多重解像度ボクセル空間構造を利用して、たとえば、ターゲット多重解像度ボクセル空間およびリファレンス多重解像度ボクセル空間など、物理環境の複数のスキャンをアライメントすることがある。例として、多重解像度ボクセル空間（例えば、ターゲット多重解像度ボクセル空間）、が物理環境を表す特有のスキャンまたはデータセットに対して生成されると、多重解像度ボクセル空間アライメントコンポーネントは、多重解像度ボクセル空間を、シーンを表す多重解像度ボクセル空間（例えば、リファレンス多重解像度ボクセル空間）とアライメントすることがある。

８０２において、多重解像度ボクセル空間アライメントコンポーネントは、シーンを表すリファレンス多重解像度ボクセル空間とアライメントされるターゲット多重解像度ボクセル空間を受信することがある。場合によっては、リファレンス多重解像度ボクセル空間は、システムによって維持され、環境の各々の新しいスキャンにより更新されて、物体検出およびトラッキングを前もって決めることがある。

８０４において、多重解像度ボクセル空間アライメントコンポーネントは、ターゲット多重解像度ボクセル空間とリファレンス多重解像度ボクセル空間との間のボクセル対応（voxel correspondence）を決定することがある。いくつかの例では、対応は、セマンティック層ごと、および解像度ごとであり得る。さらに、対応は、各セマンティック層の各解像度に対して、実質的に同時に決定されることもある。例として、８０４において、多重解像度ボクセル空間アライメントコンポーネントは、ターゲット多重解像度ボクセル空間における特有の解像度の各ボクセルに対して、リファレンス多重解像度ボクセル空間の対応する特有の解像度において平均ターゲット点を含むボクセルの２ｘ２ｘ２近傍を検索することがある。次に、多重解像度ボクセル空間アライメントコンポーネントは、ターゲット多重解像度ボクセル空間におけるボクセルに最も近いセントロイドを有する２ｘ２ｘ２近傍からボクセルを選択することがある。

８０６において、多重解像度ボクセル空間アライメントコンポーネントは、対応するボクセルを再重み付けすることがある。例として、多重解像度ボクセル空間アライメントコンポーネントは、２つの対応するボクセル（例えば、ターゲットボクセル、および選択されたボクセル）に含まれるデータの重み付き平均を計算することがある。例として、組み合わされた共分散が計算されることがある。集約した共分散が決定されると、多重解像度ボクセル空間アライメントコンポーネントは、２つの対応するボクセルの組み合わされた共分散行列に主成分分析（固有値分解など）を行い、最小の固有値を、マッチングした法線ベクトルとして選択することがある。各ボクセルに対する残差（または誤差）は、マッチングされた法線ベクトルおよび／または対応するボクセルの平均（またはセントロイド）の差に比例して計算されることがあり、２つのフレーム間の変換にわたる最適化は、残差を最小化するように行われることがある。このように、アライメントの間、より粗い解像度（例えば、より大きなボクセルに対応する解像度）は、より細かい解像度より前のマッチングに帰着することがある。このように、より粗い解像度におけるマッチングは、より細かい解像度が、図６に関して上に述べているマッチングをすることを開始し、アライメント処理を完了することができるように、２つの多重解像度ボクセル空間を、より近いアライメントに至らせる。

８０８において、多重解像度ボクセル空間アライメントコンポーネントは、イテレーションの数が完了したかどうかを決定することがある。例えば、システムは、アライメント処理のイテレーションの最大数を含み、２つの多重解像度ボクセル空間をアライメントすることに関連付けられた処理時間の上限を定める、または制限をすることがある。イテレーションの数が完了したならば、処理８００は８１２に進み、そうでなければ、処理８００は８１０に進行する。

８１０において、多重解像度ボクセル空間アライメントコンポーネントは、組み合わされた多重解像度ボクセル空間についての再重み付き平均が許容誤差しきい値より下であるかどうかを決定することがある。再重み付き平均が許容誤差しきい値より下であるならば、処理８００は８１２に進み、そうでなければ、処理８００は８０４に戻る。システムは、２つの多重解像度ボクセル空間が、特有の使用に対してどれぐらい十分にアライメントされるべきかという要件を設定する許容誤差を含むことがある。例として、いくつかのアプリケーションでは、物理環境の粗い理解のみが必要とされる一方、たとえば自律車両などの他の場合、より正確な詳細な理解が必要とされることがある。

８１２において、多重解像度ボクセル空間アライメントコンポーネントは、ターゲット多重解像度ボクセル空間とリファレンス多重解像度ボクセル空間とのアライメントにおける不確かさの量を減らすおよび／または決定することがある。例えば、最適化（例えば、上記の非線形最適化）の後、多重解像度ボクセル空間アライメントコンポーネントは、アライメントされたボクセルに測定ノイズを伝搬することがある。以下により詳細に議論される１つの特定の例では、多重解像度ボクセル空間アライメントコンポーネントは、零平均および零共分散を有するガウス分布に従ってアライメントの不確かさのモデルを決定することがある。例として、多重解像度ボクセル空間アライメントコンポーネントは、各ステップが次のとおりに計算されるように、正規確率変数ｘ～Ｎ（μ_x，Σ_x）をモデリングすることがある。
ｘ＝Ｃｚ
ただし、Ｃ＝（Ｊ^TＷＪ）^―1Ｊ^TＷ（ＪおよびＷは決定された同一のヤコビアンおよび重みを表し、Ｃは重み付き擬ハミルトニアンを表す）、ｚ～Ｎ（０，δ_z ²Ｉ）は残差である。

次に、ｘの共分散は、残差ノイズを伝搬させ、次のとおりに展開することによって決定されることがある。
Σ_x＝ＣΣ_zＣ^T
Σ_x＝（Ｊ^TＷＪ）^―1Ｊ^Tσ_z ²Ｗ²J（Ｊ^TＷＪ）^―1
場合によっては、残差ノイズは、インクリメントに計算され、次に、行列Ｊ^TＷＪおよびσ_z ²Ｊ^TＷ²Ｊは、各ボクセルに対して集められることがある。１つの特有の例では、さらに、多重解像度ボクセル空間アライメントコンポーネントは、各残差

の等方性の分散を導出することもあり、各ボクセルの平均は、

に従って分布され、ただし、σ_p ²は、各点観測における等方性のガウス雑音であり、Ｗ_iは、ボクセルの重みである。次に、残差の共分散は、次のとおりに計算されることがある。
σ_z ²Ｉ＝Ｅ［ｚｚ^T］
Ｅ［ｚｚ^T］を含む項は、ボクセル平均について仮定される独立のために零になる。ゆえに、

ただし、

次に、多重解像度ボクセル空間アライメントコンポーネントは、外れ値の名目上の数から仮定される寄与を加えることによって、および、対角を最小値にクランピングするまたは制限することによって、結果の共分散行列をさらに正則化することもある。

８１４において、多重解像度ボクセル空間アライメントコンポーネントは、アライメントされた多重解像度ボクセル空間（測定不確実さを含むことがある）を出力することがある。例として、アライメントされた多重解像度ボクセル空間は、たとえば、自律車両のプランニングシステムまたはパーセプションシステムなど、別のシステムに提供されることがある。他の場合、アライメントされた多重解像度ボクセル空間は、１つまたは複数のネットワークを介して、たとえばクラウドベースのコンピューティングシステムなど、リモートシステムまたはリモートデバイスに送られることがある。他の例では、多重解像度ボクセル空間アライメントコンポーネントは、物理環境に関して、車両の位置に関連付けられたターゲット多重解像度ボクセル空間とリファレンス多重解像度ボクセル空間との間のローカリゼーションデータまたは変換データを出力することがある。いくつかの例では、リファレンス多重解像度ボクセル空間は、クラウドベースのコンピューティングシステムによって予め生成され、車両が進み始めるより前に車両に送られることがある。場合によっては、クラウドベースシステムｍａは、複数の車両から、動作の間、収集されたデータ（例えば、マージターゲット多重解像度ボクセル空間（merge target multi-resolution voxel space））を用いて、リファレンス多重解像度ボクセル空間を更新する。さらに、いくつかの例では、車両は、オフラインのやり方にて（例えば、駐車されたとき、ないしは別のやり方により機敏に進む状況でないなど）リファレンス多重解像度ボクセル空間を更新するように装備されることがある。

図９は、本開示の態様にしたがって、本明細書に説明される技法を実装するための例示的なシステムを例示する。いくつかの例では、システムは、図１～８を参照して本明細書に説明される態様の１つまたは複数の特徴、処理リソース、構成要素、および／または機能性を含むことがある。上に述べている、いくつかの態様では、システムは、自律車両を含むことがある。

図９は、本明細書に説明されている多重解像度ボクセル空間アライメントシステムを実装するための例示的なシステム９００のブロック図である。今述べた態様では、システム９００は、車両コンピューティングデバイス９０４、１つまたは複数のセンサーシステム９０６、１つまたは複数の通信接続９０８、および１つまたは複数のドライブシステム９１０１０を含むことがある車両９０２である。

車両コンピューティングデバイス９０４は、１つまたは複数のプロセッサー９１２（または処理リソース）と、１つまたは複数のプロセッサー９１２と通信接続されたコンピューター読取り可能媒体９１４とを含むことがある。例示される例では、車両９０２は、自律車両であるが、しかしながら、車両９０２は、どんな他の種類の車両でも、またはどんな他のシステム（例えば、ロボティックシステム、カメラ可能スマートフォンなど）でもあることが可能だろう。例示される例では、車両コンピューティングデバイス９０４のコンピューター読取り可能媒体９１４は、多重解像度ボクセル空間生成コンポーネント９１６、多重解像度ボクセル空間アライメントコンポーネント９１８、プランニングコンポーネント９２０、パーセプションコンポーネント９２２を、自律車両に関連付けられた他のシステムも同様に、格納する。さらに、コンピューター読取り可能媒体９１４は、センサーデータ９２４および多重解像度ボクセル空間９２６を格納することもある。いくつかの実装では、システムが、コンピューター読取り可能媒体に格納されたデータも同様に、加えてまたは代わりに、車両９０２にアクセス可能であり得る（例えば、車両９０２から離れた他のコンピューター読取り可能媒体に格納される、ないしは別のやり方によりアクセス可能である）ことは、理解されるべきである。

多重解像度ボクセル空間生成コンポーネント９１６は、たとえば、ライダーシステムの出力など、物理環境を表すデータ点から多重解像度ボクセル空間を生成することがある。場合によっては、多重解像度ボクセル空間生成コンポーネント９１６は、複数のライダーポイント、または点群として表されるライダーデータを受信することがある。多重解像度ボクセル空間生成コンポーネント９１６は、ライダーポイントを、第１のベース解像度のボクセルグリッドのボクセルに割り当てることがある。次に、多重解像度ボクセル空間生成コンポーネント９１６は、より高いレベルのボクセルグリッドを生成するとき、より低い解像度のグリッドのボクセルをマージすることがある。例えば、多重解像度ボクセル空間生成コンポーネント９１６は次のより高いレベルのボクセルグリッドを形成するとき、より低い解像度のグリッドにおける近傍（たとえば、２ｘ２ｘ２近傍など）内のボクセルをマージすることがある。

１つの特有の例では、多重解像度ボクセル空間生成コンポーネント１０１６は、ブロックに、メモリー内にて動かされるまたは再配置されることを可能にするオフセットとして実装されたポインタを有するコリジョンフリーのハッシュテーブルを介してアクセス可能なメモリーのマッピング可能な連続ブロックとして多重解像度ボクセル空間を生成することがある。場合によっては、メモリーブロックは、ヘッダ、インデックス（例えば、ハッシュテーブル）、およびボクセルアレイを有するタイルとして表されることがある。インデックスは、層および／または解像度によって分離されることがある。ボクセルアレイは、単一のアレイ、または解像度によって配置される複数のアレイ（例えば、第１のセマンティック層の第１の解像度のグリッド、第２のセマンティック層の第１の解像度のグリッド、第３セマンティック層の第１の解像度のグリッド、．．．）を含むことがある。ボクセルアレイにおいて、各エレメントは、ボクセルと、ボクセルの空間位置のキーとであり得る。場合によっては、ヘッダは、スタック識別子、バージョン数、解像度の数、セマンティックラベルの数、層の総数、オフセットなどを含むことがある。インデックスは、ハッシュ値をメモリーブロック内のオフセットに関係させるスパースハッシュテーブル（sparse hash table）であり得る。さらに、インデックスは、今述べた特有のテーブルに対する入力をソルトするのに用いられるソルト値と、モジュラス計算の第１のラウンドに用いられる素数値とを含むこともある。

いくつかの例では、多重解像度ボクセル空間アライメントコンポーネント１０１８は、２つの多重解像度ボクセル空間（例えば、ターゲット多重解像度ボクセル空間およびリファレンス多重解像度ボクセル空間）をアライメントすることがある。場合によっては、多重解像度ボクセル空間アライメントコンポーネント９１８は、リファレンス多重解像度ボクセル空間およびターゲット多重解像度ボクセル空間のボクセル間の対応を見つけることがある。多重解像度ボクセル空間アライメントコンポーネント９１８は、ターゲット多重解像度ボクセル空間における特有の解像度の各ボクセルに対して、リファレンス多重解像度ボクセル空間の対応する特有の解像度にて平均ターゲット点を含むボクセルの３次元（例えば、２ｘ２ｘ２、３ｘ３ｘ３、５ｘ５ｘ５など）近傍を検索することによって、対応を見つけることがある。近傍内の識別されたボクセルのうち、多重解像度ボクセル空間アライメントコンポーネント９１８は、ターゲット多重解像度ボクセル空間のボクセルに近いセントロイドを有するボクセルを選択することがある。次に、多重解像度ボクセル空間アライメントコンポーネント９１８は、リファレンス多重解像度ボクセル空間における選択されたボクセルの分布を、ターゲット共分散スタック（target covariance stack）のボクセルにより平均することがある。次に、多重解像度ボクセル空間アライメントコンポーネント１０１８は、組み合わされた共分散行列に主成分分析を行い、最小の固有値を、２つのボクセルに対してマッチングされた法線ベクトルとして選択することがある。

プランニングコンポーネント９２０は、物理環境を通過して横切るために従う車両９０２に対してパスを決定することがある。例えば、プランニングコンポーネント９２０は、種々のルートおよび軌道および種々の詳細レベルを決定することがある。例えば、プランニングコンポーネント９２０は、現在ロケーションから目標ロケーションまでの移動経路を決定することがある。本解説の目的のために、ルートは、２つのロケーション間を進むためのウェイポイントのシーケンスであり得る。

いくつかの実装では、プレディクションコンポーネント９２２は、多重解像度ボクセル空間生成コンポーネント９１６および多重解像度ボクセル空間アライメントコンポーネント９１８によって出力された多重解像度ボクセル空間９２６に少なくとも部分的に基づいて、たとえば、姿勢、速さ、軌道、速度、ヨー、ヨー率、ロール、ロール率、ピッチ、ピッチ率、位置、加速度、または他の特性など、オブジェクト（例えば、車両、歩行者、動物など）の現在を推定する、および／または将来、特性、または状態を予測するように構成されることがある。

さらに、車両９０２は、車両９０２と、他のローカルまたはリモートのコンピューティングデバイス（複数可）との間の通信を可能にする通信接続（複数可）９０８を含むことも可能である。例として、通信接続（複数可）９０８は、車両９０２の他のローカルコンピューティングデバイス（複数可）との、および／またはドライブシステム（複数可）９１０との通信を容易にすることがある。さらに、通信接続（複数可）９０８は、車両９０２が、他の近くのコンピュータデバイス（複数可）（たとえば、他の近くの車両、交通信号機など）と通信できるようにすることもある。さらに、通信接続（複数可）９０８は、車両９０２に、リモート遠隔操作コンピューティングデバイス、または他のリモートサービスと通信できるようにもする。

通信接続（複数可）９０８は、車両コンピューティングデバイス９０４を、別のコンピューティングデバイス（例えば、コンピューティングデバイス（複数可）９３０）に、および／またはネットワークたとえばネットワーク（複数可）９２８などに接続するための物理および／または論理インターフェースを含むことがある。例えば、通信接続（複数可）９０８は、たとえば、ＩＥＥＥ８０２．１１規格によって定義された周波数、たとえばＢＬＵＥＴＯＯＴＨ（登録商標）などのショートレンジのワイヤレス周波数、セルラー通信（例えば２Ｇ、３Ｇ、４Ｇ、４ＧＬＴＥ、５Ｇなど）、またはそれぞれのコンピューティングデバイスに他のコンピューティングデバイス（複数可）とインターフェースできるようにするどんな適切なワイヤードもしくはワイヤレスの通信プロトコルでも介してなど、Ｗｉ－Ｆｉベースの通信を可能にすることがある。いくつかの例では、車両９０２の通信接続９０８は、多重解像度ボクセル空間９２６をコンピューティングデバイス（複数可）９３０に送信するまたは送ることがある。

少なくとも１つの例にて、センサーシステム（複数可）９０６は、ライダーセンサー、レーダーセンサー、超音波トランスデューサー、ソナーセンサー、ロケーションセンサー（例えば、ＧＰＳ、方位磁針など）、慣性センサー（例えば、慣性測定ユニット（ＩＭＵ）、加速度計、磁力計、ジャイロスコープなど）、カメラ（例えば、ＲＧＢ、ＩＲ、強度、深度、タイムオブフライトなど）、マイクロフォン、ホイールエンコーダー、環境センサー（例えば、温度センサー、湿度センサー、光センサー、圧力センサーなど）、および１つまたは複数のタイムオブフライト（time of flight：ＴｏＦ）センサーなどを含むことが可能である。センサーシステム（複数可）９０６は、今述べたまたは他の種類のセンサーの各々に関する複数のインスタンスを含むことが可能である。例として、ライダーセンサーは、車両９０２の角、前面、後面、側面、および／または上面に位置される個々のライダーセンサーを含むことがある。別の例として、カメラセンサーは、車両９０２の外部および／または内部のあちこちに、種々のロケーションに配置された複数のカメラを含むことが可能である。センサーシステム（複数可）９０６は、入力を、車両コンピューティングデバイス９０４に提供することがある。加えて、または代わりに、センサーシステム（複数可）９０６は、１つまたは複数のネットワーク９２８を介して、センサーデータを、特有の周波数において、予め決められた一定の時間が経つと、ほぼリアルタイムにおいてなど、１つまたは複数のコンピューティングデバイス（複数可）９３０に送ることが可能である。

少なくとも１つの例にて、車両９０２は、１つまたは複数のドライブシステム９１０を含むことが可能である。いくつかの例では、車両９０２は、単一のドライブモジュール９１０を有することがある。少なくとも１つの例にて、車両９０２が複数のドライブシステム９１０を有するならば、個々のドライブシステム９１０は、車両９０２の向き合う端部（例えば、前方および後方など）に置かれることが可能である。少なくとも１つの例にて、ドライブシステム（複数可）９１０は、上に述べている、ドライブシステム（複数可）９１０の状態を、および／または車両９０２の周囲の状態を検出する１つまたは複数のセンサーシステム９０６を含むことが可能である。例および非限定として、センサーシステム（複数可）９０６は、ドライブモジュールの車輪の回転を感知する１つまたは複数のホイールエンコーダー（たとえば、ロータリーエンコーダー）、ドライブシステムの向きおよび加速度を測定する慣性センサー（たとえば、慣性測定ユニット、加速度計、ジャイロスコープ、磁力計など）、カメラまたは他の画像センサー、ドライブシステムの周囲のオブジェクトを聴覚的に検出する超音波センサー、ライダーセンサー、レーダーセンサーなどを含むことが可能である。いくつかのセンサー、たとえばホイールエンコーダーなどは、ドライブシステム（複数可）９１０に一意的であり得る。場合によっては、ドライブシステム（複数可）９１０におけるセンサーシステム（複数可）９０６は、車両９０２の対応するシステムに重なるまたは対応するシステムを補うことが可能である。

少なくとも１つの例にて、本明細書に述べられる構成要素は、上に説明されるようにセンサーデータ９２４を処理することができ、１つまたは複数のネットワーク（複数可）９２８を介して、それぞれの出力を１つまたは複数のコンピューティングデバイス（複数可）９３０に送ることがある。少なくとも１つの例にて、本明細書に述べられるコンポーネントは、それらのそれぞれの出力を、特定の周波数において、予め決められた一定の時間が経つと、ほぼリアルタイムにおいてなど、１つまたは複数のコンピューティングデバイス（複数可）９３０に送ることがある。

いくつかの例では、車両９０２は、ネットワーク（複数可）９２８を介して１つまたは複数のコンピューティングデバイス（複数可）９３０にセンサーデータを送ることが可能である。いくつかの例では、車両９０２は、生のセンサーデータ９２４または処理された多重解像度ボクセル空間９２６をコンピューティングデバイス（複数可）９３０に送ることが可能である。他の例では、車両９０２は、処理されたセンサーデータ９２４および／またはセンサーデータの表現（例として、物体パーセプショントラック（object perception track））をコンピューティングデバイス（複数可）９３０に送ることが可能である。いくつかの例では、車両９０２は、センサーデータ９２４を、特有の周波数において、予め決められた一定の時間が経つと、ほぼリアルタイムにおいてなど、コンピューティングデバイス（複数可）９３０に送ることが可能である。場合によっては、車両９０２は、（生のまたは処理された）センサーデータをコンピューティングデバイス（複数可）９３０に送ることが可能である。

コンピューティングシステム（複数可）９３０は、プロセッサー（複数可）９３２と、多重解像度ボクセル空間生成コンポーネント９３６、多重解像度ボクセル空間アライメントコンポーネント９３８を、車両９０２から受信されるセンサーデータ９４０および多重解像度ボクセル空間９４２も同様に、格納するコンピューター読取り可能媒体９３４とを含むことがある。いくつかの例では、多重解像度ボクセル空間生成コンポーネント９３６および多重解像度ボクセル空間アライメントコンポーネント９３８は、多重解像度ボクセル空間９４２を生成して、または複数の車両９０２によってキャプチャされたデータから生成された多重解像度ボクセル空間９４２をアライメントして、種々の物理環境のより完全なシーンを形成する、および／または信号拡張物理環境としていっしょに種々のシーンを接続するように構成されることがある。場合によっては、多重解像度ボクセル空間生成コンポーネント９３６および／または多重解像度ボクセル空間アライメントコンポーネント９３８は、機械学習および／または将来のコードテストのために用いられることがあるセンサーデータ９２４からの１つまたは複数のモデルを生成するように構成されることがある。

車両９０２のプロセッサー（複数可）９１２およびコンピューティングデバイス（複数可）９３０のプロセッサー（複数可）９３２は、本明細書に説明されているデータを処理し、動作を行う命令を実行する性能があるどんな適切なプロセッサーでもあり得る。例および非限定として、プロセッサー（複数可）９１２および９３２は、１つまたは複数のＣＰＵ（中央処理装置）、ＧＰＵ（Graphics Processing Unit）、または電子データを処理して、その電子データを、レジスターおよび／もしくはコンピューター読取り可能媒体に格納されることが可能である他の電子データに変換するどんな他のデバイスもしくはデバイスの部分でも含むことが可能である。いくつかの例では、さらに、集積回路（例えば、ＡＳＩＣなど）、ゲートアレイ（例えば、ＦＰＧＡなど）、および他のハードウェアデバイスは、エンコードされた命令を実装するように構成される限り、考慮されるプロセッサーであることも可能である。

コンピューター読取り可能媒体９１４および９３４は、非一時的なコンピューター読取り可能媒体の例である。コンピューター読取り可能媒体９１４および９３４は、本明細書に説明される方法と、種々のシステムに帰する機能とを実装するためのオペレーティングシステムおよび１つまたは複数のソフトウェアアプリケーション、命令、プログラム、および／またはデータを格納することが可能である。種々の実装において、コンピューター読取り可能媒体は、どんな適切なコンピューター読取り可能媒体技術でも、例えば、ＳＲＡＭ（スタティックＲＡＭ）、ＳＤＲＡＭ（シンクロナスＤＲＡＭ）、不揮発性／フラッシュ型メモリー、または情報を格納する性能があるどんな他のタイプのメモリーでも用いて実装されることが可能である。本明細書に説明されるアーキテクチャ、システム、および個々の要素は、多くの他の論理的な、プログラム的な、および物理的なコンポーネントを含むことが可能であり、添付の図面に示されるそれらは、本明細書の説明に関係する単なる例である。

理解されることが可能であるように、本明細書に述べられる構成要素は、例示の目的のために区分されているとして説明される。しかしながら、種々の構成要素によって行われる動作は、どんな他の構成要素にでも組み合わされるまたは行われることが可能である。

図９が分散システムとして例示される一方、代替えの例では、車両９０２のコンポーネントがコンピューティングデバイス（複数可）９３０に関連付けられることが可能であること、および／または、コンピューティングデバイス（複数可）９３０のコンポーネントが車両９０２に関連付けられることが可能であることは特筆されるべきである。すなわち、車両９０２は、コンピューティングデバイス（複数可）９３０に関連付けられた１つまたは複数の機能を行い、逆もまた同様であることが可能である。

図１０は、本明細書に説明されている、たとえばキャプチャされたデータの点群表現１００８と比較した図２～４の多重解像度ボクセル空間２０８など、多重解像度ボクセル空間の例についての絵入りの図１０００である。例示されている多重解像度ボクセル空間２０８および点群表現１００８の両方は、実世界の物理的なロケーションまたは空間に対応する。

例示的な箇条
Ａ．ライダーセンサーと、１つまたは複数のプロセッサーと、１つまたは複数のプロセッサーによって実行可能な命令を格納する１つまたは複数の非一時的なコンピューター読取り可能媒体とを含み、命令は、実行されると、システムに、ライダーセンサーから物理環境を表すデータを受信することと、データの第１の部分に関連付けられた第１のセマンティッククラスを決定することと、データの第２の部分に関連付けられた第２のセマンティッククラスを決定することと、データの第１の部分を第１のボクセルグリッドの第１のボクセルのボクセルに関連付け、第１のボクセルグリッドがターゲット多重解像度ボクセル空間の第１のセマンティック層に関連付けられることと、データの第２の部分を第２のボクセルグリッドの第２のボクセルのボクセルに関連付け、第２のボクセルグリッドがターゲット多重解像度ボクセル空間の第２のセマンティック層に関連付けられ、第１のボクセルグリッドおよび第２のボクセルグリッドが第１の解像度に関連付けられることと、第１のボクセルグリッドの隣り合ったボクセルの第１のセットをマージして、第１のセマンティック層に関連付けられた第３のボクセルグリッドのボクセルを形成し、第３のボクセルグリッドが第１の解像度よりも低い第２の解像度に関連付けられることと、第２のボクセルグリッドの隣り合ったボクセルの第２のセットをマージして、第２のセマンティック層に関連付けられた第４のボクセルグリッドのボクセルを形成し、第４のボクセルグリッドが第２の解像度に関連付けられることとを含む動作を行わせる、システム。

Ｂ．動作は、第３のボクセルグリッドの隣り合ったボクセルの第３のセットをマージして、第１のセマンティック層に関連付けられた第５のボクセルグリッドのボクセルを形成し、第５のボクセルグリッドが第２の解像度よりも低い第３の解像度を有することと、第４のボクセルグリッドの隣り合ったボクセルの第４のセットをマージして、第２のセマンティック層に関連付けられた第６のボクセルグリッドのボクセルを形成し、第６のボクセルグリッドが第３の解像度を有することとをさらに含む、項Ａのシステム。

Ｃ．データの第１の部分を関連付けることは、データの第１の部分の観測の数が観測のしきい値数以上であると決定することと、データの第１の部分の平均値を決定することと、データの第１の部分の共分散を決定することと、平均および共分散を第１のボクセルに関連付けることとを含む、項Ａのシステム。

Ｄ．動作は、リファレンス多重解像度ボクセル空間を受信することと、ターゲット多重解像度ボクセル空間のターゲットボクセルとリファレンス多重解像度ボクセル空間のリファレンスボクセル（reference voxel）との間のボクセル対応（voxel correspondence）を決定し、ターゲットボクセルおよびリファレンスボクセルが同一の解像度を含むことと、ターゲットボクセルおよびリファレンスボクセルを表す組み合わされたボクセルの重み付き統計量を決定することと、重み付き平均共分散に少なくとも部分的に基づいてリファレンス多重解像度ボクセル空間とターゲット多重解像度ボクセル空間との間の変換を決定することと、変換に少なくとも部分的に基づいて自律車両を制御することとをさらに含む、項Ｃのシステム。

Ｅ．センサーからセンサーデータを受信することと、センサーデータの少なくとも第１の部分を多重解像度ボクセル空間の第１のボクセルグリッドの第１のボクセルに関連付け、第１のボクセルが第１のセマンティック分類（semantic classification）および第１の解像度に関連付けられることと、センサーデータの少なくとも第２の部分を多重解像度ボクセル空間の第２のボクセルグリッドの第２のボクセルに関連付け、第２のボクセルが第１のセマンティック分類および第１の解像度に関連付けられることと、第１のボクセルおよび第２のボクセルに少なくとも部分的に基づいて、第１の解像度よりも低い第２の解像度に関連付けられた第３のボクセルを決定し、第３のボクセルが第１のセマンティック分類に関連付けられることと、多重解像度ボクセル空間に少なくとも部分的に基づいて自律車両を制御することとを含む、方法。

Ｆ．データの第１の部分に関連付けられた第１のセマンティック分類を決定することと、データの第３の部分に関連付けられた第２のセマンティック分類を決定することと、第２のセマンティック分類に少なくとも部分的に基づいて、データの第３の部分を多重解像度ボクセル空間の第３のボクセルに関連付けることとをさらに含む、項Ｅの方法。

Ｇ．データの第１の部分を関連付けることは、データの第１の部分の第１の平均値を決定することと、データの第１の部分の第１の共分散を決定することと、第１の平均および第１の共分散を第１のボクセルに関連付けることと、データの第２の部分の第２の平均値を決定することと、データの第２の部分の第２の共分散を決定することと、第２の平均および第２の共分散を第２のボクセルに関連付けることとを含む、項Ｅの方法。

Ｈ．第３のボクセルを決定することは、第１のボクセルの第１の平均および第２のボクセルの第２の平均の重み付き平均を決定することと、第１のボクセルの第１の共分散および第２のボクセルの第２の共分散の重み付き平均を決定することと、第１の平均および第２の平均の重み付き平均と第１の共分散および第２の共分散の重み付き平均とを第３のボクセルに関連付けることを含む、項Ｅの方法。

Ｉ．リファレンス多重解像度ボクセル空間を受信することと、第１のボクセルとリファレンス多重解像度ボクセル空間のリファレンスボクセルとの間のボクセル対応を決定し、リファレンスボクセルが第１の解像度を有することと、第１のボクセルおよびリファレンスボクセルを表す組み合わされたボクセルの重み付き統計量を決定することと、重み付き平均統計量に少なくとも部分的に基づいて多重解像度ボクセル空間とリファレンス多重解像度ボクセル空間との間の変換を決定することとをさらに含み、自律車両を制御することは変換に少なくとも部分的に基づく、項Ｅの方法。

Ｊ．ボクセル対応は、少なくとも、リファレンス多重解像度ボクセル空間に関連付けられた第１のセントロイドと、ターゲット多重解像度ボクセル空間に関連付けられた第２のセントロイドとの間の距離に基づく、項Ｉの方法。

Ｋ．重み付き統計量は、重み付き共分散を含む、項Ｉの方法。

Ｌ．変換を決定することは、アライメントをガウス分布としてモデリングすることに少なくとも部分的に基づいて、測定の不確かさを決定することをさらに含む、項Ｉの方法。

Ｍ．変換を決定することは、第１のボクセルの共分散とリファレンスボクセルの共分散との重み付き平均を決定することと、重み付き平均の最小固有ベクトルを決定することとを含む、項Ｉの方法。

Ｎ．第１のボクセルおよび第２のボクセルは、第１の解像度内にて隣り合う、項Ｅの方法。

Ｏ．実行されると、１つまたは複数のプロセッサーに、車両に関連付けられたセンサーからセンサーデータを受信することと、データの第１の部分をボクセル空間の第１のグリッドの第１のボクセルに関連付け、データの第１の部分が第１のセマンティッククラスを有することと、データの第１の部分に関連付けられた第１の重み付き統計量を決定することと、データの第２の部分をボクセル空間の第１のグリッドの第２のボクセルに関連付けることと、データの第２の部分に関連付けられた第２の重み付き統計量を決定し、データの第２の部分が第１のセマンティッククラスを有することと、第１の重み付き統計量と第２の重み付き統計量とに少なくとも部分的に基づいて、ボクセル空間の第２のグリッドの第３のボクセルに関連付けられた第３の重み付き統計量を決定し、第１のグリッドは、第２のグリッドに関連付けられた第２の解像度よりも少ないボクセルを有する第１の解像度に関連付けられることと、ボクセル空間に少なくとも部分的に基づいて車両を制御することとを含む動作を行わせる命令を格納する非一時的なコンピューター読取り可能媒体。

Ｐ．動作は、データの第１の部分およびデータの第２の部分をボクセル空間の第１のセマンティック層に関連付け、第１のセマンティック層が第１のセマンティッククラスに対応することと、データの第３の部分をボクセル空間の第１のグリッドの第３のボクセルに関連付け、データの第３の部分が第２のセマンティッククラスを有することと、データの第３の部分をボクセル空間の第２のセマンティック層に関連付け、第２のセマンティック層が第２のセマンティッククラスに対応することとを含む、項Ｏの非一時的なコンピューター読取り可能媒体。

Ｑ．第１のセマンティッククラスは、歩行者、車両、建物、動物、または群葉を含む、項Ｏの非一時的なコンピューター読取り可能媒体。

Ｒ．第１の重み付き統計量は、データの第１の部分の第１の平均および第１の共分散を含み、第２の重み付き統計量は、データの第２の部分の第２の平均および第２の共分散を含む、項Ｏの非一時的なコンピューター読取り可能媒体。

Ｓ．第３の重み付き統計量は、第１の平均および第２の平均の重み付き平均を決定することと、第１の共分散および第２の共分散の重み付き平均を決定することと、第１の平均および第２の平均の重み付き平均と第１の共分散および第２の共分散の重み付き平均を第３ボクセルに関連付けることとに少なくとも部分的に基づいて決定される、項Ｏの非一時的なコンピューター読取り可能媒体。

Ｔ．動作は、ボクセル空間および多重解像度ボクセル空間に少なくとも部分的に基づいて、物理環境内の車両のロケーションを決定することをさらに含む、項Ｏの非一時的なコンピューター読取り可能媒体。

Ｕ．１つまたは複数のプロセッサーと、１つまたは複数のプロセッサーによって実行可能な命令を格納する１つまたは複数の非一時的なコンピューター読取り可能媒体とを含み、命令は、実行されると、システムに、データを受信することと、データをターゲット多重解像度ボクセル空間に関連付けることと、リファレンス多重解像度ボクセル空間を受信することと、リファレンス多重解像度ボクセル空間のリファレンスボクセルに関連付けられたターゲット多重解像度ボクセル空間のターゲットボクセルを決定し、ターゲットボクセルおよびリファレンスボクセルが同一の解像度に関連付けられることと、ターゲットボクセルおよびリファレンスボクセルを表す組み合わされたボクセルに関連付けられた重み付き統計値を決定することと、重み付き統計値に少なくとも部分的に基づいて変換を決定することと、変換に少なくとも部分的に基づいて自律車両を制御することとを含む動作を行わせる、システム。

Ｖ．重み付き統計値は、重み付き共分散行列である、項Ｕのシステム。

Ｗ．動作は、重み付き平均共分散行列に主成分分析を行うことと、主成分分析の最小固有ベクトルを決定することとをさらに含み、変換を決定することは、最小固有ベクトルにさらに基づく、項Ｕのシステム。

Ｘ．リファレンス多重解像度ボクセル空間のリファレンスボクセルに関連付けられたターゲット多重解像度ボクセル空間のターゲットボクセルを決定し、ターゲットボクセルおよびリファレンスボクセルを表す組み合わされたボクセルに関連付けられた重み付き統計値を決定することは、ボクセルの複数のペアに対して反復して行われ、ボクセルの個々のペアがターゲット多重解像度ボクセル空間のボクセルおよびリファレンス多重解像度ボクセル空間のボクセルを含む、項Ｕのシステム。

Ｙ．第１のボクセル空間を含むマップデータを受信し、第１のボクセル空間が、第１の解像度に関連付けられた第１の層と、第１の解像度とは異なる第２の解像度に関連付けられた第２の層とを有することと、車両に関連付けられたセンサーからセンサーデータを受信することと、センサーデータを第２のボクセル空間に関連付け、第２のボクセル空間が、第１の解像度に関連付けられた第１の層と第２の解像度に関連付けられた第２の層とを有することとを含むことと、第１のボクセル空間および第２のボクセル空間に少なくとも部分的に基づいて、第１の集約されたボクセルデータを決定することと、第１の集約されたボクセルデータに少なくとも部分的に基づいて、第１のボクセル空間と第２のボクセル空間との間の変換を決定することと、変換に少なくとも部分的に基づいて物理環境における車両のロケーションを決定することとを含む、方法。

Ｚ．第１の集約されたボクセルデータを決定することは、第１のボクセル空間の第１のボクセルに対して、第１のボクセルのセントロイドの指定された距離内のセントロイドを有する第２のボクセル空間のボクセルのセットを識別することと、ボクセルのセットの第２のボクセルを選択し、第２のボクセルが第１のボクセルのセントロイドに最も近いセントロイドを有することと、第１のボクセルの共分散およびリファレンスボクセルの共分散の重み付き平均を決定することとを含む、項Ｙの方法。

ＡＡ．第１のボクセルおよび第２のボクセルは、同一のセマンティッククラスを含む、項Ｚの方法。

ＡＢ．第１の集約されたボクセルデータを決定することは、重み付き平均の最小固有ベクトルを決定することと、最小固有ベクトルに少なくとも部分的に基づいて、第１の集約されたボクセルデータを表す法線ベクトルを決定することとをさらに含む、項Ｚの方法。

ＡＣ．第１の集約されたボクセルデータを再重み付けすることは、ｍ－エスティメータフレームワークを適用することを含む、項ＡＢの方法。

ＡＤ．変換を決定することは、最小固有値に少なくとも部分的に基づいて、残差を決定することと、残差に少なくとも部分的に基づいて、ターゲットボクセル空間とリファレンスボクセル空間との間の回転または平行移動のうちの１つまたは複数を決定することとを含む、項ＡＢの方法。

ＡＥ．分布をモデリングすることに少なくとも部分的に基づいて、アライメントに関連付けられた不確かさを決定することをさらに含む、項ＡＤの方法。

ＡＦ．変換は、第１のボクセル空間と第２のボクセル空間との間の位置または向きのうちの１つまたは複数における差を示す、項Ｚの方法。

ＡＧ．車両は自律車両であり、方法は、物理環境における自律車両のロケーションに少なくとも部分的に基づいて自律車両を制御することをさらに含む、項Ｚの方法。

ＡＨ．実行されると、１つまたは複数のプロセッサーに、ターゲット多重解像度ボクセル空間を受信することと、リファレンス多重解像度ボクセル空間を受信することと、ターゲット多重解像度ボクセル空間の第１のターゲットボクセルがリファレンス多重解像度ボクセル空間の第１のリファレンスボクセルに関連付けられると決定し、第１のターゲットボクセルおよび第１のリファレンスボクセルが第１の解像度を共有することと、第１のターゲットボクセルおよび第１のリファレンスボクセルの第１の重み付き統計量を決定することと、ターゲット多重解像度ボクセル空間の第２のターゲットボクセルがリファレンス多重解像度ボクセル空間の第２のリファレンスボクセルに関連付けられると決定し、第２のターゲットボクセルおよび第２のリファレンスボクセルは、第２の解像度を共有し、第２の解像度が第１の解像度とは異なることと、第２のターゲットボクセルおよび第２のリファレンスボクセルを表す第２の組み合わされたボクセルの第２の重み付き統計量を決定することと、第１の重み付き統計量および第２の重み付き統計量に少なくとも部分的に基づいて、ターゲット多重解像度ボクセル空間とリファレンス多重解像度ボクセル空間との間の変換を決定することとを含む動作を行わせる命令を格納する、非一時的なコンピューター読取り可能媒体。

ＡＩ．ターゲット多重解像度ボクセル空間は、第１の分類に関連付けられたボクセルの第１のセットと、第２の分類に関連付けられたボクセルの第２のセットとを含む、項ＡＨの非一時的なコンピューター読取り可能媒体。

ＡＪ．ターゲット多重解像度ボクセル空間の第１のターゲットボクセルがリファレンス多重解像度ボクセル空間の第１のリファレンスボクセルに関連付けられると決定することは、第１のターゲットボクセルに対して、第１のターゲットボクセルのセントロイドの指定された距離内のセントロイドを有するリファレンス多重解像度ボクセル空間のボクセルのセットを識別することと、第１のターゲットボクセルのセントロイドに対する第１のリファレンスボクセルのセントロイドの距離に基づいて、ボクセルのセットから第１のリファレンスボクセルを決定することと、を含む、項ＡＨの非一時的なコンピューター読取り可能媒体。

ＡＫ．第１のターゲットボクセルのセントロイドと第１のリファレンスボクセルのセントロイドとの距離に少なくとも部分的に基づいて、第１のターゲットボクセルおよび第１のリファレンスボクセルが対応すると決定することをさらに含む、項ＡＨの非一時的なコンピューター読取り可能媒体。

ＡＬ．第１の重み付き統計量は、重み付き平均共分散である、項ＡＨの非一時的なコンピューター読取り可能媒体。

ＡＭ．変換を決定することは、第１の重み付き統計量に主成分分析を行うことと、主成分分析の最小固有値を決定することと、最小固有値に少なくとも部分的に基づいて、残差を決定することと、変換として、残差を最適化するターゲット多重解像度マップとリファレンス多重解像度マップと間の回転または平行移動のうちの１つまたは複数を決定することとを含む、項ＡＨの非一時的なコンピューター読取り可能媒体。

ＡＮ．残差に少なくとも部分的に基づいて値を最小化する勾配降下技法または非線形最適化技法のうちの１つまたは複数を適用することをさらに含み、変換は、平行移動または回転のうちの１つまたは複数を含む、項ＡＭの非一時的なコンピューター読取り可能媒体。

上に説明される例示的な箇条が、ある特有の実装に関して説明されるが、本文書の関連において、さらに、例示的な箇条の内容が、方法、デバイス、システム、コンピューター読取り可能媒体、および／または別の実装を介して実装されることが可能であることは、理解されるべきである。加えて、例Ａ-ＡＮのいずれかは、単独にて、または例Ａ-ＡＮのうちのいずれか他の１つまたは複数との組み合わせにおいて、実装されることがある。

終結
理解されることが可能であるように、本明細書に述べられる構成要素は、例示の目的のために区分されているとして説明される。しかしながら、種々の構成要素によって行われる動作は、どんな他の構成要素にでも組み合わされるまたは行われることが可能である。さらに、１つの例または実装に関して述べられた構成要素またはステップが、他の例の構成要素またはステップと協働して用いられることがあることは、理解されるべきである。例えば、図９のコンポーネントおよび命令は、図１～８の処理およびフローを利用することがある。

本明細書に説明される技法に関する１つまたは複数の例が説明されたが、種々の代替、追加、置換および均等は、本明細書に説明される技法の範囲内に含まれる。

例の説明において、参照は、主張される主題の特定の例を実例として示す、一部を形成する添付の図面に対してされる。他の例が用いられることが可能であること、および、変更または代替、たとえば構造的な変更などがされることが可能であることは、理解されることである。上記の例、変更、または代替は、意図され主張される主題に関して、必ずしも範囲からの逸脱でない。本明細書におけるステップが、ある順において与えられることが可能であるが、いくつかの場合において、順は、ある入力が、説明されるシステムおよび方法の機能を変更することなしに異なる時間に、または別個の順に提供されるように、変更されることが可能である。さらに、開示される手順は、異なる順において実行されることも可能だろう。追加として、本明細書に説明される種々の計算は、開示された順において行われる必要がなく、計算に関し代替の順にすることを用いる他の例は、難なく実装されることが可能であろう。並べ替えられることに加えて、いくつかの場合には、さらに、計算は、同一の結果を有する部分計算に分解されることも可能だろう。

Claims

第１のボクセル空間を含むマップデータを受信することであって、前記第１のボクセル空間は、第１の解像度に関連付けられた第１の層と、前記第１の解像度とは異なる第２の解像度に関連付けられた第２の層とを有する、ことと、
車両に関連付けられたセンサーからセンサーデータを受信することと、
前記センサーデータを第２のボクセル空間に関連付けることであって、前記第２のボクセル空間は、前記第１の解像度に関連付けられた第１の層と、前記第２の解像度に関連付けられた第２の層とを含む、ことと、
前記第１のボクセル空間および前記第２のボクセル空間に少なくとも部分的に基づいて、第１の集約されたボクセルデータを決定することと、
前記第１の集約されたボクセルデータに少なくとも部分的に基づいて、前記第１のボクセル空間と前記第２のボクセル空間との間の変換を決定することと、
前記変換に少なくとも部分的に基づいて、前記物理環境における前記車両のロケーションを決定することと
を備えることを特徴とする方法。
前記第１の集約されたボクセルデータを決定することは、
前記第１のボクセル空間の第１のボクセルに対して、前記第１のボクセルのセントロイドの指定された距離内のセントロイドを有する前記第２のボクセル空間のボクセルのセットを識別することと、
ボクセルの前記セットのうちの第２のボクセルを選択することであって、前記第２のボクセルは、前記第１のボクセルの前記セントロイドに最も近いセントロイドを有する、ことと、
前記第１のボクセルの共分散および前記リファレンスボクセルの共分散の重み付き平均を決定することと
を含むことを特徴とする請求項１に記載の方法。
前記第１のボクセルおよび前記第２のボクセルは、同一のセマンティッククラスを含むことを特徴とする請求項１または２に記載の方法。
前記第１の集約されたボクセルデータを決定することは、
前記重み付き平均の最小固有ベクトルを決定することと、
前記最小固有ベクトルに少なくとも部分的に基づいて、前記第１の集約されたボクセルデータを表す法線ベクトルを決定することと
をさらに含むことを特徴とする請求項１ないし３のいずれか一項に記載の方法。
前記第１の集約されたボクセルデータを再重み付けすることは、ｍ－エスティメータフレームワークを適用することを含むことを特徴とする請求項１ないし４のいずれか一項に記載の方法。
前記変換を決定することは、
前記最小固有値に少なくとも部分的に基づいて、残差を決定することと、
前記残差に少なくとも部分的に基づいて、前記ターゲットボクセル空間とリファレンスボクセル空間との間の回転または平行移動のうちの１つまたは複数を決定することと
を含むことを特徴とする請求項１ないし４のいずれか一項に記載の方法。
分布をモデリングすることに少なくとも部分的に基づいて、前記アライメントに関連付けられた不確かさを決定することをさらに備えることを特徴とする請求項１ないし６のいずれか一項に記載の方法。
前記変換は、前記第１のボクセル空間と第２のボクセル空間との間の位置または向きのうちの１つまたは複数における差を示すことを特徴とする請求項１ないし７のいずれか一項に記載の方法。
前記車両は自律車両であり、前記方法は、
前記物理環境における前記自律車両の前記ロケーションに少なくとも部分的に基づいて前記自律車両を制御すること
をさらに備えることを特徴とする請求項１ないし８のいずれか一項に記載の方法。
コンピューターにおいて実行されると、請求項１ないし９のいずれか一項に記載の方法を実装する、コード化された命令を含むことを特徴とするコンピュータープログラム製品。
システムであって、
１つまたは複数のプロセッサーと、
前記１つまたは複数のプロセッサーによって実行可能な命令を格納する１つまたは複数の非一時的なコンピューター読取り可能媒体と
を備え、前記命令は、実行されると、前記システムに、
ターゲット多重解像度ボクセル空間を受信することと、
リファレンス多重解像度ボクセル空間を受信することと、
前記ターゲット多重解像度ボクセル空間の第１のターゲットボクセルが、前記リファレンス多重解像度ボクセル空間の第１のリファレンスボクセルに関連付けられると決定することであって、前記第１のターゲットボクセルおよび前記第１のリファレンスボクセルは、第１の解像度を共有する、ことと、
前記第１のターゲットボクセルおよび前記第１のリファレンスボクセルの第１の重み付き統計量を決定することと、
前記ターゲット多重解像度ボクセル空間の第２のターゲットボクセルが、前記リファレンス多重解像度ボクセル空間の第２のリファレンスボクセルに関連付けられると決定することであって、前記第２のターゲットボクセルおよび前記第２のリファレンスボクセルは、第２の解像度を共有し、前記第２の解像度は前記第１の解像度とは異なる、ことと、
前記第２のターゲットボクセルおよび前記第２のリファレンスボクセルを表す第２の組み合わされたボクセルの第２の重み付き統計量を決定することと、
前記第１の重み付き統計量および前記第２の重み付き統計量に少なくとも部分的に基づいて、前記ターゲット多重解像度ボクセル空間とリファレンス多重解像度ボクセル空間との間の変換を決定することと
を含む動作を行わせることを特徴とするシステム。
前記ターゲット多重解像度ボクセル空間は、第１の分類に関連付けられたボクセルの第１のセットと、第２の分類に関連付けられたボクセルの第２のセットとを含むことを特徴とする請求項１１に記載のシステム。
前記ターゲット多重解像度ボクセル空間の前記第１のターゲットボクセルが、前記リファレンス多重解像度ボクセル空間の前記第１のリファレンスボクセルに関連付けられると決定することは、
第１のターゲットボクセルに対して、前記第１のターゲットボクセルのセントロイドの指定された距離内にセントロイドを有する前記リファレンス多重解像度ボクセル空間のボクセルのセットを識別することと、
前記第１のターゲットボクセルの前記セントロイドへの前記第１のリファレンスボクセルのセントロイドの距離に基づいて、ボクセルの前記セットから前記第１のリファレンスボクセルを決定することと
を含むことを特徴とする請求項１１または１２に記載のシステム。
前記動作は、前記第１のターゲットボクセルのセントロイドおよび前記第１のリファレンスボクセルのセントロイドの距離に少なくとも部分的に基づいて、前記第１のターゲットボクセルおよび前記第１のリファレンスボクセルが対応すると決定することをさらに含むことを特徴とする請求項１ないし１３のいずれか一項に記載のシステム。
前記変換を決定することは、
前記第１の重み付き統計量に主成分分析を行うことと、
前記主成分分析の最小固有値を決定することと、
前記最小固有値に少なくとも部分的に基づいて、残差を決定することと、
前記変換として、前記残差を最適化する前記ターゲット多重解像度マップとリファレンス多重解像度マップとの間の回転または平行移動のうちの１つまたは複数を決定することと
を含み、
前記動作は、前記残差に少なくとも部分的に基づいて値を最小化する勾配降下技法または非線形最適化技法のうちの１つまたは複数を適用することをさらに含み、前記変換は、平行移動または回転のうちの１つまたは複数を含む
ことを特徴とする請求項１１ないし１４のいずれか一項に記載のシステム。