JP2021530815A

JP2021530815A - 仮想キャラクタの姿勢空間変形のための姿勢空間次元低減

Info

Publication number: JP2021530815A
Application number: JP2021503745A
Authority: JP
Inventors: ショーンマイケルコマー，; ジェフリーウェディグ，
Original assignee: Magic Leap Inc
Current assignee: Magic Leap Inc
Priority date: 2018-07-27
Filing date: 2019-07-25
Publication date: 2021-11-11
Anticipated expiration: 2039-07-25
Also published as: EP3830673A4; US20210304477A1; CN112753007A; US20220327756A1; US11328467B2; JP7459050B2; US10950024B2; WO2020023788A1; US20200035009A1; EP3830673A1; JP2024069598A; US11670032B2

Abstract

姿勢空間次元を低減させるためのシステムおよび方法。複数の例示的姿勢が、入力姿勢空間を定義することができる。例示的姿勢はそれぞれ、仮想キャラクタのための関節回転のセットを含むことができる。関節回転は、特異性のない数学的表現で表されることができる。複数の例示的姿勢は、次いで、１つ以上のクラスタにクラスタ化されることができる。代表的姿勢が、クラスタ毎に決定される。入力姿勢空間と比較して低減された次元を伴う、出力姿勢空間が、次いで、提供されることができる。

Description

（任意の優先権出願に対する参照による組み込み）
本願は、２０１８年７月２７日号に出願され、「ＰＯＳＥＳＰＡＣＥＤＩＭＥＮＳＩＯＮＡＬＩＴＹＲＥＤＵＣＴＩＯＮＦＯＲＰＯＳＥＳＰＡＣＥＤＥＦＯＲＭＡＴＩＯＮＯＦＡＶＩＲＴＵＡＬＣＨＡＲＡＣＴＥＲ」と題された、米国仮特許出願第６２／７１１，３２６号の優先権を主張する。国内外の優先権の主張が本願とともに申請されるアプリケーションデータシート内で識別される、あらゆる出願は、３７ＣＦＲ１．５７下、参照することによって本明細書に組み込まれる。

本開示は、複合現実、結像、および可視化システムを含む、仮想現実および拡張現実に関し、より具体的には、アバタ等の仮想キャラクタをアニメーション化するためのリギングシステムおよび方法に関する。

現代のコンピューティングおよびディスプレイ技術は、いわゆる「仮想現実」、「拡張現実」、および「複合現実」体験のためのシステムの開発を促進しており、デジタル的に再現された画像が、現実であるように見える、またはそのように知覚され得る様式でユーザに提示される。仮想現実（ＶＲ）シナリオは、典型的には、他の実際の実世界の視覚的入力に対する透過性を伴わずに、コンピュータ生成仮想画像情報の提示を伴う。拡張現実（ＡＲ）シナリオは、典型的には、ユーザの周囲の実際の世界の可視化に対する拡張としての仮想画像情報の提示を伴う。複合現実（ＭＲ）は、その中に物理的および仮想オブジェクトが、共存し、リアルタイムで相互作用し得る、拡張現実のタイプである。本明細書に開示されるシステムおよび方法は、ＶＲ、ＡＲ、およびＭＲ技術に関連する種々の課題に対処する。

概要
仮想アバタは、ＡＲ／ＶＲ／ＭＲ環境内の実際または架空の人物（または創造物または擬人化されたオブジェクト）の仮想表現であってもよい。例えば、その中で２人のＡＲ／ＶＲ／ＭＲユーザが相互に相互作用する、テレプレゼンスセッションの間、視認者は、別のユーザのアバタを視認者の環境内で知覚し、それによって、他のユーザの存在の有形感覚を視認者の環境内に作成することができる。アバタはまた、共有仮想環境内において、ユーザが、相互に相互作用し、ともに物事を行うための方法を提供することができる。例えば、オンラインクラスに出席する生徒は、仮想教室内の他の生徒または教師のアバタを知覚し、彼らと相互作用することができる。別の実施例として、ＡＲ／ＶＲ／ＭＲ環境内でゲームをプレーしているユーザは、ゲーム内の他のプレーヤのアバタを視認し、彼らと相互作用してもよい。

開示されるシステムおよび方法の実施形態は、改良されたアバタおよびウェアラブルシステムのユーザとユーザの環境内のアバタとの間のより現実的相互作用を提供し得る。本開示における実施例は、ヒト形状のアバタをアニメーション化することを説明するが、類似技法はまた、動物、架空の生物、オブジェクト等にも適用されることができる。

本明細書に説明される主題の１つ以上の実装の詳細が、付随の図面および以下の説明に記載される。他の特徴、側面、および利点は、説明、図面、および請求項から明白となるであろう。

図１は、人物によって視認されるある仮想現実オブジェクトおよびある物理的オブジェクトを伴う、複合現実シナリオの例証を描写する。

図２は、ウェアラブルシステムの実施例を図式的に図示する。

図３は、ウェアラブルシステムの例示的コンポーネントを図式的に図示する。

図４は、画像情報をユーザに出力するためのウェアラブルデバイスの導波管スタックの実施例を図式的に図示する。

図５は、仮想ユーザインターフェースと相互作用するための方法の実施例のプロセスフロー図である。

図６Ａは、アバタ処理およびレンダリングシステムを備え得る、ウェアラブルシステムの別の実施例のブロック図である。

図６Ｂは、アバタ処理およびレンダリングシステムの例示的コンポーネントを図示する。

図７は、ウェアラブルシステムの中への種々の入力を含む、ウェアラブルシステムの実施例のブロック図である。

図８は、認識されるオブジェクトに関連して仮想コンテンツをレンダリングする方法の実施例のプロセスフロー図である。

図９Ａは、相互に相互作用する複数のウェアラブルシステムを描写する、全体的システム図を図式的に図示する。

図９Ｂは、例示的テレプレゼンスセッションを図示する。

図１０は、ウェアラブルシステムのユーザによって知覚されるようなアバタの実施例を図示する。

図１１は、この場合、ヒトアバタである、仮想キャラクタのためのいくつかの腕姿勢を示す。

図１２Ａは、ｋ−平均クラスタリングを使用して姿勢空間デフォーマのための入力姿勢空間の次元を低減させるための方法を図示する。

図１２Ｂは、図１２Ａの方法を使用して形成される、クラスタの例示的セットを図示する。

図１３は、入力姿勢空間の次元を低減させるために使用するためのクラスタの数を選択するための例示的技法を図示する、グラフである。

図１４は、Ｎ個のブレンドシェイプを伴う入力変形行列のためにプロットされる点の例示的セットを図示する。

図１５は、３０個のブレンドシェイプから成る入力変形行列のための３０個の主成分のそれぞれによって考慮される分散の割合の例示的プロットである。

図１６は、主成分分析（ＰＣＡ）を使用して変形行列の次元を低減させる例示的方法を描写する、フローチャートである。

図面全体を通して、参照番号は、参照される要素間の対応を示すために再使用され得る。図面は、本明細書に説明される例示的実施形態を図示するために提供され、本開示の範囲を限定することを意図されない。

（ウェアラブルシステムの３Ｄディスプレイの実施例）
ウェアラブルシステム（本明細書では、拡張現実（ＡＲ）システムとも称される）は、２Ｄまたは３Ｄ仮想画像をユーザに提示するために構成されることができる。画像は、組み合わせまたは同等物における、静止画像、ビデオのフレーム、またはビデオであってもよい。ウェアラブルシステムの少なくとも一部は、ユーザ相互作用のために、単独で、または組み合わせて、ＶＲ、ＡＲ、またはＭＲ環境を提示し得る、ウェアラブルデバイス上に実装されることができる。ウェアラブルデバイスは、ＡＲデバイス（ＡＲＤ）と同義的に使用されることができる。さらに、本開示の目的のために、用語「ＡＲ」は、用語「ＭＲ」と同義的に使用される。

図１は、人物によって視認される、ある仮想現実オブジェクトおよびある物理的オブジェクトを伴う、複合現実シナリオの例証を描写する。図１では、ＭＲ場面１００が、描写され、ＭＲ技術のユーザには、人々、木々、背景における建物、およびコンクリートプラットフォーム１２０を特徴とする、実世界公園状設定１１０が見える。これらのアイテムに加え、ＭＲ技術のユーザはまた、実世界プラットフォーム１２０上に立っているロボット像１３０と、マルハナバチの擬人化のように見える、飛んでいる漫画のようなアバタキャラクタ１４０とが「見える」と知覚するが、これらの要素は、実世界には存在しない。

３Ｄディスプレイが、真の深度感覚、より具体的には、表面深度のシミュレートされた感覚を生成するために、ディスプレイの視野内の点毎に、その仮想深度に対応する遠近調節応答を生成することが望ましくあり得る。ディスプレイ点に対する遠近調節応答が、収束および立体視の両眼深度キューによって決定されるようなその点の仮想深度に対応しない場合、ヒトの眼は、遠近調節衝突を体験し、不安定な結像、有害な眼精疲労、頭痛、および遠近調節情報の不在下では、表面深度のほぼ完全な欠如をもたらし得る。

ＶＲ、ＡＲ、およびＭＲ体験は、複数の深度平面に対応する画像が視認者に提供されるディスプレイを有する、ディスプレイシステムによって提供されることができる。画像は、深度平面毎に異なってもよく（例えば、場面またはオブジェクトの若干異なる提示を提供する）、視認者の眼によって別個に集束され、それによって、異なる深度平面上に位置する場面に関する異なる画像特徴に合焦させるために要求される眼の遠近調節(accommodation)に基づいて、または合焦からずれている異なる深度平面上の異なる画像特徴を観察することに基づいて、ユーザに深度キューを提供することに役立ち得る。本明細書のいずれかに議論されるように、そのような深度キューは、信用できる深度の知覚を提供する。

図２は、ウェアラブルシステム２００の実施例を図示し、これは、ＡＲ／ＶＲ／ＭＲ場面を提供するように構成されることができる。ウェアラブルシステム２００はまた、ＡＲシステム２００と称され得る。ウェアラブルシステム２００は、ディスプレイ２２０と、ディスプレイ２２０の機能をサポートするための種々の機械的および電子的モジュールおよびシステムとを含む。ディスプレイ２２０は、ユーザ、装着者、または視認者２１０によって装着可能である、フレーム２３０に結合されてもよい。ディスプレイ２２０は、ユーザ２１０の眼の正面に位置付けられることができる。ディスプレイ２２０は、ＡＲ／ＶＲ／ＭＲコンテンツをユーザに提示することができる。ディスプレイ２２０は、ユーザの頭部上に装着される、頭部搭載型ディスプレイ（ＨＭＤ）を備えることができる。

いくつかの実施形態では、スピーカ２４０が、フレーム２３０に結合され、ユーザの外耳道に隣接して位置付けられる（いくつかの実施形態では、示されない別のスピーカが、ユーザの他方の外耳道に隣接して位置付けられ、ステレオ／成形可能音制御を提供する）。ディスプレイ２２０は、環境からオーディオストリームを検出し、周囲音を捕捉するために、オーディオセンサ（例えば、マイクロホン）２３２を含むことができる。いくつかの実施形態では、示されない１つ以上の他のオーディオセンサが、ステレオ音受信を提供するために位置付けられる。ステレオ音受信は、音源の場所を決定するために使用されることができる。ウェアラブルシステム２００は、音声または発話認識をオーディオストリームに実施することができる。

ウェアラブルシステム２００は、ユーザの周囲の環境内の世界を観察する、外向きに向いた結像システム４６４（図４に示される）を含むことができる。ウェアラブルシステム２００はまた、ユーザの眼移動を追跡し得る、内向きに向いた結像システム４６２（図４に示される）を含むことができる。内向きに向いた結像システムは、一方の眼の移動または両方の眼の移動のいずれかを追跡することができる。内向きに向いた結像システム４６２は、フレーム２３０に取り付けられてもよく、内向きに向いた結像システムによって入手された画像情報を処理し、例えば、ユーザ２１０の眼の瞳孔直径または配向、眼の移動、または眼姿勢を決定し得る、処理モジュール２６０または２７０と電気通信してもよい。内向きに向いた結像システム４６２は、１つ以上のカメラを含んでもよい。例えば、少なくとも１つのカメラは、各眼を結像するために使用されてもよい。カメラによって入手された画像は、眼毎に、別個に、瞳孔サイズまたは眼姿勢を決定し、それによって、各眼への画像情報の提示がその眼に対して動的に調整されることを可能にするために使用されてもよい。

実施例として、ウェアラブルシステム２００は、外向きに向いた結像システム４６４または内向きに向いた結像システム４６２を使用して、ユーザの姿勢の画像を入手することができる。画像は、静止画像、ビデオのフレーム、またはビデオであってもよい。

ディスプレイ２２０は、有線導線または無線接続等によって、フレーム２３０に固定して取り付けられる、ユーザによって装着されるヘルメットまたは帽子に固定して取り付けられる、ヘッドホンに内蔵される、または別様にユーザ２１０に除去可能に取り付けられる（例えば、リュック式構成において、ベルト結合式構成において）等、種々の構成において搭載され得る、ローカルデータ処理モジュール２６０に動作可能に結合されることができる（２５０）。

ローカル処理およびデータモジュール２６０は、ハードウェアプロセッサおよび不揮発性メモリ（例えば、フラッシュメモリ）等のデジタルメモリを備えてもよく、その両方とも、データの処理、キャッシュ、および記憶を補助するために利用され得る。データは、ａ）画像捕捉デバイス（例えば、内向きに向いた結像システムまたは外向きに向いた結像システム内のカメラ）、オーディオセンサ（例えば、マイクロホン）、慣性測定ユニット（ＩＭＵ）、加速度計、コンパス、全地球測位システム（ＧＰＳ）ユニット、無線デバイス、またはジャイロスコープ等の（例えば、フレーム２３０に動作可能に結合される、または別様にユーザ２１０に取り付けられ得る）センサから捕捉されるデータ、または、ｂ）可能性として処理または読出後にディスプレイ２２０への通過のために、遠隔処理モジュール２７０または遠隔データリポジトリ２８０を使用して入手または処理されるデータを含んでもよい。ローカル処理およびデータモジュール２６０は、これらの遠隔モジュールがローカル処理およびデータモジュール２６０へのリソースとして利用可能であるように、有線または無線通信リンク等を介して、通信リンク２６２または２６４によって遠隔処理モジュール２７０または遠隔データリポジトリ２８０に動作可能に結合されてもよい。加えて、遠隔処理モジュール２８０および遠隔データリポジトリ２８０は、相互に動作可能に結合されてもよい。

いくつかの実施形態では、遠隔処理モジュール２７０は、データまたは画像情報を分析および処理するように構成される、１つまたはそれを上回るプロセッサを備えてもよい。いくつかの実施形態では、遠隔データリポジトリ２８０は、デジタルデータ記憶設備を備えてもよく、これは、インターネットまたは「クラウド」リソース構成における他のネットワーキング構成を通して利用可能であってもよい。いくつかの実施形態では、全てのデータが、記憶され、全ての算出が、ローカル処理およびデータモジュールにおいて実施され、遠隔モジュールからの完全に自律的な使用を可能にする。
ウェアラブルシステムの例示的コンポーネント

図３は、ウェアラブルシステムの例示的コンポーネントを図式的に図示する。図３は、ウェアラブルシステム２００を示し、これは、ディスプレイ２２０と、フレーム２３０とを含むことができる。引き伸ばし図２０２は、ウェアラブルシステム２００の種々のコンポーネントを図式的に図示する。ある実装では、図３に図示されるコンポーネントのうちの１つ以上のものは、ディスプレイ２２０の一部であることができる。種々のコンポーネントは、単独で、または組み合わせて、ウェアラブルシステム２００のユーザまたはユーザの環境と関連付けられた種々のデータ（例えば、聴覚的または視覚的データ等）を収集することができる。他の実施形態は、ウェアラブルシステムが使用される用途に応じて、付加的またはより少ないコンポーネントを有してもよいことを理解されたい。なお、図３は、種々のコンポーネントのうちのいくつかと、ウェアラブルシステムを通して収集、分析、および記憶され得る、データのタイプの基本概念とを提供する。

図３は、例示的ウェアラブルシステム２００を示し、これは、ディスプレイ２２０を含むことができる。ディスプレイ２２０は、ユーザの頭部、またはフレーム２３０に対応する、筐体またはフレーム２３０に搭載され得る、ディスプレイレンズ２２６を備えることができる。ディスプレイレンズ２２６は、筐体２３０によって、ユーザの眼３０２、３０４の正面に位置付けられる、１つ以上の透明ミラーを備えてもよく、投影された光３３８を眼３０２、３０４の中にバウンスさせ、ビーム成形を促進しながら、また、ローカル環境からの少なくとも一部の光の透過を可能にするように構成されてもよい。投影された光ビーム３３８の波面は、投影された光の所望の焦点距離と一致するように屈曲または集束されてもよい。図示されるように、２つの広視野マシンビジョンカメラ３１６（世界カメラとも称される）が、筐体２３０に結合され、ユーザの周囲の環境を結像することができる。これらのカメラ３１６は、二重捕捉式可視光／非可視（例えば、赤外線）光カメラであることができる。カメラ３１６は、図４に示される外向きに向いた結像システム４６４の一部であってもよい。世界カメラ３１６によって入手された画像は、姿勢プロセッサ３３６によって処理されることができる。例えば、姿勢プロセッサ３３６は、１つ以上のオブジェクト認識装置７０８（例えば、図７に示される）を実装し、ユーザまたはユーザの環境内の別の人物の姿勢を識別する、またはユーザの環境内の物理的オブジェクトを識別することができる。

図３を継続して参照すると、光３３８を眼３０２、３０４の中に投影するように構成される、ディスプレイミラーおよび光学系を伴う、一対の走査式レーザ成形波面（例えば、深度のために）光プロジェクタモジュールが、示される。描写される図はまた、ユーザの眼３０２、３０４を追跡し、レンダリングおよびユーザ入力をサポート可能であるように構成される、赤外線光（発光ダイオード「ＬＥＤ」等）とペアリングされる、２つの小型赤外線カメラ３２４を示す。カメラ３２４は、図４に示される、内向きに向いた結像システム４６２の一部であってもよい。ウェアラブルシステム２００はさらに、センサアセンブリ３３９を特徴とすることができ、これは、Ｘ、Ｙ、およびＺ軸加速度計能力および磁気コンパスおよびＸ、Ｙ、およびＺ軸ジャイロスコープ能力を備え、好ましくは、２００Ｈｚ等の比較的に高周波数でデータを提供し得る。センサアセンブリ３３９は、図２Ａを参照して説明される、ＩＭＵの一部であってもよい。描写されるシステム２００はまた、ＡＳＩＣ（特定用途向け集積回路）、ＦＰＧＡ（フィールドプログラマブルゲートアレイ）、またはＡＲＭプロセッサ（高度縮小命令セット機械）等の頭部姿勢プロセッサ３３６を備えることができ、これは、リアルタイムまたは近リアルタイムユーザ頭部姿勢を捕捉デバイス３１６から出力された広視野画像情報から計算するように構成されてもよい。頭部姿勢プロセッサ３３６は、ハードウェアプロセッサであることができ、図２Ａに示されるローカル処理およびデータモジュール２６０の一部として実装されることができる。

ウェアラブルシステムはまた、１つ以上の深度センサ２３４を含むことができる。深度センサ２３４は、環境内のオブジェクトとウェアラブルデバイスとの間の距離を測定するように構成されることができる。深度センサ２３４は、レーザスキャナ（例えば、ライダ）、超音波深度センサ、または深度感知カメラを含んでもよい。カメラ３１６が深度感知能力を有する、ある実装では、カメラ３１６はまた、深度センサ２３４と見なされ得る。

また、示されるのは、デジタルまたはアナログ処理を実行し、姿勢をセンサアセンブリ３３９からのジャイロスコープ、コンパス、または加速度計データから導出するように構成される、プロセッサ３３２である。プロセッサ３３２は、図２に示される、ローカル処理およびデータモジュール２６０の一部であってもよい。ウェアラブルシステム２００はまた、図３に示されるように、例えば、ＧＰＳ３３７（全地球測位システム）等の測位システムを含み、姿勢および測位分析を補助することができる。加えて、ＧＰＳはさらに、ユーザの環境についての遠隔ベース（例えば、クラウドベース）の情報を提供してもよい。本情報は、ユーザの環境内のオブジェクトまたは情報を認識するために使用されてもよい。

ウェアラブルシステムは、ＧＰＳ３３７および遠隔コンピューティングシステム（例えば、遠隔処理モジュール２７０、別のユーザのＡＲＤ等）によって入手されたデータを組み合わせてもよく、これは、ユーザの環境についてのより多くの情報を提供することができる。一実施例として、ウェアラブルシステムは、ＧＰＳデータに基づいて、ユーザの場所を決定し、ユーザの場所と関連付けられた仮想オブジェクトを含む、世界マップを読み出すことができる（例えば、遠隔処理モジュール２７０と通信することによって）。別の実施例として、ウェアラブルシステム２００は、世界カメラ３１６（図４に示される外向きに向いた結像システム４６４の一部であってもよい）を使用して、環境を監視することができる。世界カメラ３１６によって入手された画像に基づいて、ウェアラブルシステム２００は、環境内のオブジェクトを検出することができる（例えば、図７に示される１つ以上のオブジェクト認識装置７０８を使用することによって）。ウェアラブルシステムはさらに、ＧＰＳ３３７によって入手されたデータを使用して、キャラクタを解釈することができる。

ウェアラブルシステム２００はまた、レンダリングエンジン３３４を備えてもよく、これは、世界のユーザのビューのために、ユーザにローカルなレンダリング情報を提供し、スキャナの動作およびユーザの眼の中への結像を促進するように構成されることができる。レンダリングエンジン３３４は、ハードウェアプロセッサ（例えば、中央処理ユニットまたはグラフィック処理ユニット等）によって実装されてもよい。いくつかの実施形態では、レンダリングエンジンは、ローカル処理およびデータモジュール２６０の一部である。レンダリングエンジン３３４は、ウェアラブルシステム２００の他のコンポーネントに通信可能に結合されることができる（例えば、有線または無線リンクを介して）。例えば、レンダリングエンジン３３４は、通信リンク２７４を介して、眼カメラ３２４に結合され、通信リンク２７２を介して、投影サブシステム３１８（網膜走査ディスプレイに類似する様式において、走査レーザ配列を介して、光をユーザの眼３０２、３０４の中に投影することができる）に結合されることができる。レンダリングエンジン３３４はまた、それぞれ、リンク２７６および２９４を介して、例えば、センサ姿勢プロセッサ３３２および画像姿勢プロセッサ３３６等の他の処理ユニットと通信することができる。

カメラ３２４（例えば、小型赤外線カメラ）は、眼姿勢を追跡し、レンダリングおよびユーザ入力をサポートするために利用されてもよい。いくつかの例示的眼姿勢は、ユーザが見ている場所または合焦させている深度（眼の輻輳・開散運動(vergence)を用いて推定されてもよい）を含んでもよい。ＧＰＳ３３７、ジャイロスコープ、コンパス、および加速度計３３９は、大まかなまたは高速姿勢推定を提供するために利用されてもよい。カメラ３１６のうちの１つ以上のものは、画像および姿勢を入手することができ、これは、関連付けられたクラウドコンピューティングリソースからのデータと併せて、ローカル環境をマッピングし、ユーザビューを他者と共有するために利用されてもよい。

図３に描写される例示的コンポーネントは、例証目的のためだけのものである。複数のセンサおよび他の機能モジュールが、例証および説明の容易性のために、ともに示される。いくつかの実施形態は、これらのセンサまたはモジュールの１つのみまたはサブセットを含んでもよい。さらに、これらのコンポーネントの場所は、図３に描写される位置に限定されない。いくつかのコンポーネントは、ベルト搭載型コンポーネント、ハンドヘルドコンポーネント、またはヘルメットコンポーネント等、他のコンポーネント内に搭載または格納されてもよい。一実施例として、画像姿勢プロセッサ３３６、センサ姿勢プロセッサ３３２、およびレンダリングエンジン３３４は、ベルトパック内に位置付けられ、超広帯域、Ｗｉ−Ｆｉ、Ｂｌｕｅｔｏｏｔｈ（登録商標）等の無線通信を介して、または有線通信を介して、ウェアラブルシステムの他のコンポーネントと通信するように構成されてもよい。描写される筐体２３０は、好ましくは、ユーザによって頭部搭載可能かつ装着可能である。しかしながら、ウェアラブルシステム２００のいくつかのコンポーネントは、ユーザの身体の他の部分に装着されてもよい。例えば、スピーカ２４０が、ユーザの耳の中に挿入され、音をユーザに提供してもよい。

ユーザの眼３０２、３０４の中への光３３８の投影に関して、いくつかの実施形態では、カメラ３２４は、一般に、眼の焦点の位置または「焦点深度」と一致する、ユーザの眼の中心が幾何学的に輻輳される場所を測定するために利用されてもよい。眼が輻輳する全ての点の３次元表面は、「単視軌跡」と称され得る。焦点距離は、有限数の深度をとり得る、または無限に変動し得る。輻輳・開散運動距離から投影された光は、対象の眼３０２、３０４に集束されるように現れる一方、輻輳・開散運動距離の正面または背後の光は、ぼかされる。本開示のウェアラブルシステムおよび他のディスプレイシステムの実施例はまた、米国特許公開第２０１６／０２７０６５６号（参照することによってその全体として本明細書に組み込まれる）に説明される。

ヒト視覚系は、複雑であって、深度の現実的知覚を提供することは、困難である。オブジェクトの視認者は、輻輳・開散運動移動と遠近調節の組み合わせに起因して、オブジェクトを３次元として知覚し得る。相互に対する２つの眼の輻輳・開散運動移動（例えば、瞳孔が、相互に向かって、またはそこから離れるように移動し、眼の視線を収束させ、オブジェクトを固視するような瞳孔の回転）は、眼の水晶体の合焦（または「遠近調節」）と緊密に関連付けられる。通常条件下、焦点を１つのオブジェクトから異なる距離における別のオブジェクトに変化させるための眼のレンズの焦点の変化または眼の遠近調節は、「遠近調節−輻輳・開散運動反射」として知られる関係下、輻輳・開散運動の整合変化を自動的に同一距離に生じさせるであろう。同様に、輻輳・開散運動の変化は、通常条件下、遠近調節の整合変化を誘起するであろう。遠近調節と輻輳・開散運動との間のより良好な整合を提供するディスプレイシステムは、３次元画像のより現実的かつ快適なシミュレーションを形成し得る。

さらに、約０．７ミリメートル未満のビーム直径を伴う、空間的にコヒーレントな光は、眼が合焦している場所にかかわらず、ヒトの眼によって正しく解決されることができる。したがって、適切な焦点深度の錯覚を作成するために、眼の輻輳・開散運動が、カメラ３２４を用いて追跡されてもよく、レンダリングエンジン３３４および投影サブシステム３１８は、単視軌跡上またはそれに近接する全てのオブジェクトを合焦させてレンダリングし、全ての他のオブジェクトを可変程度に焦点をずらしてレンダリングするために利用されてもよい（例えば、意図的に作成されたぼけを使用して）。好ましくは、システム２２０は、ユーザに、約６０フレーム／秒以上のフレームレートでレンダリングする。上記に説明されるように、好ましくは、カメラ３２４は、眼追跡のために利用されてもよく、ソフトウェアは、輻輳・開散運動幾何学形状だけではなく、また、ユーザ入力としての役割を果たすための焦点場所キューも取り上げるように構成されてもよい。好ましくは、そのようなディスプレイシステムは、昼間または夜間の使用のために好適な明度およびコントラストを用いて構成される。

いくつかの実施形態では、ディスプレイシステムは、好ましくは、視覚的オブジェクト整合のために約２０ミリ秒未満の待ち時間、約０．１度未満の角度整合、および約１弧分の分解能を有し、これは、理論によって限定されるわけではないが、ヒトの眼のほぼ限界であると考えられる。ディスプレイシステム２２０は、位置特定システムと統合されてもよく、これは、ＧＰＳ要素、光学追跡、コンパス、加速度計、または他のデータソースを伴い、位置および姿勢決定を補助し得る。位置特定情報は、関連世界のユーザのビュー内における正確なレンダリングを促進するために利用されてもよい（例えば、そのような情報は、眼鏡が実世界に対する場所を把握することを促進するであろう）。

いくつかの実施形態では、ウェアラブルシステム２００は、ユーザの眼の遠近調節に基づいて、１つ以上の仮想画像を表示するように構成される。ユーザに画像が投影されている場所に合焦させるように強制する、従来の３Ｄディスプレイアプローチと異なり、いくつかの実施形態では、ウェアラブルシステムは、投影された仮想コンテンツの焦点を自動的に変動させ、ユーザに提示される１つ以上の画像のより快適な視認を可能にするように構成される。例えば、ユーザの眼が、１ｍの現在の焦点を有する場合、画像は、ユーザの焦点と一致するように投影されてもよい。ユーザが、焦点を３ｍに偏移させる場合、画像は、新しい焦点と一致するように投影される。したがって、ユーザに所定の焦点を強制するのではなく、いくつかの実施形態のウェアラブルシステム２００は、ユーザの眼がより自然な様式において機能することを可能にする。

そのようなウェアラブルシステム２００は、仮想現実デバイスに対して典型的に観察される、眼精疲労、頭痛、および他の生理学的症状の発生率を排除または低減させ得る。これを達成するために、ウェアラブルシステム２００の種々の実施形態は、１つ以上の可変焦点要素（ＶＦＥ）を通して、仮想画像を可変焦点距離に投影するように構成される。１つ以上の実施形態では、３Ｄ知覚は、画像をユーザから固定された焦点面に投影する、多平面焦点システムを通して達成されてもよい。他の実施形態は、可変平面焦点を採用し、焦点面は、ユーザの焦点の現在の状態と一致するように、ｚ−方向に往復して移動される。

多平面焦点システムおよび可変平面焦点システムの両方において、ウェアラブルシステム２００は、眼追跡を採用し、ユーザの眼の輻輳・開散運動を決定し、ユーザの現在の焦点を決定し、仮想画像を決定された焦点に投影してもよい。他の実施形態では、ウェアラブルシステム２００は、ファイバスキャナまたは他の光生成源を通して、網膜を横断して、可変焦点の光ビームをラスタパターンで可変に投影する、光変調器を備える。したがって、画像を可変焦点距離に投影するウェアラブルシステム２００のディスプレイの能力は、ユーザがオブジェクトを３Ｄにおいて視認するための遠近調節を容易にするだけではなく、また、米国特許公開第２０１６／０２７０６５６号（参照することによってその全体として本明細書に組み込まれる）にさらに説明されるように、ユーザの眼球異常を補償するために使用されてもよい。いくつかの他の実施形態では、空間光変調器は、種々の光学コンポーネントを通して、画像をユーザに投影してもよい。例えば、以下にさらに説明されるように、空間光変調器は、画像を１つ以上の導波管上に投影してもよく、これは、次いで、画像をユーザに伝送する。
導波管スタックアセンブリ

図４は、画像情報をユーザに出力するための導波管スタックの実施例を図示する。ウェアラブルシステム４００は、複数の導波管４３２ｂ、４３４ｂ、４３６ｂ、４３８ｂ、４４００ｂを使用して、３次元知覚を眼／脳に提供するために利用され得る、導波管のスタックまたはスタックされた導波管アセンブリ４８０を含む。いくつかの実施形態では、ウェアラブルシステム４００は、図２のウェアラブルシステム２００に対応してもよく、図４Ａは、そのウェアラブルシステム２００のいくつかの部分をより詳細に概略的に示す。例えば、いくつかの実施形態では、導波管アセンブリ４８０は、図２のディスプレイ２２０の中に統合されてもよい。

図４を継続して参照すると、導波管アセンブリ４８０はまた、複数の特徴４５８、４５６、４５４、４５２を導波管間に含んでもよい。いくつかの実施形態では、特徴４５８、４５６、４５４、４５２は、レンズであってもよい。他の実施形態では、特徴４５８、４５６、４５４、４５２は、レンズではなくてもよい。むしろ、それらは、単に、スペーサであってもよい（例えば、空気間隙を形成するためのクラッディング層または構造）。

導波管４３２ｂ、４３４ｂ、４３６ｂ、４３８ｂ、４４０ｂまたは複数のレンズ４５８、４５６、４５４、４５２は、種々のレベルの波面曲率または光線発散を用いて、画像情報を眼に送信するように構成されてもよい。各導波管レベルは、特定の深度平面と関連付けられてもよく、その深度平面に対応する画像情報を出力するように構成されてもよい。画像投入デバイス４２０、４２２、４２４、４２６、４２８は、それぞれ、眼４１０に向かって出力するために、各個別の導波管を横断して入射光を分散させるように構成され得る、導波管４４０ｂ、４３８ｂ、４３６ｂ、４３４ｂ、４３２ｂの中に画像情報を投入するために利用されてもよい。光は、画像投入デバイス４２０、４２２、４２４、４２６、４２８の出力表面から出射し、導波管４４０ｂ、４３８ｂ、４３６ｂ、４３４ｂ、４３２ｂの対応する入力縁の中に投入される。いくつかの実施形態では、光の単一ビーム（例えば、コリメートされたビーム）が、各導波管の中に投入され、特定の導波管と関連付けられた深度平面に対応する特定の角度（および発散量）において眼４１０に向かって指向される、クローン化されたコリメートビームの場全体を出力してもよい。

いくつかの実施形態では、画像投入デバイス４２０、４２２、４２４、４２６、４２８は、それぞれ、それぞれの対応する導波管４４０ｂ、４３８ｂ、４３６ｂ、４３４ｂ、４３２ｂの中への投入のための画像情報を生成する、離散ディスプレイである。いくつかの他の実施形態では、画像投入デバイス４２０、４２２、４２４、４２６、４２８は、例えば、画像情報を１つ以上の光学導管（光ファイバケーブル等）を介して、画像投入デバイス４２０、４２２、４２４、４２６、４２８のそれぞれに送り得る、単一の多重化されたディスプレイの出力端である。

コントローラ４６０が、スタックされた導波管アセンブリ４８０および画像投入デバイス４２０、４２２、４２４、４２６、４２８の動作を制御する。コントローラ４６０は、導波管４４０ｂ、４３８ｂ、４３６ｂ、４３４ｂ、４３２ｂへの画像情報のタイミングおよび提供を調整する、プログラミング（例えば、非一過性コンピュータ可読媒体内の命令）を含む。いくつかの実施形態では、コントローラ４６０は、単一一体型デバイスまたは有線または無線通信チャネルによって接続される分散型システムであってもよい。コントローラ４６０は、いくつかの実施形態では、処理モジュール２６０または２７０（図２に図示される）の一部であってもよい。

導波管４４０ｂ、４３８ｂ、４３６ｂ、４３４ｂ、４３２ｂは、全内部反射（ＴＩＲ）によって各個別の導波管内で光を伝搬するように構成されてもよい。導波管４４０ｂ、４３８ｂ、４３６ｂ、４３４ｂ、４３２ｂはそれぞれ、主要上部表面および主要底部表面およびそれらの主要上部表面と主要底部表面との間に延在する縁を伴う、平面である、または別の形状（例えば、湾曲）を有してもよい。図示される構成では、導波管４４０ｂ、４３８ｂ、４３６ｂ、４３４ｂ、４３２ｂはそれぞれ、光を再指向させ、各個別の導波管内で伝搬させ、導波管から画像情報を眼４１０に出力することによって、光を導波管から抽出するように構成される、光抽出光学要素４４０ａ、４３８ａ、４３６ａ、４３４ａ、４３２ａを含んでもよい。抽出された光はまた、外部結合光と称され得、光抽出光学要素はまた、外部結合光学要素と称され得る。抽出された光のビームは、導波管によって、導波管内で伝搬する光が光再指向要素に衝打する場所において出力される。光抽出光学要素（４４０ａ、４３８ａ、４３６ａ、４３４ａ、４３２ａ）は、例えば、反射または回折光学特徴であってもよい。説明を容易にし、図面を明確にするために、導波管４４０ｂ、４３８ｂ、４３６ｂ、４３４ｂ、４３２ｂの底部主要表面に配置されて図示されるが、いくつかの実施形態では、光抽出光学要素４４０ａ、４３８ａ、４３６ａ、４３４ａ、４３２ａは、上部または底部主要表面に配置されてもよい、または導波管４４０ｂ、４３８ｂ、４３６ｂ、４３４ｂ、４３２ｂの容積内に直接配置されてもよい。いくつかの実施形態では、光抽出光学要素４４０ａ、４３８ａ、４３６ａ、４３４ａ、４３２ａは、透明基板に取り付けられ、導波管４４０ｂ、４３８ｂ、４３６ｂ、４３４ｂ、４３２ｂを形成する、材料の層内に形成されてもよい。いくつかの他の実施形態では、導波管４４０ｂ、４３８ｂ、４３６ｂ、４３４ｂ、４３２ｂは、モノリシック材料部品であってもよく、光抽出光学要素４４０ａ、４３８ａ、４３６ａ、４３４ａ、４３２ａは、その材料部品の表面上および／または内部に形成されてもよい。

図４を継続して参照すると、本明細書に議論されるように、各導波管４４０ｂ、４３８ｂ、４３６ｂ、４３４ｂ、４３２ｂは、光を出力し、特定の深度平面に対応する画像を形成するように構成される。例えば、眼の最近傍の導波管４３２ｂは、そのような導波管４３２ｂの中に投入されるにつれて、コリメートされた光を眼４１０に送達するように構成されてもよい。コリメートされた光は、光学無限遠焦点面を表し得る。次の上方の導波管４３４ｂは、眼４１０に到達し得る前に、第１のレンズ４５２（例えば、負のレンズ）を通して通過する、コリメートされた光を送出するように構成されてもよい。第１のレンズ４５２は、眼／脳が、その次の上方の導波管４３４ｂから生じる光を光学無限遠から眼４１０に向かって内向きにより近い第１の焦点面から生じるように解釈するように、若干の凸面波面曲率を生成するように構成されてもよい。同様に、第３の上方の導波管４３６ｂは、眼４１０に到達する前に、その出力光を第１のレンズ４５２および第２のレンズ４５４の両方を通して通過させる。第１および第２のレンズ４５２および４５４の組み合わせられた屈折力は、眼／脳が、第３の導波管４３６ｂから生じる光が次の上方の導波管４３４ｂからの光であった光学無限遠から人物に向かって内向きにさらに近い第２の焦点面から生じるように解釈するように、別の漸増量の波面曲率を生成するように構成されてもよい。

他の導波管層（例えば、導波管４３８ｂ、４４０ｂ）およびレンズ（例えば、レンズ４５６、４５８）も同様に構成され、スタック内の最高導波管４４０ｂを用いて、人物に最も近い焦点面を表す集約焦点力のために、その出力をそれと眼との間のレンズの全てを通して送出する。スタックされた導波管アセンブリ４８０の他側の世界４７０から生じる光を視認／解釈するとき、レンズ４５８、４５６、４５４、４５２のスタックを補償するために、補償レンズ層４３０が、スタックの上部に配置され、下方のレンズスタック４５８、４５６、４５４、４５２の集約力を補償してもよい。そのような構成は、利用可能な導波管／レンズ対と同じ数の知覚される焦点面を提供する。導波管の光抽出光学要素およびレンズの集束側面は両方とも、静的であってもよい（例えば、動的または電気活性ではない）。いくつかの代替実施形態では、一方または両方とも、電気活性特徴を使用して動的であってもよい。

図４を継続して参照すると、光抽出光学要素４４０ａ、４３８ａ、４３６ａ、４３４ａ、４３２ａは、導波管と関連付けられた特定の深度平面のために、光をその個別の導波管から再指向し、かつ本光を適切な量の発散またはコリメーションを伴って出力するように構成されてもよい。その結果、異なる関連付けられた深度平面を有する導波管は、関連付けられた深度平面に応じて、異なる量の発散を伴う光を出力する、異なる構成の光抽出光学要素を有してもよい。いくつかの実施形態では、本明細書に議論されるように、光抽出光学要素４４０ａ、４３８ａ、４３６ａ、４３４ａ、４３２ａは、光を具体的角度で出力するように構成され得る、立体または表面特徴であってもよい。例えば、光抽出光学要素４４０ａ、４３８ａ、４３６ａ、４３４ａ、４３２ａは、立体ホログラム、表面ホログラム、および／または回折格子であってもよい。回折格子等の光抽出光学要素は、２０１５年６月２５日に公開された米国特許公開第２０１５／０１７８９３９号（参照することによってその全体として本明細書に組み込まれる）に説明される。

いくつかの実施形態では、光抽出光学要素４４０ａ、４３８ａ、４３６ａ、４３４ａ、４３２ａは、回折パターンを形成する回折特徴または「回折光学要素」（本明細書では、「ＤＯＥ」とも称される）である。好ましくは、ＤＯＥは、ビームの光の一部のみがＤＯＥの各交差部で眼４１０に向かって偏向される一方、残りが、全内部反射を介して、導波管を通して移動し続けるように、比較的に低回折効率を有する。画像情報を搬送する光は、したがって、複数の場所において導波管から出射する、いくつかの関連出射ビームに分割され、その結果、導波管内でバウンスする本特定のコリメートされたビームに関して、眼３０４に向かって非常に均一なパターンの出射放出となることができる。

いくつかの実施形態では、１つ以上のＤＯＥは、能動的に回折する「オン」状態と有意に回折しない「オフ」状態との間で切替可能であってもよい。例えば、切替可能なＤＯＥは、ポリマー分散液晶の層を備えてもよく、その中で微小液滴は、ホスト媒体中に回折パターンを備え、微小液滴の屈折率は、ホスト材料の屈折率に実質的に整合するように切り替えられることができる（その場合、パターンは、入射光を著しく回折させない）、または微小液滴は、ホスト媒体のものに整合しない屈折率に切り替えられることができる（その場合、パターンは、入射光を能動的に回折させる）。

いくつかの実施形態では、深度平面または被写界深度の数および分布は、視認者の眼の瞳孔サイズまたは配向に基づいて、動的に変動されてもよい。被写界深度は、視認者の瞳孔サイズと反比例して変化してもよい。その結果、視認者の眼の瞳孔のサイズが減少するにつれて、被写界深度は、その平面の場所が眼の焦点深度を越えるため判別不能である１つの平面が、判別可能となり、瞳孔サイズの低減および被写界深度の相当する増加に伴って、より合焦して現れ得るように増加する。同様に、異なる画像を視認者に提示するために使用される、離間される深度平面の数は、減少された瞳孔サイズに伴って減少されてもよい。例えば、視認者は、一方の深度平面から他方の深度平面への眼の遠近調節を調節せずに、第１の深度平面および第２の深度平面の両方の詳細を１つの瞳孔サイズにおいて明確に知覚することが可能ではない場合がある。しかしながら、これらの２つの深度平面は、同時に、遠近調節を変化させずに、別の瞳孔サイズにおいてユーザに合焦するには十分であり得る。

いくつかの実施形態では、ディスプレイシステムは、瞳孔サイズまたは配向の決定に基づいて、または特定の瞳孔サイズまたは配向を示す電気信号の受信に応じて、画像情報を受信する導波管の数を変動させてもよい。例えば、ユーザの眼が、２つの導波管と関連付けられた２つの深度平面間を区別不能である場合、コントローラ４６０（ローカル処理およびデータモジュール２６０の実施形態であり得る）は、これらの導波管のうちの１つへの画像情報の提供を停止するように構成またはプログラムされることができる。有利なこととして、これは、システムへの処理負担を低減させ、それによって、システムの応答性を増加させ得る。導波管のためのＤＯＥがオンおよびオフ状態間で切替可能である実施形態では、ＤＯＥは、導波管が画像情報を受信するとき、オフ状態に切り替えられてもよい。

いくつかの実施形態では、出射ビームに視認者の眼の直径未満の直径を有するという条件を満たさせることが望ましくあり得る。しかしながら、本条件を満たすことは、視認者の瞳孔のサイズの変動性に照らして、困難であり得る。いくつかの実施形態では、本条件は、視認者の瞳孔のサイズの決定に応答して出射ビームのサイズを変動させることによって、広範囲の瞳孔サイズにわたって満たされる。例えば、瞳孔サイズが減少するにつれて、出射ビームのサイズもまた、減少し得る。いくつかの実施形態では、出射ビームサイズは、可変開口を使用して変動されてもよい。

ウェアラブルシステム４００は、世界４７０の一部を結像する、外向きに向いた結像システム４６４（例えば、デジタルカメラ）を含むことができる。世界４７０の本部分は、世界カメラの視野（ＦＯＶ）と称され得、結像システム４６４は、時として、ＦＯＶカメラとも称される。世界カメラのＦＯＶは、視認者２１０のＦＯＶと同一である場合とそうではない場合があり、これは、視認者２１０が所与の時間に知覚する、世界４７０の一部を包含する。例えば、いくつかの状況では、世界カメラのＦＯＶは、ウェアラブルシステム４００の視認者２１０の視野より大きくあり得る。視認者による視認または結像のために利用可能な領域全体は、動眼視野（ＦＯＲ）と称され得る。ＦＯＲは、装着者が、その身体、頭部、または眼を移動させ、空間内の実質的に任意の方向を知覚することができるため、ウェアラブルシステム４００を囲繞する４πステラジアンの立体角を含んでもよい。他のコンテキストでは、装着者の移動は、より抑制されてもよく、それに応じて、装着者のＦＯＲは、より小さい立体角に接し得る。外向きに向いた結像システム４６４から得られた画像は、ユーザによって行われるジェスチャ（例えば、手または指のジェスチャ）を追跡し、ユーザの正面における世界４７０内のオブジェクトを検出する等のために、使用されることができる。

ウェアラブルシステム４００は、オーディオセンサ２３２、例えば、マイクロホンを含み、周囲音を捕捉することができる。上記に説明されるように、いくつかの実施形態では、１つ以上の他のオーディオセンサが、発話源の場所の決定に有用なステレオ音受信を提供するために位置付けられることができる。オーディオセンサ２３２は、別の実施例として、指向性マイクロホンを備えることができ、これはまた、オーディオ源が位置する場所に関するそのような有用な指向性情報を提供することができる。ウェアラブルシステム４００は、発話源を位置特定する際、または特定の瞬間におけるアクティブ話者を決定するために等、外向きに向いた結像システム４６４およびオーディオセンサ２３０の両方からの情報を使用することができる。例えば、ウェアラブルシステム４００は、単独で、または話者の反射された画像（例えば、鏡に見られるように）と組み合わせて、音声認識を使用して、話者の識別を決定することができる。別の実施例として、ウェアラブルシステム４００は、指向性マイクロホンから入手された音に基づいて、環境内の話者の位置を決定することができる。ウェアラブルシステム４００は、発話認識アルゴリズムを用いて、話者の位置から生じる音を解析し、発話のコンテンツを決定し、音声認識技法を使用して、話者の識別（例えば、名前または他の人口統計情報）を決定することができる。

ウェアラブルシステム４００はまた、眼移動および顔移動等のユーザの移動を観察する、内向きに向いた結像システム４６６（例えば、デジタルカメラ）を含むことができる。内向きに向いた結像システム４６６は、眼４１０の画像を捕捉し、眼３０４の瞳孔のサイズおよび／または配向を決定するために使用されてもよい。内向きに向いた結像システム４６６は、ユーザが見ている方向（例えば、眼姿勢）を決定する際に使用するため、またはユーザのバイオメトリック識別のため（例えば、虹彩識別を介して）、画像を得るために使用されることができる。いくつかの実施形態では、少なくとも１つのカメラが、眼毎に、独立して、各眼の瞳孔サイズまたは眼姿勢を別個に決定し、それによって、各眼への画像情報の提示がその眼に対して動的に調整されることを可能にするために利用されてもよい。いくつかの他の実施形態では、単一眼４１０のみの瞳孔直径または配向（例えば、対の眼あたり単一カメラのみを使用して）が、決定され、ユーザの両眼に関して類似すると仮定される。内向きに向いた結像システム４６６によって得られる画像は、ユーザに提示されるべきオーディオまたは視覚的コンテンツを決定するためにウェアラブルシステム４００によって使用され得る、ユーザの眼姿勢または気分を決定するために分析されてもよい。ウェアラブルシステム４００はまた、ＩＭＵ、加速度計、ジャイロスコープ等のセンサを使用して、頭部姿勢（例えば、頭部位置または頭部配向）を決定してもよい。

ウェアラブルシステム４００は、ユーザが、コマンドをコントローラ４６０に入力し、ウェアラブルシステム４００と相互作用し得る、ユーザ入力デバイス４６６を含むことができる。例えば、ユーザ入力デバイス４６６は、トラックパッド、タッチスクリーン、ジョイスティック、多自由度（ＤＯＦ）コントローラ、容量感知デバイス、ゲームコントローラ、キーボード、マウス、指向性パッド（Ｄパッド）、ワンド、触知デバイス、トーテム（例えば、仮想ユーザ入力デバイスとして機能する）等を含むことができる。マルチＤＯＦコントローラは、コントローラの一部または全部の可能性として考えられる平行移動（例えば、左／右、前方／後方、または上／下）または回転（例えば、ヨー、ピッチ、またはロール）におけるユーザ入力を感知することができる。平行移動をサポートする、マルチＤＯＦコントローラは、３ＤＯＦと称され得る一方、平行移動および回転をサポートする、マルチＤＯＦコントローラは、６ＤＯＦと称され得る。ある場合には、ユーザは、指（例えば、親指）を使用して、タッチセンサ式入力デバイスを押下またはその上でスワイプし、入力をウェアラブルシステム４００に提供してもよい（例えば、ユーザ入力をウェアラブルシステム４００によって提供されるユーザインターフェースに提供するために）。ユーザ入力デバイス４６６は、ウェアラブルシステム４００の使用の間、ユーザの手によって保持されてもよい。ユーザ入力デバイス４６６は、ウェアラブルシステム４００と有線または無線通信することができる。
ウェアラブルシステムの他のコンポーネント

多くの実装では、ウェアラブルシステムは、上記に説明されるウェアラブルシステムのコンポーネントに加えて、またはその代替として、他のコンポーネントを含んでもよい。ウェアラブルシステムは、例えば、１つ以上の触知デバイスまたはコンポーネントを含んでもよい。触知デバイスまたはコンポーネントは、触覚をユーザに提供するように動作可能であってもよい。例えば、触知デバイスまたはコンポーネントは、仮想コンテンツ（例えば、仮想オブジェクト、仮想ツール、他の仮想構造）に触れると、圧力またはテクスチャの触覚を提供してもよい。触覚は、仮想オブジェクトが表す物理的オブジェクトの感覚を再現してもよい、または仮想コンテンツが表す想像上のオブジェクトまたはキャラクタ（例えば、ドラゴン）の感覚を再現してもよい。いくつかの実装では、触知デバイスまたはコンポーネントは、ユーザによって装着されてもよい（例えば、ユーザウェアラブルグローブ）。いくつかの実装では、触知デバイスまたはコンポーネントは、ユーザによって保持されてもよい。

ウェアラブルシステムは、例えば、ユーザによって操作可能であって、ウェアラブルシステムへの入力またはそれとの相互作用を可能にする、１つ以上の物理的オブジェクトを含んでもよい。これらの物理的オブジェクトは、本明細書では、トーテムと称され得る。いくつかのトーテムは、例えば、金属またはプラスチック片、壁、テーブルの表面等、無生物オブジェクトの形態をとってもよい。ある実装では、トーテムは、実際には、任意の物理的入力構造（例えば、キー、トリガ、ジョイスティック、トラックボール、ロッカスイッチ）を有していなくてもよい。代わりに、トーテムは、単に、物理的表面を提供してもよく、ウェアラブルシステムは、ユーザにトーテムの１つ以上の表面上にあるように見えるように、ユーザインターフェースをレンダリングしてもよい。例えば、ウェアラブルシステムは、トーテムの１つ以上の表面上に常駐するように見えるように、コンピュータキーボードおよびトラックパッドの画像をレンダリングしてもよい。例えば、ウェアラブルシステムは、トーテムとしての役割を果たす、アルミニウムの薄い長方形プレートの表面上に見えるように、仮想コンピュータキーボードおよび仮想トラックパッドをレンダリングしてもよい。長方形プレート自体は、任意の物理的キーまたはトラックパッドまたはセンサを有していない。しかしながら、ウェアラブルシステムは、仮想キーボードまたは仮想トラックパッドを介して行われた選択または入力として、長方形プレートを用いたユーザ操作または相互作用またはタッチを検出し得る。ユーザ入力デバイス４６６（図４に示される）は、トラックパッド、タッチパッド、トリガ、ジョイスティック、トラックボール、ロッカまたは仮想スイッチ、マウス、キーボード、多自由度コントローラ、または別の物理的入力デバイスを含み得る、トーテムの実施形態であってもよい。ユーザは、単独で、または姿勢と組み合わせて、トーテムを使用し、ウェアラブルシステムまたは他のユーザと相互作用してもよい。

本開示のウェアラブルデバイス、ＨＭＤ、およびディスプレイシステムと使用可能な触知デバイスおよびトーテムの実施例は、米国特許公開第２０１５／００１６７７７号（参照することによってその全体として本明細書に組み込まれる）に説明される。
（ウェアラブルシステムとのユーザ相互作用の例示的プロセス）

図５は、仮想ユーザインターフェースと相互作用するための方法５００の実施例のプロセスフロー図である。方法５００は、本明細書に説明されるウェアラブルシステムによって実施されてもよい。方法５００の実施形態は、ウェアラブルシステムによって使用され、ウェアラブルシステムのＦＯＶ内の人物またはドキュメントを検出することができる。

ブロック５１０では、ウェアラブルシステムは、特定のＵＩを識別してもよい。ＵＩのタイプは、ユーザによって事前決定されてもよい。ウェアラブルシステムは、ユーザ入力（例えば、ジェスチャ、視覚的データ、オーディオデータ、感覚データ、直接コマンド等）に基づいて、特定のＵＩが取り込まれる必要があることを識別してもよい。ＵＩは、システムの装着者がドキュメントを装着者に提示するユーザを観察している（例えば、旅行者検問所において）、セキュリティシナリオに特有であることができる。ブロック５２０では、ウェアラブルシステムは、仮想ＵＩのためのデータを生成してもよい。例えば、範囲、一般的構造、ＵＩの形状等と関連付けられたデータが、生成されてもよい。加えて、ウェアラブルシステムは、ウェアラブルシステムがＵＩをユーザの物理的場所に関連して表示し得るように、ユーザの物理的場所のマップ座標を決定してもよい。例えば、ＵＩが、身体中心である場合、ウェアラブルシステムは、リングＵＩがユーザの周囲に表示され得る、または平面ＵＩが壁上またはユーザの正面に表示され得るように、ユーザの物理的立ち位置の座標、頭部姿勢、または眼姿勢を決定してもよい。本明細書に説明されるセキュリティコンテキストでは、ＵＩは、装着者が、旅行者および旅行者のドキュメントを見ながら、ＵＩを容易に視認し得るように、ＵＩがドキュメントをシステムの装着者に提示している旅行者を囲繞しているかのように表示されてもよい。ＵＩが、手中心である場合、ユーザの手のマップ座標が、決定されてもよい。これらのマップ点は、ＦＯＶカメラ、感覚入力を通して受信されたデータ、または任意の他のタイプの収集されたデータを通して、導出されてもよい。

ブロック５３０では、ウェアラブルシステムは、データをクラウドからディスプレイに送信してもよい、またはデータは、ローカルデータベースからディスプレイコンポーネントに送信されてもよい。ブロック５４０では、ＵＩは、送信されたデータに基づいて、ユーザに表示される。例えば、ライトフィールドディスプレイは、仮想ＵＩをユーザの眼の一方または両方の中に投影することができる。いったん仮想ＵＩが作成されると、ウェアラブルシステムは、単に、ブロック５５０において、より多くの仮想コンテンツを仮想ＵＩ上に生成するためのユーザからのコマンドを待機してもよい。例えば、ＵＩは、ユーザの身体またはユーザの環境内の人物（例えば、旅行者）の身体の周囲の身体中心リングであってもよい。ウェアラブルシステムは、次いで、コマンド（ジェスチャ、頭部または眼移動、音声コマンド、ユーザ入力デバイスからの入力等）を待機してもよく、それが認識される場合（ブロック５６０）、コマンドと関連付けられた仮想コンテンツは、ユーザに表示されてもよい（ブロック５７０）。
（複合現実におけるアバタレンダリングの実施例）

ウェアラブルシステムは、高被写界深度をレンダリングされたライトフィールド内で達成するために、種々のマッピング関連技法を採用してもよい。仮想世界をマッピングする際、実世界内の全ての特徴および点を把握し、仮想オブジェクトを実世界に関連して正確に描くことが有利である。この目的を達成するために、ウェアラブルシステムのユーザから捕捉されたＦＯＶ画像が、実世界の種々の点および特徴についての情報を伝達する新しい写真を含むことによって、世界モデルに追加されることができる。例えば、ウェアラブルシステムは、マップ点（２Ｄ点または３Ｄ点等）のセットを収集し、新しいマップ点を見出し、世界モデルのより正確なバージョンをレンダリングすることができる。第１のユーザの世界モデルは、第２のユーザが第１のユーザを囲繞する世界を体験し得るように、（例えば、クラウドネットワーク等のネットワークを経由して）第２のユーザに通信されることができる。

図６Ａは、ウェアラブルシステムの別の実施例のブロック図であって、これは、複合現実環境内へのアバタ処理およびレンダリングシステム６９０を備えることができる。ウェアラブルシステム６００は、図２に示されるウェアラブルシステム２００の一部であってもよい。本実施例では、ウェアラブルシステム６００は、マップ６２０を備えることができ、これは、マップデータベース７１０（図７に示される）内のデータの少なくとも一部を含んでもよい。マップは、部分的に、ウェアラブルシステム上にローカルで常駐してもよく、部分的に、有線または無線ネットワークによってアクセス可能なネットワーク化された記憶場所（例えば、クラウドシステム内）に常駐してもよい。姿勢プロセス６１０は、ウェアラブルコンピューティングアーキテクチャ（例えば、処理モジュール２６０またはコントローラ４６０）上で実行され、マップ６２０からのデータを利用して、ウェアラブルコンピューティングハードウェアまたはユーザの位置および配向を決定してもよい。姿勢データは、ユーザが、システムを体験し、世界内で動作するにつれてオンザフライで収集されたデータから、算出されてもよい。データは、画像、センサ（慣性測定ユニット等、これは、概して、加速度計と、ジャイロスコープコンポーネントとを備える）からのデータ、および実または仮想環境内のオブジェクトと関連する表面情報を含んでもよい。

疎点表現は、同時位置特定およびマッピング（例えば、入力が画像／視覚専用である構成を指す、ＳＬＡＭまたはｖＳＬＡＭ）プロセスの出力であってもよい。本システムは、種々のコンポーネントが存在する世界内の場所だけではなく、世界が成る内容も見出すように構成されることができる。姿勢は、マップの取込およびマップからのデータの使用を含む、多くの目標を達成する、構築ブロックであり得る。

一実施形態では、疎点位置は、それだけでは完全に適正ではあり得ず、さらなる情報が、多焦点ＡＲ、ＶＲ、またはＭＲ体験を生産するために必要とされ得る。概して、深度マップ情報を指す、稠密表現が、少なくとも部分的に、本間隙を充填するために利用されてもよい。そのような情報は、ステレオ６４０と称される、プロセスから算出されてもよく、深度情報は、三角測量または飛行時間感知等の技法を使用して決定される。画像情報およびアクティブパターン（アクティブプロジェクタを使用して作成された赤外線パターン等）、画像カメラから入手された画像、または手のジェスチャ／トーテム６５０が、ステレオプロセス６４０への入力としての役割を果たし得る。有意な量の深度マップ情報が、ともに融合され得、そのうちの一部は、表面表現とともに要約され得る。例えば、数学的に定義可能な表面は、効率的（例えば、大点群と比較して）であって、ゲームエンジンのような他の処理デバイスへの理解しやすい入力であり得る。したがって、ステレオプロセス（例えば、深度マップ）６４０の出力は、融合プロセス６３０において組み合わせられてもよい。姿勢６１０も同様に、本融合プロセス６３０への入力であってもよく、融合６３０の出力は、マップ取込プロセス６２０への入力となる。サブ表面は、トポグラフィマッピングにおけるように、相互に接続し、より大きい表面を形成し得、マップは、点および表面の大規模ハイブリッドとなる。

複合現実プロセス６６０における種々の側面を解決するために、種々の入力が、利用されてもよい。例えば、図６Ａに描写される実施形態では、ゲームパラメータが、入力され、システムのユーザが、種々の場所における１匹以上のモンスター、種々の条件下で死にかけている、または逃げているモンスター（ユーザがモンスターを射撃する場合等）、種々の場所における壁または他のオブジェクト、および同等物を伴った状態で、モンスターバトルゲームをプレーしていることを決定し得る。世界マップは、オブジェクトの場所に関する情報またはオブジェクトの意味論情報（例えば、オブジェクトが、平坦または丸いかどうか、水平または垂直であるか、テーブルまたはランプであるかどうか等の分類）を含んでもよく、世界マップは、複合現実への別の有益な入力であり得る。世界に対する姿勢も同様に、入力となり、ほぼあらゆる双方向システムに対して重要な役割を担う。

ユーザからの制御または入力は、ウェアラブルシステム６００への別の入力である。本明細書に説明されるように、ユーザ入力は、視覚的入力、ジェスチャ、トーテム、オーディオ入力、感覚入力等を含むことができる。動き回る、またはゲームをプレーするために、例えば、ユーザは、自らが所望する内容に関して、ウェアラブルシステム６００に命令する必要があり得る。単に、自らを空間内で移動させる以外にも利用され得る、種々の形態のユーザ制御が存在する。一実施形態では、トーテム（例えば、ユーザ入力デバイス）または玩具銃等のオブジェクトが、ユーザによって保持され、システムによって追跡されてもよい。本システムは、好ましくは、ユーザがアイテムを保持していることを把握し、ユーザがアイテムと行っている相互作用の種類を理解するように構成されるであろう（例えば、トーテムまたはオブジェクトが、銃である場合、本システムは、場所および配向と、ユーザが、トリガまたは他の感知されるボタンまたは要素（アクティビティがカメラのいずれかの視野内にないときでも、生じている内容を決定することを補助し得る、ＩＭＵ等のセンサを装備し得る）をクリックしているかどうかとを理解するように構成されてもよい）。

手のジェスチャの追跡または認識もまた、入力情報を提供し得る。ウェアラブルシステム６００は、ボタン押下、左または右、停止、握持、保持のジェスチャ等に関して、手のジェスチャを追跡および解釈するように構成されてもよい。例えば、１つの構成では、ユーザは、非ゲーム用環境において電子メールまたはカレンダをフリップする、または「フィストバンプ」を別の人物またはプレーヤと行うことを所望し得る。ウェアラブルシステム６００は、動的である場合とそうではない場合がある、最小量の手のジェスチャを活用するように構成されてもよい。例えば、ジェスチャは、停止のために手を開く、ＯＫのためのサムズアップ、非ＯＫのためのサムズダウン、または指向性コマンドのための右または左または上／下への手のフリップのような単純静的ジェスチャであってもよい。

眼追跡は、別の入力である（例えば、ユーザが見ている場所を追跡し、ディスプレイ技術を制御し、具体的深度または範囲にレンダリングする）。一実施形態では、眼の輻輳・開散運動が、三角測量を使用して、決定されてもよく、次いで、その特定の人物に関して開発された輻輳・開散運動／遠近調節モデルを使用して、遠近調節が、決定されてもよい。眼追跡は、眼カメラによって実施され、眼視線（例えば、片眼または両眼の方向または配向）を決定することができる。他の技法は、例えば、眼の近傍に設置された電極による電位の測定（例えば、電気眼球図記録）等の眼追跡のために使用されることができる。

発話追跡は、単独で、または他の入力（例えば、トーテム追跡、眼追跡、ジェスチャ追跡等）と組み合わせて使用され得る、別の入力であり得る。発話追跡は、単独で、または組み合わせて、発話認識、音声認識を含んでもよい。システム６００は、オーディオストリームを環境から受信する、オーディオセンサ（例えば、マイクロホン）を含むことができる。システム６００は、発話している人物（例えば、発話が、ＡＲＤの装着者または別の人物または音声（例えば、環境内のラウドスピーカによって伝送される記録された音声）からのものであるかどうか）を決定するための音声認識技術と、話されている内容を決定するための発話認識技術とを組み込むことができる。ローカルデータおよび処理モジュール２６０または遠隔処理モジュール２７０は、例えば、隠れマルコフモデル、動的時間伸縮法（ＤＴＷ）ベースの発話認識、ニューラルネットワーク、ディープフィードフォワードおよび再帰ニューラルネットワーク等の深層学習アルゴリズム、エンドツーエンド自動発話認識、機械学習アルゴリズム（図７を参照して説明される）、または音響モデル化または言語モデル化を使用する、他のアルゴリズム等の種々の発話認識アルゴリズムを適用することによって、マイクロホンからのオーディオデータ（または、例えば、ユーザによって鑑賞されているビデオストリーム等の別のストリーム内のオーディオデータ）を処理し、発話のコンテンツを識別することができる。

ローカルデータおよび処理モジュール２６０または遠隔処理モジュール２７０はまた、音声認識アルゴリズムを適用することができ、これは、話者が、ウェアラブルシステム６００のユーザ２１０またはユーザが会話している別の人物であるかどうか等、話者の識別を識別することができる。いくつかの例示的音声認識アルゴリズムは、周波数推定、隠れマルコフモデル、ガウス混合物モデル、パターンマッチングアルゴリズム、ニューラルネットワーク、行列表現、ベクトル量子化、話者ダイアライゼーション、決定ツリー、および動的時間伸縮法（ＤＴＷ）技法を含むことができる。音声認識技法はまた、コホートモデルおよび世界モデル等のアンチ話者技法を含むことができる。スペクトル特徴が、話者特性を表す際に使用されてもよい。ローカルデータおよび処理モジュールまたは遠隔データ処理モジュール２７０は、図７を参照して説明される、種々の機械学習アルゴリズムを使用して、音声認識を実施することができる。

ウェアラブルシステムの実装は、ＵＩを介したこれらのユーザ制御または入力を使用することができる。ＵＩ要素（例えば、制御、ポップアップウィンドウ、吹き出し、データエントリフィールド等）は、例えば、情報、例えば、オブジェクトのグラフィックまたは意味論情報のディスプレイを閉じるために使用されることができる。

カメラシステムに関して、図６Ａに示される例示的ウェアラブルシステム６００は、３つの対のカメラ、すなわち、ユーザの顔の側面に配列される、一対の相対的広ＦＯＶまたは受動ＳＬＡＭカメラと、ステレオ結像プロセス６４０をハンドリングし、また、ユーザの顔の正面における手のジェスチャおよびトーテム／オブジェクト追跡を捕捉するために、ユーザの顔の正面に配向される、異なる対のカメラとを含むことができる。ＦＯＶカメラおよびステレオプロセス６４０のための対のカメラは、外向きに向いた結像システム４６４（図４に示される）の一部であってもよい。ウェアラブルシステム６００は、眼ベクトルおよび他の情報を三角測量するために、ユーザの眼に向かって配向される、眼追跡カメラ（図４に示される内向きに向いた結像システム４６２の一部であってもよい）を含むことができる。ウェアラブルシステム６００はまた、１つ以上のテクスチャ加工された光プロジェクタ（赤外線（ＩＲ）プロジェクタ等）を備え、テクスチャを場面の中に投入してもよい。

ウェアラブルシステム６００は、アバタ処理およびレンダリングシステム６９０を備えることができる。アバタ処理およびレンダリングシステム６９０は、コンテキスト情報に基づいて、アバタを生成、更新、アニメーション化、およびレンダリングするように構成されることができる。アバタ処理およびレンダリングシステム６９０の一部または全部は、単独で、または組み合わせて、ローカル処理およびデータモジュール２６０または遠隔処理モジュール２６２、２６４の一部として実装されることができる。種々の実施形態では、複数のアバタ処理およびレンダリングシステム６９０（例えば、異なるウェアラブルデバイス上に実装されるように）が、仮想アバタ６７０をレンダリングするために使用されることができる。例えば、第１のユーザのウェアラブルデバイスは、第１のユーザの意図を決定するために使用されてもよい一方、第２のユーザのウェアラブルデバイスは、アバタの特性を決定し、第１のユーザのウェアラブルデバイスから受信された意図に基づいて、第１のユーザのアバタをレンダリングすることができる。第１のユーザのウェアラブルデバイスおよび第２のユーザのウェアラブルデバイス（または他のそのようなウェアラブルデバイス）は、例えば、図９Ａおよび９Ｂを参照して説明されるであろうように、ネットワークを介して、通信することができる。

図６Ｂは、例示的アバタ処理およびレンダリングシステム６９０を図示する。例示的アバタ処理およびレンダリングシステム６９０は、単独で、または組み合わせて、３Ｄモデル処理システム６８０と、コンテキスト情報分析システム６８８と、アバタ自動スケーラ６９２と、意図マッピングシステム６９４と、解剖学的構造調節システム６９８と、刺激応答システム６９６とを備えることができる。システム６９０は、アバタ処理およびレンダリングのための機能性を図示するように意図され、限定することを意図するものではない。例えば、ある実装では、これらのシステムのうちの１つ以上のものは、別のシステムの一部であってもよい。例えば、コンテキスト情報分析システム６８８の一部は、個々に、または組み合わせて、アバタ自動スケーラ６９２、意図マッピングシステム６９４、刺激応答システム６９６、または解剖学的構造調節システム６９８の一部であってもよい。

コンテキスト情報分析システム６８８は、図２および３を参照して説明される、１つ以上のデバイスセンサに基づいて、環境およびオブジェクト情報を決定するように構成されることができる。例えば、コンテキスト情報分析システム６８８は、ユーザまたはユーザのアバタの視認者の外向きに向いた結像システム４６４によって入手された画像を使用して、環境およびユーザの環境のオブジェクト（物理的または仮想オブジェクトを含む）またはその中にユーザのアバタがレンダリングされる環境を分析することができる。コンテキスト情報分析システム６８８は、単独で、または場所データまたは世界マップ（例えば、マップ６２０、７１０、９１０）から入手されたデータと組み合わせて、そのような画像を分析し、環境内のオブジェクトの場所およびレイアウトを決定することができる。コンテキスト情報分析システム６８８はまた、仮想アバタ６７０を現実的にアニメーション化するために、ユーザまたはヒト全般の生物学的特徴にアクセスすることができる。例えば、コンテキスト情報分析システム６８８は、違和感曲線を生成することができ、これは、ユーザのアバタの身体の一部（例えば、頭部）がユーザの身体の他の部分に対して違和感のある（または非現実的）位置にないように（例えば、アバタの頭部は、２７０度方向転換されない）、アバタに適用されることができる。ある実装では、１つ以上のオブジェクト認識装置７０８（図７に示される）は、コンテキスト情報分析システム６８８の一部として実装されてもよい。

アバタ自動スケーラ６９２、意図マッピングシステム６９４、および刺激応答システム６９６、および解剖学的構造調節システム６９８は、コンテキスト情報に基づいて、アバタの特性を決定するように構成されることができる。アバタのいくつかの例示的特性は、サイズ、外観、位置、配向、移動、姿勢、表現等を含むことができる。アバタ自動スケーラ６９２は、ユーザがアバタを不快な姿勢で見る必要がないように、アバタを自動的にスケーリングするように構成されることができる。例えば、アバタ自動スケーラ６９２は、ユーザが、それぞれ、アバタを見下ろす、またはアバタを見上げる必要がないように、アバタのサイズを増加または減少させ、アバタをユーザの眼の高さに持って来ることができる。意図マッピングシステム６９４は、アバタがその中にレンダリングされる環境に基づいて、ユーザの相互作用の意図を決定し、（正確なユーザ相互作用ではなく）意図をアバタにマッピングすることができる。例えば、第１のユーザの意図は、テレプレゼンスセッションにおいて第２のユーザと通信することであり得る（例えば、図９Ｂ参照）。典型的には、２人が、通信するとき、相互に向かい合う。第１のユーザのウェアラブルシステムの意図マッピングシステム６９４は、テレプレゼンスセッションの間に存在するそのような対面意図を決定することができ、第１のユーザのウェアラブルシステムに、第２のユーザのアバタを第１のユーザに向かってレンダリングさせることができる。第２のユーザが、物理的に方向転換しようとする場合、第２のユーザのアバタを方向転換された位置にレンダリングする代わりに（第２のユーザのアバタの背面を第１のユーザに対してレンダリングさせるであろう）、第１のユーザの意図マッピングシステム６９４は、第２のアバタの顔を第１のユーザに対してレンダリングし続けることができ、これは、テレプレゼンスセッションの推測される意図（例えば、本実施例では、対面意図）である。

刺激応答システム６９６は、環境内の関心オブジェクトを識別し、関心オブジェクトに対するアバタの応答を決定することができる。例えば、刺激応答システム６９６は、アバタの環境内の音源を識別し、音源を見るようにアバタを自動的に方向転換させることができる。刺激応答システム６９６はまた、閾値終了条件を決定することができる。例えば、刺激応答システム６９６は、音源が消失した後またはある時間周期が経過した後、アバタをそのオリジナル姿勢に戻させることができる。

解剖学的構造調節システム６９８は、生物学的特徴に基づいて、ユーザの姿勢を調節するように構成されることができる。例えば、解剖学的構造調節システム６９８は、違和感曲線に基づいて、ユーザの頭部とユーザの胴体との間またはユーザの上半身と下半身との間の相対的位置を調節するように構成されることができる。

３Ｄモデル処理システム６８０は、仮想アバタ６７０をアニメーション化し、ディスプレイ２２０にレンダリングさせるように構成されることができる。３Ｄモデル処理システム６８０は、仮想キャラクタ処理システム６８２と、移動処理システム６８４とを含むことができる。仮想キャラクタ処理システム６８２は、ユーザの３Ｄモデルを生成および更新するように構成されることができる（仮想アバタを作成およびアニメーション化するため）。移動処理システム６８４は、例えば、アバタの姿勢を変化させることによって、アバタをユーザの環境内で移動させることによって、またはアバタの顔の表情をアニメーション化することによって等、アバタをアニメーション化するように構成されることができる。本明細書にさらに説明されるであろうように、仮想アバタは、リギング技法を使用して、アニメーション化されることができる。いくつかの実施形態では、アバタは、２つの部分、すなわち、仮想アバタの外向き外観をレンダリングするために使用される表面表現（例えば、変形可能メッシュ）と、メッシュをアニメーション化するために相互接続された関節の階層セット（例えば、コア骨格）とにおいて表される。いくつかの実装では、仮想キャラクタ処理システム６８２は、表面表現を編集または生成するように構成されることができる一方、移動処理システム６８４は、アバタを移動させる、メッシュを変形させる等によって、アバタをアニメーション化するために使用されることができる。
（ユーザの環境をマッピングする実施例）

図７は、ＭＲ環境７００の実施例のブロック図である。ＭＲ環境７００は、入力（例えば、ユーザのウェアラブルシステムからの視覚的入力７０２、室内カメラ等の定常入力７０４、種々のセンサからの感覚入力７０６、ユーザ入力デバイス４６６からのジェスチャ、トーテム、眼追跡、ユーザ入力等）を、１つ以上のユーザウェアラブルシステム（例えば、ウェアラブルシステム２００またはディスプレイシステム２２０）または定常室内システム（例えば、室内カメラ等）から受信するように構成されてもよい。ウェアラブルシステムは、種々のセンサ（例えば、加速度計、ジャイロスコープ、温度センサ、移動センサ、深度センサ、ＧＰＳセンサ、内向きに向いた結像システム、外向きに向いた結像システム等）を使用して、ユーザの環境の場所および種々の他の属性を決定することができる。本情報はさらに、異なる視点からの画像または種々のキューを提供し得る、部屋内の定常カメラからの情報で補完されてもよい。カメラ（室内カメラおよび／または外向きに向いた結像システムのカメラ等）によって入手された画像データは、マッピング点のセットに低減されてもよい。

１つ以上のオブジェクト認識装置７０８が、受信されたデータ（例えば、点の集合）を通してクローリングし、点を認識またはマッピングし、画像をタグ付けし、マップデータベース７１０を用いて、意味論情報をオブジェクトに結び付けることができる。マップデータベース７１０は、経時的に収集された種々の点およびその対応するオブジェクトを備えてもよい。種々のデバイスおよびマップデータベースは、ネットワーク（例えば、ＬＡＮ、ＷＡＮ等）を通して相互に接続され、クラウドにアクセスすることができる。

本情報およびマップデータベース内の点集合に基づいて、オブジェクト認識装置７０８ａ−７０８ｎは、環境内のオブジェクトを認識してもよい。例えば、オブジェクト認識装置は、顔、人物、窓、壁、ユーザ入力デバイス、テレビ、ドキュメント（例えば、本明細書におけるセキュリティ実施例において説明されるような旅券、運転免許証、パスポート）、ユーザの環境内の他のオブジェクト等を認識することができる。１つ以上のオブジェクト認識装置が、ある特性を伴うオブジェクトのために特殊化されてもよい。例えば、オブジェクト認識装置７０８ａは、顔を認識するために使用されてもよい一方、別のオブジェクト認識装置は、ドキュメントを認識するために使用されてもよい。

オブジェクト認識は、種々のコンピュータビジョン技法を使用して実施されてもよい。例えば、ウェアラブルシステムは、外向きに向いた結像システム４６４（図４に示される）によって入手された画像を分析し、場面再構成、イベント検出、ビデオ追跡、オブジェクト認識（例えば、人物またはドキュメント）、オブジェクト姿勢推定、顔認識（例えば、環境内の人物またはドキュメント上の画像から）、学習、インデックス化、運動推定、または画像分析（例えば、写真、署名、識別情報、旅行情報等のドキュメント内の印を識別する）等を実施することができる。１つ以上のコンピュータビジョンアルゴリズムが、これらのタスクを実施するために使用されてもよい。コンピュータビジョンアルゴリズムの非限定的実施例は、スケール不変特徴変換（ＳＩＦＴ）、スピードアップロバスト特徴（ＳＵＲＦ）、配向ＦＡＳＴおよび回転ＢＲＩＥＦ（ＯＲＢ）、バイナリロバスト不変スケーラブルキーポイント（ＢＲＩＳＫ）、高速網膜キーポイント（ＦＲＥＡＫ）、Ｖｉｏｌａ−Ｊｏｎｅｓアルゴリズム、Ｅｉｇｅｎｆａｃｅｓアプローチ、Ｌｕｃａｓ−Ｋａｎａｄｅアルゴリズム、Ｈｏｒｎ−Ｓｃｈｕｎｋアルゴリズム、Ｍｅａｎ−ｓｈｉｆｔアルゴリズム、視覚的同時位置推定およびマッピング（ｖＳＬＡＭ）技法、シーケンシャルベイズ推定器（例えば、カルマンフィルタ、拡張カルマンフィルタ等）、バンドル調節、適応閾値化（および他の閾値化技法）、反復最近傍点（ＩＣＰ）、セミグローバルマッチング（ＳＧＭ）、セミグローバルブロックマッチング（ＳＧＢＭ）、特徴点ヒストグラム、種々の機械学習アルゴリズム（例えば、サポートベクトルマシン、ｋ最近傍アルゴリズム、単純ベイズ、ニューラルネットワーク（畳み込みまたは深層ニューラルネットワークを含む）、または他の教師あり／教師なしモデル等）等を含む。

オブジェクト認識は、加えて、または代替として、種々の機械学習アルゴリズムによって実施されることができる。いったん訓練されると、機械学習アルゴリズムは、ＨＭＤによって記憶されることができる。機械学習アルゴリズムのいくつかの実施例は、教師ありまたは教師なし機械学習アルゴリズムを含むことができ、回帰アルゴリズム（例えば、通常の最小２乗回帰等）、インスタンスベースのアルゴリズム（例えば、学習ベクトル量子化等）、決定ツリーアルゴリズム（例えば、分類および回帰ツリー等）、ベイズアルゴリズム（例えば、単純ベイズ等）、クラスタリングアルゴリズム（例えば、ｋ−平均クラスタリング等）、関連付けルール学習アルゴリズム（例えば、アプリオリアルゴリズム等）、人工ニューラルネットワークアルゴリズム（例えば、Ｐｅｒｃｅｐｔｒｏｎ等）、深層学習アルゴリズム（例えば、ＤｅｅｐＢｏｌｔｚｍａｎｎＭａｃｈｉｎｅ、すなわち、深層ニューラルネットワーク等）、次元削減アルゴリズム（例えば、主成分分析等）、アンサンブルアルゴリズム（例えば、ＳｔａｃｋｅｄＧｎｅｒａｌｉｚａｔｉｏｎ等）、および／または他の機械学習アルゴリズムを含む。いくつかの実施形態では、個々のモデルは、個々のデータセットのためにカスタマイズされることができる。例えば、ウェアラブルデバイスは、ベースモデルを生成または記憶することができる。ベースモデルは、開始点として使用され、データタイプ（例えば、テレプレゼンスセッション内の特定のユーザ）、データセット（例えば、テレプレゼンスセッション内のユーザの取得される付加的画像のセット）、条件付き状況、または他の変形例に特有の付加的モデルを生成してもよい。いくつかの実施形態では、ウェアラブルＨＭＤは、複数の技法を利用して、集約されたデータの分析のためのモデルを生成するように構成されることができる。他の技法は、事前に定義された閾値またはデータ値を使用することを含んでもよい。

マップデータベース内の本情報および点の集合に基づいて、オブジェクト認識装置７０８ａ−７０８ｎは、オブジェクトを認識し、オブジェクトを意味論情報で補完し、生命をオブジェクトに与えてもよい。例えば、オブジェクト認識装置が、点のセットがドアであることを認識する場合、システムは、いくつかの意味論情報を結び付けてもよい（例えば、ドアは、ヒンジを有し、ヒンジを中心として９０度移動を有する）。オブジェクト認識装置が、点のセットが鏡であることを認識する場合、システムは、鏡が、部屋内のオブジェクトの画像を反射させ得る、反射表面を有するという意味論情報を結び付けてもよい。意味論情報は、本明細書に説明されるように、オブジェクトのアフォーダンスを含むことができる。例えば、意味論情報は、オブジェクトの法線を含んでもよい。システムは、ベクトルを割り当てることができ、その方向は、オブジェクトの法線を示す。経時的に、マップデータベースは、システム（ローカルに常駐し得る、または無線ネットワークを通してアクセス可能であり得る）がより多くのデータを世界から蓄積するにつれて成長する。いったんオブジェクトが認識されると、情報は、１つ以上のウェアラブルシステムに伝送されてもよい。例えば、ＭＲ環境７００は、Ｃａｌｉｆｏｒｎｉａで発生している場面についての情報を含んでもよい。環境７００は、ＮｅｗＹｏｒｋにおける１人以上のユーザに伝送されてもよい。ＦＯＶカメラおよび他の入力から受信されたデータに基づいて、オブジェクト認識装置および他のソフトウェアコンポーネントは、場面が世界の異なる部分に存在し得る第２のユーザに正確に「パス」され得るように、種々の画像から収集された点をマッピングし、オブジェクトを認識すること等ができる。環境７００はまた、位置特定目的のために、トポロジマップを使用してもよい。

図８は、認識されたオブジェクトに関連して仮想コンテンツをレンダリングする方法８００の実施例のプロセスフロー図である。方法８００は、仮想場面がウェアラブルシステムのユーザに提示され得る方法を説明する。ユーザは、その場面から地理的に遠隔に存在してもよい。例えば、ユーザは、ＮｅｗＹｏｒｋに存在し得るが、Ｃａｌｉｆｏｒｎｉａで現在起こっている場面を視認することを所望し得る、またはＣａｌｉｆｏｒｎｉａに存在する友人と散歩に行くことを所望し得る。

ブロック８１０では、ウェアラブルシステムは、ユーザの環境に関する入力をユーザおよび他のユーザから受信してもよい。これは、種々の入力デバイスおよびマップデータベース内にすでに保有されている知識を通して達成されてもよい。ユーザのＦＯＶカメラ、センサ、ＧＰＳ、眼追跡等が、ブロック８１０において、情報をシステムに伝達する。システムは、ブロック８２０において、本情報に基づいて、疎点を決定してもよい。疎点は、ユーザの周囲における種々のオブジェクトの配向および位置を表示および理解する際に使用され得る、姿勢データ（例えば、頭部姿勢、眼姿勢、身体姿勢、または手のジェスチャ）を決定する際に使用されてもよい。オブジェクト認識装置７０８ａ〜７０８ｎは、ブロック８３０において、これらの収集された点を通してクローリングし、マップデータベースを使用して、１つ以上のオブジェクトを認識してもよい。本情報は、次いで、ブロック８４０において、ユーザの個々のウェアラブルシステムに伝達されてもよく、所望の仮想場面が、ブロック８５０において、適宜、ユーザに表示されてもよい。例えば、所望の仮想場面（例えば、ＣＡにおけるユーザ）が、ＮｅｗＹｏｒｋにおけるユーザの種々のオブジェクトおよび他の周囲に関連して、適切な配向、位置等において表示されてもよい。
（複数のウェアラブルシステム間の例示的通信）

図９Ａは、相互に相互作用する複数のユーザデバイスを描写する、全体的システム図を図式的に図示する。コンピューティング環境９００は、ユーザデバイス９３０ａ、９３０ｂ、９３０ｃを含む。ユーザデバイス９３０ａ、９３０ｂ、および９３０ｃは、ネットワーク９９０を通して、相互に通信することができる。ユーザデバイス９３０ａ−９３０ｃはそれぞれ、ネットワークインターフェースを含み、ネットワーク９９０を介して、遠隔コンピューティングシステム９２０（また、ネットワークインターフェース９７１を含んでもよい）と通信することができる。ネットワーク９９０は、ＬＡＮ、ＷＡＮ、ピアツーピアネットワーク、無線、Ｂｌｕｅｔｏｏｔｈ（登録商標）、または任意の他のネットワークであってもよい。コンピューティング環境９００はまた、１つ以上の遠隔コンピューティングシステム９２０を含むことができる。遠隔コンピューティングシステム９２０は、クラスタ化され、異なる地理的場所に位置する、サーバコンピュータシステムを含んでもよい。ユーザデバイス９３０ａ、９３０ｂ、および９３０ｃは、ネットワーク９９０を介して、遠隔コンピューティングシステム９２０と通信してもよい。

遠隔コンピューティングシステム９２０は、遠隔データリポジトリ９８０を含んでもよく、これは、具体的ユーザの物理および／または仮想世界についての情報を維持することができる。データ記憶装置９８０は、ユーザ、ユーザの環境（例えば、ユーザの環境の世界マップ）、またはユーザのアバタの構成に関連する情報を記憶することができる。遠隔データリポジトリは、図２に示される遠隔データリポジトリ２８０の実施形態であってもよい。遠隔コンピューティングシステム９２０はまた、遠隔処理モジュール９７０を含んでもよい。遠隔処理モジュール９７０は、図２に示される遠隔処理モジュール９７０の実施形態であってもよい。遠隔処理モジュール９７０は、１つ以上のプロセッサを含んでもよく、これは、ユーザデバイス（９３０ａ、９３０ｂ、９３０ｃ）および遠隔データリポジトリ９８０と通信することができる。プロセッサは、ユーザデバイスおよび他の源から取得される情報を処理することができる。いくつかの実装では、処理または記憶の少なくとも一部は、ローカル処理およびデータモジュール２６０（図２に示されるように）によって提供されることができる。遠隔コンピューティングシステム９２０は、所与のユーザが、具体的ユーザ自身の物理的および／または仮想世界についての情報を別のユーザと共有することを可能にしてもよい。

ユーザデバイスは、単独で、または組み合わせて、ウェアラブルデバイス（ＨＭＤまたはＡＲＤ等）、コンピュータ、モバイルデバイス、または任意の他のデバイスであってもよい。例えば、ユーザデバイス９３０ｂおよび９３０ｃは、図２に示されるウェアラブルシステム２００（または図４に示されるウェアラブルシステム４００）の実施形態であってもよく、これは、ＡＲ／ＶＲ／ＭＲコンテンツを提示するように構成されることができる。

ユーザデバイスのうちの１つ以上のものは、図４に示されるユーザ入力デバイス４６６と併用されることができる。ユーザデバイスは、ユーザおよびユーザの環境についての情報を取得することができる（例えば、図４に示される外向きに向いた結像システム４６４を使用して）。ユーザデバイスおよび／または遠隔コンピューティングシステム１２２０は、ユーザデバイスから取得される情報を使用して、画像、点、および他の情報の集合を構築、更新、および建造することができる。例えば、ユーザデバイスは、入手された未加工情報を処理し、さらなる処理のために、処理された情報を遠隔コンピューティングシステム１２２０に送信してもよい。ユーザデバイスはまた、処理のために、未加工情報を遠隔コンピューティングシステム１２２０に送信してもよい。ユーザデバイスは、処理された情報を遠隔コンピューティングシステム１２２０から受信し、ユーザに投影させる前に、最終処理を提供してもよい。ユーザデバイスはまた、取得された情報を処理し、処理された情報を他のユーザデバイスに渡してもよい。ユーザデバイスは、入手された情報を処理しながら、遠隔データリポジトリ１２８０と通信してもよい。複数のユーザデバイスおよび／または複数のサーバコンピュータシステムが、入手された画像の構築および／または処理に関与してもよい。

物理的世界に関する情報は、経時的に展開されてもよく、異なるユーザデバイスによって収集される情報に基づいてもよい。仮想世界のモデルはまた、経時的に展開され、異なるユーザの入力に基づいてもよい。そのような情報およびモデルは、時として、本明細書では、世界マップまたは世界モデルと称され得る。図６および７を参照して説明されるように、ユーザデバイスによって入手された情報は、世界マップ９１０を構築するために使用されてもよい。世界マップ９１０は、図６Ａに説明されるマップ６２０の少なくとも一部を含んでもよい。種々のオブジェクト認識装置（例えば、７０８ａ、７０８ｂ、７０８ｃ…７０８ｎ）が、オブジェクトおよびタグ画像を認識するため、および意味論情報をオブジェクトに付加するために使用されてもよい。これらのオブジェクト認識装置はまた、図７に説明される。

遠隔データリポジトリ９８０は、データを記憶し、世界マップ９１０の構造を促進するために使用されることができる。ユーザデバイスは、ユーザの環境についての情報を常に更新し、世界マップ９１０についての情報を受信することができる。世界マップ９１０は、ユーザまたは別の人物によって作成されてもよい。本明細書に議論されるように、ユーザデバイス（例えば、９３０ａ、９３０ｂ、９３０ｃ）および遠隔コンピューティングシステム９２０は、単独で、または組み合わせて、世界マップ９１０を構築および／または更新してもよい。例えば、ユーザデバイスは、遠隔処理モジュール９７０および遠隔データリポジトリ９８０と通信してもよい。ユーザデバイスは、ユーザおよびユーザの環境についての情報を入手または処理してもよい。遠隔処理モジュール９７０は、遠隔データリポジトリ９８０およびユーザデバイス（例えば、９３０ａ、９３０ｂ、９３０ｃ）と通信し、ユーザおよびユーザの環境についての情報を処理してもよい。遠隔コンピューティングシステム９２０は、例えば、ユーザの画像を選択的にクロッピングする、ユーザの背景を修正する、仮想オブジェクトをユーザの環境に追加する、ユーザの発話に補助情報で注釈を付ける等、ユーザデバイス（例えば、９３０ａ、９３０ｂ、９３０ｃ）によって入手された情報を修正することができる。遠隔コンピューティングシステム９２０は、処理された情報を同一または異なるユーザデバイスに送信することができる。
（テレプレゼンスセッションの実施例）

図９Ｂは、個別のウェアラブルシステムの２人のユーザがテレプレゼンスセッションを行っている、実施例を描写する。２人のユーザ（本実施例では、Ａｌｉｃｅ９１２およびＢｏｂ９１４と命名される）が、本図に示される。２人のユーザは、その個別のウェアラブルデバイス９０２および９０４を装着しており、これは、テレプレゼンスセッションにおいて他のユーザの仮想アバタを表すために、図２を参照して説明される、ＨＭＤ（例えば、システム２００のディスプレイデバイス２２０）を含むことができる。２人のユーザは、ウェアラブルデバイスを使用して、テレプレゼンスセッションを行うことができる。２人のユーザを分離する、図９Ｂにおける垂直線は、Ａｌｉｃｅ９１２およびＢｏｂ９１４が、テレプレゼンスを介して彼らが通信する間、２つの異なる場所に存在し得る（但し、その必要はない）（例えば、Ａｌｉｃｅは、Ａｔｌａｎｔａにおけるそのオフィス内に存在し得る一方、Ｂｏｂは、Ｂｏｓｔｏｎの屋外に存在する）ことを図示するように意図されることに留意されたい。

図９Ａを参照して説明されるように、ウェアラブルデバイス９０２および９０４は、相互または他のユーザデバイスおよびコンピュータシステムと通信してもよい。例えば、Ａｌｉｃｅのウェアラブルデバイス９０２は、例えば、ネットワーク９９０（図９Ａに示される）を介して、Ｂｏｂのウェアラブルデバイス９０４と通信してもよい。ウェアラブルデバイス９０２および９０４は、ユーザの環境および環境内の移動（例えば、個別の外向きに向いた結像システム４６４または１つ以上の場所センサを介して）および発話（例えば、個別のオーディオセンサ２３２を介して）を追跡することができる。ウェアラブルデバイス９０２および９０４はまた、内向きに向いた結像システム４６２によって入手されたデータに基づいて、ユーザの眼移動または視線を追跡することができる。いくつかの状況では、ウェアラブルデバイスはまた、ユーザが反射性表面の近傍に存在する場合、ユーザの顔の表情または他の身体移動（例えば、腕または脚部移動）を捕捉または追跡することができ、外向きに向いた結像システム４６４は、ユーザの反射された画像を取得し、ユーザの顔の表情または他の身体移動を観察することができる。

ウェアラブルデバイスは、第１のユーザおよび環境の入手された情報を使用して、第２のユーザのウェアラブルデバイスによってレンダリングされ、第２のユーザの環境内における第１のユーザの存在の有形感覚を作成するであろう、仮想アバタをアニメーション化することができる。例えば、ウェアラブルデバイス９０２および９０４および遠隔コンピューティングシステム９２０は、単独で、または組み合わせて、Ｂｏｂのウェアラブルデバイス９０４による提示のために、Ａｌｉｃｅの画像または移動を処理してもよい、またはＡｌｉｃｅのウェアラブルデバイス９０２による提示のために、Ｂｏｂの画像または移動を処理してもよい。本明細書にさらに説明されるように、アバタは、例えば、ユーザの意図、ユーザの環境またはその中にアバタがレンダリングされる環境、またはヒトの他の生物学的特徴等のコンテキスト情報に基づいて、レンダリングされることができる。

実施例は、２人のみのユーザを参照するが、本明細書に説明される技法は、２人のユーザに限定されるべきではない。ウェアラブルデバイス（または他のテレプレゼンスデバイス）を使用する、複数のユーザ（例えば、２人、３人、４人、５人、６人、またはそれを上回る）が、テレプレゼンスセッションに参加してもよい。特定のユーザのウェアラブルデバイスは、テレプレゼンスセッションの間、その特定のユーザに、他のユーザのアバタを提示することができる。さらに、本図における実施例は、環境内に立っているユーザを示すが、ユーザは、立っているように要求されない。ユーザのいずれかは、テレプレゼンスセッションの間、立っている、座っている、膝をついている、横になっている、歩いている、または走っていてもよい、または任意の位置または移動状態にあってもよい。ユーザはまた、本明細書の実施例に説明される以外の物理的環境内に存在してもよい。ユーザは、テレプレゼンスセッションを行っている間、別個の環境内に存在してもよい、または同一環境内に存在してもよい。全てのユーザが、テレプレゼンスセッションにおいて、その個別のＨＭＤを装着することが要求されるわけではない。例えば、Ａｌｉｃｅ９１２は、ウェブカメラおよびコンピュータ画面等の他の画像入手およびディスプレイデバイスを使用してもよい一方、Ｂｏｂ９１４は、ウェアラブルデバイス９０４を装着する。
（仮想アバタの実施例）

図１０は、ウェアラブルシステムのユーザによって知覚されるようなアバタの実施例を図示する。図１０に示される例示的アバタ１０００は、部屋内の物理的植物の背後に立っている、Ａｌｉｃｅ９１２（図９Ｂに示される）のアバタであることができる。アバタは、例えば、サイズ、外観（例えば、肌色、顔色、髪型、衣類、およびしわ、ほくろ、しみ、にきび、えくぼ等の顔特徴）、位置、配向、移動、姿勢、表現等の種々の特性を含むことができる。これらの特性は、アバタと関連付けられたユーザに基づいてもよい（例えば、Ａｌｉｃｅのアバタ１０００は、実際の人物Ａｌｉｃｅ９１２の一部または全部の特性を有してもよい）。本明細書にさらに説明されるように、アバタ１０００は、コンテキスト情報に基づいて、アニメーション化されることができ、これは、アバタ１０００の特性のうちの１つ以上のものに対する調節を含むことができる。概して、人物（例えば、Ａｌｉｃｅ）の物理的外観を表すように本明細書に説明されるが、これは、限定ではなく、例証のためのものである。Ａｌｉｃｅのアバタは、Ａｌｉｃｅ以外の別の実際または架空のヒト、擬人化されたオブジェクト、創造物、または任意の他の実際または架空の表現の外観を表し得る。さらに、図１０における植物は、物理的である必要はなく、ウェアラブルシステムによってユーザに提示される植物の仮想表現であり得る。また、図１０に示されるものの付加的または異なる仮想コンテンツも、ユーザに提示され得る。
（仮想キャラクタのためのリギングシステムの実施例）

ヒトアバタ等のアニメーション化された仮想キャラクタが、全体的または部分的に、コンピュータグラフィック内にポリゴンメッシュとして表されることができる。ポリゴンメッシュ、または略して、単に、「メッシュ」は、モデル化された３次元空間内の点の集合である。メッシュは、その表面が仮想キャラクタ（またはその一部）の身体または形状を定義する、多角形オブジェクトを形成することができる。メッシュは、任意の数の点を含むことができるが（利用可能なコンピューティングパワーによって課され得る、実践的限界内において）、より多くの点を伴うより細かいメッシュは、概して、実在の人々、動物、オブジェクト等により近似し得る、より細かい詳細を伴うより現実的仮想キャラクタを描写することが可能である。図１０は、アバタ１０００の眼の周囲のメッシュ１０１０の実施例を示す。

メッシュ内の各点は、モデル化された３次元空間内の座標によって定義されることができる。モデル化された３次元空間は、例えば、（ｘ，ｙ，ｚ）座標によってアドレス指定されるデカルト空間であることができる。メッシュ内の点は、ポリゴンの頂点であって、これは、多角形オブジェクトを構成する。各ポリゴンは、多角形オブジェクトの表面、すなわち、面を表し、頂点の順序付けられたセットによって定義され、各ポリゴンの辺は、頂点の順序付けられたセットを接続する、直線縁である。ある場合には、メッシュ内のポリゴン頂点は、それらが必ずしも３Ｄグラフィック内において同一平面にあるわけではないという点で、幾何学的ポリゴンと異なり得る。加えて、メッシュ内のポリゴンの頂点は、共線形であり得、その場合、ポリゴンは、ゼロ面積を有する（縮退ポリゴンと称される）。

いくつかの実施形態では、メッシュは、３頂点ポリゴン（すなわち、略して、三角形または「三角」）または４頂点ポリゴン（すなわち、略して、四辺形または「四角」）から成る。しかしながら、高次ポリゴンもまた、いくつかのメッシュでは使用されることができる。メッシュは、直接コンテンツ作成（ＤＣＣ）アプリケーション（例えば、主に、３Ｄコンピュータグラフィックを作成および操作するために設計される、Ｍａｙａ（Ａｕｔｏｄｅｓｋ，Ｉｎｃ．から利用可能）またはＨｏｕｄｉｎｉ（ＳｉｄｅＥｆｆｅｃｔｓＳｏｆｔｗａｒｅＩｎｃ．から利用可能）等のアプリケーション）では、典型的には、四角ベースである一方、メッシュは、リアルタイムアプリケーションでは、典型的には、三角ベースである。

仮想キャラクタをアニメーション化するために、そのメッシュは、その頂点の一部または全部を種々の瞬間における空間内の新しい位置に移動させることによって変形されることができる。変形は、大規模移動（例えば、四肢の移動）および微細移動（例えば、顔移動）の両方を表すことができる。これらおよび他の変形は、実世界モデル（例えば、身体移動、関節運動、顔のゆがみ、表情等を実施する、実際のヒトの写真測量走査）、芸術指向的展開（実世界サンプリングに基づいてもよい）、それらの組み合わせ、または他の技法に基づくことができる。コンピュータグラフィックの初期の段階では、メッシュ変形は、頂点のための新しい位置を独立して設定することによって手動で遂行され得たが、現代のメッシュのサイズおよび複雑性を前提として、典型的には、自動化されたシステムおよびプロセスを使用して変形を生産することが望ましい。これらの変形を生産するための制御システム、プロセス、および技法は、リギング、または単に、「リグ」と称される。図６Ｂの例示的アバタ処理およびレンダリングシステム６９０は、３Ｄモデル処理システム６８０を含み、これは、リギングを実装することができる。

仮想キャラクタのためのリギングは、骨格系を使用して、メッシュ変形を補助することができる。骨格系は、関節の集合を含み、これは、メッシュのための関節運動の点に対応する。リギングのコンテキストでは、関節は、解剖学的意味において使用されるときのこれらの用語間の差異にもかかわらず、時として、「ボーン」とも称される。骨格系内の関節は、関節に適用され得る、変換に従って、相互に対して移動または別様に変化することができる。変換は、空間内の平行移動または回転および他の動作を含むことができる。関節は、相互に対して階層関係（例えば、親−子関係）を割り当てられることができる。これらの階層関係は、ある関節が、別の関節からの変換または他の特性を継承することを可能にすることができる。例えば、骨格系内の子関節は、子関節を親関節とともに移動させるように、その親関節に割り当てられた変換を継承することができる。

仮想キャラクタのための骨格系は、適切な位置における関節を用いて、かつ適切な局所回転軸、自由度等を用いて、定義され、所望のセットのメッシュ変形が行われることを可能にすることができる。いったん骨格系が、仮想キャラクタのために定義されると、各関節は、「スキニング」と呼ばれるプロセスにおいて、メッシュ内の種々の頂点に及ぼす影響の量を割り当てられることができる。これは、骨格系内の関節毎に、加重値を各頂点に割り当てることによって行われることができる。変換が、任意の所与の関節に適用されると、その影響下の頂点は、その個別の加重値に依存し得る量だけ、その関節変換に基づいて、自動的に移動または別様に改変されることができる。

リグは、複数の骨格系を含むことができる。１つのタイプの骨格系は、コア骨格（低次骨格とも称される）であって、これは、仮想キャラクタの大規模移動を制御するために使用され得る。例えば、ヒトアバタの場合、コア骨格は、ヒトの解剖学的骨格に類似し得る。リギング目的のためのコア骨格は、解剖学的に正しい骨格に正確にマッピングされ得ないが、類似配向および移動性質を伴う類似場所における関節のサブセットを有し得る。

上記に簡単に述べられたように、関節の骨格系は、例えば、関節間の親−子関係を伴う、階層であることができる。変換（例えば、位置および／または配向の変化）が、骨格系内の特定の関節に適用されると、同一変換が、同一階層内の全ての他のより低いレベルの関節に適用されることができる。例えば、ヒトアバタのためのリグの場合、コア骨格は、アバタの肩、肘、および手首のための別個の関節を含んでもよい。これらのうち、肩関節は、階層内で最高レベルを割り当てられてもよい一方、肘関節は、肩関節の子として割り当てられることができ、手首関節は、肘関節の子として割り当てられることができる。故に、特定の平行移動および／または回転変換が、肩関節に適用されると、同一変換がまた、肩と同一方法において平行移動および／または回転されるように、肘関節および手首関節にも適用されることができる。

その名称の含蓄にもかかわらず、リグ内の骨格系は、必ずしも、解剖学的骨格を表す必要はない。リギングでは、骨格系は、メッシュの変形を制御するために使用される、様々な階層を表すことができる。例えば、髪は、階層連鎖内の一連の関節として表され得、アバタの顔のゆがみに起因する、皮膚の動き（笑顔、眉を顰める、笑う、発話する、瞬目等の表情を表し得る）は、顔リグによって制御される一連の顔関節によって表され得、筋肉変形は、関節によってモデル化されることができ、衣類の動きは、関節のグリッドによって表され得る。

仮想キャラクタのためのリグは、複数の骨格系を含むことができ、そのうちのいくつかは、その他の移動を駆動し得る。低次骨格系は、１つ以上の高次骨格系を駆動するものである。逆に言えば、高次骨格系は、低次骨格系によって駆動または制御されるものである。例えば、キャラクタのコア骨格の移動は、アニメータによって手動で制御され得るが、コア骨格は、ひいては、高次骨格系の移動を駆動または制御することができる。例えば、高次ヘルパ関節（物理的骨格内の解剖学的類似物を有していなくてもよい）が、コア骨格の移動から生じる、メッシュ変形を改良するために提供されることができる。高次骨格系内のこれらおよび他の関節に適用される変換は、低次骨格に適用される変換からアルゴリズム的に導出されてもよい。高次骨格は、例えば、筋肉、皮膚、脂肪、衣類、髪、または任意の他の骨格系を表すことができ、これは、直接アニメーション制御を要求しない。

すでに議論されたように、変換は、メッシュ変形を行うために、骨格系内の関節に適用されることができる。リギングのコンテキストでは、変換は、３Ｄ空間内の１つ以上の所与の点を受け取り、１つ以上の新しい３Ｄ点の出力を生産する、機能を含む。例えば、変換は、関節を定義する、１つ以上の３Ｄ点を受け取ることができ、変換された関節を規定する、１つ以上の新しい３Ｄ点を出力することができる。関節変換は、例えば、平行移動成分、回転成分、およびスケール成分を含むことができる。

平行移動は、点のセットの配向またはサイズの変化を伴わずに、モデル化された３Ｄ空間内で１つ以上の規定された点のセットを規定された量だけ移動させる、変換である。回転は、規定された量だけ、モデル化された３Ｄ空間内で１つ以上の規定された点のセットを規定された軸を中心として回転させる（例えば、メッシュ内の全ての点をｚ−軸を中心として４５度回転させる）、変換である。アフィン変換（または６自由度（ＤＯＦ）変換）は、平行移動および回転のみを含むものである。アフィン変換の適用は、そのサイズを変化させずに（但し、配向は、変化することができる）、空間内の１つ以上の点のセットを移動させることであると見なされ得る。

一方、スケール変換は、その個別の座標を規定された値だけスケーリングすることによって、モデル化された３Ｄ空間内の１つ以上の規定された点を修正するものである。これは、点の変換されたセットのサイズおよび／または形状を変化させる。均一スケール変換は、同一量だけ各座標をスケーリングする一方、非均一スケール変換は、規定された点の（ｘ，ｙ，ｚ）座標を独立してスケーリングすることができる。非均一スケール変換は、例えば、筋肉作用から生じ得るもの等の収縮および伸展効果を提供するために使用されることができる。さらに別のタイプの変換は、剪断変換である。剪断変換は、軸からのその座標の距離に基づいて、異なる量だけ点の座標を平行移動させることによって、モデル化された３Ｄ空間内の１つ以上の規定された点のセットを修正するものである。

変換が、関節に適用され、それを移動させると、その関節の影響下の頂点もまた、移動される。これは、メッシュの変形をもたらす。上記に議論されるように、加重を割り当て、各関節が各頂点に及ぼす影響を定量化するプロセスは、スキニング（または時として、「加重ペインティング」または「スキン加重」）と呼ばれる。加重は、典型的には、０（無影響を意味する）と１（完全影響を意味する）との間の値である。メッシュ内のいくつかの頂点は、単一関節によってのみ影響され得る。その場合、それらの頂点は、その関節のために、１の加重値を割り当てられ、その位置は、その他ではなく、その具体的関節に割り当てられた変換に基づいて変化される。メッシュ内の他の頂点は、複数の関節によって影響され得る。その場合、別個の加重が、影響を及ぼす関節の全てのために、それらの頂点に割り当てられ、頂点毎の加重の和は、１に等しい。これらの頂点の位置は、その影響を及ぼす関節の全てに割り当てられる変換に基づいて、変化される。

メッシュ内の頂点の全てのための加重割当を行うことは、特に、関節の数が増加するにつれて、極度に労働集約的となり得る。関節に適用される変換に応答して、加重を平衡し、所望のメッシュ変形を達成することは、高度に訓練された専門家にとってさえ非常に困難であり得る。リアルタイムアプリケーションの場合、タスクは、多くのリアルタイムシステムがまた、具体的頂点に加重され得る、関節の数（概して、８つまたはより少ない）に関する限界を強いるという事実によって、さらに複雑になり得る。そのような限界は、典型的には、グラフィック処理ユニット（ＧＰＵ）内の効率の目的のために課される。

用語「スキニング」はまた、骨格系内の関節に適用される変換に基づいて、割り当てられた加重を使用して、メッシュを実際に変形させるプロセスを指す。例えば、一連のコア骨格関節変換が、アニメータによって、所望のキャラクタ移動（例えば、走っている動きまたはダンスステップ）を生産するように規定され得る。変換が、関節のうちの１つ以上のものに適用されると、新しい位置が、変換された関節の影響下の頂点のために計算される。任意の所与の頂点のための新しい位置は、典型的には、その特定の頂点に影響を及ぼす、全ての関節変換の加重平均として算出される。本加重平均を算出するために使用される、多くのアルゴリズムが存在するが、最も一般的であって、かつその単純性および制御の容易性に起因して、大部分のリアルタイムアプリケーションにおいて使用されるものは、線形ブレンドスキニング（ＬＢＳ）である。線形ブレンドスキニングでは、頂点毎の新しい位置が、それに関してその頂点が非ゼロ加重を有する、各関節変換を使用して計算される。次いで、これらの関節変換のそれぞれから生じる、新しい頂点座標が、関節毎のその頂点に割り当てられる個別の加重に比例して平均される。実際は、ＬＢＳに対する周知の限界が存在し、高品質リグを作成する際の作業の多くは、これらの限界を見出し、克服することに費やされる。多くのヘルパ関節システムが、本目的のために具体的に設計される。

骨格系に加え、「ブレンドシェイプ」はまた、リギングにおいて、メッシュ変形を生産するためにも使用されることができる。ブレンドシェイプ（時として、「モーフ標的」または単に「形状」とも呼ばれる）は、メッシュ内の頂点のセットに適用される変形であって、セット内の各頂点は、加重に基づいて、規定された量だけ規定された方向に移動する。セット内の各頂点は、具体的ブレンドシェイプのためのその独自のカスタム運動を有し得、セット内の頂点を同時に移動させることは、所望の形状を生成するであろう。ブレンドシェイプ内の頂点毎のカスタム運動は、「デルタ」によって規定されることができ、これは、その頂点に適用されるＸＹＺ運動の量および方向を表す、ベクトルである。ブレンドシェイプは、例えば、顔変形を生産し、いくつかの可能性のみを挙げると、眼、唇、眉、鼻、えくぼ等を移動させるために使用されることができる。

ブレンドシェイプは、芸術指向的方法においてメッシュを変形させるために有用である。それらは、正確な形状がモデルの走査からスカルピングまたは捕捉され得るにつれて、大量の制御をもたらす。しかし、ブレンドシェイプの利点は、ブレンドシェイプ内の全ての頂点のためのデルタを記憶する必要があることを代償とする。細かいメッシュおよび多くのブレンドシェイプを伴うアニメーション化されたキャラクタに関して、デルタデータの量は、有意となり得る。

各ブレンドシェイプは、ブレンドシェイプ加重を使用することによって、規定された程度まで適用されることができる。これらの加重は、典型的には、０（ブレンドシェイプは、全く適用されない）から１（ブレンドシェイプが、完全にアクティブである）に及ぶ。例えば、キャラクタの眼を移動させるためのブレンドシェイプは、眼を小量だけ移動させるための小加重を伴って適用されることができる、またはより大きい眼移動を作成するための大加重を伴って適用されることができる。

リグは、相互に組み合わせて、所望の複雑な変形を達成するために、複数のブレンドシェイプに適用されてもよい。例えば、笑顔を生産するために、リグは、口角を引っ張り、上唇を持ち上げ、下唇を下げ、および眼、眉、鼻、およびえくぼを移動させるために、ブレンドシェイプに適用されてもよい。２つ以上のブレンドシェイプを組み合わせることからの所望の形状は、組み合わせ形状（または単に、「コンボ」）として知られる。

２つのブレンドシェイプを組み合わせて適用することから生じ得る、１つの問題は、ブレンドシェイプが、同一頂点のうちのいくつかに作用し得ることである。両ブレンドシェイプが、アクティブであるとき、結果は、二重変換または「離脱モデル」と呼ばれる。これに対するソリューションは、典型的には、補正ブレンドシェイプである。補正ブレンドシェイプは、中立点に対する所望の変形を表すのではなく、現在適用されている変形に対する所望の変形を表す、特殊ブレンドシェイプである。補正ブレンドシェイプ（または単に、「補正」）は、それらが補正するブレンドシェイプの加重に基づいて、適用されることができる。例えば、補正ブレンドシェイプのための加重は、補正ブレンドシェイプの適用をトリガする、下層ブレンドシェイプの加重に比例するように行われることができる。

補正ブレンドシェイプはまた、スキニング異常を補正する、または変形の品質を改良するために使用されることができる。例えば、関節が、具体的筋肉の運動を表し得るが、単一変換として、皮膚、脂肪、および筋肉の全ての非線形挙動を表すことができない。筋肉がアクティブ化するにつれて、補正または一連の補正を適用することは、より魅力的かつ説得力のある変形をもたらし得る。

リグは、層内に構築され、より低次かつ単純な層は、多くの場合、高次層を駆動する。これは、骨格系およびブレンドシェイプ変形の両方に適用される。例えば、すでに述べられたように、アニメーション化された仮想キャラクタのためのリギングは、低次骨格系によって制御される、高次骨格系を含んでもよい。制約、論理システム、および姿勢ベースの変形を含む、低次骨格に基づいて、高次骨格またはブレンドシェイプを制御するための多くの方法が存在する。

制約は、典型的には、特定のオブジェクトまたは関節変換が、別の関節またはオブジェクトに適用される変換の１つ以上の成分を制御する、システムである。多くの異なるタイプの制約が、存在する。例えば、照準制約は、標的変換の回転を変化させ、具体的方向または具体的オブジェクトに向ける。親制約は、対の変換間の仮想親−子関係として作用する。位置制約は、変換を具体的点または具体的オブジェクトに制約する。配向制約は、変換をオブジェクトの具体的回転に制約する。

論理システムは、入力のセットを前提として、いくつかの出力を生産する、数学的方程式のシステムである。これらは、学習されるのではなく、規定される。例えば、あるブレンドシェイプ値が、２つの他のブレンドシェイプの積として定義され得る（これは、組み合わせまたはコンボ形状として知られる補正形状の実施例である）。

姿勢ベースの変形もまた、高次骨格系またはブレンドシェイプを制御するために使用されることができる。骨格系の姿勢は、その骨格系内の全ての関節のための変換（例えば、回転および平行移動）の集合によって定義される。姿勢はまた、骨格系内の関節のサブセットのためにも定義されることができる。例えば、腕姿勢が、肩、肘、および手首関節に適用される変換によって定義され得る。姿勢空間デフォーマ（ＰＳＤ）は、特定の姿勢と定義された姿勢との間の１つ以上の「距離」に基づいて、その姿勢のための変形出力を決定するために使用される、システムである。これらの距離は、姿勢のうちの１つが他のものと異なる程度を特性評価する、メトリックであることができる。ＰＳＤは、姿勢補間ノードを含むことができ、これは、例えば、関節回転（姿勢を定義する）のセットを入力パラメータとして受け取り、ひいては、正規化された姿勢毎の加重を出力し、ブレンドシェイプ等のデフォーマを駆動する。姿勢補間ノードは、放射基底関数（ＲＢＦ）を用いたものを含む、種々の方法において実装されることができる。ＲＢＦは、関数の機械学習された数学的近似を実施することができる。ＲＢＦは、入力およびその関連付けられた予期される出力のセットを使用して、訓練されることができる。訓練データは、例えば、関節変換（特定の姿勢を定義する）およびそれらの姿勢に応答して適用されるべき対応するブレンドシェイプの複数のセットであり得る。いったん関数が、学習されると、新しい入力（例えば、姿勢）が、与えられることができ、その予期される出力が、効率的に算出されることができる。ＲＢＦは、人工ニューラルネットワークの亜種である。ＲＢＦは、より低いレベルの成分の状態に基づいて、リグのより高いレベルの成分を駆動するために使用されることができる。例えば、コア骨格の姿勢は、より高いレベルにおいて、ヘルパ関節および補正を駆動することができる。

これらの制御システムは、ともに連鎖化され、複雑な挙動を実施することができる。実施例として、眼リグは、水平および垂直回転のための２つの「見回し」値を含有し得る。これらの値は、いくつかの論理を通して通過され、眼関節変換の正確な回転を決定することができ、これは、ひいては、眼瞼の形状を変化させ、眼の位置に合致させる、ブレンドシェイプを制御する、ＲＢＦへの入力として使用され得る。これらの形状のアクティブ化値は、付加的論理等を使用して、顔の表情の他の成分を駆動するために使用され得る。

リギングシステムの目標は、典型的には、単純なヒトが理解可能な制御システムに基づいて、魅力的かつ高忠実性の変形を生産するための機構を提供することである。リアルタイムアプリケーションの場合、目標は、典型的には、最終品質に対して可能な限り少ない妥協点をもたらしながら、例えば、ＶＲ／ＡＲ／ＭＲシステム２００上で、リアルタイムで起動されるために十分に単純である、リギングシステムを提供することである。いくつかの実施形態では、３Ｄモデル処理システム６８０は、（ＶＲ／ＡＲ／ＭＲシステムのユーザと）双方向的であって、ユーザの環境内で適切なコンテキストアバタ挙動（例えば、意図ベースの挙動）を提供するように、リギングシステムを実行し、複合現実環境１００内でアバタをリアルタイムでアニメーション化する。
（仮想キャラクタの姿勢空間変形のための姿勢空間次元低減）

本明細書に議論されるように、仮想キャラクタは、変形可能メッシュおよび１つ以上の下層骨格系等のリギング要素を使用して、アニメーション化されることができる。例えば、コア骨格系の関節は、種々の位置および／または配向に変換され（例えば、平行移動および／または回転変換を使用して）、仮想キャラクタを種々の異なる姿勢に設置することができる。図１１は、この場合、ヒトアバタである、仮想キャラクタのためのいくつかの腕姿勢を示す。図１１における姿勢はそれぞれ、個別の腕関節に適用される回転変換のセットによって定義される。アバタのコア骨格内の腕関節はそれぞれ、３次元空間内の選択された角度に回転され、腕を第１の姿勢（例えば、基礎姿勢）から第２の姿勢に遷移させることができる。同様に、アバタのコア骨格内の個別の関節の全てのための回転変換のセットは、他の姿勢を定義し得、各一意のセットの回転変換は、一意の姿勢を定義する。

オイラー角が、仮想キャラクタの骨格系の異なる姿勢のための個別の関節の回転を規定するために使用されることができる。各関節は、ローカル座標系ＸＹＺと関連付けられることができる。オイラー角のセットは、基準座標系ｘｙｚ（例えば、世界座標系または仮想キャラクタが基礎姿勢にある間に関節と関連付けられる座標系）に対する所与の関節のローカル座標系ＸＹＺの回転を規定するために使用されることができる。３次元空間内の関節の角度配向は、３つのオイラー角のセットによって規定されることができる。いくつかの実施形態では、第１のオイラー角αは、いわゆるｘ−規約を使用するときのｘ軸とＮ軸との間の角度（またはｙ−規約を使用するときのｙ軸とＮ軸との間の角度）を表し、Ｎ軸は、ｘｙとＸＹ平面の交点によって定義されたノードの線であって、第２のオイラー角βは、ｚ軸とＺ軸との間の角度を表すことができ、第３のオイラー角γは、ｘ−規約を使用するときのＮ軸とＸ軸との間の角度（またはｙ−規約を使用するときのＮ軸とＹ軸との間の角度）を表すことができる。これら等のオイラー角は、基準座標系に対する関節の任意の所望の角度配向を規定するために使用されることができる。

関節のためのオイラー角（α，β，γ）のベクトルは、３×３回転行列にマッピングされることができる。回転行列の要素は、関節のローカル座標系ＸＹＺの軸と基準座標系ｘｙｚの軸との間の角度のコサインに対応し得る。故に、回転行列は、方向コサイン行列と称され得る。

オイラー角のセットは、仮想キャラクタの骨格系の異なる姿勢を説明するために使用されることができる。例えば、骨格系が、Ｍ個の関節を含む場合、および姿勢内の各関節の角度配向が、３つのオイラー角（α，β，γ）によって定義される場合、姿勢は、ベクトル

によって規定されることができる。

それぞれ、一意のベクトルｘによって規定される、種々の例示的姿勢は、仮想キャラクタのためのメッシュ変形を決定するために、姿勢空間変形と呼ばれるリギング技法において使用されることができる。姿勢空間変形は、仮想キャラクタのメッシュの変形がキャラクタの姿勢の関数であるという仮定に基づく、リギング技法である。したがって、姿勢空間変形は、キャラクタの姿勢の入力に基づいて、仮想キャラクタのメッシュの変形を算出するために使用されることができる。

姿勢空間デフォーマは、機械学習技法を使用して訓練されることができる。訓練データは、キャラクタのコア骨格等の仮想キャラクタの下層骨格系の複数の例示的姿勢のために規定される、メッシュ変形（例えば、皮膚、筋肉、衣類等の変形）を含むことができる。例示的姿勢と関連付けられるメッシュ変形は、例えば、仮想キャラクタの姿勢がとられた物理的モデルを走査することによって取得されることができる。例示的姿勢は、集合的に、姿勢空間を構成する。いったん姿勢空間デフォーマが、例示的姿勢を使用して訓練されると、他の姿勢の変形（例えば、アニメーションシーケンスによって規定され得る）は、補間によって算出されることができる（例えば、放射基底関数を使用して）。特に、姿勢空間デフォーマは、仮想キャラクタの下層骨格系の関節の個別の回転状態に対応する入力を提供されることができる。これらの入力に基づいて、姿勢空間デフォーマは、姿勢空間内の例示的姿勢に基づいて、入力姿勢のための補間されたメッシュ変形を計算することができる。

姿勢空間は、Ｎ個の姿勢

から成ることができ、Ｎは、任意の正の整数であって、姿勢空間の次元と称される。姿勢空間の次元は、姿勢空間デフォーマを訓練するために使用される、例示的姿勢の数である。高次元姿勢空間は、それらが現実的高忠実性メッシュ変形を達成するために使用され得るため有利であり得る。しかしながら、高次元姿勢空間は、不利なこととして、コンピュータメモリおよび／または記憶装置等の大量のコンピューティングリソースを要求し得る。姿勢空間の次元は、単に、より少ない例示的姿勢を姿勢空間内に含めることによって、低減され、コンピューティングリソースを節約することができる。しかしながら、本アプローチは、姿勢空間デフォーマによって計算される、メッシュ変形の忠実度に悪影響を及ぼし得る。したがって、依然として、姿勢空間デフォーマが現実的メッシュ変形を生産することを可能にしながら、姿勢空間の次元が低減され得る場合、有利であろう。

本願は、姿勢空間変形を介して計算されるメッシュ変形の忠実性に及ぼされるより低い次元の影響を減少させるように、入力姿勢空間の次元を低減させるための技法を説明する。いくつかの実施形態では、入力姿勢空間の一部である、複数の例示的姿勢は、ともにクラスタ化されることができ、クラスタ全体のための単一の代表的姿勢が、出力姿勢空間内で使用されることができる。本クラスタ化は、例えば、ｋ−平均クラスタリング技法を使用して遂行されることができる。Ｋ−平均クラスタリングは、入力姿勢空間を構成する例示的姿勢をｋクラスタにパーティション化し得る、技法である。ｋクラスタはそれぞれ、平均値によって特徴付けられることができる。入力姿勢空間内の各例示的姿勢は、その平均値が選択されたメトリックに従ってその特定の例示的姿勢に最も類似する、クラスタに属すると見なされ得る。クラスタ平均値を決定し、各例示的姿勢をクラスタに割り当てるプロセスは、反復的に繰り返されることができる。

ｋクラスタのそれぞれの平均値は、クラスタを全体として表すと見なされ得る、姿勢に対応し得る。したがって、クラスタ毎の平均値姿勢は、その特定のクラスタに属する全ての例示的姿勢の代わりに、出力姿勢空間内で代用されることができる。

クラスタ化プロセスの一部として、入力姿勢空間内の例示的姿勢はそれぞれ、多次元空間内の点にマッピングされることができる。すでに議論されたように、各姿勢は、オイラー角のベクトル

によって表され得る。本ベクトルｘ内の要素は、多次元空間内の座標と見なされ得る。したがって、入力姿勢空間内のＮ個の例示的姿勢のためのベクトルｘ_１…ｘ_Ｎはそれぞれ、個別の例示的姿勢のための空間内の点を定義するために使用されることができる。これらの点は、メトリックを使用して、種々のクラスタとの各点の類似性を示す、クラスタにグループ化されることができる。本メトリックは、例えば、特定の姿勢に対応する点から多次元空間内の特定のクラスタの中心までの距離であり得る。クラスタの中心は、例えば、クラスタの平均値点、すなわち、重心として計算されることができる。

他のメトリックもまた、特定のクラスタとの特定の例示的姿勢の類似性を決定するために使用されることができる。例えば、いくつかの実施形態では、加重された距離メトリックが、使用されることができる。そのような実施形態では、骨格系内のいくつかの関節は、距離メトリックにより大きく影響を及ぼすように加重されることができる一方、その他は、距離メトリックにあまり大きく影響を及ぼさないように加重されることができる。

ともにクラスタ化される姿勢は、選択されたメトリックによって決定されるように、相互に類似するため、クラスタ毎の代表的姿勢が、その特定のクラスタに属する全ての姿勢の代わりに、出力姿勢空間内で使用されることができる。Ｎ個の例示的姿勢のセットが、ｋ個のクラスタにパーティション化されるとき、入力姿勢空間の次元は、Ｎからｋに低減されることができ、ｋは、Ｎ未満の正の整数である。

しかしながら、例示的姿勢がオイラー角の対応するベクトルに基づいて多次元空間内の点にマッピングされるときに生じ得る、厄介な問題が存在する。数学的特異性が、例えば、所与の関節のための第２のオイラー角βが９０°であるときに生じ得る。本特異性は、関節の同一角回転を表す、オイラー角の複数の可能性として考えられる３値セット（例えば、無限数のオイラー角の３値セット）をもたらす。例えば、オイラー角のセット（４５°，９０°，４５°）は、オイラー角のセット（９０°，９０°，９０°）と同一回転を表す。

そのような数学的特異性によって影響される関節回転を含む、姿勢は、したがって、オイラー角がその空間内の座標として使用されるとき、空間内の複数の異なる点のいずれかにマッピングされ得る。そのような姿勢は、空間内の複数の異なる点のいずれかにマッピングされ得るため、規定されることになる複数の同等可能性の中でもとりわけ、特定のオイラー角のセットに応じて、異なるクラスタにグループ化されてもよい。これは、異なる姿勢がともにクラスタ化され得る、逆に言えば、類似姿勢が別個のクラスタにグループ化され得ることを意味する。オイラー角を使用して角回転を表すときに生じ得る、特異性は、したがって、クラスタ化プロセスを改悪させ得、これは、ひいては、姿勢空間デフォーマによって計算されるメッシュ変形の忠実性に悪影響を及ぼし得る。

オイラー角を使用して関節回転を表すときに生じ得る数学的特異性から生じ得る、クラスタ化複雑性を回避するために、入力姿勢空間を構成する、種々の例示的姿勢における関節の角回転の特異性のない表現が、代わりに、使用されることができる。四元数は、そのような特異性のない表現の実施例である。したがって、いくつかの実施形態では、入力姿勢空間内の例示的姿勢のための関節回転は、クラスタ化目的のために、四元数を使用して規定される。

四元数は、ベクトルｑ＝［ｘ，ｙ，ｚ，ｗ］によって表され得、ベクトルｖ＝［ｘ，ｙ，ｚ］は、関節の回転軸を定義し、θ＝ａｃｏｓ（ｗ）は、その軸を中心とする回転の角度を定義する。オイラー角表現に影響を及ぼす、数学的特異性のタイプは、四元数表現に影響を及ぼさない。故に、入力姿勢空間を構成する、種々の例示的姿勢は、それらが四元数として表されるとき、例示的姿勢がオイラー角を使用して表されるときより正確にクラスタ化されることができる。

図１２Ａは、ｋ−平均クラスタリングを使用して姿勢空間デフォーマのための入力姿勢空間の次元を低減させるための方法１２００を図示する。方法１２００は、非一過性記憶媒体内に記憶される命令を実行する、ハードウェアコンピュータプロセッサによって実施されることができる。図１２Ｂは、図１２Ａの方法を使用して形成される、クラスタの例示的セットを図示する。

方法１２００によると、仮想キャラクタのための骨格系内の関節の角回転が、四元数を使用して表される。したがって、その関節回転がオイラー角を使用して最初に表される、任意の例示的姿勢は、代わりに、ブロック１２０５に示されるように、四元数表現を使用するように変換されることができる。本変換後、関節回転はそれぞれ、形態ｑ＝［ｘ，ｙ，ｚ，ｗ］のベクトルで表されることができ、各姿勢は、Ｍ個の関節回転から成ることができ、ベクトル

によって表され得、Ｍは、骨格系内の関節の数であって、任意の正の整数であることができる。

いったん関節回転のためのオイラー角が、四元数に変換されると、ブロック１２１０において、入力姿勢空間内の各例示的姿勢は、多次元空間内の点にマッピングされることができる。各例示的姿勢は、形態

のベクトルによって表され得る。姿勢毎のベクトルの要素は、クラスタ化目的のために、その姿勢を多次元空間内の点にマッピングするための座標として使用されることができる。入力姿勢空間は、Ｎ個の例示的姿勢を含むことができ、ベクトルｘ_１…ｘ_Ｎはそれぞれ、個別の例示的姿勢のための空間内の点を定義するために使用されることができる。図１２Ｂは、空間内の点にマッピングされた例示的姿勢のセットを示し、各ドット１２０１は、例示的姿勢を表す。

ブロック１２１５では、ハードウェアコンピュータプロセッサは、ｋ個のクラスタのための初期平均値点、すなわち、多次元空間内の重心を決定することができ、ｋは、任意の正の整数である。（ｋのための値は、図１３に関して下記に説明される技法を使用して決定されることができる。）いくつかの実施形態では、ｋ個の重心の初期位置が、多次元空間内の異なるランダム場所において選択される。しかしながら、他の技法もまた、ｋ個の重心の初期位置を決定するために使用されることができる。例えば、ｋ個のクラスタはそれぞれ、入力姿勢空間内の例示的姿勢のうちの１つに基づく、初期重心場所を有することができる。そのような場合、一例示的姿勢が、選択されることができ（ランダムにまたは所定の様式においてかどうかにかかわらず）、ｋ個のクラスタのそれぞれに割り当てられる。クラスタ毎の初期重心の座標は、そのクラスタのために選択された例示的姿勢のための四元数のセットによって決定されることができる。

ブロック１２２０では、入力姿勢空間を集合的に構成する、例示的姿勢はそれぞれ、ｋ個のクラスタのうちの１つに割り当てられることができる。いくつかの実施形態では、割当は、クラスタ重心と例示的姿勢に対応する点との間の幾何学的距離に基づくことができる。例えば、ハードウェアコンピュータプロセッサは、クラスタ重心のそれぞれと例示的姿勢に対応する点のそれぞれとの間の幾何学的距離を計算することができる。ハードウェアコンピュータプロセッサは、次いで、各例示的姿勢をその重心が最も近くのクラスタに割り当てることができる。

いったん姿勢空間内の例示的姿勢がそれぞれ、ｋ個のクラスタのうちの１つに割り当てられると、ブロック１２２５では、ハードウェアコンピュータプロセッサは、クラスタ毎に、重心を再計算することができる。ｋ個の異なるクラスタ毎に更新された重心は、現在そのクラスタに割り当てられている四元数

の平均値を見出すことによって計算されることができる。四元数算術に従って、ｎ個の四元数ｑ_１、ｑ_２、…、ｑ_ｎの平均値ｍが、式

によって計算されることができ、式中、

である。

例示的姿勢をクラスタに割り当て（ブロック１２２０）、クラスタ重心を更新する（ブロック１２２５）プロセスは、ブロック１２３０に示されるように、閾値を超える反復の回数まで、またはブロック１２３５に示されるように、収束条件が、満たされるまで、繰り返されることができる。収束条件は、例えば、ｋ個のクラスタへの種々の例示的姿勢の割当が１つの反復から次の反復へと変化しない場合に満たされると見なされ得る。

図１２Ｂは、ｋ＝３の場合の本クラスタ化プロセスの例示的結果を図示する。例示的姿勢はそれぞれ、ドット１２０１によって表される。例示的姿勢はそれぞれ、クラスタＡ、クラスタＢ、またはクラスタＣを割り当てられている。クラスタ間の境界は、線によって輪郭を描かれている。各クラスタの重心は、星形１２０２ａ−ｃによって表され、クラスタＡの重心は、１２０２ａであって、クラスタＢの重心は、１２０２ｂであって、クラスタＣの重心は、１２０２ｃである。

いったん入力姿勢空間内の各例示的姿勢が、最終的に、ｋ個のクラスタのうちの１つに割り当てられると、ハードウェアコンピュータプロセッサは、一例示的姿勢を規定し、各クラスタを出力姿勢空間内に表すことができる。いくつかの実施形態では、特定のクラスタのための代表的姿勢は、そのクラスタに割り当てられる例示的姿勢のうちの１つであることができる。例えば、多次元空間内のその対応する点が、そのクラスタの重心の最も近くに位置する、例示的姿勢は、クラスタ全体のための代表的姿勢として規定されることができる。他の実施形態では、クラスタの重心の座標は、代表的姿勢のための関節回転として規定されることができる。

このように、入力姿勢空間の次元は、Ｎ個の例示的姿勢からｋ個の例示的姿勢に低減されることができ、ｋは、クラスタの数である。さらに、クラスタ化される例示的姿勢は、相互に類似するため、姿勢空間デフォーマによって計算されるメッシュ変形の忠実性に及ぼされる姿勢空間の低減された次元の影響は、姿勢空間の次元があまり高度ではない様式において（例えば、入力姿勢空間から例示的姿勢のサブセットをランダムに選択することによって）低減された場合より小さくなり得る。出力姿勢空間の低減された次元は、仮想キャラクタの姿勢の変化に応答して、メッシュ変形の高忠実性リアルタイム算出を促進することができる。

しかしながら、図１２Ａに示される方法１２００の有効性は、その中に入力姿勢空間からの例示的姿勢がグループ化される、クラスタの数に敏感であり得る。入力姿勢空間を集合的に構成する、例示的姿勢が、比較的に多数のクラスタにクラスタ化される場合、姿勢空間変形の忠実性は、比較的に少量低減されるであろう。しかしながら、入力姿勢空間の次元も同様に、比較的に少量だけ低減されるであろう。対照的に、例示的姿勢が、比較的に少数のクラスタにクラスタ化される場合、入力姿勢空間の次元は、比較的に大量に低減されるであろうが、姿勢空間変形の忠実性もまた、比較的に大量に低減され得る。入力姿勢空間の次元の低減は、クラスタの数（すなわち、ｋの値）に依存するため、入力姿勢空間の次元の低減と姿勢空間変形の結果として生じる忠実性との間の効果的平衡をもたらす、クラスタの数を選択することが有利であり得る。

種々の要因が、クラスタの数の選択肢を複雑にし得る。これらの要因のうちの１つは、入力姿勢空間内の例示的姿勢の分布である。例えば、入力姿勢空間内の種々の例示的姿勢が、種々の例示的姿勢が比較的に相互に異なるように広く分散される場合、より多数のクラスタが、依然として、容認可能忠実性度を仮想キャラクタのメッシュの計算された変形内に維持しながら、異なる例示的姿勢をパーティション化するために必要とされ得る。しかしながら、入力姿勢空間内の種々の例示的姿勢の分布が、種々の例示的姿勢が比較的に類似するように狭い場合、より小さい数のクラスタが、依然として、所望の忠実性度をメッシュ変形内に維持しながら、異なる例示的姿勢をパーティション化するために必要とされ得る。

クラスタの数が、適切に選定されると、入力姿勢空間の次元は、所望の忠実性度を姿勢空間デフォーマによって計算されるメッシュ変形内に維持しながら、低減されることができる。実際、いくつかの実施形態では、低減された次元の出力姿勢空間を用いて計算されるメッシュ変形の忠実性は、より高い次元の入力姿勢空間を使用して達成され得るものに匹敵し得る。

クラスタの数を選定するための１つの技法は、ｋの複数の異なる候補値のために、図１２Ａに示される方法１２００を実施し、ｋの各候補値と関連付けられる誤差メトリックを計算し、次いで、候補値と関連付けられる誤差メトリックに基づいて、ｋのための値を選択することである。いくつかの実施形態では、誤差メトリックは、入力姿勢空間内の例示的姿勢の全てに関する、各例示的姿勢に対応する点とその割り当てられるクラスタの重心との間の二乗距離の和である。本誤差メトリックは、二乗誤差の和と称され得る。しかしながら、他の誤差メトリックもまた、使用されることができる。

図１３は、入力姿勢空間の次元を低減させるために使用するためのクラスタの数を選択するための例示的技法を図示する、グラフである。図１３は、ｋの値の関数として、二乗誤差の和の例示的曲線１３００をプロットする。例示的曲線１３００によって示されるデータを生成するために、ハードウェアコンピュータプロセッサは、ｋの複数の候補値毎に、図１２Ａに示される方法１２００を実施することができる。図示される実施例では、候補値は、ｋ＝１〜ｋ＝１２である。候補値の他の範囲も、特定の用途に応じて、他の実施形態で使用されることができる。ハードウェアコンピュータプロセッサは、次いで、候補値毎に、二乗誤差の和を計算することができる。

二乗誤差の和は、クラスタの数ｋが比較的に小さいとき、比較的に大きい。ｋの値が増加するにつれて、二乗誤差の和は、減少し、ゼロに接近し始める。多くの場合、二乗誤差の和は、最初に、クラスタの数の増加に伴って急速に減少する。これは、ｋのより低い候補値に関する曲線１３００の急峻な傾きによって示される。下り勾配の率は、典型的には、ある点において減速するであろう。これは、ｋのより高い候補値に関する曲線１３００の傾きにおける低減から明白である。二乗誤差の和は、いったんｋの候補値が入力姿勢空間内の例示的姿勢と等数になると、その場合、各入力姿勢サンプルがその独自のクラスタを構成するため、最終的に、ゼロになる。逆に言えば、二乗誤差の最大和は、典型的には、ｋ＝１であるときであって、例示的姿勢の全てが単一クラスタ内に設置されることを意味する。

いくつかの実施形態では、出力姿勢空間を生成するために使用されるｋの値は、選択された基準を満たすその誤差メトリックに基づいて、選択されることができる。例えば、基準は、誤差メトリックの変化率が指定された閾値を超えることであり得る。図１３を参照すると、誤差メトリックの変化率は、曲線１３００の傾きを分析することによって決定されることができる。ｋの対の隣接する候補値間の曲線１３００の傾きが、計算されることができ、傾きが指定される閾値を超える、ｋの候補値が、ｋのための値として選択されることができる。図１３を参照すると、曲線１３００の傾きは、ｋ＝１とｋ＝２との間、ｋ＝２とｋ＝３との間、ｋ＝３とｋ＝４との間、ｋ＝４とｋ＝５との間等で計算されることができる。曲線の傾きが指定される閾値を超える、ｋの値（この場合、線１３０５によって示されるように、ｋ＝４）が、クラスタの数のための値として選択されることができる。いくつかの実施形態では、閾値変化率の大きさは、約０〜約１（すなわち、約０°〜４５°）であることができるが、他の閾値もまた、使用されることができる。

表１は、図１２Ａに描写される例示的方法によって生成されたいくつかの低減された次元の姿勢空間の実施例を示す。

表１に示されるように、ヒトアバタのための三角筋および胸筋の姿勢ベースの変形を計算するための入力姿勢空間の実施例は、１，９４４個の姿勢を含む。これは、本明細書に説明される技法を使用して、出力姿勢空間内で１，１８９個の姿勢まで低減された。同様に、大腿四頭筋の変形を計算するための例示的入力姿勢空間は、最初に、１，２９６個の姿勢を含んでいたが、７５７個の姿勢まで低減された。匹敵する結果が、僧帽筋、広背筋、二頭筋、および脹脛筋、および腰部等のアバタ仮想キャラクタの種々の他の筋肉および身体部分に関しても取得された。しかしながら、肩甲骨、胸鎖乳突筋および斜角筋、および膝腱筋に関しては、入力姿勢空間の例外が存在した。これらの姿勢空間の次元は、個別の入力姿勢空間が、比較的に少ない例示的姿勢のみを含み、したがって、クラスタ化をあまり効果的ではないものにしたため、低減されなかった。全体的に、表１に例証される姿勢空間に関して、入力姿勢の数は、６，８９１から４，１９３まで低減された。いくつかの実施形態では、本明細書に説明される技法を使用することによって、入力姿勢空間の次元は、３０％またはそれを上回って、または４０％またはそれを上回って、または５０％またはそれを上回って低減されることができる。さらに、出力姿勢空間は、依然として、入力姿勢空間内の情報の７０％以上、または８０％以上、または９０％以上のものを表すことができる。
（主成分分析を使用したブレンドシェイプの圧縮）

いくつかの実施形態では、姿勢空間デフォーマは、仮想キャラクタのメッシュを変形させるために使用される、１つ以上のブレンドシェイプのための加重を制御することができる。ブレンドシェイプは、Ｎ×Ｍ個の変形行列Ａとして表され得、これは、メッシュを変形させるためのデルタ値を含む。変形行列のＭ個の列はそれぞれ、メッシュ内の特定の頂点に対応し得、Ｎ個の行はそれぞれ、ブレンドシェイプを構成する、頂点のセットに対応し得る。高分解能メッシュおよび多数のブレンドシェイプを伴う仮想キャラクタに関して、変形行列は、非常に大きくなり得、有意なコンピューティングリソースを消費し得る。したがって、依然として、高忠実性メッシュ変形を提供しながら、変形行列のサイズを低減させることが有利であろう。

主成分分析（ＰＣＡ）を使用して入力変形行列の次元を低減させる（すなわち、変形行列内のブレンドシェイプの数を低減させる）ための技法が、本明細書に説明される。ＰＣＡは、入力変形行列内に含有される、変動、すなわち、情報の規定された量を上回って喪失することなく、本目的を遂行するために使用されることができる。

メッシュ内の頂点毎の入力変形行列内のデルタ値の列が、Ｎ−次元空間内の点を定義するために使用されることができ、Ｎは、入力変形行列内のブレンドシェイプの数に等しい。ＰＣＡは、入力変形行列のための基底ベクトルのセットを計算するために使用されることができ、Ｎ−次元空間内の点がそれぞれ、基底ベクトルの線形組み合わせとして表され得ることを意味する。これらの基底ベクトルは、入力変形行列の主成分であって、第１の主成分が、最大可能分散を有し、先行主成分の全てに直交するという制約に従って、各後続主成分が、次の最大可能分散を有するという性質を有する。例えば、Ｎ−次元空間内の入力変形行列によって規定された点の全てが、プロットされる場合、第１の主成分は、点間の最大分散の方向を指す、ベクトルである。第２の主成分は、第１の主成分との直交性制約に従って、第１の主成分に直交し、入力変形行列によって規定された点の中の最大分散の方向を指す。第３の主成分は、第１の主成分および第２の主成分の両方に直交する。第３の主成分は、第１および第２の主成分との直交性制約に従って、最大分散の方向を指す。入力変形行列のＮ個の主成分毎に同等となる。主成分はそれぞれまた、関連付けられる固有値を有し、これは、関連付けられる固有ベクトルの方向に生じる、入力データ内の変動の量を示す。

図１４は、Ｎ個のブレンドシェイプを伴う入力変形行列のためのプロットされる点の例示的セットを図示する。議論されたばかりのように、点はそれぞれ、Ｎ−次元空間内の点である。変形行列は、多くのブレンドシェイプを含むことができる（例えば、Ｎは、数十、数百、または数千のブレンドシェイプに等しい）が、例証を容易にするために、図１４は、最初の２つの主成分の平面に投影された点を示す。図１４に見られるように、第１の主成分ＰＣ１は、プロットされる点間の最大変動の方向を指す。第２の主成分ＰＣ２は、第１の主成分ＰＣ１に直交するという制約に従って、次の最大変動の方向を指す。図示されないが、同じことが、後続主成分にも当てはまるであろう。図１４における点はそれぞれ、主成分の線形組み合わせとして表され得る。第１の主成分は、入力変形行列内の変動の大部分を考慮する、新しいブレンドシェイプを定義するために使用されることができる。第２の主成分は、入力変形行列内の次の最大量の変動を考慮する、別の新しいブレンドシェイプを定義するために使用されることができる。残りの主成分に関しても同様となる。

Ｎ−次元入力変形行列に関して、Ｎ個の主成分はそれぞれ、新しいブレンドシェイプを定義するために使用されることができる。これらの新しいブレンドシェイプは、出力変形行列Ａ’内に編成されることができる。各連続する新しいブレンドシェイプは、前のものより少ない入力変形行列内の変動を考慮する。これは、図１５に図示され、これは、３０個のブレンドシェイプから成る入力変形行列のための３０個の主成分のそれぞれによって考慮される分散の割合の例示的プロットである。図から明白であるように、各主成分によって考慮される分散の割合は、主成分の数が増加するにつれて減少する。最後のいくつかの主成分は、入力変形行列内の比較的に少量の変動を考慮する。主成分Ｎは、入力変形行列からの最小量の情報を含むため、その対応するブレンドシェイプは、いくつかの実施形態では、出力変形行列から省略されることができる。同様に、（Ｎ−１）、（Ｎ−２）等の主成分もまた、入力変形行列から留保されることが所望される情報の量に応じて、出力変形行列から、その対応するブレンドシェイプとともに省略されることができる。最後の主成分に対応するブレンドシェイプを省略する本プロセスは、入力変形行列から少なくとも指定量の情報を留保しながら、出力変形行列の次元を低減させる。

入力変形行列の主成分は、複数の異なる方法において計算されることができる。いくつかの実施形態では、入力変形行列Ａの共分散行列または相関行列が、計算されることができる。固有値分解が、次いで、共分散行列または相関行列上で実施されることができる。共分散行列または相関行列の本固有値分解は、線形独立固有ベクトルのセットを与える。これらの固有ベクトル（単位長に正規化され得る）は、主成分である。主成分はまた、特異値分解（ＳＶＤ）等の他の技法を用いても計算されることができる。主成分に加え、ＳＶＤは、特異値と呼ばれる値のセットを生産する。主成分毎の特異値は、その主成分によって解説される入力変形行列内の変動の量を示す。

図１６は、主成分分析（ＰＣＡ）を使用して変形行列の次元を低減させる例示的方法を描写する、フローチャートである。本方法は、非一過性記憶媒体内に記憶される命令を実行する、ハードウェアコンピュータプロセッサによって実施されることができる。本方法は、ブロック１６０５から開始し、入力変形行列が、ブレンドシェイプのＮ×Ｍ行列として初期化される。入力変形行列のＮ個の主成分が、次いで、ブロック１６１０に示されるように、計算される。すでに議論されたように、主成分はそれぞれ、新しいブレンドシェイプと関連付けられる。入力変形行列から留保されるべきデータのパーセンテージに応じて、いくつかの主成分は、ブロック１６２０に示されるように、省略される。省略される主成分の数は、各主成分によって解説される入力変形行列内の変動のパーセンテージに基づいて選択されることができる。いくつかの実施形態では、留保された主成分の数は、留保されるべき分散のパーセンテージに関する、ユーザ選好、算出上高性能である、新しいブレンドシェイプの数、および／または審美的に容認可能であるメッシュ変形をもたらすと判断される、新しいブレンドシェイプの数に基づくことができる。最後に、ブロック１６２５では、省略される主成分に対応するブレンドシェイプもまた、省略され、出力変形行列Ａ’が、残りの主成分と関連付けられる新しいブレンドシェイプから形成される。

出力変形行列Ａ’内のブレンドシェイプは、姿勢空間デフォーマによって制御されることができる。本明細書に説明される技法は、入力変形行列からの情報の指定される量が留保されることを可能にするため、これらの技法は、有利なこととして、容認可能メッシュ変形を達成するために必要とされるブレンドシェイプの数を低減させることができる。
（例示的実施形態）

（項目１）
システムであって、仮想キャラクタのための骨格系の複数の例示的姿勢を記憶するための非一過性コンピュータ記憶装置と、非一過性コンピュータ記憶装置と通信する、ハードウェアコンピュータプロセッサであって、複数の例示的姿勢を１つ以上のクラスタにクラスタ化するステップであって、複数の例示的姿勢は、入力姿勢空間を定義し、複数の例示的姿勢はそれぞれ、関節回転のセットを備え、関節回転は、特異性のない数学的表現を有する、ステップと、クラスタ毎に、代表的姿勢を決定するステップと、入力姿勢空間と比較して低減された次元を伴う、出力姿勢空間を提供するステップとを含む、方法を実行することによって、入力姿勢空間の次元を低減させるように構成される、ハードウェアコンピュータプロセッサとを備える、システム。

（項目２）
関節回転の特異性のない数学的表現は、四元数表現を含む、項目１に記載のシステム。

（項目３）
オイラー角表現を有する関節回転とともに、複数の例示的姿勢を受信するステップと、オイラー角表現を四元数表現に変換するステップとをさらに含む、項目２に記載のシステム。

（項目４）
例示的姿勢は、各例示的姿勢と各クラスタとの間の類似性を決定するためのメトリックに基づいて、１つ以上のクラスタにクラスタ化される、項目１に記載のシステム。

（項目５）
例示的姿勢をクラスタ化するステップは、例示的姿勢のそれぞれを多次元空間内の点にマッピングするステップを含む、項目１に記載のシステム。

（項目６）
例示的姿勢をクラスタ化するステップはさらに、クラスタ毎に、重心を決定するステップと、例示的姿勢毎の点と各クラスタの重心との間の距離を決定するステップと、各例示的姿勢を最も近くのクラスタに割り当てるステップとを含む、項目５に記載のシステム。

（項目７）
反復的に、クラスタ毎に、重心を決定し、各例示的姿勢を最も近くのクラスタに割り当てるステップをさらに含む、項目６に記載のシステム。

（項目８）
クラスタ毎の代表的姿勢は、そのクラスタに割り当てられる例示的姿勢またはそのクラスタの重心と関連付けられる例示的姿勢のうちの１つを含む、項目６に記載のシステム。

（項目９）
クラスタの数を決定するステップをさらに含む、項目１に記載のシステム。

（項目１０）
クラスタの数を決定するステップは、クラスタの複数の異なる候補数毎に、複数の例示的姿勢を１つ以上のクラスタにクラスタ化するステップと、クラスタの各候補数と関連付けられる誤差メトリックを計算するステップと、クラスタの候補数と関連付けられる誤差メトリックに基づいて、クラスタの候補数のうちの１つを選択するステップとを含む、項目９に記載のシステム。

（項目１１）
誤差メトリックは、入力姿勢空間内の例示的姿勢の全てに関する、各例示的姿勢に対応する点とその割り当てられるクラスタの重心との間の二乗距離の和を含む、項目１０に記載のシステム。

（項目１２）
クラスタの候補数のうちの１つを選択するステップは、その誤差メトリックが選択された基準を満たすかどうかを決定するステップを含む、項目１０に記載のシステム。

（項目１３）
基準は、誤差メトリックの変化率が指定された閾値を超えることである、項目１２に記載のシステム。

（項目１４）
出力姿勢空間を使用して、姿勢空間デフォーマを訓練するステップをさらに含む、項目１に記載のシステム。

（項目１５）
姿勢空間デフォーマを使用して、仮想キャラクタのためのメッシュ変形を計算するステップをさらに含む、項目１４に記載のシステム。

（項目１６）
姿勢空間デフォーマを使用して、出力変形行列内の複数のブレンドシェイプを制御するステップをさらに含む、項目１４に記載のシステム。

（項目１７）
出力変形行列は、主成分分析を使用して入力変形行列の次元を低減させることによって生成される、項目１６に記載のシステム。

（項目１８）
入力変形行列の次元を低減させるステップは、入力変形行列の主成分を決定するステップと、主成分のうちの１つ以上のものを省略し、１つ以上の残りの主成分を残すステップと、１つ以上の残りの主成分と関連付けられる１つ以上のブレンドシェイプを使用して、出力変形行列を生成するステップとを含む、項目１７に記載のシステム。

（項目１９）
出力姿勢空間は、入力姿勢空間より少なくとも３０％小さい、項目１に記載のシステム。

（項目２０）
システムは、仮想現実、拡張現実、または複合現実ディスプレイシステムを備える、項目１に記載のシステム。

（項目２１）
方法であって、仮想キャラクタのための骨格系の複数の例示的姿勢を取得するステップであって、複数の例示的姿勢は、入力姿勢空間を定義し、複数の例示的姿勢はそれぞれ、関節回転のセットを備え、関節回転は、特異性のない数学的表現を有する、ステップと、複数の例示的姿勢を１つ以上のクラスタにクラスタ化するステップと、クラスタ毎に、代表的姿勢を決定するステップと、入力姿勢空間と比較して低減された次元を伴う、出力姿勢空間を提供するステップとを含む、方法。

（項目２２）
関節回転の特異性のない数学的表現は、四元数表現を含む、項目２１に記載の方法。

（項目２３）
オイラー角表現を有する関節回転とともに、複数の例示的姿勢を受信するステップと、オイラー角表現を四元数表現に変換するステップとをさらに含む、項目２２に記載の方法。

（項目２４）
例示的姿勢は、各例示的姿勢と各クラスタとの間の類似性を決定するためのメトリックに基づいて、１つ以上のクラスタにクラスタ化される、項目２１に記載の方法。

（項目２５）
例示的姿勢をクラスタ化するステップは、例示的姿勢のそれぞれを多次元空間内の点にマッピングするステップを含む、項目２１に記載の方法。

（項目２６）
例示的姿勢をクラスタ化するステップはさらに、クラスタ毎に、重心を決定するステップと、例示的姿勢毎の点と各クラスタの重心との間の距離を決定するステップと、各例示的姿勢を最も近くのクラスタに割り当てるステップとを含む、項目２５に記載の方法。

（項目２７）
反復的に、クラスタ毎に、重心を決定し、各例示的姿勢を最も近くのクラスタに割り当てるステップをさらに含む、項目２６に記載の方法。

（項目２８）
クラスタ毎の代表的姿勢は、そのクラスタに割り当てられる例示的姿勢またはそのクラスタの重心と関連付けられる例示的姿勢のうちの１つを含む、項目２６に記載の方法。

（項目２９）
クラスタの数を決定するステップをさらに含む、項目２１に記載の方法。

（項目３０）
クラスタの数を決定するステップは、クラスタの複数の異なる候補数毎に、複数の例示的姿勢を１つ以上のクラスタにクラスタ化するステップと、クラスタの各候補数と関連付けられる誤差メトリックを計算するステップと、クラスタの候補数と関連付けられる誤差メトリックに基づいて、クラスタの候補数のうちの１つを選択するステップとを含む、項目２９に記載の方法。

（項目３１）
誤差メトリックは、入力姿勢空間内の例示的姿勢の全てに関する、各例示的姿勢に対応する点とその割り当てられるクラスタの重心との間の二乗距離の和を含む、項目３０に記載の方法。

（項目３２）
クラスタの候補数のうちの１つを選択するステップは、その誤差メトリックが選択された基準を満たすかどうかを決定するステップを含む、項目３０に記載の方法。

（項目３３）
基準は、誤差メトリックの変化率が指定された閾値を超えることである、項目３２に記載の方法。

（項目３４）
出力姿勢空間を使用して、姿勢空間デフォーマを訓練するステップをさらに含む、項目２１に記載の方法。

（項目３５）
姿勢空間デフォーマを使用して、仮想キャラクタのためのメッシュ変形を計算するステップをさらに含む、項目３４に記載の方法。

（項目３６）
姿勢空間デフォーマを使用して、出力変形行列内の複数のブレンドシェイプを制御するステップをさらに含む、項目３４に記載の方法。

（項目３７）
出力変形行列は、主成分分析を使用して入力変形行列の次元を低減させることによって生成される、項目３６に記載の方法。

（項目３８）
入力変形行列の次元を低減させるステップは、入力変形行列の主成分を決定するステップと、主成分のうちの１つ以上のものを省略し、１つ以上の残りの主成分を残すステップと、１つ以上の残りの主成分と関連付けられる１つ以上のブレンドシェイプを使用して、出力変形行列を生成するステップとを含む、項目３７に記載の方法。

（項目３９）
出力姿勢空間は、入力姿勢空間より少なくとも３０％小さい、項目２１に記載の方法。

（項目４０）
方法は、仮想現実、拡張現実、または複合現実ディスプレイシステムによって実施される、項目２１に記載の方法。

（項目４１）
非一過性コンピュータ可読媒体であって、ハードウェアコンピュータプロセッサによって読み取られると、ハードウェアコンピュータプロセッサに、仮想キャラクタのための骨格系の複数の例示的姿勢を取得するステップであって、複数の例示的姿勢は、入力姿勢空間を定義し、複数の例示的姿勢はそれぞれ、関節回転のセットを備え、関節回転は、特異性のない数学的表現を有する、ステップと、複数の例示的姿勢を１つ以上のクラスタにクラスタ化するステップと、クラスタ毎に、代表的姿勢を決定するステップと、入力姿勢空間と比較して低減された次元を伴う、出力姿勢空間を提供するステップとを含む、方法を実施させる、非一過性コンピュータ可読媒体。

（項目４２）
関節回転の特異性のない数学的表現は、四元数表現を含む、項目４１に記載のコンピュータ可読媒体。

（項目４３）
本方法はさらに、オイラー角表現を有する関節回転とともに、複数の例示的姿勢を受信するステップと、オイラー角表現を四元数表現に変換するステップとを含む、項目４２に記載のコンピュータ可読媒体。

（項目４４）
例示的姿勢は、各例示的姿勢と各クラスタとの間の類似性を決定するためのメトリックに基づいて、１つ以上のクラスタにクラスタ化される、項目４１に記載のコンピュータ可読媒体。

（項目４５）
例示的姿勢をクラスタ化するステップは、例示的姿勢のそれぞれを多次元空間内の点にマッピングするステップを含む、項目４１に記載のコンピュータ可読媒体。

（項目４６）
例示的姿勢をクラスタ化するステップはさらに、クラスタ毎に、重心を決定するステップと、例示的姿勢毎の点と各クラスタの重心との間の距離を決定するステップと、各例示的姿勢を最も近くのクラスタに割り当てるステップとを含む、項目４５に記載のコンピュータ可読媒体。

（項目４７）
本方法はさらに、反復的に、クラスタ毎に、重心を決定し、各例示的姿勢を最も近くのクラスタに割り当てるステップを含む、項目４６に記載のコンピュータ可読媒体。

（項目４８）
クラスタ毎の代表的姿勢は、そのクラスタに割り当てられる例示的姿勢またはそのクラスタの重心と関連付けられる例示的姿勢のうちの１つを含む、項目４６に記載のコンピュータ可読媒体。

（項目４９）
本方法はさらに、クラスタの数を決定するステップを含む、項目４１に記載のコンピュータ可読媒体。

（項目５０）
クラスタの数を決定するステップは、クラスタの複数の異なる候補数毎に、複数の例示的姿勢を１つ以上のクラスタにクラスタ化するステップと、クラスタの各候補数と関連付けられる誤差メトリックを計算するステップと、クラスタの候補数と関連付けられる誤差メトリックに基づいて、クラスタの候補数のうちの１つを選択するステップとを含む、項目４９に記載のコンピュータ可読媒体。

（項目５１）
誤差メトリックは、入力姿勢空間内の例示的姿勢の全てに関する、各例示的姿勢に対応する点とその割り当てられるクラスタの重心との間の二乗距離の和を含む、項目５０に記載のコンピュータ可読媒体。

（項目５２）
クラスタの候補数のうちの１つを選択するステップは、その誤差メトリックが選択された基準を満たすかどうかを決定するステップを含む、項目５０に記載のコンピュータ可読媒体。

（項目５３）
基準は、誤差メトリックの変化率が指定された閾値を超えることである、項目５２に記載のコンピュータ可読媒体。

（項目５４）
本方法はさらに、出力姿勢空間を使用して、姿勢空間デフォーマを訓練するステップを含む、項目４１に記載のコンピュータ可読媒体。

（項目５５）
本方法はさらに、姿勢空間デフォーマを使用して、仮想キャラクタのためのメッシュ変形を計算するステップを含む、項目５４に記載のコンピュータ可読媒体。

（項目５６）
本方法はさらに、姿勢空間デフォーマを使用して、出力変形行列内の複数のブレンドシェイプを制御するステップを含む、項目５４に記載のコンピュータ可読媒体。

（項目５７）
出力変形行列は、主成分分析を使用して入力変形行列の次元を低減させることによって生成される、項目５６に記載のコンピュータ可読媒体。

（項目５８）
入力変形行列の次元を低減させるステップは、入力変形行列の主成分を決定するステップと、主成分のうちの１つ以上のものを省略し、１つ以上の残りの主成分を残すステップと、１つ以上の残りの主成分と関連付けられる１つ以上のブレンドシェイプを使用して、出力変形行列を生成するステップとを含む、項目５７に記載のコンピュータ可読媒体。

（項目５９）
出力姿勢空間は、入力姿勢空間より少なくとも３０％小さい、項目４１に記載のコンピュータ可読媒体。

（項目６０）
方法は、仮想現実、拡張現実、または複合現実ディスプレイシステムによって実施される、項目４１に記載のコンピュータ可読媒体。
（他の考慮点）

本明細書に説明される、および／または添付される図に描写されるプロセス、方法、およびアルゴリズムはそれぞれ、具体的かつ特定のコンピュータ命令を実行するように構成される、１つ以上の物理的コンピューティングシステム、ハードウェアコンピュータプロセッサ、特定用途向け回路、および／または電子ハードウェアによって実行される、コードモジュールにおいて具現化され、それによって完全または部分的に自動化され得る。例えば、コンピューティングシステムは、具体的コンピュータ命令とともにプログラムされた汎用コンピュータ（例えば、サーバ）または専用コンピュータ、専用回路等を含むことができる。コードモジュールは、実行可能プログラムにコンパイルおよびリンクされ得る、動的リンクライブラリ内にインストールされ得る、またはインタープリタ型プログラミング言語において書き込まれ得る。いくつかの実装では、特定の動作および方法が、所与の機能に特有の回路によって実施され得る。

さらに、本開示の機能性のある実装は、十分に数学的、コンピュータ的、または技術的に複雑であるため、（適切な特殊化された実行可能命令を利用する）特定用途向けハードウェアまたは１つまたはそれを上回る物理的コンピューティングデバイスは、例えば、関与する計算の量または複雑性に起因して、または結果を実質的にリアルタイムで提供するために、機能性を実施する必要があり得る。例えば、アニメーションまたはビデオは、多くのフレームを含み、各フレームは、数百万のピクセルを有し得、具体的にプログラムされたコンピュータハードウェアは、商業的に妥当な時間量において所望の画像処理タスクまたは用途を提供するようにビデオデータを処理する必要がある。

コードモジュールまたは任意のタイプのデータは、ハードドライブ、ソリッドステートメモリ、ランダムアクセスメモリ（ＲＡＭ）、読取専用メモリ（ＲＯＭ）、光学ディスク、揮発性または不揮発性記憶装置、同一物の組み合わせ、および／または同等物を含む、物理的コンピュータ記憶装置等の任意のタイプの非一過性コンピュータ可読媒体上に記憶され得る。本方法およびモジュール（またはデータ）はまた、無線ベースおよび有線／ケーブルベースの媒体を含む、種々のコンピュータ可読伝送媒体上で生成されたデータ信号として（例えば、搬送波または他のアナログまたはデジタル伝搬信号の一部として）伝送され得、種々の形態（例えば、単一または多重化アナログ信号の一部として、または複数の離散デジタルパケットまたはフレームとして）をとり得る。開示されるプロセスまたはプロセスステップの結果は、任意のタイプの非一過性有形コンピュータ記憶装置内に持続的または別様に記憶され得る、またはコンピュータ可読伝送媒体を介して通信され得る。

本明細書に説明される、および／または添付される図に描写されるフロー図における任意のプロセス、ブロック、状態、ステップ、または機能性は、プロセスにおいて具体的機能（例えば、論理または算術）またはステップを実装するための１つまたはそれを上回る実行可能命令を含む、コードモジュール、セグメント、またはコードの一部を潜在的に表すものとして理解されたい。種々のプロセス、ブロック、状態、ステップ、または機能性は、組み合わせられる、再配列される、追加される、削除される、修正される、または別様に本明細書に提供される例証的実施例から変更されることができる。いくつかの実施形態では、付加的または異なるコンピューティングシステムまたはコードモジュールが、本明細書に説明される機能性のいくつかまたは全てを実施し得る。本明細書に説明される方法およびプロセスはまた、任意の特定のシーケンスに限定されず、それに関連するブロック、ステップ、または状態は、適切な他のシーケンスで、例えば、連続して、並行して、またはある他の様式で実施されることができる。タスクまたはイベントが、開示される例示的実施形態に追加される、またはそれから除去され得る。さらに、本明細書に説明される実装における種々のシステムコンポーネントの分離は、例証を目的とし、全ての実装においてそのような分離を要求するものとして理解されるべきではない。説明されるプログラムコンポーネント、方法、およびシステムは、概して、単一のコンピュータ製品においてともに統合される、または複数のコンピュータ製品にパッケージ化され得ることを理解されたい。多くの実装変形例が、可能である。

本プロセス、方法、およびシステムは、ネットワーク（または分散）コンピューティング環境において実装され得る。ネットワーク環境は、企業全体コンピュータネットワーク、イントラネット、ローカルエリアネットワーク（ＬＡＮ）、広域ネットワーク（ＷＡＮ）、パーソナルエリアネットワーク（ＰＡＮ）、クラウドコンピューティングネットワーク、クラウドソースコンピューティングネットワーク、インターネット、およびワールドワイドウェブを含む。ネットワークは、有線または無線ネットワークまたは任意の他のタイプの通信ネットワークであり得る。

本開示のシステムおよび方法は、それぞれ、いくつかの革新的側面を有し、そのうちのいかなるものも、本明細書に開示される望ましい属性に単独で関与しない、またはそのために要求されない。上記に説明される種々の特徴およびプロセスは、相互に独立して使用され得る、または種々の方法で組み合わせられ得る。全ての可能な組み合わせおよび副次的組み合わせが、本開示の範囲内に該当することが意図される。本開示に説明される実装の種々の修正が、当業者に容易に明白であり得、本明細書に定義される一般原理は、本開示の精神または範囲から逸脱することなく、他の実装に適用され得る。したがって、請求項は、本明細書に示される実装に限定されることを意図されず、本明細書に開示される本開示、原理、および新規の特徴と一貫する最も広い範囲を与えられるべきである。

別個の実装の文脈において本明細書に説明されるある特徴はまた、単一の実装における組み合わせにおいて実装されることができる。逆に、単一の実装の文脈において説明される種々の特徴もまた、複数の実装において別個に、または任意の好適な副次的組み合わせにおいて実装されることができる。さらに、特徴がある組み合わせにおいて作用するものとして上記に説明され、さらに、そのようなものとして最初に請求され得るが、請求される組み合わせからの１つ以上の特徴は、いくつかの場合では、組み合わせから削除されることができ、請求される組み合わせは、副次的組み合わせまたは副次的組み合わせの変形例を対象とし得る。いかなる単一の特徴または特徴のグループも、あらゆる実施形態に必要または必須ではない。

とりわけ、「〜できる（ｃａｎ）」、「〜し得る（ｃｏｕｌｄ）」、「〜し得る（ｍｉｇｈｔ）」、「〜し得る（ｍａｙ）」、「例えば（ｅ．ｇ．）」、および同等物等、本明細書で使用される条件文は、別様に具体的に記述されない限り、または使用されるような文脈内で別様に理解されない限り、概して、ある実施形態がある特徴、要素、またはステップを含む一方、他の実施形態がそれらを含まないことを伝えることが意図される。したがって、そのような条件文は、概して、特徴、要素、および／またはステップが、１つまたはそれを上回る実施形態に対していかようにも要求されること、または１つまたはそれを上回る実施形態が、著者の入力または促しの有無を問わず、これらの特徴、要素、および／またはステップが任意の特定の実施形態において含まれる、または実施されるべきかどうかを決定するための論理を必然的に含むことを合意することを意図していない。用語「〜を備える（ｃｏｍｐｒｉｓｉｎｇ）」、「〜を含む（ｉｎｃｌｕｄｉｎｇ）」、「〜を有する（ｈａｖｉｎｇ）」、および同等物は、同義語であり、非限定的方式で包括的に使用され、付加的要素、特徴、行為、動作等を除外しない。また、用語「または」は、その包括的意味において使用され（およびその排他的意味において使用されず）、したがって、例えば、要素のリストを接続するために使用されると、用語「または」は、リスト内の要素のうちの１つ、いくつか、または全てを意味する。加えて、本願および添付される請求項で使用されるような冠詞「ａ」、「ａｎ」、および「ｔｈｅ」は、別様に規定されない限り、「１つ以上の」または「少なくとも１つ」を意味すると解釈されるべきである。

本明細書で使用されるように、項目のリスト「〜のうちの少なくとも１つ」を指す語句は、単一の要素を含む、それらの項目の任意の組み合わせを指す。ある実施例として、「Ａ、Ｂ、またはＣのうちの少なくとも１つ」は、Ａ、Ｂ、Ｃ、ＡおよびＢ、ＡおよびＣ、ＢおよびＣ、およびＡ、Ｂ、およびＣを網羅することが意図される。語句「Ｘ、Ｙ、およびＺのうちの少なくとも１つ」等の接続文は、別様に具体的に記載されない限り、概して、項目、用語等がＸ、Ｙ、またはＺのうちの少なくとも１つであり得ることを伝えるために使用されるような文脈で別様に理解される。したがって、そのような接続文は、概して、ある実施形態が、Ｘのうちの少なくとも１つ、Ｙのうちの少なくとも１つ、およびＺのうちの少なくとも１つがそれぞれ存在するように要求することを示唆することを意図されない。

同様に、動作は、特定の順序で図面に描写され得るが、これは、望ましい結果を達成するために、そのような動作が示される特定の順序で、または連続的順序で実施される、または全ての図示される動作が実施される必要はないと認識されるべきである。さらに、図面は、フローチャートの形態で１つ以上の例示的プロセスを図式的に描写し得る。しかしながら、描写されない他の動作も、図式的に図示される例示的方法およびプロセス内に組み込まれることができる。例えば、１つ以上の付加的動作が、図示される動作のいずれかの前に、その後に、それと同時に、またはその間に実施されることができる。加えて、動作は、他の実装において再配列される、または再順序付けられ得る。ある状況では、マルチタスクおよび並列処理が、有利であり得る。さらに、上記に説明される実装における種々のシステムコンポーネントの分離は、全ての実装におけるそのような分離を要求するものとして理解されるべきではなく、説明されるプログラムコンポーネントおよびシステムは、概して、単一のソフトウェア製品においてともに統合される、または複数のソフトウェア製品にパッケージ化され得ることを理解されたい。加えて、他の実装も、以下の請求項の範囲内である。いくつかの場合では、請求項に列挙されるアクションは、異なる順序で実施され、依然として、望ましい結果を達成することができる。

Claims

システムであって、
仮想キャラクタのための骨格系の複数の例示的姿勢を記憶するための非一過性コンピュータ記憶装置と、
前記非一過性コンピュータ記憶装置と通信するハードウェアコンピュータプロセッサであって、前記ハードウェアコンピュータプロセッサは、
前記複数の例示的姿勢を１つ以上のクラスタにクラスタ化することであって、前記複数の例示的姿勢は、入力姿勢空間を定義し、前記複数の例示的姿勢はそれぞれ、関節回転のセットを備え、前記関節回転は、特異性のない数学的表現を有する、ことと、
クラスタ毎に、代表的姿勢を決定することと、
前記入力姿勢空間と比較して低減された次元を伴う出力姿勢空間を提供することと
を含む方法を実行することによって、前記入力姿勢空間の次元を低減させるように構成される、ハードウェアコンピュータプロセッサと
を備える、システム。
前記関節回転の特異性のない数学的表現は、四元数表現を含む、請求項１に記載のシステム。
オイラー角表現を有する前記関節回転とともに、前記複数の例示的姿勢を受信することと、
前記オイラー角表現を前記四元数表現に変換することと
をさらに含む、請求項２に記載のシステム。
前記例示的姿勢は、各例示的姿勢と各クラスタとの間の類似性を決定するためのメトリックに基づいて、前記１つ以上のクラスタにクラスタ化される、請求項１に記載のシステム。
前記例示的姿勢をクラスタ化することは、前記例示的姿勢のそれぞれを多次元空間内の点にマッピングすることを含む、請求項１に記載のシステム。
前記例示的姿勢をクラスタ化することはさらに、
クラスタ毎に、重心を決定することと、
前記例示的姿勢毎の点と各クラスタの重心との間の距離を決定することと、
各例示的姿勢を最も近くのクラスタに割り当てることと
を含む、請求項５に記載のシステム。
反復的に、クラスタ毎に、前記重心を決定し、各例示的姿勢を最も近くのクラスタに割り当てることをさらに含む、請求項６に記載のシステム。
前記クラスタ毎の代表的姿勢は、そのクラスタに割り当てられる例示的姿勢またはそのクラスタの重心と関連付けられる例示的姿勢のうちの１つを含む、請求項６に記載のシステム。
クラスタの数を決定することをさらに含む、請求項１に記載のシステム。
クラスタの数を決定することは、
クラスタの複数の異なる候補数毎に、前記複数の例示的姿勢を前記１つ以上のクラスタにクラスタ化することと、
クラスタの各候補数と関連付けられる誤差メトリックを計算することと、
前記クラスタの候補数と関連付けられる前記誤差メトリックに基づいて、前記クラスタの候補数のうちの１つを選択することと
を含む、請求項９に記載のシステム。
前記誤差メトリックは、前記入力姿勢空間内の例示的姿勢の全てに関する各例示的姿勢に対応する点とその割り当てられるクラスタの重心との間の二乗距離の和を含む、請求項１０に記載のシステム。
前記クラスタの候補数のうちの１つを選択することは、その誤差メトリックが選択された基準を満たすかどうかを決定することを含む、請求項１０に記載のシステム。
前記基準は、前記誤差メトリックの変化率が指定された閾値を超えることである、請求項１２に記載のシステム。
前記出力姿勢空間を使用して、姿勢空間デフォーマを訓練することをさらに含む、請求項１に記載のシステム。
前記姿勢空間デフォーマを使用して、仮想キャラクタのためのメッシュ変形を計算することをさらに含む、請求項１４に記載のシステム。
前記姿勢空間デフォーマを使用して、出力変形行列内の複数のブレンドシェイプを制御することをさらに含む、請求項１４に記載のシステム。
前記出力変形行列は、主成分分析を使用して入力変形行列の次元を低減させることによって生成される、請求項１６に記載のシステム。
前記入力変形行列の次元を低減させることは、
前記入力変形行列の主成分を決定することと、
前記主成分のうちの１つ以上のものを省略し、１つ以上の残りの主成分を残すことと、
前記１つ以上の残りの主成分と関連付けられる１つ以上のブレンドシェイプを使用して、前記出力変形行列を生成することと
を含む、請求項１７に記載のシステム。
前記出力姿勢空間は、前記入力姿勢空間より少なくとも３０％小さい、請求項１に記載のシステム。
前記システムは、仮想現実、拡張現実、または複合現実ディスプレイシステムを備える、請求項１に記載のシステム。
方法であって、
仮想キャラクタのための骨格系の複数の例示的姿勢を取得することであって、前記複数の例示的姿勢は、入力姿勢空間を定義し、前記複数の例示的姿勢はそれぞれ、関節回転のセットを備え、前記関節回転は、特異性のない数学的表現を有する、ことと、
前記複数の例示的姿勢を１つ以上のクラスタにクラスタ化することと、
クラスタ毎に、代表的姿勢を決定することと、
前記入力姿勢空間と比較して低減された次元を伴う出力姿勢空間を提供することと
を含む、方法。