WO2023281593A1

WO2023281593A1 - 情報処理装置、制御方法及び記憶媒体

Info

Publication number: WO2023281593A1
Application number: PCT/JP2021/025338
Authority: WO
Inventors: 亮介坂井; 康敬馬場崎
Original assignee: 日本電気株式会社
Priority date: 2021-07-05
Filing date: 2021-07-05
Publication date: 2023-01-12
Also published as: JPWO2023281593A1

Abstract

情報処理装置１Ｘは、主に、特徴点情報取得手段４２Ｘと、候補フィールド生成手段５１Ｘと、整合性判定手段５２Ｘとを有する。特徴点情報取得手段４２Ｘは、対象となるフィールドの少なくとも一部を含む画像に基づき決定された、フィールドの複数の特徴点の候補位置及び候補ラベルを示す特徴点情報を取得する。候補フィールド生成手段５１Ｘは、特徴点情報に基づき、画像を撮影するカメラを有する表示装置が基準とする座標系である第１座標系におけるフィールドの候補を表す候補フィールドを生成する。整合性判定手段５２Ｘは、複数の画像の複数の特徴点情報に対応する複数の候補フィールドに基づき、非整合候補フィールドを判定する。

Description

情報処理装置、制御方法及び記憶媒体

　本発明は、拡張現実（ＡＲ：Ａｕｇｍｅｎｔｅｄ　Ｒｅａｌｉｔｙ）における空間把握に関する処理を行う情報処理装置、制御方法及び記憶媒体の技術分野に関する。

　拡張現実を提供する装置において、カメラで撮像した画像に基づき、ユーザが視認する風景に重ねて表示する画像（所謂ＡＲ画像）の表示位置を決定する技術が存在する。例えば、特許文献１には、スポーツ観戦におけるＡＲを実現するため、フィールドの各特徴点の位置を推定し、その推定結果に基づきＡＲのキャリブレーションを行う技術が記載されている。

国際公開ＷＯ２０２１／０３３３１４

　特許文献１のように対象のフィールドの特徴点を抽出してキャリブレーションなどの処理を行う場合において、対象のフィールドが規則的な特徴点を有する場合には、特徴点の抽出にエラーが生じやすくなり、その結果キャリブレーション処理の精度が低下する。対象のフィールドの一部の特徴点しか表れていない画像を用いた場合にはそのようなエラーが生じやすくなる。

　本開示は、上述した課題を鑑み、対象となるフィールドの推定の誤りを好適に抑制することが可能な情報処理装置、制御方法及び記憶媒体を提供することを主な目的の１つとする。

　情報処理装置の一の態様は、
　対象となるフィールドの少なくとも一部を含む画像に基づき決定された、前記フィールドの複数の特徴点に関する特徴点情報を取得する特徴点情報取得手段と、
　前記特徴点情報に基づき、前記画像を撮影するカメラを有する表示装置が基準とする座標系である第１座標系における前記フィールドの候補を表す候補フィールドを生成する候補フィールド生成手段と、
　複数の前記画像の複数の前記特徴点情報に対応する複数の前記候補フィールドに基づき、整合性を有しない前記候補フィールドである非整合候補フィールドを判定する整合性判定手段と、
を有する情報処理装置である。

　制御方法の一の態様は、
　コンピュータが、
　対象となるフィールドの少なくとも一部を含む画像に基づき決定された、前記フィールドの複数の特徴点に関する特徴点情報を取得し、
　前記特徴点情報に基づき、前記画像を撮影するカメラを有する表示装置が基準とする座標系である第１座標系における前記フィールドの候補を表す候補フィールドを生成し、
　複数の前記画像の複数の前記特徴点情報に対応する複数の前記候補フィールドに基づき、整合性を有しない前記候補フィールドである非整合候補フィールドを判定する、
制御方法である。

　記憶媒体の一の態様は、
　対象となるフィールドの少なくとも一部を含む画像に基づき決定された、前記フィールドの複数の特徴点に関する特徴点情報を取得し、
　前記特徴点情報に基づき、前記画像を撮影するカメラを有する表示装置が基準とする座標系である第１座標系における前記フィールドの候補を表す候補フィールドを生成し、
　複数の前記画像の複数の前記特徴点情報に対応する複数の前記候補フィールドに基づき、整合性を有しない前記候補フィールドである非整合候補フィールドを判定する処理をコンピュータに実行させるプログラムを格納する記憶媒体である。

　本開示の１つの効果の例として、対象となるフィールドの推定の誤りを好適に抑制することができる。

第１実施形態に係る表示装置の概略構成図である。構造データのデータ構造の一例を示す。制御部の機能的な構成を示すブロック図である。（Ａ）対象フィールドがテニスコートである場合の構造特徴点の第１のラベル定義例である。（Ｂ）対象フィールドがテニスコートである場合の構造特徴点の第２のラベル定義例である。（Ａ）対象フィールドがプールである場合の構造特徴点の第１のラベル定義例である。（Ｂ）対象フィールドがプールである場合の構造特徴点の第２のラベル定義例である。（Ａ）対象フィールドの一部を撮影した撮像画像を示す。（Ｂ）撮像画像を反転させることで生成された変換撮像画像を示す。フィールド推定部の処理の概要を表したフィールド推定部の機能ブロック図である。デバイス座標系とフィールド座標系との関係を示した図である。１つの画像の特徴点情報に基づく候補フィールドをデバイス座標系において表した図である。生成した６個の候補フィールドのクラスタリングの結果をデバイス座標系において示した図である。（Ａ）特徴抽出処理が適切に行われた撮像画像上に、特徴点情報に基づく候補フィールドを重畳した図である。（Ｂ）特徴抽出処理にエラーが生じた撮像画像上に、特徴点情報に基づく候補フィールドを重畳した図である。整合候補フィールドから推定フィールドを決定する処理の概要を示す図である。第１実施形態において制御部が実行する仮想オブジェクトの表示処理に関する処理概要を示すフローチャートの一例である。キャリブレーション処理の詳細な処理手順を示すフローチャートの一例である。変形例におけるフィールド推定部のブロック構成図である。第２実施形態における表示システムの構成を示す。第２実施形態におけるサーバ装置のブロック図である。第２実施形態においてサーバ装置の制御部が実行する処理手順を示すフローチャートの一例である。第３実施形態における情報処理装置の概略構成を示す。第３実施形態におけるフローチャートの一例である。

　以下、図面を参照しながら、情報処理装置、制御方法及び記憶媒体の実施形態について説明する。

　＜第１実施形態＞
　（１）概略構成
　図１は、第１実施形態に係る表示装置１の概略構成図である。表示装置１は、ユーザが装着可能な装置であり、例えば眼鏡型に構成されたシースルー型であって、ユーザの頭部に装着可能に構成されている。そして、表示装置１は、スポーツ観戦や劇（コンサートを含む）の観賞などにおいて、実在する風景に視覚情報を重ねて表示することで、拡張現実（ＡＲ：Ａｕｇｍｅｎｔｅｄ　Ｒｅａｌｉｔｙ）を実現する。上記の視覚情報は、２次元又は３次元により表された仮想のオブジェクトであり、以後では、「仮想オブジェクト」とも呼ぶ。なお、表示装置１は、ユーザの片眼にのみ仮想オブジェクトを表示してもよく、両眼に対して仮想オブジェクトを表示してもよい。

　本実施形態では、スポーツや劇などが行われる場又は構造物（以後では「対象フィールド」とも呼ぶ。）が存在するものとし、表示装置１は、ユーザがスポーツ観戦や劇の観賞を行う際に補助となる付加的な情報となる仮想オブジェクトを、対象フィールド又はその周辺に重畳表示する。対象フィールドは、例えば、スポーツ観戦において対象となるフィールド（例えばテニスコート、競泳用プール、スタジアム等）、又は、観劇において対象となるフィールド（例えば劇場、コンサートホール、多目的ホール、各種ステージ等）などが該当する。後述するように、対象フィールドは、構造上の（即ち形状において特徴がある）特徴点（「構造特徴点」とも呼ぶ。）を複数有している。対象フィールドは、表示装置１のキャリブレーションにおける基準物として機能する。

　仮想オブジェクトは、例えば、テニスなどの場合には、テニスコート上方に表示する点数ボード、競泳の場合には、競泳中のプールにリアルタイム重畳表示する世界記録ライン、観劇などでステージ上に重畳表示するバーチャル出演者などを含む。

　表示装置１は、光源ユニット１０と、光学素子１１と、通信部１２と、入力部１３と、記憶部１４と、カメラ１５と、位置姿勢検出センサ１６と、制御部１７とを有する。

　光源ユニット１０は、レーザ光源やＬＣＤ（Ｌｉｑｕｉｄ　Ｃｒｙｓｔａｌ　Ｄｉｓｐｌａｙ）光源などの光源を有しており、制御部１７から供給される駆動信号に基づき、光を射出する。光学素子１１は、所定の透過率を有し、外光の少なくとも一部を透過してユーザの眼球に入射させると共に、光源ユニット１０からの光の少なくとも一部を、ユーザの眼球に向けて反射する。これにより、表示装置１によって形成された仮想オブジェクトに対応する虚像が、風景と重なってユーザに視認されることとなる。なお、光学素子１１は、透過率と反射率とが概ね等しいハーフミラーであってもよく、透過率と反射率とが等しくないようなミラー（所謂ビームスプリッタ）であってもよい。

　通信部１２は、制御部１７の制御に基づき、外部装置とのデータの授受を行う。例えば、ユーザがスポーツ観戦や劇の観賞などに表示装置１を使用する場合には、通信部１２は、制御部１７の制御に基づき、興行者が管理するサーバ装置から表示装置１が表示すべき仮想オブジェクトに関する情報を受信する。

　入力部１３は、ユーザの操作に基づく入力信号を生成して制御部１７に送信する。入力部１３は、例えば、ユーザが表示装置１に対して指示を行うためのボタン、十字キー、音声入力装置等である。

　カメラ１５は、制御部１７の制御に基づき、表示装置１の前方を撮像した画像を生成し、生成した画像（「撮像画像Ｉｍ」とも呼ぶ。）を制御部１７に供給する。

　位置姿勢検出センサ１６は、表示装置１の位置及び姿勢（向き）を検出するセンサ（センサ群）であり、例えば、ＧＰＳ（Ｇｌｏｂａｌ　Ｐｏｓｉｔｉｏｎｉｎｇ　Ｓａｔｅｌｌｉｔｅ）受信機などの測位センサと、ジャイロセンサ、加速度センサ、ＩＭＵ（Ｉｎｅｒｔｉａｌ　Ｍｅａｓｕｒｅｍｅｎｔ　Ｕｎｉｔ）などの表示装置１の相対的な姿勢の変化を検出する姿勢検出センサとを含む。位置姿勢検出センサ１６は、生成した表示装置１の位置及び姿勢に関する検出信号を制御部１７へ供給する。後述するように、制御部１７は、位置姿勢検出センサ１６から供給される検出信号に基づき、表示装置１の起動時等からの位置及び姿勢の変化量を検出する。なお、制御部１７は、測位センサから表示装置１の位置を検出する代わりに、例えば、会場に設けられたビーコン端末や無線ＬＡＮ機器から受信する信号に基づき、表示装置１の位置を特定してもよい。他の例では、制御部１７は、ＡＲマーカを用いた公知の位置推定技術に基づき、表示装置１の位置を特定してもよい。これらの場合、位置姿勢検出センサ１６は、測位センサを含まなくともよい。

　制御部１７は、例えばＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）、ＧＰＵ（Ｇｒａｐｈｉｃｓ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）などのプロセッサ、プロセッサの作業メモリとして機能する揮発性メモリなどを有しており、表示装置１の全体的な制御を行う。

　例えば、制御部１７は、仮想オブジェクトの表示タイミングなどにおいて、撮像画像Ｉｍから認識される対象フィールドの構造特徴点に基づき、実世界空間と表示装置１が認識する空間とを対応付けるためのキャリブレーション処理を行う。このキャリブレーション処理では、制御部１７は、表示装置１が基準とする３次元空間の座標系（「デバイス座標系」とも呼ぶ。）を、対象フィールドを基準とした３次元空間の座標系（「フィールド座標系」とも呼ぶ。）に変換するための座標変換情報を生成する。デバイス座標系は「第１座標系」の一例であり、フィールド座標系は「第２座標系」の一例である。キャリブレーション処理の詳細については後述する。そして、制御部１７は、上述の座標変換情報等に基づき、光源ユニット１０を駆動するための駆動信号を生成し、駆動信号を光源ユニット１０に供給することで光源ユニット１０に仮想オブジェクトを表示するための光（「表示光」とも呼ぶ。）を光学素子１１に射出させる。これにより、制御部１７は、仮想オブジェクトをユーザに視認させる。

　記憶部１４は、制御部１７が表示装置１の制御に必要な種々の情報を記憶する不揮発性メモリである。記憶部１４は、フラッシュメモリなどの着脱自在な記憶媒体を含んでもよい。また、記憶部１４には、制御部１７が実行するプログラムが記憶される。

　また、記憶部１４は、センサデータ記憶部２０と、パラメータ記憶部２１と、構造データ記憶部２２とを有する。

　センサデータ記憶部２０は、カメラ１５が生成する撮像画像Ｉｍと、当該撮像画像Ｉｍの生成時におけるデバイス座標系の設定時（例えば表示装置１の起動時）からの表示装置１の位置及び姿勢の変化量（「位置姿勢変化量Ａｐ」とも呼ぶ。）とを関連付けて記憶する。この場合、例えば、制御部１７は、デバイス座標系の設定時の位置及び姿勢を基準とする現在の位置及び姿勢の変化量を、位置姿勢検出センサ１６の検出信号に基づき常時算出する。そして、制御部１７は、カメラ１５が生成した撮像画像Ｉｍをセンサデータ記憶部２０に記憶する場合に、当該撮像画像Ｉｍの生成時に算出した位置姿勢変化量Ａｐを当該撮像画像Ｉｍに関連付けてセンサデータ記憶部２０に記憶する。制御部１７は、例えば、最新の所定時間分又は所定数分の撮像画像Ｉｍ及び位置姿勢変化量Ａｐの組合せをセンサデータ記憶部２０に記憶させる。センサデータ記憶部２０に記憶される情報は、キャリブレーション処理において使用される。

　パラメータ記憶部２１は、キャリブレーション処理において、対象フィールドの構造特徴点の位置情報及び当該構造特徴点の分類情報を撮像画像Ｉｍから抽出する際に用いる推論器（「特徴抽出器」とも呼ぶ。）のパラメータを記憶する。上述の特徴抽出器は、例えば、撮像画像Ｉｍが入力された場合に、抽出対象となる構造特徴点の分類（即ちラベル）毎に構造特徴点の画像内の位置情報を出力するように学習された学習モデルである。上述の位置情報は、構造特徴点の座標値ごとの信頼度を示す画像上のマップ情報であってもよく、ピクセル単位又はサブピクセル単位での画像内の構造特徴点の位置を示す座標値であってもよい。上述の特徴抽出器が構造特徴点の分類毎のマップ情報を出力する場合には、例えば、構造特徴点の分類毎に信頼度がある閾値を超えた上位ｍ個（ｍは１以上の整数）の座標値が構造特徴点の位置として採用される。上記整数ｍは、後述する図４（Ａ）及び図５（Ａ）の例では「１」となり、後述する図４（Ｂ）及び図５（Ｂ）の例では「２」となる。なお、特徴抽出器の学習に用いる学習モデルは、ニューラルネットワークに基づく学習モデルであってもよく、サポートベクターマシーンなどの他の種類の学習モデルであってもよく、これらの組み合わせであってもよい。例えば、上述の学習モデルが畳み込みニューラルネットワークなどのニューラルネットワークである場合、パラメータ記憶部２１は、層構造、各層のニューロン構造、各層におけるフィルタ数及びフィルタサイズ、並びに各フィルタの各要素の重みなどの各種パラメータを記憶する。

　また、パラメータ記憶部２１は、カメラ１５の焦点距離、内部パラメータ、主点、撮像画像Ｉｍのサイズ情報などの、仮想オブジェクトの表示に必要なカメラ１５に関するパラメータを記憶する。

　構造データ記憶部２２は、対象フィールドの構造に関するデータである構造データを記憶する。図２は、構造データのデータ構造の一例を示す。構造データは、サイズ情報と、登録特徴点情報と、を有する。

　サイズ情報は、対象フィールドのサイズに関する情報である。登録特徴点情報は、対象フィールドの構造特徴点に関する情報であり、予め計測した構造特徴点毎の個別の情報を含んでいる。ここでは、対象フィールドがＮ個（Ｎは２以上の整数）の構造特徴点を有することから、登録特徴点情報は、これらのＮ個の構造特徴点に夫々対応する情報（第１登録特徴点情報～第Ｎ登録特徴点情報）を含んでいる。登録特徴点情報は、対象となる構造特徴点の分類を示すラベルと、対象となる構造特徴点のフィールド座標系での位置を示す登録位置情報とを少なくとも含んでいる。登録位置情報は、フィールド座標系により表された座標情報であり、例えばいずれかの構造特徴点の位置が原点となるように設定されている。登録特徴点情報は、キャリブレーション処理において用いられる。なお、任意の２点の構造特徴点間の長さは、これらの登録位置情報が示す座標値に基づき算出可能である。

　その他、構造データは、フィールド座標系において原点とする構造特徴点を指定する情報及びフィールド座標系の３軸の各方向をそれぞれ指定する情報などが含まれてもよい。

　なお、図１に示す表示装置１の構成は一例であり、この構成に対して種々の変更を行ってもよい。例えば、表示装置１は、制御部１７の制御に基づき、音声を出力するスピーカをさらに備えてもよい。また、表示装置１は、ユーザの視線の位置に応じて仮想オブジェクトの表示有無や仮想オブジェクトの表示位置を変更するための視線検出用カメラを備えてもよい。さらに別の例では、記憶部１４は、センサデータ記憶部２０を有しなくともよい。この場合、制御部１７は、カメラ１５から即時に取得した撮像画像Ｉｍと、位置姿勢検出センサ１６の検出信号に基づき算出した位置姿勢変化量Ａｐとを用いて、キャリブレーション処理を行う。

　さらに別の例では、表示装置１は、位置姿勢検出センサ１６等による表示装置１の位置を検出しなくともよい。一般に、スポーツ観戦や劇等の観賞中では、ユーザが移動することは稀であり、かつ、表示装置１の姿勢変化に比べて表示装置１の位置の変化に対する仮想オブジェクトの表示への影響は小さい。以上を勘案し、位置姿勢検出センサ１６は、表示装置１の姿勢を検出するセンサから構成され、制御部１７は、デバイス座標系の設定時からの表示装置１の姿勢の変化量のみを、位置姿勢変化量Ａｐとして算出してもよい。

　（２）機能ブロック
　図３は、制御部１７の機能的な構成を示すブロック図である。図３に示すように、制御部１７は、機能的には、画像変換部４０と、仮想オブジェクト取得部４１と、特徴抽出部４２と、座標変換情報生成部４３と、反映部４４と、光源制御部４５と、を有する。なお、図３では、データの授受が行われるブロック同士を実線により結んでいるが、データの授受が行われるブロックの組合せは図３に限定されない。後述する他の機能ブロックの図においても同様である。

　画像変換部４０は、センサデータ記憶部２０から特徴抽出部４２が取得する撮像画像Ｉｍに対して所定の画像変換を行った画像（「変換撮像画像Ｉｍａ」とも呼ぶ。）を生成する。この場合、画像変換部４０は、任意のデータオーグメンテーションの手法により変換撮像画像Ｉｍａを生成してもよい。例えば、画像変換部４０は、撮像画像Ｉｍを反転させた画像を変換撮像画像Ｉｍａとして生成してもよく、撮像画像Ｉｍに対してクロップした（切り取りを行った）画像を変換撮像画像Ｉｍａとして生成してもよい。この場合、画像変換部４０は、クロップする大きさや箇所をランダム又は規則的に変更することで、複数のクロップ画像を変換撮像画像Ｉｍａとして生成してもよい。画像変換部４０は、１つの撮像画像Ｉｍに対して１個以上の変換撮像画像Ｉｍａを生成する。

　仮想オブジェクト取得部４１は、仮想オブジェクトとして風景に重畳表示させる元となる仮想オブジェクトとその表示位置とを指定する情報（「指定表示情報Ｉｄ」とも呼ぶ。）を取得する。この仮想オブジェクトは、２次元の物体描画のための情報（２次元描画情報）であってもよく、３次元の物体描画のための情報（３次元描画情報）であってもよい。例えば、興行者が管理するサーバ装置と表示装置１が通信可能である場合には、仮想オブジェクト取得部４１は、サーバ装置から所定のタイミングによりプッシュ型配信又はプル型配信される配信情報を、指定表示情報Ｉｄとして取得する。この場合、指定表示情報Ｉｄには、仮想オブジェクトの他、表示位置を指定する情報（例えばフィールド座標系での座標値を示す情報）が含まれている。他の例では、仮想オブジェクトと表示位置とその表示条件との組み合わせを示す情報が記憶部１４に予め記憶されてもよい。この場合、仮想オブジェクト取得部４１は、記憶された上述の表示条件が満たされたと判断したときに、満たされた表示条件に対応する仮想オブジェクトと表示位置の組み合わせを指定表示情報Ｉｄとして取得する。

　特徴抽出部４２は、センサデータ記憶部２０から取得する撮像画像Ｉｍ（例えば最新の撮像画像Ｉｍ）及びその変換画像である変換撮像画像Ｉｍａから、特徴点情報「ＩＦ」を画像ごとに生成する。この場合、特徴抽出部４２は、パラメータ記憶部２１から抽出したパラメータに基づき構成した特徴抽出器に上述の画像を入力することで特徴抽出器が出力する情報から入力した入力画像に対する特徴点情報ＩＦを生成する。例えば、特徴抽出器は、構造特徴点の分類を示すラベルごとに、入力画像内の構造特徴点の位置（例えば座標値）を出力し、特徴抽出部４２は、上述の入力画像内の構造特徴点の位置を構造特徴点の候補位置（「特徴点候補位置」とも呼ぶ。）とし、当該位置に対応するラベルをラベルの候補（「候補ラベル」とも呼ぶ。）とする複数の組み合わせを示す特徴点情報ＩＦを生成する。なお、特徴抽出器が構造特徴点の座標値として画像サイズに依存しないように正規化された値を出力する場合には、特徴抽出部４２は、当該座標値に入力画像の画像サイズを乗じることで、特徴点候補位置を算出する。

　座標変換情報生成部４３は、構造データ記憶部２２から抽出した構造データと、特徴点情報ＩＦと、特徴抽出を行った撮像画像Ｉｍの生成時の位置姿勢変化量Ａｐと、カメラ１５のパラメータ等とに基づき、デバイス座標系とフィールド座標系との座標変換情報「Iｃ」を生成する。座標変換情報Ｉｃは、例えば、３次元空間同士の座標変換を行うために一般的に用いられる回転行列及び並進ベクトルの組み合わせである。なお、座標変換情報Ｉｃは、フィールド座標系をデバイス座標系へ変換する際に用いられる情報であることに限定されず、デバイス座標系をフィールド座標系へ変換する際に用いられる情報であってもよい。ここで、フィールド座標系からデバイス座標系へ変換するための回転行列及び並進ベクトルは、デバイス座標系からフィールド座標系へ変換するための回転行列（上述の回転行列の逆行列）及び並進ベクトル（符号反転した上述の並進ベクトル）に変換可能である。

　また、座標変換情報生成部４３は、フィールド推定部４６を有する。フィールド推定部４６は、デバイス座標系における対象フィールド（対象フィールドの位置）を推定する。フィールド推定部４６による推定方法については後述する。座標変換情報生成部４３は、フィールド推定部４６が推定したデバイス座標系における対象フィールド（「推定フィールド」とも呼ぶ。）と、構造データ記憶部２２が示すフィールド座標系における対象フィールドとに基づき、座標変換情報Ｉｃを生成する。

　反映部４４は、座標変換情報生成部４３から供給される座標変換情報Ｉｃを、仮想オブジェクト取得部４１から供給される指定表示情報Ｉｄに反映させることで、光学素子１１上に投影させる仮想オブジェクトを示す表示信号「Ｓｄ」を生成する。この場合、反映部４４は、座標変換情報Ｉｃによりデバイス座標系をフィールド座標系と一致させた上で、指定表示情報Ｉｄに基づく表示信号Ｓｄを生成する。光源制御部４５は、反映部４４から供給される表示信号Ｓｄに基づき、光源ユニット１０の光源（例えばＲＧＢに対応する各光源）を駆動するための駆動タイミング及び光量などを指示する駆動信号を生成し、生成した駆動信号を光源ユニット１０へ供給する。

　なお、キャリブレーション完了後（即ち座標変換情報Ｉｃを算出後）の各処理（即ち反映部４４及び光源制御部４５の処理）の説明は一例であり、既存のＡＲ製品などにおいて適用される任意の方法により、仮想オブジェクトを所望の風景位置に重畳させる仮想オブジェクトを表示させてもよい。例えば、このような技術を開示する文献の例として、特開２０１５－１１６３３６号公報、特開２０１６－５２５７４１号公報などが存在する。これらの文献に示されるように、表示装置１は、ユーザの視線検出などを行い、仮想オブジェクトが適切に視認されるように制御を行う。

　図３において説明した画像変換部４０、仮想オブジェクト取得部４１、特徴抽出部４２、座標変換情報生成部４３、反映部４４及び光源制御部４５の各構成要素は、例えば、制御部１７がプログラムを実行することによって実現できる。また、必要なプログラムを任意の不揮発性記憶媒体に記録しておき、必要に応じてインストールすることで、各構成要素を実現するようにしてもよい。なお、これらの各構成要素の少なくとも一部は、プログラムによるソフトウェアで実現することに限ることなく、ハードウェア、ファームウェア、及びソフトウェアのうちのいずれかの組合せ等により実現してもよい。また、これらの各構成要素の少なくとも一部は、例えばＦＰＧＡ（Field-Programmable Gate Array）又はマイクロコントローラ等の、ユーザがプログラミング可能な集積回路を用いて実現してもよい。この場合、この集積回路を用いて、上記の各構成要素から構成されるプログラムを実現してもよい。また、各構成要素の少なくとも一部は、ＡＳＳＰ（Application Specific Standard Produce）、ＡＳＩＣ（Application Specific Integrated Circuit）又は量子プロセッサ（量子コンピュータ制御チップ）により構成されてもよい。このように、各構成要素は、種々のハードウェアにより実現されてもよい。以上のことは、後述する他の実施の形態においても同様である。さらに、これらの各構成要素は、例えば、クラウドコンピューティング技術などを用いて、複数のコンピュータの協働によって実現されてもよい。

　（３）構造特徴点のラベル定義例
　図４（Ａ）は、対象フィールドがテニスコートである場合の構造特徴点の第１のラベル定義例であり、図４（Ｂ）は、対象フィールドがテニスコートである場合の構造特徴点の第２のラベル定義例である。図４（Ａ）及び図４（Ｂ）では、構造特徴点の位置に丸印及び対応するラベルの番号が明示されている。

　図４（Ａ）に示す第１のラベル定義例では、１４個存在する構造特徴点の隅から順に、０から１３までの通し番号を、各構造特徴点のラベルとして付している。一方、図４（Ｂ）に示す第２のラベル定義例では、対称となる構造特徴点に対して同一ラベルを付している。その結果、０から５までの各ラベルは、対称位置にある２つの構造特徴点に対して付されている。

　図５（Ａ）は、対象フィールドがプールである場合の構造特徴点の第１のラベル定義例であり、図５（Ｂ）は、対象フィールドがプールである場合の構造特徴点の第２のラベル定義例である。図５（Ａ）及び図５（Ｂ）では、構造特徴点の位置に丸印及び対応するラベルの番号が明示されている。なお、対象フィールドがプールの場合、コースを区画するロープに所定距離間隔により設けられた所定色のフロートが構造特徴点として選ばれている。

　図５（Ａ）に示す第１のラベル定義例では、２５個存在する構造特徴点の隅から順に、０から２４までの通し番号を、各構造特徴点のラベルとして付している。一方、図５（Ｂ）に示す第２のラベル定義例では、対称となる構造特徴点に対して同一ラベルを付している。その結果、０から１１までの各ラベルは、対称位置にある２つの構造特徴点に対して付されている。

　（４）画像変換の例
　図６（Ａ）は、対象フィールドの一部を撮影した撮像画像Ｉｍを示す。図６（Ｂ）は、図６（Ａ）の撮像画像Ｉｍを反転させることで生成された変換撮像画像Ｉｍａを示す。ここでは、対象フィールドは、格子状のフィールドであるものとし、格子の各頂点を構造特徴点として有するものとする。なお、図６（Ａ）及び図６（Ｂ）では、１２個の構造特徴点に対してラベル「０」～「１１」が割り当てられており、説明便宜上、各構造特徴点に対するラベルの番号を図示している。また、図６（Ａ）では、撮像画像Ｉｍの撮影範囲外となる対象フィールドを表す仮想線を破線により示し、かつ、撮影範囲外の構造特徴点に対するラベルについても明示している。

　図６（Ａ）では、対象フィールドの一部が撮影範囲外となっており、対象フィールドの右側の構造特徴点（ラベル９～１１の構造特徴点）が撮像画像Ｉｍ上において表れていない。一方、撮像画像Ｉｍを左右反転させた図６（Ｂ）に示す変換撮像画像Ｉｍａは、左右反転により、撮像画像Ｉｍでは表れていなかった対象フィールドの右側の構造特徴点（ここではラベル９～１１の構造特徴点）が表れた画像となっている。なお、左側の構造特徴点（ここではラベル１～３の構造特徴点）は、変換撮像画像Ｉｍａ上に表れていない。

　以上のように、画像変換部４０は、撮像画像Ｉｍの反転画像を変換撮像画像Ｉｍａとして生成することで、撮像画像Ｉｍとは別に対象フィールドを表した画像を好適に生成することができる。撮像画像Ｉｍのクロップ画像を変換撮像画像Ｉｍａとして生成する場合も同様である。このように、画像変換部４０は、対象フィールドに対する複数の特徴抽出結果が得られるようにデータオーグメンテーションを行う。

　（４）フィールド推定部の処理
　（４－１）概要
　図７は、フィールド推定部４６の処理の概要を表したフィールド推定部４６の機能ブロック図である。図７に示すように、フィールド推定部４６は、機能的には、候補フィールド生成部５１と、整合性判定部５２と、推定フィールド決定部５３とを有する。なお、図７では明示していないが、フィールド推定部４６の各構成要素は、センサデータ記憶部２０に記憶された位置姿勢変化量Ａｐ及びパラメータ記憶部２１に記憶されたカメラのパラメータ（内部パラメータ、撮像画像Ｉｍのサイズを含む）を参照して各処理を行うものとする。

　候補フィールド生成部５１は、画像ごとの特徴点情報ＩＦに基づき、デバイス座標系において対象フィールドを表す候補（「候補フィールド」とも呼ぶ。）を生成する処理を実行する。候補フィールド生成部５１は、候補フィールドとして、例えば、ラベルごとのデバイス座標系における構造特徴点の推定位置と、デバイス座標系における対象フィールドの推定面とを特定する。候補フィールド生成部５１は、撮像画像Ｉｍ及び変換撮像画像Ｉｍａの合計がｋ（ｋは２以上の整数）個存在する場合には、ｎ個（ｎはｋ以下の整数）の候補フィールドを生成する。なお、対象フィールドが全く含まれていない変換撮像画像Ｉｍａについては、候補フィールドを生成できないため、撮像画像Ｉｍ及び変換撮像画像Ｉｍａの合計数よりも候補フィールドの生成数が少なくなる場合がある。同様に、ある画像から候補フィールドを生成する場合に、最小２乗を行う評価関数の値が所定の閾値より大きい場合、候補フィールド生成部５１は、生成される候補フィールドの信頼性が低いとみなし、当該画像に対する候補フィールドを生成しない。この場合においても、撮像画像Ｉｍ及び変換撮像画像Ｉｍａの合計数よりも候補フィールドの生成数が少なくなる。候補フィールドの生成方法の具体例については後述する。

　整合性判定部５２は、ｎ個の候補フィールドに基づき、他の候補フィールドと整合性を有しない候補フィールド（「非整合候補フィールド」とも呼ぶ。）を判定する。そして、整合性判定部５２は、非整合候補フィールド以外の候補フィールド（「整合候補フィールド」とも呼ぶ。）を推定フィールド決定部５３に供給する。

　推定フィールド決定部５３は、整合候補フィールドに基づき、推定フィールドを決定する。この場合、推定フィールド決定部５３は、例えば、整合候補フィールドを統合することで、推定フィールドを生成する。言い換えると、推定フィールド決定部５３は、デバイス座標系での対象フィールドの各ラベルの構造特徴点の推定位置（及び対象フィールドの推定面）を決定する。

　また、推定フィールド決定部５３は、整合性判定部５２による判定結果に基づき、推定フィールドを生成する要否判定を行ってもよい。この場合、推定フィールド決定部５３は、推定フィールドを決定する条件（「推定フィールド決定条件」とも呼ぶ。）を設け、当該推定フィールド決定条件が満たされる場合に限り、推定フィールドを生成する。

　この場合、推定フィールド決定部５３は、推定フィールド決定条件を、全候補フィールドに対する非整合候補フィールドの割合に基づく条件（言い換えると整合候補フィールドの割合に基づく条件）に設定する。例えば、推定フィールド決定部５３は、全体の候補フィールドに対する非整合候補フィールドの割合が所定割合（例えば３割）未満である場合に、推定フィールド決定条件が満たされると判定し、整合候補フィールドに基づき推定フィールドを生成する。一方、推定フィールド決定部５３は、全体の候補フィールドに対する非整合候補フィールドの割合が所定割合以上である場合、推定フィールド決定条件が満たされないと判定し、推定フィールドを生成しない。この場合、フィールド推定部４６は、新たに生成された撮像画像Ｉｍ及び当該撮像画像Ｉｍから生成される変換撮像画像Ｉｍａの特徴点情報ＩＦに基づき、候補フィールドの再生成を行う。上述の所定割合は、例えば予め記憶部１４に記憶された適合値に設定される。このような判定を行うことで、推定フィールド決定部５３は、信頼性が低い候補フィールドに基づき推定フィールドを生成するのを好適に抑制することができる。なお、推定フィールド決定条件は、上述したものに限定されない。例えば、推定フィールド決定部５３は、ｎ個の候補フィールドに対するクラスタリングにより生成された最も数が多い第１クラスタの候補フィールド数と、全体に対する第１クラスタ及び第２クラスタの候補フィールドの合計数の割合とに基づき、推定フィールドを生成する要否判定を行ってもよい。この具体例については、図１０を参照して後述する。

　次に、フィールド推定部４６の処理による技術的効果について補足説明する。

　図４（Ａ）及び図４（Ｂ）に示すテニスコートや図５（Ａ）及び図５（Ｂ）に示すプールなどのように規則的な（詳しくは並進対称性を有する）構造特徴点を有する対象フィールドでは、構造特徴点が隣接する構造特徴点として抽出され、結果として全ての構造特徴点が規則的にずれて抽出されてしまう場合がある。このような特徴抽出結果のエラーは、画像に対象フィールドの一部のみが写されている場合にほぼ矛盾なく生じるエラー（無矛盾エラー）であり、一般的な特徴抽出結果のエラー検出手法や修正手法では対応できないものとなる。このように、対象フィールドの一部が隠れた画像を用いる場合には、特徴抽出精度が低下し、結果としてフィールド推定精度も低くなる。

　以上を勘案し、フィールド推定部４６は、データオーグメンテーションにより生成された画像を含むｋ枚の画像に基づく候補フィールドに基づき、非整合候補フィールド及び整合候補フィールドを判定し、整合候補フィールドにより推定フィールドを決定する。これにより、フィールド推定部４６は、規則的に並ぶ構造特徴点を有する対象フィールドの推定において撮像されない死角部分の存在に起因した推定精度低下の課題を好適に解決し、デバイス座標系での対象フィールドを的確に推定することができる。

　また、ニューラルネットワークに基づく特徴抽出器は、難易度が高い特徴点抽出を行う場合には、入力画像の細かい変更でも出力する特徴抽出結果が異なる場合がある。そして、特徴抽出部４２において用いられる特徴抽出器は、主にニューラルネットワークに基づく推論器が想定されている。よって、特徴抽出部４２において用いられる特徴抽出器は、元画像（即ち撮像画像Ｉｍ）を入力した場合と元画像を反転又はクロップした画像（即ち変換撮像画像Ｉｍａ）を入力した場合とで、出力する特徴抽出結果にばらつきが生じる。このばらつきは、正確な特徴抽出が難しい場合ほど生じやすい。よって、フィールド推定部４６は、撮像画像Ｉｍ及び変換撮像画像Ｉｍａから夫々生成した特徴点情報ＩＦに基づき、複数の候補フィールドを好適に生成することができる。

　（４－２）候補フィールドの生成
　次に、候補フィールド生成部５１による候補フィールドの生成処理について具体的に説明する。

　図８は、デバイス座標系とフィールド座標系との関係を示した図である。図８に示されるように、フィールド座標系は、構造データにおいて採用される座標系であり、対象フィールドを基準とする座標系となっている。ここでは、対象フィールドはテニスコートとなっており、フィールド座標系は、テニスコートの短手方向及び長手方向及びこれらの垂直方向に各軸が設けられている。以後では、デバイス座標系の３軸をｘ軸、ｙ軸、ｚ軸とし、フィールド座標系の３軸をｘ＾軸、ｙ＾軸、ｚ＾軸とする。一方、デバイス座標系は、表示装置１が起動時等において設定した座標系であり、デバイス座標系におけるカメラ１５の撮影位置（撮影方向を含む）は、位置姿勢変化量Ａｐに基づき特定される。そして、候補フィールド生成部５１は、フィールド座標系が採用される構造データと、特徴点情報ＩＦとに基づき、デバイス座標系における対象フィールドを表す候補フィールドを生成する。

　なお、候補フィールド生成部５１は、位置姿勢検出センサ１６に含まれる加速度センサの出力信号に基づき、デバイス座標系における鉛直方向を認識し、認識した鉛直方向に基づき、デバイス座標系及びフィールド座標系の高さ方向の軸（ｙ軸とｙ＾軸）が平行になるようにデバイス座標系を調整してもよい。この場合、候補フィールド生成部５１は、デバイス座標系及びフィールド座標系の１軸を揃えることができるため、後述するデバイス座標系での特徴点候補位置の特定及び候補フィールドの生成における計算コストの削減等を実現することが可能となる。

　図９は、１つの画像の特徴点情報ＩＦに基づく候補フィールドをデバイス座標系において表した図である。ここでは、対象フィールドは、図６（Ａ）の撮像画像Ｉｍにおいて撮像対象となった格子状フィールドであり、１２個の構造特徴点のうち、特徴点候補位置「Ｐ０」～「Ｐ８」に対応する計９個の構造特徴点が特徴抽出部４２により抽出されている。そして、候補フィールド生成部５１は、特徴点候補位置Ｐ０～Ｐ８に基づき、候補フィールド「Ｃ１」を生成している。

　この場合、候補フィールド生成部５１は、位置姿勢変化量Ａｐに基づき特定されるデバイス座標系での撮影位置（撮影向きを含む）とカメラ１５のパラメータ（内部パラメータを含む）とに基づき、デバイス座標系に投影された特徴点候補位置Ｐ０～Ｐ８（図９に示される破線）を特定する。そして、候補フィールド生成部５１は、構造データを参照することで、対象フィールドの構造特徴点間の距離等を表す相対位置関係（対象フィールドのモデル）を特定し、特定した構造特徴点間の位置関係が保たれるように、デバイス座標系での特徴点候補位置Ｐ０～Ｐ８及び候補フィールドを決定する。この場合、例えば、候補フィールド生成部５１は、最小二乗法などにより、対象フィールドのモデルの構造特徴点と破線により示されるデバイス座標系に投影された特徴点候補位置とのラベルごとの誤差（２乗誤差）の和が最小となるように、対象フィールドのモデルの構造特徴点の位置を決定する。上記の例は、鉛直方向と直交した水平面上に特徴点があることを仮定したカメラの外部パラメータ（撮影位置や姿勢）の推定手法の一例である。なお、この例に限らず、候補フィールド生成部５１は、例えば、同一平面上に特徴点がある仮定も必要なく、また内部パラメータや画像上の特徴点の位置等の最適化も同時に行う任意のカメラキャリブレーション手法（例えば、ＰｎＰ法）を実行してもよい。

　（４－３）非整合候補フィールドの判定
　次に、複数の候補フィールドに基づき非整合候補フィールドを判定する方法について説明する。例えば、フィールド推定部４６は、候補フィールドのクラスタリングを行い、候補フィールドが属する数が最も大きい主クラスタに属する候補フィールドから推定フィールドを決定する。

　図１０は、生成した６個の候補フィールド「Ｃ１」～「Ｃ６」のクラスタリングの結果をデバイス座標系において示した図である。

　この場合、フィールド推定部４６は、任意のクラスタリング手法を用いることで、候補フィールドを第１クラスタＣＬ１と、第２クラスタＣＬ２と、第３クラスタＣＬ３とに分類している。この場合、フィールド推定部４６は、例えば、各候補フィールドに対してデバイス座標系での３次元の重心座標（例えば構造特徴点の平均座標）及びヨー・ピッチ・ロールのオイラー角（鉛直方向の情報によりデバイス座標系とフィールド座標系で揃えている場合にはｘｚ平面上での向きを表す角度）を表すベクトルに基づき、上述のクラスタリングを実行する。なお、このようなクラスタリング手法は、単リンク法、完全リンク法、群平均法、Ｗａｒｄ法、セントロイド法、重み付き法、メジアン法などが存在するがこれに限られない。

　ここでは、第１クラスタＣＬ１は候補フィールドが属する数が最も多いクラスタ（「主クラスタ」とも呼ぶ。）であり、最も多くの４つの候補フィールドＣ１、Ｃ３、Ｃ４、Ｃ６が属している。一方、第２クラスタＣＬ２は候補フィールドＣ２からなり、第３クラスタＣＬ３は、候補フィールドＣ５からなる。

　この場合、フィールド推定部４６は、主クラスタである第１クラスタＣＬ１に属する候補フィールドを、整合候補フィールドであると判定し、主クラスタ以外の第２クラスタＣＬ２、第３クラスタＣＬ３に属する候補フィールドを非整合候補フィールドであると判定する。

　なお、上述のクラスタリングに代えて、フィールド推定部４６は、閾値処理に基づき、整合候補フィールド及び非整合候補フィールドを判定してもよい。例えば、フィールド推定部４６は、上述のベクトルに基づく各候補フィールド間の距離を算出し、互いの距離が所定閾値未満となるクラスタを生成する。そして、フィールド推定部４６は、生成したクラスタのうち最も候補フィールド数が多い主クラスタに属する候補フィールドを、整合候補フィールドと判定し、主クラスタに属しない候補フィールドを、非整合候補フィールドと判定する。

　ここで、推定フィールドを生成する要否判定（及び推定フィールドに関する処理の終了判定）の具体例について、引き続き図１０を参照して説明する。ここでは、ｎ個の候補フィールドに対するクラスタリングにより生成された第１クラスタの候補フィールド数と、第１クラスタ及び第２クラスタの候補フィールドの合計数の全体に対する割合とに基づき、推定フィールドを生成する要否判定（及び推定フィールドに関する処理の終了判定）を行う例について説明する。

　第１ステップとして、フィールド推定部４６は、最も数が多い第１クラスタＣＬ１に属する候補フィールド数「Ｎｃ１」が所定の閾値「Ｎｃｔｈ１」以上であるか否か判定する。図１０の例では、候補フィールド数Ｎｃ１は、「４」となる。そして、候補フィールド数Ｎｃ１が閾値Ｎｃｔｈ１以上の場合、フィールド推定部４６は、以下に説明する第２ステップに処理を進める。一方、候補フィールド数Ｎｃ１が閾値Ｎｃｔｈ１未満の場合、フィールド推定部４６は、推定フィールド決定条件が満たされないと判定し、新たに生成された撮像画像Ｉｍ及び当該撮像画像Ｉｍから生成される変換撮像画像Ｉｍａの特徴点情報ＩＦに基づき、候補フィールドの再生成を行う。

　第２ステップとして、フィールド推定部４６は、最も数が多い第１クラスタＣＬ１及び２番目に数が多い第２クラスタＣＬ２の候補フィールドの合計数（即ちＮ２＝Ｎｃ１＋Ｎｃ２）に対する最も数が多い第１クラスタＣＬ１の候補フィールド数Ｎｃ１の割合「Ｒ１２」が所定の閾値「Ｒｔｈ１２」以上であるか否かを判定する。図１０の例では、割合Ｒ１２は、「０．８」（＝４／（４＋１））となる。そして、割合Ｒ１２が閾値Ｒｔｈ１２以上の場合、フィールド推定部４６は、推定フィールド決定条件が満たされたと判定し、整合候補フィールドに基づき推定フィールドを生成する。そして、フィールド推定部４６は、対象フィールドの推定に関する処理を終了すべきと判定する。一方、割合Ｒ１２が閾値Ｒｔｈ１２未満の場合、フィールド推定部４６は、推定フィールド決定条件が満たされないと判定し、新たに生成された撮像画像Ｉｍ及び当該撮像画像Ｉｍから生成される変換撮像画像Ｉｍａの特徴点情報ＩＦに基づき、候補フィールドの再生成を行う。なお、このように第２ステップを設けることで、整合性判定時に複数の無矛盾な間違い候補がある場合において、枚数分布にピークを持たない間違いクラスタが多く発生することによる終了判定の不要な条件難化を好適に防ぐことができる。

　以上のように、フィールド推定部４６は、候補フィールド生成部５１が生成するｎ個の候補フィールドの整合性の判定結果（ここでは候補フィールドのクラスタリングの結果）に基づき、推定フィールドを生成する要否判定及び推定フィールドに関する処理の終了判定を好適に行うことができる。

　次に、非整合候補フィールドについて、図１１（Ａ）及び図１１（Ｂ）を用いて補足説明する。

　図１１（Ａ）は、特徴抽出処理が適切に行われた撮像画像Ｉｍ上に、特徴点情報ＩＦに基づく候補フィールドを重畳した図である。図１１（Ｂ）は、特徴抽出処理にエラーが生じた撮像画像Ｉｍ上に、特徴点情報ＩＦに基づく候補フィールドを重畳した図である。図１１（Ａ）及び図１１（Ｂ）では、説明便宜上、各構造特徴点のラベルの正解（Ｘ）と、特徴抽出処理及び候補フィールドの生成処理に基づく認識結果（Ｙ）との組を「Ｘ→Ｙ」により示している。さらに図１１（Ａ）及び図１１（Ｂ）では、生成される候補フィールドを仮想的に表す補助線を破線により示している。

　図１１（Ａ）の例では、特徴抽出処理において、ラベル０～１１の構造特徴点のうち撮像画像Ｉｍの撮影範囲内である０～８の構造特徴点が正しく抽出されたことにより、正しい対象フィールドを表す候補フィールドが生成されている。その結果、図１１（Ａ）の例では、撮像画像Ｉｍの撮影対象外であったラベル９～１１の構造特徴点についても正しく認識されている。

　一方、図１１（Ｂ）の例では、特徴抽出処理において、ラベル０～１１の構造特徴点のうち撮像画像Ｉｍの撮影範囲内である０～８の構造特徴点が対象フィールドの長手方向に格子１個分ずれて抽出され、その結果、実際の対象フィールドから格子１個分ずれた候補フィールドが生成されている。

　このように、規則的な（詳しくは並進対称性を有する）構造特徴点を有する対象フィールドでは、構造特徴点が隣接する構造特徴点として抽出され、結果として全ての構造特徴点が規則的にずれて認識されてしまう場合がある。このような場合においても、フィールド推定部４６は、撮像画像Ｉｍ及びデータオーグメンテーションにより生成した変換撮像画像Ｉｍａに基づく複数の候補フィールドから推定フィールドを決定する処理を行う。また、好適には、フィールド推定部４６は、全体の候補フィールドに対する整合候補フィールドの割合が所定割合未満である場合、推定フィールドを生成しない。これにより、フィールド推定部４６は、精度が低い推定フィールドの生成を好適に抑制することができる。

　（４－４）推定フィールドの決定
　次に、整合候補フィールドから推定フィールドを決定する具体例について説明する。

　図１２は、整合候補フィールドから推定フィールドを決定する処理の概要を示す図である。図１２では、ｘｚ座標系において、整合候補フィールドの構造特徴点を丸印により示し、決定される推定フィールドを破線により仮想的に示している。ここでは、対象フィールドが有するラベル０～１１の構造特徴点に対し、４個の整合候補フィールドの構造特徴点の点群「ＰＣ０」～「ＰＣ１１」が形成されている。また、対象フィールドは、短手方向に「Ｌ１」、長手方向に「Ｌ２」の長さを有する矩形領域であるものとする。対象フィールドの長さＬ１、Ｌ２は、構造データに記録されている。

　この場合、推定フィールド決定部５３は、第１の例では、推定フィールドを短手方向にＬ１かつ長手方向にＬ２の矩形領域とみなし、かつ、当該矩形領域の対角（例えばラベル０と１１の構造特徴点）が整合候補フィールドの対角の構造特徴点の点群（例えば点群ＰＣ０とＰＣ１１）により定まるように、推定フィールドを決定する。この場合、推定フィールド決定部５３は、例えば、最小二乗法を用い、上述の矩形領域の頂点ごとに点群との誤差（２乗誤差）を算出し、その誤差の和が最小となるように推定フィールドを決定する。

　また、推定フィールド決定部５３は、対象フィールドが矩形領域でない場合においても、構造データに基づき特定される対象フィールドのモデル（例えば、構造特徴点間の距離などの位置関係）を用い、ラベルごとにモデルの構造特徴点と対応する点群との誤差を最小化するように、推定フィールドを決定する。なお、推定フィールド決定部５３は、構造データにより特定される構造特徴点間の距離などの位置関係を制約条件とし、ラベルごとの推定フィールドの構造特徴点と点群との誤差の和を評価関数として、当該評価関数を最小化するように推定フィールドの構造特徴点を最適化により決定してもよい。このとき、推定フィールド決定部５３は、任意の最適化ソルバーを用いて上述の最適化の解を求めてもよい。

　なお、推定フィールド決定部５３は、整合候補フィールドを統合して推定フィールドを生成する代わりに、所定の規則又はランダムに決定した整合候補フィールドを、推定フィールドとして選択してもよい。この場合、例えば、推定フィールド決定部５３は、整合候補フィールドの各々に対する重心のｘｙｚ座標値及び姿勢角を表すベクトルの平均ベクトルを算出し、当該平均ベクトルに最も近い上述のベクトルに対応する整合候補フィールドを、推定フィールドとして選択してもよい。

　（５）処理フロー
　図１３は、第１実施形態において制御部１７が実行する仮想オブジェクトの表示処理に関する処理概要を示すフローチャートの一例である。

　まず、制御部１７は、表示装置１の起動を検知する（ステップＳ１１）。この場合、制御部１７は、表示装置１の起動時の表示装置１の姿勢及び位置を基準としたデバイス座標系を設定する（ステップＳ１２）。その後、制御部１７は、カメラ１５が生成する撮像画像Ｉｍを取得すると共に、位置姿勢検出センサ１６が出力する検出信号に基づく位置姿勢変化量Ａｐを取得する（ステップＳ１３）。制御部１７は、ステップＳ１３で取得した撮像画像Ｉｍ及び位置姿勢変化量Ａｐの組合せを、センサデータ記憶部２０に記憶する。

　そして、制御部１７は、仮想オブジェクトの表示要求があるか否か判定する（ステップＳ１４）。例えば、仮想オブジェクト取得部４１は、興行者が管理する図示しないサーバ装置から仮想オブジェクトの表示を指示する配信情報を受信した場合に、仮想オブジェクトの表示要求があると判定する。そして、仮想オブジェクトの表示要求がない場合（ステップＳ１４；Ｎｏ）、引き続きステップＳ１３において撮像画像Ｉｍ及び位置姿勢変化量Ａｐの取得を行う。

　一方、仮想オブジェクトの表示要求があった場合（ステップＳ１４；Ｙｅｓ）、制御部１７は、キャリブレーション処理を実行する（ステップＳ１５）。このキャリブレーション処理の手順の詳細は図１４を参照して後述する。

　次に、制御部１７の反映部４４は、ステップＳ１５のキャリブレーション処理で得られた座標変換情報Ｉｃに基づき、表示要求において指定された仮想オブジェクト及び表示位置に対応する仮想オブジェクトを表示するための表示信号Ｓｄを生成する（ステップＳ１６）。なお、この場合、実際には、制御部１７は、種々の従来のＡＲ表示製品と同様、ユーザの視線方向及び位置姿勢変化量Ａｐ等を考慮してデバイス座標系においてユーザが視認する空間を認識し、当該空間内において仮想オブジェクトが指定された位置で表示されるように表示信号Ｓｄを生成する。そして、制御部１７の光源制御部４５は、表示信号Ｓｄに基づき、光源ユニット１０の射出制御を行う（ステップＳ１７）。

　なお、図１３に示すフローチャートの処理手順は一例であり、この処理手順に対し種々の変更を行うことができる。

　例えば、制御部１７は、ステップＳ１５のキャリブレーション処理を仮想オブジェクト表示要求がある度に実行しているが、これに限られない。これに代えて、制御部１７は、前回のキャリブレーション処理から所定時間以上経過した場合に限り、キャリブレーション処理を行ってもよい。このように、制御部１７は、キャリブレーション処理を、表示装置１の起動後少なくとも１度行えばよい。

　また、制御部１７は、表示装置１の起動時の表示装置１の位置及び姿勢を基準としてデバイス座標系を決定しているが、これに限られない。これに代えて、例えば、制御部１７は、表示装置１の起動後に最初に表示要求があったとき（即ち最初にキャリブレーション処理を実行したとき）の表示装置１の位置及び姿勢を基準として、デバイス座標系を決定してもよい。他の例では、制御部１７は、表示要求がある度に、当該表示要求時（即ちキャリブレーション処理実行時）の表示装置１の位置及び姿勢を基準としてデバイス座標系を再設定してもよい。この場合、後述する座標変換情報Ｉｃの生成処理には位置姿勢変化量Ａｐを使用する必要がない。

　図１４は、図１３のステップＳ１５のキャリブレーション処理の詳細な処理手順を示すフローチャートの一例である。

　まず、制御部１７の画像変換部４０は、センサデータ記憶部２０等から取得する撮像画像Ｉｍに基づき、データオーグメンテーションを実行することで変換撮像画像Ｉｍａを生成する（ステップＳ２１）。これにより、画像変換部４０は、対象フィールドの推定に用いる撮像画像Ｉｍに対して少なくとも１個の変換撮像画像Ｉｍａを生成する。

　次に、特徴抽出部４２は、ステップＳ２１で用いた撮像画像Ｉｍ及びステップＳ２１で生成された変換撮像画像Ｉｍａの各々に対し、対象フィールドの各構造特徴点に対応する特徴点候補位置及び候補ラベルの組を示す特徴点情報ＩＦを生成する（ステップＳ２２）。この場合、特徴抽出部４２は、パラメータ記憶部２１から取得するパラメータに基づき特徴抽出器を構成し、当該特徴抽出器に各画像を入力する。そして、特徴抽出部４２は、特徴抽出器が出力する情報に基づき、各画像に対する特徴点情報ＩＦを生成する。

　次に、候補フィールド生成部５１は、各画像の特徴点情報ＩＦから夫々候補フィールドを生成する（ステップＳ２３）。そして、整合性判定部５２は、生成した複数の候補フィールドに対してクラスタリング等を行うことにより、非整合候補フィールドの判定を行う（ステップＳ２４）。そして、整合性判定部５２は、推定フィールド決定条件を満たすか否か判定する（ステップＳ２５）。そして、整合性判定部５２は、推定フィールド決定条件を満たすと判定した場合（ステップＳ２５；Ｙｅｓ）、整合候補フィールドに基づき、推定フィールドを決定する（ステップＳ２６）。この場合、整合性判定部５２は、整合候補フィールドの統合処理又は選択処理に基づき、推定フィールドを決定する。

　そして、座標変換情報生成部４３は、フィールド推定部４６が決定した推定フィールドに基づき、デバイス座標系からフィールド座標系へ変換するための座標変換情報Ｉｃを生成する（ステップＳ２７）。この場合、座標変換情報生成部４３は、構造特徴点のラベル毎に、ステップＳ２５で取得した第２フィールド推定情報が示す各構造特徴点のデバイス座標系での検出位置と、構造データに含まれる登録位置情報が示すフィールド座標系の構造特徴点の位置と、を夫々対応付けて照合を行い、ラベル毎に照合した位置同士が一致するような（即ちラベル毎の位置の誤差が最小となる）座標変換情報Ｉｃを算出する。

　このように、表示装置１は、キャリブレーション処理において撮像画像Ｉｍから予め登録されている（即ち既にラベルが登録された）構造特徴点のみを抽出した情報を、構造データに登録された構造特徴点の情報と照合させる。これにより、座標変換情報Ｉｃを算出するための照合処理に要する計算量を大幅に削減し、かつ、撮像画像Ｉｍに含まれるノイズ（即ち対象フィールド以外の特徴点）の抽出に起因した影響等を受けないロバストな座標変換情報Ｉｃの算出が可能となる。また、本実施形態では、上述の照合は、高精度に推定された推定フィールドに基づき実行されるため、正確な座標変換情報Ｉｃの算出が可能となる。

　（６）変形例
　フィールド推定部４６は、１枚の撮像画像Ｉｍ及び当該撮像画像Ｉｍから生成される変換撮像画像Ｉｍａに基づき推定フィールドを決定する代わりに、ｍ枚（「ｍ」は２以上の整数）の撮像画像Ｉｍ及び当該撮像画像Ｉｍから生成される変換撮像画像Ｉｍａに基づき推定フィールドを決定してもよい。

　図１５は、変形例におけるフィールド推定部４６のブロック構成図である。図１５では、記憶部１４は、候補フィールド生成部５１が生成した候補フィールド記憶部２３をさらに有し、候補フィールド生成部５１は、ｍ枚分の撮像画像Ｉｍ及びこれらに対応する変換撮像画像Ｉｍａの各々に対して生成したフィールド候補を、候補フィールド記憶部２３に記憶する。そして、ｍ枚分の撮像画像Ｉｍ及びこれらに対応する変換撮像画像Ｉｍａの各々に対するフィールド候補の生成後、整合性判定部５２は、候補フィールド記憶部２３が記憶する候補フィールドに基づき、非整合候補フィールドを判定する処理及び推定フィールド決定条件の成否判定などを行う。

　なお、本変形例では、制御部１７は、画像変換部４０を有しなくともよい。この場合であっても、整合性判定部５２は、ｍ枚の撮像画像Ｉｍに基づき生成されたｍ個の候補フィールドに基づき、推定フィールドを好適に決定することができる。

　以上のように、本変形例では、フィールド推定部４６は、複数枚の撮像画像Ｉｍを使用することで、推定フィールドの決定に用いる複数の候補フィールドを好適に生成することができる。

　＜第２実施形態＞
　図１６は、第２実施形態における表示システムの構成を示す。図１６に示すように、第２実施形態に係る表示システムは、表示装置１Ａと、サーバ装置２とを有する。第２実施形態では、キャリブレーション処理等を、表示装置１Ａの代わりにサーバ装置２が実行する点において、第１実施形態と異なる。以後では、第１実施形態と同様の構成要素については適宜同一符号を付し、その説明を省略する。

　表示装置１Ａは、サーバ装置２がキャリブレーション処理等を行うために必要な情報であるアップロード信号「Ｓ１」をサーバ装置２に送信する。この場合、アップロード信号Ｓ１には、例えば、カメラ１５が生成する撮像画像Ｉｍ及び位置姿勢検出センサ１６の出力に基づき検出される位置姿勢変化量Ａｐが含まれている。そして、表示装置１Ａは、サーバ装置２から送信される配信信号「Ｓ２」を受信した場合、配信信号Ｓ２に基づき、光源ユニット１０の光の射出制御を行うことで、仮想オブジェクトを表示する。例えば、配信信号Ｓ２は、第１実施形態の表示信号Ｓｄに相当する情報を含んでおり、表示装置１Ａは、配信信号Ｓ２の受信後、第１実施形態の光源制御部４５と同様の処理を行うことで、光源ユニット１０に仮想オブジェクトを表示するための光を射出させる。

　サーバ装置２は、例えば、興行者が管理するサーバ装置であり、表示装置１Ａから受信するアップロード信号Ｓ１に基づき、配信信号Ｓ２の生成及び表示装置１Ａへの配信信号Ｓ２の配信を行う。図１７は、サーバ装置２のブロック図である。サーバ装置２は、入力部２６と、制御部２７と、通信部２８と、記憶部２９とを有する。

　記憶部２９は、制御部２７がサーバ装置２の制御に必要な種々の情報を記憶する不揮発性メモリである。記憶部２９には、制御部２７が実行するプログラムが記憶される。記憶部２９は、センサデータ記憶部２０と、パラメータ記憶部２１と、構造データ記憶部２２とを有する。センサデータ記憶部２０には、制御部２７の制御に基づき、アップロード信号Ｓ１に含まれる撮像画像Ｉｍ及び位置姿勢変化量Ａｐが記憶される。なお、記憶部２９は、サーバ装置２に接続又は内蔵されたハードディスクなどの外部記憶装置であってもよく、フラッシュメモリなどの記憶媒体であってもよい。また、記憶部２９は、サーバ装置２とデータ通信を行うサーバ装置（即ち、他の装置から参照可能に情報を記憶する装置）であってもよい。また、この場合、記憶部２９は、複数のサーバ装置から構成され、センサデータ記憶部２０と、パラメータ記憶部２１と、構造データ記憶部２２とを分散して記憶してもよい。

　制御部２７は、例えばＣＰＵ、ＧＰＵなどのプロセッサ、作業メモリとして機能する揮発性メモリなどを有しており、サーバ装置２の全体的な制御を行う。制御部２７は、入力部２６へのユーザ入力等に基づき、仮想オブジェクトとして表示させる仮想オブジェクト及び表示位置の情報（即ち第１実施形態の指定表示情報Ｉｄに相当する情報）を生成する。さらに、制御部２７は、センサデータ記憶部２０、パラメータ記憶部２１、構造データ記憶部２２を参照することで、キャリブレーション処理を実行し、配信信号Ｓ２を生成する。このように、制御部２７は、図３に示す画像変換部４０、仮想オブジェクト取得部４１、特徴抽出部４２、座標変換情報生成部４３、反映部４４に相当する機能を含む。

　図１８は、第２実施形態においてサーバ装置２の制御部２７が実行する処理手順を示すフローチャートの一例である。

　まず、制御部２７は、通信部２８を介し、撮像画像Ｉｍ及び位置姿勢変化量Ａｐなどを含むアップロード信号Ｓ１を表示装置１Ａから受信する（ステップＳ３１）。この場合、制御部２７は、アップロード信号Ｓ１に基づきセンサデータ記憶部２０に記憶させるデータを更新する。そして、制御部２７は、仮想オブジェクトの表示タイミングか否か判定する（ステップＳ３２）。そして、制御部２７は、表示タイミングではない場合（ステップＳ３２；Ｎｏ）、引き続きステップＳ３１においてアップロード信号Ｓ１を表示装置１Ａから受信する。

　一方、制御部２７は、表示タイミングである場合（ステップＳ３２；Ｙｅｓ）、ステップＳ３１で受信した最新のアップロード信号Ｓ１等に基づき、キャリブレーション処理を実行する。この場合、制御部２７は、図１４に示されるフローチャートを実行する。そして、制御部２７は、キャリブレーション処理で得られた座標変換情報Ｉｃに基づき、仮想オブジェクトを表示装置１Ａが表示するための配信信号Ｓ２を生成する（ステップＳ３４）。そして、制御部２７は、生成した配信信号Ｓ２を、通信部２８により表示装置１Ａに送信する（ステップＳ３５）。その後、配信信号Ｓ２を受信した表示装置１Ａは、配信信号Ｓ２に基づき光源ユニット１０を制御することで、仮想オブジェクトを表示する。

　以上のように、第２実施形態によっても、表示システムは、表示装置１Ａによる仮想オブジェクトの表示に必要な座標変換情報Ｉｃを的確に算出し、仮想オブジェクトを好適にユーザに視認させることができる。

　なお、第２実施形態において、キャリブレーション処理等をサーバ装置２が行う代わりに、表示装置１Ａが行ってもよい。この場合、表示装置１Ａは、サーバ装置２からキャリブレーション処理に必要な情報を適宜受信することで、図１４に示すフローチャートの処理を実行する。この態様であっても、表示システムは、表示装置１Ａのユーザに好適に仮想オブジェクトを視認させることができる。

　＜第３実施形態＞
　図１９は、第３実施形態における情報処理装置１Ｘの概略構成を示す。図１９に示すように、情報処理装置１Ｘは、主に、特徴点情報取得手段４２Ｘと、候補フィールド生成手段５１Ｘと、整合性判定手段５２Ｘとを有する。情報処理装置１Ｘは、例えば、第１実施形態における表示装置１又は表示装置１の制御部１７若しくは第２実施形態におけるサーバ装置２の制御部２７により実現される。なお、情報処理装置１Ｘは、複数の装置から構成されてもよい。

　特徴点情報取得手段４２Ｘは、対象となるフィールドの少なくとも一部を含む画像に基づき決定された、フィールドの複数の特徴点の候補位置及び候補ラベルを示す特徴点情報を取得する。特徴点情報取得手段４２Ｘは、特徴点情報取得手段４２Ｘ以外の処理ブロック（情報処理装置１Ｘ以外の装置を含む）が生成した特徴点情報を受信してもよく、特徴点情報取得手段４２Ｘが特徴点情報を生成してもよい。後者の場合、特徴点情報取得手段４２Ｘは、例えば、第１実施形態又は第２実施形態における特徴抽出部４２とすることができる。

　候補フィールド生成手段５１Ｘは、特徴点情報に基づき、画像を撮影するカメラを有する表示装置が基準とする座標系である第１座標系におけるフィールドの候補を表す候補フィールドを生成する。候補フィールド生成手段５１Ｘは、例えば、第１実施形態又は第２実施形態における候補フィールド生成部５１とすることができる。

　整合性判定手段５２Ｘは、複数の画像の複数の特徴点情報に対応する複数の候補フィールドに基づき、整合性を有しない候補フィールドである非整合候補フィールドを判定する。整合性判定手段５２Ｘは、例えば、第１実施形態又は第２実施形態における整合性判定部５２とすることができる。

　図２０は、第３実施形態におけるフローチャートの一例である。特徴点情報取得手段４２Ｘは、対象となるフィールドの少なくとも一部を含む画像に基づき、フィールドの複数の特徴点の候補位置及び候補ラベルを示す特徴点情報を取得する（ステップＳ４１）。候補フィールド生成手段５１Ｘは、特徴点情報に基づき、画像を撮影するカメラを有する表示装置が基準とする座標系である第１座標系におけるフィールドの候補を表す候補フィールドを生成する（ステップＳ４２）。整合性判定手段５２Ｘは、複数の画像の複数の特徴点情報に対応する複数の候補フィールドに基づき、整合性を有しない候補フィールドである非整合候補フィールドを判定する（ステップＳ４３）。

　第３実施形態によれば、情報処理装置１Ｘは、複数の候補フィールドに基づいて整合性を有しない非整合候補フィールドを的確に判定し、フィールドの推定精度の低下等を好適に抑制することができる。

　なお、上述した各実施形態において、プログラムは、様々なタイプの非一時的なコンピュータ可読媒体（non-transitory computer readable medium）を用いて格納され、コンピュータであるプロセッサ等に供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記憶媒体（tangible storage medium）を含む。非一時的なコンピュータ可読媒体の例は、磁気記憶媒体（例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ）、光磁気記憶媒体（例えば光磁気ディスク）、ＣＤ－ＲＯＭ（Read Only Memory）、ＣＤ－Ｒ、ＣＤ－Ｒ／Ｗ、半導体メモリ（例えば、マスクＲＯＭ、ＰＲＯＭ（Programmable ROM）、ＥＰＲＯＭ（Erasable PROM）、フラッシュＲＯＭ、ＲＡＭ（Random Access Memory））を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体（transitory computer readable medium）によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。

　その他、上記の実施形態（変形例を含む、以下同じ）の一部又は全部は、以下の付記のようにも記載され得るが以下には限られない。

［付記１］
　対象となるフィールドの少なくとも一部を含む画像に基づき決定された、前記フィールドの複数の特徴点に関する特徴点情報を取得する特徴点情報取得手段と、
　前記特徴点情報に基づき、前記画像を撮影するカメラを有する表示装置が基準とする座標系である第１座標系における前記フィールドの候補を表す候補フィールドを生成する候補フィールド生成手段と、
　複数の前記画像の複数の前記特徴点情報に対応する複数の前記候補フィールドに基づき、整合性を有しない前記候補フィールドである非整合候補フィールドを判定する整合性判定手段と、
を有する情報処理装置。
［付記２］
　前記非整合候補フィールド以外の前記複数の候補フィールドである整合候補フィールドに基づき、前記第１座標系において推定された前記フィールドを表す推定フィールドを決定する推定フィールド決定手段をさらに有する、付記１に記載の情報処理装置。
［付記３］
　前記推定フィールド決定手段は、前記整合候補フィールドを統合した前記推定フィールドを生成する、又は、１つの前記整合候補フィールドを前記推定フィールドとして選択する、付記２に記載の情報処理装置。
［付記４］
　前記推定フィールド決定手段は、前記整合性判定手段による判定結果に基づき、前記推定フィールドを決定する要否判定を行う、付記２または３に記載の情報処理装置。
［付記５］
　前記推定フィールド決定手段は、前記複数の候補フィールドに対する前記非整合候補フィールド又は前記整合候補フィールドの割合に基づき、前記要否判定を行う、付記４に記載の情報処理装置。
［付記６］
　前記推定フィールド決定手段は、前記整合性判定手段による判定結果に基づき、前記推定フィールドに関する処理の終了判定を行う、付記２～５のいずれか一項に記載の情報処理装置。
［付記７］
　前記フィールドの少なくとも一部を含む第１画像を変換した１又は複数の第２画像を生成する画像変換手段をさらに有し、
　前記複数の画像は、前記第１画像と前記第２画像とを含み、
　前記整合性判定手段は、前記第１画像及び前記第２画像の前記複数の特徴点情報に対応する前記複数の候補フィールドに基づき、前記非整合候補フィールドを判定する、付記１～６のいずれか一項に記載の情報処理装置。
［付記８］
　前記第２画像は、前記第１画像を反転した画像又はクロップした画像の少なくとも一方を含む、付記７に記載の情報処理装置。
［付記９］
　前記非整合候補フィールド以外の前記複数の候補フィールドである整合候補フィールドと、前記フィールドの構造に関する構造データとに基づき、前記第１座標系と、前記構造データにおいて採用される座標系である第２座標系との間の座標変換に関する座標変換情報を生成する座標変換情報生成手段をさらに有する、付記１～８のいずれか一項に記載の情報処理装置。
［付記１０］
　前記情報処理装置は、風景に重ねて仮想オブジェクトを表示する前記表示装置であって、
　前記仮想オブジェクトを表示するための表示光を射出する光源ユニットと、
　前記表示光の少なくとも一部を反射することで、前記仮想オブジェクトを風景に重ねて観察者に視認させる光学素子と、
をさらに有する、付記１～９のいずれか一項に記載の情報処理装置。
［付記１１］
　コンピュータが、
　対象となるフィールドの少なくとも一部を含む画像に基づき決定された、前記フィールドの複数の特徴点に関する特徴点情報を取得し、
　前記特徴点情報に基づき、前記画像を撮影するカメラを有する表示装置が基準とする座標系である第１座標系における前記フィールドの候補を表す候補フィールドを生成し、
　複数の前記画像の複数の前記特徴点情報に対応する複数の前記候補フィールドに基づき、整合性を有しない前記候補フィールドである非整合候補フィールドを判定する、
制御方法。
［付記１２］
　対象となるフィールドの少なくとも一部を含む画像に基づき決定された、前記フィールドの複数の特徴点に関する特徴点情報を取得し、
　前記特徴点情報に基づき、前記画像を撮影するカメラを有する表示装置が基準とする座標系である第１座標系における前記フィールドの候補を表す候補フィールドを生成し、
　複数の前記画像の複数の前記特徴点情報に対応する複数の前記候補フィールドに基づき、整合性を有しない前記候補フィールドである非整合候補フィールドを判定する処理をコンピュータに実行させるプログラムを格納する記憶媒体。

　以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。すなわち、本願発明は、請求の範囲を含む全開示、技術的思想にしたがって当業者であればなし得るであろう各種変形、修正を含むことは勿論である。また、引用した上記の特許文献等の各開示は、本書に引用をもって繰り込むものとする。

　１、１Ａ　表示装置
　１Ｘ、１Ｙ　情報処理装置
　２　サーバ装置
　１０　光源ユニット
　１１　光学素子
　１２　通信部
　１３　入力部
　１４　記憶部
　１５　カメラ
　１６　位置姿勢検出センサ
　２０　センサデータ記憶部
　２１　パラメータ記憶部
　２２　構造データ記憶部
　２３　候補フィールド記憶部

Claims

　対象となるフィールドの少なくとも一部を含む画像に基づき決定された、前記フィールドの複数の特徴点に関する特徴点情報を取得する特徴点情報取得手段と、
　前記特徴点情報に基づき、前記画像を撮影するカメラを有する表示装置が基準とする座標系である第１座標系における前記フィールドの候補を表す候補フィールドを生成する候補フィールド生成手段と、
　複数の前記画像の複数の前記特徴点情報に対応する複数の前記候補フィールドに基づき、整合性を有しない前記候補フィールドである非整合候補フィールドを判定する整合性判定手段と、
を有する情報処理装置。
　前記非整合候補フィールド以外の前記複数の候補フィールドである整合候補フィールドに基づき、前記第１座標系において推定された前記フィールドを表す推定フィールドを決定する推定フィールド決定手段をさらに有する、請求項１に記載の情報処理装置。
　前記推定フィールド決定手段は、前記整合候補フィールドを統合した前記推定フィールドを生成する、又は、１つの前記整合候補フィールドを前記推定フィールドとして選択する、請求項２に記載の情報処理装置。
　前記推定フィールド決定手段は、前記整合性判定手段による判定結果に基づき、前記推定フィールドを決定する要否判定を行う、請求項２または３に記載の情報処理装置。
　前記推定フィールド決定手段は、前記複数の候補フィールドに対する前記非整合候補フィールド又は前記整合候補フィールドの割合に基づき、前記要否判定を行う、請求項４に記載の情報処理装置。
　前記推定フィールド決定手段は、前記整合性判定手段による判定結果に基づき、前記推定フィールドに関する処理の終了判定を行う、請求項２～５のいずれか一項に記載の情報処理装置。
　前記フィールドの少なくとも一部を含む第１画像を変換した１又は複数の第２画像を生成する画像変換手段をさらに有し、
　前記複数の画像は、前記第１画像と前記第２画像とを含み、
　前記整合性判定手段は、前記第１画像及び前記第２画像の前記複数の特徴点情報に対応する前記複数の候補フィールドに基づき、前記非整合候補フィールドを判定する、請求項１～６のいずれか一項に記載の情報処理装置。
　前記第２画像は、前記第１画像を反転した画像又はクロップした画像の少なくとも一方を含む、請求項７に記載の情報処理装置。
　前記非整合候補フィールド以外の前記複数の候補フィールドである整合候補フィールドと、前記フィールドの構造に関する構造データとに基づき、前記第１座標系と、前記構造データにおいて採用される座標系である第２座標系との間の座標変換に関する座標変換情報を生成する座標変換情報生成手段をさらに有する、請求項１～８のいずれか一項に記載の情報処理装置。
　前記情報処理装置は、風景に重ねて仮想オブジェクトを表示する前記表示装置であって、
　前記仮想オブジェクトを表示するための表示光を射出する光源ユニットと、
　前記表示光の少なくとも一部を反射することで、前記仮想オブジェクトを風景に重ねて観察者に視認させる光学素子と、
をさらに有する、請求項１～９のいずれか一項に記載の情報処理装置。
　コンピュータが、
　対象となるフィールドの少なくとも一部を含む画像に基づき決定された、前記フィールドの複数の特徴点に関する特徴点情報を取得し、
　前記特徴点情報に基づき、前記画像を撮影するカメラを有する表示装置が基準とする座標系である第１座標系における前記フィールドの候補を表す候補フィールドを生成し、
　複数の前記画像の複数の前記特徴点情報に対応する複数の前記候補フィールドに基づき、整合性を有しない前記候補フィールドである非整合候補フィールドを判定する、
制御方法。
　対象となるフィールドの少なくとも一部を含む画像に基づき決定された、前記フィールドの複数の特徴点に関する特徴点情報を取得し、
　前記特徴点情報に基づき、前記画像を撮影するカメラを有する表示装置が基準とする座標系である第１座標系における前記フィールドの候補を表す候補フィールドを生成し、
　複数の前記画像の複数の前記特徴点情報に対応する複数の前記候補フィールドに基づき、整合性を有しない前記候補フィールドである非整合候補フィールドを判定する処理をコンピュータに実行させるプログラムを格納する記憶媒体。