WO2021106388A1

WO2021106388A1 - 情報処理装置、情報処理方法および情報処理プログラム

Info

Publication number: WO2021106388A1
Application number: PCT/JP2020/038327
Authority: WO
Inventors: 辰起柏谷
Original assignee: ソニー株式会社
Priority date: 2019-11-29
Filing date: 2020-10-09
Publication date: 2021-06-03
Also published as: JPWO2021106388A1; US20220413512A1

Abstract

地図データに予め配置されたキーフレームとクエリ画像との対応情報を取得し、対応情報に基づいて複数の地図データを合成する情報処理装置である。

Description

情報処理装置、情報処理方法および情報処理プログラム

　本技術は、情報処理装置、情報処理方法および情報処理プログラムに関する。

　近年、車両、ドローン、ロボットなどの移動体を移動させて周辺の情報や地図情報を取得する技術が提案されている。また、個々の移動体により取得した情報を合成する技術も提案されている（特許文献１）

特開２０１７－９０２３９号公報

　複数の移動体を用いる場合、移動体はそれぞれが独立して周辺情報や地図情報を取得するため、各移動体の位置、姿勢は情報ごとに別の原点に基づいて推定されるため、一の移動体から他の移動体までの距離や方向を把握するのが難しいため、正確に複数の情報を合成するのが難しいという問題がある。

　本技術はこのような点に鑑みなされたものであり、複数の地図データを合成することができる情報処理装置、情報処理方法および情報処理プログラムを提供することを目的とする。

　上述した課題を解決するために、第１の技術は、地図データに予め配置されたキーフレームとクエリ画像との対応情報を取得し、対応情報に基づいて複数の前記地図データを合成する情報処理装置である。

　また、第２の技術は、地図データに予め配置されたキーフレームとクエリ画像との対応情報を取得し、対応情報に基づいて複数の前記地図データを合成する情報処理方法である。

　さらに、第３の技術は、地図データに予め配置されたキーフレームとクエリ画像との対応情報を取得し、対応情報に基づいて複数の地図データを合成する情報処理方法をコンピュータに実行させる情報処理プログラムである。

情報処理システム１０の構成を示すブロック図である。移動体１００の構成を示すブロック図である。情報処理装置２００の構成を示すブロック図である。移動体１００における処理を示すフローチャートである。ハッシュ値生成の説明図である。ハッシュ値生成の説明図である。情報処理装置２００における処理を示すフローチャートである。第１地図データと第２地図データの例を示す図である。地図データの合成処理の説明図である。地図データの合成処理の説明図である。地図データの合成処理の説明図である。第１地図データと第２地図データの合成により作成された合成地図データを示す図である。変形例の説明図である。

　以下、本技術の実施の形態について図面を参照しながら説明する。なお、説明は以下の順序で行う。

＜１．実施の形態＞
［１－１．情報処理システム１０の構成］
［１－２．移動体１００の構成］
［１－３．情報処理装置２００の構成］
［１－４．移動体１００における処理］
［１－５．情報処理装置２００における処理］
＜２．変形例＞

＜１．実施の形態＞
［１－１．情報処理システム１０の構成］
　まず図１を参照して、本技術の実施の形態における情報処理システム１０の構成について説明する。情報処理システム１０は複数の移動体１００と、複数の情報処理装置２００とから構成されている。本実施の形態では移動体１００として第１移動体１００Ａと第２移動体１００Ｂがあり、情報処理装置２００として第１情報処理装置２００Ａと第２情報処理装置２００Ｂがあるとする。

　第１情報処理装置２００Ａは第１サーバ装置３００Ａにおいて動作し、第２情報処理装置２００Ｂは第２サーバ装置３００Ｂにおいて動作するものとする。移動体１００と、情報処理装置２００を備えるサーバ装置３００はインターネットなどのネットワークを介して接続されている。

　移動体１００は、自立して移動する装置であればどのようなものでもよく、例えば、ドローン、ロボット掃除機、ペット型ロボット、人型ロボット、自動運転車、自律配送ロボットなどがある。また、移動体１００はＳＬＡＭ（Simultaneous Localization and Mapping）機能により移動体１００の周囲の地図データの作成および自己位置推定を行うことができるものである。なお情報処理システム１０を構成する移動体１００の数に制限はない。

　情報処理装置２００は移動体１００が作成した地図データを保持し、地図データの合成処理を行うものである。本実施の形態において情報処理装置２００は複数の移動体１００がそれぞれ個別にＳＬＡＭにより作成した複数の地図データを格納しているものとする。

　第１移動体１００Ａは第１情報処理装置２００Ａと関連付けられ、第１情報処理装置２００Ａは第１移動体１００Ａが作成した第１地図データを格納する。また、第２移動体１００Ｂは第２情報処理装置２００Ｂと関連付けられ、第２情報処理装置２００Ｂは第２移動体１００Ｂが作成した第２地図データを格納する。

　サーバ装置３００は、少なくとも制御部３０１、通信部３０２、記憶部３０３を備える。情報処理装置２００はサーバ装置３００が備える通信部３０２を用いて移動体１００との通信を行う。

　制御部３０１はＣＰＵ（Central Processing Unit）、ＲＡＭ（Random Access Memory）およびＲＯＭ（Read Only Memory）などから構成されている。ＲＯＭには、ＣＰＵにより読み込まれ動作されるプログラムなどが記憶されている。ＲＡＭは、ＣＰＵのワークメモリとして用いられる。ＣＰＵは、ＲＯＭに記憶されたプログラムに従い様々な処理を実行してコマンドの発行を行うことによって、サーバ装置全体および各部を制御する。

　通信部３０２は、移動体や他のサーバ装置と通信を行なうための通信モジュールである。通信方式としては、無線ＬＡＮ（Local Area Network）やＷＡＮ（Wide Area Network）、ＷｉＦｉ（Wireless Fidelity）、４Ｇ（第４世代移動通信システム）、５Ｇ（第５世代移動通信システム）、Bluetooth（登録商標）、ZigBee（登録商標）などがある。

　記憶部３０３は、例えば、ハードディスク、フラッシュメモリなどの大容量記憶媒体である。

　第１情報処理装置２００Ａは第１サーバ装置３００Ａにおいて動作し、第２情報処理装置２００Ｂは第２サーバ装置３００Ｂにおいて動作するものとする。

［１－２．移動体１００の構成］
　次に図２を参照して移動体１００の構成について説明する。移動体１００は、制御部１０１、記憶部１０２、通信部１０３、カメラ部１０４、センサ部１０５、ＳＬＡＭ処理部１０６、駆動部１０７、電源部１０８、移動体検索部１１０を備えて構成されている。移動体検索部１１０は情報取得部１１１、ハッシュ生成部１１２、検索処理部１１３とから構成されている。

　制御部１０１はＣＰＵ、ＲＡＭおよびＲＯＭなどから構成されている。ＣＰＵは、ＲＯＭに記憶されたプログラムに従い様々な処理を実行してコマンドの発行を行うことによって、移動体１００全体および各部を制御する。また、制御部１０１は駆動部１０７の出力を制御する制御信号を駆動部１０７に供給することにより移動体１００の移動速度、移動方向などを制御する。

　記憶部１０２は、例えば、ハードディスク、フラッシュメモリなどの大容量記憶媒体である。記憶部１０２にはＳＬＡＭ処理部１０６が作成した地図データやカメラ部１０４で撮影した画像、その他、移動体１００の使用に必要なデータやアプリケーションなどが保存される。

　通信部１０３は、サーバ装置３００と通信を行なうための通信モジュールである。通信方式としては、無線ＬＡＮやＷＡＮ、ＷｉＦｉ、４Ｇ、５Ｇ、Bluetooth（登録商標）、ZigBee（登録商標）などがある。

　カメラ部１０４は、撮像素子や画像処理エンジンなどからなり、ＲＧＢやモノクロの２次元の静止画像および動画を撮影することができるカメラとしての機能を備えるものである。カメラ部１０４は移動体１００自体が備えるものの他、移動体１００とは別の装置として構成され、移動体１００に接続して搭載可能なものでもよい。

　センサ部１０５は、ＧＰＳ（Global Positioning System）モジュールなどの移動体１００の位置を検出することができるセンサである。ＧＰＳは地球の周囲に位置する複数の人工衛星からの信号を受信機で受け取ることにより現在位置を知るシステムである。

　さらに、センサ部１０５はＩＭＵ（Inertial Measurement Unit）モジュールなどの角速度を検出するセンサを含んでいてもよい。ＩＭＵモジュールは慣性計測装置であり、２軸または３軸方向に対する加速度センサ、角速度センサ、ジャイロセンサなどによって、３次元の角速度と加速度を求めることにより、移動体１００の姿勢、向きなど検出する。

　ＳＬＡＭ処理部１０６は、ＳＬＡＭ機能により移動体１００の周囲の地図データの作成および自己位置推定を行うものである。ＳＬＡＭにより、カメラ部１０４で撮影した画像から検出された特徴点、ＩＭＵの検出結果、その他各種センサからのセンサ情報などを複合的に用いることにより地図データの作成、地図データにおける自己位置の推定を行うことができる。ＳＬＡＭ処理部１０６が作成した地図データは通信部１０３により情報処理装置２００に送信される。

　駆動部１０７は、制御部１０１が指令する所定の動作に従って移動体の動作を実現する機能ブロックである。駆動部１０７は、移動体１００の各動作部位であるモータやアクチュエータを動作させることで移動体１００の移動を実現する。なお、移動体１００の移動方法は移動体の種類によって異なるものであり、本実施の形態においては移動体の移動方法はどのような移動方法であってもよい。移動方法は、例えば、移動体１００がドローンの場合には回転翼の動作であり、ロボット掃除機や自動運転車や自律配送ロボットの場合は車輪の回転であり、ペット型ロボットや人型ロボットの場合は足の動作などがある。

　電源部１０８は、移動体１００の各電気回路などに対して給電を行なう。移動体１００は、バッテリを用いた自律駆動式であり、電源部１０８は例えば充電バッテリと、充電バッテリの充放電状態を管理する充放電制御部とで構成される。

　移動体検索部１１０は他の移動体の検索を行うためのものである。

　情報取得部１１１は、ハッシュ生成部１１２によるハッシュ値生成に用いる情報を取得するものである。本実施の形態においてはハッシュ値生成に時刻情報とネットワークＩＤを用いる。時刻情報は移動体１００が通常備える時計機能から取得することができる。ネットワークＩＤは移動体１００が備える通信部１０３による通信機能から取得することができる。ネットワークＩＤとしてはWi-Fiのアクセスポイントの識別名であるＳＳＩＤ（Service Set Identifier）、セルラー基地局のＩＤなどがある。また、情報取得部１１１は必要に応じてネットワークＩＤを取得したネットワークの電波強度を取得する。電波強度の取得は通信部１０３による通信機能から取得してもよいし、公知の電波強度取得専用のアプリケーションなどを用いてもよい。

　ハッシュ生成部１１２は、時刻情報とネットワークＩＤとからハッシュ値を生成するものである。ハッシュ値は検索処理部１１３による移動体検索処理に用いられる。

　検索処理部１１３は、ハッシュ生成部１１２が生成したハッシュ値を用いて移動体１００の近傍範囲に存在する他の移動体を検索するものである。本実施の形態は、移動体１００が生成した地図データと近傍範囲に存在する他の移動体が生成した地図データを情報処理装置２００により合成する。なお、近傍範囲とは具体的な範囲として限定されるものではなく、地図データで示される範囲や、どの程度の範囲まで他の移動体を検索するかによって決定されるものである。

　移動体１００は、他の移動体を発見すると情報処理装置２００に対してカメラ部１０４で撮影した画像をクエリ画像として送信し、クエリ画像の地図データ上における撮影位置と撮影姿勢を問い合わせるとともに、自身が作成した地図データと他の移動体が作成した地図データとの合成を指示する。

　移動体検索部１１０はプログラムの実行により実現され、そのプログラムは予め移動体にインストールされていてもよいし、ダウンロード、記憶媒体などで配布されて、ユーザが自らインストールするようにしてもよい。さらに、移動体検索部１１０はプログラムによって実現されるのみでなく、その機能を有するハードウェアによる専用の装置、回路などを組み合わせて実現されてもよい。

［１－３．情報処理装置２００の構成］
　次に図３を参照して情報処理装置２００の構成について説明する。情報処理装置２００は地図格納部２０１、キーフレーム検索部２０２、特徴点マッチング部２０３、対応情報推定部２０４、地図合成部２０５を備えて構成されている。キーフレーム検索部２０２、特徴点マッチング部２０３、対応情報推定部２０４はローカライズ処理を行うものである。

　地図格納部２０１は地図データを格納して保存する記憶部である。地図データは移動体１００がＳＬＡＭにより作成したものでもよいし、既存の地図データベースや、地図サービスで提供される地図データなどでもよい。情報処理装置２００で地図合成処理を行う場合、地図格納部２０１から地図データが読み出される。

　地図データには予め任意の位置の原点Ｏとｘｙｚ軸が設定されているものとする。原点Ｏからの変位に基づいて地図データ上におけるクエリ画像とキーフレームの位置が特定され、その位置に基づいてクエリ画像とキーフレーム間の変位および回転が算出される。また、複数の地図データを合成する際にｘｙｚ軸を一致させて合成する必要がある。原点Ｏは地図データ上の任意の点であり、ｘｙｚ軸は例えば方位に基づいて東西方向をｘ方向とし、北南方向をｘ軸方向とし、高さをｚ軸方向とする。

　地図データには予めキーフレームが配置されている。キーフレームとは、地図データ内の環境を表す代表画像であり、地図データにおける位置と姿勢の情報も含まれている。キーフレームは１つの地図データに１つ配置されていてもよいし、複数配置されていてもよい。キーフレームの数に限定はない。地図データの大きさや地図データに対応する実空間におけるオブジェクトに応じてキーフレーム内の被写体やキーフレームの数を決定するとよい。キーフレームの数が多いほうが地図データに対応する実空間における特徴をより把握することができるため、地図データ合成の精度を高めることができる。キーフレームは例えば、予め移動体１００および情報処理装置２００を使用するユーザが撮影して地図データと対応させておく。移動体１００がＳＬＡＭ処理を実行しながらキーフレームを追加していってもよい。

　キーフレームには特徴点の情報が含まれている。特徴点とは、キーフレーム内におけるオブジェクトなど、時刻や天気などの環境条件が変化しても変化が小さいキーフレームの特徴を表すものである。キーフレームからの特徴点の検出は、従来からあるアルゴリズムを使用しておこなうことができる。例えば、コーナー検出法（Harrisアルゴリズム、ＦＡＳＴ（Features from Accelerated Segment Test））、ニューラルネットワークによる特徴点検出法、ディープラーニングによる特徴点検出、輝度勾配などの方法がある。地図データには予め１または複数のキーフレームが配置されており、各キーフレームには特徴点が検出されているものとする。なお、公知にアルゴリズムの他、ユーザが直接キーフレームおよび特徴点は設定してもよい。

　キーフレーム検索部２０２は、キーフレームにおける特徴量に基づいて地図データに配置されている複数のキーフレームの中からクエリ画像と特徴点マッチング処理を行うキーフレームを検索するものである。キーフレーム検索部２０２には地図格納部２０１からキーフレーム特徴量が供給される。全てのキーフレームを順にクエリ画像と比較してもよいし、キーフレーム内の特徴に基づいて比較処理を行うキーフレームを選択して選択したキーフレームのみをクエリ画像と比較するようにしてもよい。特徴点マッチング処理を行うキーフレームの情報は特徴点マッチング部２０３に供給される。以下の説明ではクエリ画像と特徴点マッチング処理を行い、クエリ画像の地図データ上における位置を特定する基準となるキーフレームを特定キーフレームと称する。

　特徴点マッチング部２０３は、キーフレーム検索部２０２により検索された特定キーフレームとクエリ画像とで特徴点マッチング処理を行うものである。特定キーフレームの特徴点とクエリ画像の特徴点を比較することにより一致する特徴点を抽出し、対応情報推定部による特定キーフレームとクエリ画像との対応情報の推定を可能にする。特徴点マッチング部２０３には地図格納部２０１から特定キーフレームの特徴点が供給される。特徴点マッチング処理は例えば、ＳＩＦＴ(Scale Invariant Feature Transform)、ＳＵＲＦ(Speed Upped Robust Feature)などの手法により行うことができる。特徴点マッチング処理の結果は対応情報推定部２０４に供給される。

　対応情報推定部２０４は、特徴点マッチング処理の結果と特定キーフレームの位置姿勢情報に基づいて、特定キーフレームとクエリ画像の対応情報およびクエリ画像の地図データ上における位置と姿勢を推定する。対応情報推定部２０４には地図格納部２０１から特定キーフレームの位置姿勢情報が供給される。

　対応情報は、特定キーフレームの地図データにおける位置からクエリ画像の地図データにおける位置までの変位（移動量）と、特定キーフレームの地図データにおける姿勢からクエリ画像の地図データにおける姿勢までの回転である。特定キーフレームにおける特徴点とクエリ画像における特徴点の一致からキーフレームとクエリ画像におけるオブジェクトの位置、変位、回転などを把握することにより対応情報を取得する。対応情報はキーフレームが示す位置および姿勢からクエリ画像が示す位置および姿勢までの変位および回転は地図データに設定されている原点Ｏとｘｙｚ軸を基準として取得することができる。

　なお、移動体１００はＳＬＡＭにより地図データにおける自己位置を推定することが可能である。よって、移動体１００はクエリ画像とともにクエリ画像の撮影位置と一致する地図データにおける自己位置の情報を情報処理装置２００に送信し、情報処理装置２００はその自己位置の情報を用いて地図データにおけるクエリ画像の位置を特定したり、地図を作成したりしてもよい。

　対応情報推定部２０４は、推定したクエリ画像の地図データ上における位置と姿勢を位置姿勢情報として出力する。このクエリ画像の位置姿勢情報はクエリ画像を送信した移動体１００に送信される。

　地図合成部２０５は、複数の地図データと、その複数の地図データそれぞれにおけるクエリ画像との対応情報に基づいて複数の地図データを合成する処理を行うものである。

　情報処理装置２００は以上のようにして構成されている。なお、情報処理装置２００はプログラムの実行により実現され、そのプログラムは予めサーバ装置などにインストールされていてもよいし、ダウンロード、記憶媒体などで配布されて、ユーザが自らインストールするようにしてもよい。さらに、情報処理装置２００はプログラムによって実現されるのみでなく、その機能を有するハードウェアによる専用の装置、回路などを組み合わせて実現されてもよい。

［１－４．移動体１００における処理］
　次に図４のフローチャートを参照して移動体１００における処理について説明する。ここでは第１移動体１００Ａが検索により第２移動体１００Ｂを発見し、第１移動体１００Ａと関連付けられた第１情報処理装置２００Ａが第１地図データと第２地図データを合成するものとして説明を行う。したがって下記の説明は第１移動体１００Ａにおける処理である。

　第１移動体１００Ａにおける処理では、まずステップＳ１０１で情報取得部１１１が現在の時刻情報およびネットワークＩＤを取得する。

　次にステップＳ１０２でハッシュ生成部１１２が時刻情報およびネットワークＩＤに基づいてハッシュ値を生成する。

　ここでハッシュ値の作成について図５および図６を参照して説明する。例として図５に示すようにネットワークＡ、ネットワークＢおよびネットワークＣのそれぞれのアクセスポイントが存在するものとする。

　第１移動体１００ＡはネットワークＡ、ネットワークＢおよびネットワークＣのネットワークＩＤを取得し、さらに各ネットワークの電波強度を取得する。ここでは説明の便宜上、ネットワークＡのネットワークＩＤを「ＡＡＡ」、ネットワークＢのネットワークＩＤを「ＢＢＢ」、ネットワークＣのネットワークＩＤを「ＣＣＣ」とする。

　次に第１移動体１００Ａは各ネットワークを電波強度の順にソートする。第１移動体１００ＡにおいてはネットワークＡのアクセスポイントが最も近いため、ネットワークＡの電波強度が最も高く、次いでネットワークＢ、ネットワークＣの順になっている。

　さらに取得済みの時刻情報に端数処理（丸め処理）を施し、時刻情報とソートしたネットワークＩＤとから所定のハッシュ関数を用いてハッシュ値を生成する。端数処理は例えば１０分単位で行い、その場合、時刻が９：０４の場合、９：０８の場合いずれも端数処理の結果は９：００となる。移動体１００ごとに算出するハッシュ値が同一であることが地図データの合成を行うことの条件であるため、わずかでも時刻情報が異なるとハッシュ値が異なる値になり、地図データの合成を行うことができなくなる。よって端数処理により地図データ合成の条件に幅を持たせることができ、各移動体１００におけるハッシュ値生成のタイミングは正確に一致している必要はない。

　移動体１００は移動状態であることが多いため、古い時刻情報およびネットワークＩＤからハッシュ値を生成すると、そのハッシュ値がリアルタイムの移動体１００の位置とずれてしまう可能性がある。よって、ハッシュ値の生成と移動体１００の検索はある程度の短い時間間隔（例えば１０分など）で行うようにするとよい。

　第１移動体１００Ａにおけるハッシュ値は時刻情報とソートされたネットワークＩＤから図６に示すように算出される。第２移動体１００Ｂも同様にしてハッシュ値を生成する。さらに説明の必要上、第３移動体１００Ｃが存在するものとし、第３移動体１００Ｃも同様にしてハッシュ値を生成する。

第１移動体１００Ａと第２移動体１００Ｂは共に、ネットワークＡ、ネットワークＢ、ネットワークＣの順にアクセスポイントが最も近いため、図５に示すようにネットワークＩＤの電波強度に基づくソート順は同一の順序になっている。しかし、第３移動体１００ＣにおいてはネットワークＣのアクセスポイントが最も近いため、ネットワークＣの電波強度が最も高く、次いでネットワークＢ、ネットワークＡの順になっている。よって、第３移動体１００ＣにおけるネットワークＩＤのソート順は第１移動体１００Ａおよび第２移動体１００ＢにおけるネットワークＩＤのソート順とは異なっている。なおソートは電波強度の順に限られず、他の順、例えば辞書順などでもよい。

　同様に第２移動体１００Ｂにおけるハッシュ値、第３移動体１００Ｃにおけるハッシュ値も時刻とソートされたネットワークＩＤから図６に示すように算出される。なお、図６に示すハッシュ値は説明の便宜上例示として仮定したものであり、実際のハッシュ値ではない。

　第１移動体１００Ａと第２移動体１００Ｂにおいては時刻情報とネットワークＩＤの電波強度のソート順が同一であるため、ハッシュ値は同一のものとなる。しかし、第３移動体１００ＣにおけるネットワークＩＤのソート順は第１移動体１００Ａおよび第２移動体１００Ｂのものとは異なるため、第３移動体１００Ｃのハッシュ値は第１移動体１００Ａおよび第２移動体１００Ｂのハッシュ値とは同一にはならない。

　フローチャートの説明に戻る。次にステップＳ１０３で、移動体検索部１１０がハッシュ値に基づいて第１移動体１００Ａの近傍範囲に存在する他の移動体の検索を行う。

　移動体検索部１１０はハッシュ生成部１１２が生成したハッシュ値を第１移動体１００Ａの周囲に存在する他の移動体にブロードキャストして自身と同一のハッシュ値を有しているかを問い合わせることで他の移動体の検索を行う。問い合わせを受けた他の移動体は受信したハッシュ値と自身が生成したハッシュ値が同一であるか否かの応答を問い合わせ行った第１移動体１００Ａに送信する。よって、他の移動体も同じ方法でハッシュ値を生成している必要がある。

　なお、管理下にある全ての移動体１００から送信されたハッシュ値を送信元の移動体１００の識別情報と共に一元管理している管理サーバが存在する場合、移動体１００の検索は他の方法でも行うことができる。第１移動体１００Ａは自身が生成したハッシュ値を管理サーバに送信して、同一のハッシュ値を管理サーバに送信した移動体が存在するか問い合わせすることにより他の移動体の検索を行うこともできる。なお、管理サーバは、問い合わせと共に送信されたハッシュ値を全て格納し、それ以降の他の移動体からの問い合わせに対するハッシュ値の有無の確認に使用する。

　次にステップＳ１０４で他の移動体の検索が成功した場合、すなわち、同一のハッシュ値を有する移動体が存在する場合、処理はステップＳ１０５に進む（ステップＳ１０４のＹｅｓ）。一方、検索が成功してない、すなわち、同一のハッシュ値を有する移動体が存在しない場合、処理はステップＳ１０１に進み、ステップＳ１０１乃至ステップＳ１０４が繰り返される（ステップＳ１０４のＮｏ）。ここでは他の移動体として第２移動体１００Ｂが発見されたものとする。

　次にステップＳ１０５で、第１移動体１００Ａは他の移動体である第２移動体１００Ｂとの通信を確立し、第２移動体１００Ｂが作成した第２地図データを格納する第２サーバ装置３００Ｂ（第２情報処理装置２００Ｂ）の識別情報を取得する。これにより、第１移動体１００Ａは第２情報処理装置２００Ｂに対してクエリ画像を送信することが可能になる。

　次にステップＳ１０６で、第１移動体１００Ａは第１情報処理装置２００Ａに対してクエリ画像を送信し、第１地図データにおけるクエリ画像の位置姿勢情報の問い合わせを行う。また、第２移動体１００Ｂに対応する第２情報処理装置２００Ｂに対してもクエリ画像を送信し、第２地図データにおけるクエリ画像の位置姿勢の問い合わせを行う。

　さらに第１移動体１００Ａは、第１情報処理装置２００Ａに第１情報処理装置２００Ａが格納する第１地図データと第２情報処理装置２００Ｂが格納する第２地図データの合成指示を送信する。この際、第１移動体１００Ａは、第２地図データを有するのが第２移動体１００Ｂと関連付けられた第２情報処理装置２００Ｂであることを示す情報を第１情報処理装置２００Ａに送信する。これにより第１情報処理装置２００Ａは第２情報処理装置２００Ｂと通信を確立して地図データの合成に必要な情報の送受信を行うことが可能になる。

　以上のようにして移動体１００における処理が行われる。本技術によれば、他の移動体の検索のためにネットワークＩＤを用いるがハッシュ値しか公開しないため、ネットワークＩＤから移動体１００の位置情報が外部に漏洩するおそれがない。また、万が一、ハッシュ値が盗聴されたとしてもハッシュ値からネットワークＩＤを求めるには膨大な量の計算が必要になるため、ネットワークＩＤが漏洩される可能性は低い。また、ハッシュ値をネットワーク上のキーバリューストアサービスに送信して他の移動体を検索することもできる。

［１－５．情報処理装置における処理］
　次に図７のフローチャートを参照して情報処理装置２００における処理について説明する。上述の移動体１００における処理は、第１移動体１００Ａの近傍範囲に第２移動体１００Ｂが存在することを確認してクエリ画像の送信と地図データ合成を指示するまでの処理である。その段階では第１移動体１００Ａが作成した第１地図データと第２移動体１００Ｂが作成した第２地図データが合成可能かは不明である。情報処理装置２００では、第１地図データと第２地図データが合成可能か否かを判断し、合成可能である場合にそれらを合成して１つの地図データとする。

　まずステップＳ２０１で、第１情報処理装置２００Ａは第１移動体１００Ａから送信されたクエリ画像を受信し、第１地図データにおけるクエリ画像の位置姿勢情報の問い合わせおよび地図データ合成指示を受け付ける。

　次にステップＳ２０２で、第１情報処理装置２００Ａは第１移動体１００Ａから送信されたクエリ画像と第１地図データにおいてローカライズ処理を行う。これにより、第１地図データにおけるクエリ画像の位置姿勢と、特定キーフレームに対するクエリ画像の対応情報が取得される。なお、第２情報処理装置２００Ｂにおいても同様に、第１移動体１００Ａから送信されたクエリ画像と第２地図データにおいてローカライズ処理が行われる。
ローカライズ処理が成功した場合、処理はステップＳ２０４に進み（ステップＳ２０３のＹｅｓ）、ローカライズ処理が成功していない場合、処理はステップＳ２０１に戻る（ステップＳ２０３のＮｏ）。

　次にステップＳ２０４で、第１情報処理装置２００Ａは推定したクエリ画像の位置姿勢情報を、クエリ画像を送信して問い合わせを行った第１移動体１００Ａに送信する。これにより第１移動体１００Ａは自身がどの地図データのどの位置でどのような姿勢でクエリ画像を撮影したかを認識することができる。

次にステップＳ２０５で、第１情報処理装置２００Ａは第２情報処理装置２００Ｂに通信要求を送信し、第２情報処理装置２００Ｂとの通信を確立する。

　次にステップＳ２０６で、第１情報処理装置２００Ａは第２地図データを有する第２情報処理装置２００Ｂとの通信が確立しているかを確認する。第２情報処理装置２００Ｂとの通信が確立するまでステップＳ２０５およびステップＳ２０６が継続される。

　次にステップＳ２０７で、第１情報処理装置２００Ａは自身および第２情報処理装置２００Ｂにおいて、同一のクエリ画像に基づいてローカライズ処理が成功したか否かを確認する。そのために第１情報処理装置２００Ａは第２情報処理装置２００Ｂからローカライズ処理が成功したか否かの通知を受信する必要がある。第１情報処理装置２００Ａは複数の地図データをクエリ画像に基づいて合成するものであるため、地図データの合成を行うためには同一のクエリ画像に基づいて第１地図データおよび第２地図データにおいてローカライズ処理が成功することが必要となる。同一のクエリ画像に基づいて第１地図データおよび第２地図データにおいてローカライズ処理が成功した場合、第１情報処理装置２００Ａは第１地図データと第２地図データは合成可能であるとして処理はステップＳ２０７に進む（ステップＳ２０７のＹｅｓ）

　次にステップＳ２０８で、第１情報処理装置２００Ａは第２情報処理装置２００Ｂから第２地図データにおけるクエリ画像の対応情報を受信する。なお、第２地図データにおけるクエリ画像の対応情報はサーバ装置間の直接通信ではなく、第１移動体１００Ａを介した通信で送受信してもよい。ただし、通信効率やセキュリティの観点からはサーバ装置間の直接通信のほうがよいと考えられる。

　そしてステップＳ２０９で、第１情報処理装置２００Ａは、ローカライズ処理が成功した第１地図データと第２地図データの合成処理を行う。

　ここで図８乃至図１２を参照して地図データの合成処理について説明する。第１地図データは図８Ａに示すものであり、第２地図データは図８Ｂに示すものであるとして説明を行う。第１地図データと第２地図データはそれぞれ別々の原点Ｏとｘｙｚ軸が対応付けられている。

　図８Ａに示すように第１地図データには予め複数のキーフレームを配置しておく必要がある。また、図８Ｂに示すように第２地図データにも予め複数のキーフレームを配置しておく必要がある。

　そして図９Ａに示すように、ローカライズ処理により第１地図データにおけるクエリ画像の位置が特定されると、第１地図データにおける特定キーフレームとクエリ画像との対応情報を取得することができる。第１地図データにおける特定キーフレームを第１特定キーフレームと称する。

　同様に、図９Ｂに示すように、ローカライズ処理により第２地図データにおけるクエリ画像の位置が特定されると、第２地図データにおける特定キーフレームとクエリ画像との対応情報を取得することができる。第２地図データにおける特定キーフレームを第２特定キーフレームと称する。

　図１０に示すように第１地図データにおいて対応情報は、第１特定キーフレームで示される地図データにおける位置からクエリ画像で示される地図データにおける位置までの変位Ｌ１と、第１特定キーフレームで示される地図データにおける姿勢からクエリ画像で示される地図データにおける姿勢まで回転（角度Ｒ１）である。角度Ｒ１は例えば第１地図データに予め設定されているｘｙｚ軸のいずれかを基準にして求められる。

　また、図１０に示すように、第２地図データにおいて対応情報は、第２特定キーフレームで示される地図データにおける位置からクエリ画像で示される地図データにおける位置までの変位Ｌ２と、第２特定キーフレームで示される地図データにおける姿勢からクエリ画像で示される地図データにおける姿勢までの回転（角度Ｒ２）である。角度Ｒ２は角度Ｒ１と同様に第２地図データに予め設定されているｘｙｚ軸のいずれかを基準にして求められる。

　なお、図１０および図１１においてはそれぞれ第１特定キーフレーム、第２特定キーフレーム、クエリ画像の略中心を基準として変位Ｌと角度Ｒを算出しているが、それは図示と説明の便宜上設定したものである。実際にはそれぞれ第１特定キーフレーム、第２特定キーフレーム、クエリ画像が示す地図データ上の位置を基準として変位Ｌと角度Ｒを算出する。

　第１地図データに配置したクエリ画像と第２地図データに配置したクエリ画像は同一のものであり、実空間における同一の位置姿勢を表している。したがって、ローカライズ処理により第１地図データとクエリ画像との対応情報と、第２地図データとクエリ画像との対応情報が取得できた場合、クエリ画像の第１地図データおよび第２地図データ上における位置に基づいて第１地図データと第２地図データの対応関係（相対関係）を取得することができる。

　第１地図データと第２地図データの対応関係（相対関係）は、図１１に示すように第１地図データの第１特定キーフレームから第２地図データの第２特定キーフレームまでの変位Ｌ３と、第１地図データの第１特定キーフレームから第２地図データの第２特定キーフレームまでの回転（角度Ｒ３）である。これにより図１２に示すように第１地図データと第２地図データを合成して１つの合成地図データを作成することができる。

　なお、クエリ画像とキーフレームの対応情報はキーフレームの位置を基準にした３次元座標により表すこともできる。また、キーフレームからクエリ画像への姿勢（向き）は行列により表すこともできる。

　本実施の形態では２次元の地図データの合成で説明を行ったが、本技術は３次元の地図データの合成にも適用することができる。

　情報処理装置２００における処理は以上のようにして行われる。本技術によれば、複数の地図データを合成することでより大きな地図データを作成することができる。また、１つのクエリ画像に基づいて複数の地図データを合成するので容易に地図データの合成を行うことができる。地図データの合成により、移動体１００は他の移動体が作成した地図データを利用できるようになり、移動体１００は他の移動体に自身が作成した地図データを利用させることも可能となる。移動体１００自身が未踏の領域についての地図データも取得することができる。さらに、複数の移動体の位置が合成後の１つの地図データ上において推定できるため、複数の移動体が相互に位置情報を交換して協調して動作することが可能となる。

＜２．変形例＞
　以上、本技術の実施の形態について具体的に説明したが、本技術は上述の実施の形態に限定されるものではなく、本技術の技術的思想に基づく各種の変形が可能である。

　実施の形態では２つの情報処理装置２００に格納された２つの地図データの合成を例にして説明を行ったが、地図データの数と合成はそれに限られるものではない。例えば図１３に示すように、第１情報処理装置２００Ａ、第２情報処理装置２００Ｂ、第３情報処理装置２００Ｃという３つの情報処理装置があり、さらに第３情報処理装置２００Ｃは２つの地図データを格納している場合を想定する。この場合、移動体１００は３つ全ての情報処理装置２００にクエリ画像を送信して地図データの合成を指示し、例えば、第３情報処理装置３００Ｃが第３地図データと第４地図データを合成し、さらに、いずれかの情報処理装置２００が第１地図データと第２地図データと、第３および第４の合成地図データを合成して合計４つの地図データからなる１つの合成地図データを作成する、ということも可能である。

　実施の形態では、第１情報処理装置２００Ａが第１地図データを格納し、第２情報処理装置２００Ｂが第２地図データを格納しているとしたが、１つの情報処理装置２００は複数の地図データを格納していてもよい。１つの情報処理装置２００が複数の地図データを格納している場合、複数の地図データに対して順々にローカライズ処理を行い、合成する地図データを選択する。

　また、実施の形態では第１移動体１００Ａが第１情報処理装置２００Ａおよび第２情報処理装置２００Ｂにクエリ画像を送信して地図データの合成を指示したが、第１移動体１００Ａに加え、第２移動体１００Ｂもクエリ画像を第１情報処理装置２００Ａおよび第２情報処理装置２００Ｂに送信してもよい。第１移動体１００Ａからのクエリ画像と第２移動体１００Ｂからのクエリ画像を用いてそれぞれローカライズ処理を行うことにより地図データ合成の精度を高めることができる。

　また、サーバ装置３００を設けずに、第１移動体１００Ａ自身が第１情報処理装置２００Ａとしての機能を有して第１地図データを格納し、第２移動体１００Ｂ自身が第２情報処理装置２００Ｂとしての機能を有して第２地図データを格納するという構成でもよい。この場合、クエリ画像を送信する側の移動体１００は自身が格納している地図データとクエリ画像とのローカライズ処理を行う必要がある。

　また、１つの移動体１００と関連付けられた１つの情報処理装置２００が格納する複数の地図データに対しても実施の形態と同様に地図データの合成を行うことができる。さらに、情報処理装置２００としての機能を備える１つの移動体１００が格納する複数の地図データに対しても実施の形態と同様に地図データの合成を行うことができる。すなわち、地図データが複数存在していれば、移動体の数および情報処理装置の数は問わない。

　情報処理装置２００はクエリ画像を地図データに取り込んで地図データを拡張していってもよい。

　情報処理装置２００は実施の形態で示したサーバ装置３００の他、移動体１００において動作してもよいし、パーソナルコンピュータ、スマートフォン、タブレット端末などの端末装置において動作してもよいし、クラウドで動作してもよい。

　移動体１００が複数存在し、それら複数の移動体１００がそれぞれ作成した複数の地図データを１つの共通の情報処理装置２００に格納するようにしてもよい。

　また、サーバ装置３００などの他の装置を介さず、情報処理装置２００自身が通信機能を有し、移動体１００との通信を行うようにしてもよい。

　クエリ画像は必ずしも地図データを作成した移動体１００が備えるカメラで撮影したものである必要はなく、例えば、ユーザが端末装置などで撮影した画像をクエリ画像として情報処理装置２００に送信してもよい。

　ユーザが少なくとも２つの地図データを指定し、かつ、クエリ画像を用意して情報処理装置２００に地図データを合成させることもできるので、地図データの合成においては移動体１００の存在は必須のものではない。

　実施の形態では２つの地図データである第１地図データと第２地図データを合成する説明を行ったが、合成する地図データは２つに限られず３つ以上でもよい。したがって、移動体、情報処理装置、サーバ装置の数も３つ以上でもよい。

　本技術は以下のような構成も取ることができる。
（１）
　地図データに予め配置されたキーフレームとクエリ画像との対応情報を取得し、
　前記対応情報に基づいて複数の前記地図データを合成する
情報処理装置。
（２）
　前記キーフレームは、前記地図データで表す実空間を撮影した画像である（１）に記載の情報処理装置。
（３）
　前記対応情報は、前記キーフレームで示される前記地図データにおける位置から前記クエリ画像で示される前記地図データにおける位置までの変位である（１）または（２）に記載の情報処理装置。
（４）
　前記対応情報は、前記キーフレームで示される前記地図データにおける姿勢から前記クエリ画像で示される前記地図データにおける姿勢への回転である（１）から（３）のいずれかに記載の情報処理装置。
（５）
　前記地図データに前記キーフレームが複数ある場合、前記キーフレームと前記クエリ画像との特徴点マッチングにより前記対応情報を取得する一つの前記キーフレームを特定する（１）から（４）のいずれかに記載の情報処理装置。
（６）
　複数の前記地図データのそれぞれにおける前記特徴情報の相対関係に基づいて複数の前記地図データを合成する（１）から（５）のいずれかに記載の情報処理装置。
（７）
　前記地図データは、移動体の移動に基づいてＳＬＡＭにより取得される（１）から（６）のいずれかに記載の情報処理装置。
（８）
　複数の前記地図データが近傍範囲内に存在する複数の前記移動体によりそれぞれ取得されたものである場合に前記複数の地図データを合成する（７）に記載の情報処理装置。
（９）
　複数の前記移動体が前記近傍範囲内に存在するか否かはハッシュ値に基づいて判定される（８）に記載の情報処理装置。
（１０）
　一の前記移動体が生成したハッシュ値と他の前記移動体が生成したハッシュ値が同一である場合、一の前記移動体と他の前記移動体は近傍範囲に存在すると判定される（９）に記載の情報処理装置。
（１１）
　前記ハッシュ値は、時刻情報とネットワークＩＤに基づいて生成される（９）に記載の情報処理装置。
（１２）
　前記クエリ画像は前記移動体から送信される（７）に記載の情報処理装置。
（１３）
　前記クエリ画像は、該クエリ画像の前記地図データにおける位置情報の問い合わせと共に前記移動体から送信される（１２）に記載の情報処理装置。
（１４）
　前記クエリ画像を送信した前記移動体に前記地図における前記クエリ画像の位置情報を送信する（１３）に記載の情報処理装置。
（１５）
　地図データに予め配置されたキーフレームとクエリ画像との対応情報を取得し、
　前記対応情報に基づいて複数の前記地図データを合成する情報処理方法。
（１６）
　地図データに予め配置されたキーフレームとクエリ画像との対応情報を取得し、
　前記対応情報に基づいて複数の前記地図データを合成する情報処理方法をコンピュータに実行させる情報処理プログラム。

１００・・・移動体
２００・・・情報処理装置。

Claims

　地図データに予め配置されたキーフレームとクエリ画像との対応情報を取得し、
　前記対応情報に基づいて複数の前記地図データを合成する
情報処理装置。
　前記キーフレームは、前記地図データで表す実空間を撮影した画像である
請求項１に記載の情報処理装置。
　前記対応情報は、前記キーフレームで示される前記地図データにおける位置から前記クエリ画像で示される前記地図データにおける位置までの変位である
請求項１に記載の情報処理装置。
　前記対応情報は、前記キーフレームで示される前記地図データにおける姿勢から前記クエリ画像で示される前記地図データにおける姿勢への回転である
請求項１に記載の情報処理装置。
　前記地図データに前記キーフレームが複数ある場合、前記キーフレームと前記クエリ画像との特徴点マッチングにより前記対応情報を取得する一つの前記キーフレームを特定する
請求項１に記載の情報処理装置。
　複数の前記地図データのそれぞれにおける前記特徴情報の相対関係に基づいて複数の前記地図データを合成する
請求項１に記載の情報処理装置。
　前記地図データは、移動体の移動に基づいてＳＬＡＭにより取得される
請求項１に記載の情報処理装置。
　複数の前記地図データが近傍範囲内に存在する複数の前記移動体によりそれぞれ取得されたものである場合に前記複数の地図データを合成する
請求項７に記載の情報処理装置。
　複数の前記移動体が前記近傍範囲内に存在するか否かはハッシュ値に基づいて判定される
請求項８に記載の情報処理装置。
　一の前記移動体が生成したハッシュ値と他の前記移動体が生成したハッシュ値が同一である場合、一の前記移動体と他の前記移動体は近傍範囲に存在すると判定される
請求項９に記載の情報処理装置。
　前記ハッシュ値は、時刻情報とネットワークＩＤに基づいて生成される
請求項９に記載の情報処理装置。
　前記クエリ画像は前記移動体から送信される
請求項７に記載の情報処理装置。
　前記クエリ画像は、該クエリ画像の前記地図データにおける位置情報の問い合わせと共に前記移動体から送信される
請求項１２に記載の情報処理装置。
　前記クエリ画像を送信した前記移動体に前記地図における前記クエリ画像の位置情報を送信する
請求項１３に記載の情報処理装置。
　地図データに予め配置されたキーフレームとクエリ画像との対応情報を取得し、
　前記対応情報に基づいて複数の前記地図データを合成する
情報処理方法。
　地図データに予め配置されたキーフレームとクエリ画像との対応情報を取得し、
　前記対応情報に基づいて複数の前記地図データを合成する
情報処理方法をコンピュータに実行させる情報処理プログラム。