WO2019208234A1

WO2019208234A1 - 自己位置推定装置、自己位置推定方法、およびそのプログラム

Info

Publication number: WO2019208234A1
Application number: PCT/JP2019/015755
Authority: WO
Inventors: 遵五味田
Original assignee: ソニー株式会社
Priority date: 2018-04-26
Filing date: 2019-04-11
Publication date: 2019-10-31
Also published as: US11386574B2; US20210142510A1; DE112019002126T5

Abstract

自己位置推定装置は、位置推定部を具備する。前記位置推定部は、２つの撮像部により一定周期で同じ時刻に撮影された画像フレームに基づき自己位置を推定し、かつ、前記一定周期内に前記２つの撮像部のうち少なくとも一方により異なる時刻に撮影された画像フレームに基づき自己位置を推定するように構成される。

Description

自己位置推定装置、自己位置推定方法、およびそのプログラム

　本技術は、自己位置推定装置、自己位置推定方法、およびそのプログラムに関する。

　従来より、主に移動体の自律的な空間移動を実現するためのＳＬＡＭ（Simultaneous Localization and Mapping）と呼ばれる技術がある。ＳＬＡＭは、自己位置の推定と、環境地図の作成とを同時に行う技術である。例えばＡＲ（Augmented Reality）やＶＲ（Virtual Reality）を実現するヘッドマウントディスプレイに、そのＳＬＡＭを適用する技術も開発されている（例えば特許文献１を参照。）

特開2016-045874号公報

　ＳＬＡＭにおいて、特に２つのカメラで得られる画像を用いるものをステレオＳＬＡＭと呼ぶ。ステレオＳＬＡＭでは、単一のカメラを用いる場合に比べて、カメラの個数が倍になる分、消費電力やデータ処理量などが増えるという問題がある。

　本開示の目的は、ステレオＳＬＡＭにおいて消費電力やデータ処理量を低減することができる自己位置推定装置、自己位置推定方法、およびそのプログラムを提供することにある。

　上記目的を達成するため、一形態に係る自己位置推定装置は、位置推定部を具備する。
　前記位置推定部は、２つの撮像部により一定周期で同じ時刻に撮影された画像フレームに基づき自己位置を推定し、かつ、前記一定周期内に前記２つの撮像部のうち少なくとも一方により異なる時刻に撮影された画像フレームに基づき自己位置を推定するように構成される。

　位置推定部は、一定周期の間に２つの画像フレームがそれぞれ異なる時刻に撮影される場合には、それらの画像フレームを利用して、自己位置を推定する。すなわち、少なくとも１つの撮像部によっても、位置推定を行うことができるため、消費電力やデータ処理量を低減することができる。

　前記自己位置推定装置は、前記２つの撮像部が異なる撮像フレームレートで撮像を行うように、前記２つの撮像部による撮像タイミングを制御する撮像制御部をさらに具備してもよい。

　例えば、２つの撮像部の両方が、前記同時刻以外の期間内の異なる時刻に少なくとも１回の撮像を行うことにより、位置推定部による自己位置の推定レートを、個々の撮像部の撮像フレームレートより高くすることができる。逆に言うと、従来と同じ推定レートを実現するために必要な、２つの撮像部のそれぞれの撮像フレームレートを下げることができる。これにより消費電力やデータ処理量を低減することができる。

　前記２つの撮像部による撮像フレームレートをそれぞれN、M[fps]とし、それら２つの値の最大公約数をgcd(N,M)とする場合、前記撮像制御部は、前記位置推定部による推定レートOが、O=N+M-gcd(N,M)となるように制御を実行してもよい。

　前記撮像フレームレートNおよびMは互いに素の関係にあってもよい。

　あるいは、前記撮像フレームレートNおよびMの差が1であってもよい。これにより、最大限の推定レートを実現できる。

　前記撮像制御部は、前記２つの撮像部のうち少なくとも一方の撮像フレームレートを可変に制御してもよい。

　前記撮像制御部は、自己位置の推定レートが一定となるように制御を実行してもよい。

　これにより、たとえ従来と同じ推定レートであっても、２つの撮像部のそれぞれの撮像フレームレートを下げることができ、消費電力やデータ処理量を低減することができる。

　前記２つの撮像部による同一の撮像フレームレートをそれぞれN、M[fps]とし、前記一定周期をK[s]とする場合、前記撮像制御部は、前記位置推定部による推定レートOが、O=2N-1/Kとなるように制御を実行してもよい。

　前記自己位置推定部は、検出部と、距離推定部とをさらに具備してもよい。前記検出部は、前記２つの撮像部によりそれぞれ撮影された画像フレーム内の特徴点を検出するように構成される。前記距離推定部は、前記推定された自己位置と、前記２つの撮像部により異なる時刻に撮影された画像フレームとに基づき、前記特徴点までの距離を推定するように構成される。
　前記撮像制御部は、前記同じ時刻以外の期間が、前記２つの撮像部のうち一方のみが撮像を行う期間を含むように制御を実行してもよい。
　前記位置推定部は、前記一定周期内に前記２つの撮像部の一方のみにより異なる時刻に撮影された画像フレームに基づき、自己位置を推定するように構成されればよい。
　前記距離推定部は、前記推定された自己位置と、前記２つの撮像部の一方のみにより異なる時刻に撮影された画像フレームとに基づいて、前記特徴点までの距離を推定するように構成されればよい。

　前記検出部は、前記異なる時刻に撮影された画像フレームのうちの一方である第１画像フレームから、前記特徴点の２次元座標を算出するように構成されていてもよい。
　前記自己位置推定装置は、前記第１画像フレームと、前記異なる時刻に撮影された画像フレームのうち前記第１画像フレームより前に撮影された第２画像フレームとに基づき、前記第２画像フレーム上における、前記第１画像フレーム上の前記特徴点に対応する対応点を求めるように構成された動きマッチング部をさらに具備してもよい。

　一形態に係る自己位置推定方法は、２つの撮像部により一定周期で同じ時刻に撮影された画像フレームに基づき自己位置が推定され、かつ、前記一定周期内に前記２つの撮像部のうち少なくとも一方により異なる時刻に撮影された画像フレームに基づき、自己位置を推定することを含む。

　一形態に係るプログラムは、上記自己位置推定方法をコンピュータに実行させる。

　以上、本技術によれば、ステレオＳＬＡＭにおいて消費電力やデータ処理量を低減することができる。

　なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれかの効果であってもよい。

図１は、参考例に係る自己位置推定装置の機能的な構成を示すブロック図である。図２は、本技術の一実施形態に係る自己位置推定装置の機能的な構成を示すブロック図である。図３は、一実施形態に係る撮像制御部による、ステレオカメラ部の撮像タイミングの例を示す図である。図３は、一実施形態に係る撮像制御部による、ステレオカメラ部の撮像タイミングの他の例を示す図である。図５は、一実施形態に係る撮像制御部による、ステレオカメラ部の撮像タイミングのさらに別の例を示す図である。

　以下、本技術に係る実施形態を、図面を参照しながら説明する。

　１．参考例に係る自己位置推定装置

　図１は、参考例に係る自己位置推定装置の機能的な構成を示すブロック図である。この自己位置推定装置１００は、撮像制御部１０１、特徴点検出部１０３、視差マッチング部１０４、距離推定部１０５、メモリ１０６、１０７、動きマッチング部１０８、および位置推定部１０９を含む。

　撮像制御部１０１は、２つのカメラ（撮像部）１０２ａ、１０２ｂを含むステレオカメラ部１０２による撮像タイミングを制御する。ステレオカメラ部１０２は、撮像制御部１０１により供給される撮像タイミング信号をトリガーとして撮像を行う。

　なお、ステレオカメラ部１０２で撮影された２つの画像に対しては、光学歪み補正などを含む各種の補正およびゲイン調整が行われ、それぞれ撮影された２つの画像の姿勢ずれを相殺する平行化の処理が行われる。

　画像処理部は、特徴点検出部１０３、視差マッチング部１０４、距離推定部１０５、メモリ１０６、１０７、動きマッチング部１０８、および位置推定部１０９を含む。

　特徴点検出部１０３は、ステレオカメラ部１０２のうち一方のカメラ１０２ｂから出力される画像フレームについて、自己位置の推定のために利用される特徴的な点、つまり特徴点を検出する。特徴点の集まりは、典型的には、コントラストが高く、かつ、周囲に似たような構造を持たない模様になる。このような特徴点の検出および特徴量の表現方法として、ＨａｒｉｉｓやＳＩＦＴ（Scale-Invariant Feature Transform）等の方法がある。

　視差マッチング部１０４は、カメラ１０２ａから出力される画像上から、特徴点検出部１０３により検出された他方（カメラ１０２ｂ）の画像上の各特徴点に対応する各点を、テンプレートマッチング法により検索する。ここで見つかった、特徴点に対応する点（以下、対応点と言う）は、２つの視点から同一の対象を見た点であると考えられ、この視点による見えの違い（ずれ量）を視差と呼ぶ。つまり、視差マッチング部１０４は、対応点の２次元位置（つまり２次元座標）を出力する。

　距離推定部１０５は、視差マッチング部１０４により求められた各特徴点の視差に基づき、各特徴点の（ステレオカメラ部１０２からの）距離を推定し、その距離に基づき、特徴点の３次元空間内の位置を算出する。距離は３次元的な奥行方向の距離であるため、デプスとも呼ばれる。視差から距離を算出する方法は、三角測量の原理により可能である。具体的には、距離zは、以下の式(1)により求められる。

　z=fB/d　・・・(1)

　f：カメラの焦点距離
　B：２つのカメラ間の距離（基線長）
　d：観測された視差

　距離zが求められることにより、下記式(2)によって、特徴点の３次元空間内の位置（つまり３次元座標）である3dCurr（x,y,z）が算出される。

　2dCurr（u,v）：対応点の２次元座標
　K：カメラの内部パラメータ行列

　距離推定部１０５により推定された３次元座標の点群情報はメモリ１０６に記憶される。

　一方、特徴点検出部１０３からの出力である各特徴点の特徴量（マッチングのためのテンプレート等を含む）およびその２次元座標の情報は、メモリ１０７に記憶される。

　メモリ１０６、１０７に記憶されたそれらの特徴点群は、時間的に「次の画像フレーム」が得られた時、過去の画像フレームを特徴付ける点群となり、自己位置変化の基準となる過去の画像フレームとして利用される。当該「次の画像フレーム」は現在の画像フレームとなる。なお、式(2)は記号「Curr」は形式的なものであり、その前のフレーム（過去のフレーム）についても同様に成立する式である。

　次の画像フレーム（現在の画像フレーム）が得られた時、動きマッチング部１０８は、現在の画像フレームから、メモリ１０７に記憶された過去の画像フレーム上の各特徴点の対応点をテンプレートマッチング法により検索する。つまり、動きマッチング部１０８は、メモリ１０７から抽出された過去の画像フレーム上の各特徴点が、現在の画像フレーム上のどこに対応するのかを解析する。ここで見つかった対応点は、２つの視点から同一の対象を見た点であると考えられ、その見え方の違いはカメラ１０２ｂの時間的な位置（姿勢）の変化によるものである。

　以下では、説明の便宜上、「現在の画像フレーム」を「現在フレーム」、「過去の画像フレーム」を「過去フレーム」と省略して呼称する。

　位置推定部１０９は、メモリ１０６から出力された過去の画像フレームの３次元座標と、動きマッチング部１０８から出力された現在フレーム上の対応点の２次元座標とに基づき、過去フレームの撮影時刻から現在フレームの撮影時刻までのステレオカメラ部１０２の位置の変化（差分）を推定する。つまりこれが自己位置の変化であり、その積分が３次元空間内の自己位置として特定される。この位置の変化は、ポーズ差分やΔポーズとも呼ばれる。「位置」は、「姿勢」の意味も含み、以下同じである。

　なお、過去フレームと現在フレームとは、時間的に連続する画像フレームである必要はなく、それらの間に別の画像フレームがあってもよい。すなわち、カメラ１０２ａ、１０２ｂの両方による撮像フレームレートより、位置推定部による出力レート（自己位置の推定レート）が低くてもよい。

　３次元空間内の点群（３次元位置）と、その点群に対応する（すなわち，３次元空間内の点群を投影した）２次元平面上の点群（２次元位置）が与えられたとき、その投影平面の位置（すなわち、ステレオカメラ部１０２の位置を求めることは、各特徴点を２次元面に投影したときの画像フレーム上の誤差をコストとした最小化問題を解くことで可能となる。

　視差マッチング部１０４および距離推定部１０５により各特徴点の距離が求められるのは、ステレオカメラ部１０２によって同時刻における同一の点を異なる視点から見ることができるためである。すなわちこの場合、ステレオカメラ部１０２を構成する２つのカメラの撮像タイミングは同時である必要がある。

　ステレオカメラを用いることで、単一のカメラを用いる場合に比べ、距離の推定を容易かつ高精度に行える利点がある。一方で、ステレオカメラを用いる場合、単一のカメラを用いる場合に比べて、カメラの個数が倍になることから、消費電力やデータ処理量（処理対象の画素総数が増えるため）などのコスト面で不利である。

　移動体のアプリケーションとして例えば車やドローンなど、移動体（に搭載されるカメラ）の移動速度が大きく、また、運動の変化が急峻なケースにおいては、自己位置推定の精度を上げるため、より高速な撮像フレームレートで撮像が行われることが望まれる。そのためには、カメラの撮像フレームレートを高くすればよいが、ステレオカメラを高撮像フレームレートで利用する場合、上記コストがさらに大きくなる。

　２．本技術に係る自己位置推定装置

　図２は、本技術の一実施形態に係る自己位置推定装置の機能的な構成を示すブロック図である。

　この自己位置推定装置２００の、特徴点検出部（検出部）２０３、視差マッチング部２０４、距離推定部２０５、メモリ２０６、２０７、動きマッチング部２０８、および位置推定部２０９は、図１で示した自己位置推定装置１００の特徴点検出部１０３、視差マッチング部１０４、距離推定部１０５、メモリ１０６、１０７、動きマッチング部１０８、および位置推定部１０９とそれぞれほぼ同じ機能を有する。ただし、メモリ２０６、２０７、動きマッチング部２０８は、図１で示した情報の他、さらに別の情報を記憶する。

　この自己位置推定装置２００は、基本的にはＣＰＵ（Central Processing Unit）、ＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）等のハードウェアを備え、ＲＡＭやＲＯＭに記憶されたソフトウェアにより主な機能が実現され得る。ＣＰＵに代えて、あるいはＣＰＵに加えて、ＦＰＧＡ（Field Programmable Gate Array）等のＰＬＤ(Programmable Logic Device)、あるいはＤＳＰ（Digital Signal Processor）等が用いられる場合もある。上記自己位置推定装置１００についても同様である。メモリ２０６、２０７、および２１０のうち少なくとも２つは一体のメモリデバイスにより構成されていてもよい。

　撮像制御部２０１は、ステレオカメラ部２０２の撮像タイミングを制御する。本技術では、撮像制御部２０１は、一定周期で２つのカメラ２０２ａ、２０２ｂが同じ時刻に撮像を行い、その一定周期の期間内に２つのカメラ２０２ａ、２０２ｂのいずれか一方が他方と異なる時刻に撮像を行うようにタイミングを制御する。

　図３は、本実施形態に係る撮像制御部２０１による、ステレオカメラ部２０２の撮像タイミングの例を示す図である。本実施形態では、撮像制御部２０１は２つのカメラ２０２ａ、２０２ｂの撮像フレームレートが異なるように撮像タイミング信号を供給する。具体的には、２つのカメラ２０２ａ、２０２ｂの両方が、ハッチングの丸で示すように一定周期（図３では1[s]）で同時刻に撮像を行い、また、白い丸で示すようにその同時刻以外の期間内で異なる時刻にそれぞれ撮像を行う。

　図３では、例えばカメラ２０２ａの撮像フレームレートは6[fps]であり、カメラ２０２ｂのそれは5[fps]となっている。つまり、両者で撮像フレームレートが異なる。本技術は、カメラ２０２ａ、２０２ｂの両方で得られる画像フレームのレートにより、位置推定部２０９による出力レート（位置の推定レート）を実現しようとするものである。

　なお、図３は、簡単化のために低い撮像フレームレートを示しているが、現実的には、例えば15～120[fps]等のフレームレートが採用され得る。

　図２において、破線で囲まれた部分が、２つのカメラ２０２ａ、２０２ｂにより一定周期で同時刻に撮影された画像フレームを処理する部分である。一方、一点鎖線で囲まれた部分が、基本的には２つのカメラ２０２ａ、２０２ｂにより一定周期内に異なる時刻にそれぞれ撮影された画像フレームを処理する部分である。

　図２の説明に戻る。自己位置推定装置２００は、セレクタ２１１、メモリ２１０、特徴点検出部（検出部）２１２、動きマッチング部２１３、距離推定部２１４をさらに備える。これらセレクタ２１１、特徴点検出部２１２、動きマッチング部２１３、距離推定部２１４は、主に、上記異なる時刻でそれぞれ撮影された画像フレーム（図３において白い丸で示す）を処理するための機能部である。

　一方、主に特徴点検出部２０３、視差マッチング部２０４、距離推定部２０５、動きマッチング部２０８、および位置推定部２０９は、主に、同じ時刻で撮影された画像フレーム（図３においてハッチングの丸で示す）を処理するための機能部である。

　セレクタ２１１は、２つのカメラ２０２ａ、２０２ｂで異なる時刻にそれぞれ撮影された画像フレームのうち、現在時刻において撮影されたカメラ側の画像フレーム（以下、有効画像フレームと言う）を選択して出力する。有効画像フレームは、メモリ２１０、特徴点検出部２１２、および動きマッチング部２０８にそれぞれ入力される。

　メモリ２１０は、同じ時刻で撮影された画像フレームを処理する際にはカメラ２０２ｂで撮影された（セレクタ２１１を介しない）画像フレームを記憶し、また、異なる時刻でそれぞれ撮影された画像フレームを処理する際にはセレクタ２１１から出力された有効画像フレームを記憶する。

　特徴点検出部２１２は、有効画像フレームの特徴点を検出する。特徴点の検出方法は、特徴点検出部２０３によるものと同様である。特徴点検出部２１２で検出されて得られる各特徴点の特徴量（マッチングのためのテンプレート等を含む）およびその２次元座標は、メモリ２０７に記憶される。また、それらは、動きマッチング部２１３に入力されるとともに、距離推定部２１４にも供給される。

　動きマッチング部２１３は、基本的に、メモリ２１０から過去時刻における画像フレームを抽出し、抽出した画像フレーム（第２画像フレーム）から、特徴点検出部２１２で得られた現在フレーム（第１画像フレーム）上の各特徴点の対応点をテンプレートマッチング法により検索する。つまり、動きマッチング部２１３は、特徴点検出部２１２で得られた現在フレーム（第１画像フレーム）上の各特徴点が、過去フレーム（第２画像フレーム）上のどこに対応するのかを解析する。ここで見つかった対応点は、２つの視点から同一の対象を見た点であると考えられ、その見え方の違いは、２つのカメラ２０２ａ、２０２ｂの時間的な位置の変化によるものである。

　一方、上述したように、動きマッチング部２０８は、メモリ２０７から抽出された過去フレーム上の各特徴点が、現在の有効画像フレーム上のどこに対応するのかを解析する点で、動きマッチング部２１３と異なる。

　距離推定部２１４は、動きマッチング部２１３から出力された過去フレーム上の対応点の２次元座標、特徴点検出部２１２から出力された現在フレーム上の各特徴点の２次元座標、および、位置推定部２０９から出力された位置差分（位置変化）を取得する。そして、距離推定部２１４は、これらの情報に基づき、ステレオカメラ部２０２からの各特徴点までの距離（デプス）を推定する。

　動きマッチング部２１３の処理により、有効画像フレーム（現在フレーム）の各特徴点について過去フレーム（別の視点に相当）上における対応点がわかっおり、位置推定部２０９の処理により、現在および過去フレーム間での位置差分がわかっている。したがって、距離推定部２１４は、異なる時刻に２つのカメラ２０２ａ、２０２ｂでそれぞれ撮影された画像フレーム（過去フレームと現在フレーム）間の移動視差によって、距離を推定することができる。この移動視差による距離は、後述する式(6)において、現在の距離である「3dCurr.z」に相当する。

　現在フレーム上の点の３次元座標を3dCurr、その点を過去フレームからみた場合の３次元座標を3dPrev、それら２フレーム間の位置差分をcRb（回転行列）およびcPb（並進ベクトル）とした場合、それら２フレーム間の３次元座標の間に次式(3)が成り立つ。

　また、上述の式(2)より、各画像フレームにおける各点の３次元座標3dCurr（あるいは3dPrev）と、その点を画像フレーム上（２次元面）に投影した２次元座標2dCurr（あるいは2dPrev）の間に、次式(4)が成り立つ。

　式(4)において、カメラ２０２ａ、２０２ｂの内部パラメータ行列Kは，焦点距離fおよび光学中心cより、次式(5)で表される。

　式(4)において、2dPrevは動きマッチング部２１３からの出力値であり、2dCurrは特徴点検出部２１２からの出力値である。式(3)、(4)より、次式(6)が導かれる。

　距離推定部２１４の処理として、上記式(6)の連立方程式（２つ（3dCurr.z，3dPrev.z）の変数に対して３つの式）を解くことにより，現在フレームにおける各点の距離である3dCurr.zが求められる。

　なお、図３に示すように、例えば時刻t0が撮影開始時刻であるとする。時刻t0では、両カメラ２０２ａ、２０２ｂで同時刻に撮像が行われる。時刻t0から見ると過去フレームは存在しないため、位置推定部２０９は、時刻t0に得られた両画像フレームのみによっては位置（位置差分）を推定することができない。位置推定部２０９が位置を出力できるのは、次の時刻t1においてカメラ２０２ａから画像フレームが得られた以降である。例えば時刻t1では、位置推定部２０９から出力される位置差分は、時刻t1からt0までの間の位置差分である。

　上述したように、一点鎖線で囲まれた部分が、基本的には２つのカメラ２０２ａ、２０２ｂにより一定周期内に異なる時刻にそれぞれ撮影された画像フレームを処理する部分である。

　ここで時刻t1では、カメラ２０２ａで撮影されセレクタ２１１で選択された有効画像フレームに対して、過去フレームとしては、時刻t0において２つのカメラ２０２ａ、２０２ｂで撮影された２つの画像フレームが原理的に存在する。上記したようにメモリ２１０は、それら２つの画像フレームのうち、カメラ２０２ｂで撮影された画像フレーム（セレクタ２１１を介しない）を記憶している。したがって、時刻t1にカメラ２０２ａで撮影された現在の有効画像フレーム（の各特徴点の２次元座標）と、メモリ２１０に記憶されたカメラ２０２ｂで撮影された過去フレームとが、動きマッチング部２１３に入力され処理される。

　なお、メモリ２１０にセレクタ２１１を介さないで記憶される対象が、カメラ２０２ａで撮影された画像フレームであってもよい。この場合、時刻t1にカメラ２０２ａで撮影された現在の有効画像フレーム（の各特徴点の２次元座標）と、メモリ２１０に記憶されたカメラ２０２ａで撮影された過去フレームとが、動きマッチング部２１３にて入力されて処理され得る。

　距離推定部２１４は、位置推定部２０９から出力された位置差分の情報を取得するので、距離推定部２１４の処理対象には過去フレームも含まれる。したがって、距離推定部２１４が距離を出力できるのは、時刻t1においてカメラ２０２ａから画像フレームが得られた以降である。それ以降（時刻t2以降）、位置推定部２０９および距離推定部２１４が同様に処理を実行していくために、メモリ２０６は距離推定部２１４の出力値（各特徴点の距離3dCurr.zを含む３次元座標）を記憶する。

　メモリ２０７は、異なる時刻でそれぞれ撮影された画像フレームを処理する際には、特徴点検出部２１２で得られた有効画像フレーム上の点群の２次元座標を記憶する。例えばメモリ２０７は、時刻t9においてその画像フレーム上の点群の２次元座標を記憶する。動きマッチング部２０８が、次の時刻t10において、当該時刻t9に撮影されたその（過去の）画像フレームと、時刻t10にカメラ２０２ｂにより撮影された現在フレームとに基づき、対応点の２次元座標を得ることができる。

　なお、動きマッチング部２０８は、時刻t10において、当該時刻t9に撮影された過去フレームと、時刻t10にカメラ２０２ａにより撮影された現在フレームとに基づき、対応点の２次元座標を得るようにしてもよい。

　カメラ２０２ａ、２０２ｂが剛体接続されることを前提に、カメラ２０２ｂのみで撮像が行われるタイミングで、カメラ２０２ａの位置（あるいは逆に、カメラ２０２ａのみで撮像が行われるタイミングで、カメラ２０２ｂの位置）を推定することは可能である。２つのカメラ２０２ａ、２０２ｂ間の位置差分をaRb（回転行列）およびaPb（並進ベクトル）で表すとする。カメラ２０２ｂから求められたカメラ２０２ｂの位置をbRc（回転行列）およびbPc（並進ベクトル）で表す場合、カメラ２０２ａの位置を表すaRc（回転行列）およびaPc（並進ベクトル）は、次式(7)および(8)でそれぞれ求められる。なお、記号「*」は積を意味する。

　aRc=aRb*bRc　・・・(7)
　aPc=aRb*bPc+aPb　・・・(8)

　逆の場合（カメラ２０２ａの位置からカメラ２０２ｂの位置を求める場合）も同様に可能である。２つのカメラ２０２ａ、２０２ｂ間の位置差分aPbおよびaRbは既知であってもよいし、システムが、推定されたカメラ２０２ａ、２０２ｂの位置関係からカルマンフィルタなどを用いて動的に推定してもよい。

　以上のように、本実施形態に係る自己位置推定装置２００は、２つのカメラ２０２ａおよび２００ｂが同時刻に撮像を行うタイミング、および、一方のカメラ２０２ａまたはｂのみが撮像を行うタイミングのいずれにおいても、カメラ２０２ａおよび２００ｂの両方の位置を推定することができる。その結果、一方のカメラの撮像フレームレートより高速なレートでの位置の推定を実現できる。

　例えば図３に示す例では、6[fps]および5[fps]の撮像フレームレートに対して、位置の推定レートは10[fps]となる。例えば、60[fps]および59[fps]の撮像フレームレートに対して、位置の推定レートは118[fps]となる。

　このように、２つのカメラ２０２ａ、２０２ｂの撮像フレームレートが異なる場合、それぞれの撮像フレームレートをN，M[fps]としたとき、位置の推定レートOは式(9)で表せる。なお、式(9)中のgcd(N,M)は、NおよびMの最大公約数を表す。

　O=N+M-gcd(N,M)　・・・(9)

　図３に示したように、撮像フレームレートNおよびMは互いに素の関係にあり、かつ、その差が1であるとき、最大限の推定レートを実現できる。

　上記のように、本実施形態では、推定レートを高速化できるが、逆にいえば、一方にカメラの撮像フレームレートと同じ推定レートを実現するために必要な撮像フレームレートを（最大で1/2程度まで）下げることができる。結果として、消費電力やデータ処理量を削減することができる。

　ところで、図３に示すように、２つのカメラ２０２ａ、２０２ｂを互いに異なるフレームレートで駆動した場合、完全に同時刻に撮像されるタイミングは１秒に１回しか存在しない。しかし、撮像フレームレートによっては、完全に同時刻でなくともかなり近い時刻になる（２つのカメラ２０２ａ、２０２ｂの撮像タイミングが近接する）ケースが考えられる。２つのカメラ２０２ａ、２０２ｂ間の撮像タイミングの差が、移動体の移動速度からして無視できるほど小さい場合がある。この場合、自己位置推定装置２００は、それらを同時刻に撮像されたものとみなして距離および位置の推定（図２において破線で示す枠内の処理）を行ってもよい。

　移動体の移動速度が速い場合、カメラ２０２ａ、２０２ｂの撮像タイミングの差が小さくても無視できないケースがある。したがって、この自己位置推定装置２００が搭載される移動体が取り得る最大移動速度に応じて、この自己位置推定装置２００の設計または製造時において、当該無視できる撮像タイミングの差の閾値が設定されればよい。

　撮像制御部２０１は、撮像タイミングを可変に制御することもできる。図４は、そのような可変な撮像タイミングの例を示す。この例は、２つのカメラ２０２ａ、２０２ｂの撮像フレームレートが同一である期間を含むが、同時刻での撮像が行われる一定周期内で、互いに位相が半周期ずれている。

　具体的には、図３に示した例と同様に、２つのカメラ２０２ａ、２０２ｂにより1[s]の一定周期で同時刻に撮像が行われる。撮像フレームレートは、カメラ２０２ａ、２０２ｂとも変速の4[fps]である。一定周期内の同時刻以外の期間では、カメラ２０２ａは当該同時刻後の最初の１回について、カメラ２０２ｂは最後の１回について、7[fps]で撮像を行う。このように、撮像タイミングを可変にすることによって、推定レートを一定にすることができる。

　図４に示す例では、撮像フレームレートをN[fps]、撮像タイミングを揃えるための同期フレームを挿入する間隔をK[s]としたとき、推定レートOは式(10)で表せる。

　O=2N-1/K　・・・(10)

　図５は、撮像制御部２０１によるさらに別の撮像タイミングの例を示す。この例では、撮像制御部２０１は、２つのカメラ２０２ａ、２０２ｂが一定周期（1[s]）で同時刻に撮像を行い、かつ、一定周期内の当該同時刻以外の期間が、２つのカメラ２０２ａ、２０２ｂのうち一方のみ、ここではカメラ２０２ａのみが撮像を行う期間を含むように制御を実行する。カメラ２０２ａのみが行う撮像の期間の撮像フレームレートは例えば7[fps]である。この場合、推定レートは、カメラ２０２ａの撮像フレームレートと同じとなる。

　この例では、一定周期における同時刻撮像以外の期間内に、カメラ２０２ａが少なくとも２回連続して撮像を行う。すなわち、カメラ２０２ｂが撮像を行わない期間内に、カメラ２０２ａが異なる時刻にそれぞれ撮像を行う。この場合、位置推定部２０９および距離推定部２１４は、カメラ２０２ａによりそのように連続して撮影された２つの画像フレームを利用して、それらの画像フレーム間での位置推定および距離推定を行うことができる。このような撮像タイミングを採用した処理も、本技術の範囲に含まれる。

　図５に示す例では、少なくとも１つのカメラ２０２ａによっても、位置推定を行うことができるため、消費電力やデータ処理量を低減することができる。

　ここで、図３、４に示した撮像タイミングの例を採用した処理のメリットは大きく３つある。この３つのメリットを、図５に示した撮像タイミングの例を採用した処理と比較しながら、以下に説明する。

　１つ目として、カメラの撮像フレームレートを比較すると、図４に示す例は露光時間を長く取ることができるというメリットがある。図４に示す例では、図５に示す例と同じ推定レートを実現するために必要な撮像フレーム（カメラ２０２ａ、２０２ｂの個別のフレームレート）が、図５に比べ低いため、露光時間を長く取ることができる。図４に示す例は、特に、SN比が課題となる暗所などで有利である。

　２つ目として、単一のカメラのキャリブレーションがずれていた場合の影響が、図３、４に示す例の場合、緩和できる可能性がある。例えば図５に示す例のように一方のカメラ２０２ａのみを用いて位置を推定する場合に比べて、図３、４に示す例は、２つのカメラ２０２ａ、２０２ｂによりそれぞれ位置を推定し、それらの結果をカルマンフィルタ等で最適化できる。したがって、一方のカメラに不具合等があっても、他方のカメラでそれを補償できる可能性がある。

　３つ目として、２つのカメラ２０２ａ、２０２ｂに含まれる（２つのカメラ分の）広い画角を利用できるというメリットがある。

　３．変形例

　本技術は、以上説明した実施形態に限定されず、他の種々の実施形態を実現することができる。

　図５に示す例の変形例として、カメラ２０２ｂが同時刻以外の期間でも少なくとも１回の撮像を行うようにしてもよい。例えばカメラ２０２ａが7[fps]、カメラ２０２ｂが2[fps]の撮像フレームレートで撮像を行うことができる。この場合も、カメラ２０２ｂが撮像を行わない期間内に、カメラ２０２ａが異なる時刻に撮像を行うことについては図５に示す例と同様である。

　２つのカメラ２０２ａ、２０２ｂは、主に可視光を受光する撮像センサを備えるが、紫外光や赤外光も撮像可能な撮像センサを備えていてもよい。

　以上説明した各形態の特徴部分のうち、少なくとも２つの特徴部分を組み合わせることも可能である。

　なお、本技術は以下のような構成もとることができる。
（１）
　２つの撮像部により一定周期で同じ時刻に撮影された画像フレームに基づき自己位置を推定し、かつ、前記一定周期内に前記２つの撮像部のうち少なくとも一方により異なる時刻に撮影された画像フレームに基づき自己位置を推定するように構成された位置推定部
　を具備する自己位置推定装置。
（２）
　前記（１）に記載の自己位置推定装置であって、
　前記２つの撮像部が異なる撮像フレームレートで撮像を行うように、前記２つの撮像部による撮像タイミングを制御する撮像制御部をさらに具備する
　自己位置推定装置。
（３）
　前記（２）に記載の自己位置推定装置であって、
　前記２つの撮像部による撮像フレームレートをそれぞれN、M[fps]とし、それら２つの値の最大公約数をgcd(N,M)とする場合、前記撮像制御部は、前記位置推定部による推定レートOが、
　O=N+M-gcd(N,M)
　となるように制御を実行する
　自己位置推定装置。
（４）
　前記（３）に記載の自己位置推定装置であって、
　前記撮像フレームレートNおよびMは互いに素の関係にある
　自己位置推定装置。
（５）
　前記（４）に記載の自己位置推定装置であって、
　前記撮像フレームレートNおよびMの差が1である
　自己位置推定装置。
（６）
　前記（１）に記載の自己位置推定装置であって、
　前記撮像制御部は、前記２つの撮像部のうち少なくとも一方の撮像フレームレートを可変に制御する
　自己位置推定装置。
（７）
　前記（６）に記載の自己位置推定装置であって、
　前記撮像制御部は、自己位置の推定レートが一定となるように制御を実行する
　自己位置推定装置。
（８）
　前記（７）に記載の自己位置推定装置であって、
　前記２つの撮像部による同一の撮像フレームレートをそれぞれN、M[fps]とし、前記一定周期をK[s]とする場合、前記撮像制御部は、前記位置推定部による推定レートOが、
　O=2N-1/K
　となるように制御を実行する
　自己位置推定装置。
（９）
　前記（１）に記載の自己位置推定装置であって、
　前記２つの撮像部によりそれぞれ撮影された画像フレーム内の特徴点を検出するように構成された検出部と、
　前記推定された自己位置と、前記２つの撮像部により異なる時刻に撮影された画像フレームとに基づき、前記特徴点までの距離を推定するように構成された距離推定部と
　をさらに具備する自己位置推定装置。
（１０）
　請求項９に記載の自己位置推定装置であって、
　前記２つの撮像部が異なる撮像フレームレートで撮像を行うように、前記２つの撮像部による撮像タイミングを制御する撮像制御部をさらに具備し、
　前記撮像制御部は、前記同じ時刻以外の期間が、前記２つの撮像部のうち一方のみが撮像を行う期間を含むように制御を実行し、
　前記位置推定部は、前記一定周期内に前記２つの撮像部の一方のみにより異なる時刻に撮影された画像フレームに基づき、自己位置を推定するように構成され、
　前記距離推定部は、前記推定された自己位置と、前記２つの撮像部の一方のみにより異なる時刻に撮影された画像フレームとに基づき、前記特徴点までの距離を推定するように構成される
　自己位置推定装置。
（１１）
　前記（９）または（１０）のうちいずれか１つに記載の自己位置推定装置であって、
　前記検出部は、前記異なる時刻に撮影された画像フレームのうちの一方である第１画像フレームから、前記特徴点の２次元座標を算出するように構成され、
　前記第１画像フレームと、前記異なる時刻に撮影された画像フレームのうち前記第１画像フレームより前に撮影された第２画像フレームとに基づき、前記第２画像フレーム上における、前記第１画像フレーム上の前記特徴点に対応する対応点を求めるように構成された動きマッチング部をさらに具備する
　自己位置推定装置。
（１２）
　２つの撮像部により一定周期で同じ時刻に撮影された画像フレームに基づき自己位置を推定し、
　前記一定周期内に前記２つの撮像部のうち少なくとも一方により異なる時刻に撮影された画像フレームに基づき自己位置を推定する
　自己位置推定方法。
（１３）
　２つの撮像部により一定周期で同じ時刻に撮影された画像フレームに基づき自己位置を推定し、
　前記一定周期内に前記２つの撮像部のうち少なくとも一方により異なる時刻に撮影された画像フレームに基づき自己位置を推定する
　ことをコンピュータに実行させるプログラム。

　２００…自己位置推定装置
　２０１…撮像制御部
　２０２…ステレオカメラ部
　２０２ａ、２０２ｂ…カメラ
　２０３、２１２…特徴点検出部
　２０４…視差マッチング部
　２０５、２１４…距離推定部
　２０６、２０７、２１０…メモリ
　２０８、２１３…動きマッチング部
　２０９…位置推定部
　２１１…セレクタ

Claims

　２つの撮像部により一定周期で同じ時刻に撮影された画像フレームに基づき自己位置を推定し、かつ、前記一定周期内に前記２つの撮像部のうち少なくとも一方により異なる時刻に撮影された画像フレームに基づき自己位置を推定するように構成された位置推定部
　を具備する自己位置推定装置。
　請求項１に記載の自己位置推定装置であって、
　前記２つの撮像部が異なる撮像フレームレートで撮像を行うように、前記２つの撮像部による撮像タイミングを制御する撮像制御部をさらに具備する
　自己位置推定装置。
　請求項２に記載の自己位置推定装置であって、
　前記２つの撮像部による撮像フレームレートをそれぞれN、M[fps]とし、それら２つの値の最大公約数をgcd(N,M)とする場合、前記撮像制御部は、前記位置推定部による推定レートOが、
　O=N+M-gcd(N,M)
　となるように制御を実行する
　自己位置推定装置。
　請求項３に記載の自己位置推定装置であって、
　前記撮像フレームレートNおよびMは互いに素の関係にある
　自己位置推定装置。
　請求項４に記載の自己位置推定装置であって、
　前記撮像フレームレートNおよびMの差が1である
　自己位置推定装置。
　請求項１に記載の自己位置推定装置であって、
　前記撮像制御部は、前記２つの撮像部のうち少なくとも一方の撮像フレームレートを可変に制御する
　自己位置推定装置。
　請求項６に記載の自己位置推定装置であって、
　前記撮像制御部は、自己位置の推定レートが一定となるように制御を実行する
　自己位置推定装置。
　請求項７に記載の自己位置推定装置であって、
　前記２つの撮像部による同一の撮像フレームレートをそれぞれN、M[fps]とし、前記一定周期をK[s]とする場合、前記撮像制御部は、前記位置推定部による推定レートOが、
　O=2N-1/K
　となるように制御を実行する
　自己位置推定装置。
　請求項１に記載の自己位置推定装置であって、
　前記２つの撮像部によりそれぞれ撮影された画像フレーム内の特徴点を検出するように構成された検出部と、
　前記推定された自己位置と、前記２つの撮像部により異なる時刻に撮影された画像フレームとに基づき、前記特徴点までの距離を推定するように構成された距離推定部と
　をさらに具備する自己位置推定装置。
　請求項９に記載の自己位置推定装置であって、
　前記２つの撮像部が異なる撮像フレームレートで撮像を行うように、前記２つの撮像部による撮像タイミングを制御する撮像制御部をさらに具備し、
　前記撮像制御部は、前記同じ時刻以外の期間が、前記２つの撮像部のうち一方のみが撮像を行う期間を含むように制御を実行し、
　前記位置推定部は、前記一定周期内に前記２つの撮像部の一方のみにより異なる時刻に撮影された画像フレームに基づき、自己位置を推定するように構成され、
　前記距離推定部は、前記推定された自己位置と、前記２つの撮像部の一方のみにより異なる時刻に撮影された画像フレームとに基づき、前記特徴点までの距離を推定するように構成される
　自己位置推定装置。
　請求項９に記載の自己位置推定装置であって、
　前記検出部は、前記異なる時刻に撮影された画像フレームのうちの一方である第１画像フレームから、前記特徴点の２次元座標を算出するように構成され、
　前記第１画像フレームと、前記異なる時刻に撮影された画像フレームのうち前記第１画像フレームより前に撮影された第２画像フレームとに基づき、前記第２画像フレーム上における、前記第１画像フレーム上の前記特徴点に対応する対応点を求めるように構成された動きマッチング部をさらに具備する
　自己位置推定装置。
　２つの撮像部により一定周期で同じ時刻に撮影された画像フレームに基づき自己位置を推定し、
　前記一定周期内に前記２つの撮像部のうち少なくとも一方により異なる時刻に撮影された画像フレームに基づき自己位置を推定する
　自己位置推定方法。
　２つの撮像部により一定周期で同じ時刻に撮影された画像フレームに基づき自己位置を推定し、
　前記一定周期内に前記２つの撮像部のうち少なくとも一方により異なる時刻に撮影された画像フレームに基づき自己位置を推定する
　ことをコンピュータに実行させるプログラム。