JP6086491B2 - 画像処理装置およびそのデータベース構築装置 - Google Patents

画像処理装置およびそのデータベース構築装置 Download PDF

Info

Publication number
JP6086491B2
JP6086491B2 JP2013163446A JP2013163446A JP6086491B2 JP 6086491 B2 JP6086491 B2 JP 6086491B2 JP 2013163446 A JP2013163446 A JP 2013163446A JP 2013163446 A JP2013163446 A JP 2013163446A JP 6086491 B2 JP6086491 B2 JP 6086491B2
Authority
JP
Japan
Prior art keywords
image
viewpoint
recognition target
parameter
representative image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013163446A
Other languages
English (en)
Other versions
JP2015032256A (ja
Inventor
小林 達也
達也 小林
加藤 晴久
晴久 加藤
柳原 広昌
広昌 柳原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2013163446A priority Critical patent/JP6086491B2/ja
Publication of JP2015032256A publication Critical patent/JP2015032256A/ja
Application granted granted Critical
Publication of JP6086491B2 publication Critical patent/JP6086491B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Description

本発明は、カメラ等の撮像手段によって取得された入力画像から認識対象を識別し、認識対象とカメラとの相対的な位置および姿勢の関係を推定する画像処理装置およびそのデータベース構築装置に関する。
近年、現実空間の映像をコンピュータで処理して更なる情報を付加するAR(拡張現実感)技術が、携帯電話等のカメラモジュールを備えた情報端末で実現されている。これらAR技術においては、処理リソースの少ない端末においても、カメラ等の撮像手段によって取得された入力画像内の認識対象物を識別し、それらの位置および姿勢の関係(以下、姿勢パラメータと表現する場合もある)をリアルタイムに推定する必要がある。
特許文献1では、画像認識処理によって、入力画像中の基準マーカに対する姿勢パラメータを推定する技術が開示されている。特許文献2では、サーバと情報端末における特徴点マッチングを利用した画像認識処理によって、処理リソースの少ない端末において、入力画像中の任意の対象物を識別する技術が開示されている。特許文献3では、初期化と追跡を組み合わせたハイブリッド型の画像認識処理によって、処理リソースの少ない端末において、入力画像中の任意の対象物に対する姿勢パラメータを推定する技術が開示されている。
特開2012−212460号公報 特開2012−203669号公報 特表2013−508844号公報
M. Ozuysal, M. Calonder, V. Lepetit, and P. Fua, "Fast keypoint recognition using random ferns," Pattern Analysis and Machine Intelligence, IEEE Transactions on, vol. 32, no. 3, pp. 448 -461, march 2010.
特許文献1に記載の従来技術においては、複雑なデザインのプリント等、任意の物体を認識対象物として扱うことができないという問題点があった。
特許文献2に記載の従来技術においては、サーバと通信を行うことによる識別速度の低下や、対象物を撮影する距離や方向の変化に対する頑健性の不足が問題であった。
特許文献3に記載の従来技術においては、初期化時の対象物を撮影する距離や方向の変化に対する頑健性の不足が問題であった。
また、特許文献2,3では、処理リソースの少ない端末でも実行可能な非特許文献1に記載のRandom Fernsと呼ばれる手法を用いることを想定しているが、その場合、実行前に必要なオフライン処理に時間を要することや、実行に必要なデータベースのサイズが大きいことが問題であった。
その一方で、オフライン処理に時間を要さないSURF,ORB,BRISK等の局所特徴量を用いた場合は、実行時の処理負荷や対象物を撮影する距離や方向の変化に対する頑健性の不足がより顕著になるという問題点があった。
本発明の目的は、上記の従来技術の課題を鑑みてなされたものであり、処理負荷を増やすことなく撮影距離や方向の変化に対する頑健性を向上させ、さらにオフライン処理時間を削減できる画像処理装置およびそのデータベース構築装置を提供することにある。
(1) 本発明の画像処理装置は、認識対象を複数の視点で画像サンプリングして各視点に固有の代表画像を生成する代表画像生成手段と、認識対象のカメラ画像から特徴点およびその局所特徴量を検出する特徴点検出手段と、各代表画像から対応点候補およびその局所特徴量を検出する対応点候補検出手段と、前記対応点候補の局所特徴量および認識対象に逆投影した座標を対応付けて管理するデータベースと、カメラ画像から検出された各特徴点の局所特徴量と前記データベースで管理される各対応点候補の局所特徴量とのマッチング結果に基づいて対応点を認識する認識手段と、前記認識結果に基づいて、前記カメラ画像を撮影した際の姿勢パラメータを推定する姿勢パラメータ算出手段とを具備した。
(2) 本発明の画像処理装置は、認識対象を複数の視点で画像サンプリングして生成された代表画像から検出された各対応点候補の局所特徴量および認識対象に逆投影した座標を対応付けて管理するデータベースと、認識対象のカメラ画像から特徴点およびその局所特徴量を取得する特徴点検出手段と、カメラ画像から検出された各特徴点の局所特徴量と前記データベースで管理される各対応点候補の局所特徴量とのマッチング結果に基づいて対応点を認識する認識手段と、認識結果に基づいて、前記カメラ画像を撮影した際の姿勢パラメータを推定する姿勢パラメータ算出手段とを具備した。
(3) 本発明のデータベース構築装置は、認識対象を複数の視点で画像サンプリングして各視点に固有の代表画像を生成する代表画像生成手段と、各代表画像から対応点候補およびその局所特徴量を取得する対応点候補検出手段と、対応点候補ごとに、その局所特徴量および認識対象に逆投影した座標を対応付けるデータベースとを具備した。
(4) 代表画像生成手段は、特徴点および/または特徴点候補を検出するアルゴリズムの視点変化に対する頑健性に応じて、視点を変化させる距離、角度、回転などのパラメータごとに画像サンプリングの密度を決定するようにした。
本発明によれば、以下のような効果が達成される。
(1) データベースには、投影パラメータの異なる代表画像そのものは蓄積されず、各代表点から検出された対応点候補の局所特徴量および当該対応点候補を認識対象へ逆投影して得られる座標値のみが蓄積され、さらに各局所特徴量は、その対応点候補の検出元の代表画像とは無関係に画一的に扱われるので、データベース容量の小型化およびデータベース構成の簡素化が達成され、認識速度の向上が図られる。
(2) 投影パラメータ値を変えて代表画像を取得する際の視点配置の密度が、特徴点検出および対応点候補検出アルゴリズムの各視点変化に対する頑健性に応じて、その弱さを補うように決定される。したがって、頑健性の高い視点変化に関して密に視点配置を行って精度向上に寄与しない多数の代表画像に関して対応点候補を無駄に蓄積したり、その逆に頑健性の低い視点変化に関して粗に視点配置を行って精度を劣化させたりすることなく、処理負荷の軽減およびデータベース容量の小型化を、視点変化に対する十分な頑健性を確保しながら実現できるようになる。
本発明が適用されるARシステムの構成を示したブロック図である。 姿勢パラメータ推定装置2の主要部の構成を示したブロック図である。 認識対象から生成される代表画像の例を示した図である。 代表画像の各対応点候補を認識対象に逆投影することで、各対応点候補に対応する認識対象の座標および勾配方向を取得する方法を示した図である。 仮想視点の設定方法を示した図である。 特徴点検出アルゴリズムの頑健性に応じて特徴点データベースの登録内容を異ならせる例を示した図である。 画像処理装置のデータベース構築装置の構成を示したブロック図である。
以下、図面を参照して本発明の実施形態について詳細に説明する。図1は、本発明が適用されるARシステムの構成を示したブロック図であり、携帯電話、スマートフォン、PDAあるいはノートPCなどの情報端末に実装されて使用される。
撮像装置4は、携帯端末等に搭載されているカメラモジュールあるいはWEBカメラ装置であり、認識対象5を撮影してカメラ画像Icaを表示装置1および姿勢パラメータ推定装置2に出力する。認識対象5は、形状や模様が既知である任意の三次元物体であり、印刷物やプリント等に代表される二次元的な物体(画像)も含まれる。
姿勢パラメータ推定装置2は、撮像装置4から取得したカメラ画像に基づいて、後に詳述するように、認識対象5の各対応点候補(特徴点)とカメラ画像の各特徴点との間で特徴点マッチングを実施し、相互に対応付けられた特徴点ならびにカメラの内部パラメータに基づいて、認識対象5とARシステムないしは撮像装置4との相対的な位置および姿勢の関係を推定する。
一般に、相対的な位置および姿勢の関係は、姿勢パラメータまたはカメラの外部パラメータと呼ばれる行列の形で表され、三次元空間内の位置と方向の情報が含まれる。画面内での物体の見え方は、この姿勢パラメータと、カメラの内部パラメータと呼ばれる、カメラに固有の焦点距離、主軸の位置の情報が含まれる行列やその他の光学的歪みのパラメータとによって決定される。
本実施形態では、内部パラメータや歪みパラメータは予めキャリブレーション等によって取得され、歪みは取り除かれているものとし、姿勢パラメータの推定結果は表示装置1へ提供される。ARシステムが複数種類の物体を認識対象とする場合には、姿勢パラメータと対象物のIDとの組が、認識した数だけ表示装置1へ提供される。
付加情報データベース3は、ハードディスクドライブや半導体メモリモジュール等により構成された記憶装置であり、認識対象5の位置をARシステムが認識した際に、表示装置1上で認識対象5に重畳表示するCGや2次元画像を保持しており、姿勢パラメータ推定装置2が推定したカメラの姿勢パラメータに対応する認識対象5に関する付加情報を表示装置1へ出力する。
前記表示装置1は、撮像装置4が連続的に取得したカメラ画像、および付加情報データベース3から取得された付加情報をユーザに掲示できるモニタ装置であり、携帯端末のディスプレイでも良い。また、ヘッドマウントディスプレイ(HMD)のような形態でも良く、特にシースルー型のHMDの場合はカメラ画像を表示せず、視界に付加情報のみを重畳して表示することも可能である。表示装置1がディスプレイである場合は、カメラ画像に付加情報DBから入力された付加情報を重畳表示する。その際、付加情報は、姿勢パラメータ推定装置2から入力された姿勢パラメータによって、位置や向きを補正されて表示される。
図2は、前記姿勢パラメータ推定装置2の主要部の構成を示したブロック図であり、特徴点検出部21,マッチング部22および姿勢パラメータ算出部23により構成される。
特徴点検出部21において、特徴点検出器201は、認識対象5を撮影したカメラ画像から特徴点を検出する。特徴量抽出器202は、前記各特徴点から局所特徴量を抽出する。前記特徴点検出器201および特徴量抽出器202としては、Harris,Hessian,SIFT,SURF,FAST,BRIEF,ORB,BRISK,FREAK等のアルゴリズムを用いることができる。
一般に、これらのアルゴリズムには一長一短の側面があり、撮影の距離や角度・回転に頑健なSIFT,SURF等のアルゴリズムは処理負荷が大きく、処理負荷の小さいFAST,BRIEF等のアルゴリズムは、距離や角度・回転に対する頑健性に乏しい。処理負荷と頑健性とを両立できる手法として、特徴点を分類するための識別器を事前学習する、Random Fernsに代表されるアルゴリズムが存在するが、長時間の学習とサイズの大きいデータベース(識別器)を必要とするという課題がある。
マッチング部22において、学習部203は、代表画像生成部203a、対応点候補検出部203bおよび座標対応付部203cを含む。
代表画像生成部203aは、認識対象5を複数の位置および方向から(複数の視点から)撮影することで、あるいは視点を変えた複数の投影パラメータを使用して投影する(以下、画像サンプリングと表現する場合もある)ことで、代表画像を生成する。本実施形態では、複数の投影パラメータを使用して代表画像が生成される。ここで、視点は認識対象5と撮像装置4との距離、認識対象5に対する撮像装置4の角度、認識対象5に対する撮像装置4の光軸周りの回転等から構成される。代表画像生成部203aは、複数の異なる視点を投影パラメータに変換する。この投影パラメータを用いて認識対象5を二次元に投影することにより、距離、角度および回転の異なる複数の画像が代表画像として生成される。
図3は、認識対象5から生成される代表画像の例を示した図であり、ここでは、複数種類の角度(横軸)および距離(縦軸)の組み合わせから変換した投影パラメータを用いて代表画像が生成されている。
前記代表画像は、認識対象5を複数の視点から撮影することで取得することも可能であるが、オフライン処理の簡便さの観点から、認識対象5が平面物体であれば基準画像を射影変換(変換パラメータは投影パラメータから算出される)する等して、また複雑な三次元物体であれば、三次元モデルを投影することで人工的に作成する手法を用いることが望ましい。
対応点候補検出部203bは、前記特徴点検出部21における手法と同様の手法で、前記各代表画像から特徴点を検出して対応点候補とし、さらに各対応点候補の局所特徴量を抽出する。
なお、対応点候補の精度を高めるために、距離が予め設定された閾値以下の局所特徴量のみを対応付ける手法や、対応点の全体の傾向から外れた対応点候補を除外する手法等が知られており、これらの手法は本発明のマッチング部22にも同様に適用可能である。
本実施形態では、マッチング部22の対応点候補検出部203bとして、前記特徴点検出部21と同様のアルゴリズムを用いることが望ましいが、分解能や閾値等の細かいパラメータまで一致させる必要はなく、むしろ処理負荷の観点では、カメラ画像ごとにマッチングを実行する特徴点検出部21では、実行速度優先のパラメータ設定を行い、実行時の最初あるいはオフラインでの学習時にのみマッチングを実行する対応点候補検出部203bでは、精度優先のパラメータ設定とすることが望ましい。
座標対応付部203cは、図4に一例を示したように、各代表画像から検出された各対応点候補を認識対象5に逆投影することで、各対応点候補に対応する認識対象5の物体座標系における座標値(3次元座標)を取得する。
特徴点データベース204には、各代表画像から検出された各対応点候補の局所特徴量および座標対応付部203cによって取得された逆投影後の座標値が相互に対応付けられて対応点候補ごとに記憶される。それぞれの対応点候補は異なる画像(代表画像)から検出された局所特徴量を含むが、以降の処理では全て認識対象5から検出された対応点候補として画一的に扱われる。
認識部205は、上記の学習後に認識対象5のカメラ画像から検出された各特徴点の局所特徴量と前記データベース204に蓄積されている各対応点候補の局所特徴量との対応点マッチングを行なう。本実施形態では、各特徴点および各対応点候補の局所特徴量がベクトル形式で表現されており、ユークリッド距離やハミング距離が最も近い特徴点と対応点候補とのペアが相互に対応付けられて対応点とされる。
ここで、対応付けられた特徴点と対応点候補とのペア(対応点)には、一部誤りが含まれている可能性があり、対応点を姿勢パラメータ算出部23に入力する前段階で選抜する処理を行うことで、対応点の信頼性の向上が可能である。
この選抜処理の例として、例えば認識対象が平面物体の場合、各対応点を構成する特徴点と対応点候補の勾配方向を比較し、各対応点の勾配方向の差分が特異な対応点を削除する処理があげられる。ここで、認識対象が平面物体の場合、各勾配方向の差分は概ね一致することが期待される性質を利用している。
ここで、上述した勾配方向を利用した選抜処理を行う場合、前記座標対応付部203cが逆投影の際に、各対応点候補に対応する認識対象5の物体座標系における座標値(3次元座標)だけでなく、各対応点候補に対応する認識対象5の物体座標系における勾配方向も同時に取得し、データベース204に記憶する必要がある。
姿勢パラメータ算出部23は、前記特徴点と対応点候補との対応関係、およびカメラの内部パラメータに基づいて姿勢パラメータを推定する。従来から、2次元座標と3次元座標とのマッチから、その関係を説明する姿勢パラメータを推定する手法が検討されており、3次元座標と2次元座標との関係は、一般的に次式(1)で表される。
ここで、[u,v],[X,Y,Z]は、それぞれ2次元ピクセル座標値および3次元座標値を表し、[・]^Tは転置行列を表す。また、A、Wは、それぞれカメラの内部パラメータおよび姿勢パラメータを表す。カメラの内部パラメータは予めカメラキャリブレーションによって求めておく。
姿勢パラメータW=[R,t]=[r1,r2,r3,t]であり、回転行列Rと並進ベクトルtとで表される。3次元座標[X,Y,Z,1]^Tと2次元座標[u,v,1]^Tとのマッチおよびカメラの内部パラメータを用いて姿勢パラメータWを推定できる。
ここで、入力された2次元座標と3次元座標の対応点の中には一部誤った対応点(ペア)が含まれるため、RANSACやPROSACに代表されるサンプリング手法によって入力された対応点から正しい対応点(インライア)のみを抽出し、Levenberg-Marquard法等の反復手法によって3次元座標の再投影誤差を最小化する姿勢パラメータの推定を行うことが一般的である。
次いで、前記代表画像生成部203aによる代表画像の生成方法について更に詳細に説明する。本発明では、多数の代表画像を、投影する視点に偏りがないように生成するために、認識対象5の周囲に仮想的な視点を偏りなく配置し、各視点から観察される画像を生成する。より具体的には、各視点から投影パラメータを算出し、認識対象5またはその三次元モデルを二次元に投影することで代表画像が生成される。
本実施形態では、図5に一例を示したように、認識対象5の周囲を覆う半球を近似した多角形の頂点を仮想的な視点として扱う。この場合、次式(2)、(3)、(4)の計算を行うことで視点から回転行列Rを求めることが可能である。
ただし
ここで、Pは仮想視点の三次元座標、rod(・)はロドリゲス変換を表す。さらに各回転行列について任意の並進パラメータtを加え、カメラの内部パラメータAと合わせて投影パラメータP=A[R|t]を作成する。最終的に、代表画像生成部203aは投影パラメータを用いて認識対象5を投影することで前記代表画像(図3)を生成する。
なお、代表画像生成部203aは視点に偏りを作ることなく各代表画像を生成しても良いが、特定の視点から撮影される尤度が高いような状況下では、代表画像を生成する視点の範囲を制限しても良い。一般的に、認識対象5が平面物体であれば正面に近い角度から撮影される尤度が高いことが想定される。その場合、代表画像生成部203aは、正面に近い仮想視点のみを用いて代表画像を生成することで、学習時間の削減および信頼性の向上を実現することが可能になる。
また、例えば路面上のデザイン等、撮影距離が一定の範囲内に制限されることが想定される場合には、並進パラメータの範囲を狭めることで代表画像数を削減し、学習時間の削減と信頼性の向上を実現することが可能にある。その一方で、認識対象5が三次元形状を持ち、全周囲から撮影される可能性がある場合には、仮想視点も全周囲に配置することが望ましい。
ところで、特徴点検出部21および対応点候補検出部203bが採用する特徴点検出のアルゴリズムが、例えば角度の変化に対して高い頑健性を有している場合、撮影角度に関して視点間隔を密にして代表画像数を増やしてもマッチング精度の向上に余り寄与しない。
したがって、例えばSIFTアルゴリズムのように、距離、角度および回転(以下、「視点を変化させるパラメータ」で総称する場合もある)のいずれの変化に対する頑健性も優れたアルゴリズムを採用するのであれば、視点間隔を距離、角度、回転のいずれに関しても粗にすれば、オフライン処理負荷およびデータベース容量の小型化を、認識対象5を撮影する際の視点の変化に対する十分な頑健性を確保しながら実現できるようになる。
一方、例えばFASTアルゴリズムやBRIEFアルゴリズムのように、距離、角度および回転のいずれの変化に対しても頑健性が低いアルゴリズムを採用するのであれば、視点間隔を距離、角度、回転のいずれに関しても密にすることで、マッチング精度の向上を実現できるようになる。
ただし、必要以上に密に視点を配置してもマッチング精度の向上には寄与しないため、本発明の対応点候補検出部203bは、各視点変化(距離の変化、角度の変化、回転の変化等)に対する頑健性を補う必要最小限の数の代表画像を生成するようにしている。例えば、BRIEFアルゴリズムであれば、0〜10度程度の回転であれば問題なくマッチングを行うことが可能であるため、回転に関しては、視点間隔(画像サンプリングの分解能)を20度(18パターン)や30度(12パターン)に設定することで、オフライン処理負荷およびデータベース容量の小型化を、認識対象5を撮影する際の回転の変化に対する十分な頑健性を確保しながら実現できるようになる。
また、例えばORBアルゴリズムやBRISKアルゴリズムのように、回転の変化に対する頑健性に較べて距離や角度の変化に対する頑健性が低いアルゴリズムを採用するのであれば、視点間隔を回転に関しては粗にする一方、距離や角度に関しては密にすれば、処理負荷の軽減およびデータベース容量の小型化を、認識対象5を撮影する際の視点の変化に対する十分な頑健性を確保しながら実現できるようになる。
一般に、回転の変化に対する頑健性にのみ優れるアルゴリズムは低処理負荷のものが数多く存在しており、距離や角度の変化に対する頑健性を加えると高処理負荷になる傾向がある。したがって、距離、角度の変化に対する頑健性に乏しいORBアルゴリズムやBRISKアルゴリズムを採用し、距離と角度の変化に対する頑健性を補えるように代表画像を生成することが、総合的な処理負荷と各視点変化に対する頑健性の両立を実現する上で望ましい。
上述したように、本発明の対応点候補検出部203bは、特徴点検出部21および対応点候補検出部203bが採用するアルゴリズムの各視点変化(距離の変化、角度の変化、回転の変化等)に対する頑健性に応じて、その頑健性の弱さを補うように代表画像を生成するようにしている。
図6は、特徴点検出部21および対応点候補検出部203bが採用するアルゴリズムの各視点変化に対する頑健性に応じて、特徴点データベース204に対応点候補が登録される代表画像の傾向を異ならせる例を示した図であり、ここでは、角度の変化に対する頑健性が同等であって、距離の変化に対する頑健性の高いアルゴリズムを採用する場合と低いアルゴリズムを採用する場合との比較を示している。
距離の変化に対して頑健性の高い認識アルゴリズムを採用した場合は、撮影距離に関わらず同等のマッチング精度を得られるので、角度ごとに撮影距離の異なる多数の代表画像を用意する必要がない。すなわち、距離に関して視点の間隔を粗にできるので、特徴点が登録される代表画像数を減じることができる。
一方、撮影距離の変化に対して頑健性の低いアルゴリズムを搭載した場合は、撮影距離に応じてマッチング精度が大きく変化するので、角度ごとに距離の異なる多数の代表画像を用意する必要がある。すなわち、距離に関して視点の間隔を密にしなければならないので、代表画像数が増えることになる。
なお、図示は省略するが、角度や回転の変化に対して頑健性の高い認識アルゴリズムを採用した場合は、角度や回転に関わらず同等のマッチング精度を得られるので、撮影距離ごとに角度や回転の異なる多数の代表画像を用意する必要がない。すなわち、角度や回転に関して視点の間隔を粗に配置すれば良い。
一方、角度や回転の変化に対して頑健性の低いアルゴリズムを搭載した場合は、角度や回転に応じてマッチング精度が大きく変化するので、撮影距離ごとに角度や回転の異なる多数の代表画像を用意する必要がある。すなわち、角度や回転に関して視点の間隔を密に設定しなければならない。
このように、本実施形態によれば、投影パラメータ値を変えて代表画像を取得する際の視点配置の密度が、特徴点検出部および対応点候補検出部の各視点変化に対する頑健性の弱さを補うように決定される。したがって、頑健性の高い視点変化に関して密に視点配置を行って精度向上に寄与しない多数の代表画像に関して対応点候補を無駄に蓄積したり、その逆に頑健性の低い視点変化に関して粗に視点配置を行って精度を劣化させたりすることなく、処理負荷の軽減およびデータベース容量の小型化を、視点変化に対する十分な頑健性を確保しながら実現できるようになる。
なお、上記の実施形態では、ARシステムの姿勢パラメータ推定装置2が学習部203を備え、自ら特徴点データベース204を予め構築するものとして説明したが、本発明はこれのみに限定されるものではなく、図7に一例を示したように、前記学習部203と同等の学習機能10を姿勢パラメータ推定装置の外部に設け、当該学習機能10がオフラインで構築したデータベースを学習部203に移植するようにしても良い。
学習機能10において、代表画像生成部101は、認識対象5を様々な投影パラメータで二次元に投影することで代表画像を生成する。対応点候補検出部102は、特徴点検出部21における手法と同様の手法で、前記各代表画像から特徴点を検出して対応点候補とし、さらに各対応点候補の局所特徴量を各代表画像から抽出する。
座標対応付部103は、各代表画像から検出された各対応点候補を認識対象5に逆投影することで、各対応点候補に対応する認識対象5の物体座標系における座標値(3次元座標)および勾配方向を取得する。データベース104には、各代表画像から検出された各対応点候補の局所特徴量、逆投影後の座標値および勾配方向が、相互に対応付けられて対応点候補ごとに記憶され、その後、ARシステムの特徴点データベース204へ移植される。
1…表示装置,2…姿勢パラメータ推定装置,3…付加情報データベース,4…撮像装置,5…認識対象,21…特徴点検出部,22…マッチング部,23…姿勢パラメータ算出部,203…学習部,203a…代表画像生成部,203b…対応点候補検出部,203c…座標対応付部,204…特徴点データベース,205…認識部

Claims (10)

  1. 撮影したカメラ画像内の認識対象に対する姿勢パラメータを推定する画像処理装置において、
    認識対象を複数の視点で画像サンプリングして各視点に固有の代表画像を生成する代表画像生成手段と、
    認識対象のカメラ画像から特徴点およびその局所特徴量を検出する特徴点検出手段と、
    各代表画像から対応点候補およびその局所特徴量を検出する対応点候補検出手段と、
    前記対応点候補ごとに、その局所特徴量および認識対象に逆投影した座標を対応付けて管理するデータベースと、
    前記カメラ画像から検出された各特徴点の局所特徴量と前記データベースで管理される各対応点候補の局所特徴量とのマッチング結果に基づいて対応点を認識する認識手段と、
    前記認識結果に基づいて、前記カメラ画像を撮影した際の姿勢パラメータを推定する姿勢パラメータ算出手段とを具備し
    前記代表画像生成手段は、前記特徴点および/または特徴点候補を検出するアルゴリズムの視点変化に対する頑健性に応じて、視点を変化させるパラメータごとに画像サンプリングの密度を決定することを特徴とする画像処理装置。
  2. 前記代表画像生成手段は、頑健性が弱いパラメータほどより密に画像サンプリングを行うことを特徴とする請求項1に記載の画像処理装置。
  3. 前記代表画像生成手段は、頑健性が強いパラメータほどより粗に画像サンプリングを行うことを特徴とする請求項1に記載の画像処理装置。
  4. 撮影したカメラ画像内の認識対象に対する姿勢パラメータを推定する画像処理装置において、
    認識対象を複数の視点で画像サンプリングして生成された代表画像から検出された対応点候補ごとに、その局所特徴量および認識対象に逆投影した座標を対応付けて管理するデータベースと、
    認識対象のカメラ画像から特徴点およびその局所特徴量を取得する特徴点検出手段と、
    前記カメラ画像から検出された各特徴点の局所特徴量と前記データベースで管理される各対応点候補の局所特徴量とのマッチング結果に基づいて対応点を認識する認識手段と、
    前記認識結果に基づいて、前記カメラ画像を撮影した際の姿勢パラメータを推定する姿勢パラメータ算出手段とを具備し、
    前記代表画像は、視点を変化させるパラメータごとに、前記特徴点を検出するアルゴリズムの視点変化に対する頑健性に応じた密度で画像サンプリングされていることを特徴とする画像処理装置。
  5. 前記視点を変化させるパラメータが、距離、角度および回転の少なくとも一つを含むことを特徴とする請求項1ないしのいずれかに記載の画像処理装置。
  6. 前記代表画像が、認識対象の周囲に偏りなく仮想的に配置された視点から観察される画像であることを特徴とする請求項1ないしのいずれかに記載の画像処理装置。
  7. 前記代表画像が、認識対象を二次元に投影させた投影画像であり、前記視点を変化させるパラメータが投影パラメータであることを特徴とする請求項1ないしのいずれかに記載の画像処理装置。
  8. 撮影したカメラ画像内の認識対象に対する姿勢パラメータを推定する画像処理装置のデータベース構築装置において、
    認識対象を複数の視点で画像サンプリングして各視点に固有の代表画像を生成する代表画像生成手段と、
    各代表画像から対応点候補およびその局所特徴量を取得する対応点候補検出手段と、
    前記対応点候補ごとに、その局所特徴量および認識対象に逆投影した座標を対応付けるデータベースとを具備し、
    前記代表画像生成手段は、前記対応点候補を検出するアルゴリズムの視点変化に対する頑健性に応じて、視点を変化させるパラメータごとに画像サンプリングの密度を決定することを特徴とする画像処理装置のデータベース構築装置。
  9. 前記代表画像生成手段は、頑健性が弱いパラメータほどより密に画像サンプリングを行うことを特徴とする請求項に記載の画像処理装置のデータベース構築装置。
  10. 前記代表画像生成手段は、頑健性が強いパラメータほどより粗に画像サンプリングを行うことを特徴とする請求項に記載の画像処理装置のデータベース構築装置。
JP2013163446A 2013-08-06 2013-08-06 画像処理装置およびそのデータベース構築装置 Active JP6086491B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013163446A JP6086491B2 (ja) 2013-08-06 2013-08-06 画像処理装置およびそのデータベース構築装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013163446A JP6086491B2 (ja) 2013-08-06 2013-08-06 画像処理装置およびそのデータベース構築装置

Publications (2)

Publication Number Publication Date
JP2015032256A JP2015032256A (ja) 2015-02-16
JP6086491B2 true JP6086491B2 (ja) 2017-03-01

Family

ID=52517488

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013163446A Active JP6086491B2 (ja) 2013-08-06 2013-08-06 画像処理装置およびそのデータベース構築装置

Country Status (1)

Country Link
JP (1) JP6086491B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6491517B2 (ja) * 2015-03-31 2019-03-27 Kddi株式会社 画像認識ar装置並びにその姿勢推定装置及び姿勢追跡装置
JP7204087B2 (ja) * 2018-04-25 2023-01-16 成典 田中 対象物認識装置
CN109829853B (zh) * 2019-01-18 2022-12-23 电子科技大学 一种无人机航拍图像拼接方法
JP7375405B2 (ja) * 2019-09-19 2023-11-08 株式会社大林組 学習支援システム、学習支援方法及び学習支援プログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004164503A (ja) * 2002-11-15 2004-06-10 Olympus Corp 三次元モデル検索方法、三次元モデル検索装置、三次元モデル検索プログラム、及び三次元モデル検索システム
JP4715539B2 (ja) * 2006-02-15 2011-07-06 トヨタ自動車株式会社 画像処理装置、その方法、および画像処理用プログラム
JP5924862B2 (ja) * 2010-12-15 2016-05-25 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム

Also Published As

Publication number Publication date
JP2015032256A (ja) 2015-02-16

Similar Documents

Publication Publication Date Title
JP6768156B2 (ja) 仮想的に拡張された視覚的同時位置特定及びマッピングのシステム及び方法
US8467596B2 (en) Method and apparatus for object pose estimation
JP5290864B2 (ja) 位置姿勢推定装置及び方法
WO2014061372A1 (ja) 画像処理装置、画像処理方法および画像処理プログラム
JP5833507B2 (ja) 画像処理装置
JP2012043308A (ja) 位置姿勢決定方法、位置姿勢決定装置、物体モデル生成方法、物体モデル生成装置、およびプログラム
CN109785373B (zh) 一种基于散斑的六自由度位姿估计***及方法
KR100951309B1 (ko) 광학식 모션 캡처 장비를 위한 다중 카메라 보정 방법
JP6086491B2 (ja) 画像処理装置およびそのデータベース構築装置
JP5656768B2 (ja) 画像特徴量抽出装置およびそのプログラム
JP2017123087A (ja) 連続的な撮影画像に映り込む平面物体の法線ベクトルを算出するプログラム、装置及び方法
JP6017343B2 (ja) データベース生成装置、カメラ姿勢推定装置、データベース生成方法、カメラ姿勢推定方法、およびプログラム
KR101868740B1 (ko) 파노라마 이미지 생성 방법 및 장치
CN114981845A (zh) 图像扫描方法及装置、设备、存储介质
JP6016242B2 (ja) 視点推定装置及びその分類器学習方法
JP6347610B2 (ja) 画像処理装置および3次元空間情報取得方法
JP5931646B2 (ja) 画像処理装置
US9135715B1 (en) Local feature cameras for structure from motion (SFM) problems with generalized cameras
JP6304815B2 (ja) 画像処理装置ならびにその画像特徴検出方法、プログラムおよび装置
KR101673144B1 (ko) 부분 선형화 기반의 3차원 영상 정합 방법
JP6080424B2 (ja) 対応点探索装置、そのプログラムおよびカメラパラメータ推定装置
CN113034345B (zh) 一种基于sfm重建的人脸识别方法及***
JP2000353244A (ja) 基礎行列を求めるための方法、ユークリッド的な3次元情報の復元方法、および3次元情報復元装置。
JP2018526753A (ja) 物体認識装置、物体認識方法及び記憶媒体
Li et al. Research on Container Panorama Image Stitching Method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160128

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20160810

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161128

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161207

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170112

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170125

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170126

R150 Certificate of patent or registration of utility model

Ref document number: 6086491

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150