JP2017126264A - 情報処理装置、情報処理方法およびプログラム - Google Patents
情報処理装置、情報処理方法およびプログラム Download PDFInfo
- Publication number
- JP2017126264A JP2017126264A JP2016006228A JP2016006228A JP2017126264A JP 2017126264 A JP2017126264 A JP 2017126264A JP 2016006228 A JP2016006228 A JP 2016006228A JP 2016006228 A JP2016006228 A JP 2016006228A JP 2017126264 A JP2017126264 A JP 2017126264A
- Authority
- JP
- Japan
- Prior art keywords
- image
- vector
- processing apparatus
- information processing
- pixel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Length Measuring Devices By Optical Means (AREA)
- Measurement Of Optical Distance (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
【課題】画像間における対応するブロックを探索する処理を、精度を低下させることなく高速化すること。【解決手段】情報処理装置は、複数の画像データを取得する。そして、取得した各画像データに対して射影演算を行い、処理対象の画素に対応する、次元数を減らしたベクトルを生成する。そして生成されたベクトルを用いて処理対象の画素の類似度を算出する。【選択図】図3
Description
本発明は、複数の画像から対応する局所領域を探索する処理に関する。
従来より、視点が異なる複数の画像(視差画像群)に基づき視差マップまたは距離マップを推定する技術がある。このようにして推定された視差マップまたは距離マップは、被写体の3次元形状の計測などに用いられる。その他、視差マップまたは距離マップは撮影後にピント位置、被写界深度、視点、照明などを画像処理によって変更するために用いられる場合もある。このような、撮影後にピント位置、被写界深度、視点、照明などを画像処理によって変更する技術はコンピュテーショナルフォトグラフィと呼ばれており、一部のカメラで製品化されている。
この視差マップまたは距離マップの推定技術は、2つの画像間での対応する特徴点を探索する方法と、対応するブロックを探索する方法とに分けられる。特徴点を探索する方法は、結果が疎な情報であるため先述した用途には補助的にしか用いることができない。これに対しブロックを探索する方法は、密な距離情報を推定できるため先述した用途に適用できる。ブロックを探索する方法を用いる場合、推定精度はブロックのサイズに大きく依存する。このため、対応するブロックを探索する処理を、入力画像に対するブロックのサイズを変えて複数回実行する方法が一般的に用いられている。また、ブロックのサイズが大きいほど対応の精度が向上する一方で演算量が増え、処理の時間が増大する。そこで、対応するブロックを探索する演算において、演算量を低減し処理を高速化する技術が求められている。特許文献1では、シーンに応じて入力画像の解像度変換を行うことで演算量の低減を図ることが記載されている。
Dimitris Achlioptas著「Database―friendly Random Projections」第20回ACM SIGMOD―SIGACT―SIGARTシンポジウム予稿集、2001年、274―281頁
Robert Calderbank、Stephen Howard、Sina Jafarpour著「Construction of a Large Class of Deterministic Sensing Matrices That Satisfy a Statistical Isometry Property」IEEE Journal of Selected Topics in Signal Processing、2010年、4巻、2号、358―374頁
しかしながら、特許文献1に記載の技術では、解像度変換により情報量が低減するために、解像度変換が適切でない場合にブロックマッチングの精度が低下してしまう。これは、画像を低解像度化すると画像上の詳細な特徴が消失することに起因する。このため、入力画像の各部分が属する距離レンジが予め正確に推定されていなければならないという制約がある。
本発明に係る情報処理装置は、複数の画像データを取得する取得手段と、前記取得手段で取得した各画像データに対して射影演算を行い、処理対象の画素に対応する、次元数を減らしたベクトルを生成する生成手段と、前記生成手段で生成された前記ベクトルを用いて前記処理対象の画素の類似度を算出する算出手段とを有することを特徴とする。
本発明によれば、画像間における対応するブロックを探索する処理を、精度を低下させることなく高速化することが可能となる。
<実施例1>
実施例1では、画像データの局所領域(以下、ブロックという)にそれぞれ次元圧縮処理を行うことで、対応ブロック探索処理の高速化を実現する例について述べる。まずは、実施例1の情報処理装置の構成について説明する。
実施例1では、画像データの局所領域(以下、ブロックという)にそれぞれ次元圧縮処理を行うことで、対応ブロック探索処理の高速化を実現する例について述べる。まずは、実施例1の情報処理装置の構成について説明する。
図1は、実施例1の情報処理装置の構成の一例を示す図である。実施例1の情報処理装置100(以下、処理装置100とする)は、CPU101、RAM102、ROM103、二次記憶装置104、入力インターフェース105、出力インターフェース106を含む。そして、処理装置100の各構成部はシステムバス107によって相互に接続されている。また、処理装置100は、入力インターフェース105を介して外部記憶装置108および操作部110に接続されており、出力インターフェース106を介して外部記憶装置108および表示装置109に接続されている。
CPU101は、RAM102をワークメモリとして、ROM103に格納されたプログラムを実行し、システムバス107を介して処理装置100の各構成部を統括的に制御するプロセッサーである。これにより、後述する様々な処理が実行される。二次記憶装置104は、処理装置100で取り扱われる種々のデータを記憶する記憶装置であり、本実施例ではHDDが用いられる。CPU101は、システムバス107を介して二次記憶装置104へのデータの書き込みおよび二次記憶装置104に記憶されたデータの読出しを行うことができる。なお、二次記憶装置104にはHDDの他に、光ディスクドライブやフラッシュメモリなど、様々な記憶デバイスを用いることが可能である。
入力インターフェース105は、例えばUSBやIEEE1394等のシリアルバスインターフェースであり、外部装置から処理装置100へのデータや命令等の入力は、この入力インターフェース105を介して行われる。処理装置100は、この入力インターフェース105を介して、外部記憶装置108(例えば、ハードディスク、メモリーカード、CFカード、SDカード、USBメモリなどの記憶媒体)からデータを取得する。また、処理装置100は、この入力インターフェース105を介して、操作部110を用いて入力されたユーザによる命令を取得する。操作部110はマウスやキーボードなどの入力装置であり、ユーザの指示を処理装置100に入力するために用いられる。
出力インターフェース106は、入力インターフェース105と同様にUSBやIEEE1394等のシリアルバスインターフェースを備える。その他に、例えばDVIやHDMI(登録商標)等の映像出力端子を用いることも可能である。処理装置100から外部装置へのデータ等の出力は、この出力インターフェース106を介して行われる。処理装置100は、この出力インターフェース106を介して表示装置109(液晶ディスプレイなどの各種画像表示デバイス)に、処理された画像などを出力することで、画像の表示を行う。なお、処理装置100の構成要素は上記に限られるものではなく、他の構成要素を含むことが可能であるが、ここでは説明を省略する。また、ここではPCなどの情報処理装置を例に挙げて説明したが、図1に示す構成の一部がネットワーク接続されている構成を利用する形態であってもよい。
以下、実施例1の処理装置100で行われる処理について、図2に示す機能ブロック図、図3に示すフローチャートおよび図9(a)に示す模式図を用いて説明する。実施例1の処理装置100は、図2に示すようにデータ取得部201、射影演算部202、照合部203、対応決定部204としての機能を有する。処理装置100は、CPU101がROM103内に格納された制御プログラムを読み込み実行することで、上記各部の機能を実現する。なお、各構成部に相当する専用の処理回路を備えるように処理装置100を構成するようにしてもよい。以下、各構成部により行われる処理の流れを説明する。
ステップS301では、データ取得部201は、入力インターフェース105を介して、または二次記憶装置104から、処理対象の画像データを取得する。取得する画像データは、複数の画像にそれぞれが対応する複数の画像データである。例えば複数の画像は、1台または複数台のカメラで撮像した複数の異なる視点からの画像を含む。撮像手段として、例えば、小型カメラを複数台並置した多眼カメラを用いてもよいし、マイクロレンズアレイを内蔵することで複数視点の画像を同時に取得できるプレノプティックカメラを用いてもよい。処理装置100は、取得した複数の画像の1つを基準画像901として決定する。基準画像901としては、取得した画像のうち視差マップなどの情報を推定したい画像を選択すればよく、予めユーザが設定してもよいし、処理装置100が自動的に決定してもよい。また、以降では基準画像以外の入力画像の1つを参照画像906とする。
ステップS302では、データ取得部201は、基準画像901の1つの画素(以下、対象画素と呼ぶ)に対応する1つのブロック902を抽出し、射影演算部202に出力する。ブロックは複数の画素から構成される。ブロック902は、対象画素を中心とする矩形領域としてもよい。
ステップS303では、射影演算部202が、データ取得部201から入力された基準画像901の1つのブロック902に対し射影演算を行う。射影演算としては、ブロック902を変形して得られるベクトル903(列ベクトル)に対し後述する横長の射影行列904を乗じる方法が挙げられる。この射影演算の結果として、ブロック902に対応するベクトル903から、より低次元の(要素数の少ない)ベクトル905が生成される。例えば図9(a)に示すように、N画素のブロックに対してM×Nのサイズの行列を乗じると、M次元のベクトル905が生成される。なお、射影演算の目的はデータサイズを低減することであるので、M<Nを満たすこととする。
先述した射影行列が満たすべき条件の1つとして、非特許文献1にも記載されているように、Johnson―Lindenstraussの補題がある。この補題によれば、任意の2ベクトルの差分に対しある条件を満たすM<Nの射影行列を乗じて次元を縮小しても、そのノルム(長さ)はほぼ完全に保存されることが数学的に保証される。また、2ベクトルの類似度を算出するための情報と2ベクトルの差分のノルムとは密接な関係をもつ。2ベクトルの類似度を算出する際には、2ベクトルの差分などを求める処理を行なうからである。よって、このような射影行列を乗じて前記ブロックをより低次元のベクトルに変換しても、前記ブロックが有する類似度算出のための情報は失われない。このように、本実施例では、情報を損なうことなく類似度の算出に用いるデータのサイズを縮小できるために、精度を維持しながら対応ブロック探索の演算量を低減できる。
任意の2ベクトルの差分に対して射影行例を乗じて次元を縮小しても、そのノルムが保存されるような射影行列の具体例が、非特許文献1の1.1節に記載されている。非特許文献1には、任意の2ベクトルの差分に対して射影行例を乗じて次元を縮小しても、そのノルムが保存されるような射影行列の具体例として、各要素が独立に1/2の確率で+1または−1をランダムにとる2値の行列が記載されている。また、各要素が独立に1/6の確率で+√3を、1/6の確率で−√3を、2/3の確率で0をランダムにとる疎な行列も同じ性質を有することが知られている。なお、任意の2ベクトルの差分に対して射影行例を乗じて次元を縮小しても、そのノルムが保存されるような条件を満たす射影行列はこれらに限定されず、ランダム性を有するベクトルから生成された巡回行列でもよい。さらには、射影行列は必ずしもランダム性を有する必要はなく、非特許文献2の2節に記載されているような離散チャープ行列、Delsarte―Goethalsコード、BCHコードなどの一意に決定される行列でもよい。なお、ブロックによらず射影行列を同一にすることが計算上好適である。このように、本実施例では、乱数、離散チャープ行列、Delsarte―Goethalsコード、BCHコードのいずれかによって決定されるM行N列(M<N)を用いることができる。また、この行列においては、符号が反転した同じ値が略同数あることができる。さらには、乱数は離散値に丸められた値としてもよい。
ステップS304では、データ取得部201は、参照画像906から特定の位置の画素に対応する複数のブロック907を抽出する。ブロック907の位置は、ブロック902の位置から予め決定された複数の相対位置に移動した位置としてもよい。この複数の相対位置は視差の候補値であり、ブロック902の位置によらず固定された値の集合でもよいし、ブロック902の位置ごとに異なる値の集合でもよい。
ステップS305では、射影演算部202は、ステップS303と同様に、ブロック907の各々を変形して得られるベクトル908に対し射影演算を行い、複数の低次元ベクトル909を生成する。なお、本実施例では、基準画像のブロック902に対応する複数のブロックを先に抽出し、その後、抽出した複数のブロックそれぞれに射影演算を行なう例を説明したが、これに限られない。例えば、基準画像のブロック902に対応する単一のブロック907を抽出して射影演算を行い、この処理をブロック907の位置を変えて反復する処理でもよい。
なお、ステップS305の射影変換で用いる射影行列はステップS303の射影変換で用いる射影行列と同じ射影行列である。すなわち、後述する類似度の比較で用いられる、基準画像のブロックと、参照画像の複数のブロックとの第1の組においては、同じ射影行列を用いることが必要であるが、他の組においては第1の組で用いた射影行列とは異なる射影行例を用いてもよい。
ステップS306では、照合部203は、ベクトル905とベクトル909の類似度の算出を行う。すなわち、ステップS303で射影演算がされたベクトル905と、ステップS305で射影演算がされた複数のベクトル909との類似度の算出を行なう。類似度の算出方法としては、一般に知られている差分2乗和、差分絶対値和、正規化相互相関などを用いてもよいし、これらに限定されることはない。従来から行なわれているブロックマッチングでは、射影前のベクトル903とベクトル908との類似度を算出していたが、ブロックサイズが大きいほどこの演算量が増大する。これに対し、本実施例で説明した方法では次元を低減したベクトル同士の類似度の算出を行うため演算量の低減が可能になる。
ステップS307では、対応決定部204は、ステップS306において算出された類似度と参照画像のブロック907の基準画像のブロック902に対する相対位置とに基づき、基準画像901のブロック902の位置における視差を推定する。最も単純な方法としては、類似度が最大になるブロック902とブロック907との間の距離dを視差値とする。別の方法としては、類似度をブロック902とブロック907の距離の関数とみなし、関数フィッティングにより極大値をとる距離を算出し、これを視差値とする。なお、類似度に基づき視差を推定する方法はこれらに限られることはなく、任意の公知の技術を用いることができる。また、視差値は必要に応じて距離値に変換してもよい。
ステップS308では、処理装置100は、基準画像901の視差を算出すべき対象画素の全ての画素に対応するブロック902に対して処理が行われたかを判定する。処理が完了していない場合にはステップS302に戻り、未処理の対象画素に対応するブロック902を選択した上でステップS302〜307の処理を行う。
以上が、実施例1の処理装置100で行われる処理である。この処理を、図9(a)に模式的に示す。以上の処理によれば、画像内のブロックの次元数を、情報量を低減させることなく縮小することができるので、視差マップを高速に生成することができる。
本実施例の効果を説明するため、以下に上記の処理を画像データに対して実際に行った例を示す。
水平方向にのみ視差を有する2枚のステレオ画像を入力画像データとする。ブロックサイズを5×5画素とし、各ブロックの組に対する類似度として式(1)に示す正規化相互相関NCCを基準画像の座標(x0,y0)および推定視差dごとに算出する。
ここで、F(x,y)は基準画像の座標(x,y)における画素値、G(x,y)は参照画像の座標(x,y)における画素値、Bは座標(x0,y0)を中心とするブロック内の座標の集合である。ブロックサイズが5×5画素の場合には、射影演算を行わない場合のBは25組の座標の集合である。また射影演算を行う場合は、Bは10組の座標の集合であり、ブロックに対応するベクトルに乗じる行列は10×25のサイズで各要素は独立に1/2の確率で0または1をとるとした。すなわち、射影演算によりベクトルの次元を60%削減することになる。
各座標(x0,y0)に対し、NCCが最大になるdを探索し、視差マップの座標(x0,y0)における値をdとする。1つの座標(x0,y0)におけるNCCとdとの対応を図4に示す。図4(a)は射影演算を行わない場合、図4(b)は射影演算を行った場合を示す図であり、図中の△はNCCが最大の点を表す。射影演算によらずNCCが最大値を取るdの値は一致しており、NCCのd依存性は類似している。また、算出された視差マップに5×5画素のメディアンフィルタ処理を行った結果を、図5に示す。図5(a)は射影演算を行わない場合、図5(b)は射影演算を行った場合、図5(c)は図5(b)から図5(a)を減算した分布を示す図である。画像端部や物体の輪郭近傍のような原理的に正確な視差の推定が困難な位置を除けば、両者はほぼ差が0である。このように、類似度の算出に用いるベクトルの次元を削減しても、射影行列が所定の条件を満たせばブロックの情報が保存されるために、視差推定の結果に実質的に影響を与えない。
以上が実施例1の処理である。以上の処理によれば、視差マップの推定精度を損なうことなく類似度算出処理の演算量低減を実現できる。
<実施例2>
実施例1の方法では、画像データから1つ1つのブロックを抽出してベクトル化した上で行列を乗じるため、計算効率が良くない。そこで、実施例2では、先述の射影行列と同様の方法で生成した同一サイズの異なるカーネルを複数生成する。そして生成したカーネルの各々を基準画像および参照画像にそれぞれ畳み込むことで複数の射影画像をそれぞれ算出し、この射影画像を用いて類似度を算出する。2次元の畳み込み演算は高速フーリエ変換を用いて効率よく計算できるため、この方法の方がブロックごとに行列を乗じるよりも高速に処理することが可能である。
実施例1の方法では、画像データから1つ1つのブロックを抽出してベクトル化した上で行列を乗じるため、計算効率が良くない。そこで、実施例2では、先述の射影行列と同様の方法で生成した同一サイズの異なるカーネルを複数生成する。そして生成したカーネルの各々を基準画像および参照画像にそれぞれ畳み込むことで複数の射影画像をそれぞれ算出し、この射影画像を用いて類似度を算出する。2次元の畳み込み演算は高速フーリエ変換を用いて効率よく計算できるため、この方法の方がブロックごとに行列を乗じるよりも高速に処理することが可能である。
本実施例は、ブロックに対応するベクトルから射影演算により得られた低次元ベクトルを用いる代わりに、上記のように得られた複数の射影画像の同一座標の画素値を並べたベクトルを類似度の算出に用いる以外は、実施例1と同じである。
以下、実施例1の処理装置100で行われる処理について、図2に示す機能ブロック図、図6に示すフローチャートおよび図9(b)に示す模式図を用いて説明する。
ステップS601では、ステップS301と同様に、データ取得部201は、入力インターフェース105を介して、または二次記憶装置104から、複数の画像に対応する複数の処理対象の画像データを取得する。また、処理装置100は、複数の画像のうち1つを基準画像901に、他の1つを参照画像906に定める。
ステップS602では、射影演算部202は、基準画像901に対し複数のカーネル910を畳み込み、カーネルにそれぞれが対応した射影画像から構成される射影画像群911を生成し照合部203に出力する。同様に、参照画像906に対し先述と同一の複数のカーネル910を畳み込み、カーネルにそれぞれが対応した射影画像から構成される射影画像群913を生成し照合部203に出力する。なお、ここで畳み込みに用いるカーネルは、カーネル内の要素の値が実施例1で説明したような射影行例と同様の方法で生成されたカーネルである。ステップS602の処理によって、カーネルの個数分の射影画像群911、913がそれぞれ生成されることになる。また、射影演算部202は、基準画像901と参照画像906とに対して複数のカーネルをそれぞれ同じ順番で使用して射影画像を生成し、生成した順で照合部203に射影画像を出力する。照合部203においては、同じカーネルを使用して得られた基準画像901の射影画像と参照画像906の射影画像との対応関係がわかるように射影画像群を処理する。例えば、照合部は射影演算部202から出力された順序で射影画像群を取得する。
ステップS603では、照合部203は、基準画像の射影画像群911から画素群912を抽出する画素位置を1つ選択する。すなわち、基準画像の射影画像群911における対象画素の画素位置を選択する。
ステップS604では、照合部203は、基準画像の射影画像群911の対象画素の画素位置と同一位置の画素群912を射影画像群911から抽出し、ベクトル905を生成する。
ステップS605では、照合部203は、参照画像の射影画像群913において、特定の位置に対応する複数の画素群914を射影画像群913から抽出し、複数のベクトル909を生成する。なお、画素群914の位置は、画素群914から予め決定された複数の相対位置に移動した位置としてもよい。このように、画素群912と画素群914の相対位置は、ステップS304で説明した相対位置と同一としてよい。
前述のように照合部203では、同じカーネルを使用して得られた基準画像901の射影画像と参照画像906の射影画像との対応関係がわかるように射影画像群を処理する。したがって、生成されたベクトル905とベクトル909とにおける各要素は、それぞれ同じカーネルを用いて生成された射影画像に基づく要素となっている。
ステップS606では、照合部203は、ベクトル905とベクトル909の類似度の算出を行う。このように処理を行なう結果、カーネルと同じサイズのブロックを直接類似度の算出に用いる場合に比べて演算量が低減する。
ステップS607では、ステップS307と同様に、対応決定部204が、ステップS606において算出された類似度と、画素群912と画素群914の画素位置の距離とに基づき、基準画像の選択された画素位置における視差を推定する。最も単純な方法としては、類似度が最大になる画素群912と画素群914の画素位置の距離を視差値とする。別の方法としては、類似度を画素群912と画素群914の画素位置の距離の関数とみなし、関数フィッティングにより極大値をとる画素位置の距離を算出し、これを視差値とする。
ステップS608では、基準画像の視差を算出すべき処理対象の全ての画素に対して処理が行われたかを判定する。処理が完了していない場合にはステップS603に戻り、未処理の画素に対応する画素位置を選択した上でステップS603〜607の処理を行う。
以上が、実施例2の処理装置100で行われる処理である。以上の処理によれば、画像内のブロックに対し必要な情報を損失することなく縮小することができるので、視差マップを高速に生成することができる。
演算量のオーダーは、類似度にNCCを用い入力画像がn画素とすると、射影演算を用いない場合はO(Nn)である。一方で本実施例の射影演算を用いる場合は、高速フーリエ変換を用いた畳み込みと縮小されたブロックを用いたNCC算出の2つの演算を行うため、O(nlogn)+O(Mn)となる。これらを比べるとおおよそNとMの比となり、Mが小さいほど本実施例の方法は高速になることが分かる。つまり、ベクトルを用いた類似度の算出においては、本実施例のように次元数(M)が少ないほど高速になる。なお、本実施例のベクトルの次元数は、カーネルの個数に対応する。従って、本実施例で使用するカーネルの総数は、カーネルに含まれる画素数よりも少ないものとする。
本実施例の効果を説明するため、以下に上記の処理を画像データに対して実際に行った例を示す。
図4と同じ1つの座標(x0,y0)におけるNCCとdの対応を図7に示す。図4(a)と比較すると、NCCが最大値を取るdの値は一致しており、NCCのd依存性は類似している。また、算出された視差マップに5×5画素のメディアンフィルタ処理を行った結果を、図8に示す。図8(a)は射影演算を行わない場合、図8(b)は図8(a)から図5(a)を減算した分布である。実施例1と同様に、推定が困難な位置を除けば、両者はほぼ差が0である。なお、視差マップの算出に要した演算時間は、一例として図5(a)が6.4秒、図8(a)が3.7秒であった。
以上が実施例2の処理である。以上の処理によれば、視差マップの推定精度を損なうことなく処理の高速化を実現できる。
<その他の実施形態>
以上説明した実施形態においては、撮影条件が異なる2つの撮影画像の対応する局所領域(部分領域)を探索する処理を例に挙げて説明した。しかしながら、必ずしも撮影画像に限られるものではなく、2つの画像間の対応する局所領域を探索する処理であればよく、処理対象の画像がどのようにして得られた画像であってもよい。また、ここでは2つの画像間の局所領域を探索する処理を例に挙げて説明したが、処理対象の画像の数は2つに限られるものではなく、複数の画像間の局所領域を探索するような処理でもよい。
以上説明した実施形態においては、撮影条件が異なる2つの撮影画像の対応する局所領域(部分領域)を探索する処理を例に挙げて説明した。しかしながら、必ずしも撮影画像に限られるものではなく、2つの画像間の対応する局所領域を探索する処理であればよく、処理対象の画像がどのようにして得られた画像であってもよい。また、ここでは2つの画像間の局所領域を探索する処理を例に挙げて説明したが、処理対象の画像の数は2つに限られるものではなく、複数の画像間の局所領域を探索するような処理でもよい。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
201 データ取得部
202 射影演算部
203 照合部
204 対応決定部
202 射影演算部
203 照合部
204 対応決定部
Claims (12)
- 複数の画像データを取得する取得手段と、
前記取得手段で取得した各画像データに対して射影演算を行い、処理対象の画素に対応する、次元数を減らしたベクトルを生成する生成手段と、
前記生成手段で生成された前記ベクトルを用いて前記処理対象の画素の類似度を算出する算出手段と
を有することを特徴とする情報処理装置。 - 前記生成手段は、乱数、離散チャープ行列、Delsarte―Goethalsコード、BCHコードのいずれかによって決定されるM行N列(M<N)の射影行列と、前記複数の画像データが示す各画像の、複数の画素から構成される部分領域の画素値に対応するベクトルと、の積を求めることで前記次元数を減らしたベクトルを生成することを特徴とする請求項1に記載の情報処理装置。
- 前記生成手段は、乱数、離散チャープ行列、Delsarte―Goethalsコード、BCHコードのいずれかによって決定される値を要素に含む複数のカーネルと前記複数の画像データが示す各画像との畳み込み演算を行うことで射影画像を生成し、前記次元数を減らしたベクトルとして、前記射影画像の所定の位置の画素群の画素値に対応するベクトルを生成することを特徴とする請求項1に記載の情報処理装置。
- 前記生成手段は、複数の画像データが示す複数の画像のうち、第1の画像に対して前記複数のカーネルの畳み込み演算を行なって得られた第1の射影画像群の所定の位置の画素群の画素値に対応するベクトルに含まれる各要素の値と、前記第1の画像とは異なる第2の画像に対して前記複数のカーネルの畳み込み演算を行なって得られた第2の射影画像群の所定の位置の画素群の画素値に対応するベクトルに含まれる各要素の値とが、同じカーネルをそれぞれの画像に畳み込んで得られた射影画像に対応する値となるように、前記ベクトルを生成することを特徴とする請求項3に記載の情報処理装置。
- 前記カーネルの総数は、前記カーネルに含まれる要素数よりも少ないことを特徴とする請求項3または4に記載の情報処理装置。
- 前記射影行列において、符号が反転した同じ値が略同数あることを特徴とする請求項2に記載の情報処理装置。
- 前記カーネルにおいて、符号が反転した同じ値が略同数あることを特徴とする請求項3から5のいずれか一項に記載の情報処理装置。
- 前記行列は巡回行列であることを特徴とする請求項2から7のいずれか一項に記載の情報処理装置。
- 前記乱数は離散値に丸められた値であることを特徴とする請求項2から8のいずれか一項に記載の情報処理装置。
- 前記類似度を用いて視差または被写体とカメラの距離を算出する算出手段をさらに有することを特徴とする請求項1から9のいずれか一項に記載の情報処理装置。
- 複数の画像データを取得する取得ステップと、
前記取得ステップで取得した各画像データに対して射影演算を行い、処理対象の画素に対応する、次元数を減らしたベクトルを生成する生成ステップと、
前記生成ステップで生成された前記ベクトルを用いて前記処理対象の画素の類似度を算出する算出ステップと
を有することを特徴とする情報処理方法。 - コンピュータを請求項1から10のいずれか一項に記載の情報処理装置の各手段として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016006228A JP2017126264A (ja) | 2016-01-15 | 2016-01-15 | 情報処理装置、情報処理方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016006228A JP2017126264A (ja) | 2016-01-15 | 2016-01-15 | 情報処理装置、情報処理方法およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2017126264A true JP2017126264A (ja) | 2017-07-20 |
Family
ID=59365309
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016006228A Pending JP2017126264A (ja) | 2016-01-15 | 2016-01-15 | 情報処理装置、情報処理方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2017126264A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108648226A (zh) * | 2018-03-30 | 2018-10-12 | 百度在线网络技术(北京)有限公司 | 用于生成信息的方法和装置 |
CN109886915A (zh) * | 2019-01-03 | 2019-06-14 | 深圳市灵犀智汇科技有限公司 | 一种多圆环显著程度判断方法、装置、设备、存储介质 |
RU2769453C1 (ru) * | 2021-07-19 | 2022-03-31 | Федеральное государственное бюджетное образовательное учреждение высшего образования "Рязанский государственный радиотехнический университет имени В.Ф. Уткина" | Способ измерения дальности до вагона на прямолинейном участке железнодорожного пути |
-
2016
- 2016-01-15 JP JP2016006228A patent/JP2017126264A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108648226A (zh) * | 2018-03-30 | 2018-10-12 | 百度在线网络技术(北京)有限公司 | 用于生成信息的方法和装置 |
CN108648226B (zh) * | 2018-03-30 | 2019-10-22 | 百度在线网络技术(北京)有限公司 | 用于生成信息的方法和装置 |
CN109886915A (zh) * | 2019-01-03 | 2019-06-14 | 深圳市灵犀智汇科技有限公司 | 一种多圆环显著程度判断方法、装置、设备、存储介质 |
RU2769453C1 (ru) * | 2021-07-19 | 2022-03-31 | Федеральное государственное бюджетное образовательное учреждение высшего образования "Рязанский государственный радиотехнический университет имени В.Ф. Уткина" | Способ измерения дальности до вагона на прямолинейном участке железнодорожного пути |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2019223382A1 (zh) | 单目深度估计方法及其装置、设备和存储介质 | |
US11663691B2 (en) | Method and apparatus for restoring image | |
CN106488215B (zh) | 图像处理方法和设备 | |
Wang et al. | High-fidelity view synthesis for light field imaging with extended pseudo 4DCNN | |
CN112750133A (zh) | 计算机视觉训练***和用于训练计算机视觉***的方法 | |
US9386266B2 (en) | Method and apparatus for increasing frame rate of an image stream using at least one higher frame rate image stream | |
JP2019190974A (ja) | キャリブレーション装置、キャリブレーション方法、及びプログラム | |
CN109661815B (zh) | 存在相机阵列的显著强度变化的情况下的鲁棒视差估计 | |
US10891740B2 (en) | Moving object tracking apparatus, moving object tracking method, and computer program product | |
JP2017126264A (ja) | 情報処理装置、情報処理方法およびプログラム | |
Liu et al. | Two-stream refinement network for RGB-D saliency detection | |
KR20190078890A (ko) | 그리드 기반의 평면 추정 방법 및 장치 | |
CN112102404B (zh) | 物体检测追踪方法、装置及头戴显示设备 | |
US20170116739A1 (en) | Apparatus and method for raw-cost calculation using adaptive window mask | |
US10212412B2 (en) | Method of increasing photographing speed of photographing device | |
JP5769248B2 (ja) | ステレオマッチング処理装置、ステレオマッチング処理方法、及び、プログラム | |
JP7312026B2 (ja) | 画像処理装置、画像処理方法およびプログラム | |
US10755439B2 (en) | Estimation device, estimation method and storage medium | |
CN107396083B (zh) | 一种全息图像生成方法及装置 | |
KR20200057929A (ko) | 캘리브레이트된 카메라들에 의해 캡쳐된 스테레오 영상들의 렉티피케이션 방법과 컴퓨터 프로그램 | |
CN114757822A (zh) | 一种基于双目的人体三维关键点检测方法及*** | |
KR20150102011A (ko) | 다른 이미지들로부터의 정보의 함수들에 기초한 범함수를 사용한 대상 이미지 생성 | |
KR20150094108A (ko) | 배경 영상의 위치를 이용한 관심맵 생성 방법 및 이를 기록한 기록 매체 | |
JP2018010359A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP6641313B2 (ja) | 領域抽出装置及びプログラム |