JP4349568B2 - 物体認識装置、物体認識方法、プログラム及び記録媒体 - Google Patents

物体認識装置、物体認識方法、プログラム及び記録媒体 Download PDF

Info

Publication number
JP4349568B2
JP4349568B2 JP2003387151A JP2003387151A JP4349568B2 JP 4349568 B2 JP4349568 B2 JP 4349568B2 JP 2003387151 A JP2003387151 A JP 2003387151A JP 2003387151 A JP2003387151 A JP 2003387151A JP 4349568 B2 JP4349568 B2 JP 4349568B2
Authority
JP
Japan
Prior art keywords
image
specular reflection
illumination light
object recognition
component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003387151A
Other languages
English (en)
Other versions
JP2005070026A (ja
Inventor
勝 土田
隆仁 川西
茂 高木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2003387151A priority Critical patent/JP4349568B2/ja
Publication of JP2005070026A publication Critical patent/JP2005070026A/ja
Application granted granted Critical
Publication of JP4349568B2 publication Critical patent/JP4349568B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Investigating Or Analysing Materials By Optical Means (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Description

本発明は、物体表面に鏡面反射や光沢が観察される状況において、静止画像、もしくは連続して入力される動画像中の鏡面反射成分を除去し、その結果を用いて物体を認識する物体認識装置および方法、そのプログラム並びに記録媒体に関する。
画像を用いた物体認識技術では、被写体表面に鏡面反射や光沢が観察される場合には、その影響により認識精度が低下する。この問題を解決するために、一般には、鏡面反射成分を含まない領域のみによる処理や、入力画像から鏡面反射成分を分離して得られた拡散反射成分の画像を用いた処理が行われている。
しかし、鏡面反射成分を含まない領域のみを用いた処理では、鏡面反射を含むか否かの判別を行う必要があり、複雑な処理を必要とする。また、被写体を特徴付けるテクスチヤが鏡面反射により隠蔽されている場合には、認識精度が著しく低下する。
一方、鏡面反射成分と拡散反射成分との分離を行い、拡散反射成分の画像を用いた処理では、照明光源および画像撮影装置の入力部において光の偏光を制御することで鏡面反射成分を除去し、拡散反射成分のみの画像を得ることができる(例えば、非特許文献1参照)。また、異なる方向から被写体に照明を当てて撮影した画像から、被写体の鏡面反射成分と拡散反射成分とを分離することができる(例えば、非特許文献2参照)。しかし、非特許文献1および非特許文献2に記載の技術では、1枚の拡散反射成分の画像を得るためには撮影条件を変えて撮影した複数枚の入力画像を必要とするため、動く物体を被写体とする場合や、動画像を入力画像とする場合には適さない。さらに、特殊な撮影装置を要するため、この技術を使用できる状況も制限されている。
また、被写体を多方向から撮影した複数の画像からは、画像での対応点追跡を行い、その結果を用いて鏡面反射成分と拡散反射成分を分離することができる(例えば、特許文献1参照)。しかし、特許文献1に記載の技術では、照明光源が複数存在する場合には鏡面反射成分や光沢の影響により対応点追跡の精度が低下し、その結果、鏡面反射成分と拡散反射成分との分離精度が低下する。
また、被写体の分光反射率を推定することにより、撮影時とは異なる照明環境(照明光スペクトルが異なる場合)でも、同じ照明下で観察した際の色を再現することができる。現在、この技術を医療分野や電子美術館(デジタルアーカイブ)、電子商取引(オンラインショッピング等)に応用した高色再画像システムの開発が進められている。しかし、主に目視による識別が主目的で、データベース等に蓄積された画像と入力画像で画像同士での照合を行う、画像認識、探索、検索は行われていない。その理由としては、鏡面反射が観測される(画像が含まれる)場合には、その影響により色再現が困難であること、また本来観察されるべき被写体表面のテクスチャが鏡面反射により隠蔽されていることがあげられる。
小島伸俊、他2名、「化粧肌の質感推定(II)(肌の凹凸情報の定量化)」、日本写真学会誌、56(4)、1993、pp.264〜269 YoichiSato、他2名、「Temporal-color space analysis of reflection」,Journal of OpticalSociety of America,A/vol.11,November,1994,pp.2990〜3002 特開2003−85531号広報
本発明は、上記従来技術の問題点を解決すべくなされたもので、照明光成分を用いて鏡面反射成分を含まない画像(鏡面反射除去画像)を生成し、得られた鏡面反射除去画像を用いて、照明条件(光源の数や種類、配置)の変化に対し、物体認識処理を安定に行うことができる物体認識装置及び方法、そのプログラム並びに記録媒体を提供することを目的とする。
また、本発明は、入力画像と照合画像とで撮影時の照明の種類(分光スペクトル)が異なる場合でも、画素値毎の単純な比較による照合が可能である物体認識装置及び方法、そのプログラム並びに記録媒体を提供することを目的とする。
本発明は、物体の撮影時に用いる照明光源の照明光成分を取得する手段と、撮影装置により撮影された対象物の画像である入力画像と対象物の表面からの反射光の分光放射輝度とを取り込む手段と、予め撮影されている対象物の画像である蓄積画像と、該蓄積画像の撮影時の照明光成分とを、少なくとも蓄積する手段と、取得した照明光成分を用いて入力画像から鏡面反射成分を含まない鏡面反射除去画像を生成する手段を備える。
また、本発明は、鏡面反射除去画像と蓄積手段に蓄積された蓄積画像とを照合する手段を更に備える。また、入力画像と当該入力画像の鏡面反射除去画像、または、入力画像と当該入力画像の鏡面反射除去画像および蓄積画像と当該蓄積画像の鏡面反射除去画像とを表示する手段を備える。
鏡面反射除去画像の生成は、入力画像の分光放射輝度を照明光成分で割って総合反射率画像を得(照明光を用いて物体表面の各画素における見かけの反射率を算出)、この総合反射率画像の各画素の信号値を、ベクトルU(λ)=[1,1,…,1](λは波長)を法線とする超平面に投影することで行う
なお、照明光成分の計測装置、および画像の取り込みに用いる撮影装置に関しては、予め当該機器の入力及び出力特性を計測しておく。
まず、照明光源等の照明光成分の取得について説明する。一般には白色板からの拡散光を照明光成分とし、その計測には分光輝度計、色彩輝度計、もしくは3バンド以上の画像撮影が可能なデジタルカメラが用いられる。一般的に3バンドとは「赤、緑、青」の三原色を指す。ここで照明光成分とは、照明光の分光スペクトル、光原色、もしくは撮影装置により撮影された白色板の画像の信号値とする。デジタルカメラを使用する場合、一般に入力された光の強度と、出力される信号値は、比例関係にない。そこで、あらかじめデジタルカメラの特性を計測しておき、その結果を参照して信号値を明るさで規格化する。計測時には、1種類の照明光源だけ点灯させ、他の照明は消灯した状態で行う。これをすべての照明光源に対して行い、複数の照明光成分を得る。オフィス環境など、使用されている光源が有限種類に限定できる場合には、照明光源としてそれらすべてを仮定し、予め計測しておいたデータを用いてもよい。また、照明光としては太陽光等の自然光を用いることも可能である。ただし、自然光と複数の人工的な照明光とを組み合わせて照明光群として使用する場合は、人工的な照明光のみが被写体(対象物)を照らすことを可能にするような構成が必要になる。その構成としては、例えば、被写体と人工的な照明光との組み合わせを自然光から遮断するような覆いを用いる。
次に、被写体の画像取込みについて説明する。撮影装置としては、例えば、3バンド以上の画像撮影が可能なデジタルカメラを用いる。撮影装置からの出力信号値は、照明情報取得時と同じく、あらかじめ計測しておいた機器特性を基に明るさでの規格化を行う。画像中の光沢や鏡面反射が明るすぎて撮影装置のダイナミックレンジを超えてしまい画像情報が欠損する場合には、露光時間や絞り値を適切な値に調節するか、露光時間を変えて取得した複数のダイナミックレンジが広い1枚の画像を合成する。また用途にあわせ、得られた信号値から、撮影装置に入力された光の分光スペクトルもしくは色度値を推定する。
次に、照明光成分を用いて入力画像から鏡面反射成分を含まない鏡面反射除去画像を得る原理について説明する。ここでは、分光スペクトルを入力とする場合について述べる。
初めに、入力画像の各画素の信号値を照明光成分に直交する空間に投影することで、鏡面反射除去画像が得られる原理を、図13にもとづき説明する。
対象とする被写体は、非金属で2色正反射が仮定できる有彩色の拡散物体とする。簡単のため、1つの点光源で被写体を照明する場合について考える。ある方向が被写体を観察した際に観察される、物体表面の1点からの反射光の分光放射輝度(反射光スペクトル)I(λ)は、標準2色性反射モデルが仮定できる場合、(1)式のように、拡散反射成分(第1項)と鏡面反射成分(第2項)の線形和で表わされる。
Figure 0004349568
λは波長、kは鏡面反射成分の強度を表わす係数、E(λ)は照明光の分光分布である。
鏡面反射成分は照明光と同じ分光分布を持つ。I(λ)をE(λ)に直交する空間に投影して得られる成分をP(λ)とすると、
Figure 0004349568
と表わすことができる。αと(1)式を(2)式に代入すると、
Figure 0004349568
となり、P(λ)は、拡散反射成分I(λ)をE(λ)に直交する空間へ投影したものであることが分かる(図13)。したがって、P(λ)は鏡面反射成分の影響を含まないため、この成分に注目することで鏡面反射成分の変化に頑健な画像認識が可能となる。
次に、分光分布が異なるL個の照明光源で被写体を照明する場合を考える。i番目の照明光源の分光スペクトルをE(λ)とすると、観察される被写体表面のある1点からの反射光の分光放射輝度(反射光スペクトル)I(λ)は次式のように表わされる。
Figure 0004349568
D(λ)は各光源単独で被写体を照明した際に観察される拡散反射成分の和、kは各光源に対応する鏡面反射成分の強度を表わす係数である。
ここで、各光源の分光スペクトルE(λ)(i=1,2,…,N)全てに直交する空間をG(λ
)とすると、反射光スペクトルI(λ)を空間G(λ)に投影して得られる成分P(λ)は次式のように表わされる。
Figure 0004349568
従って、全ての照明光源の分光スペクトルに直交する空間G(λ)を求め、I(λ)をG(λ)へ投影することにより、先の照明光源が1種類の時と同様の処理が可能である。
なお、照明光スペクトルに直交する成分P(λ)は次のように求めることもできる。反射光スペクトルI(λ)のi番目の照明光源の分光スペクトルに直交する成分P(λ)を求め、さらにP(λ)を(i+1)番目の照明光源の分光スペクトルに直交する空間へ投影する。この処理をi=0,・・・,Lに関して繰り返すことで、用いたすべての照明光スペクトルに直交する成分P(λ)が次式のように求まる。
Figure 0004349568
Figure 0004349568
ここで、上記式(5)あるいは式(6)、(7)の処理の違いは、計算機資源の使い方やプログラムに依存する。
オフィス環境など、使用されている光源が有限種類に限定できる場合には、照明光源としてそれら全てを仮定し、仮定した照明光源の分光スペクトルのすべてに直交する空間をG(λ)としてもよい。
以上の原理は、線形な入出力特性をもつ撮影装置からの出力信号に対しても同様に成り立つ。まず、各光源を単独に点灯させた状態で標準白色板のマルチバンド画像(バンド数:N≧3、波長選択性の強いカラーフィルタを複数用いた場合の画像に相当する)を撮影し、i番目の光源下における画像の信号値を正規化したものW=[W(1),・・・,W(N)]を、照明分光の分光スペクトルE(λ)の代わりに用いる。次に被写体のマルチバンド画像を撮影する。なお、撮影装置は標準白色板の撮影時と同じものを使用する。分光スペクトルが異なるl個の照明光源で被写体を照明する場合を考える。画像上の1画素には被写体表面のある1点からの反射光が記録されると仮定すると、nバンド目の画像上のある1画素の画素値c(n)は次のように表される。
Figure 0004349568
(n)はi番目の照明光源下で白色板の画素値を正規化したもの、D'(n)とk'(n)W(n)はi番目の照明光源のみで被写体を照明したときの拡散反射成分と鏡面成分、
k'(n)は鏡面反射成分の強度を表す係数である。全てのWに直交するベクトルG'=[G'(1),・・・,G'(N)]を求め、c=[c(1),・・・,c(N)]をG'へ投影することにより、鏡面反射成分を含まない成分P'=[P'(1),・・・,P'(N)]が得られる。
Figure 0004349568
以上の処理を画像中の全画素に対して行うことで、鏡面反射成分を含まない鏡面反射除去画像が得られる。なお、得られる画像は拡散成分の画像とは異なる。その画素値はG'に依存し、負の値にもなる。
上記のように求められた照明光スペクトルに直交する成分P(λ)、もしくはP'を用いて認識処理を行うことにより、鏡面反射成分の影響を受けない、照明変化に対して頑健な物体認識が可能となる。
さらに、得られた成分P(λ)、もしくはP’の各画素値を、そのパワーで正規化(例えば、P(λ)/|P(λ)|)して、照明条件に依存しない鏡面反射成分の除去された画像(照明不変画像)を生成し、この画像を用いて認識処理を行ってもよい。
次に、入力画像の分光放射輝度を照明光成分で割り、総合反射率画像を生成し(照明光スペクトルを用いて物体表面の各画素における見かけの反射率を算出)、総合反射率画像をベクトルU(λ)=[1,1,…,1]を法線に持つ超平面に投影することで、鏡面反射除去画像を得る原理について説明する。ここでも、分光スペクトルを入力とする場合について述べる。
一つの点光源で被写体を照明する場合について考える。ある方向から被写体を観察した際に観測される、物体表面の1点xからの反射光の分光放射輝度(反射光スペクトル)I(x,λ)は、標準2色反射モデルが仮定できる場合、(10)式で表わされる。これは、先の(1)式と基本的に同じ式である(先の(1)式は位置座標xを省略した簡略式)。
Figure 0004349568
xは物体表面の位置座標(x=[x,y,z])、λは波長、I(x,y)は拡散反射成分、I(x,λ)は鏡面反射成分、E(λ)は照明光の分光スペクトル、D(x)は拡散反射成分の明るさ、f(x,λ)は拡散反射率、S(x)は鏡面反射の強度である。
ここで、総合反射率画像F(x,λ)を
Figure 0004349568
とし、F(x,λ)を、ベクトルU(λ)を法線にもつ超平面に投影し、U(λ)に直交する成分P(x,λ)を次のように求める。
Figure 0004349568
これにより、P(x,λ)は物体の拡散反射率f(x,λ)のみに依存することが分かる。また、f(x,λ)は、照明光に依存しない物体固有の関数であるため、入力画像と照合用画像とで撮影時の照明の種類が異なる場合でも、P(x,λ)は分光スペクトル空間内内で同じ方向を指す(P(x,λ)を正規化したものが等しくなる)。なお、P(x,λ)の正規化はP(x,λ)/|P(x,λ)|で求まる。
本発明によれば、鏡面反射により隠れているテクスチャ等の可視化が実現でき、入力画像と蓄積画像(照合用画像)の比較を行う際に、鏡面反射による認識精度の低下を抑制することができる。したがって、例えば、複数の照明光源が存在するオフィス環境や、窓のある部屋、また蓄積画像撮影時とは異なる照明環境での物体認識が容易となる。また、照明光スペクトルを用いて物体表面(各画素)における見かけの反射率を算出し、得られた結果をベクトルU(λ)=[1,1,…,1](全ての成分の値が同じ)を法線とする超平面に投影し、鏡面反射成分の除去された画像を用いることにより、入力画像と照合用画像とで撮影時の照明の種類(分光スペクトル)が異なる場合でも、画素値ごとの単純な比較による照合が可能になる。
以下、本発明の一実施の形態について図面により説明する。
図1は、本発明の一実施の形態に係る物体認識システムの概略構成図を示す。物体認識装置1は、例えばパソコンなどのコンピュータで構成し、撮影装置であるデジタルCCDカメラ2の露光時間および画像取り込み、物体認識等の処理を制御する。また、取り込まれた画像は、物体認識装置1の内部に記憶される。該物体認識装置1には、あらかじめ照合用として撮影されている画像やその撮影時における照明光成分、鏡面反射除去画像等が蓄積されている。被写体3の撮影結果、鏡面反射除去画像および物体認識処理の結果等は結果表示用モニタ4に表示される。照明光源群5は、分光スペクトルが異なる複数の光源により構成されており、図示しない照明制御装置により、点灯、消灯を独立に制御できるようになっている。なお、物体認識装置1が照明制御装置を兼ねてもよい。白色板6の画像はデジタルCCDカメラ2により撮影され、各光源の照明光成分の算出に用いられる。
図2は、本発明における物体認識装置1の一実施例を示す全体構成図である。本物体認識装置1は、撮影装置の入力、出力特性を計測する撮影装置特性計測部11、照明光源の照明光成分を取得する照明光情報取得部12、撮影装置により撮影される入力画像を取り込む画像取込部13、入力画像から鏡面反射成分を含まない鏡面反射除去画像を生成する鏡面反射除去部14、あらかじめ照合用として撮影されている画像やその撮影時における照明光成分、さらに鏡面反射除去画像等を蓄積している画像等蓄積部(照合画像データベース)15、鏡面反射除去画像を照合用画像と照合して認識処理を行う画像解析部(画像認識部)16、物体認識結果、あるいは入力画像とその鏡面反射除去画像、さらには蓄積されている画像やその鏡面反射除去画像の一部あるいは全部の表示を制御する画像表示制御部17で構成される。
図3に、物体認識装置1の全体的処理フロー図を示す。撮影装置特性計測部11では、あらかじめ撮影装置であるデジタルCCDカメラ2の入力、出力特性を計測しておく(S1001)。計測結果の撮影装置特性データは照明光情報取得部12および画像取込部13に送られる。
照明光情報取得部12では、デジタルCCDカメラ2において撮影された白色板6の画像を取り込み、撮影装置特性データを参照して信号値の変換を行い(γ補正処理)、規格化された信号値から照明光成分を取得し、記憶しておく(S1002)。この照明光成分は鏡面反射除去部14に送られる。
画像取込部13では、デジタルCCDカメラ2において撮影された被写体3の画像を取り込み、撮影装置特性データを参照して信号値の変換を行い(γ補正処理)、規格化された入力画像を出力する(S1003)。ここで、デジタルCCDカメラ2により取り込まれる入力画像には、鏡面反射成分に関する明るさおよび色の情報が記録されている。
鏡面反射除去部14では、入力画像の分光放射輝度を照明光成分で割り、総合反射率画像を生成し、この総合反射率画像を、ベクトル[1,1,…,1]を法線に持つ超平面に投影することで、鏡面反射除去画像を得る(S1004)。
画像解析部16では、鏡面反射除去部14で得られた鏡面反射除去画像を用い、該鏡面反射除去画像と画像等蓄積部15にあらかじめ蓄積されている照合用画像とを照合することで、認識処理を行い、画像中の物体の認識結果を出力する(S1005)。ここで、照合用画像としては、あらかじめ撮影されて画像等蓄積部15に蓄積されている画像(蓄積画像)、あるいはその鏡面反射除去画像が用いられる。
画像表示制御部17では、画像解析部16で得られた物体認識結果を結果表示用モニタ2に表示する(S1006)。画像表示制御部17では、この時、物体認識結果と共に入力画像、鏡面反射除去画像等を表示してもよい。
なお、図2の構成図では必要な矢印は省略したが、鏡面反射除去部14では、画像蓄積部15からも蓄積画像の照明光成分データを入力して、これと照明光情報取得部12からの照明光成分データとを用いて、入力画像と蓄積画像共通の投影空間を求めて、鏡面反射除去画像を得ることも可能である。この場合、算出された投影空間データは画像等蓄積部15に送る。画像等蓄積部15では、照合用画像に蓄積画像の鏡面反射除去画像を用いる場合、例えば、鏡面反射除去部14で算出された投影空間データを用いて、蓄積画像の鏡面反射除去画像を生成し、その結果を照合用画像として画像解析部16へ送るようにする。
図4に、物体認識装置1の他の処理フロー図を示す。図4において、S2001〜S2004までは図3のS1001〜S1004と同じである。図4では、鏡面反射除去部14において入力画像の鏡面反射除去画像が得られたならば(S2005)、画像解析部16での画像認識処理は行わず、画像表示制御部17は、入力画像およびその鏡面反射除去画像、さらには画像等蓄積部15の画像等を結果表示用モニタ4に表示して、認識は人間により視覚的な判別にゆだねるものである(S2005)。この場合、画像解析部(画像認識部)16は省略でき、物体認識装置の構成が簡単化される。
なお、画像等蓄積部15に対して、あらかじめ照合用の画像やその撮影時における照明光成分、鏡面反射除去画像等を蓄積する場合の動作は、基本的に図3の処理フロー図で説明したと同様であるので、説明は省略する。
次に、図2に示した物体認識装置1の各部の構成、動作について説明する。
撮影装置特性計測部11では、例えば図11に示す方法により、あらかじめデジタルCCDカメラ2の入力、出力の特性を計測する。なお、対象のデジタルCCDカメラ2のホワイトバランス、ゲイン、γ値などの自動補正機能はOFFにしておく。まず、CRT等の表示装置に明るさが既知である白色を表示し、それをデジタルCCDカメラ2で撮影する。次に、表示した白色の明るさを変化させ、再び画像を撮影する。この作業を数回繰り返し、撮影装置(デジタルCCDカメラ)への入力光の明るさと、出力信号値との関係を計測する。そして、この計測結果を基に、撮影装置からの出力信号値から入力光の明るさを推定する撮影装置特性データとしての変換式(多項式近似あるいは変換テーブル)を求める(図12参照)。
図5に照明光情報取得部12の構成例を示す。照明光情報取得部12は、照明光取込部121、規格化処理部122、正規化処理部123、照明光成分蓄積部124から構成される。デジタルCCDカメラ2において撮影された白色板6の画像(照明光)は照明光情報取込部121で取込まれ、規格化処理部122において、撮影装置特性計測部11からの撮影装置特性データを参照して信号値の変換が行われ(γ補正処理)、規格化された信号値を得る。更に正規化処理部124において、パワーが1になるように正規化処理が行われ、その結果を照明光成分として照明光成分蓄積部125に蓄積する。照明制御装置7は、白色板6の画像撮影時に点灯している照明光源が1つのみとなるよう照明光源群5の照明を制御する。この処理を全ての照明光源に対して行い、得られた複数の照明光成分のデータが照明光成分蓄積部125に蓄積され、鏡面反射除去部14へ送られる。なお、照明光情報取得部12では、有限種類の一般的に用いられている照明光源の照明光成分をあらかじめ計測しておいて照明光成分蓄積部124に蓄積しておくことでもよい。
図6に画像取込部13の構成例を示す。画像取込部13は、規格化処理部131から構成される。デジタルCCDカメラ2において撮影された被写体3の入力画像は、規格化処理部131において、撮影装置特性計測部11からの撮影装置特性データを参照にした信号値の変換により(γ補正処理)、規格化された画像となり鏡面反射除去部14へ送られる。この規格化画像には、光沢び鏡面反射成分に関する明るさおよび色の情報が含まれている。
図7に鏡面反射除去部14の第1の構成例を示す。これは、入力画像を照明光成分に直交する空間に投影することで、鏡面反射除去画像を得る場合の構成例である。本鏡面反射除去部14は、投影空間算出部141、投影演算処理部142から構成される。投影空間算出部141では照明光情報取得部12で得られた全ての照明光成分に直交する空間(投影空間データ)を算出する。投影演算処理部142では、その結果に基づき、画像取込部13において得られた規格化後の入力画像の各画素の信号値を投影空間へ投影し、鏡面反射成分を除去する。この処理を全ての画素に関して行うことで、鏡面反射除去画像が得られる。
先に述べたように、該鏡面反射除去部14では、画像等蓄積部15からの蓄積画像の照明光成分データと、照明光情報取得部12で取られた人力画像撮影時の照明光成分データを用いて、投影空間算出部141にて入力画像と蓄積画像共通の投影空間データを算出し、投影演算処理部142にて、画像取込部13において得られた規格化後の入力画像の各画素の信号値を該投影空間へ投影し、鏡面反射成分を除去することでもよい。投影空間算出部141で算出された入力画像と蓄積画像共通の投影空聞データは、画像等蓄積部15にも送られる。
なお、図7では省略したが、投影演算処理部142の出力側に正規化処理部を設け、投影演算処理部142で得られた鏡面反射除去画像の各画素値をそのパワーで正規化するようにしてもよい。これにより、照明条件に依存しない鏡面反射除去画像(照明不変画像)が得られる。
図8に鏡面反射除去部14の第2の構成例を示す。これが、入力画像の分光放射輝度を照明光成分で割って総合反射率画像を生成し、この総合反射率画像を、ベクトルU(λ)=[1,1,…,1]を法線に持つ超平面に投影することで、鏡面反射除去画像を得る場合の本発明の構成例である。本鏡面反射除去部14は、法線ベクトル設定部143、総合反射率画像生成部144、投影演算処理部145から構成される。法線ベクトル設定部143は、あらかじめベクトルU(λ)=[1,1,…,1]を保持している。ベクトルの次元(要素数)Nは、取得する画像の色成分に対応し、例えば、色成分が3の場合はN=3で、U(λ)=[1,1,,1]となる。総合反射率画像生成部144では、照明光情報取得部12で得られた照明光成分データ群と画像取込み部13において得られた入力画像から総合反射率画像を生成する。すなわち、照明光スペクトルを用いて、入力画像の各画素における見かけの反射率を算出する。投影演算処理部145では、法線ベクトル設定部143からベクトル[1,1,…,1]を入力し、該ベクトルを法線に持つ超平面に、総合反射率画像生成部144で得られた総合反射率画像の各画素の信号値(画素値)を投影し、鏡面反射成分を除去する。この処理を全ての画素に関して行うことで、入力画像から鏡面反射成分の除去された鏡面反射除去画像が得られる。
なお、図8でも省略したが、投影演算処理部145の出力側に正規化処理部を設け、投影演算処理部142で得られた鏡面反射除去画像の各画素値をそのパワーで正規化するようにしてもよい。これにより、照明条件に依存しない鏡面反射除去画像(照明不変画像)が得られる。
図9に画像等蓄積部(照合画像データベース)15の第1の構成例を示す。本画像等蓄積部15は照明光成分蓄積部151、規格化画像蓄積部152、鏡面反射除去画像蓄積部153から構成される。規格化画像蓄積部152及び鏡面反射除去画像蓄積部153には、あらかじめ照合用としてデジタルCCDカメラ2で撮影された全ての画像について、画像取込部13及び鏡面反射除去部14で算出された規格化画像及び鏡面反射除去画像がそれぞれ蓄積されている。照明光成分蓄積部151には、この照合用の画像の撮影時における照明光源の照明光成分データが照明光情報取得部12から送られて蓄積されている。この規格化画像蓄積部152の規格化画像及び/又は鏡面反射除去画像蓄積部153の鏡面反射除去画像が照合用画像として画像解析部16に送られる。
図10に画像等蓄積部15の第2の構成例を示す。本画像等蓄積部15は、照明光成分蓄積部151、規格化画像蓄積部152、投影空間算出部154、投影演算処理部155から構成される。照明光成分蓄積部151、規格化画像蓄積部152は図9と同じである。図10は、鏡面反射除去画像蓄積部153をなくして、当該画像等蓄積部15自体で照合用画像としての鏡面反射除去画像を生成するものである。必要な投影空間データは当該画像等蓄積部15自体で同様に算出するか、あるいは鏡面反射除去部14から送られたものを利用する。すなわち、規格化画像蓄積部152の各規格化画像に対応する照明光成分蓄積部151内の照明光成分から、投影空間算出部154にて投影空間データを算出し、投影演算処理部155にて、規格化画像蓄積部152の各規格化画像(蓄積画像)の鏡面反射除去画像を算出し、これを照合用画像とする。もしくは、照明光成分蓄積部151内の照明光成分データを鏡面反射除去部14へ送り、得られた入力画像と蓄積画像共通の投影空間データを用いて、投影演算処理部154にて規格化画像蓄積部152の各規格化画像(蓄積画像)の鏡面反射除去画像を算出し、これを照合用画像とする。
一般には、図9及び図10で説明した照合用画像のいずれか、あるいは全部を照合用画像とすることができる。
図11に画像解析部16の構成例を示す。画像解析部16は、基本的に画像照合部161から構成される。画像照合部161にて、鏡面反射除去部14からの鏡面反射除去画像と、画像等蓄積部15からの照合用画像の照合を行い、物体の認識結果を得る。なお、画像解析部16では、必要に応じて、画像等蓄積部15からの照合用画像との照合処理を行わずに、鏡面反射除去部14からの鏡面反射除去画像を解析して認識結果を得るようにしてもよい。
画像表示制御部17は、画像解析部15からの物体の認識結果を結果表示用モニタ2に表示する。該表示制御部17の構成図は省略する。先にも述べたように、表示制御部17では、画像取込部13と鏡面反射除去部14からの入力画像およびその鏡面反射除去画像並びに画像等蓄積部15からの蓄積画像およびその鏡面反射除去画像(照合用画像)、もしくは上記入力画像およびその鏡面反射除去画像のみを結果表示用モニタ4に表示し、人間により視覚的な判別を行うようにすることもできる。
以上、本発明の一実施形態を説明したが、図2で示した物体認識装置における各部の一部もしくは全部の処理機能をコンピュータのプログラムで構成し、そのプログラムをコンピュータを用いて実行して本発明を実現することができること、あるいは、図3や図4で示した処理手順をコンピュータのプログラムで構成し、そのプログラムをコンピュータを用いて実行させることができることは言うまでもない。また、コンピュータでその処理機能を実現させるためのプログラム、あるいは、コンピュータにその処理手順を実行させるためのプログラムを、そのコンピュータが読み取り可能な記録媒体、例えば、FDやMO、ROM、メモリーカード、CD、DVD、リムーバブルディスクなどに記録して、保存したり、提供したりすることができるとともに、インターネット等のネットワークを通してそのプログラムを配布したりすることが可能である。
本発明の物体認識技術は、ロボットによる物体探索や物体認識、物体の形状推定、文字認識、データベース上の画像検索、内視鏡画像でのテクスチャ解析等に応用が可能である。
本発明の一実施形態に係る物体認識システムの概略構成図である。 本発明における物体認識装置の全体構成例を示す図である。 図2の全体的処理フロー(その一)を示す図である。 図2の全体的処理フロー(その二)を示す図である。 照明光情報取得部の詳細構成を示す図である。 画像取得部の詳細構成を示す図である。 鏡面反射除去部の詳細構成(その一)を示す図である。 鏡面反射除去部の詳細構成(その二)を示す図である。 画像等蓄積部の詳細構成(その一)を示す図である。 画像等蓄積部の詳細構成(その二)を示す図である。 画像解析部の詳細構成を示す図である。 撮影装置の入出力特性の計測を説明する図である。 鏡面反射成分除去の原理を説明する図である。
符号の説明
1 物体認識装置
2 デジタルCCDカメラ
3 被写体
4 結果表示用モニタ
5 照明光源群
6 白色板
7 照明制御装置
11 撮影装置特性計測部
12 照明光情報取得部
13 画像取込部
14 鏡面反射除去部
15 画像等蓄積部
16 画像解析部
17 画像表示制御部
S1001、S2001 撮影装置特性計測ステップ
S1002、S2002 照明光成分計測ステップ
S1003、S2003 画像取込みステップ
S1004、S2004 鏡面反射成分除去ステップ
S1005 画像解析ステップ
S1006 認識結果等表示ステップ
S2005 入力画像、鏡面反射除去画像等表示ステップ

Claims (14)

  1. 対象物の画像である入力画像から鏡面反射成分を除去した鏡面反射除去画像と予め撮影された対象物の画像である蓄積画像とを照合することにより、対象物の認識を行う物体認識装置であって、
    前記入力画像の撮影時の照明光源の照明光成分を取得する照明光情報取得手段と、
    撮影装置により撮影された入力画像と前記対象物の表面からの反射光の分光放射輝度とを取り込む画像取込手段と、
    前記予め撮影されている対象物の画像である蓄積画像と、前記蓄積画像の撮影時の照明光成分とを、少なくとも蓄積する蓄積手段と、
    前記対象物の表面からの反射光の分光放射輝度を前記照明光情報取得手段で取得した照明光成分で割って総合反射率画像を生成し、該総合反射率画像の信号値を、ベクトルU(λ)=[1,1,…,1](λは波長)を法線とする超平面に投影することにより、前記入力画像から鏡面反射成分を除去した鏡面反射除去画像を生成する鏡面反射除去手段と、
    を有することを特徴とする物体認識装置。
  2. 請求項1に記載の物体認識装置において、前記鏡面反射除去画像と前記蓄積手段に蓄積された蓄積画像とを照合する画像解析手段を更に有することを特徴とする物体認識装置。
  3. 請求項1乃至2に記載の物体認識装置において、前記入力画像と当該入力画像の鏡面反射除去画像、または、前記入力画像と当該入力画像の鏡面反射除去画像および前記蓄積画像とあらかじめ生成して当該蓄積画像と共に蓄積されている当該蓄積画像の鏡面反射除去画像とを表示する画像表示制御手段を更に有することを特徴とする物体認識装置。
  4. 請求項1乃至3のいずれか1項に記載の物体認識装置において、あらかじめ撮影装置の入力及び出力特性を計測する撮影装置特性計測手段を更に備え、前記画像取込手段では、前記撮影装置特性計測手段の計測結果である撮影装置の入出力特性を基に規格化された画像を得ることを特徴とする物体認識装置。
  5. 請求項1乃至3のいずれか1項に記載の物体認識装置において、前記鏡面反射除去手段では、全ての照明光源に関する照明光成分を入力画像から除去することにより、鏡面反射成分を含まない鏡面反射除去画像を生成することを特徴とする物体認識装置。
  6. 請求項1乃至3のいずれか1項に記載の物体認識装置において、有限種類の一般的に用いられている照明光源の照明光成分をあらかじめ蓄積しておく照明光成分蓄積手段を備え、前記鏡面反射除去手段では、前記蓄積された照明光成分を用いて鏡面反射除去画像を得ることを特徴とする物体認識装置。
  7. 対象物の画像である入力画像から鏡面反射成分を除去した鏡面反射除去画像と予め撮影された対象物の画像である蓄積画像とを照合することにより、対象物の認識を行う物体認識方法であって、
    前記入力画像の撮影時の照明光源の照明光成分を取得する照明光情報取得ステップと、
    撮影装置により撮影された入力画像と前記対象物の表面からの反射光の分光放射輝度とを取り込む画像取込ステップと、
    前記予め撮影されている対象物の画像である蓄積画像と、前記蓄積画像の撮影時の照明光成分とを、少なくとも蓄積手段に蓄積する蓄積制御ステップと、
    前記対象物の表面からの反射光の分光放射輝度を前記照明光情報取得ステップで取得した照明光成分で割って総合反射率画像を生成し、該総合反射率画像の信号値を、ベクトルU(λ)=[1,1,…,1](λは波長)を法線とする超平面に投影することにより、前記入力画像から鏡面反射成分を除去した鏡面反射除去画像を生成する鏡面反射除去ステップと、
    を有することを特徴とする物体認識方法。
  8. 請求項7に記載の物体認識方法において、
    前記鏡面反射除去画像と前記蓄積手段に蓄積された蓄積画像とを照合する画像解析ステップを更に有することを特徴とする物体認識方法。
  9. 請求項7乃至8に記載の物体認識方法において、前記入力画像と当該入力画像の鏡面反射除去画像、または、前記入力画像と当該入力画像の鏡面反射除去画像および前記蓄積画像とあらかじめ生成して当該蓄積画像と共に蓄積されている当該蓄積画像の鏡面反射除去画像を表示手段に表示する画像表示制御ステップを更に有することを特徴とする物体認識方法。
  10. 請求項7乃至9のいずれか1項に記載の物体認識方法において、あらかじめ撮影装置の入力及び出力特性を計測する撮影装置特性計測ステップを更に備え、前記画像取込ステップでは、前記撮影装置特性計測ステップの計測結果である撮影装置の入出力特性を基に規格化された画像を得ることを特徴とする物体認識方法。
  11. 請求項7乃至9のいずれか1項に記載の物体認識方法において、前記鏡面反射除去ステップでは、全ての照明光源に関する照明光成分を入力画像から除去することにより、鏡面反射成分を含まない鏡面反射除去画像を生成することを特徴とする物体認識方法。
  12. 請求項7乃至9のいずれか1項に記載の物体認識方法において、有限種類の一般的に用いられている照明光源の照明光成分をあらかじめ蓄積手段に蓄積しておく照明光成分蓄積制御ステップを更に有し、前記鏡面反射除去ステップでは、前記蓄積された照明光成分を用いて鏡面反射除去画像を得ることを特徴とする物体認識方法。
  13. コンピュータを請求項1乃至6のいずれか1項に記載の物体認識装置として機能させるためのプログラム。
  14. コンピュータを請求項1乃至6のいずれか1項に記載の物体認識装置の各手段として機能させるためのプログラムを記録したコンピュータ読取り可能な記録媒体。
JP2003387151A 2003-08-04 2003-11-17 物体認識装置、物体認識方法、プログラム及び記録媒体 Expired - Fee Related JP4349568B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003387151A JP4349568B2 (ja) 2003-08-04 2003-11-17 物体認識装置、物体認識方法、プログラム及び記録媒体

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2003285714 2003-08-04
JP2003387151A JP4349568B2 (ja) 2003-08-04 2003-11-17 物体認識装置、物体認識方法、プログラム及び記録媒体

Publications (2)

Publication Number Publication Date
JP2005070026A JP2005070026A (ja) 2005-03-17
JP4349568B2 true JP4349568B2 (ja) 2009-10-21

Family

ID=34425136

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003387151A Expired - Fee Related JP4349568B2 (ja) 2003-08-04 2003-11-17 物体認識装置、物体認識方法、プログラム及び記録媒体

Country Status (1)

Country Link
JP (1) JP4349568B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4917959B2 (ja) * 2007-05-09 2012-04-18 日本電信電話株式会社 知覚的な鏡面・拡散反射画像推定方法とその装置、及びプログラムと記憶媒体
JP5058838B2 (ja) * 2008-02-01 2012-10-24 キヤノン株式会社 情報処理装置および方法
JP5009865B2 (ja) * 2008-06-16 2012-08-22 日本電信電話株式会社 画像変換装置、画像変換方法、画像変換プログラム及び画像変換プログラムを記録したコンピュータ読み取り可能な記録媒体
EP2590140A1 (en) * 2011-09-05 2013-05-08 Morpho, Inc. Facial authentication system, facial authentication method, and facial authentication program
JP5928076B2 (ja) * 2012-03-28 2016-06-01 セイコーエプソン株式会社 分析方法、撮像装置
CN103413318B (zh) * 2013-08-27 2016-03-02 北京航空航天大学 靶标球镜面中心定位方法
WO2020145023A1 (ja) * 2019-01-10 2020-07-16 コニカミノルタ株式会社 光学特性解析装置及びプログラム

Also Published As

Publication number Publication date
JP2005070026A (ja) 2005-03-17

Similar Documents

Publication Publication Date Title
JP3767541B2 (ja) 光源推定装置、光源推定方法、撮像装置および画像処理方法
US8705815B2 (en) Systems and methods for automatic skin-based identification of people using digital images
US9134121B2 (en) Determining material properties using speckle statistics
JP2002279416A (ja) 色補正方法および色補正装置
JP2009508648A (ja) デジタル画像を用いて人の皮膚状態を分析するためのシステム及び方法
JP2008529170A (ja) 照明および反射境界の区別
JP5340907B2 (ja) 情報処理装置、情報処理方法、および、プログラム
JP2009134383A (ja) 画像処理装置および方法、並びにプログラム
JP4974599B2 (ja) 顕微鏡用カラー撮像装置、顕微鏡用カラー撮像プログラムおよび顕微鏡用カラー撮像方法
JP2006084425A (ja) マルチスペクトル画像処理方法及びマルチスペクトル皮膚画像による診断方法
JP2014027597A (ja) 画像処理装置、物体識別装置、及びプログラム
JP4349568B2 (ja) 物体認識装置、物体認識方法、プログラム及び記録媒体
US20110304820A1 (en) Method and device for imaging a target
JP4415446B2 (ja) 測色画像変換方法及び測色画像変換装置並びに測色画像変換プログラムを記録したコンピュータ読み取り可能な情報記録媒体
JP4756148B2 (ja) 光沢・色再現システム、光沢・色再現プログラム
JP2001311666A (ja) 測色変換係数算出方法と測色画像変換方法、及び、測色変換係数算出装置と測色画像変換装置、並びに、測色変換係数算出プログラム又は測色的撮像プログラムを記録したコンピュータ読み取り可能な情報記録媒体
JP4529210B2 (ja) 測色変換係数算出方法と測色画像変換方法、及び、測色変換係数算出装置と測色画像変換装置、並びに、測色変換係数算出プログラム又は測色的撮像プログラムを記録したコンピュータ読み取り可能な情報記録媒体
JP4378810B2 (ja) 測色変換係数算出方法と測色的撮像方法、および測色変換係数算出装置と測色的撮像装置、並びに測色変換プログラムを記録したコンピュータ読み取り可能な情報記録媒体
JP2009258770A (ja) 画像処理方法、画像処理装置、画像処理プログラム、撮像装置
CN114972547A (zh) 用于确定牙齿颜色的方法
JP2002157588A (ja) 画像データ処理方法及び装置と該方法を実行するためのプログラムを記録した記録媒体
JP2011095110A (ja) 光源推定装置および光源推定方法
JP6317703B2 (ja) 画像処理装置、画像処理システム、画像処理方法、及び画像処理プログラム
WO2024075181A1 (ja) 情報処理装置、判定方法、及び判定プログラム
Brogle Incorporating High Dynamic Range into Multispectral Imaging for Cultural Heritage Documentation

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060406

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081001

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090225

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090413

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090715

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090716

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120731

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130731

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees