JP5041229B2 - 学習装置および方法、認識装置および方法、並びにプログラム - Google Patents

学習装置および方法、認識装置および方法、並びにプログラム Download PDF

Info

Publication number
JP5041229B2
JP5041229B2 JP2007316636A JP2007316636A JP5041229B2 JP 5041229 B2 JP5041229 B2 JP 5041229B2 JP 2007316636 A JP2007316636 A JP 2007316636A JP 2007316636 A JP2007316636 A JP 2007316636A JP 5041229 B2 JP5041229 B2 JP 5041229B2
Authority
JP
Japan
Prior art keywords
feature
learning
image
target object
discriminator
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007316636A
Other languages
English (en)
Other versions
JP2009140283A (ja
Inventor
順 横野
雄一 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2007316636A priority Critical patent/JP5041229B2/ja
Priority to EP08253672A priority patent/EP2068271A3/en
Priority to US12/328,318 priority patent/US20090202145A1/en
Priority to CN2008101829149A priority patent/CN101458764B/zh
Publication of JP2009140283A publication Critical patent/JP2009140283A/ja
Application granted granted Critical
Publication of JP5041229B2 publication Critical patent/JP5041229B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/806Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Description

本発明は学習装置および方法、認識装置および方法、並びにプログラムに関し、特に、画像からより確実に対象物体を検出できるようにした学習装置および方法、認識装置および方法、並びにプログラムに関する。
従来、画像から人を検出する技術は、主にセキュリティや車載用途のために研究開発されてきた(例えば、非特許文献1乃至6参照)。
非特許文献2乃至非特許文献6においては、画像から人を検出(認識)するための主な特徴量として、エッジ抽出により得られる輪郭特徴量が用いられている。より詳細には、これらの技術においては、エッジ抽出で得られた輪郭特徴量の様々な変化形が新たな特徴量として定義されて、人の認識が行われる。
例えば、非特許文献3では、エッジのある小領域内の方向のヒストグラムをとることで特徴量が得られ、この特徴量を用いることで多少の輪郭の歪みなどに強くなるという利点がある。また、非特許文献5では、エッジの小領域の教師画像を用いた学習と、教師画像を用いて、エッジの小領域を階層的に学習したモデルが提案されている。
さらに、非特許文献2では、Gaussian Derivativesを用いた輪郭特徴量により、人の体の各パーツが表現されている。さらに、また、非特許文献6では、エッジのグローバルテンプレートが用いられて人の認識が行われている。
Papageorgiou, C., M. Oren, and T. Poggio. 「A General Framework for Object Detection」 Proceedings of the Sixth International Conference on Computer Vision (ICCV'98), Bombay, India, 555-562, January 1998 K. Mikolajczyk, C. Schmid, and A. Zisserman「Human detection based on a probabilistic assembly of robust part detectors」Proc. ECCV, 1:69.81, 2004 Navneet Dalal and Bill Triggs「Histograms of Oriented Gradients for Human Detection」CVPR2005 B. Wu and R. Nevatia「Detection of multiple, partially occluded humans in a single image by bayesian combination of edgelet part detectors」In Proc. 10th Int. Conf. Computer Vision, 2005 Payam Sabzmeydani and Greg Mori「Detecting Pedestrians by Learning Shapelet Features」CVPR2007 S.Munder and D.Gavrilla「An Experimental Study on Pedestrian Classification」
しかしながら、上述した技術では、輪郭により画像中の人を認識しようとすると、画像から輪郭がうまく抽出できない場合や、背景周辺に輪郭が多数抽出される場合に、人の不検出または誤検出が生じるという欠点があった。
本発明は、このような状況に鑑みてなされたものであり、画像からより確実に対象物体を検出することができるようにするものである。
本発明の第1の側面の学習装置は、認識対象の対象物体が含まれている学習画像と、前記対象物体が含まれていない学習画像とからなる複数の学習画像のそれぞれについて、前記学習画像上の予め定められた複数の画素のうちの所定の画素と、前記複数の画素のうちの前記所定の画素とは異なる他の画素とを画素のペアとして、前記所定の画素を含む領域と、前記他の画素を含む領域とのテクスチャの距離を計算することで、前記複数の画素のそれぞれを前記所定の画素として定めた各前記ペアの第1の特徴量を計算する第1の特徴量計算手段と、複数の前記第1の特徴量を用いた統計学習により、画像から前記対象物体を検出する第1の識別器を生成する第1の識別器生成手段とを備える。
学習装置には、前記複数の学習画像のそれぞれについて、前記学習画像に対するフィルタ処理を行なうことで前記学習画像から輪郭を抽出する計算を行い、その計算結果から第2の特徴量を生成する第2の特徴量計算手段と、複数の前記第2の特徴量を用いた統計学習により、前記画像から前記対象物体を検出する第2の識別器を生成する第2の識別器生成手段と、前記第1の識別器と、前記第2の識別器とを統合して、前記画像から前記対象物体を検出する第3の識別器を生成する第3の識別器生成手段とをさらに設けることができる。
前記第3の識別器生成手段には、前記第1の識別器と前記第2の識別器とを線形結合することにより前記第3の識別器を生成させることができる。
学習装置には、前記複数の学習画像のそれぞれについて、前記学習画像に対するフィルタ処理を行なうことで前記学習画像から輪郭を抽出する計算を行い、その計算結果から第2の特徴量を生成する第2の特徴量計算手段をさらに設け、前記第1の識別器生成手段には、複数の前記第1の特徴量、および複数の前記第2の特徴量を用いた統計学習により、前記第1の識別器を生成させることができる。
本発明の第1の側面の学習方法またはプログラムは、認識対象の対象物体が含まれている学習画像と、前記対象物体が含まれていない学習画像とからなる複数の学習画像のそれぞれについて、前記学習画像上の予め定められた複数の画素のうちの所定の画素と、前記複数の画素のうちの前記所定の画素とは異なる他の画素とを画素のペアとして、前記所定の画素を含む領域と、前記他の画素を含む領域とのテクスチャの距離を計算することで、前記複数の画素のそれぞれを前記所定の画素として定めた各前記ペアの特徴量を計算する特徴量計算ステップと、複数の前記特徴量を用いた統計学習により、画像から前記対象物体を検出する識別器を生成する識別器生成ステップとを含む。
本発明の第1の側面においては、認識対象の対象物体が含まれている学習画像と、前記対象物体が含まれていない学習画像とからなる複数の学習画像のそれぞれについて、前記学習画像上の予め定められた複数の画素のうちの所定の画素と、前記複数の画素のうちの前記所定の画素とは異なる他の画素とが画素のペアとされて、前記所定の画素を含む領域と、前記他の画素を含む領域とのテクスチャの距離が計算されることで、前記複数の画素のそれぞれを前記所定の画素として定めた各前記ペアの第1の特徴量が計算され、複数の前記第1の特徴量を用いた統計学習により、画像から前記対象物体を検出する第1の識別器が生成される。
本発明の第2の側面の認識装置は、入力画像上の所定の画素と、前記所定の画素とは異なる他の画素とを画素のペアとして、前記所定の画素を含む領域と、前記他の画素を含む領域とのテクスチャの距離を計算することで、予め定められた複数の前記ペアの第1の特徴量を計算する第1の特徴量計算手段と、認識対象の対象物体が含まれている学習画像と、前記対象物体が含まれていない学習画像とから求められた複数の前記第1の特徴量を用いた統計学習により生成された第1の識別器を用い、前記第1の特徴量計算手段により計算された前記第1の特徴量に基づいて、前記入力画像から前記対象物体を検出する検出手段とを備える。
認識装置には、前記入力画像に対するフィルタ処理を行なうことで前記入力画像から輪郭を抽出する計算を行い、その計算結果から第2の特徴量を生成する第2の特徴量計算手段をさらに設け、前記検出手段には、前記対象物体が含まれている学習画像と、前記対象物体が含まれていない学習画像とから求められた複数の前記第2の特徴量を用いた統計学習により生成された第2の識別器と前記第1の識別器とが統合された第3の識別器を用い、前記第1の特徴量計算手段により計算された前記第1の特徴量、および前記第2の特徴量計算手段により計算された前記第2の特徴量に基づいて、前記入力画像から前記対象物体を検出させることができる。
認識装置には、前記入力画像に対するフィルタ処理を行なうことで前記入力画像から輪郭を抽出する計算を行い、その計算結果から第2の特徴量を生成する第2の特徴量計算手段をさらに設け、前記検出手段には、前記対象物体が含まれている学習画像と、前記対象物体が含まれていない学習画像とから求められた複数の前記第2の特徴量と、前記複数の第1の特徴量とを用いた統計学習により生成された前記第1の識別器を用い、前記第1の特徴量計算手段により計算された前記第1の特徴量、および前記第2の特徴量計算手段により計算された前記第2の特徴量に基づいて、前記入力画像から前記対象物体を検出させることができる。
本発明の第2の側面の認識方法またはプログラムは、入力画像上の所定の画素と、前記所定の画素とは異なる他の画素とを画素のペアとして、前記所定の画素を含む領域と、前記他の画素を含む領域とのテクスチャの距離を計算することで、予め定められた複数の前記ペアの特徴量を計算する特徴量計算ステップと、認識対象の対象物体が含まれている学習画像と、前記対象物体が含まれていない学習画像とから求められた複数の前記特徴量を用いた統計学習により生成された識別器を用い、前記特徴量計算ステップにおいて計算された前記特徴量に基づいて、前記入力画像から前記対象物体を検出する検出ステップとを含む。
本発明の第2の側面においては、入力画像上の所定の画素と、前記所定の画素とは異なる他の画素とを画素のペアとして、前記所定の画素を含む領域と、前記他の画素を含む領域とのテクスチャの距離が計算されることで、予め定められた複数の前記ペアの第1の特徴量が計算され、認識対象の対象物体が含まれている学習画像と、前記対象物体が含まれていない学習画像とから求められた複数の前記第1の特徴量を用いた統計学習により生成された第1の識別器が用いられて、計算された前記第1の特徴量に基づいて、前記入力画像から前記対象物体が検出される。
本発明の第1の側面によれば、画像からより確実に対象物体を検出することができる識別器を提供することができる。
また、本発明の第2の側面によれば、画像からより確実に対象物体を検出することができる。
以下、図面を参照して、本発明を適用した実施の形態について説明する。
図1は、本発明を適用した人識別システムの一実施の形態の構成例を示すブロック図である。この人識別システムは、学習装置11、識別器記録部12、および認識装置13からなり、入力された画像における、対象物体として人間の画像のある領域を認識させるものである。
学習装置11は、入力された学習画像に基づいて、認識装置13において画像上における対象物体の有無を識別する処理を行うときに用いられる、識別用特徴量および統合識別器を生成し、識別器記録部12に記録させる。認識装置13は、識別器記録部12に記録されている識別用特徴および統合識別器を用いて、入力された入力画像に対象物体である人の画像が存在するか否かを識別し、その識別結果を出力する。
学習装置11は、服装特徴点抽出部21、服装特徴量計算部22、服装識別器生成部23、輪郭特徴点抽出部24、輪郭特徴量計算部25、輪郭識別器生成部26、および統合識別器生成部27から構成される。
服装特徴点抽出部21は、入力された学習画像から、その学習画像の画素のいくつかを服装識別器を生成するときに用いられる服装特徴点として抽出し、抽出した服装特徴点と学習画像とを服装特徴量計算部22に供給する。ここで、服装識別器とは、統計学習により生成された、複数の弱識別器からなる強い識別器であり、人の服装の特徴を利用して、入力された画像中に人の画像の領域が存在するか否かを識別するときに用いられる。
服装特徴量計算部22は、服装特徴点抽出部21からの各服装特徴点について、その服装特徴点と、他の服装特徴点とを1つのペアとするペアリングを行う。また、服装特徴量計算部22は、服装特徴点抽出部21からの学習画像に基づいて、服装特徴点のペアごとに、任意の2つの領域のテクスチャの距離を示す服装特徴量を計算し、求められた服装特徴量と学習画像とを服装識別器生成部23に供給する。
服装識別器生成部23は、服装特徴量計算部22から供給された学習画像および服装特徴量に基づいて、例えばAdaboostによる統計学習処理を行い、対象物体である人を認識する服装識別器を生成する。また、服装識別器生成部23は、生成した服装識別器を統合識別器生成部27に供給する。
輪郭特徴点抽出部24は、入力された学習画像から、その学習画像の画素のいくつかを輪郭識別器を生成するときに用いられる輪郭特徴点として抽出し、抽出した輪郭特徴点と学習画像とを輪郭特徴量計算部25に供給する。ここで、輪郭識別器とは、統計学習により生成された、複数の弱識別器からなる強い識別器であり、人の輪郭を利用して、入力された画像中に人の画像の領域が存在するか否かを識別するときに用いられる。
輪郭特徴量計算部25は、輪郭特徴点抽出部24からの学習画像に基づいて、例えばステアラブルフィルタ(Steerable Filter)を用いたフィルタ処理により、輪郭特徴点ごとに、抽出された輪郭を示す輪郭特徴量を計算し、求められた輪郭特徴量と学習画像とを輪郭識別器生成部26に供給する。輪郭識別器生成部26は、輪郭特徴量計算部25から供給された学習画像および輪郭特徴量に基づいて、例えばAdaboostによる統計学習処理を行い、対象物体である人を認識する輪郭識別器を生成する。また、輪郭識別器生成部26は、生成した輪郭識別器を統合識別器生成部27に供給する。
統合識別器生成部27は、服装識別器生成部23からの服装識別器と、輪郭識別器生成部26からの輪郭識別器とを統合して統合識別器を生成し、生成した統合識別器を識別器記録部12に供給して記録させる。また、統合識別器生成部27は、統合識別器を用いて対象物体の認識を行うときに用いられる服装特徴点のペアの服装特徴量、および輪郭特徴点の輪郭特徴量を、識別用特徴量として識別器記録部12に供給し、記録させる。
また、認識装置13は、服装特徴点抽出部31、服装特徴量計算部32、輪郭特徴点抽出部33、輪郭特徴量計算部34、識別計算部35、および識別結果出力部36から構成される。なお、認識装置13の服装特徴点抽出部31乃至輪郭特徴量計算部34のそれぞれは、対象物体を認識しようとする入力画像に対して、学習装置11の服装特徴点抽出部21、服装特徴量計算部22、輪郭特徴点抽出部24、および輪郭特徴量計算部25のそれぞれと同様の処理を行うものであるので、その説明は省略する。
識別計算部35は、識別器記録部12に記録されている識別用特徴量および統合識別器を読み出す。また、識別計算部35は、服装特徴量計算部32からの服装特徴量、および輪郭特徴量計算部34からの輪郭特徴量のうちの識別用特徴量に対応するものを、読み出した統合識別器に代入して演算を行う。識別結果出力部36は、識別計算部35における演算結果を取得し、その演算結果に基づいて、対象物体が入力画像で認識されたか否かの識別結果を出力する。
次に、図2を参照して、図1の輪郭特徴量計算部25のより詳細な構成例について説明する。輪郭特徴量計算部25は、1次フィルタ処理部61、2次フィルタ処理部62、3次フィルタ処理部63、および特徴量生成部64から構成される。また、輪郭特徴点抽出部24からの学習画像は、1次フィルタ処理部61乃至特徴量生成部64に供給され、輪郭特徴点は、1次フィルタ処理部61乃至3次フィルタ処理部63に供給される。
1次フィルタ処理部61は、供給された輪郭特徴点ごとに、輪郭特徴点に対してガウス関数Gの1次微分関数G1によりフィルタ処理を施して特徴量を抽出し、特徴量生成部64に供給する。ここで、ガウス関数G、および1次微分関数G1は、次式(1)および式(2)により示される。
Figure 0005041229
Figure 0005041229
なお、式(1)において、σはガウス幅を示しており、また式(2)において、θは任意の角度、つまり計算したいフィルタの方向を示している。
例えば、1次フィルタ処理部61は、ガウス関数Gのガウス幅σを3つの所定値(例えば、ガウス幅σ1,σ2,σ3=1,2,4)に変化させ、ガウス幅σごとに所定の4方向(例えば、θ=θ1,θ2,θ3,θ4)について式(2)を計算する。なお、方向θは4方向に限らず、8方向、例えばpiを8方向に等分したときの各方向などとしてもよい。
2次フィルタ処理部62は、供給された輪郭特徴点ごとに、輪郭特徴点に対してガウス関数Gの2次微分関数G2によりフィルタ処理を施して特徴量を抽出し、特徴量生成部64に供給する。次式(3)は、2次微分関数G2を示しており、式(3)においてθは任意の角度を示している。
Figure 0005041229
また、式(3)における係数k2i(θ)(但し、i=1,2,3)は、次式(4)で示される関数である。
Figure 0005041229
例えば、2次フィルタ処理部62は、ガウス関数Gのガウス幅σを3つの所定値(例えば、ガウス幅σ1,σ2,σ3=1,2,4)に変化させ、ガウス幅σごとに所定の4方向(例えば、θ=θ1,θ2,θ3,θ4)について式(3)を計算する。
3次フィルタ処理部63は、供給された輪郭特徴点ごとに、輪郭特徴点に対してガウス関数Gの3次微分関数G3によりフィルタ処理を施して特徴量を抽出し、特徴量生成部64に供給する。次式(5)は、3次微分関数G3を示しており、式(5)においてθは任意の角度を示している。
Figure 0005041229
また、式(5)における係数k3i(θ)(但し、i=1,2,3)は、次式(6)で示される関数である。
Figure 0005041229
例えば、3次フィルタ処理部63は、ガウス関数Gのガウス幅σを3つの所定値(例えば、ガウス幅σ1,σ2,σ3=1,2,4)に変化させ、ガウス幅σごとに所定の4方向(例えば、θ=θ1,θ2,θ3,θ4)について、式(5)を計算する。
特徴量生成部64は、1次フィルタ処理部61、2次フィルタ処理部62、および3次フィルタ処理部63のそれぞれから供給された、3種類のガウス幅σごとに、4つの方向θについて計算された各輪郭特徴点の特徴量の供給を受け、供給された合計36個(=3(次数)×4(方向)×3(ガウス幅))の特徴量を並べて輪郭特徴点における輪郭特徴量とする。また、特徴量生成部64は、生成した輪郭特徴量と、供給された学習画像とを輪郭識別器生成部26に供給する。
このように、輪郭特徴量計算部25では、ガウス関数を微分して得られる、方向および周波数、つまり方向θおよびガウス幅σに選択性を持つフィルタ(基底関数)が用いられて、微分の次数ごとに異なる特徴量(輪郭)が抽出され、輪郭特徴量とされている。
輪郭特徴量の抽出にステアラブルフィルタを用いる場合、図3に示すように、方向θおよびガウス幅σの異なるフィルタを用意すれば、それらのフィルタの線形結合により、任意の方向θのフィルタ、つまりガウス関数Gの微分関数Gn(但し、n=1,2,3)を表現することができる。
図3において、図中、左側の一番上の列の画像は、図中、左から順番にガウス幅σ=2である場合における1次微分関数G1(0°)および1次微分関数G1(90°)を表している。また、図中、左側の真ん中の列の画像は、図中、左から順番にガウス幅σ=2である場合における2次微分関数G2(0°)、2次微分関数G2(60°)、2次微分関数G2(120°)、およびラプラシアンを表している。さらに、図中、左側の一番下の列の画像は、図中、左から順番にガウス幅σ=2である場合における3次微分関数G3(0°)、3次微分関数G3(45°)、3次微分関数G3(90°)、および3次微分関数G3(135°)を表している。
また、図中、右側の横方向の列のうちの一番上の列の画像は、図中、左側から順番に、ガウス幅σ=1である場合における1次微分関数G1(θ)のθを0,1/8pi,2/8pi,3/8pi,4/8pi,5/8pi,6/8pi,7/8piとしたものを表している。
同様に、図中、右側の横方向の各列の画像は、図中、上から二番目から下方向に順番に、ガウス幅σ=2である場合における1次微分関数G1(θ)、ガウス幅σ=4である場合における1次微分関数G1(θ)、ガウス幅σ=1である場合における2次微分関数G2(θ)、ガウス幅σ=2である場合における2次微分関数G2(θ)、ガウス幅σ=4である場合における2次微分関数G2(θ)、ガウス幅σ=1である場合における3次微分関数G3(θ)、ガウス幅σ=2である場合における3次微分関数G3(θ)、およびガウス幅σ=4である場合における3次微分関数G3(θ)を示している。そして、それらの各列の画像は、図中、左側から順番に微分関数の方向θを0,1/8pi,2/8pi,3/8pi,4/8pi,5/8pi,6/8pi,7/8piとしたものを表している。
例えば、図中、左側のフィルタである1次微分関数G1(0°)および1次微分関数G1(90°)を用いることで、図中、右側の上から二番目の列の各方向θにおける1次微分関数G1(θ)を表すことができる。同様に、図中、左側の2次微分関数G2を用いて、図中、右側の上から5番目の列に示す各方向θにおける2次微分関数G2(θ)を表すことができ、図中、左側の3次微分関数G3を用いて、図中、右側の上から8番目の列に示す各方向θにおける3次微分関数G3(θ)を表すことができる。つまり、各次元の任意の方向の微分関数は、その次元より1だけ多い数の基底関数があれば、それらの基底関数の線形結合により表現することができる。
また、図4乃至図6に、ガウス幅σを変えて、ガウス関数Gの微分関数により、人が写っている画像に対してフィルタ処理を行うことで得られた結果を示す。なお、図4乃至図6のそれぞれにおいて、図中、左側にはフィルタ処理の対象となる画像が示されている。
図4の右側において、一番上側の横方向の画像の列は、左側から順番に、ガウス幅σ=1とし、1次微分関数G1(θ)のθを0,1/8pi,2/8pi,3/8pi,4/8pi,5/8pi,6/8pi,7/8piとした場合におけるフィルタ処理の結果のそれぞれを示している。
同様に、図4の右側において、真ん中の横方向の画像の列は、左側から順番に、ガウス幅σ=1とし、2次微分関数G2(θ)のθを0,1/8pi,2/8pi,3/8pi,4/8pi,5/8pi,6/8pi,7/8piとした場合、およびラプラシアンを用いた場合におけるフィルタ処理の結果を示している。図中、一番下の横方向の画像の列は、左側から順番に、ガウス幅σ=1とし、3次微分関数G3(θ)のθを0,1/8pi,2/8pi,3/8pi,4/8pi,5/8pi,6/8pi,7/8piとした場合におけるフィルタ処理の結果を示している。
また、図5は、ガウス幅σを2としたときのフィルタ処理の結果を示している。つまり、図5の右側において、一番上側の横方向の画像の列は、左側から順番に、ガウス幅σ=2とし、1次微分関数G1(θ)のθを0,1/8pi,2/8pi,3/8pi,4/8pi,5/8pi,6/8pi,7/8piとした場合におけるフィルタ処理の結果を示している。
同様に、図5の右側において、真ん中の横方向の画像の列は、左側から順番に、ガウス幅σ=2とし、2次微分関数G2(θ)のθを0,1/8pi,2/8pi,3/8pi,4/8pi,5/8pi,6/8pi,7/8piとした場合、およびラプラシアンを用いた場合におけるフィルタ処理の結果を示している、また、図中、一番下の横方向の画像の列は、左側から順番に、ガウス幅σ=2とし、3次微分関数G3(θ)のθを0,1/8pi,2/8pi,3/8pi,4/8pi,5/8pi,6/8pi,7/8piとした場合におけるフィルタ処理の結果を示している。
さらに、図6は、ガウス幅σを4としたときのフィルタ処理の結果を示している。つまり、図6の右側において、一番上側の横方向の画像の列は、左側から順番に、ガウス幅σ=4とし、1次微分関数G1(θ)のθを0,1/8pi,2/8pi,3/8pi,4/8pi,5/8pi,6/8pi,7/8piとした場合におけるフィルタ処理の結果を示している。
同様に、図6の右側において、真ん中の横方向の画像の列は、左側から順番に、ガウス幅σ=4とし、2次微分関数G2(θ)のθを0,1/8pi,2/8pi,3/8pi,4/8pi,5/8pi,6/8pi,7/8piとした場合、およびラプラシアンを用いた場合におけるフィルタ処理の結果を示している。また、図中、一番下の横方向の画像の列は、左側から順番に、ガウス幅σ=4とし、3次微分関数G3(θ)のθを0,1/8pi,2/8pi,3/8pi,4/8pi,5/8pi,6/8pi,7/8piとした場合におけるフィルタ処理の結果を示している。
また、図4乃至図6に示した各フィルタでのフィルタ処理を、複数の異なる画像に対して行い、それらの結果を平均して得られる画像を図7乃至図9に示す。すなわち、図7乃至図9のそれぞれは、ガウス幅σを1,2,4とした場合における、フィルタ処理の結果の平均を示しており、図7乃至図9のそれぞれにおいて、図中、左側にはフィルタ処理の対象となった画像を平均して得られる画像が示されている。
したがって、図7乃至図9の図中、右側の横方向に並んだ画像の各列は、それらの列と同じ位置にある図4乃至図6の図中、右側の各列と同様のフィルタ処理を、複数の画像に対して行った結果を平均したものを示している。例えば、図7の右側において、一番上側の画像の列は、左側から順番に、ガウス幅σ=1とし、1次微分関数G1(θ)のθを0,1/8pi,2/8pi,3/8pi,4/8pi,5/8pi,6/8pi,7/8piとした場合におけるフィルタ処理の結果の平均を示している。
図7乃至図9において、各フィルタ処理の結果の平均の画像からは、人の輪郭を確認することができ、各フィルタを用いたフィルタ処理によって、画像から適切に人の輪郭が抽出されていることが分かる。
次に、図10は、図1の服装識別器生成部23のより詳細な構成例を示すブロック図である。服装識別器生成部23は、サンプリング部101、重み設定部102、並び替え部103、識別器設定部104、識別器選択部105、および重み更新部106から構成される。
サンプリング部101は、重み設定部102により設定される学習画像単位の重みに応じて、服装特徴点のペアごとに、複数の学習画像のそれぞれの同じ位置の服装特徴点のペアの服装特徴量から、M個の服装特徴量をサンプリングして並び替え部103に供給する。
並び替え部103は、各服装特徴点のペアについて、サンプリングされたM個の服装特徴量を昇べきの順、または降べきの順に並び替えて識別器設定部104に供給する。
識別器設定部104は、服装特徴量が抽出された学習画像に認識しようとする対象物体が含まれているか否かを示す正誤情報に基づいて、昇べきの順、または降べきの順に並び替えられた各ペアの服装特徴量のそれぞれについて、閾値を変化させながら誤り率計算部104aを制御して、誤り率を計算させ、誤り率が最小となるように閾値を設定する(この閾値が、弱識別器として設定される)。さらに、識別器設定部104は、弱識別器ごとの誤り率を識別器選択部105に供給する。
なお、より詳細には、学習画像には、その学習画像に対象物体が含まれているか否かを示す正誤情報(ラベル)が付加されており、識別器設定部104は、服装特徴量計算部22から供給された学習画像に付加されている正誤情報に基づいて、弱識別器の設定を行う。
識別器選択部105は、弱識別器のうち、誤り率が最小となる弱識別器を選択して、弱識別器からなる服装識別器を更新し、最終的な服装識別器および各弱識別器に対応する服装特徴量を統合識別器生成部27に供給する。さらに、識別器選択部105は、選択した弱識別器の誤り率に基づいて信頼度を計算し、重み更新部106に供給する。
重み更新部106は、供給された信頼度に基づいて学習画像ごとの重みを再計算すると共に、重みを正規化して更新し、更新結果を重み設定部102に供給する。重み設定部102は、重み更新部106より供給されてくる重みの更新結果に基づいて、学習画像単位の重みを設定する。
なお、図1の輪郭特徴量計算部34は、図2に示した輪郭特徴量計算部25と同様の構成とされ、図1の輪郭識別器生成部26は、図10に示した服装識別器生成部23と同様の構成とされるため、その図示および説明は省略する。
ところで、学習装置11に学習画像が入力され、統合識別器の生成が指示されると、学習装置11は、学習処理を開始して統計学習により統合識別器を生成する。以下、図11のフローチャートを参照して、学習装置11による学習処理について説明する。
ステップS11において、服装特徴点抽出部21は、入力された学習画像から服装特徴点を抽出して、抽出した服装特徴点および学習画像を服装特徴量計算部22に供給する。
ステップS12において、服装特徴量計算部22は、服装特徴点抽出部21から供給された服装特徴点と学習画像とに基づいて、各服装特徴点について、服装特徴点のペアリングを行う。
ステップS13において、服装特徴量計算部22は、ペアリングによりペアとされた服装特徴点の各ペアについて服装特徴量を計算し、これにより得られた服装特徴量を服装識別器生成部23に供給する。
例えば、図12に示す学習画像が服装特徴点抽出部21に入力された場合、服装特徴点抽出部21は、予め定められたマージン(のりしろ)と、サンプリングスキップ数とに基づいて、学習画像から服装特徴点を抽出する。なお、図12において、学習画像上の円は、服装特徴点とされた画素を示している。
ここで、マージンとは、学習画像において、学習画像の端から服装特徴点の抽出の対象となる領域までの画素数をいう。また、サンプリングスキップ数とは、服装特徴点とされる学習画像上の画素と画素との間隔をいう。
したがって、例えばマージンが5画素であり、サンプリングスキップ数が5画素である場合、服装特徴点抽出部21は、学習画像の端から5画素以内の位置にある画素からなる領域を学習画像から除外し、残りの領域E11を服装特徴点の抽出の対象とする。そして、服装特徴点抽出部21は、領域E11内の画素のうち、互いに5画素だけ離れている位置の画素を服装特徴点として抽出する。つまり、図中、縦方向または横方向に互いに隣り合う服装特徴点間の距離は5画素とされ、各服装特徴点は、領域E11内の画素とされる。
次に、服装特徴量計算部22は、予め定められた最小半径および最大半径に基づいて、各服装特徴点のペアリングを行う。例えば、最小半径がR11であり、最大半径がR12である場合、所定の服装特徴点KT1に注目したとき、服装特徴量計算部22は、服装特徴点KT1からの距離が、最小半径R11以上であり、かつ最大半径R12以内である全ての服装特徴点について、その服装特徴点と、服装特徴点KT1とを1つのペアとする。
したがって、例えば、服装特徴点KT1からの距離が、最小半径R11以上であり、かつ最大半径R12以内である服装特徴点がN個存在する場合、N個の服装特徴点のペアが得られることになる。服装特徴量計算部22は、全ての服装特徴点について、他の服装特徴点とのペアリングを行う。
さらに、服装特徴量計算部22は、ペアリングにより得られた服装特徴点の各ペアについて、ペアとなる各服装特徴点を中心とする所定の形の所定の大きさの領域同士のテクスチャの距離を服装特徴量として計算する。
例えば、図12に示す服装特徴点KT1と服装特徴点KT2とのペアについての服装特徴量をSSD(Sum of Square Distance)により求める場合、服装特徴量計算部22は、服装特徴点KT1を中心とする所定の領域を領域TX1とし、服装特徴点KT2を中心とする領域TX1と同じ大きさの領域を領域TX2とする。そして、服装特徴量計算部22は、領域TX1内の画素の画素値と、その画素に対応する領域TX2内の画素の画素値との差分の絶対値和を求め、求められた差分の絶対値和を服装特徴量とする。
なお、服装特徴量は、SSDに限らず、SAD(Sum of Absolute Distance)や、正規化相関などとされてもよい。
このようにして、服装特徴量計算部22は、学習画像から抽出された服装特徴点の各ペアについて、服装特徴量を求める。なお、より詳細には、学習装置11には、対象物体が含まれているいくつかの学習画像と、対象物体が含まれていないいくつかの学習画像とからなる複数の学習画像が入力される。そして、入力された学習画像ごとに、服装特徴点の抽出および服装特徴量の計算が行われる。
したがって、例えばM個(但し、Mは自然数)の学習画像PI1乃至学習画像PIMが学習装置11に入力された場合には、図13に示すように、M個の学習画像PIi(但し、1≦i≦M)について、服装特徴点のペアごとの服装特徴量が得られる。
図13では、1つの四角形は、1つの服装特徴点のペアの服装特徴量を表している。また、図中、縦方向に並べられた四角形の列は、1つの学習画像PIi(但し、1≦i≦M)から得られた服装特徴量の列を表しており、1つの列には、その学習画像PIiから得られた服装特徴点のペアの数だけ服装特徴量が並んでいる。つまり、1つの学習画像PIiから得られた服装特徴点のペアの数が、その学習画像PIiの服装特徴量の次元となる。
さらに、各学習画像PIiの服装特徴量の列の図中、下側には、その学習画像PIiに対象物体が含まれているか否かを示すラベル(正誤情報)が示されている。例えば、学習画像PI1の服装特徴量の列の図中、下側に示されるラベル「+1」は、学習画像PI1に対象物体が含まれることを表しており、学習画像PIMの服装特徴量の列の図中、下側に示されるラベル「−1」は、学習画像PIMに対象物体が含まれていないことを表している。
図11のフローチャートの説明に戻り、ステップS13において、服装特徴量が求められると、ステップS14において、服装識別器生成部23は、服装識別器生成処理を行って、服装識別器を生成する。
ここで、図14のフローチャートを参照して、ステップS14の処理に対応する服装識別器生成処理について説明する。
ステップS51において、重み設定部102は、例えば、図13で示される学習画像PIi(1≦i≦M)毎の重みWiを全て1/Mに初期化し、識別器選択部105は、カウンタjを1に、弱識別器の和からなる服装識別器R(x)を0にそれぞれ初期化する。
ここで、iは、図13における学習画像PIiを識別するものであり、1≦i≦Mである。ステップS51の処理により、全ての学習画像PIiの重みWiは、いずれも正規化された同一の重み(=1/M)とされる。また、カウンタjは、予め定められた、服装識別器R(x)を更新する回数を示している。
ステップS52において、サンプリング部101は、各服装特徴点のペアごとに、複数の学習画像PIiのそれぞれの同じ位置の服装特徴点のペアの服装特徴量から、学習画像PIiの重みWiに応じて、M個の服装特徴量を選択し、並び替え部103に供給する。
例えば、服装特徴量計算部22からサンプリング部101に、図15に示すように、M個の学習画像PI1乃至学習画像PIMの服装特徴量が供給されたとする。図15では、図中、横方向に学習画像PIi(但し、1≦i≦M)から得られた服装特徴量が並べられており、学習画像を表す文字PIiの図中、左側の数字「+1」または「−1」は、その学習画像PIiに付加されたラベル(正誤情報)を示している。
すなわち、図中、一番上側に横方向に並んでいる(A1,A2,A3,・・・,AN)は、学習画像PI1の服装特徴点の各ペアの服装特徴量のそれぞれを表しており、学習画像PI1を示す文字「PI1」の図中、左側の文字「+1」は、学習画像PI1に対象物体が含まれている旨のラベルを表している。
同様に、図中、上から二番目の横方向に並んでいる(B1,B2,B3,・・・,BN)は、学習画像PI2の服装特徴点の各ペアの服装特徴量のそれぞれを表しており、学習画像PI2を示す文字「PI2」の図中、左側の文字「+1」は、学習画像PI2に対象物体が含まれている旨のラベルを表している。
また、図中、上から三番目の横方向に並んでいる(C1,C2,C3,・・・,CN)は、学習画像PI3の服装特徴点の各ペアの服装特徴量のそれぞれを表しており、文字「PI3」の図中、左側の文字「−1」は、学習画像PI3に対象物体が含まれていない旨のラベルを表している。さらに、図中、上からM番目の横方向に並んでいる(M1,M2,M3,・・・,MN)は、学習画像PIMの服装特徴点の各ペアの服装特徴量のそれぞれを表しており、文字「PIM」の図中、左側の文字「−1」は、学習画像PIMに対象物体が含まれていない旨のラベルを表している。
このように、図15の例では、1つの学習画像PIiからは、服装特徴点のN個のペアのそれぞれの服装特徴量が得られる。また、図15では、縦方向に並んだM個の服装特徴量Ak乃至服装特徴量Mk(但し、1≦k≦N)が1つのグループGrkとされており、このグループGrkに属す服装特徴量は、各学習画像PIiにおける同じ位置の服装特徴点のペアの服装特徴量とされている。
例えば、グループGr1は、縦方向に並んだ服装特徴量A1乃至服装特徴量M1からなり、服装特徴量A1が求められる学習画像PI1のペアとなる2つの服装特徴点と、グループGr1に属す他の服装特徴量、例えば服装特徴量M1が求められる学習画像PIMのペアとなる2つの服装特徴点とは、学習画像上の同じ位置にある。なお、以下において、各学習画像PIiにおける服装特徴点のペアであって、グループGrk(1≦k≦N)に属す服装特徴量が求まめられるペアをペアkと称する。
サンプリング部101に、図15に示される学習画像PIiごとの服装特徴量が供給された場合、サンプリング部101は、ペアkごと、つまりグループGrkごとに、そのグループに属す服装特徴量から学習画像PIiの重みWiに応じて、M個の服装特徴量を抽選で選択する。例えば、サンプリング部101は、重みWiに応じて、グループGr1に属す服装特徴量A1乃至服装特徴量M1から、M個の服装特徴量を選択する。なお、最初の処理においては、いずれの重みWiも1/Mであり、等しいため、M個が抽選されると、確率的には全ての服装特徴量が選択されることになる。そのため、ここでは、最初の処理では各グループGrkにおいて、全ての服装特徴量が選択されたものとする。もちろん、実際には、同一の服装特徴量が重複して選択されることもある。
なお、重みWiは、服装特徴点のペアごとのエラー計算に用いることもできる。この場合、データ重み係数(重みWi)がエラー値に掛け合わされてエラー計算が行われる。
ステップS53において、並び替え部103は、N個のグループGrkのそれぞれについて、グループGrk、つまりペアkごとに選択されたM個の服装特徴量を昇べきの順、または降べきの順に並び替えて、識別器設定部104に供給する。例えば、図15のグループGr1に属す服装特徴量から選択された、M個の服装特徴量が順番に並び替えられる。
ステップS54において、識別器設定部104は、服装特徴量計算部22から供給された学習画像に付加されている正誤情報(ラベル)に基づいて、グループGrkごと、つまり服装特徴点のペアkごとに、閾値を変化させながら誤り率計算部104aを制御して、以下の式(7)で示すように誤り率ejkを計算させ、誤り率ejkが最小となるように閾値を設定する。
ここで、服装特徴点のペアkごとの閾値thjkが、1個の弱識別器fjkとなる。識別器設定部104は、弱識別器fjkごとの誤り率ejkを識別器選択部105に供給する。すなわち、N個のペアkのそれぞれに対して、N個の弱識別器fjkのそれぞれが設定され、N個の弱識別器fjkのそれぞれについて誤り率ejkが求められることになる。なお、弱識別器fjkは、認識しようとする対象物体を含む場合「+1」を出力し、認識しようとする対象物体を含まない場合「−1」を出力する関数である。
例えば、図16に示すように、j=1であって、服装特徴点のペアk=1の服装特徴量がL1,A1,C1,B1,・・・,M1に昇べき、または、降べきの順に並べられた場合、閾値th11が服装特徴量A1とC1の間に設定される。そして、閾値th11より小さい範囲では、認識しようとする対象物体がないと認識され(「−1」で示されている範囲)、閾値th11より大きい範囲では、認識しようとする対象物体があると認識される(「+1」で示されている範囲)とき、図中の点線で囲まれた服装特徴量A1は、認識しようとする対象物体が含まれた学習画像の服装特徴量であるので、エラーであるとみなされる。また、服装特徴量C1,M1は、逆に、認識しようとする対象物体が含まれていない学習画像の服装特徴量であるので、エラーであるとみなされる。
図16の例では、閾値th11は、誤り率ejkが最小となる位置に設定されている。例えば、図16に示す閾値th11が、誤り率ejkの最小となる位置ではない場合には、識別器設定部104は、閾値th11の位置を変化させて、各位置における誤り率ejkを参照しながら、誤り率ejkが最小となる閾値th11の位置を探し出し、その位置を閾値th11の位置とする。
誤り率計算部104aは、以下の式(7)で示されるように、学習画像の正誤情報(ラベル)に基づいて、エラーであるとみなされた服装特徴量が抽出された学習画像の重みWiを加算し、誤り率ejkを計算する。
Figure 0005041229
ここで、y≠fjkはエラーとなっている服装特徴点のペアkの条件を示しており、Ewは、エラーの発生したペアkにおける重みが加算されることを示している。
ステップS55において、識別器選択部105は、識別器設定部104から供給されたペアkごとのN個の誤り率ejkに基づいて、N個の弱識別器fjkのうち、誤り率ejkが最小となる弱識別器fjkを選択する。そして、識別器選択部105は、識別器設定部104から選択した弱識別器fjkを取得する。
ステップS56において、識別器選択部105は、選択した弱識別器fjkの誤り率ejkに基づいて、以下の式(8)で示される信頼度cjを計算し、計算結果を重み更新部106に供給する。
Figure 0005041229
なお、式(8)において、ejは、誤り率ejkのうち、選択された弱識別器fjkの誤り率ejk、つまりN個の誤り率ejkのうちの最小の誤り率ejkを示している。また、以下において、ステップS55の処理において選択されたペアkの弱識別器を、弱識別器fjとも称し、その弱識別器fjの誤り率ejkを誤り率ejとも称する。
ステップS57において、重み更新部106は、供給された信頼度cjに基づいて、以下の式(9)を計算することで、学習画像PIiごとに重みWiを再計算すると共に、全ての重みWiを正規化して更新し、更新結果を重み設定部102に供給する。重み設定部102は、重み更新部106より供給されてくる重みの更新結果に基づいて、学習画像ごとの重みを設定する。
Figure 0005041229
すなわち、式(9)においては、エラーの発生した服装特徴量を含む学習画像の重みWiが大きくなることが示されている。
ステップS58において、識別器選択部105は、新たに求められた弱識別器fjを用いて、保持している服装識別器R(x)を更新する。すなわち、識別器選択部105は、次式(10)を計算することで服装識別器R(x)を更新する。
R(x)=R’(x)+cj×fj(x) ・・・(10)
なお、式(10)において、R’(x)は、識別器選択部105が保持している更新前の服装識別器を表しており、fj(x)は、新たに求められた弱識別器fjを表している。すなわち、識別器選択部105は、保持している服装識別器に、信頼度cjが乗算されて重み付けされた、新たに求められた弱識別器を加算することで服装識別器を更新する。
ステップS59において、識別器選択部105は、誤り率ejkが最小となる弱認識器fjkに対応する服装特徴点のペアkの服装特徴量を、識別用特徴量として保持する。
ステップS60において、識別器選択部105は、カウンタjがL以上であるか否かを判定する。ステップS60において、カウンタjがL以上でないと判定された場合、ステップS61において、識別器選択部105は、カウンタjをインクリメントする。そして、その後、処理はステップS52に戻り、上述した処理が繰り返される。
すなわち、新たに設定された学習画像ごとの重みWiが用いられて、N個のペアkについて、新たな弱識別器fjkが設定され、それらの弱識別器fjkから誤り率ejkが最小となる弱認識器fjkが選択される。そして、選択された弱認識器fjkにより、服装識別器が更新される。
これに対して、ステップS60において、カウンタjがL以上であると判定された場合、ステップS62において、識別器選択部105は、保持している服装識別器および識別用特徴を統合識別器生成部27に出力する。そして、その後、処理は図11のステップS15に進む。
以上の処理により、L個の比較的誤り率の低い弱識別器fj(1≦j≦L)からなる服装識別器が統合識別器生成部27に供給されるとともに、それぞれの弱識別器fjで使用されるべき服装特徴点のペアkの服装特徴量が統合識別器生成部27に供給される。ここでLは、L≦Nである。
なお、式(10)の服装識別器を用いて、服装特徴量を代入した服装識別器が正である場合に「+1」を出力し、服装識別器が負である場合に「−1」を出力する識別器(関数)を生成すると、その識別器は、L個の弱識別器の多数決により、認識しようとする対象物体の有無を出力する関数であると言える。また、図14のフローチャートを参照して説明した弱識別器を学習処理により重み付けしつつ付加することを繰り返し、識別器を生成する学習処理は、Descrete Adaboost Algorithmと呼ばれている。
すなわち、以上の服装識別器生成処理により、誤り率の高い学習画像の服装特徴量の重みが順次大きくなり、誤り率の低い服装特徴量の重みが小さくなるように、服装特徴点のペアごとに弱識別器と誤り率が計算される処理が繰り返されることになる。したがって、繰り返し処理(ステップS52乃至S61の処理)の中で、弱識別器を設定する際に選択される服装特徴量(ステップS52で選択される服装特徴量)は、徐々に誤り率の高いものが選択されやすくなるので、認識し難い服装特徴量が繰り返されるほどに選択されて学習が繰り返されることになるため、認識し難い学習画像の服装特徴量がより多く選択されることになり、最終的に高い認識率にすることが可能となる。
また、繰り返し処理(ステップS52乃至S61の処理)の中で、識別器選択部105は、常に誤り率の最も低いペアに対応する弱識別器を選択することになるので、学習処理の繰り返しにより、常に信頼度の最も高い服装特徴点のペアについての弱識別器が選択されて服装識別器に加算されることになり、繰り返されるごとに精度の高い弱識別器が順次加算されることになる。
さらに、服装識別器は、服装特徴量を用いて画像に対象物体としての人が含まれているか否かを識別する識別器である。そして、服装識別器を構成する各弱識別器に代入される服装特徴量に対応する服装特徴点のペアは、服装特徴点のペアのうち、入力された画像から対象物体を検出するのに適したペアである。
例えば、服装識別器に代入される服装特徴量に対応するペアは、図17に示すように、画像中の対象物体としての人の周囲にある服装特徴点のペアとされている。図17では、点線の直線は、ペアとなる2つの服装特徴点を結ぶ直線を表しており、その点線の端を中心とする四角形は、服装特徴量を求めるときに用いられるテクスチャの領域を表している。
図17の例では、画像上の人が身に着けている、その人の上半身の洋服内にある2つの服装特徴点からなり、テクスチャ間の距離、つまり服装特徴量が小さくなるペアや、人の洋服内の服装特徴点と、人ではなく背景上の服装特徴点とからなり、服装特徴量が大きくなるペアなどが選択されていることが分かる。
図11のフローチャートの説明に戻り、ステップS15において、輪郭特徴点抽出部24は、入力された学習画像から輪郭特徴点を抽出する。
例えば、輪郭特徴点抽出部24に図18Aに示す学習画像が入力された場合、輪郭特徴点抽出部24は、図18Bに示すように、学習画像において所定の間隔で並んでいる画素を、輪郭特徴点として抽出する。なお、図18Bにおいて、学習画像上の円は輪郭特徴点とされた画素を表している。
図18Aおよび図18Bに示す学習画像は、図中、横方向に32画素、縦方向に64画素からなる学習画像であり、輪郭特徴点抽出部24は、学習画像上の画素を、横方向および縦方向に2画素おきに輪郭特徴点とする画素として選択する。これにより、学習画像において、図中、横方向に12画素、縦方向に28画素、合計336(=12×28)画素が輪郭特徴点として選択される。
輪郭特徴点抽出部24は、学習画像から輪郭特徴点を抽出すると、抽出した輪郭特徴点と、入力された学習画像とを輪郭特徴量計算部25に供給する。
ステップS16において、輪郭特徴量計算部25は、輪郭特徴量計算処理を行い、輪郭特徴点抽出部24から供給された輪郭特徴点および学習画像に基づいて、各輪郭特徴点の輪郭特徴量を計算する。
ここで、図19のフローチャートを参照して、ステップS16の処理に対応する輪郭特徴量計算処理について説明する。
ステップS101において、輪郭特徴量計算部25、より詳細には、輪郭特徴量計算部25の1次フィルタ処理部61、2次フィルタ処理部62、および3次フィルタ処理部63は、それぞれ輪郭特徴点抽出部24から供給されてきた輪郭特徴点のうち、未処理の輪郭特徴点の1つを注目画素として選択する。
ステップS102において、輪郭特徴量計算部25は、方向θqを示すカウンタqを1とする。これにより、方向θqはθ1とされる。
ステップS103において、輪郭特徴量計算部25は、ガウス幅σpを示すカウンタpを1とする。これにより、ガウス幅σpはσ1とされる。
ステップS104において、1次フィルタ処理部61は、1次フィルタ処理を行う。すなわち、1次フィルタ処理部61は、処理対象となる注目画素の画素値に基づいて、ガウス幅をσpとし、かつ方向をθqとして式(2)を演算し、フィルタ処理した結果を特徴量生成部64に供給する。つまり、式(2)における方向θがθqとされて演算が行われ、輪郭が抽出される。
ステップS105において、2次フィルタ処理部62は、2次フィルタ処理を行う。すなわち、2次フィルタ処理部62は、注目画素の画素値に基づいて、ガウス幅をσpとし、かつ方向をθqとして式(3)を演算し、フィルタ処理した結果を特徴量生成部64に供給する。つまり、式(3)における方向θがθqとされて演算が行われ、輪郭が抽出される。
ステップS106において、3次フィルタ処理部63は、3次フィルタ処理を行う。すなわち、3次フィルタ処理部63は、注目画素の画素値に基づいて、ガウス幅をσpとし、かつ方向をθqとして式(5)を演算し、フィルタ処理した結果を特徴量生成部64に供給する。つまり、式(5)における方向θがθqとされて演算が行われ、輪郭が抽出される。
ステップS107において、輪郭特徴量計算部25は、ガウス幅σpがσ3であるか、つまりカウンタp=3であるか否かを判定する。ステップS107において、ガウス幅σpがσ3でないと判定された場合、ステップS108において、輪郭特徴量計算部25は、カウンタpをインクリメントする。例えば、カウンタp=1であった場合、カウンタpがインクリメントされてp=2とされ、これによりガウス幅σpはσ2とされる。カウンタpがインクリメントされると、処理はステップS104に戻り、上述した処理が繰り返される。
一方、ステップS107において、ガウス幅σpがσ3であると判定された場合、ステップS109において、輪郭特徴量計算部25は、方向θqがθ4であるか否か、つまりカウンタq=4であるか否かを判定する。
ステップS109において、方向θqがθ4でないと判定された場合、ステップS110において、輪郭特徴量計算部25は、カウンタqをインクリメントする。例えば、カウンタq=1であった場合、カウンタqがインクリメントされてq=2とされ、これにより方向θqはθ2とされる。カウンタqがインクリメントされると、処理はステップS103に戻り、上述した処理が繰り返される。
これに対して、ステップS109において、方向θqがθ4であると判定された場合、ステップS111において、特徴量生成部64は、1次フィルタ処理部61、2次フィルタ処理部62、および3次フィルタ処理部63から供給された演算結果を輪郭特徴量として合成し、1つの輪郭特徴点に対する輪郭特徴量を生成する。
ステップS112において、輪郭特徴量計算部25は、全ての輪郭特徴点について処理が終了したか否かを判定する。例えば、輪郭特徴点抽出部24から供給された全ての輪郭特徴点について、輪郭特徴量が求められた場合、処理が終了したと判定される。
ステップS112において、全ての輪郭特徴点について処理が終了していないと判定された場合、処理はステップS101に戻り、次の輪郭特徴点が注目画素として選択される。
これに対して、ステップS112において、全ての輪郭特徴点について処理が終了したと判定された場合、特徴量生成部64は、輪郭特徴点抽出部24から供給された学習画像と、生成された各輪郭特徴点の輪郭特徴量とを輪郭識別器生成部26に供給する。そして、その後、処理は図11のステップS17に進む。
なお、学習画像からの輪郭特徴量の抽出には、ステアラブルフィルタに限らず、ガボアフィルタなどが用いられるようにしてもよい。
図11のフローチャートの説明に戻り、各輪郭特徴点の輪郭特徴量が求められると、ステップS17において、輪郭識別器生成部26は、輪郭特徴量計算部25から供給された学習画像および輪郭特徴量に基づいて、輪郭識別器生成処理を行い、輪郭識別器を生成する。なお、この輪郭識別器生成処理は、図14を参照して説明した服装識別器生成処理と同様であるので、その説明は省略する。
すなわち、服装識別器生成処理と輪郭識別器生成処理とは、処理対象となる特徴量が服装特徴量であるか、または輪郭特徴量であるかという点のみが異なる。したがって、輪郭識別器生成処理においては、最も誤り率の低い輪郭特徴点の輪郭特徴量に対応する弱識別器の和から輪郭識別器が生成される。輪郭識別器生成部26は、生成した輪郭識別器および識別用特徴を統合識別器生成部27に出力する。
ステップS18において、統合識別器生成部27は、服装識別器生成部23から供給された服装識別器と、輪郭識別器生成部26から供給された輪郭識別器とを統合して統合識別器を生成する。
例えば、Adaboostによる統計学習処理により得られた識別器は、弱識別器の線形結合により表現されるので、統合識別器生成部27は、服装識別器と輪郭識別器とをLate Fusion方式により統合する。
すなわち、統合識別器生成部27は、次式(11)を計算することで、服装識別器R(x)と、輪郭識別器T(x)との識別器和U(x)を求める。つまり、服装識別器R(x)と、輪郭識別器T(x)との線形結合により、識別器和U(x)が求められる。
U(x)=α・R(x)+β・T(x) ・・・(11)
なお、式(11)において、αおよびβは所定の定数、つまりチューニングパラメータであり、例えば統計学習処理に用いられる学習画像に対する識別率などにより求められる。また、輪郭識別器T(x)は、式(10)により示される服装識別器R(x)と同様に、信頼度が乗算された弱識別器の和とされる。
さらに、統合識別器生成部27は、求められた識別器和U(x)を用いて、次式(12)により示される統合識別器を生成する。
統合識別器=sign(U(x)) ・・・(12)
なお、式(12)において、sign(U(x))は、識別器和U(x)が正の場合、認識しようとする対象物体が、入力画像中に存在することを示す「+1」を出力し、識別器和U(x)が負の場合、認識しようとする対象物体が、入力画像中に存在しないことを示す「−1」を出力する関数である。
このようにして、統合識別器が生成されると、統合識別器生成部27は、生成した統合識別器を識別器記録部12に供給して記録させる。また、統合識別器生成部27は、服装識別器生成部23から供給された識別用特徴量に、輪郭識別器生成部26から供給された識別用特徴量を付加して最終的な識別用特徴量とし、最終的な識別用特徴量を識別器記録部12に供給して記録させ、学習処理は終了する。
以上のようにして、学習装置11は、学習画像から服装特徴点を抽出して、服装特徴点のペアの服装特徴量を求め、統計学習により服装識別器を生成するとともに、学習画像から輪郭特徴点を抽出して輪郭特徴量を求め、統計学習により輪郭識別器を生成する。そして、学習装置11は、服装識別器と輪郭識別器とを線形結合により統合して、統合識別器を生成する。
このように、服装識別器と輪郭識別器とを統合して統合識別器を生成することで、画像からより確実に対象物体を検出できる統合識別器を提供することができる。すなわち、統合識別器は、対象物体の服装の特徴を利用した服装識別器と、対象物体の輪郭を利用した輪郭識別器とが統合されたものであるので、入力された画像から、少なくとも一方の特徴量を充分に抽出することができれば、画像から対象物体を検出することができる。
画像から対象物体としての人を検出する場合、対象物体としての人は、服装が変化しても、人として検出されるべきである。そのため、従来は、人の服装の輝度によらない特徴量として、輪郭だけが用いられて画像からの人の検出が行われていた。
これに対して、学習装置11では、人の服装の特徴を利用した、人の服装のパターンの変化に対して不変な服装特徴量を画像からの人の検出に用いている。この服装特徴量は、統計的に、人が上半身(シャツ)で同じテクスチャの繰り返しのパターンであり、下半身(ズボン)で同じテクスチャの繰り返しのパターンである洋服を着用することが多いことに着目し、新たに定義された特徴量である。
つまり、服装特徴量は、画像上の任意の2つの領域のテクスチャ、すなわち輝度のパターンの似ている度合い(類似度)を示している。例えば、人の上半身の2つの領域間のテクスチャの類似度は高く、上半身と下半身や、人の服装と背景とのテクスチャの類似度は低い。学習装置11では、このような2つの領域のテクスチャの類似度を利用して、画像から人を検出する服装識別器が用いられ、統合識別器が生成される。
したがって、例えば、入力された画像から輪郭が充分に抽出できなくても、画像から2つの領域のテクスチャの類似の特徴を充分に抽出できれば、統合識別器を用いて、画像から人を検出することができる。逆に、画像中において、人の着用している洋服が繰り返しでないパターンの服であったり、バッグなどで洋服が部分的に隠れていたりする場合には、画像からテクスチャの類似の特徴を充分に抽出できない恐れがあるが、画像から輪郭を充分に抽出することができれば、統合識別器により画像から人を検出することができる。
ところで、認識装置13に入力画像が入力され、対象物体としての人の検出が指示されると、認識装置13は、人検出処理を開始して、入力画像から対象物体を検出する。以下、図20のフローチャートを参照して、認識装置13による人検出処理について説明する。
なお、ステップS151の処理乃至ステップS153の処理のそれぞれは、図11のステップS11の処理乃至ステップS13の処理のそれぞれと同様であるので、その説明は省略する。すなわち、服装特徴点抽出部31は、入力された入力画像から服装特徴点を抽出し、服装特徴量計算部32は、服装特徴点抽出部31により抽出された服装特徴点のペアリングを行って、各ペアの服装特徴量を計算する。そして、服装特徴量計算部32は、各ペアについて求めた服装特徴量を識別計算部35に供給する。
ステップS154において、輪郭特徴点抽出部33は、図11のステップS15の処理と同様の処理を行い、入力された入力画像から輪郭特徴点を抽出し、入力画像とともに輪郭特徴量計算部34に供給する。
ステップS155において、輪郭特徴量計算部34は、輪郭特徴点抽出部33からの入力画像および輪郭特徴点に基づいて、輪郭特徴量計算処理を行い、各輪郭特徴点の輪郭特徴量を計算する。そして、輪郭特徴量計算部34は、求められた輪郭特徴量を識別計算部35に供給する。なお、この輪郭特徴量計算処理は、図19を参照して説明した輪郭特徴量計算処理と同様の処理であるため、その説明は省略する。
ステップS156において、識別計算部35は、識別器記録部12から識別用特徴量および統合識別器を読み出して、読み出した統合識別器に特徴量を代入して計算する。すなわち、識別計算部35は、服装特徴量計算部32からの服装特徴量、および輪郭特徴量計算部34からの輪郭特徴量のうちの識別用特徴量に対応するものを、式(12)により示される統合識別器に代入して演算を行う。
ここで、統合識別器を構成する弱識別器に代入される特徴量は、識別用特徴量とされた特徴量が求められた、学習画像の服装特徴点のペアまたは輪郭特徴点と同じ位置にある、入力画像上の服装特徴点のペアまたは輪郭特徴点から求められた特徴量である。また、識別用特徴量とされる特徴量は、統計学習処理時において、統合識別器を構成する弱識別器の設定に用いられた特徴量である。
式(12)の演算が行われると、その演算の結果として、入力画像中に対象物体としての人が存在することを示す「+1」、または入力画像中に対象物体としての人が存在しないことを示す「−1」が得られる。識別計算部35は、統合識別器での演算結果を識別結果出力部36に供給する。
ステップS157において、識別結果出力部36は、識別計算部35からの演算結果に基づいて、人の検出結果を出力し、人検出処理は終了する。すなわち、対象物体が入力画像で認識されたか否かの識別結果が出力される。
例えば、対象物体が入力画像で認識されたか否かの識別結果として、図21に示すように、対象物体としての人が検出された領域に枠が表示された入力画像が、識別結果出力部36に表示されるようにしてもよい。
図21に示す入力画像は、対象物体としての2人の人が写っている画像であり、入力画像には、それぞれの人を囲む枠が表示されている。この場合、識別結果出力部36にも入力画像が入力され、識別計算部35は、演算結果とともに入力画像における対象物体が検出された領域を示す情報を識別結果出力部36に供給する。すると、識別結果出力部36は、識別計算部35からの演算結果および領域を示す情報に基づいて、入力画像から対象物体が検出された場合には、入力画像とともに、対象物体が検出された領域を囲む枠を表示する。
このようにして、認識装置13は、入力画像から服装特徴点を抽出して、服装特徴点のペアの服装特徴量を求めるとともに、入力画像から輪郭特徴点を抽出して輪郭特徴量を求める。そして、認識装置13は、求めた服装特徴量および輪郭特徴量と、識別器記録部12に記録されている統合識別器とを用いて、入力画像から対象物体を検出する。
このように、服装特徴量および輪郭特徴量を用いて入力画像から対象物体を検出することで、より確実に画像から対象物体を検出することができる。すなわち、入力画像から服装特徴量または輪郭特徴量の少なくとも何れか一方を充分に抽出することができれば、入力画像から対象物体を確実に検出することができる。
なお、以上においては、対象物体として人を検出すると説明したが、対象物体は、人に限らず、物体の表面のパターンが、同じテクスチャの繰り返しのパターンとなるものであれば、どのようなものであってもよい。
また、以上においては、Descrete Adaboost Algorithmに基づいて、統計学習処理を実行する例について説明してきたが、それ以外のBoosting Algorithmを適用するようにしてもよく、例えば、Gentle Adaboost Algorithmを用いるようにしてもよい。Descrete Adaboost Algorithmと、Gentle Adaboost Algorithmとは、前者の識別器の出力結果が離散変量であるのに対して、後者は、連続変量である点で異なる。しかしながら、前者においては、信頼度が乗じられるため、出力結果は、実質的に連続変量として扱われており、本質的に処理の違いはない。
さらに、その他、SVM(Support Vector Machine)やBaysianなどにより統計学習処理を行い、服装識別器や輪郭識別器を生成するようにしてもよい。なお、統計学習処理において、Adaboostなどで特徴量(服装特徴量または輪郭特徴量)を選択するようにすると、認識装置13における統合識別器を用いた人の検出時に、より高速に処理を行うことができるようになる。
また、以上においては、服装識別器と輪郭識別器とを生成し、それらの識別器を統合して統合識別器を生成すると説明したが、服装識別器および輪郭識別器を生成せずに、服装特徴量および輪郭特徴量から、直接、統合識別器が生成されるようにしてもよい。
そのような場合、人識別システムは、例えば図22に示すように構成される。なお、図22において、図1における場合と対応する部分には、同一の符号を付してあり、その説明は省略する。
図22に示す人識別システムと、図1に示す人認識システムとでは、識別器記録部12および認識装置13は同じ構成とされ、学習装置11の構成だけが異なる。
すなわち、図22に示す学習装置11は、服装特徴点抽出部21、服装特徴量計算部22、輪郭特徴点抽出部24、輪郭特徴量計算部25、および統合識別器生成部201から構成される。なお、服装特徴点抽出部21、服装特徴量計算部22、輪郭特徴点抽出部24、および輪郭特徴量計算部25は、図1に示した学習装置11における場合と同様であるので、その説明は省略する。
統合識別器生成部201は、服装特徴量計算部22から供給された服装特徴量、および輪郭特徴量計算部25から供給された輪郭特徴量に基づいて、例えばAdaboostによる統計学習処理を行い、統合識別器を生成する。また、統合識別器生成部201は、生成した統合識別器、および識別用特徴量を識別器記録部12に供給して記録させる。
また、統合識別器生成部201は、より詳細には、例えば図23に示すように構成される。統合識別器生成部201は、サンプリング部231、重み設定部232、並び替え部233、識別器設定部234、識別器選択部235、および重み更新部236から構成される。
これらのサンプリング部231乃至重み更新部236のそれぞれは、処理の対象となる特徴量が服装特徴量および輪郭特徴量である点が異なるだけで、行われる処理自体は、図10のサンプリング部101乃至重み更新部106のそれぞれと同様であるので、その説明は適宜、省略する。
つまり、サンプリング部231には、服装特徴量計算部22から学習画像および服装特徴量が供給されるとともに、輪郭特徴量計算部25から学習画像および輪郭特徴量が供給される。そして、サンプリング部231は、同じ学習画像から抽出された服装特徴量および輪郭特徴量を並べて1つの特徴量とし、学習画像単位の重みに応じて、服装特徴点のペアまたは輪郭特徴点ごとに、複数の学習画像のそれぞれにおける同じ位置の服装特徴点のペアの服装特徴量、または同じ輪郭特徴点の輪郭特徴量のうちのM個の特徴量(服装特徴量または輪郭特徴量)をサンプリングし、並び替え部233に供給する。
また、識別器設定部234は、服装特徴量計算部22および輪郭特徴量計算部25からの学習画像に付加されている正誤情報に基づいて、並び替えられた各服装特徴点のペアの服装特徴量、または各輪郭特徴点の輪郭特徴量のそれぞれについて、閾値を変化させながら誤り率計算部234aを制御して、誤り率を計算させ、誤り率が最小となるように閾値設定する。
識別器選択部235は、弱識別器のうち、誤り率が最小となる弱識別器を選択して、保持している弱識別器からなる統合識別器を更新し、最終的な統合識別器と、各弱識別器に対応する服装特徴量または輪郭特徴量とを識別用特徴量として識別器記録部12に供給して記録させる。
次に、図24のフローチャートを参照して、図22の学習装置11による学習処理について説明する。なお、ステップS201の処理乃至ステップS203の処理のそれぞれは、図11のステップS11の処理乃至ステップS13の処理のそれぞれと同様であるので、その説明は省略する。
ステップS203において、服装特徴量計算部22から統合識別器生成部201に、服装特徴量および学習画像が供給されると、ステップS204において、輪郭特徴点抽出部24は、図11のステップS15の処理と同様の処理を行って、入力された学習画像から輪郭特徴点を抽出し、輪郭特徴点および学習画像を輪郭特徴量計算部25に供給する。
ステップS205において、輪郭特徴量計算部25は、輪郭特徴点抽出部24からの輪郭特徴点および学習画像に基づいて、輪郭特徴量計算処理を行い、各輪郭特徴点の輪郭特徴量を計算する。なお、この輪郭特徴量計算処理は、図11のステップS16の処理と同様であるため、その説明は省略する。
輪郭特徴量計算処理が行われ、輪郭特徴量計算部25から統合識別器生成部201に輪郭特徴量および学習画像が供給されると、ステップS206において、統合識別器生成部201は、服装特徴量計算部22から供給された学習画像および服装特徴量と、輪郭特徴量計算部25から供給された学習画像および輪郭特徴量とに基づいて、統合識別器生成処理を行って、統合識別器を生成する。なお、この統合識別器生成処理は、図14を参照して説明した服装識別器生成処理と同様であるので、その説明は省略する。
ステップS206の統合識別器生成処理では、服装特徴量および輪郭特徴量からなる1つの特徴量が用いられて、Early Fusion方式により統合識別器を生成する処理が行われる。したがって、例えば図15に示したグループGrk(但し、服装特徴量の数をN1とし、輪郭特徴量の数をN2として、1≦k≦N1+N2)に属す特徴量は、服装特徴量または輪郭特徴量の何れかとされる。
また、グループGrkごとに設定された、N1+N2個の弱識別器fjkのうち、選択される誤り率ejkが最小となる弱識別器fjkは、服装特徴点のペアの弱識別器、または輪郭特徴点の弱識別器の何れかとなる。つまり、服装特徴点のペアの弱識別器または輪郭特徴点の弱識別器のうち、そのときに最もエラーが少なくなるものがどの弱識別器であるかによって、統合識別器を構成する弱識別器として、統合識別器に加算される弱識別器が、服装特徴点のペアの弱識別器となるか、または輪郭特徴点の弱識別器となるかが定まる。
このように、統合識別器を服装特徴量および輪郭特徴量から直接生成する場合にも、統合識別器は、服装特徴点のペアの弱識別器と、輪郭特徴点の弱識別器とが線形結合されて生成される。そして、統合識別器は、特徴量を代入したときの各弱識別器の和が正である場合、画像中に対象物体が存在することを示す「+1」を出力し、各弱識別器の和が負である場合、画像中に対象物体が存在しないことを示す「−1」を出力する関数とされる。つまり、2つの強い識別器が独立に学習されるのではなく、2つの弱い特徴量が用いられて、1つの強い識別器が学習される。
統合識別器生成部201により、統合識別器が生成されると、生成された統合識別器と識別用特徴量とが識別器記録部12に供給されて記録され、学習処理は終了する。
以上のようにして、学習装置11は、服装特徴量と輪郭特徴量とから、直接、統計学習により1つの統合識別器を生成する。このように、服装特徴量および輪郭特徴量から統合識別器を生成することで、画像からより確実に人を検出できる識別器を提供することができる。
また、図22に示した学習装置11により生成された統合識別器を用いて、認識装置13が入力画像から対象物体を検出する場合、識別計算部35は、服装特徴量計算部32からの服装特徴量と、輪郭特徴量計算部34からの輪郭特徴量とのうち、識別器記録部12に記録されている識別用特徴量に対応する特徴量を統合識別器に代入して演算を行う。この処理は、識別用特徴量が異なるだけで、図20を参照して説明した人検出処理と同様の処理であるため、その説明は省略する。
上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、プログラム記録媒体からインストールされる。
図25は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。
コンピュータにおいて、CPU(Central Processing Unit)501,ROM(Read Only Memory)502,RAM(Random Access Memory)503は、バス504により相互に接続されている。
バス504には、さらに、入出力インターフェース505が接続されている。入出力インターフェース505には、キーボード、マウス、マイクロホンなどよりなる入力部506、ディスプレイ、スピーカなどよりなる出力部507、ハードディスクや不揮発性のメモリなどよりなる記録部508、ネットワークインターフェースなどよりなる通信部509、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア511を駆動するドライブ510が接続されている。
以上のように構成されるコンピュータでは、CPU501が、例えば、記録部508に記録されているプログラムを、入出力インターフェース505及びバス504を介して、RAM503にロードして実行することにより、上述した一連の処理が行われる。
コンピュータ(CPU501)が実行するプログラムは、例えば、磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)等)、光磁気ディスク、もしくは半導体メモリなどよりなるパッケージメディアであるリムーバブルメディア511に記録して、あるいは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供される。
そして、プログラムは、リムーバブルメディア511をドライブ510に装着することにより、入出力インターフェース505を介して、記録部508にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部509で受信し、記録部508にインストールすることができる。その他、プログラムは、ROM502や記録部508に、あらかじめインストールしておくことができる。
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
なお、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
本発明を適用した人識別システムの一実施の形態の構成例を示すブロック図である。 輪郭特徴量計算部の詳細な構成例を示すブロック図である。 ステアラブルフィルタについて説明する図である。 画像に対してフィルタ処理を行った結果を示す図である。 画像に対してフィルタ処理を行った結果を示す図である。 画像に対してフィルタ処理を行った結果を示す図である。 画像に対してフィルタ処理を行った結果の平均を示す図である。 画像に対してフィルタ処理を行った結果の平均を示す図である。 画像に対してフィルタ処理を行った結果の平均を示す図である。 服装識別器生成部の詳細な構成例を示すブロック図である。 学習処理を説明するフローチャートである。 服装特徴点の抽出について説明する図である。 服装特徴量を説明する図である。 服装識別器生成処理を説明するフローチャートである。 服装特徴点のペアごとの服装特徴量のサンプリングについて説明する図である。 弱識別器の設定について説明する図である。 服装特徴点のペアについて説明する図である。 輪郭特徴点の抽出について説明する図である。 輪郭特徴量計算処理を説明するフローチャートである。 人検出処理を説明するフローチャートである。 対象物体の認識結果の表示例を示す図である。 本発明を適用した人識別システムの他の構成例を示すブロック図である。 統合識別器生成部の詳細な構成例を示すブロック図である。 学習処理を説明するフローチャートである。 コンピュータの構成例を示すブロック図である。
符号の説明
11 学習装置, 12 識別器記録部, 13 認識装置, 21 服装特徴点抽出部, 22 服装特徴量計算部, 23 服装識別器生成部, 24 輪郭特徴点抽出部, 25 輪郭特徴量計算部, 26 輪郭識別器生成部, 27 統合識別器生成部, 31 服装特徴点抽出部, 32 服装特徴量計算部, 33 輪郭特徴点抽出部, 34 輪郭特徴量計算部, 35 識別計算部, 201 統合識別器生成部

Claims (11)

  1. 認識対象の対象物体が含まれている学習画像と、前記対象物体が含まれていない学習画像とからなる複数の学習画像のそれぞれについて、前記学習画像上の予め定められた複数の画素のうちの所定の画素と、前記複数の画素のうちの前記所定の画素とは異なる他の画素とを画素のペアとして、前記所定の画素を含む領域と、前記他の画素を含む領域とのテクスチャの距離を計算することで、前記複数の画素のそれぞれを前記所定の画素として定めた各前記ペアの第1の特徴量を計算する第1の特徴量計算手段と、
    複数の前記第1の特徴量を用いた統計学習により、画像から前記対象物体を検出する第1の識別器を生成する第1の識別器生成手段と
    を備える学習装置。
  2. 前記複数の学習画像のそれぞれについて、前記学習画像に対するフィルタ処理を行なうことで前記学習画像から輪郭を抽出する計算を行い、その計算結果から第2の特徴量を生成する第2の特徴量計算手段と、
    複数の前記第2の特徴量を用いた統計学習により、前記画像から前記対象物体を検出する第2の識別器を生成する第2の識別器生成手段と、
    前記第1の識別器と、前記第2の識別器とを統合して、前記画像から前記対象物体を検出する第3の識別器を生成する第3の識別器生成手段と
    をさらに備える請求項1に記載の学習装置。
  3. 前記第3の識別器生成手段は、前記第1の識別器と前記第2の識別器とを線形結合することにより前記第3の識別器を生成する
    請求項2に記載の学習装置。
  4. 前記複数の学習画像のそれぞれについて、前記学習画像に対するフィルタ処理を行なうことで前記学習画像から輪郭を抽出する計算を行い、その計算結果から第2の特徴量を生成する第2の特徴量計算手段をさらに備え、
    前記第1の識別器生成手段は、複数の前記第1の特徴量、および複数の前記第2の特徴量を用いた統計学習により、前記第1の識別器を生成する
    請求項1に記載の学習装置。
  5. 認識対象の対象物体が含まれている学習画像と、前記対象物体が含まれていない学習画像とからなる複数の学習画像のそれぞれについて、前記学習画像上の予め定められた複数の画素のうちの所定の画素と、前記複数の画素のうちの前記所定の画素とは異なる他の画素とを画素のペアとして、前記所定の画素を含む領域と、前記他の画素を含む領域とのテクスチャの距離を計算することで、前記複数の画素のそれぞれを前記所定の画素として定めた各前記ペアの特徴量を計算する特徴量計算ステップと、
    複数の前記特徴量を用いた統計学習により、画像から前記対象物体を検出する識別器を生成する識別器生成ステップと
    を含む学習方法。
  6. 認識対象の対象物体が含まれている学習画像と、前記対象物体が含まれていない学習画像とからなる複数の学習画像のそれぞれについて、前記学習画像上の予め定められた複数の画素のうちの所定の画素と、前記複数の画素のうちの前記所定の画素とは異なる他の画素とを画素のペアとして、前記所定の画素を含む領域と、前記他の画素を含む領域とのテクスチャの距離を計算することで、前記複数の画素のそれぞれを前記所定の画素として定めた各前記ペアの特徴量を計算する特徴量計算ステップと、
    複数の前記特徴量を用いた統計学習により、画像から前記対象物体を検出する識別器を生成する識別器生成ステップと
    を含む処理をコンピュータに実行させるプログラム。
  7. 入力画像上の所定の画素と、前記所定の画素とは異なる他の画素とを画素のペアとして、前記所定の画素を含む領域と、前記他の画素を含む領域とのテクスチャの距離を計算することで、予め定められた複数の前記ペアの第1の特徴量を計算する第1の特徴量計算手段と、
    認識対象の対象物体が含まれている学習画像と、前記対象物体が含まれていない学習画像とから求められた複数の前記第1の特徴量を用いた統計学習により生成された第1の識別器を用い、前記第1の特徴量計算手段により計算された前記第1の特徴量に基づいて、前記入力画像から前記対象物体を検出する検出手段と
    を備える認識装置。
  8. 前記入力画像に対するフィルタ処理を行なうことで前記入力画像から輪郭を抽出する計算を行い、その計算結果から第2の特徴量を生成する第2の特徴量計算手段をさらに備え、
    前記検出手段は、前記対象物体が含まれている学習画像と、前記対象物体が含まれていない学習画像とから求められた複数の前記第2の特徴量を用いた統計学習により生成された第2の識別器と前記第1の識別器とが統合された第3の識別器を用い、前記第1の特徴量計算手段により計算された前記第1の特徴量、および前記第2の特徴量計算手段により計算された前記第2の特徴量に基づいて、前記入力画像から前記対象物体を検出する
    請求項7に記載の認識装置。
  9. 前記入力画像に対するフィルタ処理を行なうことで前記入力画像から輪郭を抽出する計算を行い、その計算結果から第2の特徴量を生成する第2の特徴量計算手段をさらに備え、
    前記検出手段は、前記対象物体が含まれている学習画像と、前記対象物体が含まれていない学習画像とから求められた複数の前記第2の特徴量と、前記複数の第1の特徴量とを用いた統計学習により生成された前記第1の識別器を用い、前記第1の特徴量計算手段により計算された前記第1の特徴量、および前記第2の特徴量計算手段により計算された前記第2の特徴量に基づいて、前記入力画像から前記対象物体を検出する
    請求項7に記載の認識装置。
  10. 入力画像上の所定の画素と、前記所定の画素とは異なる他の画素とを画素のペアとして、前記所定の画素を含む領域と、前記他の画素を含む領域とのテクスチャの距離を計算することで、予め定められた複数の前記ペアの特徴量を計算する特徴量計算ステップと、
    認識対象の対象物体が含まれている学習画像と、前記対象物体が含まれていない学習画像とから求められた複数の前記特徴量を用いた統計学習により生成された識別器を用い、前記特徴量計算ステップにおいて計算された前記特徴量に基づいて、前記入力画像から前記対象物体を検出する検出ステップと
    を含む認識方法。
  11. 入力画像上の所定の画素と、前記所定の画素とは異なる他の画素とを画素のペアとして、前記所定の画素を含む領域と、前記他の画素を含む領域とのテクスチャの距離を計算することで、予め定められた複数の前記ペアの特徴量を計算する特徴量計算ステップと、
    認識対象の対象物体が含まれている学習画像と、前記対象物体が含まれていない学習画像とから求められた複数の前記特徴量を用いた統計学習により生成された識別器を用い、前記特徴量計算ステップにおいて計算された前記特徴量に基づいて、前記入力画像から前記対象物体を検出する検出ステップと
    を含む処理をコンピュータに実行させるプログラム。
JP2007316636A 2007-12-07 2007-12-07 学習装置および方法、認識装置および方法、並びにプログラム Expired - Fee Related JP5041229B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2007316636A JP5041229B2 (ja) 2007-12-07 2007-12-07 学習装置および方法、認識装置および方法、並びにプログラム
EP08253672A EP2068271A3 (en) 2007-12-07 2008-11-10 Detection of an object in an image
US12/328,318 US20090202145A1 (en) 2007-12-07 2008-12-04 Learning appartus, learning method, recognition apparatus, recognition method, and program
CN2008101829149A CN101458764B (zh) 2007-12-07 2008-12-05 学习设备、学习方法、识别设备、识别方法和程序

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007316636A JP5041229B2 (ja) 2007-12-07 2007-12-07 学習装置および方法、認識装置および方法、並びにプログラム

Publications (2)

Publication Number Publication Date
JP2009140283A JP2009140283A (ja) 2009-06-25
JP5041229B2 true JP5041229B2 (ja) 2012-10-03

Family

ID=40403909

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007316636A Expired - Fee Related JP5041229B2 (ja) 2007-12-07 2007-12-07 学習装置および方法、認識装置および方法、並びにプログラム

Country Status (4)

Country Link
US (1) US20090202145A1 (ja)
EP (1) EP2068271A3 (ja)
JP (1) JP5041229B2 (ja)
CN (1) CN101458764B (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011118694A (ja) * 2009-12-03 2011-06-16 Sony Corp 学習装置および方法、認識装置および方法、並びにプログラム
JP2011154501A (ja) * 2010-01-27 2011-08-11 Sony Corp 学習装置、学習方法、識別装置、識別方法、プログラム、及び情報処理システム
JP2011154500A (ja) * 2010-01-27 2011-08-11 Sony Corp 学習装置、学習方法、識別装置、識別方法、及びプログラム
JP2011186519A (ja) * 2010-03-04 2011-09-22 Sony Corp 情報処理装置、情報処理方法およびプログラム
JP2011257805A (ja) * 2010-06-04 2011-12-22 Sony Corp 情報処理装置および方法、並びにプログラム
US8660368B2 (en) * 2011-03-16 2014-02-25 International Business Machines Corporation Anomalous pattern discovery
JP2013003686A (ja) 2011-06-13 2013-01-07 Sony Corp 認識装置および方法、プログラム、並びに記録媒体
US9536137B2 (en) * 2013-03-26 2017-01-03 Megachips Corporation Object detection apparatus
JP6160196B2 (ja) * 2013-04-15 2017-07-12 オムロン株式会社 識別器更新装置、識別器更新プログラム、情報処理装置、および識別器更新方法
JP6168876B2 (ja) * 2013-06-24 2017-07-26 オリンパス株式会社 検出装置、学習装置、検出方法、学習方法及びプログラム
US9158996B2 (en) * 2013-09-12 2015-10-13 Kabushiki Kaisha Toshiba Learning image collection apparatus, learning apparatus, and target object detection apparatus
WO2015076152A1 (ja) 2013-11-20 2015-05-28 日本電気株式会社 ヘルメット着用判定方法、ヘルメット着用判定システム、ヘルメット着用判定装置及びプログラム
GB201800811D0 (en) * 2018-01-18 2018-03-07 Univ Oxford Innovation Ltd Localising a vehicle
JP6872502B2 (ja) * 2018-01-31 2021-05-19 富士フイルム株式会社 画像処理装置、画像処理方法、およびプログラム
JP2020091302A (ja) 2018-12-03 2020-06-11 本田技研工業株式会社 感情推定装置、感情推定方法、およびプログラム
CN111160466B (zh) * 2019-12-30 2022-02-22 深圳纹通科技有限公司 一种基于直方图统计的特征匹配算法
US20240046150A1 (en) * 2021-06-11 2024-02-08 Hitachi Solutions, Ltd. Ai quality monitoring system

Family Cites Families (69)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2375212B (en) * 1999-04-29 2003-06-11 Mitsubishi Electric Inf Tech Method and apparatus for searching for an object using shape
US6411724B1 (en) * 1999-07-02 2002-06-25 Koninklijke Philips Electronics N.V. Using meta-descriptors to represent multimedia information
GB2393012B (en) * 1999-07-05 2004-05-05 Mitsubishi Electric Inf Tech Representing and searching for an object in an image
US6704454B1 (en) * 1999-07-23 2004-03-09 Sarnoff Corporation Method and apparatus for image processing by generating probability distribution of images
EP1089214A3 (en) * 1999-09-30 2005-01-26 Matsushita Electric Industrial Co., Ltd. Apparatus and method for image recognition
GB2360919A (en) * 2000-01-20 2001-10-03 Anthropics Technology Ltd Appearance modelling
US6807286B1 (en) * 2000-04-13 2004-10-19 Microsoft Corporation Object recognition using binary image quantization and hough kernels
US7099510B2 (en) * 2000-11-29 2006-08-29 Hewlett-Packard Development Company, L.P. Method and system for object detection in digital images
KR100450793B1 (ko) * 2001-01-20 2004-10-01 삼성전자주식회사 영역 분할된 영상의 영역 특징치 정합에 기초한객체추출장치 및 그 방법
US6826316B2 (en) * 2001-01-24 2004-11-30 Eastman Kodak Company System and method for determining image similarity
US6845171B2 (en) * 2001-11-19 2005-01-18 Microsoft Corporation Automatic sketch generation
US6915025B2 (en) * 2001-11-27 2005-07-05 Microsoft Corporation Automatic image orientation detection based on classification of low-level image features
US7024033B2 (en) * 2001-12-08 2006-04-04 Microsoft Corp. Method for boosting the performance of machine-learning classifiers
CN100470592C (zh) * 2002-12-17 2009-03-18 中国科学院自动化研究所 基于人体局部和形体信息的敏感图像识别方法
US20060129908A1 (en) * 2003-01-28 2006-06-15 Markel Steven O On-content streaming media enhancement
US7689023B2 (en) * 2003-05-30 2010-03-30 Rabinovich Andrew M Color unmixing and region of interest detection in tissue samples
GB2402535B (en) * 2003-06-05 2006-06-21 Canon Kk Image processing
JP4447245B2 (ja) * 2003-06-06 2010-04-07 オムロン株式会社 特定被写体検出装置
WO2005001750A2 (en) * 2003-06-30 2005-01-06 Honda Motor Co., Ltd. System and method for face recognition
JP2005100122A (ja) * 2003-09-25 2005-04-14 Fuji Photo Film Co Ltd 識別処理に用いる特徴量の種類と識別条件を決定する装置、プログラムならびにプログラムを記録した記録媒体、および特定内容のデータを選別する装置
US7508979B2 (en) * 2003-11-21 2009-03-24 Siemens Corporate Research, Inc. System and method for detecting an occupant and head pose using stereo detectors
JP4423076B2 (ja) * 2004-03-22 2010-03-03 キヤノン株式会社 認識対象切出し装置および方法
US7313270B2 (en) * 2004-05-19 2007-12-25 Applied Vision Company, Llc Vision system and method for process monitoring
US7668376B2 (en) * 2004-06-30 2010-02-23 National Instruments Corporation Shape feature extraction and classification
WO2006093523A2 (en) * 2004-07-15 2006-09-08 Kenji Suzuki Computerized scheme for distinction between benign and malignant nodules in thoracic low-dose ct
SE528068C2 (sv) * 2004-08-19 2006-08-22 Jan Erik Solem Med Jsolutions Igenkänning av 3D föremål
US7447359B2 (en) * 2004-09-07 2008-11-04 Siemens Medical Solutions Usa, Inc. System and method for anatomical structure parsing and detection
KR100703528B1 (ko) * 2004-12-09 2007-04-03 삼성전자주식회사 영상 인식 장치 및 방법
US7715597B2 (en) * 2004-12-29 2010-05-11 Fotonation Ireland Limited Method and component for image recognition
US7835549B2 (en) * 2005-03-07 2010-11-16 Fujifilm Corporation Learning method of face classification apparatus, face classification method, apparatus and program
US7548637B2 (en) * 2005-04-07 2009-06-16 The Board Of Trustees Of The University Of Illinois Method for detecting objects in an image using pair-wise pixel discriminative features
JP4316541B2 (ja) * 2005-06-27 2009-08-19 パナソニック株式会社 監視記録装置及び監視記録方法
US7630517B2 (en) * 2005-07-13 2009-12-08 Schlumberger Technology Corporation Computer-based generation and validation of training images for multipoint geostatistical analysis
US7783095B2 (en) * 2005-08-11 2010-08-24 Siemens Medical Solutions Usa, Inc. System and method for fetal biometric measurements from ultrasound data and fusion of same for estimation of fetal gestational age
JP4618098B2 (ja) * 2005-11-02 2011-01-26 ソニー株式会社 画像処理システム
US7711145B2 (en) * 2006-01-27 2010-05-04 Eastman Kodak Company Finding images with multiple people or objects
US7903870B1 (en) * 2006-02-24 2011-03-08 Texas Instruments Incorporated Digital camera and method
JP2007241479A (ja) * 2006-03-06 2007-09-20 Toshiba Corp 変動領域検出装置及びその方法
US7488087B2 (en) 2006-05-19 2009-02-10 Honeywell International Inc. Light guide and display including a light guide
US8306326B2 (en) * 2006-08-30 2012-11-06 Amazon Technologies, Inc. Method and system for automatically classifying page images
TWI316690B (en) * 2006-09-05 2009-11-01 Univ Nat Cheng Kung Video annotation method by integrating visual features and frequent patterns
US7809185B2 (en) * 2006-09-21 2010-10-05 Microsoft Corporation Extracting dominant colors from images using classification techniques
US8073253B2 (en) * 2006-09-29 2011-12-06 General Electric Company Machine learning based triple region segmentation framework using level set on PACS
JP4512578B2 (ja) * 2006-10-27 2010-07-28 株式会社ブリヂストン 分離フィルタ決定装置及びタイヤ検査装置
US20080107341A1 (en) * 2006-11-02 2008-05-08 Juwei Lu Method And Apparatus For Detecting Faces In Digital Images
JP4321645B2 (ja) * 2006-12-08 2009-08-26 ソニー株式会社 情報処理装置および情報処理方法、認識装置および情報認識方法、並びに、プログラム
US7903883B2 (en) * 2007-03-30 2011-03-08 Microsoft Corporation Local bi-gram model for object recognition
RU2007119908A (ru) * 2007-05-29 2008-12-10 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко. Адаптивный к галерее способ и система распознавания лиц
US7844085B2 (en) * 2007-06-07 2010-11-30 Seiko Epson Corporation Pairwise feature learning with boosting for use in face detection
US8233704B2 (en) * 2007-06-13 2012-07-31 Sri International Exemplar-based heterogeneous compositional method for object classification
US7890443B2 (en) * 2007-07-13 2011-02-15 Microsoft Corporation Learning classifiers using combined boosting and weight trimming
JP4424386B2 (ja) * 2007-08-09 2010-03-03 三菱電機株式会社 画像表示装置、画像処理装置および画像処理方法
US8295543B2 (en) * 2007-08-31 2012-10-23 Lockheed Martin Corporation Device and method for detecting targets in images based on user-defined classifiers
US8556814B2 (en) * 2007-10-04 2013-10-15 Siemens Medical Solutions Usa, Inc. Automated fetal measurement from three-dimensional ultrasound data
US8428367B2 (en) * 2007-10-26 2013-04-23 International Business Machines Corporation System and method for electronic document classification
US8170280B2 (en) * 2007-12-03 2012-05-01 Digital Smiths, Inc. Integrated systems and methods for video-based object modeling, recognition, and tracking
US8165406B2 (en) * 2007-12-12 2012-04-24 Microsoft Corp. Interactive concept learning in image search
KR100947990B1 (ko) * 2008-05-15 2010-03-18 성균관대학교산학협력단 차영상 엔트로피를 이용한 시선 추적 장치 및 그 방법
US8199999B2 (en) * 2008-06-17 2012-06-12 Cambridge Research & Instrumentation, Inc. Image classifier training
US8175379B2 (en) * 2008-08-22 2012-05-08 Adobe Systems Incorporated Automatic video image segmentation
JP4623387B2 (ja) * 2008-09-04 2011-02-02 ソニー株式会社 学習装置および方法、認識装置および方法、並びにプログラム
JP2010108475A (ja) * 2008-10-03 2010-05-13 Sony Corp 画像処理装置および方法、プログラム、並びに記録媒体
JP4670976B2 (ja) * 2008-10-03 2011-04-13 ソニー株式会社 学習装置および方法、認識装置および方法、プログラム、並びに記録媒体
US8103056B2 (en) * 2008-10-15 2012-01-24 Honeywell International Inc. Method for target geo-referencing using video analytics
JP5326910B2 (ja) * 2009-01-20 2013-10-30 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
US8774498B2 (en) * 2009-01-28 2014-07-08 Xerox Corporation Modeling images as sets of weighted features
JP2010176380A (ja) * 2009-01-29 2010-08-12 Sony Corp 情報処理装置および方法、プログラム、並びに記録媒体
JP2010266983A (ja) * 2009-05-13 2010-11-25 Sony Corp 情報処理装置及び方法、学習装置および方法、プログラム、並びに情報処理システム
JP2012053606A (ja) * 2010-08-31 2012-03-15 Sony Corp 情報処理装置および方法、並びにプログラム

Also Published As

Publication number Publication date
JP2009140283A (ja) 2009-06-25
EP2068271A2 (en) 2009-06-10
CN101458764B (zh) 2011-08-31
CN101458764A (zh) 2009-06-17
EP2068271A3 (en) 2012-06-27
US20090202145A1 (en) 2009-08-13

Similar Documents

Publication Publication Date Title
JP5041229B2 (ja) 学習装置および方法、認識装置および方法、並びにプログラム
JP4670976B2 (ja) 学習装置および方法、認識装置および方法、プログラム、並びに記録媒体
JP4623387B2 (ja) 学習装置および方法、認識装置および方法、並びにプログラム
US9002101B2 (en) Recognition device, recognition method, and computer program product
US9098775B2 (en) Multi-class identifier, method, and computer-readable recording medium
US10204283B2 (en) Image recognizing apparatus, image recognizing method, and storage medium
JP2011118694A (ja) 学習装置および方法、認識装置および方法、並びにプログラム
JP2010108475A (ja) 画像処理装置および方法、プログラム、並びに記録媒体
Bodesheim et al. Local novelty detection in multi-class recognition problems
JP5202148B2 (ja) 画像処理装置、画像処理方法、及びコンピュータプログラム
US11521099B2 (en) Dictionary generation apparatus, evaluation apparatus, dictionary generation method, evaluation method, and storage medium for selecting data and generating a dictionary using the data
JP2010204826A (ja) 学習装置及び物体検出装置
US20100290700A1 (en) Information processing device and method, learning device and method, programs, and information processing system
US8761510B2 (en) Object-centric spatial pooling for image classification
JP6897749B2 (ja) 学習方法、学習システム、および学習プログラム
JP2011013732A (ja) 情報処理装置、情報処理方法、およびプログラム
CN111783505A (zh) 伪造人脸的识别方法、装置和计算机可读存储介质
US9449259B1 (en) Opportunistic cascade and cascade training, evaluation, and execution for vision-based object detection
JP2012053606A (ja) 情報処理装置および方法、並びにプログラム
Krishnan et al. Conditional distance based matching for one-shot gesture recognition
JP2017102906A (ja) 情報処理装置、情報処理方法及びプログラム
Cholakkal et al. A classifier-guided approach for top-down salient object detection
JP2016151805A (ja) オブジェクト検出装置、オブジェクト検出方法、及びプログラム
US8755594B2 (en) Information processing device and method, and program
JP2016062249A (ja) 識別辞書学習システム、認識辞書学習方法および認識辞書学習プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101111

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111220

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120206

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120614

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120627

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150720

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees