JP6529246B2 - 特徴抽出方法、特徴抽出装置、及びプログラム - Google Patents

特徴抽出方法、特徴抽出装置、及びプログラム Download PDF

Info

Publication number
JP6529246B2
JP6529246B2 JP2014242461A JP2014242461A JP6529246B2 JP 6529246 B2 JP6529246 B2 JP 6529246B2 JP 2014242461 A JP2014242461 A JP 2014242461A JP 2014242461 A JP2014242461 A JP 2014242461A JP 6529246 B2 JP6529246 B2 JP 6529246B2
Authority
JP
Japan
Prior art keywords
image
feature
feature extraction
features
groups
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014242461A
Other languages
English (en)
Other versions
JP2016103244A5 (ja
JP2016103244A (ja
Inventor
靖 岩崎
靖 岩崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2014242461A priority Critical patent/JP6529246B2/ja
Priority to US14/945,920 priority patent/US9600737B2/en
Publication of JP2016103244A publication Critical patent/JP2016103244A/ja
Publication of JP2016103244A5 publication Critical patent/JP2016103244A5/ja
Application granted granted Critical
Publication of JP6529246B2 publication Critical patent/JP6529246B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)

Description

本発明は、画像を複数の領域に分割し、分割した領域に対して特徴を抽出する特徴抽出方法、特徴抽出装置、及びそのプログラムに関する。
従来から、画像全体の大域的な特徴を抽出する方法として、ブロック分割による特徴抽出方法が知られている。この特徴抽出方法では、縦方向と横方向に複数の直線を引いて画像を複数のブロック領域に分割し、このブロック領域のそれぞれに対して、色情報の平均値やヒストグラムのような特徴量を抽出する。これにより、画像全体の大域的な特徴を抽出することができる。
また、特許文献1には、紙幣の偽造防止のために、円形の偽造防止マークの領域に対して、放射方向線上と円周上の領域における特徴量を抽出する技術が開示されている。
特開2006−202100号公報
情報処理学会研究報告.CVIM,[コンピュータビジョンとイメージメディア]99(3),65−72,1999−01−21. Efficient Graph−Based Image Segmentation,P.F.Felzenszwalb、IJCV2004. SLIC Superpixels,R.Achanta,A.Shaji,K.Smith,A.Lucchi,EPFL Technical Report,2010.
消失点を含む画像では、消失点から放射状にエッジが出ている場合が多く、また、消失点を中心とする同心円上に物体が配置されている場合が多い。そのため、消失点を含む画像に対してブロックに分割して特徴を抽出しても、適切に特徴を抽出することはできなかった。
また、特許文献1の技術は、紙幣の偽造防止マークの放射方向線上と円周上の領域のみについて特徴量を抽出し、そのマークが正しいかを判別しているため、消失点を含む画像の大域的な特徴を適切に抽出するには十分でなかった。
上記課題を解決するために、本発明は、画像の特徴を抽出する特徴抽出方法であって、画像を取得する取得ステップと、前記取得した画像の消失点を検出する検出ステップと、前記検出した消失点に基づいてm個の楕円とn本の半直線(m=0の場合にn≧2の整数、m≧1以上の整数の場合はn≧0の整数)を設定する設定ステップと、前記設定された楕円および半直線により分割された領域の特徴を抽出する抽出ステップと、複数の前記画像について前記分割された領域の特徴を抽出し、当該抽出した複数の前記特徴を複数のグループにクラスタリングすることにより、前記複数の画像を前記複数のグループに分類する分類ステップとを有し、前記分類ステップでは、前記複数のグループごとに保持された画像の小領域における特徴と正解ラベルの情報を用いて、前記複数のグループに分類された画像における分割された領域の特徴に基づき前記画像の小領域のラベルを識別することを特徴とする。
以上の構成によれば、本発明は、消失点を含む画像に対して適切に大域的な特徴を抽出することが可能となる。
本実施形態に関わる特徴抽出装置のブロック図。 本実施形態に関わる特徴抽出の処理フローを説明する図。 本実施形態に関わる意味的領域分割の処理のフローを説明する図。 本実施形態に関わる学習工程における詳細な処理のフローを説明する図。 本実施形態に関わる識別工程における詳細な処理のフローを説明する図。 本実施形態に関わる入力画像と正解ラベル画像を模式的に説明する図 本実施形態に関わる画像の分割方法を説明する図。 本実施形態に関わる画像の構図を分割する楕円と半直線のパターンを示す図。
以下、図面を参照して本発明の実施形態を詳細に説明する。
図1は本実施形態に関わる特徴抽出装置の構成(機能構成)を説明する図である。図1に示す各機能部は、特徴抽出装置が有しているCPUがROMまたはRAM等の格納手段に格納されている制御プログラムを実行することにより実現される。
本実施形態の特徴抽出装置は、特徴を抽出すべき画像を取得する取得部101と、取得した画像の消失点を検出する特徴点検出部102と、検出した消失点に基づいて楕円および半直線を設定して画像を複数の領域に分割する設定部103とを備えている。また、画像を分割した領域ごとに特徴量を抽出する特徴抽出部104と、その特徴量をデータとして出力する出力部105と、特徴量をクラスタリングして画像をグループに分けるクラスタリング部106とを備える。
また、グループに分けられた画像に対して小領域ごとにラベルを取得する処理を実行するために、画像を小領域に分割するための小領域分割部107と、学習用の正解ラベル画像の小領域から特徴量に対応したラベルを抽出するラベル抽出部108とを備える。さらに、学習データとして学習した特徴量に対応したラベルを各クラスタに分ける学習データ分配部と、各クラスタに分けられたラベルに基づいて識別すべき画像の小領域におけるラベルを取得するラベル取得部110とを備えている。
以下、特徴抽出装置の各部の機能について、本実施形態における処理フローを参照しつつ詳細に説明する。
図2は本実施形態における特徴抽出の処理フローを説明する図である。本処理フローにおいて、ステップS101〜S107が画像特徴量の抽出工程に相当し、S108,S109が抽出した特徴量に基づいて画像を認識し複数のグループに分ける認識工程に相当する。本実施形態では、画像特徴量の抽出工程と画像の整理工程とを一連の処理としているが、これら2つの工程を続けて行う必要はなく、それぞれ任意のタイミングで行うようにしてもよい。
図2において、ステップS101では、取得部101により複数の画像が取得される。取得部101は、デジタルカメラ等の撮像手段により撮影された画像やスキャナ等の入力デバイスを用いて装置内の記憶手段(HDD等)に記憶されている画像を取得する。特徴抽出装置にデジタルカメラ等の撮像手段が備えられている場合には、取得部は直接、撮像装置より画像を取得することもできる。
ステップS102では、S101にて得られた取得画像に対して、特徴点検出部102が画像全体の大域的情報を用いて消失点を検出する。本実施形態では、画像の特徴点として消失点を検出しているが、単に画像の中心を検出したり、特定の被写体の重心を検出するようにしてもよい。また、本実施形態では、特徴点検出部102による消失点検出方法として、非特許文献1に記載の方法を用いる。この方法では、まず特徴点群を同一直線上にあるべき点の集合にクラスタリングし、その後、各直線を検出してそれらが交わるべき点を消失点として検出する。さらに、得られた複数の消失点から消失線を検出する。
また、ステップS102では、取得画像を消失点が検出された画像と検出されなかった画像とに分類する。消失点の検出されなかった画像はブロック分割による特徴量検出が行われる処理へと移行され、消失点の検出された画像のみがステップS103以降の処理へ進む。
次に、ステップS103において、設定部103は画像の消失点を画像座標系の原点に設定する。なお、画像の横方向右向きがx方向の正方向、縦方向上向きがy方向の正方向である。
続くステップS104において、設定部103は、ステップS103により設定した原点を中心として、大きさの異なるm個の楕円を設定する。図7は本実施形態における画像の分割方法を説明する図面であり、本実施形態では、m=4として、E1,E2,E3,E4の4個の楕円を設定する。図7は本実施形態における画像の分割方法を説明する図であり、図7(A)が4個の楕円により画像が分割されている様子を図示している。このとき、各楕円のx方向半径a1,a2,a3,a4およびy方向半径b1、b2、b3,b4は、画像の幅をw、高さをhとすると、以下のように設定される。
[数式1]
E1:a1=(w/2)/4=w/8 b1=(h/2)/4=h/8
E2:a2=2a1 b2=2b1
E3:a3=3a1 b3=3b1
E4:a4=4a1 b4=4b1
そして、ステップS105では、設定部103が原点を始点として偏角を所定の大きさとする半直線をn本設定する。本実施形態ではn=8として、8本の半直線を設定する。図7(B)は、8本の半直線により画像が分割されている様子を示す。同図に示されるように、始線(x軸の正方向)から正方向(反時計回り)に向かって半直線L1、L2、L3、L4、L5、L6、L7、L8を設定しており、各半直線の偏角θ1、θ2、θ3、θ4、θ5、θ6、θ7、θ8は以下のようになる。このように、本実施形態では、8本の半直線により画像を複数の領域に分割している。
[数式2]
L1:θ1=0
L2:θ2=arctan(h/w)
L3:θ3=π/2
L4:θ4=π−θ2
L5:θ5=π
L6:θ6=π+θ2
L7:θ7=3π/2
L8:θ8=2π−θ2
この結果、本実施形態では、図7(C)に示すように、楕円E1、E2、E3、E4と半直線L1、L2、L3、L4、L5、L6、L7、L8とにより、画像が40個の分割領域A1、A2、A3、…、A40に分割されるようになる。
ステップS106において、特徴抽出部104は、S104、S105によって分割された画像の各分割領域から特徴量の抽出を行う。特徴量としては、色情報、幾何特徴、色ヒストグラム、バイナリパターン特徴等を抽出することができるが、本実施形態では、色情報R、G、Bの各チャネルの平均を特徴量として抽出する。特徴抽出部104は、分割領域Aiに対して、その領域内の全画素を参照することによりRチャネルの平均値r、Gチャネルの平均値g、Bチャネルの平均値bを算出する。分割領域Aiに対する特徴量fiは、以下の数式3として表わされる。
[数式3]
fi=(r,g,b)
特徴抽出部104は、全ての分割領域A1〜A40に対して上述した特徴量の抽出を行うことにより、画像全体としての特徴量Fを取得する。この特徴量Fは、画像全体としての構図情報を反映したものであり、以下の数式4として表わされる。
[数式4]
F=(f1,…,f40)
なお、消失点の位置によっては分割領域Aiが画像の外側になってしまう場合もある。このような場合には画像からの特徴抽出が行えないので、NA(Not Available)に相当するフラグを特徴量fiに持たせればよい。さらに、ステップS106では、出力部105が抽出した特徴量を出力する。出力形態は、特徴量である数値を列挙したテキストファイルでも、バイナリ化したバイナリファイルでもよいし、本実施形態のように画像の整理についても一連の処理として行う場合は、装置内の格納手段(メモリ等)にデータのまま出力するようにしてもよい。
ステップS107では、ステップS101で取得した全画像に対して特徴量の抽出が完了したかを判断し、特徴量の抽出が完了していなければステップS102に戻り、残りの画像についても特徴量の抽出を行う。
ステップS108以降は、本実施形態の画像特徴の抽出処理に続いて行われる処理であり、抽出した特徴量に基づいて画像をいくつかのグループに分ける処理になる。なお、既に本ステップで画像がグループ分けされていて、この既存のグループに対して新しく画像を整理する場合には、ステップS108をスキップし、後述するステップS109により画像を整理する。
ステップS108では、クラスタリング部106が、S106で得られた特徴量Fをクラスタリングする。例えば、取得画像数がNのとき、S106では特徴抽出部104が画像ごとに特徴量Fを求め、結果としてN個の特徴量Fを抽出している。ステップS108では、構図情報を反映した特徴量Fをクラスタリングすることにより、画像をいくつかのグループに分類する。なお、特徴量Fには分割領域A1〜A40から抽出された特徴量f1〜f40が含まれているが、一つでもNAとなっている特徴量Fについては、これを除外する。
本実施形態では、既知のK−meansを利用して特徴量Fをクラスタリングする。K−meansのKは、出来上がるクラスタの数を表したものである。K−meansによるクラスタリングでは、与えられたN個のデータの中からランダムにK個のデータを選択する。このK個のデータは、シードと呼ばれる。次に、各データを最も近いシードのクラスタに属させる。そして、各クラスタで重心を計算して新しいシードを求め、再度クラスタリングを行う。これを繰り返し行い、クラスタリング結果が変化しなくなったところで終了する。これにより、N個のデータをK個のクラスタにクラスタリングすることができる。本実施形態では、K−meansを利用して特徴量Fをクラスタリングすることで、大量の画像に対しても特徴量の類似する画像同士を集めて整理することができる。
ステップS109では、S108によって既にクラスタが得られている場合に、新しく画像を割り当てるステップである。本実施形態では、新しく整理する画像についてステップS107までの処理によって画像の特徴量Fが求められており、クラスタリング部106が、これをクラスタの平均特徴量と比較する。そして、両者の距離が一番小さくなったクラスタに新しい画像を割り当てる。以上により、取得部101により新しく画像が取得された場合でも、継続した画像の管理が可能になる。
本実施形態では、消失点が含まれる画像に対して楕円と半直線との組合せにより複数の分割領域に分割し、各分割領域より特徴量を抽出するようにしている。この構成によって、本実施形態では、構図情報を反映した画像特徴を抽出することができ、消失点を含む画像に対して適切に大域的な特徴を抽出することが可能となる。
ここで、上述した本実施形態の特徴抽出装置によってクラスタ(グループ)に分けられた画像に対して、意味的領域分割の処理を行う構成について説明する。この意味的領域分割は、本実施形態のS108によって作成されたクラスタ(グループ)に分けられた画像に対して、付随的に実行可能な処理である。本実施形態において、意味的領域分割とは、画像を小領域に分割し、この小領域に対して「空」や「木」といった「意味」を付与する処理になる。
図3は、本実施形態における意味的領域分割の処理のフローである。なお、本実施形態の意味的領域分割を実行するにあたっては、上述したS108のクラスタリング部106による特徴量Fのクラスタリングが行われていることが前提となる。その上で、図3のステップS201では、学習工程として、クラスタリング部106により得られたクラスタに対して識別器を学習する。
ステップS201では、入力画像に対して正解ラベル画像が事前に用意されている。ラベルとは、識別したい対象であり、例えば「人」、「木」、「空」、「その他」などである。そして、画像を与えたときにその画素それぞれに対して、それが何であるかのラベルが付与された画像がラベル画像である。このラベル画像は、各ラベルに特定の色を割り振って表現してもよい。そして、正解ラベル画像とは、入力画像に対して予め画素ごとに正しいと認識されたラベルが入力された画像である。図6は、入力画像と正解ラベル画像を模式的に説明する図である。ここでは、図6(A)の入力画像の各領域10,20,30,40の画素に対して、図6(B)に示すように各々異なるラベル「人」、「木」、「空」、「その他」が付与されている。正解ラベル画像は、本装置内の格納手段に蓄積される。また、識別器は、特徴量を与えたときにラベルを出力するものであり、本実施形態では、例えばサポートベクトルマシン、ニューラルネットワーク、ロジスティック回帰などの既知の識別手法を用いることができる。
図4は、図3のステップS201学習工程における詳細な処理のフローを示すものである。同図のステップS201−1では、小領域分割部107が、格納手段内に存在する画像に対して小領域分割を行う。小領域とは視覚的に類似している画素の集まりのことであり、super−pixel(スーパーピクセル、以下、SP)と呼ばれる。このようなSPに分割する小領域分割の手法としては、非特許文献1または非特許文献2等を用いることができる。
ステップS201−2において、特徴抽出部104は、分割した各SPに対して特徴量を抽出する。特徴量としては、色情報、幾何特徴、位置情報、色ヒストグラム、バイナリパターン特徴等を抽出することができる。
ステップS201−3では、ラベル抽出部108がSPに対する正解ラベルを抽出する。ラベル抽出部108は、まず正解ラベル画像に対してSPに相当する領域を切り出し、そのSPの領域内の全画素に対して正解ラベルを集計する。そして、ラベル抽出部108は、集計した正解ラベルのうち一番多かったラベルをそのSPの正解ラベルとして抽出する。例えば、取得したSP100画素について正解ラベルの集計を行ったところ、「空」ラベルが90画素で「木」ラベルが10画素であったとする。このとき、一番多かったラベルは「空」ラベルとなるので、ラベル抽出部108は、このSPの正解ラベルを「空」ラベルとして抽出する。
ステップS201−4において、ラベル抽出部108がSP特徴量と正解ラベルのペアを全学習画像の全SPに対して行うことにより、学習データが構築される。そして、ステップS201−5において、学習データ分配部109が、学習データとしてのSP特徴量と正解ラベルがペアになった情報をクラスタに対応させてK個のグループに分ける。続くステップS201−6では、分けたK個のグループそれぞれで識別器を学習することによって、学習済み識別器をK個構築する。構築された学習済み識別器は、例えば装置内の格納手段等に保持される。
図3に戻ると、ステップS201によりクラスタごとにK個の学習済み識別器を構築すると、ステップS202へと進み、認識工程として、学習済み識別器を用いて意味的領域分割を行う。図5は、図3のステップS202識別工程における詳細な処理のフローを示すものである。
上述した通り、意味的領域分割を実行するにあたっては、クラスタリング部106による特徴量Fのクラスタリングまでが行われていることが前提となっている。そこで、ステップS202−1において、取得部101は、取得画像をクラスタ毎の識別器のいずれかに割り当て、小領域分割部107が、その取得画像に対してSP分割を行う。
続いて、ステップS202−2では、特徴抽出部104が、分割した各SPに対して特徴量を抽出する。そして、ステップS202−3において、ラベル取得部110が、割り当てられたクラスタに対応する識別器に特徴量を入力することによって、そのSPのラベルが識別される。以上のように、分割した全SPに対してラベルを識別することにより、認識画像に対するラベル画像を得ることができる。
本実施形態は、全学習画像に対して一つの識別器で対応する汎用識別器によって画像を識別する構成ではなく、消失点に基づいたクラスタごとの識別器で対応する専門識別器によって画像を識別する構成となっている。この構成により、本実施形態は、適切な専門識別器を設定でき、高い精度で画像を識別できるようになる。
なお、本実施形態の上述の説明では、設定部103が設定した楕円のx方向半径、y方向半径の比を画像の幅と高さの比(アスペクト比)と一致するようにしたが、これらの比は異なっていてもよい。また、本実施形態は、x方向半径、y方向半径が等しい形態、すなわち正円を排除するものでもない。また、本実施形態では、設定部103が設定した各楕円のx方向半径、y方向半径を一定間隔としたが、一定間隔以外としてもよい。また、半直線の偏角も同様に、一定間隔以外としてもよい。
また、本実施形態では、画像の消失点に基づいて楕円および半直線の両方を設定して、画像を分割するようにしているが、楕円と半直線のいずれか一方のみを設定することにより画像を分割するようにしてもよい。楕円のみで画像を分割するには少なくとも1個の楕円が必要であり、半直線のみで画像を分割するには少なくとも2本の半直線が必要である。すなわち、本実施形態の特徴抽出方法では、m=0の場合はn≧2の整数、またはm≧1以上の整数の場合はn≧0の整数となる楕円および半直線を設定すればよい。
また、本実施形態では、楕円の個数m=4、半直線の本数n=8としているが、この2つのパラメータm,nは、例えば、次のように適宜設定することができる。まず、パラメータ(m,n)の候補をリストとして作成する。ここでは、m=2,3,4,5をmの候補とし、またn=4,8,16,32の候補とする。すなわち、パラメータ(m,n)の候補リストは、(m,n)=(2,4),(2,8),(2,16),(2,32),…,(5,4),(5,8),(5,16),(5,32)となる。
次に、候補リストのmの値に対して楕円の半径aを設定する。画像の幅をw、高さをhとし、内側から外側にかけてのm個の楕円をそれぞれE1、E2、…、Emとすると、楕円のx方向半径aおよびy方向半径bは、以下の数式5のように表わされる。
[数式5]
E1:a1=(w/2)/m=w/(2m) b1=(h/2)/m=h/(2m)
E2:a2=2a1 b2=2b1

Em:am=ma1 bm=mb1
また、先に設定したn個の楕円に対して始線(x軸の正の向き)から正の向き(反時計回り)にかけてn本の半直線L1、L2、…、Lnを設定する。各半直線の偏角は、以下の数式6として表わされる。
[数式6]
L1:θ1=0
L2:θ2=2π/n

Ln:θn=(n−1)(2π/n)
ここで、以上のように楕円の半径と半直線の偏角を設定すると、(m,n)の候補リストに対して画像の構図を分割する楕円と半直線のパターンは、図8に示すようになる。
次に、正解ラベル画像がある学習画像を二分して学習画像と認識画像とし、学習画像に対して候補リスト(m,n)の楕円と半直線で領域を分割し、上述した本実施形態の手法により複数のクラスタを得る。
次にクラスタを評価するために、得られた複数のクラスタに正解ラベル画像がある認識画像を割り当てる。この処理は、先に説明したステップS109と同様にして行うことができる。そして、各クラスタから出力されるラベル画像について、正解ラベル画像と出力ラベル画像が近いほど精度が高いということになり、一致度を指標化した精度指標を設定してクラスタを評価する。このように、精度指標を設けて全クラスタを評価する。そして、一番精度が高いと判断されたクラスタに対応する(m,n)が、最適なパラメータとして決定される。
以降は、取得部101により取得された正解ラベル画像がない画像に対して特徴量の抽出、更には意味的領域分割を行う際には、以上のように決定した最適パラメータの(m,n)を用いることにより、精度の高い結果を得ることができる。
以上説明したように、本実施形態に関わる特徴検出方法は、消失点が含まれる画像に対して楕円と半直線との組合せにより複数の分割領域に分割し、各分割領域より特徴量を抽出するようにしている。この構成によって、本実施形態では、構図情報を反映した画像特徴を抽出することができ、消失点を含む画像に対して適切に大域的な特徴を抽出することが可能となる。特に、本実施形態では、直線ではなく半直線を設定して画像を分割している。これにより、例えば三本の半直線により偏角0°、120°、240°のように画像を三分割することができるなど、画像に対して適切に特徴量の抽出ができるようになる。
また、本実施形態は、クラスタ(グループ)に分けられた画像を分割してなる小領域に対して「空」や「木」といった「意味」を付与する際に、消失点に基づいたクラスタごとの識別器で対応する専門識別器によって画像を識別する。この構成により、本実施形態では、高い精度で画像を識別できるようになる。
また、本発明は、上記実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(又はCPUやMPU等)がプログラムを読み出して実行する処理である。また、本発明は、複数の機器から構成されるシステムに適用しても、1つの機器からなる装置に適用してもよい。本発明は上記実施例に限定されるものではなく、本発明の趣旨に基づき種々の変形(各実施例の有機的な組合せを含む)が可能であり、それらを本発明の範囲から除外するものではない。即ち、上述した各実施例及びその変形例を組み合わせた構成も全て本発明に含まれるものである。
101 取得部
102 特徴点検出部
103 設定部
104 特徴抽出部
105 出力部
106 クラスタリング部
107 小領域分割部
108 ラベル抽出部
109 学習データ分配部
110 ラベル取得部

Claims (8)

  1. 画像の特徴を抽出する特徴抽出方法であって、
    画像を取得する取得ステップと、
    前記取得した画像の消失点を検出する検出ステップと、
    前記検出した消失点に基づいてm個の楕円とn本の半直線(m=0の場合にn≧2の整数、m≧1以上の整数の場合はn≧0の整数)を設定する設定ステップと、
    前記設定された楕円および半直線により分割された領域の特徴を抽出する抽出ステップと
    複数の前記画像について前記分割された領域の特徴を抽出し、当該抽出した複数の前記特徴を複数のグループにクラスタリングすることにより、前記複数の画像を前記複数のグループに分類する分類ステップとを有し、
    前記分類ステップでは、前記複数のグループごとに保持された画像の小領域における特徴と正解ラベルの情報を用いて、前記複数のグループに分類された画像における分割された領域の特徴に基づき前記画像の小領域のラベルを識別することを特徴とする特徴抽出方法。
  2. 前記設定ステップでは、x方向半径およびy方向半径が一定間隔となるように複数の前記楕円を設定することを特徴とする請求項1に記載の特徴抽出方法。
  3. 前記設定ステップでは、偏角が一定間隔となるように複数の前記半直線を設定することを特徴とする請求項1または2に記載の特徴抽出方法。
  4. 前記抽出ステップでは、前記分割された領域の特徴として、色情報、幾何特徴、色ヒストグラム、バイナリパターン特徴のいずれかを抽出することを特徴とする請求項1から3のいずれか1項に記載の特徴抽出方法。
  5. 正解ラベルを有する画像を用いて、当該画像の小領域における特徴と正解ラベルとの情報を学習するステップをさらに有することを特徴とする請求項に記載の特徴抽出方法。
  6. 前記取得した画像から消失点が検出できなかった場合、前記設定ステップでは前記取得した画像を複数のブロックに分割し、前記抽出ステップでは前記複数のブロックから特徴を抽出することを特徴とする請求項1からのいずれか1項に記載の特徴抽出方法。
  7. 画像の特徴を抽出する特徴抽出装置であって、
    画像を取得する取得手段と、
    前記取得手段により取得した画像の消失点を検出する検出手段と、
    前記検出手段により検出した消失点に基づいてm個の楕円とn本の半直線(m=0の場合にn≧2の整数、m≧1以上の整数の場合はn≧0の整数)を設定する設定手段と、
    前記設定手段により設定された楕円および半直線により分割された領域の特徴を抽出する抽出手段と
    複数の前記画像について前記分割された領域の特徴を抽出し、当該抽出した複数の前記特徴を複数のグループにクラスタリングすることにより、前記複数の画像を前記複数のグループに分類する分類手段とを有し、
    前記分類手段は、前記複数のグループごとに保持された画像の小領域における特徴と正解ラベルの情報を用いて、前記複数のグループに分類された画像における分割された領域の特徴に基づき前記画像の小領域のラベルを識別することを特徴とする特徴抽出装置。
  8. 請求項1からのいずれか1項に記載の特徴抽出方法をコンピュータに実行させるためのプログラム。
JP2014242461A 2014-11-28 2014-11-28 特徴抽出方法、特徴抽出装置、及びプログラム Active JP6529246B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014242461A JP6529246B2 (ja) 2014-11-28 2014-11-28 特徴抽出方法、特徴抽出装置、及びプログラム
US14/945,920 US9600737B2 (en) 2014-11-28 2015-11-19 Image feature extraction method, image feature extraction apparatus, and recording medium storing program therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014242461A JP6529246B2 (ja) 2014-11-28 2014-11-28 特徴抽出方法、特徴抽出装置、及びプログラム

Publications (3)

Publication Number Publication Date
JP2016103244A JP2016103244A (ja) 2016-06-02
JP2016103244A5 JP2016103244A5 (ja) 2017-11-30
JP6529246B2 true JP6529246B2 (ja) 2019-06-12

Family

ID=56079395

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014242461A Active JP6529246B2 (ja) 2014-11-28 2014-11-28 特徴抽出方法、特徴抽出装置、及びプログラム

Country Status (2)

Country Link
US (1) US9600737B2 (ja)
JP (1) JP6529246B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106340023B (zh) * 2016-08-22 2019-03-05 腾讯科技(深圳)有限公司 图像分割的方法和装置
US11205103B2 (en) 2016-12-09 2021-12-21 The Research Foundation for the State University Semisupervised autoencoder for sentiment analysis
US11295151B2 (en) 2019-07-31 2022-04-05 Nxp Usa, Inc. Line-based feature generation for vision-based driver assistance systems and methods
CN111311593B (zh) * 2020-03-14 2023-05-26 深圳市维森软件股份有限公司 一种多椭圆检测和评估算法、装置及终端
WO2023108444A1 (zh) * 2021-12-14 2023-06-22 深圳传音控股股份有限公司 图像处理方法、智能终端及存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6778699B1 (en) * 2000-03-27 2004-08-17 Eastman Kodak Company Method of determining vanishing point location from an image
US8948468B2 (en) * 2003-06-26 2015-02-03 Fotonation Limited Modification of viewing parameters for digital images using face detection information
DE60315658T2 (de) * 2003-10-17 2007-12-27 Berner Fachhochschule, Technik Und Informatik (Ti) Fingerabdrucksverifikationsmethode und -system
JP2006202100A (ja) 2005-01-21 2006-08-03 Kyocera Mita Corp 画像検出装置
US8487991B2 (en) * 2008-04-24 2013-07-16 GM Global Technology Operations LLC Clear path detection using a vanishing point
US8249302B2 (en) * 2009-06-30 2012-08-21 Mitsubishi Electric Research Laboratories, Inc. Method for determining a location from images acquired of an environment with an omni-directional camera
JP5919963B2 (ja) 2012-03-30 2016-05-18 富士通株式会社 画像処理装置、画像処理方法および画像処理プログラム

Also Published As

Publication number Publication date
US9600737B2 (en) 2017-03-21
US20160155010A1 (en) 2016-06-02
JP2016103244A (ja) 2016-06-02

Similar Documents

Publication Publication Date Title
JP6529246B2 (ja) 特徴抽出方法、特徴抽出装置、及びプログラム
CN109670500B (zh) 一种文字区域获取方法、装置、存储介质及终端设备
US9098775B2 (en) Multi-class identifier, method, and computer-readable recording medium
JP5916886B2 (ja) 画像特徴の類似性に基づく画像索引作成
CN105608441B (zh) 一种车型识别方法及***
US9911027B2 (en) Fingerprint authentication system, fingerprint authentication program and fingerprint authentication method
JP2017538196A (ja) 商品画像のセグメンテーション方法および装置
KR101836811B1 (ko) 이미지 상호간의 매칭을 판단하는 방법, 장치 및 컴퓨터 프로그램
CN110378351B (zh) ***鉴别方法及装置
CN113673607A (zh) 图像标注模型的训练及图像标注的方法及装置
CN104517113A (zh) 一种图像的特征提取方法、图像的分类方法及相关装置
Forczmański et al. Stamps detection and classification using simple features ensemble
CN108960850B (zh) 防伪方法及装置、防伪溯源***
JP2006099565A (ja) コンテンツ識別装置
Alturki Traffic sign detection and recognition using adaptive threshold segmentation with fuzzy neural network classification
JP2016103244A5 (ja)
JP6487565B2 (ja) 勾配場の特異点の記述子を用いた郵便物の画像のペア作成
CN109166093B (zh) 一种图像显著区域检测方法
da Silva et al. ALPRs-A new approach for license plate recognition using the SIFT algorithm
JP2013164832A (ja) オブジェクト認識装置および方法
JP2014115737A (ja) 画像辞書生成装置、画像辞書生成方法及びコンピュータプログラム
Grycuk et al. Improved digital image segmentation based on stereo vision and mean shift algorithm
JP2013073608A (ja) 文書処理装置、及び文書処理方法、並びにプログラム
EP2993623A1 (en) Apparatus and method for multi-object detection in a digital image
JP2019021100A (ja) 画像探索装置、商品認識装置および画像探索プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171018

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171018

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181011

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181023

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181221

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190416

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190514

R151 Written notification of patent or utility model registration

Ref document number: 6529246

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151