JP2016149010A - 画像評価装置、画像評価方法およびプログラム - Google Patents

画像評価装置、画像評価方法およびプログラム Download PDF

Info

Publication number
JP2016149010A
JP2016149010A JP2015025643A JP2015025643A JP2016149010A JP 2016149010 A JP2016149010 A JP 2016149010A JP 2015025643 A JP2015025643 A JP 2015025643A JP 2015025643 A JP2015025643 A JP 2015025643A JP 2016149010 A JP2016149010 A JP 2016149010A
Authority
JP
Japan
Prior art keywords
pixel
score
unit
area
evaluation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015025643A
Other languages
English (en)
Other versions
JP6490441B2 (ja
Inventor
友樹 渡辺
Yuki Watanabe
友樹 渡辺
進 窪田
Susumu Kubota
進 窪田
伊藤 聡
Satoshi Ito
聡 伊藤
友弘 中居
Tomohiro Nakai
友弘 中居
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2015025643A priority Critical patent/JP6490441B2/ja
Priority to US15/018,986 priority patent/US9830363B2/en
Publication of JP2016149010A publication Critical patent/JP2016149010A/ja
Application granted granted Critical
Publication of JP6490441B2 publication Critical patent/JP6490441B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Library & Information Science (AREA)
  • Computational Linguistics (AREA)
  • Image Analysis (AREA)

Abstract

【課題】演算コストを小さくする。
【解決手段】実施形態に係る画像評価装置は、特徴量算出部と、画素評価部と、スコア累積部と、領域評価部とを備える。特徴量算出部は、画像データの画素位置毎に、画像の特徴を表す特徴量を算出する。画素評価部は、画像データの画素位置毎に、特徴量を評価したスコアを生成する。スコア累積部は、画像データの画素位置毎に、対象の画素を起点として予め定められた第1方向に延びる半直線と対象の画素を起点として予め定められた第2方向に延びる半直線との間に挟まれた劣角側の領域における全てのスコアを累積した累積スコアを算出する。領域評価部は、第1方向に平行な2本の直線と第2方向に平行な2本の直線により囲まれた四角形領域におけるスコアの合計である領域評価値を、四角形領域の頂点の画素位置の累積スコアに基づき算出する。
【選択図】図1

Description

本発明の実施形態は、画像評価装置、画像評価方法およびプログラムに関する。
画像認識等では、画像の特徴を評価して、その領域が例えば人物等の特定の対象物であるかどうかを判断する。画像の特徴を評価するための特徴量には様々なものが知られている。
様々な特徴量の中の一つとして、HOG(Histograms of Oriented Gradients)特徴量のようなヒストグラムベースの特徴量が知られている。ヒストグラムベースの特徴量は、領域内の画素毎の特徴量の合計値が評価対象となる特徴量である。このようなヒストグラムベースの特徴量を用いて画像内の領域を評価する場合、画素毎の特徴量の算出および領域内の累積演算に加えて、累積した特徴量の評価演算もしなければならなく、演算コストが大きかった。
特表2008−530627号公報
N. Dalal, and B. Triggs, "Histograms of Oriented Gradients for Human Detection", CVPR 2005, vol. 1, pp. 886-893, 2005. T. Watanabe, S. Ito, and K. Yokoi, "Co-occurrence Histograms of Oriented Gradients for Human Detection", Trans. on CVA, Vol. 2, pp. 39-47, 2010. T. Ojala, M. Pietikainen, and D. Harwood, "Performance evaluation of texture measures with classification based on Kullback discrimination of distributions", ICPR 1994, vol. 1, pp. 582-585, 1994. S. Ito and S. Kubota, "Object classification using heterogeneous co-occurrence features", ECCV 2010, Part V, pp. 701-714, 2010.
本発明が解決しようとする課題は、演算コストを小さくすることにある。
実施形態に係る画像評価装置は、特徴量算出部と、画素評価部と、スコア累積部と、領域評価部とを備える。前記特徴量算出部は、画像データの画素位置毎に、画像の特徴を表す特徴量を算出する。前記画素評価部は、前記画像データの画素位置毎に、前記特徴量を評価したスコアを生成する。前記スコア累積部は、前記画像データの画素位置毎に、対象の画素を起点として予め定められた第1方向に延びる半直線と対象の画素を起点として予め定められた第2方向に延びる半直線との間に挟まれた劣角側の領域における全ての前記スコアを累積した累積スコアを算出する。領域評価部は、前記第1方向に平行な2本の直線と前記第2方向に平行な2本の直線により囲まれた四角形領域における前記スコアの合計である領域評価値を、前記四角形領域の頂点の画素位置の前記累積スコアに基づき算出する。
実施形態に係る画像評価装置を示す図。 スコアの算出例を示す図。 スコアを累積する領域を示す図。 画素位置毎の累積スコアの演算を説明するための図。 スコアを累積する領域の他の一例を示す図。 四角形領域の一例を示す図。 領域評価値の演算を説明するための図。 四角形領域の他の一例を示す図。 画像評価装置の処理手順を示すフローチャート。 変形例に係る画像評価装置を示す図。 画像評価装置のハードウェア構成を示す図。
以下、図面を参照しながら実施形態に係る画像評価装置について詳細に説明する。本実施形態に係る画像評価装置は、領域内での特徴量の合計を算出するための演算コストおよび特徴量を評価するための演算コストを小さくすることを目的としている。
図1は、実施形態に係る画像評価装置10を示す図である。画像評価装置10は、特徴量算出部31と、識別ベクトル記憶部32と、スコア累積部34と、累積スコア記憶部35と、領域指定部36と、領域評価部37と、正規化部38とを備える。
特徴量算出部31は、外部から1フレーム分の画像データを取得する。そして、特徴量算出部31は、画像データの画素位置毎に、画像の特徴を表す特徴量を算出する。
ここで、特徴量算出部31は、ヒストグラムベースの特徴量を算出する。ヒストグラムベースの特徴量は、画素単位の特徴量を領域内で合計した値が評価対象となる。
特徴量算出部31は、一例として、HOG特徴量(非特許文献1)、CoHOG(Co-occurrence Histograms of Oriented Gradients)特徴量(非特許文献2)、LBP(Local Binary Patterns)特徴量(非特許文献3)またはHeterogeneous co-occurrence特徴量(非特許文献4)を算出する。特徴量算出部31は、これらの特徴量以外のヒストグラムベースの特徴量を算出してもよい。また、特徴量算出部31は、1つの画素に対して1種類の特徴量ではなく、複数種類の特徴量を算出してもよい。
特徴量算出部31は、特徴量の算出の対象の画素について、その画素の画素値と周辺の画素の画素値とを入力して、予め定められた関数を演算することにより、特徴量を算出する。特徴量算出部31は、特徴量として複数の値(成分)を含むベクトルを画素毎に算出する。
例えば、HOG特徴量を算出する場合には、特徴量算出部31は、輝度勾配の方向と輝度勾配の強度とを含む2次元のベクトルを算出する。より具体的には、特徴量算出部31は、ソーベルフィルタまたはロバーツフィルタ等を用いて、量子化した直交する方向の輝度勾配dx,dyを算出する。そして、特徴量算出部31は、tan−1(dx/dy)を演算することにより、輝度勾配の方向を算出する。また、特徴量算出部31は、{(dx)+(dy)1/2を演算することにより、輝度勾配の強度を算出する。輝度勾配を18方向に量子化した場合、輝度勾配の方向および輝度勾配の強度は、18通りのコードと実数の値との組み合わせとなる。
また、例えば、CoHOG特徴量を算出する場合には、特徴量算出部31は、量子化された輝度勾配の方向の、近傍の2画素の組み合わせを30組含む30次元のベクトルを算出する。輝度勾配の方向を8方向に量子化した場合、2点の組み合わせは64通りのコードになる。
また、例えば、LBP特徴量を算出する場合には、特徴量算出部31は、近傍の8画素との大小関係に基づき定義される256通りのコードを含む1次元のベクトルを算出する。また、例えば、Heterogeneous co-occurrence特徴量を算出する場合には、特徴量算出部31は、量子化された輝度勾配の方向、色相、色差分の方向および色差分の符号等を含むベクトルを算出する。
識別ベクトル記憶部32は、予め登録された識別ベクトルを記憶する。識別ベクトルは、特徴量算出部31が算出する特徴量と同一の次数のベクトルである。識別ベクトルは、一例として、予め準備された画像から特徴量算出部31と同一の方法で算出された特徴量における、人物等の特定の対象物を含む領域のヒストグラムを学習データとし、サポートベクタマシンまたはニューラルネットワーク等により学習して算出される。すなわち、識別ベクトルは、人物等の特定の対象物の画像から学習等して生成した特徴量に相当する。
画素評価部33は、画像データの画素位置毎に、識別ベクトルに基づき特徴量を評価したスコアを生成する。画素評価部33は、一例として、図2に示すように、画像データの画素位置毎に、特徴量と識別ベクトルとのノルムをスコアとして生成する。
画素評価部33は、特徴量と識別ベクトルとを関数に入力してスコアを算出してもよい。また、識別ベクトルに基づき特徴量のそれぞれの値に対応するスコアが格納されたテーブルを予め生成しておき、画素評価部33は、入力された特徴量に対応するスコアをテーブルから取得してもよい。
画素評価部33は、一例として、HOG特徴量の場合、識別ベクトルの値と輝度勾配の強度との積をスコアとして算出する。また、画素評価部33は、一例として、CoHOG特徴量およびLBP特徴量の場合、テーブルから特徴量に対応するスコアを取得する。
スコア累積部34は、画像データの画素位置毎に、対象の画素を起点として予め定められた第1方向に延びる半直線と対象の画素を起点として予め定められた第2方向に延びる半直線との間に挟まれた劣角側の領域における全てのスコアを累積した累積スコアを算出する。そして、スコア累積部34は、画像データの画素位置毎の累積スコアを累積スコア記憶部35に書き込む。なお、スコア累積部34での処理については、図3〜図5を参照して後で説明する。
累積スコア記憶部35は、画像データの画素位置毎の累積スコアを記憶する。
領域指定部36は、画像データ内における、第1方向に平行な2本の直線と第2方向に平行な2本の直線により囲まれた四角形領域を指定する。第1方向および第2方向は、スコア累積部34がスコアを累積する領域を規定する方向と同一である。なお、四角形領域の詳細については、図6〜図8を参照して後で説明する。領域指定部36は、位置および大きさを変化させながら、複数の四角形領域を指定する。
領域評価部37は、領域指定部36に四角形領域が指定される毎に、指定された四角形領域におけるスコアの合計である領域評価値を、累積スコア記憶部35に記憶されている画素位置毎の累積スコアにおける四角形領域の頂点の画素位置の累積スコアに基づき算出する。なお、領域評価部37での処理については、図6〜図8を参照して後で説明する。
正規化部38は、領域評価部37により算出された領域評価値を、領域指定部36により指定された四角形領域の面積により正規化する。正規化部38は、一例として、領域評価値を四角形領域の面積で除算することにより正規化する。これにより、正規化部38は、様々な大きさの四角形領域の領域評価値を相互に比較可能とすることができる。なお、領域指定部36により指定される四角形領域の面積が一定の場合には、画像評価装置10は、正規化部38を備えずに領域評価値を出力してよい。
画像評価装置10は、正規化部38により正規化された領域評価値を外部へと出力する。外部へと出力された領域評価値は、例えば、画像認識部等により閾値を超えるか(または下回るか)否かが検出される。そして、領域評価値が閾値を超える(または下回る)場合には、対応する四角形領域が人物等の特定の対象物を含む領域であると判断される。
図3は、ある任意の画素位置(x,y)の累積スコアを算出する場合における、スコアを累積する領域を示す図である。
画像データに含まれる画素は、直交する2つの方向(x方向およびy方向)に2次元配列される。x方向(第1配列方向)は、水平方向に右から左に向かう方向である。y方向(第2配列方向)は、垂直方向に下から上に向かう方向である。
また、画像評価装置10には、画像データの画素の配列方向に対して、第1方向および第2方向が予め設定されている。本例において、第1方向は、x方向の逆方向(水平方向に左から右に向かう方向)である。また、第2方向は、y方向の逆方向(垂直方向に下から上に向かう方向)である。
スコア累積部34は、画像データの画素位置毎に、累積スコアを算出する。ある1つの対象の画素の累積スコアを算出する場合、スコア累積部34は、対象の画素を起点として第1方向に延びる半直線と、対象の画素を起点として第2方向に延びる半直線との間に挟まれた劣角側の領域における全てのスコアを累積する。
より具体的には、図3に示すように、累積スコアの算出対象の画素位置を(x,y)とした場合、スコア累積部34は、斜線で示した領域に含まれる全ての画素のスコアを累積する。すなわち、対象の画素(x,y)を起点として第1方向に延びる半直線は、画素位置(x,y)から、x方向とは逆方向(水平方向に左側)に延びる半直線51となる。また、対象の画素(x,y)を起点として第2方向に延びる半直線は、画素位置(x,y)から、y方向とは逆方向(垂直方向に上側)に延びる半直線52となる。また、対象の画素(x,y)の劣化側の領域は、画像データの画素配列が開始する位置(0,0)と、対象の画素の位置(x,y)とを対角の頂点とする長方形の領域となる。
スコア累積部34は、画像データに含まれる全ての画素について、以上のような劣角側の領域におけるスコアを全て累積した累積スコアを算出する。
図4は、画素位置毎の累積スコアの演算を説明するための図である。スコア累積部34は、画像データの画素位置毎に累積スコアを算出するために、第1配列方向および第2配列方向に2次元配列された画像データのそれぞれの画素を、ラスタスキャンしながら1つずつ選択する。
すなわち、画像データに含まれる画素がx方向およびy方向に2次元配列される場合においては、図4に示すように、スコア累積部34は、左上の画素から選択を開始する。次に、スコア累積部34は、右方向に1画素ずつ、1水平ラインの画素を選択する。次に、スコア累積部34は、1画素分下がった最も左側の画素から、右方向に1画素ずつ1水平ライン分の画素を選択する処理を繰り返す。そして、スコア累積部34は、一番下の水平ラインの最も右側の画素まで選択した後に、選択を終了する。
このようにラスタスキャンをしながら選択した画素の画素位置が、(x,y)であるとする。
この場合、スコア累積部34は、選択した画素(x,y)のスコアa(x,y)を取得する。
さらに、スコア累積部34は、第1画素(x−1,y)の累積スコアS(x−1,y)と、第2画素(x,y−1)の累積スコアS(x,y−1)と、第3画素(x−1,y−1)の累積スコアS(x−1,y−1)とを取得する。第1画素(x−1,y)は、選択した画素から第1配列方向(x方向)の直前の画素である。第2画素(x,y−1)は、選択した画素から第2配列方向(y方向)の直前の画素である。第3画素(x−1,y−1)は、第1画素(x−1,y)から第2配列方向(y方向)の直前の画素である。
なお、ラスタスキャンをしながら順次に選択して累積スコアを算出する場合には、これら第1画素(x−1,y)、第2画素(x,y−1)および第3画素(x−1,y−1)の累積スコアは、既に算出されている。ただし、選択した画素位置が、水平ラインの一番左の画素である場合には、第1画素(x−1,y)および第3画素(x−1,y−1)が存在しない。また、選択した画素位置が、一番上の水平ラインの画素である場合には、第2画素(x,y−1)および第3画素(x−1,y−1)が存在しない。スコア累積部34は、存在しない画素の累積スコアは、0とする。
そして、スコア累積部34は、下記の式(1)を演算して、選択した画素の累積スコアS(x,y)を算出する。
S(x,y)=a(x,y)+S(x−1,y)+S(x,y−1)−S(x−1,y−1)+S(x,y) …(1)
すなわち、スコア累積部34は、選択した画素のスコアと、選択した画素に対する第1配列方向の直前の第1画素の累積スコアと、選択した画素に対する第2配列方向の直前の第2画素の累積スコアとを加算した値から、第1画素に対する第2配列方向の直前の第3画素の累積スコアを減じた値を、選択した画素の累積スコアとして算出する。
このような演算をすることにより、スコア累積部34は、劣角側の領域における全てのスコアを累積した累積スコアを簡易に算出することができる。
図5は、スコアを累積する領域の他の一例を示す図である。画像評価装置10は、第1方向および第2方向が互いに異なる方向であれば、例えば図5に示すように、画素の配列方向の逆方向に限らず他の方向に設定されていてもよい。
例えば、第1方向および第2方向は、画像データの画素の配列方向(x方向およびy方向)に対して、22.5°、45°または67.5°回転した、直交する2つの方向であってもよい。また、第1方向および第2方向は、直交しない2つの方向であってもよい。
また、このような場合、第1方向に延びる半直線51および第2方向に延びる半直線52が、画素と画素との間を通過する部分が存在する。この場合、スコア累積部34は、第1方向に延びる半直線51と第2方向に延びる半直線52との内側(劣角側)の画素位置(半直線51上および半直線52上の画素位置も含む)のスコアを累積する。
図6は、四角形領域の一例を示す図である。領域指定部36は、四角形領域を指定する。四角形領域は、第1方向に平行な2本の直線と第2方向に平行な2本の直線により囲まれた領域である。
本例においては、画像データに含まれる画素が、x方向およびy方向に2次元配列され、第1方向がx方向の逆方向、第2方向がy方向の逆方向である。従って、本例においては、領域指定部36は、x方向(水平方向)に平行な第1の直線61および第2の直線62と、y方向(垂直方向)に平行な第3の直線63および第4の直線64とにより囲まれた四角形領域を指定する。
ここで、第1の直線61のy方向の画素位置はyであり、第2の直線62のy方向の画素位置はyであるとする。また、第3の直線63のx方向の画素位置はxであり、第4の直線64のx方向の画素位置はxであるとする。
この場合、四角形領域は、第1頂点(x,y)、第2頂点(x,y)、第3頂点(x,y)および第4頂点(x,y)を有する。第1頂点(x,y)は、四角形領域における右下の頂点である。また、第2頂点(x,y)は、四角形領域における左上の頂点である。第3頂点(x,y)は、四角形領域における左下の頂点である。第4頂点(x,y)は、四角形領域における右上の頂点である。
すなわち、第2頂点(x,y)は、第1頂点(x,y)よりも第1方向の側で且つ第2方向の側に位置する。つまり、第2頂点(x,y)は、第1頂点(x,y)を起点として、第1方向(水平方向に左から右の方向)に向いた半直線と、第1頂点(x,y)を起点として第2方向(垂直方向に下から上の方向)に向いた半直線との間に挟まれた劣角側の領域内に位置する。また、第3頂点(x,y)および第4頂点(x,y)は、第1頂点(x,y)および第2頂点(x,y)とは異なる頂点である。
そして、領域評価部37は、累積スコア記憶部35から、領域指定部36に指定された四角形領域の頂点の画素位置の累積スコアを取得する。本例においては、領域評価部37は、第1頂点の累積スコアS(x,y)、第2頂点の累積スコアS(x,y)、第3頂点の累積スコアS(x,y)および第4頂点の累積スコアS(x,y)を読み出す。
図7は、領域評価値の演算を説明するための図である。領域評価部37は、読み出した第1頂点の累積スコアS(x,y)、第2頂点の累積スコアS(x,y)、第3頂点の累積スコアS(x,y)および第4頂点の累積スコアS(x,y)に基づき、四角形領域におけるスコアの合計Tを算出する。
より具体的には、領域評価部37は、下記の式(2)を演算して、四角形領域におけるスコアの合計Tを算出する。
T=(S(x,y)+S(x,y))−(S(x,y)+S(x,y)) …(2)
すなわち、領域評価部37は、第1頂点の累積スコアS(x,y)と第2頂点の累積スコアS(x,y)とを加算した第1加算値から、第3頂点の累積スコアS(x,y)と第4頂点の累積スコアS(x,y)とを加算した第2加算値とを減算した値を、合計Tとして算出する。
そして、領域評価部37は、算出した合計Tを、指定された四角形領域における領域評価値として出力する。これにより、領域評価部37は、指定された四角形領域における領域評価値を簡易に算出することができる。
図8は、四角形領域の他の一例を示す図である。領域指定部36は、第1方向および第2方向の何れか一方が、x方向およびy方向と平行でない場合には、図8に示すように、長方形ではない平行四辺形の四角形領域を指定する。
なお、第1頂点(x,y)、第2頂点(x,y)、第3頂点(x,y)または第4頂点(x,y)が、画素位置上に存在しない場合、領域評価部37は、周囲の画素の累積スコアから補間して、対応する頂点の累積スコアを算出する。
このように第1方向および第2方向が、画像データの画素の配列方向(x方向およびy方向)と平行ではない場合、画像評価装置10は、例えば、画素の配列方向に対して回転した対象物または非矩形の対象物等を評価することができる。
図9は、画像評価装置10の処理手順を示すフローチャートである。画像評価装置10は、図9に示すステップS11からステップS19の処理を実行する。
まず、特徴量算出部31は、1フレーム分の画像データを入力する(S11)。続いて、特徴量算出部31は、入力された画像データの画素位置毎に特徴量を算出する(S12)。続いて、画素評価部33は、画像データの画素位置毎に、識別ベクトルに基づき特徴量を評価したスコアを生成する(S13)。
続いて、スコア累積部34は、画像データの画素位置毎に、累積スコアを算出する(S14)。スコア累積部34により算出された画素位置毎の累積スコアは、累積スコア記憶部35に記憶される。
続いて、画像評価装置10は、異なる四角形領域毎に、ステップS16からステップS18までの処理を繰り返して実行する(ステップS15とステップS19との間のループ処理)。まず、領域指定部36は、第1方向に平行な2本の直線と第2方向に平行な2本の直線により囲まれた四角形領域を指定する(S16)。続いて、領域評価部37は、指定された四角形領域におけるスコアの合計である領域評価値を、四角形領域の頂点の画素位置の累積スコアに基づき算出する(S17)。続いて、正規化部38は、算出した領域評価値を四角形領域の面積で除算することにより正規化する(S18)。
そして、画像評価装置10は、全ての領域について正規化した領域評価値を生成すると、処理を終了する(S19)。
以上のように、本実施形態に係る画像評価装置10は、画素毎の特徴量を累積するのではなく、画素毎のスコア(特徴量を識別ベクトルで評価した値)を累積する。そして、画像評価装置10は、指定された四角形領域の頂点の4つの累積スコアを読み出して加減算して、領域評価値を算出する。これにより、画像評価装置10は、異なる複数の領域について領域評価値を生成する場合に領域内の特徴量の累積演算および評価演算を1回だけすればよいので、演算コストを小さくすることができる。
また、本実施形態に係る画像評価装置10は、複数の領域に重なりが多いほど演算コストをより削減することができる。例えば、画像内における特定の物体の領域を検出する場合、画像評価装置10は、画像内の様々な位置および様々な大きさの領域を指定して、領域評価値を算出する。また、例えば、人物のポーズ推定等に用いられるDeformable Part Modelに適用した場合、画像評価装置10は、頭、手、足等のそれぞれのパーツの位置を評価するための領域を細かくずらしながら指定する。また、例えば、特定の物体の追跡に適用した場合、画像評価装置10は、直前のフレームまでの検出結果から予想される特定の物***置の周辺において、細かく位置をずらしながら領域を指定する。このような場合、それぞれの領域が互いに重なり合っているので、画像評価装置10は、領域内の特徴量の累積演算および評価演算を大幅に削減することができる。
図10は、変形例に係る画像評価装置10を示す図である。変形例に係る画像評価装置10は、図1に示した構成の画像評価装置10と略同一の機能および構成を有するので、略同一の機能および構成を有する部材には同一の符号を付けて、相違点を除き説明を省略する。
変形例に係る画像評価装置10は、特徴量算出部31と、識別ベクトル記憶部32と、スコア累積部34と、累積スコア記憶部35と、領域指定部36と、領域評価部37と、正規化部38と、重み取得部81と、重み累積部82と、累積重み記憶部83と、領域重み算出部84とを備える。
重み取得部81は、画像データの画素位置毎に、特徴量の重みを取得する。重み取得部81は、一例として、特徴量算出部31により算出された特徴量のうちの1つの成分を重みとして取得してもよい。HOG特徴量の場合、重み取得部81は、輝度勾配の強度を重みとして取得する。また、重み取得部81は、外部から画素毎の重みを取得してもよい。
重み累積部82は、画像データの画素位置毎に、対象の画素を起点とした第1方向に平行な半直線と対象の画素を起点とした第2方向に平行な半直線との間に挟まれた劣角側の領域における全ての重みを累積した累積重みを算出する。すなわち、重み累積部82は、スコア累積部34がスコアを累積する領域と同一の領域の全ての重みを累積する。
累積重み記憶部83は、画像データの画素位置毎の累積重みを記憶する。
領域重み算出部84は、領域指定部36により指定された四角形領域における重みを合計した重み合計値を、四角形領域の頂点の画素位置の累積重みに基づき算出する。すなわち、領域重み算出部84は、領域評価部37が領域評価値を算出する演算処理と同一の演算により重み合計値を算出する。
正規化部38は、領域評価部37により算出された領域評価値を、領域重み算出部84により算出された累積重みにより正規化する。正規化部38は、一例として、領域評価部37により算出された領域評価値を累積重みにより除算することにより正規化する。
このような変形例に係る画像評価装置10によれば、例えばHOG特徴量のような、画素毎に重みが設定される特徴量を用いた場合に、領域内の重みで正規化した領域評価値を小さい演算コストで算出することができる。
図11は、画像評価装置10のハードウェア構成を示す図である。画像評価装置10は、CPU(Central Processing Unit)201と、操作部202と、表示部203と、ROM(Read Only Memory)204と、RAM(Random Access Memory)205と、記憶部206とを備える。これらの各部は、バス210により接続される。
CPU201は、プログラムに従って演算処理および制御処理等を実行するプロセッサである。CPU201は、RAM205の所定領域を作業領域としてROM204または記憶部206に予め記憶された各種プログラムとの協働により各種処理を実行する。
操作部202は、マウスやキーボード等の入力デバイスであって、ユーザから操作入力された情報を指示信号として受け付け、その指示信号をCPU201に出力する。表示部203は、LCD(Liquid Crystal Display)等の表示装置である。表示部203は、CPU201からの表示信号に基づいて、各種情報を表示する。
ROM204は、画像評価装置10の制御に用いられるプログラムおよび各種設定情報等を書き換え不可能に記憶する。RAM205は、SDRAM(Synchronous Dynamic Random Access Memory)等の揮発性の記憶媒体である。RAM205は、CPU201の作業領域として機能する。
記憶部206は、フラッシュメモリ等の半導体による記憶媒体、磁気的または光学的に記録可能な記憶媒体等の書き換え可能な記録装置である。記憶部206は、プログラムおよび各種設定情報等を記憶する。また、記憶部206は、例えば、操作部202および通信装置等を介して取得されたデータを記憶する。
なお、画像評価装置10は、このようなハードウェア構成に限らず、特徴量算出部31、識別ベクトル記憶部32、画素評価部33、スコア累積部34、累積スコア記憶部35、領域指定部36、領域評価部37および正規化部38の一部または全部をハードウェア回路(例えば半導体集積回路)により実装する構成であってもよい。
また、本実施形態に係る画像評価装置10で実行されるプログラムは、インストール可能な形式または実行可能な形式のファイルでCD−ROM、フレキシブルディスク、CD−R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録されて提供される。
また、本実施形態に係る画像評価装置10で実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。また、本実施形態に係る画像評価装置10で実行されるプログラムをインターネット等のネットワーク経由で提供または配布するように構成してもよい。また、本実施形態に係る画像評価装置10で実行されるプログラムを、ROM等に予め組み込んで提供するように構成してもよい。
本実施形態に係る画像評価装置10で実行されるプログラムは、上述した画像評価装置10の各部(特徴量算出部31、識別ベクトル記憶部32、画素評価部33、スコア累積部34、累積スコア記憶部35、領域指定部36、領域評価部37および正規化部38)を含むモジュール構成となっており、CPU201(プロセッサ)が記憶媒体等からプログラムを読み出して実行することにより上記各部がRAM205上にロードされ、画像評価装置10(特徴量算出部31、識別ベクトル記憶部32、画素評価部33、スコア累積部34、累積スコア記憶部35、領域指定部36、領域評価部37および正規化部38)がRAM205上に生成されるようになっている。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
10 画像評価装置
31 特徴量算出部
32 識別ベクトル記憶部
33 画素評価部
34 スコア累積部
35 累積スコア記憶部
36 領域指定部
37 領域評価部
38 正規化部
51 半直線
52 半直線
61 第1の直線
62 第2の直線
63 第3の直線
64 第4の直線
81 重み取得部
82 重み累積部
83 累積重み記憶部
84 領域重み算出部
201 CPU
202 操作部
203 表示部
204 ROM
205 RAM
206 記憶部

Claims (12)

  1. 画像データの画素位置毎に、画像の特徴を表す特徴量を算出する特徴量算出部と、
    前記画像データの画素位置毎に、前記特徴量を評価したスコアを生成する画素評価部と、
    前記画像データの画素位置毎に、対象の画素を起点として予め定められた第1方向に延びる半直線と対象の画素を起点として予め定められた第2方向に延びる半直線との間に挟まれた劣角側の領域における全ての前記スコアを累積した累積スコアを算出するスコア累積部と、
    前記第1方向に平行な2本の直線と前記第2方向に平行な2本の直線により囲まれた四角形領域における前記スコアの合計である領域評価値を、前記四角形領域の頂点の画素位置の前記累積スコアに基づき算出する領域評価部と、
    を備える画像評価装置。
  2. 前記四角形領域は、第1頂点と、前記第1頂点を起点として前記第1方向に延びる半直線と前記第1頂点を起点として前記第2方向に延びる半直線との間に挟まれた劣角側の領域内に位置する第2頂点と、前記第1頂点および前記第2頂点とは異なる頂点である第3頂点および第4頂点とを有し、
    前記領域評価部は、前記第1頂点の前記累積スコアと前記第2頂点の前記累積スコアとを加算した第1加算値から、前記第3頂点の前記累積スコアと前記第4頂点の前記累積スコアとを加算した第2加算値とを減算した値を、前記領域評価値として算出する
    請求項1に記載の画像評価装置。
  3. 前記スコア累積部は、
    第1配列方向および第2配列方向に2次元配列された前記画像データのそれぞれの画素を、ラスタスキャンしながら1つずつ選択し、
    選択した画素の前記スコアと、選択した画素に対する第1配列方向の直前の第1画素の前記累積スコアと、選択した画素に対する第2配列方向の直前の第2画素の前記累積スコアとを加算した値から、前記第1画素に対する前記第2配列方向の直前の第3画素の前記累積スコアを減じた値を、選択した画素の前記累積スコアとして算出する
    請求項2に記載の画像評価装置。
  4. 前記第1方向は、前記第1配列方向の逆方向であり、
    前記第2方向は、前記第2配列方向の逆方向である
    請求項3に記載の画像評価装置。
  5. 前記第1配列方向は、水平方向に右から左に向かう方向であり、
    前記第2配列方向は、垂直方向に上から下に向かう方向である
    請求項4に記載の画像評価装置。
  6. 前記画像データの画素位置毎の前記累積スコアを記憶する累積スコア記憶部と、
    前記四角形領域を指定する領域指定部と、
    をさらに備え、
    前記領域評価部は、前記領域指定部により指定された前記四角形領域の頂点の画素位置の前記累積スコアを前記累積スコア記憶部から読み出して、前記領域評価値を算出する
    請求項1から5の何れか1項に記載の画像評価装置。
  7. 前記特徴量算出部は、前記特徴量として、複数の値を含むベクトルを算出し、
    前記画素評価部は、前記特徴量と予め登録された識別ベクトルとのノルムに基づき前記スコアを生成する
    請求項1から6の何れか1項に記載の画像評価装置。
  8. 前記特徴量は、領域内で合計した値が評価対象となる
    請求項1から7の何れか1項に記載の画像評価装置。
  9. 前記領域評価値を前記四角形領域の面積により正規化する正規化部をさらに備える
    請求項1から8の何れか1項に記載の画像評価装置。
  10. 前記画像データの画素位置毎に、前記特徴量の重みを取得する重み取得部と、
    前記画像データの画素位置毎に、対象の画素を起点とした前記第1方向に平行な半直線と対象の画素を起点とした前記第2方向に平行な半直線との間に挟まれた劣角側の領域における全ての前記重みを累積した累積重みを算出する重み累積部と、
    前記四角形領域における前記重みを合計した重み合計値を、前記四角形領域の頂点の画素位置の前記累積重みに基づき算出する領域重み算出部と、
    を備え、
    前記正規化部は、前記領域評価値を前記累積重みにより正規化する
    請求項9に記載の画像評価装置。
  11. 画像データの画素位置毎に、画像の特徴を表す特徴量を算出する特徴量算出ステップと、
    前記画像データの画素位置毎に、前記特徴量を評価したスコアを生成する画素評価ステップと、
    前記画像データの画素位置毎に、対象の画素を起点として予め定められた第1方向に延びる半直線と対象の画素を起点として予め定められた第2方向に延びる半直線との間に挟まれた劣角側の領域における全ての前記スコアを累積した累積スコアを算出するスコア累積ステップと、
    前記第1方向に平行な2本の直線と前記第2方向に平行な2本の直線により囲まれた四角形領域における前記スコアの合計である領域評価値を、前記四角形領域の頂点の画素位置の前記累積スコアに基づき算出する領域評価ステップと、
    を含む画像評価方法。
  12. コンピュータを画像評価装置として機能させるためのプログラムであって、
    前記コンピュータを、
    画像データの画素位置毎に、画像の特徴を表す特徴量を算出する特徴量算出部と、
    前記画像データの画素位置毎に、前記特徴量を評価したスコアを生成する画素評価部と、
    前記画像データの画素位置毎に、対象の画素を起点として予め定められた第1方向に延びる半直線と対象の画素を起点として予め定められた第2方向に延びる半直線との間に挟まれた劣角側の領域における全ての前記スコアを累積した累積スコアを算出するスコア累積部と、
    前記第1方向に平行な2本の直線と前記第2方向に平行な2本の直線により囲まれた四角形領域における前記スコアの合計である領域評価値を、前記四角形領域の頂点の画素位置の前記累積スコアに基づき算出する領域評価部と
    して機能させるプログラム。
JP2015025643A 2015-02-12 2015-02-12 画像評価装置、画像評価方法およびプログラム Active JP6490441B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2015025643A JP6490441B2 (ja) 2015-02-12 2015-02-12 画像評価装置、画像評価方法およびプログラム
US15/018,986 US9830363B2 (en) 2015-02-12 2016-02-09 Image evaluation apparatus, image evaluation method, and computer program product

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015025643A JP6490441B2 (ja) 2015-02-12 2015-02-12 画像評価装置、画像評価方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2016149010A true JP2016149010A (ja) 2016-08-18
JP6490441B2 JP6490441B2 (ja) 2019-03-27

Family

ID=56621245

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015025643A Active JP6490441B2 (ja) 2015-02-12 2015-02-12 画像評価装置、画像評価方法およびプログラム

Country Status (2)

Country Link
US (1) US9830363B2 (ja)
JP (1) JP6490441B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200107480A (ko) * 2019-03-08 2020-09-16 주식회사 에이아이네이션 가상화장 합성 처리 장치 및 방법
KR20200107492A (ko) * 2019-03-08 2020-09-16 주식회사 에이아이네이션 가상화장 이미지 평가 점수 생성 장치
KR20200107499A (ko) * 2019-03-08 2020-09-16 주식회사 에이아이네이션 가상화장 이미지 평가 점수 생성 장치

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11281926B2 (en) * 2018-06-04 2022-03-22 Denso Corporation Feature extraction method and apparatus
US11373095B2 (en) * 2019-12-23 2022-06-28 Jens C. Jenkins Machine learning multiple features of depicted item

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003323622A (ja) * 2002-02-27 2003-11-14 Nec Corp 画像認識システム及びその認識方法並びにプログラム
JP2008027275A (ja) * 2006-07-24 2008-02-07 Seiko Epson Corp オブジェクト検出装置、オブジェクト検出方法および制御プログラム
JP2008102792A (ja) * 2006-10-19 2008-05-01 Toyota Motor Corp 画像識別装置および画像識別方法
JP2008530627A (ja) * 2005-02-07 2008-08-07 ミツビシ・エレクトリック・リサーチ・ラボラトリーズ・インコーポレイテッド サンプルされたデータから統合ヒストグラムを抽出するコンピュータ実行方法
US20080240500A1 (en) * 2007-04-02 2008-10-02 Industrial Technology Research Institute Image processing methods
JP2011180792A (ja) * 2010-03-01 2011-09-15 Sony Corp 画像処理装置及び画像処理方法、並びにコンピューター・プログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5214367B2 (ja) 2008-08-08 2013-06-19 株式会社東芝 特徴量抽出装置、特徴量抽出方法、画像処理装置、及び、プログラム
JP4970381B2 (ja) 2008-08-08 2012-07-04 株式会社東芝 特徴抽出装置、特徴抽出方法、画像処理装置、及び、プログラム
JP5015097B2 (ja) 2008-08-29 2012-08-29 シャープ株式会社 画像処理装置、画像処理プログラム、コンピュータ読み取り可能な記録媒体、電子機器及び画像処理方法
JP5126115B2 (ja) 2009-02-25 2013-01-23 株式会社デンソー 検出対象判定装置,インテグラルイメージ生成装置。
JP5095790B2 (ja) 2010-09-02 2012-12-12 株式会社東芝 特徴量算出装置及び識別装置
JP5417368B2 (ja) 2011-03-25 2014-02-12 株式会社東芝 画像識別装置及び画像識別方法
JP2013164643A (ja) 2012-02-09 2013-08-22 Honda Elesys Co Ltd 画像認識装置、画像認識方法および画像認識プログラム
US9697233B2 (en) * 2014-08-12 2017-07-04 Paypal, Inc. Image processing and matching

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003323622A (ja) * 2002-02-27 2003-11-14 Nec Corp 画像認識システム及びその認識方法並びにプログラム
JP2008530627A (ja) * 2005-02-07 2008-08-07 ミツビシ・エレクトリック・リサーチ・ラボラトリーズ・インコーポレイテッド サンプルされたデータから統合ヒストグラムを抽出するコンピュータ実行方法
JP2008027275A (ja) * 2006-07-24 2008-02-07 Seiko Epson Corp オブジェクト検出装置、オブジェクト検出方法および制御プログラム
JP2008102792A (ja) * 2006-10-19 2008-05-01 Toyota Motor Corp 画像識別装置および画像識別方法
US20080240500A1 (en) * 2007-04-02 2008-10-02 Industrial Technology Research Institute Image processing methods
JP2011180792A (ja) * 2010-03-01 2011-09-15 Sony Corp 画像処理装置及び画像処理方法、並びにコンピューター・プログラム

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
PETER TARABEK: ""Fast license plate detection based on edge density and integral edge image"", 2012 IEEE 10TH INTERNATIONAL SYMPOSIUM ON APPLIED MACHINE INTELLIGENCE AND INFORMATICS (SAMI), JPN6018045645, 2012, pages 37 - 40, ISSN: 0003923358 *
XIN HE, 外2名: ""Real-time human face detection in color image"", PROCEEDINGS OF THE 2003 INTERNATIONAL CONFERENCE ON MACHINE LEARNING AND CYBERNETICS (IEEE CAT. NO.0, JPN6018045646, 2003, pages 2915 - 2920, XP010682211, ISSN: 0003923359, DOI: 10.1109/ICMLC.2003.1260064 *
青木裕太, 外1名: ""メッシュ・テンプレートを用いた円形道路標識の高速検出"", 情報処理学会研究報告 平成21年度▲2▼, JPN6018045643, 24 September 2009 (2009-09-24), JP, pages 1 - 8, ISSN: 0003923357 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200107480A (ko) * 2019-03-08 2020-09-16 주식회사 에이아이네이션 가상화장 합성 처리 장치 및 방법
KR20200107492A (ko) * 2019-03-08 2020-09-16 주식회사 에이아이네이션 가상화장 이미지 평가 점수 생성 장치
KR20200107499A (ko) * 2019-03-08 2020-09-16 주식회사 에이아이네이션 가상화장 이미지 평가 점수 생성 장치
KR102465455B1 (ko) * 2019-03-08 2022-11-10 주식회사 에이아이네이션 스코어 분포 예측을 통한 사용자 취향별 뷰티 평가 인공지능 장치 및 방법
KR102465454B1 (ko) 2019-03-08 2022-11-10 주식회사 에이아이네이션 얼굴의 특징 인식을 통한 뷰티 평가 인공지능 장치 및 방법
KR102465453B1 (ko) 2019-03-08 2022-11-10 주식회사 에이아이네이션 가상화장 합성 처리 인공지능 장치 및 방법

Also Published As

Publication number Publication date
US9830363B2 (en) 2017-11-28
JP6490441B2 (ja) 2019-03-27
US20160239984A1 (en) 2016-08-18

Similar Documents

Publication Publication Date Title
JP6490441B2 (ja) 画像評価装置、画像評価方法およびプログラム
US9898686B2 (en) Object re-identification using self-dissimilarity
US10043313B2 (en) Information processing apparatus, information processing method, information processing system, and storage medium
JP5861123B2 (ja) 特徴抽出装置、特徴抽出方法、特徴抽出プログラム、および、画像処理装置
US9754192B2 (en) Object detection utilizing geometric information fused with image data
JP6547386B2 (ja) 画像処理装置及び方法
US9633284B2 (en) Image processing apparatus and image processing method of identifying object in image
US9740965B2 (en) Information processing apparatus and control method thereof
US9047673B2 (en) Apparatus and method for extracting target, and recording medium storing program for performing the method
US9443287B2 (en) Image processing method and apparatus using trained dictionary
US20140204238A1 (en) Feature extraction apparatus, feature extraction program, and image processing apparatus
JP5671928B2 (ja) 学習装置、学習方法、識別装置、識別方法、およびプログラム
US8442327B2 (en) Application of classifiers to sub-sampled integral images for detecting faces in images
CN108960247B (zh) 图像显著性检测方法、装置以及电子设备
KR101833943B1 (ko) 동영상의 주요 장면을 추출 및 탐색하는 방법 및 시스템
JP2016529598A (ja) 文書内バーコード配置特定
JP6511950B2 (ja) 画像処理装置、画像処理方法及びプログラム
US9445008B2 (en) Device, method, and computer readable medium for area identification using motion from a projected pattern
US9158956B2 (en) Reader, reading method and computer program product
KR101592087B1 (ko) 배경 영상의 위치를 이용한 관심맵 생성 방법 및 이를 기록한 기록 매체
US9286695B2 (en) Systems and methods for tracking points within an encasement
US20210398295A1 (en) Object tracking apparatus, object tracking method and program
KR101627974B1 (ko) 영상 블러에 강인한 영상 특징 기술자 생성 방법 및 장치
JP2021047650A (ja) 識別装置、識別方法及び識別プログラム
JP7314645B2 (ja) 物体検出プログラム、物体検出方法、及び、物体検出装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171121

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181112

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181120

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190117

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190129

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190227

R151 Written notification of patent or utility model registration

Ref document number: 6490441

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151