JP2018507495A - 特徴抽出方法及び装置 - Google Patents

特徴抽出方法及び装置 Download PDF

Info

Publication number
JP2018507495A
JP2018507495A JP2017552216A JP2017552216A JP2018507495A JP 2018507495 A JP2018507495 A JP 2018507495A JP 2017552216 A JP2017552216 A JP 2017552216A JP 2017552216 A JP2017552216 A JP 2017552216A JP 2018507495 A JP2018507495 A JP 2018507495A
Authority
JP
Japan
Prior art keywords
image
block
sparse
vector
cells
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017552216A
Other languages
English (en)
Inventor
▲飛▼ ▲龍▼
▲飛▼ ▲龍▼
志▲軍▼ ▲陳▼
志▲軍▼ ▲陳▼
涛 ▲張▼
涛 ▲張▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiaomi Inc
Original Assignee
Xiaomi Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiaomi Inc filed Critical Xiaomi Inc
Publication of JP2018507495A publication Critical patent/JP2018507495A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • G06V10/464Salient features, e.g. scale invariant feature transforms [SIFT] using a plurality of salient features, e.g. bag-of-words [BoW] representations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • G06V10/507Summing image-intensity values; Histogram projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2136Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on sparsity criteria, e.g. with an overcomplete basis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/7715Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/469Contour-based spatial representations, e.g. vector-coding
    • G06V10/473Contour-based spatial representations, e.g. vector-coding using gradient analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/513Sparse representations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)
  • Probability & Statistics with Applications (AREA)

Abstract

【課題】本発明は特徴抽出方法及び装置を開示し、画像処理技術分野に属する。【解決手段】特徴抽出方法は、画像を複数のセルを含む複数のブロックに区分することと、各セルに対してスパース信号分解を行い、各セルにそれぞれ対応するスパースベクトルを取得することと、スパースベクトルに基づき、画像の勾配方向ヒストグラムHOG特徴を抽出することとを含み、スパース信号分解後の画像に対してHOG特徴を抽出することにより、HOG特徴の抽出過程における画像の空間領域に対して直接的に計算して取得することによるパターン認識における検出率及び正確度が低いという問題を解決する。周波数領域における画像のHOG特徴の抽出を実現し、パターン認識における検出率及び正確度を向上させる効果を達成している。【選択図】図1

Description

本発明は画像処理技術分野に関し、特に特徴抽出方法及び装置に関する。
本発明は出願番号が201510827753.4であり、出願日が2015年11月25日である中国特許出願に基づいて提出され、該中国特許出願の優先権を主張し、該中国特許出願の全ての内容はここで参考として本発明に援用される。
画像検出と認識はコンピュータビジョンにおける一つの重要な研究分野である。画像検出と認識技術において最もよく使われる方法は、画像におけるある特徴を抽出することにより、画像に対して検出と認識を行う。
関わる技術において、画像のHOG(Histogram of Oriented Gradient、勾配方向ヒストグラム)特徴を抽出することにより、画像に対して検出と認識を行う。HOG特徴抽出の方法は、画像における各画素の勾配を計算することと、画像を複数の画素を含む複数のセルに区分し、各隣接するn個のセルを一つのブロックに形成することと、各セルにおける全ての画素の勾配ヒストグラムを統計し、各ブロックにおける全てのセルの勾配ヒストグラムに基づき、各ブロックのHOG特徴を取得することと、画像における全てのブロックのHOG特徴を統計し画像のHOG特徴を取得することと、を含む。
関わる技術に存在する問題を解決するために、本発明は特徴抽出方法及び装置を提供する。当該技術的解決手段は以下のとおりである。
本発明の実施例の第1態様によれば、
画像を複数のセルを含む複数のブロックに区分することと、
各セルに対してスパース信号分解を行い、各セルにそれぞれ対応するスパースベクトルを取得することと、
スパースベクトルに基づき、画像の勾配方向ヒストグラムHOG特徴を抽出することと、
を含む特徴抽出方法を提供している。
好ましい実施例において、各セルに対してスパース信号分解を行い、各セルに対応するスパースベクトルを取得することは、
各セルにおける画素をn*1次元のベクトルに調整することと、
下記の数1を用いて、各セルにおけるベクトルに対してスパース信号分解を行い、対応するスパースベクトルを取得することと、を含み、
Figure 2018507495
yは各セルにおけるベクトルであり、Dは予め与えられた過完備辞書であり、xは過完備辞書Dにおいてyをスパース化して得られたスパースベクトルであり、||x||はスパースベクトルxの各列の絶対値の和を求めることを示し、各スパースベクトルはm*1次元のベクトルであり、過完備辞書Dはn*mの行列である。
好ましい実施例において、スパースベクトルに基づき、画像の勾配方向ヒストグラムHOG特徴を抽出することは、
スパースベクトルに基づき、各セルの勾配の大きさと勾配の方向を計算し、各セルの記述子を取得することと、
各ブロック内の各記述子を統計し、各ブロックのHOG特徴を取得することと、
画像における各ブロックのHOG特徴を統計し、画像のHOG特徴を取得することと、を含む。
好ましい実施例において、画像における各ブロックのHOG特徴を統計し、画像のHOG特徴を取得することは、
画像における各ブロックのHOG特徴を一つの列として一つの行列に直列接続することを含む。
好ましい実施例において、画像における各ブロックのHOG特徴を統計し、画像のHOG特徴を取得することは、
画像における、M*N個の画素を含む各ブロックのHOG特徴を初期のL*1次元ベクトルからM*Nの行列(L=M*N)に調整することと、
各ブロックの調整後のHOG特徴と画像における各ブロックの対応する位置に基づき、画像のHOG特徴を取得することと、を含む。
好ましい実施例において、該方法は、さらに、
画像に対して正規化処理を行い、所定のサイズの画像を取得することを含む。
本発明の実施例の第2態様によれば、
画像を複数のセルを含む複数のブロックに区分するように配置された区分モジュールと、
各セルに対してスパース信号分解を行い、各セルにそれぞれ対応するスパースベクトルを取得するように配置された分解モジュールと、
スパースベクトルに基づき、画像の勾配方向ヒストグラムHOG特徴を抽出するように配置された抽出モジュールと、
を含む特徴抽出装置を提供している。
好ましい実施例において、分解モジュールは、
各セルにおける画素をn*1次元のベクトルに調整するように配置された第1調整サブモジュールと、
下記の数2を用いて、各セルにおけるベクトルに対してスパース信号分解を行い、対応するスパースベクトルを取得するように配置された信号分解サブモジュールと、を含み、
Figure 2018507495
yは各セルにおけるベクトルであり、Dは予め与えられた過完備辞書であり、xは過完備辞書Dにおいてyをスパース化して得られたスパースベクトルであり、||x||はスパースベクトルxの各例の絶対値の和を求めることを示し、各スパースベクトルはm*1次元のベクトルであり、過完備辞書Dはn*mの行列である。
好ましい実施例において、抽出モジュールは、
スパースベクトルに基づき、各セルの勾配の大きさと勾配の方向を計算し、各セルの記述子を取得するように配置された計算サブモジュールと、
各ブロック内の各記述子を統計し、各ブロックのHOG特徴を取得するように配置された第1統計サブモジュールと、
画像における各ブロックのHOG特徴を統計し、画像のHOG特徴を取得するように配置された第2統計サブモジュールと、を含む。
好ましい実施例において、第2統計サブモジュールは、画像における各ブロックのHOG特徴を一つの列として一つの行列に直列接続し、画像のHOG特徴を取得するように配置される。
好ましい実施例において、第2統計サブモジュールは、
画像における、M*N個の画素を含む各ブロックのHOG特徴を初期のL*1次元ベクトルからM*Nの行列(L=M*N)に調整するように配置された第2調整サブモジュールと、
各ブロックの調整後のHOG特徴と画像における各ブロックの対応する位置に基づき、画像のHOG特徴を取得するように配置された特徴抽出サブモジュールと、を含む。
好ましい実施例において、該装置は、さらに、
画像に対して正規化処理を行い、所定のサイズの画像を取得するように配置された処理モジュールを含む。
本発明の実施例の第3態様によれば、
画像を複数のセルを含む複数のブロックに区分し、
各セルに対してスパース信号分解を行い、各セルにそれぞれ対応するスパースベクトルを取得し、
スパースベクトルに基づき、画像の勾配方向ヒストグラムHOG特徴を抽出するように配置されたプロセッサと、
プロセッサにより実行可能なコマンドを記憶するメモリと、
を含む特徴抽出装置を提供している。
本発明の実施例により提供される技術的解決手段は、下記の好適な効果を含むことができる。
画像を複数のセルを含むブロックに区分することと、各セルに対してスパース信号分解を行い、各セルにそれぞれ対応するスパースベクトルを取得することと、スパースベクトルに基づき、画像の勾配方向ヒストグラムHOG特徴を抽出することにより、HOG特徴の抽出過程における画像の空間領域に対して直接的に計算して取得することによるパターン認識における検出率及び正確度が低いという問題を解決し、周波数領域における画像のHOG特徴の抽出を実現し、パターン認識における検出率及び正確度を向上させる効果を達成している。
理解すべきことは、以上の一般的な説明と後の詳細な説明は例示的なものに過ぎず、本発明を限定するものではない。
ここの図面は明細書に合せされ本明細書の一部を構成し、本発明に適合する実施例を示し、明細書と共に本発明の原理を解釈するのに用いられる。
一例示的な実施例により示された特徴抽出方法のフローチャートである。 別の一例示的な実施例により示された特徴抽出方法のフローチャートである。 一例示的な実施例により示された画像の区分の概略図である。 別の一例示的な実施例により示された画像の区分の概略図である。 一例示的な実施例により示されたセル画素の調整の概略図である。 一例示的な実施例により示されたブロック内のHOG特徴を統計する概略図である。 一例示的な実施例により示された特徴抽出方法のフローチャートである。 一例示的な実施例により示された画像HOG特徴を統計する概略図である。 一例示的実施例により示された特徴抽出装置のブロック図である。 別の一例示的実施例により示された特徴抽出装置のブロック図である。 一例示的実施例により示された特徴抽出装置のサブモジュールのブロック図である。 別の一例示的実施例により示された特徴抽出装置のブロック図である。
ここで例示的な実施例について詳しく説明し、その実例は図面に示す通りである。下記の説明が図面に関わる時、別途に表示されない限り、異なる図面における同じ数字は同じ又は類似する要素を表示する。以下の例示的な実施例に説明される実施形態は本発明と一致する全ての実施形態を代表するわけではない。逆に、それらは特許請求の範囲に詳細に記載された本発明の一部の態様と一致する装置と方法の例に過ぎない。
図1は一例示的な実施例により示された特徴抽出方法のフローチャートであり、図1に示すように、本実施例は該方法をパターン認識のハードウェアに用いることを例として説明し、該方法は以下のステップを含むことができる。
ステップ102において、画像を複数のセルを含む複数のブロックに区分する。
ステップ104において、各セルに対してスパース信号分解を行い、各セルにそれぞれ対応するスパースベクトルを取得する。
スパース信号分解は所与の観測信号を分解ルールに従って複数の要素の値がゼロであるスパースベクトルに転換することである。本実施例において、各セルにおける画素を所与の観測信号とするよって各セルにそれぞれ対応するスパースベクトルを取得する。
ステップ106において、スパースベクトルに基づき、画像のHOG特徴を抽出する。
端末は得られたスパース信号分解後のスパースベクトルに基づき、画像のHOG特徴を抽出する。
上述したように、本発明の実施例により提供される特徴抽出方法は、画像を複数のセルを含むブロックに区分することと、各セルに対してスパース信号分解を行い、各セルにそれぞれ対応するスパースベクトルを取得することと、スパースベクトルに基づき、画像の勾配方向ヒストグラムHOG特徴を抽出することにより、HOG特徴の抽出過程における画像の空間領域に対して直接的に計算して取得することによるパターン認識における検出率及び正確度が低いという問題を解決し、周波数領域における画像のHOG特徴の抽出を実現し、パターン認識における検出率及び正確度を向上させる効果を達成している。
図2Aは別の一例示的な実施例により示された特徴抽出方法のフローチャートであり、図2Aに示すように、本実施例は該方法をパターン認識のハードウェアに用いることを例として説明し、該方法は以下のステップを含むことができる。
ステップ201において、画像に対して正規化処理を行い、所定のサイズの画像を取得する。
パターン認識において、一般的に複数の画像から特徴を抽出することが多く、画像に対する統一処理が便利であるように、画像に対して特徴抽出を行う前、まず端末により画像に対して正規化処理を行い、異なるサイズの画像を所定のサイズの画像に処理する。
ステップ202において、画像を複数のセルを含む複数のブロックに区分する。
好ましくは、正規化処理後の画像を区分することは、画像を複数のブロックに区分し、各ブロックを複数のセルに区分することを含む。
好ましくは、正規化処理後の画像を区分することは、画像を複数のセルに区分し、接続されたセルを複数のセルを含む一つのブロックに組み合わせ、例えば二つずつ隣接する四つの田字状に配列されたセルを一つのブロックに組み合わせることを含む。
本実施例において、画像区分過程では、ブロックとセルの区分の順序を詳しく限定せず、ブロックを区分してからセルを区分してもよく、セルを区分してからブロックに組み合わせてもよい。
本実施例において、画像が区分されたブロックの間に重複領域が存在するか否かを詳しく限定せず、ブロックの間に重複領域が存在してもよく、存在しなくてもよい。
例えば、図2Bに示すように、128画素*128画素の画像20を先に互いに重なっていない16画素*16画素のブロック21に区分してから、さらに16画素*16画素の各ブロック21を8画素*8画素のセル22に区分する場合、画像には8個*8個=64個の互いに重なっていないブロック21が含まれ、各ブロックには2個*2個=4個のセルが含まれる。
例えば、図2Cに示すように、128画素*128画素の画像20を先に重複領域が存在する16画素*16画素のブロック23に区分してから、さらに16画素*16画素の各ブロック23を8画素*8画素のセル24に区分する場合、画像には16個*16個=256個の重複領域が存在するブロック23が含まれ、各ブロックには2個*2個=4個のセルが含まれる。
ステップ203において、各セルにおける画素をn*1次元のベクトルに調整する。
画像を区分した後、各セルにおける画素を一つの行列と考えてもよく、各セルにおける画素に対応する行列をn*1次元のベクトルに調整する。
行列調整過程において、図2Dに示すように、画素に対応する行列25の第2列K27を第1列K26の下に直列接続し、画素に対応する行列25の第3列(図示せず)を直列接続された後の第2列K27の下に直列接続し、これによって類推し、各セルにおける画素に対応する行列25をn*1次元のベクトル28に調整する。
ステップ204において、下記の数3を用いて、各セルにおけるベクトルに対してスパース信号分解を行い、対応するスパースベクトルを取得する。
Figure 2018507495
yは各セルにおけるベクトルであり、Dは予め与えられた過完備辞書であり、xは過完備辞書Dにおいてyをスパース化して得られたスパースベクトルであり、||x||はスパースベクトルxの各列の絶対値の和を求めることを示し、各スパースベクトルはm*1次元のベクトルであり、過完備辞書Dはn*mの行列である。
画像における各セルに対して、端末は過完備辞書Dを事前に設定し、各セルにおけるベクトルを所与の観測信号yとする場合、上記の数3によって計算して各セルにおけるベクトルの予め与えられた過完備辞書Dにおけるスパースベクトルxを取得する。各セルにおける調整後のベクトルはn*1次元であり、端末により予め与えられた過完備辞書Dがn*m行列であるため、上記の数3によって計算により取得された各セルにおけるベクトルに対応するスパースベクトルがm*1次元である。
ステップ205において、スパースベクトルに基づき、各セルの勾配の大きさと勾配の方向を計算し、各セルの記述子を取得する。
勾配演算子を用いて、スパース信号分解後の各セルにおける各画素の横方向勾配と縦方向勾配を計算する。
即ち、勾配演算子を利用して、各セルに対応するスパースベクトルにおける各要素に対し、横方向勾配と縦方向勾配を計算する。
一例示的に、一般的な勾配演算子は表1に示すように、
Figure 2018507495
本実施例において、各セルにおける画素の勾配の大きさを計算する時、表1におけるいずれかの勾配演算子を選択してもよく、他の勾配演算子を選択してもよく、本実施例において勾配演算子に対する選択を詳しく限定しない。
スパースベクトルにおける要素の横方向勾配はH(x,y)であり、縦方向勾配はV(x,y)であると仮定する場合、該要素に対応する勾配方向と勾配ゲインを下記の数4で計算する。
Figure 2018507495
θ(x,y)はスパースベクトルにおける要素(x,y)の勾配方向であり、m(x,y)は要素(x,y)の勾配の大きさである。
勾配方向θ(x,y)の値の範囲は−90度から90度までであり、勾配方向θ(x,y)をz個の部分に均等に区分し、各セルに対応するスパースベクトルにおける全ての要素に対して重み付けm(x,y)に従って勾配方向に区分された各部分を統計し、最後に各セルはz次元のベクトル、即ち、各セルに対応する記述子を取得する。
例えば、勾配方向θ(x,y)を9部分に均等に区分し、各部分に対応する角度は20度であり、各セルに対応するスパースベクトルにおける全ての要素を重み付けm(x,y)に従って20度ごとに統計し、最後に各セルに対応して9次元のベクトルを取得する。
本実施例において、勾配方向を何個の部分に区分するのを詳しく限定しない。
ステップ206において、各ブロックにおける各記述子を統計し、各ブロックのHOG特徴を取得する。
端末は各ブロックに含まれている各セルにおける計算により取得された記述子を統計し、各ブロックのHOG特徴を取得する。
各セルにおける計算により取得された記述子を統計する時、端末は各セルに対応する記述子を直列接続し、各ブロックのHOG特徴が一つのベクトルであるようにして、該ベクトルの次元は該ブロックに含まれているセルに対応する記述子次元のk倍である。
例えば、各セルにおける記述子は9次元のベクトルであり、各ブロックには4個のセルが含まれている場合、4個のセルにおける9次元の記述子を直列接続し、36次元のベクトルを形成し、該36次元のベクトルを対応するブロックのHOG特徴とする。
ステップ207において、画像における各ブロックのHOG特徴を統計し、画像のHOG特徴を取得する。
端末が画像における各ブロックのHOG特徴を統計し、画像のHOG特徴を取得する。端末は画像における各ブロックのHOG特徴を一つの列として一つの行列に直列接続し、画像のHOG特徴を取得する。
例えば、図2Eに示すように、画像にはHOG特徴がKであるK個のブロックが含まれている場合、K個のHOG特徴を一つの行列250に直列接続し、Kを直列接続された行列の第1列260に置き、Kを直列接続された行列の第2列270に置き、これによって類推する。
上述したように、本発明の実施例により提供される特徴抽出方法は、画像を複数のセルを含むブロックに区分し、各セルにおける画素をn*1次元のベクトルに調整し、式を用いて、各セルにおけるベクトルに対してスパース信号分解を行い、対応するスパースベクトルを取得し、スパースベクトルに基づき、各セルの勾配の大きさと勾配の方向を計算し、各セルの記述子を取得し、各ブロックにおける各記述子を統計し、各ブロックのHOG特徴を取得し、画像における各ブロックのHOG特徴を統計し、画像のHOG特徴を取得することにより、HOG特徴の抽出過程における画像の空間領域に対して直接的に計算して取得することによるパターン認識における検出率及び正確度が低いという問題を解決し、周波数領域における画像のHOG特徴の抽出を実現し、パターン認識における検出率及び正確度を向上させる効果を達成している。
図2Aにより示された好ましい実施例において、画像における各ブロックのHOG特徴を統計し画像のHOG特徴の取得過程において、画像における対応的な位置に従うように配列することができる。図3Aに示すようにステップ207を下記ステップ207aと207bで代替できる。
ステップ207aにおいて、画像における、M*N個の画素を含む各ブロックのHOG特徴を初期のL*1次元ベクトルからM*Nの行列(L=M*N)に調整する。
各ブロックのHOG特徴は各セルに対応する記述子を直列接続してL*1次元ベクトルを取得して、L*1次元ベクトルをM*Nの行列に調整するものであり、即ち、各ブロックにおけるL*1次元ベクトルを含まれているセルに従って、各列が一つのセルの記述子である対応する行列に調整し、各セルの記述子を対応する画素に従って調整し、得られた調整後の行列の各列は対応するブロックにおける対応する列の画素に対応するHOG特徴である。
ステップ207bにおいて、各ブロックの調整後のHOG特徴と画像における各ブロックの対応する位置に基づき、画像のHOG特徴を取得する。
各ブロックの調整後のHOG特徴と画像における各ブロックの対応する位置に基づき、画像における画素位置に対応するHOG特徴を取得する。
例えば、図3Bに示すように、画像にHOG特徴がKであるK個のブロックが含まれている場合、K個のHOG特徴をM*Nの行列に調整し、Kを調整した後の行列31を画像における第1のブロック32の対応的な位置に置き、Kを調整した後の行列33を画像における第2のブロック34の対応的な位置に置き、これによって類推し、行列MNを画像における最後のブロックMNの対応的な位置に置く。
上に述べたように、本実施例により提供される特徴抽出方法は、画像における、M*N個の画素を含む各ブロックのHOG特徴を初期のL*1次元ベクトルからM*Nの行列(L=M*N)に調整し、各ブロックの調整後のHOG特徴と画像における各ブロックの対応する位置に基づき、画像のHOG特徴を取得することにより、抽出後の画像のHOG特徴と画像における各ブロックの対応する位置に対応し、画像における各ブロックの特徴をより良く強調することができる。
以下は本発明に関わる装置の実施例であり、本発明に関わる方法の実施例を実行するのに用いることができる。本発明に関わる装置の実施例に開示されていない詳細については、本発明に関わる方法の実施例を参照する。
図4は一例示的な実施例により示された特徴抽出装置のブロック図であり、図4に示すように、該特徴抽出装置は、区分モジュール420と、分解モジュール440と、抽出モジュール460とを含むが、それに限定されない。
区分モジュール420は、画像を複数のセルを含む複数のブロックに区分するように配置される。
分解モジュール440は、各セルに対してスパース信号分解を行い、各セルにそれぞれ対応するスパースベクトルを取得するように配置される。
スパース信号分解は所与の観測信号を分解ルールに従って複数の要素の値がゼロであるスパースベクトルに転換することである。本実施例において、各セルにおける画素を所与の観測信号とするよって各セルにそれぞれ対応するスパースベクトルを取得する。
抽出モジュール460は、スパースベクトルに基づき、画像の勾配方向ヒストグラムHOG特徴を抽出するように配置される。
上述したように、本発明の実施例により提供される特徴抽出装置は、画像を複数のセルを含むブロックに区分し、各セルに対してスパース信号分解を行い、各セルにそれぞれ対応するスパースベクトルを取得し、スパースベクトルに基づき、画像の勾配方向ヒストグラムHOG特徴を抽出することにより、HOG特徴の抽出過程における画像の空間領域に対して直接的に計算して取得することによるパターン認識における検出率及び正確度が低いという問題を解決し、周波数領域における画像のHOG特徴の抽出を実現し、パターン認識における検出率及び正確度を向上させる効果を達成している。
図5は別の一例示的な実施例により示された特徴抽出装置のブロック図であり、図5に示すように、該特徴抽出装置は、処理モジュール410と、区分モジュール420と、分解モジュール440とを含むが、それに限定されない。
処理モジュール410は、画像に対して正規化処理を行い、所定のサイズの画像を取得するように配置される。
パターン認識において、一般的に複数の画像から特徴を抽出することが多い。
画像に対する統一処理が便利になるように、画像に対して特徴抽出を行う前、処理モジュール410は、画像に対して正規化処理を行い、異なるサイズの画像を所定のサイズの画像に処理する。
区分モジュール420は、画像を複数のセルを含む複数のブロックに区分するように配置される。
好ましくは、区分モジュール420が正規化処理後の画像を区分することは、画像を複数のブロックに区分し、各ブロックを複数のセルに区分することを含む。
好ましくは、区分モジュール420が正規化処理後の画像を区分することは、画像を複数のセルに区分し、接続されたセルを複数のセルを含む一つのブロックに組み合わせ、例えば、二つずつ隣接する四つの田字状に配列されたセルを一つのブロックに組み合わせることを含む。
本実施例において、区分モジュール420は画像区分過程において、ブロックの区分とセルの区分の順序を詳しく限定せず、ブロックを区分してからセルを区分してもよく、セルを区分してからブロックに組み合わせてもよい。
本実施例において、区分モジュール420は画像が区分されたブロックの間に重複領域が存在するか否かを詳しく限定せず、ブロックの間に重複領域が存在してもよく、存在しなくてもよい。
分解モジュール440は、各セルに対してスパース信号分解を行い、各セルにそれぞれ対応するスパースベクトルを取得するように配置される。
スパース信号分解は所与の観測信号を分解ルールに従って複数の要素の値がゼロであるスパースベクトルに転換することである。
本実施例において、区分モジュール440は第1調整サブモジュール441と、信号分解サブモジュール442と、抽出モジュール460と、を含むことができる。
第1調整サブモジュール441は、各セルにおける画素をn*1次元のベクトルに調整するように配置される。
画像を区分した後、各セルにおける画素が一つの行列と考えてもよく、第1調整サブモジュール441は各セルにおける画素に対応する行列をn*1次元のベクトルに調整する。
信号分解サブモジュール442は、下記の数5を用いて、各セルにおけるベクトルに対してスパース信号分解を行い、対応するスパースベクトルを取得するように配置される。
Figure 2018507495
yは各セルにおけるベクトルであり、Dは予め与えられた過完備辞書であり、xは過完備辞書Dにおいてyをスパース化して得られたスパースベクトルであり、||x||はスパースベクトルxの各例の絶対値の和を求めることを示し、各スパースベクトルはm*1次元のベクトルであり、過完備辞書Dはn*mの行列である。
画像における各セルに対して、端末は過完備辞書Dを事前に設定し、さらに各セルにおけるベクトルを所与の観測信号yとする場合、信号分解サブモジュール442は上記の数5の計算により、各セルにおけるベクトルの予め与えられた過完備辞書Dにおけるスパースベクトルxを取得する。各セルにおける調整後のベクトルはn*1次元であり、端末の予め与えられた過完備辞書Dがn*mであるため、上記の数5によって計算して取得された各セルにおけるベクトルに対応するスパースベクトルはm*1次元である。
抽出モジュール460は、スパースベクトルに基づき、画像の勾配方向ヒストグラムHOG特徴を抽出するように配置される。
本実施例において、抽出モジュール460は、計算サブモジュール461と、第1統計サブモジュール462と、第2統計サブモジュール463と、を含むことができる。
計算サブモジュール461は、周波数領域における各セルの勾配の大きさと勾配の方向を計算し、各セルの記述子を取得するように配置される。
計算サブモジュール461は、勾配演算子を利用して、DCT変換又はDFT変換後の各セルにおける各画素の横方向勾配と縦方向勾配を計算する。
本実施例は勾配演算子の選択を詳しく限定しない。
画素の横方向勾配はH(x,y)であり、縦方向勾配はV(x,y)であると仮定する場合、各画素の勾配方向と勾配ゲインを下記の数6で計算する。
Figure 2018507495
θ(x,y)は画素(x,y)の勾配方向であり、m(x,y)は画素(x,y)の勾配の大きさである。
勾配方向θ(x,y)の値の範囲は−90度から90度までであり、勾配方向θ(x,y)をz個の部分に均等に区分し、各セルにおける全ての画素に対して重み付けm(x,y)に従って勾配方向に区分された各部分を統計し、最後に各セルは一つのz次元のベクトル、即ち、各セルに対応する記述子を取得する。
本実施例において、勾配方向を何個の部分に区分するのを詳しく限定しない。
第1統計サブモジュール462は、各周波数領域における各ブロック内の各記述子を統計し、各ブロックのHOG特徴を取得するように配置される。
第1統計サブモジュール462は、各ブロックに含まれている各セルにおける計算により取得された記述子を統計し、各ブロックのHOG特徴を取得する。
各セルにおける計算により取得された記述子を統計する時、第1統計サブモジュール462は各セルに対応する記述子を直列接続し、各ブロックのHOG特徴が一つのベクトルであるようにして、該ベクトルの次元が該ブロックに含まれているセルに対応する記述子次元のk倍である。
第2統計サブモジュール463は、画像の周波数領域における各ブロックのHOG特徴を統計するように配置される。
第2統計サブモジュール463は各ブロックのHOG特徴を統計し、画像のHOG特徴を取得する。
好ましくは、第2統計サブモジュール463は、画像における各ブロックのHOG特徴を一つの列として一つの行列に直列接続し、画像のHOG特徴を取得するように配置される。
上述したように、本発明の実施例により提供される特徴抽出装置は、画像を複数のセルを含むブロックに区分し、各セルにおける画素をn*1次元のベクトルに調整し、式を用いて、各セルにおけるベクトルに対してスパース信号分解を行い、対応するスパースベクトルを取得し、スパースベクトルに基づき、各セルの勾配の大きさと勾配の方向を計算し、各セルの記述子を取得し、各ブロックにおける各記述子を統計し、各ブロックのHOG特徴を取得し、画像における各ブロックのHOG特徴を統計し、画像のHOG特徴を取得することにより、HOG特徴の抽出過程における画像の空間領域に対して直接的に計算して取得することによるパターン認識における検出率及び正確度が低いという問題を解決し、周波数領域における画像のHOG特徴の抽出を実現し、パターン認識における検出率及び正確度を向上させる効果を達成している。
図5により示された好ましい実施例において、図6に示すように、第2統計サブモジュール463は、第2調整サブモジュール610と、抽出サブモジュール620と、を含むことができる。
第2調整サブモジュール610は、画像における、M*N個の画素を含む各ブロックのHOG特徴を初期のL*1次元ベクトルからM*Nの行列(L=M*N)に調整するように配置される。
各ブロックのHOG特徴は各セルに対応する記述子を直列接続してL*1次元ベクトルを取得して、調整サブモジュール610はL*1次元ベクトルをM*Nの行列に調整し、即ち、各ブロックにおけるL*1次元ベクトルを含まれているセルに従って、各列が一つのセルの記述子である対応する行列に調整し、各セルの記述子を対応する画素に従って調整し、得られた調整後の行列の各列は対応するブロックにおける対応する列の画素に対応するHOG特徴である。
特徴抽出サブモジュール620は、各ブロックの調整後のHOG特徴と画像における各ブロックの対応する位置に基づき、画像のHOG特徴を取得するように配置される。
特徴抽出サブモジュール620は、各ブロックの調整後のHOG特徴と画像における各ブロックの対応する位置に基づき、画像の対応する画素位置のHOG特徴を取得する。
上述したように、本実施例により提供される特徴抽出方法は、画像における、M*N個の画素を含む各ブロックのHOG特徴を初期のL*1次元ベクトルからM*Nの行列(L=M*N)に調整することにより、各ブロックの調整後のHOG特徴と上記画像における各ブロックの対応的な位置に基づき、画像のHOG特徴を取得し、抽出後の画像のHOG特徴と画像における各ブロックの対応的な位置に対応し、画像における各ブロックの特徴をより良く強調することができる。
上記実施例における装置について、各モジュールの操作を実行する具体的な形態は、すでに該方法に関する実施例において詳しく説明されたため、ここでは詳細な説明を省略する。
本発明の一例示的な実施例は特徴抽出装置を提供し、本発明により提供される特徴抽出方法を実現することができ、該特徴抽出装置は、
画像を複数のセルを含む複数のブロックに区分し、
各セルに対してスパース信号分解を行い、各セルにそれぞれ対応するスパースベクトルを取得し、
スパースベクトルに基づき、画像の勾配方向ヒストグラムHOG特徴を抽出するように配置されたプロセッサと、
プロセッサの実行可能なコマンドを記憶するメモリと、を含む。
図7は一例示的実施例により示される特徴抽出装置のブロック図である。例えば、装置700は、携帯電話、コンピュータ、デジタル放送端末、メッセージ送受信装置、ゲームコンソール、タブレット型装置、医療機器、運動器具、個人用デジタル補助装置などであってもよい。
図7に示すように、装置700は、処理部702、メモリ704、電源部706、マルチメディア部708、音声部710、入力/出力(I/O)のインターフェース712、センサー部714、及び通信部716のうちの一つ又は複数の部材を含むことができる。
処理部702は、一般的に装置700の全体的操作、例えば、表示、電話呼び出し、データ通信、カメラ操作及び記録操作に関する操作を制御する。処理部702は、上記方法の全部又は一部のステップを完成するために、一つ又は複数のプロセッサ720を含んでコマンドを実行してもよい。さらに、処理部702は、その他のモジュールとのインタラクションを便利にするように、一つ又は複数のモジュールを含んでもよい。例えば、処理部702は、マルチメディア部708と処理部702とのインタラクションを便利にするように、マルチメディアモジュールを含んでもよい。
メモリ704は、装置700の操作をサポートするために、様々な種類のデータを記憶するように配置される。これらのデータの実例は、装置700において操作される如何なるアプリケーション又は方法のコマンド、連絡先データ、電話帳データ、メッセージ、画像、ビデオなどを含む。メモリ704は、如何なる種類の揮発性又は不揮発性メモリ又はそれらの組合せ、例えば、スタティックランダムアクセスメモリ(SRAM)、電気的消去可能なプログラマブル読み取り専用メモリ(EEPROM)、消去可能なプログラマブル読み取り専用メモリ(EPROM)、プログラマブル読み取り専用メモリ(PROM)、読み取り専用メモリ(ROM)、磁気メモリ、フラッシュメモリ、磁気ディスク又は光ディスクにより実現することができる。
電源部706は、装置700の様々な部材のために電力を供給する。電源部706は、電源管理システム、一つ又は複数の電源、及びその他の装置700のための電力の生成、管理及び供給に関連する部材を含むことができる。
マルチメディア部708は、装置700とユーザーとの間の一つの出力インターフェースを提供するスクリーンを含む。一部の実施例において、スクリーンは液晶ディスプレイ(LCD)とタッチパネル(TP)を含んでもよい。スクリーンにタッチパネルが含まれる場合、スクリーンはユーザーからの入力信号を受信するために、タッチスクリーンに実現されることができる。タッチパネルは、タッチ、スワイプ及びタッチパネルにおけるジェスチャーを感知するために、一つ又は複数のタッチセンサを含む。上記タッチセンサは、タッチ又はスワイプ動作の境界を感知するとともに、上記タッチ又はスワイプ動作に関わる持続時間及び圧力を検出することができる。一部の実施例において、マルチメディア部708は、フロントカメラ及び/又はバックカメラを含む。装置700が操作モードである場合、例えば、撮影モード又はビデオモードである場合、フロントカメラ及び/又はバックカメラは外部のマルチメディアデータを受信することができる。各フロントカメラ及びバックカメラは、固定された光学レンズシステムであってもよく、又は焦点距離と光学ズーム能力を有する。
音声部710は、音声信号を出力及び/又は入力するように配置される。例えば、音声部710は、マイクロホン(MIC)を含み、装置700が操作モードである場合、例えば、呼び出しモード、記録モード及び音声認識モードである場合、マイクロホンは外部の音声信号を受信するように配置される。受信された音声信号は、さらにメモリ704に記憶され、又は通信部716を介して送信される。一部の実施例において、音声部710は、さらに音声信号を出力するスピーカーを含む。
I/Oインターフェース712は、処理部702と周辺インターフェース部との間にインターフェースを提供し、上記周辺インターフェース部は、キーボード、クリックホイール、ボタンなどであってもよい。これらのボタンは、ホームボタン、ボリュームボタン、スタートボタン及びホールドボタンを含むことができるが、それに限定されない。
センサー部714は、一つ又は複数のセンサーを含み、装置700に各方面の状態評価を提供するためである。例えば、センサー部714は、装置700のオン/オフ状態、部材の相対的位置決めを検出することができ、例えば、前記部材が装置700のディスプレイ及びキーパッドであり、センサー部714は、さらに装置700又は装置700の一つの部材の位置変化、ユーザーと装置700との接触の有無、装置700の方角又は加速/減速及び装置700の温度変化を検出することができる。センサー部714は、近接センサーを含むことができ、如何なる物理的接触がない時、近傍物体の存在を検出するように配置される。センサー部714は、さらに光学センサー、例えば、CMOS又はCCDイメージセンサーを含むことができ、イメージングアプリケーションに用いられる。一部の実施例において、該センサー部714は、さらに加速度センサー、ジャイロセンサー、磁気センサー、圧力センサー又は温度センサーを含むことができる。
通信部716は、装置700とその他の装置との有線又は無線方式による通信を便利にするように配置される。装置700は、通信標準に基づく無線ネットワーク、例えば、Wi−Fi、2G又は3G、又はそれらの組み合わせにアクセスすることができる。一例示的な実施例において、通信部716は、放送チャネルを介して外部放送管理システムからの放送信号又は放送関連情報を受信する。一例示的な実施例において、通信部716は、狭域通信を促進するために、さらに近距離無線通信(NFC)モジュールを含む。例えば、NFCモジュールにおいて、無線周波数認識(RFID)技術、赤外線データ協会(IrDA)技術、超広帯域(UWB)技術、ブルートゥース(BT)及びその他の技術に基づいて実現することができる。
例示的な実施例において、装置700は、一つ又は複数の特定用途向け集積回路(ASIC)、デジタル信号プロセッサ(DSP)、デジタル信号処理装置(DSPD)、プログラマブルロジックデバイス(PLD)、フィールドプログラマブルゲートアレイ(FPGA)、コントローラ、マイクロコントローラ、マイクロプロセッサ又はその他の電子部品により実現することができ、上記特徴抽出方法を実行するのに用いられる。
例示的な実施例において、さらに、コマンドを含む非一時的コンピュータ可読記憶媒体、例えば、コマンドを含むメモリ704を提供し、上記方法を完成するために、上記コマンドは装置700のプロセッサ720により実行することができる。例えば、上記非一時的なコンピュータ可読記憶媒体は、ROM、ランダムアクセスメモリ(RAM)、CD−ROM、磁気テープ、フロッピーディスク及び光データ記憶装置などであってもよい。
当業者であれば、明細書を考慮しここに開示された発明を実践した後、本発明のその他の実施様態を容易に想到できる。本発明は、本発明の如何なる変形、用途又は適応的変化を含むためのものであり、これらの変形、用途又は適応的変化は本発明の一般的な原理に準じ、本発明の開示されていない当該技術分野における一般的知識又は慣用の技術手段を含む。明細書と実施例は例示的なものに過ぎず、本発明の実際の範囲と精神は特許請求の範囲により与えられる。
理解すべきことは、本発明は既に上記のように説明され、図面に示された正確な構造に限定されず、その範囲を逸脱しない限りにおいて様々な修正や変更を行うことができる。本発明の範囲は特許請求の範囲のみにより限定される。

Claims (13)

  1. 特徴抽出方法であって、
    画像を複数のセルを含む複数のブロックに区分することと、
    各前記セルに対してスパース信号分解を行い、各前記セルにそれぞれ対応するスパースベクトルを取得することと、
    前記スパースベクトルに基づき、前記画像の勾配方向ヒストグラムHOG特徴を抽出することと、
    を含むことを特徴とする方法。
  2. 各前記セルに対してスパース信号分解を行い、各前記セルに対応するスパースベクトルを取得することは、
    各前記セルにおける画素をn*1次元のベクトルに調整することと、
    下記の数1を用いて、各前記セルにおける前記ベクトルに対してスパース信号分解を行い、対応するスパースベクトルを取得することと、を含み、
    Figure 2018507495
    yは各前記セルにおける前記ベクトルであり、Dは予め与えられた過完備辞書であり、xは過完備辞書Dにおいてyをスパース化して得られたスパースベクトルであり、||x||は前記スパースベクトルxの各例の絶対値の和を求めることを示し、各前記スパースベクトルはm*1次元のベクトルであり、前記過完備辞書Dはn*mの行列であることを特徴とする請求項1に記載の方法。
  3. 前記スパースベクトルに基づき、前記画像の勾配方向ヒストグラムHOG特徴を抽出することは、
    前記スパースベクトルに基づき、各前記セルの勾配の大きさと勾配の方向を計算し、各前記セルの記述子を取得することと、
    各前記ブロックにおける各前記記述子を統計し、各前記ブロックのHOG特徴を取得することと、
    前記画像における各前記ブロックのHOG特徴を統計し、前記画像のHOG特徴を取得することと、
    を含むことを特徴とする請求項1に記載の方法。
  4. 前記画像における各前記ブロックのHOG特徴を統計し、前記画像のHOG特徴を取得することは、
    前記画像における各前記ブロックのHOG特徴を一つの列として一つの行列に直列接続し、前記画像のHOG特徴を取得することを含むことを特徴とする請求項3に記載の方法。
  5. 前記画像における各前記ブロックのHOG特徴を統計し、前記画像のHOG特徴を取得することは、
    前記画像における、M*N個の画素を含む各前記ブロックのHOG特徴を初期のL*1次元ベクトルからM*Nの行列(L=M*N)に調整することと、
    各前記ブロックの調整後の前記HOG特徴と前記画像における各前記ブロックの対応する位置に基づき、前記画像のHOG特徴を取得することと、
    を含むことを特徴とする請求項3に記載の方法。
  6. 前記方法は、さらに、
    前記画像に対して正規化処理を行い、所定のサイズの前記画像を取得することを含むことを特徴とする請求項1〜5のいずれかに記載の方法。
  7. 特徴抽出装置であって、
    画像を複数のセルを含む複数のブロックに区分するように配置された区分モジュールと、
    各前記セルに対してスパース信号分解を行い、各前記セルにそれぞれ対応するスパースベクトルを取得するように配置された分解モジュールと、
    前記スパースベクトルに基づき、前記画像の勾配方向ヒストグラムHOG特徴を抽出するように配置された抽出モジュールと、
    を含むことを特徴とする装置。
  8. 前記分解モジュールは、
    各前記セルにおける画素をn*1次元のベクトルに調整するように配置された第1調整サブモジュールと、
    下記の数2を用いて、各前記セルにおける前記ベクトルに対してスパース信号分解を行い、対応するスパースベクトルを取得するように配置された信号分解サブモジュールと、を含み、
    Figure 2018507495
    yは各前記セルにおける前記ベクトルであり、Dは予め与えられた過完備辞書であり、xは過完備辞書Dにおいてyをスパース化して得られたスパースベクトルであり、||x||は前記スパースベクトルxの各例の絶対値の和を求めることを示し、各前記スパースベクトルはm*1次元のベクトルであり、前記過完備辞書Dはn*mの行列であることを特徴とする請求項7に記載の装置。
  9. 前記抽出モジュールは、
    前記スパースベクトルに基づき、各前記セルの勾配の大きさと勾配の方向を計算し、各前記セルの記述子を取得するように配置された計算サブモジュールと、
    各前記ブロックにおける各前記記述子を統計し、各前記ブロックのHOG特徴を取得するように配置された第1統計サブモジュールと、
    前記画像における各前記ブロックのHOG特徴を統計し、前記画像のHOG特徴を取得するように配置された第2統計サブモジュールと、
    を含むことを特徴とする請求項7に記載の装置。
  10. 前記第2統計サブモジュールは、
    前記画像における各前記ブロックのHOG特徴を一つの列として一つの行列に直列接続し、前記画像のHOG特徴を取得するように配置されたことを特徴とする請求項9に記載の装置。
  11. 前記第2統計サブモジュールは、
    前記画像における、M*N個の画素を含む各前記ブロックのHOG特徴を初期のL*1次元ベクトルからM*Nの行列(L=M*N)に調整するように配置された第2調整サブモジュールと、
    各前記ブロックの調整後の前記HOG特徴と前記画像における各前記ブロックの対応的な位置に基づき、前記画像のHOG特徴を取得するように配置された特徴抽出サブモジュールと、
    を含むことを特徴とする請求項9に記載の装置。
  12. 前記装置は、さらに、
    前記画像に対して正規化処理を行い、所定のサイズの前記画像を取得するように配置された処理モジュールを含むことを特徴とする請求項7〜11のいずれかに記載の装置。
  13. 特徴抽出装置であって、
    画像を複数のセルを含む複数のブロックに区分し、
    各前記セルに対してスパース信号分解を行い、各前記セルにそれぞれ対応するスパースベクトルを取得し、
    前記スパースベクトルに基づき、前記画像の勾配方向ヒストグラムHOG特徴を抽出するように配置されたプロセッサと、
    プロセッサにより実行可能なコマンドを記憶するメモリと、
    を含むことを特徴とする装置。
JP2017552216A 2015-11-25 2015-12-29 特徴抽出方法及び装置 Pending JP2018507495A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201510827753.4 2015-11-25
CN201510827753.4A CN105654092B (zh) 2015-11-25 2015-11-25 特征提取方法及装置
PCT/CN2015/099312 WO2017088250A1 (zh) 2015-11-25 2015-12-29 特征提取方法及装置

Publications (1)

Publication Number Publication Date
JP2018507495A true JP2018507495A (ja) 2018-03-15

Family

ID=56481853

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017552216A Pending JP2018507495A (ja) 2015-11-25 2015-12-29 特徴抽出方法及び装置

Country Status (8)

Country Link
US (1) US10282637B2 (ja)
EP (1) EP3173978A1 (ja)
JP (1) JP2018507495A (ja)
KR (1) KR101756605B1 (ja)
CN (1) CN105654092B (ja)
MX (1) MX360590B (ja)
RU (1) RU2635267C2 (ja)
WO (1) WO2017088250A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106408086A (zh) * 2016-09-12 2017-02-15 上海影城有限公司 用于图像优化的深度学习神经网络处理方法及***
CN108460899A (zh) * 2017-02-20 2018-08-28 深圳怡化电脑股份有限公司 一种图像特征识别方法和装置
CN108182442B (zh) * 2017-12-29 2022-03-15 惠州华阳通用电子有限公司 一种图像特征提取方法
CN109522910B (zh) * 2018-12-25 2020-12-11 浙江商汤科技开发有限公司 关键点检测方法及装置、电子设备和存储介质
CN111167731B (zh) * 2019-10-23 2022-11-08 武汉库柏特科技有限公司 一种产品分拣方法、产品分拣***和智能分拣机器人
CN111914741B (zh) * 2020-07-30 2024-04-19 云知声智能科技股份有限公司 房产证识别方法、装置和设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013130573A (ja) * 2011-12-20 2013-07-04 Mitsubishi Electric Corp 類縁性ネット上のスパース再構成による画像フィルタリング
JP2014016710A (ja) * 2012-07-06 2014-01-30 Toyota Central R&D Labs Inc 対象物検出装置及びプログラム
JP2015125662A (ja) * 2013-12-27 2015-07-06 株式会社リコー 物体識別プログラム及び装置

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0757077A (ja) 1993-08-13 1995-03-03 Ricoh Co Ltd 画像処理装置
WO2007050680A2 (en) * 2005-10-25 2007-05-03 William Marsh Rice University Method and apparatus for on-line compressed sensing
US8165397B2 (en) * 2006-12-04 2012-04-24 Lockheed Martin Company Identifying descriptor for person or object in an image
US8625861B2 (en) * 2008-05-15 2014-01-07 International Business Machines Corporation Fingerprint representation using gradient histograms
US8457414B2 (en) * 2009-08-03 2013-06-04 National Instruments Corporation Detection of textural defects using a one class support vector machine
US8855190B2 (en) * 2009-10-21 2014-10-07 Futurewei Technologies, Inc. Communication system with compressive sensing
KR101399804B1 (ko) * 2009-11-19 2014-05-27 보드 오브 트러스티스 오브 더 리랜드 스탠포드 주니어 유니버시티 회전 불변형 특징 디스크립터를 이용한 추적 및 인식을 위한 방법 및 장치
US20110142335A1 (en) * 2009-12-11 2011-06-16 Bernard Ghanem Image Comparison System and Method
US8774499B2 (en) * 2011-02-28 2014-07-08 Seiko Epson Corporation Embedded optical flow features
SG11201501691VA (en) 2012-09-05 2015-04-29 Element Inc Biometric authentication in connection with camera-equipped devices
GB201313125D0 (en) * 2013-07-23 2013-09-04 Univ Singapore Technology & Design Method and system for classifying images
TWI513291B (zh) * 2013-12-12 2015-12-11 Ind Tech Res Inst 影像處理的方法、裝置及電腦可讀取媒體
KR101791518B1 (ko) 2014-01-23 2017-10-30 삼성전자주식회사 사용자 인증 방법 및 장치
CN103761537B (zh) * 2014-02-07 2017-02-15 重庆市国土资源和房屋勘测规划院 基于低秩优化特征字典模型的图像分类方法
CN104239872A (zh) * 2014-09-26 2014-12-24 南开大学 异态汉字识别方法
CN104657717B (zh) * 2015-02-12 2018-02-02 合肥工业大学 一种基于分层核稀疏表示的行人检测方法
CN104850852B (zh) * 2015-04-27 2018-06-12 小米科技有限责任公司 特征向量计算方法和装置
US9727785B2 (en) * 2015-06-18 2017-08-08 The Boeing Company Method and apparatus for tracking targets
US9875213B2 (en) * 2015-06-26 2018-01-23 Intel Corporation Methods, apparatus, instructions and logic to provide vector packed histogram functionality
CN105654094B (zh) * 2015-11-25 2019-11-29 小米科技有限责任公司 特征提取方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013130573A (ja) * 2011-12-20 2013-07-04 Mitsubishi Electric Corp 類縁性ネット上のスパース再構成による画像フィルタリング
JP2014016710A (ja) * 2012-07-06 2014-01-30 Toyota Central R&D Labs Inc 対象物検出装置及びプログラム
JP2015125662A (ja) * 2013-12-27 2015-07-06 株式会社リコー 物体識別プログラム及び装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
加藤 利幸、外2名: ""スパースコーディングを用いたマルチフレーム超解像"", 情報処理学会研究報告, vol. Vol.2013-CVIM-187, No.3, JPN6018024959, 23 May 2013 (2013-05-23), JP, pages 1 - 9, ISSN: 0003925666 *
小林 拓也、外2名: ""Histograms of Oriented Gradientsを用いた対象識別での特徴選択"", 電子情報通信学会技術研究報告, vol. 106, no. 606, JPN6018008729, 9 March 2007 (2007-03-09), JP, pages 119 - 124, ISSN: 0003755484 *
日野 英逸、村田 昇: ""スパース表現の数理とその応用"", 情報処理学会研究報告, vol. Vol.2012-CVIM-183, No.20, JPN6018024961, 15 October 2012 (2012-10-15), JP, pages 1 - 10, ISSN: 0003925667 *
竹村 和将、宮城 茂幸: ""統計的形状モデリングによる図上から撮影された距離画像中の歩行者検出"", FIT2013 第12回情報科学技術フォーラム 講演論文集 第3分冊 査読付き論文・一般論文, JPN6018008732, 20 August 2013 (2013-08-20), JP, pages 125 - 128, ISSN: 0003755485 *

Also Published As

Publication number Publication date
RU2016110719A (ru) 2017-09-28
MX360590B (es) 2018-11-08
CN105654092B (zh) 2019-08-30
US20170147899A1 (en) 2017-05-25
US10282637B2 (en) 2019-05-07
KR101756605B1 (ko) 2017-07-10
EP3173978A1 (en) 2017-05-31
WO2017088250A1 (zh) 2017-06-01
RU2635267C2 (ru) 2017-11-09
CN105654092A (zh) 2016-06-08
MX2016003767A (es) 2017-07-31
KR20170074215A (ko) 2017-06-29

Similar Documents

Publication Publication Date Title
JP6378453B2 (ja) 特徴抽出方法及び装置
JP6392468B2 (ja) 領域認識方法及び装置
JP2018507495A (ja) 特徴抽出方法及び装置
US9674395B2 (en) Methods and apparatuses for generating photograph
JP6134446B2 (ja) 画像分割方法、画像分割装置、画像分割デバイス、プログラム及び記録媒体
US9959484B2 (en) Method and apparatus for generating image filter
TWI702544B (zh) 圖像處理方法、電子設備和電腦可讀儲存介質
JP2016531362A (ja) 肌色調整方法、肌色調整装置、プログラム及び記録媒体
CN107463903B (zh) 人脸关键点定位方法及装置
CN109034150B (zh) 图像处理方法及装置
WO2015196715A1 (zh) 图像重定位方法、装置及终端
CN105574834B (zh) 图像处理方法及装置
JP2018507494A (ja) 特徴抽出方法及び装置
CN107133361B (zh) 手势识别方法、装置和终端设备
CN107292901B (zh) 边缘检测方法及装置
US9665925B2 (en) Method and terminal device for retargeting images
CN108053372A (zh) 处理深度图像的方法和装置
EP3599763A2 (en) Method and apparatus for controlling image display
CN115147466A (zh) 图像配准方法及装置、图像处理方法及装置以及存储介质
CN112070681B (zh) 图像处理方法及装置
CN111985280B (zh) 图像处理方法及装置
CN118118651A (zh) 拖影检测方法及装置、电子设备、存储介质和程序产品

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180313

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180604

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180703

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180821

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20181127