JP4439829B2 - データ分析装置およびデータ認識装置 - Google Patents

データ分析装置およびデータ認識装置 Download PDF

Info

Publication number
JP4439829B2
JP4439829B2 JP2003065517A JP2003065517A JP4439829B2 JP 4439829 B2 JP4439829 B2 JP 4439829B2 JP 2003065517 A JP2003065517 A JP 2003065517A JP 2003065517 A JP2003065517 A JP 2003065517A JP 4439829 B2 JP4439829 B2 JP 4439829B2
Authority
JP
Japan
Prior art keywords
frequency distribution
difference
point
luminance
arbitrary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003065517A
Other languages
English (en)
Other versions
JP2004272801A (ja
Inventor
忠弘 大見
光司 小谷
菲菲 李
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Foundation for Advancement of International Science
Original Assignee
Foundation for Advancement of International Science
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Foundation for Advancement of International Science filed Critical Foundation for Advancement of International Science
Priority to JP2003065517A priority Critical patent/JP4439829B2/ja
Priority to US10/548,760 priority patent/US7436999B2/en
Priority to PCT/JP2004/002526 priority patent/WO2004081872A1/ja
Publication of JP2004272801A publication Critical patent/JP2004272801A/ja
Application granted granted Critical
Publication of JP4439829B2 publication Critical patent/JP4439829B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/30Determination of transform parameters for the alignment of images, i.e. image registration
    • G06T7/37Determination of transform parameters for the alignment of images, i.e. image registration using transform domain methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/42Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • G06V40/169Holistic features and representations, i.e. based on the facial image taken as a whole
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person
    • G06T2207/30201Face

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、画像データを分析するデータ分析装置に関する。本発明は、また、そのデータ分析装置を用いたデータ認識装置に関し、特に、顔などの画像認識装置として有効なデータ認識装置に関する。
【0002】
【従来の技術】
最近、顔、音声、指紋、虹彩パターンなどのような、個人の生物測定学的な特徴を利用する個人の識別/認証システムが注目を集めている。それらの中で、顔認識は、それが、人間が行うのと同じであり、特別の設備を使用する必要がないので、人を識別する最も自然で最も有効である方法であると考えられる。顔認識では、個人の顔の特徴抽出が、より効果的なシステムの作成の鍵である。多くの特徴抽出技術が提案されたが、これらの技術はかなり複雑であり、リアルタイムの顔認識へそれらを適用することは困難である。
【0003】
最近、非常に簡便で、高度に信頼できる、ベクトル量子化(VQ)アルゴリズムに基づいた顔認識方法が提案された(非特許文献1)。
【0004】
特許文献1及び特許文献2にも同様のデータ認識装置が開示されている。
【0005】
【特許文献1】
特開2000−101437号公報
【0006】
【特許文献2】
特開2002−203241号公報
【0007】
【非特許文献1】
K.Kotani, C.Qiu, and T.Ohmi, “Face Recognition Using Vector Quantization Histogram Method,” Proc.2002 Int. Conf. on Image Processing, Vol. II of III, pp.II-105-II-108, 2002.
【0008】
【発明が解決しようとする課題】
この顔認識方法は、顔画像のVQ処理によって得られたコードベクトル毎の使用頻度から生成されたヒストグラムが非常に有効な個人の特徴抽出手法として利用された。顔画像に適切なフィルタ処理およびVQ処理を適用することによって、顔認識に有用な特徴を抽出することができる。AT&Tの顔のデータ・ベースでテストした実験結果は、95.6%の認識率を示した。1.1GHzのパーソナルコンピュータを使用したとき、一つの画像のための処理時間は、194ミリ秒である。VQヒストグラム法はそれ以前の顔認識方法よりはるかに簡便でより速いが、それはビデオレート(動画像は一秒間に30フレームであり、ビデオレートとは1フレーム分の33ミリ秒程度の画像認識速度をいう。)認識などの高速データ認識への適用に十分ではない。
【0009】
本発明の課題は、高い処理速度を達成するデータ分析装置及びそのデータ分析装置を用いたデータ認識装置を提供し、高速データ認識を可能とすることにある。
【0010】
【課題を解決するための手段】
本発明によるデータ分析装置及びデータ認識装置は、以下のとおりである。
【0011】
(1) 画像に対して、画像上の任意の一点と第一の方向における前記任意の一点の近傍の点との輝度値の差分を前記任意の一点の第一の輝度差分とし、前記任意の一点と、前記第一の方向とは異なる第二の方向における前記任意の一点の近傍の点との輝度値の差分を前記任意の一点の第二の輝度差分とする計算を、前記画像上の複数点について行う差分計算手段と、
上記差分計算手段により前記画像上の複数点の各々について得られた第一の輝度差分と第二の輝度差分で構成されるベクトルを所定の領域分割方法により分割された複数領域の一領域に割り当て、前記複数領域の各領域に割当てられたベクトル数をその領域の頻度として、前記複数領域の頻度分布を生成する頻度分布生成手段とを備えたことを特徴とするデータ分析装置。
【0012】
(2) 上記(1)項に記載のデータ分析装置において、前記頻度分布生成手段により生成される前記複数領域の頻度分布から、少なくとも一部分の領域に対する頻度分布を抽出して特徴データを生成することを特徴とするデータ分析装置。
【0013】
(3) 上記(1)又は(2)項に記載のデータ分析装置において、前記差分計算手段が前記画像に対して前記計算を行う前に、前記画像に対してフィルタ処理を施すことを特徴とするデータ分析装置。
【0014】
(4) 少なくとも一つ以上の画像に対する一つ以上の頻度分布の情報を記憶する頻度分布記憶手段と、
画像に対して、画像上の任意の一点と第一の方向における前記任意の一点の近傍の点との輝度値の差分を前記任意の一点の第一の輝度差分とし、前記任意の一点と、前記第一の方向とは異なる第二の方向における前記任意の一点の近傍の点との輝度値の差分を前記任意の一点の第二の輝度差分とする計算を、前記画像上の複数点について行う差分計算手段と、
上記差分計算手段により前記画像上の複数点の各々について得られた第一の輝度差分と第二の輝度差分で構成されるベクトルを所定の領域分割方法により分割された複数領域の一領域に割り当て、前記複数領域の各領域に割当てられたベクトル数をその領域の頻度として、前記複数領域の頻度分布を生成する頻度分布生成手段と、
前記頻度分布生成手段により生成された一つ以上の前記画像に関する頻度分布と上記頻度分布記憶手段内の頻度分布とを比較する比較手段とを備えたことを特徴とするデータ認識装置。
【0015】
(5) 上記(4)項に記載のデータ認識装置において、上記比較手段は、上記頻度分布生成手段により生成された一つ以上の前記画像に関する頻度分布と上記頻度分布記憶手段内の頻度分布とを比較し、上記頻度分布記憶手段に記憶されている各頻度分布の中から、所定の比較関数によって特定される頻度分布を選び出すものであることを特徴とするデータ認識装置。
【0016】
(6) 上記(5)項に記載のデータ認識装置において、上記頻度分布生成手段により生成された一つ以上の前記画像に関する頻度分布は、該頻度分布生成手段により生成される前記複数領域の頻度分布から、一部分の領域に対する頻度分布を抽出したものであることを特徴とするデータ認識装置。
【0017】
(7) 上記(4)〜(6)項のいずれかに記載のデータ認識装置において、前記差分計算手段が前記画像に対して前記計算を行う前に、前記画像に対してフィルタ処理を施すことを特徴とするデータ認識装置。
【0018】
(8) 入力される画像データに対してフィルタ処理を施すフィルタ手段と、
上記フィルタ手段によりフィルタ処理の施された画像データに対して、画面上の任意の一点のx方向の輝度差分dIxを前記任意の一点の輝度値と前記任意の一点の右側点又は左側点の輝度値との差とし、前記任意の一点のy方向の輝度差分dIyを前記任意の一点の輝度値と前記任意の一点の下側点又は上側点の輝度値との差とする計算を、前記画面上の複数点について行う差分計算手段と、
上記差分計算手段により前記画面上の複数点の各々について得られたx方向の輝度差分とy方向の輝度差分で構成されるベクトルを所定の領域分割方法により分割された複数領域の一領域に割り当て、前記複数領域の各領域に割当てられたベクトル数をその領域の頻度として、前記複数領域の頻度分布を生成する頻度分布生成手段と、
少なくとも1つ以上の頻度分布の情報を記憶する頻度分布記憶手段と、
上記頻度分布生成手段により生成された上記入力される画像データに関する頻度分布と上記頻度分布記憶手段内の各頻度分布とを比較し、上記頻度分布記憶手段に記憶されている各頻度分布の中から、所定の比較関数によって特定される頻度分布を選び出す比較手段とを備えたことを特徴とするデータ認識装置。
【0019】
(9) 入力される画像データに対して複数フィルタ処理を施す複数フィルタ手段と、
上記複数フィルタ手段によりフィルタ処理の施された画像データに対して、画面上の任意の一点のx方向の輝度差分dIxを前記任意の一点の輝度値と前記任意の一点の右側点又は左側点の輝度値との差とし、前記任意の一点のy方向の輝度差分dIyを前記任意の一点の輝度値と前記任意の一点の下側点又は上側点の輝度値との差とする計算を、前記画面上の複数点について行う差分計算手段と、
上記差分計算手段により前記画面上の複数点の各々について得られたx方向の輝度差分とy方向の輝度差分で構成されるベクトルを所定の領域分割方法により分割された複数領域の一領域に割り当て、前記複数領域の各領域に割り当てられたベクトル数をその領域の頻度として、前記複数領域の頻度分布を生成する頻度分布生成手段と、
前記複数領域の頻度分布の情報を、複数組、記憶する頻度分布記憶手段と、
上記頻度分布生成手段により生成された上記入力される画像データに関する頻度分布と上記頻度分布記憶手段内の各組の頻度分布とを比較し、上記頻度分布記憶手段に記憶されている各組の頻度分布の中から、所定の比較関数によって特定される1組の頻度分布を選び出す比較手段とを備えたことを特徴とするデータ認識装置。
【0020】
(10) 上記(5)、(6)、(8)、及び(9)項のいずれかに記載のデータ認識装置において、上記比較手段による比較の結果、上記所定の比較関数によって選び出される頻度分布が上記頻度分布記憶手段内にない場合、上記頻度分布生成手段により生成された頻度分布を上記頻度分布記憶手段に登録する頻度分布登録手段を備えたことを特徴とするデータ認識装置。
【0021】
【発明の実施の形態】
次に本発明の実施例について図面を参照して説明する。
【0022】
本発明者等は、高速データ認識(例えばビデオレート顔認識)を可能とする、隣接ピクセル輝度差分量子化(APIDQ:Adjacent Pixcel Intensity Difference Quantization)ヒストグラム法と呼ばれる新規で非常に簡便で効果的な高速データ認識方法を開発した。
【0023】
図1は、本発明の一実施例によるデータ認識装置で用いる隣接ピクセル輝度差分量子化(APIDQ)ヒストグラム法の処理ステップを示している。
【0024】
まず、図1を参照して本発明の一実施例で用いる隣接ピクセル輝度差分量子化(APIDQ)ヒストグラム法を概略的に説明する。
【0025】
図1において、顔画像は、後述するローパスフィルタリング(ステップS1)を受け、隣接ピクセル輝度差分が計算される(ステップS2)。
【0026】
このステップS2において、入力画像中の各ピクセル(画素)位置では、2次元ベクトル(すなわち、水平方向において隣接したピクセル(画素)との輝度差分(dIx)および垂直方向において隣接したピクセル(画素)との輝度差分(dIy)から構成された輝度変化ベクトル)が計算される。入力画像中の各ピクセル位置の2次元ベクトル(dIxおよびdIyから構成された輝度変化ベクトル)は、輝度変化角度(θ)およびその量(r)に関する情報を含んでいる。
【0027】
画像中のすべてのピクセルに対して計算された輝度変化ベクトルは、r−θ平面にプロットされる(ステップS3(θ−r系への座標変換))。
【0028】
その後、各ベクトルは、そのθ値およびr値に関して量子化される(ステップS4)。r−θ平面において各量子化された領域に含まれる要素の数を数えることによって、ヒストグラムを生成することができる(ステップS5)。顔画像に対してAPIDQによって得られたこのヒストグラムは、非常に有効な個人の特徴として利用される。
【0029】
顔画像の前処理として適切なローパスフィルタとAPIDQを組み合わせることによって、顔認識のための有用な特徴を抽出することができる。
【0030】
実験の結果は、公に利用可能なAT&T(American Telephone and Telegraph Company)顔データ・ベースから、40人の400の画像(1人当たり10の画像)に対して95.7%の認識率を示す。量子化ステップでテーブル参照(TLU)法を利用することによって、トータルの認識処理時間は、わずかに31ミリ秒であり、ビデオレートでの顔認識を可能にする。
【0031】
次に、図1の隣接ピクセル輝度差分量子化(APIDQ)ヒストグラム法の各ステップについて詳細に説明する。
【0032】
図1に示した隣接ピクセル輝度差分量子化(APIDQ)ヒストグラム法は、特徴抽出手続きを除いてVQヒストグラム法に非常に似ている。前者(VQヒストグラム)方法は、そのためのVQ処理を利用する。VQヒストグラム法は、33の規則的なコードベクトルから構成された非常に基礎的なコードブックを使用しており、直流成分を除去した輝度変化画像ブロックにVQ処理を適用した。これらはVQヒストグラム法の本質であるが、処理は単に、ブロックにおける輝度変化の方向および量を検出し量子化するだけである。APIDQは、同様の処理をより簡便に行うことができる。
【0033】
図1のステップS2について:
図2に示されたように、APIDQにおいては、入力の顔画像の各ピクセルに対して、水平方向に隣接したピクセルとの輝度差分(dIx)および垂直方向に隣接したピクセルとの輝度差分(dIy)が、次の簡便な減算演算を用いて最初に計算される。
【0034】
dIx(i、j)=I(i+1,j)-I(i,j)
dIy(i、j)=I(i,j+l)-I(i,j)
【0035】
図1のステップS3について:
計算されたdIx,dIyのペアは、dIx-dIy平面において(0,0)を始点とする単一のベクトル(輝度変化ベクトル)を表わす。入力画像中のピクセルをすべて処理した後に、輝度変化ベクトルの終点は、図3に示されるようなdIx-dIy平面に分布される。輝度変化ベクトルの終点の分布(密度と形)は、入力顔画像の特徴を表わす。直交座標から極座標に座標系を変換することによって、当該ベクトルの角度θおよび距離rは輝度変化の方向および量をそれぞれ表わす。
【0036】
図1のステップS4について:
それから、各輝度変化ベクトルはr−θ平面において量子化される。量子化テーブルの一例は図4の下方に示されている。量子化テーブル中の数0〜49は、第0乃至第49の量子化領域の指数(index numbers)をそれぞれ表わす。
【0037】
例えば、図4の上方に示された輝度変化ベクトルのθは、3π/8とπ/8との間の領域にあり、その輝度変化ベクトルのrは内側から3番目の領域(図4の下方の量子化テーブルではrが2と4との間の領域に対応する)にある。従って、この図4の上方に示された輝度変化ベクトルは、図4の下方の量子化テーブルに基づいて、指数10の量子化領域として量子化される。
【0038】
図1のステップS5について:
各量子化領域に量子化されたベクトルの数は、カウントされる。カウント数は、横軸を量子化領域の指数0〜49として生成されるヒストグラム(後に図6として図示)の頻度として棒状に表示される。例えば、図4の上方に図示のベクトルは、ヒストグラムにおける指数10の1頻度を構成することになる。このヒストグラムは人間の顔の特徴ベクトルになる。
【0039】
図1のステップS6について:
登録ステップS6では、このヒストグラムが個人の識別情報としてデータ・ベース10に保存される。
【0040】
図1のステップS7及びS8について:
認識ステップS7では、未知の入力顔画像からヒストグラムが作られ、登録された個人ヒストグラムに比較され、最も良くマッチしたものがデータ・ベースマッチングS8の認識結果として出力される。ヒストグラム間のマンハッタン距離(MD)がマッチングの度合いを示すものの一例として使用される。
【0041】
図1のステップS1に戻って、APIDQの前に、ローパスフィルタリングが、簡便な2次元移動平均フィルタ(moving average filter)を使用して、まず行われることに注意する。このローパスフィルタリングは、高周波ノイズの減少および認識のための最も有効な低周波コンポーネントの抽出にとって不可欠である。
【0042】
認識アルゴリズムが非常に簡便で、開発された顔の特徴抽出方法が、従来の認識方法とは全く異なるので、単独で用いるだけでなく、最小の追加コストで、認識精度を増加させる形で、従来方法と組み合わせることが容易であり、また、非常に有効である。
【0043】
次に、本発明を用いた顔認識実験の結果について説明する。
【0044】
公に利用可能なAT&T顔データ・ベースを認識実験のために使用した。各人が、顔の角度、顔の表情、および照明条件で変化を持たせた、10の顔画像を持った40人の合計400の画像が、データ・ベースに含まれてる。各画像は、92×112の解像度を持っている。図5は、AT&Tのデータ・ベースの典型的な画像のサンプルを示している。各人の10の画像から、5つの画像が評価入力画像として選択され、残りの5つは、データベース登録画像として登録された。認識実験は、ローテーション法を使用して、252(=10)回の評価入力画像−データベース登録画像の組合せに対して、実行された。
【0045】
次に、本発明による認識パフォーマンスについて説明する。
【0046】
図6は、ヒストグラムの典型的な例を示す。別人のヒストグラムは明らかに異なる。しかしながら、同一人物の異なる画像のヒストグラムは、詳細には小さな違いがあるが、多くの場合類似している。APIDQによって得られたヒストグラムが人を識別するための非常に有効な個人の特徴であると言える。
【0047】
認識結果を図7に示す。図7において、認識率はフィルタ・サイズの関数として示されている。フィルタ・サイズは、平均値フィルタのコア(averaging filter core)のサイズを表わす。F3のサイズは、例えば、3×3フィルタコアのサイズを表わす。“Max”、“Min”、および“Ave”は、252(=10)回の評価入力画像−データベース登録画像の組合せに対する最良の場合の結果、最悪の場合の結果、および平均結果を、それぞれ表わす。認識率は、F3からF19までのフィルタ・サイズに対しては、ほとんど一定であり、95.7%という最も高い平均認識率が得られる。これは、同じ条件下でのVQヒストグラム法(95.6%)の場合とほとんど同じである。認識パフォーマンスを下げる、例えば、しわ、局部的なヘアスタイル、画像取得条件、および時間経過による、詳細な顔の特徴は、ローパスフィルタの適用によって、除外される。顔の大まかな形状のような、重要な各人の顔の特徴だけが抽出される。更に、APIDQ処理は、照明条件によって変化するピクセル輝度のdc成分を効果的に除外することができる。これらの2つの効果の組合せによって、顔認識のために最も重要な情報を効果的に抽出することができる。
【0048】
上述したように、APIDQを使用した顔の特徴抽出に、ローパス・フィルタリングは非常に有効である。異なるサイズのフィルタの使用により異なる特徴を抽出することができることを期待することができる。したがって、より強力な個人の特徴情報は、多数のフィルタ・サイズを使用した多数の認識結果を組み合わせることにより得ることができる。実際上、異なるサイズのフィルタでの認識結果(類似性スコア)は最初に別々に得られ、次に、平均(averaging)により組み合わせられた。図8は、多数の(multiple)フィルタの使用により得られた認識結果を示している。ここで、F3、F5、F17、およびF23が、3×3、5×5、17×17、および23×23のフィルタ・サイズをそれぞれ表わしている。多数のフィルタの使用によって、認識率は、2%増加し、約98%の平均認識率となる。
【0049】
次に、本発明における認識スピードについて説明する。
【0050】
認識アルゴリズムは、ANSICを使用してプログラムされ、かつ、PC(AMD Athron 1.1GHz)上で実行された。r−θ座標における量子化は、簡単な条件付き分岐(“if”ステートメント)を介して実施される。AT&Tデータ・ベース中の一つの画像に対する処理時間は、37ミリ秒(ローパス・フィルタリングのために15ミリ秒、APIDQ処理のために7ミリ秒、およびデータ・ベースマッチングのために15ミリ秒)であった。VQヒストグラム法のVQ処理時間と比較して、APIDQによって行われた顔の特徴抽出の処理時間は、164ミリ秒(VQ)から7ミリ秒(APIDQ)に減らされた。処理時間の大幅な短縮が達成された。更に、量子化に使用された簡単な条件付き分岐(“if”ステートメント)が、計算速度にはそれほど有効でないので、“if”ステートメントの代りに、テーブル参照(TLU)法を使用することを試みた。TLUがr−θドメインに適用される場合、APIDQ処理時間は、7ミリ秒から5ミリ秒に減じられた。更に、TLUは直接dIx-dIyドメインに適用され得る。その場合、APIDQは、1ミリ秒以内になされ得て、トータル認識時間は31ミリ秒になる。顔検出処理ステップは含まれないが、ビデオレートでの顔認識が可能になる。
【0051】
以上説明したように、本発明は、APIDQヒストグラム法と呼ばれる非常に速く高信頼性の顔認識方法を提供することができた。その顔認識方法は、適切なフィルタリング、輝度変化方向および量の量子化、およびヒストグラム生成および分析に基づく。95.7%の認識率という大きな優れた顔認識パフォーマンスが、公に利用可能なAT&T顔データ・ベースの使用により確認された。
【0052】
dIx-dIyドメインにテーブル参照(TLU)法を直接利用することによって、トータルの認識処理時間は、わずか31ミリ秒であり、ビデオレートでの顔認識を可能にする。
【0053】
図1をまとめると、本発明の一実施例によるデータ認識装置は、以下のデータ分析装置100を備えたものと考えることができる。
【0054】
すなわち、データ分析装置100は、
画像に対して、画像上の任意の一点と第一の方向における前記任意の一点の近傍の点との輝度値の差分を前記任意の一点の第一の輝度差分(dIx)とし、前記任意の一点と、前記第一の方向とは異なる(例えば、前記第一の方向に直交する)第二の方向における前記任意の一点の近傍の点との輝度値の差分を前記任意の一点の第二の輝度差分(dIy)とする計算を、前記画像上の複数点について行う差分計算手段(図1のS2)と、
上記差分計算手段により前記画像上の複数点の各々について得られた第一の輝度差分と第二の輝度差分で構成されるベクトル(輝度変化ベクトル)を所定の領域分割方法により分割された複数領域(図4の量子化テーブルの指数0〜49にて表わされる領域)の一領域に割り当て、前記複数領域の各領域に割り当てられたベクトル数をその領域の頻度として、前記複数領域の頻度分布を生成する頻度分布生成手段(図1のS3〜S5)とを備えている。
【0055】
ここで、所定の領域分割方法は、上記実施例で用いた、輝度変化ベクトルをθ−r系への座標変換によりr−θ平面の複数領域の一領域に割り当てる方法に限定されるものではなく、この所定の領域分割方法として他の領域分割方法を用いても良い。
【0056】
また、上記差分計算手段は、画像データに対して、画面上の任意の一点のx方向の輝度差分dIxを前記任意の一点の輝度値と前記任意の一点の右側点(又は左側点)の輝度値との差とし、前記任意の一点のy方向の輝度差分dIyを前記任意の一点の輝度値と前記任意の一点の下側点(又は上側点)の輝度値との差とする計算を、前記画面上の複数点について行うものであって良い。
【0057】
なお、このデータ分析装置100において、前記頻度分布生成手段により生成される前記複数領域の頻度分布から、少なくとも一部分の領域に対する頻度分布を抽出して特徴データを生成するようにしても良い。
【0058】
本発明の一実施例によるデータ認識装置は、上記データ分析装置100に加えて、以下の手段を備えているものと考えることができる。
【0059】
すなわち、データ認識装置は、
少なくとも一つ以上の画像に対する一つ以上の頻度分布の情報を記憶する頻度分布記憶手段(図1のデータ・ベース10)と、
前記頻度分布生成手段により生成された一つ以上の前記画像に関する頻度分布と上記頻度分布記憶手段内の頻度分布とを比較する比較手段(図1のS8)とを備えている。
【0060】
好ましくは、上記比較手段は、上記頻度分布生成手段により生成された一つ以上の前記画像に関する頻度分布と上記頻度分布記憶手段内の頻度分布とを比較し、上記頻度分布記憶手段に記憶されている各頻度分布の中から、所定の比較関数によって特定される頻度分布を選び出すものである。
【0061】
なお、このデータ認識装置において、上記頻度分布生成手段により生成された一つ以上の前記画像に関する頻度分布は、該頻度分布生成手段により生成される前記複数領域の頻度分布から、一部分の領域に対する頻度分布を抽出したものであっても良い。
【0062】
なお、データ認識装置は、上記比較手段(図1のS8)による比較の結果、上記所定の比較関数によって選び出される頻度分布が上記頻度分布記憶手段内にない場合、上記頻度分布生成手段により生成された頻度分布を上記頻度分布記憶手段に登録する頻度分布登録手段(図1のS6)を備え手も良い。
【0063】
また、データ認識装置は、入力される画像データに対してフィルタ処理を施すフィルタ手段(図1のS1)を、更に備え、前記差分計算手段は、このフィルタ手段によりフィルタ処理の施された画像データに対して、差分計算するようにしても良い。
【0064】
このフィルタ手段(図1のS1)は、上記実施例で用いたローパスフィルタに限定されるものではなく、このフィルタ手段として他のフィルタを用いても良い。
【0065】
代りに、入力される画像データに対して複数フィルタ処理を施す複数フィルタ手段を設け、この複数フィルタ手段によりフィルタ処理の施された画像データに対して、前記差分計算手段が、差分計算するようにしても良い。
【0066】
この場合、データ認識装置は、前記複数領域の頻度分布の情報を、複数組、記憶する頻度分布記憶手段と、上記頻度分布生成手段により生成された上記入力される画像データに関する頻度分布と上記頻度分布記憶手段内の各組の頻度分布とを比較し、上記頻度分布記憶手段に記憶されている各組の頻度分布の中から、所定の比較関数によって特定される1組の頻度分布を選び出す比較手段とを備えても良い。
【0067】
本発明は、上記実施例で述べた顔認識への適用に限定されるものではなく、一般の画像やその他の大容量データの高速データ認識に適用しても良いことはもちろんである。
【0068】
【発明の効果】
以上説明したように、本発明によれば、高い処理速度を達成するデータ分析装置及びそのデータ分析装置を用いたデータ認識装置を得られ、高速データ認識や瞬時のデータ認識が可能となる。
【図面の簡単な説明】
【図1】本発明の一実施例によるデータ認識装置で用いる隣接ピクセル輝度差分量子化(APIDQ)ヒストグラム法の認識処理ステップを示したフローチャートである。
【図2】本発明の一実施例による隣接ピクセル輝度差分計算の説明に使用する図である。
【図3】本発明の一実施例の動作の説明に使用する図であり、(dIx,dIy)ベクトル分布の典型的な例を示した図である。
【図4】本発明の一実施例の動作の説明に使用する図であり、r−θ平面及び量子化テーブルを示した図である。
【図5】本発明の一実施例で使用する、AT&Tのデータ・ベースの典型的な顔画像のサンプルを示した図である。
【図6】本発明の一実施例の動作の説明に使用する図であり、ヒストグラムの典型的な例を示した図である。
【図7】本発明の一実施例の効果の説明に使用する図であり、認識成功率(Recognition success rate)をフィルタ・サイズの関数として示した図である。
【図8】本発明の一実施例の効果の説明に使用する図であり、多数のフィルタの使用によって得られた認識結果を示した図である。
【符号の説明】
S1 ローパスフィルタリング
S2 隣接ピクセル輝度差分計算
S3 座標系変換(θ−r)
S4 量子化
S5 ヒストグラム生成
S6 登録
S7 認識
S8 データ・ベースマッチング
10 データ・ベース
100 データ分析装置

Claims (10)

  1. 画像に対して、画像上の任意の一点と第一の方向における前記任意の一点の近傍の点との輝度値の差分を前記任意の一点の第一の輝度差分とし、前記任意の一点と、前記第一の方向とは異なる第二の方向における前記任意の一点の近傍の点との輝度値の差分を前記任意の一点の第二の輝度差分とする計算を、前記画像上の複数点について行う差分計算手段と、
    上記差分計算手段により前記画像上の複数点の各々について得られた第一の輝度差分と第二の輝度差分で構成される2次元ベクトルをその輝度変化の方向および量に関して量子化し、量子化されたベクトルを所定の領域分割方法により分割された複数領域の一領域に割り当て、前記複数領域の各領域に割当てられたベクトル数をその領域の頻度として、前記複数領域の頻度分布を生成する頻度分布生成手段とを備えたことを特徴とするデータ分析装置。
  2. 請求項1に記載のデータ分析装置において、前記頻度分布生成手段により生成される前記複数領域の頻度分布から、少なくとも一部分の領域に対する頻度分布を抽出して特徴データを生成することを特徴とするデータ分析装置。
  3. 請求項1又は2に記載のデータ分析装置において、前記差分計算手段が前記画像に対して前記計算を行う前に、前記画像に対してフィルタ処理を施すことを特徴とするデータ分析装置。
  4. 少なくとも一つ以上の画像に対する一つ以上の頻度分布の情報を記憶する頻度分布記憶手段と、
    画像に対して、画像上の任意の一点と第一の方向における前記任意の一点の近傍の点との輝度値の差分を前記任意の一点の第一の輝度差分とし、前記任意の一点と、前記第一の方向とは異なる第二の方向における前記任意の一点の近傍の点との輝度値の差分を前記任意の一点の第二の輝度差分とする計算を、前記画像上の複数点について行う差分計算手段と、
    上記差分計算手段により前記画像上の複数点の各々について得られた第一の輝度差分と第二の輝度差分で構成される2次元ベクトルをその輝度変化の方向および量に関して量子化し、量子化されたベクトルを所定の領域分割方法により分割された複数領域の一領域に割り当て、前記複数領域の各領域に割当てられたベクトル数をその領域の頻度として、前記複数領域の頻度分布を生成する頻度分布生成手段と、
    前記頻度分布生成手段により生成された一つ以上の前記画像に関する頻度分布と上記頻度分布記憶手段内の頻度分布とを比較する比較手段とを備えたことを特徴とするデータ認識装置。
  5. 請求項4に記載のデータ認識装置において、上記比較手段は、上記頻度分布生成手段により生成された一つ以上の前記画像に関する頻度分布と上記頻度分布記憶手段内の頻度分布とを比較し、上記頻度分布記憶手段に記憶されている各頻度分布の中から、所定の比較関数によって特定される頻度分布を選び出すものであることを特徴とするデータ認識装置。
  6. 請求項5に記載のデータ認識装置において、上記頻度分布生成手段により生成された一つ以上の前記画像に関する頻度分布は、該頻度分布生成手段により生成される前記複数領域の頻度分布から、一部分の領域に対する頻度分布を抽出したものであることを特徴とするデータ認識装置。
  7. 請求項4〜6のいずれかに記載のデータ認識装置において、前記差分計算手段が前記画像に対して前記計算を行う前に、前記画像に対してフィルタ処理を施すことを特徴とするデータ認識装置。
  8. 入力される画像データに対してフィルタ処理を施すフィルタ手段と、
    上記フィルタ手段によりフィルタ処理の施された画像データに対して、画面上の任意の一点のx方向の輝度差分dIxを前記任意の一点の輝度値と前記任意の一点の右側点又は左側点の輝度値との差とし、前記任意の一点のy方向の輝度差分dIyを前記任意の一点の輝度値と前記任意の一点の下側点又は上側点の輝度値との差とする計算を、前記画面上の複数点について行う差分計算手段と、
    上記差分計算手段により前記画面上の複数点の各々について得られたx方向の輝度差分とy方向の輝度差分で構成される2次元ベクトルをその輝度変化の方向および量に関して量子化し、量子化されたベクトルを所定の領域分割方法により分割された複数領域の一領域に割り当て、前記複数領域の各領域に割当てられたベクトル数をその領域の頻度として、前記複数領域の頻度分布を生成する頻度分布生成手段と、
    少なくとも1つ以上の頻度分布の情報を記憶する頻度分布記憶手段と、
    上記頻度分布生成手段により生成された上記入力される画像データに関する頻度分布と上記頻度分布記憶手段内の各頻度分布とを比較し、上記頻度分布記憶手段に記憶されている各頻度分布の中から、所定の比較関数によって特定される頻度分布を選び出す比較手段とを備えたことを特徴とするデータ認識装置。
  9. 入力される画像データに対して複数フィルタ処理を施す複数フィルタ手段と、
    上記複数フィルタ手段によりフィルタ処理の施された画像データに対して、画面上の任意の一点のx方向の輝度差分dIxを前記任意の一点の輝度値と前記任意の一点の右側点又は左側点の輝度値との差とし、前記任意の一点のy方向の輝度差分dIyを前記任意の一点の輝度値と前記任意の一点の下側点又は上側点の輝度値との差とする計算を、前記画面上の複数点について行う差分計算手段と、
    上記差分計算手段により前記画面上の複数点の各々について得られたx方向の輝度差分とy方向の輝度差分で構成される2次元ベクトルをその輝度変化の方向および量に関して量子化し、量子化されたベクトルを所定の領域分割方法により分割された複数領域の一領域に割り当て、前記複数領域の各領域に割り当てられたベクトル数をその領域の頻度として、前記複数領域の頻度分布を生成する頻度分布生成手段と、
    前記複数領域の頻度分布の情報を、複数組、記憶する頻度分布記憶手段と、
    上記頻度分布生成手段により生成された上記入力される画像データに関する頻度分布と上記頻度分布記憶手段内の各組の頻度分布とを比較し、上記頻度分布記憶手段に記憶されている各組の頻度分布の中から、所定の比較関数によって特定される1組の頻度分布を選び出す比較手段とを備えたことを特徴とするデータ認識装置。
  10. 請求項5、6、8、及び9のいずれかに記載のデータ認識装置において、上記比較手段による比較の結果、上記所定の比較関数によって選び出される頻度分布が上記頻度分布記憶手段内にない場合、上記頻度分布生成手段により生成された頻度分布を上記頻度分布記憶手段に登録する頻度分布登録手段を備えたことを特徴とするデータ認識装置。
JP2003065517A 2003-03-11 2003-03-11 データ分析装置およびデータ認識装置 Expired - Fee Related JP4439829B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2003065517A JP4439829B2 (ja) 2003-03-11 2003-03-11 データ分析装置およびデータ認識装置
US10/548,760 US7436999B2 (en) 2003-03-11 2004-03-02 Data analysis device and data recognition device
PCT/JP2004/002526 WO2004081872A1 (ja) 2003-03-11 2004-03-02 データ分析装置およびデータ認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003065517A JP4439829B2 (ja) 2003-03-11 2003-03-11 データ分析装置およびデータ認識装置

Publications (2)

Publication Number Publication Date
JP2004272801A JP2004272801A (ja) 2004-09-30
JP4439829B2 true JP4439829B2 (ja) 2010-03-24

Family

ID=32984497

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003065517A Expired - Fee Related JP4439829B2 (ja) 2003-03-11 2003-03-11 データ分析装置およびデータ認識装置

Country Status (3)

Country Link
US (1) US7436999B2 (ja)
JP (1) JP4439829B2 (ja)
WO (1) WO2004081872A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8712140B2 (en) * 2005-04-15 2014-04-29 Intelligent Virus Imaging Inc. Method of analyzing cell structures and their components
US8218834B2 (en) * 2005-04-15 2012-07-10 Intelligent Virus Imaging Inc. Method of analyzing cell structures and their components
US8238677B2 (en) * 2008-03-07 2012-08-07 International Business Machines Corporation Adaptive lossless data compression method for compression of color image data
US8260076B1 (en) * 2009-03-31 2012-09-04 Hewlett-Packard Development Company, L.P. Constant time filtering
TWI384406B (zh) * 2009-05-26 2013-02-01 Univ Nat Chiao Tung 人臉辨識與合成方法
US8818714B2 (en) * 2010-12-10 2014-08-26 Sony Corporation Portable navigation device and method with active elements
JP2013029953A (ja) * 2011-07-28 2013-02-07 Sony Corp 画像処理装置および方法
DE102015120967A1 (de) * 2015-12-02 2017-06-08 Carl Zeiss Ag Verfahren und Vorrichtung zur Bildkorrektur
DE102017112484A1 (de) 2017-06-07 2018-12-13 Carl Zeiss Ag Verfahren und Vorrichtung zur Bildkorrektur
EP3798592A1 (en) * 2019-09-27 2021-03-31 Koninklijke Philips N.V. Multi-/hyperspectral two-dimensional image processing

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3353968B2 (ja) * 1992-09-25 2002-12-09 オリンパス光学工業株式会社 画像処理装置
JPH0737103A (ja) * 1993-07-23 1995-02-07 Olympus Optical Co Ltd 傾き角度検出装置
JP3373008B2 (ja) * 1993-10-20 2003-02-04 オリンパス光学工業株式会社 画像像域分離装置
EP1265190B1 (en) * 1993-12-10 2009-06-24 Ricoh Company, Ltd. Image recognition method for extracting/recognizing specific image from input image signal
JP2000101437A (ja) * 1998-04-17 2000-04-07 Tadahiro Omi コ―ドブック方式によるデ―タ分析装置および方法、デ―タ認識装置および方法、記録媒体
JP2002203241A (ja) 2000-12-28 2002-07-19 Tadahiro Omi コードブック方式によるデータ認識装置、データ認識方法および記録媒体
US6865295B2 (en) * 2001-05-11 2005-03-08 Koninklijke Philips Electronics N.V. Palette-based histogram matching with recursive histogram vector generation
US7162076B2 (en) * 2003-02-11 2007-01-09 New Jersey Institute Of Technology Face detection method and apparatus

Also Published As

Publication number Publication date
US7436999B2 (en) 2008-10-14
JP2004272801A (ja) 2004-09-30
US20060088212A1 (en) 2006-04-27
WO2004081872A1 (ja) 2004-09-23

Similar Documents

Publication Publication Date Title
Baskan et al. Projection based method for segmentation of human face and its evaluation
CN105426829B (zh) 基于人脸图像的视频分类方法和装置
WO2003081532A1 (en) Method and apparatus for the automatic detection of facial features
Chetty et al. Automated lip feature extraction for liveness verification in audio-video authentication
CN110348263A (zh) 一种基于图像识别的二维随机码图像识别与提取方法
CN106778613A (zh) 一种基于人脸分割区域匹配的身份验证方法及装置
KR102458615B1 (ko) 피부 상태 측정 장치, 이를 포함하는 피부 상태 측정 시스템 및 그 방법
CN111339897B (zh) 活体识别方法、装置、计算机设备和存储介质
JP4439829B2 (ja) データ分析装置およびデータ認識装置
Pigeon et al. Image-based multimodal face authentication
Thamaraimanalan et al. Multi biometric authentication using SVM and ANN classifiers
CN111709305A (zh) 一种基于局部图像块的人脸年龄识别方法
Winarno et al. Face recognition based on symmetrical half-join method using stereo vision camera
Mohamed et al. Automated face recogntion system: Multi-input databases
Bharadi et al. Multi-instance iris recognition
Krichen et al. Specific texture analysis for iris recognition
Ribarić et al. Personal recognition based on the Gabor features of colour palmprint images
JP2000348173A (ja) 唇抽出方法
Dhall et al. Adaptive digital makeup
Cheng et al. Illumination normalization based on different smoothing filters quotient image
Su et al. Micro-expression recognition based on the spatio-temporal feature
Prinosil et al. Facial image de-identification using active appearance model
Saeed Comparative analysis of lip features for person identification
Ma et al. A lip localization algorithm under variant light conditions
Belahcene et al. 3D and 2D face recognition based on image segmentation

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060309

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20060810

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20061012

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090924

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091120

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091216

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100106

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130115

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130115

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees