JP5294798B2 - 画像処理装置及び画像処理方法 - Google Patents

画像処理装置及び画像処理方法 Download PDF

Info

Publication number
JP5294798B2
JP5294798B2 JP2008274662A JP2008274662A JP5294798B2 JP 5294798 B2 JP5294798 B2 JP 5294798B2 JP 2008274662 A JP2008274662 A JP 2008274662A JP 2008274662 A JP2008274662 A JP 2008274662A JP 5294798 B2 JP5294798 B2 JP 5294798B2
Authority
JP
Japan
Prior art keywords
subject
storage device
pixel information
scanning direction
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008274662A
Other languages
English (en)
Other versions
JP2010102584A (ja
Inventor
哲 八代
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2008274662A priority Critical patent/JP5294798B2/ja
Priority to US12/603,458 priority patent/US8482812B2/en
Publication of JP2010102584A publication Critical patent/JP2010102584A/ja
Application granted granted Critical
Publication of JP5294798B2 publication Critical patent/JP5294798B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/94Hardware or software architectures specially adapted for image or video understanding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/248Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
    • G06V30/2504Coarse or fine approaches, e.g. resolution of ambiguities or multiscale approaches

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Description

本発明は、画像処理装置及び画像処理方法に関する。
画像から特定の被写体パターンを自動的に検出する画像処理方法は非常に有用であり、例えば人間の顔の判定に利用することができる。このような方法は、通信会議、マン・マシン・インタフェース、セキュリティ、人間の顔を追跡するためのモニタ・システム、画像圧縮などの多くの分野で使用することができる。このような画像中から被写体を検出する技術の例としては、非特許文献1の報告がある。
この報告の中ではAdaBoostを使って多くの弱判別器を有効に組合せて判別精度を向上させる一方、この判別器を直列に繋ぎ、カスケード型の検出器を構成するようにしている。更に夫々の弱判別器をHaarタイプの矩形特徴量で構成し、矩形特徴量の算出を、積分画像を利用して高速に行っている。このカスケード型の検出器は、まず前段の単純な(即ち計算量のより少ない)判別器を使って明らかに被写体でないパターンの候補をその場で除去する。そしてその後、それ以外の候補に対してのみ、より高い識別性能を持つ後段の複雑な(即ち計算量のより多い)判別器を使って被写体かどうかの判定を行っており、全ての候補に対して複雑な判定を行う必要がないので高速である。
一般に、デジタルカメラで撮影した画像内においてある被写体を探索する際、所定の大きさのサブウィンドウ(枠)を走査させ、サブウィンドウ内の画像を切り出したパターン画像に対し被写体であるか否かの2クラス判別が行われる。そのため、検出時間の短縮は早い段階でいかに被写体でないパターンを除くかにかかっている。
従来は、早い段階で高速に絞り込むために、所定の絞込み性能を実現するのに必要な演算量が最小になるような特徴量となる局所領域の位置やサイズなどを総当りで探索し、これを組み合わせることで弱判別器を構成していた。
「Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR'01)」、"Rapid Object Detection using Boosted Cascade of Simple Features"
しかしながら、更に処理速度を向上するためには、パターン画像や積分画像の読み出し、及び転送スピードがボトルネックとなっていた。
本発明はこのような問題点に鑑みなされたもので、パターン画像の読み出し及び転送スピードに着目して高速な被写体検出(被写体判定)を実現することを目的とする。
そこで、本発明の画像処理装置は、画像データを主走査方向に走査した順に第1の記憶装置に格納して記憶する第1の記憶手段と、前記第1の記憶装置から第2の記憶装置へ前記画像データにおける照合パターン領域のうち部分領域の画素情報を転送する転送手段と、前記第2の記憶装置に記憶されている前記画素情報を参照し、前記画素情報に基づいて、前記照合パターン領域が被写体領域か否かを判別する被写体判別手段と、を有し、前記被写体判別手段は、それぞれ異なる部分領域を参照する、少なくとも第1の被写体判別手段と、第2の被写体判別手段と、を含み、前記第2の被写体判別手段は、前記第1の被写体判別手段により被写体領域と判別された照合パターン領域が被写体領域か否かを判別するものであり、前記転送手段は、前記第1の被写体判別手段が参照する部分領域として、主走査方向が副走査方向より長い部分領域の画素情報を前記第1の記憶装置から前記第2の記憶装置に転送し、前記第1の被写体判別手段は、前記主走査方向が副走査方向より長い部分領域の画素情報を参照して前記照合パターン領域が被写体領域であるか否かを判別することを特徴とする。
本発明によれば、パターン画像の読み出し及び転送スピードに着目して高速な被写体検出(被写体判定)を実現することができる。
以下、本発明の実施形態について図面に基づいて説明する。
<第1の実施形態>
図1は、画像処理装置のハードウェア構成の一例を示す図(その1)である。
画像処理装置は、CPU201、ROM202、DRAM203、ドライブI/F204、HDD205、画像入力装置206、入力装置208、表示装置209、ネットワークI/F210、これらを接続するバス211を介して相互にデータの入出力を行う。
CPU201は、ROM202やDRAM203に格納されたプログラムに従って命令を実行する。ROM202は、本実施形態のプログラムやその他の制御に必要なプログラムやデータを格納する。DRAM203は、一時的なデータを格納する。ドライブI/F204は、IDEやSCSI等の外部記憶装置とのインターフェースを実現する。HDD205は、画像やパターン抽出等のプログラムや、顔、非顔のサンプルパターン等を記憶する。画像入力装置206は、デジタルカメラやスキャナ等の装置から画像を入力する。入力装置208は、キーボードやマウス等、オペレータからの入力を行う。表示装置209は、ブラウン管や液晶ディスプレイ等、オペレータに対する表示を行う。ネットワークI/F210は、インターネットやイントラネット等のネットワークと接続を行うモデムやLAN等である。
CPU201の内部には、メモリキャッシュと呼ばれる、DRAMより高速にデータの入出力が可能なSRAM213が含まれている。
図2は、画像処理装置の機能構成の一例を示した図である。
第1記憶部10は、DRAM203の一部である第1記憶装置(第1の記憶装置)に、直交する主走査方向と副走査方向とに画素をマトリクス状に並べた2次元画像の画像データを記憶する。ここで第1記憶部10は、入力されるRGB画像から縮小処理を行って輝度情報のみを1画素あたり8Bitで、主走査方向を横に、副走査方向を縦にとって、画素を主走査方向に走査した順に画像データを第1記憶装置に格納(記憶)する。
第1記憶部10が記憶する画像(画像データ)は、拡大縮小や色変換処理の他に所定の方向のエッジの強さを示すエッジ画像データや、微分、積分等の画像処理を行った1つ又は複数の画像(微分画像データ、積分画像データ)であってもよい。
第2記憶部11は、SRAM213の一部である第2記憶装置(第2の記憶装置)に第1記憶装置に記憶されている画像の所定の領域(所定領域)のうち、被写体判別部14における判別に必要な部分領域の画素情報を記憶する。
転送部12は、図示しない制御部からの指示により第1記憶装置に記憶されている画像データの一部を第2記憶装置へ転送する。
被写体判別部13、14は、第2記憶装置に記憶されている画素情報に基づき、所定領域が被写体(被写体領域)か否かを判別する。後段である被写体判別部14(第1の被写体判別)は、前段である被写体判別部13(第2の被写体判別)の判別結果に基づいて起動する。
なお、図2では説明の簡略化ため2つの被写体判別部を直列2段に構成したが、更に段数があってもよい。また、被写体判別部の構成は、前段の判別部の判別結果に基づいて後段の所定の被写体判別部に分岐するようなツリー状の構成であってもよい。
次に本実施形態の処理の流れについて図3のフローチャートを用いて説明する。図3は、本実施形態の処理の流れを説明するフローチャートである。
ステップS301にて、第1記憶部10は、画像入力装置206から所望の画像データをDRAM203に読み込む。
ここで読み込まれた画像データは、例えば8ビットの画素により構成される2次元配列のデータであり、R、G、B、3つの面により構成される。このとき、画像データがJPEG等の方式により圧縮されている場合、第1記憶部10は、画像データを所定の解凍方式にしたがって解凍し、RGB各画素により構成される画像データとする。更に、本実施形態では第1記憶部10は、RGBデータを輝度データに変換し、輝度画像データを以後の処理に適用するものとし、変換した輝度データをDRAM203に格納する。なお、画像データとしてYCrCbのデータを入力する場合、第1記憶部10は、Y成分をそのまま輝度データとしてもよい。
ステップS302において、第1記憶部10は、画像データを所定の倍率に縮小した輝度画像データを生成する。これは、本実施形態では様々な大きさの顔の検出に対応するため複数のサイズの画像データに対して順次検出を行うようにしたためである。例えば、第1記憶部10は、倍率が1.2倍程度異なる複数の画像への縮小処理を、後段の検出処理のために順次実行する。
ステップS303において、第1記憶部10は、多重解像度用画像を作成する。この処理はパターン領域の画像を1/2、1/4に縮小したパターン画像を高速に得るための処理である。
この処理の様子を図4に示す。図4は、多重解像度用画像の作成を説明するための図である。図4の様に第1記憶部10は、縮小画像400全体に対してフィルタ401によりコンボリュージョンをかけて1/2解像度用画像402を生成する。
更に、第1記憶部10は、1/2解像度用画像402にフィルタ403でコンボリュージョンをかけて1/4解像度用画像404を生成する。
ステップS304において、第1記憶部10は、縮小された輝度画像データ上に所定の大きさの部分領域を設定する。この様子を図5に示す。図5は、部分領域の設定を説明するための図である。
図5のAの列はステップS302で縮小されたそれぞれの縮小画像を示しており、第1記憶部10は、それぞれの縮小画像に対して所定の大きさの矩形領域を切り出すものとする。図5のBは、第1記憶部10がそれぞれの縮小画像から縦横順次に走査を繰り返していく途中の設定の様子を示すものである。図から分かるように、縮小率の大きな画像から照合パターン領域(照合パターン)を設定して顔の判別を行う場合には、画像に対して大きな顔の検出を行うことになる。
ステップS305において、例えば被写体判別部13及び被写体判別部14は、照合パターンが顔パターンか非顔パターンかを判別する。
以上、S304からS306までの処理が、ステップS302の出力である縮小輝度画像に対して図5に示すように所定のステップにおいて縦横順次に走査が繰り返される。また、倍率が異なる縮小処理が順次適用され、S302からS306までの処理が繰り返される。
ステップS307において、例えば制御部は、以上の繰り返し走査が完了したか判断し、完了した場合、ステップS308において、顔と判別されたパターンを表示装置209へ顔領域として出力する。
図6は、表示装置209に表示される画面の一例を示す図である。図6は、入力画像601に顔の検出結果を重畳して出力した画面表示の一例となっている。602、603は、被写体判別部によって抽出された顔パターンで、その位置と大きさとが示された枠である。また、ボタン604は、被写体判別処理の終了ボタンである。
次に、ステップS305における顔判別の処理についてより詳細を説明する。
顔判別は図2に示したように複数の被写体判別部を直列に接続することで実現する。前段の被写体判別部13に入力されたパターンデータ(照合パターン)が被写体(顔パターン)であるか否かを判定し、被写体であった場合にのみ後段の被写体判別部14で同じパターンデータが被写体であるか否かの判定を前段より高い精度で行う。各被写体判別部及びその内部の弱判別部は同様な構成であり、各部の数や判別パラメータが異なるのみである。
各被写体判別部の詳細について説明する。図7は、各被写体判別部の詳細を説明するための図である。各被写体判別部は複数の弱判別部701〜703で構成され、各々が出力する被写体尤度を加算部704で統合し、閾値処理部705で閾値処理(閾値判定)を行い、判定に基づき、被写体であるか否かを出力する。
次に、各弱判別部の構成について説明する。図8は、各弱判別部の詳細を説明するための図である。弱判別部は、局所領域抽出部801と、特徴量算出部802と、被写体信頼度変換部803と、から構成される。各々の部へは判別情報格納部804から判別パラメータが供給される。
次に、判別情報格納部804に格納されている判別パラメータについて図9を用いて説明する。図9は、判別パラメータの一例を示す図である。
判別パラメータは、被写体判別部数901と、被写体判別部数901分の被写体判別パラメータ902と、が結合されたものである。各々の被写体判別パラメータ902は、1つの被写体判別部に関するパラメータが格納されている。各々の被写体判別パラメータ902は、弱判別部数903と、弱判別部数903分の弱判別パラメータ904と、閾値905と、が結合されたものである。各々の弱判別パラメータ904は、1つの弱判別部に関するパラメータが格納されている。各弱判別パラメータ904は、それぞれの局所領域の画素数906と、局所領域の画素番号を列挙した画素番号リスト907と、画素数906に等しい行数*1列の行列である特徴抽出フィルタ908と、を含む。また、各弱判別パラメータ904は、特徴量から被写体の信頼度への変換テーブルである被写体信頼度変換ルックアップテーブル(被写体信頼度変換LUT)909を含む。
画素番号は、図10に示すように、本実施形態では顔パターンは目、口を含む20画素*20画素のパターンとなっている。また、これを更に1/2に縮小し、10画素*10画素にしたパターンと、1/4に縮小して5画素*5画素にしたパターンとに、それぞれの画素に対して1から525までの画素番号が付与されている。このように画像処理装置が画像を多重解像にすることによって以下の2つのメリットを併せ持つことができる。即ち、低解像度側では顔を構成する器官同士の位置関係を効率よく照合でき、高解像度側では顔を構成する器官の部分的特徴を精度よく照合できる。
次に図11を用いて顔判別処理の流れを詳細に説明する。図11は、顔判別処理の一例を示すフローチャートである。
ステップS1101において、被写体判別部は、被写体判別部ループカウンタNを初期化する。
ステップS1102において、弱判定部は、弱判別部ループカウンタtを初期化する。
ステップS1103において、弱判定部は、転送部12に対して、画素番号リスト907に基づいてパターン中の参照画素をDRAM203からSRAM213に転送するよう要求する。転送部12は、この要求に基づき、パターン中の参照画素をDRAM203からSRAM213に転送する。
ここでパターンを縮小した画素の読み込み方法について図4を用いて説明する。なお、図4では説明のためパターンのサイズを8*8画素としている。1/2解像度用画像402及び1/4解像度用画像404は縮小画像400と同じ縦横サイズである。例えば縮小画像400から8*8画素のパターン領域405の画素を参照するとき、この1/2の4*4画素のパターン画像406は、1/2解像度用画像402の黒点で示すように同じ領域から2画素置きに画素を参照したものに等しい。同様にパターンの1/4の2*2画素のパターン画像407は、1/4解像度用画像404の同じ領域から4画素置きに画素を参照したものに等しい。
ステップS1104において、特徴量算出部802は、局所特徴量を算出する。特徴量算出部802は、局所特徴量utを以下の(式1)によって求める。
t,N =φtN Tt,N ・・・ (式1)
ここで添え字t,Nは、N番目の被写体判別部のt番目の弱判別部を示す。
t,Nは局所特徴量を示す数値であり、
φt,Nは特徴抽出フィルタ908であり、
t,Nは局所領域抽出部801によって得られる画素番号リスト907で示されるパターン又は縮小パターン上の画素の輝度を要素とする画素数に等しい行数で1列の行列である。
次にステップS1105において、被写体信頼度変換部803は、以下の(式2)の様に局所特徴量Ut,Nから被写体信頼度に変換する。
t,N = ft,N(Ut,N) ・・・ (式2)
但し、HtNは被写体信頼度の出力である。
ここで、ft,Nは、被写体信頼度変換ルックアップテーブル909を使って、局所特徴量Ut,Nからテーブル変換によって被写体信頼度に変換し、弱判別部の出力とする。
被写体信頼度変換部803は、局所特徴量Ut,Nが変換テーブルの上限又は下限を超えている場合はそれぞれ、上限値、下限値にしたうえで、テーブルを参照し被写体信頼度を得る。
次にステップS1106において、被写体判定部は、最後の弱判別部になるまでステップS1111で弱判別部番号tをインクリメントしながらステップS1104〜ステップS1106の処理を繰り返す。
被写体判定部は、最後の弱判別部まで被写体信頼度を求めた場合、ステップS1107に進み、加算部704は、以下の(式3)のように被写体信頼度の総和を求める。
H = ΣttN ・・・ (式3)
次にステップS1108において、閾値処理部705は、前ステップで求めた総和の閾値比較(以下の(式4))によって被写体か否かの判定を行う。
H≧ThN ・・・ (式4)
閾値処理部705は、顔でないと判定した場合は、顔でないとして終了する。
閾値処理部705は、顔であると判定した場合は、ステップS1109に進む。ステップS1109において、例えば、被写体判別部は、最後の被写体判別部の判定を終わるまでステップS1112で被写体判別部番号NをインクリメントしながらステップS1102〜ステップS1109の処理を繰り返す。
例えば、被写体判別部は、最後の被写体判別部まで全て顔と判定した場合にのみ最終的に顔であると判定し、ステップS1110に進み、パターンの位置を記憶して図11に示す被写体判定処理を終了する。
なお、本実施形態では、局所特徴量として、照合パターンのうち、所定解像度、所定サイズ、所定形状の局所領域における線形識別特徴を用いるものとする。
局所領域としては、例えば、図12に示すように照合パターンFが20×20画素からなる輝度パターンであるとすると、その一部である5×5画素の正方形の局所領域P等である。この場合、照合パターン内の全ての位置において同様の局所領域Pを設定すると、256の局所領域が考えられる。
なお、画像処理装置は、図13のP1、P2、P3に示すように横長の矩形、縦長の矩形、楕円等様々な形状及びサイズの局所領域から得られたものを組合せて用いてもよい。また、画像処理装置は、元の照合パターンを縮小して様々な低解像度の照合パターンを作成し、各解像度の照合パターン中の局所領域を組み合せて用いてもよい。また、画像処理装置は、複数の乖離した領域・画素を用いてもよい。
メモリ転送コストを削減するためには、呼び出し回数の多い前段側の被写体判別部の局所領域が参照する画素を工夫すると効果が大きい。
例えば、前段側の被写体判別部(図2の被写体判別部13)が参照する画素を、横長の部分領域のみで構成する。つまり、例えば、転送部12は、前段側の被写体判別部が参照する画素として、主走査方向に長い部分領域の画素の情報(画素情報)をDRAM203からSRAM213に転送する。そして、前段側の被写体判別部は、この画素情報を参照し、上述したような判別に係る処理を実行する。
これにより前段側の被写体判別部は、主走査方向に連続した画素を参照できるためバスで一度に転送可能なビット幅を最大限活用することができる。
図14は、最初の被写体判別部の全ての弱判別部が参照する画素を示した図である。1401は、10*10の解像度の黒く示した画素で、顔で言えば両目にあたる6画素を参照している。一方、1402は、同じ判別性能の被写体判別部の全ての弱判別部が参照する画素が、横長の局所領域のみで構成されている。画素数では1402の方が多くなっているため演算コストが増加するが、横方向に長いので転送コストが少ないため全体としては1402のほうが高速に判別処理を実行することができる。
また、参照する画素を、主走査方向へ投影した時の画素数が、所定領域の副走査方向の画素数の半分より少なくなるように構成してもよい。例えば参照画素の縦方向の座標が偶数番目のみの画素のみを使用するようにする。
図15は、前段側の被写体判別部が参照する局所領域の一例を示す図である。1501は、ある被写体判別部の全ての弱判別部が参照するパターン中の画素を黒で示したものである。1502は、1501を主走査方向へ投影したものである。即ち対応する行で黒い画素があれば黒、そうでない場合は白である。この投影した画素のうち黒い画素が少ないほど転送コストは少ない。
これにより、DRAM203からのデータ入出力ではバースト転送によって連続したメモリを一括して読み出すことが可能であるので、照合パターンを横1行ごとにバースト転送する場合にバースト転送の回数を削減することができる。
なお、SRAM213に記憶した照合パターンの画素データは、S1106及びS1106、S306で構成されるループの間、メモリサイズに応じて一度転送したデータを記憶し続けることで、転送コストを削減することができる。照合パターン領域を横に1画素ずらして設定して判定(判別)するとき、パターン領域の大部分はオーバーラップするので、再利用することができる。よって、画像の主走査方向に長いバンドバッファを用いてもよい。
また、参照する照合パターンの解像度を限定してもよい。例えば、20*20を10*10に縮小したパターンのみで判定を行うことは有効である。1/2解像度用画像で参照する画素は隣り合っていないが、このとき縦、つまり副走査方向で1つ飛びにすることで転送コストを抑えることができる。また、横、つまり主走査方向の画素は1画素飛びでなく連続して転送することで、パターン領域を横に1画素ずらして設定したときに新たに転送することなく利用することができる。
特徴量を非特許文献1のような矩形領域の組み合わせによって獲得する場合にも本実施形態を適用可能である。非特許文献1では矩形領域の画素の合計を、積分画像を用いることで高速に求めることができる。即ち矩形の頂点に相当する4画素について積分画像を参照し、4点の積分値の和差演算によって得ることができる。この場合は、メモリ転送が必要なのは1つの矩形につき4点だけであるので、この点が前記参照画素に相当する。
なお、ステップS304での照合パターン領域の設定は画像を全て走査する必要はない。
例えば、顔であれば肌色を多く含む領域のみを探索したり、隣接画素間で輝度変化の少ない壁のような画像領域を除くことで高速化したりすることができる。また、動画に適用した場合には時系列に並んだ画像のうち時間的に近い近隣画像は画像内容に相関が高いことを利用して、近隣画像における被写体の位置情報や、近隣画像から動きがあった領域等に限定することで更なる高速化ができる。
このような高速化手法と組み合わせた場合には、パターン領域の走査が非連続になるため、本実施形態による効果は更に増す。
<第2の実施形態>
図16は、画像処理装置のハードウェア構成の一例を示す図(その2)である。第1の実施形態と共通する部分には同じ番号を付与している。
ハードウェア構成としては本実施形態に係るプログラムを記録したDVD又はCDのような光ディスク212を追加し、ドライブインターフェース204にCD/DVDドライブ等の外部記憶読書装置214が接続されているところが第1の実施形態と異なる。
本実施形態に係るプログラムを記録した光ディスク212を外部記憶読書装置214に挿入するとCPU201は記録媒体からプログラムを読み取って、DRAM203に展開することで、第1の実施形態と同様の処理を実現することができる。
<第3の実施形態>
上述した実施形態では顔抽出を例に説明を行ったが、上述した構成及び処理は、顔以外の任意の物体に対しても適用することができる。例えば、人体全身、人体上半身、生物、自動車等がある。工業、流通分野等では生産物、部品、流通物品等の同定や検査等に適用することができる。
<その他の実施形態>
また、本発明の目的は、以下のようにすることによって達成される。即ち、上述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体(又は記録媒体)を、システム或いは装置に供給する。そして、そのシステム或いは装置の中央演算処理手段(CPUやMPU)が記憶媒体に格納されたプログラムコードを読み出し実行する。この場合、記憶媒体から読み出されたプログラムコード自体が上述した実施形態の機能を実現することになり、そのプログラムコードを記録した記憶媒体は本発明を構成することになる。
また、システム或いは装置の前記中央演算処理手段が読み出したプログラムコードを実行することにより、そのプログラムコードの指示に基づき、システム或いは装置上で稼働しているオペレーティングシステム(OS)等が実際の処理の一部又は全部を行う。その処理によって上述した実施形態の機能が実現される場合も含まれる。
更に、記憶媒体から読み出されたプログラムコードが、前記システム或いは装置に挿入された機能拡張カードや、接続された機能拡張ユニットに備わるメモリに書込まれたとする。その後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPU等が実際の処理の一部又は全部を行い、その処理によって上述した実施形態の機能が実現される場合も含まれる。
本発明を前記記憶媒体に適用する場合、その記憶媒体(コンピュータ読み取り可能な記憶媒体)には、先に説明したフローチャートに対応するプログラムコードが格納されることになる。
以上、上述した各実施形態によれば、パターン画像の読み出し及び転送スピードに着目して高速な被写体検出(被写体判定)を実現することができる。
以上、本発明の好ましい実施形態について詳述したが、本発明は係る特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
例えば、SRAMの一部を第1の記憶装置として利用し、CPU201のレジスタを第2の記憶装置として利用してもよい。第1の記憶装置に比べて、第2の記憶装置のアクセスが高速であれば、どのようなメモリを使用してもよい。
画像処理装置のハードウェア構成の一例を示す図(その1)である。 画像処理装置の機能構成の一例を示した図である。 本実施形態の処理の流れを説明するフローチャートである。 多重解像度用画像の作成を説明するための図である。 部分領域の設定を説明するための図である。 表示装置209に表示される画面の一例を示す図である。 各被写体判別部の詳細を説明するための図である。 各弱判別部の詳細を説明するための図である。 判別パラメータの一例を示す図である。 多重解像度化したパターンと画素番号との関係を示す図である。 顔判別処理の一例を示すフローチャートである。 顔の局所領域の一例を示す図である。 顔の別の局所領域の一例を示す図である。 最初の被写体判別部の全ての弱判別部が参照する画素を示した図である。 前段側の被写体判別部が参照する局所領域の一例を示す図である。 画像処理装置のハードウェア構成の一例を示す図(その2)である。
符号の説明
201 CPU
202 ROM
203 DRAM
213 SRAM

Claims (8)

  1. 画像データを主走査方向に走査した順に第1の記憶装置に格納して記憶する第1の記憶手段と、
    前記第1の記憶装置から第2の記憶装置へ前記画像データにおける照合パターン領域のうち部分領域の画素情報を転送する転送手段と、
    前記第2の記憶装置に記憶されている前記画素情報を参照し、前記画素情報に基づいて、前記照合パターン領域が被写体領域か否かを判別する被写体判別手段と、
    を有し、
    前記被写体判別手段は、それぞれ異なる部分領域を参照する、少なくとも第1の被写体判別手段と、第2の被写体判別手段と、を含み、前記第2の被写体判別手段は、前記第1の被写体判別手段により被写体領域と判別された照合パターン領域が被写体領域か否かを判別するものであり、
    前記転送手段は、前記第1の被写体判別手段が参照する部分領域として、主走査方向が副走査方向より長い部分領域の画素情報を前記第1の記憶装置から前記第2の記憶装置に転送し、
    前記第1の被写体判別手段は、前記主走査方向が副走査方向より長い部分領域の画素情報を参照して前記照合パターン領域が被写体領域であるか否かを判別することを特徴とする画像処理装置。
  2. 前記画素情報は、前記画像データの輝度情報であることを特徴とする請求項1に記載の画像処理装置。
  3. 前記画素情報は、所定のフィルタでコンボリュージョンを行った画像データ、微分画像データ、積分画像データの1つ又は複数を含むことを特徴とする請求項1に記載の画像処理装置。
  4. 画像処理装置における画像処理方法であって、
    画像データを主走査方向に走査した順に第1の記憶装置に格納して記憶する第1の記憶ステップと、
    前記第1の記憶装置から第2の記憶装置へ前記画像データにおける照合パターン領域のうち部分領域の画素情報を転送する転送ステップと、
    前記第2の記憶装置に記憶されている前記画素情報を参照し、前記画素情報に基づいて、前記照合パターン領域が被写体領域か否かを判別する被写体判別ステップと、
    を含み、
    前記被写体判別ステップは、それぞれ異なる部分領域を参照する、少なくとも第1の被写体判別ステップと、第2の被写体判別ステップと、を含み、前記第2の被写体判別ステップでは、前記第1の被写体判別ステップにより被写体領域と判別された照合パターン領域が被写体領域か否かを判別し、
    前記転送ステップでは、前記第1の被写体判別ステップにおいて参照される部分領域として、主走査方向が副走査方向より長い部分領域の画素情報を前記第1の記憶装置から前記第2の記憶装置に転送し、
    前記第1の被写体判別ステップでは、前記主走査方向が副走査方向より長い部分領域の画素情報を参照して前記照合パターン領域が被写体領域であるか否かを判別することを特徴とする画像処理方法
  5. 前記画素情報は、前記画像データの輝度情報であることを特徴とする請求項4に記載の画像処理方法。
  6. 前記画素情報は、所定のフィルタでコンボリュージョンを行った画像データ、微分画像データ、積分画像データの1つ又は複数を含むことを特徴とする請求項に記載の画像処理方法。
  7. コンピュータを、
    画像データを主走査方向に走査した順に第1の記憶装置に格納して記憶する第1の記憶手段と、
    前記第1の記憶装置から第2の記憶装置へ前記画像データにおける照合パターン領域のうち部分領域の画素情報を転送する転送手段と、
    前記第2の記憶装置に記憶されている前記画素情報を参照し、前記画素情報に基づいて、前記照合パターン領域が被写体領域か否かを判別する被写体判別手段と、
    して機能させ、
    前記被写体判別手段は、それぞれ異なる部分領域を参照する、少なくとも第1の被写体判別手段と、第2の被写体判別手段と、を含み、前記第2の被写体判別手段は、前記第1の被写体判別手段により被写体領域と判別された照合パターン領域が被写体領域か否かを判別するものであり、
    前記転送手段は、前記第1の被写体判別手段が参照する部分領域として、主走査方向が副走査方向より長い部分領域の画素情報を前記第1の記憶装置から前記第2の記憶装置に転送し、
    前記第1の被写体判別手段は、前記主走査方向が副走査方向より長い部分領域の画素情報を参照して前記照合パターン領域が被写体領域であるか否かを判別することを特徴とするプログラム
  8. 請求項7に記載のプログラムを記憶したコンピュータにより読み取り可能な記憶媒体
JP2008274662A 2008-10-24 2008-10-24 画像処理装置及び画像処理方法 Expired - Fee Related JP5294798B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008274662A JP5294798B2 (ja) 2008-10-24 2008-10-24 画像処理装置及び画像処理方法
US12/603,458 US8482812B2 (en) 2008-10-24 2009-10-21 Image processing apparatus for detecting object from image and method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008274662A JP5294798B2 (ja) 2008-10-24 2008-10-24 画像処理装置及び画像処理方法

Publications (2)

Publication Number Publication Date
JP2010102584A JP2010102584A (ja) 2010-05-06
JP5294798B2 true JP5294798B2 (ja) 2013-09-18

Family

ID=42117202

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008274662A Expired - Fee Related JP5294798B2 (ja) 2008-10-24 2008-10-24 画像処理装置及び画像処理方法

Country Status (2)

Country Link
US (1) US8482812B2 (ja)
JP (1) JP5294798B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5686499B2 (ja) * 2009-01-22 2015-03-18 株式会社Nttドコモ 画像予測符号化装置、方法及びプログラム、画像予測復号装置、方法及びプログラム、並びに、符号化・復号システム及び方法
TWI384427B (zh) * 2009-04-29 2013-02-01 Utechzone Co Ltd Background establishment method and device
JP5448758B2 (ja) * 2009-11-30 2014-03-19 キヤノン株式会社 情報処理装置、情報処理方法、情報処理システム、プログラム及びデータ構造
CN102834843B (zh) * 2010-04-02 2016-11-16 诺基亚技术有限公司 用于面部检测的方法和装置
JP2012053606A (ja) * 2010-08-31 2012-03-15 Sony Corp 情報処理装置および方法、並びにプログラム
JP6161266B2 (ja) 2012-11-27 2017-07-12 キヤノン株式会社 情報処理装置及びその制御方法及び電子デバイス及びプログラム及び記憶媒体
CN109490904B (zh) * 2018-11-15 2021-09-21 上海炬佑智能科技有限公司 飞行时间传感器及其检测方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3874985B2 (ja) * 2000-02-18 2007-01-31 富士通株式会社 画像演算装置
JP2003271329A (ja) * 2002-03-14 2003-09-26 Fuji Xerox Co Ltd 画像転送システム
JP4161790B2 (ja) * 2003-05-08 2008-10-08 松下電器産業株式会社 模様識別装置
US7664339B2 (en) * 2004-05-03 2010-02-16 Jacek Turski Image processing method for object recognition and dynamic scene understanding
US7403641B2 (en) * 2004-05-28 2008-07-22 Matsushita Electric Works, Ltd. Object recognition system
JP4329767B2 (ja) * 2006-02-07 2009-09-09 コニカミノルタビジネステクノロジーズ株式会社 画像読取装置およびカラー判別方法
JP4166253B2 (ja) * 2006-07-10 2008-10-15 トヨタ自動車株式会社 物体検出装置、物体検出方法、および物体検出用プログラム

Also Published As

Publication number Publication date
JP2010102584A (ja) 2010-05-06
US8482812B2 (en) 2013-07-09
US20100103476A1 (en) 2010-04-29

Similar Documents

Publication Publication Date Title
JP5294798B2 (ja) 画像処理装置及び画像処理方法
US8265350B2 (en) Method and apparatus for detecting and processing specific pattern from image
JP4933186B2 (ja) 画像処理装置、画像処理方法、プログラム及び記憶媒体
US10185857B2 (en) Devices, systems, and methods for reading barcodes
US8254643B2 (en) Image processing method and device for object recognition
US8879839B2 (en) Image processing apparatus, image processing method, and storage medium
JP5683367B2 (ja) 画像処理装置、画像処理装置の制御方法、およびプログラム
JP2005309608A (ja) 文字認識結果出力装置、文字認識装置、その方法及びプログラム
JP2010165052A (ja) 画像処理装置及び画像処理方法
US9053354B2 (en) Fast face detection technique
JP5258506B2 (ja) 情報処理装置
CN111767752B (zh) 一种二维码识别方法及装置
JP5335554B2 (ja) 画像処理装置及び画像処理方法
JP2017049686A (ja) 画像処理装置
Chia et al. A parallel algorithm for generating chain code of objects in binary images
RU2626551C1 (ru) Способ формирования панорамных изображений из видеопотока кадров в режиме реального времени
JP5702960B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP2007087218A (ja) 画像処理装置
JP5693670B2 (ja) 画像処理装置及び画像処理方法
US8768060B2 (en) Image processing apparatus, image processing method and computer-readable medium
JP6077873B2 (ja) 画像処理装置、画像処理方法
JP3814547B2 (ja) 画像処理装置及びその方法
JP4720805B2 (ja) 画像処理装置及びプログラム
JPH0394393A (ja) 文字認識装置
JPH05189553A (ja) 画像処理方式

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111024

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120816

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120828

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121029

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130108

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130408

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20130416

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130514

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130611

R151 Written notification of patent or utility model registration

Ref document number: 5294798

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees