JP2009223540A - 対象画像からの顔領域の検出 - Google Patents

対象画像からの顔領域の検出 Download PDF

Info

Publication number
JP2009223540A
JP2009223540A JP2008066306A JP2008066306A JP2009223540A JP 2009223540 A JP2009223540 A JP 2009223540A JP 2008066306 A JP2008066306 A JP 2008066306A JP 2008066306 A JP2008066306 A JP 2008066306A JP 2009223540 A JP2009223540 A JP 2009223540A
Authority
JP
Japan
Prior art keywords
image
size
face
detection
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2008066306A
Other languages
English (en)
Inventor
Kenji Matsuzaka
健治 松坂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2008066306A priority Critical patent/JP2009223540A/ja
Publication of JP2009223540A publication Critical patent/JP2009223540A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

【課題】対象画像からの顔領域の検出の際に、処理の高速化を図りつつ、検出率を向上させることを可能とする。
【解決手段】画像処理装置は、対象画像から検出すべき顔の画像のサイズを特定する検出サイズ情報を取得する検出サイズ情報取得部と、検出サイズ情報に基づき設定した使用画像領域サイズを有する画像領域を判定対象画像領域として設定する判定対象設定部と、判定対象画像領域が顔の画像に対応する画像領域であることの確からしさを表す評価値を算出する評価値算出部と、評価値と顔の画像に対応する画像領域であると判定された判定対象画像領域の位置およびサイズとに基づき顔領域を設定する顔領域設定部と、を備える。
【選択図】図5

Description

本発明は、対象画像からの顔の画像に対応する画像領域である顔領域の検出に関する。
対象画像データの表す対象画像から部分画像を順次切り出し、切り出した部分画像が顔に対応する画像であるか否かを判定することにより、対象画像から顔の画像に対応する画像領域である顔領域を検出する技術が知られている(例えば特許文献1および2)。
特開2007−94633 特開2007−72606
対象画像からの顔領域の検出の際には、検出漏れを抑制することによる検出率の向上と処理の高速化とが求められる。
本発明は、上記の課題を解決するためになされたものであり、対象画像からの顔領域の検出の際に、処理の高速化を図りつつ、検出率を向上させることを可能とする技術を提供することを目的とする。
上記課題の少なくとも一部を解決するために、本発明は、以下の形態または適用例として実現することが可能である。
[適用例1]画像処理装置であって、
対象画像データの表す対象画像から検出すべき顔の画像のサイズを特定する検出サイズ情報を取得する検出サイズ情報取得部と、
前記検出サイズ情報に基づき使用画像領域サイズを設定し、前記対象画像における前記使用画像領域サイズを有する少なくとも1つの画像領域を判定対象画像領域として設定する判定対象設定部と、
前記判定対象画像領域に対応した画像データに基づき、前記判定対象画像領域が顔の画像に対応する画像領域であることの確からしさを表す評価値を算出する評価値算出部と、
前記評価値と前記判定対象画像領域の位置およびサイズとに基づき、前記対象画像における顔の画像に対応する画像領域としての顔領域を設定する顔領域設定部と、を備える、画像処理装置。
この画像処理装置では、検出サイズ情報が取得され、検出サイズ情報に基づき設定された使用画像領域サイズを有する画像領域が判定対象画像領域として設定される。判定対象画像領域に対応した画像データに基づき判定対象画像領域が顔の画像に対応する画像領域であることの確からしさを表す評価値が算出され、評価値と判定対象画像領域の位置およびサイズとに基づき顔領域が設定される。このように、この画像処理装置では、検出サイズ情報に基づき使用画像領域サイズが設定されるため、検出サイズ情報により特定される検出サイズから外れたサイズの顔の画像の検出のための処理が省略可能になると共に、検出サイズの顔の画像の検出率を向上させるように使用画像領域サイズを設定することが可能であるため、対象画像からの顔領域の検出の際に、処理の高速化を図りつつ、検出率を向上させることができる。
[適用例2]適用例1に記載の画像処理装置であって、
前記検出サイズ情報は、検出すべき顔の画像のサイズを値の範囲として特定する情報であり、
前記判定対象設定部は、前記検出サイズ情報により特定される前記値の範囲に含まれる少なくとも1つの値を前記使用画像領域サイズとして設定する、画像処理装置。
この画像処理装置では、検出サイズ情報により検出すべき顔の画像のサイズが値の範囲として特定され、値の範囲に含まれる少なくとも1つの値が使用画像領域サイズとして設定されるため、当該値の範囲の顔の画像の検出率を向上させることができる。
[適用例3]適用例2に記載の画像処理装置であって、
前記判定対象設定部は、前記値の範囲をK(Kは2以上の整数)等分する値を前記使用画像領域サイズとして設定する、画像処理装置。
この画像処理装置では、使用画像領域サイズを容易に設定することができると共に、当該値の範囲における顔の画像の検出率を満遍なく向上させることができる。
[適用例4]適用例3に記載の画像処理装置であって、
前記Kは前記値の範囲が広いほど大きい、画像処理装置。
この画像処理装置では、検出すべき顔の画像のサイズとして比較的広い範囲が設定された場合にも、顔の画像の検出率の低下を抑制することができる。
[適用例5]適用例2ないし適用例4のいずれかに記載の画像処理装置であって、
前記判定対象設定部は、予め設定された標準画像領域サイズを有しており、前記検出サイズ情報が取得されなかった場合には前記標準画像領域サイズを前記使用画像領域サイズとして設定し、前記検出サイズ情報が取得された場合には前記値の範囲内に含まれる前記標準画像領域サイズの値の数よりも多数の値を前記使用画像領域サイズとして設定する、画像処理装置。
この画像処理装置では、検出サイズ情報が取得された場合には、取得されなかった場合と比較して、顔の画像の検出率を向上させることができる。
[適用例6]適用例1に記載の画像処理装置であって、
前記検出サイズ情報は、検出すべき顔の画像のサイズを1つの値として特定する情報であり、
前記判定対象設定部は、前記検出サイズ情報により特定される前記1つの値を前記使用画像領域サイズとして設定する、画像処理装置。
この画像処理装置では、検出サイズ情報により特定されたサイズの顔の画像の検出の際に、処理の高速化を図りつつ、検出率を向上させることができる。
[適用例7]適用例1ないし適用例6のいずれかに記載の画像処理装置であって、さらに、
前記対象画像における顔の画像の検出を行うべき一部の領域である検出範囲を特定する検出範囲情報を取得する検出範囲情報取得部を備え、
前記判定対象設定部は、前記検出範囲情報により特定される前記検出範囲において、前記判定対象画像領域を設定する、画像処理装置。
この画像処理装置では、検出範囲情報により特定される検出範囲において判定対象画像領域が設定されるため、対象画像からの顔領域の検出の際に、処理の高速化を図りつつ、検出率を向上させることができる。
[適用例8]適用例7に記載の画像処理装置であって、
前記判定対象設定部は、前記判定対象画像領域として設定されるべき第1の画像領域と、前記第1の画像領域と同一サイズの前記判定対象画像領域であって最も前記第1の画像領域に近い前記判定対象画像領域として設定されるべき第2の画像領域と、の間の距離の標準値を有しており、前記検出範囲情報が取得されなかった場合には前記距離として前記標準値を用いて前記判定対象画像領域を設定し、前記検出範囲情報が取得された場合には前記距離として前記標準値よりも小さい値を用いて前記判定対象画像領域を設定する、画像処理装置。
この画像処理装置では、検出範囲情報が取得された場合には、取得されなかった場合と比較して、顔の画像の検出率を向上させることができる。
[適用例9]適用例7に記載の画像処理装置であって、
前記判定対象設定部は、前記検出範囲情報により特定される前記検出範囲のサイズに応じて、前記判定対象画像領域として設定されるべき第1の画像領域と、前記第1の画像領域と同一サイズの前記判定対象画像領域であって最も前記第1の画像領域に近い前記判定対象画像領域として設定されるべき第2の画像領域と、の間の距離を設定する、画像処理装置。
この画像処理装置では、検出範囲のサイズに応じて距離を設定することにより、顔の画像の検出率を向上させることができる。
[適用例10]適用例1ないし適用例9のいずれかに記載の画像処理装置であって、
前記顔領域設定部は、前記評価値に基づき前記判定対象画像領域が顔の画像に対応する画像領域であるか否かを判定し、顔の画像に対応する画像領域であると判定された前記判定対象画像領域の位置およびサイズに基づき顔領域を設定する、画像処理装置。
この画像処理装置では、顔の画像に対応する画像領域であると判定された判定対象画像領域の位置およびサイズに基づき顔領域を設定することができる。
なお、本発明は、種々の態様で実現することが可能であり、例えば、画像処理方法および装置、顔領域検出方法および装置、顔領域設定方法および装置、これらの方法または装置の機能を実現するためのコンピュータプログラム、そのコンピュータプログラムを記録した記録媒体、そのコンピュータプログラムを含み搬送波内に具現化されたデータ信号、等の形態で実現することができる。
次に、本発明の実施の形態を実施例に基づいて以下の順序で説明する。
A.実施例:
A−1.画像処理装置の構成:
A−2.顔領域検出処理:
B.変形例:
A.実施例:
A−1.画像処理装置の構成:
図1は、本発明の実施例における画像処理装置としてのプリンタ100の構成を概略的に示す説明図である。本実施例のプリンタ100は、メモリカードMC等から取得した画像データに基づき画像を印刷する、いわゆるダイレクトプリントに対応したインクジェット式カラープリンタである。プリンタ100は、プリンタ100の各部を制御するCPU110と、ROMやRAMによって構成された内部メモリ120と、ボタンやタッチパネルにより構成された操作部140と、液晶ディスプレイにより構成された表示部150と、プリンタエンジン160と、カードインターフェース(カードI/F)170と、を備えている。プリンタ100は、さらに、他の機器(例えばデジタルスチルカメラやパーソナルコンピュータ)とのデータ通信を行うためのインターフェースを備えているとしてもよい。プリンタ100の各構成要素は、バスを介して互いに接続されている。
プリンタエンジン160は、印刷データに基づき印刷を行う印刷機構である。カードインターフェース170は、カードスロット172に挿入されたメモリカードMCとの間でデータのやり取りを行うためのインターフェースである。なお、本実施例では、メモリカードMCに画像データを含む画像ファイルが格納されている。
内部メモリ120には、画像処理部200と、表示処理部310と、印刷処理部320と、が格納されている。画像処理部200は、所定のオペレーティングシステムの下で、所定の画像処理(例えば対象画像中の顔の肌に対応した画像の部分の色を好ましい肌色に調整するための肌色補正)を実行するためのコンピュータプログラムである。表示処理部310は、表示部150を制御して、表示部150上に処理メニューやメッセージ、画像等を表示させるディスプレイドライバである。印刷処理部320は、画像データから印刷データを生成し、プリンタエンジン160を制御して、印刷データに基づく画像の印刷を実行するためのコンピュータプログラムである。CPU110は、内部メモリ120から、これらのプログラムを読み出して実行することにより、これら各部の機能を実現する。
画像処理部200は、プログラムモジュールとして、顔領域検出部210を含んでいる。顔領域検出部210は、対象画像データの表す対象画像における顔の画像に対応する画像領域である顔領域の検出を行う。顔領域検出部210は、判定対象設定部212と、評価値算出部214と、判定部216と、顔領域設定部218と、検出サイズ情報取得部222と、検出範囲情報取得部224と、を含んでいる。これら各部の機能については、後述の顔領域検出処理の説明において詳述する。
内部メモリ120には、また、顔領域検出部210による顔領域検出処理に用いられる顔学習データFLDが格納されている。顔学習データFLDの内容についても、後述の顔領域検出処理の説明において詳述する。
A−2.顔領域検出処理:
図2は、本実施例のプリンタ100による顔領域検出処理の流れを示すフローチャートである。顔領域検出処理は、対象画像データの表す対象画像から顔の画像に対応する画像領域である顔領域の検出を行う処理である。
ステップS110(図2)では、顔領域検出部210(図1)が、対象画像を表す対象画像データを取得する。本実施例のプリンタ100では、カードスロット172にメモリカードMCが挿入されると、メモリカードMCに格納された画像ファイルのサムネイル画像が表示部150(図1)に表示される。ユーザは、表示されたサムネイル画像を参照しつつ、操作部140を介して処理の対象となる1つまたは複数の画像を選択する。顔領域検出部210は、選択された1つまたは複数の画像に対応した画像データを対象画像データとして設定し、対象画像データを含む画像ファイルをメモリカードMCから取得して内部メモリ120の所定の領域に格納する。
ステップS120(図2)では、検出サイズ情報取得部222(図1)が、検出サイズ情報を取得する。検出サイズ情報は、対象画像データの表す対象画像から顔領域として検出すべき顔の画像のサイズである検出サイズを特定する情報である。検出サイズ情報取得部222は、表示処理部310(図1)を制御して、表示部150上に検出サイズ情報取得のためのユーザインタフェースを表示させる。図3は、検出サイズ情報取得のためのユーザインタフェースの一例を示す説明図である。図3(a)および(b)に示すように、ユーザは、操作部140(図1)を介して、ユーザインタフェース上のサイズ入力欄SISに、所望のサイズを入力する。本実施例では、図3(a)に示すようにユーザインタフェース上の2つのサイズ入力欄SISにサイズが入力された場合には、入力された2つのサイズを境界値とする範囲が検出サイズに設定される。一方、図3(b)に示すようにユーザインタフェース上の1つのサイズ入力欄SISにのみサイズが入力された場合には、入力されたサイズそのものが検出サイズに設定される。検出サイズ情報取得部222は、設定された検出サイズを特定する情報を検出サイズ情報として取得し、内部メモリ120の所定の領域に格納する。
なお、本実施例では、図3(a)および(b)に示すように、ユーザインタフェース上において、サイズ入力欄SISにサイズが入力されると、入力されたサイズと対象画像のサイズとの大きさの関係がわかるように、入力されたサイズに対応した入力サイズ枠ISFと対象画像のサイズに対応した対象画像サイズ枠TIFとが表示される。これにより、ユーザは、対象画像と検出サイズとの大きさの関係を容易に把握することができ、検出サイズを容易にかつ所望の通りに指定することができる。また、本実施例では、後述するように、顔領域の検出が、正方形形状の画像領域が顔の画像に対応する画像領域であるか否かを判定することにより実行されるため、入力サイズ枠ISFはサイズ入力欄SISに入力された値を1辺の長さとする正方形形状となっている。また、図3(a)および(b)の例で示した検出サイズ(例えば60や80)は、対象画像サイズ枠TIFの短辺の長さを240画素とした場合における画素数で表すサイズである。これは、本実施例では、後述するように、横320画素×縦240画素のサイズの画像(顔検出用画像)を用いて顔検出が実行されるためである。また、図3に示したユーザインタフェースにおいてユーザによりサイズが入力されなかった場合には、検出サイズが設定されず、検出サイズ情報は取得されない。
ステップS130(図2)では、検出範囲情報取得部224(図1)が、検出範囲情報を取得する。検出範囲情報は、対象画像データの表す対象画像における顔の画像の検出を行うべき一部の領域である検出範囲を特定する情報である。検出範囲情報取得部224は、表示処理部310(図1)を制御して、表示部150上に検出範囲情報取得のためのユーザインタフェースを表示させる。図4は、検出範囲情報取得のためのユーザインタフェースの一例を示す説明図である。図4に示すように、ユーザは、操作部140(図1)を介して、ユーザインタフェース上に表示された対象画像のサイズに対応した対象画像サイズ枠TIF内の所望の画像領域(画像範囲)を検出範囲DAとして指定入力する。本実施例では、対象画像サイズ枠TIF内の指定された2点を対角の頂点とする矩形の領域が検出範囲DAとして設定される。検出範囲情報取得部224は、設定された検出範囲DAを特定する情報を検出範囲情報として取得し、内部メモリ120の所定の領域に格納する。なお、図4に示したユーザインタフェースにおいてユーザにより画像範囲が指定入力されなかった場合には、検出範囲情報は取得されない。
ステップS140(図2)では、判定対象設定部212(図1)が、使用ウィンドウサイズとウィンドウ移動範囲とウィンドウ移動ピッチとの設定を行う。本実施例では、後述するように、顔領域の検出実行のステップ(図2のステップS150)において、対象画像に基づき生成された顔検出用画像FDImg上に正方形形状のウィンドウSWがそのサイズおよび位置が変更されつつ配置され、配置されたウィンドウSWにより規定される顔検出用画像FDImg上の画像領域である判定対象画像領域JIAが顔の画像に対応する画像領域であるか否かが判定される(図9参照)。使用ウィンドウサイズは、検出実行のステップにおいて使用されるウィンドウSWのサイズ(すなわち判定対象画像領域JIAのサイズ)である。本実施例における使用ウィンドウサイズは、本発明における使用画像領域サイズに相当する。本実施例に用いられるウィンドウSWは正方形形状であるため、使用ウィンドウサイズとしては、ウィンドウSWの1辺の長さを画素数で表した値が用いられる。
図5は、使用ウィンドウサイズの設定方法を示す説明図である。判定対象設定部212は、図5(a)に示す予め設定された15個のウィンドウSWの標準サイズを有している。すなわち、ウィンドウSWの標準サイズ(1辺の長さ)は、20画素(最小サイズ)、24画素、29画素、35画素、41画素、50画素、60画素、72画素、86画素、103画素、124画素、149画素、178画素、213画素、240画素(最大サイズ)の合計15個のサイズである。ステップS120(図2)で検出サイズ情報が取得されなかった場合には、判定対象設定部212は、ウィンドウSWの標準サイズを使用ウィンドウサイズとして設定する。
一方、ステップS120で検出サイズ情報が取得された場合には、判定対象設定部212は、取得された検出サイズ情報により特定される検出サイズに基づき、使用ウィンドウサイズを設定する。具体的には、検出サイズがサイズの範囲として設定された場合には(図3(a)参照)、当該サイズの範囲をK(Kは2以上の整数)等分するサイズが使用ウィンドウサイズとして設定される。例えば図5(b)に示すように、検出サイズが60画素から80画素までの範囲として設定された場合には、Kの値が5に設定され、当該サイズの範囲を5等分するサイズである60画素、65画素、70画素、75画素、80画素の5つのサイズが使用ウィンドウサイズとして設定される。このとき、設定される使用ウィンドウサイズの数(5個)は、当該サイズの範囲内に含まれる標準サイズの数(60画素および72画素の2個)よりも多い。なお、Kの値は、サイズの範囲の広さに応じて定められ、サイズの範囲が広いほどKの値は大きな値に設定される。
また、検出サイズがサイズの範囲ではなく1つのサイズとして設定された場合には(図3(b)参照)、当該サイズが使用ウィンドウサイズとして設定される。例えば図5(c)に示すように、検出サイズが70画素に設定された場合には、検出サイズである70画素が使用ウィンドウサイズとして設定される。
ウィンドウ移動範囲は、検出実行のステップ(図2のステップS150)において、ウィンドウSWが配置され得る顔検出用画像FDImg上の範囲(すなわち判定対象画像領域JIAが設定され得る範囲)である(図9参照)。図6は、ウィンドウ移動範囲の設定方法を示す説明図である。判定対象設定部212は、ステップS130(図2)で取得された検出範囲情報により特定される検出範囲DAに基づき、ウィンドウ移動範囲を設定する。具体的には、図6(a)に示すように、ウィンドウ移動範囲は、ウィンドウSWが顔検出用画像FDImgの外側にはみ出さない限りにおいて、ウィンドウSWの中心が検出範囲DA内に位置するような範囲として設定される。なお、このようにウィンドウ移動範囲を設定することは、検出範囲DAにおいてウィンドウSWにより規定される判定対象画像領域JIAを設定すると表現できる。また、ステップS130で検出範囲情報が取得されなかった場合には、ウィンドウ移動範囲は、顔検出用画像FDImg全体であると設定される。なお、図6(b)に示すように、ウィンドウ移動範囲は、顔検出用画像FDImg上においてウィンドウSW全体が検出範囲DA内に含まれるような範囲として設定されるものとしてもよい。
ウィンドウ移動ピッチは、検出実行のステップ(図2のステップS150)において、各ウィンドウSWのサイズについて、ウィンドウSWの移動(位置の変更)の際の縦方向または横方向への移動ピッチ(1回あたりの移動量)である。ウィンドウSWは判定対象画像領域JIAを規定するものであるため(図9参照)、ウィンドウ移動ピッチは、判定対象画像領域JIAとして設定されるべき第1の画像領域と、第1の画像領域と同一サイズの判定対象画像領域JIAであって最も第1の画像領域に近い判定対象画像領域JIAとして設定されるべき第2の画像領域と、の間の距離であると表現できる。図7は、ウィンドウ移動ピッチの設定方法を示す説明図である。判定対象設定部212(図1)は、ウィンドウ移動ピッチSPの標準値を有している。具体的には、ウィンドウ移動ピッチSPの標準値は、図7(a)に示すように、縦方向および横方向共に、ウィンドウSWのサイズSswに0.2を乗じた値とされている。ステップS130(図2)で検出範囲情報が取得されなかった場合には、判定対象設定部212は、ウィンドウ移動ピッチSPを標準値に設定する。
一方、ステップS130で検出範囲情報が取得された場合には、図7(b)に示すように、判定対象設定部212は、ウィンドウ移動ピッチSPを、縦方向および横方向共に、ウィンドウSWのサイズSswに0.1を乗じた値に設定する。すなわち、ウィンドウSWのサイズが同じときには、検出範囲情報が取得された場合には、ウィンドウ移動ピッチSPは上記標準値よりも小さい値に設定される。
ステップS150(図2)では、顔領域の検出が実行される。図8は、顔領域の検出実行の流れを示すフローチャートである。また、図9は、顔領域の検出実行の概要を示す説明図である。図9の最上段には対象画像データの表す対象画像TImgの一例を示している。
顔領域の検出実行(図8)におけるステップS310では、顔領域検出部210(図1)が、対象画像データから顔検出用画像FDImgを表す顔検出用画像データを生成する。本実施例では、図9に示すように、顔検出用画像FDImgは横320画素×縦240画素のサイズの画像である。顔領域検出部210は、必要により対象画像データの解像度変換を行うことにより、顔検出用画像FDImgを表す顔検出用画像データを生成する。なお、顔検出用画像FDImgは対象画像TImgとはサイズのみが異なり得る画像であるため、顔検出用画像FDImgは本発明における対象画像であるとも表現できる。
ステップS320(図3)では、判定対象設定部212(図1)が、判定対象画像領域JIAの設定に用いるウィンドウSWのサイズを初期値に設定する。ステップS330では、判定対象設定部212が、ウィンドウSWを顔検出用画像FDImg上の初期位置に配置する。ステップS340では、判定対象設定部212が、顔検出用画像FDImg上に配置されたウィンドウSWにより規定される画像領域を、顔の画像に対応する顔領域であるか否かの判定(以下「顔判定」とも呼ぶ)の対象となる判定対象画像領域JIAに設定する。
ここで、ウィンドウSWのサイズの初期値およびウィンドウSWの顔検出用画像FDImg上における初期位置は、ステップS140で設定された使用ウィンドウサイズおよびウィンドウ移動範囲に基づき設定される。具体的には、ウィンドウSWのサイズの初期値は、使用ウィンドウサイズの中で最大のサイズに設定される。例えば、図5(b)に示すように使用ウィンドウサイズが設定された場合には、ウィンドウSWのサイズの初期値は80画素に設定される。また、ウィンドウSWの顔検出用画像FDImg上における初期位置は、ウィンドウSWがウィンドウ移動範囲内に位置する限りにおいて最も左上側の位置である。すなわち、ウィンドウSWの中心が検出範囲DAの左上の頂点に重なるような位置である(図6(a)参照)。ただし、このように初期位置を設定するとウィンドウSWが顔検出用画像FDImgの外側にはみ出してしまう場合には、初期位置は、ウィンドウSWの上辺または左辺が顔検出用画像FDImgの上辺または左辺に重なるような位置である。図9の中段には、顔検出用画像FDImg上に初期値のサイズのウィンドウSWが初期位置に配置され、ウィンドウSWにより規定される画像領域が判定対象画像領域JIAとして設定された様子を示している。
ステップS350(図8)では、評価値算出部214(図1)が、判定対象画像領域JIAについて、判定対象画像領域JIAに対応する画像データ基づき、顔判定に用いる累計評価値Tvを算出する。なお、本実施例では、顔判定は予め設定された特定顔傾き毎に実行される。すなわち、特定顔傾き毎に、判定対象画像領域JIAが当該特定顔傾き分だけ傾いた顔の画像に対応する画像領域であるか否かの判定が行われる。そのため、累計評価値Tvも特定顔傾き毎に算出される。ここで、特定顔傾きとは、画像面内(インプレーン)における顔の画像の回転角度を意味している。本実施例では、特定顔傾きとして、画像の上下方向に沿って顔の画像が位置している状態(頭が上方向を向き顎が下方向を向いた状態)を基準(特定顔傾き=0度)とし、顔の画像の傾きを時計回りに30度ずつ増加させた計12個の傾き(0度、30度、60度、・・・、330度)が設定されている。
図10は、顔判定に用いる累計評価値Tvの算出方法の概要を示す説明図である。本実施例では、累計評価値Tvの算出にN個のフィルタ(フィルタ1〜フィルタN)が用いられる。各フィルタの外形はウィンドウSWと同じアスペクト比を有しており(すなわち正方形形状であり)、各フィルタにはプラス領域paとマイナス領域maとが設定されている。評価値算出部214は、判定対象画像領域JIAにフィルタX(X=1,2,・・・,N)を順に適用して評価値vX(すなわちv1〜vN)を算出する。具体的には、評価値vXは、フィルタXのプラス領域paに対応する判定対象画像領域JIA上の領域内に位置する画素の輝度値の合計から、マイナス領域maに対応する判定対象画像領域JIA上の領域内に位置する画素の輝度値の合計を差し引いた値である。
算出された評価値vXは、各評価値vXに対応して設定された閾値thX(すなわちth1〜thN)と比較される。本実施例では、評価値vXが閾値thX以上である場合には、フィルタXに関しては判定対象画像領域JIAが顔の画像に対応する画像領域であると判定され、フィルタXの出力値として値「1」が設定される。一方、評価値vXが閾値thXより小さい場合には、フィルタXに関しては判定対象画像領域JIAが顔の画像に対応しない画像領域であると判定され、フィルタXの出力値として値「0」が設定される。各フィルタXには重み係数WeX(すなわちWe1〜WeN)が設定されており、すべてのフィルタについての出力値と重み係数WeXとの積の合計が、累計評価値Tvとして算出される。
なお、顔判定に用いられるフィルタXの態様や閾値thX、重み係数WeX、後述の閾値THは、上記12個の特定顔傾きのそれぞれについて予め設定されており、顔学習データFLD(図1)として内部メモリ120に格納されている。顔学習データFLDは、サンプル画像を用いた学習によって設定される。図11は、学習に用いられるサンプル画像の一例を示す説明図である。学習には、顔の画像に対応した画像であることが予めわかっている複数の顔サンプル画像によって構成された顔サンプル画像群と、顔の画像に対応した画像ではないことが予めわかっている複数の非顔サンプル画像によって構成された非顔サンプル画像群と、が用いられる。
学習による顔学習データFLDの設定は特定顔傾き毎に実行されるため、図11に示すように、顔サンプル画像群は、12個の特定顔傾きのそれぞれに対応したものが準備される。例えば0度の特定顔傾きについての顔学習データFLDの設定は、0度の特定顔傾きに対応した顔サンプル画像群と非顔サンプル画像群とを用いて実行され、30度の特定顔傾きについての顔学習データFLDの設定は、30度の特定顔傾きに対応した顔サンプル画像群と非顔サンプル画像群とを用いて実行される。
各特定顔傾きに対応した顔サンプル画像群は、画像サイズに対する顔の画像の大きさの比が所定の値の範囲内であると共に顔の画像の傾きが特定顔傾きに等しい複数の顔サンプル画像(以下、「基本顔サンプル画像FIo」とも呼ぶ)を含む。また、顔サンプル画像群は、少なくとも1つの基本顔サンプル画像FIoについて、基本顔サンプル画像FIoを例えば1.2倍から0.8倍までの範囲の所定の倍率で拡大および縮小した画像(例えば図11における画像FIaおよびFIb)や、基本顔サンプル画像FIoを時計回りおよび反時計回りに例えば15度の範囲で所定の角度だけ回転させた画像(例えば図11における画像FIcおよびFId)をも含む。
サンプル画像を用いた学習は、例えばニューラルネットワークを用いた方法や、ブースティング(例えばアダブースティング)を用いた方法、サポートベクターマシーンを用いた方法等により実行される。例えば学習がニューラルネットワークを用いた方法により実行される場合には、各フィルタX(すなわちフィルタ1〜フィルタN、図10参照)について、ある特定顔傾きに対応した顔サンプル画像群と非顔サンプル画像群とに含まれるすべてのサンプル画像を用いて評価値vX(すなわちv1〜vN)が算出され、所定の顔検出率を達成する閾値thX(すなわちth1〜thN)が設定される。ここで、顔検出率とは、顔サンプル画像群を構成する顔サンプル画像の総数に対する、評価値vXによる閾値判定によって顔の画像に対応する画像であると判定される顔サンプル画像の数の割合を意味している。
次に、各フィルタXに設定された重み係数WeX(すなわちWe1〜WeN)が初期値に設定され、顔サンプル画像群および非顔サンプル画像群の中から選択された1つのサンプル画像についての累計評価値Tvが算出される。後述するように、顔判定においては、ある画像について算出された累計評価値Tvが所定の閾値TH以上の場合には、当該画像は顔の画像に対応する画像であると判定される。学習においては、選択されたサンプル画像(顔サンプル画像または非顔サンプル画像)について算出された累計評価値Tvによる閾値判定結果の正誤に基づき、各フィルタXに設定された重み係数WeXの値が修正される。以降、サンプル画像の選択と、選択されたサンプル画像について算出された累計評価値Tvによる閾値判定、および判定結果の正誤に基づく重み係数WeXの値の修正が、顔サンプル画像群および非顔サンプル画像群に含まれるすべてのサンプル画像について繰り返し実行される。以上の処理が特定顔傾き毎に実行されることにより、特定顔傾き毎の顔学習データFLDが設定される。
判定対象画像領域JIAについて特定顔傾き毎に累計評価値Tvが算出されると(図8のステップS350)、判定部216(図1)は、累計評価値Tvを特定顔傾き毎に設定された閾値THと比較する(ステップS360)。ある特定顔傾きについて累計評価値Tvが閾値TH以上である場合には、顔領域検出部210が、判定対象画像領域JIAは当該特定顔傾き分だけ傾いた顔の画像に対応する画像領域であるとして、判定対象画像領域JIAの位置、すなわち現在設定されているウィンドウSWの座標と、当該特定顔傾きと、を記憶する(ステップS370)。一方、いずれの特定顔傾きについても累計評価値Tvが閾値THより小さい場合には、ステップS370の処理はスキップされる。
ステップS380(図8)では、顔領域検出部210(図1)が、現在設定されているサイズのウィンドウSWにより、ステップS140(図2)で設定されたウィンドウ移動範囲全体がスキャンされたか否かを判定する。未だウィンドウ移動範囲全体がスキャンされていないと判定された場合には、判定対象設定部212(図1)が、ウィンドウSWを所定の方向にウィンドウ移動ピッチSPだけ移動する(ステップS390)。図9の下段には、ウィンドウSWが移動した様子を示している。本実施例では、上述したように、ステップS130(図2)において検出範囲情報が取得された場合には、ウィンドウ移動ピッチSPは、縦方向および横方向共にウィンドウSWのサイズSswに0.1を乗じた値とされる(図7(b)参照)。また、検出範囲情報が取得されなかった場合には、ウィンドウ移動ピッチSPは、縦方向および横方向共にウィンドウSWのサイズSswに0.2を乗じた値とされる(図7(a)参照)。ステップS390では、ウィンドウSWがこのウィンドウ移動ピッチSP分の移動量で右方向に移動する。また、ウィンドウSWがさらに右方向には移動できない位置に配置されている場合には、ステップS390において、ウィンドウSWがウィンドウ移動範囲の左端まで戻ると共に、ウィンドウ移動ピッチSP分の移動量で下方向に移動する。ウィンドウSWがさらに下方向には移動できない位置に配置されている場合には、ウィンドウ移動範囲全体がスキャンされたこととなる。ウィンドウSWの移動(ステップS390)の後には、移動後のウィンドウSWについて、上述のステップS340以降の処理が実行される。
ステップS380(図8)において現在設定されているサイズのウィンドウSWによりウィンドウ移動範囲全体がスキャンされたと判定された場合には、ステップS140(図2)で設定された使用ウィンドウサイズがすべて使用されたか否かが判定される(ステップS400)。未だ使用されていない使用ウィンドウサイズがあると判定された場合には、判定対象設定部212(図1)が、ウィンドウSWのサイズを現在設定されているサイズの次に小さい使用ウィンドウサイズに変更する(ステップS410)。すなわち、ウィンドウSWのサイズは、最初に使用ウィンドウサイズの内の最大サイズに設定され、その後、順に小さいサイズに変更されていく。ウィンドウSWのサイズの変更(ステップS410)の後には、変更後のサイズのウィンドウSWについて、上述のステップS330以降の処理が実行される。
ステップS400(図8)において使用ウィンドウサイズがすべて使用されたと判定された場合には、顔領域設定部218(図1)が、顔領域設定処理を実行する(ステップS420)。図12および図13は、顔領域設定処理の概要を示す説明図である。顔領域設定部218は、図8のステップS360において累計評価値Tvが閾値TH以上であると判定されステップS370において記憶されたウィンドウSWの座標(すなわちウィンドウSWの位置およびサイズ)と特定顔傾きとに基づき、顔の画像に対応する画像領域としての顔領域FAを設定する。具体的には、特定顔傾きが0度である場合には、ウィンドウSWにより規定される画像領域(すなわち判定対象画像領域JIA)が、そのまま顔領域FAとして設定される。一方、特定顔傾きが0度以外である場合には、ウィンドウSWにより規定される画像領域(判定対象画像領域JIA)を所定の点(例えばウィンドウSWの重心)を中心として時計回りに特定顔傾き分だけ回転させた画像領域が顔領域FAとして設定される。例えば図12(a)に示すように、30度の特定顔傾きについて累計評価値Tvが閾値TH以上であると判定された場合には、図12(b)に示すように、ウィンドウSWにより規定される画像領域をウィンドウSWの重心を中心として時計回りに30度回転させた画像領域が顔領域FAとして設定される。
また、顔領域設定部218は、ステップS370において、ある特定顔傾きについて互いに一部が重複する複数のウィンドウSWが記憶された場合には、各ウィンドウSWにおける所定の点(例えばウィンドウSWの重心)の座標の平均の座標を重心とし、各ウィンドウSWのサイズの平均のサイズを有する1つの新たなウィンドウ(以下、「平均ウィンドウAW」とも呼ぶ)を設定する。例えば図13(a)に示すように、互いに一部が重複する4つのウィンドウSW(SW1〜SW4)が記憶された場合には、図13(b)に示すように、4つのウィンドウSWのそれぞれの重心の座標の平均の座標を重心とし、4つのウィンドウSWのそれぞれのサイズの平均のサイズを有する1つの平均ウィンドウAWが定義される。このとき、上述したのと同様に、特定顔傾きが0度である場合には、平均ウィンドウAWにより規定される画像領域がそのまま顔領域FAとして設定される。一方、特定顔傾きが0度以外である場合には、平均ウィンドウAWにより規定される画像領域を所定の点(例えば平均ウィンドウAWの重心)を中心として時計回りに特定顔傾き分だけ回転させた画像領域が顔領域FAとして設定される(図13(c)参照)。
なお、図12に示したように、他のウィンドウSWと重複しない1つのウィンドウSWが記憶された場合にも、図13に示した互いに一部が重複する複数のウィンドウSWが記憶された場合と同様に、1つのウィンドウSW自身が平均ウィンドウAWであると解釈することも可能である。
本実施例では、学習の際に用いられる顔サンプル画像群(図11参照)に、基本顔サンプル画像を例えば1.2倍から0.8倍までの範囲の所定の倍率で拡大および縮小した画像(例えば図11における画像FIaおよびFIb)が含まれているため、ウィンドウSWの大きさに対する顔の画像の大きさが基本顔サンプル画像FIoと比べてわずかに大きかったり小さかったりする場合にも、顔領域FAが検出されうる。従って、本実施例では、ウィンドウSWのサイズとして上述した15個の離散的なサイズのみが設定されているが、あらゆる大きさの顔の画像について顔領域FAが検出されうる。同様に、本実施例では、学習の際に用いられる顔サンプル画像群に、基本顔サンプル画像を時計回りおよび反時計回りに例えば15度の範囲で所定の角度だけ回転させた画像(例えば図11における画像FIcおよびFId)が含まれているため、ウィンドウSWに対する顔の画像の傾きが基本顔サンプル画像FIoとはわずかに異なっている場合にも、顔領域FAが検出されうる。従って、本実施例では、特定顔傾きとして上述した12個の離散的な角度のみが設定されているが、あらゆる角度の顔の画像について顔領域FAが検出されうる。
顔領域検出処理(図2)における顔領域FAの検出結果は、種々の用途に利用可能である。例えば、対象画像における顔領域FA、あるいは顔領域FAに基づき設定された画像領域を対象として所定の補正処理を行うことが可能である。所定の補正処理としては、例えば、顔の画像の変形や肌色補正が挙げられる。また、検出された顔領域FAの情報を、対象画像データを含む画像ファイルに付加することも可能である。
以上説明したように、本実施例のプリンタ100による顔領域検出処理(図2)では、対象画像データの表す対象画像から顔領域として検出すべき顔の画像のサイズである検出サイズを特定する検出サイズ情報が取得され、検出サイズ情報により特定される検出サイズに基づき使用ウィンドウサイズが設定される(図5参照)。使用ウィンドウサイズに含まれる各サイズのウィンドウSWが顔検出用画像FDImg上に順に配置されることにより、判定対象画像領域JIAが規定される(図9参照)。判定対象画像領域JIAに対応した画像データに基づき、判定対象画像領域JIAが顔の画像に対応する画像領域であることの確からしさを表す累計評価値Tvが算出され、累計評価値Tvと閾値THとの比較に基づき、判定対象画像領域JIAが顔の画像に対応する画像領域であるか否かが判定される(図10参照)。そして、顔の画像に対応する画像領域であると判定された判定対象画像領域JIAの位置およびサイズに基づき、顔領域FAが設定される(図12および図13参照)。
本実施例のプリンタ100による顔領域検出処理では、検出サイズ情報に基づき、判定対象画像領域JIAを規定するための使用ウィンドウサイズが設定されるため、対象画像からの顔領域FAの検出の際に、処理の高速化を図りつつ検出率を向上させることができる。以下、これについて説明する。
図14は、ウィンドウSWの標準サイズが使用ウィンドウサイズとして設定された場合の顔画像のサイズと検出率の関係を概略的に示す説明図である。図14における顔画像のサイズとは、顔検出用画像FDImg(図9)における顔の画像のサイズである。顔の画像とは、概ね上述の学習に用いられる基本顔サンプル画像FIo(図11)に含まれる顔の範囲と同じ範囲を含む画像である。また、検出率とは、対象画像に顔の画像が含まれている場合に、顔領域検出処理(図2)において当該顔の画像に対応する画像領域が顔領域FAとして検出される率である。顔画像のサイズおよび検出率の意義は、図15および図16においても同じである。
上述したように、本実施例では、図5(a)に示す15個のウィンドウSWの標準サイズが予め設定されている。ウィンドウSWの標準サイズが使用ウィンドウサイズとして設定され、例えば標準サイズの1つである86画素がウィンドウSWのサイズとして選択された場合、当該ウィンドウSWを用いて検出可能な顔画像のサイズは、86画素を中心とした一定の拡がりを有する範囲(検出可能範囲R(86)と呼ぶ)内のサイズである。これは、上述の学習に用いられる顔サンプル画像群(図11)に、基本顔サンプル画像FIoを所定の倍率で拡大および縮小した画像(図11における画像FIaおよびFIb)が含まれているからである。ただし、顔サンプル画像群に含まれる画像数に対する拡大画像および縮小画像の数の割合は小さいので、検出率は、曲線C(86)で示すように、顔画像のサイズが標準サイズである86画素から離れるほど小さくなる。他の標準サイズ(例えば103画素や72画素、60画素)についても同様である。図14に示すように、互いに隣接する標準サイズ(例えば86画素と72画素)についての検出可能範囲R(例えばR(86)とR(72))は一部が重複しているため、概ねすべてのサイズの顔画像の検出が可能となっている。図14に示した場合における使用ウィンドウサイズ全体としての検出率は、顔画像の各サイズにおいて最も検出率の高い曲線Cを選択して結んだ曲線で表される。
図15は、検出サイズ情報に基づき使用ウィンドウサイズが設定された場合の顔画像のサイズと検出率の関係を概略的に示す説明図である。図15には、検出サイズが60画素から80画素までの範囲として設定され、当該サイズの範囲を5等分するサイズである60画素、65画素、70画素、75画素、80画素の5つのサイズが使用ウィンドウサイズとして設定された場合における、顔画像のサイズと検出率の関係を示している。図15においても、各使用ウィンドウサイズについての検出率が曲線C(C(60)、C(65)、C(70)、C(75)、C(80))で示されており、図15に示した場合における使用ウィンドウサイズ全体としての検出率は、顔画像の各サイズにおいて最も検出率の高い曲線Cを選択して結んだ曲線で表される。図15に示すように、検出サイズ情報に基づき使用ウィンドウサイズが設定された場合には、検出サイズ情報により特定される検出サイズ(図15の例では60画素から80画素までの範囲)における検出率が、ウィンドウSWの標準サイズが使用ウィンドウサイズとして設定された場合(図14)と比較して、全体として高くなる。また、検出サイズ情報に基づき使用ウィンドウサイズが設定された場合には、検出サイズ情報により特定される検出サイズを外れたサイズのウィンドウSWが使用されることはないため、検出実行処理(図8)の高速化を図ることができる。そのため、本実施例のプリンタ100による顔領域検出処理では、対象画像からの顔領域FAの検出の際に、処理の高速化を図りつつ、ユーザの所望するサイズの顔の画像の検出率を向上させることができる。
図16は、検出サイズ情報に基づき使用ウィンドウサイズが設定された場合の顔画像のサイズと検出率の関係を概略的に示す説明図である。図16には、検出サイズが1つの値である70画素と設定され、使用ウィンドウサイズが70画素と設定された場合における、顔画像のサイズと検出率の関係を示している。図16においても、使用ウィンドウサイズについての検出率が曲線C(70)で示されている。図16に示すように、検出サイズ情報に基づき使用ウィンドウサイズが設定された場合には、検出サイズ情報により特定される検出サイズ(図16の例では70画素)における検出率が、ウィンドウSWの標準サイズが使用ウィンドウサイズとして設定された場合(図14)と比較して高くなる。また、検出サイズ情報に基づき使用ウィンドウサイズが設定された場合には、検出サイズ情報により特定される検出サイズを外れたサイズのウィンドウSWが使用されることはないため、検出実行処理(図8)の高速化を図ることができる。そのため、本実施例のプリンタ100による顔領域検出処理では、対象画像からの顔領域FAの検出の際に、処理の高速化を図りつつ、ユーザの所望するサイズの顔の画像の検出率を向上させることができる。
また、本実施例のプリンタ100による顔領域検出処理では、検出サイズがサイズの範囲として設定された場合には、当該サイズの範囲をK(Kは2以上の整数)等分するサイズが使用ウィンドウサイズとして設定される。そのため、使用ウィンドウサイズが容易に設定可能であると共に、当該検出サイズにおける顔の画像の検出率を満遍なく向上させることができる。また、Kの値は当該サイズの範囲が広いほど大きい値に設定されるため、比較的広い範囲の検出サイズが設定された場合にも、顔の画像の検出率の低下を抑制することができる。また、検出サイズ情報が取得された場合には、当該サイズの範囲内に含まれるウィンドウSWの標準サイズの数よりも多数のサイズが使用ウィンドウサイズとして設定されるため、ユーザにより検出サイズが指定された場合には、指定されなかった場合と比較して、顔の画像の検出率を向上させることができる。
また、本実施例のプリンタ100による顔領域検出処理では、検出範囲DAを特定する検出範囲情報が取得され、検出範囲情報により特定される検出範囲DAにおいて、ウィンドウSWにより規定される判定対象画像領域JIAが設定される。そのため、対象画像からの顔領域FAの検出の際に、処理の高速化を図りつつ、ユーザの所望する範囲に位置する顔の画像を検出することができる。また、検出範囲情報が取得された場合には、検出範囲情報が取得されなかった場合と比較して、ウィンドウ移動ピッチSPが小さく設定されるため、処理の高速化を図りつつ、ユーザの所望する範囲に位置する顔の画像の検出率を向上させることができる。
B.変形例:
なお、この発明は上記の実施例や実施形態に限られるものではなく、その要旨を逸脱しない範囲において種々の態様において実施することが可能であり、例えば次のような変形も可能である。
B1.変形例1:
上記実施例おける検出サイズの指定方法(図3参照)は、あくまで一例であり、種々変形可能である。例えば、検出サイズが、「大」、「中」、「小」のように段階的に指定されるものとしてもよい。また、検出サイズは、必ずしも顔検出用画像FDImgのサイズに対応した画素数で指定される必要はなく、当該サイズとは無関係に例えば0〜100の値を用いて指定されるものとしてもよい。また、本実施例では、正方形形状のウィンドウSWを採用しているため、検出サイズを表す入力サイズ枠ISFも正方形形状であるが、検出サイズの指定方法や入力サイズ枠ISFの形状は、ウィンドウSWの形状に応じて変更可能である。例えば、円形形状のウィンドウSWを採用する場合には、入力サイズ枠ISFも円形形状となり、検出サイズとして円の径を指定するものとしてもよい。
B2.変形例2:
上記実施例における検出範囲DAの指定方法(図4参照)は、あくまで一例であり、種々変形可能である。例えば、検出範囲DAは矩形である必要はなく、円形であってもよいし、例えばユーザがタッチペン等の入力機器により指定した任意の形状であってもよい。また、検出範囲DAは1つの画像領域として指定される必要はなく、複数の分離した画像領域の集合として指定されてもよい。
B3.変形例3:
上記実施例における使用ウィンドウサイズの設定方法(図5参照)は、あくまで一例であり、種々変形可能である。例えば、上記実施例では、検出サイズがサイズの範囲として設定された場合に、当該サイズの範囲をK(Kは2以上の整数)等分するサイズが使用ウィンドウサイズとして設定されるが、当該サイズの範囲をK等分するサイズではない当該サイズの範囲内の少なくとも1つのサイズが使用ウィンドウサイズとして設定されるとしてもよい。また、当該サイズの範囲をK等分するサイズが使用ウィンドウサイズとして設定される場合に、Kの値が可変に設定される必要はなく、Kの値は固定であってもよい。
B4.変形例4:
上記実施例におけるウィンドウ移動ピッチSPの設定方法(図5参照)は、あくまで一例であり、種々変形可能である。ウィンドウ移動ピッチSPは、検出範囲情報が取得されたか否かに関わらず同じ方法で設定されるとしてもよい。また、上記実施例におけるウィンドウ移動ピッチSPの算出の際にウィンドウSWのサイズSswに乗じられる係数は変更可能である。また、ウィンドウ移動ピッチSPは、ウィンドウSWのサイズSswに基づき算出されるのではなく、検出範囲DAのサイズに基づき算出されるものとしてもよい。例えば、横方向のウィンドウ移動ピッチSPは、検出範囲DAの横方向のサイズに所定の係数を乗じて算出し、縦方向のウィンドウ移動ピッチSPは、検出範囲DAの縦方向のサイズに所定の係数を乗じて算出するとしてもよい。このようにすれば、検出範囲DAが大きいほどウィンドウ移動ピッチSPが大きな値に設定されるため、検出範囲DAが大きい場合にも処理時間の低減を図ることができる。また、横方向についてはL回、縦方向についてはM回のウィンドウSWの移動で検出範囲DA全体のスキャンが完了するようにウィンドウ移動ピッチSPが算出されるとしてもよい。
B5.変形例5:
上記実施例における顔領域検出処理(図3)の態様はあくまで一例であり、種々変更可能である。例えば顔検出用画像FDImg(図9参照)のサイズは320画素×240画素に限られず、他のサイズであってもよいし、対象画像TImgそのものを顔検出用画像FDImgとして用いることも可能である。また、使用されるウィンドウSWのサイズやウィンドウSWの移動方向および移動量(移動ピッチ)は上述したものに限られない。また、上記実施例では、顔検出用画像FDImgのサイズが固定され、複数種類のサイズのウィンドウSWが顔検出用画像FDImg上に配置されることにより複数サイズの判定対象画像領域JIAが設定されているが、複数種類のサイズの顔検出用画像FDImgが生成され、固定サイズのウィンドウSWが顔検出用画像FDImg上に配置されることにより複数サイズの判定対象画像領域JIAが設定されるものとしてもよい。
また、上記実施例では、累計評価値Tvを閾値THと比較することにより顔判定を行っているが(図10参照)、顔判定を複数の判別器を用いた判別等の他の方法によって行ってもよい。顔判定の方法に応じて、顔学習データFLDの設定に用いられる学習方法も変更される。また、顔判定は、必ずしも学習を用いた判別方法により行われる必要はなく、パターンマッチング等の他の方法により行われるとしてもよい。
また、上記実施例では、30度刻みの12種類の特定顔傾き(図11参照)が設定されているが、より多くの種類の特定顔傾きが設定されてもよいし、より少ない種類の特定顔傾きが設定されてもよい。また、必ずしも特定顔傾きが設定される必要はなく、0度の顔傾きについての顔判定が行われるとしてもよい。また、上記実施例では、顔サンプル画像群に基本顔サンプル画像FIoを拡大・縮小した画像や回転させた画像が含まれるとしているが、顔サンプル画像群に必ずしもこのような画像が含まれる必要はない。
上記実施例において、あるサイズのウィンドウSWにより規定される判定対象画像領域JIAについての顔判定で顔の画像に対応する画像領域であると判定された場合には、当該サイズより所定の比率以上小さいサイズのウィンドウSWを配置する場合には、顔の画像に対応する画像領域であると判定された判定対象画像領域JIAを避けて配置するものとしてもよい。このようにすれば、処理の高速化を図ることができる。
上記実施例では、メモリカードMCに格納された画像データが対象画像データに設定されているが、対象画像データはメモリカードMCに格納された画像データに限らず、例えばネットワークを介して取得された画像データであってもよい。
上記実施例では、顔領域FAは矩形の領域であるが、顔領域FAは矩形以外の形状の領域であってもよい。
上記実施例では、画像処理装置としてのプリンタ100による顔領域検出処理を説明したが、処理の一部または全部がパーソナルコンピュータやデジタルスチルカメラ、デジタルビデオカメラ等の他の種類の画像処理装置により実行されるものとしてもよい。また、プリンタ100はインクジェットプリンタに限らず、他の方式のプリンタ、例えばレーザプリンタや昇華型プリンタであるとしてもよい。
上記実施例において、ハードウェアによって実現されていた構成の一部をソフトウェアに置き換えるようにしてもよく、逆に、ソフトウェアによって実現されていた構成の一部をハードウェアに置き換えるようにしてもよい。
また、本発明の機能の一部または全部がソフトウェアで実現される場合には、そのソフトウェア(コンピュータプログラム)は、コンピュータ読み取り可能な記録媒体に格納された形で提供することができる。この発明において、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスクやCD−ROMのような携帯型の記録媒体に限らず、各種のRAMやROM等のコンピュータ内の内部記憶装置や、ハードディスク等のコンピュータに固定されている外部記憶装置も含んでいる。
本発明の実施例における画像処理装置としてのプリンタ100の構成を概略的に示す説明図である。 本実施例のプリンタ100による顔領域検出処理の流れを示すフローチャートである。 検出サイズ情報取得のためのユーザインタフェースの一例を示す説明図である。 検出範囲情報取得のためのユーザインタフェースの一例を示す説明図である。 使用ウィンドウサイズの設定方法を示す説明図である。 ウィンドウ移動範囲の設定方法を示す説明図である。 ウィンドウ移動ピッチの設定方法を示す説明図である。 顔領域の検出実行の流れを示すフローチャートである。 顔領域の検出実行の概要を示す説明図である。 顔判定に用いる累計評価値Tvの算出方法の概要を示す説明図である。 学習に用いられるサンプル画像の一例を示す説明図である。 顔領域設定処理の概要を示す説明図である。 顔領域設定処理の概要を示す説明図である。 ウィンドウSWの標準サイズが使用ウィンドウサイズとして設定された場合の顔画像のサイズと検出率の関係を概略的に示す説明図である。 検出サイズ情報に基づき使用ウィンドウサイズが設定された場合の顔画像のサイズと検出率の関係を概略的に示す説明図である。 検出サイズ情報に基づき使用ウィンドウサイズが設定された場合の顔画像のサイズと検出率の関係を概略的に示す説明図である。
符号の説明
100…プリンタ
110…CPU
120…内部メモリ
140…操作部
150…表示部
160…プリンタエンジン
170…カードインターフェース
172…カードスロット
200…画像処理部
210…顔領域検出部
212…判定対象設定部
214…評価値算出部
216…判定部
218…顔領域設定部
222…検出サイズ情報取得部
224…検出範囲情報取得部
310…表示処理部
320…印刷処理部

Claims (12)

  1. 画像処理装置であって、
    対象画像データの表す対象画像から検出すべき顔の画像のサイズを特定する検出サイズ情報を取得する検出サイズ情報取得部と、
    前記検出サイズ情報に基づき使用画像領域サイズを設定し、前記対象画像における前記使用画像領域サイズを有する少なくとも1つの画像領域を判定対象画像領域として設定する判定対象設定部と、
    前記判定対象画像領域に対応した画像データに基づき、前記判定対象画像領域が顔の画像に対応する画像領域であることの確からしさを表す評価値を算出する評価値算出部と、
    前記評価値と前記判定対象画像領域の位置およびサイズとに基づき、前記対象画像における顔の画像に対応する画像領域としての顔領域を設定する顔領域設定部と、を備える、画像処理装置。
  2. 請求項1に記載の画像処理装置であって、
    前記検出サイズ情報は、検出すべき顔の画像のサイズを値の範囲として特定する情報であり、
    前記判定対象設定部は、前記検出サイズ情報により特定される前記値の範囲に含まれる少なくとも1つの値を前記使用画像領域サイズとして設定する、画像処理装置。
  3. 請求項2に記載の画像処理装置であって、
    前記判定対象設定部は、前記値の範囲をK(Kは2以上の整数)等分する値を前記使用画像領域サイズとして設定する、画像処理装置。
  4. 請求項3に記載の画像処理装置であって、
    前記Kは前記値の範囲が広いほど大きい、画像処理装置。
  5. 請求項2ないし請求項4のいずれかに記載の画像処理装置であって、
    前記判定対象設定部は、予め設定された標準画像領域サイズを有しており、前記検出サイズ情報が取得されなかった場合には前記標準画像領域サイズを前記使用画像領域サイズとして設定し、前記検出サイズ情報が取得された場合には前記値の範囲内に含まれる前記標準画像領域サイズの値の数よりも多数の値を前記使用画像領域サイズとして設定する、画像処理装置。
  6. 請求項1に記載の画像処理装置であって、
    前記検出サイズ情報は、検出すべき顔の画像のサイズを1つの値として特定する情報であり、
    前記判定対象設定部は、前記検出サイズ情報により特定される前記1つの値を前記使用画像領域サイズとして設定する、画像処理装置。
  7. 請求項1ないし請求項6のいずれかに記載の画像処理装置であって、さらに、
    前記対象画像における顔の画像の検出を行うべき一部の領域である検出範囲を特定する検出範囲情報を取得する検出範囲情報取得部を備え、
    前記判定対象設定部は、前記検出範囲情報により特定される前記検出範囲において、前記判定対象画像領域を設定する、画像処理装置。
  8. 請求項7に記載の画像処理装置であって、
    前記判定対象設定部は、前記判定対象画像領域として設定されるべき第1の画像領域と、前記第1の画像領域と同一サイズの前記判定対象画像領域であって最も前記第1の画像領域に近い前記判定対象画像領域として設定されるべき第2の画像領域と、の間の距離の標準値を有しており、前記検出範囲情報が取得されなかった場合には前記距離として前記標準値を用いて前記判定対象画像領域を設定し、前記検出範囲情報が取得された場合には前記距離として前記標準値よりも小さい値を用いて前記判定対象画像領域を設定する、画像処理装置。
  9. 請求項7に記載の画像処理装置であって、
    前記判定対象設定部は、前記検出範囲情報により特定される前記検出範囲のサイズに応じて、前記判定対象画像領域として設定されるべき第1の画像領域と、前記第1の画像領域と同一サイズの前記判定対象画像領域であって最も前記第1の画像領域に近い前記判定対象画像領域として設定されるべき第2の画像領域と、の間の距離を設定する、画像処理装置。
  10. 請求項1ないし請求項9のいずれかに記載の画像処理装置であって、
    前記顔領域設定部は、前記評価値に基づき前記判定対象画像領域が顔の画像に対応する画像領域であるか否かを判定し、顔の画像に対応する画像領域であると判定された前記判定対象画像領域の位置およびサイズに基づき顔領域を設定する、画像処理装置。
  11. 画像処理方法であって、
    (a)対象画像データの表す対象画像から検出すべき顔の画像のサイズを特定する検出サイズ情報を取得する工程と、
    (b)前記検出サイズ情報に基づき使用画像領域サイズを設定し、前記対象画像における前記使用画像領域サイズを有する少なくとも1つの画像領域を判定対象画像領域として設定する工程と、
    (c)前記判定対象画像領域に対応した画像データに基づき、前記判定対象画像領域が顔の画像に対応する画像領域であることの確からしさを表す評価値を算出する工程と、
    (d)前記評価値に基づき、前記判定対象画像領域が顔の画像に対応する画像領域であるか否かを判定する工程と、
    (e)顔の画像に対応する画像領域であると判定された前記判定対象画像領域の位置およびサイズに基づき、前記対象画像における顔の画像に対応する画像領域としての顔領域を設定する工程と、を備える、画像処理方法。
  12. 画像処理のためのコンピュータプログラムであって、
    対象画像データの表す対象画像から検出すべき顔の画像のサイズを特定する検出サイズ情報を取得する検出サイズ情報取得機能と、
    前記検出サイズ情報に基づき使用画像領域サイズを設定し、前記対象画像における前記使用画像領域サイズを有する少なくとも1つの画像領域を判定対象画像領域として設定する判定対象設定機能と、
    前記判定対象画像領域に対応した画像データに基づき、前記判定対象画像領域が顔の画像に対応する画像領域であることの確からしさを表す評価値を算出する評価値算出機能と、
    前記評価値に基づき、前記判定対象画像領域が顔の画像に対応する画像領域であるか否かを判定する判定機能と、
    顔の画像に対応する画像領域であると判定された前記判定対象画像領域の位置およびサイズに基づき、前記対象画像における顔の画像に対応する画像領域としての顔領域を設定する顔領域設定機能と、を、コンピュータに実現させる、コンピュータプログラム。
JP2008066306A 2008-03-14 2008-03-14 対象画像からの顔領域の検出 Withdrawn JP2009223540A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008066306A JP2009223540A (ja) 2008-03-14 2008-03-14 対象画像からの顔領域の検出

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008066306A JP2009223540A (ja) 2008-03-14 2008-03-14 対象画像からの顔領域の検出

Publications (1)

Publication Number Publication Date
JP2009223540A true JP2009223540A (ja) 2009-10-01

Family

ID=41240262

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008066306A Withdrawn JP2009223540A (ja) 2008-03-14 2008-03-14 対象画像からの顔領域の検出

Country Status (1)

Country Link
JP (1) JP2009223540A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013250604A (ja) * 2012-05-30 2013-12-12 Hitachi Ltd 物体検出装置および物体検出方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013250604A (ja) * 2012-05-30 2013-12-12 Hitachi Ltd 物体検出装置および物体検出方法
US9465998B2 (en) 2012-05-30 2016-10-11 Hitachi, Ltd. Object detecting device and object detecting method

Similar Documents

Publication Publication Date Title
US20090245655A1 (en) Detection of Face Area and Organ Area in Image
JP5076744B2 (ja) 画像処理装置
US20090051946A1 (en) Image area selecting method
JP2009053914A (ja) 画像処理装置および画像処理方法
US20120014453A1 (en) Image processing apparatus and image processing method
US20090285457A1 (en) Detection of Organ Area Corresponding to Facial Organ Image in Image
JP4957607B2 (ja) 画像における顔領域の検出
JP4389954B2 (ja) 画像処理装置、画像処理方法、コンピュータープログラム、記録媒体、および、プリンタ
JP2010086379A (ja) 画像処理装置、画像処理方法、及びプログラム
JP4686624B2 (ja) 情報処理装置、画像処理方法およびプログラム
JP2009282699A (ja) 画像における顔の器官の画像に対応する器官領域の検出
CN106354381B (zh) 图像文件的处理方法及装置
JP4985510B2 (ja) 対象画像における顔の画像に対応する顔領域の設定
JP2009223540A (ja) 対象画像からの顔領域の検出
JP2009237857A (ja) 画像における顔の器官の画像に対応する器官領域の設定
JP5489821B2 (ja) 画像処理装置及び画像処理装置の制御方法
JP2009237618A (ja) 画像における顔領域の検出
JP4816540B2 (ja) 画像処理装置および画像処理方法
JP2009230557A (ja) オブジェクト検出装置、オブジェクト検出方法、オブジェクト検出プログラムおよび印刷装置
JP2009217607A (ja) 画像中の顔領域検出における信頼度の算出
JP2009217609A (ja) 顔領域に基づき設定された画像領域を対象とした補正処理
JP6973524B2 (ja) プログラム
JP2009237754A (ja) オブジェクト検出方法、オブジェクト検出装置、印刷装置、オブジェクト検出プログラムおよびオブジェクト検出プログラムを記録した記録媒体
JP2009104292A (ja) 目の画像を対象とした画像処理
JP2009230473A (ja) 対象画像からの特定種類の被写体の画像に対応する画像領域の検出

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110216

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111110

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111115

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20111208