JP4710426B2 - 画像処理装置、画像処理方法及び画像処理プログラム - Google Patents

画像処理装置、画像処理方法及び画像処理プログラム Download PDF

Info

Publication number
JP4710426B2
JP4710426B2 JP2005174409A JP2005174409A JP4710426B2 JP 4710426 B2 JP4710426 B2 JP 4710426B2 JP 2005174409 A JP2005174409 A JP 2005174409A JP 2005174409 A JP2005174409 A JP 2005174409A JP 4710426 B2 JP4710426 B2 JP 4710426B2
Authority
JP
Japan
Prior art keywords
area
score value
region
temporary area
temporary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2005174409A
Other languages
English (en)
Other versions
JP2006350575A (ja
Inventor
基文 福井
典司 加藤
洋次 鹿志村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2005174409A priority Critical patent/JP4710426B2/ja
Priority to US11/338,807 priority patent/US7602943B2/en
Publication of JP2006350575A publication Critical patent/JP2006350575A/ja
Application granted granted Critical
Publication of JP4710426B2 publication Critical patent/JP4710426B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Description

本発明は、画像データに含まれる、人物等の対象物の少なくとも一部を含む領域を検出する画像処理装置、画像処理方法及び画像処理プログラムに関する。
画像データの中から、人物の顔や手などの部分を検出することは、当該人物の姿勢や状態を認識するために極めて重要な技術である。顔や手を検出する場合には、何らかの方法により検出すべき顔や手の肌色情報を色分布として取得し、当該色分布を用いて顔や手を含む画像領域を画定する手法がある。
上記の技術により例えば手領域を検出する場合、取得した肌色の色分布をもとに、画像データに含まれる各画素について手領域に含まれる度合いに関するスコア値を算出し、各画素の位置とスコア値とが対応づけられたスコア値のマップを生成する。そして、このスコア値のマップを用いて手領域を検出する。
スコア値のマップを用いて手領域などの注目領域を検出する手法の一つとして、カムシフト(Continuously Adaptive Mean Shift)アルゴリズムがある(非特許文献1参照)。この手法を用いる場合、まずスコア値のマップ上に仮領域を配置する。そして、仮領域のスコア値の分布に基づいて仮領域の位置を移動させるとともに、仮領域の大きさを変更する処理を繰り返すことで、仮領域が収束した位置及び大きさにより注目領域を決定する。
Gary R.Bradski. "Computer Vision Face Tracking For Use in a Perceptual User Interface: Intel Technology Journal Q2,1998". [online]. Intel Corporation, 1998. [retrieved on 2005-06-03]. Retrieved from the Internet: <URL: ftp://download.intel.com/technology/itj/q21998/pdf/camshift.pdf>.
しかしながら、上記従来例の技術によれば、注目領域を検出する際に、仮領域のスコア値の分布に基づいて仮領域の位置及び大きさは変更するが、仮領域の形状については、仮領域と同じ形状で仮領域を包含する領域全体のスコア値の分布に基づいて変更するだけである。このため、仮領域に対して所定の方向の隣接領域の情報に基づいて、当該方向の大きさを変更することは行わない。その結果、画定しようとする注目領域の形状が予め予測できない場合、注目領域の検出に失敗したり、検出の精度が悪くなったりするという問題がある。例えば手領域を検出する場合、撮像された人物が長袖の上着を着用しており、掌の部分しか肌が露出していない場合には肌色情報を用いて手領域を比較的精度よく検出できるが、撮像された人物が半袖の上着を着用しており、腕の部分全体の肌が露出している場合、正しく手領域を検出できない場合がある。
本発明は、上記実情に鑑みてなされたものであって、その目的の一つは、画像データに含まれる、人物等の対象物の少なくとも一部を含む領域を検出する場合に、検出の精度を向上できる画像処理装置、画像処理方法及び画像処理プログラムを提供することにある。
上記課題を解決するための本発明に係る画像処理装置は、対象物の少なくとも一部を撮像して生成された画像データについて、当該画像データの中から対象物の少なくとも一部を含む注目領域を検出する画像処理装置であって、前記画像データに含まれる単位領域のそれぞれについて、当該単位領域の画像データ内における位置に、当該単位領域が前記注目領域に含まれる度合いに関するスコア値が対応づけられたスコア値のマップを取得するマップ取得手段と、所定の形状を有する仮領域を、前記スコア値のマップ上の所定の条件に基づいて決定した位置に配置する仮領域配置手段と、(1)前記仮領域に含まれる単位領域のスコア値の分布に基づいて、前記仮領域の前記スコア値のマップ上の位置を変更する処理、及び(2)前記仮領域に隣接する所定の隣接領域に含まれる単位領域の位置及びスコア値に基づいて、前記仮領域の所定の方向と前記所定の方向に直交する方向の長さの比を変更する処理、について、(1)及び/又は(2)の処理を少なくとも一度実行し、所定の条件を満たした場合に、前記仮領域を前記注目領域として決定し、その結果を出力する注目領域検出手段と、を含むことを特徴とする。
ここで、前記注目領域検出手段は、前記スコア値の分布に基づいて、前記仮領域を前記スコア値のマップ上で回転させる処理をさらに実行することとしてもよい。
さらに、前記仮領域は矩形領域であり、前記隣接領域は、前記仮領域の4辺のそれぞれに隣接する4つの矩形領域からなることとしてもよい。
あるいは、前記仮領域は矩形領域であり、前記隣接領域は前記仮領域を内包又は外接する楕円又はひし形に含まれる領域であることとしてもよい。
また、前記仮領域配置手段は、前記仮領域を、前記スコア値のマップに含まれる単位領域の位置とスコア値に基づいて決定した位置に配置することとしてもよい。
また、本発明に係る画像処理方法は、コンピュータを用いて、対象物の少なくとも一部を撮像して生成された画像データについて、当該画像データの中から対象物の少なくとも一部を含む注目領域を検出する画像処理方法であって、前記画像データに含まれる単位領域のそれぞれについて、当該単位領域の画像データ内における位置に、当該単位領域が前記注目領域に含まれる度合いに関するスコア値が対応づけられたスコア値のマップを取得するステップと、所定の形状を有する仮領域を、前記スコア値のマップ上の所定の条件に基づいて決定した位置に配置するステップと、(1)前記仮領域に含まれる単位領域のスコア値の分布に基づいて、前記仮領域の前記スコア値のマップ上の位置を変更する処理、及び(2)前記仮領域に隣接する所定の隣接領域に含まれる単位領域の位置及びスコア値に基づいて、前記仮領域の所定の方向と前記所定の方向に直交する方向の長さの比を変更する処理、について、(1)及び/又は(2)の処理を少なくとも一度実行し、所定の条件を満たした場合に、前記仮領域を前記注目領域として決定し、その結果を出力するステップと、を含むことを特徴とする。
また、本発明に係る画像処理プログラムは、コンピュータに、対象物の少なくとも一部を撮像して生成された画像データについて、当該画像データの中から対象物の少なくとも一部を含む注目領域を検出させる画像処理プログラムであって、前記画像データに含まれる単位領域のそれぞれについて、当該単位領域の画像データ内における位置に、当該単位領域が前記注目領域に含まれる度合いに関するスコア値が対応づけられたスコア値のマップを取得するステップと、所定の形状を有する仮領域を、前記スコア値のマップ上の所定の条件に基づいて決定した位置に配置するステップと、(1)前記仮領域に含まれる単位領域のスコア値の分布に基づいて、前記仮領域の前記スコア値のマップ上の位置を変更する処理、及び(2)前記仮領域に隣接する所定の隣接領域に含まれる単位領域の位置及びスコア値に基づいて、前記仮領域の所定の方向と前記所定の方向に直交する方向の長さの比を変更する処理、について、(1)及び/又は(2)の処理を少なくとも一度実行し、所定の条件を満たした場合に、前記仮領域を前記注目領域として決定し、その結果を出力するステップと、を前記コンピュータに実行させることを特徴とする。
本発明によれば、画像データに含まれる、人物等の対象物の少なくとも一部を含む領域を検出する際に、検出する領域の形状を予め知ることができないなどの場合においても、検出の精度を向上できる。
以下、本発明の好適な実施の形態について、図面を参照しながら説明する。
本発明の実施の形態に係る画像処理装置10は、図1に示すように、制御部11、記憶部12、操作部13、表示部14及び撮像部15を含んで構成されている。
ここで、制御部11は、例えばCPU等で構成されており、記憶部12に格納されているプログラムに従って動作する。記憶部12は、RAMやROM等のメモリ素子及び/又はディスクデバイスなどを含んで構成されている。この記憶部12には、制御部11によって実行されるプログラムが格納されている。また、記憶部12は、制御部11のワークメモリとしても動作する。本実施の形態において制御部11が実行する処理の内容については、後に詳しく述べる。
操作部13は、キーボードやマウス等であり、利用者の指示操作を受け付けて、当該指示操作の内容を制御部11に出力する。表示部14は、ディスプレイ等であり、制御部11からの指示に従って、情報の表示を行う。
撮像部15は、デジタルスチルカメラやビデオカメラ等であり、画像を撮影して得られた画像データを制御部11に対して出力する。なお、撮像部15は、必ずしも必要ではない。この場合、本実施の形態による処理の対象となる画像データは、記憶部12に予め保持されていてもよいし、図示しない通信部によりネットワーク経由で他の装置から受信することとしてもよい。
以下では、人物を撮像して生成された画像データに対して、当該人物の顔に係る部分を含む顔領域をまず抽出し、当該顔領域に含まれる画素の色の情報に基づいて当該人物の手に係る部分を含む手領域を検出する場合に、画像処理装置10が実行する処理を例として説明する。なお、本発明の実施の形態は、上述の形態に限られず、任意の対象物について、当該対象物の性状情報に基づいて画像データから当該対象物の少なくとも一部を含む画像領域を検出する場合に適用可能である。例えば、人物だけでなく、動物やロボット等、その姿勢や状態を外観の性状情報を用いて検出可能な多様な対象物に対して適用することができる。この場合、対象物の外観や撮像する画像のデータ形式などによって、色の情報に代えて画素の濃度の情報など他の外観の性状に関する情報を用いてもよい。
画像処理装置10は、機能的には、図2に示すように、サンプル領域抽出部21、色ヒストグラム生成部22、マップ生成部23、仮領域配置部24及び注目領域検出部25を含んで構成されている。これらの機能は、プログラムとして画像処理装置10の記憶部12に記憶されており、制御部11によって実行される。
サンプル領域抽出部21は、撮像部15などによって得られた画像データに対して、当該画像データの中からサンプルデータとして用いる画像領域を抽出する。撮像部15がビデオカメラなどの場合、動画像のデータが得られるが、この場合、サンプル領域抽出部21は、動画像データの中に含まれる各フレームの静止画像データに対して、処理を行う。
ここでは、サンプル領域抽出部21は、人物の顔に係る部分を含む領域(顔領域)を抽出する。顔領域の抽出の方法は特に限定されず、任意の技術を用いることができる。例えば、サンプル領域抽出部21は、予め学習によって獲得した顔の形状パターンに関する統計データを用いて、顔領域の抽出を行うこととしてもよい。また、サンプル領域抽出部21は、顔の位置だけでなく、顔の向きや大きさを特定することとしてもよい。
色ヒストグラム生成部22は、サンプル領域抽出部21により抽出された画像領域に含まれる画素について、その色分布を表す色ヒストグラムを生成する。生成される色ヒストグラムは、対象となる画像データに表される人物の顔の色情報から得られた、その人物固有の肌の色情報を表すことになる。
具体的に、色ヒストグラム生成部22は、まず顔領域に含まれる画素がそれぞれ持つ色の値を、必要に応じて適当な色空間上の値に変換する。例えば、元の画像データに含まれるそれぞれの画素が、赤、緑、青の3原色のそれぞれについて0から255までの256階調の値(以下、それぞれR,G,Bで表す)を持ち、これら3つの値の組み合わせによって画素の持つ色が表されるものとする。この場合、色ヒストグラム生成部22は、他の色空間への変換を行わず、R,G,Bの値をそのまま用いて3次元のヒストグラムを生成してもよいし、3つの値のうち一部の値のみ用いて、より低次元のヒストグラムを生成することとしてもよい。また、特に人物の肌色の特徴を捉える場合には、前記R,G,Bの値によって表される色を正規化rg空間や、HSV空間上の値に変換することが望ましい。ここでは、正規化rg空間上の値に変換するものとする。正規化rg空間上のr成分、g成分のそれぞれの値は、以下の計算式により計算される。
r=R/(R+G+B)
g=G/(R+G+B)
この計算式により、色ヒストグラム生成部22は、それぞれの画素について、(R,G,B)の値から、正規化rg空間上の値(r,g)を得る。ここで、r,gはそれぞれ0から1までの値をとる。
さらに、色ヒストグラム生成部22は、顔領域に含まれる画素のそれぞれについて、必要に応じて変換された色空間上の値が、色ヒストグラムのどのビンに含まれるか判定する。ここで、ヒストグラムのビン数としては、予め定められた適当な値を用いる。例えばビン数をr成分、g成分のそれぞれについて50とすると、生成される色ヒストグラムは、50×50のビン数を持つ2次元のヒストグラムになる。r,gはそれぞれ0から1までの値をとるので、ビンの幅が一様である場合、それぞれのビン幅は1/50となる。
このようにして、色ヒストグラム生成部22は、サンプル領域抽出部21が抽出した画像領域に含まれる画素について、所定の色空間における色分布を色ヒストグラムとして生成する。この色ヒストグラムは、それぞれのビンについて、そのビンに該当する成分の色を持つ画素の数を度数として持つ。また、そのビンに該当する成分の色を持つ画素の数を調査対象とした画素数で割った値を度数としてもよい。この場合、各ビンの度数は画像領域に含まれる全画素に対する割合で表され、全てのビンの度数を合計すると1になる。
マップ生成部23は、色ヒストグラム生成部22により生成された色ヒストグラムのデータを用いて、スコア値のマップ(活性化マップ)を生成する。ここで、スコア値のマップは、処理の対象となっている画像データに含まれる各画素について、当該画素の画像データ上の位置情報と、当該画素が検出しようとする手領域に含まれる度合いに関するスコア値とが対応づけられたデータである。スコア値は、画像データに含まれる各画素について、注目領域(本実施例においては、手領域)に含まれる度合いを所定の方法により算出した値である。例えば、当該画素が手領域に含まれる確率を表す尤度などに基づいてスコア値を算出できる。本実施の形態に置いては、スコア値は主として当該画素の色が画像データに撮像された人物の肌色である可能性がどの程度あるかに関する情報に基づいて算出される。
スコア値を算出する方法としては、バックプロジェクション方式や相関方式などの方法を用いることができる。具体的には、例えば以下のようにする。すなわち、まずスコア値を算出する対象となる画素の色の値を、必要に応じて色ヒストグラム生成部22が用いた色空間上の値に変換する。そして、色ヒストグラム生成部22により得られた色ヒストグラムにおいて、変換後の画素の色情報が該当するビンの度数の値を、当該画素の肌色のスコア値として設定する。
ここで、サンプル領域抽出部21が抽出した画像領域(顔領域)については、注目領域検出部25が注目領域を検出する対象からは除かれるため、スコア値の算出は行わなくともよい。この場合、当該画像領域に含まれる画素のスコア値を0とすることで、注目領域検出部25が検出する対象から除かれるようにすることができる。
また、スコア値を算出する場合に、顔領域との位置関係を考慮してもよい。すなわち、顔領域の位置や大きさ、また顔の向きの情報から、手が存在する可能性が高いと考えられる位置にある画素については、同じ肌色の色情報を持っていたとしても、手が存在する可能性が低いと考えられる位置にある画素よりもスコア値が高くなるように、スコア値の算出を行う。このようにすれば、より精度よく手領域を検出することができる。
このようにして得られたスコア値のマップは、サンプル領域抽出部21が抽出した顔領域の色情報に近い色を持つ画素が高いスコア値を持つため、検出対象となる人物の肌に係る部分を含む領域に高いスコア値を持つ画素が集まることになる。
仮領域配置部24は、マップ生成部23が生成したスコア値のマップ上に、仮領域を配置する。ここで仮領域は、手領域を検出する際にスコア値のマップ上に仮に設定される領域であり、所定の形状と大きさを与えられている。ここでは、初期の状態では、仮領域は1画素の大きさを単位として1辺が3の正方形の形状であるとする。
仮領域配置部24は、仮領域を配置する位置を、所定の条件に基づいて決定する。この場合、仮領域を配置する位置を複数個所決定してもよい。仮領域を配置する位置の決定方法としては、スコア値のマップ上の各画素のスコア値に基づいて決定する方法などがある。例えば、全画素の中から、スコア値の高い順に所定の数の画素を、仮領域の中心として決定する。
また、例えば以下のような方法により仮領域を配置する位置を決定してもよい。すなわち、所定の方法でサイズを定めた正方形の領域を用意し、この正方形の領域によってスコア値のマップ全体を走査した場合に、正方形の領域の内部に含まれる画素のスコア値の平均値が最も高くなるような位置を決定する。そして、その位置における正方形の領域の中心が仮領域の中心となるように仮領域の位置を決定する。この場合、正方形の領域の大きさを、サンプル領域抽出部21が抽出した顔領域の大きさに基づいて、例えば顔領域の大きさの0.4倍の大きさになるように設定するとよい。また、スコア値の平均値が最も高くなる位置ではなく、スコア値の平均値が高い順に所定の数だけ仮領域の位置を決定してもよい。これにより、単にスコア値の高い画素に基づいて仮領域の位置を決定する場合に比べて、手領域ではないのに高いスコア値を持つような画素によるノイズの影響を低減できる。
また、元の画像データが動画像に含まれるフレームの画像データである場合、当該フレームより時間的に前のフレームの画像データについて、既に手領域の検出を行っていれば、前のフレームで得られた手領域の位置に基づいて仮領域を配置する位置を決定してもよい。動画像の場合、前後のフレーム画像において手領域の位置が急激に変化する可能性は少ないため、この方法によれば、より手領域である可能性が高い位置に仮領域を配置することができる。
注目領域検出部25は、マップ生成部23が生成したスコア値のマップ上において、仮領域配置部24が当該スコア値のマップ上に配置した仮領域を基点として、仮領域の位置、傾き、及び形状を変化させてスコア値に関する計算を繰り返すことにより、検出する目的となる画像領域(注目領域)の候補領域を検出する。仮領域配置部24が仮領域を配置する位置を複数決定した場合は、注目領域検出部25は複数の位置のそれぞれについて候補領域を検出する処理を行う。そして、最終的に得られた1又は2以上の候補領域のうち、所定の条件を満たす候補領域を、注目領域(本実施例においては、手領域)として決定する。この場合、所定の条件を満たす候補領域が1つもない場合には、元の画像データには手領域が含まれないと判定することとしてもよい。また、事前に画像データに含まれる手領域の数が分かっている場合には、候補領域に含まれる画素のスコア値に基づいて、所定の数の候補領域を手領域として決定する。
具体的に、注目領域検出部25は、スコア値のマップの中から高いスコア値を持つ画素が集まった領域を特定することで、候補領域を検出する。以下では、注目領域検出部25が候補領域を検出する手順について、図3のフロー図に基づいて説明する。なお、以下では、図4の例に示すように、スコア値のマップ上における1画素の大きさを単位とした仮領域の中心の位置の座標を(x,y)、仮領域の1辺に平行な所定の方向(w方向)の長さをw、w方向と直交する方向(h方向)の長さをhで表す。また、w方向とスコア値のマップの縦方向とのなす角をθとする。注目領域検出部25による処理の開始前においては、(x,y)は仮領域配置部24が決定した位置である。また、仮領域は大きさ3の正方形の形状を持つので、w及びhはともに3であり、θは0であるとする。
注目領域検出部25は、まずカウンタsの値を0で初期化する(S1)。カウンタsは、仮領域配置部24が配置した1の仮領域について、仮領域の位置、傾き及び形状の全てが収束するまでS2からS10までの処理を繰り返す際の繰り返し回数を管理するための変数である。次いで、注目領域検出部25は、カウンタtの値を0で初期化する(S2)。カウンタtは、仮領域の傾き及び形状を固定した状態で、仮領域の位置が収束するまでS3からS6までの処理を繰り返す際の繰り返し回数を管理するための変数である。
次に、注目領域検出部25は、現在の仮領域について、当該仮領域に含まれる画素のスコア値の分布に基づいて、モーメントを算出する(S3)。
S3で算出するモーメントは、0次モーメントm00、1次モーメントm10及びm01、2次モーメントm20,m02及びm11である。ここで、iは画素を単位としたスコア値のマップの横方向の座標、jは縦方向の座標を表し(図4参照)、h(i,j)は座標(i,j)の画素に対応づけられたスコア値を表すとすると、モーメントの値は、以下の数式により計算される。
Figure 0004710426
ここで、計算は仮領域に含まれる画素(i,j)について行う。すなわち、各モーメントは、仮領域に含まれる全ての画素についての、スコア値h(i,j)とi,jとを含む関数値の和として算出される。
次に、注目領域検出部25は、S3で算出した0次及び1次モーメントに基づいて、仮領域のスコア値の重心を算出し、算出された重心が中心となるように仮領域の位置を変更する(S4)。具体的には、t番目の繰り返し処理における仮領域のスコア値の重心をGとし、Gの座標を(x,y)とすると、計算式
=m10/m00
=m01/m00
により仮領域のスコア値の重心を算出する。そして、算出された重心の座標が新たな仮領域の中心となるように、仮領域の位置を変更する。
続いて、注目領域検出部25は、カウンタtの値に1を加算し(S5)、所定の収束条件を満たしたか否かの判定を行う(S6)。具体的には、まずt<2であれば、まだ一度しか重心を求めて仮領域の位置を変更する処理を行っていないので、直ちにS3に戻り、新たに設定した仮領域の位置におけるモーメントの算出を行う。それ以外の場合、S4で算出した新たな仮領域の中心の位置が、S4における変更を行う前の仮領域の中心の位置に対してどれだけ離れているかにより、仮領域の位置が収束しているか否かの判定を行う。すなわち、Gt−1(S4で算出した仮領域のスコア値の重心)とGt−2(一つ前の繰り返し処理により算出した仮領域のスコア値の重心であり、S4でスコア値の重心を算出した際の仮領域の中心)との距離が、所定の閾値を下回った場合に、仮領域の位置はGt−1に収束したと判断し、繰り返し処理を終了して次のS7の処理に進む。また、カウンタtの値が所定の値を超えた場合、すなわち繰り返し回数が一定の数に達した場合にも、繰り返し処理を終了して次のS7の処理に進む。これは、最終的に仮領域の位置が収束するまでに非常に時間がかかってしまったり、仮領域の位置が収束せずに繰り返し処理が終わらなくなってしまったりする状態を避けるためである。これらの条件を満たさない場合、すなわち繰り返し回数が所定の数に達しておらず、かつGt−1とGt−2との距離が所定の閾値を下回っていない場合には、S3に戻って繰り返し処理を続行する。なお、仮領域の中心の位置がスコア値の重心の位置に収束した場合、仮領域の中心と仮領域のスコア値の重心はほぼ一致すると考えられる。
続いて、注目領域検出部25は、所定の関数によって得られた角度の値により、仮領域の傾きを変更することで、仮領域をスコア値のマップ上で回転させる(S7)。スコア値のマップに対する仮領域の傾きθは、S3で算出した0次及び2次モーメントに基づいて、以下の計算式により算出できる。
Figure 0004710426
ここで、x及びyは現在の仮領域の中心であり、S3でモーメントを算出した際の仮領域について、S4で算出したスコア値の重心の座標に該当する。
さらに、注目領域検出部25は、現在の仮領域及び仮領域の周囲の領域に含まれる画素のスコア値に基づいて、新たなw及びhの値を算出し、これによって仮領域のw方向とh方向の長さの比を変更する(S8)。
この場合、仮領域の周囲の領域のうち、仮領域に対して設定された軸方向(本実施例の場合は、w方向)上に位置する領域に含まれる画素のスコア値に基づいて、仮領域の当該軸方向の大きさを変更する。また、当該軸方向に直交する方向(本実施例の場合は、h方向)上に位置する領域に含まれる画素のスコア値に基づいて、仮領域の当該直交する方向の大きさを変更する。このように、仮領域に固定された軸方向と軸方向に直交する方向について、それぞれの方向に沿った周囲の領域のスコア値の情報に基づいてそれぞれの方向の大きさを変更する処理を繰り返すことで、検出しようとする領域が細長い形状であったとしても、少ない繰り返し回数で仮領域の形状を望ましい形状に変更することができる。これにより、仮領域の形状は早く収束し、処理時間が短縮できる。
具体的には、仮領域を取り囲む所定の領域に含まれる複数の領域について、それぞれの領域に含まれる画素のスコア値の合計値(それぞれの領域の0次モーメント)を算出し、この0次モーメントに基づいてw及びhの値を算出する。例えば、注目領域検出部25は図5に示すように、仮領域と、+w方向、−w方向、+h方向及び−h方向のそれぞれの方向に仮領域を平行移動させた領域について、0次モーメントを算出する。ここで、図5において網がけ部分により示される長方形ABCDが、S4で算出したスコア値の重心の位置を中心とした仮領域を表す。図5の例においては、注目領域検出部25が0次モーメントを算出する対象となる領域は、以下のような同じ形状の5つの矩形領域である。すなわち、長方形ABCDと、長方形ABCDを+w方向にw/2だけ平行移動させた長方形HGIJと、長方形ABCDを−w方向にw/2だけ平行移動させた長方形EFGHと、長方形ABCDを+h方向にh/2だけ平行移動させた長方形KLMNと、長方形ABCDを−h方向にh/2だけ平行移動させた長方形LPQMの、5つの長方形によって画定される領域である。
ここで、上記5つの矩形領域の0次モーメントをそれぞれM、M、M、M及びMとすると、新たな仮領域のw方向の大きさを表す値w及びh方向の大きさを表す値hは、これまでの仮領域のw方向の大きさws−1及びh方向の大きさhs−1を用いて、以下の計算式により算出できる。
Figure 0004710426
ここで、Δw及びΔhは所定の係数であり、例えばΔw=Δh=2.0などに設定する。
この式により、仮領域の±w方向の隣接領域の画素のスコア値により仮領域のw方向の大きさを変化させ、仮領域の±h方向の隣接領域の画素のスコア値により仮領域のh方向の大きさを変化させることになる。つまり、w方向及びh方向それぞれの方向の隣接領域のスコア値の情報により、wとhの変化量はそれぞれ独立に計算される。
また、S8の処理は、上述の説明とは異なる領域を隣接領域として用いることができる。例えば、図6に示すような仮領域に外接する楕円の領域について、その中に含まれる画素のスコア値によりw及びhを算出してもよい。この場合、外接する楕円の軸長を
Figure 0004710426
とすれば、楕円と仮領域に挟まれた領域A2′,A3′,A4′及びA5′の面積は(π―2)wh/8となり、全て等しくなる。これらの領域の0次モーメントをそれぞれM′,M′,M′及びM′とすると、上述の例におけるM,M,M及びMをM′,M′,M′及びM′に置き換えることで、楕円の領域を用いて新たなw及びhの値を得ることができる。また、この領域A2′,A3′,A4′及びA5′と仮領域の面積は異なるので、この影響を排除するために0次モーメントをそれぞれの面積、すなわちそれぞれの領域に含まれる画素数で割ったスコア値の平均値を0次モーメントの代わりに用いてもよい。
また、例えば、図7に示すように楕円の領域に代えて仮領域に外接するひし形の領域を用いてもよい。この場合、外接するひし形の対角線を2w,2hとすれば、ひし形と仮領域に挟まれた領域A2″,A3″,A4″及びA5″の面積はwh/4となり、全て等しくなる。これらの領域の0次モーメントをそれぞれM″,M″,M″及びM″とすれば、上述の例におけるM′,M′,M′及びM′をM″,M″,M″及びM″に置き換えることで、ひし形の領域を用いて新たなw及びhの値を得ることができる。
さらに、前述のように楕円やひし形の領域を用いる場合、仮領域に外接する楕円やひし形ではなく、仮領域を内包する楕円やひし形に含まれる領域に基づいてw及びhの変更を行ってもよい。この場合、楕円やひし形に含まれる領域を、所定の方法により仮領域に対して±w方向の領域と±h方向の領域に分割し、分割された領域のそれぞれについて0次モーメントを算出する。なお、分割された領域は互いに面積が異なってもよい。その場合、それぞれの領域の0次モーメントを当該領域の面積、すなわち当該領域に含まれる画素数で割ってスコア値の平均値を算出し、当該スコア値の平均値を用いてw及びhを算出する。
続いて、注目領域検出部25は、カウンタsの値に1を加算し(S9)、所定の収束条件を満たしたか否かの判定を行う(S10)。具体的には、まずs<2であれば、まだ一度しか仮領域の傾き、幅及び高さを変更する処理を行っていないので、直ちにS2に戻り、tを初期化し、新たに設定した仮領域の傾き、幅及び高さにおいて再度モーメントを算出して仮領域の位置を変更する処理を行う。それ以外の場合、S7で算出した新たな仮領域の傾きθ及びS8で算出した新たな仮領域の幅w、高さhが、変更を行う前の仮領域の傾き、幅及び高さと一致するか否かにより、仮領域の傾きと形状が収束しているか否かの判定を行う。θ、w、hの全てがS7及びS8の処理により変化しないか、またはそれぞれの変化量が所定の閾値を下回っていれば、仮領域の傾き及び形状は現在のθ、w及びhに収束したと判断し、繰り返し処理を終了して次のS11の処理に進む。また、カウンタsの値が所定の値を超えた場合、すなわち繰り返し回数が一定の数に達した場合にも、繰り返し処理を終了して次のS10の処理に進む。これは、最終的に仮領域の傾き及び形状が収束するまでに非常に時間がかかってしまったり、仮領域の位置が収束せずに繰り返し処理が終わらなくなってしまったりする状態を避けるためである。これらの条件を満たさない場合、すなわち繰り返し回数が所定の数に達しておらず、かつθ、w及びhのいずれかの変化量が所定の閾値を下回っていない場合には、S2に戻って繰り返し処理を続行する。
θ、w及びhの全てが収束した場合、現在の仮領域を注目領域の候補領域として決定する(S11)。すなわち、現在の仮領域のスコア値のマップ上の位置を表すx,yと、スコア値のマップ上の傾きを表すθと、w方向及びh方向の大きさを表すw,hを、候補領域のパラメタとして設定する。
以上の処理により候補領域が得られると、上述したように候補領域の中から所定の条件を満たす領域が注目領域(本実施例の場合は、手領域)として決定される。得られた手領域の情報は、人物の姿勢や状態に関する情報として記憶部12に記録され、又は他の処理に用いられる。また、処理の対象とした画像データが動画像の一部であるフレーム画像のデータであった場合、動画像データの各フレームに対して手領域を検出し、各フレームについての手領域の差分情報を得ることで、人物の手の動きを把握することが可能となる。
また、本実施の形態によれば、例えば半袖の人物を撮像して得られた画像データからは、腕の部分の肌が露出しているので、注目領域として腕に係る部分を含む腕領域が得られる。この場合、所定の条件に基づいて、得られた腕領域の一部、又は腕領域に隣接する領域を手領域として決定することができる。例えば、腕を含む領域を長方形の領域として検出した場合、長方形の長辺方向の両端のいずれかが、手に係る部分を含む領域に近いと考えられる。そのため、腕領域の位置、形状及び傾きと、顔の位置との相対関係や、腕領域の周囲の領域の色情報を用いて、手領域を画定することができる。
以上説明した本発明の実施の形態によれば、w及びhを仮領域の隣接領域のスコア値に基づいて変化させることで、縦横比の異なる領域を注目領域として検出できる。これにより、腕を含む領域など、カメラに対する位置関係によって画像データ上の形状が大きく異なるような領域を検出する際であっても、検出の精度を向上することができる。
なお、以上の説明においては、画像データに含まれる各画素についてスコア値を設定し、スコア値のマップを生成する例について説明したが、マップ生成部23が生成するスコア値のマップは、必ずしも単位領域として画素を用いなくてもよい。例えば、2×2の4画素など複数の画素の集合を単位領域として設定し、当該単位領域ごとにスコア値を設定することで、画素ごとにスコア値を設定した場合に比較してより粗い情報量を持つスコア値のマップが得られる。このスコア値のマップに対して、仮領域配置部24及び注目領域検出部25が手領域を検出することで、検出される手領域の精度は落ちるものの、より少ない計算量で手領域を検出することができる。
また、上記説明においては、まず顔領域をサンプル領域抽出部21が抽出し、得られた顔領域に含まれる画素から色ヒストグラム生成部22が色ヒストグラムを生成したが、本発明の実施の形態はこのような形態に限られない。すなわち、色ヒストグラムは予め所定の肌色の色分布として与えられていてもよいし、過去の手領域を検出する処理によって得られた学習データを用いてもよい。また、動画像に含まれる各フレームの画像データから手領域を検出する場合、以前のフレームの画像データに対して色ヒストグラム生成部22が生成した色ヒストグラムを用いてスコア値のマップを生成することとしてもよい。
また、本発明を手領域の検出に用いる場合、着衣(例えば半袖・長袖)に関わらず手領域を抽出することができ、さらに検出された手領域の画像データに対し、ジェスチャ認識に有効な指の領域抽出を組合せることにより、本発明を更に有効に適用できるようになる。
本発明の実施の形態に係る画像処理装置の構成を表すブロック図である。 本発明の実施の形態に係る画像処理装置の機能を表す機能ブロック図である。 本発明の実施の形態に係る画像処理装置によって実行される処理の一例を示すフロー図である。 本発明の実施の形態に係る画像処理装置によって生成される、スコア値のマップの一例を表す図である。 注目領域検出部25による処理の対象となる、仮領域の隣接領域の一例を表す図である。 注目領域検出部25による処理の対象となる、仮領域の隣接領域の別の一例を表す図である。 注目領域検出部25による処理の対象となる、仮領域の隣接領域の別の一例を表す図である。
符号の説明
10 画像処理装置、11 制御部、12 記憶部、13 操作部、14 表示部、15 撮像部、21 サンプル領域抽出部、22 色ヒストグラム生成部、23 マップ生成部、24 仮領域配置部、25 注目領域検出部、31 スコア値のマップ、32 仮領域。

Claims (6)

  1. 対象物の少なくとも一部を撮像して生成された画像データについて、当該画像データの中から対象物の少なくとも一部を含む注目領域を検出する画像処理装置であって、
    前記画像データに含まれる単位領域のそれぞれについて、当該単位領域の画像データ内における位置に、当該単位領域が前記注目領域に含まれる度合いに関するスコア値が対応づけられたスコア値のマップを取得するマップ取得手段と、
    矩形形状を有する仮領域を、前記スコア値のマップ上の所定の条件に基づいて決定した位置に配置する仮領域配置手段と、
    前記仮領域の外周を構成する各辺に接するように前記仮領域に隣接する複数の隣接領域に含まれる単位領域のスコア値に基づいて、前記仮領域の一辺に沿った方向に隣接する隣接領域に含まれる単位領域のスコア値が大きい場合には、前記一辺の長さを大きくし、前記一辺に直交する辺に沿った方向に隣接する隣接領域に含まれる単位領域のスコア値が大きい場合には、前記直交する辺の長さを大きくするように前記仮領域の各辺の長さを変更する処理、及び、前記スコア値の分布に基づいて、前記仮領域を前記スコア値のマップ上で回転させる処理を少なくとも含む前記仮領域の更新処理を繰り返し実行し、所定の条件を満たした際における前記仮領域を前記注目領域として決定し、その結果を出力する注目領域検出手段と、
    を含むことを特徴とする画像処理装置。
  2. 請求項1に記載の画像処理装置において
    記隣接領域は、前記仮領域の4辺のそれぞれに隣接する4つの矩形領域からなることを特徴とする画像処理装置。
  3. 請求項1に記載の画像処理装置において
    記隣接領域は前記仮領域を内包又は外接する楕円又はひし形に含まれる領域であることを特徴とする画像処理装置。
  4. 請求項1乃至のいずれか一項に記載の画像処理装置において、
    前記仮領域配置手段は、前記仮領域を、前記スコア値のマップに含まれる単位領域の位置とスコア値に基づいて決定した位置に配置することを特徴とする画像処理装置。
  5. コンピュータを用いて、対象物の少なくとも一部を撮像して生成された画像データについて、当該画像データの中から対象物の少なくとも一部を含む注目領域を検出する画像処理方法であって、
    前記画像データに含まれる単位領域のそれぞれについて、当該単位領域の画像データ内における位置に、当該単位領域が前記注目領域に含まれる度合いに関するスコア値が対応づけられたスコア値のマップを取得するステップと、
    矩形形状を有する仮領域を、前記スコア値のマップ上の所定の条件に基づいて決定した位置に配置するステップと、
    前記仮領域の外周を構成する各辺に接するように前記仮領域に隣接する複数の隣接領域に含まれる単位領域のスコア値に基づいて、前記仮領域の一辺に沿った方向に隣接する隣接領域に含まれる単位領域のスコア値が大きい場合には、前記一辺の長さを大きくし、前記一辺に直交する辺に沿った方向に隣接する隣接領域に含まれる単位領域のスコア値が大きい場合には、前記直交する辺の長さを大きくするように前記仮領域の各辺の長さを変更する処理、及び、前記スコア値の分布に基づいて、前記仮領域を前記スコア値のマップ上で回転させる処理を少なくとも含む前記仮領域の更新処理を繰り返し実行し、所定の条件を満たした際における前記仮領域を前記注目領域として決定し、その結果を出力するステップと、
    を含むことを特徴とする画像処理方法。
  6. コンピュータに、対象物の少なくとも一部を撮像して生成された画像データについて、当該画像データの中から対象物の少なくとも一部を含む注目領域を検出させる画像処理プログラムであって、
    前記画像データに含まれる単位領域のそれぞれについて、当該単位領域の画像データ内における位置に、当該単位領域が前記注目領域に含まれる度合いに関するスコア値が対応づけられたスコア値のマップを取得するステップと、
    矩形形状を有する仮領域を、前記スコア値のマップ上の所定の条件に基づいて決定した位置に配置するステップと、
    前記仮領域の外周を構成する各辺に接するように前記仮領域に隣接する複数の隣接領域に含まれる単位領域のスコア値に基づいて、前記仮領域の一辺に沿った方向に隣接する隣接領域に含まれる単位領域のスコア値が大きい場合には、前記一辺の長さを大きくし、前記一辺に直交する辺に沿った方向に隣接する隣接領域に含まれる単位領域のスコア値が大きい場合には、前記直交する辺の長さを大きくするように前記仮領域の各辺の長さを変更する処理、及び、前記スコア値の分布に基づいて、前記仮領域を前記スコア値のマップ上で回転させる処理を少なくとも含む前記仮領域の更新処理を繰り返し実行し、所定の条件を満たした際における前記仮領域を前記注目領域として決定し、その結果を出力するステップと、
    を前記コンピュータに実行させることを特徴とする画像処理プログラム。
JP2005174409A 2005-06-14 2005-06-14 画像処理装置、画像処理方法及び画像処理プログラム Active JP4710426B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005174409A JP4710426B2 (ja) 2005-06-14 2005-06-14 画像処理装置、画像処理方法及び画像処理プログラム
US11/338,807 US7602943B2 (en) 2005-06-14 2006-01-25 Image processing apparatus, image processing method, and image processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005174409A JP4710426B2 (ja) 2005-06-14 2005-06-14 画像処理装置、画像処理方法及び画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2006350575A JP2006350575A (ja) 2006-12-28
JP4710426B2 true JP4710426B2 (ja) 2011-06-29

Family

ID=37523845

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005174409A Active JP4710426B2 (ja) 2005-06-14 2005-06-14 画像処理装置、画像処理方法及び画像処理プログラム

Country Status (2)

Country Link
US (1) US7602943B2 (ja)
JP (1) JP4710426B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7920717B2 (en) * 2007-02-20 2011-04-05 Microsoft Corporation Pixel extraction and replacement
JP4877810B2 (ja) * 2007-04-02 2012-02-15 株式会社国際電気通信基礎技術研究所 物体の視覚的表現を学習するための学習システム及びコンピュータプログラム
KR101549824B1 (ko) * 2008-12-11 2015-09-03 삼성전자주식회사 피부색 보정 방법 및 장치, 이를 이용한 디지털 촬영 장치
JP5557091B2 (ja) * 2010-03-30 2014-07-23 日本電気株式会社 画像処理装置、画像読取装置、画像処理方法及び画像処理プログラム
CN103221977B (zh) * 2010-12-09 2015-10-14 松下电器产业株式会社 姿势状态估计装置及姿势状态估计方法
JP6346576B2 (ja) * 2015-02-27 2018-06-20 Hoya株式会社 画像処理装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05126531A (ja) * 1990-07-23 1993-05-21 Toshiba Eng Co Ltd 検査装置
JPH06333025A (ja) * 1993-05-27 1994-12-02 Sanyo Electric Co Ltd ウインドウサイズ決定方法
US6363160B1 (en) * 1999-01-22 2002-03-26 Intel Corporation Interface using pattern recognition and tracking
JP2003303346A (ja) * 2002-04-09 2003-10-24 Nippon Telegr & Teleph Corp <Ntt> 目標追跡方法、目標追跡装置、目標追跡プログラム、並びにこのプログラムを記録した記録媒体

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05126531A (ja) * 1990-07-23 1993-05-21 Toshiba Eng Co Ltd 検査装置
JPH06333025A (ja) * 1993-05-27 1994-12-02 Sanyo Electric Co Ltd ウインドウサイズ決定方法
US6363160B1 (en) * 1999-01-22 2002-03-26 Intel Corporation Interface using pattern recognition and tracking
JP2003303346A (ja) * 2002-04-09 2003-10-24 Nippon Telegr & Teleph Corp <Ntt> 目標追跡方法、目標追跡装置、目標追跡プログラム、並びにこのプログラムを記録した記録媒体

Also Published As

Publication number Publication date
US20060279800A1 (en) 2006-12-14
US7602943B2 (en) 2009-10-13
JP2006350575A (ja) 2006-12-28

Similar Documents

Publication Publication Date Title
JP7094702B2 (ja) 画像処理装置及びその方法、プログラム
JP3863809B2 (ja) 手の画像認識による入力システム
JP4372051B2 (ja) 手形状認識装置及びその方法
US8542928B2 (en) Information processing apparatus and control method therefor
CN110349082B (zh) 图像区域的裁剪方法和装置、存储介质及电子装置
CN110443205B (zh) 一种手部图像分割方法及装置
JP2021517330A (ja) 画像中の物体を識別するための方法、及び当該方法を実施するためのモバイル装置
JP5762730B2 (ja) 人検出装置および人検出方法
JP5505409B2 (ja) 特徴点生成システム、特徴点生成方法および特徴点生成プログラム
JP4710426B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
US20080219516A1 (en) Image matching apparatus, image matching method, computer program and computer-readable storage medium
WO2017198749A1 (en) Image processing apparatus and method
WO2021098147A1 (zh) Vr体感数据检测方法、装置、计算机设备及存储介质
JP6728865B2 (ja) 手上げ検出装置及び手上げ検出プログラム
CN112348958A (zh) 关键帧图像的采集方法、装置、***和三维重建方法
JP2003178303A (ja) 物体認識装置
JP2010113530A (ja) 画像認識装置及びプログラム
JP6661082B2 (ja) 画像認識装置、及び画像認識プログラム
JP5747695B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP2006343989A (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP2023082065A (ja) ユーザのバイオメトリック特性を有する画像中の物体を識別して、画像のうちバイオメトリック特性を含む部分を他の部分から分離することにより当該ユーザのidを検証するための方法
JP2009237627A (ja) 画像処理方法、画像処理装置、画像処理プログラムおよび印刷装置
JP5051671B2 (ja) 情報処理装置、情報処理方法およびプログラム
JP6717049B2 (ja) 画像解析装置、画像解析方法およびプログラム
JP2022518036A (ja) ユーザのバイオメトリック特性を有する画像中の物体を識別することにより当該ユーザのidを検証するための方法、及び当該方法を実施するためのモバイル装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080317

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101026

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101207

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110204

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110222

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110307