JP2008061209A - 画像処理方法 - Google Patents
画像処理方法 Download PDFInfo
- Publication number
- JP2008061209A JP2008061209A JP2006239111A JP2006239111A JP2008061209A JP 2008061209 A JP2008061209 A JP 2008061209A JP 2006239111 A JP2006239111 A JP 2006239111A JP 2006239111 A JP2006239111 A JP 2006239111A JP 2008061209 A JP2008061209 A JP 2008061209A
- Authority
- JP
- Japan
- Prior art keywords
- image
- region
- candidate
- spatial frequency
- size
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Analysis (AREA)
- Processing Of Color Television Signals (AREA)
- Studio Devices (AREA)
Abstract
【課題】画像データから所望の特徴領域を、画像補正に使用するために、効率よく検出すること。
【解決手段】所望の特徴領域に関連付けて予め設定された色度に関する範囲に基づいて、圧縮ブロック単位ごとに予め定めた色度と比較して、予め定めた色度を有するとされた候補領域を決定し、互いに隣接する複数の候補ブロックから構成される1つあるいは複数の候補画像領域のサイズを求め、候補画像領域内の各圧縮ブロックに対して、画像サイズ情報と候補領域サイズにより予め定められる空間周波数に関する範囲に基づいて、特徴領域内の圧縮ブロック単位ごとの空間周波数成分の分布あるいは量を検査して、予め定めた空間周波数の分布あるいは量を有すると見なされるブロックを決定し、決定した圧縮ブロックから構成される領域を所望の特徴領域とした領域データを作成する。さらに最終的な領域データのサイズに基づく空間周波数範囲からの絞り込みを、実行可能である。
【選択図】図6
【解決手段】所望の特徴領域に関連付けて予め設定された色度に関する範囲に基づいて、圧縮ブロック単位ごとに予め定めた色度と比較して、予め定めた色度を有するとされた候補領域を決定し、互いに隣接する複数の候補ブロックから構成される1つあるいは複数の候補画像領域のサイズを求め、候補画像領域内の各圧縮ブロックに対して、画像サイズ情報と候補領域サイズにより予め定められる空間周波数に関する範囲に基づいて、特徴領域内の圧縮ブロック単位ごとの空間周波数成分の分布あるいは量を検査して、予め定めた空間周波数の分布あるいは量を有すると見なされるブロックを決定し、決定した圧縮ブロックから構成される領域を所望の特徴領域とした領域データを作成する。さらに最終的な領域データのサイズに基づく空間周波数範囲からの絞り込みを、実行可能である。
【選択図】図6
Description
本発明は画像認識方法に関し、より詳細には、画像圧縮単位による空間周波数成分と色度を利用した画像データ中における所望の特徴領域を抽出する画像処理方法に関する。
写真撮影における一般的な問題として、シャッター速度やピント調節の問題を別にしても、と、色露出の問題、コントラスト(ラチェード)の問題、色温度の問題、色かぶりの問題が存在する。このような問題は、近年普及してきたデジタル・カメラなどでも同様に存在する。
そこで、従来のフィルム・カメラでは困難であったこれらの問題を、近年普及してきたデジタル・カメラにおいては、その特徴を生かして、良い画像の定義を行い、その定義に沿った、処理も可能になっている。たとえば、色温度対策としてのホワイト・バランス補正や、露出/コントラスト補正を自動で行うアプリケーションも一般的になってきている。また、従来のフィルム写真では不可能であったが、デジタル・カメラでは、これらの問題は後処理の問題としても存在し、さらに輪郭補正やガンマ補正等の問題も存在する。
但し、このようなホワイト・バランス補正や、露出/コントラスト補正が撮影時に自動的に行われるデジタル・カメラであっても、撮影される環境は千差万別であり、必ずしもユーザにとっては適正に補正されていると言えない撮影画像は存在してしまう。その理由としては、良い画像というものは、画像全体の上記のようなバランスとは別に、画像の中の観察者が着目する被写体が、ユーザがイメージするような画像でなっているか?に応じて判断されるからである。このような判断処理は、撮像画像ごとに異なるのが普通であり、このような複雑な処理をデジタル・カメラでは実行することができない。可能なのは全てに通用する処理のみである。しかしながら、デジタル・カメラではユーザのこのような好みに合わせるように色々な撮影モードが設けられているが、そのような操作を撮影の度に行うことは煩雑であり、一挙動作で設定することができないのが通常である。したがって、そのような適切な撮影モードで撮像されることが少なく、またそのような撮影モードを良好な撮影画像とすることができるが、撮影したもの全てを良好な画像とすることはできない。
また、良い画像の条件の1つとして、画像中にはユーザが着目する重要な領域が存在する場合があり、その領域の状態が良く絵作りされていることが挙げられる。反対にそのような領域の状態が良く絵作りされていないと不満の残る画像となってしまう。このような一般的に、ユーザが着目する重要な領域としては、たとえば、人の顔や肌の部分などがある。
従来においても、たとえば、放送局が使用するようなテレビジョン・カメラ(スタジオカメラ)においては、撮像した信号中の人の肌色部分を検出して、その部分の輪郭補正を弱めることが行われている。これは、肌色部分の僅かのレベル変化が輪郭補正(あるいはアパーチャー補正)で強調されないようにするためである。
また、テレビジョン受信装置においても、受信した映像信号の色差信号から、1フレーム中の肌色部分の面積を検出して、その領域を人物肌領域として、輝度補正の目標設定値として利用し、ガンマ補正回路制御信号を作成することで、視聴者が映像の状態に応じた最適な映像信号補正状態でのテレビジョンの視聴を可能とすることも行われている(たとえば、特許文献1を参照)。
また、撮像済みの画像を後処理するにあたり、圧縮記録された画像データから所定のブロックごとに空間周波数情報と色度情報とを取得して、これを画像データ中の注目画像の検索のために利用することも行われている(たとえば特許文献2を参照)。この場合、まず、まず交流周波数成分から特徴部分が検出され、次に検出した特徴部分に対して色度の特徴部分が検出されている。
本発明は、デジタル・カメラなどの入力機器で撮影した画像(Jpeg画像など)を、たとえば、パーソナル・コンピュータを介して、あるいはダイレクトに(たとえば、インクジェット方式の)プリンタ等でプリントしようとする場合に、対処する。従来の銀塩写真では、現像されたネガフィルムに対して手操作が加えられた露光量を使用して印画紙に焼き付けられて、いわゆるプリントが作成されていた。すなわち、撮像した状態そのままでなく、少なくとも明るさ(輝度)(場合によっては色温度)に対する変更が、人手により適切に加えられてプリントが作成されていた。言い換えれば、撮像時のバラツキなどが、適切に補正されていた。しかしながら、デジタル・カメラなどの場合、撮像したデータを処理せずにプリントすることが可能である。この場合、撮像時のバラツキなどが適切に補正されないまま、プリントすることになり、同じようなシーンを撮像した場合でも、プリントされた結果は、銀塩写真とデジタル・カメラなどで異なることになる。この場合、適切に補正された銀塩写真のプリントと比較すると、デジタル・カメラなどプリント結果は適切な補正がされない分、よいプリントとは評価されないことになる。
したがって、銀塩写真のプリントのように、デジタル・カメラなどの入力機器で撮影した画像中の人物などの注目画像が、より良くプリントできるように必要に応じて補正を行うことを可能にする必要がある。銀塩写真の場合には、印画紙への露光量を調節することで明るさを、また光源に適切な色温度変換フィルタを入れることで色温度を調節することが可能である。しかし、デジタル・カメラなどの入力機器で撮影した画像の場合は、この補正は、画像データそのものを、その画像データに応じて加工することで実現される。したがって、補正を行うためには、画像中の注目画像を見つけ出し、その注目画像部分のデータに基づいて補正処理を実行することが求められる。
また、デジタル・カメラからプリンタへ直接プリントを行うダイレクト・プリントなどのデータ処理能力の低いシステム構成でも使用できるように、この注目画像の検出処理は、できるだけその処理負荷が軽く済む方法が求められる。
この時に撮影データの中に人物など注目画像の有無の検出として人物の肌領域の検出を行う場合において、領域検出プロセスの中に、色度もしくは色度比率などの色成分による判定を加えている場合がある。また、その色度判定を行う場合、検出の対象として定義した色度は人の肌の色度分布より定義されたものである。また、検出対象の撮影データにおける被写体そのものの色度には差があり、さらに、撮影時の光源状態により、その被写体を撮像した結果としての画像の色度が影響を受けることとがわかっている。
この場合、画一の色度代表によるグループ検出処理だと、抽出領域が色度判定の結果により完全には検出できない、もしくは、同じ色相の対象外の領域を含んでしまい、抽出対象の検出が、不完全になる問題があった。
本発明は、上記問題点を、比較的、データ処理能力に制限があるような装置に置いて、注目画像の領域を効率よく、比較的正確に検出する方法を提供することを目的とする。言い換えれば、注目画像の領域を検出することによってし、その部分に対して適切な補正ができるようにする画像処理方法を提供することを目的とする。
本発明は、このような目的を達成するために、請求項1に記載の発明は、空間周波数成分、色度、および画像サイズ情報を有する圧縮画像データを入力して、当該画像データの中に、所望の特徴領域が存在するか否かと存在する場合に当該特徴領域を検出する画像処理方法であって、前記所望の特徴領域に関連付けて予め設定された色度に関する範囲に基づいて、前記圧縮画像データを圧縮ブロック単位ごとに検査し、圧縮ブロック単位ごとに予め定めた色度を有するか否かを判定して、予め定めた色度を有すると見なされる候補ブロックから構成される候補領域を決定する第1のステップと、互いに隣接する複数の前記候補ブロックから構成される1つあるいは複数の候補画像領域のサイズを求める第2のステップと、前記候補画像領域内の圧縮ブロックそれぞれに対して、前記画像サイズ情報と前記候補画像領域サイズにより予め定められる空間周波数に関する範囲に基づいて、前記候補画像領域内の圧縮ブロック単位ごとの空間周波数成分の分布あるいは量を検査して、予め定めた空間周波数の分布あるいは量を有すると見なされる圧縮ブロックを決定する第3のステップと、前記第3のステップで決定した圧縮ブロックから構成される領域を所望の特徴領域とした領域データを作成するステップとを備えることを特徴とする。
また、請求項2に記載の発明は、請求項1に記載の画像処理方法であって、互いに隣接する複数の前記候補ブロックから構成される1つあるいは複数の候補画像領域のサイズを求める第2のステップは、前記複数の候補画像領域のうちの最大の領域のサイズを求めることを含み、前記第3のステップは、前記画像サイズと前記最大の領域のサイズにより予め定められる空間周波数に関する範囲に基づくことを特徴とする。
また、請求項3に記載の発明は、請求項1又は2に記載の画像処理方法であって、前記第3のステップによって決定された領域のサイズを検出して、当該サイズと前記画像サイズにより予め定められる空間周波数に関する範囲に基づいて、前記候補画像領域内の圧縮ブロックそれぞれの空間周波数成分の分布あるいは量を検査して、予め定めた空間周波数の分布あるいは量を有すると見なされる圧縮ブロックを決定する第4のステップをさらに備え、前記所望の特徴領域とした領域データを作成するステップは、前記第4のステップで決定した圧縮ブロックから構成される領域を所望の特徴領域とした領域データを作成することを特徴とする。
また、請求項4に記載の発明は、請求項1又は2に記載の画像処理方法であって、前記第3のステップによって決定された領域内の空間周波数の頻度分布を調べて、当該頻度分布の上限と下限とが延長された範囲を新たな空間周波数適合値とする領域で、内部に前記ステップ3で決定された領域を含む領域を設定する第5のステップと、前記第5のステップで設定された領域について、前記所望の特徴領域に関連付けて予め設定された色度に関する範囲よりも拡大された範囲に基づいて、前記圧縮画像データを圧縮ブロック単位ごとに検査し、圧縮ブロック単位ごとに前記拡大され範囲の色度を有するか否かを判定して、有すると見なされる候補領域を決定する第6のステップと、前記第6のステップで決定された互いに隣接する複数の前記候補ブロックから構成される1つあるいは複数の候補画像領域のサイズを求める第7のステップと、前記前記第6のステップで決定された候補画像領域内の圧縮ブロックそれぞれに対して、前記画像サイズ情報と前記候補画像領域サイズにより予め定められる空間周波数に関する情報に基づいて、前記特徴領域内の圧縮ブロック単位ごとの空間周波数成分の分布あるいは量を検査して、予め定めた空間周波数の分布あるいは量を有すると見なされるブロックを決定する第8のステップとをさらに備え、前記所望の特徴領域とした領域データを作成するステップは、前記第8のステップで決定した圧縮ブロックから構成される領域を所望の特徴領域とした領域データを作成することを特徴とする。
また、請求項5に記載の発明は、請求項1に記載の画像処理方法であって、前記第1のステップは、予め定めた色度を有して特徴領域と見なされる候補ブロックを検出しない場合、および予め定めた色度を有して特徴領域と見なされる候補ブロックの互いに隣接ブロックから構成される1つあるいは複数の領域の最大のサイズが、予め定めたサイズよりも小さい場合、検出不成功を表すデータを出力し、前記第3のステップは、予め定めた空間周波数の分布あるいは量を有すると見なされるブロックを検出しない場合、および予め定めた空間周波数の分布あるいは量を有すると見なされる候補ブロックの互いに隣接ブロックから構成される1つあるいは複数の領域の最大のサイズが、予め定めたサイズよりも小さい場合、検出不成功を表すデータを出力し、前記領域データを作成するステップは、前記何れかの検出不成功を表すデータを入力した場合に、ヌル値を出力することを特徴とする。
また、請求項6に記載の発明は、請求項1に記載の画像処理方法であって、前記第3のステップは、前記圧縮画像データの前記画像サイズ情報とファイル・サイズおよび前記候補画像領域サイズにより予め定められる空間周波数に関する範囲に基づくことを特徴とする。
また、請求項7に記載の発明は、請求項1〜5の何れかに記載の画像処理方法であって、前記所望の特徴領域は、少なくとも人物の肌領域を含むことを特徴とする。
請求項8に記載の発明は、プログラムであって、空間周波数成分、色度、および画像サイズ情報を有する圧縮画像データを入力して、当該画像データの中に、所望の特徴領域が存在するか否かと存在する場合に当該特徴領域を検出するために、コンピュータに、前記所望の特徴領域に関連付けて予め設定された色度に関する範囲に基づいて、前記圧縮画像データを圧縮ブロック単位ごとに検査し、圧縮ブロック単位ごとに予め定めた色度を有するか否かを判定して、予め定めた色度を有すると見なされる候補ブロックから構成される候補領域を決定する第1のステップと、互いに隣接する複数の前記候補ブロックから構成される1つあるいは複数の候補画像領域のサイズを求める第2のステップと、前記候補画像領域内の圧縮ブロックそれぞれに対して、前記画像サイズ情報と前記候補領域サイズにより予め定められる空間周波数に関する範囲に基づいて、前記候補画像領域内の圧縮ブロック単位ごとの空間周波数成分の分布あるいは量を検査して、予め定めた空間周波数の分布あるいは量を有すると見なされる圧縮ブロックを決定する第3のステップと、前記第3のステップで決定した圧縮ブロックから構成される領域を所望の特徴領域とした領域データを作成するステップとを実行させることを特徴とする。
また、請求項9に記載の発明は、コンピュータ読み取り可能記録媒体であって、請求項8に記載のプログラムを記録したことを特徴とする。
上記構成を有する本発明は、画像全体をみての画像補正では画質を良好に補正できない撮影画像データに対して、補正のために、所望の特徴領域を表すデータを作成することができ、その検出した特徴領域結果を補正に反映させることを可能にする。この補正にあたり、個別に必要に応じた特徴領域の抽出を、その撮影画像データに関連付けて精度良く行う判定手段を提供することを可能とするので、画像中の特徴領域の特性把握を正確に行うことできるようになる。また、その検出した特徴領域結果を補正処理に反映させることで、最終的に、撮影画像データに対して個別に良好な画像補正を実現することを可能とする。特に、抽出した対象領域に限定したフィルタ処理を実施する場合は、領域検出の精度が高い程効果があり、本発明の方法は、この高精度の領域検出に使用することができる。
(第1の実施形態)
以下、図面を参照して本発明の実施形態について説明する。
以下、図面を参照して本発明の実施形態について説明する。
通常、デジタル・カメラやデジタル・ビデオなどでは、静止画をJpegファイルにて保存することが一般的になっている。したがって、まず、現在、最も一般的な画像圧縮ファイルの“Jpeg file”における情報省略と符号化・復号化について、説明する。
(圧縮符号化の説明)
デジタル・カメラやデジタル・ビデオなどでは、撮像対象の画像は、RGBもしくはCMYフィルタを介して、入力機器の受光素子であるCCDなどに入る。入射した光信号を、電気信号として読み出してA/D変換し、フレーム・メモリに取り込む。次にこの情報を輝度と色度情報の2次元データ(ビットマップ)に変換する。その後、各2次元データ(ビットマップ)を8*8(64個)の画素からなる複数の正方画素ブロックに分割する。
デジタル・カメラやデジタル・ビデオなどでは、撮像対象の画像は、RGBもしくはCMYフィルタを介して、入力機器の受光素子であるCCDなどに入る。入射した光信号を、電気信号として読み出してA/D変換し、フレーム・メモリに取り込む。次にこの情報を輝度と色度情報の2次元データ(ビットマップ)に変換する。その後、各2次元データ(ビットマップ)を8*8(64個)の画素からなる複数の正方画素ブロックに分割する。
図1は、符号化の例を示しており、(1)で示す表は、輝度データのビットマップを、複数の8*8ブロックに分割したうちの1ブロックのデータ例を示している。各マス目内の数値は、8ビットで表された輝度値の10進表現の例を示している。(2)に示す表は、(1)に示す表の0〜255の画素値をレベル・シフトして−128〜127の信号に変換した後の値を示している。さらに、(3)に示す表は、(2)に示す表をDCT(離散コサイン変換)した結果のDCT係数の各係数値を示している。また、(4)に示す表は、視覚特性を考慮した量子化テーブルの例であり、高周波成分の省略を大きくした量子化テーブルの例を示している。この量子化テーブルを用いて、上記(3)に示すDCT係数に対して量子化を行うことになる。また、(5)に示す表は、量子化を行った結果の例を示している。この値をエントロピー符号化してハフマン符号で表すことにより符号化信号である圧縮データを生成する。
次に、復号化においては、符号化の逆の工程を行う。圧縮データに対してエントロピー符号化の逆を実行して、量子化DCT係数の値を得る。次に、逆量子化を行うために量子化テーブルを乗ずることでDCT係数を得る。その後、逆DCTを行うことでレベル・シフトした画像が復元され、さらに逆レベル・シフトの値128を加算することで1ブロックの画像に復号される。この復号されたデータは、図1の(1)で示すようなデータである。
図2は、図1の(3)に示すDCT変換後の係数データ配置のイメージを表したものである。“0”で示す部分は、直流(DC)成分のデータであり、“1〜63”で示す部分は、交流(AC)成分のデータであり、若い番号は空間周波数成分の低い部分を表している。この順序付けは、通常、ジグザグスキャンと呼ばれる、係数のスキャン順序を示している。他の順序付けの方法も使用することができるけれども、以後においては、係数値の周波数分布を表現する場合、この係数順を使用するものとする。
(システムの構成)
図3は、本発明の第1の実施形態による画像処理方法を、実装したり、あるいは実施したりすることができるシステムの構成を示す概略ブロック図である。図3に示すように、本実施形態の方法を実装するシステムは、限定されないが、いわゆるパーソナル・コンピュータの構成を有することができる。具体的には、このシステムは、データが入出力される入出力ポート51と、ポインティング・デバイスであるマウス52と、数値や文字等を入力するキーボード53と、種々の表示を行うためのモニタ54とを備える。また、装置全体の動作を制御する制御部55と、メモリ・カードに記録された画像データを読み出すメモリ・カード・ドライブ56と、データやプログラムを記憶するハードディスク57と、各部を接続するバス58とを備える。
図3は、本発明の第1の実施形態による画像処理方法を、実装したり、あるいは実施したりすることができるシステムの構成を示す概略ブロック図である。図3に示すように、本実施形態の方法を実装するシステムは、限定されないが、いわゆるパーソナル・コンピュータの構成を有することができる。具体的には、このシステムは、データが入出力される入出力ポート51と、ポインティング・デバイスであるマウス52と、数値や文字等を入力するキーボード53と、種々の表示を行うためのモニタ54とを備える。また、装置全体の動作を制御する制御部55と、メモリ・カードに記録された画像データを読み出すメモリ・カード・ドライブ56と、データやプログラムを記憶するハードディスク57と、各部を接続するバス58とを備える。
モニタ54としては、たとえば液晶モニタ、CRTモニタ、ELディスプレイ、プラズマ・ディスプレイ、テレビジョン受像機を用いることができる。さらに、マウス52、キーボード53およびモニタ54の各機能を備えた、いわゆるタッチ・パネルを用いてもよい。
制御部55は、マウス52やキーボード53からの入力に基づいて、入出力ポート51もしくは、メモリ・カード・ドライブ56において読み出された画像データに対する各種処理を行う。
本実施形態においては、本発明の画像処理をパーソナル・コンピュータ(PC)に実装するとして説明を行う。しかし、画像を扱うものであれば、画像を扱うマルチ・ファンクション・プリンタやフォト・ダイレクト・プリンタなどノンPCの組み込み機器や携帯電話など画像を扱う機器においても同様に実装することができる。
(全体的な処理)
図4は、たとえばPC上で行われる、本発明を適用した補正処理を実行する場合の、全体の処理の流れを示している。この処理には、たとえば撮影データの中に人物など注目画像の有無の検出として人物の肌領域の検出を行い、検出した人物の肌領域とそれ以外の部分に分けた輪郭補正や、また、検出した人物の肌領域の着目した明るさ補正やガンマ補正などを含むことができる。
図4は、たとえばPC上で行われる、本発明を適用した補正処理を実行する場合の、全体の処理の流れを示している。この処理には、たとえば撮影データの中に人物など注目画像の有無の検出として人物の肌領域の検出を行い、検出した人物の肌領域とそれ以外の部分に分けた輪郭補正や、また、検出した人物の肌領域の着目した明るさ補正やガンマ補正などを含むことができる。
まず、S401ステップにおいては、入出力ポート51もしくは、メモリ・カード・ドライブ56において読み出された撮像後の画像データ、及びハードディスク57に保存している画像データをマウス52やキーボード53からの入力に基づいて読み込む。
次のS402ステップは、本発明による特徴領域抽出処理を実行するステップであり、ここでは、予め設定されている特徴を有する特徴領域、すなわち注目画像の領域を抽出する処理を実行する。
次のS403ステップにおいては、S402ステップにおける特徴領域が検出されたか否か、あるいは注目画像領域が存在したか否かが判定される。特徴領域が検出された場合、あるいは注目画像領域が存在する場合、たとえば、特徴領域が有意量存在するとした場合、その有意量が存在する領域に対して、S404ステップで、その画像の補正目標値を決定する。たとえば、輝度補正の場合、その特徴領域の最終的な輝度を決定する。補正目標値の決定後、その補正目標値を使用して、S405ステップで画像補正処理、たとえば輝度補正を実行することになる。S403ステップで、有意量の特徴領域が検出できなかったと判定した場合は、S406ステップで、通常の画像補正処理を実行することになる。
S405ステップでは、たとえば、輝度補正の場合、通常の補正処理における特徴領域の輝度補正値が、補正目標値となるように補正値の置き換えを行った後に、画像補正を実行する。言い換えれば、通常の補正処理は、たとえば全体または中央部を重点的にみて補正量を設定するが、本発明においては、特徴領域の補正値が補正目標値となるように、画像全体を補正することになる。また、S405の補正処理が輪郭補正のような場合で、しかも特徴領域が人物の肌領域の場合は、特徴領域に対しては輪郭補正をせず、あるいは弱めた輪郭補正を実行し、その他の領域に対しては、通常のあるいは設定した輪郭補正をすることになる。
(特徴領域抽出処理)
本発明のキーとなる、特徴領域抽出処理の実施形態として、注目画像が、たとえば人物画像で、特徴領域の定義として画像中の主要な人物の肌領域である場合についてフローチャートを基に説明する。図5は、本願発明に係わる、画像データからの特徴領域の抽出処理の概要を説明するフローチャートである。この抽出処理は、図4では、S402ステップの処理を表している。
本発明のキーとなる、特徴領域抽出処理の実施形態として、注目画像が、たとえば人物画像で、特徴領域の定義として画像中の主要な人物の肌領域である場合についてフローチャートを基に説明する。図5は、本願発明に係わる、画像データからの特徴領域の抽出処理の概要を説明するフローチャートである。この抽出処理は、図4では、S402ステップの処理を表している。
図5のS501ステップで、図4のS401ステップから入力した画像データに対して、Jpeg画像の圧縮単位である8*8画素ブロックを単位とした、設定された色度比率(たとえば、RGBの各比率)に基づく抽出を、まず実行する。この色度判定処理について詳細に説明する。
(色度判定処理)
本実施形態における色度判定は、Jpeg画像の画像圧縮単位である8*8画素のそれぞれに対して行われる。ここで、本発明の実施形態を説明するにあたり、最も利用が考えられる特徴領域として人物で、しかも人物の肌部分として説明する。したがって、色度判定の実施形態として、人物肌の色度判定処理となる。
本実施形態における色度判定は、Jpeg画像の画像圧縮単位である8*8画素のそれぞれに対して行われる。ここで、本発明の実施形態を説明するにあたり、最も利用が考えられる特徴領域として人物で、しかも人物の肌部分として説明する。したがって、色度判定の実施形態として、人物肌の色度判定処理となる。
人物の肌部分の色度の検索方法としては、複数の方法、たとえば、以下の1)および2)がある。
1)B(青)/G(緑)の比率が0.7〜0.8の範囲に収まり、R(赤)/G(緑)の比率が1.4〜1.8の範囲に収まる色度を持つもの。
2)図10の概念図に示すように、肌色を確率楕円にて表すことができる。求める式としては下記の(1)〜(3)になる。
1)B(青)/G(緑)の比率が0.7〜0.8の範囲に収まり、R(赤)/G(緑)の比率が1.4〜1.8の範囲に収まる色度を持つもの。
2)図10の概念図に示すように、肌色を確率楕円にて表すことができる。求める式としては下記の(1)〜(3)になる。
ここで、
であり、r,gは肌色色度の平均値、σr 2やσg 2は分散であり、ηは、確率を表す係数である。η=2.0、η=1.5、η=1.0でそれぞれ確率楕円95%、84%、68%に対応する。
本実施例においては、処理の簡便さを考慮に入れて、下記式(4)で示される色度分布範囲を肌色の色度範囲とした。この範囲を表したのが図11である。
色度判定の結果として得られる最小単位は、8*8ブロック(8*8のピクセルから構成されるブロック)であるが、色度判定そのものは8*8ブロック内の画素が使用される。
図12は、本実施形態で用いている、8*8ブロックの色度判定に使用する、8*8ブロック内の画素の位置と、判定された結果のブロックとの関係を図示したものである。また、これによると8*8画素単位ブロックの四隅の画素の色度の全てが、所定の色度範囲に入っているかを確認し、全てが範囲に入っている場合に、その8*8ブロックが適合範囲内の色度であると判定している。図12においては上段の左から2つ目と下段の左から1つ目、2つ目、3つ目のブロックが、適合範囲内の色度を有するブロックに該当する。上段の一番左のブロックは4ポイントのうち左上の色度は非肌色ピクセルと判定されるので、これを含むブロックは肌色の範囲外(適合範囲外)と判定される。同じように上段の右側1,2ブロックと下段の一番右のブロックが範囲外となる。
(配置等による候補領域の存在の決定)
次に、抽出した8*8画素ブロックの配置組合せ(たとえば、隣接する複数の8*8画素ブロックから構成される領域の位置や大きさ、形状等)により、主要な人物の肌領域と見なされる、1つまたは複数の候補グループの検出処理を実行する。たとえば、3人の人物の顔を含む被写体を撮像した画像の場合、通常であれば、少なくとも3つの顔領域とこれに隣接した肌の露出部分が検出されることになる。これらの各部分は、通常、隣接した複数のブロックからなる固まりとして検出されることになる。この部分には、一般的には、肌の色と誤検出した部分も含まれることになる。したがって、この段階で検出される部分は、色度のみに基づいているので、単に人肌画像と見なすことが可能な領域の候補であるに過ぎない。
次に、抽出した8*8画素ブロックの配置組合せ(たとえば、隣接する複数の8*8画素ブロックから構成される領域の位置や大きさ、形状等)により、主要な人物の肌領域と見なされる、1つまたは複数の候補グループの検出処理を実行する。たとえば、3人の人物の顔を含む被写体を撮像した画像の場合、通常であれば、少なくとも3つの顔領域とこれに隣接した肌の露出部分が検出されることになる。これらの各部分は、通常、隣接した複数のブロックからなる固まりとして検出されることになる。この部分には、一般的には、肌の色と誤検出した部分も含まれることになる。したがって、この段階で検出される部分は、色度のみに基づいているので、単に人肌画像と見なすことが可能な領域の候補であるに過ぎない。
候補とされた部分とそれ以外の部分との関係において、それ以外の部分内に候補とされた部分で且つ周囲から孤立した部分が存在するか否かが検出されて、存在する場合に、候補となるグループを検出したとすることができる。この存在/不存在については、候補とされた部分の領域の大きさ(たとえば、面積や形を含む)や、その領域の画像データ中の位置(中央部分か、端部か等)を含むことができる。たとえば、候補領域の大きさが小さすぎたり、画像全体の端部のみに存在したりする場合は、検出に失敗したとすることができる。反対に、候補領域の大きさが小さすぎず、端部にも存在するが中央部にも存在する場合は、少なくともこの段階では候補グループを検出したとすることができる。
図5に戻り、次のS502ステップでは、S501ステップにおいて候補となるグループを検出したか否かを判定する。
検出に失敗した場合は、S506ステップへ移行して主要人物肌領域の検出に失敗したことをセットする[HM=“0000”]。検出に成功した場合は、S503ステップへ移行する。
S503ステップでは、画像圧縮単位である8*8ブロックの圧縮特性である空間周波数成分データをブロックごとに取得する。取得後、そのブロック単位の集合として構成する所望の特徴領域である主要人物肌領域候補のグループに対して、空間周波数特性の代表値(後述する)を算出し、その結果と、予め設定して保存してある空間周波数特性の範囲に適合するか比較する。このステップは、主要な人物肌領域を空間周波数の面から検出可能であるか否かを確認するためのものである。人物の肌領域を空間周波数の面から検出した場合、次のステップでより細部に亘って空間周波数の面から検出することになる。このステップでは、比較結果に対して、上述したS502ステップと同様の処理(領域の大きさや配置に関する判定)を実行することになる。このステップの判定に使用する空間周波数範囲については、入力した画像サイズとファイル・サイズとから決定された範囲とすることができる。
次に、S504ステップにおいては、S503ステップにおいて候補となるグループを検出したか判定する。検出に失敗した場合は、S506ステップへ移行して主要人物肌領域の検出に失敗したことをセットする[HM=“0000”]。また、検出した場合は、S507ステップへ移行する。
以上の処理は、主要な人物肌領域の存在を色度と空間周波数の面から独立に検出可能か否かを判定することにその主目的がある。共に検出可能である場合にのみ、以下に説明するさらに詳細な検出処理、いわゆる絞り込み処理を実行することになる。
S507ステップにおいては、図6と図7を使用して後述する処理を実行する。
S507ステップの処理を完了すると、S508ステップで、所望の特徴領域である主要人物肌領域候補のグループが、所望の特徴領域である主要人物肌とすべきかが判定する。判定の結果、主要人物肌とすべき領域が存在しない(検出されない)とされた場合は、S506ステップへ移行して主要人物肌領域の検出に失敗したことをセットする[HM=“0000”]。また、存在する(検出された)と判定された場合は、S505ステップへ移行して主要人物肌領域の検出に成功したことをセットする[HM=“1111”]。さらにに、検出した主要人物肌領域のデータを保存する。主要人物肌領域の検出に失敗した場合は、この主要人物肌領域のデータには、ヌル値がセットされ、領域を表すデータが存在しないことが示される。
(候補領域の空間周波数を使用した絞り込み)
S507ステップの詳細の動作フローについて、図6と図7を用いてさらに詳細に説明する。この処理概要は、色度比率により検出して候補領域とした部分について、さらにその候補領域に関連付けた空間周波数の適合範囲を使用して、候補領域をさらに絞り込み、所望する特徴を備えた領域を決定する処理である。
S507ステップの詳細の動作フローについて、図6と図7を用いてさらに詳細に説明する。この処理概要は、色度比率により検出して候補領域とした部分について、さらにその候補領域に関連付けた空間周波数の適合範囲を使用して、候補領域をさらに絞り込み、所望する特徴を備えた領域を決定する処理である。
まず、図6のS601ステップにおいては、上述した図5のS501ステップの処理の結果得られた候補領域を表すデータ(Jpegファイルにおける画像圧縮単位の8*8ブロックを適合色度比率によりグループ化して検出した候補領域)を取得する。
S602ステップにおいては、取得した候補領域を表すデータを使用して、1つの候補グループ(隣接する8*8ブロックからなる固まり)内の各8*8ブロックのデータを取得する。また、これに換えて、候補領域とした際に使用した候補領域の代表値としての特徴量の判定処理に使用したデータを使用することもできる。
次に、空間周波数を使用して候補領域をさらに絞り込むために、S603ステップでは、判定基準を設定することになる。この判定基準は候補領域のサイズによって変わる。たとえば、注目画像が人物肌として顔画像である場合、その顔画像の大きさによっても、その顔部分の空間周波数が変化することになる。また、この空間周波数の基準は、VGAサイズの画像(図8)や、UXGAサイズの画像(図9)のように、画像サイズによっても変化する。したがって、空間周波数から、顔画像、すなわち人物肌領域と判断するには、画像全体のサイズと、候補領域の大きさ(たとえば、1つの候補グループとされた固まりの横幅、高さ等)によって変化させる必要がある。
図8は、本発明において使用したもので、VGA(640*480)のサイズの画像データにおける、候補画像の横幅をパラメータとした注目画像である人物肌の空間周波数特性の範囲の例を表したものである。
図8の最上段の数値は、図2に示した係数の番号付けを表している。たとえば、1〜10は、係数1〜係数10を表している。1つの候補グループを構成する複数の互いに隣接する連続ブロック値を2〜8個のグループ(〜L8)と9〜20個のグループ(L9〜20)と21個以上のグループ(L21〜)の3グループにまとめて、グループごとに周波数の適正範囲を設定したものである。また、連続ブロック値を2〜8個の場合、注目画像である人物肌の空間周波数特性の範囲は、係数1〜係数10の係数の和が50以上で300以下であることを示している。
このような周波数や連続ブロック数の分類は処理の簡略化と検出精度のバランスで行ったもので、これに縛られる必要は無い。
図9は、UXGA画像用判定テーブルである。この構成は、図8のVGA画像用判定テーブルと同じであり、図8と異なる部分は、画像サイズの違いによる空間周波数範囲の違いのみである。
ここで、空間周波数特性の代表値を説明する。これは、図8や図9に示した範囲を表すデータと比較するために、複数の係数値を1つの数値に纏めたデータである。8*8ブロックの代表値とは、各周波数の低い順に、図8や図9に示すように複数個単位(実施形態の場合M10個単位で、最後は3個)のグループごとの係数値の積算値を求めたものである。実施形態の場合では、63個の計数値データを7個の数値で代表させるように構成されることになる。
図6に戻り、S603ステップでは、空間周波数判定基準(適合範囲)を算出する。ここで算出するのは、S601ステップで取得した候補領域に関するものである。すなわち、図6では、詳細を示していないが、候補領域として複数のグループ(互いに隣接する8*8ブロックの固まり)がある場合、最初に取得した1つの候補領域のグループに関するものである。候補領域として複数のグループのある場合、それぞれについてS604〜S605の各ステップを実行することになる。
(空間周波数判定基準)
ここで、空間周波数判定基準(適合範囲)の算出について、図7のフローを用いて説明を行う。
ここで、空間周波数判定基準(適合範囲)の算出について、図7のフローを用いて説明を行う。
まず、S701ステップにおいては、以下のそれぞれを取得する。
(1)入力画像ファイルのファイル・サイズ(ファイルを構成するバイト数)。
(2)画像の画素数を確認するための画像サイズ(たとえば、VGA、UXGA等)。
(3)S501ステップにおいて主要人物肌領域候補のグループであるとした候補領域の画像サイズ(たとえば、最初に処理する1つの候補領域(塊)のサイズ、たとえば8*8ブロック単位の数値で、横幅、縦幅)。
(1)入力画像ファイルのファイル・サイズ(ファイルを構成するバイト数)。
(2)画像の画素数を確認するための画像サイズ(たとえば、VGA、UXGA等)。
(3)S501ステップにおいて主要人物肌領域候補のグループであるとした候補領域の画像サイズ(たとえば、最初に処理する1つの候補領域(塊)のサイズ、たとえば8*8ブロック単位の数値で、横幅、縦幅)。
S702ステップにおいては、(1)入力画像ファイルのファイル・サイズと、(2)画像の画素数を確認するための画像サイズより、画像圧縮単位である8*8ブロックの空間周波数適合値を設定する。たとえば、図8に示した表を設定する。ここで、Jpegファイル・サイズは、同じ画像サイズでも空間周波数成分が高いほど大きくなるので、たとえば、図8や図9に示した範囲を表す数値を、Jpegファイル・サイズに応じて変更することになる。
次に、S703ステップにおいて、現在、対象としている複数の互いに隣接する8*8ブロックから構成される候補領域グループの大きさから、たとえば、図8に示した表のうちの〜L8、L9〜20、L21〜のうちの何れを使用するかを設定する。
(空間周波数判定基準(適合範囲)を使用した検出)
図6に戻り、S604ステップにおいては、S603ステップで求めた空間周波数判定基準と、対応する候補領域を構成している各8*8ブロックごとの空間周波数成分(上述した各8*8ブロックブロックの代表値)を比較する。この比較によって、8*8ブロックごとにその空間周波数が判定基準に適合しているか(空間周波数が適合範囲に入っているか)判定が行われる。たとえば、ファイル・サイズと画像サイズから、図8に示された表が設定される。さらに処理の対象とする候補領域のサイズが、L21〜(21個以上の連続ブロックのサイズ)の場合、図4の最下段に示すような範囲にそのブロックの空間周波数の代表値が入っているか否かを判定する。これを、対象とする候補領域の全ての8*8ブロックに対して実行する。
図6に戻り、S604ステップにおいては、S603ステップで求めた空間周波数判定基準と、対応する候補領域を構成している各8*8ブロックごとの空間周波数成分(上述した各8*8ブロックブロックの代表値)を比較する。この比較によって、8*8ブロックごとにその空間周波数が判定基準に適合しているか(空間周波数が適合範囲に入っているか)判定が行われる。たとえば、ファイル・サイズと画像サイズから、図8に示された表が設定される。さらに処理の対象とする候補領域のサイズが、L21〜(21個以上の連続ブロックのサイズ)の場合、図4の最下段に示すような範囲にそのブロックの空間周波数の代表値が入っているか否かを判定する。これを、対象とする候補領域の全ての8*8ブロックに対して実行する。
S605ステップにおいては、S604ステップにおいて、判定基準に対して不適合と判定された8*8ブロックを、処理対象の候補領域から除外して絞り込んだ候補領域を確定する。
残りの候補領域のグループに対して、以上のS703、S604、S605の各ステップを繰り返す。残りの候補グループが無い場合、終了する。
(絞り込まれた候補領域に対するサイズ適応空間周波数適合判定)
上述した処理において、たとえば、S501ステップで検出した候補領域が、S605ステップで、さらに絞り込まれた領域となり、これらの領域のサイズの変更が無視できない大きさである場合がある。この場合、この変更の程度を検出して、所定以上の場合に、絞り込まれた領域のサイズに基づいて、再度S703、S604、605ステップの処理をやり直すことが、正確な検出に役立つ。この再度の処理は、最初の処理の結果得られた(絞り込まれた)領域をさらに絞り込むのではなく、最初の処理と入れ替わる処理である。この場合、高い周波数成分に対する許容量が増加する可能性があるので、最初のステップで絞り込まれた領域よりも、再度のステップで絞り込まれた領域の方が、若干拡大された領域となる可能性がある。
上述した処理において、たとえば、S501ステップで検出した候補領域が、S605ステップで、さらに絞り込まれた領域となり、これらの領域のサイズの変更が無視できない大きさである場合がある。この場合、この変更の程度を検出して、所定以上の場合に、絞り込まれた領域のサイズに基づいて、再度S703、S604、605ステップの処理をやり直すことが、正確な検出に役立つ。この再度の処理は、最初の処理の結果得られた(絞り込まれた)領域をさらに絞り込むのではなく、最初の処理と入れ替わる処理である。この場合、高い周波数成分に対する許容量が増加する可能性があるので、最初のステップで絞り込まれた領域よりも、再度のステップで絞り込まれた領域の方が、若干拡大された領域となる可能性がある。
また、上述では、候補領域の各グループに対して、S703、S604、S605の各ステップを繰り返すとしたが、複数の候補領域のうちの最大の候補領域のサイズにより空間周波数の設定値(適合値)を決定し、これを候補領域の全てに適用することもできる。
以上の再度の処理をS606ステップで実行する。このS606ステップの処理の結果、色度が適合範囲に入り、さらに空間周波数を使用した2回の処理を行うことで、所望する特徴領域を検出することが可能になる。
図5に戻り、S508ステップにおいては、所望の特徴領域である主要人物肌領域候補のグループが所望の特徴領域である主要人物肌と判定されたかを判定することになる。たとえば、S507ステップ後の、絞り込まれた所望の特徴領域である主要人物肌領域候補の各グループのどれもが、画像サイズに対して所定の面積比を有していない場合は、検出不成功とされる。また、所定の面積比を有しているグループが1つ存在する場合は、検出成功とされる。検出成功とされた場合、その判定の基になった絞り込まれた候補グループそれぞれの領域データ(たとえば、1ビットの2次元データや、境界をなだらかにした複数ビットからなる2次元データ)を保存する。
なお、この領域データは、画像データに関連付けられることが望ましい。たとえば、輝度補正した後、数日経過してから輪郭補正をする場合に、最初の輝度補正時に検出した領域データが再利用できることが望ましい。
上述の場合、前述した図4のS404ステップにおいては、S402ステップにおける検出結果“HM”が“1111”と判定されていることになり、画像より抽出した特徴領域を利用した画像補正目標値を設定する必要があると判定することになる。たとえば、輝度補正をする場合、特徴領域の状況を踏まえて、その特徴領域をどの輝度レベルまで補正するか、言い替えれば、その特徴領域の特性やレベルを最終目標値に近付けるかを設定することになる。次に、この設定した、目標値を使用して補正用テーブルを作成することになる。また、輪郭補正の場合は、検出した特徴領域とその他の領域を分離して、独立にユーザ設定されるようにしたり、あるいは特徴領域に対して補正量をゼロにしたりすることになる。
また、上述したS402ステップにおける検出結果“HM”が“0000”と判定されている時には、S406ステップにて通常の画像補正を実行することになる。つまり、画像全体に均一な補正量を設定し、補正を実行することになる。
S405ステップにおいては、共通の定義に基づく画像補正に対して、作成した補正用テーブルを利用できるように共通の定義に基づく画像補正に対して置き換えを行った後に、画像補正を実行することになる。
(第1の実施形態が適用可能な画像例)
図13は、本発明に関わる第1の実施形態を適用することが望ましい画像例を示す図である。
1)に示す図は、入力した画像の例である。
2)に示す図は、候補領域検出の工程で、図6のS601ステップで取得したデータ、すなわち、S501ステップの色度判定において、式(4)で示される範囲に入っているか否かの結果を示す図である。この図では、セーターの部分は、肌色に近い(適合色度比率の閾値に合致する)ために色度比率では肌の候補領域として検出されている。
3)に示す図は、図5のS503ステップにて各8*8ブロックの単位で、空間周波数特性の判定を実施した判定結果である。明色部分は、空間周波数特性において、候補領域には不適当と判定された部分である。
図13は、本発明に関わる第1の実施形態を適用することが望ましい画像例を示す図である。
1)に示す図は、入力した画像の例である。
2)に示す図は、候補領域検出の工程で、図6のS601ステップで取得したデータ、すなわち、S501ステップの色度判定において、式(4)で示される範囲に入っているか否かの結果を示す図である。この図では、セーターの部分は、肌色に近い(適合色度比率の閾値に合致する)ために色度比率では肌の候補領域として検出されている。
3)に示す図は、図5のS503ステップにて各8*8ブロックの単位で、空間周波数特性の判定を実施した判定結果である。明色部分は、空間周波数特性において、候補領域には不適当と判定された部分である。
上記結果より、本実施例においては、2)における暗部部分が候補領域であり、この暗部部分と、3)における暗部部分とのANDが取られる形になって、さらに絞り込まれることになる。
その後、この絞り込まれた領域(顔画像部分)のサイズを検出して、検出したサイズに応じた空間周波数の適合範囲が設定され、これ基づいて再度空間周波数の適合性が判定されることになる。この最後の判定処理を実施することで、本来検出したい候補領域をより正確に検出できる。
なお、本実施例では、特徴領域を人物の肌領域として説明したが、空間周波数を利用して、検出領域の境界をより正確に検出するための技術であるので、検出対象は人物の肌でなくても良いことは明らかである。色度と空間周波数を使用して、周囲の画像から識別可能な対象物を含む画像であれば、本発明を使用して対象物の領域を検出することができる。
(第2の実施形態)
上述した第1の実施形態においては、色度比率により検出対象の領域の全てが検出され、さらに、空間周波数を使用してさらに絞り込むことによって、より正確な、特徴領域の検出を目指す方法である。しかし、最初に色度比率を利用する場合、検出対象の色かぶりや、色度の個別ばらつきにより、所望する候補領域を完全には検出できない場合がある。この場合の特徴領域の検出精度を上げることを目的とし、画像全体に対する空間周波数を利用した検出結果を利用して、最初に色度比率を使用した検出では完全に検出できない部分をも検出するようにした第2の実施形態を示す。
上述した第1の実施形態においては、色度比率により検出対象の領域の全てが検出され、さらに、空間周波数を使用してさらに絞り込むことによって、より正確な、特徴領域の検出を目指す方法である。しかし、最初に色度比率を利用する場合、検出対象の色かぶりや、色度の個別ばらつきにより、所望する候補領域を完全には検出できない場合がある。この場合の特徴領域の検出精度を上げることを目的とし、画像全体に対する空間周波数を利用した検出結果を利用して、最初に色度比率を使用した検出では完全に検出できない部分をも検出するようにした第2の実施形態を示す。
基本的な構成は、第1の実施形態と同一であり、差異部分のみ詳細に説明を行う。
この方法は、第1の実施形態における検出処理のうちで、図5のS507ステップ部分についての検出及び判定処理にのみ違いがある。
図14は、上述した図5のS507ステップ部分の第2の実施形態における処理フローを示すである。また、この図14の処理は、図6に示す処理と一部類似する。ただし、ここでは、説明を簡単にするため、候補領域としては1つの候補グループしかない場合で、かつ、第1の実施形態で、図5のS508ステップで検出成功とされる場合における、S507ステップの部分を説明する。
S1401ステップは、図6のS601ステップと同様であり、Jpegファイルにおける画像圧縮単位の8*8ブロックを適合色度比率によりグループ化して検出した第1の候補領域を、取得する。
S1402ステップは、図6のS602ステップと同様であり、Jpegファイルにおける画像圧縮単位の8*8ブロックのDCT変換による交流成分を利用した候補領域の代表値としての特徴量を判定処理、及びその結果を取得する。
S1403ステップにおいては、図6のS603ステップと同様であり、前述した画像圧縮単位である8*8ブロックに対する空間周波数判定基準を算出する。
S1404ステップは、図6のS603ステップと同様である。ここでは、S1403ステップで求めた画像圧縮単位の8*8ブロックに対する境界領域検出用の空間周波数特性による閾値と、候補領域を構成している各8*8ブロックごとの空間周波数成分を比較し、適合範囲に入っているか判定を行う。
以降のステップは、第2の実施形態に特有な処理である。
第1の実施形態においては、図6のS605ステップの処理において、絞り込まれた候補領域を、たとえば、入力された画像と重畳して表示した場合、ほぼ正確に人物肌領域を検出していると判断されることになると思われる。しかし、明らかに絞り込まれた候補領域に不足があると判断される場合も想定される。この想定に基づいて、既に絞り込まれた候補領域に関連する領域の検出を実行する。
まず、S1405ステップにおいては、S1401ステップにて検出した第1の候補領域に隣接するJpeg8*8ブロックで、新たに設定した適合値に合致するブロックで構成する第2の候補領域を検出する。ここで、新たに設定した適合値の範囲が最初の適合値の範囲を含む場合、この第2の候補領域は、第1の候補領域を含むことになる。
ここで、適合値としては、空間周波数との範囲とする。このステップにおける各ブロックの空間周波数における新たな適合値の決定は、以下の方法から得ることができる。まず、各8*8ブロック単位のDCT係数の総和(8*8ブロック単位の空間周波数の代表値)を算出し、算出値から全画像に対する総和値の分布を作成する(不図示)。次に、同様に、絞り込まれた候補領域についても分布を作成する。この分布は、たとえば、輝度ヒストグラムのような分布となる。例として図15に全画像領域データの輝度ヒストグラムと、絞り込まれた候補領域の輝度ヒストグラムを提示する。この図15は、空間周波数分布ではないが、このような分布において、絞り込まれた候補領域の周波数頻度分布の上限と下限を設定し、この上限の上部5%と下限の下5%程度の範囲を含む範囲を、新たな適合範囲として設定する。これ以外の方法で同様の範囲を設定する場合であっても、それまでに絞り込まれた候補領域の8*8ブロックのデータを元にした新たな適合領域の設定であれば、指定方法が違う分散など統計的手法を用いても考えとしては一緒である。
ここで、上述したような新たに設定された空間周波数の範囲に適合し、その内部にそれまでに絞り困れた領域を有する領域が、S1405で設定される。
S1406ステップにおいては、上述した第2の候補領域の8*8ブロックに対して、先の式4で設定した色度比率より適合範囲が広い第2の色度比率による第3の候補領域を検出する。
S1407ステップにおいては、第3の候補領域のサイズに応じた空間周波数適合範囲を使用して、第3の候補領域内の空間周波数算出及び判定を、実施する。このような処理の結果、少なくと、第1の実施形態よって最終的に検出した領域よりも広い領域で、しかも所望する特徴領域を備えた領域を検出することが可能になる。
(第2の実施形態が適用可能な画像例)
図16は、本発明に関わる第2の実施形態を適用することが望ましい画像例を示す図である。
1)に示す図は、入力した画像の例である。
2)に示す図は、候補領域検出の工程で、図14のS1401ステップで取得したデータ、すなわち、S501ステップの色度判定において、式(4)で示される範囲に入っているか否かの結果を示す図である。この図からは、式4で設定した適合色度比率による肌色設定範囲に入らない肌色領域が存在し、元画像における肌領域の全てを検出することができていない、ことがわかる。従来の検出の場合、この候補領域に対して空間周波数代表値の特徴量を算出し、判定に持ち込むため、判定値に入った場合は、実際の肌色領域より少ない状態でしか候補領域を検出することができない。また、判定値に入らなかった場合は、人物の顔部分が検出領域に含まれているにもかかわらず候補領域は検出不能と判断されてしまうことになる。
3)に示す図は、図14のS1404ステップにて各8*8ブロックの単位で、空間周波数特性の判定を実施した判定結果である。明色部分は、空間周波数特性において、候補領域には不適当と判定された部分である。この図からは、所望の特徴領域については、少なくとも、その前の色度判定よりも正確に検出していることがわかる。
図16は、本発明に関わる第2の実施形態を適用することが望ましい画像例を示す図である。
1)に示す図は、入力した画像の例である。
2)に示す図は、候補領域検出の工程で、図14のS1401ステップで取得したデータ、すなわち、S501ステップの色度判定において、式(4)で示される範囲に入っているか否かの結果を示す図である。この図からは、式4で設定した適合色度比率による肌色設定範囲に入らない肌色領域が存在し、元画像における肌領域の全てを検出することができていない、ことがわかる。従来の検出の場合、この候補領域に対して空間周波数代表値の特徴量を算出し、判定に持ち込むため、判定値に入った場合は、実際の肌色領域より少ない状態でしか候補領域を検出することができない。また、判定値に入らなかった場合は、人物の顔部分が検出領域に含まれているにもかかわらず候補領域は検出不能と判断されてしまうことになる。
3)に示す図は、図14のS1404ステップにて各8*8ブロックの単位で、空間周波数特性の判定を実施した判定結果である。明色部分は、空間周波数特性において、候補領域には不適当と判定された部分である。この図からは、所望の特徴領域については、少なくとも、その前の色度判定よりも正確に検出していることがわかる。
上記結果より、本発明の第2の実施形態においては、2)において、検出した領域(暗部部分)を主にその領域を含み、その領域から、3)における不適当とされた部分までの領域を含めるような領域を求める処理を実行する。この拡大された領域に対して、先の式4で設定した色度比率より適合範囲が広い第2の色度比率を使用して第3の候補領域を検出するものである。言い換えれば、そのような処理を実行するために、まず、第一の実施形態の処理を実行して、得られた領域が有する空間周波数範囲よりも広い範囲の領域に対して、範囲が拡大された色度判定処理と、領域のサイズに応じた空間周波数の適合性判定することにある。
上述した第1の実施形態あるいは、第2の実施形態は、最終的に検出した特徴領域を、画像全体に重畳する形で表示し、ユーザが、その両者の関係を視認することもできる。このようにした場合に、各パラメータや、各実施形態の選択などをユーザあるいはオペレータが指示することにより、最終的に得られた特徴領域を所望する領域と実質的に一致させることが可能になる。
また、同じような条件で撮像された複数の画像に対して補正を実施する場合に、上述した方法の各種の設定を最初の画像に対してユーザが設定するだけで、残りの画像に対しては、追加のユーザ設定を実質的に必要とせずに、所望の処理を実施させることができる。
なお、本実施例では、候補領域を人物の肌領域として説明したが、本発明は、空間周波数を利用して、検出領域の境界をより正確に検出するための技術でもあるので、検出対象は人物の肌でなくても良いことは明らかである。
また、上述した図13や図16のDCT/AC成分による分割の図から、空間周波数を利用して、検出領域の境界を比較的正確に検出できることが理解されよう。上述した第2の実施形態は、空間周波数を利用すると検出領域の境界を比較的正確に検出することができることを前提に構成されている。
ただし、検出できるのは境界であるので、上述した実施形態では、まず実施形態1を使用して、不満足ながらも少なくとも所望の領域からなる限定された領域を求める。そしてこの求めた領域の圧縮ブロックのDCT係数に基づいて、この領域を含む拡大された領域を設定し、再度この領域に対して色度と空間周波数成分の判定を実行させている。
本発明は、デジタル・カメラ等からの撮像データを入力し、従来の銀塩フィルムのDPEのようなスタイルでプリントを作成する場合に利用することが可能である。また、そのような場合に、撮像条件等に余り影響されない、良好なプリント結果を得る処理の実行を容易にする。
本発明は、上記で例示した画像補正のための人物肌領域検出だけでなく、画像中からの人物の顔検出、個人顔承認などにおける検出にも対しても使用することができる。
51 入出力ポート
52 マウス
53 キーボード
54 モニタ
55 制御部(コントローラ)
56 メモリ・カード・ドライブ
57 ハードディスク
52 マウス
53 キーボード
54 モニタ
55 制御部(コントローラ)
56 メモリ・カード・ドライブ
57 ハードディスク
Claims (9)
- 空間周波数成分、色度、および画像サイズ情報を有する圧縮画像データを入力して、当該画像データの中に、所望の特徴領域が存在するか否かと存在する場合に当該特徴領域を検出する画像処理方法であって、
前記所望の特徴領域に関連付けて予め設定された色度に関する範囲に基づいて、前記圧縮画像データを圧縮ブロック単位ごとに検査し、圧縮ブロック単位ごとに予め定めた色度を有するか否かを判定して、予め定めた色度を有すると見なされる候補ブロックから構成される候補領域を決定する第1のステップと、
互いに隣接する複数の前記候補ブロックから構成される1つあるいは複数の候補画像領域のサイズを求める第2のステップと、
前記候補画像領域内の圧縮ブロックそれぞれに対して、前記画像サイズ情報と前記候補画像領域サイズにより予め定められる空間周波数に関する範囲に基づいて、前記候補画像領域内の圧縮ブロック単位ごとの空間周波数成分の分布あるいは量を検査して、予め定めた空間周波数の分布あるいは量を有すると見なされる圧縮ブロックを決定する第3のステップと、
前記第3のステップで決定した圧縮ブロックから構成される領域を所望の特徴領域とした領域データを作成するステップと
を備えることを特徴とする画像処理方法。 - 互いに隣接する複数の前記候補ブロックから構成される1つあるいは複数の候補画像領域のサイズを求める第2のステップは、前記複数の候補画像領域のうちの最大の領域のサイズを求めることを含み、
前記第3のステップは、前記画像サイズと前記最大の領域のサイズにより予め定められる空間周波数に関する範囲に基づく
ことを特徴とする請求項1に記載の画像処理方法。 - 前記第3のステップによって決定された領域のサイズを検出して、当該サイズと前記画像サイズにより予め定められる空間周波数に関する範囲に基づいて、前記候補画像領域内の圧縮ブロックそれぞれの空間周波数成分の分布あるいは量を検査して、予め定めた空間周波数の分布あるいは量を有すると見なされる圧縮ブロックを決定する第4のステップをさらに備え、
前記所望の特徴領域とした領域データを作成するステップは、前記第4のステップで決定した圧縮ブロックから構成される領域を所望の特徴領域とした領域データを作成する
ことを特徴とする請求項1又は2に記載の画像処理方法。 - 前記第3のステップによって決定された領域内の空間周波数の頻度分布を調べて、当該頻度分布の上限と下限とが延長された範囲を新たな空間周波数適合値とする領域で、内部に前記ステップ3で決定された領域を含む領域を設定する第5のステップと、
前記第5のステップで設定された領域について、前記所望の特徴領域に関連付けて予め設定された色度に関する範囲よりも拡大された範囲に基づいて、前記圧縮画像データを圧縮ブロック単位ごとに検査し、圧縮ブロック単位ごとに前記拡大され範囲の色度を有するか否かを判定して、有すると見なされる候補領域を決定する第6のステップと、
前記第6のステップで決定された互いに隣接する複数の前記候補ブロックから構成される1つあるいは複数の候補画像領域のサイズを求める第7のステップと、
前記前記第6のステップで決定された候補画像領域内の圧縮ブロックそれぞれに対して、前記画像サイズ情報と前記候補画像領域サイズにより予め定められる空間周波数に関する情報に基づいて、前記特徴領域内の圧縮ブロック単位ごとの空間周波数成分の分布あるいは量を検査して、予め定めた空間周波数の分布あるいは量を有すると見なされるブロックを決定する第8のステップと
をさらに備え、
前記所望の特徴領域とした領域データを作成するステップは、前記第8のステップで決定した圧縮ブロックから構成される領域を所望の特徴領域とした領域データを作成する
ことを特徴とする請求項1又は2に記載の画像処理方法。 - 前記第1のステップは、予め定めた色度を有して特徴領域と見なされる候補ブロックを検出しない場合、および予め定めた色度を有して特徴領域と見なされる候補ブロックの互いに隣接ブロックから構成される1つあるいは複数の領域の最大のサイズが、予め定めたサイズよりも小さい場合、検出不成功を表すデータを出力し、
前記第3のステップは、予め定めた空間周波数の分布あるいは量を有すると見なされるブロックを検出しない場合、および予め定めた空間周波数の分布あるいは量を有すると見なされる候補ブロックの互いに隣接ブロックから構成される1つあるいは複数の領域の最大のサイズが、予め定めたサイズよりも小さい場合、検出不成功を表すデータを出力し、
前記領域データを作成するステップは、前記何れかの検出不成功を表すデータを入力した場合に、ヌル値を出力する
ことを特徴とする請求項1に記載の画像処理方法。 - 前記第3のステップは、前記圧縮画像データの前記画像サイズ情報とファイル・サイズおよび前記候補画像領域サイズにより予め定められる空間周波数に関する範囲に基づくことを特徴とする請求項1に記載の画像処理方法。
- 前記所望の特徴領域は、少なくとも人物の肌領域を含むことを特徴とする請求項1〜5の何れかに記載の画像処理方法。
- 空間周波数成分、色度、および画像サイズ情報を有する圧縮画像データを入力して、当該画像データの中に、所望の特徴領域が存在するか否かと存在する場合に当該特徴領域を検出するために、コンピュータに、
前記所望の特徴領域に関連付けて予め設定された色度に関する範囲に基づいて、前記圧縮画像データを圧縮ブロック単位ごとに検査し、圧縮ブロック単位ごとに予め定めた色度を有するか否かを判定して、予め定めた色度を有すると見なされる候補ブロックから構成される候補領域を決定する第1のステップと、
互いに隣接する複数の前記候補ブロックから構成される1つあるいは複数の候補画像領域のサイズを求める第2のステップと、
前記候補画像領域内の圧縮ブロックそれぞれに対して、前記画像サイズ情報と前記候補画像領域サイズにより予め定められる空間周波数に関する範囲に基づいて、前記候補画像領域内の圧縮ブロック単位ごとの空間周波数成分の分布あるいは量を検査して、予め定めた空間周波数の分布あるいは量を有すると見なされる圧縮ブロックを決定する第3のステップと、
前記第3のステップで決定した圧縮ブロックから構成される領域を所望の特徴領域とした領域データを作成するステップと
を実行させるためのプログラム。 - 請求項8に記載のプログラムを記録したコンピュータ読み取り可能記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006239111A JP2008061209A (ja) | 2006-09-04 | 2006-09-04 | 画像処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006239111A JP2008061209A (ja) | 2006-09-04 | 2006-09-04 | 画像処理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008061209A true JP2008061209A (ja) | 2008-03-13 |
Family
ID=39243398
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006239111A Pending JP2008061209A (ja) | 2006-09-04 | 2006-09-04 | 画像処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008061209A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009252243A (ja) * | 2008-04-04 | 2009-10-29 | Nhn Corp | 成人物判断方法及びシステム |
JP2016102953A (ja) * | 2014-11-28 | 2016-06-02 | 株式会社ニコン | 焦点検出装置およびカメラ |
JP2018201119A (ja) * | 2017-05-26 | 2018-12-20 | エスゼット ディージェイアイ テクノロジー カンパニー リミテッドSz Dji Technology Co.,Ltd | モバイルプラットフォーム、飛行体、支持装置、携帯端末、撮像補助方法、プログラム、及び記録媒体 |
JP2019148817A (ja) * | 2019-04-22 | 2019-09-05 | 株式会社ニコン | 合焦状態検出装置およびカメラ |
JP2021051322A (ja) * | 2020-12-09 | 2021-04-01 | 株式会社ニコン | 合焦状態検出装置およびカメラ |
-
2006
- 2006-09-04 JP JP2006239111A patent/JP2008061209A/ja active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009252243A (ja) * | 2008-04-04 | 2009-10-29 | Nhn Corp | 成人物判断方法及びシステム |
JP2016102953A (ja) * | 2014-11-28 | 2016-06-02 | 株式会社ニコン | 焦点検出装置およびカメラ |
JP2018201119A (ja) * | 2017-05-26 | 2018-12-20 | エスゼット ディージェイアイ テクノロジー カンパニー リミテッドSz Dji Technology Co.,Ltd | モバイルプラットフォーム、飛行体、支持装置、携帯端末、撮像補助方法、プログラム、及び記録媒体 |
JP2019148817A (ja) * | 2019-04-22 | 2019-09-05 | 株式会社ニコン | 合焦状態検出装置およびカメラ |
JP2021051322A (ja) * | 2020-12-09 | 2021-04-01 | 株式会社ニコン | 合焦状態検出装置およびカメラ |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9525868B2 (en) | Mobile terminal apparatus which displays captured images | |
US7652717B2 (en) | White balance correction in digital camera images | |
US9497355B2 (en) | Image processing apparatus and recording medium for correcting a captured image | |
US20070071316A1 (en) | Image correcting method and image correcting system | |
US8391646B2 (en) | Image processing device and method that performs image quality adjustment and resize processing on image data | |
US8374439B2 (en) | Image processing apparatus, image processing method, program, and computer-readable print medium | |
JP2012027687A (ja) | 画像処理装置及びプログラム | |
JP2018006981A (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
JP2018107593A (ja) | 画像処理装置、画像処理方法およびプログラム | |
JP4618153B2 (ja) | 画像処理装置、デジタルカメラ、画像データ構造、自動色補正機能付き印刷装置、顔オブジェクト情報付き撮影画像の生成方法および色補正方法 | |
JP2008061209A (ja) | 画像処理方法 | |
US8351737B2 (en) | Image processing apparatus | |
US20110026818A1 (en) | System and method for correction of backlit face images | |
CN107018277B (zh) | 当向原件发射光时读取原件的图像的图像处理装置 | |
JP2014123881A (ja) | 情報処理装置、情報処理方法、コンピュータプログラム | |
JP7039219B2 (ja) | 情報処理装置、画像処理方法、プログラム | |
US7684588B2 (en) | System and method for providing robust information tags to image files | |
JP2001292449A (ja) | 画像処理装置、画像処理方法、及び記録媒体 | |
JP2005192158A (ja) | 画像処理方法、画像処理装置及び画像記録装置 | |
US7609425B2 (en) | Image data processing apparatus, method, storage medium and program | |
JP2008060623A (ja) | 電子カメラ | |
JP2004222078A (ja) | 画像処理装置、画像処理方法、およびそのプログラム | |
JP4235592B2 (ja) | 画像処理方法および画像処理装置 | |
JP4292873B2 (ja) | 画像処理方法、画像処理装置及び画像記録装置 | |
JP5310782B2 (ja) | 電子カメラ |