JP2010009305A - 画像処理装置、画像処理方法及びプログラム - Google Patents
画像処理装置、画像処理方法及びプログラム Download PDFInfo
- Publication number
- JP2010009305A JP2010009305A JP2008167614A JP2008167614A JP2010009305A JP 2010009305 A JP2010009305 A JP 2010009305A JP 2008167614 A JP2008167614 A JP 2008167614A JP 2008167614 A JP2008167614 A JP 2008167614A JP 2010009305 A JP2010009305 A JP 2010009305A
- Authority
- JP
- Japan
- Prior art keywords
- face
- image
- size
- processing
- detected
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Editing Of Facsimile Originals (AREA)
- Studio Devices (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
【課題】 画像データ中から顔画像を抽出して拡大する処理に関し、処理トータルとしての負荷を平準化することのできる画像処理装置、画像処理方法及び画像処理プログラムを提供する。
【解決手段】 入力される画像から顔を検出する際、検出する顔のサイズによって検出の処理負荷が変動する顔検出部(11)と、顔検出部から検出された顔の画像中の位置とサイズとに関する情報を受け取って、この情報に基づいて顔画像を抽出すると共に当該顔画像を所定サイズの画像に拡大する際、当該顔画像のサイズによって拡大の処理負荷が変動する拡大部(12)とを備える画像処理装置(10)である。
【選択図】図1
【解決手段】 入力される画像から顔を検出する際、検出する顔のサイズによって検出の処理負荷が変動する顔検出部(11)と、顔検出部から検出された顔の画像中の位置とサイズとに関する情報を受け取って、この情報に基づいて顔画像を抽出すると共に当該顔画像を所定サイズの画像に拡大する際、当該顔画像のサイズによって拡大の処理負荷が変動する拡大部(12)とを備える画像処理装置(10)である。
【選択図】図1
Description
本発明は、画像中から顔画像を検出して拡大する画像処理装置、画像処理方法及びプログラムに関する。
画像データに含まれる特定の画像を抽出する技術として、例えば、顔画像検出技術が知られている。さらに、顔画像を抽出するだけでなく、抽出した顔画像を拡大して表示したいとのニーズも多い。
特許文献1に記載された技術では、画面に表示される画像の中から、人の顔などの注目被写体を検出し、検出された注目被写体の位置や大きさ等に従って、この注目被写体を拡大表示するための表示領域や拡大率を決定する。そして、決定された表示領域や拡大率に従って画面に拡大表示を行う。
特開2005−311888号公報
ところで、顔画像の抽出とその拡大を一連の処理として実行する際には、解決すべき課題として処理に要する負荷をトータルとして平準化することが求められる。
即ち、顔画像を抽出して拡大する処理は単独の装置として機能するよりも、映像表示装置などのシステムに組み込まれて使用される場合が多いと考えられる。従って、顔画像を抽出する処理の負荷と、顔画像を拡大する処理の負荷との各々の負荷を個別に制御したとしても、一連の処理トータルの負荷が変動するようでは、映像表示装置などのシステムの負荷を変動させ、その機能を低下させることになる。
しかしながら、特許文献1には、このような処理トータルとしての負荷を平準化することに関する記載は無く、示唆する記載も無い。
本発明は係る事情に鑑みてなされたものであって、画像データ中から顔画像を抽出して拡大する処理に関し、処理トータルとしての負荷を平準化することのできる画像処理装置、画像処理方法及びプログラムを提供することを目的とする。
課題を解決するための本発明は、入力される画像から顔を検出する際、検出する顔のサイズによって検出の処理負荷が変動する顔検出部と、前記顔検出部から検出された顔の前記画像中の位置とサイズとに関する情報を受け取って、この情報に基づいて顔画像を抽出すると共に当該顔画像を所定サイズの画像に拡大する際、当該顔画像のサイズによって拡大の処理負荷が変動する拡大部とを備えることを特徴とする画像処理装置である。
また本発明は、入力される画像から顔を検出する際、検出する顔のサイズが大きいほど検出の処理負荷が小さくなるように顔を検出する顔検出ステップと、前記顔検出ステップで検出された顔の前記画像中の位置とサイズとに関する情報を受け取る情報取得ステップと、この情報に基づいて顔画像を抽出する抽出ステップと、当該顔画像を所定サイズの画像に拡大する際、拡大する当該顔画像のサイズが大きいほど拡大の処理負荷が大きくなるように顔を拡大する拡大ステップとを備える画像処理方法である。
また本発明は、画像処理プログラムであって、入力される画像から顔を検出する際、検出する顔のサイズが大きいほど検出の処理負荷が小さくなるように顔を検出する顔検出ステップと、前記顔検出ステップで検出された顔の前記画像中の位置とサイズとに関する情報を受け取る情報取得ステップと、この情報に基づいて顔画像を抽出する抽出ステップと、当該顔画像を所定サイズの画像に拡大する際、拡大する当該顔画像のサイズが大きいほど拡大の処理負荷が大きくなるように顔を拡大する拡大ステップとをコンピュータに実行させる画像処理プログラムである。
この発明によれば、画像データ中から顔画像を抽出して拡大する処理に関し、処理トータルとしての負荷を平準化することのできる画像処理装置、画像処理方法及びプログラムを提供することができる。
図1は、本実施の形態に係る画像処理装置をデジタルテレビへ組み込んだ図である。このデジタルテレビは、受信した映像信号から顔を検出し、リアルタイムで顔の部分を拡大して表示する機能を備えている。
デジタルテレビ1は、チューナ制御部2、分離部3、オーディオ復調部4、映像復調部5、合成部6、AV出力部7、表示部8、制御部9及び画像処理装置10を備えている。
そして、画像処理装置10は顔検出部11、拡大部12及びDB(データベース)13を備えている。
そして、画像処理装置10は顔検出部11、拡大部12及びDB(データベース)13を備えている。
チューナ制御部2は、BS、CS及び地上波に対応する放送データの受信とチャンネル選択のための選局処理とを行う放送受信部であり、対応のアンテナ(不図示)に接続されている。分離部3は、受信した放送データを音声データと映像データとに分離しそれぞれをオーディオ復調部4と映像復調部5とに出力する。オーディオ復調部4は、音声データを復調する。映像復調部5は、映像データを復調する。
画像処理装置10の顔検出部11は、復調された映像データに含まれる顔画像を検出する。拡大部12は、検出された顔画像に対応する部分の画像データを所定のサイズの顔画像に拡大する。DB13は、顔検出部11が顔を検出する際に使用する辞書(詳細は後述する)を記憶する。
合成部6は、音声データと拡大された顔画像とを合成する。AV出力部7は、合成された映像を表示部8に出力し、表示部8は、合成された映像を液晶、プラズマなどのディスプレイに表示する。
そして、制御部9はデジタルテレビ1の各部の動作を制御するために設けられたメインCPU(Central Processing Unit)である。
そして、制御部9はデジタルテレビ1の各部の動作を制御するために設けられたメインCPU(Central Processing Unit)である。
図2は、画像処理装置10の処理例を説明する図である。
映像復調部5で復調された画像データに複数の顔が表示されている場合、顔検出部11は、大きいサイズの顔の検出を優先して実行し、画像データ中で一番大きい顔の部分を検出する。そして、検出した顔の部分を特定する情報を算出する。例えば、顔の部分を含む矩形の領域を定義し、その矩形を特定する位置、サイズの情報を抽出する。その情報としては、矩形の1つの頂点または中心の座標及び矩形の縦・横のサイズとすることができ、あるいは、矩形の4つの頂点の座標とすることもできる。
映像復調部5で復調された画像データに複数の顔が表示されている場合、顔検出部11は、大きいサイズの顔の検出を優先して実行し、画像データ中で一番大きい顔の部分を検出する。そして、検出した顔の部分を特定する情報を算出する。例えば、顔の部分を含む矩形の領域を定義し、その矩形を特定する位置、サイズの情報を抽出する。その情報としては、矩形の1つの頂点または中心の座標及び矩形の縦・横のサイズとすることができ、あるいは、矩形の4つの頂点の座標とすることもできる。
拡大部12は、顔検出部11からの情報に基づいて、画像データから顔の部分を切り出すと共に、所定サイズの画像に拡大するための拡大率を算出して、その拡大率に従って顔画像を拡大する。例えば、フルハイビジョンのサイズで表示できるように拡大することが考えられる。
なお、拡大に際しては、単にサイズを拡大するに留まらず、付随して画像処理を施す。顔が検出された場合には、肌,髪等の顔の特徴となる場所が既知となるので、画像処理のパラメータを顔の特徴に最適な値に変更して、顔部分を特に綺麗に拡大することが可能である。例えば、画像処理の内シャープネスに関するパラメータを、顔の部分と顔以外の部分で変更して、顔の部分をソフトな色調となる様に処理することができる。
なお、拡大に際しては、単にサイズを拡大するに留まらず、付随して画像処理を施す。顔が検出された場合には、肌,髪等の顔の特徴となる場所が既知となるので、画像処理のパラメータを顔の特徴に最適な値に変更して、顔部分を特に綺麗に拡大することが可能である。例えば、画像処理の内シャープネスに関するパラメータを、顔の部分と顔以外の部分で変更して、顔の部分をソフトな色調となる様に処理することができる。
図3は、画像処理装置10におけるモジュール間のデータの流れを説明する図である。
手順(1)映像復調部5からの画像データは、顔検出部11へ入力される。
手順(2)顔検出部11からは、映像復調部5からの画像データが拡大部12へ入力される。
手順(3)顔検出部11からは、映像復調部5からの画像データに基づいて検出された顔の位置,サイズなどの情報が拡大部11へ入力される。
手順(4)拡大部11からは、検出された顔の位置,サイズなどの情報を元に、映像復調部5からの画像データの一部を拡大した画像データが出力される。
手順(1)映像復調部5からの画像データは、顔検出部11へ入力される。
手順(2)顔検出部11からは、映像復調部5からの画像データが拡大部12へ入力される。
手順(3)顔検出部11からは、映像復調部5からの画像データに基づいて検出された顔の位置,サイズなどの情報が拡大部11へ入力される。
手順(4)拡大部11からは、検出された顔の位置,サイズなどの情報を元に、映像復調部5からの画像データの一部を拡大した画像データが出力される。
ここで、画像処理装置10の各モジュールは、上述のデータの流れに従ってシーケンシャルに動作を実行するように構成されている。これは、リアルタイムに顔画像を抽出して拡大処理するためである。
尚、映像復調部5からの画像データを、顔検出部11と拡大部12とに並列に入力し、手順(2)に示すデータの授受を省くことが可能である。ただし、その場合は、拡大部12は顔検出部11の結果を使用するため、同期した動作を実現するために拡大部12の前に映像復調部5からの画像データを一時保存するバッファを設ける必要がある。
図4は、顔検出部11が入力される画像を走査して顔を検出する方法を説明する図である。
映像復調部5から入力される画像のサイズが、横Xピクセル、縦Yピクセルとする。これに対して、顔を検出するための領域20を設ける。この領域20のサイズを横aピクセル、縦bピクセルとする。
図4は、顔検出部11が入力される画像を走査して顔を検出する方法を説明する図である。
映像復調部5から入力される画像のサイズが、横Xピクセル、縦Yピクセルとする。これに対して、顔を検出するための領域20を設ける。この領域20のサイズを横aピクセル、縦bピクセルとする。
そして、この領域20を所定ピクセル(例えば、1ピクセル)毎、右方向に走査しながら、領域20内に所定のパターンの顔画像が存在するかどうかを判断する。領域20は、右端まで走査した後は、所定ピクセル(例えば、1ピクセル)下方向に移動して、画像の左端から右端まで同様に走査する。この動作を繰り返して、領域20が画像の左上から右下まで走査することで画像中の顔を検出する。
この動作は、領域20内に顔が検出されるまで継続し、領域20内に顔が検出されたときは、その時点で走査を終了する。一方、一つのサイズの領域20による画像の走査を行っても所定のパターンの顔パターンが存在しない場合は、領域20のサイズを変更して再度画像の左上から右下まで走査する動作を繰り返す。
なお、走査範囲とは、入力される画像全体の領域の内、走査する対象とされている領域のことをいう。
なお、走査範囲とは、入力される画像全体の領域の内、走査する対象とされている領域のことをいう。
図5は、顔検出部11の処理動作を示すフロー図である。顔検出部11は、制御部9からの周期的な起動指示に対応して、例えば、1フレーム周期毎に起動して、以下の手順で処理を実行する。
ステップS01において、顔検出部11は、映像復調部5から入力される画像データに対して顔を検出するための顔サイズ、走査範囲などの情報を設定する。
本実施の形態では、顔のサイズは初期値は大きいサイズとし、走査を繰り返す毎にサイズを小さくする。即ち、サイズの大きい顔を優先的に検出する。これは、画像中において主たる人物(対象)は、大きい領域を有しているのが普通であると考えられるからである。従って、大きいサイズの顔を優先して検出することにより所望の顔画像を効率的に検出することができる。
ステップS01において、顔検出部11は、映像復調部5から入力される画像データに対して顔を検出するための顔サイズ、走査範囲などの情報を設定する。
本実施の形態では、顔のサイズは初期値は大きいサイズとし、走査を繰り返す毎にサイズを小さくする。即ち、サイズの大きい顔を優先的に検出する。これは、画像中において主たる人物(対象)は、大きい領域を有しているのが普通であると考えられるからである。従って、大きいサイズの顔を優先して検出することにより所望の顔画像を効率的に検出することができる。
ステップS02において、予定した範囲の全てのサイズで画像を走査したかどうかを調べる。
ステップS02でNoの場合、即ちまだ走査していない顔サイズがあるときは、ステップS02において、そのサイズで画像を走査する。
ステップS02でNoの場合、即ちまだ走査していない顔サイズがあるときは、ステップS02において、そのサイズで画像を走査する。
ステップS03でNoの場合、即ちまだ走査が完了していないときは、ステップS04において、領域20を移動する毎に顔検出処理を実行する。
顔検出部11は、DB13に格納されている辞書を読み出す。この辞書には、顔の標準パターン(例えば、正面の顔、横向きの顔、男性の顔、女性の顔などが組み合わされた顔画像)が複数種類格納されている。顔検出部11は、領域20内の画像とそれぞれの顔の標準パターンとを、例えば、パターンマッチングの手法を用いて比較照合する。この際、例えば、領域20内に顔画像が存在していても、標準パターンと比較して顔の領域の占める割合が小さい場合には顔がないものとして認識される。
顔検出部11は、DB13に格納されている辞書を読み出す。この辞書には、顔の標準パターン(例えば、正面の顔、横向きの顔、男性の顔、女性の顔などが組み合わされた顔画像)が複数種類格納されている。顔検出部11は、領域20内の画像とそれぞれの顔の標準パターンとを、例えば、パターンマッチングの手法を用いて比較照合する。この際、例えば、領域20内に顔画像が存在していても、標準パターンと比較して顔の領域の占める割合が小さい場合には顔がないものとして認識される。
ステップS05においてNoの場合、即ち、辞書にある全てのパターンについて比較照合がまだ終わっていない場合は、ステップS04の顔検出処理を繰り返して実行する。
ステップS05においてYesの場合、即ち、辞書にある全てのパターンについて比較照合が終了した場合は、ステップS06において、顔が検出されたかどうかを調べる。
ステップS05においてYesの場合、即ち、辞書にある全てのパターンについて比較照合が終了した場合は、ステップS06において、顔が検出されたかどうかを調べる。
ステップS06においてYesの場合、即ち、顔が検出されている場合は、これ以上の検出動作を中止して、ステップS07において、顔検出判定処理を実行する。
顔検出判定処理では、顔を検出した位置(例えば、そのときの領域20の左上端の座標)と領域20のサイズを抽出する。
そして、顔検出処理を終了する。
顔検出判定処理では、顔を検出した位置(例えば、そのときの領域20の左上端の座標)と領域20のサイズを抽出する。
そして、顔検出処理を終了する。
一方、ステップS06においてNoの場合、即ち、顔が検出されなかった場合は、ステップS03にもどり、領域20を移動して、ステップS04〜S05の顔検出処理を繰り返す。
そして、ステップS03においてYesの場合、即ち、走査範囲の走査を終了した場合は、ステップS01に戻り、顔のサイズ(領域20のサイズ)を小さいサイズに設定してステップS02〜S06の顔検出処理を繰り返す。
そして、ステップS03においてYesの場合、即ち、走査範囲の走査を終了した場合は、ステップS01に戻り、顔のサイズ(領域20のサイズ)を小さいサイズに設定してステップS02〜S06の顔検出処理を繰り返す。
ステップS02でYesの場合、即ち、全ての顔サイズについて走査した結果、顔が検出されなかったときは、ステップS07において、顔検出判定処理を実行する。そして、顔検出判定処理では、顔が検出されなかったことを示す情報が作成される。
図6は、拡大部12の処理動作を示すフロー図である。拡大部12は、顔検出部11の処理結果に基づいて以下の手順で処理を実行する。
ステップS11において、拡大部12は、顔検出部11より顔検出位置、領域20のサイズ及び入力された画像データを受け取る。
ステップS11において、拡大部12は、顔検出部11より顔検出位置、領域20のサイズ及び入力された画像データを受け取る。
そして、ステップS12において、拡大位置と拡大率を決定する。
ここで、拡大位置は、顔検出位置、領域20のサイズに基づいて決定される。即ち、検出された顔画像では、そのまま拡大したのでは顔の占める部分が大きすぎることにも成りかねない。また、縦横の比率が拡大後の縦横の比率と一致していることが元画像を変形することがないため望ましい。そこで、領域20のサイズを補正した新たなサイズの領域を拡大位置とする。そして、この拡大位置に基づいて拡大率を決定する。例えば、フルハイビジョンサイズである1920×1080に拡大する場合、新たなサイズをa×bとすると、拡大率は1920/a(=1080/b)として求める。
なお、ハイビジョンの映像の場合は、解像度が良いため、拡大しても画像の劣化が生じにくいが、それでも、拡大率が大きすぎる場合は、拡大後の画像の視認性が劣ることとなる。従って拡大率が所定値以下となるように制限しても良い。
ここで、拡大位置は、顔検出位置、領域20のサイズに基づいて決定される。即ち、検出された顔画像では、そのまま拡大したのでは顔の占める部分が大きすぎることにも成りかねない。また、縦横の比率が拡大後の縦横の比率と一致していることが元画像を変形することがないため望ましい。そこで、領域20のサイズを補正した新たなサイズの領域を拡大位置とする。そして、この拡大位置に基づいて拡大率を決定する。例えば、フルハイビジョンサイズである1920×1080に拡大する場合、新たなサイズをa×bとすると、拡大率は1920/a(=1080/b)として求める。
なお、ハイビジョンの映像の場合は、解像度が良いため、拡大しても画像の劣化が生じにくいが、それでも、拡大率が大きすぎる場合は、拡大後の画像の視認性が劣ることとなる。従って拡大率が所定値以下となるように制限しても良い。
ステップS13において、入力された画像から拡大位置の画像を切り出し、ステップS14において、拡大率に従って画像を拡大する。
この際、元画像の特徴あるいは拡大率に応じて処理内容を変更する。例えば、顔のトーンをソフトにする、顔部の色を肌色に近づける、明るさを強くする、解像度(ガンマ特性)を変更する、などの処理を元画像の特徴と拡大率とに応じて適切な表示になるように調整して実行する。このため、どのような画像処理を施せば良いかを元画像を解析して判定する。具体的には、ピクセル毎の色情報、輝度情報、分布情報などに基づいて複数のインデックスを算出して画像処理内容を決定する。
この際、元画像の特徴あるいは拡大率に応じて処理内容を変更する。例えば、顔のトーンをソフトにする、顔部の色を肌色に近づける、明るさを強くする、解像度(ガンマ特性)を変更する、などの処理を元画像の特徴と拡大率とに応じて適切な表示になるように調整して実行する。このため、どのような画像処理を施せば良いかを元画像を解析して判定する。具体的には、ピクセル毎の色情報、輝度情報、分布情報などに基づいて複数のインデックスを算出して画像処理内容を決定する。
このように拡大処理時に画像処理のパラメータを適応するように変更して実行することによって、拡大された顔画像をより高精細な望ましい画像とすることができる。通常、顔画像を単純に拡大した場合、拡大された顔が不自然なものとなる場合が多いが、このように取り計らうことで拡大後の画像を鑑賞する楽しみを大幅に向上することができる。
また、元画像が小さい場合、即ち拡大率が大きい場合は、上述の処理を実施することによってかえって不自然な顔になる場合がある。これは処理する部分が小さいため画像処理の効果が十分に発揮できず、むしろ逆効果となるためである。
そこで、本実施の形態では、元画像が小さい場合、即ち拡大率が大きい場合は、画像処理を抑制するように制御しても良い。
そこで、本実施の形態では、元画像が小さい場合、即ち拡大率が大きい場合は、画像処理を抑制するように制御しても良い。
次に、本実施の形態において、負荷の平準化が計れる理由について説明する。
図7は、顔検出処理における負荷を説明する図である。
上述のように顔検出処理では、画像の左上から右下に向かい領域20を走査して顔検出を実行する。このときの負荷を表す値として「処理コスト」なる概念を導入する。
上述のように顔検出処理では、画像の左上から右下に向かい領域20を走査して顔検出を実行する。このときの負荷を表す値として「処理コスト」なる概念を導入する。
顔検出処理は、領域20を走査して領域20内に顔があるかどうかを識別する動作で構成される。
ここで、辞書に格納されている顔パターンと比較照合する動作に要する時間は領域20の大きさ、即ち顔検出画像サイズによらず略一定となる方式を採用する。従って、処理コストは、画像を識別する回数に比例すると考えられる。
一方、画像を識別する回数は走査方法と、顔検出画像サイズによって異なる。
ここで、辞書に格納されている顔パターンと比較照合する動作に要する時間は領域20の大きさ、即ち顔検出画像サイズによらず略一定となる方式を採用する。従って、処理コストは、画像を識別する回数に比例すると考えられる。
一方、画像を識別する回数は走査方法と、顔検出画像サイズによって異なる。
フルHDの画像(1920×1080)を処理する場合の処理コストを説明する。
図7(1)は、領域20のサイズを1000×1000として、この領域20を左上から右下まで1ピクセル毎に走査する場合を示す図である。
このときの識別回数は、式(1)で表される。
73,600 = (1920−1000)×(1080−1000)・・・式(1)
図7(2)は、領域20のサイズを25×25として、この領域20を左上から右下まで1ピクセル毎に走査する場合を示す図である。
このときの識別回数は、式(2)で表される。
1,999,225 = (1920−25)×(1080−25)・・・式(2)
本実施の形態では、領域20のサイズを大きいサイズから徐々に小さくして、顔検出の走査を行うが、顔検出のサイズが大きいほど、識別回数が減少していることがわかる。従って、顔検出の処理コストは、顔検出のサイズが大きいほど小さく、顔検出のサイズが小さいほど大きい。
このときの識別回数は、式(1)で表される。
73,600 = (1920−1000)×(1080−1000)・・・式(1)
図7(2)は、領域20のサイズを25×25として、この領域20を左上から右下まで1ピクセル毎に走査する場合を示す図である。
このときの識別回数は、式(2)で表される。
1,999,225 = (1920−25)×(1080−25)・・・式(2)
本実施の形態では、領域20のサイズを大きいサイズから徐々に小さくして、顔検出の走査を行うが、顔検出のサイズが大きいほど、識別回数が減少していることがわかる。従って、顔検出の処理コストは、顔検出のサイズが大きいほど小さく、顔検出のサイズが小さいほど大きい。
図8は、拡大処理における負荷を説明する図である。
上述のように本実施の形態の拡大処理では元画像の特徴を捉え、特徴に応じて処理を適用的に変更することで高品質な拡大画像を得る。それゆえ、拡大処理の処理コストは、主として元画像の特徴を正確に識別するための負荷に依存する。
従って、図8(1)に示すように検出された顔サイズが大きい場合、識別する部分が広範囲にわたるため、識別コストが増加する。また、画像処理する部分が広範囲にわたるため、画像処理コストが増加する。
逆に、図8(2)に示すように検出された顔サイズが小さい場合、識別する部分が狭いため、識別コストは小さく、画像処理する部分が狭いため、画像処理コストも低い。
従って、顔拡大の処理コストは、顔検出のサイズが大きいほど大きく、顔検出のサイズが小さいほど小さい。
上述のように本実施の形態の拡大処理では元画像の特徴を捉え、特徴に応じて処理を適用的に変更することで高品質な拡大画像を得る。それゆえ、拡大処理の処理コストは、主として元画像の特徴を正確に識別するための負荷に依存する。
従って、図8(1)に示すように検出された顔サイズが大きい場合、識別する部分が広範囲にわたるため、識別コストが増加する。また、画像処理する部分が広範囲にわたるため、画像処理コストが増加する。
逆に、図8(2)に示すように検出された顔サイズが小さい場合、識別する部分が狭いため、識別コストは小さく、画像処理する部分が狭いため、画像処理コストも低い。
従って、顔拡大の処理コストは、顔検出のサイズが大きいほど大きく、顔検出のサイズが小さいほど小さい。
図9は、顔検出サイズによる顔検出部11と拡大部12の負荷状態を説明する図である。
大きい顔を検出する場合、顔検出部11は処理コストが少ないために負荷が小さくなるが、拡大部12は識別処理する画素数が多いために処理コストが多くなり負荷が大きくなる。
小さい顔を検出する場合、顔検出部11は処理コストが多いために負荷が大きくなるが、拡大部12は識別処理する画素数が少ないために処理コストが小さくなり負荷が小さくなる。
なお、顔が検出されない場合は小さい顔を検出する場合と同様に、顔検出部11は処理コストが多いために負荷が大きくなるが、拡大部12は識別処理する必要がないため、処理コストは小さくなり負荷が小さくなる。
この結果、顔を検出し拡大する処理に要する負荷は、顔検出サイズによって大きく変動することなく平準化される。
大きい顔を検出する場合、顔検出部11は処理コストが少ないために負荷が小さくなるが、拡大部12は識別処理する画素数が多いために処理コストが多くなり負荷が大きくなる。
小さい顔を検出する場合、顔検出部11は処理コストが多いために負荷が大きくなるが、拡大部12は識別処理する画素数が少ないために処理コストが小さくなり負荷が小さくなる。
なお、顔が検出されない場合は小さい顔を検出する場合と同様に、顔検出部11は処理コストが多いために負荷が大きくなるが、拡大部12は識別処理する必要がないため、処理コストは小さくなり負荷が小さくなる。
この結果、顔を検出し拡大する処理に要する負荷は、顔検出サイズによって大きく変動することなく平準化される。
なお、本実施の形態では、顔を検出する技術に関して説明したが、本発明は顔の検出のみではなく、例えば、特定の人物を認識するなど、顔の認識に関しても適用することは可能である。
また、本実施の形態では、1人の顔を検出する例を示したが、複数の顔が一つの映像中に存在する場合についても適用することができる。上述の説明では、最初に顔が見つかった時点で顔検出処理を終了しているが、顔を検出した順に上位10名で処理を終わる、ある定まったサイズにまで縮小した時点で処理を終える、などの複数の顔を検出する処理が可能である。即ち、本実施の形態で挙げた検出方法や検出数は一例であり、この実施例から容易に推測可能な方法は本発明の技術思想に当然含まれる。
また、本実施の形態では、全画面をピクセル単位で検出する顔検出技術をベースに話を進めたが、顔検出方法はこれに制限されない。すなわち、大きい顔を優先し検出する顔検出アルゴリズムであれば、いかなる顔検出方法も適用可能である。
また、本実施の形態では、顔検出を例として説明したが、本発明は、顔検出だけに制限されない。例えばある物体を検出し、拡大表示するシステムに適用することが可能である。この際、例えば画像処理では顔と異なりシャープネスを強くするなどの画像処理のバリエーションをとることができる。
さらに、本実施の形態の顔検出方法を高速化することができる。その方法としては、例えば、(1)前回顔を検出した結果により、その位置を中心として処理を行う、(2)画像の隅は処理を行わない、(3)1フレーム毎に顔検出を行うのではなく数フレームに一度のみ顔検出処理を行う、などにより高速化を図っても良い。
本発明の代表的な構成要素を例示すると以下のように示すことができる。
<例示1>
入力される画像から顔を検出する際、検出する顔のサイズによって検出の処理負荷が変動する顔検出部(11)と、
前記顔検出部から検出された顔の前記画像中の位置とサイズとに関する情報を受け取って、この情報に基づいて顔画像を抽出すると共に当該顔画像を所定サイズの画像に拡大する際、当該顔画像のサイズによって拡大の処理負荷が変動する拡大部(12)と
を備えることを特徴とする画像処理装置(10)。
入力される画像から顔を検出する際、検出する顔のサイズによって検出の処理負荷が変動する顔検出部(11)と、
前記顔検出部から検出された顔の前記画像中の位置とサイズとに関する情報を受け取って、この情報に基づいて顔画像を抽出すると共に当該顔画像を所定サイズの画像に拡大する際、当該顔画像のサイズによって拡大の処理負荷が変動する拡大部(12)と
を備えることを特徴とする画像処理装置(10)。
<例示2>
前記顔検出部(11)は、検出する顔のサイズが大きいほど検出の処理負荷が小さくなるようになされる。
前記顔検出部(11)は、検出する顔のサイズが大きいほど検出の処理負荷が小さくなるようになされる。
<例示3>
前記拡大部(12)は、顔画像のサイズが大きいほど拡大の処理負荷が大きくなるようになされる。
前記拡大部(12)は、顔画像のサイズが大きいほど拡大の処理負荷が大きくなるようになされる。
<例示4>
前記顔検出部(11)は、
前記画像中の大きいサイズの顔画像を優先して検出するように前記画像を走査して検索し、顔画像が検出されたときは以降の走査を中止する。
前記顔検出部(11)は、
前記画像中の大きいサイズの顔画像を優先して検出するように前記画像を走査して検索し、顔画像が検出されたときは以降の走査を中止する。
<例示5>
前記顔検出部(11)は、
検出しようとする顔のサイズで前記画像を走査しつつその一部を切り出して、切り出した画像に前記顔のサイズに対応した顔が含まれているかどうかを判断する。
前記顔検出部(11)は、
検出しようとする顔のサイズで前記画像を走査しつつその一部を切り出して、切り出した画像に前記顔のサイズに対応した顔が含まれているかどうかを判断する。
<例示6>
前記顔検出部(11)は、
前記切り出した画像に顔が含まれているかどうかを、顔の標準パターンを用いたパターンマッチング法によって判断する。
前記顔検出部(11)は、
前記切り出した画像に顔が含まれているかどうかを、顔の標準パターンを用いたパターンマッチング法によって判断する。
<例示7>
拡大処理前に前記顔画像に画像処理を施す画像処理部(12)を更に備え、
前記画像処理部は、前記顔画像の特徴を表す少なくとも一つのインデックスを求め、このインデックスに応じて前記顔画像に施す画像処理内容を決定する。
拡大処理前に前記顔画像に画像処理を施す画像処理部(12)を更に備え、
前記画像処理部は、前記顔画像の特徴を表す少なくとも一つのインデックスを求め、このインデックスに応じて前記顔画像に施す画像処理内容を決定する。
<例示8>
入力される画像から顔を検出する際、検出する顔のサイズが大きいほどその処理負荷が小さくなるように顔を検出する顔検出ステップと、
前記顔検出ステップで検出された顔の前記画像中の位置とサイズとに関する情報を受け取る情報取得ステップと、
この情報に基づいて顔画像を抽出する抽出ステップと、
当該顔画像を所定サイズの画像に拡大する際、拡大する当該顔画像のサイズが大きいほどその処理負荷が大きくなるように顔を拡大する拡大ステップと
を備える画像処理方法。
入力される画像から顔を検出する際、検出する顔のサイズが大きいほどその処理負荷が小さくなるように顔を検出する顔検出ステップと、
前記顔検出ステップで検出された顔の前記画像中の位置とサイズとに関する情報を受け取る情報取得ステップと、
この情報に基づいて顔画像を抽出する抽出ステップと、
当該顔画像を所定サイズの画像に拡大する際、拡大する当該顔画像のサイズが大きいほどその処理負荷が大きくなるように顔を拡大する拡大ステップと
を備える画像処理方法。
<例示9>
入力される画像から顔を検出する際、検出する顔のサイズが大きいほどその処理負荷が小さくなるように顔を検出する顔検出ステップと、
前記顔検出ステップで検出された顔の前記画像中の位置とサイズとに関する情報を受け取る情報取得ステップと、
この情報に基づいて顔画像を抽出する抽出ステップと、
当該顔画像を所定サイズの画像に拡大する際、拡大する当該顔画像のサイズが大きいほどその処理負荷が大きくなるように顔を拡大する拡大ステップと
をコンピュータに実行させる画像処理プログラム。
入力される画像から顔を検出する際、検出する顔のサイズが大きいほどその処理負荷が小さくなるように顔を検出する顔検出ステップと、
前記顔検出ステップで検出された顔の前記画像中の位置とサイズとに関する情報を受け取る情報取得ステップと、
この情報に基づいて顔画像を抽出する抽出ステップと、
当該顔画像を所定サイズの画像に拡大する際、拡大する当該顔画像のサイズが大きいほどその処理負荷が大きくなるように顔を拡大する拡大ステップと
をコンピュータに実行させる画像処理プログラム。
なお、上述の実施の形態で説明した各機能は、ハードウエアを用いて構成しても良く、また、ソフトウエアを用いて各機能を記載したプログラムをコンピュータに読み込ませて実現しても良い。また、各機能は、適宜ソフトウエア、ハードウエアのいずれかを選択して構成するものであっても良い。
更に、各機能は図示しない記録媒体に格納したプログラムをコンピュータに読み込ませることで実現させることもできる。ここで本実施の形態における記録媒体は、プログラムを記録でき、かつコンピュータが読み取り可能な記録媒体であれば、その記録形式は何れの形態であってもよい。
尚、本発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。更に、異なる実施形態に亘る構成要素を適宜組み合せてもよい。
1…デジタルテレビ、2…チューナ制御部、3…分離部、4…オーディオ復調部、5…映像復調部、6…合成部、7…AV出力部、8…表示部、9…制御部、10…画像処理装置、11…顔検出部、12…拡大部、13…DB、20…領域。
Claims (9)
- 入力される画像から顔を検出する際、検出する顔のサイズによって検出の処理負荷が変動する顔検出部と、
前記顔検出部から検出された顔の前記画像中の位置とサイズとに関する情報を受け取って、この情報に基づいて顔画像を抽出すると共に当該顔画像を所定サイズの画像に拡大する際、当該顔画像のサイズによって拡大の処理負荷が変動する拡大部と
を備えることを特徴とする画像処理装置。 - 前記顔検出部は、検出する顔のサイズが大きいほど検出の処理負荷が小さくなるようになされることを特徴とする請求項1に記載の画像処理装置。
- 前記拡大部は、顔画像のサイズが大きいほど拡大の処理負荷が大きくなるようになされることを特徴とする請求項2に記載の画像処理装置。
- 前記顔検出部は、
前記画像中の大きいサイズの顔画像を優先して検出するように前記画像を走査して検索し、顔画像が検出されたときは以降の走査を中止することを特徴とする請求項3に記載の画像処理装置。 - 前記顔検出部は、
検出しようとする顔のサイズで前記画像を走査しつつその一部を切り出して、切り出した画像に前記顔のサイズに対応した顔が含まれているかどうかを判断することを特徴とする請求項4に記載の画像処理装置。 - 前記顔検出部は、
前記切り出した画像に顔が含まれているかどうかを、顔の標準パターンを用いたパターンマッチング法によって判断することを特徴とする請求項5に記載の画像処理装置。 - 拡大処理前に前記顔画像に画像処理を施す画像処理部を更に備え、
前記画像処理部は、前記顔画像の特徴を表す少なくとも一つのインデックスを求め、このインデックスに応じて前記顔画像に施す画像処理内容を決定することを特徴とする請求項3に記載の画像処理装置。 - 入力される画像から顔を検出する際、検出する顔のサイズが大きいほど検出の処理負荷が小さくなるように顔を検出する顔検出ステップと、
前記顔検出ステップで検出された顔の前記画像中の位置とサイズとに関する情報を受け取る情報取得ステップと、
この情報に基づいて顔画像を抽出する抽出ステップと、
当該顔画像を所定サイズの画像に拡大する際、拡大する当該顔画像のサイズが大きいほど拡大の処理負荷が大きくなるように顔を拡大する拡大ステップと
を備えることを特徴とする画像処理方法。 - 画像処理プログラムであって、
入力される画像から顔を検出する際、検出する顔のサイズが大きいほど検出の処理負荷が小さくなるように顔を検出する顔検出ステップと、
前記顔検出ステップで検出された顔の前記画像中の位置とサイズとに関する情報を受け取る情報取得ステップと、
この情報に基づいて顔画像を抽出する抽出ステップと、
当該顔画像を所定サイズの画像に拡大する際、拡大する当該顔画像のサイズが大きいほど拡大の処理負荷が大きくなるように顔を拡大する拡大ステップと
をコンピュータに実行させることを特徴とする画像処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008167614A JP2010009305A (ja) | 2008-06-26 | 2008-06-26 | 画像処理装置、画像処理方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008167614A JP2010009305A (ja) | 2008-06-26 | 2008-06-26 | 画像処理装置、画像処理方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010009305A true JP2010009305A (ja) | 2010-01-14 |
Family
ID=41589726
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008167614A Withdrawn JP2010009305A (ja) | 2008-06-26 | 2008-06-26 | 画像処理装置、画像処理方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010009305A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012141651A (ja) * | 2010-12-14 | 2012-07-26 | Tokai Denshi Kk | 点呼システム |
JP2017162348A (ja) * | 2016-03-11 | 2017-09-14 | 富士フイルム株式会社 | 印刷システム及びマニュアル表示方法 |
-
2008
- 2008-06-26 JP JP2008167614A patent/JP2010009305A/ja not_active Withdrawn
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012141651A (ja) * | 2010-12-14 | 2012-07-26 | Tokai Denshi Kk | 点呼システム |
JP2017162348A (ja) * | 2016-03-11 | 2017-09-14 | 富士フイルム株式会社 | 印刷システム及びマニュアル表示方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6714254B2 (en) | Method of displaying character data in digital television broadcasting receiver | |
US20130169834A1 (en) | Photo extraction from video | |
US20120099794A1 (en) | Retargeting of image with overlay graphic | |
WO2014030405A1 (ja) | 表示装置、表示方法、テレビジョン受信機及び表示制御装置 | |
JP4981820B2 (ja) | 表示処理装置 | |
JP6045405B2 (ja) | 映像処理装置、表示装置、テレビジョン受信機及び映像処理方法 | |
JP2008046608A (ja) | ビデオウィンドウ検出器 | |
JP2009100270A (ja) | 映像編集方法およびテレビ放送受信機 | |
JP2001169199A (ja) | 字幕補正回路及びその字幕補正方法 | |
JP2010009305A (ja) | 画像処理装置、画像処理方法及びプログラム | |
EP2063636A1 (en) | Video processing device and video processing method | |
JP5042251B2 (ja) | 画像処理装置および画像処理方法 | |
JP6645076B2 (ja) | 画像処理装置 | |
JP5377649B2 (ja) | 画像処理装置および映像再生装置 | |
CN110519530B (zh) | 基于硬件的画中画显示方法及装置 | |
JP2007005933A (ja) | 画像調整方法、画像処理回路、及び画像表示装置 | |
US9159118B2 (en) | Image processing apparatus, image processing system, and non-transitory computer-readable medium | |
CN113507572A (zh) | 视频画面的显示方法、装置、终端及存储介质 | |
JP4631258B2 (ja) | 携帯機器 | |
JP4496036B2 (ja) | デジタル放送受信機 | |
JP2009065432A (ja) | 画像再生装置 | |
EP2509045B1 (en) | Method of, and apparatus for, detecting image boundaries in video data | |
JP5061778B2 (ja) | 字幕補正表示方法 | |
KR100775177B1 (ko) | 이동 방송 수신 단말기의 영상 부분 확대 방법과 장치 | |
CN116996743A (zh) | 一种视频处理方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20110906 |