JP4775306B2 - 画像処理装置、撮像装置、および画像表示制御方法、並びにコンピュータ・プログラム - Google Patents

画像処理装置、撮像装置、および画像表示制御方法、並びにコンピュータ・プログラム Download PDF

Info

Publication number
JP4775306B2
JP4775306B2 JP2007112591A JP2007112591A JP4775306B2 JP 4775306 B2 JP4775306 B2 JP 4775306B2 JP 2007112591 A JP2007112591 A JP 2007112591A JP 2007112591 A JP2007112591 A JP 2007112591A JP 4775306 B2 JP4775306 B2 JP 4775306B2
Authority
JP
Japan
Prior art keywords
face
score
image
detected
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007112591A
Other languages
English (en)
Other versions
JP2008271268A5 (ja
JP2008271268A (ja
Inventor
正剛 福島
繁 柏木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2007112591A priority Critical patent/JP4775306B2/ja
Priority to KR1020080035565A priority patent/KR20080095179A/ko
Priority to US12/148,612 priority patent/US8064656B2/en
Priority to EP08154951.1A priority patent/EP1986128B1/en
Priority to TW097114638A priority patent/TWI375917B/zh
Priority to CN201310051300.8A priority patent/CN103258185B/zh
Priority to CN2008100950367A priority patent/CN101295354B/zh
Publication of JP2008271268A publication Critical patent/JP2008271268A/ja
Publication of JP2008271268A5 publication Critical patent/JP2008271268A5/ja
Application granted granted Critical
Publication of JP4775306B2 publication Critical patent/JP4775306B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5854Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • G06V20/47Detecting features for summarising video content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/174Facial expression recognition
    • G06V40/175Static expression

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Health & Medical Sciences (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Studio Devices (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Television Signal Processing For Recording (AREA)

Description

本発明は、画像処理装置、撮像装置、および画像表示制御方法、並びにコンピュータ・プログラムに関する。さらに詳細には、例えばビデオカメラなどによって撮像された多数の動画像データから選択された画像をサムネイル画像一覧として表示するとともに、一覧表示されたサムネイル画像の指定に応じて、サムネイル画像位置からの動画再生処理を実行する画像処理装置、撮像装置、および画像表示制御方法、並びにコンピュータ・プログラムに関する。
昨今のデジタルカメラ、デジタルビデオカメラなどの撮像装置、あるいはDVDプレーヤなどの画像処理装置は、例えば画像表示部やモニタ画面に記録媒体(記録メディア)に格納された画像データの一覧を表示する機能を備えているものが多い。
例えば、撮像装置やDVDプレーヤなど動画再生可能な装置は、動画のタイトルまたはチャプターをメニュー形式で並べて表示し、これらの表示データからユーザに再生コンテンツを選択させて再生処理を行なうものがある。また、例えば撮像装置において撮影された動画について、1回の撮影処理、すなわち、撮影開始から撮影停止までの動画データをから選択された代表画像の縮小画像(サムネイル画像)を表示する、いわゆるインデックス表示処理を可能としたものがある。ディスプレイに表示した縮小画像をインデックスとして、そのフレームからの再生を可能とするものである。
動画データをインデックス表示する場合、動画データを構成するフレームから選択されたフレームの縮小画像が表示されることになる。従って、内容把握を容易にするためには、動画データ中からできるだけ意味のあるフレームをインデックス用画像として選択することが必要となる。この方法については、例えば特許文献1(特許第3312105号)に記載されている技術がある。これは、予め見つけたいオブジェクトの画像を学習させて登録したオブジェクト辞書を用いて、動画像データを検索して、登録した画像に類似するものをインデックス用のフレーム画像として選択しようとする構成である。
しかし、この方法は、1回の記録開始から終了までの単位(以降、1コンテンツと呼ぶ)に対し、特定の登録オブジェクトのインデックス画像を選択する方法であり、予めオブジェクト画像の登録処理が必要となり、未登録オブジェクトについてはインデックスとして選択できないという問題がある。例えば、複数の人物が同じ1コンテンツ中の別の時間帯に登場した場合、特定の登録されたオブジォクトに対応する人物の顔が含まれたフレームはインデックスとして選択されるが、その他の人物のみが含まれるフレームについてはインデックスとして表示されないことになる。このような構成では、インデックス画像として残っていて欲しい顔(例えば自分の子供)が、インデックス画像に残らない可能性がある、という問題がある。
また、動画像をインデックス表示する際、「動画像に含まれる顔の画像を表示」するようなビデオカメラ等のアプリケーション(以下、「顔インデックス」と呼ぶことにする)において、1コンテンツ中の全動画フレームに含まれる顔を、全てインデックス表示しようとすると、顔が多く含まれる場面(合唱コンクールや運動会など)を撮影した場合、非常に多くの顔がインデックス表示されてしまう。本来、インデックス表示を行う目的は「1コンテンツの概要を素早く把握する」ことであるが、このように多くの顔が表示されてしまうと、この目的が達成されない。
特許3312105号公報
本発明は、上述の問題点に鑑みてなされたものであり、動画データ中から、顔画像を抽出してインデックスとして表示する構成において、予めオブジェクトの登録処理などを行なうことなく顔画像をインデックスとして抽出し表示することを可能とし、さらに、動画データ中に多数の顔が含まれる場合であっても効率的に様々な人物の顔を選択してインデックス表示することを可能とした画像処理装置、撮像装置、および画像表示制御方法、並びにコンピュータ・プログラムを提供することを目的とする。
本発明の第1の側面は、
動画像データを構成する画像フレームから顔画像領域を検出し、検出した顔画像からインデックス情報とする顔画像を選択する処理を実行する代表顔抽出部を有し、
前記代表顔抽出部は、
画像フレームから検出された検出顔各々の特徴に基づくスコアを算出し、スコアの高い検出顔をインデックス用の顔画像として選択する処理を実行する構成を有することを特徴とする画像処理装置にある。
さらに、本発明の画像処理装置の一実施態様において、前記代表顔抽出部は、画像フレームから検出された検出顔各々のフレーム内の位置が中心に近いほど高いスコアとした位置スコアを算出し、位置スコアの高い検出顔をインデックス用の顔画像として選択する処理を実行する構成を有することを特徴とする。
さらに、本発明の画像処理装置の一実施態様において、前記代表顔抽出部は、画像フレームから検出された検出顔各々のサイズが大きいほど高いスコアとしたサイズスコアを算出し、サイズスコアの高い検出顔をインデックス用の顔画像として選択する処理を実行する構成を有することを特徴とする。
さらに、本発明の画像処理装置の一実施態様において、前記代表顔抽出部は、画像フレームから検出された検出顔各々の顔らしさの評価値が高いほど高いスコアとした顔評価値スコアを算出し、顔評価値スコアの高い検出顔をインデックス用の顔画像として選択する処理を実行する構成を有することを特徴とする。
さらに、本発明の画像処理装置の一実施態様において、前記代表顔抽出部は、画像フレームから検出された検出顔の検出顔数が、先行する顔検出フレームにおける検出顔数より増加しているか否かを判定し、増加していることを条件として、検出顔をインデックス用の顔画像として選択する処理を実行する構成を有することを特徴とする。
さらに、本発明の画像処理装置の一実施態様において、前記代表顔抽出部は、画像フレームから検出された検出顔各々の個人識別を実行し、先行する顔検出フレームにおける検出顔と異なる人物の顔を優先的にインデックス用の顔画像として選択する処理を実行する構成を有することを特徴とする。
さらに、本発明の画像処理装置の一実施態様において、前記代表顔抽出部は、画像フレームから検出された検出顔各々の笑顔の度合いを判定し、笑顔の度合いの高いほど高いスコア値とした笑顔スコアを算出し、笑顔スコアの高い検出顔をインデックス用の顔画像として選択する処理を実行する構成を有することを特徴とする。
さらに、本発明の画像処理装置の一実施態様において、前記代表顔抽出部は、画像フレームから検出された検出顔各々の子供顔の度合いを判定し、子供顔の度合いの高いほど高いスコア値とした子供顔スコアを算出し、子供顔スコアの高い検出顔をインデックス用の顔画像として選択する処理を実行する構成を有することを特徴とする。
さらに、本発明の画像処理装置の一実施態様において、前記代表顔抽出部は、画像フレームから検出された検出顔各々の異なる特徴に基づく複数のスコアを算出し、さらに複数のスコアに基づいて総合スコアを算出して、総合スコアの高い検出顔をインデックス用の顔画像として選択する処理を実行する構成を有することを特徴とする。
さらに、本発明の画像処理装置の一実施態様において、前記代表顔抽出部は、選択されたインデックス用の顔画像に対応するメタデータを生成し、記録メディアに対する記録処理を実行する構成であることを特徴とする。
さらに、本発明の画像処理装置の一実施態様において、前記メタデータには、インデックス用の顔画像として選択された顔画像に対応するフレーム番号、顔位置情報、顔サイズ情報を含む構成であることを特徴とする。
さらに、本発明の画像処理装置の一実施態様において、前記メタデータには、インデックス用の顔画像として選択された顔画像に対応するスコア情報を含む構成であることを特徴とする。
さらに、本発明の第2の側面は、
撮像部と、
前記撮像部において撮影された動画像データを入力し、入力動画像データを構成する画像フレームから顔画像領域を検出し、検出した顔画像からインデックス情報とする顔画像を選択する処理を実行する代表顔抽出部を有し、
前記代表顔抽出部は、
画像フレームから検出された検出顔各々の特徴に基づくスコアを算出し、スコアの高い検出顔をインデックス用の顔画像として選択する処理を実行する構成を有することを特徴とする撮像装置にある。
さらに、本発明の第3の側面は、
画像処理装置において実行する画像処理方法であり、
代表顔抽出部が、動画像データを構成する画像フレームから顔画像領域を検出し、検出した顔画像からインデックス情報とする顔画像を選択する処理を実行する代表顔抽出ステップを有し、
前記代表顔抽出ステップは、
画像フレームから検出された検出顔各々の特徴に基づくスコアを算出し、スコアの高い検出顔をインデックス用の顔画像として選択する処理を実行するステップを有することを特徴とする画像処理方法にある。
さらに、本発明の第4の側面は、
画像処理装置において画像処理を実行させるコンピュータ・プログラムであり、
代表顔抽出部に、動画像データを構成する画像フレームから顔画像領域を検出し、検出した顔画像からインデックス情報とする顔画像を選択する処理を実行させる代表顔抽出ステップを有し、
前記代表顔抽出ステップは、
画像フレームから検出された検出顔各々の特徴に基づくスコアを算出し、スコアの高い検出顔をインデックス用の顔画像として選択する処理を実行するステップを有することを特徴とするコンピュータ・プログラムにある。
なお、本発明のコンピュータ・プログラムは、例えば、様々なプログラム・コードを実行可能な汎用コンピュータ・システムに対して、コンピュータ可読な形式で提供する記憶媒体、通信媒体によって提供可能なコンピュータ・プログラムである。このようなプログラムをコンピュータ可読な形式で提供することにより、コンピュータ・システム上でプログラムに応じた処理が実現される。
本発明のさらに他の目的、特徴や利点は、後述する本発明の実施例や添付する図面に基づくより詳細な説明によって明らかになるであろう。なお、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。
本発明の一実施例構成によれば、動画像データからインデックス画像とする顔画像を選択する構成において、画像フレームから検出された顔に対応するスコア、例えばフレーム内の顔の位置に応じた位置スコア、顔のサイズに応じたサイズスコア、顔らしさの度合いに応じた顔評価値スコア、先行する顔検出フレームとの検出位置の差分に応じた距離スコアなどを算出して、これらのスコアに基づいて算出する総合スコアの高い顔画像を優先的にインデックスに採用する構成としたので、多数の顔が出現する動画像データから、スコアの高い顔のみを効率的に選択してユーザにとって利用しやすい顔インデックス情報を生成することが可能となる。
以下、図面を参照しながら、本発明の画像処理装置、撮像装置、および画像表示制御方法、並びにコンピュータ・プログラムの詳細について説明する。
まず、図1のブロック図を参照して本発明の画像処理装置の一例である撮像装置100の構成について説明する。例えばユーザ操作部であるキー入力部106からの撮影開始信号がマイクロプロセッサ110に入力されると、マイクロプロセッサ110はコントロール信号を各構成部に出力して撮影処理が開始する。マイクロプロセッサ110からの制御に応じて、レンズ101のフォーカス機構、シャッター機構、絞り機構などを制御し被写体の画像を取り込んで、CCD(Charge Coupled Device)102に供給する。
CCD102は、画像を光電変換して被写体の画像(画像情報)を電気信号としてカメラ信号処理部103に出力する。カメラ信号処理部103は、CCD102から入力する画像信号に対する信号処理を実行する。例えば、CDS(Correlated Double Sampling)処理、AGC(Automatic Gain Control)処理、A/D(Analog/Digital)変換処理、さらに、AF(Auto Focus)、AE(Auto Exposure)、AWB(Auto White Balance)などのカメラ信号処理を施す。
カメラ信号処理部103は、さらに、代表顔抽出部114を有しており、代表顔抽出部114は、撮影される画像の各フレームデータに人物の顔領域が含まれるか否かの顔検出処理と、検出した顔画像をインデックス画像として選択するか否かの判定処理としてのインデックス用顔選択処理を実行する。以降、「顔検出処理」と「インデックス用顔選択処理」の二つの処理を合わせて「代表顔抽出処理」と呼ぶ。なお、画像の各フレームデータに人物の顔領域が含まれるか否かの顔検出処理には、既存の顔検出処理アルゴリズムが適用可能である。検出した顔画像をインデックス画像として選択するか否かの判定処理としてのインデックス用顔選択処理の詳細については後段で説明する。
カメラ信号処理部103において種々の調整がされた画像データは、代表顔抽出部114における顔検出処理およびインデックス用顔選択処理の結果として生成される撮影画像対応のメタデータとともに記録再生部104を介して記録メディア105に記録される。メタデータには、顔が検出されたフレームの情報、検出された顔領域の位置、サイズ、さらに、後段で説明するスコア情報などが含まれる。
記録再生部104は、予め設定された圧縮方式でデータ圧縮を実行し記録メディア105に圧縮データを記録する。映像信号の記録方式としては例えば、MPEG−4 AVC/H.264圧縮を用いた高精細(HD)映像記録、あるいはMPEG−2圧縮を用いた標準(SD)映像記録などが利用される。さらに、圧縮画像情報に対応する管理情報を記録した画像情報管理ファイル(例えばAVインデックスファイルと呼ばれる)を生成して記録メディア105に記録する。
画像情報管理ファイル(AVインデックスファイル)には、各フレーム対応のメタデータが記録される。前述したようにメタデータには、顔が検出されたフレームの情報、検出された顔領域の位置、サイズ、さらに、後段で説明するスコア情報などが含まれる。
さらに、撮影画像は記録再生部104を介して表示部109に出力され、表示部109には撮影画像がスルー画として表示される。カメラ信号処理部103の代表顔抽出部114において撮影フレーム中に顔検出がなされた場合には、スルー画に顔が検出されたことを示す顔検出アイコンが表示される。図2は、表示部109に表示される撮影画像(スルー画)の例を示している。この撮影画像に、顔領域が含まれるか否かが、カメラ信号処理部103の代表顔抽出部114において解析され、代表顔抽出部114において顔検出がなされた場合には、スルー画に顔が検出されたことを示す顔検出アイコン201が表示される。顔検出アイコン201の表示態様は、様々な設定が可能であるが、例えば、画面内に顔を検出したら反転点滅させるといった処理が実行される。
図1に戻り撮像装置の構成の説明を続ける。マイクロプロセッサ110はキー入力部106のキー操作情報、あるいは表示部109に表示されるGUI上の操作キーからユーザの操作情報を入力し、ユーザ指示に従った処理を実行する。表示部109は例えばLCDタッチパネルによって構成され、GUIが表示されてユーザの操作情報が入力可能な構成を持つ。
マイクロプロセッサ110は、バッテリ120またはAC電源から電源回路121を介して電力供給を受けて動作し、撮像装置100内部の様々な処理の制御を実行する。また、必要に応じて電源コントロール信号を制御して、他回路への電力供給制御を行う。マイクロプロセッサ110は、キー入力部106のキー、または、表示部109に表示されるGUI上のキーの入力をA/D変換し、変換デジタル値からどのキーが押されているか判断して、判断に応じて様々な処理を実行する。マイクロプロセッサ110は、CPU111、RAM112、ROM113などを有し、予め記録されたプログラムに従った処理を実行する。
例えば、マイクロプロセッサ110は、キー入力部106のキー、または、表示部109に表示されるGUI上のキーによって再生指示が入力されると、撮像装置を映像信号再生モードに切り替え、記録メディア105に記録されたデータを、記録再生部104を介して読み出し、復号処理を実行して重畳処理部108を介して表示部109に表示する。
オンスクリーディスプレイ(OSD)処理部107は、マイクロプロセッサ110から入力するコマンドを解釈し、VRAM上に作成された表示信号を走査単位で重畳処理部108へ送る。例えばGUI情報、マニュアル情報などの映像信号と異なる映像に重畳させて表示するデータを生成して重畳処理部108へ送る。重畳処理部108は、記録用映像信号、または再生された映像信号とオンスクリーディスプレイ(OSD)処理部107からの表示信号を重畳して表示部109に出力する。
本発明の撮像装置においては、マイクロプロセッサ110は、ユーザの指示に基づいて記録メディア105に記録された画像データのサムネイル画像一覧を生成して、表示部109に表示する。この際、記録メディア105に記録された各コンテンツの各々について、コンテンツ内から人物の顔を含む画像を選択して選択した顔を含む画像のサムネイル画像を生成して、これらを時系列サムネイル画像として表示部109に表示する。
なお、図1には、マイクロプロセッサ110内に点線枠で代表顔抽出部114'を示している。この代表顔抽出部114'は、カメラ信号処理部103における代表顔抽出部114と同様の処理を実行する。すなわち、各画像に人物の顔領域が含まれるか否かを判定する顔検出処理と、検出した顔画像をインデックス画像として選択するか否かの判定処理としてのインデックス用顔選択処理を実行する。顔検出処理とインデックス用顔選択処理は、カメラ信号処理部103において実行する構成としてもよいし、マイクロプロセッサ110内において実行する構成としてもよい。あるいは独立した専用のプロセッサを設けて、顔検出処理とインデックス用顔選択処理を実行する構成としてもよい。図1に示すマイクロプロセッサ110内の点線枠で示す代表顔抽出部114'は、カメラ信号処理部103ではなくマイクロプロセッサ110内に代表顔抽出部を設定してもよいことを示している。
さらに、マイクロプロセッサ110は、表示部109に表示された時系列サムネイル画像データに対するユーザ選択情報を入力して選択されたサムネイル画像に対応する画像位置からの再生処理を実行する。
本発明の撮像装置においては、マイクロプロセッサ110は、記録メディア105から例えばユーザ指定コンテンツの画像データを取得し、画像情報管理ファイルのメタデータ解析に基づいて、インデックスとして選択された顔画像の含まれるフレームを抽出し、抽出フレームからインデックスとして選択された顔領域を切り出して、顔サムネイル画像を生成し時系列順に並べた顔インデックス画像を表示部109に出力する。1つの動画記録データに対応する時系列顔サムネイル画像一覧リストの表示データを「顔インデックス画面(ビュー)」と呼ぶ。
顔インデックス画面の表示部109における表示例について図3を参照して説明する。「顔インデックス画面」は、カメラ信号処理部103の代表顔抽出部114、または、マイクロプロセッサ110の代表顔抽出部114'において、撮影画像の各フレームデータに人物の顔領域が含まれるか否かの顔検出処理と、検出した顔画像をインデックスとして選択抽出するかを判定するインデックス用顔選択処理を実行した結果として得られるメタデータに基づいて生成される顔領域のサムネイル画像(縮小画像)の時系列一覧画像データである。
この顔インデックス画面に表示するサムネイル画像は、顔インデックス画面の表示要求があった時点でマイクロプロセッサ110が生成し、マイクロプロセッサ110内のRAM112に一時的にサムネイル画像を格納するとともに、生成したサムネイル画像を表示部109に出力して表示する。顔インデックス画面において利用されるサムネイル画像は、記録メディア105には記録されない。従って、記録メディアの記録領域を減少させることはない。マイクロプロセッサ110は、記録メディア105に記録された圧縮画像(例えばMPEG−4 AVC/H.264圧縮を用いた高精細(HD)映像、あるいはMPEG−2圧縮を用いた標準(SD)映像)を取得してフレーム内圧縮符号化画像(I−Picture、I−FrameまたはI−VOPとも呼ばれる)を切りだし、縮小処理を実行して顔インデックス一覧領域に順番に並べて表示する。なお、顔インデックス画面に適用するサムネイル画像の生成手法の詳細については後段でさらに説明する。
顔インデックス画面の詳細構成について、図3を参照して説明する。顔インデックス画面には、コンテンツインデックス表示領域301と、顔インデックス表示領域302が含まれる。
コンテンツインデックス表示領域301は、1つの動画記録データ単位である1つのコンテンツから選択された1つの代表画像を表示する領域であり、コンテンツインデックス送り/戻しキー303a,bを操作することで、異なるコンテンツの代表画像を提示することができる。なお、このコンテンツインデックス表示領域301に表示される代表画像は、例えばコンテンツの先頭画のサムネイル画像である。
一方、顔インデックス表示領域302は、コンテンツインデックス表示領域301に表示されたサムネイル画像が属するコンテンツ(動画像データ)から、顔検出処理と、インデックス用顔選択処理の結果得られるメタデータに基づいてインデックスとして選択された顔領域を含むフレームからその顔領域を切り出した顔のサムネイル画像(縮小画像)の一覧画像データが表示される領域である。
この顔インデックス表示領域302には、顔インデックス送り/戻しキー306a,bが表示され、この顔インデックス送り/戻しキー306a,bを操作することで、同一コンテンツの異なる時間の顔インデックスとしてのサムネイル画像を表示することができる。なお、1つの静止画に複数の顔画像領域が含まれる場合は、複数の顔画像が顔インデックス表示領域302に並べて表示される。
コンテンツインデックス表示領域301中のコンテンツインデックス送り/戻しキー303a,bを操作することで、顔インデックス表示領域302に表示される顔インデックスも、コンテンツインデックス表示領域301に表示されるインデックスに対応して切り替えられることになる。
次に、図4に示すフローチャートを参照して本発明の画像処理装置において実行する処理について概略的に説明する。図4に示すフローチャートは、図1に示す撮像装置において、画像を撮影し撮影画像を記録メディア105に記録する際の処理であり、顔検出処理およびインデックス用顔選択処理、さらに、これらの処理に基づいて生成されるメタデータの記録処理のシーケンスを説明している。この図4に示すフローは、図1に示すマイクロプロセッサ110の制御の下、主に代表顔抽出部114および記録再生部104の処理として実行される処理である。
図4に示すフローチャートに示す各ステップの処理について説明する。先ず、ステップS101において、代表顔抽出部114は、撮影される動画像から顔検出を実行するための画像フレームを抽出する。フレーム抽出は例えば撮影画像から所定間隔の周期に基づくフレーム選択処理として実行される。フレームの抽出周期は様々な設定が可能である。例えば、1フレーム毎、すなわち全フレームを抽出してもよいし、数フレーム毎に行ってもよい。
ステップS101のフレーム抽出処理の詳細について図5を参照して説明する。例えば、記録メディア105に対する記録データの動画像圧縮フォーマットとしてMPEGやAVCを用いる場合、これらの圧縮画像データ400には、それぞれ異なる態様で圧縮されたフレーム(ピクチャ)が含まれる。具体的には、フレーム内圧縮符号化画像(Iピクチャ)、さらに、よりデータ量が少ないBフレーム(Bピクチャ)、Pフレーム(Pピクチャ)などである。これらの符号化データの中で、1つのデータから復号可能なのはフレーム内圧縮符号化画像である。
顔検出を実行するための画像フレームは、インデックス表示に用いる顔画像を選択するためのフレームであるので、インデックス表示処理が容易にできるフレームを選ぶことが好ましい。フレーム内圧縮符号化画像(Iピクチャ)は、他の参照画像を用いることなく復号可能なフレームであり、このフレーム内圧縮符号化画像(Iピクチャ)を選択フレーム401とすることが好ましい。また、GOP周期毎(15フレーム周期等)に処理を行うことで、再生モード時に素早く所望のフレームにアクセスすることができるため、GOP周期毎のフレーム抽出、若しくは2GOP周期などの間隔でのフレーム抽出処理を行なう構成とすることが好ましい。なお、システムの性能に応じて、もっと長い周期でフレームを抽出してもよい。
ステップS101において、動画像から顔検出を実行するための画像フレームの抽出がなされると、次にステップS102において、抽出したフレーム中に顔領域が含まれるか否かの顔検出処理を実行する。顔検出処理は、既存の技術によって実行可能であり、例えば、「特開2005−157679」に記載された技術を用いて実行する。このステップS102において、フレームから顔が検出された場合は、検出された全ての顔に対する
「フレーム内の座標位置」、
「サイズ」、
「(顔らしさを表す)顔スコア評価値」
を求め、これらの情報をメモリに保存する。
顔に対する「フレーム内の座標位置」、「サイズ」について、図6を参照して説明する。
顔の「フレーム内の座標位置」は、例えば図6に示すように、フレームの左上端を原点、横方向をX、縦方向をYとして、フレームから検出された顔領域421左上端までのオフセットの座標(X,Y)として求められる。
顔の「サイズ」は、フレームから検出された顔領域421のX方向の幅と、Y方向の高さとして算出される。
なお、「(顔らしさを表す)顔スコア評価値」は、例えば、「特開2005−157679」に記載された技術を用いて実行される顔検出において、人物の顔である確からしさを示す評価値であり、人物の顔であると特定できる特徴量が多い場合には、高い評価値となり、少ない場合は低い評価値となる。なお、この評価値算出処理の詳細は、「特開2005−157679」に記載されており、本発明においても、この開示技術を適用して「(顔らしさを表す)顔スコア評価値」を算出する。
次にステップS103において、インデックス用顔選択処理を実行する。ステップS102では、例えば、フレーム内圧縮符号化画像(Iピクチャ)を選択フレームとして顔検出が実行されるが、検出された顔をすべてインデックス画像に設定してしまうと、人物を中心として撮影した動画像では、ほとんどのフレームに顔が検出され、これらを全てインデックス画像として設定してしまうと、膨大な数のインデックス顔画像が設定されることになりインデックスとしての意味がなくなってしまう。
そこで、ステップS103では、ステップS102において検出された顔画像から、インデックスとして利用する顔画像を選択する処理を実行する。ステップS103の処理は、ステップS101〜S102までの処理において顔が1つでも検出されたフレームについて実行する。すなわち、検出された顔の各々に対してスコアを算出して、スコアの高いものをインデックス顔として選択する。ステップS103の詳細処理の一例について、図7に示すフローチャートを参照して説明する。
図7に示すフローチャートは、図4に示すステップS101,S102において顔が検出されたフレーム毎に実行する処理である。すなわち顔検出フレーム毎にステップS201〜S208の処理が逐次実行される。
まず、ステップS201において、ステップS102において検出された顔に対する「顔の位置」に応じた位置スコアを算出する。処理対象となる1つの顔検出フレームに検出された顔の各々について位置スコアを算出する。複数の顔が検出された場合は、各顔についてのスコアを算出する。
この位置スコアは、検出された顔の位置がフレームの中心に近いほどスコア値が高く、中心から離れるに従ってスコア値が低い設定としたスコアである。
具体的な設定としては、例えばフレームの領域を中心領域と外周領域の2つに区分して、
中心領域に顔が検出された場合:位置スコア=100
外周領域に顔が検出された場合:位置スコア=0
とするような領域を複数に区分して区分に応じたスコアを設定するデジタル的なスコア設定や、顔の位置が中心から外周に行くに従ってなだらかにスコア値を低下させるアナログ的なスコア設定などが適用可能である。
次に、ステップS202において、ステップS102において検出された顔に対する「顔のサイズ」に応じたサイズスコアを算出する。処理対象となる1つの顔検出フレームに検出された顔の各々についてサイズスコアを算出する。複数の顔が検出された場合は、各顔についてのスコアを算出する。
このサイズスコアは、検出された顔のサイズが大きいほどスコア値が高く、小さいほどスコア値が低い設定としたスコアである。
具体的な設定としては、例えばある閾値サイズを設定して、
閾値サイズ以上の顔:サイズスコア=100
閾値サイズ未満の顔:サイズスコア=0
とするサイズを複数に区分して区分に応じたスコアを設定するデジタル的なスコア設定や、顔のサイズが大から小となるに従ってなだらかにスコア値を低下させるアナログ的なスコア設定などが適用可能である。
次に、ステップS203において、ステップS102において検出された顔に対する「(顔らしさを表す)顔スコア評価値」に応じた顔評価値スコアを算出する。処理対象となる1つの顔検出フレームに検出された顔の各々について顔評価値スコアを算出する。複数の顔が検出された場合は、各顔についてのスコアを算出する。
「(顔らしさを表す)顔スコア評価値」は、前述したように、例えば、「特開2005−157679」に記載され、人物の顔であると特定できる特徴量が多い場合には、高い評価値となり、少ない場合は低い評価値となる。顔評価値スコアは、この評価値に応じて設定される。この顔評価値スコアは、検出された顔の顔スコア評価値が高いほどスコア値が高く、低いほどスコア値が低い設定としたスコアである。
具体的な設定としては、例えばある閾値を設定して、
閾値以上の顔評価値を持つ顔:顔評価値スコア=100
閾値未満の顔評価値を持つ顔:顔評価値スコア=0
とする評価値を複数に区分して区分に応じたスコアを設定するデジタル的なスコア設定や、高評価値から低評価値となるに従ってなだらかにスコア値を低下させるアナログ的なスコア設定などが適用可能である。
次に、ステップS204において、ステップS102において検出された顔に対する「距離スコア」を算出する。処理対象となる1つの顔検出フレームに検出された顔の各々について距離スコアを算出する。複数の顔が検出された場合は、各顔についてのスコアを算出する。
距離スコアについて、図8を参照して説明する。距離スコアを算出するフレームを図8に示す距離スコア算出フレーム451とする。この距離スコア算出フレーム451は、図4に示すフローのステップS102において顔検出がなされたフレームである。
図8に示す距離スコア算出フレーム451は、時刻(T)のフレーム画像であり、3つの顔[P1(t),P2(t),P3(t)]が検出されている。距離スコアは、これらの3つの顔の各々について算出する。
距離スコア算出処理フレーム(T)の検出顔[P1(t),P2(t),P3(t)]各々のスコアは、
前回の処理フレーム、すなわち、図4に示すフローのステップS102において顔検出がなされたフレームとして時刻(T)の距離スコア算出フレーム451の以前のフレーム(T−1)の検出顔[P1(t−1),P2(t−1)]を参照して実行される。すなわち、図8に示す参照フレーム461である。
距離スコア算出処理フレーム(T)の検出顔[P1(t),P2(t),P3(t)]各々のスコアは、前回の処理フレーム(T−1)の検出顔[P1(t−1),P2(t−1)]各々との距離に基づいて算出される。
例えば、
前回の処理フレーム(T−1)の検出顔[P1(t−1),P2(t−1)]に最も近い位置にある今回の処理フレームの検出顔のスコアは[0]、それ以外の顔のスコアは[100]を与えるといった処理によって距離スコアを算出する。
例えば、距離スコア算出フレーム451の顔[P1(t)]の距離スコアは、
P1(t):距離スコア=(0+100)=100
となる。(0+100)の0は、距離スコア算出フレーム451の顔[P1(t)]は、参照フレーム461である前回の処理フレーム(T−1)の検出顔[P1(t−1)に最も近い位置にあるという条件に基づいて設定されたスコア[0]であり、(0+100)の100は、距離スコア算出フレーム451の顔[P1(t)]は、参照フレーム461である前回の処理フレーム(T−1)の検出顔[P2(t−1)に最も近い位置にないという条件に基づいて設定されたスコア[100]である。距離スコア算出フレーム451の顔[P1(t)]の距離スコアは、これらのスコア[0]と[100]の加算値として、算出され、
P1(t):距離スコア=(0+100)=100
となる。
また、距離スコア算出フレーム451の顔[P2(t)]の距離スコアは、
P2(t):距離スコア=(100+0)=100
となる。(100+0)の100は、距離スコア算出フレーム451の顔[P2(t)]は、参照フレーム461である前回の処理フレーム(T−1)の検出顔[P1(t−1)に最も近い位置にないという条件に基づいて設定されたスコア[100]であり、(100+0)の0は、距離スコア算出フレーム451の顔[P2(t)]は、参照フレーム461である前回の処理フレーム(T−1)の検出顔[P2(t−1)に最も近い位置にあるという条件に基づいて設定されたスコア[0]である。距離スコア算出フレーム451の顔[P2(t)]の距離スコアは、これらのスコア[100]と[0]の加算値として、算出され、
P2(t):距離スコア=(100+0)=100
となる。
また、距離スコア算出フレーム451の顔[P3(t)]の距離スコアは、
P3(t):距離スコア=(100+100)=200
となる。(100+100)の先の100は、距離スコア算出フレーム451の顔[P3(t)]は、参照フレーム461である前回の処理フレーム(T−1)の検出顔[P1(t−1)に最も近い位置にないという条件に基づいて設定されたスコア[100]であり、(100+100)の後の100は、距離スコア算出フレーム451の顔[P3(t)]は、参照フレーム461である前回の処理フレーム(T−1)の検出顔[P2(t−1)に最も近い位置にないという条件に基づいて設定されたスコア[100]である。距離スコア算出フレーム451の顔[P3(t)]の距離スコアは、これらのスコア[100]と[100]の加算値として、算出され、
P3(t):距離スコア=(100+100)=200
となる。
このように、距離スコア算出フレーム451において検出された顔のスコアは、参照フレームの検出顔との距離に応じて設定される。これは、同じ位置にある顔は同一人物である可能性が高く、同一人物の顔をインデックスとして複数採用することは好ましくなく、できるだけ異なる人物の顔をインデックスとして採用したいという要請に基づいて実行される処理である。
なお、この距離スコアについても、図8を参照して説明したスコア算出処理においては、距離スコア算出フレーム451において検出された顔が、参照フレームにおいて検出された顔の位置に最も近い場合は距離スコアを[0]、それ以外の場合は[100]として設定する例を示したが、このようなデジタル的なスコア設定とするのではなく、距離スコア算出フレーム451において検出された顔が、参照フレームにおいて検出された顔の位置に一致する場合は低スコアとして、離れるに従って次第に高スコアとするといったアナログ的なスコア設定としてもよい。
次に、ステップS205において、ステップS201〜S204において算出した4種類のスコア、すなわち、
(a)位置スコア
(b)サイズスコア
(c)顔評価値スコア
(d)距離スコア
これら4種類のスコアから総合スコアを算出して、総合スコアの高い顔から順に並べるソート処理を実行する。処理対象となる1つの顔検出フレームに検出された顔の各々について総合スコアを算出してソートする。なお、総合スコアの算出には、例えば、各スコアに対する重み設定パラメータを適用した加算を適用する。
具体的には、
(a)位置スコア=Sa
(b)サイズスコア=Sb
(c)顔評価値スコア=Sc
(d)距離スコア=Sd
として、各スコアに対する重み設定パラメータをp,q,r,sとして設定し、総合スコア[Sall]を以下の式によって算出する。
総合スコア[Sall]=p(Sa)+q(Sb)+r(Sc)+s(Sd)
上記式によって算出する。なお、重みパラメータは、すべて1としてもよいし、例えば距離スコアに対する重みを大きくする設定とするなど、様々な設定が可能である。
このように、ステップS205では、処理対象となる1つの顔検出フレームに検出された顔の各々について(a)位置スコア、(b)サイズスコア、(c)顔評価値スコア、(d)距離スコア、これら4種類のスコアから総合スコアを算出して、総合スコアの高い顔から順に並べるソート処理を実行する。
ステップS206では、処理対象フレーム、すなわち、各スコアの算出および総合スコアの算出処理を実行したフレームにおいて検出された顔の数と、前回の処理フレーム、すなわち、図4に示すフローチャートのステップS101において処理フレームとして選択したフレームにおいて検出された顔の数を比較し、今回の処理フレームの検出顔数が、前回処理フレームの検出顔数より増加しているか否かを判定する。増加している場合は、ステップS207に進む。増加していない場合は、ステップS208に進む。
ステップS207では、処理対象フレームにおいて検出され総合スコア順にソートされた顔のうち、総合スコア値が高い顔を複数個、または、最も高いものを一つだけインデックス顔として選択し、それらの顔のメタ情報(フレーム番号、位置、サイズ、顔評価値スコア、総合スコアなど)を、メタ情報記録処理部へ出力する。この処理の後、図4に示すステップS104の処理、すなわちメタ情報記録処理が実行される。すなわち、ステップS207において、処理対象フレームから総合スコア順に選択された顔がインデックス顔(代表顔)として決定され、そのインデックス顔に対応するメタ情報が記録メディア105(図1参照)に記録されることになる。ステップS207においてスコアが低く選択されなかった顔はインデックスとしては設定されないことになる。
なお、1フレームからインデックス顔(代表顔)として選択する顔の数は予め設定した情報を用いる。この数はユーザが設定可能としてもよく、この場合は、予めユーザの入力値として選択数を入力し、入力された選択数に応じて総合スコア順に応じた顔数をインデックス顔として選択する。
ステップS206において、今回の処理フレームの検出顔数が、前回処理フレームの検出顔数より増加していない場合は、ステップS208に進み、ステップS207の処理は実行されない。従って、今回の処理フレームの検出顔数が、前回処理フレームの検出顔数より増加していない場合は、今回の処理フレームから検出された顔についてはインデックス顔として選択されない。
ステップS208では、処理対象の顔検出フレームの検出顔の位置情報をメモリに記録する。これは、ステップS204における距離スコア算出のための参照フレーム(図8に示す参照フレーム461)として利用するための情報である。
このように、図4のフローにおけるステップS103のインデックス用顔選択処理は、例えば図7に示すフローに従って実行され、ステップS102において検出された顔画像から、インデックスとして利用する顔画像が選択される。ステップS104では、ステップS103のインデックス用顔選択処理において選択された顔に対応するメタ情報、すなわち、インデックスとして選択された顔に対応するフレーム番号、位置、サイズ、顔評価値スコア、総合スコアなどのデータが、インデックス顔に対応するメタ情報として記録メディア105(図1参照)に記録される。
このように、本発明の装置では、動画像を構成するフレームから選択されたフレーム(例えばフレーム内圧縮符号化画像(Iピクチャ))について顔検出を実行して、顔が検出されたフレームについては、図7に示すインデックス用顔選択処理を実行し、検出した各顔についての
(a)位置スコア
(b)サイズスコア
(c)顔評価値スコア
(d)距離スコア
これら4種類のスコアを算出して、さらに総合スコアを算出し、総合スコアの高い顔から順に並べるソート処理を行い、総合スコアの高い顔のみをインデックス用の顔とする設定とした。さらに、処理対象の顔検出フレームと先行する処理フレームとの検出顔数を比較して、先行の処理フレームの検出顔数より、今回の顔検出顔数が増加している場合に、その処理対象フレームの検出顔をインデックス候補として設定する構成としたので、例えば同一人物を連続して撮影している場合など、顔の検出数が各フレームで一定である場合は、顔が現れたフレームや、一旦、人物が途切れて再登場したフレームにおいて検出された顔がインデックスとして登録され、連続するフレームの同一人物をインデックスとして設定することが防止され、適度な数に設定されたインデックスの生成が実現される。
インデックス顔として選択された顔に対するメタ情報は図4に示すフローのステップS104において記録メディア105(図1参照)に記録される。前述のようにこのメタ情報には、インデックスとして選択された顔に対応するフレーム番号、位置、サイズ、顔評価値スコア、総合スコアなどのデータが含まれる。
具体的なメタデータのデータ構成例について図9を参照して説明する。メタデータは、例えば記録メディア105(図1参照)に記録される画像データに対応して記録される画像情報管理ファイル(AVインデックスファイル)の構成データとしての顔情報管理ファイルに記録される。顔情報管理ファイルは、図9(a)に示すように、インデックス用の顔として選択されたインデックス顔(代表顔)各々のメタデータの集積ファイルであり、各顔のメタデータは、図9(b)に示すデータ構成を持つ。
すなわち、インデックスとして選択された顔(代表顔)に対応するフレーム番号に相当する顔検出フレームの時刻情報(上位4バイトと下位4バイト)、顔のフレーム内の位置情報(4バイト)、顔のサイズ(4バイト)、顔評価値スコア(4バイト)、総合スコア(4バイト)、これらのデータが含まれる。なお、顔のフレーム内の位置情報、顔のサイズ情報は、先に図6を参照して説明したデータに対応する。図9(b)に示すメタデータの構成は一例であり、例えば顔評価値スコア(4バイト)や、総合スコア(4バイト)は省略した設定としてもよい。
実際にインデックス表示を実行する場合は、これらのメタデータを適用してフレーム選択および顔領域の情報が取得され、顔領域の切り取りを実行して、図3に示すような顔インデックス表示が行なわれることになる。このインデックス表示処理に際して、例えば、メタデータ中に、顔評価値スコア(4バイト)や、総合スコア(4バイト)を含む構成とした場合は、総合評価値の高いもののみを選択して表示する処理や、顔評価値スコアの高いもののみとを選択して表示するといった制御を行なうことが可能となる。
図7のフローを参照して説明したインデックス用顔選択処理では、検出された顔についての
(a)位置スコア
(b)サイズスコア
(c)顔評価値スコア
(d)距離スコア
これらのスコア情報に基づくインデックス顔(代表顔)選択処理を行っていたが、インデックス顔(代表顔)として選択する基準としては、これらの情報以外の情報を利用する構成としてもよい。以下、
(1)個人識別情報を適用したインデックス顔の選択処理例
(2)笑顔検出情報を適用したインデックス顔の選択処理例
(3)子供顔検出情報を適用したインデックス顔の選択処理例
これらの処理例について、それぞれ図10、図11、図12に示すフローチャートを参照して説明する。なお、図10、図11、図12に示すフローチャートは、先に説明した図7のフローチャートに対応する処理であり、図4に示すフローにおけるステップS103のインデックス用顔選択処理の変更例であり、顔の検出されたフレームに対する処理として実行される。
(1)個人識別情報を適用したインデックス顔の選択処理例
まず、図10を参照して個人識別情報を適用したインデックス顔の選択処理例について説明する。この処理例は、検出した顔の個人識別を行なう処理例である。先に説明した実施例、すなわち図7を参照して説明したインデックス顔の選択処理では、検出した顔が同一人物の顔であるか異なる人物であるかといった、いわゆる個人識別を行っていない。本処理例では、この個人識別を実行して、過去フレームにおいてインデックス顔として選択された顔と異なる人物の顔が検出された場合、異なる人物の顔を優先的にインデックスとして選択する処理を行なうものである。
図10に示すインデックス顔の選択処理フローに従って本処理例について説明する。上述したように図10に示すフローチャートは、先に説明した図7のフローチャートに対応する処理であり、図4に示すフローにおけるステップS103のインデックス用顔選択処理であり、顔の検出されたフレームに対する処理として実行される。
まず、ステップS301において、処理対象フレーム内に検出された全ての顔に対し、前回の処理時に検出された顔との個人識別を行い、明らかに同一であると判定できる顔と、そうでない顔に分ける。すなわち、
(a)処理対象フレーム内の検出顔、
(b)先行して処理された顔検出フレームにおける検出顔
これらの顔の個人識別を実行し、処理対象フレーム内の検出顔に、先行して処理された顔検出フレームにおける検出顔と異なる人物の顔が存在するか否かを判定する。なお、検出顔が同一人物であるか否かを識別するいわゆる個人識別処理は、顔検出処理に際して取得される顔画像の特徴量の比較により実行することができる。例えば顔画像認識処理を開示した特開平7−128031、論文「[ピクセル差分特徴を用いた実時間任意姿勢顔検出器の学習]第10回画像センシングシンポジウム予稿集、pp.547-552, 2004.」などに開示された技術などの適用により実行される。
ステップS302では、処理対象フレーム内に前回の処理時に検出された顔と異なる顔が含まれているかの判定を行い、明らかに同一であると判定できなかった顔がある場合は、ステップS303に進み、インデックス顔の選定処理を実行し、ない場合は、インデックス顔の選定処理を実行することなくステップS308に進む。
ステップS303〜S305の3つのステップの処理は、図7を参照して説明したステップS201〜S203の処理に対応する。すなわち、新たな人物の顔であると推定される顔についての
(a)位置スコア
(b)サイズスコア
(c)顔評価値スコア
これらの各スコアを算出する。
ステップS306では、これら3種類のスコアから総合スコアを算出して、総合スコアの高い顔から順に並べるソート処理を実行する。前回の顔検出フレームと異なる顔であると推定された顔の各々について総合スコアを算出してソートする。なお、総合スコアの算出には、前述した処理例と同様、例えば、各スコアに対する重み設定パラメータを適用した加算を適用する。
具体的には、
(a)位置スコア=Sa
(b)サイズスコア=Sb
(c)顔評価値スコア=Sc
として、各スコアに対する重み設定パラメータをp,q,rとして設定し、総合スコア[Sall]を以下の式によって算出する。
総合スコア[Sall]=p(Sa)+q(Sb)+r(Sc)
上記式によって算出する。
ステップS307では、総合スコア順にソートされた顔のうち、総合スコア値が高い顔を複数個、または、最も高いものを一つだけインデックス顔として選択し、それらの顔のメタ情報(フレーム番号、位置、サイズ、顔評価値スコア、総合スコアなど)を、メタ情報記録処理部へ出力する。この処理の後、図4に示すステップS104の処理、すなわちメタ情報記録処理が実行される。
ステップS308では、処理対象の顔検出フレームの顔画像情報をメモリに記録する。これは、次の処理フレームに対するステップS301の個人識別処理において比較する顔画像として利用するためである。
本処理例では、個人識別処理を実行して、検出した顔が同一人物の顔であるか異なる人物であるかの識別を実行し、過去フレームにおいてインデックス顔として選択された顔と異なる人物の顔が検出された場合、異なる人物の顔を優先的にインデックスとして選択する処理を行なう構成としたので、複数の人物が登場する動画像データにおいて、各人物の登場タイミングに応じたインデックス顔の設定が可能となる。
(2)笑顔検出情報を適用したインデックス顔の選択処理例
次に、図11を参照して笑顔検出情報を適用したインデックス顔の選択処理例について説明する。この処理例は、検出した顔が笑顔であるか否かを判別して笑顔である場合に優先的にインデックスとして選択する処理を行なうものである。
図11に示すインデックス顔の選択処理フローに従って本処理例について説明する。上述したように図11に示すフローチャートは、先に説明した図7のフローチャートに対応する処理であり、図4に示すフローにおけるステップS103のインデックス用顔選択処理であり、顔の検出されたフレームに対する処理として実行される。
まず、ステップS401において、処理対象フレーム内に検出された全ての顔に対し、「笑顔の度合い」を求め、ステップS402において、「笑顔の度合い」に応じたスコア、すなわち笑顔スコアを算出する。「笑顔の度合い」は、顔検出処理に際して取得される顔画像の特徴量に基づいて算出することができる。例えば顔画像認識処理を開示した特開平7−128031、論文「[ピクセル差分特徴を用いた実時間任意姿勢顔検出器の学習]第10回画像センシングシンポジウム予稿集、pp.547-552, 2004.」などに開示された技術などの適用により実行される。
笑顔スコアは、検出された顔の「笑顔の度合い」が高いほどスコア値が高く、「笑顔の度合い」が低くなるに従ってスコア値が低い設定としたスコアである。
具体的な設定としては、例えば「笑顔の度合い」を示す数値に閾値を設定し、
閾値以上の笑顔の度合いを持つ顔:笑顔スコア=100
閾値未満の笑顔の度合いを持つ顔:笑顔スコア=0
とするようなスコア設定をするデジタル的なスコア設定や、笑顔の度合いを示す数値に応じてなだらかにスコア値を低下させるアナログ的なスコア設定などが適用可能である。
ステップS403〜S407の処理は、図7を参照して説明したステップS204〜S208の処理に対応する。すなわち、本処理例では、
(a)笑顔スコア(ステップS402)
(b)距離スコア(ステップS403)
これらの各スコアを算出して、ステップS404で、これら2種類のスコアから総合スコアを算出して、総合スコアの高い顔から順に並べるソート処理を実行する。距離スコアの算出処理は、先に図8を参照して説明した処理と同様である。
総合スコアの算出には、前述した処理例と同様、例えば、各スコアに対する重み設定パラメータを適用した加算を適用する。具体的には、
(a)笑顔スコア=Sa
(b)距離スコア=Sb
として、各スコアに対する重み設定パラメータをp,qとして設定し、総合スコア[Sall]を以下の式によって算出する。
総合スコア[Sall]=p(Sa)+q(Sb)
上記式によって算出する。
ステップS405では、処理対象フレーム、すなわち、各スコアの算出および総合スコアの算出処理を実行したフレームにおいて検出された顔の数と、前回の処理フレーム、すなわち、図4に示すフローチャートのステップS101において処理フレームとして選択したフレームにおいて検出された顔の数を比較し、今回の処理フレームの検出顔数が、前回処理フレームの検出顔数より増加しているか否かを判定する。増加している場合は、ステップS406に進む。増加していない場合は、ステップS407に進む。
ステップS406では、総合スコア順にソートされた顔のうち、総合スコア値が高い顔を複数個、または、最も高いものを一つだけインデックス顔として選択し、それらの顔のメタ情報(フレーム番号、位置、サイズ、顔評価値スコア、総合スコアなど)を、メタ情報記録処理部へ出力する。この処理の後、図4に示すステップS104の処理、すなわちメタ情報記録処理が実行される。
ステップS407では、処理対象の顔検出フレームの検出顔の位置情報をメモリに記録する。これは、ステップS403における距離スコア算出のための参照フレーム(図8に示す参照フレーム461)として利用するための情報である。
本処理例では、検出顔の笑顔の度合いを算出する処理を実行して、笑顔の度合いの高い顔のスコアを高くして優先的にインデックスとして選択する処理を行なう構成としたので、様々な表情の顔がある場合、笑顔を優先的に選択してインデックスとして設定する処理が可能となる。
(3)子供顔検出情報を適用したインデックス顔の選択処理例
次に、図12を参照して子供顔検出情報を適用したインデックス顔の選択処理例について説明する。この処理例は、検出した顔が子供顔であるか否かを判別して子供顔である場合に優先的にインデックスとして選択する処理を行なうものである。
図12に示すインデックス顔の選択処理フローに従って本処理例について説明する。上述したように図12に示すフローチャートは、先に説明した図7のフローチャートに対応する処理であり、図4に示すフローにおけるステップS103のインデックス用顔選択処理であり、顔の検出されたフレームに対する処理として実行される。
まず、ステップS501において、処理対象フレーム内に検出された全ての顔に対し、「子供顔の度合い」を求め、ステップS502において、「子供顔の度合い」に応じたスコア、すなわち子供顔スコアを算出する。「子供顔の度合い」は、顔検出処理に際して取得される顔画像の特徴量に基づいて算出することができる。例えば顔画像認識処理を開示した特開平7−128031、論文「[ピクセル差分特徴を用いた実時間任意姿勢顔検出器の学習]第10回画像センシングシンポジウム予稿集、pp.547-552, 2004.」などに開示された技術などの適用により実行される。
子供顔スコアは、検出された顔の「子供顔の度合い」が高いほどスコア値が高く、「子供顔の度合い」が低くなるに従ってスコア値が低い設定としたスコアである。
具体的な設定としては、例えば「子供顔の度合い」を示す数値に閾値を設定し、
閾値以上の子供顔の度合いを持つ顔:子供顔スコア=100
閾値未満の子供顔の度合いを持つ顔:子供顔スコア=0
とするようなスコア設定をするデジタル的なスコア設定や、子供顔の度合いを示す数値に応じてなだらかにスコア値を低下させるアナログ的なスコア設定などが適用可能である。
ステップS503〜S507の処理は、図7を参照して説明したステップS204〜S208の処理に対応する。すなわち、本処理例では、
(a)子供顔スコア(ステップS502)
(b)距離スコア(ステップS503)
これらの各スコアを算出して、ステップS504で、これら2種類のスコアから総合スコアを算出して、総合スコアの高い顔から順に並べるソート処理を実行する。距離スコアの算出処理は、先に図8を参照して説明した処理と同様である。
総合スコアの算出には、前述した処理例と同様、例えば、各スコアに対する重み設定パラメータを適用した加算を適用する。具体的には、
(a)子供顔スコア=Sa
(b)距離スコア=Sb
として、各スコアに対する重み設定パラメータをp,qとして設定し、総合スコア[Sall]を以下の式によって算出する。
総合スコア[Sall]=p(Sa)+q(Sb)
上記式によって算出する。
ステップS505では、処理対象フレーム、すなわち、各スコアの算出および総合スコアの算出処理を実行したフレームにおいて検出された顔の数と、前回の処理フレーム、すなわち、図4に示すフローチャートのステップS101において処理フレームとして選択したフレームにおいて検出された顔の数を比較し、今回の処理フレームの検出顔数が、前回処理フレームの検出顔数より増加しているか否かを判定する。増加している場合は、ステップS506に進む。増加していない場合は、ステップS507に進む。
ステップS506では、総合スコア順にソートされた顔のうち、総合スコア値が高い顔を複数個、または、最も高いものを一つだけインデックス顔として選択し、それらの顔のメタ情報(フレーム番号、位置、サイズ、顔評価値スコア、総合スコアなど)を、メタ情報記録処理部へ出力する。この処理の後、図4に示すステップS104の処理、すなわちメタ情報記録処理が実行される。
ステップS507では、処理対象の顔検出フレームの検出顔の位置情報をメモリに記録する。これは、ステップS503における距離スコア算出のための参照フレーム(図8に示す参照フレーム461)として利用するための情報である。
本処理例では、検出顔の子供顔の度合いを算出する処理を実行して、子供顔の度合いの高い顔のスコアを高くして優先的にインデックスとして選択する処理を行なう構成としたので、様々な登場人物があるデータにおいて、子供顔を優先的に選択してインデックスとして設定する処理が可能となる。
以上、特定の実施例を参照しながら、本発明について詳解してきた。しかしながら、本発明の要旨を逸脱しない範囲で当業者が実施例の修正や代用を成し得ることは自明である。すなわち、例示という形態で本発明を開示してきたのであり、限定的に解釈されるべきではない。本発明の要旨を判断するためには、特許請求の範囲の欄を参酌すべきである。
また、明細書中において説明した一連の処理はハードウェア、またはソフトウェア、あるいは両者の複合構成によって実行することが可能である。ソフトウェアによる処理を実行する場合は、処理シーケンスを記録したプログラムを、専用のハードウェアに組み込まれたコンピュータ内のメモリにインストールして実行させるか、あるいは、各種処理が実行可能な汎用コンピュータにプログラムをインストールして実行させることが可能である。例えば、プログラムは記録媒体に予め記録しておくことができる。記録媒体からコンピュータにインストールする他、LAN(Local Area Network)、インターネットといったネットワークを介してプログラムを受信し、内蔵するハードディスク等の記録媒体にインストールすることができる。
なお、明細書に記載された各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。また、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。
以上、説明したように、本発明の一実施例構成によれば、動画像データからインデックス画像とする顔画像を選択する構成において、画像フレームから検出された顔に対応するスコア、例えばフレーム内の顔の位置に応じた位置スコア、顔のサイズに応じたサイズスコア、顔らしさの度合いに応じた顔評価値スコア、先行する顔検出フレームとの検出位置の差分に応じた距離スコアなどを算出して、これらのスコアに基づいて算出する総合スコアの高い顔画像を優先的にインデックスに採用する構成としたので、多数の顔が出現する動画像データから、スコアの高い顔のみを効率的に選択してユーザにとって利用しやすい顔インデックス情報を生成することが可能となる。
本発明の一実施例の画像処理装置としての撮像装置の構成について説明する図である。 表示部に表示する顔検出アイコンの表示例について説明する図である。 表示部に表示される顔インデックス画面の例について説明する図である。 本発明の一実施例の画像処理装置において実行する顔検出およびインデックス顔選択処理を含むデータ記録シーケンスについて説明するフローチャートを示す図である。 本発明の一実施例の画像処理装置において実行する顔検出処理を行なうフレーム選択処理例について説明する図である。 本発明の一実施例の画像処理装置において実行する顔検出によって検出された顔に関するメタ情報について説明する図である。 本発明の一実施例の画像処理装置において実行するインデックス顔選択処理シーケンスについて説明するフローチャートを示す図である。 本発明の一実施例の画像処理装置において実行するインデックス顔選択処理シーケンスにおいて算出する距離スコアの算出処理の詳細について説明する図である。 本発明の一実施例の画像処理装置において生成するインデックス顔に対応するメタデータの構成例を示す図である。 本発明の一実施例の画像処理装置において実行する個人識別を伴うインデックス顔選択処理シーケンスについて説明するフローチャートを示す図である。 本発明の一実施例の画像処理装置において実行する笑顔識別を伴うインデックス顔選択処理シーケンスについて説明するフローチャートを示す図である。 本発明の一実施例の画像処理装置において実行する子供顔識別を伴うインデックス顔選択処理シーケンスについて説明するフローチャートを示す図である。
符号の説明
100 撮像装置
101 レンズ
102 CCD(Charge Coupled Device)
103 カメラ信号処理部
104 記録再生部
105 記録メディア
106 キー入力部
107 オンスクリーンディスプレイ処理部
108 重畳処理部
109 表示部
110 マイクロプロセッサ
111 CPU
112 RAM
113 ROM
114 代表顔抽出部
120 バッテリ
121 電源回路
201 顔検出アイコン
301 コンテンツインデックス表示領域
302 顔インデックス表示領域
303 コンテンツインデックス送り/戻しキー
306 顔インデックス送り/戻しキー
400 MPEGデータ
401 選択フレーム
421 顔領域
451 距離スコア算出フレーム
452 参照フレーム

Claims (12)

  1. 動画像データを構成する画像フレームから顔画像領域を検出し、検出した顔画像からインデックス情報とする顔画像を選択する処理を実行する代表顔抽出部を有し、
    前記代表顔抽出部は、
    画像フレームから検出された検出顔各々の特徴に基づくスコアを算出し、スコアの高い検出顔をインデックス用の顔画像として選択する処理を実行する構成であり、
    画像フレームから検出された検出顔各々のフレーム内の位置が中心に近いほど高いスコアとした位置スコアと、
    画像フレームから検出された検出顔各々のサイズが大きいほど高いスコアとしたサイズスコアと、
    画像フレームから検出された検出顔各々の顔らしさの評価値が高いほど高いスコアとした顔評価値スコアを算出し、
    前記位置スコアと、前記サイズスコアと、前記顔評価値スコアの全スコアを考慮した総合スコアを算出して総合スコアの高い検出顔をインデックス用の顔画像として選択する処理を実行することを特徴とする画像処理装置。
  2. 前記代表顔抽出部は、
    画像フレームから検出された検出顔の検出顔数が、先行する顔検出フレームにおける検出顔数より増加しているか否かを判定し、増加していることを条件として、検出顔をインデックス用の顔画像として選択する処理を実行する構成を有することを特徴とする請求項1に記載の画像処理装置。
  3. 前記代表顔抽出部は、
    画像フレームから検出された検出顔各々の個人識別を実行し、先行する顔検出フレームにおける検出顔と異なる人物の顔を優先的にインデックス用の顔画像として選択する処理を実行する構成を有することを特徴とする請求項1に記載の画像処理装置。
  4. 前記代表顔抽出部は、
    画像フレームから検出された検出顔各々の笑顔の度合いを判定し、笑顔の度合いの高いほど高いスコア値とした笑顔スコアを算出し、笑顔スコアの高い検出顔をインデックス用の顔画像として選択する処理を実行する構成を有することを特徴とする請求項1に記載の画像処理装置。
  5. 前記代表顔抽出部は、
    画像フレームから検出された検出顔各々の子供顔の度合いを判定し、子供顔の度合いの高いほど高いスコア値とした子供顔スコアを算出し、子供顔スコアの高い検出顔をインデックス用の顔画像として選択する処理を実行する構成を有することを特徴とする請求項1に記載の画像処理装置。
  6. 前記代表顔抽出部は、
    画像フレームから検出された検出顔各々の異なる特徴に基づく複数のスコアを算出し、さらに複数のスコアに基づいて総合スコアを算出して、総合スコアの高い検出顔をインデックス用の顔画像として選択する処理を実行する構成を有することを特徴とする請求項1に記載の画像処理装置。
  7. 前記代表顔抽出部は、
    選択されたインデックス用の顔画像に対応するメタデータを生成し、記録メディアに対する記録処理を実行する構成であることを特徴とする請求項1〜6いずれかに記載の画像処理装置。
  8. 前記メタデータには、
    インデックス用の顔画像として選択された顔画像に対応するフレーム番号、顔位置情報、顔サイズ情報を含む構成であることを特徴とする請求項に記載の画像処理装置。
  9. 前記メタデータには、
    インデックス用の顔画像として選択された顔画像に対応するスコア情報を含む構成であることを特徴とする請求項7または8に記載の画像処理装置。
  10. 撮像部と、
    前記撮像部において撮影された動画像データを入力し、入力動画像データを構成する画像フレームから顔画像領域を検出し、検出した顔画像からインデックス情報とする顔画像を選択する処理を実行する代表顔抽出部を有し、
    前記代表顔抽出部は、
    画像フレームから検出された検出顔各々の特徴に基づくスコアを算出し、スコアの高い検出顔をインデックス用の顔画像として選択する処理を実行する構成であり、
    画像フレームから検出された検出顔各々のフレーム内の位置が中心に近いほど高いスコアとした位置スコアと、
    画像フレームから検出された検出顔各々のサイズが大きいほど高いスコアとしたサイズスコアと、
    画像フレームから検出された検出顔各々の顔らしさの評価値が高いほど高いスコアとした顔評価値スコアを算出し、
    前記位置スコアと、前記サイズスコアと、前記顔評価値スコアの全スコアを考慮した総合スコアを算出して総合スコアの高い検出顔をインデックス用の顔画像として選択する処理を実行することを特徴とする撮像装置。
  11. 画像処理装置において実行する画像処理方法であり、
    代表顔抽出部が、動画像データを構成する画像フレームから顔画像領域を検出し、検出した顔画像からインデックス情報とする顔画像を選択する処理を実行する代表顔抽出ステップを有し、
    前記代表顔抽出ステップは、
    画像フレームから検出された検出顔各々の特徴に基づくスコアを算出し、スコアの高い検出顔をインデックス用の顔画像として選択する処理を実行するステップであり、
    画像フレームから検出された検出顔各々のフレーム内の位置が中心に近いほど高いスコアとした位置スコアと、
    画像フレームから検出された検出顔各々のサイズが大きいほど高いスコアとしたサイズスコアと、
    画像フレームから検出された検出顔各々の顔らしさの評価値が高いほど高いスコアとした顔評価値スコアを算出し、
    前記位置スコアと、前記サイズスコアと、前記顔評価値スコアの全スコアを考慮した総合スコアを算出して総合スコアの高い検出顔をインデックス用の顔画像として選択する処理を実行するステップであることを特徴とする画像処理方法。
  12. 画像処理装置において画像処理を実行させるコンピュータ・プログラムであり、
    代表顔抽出部に、動画像データを構成する画像フレームから顔画像領域を検出し、検出した顔画像からインデックス情報とする顔画像を選択する処理を実行させる代表顔抽出ステップを有し、
    前記代表顔抽出ステップは、
    画像フレームから検出された検出顔各々の特徴に基づくスコアを算出し、スコアの高い検出顔をインデックス用の顔画像として選択する処理を実行するステップであり、
    画像フレームから検出された検出顔各々のフレーム内の位置が中心に近いほど高いスコアとした位置スコアと、
    画像フレームから検出された検出顔各々のサイズが大きいほど高いスコアとしたサイズスコアと、
    画像フレームから検出された検出顔各々の顔らしさの評価値が高いほど高いスコアとした顔評価値スコアを算出し、
    前記位置スコアと、前記サイズスコアと、前記顔評価値スコアの全スコアを考慮した総合スコアを算出して総合スコアの高い検出顔をインデックス用の顔画像として選択する処理を実行するステップであることを特徴とするコンピュータ・プログラム。
JP2007112591A 2007-04-23 2007-04-23 画像処理装置、撮像装置、および画像表示制御方法、並びにコンピュータ・プログラム Expired - Fee Related JP4775306B2 (ja)

Priority Applications (7)

Application Number Priority Date Filing Date Title
JP2007112591A JP4775306B2 (ja) 2007-04-23 2007-04-23 画像処理装置、撮像装置、および画像表示制御方法、並びにコンピュータ・プログラム
KR1020080035565A KR20080095179A (ko) 2007-04-23 2008-04-17 화상 처리 장치, 촬상 장치, 및 화상 표시 제어 방법, 및컴퓨터 프로그램
US12/148,612 US8064656B2 (en) 2007-04-23 2008-04-21 Image processing apparatus, imaging apparatus, image processing method, and computer program
TW097114638A TWI375917B (en) 2007-04-23 2008-04-22 Image processing apparatus, imaging apparatus, image processing method, and computer program
EP08154951.1A EP1986128B1 (en) 2007-04-23 2008-04-22 Image processing apparatus, imaging apparatus, image processing method, and computer program
CN201310051300.8A CN103258185B (zh) 2007-04-23 2008-04-23 图像处理装置、成像装置和图像处理方法
CN2008100950367A CN101295354B (zh) 2007-04-23 2008-04-23 图像处理装置、成像装置和图像处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007112591A JP4775306B2 (ja) 2007-04-23 2007-04-23 画像処理装置、撮像装置、および画像表示制御方法、並びにコンピュータ・プログラム

Publications (3)

Publication Number Publication Date
JP2008271268A JP2008271268A (ja) 2008-11-06
JP2008271268A5 JP2008271268A5 (ja) 2010-02-12
JP4775306B2 true JP4775306B2 (ja) 2011-09-21

Family

ID=39645437

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007112591A Expired - Fee Related JP4775306B2 (ja) 2007-04-23 2007-04-23 画像処理装置、撮像装置、および画像表示制御方法、並びにコンピュータ・プログラム

Country Status (6)

Country Link
US (1) US8064656B2 (ja)
EP (1) EP1986128B1 (ja)
JP (1) JP4775306B2 (ja)
KR (1) KR20080095179A (ja)
CN (2) CN101295354B (ja)
TW (1) TWI375917B (ja)

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009089065A (ja) * 2007-09-28 2009-04-23 Toshiba Corp 電子機器および顔画像表示装置
JP5111269B2 (ja) * 2008-07-09 2013-01-09 キヤノン株式会社 画像処理装置、画像処理方法
JP5312256B2 (ja) * 2008-09-12 2013-10-09 三洋電機株式会社 撮像装置および撮像システム
US8239359B2 (en) * 2008-09-23 2012-08-07 Disney Enterprises, Inc. System and method for visual search in a video media player
JP5213620B2 (ja) * 2008-10-01 2013-06-19 キヤノン株式会社 画像処理装置及び画像処理方法
JP5483863B2 (ja) * 2008-11-12 2014-05-07 キヤノン株式会社 情報処理装置およびその制御方法
JP5317710B2 (ja) * 2009-01-07 2013-10-16 キヤノン株式会社 画像処理装置、その制御方法、プログラム及び記録媒体
JP2010177894A (ja) * 2009-01-28 2010-08-12 Sony Corp 撮像装置、画像管理装置及び画像管理方法、並びにコンピューター・プログラム
JP5272775B2 (ja) * 2009-02-12 2013-08-28 株式会社ニコン 電子スチルカメラ
US9727312B1 (en) * 2009-02-17 2017-08-08 Ikorongo Technology, LLC Providing subject information regarding upcoming images on a display
JP5438419B2 (ja) * 2009-07-29 2014-03-12 富士フイルム株式会社 人物照合装置及び人物照合方法
US8321357B2 (en) * 2009-09-30 2012-11-27 Lapir Gennady Method and system for extraction
CN102483942B (zh) * 2009-10-02 2015-02-04 索尼公司 使用蓝光盘上的数据提供服务
KR101185243B1 (ko) * 2009-12-15 2012-09-21 삼성전자주식회사 얼굴 인식을 위한 복수의 얼굴 이미지를 등록하기 위한 장치 및 방법
JP2011215963A (ja) * 2010-03-31 2011-10-27 Sony Corp 電子機器、画像処理方法及びプログラム
US8320644B2 (en) * 2010-06-15 2012-11-27 Apple Inc. Object detection metadata
US8730334B2 (en) * 2010-12-10 2014-05-20 Symantec Corporation Techniques for providing improved perpetrator imaging
JP5751898B2 (ja) * 2011-04-05 2015-07-22 キヤノン株式会社 情報処理装置、情報処理方法、プログラム及び記憶媒体
US9179201B2 (en) 2011-08-26 2015-11-03 Cyberlink Corp. Systems and methods of detecting significant faces in video streams
ES2625263T3 (es) * 2011-09-27 2017-07-19 Huawei Technologies Co., Ltd. Procedimiento y aparato para generar animación de metamorfosis
US9087273B2 (en) * 2011-11-15 2015-07-21 Facebook, Inc. Facial recognition using social networking information
US10645345B2 (en) * 2012-07-03 2020-05-05 Verint Americas Inc. System and method of video capture and search optimization
CN102833486B (zh) * 2012-07-05 2016-09-21 深圳泰山体育科技股份有限公司 一种实时调节视频图像中人脸显示比例的方法及装置
US9508119B2 (en) * 2012-07-13 2016-11-29 Blackberry Limited Application of filters requiring face detection in picture editor
WO2014071558A1 (en) * 2012-11-06 2014-05-15 Nokia Corporation Method and apparatus for summarization based on facial expressions
JP5859471B2 (ja) 2013-03-19 2016-02-10 富士フイルム株式会社 電子アルバム作成装置および電子アルバムの製造方法
US9684881B2 (en) 2013-06-26 2017-06-20 Verint Americas Inc. System and method of workforce optimization
US9154761B2 (en) 2013-08-19 2015-10-06 Google Inc. Content-based video segmentation
CN106572798A (zh) 2014-03-13 2017-04-19 第感觉医疗有限责任公司 一种用于检测恶性肿瘤的存在的装置和方法
US9583149B2 (en) * 2014-04-23 2017-02-28 Daniel Stieglitz Automated video logging methods and systems
JP6362085B2 (ja) * 2014-05-21 2018-07-25 キヤノン株式会社 画像認識システム、画像認識方法およびプログラム
KR102209070B1 (ko) * 2014-06-09 2021-01-28 삼성전자주식회사 동영상의 썸네일 영상을 제공하는 장치 및 방법
CN105323634B (zh) * 2014-06-27 2019-01-04 Tcl集团股份有限公司 一种视频的缩略图生成方法及***
CN105744345B (zh) * 2014-12-12 2019-05-31 深圳Tcl新技术有限公司 视频压缩方法及装置
US9509741B2 (en) * 2015-04-10 2016-11-29 Microsoft Technology Licensing, Llc Snapshot capture for a communication session
US10628009B2 (en) 2015-06-26 2020-04-21 Rovi Guides, Inc. Systems and methods for automatic formatting of images for media assets based on user profile
BR112017018539A2 (pt) * 2015-06-26 2018-04-24 Rovi Guides Inc sistemas e métodos para formatação automática de imagens para ativos de mídia com base em perfil de usuário
JP6708378B2 (ja) * 2015-07-27 2020-06-10 キヤノン株式会社 画像処理装置、撮像装置、画像処理方法、画像処理プログラム、および、記憶媒体
JP6809114B2 (ja) * 2016-10-12 2021-01-06 株式会社リコー 情報処理装置、画像処理システム、プログラム
US10282598B2 (en) 2017-03-07 2019-05-07 Bank Of America Corporation Performing image analysis for dynamic personnel identification based on a combination of biometric features
US10769207B2 (en) * 2017-08-17 2020-09-08 Opentv, Inc. Multimedia focalization
CN108629336B (zh) * 2018-06-05 2020-10-16 北京千搜科技有限公司 基于人脸特征点识别的颜值计算方法
US11222208B2 (en) * 2018-07-13 2022-01-11 Futurewei Technologies, Inc. Portrait image evaluation based on aesthetics
CA3133908A1 (en) * 2020-10-20 2022-04-20 Sean David Paul Rutherford Method and system for capturing student images
CN113553595B (zh) * 2021-07-27 2023-09-26 北京天融信网络安全技术有限公司 一种漏洞扫描方法、装置、设备及存储介质

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07128031A (ja) 1993-10-29 1995-05-19 Sony Corp 顔画像認識装置
JP3312105B2 (ja) 1997-02-05 2002-08-05 株式会社東芝 動画像インデックス生成方法および生成装置
WO2001028238A2 (en) * 1999-10-08 2001-04-19 Sarnoff Corporation Method and apparatus for enhancing and indexing video and audio signals
US6754389B1 (en) * 1999-12-01 2004-06-22 Koninklijke Philips Electronics N.V. Program classification using object tracking
JP2001167110A (ja) * 1999-12-08 2001-06-22 Matsushita Electric Ind Co Ltd 画像検索方法及びその装置
EP1260935B1 (en) * 2001-05-22 2006-07-12 Matsushita Electric Industrial Co., Ltd. Face detection device, face pose detection device, partial image extraction device, and methods for said devices
US7327891B2 (en) * 2001-07-17 2008-02-05 Yesvideo, Inc. Automatic selection of a visual image or images from a collection of visual images, based on an evaluation of the quality of the visual images
US6823011B2 (en) * 2001-11-19 2004-11-23 Mitsubishi Electric Research Laboratories, Inc. Unusual event detection using motion activity descriptors
US7130446B2 (en) * 2001-12-03 2006-10-31 Microsoft Corporation Automatic detection and tracking of multiple individuals using multiple cues
JP2003204541A (ja) * 2001-12-28 2003-07-18 Nippon Signal Co Ltd:The 映像処理方法及び映像処理装置
US7003139B2 (en) * 2002-02-19 2006-02-21 Eastman Kodak Company Method for using facial expression to determine affective information in an imaging system
JP2004118627A (ja) * 2002-09-27 2004-04-15 Toshiba Corp 人物認証装置および人物認証方法
US7822233B2 (en) * 2003-11-14 2010-10-26 Fujifilm Corporation Method and apparatus for organizing digital media based on face recognition
JP4517633B2 (ja) 2003-11-25 2010-08-04 ソニー株式会社 対象物検出装置及び方法
JP2005327249A (ja) * 2004-04-13 2005-11-24 Fuji Photo Film Co Ltd 画像記録装置および方法並びにプログラム
US7627148B2 (en) * 2004-07-06 2009-12-01 Fujifilm Corporation Image data processing apparatus and method, and image data processing program
US7519200B2 (en) * 2005-05-09 2009-04-14 Like.Com System and method for enabling the use of captured images through recognition
JP2007041927A (ja) * 2005-08-04 2007-02-15 Olympus Imaging Corp 画像検索プログラム、画像検索装置、画像検索方法及び記録媒体
JP4833633B2 (ja) 2005-10-21 2011-12-07 株式会社大滝油圧 重量物昇降装置
US7716157B1 (en) * 2006-01-26 2010-05-11 Adobe Systems Incorporated Searching images with extracted objects
US8031914B2 (en) 2006-10-11 2011-10-04 Hewlett-Packard Development Company, L.P. Face-based image clustering

Also Published As

Publication number Publication date
TWI375917B (en) 2012-11-01
US20080260255A1 (en) 2008-10-23
JP2008271268A (ja) 2008-11-06
CN101295354B (zh) 2013-03-27
EP1986128A2 (en) 2008-10-29
CN101295354A (zh) 2008-10-29
EP1986128A3 (en) 2013-11-27
EP1986128B1 (en) 2020-02-26
CN103258185A (zh) 2013-08-21
TW200907824A (en) 2009-02-16
KR20080095179A (ko) 2008-10-28
US8064656B2 (en) 2011-11-22
CN103258185B (zh) 2017-12-08

Similar Documents

Publication Publication Date Title
JP4775306B2 (ja) 画像処理装置、撮像装置、および画像表示制御方法、並びにコンピュータ・プログラム
JP4998026B2 (ja) 画像処理装置、撮像装置、および画像表示制御方法、並びにコンピュータ・プログラム
EP2710594B1 (en) Video summary including a feature of interest
US9013604B2 (en) Video summary including a particular person
EP1971134B1 (en) Information processing apparatus, imaging apparatus, image display control method and computer program
US8681239B2 (en) Image capturing device, image capturing method, program, and integrated circuit
CN103971090A (zh) 图像处理装置、图像捕获装置、图像处理方法及记录媒介
JPWO2006025272A1 (ja) 映像分類装置、映像分類プログラム、映像検索装置、および映像検索プログラム
JP5677011B2 (ja) 動画再生装置及びその制御方法
JP2008199330A (ja) 動画像管理装置
JP6512208B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP5147737B2 (ja) 撮像装置
JP5665380B2 (ja) 画像処理装置、画像処理装置の制御方法、プログラム、及び記録媒体
JP2012123721A (ja) 画像処理装置及び画像処理方法
WO2018155087A1 (ja) 画像処理装置、画像形成装置及び画像処理方法
JP2010154147A (ja) ビデオカメラ装置
JP2012015742A (ja) 再生装置および記録装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091221

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091221

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110322

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110516

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110531

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110613

R151 Written notification of patent or utility model registration

Ref document number: 4775306

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140708

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees