JP6948787B2 - 情報処理装置、方法およびプログラム - Google Patents

情報処理装置、方法およびプログラム Download PDF

Info

Publication number
JP6948787B2
JP6948787B2 JP2016239780A JP2016239780A JP6948787B2 JP 6948787 B2 JP6948787 B2 JP 6948787B2 JP 2016239780 A JP2016239780 A JP 2016239780A JP 2016239780 A JP2016239780 A JP 2016239780A JP 6948787 B2 JP6948787 B2 JP 6948787B2
Authority
JP
Japan
Prior art keywords
feature amount
frame
acquired
frames
target frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016239780A
Other languages
English (en)
Other versions
JP2018097490A (ja
Inventor
竜也 山本
竜也 山本
チャン サミー
チャン サミー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2016239780A priority Critical patent/JP6948787B2/ja
Priority to US15/820,474 priority patent/US10650242B2/en
Publication of JP2018097490A publication Critical patent/JP2018097490A/ja
Application granted granted Critical
Publication of JP6948787B2 publication Critical patent/JP6948787B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • G06F18/2113Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/771Feature selection, e.g. selecting representative features from a multi-dimensional feature space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Television Signal Processing For Recording (AREA)
  • Image Analysis (AREA)
  • Studio Devices (AREA)

Description

本発明は、画像処理を行う情報処理装置、方法およびプログラムに関する。
近年、デジタルカメラやスマートフォンの普及に伴い、動画の撮影が手軽になったことから、動画を撮りためることが多くなってきている。撮りためた動画は、単に視聴するだけでなく、選択した特定のフレームから静止画を抽出して、フォトブックやスライドショーに使用するといった活用法も普及しつつある。しかしながら、動画には大量のフレームが含まれており、この中から目的にあった特定のフレームを手動で選択することは負担が大きい。特許文献1には、動画からフレームを選択する方法として、一定間隔で動画に含まれるフレームの特徴量を取得し、取得した特徴量に基づいてフレームを選択する方法が記載されている。
また、一般的にフォトブックやスライドショーを作成するとき、人物の構図、ボケブレ、露出、彩度など複数の要因に基づいて画像を選択することがある。その場合、動画からフレームを選択する精度を向上させるために、一つの特徴量ではなく、複数の特徴量を用いる方法が考えられる。特許文献2には、手ぶれ、被写体ぶれ、露出不良など様々な特徴量を組み合わせることで、最適なものを選択する方法が記載されている。
特開2011−66487号公報 特開2009−122792号公報
しかしながら、選択の精度を向上させるために、一つのフレームから取得する特徴量の種類を増やすと、その分、フレーム選択に余分に時間がかかることになる。特徴量は、種類によっては、画素を解析するなど取得に時間がかかるものや、メタデータから取得するなど時間がかからないものがある。しかしながら、常に全ての種類の特徴量を取得すると、フレームあたりの特徴量の取得時間が長くなってしまう。また、動画には、大量のフレームが含まれるので、フレームを選択する処理にかかる時間は、特徴量を取得する時間に大きく影響される。従って、特徴量の取得に時間がかかると、ユーザはフレームが選択されるまで長時間待たされることになってしまう。
本発明の目的は、このような従来の問題点を解決することにある。上記の点に鑑み、本発明は、フレーム選択の効率を向上させる情報処理装置、方法およびプログラムを提供することを目的とする。
上記課題を解決するため、本発明に係るプログラムは、情報処理装置に記憶されるプログラムであって、前記情報処理装置のコンピュータを、複数のフレームそれぞれについて第1の特徴量を取得する処理を実行する第1の取得手段と、前記第1の取得手段により取得された前記第1の特徴量に基づいて、前記第1の特徴量と異なる第2の特徴量を取得するための対象のフレームの優先順位を特定する特定手段と、前記特定手段により特定された前記優先順位に従って、前記第2の特徴量を取得する処理を実行する第2の取得手段と、前記第2の取得手段により取得された前記第2の特徴量に基づいて、画像処理の対象となるフレームを選択する選択手段と、として実行させ、前記第2の取得手段は、前記優先順位に従って前記対象のフレームの前記第2の特徴量を取得する場合、前記対象のフレームの前後のフレームの前記第2の特徴量が取得済みでないならば、前記対象のフレームの前記第2の特徴量を取得し、前記対象のフレームの前後のフレームの前記第2の特徴量が取得済みであれば、前記対象のフレームの前記第2の特徴量を取得しない、ことを特徴とする。
本発明によれば、フレーム選択の効率を向上させることができる。
情報処理装置のハードウェア構成を示す図である。 フォトブック作成機能に関するブロック構成を示す図である。 フレーム情報管理テーブルを示す図である。 第2特徴量を取得する順番が決定されたフレーム情報を示す図である。 キーフレームを選択する処理を示すフローチャートである。 S504の処理を示すフローチャートである。 フォトブック作成機能に関するブロック構成を示す図である。 フレーム情報管理テーブルを示す図である。 キーフレームを選択する処理を示すフローチャートである。 S906の処理を示すフローチャートである。 S907の処理を示すフローチャートである。 ムービー作成機能に関するブロック構成を示す図である。 キーフレームを選択する処理を示すフローチャートである。 S1301の処理を示すフローチャートである。
以下、添付図面を参照して本発明の実施形態を詳しく説明する。尚、以下の実施形態は特許請求の範囲に係る本発明を限定するものでなく、また本実施形態で説明されている特徴の組み合わせの全てが本発明の解決手段に必須のものとは限らない。なお、同一の構成要素には同一の参照番号を付して、説明を省略する。
[第1の実施形態]
図1は、本実施形態における情報処理装置100のハードウェア構成を示す図である。CPU101は、装置全体を統括的に制御する中央演算装置である。CPU101が制御プログラムに基づいて、情報の演算や加工、各ハードウェアの制御を実行することにより、本実施形態の動作を実現する。RAM102は、汎用的なRAMであり、CPU101の主メモリとして、若しくは、実行プログラムのロードやプログラム実行に必要なワークメモリとして機能する。ROM103は、汎用的なROMであり、例えば、本実施形態の動作を実現するための手順を規定するプログラムを記憶する。ROM103には、コンピュータシステムの機器制御を行うシステムプログラムである基本ソフトウェア(OS)等を記憶したプログラムROMと、システムを稼動するために必要な情報などが記憶されたデータROMが含まれる。また、ROM103の代わりに、HDD109が用いられても良い。
ネットワークIF104は、ネットワークインタフェースであり、LAN等のネットワークを介して送受信される動画データなどのデータの入出力制御を行う。ネットワークIF104は、有線や無線等、ネットワークの媒体に応じた構成を有する。VRAM105は、ビデオRAMであり、表示装置であるディスプレイ106の画面に表示される画像を展開する。ディスプレイ106は、表示装置であり、例えば、液晶ディスプレイや液晶パネルである。入力コントローラ107は、入力装置108からの入力信号を制御するコントローラである。入力装置108は、ユーザからの操作指示を受け付けるための外部入力装置であり、例えば、タッチパネル、キーボード、ポインティングデバイス、リモートコントローラなどである。HDD109は、ハードディスクドライブである。HDD109は、アプリケーションプログラムや、動画データや画像データなどのデータ保存用に用いられる。アプリケーションプログラムは、例えば、フォトブック作成アプリケーションやムービー作成アプリケーションである。入力IF110は、CD(DVD)−ROMドライブ、メモリカードドライブ等の外部装置と接続するためのインタフェースであり、例えば、デジタルカメラで撮影した動画データの読出しなどに用いられる。入出力バス111は、上述した各ユニット間を相互に通信可能に接続するための入出力バスであり、例えばアドレスバス、データバス、制御バスを含む。
図2は、情報処理装置100のフォトブック作成機能に関するブロック構成の一例を示す図である。本実施形態では、情報処理装置100は、アプリケーションを実行することにより、動画データから選択されたフレームに基づいてフォトブックを作成する機能を有する。本実施形態では、動画データから選択されたフレームに基づいて作成されるものはフォトブックとして説明するが、カレンダや単葉印刷など他の作成物であっても良い。図2の各ブロックは、例えば、CPU101がアプリケーションを実行することで実現される。
フレーム入力部201は、入力IF110から入力された動画データを読み込み、動画データに含まれる互いに連関する複数のフレームの画像を抽出してHDD109に保存する。ここで、対象とするフレームは、動画データに含まれる全てのフレームでも良いし、動画データの圧縮符号化にフレーム間予測を用いている場合にはIフレーム(intra frame)のみでも良い。本実施形態では、0.5秒ごとのIフレームの画像データを入力してHDD109に保存する。
第1特徴量取得部202は、保存されたフレームの画像から1フレームごとに、オブジェクトとして正面方向の顔を検出し、その正面方向の顔の座標およびサイズ(幅、高さ)を第1特徴量として取得する。第2特徴量取得部203は、保存されたフレームの画像から1フレームごとに、オブジェクトとして全方向の顔を検出し、その全方向の顔の座標およびサイズ(幅、高さ)を第2特徴量として取得する。例えば、検出を所望する全ての方向に対して、検出方向毎に回転画像を生成し、各回転画像に対して正面方向の顔を検出することで座標を取得する。従って、全方向の顔を検出する処理は、正面方向の顔を検出するよりも時間がかかる。本実施形態では、第2特徴量は、第1特徴量よりもその取得に時間がかかる特徴量をいう。
特徴量取得順決定部204は、各フレームから取得した第1特徴量を用いて、第2特徴量を取得する順番を決定する。キーフレーム選択部205は、特徴量取得順に従ってフレームから第2特徴量を取得し、第2特徴量を用いて、キーフレームを選択する。出力部206は、選択されたキーフレームの画像をレイアウトしてフォトブックを作成するため画像のレイアウトに係る画像処理を実行する。出力部206での画像処理では、必ずしも全てのキーフレームを用いる必要はなく、キーフレームからさらに使用する画像を絞りこんでも良いし、動画と一緒に撮影した静止画など、キーフレーム以外の画像を用いても良い。
図3は、動画データの各フレームの情報を管理するテーブルの一例を示す図である。フレーム情報管理テーブル301は、ID、第1特徴量、第2特徴量、第1スコア、第2スコア、キーフレームの項目を含むフレーム情報で構成される。IDは、各フレームを識別する識別情報であり、動画データから抽出された順、例えば、日時情報順に付与されている。第1特徴量は、第1特徴量取得部202により取得された正面顔の座標であり、正規化された顔の中心座標(x,y)と幅w、高さhが格納されている。第2特徴量は、第2特徴量取得部203により取得された全方向の顔の中心座標、幅、高さであり、第1特徴量と同様の情報が格納されている。
第1スコアは、第1特徴量から算出されたフレームの評価値であり、第2スコアは、第2特徴量から算出されたフレームの評価値である。評価値の算出については、後述する。キーフレームは、キーフレーム選択部205によりキーフレームとして選択されたか否かを示すフラグであり、丸印が付加されている(フラグが設定されている)IDのフレームは、キーフレームとして選択されたことを示している。
図4は、第2特徴量を取得する順番が決定されたフレーム情報の一例を示す図である。フレーム情報テーブル401の特徴量取得順は、第2特徴量を取得する順番を示す。フレーム情報IDは、第2特徴量を取得する順番に対応するフレームを識別するIDを示す。図3のフレーム情報管理テーブル301および図4のフレーム情報テーブル401は、例えば、HDD109に記憶され、随時更新可能である。
図5は、動画の各フレームからキーフレームを選択する処理を示すフローチャートである。図5の処理は、例えば、CPU101がROM103に記憶されたプログラムをRAM102に読み出して実行することにより実現される。図5の処理は、例えば、フォトブックアルバムを作成するユーザインタフェース画面上で、所定のレイアウトに割り当てる画像データを取得する先として動画データが指定されたときに開始される。
S501では、CPU101は、フレーム入力部201により入力された全てのフレームに対して、第1特徴量取得部202によりフレーム毎に第1特徴量を取得し、その第1特徴量をフレーム情報管理テーブル301に格納する。本実施形態では、フレーム入力部201による入力対象はIフレームのみであり、0.5秒ごとのIフレームの情報が、情報管理テーブル301に順次格納される。
S502では、CPU101は、第1特徴量である顔座標から構図を考慮した評価値を第1スコアとして算出し、その第1スコアをフレーム情報管理テーブル301に格納する。本実施形態では、第1スコアの算出方法として、中心座標に近く顔サイズが大きいほど高いスコアを算出する。例えば、図3からID4のフレームの顔座標は、ID3のフレームの顔座標よりも中心座標(0.5,0.5)に近く、サイズも大きい。従って、ID4のフレームの第1スコアには、ID3のフレームよりも高いスコアが格納されている。
第1スコアは、例えば、以下の方法によって算出されても良い。まず、全てのIDのフレームについて、正面顔を含むフレームを抽出する。例えば、正位置の正面顔を含むフレームを抽出する。これは、例えば、ROM103やHDD109に記憶されている顔データベースにおける特定の正面顔と類似する顔を含むフレームを抽出するようにしても良い。そして、その正面顔の中心座標と対象フレームの中心座標との第1のずれ量を取得する。また、その正面顔のサイズと対象フレーム内での最大許容サイズとの第2のずれ量を取得する。そして、それらの第1のずれ量および第2のずれ量から、各ずれ量が小さいほど値が高くなるようなパラメータを規定しておき、その値を第1スコアとしても良い。例えば、第1スコアは、式(1)のように算出されても良い。
第1スコア = 1−√[{(第1のずれ量/第1の最大許容ずれ量)^2+(第2のずれ量/第2の最大許容ずれ量)^2}/2] ・・・(1)
式(1)によれば、第1及び第2のずれ量が0である場合は、第1スコアは1であり、第1及び第2のずれ量が最大許容ずれ量である場合は、第1スコアは0である。また、第1及び第2のずれ量それぞれが、第1及び第2の最大許容ずれ量の0.2(20%)であれば、第1スコアは0.8となる。
また、上記の方法でなくても、中心座標(0.5,0.5)に近く且つサイズが大きいほど、高いスコア値が得られるのであれば、他の方法によって第1スコアが取得されても良い。また、正面顔の位置とサイズそれぞれに重み付けを行うようにしても良いし、一つのフレームで複数の正面顔が検出された場合には、大きさが同じでも顔が一つの場合よりも高い点となるよう重み付けを行うようにしても良い。
S503では、CPU101は、特徴量取得順決定部204により、フレーム情報管理テーブル301の第1スコアが高い順にIDをソートし、第2特徴量を取得する特徴量取得順を決定する。例えば、図4の特徴量取得順では、フレーム情報管理テーブル301の第1スコアが最も高いID14のフレームが特徴量取得順において1番目となっている。図4では、第1スコアが低いID26のフレームも特徴量取得順に加えられているが、第1スコアの信頼度が所定の基準を満たすものである場合には、第1スコアが閾値以下のフレームを特徴量取得順から除外するようにしても良い。
S504では、CPU101は、キーフレーム選択部205により、決定された特徴量取得順を用いて、キーフレームとなるフレームを選択する。S504の処理については後述する。S504の処理後、図5の処理を終了する。
S501〜S504は、1つの動画データからキーフレームを選択する処理である。従って、フレーム入力部201が複数の動画データを受け付ける場合、CPU101は、各動画データに対してS501〜S504を繰り返して実行する。図5の処理後、出力部206は、選択されたキーフレームの画像をレイアウトしてフォトブックを作成する。
図6は、図5のS504の処理を示すフローチャートである。図6では、特徴量取得順を用いて動画データの各フレームからキーフレームが選択される。
S601では、CPU101は、RAM102に確保された特徴量取得順の順番を示す変数rを1に初期化する。S602では、CPU101は、図4のフレーム情報テーブル401を参照し、特徴量取得順がr番目のフレームのIDを取得する。そして、CPU101は、フレーム情報管理テーブル301を参照し、そのIDのフレーム情報を取得する。
S603では、CPU101は、S602で取得した対象フレームの近傍のフレームから第2特徴量が既に取得済みであるか否かを判定する。ここで、近傍のフレームとは、S602で取得した対象フレームの前後の2つのフレームである。しかしながら、特に前後の2つのフレームに限定されるわけではなく、例えば、動画データから抽出された全フレーム数に応じて、前後の4つのフレームなど、適宜フレーム範囲を変更可能としても良い。
S603で取得済みでないと判定された場合、S604に進み、後述するキーフレーム判定を行う。S603で取得済みと判定された場合、対象フレームと類似する近傍のフレームにおいて既にキーフレーム判定が行われているということなので、キーフレーム判定を行わずにS607に進む。つまり、本実施形態では、キーフレーム判定が既に行われているフレームの近傍については、フレーム判定を行わない。そのような構成により、動画データにおける抽出されたフレームの並びにおいてキーフレームを分散させることができ、キーフレームの位置の偏りを防ぐことができる。
なお、近傍のフレームが既に第2特徴量を取得済みであると判定され且つキーフレームでないと判定された場合でも、対象フレームがキーフレームと判定される可能性はゼロではない。従って、S603では、合わせて、近傍のフレームがキーフレームとして既に選択されているか否かを判定するようにしても良い。その場合、近傍のフレームがキーフレームとして既に選択されている場合には、S607に進み、近傍のフレームがキーフレームとして既に選択されていない場合には、S604に進む。
S604では、CPU101は、第2特徴量取得部203により第2特徴量を取得し、第2特徴量から第2スコアを算出して、その第2スコアをフレーム情報管理テーブル301に格納する。第2特徴量の取得は、例えば、所定の全ての検出方向に対して、検出方向毎に回転画像を生成し、各回転画像に対して正面方向の顔を検出することで中心座標、幅、高さを取得する。第2スコアは、第1スコアと同様の方法により算出される。第2特徴量取得部203は、所定の全ての検出方向の顔の向きに対応しているので、例えば、図3のID4のフレームのように新たに顔の座標が取得される場合もある。そのような場合、検出される顔の個数によって重み付けが設定されている場合など、第2スコアは必ずしも第1スコアと同じとはならずに、第1スコアよりも第2スコアの方がより高い値になる場合がある。
S605では、CPU101は、第2スコアが閾値以上であるか否かを判定する。ここでは、閾値として0.8を用いるが特に0.8に限られず、フレームサイズや条件等に応じて他の値が用いられても良い。閾値以上であると判定された場合、S606において、CPU101は、現在の対象フレームをキーフレームとして設定し、図3のフレーム情報管理テーブル301のキーフレームの項目を「設定済み」に設定する。一方、閾値以上でないと判定された場合、S607に進む。
S607では、r番目のフレームが図4の特徴量取得順の最後のフレームであるか否かを判定する。最後のフレームでないと判定された場合、S608において、CPU101は、変数rを+1インクリメントしてS602からの処理を繰り返す。一方、最後のフレームであると判定された場合、図6の処理を終了する。また、S607では、必要なフレーム数分、キーフレームが設定されたか否かを判定するようにしても良い。そして、必要なフレーム数分、キーフレームが設定されたと判定された場合には図6の処理を終了するようにしても良い。
なお、本実施形態では、第2特徴量取得部203が所定の全方向の顔をオブジェクトとし、その顔座標を第2特徴量として取得した。しかしながら、さらに、笑顔度、彩度、ボケブレ度など様々な特徴量を取得するようにし、第2スコアは、それらの特徴量を総合評価したものとしても良い。また、フレーム入力部201で各フレームの画像を保存するとき、1つのフレームからサイズの異なる2種類の画像を保存するようにしても良い。その場合、第1特徴量取得部202は、小さい方の画像を解析して第1特徴量を取得し、第2特徴量取得部203は、大きい方の画像を解析して第2特徴量を取得するようにしても良い。また、本実施形態では、第2特徴量は第1特徴量を取得する処理量より多い特徴量であるとしたが、第1特徴量を取得する処理量の方が多くてもその取得時間が第2特徴量の取得時間よりも短く済むのであれば、本実施形態の動作を適用可能である。例えば、第1特徴量の取得をハードウェアで行う場合である。その場合、取得時間が長い第2特徴量を取得するフレームの数を制限する(絞る)ことができる。
以上説明したように、本実施形態によれば、第1特徴量から算出した第1スコアの高いフレーム順(特徴量取得順)で、第2スコアが高いと期待されるフレームから優先的にキーフレーム判定を行う。その結果、取得するための処理量が多い第2特徴量を取得する対象のフレームの数を制限することができる。また、キーフレーム判定では、第2特徴量を取得して第2スコアを算出し、第2スコアが上位のフレームから優先的に、第2スコアが高いフレームをキーフレームとして選択していく。その結果、第2特徴量を取得するフレームの数を制限しても、キーフレームとしての選択精度を維持することができる。これにより、精度良く高速にキーフレームを選択でき、ユーザが長時間待たされることなく動画から静止画を抽出することが可能となる。
第1特徴量を用いて予め評価の低いフレームを除外しておく構成では、第1特徴量の精度が低い場合に誤って除外してしまい、その結果、キーフレームを発見できないおそれがある。しかしながら、本実施形態では、順番が下位になるだけで最終的にはキーフレームを発見することができる。
[第2の実施形態]
第1の実施形態では、特徴量取得順を用いて、第2特徴量を取得するフレームの数を制限し、精度良く高速にフレームを選択する構成を説明した。本実施形態では、第2特徴量を取得するフレームの数を制限する他の構成として、フレームを所定の区間に分割し、その情報を用いて、第2特徴量を取得するフレームの数を制限する。以下、第1の実施形態と異なる点について説明する。
図7は、本実施形態における情報処理装置100のフォトブック作成機能に関するブロック構成の一例を示す図である。フレーム入力部201、第1特徴量取得部202、第2特徴量203、キーフレーム選択部205、出力部206については、第1の実施形態における説明と同じである。但し、第1特徴量取得部202は、本実施形態では、第1特徴量として、カメラのジャイロセンサなどにより予め動画に付与されたメタデータを用いてカメラの動き量の情報が取得されるものとする。区間設定部701は、動画に含まれる連続する複数のフレームを所定の処理により、時刻情報等に基づいて区間分割する。図7の各ブロックは、例えば、CPU101がアプリケーションを実行することで実現される。
図8は、本実施形態におけるフレーム情報管理テーブルの一例を示す図である。フレーム情報管理テーブル801は、ID、区間ID、フレーム番号、第1特徴量、第2特徴量、第1スコア、第2スコア、候補フレーム、キーフレームの項目を含むフレーム情報で構成される。IDは、各フレームを識別する識別情報であり、動画データから抽出された順に付与されている。区間IDは、区間設定部701で連続するフレームを分割した際の、フレームが属する区間を識別する識別情報である。第1特徴量は、第1特徴量取得部202により取得されたカメラの動き量であり、動き量の大きさが格納される。第2特徴量は、保存されたフレームの画像から検出された顔の中心座標、幅、高さであり、第1の実施形態で、第1特徴量として検出される正面顔の特徴量と同じである。
第1スコアは、第1特徴量から算出されたフレームの評価値であり、動き量が小さいほど高い値となる。第1スコアは、例えば、全フレームの動き量の中で最大値を1.0とし最小値を0として、各フレームの動き量の相対値を0〜1.0の範囲で算出するようにしても良い。第2スコアは、第1の実施形態における説明と同じである。候補フレームは、キーフレームの候補となるフレームであるか否かを示すフラグである。キーフレームは、キーフレームとして設定されたか否かを示すフラグである。フレーム情報管理テーブル801は、候補フレームおよびキーフレームが設定される前の状態を示し、情報管理テーブル802は、候補フレームおよびキーフレームが設定された後の状態を示している。
図9は、本実施形態における、動画の各フレームからキーフレームを選択する処理を示すフローチャートである。図9の処理は、例えば、CPU101がROM103に記憶されたプログラムをRAM102に読み出して実行することにより実現される。図9の処理は、例えば、フォトブックアルバムを作成するユーザインタフェース画面上で、所定のレイアウトに割り当てる画像データを取得する先として動画データが指定されたときに開始される。本実施形態では、キーフレーム選択部205は、区間設定部701で設定された区間情報を用いて、キーフレームとなるフレームを選択する。
S901では、CPU101は、フレーム入力部201により入力された全てのフレームに対して、第1特徴量取得部202によりフレーム毎に第1特徴量であるカメラの動き量を取得し、その第1特徴量をフレーム情報管理テーブル801に格納する。
S902では、CPU101は、第1特徴量から第1スコアを算出し、その第1スコアをフレーム情報管理テーブル801に格納する。本実施形態では、動き量の大きいフレームの画像はぶれている可能性が高いので、動き量の小さいものほど高い値になるよう第1スコアが算出されている。
S903では、CPU101は、区間設定部701により全てのフレームに対して各フレームが属する区間のIDをフレーム情報管理テーブル801に設定する。本実施形態では、図8(a)に示すように、区間を固定長の5つのフレームごとに分割する。しかしながら、動き量の差が閾値以上の箇所で分割するなど、可変長に分割するようにしても良い。
S904では、CPU101は、各区間を代表する第2特徴量として、各区間の中心に位置するフレームから第2特徴量を取得する。S905では、CPU101は、中心フレームの第2特徴量から第2スコアを算出し、その第2スコアをフレーム情報管理テーブル801に格納する。図8(a)は、S901〜S905の処理が実行された状態の一例を示しており、各区間の中心フレームであるID3、ID8、ID13のフレームに第2特徴量と第2スコアが格納されている。
S906では、CPU101は、キーフレームの候補となる候補フレームを選択する。S906の処理は、図10において後述する。S907では、CPU101は、候補フレームからキーフレームを選択する。S907の処理は、図11において後述する。
図10は、図9のS906の処理を示すフローチャートである。図10では、区間の情報を用いて、動画の各フレームからキーフレームの候補となる候補フレームが選択される。
S1001では、CPU101は、RAM102に確保された対象フレームのIDを示す変数iを1に初期化する。S1002では、CPU101は、図8のフレーム情報管理テーブル801を参照し、フレームのIDがiであるフレームのフレーム情報を取得する。S1003では、CPU101は、S1002で取得した対象フレームの区間IDと同じ区間に属する中心フレームの第2スコアを取得する。
S1004では、CPU101は、対象フレームの第1スコアが閾値以上であるか否かを判定する。ここでは、閾値として0.8を用いるが特に0.8に限られず、条件等に応じて他の値が用いられても良い。閾値以上であると判定された場合、S1005に進み、閾値以上でないと判定された場合、S1007に進む。
S1005では、CPU101は、S1003で取得した中心フレームの第2スコアが閾値以上であるか否かを判定する。ここでは、閾値として0.8を用いるが特に0.8に限られず、条件等に応じて他の値が用いられても良い。また、S1004の閾値と異なる値が用いられても良い。閾値以上であると判定された場合、S1006に進み、閾値以上でないと判定された場合、S1007に進む。
S1004、S1005のいずれも閾値以上であると判定された場合、S1006で、CPU101は、対象フレームを候補フレームとして設定する。さらに、CPU101は、第2特徴量取得部203により対象フレームの第2特徴量を取得し、第2スコアを算出し、その第2スコアをフレーム情報管理テーブル801に格納する。なお、対象フレームの第2スコアを算出せずに、中心フレームの第2スコアを対象フレームの第2スコアとして用いても良い。
例えば、フレーム情報管理テーブル802のID5のフレームは、第1スコアが0.89で閾値以上である。そして、ID5と同区間で中心に位置するID3の中心フレームの第2スコアは、0.81で閾値以上である。従って、ID5のフレームは、S1006で候補フレームとして設定される。さらに、ID5のフレームの第2特徴量が取得され、その第2特徴量に基づいて算出された第2スコアである0.82がフレーム情報管理テーブル802に格納される。S1004、S1005のいずれかで閾値以上と判定されない場合、S1007に進む。
S1007では、CPU101は、フレームのIDがiであるフレームがフレーム情報管理テーブル801の最後のフレームであるか否かを判定する。ここで、最後のフレームでないと判定された場合、S1008でiを+1インクリメントしてS1002からの処理を繰り返す。一方、最後のフレームであると判定された場合、図10の処理を終了する。
なお、本実施形態では、S1004、S1005において、対象フレームの第1スコア、中心フレームの第2スコアのそれぞれの値が閾値以上であるか否かを判定した。他にも、対象フレームの第1スコアと中心フレームの第2スコアを合計するなど、総合的な評価値を算出し、その評価値を用いて候補フレームに設定するか否かを判定するようにしても良い。また、中心フレームの第2スコアを直接用いるのではなく、線形補完などにより、別途算出した値を第2スコアとして用いても良い。
図11は、図9のS907の処理を示すフローチャートである。図11では、候補フレームからキーフレームが選択される。
S1101では、CPU101は、候補フレームが設定されたフレーム情報を全て取得し、第2スコアでソートする。S1102では、CPU101は、RAM102に確保された、対象となる候補フレームを示す変数kを1に初期化する。S1103では、CPU101は、k番目に第2スコアの高い候補フレーム情報を取得する。
S1104では、CPU101は、対象の候補フレームの区間IDと同一区間に既にキーフレームが存在するか否かを判定する。存在しないと判定された場合、S1105に進み、CPU101は、対象の候補フレームをキーフレームとして設定する。S1105の処理後、若しくは、S1104で存在すると判定された場合、S1106に進む。
S1106では、CPU101は、k番目の候補フレームが、ソートされた順番のうち最後であるか否かを判定する。最後でないと判定された場合、S1107に進み、CPU101は、kを+1インクリメントしてS1103からの処理を繰り返す。一方、最後であると判定された場合、図11の処理を終了する。
本実施形態によれば、同区間のフレームの画像は類似している可能性が高いので、S1104の判定により、同区間に既にキーフレームが存在しない場合に、その候補フレームをキーフレームとして設定する。これにより、同区間において類似する候補フレームをともにキーフレームとして設定してしまうことを防ぐことができる。
また、他の構成として、高スコアであれば同区間のフレームであっても選択することが望ましいとし、同区間にキーフレームが存在する数に基づいて第2スコアを低減するように調整しても良い。そして、調整の結果、なお閾値以上であると判定される場合にキーフレームとして設定するようにしても良い。また、第2スコアの高い順にキーフレームを選択するのではなく、第2特徴量と異なる特徴量から第3スコアを算出し、第3スコアの高い順にキーフレームを選択しても良い。
以上説明したように、本実施形態によれば、フレームを区間分割した情報を用いて、第2特徴量を取得するフレームの数を制限することで、精度良く高速にフレームを選択でき、ユーザを長時間待たすことなく動画から静止画を抽出することができる。また、第1スコアがいずれも高く且つ差がなく順位付けが難しい場合でも、区間の中心フレームの第2特徴量から算出した第2スコアを用いることで、フレームの数を制限することができる。
[第3の実施形態]
第1及び第2の実施形態では、フォトブックにレイアウトする画像を動画データから抽出するために、キーフレームを選択するものであった。本実施形態では、選択されたキーフレームの情報を用いて動画データのハイライトとなるシーン(特定の区間)を選択する。以下、各実施形態と異なる点について説明する。
図12は、情報処理装置100のムービー作成機能に関するブロック構成の一例を示す図である。フレーム入力部201、第1特徴量取得部202、第2特徴量取得部203、特徴量取得順決定部204、出力部206は、第1の実施形態における説明と同じである。但し、本実施形態では、出力部206は、選択されたハイライトシーンの区間の動画を抽出し、ハイライトムービーとして出力する。ハイライトシーン選択部1201は、図2のキーフレーム選択部205と同様にキーフレームを選択し、さらに、キーフレームの情報を用いてハイライトシーンを選択する。類似判定部1202は、2つの画像を解析し、色ヒストグラムなどの情報に基づいて、2つのフレームの画像が類似しているか否かを判定する。図12の各ブロックは、例えば、CPU101がアプリケーションを実行することで実現される。
図13は、動画の各フレームからキーフレームを選択する処理を示すフローチャートである。図13の処理は、例えば、CPU101がROM103に記憶されたプログラムをRAM102に読み出して実行することにより実現される。図13の処理では、ハイライトシーン選択部1201が、フレーム入力部201から入力された動画データの各フレームの中からハイライトシーンとなるフレームを選択する。
S501〜S504は、第1の実施形態における説明と同様である。本実施形態では、S504の処理後、S1301に進む。S1301では、CPU101は、S504で選択されたキーフレームの情報を用いて、ハイライトシーンとなるフレームを選択する。S1301の処理は、図14において後述する。
図14は、図13のS1301の処理を示すフローチャートである。図14では、キーフレームの情報を用いて、ハイライトシーンの開始フレームと終了フレームが選択される。以下、図3のフレーム情報管理テーブル301に示すように、キーフレームが設定されたとする。
S1401では、CPU101は、RAM102に確保された、フレームを進める方向を示す変数dに−1を設定する。S1402では、CPU101は、フレーム情報管理テーブル301から第2スコアの最も高いキーフレームのIDを取得し、そのIDの値を変数sに設定する。後述するが、変数dが−1であれば、変数sのフレームを負の方向に進めることにより開始フレームを探索し、変数dが1であれば、変数sのフレームを正の方向に進めることにより終了フレームを探索する。
S1403では、CPU101は、HDD109に保存されている、IDがsとs+dのフレームの画像を取得する。S1404では、CPU101は、類似判定部1202により、IDがs+dのフレームが存在し、且つIDがsのフレームと類似するか否かを判定する。類似しないと判定された場合、S1407に進み、類似すると判定された場合、S1405に進む。類似判定では、例えば、各フレームについて、画素値分布から色ヒストグラムを取得し、その類似を判定するようにしても良い。
S1405では、CPU101は、sにdを加算して変数dの方向に一つ進める。S1406では、CPU101は、sがキーフレームの位置から変数dの方向に所定回数、例えば6回移動したか否かを判定する。移動していないと判定された場合、S1403からの処理を繰り返す。移動していると判定された場合、S1407に進む。なお、ここでは、判定基準となる移動量を固定の6回としたが、キーフレームの第2スコアに応じて判定に用いるフレームの数を変えるなど、可変としても良い。
S1407では、CPU101は、変数dが1であるか否かを判定する。1でないと判定された場合、CPU101は、S1408でIDがsのフレームをハイライトシーンの開始フレームとして設定する。そして、S1409で、CPU101は、変数dの値を1に設定して変数sを正の方向に進めるようにして、S1402からの処理を繰り返す。S1407で1であると判定された場合、S1410で、CPU101は、IDがsのフレームをハイライトシーンの終了フレームとして設定する。S1410の処理後、図14の処理を終了する。
例えば、図3に示すように、フレーム情報管理テーブル301のID4のフレームが最も第2スコアが高いフレームである場合、ID4からID番号が小さくなる方向に類似判定を行って、開始フレームを探索する。そして、開始フレームが設定された後、ID4からID番号が大きくなる方向に類似判定を行って終了フレームを探索することになる。仮に、ID9とID10が類似していないとした場合、ID1〜ID9までのフレームがハイライトシーンとして選択されることになる。
なお、本実施形態では、S1402で第2スコアが最も高いキーフレームを基準としてハイライトシーンを探索した。他の方法として、キーフレームの前後のフレームの第1スコアを加算するなどして、第2スコアと異なるスコアを算出し、最も高いスコアのキーフレームを基準としてハイライトシーンを探索するようにしても良い。また、S1404の類似判定では、第2の実施形態で用いた動き量の差が閾値より大きいか否かによって判定しても良いし、画像を解析して得られた局所特徴量を用いるなど他の方法により類似の判定を行っても良い。
また、本実施形態では、第1の実施形態と同様の動作によりキーフレームを選択し、キーフレームの情報を用いてハイライトシーンを選択した。しかしながら、第2の実施形態の動作によりキーフレームを選択し、そのキーフレームの情報を用いてハイライトシーンを選択しても良い。
以上説明したように、第1の実施形態または第2の実施形態により選択されたキーフレームを基準として、隣接するフレームとの類似を判定し、一定時間もしくはシーンが大きく変わる所で切り出した動画をハイライトシーンとして選択することができる。
以上、各実施形態を説明したが、本発明は、例えば、システム、装置、方法、プログラム若しくは記録媒体(記憶媒体)等としての実施態様をとることが可能である。具体的には、複数の機器(例えば、ホストコンピュータ、インタフェース機器、撮像装置、Webアプリケーション等)から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
また、本発明の目的は、以下のようにすることによって達成されることはいうまでもない。即ち、前述した実施形態の機能を実現するソフトウェアのプログラムコード(コンピュータプログラム)を記録した記録媒体(または記憶媒体)を、システムあるいは装置に供給する。係る記憶媒体は言うまでもなく、コンピュータ読取可能な記憶媒体である。そして、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムコードを読み出して実行する。この場合、記録媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記録した記録媒体は本発明を構成することになる。
(その他の実施例)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
100 情報処理装置: 101 CPU: 102 RAM: 103 ROM

Claims (14)

  1. 情報処理装置に記憶されるプログラムであって、
    前記情報処理装置のコンピュータを、
    複数のフレームそれぞれについて第1の特徴量を取得する処理を実行する第1の取得手段と、
    前記第1の取得手段により取得された前記第1の特徴量に基づいて、前記第1の特徴量と異なる第2の特徴量を取得するための対象のフレームの優先順位を特定する特定手段と、
    前記特定手段により特定された前記優先順位に従って、前記第2の特徴量を取得する処理を実行する第2の取得手段と、
    前記第2の取得手段により取得された前記第2の特徴量に基づいて、画像処理の対象となるフレームを選択する選択手段と、
    として実行させ、
    前記第2の取得手段は、前記優先順位に従って前記対象のフレームの前記第2の特徴量を取得する場合、前記対象のフレームの前後のフレームの前記第2の特徴量が取得済みでないならば、前記対象のフレームの前記第2の特徴量を取得し、前記対象のフレームの前後のフレームの前記第2の特徴量が取得済みであれば、前記対象のフレームの前記第2の特徴量を取得しない、
    ことを特徴とするプログラム。
  2. 前記特定手段は、前記第1の特徴量に基づいて前記複数のフレームをソートし、当該ソートされた順を前記優先順位とし、前記優先順位に従って前記第2の特徴量を取得する対象のフレームを特定することを特徴とする請求項1に記載のプログラム。
  3. 前記特定手段は、前記第1の特徴量から取得された第1のスコアに従って前記複数のフレームをソートすることを特徴とする請求項2に記載のプログラム。
  4. 前記第2の取得手段により取得された前記第2の特徴量が条件を満たすか否かを判定する判定手段、をさらに備え、
    前記選択手段は、前記判定手段により前記条件を満たすと判定されたフレームを、前記画像処理の対象となるフレームとして選択する、
    ことを特徴とする請求項1乃至3のいずれか1項に記載のプログラム。
  5. 前記判定手段は、前記第2の特徴量から取得された第2のスコアが閾値以上であるかを前記条件として判定することを特徴とする請求項4に記載のプログラム。
  6. 前記第2の特徴量が取得されるフレームの数は、前記第1の特徴量が取得されるフレームの数よりも小さいことを特徴とする請求項1乃至5のいずれか1項に記載のプログラム。
  7. 前記第1の特徴量は、所定の向きのオブジェクトの特徴量であり、前記第2の特徴量は、当該所定の向きを含む複数の向きのオブジェクトの特徴量であることを特徴とする請求項1乃至6のいずれか1項に記載のプログラム。
  8. 前記第1の特徴量は、フレームの画像に関わりなく前記複数のフレームそれぞれに付加されているパラメータであり、前記第2の特徴量は、フレームの画像の特徴量であることを特徴とする請求項1乃至7のいずれか1項に記載のプログラム。
  9. 前記複数のフレームは、動画データから取得されることを特徴とする請求項1乃至8のいずれか1項に記載のプログラム。
  10. 前記画像処理は、フレームの画像をレイアウトする処理であることを特徴とする請求項1乃至9のいずれか1項に記載のプログラム。
  11. 前記画像処理は、ハイライトシーンを作成する処理であることを特徴とする請求項1乃至9のいずれか1項に記載のプログラム。
  12. 前記複数のフレームの並びにおいて、前記選択手段により選択されたフレームを基準として、当該フレームに類似するフレームを前記ハイライトシーンに用いるフレームとして設定する設定手段、をさらに備えることを特徴とする請求項11に記載のプログラム。
  13. 情報処理装置において実行される方法であって、
    複数のフレームそれぞれについて第1の特徴量を取得する処理を実行する第1の取得工程と、
    前記第1の取得工程において取得された前記第1の特徴量に基づいて、前記第1の特徴量と異なる第2の特徴量を取得するための対象のフレームの優先順位を特定する特定工程と、
    前記特定工程において特定された前記優先順位に従って、前記第2の特徴量を取得する処理を実行する第2の取得工程と、
    前記第2の取得工程において取得された前記第2の特徴量に基づいて、画像処理の対象となるフレームを選択する選択工程と、
    を有し、
    前記第2の取得工程は、前記優先順位に従って前記対象のフレームの前記第2の特徴量を取得する場合、前記対象のフレームの前後のフレームの前記第2の特徴量が取得済みでないならば、前記対象のフレームの前記第2の特徴量を取得し、前記対象のフレームの前後のフレームの前記第2の特徴量が取得済みであれば、前記対象のフレームの前記第2の特徴量を取得しない、
    ことを特徴とする方法。
  14. 複数のフレームそれぞれについて第1の特徴量を取得する処理を実行する第1の取得手段と、
    前記第1の取得手段により取得された前記第1の特徴量に基づいて、前記第1の特徴量と異なる第2の特徴量を取得するための対象のフレームの優先順位を特定する特定手段と、
    前記特定手段により特定された前記優先順位に従って、前記第2の特徴量を取得する処理を実行する第2の取得手段と、
    前記第2の取得手段により取得された前記第2の特徴量に基づいて、画像処理の対象となるフレームを選択する選択手段と、
    を備え、
    前記第2の取得手段は、前記優先順位に従って前記対象のフレームの前記第2の特徴量を取得する場合、前記対象のフレームの前後のフレームの前記第2の特徴量が取得済みでないならば、前記対象のフレームの前記第2の特徴量を取得し、前記対象のフレームの前後のフレームの前記第2の特徴量が取得済みであれば、前記対象のフレームの前記第2の特徴量を取得しない、
    ことを特徴とする情報処理装置。
JP2016239780A 2016-12-09 2016-12-09 情報処理装置、方法およびプログラム Active JP6948787B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2016239780A JP6948787B2 (ja) 2016-12-09 2016-12-09 情報処理装置、方法およびプログラム
US15/820,474 US10650242B2 (en) 2016-12-09 2017-11-22 Information processing apparatus, method, and storage medium storing a program that obtain a feature amount from a frame in accordance with a specified priority order

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016239780A JP6948787B2 (ja) 2016-12-09 2016-12-09 情報処理装置、方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2018097490A JP2018097490A (ja) 2018-06-21
JP6948787B2 true JP6948787B2 (ja) 2021-10-13

Family

ID=62490000

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016239780A Active JP6948787B2 (ja) 2016-12-09 2016-12-09 情報処理装置、方法およびプログラム

Country Status (2)

Country Link
US (1) US10650242B2 (ja)
JP (1) JP6948787B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6723566B2 (ja) * 2018-10-17 2020-07-15 株式会社アジェンシア コンテンツ生成プログラム、コンテンツ生成方法及びコンテンツ生成システム
CN109726765A (zh) 2019-01-02 2019-05-07 京东方科技集团股份有限公司 一种视频分类问题的样本提取方法及装置
US11893668B2 (en) 2021-03-31 2024-02-06 Leica Camera Ag Imaging system and method for generating a final digital image via applying a profile to image information

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3882585B2 (ja) * 2001-11-07 2007-02-21 富士ゼロックス株式会社 画像処理装置およびプログラム
JP4613617B2 (ja) * 2005-01-07 2011-01-19 ソニー株式会社 画像処理システム、学習装置および方法、並びにプログラム
JP2006331271A (ja) * 2005-05-30 2006-12-07 Nippon Hoso Kyokai <Nhk> 代表画像抽出装置及び代表画像抽出プログラム
US8160245B2 (en) * 2007-03-07 2012-04-17 Research In Motion Limited Methods and apparatus for performing an elliptic curve scalar multiplication operation using splitting
JP4966167B2 (ja) 2007-11-13 2012-07-04 株式会社ニコンシステム 画像評価装置及びこの画像評価装置を有するカメラ
US8953685B2 (en) * 2007-12-10 2015-02-10 Qualcomm Incorporated Resource-adaptive video interpolation or extrapolation with motion level analysis
JP5176572B2 (ja) * 2008-02-05 2013-04-03 ソニー株式会社 画像処理装置および方法、並びにプログラム
JP5495101B2 (ja) 2009-09-15 2014-05-21 株式会社リコー 動画サムネイル作成装置、方法及びプログラム
AU2009243486B2 (en) 2009-12-02 2012-12-13 Canon Kabushiki Kaisha Processing captured images having geolocations
JP5693162B2 (ja) * 2010-11-09 2015-04-01 キヤノン株式会社 画像処理システム、撮像装置、画像処理装置及びそれらの制御方法、プログラム
EP2690867A4 (en) * 2011-03-25 2014-09-10 Nec Corp VIDEO PROCESSING SYSTEM, VIDEO CONTENT MONITORING METHOD, VIDEO PROCESSING DEVICE, ITS CONTROL METHOD AND STORAGE MEDIUM STORING A CONTROL PROGRAM
JP2013225731A (ja) * 2012-04-19 2013-10-31 Nippon Hoso Kyokai <Nhk> 画像処理装置及びプログラム
US10540566B2 (en) * 2012-06-29 2020-01-21 Nec Corporation Image processing apparatus, image processing method, and program
JP6015250B2 (ja) * 2012-08-31 2016-10-26 富士通株式会社 画像処理装置、画像処理方法及び画像処理プログラム
JP6036335B2 (ja) * 2013-01-24 2016-11-30 富士通株式会社 画像処理装置、画像処理方法および画像処理プログラム
CN104660900B (zh) * 2013-10-30 2018-03-02 株式会社摩如富 图像处理装置及图像处理方法
JP6211407B2 (ja) * 2013-12-06 2017-10-11 株式会社デンソーアイティーラボラトリ 画像検索システム、画像検索装置、検索サーバ装置、画像検索方法、及び画像検索プログラム
US10664687B2 (en) * 2014-06-12 2020-05-26 Microsoft Technology Licensing, Llc Rule-based video importance analysis
JP6516832B2 (ja) * 2015-04-08 2019-05-22 株式会社日立製作所 画像検索装置、システム及び方法
JP6660119B2 (ja) 2015-08-07 2020-03-04 キヤノン株式会社 情報処理装置、情報処理方法、並びにプログラム

Also Published As

Publication number Publication date
US20180165521A1 (en) 2018-06-14
US10650242B2 (en) 2020-05-12
JP2018097490A (ja) 2018-06-21

Similar Documents

Publication Publication Date Title
EP3457683B1 (en) Dynamic generation of image of a scene based on removal of undesired object present in the scene
KR101739245B1 (ko) 비디오 프레임들의 디스플레이 파티셔닝 및 클러스터링을 위한 오브젝트들의 선택 및 추적
US10410677B2 (en) Content management system, management content generating method, management content play back method, and recording medium
US7916894B1 (en) Summary of a video using faces
US11184558B1 (en) System for automatic video reframing
CN106663196B (zh) 用于识别主体的方法、***和计算机可读存储介质
US8897603B2 (en) Image processing apparatus that selects a plurality of video frames and creates an image based on a plurality of images extracted and selected from the frames
CN105830093A (zh) 用于产生与非均匀大小的空间区相关的元数据的***、方法及设备
US9727789B2 (en) Information processing apparatus and control method thereof
US10115431B2 (en) Image processing device and image processing method
CN108377351A (zh) 用于在模板上布局图像的图像处理装置和图像处理方法
JP6948787B2 (ja) 情報処理装置、方法およびプログラム
CN105095853A (zh) 图像处理装置及图像处理方法
JP2012105205A (ja) キーフレーム抽出装置、キーフレーム抽出プログラム、キーフレーム抽出方法、撮像装置、およびサーバ装置
JP2007249434A (ja) アルバム作成システム、アルバム作成方法、及びプログラム
EP3151243B1 (en) Accessing a video segment
US10924637B2 (en) Playback method, playback device and computer-readable storage medium
JP6410427B2 (ja) 情報処理装置、情報処理方法及びプログラム
US11373313B2 (en) Image processing apparatus and image processing method
JP6579925B2 (ja) 画像再生装置およびその制御方法ならびにプログラムならびに記録媒体
JP7166796B2 (ja) 情報処理装置、情報処理方法、及びプログラム
JP7324066B2 (ja) 画像処理装置およびその制御方法、ならびに撮像装置
US8588475B2 (en) Image processing apparatus and image processing method for indicating movement information
JP7266490B2 (ja) 画像処理装置、その制御方法及びプログラム
JP5582924B2 (ja) 画像処理装置、画像処理方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191204

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20210103

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210113

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210412

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210823

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210921

R151 Written notification of patent or utility model registration

Ref document number: 6948787

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151