JP2005276220A - ビデオからのインテリジェントなキーフレーム抽出 - Google Patents
ビデオからのインテリジェントなキーフレーム抽出 Download PDFInfo
- Publication number
- JP2005276220A JP2005276220A JP2005085295A JP2005085295A JP2005276220A JP 2005276220 A JP2005276220 A JP 2005276220A JP 2005085295 A JP2005085295 A JP 2005085295A JP 2005085295 A JP2005085295 A JP 2005085295A JP 2005276220 A JP2005276220 A JP 2005276220A
- Authority
- JP
- Japan
- Prior art keywords
- video
- key frame
- frame
- key
- candidates
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/91—Television signal processing therefor
- H04N5/93—Regeneration of the television signal or of selected parts thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/738—Presentation of query results
- G06F16/739—Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/74—Browsing; Visualisation therefor
- G06F16/743—Browsing; Visualisation therefor a collection of video files or sequences
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7834—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using audio features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7847—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
- G06F16/785—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content using colour or luminescence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7847—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
- G06F16/786—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content using motion, e.g. object motion or camera motion
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Library & Information Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】 ビデオクリップの内容の重要な描写を提供するキーフレームを抽出する方法及びシステムを提供する。
【解決手段】 本発明では、ビデオ12中の意味のある内容を検出するようにそれぞれ選択される集合をなす解析を各ビデオフレームに実施することによって前記ビデオ12中の一連のビデオフレームの中から集合をなすキーフレーム候補18を選択するステップと、前記キーフレーム候補を集合をなすクラスタにアレンジするステップと、各キーフレーム候補18の相対的な重要度に応じて、各クラスタから前記キーフレーム候補の1つを選択するステップとを含む、ビデオから集合をなすキーフレームを抽出する方法が提供される。
【選択図】 図1
【解決手段】 本発明では、ビデオ12中の意味のある内容を検出するようにそれぞれ選択される集合をなす解析を各ビデオフレームに実施することによって前記ビデオ12中の一連のビデオフレームの中から集合をなすキーフレーム候補18を選択するステップと、前記キーフレーム候補を集合をなすクラスタにアレンジするステップと、各キーフレーム候補18の相対的な重要度に応じて、各クラスタから前記キーフレーム候補の1つを選択するステップとを含む、ビデオから集合をなすキーフレームを抽出する方法が提供される。
【選択図】 図1
Description
本発明は、ビデオクリップの内容の重要な描写を提供するキーフレームを抽出する方法及びシステムに関する。
ビデオは、画像シーンのビデオスナップショットをそれぞれ含む一連のビデオフレームを含むことができる。一連のビデオフレームを適切なフレームレートでディスプレイ上にレンダリングして、ビデオ再生を提供することができる。
ビデオシステムは、ビデオのビデオフレームのサブセットを抽出して、ビデオのキーフレームとして使用する機能を備えることができる。たとえば、ビデオから集合をなすキーフレームを抽出して、ビデオのストーリーボードを構築することができる。ストーリーボードは、抽出されたキーフレームを、見る側にビデオの内容の視覚的な目安(indication)を提供する一連のサムネイル画像としてレンダリングすることによって構築することができる。
ビデオからキーフレームを抽出する1つの従来の方法は、ビデオ中のショットの配置に基づく。ショットは、連続して取り込まれた一連のビデオフレームとして定義することができる。たとえば、専門的に生成されたビデオは、綿密に選択されたショットのセットにアレンジすることができる。このようなビデオのキーフレームは、ショットの境界を検出し、次いで検出された各ショットの集合をなすキーフレームを選択することによって抽出することができる。たとえば、キーフレームは序盤、中盤、および/または終盤のショットで選択することができる。
不都合なことに、ショット検出に基づくキーフレーム抽出方法は、短いビデオクリップやショットに綿密にアレンジされていないアマチュアビデオからのキーフレーム抽出に適さない場合がある。さらに、このような従来の方法によって選択されるキーフレームは、ビデオ中の内容のハイライトやビデオ中の重要であり得る内容を表さない場合がある。
ビデオの重要な内容を表すキーフレームをもたらす、ビデオからキーフレームをインテリジェントに抽出する方法を開示する。本技法による方法は、各ビデオフレームに対して解析のセットを行うことによってビデオ中の一連のビデオフレームの中から集合をなすキーフレーム候補を選択することを含む。各解析は、対応するタイプのビデオ中の重要な内容を検出するように選択される。次いで、キーフレーム候補は集合をなすクラスタにアレンジされ、次いで、ビデオ中の重要な内容を表すことに関しての相対的な重要度に応じて、各クラスタからキーフレームが選択される。
本技法は、ビデオクリップの内容の重要な描写を提供するキーフレームを抽出することにより、膨大なビデオクリップのコレクションの管理に使用することができる。本技法に従って抽出されるキーフレームは、ビデオ閲覧およびビデオプリントに使用することができる。
本発明の他の特徴および利点が以下の詳細な説明から明らかになろう。
本発明について、本発明の特定の例示的な実施形態を参照して説明し、それに沿って図面を参照する。
図1は、本教示によるビデオから集合をなすキーフレームを抽出する方法の実施形態を示す。ステップ300において、集合をなすキーフレーム候補が、ビデオ中の一連のビデオフレームの中から選択される。キーフレーム候補は、各ビデオフレームに対して解析のセットを行うことによって選択される。各解析は、ビデオ中の重要な内容を検出するように選択される。重要な内容は、数例を挙げれば、ビデオ中のカメラの移動、ビデオ中のオブジェクトの移動、ビデオに含まれている人の顔の数、および/またはビデオ中のオーディオイベントを解析することによって検出することができる。
ステップ302において、ステップ300からのキーフレーム候補は集合をなすクラスタにアレンジされる。クラスタの数は固定であっても、またはビデオの内容の複雑性に応じて可変であってもよい。
ステップ304において、各クラスタから、ビデオのキーフレームとしてキーフレーム候補の1つが選択される。キーフレーム候補は、各キーフレーム候補の相対的な重要度に応じて選択することができる。キーフレーム候補の相対的な重要度は、キーフレーム候補における重要な内容の全体レベルに基づくことができる。
図2は、本教示によるキーフレーム抽出システム10の実施形態を示す。キーフレーム抽出システム10は、ビデオ12からキーフレーム32のセットを抽出する。
キーフレーム抽出システム10は、ビデオ12中の一連のビデオフレームの各ビデオフレームを抽出し、抽出されたビデオフレームを集合をなすフレームアナライザ20〜24に供給するビデオフレームエクストラクタ14を備える。各フレームアナライザ20〜24は、ビデオフレームエクストラクタ14から供給されたビデオフレームに対して、対応する解析を行う。各解析は、ビデオ12中の重要な内容を検出するように選択される。各フレームアナライザ20〜24は、ビデオ12のビデオフレームからキーフレーム候補を選択する。フレームアナライザ20〜24によって選択されたキーフレーム候補は、キーフレーム候補18のセットとして累積される。
キーフレーム抽出システム10は、ビデオ12中のオーディオイベントを検出するオーディオイベント検出器16を備える。検出されたオーディオイベントに対応するビデオ12のビデオフレームは、キーフレーム候補18に含めるものとして選択される。
キーフレーム抽出システム10は、各キーフレーム候補18の相対的な重要度に基づいてキーフレーム候補18の中からキーフレーム32を選択するキーフレームセレクタ30を備える。さらに、キーフレームセレクタ30は、各キーフレーム候補18の相対画質に基づいてキーフレーム候補18の中からキーフレーム32を選択する。
フレームアナライザ20〜24はカラーヒストグラムアナライザを含む。カラーヒストグラムアナライザは、ビデオ12の各ビデオフレームのカラーヒストグラムを求める。ビデオ12中のビデオフレームのカラーヒストグラムの差を用いて、ビデオの内容を差別化することができる。たとえば、カラーヒストグラムの差を用いて、ビデオ12における大きなシーンの変化を検出することができる。カラーヒストグラムアナライザは、先行するビデオフレームと比較してカラーヒストグラムに相対的に大きな変化が検出される場合に、ビデオ12中のビデオフレームをキーフレーム候補として選択する。カラーヒストグラムアナライザはビデオフレームのカラーヒストグラムを正規化して、ビデオ12における照明の変化による影響を最小化する。
まず、カラーヒストグラムアナライザは、ビデオ12の最初のビデオフレームをキーフレーム候補および基準フレームとして選択する。次いで、カラーヒストグラムアナライザは、カラーヒストグラムの差が所定のしきい値よりも高くなるまで、基準フレームのカラーヒストグラムをビデオ12中の後続する各ビデオフレームのカラーヒストグラムと比較する。次いで、カラーヒストグラムアナライザは、所定のしきい値を越えるビデオフレームをキーフレーム候補および新しい基準フレームとして選択し、次いで、プロセスをビデオ12中の残りのビデオフレームに対して繰り返す。
カラーヒストグラム差は以下のように計算することができる。ビデオフレームのカラーヒストグラムは、ビデオフレームの各ピクセルの赤、緑、および青の各成分の値を組み合わせて1つのカラーコードにすることによって計算することができる。カラーコードのビット深さは任意であることができる。たとえば、8ビットのカラーコードは0〜255の範囲を有し、緑に最上位4ビット、赤に最上位2ビット、および青に最上位2ビットを含むことができる。したがって、ビデオフレームのカラーヒストグラムH(k)の値は、kに等しいカラーコードを有するビデオフレームのピクセルの総数に等しい。但し、k=0〜255である。
Hi(k)およびHj(k)でi番目のビデオフレームおよびj番目のビデオフレームそれぞれのヒストグラム値を表し、k=0〜255とする。i番目のビデオフレームとj番目のビデオフレームとの間のカラーヒストグラム差は以下のように計算される。
別法として、i番目のビデオフレームとj番目のビデオフレームとの間のカラーヒストグラム差は以下のように計算されて、差をより強く反映させることができる。
照明の変化は2つの連続したビデオフレームのカラーヒストグラムをシフトさせる可能性があるため、輝度正規化を適用することができる。これにより、2つの同様のビデオフレームに、相対的に大きなカラーヒストグラム差を示させることができる。輝度正規化は、ビデオフレーム内のすべてのピクセルの輝度の和を正規化することによって行うことができる。正規化は、隣接するビデオフレームの間で相対的に大きなカラーヒストグラム差が検出される場合に行うことができる。後続するビデオフレームの輝度は、新しい基準フレームが選択されるまで、基準フレームの輝度の従って正規化することができる。
図3は、ビデオ12中の一連のビデオフレーム例40〜47に対するカラーヒストグラムアナライザの動作を示す。ビデオフレーム40はビデオ12中の最初のビデオフレームであり、カラーヒストグラムアナライザにより最初のキーフレーム候補および最初の基準フレームとして選択される。
カラーヒストグラムアナライザは、ビデオフレーム40のカラーヒストグラムおよびビデオフレーム41のカラーヒストグラムを求め、ビデオフレーム40および41のカラーヒストグラム差を求める。ビデオフレーム40および41のカラーヒストグラム差は、所定のしきい値を越えない。カラーヒストグラムアナライザは、ビデオフレーム42のカラーヒストグラム、およびビデオフレーム40および42のカラーヒストグラム差を求める。ここでも、ビデオフレーム40および42のカラーヒストグラム差は、所定のしきい値を越えない。カラーヒストグラムアナライザは、ビデオフレーム43のカラーヒストグラム、およびビデオフレーム40および43のカラーヒストグラム差を求める。ビデオフレーム40および43のカラーヒストグラム差は所定のしきい値を越えるため、カラーヒストグラムアナライザはビデオフレーム43を別のキーフレーム候補としておよび後続のビデオフレーム44〜47のカラーヒストグラムと比較する新しい基準フレームとして選択する。
後続のステップにおいて、カラーヒストグラムアナライザはビデオフレーム47を次のキーフレーム候補として選択する。図3に示す矢印は、ビデオフレーム40〜47の間でのカラーヒストグラムの比較を示す。
フレームアナライザ20〜24は、ビデオ12の各ビデオフレームのカラーレイアウトを求めるカラーレイアウトアナライザを含む。ビデオフレーム中のカラーレイアウトを使用して、ビデオフレームの内容を差別化することができる。たとえば、ビデオ12のビデオフレームのカラーレイアウトの差を使用して、ビデオ12中のオブジェクトの大きな変化を検出するとともに、ビデオ12中のオブジェクトの移動を検出することができる。
図4は、オブジェクト54を含むビデオ12中の一連のビデオフレーム例50〜52を示す。オブジェクト54は、各後続ビデオフレーム50〜52内で位置を変える。オブジェクト54の位置変化は、ビデオフレーム50〜52のカラーレイアウトの変化によって示される。たとえば、オブジェクト54のカラーコンテンツは、ビデオフレーム50のサブブロック55に大部分含まれ、次いで、ビデオフレーム51のサブブロック56に大部分移動し、次いでビデオフレーム52のサブブロック57に大部分移動する。
カラーレイアウトアナライザは、ビデオ12中の先行ビデオフレームと比較してカラーレイアウトに相対的に大きな変化が検出される場合、そのビデオフレームをキーフレーム候補として選択する。最初に、カラーレイアウトアナライザは、ビデオ12中の最初のビデオフレームをキーフレーム候補および基準フレームとして選択する。次いで、カラーレイアウトアナライザは、差が所定のしきい値よりも高くなるまで、基準フレームのカラーレイアウトをビデオ12中の各後続ビデオフレームのカラーレイアウトと比較する。カラーレイアウトアナライザは、所定のしきい値を越えるカラーレイアウト差を有するビデオフレームを新しいキーフレーム候補および新しい基準フレームとして選択し、次いで、ビデオ12中の残りのビデオフレームに対してプロセスを繰り返す。
カラーレイアウト差は、ビデオフレームを複数のサブブロックに分割することによって計算することができる。たとえば、ビデオフレームの幅がWIDTHであり、ビデオフレームの高さがHEIGHTであり、ビデオフレームがN×Nサブブロックに分割される場合、各サブブロックの幅はWIDTH/Nであり、各サブブロックの高さはHEIGHT/Nである。次いで、サブブロック全体にわたって赤、緑、および青の各成分を平均することにより、各サブブロックの平均カラーを計算することができる。
2つのビデオフレーム間のカラーレイアウト差は、2つのビデオフレーム中の対応するサブブロックの各対の平均カラーの差を計算することにより、すなわち各色成分の絶対差の平均を計算することにより、計算することができる。次いで、最大差の値を有するM個のサブブロックがN×Nサブブロックの中から選択される。M個の差の値の平均が計算され、これが2つのビデオフレームのカラーレイアウト差を表す。
別法として、カラーレイアウトを計算する他の方法、たとえば、MPEG−7規格において規定される方法を採用することもできる。
カラーレイアウトアナライザおよびカラーヒストグラムアナライザは、カラーレイアウトおよび/またはカラーヒストグラムに関して実質的に異なるキーフレーム候補をもたらす。カラーレイアウトおよび/またはカラーヒストグラムが実質的に異なるキーフレーム候補により、選択キーフレームの重複を回避しながら、ビデオ12において異なるビューのシーンを示すキーフレームの選択が可能になる。
フレームアナライザ20〜24は、高速カメラ移動検出器を含む。高速カメラ移動検出器は、ビデオ12中の複数の連続したビデオフレームにわたる隣接ビデオフレームのカラーレイアウトまたはカラーヒストグラムの相対的に大きな差を検出することにより、ビデオ12を取り込んだカメラの高速移動を検出することができる。高速カメラ移動の期間に対応するビデオ12中のビデオフレームは、高速移動はぶれた画像になりがちであることからキーフレーム候補18に選択されない。代わりに、高速カメラ移動検出器は、高速カメラ移動が止まり、カメラが安定化した直後にキーフレーム候補を選択する。
フレームアナライザ20〜24はカメラ移動トラッカを含む。カメラ移動トラッカは、ビデオ12を取り込んだカメラの移動をトラッキングすることにより、ビデオ12の内容のハイライトを検出する。カメラ移動トラッカは、ビデオ12の一連のビデオフレームの間の相対移動を解析することにより、ビデオ12中のカメラ移動を検出する。カメラ移動トラッカは、MPEG符号化に関連するもの等のブロックベースの移動解析を使用して、ビデオ12中のビデオフレームの間の相対移動を求めることができる。
図5a〜図5cは、カメラ移動トラッカが、ビデオ12中の隣接するビデオフレーム60〜62の対の間での相対移動を求めるために採用することができる一方法を示す。カメラ移動トラッカは、ビデオフレーム60および62のピクセルの内容を比較し、ビデオフレーム60のブロック70がビデオフレーム62中のブロック72と実質的に同様であると判断する。たとえば、カメラ移動トラッカは、ブロック70および72中のピクセルデータ値に基づいてブロック70および72の間の相関メトリックを求めて、類似度を求めることができる。カメラ移動トラッカは、基準フレームとしてのビデオフレーム60に基づいて、ブロック70および72の間の空間関係を示す動きベクトル74を生成する。カメラ移動トラッカは、ビデオフレーム60〜62の動きベクトルのセットを生成し、各動きベクトルは基準ビデオフレーム60のブロックに対応する。カメラ移動トラッカは、ビデオ12中の隣接するビデオフレーム対の動きベクトルの配置を調べて、移動を検出する。
カメラ移動トラッカは、相対的に一貫した方向および均一の大きさを示す方向および大きさを有する隣接ビデオフレームの動きベクトルの配置を検出することにより、パン移動を検出することができる。カメラ移動トラッカは、ビデオフレームの中心から離れて指す隣接ビデオフレームの動きベクトルの配置を検出することによってズームイン移動を検出することができる。カメラ移動トラッカは、ビデオフレームの中心を指す隣接ビデオフレームの動きベクトルの配置を検出することによってズームアウト移動を検出することができる。カメラ移動トラッカは、隣接ビデオフレーム中の略ゼロの動きベクトルの配置を検出することによってフォーカス期間を検出することができる。カメラ移動トラッカは、相対的に大きな大きさおよび均一の方向を有する隣接ビデオフレームの動きベクトルを検出することにより、高速パン移動期間またはカメラ傾斜移動期間を検出することができる。
カメラ移動トラッカは、カメラ移動ルールのセットを使用してキーフレーム候補を選択する。1つのカメラ移動ルールは、パン移動期間またはズーム移動期間後のカメラフォーカスに関わる。カメラ移動トラッカが、パン移動期間またはズーム移動期間後にカメラがフォーカスする時間期間を検出する場合、フォーカス期間の開始直後のキーフレーム候補が選択される。フォーカス期間がビデオ12中の興味を持つシーンまたはオブジェクトに対応し得る。
別のカメラ移動ルールは、ビデオ12の開始時の比較的長期間のフォーカス後のパン移動に関わる。カメラ移動トラッカが、ビデオ12の開始時の比較的長期間のフォーカス後のパン移動を検出する場合、キーフレーム候補がパン移動の開始時に選択される。パン移動の開始は、ビデオ12中の来るべきハイライトの兆候であり得る。
別のカメラ移動ルールは、ビデオ12中の高速カメラ移動に関わる。カメラ移動トラッカがビデオ12中の高速カメラ移動を検出する場合、高速カメラ移動期間中にキーフレーム候補は選択されない。高速カメラ移動期間は、ビデオ12を取り込んだカメラの操作者にとって興味のないビデオ12中の内容を示し得る。
フレームアナライザ20〜24はオブジェクト移動アナライザを含む。オブジェクト移動アナライザは、ビデオフレーム中の小格子カラーレイアウトを比較することにより、ビデオ12中の移動中オブジェクトの軌跡を調べる。オブジェクト移動アナライザは、新しいオブジェクトが現われたとき、またはオブジェクトの移動がオブジェクトサイズまたはビデオフレーム内のオブジェクト位置に関して大幅に変化したときにキーフレーム候補を選択する。オブジェクト移動アナライザは、ビデオフレームの中央付近に移動中のオブジェクトがあるビデオフレームを優先的に選択する。
図6は、移動中オブジェクト114を取り込むビデオ12中の隣接ビデオフレーム110〜112の対を示す。オブジェクト移動アナライザは、移動中オブジェクト114がビデオフレーム112内でかなりのサイズを有し、ビデオフレーム112の中心付近にあるため、ビデオフレーム112をキーフレーム候補として選択する。
オブジェクト移動アナライザは、移動中オブジェクトに関する観察のセットに基づいて移動中オブジェクト114を検出する。1つの観察は、ビデオ12中の前景の移動がビデオ12中の背景の移動と実質的に異なることである。別の観察は、ビデオ12を取り込んだ撮影者が、中間サイズまたはより大きな移動中オブジェクトの取り込みに興味を持ち、また興味を持つ移動中オブジェクトをカメラビューファインダの中心付近に保つことに興味を持っていたことである。別の観察は、カメラ操作者が一度に1つの支配的な移動中オブジェクトに興味を持つ傾向が高かったことである。
図7aおよび図7bは、オブジェクト移動アナライザにより行われる、ビデオ12中のビデオフレーム126中の移動中オブジェクトを検出する方法を示す。オブジェクト移動アナライザはまず、ビデオフレーム126に対してカメラ移動推定120を行う。次いで、オブジェクト移動アナライザは、ビデオフレーム126のカメラ移動推定に応じて、残差誤差計算を行うことによって残差画像130を生成する。次いで、オブジェクト移動アナライザは、フィルタリング124を残差画像130に施す。フィルタリング124は、一連のフィルタ140〜143を含む。図7bは、残差画像130から導出されるフィルタリング後の残差画像160を示す。
次いで、オブジェクト移動アナライザは、ブロック170の連結性に基づいて、フィルタリング後の残差画像160中のブロック170のセットをクラスタ化する。オブジェクト移動アナライザは、図7bに示すように、ビデオフレーム126の中央付近の最大クラスタであるブロック180のクラスタを保持し、残りのブロック170を除去する。次いで、オブジェクト移動アナライザは、図7bに示すように、ビデオフレーム126中の検出された移動中オブジェクトの位置を表す、ブロック180の枠162を求める。
枠162中の移動中オブジェクトが検出されると、オブジェクト移動アナライザは、ビデオフレーム126に続くビデオ12の複数のビデオフレームを通してその移動中オブジェクトをトラッキングする。オブジェクト移動アナライザは、連続したビデオフレームにおけるオブジェクトの移動をトラッキングする様々な既知の方法のいずれかを使用してオブジェクトをトラッキングすることができる。
フレームアナライザ20〜24は人面検出器を含む。人面検出器は、人の顔を含むビデオフレームは、人の顔を含まないビデオフレームよりもビデオ12を見る側にとって興味がある傾向があると仮定することができるため、ビデオ12のビデオフレームの中から人の顔を含むキーフレーム候補を選択する。人面検出器はまた、検出されたいずれの人の顔のサイズおよびフレーム位置も記録する。人面検出器は、パターンマッチング、たとえば人の顔の特徴の配置のマッチングに基づく方法を含め、人面検出器の既知のいずれの方法も採用することができる。
オーディオイベント検出器16は、ハイライトを示し得るビデオ12のサウンドトラックにおけるオーディオイベントを検出する。オーディオイベントの例としては、拍手、叫び声、喝采、無音期間後の高レベルのノイズの開始が挙げられる。オーディオイベント検出器16は、キーフレーム候補18に含めるオーディオイベントの開始に対応するビデオ12中のビデオフレームを選択する。オーディオイベント検出器16は、所定の集合をなすオーディオイベントのオーディオエネルギーの統計モデルを採用し、次いでビデオ12中の各ビデオフレームのオーディオエネルギーを統計モデルとマッチングすることができる。
図8aは、オーディオイベント例220のオーディオスペクトルである。オーディオイベント例220は、比較的高いレベルの、高速変化するピッチを特徴とする叫び声の音である。オーディオイベント検出器16は、オーディオ信号の周波数領域における叫び声のピッチ、すなわち基本周波数、および部分音、すなわち基本周波数の整数倍を求めてビデオ12のサウンドトラックを探索し、キーフレーム候補は叫び声のポイントにおいて選択される。
図8bは、比較的長期間の無音後のノイズまたはスピーチの期間であるオーディオイベント例222のオーディオ信号波形である。オーディオイベント検出器16は、オーディオ信号のエネルギーレベルをトラッキングし、比較的長期間の無音後のノイズまたはスピーチの期間の開始に対応するポイント222においてキーフレーム候補を選択する。
図9は、キーフレーム候補18の中からキーフレーム32を選択する、キーフレームセレクタ30によって採用される方法の実施形態を示す。ステップ200において、キーフレームセレクタ30は、各キーフレーム候補18の特徴に基づいてキーフレーム候補18をクラスタ化する。一実施形態では、キーフレームセレクタ30は、各キーフレーム候補18のカラーヒストグラムに応じてキーフレーム候補18をクラスタ化する。他の実施形態では、キーフレーム候補18の他の特徴を、ステップ200におけるクラスタ化のベースとして使用することができる。
キーフレームセレクタ30は、ステップ200において、キーフレーム候補18を固定数N個のクラスタにクラスタ化することができる。たとえば、4つのキーフレームを選択すべき実施形態では、キーフレームセレクタ30はキーフレーム候補18を4つのクラスタにクラスタ化する。キーフレームの数は、特定の用途、たとえば、ビデオポストカード、ビデオストーリーブック、カメラまたはプリンタのLCDディスプレイ等に適した数に制限することができる。最初に、キーフレームセレクタ30は、キーフレーム候補18の中の第Nのキーフレーム候補18を各クラスタ1〜Nにランダムに割り当てる。これらキーフレーム候補のカラーヒストグラムが、各クラスタ1〜Nの初期重心を提供する。次いで、キーフレームセレクタ30は、残りのキーフレーム候補18のカラーヒストグラムをクラスタ1〜Nの重心と繰り返し比較し、重心との最良マッチングに基づいてキーフレーム候補18をクラスタ1〜Nに割り当て、それに従ってクラスタ1〜Nの重心を更新する。
キーフレームセレクタ30は、ステップ200において、キーフレーム候補18を可変数nのクラスタにクラスタ化することができる。nの値は、ビデオ12の内容の複雑性に従って可変である。たとえば、キーフレームセレクタ30は、ビデオ12の内容がより多様であることに応じて、より大きな数のクラスタを採用することができる。これを使用して、たとえば、ビデオコレクションの閲覧に使用されるより多くのキーフレーム32をもたらすことができる。最初に、キーフレームセレクタ30は、キーフレーム候補18の中の第1のキーフレーム候補18をクラスタ1に割り当て、第1のキーフレーム候補18のカラーヒストグラムをクラスタ1の重心として使用する。次いで、キーフレームセレクタ30は、キーフレーム候補18の中の第2のキーフレーム候補18のカラーヒストグラムをクラスタ1の重心と比較する。クラスタ1の重心との差が所定のしきい値未満の場合、第2のキーフレーム候補はクラスタ1に割り当てられ、クラスタ1の重心は、第2のキーフレーム候補18のカラーヒストグラムで更新される。第2のキーフレーム候補18のカラーヒストグラムが所定のしきい値を超える量分、クラスタ1の重心と異なる場合、第2のキーフレーム候補はクラスタ2に割り当てられ、その第2のキーフレーム候補のカラーヒストグラムがクラスタ2の重心として機能する。このプロセスは、残りのキーフレーム候補18に対して繰り返される。
ステップ202において、キーフレームセレクタ30は、各キーフレーム候補18の重要度スコアを求める。キーフレーム候補の重要度スコアは、キーフレーム候補の特徴のセットに基づく。
キーフレーム候補の重要度スコアを求めるために使用される1つの特徴は、キーフレーム候補がカメラ移動トラッカのカメラ移動ルールの1つを満たしているか否かである。キーフレーム候補がカメラ移動ルールの1つを満たす場合、キーフレームセレクタ30はキーフレーム候補に重要度ポイント1の評価を与える。
キーフレーム候補の重要度スコアを求めるために使用される別の特徴は、キーフレーム候補に含まれ得る任意の人の顔に基づく。この特徴に関連する要素としては、キーフレーム候補中の人の顔の数、キーフレーム候補中の人の顔のサイズ、およびキーフレーム候補内の人の顔の位置が挙げられる。キーフレームセレクタ30は、キーフレーム候補の所定のエリア範囲、たとえば中央エリアに含まれ、かつ所定のサイズよりも大きい人の顔の数(F)をカウントし、キーフレーム候補に重要度ポイントFの評価を与える。
キーフレーム候補の重要度スコアを求めるために使用される別の特徴は、キーフレーム候補中の移動中オブジェクトに基づく。キーフレームセレクタ30は、キーフレーム候補が、所定のサイズ範囲内のサイズを有する移動中オブジェクトを含む場合、キーフレーム候補に重要度ポイントMの評価を与える。数Mは、フレームの中央に対するキーフレーム候補中の移動中オブジェクトの位置によって求められる。数Mは、移動中オブジェクトがキーフレーム候補の予め画定された中央エリア範囲にある場合、3に等しい。数Mは、移動中オブジェクトがキーフレーム候補の予め画定された第2レベルのエリア範囲にある場合、2に等しい。数Mは、移動中オブジェクトがキーフレーム候補の予め画定された第3レベルのエリア範囲にある場合、1に等しい。
キーフレーム候補の重要度スコアを求めるために使用される別の特徴は、キーフレーム候補に関連するオーディオイベントに基づく。キーフレーム候補がオーディオイベント検出器16によって検出されたオーディオイベントに関連する場合、キーフレームセレクタ30は、キーフレーム候補に重要度ポイント1の評価を与える。
キーフレームセレクタ30は、対応する重要度ポイントを集計することによって各キーフレーム候補18の重要度スコアを求める。
ステップ204において、キーフレームセレクタ30は、各キーフレーム候補18の画質スコアを求める。キーフレーム候補の画質スコアは、キーフレーム候補の鮮鋭度、キーフレーム候補の輝度、または鮮鋭度と輝度の組み合わせに基づくことができる。キーフレームセレクタ30は、各キーフレーム候補18の画質スコアを求める際に、ビデオフレームの鮮鋭度および輝度を求める既知の方法を行うことができる。
ステップ206において、キーフレームセレクタ30は、キーフレーム候補18の各クラスタから1つのキーフレーム候補を選択することによってキーフレーム32を選択する。キーフレームセレクタ30は、最高重要度スコアを有し、かつ所定のしきい値を越える画質スコアを有するクラスタ中のキーフレーム候補を選択する。たとえば、キーフレームセレクタ30は最初に、最高重要度スコアを有するクラスタ中のキーフレーム候補を選択し、そのキーフレーム候補の画質スコアが所定のしきい値未満の場合、次に最も高い重要度スコアを有するクラスタ中のキーフレーム候補を選択し、画質スコアしきい値が満たされるまで以下同様である。2つ以上のキーフレーム候補が最高重要度スコアを有する場合、クラスタの重心に最も近いものが選択される。
キーフレーム抽出システム10では、ビデオ12のキーフレームの半自動ユーザ選択が可能である。たとえば、キーフレーム32を初期セットとして使用することができる。初期セットに基づいて、ユーザは、初期セット中の各キーフレームの先行フレームおよび後続フレームの閲覧を選択して、プリント、または友人に電子メール送信等すべき的確なフレームを見つけることができる。別の例では、キーフレームセレクタ30は、各クラスタにX個のキーフレーム候補、たとえば、最高重要度スコアのX個のキーフレーム候補を選択することができる。キーフレーム抽出システム10は、ディスプレイおよびユーザインタフェース機構を備えることができる。各クラスタのX個のキーフレーム候補をディスプレイ上にレンダリングすることができ、ユーザは、ユーザインタフェース機構を介して最も魅力のあるキーフレーム候補を選択することができる。
本技法は、ビデオクリップのコレクション、たとえば、デジタルカメラを使用して取り込まれた短いビデオクリップのコレクション、ならびにカムコーダを使用して取り込まれたビデオ記録中の未編集のロングショットの管理に使用することができる。ビデオクリップから抽出されたキーフレームは、ビデオプリントおよび/またはビデオ閲覧、およびたとえば電子メール、携帯電話ディスプレイ等を通してのビデオ通信に使用することができる。キーフレームを抽出する上記方法は、ビデオクリップのハイライトを示し、見る側にとって重要であり得るビデオクリップの内容を示すことができるキーフレームをもたらす。フレームアナライザ20〜24によって行われる複数のタイプの内容解析により、ビデオクリップの内容のわかりのよい表現を提供するキーフレームの抽出が可能である。抽出されたキーフレームは、ビデオクリップのサムネイル表現、ビデオクリップのプレビュー、ならびにビデオデータのカテゴリ化および検索に使用することができる。抽出されたキーフレームは、ストーリーブック、ポストカードのプリント等に使用することができる。
本発明の上記詳細な説明は、例示を目的として提供され、網羅的である、すなわち本発明を開示された厳密な実施形態に限定することを意図するものではない。したがって、本発明の範囲は添付の特許請求の範囲によって規定される。
Claims (10)
- ビデオ中の意味のある内容を検出するようにそれぞれ選択される集合をなす解析を各ビデオフレームに実施することによって前記ビデオ中の一連のビデオフレームの中から集合をなすキーフレーム候補を選択するステップと、
前記キーフレーム候補を集合をなすクラスタにアレンジするステップと、
各キーフレーム候補の相対的な重要度に応じて、各クラスタから前記キーフレーム候補の1つを選択するステップと
を含むビデオから集合をなすキーフレームを抽出する方法。 - ある集合をなすキーフレーム候補を選択する前記ステップは、前記ビデオ中のカメラの移動に応じて集合をなすキーフレーム候補を選択するステップを含む、請求項1に記載のビデオから集合をなすキーフレームを抽出する方法。
- 集合をなすキーフレーム候補を選択する前記ステップは、前記ビデオ中の物体の移動に応じて集合をなすキーフレーム候補を選択するステップを含む、請求項1に記載のビデオから集合をなすキーフレームを抽出する方法。
- 集合をなすキーフレーム候補を選択する前記ステップは、前記ビデオ中の高速なカメラの移動に応じて集合をなすキーフレーム候補を選択するステップを含む、請求項1に記載のビデオから集合をなすキーフレームを抽出する方法。
- 集合をなすキーフレーム候補を選択する前記ステップは、前記ビデオ中の人の顔の数に応じて集合をなすキーフレーム候補を選択するステップを含む、請求項1に記載のビデオから集合をなすキーフレームを抽出する方法。
- 前記ビデオ中のオーディオイベントに応じて、ある集合をなすキーフレーム候補を選択する前記ステップをさらに含む、請求項1に記載のビデオからある集合をなすキーフレームを抽出する方法。
- ビデオ中の一連のビデオフレームの中から集合をなすキーフレーム候補をそれぞれ選択する、前記ビデオ中の重要な内容を検出する集合をなすフレームアナライザと、
前記キーフレーム候補を集合をなすクラスタにアレンジし、各キーフレーム候補の相対的な重要度に応じて、前記ビデオのキーフレームとして各クラスタから前記キーフレーム候補の1つを選択するキーフレームセレクタと
を備えるキーフレーム抽出システム。 - 前記ビデオ中の集合をなすオーディオイベントを検出することによって集合をなすキーフレーム候補を選択するオーディオイベント検出器をさらに備える、請求項7に記載のキーフレーム抽出システム。
- 前記フレームアナライザはカラーヒストグラムアナライザを含む、請求項7に記載のキーフレーム抽出システム。
- 前記フレームアナライザはカラーレイアウトアナライザを含む、請求項7に記載のキーフレーム抽出システム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/807,949 US20050228849A1 (en) | 2004-03-24 | 2004-03-24 | Intelligent key-frame extraction from a video |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005276220A true JP2005276220A (ja) | 2005-10-06 |
Family
ID=34862062
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005085295A Pending JP2005276220A (ja) | 2004-03-24 | 2005-03-24 | ビデオからのインテリジェントなキーフレーム抽出 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20050228849A1 (ja) |
EP (1) | EP1580757A3 (ja) |
JP (1) | JP2005276220A (ja) |
KR (1) | KR20060044634A (ja) |
TW (1) | TW200536389A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009049950A (ja) * | 2007-08-23 | 2009-03-05 | Sony Corp | 画像撮像装置、撮像方法 |
JP2009539273A (ja) * | 2006-02-03 | 2009-11-12 | イーストマン コダック カンパニー | ビデオクリップからのキーフレーム候補の抽出 |
US7995109B2 (en) | 2007-08-23 | 2011-08-09 | Sony Corporation | Imaging apparatus that captures an image of a subject |
US8243156B2 (en) | 2007-07-24 | 2012-08-14 | Sony Corporation | Image-capturing apparatus and image-capturing control method |
US8890966B2 (en) | 2007-11-06 | 2014-11-18 | Sony Corporation | Automatic image-capturing apparatus, automatic image-capturing control method, image display system, image display method, display control apparatus, and display control method |
Families Citing this family (81)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4230402B2 (ja) * | 2004-03-31 | 2009-02-25 | パイオニア株式会社 | サムネイル画像抽出方法、装置、プログラム |
US20060059120A1 (en) * | 2004-08-27 | 2006-03-16 | Ziyou Xiong | Identifying video highlights using audio-visual objects |
US20060045381A1 (en) * | 2004-08-31 | 2006-03-02 | Sanyo Electric Co., Ltd. | Image processing apparatus, shooting apparatus and image display apparatus |
US7612832B2 (en) * | 2005-03-29 | 2009-11-03 | Microsoft Corporation | Method and system for video clip compression |
US7760956B2 (en) | 2005-05-12 | 2010-07-20 | Hewlett-Packard Development Company, L.P. | System and method for producing a page using frames of a video stream |
JP4379409B2 (ja) | 2005-11-08 | 2009-12-09 | ソニー株式会社 | 撮像装置、および情報処理方法、並びにコンピュータ・プログラム |
US8036263B2 (en) * | 2005-12-23 | 2011-10-11 | Qualcomm Incorporated | Selecting key frames from video frames |
US8031775B2 (en) * | 2006-02-03 | 2011-10-04 | Eastman Kodak Company | Analyzing camera captured video for key frames |
JP5212610B2 (ja) * | 2006-02-08 | 2013-06-19 | 日本電気株式会社 | 代表画像又は代表画像群の表示システム、その方法、およびそのプログラム並びに、代表画像又は代表画像群の選択システム、その方法およびそのプログラム |
TW200803480A (en) * | 2006-03-14 | 2008-01-01 | Sony Corp | Image processing device and image processing method |
US20070237225A1 (en) * | 2006-03-30 | 2007-10-11 | Eastman Kodak Company | Method for enabling preview of video files |
JP2007300565A (ja) | 2006-05-03 | 2007-11-15 | Sony Computer Entertainment Inc | マルチメディア再生装置およびメニュー画面表示方法 |
US8379154B2 (en) * | 2006-05-12 | 2013-02-19 | Tong Zhang | Key-frame extraction from video |
US20070266322A1 (en) * | 2006-05-12 | 2007-11-15 | Tretter Daniel R | Video browsing user interface |
WO2008001305A2 (en) * | 2006-06-29 | 2008-01-03 | Koninklijke Philips Electronics N.V. | Method and system of key frame extraction |
US20080019661A1 (en) * | 2006-07-18 | 2008-01-24 | Pere Obrador | Producing output video from multiple media sources including multiple video sources |
KR20080061655A (ko) * | 2006-12-28 | 2008-07-03 | 삼성전자주식회사 | 이미지처리장치 및 그 제어방법 |
JP5092469B2 (ja) * | 2007-03-15 | 2012-12-05 | ソニー株式会社 | 撮像装置、画像処理装置、および画像表示制御方法、並びにコンピュータ・プログラム |
US7817914B2 (en) * | 2007-05-30 | 2010-10-19 | Eastman Kodak Company | Camera configurable for autonomous operation |
US7676145B2 (en) * | 2007-05-30 | 2010-03-09 | Eastman Kodak Company | Camera configurable for autonomous self-learning operation |
US20090079840A1 (en) * | 2007-09-25 | 2009-03-26 | Motorola, Inc. | Method for intelligently creating, consuming, and sharing video content on mobile devices |
WO2009078686A2 (en) * | 2007-12-18 | 2009-06-25 | Humax Co., Ltd. | Method and device for video coding and decoding |
JP2009232295A (ja) * | 2008-03-25 | 2009-10-08 | Fujitsu Ltd | コンテンツ変換装置 |
KR101599465B1 (ko) * | 2009-03-03 | 2016-03-04 | 삼성전자주식회사 | 동기화 정보 제공 서버 및 방법과, 클라이언트 기기 및 방송 프로그램과 부가 정보의 동기화 방법 |
US8345990B2 (en) * | 2009-08-03 | 2013-01-01 | Indian Institute Of Technology Bombay | System for creating a capsule representation of an instructional video |
US8730397B1 (en) * | 2009-08-31 | 2014-05-20 | Hewlett-Packard Development Company, L.P. | Providing a photobook of video frame images |
US8571330B2 (en) * | 2009-09-17 | 2013-10-29 | Hewlett-Packard Development Company, L.P. | Video thumbnail selection |
US8438484B2 (en) * | 2009-11-06 | 2013-05-07 | Sony Corporation | Video preview module to enhance online video experience |
US9443147B2 (en) * | 2010-04-26 | 2016-09-13 | Microsoft Technology Licensing, Llc | Enriching online videos by content detection, searching, and information aggregation |
US9171578B2 (en) * | 2010-08-06 | 2015-10-27 | Futurewei Technologies, Inc. | Video skimming methods and systems |
CN102402536A (zh) * | 2010-09-13 | 2012-04-04 | 索尼公司 | 从视频中提取关键帧的方法和设备 |
US9876905B2 (en) | 2010-09-29 | 2018-01-23 | Genesys Telecommunications Laboratories, Inc. | System for initiating interactive communication in response to audio codes |
US8726161B2 (en) * | 2010-10-19 | 2014-05-13 | Apple Inc. | Visual presentation composition |
US9271035B2 (en) | 2011-04-12 | 2016-02-23 | Microsoft Technology Licensing, Llc | Detecting key roles and their relationships from video |
US9460465B2 (en) | 2011-09-21 | 2016-10-04 | Genesys Telecommunications Laboratories, Inc. | Graphical menu builder for encoding applications in an image |
EP2782330A4 (en) * | 2011-11-17 | 2015-03-11 | Panasonic Ip Corp America | IMAGE PROCESSING DEVICE, IMAGING APPARATUS AND IMAGE PROCESSING METHOD |
US9137428B2 (en) | 2012-06-01 | 2015-09-15 | Microsoft Technology Licensing, Llc | Storyboards for capturing images |
US9350916B2 (en) | 2013-05-28 | 2016-05-24 | Apple Inc. | Interleaving image processing and image capture operations |
US9491360B2 (en) | 2013-06-06 | 2016-11-08 | Apple Inc. | Reference frame selection for still image stabilization |
US9262684B2 (en) | 2013-06-06 | 2016-02-16 | Apple Inc. | Methods of image fusion for image stabilization |
US9384552B2 (en) | 2013-06-06 | 2016-07-05 | Apple Inc. | Image registration methods for still image stabilization |
WO2014200870A2 (en) * | 2013-06-09 | 2014-12-18 | Apple Inc. | Browser-driven power saving |
US10075680B2 (en) | 2013-06-27 | 2018-09-11 | Stmicroelectronics S.R.L. | Video-surveillance method, corresponding system, and computer program product |
US20150071547A1 (en) | 2013-09-09 | 2015-03-12 | Apple Inc. | Automated Selection Of Keeper Images From A Burst Photo Captured Set |
US9786028B2 (en) | 2014-08-05 | 2017-10-10 | International Business Machines Corporation | Accelerated frame rate advertising-prioritized video frame alignment |
US9799376B2 (en) * | 2014-09-17 | 2017-10-24 | Xiaomi Inc. | Method and device for video browsing based on keyframe |
US10452713B2 (en) * | 2014-09-30 | 2019-10-22 | Apple Inc. | Video analysis techniques for improved editing, navigation, and summarization |
US10089532B2 (en) * | 2015-02-23 | 2018-10-02 | Kodak Alaris Inc. | Method for output creation based on video content characteristics |
KR102282463B1 (ko) * | 2015-09-08 | 2021-07-27 | 한화테크윈 주식회사 | 이벤트를 보존하는 비디오 축약 방법 및 이를 위한 장치 |
TWI571804B (zh) * | 2015-11-20 | 2017-02-21 | 晶睿通訊股份有限公司 | 可預覽畫面之視訊檔案回放系統及其方法與電腦程式產品 |
US10225511B1 (en) | 2015-12-30 | 2019-03-05 | Google Llc | Low power framework for controlling image sensor mode in a mobile image capture device |
US10732809B2 (en) | 2015-12-30 | 2020-08-04 | Google Llc | Systems and methods for selective retention and editing of images captured by mobile image capture device |
KR20170090868A (ko) * | 2016-01-29 | 2017-08-08 | 주식회사 마크애니 | 장면 전환 프레임 검출 장치 및 방법 |
US10575036B2 (en) | 2016-03-02 | 2020-02-25 | Google Llc | Providing an indication of highlights in a video content item |
US11256923B2 (en) * | 2016-05-12 | 2022-02-22 | Arris Enterprises Llc | Detecting sentinel frames in video delivery using a pattern analysis |
US11880918B2 (en) * | 2016-07-28 | 2024-01-23 | Kodak Alaris, Inc. | Method for dynamic creation of collages from mobile video |
US10645142B2 (en) * | 2016-09-20 | 2020-05-05 | Facebook, Inc. | Video keyframes display on online social networks |
WO2019012555A1 (en) * | 2017-07-10 | 2019-01-17 | Sangra Nagender | SYSTEM AND METHOD FOR VIDEO FILE ANALYSIS IN A SHORTCUT TEMPORARY FRAME |
JP7445642B2 (ja) | 2018-08-13 | 2024-03-07 | マジック リープ, インコーポレイテッド | クロスリアリティシステム |
US11227435B2 (en) | 2018-08-13 | 2022-01-18 | Magic Leap, Inc. | Cross reality system |
WO2020060113A1 (en) | 2018-09-21 | 2020-03-26 | Samsung Electronics Co., Ltd. | Method for providing key moments in multimedia content and electronic device thereof |
US11232635B2 (en) | 2018-10-05 | 2022-01-25 | Magic Leap, Inc. | Rendering location specific virtual content in any location |
US11062455B2 (en) | 2019-10-01 | 2021-07-13 | Volvo Car Corporation | Data filtering of image stacks and video streams |
CN114600064A (zh) | 2019-10-15 | 2022-06-07 | 奇跃公司 | 具有定位服务的交叉现实*** |
WO2021076757A1 (en) * | 2019-10-15 | 2021-04-22 | Magic Leap, Inc. | Cross reality system supporting multiple device types |
JP2022551735A (ja) | 2019-10-15 | 2022-12-13 | マジック リープ, インコーポレイテッド | 無線フィンガプリントを用いたクロスリアリティシステム |
CN114730546A (zh) | 2019-11-12 | 2022-07-08 | 奇跃公司 | 具有定位服务和基于位置的共享内容的交叉现实*** |
US11182906B2 (en) * | 2019-11-24 | 2021-11-23 | International Business Machines Corporation | Stream object tracking with delayed object detection |
US11562542B2 (en) | 2019-12-09 | 2023-01-24 | Magic Leap, Inc. | Cross reality system with simplified programming of virtual content |
WO2021154861A1 (en) * | 2020-01-27 | 2021-08-05 | Schlumberger Technology Corporation | Key frame extraction for underwater telemetry and anomaly detection |
US11562525B2 (en) | 2020-02-13 | 2023-01-24 | Magic Leap, Inc. | Cross reality system with map processing using multi-resolution frame descriptors |
US11410395B2 (en) | 2020-02-13 | 2022-08-09 | Magic Leap, Inc. | Cross reality system with accurate shared maps |
EP4104145A4 (en) | 2020-02-13 | 2024-01-24 | Magic Leap, Inc. | CROSS-REALLY SYSTEM PRIORITIZING GEOLOCALIZATION INFORMATION FOR LOCALIZATION |
JP2023515524A (ja) | 2020-02-26 | 2023-04-13 | マジック リープ, インコーポレイテッド | 高速位置特定を伴うクロスリアリティシステム |
WO2021222371A1 (en) | 2020-04-29 | 2021-11-04 | Magic Leap, Inc. | Cross reality system for large scale environments |
US11461535B2 (en) | 2020-05-27 | 2022-10-04 | Bank Of America Corporation | Video buffering for interactive videos using a markup language |
US11237708B2 (en) | 2020-05-27 | 2022-02-01 | Bank Of America Corporation | Video previews for interactive videos using a markup language |
CN112333467B (zh) * | 2020-11-27 | 2023-03-21 | 中国船舶工业***工程研究院 | 一种用于检测视频的关键帧的方法、***和介质 |
CN112653918B (zh) * | 2020-12-15 | 2023-04-07 | 咪咕文化科技有限公司 | 预览视频生成方法、装置、电子设备及存储介质 |
KR102496462B1 (ko) * | 2021-03-17 | 2023-02-06 | 고려대학교 세종산학협력단 | 비디오에서 키프레임 추출을 위한 알고리즘 |
CN115205768B (zh) * | 2022-09-16 | 2023-01-31 | 山东百盟信息技术有限公司 | 一种基于分辨率自适应网络的视频分类方法 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5635982A (en) * | 1994-06-27 | 1997-06-03 | Zhang; Hong J. | System for automatic video segmentation and key frame extraction for video sequences having both sharp and gradual transitions |
US6125229A (en) * | 1997-06-02 | 2000-09-26 | Philips Electronics North America Corporation | Visual indexing system |
US6137544A (en) * | 1997-06-02 | 2000-10-24 | Philips Electronics North America Corporation | Significant scene detection and frame filtering for a visual indexing system |
US7016540B1 (en) * | 1999-11-24 | 2006-03-21 | Nec Corporation | Method and system for segmentation, classification, and summarization of video images |
US6549643B1 (en) * | 1999-11-30 | 2003-04-15 | Siemens Corporate Research, Inc. | System and method for selecting key-frames of video data |
KR100512138B1 (ko) * | 2000-03-08 | 2005-09-02 | 엘지전자 주식회사 | 합성 키프레임을 이용한 비디오 브라우징 시스템 |
US20040125877A1 (en) * | 2000-07-17 | 2004-07-01 | Shin-Fu Chang | Method and system for indexing and content-based adaptive streaming of digital video content |
US6697523B1 (en) * | 2000-08-09 | 2004-02-24 | Mitsubishi Electric Research Laboratories, Inc. | Method for summarizing a video using motion and color descriptors |
US6711587B1 (en) * | 2000-09-05 | 2004-03-23 | Hewlett-Packard Development Company, L.P. | Keyframe selection to represent a video |
US20020186235A1 (en) * | 2001-05-25 | 2002-12-12 | Koninklijke Philips Electronics N.V. | Compact visual summaries using superhistograms and frame signatures |
TW544634B (en) * | 2001-10-05 | 2003-08-01 | Newsoft Technology Corp | Thumbnail sequence generation system and method |
US7035435B2 (en) * | 2002-05-07 | 2006-04-25 | Hewlett-Packard Development Company, L.P. | Scalable video summarization and navigation system and method |
US7298930B1 (en) * | 2002-11-29 | 2007-11-20 | Ricoh Company, Ltd. | Multimodal access of meeting recordings |
-
2004
- 2004-03-24 US US10/807,949 patent/US20050228849A1/en not_active Abandoned
-
2005
- 2005-02-24 TW TW094105591A patent/TW200536389A/zh unknown
- 2005-03-08 EP EP05251372A patent/EP1580757A3/en not_active Withdrawn
- 2005-03-23 KR KR1020050024152A patent/KR20060044634A/ko not_active Application Discontinuation
- 2005-03-24 JP JP2005085295A patent/JP2005276220A/ja active Pending
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009539273A (ja) * | 2006-02-03 | 2009-11-12 | イーストマン コダック カンパニー | ビデオクリップからのキーフレーム候補の抽出 |
US8243156B2 (en) | 2007-07-24 | 2012-08-14 | Sony Corporation | Image-capturing apparatus and image-capturing control method |
JP2009049950A (ja) * | 2007-08-23 | 2009-03-05 | Sony Corp | 画像撮像装置、撮像方法 |
US7995109B2 (en) | 2007-08-23 | 2011-08-09 | Sony Corporation | Imaging apparatus that captures an image of a subject |
US8063952B2 (en) | 2007-08-23 | 2011-11-22 | Sony Corporation | Image-capturing apparatus and image-capturing method for performing drive log image capturing and life log image capturing as automatic image capturing |
US8994852B2 (en) | 2007-08-23 | 2015-03-31 | Sony Corporation | Image-capturing apparatus and image-capturing method |
US8890966B2 (en) | 2007-11-06 | 2014-11-18 | Sony Corporation | Automatic image-capturing apparatus, automatic image-capturing control method, image display system, image display method, display control apparatus, and display control method |
US9497371B2 (en) | 2007-11-06 | 2016-11-15 | Sony Corporation | Automatic image-capturing apparatus, automatic image-capturing control method, image display system, image display method, display control apparatus, and display control method |
US9866743B2 (en) | 2007-11-06 | 2018-01-09 | Sony Corporation | Automatic image-capturing apparatus, automatic image-capturing control method, image display system, image display method, display control apparatus, and display control method |
Also Published As
Publication number | Publication date |
---|---|
EP1580757A3 (en) | 2005-11-30 |
EP1580757A2 (en) | 2005-09-28 |
US20050228849A1 (en) | 2005-10-13 |
KR20060044634A (ko) | 2006-05-16 |
TW200536389A (en) | 2005-11-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2005276220A (ja) | ビデオからのインテリジェントなキーフレーム抽出 | |
JP4426966B2 (ja) | スケーラブルなビデオ要約およびナビゲーションのシステムおよび方法 | |
Peng et al. | Keyframe-based video summary using visual attention clues | |
JP4981128B2 (ja) | 映像からのキーフレーム抽出 | |
Aner et al. | Video summaries through mosaic-based shot and scene clustering | |
Sujatha et al. | A study on keyframe extraction methods for video summary | |
CN107430780B (zh) | 用于基于视频内容特性的输出创建的方法 | |
US20080019661A1 (en) | Producing output video from multiple media sources including multiple video sources | |
JP2006510072A (ja) | 一様なカラーセグメントを検出するための方法及びシステム | |
Clarin et al. | DOVE: Detection of movie violence using motion intensity analysis on skin and blood | |
WO2007092156A2 (en) | Extracting key frame candidates from video clip | |
Omidyeganeh et al. | Video keyframe analysis using a segment-based statistical metric in a visually sensitive parametric space | |
CN107516084B (zh) | 一种基于多特征融合的互联网视频作者身份识别方法 | |
Aner-Wolf et al. | Video summaries and cross-referencing through mosaic-based representation | |
Ciocca et al. | Dynamic key-frame extraction for video summarization | |
Volkmer et al. | Gradual transition detection using average frame similarity | |
Kiani et al. | Flexible soccer video summarization in compressed domain | |
Zhang | Intelligent keyframe extraction for video printing | |
Han et al. | Shot detection combining bayesian and structural information | |
Patel et al. | Scene-Change Detection using Locality Preserving Projections | |
Han | Scalable temporal interest points for abstraction and classification of video events | |
EP2426620A1 (en) | Feature extraction and automatic annotation of flash illuminated video data in unconstrained video streams | |
WO2003084249A9 (en) | Methods for summarizing video through mosaic-based shot and scene clustering | |
Zhu et al. | A novel scheme for video scenes segmentation and semantic representation | |
Petersohn | Sub-shots-basic units of video |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070316 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070810 |