JP6211715B2 - ビデオのブラウジング方法、その装置、プログラム及び記録媒体 - Google Patents

ビデオのブラウジング方法、その装置、プログラム及び記録媒体 Download PDF

Info

Publication number
JP6211715B2
JP6211715B2 JP2016548409A JP2016548409A JP6211715B2 JP 6211715 B2 JP6211715 B2 JP 6211715B2 JP 2016548409 A JP2016548409 A JP 2016548409A JP 2016548409 A JP2016548409 A JP 2016548409A JP 6211715 B2 JP6211715 B2 JP 6211715B2
Authority
JP
Japan
Prior art keywords
image frame
target block
information
current image
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016548409A
Other languages
English (en)
Other versions
JP2016541214A (ja
Inventor
百超 王
百超 王
秋平 秦
秋平 秦
文迪 侯
文迪 侯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiaomi Inc
Original Assignee
Xiaomi Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiaomi Inc filed Critical Xiaomi Inc
Publication of JP2016541214A publication Critical patent/JP2016541214A/ja
Application granted granted Critical
Publication of JP6211715B2 publication Critical patent/JP6211715B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44004Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving video buffer management, e.g. video decoder buffer or video display buffer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/74Browsing; Visualisation therefor
    • G06F16/745Browsing; Visualisation therefor the internal structure of a single video sequence
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • H04N21/4312Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44213Monitoring of end-user related data
    • H04N21/44218Detecting physical presence or behaviour of the user, e.g. using sensors to detect if the user is leaving the room or changes his face expression during a TV program
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/47202End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting content on demand, e.g. video on demand

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Social Psychology (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Image Analysis (AREA)
  • Television Signal Processing For Recording (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Computer Security & Cryptography (AREA)
  • Studio Devices (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

相互参照
本願は、出願番号がCN201410475165.4であって、出願日が2014年9月14日である中国特許出願に基づき優先権を主張し、当該中国特許出願のすべての内容を本願に援用する。
本願は、コンピュータ技術分野に関し、特にビデオのブラウジング方法その装置、プログラム及び記録媒体に関する。
インターネットの発展に伴い、インターネットのビデオがよく使用されている。ビデオを取得した場合、ビデオを素早くブラウジングしてビデオの内容を確認する必要があるため、如何にビデオを素早くブラウジングすることはよく注目された問題になる。
ビデオが連続の画像フレームからなるので、ビデオのキーフレームを抽出する過程において、端末は、ビデオを少なくとも2つのショットに分割して、各ショットの境界に基づいて、画像品質とビデオ内容の変更とに基づいて、各ショットについて一組のキーフレームを選出し、これらのキーフレームをスクリーンに適当なレートで再生させ、ビデオのブラウジングを実現することができる。
本願の発明者は、本発明を実現する過程において、従来技術が少なくとも以下の欠陥を有すると見出した。即ち、端末は、ショットの境界に基づいてキーフレームを抽出する必要があり、ビデオが1つの連続的なショットである場合、ビデオからキーフレームを抽出できなくなる。
本願の発明は、連続的なショットからなるビデオからキーフレームを抽出できないことによるビデオをブラウジングすることができない問題点を解決するために、ビデオのブラウジング方法その装置、プログラム及び記録媒体を提供する。
本発明の実施例の第1の形態によれば、
ビデオにおける現在の画像フレームと直前の画像フレームとを比較して、前記現在の画像フレームに含まれるターゲットブロックと前記直前の画像フレームに含まれるターゲットブロックとを比較して得る情報であるターゲットブロック情報を取得するステップと、
前記ターゲットブロック情報が予め定められた条件を満たす場合、前記現在の画像フレームをキーフレームとして決定するステップと、
前記現在の画像フレームの直後の画像フレームを現在の画像フレームとして決定し、前記ビデオにおける現在の画像フレームと直前の画像フレームとを比較してターゲットブロック情報を取得するステップを、前記ビデオにおける最後の画像フレームが比較されるまで継続して実行するステップと、
決定された少なくとも1つのキーフレームを再生させるステップと、を含むビデオのブラウジング方法を提供する。
好ましくは、前記ビデオにおける現在の画像フレームと直前の画像フレームとを比較してターゲットブロック情報を取得するステップは、
前記直前の画像フレームにおけるターゲットブロックと、前記現在の画像フレームにおけるターゲットブロックとを比較させるステップと、
前記現在の画像フレームには、前記直前の画像フレームが備えない少なくとも1つのターゲットブロックが含まれた場合、当該備えない各ターゲットブロックを、新たに追加されたターゲットブロックとして決定し、前記新たに追加されたターゲットブロックに対して、確定されたキーフレームの個数に1を加算してなるフラグ情報を設定し、各新たに追加されたターゲットブロックのターゲットブロック情報を取得するステップと、
前記現在の画像フレームには、前記直前の画像フレームが備える少なくとも1つのターゲットブロックが含まれた場合、当該備える各ターゲットブロックを既存ターゲットブロックとして決定し、前記現在の画像フレームにおける前記既存ターゲットブロックの前記直前の画像フレームにおける対応するターゲットブロックに対する移動情報を計算し、各既存ターゲットブロックのターゲットブロック情報を取得するステップと、
前記直前の画像フレームには、前記現在の画像フレームが備えない少なくとも1つのターゲットブロックが含まれた場合、当該備えない各ターゲットブロックを消失ターゲットブロックとして決定し、各消失ターゲットブロックのターゲットブロック情報を取得するステップと、を含む。
好ましくは、前記ターゲットブロック情報が予め定められた条件を満たす場合、前記現在の画像フレームをキーフレームとして決定するステップは、
前記現在の画像フレームのターゲットブロック情報から、前記既存ターゲットブロックの移動の回数と、移動の変位と、到達した領域との少なくとも1つを含む各既存ターゲットブロックのそれぞれの移動情報を読み取るステップと、
移動条件を満たす移動情報の数量が予め設定された閾値より大きいか否かを検出するステップと、
前記移動条件を満たす移動情報の数量が前記予め設定された閾値より大きいと検出したと、前記現在の画像フレームを前記キーフレームとして決定するステップと、を含む。
好ましくは、前記ターゲットブロック情報が予め定められた条件を満たす場合、前記現在の画像フレームをキーフレームとして決定するステップは、
前記現在の画像フレームのターゲットブロック情報から、各ターゲットブロックのフラグ情報を読み取るステップと、
各フラグ情報に前記消失ターゲットブロックのフラグ情報と同一のフラグ情報を有するか否かを検出するステップと、
前記消失ターゲットブロックのフラグ情報と同一のフラグ情報を有しないと検出した場合、前記現在の画像フレームを前記キーフレームとして決定するステップと、を含む。
好ましくは、前記ビデオのブラウジング方法は、
前記ビデオにおける各画像フレーム及び前記画像フレームを撮影するときのGPS情報と、加速度情報と、感度ISO情報との少なくとも1つを含むセンサ情報を取得するステップと、
前記センサ情報に基づいてスクリーニング条件を満たさない画像フレームを捨て、前記ビデオにおける現在の画像フレームと直前の画像フレームとを比較してターゲットブロック情報を取得するステップをトリガーするステップと、をさらに含む。
好ましくは、前記ターゲットブロック情報が予め定められた条件を満たす場合、前記現在の画像フレームをキーフレームとして決定するステップが、
前記現在の画像フレームに人物が含まれた場合、前記直前の画像フレームの人物姿勢情報に対して前記現在の画像フレームが変化するか否かを検出し、且つ前記現在の画像フレームにおける前記人物以外のターゲットブロック情報が前記予め定められた条件を満たすか否かを検出するステップと、
前記人物姿勢情報が変化したと検出し、且つ前記現在の画像フレームにおいる前記人物以外のターゲットブロック情報が前記予め定められた条件を満たした場合、前記現在の画像フレームをキーフレームとして決定するステップと、を含む。
本発明の実施例の第2の形態によれば、
ビデオにおける現在の画像フレームと直前の画像フレームとを比較して、前記現在の画像フレームに含まれるターゲットブロックと前記直前の画像フレームに含まれるターゲットブロックとを比較して得る情報であるターゲットブロック情報を取得するように構成される画像比較モジュールと、
前記画像比較モジュールが取得した前記ターゲットブロック情報が予め定められた条件を満たす場合、前記現在の画像フレームをキーフレームとして決定するように構成される画像決定モジュールと、
前記現在の画像フレームの直後の画像フレームを現在の画像フレームとして決定し、前記ビデオにおける現在の画像フレームと直前の画像フレームとを比較してターゲットブロック情報を取得する操作を、前記ビデオにおける最後の画像フレームが比較されるまで継続して実行するように構成される操作実行モジュールと、
前記画像決定モジュールが決定した少なくとも1つのキーフレームを再生させるように構成される画像再生モジュールと、を有するビデオのブラウジング装置を提供する。
好ましくは、前記画像比較モジュールは、
前記直前の画像フレームにおけるターゲットブロックを前記現在の画像フレームにおけるターゲットブロックと比較させるように構成されるターゲット比較サブモジュールと、
前記ターゲット比較サブモジュールによって前記現在の画像フレームには、前記直前の画像フレームが備えない少なくとも1つのターゲットブロックが含まれた場合、当該備えない各ターゲットブロックを新たに追加されたターゲットブロックとして決定し、前記新たに追加されたターゲットブロックに対して、決定されたキーフレームの個数に1を加算してなるフラグ情報を設定し、各新たに追加されたターゲットブロックのターゲットブロック情報を取得するように構成される第1決定サブモジュールと、
前記ターゲット比較サブモジュールによって前記現在の画像フレームには、前記直前の画像フレームが備える少なくとも1つのターゲットブロックが含まれた場合、当該備える各ターゲットブロックを既存ターゲットブロックとして決定し、前記現在の画像フレームにおける前記既存ターゲットブロックの前記直前の画像フレームにおける対応するターゲットブロックに対する移動情報を計算し、各既存ターゲットブロックのターゲットブロック情報を取得するように構成される第2決定サブモジュールと、
前記ターゲット比較サブモジュールによって前記直前の画像フレームには、前記現在の画像フレームが備えない少なくとも1つのターゲットブロックが含まれた場合、当該備えない各ターゲットブロックを消失ターゲットブロックとして決定し、各消失ターゲットブロックのターゲットブロック情報を取得するように構成される第3決定サブモジュールと、を有する。
好ましくは、前記画像決定モジュールは、
前記現在の画像フレームのターゲットブロック情報から、前記既存ターゲットブロックの移動の回数と、移動の変位と、到達した領域との少なくとも1つを含む各既存ターゲットブロックのそれぞれの移動情報を読み取るように構成される第1読取サブモジュールと、
移動条件を満たす移動情報の数量が予め設定された閾値より大きいか否かを検出するように構成される第1検出サブモジュールと、
前記第1検出サブモジュールによって前記移動条件を満たす移動情報の数量が前記予め設定された閾値より大きいと検出した場合、前記現在の画像フレームを前記キーフレームとして決定するように構成される第4決定サブモジュールと、を有する。
好ましくは、前記画像決定モジュールは、
前記現在の画像フレームのターゲットブロック情報から、各ターゲットブロックのそれぞれのフラグ情報を読み取るように構成される第2読取サブモジュールと、
各フラグ情報に前記消失ターゲットブロックのフラグ情報と同一のフラグ情報を有するか否かを検出するように構成される第2検出サブモジュールと、
前記第2検出サブモジュールによって前記消失ターゲットブロックのフラグ情報と同一のフラグ情報を有しないと検出した場合、前記現在の画像フレームを前記キーフレームとして決定するように構成される第5決定サブモジュールと、を有する。
好ましくは、前記ビデオのブラウジング装置は、
前記ビデオにおける各画像フレーム及び前記画像フレームを撮影するときのGPS情報と、加速度情報と、感度ISO情報との少なくとも1つを含むセンサ情報を取得するように構成される情報取得モジュールと、
前記情報取得モジュールが取得したセンサ情報に基づいてスクリーニング条件を満たさない画像フレームを捨て、前記ビデオにおける現在の画像フレームと直前の画像フレームとを比較してターゲットブロック情報を取得する操作の実行をトリガーするように構成される画像スクリーニングモジュールと、をさらに有する。
好ましくは、前記画像決定モジュールは、
前記現在の画像フレームに人物が含まれた場合、前記直前の画像フレームの人物姿勢情報に対して前記現在の画像フレームが変化するか否かを検出し、且つ前記現在の画像フレームにおける前記人物以外のターゲットブロック情報が前記予め定められた条件を満たすか否かを検出するように構成される第3検出サブモジュールと、
前記第3検出サブモジュールによって前記人物姿勢情報が変化したと検出し、且つ前記現在の画像フレームにおいる前記人物以外のターゲットブロック情報が前記予め定められた条件を満たした場合、前記現在の画像フレームをキーフレームとして決定するように構成される第6決定サブモジュールと、を有する。
本発明の実施例の第3の形態によれば、
プロセッサと、
プロセッサが実行できる命令を記憶するためのメモリとを有し、
前記プロセッサは、
ビデオにおける現在の画像フレームと直前の画像フレームとを比較して、前記画像フレームに含まれるターゲットブロックと前記直前の画像フレームに含まれるターゲットブロックとを比較させて得られる情報であるターゲットブロック情報を取得し、
前記ターゲットブロック情報が予め定められた条件を満たす場合、前記現在の画像フレームをキーフレームとして決定し、
前記現在の画像フレームの直後の画像フレームを現在の画像フレームとして決定し、前記ビデオにおける現在の画像フレームと直前の画像フレームとを比較してターゲットブロック情報を取得するステップを、前記ビデオにおける最後の画像フレームが比較されるまで継続して実行し、
決定された少なくとも1つのキーフレームを再生させるように構成されるビデオのブラウジング装置を提供する。
本発明の実施例の第4の形態によれば、プロセッサに実行されることにより、第ビデオのブラウジング方法を実現するプログラムを提供する。
本発明の実施例の第5の形態によれば、上記のプログラムが記録された記録媒体を提供する。
本発明の実施例が提供する技術方案は、以下の有益な効果を有する。
ビデオにおける現在の画像フレームと直前の画像フレームとを比較することによって、現在の画像フレームに含まれるターゲットブロックと直前の画像フレームに含まれるターゲットブロックとを比較して得る情報であるターゲットブロック情報を取得し、ターゲットブロック情報が予め定められた条件を満たす場合、現在の画像フレームをキーフレームとして決定する。このため、ショットの境界に基づいてキーフレームを決定する必要がなく、ビデオにおける現在の画像フレームのターゲットブロックを比較することによってターゲットブロック情報を取得することができ、ターゲットブロック情報に基づいてキーフレームをスクリーニングすることができるので、連続的なショットからキーフレームを抽出できないことによるビデオをブラウジングできない問題点を解決することができ、ビデオの再生効率を向上させる効果が得られる。
以上の一般的な説明及び後述の詳細な説明は、例示的なものに過ぎず、本発明を限定するものではないことを理解すべきである。
ここで、図面は明細書に組み込んで本明細書の一部とし、本発明に合致する実施例を示すとともに、明細書とともに本発明の原理を説明する。
例示的な実施例に係るビデオのブラウジング方法のプロチャートである。
例示的な他の1つの実施例に係るビデオのブラウジング方法のプロチャートである。
例示的な実施例に係るビデオのブラウジング装置のブロック図である。
例示的な実施例に係るビデオのブラウジング装置のブロック図である。
例示的な実施例に係るビデオのブラウジング用の装置のブロック図である。
以下、図面に示される例示された実施例に対して詳しく説明する。以下の説明は、図面に関するときに、特定な声明以外、各図面における同一の数字は、同一又は類似な要素を表す。以下に例示された実施例において説明された実施形態は、本発明と一致する全ての実施形態ではない。逆に、それらは、特許請求の範囲に記載の本発明のある局面と一致する装置及び方法の例だけである。
図1は例示的な実施例に係るビデオのブラウジング方法のプロチャートであり、当該ビデオのブラウジング方法は、端末に用いられる。図1に示すように、当該ビデオのブラウジング方法は以下のステップを含む。
ステップ101において、ビデオにおける現在の画像フレームと、直前の画像フレームとを比較して、現在の画像フレームに含まれるターゲットブロックと直前の画像フレームに含まれるターゲットブロックとを比較して得る情報であるターゲットブロック情報を取得する。
画像フレームはビデオの単位画面である。ターゲットブロックは、画像フレームにおける内容を分割してなるものであり、少なくとも1つの物体を含んでもよいし、1つの物体の一部を含んでもよい。本実施例において、ターゲットブロックの分割方式が限定されない。ターゲットブロック情報は、ビデオにおける現在の画像フレームのターゲットブロックと、直前の画像フレームのターゲットブロックとを比較して得る情報である。
ステップ102において、ターゲットブロック情報が予め定められた条件を満たす場合、現在の画像フレームがキーフレームとして決定される。
キーフレームは、ビデオ全体に物体が存在する1つの画像フレーム、または物体の運動におけるキー動作が存在する1つの画像フレームであり、ビデオにおけるある時間帯のビデオ内容を示すことができる。
画像フレーム内の物体をターゲットブロックで示すことができ、且つターゲットブロック情報が、隣接する2つの画像フレームのターゲットブロックの変化を示すことができるので、端末は、ターゲットブロック情報に基づいて画像フレームがキーフレームであるか否かを検出でき、ビデオから少なくとも1つのキーフレームを抽出できる。
ステップ103において、現在の画像フレームの直後の画像フレームを現在の画像フレームとして決定され、ビデオにおける現在の画像フレームと直前の画像フレームとを比較してターゲットブロック情報を取得するステップを、ビデオにおける最後の画像フレームが比較されるまで継続して実行する。
ビデオにおける全てのキーフレームを抽出するために、端末は、全ての画像フレームを比較する必要があるので、現在の画像フレームを比較した後、直後の画像フレームを新たな現在の画像フレームとして決定し、当該現在の画像フレームを新たな直前の画像フレームとして決定し、ステップ101をビデオにおける最後の画像フレームが現在の画像フレームとして比較されるまで継続して実行し、検出のプロチャートを完了させる。
ステップ104において、決定された少なくとも1つのキーフレームを再生させる。
各キーフレームのそれぞれが1つの時間帯のビデオ内容を示すことができるので、端末において、決定された少なくとも1つのキーフレームを適切なフレーム速度で順番に再生させることによって、ビデオが表す有効的な情報を縮減せずに、ビデオの再生時間を圧縮できる。このため、ビデオ内容に対する快速ブラウジングを実現でき、ビデオの再生効率を向上できる。
以上により、本願発明のビデオのブラウジング方法は、ビデオにおける現在の画像フレームと、直前の画像フレームとを比較することによって、現在の画像フレームに含まれるターゲットブロックと直前の画像フレームに含まれるターゲットブロックとを比較して得る情報であるターゲットブロック情報を取得し、ターゲットブロック情報が予め定められた条件を満たす場合、現在の画像フレームをキーフレームとして決定する。このため、ショットの境界に基づいてキーフレームを決定する必要がなく、ビデオにおける現在の画像フレームのターゲットブロックを比較することによってターゲットブロック情報を取得でき、ターゲットブロック情報に基づいてキーフレームをスクリーニングすることができるので、連続的なショットからキーフレームを抽出できないことによるビデオをブラウジングすることができない問題点を解決でき、ビデオの再生効率を向上できる効果が得られる。
図2は例示的な他の1つの実施例に係るビデオのブラウジング方法のプロチャートであり、当該ビデオのブラウジング方法は、端末に用いられる。図2に示すように、当該ビデオのブラウジング方法は、以下のステップを含む。
ステップ201において、ビデオにおける各画像フレーム及び画像フレームを撮影するときのGPS(Global PosItIonIng System)情報と、加速度情報と、感度ISO情報との少なくとも1つを含むセンサ情報を取得し、センサ情報に基づいてスクリーニング条件を満たさない画像フレームを捨て、ステップ202をリカードする。
本実施例において、ステップ201は選択可能なステップである。即ち、端末は、カメラによってビデオを撮影し、ビデオを取得した後ステップ202を実行可能である。或は、端末は、ビデオを取得した後、ビデオにおける画像フレームをスクリーニングし、捨て条件を満たした画像フレームを捨てることにより、捨て条件を満たす画像フレームに対する処理によるリソースの無駄を減少でき、ビデオの単位画面である画像フレームに対する処理効率を向上できる。
端末は、画像フレームに対してスクリーニング操作を実行させる必要があると、カメラでビデオを撮影するとき、センサで各画像フレームのGPS情報と、加速度情報と、感度ISO情報との少なくとも1つであるセンサ情報を収集し、センサ情報に基づいて各画像フレームが捨て条件を満たすか否かを検出することができる。
また、端末は、センサ情報に応じて捨て条件を設定することができる。センサ情報がGPS情報である場合、撮影シーンは移動中にビデオを撮影することになることが可能である。端末は長時間同一の地理位置に止まると、このときに撮影された画像フレームが重複する可能性があるので、捨て条件は、移動中にビデオを撮影するとき、GPS情報と直前の画像フレームのGPS情報との間の距離がGPS閾値より小さいと設定される。センサ情報が加速度情報である場合、撮影シーンは移動中にビデオを撮影することになることが可能である。端末の移動の加速度が早いと、撮影された画像フレームが不明瞭になるので、捨て条件は、加速度が加速度閾値より大きいと設定される。センサ情報がISO情報である場合、ISOが高いと、撮影された画像フレームにノイズが多いので、捨て条件は、ISOがISO閾値より大きいと設定される。センサ情報が、GPS情報と、加速度情報と、ISO情報との少なくとも2つを含む場合、端末は、各センサ情報に対応する捨て条件を合併することができ、センサ情報における少なくとも1つが捨て条件を満たした場合、当該画像フレームを捨てる。
ステップ202において、ビデオにおける現在の画像フレームと、直前の画像フレームとを比較して、現在の画像フレームに含まれるターゲットブロックと直前の画像フレームに含まれるターゲットブロックとを比較して得る情報であるターゲットブロック情報を取得する。
ターゲットブロックは、画像フレームにおける内容を分割してなるものであり、画像フレームに対する分割方式によって確定され、少なくとも1つの物体を含んでもよいし、1つの物体の一部を含んでもよい。また、端末は、画像フレームを均等に分割することができる。例えば、端末は、画像フレームを長さ方向においてM個に均等に分割し、幅方向においてN個に均等に分割することにより、M×N個のターゲットブロックが得られる。或は、端末は、画像フレームにおける注目された最小ターゲットに応じてターゲットブロックを分割することができ、即ち、各ターゲットブロックのそれぞれが、少なくとも1つの最小ターゲットを含む。或は、端末は、開発者の経験値によってターゲットブロックを分割することができる。本実施例において、ターゲットブロックの分割方式が限定されない。
現在の画像フレームのターゲットブロックを取得した後、端末は、当該現在の画像フレームのターゲットブロックと直前の画像フレームのターゲットブロックとを比較し、隣接する2つの画像フレームのターゲットブロックの変化を示すターゲットブロック情報を取得することができる。
本実施例において、ビデオにおける現在の画像フレームと、直前の画像フレームとを比較してターゲットブロック情報を取得するステップは、以下の通りである。
1)直前の画像フレームにおけるターゲットブロックと、現在の画像フレームにおけるターゲットブロックとを比較する。
2)現在の画像フレームには、直前の画像フレームが備えない少なくとも1つのターゲットブロックが含まれた場合、当該備えない各ターゲットブロックを新たに追加されたターゲットブロックと決定し、新たに追加されたターゲットブロックに対して、決定されたキーフレームの個数に1を加算してなるフラグ情報を設定し、各新たに追加されたターゲットブロックのターゲットブロック情報を取得する。
3)現在の画像フレームには、直前の画像フレームが備える少なくとも1つのターゲットブロックが含まれた場合、当該備える各ターゲットブロックを既存ターゲットブロックとして決定し、現在の画像フレームにおける既存ターゲットブロックの直前の画像フレームにおける対応するターゲットブロックに対する移動情報を計算し、各既存ターゲットブロックのターゲットブロック情報を取得する。
4)直前の画像フレームには、現在の画像フレームが備えない少なくとも1つのターゲットブロックが含まれない場合、当該備えない各ターゲットブロックを消失ターゲットブロックとして決定し、各消失ターゲットブロックのターゲットブロック情報を取得する。
また、現在の画像フレームにおけるターゲットブロックと直前の画像フレームにおけるターゲットブロックとの特徴を比較することができる。当該特徴は、色ヒストグラムであってもよし、色ヒストグラムとテクスチャ特徴であってもよい。比較方式はユークリッド距離を使用することができる。ターゲットブロックの比較は、後述する3つの結果を有する。
第1結果
現在の画像フレームには、直前の画像フレームが備えない少なくとも1つのターゲットブロックを含み、このとき、端末は、当該備えない少なくとも1つのターゲットブロックを新たに追加されたターゲットブロックとして決定し、マークのために、当該新たに追加されたターゲットブロックに対してフラグ情報を設定する。
その中に、端末は、新たに追加されたターゲットブロックのフラグ情報を既に決定されたキーフレームの個数に1を加算してなるものに設定できる。例えば、k個目の画像フレームの前に、既にs個のキーフレームが決定された場合、k個目の画像フレームにおける新たに追加されたターゲットブロックのフラグ情報を(s+1)に設定することができる。k個目の画像フレームがキーフレームではない場合、(k+1)個目の画像フレームにおける新たに追加されたターゲットブロックのフラグも、(s+1)に設定することができる。即ち、s個目のキーフレームと、(s+1)個目のキーフレームとの間の画像フレームにおける新たに追加されたターゲットブロックのフラグ情報の全ては、(s+1)である。
また、端末は、ターゲットブロックの位置と標識等の情報を取得し、標識と、フラグ情報と、位置等の情報を当該新たに追加されたターゲットブロックのターゲットブロック情報として決定することが好ましい。
第2結果
現在の画像フレームには、直前の画像フレームが備える少なくとも1つのターゲットブロックを含み、このとき、端末は、当該備える少なくとも1つのターゲットブロックを既存ターゲットブロックとして決定し、既存ターゲットブロックの移動情報を取得することができる。
その中に、移動情報は、当該現在の画像フレームにおけるターゲットブロックの直前の画像フレームにおける対応するターゲットブロックに対する移動の変位と、当該現在の画像フレームにおけるターゲットブロックの直前の画像フレームにおける対応するターゲットブロックに対する移動の回数と、当該現在の画像フレームにおけるターゲットブロックが到達した領域との少なくとも1つを使用することができる。
例えば、移動情報が移動の変位を含む場合、例え直前の画像フレームにおける当該ターゲットブロックの座標が(10センチ、13センチ)であり、現在の画像フレームにおける当該ターゲットブロックの座標が(10センチ、15センチ)である場合、当該ターゲットブロックの変位が2センチである。移動情報が移動の回数を含む場合、例え直前の画像フレームにおける当該ターゲットブロックの移動の回数が2であり、且つ現在の画像フレームにおける当該ターゲットブロックの位置と直前の画像フレームにおける位置が同一ではない場合、当該ターゲットブロックの移動の回数が3であると決定する。移動情報が到達した領域を含む場合、当該ターゲットブロックが現在の画像フレームの中央領域に位置する場合、当該ターゲットブロックの到達した領域が中央領域であると決定する。
端末は、当該ターゲットブロックの標識とフラグ情報を取得し、標識と、フラグ情報と、移動情報とを当該既存ターゲットブロックのターゲットブロック情報として決定することができることが好ましい。
第3結果
直前の画像フレームには、現在の画像フレームが備えない少なくとも1つのターゲットブロックを含み、このとき、端末は、当該備えない少なくとも1つのターゲットブロックを消失ターゲットブロックとして決定し、当該ターゲットブロックの標識と、フラグ情報と、移動情報とを当該消失ターゲットブロックのターゲットブロック情報として決定することができる。
ステップ203において、ターゲットブロック情報が予め定められた条件を満たす場合、現在の画像フレームをキーフレームとして決定する。
キーフレームは、ビデオ全体において物体が存在する1つの画像フレーム、または物体の運動におけるキー動作が存在する1つの画像フレームであり、ビデオにおける1つの時間帯のビデオ内容を表す。画像フレームにおける物体がターゲットブロックで表すことができ、且つターゲットブロック情報が、隣接する2つの画像フレームのターゲットブロックの変化を示すことができるので、端末は、ターゲットブロック情報に基づいて現在の画像フレームがキーフレームであるか否かを検出し、ビデオから少なくとも1つのキーフレームを抽出することができる。
その中に、端末は、ターゲットブロック情報に基づいてキーフレームを決定することができる。本実施例において、ターゲットブロック情報がそれぞれ移動情報とフラグ情報とを含むことを例としてキーフレームを決定するプロチャートを説明する。
第1に、ターゲットブロック情報が予め定められた条件を満たす場合、現在の画像フレームをキーフレームとして決定するステップは、以下のステップを含む。
1)現在の画像フレームのターゲットブロック情報から、既存ターゲットブロックの移動の回数と、移動の変位と、到達した領域との少なくとも1つを含む各既存ターゲットブロックの移動情報を読み取るステップ。
2)移動条件を満たす移動情報の数量が予め設定された閾値より大きいか否かを検出するステップ。
3)移動条件を満たす移動情報の数量が予め設定された閾値より大きいと検出したと、現在の画像フレームをキーフレームとして決定するステップ。
上記のキーフレームを決定する方法は、前景ターゲットが移動し且つ背景がほとんど変化しないシーンに適応し、或は、背景がズームし且つ前景ターゲットを有しないシーンに適応する。
移動情報は、移動の回数と、移動の変位と、到達した領域との少なくとも1つであるので、移動情報が異なると、移動情報が対応する移動条件も異なる。例えば、移動情報が移動の回数を含む場合、移動条件を移動の回数が回数の閾値より大きいことに設定することができる。移動情報が移動の変位を含む場合、移動条件を移動の変位が変位の閾値より大きいことに設定することができる。移動情報が到達した領域を含む場合、移動条件を目的領域に設定することができる。移動情報が、移動の回数と、移動の変位と、到達した領域との少なくとも2つを含む場合、各移動情報に対応する移動条件を合併し、移動情報における各移動情報が全て各自の移動条件を満たした場合、当該移動情報が移動条件を満たす場合決定する。
例えば、移動条件は、移動の回数が4回を超え且つターゲット領域が中央領域であることになると、端末は、ある移動情報に記憶された移動の回数が5回であり且つ到達した領域が中央領域であることを検出したとき、当該移動情報が移動条件を満たす場合決定する。
移動情報が移動条件を満たした場合決定した後、端末は、さらに移動条件を満たした移動情報の数量を算出し、算出された回数が予め設定された閾値より大きいか否かを検出することができる。端末は、算出された回数が予め設定された閾値より大きいと検出したと、直前のキーフレームに対して、現在の画像フレームにおける多数のターゲットブロックのターゲット情報が変化したと決定し、現在の画像フレームをキーフレームとして決定することができる。端末は、算出された回数が予め設定された閾値より小さいと検出したと、直前のキーフレームに対して、現在の画像フレームにおける少数のターゲットブロックのターゲット情報が変化したと決定し、現在の画像フレームをキーフレームとして決定しないことができる。
第2に、ターゲットブロック情報が予め定められた条件を満たす場合、現在の画像フレームをキーフレームとして決定するステップは、以下のステップを含む。
1)現在の画像フレームのターゲットブロック情報から各ターゲットブロックのフラグ情報を読み取る。
2)各フラグ情報に消失ターゲットブロックのフラグ情報と同一のフラグ情報を有するか否かを検出する。
3)消失ターゲットブロックのフラグ情報と同一のフラグ情報を有しないと検出した場合、現在の画像フレームをキーフレームとして決定する。
上記のキーフレームを決定する方法は、背景が予め設定された速度で移動し且つ前景ターゲットを有しないシーンに適応し、或は、背景が予め設定された速度で移動し且つ前景ターゲットが変化しないシーンに適応する。
ターゲットブロック情報にフラグ情報をさらに含むので、現在の画像フレームにおけるあるフラグ情報が完全に消失した場合、当該画像フレームをキーフレームとして決定する。フラグ情報が完全に消失したか否かを検出する場合、端末は、現在の画像フレームにおける消失ターゲットブロックのフラグ情報を取得し、現在の画像フレームが含む各フラグ情報に消失ターゲットブロックのフラグ情報と同一のフラグ情報を有するか否かを検出することができる。端末は、現在の画像フレームが含む各フラグ情報に消失ターゲットブロックのフラグ情報と同一のフラグ情報を有しないと検出した場合、当該フラグ情報が完全に消失したと決定する。端末は、現在の画像フレームが含む各フラグ情報に消失ターゲットブロックのフラグ情報と同一のフラグ情報を有すると検出した場合、当該フラグ情報が完全に消失しなかったと決定する。
人物を含む画像フレームについて、時々、人物の微細的な姿勢の変化を取得することが必要である。このとき、端末は、人物をターゲットブロックに分割して検出する場合、ターゲットブロック情報の変化が大きくないので、重要な画像フレームが非キーフレームに誤決定され、重要な情報の紛失が発生する可能性がある。
このため、ターゲットブロック情報が予め定められた条件を満たす場合、現在の画像フレームをキーフレームとして決定ステップは、以下のステップを含む。
1)現在の画像フレームに人物が含まれた場合、直前の画像フレームの人物姿勢情報に対して現在の画像フレームが変化するか否かを検出し、且つ現在の画像フレームにおける人物以外のターゲットブロック情報が予め定められた条件を満たすか否かを検出するステップ。
2)人物姿勢情報が変化したと検出し、且つ現在の画像フレームにおける人物以外のターゲットブロック情報が予め定められた条件を満たした場合、現在の画像フレームをキーフレームとして決定するステップ。
端末は、現在の画像フレームにおける人物と背景を分離し、人物姿勢を分析し、背景をターゲットブロックに分割し、ターゲットブロック情報に基づいて検出し、分析結果と検出結果に基づいて画像がキーフレームであるか否かを決定することができる。その中に、人物姿勢情報は、顔表情または人物姿勢を含む。
人物姿勢を分析するための端末の方法は、複数あり、例えば、ASM(Active Shape Model)アルゴリズム、またはAAM(Active Appearance Model)アルゴリズムを使用して顔の特徴点の位置を特定し、主な器官の特徴を抽出し、表情に従って特徴を分類する。端末は、現在の画像フレームにおける特徴表情の分類と、直前の画像フレームにおける特徴表情の分類とが異なると検出した場合、当該現在の画像フレームをキーフレームとして決定する。端末のターゲットブロック情報に対する検出処理は上記の検出処理と同じなので、ここに省略する。
補足説明として、端末は、センサ情報に基づいてキーフレームを決定してもよい。例えば、センサ情報がGPS情報である場合、GPS情報と、直前の画像フレームのGPS情報とを比較し、GPS情報と直前の画像フレームのGPS情報との距離がGPS閾値より大きい場合、当該GPS情報が対応する現在の画像フレームをキーフレームとして決定することができる。
ステップ204において、現在の画像フレームの直後の画像フレームを現在の画像フレームとして決定し、ステップ202を、ビデオにおける最後の画像フレームが比較されるまで継続して実行する。
ビデオにおける全てのキーフレームを抽出するために、端末は、全ての画像フレームを比較することが必要であるので、現在の画像フレームが比較された後、現在の画像フレームの直後の画像フレームを新たな現在の画像フレームとして決定すると共に、当該現在の画像フレームを新たな現在の画像フレームの直前の画像フレームとして決定し、ステップ202をビデオにおける最後の画像フレームを現在の画像フレームとして比較されるまで継続して実行し、検出処理を完了する。
ステップ205において、決定された少なくとも1つのキーフレームを再生させる。
各キーフレームのそれぞれが1つの時間帯のビデオ内容を表すことができるので、端末には、決定された少なくとも1つのキーフレームを適切なフレーム速度で順番に再生させることによって、ビデオが表す有効情報が減縮めずに、ビデオの再生時間を圧縮することができる。このため、ビデオ内容に対する快速ブラウジングを実現でき、ビデオの再生効率を向上できる。
端末は、少なくとも1つのキーフレームを記憶することにより、ビデオが短いビデオに変換されることが好ましい。
以上により、本発明のビデオのブラウジング方法は、ビデオにおける現在の画像フレームと直前の画像フレームとを比較することにより、現在の画像フレームに含まれるターゲットブロックと直前の画像フレームに含まれるターゲットブロックとを比較して得る情報であるターゲットブロック情報を取得し、ターゲットブロック情報が予め定められた条件を満たす場合、現在の画像フレームをキーフレームとして決定する。このため、ショットの境界に基づいてキーフレームを確定する必要がなく、ビデオにおける画像フレームのターゲットブロックを比較してターゲットブロック情報が取得され、ターゲットブロック情報に基づいてキーフレームをスクリーニングすることができるので、連続的なショットからキーフレームを抽出できないことによるビデオをブラウジングできない問題点を解決することができ、ビデオの再生効率を向上させる効果が得られる。
また、ビデオにおける各画像フレーム及び画像フレームを撮影するときのセンサ情報を取得し、センサ情報に基づいてスクリーニング条件を満たさない画像フレームを捨てることにより、捨て条件を満たす画像フレームに対する処理による資源の無駄を減少することができ、画像フレームに対する処理効率を向上させることができる。
図3は、例示的な実施例に係るビデオのブラウジング装置のブロック図であり、当該ビデオのブラウジング装置は、端末に用いられる。図3に示すように、当該ビデオのブラウジング装置は、ビデオにおける現在の画像フレームと、直前の画像フレームとを比較して、現在の画像フレームに含まれるターゲットブロックと直前の画像フレームに含まれるターゲットブロックとを比較して得る情報であるターゲットブロック情報を取得するように構成される画像比較モジュール310と、画像比較モジュール310が取得したターゲットブロック情報が予め定められた条件を満たす場合、現在の画像フレームをキーフレームとして決定するように構成される画像決定モジュール320と、現在の画像フレームの直後の画像フレームを現在の画像フレームとして決定し、ビデオにおける現在の画像フレームと直前の画像フレームとを比較してターゲットブロック情報を取得する操作を、ビデオにおける最後の画像フレームが比較されるまで継続して実行するように構成される操作実行モジュール330と、画像決定モジュール320が決定された少なくとも1つのキーフレームを再生させるように構成される画像再生モジュール340とを有する。
以上により、本発明のビデオのブラウジング装置は、ビデオにおける現在の画像フレームと、直前の画像フレームとを比較することにより、現在の画像フレームに含まれるターゲットブロックと直前の画像フレームに含まれるターゲットブロックとを比較して得る情報であるターゲットブロック情報を取得し、ターゲットブロック情報が予め定められた条件を満たす場合、現在の画像フレームをキーフレームとして決定する。このため、ショットの境界に基づいてキーフレームを決定する必要がなく、ビデオにおける画像フレームのターゲットブロックを比較することにより、ターゲットブロック情報を取得することができ、ターゲットブロック情報に基づいてキーフレームをスクリーニングすることができるので、連続的なショットからキーフレームを抽出できないことによるビデオをブラウジングできない問題点を解決することができ、ビデオの再生効率を向上させる効果が得られる。
図4は、例示的な実施例に係るビデオのブラウジング装置のブロック図であり、当該ビデオのブラウジング装置は、端末に用いられる。図4に示すように、当該ビデオのブラウジング装置は、ビデオにおける現在の画像フレームと、直前の画像フレームとを比較して、現在の画像フレームに含まれるターゲットブロックと直前の画像フレームに含まれるターゲットブロックとを比較して得る情報であるターゲットブロック情報を取得するように構成される画像比較モジュール310と、画像比較モジュール310が取得したターゲットブロック情報が予め定められた条件を満たす場合、現在の画像フレームをキーフレームとして決定するように構成される画像決定モジュール320と、現在の画像フレームの直後の画像フレームを現在の画像フレームとして決定し、ビデオにおける現在の画像フレームと直前の画像フレームとを比較してターゲットブロック情報を取得する操作を、ビデオにおける最後の画像フレームが比較されるまで継続して実行するように構成される操作実行モジュール330と、画像決定モジュール320が決定された少なくとも1つのキーフレームを再生させるように構成される画像再生モジュール340とを有する。
画像比較モジュール310は、直前の画像フレームにおけるターゲットブロックを現在の画像フレームにおけるターゲットブロックと比較するように構成されるターゲット比較サブモジュール311と、ターゲット比較サブモジュール311によって現在の画像フレームに、直前の画像フレームが備えない少なくとも1つのターゲットブロックが含まれたと検出した場合、当該備えない各ターゲットブロックを新たに追加されたターゲットブロックとして決定し、新たに追加されたターゲットブロックに対して、決定されたキーフレームの個数に1を加算してなるフラグ情報を設定し、各新たに追加されたターゲットブロックのターゲットブロック情報を取得するように構成される第1決定サブモジュール312と、ターゲット比較サブモジュール311によって現在の画像フレームには、直前の画像フレームが備える少なくとも1つのターゲットブロックが含まれたと検出した場合、当該備える各ターゲットブロックを既存ターゲットブロックとして決定し、現在の画像フレームにおける既存ターゲットブロックの直前の画像フレームにおける対応するターゲットブロックに対する移動情報を計算し、各既存ターゲットブロックのターゲットブロック情報を取得するように構成される第2決定サブモジュール313と、ターゲット比較サブモジュール311によって直前の画像フレームには、現在の画像フレームが備えない少なくとも1つのターゲットブロックが含まれたと検出した場合、当該備えない各ターゲットブロックを消失ターゲットブロックとして決定し、各消失ターゲットブロックのターゲットブロック情報を取得するように構成される第3決定サブモジュール314と、を有することが好ましい。
画像決定モジュール320は、現在の画像フレームのターゲットブロック情報から、既存ターゲットブロックの移動の回数と、移動の変位と、到達した領域との少なくとも1つを含む各既存ターゲットブロックの移動情報を読み取るように構成される第1読取サブモジュール321と、移動条件を満たす移動情報の数量が予め設定された閾値より大きいか否かを検出するように構成される第1検出サブモジュール322と、第1検出サブモジュール322によって移動条件を満たす移動情報の数量が予め設定された閾値より大きいと検出した場合、現在の画像フレームをキーフレームとして決定するように構成される第4決定サブモジュール323とを有することが好ましい。
画像決定モジュール320は、現在の画像フレームのターゲットブロック情報から、各ターゲットブロックのフラグ情報を読み取るように構成される第2読取サブモジュール324と、各フラグ情報に消失ターゲットブロックのフラグ情報と同一のフラグ情報を有するか否かを検出するように構成される第2検出サブモジュール325と、第2検出サブモジュール325によって消失ターゲットブロックのフラグ情報と同一のフラグ情報を有しないと検出した場合、現在の画像フレームをキーフレームとして決定するように構成される第5決定サブモジュール326とを有することが好ましい。
ビデオのブラウジング装置は、ビデオにおける各画像フレーム及び画像フレームを撮影するときのGPS情報と、加速度情報と、感度ISO情報との少なくとも1つを含むセンサ情報を取得するように構成される情報取得モジュール350と、情報取得モジュール350が取得したセンサ情報に基づいてスクリーニング条件を満たさない画像フレームを捨て、ビデオにおける現在の画像フレームと、直前の画像フレームとを比較してターゲットブロック情報を取得する操作をトリガーするように構成される画像スクリーニングモジュール360とをさらに有することが好ましい。
画像決定モジュール320は、現在の画像フレームに人物が含まれた場合、直前の画像フレームにおける人物姿勢情報に対して現在の画像フレームが変化するか否かを検出し、且つ現在の画像フレームにおける人物以外のターゲットブロック情報が予め定められた条件を満たすか否かを検出するように構成される第3検出サブモジュール327と、第3検出サブモジュール327によって人物姿勢情報が変化したと検出し、且つ現在の画像フレームにおける人物以外のターゲットブロック情報が予め定められた条件を満たした場合、現在の画像フレームをキーフレームとして決定するように構成される第6決定サブモジュール328とを有することが好ましい。
以上により、本発明のビデオのブラウジング装置は、ビデオにおける現在の画像フレームと直前の画像フレームとを比較させることにより、現在の画像フレームに含まれるターゲットブロックと直前の画像フレームに含まれるターゲットブロックとを比較して得る情報であるターゲットブロック情報を取得し、ターゲットブロック情報が予め定められた条件を満たす場合、現在の画像フレームをキーフレームとして決定するように構成される。このため、ショットの境界に基づいてキーフレームを決定する必要がなく、ビデオにおける画像フレームのターゲットブロックを比較することによってターゲットブロック情報を取得することができ、ターゲットブロック情報に基づいてキーフレームをスクリーニングすることができるので、連続的なショットからキーフレームを抽出できないことによるビデオをブラウジングできない問題点を解決でき、ビデオの再生効率を向上させる効果が得られる。
また、ビデオにおける各画像フレーム及び画像フレームを撮影するときのセンサ情報を取得し、センサ情報に基づいてスクリーニング条件を満たさない画像フレームを捨てることによって、捨て条件を満たす画像フレームに対する処理による資源の無駄を減少でき、画像フレームに対する処理効率を向上させることができる。
上記の実施例における装置について、各个モジュールが実行する操作の具体的な方式は、関連する方法の実施例において詳しく説明されたので、ここに省略する。
図5は例示的な実施例に係るビデオのブラウジング装置500のブロック図である。例えば、装置500は、携帯電話、コンピューター、デジタル放送端末、メッセージ送受信機器、ゲームコントロール、タブレットデバイス、医療機器、フィットネス機器、パーソナルデジタルアシスタントなどであってもよい。
図5に示すように、装置500は、プロセスアセンブリ502、メモリ504と、電源アセンブリ506、マルチメディアアセンブリ508、オーディオアセンブリ510、入力/出力(I/O)インターフェース512、センサアセンブリ514、及び通信アセンブリ516のような1つ以上のアセンブリを含んでよい。
プロセスアセンブリ502は、一般的には装置500全体の操作を制御するものであり、例えば、表示、電話呼び出し、データ通信、カメラ操作、及び記録操作と関連する操作を制御する。プロセスアセンブリ502は、1つ以上のプロセッサ518を含み、これらによって指令を実行することにより、上記方法の全部、或は一部のステップを実現するようにしてもよい。なお、プロセスアセンブリ502は、1つ以上のモジュールを含み、これらによってプロセスアセンブリ502と他のアセンブリの間のインタラクションを容易にするようにしてもよい。例えば、プロセスアセンブリ502は、マルチメディアモジュールを含み、これらによってマルチメディアアセンブリ508とプロセスアセンブリ502の間のインタラクションを容易にするようにしてもよい。
メモリ504は、各種類のデータを記憶することにより装置500の操作を支援するように構成される。これらのデータの例は、装置500において操作されるいずれのアプリケーションプログラム又は方法の命令、連絡対象データ、電話帳データ、メッセージ、画像、ビデオ等を含む。メモリ504は、いずれの種類の揮発性メモリ、不揮発性メモリ記憶デバイスまたはそれらの組み合わせによって実現されてもよく、例えば、SRAM(Static Random Access Memory)、EEPROM(Electrically Erasable Programmable Read−Only Memory)、EPROM(Erasable Programmable Read Only Memory)、PROM( Programmable ROM)、ROM(Read Only Member)、磁気メモリ、フラッシュメモリ、磁気ディスク、或いは光ディスクである。
電源アセンブリ506は、装置500の多様なアセンブリに電力を供給する。電源アセンブリ506は、電源管理システム、1つ以上の電源、及び装置500のための電力の生成、管理及び割り当てに関連する他のアセンブリを含んでもよい。
マルチメディアアセンブリ508は、前記装置500とユーザの間に1つの出力インターフェイスを提供するスクリーンを含む。上記実施例において、スクリーンは液晶モニター(LCD)とタッチパネル(TP)を含んでもよい。スクリーンがタッチパネルを含むことにより、スクリーンはタッチスクリーンとして実現されることができ、ユーザからの入力信号を受信することができる。タッチパネルは1つ以上のタッチセンサを含んでおり、タッチ、スライド、及びタッチパネル上のジェスチャを検出することができる。前記タッチセンサは、タッチ、或はスライドの動作の境界だけでなく、前記タッチ、或はスライド操作に係る継続時間及び圧力も検出できる。上記実施例において、マルチメディアアセンブリ508は、1つのフロントカメラ、及び/又はリアカメラを含む。装置500が、例えば撮影モード、或はビデオモード等の操作モードにある場合、フロントカメラ、及び/又はリアカメラは外部からマルチメディアデータを受信できる。フロントカメラとリアカメラのそれぞれは、1つの固定型の光レンズ系、或は可変焦点距離と光学ズーム機能を有するものであってもよい。
オーディオアセンブリ510は、オーディオ信号を入出力するように構成されてもよい。例えば、オーディオアセンブリ510は、1つのマイク(MIC)を含み、装置500が、例えば呼出しモード、記録モード、及び音声認識モード等の操作モードにある場合、マイクは外部のオーディオ信号を受信することができる。受信されたオーディオ信号は、さらにメモリ504に記憶されたり、通信アセンブリ516を介して送信されたりされる。上記実施例において、オーディオアセンブリ510は、オーディオ信号を出力するための1つのスピーカーをさらに含む。
I/Oインターフェイス512は、プロセスアセンブリ502と周辺インターフェイスモジュールの間にインターフェイスを提供するものであり、上記周辺インターフェイスモジュールは、キーボード、クリックホイール、ボタン等であってもよい。これらのボタンは、ホームボタン、ボリュームボタン、起動ボタン、ロッキングボタンを含んでもよいが、これらに限定されない。
センサアセンブリ514は、装置500に各方面の状態に対する評価を提供するための1つ以上のセンサを含む。例えば、センサアセンブリ514は、装置500のON/OFF状態、装置500のディスプレイとキーパッドのようなアセンブリの相対的な位置決めを検出できる。また、例えば、センサアセンブリ514は、装置500、或は装置500の1つのアセンブリの位置変更、ユーザと装置500とが接触しているか否か、装置500の方位、又は加速/減速、装置500の温度の変化を検出できる。センサアセンブリ514は、何れの物理的接触がない状態にて付近の物体の存在を検出するための近接センサを含んでもよい。センサアセンブリ514は、撮影アプリケーションに適用するため、CMOS、又はCCD図像センサのような光センサを含んでもよい。上記実施例において、当該センサアセンブリ514は、加速度センサ、ジャイロスコープセンサ、磁気センサ、圧力センサ、及び温度センサをさらに含んでもよい。
通信アセンブリ516は、装置500と他の機器の間に有線、又は無線形態の通信を提供する。装置500は、例えばWiFi、2G、3G、或はこれらの組み合わせのような、通信規格に基づいた無線ネットワークに接続されてもよい。1つの例示的な実施例において、通信アセンブリ516は、放送チャンネルを介して外部の放送管理システムからの放送信号、又は放送に関連する情報を受信する。1つの例示的な実施例において、前記通信アセンブリ516は、近距離無線通信(NFC)モジュールをさらに含むことにより、近距離通信を推進するようにする。例えば、NFCモジュールは、RFID(Radio Frequency IDentification)技術、IrDA(Infrared Data Association)技術、UWB(Ultra Wide Band)技術、BT(Bluetooth)技術、他の技術に基づいて実現できる。
例示的な実施例において、装置500は、1つ以上のASIC(Application Specific Integrated Circuit)、DSP(Digital Signal Processor)、DSPD(Digital Signal Processing Device)、PLD(Programmable Logic Device)、FPGA(Field−Programmable Gate Array)、コントローラ、マイクロコントローラ、マイクロプロセッサ、または他の電子部品によって実現されるものであり、上記方法を実行する。
例示的な実施例では、さらに、指令を含むコンピュータ読み取り可能な非一時的な記憶媒体、例えば、指令を含むメモリ504を提供しており、装置500のプロセッサ518により前記指令を実行して上記方法を実現する。例えば、コンピュータ読み取り可能な非一時的な記憶媒体は、ROM、RAM、CD−ROM、磁気テープ、フロッピーディスク、および光データ記憶デバイスなどであってもよい。
当業者にとって、明細書を考慮してこの発明を実施した後、本発明のその他の実施の形態を容易に想到し得ることができる。本願は、本発明のいかなる変形、用途又は適応的変化をカバーすることを目的とし、これら変形、用途又は適応的変化は、本発明の一般的原理に従うとともに、本発明に開示されていない本技術分野における公知の常識又は慣用の技術手段を含む。明細書及び実施例は、例示的なものに過ぎず、本発明の本当の範囲及び主旨は、特許請求の範囲に含まれる。
本発明は、以上のように説明すると共に図面に示された正確な構造に限られず、その要旨を逸脱しない範囲内で各種の補正及び変更を行うことができると理解すべきである。本発明の範囲は、特許請求の範囲のみで限定される。

Claims (13)

  1. ビデオにおける現在の画像フレームと直前の画像フレームとを比較して、前記現在の画像フレームに含まれるターゲットブロックと前記直前の画像フレームに含まれるターゲットブロックとを比較して得る情報であるターゲットブロック情報を取得するステップと、
    前記ターゲットブロック情報が予め定められた条件を満たす場合、前記現在の画像フレームをキーフレームとして決定するステップと、
    前記現在の画像フレームの直後の画像フレームを現在の画像フレームとして決定し、前記ビデオにおける現在の画像フレームと直前の画像フレームとを比較してターゲットブロック情報を取得するステップを、前記ビデオにおける最後の画像フレームが比較されるまで継続して実行するステップと、
    決定された少なくとも1つのキーフレームを再生させるステップと、を含み、
    前記ビデオにおける現在の画像フレームと直前の画像フレームとを比較してターゲットブロック情報を取得するステップは、
    前記直前の画像フレームにおけるターゲットブロックと、前記現在の画像フレームにおけるターゲットブロックとを比較させるステップと、
    前記現在の画像フレームには、前記直前の画像フレームが備えない少なくとも1つのターゲットブロックが含まれた場合、当該備えない各ターゲットブロックを、新たに追加されたターゲットブロックとして決定し、前記新たに追加されたターゲットブロックに対して、確定されたキーフレームの個数に1を加算してなるフラグ情報を設定し、各新たに追加されたターゲットブロックのターゲットブロック情報を取得するステップと、
    前記現在の画像フレームには、前記直前の画像フレームが備える少なくとも1つのターゲットブロックが含まれた場合、当該備える各ターゲットブロックを既存ターゲットブロックとして決定し、前記現在の画像フレームにおける前記既存ターゲットブロックの前記直前の画像フレームにおける対応するターゲットブロックに対する移動情報を計算し、各既存ターゲットブロックのターゲットブロック情報を取得するステップと、
    前記直前の画像フレームには、前記現在の画像フレームが備えない少なくとも1つのターゲットブロックが含まれた場合、当該備えない各ターゲットブロックを消失ターゲットブロックとして決定し、各消失ターゲットブロックのターゲットブロック情報を取得するステップと、
    を含むことを特徴とするビデオのブラウジング方法。
  2. 前記ターゲットブロック情報が予め定められた条件を満たす場合、前記現在の画像フレームをキーフレームとして決定するステップは、
    前記現在の画像フレームのターゲットブロック情報から、前記既存ターゲットブロックの移動の回数と、移動の変位と、到達した領域との少なくとも1つを含む各既存ターゲットブロックのそれぞれの移動情報を読み取るステップと、
    移動条件を満たす移動情報の数量が予め設定された閾値より大きいか否かを検出するステップと、
    前記移動条件を満たす移動情報の数量が前記予め設定された閾値より大きいと検出したと、前記現在の画像フレームを前記キーフレームとして決定するステップと、
    を含むことを特徴とする請求項に記載のビデオのブラウジング方法。
  3. 前記ターゲットブロック情報が予め定められた条件を満たす場合、前記現在の画像フレームをキーフレームとして決定するステップは、
    前記現在の画像フレームのターゲットブロック情報から、各ターゲットブロックのフラグ情報を読み取るステップと、
    各フラグ情報に前記消失ターゲットブロックのフラグ情報と同一のフラグ情報を有するか否かを検出するステップと、
    前記消失ターゲットブロックのフラグ情報と同一のフラグ情報を有しないと検出した場合、前記現在の画像フレームを前記キーフレームとして決定するステップと、
    を含むことを特徴とする請求項に記載のビデオのブラウジング方法。
  4. 前記ビデオにおける各画像フレーム及び前記画像フレームを撮影するときのGPS情報と、加速度情報と、感度ISO情報との少なくとも1つを含むセンサ情報を取得するステップと、
    前記センサ情報に基づいてスクリーニング条件を満たさない画像フレームを捨て、前記ビデオにおける現在の画像フレームと直前の画像フレームとを比較してターゲットブロック情報を取得するステップをトリガーするステップと、
    をさらに含むことを特徴とする請求項1ないしの何れか1つに記載のビデオのブラウジング方法。
  5. 前記ターゲットブロック情報が予め定められた条件を満たす場合、前記現在の画像フレームをキーフレームとして決定するステップが、
    前記現在の画像フレームに人物が含まれた場合、前記直前の画像フレームの人物姿勢情報に対して前記現在の画像フレームが変化するか否かを検出し、且つ前記現在の画像フレームにおける前記人物以外のターゲットブロック情報が前記予め定められた条件を満たすか否かを検出するステップと、
    前記人物姿勢情報が変化したと検出し、且つ前記現在の画像フレームにおいる前記人物以外のターゲットブロック情報が前記予め定められた条件を満たした場合、前記現在の画像フレームをキーフレームとして決定するステップと、
    を含むことを特徴とする請求項1に記載のビデオのブラウジング方法。
  6. ビデオにおける現在の画像フレームと直前の画像フレームとを比較して、前記現在の画像フレームに含まれるターゲットブロックと前記直前の画像フレームに含まれるターゲットブロックとを比較して得る情報であるターゲットブロック情報を取得するように構成される画像比較モジュールと、
    前記画像比較モジュールが取得した前記ターゲットブロック情報が予め定められた条件を満たす場合、前記現在の画像フレームをキーフレームとして決定するように構成される画像決定モジュールと、
    前記現在の画像フレームの直後の画像フレームを現在の画像フレームとして決定し、前記ビデオにおける現在の画像フレームと直前の画像フレームとを比較してターゲットブロック情報を取得する操作を、前記ビデオにおける最後の画像フレームが比較されるまで継続して実行するように構成される操作実行モジュールと、
    前記画像決定モジュールが決定した少なくとも1つのキーフレームを再生させるように構成される画像再生モジュールと、を有し、
    前記画像比較モジュールは、
    前記直前の画像フレームにおけるターゲットブロックを前記現在の画像フレームにおけるターゲットブロックと比較させるように構成されるターゲット比較サブモジュールと、
    前記ターゲット比較サブモジュールによって前記現在の画像フレームには、前記直前の画像フレームが備えない少なくとも1つのターゲットブロックが含まれた場合、当該備えない各ターゲットブロックを新たに追加されたターゲットブロックとして決定し、前記新たに追加されたターゲットブロックに対して、決定されたキーフレームの個数に1を加算してなるフラグ情報を設定し、各新たに追加されたターゲットブロックのターゲットブロック情報を取得するように構成される第1決定サブモジュールと、
    前記ターゲット比較サブモジュールによって前記現在の画像フレームには、前記直前の画像フレームが備える少なくとも1つのターゲットブロックが含まれた場合、当該備える各ターゲットブロックを既存ターゲットブロックとして決定し、前記現在の画像フレームにおける前記既存ターゲットブロックの前記直前の画像フレームにおける対応するターゲットブロックに対する移動情報を計算し、各既存ターゲットブロックのターゲットブロック情報を取得するように構成される第2決定サブモジュールと、
    前記ターゲット比較サブモジュールによって前記直前の画像フレームには、前記現在の画像フレームが備えない少なくとも1つのターゲットブロックが含まれた場合、当該備えない各ターゲットブロックを消失ターゲットブロックとして決定し、各消失ターゲットブロックのターゲットブロック情報を取得するように構成される第3決定サブモジュールと、
    を有することを特徴とするビデオのブラウジング装置。
  7. 前記画像決定モジュールは、
    前記現在の画像フレームのターゲットブロック情報から、前記既存ターゲットブロックの移動の回数と、移動の変位と、到達した領域との少なくとも1つを含む各既存ターゲットブロックのそれぞれの移動情報を読み取るように構成される第1読取サブモジュールと、
    移動条件を満たす移動情報の数量が予め設定された閾値より大きいか否かを検出するように構成される第1検出サブモジュールと、
    前記第1検出サブモジュールによって前記移動条件を満たす移動情報の数量が前記予め設定された閾値より大きいと検出した場合、前記現在の画像フレームを前記キーフレームとして決定するように構成される第4決定サブモジュールと、
    を有することを特徴とする請求項に記載のビデオのブラウジング装置。
  8. 前記画像決定モジュールは、
    前記現在の画像フレームのターゲットブロック情報から、各ターゲットブロックのそれぞれのフラグ情報を読み取るように構成される第2読取サブモジュールと、
    各フラグ情報に前記消失ターゲットブロックのフラグ情報と同一のフラグ情報を有するか否かを検出するように構成される第2検出サブモジュールと、
    前記第2検出サブモジュールによって前記消失ターゲットブロックのフラグ情報と同一のフラグ情報を有しないと検出した場合、前記現在の画像フレームを前記キーフレームとして決定するように構成される第5決定サブモジュールと、
    を有することを特徴とする請求項に記載のビデオのブラウジング装置。
  9. 前記ビデオにおける各画像フレーム及び前記画像フレームを撮影するときのGPS情報と、加速度情報と、感度ISO情報との少なくとも1つを含むセンサ情報を取得するように構成される情報取得モジュールと、
    前記情報取得モジュールが取得したセンサ情報に基づいてスクリーニング条件を満たさない画像フレームを捨て、前記ビデオにおける現在の画像フレームと直前の画像フレームとを比較してターゲットブロック情報を取得する操作の実行をトリガーするように構成される画像スクリーニングモジュールと、
    をさらに有することを特徴とする請求項ないしの何れか1つに記載のビデオのブラウジング装置。
  10. 前記画像決定モジュールは、
    前記現在の画像フレームに人物が含まれた場合、前記直前の画像フレームの人物姿勢情報に対して前記現在の画像フレームが変化するか否かを検出し、且つ前記現在の画像フレームにおける前記人物以外のターゲットブロック情報が前記予め定められた条件を満たすか否かを検出するように構成される第3検出サブモジュールと、
    前記第3検出サブモジュールによって前記人物姿勢情報が変化したと検出し、且つ前記現在の画像フレームにおいる前記人物以外のターゲットブロック情報が前記予め定められた条件を満たした場合、前記現在の画像フレームをキーフレームとして決定するように構成される第6決定サブモジュールと、
    を有することを特徴とする請求項に記載のビデオのブラウジング装置。
  11. プロセッサと、
    プロセッサが実行できる命令を記憶するためのメモリとを有し、
    前記プロセッサは、
    ビデオにおける現在の画像フレームと直前の画像フレームとを比較して、前記画像フレームに含まれるターゲットブロックと前記直前の画像フレームに含まれるターゲットブロックとを比較させて得られる情報であるターゲットブロック情報を取得し、
    前記ターゲットブロック情報が予め定められた条件を満たす場合、前記現在の画像フレームをキーフレームとして決定し、
    前記現在の画像フレームの直後の画像フレームを現在の画像フレームとして決定し、前記ビデオにおける現在の画像フレームと直前の画像フレームとを比較してターゲットブロック情報を取得するステップを、前記ビデオにおける最後の画像フレームが比較されるまで継続して実行し、
    決定された少なくとも1つのキーフレームを再生させるように構成され
    前記ビデオにおける現在の画像フレームと直前の画像フレームとを比較してターゲットブロック情報を取得するステップは、
    前記直前の画像フレームにおけるターゲットブロックと、前記現在の画像フレームにおけるターゲットブロックとを比較させるステップと、
    前記現在の画像フレームには、前記直前の画像フレームが備えない少なくとも1つのターゲットブロックが含まれた場合、当該備えない各ターゲットブロックを、新たに追加されたターゲットブロックとして決定し、前記新たに追加されたターゲットブロックに対して、確定されたキーフレームの個数に1を加算してなるフラグ情報を設定し、各新たに追加されたターゲットブロックのターゲットブロック情報を取得するステップと、
    前記現在の画像フレームには、前記直前の画像フレームが備える少なくとも1つのターゲットブロックが含まれた場合、当該備える各ターゲットブロックを既存ターゲットブロックとして決定し、前記現在の画像フレームにおける前記既存ターゲットブロックの前記直前の画像フレームにおける対応するターゲットブロックに対する移動情報を計算し、各既存ターゲットブロックのターゲットブロック情報を取得するステップと、
    前記直前の画像フレームには、前記現在の画像フレームが備えない少なくとも1つのターゲットブロックが含まれた場合、当該備えない各ターゲットブロックを消失ターゲットブロックとして決定し、各消失ターゲットブロックのターゲットブロック情報を取得するステップと、を含むことを特徴とするビデオのブラウジング装置。
  12. プロセッサに実行されることにより、請求項1から請求項のいずれかに記載のビデオのブラウジング方法を実現することを特徴とするプログラム。
  13. 請求項12に記載のプログラムが記録された記録媒体。
JP2016548409A 2014-09-17 2015-01-21 ビデオのブラウジング方法、その装置、プログラム及び記録媒体 Active JP6211715B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201410475165.4A CN104284240B (zh) 2014-09-17 2014-09-17 视频浏览方法及装置
CN201410475165.4 2014-09-17
PCT/CN2015/071247 WO2016041311A1 (zh) 2014-09-17 2015-01-21 视频浏览方法及装置

Publications (2)

Publication Number Publication Date
JP2016541214A JP2016541214A (ja) 2016-12-28
JP6211715B2 true JP6211715B2 (ja) 2017-10-11

Family

ID=52258644

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016548409A Active JP6211715B2 (ja) 2014-09-17 2015-01-21 ビデオのブラウジング方法、その装置、プログラム及び記録媒体

Country Status (8)

Country Link
EP (1) EP2998960B1 (ja)
JP (1) JP6211715B2 (ja)
KR (1) KR101677607B1 (ja)
CN (1) CN104284240B (ja)
BR (1) BR112015006631A2 (ja)
MX (1) MX361664B (ja)
RU (1) RU2015111193A (ja)
WO (1) WO2016041311A1 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104284240B (zh) * 2014-09-17 2018-02-02 小米科技有限责任公司 视频浏览方法及装置
US9799376B2 (en) 2014-09-17 2017-10-24 Xiaomi Inc. Method and device for video browsing based on keyframe
CN105426515B (zh) * 2015-12-01 2018-12-18 小米科技有限责任公司 视频归类方法及装置
CN105516675B (zh) * 2015-12-28 2018-11-16 同方威视技术股份有限公司 图像显示方法及用于图像显示的***
KR102374747B1 (ko) 2017-12-15 2022-03-15 삼성전자주식회사 객체를 인식하는 장치 및 방법
CN108563651B (zh) * 2017-12-19 2021-05-11 深圳云天励飞技术有限公司 一种多视频的目标搜索方法、装置及设备
CN109993025B (zh) * 2017-12-29 2021-07-06 中移(杭州)信息技术有限公司 一种关键帧提取方法及设备
CN108470077B (zh) * 2018-05-28 2023-07-28 广东工业大学 一种视频关键帧提取方法、***及设备和存储介质
CN113516006A (zh) * 2021-04-01 2021-10-19 广州云硕科技发展有限公司 一种用于智能机器人的高效信息处理方法及***
CN113507571B (zh) * 2021-06-30 2023-10-24 深圳市路卓科技有限公司 视频防剪辑方法、装置、设备、可读存储介质
CN113965814B (zh) * 2021-08-30 2023-07-04 国网山东省电力公司信息通信公司 基于视频会议场景的多会场关键帧提取方法及***
CN115474084B (zh) * 2022-08-10 2023-10-31 北京奇艺世纪科技有限公司 一种视频封面图像的生成方法、装置、设备和存储介质

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6055025A (en) * 1993-12-21 2000-04-25 Lucent Technologies, Inc. Method and apparatus for detecting abrupt and gradual scene changes in image sequences
JP2914170B2 (ja) * 1994-04-18 1999-06-28 松下電器産業株式会社 映像変化点検出方法
JP3528524B2 (ja) * 1997-07-10 2004-05-17 ソニー株式会社 記録再生装置および記録再生方法、並びに記録媒体
US5956026A (en) * 1997-12-19 1999-09-21 Sharp Laboratories Of America, Inc. Method for hierarchical summarization and browsing of digital video
US7280753B2 (en) * 2003-09-03 2007-10-09 Canon Kabushiki Kaisha Display apparatus, image processing apparatus, and image processing system
JP2005159781A (ja) * 2003-11-27 2005-06-16 Seiko Epson Corp 画像選択処理装置、画像選択方法およびそのプログラム、記録媒体
US7843512B2 (en) * 2004-03-31 2010-11-30 Honeywell International Inc. Identifying key video frames
US20070237225A1 (en) * 2006-03-30 2007-10-11 Eastman Kodak Company Method for enabling preview of video files
WO2008001305A2 (en) * 2006-06-29 2008-01-03 Koninklijke Philips Electronics N.V. Method and system of key frame extraction
CN101184226A (zh) * 2006-11-14 2008-05-21 腾讯科技(深圳)有限公司 一种***视频关键帧的方法及装置
JP4433027B2 (ja) * 2007-09-21 2010-03-17 ソニー株式会社 信号処理装置、信号処理方法、およびプログラム
CN101360184B (zh) * 2008-09-22 2010-07-28 腾讯科技(深圳)有限公司 提取视频关键帧的***及方法
CN101398855B (zh) * 2008-10-24 2010-08-11 清华大学 一种视频关键帧提取方法和***
JP5630541B2 (ja) * 2009-01-20 2014-11-26 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
JP5393237B2 (ja) * 2009-04-24 2014-01-22 キヤノン株式会社 画像表示装置及びその制御方法、並びにプログラム及び記憶媒体
WO2011099299A1 (ja) * 2010-02-10 2011-08-18 パナソニック株式会社 映像抽出装置、撮影装置、プログラム及び記録媒体
JP5537285B2 (ja) * 2010-06-28 2014-07-02 日本放送協会 要約映像生成装置及び要約映像生成プログラム
CN102348115B (zh) * 2010-08-02 2014-04-16 南京壹进制信息技术有限公司 一种去除视频中冗余图像的方法和装置
CN102867055B (zh) * 2012-09-16 2019-01-25 吴东辉 一种图像文件格式及生成方法及装置及应用
CN103345492A (zh) * 2013-06-25 2013-10-09 无锡赛思汇智科技有限公司 一种视频浓缩的方法和***
CN103533237B (zh) * 2013-09-29 2016-08-17 清华大学 一种从视频中提取视频关键帧的方法
CN104284240B (zh) * 2014-09-17 2018-02-02 小米科技有限责任公司 视频浏览方法及装置

Also Published As

Publication number Publication date
MX361664B (es) 2018-12-13
MX2015003761A (es) 2016-08-01
EP2998960A1 (en) 2016-03-23
EP2998960B1 (en) 2020-06-17
CN104284240B (zh) 2018-02-02
BR112015006631A2 (pt) 2017-07-04
KR101677607B1 (ko) 2016-11-29
KR20160043523A (ko) 2016-04-21
CN104284240A (zh) 2015-01-14
RU2015111193A (ru) 2016-10-20
WO2016041311A1 (zh) 2016-03-24
JP2016541214A (ja) 2016-12-28

Similar Documents

Publication Publication Date Title
JP6211715B2 (ja) ビデオのブラウジング方法、その装置、プログラム及び記録媒体
US9674395B2 (en) Methods and apparatuses for generating photograph
EP3136391B1 (en) Method, device and terminal device for video effect processing
CN104796781B (zh) 视频片段提取方法及装置
US10141025B2 (en) Method, device and computer-readable medium for adjusting video playing progress
JP6117446B2 (ja) リアルタイム・ビデオの提供方法、リアルタイム・ビデオの提供装置、サーバ、端末装置、プログラム及び記録媒体
US9589595B2 (en) Selection and tracking of objects for display partitioning and clustering of video frames
CN106375674B (zh) 寻找和使用与相邻静态图像相关的视频部分的方法和装置
WO2017124773A1 (zh) 手势识别方法及装置
US9799376B2 (en) Method and device for video browsing based on keyframe
WO2020228418A1 (zh) 视频处理方法及装置、电子设备和存储介质
WO2020181728A1 (zh) 图像处理方法及装置、电子设备和存储介质
JP2017534090A (ja) 顔認識方法、装置及び端末
CN105631803B (zh) 滤镜处理的方法和装置
WO2018095252A1 (zh) 视频录制方法及装置
US20170054906A1 (en) Method and device for generating a panorama
CN110798726A (zh) 弹幕显示方法、装置、电子设备及存储介质
KR101949218B1 (ko) 휴대 단말기의 이미지 촬영 방법 및 장치
WO2021057359A1 (zh) 图像处理方法、电子设备及可读存储介质
CN108769769A (zh) 视频的播放方法、装置及计算机可读存储介质
US11715234B2 (en) Image acquisition method, image acquisition device, and storage medium
WO2021237744A1 (zh) 拍摄方法及装置
CN115713641A (zh) 视频获取方法、装置及存储介质
CN113761275A (zh) 视频预览动图生成方法、装置、设备及可读存储介质
CN114598923A (zh) 视频文字清除方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161227

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170322

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170831

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170913

R150 Certificate of patent or registration of utility model

Ref document number: 6211715

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250