JP4497761B2 - 画像処理装置及びインデックス作成方法 - Google Patents

画像処理装置及びインデックス作成方法 Download PDF

Info

Publication number
JP4497761B2
JP4497761B2 JP2001217749A JP2001217749A JP4497761B2 JP 4497761 B2 JP4497761 B2 JP 4497761B2 JP 2001217749 A JP2001217749 A JP 2001217749A JP 2001217749 A JP2001217749 A JP 2001217749A JP 4497761 B2 JP4497761 B2 JP 4497761B2
Authority
JP
Japan
Prior art keywords
operation information
unit
time interval
video data
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001217749A
Other languages
English (en)
Other versions
JP2003032600A (ja
JP2003032600A5 (ja
Inventor
洋 東條
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2001217749A priority Critical patent/JP4497761B2/ja
Priority to US10/195,403 priority patent/US7071974B2/en
Priority to EP02255021A priority patent/EP1278135A3/en
Publication of JP2003032600A publication Critical patent/JP2003032600A/ja
Publication of JP2003032600A5 publication Critical patent/JP2003032600A5/ja
Application granted granted Critical
Publication of JP4497761B2 publication Critical patent/JP4497761B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/11Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information not detectable on the record carrier
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/74Browsing; Visualisation therefor
    • G06F16/745Browsing; Visualisation therefor the internal structure of a single video sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7847Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
    • G06F16/786Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content using motion, e.g. object motion or camera motion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • H04N5/77Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera
    • H04N5/772Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera the recording apparatus and the television camera being placed in the same enclosure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/147Scene change detection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/78Television signal recording using magnetic recording
    • H04N5/781Television signal recording using magnetic recording on disks or drums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/84Television signal recording using optical recording
    • H04N5/85Television signal recording using optical recording on discs or drums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Library & Information Science (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Television Signal Processing For Recording (AREA)
  • Studio Devices (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、動画像のブラウジングや検索に必要なインデキシング技術に関し、特に、動画像中のフレームを代表画像として取り出してインデックスとする技術に関するものである。
【0002】
【従来の技術】
従来、動画像のブラウジングや検索を行うために、インデックスを作る方法として次の方法がある。動画像中のフレームを取り出して代表画像(以下、キーフレームと表現)とし、動画像中の位置とセットにし、これをインデックスとする方法である。
【0003】
動画像はショットと呼ばれる単位に分割することができる。これは、ディジタルカメラで撮った動画像ならば、撮影開始ボタンを押してから停止させるまでであり、テレビ放送の動画像ならばカメラのアングルなどが切り替わるまで(一場面)である。そこで、ショット切り替わり(以下、カットと表現)を検出して、各ショットの先頭フレームをインデックスとする方法がよく知られている。
【0004】
【発明が解決しようとする課題】
しかしながら、実際にはひとつのショット中にも、カメラがパンをして2つ以上の事象が写った場合、ショットの内容を把握するためには、先頭のフレームだけをキーフレームとしたのでは不十分であった。また、ショットの先頭からズームインが始まって、ショットの終わりまで、興味の対象がアップされた映像が続く場合などは、先頭のフレームよりもズームイン後のフレームをキーフレームとした方が、ショット全体のキーフレームとして相応しい、といったことがあった。
【0005】
このような問題点解決するものとして、カメラの操作情報を利用し、例えばズームイン後のフレームをキーフレームとして取り出す方法がある。その一例として、特開平7−99605号公報では、撮影時にカメラの操作情報を映像情報と多重化して記憶媒体に書き込んでおき、この記憶媒体を再生時にカメラの操作情報から例えばズームイン後といった特定の条件を満足するフレームをキーフレームとする技術が開示されている。また、特開平10−224736号公報では、カメラの操作情報を画像処理にて判定し、やはりズームイン後等といった特定の条件を満足するフレームをキーフレームとする技術が開示されている。
【0006】
また、特にディジタルビデオなどで撮影されるパーソナルコンテンツにおいては、ユーザはカメラ操作に不慣れなため、円滑な操作を行うことが極めて困難である。例えば、ズームインを行う際、所望のサイズにアップされるまで、何度もズームインを繰り返さなければならないばかりか、ズームアウトの操作も必要になる。これは、所望のサイズでズームインを止めることが難しいため、補正するため行われるものである。よって、この様なズームイン・ズームアウトは、本来一連の操作とみなす必要がある。しかしながら、特開平7−99605号公報では、操作情報が一定のフレーム数以上連続して増加もしくは減少し、一定のフレーム数の間連続して変化がなければ操作は検出される。上記のようにズームインとズームアウトといった、操作量の増加と減少を繰り返すような操作は一連の操作とみなすことができない。よって、多数の類似した画像や、無意味な画像がキーフレームとして抽出される、という問題点があった。
【0007】
更には、誤ってズームボタンを操作し、またもとの状態に戻す、といった場合は、ユーザが意図した操作ではないので、キーフレームを抽出しても無意味な画像となってしまう。しかしながら、特開平7−99605号公報及び特開平10−224736号公報では、上記のようなユーザの意図しない、或いは、誤った操作に対してもキーフレームを抽出してしまう、という問題点があった。
【0008】
そこで、本発明の目的は、一つのカメラ操作が発生し、その操作が停止してから再び同じカメラ操作が行われるまでの期間が所定の期間よりも長いときに、一連のカメラ操作の終了を検出し、そのカメラ操作の終了時の画像データをインデックスのキーフレームとして利用することにより、利用者にとって有用なインデックスを提示することにある。
【0009】
また、本発明の目的は、例えば、カメラ操作が円滑でなかった場合に撮影されたコンテンツに対しても、冗長な画像データをインデックスのキーフレームとして抽出されることを防止し、利用者に適切なインデックスのみを提示することにある。
【0010】
【課題を解決するための手段】
本発明の画像処理装置は、撮像手段で撮影された映像データ及び前記映像データの撮影時における前記撮像手段の操作状況を示す操作情報を取得する取得手段と、前記取得手段により取得された操作情報に基づき前記撮像手段の操作内容を判定する判定手段と、前記判定手段により同一種の操作内容と判定された二つの連続した操作情報の間における操作時間の時間間隔を算出する時間間隔算出手段と、前記時間間隔算出手段により算出された時間間隔が所定期間より長いか否かを判断する第1の判断手段と、前記第1の判断手段により時間間隔が前記所定期間より長いと判断されると、前記二つの操作情報のうち操作時間が早い方の操作情報に対応するフレームの映像データをインデックスデータとして選択する選択手段とを有することを特徴とする。
本発明のインデックス作成方法は、撮像手段で撮影された映像データ及び前記映像データの撮影時における前記撮像手段の操作状況を示す操作情報を取得する取得ステップと、前記取得ステップにより取得された操作情報に基づき前記撮像手段の操作内容を判定する判定ステップと、前記判定ステップにより同一種の操作内容と判定された二つの連続した操作情報の間における操作時間の時間間隔を算出する時間間隔算出ステップと、前記時間間隔算出ステップにより算出された時間間隔が所定期間より長いか否かを判断する判断ステップと、前記判断ステップにより時間間隔が前記所定期間より長いと判断されると、前記二つの操作情報のうち操作時間が早い方の操作情報に対応するフレームの映像データをインデックスデータとして選択する選択ステップとを有することを特徴とする。
【0036】
【発明の実施の形態】
以下、添付図面を参照しながら本発明の好適な一実施形態を詳細に説明する。
【0037】
<第1の実施形態>
図1は、本発明の第1の実施形態における画像処理装置の構成図である。1010は、動画像を撮影する撮影部である。1020は記録媒体であり、撮影部1010で撮影された動画像を記録するものである。1030はインデキシング部であり、記憶媒体1020よりキーフレームを抽出し、インデックスを作成するものである。
【0038】
図2は、第1の実施形態における撮影部1010の構成図である。2010は撮像部であり、レンズ、撮像素子、A/D変換等から構成され、撮像を行うものである。2020は画像圧縮部であり画像圧縮回路により撮像部2010の映像信号を所定の圧縮方式のアルゴリズムに基づいて圧縮符号化処理を行う。例えば、ディジタルビデオにおけるDCTとVLCを用いた方式や、DCTと動き補償予測を用いたMPEG−1、MPEG−2といった形式がある。
【0039】
2030はカメラ操作部であり、撮影開始ボタンやズームボタンなどからなり、ユーザの各種のカメラ操作を入力するものである。2040はセンサ部であり、カメラの状態を検知するための各種のセンサから構成され、絞りの開度、焦点距離などの情報を取得する。2050は制御部であり、カメラ操作部2030から得られたユーザの操作情報や、センサ部2040から得られたセンサ情報をもとに撮像部2010などカメラを制御するものである。2060は記録部であり、映像データとカメラ操作情報(ユーザによる操作情報とセンサ情報)をタイミングを取りながら多重化を行って、記憶媒体に記録するものである。2070は、多重化された映像データとカメラ操作情報を記憶する記憶媒体であり、磁気テープ、光磁気ディスク、ハードディスクなどから構成される。
【0040】
図3は、第1の実施形態におけるインデキシング部1030の制御構成を示すブロック図である。同図において、301はCPUであり、本実施形態のインデキシング部1030における各種制御を実行する。302はROMであり、本装置の立ち上げ時に実行されるブートプログラムや各種データを格納する。303はRAMであり、CPU301が処理するための制御プログラムを格納するとともに、CPU301が各種制御を実行する際の作業領域を提供する。304はキーボード、305はマウスであり、ユーザによる各種入力操作環境を提供する。
【0041】
306は外部記憶装置であり、ハードディスクやフレキシブルディスク、CD−ROM等で構成される。307は表示器であり、ディスプレイなどで構成され、結果等をユーザに対して表示する。308はネットワークインタフェースであり、ネットワーク上の各機器との通信を可能とする。また、311は上記の各構成を接続するバスである。
【0042】
図4は、第1の実施形態におけるインデキシング部1030の機能構成を示すブロック図である。同図において、4020はカメラ操作情報統合部であり、記憶媒体4010より映像データおよびカメラの操作情報を読み取り、カメラ操作情報を時間情報などをもとに統合処理、即ち、操作内容が同一種として判定されるカメラ操作情報について、時間的に隣接するものにはカメラ操作情報により示される操作量の積算値を算出する処理を実行するものである。4030はキーフレーム選択部であり、一連の操作が完了したと見なされる際に、カメラ操作情報統合部4020によって統合されたカメラ操作情報(操作量の積算値)をもとに条件を満たすフレームをキーフレームとして選択し、インデックス化を行うものである。4040はインデックス蓄積部であり、キーフレーム選択部4030が生成したインデックス情報を蓄積するものである。
【0043】
以上のような構成を備えた第1の実施形態における画像処理装置の動作例を以下に説明する。図5は、第1の実施形態における撮影部1010の手順を示した図である。まず、ステップS8010において、ユーザがカメラ操作部2030を介してカメラの設定を行ったかどうかを判定する。カメラの設定とは、例えば、フォーカスモード(自動/手動)、露光モード(自動、ゲイン優先、シャッター速度優先、絞り優先、手動)、ホワイトバランスモード(自動、ホールド、ワンプッシュ、プリセット)などである。
【0044】
カメラの設定が行われたときは、ステップS8020において、制御部2050はカメラの設定を変更し、変更したカメラの設定情報をカメラ操作情報として記録部2060に送る。次にステップS8030において、録画ボタンがONされたかどうかをチェックする。ONされなければ、待機状態であり、ステップS8010へ戻る。
【0045】
ONされたら、制御部2050は録画状態にするとともに、このときの録画開始時刻をカメラ操作情報として記録部2060に送る。次にステップS8040において、録画状態となったので、撮像を開始する。撮像部2010で撮像された映像は画像圧縮部2020で画像圧縮された後に記録部2060へ映像データとして送られる。
【0046】
次に、ステップS8050において、ユーザによってカメラ操作が行われたかをチェックする。カメラ操作とは例えば、ズームボタンのON/OFF、パン、チルト、などである。ステップS8060では、制御部2050がセンサ部2040の情報をもとに撮像部2010などを駆動して、カメラを制御する。
【0047】
センサの情報とは例えば、焦点距離、合焦距離、手ぶれ検出、などである。そして例えばズームされたときは、ズームボタンが押された区間だけ、撮像部2010のレンズを動かしてズームを行い、焦点距離、合焦距離などのセンサ情報をもとにピントを合わせる。このとき、ズームボタンのON/OFFや焦点距離、合焦距離などのセンサ情報は、カメラ操作情報として記録部2060に送られる。記録部2060では、画像圧縮部2020より送られる映像データとカメラ操作情報を多重化して、記憶媒体2070に記録する。
【0048】
多重化の方法としては、例えばMPEG−2のシステムで規格化されている方法を利用する。カメラ操作情報をPESパケットにして、映像のPESパケットと、TS(Transport Stream)やPS(Program Stream)の多重ストリームとする。ここで、記録部2060は、画像データ1フレーム毎に対応するカメラ操作情報を発生し、画像データとは別のPESパケットとして画像データと多重化させている。次にステップS8070において、録画ボタンがOFFされたかどうかをチェックする。OFFされていなければ、ステップS8040へ戻って撮影状態のままである。OFFされれば、ステップS8010へ戻って待機状態となる。
【0049】
以上で述べたように、本実施形態においてカメラ操作情報とは、カメラ操作部2030から得られる情報とセンサ部2040から得られる情報とがある。カメラ操作情報の記述の形式としては、例えば、図6に挙げたDVフォーマットの形式や、図7に挙げた形式など(両方とも一部のみ表記した)がある。
【0050】
図8は、第1の実施形態におけるインデキシング部1030の手順を示した図である。なお、ここでは説明を簡単にするために、カメラ操作情報としてズームのみを取り上げるが、他のカメラ操作情報に関しても同様な手順である。まず、ステップS9010において、後述するズーム時刻、TLEN、ズームカウンタなどの各種変数を初期化する。
【0051】
次に、ステップS9020において記憶媒体4010から読み出しを行う。次に、ステップS9030において読み出しが終了したかどうかの判定を行う。終了していれば、本処理は終了する。終了していなければ、次のステップS9040へ進む。ステップS9040においてショットの先頭かどうかの判定をする。これは、録画開始時刻が存在するかどうかでわかる。録画開始時刻が存在すれば、録画ボタンがONされたフレームだからである。
【0052】
さて、ショットの先頭であれば、インデックスを作る。ステップS9130においてフレーム画像を縮小してサムネール画像を作成する。次に、ステップS9140において、このときのタイムコードと共にサムネールをインデックス情報としてインデックス蓄積部4040に記憶する。
【0053】
図9は、インデックス蓄積部4040に蓄積されたインデックス情報の一例である。ここでショットIDとは、ショット(録画ボタンをONしてからOFFするまで)ごとに順に付与したIDである。次に、ステップS9120においてTLENを0に、そして、ステップS9125においてズームカウンタを0にそれぞれ初期化する。そして、ステップS9020へと戻る。
【0054】
また、ステップS9040においてショットの先頭でないと判定された場合は、ステップS9050へ進む。ステップS9050において、カメラ操作情報としてズームが存在したかどうかを判定する。もし、ズームが存在しなければ、ステップS9020へ戻る。また、ズームが存在すれば、ステップS9051へ進む。ステップS9051では、ズーム操作を検出したカメラ操作情報に対応する1フレームの画像データを抽出し、図示しないメモリ上に記憶する。また、このメモリ上には前回ズーム操作を検出したカメラ操作情報に対応する画像データも記憶されており、ズーム操作が検出される度にメモリ上に用意される2フレーム分の領域に交互に書き込まれる。
【0055】
次に、ステップS9055において、ズームカウンタをインクリメントする。所望のアップ画像を得るためには、一般のユーザは操作に不慣れなため、ズーム操作(インとアウト)を何度か繰り返す必要がある。ズームカウンタは、この一連のズーム操作の回数をカウントするものである。
【0056】
次に、ステップS9060において、ズーム後にタイムコードをズーム時刻として記憶する。ズーム時刻は、特に図示しないメモリ中に一つ前のズーム時刻まで保存され、新しいものが記憶されるたびに、上書きされていく。次に、ステップS9065おいて、ズームカウンタが1であるかどうかを判定する。ズームカウンタが1であれば(即ち一回目のズームのときは)、ステップS9080からステップS9100のTLENの計算(詳細は後述する)に無条件に進む。
【0057】
次に、ステップS9070において、ズーム時刻から一つ前のズーム時刻を引いたものが所定値A以下であるかどうかを判定する。所定値Aとは次のような値である。所望のアップ画像を得るためには、一般のユーザは操作に不慣れなため、ズーム操作(インとアウト)を何度か繰り返す必要がある。
【0058】
このときの一連のズーム操作は、短い間隔でおこり、所望のアップ画像が得られると終了する。所定値Aとは、繰り返していると判断できるズーム操作とズーム操作の時間間隔の上限を表している。所定値Aの値は、実験により求めることができ、特に限定されるものではないが、1秒程度の短い時間である。よって、ステップS9070において、所定値A以下と判定された場合は、ズーム操作を繰り返している場合であり、このときはステップS9080からステップS9100の処理を行う。
【0059】
ステップS9080では、カメラ操作情報からズームインであるかどうかの判定を行う。ズームインであれば、ステップS9090へ進み、ズーム量をTLENに加える。TLENとは、一連のズーム操作において、ズームインした正味の量である。ズーム量とは、ズームした区間の量であり、ズームの強さ(ズーム倍率の変化率、或いは、ズームレンズの移動速度)で重み付けされたフレーム数や時間間隔などで表すことができる。
【0060】
また、ズームアウトであった場合は、ステップS9100において、TLENよりズーム量を引く。減じるのは、言うまでもないが、TLENが正味のズームインの量を表すからである。TLENが算出された後、ステップS9020へ戻る。
【0061】
また、ステップS9070において、所定値Aより大きいと判定された場合は、一連のズーム操作が終了した場合であり、このときは、ステップS9110へ進む。ステップS9110において、ズームイン又はズームアウト(ズーム)の正味の量であるTLENの絶対値が所定値B以上であるかどうかを判定する。これが非常に小さいときは、一連のズーム操作の前後で、ほとんどズームされていないことを示す。即ち、結局ユーザはズーム操作するのを止めてしまった場合に相当する。よって所定値Bは、ズームしたと認める量の下限値を表している。所定値Bの値は、実験によって求まるものであり特に限定されるものではない。
【0062】
所定値Bより小さい場合は、このような位置のインデックスを作成する必要はないので、ステップS9130とステップS9140はスキップする。また、所定値B以上であれば、ズームしたと認められる。このときステップS9051で記憶された画像データと併せてメモリ上で記憶されるもう一方の画像データ、即ち、前回ズーム操作が検出された際に抽出された画像データは、一連のズーム操作における最終画像データとなり、インデックスとしてふさわしいアップ画像である。よって、ステップS9130に進み、その画像データを用いてサムネールを作成する。
【0063】
そして、ステップS9140において、このときのタイムコードと共にサムネールをインデックス情報としてインデックス蓄積部4040に記憶する。次に、ステップS9120において、TLENを0に、そして、ステップS9125においてズームカウンタを0にそれぞれ初期化する。そして、ステップS9020へと戻る。以上が、本発明の第1の実施形態における動画像インデックス作成システムの処理である。
【0064】
以上説明したように、本実施形態においては、検出されたズーム時刻の情報を前回検出したズーム時刻の情報と比較し、これが所定値以上であった場合にメモリに記憶してあった直前のズーム操作時のフレームをインデックスとして抽出することで、一連のズーム操作の終了時のフレームをインデックスとして抽出することができる。
【0065】
そのため、慣れないユーザがズーム操作を繰り返し行うような場合であっても、ユーザの意図するショットを代表するインデックスを得ることができる。
【0066】
更に本形態では、一連のズーム操作中の操作量を積算しておき、一連のズーム操作の終了時にこの操作量の積算値が所定値以上であった場合にのみインデックスを抽出しているので、一連のズーム操作は行われているものの、ズームインとズームアウトとを繰り返しているような場合であっても無駄なインデックスを抽出することがなく、ユーザの意図したショットを代表するインデックスを得ることができる。
【0067】
<第2の実施形態>
図10は、第2の実施形態における画像処理装置の制御構成を示すブロック図である。同図において、501はCPUであり、本実施形態における各種制御を実行する。502はROMであり、本装置の立ち上げ時に実行されるブートプログラムや各種データを格納する。503はRAMであり、CPU501が処理するための制御プログラムを格納するとともに、CPU501が各種制御を実行する際の作業領域を提供する。504はキーボード、505はマウスであり、ユーザによる各種入力操作環境を提供する。
【0068】
506は外部記憶装置であり、ハードディスクやフレキシブルディスク、CD−ROM等で構成される。507は表示器であり、ディスプレイなどで構成され、結果等をユーザに対して表示する。508はネットワークインタフェースであり、ネットワーク上の各機器との通信を可能とする。509はビデオインタフェースであり、510のビデオカメラや、512のVTRからの動画の取り込みを可能とする。また、511は上記の各構成を接続するバスである。なお、上記の構成においてビデオカメラ510、VTR512や外部記憶装置506はネットワーク上に配置されたもので代用してもよい。
【0069】
図11は、第2の実施形態における画像処理装置の機能構成を示すブロック図である。同図において、6010は動画入力部であり、ビデオI/F509を介してビデオカメラ510、VTR512の動画像、或は、外部記憶装置506や図4に示した記憶媒体4010などから動画像を読み出し、本装置に入力するものである。次に、6020はフレーム抽出部であり、動画を構成するフレーム(画像)を順番に抽出するものである。
【0070】
次に、6030はカット検出部であり、動画像中のカット点を検出するものである。6040はカメラ操作判定部であり、カメラの操作情報を画像処理により判定するものである。6050はカメラ操作情報統合部であり、カメラ操作判定部6040より判定されたカメラ操作情報を時間情報などをもとに統合、即ち、操作内容が同一種として判定されるカメラ操作情報について、時間的に隣接するものにはカメラ操作情報により示される操作量の積算値を算出するものである。6060はキーフレーム選択部であり、一連の操作が完了したと見なされる際に、カメラ操作情報統合部6050によって統合されたカメラ操作情報(操作量の積算値)をもとに条件を満たすフレームをキーフレームとして選択し、インデックス化を行うものである。6070はインデックス蓄積部であり、カット検出部6030、及び、キーフレーム選択部6060が生成したインデックス情報を蓄積するものである。
【0071】
以上のような構成を備えた第2の実施形態における画像処理装置の動作例を以下に説明する。図12及び図13は、第2の実施形態における画像処理装置の手順を示すフローチャートである。まず、ステップS10010において、動画入力部6010は記憶媒体4010から読み出しを行う。動画の入力については、前述した通りビデオI/F509を介してビデオカメラ510、VTR512の動画像を取り込んでもよいが、本実施形態においては、記憶媒体から読み込む場合で説明をする。なお、第1の実施形態と違い、この記憶媒体には動画像データのみが記憶されているものとする。
【0072】
次に、ステップS10020において、フレーム抽出部6020はフレームを順次抽出して、カット検出部6030に送る。次に、ステップS10030において、カット検出部6030は、隣接フレーム間の類似度を算出する。
【0073】
ここで、フレーム間の類似度は、フレーム間類似性距離を算出し、100%で完全に同じであるとして、百分率で表わしたものを類似度とする。フレーム間類似性距離計算については、特にそのアルゴリズムを限定しない。最も簡単な実施例を挙げると、比較対象の夫々のフレームを図14に示すように縦横に複数のブロック分割を行ない、それぞれのブロックに関してRGBの平均値を算出しておき、比較対象の夫々の対応するブロック同士のRGB各チャンネルの差の二乗和を求めこれをフレーム間類似性距離とし、これが小さいほど類似しており、大きいほど類似していない、即ちカット点である可能性が大きいと取る方法がある。その計算式の一例を次の式1に示す。
【0074】
【数1】
Figure 0004497761
【0075】
但し、
i:処理中のブロックをあらわす
P1iR:直前のフレームにおけるi番目のブロックのRチャンネルでの平均値
P1iG:直前のフレームにおけるi番目のブロックのGチャンネルでの平均値
P1iB:直前のフレームにおけるi番目のブロックのBチャンネルでの平均値
P2iR:現在のフレームにおけるi番目のブロックのRチャンネルでの平均値
P2iG:現在のフレームにおけるi番目のブロックのGチャンネルでの平均値
P2iB:現在のフレームにおけるi番目のブロックのBチャンネルでの平均値
【0076】
次に、ステップS10040において、類似度が所定値H以下であるかどうか判定をする。ショットの変わり目(カット点)では、画像が急激に変化するため、前後のフレームは類似度が低くなる。即ち、所定値Hは、カット点でないとみなせる類似度の下限値である。この値は実験により求めることができ、特に限定されるものではないが、80%程度が望ましい。
【0077】
次に、所定値H以下であった場合は、カット点であるのでインデックスとして採用するために、ステップS10051において、フレーム画像を縮小してサムネール画像を作成する。次にステップS10052において、このときのタイムコードと共にサムネールをショットIDを付してインデックス情報としてインデックス蓄積部6070に記憶する。ショットIDはショットごとに振られるIDである。図9は、インデックス蓄積部6070に蓄積されたインデックス情報の一例である。
【0078】
また、ステップS10040において、所定値Hより大きかった場合は、カット点ではないのでステップS10051とステップS10052はスキップする。次に、ステップS10060において、読み出しが終了しているかどうかを判定し、終了していなければ、ステップS10010からステップS10050までの処理を繰り返す。以上がカット点の検出である。
【0079】
次に、カメラの操作の判定を行う。ステップS10070において、Nに初期値として1をセットする。次にステップS10080において、ショットNに相当するフレーム群を取り出す。次にステップS10090において、カメラ操作判定部6040はカメラの操作を判定する。このための手法としては、ハフ変換を用いて動きのベクトルの消失点を求め、複数有る消失点のうちの最大の投票数を得た消失点を背景に対する消失点とし、カメラ操作情報に関する拘束式を説くなどの手法がある。カメラ操作情報と消失点との関係やカメラ操作情報を求める手法は、例えば「金谷健一著、『画像理解』、森北出版」などに詳しい。
【0080】
カメラ操作情報が判定されると、ステップS10100において、第1の実施形態で示した図6及び図7のような形式などで、画像データ1フレーム毎に対応するカメラ操作情報を特に図示しないメモリ中に一時記憶する。次にステップS10110において、終了判定を行い、処理すべきショットが残っていれば、ステップS10120へ進み、Nをインクリメントし、ステップS10080からステップS10100を繰り返す。以上がカメラ操作判定の処理である。
【0081】
次に、カメラ操作情報の統合、及び、キーフレーム選択の処理を行う。なお、説明を簡単にするために、以下、カメラ操作情報としてパンのみを取り上げるが、他のカメラ操作情報に関しても同様な手順である。ステップS10130において、後述するパン時刻、TLEN、パンカウンタなどの各種変数を初期化する。次にステップS10140において、カメラ操作判定部6040で判定されたカメラ操作情報を順に取り出す。次にステップS10150において、取り出しが終了したかどうかの判定を行う。終了していれば、本処理は終了する。終了していなければ、次のステップS10160へ進む。
【0082】
ステップS10160において、カメラ操作情報としてパンが存在したかどうかを判定する。もし、パンが存在しなければ、ステップS10140へ戻る。また、パンが存在すれば、ステップS10165へ進む。ステップS10165では、パン操作を検出したカメラ操作情報に対応する1フレームの画像データを抽出し、図示しないメモリ上に記憶する。また、このメモリ上には前回パン操作を検出したカメラ操作情報に対応する画像データ(1フレーム)を記憶されており、パン操作が検出される度にメモリ上に用意される2フレーム分の領域に交互に書き込まれる。
【0083】
次に、ステップS10170において、パンカウンタをインクリメントする。パンをして所望の画像を得るためには、一般のユーザは操作に不慣れなため、パン操作(右方向と左方向)を何度か繰り返す必要がある。パンカウンタは、この一連のパン操作の回数をカウントするものである。
【0084】
次に、ステップS10180において、パン後にタイムコードをパン時刻として記憶する。パン時刻は、特に図示しないメモリ中に一つ前のパン時刻まで保存され、新しいものが記憶されるたびに、上書きされていく。次に、ステップS10190において、パンカウンタが1であるかどうかを判定する。パンカウンタが1であれば(即ち一回目のパンのときは)、ステップS10210からステップS10230のTLENの計算(詳細は後述する)に無条件に進む。
【0085】
次に、ステップS10200において、パン時刻から一つ前のパン時刻を引いたものが所定値J以下であるかどうかを判定する。所定値Jとは次のような値である。パンをして所望の画像を得るためには、一般のユーザは操作に不慣れなため、パン操作(右方向と左方向)を何度か繰り返す必要がある。
【0086】
このときの一連のパン操作は、短い間隔でおこり、所望の画像が得られると終了する。所定値Jとは、この一連のパン操作とパン操作との時間間隔の上限を表している。所定値Jの値は、実験により求めることができ、特に限定されるものではないが、1秒程度の短い時間である。よって、ステップS10200において、所定値J以下と判定された場合は、パン操作を繰り返している場合であり、このときはステップS10210からステップS10230の処理を行う。
【0087】
ステップS10210では、カメラの操作情報から右方向のパンであるかどうかの判定を行う。右方向パンであれば、ステップS10220へ進み、パンの量をTLENに加える。TLENとは、一連のパン操作において、右方向にパンした正味の量である。パンの量とは、パンをした区間の量であり、パンの強さ(角加速度など)で重み付けされたフレーム数や時間間隔などで表すことができる。また、左方向のパンであった場合は、ステップS10230において、TLENよりパンの量を引く。減じるのは、言うまでもないが、TLENが正味の右方向パンの量を表すからである。
【0088】
TLENが算出された後、ステップS10140へ戻る。また、ステップS10200において、所定値Jより大きいと判定された場合は、一連のパン操作が終了した場合であり、このときは、ステップS10240へ進む。ステップS10240において、TLENの絶対値が所定値K以上であるかどうかを判定する。
【0089】
TLENは先に述べた通り、正味の右方向パンの量である。よって絶対値をとれば、正味のパンの量になる。これが非常に小さいときは、一連のパン操作の前後で、結局画像は変わらずほとんどパンされていないことを示す。即ち、結局ユーザはパンするのを止めてしまった場合に相当する。よって所定値Kは、パンをしたと認める量の下限値を表している。所定値Kの値は、実験によって求まるものであり特に限定されるものではない。
【0090】
所定値Kより小さい場合は、このような位置のインデックスを作成する必要はないので、ステップS10250とステップS10260はスキップする。また、所定値K以上であれば、パンしたと認められる。このときステップS10165で記憶された画像データと併せてメモリ上で記憶されるもう一方の画像データ、即ち、前回パン操作が検出された際に抽出された画像データは、一連のパン操作の際における最終画像データとなり、インデックスとしてふさわしい画像である。よって、ステップS10250に進み、フレーム画像を縮小してサムネールを作成する。
【0091】
そして、ステップS10260において、このときのタイムコードと共にサムネールをインデックス情報としてインデックス蓄積部6070に記憶する。次に、ステップS10270において、TLENを0に、そして、ステップS10280においてパンカウンタを0にそれぞれ初期化する。そして、ステップS10140へと戻る。以上が、第2の実施形態における動画像画像処理装置の処理である。
以上説明したように、本実施形態においては、撮影時のカメラ操作情報が動画像データと共に記録されていない場合でもカメラ疎さの状態を画像データより判定し、このように判定したカメラ操作情報、例えばパンニングの情報を検出して前回検出したパンニング時刻の情報と比較し、これが所定値以上であった場合にメモリに記憶してあった直前のズーム操作時のフレームをインデックスとして抽出することで、一連のカメラ操作の終了時のフレームをインデックスとして抽出することができる。
そのため、慣れないユーザがカメラ操作を繰り返し行うような場合であっても、ユーザの意図するショットを代表するインデックスを得ることができる。
更に本形態では、一連のカメラ操作中の操作量を積算しておき、一連のカメラ操作の終了時にこの操作量の積算値が所定値以上であった場合にのみインデックスを抽出しているので、一連のカメラ操作は行われているものの、右パンと左パンとを繰り返しているような場合であっても無駄なインデックスを抽出することがなく、ユーザの意図したショットを代表するインデックスを得ることができる。
【0092】
なお、上記第1、第2の実施形態において、フレームの位置を示すのにタイムコードを用いたが、フレームIDであってもよく、動画中でそのフレームを特定できれば何であっても構わない。
【0093】
また、上記第1の実施形態において、図1の撮像部1010とインデキシング部1030はそれぞれ別の装置で実現する例をあげたが、ひとつの装置で実現しても、もちろん構わない。また、撮像装置1010とインデキシング部1030は記憶媒体1020を介してデータのやりとりを行ったが、IEEE1394などの通信手段を介して、データのやりとりを行うように構成しても、もちろん構わない。
【0094】
また、上記第1の実施形態において、図5で示した撮像部1010の手順は一例を示したものであり、これに限定されるものではない。例えば、画像撮像中にカメラの設定を変更可能にしても構わない。また、上記第1、第2の実施形態において、カメラ操作情報からインデックスを作成する処理において、1種類のカメラ操作情報について述べたが、他のカメラ操作情報についても同様な手順でインデックスの作成が可能である。
【0095】
また、上記第1、第2の実施形態において、インデックス情報はインデックス蓄積部(4040、または、6070)に記憶されているが、これを記憶媒体4010の所定の領域に書き込んでおいても良い。また、ネットワークを介して出力してもよく、このようにすれば、他の装置でインデックス情報を活用することが可能となる。
【0096】
また、上記第1、第2の実施形態において、インデックス情報は図9に示した形式で格納されるとしたが、一例に過ぎず、これに限定されるものではない。例えば、ショット単位の区別が必要なければ、ショットIDは省略可能である。或いは、カメラ操作情報の区間(例えばズームの開始点と終了点)を加えても良い。また、上記第1、第2の実施形態において、代表画像として一連のカメラ操作後のフレームを採用するとしている。
【0097】
しかし、例えば十分に長いパンであったときは、パンの途中のフレームも代表画像したほうが、ユーザが内容を理解しやすく、インデックスとして適切である場合がある。これを可能とするために、上記第2の実施形態で説明すれば、図12及び図13において、ステップS10200の判定で、一連のパン操作であると判定された後、正味のパンの量(TLENの絶対値)が所定の長さよりも長いかどうかを判定する手段を設ける。所定の長さより長ければ、ステップS10250からステップS10260でサムネールを作成し、ステップS10270、ステップS10280を経てステップS10140に戻る。また、パンの正味の量(TLENの絶対値)が所定の長さより短ければ、ステップS10210へ進むようにすればよい。所定の長さは内容を理解しやすい長さを実験によって求めればよい。
【0098】
また、上記第1、第2の実施形態において、代表画像としてフレーム画像の縮小画像を用いたが、代表画像を一覧表示させるときの効率のためである。もし、この効率化を犠牲にしてよければ、フレーム画像そのものを代表画像として良い。このときは、インデックス情報には、画像そのものは格納しなくとも、タイムコードを参照して、記憶媒体からフレームを順次読み出していってもよい。
【0099】
なお、上記第1、第2の実施形態において、カメラ操作情報の形式として図6、図7を挙げたが、これに限定されるものではなく、カメラ操作情報の種類、存在した区間、方向、及び、必要に応じて、強さ、が表記されていればどのような形式であっても構わない。
【0100】
なお、本発明は、例えばホストコンピュータ、インターフェース機器、リーダ、プリンタなどの複数の機器から構成されるシステムに適用しても、一つの機器からなる装置(例えば、複写機、ファクシミリ装置など)に適用してもよい。また、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記憶した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読み出し実行することによっても、達成されることは言うまでもない。
【0101】
この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。プログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発生のメモリカード、ROMなどを用いることができる。
【0102】
また、コンピュータが読み出したプログラムを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼動しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0103】
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0104】
【発明の効果】
以上の説明から明らかなように、本発明によれば、一つのカメラ操作が発生し、その操作が停止してから再び同じカメラ操作が行われるまでの期間が所定の期間よりも長いときに、前回のカメラ操作終了時の画像データをインデックスのキーフレームとして利用することにより、利用者にとって有用なインデックスを提示することができる。
【0105】
また、本発明によれば、例えば、カメラ操作が円滑でなかった場合に撮影されたコンテンツに対しても、冗長な画像データをインデックスのキーフレームとして抽出されることを防止し、利用者に適切なインデックスのみを提示することができる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態における動画像インデックス作成システムのシステム構成を示したブロック図である。
【図2】本発明の第1の実施形態における撮影部の機能構成を示したブロック図である。
【図3】本発明の第1の実施形態におけるインデキシング部の制御構成を示したブロック図である。
【図4】本発明の第1の実施形態におけるインデキシング部の機能構成を示したブロック図である。
【図5】本発明の第1の実施形態における撮像部の処理手順の流れを示したフローチャートである。
【図6】本発明に適用可能なDVフォーマットにおけるカメラ操作情報の形式を一例を示した図である。
【図7】本発明の適用可能なカメラ操作情報の形式の一例を示した図である。
【図8】本発明の第1の実施形態におけるインデキシング部の処理手順の流れを示したフローチャートである。
【図9】本発明に適用可能なインデックス情報の一例を示した図である。
【図10】本発明の第2の実施形態における動画像画像処理装置の制御構成を示したブロック図である。
【図11】本発明の第2の実施形態における動画像画像処理装置の機能構成を示したブロック図である。
【図12】本発明の第2の実施形態における動画像画像処理装置の処理手順の流れを示したフローチャートである。
【図13】本発明の第2の実施形態における動画像画像処理装置の処理手順の流れを示したフローチャートである。
【図14】本発明に適用可能なフレーム間類似性距離計算の一例を説明するための図である。
【符号の説明】
1010、2010 撮影部
1020、4010 記憶媒体
1030 インデキシング部
2020 画像圧縮部
2030 カメラ操作部
2040 センサ部
2050 制御部
2060 記録部
2070 記憶媒体
301、501 CPU
302、ROM ROM
303、503 RAM
304、504 キーボード
305、505 マウス
306、506 外部記憶装置
307、507 表示装置
308、508 NIC
509 ビデオI/F
510 ビデオカメラ
512 VTR
4020、6050 カメラ操作情報統合部
4030、6060 キーフレーム選択部
4040、6070 インデックス蓄積部
6010 動画入力
6020 フレーム抽出部
6030 カット検出部
6040 カメラ操作判定部

Claims (5)

  1. 撮像手段で撮影された映像データ及び前記映像データの撮影時における前記撮像手段の操作状況を示す操作情報を取得する取得手段と、
    前記取得手段により取得された操作情報に基づき前記撮像手段の操作内容を判定する判定手段と、
    前記判定手段により同一種の操作内容と判定された二つの連続した操作情報の間における操作時間の時間間隔を算出する時間間隔算出手段と、
    前記時間間隔算出手段により算出された時間間隔が所定期間より長いか否かを判断する第1の判断手段と、
    前記第1の判断手段により時間間隔が前記所定期間より長いと判断されると、前記二つの操作情報のうち操作時間が早い方の操作情報に対応するフレームの映像データをインデックスデータとして選択する選択手段とを有することを特徴とする画像処理装置。
  2. 前記第1の判断手段により前記時間間隔が前記所定期間より短いと判断されると、前記操作情報で示される操作量の積算値を算出する積算値算出手段と、
    前記積算値算出手段により算出された積算値が所定値以上であるか否かを判断する第2の判断手段とを有し、
    前記選択手段は更に、前記第1の判断手段により時間間隔が前記所定期間より長いと判断され、且つ、前記第2の判断手段により前記所定値以上であると判断されると、先に取得された方の操作情報に対応するフレームの映像データを前記インデックスデータとして選択することを特徴とする請求項1記載の画像処理装置。
  3. 前記積算値算出手段は、前記操作情報が所定方向の操作量を示されている場合には前記操作量を加算し、前記所定方向とは反対方向の操作量を示されている場合には前記操作量を減算することにより操作量の積算値を算出することを特徴とする請求項2記載の画像処理装置。
  4. 前記取得手段は前記映像データと共に前記映像データに付加されている前記操作情報を入力する入力手段と、前記入力手段より入力された操作情報を検出する検出手段とを有し、
    前記選択手段は前記検出手段の出力に応じて前記検出された操作情報に対応するフレームの映像データを抽出してメモリに記憶する記憶手段を有することを特徴とする請求項1記載の画像処理装置。
  5. 撮像手段で撮影された映像データ及び前記映像データの撮影時における前記撮像手段の操作状況を示す操作情報を取得する取得ステップと、
    前記取得ステップにより取得された操作情報に基づき前記撮像手段の操作内容を判定する判定ステップと、
    前記判定ステップにより同一種の操作内容と判定された二つの連続した操作情報の間における操作時間の時間間隔を算出する時間間隔算出ステップと、
    前記時間間隔算出ステップにより算出された時間間隔が所定期間より長いか否かを判断する判断ステップと、
    前記判断ステップにより時間間隔が前記所定期間より長いと判断されると、前記二つの操作情報のうち操作時間が早い方の操作情報に対応するフレームの映像データをインデックスデータとして選択する選択ステップとを有することを特徴とするインデックス作成方法。
JP2001217749A 2001-07-18 2001-07-18 画像処理装置及びインデックス作成方法 Expired - Fee Related JP4497761B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2001217749A JP4497761B2 (ja) 2001-07-18 2001-07-18 画像処理装置及びインデックス作成方法
US10/195,403 US7071974B2 (en) 2001-07-18 2002-07-16 Image processing apparatus
EP02255021A EP1278135A3 (en) 2001-07-18 2002-07-17 Image processing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001217749A JP4497761B2 (ja) 2001-07-18 2001-07-18 画像処理装置及びインデックス作成方法

Publications (3)

Publication Number Publication Date
JP2003032600A JP2003032600A (ja) 2003-01-31
JP2003032600A5 JP2003032600A5 (ja) 2008-08-28
JP4497761B2 true JP4497761B2 (ja) 2010-07-07

Family

ID=19052019

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001217749A Expired - Fee Related JP4497761B2 (ja) 2001-07-18 2001-07-18 画像処理装置及びインデックス作成方法

Country Status (3)

Country Link
US (1) US7071974B2 (ja)
EP (1) EP1278135A3 (ja)
JP (1) JP4497761B2 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4507392B2 (ja) * 2000-11-15 2010-07-21 株式会社ニコン 電子カメラ
JP4335492B2 (ja) * 2002-03-05 2009-09-30 キヤノン株式会社 動画像管理方法及び装置
JP2004056397A (ja) * 2002-07-18 2004-02-19 Canon Inc 画像処理装置および方法
JP4525558B2 (ja) * 2005-11-08 2010-08-18 ソニー株式会社 情報処理装置、撮像装置、および情報処理方法、並びにコンピュータ・プログラム
CN101563914A (zh) * 2006-11-28 2009-10-21 日本电气株式会社 具有变焦功能的运动画面拍摄装置、图像处理和显示方法及程序
JP2010226557A (ja) * 2009-03-25 2010-10-07 Sony Corp 画像処理装置、画像処理方法、およびプログラム
JP5570176B2 (ja) * 2009-10-19 2014-08-13 キヤノン株式会社 画像処理システム及び情報処理方法
US8837576B2 (en) * 2009-11-06 2014-09-16 Qualcomm Incorporated Camera parameter-assisted video encoding
US10178406B2 (en) 2009-11-06 2019-01-08 Qualcomm Incorporated Control of video encoding based on one or more video capture parameters
JP5763965B2 (ja) 2011-05-11 2015-08-12 キヤノン株式会社 情報処理装置、情報処理方法、及びプログラム
JP6990998B2 (ja) * 2017-06-06 2022-02-03 日本放送協会 カメラワーク判定装置及びプログラム

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06165107A (ja) * 1992-11-26 1994-06-10 Matsushita Electric Ind Co Ltd 動画像ダイジェスト自動表示装置
JPH0799605A (ja) * 1993-08-04 1995-04-11 Matsushita Electric Ind Co Ltd ビデオカメラシステム
JPH07236115A (ja) * 1994-02-24 1995-09-05 Matsushita Electric Ind Co Ltd ショット検出方法および代表画像記録・表示装置
JPH089314A (ja) * 1994-06-22 1996-01-12 Matsushita Electric Ind Co Ltd 動画像記録媒体、静止画像抽出装置、動画像記録装置および静止画像自動抽出方法
JPH1028250A (ja) * 1996-07-10 1998-01-27 Hitachi Ltd インテリジェントビデオカメラ及びインテリジェントスチルカメラ
JPH10112835A (ja) * 1996-10-04 1998-04-28 Matsushita Electric Ind Co Ltd 映像要約方法および映像表示方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100215586B1 (ko) 1992-11-09 1999-08-16 모리시타 요이찌 다이제스트 화상 자동생성 장치 및 다이제스트 화상 자동생성 방법
JP3108585B2 (ja) * 1993-07-28 2000-11-13 日本電信電話株式会社 ビデオ画像プリントアクセス方法およびシステム
US5581362A (en) 1993-08-04 1996-12-03 Matsushita Electric Industrial Co., Ltd. Video camera system which multiplexes internal, external, and sensing parameters onto the video signal in order to identify individual segments
US6211912B1 (en) 1994-02-04 2001-04-03 Lucent Technologies Inc. Method for detecting camera-motion induced scene changes
US5485611A (en) * 1994-12-30 1996-01-16 Intel Corporation Video database indexing and method of presenting video database index to a user
JP3312105B2 (ja) 1997-02-05 2002-08-05 株式会社東芝 動画像インデックス生成方法および生成装置
WO1999003273A1 (fr) * 1997-07-11 1999-01-21 Mitsubishi Denki Kabushiki Kaisha Appareil de lecture de films et appareil permettant de constituer un recueil de films
US6298145B1 (en) * 1999-01-19 2001-10-02 Hewlett-Packard Company Extracting image frames suitable for printing and visual presentation from the compressed image data
US6731789B1 (en) 1999-01-29 2004-05-04 Canon Kabushiki Kaisha Image processing apparatus and method, and storage medium
JP3897476B2 (ja) * 1999-02-15 2007-03-22 キヤノン株式会社 画像処理装置及びその方法、コンピュータ可読メモリ
JP3809305B2 (ja) * 1999-07-27 2006-08-16 キヤノン株式会社 画像検索装置及び画像検索方法及びコンピュータ読み取り可能な記憶媒体
US6711587B1 (en) * 2000-09-05 2004-03-23 Hewlett-Packard Development Company, L.P. Keyframe selection to represent a video
US6731189B2 (en) * 2002-06-27 2004-05-04 Raytheon Company Multilayer stripline radio frequency circuits and interconnection methods

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06165107A (ja) * 1992-11-26 1994-06-10 Matsushita Electric Ind Co Ltd 動画像ダイジェスト自動表示装置
JPH0799605A (ja) * 1993-08-04 1995-04-11 Matsushita Electric Ind Co Ltd ビデオカメラシステム
JPH07236115A (ja) * 1994-02-24 1995-09-05 Matsushita Electric Ind Co Ltd ショット検出方法および代表画像記録・表示装置
JPH089314A (ja) * 1994-06-22 1996-01-12 Matsushita Electric Ind Co Ltd 動画像記録媒体、静止画像抽出装置、動画像記録装置および静止画像自動抽出方法
JPH1028250A (ja) * 1996-07-10 1998-01-27 Hitachi Ltd インテリジェントビデオカメラ及びインテリジェントスチルカメラ
JPH10112835A (ja) * 1996-10-04 1998-04-28 Matsushita Electric Ind Co Ltd 映像要約方法および映像表示方法

Also Published As

Publication number Publication date
US20030016291A1 (en) 2003-01-23
EP1278135A2 (en) 2003-01-22
JP2003032600A (ja) 2003-01-31
US7071974B2 (en) 2006-07-04
EP1278135A3 (en) 2006-03-08

Similar Documents

Publication Publication Date Title
EP0940978B1 (en) High resolution camera
RU2415513C1 (ru) Устройство записи изображения, способ записи изображения, устройство обработки изображения, способ обработки изображения и программа
EP2202968B1 (en) Video reproduction device and video reproduction method
US7391436B2 (en) Image processing apparatus with comparing of difference of camera operation information between image data of plural sections in input image data
JP4497761B2 (ja) 画像処理装置及びインデックス作成方法
US8120675B2 (en) Moving image recording/playback device
JP2015053741A (ja) 画像再生装置
US8538247B2 (en) Image processing apparatus and image processing method
US7982792B2 (en) Image processing apparatus
JP5126392B2 (ja) 再生制御装置及び再生制御方法並びにプログラム
JP3893416B2 (ja) 電子スチルカメラおよびその画像データ記録再生方法
JP4665826B2 (ja) 撮像装置および画像処理プログラム
JP2010237911A (ja) 電子機器
JP3667065B2 (ja) 撮像記録装置及びその制御方法
WO2013065642A1 (ja) 画像処理装置
JP2003069947A (ja) 動画像処理装置、動画像処理方法および記憶媒体
JP4408397B2 (ja) 撮影装置および撮影方法およびプログラム
JP5041050B2 (ja) 撮像装置および画像処理プログラム
JP5915009B2 (ja) 画像処理装置、電子カメラ、画像処理方法、及びプログラム、並びに記録媒体
JP2010288212A (ja) カメラ及び動画編集用プログラム
JP2003110995A (ja) 画像処理装置、画像処理システム、画像処理方法、記憶媒体、及びプログラム
JP4217528B2 (ja) 動画像処理方法及び装置
JP5269639B2 (ja) 撮像装置および通信システム
US20100253786A1 (en) Image file generating device and image reproducing device
JP2005142941A (ja) 動画再生装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080715

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080715

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091120

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100127

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100323

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100413

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130423

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130423

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140423

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees