JP3534592B2 - 代表画像生成装置 - Google Patents

代表画像生成装置

Info

Publication number
JP3534592B2
JP3534592B2 JP30954897A JP30954897A JP3534592B2 JP 3534592 B2 JP3534592 B2 JP 3534592B2 JP 30954897 A JP30954897 A JP 30954897A JP 30954897 A JP30954897 A JP 30954897A JP 3534592 B2 JP3534592 B2 JP 3534592B2
Authority
JP
Japan
Prior art keywords
scene
image
frame
length
cut
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP30954897A
Other languages
English (en)
Other versions
JPH11136637A (ja
Inventor
等 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP30954897A priority Critical patent/JP3534592B2/ja
Publication of JPH11136637A publication Critical patent/JPH11136637A/ja
Application granted granted Critical
Publication of JP3534592B2 publication Critical patent/JP3534592B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Television Signal Processing For Recording (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ランダムアクセス
が可能な記憶装置を備えた動画編集装置、マルチメディ
ア編集装置、動画データベース、動画ファイル管理装置
などにおける代表画像生成装置に関し、特に、編集のた
めの一覧用表示に供するフレームを自動的に決めるに当
たり、これを機械的に一律に決めるのではなく、動画デ
ータの中身を的確に表す画像フレームに決めて表示する
よう構成したものである。
【0002】
【従来の技術】従来の代表画像生成装置としては、たと
えば、対象となる動画素材の先頭フレームや先頭から一
定時間を経過した時点のフレーム(例えば、先頭から5
フレーム目)の内容をインデクス静止画とする方法(特
開平6-89549)や、映像カットの切替りを検出して検出
されたフレーム(またはその前後のフレーム)画像をイ
ンデクス静止画とする方法(特開平5-183862、特開平9-
200687)などが知られている。
【0003】しかしながら、上記従来の代表画像生成装
置は、動画の中身(どのような映像であるか)を的確に
示していないという問題があった。
【0004】そこで本発明は、前記従来の問題を解決す
るものであり、動画の中身を的確に表すインデクスとな
る画像を提示できる代表画像生成装置を提供することを
目的にするものである。
【0005】
【課題を解決するための手段】前記問題を解決するため
に本発明は、あらかじめ撮影し蓄積しておいた動画を読
み出して提供できるようにした動画入力手段と、提供さ
れた動画をフレーム単位で格納するフレームメモリと、
該フレームメモリに格納されたフレーム単位の画像デー
タを読み出してカットを検出するカット検出手段と、各
カットのカット長を計算するカット長計算手段と、計算
されたカット長を記憶するカット長記憶手段と、カット
間で似ている絵などのカットを纏めて映像シーンを構成
するシーン構成手段と、構成したシーンの長さを計算す
るシーン長計算手段と、計算したシーン長を記憶するシ
ーン長記憶手段と、記憶されたシーン長から最も長いシ
ーン長を有するシーンを最長シーンとして決定する最長
シーン決定手段と、前記最長シーンから代表フレーム画
像をインデクス静止画として決定するインデクス静止画
決定手段と、決定されたインデクス静止画を出力するイ
ンデクス静止画出力手段とから構成されることを特徴と
するものである。
【0006】以上により、動画の中身を的確に表すイン
デクスとなる画像を提示できる代表画像生成装置を提供
することができる。
【0007】
【発明の実施の形態】本発明の請求項1に記載の発明
は、あらかじめ撮影し蓄積しておいた動画を読み出して
提供できるようにした動画入力手段と、提供された動画
をフレーム単位で格納するフレームメモリと、該フレー
ムメモリに格納されたフレーム単位の画像データを読み
出してカットを検出するカット検出手段と、各カットの
カット長を計算するカット長計算手段と、計算されたカ
ット長を記憶するカット長記憶手段と、カット間で似て
いる絵(色、ものの配置)などのカットを纏めて映像シ
ーンを構成するシーン構成手段と、構成したシーンの長
さを計算するシーン長計算手段と、計算したシーン長を
記憶するシーン長記憶手段と、記憶されたシーン長から
最も長いシーン長を有するシーンを最長シーンとして決
定する最長シーン決定手段と、前記最長シーンから代表
フレーム画像をインデクス静止画として決定するインデ
クス静止画決定手段と、決定されたインデクス静止画を
出力するインデクス静止画出力手段とから構成されるこ
とを特徴とする代表画像生成装置としたものであり、映
像の撮影および編集時に、制作者の意図を反映する映像
時間配分の面で最も重点が置かれたシーンの絵をインデ
クス静止画とすることができるという作用を有する。
【0008】
【0009】本発明の請求項に記載の発明は、あらか
じめ撮影し蓄積しておいた動画を読み出して提供できる
ようにした動画入力手段と、提供された動画をフレーム
単位で格納するフレームメモリと、該フレームメモリに
格納されたフレーム単位の画像データを一定間隔区間毎
に1フレームずつ読み出す一定間隔区間フレーム抽出手
段と、抽出した複数のフレーム間で似ている映像の区間
を纏めることによりシーンを構成するシーン構成手段
と、構成したシーンの長さを計算するシーン長計算手段
と、計算したシーン長を記憶するシーン長記憶手段と、
記憶された各シーン長から最も長いシーン長を有するシ
ーンを最長シーンとして決定する最長シーン決定手段
と、前記最長シーンから代表フレーム画像をインデクス
静止画として決定するインデクス静止画決定手段と、決
定されたインデクス静止画を出力するインデクス静止画
出力手段とから構成されることを特徴とする代表画像生
成装置としたものであり、映像の撮影および編集時に、
制作者の意図を反映する映像時間配分の面で最も重点が
置かれたシーンの絵をインデクス静止画とすることがで
きるという作用を有する。
【0010】
【0011】
【0012】
【0013】
【0014】
【0015】本発明の請求項に記載の発明は、あらか
じめ撮影し蓄積しておいた動画を読み出して提供できる
ようにした動画入力手段と、提供された動画をフレーム
単位で格納するフレームメモリと、該フレームメモリに
格納されたフレーム単位の画像データを読み出してカッ
トを検出するカット検出手段と、各カットのカット長を
計算するカット長計算手段と、計算されたカット長を記
憶するカット長記憶手段と、記憶された各カット長から
カット長の短いカットが連続する短カット区間をそれぞ
れ一つのシーンとし、前記シーンの中から最長の短カッ
ト区間を最も長いシーン長を有する最長シーンとして
定する最長シーン決定手段と、前記最長シーンから代表
フレーム画像をインデクス静止画として決定するインデ
クス静止画決定手段と、決定されたインデクス静止画を
出力するインデクス静止画出力手段とから構成されるこ
とを特徴とする代表画像生成装置としたものであり、映
像の撮影および編集時に、カット数量の面で最も重点が
置かれたシーンの絵をインデクス静止画すなわち代表画
像とすることができるという作用を有する。
【0016】本発明の請求項に記載の発明は、あらか
じめ撮影し蓄積しておいた動画を読み出して提供できる
ようにした動画入力手段と、提供された動画をフレーム
単位で格納するフレームメモリと、該フレームメモリに
格納されたフレーム単位の画像データを一定間隔区間毎
に1フレームずつ読み出す一定間隔区間フレーム抽出手
段と、抽出した複数のフレーム間で似ている映像の区間
を纏めることによりシーンを構成するシーン構成手段
と、構成したシーンの長さを計算するシーン長計算手段
と、計算したシーン長を記憶するシーン長記憶手段と、
記憶された各シーン長からシーン長の短いシーンが連続
する短シーン区間の中から最長の短シーン区間を最長短
シーン区間として決定する短シーン区間決定手段と、
記最長短シーン区間から代表フレーム画像をインデクス
静止画として決定するインデクス静止画決定手段と、決
定されたインデクス静止画を出力するインデクス静止画
出力手段とから構成されることを特徴とする代表画像生
成装置としたものであり、映像の撮影および編集時に、
シーン数量の面で最も重点が置かれた短シーン区間の絵
をインデクス静止画すなわち代表画像とすることができ
るという作用を有する。
【0017】以下、本発明の実施の形態について、図面
を用いて説明する。
【0018】(第1の実施の形態)図1は、本発明の第
1の実施の形態に係る代表画像生成装置の構成を示すも
のである。図1において代表画像生成装置は、あらかじ
め撮影し蓄積しておいた動画を読み出して提供できるよ
うにした動画入力手段1と、提供された動画をフレーム
単位で格納するフレームメモリ2と、フレームメモリ2
に格納されたフレーム単位の画像データを読み出してカ
ット(1纏まりの映像データ)を検出するカット検出手
段3と、各カットのカット長を計算するカット長計算手
段4と、計算されたカット長を記憶するカット長記憶手
段5と、記憶されたカット長の中から最も長いカット長
を有するカットを決定する最長カット決定手段6と、最
も長いカット長を有するカットからインデクスとして相
応しいフレーム画像を決定するインデクス静止画決定手
段7と、決定されたインデクス静止画を出力するインデ
クス静止画出力手段8とから構成されている。上記構成
において、動画入力手段1から取り出された動画は、フ
レームメモリ2と、インデクス静止画決定手段7にそれ
ぞれ入力される。
【0019】図2を用いて代表画像が決定される過程を
上記動画入力手段1から取り出される動画のフレーム画
像開始点から始まる複数のカットから構成される動画の
例で説明する。すなわち、上記カット検出手段3は、カ
ット変化点に着目してカットの開始点を把握する。上記
最長カット決定手段6は、把握されたカットの中で最も
長いカット長を有するカットを特定する。上記インデク
ス静止画決定手段7は、そのカットの先頭から一定割合
にあるフレーム画像、たとえばカット長の先頭から30%
近傍の位置(最長カットの3分の1弱)にあるフレーム
画像を代表画像と決定する。そのように決定する理由
は、上記のような動画例においてその動画の中で最も長
いカット長を有するカットの先頭から一定割合にあるフ
レーム画像、たとえば最も長いカット長を有するカット
の先頭から30%近傍の位置にあるフレーム画像がその動
画の中身を代表するに相応しいフレーム画像であること
が多いという映像制作上の経験則に基づいている。な
お、カット検出の方法としては、隣り合うフレーム画像
間の特徴量の相関係数変化率によりカットの変化点を検
出する技術が公知なので、その技術を利用すればよい。
【0020】このように本発明の第1の実施の形態の代
表画像生成装置によれば、映像の撮影および編集時に、
制作者の意図を反映する映像時間配分の面で最も重点が
置かれたシーンの絵をインデクス静止画とすることがで
き、動画の中身を的確に表すインデクス画像を提示でき
る代表画像生成装置を提供することができる。
【0021】(第2の実施の形態) 図3は、本発明の第2の実施の形態に係る代表画像生成
装置の構成を示すものである。図3において代表画像生
成装置は、あらかじめ撮影し蓄積しておいた動画を読み
出して提供できるようにした動画入力手段1と、提供さ
れた動画をフレーム単位で格納するフレームメモリ2
と、フレームメモリ2に格納されたフレーム単位の画像
データを読み出してカット(1纏まりの映像データ)を
検出するカット検出手段3と、各カットのカット長を計
算するカット長計算手段4と、計算されたカット長を記
憶するカット長記憶手段5と、カット間で似ている絵
(色、ものの配置)などのカットを纏めて映像シーンを
構成するシーン構成手段9と、構成したシーンの長さを
計算するシーン長計算手段10と、計算したシーン長を記
憶するシーン長記憶手段11と、記憶されたシーン長から
最も長いシーン長を有するシーンを最長シーンとして
定する最長シーン決定手段12と、前記最長シーンから
表フレーム画像をインデクス静止画として決定するイン
デクス静止画決定手段7と、決定されたインデクス静止
画を出力するインデクス静止画出力手段8とから構成さ
れている。上記構成において、動画入力手段1から取り
出される動画は、フレームメモリ2と、シーン構成手段
9と、インデクス静止画決定手段7にそれぞれ入力され
る。
【0022】図4を用いて代表画像が決定される過程を
上記動画入力手段1から取り出される動画のフレーム画
像開始点から始まる複数のカットで構成される動画の例
で説明する。すなわち、上記カット検出手段3は、カッ
ト変化点に着目してカットの開始点を把握する。上記シ
ーン構成手段9は、複数のカットの間で似ている絵
(色、ものの配置など)のカットを纏めて映像シーンを
構成する。上記インデクス静止画決定手段7は、構成し
たシーンの中から最も長いシーン長を有するシーンの先
頭から一定割合にあるフレーム画像、たとえば最も長い
シーン長を有するシーンの先頭から30%近傍の位置(最
長シーンの3分の1弱)にあるフレーム画像を代表画像
と決定する。そのように決定する理由は、上記のような
動画例においてその動画の中で最も長いシーン長のシー
ンの先頭から一定割合にあるフレーム画像、たとえば最
も長いシーン長のシーンの先頭から30%近傍の位置にあ
るフレーム画像がその動画の中身を代表するに相応しい
フレーム画像であることが多いという映像制作上の経験
則に基づいている。なお、複数のカット間で似ているカ
ットを判定することは、結局は、フレーム画像間の類似
を判定することであり、一方フレーム画像間の類似を判
定する技術は公知なので、その技術を利用する。
【0023】このように本発明の第2の実施の形態の代
表画像生成装置によれば、映像の撮影および編集時に、
制作者の意図を反映する映像時間配分の面で最も重点が
置かれたシーンの絵をインデクス静止画とすることがで
き、動画の中身を的確に表すインデクス画像を提示でき
る代表画像生成装置を提供することができる。
【0024】(第3の実施の形態) 図5は、本発明の第3の実施の形態の代表画像生成装置
の構成を示すものである。図5において代表画像生成装
置は、あらかじめ撮影し蓄積しておいた動画を読み出し
て提供できるようにした動画入力手段1と、提供された
動画をフレーム単位で格納するフレームメモリ2と、フ
レームメモリ2に格納されたフレーム単位の画像データ
を一定間隔区間毎に1フレームずつ読み出す一定間隔区
間フレーム抽出手段13と、抽出した複数のフレーム間で
似ている映像の区間を纏めることによりシーンを構成す
るシーン構成手段9と、構成したシーンの長さを計算す
るシーン長計算手段10と、計算したシーン長を記憶する
シーン長記憶手段11と、記憶されたシーン長から最も長
いシーン長を有するシーンを最長シーンとして決定する
最長シーン決定手段12と、前記最長シーンから代表フレ
ーム画像をインデクス静止画として決定するインデクス
静止画決定手段7と、決定されたインデクス静止画を出
力するインデクス静止画出力手段8とから構成されてい
る。上記構成において、動画入力手段1から取り出され
る動画は、フレームメモリ2と、シーン構成手段9と、
インデクス静止画決定手段7にそれぞれ入力される。
【0025】代表画像が決定される過程を上記動画入力
手段1から取り出される動画のフレーム画像開始点から
一定間隔区間毎に1つずつ取り出されるフレーム画像に
ついて説明する。すなわち、上記一定間隔区間フレーム
抽出手段13は、一定間隔区間毎に1フレーム画像ずつフ
レーム画像を取り出す。上記シーン構成手段9は、取り
出された複数のフレーム画像間で似ている画像の区間を
纏めることによりシーンを構成する。上記インデクス静
止画決定手段7は、構成したシーンの中から最も長いシ
ーン長を有するシーンの先頭から一定割合にあるフレー
ム画像、たとえば最も長いシーン長を有するシーンの先
頭から30%近傍の位置(最長シーンの3分の1弱)にあ
るフレーム画像を代表画像と決定する。そのように決定
する理由は、上記のような動画例においてその動画の中
で最も長いシーン長を有するシーンの先頭から一定割合
にあるフレーム画像、たとえば最も長いシーン長を有す
るシーンの先頭から30%近傍の位置にあるフレーム画像
がその動画の中身を代表するに相応しいフレーム画像で
あることが多いという映像制作上の経験則に基づいてい
る。なお、前記したようにフレーム間の類似を判定する
技術は公知なので、その技術を利用すればよい。
【0026】このように本発明の第3の実施の形態の代
表画像生成装置によれば、映像の撮影および編集時に、
制作者の意図を反映する映像時間配分の面で最も重点が
置かれたシーンの絵をインデクス静止画とすることがで
き、動画の中身を的確に表すインデクス画像を提示でき
る代表画像生成装置を提供することができる。
【0027】(第4の実施の形態)図6は、本発明の第
4の実施の形態に係る代表画像生成装置の構成を示すも
のである。図6において代表画像生成装置は、あらかじ
め撮影し蓄積しておいた動画を読み出して提供できるよ
うにした動画入力手段1と、提供された動画をフレーム
単位で格納するフレームメモリ2と、フレームメモリ2
に格納された対象動画の全フレーム、または一部のフレ
ームを読み出し、そのうちフレーム特徴量(何らかのパ
ラメータ値)を抽出する特徴量パラメータ抽出手段14
と、抽出した特徴量パラメータから特徴量の大きさを計
算する特徴量計算手段15と、計算した特徴量の大きさの
うち最大のものを記憶する最大特徴量記憶手段16と、最
大の特徴量を有するフレーム画像をインデクスすべきフ
レーム画像であると決定するインデクス静止画決定手段
7と、決定されたインデクス静止画を出力するインデク
ス静止画出力手段8とから構成されている。上記構成に
おいて、動画入力手段1から取り出された動画は、フレ
ームメモリ2と、インデクス静止画決定手段7にそれぞ
れ入力される。
【0028】代表画像が決定される過程を上記動画入力
手段1から取り出される連続するフレーム画像について
説明する。すなわち、上記特徴量パラメータ抽出手段14
は、読み出された対象動画の全フレーム、または一部の
フレームのうち、フレーム特徴量(何らかのパラメータ
値)を抽出する。つぎに、上記特徴量計算手段15は、抽
出した特徴量パラメータからその特徴量の大きさを計算
する。そして、上記最大特徴量記憶手段16は、計算され
た特徴量の大きさのうち最大のものを記憶する。上記イ
ンデクス静止画決定手段7は、最大の特徴量を呈するフ
レーム画像をインデクスすべきフレーム画像であるとし
て代表画像を決定する。
【0029】このように本発明の第4の実施の形態の代
表画像生成装置によれば、例えば、音量が最大のフレー
ム、動き量が大きいフレーム、最も絵柄が複雑なフレー
ム、赤色が極端に多いフレームなど、最大の特徴量を有
するフレーム画像をインデクス静止画とすることがで
き、動画の中身を的確に表すインデクス画像を提示でき
る代表画像生成装置を提供することができる。なお、上
記例では、最大の特徴量を有するフレーム画像に着目し
てインデクス画像を決定したが、これとは反対に、最小
の特徴量を有するフレーム画像に着目してインデクス画
像を決定してもよい。また、MPEGなどの圧縮動画の
場合、圧縮動画データに含まれる特徴量パラメータによ
り、フレームの動き量、複雑度など、これらの特徴量を
得ることができることが多いため、その場合は、処理時
間を大きく削減できる。
【0030】(第5の実施の形態)図7は、本発明の第
5の実施の形態に係る代表画像生成装置の構成を示すも
のである。図7において代表画像生成装置は、あらかじ
め撮影し蓄積しておいた動画を読み出して提供できるよ
うにした動画入力手段1と、提供された動画をフレーム
単位で格納するフレームメモリ2と、フレームメモリ2
に格納された対象動画の全フレーム、または一部のフレ
ームを読み出し、そのうち、フレーム特徴量(何らかの
パラメータ値)を抽出する特徴量パラメータ抽出手段14
と、抽出した特徴量パラメータから特徴量の大きさを計
算する特徴量計算手段15と、計算された特徴量の大きさ
が規定の値以上になった時点を判定する特徴量判定手段
17と、規定の値を越えたフレーム画像をインデクスすべ
きフレーム画像であると決定するインデクス静止画決定
手段7と、決定されたインデクス静止画を出力するイン
デクス静止画出力手段8とから構成されている。上記構
成において、動画入力手段1から取り出された動画は、
フレームメモリ2と、インデクス静止画決定手段7にそ
れぞれ入力される。
【0031】代表画像が決定される過程を上記動画入力
手段1から取り出される連続するフレーム画像について
説明する。すなわち、上記特徴量パラメータ抽出手段14
は、対象動画のフレーム(例えば先頭フレーム)から順
に走査していき、フレーム特徴量(何らかのパラメータ
値、例えば輝度情報)について抽出する。つぎに、上記
特徴量計算手段15は、抽出した特徴量パラメータからそ
の特徴量、例えば輝度情報の大きさを計算する。そし
て、上記特徴量判定手段17は、計算された特徴量例えば
輝度情報の大きさがあらかじめ設定されている規定の値
を越えた時点を判定する。上記インデクス静止画決定手
段7は、規定の値(閾値)を越えた時点のフレーム画像
をインデクスとして相応しいフレーム画像であるとして
代表画像を決定する。そしてそれを出力するようにす
る。
【0032】このように本発明の第5の実施の形態の代
表画像生成装置によれば、通常、動画の先頭画像や動画
途中のシーン変化点の先頭画像は、黒く内容がないフレ
ーム画像であることが多いけれども、フレーム特徴量、
例えば輝度情報がある閾値を越えた時点のフレーム画像
を代表画像としているので、真っ黒なインデクス静止画
を生成してしまうことを避けることができ、動画の中身
を的確に表すインデクス画像を提示できる代表画像生成
装置を提供することができる。
【0033】(第6の実施の形態)図8は、本発明の第
6の実施の形態に係る代表画像生成装置の構成を示すも
のである。図8において代表画像生成装置は、あらかじ
め撮影し蓄積しておいた動画を読み出して提供できるよ
うにした動画入力手段1と、提供された動画をフレーム
単位で格納するフレームメモリ2と、フレームメモリ2
に格納されたフレーム単位の画像データを順に(或いは
飛び飛びに)走査しながら物体を検出する物体検出手段
18と、物体が検出された時点でその物体がフレーム画像
の特定領域(例えば中心付近)で検出されたかどうかを
判定する検出物体判定手段19と、検出物体判定手段19で
物体が検出された時点のフレーム画像をインデクスすべ
きフレーム画像であると決定するインデクス静止画決定
手段7と、決定されたインデクス静止画を出力するイン
デクス静止画出力手段8とから構成されている。上記構
成において、動画入力手段1から取り出された動画は、
フレームメモリ2と、インデクス静止画決定手段7にそ
れぞれ入力される。
【0034】代表画像が決定される過程を上記動画入力
手段1から取り出される連続するフレーム画像について
説明する。すなわち、上記物体検出手段18は、対象動画
のフレーム(例えば先頭フレーム)から順に(或いは飛
び飛びに)走査しながら、例えば明るさの濃度データの
積算値の変化に基づいて物体を検出する。上記検出物体
判定手段19は、物体が検出された領域が画像の特定領域
(例えば、中心付近)にあるかどうかを判定する。そし
て上記インデクス静止画決定手段7は、上記検出物体判
定手段19の判定結果に基づいてその時点のフレーム画像
をインデクスとして相応しいフレーム画像であるとして
代表画像を決定する。上記インデクス静止画出力手段8
は、決定されたフレーム画像を出力する。
【0035】このように本発明の第6の実施の形態の代
表画像生成装置によれば、通常、動画の先頭画像や動画
途中のシーン変化点の先頭画像は、動画の対象目的とな
る人物や物体が表示されていないフレームであることが
多いけれども、画像の特定領域(例えば、中心付近)に
物体があると判定された時点では動画の対象目的となる
人物や物体の画像が検出されたことになることから、特
定領域に人物や物体の画像を判定する検出物体判定手段
を備えることにより、人物や物体がフレーム領域の特定
位置に表示された時点のフレーム画像を代表画像とする
ことができ、動画の中身を的確に表すインデクス画像を
提示できる代表画像生成装置を提供することができる。
【0036】(第7の実施の形態)図9は、本発明の第
7の実施の形態に係る代表画像生成装置の構成を示すも
のである。図9において本発明の第7の実施の形態に係
る代表画像生成装置は、あらかじめ撮影し蓄積しておい
た動画を読み出して提供できるようにした動画入力手段
1と、提供された動画をフレーム単位で格納するフレー
ムメモリ2と、フレームメモリ2に格納されたフレーム
単位の画像データを順に(或いは飛び飛びに)走査しな
がら字幕スーパーやテロップを検出するテロップ検出手
段20と、検出した字幕スーパーやテロップを記憶するテ
ロップ情報記憶手段21と、テロップが検出された時点の
字幕スーパーやテロップが挿入されたフレーム画像をイ
ンデクスすべき画像であると決定するインデクス静止画
決定手段7と、決定されたインデクス静止画に対してテ
ロップ情報記憶手段21に記憶されたテロップ情報をもと
に、例えばインデクス静止画でもテロップが確実に読み
取れるようにテロップを拡大して表示できるようインデ
クス静止画を加工するインデクス静止画加工手段22と、
加工されたインデクス静止画を出力するインデクス静止
画出力手段8とから構成されている。上記構成におい
て、動画入力手段1から取り出された動画は、フレーム
メモリ2と、インデクス静止画決定手段7にそれぞれ入
力される。
【0037】代表画像が決定される過程を上記動画入力
手段1から取り出されるフレーム画像について説明す
る。すなわち、上記テロップ検出手段20が対象動画のあ
るフレーム(先頭フレーム)から順に(或いは飛び飛び
に)走査しながら字幕スーパーやテロップを検出する。
テロップの検出技術それ自体は公知なので、ここでは詳
述しない。次に、上記テロップ情報記憶手段21は、検出
した字幕スーパーやテロップを記憶する。テロップが記
憶されたことを受けて、上記インデクス静止画決定手段
7は、テロップが検出された時点のフレーム画像をイン
デクスすべき画像であると決定する。決定されたインデ
クス静止画は上記インデクス静止画加工手段22に与えら
れ、上記テロップ情報記憶手段21に記憶されたテロップ
情報をもとにテロップ情報の加工、すなわちインデクス
静止画でもテロップが確実に読み取れるように例えばテ
ロップを拡大して表示できるよう加工する。そして上記
インデクス静止画出力手段8よりインデクス静止画を出
力する。
【0038】このように本発明の第7の実施の形態の代
表画像生成装置によれば、映像編集者により説明用キャ
プションが入れられたフレーム画像がインデクス静止画
となるので、動画がニュース素材、ニュース番組、教育
用動画素材であるような場合には、代表画像として相応
しいものを代表画像に簡単に生成できるので、動画の中
身を的確に表すインデクス画像を提示できる代表画像生
成装置を提供することができる。
【0039】(第8の実施の形態)図10は、本発明の
第8の実施の形態に係る代表画像生成装置の構成を示す
ものである。図10において本発明の第8の実施の形態
に係る代表画像生成装置は、あらかじめ撮影し蓄積して
おいた動画を読み出して提供できるようにした動画入力
手段1と、提供された動画をフレーム単位で格納するフ
レームメモリ2と、フレームメモリ2に格納されたフレ
ーム単位の画像データを読み出してカット(1纏まりの
映像データ)を検出するカット検出手段3と、各カット
のカット長を計算するカット長計算手段4と、計算され
たカット長を記憶するカット長記憶手段5と、記憶され
たカット長の中から最も長いカット長を有するカットを
決定する最長カット決定手段6と、最も長いカット長を
有するカットにおいてズーム、パン、チルトなどのカメ
ラ操作を抽出するカメラ操作抽出手段23と、カメラ操作
が施されたフレーム画像の前後のフレームを記憶するカ
メラ操作情報記憶手段24と、記憶された前後フレーム画
像の中から1フレームを選択してインデクスすべき画像
を決定するインデクス静止画決定手段7と、決定された
インデクス静止画を出力するインデクス静止画出力手段
8とから構成されている。上記構成において、動画入力
手段1から取り出された動画は、フレームメモリ2と、
カメラ操作抽出手段23にそれぞれ入力される。
【0040】代表画像が決定される過程を上記動画入力
手段1から取り出される連続するフレーム画像について
説明する。すなわち、上記カメラ操作抽出手段23は最も
長いカット長を有するカットにおいてズーム、パン、チ
ルトなどのカメラ操作を抽出する。上記カメラ操作情報
記憶手段24は、カメラ操作が施されたフレーム画像の前
後のフレーム画像を記憶する。ズーム、パン、チルトな
どのカメラ操作の検出技術それ自体は公知なので、ここ
では詳述しない。次に、上記インデクス静止画決定手段
7は、記憶された前後フレームの中から1フレーム、例
えばズームアップ直後のフレーム画像を選択しインデク
スとして相応しいフレーム画像を決定する。そして上記
インデクス静止画出力手段8よりインデクス静止画を出
力する。
【0041】このように本発明の第8の実施の形態の代
表画像生成装置によれば、映像の撮影および編集時に、
カット時間やカット数量の面で最も重点が置かれたシー
ンで、かつカメラ操作による効果の面で最も重点が置か
れたシーンの絵がインデクス静止画となるので、動画の
中身を的確に表すインデクス画像を提示できる代表画像
生成装置を提供することができる。
【0042】(第9の実施の形態) 図11は、本発明の第9の実施の形態に係る代表画像生
成装置の構成を示すものである。図11において本発明
の第9の実施の形態に係る代表画像生成装置は、あらか
じめ撮影し蓄積しておいた動画を読み出して提供できる
ようにした動画入力手段1と、提供された動画をフレー
ム単位で格納するフレームメモリ2と、フレームメモリ
2に格納されたフレーム単位の画像データを読み出して
カット(1纏まりの映像データ)を検出するカット検出
手段3と、各カットのカット長を計算するカット長計算
手段4と、計算されたカット長を記憶するカット長記憶
手段5と、記憶された各カット長からカット長の短いカ
ットが連続する短カット区間をそれぞれ一つのシーンと
し、前記シーンの中から最長の短カット区間を最も長い
シーン長を有する最長シーンとして決定する最長シーン
決定手段25と、前記最長シーンから代表フレーム画像を
インデクス静止画として決定するインデクス静止画決定
手段7と、決定されたインデクス静止画を出力するイン
デクス静止画出力手段8とから構成されている。上記構
成において、動画入力手段1から取り出された動画は、
フレームメモリ2と、インデクス静止画決定手段7にそ
れぞれ入力される。
【0043】図12を用いて代表画像が決定される過程
を上記動画入力手段1から取り出される動画のフレーム
画像開始点から始まる複数のカットの例で説明する。す
なわち、上記カット検出手段3は、カット変化点に着目
してカットの開始点を把握する。さらに、上記カット長
計算手段4は、各カットの長さを計算する。そして、上
最長シーン決定手段25は、記憶された各カット長から
カット長の短いカットが連続する短カット区間をそれぞ
れ一つのシーンとし、前記シーンの中から最長の短カッ
ト区間を最も長いシーン長を有する最長シーンとして
定する。そして、上記インデクス静止画決定手段7は、
最長シーンの先頭から一定割合にあるフレーム画像、例
えば最長シーンの先頭から30%近傍の位置にあるフレー
ム画像を代表画像と決定する。そのように決定する理由
は、上記のような動画例においてその動画の中で最長の
短カット区間、すなわち最長シーンは、映像の撮影およ
び編集時に、カット数量の面で最も重点が置かれたシー
ンの絵であってこれを視聴覚者に印象付けるために制作
者が多用するという経験則に基づくものである。
【0044】このように本発明の第9の実施の形態の代
表画像生成装置によれば、映像の撮影および編集時に、
カット数量の面で最も重点が置かれたシーンの絵をイン
デクス静止画すなわち代表画像とすることができ、動画
が映画やドラマ映像のような場合に動画の中身を的確に
表すインデクス画像を提示できる代表画像生成装置を提
供することができる。
【0045】(第10の実施の形態) 図13は、本発明の第10の実施の形態に係る代表画像
生成装置の構成を示すものである。図13において本発
明の第10の実施の形態の代表画像生成装置は、あらか
じめ撮影し蓄積しておいた動画を読み出して提供できる
ようにした動画入力手段1と、提供された動画をフレー
ム単位で格納するフレームメモリ2と、フレームメモリ
2に格納されたフレーム単位の画像データを一定間隔区
間毎に1フレームずつ読み出す一定間隔区間フレーム抽
出手段13と、抽出した複数のフレーム間で似ている映像
の区間を纏めることによりシーンを構成するシーン構成
手段9と、構成したシーンの長さを計算するシーン長計
算手段10と、計算したシーン長を記憶するシーン長記憶
手段11と、記憶された各シーン長からシーン長の短いシ
ーンが連続する短シーン区間の中から最長の短シーン区
間を最長短シーン区間として決定する短シーン区間決定
手段26と、前記最長短シーン区間から代表フレーム画像
インデクス静止画として決定するインデクス静止画決
定手段7と、決定されたインデクス静止画を出力するイ
ンデクス静止画出力手段8とから構成されている。上記
構成において、動画入力手段1から取り出される動画
は、フレームメモリ2と、シーン構成手段9と、インデ
クス静止画決定手段7にそれぞれ入力される。
【0046】代表画像が決定される過程を上記動画入力
手段1から取り出される動画のフレーム画像開始点から
一定間隔区間毎に1フレーム画像ずつ取り出されるフレ
ーム画像について説明する。すなわち、上記一定間隔区
間フレーム抽出手段13は、一定間隔区間毎に1フレーム
画像ずつフレーム画像を取り出す。上記シーン構成手段
9は、取り出された複数のフレーム画像間で似ている画
像の区間を纏めることによりシーンを構成する。上記シ
ーン長計算手段10は、各シーンの長さを計算する。そし
て、上記短シーン区間決定手26は、シーン長の短いシー
ンが連続する短シーン区間の中から最長の短シーン区間
を決定する。そして、上記インデクス静止画決定手段7
は、最長の短シーン区間の先頭から一定割合にあるフレ
ーム画像、例えば決定された短シーン区間の先頭から30
%近傍の位置にあるフレーム画像を代表画像と決定す
る。そのように決定する理由は、上記のような動画例に
おいてその動画の中で最長の短シーン区間は、映像の撮
影および編集時に、シーン数量の面で最も重点が置かれ
シーン区間の絵であってこれを視聴覚者に印象付け
るために制作者が多用するという経験則に基づくもので
ある。なお、上記したようにフレーム間の類似を判定す
る技術は公知なので、その技術を利用すればよい。
【0047】このように本発明の第10の実施の形態の
代表画像生成装置によれば、映像の撮影および編集時
に、シーン数量の面で最も重点が置かれた短シーンの絵
をインデクス静止画すなわち代表画像とすることがで
き、動画が映画やドラマ映像のような場合に動画の中身
を的確に表すインデクス画像を提示できる代表画像生成
装置を提供することができる。
【0048】なお、以上の実施の形態では、静止画が代
表画像となる例について説明したが、代表画像を静止画
に限定する必要はなく、動画像を代表画像とすることも
できることを付け加えておく。
【0049】
【発明の効果】以上のように本発明によれば、動画の中
身を的確に表すインデクスとなる画像を提示できる代表
画像生成装置を提供することができるという優れた効果
が得られる。
【0050】さらに念のため、本発明の請求項毎にその
効果を記載すると、請求項乃至請求項に記載の発明
によれば、映像の撮影および編集時に、制作者の意図を
反映する映像時間配分の面で最も重点が置かれたシーン
の絵をインデクス静止画とすることができ、動画の中身
を的確に表すインデクス画像を提示できる代表画像生成
装置を提供することができる。
【0051】
【0052】
【0053】
【0054】
【0055】
【0056】請求項に記載の発明によれば、映像の撮
影および編集時に、カット数量の面で最も重点が置かれ
たシーンの絵をインデクス静止画すなわち代表画像とす
ることができ、動画が映画やドラマ映像のような場合に
動画の中身を的確に表すインデクス画像を提示できる代
表画像生成装置を提供することができる。
【0057】請求項に記載の発明によれば、映像の撮
影および編集時に、シーン数量の面で最も重点が置かれ
た短シーン区間の絵をインデクス静止画すなわち代表画
像とすることができ、動画が映画やドラマ映像のような
場合に動画の中身を的確に表すインデクス画像を提示で
きる代表画像生成装置を提供することができる。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態に係る代表画像生成
装置の構成を示す図、
【図2】本発明の第1の実施の形態に係る代表画像生成
装置の動作を説明するための図、
【図3】本発明の第2の実施の形態に係る代表画像生成
装置の構成を示す図、
【図4】本発明の第2の実施の形態に係る代表画像生成
装置の動作を説明するための図、
【図5】本発明の第3の実施の形態に係る代表画像生成
装置の構成を示す図、
【図6】本発明の第4の実施の形態に係る代表画像生成
装置の構成を示す図、
【図7】本発明の第5の実施の形態に係る代表画像生成
装置の構成を示す図、
【図8】本発明の第6の実施の形態に係る代表画像生成
装置の構成を示す図、
【図9】本発明の第7の実施の形態に係る代表画像生成
装置の構成を示す図、
【図10】本発明の第8の実施の形態に係る代表画像生
成装置の構成を示す図、
【図11】本発明の第9の実施の形態に係る代表画像生
成装置の構成を示す図、
【図12】本発明の第9の実施の形態に係る代表画像生
成装置の動作を説明するための図、
【図13】本発明の第10の実施の形態に係る代表画像
生成装置の構成を示す図である。
【符号の説明】
1 動画入力手段 2 フレームメモリ 3 カット検出手段 4 カット長計算手段 5 カット長記憶手段 6 最長カット決定手段 7 インデクス静止画決定手段 8 インデクス出力手段 9 シーン構成手段 10 シーン長計算手段 11 シーン長記憶手段 12 最長シーン決定手段 13 一定間隔区間フレーム抽出手段 14 特徴量パラメータ抽出手段 15 特徴量計算手段 16 最大特徴量記憶手段 17 特徴量判定手段 18 物体検出手段 19 検出物体判定手段 20 テロップ抽出手段 21 テロップ情報記憶手段 22 インデクス静止画加工手段 23 カメラ操作抽出手段 24 カメラ操作情報記憶手段 25 最長シーン決定手段 26 短シーン区間決定手段
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平8−191411(JP,A) 特開 平8−32924(JP,A) 特開 平9−233422(JP,A) 特開 平7−111630(JP,A) 特開 平6−149902(JP,A) 特開 平6−89549(JP,A) 特開 平6−113253(JP,A) (58)調査した分野(Int.Cl.7,DB名) H04N 5/76 - 5/956

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】 あらかじめ撮影し蓄積しておいた動画を
    読み出して提供できるようにした動画入力手段と、提供
    された動画をフレーム単位で格納するフレームメモリ
    と、該フレームメモリに格納されたフレーム単位の画像
    データを読み出してカットを検出するカット検出手段
    と、各カットのカット長を計算するカット長計算手段
    と、計算されたカット長を記憶するカット長記憶手段
    と、カット間で似ている絵などのカットを纏めて映像シ
    ーンを構成するシーン構成手段と、構成したシーンの長
    さを計算するシーン長計算手段と、計算したシーン長を
    記憶するシーン長記憶手段と、記憶されたシーン長から
    最も長いシーン長を有するシーンを最長シーンとして
    定する最長シーン決定手段と、前記最長シーンから代表
    フレーム画像をインデクス静止画として決定するインデ
    クス静止画決定手段と、決定されたインデクス静止画を
    出力するインデクス静止画出力手段とから構成されるこ
    とを特徴とする代表画像生成装置。
  2. 【請求項2】 あらかじめ撮影し蓄積しておいた動画を
    読み出して提供できるようにした動画入力手段と、提供
    された動画をフレーム単位で格納するフレームメモリ
    と、該フレームメモリに格納されたフレーム単位の画像
    データを一定間隔区間毎に1フレームずつ読み出す一定
    間隔区間フレーム抽出手段と、抽出した複数のフレーム
    間で似ている映像の区間を纏めることによりシーンを構
    成するシーン構成手段と、構成したシーンの長さを計算
    するシーン長計算手段と、計算したシーン長を記憶する
    シーン長記憶手段と、記憶された各シーン長から最も長
    いシーン長を有するシーンを最長シーンとして決定する
    最長シーン決定手段と、前記最長シーンから代表フレー
    ム画像をインデクス静止画として決定するインデクス静
    止画決定手段と、決定されたインデクス静止画を出力す
    るインデクス静止画出力手段とから構成されることを特
    徴とする代表画像生成装置。
  3. 【請求項3】 あらかじめ撮影し蓄積しておいた動画を
    読み出して提供できるようにした動画入力手段と、提供
    された動画をフレーム単位で格納するフレームメモリ
    と、該フレームメモリに格納されたフレーム単位の画像
    データを読み出してカットを検出するカット検出手段
    と、各カットのカット長を計算するカット長計算手段
    と、計算されたカット長を記憶するカット長記憶手段
    と、記憶された各カット長からカット長の短いカットが
    連続する短カット区間をそれぞれ一つのシーンとし、前
    記シーンの中から最長の短カット区間を最も長いシーン
    長を有する最長シーンとして決定する最長シーン決定手
    段と、前記最長シーンから代表フレーム画像をインデク
    ス静止画として決定するインデクス静止画決定手段と、
    決定されたインデクス静止画を出力するインデクス静止
    画出力手段とから構成されることを特徴とする代表画像
    生成装置。
  4. 【請求項4】 あらかじめ撮影し蓄積しておいた動画を
    読み出して提供できるようにした動画入力手段と、提供
    された動画をフレーム単位で格納するフレームメモリ
    と、該フレームメモリに格納されたフレーム単位の画像
    データを一定間隔区間毎に1フレームずつ読み出す一定
    間隔区間フレーム抽出手段と、抽出した複数のフレーム
    間で似ている映像の区間を纏めることによりシーンを構
    成するシーン構成手段と、構成したシーンの長さを計算
    するシーン長計算手段と、計算したシーン長を記憶する
    シーン長記憶手段と、記憶された各シーン長からシーン
    長の短いシーンが連続する短シーン区間の中から最長の
    短シーン区間を最長短シーン区間として決定する短シー
    ン区間決定手段と、前記最長短シーン区間から代表フレ
    ーム画像をインデクス静止画として決定するインデクス
    静止画決定手段と、決定されたインデクス静止画を出力
    するインデクス静止画出力手段とから構成されることを
    特徴とする代表画像生成装置。
JP30954897A 1997-10-24 1997-10-24 代表画像生成装置 Expired - Fee Related JP3534592B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP30954897A JP3534592B2 (ja) 1997-10-24 1997-10-24 代表画像生成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP30954897A JP3534592B2 (ja) 1997-10-24 1997-10-24 代表画像生成装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2003138472A Division JP2003298983A (ja) 2003-05-16 2003-05-16 代表画像生成装置

Publications (2)

Publication Number Publication Date
JPH11136637A JPH11136637A (ja) 1999-05-21
JP3534592B2 true JP3534592B2 (ja) 2004-06-07

Family

ID=17994347

Family Applications (1)

Application Number Title Priority Date Filing Date
JP30954897A Expired - Fee Related JP3534592B2 (ja) 1997-10-24 1997-10-24 代表画像生成装置

Country Status (1)

Country Link
JP (1) JP3534592B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000350156A (ja) * 1999-06-09 2000-12-15 Hitachi Ltd 動画像情報の記憶方法及びこれを記録した記録媒体
US7145601B2 (en) 2000-01-14 2006-12-05 Fuji Photo Film Co., Ltd. Multi-modal reproducing apparatus and digital camera
JP4778158B2 (ja) * 2001-05-31 2011-09-21 オリンパス株式会社 画像選出支援装置
US7574655B2 (en) * 2004-05-03 2009-08-11 Microsoft Corporation System and method for encapsulation of representative sample of media object
JP4474529B2 (ja) * 2004-11-29 2010-06-09 独立行政法人産業技術総合研究所 作業状況記録装置、その記録方法及び記録プログラム
JP4854339B2 (ja) * 2006-03-08 2012-01-18 三洋電機株式会社 映像再生装置
JP2012105205A (ja) * 2010-11-12 2012-05-31 Nikon Corp キーフレーム抽出装置、キーフレーム抽出プログラム、キーフレーム抽出方法、撮像装置、およびサーバ装置
US10984248B2 (en) 2014-12-15 2021-04-20 Sony Corporation Setting of input images based on input music

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0689549A (ja) * 1992-09-08 1994-03-29 Pioneer Electron Corp 画像再生表示装置および記録媒体
JP3163784B2 (ja) * 1992-09-30 2001-05-08 ソニー株式会社 画像表示方法
JPH06149902A (ja) * 1992-11-09 1994-05-31 Matsushita Electric Ind Co Ltd 動画像記録媒体、動画像記録装置、及び動画像再生装置
JPH07111630A (ja) * 1993-10-14 1995-04-25 Matsushita Electric Ind Co Ltd 動画像編集装置及びカット統合方法
JP3194837B2 (ja) * 1994-07-19 2001-08-06 日本電信電話株式会社 代表画面抽出方法および装置
JPH08191411A (ja) * 1994-11-08 1996-07-23 Matsushita Electric Ind Co Ltd シーン判別方法および代表画像記録・表示装置
JP3131560B2 (ja) * 1996-02-26 2001-02-05 沖電気工業株式会社 動画像処理システムにおける動画像情報検出装置

Also Published As

Publication number Publication date
JPH11136637A (ja) 1999-05-21

Similar Documents

Publication Publication Date Title
US6930687B2 (en) Method of displaying a digital image
EP1986128B1 (en) Image processing apparatus, imaging apparatus, image processing method, and computer program
US7383509B2 (en) Automatic generation of multimedia presentation
EP0729117B1 (en) Method and apparatus for detecting a point of change in moving images
US7912303B2 (en) Apparatus and method for generating thumbnail images
US8253794B2 (en) Image processing apparatus and image display method
CN107430780B (zh) 用于基于视频内容特性的输出创建的方法
US8174571B2 (en) Apparatus for processing images, apparatus for processing reproduced images, method of processing images, and method of processing reproduced images
KR20030026529A (ko) 키프레임 기반 비디오 요약 시스템
KR20110043612A (ko) 이미지 처리
JP2006245646A (ja) 画像再生装置及び画像再生プログラム、並びにフォトムービー作成装置及びフォトムービー作成プログラム
WO2008040150A1 (en) Method and device for adaptive video presentation
JP3534592B2 (ja) 代表画像生成装置
JP2009044463A (ja) 電子カメラ及び被写界像再生装置
JP3649468B2 (ja) 撮影機能付き電子アルバムシステム
EP1308861A2 (en) Image processing apparatus displaying a catalog of different types of data in a different manner
JP2007036737A (ja) 画像表示装置
US20030202110A1 (en) Arrangement of images
US7982792B2 (en) Image processing apparatus
JPH11134352A (ja) 動画像表示方法
JP3327520B2 (ja) Ng警告機能付き撮影方法、ng警告機能付き撮影装置および撮影プログラムを記録した記録媒体
JP2004080156A (ja) 画像処理装置、画像処理方法、プログラム及び記録媒体並びに画像処理システム
US7747130B2 (en) Apparatus and method for extracting representative still images from MPEG video
JP2000261757A (ja) 編集用映像区間分類方法及び装置、並びにこの方法を記録した記録媒体
JPH07236153A (ja) 動画像のカット点検出およびカット画面グループ検出装置

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040309

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040309

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees