JP2011119936A - 撮影装置及び再生方法 - Google Patents

撮影装置及び再生方法 Download PDF

Info

Publication number
JP2011119936A
JP2011119936A JP2009274909A JP2009274909A JP2011119936A JP 2011119936 A JP2011119936 A JP 2011119936A JP 2009274909 A JP2009274909 A JP 2009274909A JP 2009274909 A JP2009274909 A JP 2009274909A JP 2011119936 A JP2011119936 A JP 2011119936A
Authority
JP
Japan
Prior art keywords
still image
unit
attribute information
information
instruction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009274909A
Other languages
English (en)
Inventor
Sunako Asayama
砂子 朝山
Yoshihiro Morioka
芳宏 森岡
Hiroyuki Kamezawa
裕之 亀澤
Masashi Nosaka
昌史 野阪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Original Assignee
Panasonic Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp filed Critical Panasonic Corp
Priority to JP2009274909A priority Critical patent/JP2011119936A/ja
Publication of JP2011119936A publication Critical patent/JP2011119936A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Studio Devices (AREA)

Abstract

【課題】自動的に撮影された静止画像を再生する場合に、所望する静止画像を効率的に選択して再生する。
【解決手段】動画像の撮影中に静止画像を撮影し、撮影した静止画像を再生する撮影装置の一例であるビデオカメラ100であって、動画像を撮影するとともに、当該動画像の撮影中に静止画像を撮影する撮像部110と、撮像部110によって撮影された動画像及び静止画像の少なくとも一方の撮影状況を示す1種類以上の属性情報を生成する属性情報生成部120と、撮像部110によって撮影された静止画像と、属性情報生成部120によって生成された属性情報とを対応付けてメモリ160に記録する記録部130と、属性情報の種類を選択するための指示を受け付ける受付部140と、受付部140によって受け付けられた指示に対応する種類の属性情報に対応付けられた静止画像をメモリ160から読み出して再生する再生部150とを備える。
【選択図】図3A

Description

本発明は、動画と静止画との両方を撮影する撮影装置に関するものであり、特に、動画撮影中に撮影した静止画を再生する技術に関するものである。
ビデオカメラ等の撮影装置において、動画撮影中に並行して静止画を撮影する機能が実現されている。このような撮影装置では、ユーザーが動画撮影中に静止画撮影ボタン等を押すことで、動画と共に静止画も同時に撮影、及び記録することができる。
また、動画撮影中に、静止画を自動的に撮影する機能も考案されている。
例えば、特許文献1には、連続して撮像された複数の画像を評価し、評価結果に基づいて画像を記録するか否かを判断する撮像装置が開示されている。特許文献1に記載の撮像装置によれば、例えば、外部の閃光等の影響を受けた画像を自動的に除外して、残りの画像を記録することができる。
また、特許文献2には、動画像の撮影時に実行されるズーム操作情報、加速度センサによる検出情報によって解析されるパン・ティルト処理情報、入力音声信号のレベル情報、GPS(Global Positioning System)から入力する位置情報、クロック情報に基づいて識別される特定の記念日などの情報、又は、静止画撮影情報などの情報に基づいて重要シーン部分を判定し、重要シーン部分を識別可能なハイライトポイント情報を生成して、撮影画像データに対応付けて記録する撮像装置が開示されている。特許文献2に記載の撮像装置によれば、撮影後にハイライトポイント情報を利用して、重要シーン部分の再生を容易に行うことができる。
特開2007−306225号公報 特開2007−134770号公報
しかしながら、上記従来技術によって動画撮影中に自動的に撮影された静止画を再生する場合、必ずしも視聴者が見たい静止画ばかりを再生することができるとは限らないという課題がある。
例えば、特許文献1及び2に記載の撮像装置によれば、様々な要因に基づいて画像を記録している。したがって、自動撮影された全ての静止画を順に再生する場合、撮影した静止画にはカメラワークが優れていて撮影されたカテゴリーの静止画、及び、笑顔認識されて撮影されたカテゴリーの静止画等が混在しているため、視聴者が見たいと考えるカテゴリーの静止画ばかりとは限らない。また、撮影した静止画の枚数が多い場合には、視聴者が所望する以上に再生時間が長くなってしまう場合もある。こういう状況は、自動撮影で保存したい静止画と、再生したい静止画とは必ずしも一致しないために起こるものである。
また、視聴者が、所望する静止画のみを見ようとして、従来実現されている静止画一覧等から再生したい静止画を選択して再生する再生方法を用いることもできる。しかしながら、視聴者は見たい静止画を静止画一覧から1枚ずつ選択する必要があるため使い勝手が良くない。
そこで、本発明は、上記課題を解決するためになされたものであって、所望する静止画像を効率良く選択して再生することができる撮影装置を提供することを目的とする。
上記課題を解決するために、本発明に係る撮影装置は、動画像の撮影中に静止画像を撮影し、撮影した静止画像を再生する撮影装置であって、前記動画像を撮影するとともに、当該動画像の撮影中に静止画像を撮影する撮像部と、前記撮像部によって撮影された動画像及び静止画像の少なくとも一方の撮影状況を示す1種類以上の属性情報を生成する属性情報生成部と、前記撮像部によって撮影された静止画像と、前記属性情報生成部によって生成された属性情報とを対応付けてメモリに記録する記録部と、前記属性情報の種類を選択するための指示を受け付ける受付部と、前記受付部によって受け付けられた指示に対応する種類の属性情報に対応付けられた静止画像を前記メモリから読み出して再生する再生部とを備える。
これにより、ユーザーが所望する属性情報の種類の選択を受け付け、該当する属性情報に対応付けられた静止画像を再生するので、ユーザーが所望する静止画像を効率良く再生することができる。したがって、ユーザーが所望する静止画像を1枚ずつ選択させることを強いることなく、ユーザーが所望する静止画像を効率良く再生することができる。
また、前記属性情報生成部は、前記撮像部によって撮影された静止画像の撮影状況を示す属性情報をフレーム毎に生成してもよい。
これにより、静止画像1枚1枚に属性情報を対応付けて記録することができるので、ユーザーが所望する静止画像を的確に選択することができる。
また、前記属性情報は、前記動画像及び前記静止画像の少なくとも一方の撮影中における、前記撮影装置の動作を示す動作情報と、被写体の特徴を示す被写体情報と、前記動作情報及び前記被写体情報の評価値との少なくとも1つを含み、前記受付部は、前記動作情報と前記被写体情報と前記評価値との少なくとも1つを選択するための指示を受け付けてもよい。
これにより、撮影装置の動作、被写体の特徴、及びこれらの評価が静止画像に対応付けられるので、より多くの情報に基づいて静止画像の選択を行うことが可能となり、よりユーザーが所望する静止画像を的確に選択することができる。
また、前記受付部は、前記評価値が予め定められた閾値より高い静止画像を選択するための第1指示を受け付け、前記再生部は、前記受付部が前記第1指示を受け付けた場合、前記閾値より高い評価値が対応付けられた静止画像を再生してもよい。
これにより、評価値が高い静止画像を選択することができるので、よりユーザーが所望する静止画像を選択することができる。
また、前記属性情報は、前記被写体情報として、対応付けられた静止画像に人物が写っていることを示す人物情報を含み、前記受付部は、人物が写っている静止画像を選択するための第2指示を受け付け、前記再生部は、前記受付部が前記第2指示を受け付けた場合、前記人物情報が対応付けられた静止画像を再生してもよい。
これにより、人物が写っている静止画像を選択することができるので、よりユーザーが所望する静止画像を選択することができる。
また、前記記録部は、さらに、前記撮像部によって撮影された静止画像に、予め定められた人物を示す特定人物情報を対応付けて、前記メモリに記録し、前記受付部は、前記第2指示を受け付けた場合、さらに、予め定められた1人の人物を選択するための第3指示を受け付け、前記再生部は、前記人物情報が対応付けられた静止画像のうち、前記受付部によって受け付けられた第3指示に対応する特定人物情報が対応付けられた静止画像を再生してもよい。
これにより、特定の人物が写っている静止画像を選択することができるので、よりユーザーが所望する静止画像を選択することができる。
また、前記記録部は、さらに、前記撮像部によって撮影された静止画像に、予め定められた複数の人物を示す複数の特定人物情報を対応付けて、前記メモリに記録し、前記受付部は、前記第2指示を受け付けた場合、さらに、予め定められた複数の人物を選択するための第4指示を受け付け、前記再生部は、前記人物情報に対応付けられた静止画像のうち、前記受付部によって受け付けられた第3指示に対応する特定人物情報が対応付けられた静止画像を再生してもよい。
これにより、複数の特定の人物が写っている静止画像を選択することができるので、よりユーザーが所望する静止画像を選択することができる。
また、前記再生部は、前記受付部によって受け付けられた第4指示に対応する特定人物情報が対応付けられた静止画像のうち、複数の人物間の距離が所定の距離より小さい静止画像を再生してもよい。
これにより、写っている人物の距離が近い静止画像を選択することができるので、よりユーザーが所望する静止画像を選択することができる。人物間の距離が近い静止画像は、例えば、集合写真などのユーザーにとって重要度の高い画像である可能性が高いためである。
また、前記再生部は、前記受付部によって受け付けられた第3指示に対応する特定人物情報が対応付けられた静止画像のうち、前記予め定められた人物が予め定められた表情である静止画像を再生してもよい。
これにより、写っている人物が特定の表情(例えば、笑顔、又は目蓋が閉じられていない顔)である静止画像を選択することができるので、よりユーザーが所望する静止画像を選択することができる。
また、前記受付部は、前記動画像の属性情報に基づいて静止画像を選択するための第5指示を受け付け、前記再生部は、前記受付部が前記第5指示を受け付けた場合、前記動画像の属性情報が予め定められた条件を満たしている期間に撮影された静止画像を抽出してもよい。
これにより、静止画像の属性情報だけでなく、当該静止画像が含まれる動画像の属性情報も所定の条件を満たす静止画像を選択することができるので、よりユーザーが所望する静止画像を選択することができる。
また、前記撮影装置は、さらに、前記属性情報が対応付けられた1つ以上のメニュー項目を表示する表示部を備え、前記受付部は、前記表示部に表示された1つ以上のメニュー項目の選択を前記指示として受け付けてもよい。
これにより、選択のためのメニュー項目を表示することで、ユーザーが属性情報を容易に選択することができ、利便性が向上する。
また、本発明に係る再生方法は、動画像の撮影中に撮影した静止画像をメモリから読み出して再生する再生方法であって、前記メモリには、前記動画像の撮影中撮影された静止画像と、前記動画像及び前記静止画像の少なくとも一方の撮影状況を示す1種類以上の属性情報とが対応付けて記憶され、前記再生方法は、前記属性情報の種類を選択するための指示を受け付ける受付ステップと、前記受付ステップにおいて受け付けられた指示に対応する種類の属性情報に対応付けられた静止画像を前記メモリから読み出して再生する再生ステップとを含む。
本発明に係る撮影装置によれば、自動的に撮影された静止画像を再生する場合に、ユーザーが所望する静止画像を効率的に選択して再生することができる。
動画及び静止画像を撮影する撮影装置の一例であるビデオカメラの外観図である。 本発明の実施の形態に係るビデオカメラ内部のハードウェア構成の概略を示す図である。 本発明の実施の形態に係るビデオカメラの機能構成の一例を示すブロック図である。 本発明の実施の形態に係るビデオカメラの詳細な機能構成の一例を示すブロック図である。 本発明の実施の形態に係るビデオカメラが撮影した動画の構成を示す図である。 本発明の実施の形態に係るシーンを識別する情報の一例を示す図である。 本発明の実施の形態に係る属性情報と評価との関係の一例を示す図である。 本発明の実施の形態に係るシーン解析部が各シーンに評価を割り当てた結果を示す図である。 本発明の実施の形態に係る再生情報の情報内容の一例を示す図である。 本発明の実施の形態に係る静止画像抽出用の属性情報と評価との関係の一例を示す図である。 本発明の実施の形態に係るビデオカメラの動作のうち、動画像の撮影中に静止画像を撮影する動作の一例を示すフローチャートである。 本発明の実施の形態に係る静止画像抽出の観点から撮影したフレームを評価した結果を示す図である。 本発明の実施の形態に係る静止画像の評価に用いられた属性情報のうち評価点が高かった属性情報の一覧を示す図である。 本発明の実施の形態に係る撮影された静止画像を再生する際の操作メニュー画面の一例を示す図である。 本発明の実施の形態に係る各メニュー項目に対応する選択条件の一例を示す図である。 本発明の実施の形態に係る特定人物を選択する際の操作メニュー画面の一例を示す図である。 本発明の実施の形態に係る撮影された静止画像と人物フラグとを対応付けた表の一例を示す図である。 本発明の実施の形態に係る特定の人物が写っている静止画像を選択するための操作メニューの画面遷移の一例を示す図である。 本発明の実施の形態に係る特定人物、人物間の距離、表情の指定を選択するための操作メニュー画面の一例を示す図である。 本発明の実施の形態に係る静止画像抽出の観点からフレームを評価した結果に閾値の一例を追記した図である。 本発明の実施の形態に係る静止画像抽出の観点からフレームを評価した結果に動画の再生情報の一例を追記した図である。 本発明の実施の形態に係るビデオカメラの動作のうち、静止画像を再生する動作の一例を示すフローチャートである。
以下では、本発明に係る撮影装置の実施の形態について、図面を用いて詳細に説明する。
本実施の形態に係る撮影装置は、動画像の撮影中に静止画像を撮影し、撮影した静止画像を再生する撮影装置であって、動画像を撮影するとともに、当該動画像の撮影中に静止画像を撮影する撮像部と、撮像部によって撮影された動画像及び静止画像の少なくとも一方の撮影状況を示す1種類以上の属性情報を生成する属性情報生成部と、撮像部によって撮影された静止画像と属性情報生成部によって生成された属性情報とを対応付けてメモリに記録する記録部と、属性情報の種類を選択するための指示を受け付ける受付部と、受付部によって受け付けられた指示に対応する種類の属性情報に対応付けられた静止画像を前記メモリから読み出して再生する再生部とを備えることを特徴とする。
これにより、ユーザーが所望する属性情報の種類の選択を受け付け、該当する属性情報に対応付けられた静止画像を再生するので、本実施の形態に係る撮影装置は、ユーザーが所望する静止画像を効率良く再生することができる。したがって、ユーザーに所望の静止画像を1枚ずつ選択させることを強いることなく、ユーザーが所望する静止画像を効率良く再生することができる。
<撮影装置の構成>
まず、本実施の形態に係る撮影装置の構成について説明する。
図1は、動画像及び静止画像を撮影する撮影装置の一例であるムービーカメラ又はビデオカメラ100の外観図である。本実施の形態では、このビデオカメラ100を用いて説明を行う。
図2は、ビデオカメラ100内部のハードウェア構成の概略を示す図である。
ビデオカメラ100は、レンズ群200と、撮像素子201と、映像ADC(Analog Digital Converter)202と、映像信号変換回路203と、CPU(Central Processing Unit)204と、クロック205と、レンズ制御モジュール206と、姿勢検出センサ207と、入力ボタン208と、ディスプレイ209と、スピーカー210と、出力I/F(Interface)211と、圧縮伸張回路212と、ROM(Read Only Memory)213と、RAM(Random Access Memory)214と、HDD(Hard Disk Drive)215と、音声ADC(Analog Digital Converter)216と、マイクロフォン217とを構成要素として備える。
レンズ群200は、撮像素子201上で被写体像を形成するために、被写体から入射する光を調整する1つ以上のレンズの集合である。具体的には、レンズ群200は、焦点距離及びズーム(動画の拡大倍率)を、様々な特性を持つ複数のレンズ間の距離を変化させることで、調整する。これらの調整は、ビデオカメラ100の撮影者が手動で調整してもよく、あるいは、後述するレンズ制御モジュール206を通じてCPU204等からの制御により自動的に調整してもよい。
撮像素子201は、レンズ群200を通して入射する光を電気信号に変換する光電変換部である。撮像素子201には、CCD(Charge Coupled Device)、及びC−MOS(Complementary Metal Oxide Semiconductor)等のイメージセンサを利用することが可能である。
映像ADC202は、撮像素子201が出力するアナログの電気信号をデジタルの電気信号(デジタル信号)に変換する。デジタル信号は、映像信号変換回路203へ出力される。
映像信号変換回路203は、映像ADC202が出力するデジタル信号を、NTSC(National Television System Committee)又はPAL(Phase Alternating Line)などの所定の規格の動画信号に変換する。
CPU204は、ビデオカメラ100全体を制御する制御部である。制御の種類としては、例えば、レンズ制御モジュール206を介して前述のレンズの焦点距離及びズームの制御を行うことで、撮像素子201への入射光を制御するレンズ制御がある。また、入力ボタン208及び姿勢検出センサ207等からの外部入力に対する入力制御、あるいは、圧縮伸張回路212の動作制御等がある。CPU204は、これらの制御アルゴリズムをソフトウェア等で実行する。
クロック205は、ビデオカメラ100内で動作するCPU204等の回路に処理動作の基準となるクロック信号を出力する。なお、クロック205は、利用する集積回路又は扱うデータによって、単一又は複数のクロック信号を出力することも可能である。また、クロック205は、1つの発振子のクロック信号を任意の倍数に乗ずることで、単一又は複数のクロック信号を出力してもよい。
レンズ制御モジュール206は、レンズ群200の状態を検出し、CPU204からの制御に基づいて、レンズ群200に含まれる1つ以上のレンズを動作させる。レンズ制御モジュール206は、レンズ制御用モータ206aとレンズ位置センサ206bとを備える。
レンズ位置センサ206bは、レンズ群200を構成する複数のレンズ間の距離又は位置関係等を検出する。レンズ位置センサ206bが検出した複数のレンズ間の位置情報等は、CPU204に送信される。CPU204は、レンズ位置センサ206bからの情報、及び撮像素子201等の他の構成要素からの情報に基づいて、複数のレンズを適正に配置させるための信号をレンズ制御用モータ206aに送信する。
レンズ制御用モータ206aは、CPU204から送信された制御信号に基づいてレンズを動作させるモータを駆動する。この結果、レンズ群200の複数のレンズ間の距離が変更され、レンズの焦点距離、及びズームを調整することができる。これにより、レンズ制御モジュール206は、レンズ群200を通過した入射光を撮像素子201上に集光させ、正確に被写体像を結ぶことができる。
なお、CPU204は、上記以外にも、ビデオカメラ100で動画撮影時の手振れをレンズ位置センサ206b又は後述する姿勢検出センサ207等で検出し、レンズ制御用モータ206aを駆動する制御を行ってもよい。これにより、CPU204は、手振れ防止の動作を、レンズ制御モジュール206を介して実行させることも可能である。
姿勢検出センサ207は、ビデオカメラ100の姿勢の状態を検出する。姿勢検出センサ207は、加速度センサ207a、角速度センサ207b、及び仰角・俯角センサ207c等を備える。これらの各種センサにより、ビデオカメラ100がどのような状態で撮影を行っているかを、CPU204は検出する。なお、これらのセンサは、好ましくはビデオカメラ100の姿勢を詳細に検出するために、3軸方向(垂直方向(z軸)、水平方向(x軸、y軸)等)についてそれぞれ検出できることが望ましい。
入力ボタン208は、ビデオカメラ100の撮影者が使用する入力インタフェースの1つである。これにより、撮影者が撮影の開始及び終了、並びに、ビデオ撮影中の動画にマーキングを挿入する等、各種要求をビデオカメラ100に伝えることが可能となる。また、入力ボタン208は、ビデオカメラ100で撮影した動画像又は静止画像を再生する際に、動画像又は静止画像を再生するための情報を入力し、あるいは、動画像又は静止画像を選択することが可能である。
ディスプレイ209は、ビデオカメラ100が撮影した動画を見るため、及び、撮影ファインダー等として利用するために設けられた表示部である。これにより、撮影者は、撮影した動画をその場で確認することが可能となる。また、上記以外にも、ディスプレイ209は、ビデオカメラ100の各種情報を表示することで、撮影情報等、及び機器情報等のより詳細な情報を撮影者に伝えることが可能となる。
スピーカー210は、撮影した動画を再生する際の音声出力に使用される。これ以外にも、スピーカー210は、ビデオカメラ100が出力する警告を音で撮影者へ伝えることも可能である。
出力I/F211は、ビデオカメラ100が撮影した動画を外部機器へ出力するために用いられる。具体的には、出力I/F211は、外部機器とビデオカメラ100とをケーブルで接続する場合のケーブルインタフェースである。あるいは、出力I/F211は、撮影した動画をメモリカードに記録する場合のメモリカードインタフェース等などである。これにより、撮影した動画をビデオカメラ100に備え付けのディスプレイ209よりも大きな外部のディスプレイを用いて視聴等することが可能となる。
圧縮伸張回路212は、撮影した動画又は音声を所定のデジタルデータ形式に変更する符号化処理を行う回路である。具体的には、撮影した動画及び音声データに、MPEG(Moving Picture Experts Group)又はH.264等の規格に従って符号化処理を行い、所定のデジタルデータ方式に変換(圧縮)する。また、圧縮伸張回路212は、撮影したデータの再生時には、所定のデジタルデータ形式の動画データを伸張してディスプレイ209等に表示する復号処理を行う回路である。
ROM213は、CPU204が処理するソフトウェアのプログラム、及び、プログラムを動作させるための各種データを記録するメモリの一例である。
RAM214は、CPU204が処理するソフトウェアのプログラム実行時に使用するメモリ領域等として使用されるメモリの一例である。また、CPU204は、圧縮伸張回路212と共用でRAM214を使用してもよい。
HDD215は、圧縮伸張回路212が符号化した動画像データ、及びその他撮影した静止画像データを蓄積等する目的で利用される記録媒体の一例である。なお、HDD215は、動画像データ及び静止画像データ以外にも、後述する再生情報のデータ等を記録することも可能である。
音声ADC216は、マイクロフォン217が外部から取得した音声のアナログの電気信号をデジタルの電気信号に変換する。
マイクロフォン217は、ビデオカメラ100外部の音声をアナログの電気信号に変換して出力する。
上記の通り、図2を用いてビデオカメラ100のハードウェア構成について説明したが、本発明では、上記の構成に限定されるものではない。例えば、映像ADC202及び映像信号変換回路203等を単一の集積回路として実現することも可能である。あるいは、CPU204が実行するソフトウェアプログラムの一部を別途、FPGA(Field Programmable Gate Array)を用いてハードウェアとして実現することも可能である。
次に、ビデオカメラ100の機能構成について図3A及び図3Bを用いて説明する。図3Aは、ビデオカメラ100の機能構成の一例を示すブロック図である。
図3Aに示すように、ビデオカメラ100は、撮像部110と、属性情報生成部120と、記録部130と、受付部140と、再生部150とを備える。
撮像部110は、動画像を撮影するとともに、当該動画像の撮影中に静止画像を撮影する。撮像部110は、図2のレンズ群200と、撮像素子201と、映像ADC202と、映像信号変換回路203となどに相当する。
属性情報生成部120は、撮像部110によって撮影された動画像及び静止画像の少なくとも一方の撮影状況を示す1種類以上の属性情報を生成する。属性情報生成部120は、図2のCPU204でソフトウェア処理されるアルゴリズムに相当する。
記録部130は、撮像部110によって撮影された動画像及び静止画像と、属性情報生成部120によって生成された属性情報とを対応付けてメモリ160に記録する。具体的には、記録部130は、属性情報生成部120によって生成された静止画像の撮影状況を示す属性情報と、当該静止画像とを対応付けて記録する。
また、記録部130は、属性情報生成部120によって生成された動画像の撮影状況を示す属性情報と、当該動画像とを対応付けて記録する。あるいは、記録部130は、属性情報生成部120によって生成された動画像の撮影状況を示す属性情報と、当該動画像に含まれる静止画像とを対応付けて記録してもよい。記録部130は、図2のCPU204でソフトウェア処理されるアルゴリズムに相当する。
なお、メモリ160は、図3Aに示すように、ビデオカメラ100が備えていなくてもよい。ビデオカメラ100がメモリ160を備えている場合は、メモリ160は、図2のRAM214及びHDD215に相当する。
受付部140は、属性情報の種類を選択するための指示を受け付ける。受付部140は、図2の入力ボタン208に相当する。
再生部150は、受付部140によって受け付けられた指示に対応する種類の属性情報に対応付けられた静止画像をメモリ160から読み出して再生する。また、再生部150は、受付部140によって受け付けられた指示に対応する種類の属性情報に対応付けられた動画像に含まれる静止画像をメモリ160から読み出して再生してもよい。再生部150は、図2に示すCPU204でソフトウェア処理されるアルゴリズム、圧縮伸張回路212、ディスプレイ209、スピーカー210及び出力I/F211に相当する。
以下では、ビデオカメラ100のより詳細な機能構成について図3Bを用いて説明する。図3Bは、ビデオカメラ100の詳細な機能構成の一例を示すブロック図である。
ビデオカメラ100は、機能的な構成要素として、レンズ部300と、撮像部301と、映像AD変換部302と、信号処理部303と、映像信号圧縮部304と、撮像制御部305と、映像解析部306と、レンズ制御部307と、姿勢検出部308と、属性情報生成部309と、シーン解析部310と、再生情報生成部311と、音声解析部312と、音声信号圧縮部313と、多重化部314と、記憶部315と、表示部318と、音声AD変換部321と、マイク部322と、外部入力部323と、静止画像解析部324と、静止画像信号伸張部325と、静止画像抽出部326とを備える。
レンズ部300は、被写体から入射した光の焦点距離、ズーム倍率(動画の拡大倍率)を調整する。この調整は、レンズ制御部307からの制御により行われる。レンズ部300は、図2のレンズ群200に相当する。
撮像部301は、レンズ部300を透過した光を電気信号に変換する。撮像部301は、撮像制御部305の制御により、撮像素子上の任意の範囲のデータを動画データとして出力する。また、撮像部301は、動画データ以外にも、3原色点の色空間情報、白色の座標、3原色のうち少なくとも2つのゲイン情報、色温度情報、Δuv(デルタuv)、及び、3原色又は輝度信号のガンマ情報等の情報も出力することが可能である。これらの情報は、撮像制御部305を介して属性情報生成部309へ出力する。撮像部301は、図2の撮像素子201に相当する。
映像AD変換部302は、撮像部301からの動画データを示す電気信号を、所定の処理内容に従ってアナログ・デジタル変換を行う。映像AD変換部302は、図2の映像ADC202に相当する。
信号処理部303は、映像AD変換部302が出力したデジタル信号を所定のフォーマットの動画信号に変換する。例えば、所定のフォーマットの動画信号は、NTSCで規定された水平線の数、走査線の数、フレームレートに準拠したフォーマットの動画信号である。信号処理部303は、図2の映像信号変換回路203に相当する。
映像信号圧縮部304は、信号処理部303が出力したデジタル動画信号に所定の符号化処理を行い、データ量の圧縮等を実現する。具体例としては、MPEG2、MPEG4、H.264の符号化方式がある。映像信号圧縮部304は、図2の圧縮伸張回路212の圧縮機能に相当する。
撮像制御部305は、撮像部301の動作を制御する。具体的には、撮像制御部305は、撮像部301に対して、撮影時の露出量、撮影速度、及び感度等を制御する。また、これらの制御情報は、属性情報生成部309へも併せて出力される。撮像制御部305は、図2のCPU204でソフトウェア処理される制御アルゴリズムの1つである。
映像解析部306は、撮影された動画信号から動画の特徴を抽出する。本実施の形態では、映像解析部306は、色情報(例えば、動画に含まれる色の分布を検出する)、及びホワイトバランス等の情報を抽出する。また、映像解析部306は、動画に人物の顔が含まれている場合には、顔検出を行う等、動画信号を解析することで、動画の特徴を抽出する。なお、色分布の検出は、動画信号を形成するデータに含まれる色情報を確認することで実現可能である。また、顔検出については、パターンマッチング等を用いることにより実現可能である。映像解析部306は、図2のCPU204でソフトウェア処理されるアルゴリズムの1つである。
レンズ制御部307は、レンズ部300の動作を制御する。レンズ制御部307には、ズーム制御部307a、フォーカス制御部307b、及び手振れ補正制御部307c等を有する。レンズ制御部307は、レンズ部300を制御するとともに、レンズ部300の制御に関する制御情報を属性情報生成部309へ出力する。レンズ制御部307は、図2のレンズ制御モジュール206に相当する。
姿勢検出部308は、加速度センサ308a、角速度センサ308b、及び仰角・俯角センサ308cを備え、ビデオカメラ100の加速度、角速度、仰角・俯角等を検出する。検出した情報は、ビデオカメラ100の姿勢及びその変化状況を検出する目的等に用いられる情報である。なお、加速度及び角速度については、垂直(z軸)及び水平(x軸及びy軸の2方向)の3方向について検出できることが望ましい。姿勢検出部308は、図2の姿勢検出センサ207に相当する。
マイク部322は、周囲の音を電気信号に変換して音声信号として出力する。マイク部322は、図2のマイクロフォン217に相当する。
音声AD変換部321は、マイク部322が出力したアナログの音声信号をデジタル形式の音声データに変換する。音声AD変換部321は、図2の音声ADC216に相当する。
音声解析部312は、音声データから特徴のある音を抽出する。ここで、特徴のある音とは、例えば、撮影者の声、特定の単語の発音、歓声、銃声等である。これらの音の識別は、これらの音(音声)が持つ特有の周波数を予め登録しておき、登録しておいた周波数との比較結果で判別するなどの方法を用いることで行われる。これにより、音声解析部312は、特徴のある音を抽出することができる。また、音声解析部312は、マイク部322が捕捉した音の入力レベル等の特徴も検出する。音声解析部312は、図2のCPU204でソフトウェア処理されるアルゴリズムの1つである。
音声信号圧縮部313は、音声AD変換部321が出力した音声データを所定の符号化アルゴリズムで変換する。音声の符号化アルゴリズムには、MP3(MPEG Audio Layer−3)及びAAC(Advanced Audio Coding)等の方法がある。音声信号圧縮部313は、図2の圧縮伸張回路212での圧縮機能の1つである。
外部入力部323は、動画撮影時に外部から受信した各種の情報、例えば、撮影者によるボタン入力、及び、外部から通信経由で受信した撮影インデックス情報等を出力するインタフェースである。なお、撮影インデックス情報とは、例えば、映画撮影時における、撮影場面を識別する番号、及び、撮影回数を示す番号等のそれぞれの撮影を識別するために用いられる識別番号などである。
また、外部入力部323は、動画像又は静止画像を再生する際に、動画像又は静止画像を選択するための情報の入力や、動画像又は静止画像を選択するためのボタン入力等を受け付けるインタフェースでもある。外部入力部323は、図2の入力ボタン208等に相当する。
属性情報生成部309は、動画像又は静止画像撮影時の撮影情報、外部入力情報及びその他の情報を属性情報(メタデータ)として生成する。属性情報の一例として、以下のような情報が考えられる。
・ ホワイトバランス情報
・ 露出情報
・ 焦点距離情報
・ 撮影速度情報
・ ズーム倍率情報
・ 感度情報
・ 3原色点の色空間情報
・ 3原色のうち少なくとも2つのゲイン情報
・ 色温度情報
・ 色分布情報
・ 顔検出情報、顔認識情報
・ カメラ姿勢情報(加速度、角速度、仰角・俯角等)
・ 撮影時刻情報(撮影開始時刻、終了時刻)
・ 撮影インデックス情報
・ ユーザー入力情報
・ フレームレート情報
・ サンプリング周波数情報
なお、属性情報には、上記の撮影時の各種情報から算出される動画シーンを特徴づける新たな情報(撮影時の各種情報等を組み合わせ、組み合わせた情報を分析等することで算出される情報等)も含まれる。例えば、属性情報生成部309は、カメラ姿勢(加速度、角速度、仰角・俯角等)の情報から、ビデオカメラ100の撮影時におけるパン、ティルト等のカメラワークを算出することが可能となる。また、属性情報生成部309は、焦点距離、及びズーム倍率の情報をそのまま、属性情報として出力することが可能である。属性情報生成部309は、撮影時の各種情報からシーン評価に有用な情報を抽出、及び算出等して属性情報を生成する。
シーン解析部310は、属性情報生成部309が生成した属性情報に基づいて、動画を構成する複数のシーンのそれぞれを評価する。つまり、シーン解析部310は、シーン毎に、該当する1つ以上の属性情報を割り当て、割り当てた1つ以上の属性情報に基づいて対象シーンを評価する。そして、シーン解析部310は、評価結果に基づいて再生すべきシーンを選択する。シーンの評価及び選択方法等について後に詳細に説明する。
再生情報生成部311は、シーン解析部310が選択した再生すべきシーンを示す再生情報を生成する。再生情報の生成についても後述する。
属性情報生成部309、シーン解析部310、及び再生情報生成部311は、図2のCPU204においてソフトウェアとして処理される。
多重化部314は、映像信号圧縮部304からの符号化動画データ、音声信号圧縮部313からの符号化音声データ、及び、再生情報生成部311からの再生情報を多重化して出力する。多重化部314は、図2のCPU204で実行されるソフトウェアであってもよく、あるいは、圧縮伸張回路212で、処理されてもよい。
記憶部315は、多重化部314から出力された符号化動画データ、符号化音声データ及び再生情報が多重化されたデータ、並びに静止画像のデータを一時的に保持又は長期的に保持する。記憶部315は、図2のHDD215又はRAM214等に相当する。
静止画像解析部324は、属性情報生成部309が生成等した情報又はシーン解析部310が解析したシーン情報に基づいて、撮影した動画から好適な画面を静止画像として抽出する。具体的な抽出方法等については後述する。抽出した静止画像は、必要に応じて画像圧縮等の処理を行い、記憶部315に記録される。静止画像解析部324は、図2のCPU204でソフトウェア処理されるアルゴリズムの1つである。
静止画像信号伸張部325は、記憶部315に記録されている静止画像のデータを読み出し、読み出した画像を表示部318に表示する。なお、記憶部315に記録されている静止画像は、必ずしも画像圧縮等の処理を施されてなくてもよい。記憶部315に記録されている静止画像が圧縮されている場合、静止画像信号伸張部325は、静止画像のデータを読み出し、読み出した静止画像のデータを伸張して表示部318に出力する。静止画像信号伸張部325は、図2の圧縮伸張回路212の機能の1つである。
静止画像抽出部326は、静止画像の再生時に、外部入力部323から出力された情報に基づいて再生する静止画像を選択し、選択された静止画像を記憶部315から読み出して静止画像信号伸張部325へ出力する。外部入力部323から入力された情報とは、1つ又は複数の静止画像を特定する情報であり、静止画像抽出部326は、外部入力部323から入力された情報に基づいて、該当する静止画像を記憶部315から読み出して表示部318に出力する。静止画像抽出部326は、図2のCPU204でソフトウェア処理されるアルゴリズムの1つである。
表示部318は、静止画像及び動画像を表示する。表示部318は、図2のディスプレイ209に相当する。
上記の構成により、ビデオカメラ100で動画撮影中に撮影された静止画像は、ユーザーが入力した情報に応じて好適な静止画像を選択して再生することが可能となる。
なお、図3Aに示す撮像部110は、例えば、図3Bに示すレンズ部300、撮像部301、映像AD変換部302、及び信号処理部303に相当する。属性情報生成部120は、例えば、属性情報生成部309、シーン解析部310及び静止画像解析部324の一部に相当する。また、記録部130は、例えば、静止画像解析部324の一部に相当する。受付部140は、例えば、外部入力部323に相当する。再生部150は、例えば、静止画像抽出部326及び静止画像信号伸張部325に相当する。なお、以上の対応関係は、これに限定するものではない。
また、図2のハードウェア構成図、並びに、図3A及び図3Bの機能ブロック図は、本発明に係る撮影装置を実施するための一態様であり、これに限定されるものではない。例えば、図3Bにおいて、シーン解析部310及び再生情報生成部311は、記憶部315にデータを記録する前に処理されているが、記憶部315に圧縮された動画信号と、圧縮された音声信号と、撮影時の属性情報とを多重化して一度記録し、記録したデータを記憶部315から読み出した後にシーン解析、及び再生情報の生成等を行うものであってもよい。
また、図2のハードウェア構成と図3A及び図3Bの機能構成との対応関係は、上記記載に限定するものではない。上記の説明は、本発明に係る撮影装置を実施するための一形態として示すものであって、機能構成とハードウェア構成とが異なる関係であってもよい。
<撮影したシーンの解析、及び再生情報の生成>
続いて、撮影した動画像のシーンの解析、及び、再生情報の生成処理について説明する。
図4は、ビデオカメラ100が撮影する動画の構成を示す図である。撮影者が撮影開始を指示し、撮影の終了又は撮影の一時停止を指示するまでに撮影された動画の単位を「クリップ(Clip)」とする。撮影者が撮影の開始、撮影の終了又は一時停止を何度も繰り返すと、クリップが複数生成される。この場合、図4に示すように、各クリップには、クリップ番号(Clip#1〜#n)が付与される。
1つのクリップは1つ又は複数の「シーン(Scene)」から構成される。シーンは、論理的につながりのある一続きの動画である。シーンは、シーン解析部310が任意に設定することが可能である。例えば、1つのクリップを1つのシーンとして、すなわち、「1クリップ」=「1シーン」と設定してもよい。また、画面が大きく変わることを境としてシーンを設定してもよい。この場合には、映像解析部306がフレーム間の動きベクトルを算出し、「動き」の大きさ(変化)が所定の値より大きい場合を、シーンの切り替え部分としてもよい。
また、その他の撮影情報等に基づいてシーンを区切ってもよい。例えば、撮影者からのボタン入力によりシーンを区切ってもよい。この場合に、撮影者の明確な意図でクリップ内のシーンを構成することが可能となる。1つのクリップに複数のシーンが含まれる場合、図4に示すように、各シーンには、シーン番号(Scene#1〜#n)が付与される。
シーンは、1つ又は複数の「フレーム(Frame)」から構成される。フレームは、動画を構成する個々の静止画像である。図4に示すように、各フレームには、フレーム番号(Frame#1〜#n)が付与される。
図5は、シーン解析部310が、クリップ内を複数のシーンに分割した場合の例を示す図である。シーン解析部310は、上述の通り属性情報等に基づいてクリップを分割する。図5では、それぞれのシーンを「開始時刻」と「終了時刻」とで定めているが、フレーム番号等でシーンの開始と終了とを定めてもよい。
なお、図5に示す「代表時刻」は、各シーンに含まれる複数のフレームのうち、代表的なフレームの時刻を示している。例えば、シーンをサムネイル表示する場合などに、代表時刻のフレームが表示される。
図6は、シーン解析部310が、それぞれのシーンを評価する際に用いる属性情報と評価との関係例を示した図である。例えば、クリップイン(撮影の開始部分)及びクリップアウト(撮影の終了前部分)部分については、動画の導入部分及び重要部分と考えることができ、撮影された動画が持つ論理的な意味が高いと推論される。したがって、図6に示す例では、「クリップイン」の“A”及び「クリップアウト」の“F”は、評価点が100となっている。
その他にも、撮影時のカメラワークとして「ズームアップ」の“D”及び「ズームダウン」の“G”についても、特定の被写体への注目度を高めるとの観点から評価点が30として定められている。このように、シーン解析部310は、予め属性情報それぞれに対する数値化された評価を記憶している。
なお、図6の例では、評価点が高いほど高い評価(好ましい)として表現している。シーン解析部310は、このような図6の属性情報と評価との関係に基づいて各シーンを評価する。
なお、1つのシーンに複数の属性情報が与えられている場合は、それぞれの属性情報に割り当てられている評価(評価点)を加算してもよい。また、1つのシーンに複数の属性情報が与えられている場合、その属性情報の中から最も評価の高い属性が持つ評価(評価点)を当該シーンの評価点としてもよい。さらに、シーン内に含まれる種々の属性を考慮するのであれば、複数の属性の評価点の平均値を評価としてもよい。さらに、より詳細に評価を行う場合には、シーンに含まれるフレーム毎に評価をしてもよい。
なお、評価は好ましいシーンだけに行う必要はない。例えば、撮影時の手振れは、動画の視聴者に見づらい動画となる可能性があるので、こういった属性を持つシーンには減点(マイナス点)の評価を行ってもよい。図6の例では、「手振れ」の“I”に対する評価は−20、「地面(垂直下方向)撮影」の“J”に対する評価は−10として定められている。
なお、図6の属性情報と評価との関係は、1つに限定するものではない。例えば、複数の属性情報と評価との組み合わせデータを、ビデオカメラ100の撮影者が撮影するモード(例えば、風景の撮影、人物(ポートレート)撮影、静物撮影等)によって切り換えてもよい。また、予め複数の組み合わせデータを備えておき、撮影モードによって、複数のデータを合成(それぞれの評価の値を一定の比率で加算等)してもよい。この場合には、合成の比率を変えることで、動的に属性情報と評価との組み合わせデータを変更することが可能となる。
さらには、ユーザーが、外部入力部323などを利用して、属性情報の項目及び評価点を変更してもよい。これにより、ユーザーがより重要と考えている属性に対する評価を高めることができるので、シーン解析部310は、よりユーザーの意向に沿った評価を行うことができる。
なお、シーンの評価は、優先度を示している。すなわち、評価点が高いシーンは、ユーザー又はビデオカメラ100が重要であると判断したシーンであり、評価点が低いシーンより優先してユーザーが再生を望むシーンである。
図7は、シーン解析部310が、各シーンに評価(優先度)を割り当てた結果を示す図である。図7は、横軸に時間(シーン)を、縦軸に各シーンの評価(優先度)を示している。
図7の時間0付近にある“A”の符号が付けられているシーンは、撮影を開始した直後であるため「クリップイン」の属性を持つ。図6に従えば、「クリップイン」の属性は、評価(優先度)100を持つ。
“B”の符号が付けられているシーンは、「特定音声の抽出」の属性を持つ。「特定音声の抽出」の属性は、上述の音声解析部312等により得られた音声情報に基づいてシーン解析部310によって、対象シーンに割り当てられる。図6に従えば、「特定音声の抽出」の属性は、評価(優先度)70を持つ。
“C”の符号が付けられているシーンは、「(カメラワーク後に)静止して撮影」の属性を持つ。つまり、“C”のシーンは、撮影者がパン、ティルト等のビデオカメラ100本体を動かして撮影した後に、静止して撮影することを意味する属性を示す。“C”のシーンは、静止して撮影する際の被写体に動画としての価値が高いと判断できることが考えられる。図6に従えば、「(カメラワーク後に)静止して撮影」の属性は、評価(優先度)40を持つ。
“D”の符号が付けられているシーンは、「ズームアップ」の属性を持つ。つまり、“D”のシーンは、ビデオカメラをズームアップして撮影しているシーンである。図6では、「ズームアップ」の属性は、評価(優先度)30を持つ。
なお、図6に示すように「ズームダウン」の属性も、評価(優先度)30を持つ。ただし、ズームアップとズームダウンとで評価の値を異ならせることも可能である。例えば、ズームアップ“D”をズームダウン“G”よりも評価を高く設定することで、ズームアップで撮影されるシーン、つまり、動画の拡大倍率が大きくなるシーン(拡大されて撮影される被写体があるシーン)について高い評価(優先度)を割り当てることができる。逆に、動画の拡大倍率が小さくなるシーンについては、比較的低い評価(優先度)を割り当てることも可能である。
“E”の符号が付けられているシーンは、「パン、ティルト」の属性を持つ。つまり、“E”のシーンは、ビデオカメラ100がパン、ティルト等の動きを伴った撮影(カメラワーク)を行ったシーンである。図6では、「パン、ティルト」の属性は、評価(優先度)25を持つ。
“I”の符号が付けられているシーンは、「手振れ」の属性を持つ。つまり、“I”のシーンは、撮影時に手振れを伴って撮影されているシーンを示している。図6では、「手振れ」の属性は、評価(優先度)−20を持つ。これは、“I”のシーンについては、動画を視聴した際に画面が揺れる等、見づらいシーンとなっている可能性があり、減点したためである。
“J”の符号が付けられているシーンは、「地面(垂直下方向)撮影」の属性を持つ。つまり、“J”のシーンは、撮影者が、撮影を停止又は一時中断せずに誤ってビデオカメラ100を持ったまま移動等している場合に起こりやすい、地面を撮影し続けているようなシーンを示す。図6では、「地面(垂直下方向)撮影」の属性は、評価(優先度)−10を持つ。
以上のように、シーン解析部310は、各シーンについて評価(優先度)を割り当てる。なお、図7の例では、シーンを単位として評価を割り当てたが、シーン解析部310はクリップ単位、又は、フレーム単位で上記の評価割り当てを行ってもよい。
シーン解析部310は、さらに、各シーンに割り当てた評価に基づいて、好ましいシーンのみを抽出する。具体的には、シーン解析部310は、評価の高いシーンのみを抽出する。図7の例では、シーン解析部310は、(i)〜(v)の部分のシーンのみを抽出する。
なお、抽出方法については、抽出されたシーンの合計再生時間が所定の時間以内であること、又は、シーンの評価が一定以上であること等、様々な観点で抽出をすることが可能である。
再生情報生成部311は、シーン解析部310が抽出したシーンに従って、動画再生の手順及び方法を記した再生情報を生成する。再生情報は、抽出したシーンを特定するための情報であり、再生時に再生情報を参照することで、容易に、かつ、素早く所望のシーンのみをダイジェスト再生することができる。
再生情報は、例えば、図8に示すような、再生対象となるシーンの開始時刻と終了時刻とで示されてもよい。この場合、各シーンにおける代表的な動画画面(シーン中における最も評価の高い動画画面等)の時刻を代表時刻として別途記録しておくと、参照用画面の検索にも有効である。
また、シーンを特定するための別の方法として、動画を記録した記憶部315の記憶方法に従ったシーン特定方法であってもよい。具体的には、各シーンが記憶部315にファイル単位で記録されている場合等は、このファイルを識別することで、特定のシーンのみを選択して再生することが可能となる。
なお、再生情報の管理は上記の内容に限られず、他の方法であってもよい。例えば、フレーム番号での指定などでも可能である。また、再生情報生成部311が生成した再生情報を、MPEG等のTS(Transport Stream)として多重化部314で多重化する場合等には、多重化時に用いられる時刻情報(例えば、PTS(Presentation Time Stamp)又はDTS(Decoding Time Stamp)の時刻情報)等を用いて再生情報を記録することも可能である。H.264の場合にも同様に所定の多重化時の時刻情報を用いてもよい。
さらに、一部のビデオカメラのデータ記録方式として用いられているAVCHD(Advanced Video Codec High Definition)等の規格を用いて動画データを記録する場合には、PlayListファイル等に再生情報を記録する方法を用いてもよい。
以上により、撮影した動画からダイジェスト動画(要約された動画)を自動的に生成することが可能となる。
<静止画像の自動抽出について>
続いて、本発明に係るビデオカメラ100の特徴である静止画像の自動抽出について説明する。まず、撮影した動画をダイジェスト再生するために用いる評価を利用して、静止画像を自動的に抽出する技術について説明する。
静止画像解析部324は、シーン解析部310からシーン毎の評価を取得し、その評価に基づいて静止画像を決定する。具体的には、まず、静止画像解析部324は、シーン解析部310がシーン毎に行った図7の評価を取得する。静止画像解析部324は、シーン解析部310が評価するシーン毎の評価結果に基づいて、評価が所定の値より大きいシーンを静止画像取得対象のシーンとして決定する。
図7の例では、例えば、評価50以上のシーンを静止画像取得の対象シーンとすると、“A”又は“B”の符号が付されたシーンが対象となる。この場合、静止画像解析部324は、これらのシーンの中から、“A”又は“B”の符号が付されたフレームを特定し、特定したフレームを静止画像として抽出する。静止画像解析部324は、抽出した静止画像を記憶部315に静止画像データとして記録する。
なお、静止画像解析部324は、抽出対象となる静止画像のデータを信号処理部303が出力したデータ又は映像信号圧縮部304が出力したデータのいずれからも取得することが可能である。しかし、静止画像解析部324が、映像信号圧縮部304が出力したデータ、すなわち、符号化した後の映像データから静止画像データを抽出した場合、符号化の際に一部のデータ(画像に関わるデータ)が削除される場合がある。このため、好ましくは、符号化される前のデータである、信号処理部303が出力したデータから静止画像データを抽出することが望ましい。
また、静止画像解析部324は、抽出した静止画像データをJPEG(Joint Photographics Experts Group)等の静止画像圧縮技術を用いて記憶部315に記録してもよい。この場合には、非圧縮の場合と比較してデータ量を削減できるため、記憶部315に比較的高速に記録処理を行うことが可能となる。
静止画像信号伸張部325は、記憶部315に記録された静止画像データを読み出し、JPEG等の圧縮処理が施されている場合は、読み出した静止画像データを伸張処理して表示部318に出力する。
以上により、本実施の形態に示した構成により、ビデオカメラ100は映像を撮影しながら、シーン毎の評価を行い、ダイジェスト(要約)再生用の再生情報を生成するとともに、好適なシーンの自動抽出も行うことが可能となる。
続いて、ダイジェスト再生用などの動画用の評価とは独立した評価を行うことで、静止画像を抽出する技術について説明する。
つまり、静止画像解析部324は、静止画像の抽出に、シーン解析部310がシーン毎に評価した評価結果を用いていたが、シーン解析部310とは独立した評価を行ってもよい。
例えば、図6の“B”「特定音声の抽出」は、動画には有効な情報であるが、静止画像の抽出には有効であるとは限らない。このような場合には、静止画像解析部324は、シーン解析部310とは異なる方法で静止画像を評価する。静止画像解析部324が、シーン解析部310とは異なる方法で静止画像を評価した場合、属性情報の種類と評価点との関係は図9のようになる。
例えば、“B”「特定音声の抽出」に対する評価点は、図6では70としていたが、図9では10としている。
静止画像解析部324は、静止画像を評価する際は、図6に示した属性情報の種類と評価点との関係を用いる代わりに、図9の属性情報の種類と評価点との関係を用いてもよい。
図10は、本実施の形態に係るビデオカメラ100の動作のうち、動画像の撮影中に静止画像を撮影する動作の一例を示すフローチャートである。
まず、ビデオカメラ100は、動画像の撮影を開始する(S101)。具体的には、外部入力部323が、ユーザーから動画像の撮影開始の指示を受け付けた場合、撮像制御部305の制御に基づいて撮像部301は、動画像を撮影する。
動画像の撮影が開始されると、属性情報生成部309は、シーン又はフレーム毎に属性情報を生成する(S102)。そして、属性情報生成部309が生成した属性情報に基づいて、シーン解析部310は動画像のシーン解析を行うとともに、静止画像解析部324は、静止画像の評価を行う。例えば、シーン解析部310は、図6に示す表を参照して動画像のシーン解析を行い、静止画像解析部324は、図9に示す表を参照して静止画像の解析を行う。
次に、静止画像解析部324は、静止画像又は動画像の解析の結果が所定の条件を満たすか否かを判定する(S103)。例えば、静止画像解析部324は、静止画像又は動画像に対応付けられた属性情報の評価が所定の閾値を超えているか否かを判定する。
属性情報の評価が所定の閾値を超えている場合(S103でYes)、静止画像解析部324は、対応する静止画像を、属性情報及び属性情報の評価値と対応付けて記憶部315に記録する(S104)。属性情報の評価が所定の閾値を超えていない場合(S103でNo)、属性情報の生成処理(S102)から繰り返す。
以上の処理を、ビデオカメラ100は、動画像の撮影を終了するまで、繰り返す(S105)。
以上のようにして、本実施の形態に係るビデオカメラ100は、動画像を撮影するとともに、当該動画像の撮影中に静止画像を撮影する。
<静止画像の再生について>
以下では、具体的にビデオカメラ100で撮影された静止画像を再生する際の操作について説明する。
ビデオカメラ100で撮影したフレームを静止画像抽出の観点から評価した結果を図11に示す。
図11において、静止画像解析部324は、評価が閾値(40)より大きいシーンから静止画像を抽出している。静止画像を抽出する対象となるシーンは、図11の期間(a)、期間(b)、期間(c)となり、静止画像解析部324は、それぞれの期間から所定の条件に基づいて静止画像を抽出している。
実際に、図11のシーンで静止画像が抽出された時点を丸記号で表す。図11に示した例では、期間(a)からは、P1からP4の4枚、期間(b)からはP5からP9の5枚、期間(c)からはP10からP26の17枚、合計26枚の静止画像が抽出されたことになる。これらの静止画像は、ビデオカメラ100で動画が撮影されたときに同時に作成され、記憶部315に記憶されている。
次に、ビデオカメラ100で撮影されたP1からP26の26枚の各静止画像について、評価に用いられた属性情報のうち評価点が高かった属性情報の一覧を図12に示す。図12は、静止画像の評価に用いられた属性情報のうち評価点が高かった属性情報の一覧を示す図である。図12に示すように、静止画像毎に、評価点と属性情報とを示している。
例えば、静止画像P2、P4、P8、P12、P25など、属性情報に“C”と書かれている静止画像は、カメラワーク後に静止して撮影されて抽出されている。また、静止画像P4、P8、P25など、属性情報に“Z”と書かれている静止画像は、さらに、顔検出されて抽出されたことになる。
なお、図12に示す属性情報は、静止画像の評価に用いられた属性情報のうち評価点が高かった属性情報のみを示している。このため、図12に示す属性情報と評価点との関係と、図9に示す属性情報と評価点との関係とは一致していない(例えば、図12ではP1について評価点が57となっているが、図9では属性情報“G”の評価点は20)。つまり、図12に示す評価点は、図12に示す属性情報以外の属性情報の評価点なども考慮に入れて算出された点数である。
図12に示した静止画像と、評価点と、評価点が高かった属性情報との一覧は、例えば図12に示したような表として記憶部315に記憶されていてもよい。あるいは、静止画像の再生時に作成され、一時的に参照できてもよい。
次に、ビデオカメラ100で撮影された静止画像を再生する際の操作メニュー画面の一例を図13Aに示す。
操作メニューM500は、例えば、ビデオカメラ100の表示部318に表示されるメニュー画面の一例である。
操作メニューM500は、メニュー項目M501、M502、M503、M504、M505、M521及びM522から構成されている。メニュー項目M501、M502、M503、M504、M505は、ユーザーが再生したい静止画像を選択する条件に対応するアイコンや文字が表示されている。ユーザーは、これらのメニュー項目の1つ又は複数を選択することにより、再生したい静止画像を選択することが可能である。
図13Aでは、静止画像を選択する条件に対応するアイコンを表示させたが、メニューのデザインはこの限りではない。メニュー項目M521は、選択すると、静止画像の選択を取り消すことができる。メニュー項目M522は、選択すると、静止画像の選択を決定し再生を開始することができる。
操作メニューM500は、カーソルを具備し、ユーザーが上下左右決定等の入力が可能な入力手段(図示せず)を用いて選択可能であってもよい。あるいは、表示部318がタッチパネル画面になっており、ユーザーが選択したいメニューに直接触れることで選択可能であってもよい。ユーザーは、外部入力部323から選択に必要な情報を入力することができる。
図13Bは、各メニュー項目の静止画像選択条件の一例を示す図である。
メニュー項目M501は、1人の人物が写っている静止画像を選択するための指示を示している。メニュー項目M501が選択された場合、静止画像抽出部326は、図12に示す静止画像と属性情報との対応関係を示す一覧表を参照して、属性情報が“Z”「顔検出」を含む静止画像を選択する。なお、属性情報“Z”は、顔が検出されたために撮影された静止画像に対応付けられる人物情報の一例である。
さらに、静止画像抽出部326は、外部入力部323を介して入力されるユーザーからの指示に基づいて、選択された静止画像の中から、特定の人物が検出された静止画像を選択する。したがって、図13Aに示すメニュー項目M501は、選択すると、記憶部315に記憶された静止画像から、特定の人物の顔が検出された静止画像を選択することができる。
メニュー項目M502は、複数の人物が写っている静止画像を選択するための指示を示している。メニュー項目M502が選択された場合、静止画像抽出部326は、図12に示す静止画像と属性情報との対応関係を示す一覧表を参照して、属性情報が“Z”「顔検出/顔識別」を含む静止画像を選択する。
さらに、静止画像抽出部326は、外部入力部323を介して入力されるユーザーからの指示に基づいて、選択された静止画像の中から、複数の特定の人物が検出された静止画像を選択する。したがって、図13Aに示すメニュー項目M502は、選択すると、記憶部315に記憶された静止画像から、特定の複数の人物の顔が検出された静止画像を選択することができる。
メニュー項目M503は、カメラワーク後に静止して撮影された静止画像を選択するための指示を示している。メニュー項目M503が選択された場合、静止画像抽出部326は、図12に示す静止画像と属性情報との対応関係を示す一覧表を参照して、属性情報が“C”「(カメラワーク後に)静止して撮影」を含む静止画像を選択する。したがって、図13Aに示すメニュー項目M503は、選択すると、記憶部315に記憶された静止画像から、カメラワーク後に静止して撮影された静止画像を選択することができる。
メニュー項目M504は、パン、ティルトなどのカメラワーク中に撮影された静止画像を選択するための指示を示している。メニュー項目M504が選択された場合、静止画像抽出部326は、図12に示す静止画像と属性情報との対応関係を示す一覧表を参照して、属性情報が“E”「パン、ティルト」を含む静止画像を選択する。したがって、図13Aに示すメニュー項目M504は、選択すると、動画撮影時に、パン、ティルト操作がされた時刻に撮影された静止画像を選択することができる。
メニュー項目M505は、ズームアップして撮影された静止画像を選択するための指示を示している。メニュー項目M505が選択された場合、静止画像抽出部326は、図12に示す静止画像と属性情報との対応関係を示す一覧表を参照して、属性情報が“D”「ズームアップ」を含む静止画像を選択する。したがって、図13Aに示すメニュー項目M505は、選択すると、ズームアップして撮影された静止画像を選択することができる。
メニュー項目M506は、評価値が予め定められた閾値より高い静止画像を選択するための指示を示している。メニュー項目M506が選択された場合、静止画像抽出部326は、図12に示す静止画像と属性情報との対応関係を示す一覧表を参照して、評価点が所定の閾値以上の静止画像を選択する。
したがって、図13Aに示すメニュー項目M506は、選択すると、動画撮影時に撮影された静止画像の評価点を解析し、予め定められた評価点以上の静止画像を抽出して選択することができる。例えば、撮影時は、評価点が40以上のシーンから静止画像を抽出していたが、再生するときには評価点が80以上のシーンから抽出した静止画像のみを再生することができる。
メニュー項目M507は、動画像の属性情報に基づいて静止画像を選択するための指示を示している。具体的には、メニュー項目M507は、動画像の属性情報が予め定められた条件を満たしている期間に撮影された静止画像を選択するための指示である。例えば、メニュー項目M507は、動画像の評価値が所定の閾値より高い期間に撮影された静止画像を選択するための指示である。
メニュー項目M507が選択された場合、静止画像抽出部326は、メニュー項目M507は、選択すると、撮影された静止画像の撮影時間に対応する動画撮影時間が、動画の代表区間に含まれている場合にその静止画像を抽出して選択することができる。ここで、代表区間は、動画像の属性情報の評価値が所定の閾値より高い期間であり、例えば、図8に示す再生情報の開始時刻と終了時刻とで定められる動画像のダイジェスト再生期間である。
以上のように、静止画像抽出部326は、ユーザーに提示するメニュー項目と、属性情報、評価点及び撮影時刻などの撮影情報の少なくとも1つとを対応付けて記憶しておく。これにより、静止画像抽出部326は、外部入力部323を介して入力されるユーザーからの指示に基づいて、ユーザーが選択したメニュー項目に対応付けられた属性情報などを有する静止画像を選択することができる。
以下では、ユーザーが動画撮影時に撮影された静止画像を再生する際のビデオカメラ100の動作について、メニュー項目毎に説明する。
<特定の人物の顔が検出された静止画像の再生>
まず、ユーザーが動画撮影時に撮影された静止画像を再生する際、特定の人物の顔が検出された静止画像のみを選択して再生する手順を説明する。
まず、ユーザーは、表示部318に再生する静止画像を選択するための操作メニューM500を表示させる。具体的には、操作メニュー画面を表示させる旨のユーザーからの指示を外部入力部323が受け付けた場合、制御部(図3Bには示していない。CPU204に相当)は、当該指示に従って、メニュー画面を表示部318に表示させる。
次に、ユーザーは、特定の人物の顔が検出された静止画像を選択するために、外部入力部323から必要な情報を入力してメニュー項目M501を選択する。例えば、ユーザーは、操作メニューM500に表示されたフォーカスを上下左右決定ボタン等で選択してもよく、あるいは、表示部318がタッチパネル画面である場合には、メニュー項目M501をタッチして選択してもよい。
外部入力部323へメニュー項目M501を選択する情報が入力されると、外部入力部323は、メニュー項目M501が選択されたことを示す情報を静止画像抽出部326へ出力する。
静止画像抽出部326は、外部入力部323から、メニュー項目M501が選択されたことを示す情報が入力されると、図12に示された静止画像と評価点が高かった属性情報との一覧表を参照し、選択されたメニュー項目M501に対応する属性情報を持つ静止画像を選択する。メニュー項目M501が選択された場合、属性情報の「顔検出/顔識別」の“Z”の評価点が高かった静止画像が該当するので、静止画像抽出部326は、“Z”が付されている静止画像を選択することになる。図12の場合、P4、P8、P9、P16、P22、P25、P26の7枚が該当することになる。
静止画像抽出部326は、再生する静止画像を特定すると、該当する静止画像を記憶部315から読み出して、静止画像信号伸張部325へ出力する。静止画像信号伸張部325は、入力された静止画像を伸張して表示部318へ出力する。そして、表示部318は、静止画像信号伸張部325から入力された静止画像を表示する。
これにより、ユーザーは、選択した条件に該当する静止画像のみ、すなわち、特定の人物の顔が映っている静止画像のみを見ることができる。
<特定の人物の顔をズームアップして撮影された静止画像の再生>
次に、複数の条件を選択して再生する場合の例として、ビデオカメラ100において、ユーザーが動画撮影時に撮影された静止画像を再生する際、特定の人物の顔が検出され、さらに、ズームアップして撮影された静止画像のみを選択して再生する手順を説明する。
まず、ユーザーは、表示部318に再生する静止画像を選択するための操作メニューM500を表示させる。
次に、ユーザーは、外部入力部323から必要な情報を入力してメニュー項目M501及びメニュー項目M504を選択する。例えば、ユーザーは、操作メニューM500に表示されたフォーカスを上下左右決定ボタン等で選択してもよく、あるいは、表示部318がタッチパネル画面である場合には、メニュー項目M501及びメニュー項目M504をタッチして選択してもよい。
外部入力部323へメニュー項目M501及びメニュー項目M504を選択する情報が入力されると、外部入力部323は、メニュー項目M501、及び、メニュー項目M504が選択されたことを示す情報を静止画像抽出部326へ出力する。
静止画像抽出部326は、外部入力部323から、メニュー項目M501及びメニュー項目M504が選択されたことを示す情報が入力されると、図12に示された静止画像と評価点が高かった属性情報との一覧表を参照し、選択されたメニュー項目M501及びM504に対応する属性情報を持つ静止画像を選択する。メニュー項目M501が選択された場合、属性情報の「顔検出/顔識別」の“Z”の評価点が高かった静止画像が該当し、また、メニュー項目M504が選択された場合は、属性情報の「ズームアップ」の“D”の評価点が高かった静止画像が該当する。このため、静止画像抽出部326は、“D”及び“Z”が記述されている静止画像を選択する。図12の場合、P3、P16、P25の3枚が該当することになる。
静止画像抽出部326は、再生する静止画像を特定すると、該当する静止画像を記憶部315から読み出して静止画像信号伸張部325へ出力する。静止画像信号伸張部325は、入力された静止画像を伸張して表示部318へ出力する。そして、表示部318は、静止画像信号伸張部325から入力された静止画像を表示する。
これにより、ユーザーは、選択した条件に該当する静止画像のみ、すなわち、特定の人物の顔が写っていて、さらにズームアップで撮影された静止画像のみを見ることができる。
以下では、特定の人物が写っている静止画像を選択するためのメニュー画面と、静止画像に対応付けられている情報とについて説明する。
図14Aは、特定人物を選択する際の操作メニュー画面の一例を示す図である。図14Bは、撮影された静止画像と人物フラグとを対応付けた表の一例を示す図である。
図14Aに示す操作メニューM610は、メニュー項目M611、M612、M613、M614、M615、M616及びM617から構成される。メニュー項目M611、M612、M613、M614、M615及びM616は、予め定められた1人又は複数の人物を選択するための指示を示しており、予め登録しておいた人物を特定するためのアイコン、静止画像及び人物の名前などが表示されている。これらのメニュー項目は、予め登録している人数に応じて増減する。
図14Aに示す例では、愛子ちゃん、里奈ちゃん、あゆみちゃん、一郎くん、健太郎くん、裕子ちゃんの6人が予め登録されており、6人のそれぞれに相当するメニュー項目M611〜M616が表示されている。なお、メニュー項目M617は、選択すると、人物の選択を決定し、再生を開始することができる。
また、記憶部315に記録されている静止画像には、図14Bに示すように、登録されている人物が写っているか否かを示す特定人物情報(人物フラグ)が各静止画像に対応付けられている。なお、記憶部315は、静止画像の全てに人物フラグを対応付けていてもよく、あるいは、“Z”の属性情報を有する静止画像のみに人物フラグを対応付けて記憶してもよい。
例えば、図14Bに示す例では、静止画像P3には、愛子ちゃんとあゆみちゃんとが写っていることを示している。また、静止画像P9には、登録されている特定人物の全員が写っていることを示している。
人物フラグの対応付けは、例えば、静止画像を撮像する際に行われる顔検出及び顔識別機能を利用する。例えば、静止画像解析部324は、撮像された静止画像に、楕円検出又はテンプレートマッチングなどを行うことで、人物の顔を検出する。さらに、静止画像解析部324は、検出された顔に、より精度の高いテンプレートマッチングなどを行うことで、検出された顔が、それぞれ予め登録された人物に該当するか否かと、該当する場合はどの人物であるかとを検出する。
以下では、具体的に特定の人物が写っている静止画像を選択する手順について説明する。図15は、特定の人物が写っている静止画像を選択するための操作メニューの画面遷移の一例を示す図である。
例えば、図13Aの操作メニューM500でメニュー項目M501又はメニュー項目M502が選択された場合などに、図15に示したような操作メニューを表示させて、ユーザーが操作することで人物を選択することが可能である。
特定の人物が写っている静止画像を選択する場合、操作メニューM600において、ユーザーは、メニュー項目M601の「顔の指定あり」を選択し、メニュー項目M603の「決定」を選択する。なお、メニュー項目M601は、予め定められた1人又は複数の特定人物の選択を開始するための指示を示している。
操作メニューM600において、メニュー項目M603「決定」が選択されると、図14Aにも示した操作メニューM610が表示部318に表示される。
操作メニューM610では、実際に静止画像に撮影された人物の代表的な顔写真又は画像、及び/又は、人物の名前又はあだ名などの文字列が表示される。例えば、メニュー項目M611は、愛子ちゃんを示す顔写真又は画像と、名前又はあだ名とが表示されている。
愛子ちゃんと健太郎くんとが写っている静止画像を再生したい場合、ユーザーは、愛子ちゃんに相当するメニュー項目M611と健太郎くんに相当するメニュー項目M615とを選択し、メニュー項目M617の「決定」を選択する。外部入力部323は、メニュー項目M611、M615及びM617が選択されたことを受け付け、メニュー項目M611及びM615が選択されたことを示す情報を、静止画像抽出部326に出力する。
操作メニューM610で、再生したい人物が指定されて決定が選択されると、静止画像抽出部326は、該当する静止画像を記憶部315から読み出して、静止画像の枚数及び予め設定されている1枚の静止画像あたりの再生時間等を基に、選択された静止画像の再生時間を算出する。
操作メニューM610で、再生したい人物が指定されてメニュー項目M617の「決定」が選択されると、操作メニューM620が表示部318に表示される。
操作メニューM620は、操作メニューM610で選択された人物の静止画像を記憶部315から抽出するまでの待ち時間に表示される。
静止画像抽出部326が、選択された静止画像の再生時間を算出すると、操作メニューM630が表示部318に表示される。
操作メニューM630では、操作メニューM620で選択された人物が写っている静止画像の再生時間を表示される。なお、ここでは1枚の静止画像は4秒間再生されるとする。
例えば、愛子ちゃんが写っている静止画像の再生時間は、メニュー項目M631に示すように2分30秒、また、健太郎くんが写っている静止画像の再生時間は、メニュー項目M632に示すように1分20秒である。そして、愛子ちゃんと健太郎くんとのいずれか、又は、両方が写っている静止画像の合計の再生時間は、メニュー項目M633に示すように3分10秒となる。メニュー項目M633が示す合計の再生時間が、愛子ちゃん、及び健太郎くんのそれぞれが写っている静止画像の再生時間(メニュー項目M631が示す2分30秒とメニュー項目M632が示す1分20秒)の合計よりも短くなっているのは、愛子ちゃんと健太郎くんの両方が1枚の静止画像に写っている場合も含まれるためである。
以上の操作により、特定の人物を選択して再生することが可能になる。
なお、静止画像解析部324は、顔検出及び顔識別を行う際に、複数の顔が検出された場合は、複数の顔のそれぞれの距離を算出してもよい。そして、静止画像解析部324は、算出した距離情報も人物フラグと同様に静止画像に対応付けて記憶部315に記録する。
再生時には、外部入力部323は、例えば、図16のメニュー項目M604及びM605に示すような距離の指定の有無の選択を受け付ける。メニュー項目M604の「距離の指定あり」が選択された場合、静止画像抽出部326は、複数の人物が検出された静止画像の中から、静止画像に写っている人物間の距離が所定の閾値より小さい静止画像を選択する。
また、静止画像解析部324は、顔検出及び顔識別を行う際に、複数の顔が検出された場合は、複数の顔のそれぞれの表情も検出してもよい。例えば、静止画像解析部324は、目が開いているか否か、すなわち、目蓋が閉じられていないかを検出する。あるいは、静止画像解析部324は、口元又は目尻などの傾き具合などから顔が笑顔であるか否かを検出する。そして、静止画像解析部324は、検出した表情を示す情報も人物フラグと同様に静止画像に対応付けて記憶部315に記録する。
再生時には、外部入力部323は、例えば、図16のメニュー項目M606及びM607に示すような表情の指定の有無の選択を受け付ける。メニュー項目M606の「表情の指定あり」が選択された場合、静止画像抽出部326は、複数の人物が検出された静止画像の中から、静止画像に写っている人物の表情が所定の条件(例えば、目蓋が閉じられていない、又は笑顔)に該当する静止画像を選択する。
<評価点が予め定めた閾値より高い静止画像の再生>
次に、ビデオカメラ100において、ユーザーが動画撮影時に撮影された静止画像を再生する際、撮影した静止画像のうち、評価点の高い静止画像のみを選択して再生する手順を説明する。
まず、ユーザーは、表示部318に再生する静止画像を選択するための操作メニューM500を表示させる。
次に、外部入力部323から必要な情報を入力してメニュー項目M506を選択する。例えば、ユーザーは、操作メニューM500に表示されたフォーカスを上下左右決定ボタン等で選択してもよく、あるいは、表示部318がタッチパネル画面である場合には、メニュー項目M506をタッチして選択してもよい。
外部入力部323へメニュー項目M506を選択する情報が入力されると、外部入力部323は、メニュー項目M506が選択されたことを示す情報を静止画像抽出部326へ出力する。
静止画像抽出部326は、外部入力部323から、メニュー項目M506が選択されたことを示す情報が入力されると、図12に示された静止画像と静止画像の評価点との一覧表を参照し、予め定められた閾値以上の評価値を有する静止画像を選択する。例えば、メニュー項目M506が選択された場合には、評価点が閾値(80)以上の静止画像が再生されるとした場合の静止画像の評価点と閾値とを図17に示す。図17の場合、P3、P4、P9、P12、P13、P14、P15、P16、P17、P21、P22の11枚が該当することになる。
静止画像抽出部326は、再生する静止画像を特定すると、該当する静止画像を記憶部315から読み出して、静止画像信号伸張部325へ出力する。静止画像信号伸張部325は、入力された静止画像を伸張して表示部318へ出力する。そして、表示部318は、静止画像信号伸張部325から入力された静止画像を表示する。
これにより、ユーザーは、選択した条件に該当する静止画像のみ、すなわち、撮影された静止画像のうち、評価点が予め定めた閾値以上の値を持つ静止画像のみを視聴することができる。
なお、本実施の形態では、メニュー項目M506は、選択すると、動画撮影時に撮影された静止画像の評価点を解析し、予め定められた評価点以上の静止画像を抽出して選択するとしたが、予め再生する枚数を定めておき、その枚数に対応するように再生する静止画像の評価点の下限を決めてもよい。例えば、静止画像抽出部326は、評価点の高い静止画像から順に選択し、選択した静止画像の枚数が予め定められた枚数に達した場合に、選択を終了する。
また、予め再生する時間と1枚を表示する時間とを定めておき、これらから算出される合計時間に対応するように、再生する静止画像の評価点の下限を決めてもよい。もちろん、上記の手順で静止画像を選択するためのメニュー項目をメニュー項目M506と別に設けてもよい。
<動画の再生区間に撮影された静止画像の再生>
次に、ビデオカメラ100において、ユーザーが動画撮影時に撮影された静止画像を再生する際、動画の再生区間に撮影された静止画像のみを選択して再生する手順を説明する。
まず、ユーザーは、表示部318に再生する静止画像を選択するための操作メニューM500を表示させる。
次に、ユーザーは、外部入力部323から必要な情報を入力してメニュー項目M507を選択する。例えば、ユーザーは、操作メニューM500に表示されたフォーカスを上下左右決定ボタン等で選択してもよく、あるいは、表示部318がタッチパネル画面である場合には、メニュー項目M507をタッチして選択してもよい。
外部入力部323へメニュー項目M507を選択する情報が入力されると、外部入力部323は、メニュー項目M507が選択されたことを示す情報を静止画像抽出部326へ出力する。
静止画像抽出部326は、外部入力部323から、メニュー項目M507が選択されたことを示す情報が入力されると、図8に示したシーンの開始時刻、及び終了時刻と、図11に示した各静止画像の撮影時刻とを参照し、静止画像の撮影時刻が図8に示されたシーンのいずれかに含まれる静止画像を抽出する。
撮影フレームを静止画像の観点で評価した図11のグラフに、図8で示した動画の再生区間を記入した図を図18に示す。図18に示したように、動画の再生区間に含まれる静止画像を抽出すると、P1、P5、P6、P8が該当する。
静止画像抽出部326は、再生する静止画像を特定すると、該当する静止画像を記憶部315から読み出して静止画像信号伸張部325へ出力する。静止画像信号伸張部325は、入力された静止画像を伸張して表示部318へ出力する。そして、表示部318は、静止画像信号伸張部325から入力された静止画像を表示する。
これにより、ユーザーは、動画の再生区間に含まれる静止画像のみを視聴することができる。
なお、操作メニューM500は、ユーザーが外部入力部323からメニューを表示させる何らかのコマンドが入力された場合に表示部318に表示されてもよい。あるいは、操作メニューM500は、ビデオカメラ100が、撮影モードと再生モードとを具備し、何らかの入力によって撮影モードから再生モードに切り換えられたときに表示部318に自動的に表示されてもよい。
また、再生する静止画像を選択する情報は、実施例では再生の際に入力したが、予め再生用の設定項目等で優先的に行いたい再生条件が設定できるようになっていてもよい。その場合は、静止画像の再生を実行すると、予め定められた設定内容に応じて、自動的に該当する静止画像が選択されて再生される。
図19は、本実施の形態に係るビデオカメラ100の動作のうち、静止画像を再生する動作の一例を示すフローチャートである。
まず、外部入力部323は、ユーザーからの指示を受け付ける(S201)。具体的には、表示部318は、再生処理が開始されると、図13Aに示すような操作メニューM500を表示し、外部入力部323は、メニュー項目の選択をユーザーからの指示として受け付ける。
次に、静止画像抽出部326は、外部入力部323によって受け付けられた指示に基づいて、静止画像を抽出する(S202)。つまり、静止画像抽出部326は、外部入力部323によって受け付けられた指示に対応する種類の属性情報に対応付けられた静止画像を抽出する。静止画像の抽出の具体例については、上述した通りである。抽出された静止画像は、静止画像信号伸張部325によって必要に応じて伸張される。
そして、表示部318は、抽出された静止画像のみを表示する(S203)。
以上のようにして、本実施の形態に係るビデオカメラ100は、ユーザーが所望する属性情報の種類の選択を受け付け、該当する属性情報に対応付けられた静止画像を再生するので、ユーザーが所望する静止画像を効率良く再生することができる。したがって、ユーザーに所望の静止画像を1枚ずつ選択させることを強いることなく、ユーザーが所望する静止画像を効率良く再生することができる。
以上、本発明に係る撮影装置及び再生方法について、実施の形態に基づいて説明したが、本発明は、これらの実施の形態に限定されるものではない。本発明の趣旨を逸脱しない限り、当業者が思いつく各種変形を当該実施の形態に施したものや、異なる実施の形態における構成要素を組み合わせて構築される形態も、本発明の範囲内に含まれる。
なお、本発明は、上述したように、撮影装置及び再生方法として実現できるだけではなく、本実施の形態の再生方法をコンピュータに実行させるためのプログラムとして実現してもよい。また、当該プログラムを記録するコンピュータ読み取り可能なCD−ROMなどの記録媒体として実現してもよい。さらに、当該プログラムを示す情報、データ又は信号として実現してもよい。そして、これらプログラム、情報、データ及び信号は、インターネットなどの通信ネットワークを介して配信されてもよい。
また、本発明は、撮影装置を構成する構成要素の一部又は全部を、1個のシステムLSI(Large Scale Integration)から構成してもよい。システムLSIは、複数の構成部を1個のチップ上に集積して製造された超多機能LSIであり、具体的には、マイクロプロセッサ、ROM及びRAMなどを含んで構成されるコンピュータシステムである。
本発明に係る撮影装置及び再生方法は、自動的に撮影された静止画像から再生したい静止画像を効率良く選択することが可能となるという効果を奏し、ビデオカメラなどに利用することができる。
100 ビデオカメラ
110、301 撮像部
120、309 属性情報生成部
130 記録部
140 受付部
150 再生部
160 メモリ
200 レンズ群
201 撮像素子
202 映像ADC
203 映像信号変換回路
204 CPU
205 クロック
206 レンズ制御モジュール
206a レンズ制御用モータ
206b レンズ位置センサ
207 姿勢検出センサ
207a、308a 加速度センサ
207b、308b 角速度センサ
207c、308c 仰角・俯角センサ
208 入力ボタン
209 ディスプレイ
210 スピーカー
211 出力I/F
212 圧縮伸張回路
213 ROM
214 RAM
215 HDD
216 音声ADC
217 マイクロフォン
300 レンズ部
302 映像AD変換部
303 信号処理部
304 映像信号圧縮部
305 撮像制御部
306 映像解析部
307 レンズ制御部
307a ズーム制御部
307b フォーカス制御部
307c 手振れ補正制御部
308 姿勢検出部
310 シーン解析部
311 再生情報生成部
312 音声解析部
313 音声信号圧縮部
314 多重化部
315 記憶部
318 表示部
321 音声AD変換部
322 マイク部
323 外部入力部
324 静止画像解析部
325 静止画像信号伸張部
326 静止画像抽出部
M500、M600、M610、M620、M630 操作メニュー
M501、M502、M503、M504、M505、M506、M507、M521、M522、M601、M602、M603、M604、M605、M606、M607、M611、M612、M613、M614、M615、M616、M617、M631、M632、M633 メニュー項目

Claims (12)

  1. 動画像の撮影中に静止画像を撮影し、撮影した静止画像を再生する撮影装置であって、
    前記動画像を撮影するとともに、当該動画像の撮影中に静止画像を撮影する撮像部と、
    前記撮像部によって撮影された動画像及び静止画像の少なくとも一方の撮影状況を示す1種類以上の属性情報を生成する属性情報生成部と、
    前記撮像部によって撮影された静止画像と、前記属性情報生成部によって生成された属性情報とを対応付けてメモリに記録する記録部と、
    前記属性情報の種類を選択するための指示を受け付ける受付部と、
    前記受付部によって受け付けられた指示に対応する種類の属性情報に対応付けられた静止画像を前記メモリから読み出して再生する再生部とを備える
    撮影装置。
  2. 前記属性情報生成部は、前記撮像部によって撮影された静止画像の撮影状況を示す属性情報をフレーム毎に生成する
    請求項1記載の撮影装置。
  3. 前記属性情報は、前記動画像及び前記静止画像の少なくとも一方の撮影中における、前記撮影装置の動作を示す動作情報と、被写体の特徴を示す被写体情報と、前記動作情報及び前記被写体情報の評価値との少なくとも1つを含み、
    前記受付部は、前記動作情報と前記被写体情報と前記評価値との少なくとも1つを選択するための指示を受け付ける
    請求項2記載の撮影装置。
  4. 前記受付部は、前記評価値が予め定められた閾値より高い静止画像を選択するための第1指示を受け付け、
    前記再生部は、前記受付部が前記第1指示を受け付けた場合、前記閾値より高い評価値が対応付けられた静止画像を再生する
    請求項3記載の撮影装置。
  5. 前記属性情報は、前記被写体情報として、対応付けられた静止画像に人物が写っていることを示す人物情報を含み、
    前記受付部は、人物が写っている静止画像を選択するための第2指示を受け付け、
    前記再生部は、前記受付部が前記第2指示を受け付けた場合、前記人物情報が対応付けられた静止画像を再生する
    請求項3記載の撮影装置。
  6. 前記記録部は、さらに、前記撮像部によって撮影された静止画像に、予め定められた人物を示す特定人物情報を対応付けて、前記メモリに記録し、
    前記受付部は、前記第2指示を受け付けた場合、さらに、予め定められた1人の人物を選択するための第3指示を受け付け、
    前記再生部は、前記人物情報が対応付けられた静止画像のうち、前記受付部によって受け付けられた第3指示に対応する特定人物情報が対応付けられた静止画像を再生する
    請求項5記載の撮影装置。
  7. 前記記録部は、さらに、前記撮像部によって撮影された静止画像に、予め定められた複数の人物を示す複数の特定人物情報を対応付けて、前記メモリに記録し、
    前記受付部は、前記第2指示を受け付けた場合、さらに、予め定められた複数の人物を選択するための第4指示を受け付け、
    前記再生部は、前記人物情報に対応付けられた静止画像のうち、前記受付部によって受け付けられた第3指示に対応する特定人物情報が対応付けられた静止画像を再生する
    請求項5記載の撮影装置。
  8. 前記再生部は、前記受付部によって受け付けられた第4指示に対応する特定人物情報が対応付けられた静止画像のうち、複数の人物間の距離が所定の距離より小さい静止画像を再生する
    請求項7記載の撮影装置。
  9. 前記再生部は、前記受付部によって受け付けられた第3指示に対応する特定人物情報が対応付けられた静止画像のうち、前記予め定められた人物が予め定められた表情である静止画像を再生する
    請求項6記載の撮影装置。
  10. 前記受付部は、前記動画像の属性情報に基づいて静止画像を選択するための第5指示を受け付け、
    前記再生部は、前記受付部が前記第5指示を受け付けた場合、前記動画像の属性情報が予め定められた条件を満たしている期間に撮影された静止画像を抽出する
    請求項1記載の撮影装置。
  11. 前記撮影装置は、さらに、
    前記属性情報が対応付けられた1つ以上のメニュー項目を表示する表示部を備え、
    前記受付部は、前記表示部に表示された1つ以上のメニュー項目の選択を前記指示として受け付ける
    請求項1記載の撮影装置。
  12. 動画像の撮影中に撮影した静止画像をメモリから読み出して再生する再生方法であって、
    前記メモリには、前記動画像の撮影中撮影された静止画像と、前記動画像及び前記静止画像の少なくとも一方の撮影状況を示す1種類以上の属性情報とが対応付けて記憶され、
    前記再生方法は、
    前記属性情報の種類を選択するための指示を受け付ける受付ステップと、
    前記受付ステップにおいて受け付けられた指示に対応する種類の属性情報に対応付けられた静止画像を前記メモリから読み出して再生する再生ステップとを含む
    再生方法。
JP2009274909A 2009-12-02 2009-12-02 撮影装置及び再生方法 Pending JP2011119936A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009274909A JP2011119936A (ja) 2009-12-02 2009-12-02 撮影装置及び再生方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009274909A JP2011119936A (ja) 2009-12-02 2009-12-02 撮影装置及び再生方法

Publications (1)

Publication Number Publication Date
JP2011119936A true JP2011119936A (ja) 2011-06-16

Family

ID=44284736

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009274909A Pending JP2011119936A (ja) 2009-12-02 2009-12-02 撮影装置及び再生方法

Country Status (1)

Country Link
JP (1) JP2011119936A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015126517A (ja) * 2013-12-27 2015-07-06 キヤノン株式会社 画像処理装置、画像処理方法、プログラム
JP2016151619A (ja) * 2015-02-16 2016-08-22 キヤノン株式会社 ブレ補正装置及びその制御方法
JP2017185847A (ja) * 2016-04-01 2017-10-12 株式会社ユピテル 装置及びプログラム
DE102019118751A1 (de) * 2019-07-10 2021-01-14 Schölly Fiberoptic GmbH Verfahren zur Synthese von Standbildern aus einem mit einem medizinischen Bildaufnahmesystem aufgezeichneten Videobilddatenstrom

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015126517A (ja) * 2013-12-27 2015-07-06 キヤノン株式会社 画像処理装置、画像処理方法、プログラム
JP2016151619A (ja) * 2015-02-16 2016-08-22 キヤノン株式会社 ブレ補正装置及びその制御方法
JP2017185847A (ja) * 2016-04-01 2017-10-12 株式会社ユピテル 装置及びプログラム
DE102019118751A1 (de) * 2019-07-10 2021-01-14 Schölly Fiberoptic GmbH Verfahren zur Synthese von Standbildern aus einem mit einem medizinischen Bildaufnahmesystem aufgezeichneten Videobilddatenstrom

Similar Documents

Publication Publication Date Title
JP5685732B2 (ja) 映像抽出装置、プログラム及び記録媒体
JP5456023B2 (ja) 画像撮影装置、画像撮影方法、プログラム、及び集積回路
US7417668B2 (en) Digital camera
US20070159533A1 (en) Image filing method, digital camera, image filing program and video recording player
JP5837922B2 (ja) カメラ位置に基づくキービデオフレームのランク付け
EP2710795A1 (en) Video summary including a particular person
EP2710594A1 (en) Video summary including a feature of interest
JP2011082966A (ja) 撮像装置
KR20120068078A (ko) 영상 처리 장치 및 그의 영상 데이터와 오디오 데이터의 연결 방법
US8582948B2 (en) Scenario editing apparatus and scenario editing method, image capturing apparatus and control method thereof, and scenario editing system
KR101737086B1 (ko) 디지털 촬영 장치 및 이의 제어 방법
KR20150032165A (ko) 결합하는 동영상의 동영상 선별 장치, 동영상 선별 방법 및 기억 매체
KR20150141059A (ko) 동영상의 썸네일 영상을 제공하는 장치 및 방법
JP2010245856A (ja) 映像編集装置
JP2011119936A (ja) 撮影装置及び再生方法
JP4595832B2 (ja) 撮像装置、プログラム、及び記憶媒体
JP5064173B2 (ja) カメラ
JP6355333B2 (ja) 撮像装置、画像処理装置、画像処理方法、プログラム
JP4948014B2 (ja) 電子カメラ
JP2011119934A (ja) 画像撮影装置及び画像撮影方法
JP4636024B2 (ja) 撮像装置
JP2010171849A (ja) 画像再生装置および電子カメラ
JP2014072642A (ja) 動画像データ処理システム、動画像データ送信装置、及び動画像データ受信装置
JP5045792B2 (ja) 撮像装置、並びにプログラム
JP6249771B2 (ja) 画像処理装置、画像処理方法、プログラム