JP2008103802A - 映像合成装置 - Google Patents

映像合成装置 Download PDF

Info

Publication number
JP2008103802A
JP2008103802A JP2006282371A JP2006282371A JP2008103802A JP 2008103802 A JP2008103802 A JP 2008103802A JP 2006282371 A JP2006282371 A JP 2006282371A JP 2006282371 A JP2006282371 A JP 2006282371A JP 2008103802 A JP2008103802 A JP 2008103802A
Authority
JP
Japan
Prior art keywords
video
scene
unit
information
importance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006282371A
Other languages
English (en)
Inventor
Takeaki Suenaga
健明 末永
Yoshiaki Ogisawa
義昭 荻澤
Shuichi Watabe
秀一 渡部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2006282371A priority Critical patent/JP2008103802A/ja
Publication of JP2008103802A publication Critical patent/JP2008103802A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Processing (AREA)
  • Studio Circuits (AREA)
  • Television Signal Processing For Recording (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

【課題】 ユーザが重要としない映像シーンを視聴している時に、映像シーンと関連のある映像を選択し、合成して表示することにより、ユーザが主として視聴している映像への視聴意欲や理解を妨げることなく、他の映像の情報も提示可能な映像合成装置を提供する。
【解決手段】 ユーザが現在、視聴している映像内の各シーンから映像特徴検出部102が特徴情報を取得し、それらを用いて重要度計算部103は各シーンに対する重要度の指標の値を逐次計算することで、非重要シーン特定部104が重要ではない一定の区間(シーン)を検出する。録画済映像選択部106では、視聴している映像に関連する副映像を記憶部105より選択する。重要ではないシーンに合わせて、映像合成部109が主として視聴中の映像に関連する副映像を合成する。
【選択図】図1

Description

本発明は、複数の映像を合成して表示を行う映像合成装置に関する。
近年、ネットワークの高速化、チャンネルの多様化に伴い、個人が視聴することの出来る映像、動画コンテンツの量は飛躍的に増加している。また、DVD(Digital Versatile Disc)やハードディスク装置(HDD)などの記録媒体の大容量化に伴い、映像をこれらの記録媒体へ大量に録画し、放送時間に縛られることなく番組を視聴するというスタイルも一般的となった。
このように個人が扱う映像の量が膨大になると、これら映像の中に自分が視聴したいと考えうる映像が存在しているかどうかを容易に知ることが出来なくなる。そこで、この膨大な映像の中から映像の存在を得るための手法として、特許文献1では、主として視聴する任意の映像を視聴している間に、映像に添付されている付加情報を基に関連する映像を自動で検索し、その情報又はそれ自身を多重化して出力する手法が提案されている。
特開2003−134428号公報
しかしながら、特許文献1では映像を挿入するタイミングまでは考慮されておらず、ユーザにとって重要と考えられるシーンにまで多重化を行ってしまい、その結果ユーザの映像への視聴意欲を著しく削ぐものであった。
また、特許文献1では映像に添付される情報を用いて、番組開始時にその番組に関連する別の映像を検索しているが、一般的に映像は信号的、意味的に性質の異なる複数のシーンの組み合わせで成っているものであるから、この刻々と変化するシーン各々に関連する適切な別の映像を選択するには、この手法では不十分であった。
更に、映像が挿入され多重表示する区間が、元の映像の総再生時間より長くなる場合、単純に挿入された映像を先頭から再生するだけでは、挿入された映像を最後まで再生する前に元の映像の再生が終わり、挿入された映像の再生が途中までとなってしまい、ユーザが挿入された映像の概要を理解することが難しくなるという問題があった。
そこで、本発明の目的は、ユーザが重要としない映像シーンを視聴している時に、該映像シーンと関連のある映像を選択し、合成して表示することにより、ユーザが主として視聴している映像への視聴意欲や理解を妨げることなく、他の映像の情報も提示可能な映像合成装置を提供しようとするものである。
斯かる実情に鑑み、第1の発明による映像合成装置は、放送または記録されている少なくとも2つの映像を合成して表示する映像合成装置であって、
前記映像内の各シーンに対応する特徴情報を検出する特徴検出部と、前記映像および/または前記特徴情報を記録する記録部と、前記特徴情報に基づいて第1の映像の各シーンに対する重要度についての指標の値を計算する計算部と、第2の映像を選択する映像選択部と、前記指標の値に基づいて前記第2の映像を合成する前記第1の映像内のシーンを特定するシーン特定部と、前記シーン特定部で特定された前記第1の映像内の当該シーンに前記第2の映像を合成する映像合成部と、を具備することを特徴とする。
また、第2の発明による映像合成装置は、前記映像選択部が、前記特徴情報に基づいて、前記第2の映像として、前記第1の映像に類似または関連した映像を検出して選択することを特徴とする。
また、第3の発明による映像合成装置は、前記映像選択部が、前記第1の映像のシーンごとあるいは連続するシーングループごとの前記特徴情報に基づいて前記第2の映像を選択することを特徴とする。
また、第4の発明による映像合成装置は、前記映像選択部が前記第2の映像を選択するための前記特徴情報は、前記シーン特定部で特定された前記第1の映像内のシーンの直近の前記指標の値が高いシーンあるいはシーングループから得られる前記特徴情報とすることを特徴とする。
また、第5の発明による映像合成装置は、前記第1の映像が放送中の映像であり、前記第2の映像が装置内に記録されている映像であることを特徴とする。
また、第6の発明による映像合成装置は、前記第1の映像および前記第2の映像が共に、装置内に記録された映像であることを特徴とする。
また、第7の発明による映像合成装置は、前記特徴情報が、映像中で刻々と変化する映像情報、音声情報、テキスト情報を含むことを特徴とする。
また、第8の発明による映像合成装置は、前記シーン特定部が、前記指標の値に対して閾値処理を行うことで、前記第2の映像を合成する前記第1の映像内のシーンを特定することを特徴とする。
また、第9の発明による映像合成装置は、前記計算部が、前記閾値を設定し、前記指標の値とともに、前記シーン特定部に出力することを特徴とする。
また、第10の発明による映像合成装置は、前記計算部が、第1の映像シーンの種別により前記閾値の選択域の情報を反転させることを特徴とする。
また、第11の発明による映像合成装置は、前記映像合成部が、選択した前記第2の映像を、前記シーン特定部で特定された前記第1の映像内のシーンの連続時間長さに合わせたダイジェスト映像として編集することを特徴とする。
本発明では、ユーザが現在、主として視聴している映像内の各シーンから映像情報を取得し、それらを用いて各シーンに対する重要度の指標の値を逐次計算することで、重要ではない一定の区間(シーン)を検出する。この重要ではないシーンに合わせて主として視聴中の映像に関連する他の映像を多重化することで、ユーザが主として視聴している映像への視聴意欲や理解を妨げることなく、他の映像の情報を提供することができる。
また、この選択された映像を、主として視聴中の映像において重要ではないとされたシーンの直前のシーン、即ち最近重要とされていたシーンから得られる特徴も加味して選択することで、ユーザのその時々の興味を推定した、適切なコンテンツを選出することができる。
また、選択された映像を、重要ではないシーンの長さに合わせてダイジェストに編集し、再生することにより短時間で選択された映像の概要を知ることができる。
以下、本発明の実施の形態を図示例と共に説明する。
図1は、本発明の一実施形態にかかる映像合成装置の概略構成を示した機能ブロック図である。
図1の映像合成装置100は、映像入力部101から得られた映像とその映像に付随する付属情報から、その映像の特徴を検出する映像特徴検出部102、得られた映像特徴から映像各シーンの重要度を計算する重要度計算部103、計算された重要度から、重要度の低いシーン区間を特定する非重要シーン特定部104、記録部105に既に録画記録された映像とその映像特徴から、入力映像と録画済映像の特徴相関を計算し、入力映像に相関のある映像を録画済映像から選択する録画済映像選択部106、選択された録画済映像、その映像特徴と非重要シーン特定部104から得られた非重要シーン区間情報を受け取ってダイジェストを作成するダイジェスト作成部107、放送コンテンツと録画済コンテンツのダイジェストから動画像出力部108上の画面表示を切り替える映像合成部109とを含んで構成される。
一般に、ある映像を視聴する際、ユーザは常にその映像に集中しているわけではない。コマーシャル中や単調なシーンなど、一般的にあまり重要とされないシーンにおいて、ユーザは視聴中の映像に対する興味を一時的に失ってしまう。
本発明では、ユーザが主として視聴している映像(以下、「主映像」という)の各シーンの重要度を計算し、閾値を用いて重要度が低いと判断されたシーンに合わせて、蓄積された映像の中から、現在のユーザの興味を推定した適切な映像(以下、「副映像」という)を選択し、その副映像自身または副映像を再編集したダイジェストを再生する。
ここで、本発明における重要度とは、映像内各シーンの視聴する価値を示す指標とする。ここで、主映像と副映像は同時に再生されるため、副映像を視聴している間、主映像の内容が全く把握できなくなるようなことはない。
更に、ユーザの興味が高いと推定される映像を副映像として選択することで、ユーザは飽きること無く映像視聴を行うことが出来る。
以下に、図1各部の詳細を示す。
まず、映像特徴検出部102の動作を説明する。
映像特徴検出部102は、映像から様々な情報を取得し、映像全体、またはシーンごとの特徴を検出するブロックである。ここで得られた映像特徴は、録画済映像選択部106と重要度計算部103に伝達され、視聴の映像と類似または関連した映像の検索や、映像の重要度を計算するのに利用される。録画済映像選択部106と重要度計算部103の詳細については後述する。
映像特徴検出部102で映像特徴を検出する為に、映像自体から得られる情報乃至は映像に付属する情報を利用できる。
映像自体から得られる情報の例としては、画像情報、音声情報または字幕情報など、映像に付属する情報としてはEPG(Electronic Program Guide)、映像に付されたタグ情報などが挙げられる。
これら映像情報から得られる映像特徴の例として、画像情報から得られるシーン切替位置や色ヒストグラム情報、エッジ情報、テロップ情報、動きベクトル情報、音声情報から得られる音声レベルや発話位置、背景音楽(BGM)情報、EPGやタグ情報から得られるタイトル、ジャンル情報、出演者、録画日時などの重要キーワードが挙げられる。
映像特徴はシーンごとに求められるものであって、映像入力部101から得られる入力映像が放送中の映像であった場合、リアルタイムに処理しなければならないが、映像入力部101からの入力映像が録画済の映像、即ちユーザの視聴開始前に映像全体が既知であった場合、事前に処理しておくことが可能である。この場合、映像特徴を事前に検出し、記録部105に記録しておく構成としても良い。
重要度計算部103では、映像特徴検出部102から得られた映像の特徴を利用し、シーンごとに重要度を計算する。
前述したように、一般にユーザは自分で興味のある映像を選択し視聴している場合でも、全ての時間その映像に集中しているわけではない。
例えば、サッカーの試合における単調なパス回しのシーンや、野球の試合における攻守交替時などの一般的に盛り上がりに欠けるシーン、バラエティや歌番組などでは好みのタレントや歌手が出演していないシーンなどはユーザが映像に対して一時的に興味を失い、その映像に集中しなくなる。
本発明では、刻々と変化する映像の各シーンから得られる複数の映像特徴を単一的乃至は複合的に利用し、シーンごとの重要度を決定する。この重要度を用いてユーザが映像に対して興味を失うシーンを推定する。
例えば、人物やテロップが出現するシーンなど、ユーザが有用な情報を取得可能なオブジェクトが多数存在するシーンでは、エッジ強度が高い領域を多く含むという特徴がある。このことから、エッジ強度を用いた重要度が考えられる。
まずエッジ強度eを、次式で求める。
e=f(p)・・・(1)
ここでpは任意の画像の各画素における輝度であり、f(p)はSobelやLaplacianに代表されるエッジ取得の為のフィルタである。
このエッジ情報eが事前に設定された閾値tを越える画素をエッジ強度が高い領域として検出し、これらエッジ強度が高い領域の出現頻度Nを重要度wとすると、次式のようになる。
w=N(e)・・・(2)
また、前述のエッジ強度eが高い画素の集合に更にハフ変換を用いて、円や直線などの人工の幾何学的な規則性を抽出し、その出現頻度を重要度としても良い。
この他にも音声情報を用いた重要度計算も考えられる。
盛り上がったシーンのみを検出する為に、音声情報から得られる、音声レベルを重要度としても良いし、人物が会話するシーンを検出する為に、音声情報から音声区間を検出し、更に人の声の周波数特性から発話区間を特定、その出現頻度を重要度としても良い。また、モノラル音声が番組本編、ステレオ音声がコマーシャルとなっている番組の場合、この音声フォーマットの種別を利用してコマーシャルシーン区間を検出し、コマーシャルシーン区間の重要の度合いが低くなるように重要度を設定しても良い。
上記重要度作成の例では、映像を復号した後の情報を用いて重要度の計算を行ったが、勿論復号前の情報を用いて重要度を計算しても良い。例えば、映像がMPEG(Moving Picture Experts Group)方式のようなフレーム間予測符号化方式によって圧縮されていた場合、復号前の映像データから得られる動きベクトル情報を用いることによって、映像中の動きが激しい区間、即ちユーザに視覚的に刺激を与えるかどうかを重要度とすることも出来る。
また、いくつかの映像特徴を複合的に利用した重要度の計算方法も考えられる。
図2は、重要度計算の一例を示した図である。
図2を用いて、スポーツ映像を視聴中の場合の重要度計算の例を示す。
サッカーなどのスポーツ映像を視聴している場合には、ユーザが興味を持つのは、シュート、決定的なパス、ファールなど試合結果を左右するような決定的なイベントが発生したシーンであることが多く、それ以外のシーンに対しては興味が薄くなることが多い。
このことから、前記決定的なシーンを特徴付ける映像情報に対して重要度が高くなるように計算を行う。
一般的に、前記重要なイベントが発生したシーンでは以下のような映像特徴が得られる。
I.観客の歓声が大きくなることから、音声レベルが高くなる。
II.重要なシーンを最適な角度から捉えようと様々な角度からのカメラに次々と切り替えられることが多いことからカメラ切替頻度が高い。
III.得点が入ったシーンでは、画面上に文字情報が表示される。
これらの特徴から、図2(a)に示すように映像特徴検出部102から音声レベル、カメラ切り替え頻度、文字情報出現頻度を映像特徴として取得し、任意の時刻tでの音声レベルをx、時刻t前後の単位時間中のカメラ切り替え頻度をy、時刻t前後の単位時間中の文字情報出現頻度をzとすると、係数a、b、cを利用し、映像重要度wを以下のように計算することができる。
w=ax+by+cz・・・(3)
図2(b)は、(3)の式により計算した例を示す。
ここで、係数a、b、cは本装置に予め設定されている任意の値とする。これ以降、特に断りが無い限り、予め設定された値とは本装置で予め設定された任意の値であるとする。
一方、ドラマなどの映像においては、出演者が大きく映し出されたシーンや出演者の発話シーンにユーザに興味を抱かせるイベントが含まれていることが多いので、映像情報からシーンの切り替わりの多さ、出演者の発話の長さや回数などを映像特徴として検出し映像の重要度合いの指標とすることができる。
それ以外にも、予め好みの俳優の画像、音声などを登録しておき、パターンマッチングなどの手法で、現在のシーンに含まれる情報が事前に登録された画像、音声にマッチするかどうかを判定し、これら好みの俳優が出演しているシーンか否かを重要度の指標としても良い。
また、ニュース、情報番組などの映像では、一般にアナウンサーがメイン画面中央に配置され、発話しているシーンや、テロップが含まれるシーンにユーザにとって有益な情報が含まれる傾向がある。よって、映像情報からテロップの出現頻度や発話位置などを映像特徴として取得し、複合的に利用することで、各シーンの映像重要度を計算することが可能となる。
図2を用いた説明において、係数a、b、cは予め設定されている値であるとしたが、ユーザがその視聴目的に応じて任意に決定できる係数としても良い。
例えば、ユーザが得点の入ったシーンに重きを置く場合、それらのシーンは歓声が大きく、得点が入ったことを示す文字情報が挿入されることから、音声レベルの係数aと文字出現頻度の係数cを大きくすることにより、得点の入るシーンに対する重要度が高くなる。
また、ユーザが得点の有無に関わらず、試合を左右する決定的なシーン全般に対して重きを置く場合、それらのシーンでは歓声が大きく、リプレイが多く取り入れられることから、音声レベルの係数aとカメラ切り替え頻度の係数bを大きくすることで、決定的なシーン全般が重要とされる重要度をユーザは得ることが出来る。
図3は、ユーザからの入力を受け付けるインターフェイスの例を示した図である。
この際のユーザからの入力は、操作入力部110から得るものとし、図3(a)に示すように、コンボボックス形式で、予め用意した複数の重要とする要素と、その係数を入力させる形式としても良い。
または、重要度計算部103は、映像ジャンルごとに、係数a、b、cの値を設定したテーブルを備え、これを参照して重要度を計算するとしてもよい。
無論、重要度を計算する際に使用する映像特徴はいくつ使用しても良いし、映像重要度は映像特徴からのみ計算されると限定するわけではない。通常再生、早送り、巻き戻し、一時停止などの過去の操作履歴から、一時停止を行ったり、巻き戻して再度視聴したシーンには高い重要度、早送りで飛ばしたシーンについては低い重要度を設定することで、ユーザが好みとするシーンを推定することもできる。
また、ユーザの視線を計測するハードウェアなど、連携する外部機器から得られる情報を用い、ユーザがどの程度映像に集中していたかによって、映像の重要度を計算しても良い。また、前述の例以外の手段を用いても良く、上記例は重要度の計算方法を限定するものではない。
図4は、録画済の映像を入力映像とした際の重要度の様子を示した図である。
図4を用いて非重要シーン特定部104を説明する。
非重要シーン特定部104は、現在再生中の映像401について重要度計算部103から得られた重要度と閾値を用いて、副映像を再生するシーンを特定するものである。グラフ403は、任意のシーン区間402について、重要度計算部103で得られた映像の各シーンに対する重要度を、横軸に時間、縦軸に重要度をとってグラフ化したものである。
現在視聴中の映像が録画済のものであった場合、その映像全体401は既知であり、映像特徴検出部102で行われる特徴検出、重要度計算部103で行われる重要度計算処理を事前に行い、記録部105に記録しておくことが可能である。この事前に計算された重要度と、重要度計算部103に予め設定しておいた閾値404を用い、閾値404未満になるシーン区間を非重要シーン区間406として特定する。
図5は、非重要シーン区間決定の手法を示した図である。
ここで、重要度が得られた場合に、閾値404未満の区間を単純に非重要シーン区間とすると、図5(a)に示すような非重要シーン区間が得られる。
また、ここで得られる非重要シーン区間情報は、映像合成部109やダイジェスト作成部107に伝達され、副映像を合成表示するか否かの判断や区間長に合わせたダイジェストの作成に利用される。
このために、非重要シーンにある程度の区間長が必要とされるような場合には、図5(a)に示すような区間長が極端に短い区間は、非重要シーン区間として副映像を再生するのに適さないとし、更に以下のような処理を加える。
極端に短い区間を非重要シーン区間から排除する為に、本発明では図5(b)に示すように、予め設定されたシーン区間最低連続時間mを利用し、連続時間がm以上である区間を非重要シーンとして特定することにする。
また、各種フィルタを用い、得られた重要度に対して平滑化等を行うことで、急激な重要度の変化を軟調化し、必要以上に裁断化されたシーン区間を取り除くこととしても良い。
一方、現在視聴中の映像が放送中の映像であって、かつ、図5(a)を用いて説明したような極端に区間長が短い区間を排除する必要がある場合がある。
図6は、放送中の映像を入力映像とした際の重要度の様子を示した図である。
この場合には、図6に示すように、現在時刻603の時点で映像全体が受信されてはおらず、当然のことながら計算可能な重要度は現在時刻603以前に放送された映像部分についてのみである。このため、図4を用いて前述した録画済映像の場合のように、非重要シーンがどの程度連続するかを事前に知ることが出来ない。
入力映像が放送中の映像の場合は、図5(c)に示すように、予め設定したシーン区間最低連続時間nを用い、閾値を跨いだ時点から重要シーン区間または非重要シーン区間がn以上連続した場合にのみ画面表示切り替えを行うこととする。
また、放送中の映像を一旦記録部に一定時間だけ記録した後に再生を行うタイムシフト再生を行って、重要度によって特定するシーンの区間長が短い区間を排除することも可能である。
図7は、タイムシフト再生を行う場合における映像合成装置の概略構成を示した機能ブロック図である。図1と同一の符号を付した部分は同一物を表わしている。記録部701は、図1の記録部105で記録していた映像や映像特徴以外に、主映像として視聴する放送中の映像や映像特徴等も保存する。
図7に示すように、放送中の映像を記録部701は一定時間t1記録し、映像合成部109に出力を行う。
また、記録部701は、一定時間t1を待たずに、放送映像の入力があると映像特徴検出部102に出力を行う。この後の処理、即ち、映像特徴検出部102で入力映像の特徴を検出し、重要度計算部103で重要度を計算する処理は、図1で説明したものと同様である。
ところで、タイムシフトの一定時間t1は、非重要シーン特定部104における図5(b)で示したシーン区間最低連続時間m以上になるように設定される。そこで、非重要シーン特定部104は、重要度計算部103からの閾値及び入力映像の重要度の出力を得て、重要シーン乃至は非重要シーンが最低限、時間m以上連続するかどうかを、記録部701が映像合成部109に主映像となる動画像を出力する前に確かめることが可能になる。
図8は、タイムシフトを用いた重要シーン区間決定の手法を示した図である。
図8を用いて、受信した放送中の映像を一旦記録部701に溜め込み、m≦t1を満たす時間t1だけタイムシフトして再生を行う際の例を具体的に示す。放送映像801は、一旦記録部701に蓄積され、時間t1だけ遅れて映像合成部109に映像802として出力されるものとする。この際、時間t1は非重要シーン特定部104におけるシーン区間最低連続時間m以上であるものとする。
一方、非重要シーン特定部104は、重要度計算部103からの出力を得て処理を行い、例えば、重要度が閾値より低い非重要シーンの連続時間がm以上である区間を非重要シーンとして求めていく。ここで、現在時刻803においては、放送映像801がt1の分だけ記憶部701に蓄積され、映像合成部109にはt1より遅く出力されることが保証されているので、この時点で非重要シーン特定部104が重要シーン乃至は非重要シーンが最低限、m以上連続するか否かを確かめて映像合成部109に非重要シーン区間情報を出力することが可能となる。即ち、放送中の映像であっても、映像から非重要シーンを抽出した際に発生する、必要以上に裁断化された重要シーン区間804や、必要以上に裁断化された非重要シーン区間805、806が排除され、最終的に802に示されるような重要シーン区間、非重要シーン区間が決定される。
上記図8を用いて示したように、現在視聴中の映像が放送中の映像に対しても、極端に区間長が短い区間を排除した重要シーン区間乃至は非重要シーン区間を求めることができる。
以上の説明では、非重要シーン特定部104が行う処理として、重要度計算部103から得られる重要度によって、映像を重要、非重要シーンに分ける例を示した。
ところで、重要度計算部103で得られる映像特徴から導き出された重要度(以下、「映像重要度」という)とユーザが考える重要度(以下、「ユーザ重要度」という)が一致しないことが考えられる。
例えば、カメラワークを元に、その動きが大きい(激しい)シーンを重要とする重要度が計算されている場合を考える。
前述したように、映像がサッカー中継番組だった場合には、ユーザが注目するシーンは、シュートシーンなどカメラワークの動きが大きい(激しい)シーンであり、これは映像重要度とユーザ重要度が一致する。
一方、映像が料理番組だった場合、ユーザが注目するシーンは、調理をする手元を映すシーン、材料をフリップで紹介するシーン、出来上がりの画など、主にカメラワークの動きが小さいシーンであり、映像重要度とユーザ重要度が一致しない。
図9は、非重要シーン区間の決定方法の一例を示した図である。
ここで、単純に図9(a)のように閾値以上のシーンを重要シーンとすると、サッカー中継番組ではユーザが注目するシュートシーンなどの重要シーンが取得できるが、料理番組においては、シーンの切り替わりなど余りユーザが重要としないシーンばかりが重要シーンと判定されてしまう。
この問題を解決するために、2種類の異なる計算手法で各々の映像重要度を計算することも考えられるが、代わりに1つの映像重要度、例えば上記の例では動きの大きいシーンを重要とするような映像重要度を求めておき、動きの小さいシーンを重要としたい場合には、図9(b)に示すようにユーザ重要度の重要・非重要の評価のみを反転(閾値による指定範囲を反転)させ、映像重要度の閾値以上の区間をユーザにとっての非重要シーンとすることも考えられる。つまり、極端にカメラワークの動きが大きなシーン、即ち映像重要度がある一定以上の大きさを持つ区間のほうを、非ユーザ重要シーンと判定し、この非ユーザ重要シーンを最終的な非重要シーンとする。
以上で述べたように、重要度計算部103で計算されたある映像重要度に対して、ある閾値以上、ある閾値以下のいずれをユーザ重要度における重要とみなしてもよい。
これは重要度計算部103で計算された映像重要度の計算方法と、ユーザが重要と考えるシーンの性質との組合せに依存する。非重要シーン区間を閾値以上とするか、以下とするかは、重要度計算部103での重要度計算時に判断し、閾値とともに非重要シーン特定部104に伝えるものとする。
無論、ユーザが閾値の範囲の判断をしても良く、操作入力部110からの入力で判断する形式としても良い。
また、ここでは、閾値が一つであると仮定して説明をしたが、複数の閾値を用いて非重要シーンを特定するとしても良い。例えば、s<tの関係を満たす閾値s、tが存在するときに、閾値s以上かつ閾値t未満や、閾値s未満または閾値t以上など、複数の閾値を用いた閾値処理により非重要シーン区間を決定しても良い。
また、これらの閾値はユーザからの入力を操作入力部110から受け取るものとしても良い。ユーザの入力は図3(b)に示すように、閾値となる値を入力させる形式としても良いし、図3(c)に示すように、先に計算された重要度のグラフを表示し、グラフ上での閾値を視覚的に選択させる形式としても良い。
次に録画済映像選択部106の動作を示す。
現在視聴中の映像に関する映像特徴は、映像特徴検出部102より録画済映像選択部106に伝えられ、録画済映像の中から適切な副映像を記憶部105より選び出す。
ユーザが現在視聴している主映像は、ユーザが自ら選択し、視聴しているものであるから、ユーザは今現在、主映像に関連するまたは主映像に相関のある映像に興味を持っていると考えられる。そこで、主映像に相関や関連が高いものを副映像として選出することで、ユーザの興味を引く映像を選択することが可能になる。
更に、この副映像を検出する条件として、直前までユーザが視聴していた重要なシーンから得られる映像特徴を加えることにより、ユーザの今現在の興味をより適切に推定したシーンを検出することが出来る。
この場合、非重要シーン特定部104から重要シーンの区間情報が映像特徴検出部102に出力され、映像特徴検出部102から、該重要シーンの区間情報の特徴情報が録画済映像選択部106へ伝達される。
また、映像特徴検出部102は、特徴情報を時間情報とともに、記憶している必要がある。
現在視聴中の主映像と副映像の相関は、先に映像特徴検出部102で得られた映像特徴、またはそれに付随する情報の相関から得られる。ここで、副映像の映像特徴は、副映像の記録時または記録後に、映像特徴検出部102を用いて取得され、記録部105に記録されているものとする。これら相関の例としては、音声レベル、使用音楽、映像ヒストグラム、動きベクトル、EPGから得られるジャンル情報、出演者情報、タイトル情報、スポンサー情報、録画日時情報などが挙げられる。
以下にユーザが主映像を視聴している際に相関の高い映像を取得する例を、図4を用いて示す。
図4は、上記でも説明したように、過去に録画した映像の状態を示す図である。
過去に録画した映像401内のある区間402に注目し、その区間の重要度をグラフ化したものが403であるが、設定された閾値404から決定された非重要シーン区間406に再生する副映像を選びたい。
録画済映像選択部106では、EPG情報のような映像に付随の情報の他に、この非重要シーン区間406直前の重要シーン区間405に含まれる映像情報を用いて相関を計算することにより、適切な副映像を選択する。
図10は、映像に付随する情報の例を示した図である。
例えば、図10に示すような映像群から、ユーザがバラエティ番組である映像Bを選択し、視聴しているとする。このとき、これら映像に付随する情報のみを用いて関連する副映像を選択した場合、同一のジャンルに分類されている映像Dや、同一の出演者が出演している映像Aが選択される。
しかし、一般的に映像は複数の異なるシーンから成り立っているものであって、これら映像単位で計算した相関では、各々のシーンに適切な、即ちユーザの今現在の興味を良く推定した映像の選択が出来ない。
これに対し、本発明では、直前の重要シーンの特徴を利用することにより、現在のユーザの興味を良く推定した映像の選択を可能とする。
図11は、入力映像を重要シーンと非重要シーンに分別した後の様子を示した図である。
今、図11に示すように、映像B1101内に非重要シーン1104、1105が含まれていたとする。また、非重要シーン1104、1105各々の直前の重要シーンが、漫才を行う重要シーン1102と、出演者がサッカー対決を行うという重要シーン1103であったとする。このとき非重要シーン1105では直前の映像特徴が以下のようになる。
I.全体的に画面を占める領域が芝であることが多いことから、映像の色分布が緑に偏る。
II.フィールド上の白色線で構成された、フィールドが存在する。
III.フィールド上に、複数のオブジェクト(プレイヤー)が存在する。これらは、色によって主に2種類(チームごと)に分類される。
IV.上記オブジェクトより小さく、円形をしたオブジェクト(ボール)が存在し、このオブジェクトが画面の中心にあることが多い。
以上のような画像特徴を持つことから、同様の特徴を持つ映像にユーザの今現在の関心があると考え、図10に示される映像群からこれらの特徴と同様の特徴を持ち、相関が高い映像Fを選択する。
このように、非重要シーン直前の重要シーンから特徴を検出し、これを利用した相関を計算することで、シーンごとに適切な副映像を選択することが可能となる。
相関を得る手法としては、他にも、この直前の重要シーンに含まれる字幕情報から、重要なキーワードを抽出し、マッチする映像を選出しても良いし、映像情報中の人物が大きく映るシーンからパターンマッチングによって同一の出演者が含まれる映像を選出しても良い。また、音声情報から、同様の背景音楽(BGM)を使用している映像などを選出しても良い。
次に、図4を用いて以下にダイジェスト作成部107の動作の例を示す。
このブロックでは非重要シーン特定部104で得られた非重要シーン区間、記録部105に記録された映像特徴はダイジェスト作成部107に伝えられ、録画済映像選択部106で選択された映像について、各シーンに合わせたダイジェスト作成を行う。
ダイジェスト作成部107では非重要シーン特定部104から受け取った非重要シーン連続時間情報から、この時間に合わせた長さのダイジェストを作成する。
録画済映像を主映像として視聴する際には映像全体401が既知であり、映像特徴検出部102で行われる特徴検出、重要度計算部103で行われる重要度計算処理を事前に行い、記録部105に記録しておくことが可能である。
前述したように、この事前に計算された重要度を用いて、非重要シーン特定部104では、非重要シーン区間406がどの程度連続するかを事前に知ることができ、ダイジェスト編集部107ではこの非重要シーン区間の連続時間に合わせたダイジェストを作成する。
時間に合わせたダイジェストを作成する為には、例えば、設定されたダイジェスト再生時間に合わせてダイジェストの作成を行うことを可能とする特許番号3640615に示されるような技術を用いてもよいし、その他の技術を用いても良い。
一方、現在放送中の映像を視聴している場合、映像全体を事前に知ることが出来ない為、非重要シーン特定部の説明で図4を用いて述べたように、非重要シーンの開始点(ダイジェスト再生開始点)から、非重要シーンの終了点(ダイジェスト再生終了点)がいつ発生するかは事前に知ることは不可能である。この為、連続再生可能な時間に合わせての副映像をリアルタイムに作成することが出来ない。
そこで、以下の方法により、ダイジェスト作成を行うこととする。
まず、予め副映像の中から数秒程度にカットしたハイライトシーンをいくつか選択しておく。ここで、ハイライトシーンとは、先に重要度計算部103で計算された重要度が特に高いシーンであり、音声の盛り上がり、シーンの切り替わり、人が中心に映っているシーンなど、主にユーザに興味を抱かせるイベントが起きたシーンを指すものとする。これらのハイライトシーン群を重要度計算部103で計算される重要度が高い順や、元の映像の時間軸に沿った順に、非重要シーンの終了点に到達するまで再生することで、ダイジェストを実現する。非重要シーンの終了点に到達した際に、再生途中であったダイジェスト映像は、途中で終了するものとしてもよいし、ダイジェスト映像が再生終了するまで非重要シーン終了点を延長するようにしてもよい。
映像合成部109は、非重要シーン特定部104からの指示を受けて、動画像出力部108の表示を切りかえる。非重要シーン特定部104で重要と判断されたシーンでは主映像のみの表示とし、非重要と判断されたシーンでは、主映像と合わせてダイジェスト編集部107で作成された副映像を再生する。
図12は、映像を多重化する際の具体例を示した図である。
表示方式としては図12に示すように、メイン画面(図12(a))を縮小し、空いたスペースにダイジェストをひとつ乃至は複数表示しても良いし(図12(b))、P in P(Picture in Picture)形式でメイン画面とダイジェストを同時に表示(図12(c))しても良い。
また、ダイジェストに加えて、タイトルなどの基本情報や関連するキーワード情報などのテキストデータを表示(図12(d))しても良い。
また、出力される音声に関しては、主映像と副映像が同時に再生されている際は、主映像乃至は副映像どちらかひとつの音声を消音とし、もう片方音声のみを再生させるようにしても良い。他にも、主映像の重要度が低いと判断されている間は、主映像の音声を弱音とし、副音声の音声を多重化して再生させるようにしても良い。
以下に映像視聴時におけるユーザの特殊操作について述べる。
副映像のダイジェスト再生中、ユーザのその映像への興味に応じ、リモコン等の入力装置から特定の操作をすることが可能である。
ダイジェストとして再生された映像に興味を持った場合は、入力装置から“興味有り”といったような信号を送ることで、後に見る映像の候補とするためのブックマーク登録を記憶部105に行う形式としても良い。
逆にダイジェストとして再生された映像に興味がない場合は、その映像をそのまま記憶部105の消去リストに加える形式としても良い。
また、現在視聴中の映像とダイジェストで流れた映像を入れ替えて視聴する形式としても良い。
尚、本発明の映像合成装置は、上述の図示例にのみ限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変更を加え得ることは勿論である。
本発明の一実施形態にかかる映像合成装置の概略構成を示した機能ブロック図である。 本発明の一実施形態にかかる映像合成装置において重要度計算の一例を示した図である。 本発明の一実施形態にかかる映像合成装置においてユーザからの入力を受け付けるインターフェイスの例を示した図である。 本発明の一実施形態にかかる映像合成装置において録画済の映像を入力映像とした際の重要度の様子を示した図である。 本発明の一実施形態にかかる映像合成装置において非重要シーン区間決定の手法を示した図である。 本発明の一実施形態にかかる映像合成装置において放送中の映像を入力映像とした際の重要度の様子を示した図である。 本発明の一実施形態にかかる映像合成装置の概略構成を示した機能ブロック図である。 本発明の一実施形態にかかる映像合成装置において、タイムシフトを用いた重要シーン区間決定の手法を示した図である。 本発明の一実施形態にかかる映像合成装置において非重要シーン区間の決定方法の一例を示した図である。 本発明の一実施形態にかかる映像合成装置において映像に付随する情報の例を示した図である。 本発明の一実施形態にかかる映像合成装置において入力映像を重要シーンと非重要シーンに分別した後の様子を示した図である。 本発明の一実施形態にかかる映像合成装置において映像を多重化する際の具体例を示した図である。
符号の説明
100、700 映像合成装置
101 映像入力部
102 映像特徴検出部
103 重要度計算部
104 非重要シーン特定部
105、701 記憶部
106 録画済映像選択部
107 ダイジェスト作成部
108 動画像出力部
109 映像合成部
110 操作入力部
401、601 映像の全区間
402 任意区間
404、606 閾値
405、407、607 重要シーン区間
406 非重要シーン区間
602 放送済区間
603、803 現在放送位置
604 未放送区間
608 ダイジェスト再生開始点
609 ダイジェスト再生終了点
801 放送映像
802 シフト出力映像
804、1102、1103 重要シーン
1101 映像B
805、806、1104、1105 非重要シーン

Claims (11)

  1. 放送または記録されている少なくとも2つの映像を合成して表示する映像合成装置であって、
    前記映像内の各シーンに対応する特徴情報を検出する特徴検出部と、
    前記映像および/または前記特徴情報を記録する記録部と、
    前記特徴情報に基づいて第1の映像の各シーンに対する重要度についての指標の値を計算する計算部と、
    第2の映像を選択する映像選択部と、
    前記指標の値に基づいて前記第2の映像を合成する前記第1の映像内のシーンを特定するシーン特定部と、
    前記シーン特定部で特定された前記第1の映像内の当該シーンに前記第2の映像を合成する映像合成部と、を具備することを特徴とする、映像合成装置。
  2. 前記映像選択部は、前記特徴情報に基づいて、前記第2の映像として、前記第1の映像に類似または関連した映像を検出して選択することを特徴とする、請求項1に記載の映像合成装置。
  3. 前記映像選択部は、前記第1の映像のシーンごとあるいは連続するシーングループごとの前記特徴情報に基づいて前記第2の映像を選択することを特徴とする、請求項2に記載の映像合成装置。
  4. 前記映像選択部が前記第2の映像を選択するための前記特徴情報は、前記シーン特定部で特定された前記第1の映像内のシーンの直近の前記指標の値が高いシーンあるいはシーングループから得られる前記特徴情報とすることを特徴とする、請求項3に記載の映像合成装置。
  5. 前記第1の映像は放送中の映像であり、前記第2の映像は装置内に記録されている映像であることを特徴とする、請求項1から請求項4までのいずれか1つに記載の映像合成装置。
  6. 前記第1の映像および前記第2の映像は共に、装置内に記録された映像であることを特徴とする、請求項1から請求項4までのいずれか1つに記載の映像合成装置。
  7. 前記特徴情報は、映像中で刻々と変化する映像情報、音声情報、テキスト情報を含むことを特徴とする、請求項1から請求項6のいずれか1つに記載の映像合成装置。
  8. 前記シーン特定部は、前記指標の値に対して閾値処理を行うことで、前記第2の映像を合成する前記第1の映像内のシーンを特定することを特徴とする、請求項1から請求項7のいずれか1つに記載の映像合成装置。
  9. 前記計算部は、前記閾値を設定し、前記指標の値とともに、前記シーン特定部に出力することを特徴とする、請求項8に記載の映像合成装置。
  10. 前記計算部は、第1の映像シーンの種別により前記閾値の選択域の情報を反転させることを特徴とする、請求項9に記載の映像合成装置。
  11. 前記映像合成部は、選択した前記第2の映像を、前記シーン特定部で特定された前記第1の映像内のシーンの連続時間長さに合わせたダイジェスト映像として編集することを特徴とする、請求項1から請求項10のいずれか1つに記載の映像合成装置。
JP2006282371A 2006-10-17 2006-10-17 映像合成装置 Pending JP2008103802A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006282371A JP2008103802A (ja) 2006-10-17 2006-10-17 映像合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006282371A JP2008103802A (ja) 2006-10-17 2006-10-17 映像合成装置

Publications (1)

Publication Number Publication Date
JP2008103802A true JP2008103802A (ja) 2008-05-01

Family

ID=39437823

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006282371A Pending JP2008103802A (ja) 2006-10-17 2006-10-17 映像合成装置

Country Status (1)

Country Link
JP (1) JP2008103802A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010154197A (ja) * 2008-12-25 2010-07-08 Fujitsu Ltd 映像範囲抽出装置,映像範囲抽出プログラム,及び映像保存装置
JP2010166561A (ja) * 2009-01-16 2010-07-29 Samsung Electronics Co Ltd ユーザの関心度に基づいた鑑賞物の自動提供方法及びこれを適用したビデオ機器
JPWO2011099299A1 (ja) * 2010-02-10 2013-06-13 パナソニック株式会社 映像抽出装置、撮影装置、プログラム及び記録媒体
JP2014150314A (ja) * 2013-01-31 2014-08-21 Mitsubishi Electric Corp 情報処理装置及び情報処理方法
JP2014230203A (ja) * 2013-05-24 2014-12-08 富士通株式会社 コンテンツ提供プログラム,コンテンツ提供方法及びコンテンツ提供装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2752716B2 (ja) * 1989-09-01 1998-05-18 日本電信電話株式会社 動画像ダイジェスト自動生成方式
JP2000023062A (ja) * 1998-06-30 2000-01-21 Toshiba Corp ダイジェスト作成システム
JP2002209171A (ja) * 2001-01-09 2002-07-26 Funai Electric Co Ltd Dvd再生機能付きビデオ装置、映像信号出力装置および映像信号出力方法
JP2003134428A (ja) * 2001-10-22 2003-05-09 Toshiba Corp テレビジョン受信機
JP2003304418A (ja) * 2002-04-08 2003-10-24 Nippon Telegr & Teleph Corp <Ntt> 副映像割り込み装置および方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2752716B2 (ja) * 1989-09-01 1998-05-18 日本電信電話株式会社 動画像ダイジェスト自動生成方式
JP2000023062A (ja) * 1998-06-30 2000-01-21 Toshiba Corp ダイジェスト作成システム
JP2002209171A (ja) * 2001-01-09 2002-07-26 Funai Electric Co Ltd Dvd再生機能付きビデオ装置、映像信号出力装置および映像信号出力方法
JP2003134428A (ja) * 2001-10-22 2003-05-09 Toshiba Corp テレビジョン受信機
JP2003304418A (ja) * 2002-04-08 2003-10-24 Nippon Telegr & Teleph Corp <Ntt> 副映像割り込み装置および方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010154197A (ja) * 2008-12-25 2010-07-08 Fujitsu Ltd 映像範囲抽出装置,映像範囲抽出プログラム,及び映像保存装置
JP2010166561A (ja) * 2009-01-16 2010-07-29 Samsung Electronics Co Ltd ユーザの関心度に基づいた鑑賞物の自動提供方法及びこれを適用したビデオ機器
US9204079B2 (en) 2009-01-16 2015-12-01 Samsung Electronics Co., Ltd. Method for providing appreciation object automatically according to user's interest and video apparatus using the same
JPWO2011099299A1 (ja) * 2010-02-10 2013-06-13 パナソニック株式会社 映像抽出装置、撮影装置、プログラム及び記録媒体
JP2014030260A (ja) * 2010-02-10 2014-02-13 Panasonic Corp 映像抽出装置、プログラム及び記録媒体
US8964065B2 (en) 2010-02-10 2015-02-24 Panasonic Intellectual Property Management Co., Ltd. Video picture extracting apparatus, imaging apparatus and recording medium
JP2014150314A (ja) * 2013-01-31 2014-08-21 Mitsubishi Electric Corp 情報処理装置及び情報処理方法
JP2014230203A (ja) * 2013-05-24 2014-12-08 富士通株式会社 コンテンツ提供プログラム,コンテンツ提供方法及びコンテンツ提供装置

Similar Documents

Publication Publication Date Title
KR100403238B1 (ko) 비디오의 지능형 빨리 보기 시스템
US8832732B2 (en) Controlled multi-media program review
US9264765B2 (en) Method for providing a video, transmitting device, and receiving device
JP5322550B2 (ja) 番組推奨装置
JP4000171B2 (ja) 再生装置
JP4556752B2 (ja) コマーシャル視聴制御機能を有する録画再生装置
US8103149B2 (en) Playback system, apparatus, and method, information processing apparatus and method, and program therefor
JP4387408B2 (ja) Avコンテンツ処理装置、avコンテンツ処理方法、avコンテンツ処理プログラムおよびavコンテンツ処理装置に用いる集積回路
JP4305269B2 (ja) 信号処理装置及び方法
JP2003101939A (ja) 映像情報要約装置、映像情報要約方法及び映像情報要約プログラム
JP2005518123A (ja) ビデオコンテンツの早送り/巻き戻しにおける映像要約
WO2006126391A1 (ja) コンテンツ処理装置及びコンテンツ処理方法、並びにコンピュータ・プログラム
JP4435130B2 (ja) 映像再生装置、再生装置
US20060104609A1 (en) Reproducing device and method
JP2003283993A (ja) 映像情報記録再生装置及び映像情報記録再生方法
JP2010232814A (ja) 映像編集プログラムおよび映像編集装置
JP2008103802A (ja) 映像合成装置
JP2008178090A (ja) 映像処理装置
JP2010246000A (ja) 映像サーチ再生装置
JP2008153920A (ja) 動画像一覧表示装置
US20050232598A1 (en) Method, apparatus, and program for extracting thumbnail picture
JP2005167456A (ja) Avコンテンツ興趣特徴抽出方法及びavコンテンツ興趣特徴抽出装置
KR100370249B1 (ko) 샷 세그멘테이션 정보를 이용한 비디오 스키밍 시스템
KR20020023063A (ko) 비디오 콘텐트의 구조적 정보를 이용한 비디오 스키밍방법과 장치
JP2005328329A (ja) 映像再生装置と映像録画再生装置と映像再生方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090218

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120214

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120619