JP2008176538A - 映像属性情報出力装置、映像要約装置、プログラムおよび映像属性情報出力方法 - Google Patents

映像属性情報出力装置、映像要約装置、プログラムおよび映像属性情報出力方法 Download PDF

Info

Publication number
JP2008176538A
JP2008176538A JP2007008909A JP2007008909A JP2008176538A JP 2008176538 A JP2008176538 A JP 2008176538A JP 2007008909 A JP2007008909 A JP 2007008909A JP 2007008909 A JP2007008909 A JP 2007008909A JP 2008176538 A JP2008176538 A JP 2008176538A
Authority
JP
Japan
Prior art keywords
attribute information
video
area
scene
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007008909A
Other languages
English (en)
Other versions
JP5010292B2 (ja
Inventor
Koji Yamamoto
晃司 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2007008909A priority Critical patent/JP5010292B2/ja
Priority to US12/007,570 priority patent/US8103107B2/en
Publication of JP2008176538A publication Critical patent/JP2008176538A/ja
Application granted granted Critical
Publication of JP5010292B2 publication Critical patent/JP5010292B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7844Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using original textual content or text extracted from visual content or transcript of audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/738Presentation of query results
    • G06F16/739Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63BAPPARATUS FOR PHYSICAL TRAINING, GYMNASTICS, SWIMMING, CLIMBING, OR FENCING; BALL GAMES; TRAINING EQUIPMENT
    • A63B71/00Games or sports accessories not covered in groups A63B1/00 - A63B69/00
    • A63B71/06Indicating or scoring devices for games or players, or for other sports activities
    • A63B71/0616Means for conducting or scheduling competition, league, tournaments or rankings
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63BAPPARATUS FOR PHYSICAL TRAINING, GYMNASTICS, SWIMMING, CLIMBING, OR FENCING; BALL GAMES; TRAINING EQUIPMENT
    • A63B71/00Games or sports accessories not covered in groups A63B1/00 - A63B69/00
    • A63B71/06Indicating or scoring devices for games or players, or for other sports activities
    • A63B71/0619Displays, user interfaces and indicating devices, specially adapted for sport equipment, e.g. display mounted on treadmills
    • A63B71/0622Visual, audio or audio-visual systems for entertaining, instructing or motivating the user

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Library & Information Science (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Television Signal Processing For Recording (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】映像コンテンツに関するメタデータを容易に生成することができる映像属性情報出力装置を提供する。
【解決手段】映像コンテンツ10をシーン分割部151で分割した隣接する各シーンにおける所定のフレーム間で、変化がない領域であって属性情報が表示される領域である属性情報領域を属性情報領域抽出部153で抽出し、属性情報領域内の個々の文字が存在する領域である文字領域を文字領域抽出部155で抽出するとともに当該文字領域の意味付けを文字領域意味付け部156で行い、文字領域読み取り部157で意味付けされた文字領域から映像コンテンツに関するメタデータである映像属性情報を読み取って出力する。これにより、例えば野球中継の場合における得点やボールカウントなどの映像コンテンツに関するメタデータである映像属性情報を容易に生成することができる。
【選択図】 図3

Description

本発明は、映像属性情報出力装置、映像要約装置、プログラムおよび映像属性情報出力方法に関する。
近年、放送の多チャンネル化等の情報インフラの発展により、多くの映像コンテンツが流通するようになっている。一方、録画装置の側においては、ハードディスク・レコーダやチューナー搭載のパーソナルコンピュータの普及により映像コンテンツをデジタルデータとして保存することが出来るようになっており、様々な視聴方法が可能となっている。
録画装置を用いた視聴方法の1つとしては、長時間の映像を短時間に要約して視聴する映像要約技術がある。例えば、特許文献1には、スポーツ中継番組の要約手法として、メタデータが付与された映像からユーザの好みに基づいてシーンを抽出し、ダイジェストを作成する手法が記載されている。ここで、上述したメタデータは、試合中の個々のプレイなどをイベントとして時刻情報と共に記述したものであり、映像を見ながら人手で入力されるものである。
また、特許文献2には、メタデータを入力するための補助となる手法が記載されている。具体的には、野球中継におけるイニングや得点などの情報の表示される画像領域(スコア情報領域)を指定してキー画像として登録しておき、イニングが変わったなどのイベントが発生した際にキー画像に対する変化率が一定の基準以上になったと判定した場合に、その時点の画像を表示するものである。
特開2005−109566号公報 特開2000−132563号公報
しかしながら、特許文献1に記載されている手法によれば、ダイジェスト生成に必要となるメタデータを用いることで高精度な要約を生成できる半面、メタデータをすべて人手で入力することは入力の手間やコストが負担であるという課題がある。
そこで、特許文献2に記載されている手法を用いるようにすれば、野球中継におけるメタデータの入力について、ある程度の負担の軽減は望めるようになると考えられる。
ところが、特許文献2の手法によれば、イニングや得点などの情報が表示される画像領域の指定やイベントとして検出された画像の読み取りは人手によるため、番組ごとに画像領域を指定する手間や読み取ったイニングや得点の入力の手間やコストなどの課題は依然として解決されない。
本発明は、上記に鑑みてなされたものであって、映像コンテンツに関するメタデータを容易に生成することができる映像属性情報出力装置、映像要約装置、プログラムおよび映像属性情報出力方法を提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明の映像属性情報出力装置は、映像コンテンツのフレーム間の類似性が低くなるシーンチェンジを検出して、前記映像コンテンツを複数のシーンに分割するシーン分割手段と、前記シーン分割手段で分割した隣接する前記各シーンにおける所定のフレーム間で、変化がない領域であって属性情報が表示される領域である属性情報領域を抽出する属性情報領域抽出手段と、前記属性情報領域抽出手段により抽出された前記属性情報領域内の個々の文字が存在する領域である文字領域を抽出する文字領域抽出手段と、前記文字領域抽出手段で抽出した前記文字領域について意味付けを記したルール情報を照合することにより当該文字領域の意味付けを行う文字領域意味付け手段と、意味付けされた前記文字領域から前記映像コンテンツに関するメタデータである映像属性情報を読み取って出力する映像属性情報出力手段と、を備える。
また、本発明の映像要約装置は、請求項1ないし9の何れか一記載の映像属性情報出力装置と、前記映像属性情報出力装置から出力された前記映像属性情報に含まれるイベントごとにその重要度を算出する重要度算出部と、算出された重要度に従って、要約映像に含める映像コンテンツの映像区間を選択する映像区間選択部と、前記イベント列から要約映像に用いる説明文の生成に用いる説明文用イベントを選択する説明文用イベント選択部と、選択された前記説明文用イベントから説明文を生成する説明文作成部と、選択された前記映像区間と前記説明文とを統合し、両方の情報を含んだ要約映像情報を生成する統合部と、を備える。
また、本発明のプログラムは、映像コンテンツのフレーム間の類似性が低くなるシーンチェンジを検出して、前記映像コンテンツを複数のシーンに分割するシーン分割機能と、前記シーン分割機能で分割した隣接する前記各シーンにおける所定のフレーム間で、変化がない領域であって属性情報が表示される領域である属性情報領域を抽出する属性情報領域抽出機能と、前記属性情報領域抽出機能により抽出された前記属性情報領域内の個々の文字が存在する領域である文字領域を抽出する文字領域抽出機能と、前記文字領域抽出機能で抽出した前記文字領域について意味付けを記したルール情報を照合することにより当該文字領域の意味付けを行う文字領域意味付け機能と、意味付けされた前記文字領域から前記映像コンテンツに関するメタデータである映像属性情報を読み取って出力する映像属性情報出力機能と、をコンピュータに実行させる。
また、本発明の映像属性情報出力方法は、映像コンテンツのフレーム間の類似性が低くなるシーンチェンジを検出して、前記映像コンテンツを複数のシーンに分割するシーン分割工程と、前記シーン分割工程で分割した隣接する前記各シーンにおける所定のフレーム間で、変化がない領域であって属性情報が表示される領域である属性情報領域を抽出する属性情報領域抽出工程と、前記属性情報領域抽出工程により抽出された前記属性情報領域内の個々の文字が存在する領域である文字領域を抽出する文字領域抽出工程と、前記文字領域抽出工程で抽出した前記文字領域について意味付けを記したルール情報を照合することにより当該文字領域の意味付けを行う文字領域意味付け工程と、意味付けされた前記文字領域から前記映像コンテンツに関するメタデータである映像属性情報を読み取って出力する映像属性情報出力工程と、を含む。
本発明によれば、例えば野球中継の場合における得点やボールカウントなどの映像コンテンツに関するメタデータである映像属性情報が表示される画像領域の指定などの人手を介した作業を省略し、映像コンテンツから映像属性情報を自動的に認識して取得することができるので、映像コンテンツに関するメタデータを容易に生成することができる、という効果を奏する。
以下に添付図面を参照して、この発明にかかる映像属性情報出力装置、映像要約装置、プログラムおよび映像属性情報出力方法の最良な実施の形態を詳細に説明する。
[第1の実施の形態]
本発明の第1の実施の形態を図1ないし図16に基づいて説明する。本実施の形態は映像要約装置としてパーソナルコンピュータを適用した例である。
図1は、本発明の第1の実施の形態にかかる映像要約装置1の構成を示すブロック図である。映像要約装置1は、情報処理を行うCPU(Central Processing Unit)101、BIOSなどを記憶した読出し専用メモリであるROM(Read Only Memory)102、各種データを書換え可能に記憶するRAM(Random Access Memory)103、各種データベースとして機能するとともに各種のプログラムを格納するHDD(Hard Disk Drive)104、記憶媒体110を用いて情報を保管したり外部に情報を配布したり外部から情報を入手するためのDVDドライブ等の媒体駆動装置105、ネットワーク2を介して外部の他のコンピュータと通信により情報を伝達するための通信制御装置106、処理経過や結果等を操作者に表示するLCD(Liquid Crystal Display)等の表示部107、並びに操作者がCPU101に命令や情報等を入力するためのキーボードやマウス等の入力部108等から構成されており、これらの各部間で送受信されるデータをバスコントローラ109が調停して動作する。
このような映像要約装置1では、ユーザが電源を投入するとCPU101がROM102内のローダーというプログラムを起動させ、HDD104よりOS(Operating System)というコンピュータのハードウェアとソフトウェアとを管理するプログラムをRAM103に読み込み、このOSを起動させる。このようなOSは、ユーザの操作に応じてプログラムを起動したり、情報を読み込んだり、保存を行ったりする。OSのうち代表的なものとしては、Windows(登録商標)等が知られている。これらのOS上で走る動作プログラムをアプリケーションプログラムと呼んでいる。なお、アプリケーションプログラムは、所定のOS上で動作するものに限らず、後述の各種処理の一部の実行をOSに肩代わりさせるものであってもよいし、所定のアプリケーションソフトやOSなどを構成する一群のプログラムファイルの一部として含まれているものであってもよい。
ここで、映像要約装置1は、アプリケーションプログラムとして、映像処理プログラムをHDD104に記憶している。この意味で、HDD104は、映像処理プログラムを記憶する記憶媒体として機能する。
また、一般的には、映像要約装置1のHDD104にインストールされるアプリケーションプログラムは、DVDなどの各種の光ディスク、各種光磁気ディスク、フレキシブルディスクなどの各種磁気ディスク、半導体メモリ等の各種方式のメディア等の記憶媒体110に記録され、この記憶媒体110に記録された動作プログラムがHDD104にインストールされる。このため、DVD等の光情報記録メディアやFD等の磁気メディア等の可搬性を有する記憶媒体110も、アプリケーションプログラムを記憶する記憶媒体となり得る。さらには、アプリケーションプログラムは、例えば通信制御装置106を介して外部のネットワーク2から取り込まれ、HDD104にインストールされても良い。
映像要約装置1は、OS上で動作する映像処理プログラムが起動すると、この映像処理プログラムに従い、CPU101が各種の演算処理を実行して各部を集中的に制御する。映像要約装置1のCPU101が実行する各種の演算処理のうち、本実施の形態の特長的な処理について以下に説明する。
図2は、映像要約装置1の概略構成を示すブロック図である。図2に示すように、映像要約装置1は、映像処理プログラムに従うことにより、映像属性情報出力装置である映像属性情報作成部15、重要度算出部16、映像区間選択部17、説明文用イベント選択部18、説明文作成部19、統合部20を備える。また、10は元映像情報、11は映像属性情報、12は要約作成情報、13は説明文作成情報、14は要約映像情報である。
元映像情報10は、例えばテレビの番組やユーザが撮影した映像など、様々な映像コンテンツがこれに該当する。本実施の形態では、元映像情報10は、デジタルデータとする。デジタルデータの形式は、どのような形式でもよい(例えば、MPEG−1やMPEG−2などの圧縮データ形式を用いるのが一般的である)。もちろん、ソース映像がアナログデータでもよいが、この場合には、予め外部でデジタルデータに変換するか、または、映像要約装置1がアナログ・デジタル変換を備えるものとする。また、映像コンテンツは、1つでも複数でもかまわなく、タイトルやIDなど映像コンテンツを一意に特定できる情報と、再生を開始する時間またはフレーム番号とを与えれば、任意の映像コンテンツを任意の位置から再生可能である。
映像属性情報11は、映像コンテンツに関する様々な属性情報(メタデータ)である。映像属性情報11には、映像コンテンツ内で起きた事象をイベントとして列挙したイベント列が含まれる。イベントは、人物や物体の名称や動き(例えば、野球の場合、「○○選手のホームラン」など)や、時間的な区切り(「試合開始」、「試合終了」など)などの情報がその発生時間と共に記述される。発生時刻の記述は、シーン情報のように区間の始点・終点を記述する形式でもよいし、イベントが発生した瞬間の時刻を記述する形式でもよい。その他、属性情報には、スポーツの種目、対戦チーム名、日時、場所、出場選手、試合結果など、映像コンテンツ中の特定の時間に関連しない情報も含んでよい。また、ここでは具体例としてスポーツを挙げたが、属性情報はコンテンツに応じて適宜記述することができる。例えば、ドラマや情報番組についても登場人物やトピックのタイトルを用いることで、同様に記述することができる。
要約作成情報12は、要約を作成するときのユーザの嗜好や、要約映像の時間、要約アルゴリズムのパラメータなどを含む情報である。ユーザの嗜好とは、ユーザが優先的に視聴したい部分を求めるためのキーワードなどの情報である。スポーツの試合であれば、好みのチームや好みの選手などの情報がこれに該当する。キーワードは、見たい対象だけ記述してもよいし、見たい対象だけではなく、見たくない対象についての記述をも可能にしてもよい。これらの情報は、直接入力してもよいし、毎回同じような条件を入力する手間を省くために予め内部あるいは外部の記憶装置上に保持しておいてもよい。
説明文作成情報13は、映像属性情報11に含まれるイベントから、説明文を作成するときに用いるテンプレート(雛形)を含む情報である。ここで用いるテンプレートとは、例えば、「(時間)、(チーム)のチャンス。(選手)の(プレイ)!」のように、固定された文字列と可変の文字列の組み合わせによって与えられる文字列である。この例では、「(時間)」など()によって示された文字列が可変の文字列を表している。
要約映像情報14は、映像要約装置1によって生成される要約映像である。要約映像情報14は、元映像コンテンツの一部と、生成された文字等の可視的情報や音声等の可聴的情報による説明文(例えばテロップやナレーションなど)を含む。また、元映像コンテンツとは別に用意されたコンテンツ(例えば、タイトル画面など)を含めてもかまわない。また、要約映像情報14の形態は、元映像とは別の映像コンテンツとして、それ単体で再生できる情報であってもよいし、元映像コンテンツを参照して再生しながら、文字や音声による説明文を表示・再生するものであってもよい。後者には、SMILなど複数のメディアを同期して表示することのできる記述言語を用いることができる。音声の再生には、例えば、音声合成を用いることができる。
以下において、映像要約装置1の各部について説明する。
映像属性情報作成部15は、元映像情報10に基づいて映像属性情報11を自動的に作成する。なお、映像属性情報作成部15における映像属性情報11の自動作成処理の詳細は後述する。
重要度算出部16は、入力された映像属性情報11および要約作成情報12に基づいて、映像属性情報11に含まれるイベントごとにその重要度を算出する。イベントの重要度の算出方法は、当該イベントに含まれる文字列と要約作成情報12に含まれるキーワードとの一致の具合の評価値を求めることによって行う。例えば、重要度をwとし、キーワードの総数をNとして、次に例示する式により重要度wを求めることができる。ただし、次式においてakは、要約作成情報12に含まれるk番目のキーワードの重み値を示すパラメータである。
w=ΣakM(x)
ここで、Σはk=1〜Nの範囲を総和の対象とする。また、x番目のキーワードが一致する場合には、M(x)=1とし、x番目のキーワードが一致しない場合には、M(x)=0とする。
なお、キーワードとして見たくない対象についての記述をも可能にする構成においては、M(x)について、x番目のキーワードが一致し、x番目のキーワードが見たい映像に係るキーワードである場合には、M(x)=1とし、x番目のキーワードが一致し、x番目のキーワードが見たくない映像に係るキーワードである場合には、M(x)=−1とし、x番目のキーワードが一致しない場合には、M(x)=0とする。
映像区間選択部17は、算出された重要度に従って、要約映像に含める元映像コンテンツの区間を選択する。
説明文用イベント選択部18は、要約映像に用いる文字や音声による説明文(テロップやナレーションなど)の生成に用いるイベントを、イベント列から選択する。選択は予め決められたイベントを自動的に選択してもよいし、ユーザが明示的に選択してもよい。例えば、野球中継の場合には、ヒットなどの安打のイベントを選択する。基本的には、要約映像の全部に対してのみ説明文を生成する処理と、要約映像の一部に対してのみ説明文を生成する処理と、要約映像の全部又は一部及び要約映像以外の所定の部分に対して説明文を生成する処理と、要約映像以外の所定の部分に対してのみ説明文を生成する処理が考えられる。これらのイベント選択処理は、映像区間選択部17とは独立して処理してもよいし、映像区間選択部17のデータを利用してもよい。
説明文作成部19は、説明文用イベント選択部18で選択された説明文用イベントと説明文作成情報13とから、(文字等の可視的情報や音声等の可聴的情報による)説明文を生成する。前述したように、説明文作成情報13は、説明文を生成するためのテンプレートを含む情報である。テンプレートとは、例えば、「(時間)、(チーム)のチャンス。(選手)の(プレイ)!」のように、固定された文字列と可変の文字列の組み合わせによって、与えられる文字列である。この例では、「(時間)」など()によって示された文字列が可変の文字列を表している。可変の文字列には、映像属性情報11や要約作成情報12から、直接的あるいは間接的に得ることができる文字列が入る。このようなテンプレートがイベントの種類などによって複数用意される。
統合部20は、映像区間情報と文字テロップや音声ナレーションによる説明文とを統合し、両方の情報を含んだ要約映像情報14を生成する。文字の表示や音声の発話のタイミングは、イベントの発生時刻や映像区間に合わせて行う。発生時刻に合わせる場合、発生時刻の前に適当な間隔をおいて表示、発話したり、発話区間の特定の位置(例えば中間点)がイベントの発生時刻となるように表示、発話したりするようにタイミングを調整すればよい。また、映像区間に合わせる場合は、その区間の開始点や終了点から適当な間隔をとって表示、発話すればよい。もちろん、これらの複数の手法を組み合わせて、例えば、文字テロップは映像区間に合わせ、音声ナレーションはイベントの発生時刻に合わせて用いるなどしてもよい。
統合時には、テロップのオーバーレイ表示や、音声合成による音声ナレーションを作成して、要約映像に含めてもよいし、テキストの状態で要約映像情報14として記述して、再生装置側で、オーバーレイ表示音声合成を行ってもよい。
なお、上記では、統合部20は、選択された映像区間情報と生成された説明文情報とを単純に重ね合わせて、1つの要約映像情報14として出力する例を示したが、映像区間や音量の調整を含むようにしてもよい。
以上のように本実施の形態の映像要約装置1によれば、映像情報の中から、ユーザの入力したキーワードや時間などの条件やユーザの好みに基づいて、ユーザの興味のある映像区間のみを選択し、それにテロップや音声ナレーションを付加した要約映像を作成することができる。また、省略されてしまった重要なシーンを説明文で補うことで、より内容を理解しやすい要約映像を作成することができる。
したがって、本実施の形態の映像要約装置1によれば、ユーザは1つの番組をまるごと再生することなく、自分の興味のある部分だけを含む要約を作成して、再生することが可能である。その際に、テロップや音声ナレーションによる説明を映像に現れない部分を含めて、ユーザの嗜好に合った文章や口調で受けることができる。
次に、映像属性情報作成部15における映像属性情報11の自動作成処理について詳述する。ここで、図3は映像属性情報作成部15の概略構成を示すブロック図、図4は映像属性情報の自動作成処理の流れを概略的に示すフローチャートである。
図3に示すように、映像属性情報作成部15は、元映像情報10を入力とし、映像属性情報11を出力する。このような映像属性情報作成部15は、元映像情報10をシーンに分割するシーン分割手段として機能するシーン分割部151と、同じ構図で撮影した画像(典型シーン)を抽出する典型シーン抽出手段として機能する典型シーン抽出部152と、属性情報領域を抽出する属性情報領域抽出手段として機能する属性情報領域抽出部153と、典型シーンに属性情報領域が含まれるか否かを判定する領域判定手段として機能する属性情報領域有無判定部154と、属性情報領域が含まれる文字領域を抽出する文字領域抽出手段として機能する文字領域抽出部155と、文字領域の意味付けを行う文字領域意味付け手段として機能する文字領域意味付け部156と、文字領域から映像属性情報を読み取って出力する映像属性情報出力手段として機能する文字領域読み取り部157と、を備えている。
映像属性情報の自動作成処理の流れを概略的に説明する。各ステップの詳細については、後述する。図4に示すように、まず、元映像情報10のフレームごとの特徴量を算出し、特徴量が類似する連続フレームの集合である複数のシーンに元映像情報10を分割する(ステップS1:シーン分割部151)。すなわち、元映像情報10のフレーム間の類似性が低くなるシーンチェンジを検出して、元映像情報10を複数のシーンに分割する。
次いで、各シーンの中から典型シーンを抽出し(ステップS2:典型シーン抽出部152)、画面の中から属性情報が表示される属性情報領域を抽出し(ステップS3:属性情報領域抽出部153)、ステップS2で抽出された各典型シーンについて、属性情報が表示されているか否かを判定する(ステップS4:属性情報領域有無判定部154)。
その後、属性情報が表示された典型シーンから文字領域を抽出し(ステップS5:文字領域抽出部155)、抽出された文字領域とルール情報を照合して文字領域の意味付けを行う(ステップS6:文字領域意味付け部156)。
最後に、文字領域の読み取りを行って映像属性情報を生成し(ステップS7:文字領域読み取り部157)、処理を終了する。
ここで、上述の各用語について図面を参照しつつ説明する。
図5は、野球中継番組の画面例を示す模式図である。図5に示すように、201に示す領域には“回”、“得点”、“ボールカウント”、“出塁状況”などが表示されている。これらのスコア情報を属性情報、201の領域を属性情報領域と呼ぶ。さらに、属性情報領域内の個々の文字が存在する領域(例えば、202に示すボールカウントが存在するスコア領域)を文字領域と呼ぶ。
図6は、典型シーンとなる同じ構図で撮影した画像について示す説明図である。301は元映像情報10を示し、紙面を右に向かって時間が流れているとする。斜線部(例えば、302)は投球シーンを示す。投球シーンは、図5に示したようにピッチャーの後方からバッター方向を撮影したシーンである。野球中継では、図5に示すような画面に投球の度に切り替わることが多く、カメラの位置や向きは毎回、ほぼ同じである。そのため、303に示すように、野球中継番組では投球シーンが繰り返し出現する。このように、映像コンテンツ中に何度も反復して出現する同じ構図で撮影した画像を典型シーンと定義する。
次に、各ステップにおける処理の詳細について説明する。
まず、シーン分割部151によるシーン分割(ステップS1)について説明する。シーン分割部151によるシーン分割は、元映像情報10の映像フレームの特徴量を比較することで行う。ここで、図7は入力映像からの特徴量抽出方法について模式的に示す説明図である。図7に示す401は、元映像情報10の映像フレームを順次並べたものである。これらの映像フレームから特徴量を直接抽出することもできるが、本実施の形態においては、時間的・空間的にサンプリングを行うことで処理量を削減しつつ、特徴量を抽出する方法について述べる。
時間的なサンプリングは、図7に示すように、映像フレーム群401から映像の一部のフレーム402を抜き出して処理する。抜き出す方法としては、一定間隔で抜き出したり、MPEGのIピクチャだけ抜き出す方法などがある。403は抜き出した1フレームである。次いで、抜き出したフレーム403を縮小してサムネール画像404を作成し、空間的にサンプリングする。サムネール画像404の作成方法としては、複数の画素の平均値を求めて縮小する方法やMPEGのIピクチャのDCT係数のDC成分だけを復号して算出する方法などがある。そして、サムネール画像404をブロックに分割し、ブロックごとに色のヒストグラム分布405を求める。この色ヒストグラム分布をこのフレームの特徴量とする。
そして、隣接するフレーム403の間の特徴量の距離を求め、特徴量の距離が一定の基準を上回るフレーム403の間、すなわち類似度が低下するフレーム403の間でシーンを分割する。特徴量の距離には、例えばユークリッド距離を用いることができる。フレームiのa番目ブロックのヒストグラムにおけるb番目の頻度をhi(a,b)とすると、フレームiとフレームi+1間のユークリッド距離dは、下記式のようになる。
Figure 2008176538
次に、典型シーン抽出部152による典型シーンの抽出(ステップS2)について説明する。ここで、図8は典型シーンの抽出処理の流れを示すフローチャートである。図8に示すように、まず初めに、シーン分割部151で分割したシーン毎の特徴量に基づいて類似するシーンをグループに分類する(ステップS11:分類手段)。すなわち、1つのグループには、類似するシーンのみが含まれることになる。シーンの特徴量としては、例えば、各シーンの先頭のフレームの特徴量を用いることができる。
続くステップS12では、グループi(i=1,2,3,・・・N(初期値i=1))に分類されたシーンの中に基準以上の「反復があるシーン」が含まれるか否かを判定する。Nは、グループの総数である。「反復があるシーン」は、映像の時系列中に何度も反復して出現する同じ構図で撮影した画像である。判定の基準としては、例えば、グループに含まれる「反復があるシーン」の総数が定められた閾値を超えているか否かであったり、グループに含まれる「反復があるシーン」の総時間が元映像の時間に対して一定以上の割合を占めるか否かである。
基準以上の「反復があるシーン」が含まれる、すなわち基準を満たすと判定された場合は(ステップS12のYes)、ステップS13へ進み、グループiに分類された全シーンを典型シーンとする。ここに、判定手段の機能が実行される。その後、ステップS14へ進む。
一方、基準以上の「反復があるシーン」が含まれない場合は(ステップS12のNo)、そのままステップS14に進む。
ステップS14では全グループについての処理が終了したか否か、すなわちi=Nか否かを判定する。全グループについての処理が終了していなければ(ステップS14のNo)、iを更新し(ステップS15)、ステップS12へ戻る。全グループについての処理が終了していれば(ステップS14のYes)、選択した典型シーンを時間順に並び替え(ステップS16)、処理を終了する。
次に、属性情報領域抽出部153による属性情報領域の抽出(ステップS3)について説明する。ここで、図9は属性情報領域の抽出処理の流れを示すフローチャートである。図9に示すように、まず初めに、シーン分割部151で分割した各シーンの境界について、境界の前と境界の後のフレームを選択し、フレーム間の重複部分を抽出する(ステップS21)。なお、選択するフレームはシーン境界の直前、直後である必要はなく、数フレームあるいは数秒離れた位置のフレームを選択してもよい。また、映像中で処理対象とするシーン境界は映像中の全てのシーン境界としてもよいが、典型シーンとその直前のシーンの境界だけを対象としてもよい。これは、典型シーン(例えば、ピッチングシーン)は1つのプレイの開始であるため、属性情報(スコア情報)が表示されることが多く、属性情報領域の検出に適しているからである。
図10は、典型シーンを用いてフレーム間の重複部分を抽出する処理について模式的に示す説明図である。図10中、501は典型シーンの中の1シーンの先頭付近のフレーム、502はその直前のシーンの終端付近のフレームを示す。すなわち、ステップS21においては、典型シーンの中の1シーンの先頭付近のフレーム501と、その直前のシーンの終端付近のフレーム502との重複部分、すなわち変化がない領域が抽出される。図10においては、斜線で示す重複部分503が、変化がない領域として抽出される。
次いで、抽出された重複部分中において閾値を下回る画素を2値化によって求める(ステップS22)。
そして、抽出した全てのシーン境界の重複部分を合算し(ステップS23)、合算した重複部分中(図10中の504)において閾値を下回る画素を2値化によって求める(ステップS24)。
最後に、これらの画素の分布密度が高い部分を属性情報領域として抽出する(ステップS25)。ここで、図11は属性情報領域の抽出方法を模式的に示す説明図である。図11に示すように、画面601の中での属性情報領域の候補を602とし、この領域602の位置を求める。画面601をx軸方向,y軸方向に射影すると、603,604のような分布をもつヒストグラムが生成される。これらのヒストグラム603,604において閾値以上の頻度を持つ区間605,606を求め、その領域602を属性情報領域201の位置とする。
次に、属性情報領域有無判定部154による属性情報領域の有無の判定(ステップS4)について説明する。ステップS2で抽出された各典型シーンに属性情報(スコア情報)が表示されているか否かの判定は、ステップS3で合算された重複部分504と、各典型シーンとその直前のシーンとの重複部分(例えば、503)を比較することにより行なう。すなわち、重複部分504と、各典型シーンとその直前のシーンとの重複部分(例えば、503)を比較し、基準以上の画素が一致する場合に、その典型シーンには属性情報(スコア情報)が表示されていると判定する。
次に、文字領域抽出部155による文字領域抽出(ステップS5)について説明する。ここで、図12は文字領域の抽出処理の流れを示すフローチャート、図13は文字領域を抽出する処理について模式的に示す説明図である。図12に示すように、まず初めに、隣接する2つの典型シーン間の属性情報領域201における差分を抽出する(ステップS31)。例えば、図13においては、典型シーン701と典型シーン702の属性情報領域201における差分703を求める。
次に、閾値に基づいて差分を2値化する(ステップS32)。このようにすることで、2つの典型シーンの属性情報領域201間で、変化のあった箇所だけが抽出される。野球の投球では1プレイごとに典型シーンが繰り返されるため、1球ごとの変化が抽出される。この差分を他の隣接典型シーンの組み合わせについても求める。例えば、図13においては、典型シーン702の属性情報領域201と典型シーン704の属性情報領域201の差分705を求める。
続いて、これらの属性情報領域201内の差分を領域に分割する(ステップS33)。差分は2値化されているので、隣接画素が同じ値であれば1つの領域とする領域成長法によって領域に分割することができる。これらの領域が文字領域となる。
最後に、全ての典型シーンについて求めた文字領域から、映像中で変化のあった領域の一覧706を作成する(ステップS34)。なお、一覧には重複する領域は一度だけ含まれるようにする。
ここで、図14は重複する領域の処理例を模式的に示す説明図である。図14は、重複する領域の処理についてストライクカウントを例に説明したものである。なお、図14に示す破線部は説明のためのもので、実際には何もない。図14に示す801は、打者が交代することにより、2ストライクからノーストライクに変化したときの差分を示す領域である。図14に示す802は、ノーストライクから1ストライクに変化したときの差分を示す領域である。同様に、図14に示す803は、1ストライクから2ストライクに変化したときの差分を示す領域である。このとき、801の領域は802の領域と803の領域を合わせたものとなり、それぞれと重複する。この場合、801の領域は領域一覧には含めず、重複しない802と803の領域を含める。また、映像中に802や803と同等の領域は何度も出現するが、1回だけ採用する。
次に、文字領域意味付け部156による文字領域の意味付け(ステップS6)について説明する。文字領域意味付け部156は、ステップS5で抽出された文字領域一覧の個々の領域の意味付けを行う。
例えば、野球の場合、ボールカウント(ストライク,ボール,アウト)や得点を表すスコア文字領域(文字領域)に意味を割り当てる。意味付けにはルール情報を用い、スコア文字領域(文字領域)の特徴と照合して適合する内容を割り当てる。ルール情報は、スコア文字領域(文字領域)のグループ、他のスコア文字領域(文字領域)との相対的な位置関係やスコア文字領域(文字領域)内での大まかな位置に関する内容を含む。グループとは複数のスコア文字領域で1つの意味合いを持つものを指し、グループを構成するスコア文字領域(文字領域)の数、配色、位置関係をルール情報とする。例えば、ストライクカウントは2つのスコア文字領域(文字領域)によって構成されるので、これらの2つの領域を1グループとして扱う。そのため、意味付け処理の手順は初めに位置や色で領域をグルーピングし、次に、他のグループとの相対的な関係を比較するという2段階の処理で行う。
図15は、ルール情報の一例を示す模式図である。図15に示すように、ルール情報は、それぞれの内容901と、対応するグループとしてのルール902と、位置関係のルール903とにより構成される。例えば、「ストライク」カウントに対応して、「水平方向に隣接する2つの同サイズ同色の領域である」というグループのルール902が定義されている。そこで、各領域を位置、色によってグルーピングする。なお、隣接と近接の違いは、領域間の距離の閾値の違いであり、隣接の方がより近い位置にある。次に、「ストライク」カウントに対応して、「ボールおよびアウトカウントと領域の左端のx座標が同じ(縦並びの場合)あるいはy座標が同じ(横並びの場合)」という他の要素との相対的な位置関係についてのルール903が定義されている。そこで、このような位置関係のルール903を用いて照合を行い、ルール902に基づいてグルーピングした領域からルール903を満たすものを選択し、意味付けを完了する。
例えば野球中継においては、このように抽象度の高いルールを用いることで、放送局ごとのデザインの違いに影響を受けづらくなるので、汎用性が高まる。なお、ルール情報は1つである必要はなく複数のパターンを用意しておいてもよい。例えば、ボールカウントが数字で表示されるパターンを用意する。ルールで数字と定義されているものは属性情報領域201が表示された典型シーンを1つ以上選択し、数字として読み取ってみて、読み取ることができれば数字とする。スポーツ中継に用いられるスコア情報はスポーツごとにある程度決まった形があり、放送局が変わっても大きくは変わらないため、スポーツごとに数パターンを作成しておけば十分である。もちろん、汎用性が必要がない場合はこのような抽象的なルール情報ではなく、特定の番組のスコア情報の配置をテンプレート(雛形)とし、スコア文字領域(文字領域)の位置や大きさを細かく指定しても構わない。
次に、文字領域読み取り部157による映像属性情報の生成(ステップS7)について説明する。文字領域読み取り部157は、ステップS6で意味づけられた各文字領域から映像コンテンツに関するメタデータである映像属性情報11を読み取って出力する。ここで、図16は野球のスコア情報の一例を示す模式図である。図16に示す野球のスコア情報の例では、回、得点、ボールカウント、出塁状況を含んでいるが、一部の情報(例えば、ボールカウントだけを含む情報)を生成してもよい。その場合、当然、ステップS6における処理も該当する情報だけを意味づけることができればよい。
なお、スコア文字領域(文字領域)からの映像属性情報11の読み取りは、図形なのか文字なのかで処理が異なる。例えば、図形は、丸の数で表現されるボールカウントや出塁状況に用いられる。この場合は、各スコア文字情報が表示状態なのか、非表示状態なのかを判定する。一般的に表示状態は輝度や彩度が高い図形で表示されるので、閾値処理によって判定することができる。あるいは複数の典型シーンのスコア文字領域(文字領域)を2つのクラス(グループ)に分類し、輝度や彩度が高い方を選択する。一方、文字の読み取りの場合、野球中継で用いられる文字は数字と「表,裏」の文字であり、種類が限られている。そこで、これらの文字のテンプレートを予め作成しておき、比較することで読み取ることができる。もちろん、一般のOCRを用いたより汎用性が高い文字認識技術を用いても構わない。スコア文字領域(文字領域)から読み取ったスコア文字情報(映像属性情報11)はスポーツのルールと照らし合わせて矛盾がないように訂正される。例えば、回などに変化がないにも係わらず得点の数字が減少したときは誤認識である可能性が高いので、増加あるいは変化しない数字で読み取りの信頼性が高いものがあればそちらの数字を採用する。また、図形の読み取りに関しても、ボールカウントの1つ目が点灯せずに2つめ以降が点灯するなどの通常ありえない認識結果の場合には、前後の読み取り結果を考慮して訂正する。
このように本実施の形態によれば、映像コンテンツを分割した隣接する各シーンにおける所定のフレーム間で、変化がない領域であって属性情報が表示される領域である属性情報領域を抽出し、属性情報領域内の個々の文字が存在する領域である文字領域を抽出するとともに当該文字領域の意味付けを行い、意味付けされた文字領域から映像コンテンツに関するメタデータである映像属性情報を読み取って出力する。これにより、例えば野球中継の場合における得点やボールカウントなどの映像コンテンツに関するメタデータである映像属性情報が表示される画像領域の指定などの人手を介した作業を省略し、映像コンテンツから映像属性情報を自動的に認識して取得することができるので、映像コンテンツに関するメタデータを容易に生成することができる。
また、野球を初めとするスポーツ中継番組では投球時に投手の背後から打者方向を撮影したシーンのように、同じ構図で撮影した画像(典型的なシーン)が繰り返し現れる。このように番組に典型的なシーンはスポーツの1つのプレイごとに繰り返されることが多く、その度に得点やボールカウントなどのスコア情報に変化が生じる。そこで、本実施の形態では、対象となる映像コンテンツにおいて、野球の投球のように試合中の繰り返しの単位となる典型的なシーンを自動的に検出し、典型シーンの間での画面の変化によって映像属性情報を検出・認識することで、得点やボールカウントなどのメタデータを自動生成することにより、映像コンテンツに関するメタデータの生成を更に容易にすることができる。
[第2の実施の形態]
次に、本発明の第2の実施の形態を図17および図18に基づいて説明する。なお、前述した第1の実施の形態と同じ部分は同じ符号で示し説明も省略する。
図17は、本発明の第2の実施の形態の映像属性情報作成部15の概略構成を示すブロック図である。図17に示すように、本実施の形態の映像属性情報作成部15は、第1の実施の形態の映像属性情報作成部15の構成にイベント検出部160を追加し、イベント検出部160で検出したイベント情報30を説明文用イベント選択部18(図2参照)に出力するようにしたものである。
イベントとは試合の中で発生した何らかの事象である。例えば、野球ではヒット、ホームラン、打者の交代などが挙げられる。これらのイベントが発生すると、スコア情報(映像属性情報11)に特定の変化が起こる。そこで、イベント検出部160は、スコア情報(映像属性情報11)の変化パターンを予め用意されたイベントルール情報と照合し、特定のパターンが現れたときにイベント情報30として検出する。イベントルール情報としては、例えば、「ヒットの場合、ストライク、ボールのカウントが0に戻る」「アウトで打者が交代するときは、ストライク、ボールのカウントが0に戻り、アウトのカウントが1つ増える」「ホームランの場合は、出塁なしの状態になり、得点が増える」などが考えられる。このようなイベントルール情報を検出したいイベントの種類ごとに用意しておき、映像属性情報11と照合してイベント情報30を出力する。
ここで、図16に示したスコア情報(映像属性情報11)を例に説明する。図16に示す1001から1002のスコア情報に変化したときに、ストライク、ボールのカウントがクリアされ、アウトカウントには変化がないため、1001の投球の結果がヒットであったことが分かる。また、1003から1004への変化では、ストライク、ボールのカウント、出塁がクリアされ、得点が増えているので、ホームランと判断できる。
したがって、統合部20は、説明文用イベント選択部18で選択されたイベント情報30が含まれる典型シーンを順次再生することが可能になる。より詳細には、統合部20は、典型シーン抽出部152で得られた典型シーンの時刻を受け取り、スキップの指示があったときに典型シーンの単位で再生中の映像をスキップする。なお、次のイベントを含む典型シーンへスキップするタイミングは、前の典型シーンの再生後に自動的にスキップしてもよいし、外部からの指示があったときにスキップしてもよい。スキップした後、再生を再開するときに、説明文作成部19はその典型シーンに対応したスコア情報(映像属性情報11)に基づいて説明文を生成する。前述したように、説明文の生成はスコア情報を文章のテンプレート(説明文作成情報13)に当てはめることで行う。テンプレートは、スコア情報(映像属性情報11)の部分を除いた文章が決まっており、空白の部分にスコア情報(映像属性情報11)を当てはめる。テンプレートは1種類である必要はなく、スコア情報(映像属性情報11)の内容や前後の説明文、試合展開、ユーザの好みなどに応じて切り替えてもよい。例えば、図14の1005のスコア情報を「(回)回の(表裏)、(得点)の場面で、カウントは(ストライク)ストライク、(ボール)ボール」というテンプレートに当てはめると、「5回の裏,2対3の場面で、カウントは1ストライク、1ボール」となる。このようにして生成された説明文を音声合成を用いて音声等の可聴的情報に変換し、再生される映像に同期して再生する。このような構成とすることで、ユーザは安打のシーンや打者に対する最終投球だけを飛ばして視聴することができるので、短時間で視聴することができる。また、視聴を再開した場面での試合状況を音声で教えてくれるため、試合の流れも理解しやすくなる。
また、上述したようなスキップの際に、スコア文字領域(文字領域)の変化部分を分かり易くするように、強調表示を行うようにしても良い。図18に示すように、1401のスコア文字領域(文字領域)を含む典型シーンから1402のスコア文字領域(文字領域)を含む典型シーンにスキップで変化した際に、統合部20は、変化したスコア文字領域(文字領域)が分かり易くなるように1403のように変化部分を囲むなどして強調表示を行う。文字領域抽出部155で隣接する2つの典型シーン間の属性情報領域201における差分が得られているので、その部分の領域を強調表示する。強調表示方法は何でもよく、1403のように囲むほか、例えば色を変化させたり、点滅させたりする。このような表示とすることで、画面を切り替えたときにどの部分に動きがあったのかがすぐに把握できる。なお、ここではスキップで変化した際に強調表示を行うようにしたが、継続的な再生時にも強調表示を行うようにしても良い。
このように本実施の形態によれば、映像属性情報から詳細なメタデータであるイベント情報を生成することが可能であり、また、このようなイベント情報が発生したシーンだけを視聴することで短時間での視聴が可能となる。
本発明の第1の実施の形態にかかる映像要約装置の構成を示すブロック図である。 映像要約装置の概略構成を示すブロック図である。 映像属性情報作成部の概略構成を示すブロック図である。 映像属性情報の自動作成処理の流れを概略的に示すフローチャートである。 野球中継番組の画面例を示す模式図である。 典型シーンについて示す説明図である。 入力映像からの特徴量抽出方法について模式的に示す説明図である。 典型シーンの抽出処理の流れを示すフローチャートである。 属性情報領域の抽出処理の流れを示すフローチャートである。 典型シーンを用いてフレーム間の重複部分を抽出する処理について模式的に示す説明図である。 属性情報領域の抽出方法を模式的に示す説明図である。 文字領域の抽出処理の流れを示すフローチャートである。 文字領域を抽出する処理について模式的に示す説明図である。 重複する領域の処理例を模式的に示す説明図である。 ルール情報の一例を示す模式図である。 野球のスコア情報の一例を示す模式図である。 本発明の第2の実施の形態の映像属性情報作成部の概略構成を示すブロック図である。 強調表示の一例を模式的に示す説明図である。
符号の説明
1 映像要約装置
10 映像コンテンツ
11 映像属性情報
15 映像属性情報出力装置
16 重要度算出部
17 映像区間選択部
18 説明文用イベント選択部
19 説明文作成部
20 統合部
151 シーン分割手段
152 典型シーン抽出手段
153 属性情報領域抽出手段
154 領域判定手段
155 文字領域抽出手段
156 文字領域意味付け手段
157 映像属性情報出力手段

Claims (14)

  1. 映像コンテンツのフレーム間の類似性が低くなるシーンチェンジを検出して、前記映像コンテンツを複数のシーンに分割するシーン分割手段と、
    前記シーン分割手段で分割した隣接する前記各シーンにおける所定のフレーム間で、変化がない領域であって属性情報が表示される領域である属性情報領域を抽出する属性情報領域抽出手段と、
    前記属性情報領域抽出手段により抽出された前記属性情報領域内の個々の文字が存在する領域である文字領域を抽出する文字領域抽出手段と、
    前記文字領域抽出手段で抽出した前記文字領域について意味付けを記したルール情報を照合することにより当該文字領域の意味付けを行う文字領域意味付け手段と、
    意味付けされた前記文字領域から前記映像コンテンツに関するメタデータである映像属性情報を読み取って出力する映像属性情報出力手段と、
    を備えることを特徴とする映像属性情報出力装置。
  2. 前記シーン分割手段で分割した隣接する前記各シーンの中から前記映像コンテンツ中に何度も反復して出現する同じ構図で撮影した画像である典型シーンを抽出する典型シーン抽出手段と、
    前記典型シーン抽出手段により抽出された前記典型シーンについて、前記属性情報領域抽出手段により抽出された前記属性情報領域が有るか否かを判定する領域判定手段と、
    を更に備え、
    前記文字領域抽出手段は、前記領域判定手段により前記典型シーンに有ると判定された前記属性情報領域抽出手段により抽出された前記属性情報領域内の個々の文字が存在する領域である文字領域を抽出する、
    ことを特徴とする請求項1記載の映像属性情報出力装置。
  3. 前記属性情報領域抽出手段は、前記典型シーンとその直前のシーンの境界で前記属性情報領域を抽出する、
    ことを特徴とする請求項2記載の映像属性情報出力装置。
  4. 前記典型シーン抽出手段は、
    前記シーン分割手段で分割したシーン毎の特徴量に基づいて類似するシーンをグループに分類する分類手段と、
    同じ構図で撮影した画像が前記グループに分類されたシーンの中に所定基準以上出現する場合に、当該グループに分類された全シーンを前記典型シーンとする判定手段と、
    を備えることを特徴とする請求項2記載の映像属性情報出力装置。
  5. 前記判定手段の判定基準は、前記グループに含まれる同じ構図で撮影した画像の総数が定められた閾値を超えているか否かである、
    ことを特徴とする請求項4記載の映像属性情報出力装置。
  6. 前記判定手段の判定基準は、前記グループに含まれる同じ構図で撮影した画像の総時間が前記映像コンテンツの時間に対して一定以上の割合を占めるか否かである、
    ことを特徴とする請求項4記載の映像属性情報出力装置。
  7. 前記ルール情報は、意味付けの内容と、前記意味付けの内容に対応付けられており前記各文字領域を相対的な位置関係と配色の関係との少なくとも何れか一方によりグルーピングする第1のルールと、前記各文字領域の位置関係の第2のルールとを含み、
    前記文字領域意味付け手段は、前記第1のルールグルーピングした前記文字領域から前記第2のルールを満たす前記意味付けの内容を選択し、前記文字領域の意味付けを行う、
    ことを特徴とする請求項1記載の映像属性情報出力装置。
  8. 前記映像属性情報出力手段は、意味付けがなされた前記文字領域から読み取った前記映像属性情報に矛盾が生じた場合に認識結果を訂正する、
    ことを特徴とする請求項1記載の映像属性情報出力装置。
  9. 前記映像属性情報出力手段から出力される前記映像属性情報について、前記映像属性情報の変化パターンとイベントの内容との対応関係を含むイベントルール情報と照合し、特定のパターンが現れたときにイベント情報として検出するイベント検出手段を更に備える、
    ことを特徴とする請求項1ないし8の何れか一記載の映像属性情報出力装置。
  10. 請求項1ないし9の何れか一記載の映像属性情報出力装置と、
    前記映像属性情報出力装置から出力された前記映像属性情報に含まれるイベントごとにその重要度を算出する重要度算出部と、
    算出された重要度に従って、要約映像に含める映像コンテンツの映像区間を選択する映像区間選択部と、
    前記イベント列から要約映像に用いる説明文の生成に用いる説明文用イベントを選択する説明文用イベント選択部と、
    選択された前記説明文用イベントから説明文を生成する説明文作成部と、
    選択された前記映像区間と前記説明文とを統合し、両方の情報を含んだ要約映像情報を生成する統合部と、
    を備えることを特徴とする映像要約装置。
  11. 前記統合部は、前記説明文用イベント選択部で選択された前記説明文用イベントを含む前記要約映像情報を順次出力してスキップ再生する、
    ことを特徴とする請求項10記載の映像要約装置。
  12. 前記統合部は、スキップ再生で変化する文字領域に対して強調表示を行う、
    ことを特徴とする請求項10記載の映像要約装置。
  13. 映像コンテンツのフレーム間の類似性が低くなるシーンチェンジを検出して、前記映像コンテンツを複数のシーンに分割するシーン分割機能と、
    前記シーン分割機能で分割した隣接する前記各シーンにおける所定のフレーム間で、変化がない領域であって属性情報が表示される領域である属性情報領域を抽出する属性情報領域抽出機能と、
    前記属性情報領域抽出機能により抽出された前記属性情報領域内の個々の文字が存在する領域である文字領域を抽出する文字領域抽出機能と、
    前記文字領域抽出機能で抽出した前記文字領域について意味付けを記したルール情報を照合することにより当該文字領域の意味付けを行う文字領域意味付け機能と、
    意味付けされた前記文字領域から前記映像コンテンツに関するメタデータである映像属性情報を読み取って出力する映像属性情報出力機能と、
    をコンピュータに実行させることを特徴とするプログラム。
  14. 映像コンテンツのフレーム間の類似性が低くなるシーンチェンジを検出して、前記映像コンテンツを複数のシーンに分割するシーン分割工程と、
    前記シーン分割工程で分割した隣接する前記各シーンにおける所定のフレーム間で、変化がない領域であって属性情報が表示される領域である属性情報領域を抽出する属性情報領域抽出工程と、
    前記属性情報領域抽出工程により抽出された前記属性情報領域内の個々の文字が存在する領域である文字領域を抽出する文字領域抽出工程と、
    前記文字領域抽出工程で抽出した前記文字領域について意味付けを記したルール情報を照合することにより当該文字領域の意味付けを行う文字領域意味付け工程と、
    意味付けされた前記文字領域から前記映像コンテンツに関するメタデータである映像属性情報を読み取って出力する映像属性情報出力工程と、
    を含むことを特徴とする映像属性情報出力方法。
JP2007008909A 2007-01-18 2007-01-18 映像属性情報出力装置、映像要約装置、プログラムおよび映像属性情報出力方法 Expired - Fee Related JP5010292B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007008909A JP5010292B2 (ja) 2007-01-18 2007-01-18 映像属性情報出力装置、映像要約装置、プログラムおよび映像属性情報出力方法
US12/007,570 US8103107B2 (en) 2007-01-18 2008-01-11 Video-attribute-information output apparatus, video digest forming apparatus, computer program product, and video-attribute-information output method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007008909A JP5010292B2 (ja) 2007-01-18 2007-01-18 映像属性情報出力装置、映像要約装置、プログラムおよび映像属性情報出力方法

Publications (2)

Publication Number Publication Date
JP2008176538A true JP2008176538A (ja) 2008-07-31
JP5010292B2 JP5010292B2 (ja) 2012-08-29

Family

ID=39641276

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007008909A Expired - Fee Related JP5010292B2 (ja) 2007-01-18 2007-01-18 映像属性情報出力装置、映像要約装置、プログラムおよび映像属性情報出力方法

Country Status (2)

Country Link
US (1) US8103107B2 (ja)
JP (1) JP5010292B2 (ja)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012032953A1 (ja) * 2010-09-06 2012-03-15 ソニー株式会社 動画像処理装置、動画像処理方法およびプログラム
KR101331242B1 (ko) * 2012-07-27 2013-11-26 차병래 검색가능 이미지 암호화 시스템
KR20160025477A (ko) 2014-08-27 2016-03-08 후지쯔 가부시끼가이샤 정보 처리 방법 및 장치
JP2016107001A (ja) * 2014-12-10 2016-06-20 富士通株式会社 抽出プログラム、方法、及び装置
WO2016103457A1 (ja) * 2014-12-26 2016-06-30 Necディスプレイソリューションズ株式会社 映像記録作成装置、映像記録作成方法およびプログラム
US9530061B2 (en) 2014-01-20 2016-12-27 Fujitsu Limited Extraction method for extracting a pitching scene and device for the same
US9767364B2 (en) 2014-06-09 2017-09-19 Fujitsu Limited Footage extraction method, footage playback method, and device
JP2017169992A (ja) * 2016-03-25 2017-09-28 株式会社Jvcケンウッド 表示装置、表示方法及び表示プログラム
JP2018102898A (ja) * 2016-07-22 2018-07-05 ジョセフ プローグマンJoseph Ploegman 野球のバッターカウントを表示するためのシステムおよび方法
US10200764B2 (en) 2014-08-27 2019-02-05 Fujitsu Limited Determination method and device
WO2019088592A1 (ko) * 2017-11-01 2019-05-09 삼성전자주식회사 전자 장치 및 이의 제어방법
JP2020042771A (ja) * 2018-09-07 2020-03-19 台達電子工業股▲ふん▼有限公司Delta Electronics,Inc. データ分析方法及びデータ分析システム
KR20200038667A (ko) * 2018-10-04 2020-04-14 주식회사 엔씨소프트 스포츠 경기의 하이라이트 추출 방법 및 장치
KR20200095437A (ko) * 2020-07-27 2020-08-10 주식회사 엔씨소프트 스포츠 경기의 하이라이트 추출 방법 및 장치
JP2021524686A (ja) * 2018-05-18 2021-09-13 スーズ,インコーポレイテッド 埋め込まれた情報カードコンテンツを認識および解釈するための機械学習
US11409804B2 (en) 2018-09-07 2022-08-09 Delta Electronics, Inc. Data analysis method and data analysis system thereof for searching learning sections
JP7486871B1 (ja) 2024-03-25 2024-05-20 株式会社Star Ai シーン抽出システム、シーン抽出方法及びシーン抽出プログラム
JP7511482B2 (ja) 2018-05-18 2024-07-05 スタッツ エルエルシー 埋め込まれた情報カード位置特定およびコンテンツ抽出のためのビデオ処理

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101264070B1 (ko) * 2009-03-25 2013-05-13 후지쯔 가부시끼가이샤 재생 제어 프로그램을 기록한 컴퓨터 판독 가능한 매체, 재생 제어 방법 및 재생 장치
US9367745B2 (en) * 2012-04-24 2016-06-14 Liveclips Llc System for annotating media content for automatic content understanding
US20130283143A1 (en) 2012-04-24 2013-10-24 Eric David Petajan System for Annotating Media Content for Automatic Content Understanding
JP2014106637A (ja) * 2012-11-26 2014-06-09 Sony Corp 情報処理装置および方法、並びにプログラム
JP6303525B2 (ja) * 2014-01-20 2018-04-04 富士通株式会社 抽出プログラム、方法、及び装置、並びに野球映像メタ情報作成装置、方法、及びプログラム
CN105850149B (zh) * 2014-03-28 2018-12-14 松下知识产权经营株式会社 影像接收装置、参数设定方法以及附加信息显示***
US10536758B2 (en) 2014-10-09 2020-01-14 Thuuz, Inc. Customized generation of highlight show with narrative component
US10433030B2 (en) 2014-10-09 2019-10-01 Thuuz, Inc. Generating a customized highlight sequence depicting multiple events
US11863848B1 (en) 2014-10-09 2024-01-02 Stats Llc User interface for interaction with customized highlight shows
JP2017187969A (ja) * 2016-04-07 2017-10-12 富士通株式会社 画像処理装置、画像処理プログラム、及び画像処理方法
US10410060B2 (en) * 2017-12-14 2019-09-10 Google Llc Generating synthesis videos
CN108829881B (zh) * 2018-06-27 2021-12-03 深圳市腾讯网络信息技术有限公司 视频标题生成方法及装置
CN109364480A (zh) * 2018-10-26 2019-02-22 杭州电魂网络科技股份有限公司 一种信息同步方法和装置
WO2021234779A1 (ja) * 2020-05-18 2021-11-25 日本電気株式会社 情報処理装置、映像配信システム、情報処理方法、及び、記録媒体

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007006454A (ja) * 2005-05-26 2007-01-11 Sony Corp コンテンツ処理装置及びコンテンツ処理方法、並びにコンピュータ・プログラム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH099199A (ja) 1995-06-19 1997-01-10 Sony Corp 映像信号記録/再生装置
JP2000132563A (ja) 1998-10-26 2000-05-12 Omron Corp 画像検索方法,画像処理方法,および情報検索方法、ならびにこれらの方法を実行するためのプログラムが記録された記録媒体,画像処理装置,および情報検索システム
JP3738631B2 (ja) * 1999-09-27 2006-01-25 三菱電機株式会社 画像検索システムおよび画像検索方法
JP2001177806A (ja) 1999-12-20 2001-06-29 Sony Corp 情報信号表示方法及び情報信号表示装置
JP3821362B2 (ja) 2001-08-20 2006-09-13 日本ビクター株式会社 インデックス情報生成装置、記録再生装置、及びインデックス情報生成方法
JP4067326B2 (ja) 2002-03-26 2008-03-26 富士通株式会社 動画像内容表示装置
US8872979B2 (en) * 2002-05-21 2014-10-28 Avaya Inc. Combined-media scene tracking for audio-video summarization
JP3918772B2 (ja) 2003-05-09 2007-05-23 日本電気株式会社 映像編集装置、映像編集方法、および映像編集プログラム
JP3923932B2 (ja) 2003-09-26 2007-06-06 株式会社東芝 映像要約装置、映像要約方法及びプログラム
JP4047264B2 (ja) 2003-09-30 2008-02-13 株式会社東芝 動画像処理装置、動画像処理方法および動画像処理プログラム
US7382933B2 (en) * 2005-08-24 2008-06-03 International Business Machines Corporation System and method for semantic video segmentation based on joint audiovisual and text analysis

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007006454A (ja) * 2005-05-26 2007-01-11 Sony Corp コンテンツ処理装置及びコンテンツ処理方法、並びにコンピュータ・プログラム

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012032953A1 (ja) * 2010-09-06 2012-03-15 ソニー株式会社 動画像処理装置、動画像処理方法およびプログラム
KR101331242B1 (ko) * 2012-07-27 2013-11-26 차병래 검색가능 이미지 암호화 시스템
US9530061B2 (en) 2014-01-20 2016-12-27 Fujitsu Limited Extraction method for extracting a pitching scene and device for the same
TWI586161B (zh) * 2014-01-20 2017-06-01 富士通股份有限公司 擷取方法及裝置
TWI659654B (zh) * 2014-06-09 2019-05-11 日商富士通股份有限公司 映像片段擷取方法、映像片段重播方法及裝置
US9767364B2 (en) 2014-06-09 2017-09-19 Fujitsu Limited Footage extraction method, footage playback method, and device
US10115318B2 (en) 2014-08-27 2018-10-30 Fujitsu Limited Information processing method and device
KR20160025477A (ko) 2014-08-27 2016-03-08 후지쯔 가부시끼가이샤 정보 처리 방법 및 장치
JP2016048853A (ja) * 2014-08-27 2016-04-07 富士通株式会社 情報処理プログラム、方法、及び装置
TWI579026B (zh) * 2014-08-27 2017-04-21 富士通股份有限公司 資訊處理方法及裝置
US10200764B2 (en) 2014-08-27 2019-02-05 Fujitsu Limited Determination method and device
JP2016107001A (ja) * 2014-12-10 2016-06-20 富士通株式会社 抽出プログラム、方法、及び装置
US10134445B2 (en) 2014-12-10 2018-11-20 Fujitsu Limited Method of extracting a point from footage of a baseball game
JPWO2016103457A1 (ja) * 2014-12-26 2017-09-28 Necディスプレイソリューションズ株式会社 映像記録作成装置、映像記録作成方法およびプログラム
WO2016103457A1 (ja) * 2014-12-26 2016-06-30 Necディスプレイソリューションズ株式会社 映像記録作成装置、映像記録作成方法およびプログラム
JP2017169992A (ja) * 2016-03-25 2017-09-28 株式会社Jvcケンウッド 表示装置、表示方法及び表示プログラム
JP2018102898A (ja) * 2016-07-22 2018-07-05 ジョセフ プローグマンJoseph Ploegman 野球のバッターカウントを表示するためのシステムおよび方法
WO2019088592A1 (ko) * 2017-11-01 2019-05-09 삼성전자주식회사 전자 장치 및 이의 제어방법
US11367283B2 (en) 2017-11-01 2022-06-21 Samsung Electronics Co., Ltd. Electronic device and control method thereof
JP2021525031A (ja) * 2018-05-18 2021-09-16 スーズ,インコーポレイテッド 埋め込まれた情報カード位置特定およびコンテンツ抽出のためのビデオ処理
JP7511482B2 (ja) 2018-05-18 2024-07-05 スタッツ エルエルシー 埋め込まれた情報カード位置特定およびコンテンツ抽出のためのビデオ処理
JP7485866B2 (ja) 2018-05-18 2024-05-17 スタッツ エルエルシー 埋め込まれた情報カードコンテンツを認識および解釈するための機械学習
JP2021524686A (ja) * 2018-05-18 2021-09-13 スーズ,インコーポレイテッド 埋め込まれた情報カードコンテンツを認識および解釈するための機械学習
US11409804B2 (en) 2018-09-07 2022-08-09 Delta Electronics, Inc. Data analysis method and data analysis system thereof for searching learning sections
JP2020042771A (ja) * 2018-09-07 2020-03-19 台達電子工業股▲ふん▼有限公司Delta Electronics,Inc. データ分析方法及びデータ分析システム
JP7038090B2 (ja) 2018-10-04 2022-03-17 エヌシーソフト・コーポレイション スポーツ競技のハイライト抽出方法および装置
US11238288B2 (en) 2018-10-04 2022-02-01 Ncsoft Corporation Method and apparatus for extracting highlight of sporting event
KR102187208B1 (ko) * 2018-10-04 2020-12-04 주식회사 엔씨소프트 스포츠 경기의 하이라이트 추출 방법 및 장치
JP2020061729A (ja) * 2018-10-04 2020-04-16 エヌシーソフト・コーポレイションNcsoft Corporation スポーツ競技のハイライト抽出方法および装置
KR20200038667A (ko) * 2018-10-04 2020-04-14 주식회사 엔씨소프트 스포츠 경기의 하이라이트 추출 방법 및 장치
KR102248456B1 (ko) * 2020-07-27 2021-05-06 주식회사 엔씨소프트 스포츠 경기의 하이라이트 추출 방법 및 장치
KR20200095437A (ko) * 2020-07-27 2020-08-10 주식회사 엔씨소프트 스포츠 경기의 하이라이트 추출 방법 및 장치
JP7486871B1 (ja) 2024-03-25 2024-05-20 株式会社Star Ai シーン抽出システム、シーン抽出方法及びシーン抽出プログラム

Also Published As

Publication number Publication date
US8103107B2 (en) 2012-01-24
US20080175486A1 (en) 2008-07-24
JP5010292B2 (ja) 2012-08-29

Similar Documents

Publication Publication Date Title
JP5010292B2 (ja) 映像属性情報出力装置、映像要約装置、プログラムおよび映像属性情報出力方法
US8121462B2 (en) Video edition device and method
JP4449216B2 (ja) 映像情報の編集方法及び編集装置
US7487524B2 (en) Method and apparatus for presenting content of images
JP5691289B2 (ja) 情報処理装置、情報処理方法、及び、プログラム
JP2008048279A (ja) 映像再生装置、方法およびプログラム
US20030086692A1 (en) Special reproduction control information describing method, special reproduction control information creating apparatus and method therefor, and video reproduction apparatus and method therefor
JP2006287319A (ja) 番組ダイジェスト作成装置および番組ダイジェスト作成プログラム
WO2007127695A2 (en) Prefernce based automatic media summarization
JP2010074518A (ja) 番組推奨装置
JP2008022103A (ja) テレビ番組動画像ハイライト抽出装置及び方法
JP2008283486A (ja) 情報処理装置、情報処理方法、およびプログラム
JP2007060060A (ja) 再生システム、再生装置、再生方法、情報処理装置、情報処理方法、およびプログラム
JP2007336283A (ja) 情報処理装置、情報処理方法および情報処理プログラム
US20050182503A1 (en) System and method for the automatic and semi-automatic media editing
JP2009118168A (ja) 番組録画再生装置、および、番組録画再生方法
JP2009004994A (ja) ダイジェスト映像情報作成方法、ダイジェスト映像情報作成プログラム、および、映像装置
US8300894B2 (en) Method for decomposition and rendering of video content and user interface for operating the method thereof
US20050254782A1 (en) Method and device of editing video data
JPH11220689A (ja) 映像ソフト処理装置及び同処理プログラム記録記憶媒体
JP2008084021A (ja) 動画シナリオ生成方法、プログラムおよび装置
US20080095512A1 (en) Information Signal Processing Method And Apparatus, And Computer Program Product
WO2021240644A1 (ja) 情報出力プログラム、装置、及び方法
US20100079673A1 (en) Video processing apparatus and method thereof
Li et al. Bridging the semantic gap in sports

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090326

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110708

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110719

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110920

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120508

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120601

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150608

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees