JP4452122B2 - メタデータ生成装置及びメタデータ生成プログラム - Google Patents

メタデータ生成装置及びメタデータ生成プログラム Download PDF

Info

Publication number
JP4452122B2
JP4452122B2 JP2004141595A JP2004141595A JP4452122B2 JP 4452122 B2 JP4452122 B2 JP 4452122B2 JP 2004141595 A JP2004141595 A JP 2004141595A JP 2004141595 A JP2004141595 A JP 2004141595A JP 4452122 B2 JP4452122 B2 JP 4452122B2
Authority
JP
Japan
Prior art keywords
section
metadata
semantic information
information extraction
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004141595A
Other languages
English (en)
Other versions
JP2005322173A (ja
Inventor
雅規 佐野
英樹 住吉
正啓 柴田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2004141595A priority Critical patent/JP4452122B2/ja
Publication of JP2005322173A publication Critical patent/JP2005322173A/ja
Application granted granted Critical
Publication of JP4452122B2 publication Critical patent/JP4452122B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Television Signal Processing For Recording (AREA)

Description

本発明は、コンテンツに含まれる種々の情報に基づいて、当該コンテンツの情報を記述したメタデータを生成するメタデータ生成装置及びメタデータ生成プログラムに関する。
近年、番組等のコンテンツ(映像コンテンツ)の情報を記述したメタデータを、コンテンツに含まれる種々の情報から生成する研究が行われ、種々のメタデータ生成手法が開示されている。例えば、映像コンテンツを解析し、その特徴をメタデータとするもの(特許文献1参照)、コンテンツ内のテキスト情報からキーワードを抽出してメタデータとするもの(特許文献2参照)、音を解析して音楽の区間やスピーチの区間毎の情報をメタデータとするもの(非特許文献1参照)等が存在する。
また、最近では、マルチモーダルと称する、映像や音声などの多様な情報を統合的に処理する研究が行われ、複数のメディア、例えば、映像処理によって生成されるメタデータと、音声処理によって生成されるメタデータとを統合して新しいメタデータを生成する技術が存在する(非特許文献2参照)。
特開2004−7535号公報(図1) 特開2003−228569号公報(図1) 南憲一、他3名「音情報を用いた映像インデキシングとその応用」、電子情報通信学会論文誌 Vol.J81−D2 No.3 pp.529−537 笹森重和、他2名「インターモーダル協調による映像メディアからのイベント抽出」、電子情報通信学会 PRMU98−189、pp.99−106(1999)
前記した従来のメタデータ生成手法は、個々に特化した固有の手法によってメタデータを生成しているため、生成されるメタデータのデータ形式も、手法によってそれぞれ異なっている。そのため、例えば、1つのコンテンツから、映像、音声等に関するメタデータを生成する場合、データ形式の異なるメタデータが複数生成されるため、コンテンツとして1つの定型化したメタデータを生成するには、複数のメタデータを個々に編集しなければならず、手間がかかってしまうという問題があった。
また、個々のメタデータを汎用的に生成・編集するためのツール(装置、プログラム)は、これまで開発報告等がなく、種々のメタデータを、共通のインタフェースにより同じ操作環境で統一的に生成・編集することが可能なツールに対する要求が高まっている。
本発明は、以上のような課題を解決するためになされたものであり、コンテンツのメタデータを生成する際に、ユーザ(利用者)に対して共通の操作環境を提供し、映像、音声等で異なるメタデータを統一した形式のメタデータとして生成・編集が可能なメタデータ生成装置及びメタデータ生成プログラムを提供することを目的とする。
本発明は、前記目的を達成するために創案されたものであり、まず、請求項1に記載のメタデータ生成装置は、コンテンツにおいて、ある事象の事象区間毎に、前記コンテンツの内容を示す意味情報を対応付けた、当該コンテンツにおける前記事象区間毎の情報である区間メタデータを生成するメタデータ生成装置であって、区間情報抽出手段と、事象選択手段と、区間情報取得処理手段と、意味情報抽出手段と、種別選択手段と、意味情報取得処理手段とを備える構成とした。
かかる構成によれば、メタデータ生成装置は、コンテンツから事象を検出し、少なくとも当該事象の開始時刻及び終了時刻を区間情報として抽出する複数の区間情報抽出手段を備え、事象選択手段によって、複数の事象の中から1つを選択事象として指示されることで、当該選択事象に対応する区間情報抽出手段を選択する。これによって、当該メタデータ生成装置のユーザ(利用者)が、コンテンツの中から、所望する事象が発生している事象区間を示す区間情報を抽出する区間情報抽出手段を選択することが可能になる。なお、ここで事象とは、コンテンツ内で発生する固有の現象や変化であって、例えば、映像のシーンの切り替わりや、音声の周波数変化等である。また、事象区間は、例えば、映像のシーンの切り替わりとなるカット点間の区間や、ある周波数領域の音声区間等、コンテンツとなる映像、音声等の特徴を示す区間のことをいう。
そして、メタデータ生成装置は、区間情報取得処理手段によって、事象選択手段で選択された区間情報抽出手段から、コンテンツにおける選択事象の区間情報を取得し、第1の区間メタデータを生成する。これによって、少なくとも事象の開始時刻及び終了時刻を含んだ区間メタデータが生成される。
さらに、メタデータ生成装置は、コンテンツを解析し、そのコンテンツの内容を示す意味情報を区間情報における開始時刻及び終了時刻に対応付けて抽出する複数の意味情報抽出手段を備え、種別選択手段によって、意味情報の種別の中から1つを選択種別として指示されることで、当該選択種別に対応する意味情報抽出手段を選択する。これによって、当該メタデータ生成装置のユーザが、コンテンツの中から、所望する意味情報を抽出する意味情報抽出手段を選択することが可能になる。なお、ここで意味情報とは、コンテンツ内のある区間(ここでは、区間情報で示される事象区間)における意味・内容を示す情報であって、例えば、映像内に登場する人物名やその動作、あるいは、スポーツ中継等でアナウンサが話すコメント等である。
そして、メタデータ生成装置は、意味情報取得処理手段によって、種別選択手段で選択された意味情報抽出手段から、意味情報を取得し、区間情報と意味情報とを対応付けた第2の区間メタデータを生成する。これによって、コンテンツの事象区間毎に、意味情報が対応付けられた区間メタデータが生成される。
また、請求項2に記載のメタデータ生成装置は、請求項1に記載のメタデータ生成装置において、前記区間情報抽出手段が、予め当該区間情報抽出手段の機能を示す文字列を保持しており、前記事象選択手段が、前記区間情報抽出手段から前記文字列を取得することで、当該文字列を表示装置の画面上に一覧表示する構成とした。
かかる構成によれば、メタデータ生成装置は、予め個々の区間情報抽出手段がその機能を示す文字列を保持しておくことで、事象選択手段が、区間情報抽出手段からその文字列を取得する。そして、メタデータ生成装置は、その文字列を表示装置の画面上に一覧表示する。これによって、ユーザは、どの区間情報抽出手段が利用可能で、どの区間情報抽出手段がどのような機能を有しているのかを認識することができる。
さらに、請求項3に記載のメタデータ生成装置は、請求項1又は請求項2に記載のメタデータ生成装置において、前記区間情報抽出手段が、予め当該区間情報抽出手段において前記区間情報を抽出するためのパラメータの項目を保持しており、前記区間情報取得処理手段が、前記区間情報抽出手段から前記パラメータの項目を取得することで、当該パラメータの項目を表示した当該パラメータの入力画面を表示装置に表示する構成とした。
かかる構成によれば、メタデータ生成装置は、予め個々の区間情報抽出手段が区間情報を抽出するためのパラメータの項目を保持しておくことで、区間情報取得処理手段が、区間情報抽出手段からそのパラメータの項目を取得する。そして、メタデータ生成装置は、そのパラメータの項目を表示したパラメータの入力画面を表示装置に表示することで、ユーザに対して、パラメータの入力を促す。これによって、メタデータ生成装置は、異なる区間情報抽出手段を動作させる場合であっても、ユーザに対して共通のインタフェースを提供することが可能になる。
また、請求項4に記載のメタデータ生成装置は、請求項1に記載のメタデータ生成装置において、前記意味情報抽出手段が、予め当該意味情報抽出手段の機能を示す文字列を保持しており、前記種別選択手段が、前記意味情報抽出手段から前記文字列を取得することで、当該文字列を表示装置の画面上に一覧表示する構成とした。
かかる構成によれば、メタデータ生成装置は、予め個々の意味情報抽出手段がその機能を示す文字列を保持しておくことで、種別選択手段が、意味情報抽出手段からその文字列を取得する。そして、メタデータ生成装置は、その文字列を表示装置の画面上に一覧表示する。これによって、ユーザは、どの意味情報抽出手段が利用可能で、どの意味情報抽出手段がどのような機能を有しているのかを認識することができる。
さらに、請求項5に記載のメタデータ生成装置は、請求項1又は請求項4に記載のメタデータ生成装置において、前記意味情報抽出手段が、予め当該意味情報抽出手段において前記意味情報を抽出するためのパラメータの項目を保持しており、前記意味情報取得処理手段が、前記意味情報抽出手段から前記パラメータの項目を取得することで、当該パラメータの項目を表示した当該パラメータの入力画面を表示装置に表示する構成とした。
かかる構成によれば、メタデータ生成装置は、予め個々の意味情報抽出手段が意味情報を抽出するためのパラメータの項目を保持しておくことで、意味情報取得処理手段が、意味情報抽出手段からそのパラメータの項目を取得する。そして、メタデータ生成装置は、そのパラメータの項目を表示したパラメータの入力画面を表示装置に表示することで、ユーザに対して、パラメータの入力を促す。これによって、メタデータ生成装置は、異なる意味情報抽出手段を動作させる場合であっても、ユーザに対して共通のインタフェースを提供することが可能になる。
また、請求項6に記載のメタデータ生成装置は、請求項1乃至請求項5のいずれか一項に記載のメタデータ生成装置において、前記意味情報取得処理手段が、前記意味情報を取得する毎に、前記区間情報に複数の前記意味情報を対応付けた区間メタデータを生成する構成とした。
かかる構成によれば、メタデータ生成装置は、種別選択手段によって、異なる意味情報抽出手段が選択され、意味情報取得処理手段によって、意味情報を取得する毎に、同一の事象区間である1つの区間情報に対して、異なる意味情報が順次付加された区間メタデータを生成する。
さらに、請求項7に記載のメタデータ生成プログラムは、コンテンツにおいて、ある事象に対して、少なくとも当該事象の開始時刻及び終了時刻を区間情報として前記コンテンツから抽出する、前記事象毎に異なる複数の区間情報抽出モジュールと、前記コンテンツを解析し、当該コンテンツの内容を示す意味情報を時刻に対応付けて抽出する、前記意味情報の種別毎に異なる複数の意味情報抽出モジュールとに基づいて、前記コンテンツにおける事象区間毎の情報である区間メタデータを生成するために、コンピュータを、事象選択手段、区間情報取得処理手段、種別選択手段、意味情報取得処理手段として機能させる構成とした。
かかる構成によれば、メタデータ生成プログラムは、事象選択手段によって、複数の事象の中から1つを選択事象として指示されることで、当該選択事象に対応する区間情報抽出モジュールを選択する。これによって、コンテンツの中から、ユーザが所望する事象が発生している事象区間を示す区間情報を抽出する区間情報抽出モジュールを選択することが可能になる。
そして、メタデータ生成プログラムは、区間情報取得処理手段によって、事象選択手段で選択された区間情報抽出モジュールから、コンテンツにおける選択事象の区間情報を取得し、第1の区間メタデータを生成する。
さらに、メタデータ生成プログラムは、種別選択手段によって、意味情報の種別の中から1つを選択種別として指示されることで、当該選択種別に対応する前記意味情報抽出モジュールを選択する。これによって、コンテンツの中から、ユーザが所望する意味情報を抽出する意味情報抽出モジュールを選択することが可能になる。
そして、メタデータ生成プログラムは、意味情報取得処理手段によって、種別選択手段で選択された意味情報抽出モジュールから、意味情報を取得し、区間情報と意味情報とを対応付けた第2の区間メタデータを生成する。
請求項1に記載の発明によれば、メタデータ生成装置は、コンテンツの事象区間毎に、区間情報と意味情報とを対応付けた区間メタデータを生成することができる。このとき、ユーザは、複数の区間情報抽出手段や意味情報抽出手段から、所望の機能を行う手段を選択するだけの簡単な操作で、区間メタデータを生成することができる。さらに、メタデータ生成装置において生成された区間メタデータは、区間情報抽出手段や意味情報抽出手段の機能が異なる場合であっても、区間情報と意味情報とを含んだ共通した形式となる。そのため、メタデータ生成装置は、従来では、個別に生成されたメタデータを、共通に扱うことが可能なプラットフォームとなり、メタデータ(区間メタデータ)を分散して処理したり、メタデータを相互に交換したり等、種々な流通形態を実現することができる。
請求項2又は請求項4に記載の発明によれば、メタデータ生成装置は、区間情報抽出手段又は意味情報抽出手段が保持している機能を示す文字列を画面上に一覧表示するため、ユーザは一覧表示された項目の中から1つを選択するだけの簡単な操作で、所望の機能を行う手段を選択することができる。また、区間情報抽出手段又は意味情報抽出手段を追加する場合、区間情報抽出手段又は意味情報抽出手段に、共通のインタフェースとして、文字列を通知する機能を付加しておくだけで、簡単に区間情報抽出手段又は意味情報抽出手段の機能を示す文字列を一覧表示に付加することができる。
請求項3又は請求項5に記載の発明によれば、メタデータ生成装置は、区間情報抽出手段又は意味情報抽出手段が保持しているパラメータの項目を入力画面に表示して、ユーザに対してパラメータの入力を促すため、機能が異なる手段が選択された場合であっても、ユーザは、容易にその機能を実現するためのパラメータを認識し入力することができる。また、区間情報抽出手段又は意味情報抽出手段を追加する場合、共通のインタフェースとして、パラメータの項目を通知する機能を付加しておくだけで、簡単に区間情報抽出手段又は意味情報抽出手段のパラメータの項目を入力画面に表示することができる。
請求項6に記載の発明によれば、メタデータ生成装置は、1つの区間情報に複数の意味情報を対応付けることができ、異なる意味情報抽出手段を用いる場合であっても、共通の形式で区間メタデータを生成することができる。これによって、メタデータ生成装置は、メタデータを生成する統合プラットフォームとして機能させることができる。
請求項7の記載の発明によれば、メタデータ生成プログラムは、コンテンツの事象区間毎に、区間情報と意味情報とを対応付けた区間メタデータを生成することができる。このとき、メタデータ生成プログラムは、各区間情報や意味情報を抽出する手段として、モジュール化されたプログラムを使用するため、共通のインタフェースを持つモジュールを生成することで、簡単に機能追加を行うことができる。
以下、本発明の実施の形態について図面を参照して説明する。
[メタデータ生成システムの構成]
まず、図1を参照して、本発明に係るメタデータ生成システムの構成について説明する。図1は、本発明に係るメタデータ生成システムの構成を示すブロック図である。
図1に示すように、メタデータ生成システム100は、コンテンツ(映像、音声、テキスト情報)から、その特徴に基づいて、ある時間幅である区間(セグメント)毎の情報を抽出し、さらに、その区間に対して、意味(ラベル)を対応付けることで、抽出した区間毎のメタデータ(区間メタデータ)を生成及び編集するものである。ここで、メタデータ生成システム100は、メタデータ生成装置1と、モジュール蓄積装置2と、コンテンツ蓄積装置3とを備えている。
メタデータ生成装置1は、モジュール蓄積装置2に蓄積されているモジュールを選択し、メタデータ生成装置1内に組み込んで動作させることで、コンテンツから、区間メタデータを生成するとともに、その編集を行うものである。このメタデータ生成装置1の詳細な構成については後記する。
モジュール蓄積装置2は、コンテンツから区間(セグメント)毎の情報を抽出するプログラム(モジュール:区間情報抽出モジュールSM(SM1、SM2、SM3…))と、その区間に対して意味(ラベル)を対応付けるプログラム(モジュール:意味情報抽出モジュールLM(LM1、LM2、LM3…))とを蓄積するもので、ハードディスク等の記憶装置である。
区間情報抽出モジュールSMは、コンテンツの特徴に基づいて、その特徴となる区間を開始時刻及び終了時刻として抽出するものである。なお、区間情報抽出モジュールSMは、後記するメタデータ生成装置1の区間情報抽出モジュール選択手段10によって選択され、メタデータ生成装置1の区間情報抽出手段10aとして組み込まれて動作する。この区間情報抽出モジュールSMは、例えば、動的リンクライブラリ(DLL)として生成しておくことができる。ここでは、区間情報抽出モジュール(SM1、SM2、SM3…)は、それぞれ、異なる特徴によって区間情報を抽出するものとする。
例えば、区間情報抽出モジュールSM1は、番組(コンテンツ)がサッカーの中継番組である場合、観客の歓声をデジタイズした音声ファイル(コンテンツ蓄積装置3内の音声A1)から、ある一定音量となる時間区間を抽出するものとして機能する。なお、区間情報抽出モジュールSMは、コンテンツから目的となる特定の区間を抽出するものであれば、これに限定されるものではなく、例えば、映像の切り替わりフレームであるカット点を検出し、そのカット点間の区間(開始時刻、終了時刻)を区間情報として抽出するものでもよい。
意味情報抽出モジュールLMは、区間情報抽出モジュールSMで抽出された区間情報に対応付けて、コンテンツから、当該コンテンツの内容等を意味情報として抽出するものである。なお、意味情報抽出モジュールLMは、後記するメタデータ生成装置1の意味情報抽出モジュール選択手段12によって選択され、メタデータ生成装置1の意味情報抽出手段12aとして組み込まれて動作する。この意味情報抽出モジュールLMは、区間情報抽出モジュールSMと同様に動的リンクライブラリ(DLL)として生成し、同一のコンテンツから異なる意味情報を抽出する複数の意味情報抽出モジュール(LM1、LM2、LM3…)として、モジュール蓄積装置2に蓄積しておく。
例えば、意味情報抽出モジュールLM1は、番組(コンテンツ)がサッカーの中継番組である場合、一般的な顔認識技術により、映像ファイル(コンテンツ蓄積装置3内の映像V1)から、区間情報抽出モジュールSM1で抽出した区間内の映像に映っている選手を検出し、その選手名を意味情報として区間情報に対応付ける。なお、意味情報抽出モジュールLMは、コンテンツから目的となる内容を意味情報として抽出するものであれば、これに限定されるものではなく、例えば、サッカーの中継番組におけるアナウンサのコメントをテキスト化したテキスト情報(コンテンツ蓄積装置3内のテキスト情報T1)から、区間情報に対応するコメントを抽出するものでもよい。
コンテンツ蓄積装置3は、コンテンツを蓄積するもので、ハードディスク等の記憶装置である。ここでは、コンテンツ蓄積装置3は、コンテンツとして、映像(V1、V2…)、音声(A1、A2…)、テキスト情報(T1、T2、…)を記憶している。
ここで、映像(V1等)は、例えば、MPEG等の映像ファイルである。また、音声(A1等)は、映像(V1等)と同一時刻の音声を収録した音声ファイルである。例えば、音声A1は、Windows(登録商標)の標準的なWAVE形式(PCM録音された音声データ)の音声ファイルである。また、テキスト情報(T1等)は、映像(V1等)の再生時刻に対応付けられた種々の情報をテキストデータで記述したテキストファイルである。例えば、テキスト情報T1は、アナウンサのコメントを時刻毎にテキスト化したテキストファイルである。
このように、メタデータ生成装置1は、モジュール蓄積装置2から、区間情報を抽出するモジュール(区間情報抽出モジュールSM)を選択し、そのモジュールによってコンテンツを区間毎に区分(セグメント化)する。そして、メタデータ生成装置1は、モジュール蓄積装置2から、意味情報を抽出するモジュール(意味情報抽出モジュールLM)を選択し、そのモジュールによってセグメント化された区間情報に、意味情報を対応付けることで、区間メタデータを生成する。
ここで、図2を参照して、区間メタデータについて説明する。図2は、区間メタデータの構成を説明するための説明図であって、(a)は区間メタデータの構成、(b)は区間メタデータの例を示している。
図2(a)に示すように、区間メタデータは、識別情報と、区間情報と、意味情報とを含んだ、コンテンツの内容を示すデータである。
ここで、識別情報は、当該区間メタデータを識別するための固有の情報であって、数値等の識別子(ID)である。
また、区間情報は、コンテンツにおける当該区間メタデータの時間区間を示す情報であって、開始時刻(In)と終了時刻(Out)である。
また、意味情報は、区間情報で区分されたコンテンツの時間区間における意味・内容を、キー(Key)と値(Value)とに対応付けた情報である。ここでキー(Key)は、意味・内容の種別を示す情報である。また、値(Value)は、キー(Key)で示される種別の詳細な情報である。さらに、ここでは、意味情報として、各区間メタデータの関係(区間関係)を示す情報を付加している。この意味情報では、区間関係をタイプ(Type)とターゲット(Target)とに対応付けている。ここでタイプ(Type)は、当該区間に対して、他の区間がどのような意味合いを有しているのかを示す情報である。また、ターゲット(Target)は、区間関係の対象となる他の区間を示す情報(識別子)である。なお、同一の区間メタデータ内に、複数の意味情報を対応付けることも可能である。
この区間メタデータの具体例を図2(b)で説明する。
図2(b)に示すように、識別情報である識別子ID(「001」、「002」、「003」)によって、区間メタデータM1、区間メタデータM2、区間メタデータM3が識別される。
また、区間メタデータは、開始時刻In及び終了時刻Outによって、コンテンツの時刻(番組時刻)において、どの時間区間のメタデータであるかが表されている。例えば、区間メタデータM1は、「09:00:32−00」から「09:00:54−00」の時間区間のメタデータであることを表している。なお、時刻「XX:XX:XX−XX」は、「時:分:秒−フレーム番号」を示している。
また、区間メタデータは、意味・内容を示すキー(Key)及び値(Value)によって、当該区間におけるコンテンツの内容を示している。例えば、区間メタデータM1は、ある事象が発生したことを示す「イベント」をキー(Key)とし、そのイベントの詳細な情報である「シュート」を値(Value)として、当該区間の意味・内容を示している。また、区間メタデータM2は、映像内に選手が映っていることを示す「選手」をキー(Key)とし、その選手の詳細な情報である選手名「B選手」を値(Value)として、当該区間の意味・内容を示している。
さらに、区間メタデータは、区間関係を示すタイプ(Type)及びターゲット(Target)によって、当該区間と他の区間との関係を示している。例えば、区間メタデータM1は、他の区間(ここでは、識別子「003」)をターゲット(Target)とし、他の区間の映像が、本区間のスロー再生映像(「スロー再生」)であることを、タイプ(Type)によって示している。
このように、区間メタデータを定義しておくことで、異なる特徴によってコンテンツから区間情報を抽出したり、異なる意味情報を抽出したりする場合であっても、共通の区間メタデータの形式で表現することができる。
以下、図1に戻って、メタデータ生成装置の詳細な構成について説明する。
[メタデータ生成装置の構成]
図1に示すように、メタデータ生成装置1は、区間情報抽出モジュール選択手段10と、区間情報取得処理手段11と、意味情報抽出モジュール選択手段12と、意味情報取得処理手段13と、区間メタデータ生成制御手段14と、メタデータ蓄積手段15と、選択映像再生手段16と、区間メタデータ編集手段17と、ユーザ指示受け付け手段18と、区間メタデータ入出力手段19とを備えている。
区間情報抽出モジュール選択手段(事象選択手段)10は、後記するユーザ指示受け付け手段18を介して、複数の事象の中から1つを選択事象(例えば、サッカー中継番組における観客の歓声)として、ユーザから指示されることで、当該選択事象に対応する区間情報抽出モジュールSMを、モジュール蓄積装置2から選択するものである。なお、区間情報抽出モジュール選択手段10は、複数の区間情報抽出モジュールSMから、個々の機能を示す文字列を取得し、ユーザ指示受け付け手段18を介して、ユーザに提示することで、ユーザに対して区間情報抽出モジュールSMを選択するための補助となる情報を提示する。
そして、区間情報抽出モジュール選択手段10は、選択された区間情報抽出モジュールSMを、図示していないメモリ等に展開し動作させる。これによって、区間情報抽出モジュールSMを、区間情報抽出手段10aとして機能させる。なお、この区間情報抽出手段(区間情報抽出モジュール)10aは、後記する区間情報取得処理手段11からの指示に基づいて動作を行う。
ここでは、区間情報抽出手段10aは、複数の区間情報抽出モジュールSMにおいて選択された1つのモジュールを示しているが、予め複数の区間情報抽出モジュールSMを複数の区間情報抽出手段10aとして、メタデータ生成装置1内に組み込んで構成することとしてもよい。ただし、区間情報抽出モジュールを、一般的なモジュールとして提供される形態とする場合は、本形態のようにユーザが必要なモジュールを選択して、メタデータ生成装置1内に組み込むことで動作する形態の方が、汎用性が高く好ましい。
区間情報取得処理手段11は、区間情報抽出モジュール選択手段10で選択された区間情報抽出手段(区間情報抽出モジュール)10aを動作させることで、区間情報抽出手段10aから、コンテンツにおける選択事象の区間情報を取得し、区間メタデータ(第1の区間メタデータ)を生成するものである。ここでは、区間情報取得処理手段11は、パラメータ設定手段11aと、区間情報取得手段11bとを備えている。
パラメータ設定手段11aは、コンテンツから区間情報を抽出するために必要となるパラメータの項目を区間情報抽出手段10aから取得するとともに、ユーザが入力するパラメータの値を区間情報抽出手段10aに設定するものである。このパラメータ設定手段11aは、区間情報抽出手段10aから取得したパラメータの項目を、ユーザ指示受け付け手段18を介して、ユーザに提示する。そして、パラメータ設定手段11aは、ユーザが入力したパラメータの値をユーザ指示受け付け手段18から取得し、区間情報抽出手段10aに設定する。ここで、区間情報を抽出するために必要となるパラメータとは、例えば、どの音声(A1等)から区間情報を抽出するのかを示す音声ファイルのファイル名等である。
このように、区間情報抽出手段10aから、必要となるパラメータの項目を取得し、ユーザに提示することで、区間情報抽出手段10aが、異なる区間情報抽出モジュールSMであっても、ユーザに対する操作インタフェースを統一することができる。
区間情報取得手段11bは、区間情報抽出手段10aに対して、区間情報の抽出を指示し、区間情報抽出手段10aの区間情報の抽出動作を実行させ、その抽出結果である区間情報を取得するものである。ここで取得した区間情報は、メタデータ蓄積手段15に区間メタデータ(M1、M2…)として書き込まれる。この区間情報取得手段11bによって、区間メタデータ(M1、M2…)には、図2に示した識別情報である識別子IDと、区間情報である開始時刻In及び終了時刻Outのみが書き込まれる。なお、特許請求の範囲に記載の第1の区間メタデータは、識別情報に対応付けて区間情報のみが記述されたメタデータである。
意味情報抽出モジュール選択手段(種別選択手段)12は、後記するユーザ指示受け付け手段18を介して、意味情報を解析する複数の解析手法の種別から1つを選択種別(例えば、顔認識解析、アナウンサコメント解析)として、ユーザから指示されることで、当該選択種別に対応する意味情報抽出モジュールLMを、モジュール蓄積装置2から選択するものである。なお、意味情報抽出モジュール選択手段12は、複数の意味情報抽出モジュールLMから、個々の機能を示す文字列を取得し、ユーザ指示受け付け手段18を介して、ユーザに提示することで、ユーザに対して意味情報抽出モジュールLMを選択するための補助となる情報を提示する。
そして、意味情報抽出モジュール選択手段12は、選択された意味情報抽出モジュールLMを、図示していないメモリ等に展開し動作させる。これによって、意味情報抽出モジュールLMを、意味情報抽出手段12aとして機能させる。なお、この意味情報抽出手段(意味情報抽出モジュール)12aは、後記する意味情報取得処理手段13からの指示に基づいて動作を行う。
ここでは、意味情報抽出手段12aは、複数の意味情報抽出モジュールLMにおいて選択された1つのモジュールを示しているが、予め複数の意味情報抽出モジュールLMを複数の意味情報抽出手段12aとして、メタデータ生成装置1内に組み込んで構成することとしてもよい。ただし、意味情報抽出モジュールを、一般的なモジュールとして提供される形態とする場合は、本形態のようにユーザが必要なモジュールを選択して、メタデータ生成装置1内に組み込むことで動作する形態の方が、汎用性が高く好ましい。
意味情報取得処理手段13は、意味情報抽出モジュール選択手段12で選択された意味情報抽出手段(意味情報抽出モジュール)12aを動作させることで、意味情報抽出手段12aから、選択された解析手法により抽出された意味情報を取得し、区間メタデータ(第2の区間メタデータ)を生成するものである。ここでは、意味情報取得処理手段13は、パラメータ設定手段13aと、意味情報取得手段13bとを備えている。
パラメータ設定手段13aは、コンテンツから意味情報を抽出するために必要となるパラメータの項目を意味情報抽出手段12aから取得するとともに、ユーザが入力するパラメータの値を意味情報抽出手段12aに設定するものである。このパラメータ設定手段13aは、意味情報抽出手段12aから取得したパラメータの項目を、ユーザ指示受け付け手段18を介して、ユーザに提示する。そして、パラメータ設定手段13aは、ユーザが入力したパラメータの値をユーザ指示受け付け手段18から取得し、意味情報抽出手段12aに設定する。ここで、意味情報を抽出するために必要となるパラメータとは、例えば、どの映像(V1等)から意味情報を抽出するのかを示す映像ファイルのファイル名、顔認識を行う際の顔の特徴と選手名とを対応付けたテキストファイルのファイル名等である。
このように、意味情報抽出手段12aから、必要となるパラメータの項目を取得し、ユーザに提示することで、意味情報抽出手段12aが、異なる意味情報抽出モジュールLMであっても、統一したパラメータの入力画面を表示することができ、ユーザに対する操作インタフェースを統一することができる。
なお、メタデータ蓄積手段15に蓄積されている区間メタデータ(M1、M2…)の区間情報(開始時刻、終了時刻)は、そのままパラメータとして意味情報抽出手段12aに設定される。
意味情報取得手段13bは、意味情報抽出手段12aに対して、意味情報の抽出を指示し、意味情報抽出手段12aの意味情報の抽出動作を実行させ、その抽出結果である意味情報を取得するものである。ここで取得した意味情報は、メタデータ蓄積手段15に蓄積されている区間メタデータ(M1、M2…)の区間情報(開始時刻、終了時刻)に対応付けて、区間メタデータ(M1、M2…)に追加して書き込まれる。これによって、区間メタデータ(M1、M2…)には、識別情報と、区間情報と、意味情報とが書き込まれることになる。なお、特許請求の範囲に記載の第2の区間メタデータは、識別情報に対応付けて区間情報と意味情報とが記述されたメタデータである。
区間メタデータ生成制御手段14は、メタデータ生成装置1内の全体を制御する主制御手段である。この区間メタデータ生成制御手段14は、各手段から通知される制御情報に基づいて、動作を決定し、他の手段に対して指示を行う。例えば、区間メタデータ生成制御手段14は、区間情報抽出モジュール10から、区間情報抽出モジュールSMの機能を示す文字列をユーザに提示する旨の指示を通知された場合、ユーザ指示受け付け手段18に対して、図示していない表示装置に、区間情報抽出モジュールSMを選択するための選択画面を提示する旨の指示を行う。
メタデータ蓄積手段15は、区間メタデータを蓄積するものであって、半導体メモリ、ハードディスク等の記憶装置である。このメタデータ蓄積手段15に蓄積される区間メタデータ(M1、M2…)は、区間情報取得処理手段11や、意味情報取得処理手段13によって、区間情報や意味情報が書き込まれることで生成される。
なお、ここで蓄積される区間メタデータの形式は、特に限定されるものではないが、例えば、MPEG−7等のXML(Extensible Markup Language)形式である。
選択映像再生手段16は、区間メタデータ(M1、M2…)の中で、ユーザ指示受け付け手段18を介して、ユーザによって選択された区間メタデータに対応するコンテンツの映像をコンテンツ蓄積装置3から読み出して再生するものである。例えば、コンテンツ蓄積装置3に蓄積されている映像(V1等)がMPEG符号化された映像である場合、選択映像再生手段16は、MPEGデコーダとして機能し、映像を再生することで、図示していない表示装置に映像を表示する。これによって、ユーザは、選択された区間メタデータが、正常にセグメント化されているかどうかを確認することができる。
区間メタデータ編集手段17は、区間メタデータ(M1、M2…)を、ユーザ指示受け付け手段18を介して、ユーザに提示し、その区間メタデータを修正するものである。例えば、区間メタデータ編集手段17は、ユーザ指示受け付け手段18を介して表示画面上に、区間メタデータの内容(区間情報、意味情報)を提示し、ユーザから、図示していないキーボード等によって、区間メタデータの内容が修正された場合に、その修正結果に基づいてメタデータ蓄積手段15の内容を更新する。
ユーザ指示受け付け手段18は、図示していない表示装置に、ユーザからの指示を受け付ける画面を提示し、図示していないマウス、キーボート等の入力装置を介して、ユーザからの指示を受け付けるものである。ここで指示された内容は、随時区間メタデータ生成制御手段14に通知され、その指示内容に沿った動作が実行される。なお、このユーザからの指示を受け付ける画面については、後で画面例を示して説明する。
区間メタデータ入出力手段19は、区間メタデータを入出力するためのインタフェースである。例えば、DVD−RAM等の記録媒体に対して区間メタデータを書き込んだり、区間メタデータを読み出したりするディスクドライブ装置等である。あるいは、通信回線を介して、区間メタデータの送受信を行う通信ボードであってもよい。
なお、ここでは、区間メタデータ(M1、M2…)は、共通のデータ形式となっているため、外部で生成された区間メタデータを入力することで、その区間メタデータを活用することもできる。例えば、他のメタデータ生成装置で区間情報のみが書き込まれた区間メタデータを入力し、当該メタデータ生成装置1で、その区間メタデータに意味情報を付加することができる。
以上、メタデータ生成装置1の構成について説明したが、本発明はこれに限定されるものではない。例えば、メタデータ生成装置1は、一般的なコンピュータにプログラムを実行させ、コンピュータ内の演算装置や記憶装置を動作させることにより実現することができる。このプログラム(メタデータ生成プログラム)は、通信回線を介して配布することも可能であるし、CD−ROM等の記録媒体に書き込んで配布することも可能である。
[メタデータ生成装置の画面例]
次に、メタデータ生成装置1が表示する画面例について説明する。
(区間情報抽出用画面)
まず、図3及び図4を参照(適宜図1参照)して、区間情報抽出モジュールSMを選択して、コンテンツから区間情報を抽出する画面例について説明する。図3は、区間情報抽出モジュールを選択する選択画面の一例を示す画面例である。図4は、区間情報抽出モジュールに通知するパラメータを入力するパラメータ入力画面の一例を示す画面例である。
図3に示すように、区間情報抽出モジュールSMを選択するための選択画面W1は、区間情報抽出モジュールSMの機能を示す文字列をリスト表示(一覧表示)し、ユーザからの選択を受け付ける画面となっている。
メタデータ生成装置1では、区間情報抽出モジュール選択手段10が、区間情報抽出モジュールSMを選択する場合、ユーザ指示受け付け手段18を介して、画面上に選択画面W1を表示する。この選択画面W1において、リストボタンBをマウスでクリックされることで、区間情報抽出モジュール選択手段10が、複数の区間情報抽出モジュールSMから取得した、個々の区間情報抽出モジュール(SM1、SM2、SM3…)の機能を示す文字列をリスト表示(一覧表示)する。ここでは、区間情報抽出モジュールSM1から「歓声セグメント化モジュール(SL1)」、区間情報抽出モジュールSM2から「映像カット点セグメント化モジュール(SL2)」の各文字列が取得され、その文字列SL1、SL2をリスト表示している。これによって、ユーザは、どのような機能で区間情報を抽出するのかを選択することができる。
そして、この選択画面W1で、区間情報抽出モジュールSMが選択された段階で、図4のパラメータ入力画面W2が表示される。
図4に示すように、区間情報を抽出するために必要となるパラメータの値を入力する入力画面W2は、各パラメータP1、P2に対して、入力欄AR1、AR2を設けることで、ユーザからの入力を受け付ける画面となっている。
メタデータ生成装置1では、区間情報取得処理手段11のパラメータ設定手段11aが、区間情報抽出手段(区間情報抽出モジュール)10aから、区間情報を抽出するために必要となるパラメータを取得し、ユーザ指示受け付け手段18を介して、画面上に入力画面W2を表示する。この入力画面W2では、パラメータとして、「解析対象ファイル名(P1)」と「最大エントロピ法モデルファイル名(P2)」とが、区間情報抽出手段10aから通知された状態を示している。これによって、ユーザは、各パラメータの値(ファイル名)を、各パラメータの入力欄AR1、AR2に入力し、実行ボタンEXをマウスでクリックすることで、区間情報の抽出が実行される。
(意味情報抽出用画面)
次に、図5及び図6を参照(適宜図1参照)して、意味情報抽出モジュールLMを選択して、コンテンツから意味情報を抽出する画面例について説明する。図5は、意味情報抽出モジュールを選択する選択画面の一例を示す画面例である。図6は、意味情報抽出モジュールに通知するパラメータを入力するパラメータ入力画面の一例を示す画面例である。
図5に示すように、意味情報抽出モジュールLMを選択するための選択画面W3は、意味情報抽出モジュールLMの機能を示す文字列をリスト表示(一覧表示)し、ユーザからの選択を受け付ける画面となっている。
メタデータ生成装置1では、意味情報抽出モジュール選択手段12が、意味情報抽出モジュールLMを選択する場合、ユーザ指示受け付け手段18を介して、画面上に選択画面W3を表示する。この選択画面W3において、リストボタンBをマウスでクリックされることで、意味情報抽出モジュール選択手段12が、複数の意味情報抽出モジュールLMから取得した、個々の意味情報抽出モジュール(LM1、LM2、LM3…)の機能を示す文字列をリスト表示(一覧表示)する。ここでは、意味情報抽出モジュールLM1から「顔認識ラベル付けモジュール(LL1)」、意味情報抽出モジュールLM2から「コメント解析ラベル付けモジュール(LL2)」の各文字列が取得され、その文字列LL1、LL2をリスト表示している。これによって、ユーザは、どのような機能で意味情報を抽出するのかを選択することができる。
そして、この選択画面W3で、意味情報抽出モジュールLMが選択された段階で、図6のパラメータ入力画面W4が表示される。
図6に示すように、意味情報を抽出するために必要となるパラメータの値を入力する入力画面W4は、各パラメータP3、P4に対して、入力欄AR3、AR4を設けることで、ユーザからの入力を受け付ける画面となっている。
メタデータ生成装置1では、意味情報取得処理手段13のパラメータ設定手段13aが、意味情報抽出手段(意味情報抽出モジュール)12aから、意味情報を抽出するために必要となるパラメータを取得し、ユーザ指示受け付け手段18を介して、画面上に入力画面W4を表示する。この入力画面W4では、パラメータとして、「解析対象ファイル名(P3)」と「選手名ファイル名(P4)」とが、意味情報抽出手段12aから通知された状態を示している。これによって、ユーザは、各パラメータの値(ファイル名)を、各パラメータの入力欄AR3、AR4に入力し、実行ボタンEXをマウスでクリックすることで、意味情報の抽出が実行される。
(区間メタデータ確認・編集画面)
次に、図7を参照(適宜図1参照)して、生成された区間メタデータを、画面上で確認・編集する画面例について説明する。図7は、区間メタデータの確認・編集を行う確認・編集画面の一例を示す画面例である。
図7に示すように、確認・編集画面W5は、映像再生領域Vaと、区間情報提示領域SIと、意味情報(意味・内容)提示領域LI1と、意味情報(区間関係)提示領域LI2とで主に画面を構成している。なお、ここでは、区間情報抽出モジュールSMからの情報を提示する情報提示領域Saと、意味情報抽出モジュールLMからの情報を提示する情報提示領域Laとを、さらに画面上に構成している。
なお、区間メタデータは、区間情報によって一意に決まるため、ここでは、区間メタデータの選択は、区間情報提示領域SIに表示される区間情報を選択することで行うこととしている。
映像再生領域Vaは、選択された区間メタデータの区間情報(開始時刻Inと終了時刻Out)で示される時間区間の映像を、再生・表示する領域である。メタデータ生成装置1では、区間メタデータが選択されたことを、ユーザ指示受け付け手段18が検出し、選択映像再生手段16に通知することで、選択映像再生手段16が、該当する時間区間の映像を再生する。
区間情報提示領域SIは、区間メタデータから抽出された識別情報(識別子ID)と、区間情報(開始時刻In、終了時刻Out)とを表示する領域である。なお、ここでは、開始時刻Inにおけるフレーム画像(Fa1等)を同時に表示することとしている。そして、ユーザがマウスによって、区間情報提示領域SI内の所望の区間情報Seを選択することで、区間メタデータが選択される。
意味情報(意味・内容)提示領域LI1は、区間メタデータから抽出された意味情報(意味・内容)であるキー及び値を表示する領域である。この意味情報(意味・内容)提示領域LI1は、区間情報提示領域SIで区間メタデータが選択された段階で、当該区間メタデータの意味情報(意味・内容)が表示される。
意味情報(区間関係)提示領域LI2は、区間メタデータから抽出された意味情報(区間関係)であるタイプ及びターゲットを表示する領域である。この意味情報(区間関係)提示領域LI2は、区間情報提示領域SIで区間メタデータが選択された段階で、当該区間メタデータの意味情報(区間関係)が表示される。
なお、区間情報提示領域SI、意味情報(意味・内容)提示領域LI1及び意味情報(区間関係)提示領域LI2は、区間メタデータ編集手段17によって表示され、編集を行う際には、キーボード等からデータを入力することで、区間情報及び意味情報の変更等を行う。
情報提示領域Saは、区間情報抽出モジュールSMから詳細情報を取得可能な場合に、その詳細情報を提示する領域である。この情報提示領域Saは、区間情報抽出モジュールSMから、当該区間情報抽出モジュールSMの抽出手法、バージョン等を文字列として取得可能な場合に、その文字列を提示する。あるいは、区間情報として、区間情報提示領域SIに提示した情報以外の情報、例えば、色平均、最大音量、最低音量等を提示することとしてもよい。
情報提示領域Laは、意味情報抽出モジュールLMから詳細情報を取得可能な場合に、その詳細情報を提示する領域である。この情報提示領域Laは、意味情報抽出モジュールLMから、当該意味情報抽出モジュールLMの抽出手法、バージョン等を文字列として取得可能な場合に、その文字列を提示する。あるいは、意味情報として、意味情報(意味・内容)提示領域LI1及び意味情報(区間関係)提示領域LI2に提示した情報以外の情報、例えば、当該区間におけるアナウンサコメントの全文等を提示することとしてもよい。
このように、区間メタデータを視覚化することで、区間メタデータの内容の確認・編集を容易に行うことができる。
[メタデータ生成装置の動作]
次に、図8乃至図10を参照(構成については、適宜図1参照)して、本発明に係るメタデータ生成装置の動作について説明する、図8は、メタデータ生成装置の全体動作を示すフローチャートである。図9は、メタデータ生成装置の区間情報の抽出動作を示すフローチャートである。図10は、メタデータ生成装置の意味情報の抽出動作を示すフローチャートである。
(全体動作)
まず、図8を参照して、メタデータ生成装置1の全体動作について説明する。なお、図8では、各動作において生成される区間メタデータの内容についても例示している。
最初に、メタデータ生成装置1は、コンテンツ蓄積装置3に蓄積されているコンテンツ(映像(V1等)、音声(A1等)、テキスト情報(T1等))から、区間情報である開始時刻及び終了時刻の抽出を行う(ステップS10)。
このステップS10では、例えば、音声(A1等)から区間情報の抽出(歓声によるセグメント化)を行うことで、図8(a)に示すような開始時刻と終了時刻とを含んだ区間メタデータ(M11、M21、M31)が生成される。なお、図中、各区間メタデータの識別情報は省略している。このステップS10の詳細動作については、図9を参照して後記する。
続けて、メタデータ生成装置1は、コンテンツ蓄積装置3に蓄積されているコンテンツ(映像(V1等)、音声(A1等)、テキスト情報(T1等))から、区間メタデータ(M11、M21、M31)における開始時刻及び終了時刻に対応する意味情報の抽出を行う(ステップS20)。
このステップS20では、例えば、映像(V1等)から意味情報の抽出(顔認識によるラベル付け)を行うことで、図8(b)に示すように、図8(a)における区間メタデータ(M11、M21、M31)に、キー(選手)と値(A選手等)とが付加された区間メタデータ(M12、M22、M32)が生成される。
なお、このステップS20では、さらに、テキスト情報(T1等)から意味情報の抽出(アナウンサのコメントによるラベル付け)を行うことで、図8(c)に示すように、図8(b)における区間メタデータ(M12、M22、M32)に、キー(イベント)と値(シュート等)とが付加された区間メタデータ(M13、M23、M33)が生成される。
そして、メタデータ生成装置1は、ステップS20で生成された区間メタデータ(M13、M23、M33)を出力する(ステップS30)。
このように、メタデータ生成装置1は、コンテンツから区間情報を抽出するステップ(ステップS10)と、意味情報を抽出するステップ(ステップS20)の2つのステップによって、区間メタデータを生成し、出力する。
(区間情報の抽出動作)
次に、図9を参照して、メタデータ生成装置1における区間情報の抽出動作(図8のステップS10)の動作について詳細に説明する。
まず、メタデータ生成装置1は、区間情報抽出モジュール選択手段10によって、区間情報抽出モジュールSMから、個々の機能を示す文字列を取得する(ステップS100)。ここでは、区間情報抽出モジュールSMが、関数(IsSegmentModule())によって、文字列を返すこととしている。
この文字列を取得した区間情報抽出モジュール選択手段10は、ユーザ指示受け付け手段18を介して、区間情報抽出モジュールSMを選択する選択画面(図3参照)を提示する(ステップS101)。ここで、ユーザ指示受け付け手段18が、選択画面において、ユーザによる区間情報抽出モジュールSMの選択を受け付け、区間情報抽出モジュール選択手段10に対して、選択された区間情報抽出モジュールSMを通知する。
そして、メタデータ生成装置1は、区間情報抽出モジュール選択手段10によって、ユーザ指示受け付け手段18から通知された区間情報抽出モジュールSMを、区間情報抽出手段10aとして組み込む。これによって、実際に区間情報を抽出する区間情報抽出モジュールSMが選択されたことになる(ステップS102)。
そして、メタデータ生成装置1は、区間情報取得処理手段11のパラメータ設定手段11aによって、区間情報を抽出するために必要となるパラメータ(パラメータ項目)を区間情報抽出手段10a(ここでは、区間情報抽出モジュールSM1)から取得する(ステップS103)。ここでは、区間情報抽出モジュールSMが、関数(GetRequiredData())によって、パラメータの項目を返すこととしている。
このパラメータを取得したパラメータ設定手段11aは、ユーザ指示受け付け手段18を介して、パラメータの値を入力する入力画面(図4参照)を提示する(ステップS104)。ここで、ユーザ指示受け付け手段18が、入力画面において、ユーザによるパラメータの値の入力を受け付け、パラメータ設定手段11aに対して、入力されたパラメータの値を通知する。
そして、パラメータ設定手段11aが、パラメータの値を区間情報抽出手段10a(ここでは、区間情報抽出モジュールSM1)に通知(設定)する(ステップS105)。ここでは、区間情報抽出モジュールSMが、関数(SetRequiredData())によって、パラメータを設定することとしている。
そして、区間情報取得手段11bが、区間情報抽出手段10aに対して、区間情報の抽出を指示することで、区間情報の抽出を実行する(ステップS106)。ここでは、区間情報抽出モジュールSMが、関数(GetSegment())によって、区間情報の抽出結果を返すこととしている。ここで抽出された区間情報は、区間メタデータ編集手段17によって、確認・編集画面(図7参照)に提示される。
この段階で、ユーザが区間情報の内容の確認を行う。すなわち、メタデータ生成装置1は、ユーザ指示受け付け手段18によって、ユーザから区間情報の抽出のやり直し(ステップS107)、区間情報の編集(ステップS108)、他の区間情報抽出モジュールSMの実行(ステップS109)を行うかどうかの指示が入力されるかどうかを判定する。
そして、メタデータ生成装置1は、ユーザから区間情報の抽出のやり直しを指示された場合(ステップS107でYes)は、ステップS103に戻って、パラメータの値の再入力を行うことで、再度区間情報の抽出を行う。
また、メタデータ生成装置1は、ユーザから区間メタデータの編集を指示された場合(ステップS108でYes)は、区間メタデータ編集手段17によって、区間メタデータの編集を行う(ステップS110)。なお、この区間メタデータの編集後、ステップS107に戻る。
さらに、メタデータ生成装置1は、ユーザから他の区間情報抽出モジュールSMの実行を指示された場合(ステップS109でYes)は、ステップS100に戻って、区間情報抽出モジュールSMの選択動作から動作を再実行する。
そして、メタデータ生成装置1は、ユーザが区間情報の内容を確認した段階(ステップS107、ステップS108及びステップS109でNo)で、区間情報の抽出動作を終了する。
(意味情報の抽出動作)
次に、図10を参照して、メタデータ生成装置1における意味情報の抽出動作(図8のステップS20)の動作について詳細に説明する。
まず、メタデータ生成装置1は、意味情報抽出モジュール選択手段12によって、意味情報抽出モジュールLMから、個々の機能を示す文字列を取得する(ステップS200)。ここでは、意味情報抽出モジュールLMが、関数(IsLabelModule())によって、文字列を返すこととしている。
この文字列を取得した意味情報抽出モジュール選択手段12は、ユーザ指示受け付け手段18を介して、意味情報抽出モジュールLMを選択する選択画面(図5参照)を提示する(ステップS201)。ここで、ユーザ指示受け付け手段18が、選択画面において、ユーザによる意味情報抽出モジュールLMの選択を受け付け、意味情報抽出モジュール選択手段12に対して、選択された意味情報抽出モジュールLMを通知する。
そして、メタデータ生成装置1は、意味情報抽出モジュール選択手段12によって、ユーザ指示受け付け手段18から通知された意味情報抽出モジュールLMを、意味情報抽出手段12aとして組み込む。これによって、実際に意味情報を抽出する意味情報抽出モジュールLMが選択されたことになる(ステップS202)。
そして、メタデータ生成装置1は、意味情報取得処理手段13のパラメータ設定手段13aによって、意味情報を抽出するために必要となるパラメータ(パラメータ項目)を意味情報抽出手段12a(ここでは、意味情報抽出モジュールLM1)から取得する(ステップS203)。ここでは、意味情報抽出モジュールLMが、関数(GetRequiredData())によって、パラメータの項目を返すこととしている。
このパラメータを取得したパラメータ設定手段13aは、ユーザ指示受け付け手段18を介して、パラメータの値を入力する入力画面(図6参照)を提示する(ステップS204)。ここで、ユーザ指示受け付け手段18が、入力画面において、ユーザによるパラメータの値の入力を受け付け、パラメータ設定手段13aに対して、入力されたパラメータの値を通知する。
そして、パラメータ設定手段13aが、パラメータの値を意味情報抽出手段12a(ここでは、意味情報抽出モジュールLM1)に通知(設定)する(ステップS205)。ここでは、意味情報抽出モジュールLMが、関数(SetRequiredData())によって、パラメータを設定することとしている。
そして、意味情報取得手段13bが、意味情報抽出手段12aに対して、意味情報の抽出を指示することで、意味情報の抽出を実行する(ステップS206)。ここでは、意味情報抽出モジュールLMが、関数(GetLabel())によって、意味情報(意味・内容)の抽出結果を返し、関数(GetRelation())によって、意味情報(区間関係)の抽出結果を返すこととしている。ここで抽出された意味情報は、区間メタデータ編集手段17によって、確認・編集画面(図7参照)に提示される。
この段階で、ユーザが意味情報の内容の確認を行う。すなわち、メタデータ生成装置1は、ユーザ指示受け付け手段18によって、ユーザから意味情報の抽出のやり直し(ステップS207)、意味情報の編集(ステップS208)、他の意味情報抽出モジュールLMの実行(ステップS209)を行うかどうかの指示が入力されるかどうかを判定する。
そして、メタデータ生成装置1は、ユーザから意味情報の抽出のやり直しを指示された場合(ステップS207でYes)は、ステップS203に戻って、パラメータの値の再入力を行うことで、再度意味情報の抽出を行う。
また、メタデータ生成装置1は、ユーザから意味情報の編集を指示された場合(ステップS208でYes)は、区間メタデータ編集手段17によって、意味情報の編集を行う(ステップS210)。なお、この意味情報の編集後、ステップS207に戻る。
さらに、メタデータ生成装置1は、ユーザから他の意味情報抽出モジュールLMの実行を指示された場合(ステップS209でYes)は、ステップS200に戻って、意味情報抽出モジュールLMの選択動作から動作を再実行する。
そして、メタデータ生成装置1は、ユーザが意味情報の内容を確認した段階(ステップS207、ステップS208及びステップS209でNo)で、意味情報の抽出動作を終了する。
以上、メタデータ生成装置1の動作として、予めコンテンツ蓄積装置3に蓄積されたコンテンツから区間メタデータを生成する動作(オフライン動作)について説明した。しかし、本発明は、ストリームデータとして入力されるコンテンツからも区間メタデータを抽出することが可能である。以下、図11を参照(適宜図1参照)して、メタデータ生成装置1において、ストリームデータとして入力されるコンテンツから区間メタデータを生成する動作(オンライン動作)について説明する。
(オンライン処理による区間メタデータ生成動作)
図11は、メタデータ生成装置のオンライン処理による区間メタデータ生成動作を示すフローチャートである。
まず、メタデータ生成装置1は、区間情報抽出モジュール選択手段10によって、区間情報抽出モジュールSMを選択し、区間情報取得処理手段11のパラメータ設定手段11aによって、区間情報を抽出するために必要となるパラメータを設定する(ステップS40)。なお、このステップS40は、図9のステップS100からステップS105に相当する。
また、メタデータ生成装置1は、意味情報抽出モジュール選択手段12によって、意味情報抽出モジュールLMを選択し、意味情報取得処理手段13のパラメータ設定手段13aによって、意味情報を抽出するために必要となるパラメータを設定する(ステップS41)。なお、このステップS41は、図10のステップS200からステップS205に相当する。
そして、メタデータ生成装置1は、区間情報取得処理手段11の区間情報取得手段11bによって、区間情報抽出手段10aを介して、入力されるコンテンツから区間情報を1つ(1セグメント)抽出する(ステップS42)。
続けて、メタデータ生成装置1は、意味情報取得処理手段13の意味情報取得手段13bによって、意味情報抽出手段12aを介して、ステップS42で抽出された区間情報で示される区間内(1セグメント内)で、コンテンツから意味情報を抽出する(ステップS43)。なお、区間情報で示される区間のコンテンツのデータは、図示していない蓄積手段に一時的に蓄積され、意味情報抽出手段12aによって、その区間におけるコンテンツのデータから意味情報が抽出される。
そして、1区間毎に区間メタデータの確認・編集を行う場合(ステップS44でYes)は、区間メタデータ編集手段17が、ステップS43で抽出し、生成した区間メタデータを表示画面上に表示し、確認・編集作業を行う(ステップS45)。
さらに、1区間毎に区間メタデータを出力する場合(ステップS46でYes)は、区間メタデータ入出力手段19が、1セグメント分の区間メタデータを出力する(ステップS47)。
そして、コンテンツの入力が終了したかどうかを判断し(ステップS48)、終了していない場合(ステップS48でNo)は、ステップS42に戻って、区間情報及び意味情報の抽出を続ける。
一方、コンテンツの入力が終了した場合(ステップS48でYes)は、全区間の区間メタデータに対して確認・編集を行うかどうかを判定し(ステップS49)、確認・編集を行う場合(ステップS49でYes)は、区間メタデータ編集手段17が、図7に示したような確認・編集画面を表示し、確認・編集作業を行う(ステップS50)。
そして、メタデータ生成装置1は、生成された区間メタデータ(複数セグメント分)を区間メタデータ入出力手段19によって出力する(ステップS51)。
以上の動作によって、メタデータ生成装置1は、オンライン処理によって、コンテンツから区間メタデータを生成し出力することができる。
本発明に係るメタデータ生成装置を含んだメタデータ生成システムの構成を示すブロック図である。 区間メタデータの構成を説明するための説明図であって、(a)は区間メタデータの構成、(b)は区間メタデータの例を示す。 区間情報抽出モジュールを選択する選択画面の一例を示す画面例である。 区間情報抽出モジュールに通知するパラメータを入力するパラメータ入力画面の一例を示す画面例である。 意味情報抽出モジュールを選択する選択画面の一例を示す画面例である。 意味情報抽出モジュールに通知するパラメータを入力するパラメータ入力画面の一例を示す画面例である。 区間メタデータの確認・編集を行う確認・編集画面の一例を示す画面例である。 本発明に係るメタデータ生成装置の全体動作を示すフローチャートである。 本発明に係るメタデータ生成装置の区間情報の抽出動作を示すフローチャートである。 本発明に係るメタデータ生成装置の意味情報の抽出動作を示すフローチャートである。 本発明に係るメタデータ生成装置のオンライン処理による区間メタデータ生成動作を示すフローチャートである。
符号の説明
1 メタデータ生成装置
10 区間情報抽出モジュール選択手段(事象選択手段)
10a 区間情報抽出手段
11 区間情報取得処理手段
11a パラメータ設定手段
11b 区間情報取得手段
12 意味情報抽出モジュール選択手段(種別選択手段)
12a 意味情報抽出手段
13 意味情報取得処理手段
13a パラメータ設定手段
13b 意味情報取得手段
14 区間メタデータ生成制御手段
15 メタデータ蓄積手段
16 選択映像再生手段
17 区間メタデータ編集手段
18 ユーザ指示受け付け手段
19 区間メタデータ入出力手段
SM 区間情報抽出モジュール
LM 意味情報抽出モジュール

Claims (7)

  1. コンテンツにおいて、ある事象の事象区間毎に、前記コンテンツの内容を示す意味情報を対応付けた、当該コンテンツにおける前記事象区間毎の情報である区間メタデータを生成するメタデータ生成装置であって、
    前記コンテンツから、前記事象を検出し、少なくとも当該事象の開始時刻及び終了時刻を区間情報として抽出する、前記事象毎に異なる複数の区間情報抽出手段と、
    複数の前記事象の中から1つを選択事象として指示されることで、当該選択事象に対応する前記区間情報抽出手段を選択する事象選択手段と、
    この事象選択手段で選択された区間情報抽出手段から前記コンテンツにおける前記選択事象の区間情報を取得し、第1の前記区間メタデータを生成する区間情報取得処理手段と、
    前記コンテンツを解析し、前記意味情報を前記区間情報における開始時刻及び終了時刻に対応付けて抽出する、前記意味情報の種別毎に異なる複数の意味情報抽出手段と、
    前記意味情報の種別の中から1つを選択種別として指示されることで、当該選択種別に対応する前記意味情報抽出手段を選択する種別選択手段と、
    この種別選択手段で選択された意味情報抽出手段から前記意味情報を取得し、前記区間情報と前記意味情報とを対応付けた第2の前記区間メタデータを生成する意味情報取得処理手段と、
    を備えていることを特徴とするメタデータ生成装置。
  2. 前記区間情報抽出手段が、予め当該区間情報抽出手段の機能を示す文字列を保持しており、前記事象選択手段が、前記区間情報抽出手段から前記文字列を取得することで、当該文字列を表示装置の画面上に一覧表示することを特徴とする請求項1に記載のメタデータ生成装置。
  3. 前記区間情報抽出手段が、予め当該区間情報抽出手段において前記区間情報を抽出するためのパラメータの項目を保持しており、前記区間情報取得処理手段が、前記区間情報抽出手段から前記パラメータの項目を取得することで、当該パラメータの項目を表示した当該パラメータの入力画面を表示装置に表示することを特徴とする請求項1又は請求項2に記載のメタデータ生成装置。
  4. 前記意味情報抽出手段が、予め当該意味情報抽出手段の機能を示す文字列を保持しており、前記種別選択手段が、前記意味情報抽出手段から前記文字列を取得することで、当該文字列を表示装置の画面上に一覧表示することを特徴とする請求項1に記載のメタデータ生成装置。
  5. 前記意味情報抽出手段が、予め当該意味情報抽出手段において前記意味情報を抽出するためのパラメータの項目を保持しており、前記意味情報取得処理手段が、前記意味情報抽出手段から前記パラメータの項目を取得することで、当該パラメータの項目を表示した当該パラメータの入力画面を表示装置に表示することを特徴とする請求項1又は請求項4に記載のメタデータ生成装置。
  6. 前記意味情報取得処理手段が、前記意味情報を取得する毎に、前記区間情報に複数の前記意味情報を対応付けた区間メタデータを生成することを特徴とする請求項1乃至請求項5のいずれか一項に記載のメタデータ生成装置。
  7. コンテンツにおいて、ある事象に対して、少なくとも当該事象の開始時刻及び終了時刻を区間情報として前記コンテンツから抽出する、前記事象毎に異なる複数の区間情報抽出モジュールと、前記コンテンツを解析し、当該コンテンツの内容を示す意味情報を時刻に対応付けて抽出する、前記意味情報の種別毎に異なる複数の意味情報抽出モジュールとに基づいて、前記コンテンツにおける事象区間毎の情報である区間メタデータを生成するために、コンピュータを、
    複数の前記事象の中から1つを選択事象として指示されることで、当該選択事象に対応する前記区間情報抽出モジュールを選択する事象選択手段、
    この事象選択手段で選択された区間情報抽出モジュールから、前記コンテンツにおける前記選択事象の区間情報を取得し、第1の前記区間メタデータを生成する区間情報取得処理手段、
    前記意味情報の種別の中から1つを選択種別として指示されることで、当該選択種別に対応する前記意味情報抽出モジュールを選択する種別選択手段、
    この種別選択手段で選択された意味情報抽出モジュールから、前記意味情報を取得し、前記区間情報と前記意味情報とを対応付けた第2の前記区間メタデータを生成する意味情報取得処理手段、
    として機能させることを特徴とするメタデータ生成プログラム。
JP2004141595A 2004-05-11 2004-05-11 メタデータ生成装置及びメタデータ生成プログラム Expired - Fee Related JP4452122B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004141595A JP4452122B2 (ja) 2004-05-11 2004-05-11 メタデータ生成装置及びメタデータ生成プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004141595A JP4452122B2 (ja) 2004-05-11 2004-05-11 メタデータ生成装置及びメタデータ生成プログラム

Publications (2)

Publication Number Publication Date
JP2005322173A JP2005322173A (ja) 2005-11-17
JP4452122B2 true JP4452122B2 (ja) 2010-04-21

Family

ID=35469397

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004141595A Expired - Fee Related JP4452122B2 (ja) 2004-05-11 2004-05-11 メタデータ生成装置及びメタデータ生成プログラム

Country Status (1)

Country Link
JP (1) JP4452122B2 (ja)

Also Published As

Publication number Publication date
JP2005322173A (ja) 2005-11-17

Similar Documents

Publication Publication Date Title
US8966360B2 (en) Transcript editor
US9870796B2 (en) Editing video using a corresponding synchronized written transcript by selection from a text viewer
US7054817B2 (en) User interface for speech model generation and testing
KR100704631B1 (ko) 음성 주석 생성 장치 및 방법
JP2007171809A (ja) 情報処理装置及び情報処理方法
CN110740275A (zh) 一种非线性编辑***
CN109782997B (zh) 一种数据处理方法、装置及存储介质
US9666211B2 (en) Information processing apparatus, information processing method, display control apparatus, and display control method
US20150128048A1 (en) Automated multimedia content editing
JP5533865B2 (ja) 編集支援システム、編集支援方法および編集支援プログラム
CN106550268B (zh) 视频处理方法和视频处理装置
JP6641045B1 (ja) コンテンツ生成システム、及びコンテンツ生成方法
US7925671B2 (en) Method and system for automatic cue sheet generation
JP2008052676A (ja) コンピュータ実行可能なプログラム、方法、および処理装置
JP4452122B2 (ja) メタデータ生成装置及びメタデータ生成プログラム
JP7176272B2 (ja) 情報処理装置およびプログラム
JP2004015523A (ja) 映像関連コンテンツ生成装置、映像関連コンテンツ生成方法及び映像関連コンテンツ生成プログラム
JP4906274B2 (ja) メタデータ統合装置及びメタデータ統合プログラム
JP4885569B2 (ja) スタイルシート生成装置及びスタイルシート生成プログラム
JP2007078985A (ja) データ検索装置及びその制御方法
JP2004348553A (ja) メタデータ編集方法、装置、及びプログラム
JP5383608B2 (ja) 解説放送文作成支援装置及びプログラム
JP4033142B2 (ja) 映像・シナリオ整合方法及び装置及びプログラム
KR102636708B1 (ko) 프레젠테이션 문서에 대한 수어 발표 영상을 제작할 수 있는 전자 단말 장치 및 그 동작 방법
KR102266061B1 (ko) 음성 텍스트 변환 기술과 시간 정보를 이용하여 음성 데이터의 요약을 가능하게 하는 전자 장치 및 그 동작 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100105

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100129

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4452122

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130205

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140205

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees