JP4981026B2

JP4981026B2 - 複合ニュース・ストーリーの合成

Info

Publication number: JP4981026B2
Application number: JP2008503666A
Authority: JP
Inventors: アニホトリ，ラリサ; ディミトロワ，ネヴェンカ; バルビエリ，マウロ; ハニャリク，アラン
Original assignee: Koninklijke Philips NV; Koninklijke Philips Electronics NV
Current assignee: Koninklijke Philips NV
Priority date: 2005-03-31
Filing date: 2006-03-29
Publication date: 2012-07-18
Anticipated expiration: 2026-03-29
Also published as: JP2008537627A; CN101151674B; EP1866924A1; KR20070121810A; CN101151674A; US20080193101A1; WO2006103633A1

Description

本発明はビデオ画像処理に、より詳細にはさまざまなソースからのビデオ・ニュース・ストーリーを解析して共通ストーリーを識別し、該さまざまなソースからのストーリーの複合ビデオを生成するシステムおよび方法に関する。

しばしば異なるニュース・ソースは同じニュース・ストーリーを異なる観点から呈示する。こうした異なる観点は異なる政治的見解あるいはその他の要因に基づくものでありうる。たとえば、同じ事件について、あるソースは好意的に呈示し、別のソースは否定的に呈示することがありうる。それは、その事件の帰結が所与の政治エンティティにとって好都合か不都合かに依存する。同様に、ある事件のうち呈示される個別的な側面が、科学中心のニュース・ソースと、一般ニュース中心のニュース・ソースとでは異なりうる。同様にして、同じストーリーが同じソースからでも、たとえばそのストーリーがニュース番組の「エンターテインメント・ニュース」セグメントの間に呈示されているか「金融ニュース」セグメントの間に呈示されているかに依存して、異なる仕方で呈示されることがありうる。

個々のニュース・ストーリーを区別し、ストーリーを識別およびカテゴリー化し、ユーザーの嗜好に基づいてユーザーに呈示するためのストーリーをフィルタリングするための方法およびシステムが利用可能である。しかしながら、ストーリーの各呈示は一般には、受領されたとおりの、その独自の個別的観点をもった記録されたストーリーの再生である。

同じストーリーの複数呈示をみつけることは時間のかかるプロセスとなることがある。ユーザーが従来システムを使って複数ソースにアクセスして、ユーザーの一般的な嗜好に基づいてストーリーをみつけようとするならば、結果は典型的にはあらゆるソースからのストーリーが入り交じった「洪水」となるであろう。ユーザーが特に関心のあるストーリーをみつけると、ユーザーはそのストーリーに付随するキーワードまたはフレーズを同定し、その関心のあるストーリーのキーワードまたはフレーズを使って多様なソースからのニュース・ストーリーの別の検索を提出する。あらゆるソースからのストーリーが入り交じるため、利用可能な選択肢のうちのどれが単に同じ（関心のない）ストーリーの異なるソースからの選択肢であるかが明確でないと、ユーザーは関心のあるストーリーを関心のないストーリーから区別するためにあらゆる選択肢をフィルタリングしていくのに苦労することがありうる。さらに、ユーザーの技量および／または検索エンジンの品質に依存して、ユーザーが定義するキーワードおよびフレーズに基づく検索は、利用可能なストーリーの過剰フィルタリングまたは過少フィルタリングにつながることがある。それにより、ユーザーは望ましかったはずのいくつかの観点を呈示されないこともありうるし、あるいは単に選択されたキーワードまたはフレーズに一致しただけの異なるストーリーを呈示されたりすることがありうる。

多様なストーリー・ソースのうちから共通のストーリーを効率的に識別する方法およびシステムを提供することが本発明の一つの目的である。同じストーリーの種々のバージョンから複合ニュース・ストーリーを合成することが本発明のさらなる目的である。該複合ニュース・ストーリーを把握しやすいように効率的に構造化することが本発明のさらなる目的である。

これらの目的およびその他の目的は、個々のニュース・ストーリーを特徴付け、この特徴付けに基づいて多様なストーリーのうちから共通のニュース・ストーリーを識別する方法およびシステムによって達成される。その共通のニュース・ストーリーについて複合ストーリーが生成される。その際、好ましくはそのストーリーの種々のバージョンの共通構造に基づく構造が使用される。そのストーリーの種々のバージョンから複合ストーリーに含めるセグメントを選択するのは、諸セグメントのビデオおよびオーディオ内容の決定されたランキングに基づく。

本発明について、例として、付属の図面を参照しつつさらに詳細に説明する。

図面を通じて、同じ参照符号は同じ要素または実質的に同じ機能を実行する要素を指す。図面は解説の目的のために収められているのであり、本発明の範囲を限定することは意図していない。

図１は、本発明に基づくストーリー合成器システムのブロック図を示している。複数のビデオ・セグメント１１０が読み取り器１２０によってアクセスされる。本発明の典型的な実施形態では、ビデオ・セグメント１１０は記録されたニュース・クリップに対応する。あるいはまた、セグメント１１０は、「TiVo」レコーディングのような連続的なビデオ記録を含むディスク・ドライブ上に位置していてもよく、そこからビデオ・セグメント１１０を当技術分野で一般的な諸技法を使って区別することができる。ビデオ・セグメント１１０は、複数の機器にわたって広がる分散メモリ・システムまたはデータベースに記憶されていてもよい。たとえば、セグメント１１０の一部または全部はインターネット・サイトに位置していてもよく、読み取り器１２０はインターネット・アクセス機能を含んでいる。一般に、ビデオ・セグメント１１０は画像および音声の両方を含むが、これらは参照の便のためビデオ・コンテンツおよびオーディオ・コンテンツと称される。ただし、内容によっては、ビデオ・セグメント１１０は画像のみ、あるいは音声のみを含んでいることもありうる。ここではビデオ・セグメント１１０の用語は一般的な意味に使い、画像もしくは音声のいずれかまたはその両方を含む。

特徴付け器１３０は、各セグメントおよび任意的には各セグメント内のサブセグメントを特徴付けるためにビデオ・セグメント１１０を解析するよう構成されている。特徴付けは、ストーリー・セグメントについての代表用語の生成を含む。代表用語は、日時、ニュース・ソース、トピック、名前、場所、組織、キーワード、話者の名前／肩書きなどといった項目を含む。さらに、特徴付けは、色のヒストグラム、形の位置、シーンの種別などといったビジュアル・コンテンツの特徴付け、および／または発話、無音、音楽、雑音などのいずれかといったオーディオ・コンテンツの特徴付けを含んでいてもよい。

比較器１４０は、各セグメント１１０の特徴付けに基づいて、同じストーリーの異なるバージョンに対応するセグメント１１０を識別するよう構成されている。たとえば、異なるニュース・ソースからの、共通のシーンを含む、および／または共通の地名に言及する、および／または共通のキーワードを含むなどのセグメント１１０は共通のストーリーに関係するセグメント１１０である可能性が高く、ストーリー・セグメントのセットとして同定されることになる。セグメント１１０は複数のストーリーに関連していることがありうるので、セグメント１１０をあるストーリーに関係したあるセットに含めることは、それを別のストーリーに関係したセットに含めることを排除しない。

複合器１５０は、各ストーリーに関係したセグメントのセットを編成して、そのさまざまなセグメントを反映するストーリーの呈示を形成するよう構成されている。複合器１５０の機能および特徴は、本発明の個別的な実施形態に依存する。

本発明のストレートな実施形態では、複合器１５０は、たとえばセット中のセグメントの一つまたは複数から導出されるキャプションを使ったストーリーの識別子と、セット中のセグメントへのアクセスを容易にするインデックスとを生成する。好ましくは、そのようなインデックスは、ユーザーが各セグメントを簡単に「クリックして閲覧」できるよう、セグメント１１０へのリンクを使って形成される。

本発明のより包括的な実施形態では、複合器１５０は、セットのセグメント１１０から複合ビデオを生成するよう構成される。これについてはのちにさらに詳述する。典型的には、多様なソースからのニュース・ストーリーのセグメントは、共通の内容を示すのみならず、セグメント１１０における素材の呈示のための、ストーリーの導入からより詳細なシーンの呈示、そしてストーリーのまとめへといった共通の構造をも示す。さまざまなソースからのセグメント１１０を単に連結したものでは、各ソースからのそれぞれの「導入：ルポルタージュ・シーン：まとめ」シーケンスの繰り返しになり、そのような構造反復はばらばらで、一体性を欠くことがありうる。本発明のこの側面の好ましい実施形態では、複合器１５０は、ソース素材の一般的な構造に合致する複合ビデオを形成するようにセットからセグメント１１０を選択および編成するよう構成される。すなわち、上の例の構造を使うと、複合ビデオは導入部を含み、それに詳細なシーンが続き、それにまとめが続くのである。三つの構造セクション（導入、シーン、まとめ）のそれぞれは、セットにおける多様なセクション１１０の対応するサブセクションに基づく。これについてはのちにさらに詳述する。

当業者は、複合器１５０は、上で論じた例示的なストレートな実施形態および包括的な実施形態の諸特徴の範囲の中間にある呈示またはその範囲を超える呈示、さらにはそのような諸特徴の任意的な組み合わせを生成するよう構成されてもよいことを認識するであろう。たとえば、一体性のある複合物を生成する複合器１５０のある実施形態は、独立して、あるいはその複合物が呈示されているときの対話を介して、個々のセグメントへのインデックスによるアクセスをも提供するよう構成されてもよい。同様にして、複合器１５０が単にセグメントへのインデックスによるアクセスを提供するシステムの実施形態は、所与のセグメントのリストからのビデオを逐次的に呈示するよう構成されたメディア・プレーヤーへのリンクを含んでいてもよい。

呈示器１５０は、複合器１５０から呈示を受領し、それをユーザーに呈示するよう構成されている。呈示器１５０は従来式のメディア再生装置であってもよいし、あるいは本システムのさまざまな特徴およびオプション、そして特に複合器１５０によって提供される対話オプションへのアクセスを容易にするために本システムに統合されていてもよい。

図１のシステムは、好ましくは、ビデオ処理および選択システムにとって一般的に利用可能だが本発明の著しい側面の理解を助けるため図示されていない他の構成要素および機能をも含む。たとえば、本システムは、本システムにセグメント１１０を提供するソースの選択を管理するよう構成されていてもよいし、および／または、本システムはユーザーに呈示されるストーリーの選択の呈示を管理するよう構成されていてもよい。同様にして、本システムは好ましくは、ユーザーの嗜好に基づいて、セグメントの特徴付けおよび／または各ストーリーの複合特徴付けに基づいて、セグメントまたはストーリーをフィルタリングするよう構成された一つまたは複数のフィルタを含む。

図２は、本発明に基づくストーリー合成システムの例示的な流れ図を示している。上記したように、本発明は多様な側面を含み、多様な特徴および機能を使って実施できる。図２および以下の記述は必須の包含も明示的な除外も含意することを意図しておらず、本発明の精神または範囲を限定することも意図していない。

２１０において、諸ストーリーに関連したビデオ・セグメント１１０が識別される。これには多様な技法のどれを使ってもよい。2002年3月26日にNevenka Dimotrovaに発行され、ここに参照によって組み込まれる米国特許6,363,380、“Multimedia Computer System with Story Segmentation Capability and Operating Program Therefor Including Finite Video Parser”は、連続的なビデオをビデオの切れ目または不連続によって弁別される「ビデオ・ショット」に区分するセグメント分割を行い、ショット内のビジュアル・コンテンツおよびオーディオ・コンテンツに基づいて関係するショットをグループ化する技法を教示している。

２２０では、セグメントが特徴付けされる。それには、ビデオ・セグメント内の弁別特徴を識別するために利用可能な多様な技法のいずれを使ってもよい。典型的には、ビジュアル・コンテンツ（色、特徴的な形、顔の数、特定のシーンなど）、オーディオ・コンテンツ（音の種類、発話など）およびグローズドキャプションのテキスト、各セグメントに付随するメタデータなどといったその他の情報に基づいて行われる。この特徴付けまたは特徴識別は、２１０におけるストーリー・セグメントの識別と組み合わされたり、あるいは一体化されたりしてもよい。2002年1月9日にRadu S. Jasinschi and Nevenka Dimitrovaのために出願された逐次番号10/042,891でここに参照によって組み込まれる米国の公開特許出願2003/0131362、“A Method and Apparatus for Multimodal Story Segmentation for Linking Multimedia Content”は、セグメントのコンテンツの共通の特性または特徴に基づいて、ニュース・ショーをテーマ上ひとつながりのセグメントに区分するシステムを教示している。

２２５では、主として、現在のユーザーにとって関心がないものである可能性が高いセグメントをさらなる考慮から除外するために、任意的にセグメントがフィルタリングされる。このフィルタリングは上記のストーリー・セグメント分割２１０および特徴付け２２０と統合されてもよい。1998年12月23日にJan H. Elenbaas et al.のために出願された逐次番号10/932,460で、09/220,277の分割出願であり、ここに参照によって組み込まれる米国の公開特許出願“Personalized News Retrieval System”は、ユーザーの明示的および暗黙的嗜好に基づいて、ユーザーに関心がありそうなニュース・ストーリーを識別および呈示するセグメント分割・特徴付け・フィルタリング・システムを教示している。

２３０では、特徴付けされ、任意的にフィルタリングされたセグメントが互いに比較され、どのセグメントが同じストーリーに関係している可能性があるかを判別する。好ましくは、この照合は、２２０で決定されたセグメントの特徴の一部または全部に基づく。ただし、特に留意すべきこととして、二つのセグメントが共通のストーリーに関係しているかどうかを判別する際のこれらの特徴のそれぞれの重要性は、上記のプロセス２１０および２２０でどのビデオ・ショットまたはシーケンスがセグメントを形成するかを判別する際の各特徴の重要性とは異なる可能性が高い。

本発明のある好ましい実施形態では、二つのセグメントＡ、Ｂは、次の一致パラメータMが所与の閾値を超える場合に同じストーリーに対応していると判別される：

ここで、V^AはセグメントAの特徴ベクトルであり、V^BはセグメントBの特徴ベクトルであり、W_iはベクトル中の各特徴iに与えられる重みである。たとえば、共通のストーリーを識別するための名前特徴に与えられる重みWは典型的には、トピック特徴に与えられる重みよりも著しく大きい。これは、名前がストーリーを区別する力のためである。比較器関数F_iは個々の特徴に依存し、一般には0から1までの間で変化する類似性指標を返す。たとえば、名前を比較するために使われる関数Fは名前が一致すれば「1」、そうでなければ「0」を返すのでよい。あるいは名字と名前が一致すれば1.0、肩書きと名字が一致すれば0.9、名字のみが一致すれば0.75などでもよい。もう一つの例では、色ヒストグラムを比較するために使用される関数Fは、ヒストグラム・ベクトルの規格化されたドット積のような数学的に決定される指標を返すのでよい。

共通のストーリーに対応するセグメントの各セットを決定することは、セグメント対の間での一致パラメータMの組み合わせに基づく。単純な実施形態では、少なくとも一つの共通した一致を有するセグメントすべてが共通ストーリーに対応するセグメントのセットとして定義される。たとえば、AがBに一致し、BがCに一致すれば、AがCに一致するかどうかにかかわりなく、{A,B,C}が共通ストーリーのセグメントのセットとして定義される。制限の強い実施形態では、各セグメントが他の各セグメントに一致するようなセグメントのみでセットが定義されうる。すなわち、{A,B,C}がセットを定義するのは、AがBに一致し、BがCに一致し、CがAに一致したとき、かつそのときのみである。他の実施形態は異なるセット定義規則を使うこともありうる。たとえば、AがBに一致し、BがCに一致する場合、Cがセットに含まれるものとして定義できるのは、AとCの間の一致パラメータが少なくとも何らかの第二のより低い閾値を超える場合とする。同様にして、最初はセット定義規則はゆるいが、結果として得られるセットが大きすぎる場合にはセット定義規則のパラメータもしくは一致閾値レベルまたは両方をより厳しくできる、動的な閾値処理規則を使うことができる。双方向比較に基づいてセットを形成するためのこれらおよびその他の技法は当技術分野において一般的なものである。

あるいはまた、共通する特徴を有するセグメントをみつけるためにその他の技法を使うこともできる。それには、これに限られないが、クラスタリング技法のほか、ニューラル・ネットワークなどのようなトレーニング可能システムが含まれる。

上記したように、ある共通ストーリーに対応するセグメントの各セットを定義すると、そのストーリーの識別情報およびセグメントへのインデックスを本発明の出力として与えることができる。ただし、好ましくは、本発明のシステムは、図２のプロセス２４０〜２９０に示されるような複合ビデオの合成をも含む。

２４０では、単一のストーリーに対応する諸セグメントがさらなる処理のためにサブセグメントに区分または再区分される。サブセグメントはオーディオ・サブセグメント２４２およびビデオ・サブセグメント２４６の両方を含む。そのようなサブセグメントの組み合わせによって形成される結果的な複合ビデオが、中途半端な文、不完全なショットなどといった重大な不連続を示さないよう、これらのサブセグメントは好ましくは自己完結である。一般に、ビデオ・サブセグメント間の切れ目は元のビデオ・ソースの切れ目に対応し、オーディオ・サブセグメント間の切れ目は自然言語の切れ目に一致する。好ましい実施形態では、セグメントのオーディオ部分がビデオ・画像に直接一致するかどうか、あるいは「ボイスオーバー」のような関連しない音であるかどうかについての判別が行われる。オーディオとビデオが直接関係していれば、オーディオ２４２およびビデオ２４６のサブセグメントについて共通の切れ目が定義される。

２５０では、複合ストーリーを呈示するための好ましい構造を決定するため、元のセグメントの構造が解析される。この決定は主として、ビデオ・サブセクション２４６から推論できる構造に基づくが、オーディオ・サブセクション２４２の構造もこの決定に影響してもよい。上記の米国特許6,363,380は、「開始：ホスト：ゲスト：ホスト：終了」のような典型的な呈示構造のモデル化に取り組んでいる。ニュース・ストーリーについての共通構造は「アンカー：リポーター：シーン：リポーター：アンカー」を含む。ここで、最初のアンカー・サブセグメントは導入または見出しに対応し、最後のアンカー・サブセグメントはまとめまたは論評に対応する。同様に、金融ニュースについての共通構造は「アンカー：グラフィック：評論家：シーン：アンカー」を含む。

本発明のある典型的な実施形態では、構造解析２５０およびセグメント区分２４０は統合されたプロセスまたは逐次的なプロセスとして実行される。元のビデオの区分に基づく構造解析２５０における全体的な構造の決定は、この全体的な構造に基づいて複合ビデオを生成するために使われる各セグメントの最終的なビデオおよびオーディオ区分に対する影響をもつことができるからである。

２８０では、選ばれたサブセクションが配列されて、ストーリーに対応する複合ビデオが形成される。これらのサブセクションの選択のベースとなるのは、好ましくは、ビデオ・サブセクション２４６およびオーディオ・サブセクション２４２のランキングまたはそのようなランキングの組み合わせまたはビデオ・サブセクションとオーディオ・サブセクションの組み合わせに基づくランキングである。

オーディオ・サブセクション２４２およびビデオ・サブセクション２４６を２７０、２６０においてランク付けするためには、多様な技法のいずれを使ってもよい。本発明のある好ましい実施形態によれば、それぞれのランキングは次の形を取る：

ここで、I(i)はサブセクションiのオーディオ・コンテンツまたはビデオ・コンテンツの内在的な重要性であり、たとえばビデオ中のテキスト、グラフィック、顔またはその他の項目ならびにオーディオ中の名前、場所およびその他の項目の生起に基づいている。jランキング項R_ijのそれぞれは、サブセクションをランク付けするための種々のオーディオまたはビデオ指標に基づく。たとえば、ビデオ・サブセクションをランク付けする際、ランキングの一つはそのビデオ・サブセクションに現れるオブジェクトに基づくことができ、一方、別のランキングはそのビデオ・サブセクション中のフレームの一般的な配色といった視覚的な類似性に基づくことができる。同様に、オーディオ・サブセクションをランク付けする際、ランキングの一つはそのオーディオ・サブセクション中に生起する単語に基づいていてもよく、一方、別のランキングは、同じ人物によって話された文といったオーディオ類似性に基づいていてもよい。当業者には、本開示に鑑みて他のランキング方式も明らかであろう。W_j項は、各ランキング方式に与えられる重みに対応する。

各サブセクションのランキングを容易にするため、セグメントは、たとえばk平均クラスタリング・アルゴリズムを使ってクラスタリングされる。各クラスターにはいくつかのセグメントがあり、クラスター内のセグメントの総数がそのクラスターの重要性の指標を与える。その後は、サブセクションのランクは、そのサブセクションのセグメントが含まれるクラスターの重要性に基づく。

上記したように、サブセクションを呈示のために選択および編成するのは、複合ビデオの決定された好ましい構造に基づいて行われる。一般に、ストーリーの導入部に対応してサブセグメントの一つのみが含められるべく選択される。そしてこの選択は好ましくは、元のセクションにおいて導入部に対応するサブセクションのオーディオ・コンテンツのランキングに基づく。その後、構造の「詳細な」諸部分は一般にサブセグメントのビデオ・コンテンツのランキングに基づくが、ランクの高かったオーディオ・サブセグメントも選択プロセスに影響してもよい。上で論じたようにオーディオ・サブセクションおよびビデオ・サブセクションが直接関係していると判別された場合は、一方の選択は好ましくは他方の選択に影響し、両サブセクションは揃って呈示される。

２８０からの複合ビデオは２９０でユーザーに呈示される。この呈示は、対話機能および対話を向上させるまたは案内する機能を含みうる。たとえば、ストーリー中のある特定の側面（aspect）または事象（event）が多様なソースが扱っていることに基づいて特に重要であると判別される場合、対応するサブセクションが表現されている（rendered）間、この重要な側面または事象に関係した他のオーディオまたはビデオ・サブセグメントへの対話的アクセスとともに、この重要性（significance）の指標（indication）が呈示されてもよい。

以上は本発明の原理を単に解説するものである。よって、当業者が、ここに明示的に記述や図示はされていなくても本発明の原理を具現し、よって本発明の精神および範囲内であるさまざまな構成を考案できるであろうことは理解されるであろう。たとえば、本発明は、同じニュース・ストーリーの種々のバージョンを見ることを背景に呈示されている。当業者はこのニュース関係のアプリケーションが他の情報アクセス関係のアプリケーションに統合され、あるいはそうしたアプリケーションへのアクセスを与えられることができることを認識するであろう。たとえば、現在のストーリーに関係した他のセグメント１１０にアクセスできることに加えて、呈示器２９０は、現在のストーリーに関係した他の情報ソースにもアクセスするよう構成されていてもよい。他の情報ソースとは、そのストーリーを特徴付ける特徴に基づいて背景情報を提供できるインターネット・サイトなどである。これらおよびその他のシステム構成および最適化特徴は、本開示に鑑みて当業者には明らかであり、請求項の範囲に含まれる。

請求項を解釈する際には、以下のことを理解しておくべきである：
ａ）「有する」の語は所与の請求項に挙げられている以外の要素または動作の存在を排除しない。
ｂ）要素の単数形の表現はそのような要素の複数の存在を排除しない。
ｃ）請求項に参照符号があったとしてもそれは特許請求の範囲を限定するものではない。
ｄ）いくつかの「手段」は同一の項目、すなわちハードウェアまたはソフトウェアで実装される構造または機能によって表現されていてもよい。
ｅ）開示される要素のそれぞれは、ハードウェア部分（たとえば別個の電子回路および集積電子回路を含む）、ソフトウェア部分（たとえばコンピュータプログラミング）およびその任意の組み合わせから構成されうる。
ｆ）ハードウェア部分はアナログ部分およびデジタル部分の一方または両方から構成されうる。
ｇ）特別に断りのない限り、開示される装置またはその部分のいずれも、一緒に組み合わせたり、あるいはさらなる部分に分割したりされてもよい。
ｈ）特に示さない限り、動作のいかなる特定の序列も必要であるとは意図されていない。
ｉ）「複数の」要素という用語は請求される要素の二つ以上を含むのであり、要素数のいかなる特定の範囲も含意しない。すなわち、複数の要素は最低で２つの要素であることもできる。

本発明に基づくストーリー合成システムの例示的なブロック図を示している。本発明に基づくストーリー合成システムの例示的な流れ図を示している。

Claims

複数のビデオ・セグメントへのアクセスを提供するよう構成された読み取り器と；
前記読み取り器に動作的に結合され、前記複数のビデオ・セグメントの各セグメントを特徴付けて、複数のセグメント特徴付けを生成するよう構成された特徴付け器と；
前記特徴付け器に動作的に結合され、前記セグメント特徴付けを互いに比較してある共通ストーリーの異なる複数のバージョンに対応するビデオ・セグメントを識別するよう構成された比較器と；
前記比較器および前記読み取り器に動作的に結合され、前記複数のバージョンに対応するビデオ・セグメントの内容に基づいて、呈示を生成するよう構成された複合器とを有しており、
前記複合器は、前記複数のバージョンに対応する前記ビデオ・セグメントをサブセクションに分割し、
前記サブセクションから推論される、前記複数のバージョンの前記ビデオ・セグメントの内容の一つまたは複数の構造に基づいて、ある共通構造を決定し、
前記複数のバージョンの前記ビデオ・セグメントの異なるものからのサブセクションを選択し、配列することによって前記呈示を、前記共通構造に合致するよう生成するよう構成されている、
システム。
前記複合器がさらに、前記ビデオ・セグメントの前記サブセクションのビデオ内容およびオーディオ内容のうちの少なくとも一方の一つまたは複数のランキングに基づいて、前記ビデオ・セグメントのうちの一つまたは複数のビデオ・セグメントのサブセクションを前記呈示に含めるために選択するよう構成されている、請求項１記載のシステム。
前記比較器が、ユーザーの一つまたは複数の嗜好に基づいて、前記共通ストーリーの異なるバージョンに対応するビデオ・セグメントの識別を容易にするよう構成されているフィルタを含む、
請求項１記載のシステム。
複数のビデオ・セグメントの各セグメントを特徴付けて複数のセグメント特徴付けを生成する段階と；
前記セグメント特徴付けを互いに比較してある共通ストーリーの異なる複数のバージョンに対応するビデオ・セグメントを識別するよう比較する段階と；
前記複数のバージョンのビデオ・セグメントの内容に基づいて、前記共通ストーリーの前記複数のバージョンに基づく呈示を生成する段階とを含み、
前記呈示を生成する段階は、前記ビデオ・セグメントをサブセクションに分割することを含み、
前記呈示を生成する段階は：
前記サブセクションから推論される、前記複数のバージョンの前記ビデオ・セグメントの内容の一つまたは複数の構造に基づいて、ある共通構造を決定し、
前記複数のバージョンの前記ビデオ・セグメントの異なるものからのサブセクションを選択し、配列することによって前記呈示を、前記共通構造に合致するように生成することを含む、
方法。
前記呈示を生成する段階がさらに、前記ビデオ・セグメントの前記サブセクションのビデオ内容およびオーディオ内容のうちの少なくとも一方の一つまたは複数のランキングに基づいて、前記ビデオ・セグメントのうちの一つまたは複数のビデオ・セグメントのサブセクションを前記呈示に含めるために選択する段階を含む、請求項４記載の方法。
前記セグメント特徴付けおよびユーザーの一つまたは複数の嗜好に基づいて、前記共通ストーリーの前記複数のバージョンに対応するビデオ・セグメントを識別するのを容易にするようビデオ・セグメントをフィルタリングする段階をさらに含む、請求項４記載の方法。
前記比較器および前記読み取り器に動作的に結合され、前記呈示を提供するよう構成された呈示器をさらに含む、請求項１記載のシステム。
前記呈示器が、一つまたは複数のサブセクションに対応する、前記共通ストーリーの側面または事象の重要性の指標を、該対応するサブセクションが表現されている間に提供するよう構成されている、請求項７記載のシステム。
前記呈示器が、前記呈示中の前記側面または事象に関係するサブセクション以外の、前記側面または事象に関係するサブセクションへの対話的アクセスを提供するよう構成される、請求項８記載のシステム。
前記呈示をユーザーに提供する段階と；
一つまたは複数のサブセクションに対応する、前記共通ストーリーの側面または事象の重要性の指標を、該対応するサブセクションが表現されている間に提供する段階とをさらに含む、
請求項４記載の方法。
前記呈示中の前記側面または事象に関係するサブセクション以外の、前記側面または事象に関係するサブセクションへの対話的アクセスを提供する段階をさらに含む、請求項１０記載の方法。