JP5556911B2 - コンテンツ表現を作成する、方法、プログラム、及びシステム - Google Patents

コンテンツ表現を作成する、方法、プログラム、及びシステム Download PDF

Info

Publication number
JP5556911B2
JP5556911B2 JP2013001018A JP2013001018A JP5556911B2 JP 5556911 B2 JP5556911 B2 JP 5556911B2 JP 2013001018 A JP2013001018 A JP 2013001018A JP 2013001018 A JP2013001018 A JP 2013001018A JP 5556911 B2 JP5556911 B2 JP 5556911B2
Authority
JP
Japan
Prior art keywords
presentation
interest
region
identified
order
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013001018A
Other languages
English (en)
Other versions
JP2013101657A (ja
Inventor
ドゥヌ ローラン
チィーウ パトリック
透 布施
幸代 上堀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Publication of JP2013101657A publication Critical patent/JP2013101657A/ja
Application granted granted Critical
Publication of JP5556911B2 publication Critical patent/JP5556911B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/017Gesture based interaction, e.g. based on a set of recognized hand gestures
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2370/00Aspects of data communication
    • G09G2370/24Keyboard-Video-Mouse [KVM] switch

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • User Interface Of Digital Computer (AREA)
  • Processing Or Creating Images (AREA)
  • Controls And Circuits For Display Device (AREA)

Description

本発明は、広くは、コンテンツ(例えば、マルチメディアコンテンツ)を生成して提示する技法に関し、より具体的には、ビデオ又はその他のマルチメディア記録を自動的に生成するシステム及びそれに伴う方法であって、提示されたコンテンツにおいて、ユーザが特に関心を持ち得る部分に、特定時間自動的にフォーカスする、システム及びそれに伴う方法に関する。即ち、本発明は、このような方法、プログラム、及びコンピュータ化されたシステムに関する。
記録されたプレゼンテーション、講義、及び、例えば、スクリーンキャスト等のチュートリアルは、モバイル装置(例えば、携帯電話又はPDA)の小さな画面上では見にくい。一般的なコンピュータ画面が、少なくとも800×600ピクセルの解像度でプレゼンテーションを示すのに対し、携帯電話の一般的な画面の解像度は、たったの240×160ピクセルである。たとえ画面の解像度が高くされても(アップル(Apple)社のiPhone(登録商標)のような最近のモデルは320×480ピクセルまで向上)、携帯電話画面の実際の物理的な大きさは、携帯できる小型の装置が好まれるため、実質的に小さいままであることが多い。従って、携帯電話画面の不十分な表面面積をどのように用いて、最大の情報を効率良くユーザに伝えるか、という問題が残っている。
これまでに、何人かの著者が、この問題に対処しようとしてきた。例えば、下記の非特許文献1において、著者たちは、写真、例えば、人々の写真、に関して算出された関心領域(Region of Interest)を示す技法を提案している。このシステムは、次に、検出された顔の周囲の写真のみを切り取って、全ての顔を順に示す。
下記の非特許文献2において、著者たちは、PDFファイルのドキュメントレイアウトを自動的に分析して、ユーザがどの領域に関心を持つ可能性が最も高いか判定することを提案している。例えば、ページ上のある図が関連しているものとして見つけ出され、この図にフォーカスする。また、このシステムは、テキスト−音声合成を用いて、この図のキャプションを読み上げる。
別の例では、下記の非特許文献3において、著者たちは、モバイル装置が傾きセンサを用いてドキュメントにおけるリストを連続的にナビゲートするシステムについて、ローロデックス(Rolodex)の例えを用いて説明している。しかしながら、この技法は、リストの純粋な連続的ブラウジングに限定されるため、プレゼンテーションの流れが非線形であり得るため、他のプレゼンテーションコンテキストへの適用性を制限してしまう。
このように、既存の技法では、小型提示装置を用いて特定時点における最も関連したコンテンツをユーザに提供することに関する問題に対し、効果的な解決法をもたらすことができない。
ワン(Wang)外,「MobiPicture:モバイル装置における写真のブラウジング(browsing pictures on mobile devices)」,マルチメディアに関する第11回ACM(米国計算機学会)国際会議会報(Proceedings of the eleventh ACM international conference on Multimedia),(米国、カリフォルニア州、バークリー(Berkeley)),2003年,P.106−107 エロール(Erol)外,「ドキュメントのマルチメディアサムネイル(Multimedia thumbnails for documents)」,マルチメディアに関する第14回ACM年次国際会議会報(Proceedings of the 14th annual ACM international conference on Multimedia),(米国、カリフォルニア州、サンタバーバラ(Santa Barbara)),2006年,P.231−240 ハリソン(Harrison)外,「握って、構えて、傾けて!操作的ユーザインタフェースの探究(Squeeze Me, Hold Me, Tilt Me! An Exploration of Manipulative User Interfaces)」,CHI(コンピュータヒューマンインタラクション)'98会報(Proceedings of CHI '98),p.17−24
本発明の手法は、コンテンツをユーザに提示する従来の技法に関する上記及びその他の問題のうち、1つ以上を実質的に取り除く方法及びシステムを提供する。
本発明の第1の態様は、方法であって、キャプチャモジュールが、プレゼンタによって提供された前記プレゼンテーションを取り込み、プレゼンテーション分析モジュールが、前記プレゼンテーションにおける関心領域を分析して識別し、前記プレゼンテーション分析モジュールが、前記関心領域が変化する順序を、前記プレゼンテーションに含まれるオブジェクトが示す方向に従って識別し、ビデオ作成モジュールが、識別された前記プレゼンテーションにおける前記関心領域および前記順序に基づいて、識別された前記プレゼンテーションにおける前記識別された順序に従って変化する前記関心領域にフォーカスをしたプレゼンテーションの時間単位コンテンツ表現を作成する。
本発明の第2の態様は、コンピュータを、プレゼンタによって提供されたプレゼンテーションを取り込むキャプチャモジュール、前記プレゼンテーションにおける関心領域を分析して識別すると共に、前記関心領域が変化する順序を、前記プレゼンテーションに含まれるオブジェクトが示す方向に従って識別するプレゼンテーション分析モジュール、及び識別された前記プレゼンテーションにおける前記関心領域および前記順序に基づいて、識別された前記プレゼンテーションにおける前記識別された順序に従って変化する前記関心領域にフォーカスをしたプレゼンテーションの時間単位コンテンツ表現を作成するビデオ作成モジュールとして機能させるための、プレゼンテーションを再生したコンテンツ表現を作成するプログラムである。
本発明の第3の態様のプレゼンテーションを再生したコンテンツ表現を作成するシステムは、プレゼンタによって提供されたプレゼンテーションを取り込むキャプチャモジュールと、前記プレゼンテーションにおける関心領域を分析して識別すると共に、前記関心領域が変化する順序を、前記プレゼンテーションに含まれるオブジェクトが示す方向に従って識別するプレゼンテーション分析モジュールと、識別された前記プレゼンテーションにおける前記関心領域および前記順序に基づいて、識別された前記プレゼンテーションにおける前記識別された順序に従って変化する前記関心領域にフォーカスをしたプレゼンテーションの時間単位コンテンツ表現を作成するビデオ作成モジュールと、を備える。
本発明に関する更なる態様について、一部は以下の説明で述べられ、一部は以下の説明から明らかであるか又は本発明を実施することにより分かるであろう。本発明の態様は、要素によって、並びに、様々な要素と以下の詳細な説明及び添付の特許請求の範囲で特に示された態様とを組み合わせることによって、実現及び達成され得る。
当然のことながら、上記の記述及び下記の記述はいずれも、単なる例示及び説明であって、いかなる形においても特許請求の範囲に記載の本発明又はその適用を制限するものではない。
本発明のシステムの一例としての実施形態及びその構成要素を示す図である。 本発明のシステムの一実施形態の一例としての動作シーケンスを示すフローチャートである。 本発明のシステムの一実施形態の一例としての動作結果を示す図である。 本発明のシステムの一実施形態の別の一例としての動作結果を示す図である。 棒グラフを含むプレゼンテーションの状況における、本発明のシステムの一実施形態の更に別の一例としての動作結果を示す図である。 1セットの単一方向の矢印を含むプレゼンテーションチャートの状況における、本発明のシステムの一実施形態の一例としての動作結果を示す図である。 1セットのいろいろな方向の矢印を含むプレゼンテーションチャートの状況における、本発明のシステムの一実施形態の一例としての動作結果を示す図である。 4×9の欄から成るプレゼンテーション表の状況における、本発明のシステムの一実施形態の一例としての動作結果を示す図である。 ユーザのモバイル装置の傾きを利用してユーザの関心領域にフォーカスする、本発明のシステムの一例としての実施形態を示す図である。 手振りの動きを利用してパン及びスキャン動画の生成を促す、本発明のシステムの一例としての実施形態を示す図である。 スライド上のマーク又は注釈を利用してパン及びスキャン動画の生成を促す、本発明のシステムの一例としての実施形態を示す図である。 本発明のシステムが実施され得る、コンピュータプラットフォームの一例としての実施形態を示す図である。
以下の詳細な説明では、図面を参照するが、これらの図面において同一の機能要素は、同じ参照番号で示されている。図面は、本発明の原理に従った具体的な実施形態及び実施例を、限定目的ではなく例示目的で示している。これらの実施例は、当業者が本発明を実施することができるように詳細に説明されており、当然のことながら、他の実施例を利用してもよく、本発明の範囲及び精神を逸脱しない限り、様々な要素の構造的変更及び/又は置換を行ってもよい。従って、以下の詳細な説明は、限定された意味で解釈されない。更に、説明されているような本発明の様々な実施形態は、汎用コンピュータで作動するソフトウェアの形態で実施されてもよいし、専用ハードウェアの形態で実施されてもよいし、ソフトウェアとハードウェアとを組み合わせた形態で実施されてもよい。
上記のように、小型装置(例えば、携帯電話)の画面は小さすぎて、一般的にはテキストを含むコンテンツ(例えば、プレゼンテーションスライド又はスクリーンショット)をきちんと描画することができないため、このような小型装置では、プレゼンテーション、チュートリアル、及びスクリーンキャストが見にくい。この問題に対処するため、本発明の一実施形態は、1)映像ストリーム、音声ストリーム、及びメタストリームを用いて、オリジナルのストリームから関心領域を自動的に識別し、2)これらの関心領域とオリジナルのメディアストリームとを同期化し、3)パン及びスキャンを用いて、ズームイン/ズームアウトする(即ち、フォーカスを移動する)ことにより、既存のメディアストリームからユーザ制御可能な動画を生成しやすくする。生成された時間単位のメディアストリームは、ユーザがシームレスに割り込んで、一時的に特定の関心領域にフォーカスすることができる。その間、オリジナルメディアストリームは、再生を続けることができる、又は、ユーザが関心領域間をジャンプするのに伴ってタイムラインをジャンプして繰り返すこともできる。
本発明のシステムの一実施形態は、提示されたコンテンツにおいて、特定時間ユーザが特に関心を持ち得る部分に、自動的にフォーカスすることにより、ビデオ又はその他のマルチメディア記録の自動的な生成を容易にする。具体的には、本発明のシステムの一実施形態は、パン及びスキャンを2つの主な技法として用いて、以下に詳細に説明するように、メディアストリームにおける特定要素に自動的に(又は、ユーザの要求に応じて)フォーカスする。
図1は、本発明のシステムの一例としての実施形態100及びその構成要素を示している。本発明のシステムのこの図示されている実施形態は、キャプチャモジュール101を含んでいてもよく、このキャプチャモジュール101は、様々な装置を用いて構成され(例えば、プロジェクタ102、プレゼンタのコンピュータ103、動画若しくは静止画カメラ104、及び/又はマイク105が挙げられるが、これらに限定されない)、マルチメディアプレゼンテーション及びその他のコンテンツを取り込み得る。本発明の様々な実施形態では、メディアストリームは例えば講義のビデオであって、そのフレーム中にはその前でプレゼンタが動いたり身振り手振りをしたりしている全画面表示のスライドを含んでいたり、即ち、ProjectorBoxのように、講演の模様を静止画のスライド画像とその時の音声とをシステムによってキャプチャした、例えば、jpeg画像及びmp3ファイルとを1セットにした同期化ストリームであってもよい。別の一例である設定としては、プレゼンタとルームディスプレイ上のスライドとのやりとりを検出して追跡する複数のカメラ、並びに、スライド及び音声を記録するその他のキャプチャ装置が備えられた部屋が挙げられる。このようなプレゼンテーションモードは全て、キャプチャモジュール101及びこれに関連付けられたキャプチャ装置102〜105によって取り込むことができる。
次に、キャプチャモジュール101は、この取り込まれたプレゼンテーションスライド、取り込まれた音声、及び/又は、その他のコンテンツ109、並びに、これに関連付けられたメタデータ110を、プレゼンテーション分析モジュール106に送信する。次に、プレゼンテーション分析モジュール106は、音声と映像の特徴を用いることにより、全オリジナルプレゼンテーション中の領域であって、特定時点においてユーザに関連すると判断される領域である、同期した関心領域を、プレゼンテーションの流れという観点から見つけ出す。
プレゼンテーション分析モジュール106によって生成された、同期化関心領域に関する情報を含む情報111は、動画又はその他の時間単位で作成されたフォーカス化マルチメディアコンテンツ112を生成する、ビデオ作成モジュール107に送られる。この動画又はその他の時間単位で作成されたフォーカス化マルチメディアコンテンツ112は、フォーカスされてきちんとユーザの関連領域と同期化されたプレゼンテーションの光景をユーザに提供すると共に、全オリジナルプレゼンテーションの、プレゼンテーションの流れの特定時点における最も関連した領域をユーザに届けるように、ユーザの小型提示装置に合わせてデザインされる。また、この動画又はその他の時間単位で作成されたフォーカス化マルチメディアコンテンツ112は、それに伴うプレゼンテーションの音声部分を含んでいてもよい。
最後に、生成されたこの動画又はその他のフォーカス化マルチメディアコンテンツ112は、ユーザの提示装置108に提供される。このユーザの提示装置108は、モバイル装置(例えば、PDA)であってもよいし、携帯電話(例えば、アップル社のiPhone(登録商標))であってもよいし、生成された動画又はその他のフォーカス化マルチメディアコンテンツ112(それに伴う音声を含む)が効果的にユーザに提示され得る、あらゆるその他の適切な装置であってもよい。
図2は、本発明のシステムの一実施形態(例えば、図1に示した実施形態100)の一例としての動作シーケンス200を示している。実施形態100の動作は、ステップ201において開始する。ステップ202において、プレゼンテーションが取り込まれる。ステップ203において、プレゼンテーションを行う人の行為も取り込まれる。ステップ204において、プレゼンテーション分析モジュール106が、取り込まれたプレゼンテーションを分析し、プレゼンテーションの流れの観点から特定時点において関連した関心領域を識別する。ステップ205において、プレゼンテーションのこの時間的パス(経路)が、プレゼンテーション分析モジュールによって識別される。ステップ206において、ビデオ作成モジュール107が、この分析されたプレゼンテーション、その時間的パス、及び関心領域に基づいて、動画又はその他の時間単位で作成されたフォーカス化コンテンツ112を生成し、ステップ207において、動作が終了する。上記動作シーケンスは、動画又はその他の時間単位でフォーカス化コンテンツ112をユーザのモバイル装置又はその他の提示装置に転送するステップ、及び、この転送されたメディアをユーザに提示するステップも含み得ることに留意されたい。これらのステップは、あらゆる既知の技法を用いて行われてもよいため、これらの動作を行う厳密な方法は、本発明にとって重要なものではない。従って、これらのステップは、図2に示されていない。
初期設定により、図1に示した本発明のシステムの実施形態は、自動で動作する。つまり、システム100は、オリジナルの又はインデックスが再作成されたビデオストリームを再生するが、適切な時点で関心領域を拡大してから、スライドのフルスクリーンを示すように元に戻る。適切な場合、このシステムは、スキャンも用いて、関心領域周囲を示す。例えば、光学式文字認識(OCR:optical character recognition)を用いてスライド上において見つけられた文字が、2分30秒の時点で音声ストリームにおいて見つけられた場合、このシステムは、2分30秒の時点でこの文字をズームインして示し、この文字が見つけられた行の残りの部分をパンする。従って、本発明のシステムの一実施形態は、OCR機能を備えて、上記のような音声ストリームにおいて見つけられた文字の光学式文字認識(OCR)を行ってもよい。
図3は、本発明のシステムの一実施形態の一例の動作結果を示している。この図3は、本発明の一実施形態により行われるスライドの自動パン及びスキャンによって、ユーザには、スライドにおける関心領域が、キャプチャ装置102〜105によって取り込まれたプレゼンタの身振り手振り、及び、プレゼンテーションの音声特性に合わせて同期化されて示される、ということを示している。例えば、同じプレゼンテーションスライド301のフォーカス部分302及び303は、プレゼンタによって行われる説明に応じて、ユーザに示される。つまり、プレゼンタがスライドの特定部分に位置する項目について説明すると、本発明のシステムは、その説明された構成要素に自動的にフォーカスを行い、スライドの適切な領域302及び303を拡大する。このような拡大を行うために、本発明のシステムの一実施形態は、プレゼンテーション音声の音声認識を用いて得られた文字と、OCRを用いて抽出されるかプレゼンテーションファイルから直接的に抽出され得る、プレゼンテーションスライドにおいて見つけ出された文字とを比較する。一致する又は十分に一致していると判断される場合、このシステムは適切なズーム動作を行う。このシステムは、プレゼンタが、プレゼンテーションにある文字そのものを用いずに、別の文字(例えば、同義語)を用いることがある、ということを考慮し得る。従って、このシステムは、同義語をチェックしてもよいし、プレゼンテーションの時間の流れにおける現時点が、プレゼンテーションにおける特定項目に関連することを示すその他のものを用いてもよい。例えば、本発明のシステムは、プレゼンタによる指示装置の指す箇所(例えば、指し棒やレーザポインタの指示位置はビデオ分析から、マウスポインタの指示位置はアプリケーションを動作させているコンピュータに接続したマウスの入力から)を検出して用いる。
本発明の一実施形態では、ユーザは、再生中のいつでも制御可能であり、プレゼンテーションの通常のタイムラインとは関係なく、手動で次の関心領域に進むことができる。例えば、ユーザは、文字、人、写真、又は、プレゼンテーションのその他何らかの部分、に関してもっと読みたいと思う場合、装置のナビゲーションキーを押す(又は、傾きセンサを備えた装置を傾ける)ことにより、次の又は前の関心領域にジャンプすることができる。スライドに関し、関心領域は、OCRによって、或いは、その他の抽出方法(例えば、ファイル抽出方法)を用いて抽出された文字(例えば、PowerPoint(登録商標)は、PPTファイルの文字を囲んだバウンディングボックスを抽出することができる)、及び、画像を含み得る。携帯電話に関し、ナビゲーションキーは、上下左右であり、それぞれ、スライド上における前の行、次の行、前の文字、次の文字に行くようにマッピングされている。
ユーザが手動ナビゲーションモードを開始すると、現時点でフォーカスされた点が現在選択されているフォーカスとなり、ここからユーザはナビゲーションを開始することができる。例えば、本発明のシステムの一実施形態の別の一例の動作を示す図4では、システムがプレゼンテーションスライド401における文字“Flexible”402をズームインしており、ユーザが制御して「次へ」というキーを押すと、システムは、同じスライド401における文字“Not”404が前記OCR機能を用いて見つけ出され得る次の関心領域であるため、この文字“Not”404にフォーカスする。ユーザが制御したときにシステムが特定の関心領域をズームインしない場合、そのスライド上における最初の関心領域(例えば、OCRによって見つけ出された最初の左上の文字)がフォーカスとなる。この領域を拡大することにより、つなぎ目の無い移行が行われる。
同様に、ユーザが手動制御を終了すると、本発明のシステムの一実施形態は、ズームアウト、全景、及び、ズームインを用いて、次に示される予定となっていた関心領域にフォーカスを合わせて、自動再生に戻る。
[グラフ、チャート、表のパン及びスキャン]
プレゼンテーションでは、グラフ、チャート、及び、表がよく用いられる。これらのオブジェクトは、プレゼンテーションキャプチャモジュール101によって、多くの異なる方法で抽出することができる。ユーザがMicrosoft社のPowerPoint(登録商標)ソフトウェアを使用している場合、これらのオブジェクトは、PowerPoint(登録商標)のアプリケーションプログラミングインタフェース(API)を介して抽出することができる。ユーザがグラフ/チャートを別のアプリケーションからのオブジェクトとして組み込んだ場合には、そのオブジェクトのデータを、Excel又はその他のActiveX(登録商標)コントロールから得ることができる。また、オブジェクトが単純な画像である場合には、画像解析法(例えば、OCR)が適用される。
[グラフ]
図5は、棒グラフを含むプレゼンテーション501の状況における、本発明のシステムの一実施形態の別の一例の動作を示している。この図5に示されているように、棒グラフに関し、パン及びスキャンパス502〜504は、この棒グラフの先端の輪郭を辿り得る。
[チャート]
図6は、1セットの矢印を含むプレゼンテーションチャートの状況における、本発明のシステムの一実施形態の一例の動作を示している。本発明の一実施形態は、矢印を含むチャートをパンする新しい技法を含む。矢印の形には、一方向に向かう矢印といろいろな方向に向かう矢印との2つのタイプがあり得る、ということに留意されたい。前記図6は、1セットの単一方向の矢印を含むチャートを示している。このチャートにおける矢印はそれぞれ、単一方向を示している。従って、本発明のシステムの一実施形態は、これらの矢印によって示された方向に従ってパンする(図6に示したパンウィンドウ601〜604参照)。
図7は、1セットのいろいろな方向の矢印を含むプレゼンテーションチャートの状況における、本発明のシステムの一実施形態の一例の動作を示している。パンアニメーションは、入ってくる矢印が最も多い中央のボックス(702、705)から開始する。スライドは、この中央のボックス(702、705)から、入ってくる矢印が2つで出ていく矢印が2つの左側のボックス(701、704)へパンし、最後に、入ってくる矢印が2つで出ていく矢印が1つの右側のボックス(703、706)へパンする。このように、本発明の一実施形態は、矢印を用いることにより関心領域がチャートにおける他の要素とのつながりの数に基づいて格付けされる、チャートをパンする方法を用いる。
[表]
図8は、4×9の欄から成るプレゼンテーション表の状況における、本発明のシステムの一実施形態の一例の動作を示している。パンアニメーションは、タイトル(801、805)から開始して、ボックス(802、806)へ水平方向に移動し、次に、このパン領域は、ボックス(804、807)へ垂直方向に移動する。最後に、このパン領域は、表の右下部分(803、808)へ移動する。つまり、本発明のシステムの一実施形態は、タイトル及び項目に沿って表をスキミングすることにより、表のチャートをパンする方法を用いる。
[傾きセンサを用いた関心領域のナビゲーション]
本発明の別の実施形態によれば、このシステムは、ユーザ入力に対する運動センサを備えたモバイル装置及び携帯電話を用いる。例えば、NTT DoCoMo社の新しい携帯電話FOMAは、運動センサを有している(タブチ(Tabuchi),「新しい日本の携帯電話は動きを検出(New Japanese Mobile Phones Detect Motion)」,ABCニュースオンライン(ABC News online),2007年4月25日,[2007年6月19日検索],http://abcnews.go.com/Technology/wireStory?id=3078694,に記載)。また、携帯電話のカメラを用いて動きを測定することも可能であり、これは、例えば、TinyMotionシステム(ワン 外,「カメラ付き携帯電話に基づいた動作感知:インタラクション技法、アプリケーション、及び性能研究(Camera Phone Based Motion Sensing: Interaction Techniques, Applications and Performance Study)」,ACM UIST(User Interface Software and Technology) 2006,(スイス、モントルー(Montreux)),2006年10月15〜18日,に記載)において行われている。
これらの技法を用いて、本発明のシステムは、関心領域をナビゲートする新しい方法を利用する。このインタラクション(interaction)は、非常に直観的であって、図9に示されているように、ユーザは、見たいと思う関心領域の方へ装置を傾けるだけである。具体的には、この図9は、手振りの動きを利用してパン及びスキャン動画の生成を促す、本発明のシステムの一例の実施形態を示している。この図9では、ユーザは、装置901の動きを利用して、スライド904における関心領域905〜910の再生制御を促す。本発明のシステムがフォーカスする特定の関心領域は、装置の回転位置に基づいて選択される。例えば、装置901が位置903へ時計回りに回転されると、本発明のシステムによって、右下の隅にある関心領域910にフォーカスされる。装置901が位置902へ反時計回りに回転されると、左下の隅にある関心領域908にフォーカスされる。
モバイル装置が傾きセンサを用いてドキュメントにおけるリストを連続的にナビゲートする上記の非特許文献3でローロデックスの例えを用いて説明されたシステムとは異なり、関心領域を見つけ出す上記本発明の技法の少なくとも1つの実施形態は、非線形である、ということにも留意されたい。
[技術的詳細−同期化された関心領域の検出]
本発明の別の実施形態では、いくつかの入力ソース、即ち、ビデオファイル(例えば、記録された講義のGoogleVidep)、pboxのようなプレゼンテーションキャプチャ装置、又は、PowerPoint(登録商標)スライドから得られた情報を用いて、関心領域を見つけ出すことができる。ビデオファイルに関し、このシステムは、フレーム差分を用いて、スライドを単位要素として検出する。従って、オリジナルビデオは、時間単位にセグメント化されて、それぞれが、代表スライドとそれに関連付けられた音声セグメントを有する。次に、このシステムは、光学式文字認識、文字を囲んだバウンディングボックス、及び動作領域(例えば、スライド又はアニメーション内で再生するビデオクリップ)を用いて、各単位(即ち、スライド)において関心領域を見つけ出す。また、音声−テキスト認識を用いることにより、いくつかの関心領域が、音声ストリームで認識された文字とリンクされる。
pboxのような装置に関しては、入力データは、音声セグメントを伴う既にセグメント化されたスライドから成る。本実施例には、これらと同じ処理が用いられる。PowerPoint(登録商標)ファイルに関しては、このシステムは、スライドを抽出し、関心領域(例えば、文字、画像、チャート、及びメディア要素(例えば、ビデオクリップ))がもしあれば、ドキュメントオブジェクトモデルを用いて抽出する。時間情報が入手できないため、このシステムは、そのスライドに提示された情報量に基づいて、時間間隔と各スライドとを任意に関連付ける。このスライドにアニメーションが定義されている場合には、その時間が考慮される。好適な実施形態では、テキスト1行又は写真1枚がそれぞれ3秒間とされる。
[スライドに対するプレゼンタのインタラクションの検出及び追跡]
本発明のシステムの別の実施形態では、スライドに対するプレゼンタのインタラクションを用いて、活動的な関心領域の検出とパスの算出とが促される。インタラクションとしては、手振り、レーザポインタの動き、カーソルの移動、マーク、及び注釈が挙げられるが、これらに限定されない。スライドに対する手振りは、非常によく行われるものであり、非公式試験において、1週間に5つの講義を観察したところ、4人の話者がスライドに対して身振り手振りを使い、1人の話者がレーザポインタを用いた。
本発明のシステムの一実施形態では、ディスプレイ前におけるインタラクションを、ディスプレイのスナップショットの相違を計算することによって抽出することができる。カーソルの移動、マーク、及び注釈は、PowerPointから(登録商標)、又は、プレゼンタのコンピュータシステム103のオペレーティングシステムのAPIを用いて、より正確に得ることができる。
図10は、手振りの動きを利用してパン及びスキャン動画の生成を促す、本発明のシステムの一例の実施形態を示している。この例では、連続画像1002〜1004において、プレゼンタは、手振りを用いて、プレゼンテーションスライド1001の要素1007〜1009をそれぞれ指し示している。本発明のシステムのこの実施形態は、プレゼンタの前記手振りを検出して、プレゼンテーションスライドの同じ関心領域1007〜1009に連続的にフォーカスすることにより、本発明のシステムのこの実施形態によって行われる前記フォーカス動作が、プレゼンテーションの時間の流れと同期化される。
図11は、スライド上のマーク又は注釈を利用してパン及びスキャン動画の生成を促す、本発明のシステムの一例としての実施形態を示している。この実施形態では、本発明のシステムは、プレゼンテーション中にプレゼンテーションスライド1101上にプレゼンタが付ける注釈1102を検出する。このような検出に従って、前記注釈を含む関心領域1103に、本発明のシステムによってフォーカスされる。
[関心領域間における移行]
オリジナルストリームが単位にセグメント化され、各単位において関心領域が見つけ出されると、本発明のシステムの一実施形態のビデオ作成モジュール107は、これらの単位間及び各単位内の関心領域間を移行するアニメーションを自動的に生成する。各単位は、時間間隔に対応する(例えば、1つのスライドは30秒間示される)。関心領域とタイムラインとの間におけるマッピングが可能である場合には、このマッピングを用いて、再生中の適切な時点で、ズームイン/ズームアウトパンアニメーションに直接的にフォーカスされる。
マッピングが可能でない場合には、ズームスキャンアニメーションは、関心領域の数及び位置に合うように設定される。例えば、5行のテキストが検出され、そのセグメントの時間が30秒間である場合、アルゴリズムは、1行目の最初の文を拡大し、その行を30/5〜1秒間で走査し、2行目へ1秒間で走査し、というように最終行が示されるまで続ける。
[自動モードと手動モードとの間における移行]
ユーザは、いつでも、あらゆる利用可能なコントローラ(例えば、装置上のボタン、傾き検出器、又はタッチスクリーン)を用いて、自動再生に割り込み、異なる関心領域に手動でジャンプすることができる。1つのモードでは、音声トラックは再生を続け、ユーザが手動ナビゲーションモードを終了すると、自動再生は、その時居たであろう場所に戻り、ズームイン/ズームアウト又は走査を用いて視覚的に移行する。
[適用例−ビデオ講義の観賞]
次に、本発明のシステムの様々な実施形態の様々な適用例について説明する。第1の例では、ある日本の学生が電車通学をしている。彼は、オンラインVideoサイトにおいて、MySQLデータベース最適化に関する興味深い動画を見つける。彼は、本発明のシステムを用いて、インタラクションを必要とすることなく、その記録を見ることができる。即ち、このシステムは、オリジナルビデオストリームを自動的にセグメント化してスライドを示し、スライド内において、(例えば、話者の身振り手振り及び音声と同期化された)適切な時点で自動的にズームイン/ズームアウトする。システムが関心領域として見つけ出していない興味深い箇所が、スライド上に現れたとする。彼が携帯電話上の「次へ」を押すことにより、手動制御モードとなる。これにより、現在の関心領域がズームインされる。彼は、帰宅したら、この最適化法を試してみたいと思う。彼は、PCにおいて本発明のシステムの一実施形態を用いることにより、システムが自動的に見つけ出した関心領域と手動制御モードで自分が見つけ出した関心領域との両方をブラウズすることができる。
[注釈付きPowerPoint(登録商標)の閲覧]
第2の例では、ある会社員が、コメント及び手書き注釈の付いたPowerPoint(登録商標)プレゼンテーションが添付された電子メールを受信する。このユーザは、本発明の一実施形態のシステムが、ドキュメントのページを自動的にめくっていき、関心領域(この場合には、各スライドにおける注釈が付けられた領域)をズームイン/ズームアウトすることで、PowerPoint(登録商標)の再生を歩きながら見ることができる。
[ビデオ講義のブラウジング]
別の例では、ある学生が、来期に取る講座を探したいと思っている。彼は、Knowledge Driveによって配信されている大学のオープンコースウェアにアクセスする。彼は、本発明のシステムを用い、教師の意図(例えば、身振り手振り、注釈)及びそれに対する学生の留意(例えば、ノート取り、ブックマーク)に基づいて、評価の高いスライドをブラウズすることができる。彼が携帯電話を揺らすことにより、次から次へと動画がスキップされる。運動センサが内蔵された手動制御モードでは、携帯電話を傾けることによって、関心領域を選択することができる。
[コンピュータシステム例]
図12は、本発明の手法の一実施形態が実施され得る、コンピュータ/サーバシステム1200の一実施形態を示すブロック図である。このシステム1200は、コンピュータ/サーバプラットフォーム1201、周辺装置1202、及びネットワーク資源1203を含む。
コンピュータプラットフォーム1201は、その様々な部分の間にわたって情報をやりとりするデータバス1204又はその他の通信機構と、このバス1204につながれて情報を処理したりその他の計算及び制御タスクを行ったりするプロセッサ1205とを含み得る。また、このコンピュータプラットフォーム1201は、バス1204につながれて、様々な情報及びプロセッサ1205によって実行される命令を記憶する、揮発性記憶装置1206(例えば、ランダムアクセスメモリ(RAM)、又はその他の動的記憶装置)も含む。この揮発性記憶装置1206は、プロセッサ1205が命令を実行する間、一時的数値変数又はその他の中間情報を記憶するのに用いられてもよい。更に、コンピュータプラットフォーム1201は、バス1204につながれて、静的情報及びプロセッサ1205(例えば、基本入出力システム(BIOS))に対する命令並びに様々なシステム構成パラメータを記憶する、読出し専用メモリ(ROM若しくはEPROM)1207又はその他の静的記憶装置も含み得る。永続性記憶装置1208(例えば、磁気ディスク、光ディスク、又は固体フラッシュメモリ素子)が設けられてバス1204につながれており、情報及び命令を記憶する。
コンピュータプラットフォーム1201は、バス1204を介して、ディスプレイ1209(例えば、ブラウン管(CRT)、プラズマディスプレイ、又は液晶ディスプレイ(LCD))につながれて、システム管理者又はこのコンピュータプラットフォーム1201のユーザに情報を表示してもよい。英数字キー及びその他のキーを含む入力装置1210が、バス1204につながれており、選択された情報及びコマンドをプロセッサ1205に伝達する。別のタイプのユーザ入力装置として、カーソル制御装置1211(例えば、マウス、トラックボール、又はカーソル方向キー)があり、この装置は、選択された方向情報及びコマンドをプロセッサ1205に伝達すると共に、ディスプレイ1209上におけるカーソル移動を制御する。一般的に、この入力装置は、2つの軸(即ち、第1の軸(例えば、x)及び第2の軸(例えば、y))において自由度2を有し、これにより、平面において位置を特定することができる。
外部記憶装置1212をコンピュータプラットフォーム1201にバス1204を介して接続し、コンピュータプラットフォーム1201に追加の若しくはリムーバブルの記憶容量を提供してもよい。コンピュータシステム1200の一実施形態では、このリムーバブル外部記憶装置1212を用いて、他のコンピュータシステムとデータを交換しやすくし得る。
本発明は、本明細書中に説明した技法を実施するための、コンピュータシステム1200の使用法に関する。一実施形態において、本発明のシステムは、コンピュータプラットフォーム1201のような装置に備えられ得る。本発明の一実施形態によれば、本明細書中に説明した技法は、コンピュータシステム1200が、プロセッサ1205に応答して、揮発性メモリ1206に収容されている1つ以上の命令のうちの1つ以上のシーケンスを実行することにより行われる。このような命令は、別のコンピュータ可読媒体(例えば、永続性記憶装置1208)から揮発性メモリ1206に読み込まれてもよい。このように揮発性メモリ1206に収容されている命令のシーケンスを実行することにより、プロセッサ1205は、本明細書中に説明した処理ステップを行う。別の実施形態では、ソフトウェア命令の代わりに又はソフトウェア命令と組み合わせて配線回路を用いて、本発明を実施してもよい。従って、本発明の実施形態は、ハードウェア回路とソフトウェアとのいずれの特定の組み合わせにも限定されない。
本明細書中で用いる「コンピュータ可読媒体」という言葉は、実行するための命令をプロセッサ1205に提供することに関与するあらゆる媒体を指す。このコンピュータ可読媒体は、本明細書中に説明したあらゆる方法及び/又は技法を実施するための命令を保持し得る機械可読媒体の一例にすぎない。このような媒体は、多数の形態を取ってよく、例えば、不揮発性媒体、揮発性媒体、及び伝送媒体が挙げられるが、これらに限定されない。不揮発性媒体としては、光ディスク又は磁気ディスク(例えば、永続性記憶装置1208)が挙げられる。揮発性媒体としては、動的メモリ(例えば、揮発性記憶装置1206)が挙げられる。伝送媒体としては、同軸ケーブル、銅線、及び光ファイバー(例えば、データバス1204を構成するワイヤ)が挙げられる。また、伝送媒体は、電波及び赤外線データ通信中に発生するような、音波又は光波の形態を取ってもよい。
コンピュータ可読媒体の一般的な形態としては、例えば、フロッピー(登録商標)ディスク、フレキシブルディスク、ハードディスク、磁気テープ、その他あらゆる磁気媒体、CD−ROM、その他あらゆる光媒体、パンチカード、紙テープ、孔パターンを備えたその他あらゆる物理的媒体、RAM、PROM、EPROM、フラッシュEPROM、フラッシュドライブ(登録商標)、メモリカード、その他あらゆるメモリチップ若しくはカートリッジ、これから説明する搬送波、又は、コンピュータが読み取ることのできるその他あらゆる媒体が挙げられる。
実行する1つ以上の命令のうちの1つ以上のシーケンスをプロセッサ1205に搬送するのに、様々な形態のコンピュータ可読媒体を用いてもよい。例えば、命令は、まず、リモートコンピュータから磁気ディスクに搬送され得る。或いは、リモートコンピュータが、その動的メモリに命令をロードし、モデムを用い電話回線を介してこの命令を送信してもよい。コンピュータシステム1200内のモデムは、この電話回線上のデータを受信し、赤外線送信機を用いてこのデータを赤外線信号に変換することができる。赤外線検出器が、赤外線信号で搬送されたこのデータを受信し、適切な回路が、このデータをデータバス1204上に置くことができる。バス1204は、このデータを揮発性記憶装置1206に搬送し、プロセッサ1205は、この揮発性記憶装置1206から命令を読み出して実行する。揮発性メモリ1206によって受信されたこの命令は、任意で、プロセッサ1205が実行する前或いは実行した後に、永続性記憶装置1208に記憶されてもよい。また、この命令は、当業界では周知の様々なネットワークデータ通信プロトコルを用い、インターネットを介してコンピュータプラットフォーム1201にダウンロードされてもよい。
コンピュータプラットフォーム1201は、データバス1204につながれたネットワークインタフェースカード1213のような通信インタフェースも含む。この通信インタフェース1213は、ローカルネットワーク1215に接続されたネットワークリンク1214につなぐ双方向データ通信をもたらす。例えば、この通信インタフェース1213は、対応するタイプの電話回線へのデータ通信接続をもたらす、総合デジタル通信網サービス(ISDN)カード又はモデムであってよい。また、別の例として、この通信インタフェース1213は、互換LANへのデータ通信接続をもたらす、ローカルエリアネットワークインタフェースカード(LANNIC)であってもよい。ネットワークの実施には、更に、周知の802.11a、802.11b、802.11g、及びブルートゥース(Bluetooth(登録商標))のような、無線リンクを用いてもよい。このような実施例のいずれにおいても、通信インタフェース1213は、様々なタイプの情報を表すデジタルデータストリームを搬送する、電気信号、電磁信号、又は光信号を送受信する。
ネットワークリンク1214は、一般的に、1つ以上のネットワークを介して、他のネットワーク資源へのデータ通信をもたらす。例えば、このネットワークリンク1214は、ローカルネットワーク1215を介して、ホストコンピュータ1216又はネットワーク記憶装置/サーバ1222に接続し得る。更に又は或いは、このネットワークリンク1214は、ゲートウェイ/ファイアウォール1217を介して、広域若しくはグローバルネットワーク(例えば、インターネット)1218に接続し得る。従って、コンピュータプラットフォーム1201は、インターネット1218上のいずれの位置にあるネットワーク資源(例えば、遠隔ネットワーク記憶装置/サーバ1219)にもアクセスすることができる。一方、コンピュータプラットフォーム1201も、ローカルエリアネットワーク1215及び/又はインターネット1218上のいずれの位置にあるクライアントによってもアクセスされ得る。ネットワーククライアント1220及び1221自体は、コンピュータプラットフォーム1201に類似したコンピュータプラットフォームに基づいて実施され得る。
ローカルネットワーク1215及びインターネット1218はいずれも、デジタルデータストリームを搬送する電気信号、電磁信号、又は光信号を用いる。様々なネットワークを介する信号、並びに、コンピュータプラットフォーム1201とデジタルデータをやりとりするネットワークリンク1214上の及び通信インタフェース1213を介する信号は、情報を輸送する搬送波の例としての形態である。
コンピュータプラットフォーム1201は、インターネット1218及びLAN1215並びにネットワークリンク1214及び通信インタフェース1213を含む様々なネットワークを介して、プログラムコードを含むメッセージやデータを送受信することができる。インターネットの例において、コンピュータプラットフォーム1201は、ネットワークサーバとして機能する場合、インターネット1218、ゲートウェイ/ファイアウォール1217、ローカルエリアネットワーク1215、及び通信インタフェース1213を介して、クライアント1220及び/又は1221で稼動するアプリケーションプログラムに対して要求されたコード若しくはデータを送信する。同様にして、コンピュータプラットフォーム1201は、他のネットワーク資源からコードを受信する。
この受信コードは、受信されたら、プロセッサ1205によって実行されてもよいし、且つ/或いは、後で実行するために、永続性記憶装置1208若しくは揮発性記憶装置1206又はその他の不揮発性記憶装置に記憶されてもよい。このように、コンピュータプラットフォーム1201は、搬送波の形態でアプリケーションコードを取得し得る。
本発明は、いずれの特定のファイアウォールシステムにも限定されない、ということに留意されたい。本発明の方策に基づいたコンテンツ処理システムは、3つのファイアウォール動作モード(具体的には、NATモード、ルートモード、透過モード)のいずれにおいて用いられてもよい。
最後に、当然のことながら、本明細書中に説明した処理及び技法は、本質的にはいずれの特定装置にも関連せず、あらゆる適切な構成要素の組み合わせによって実施され得る。更に、本明細書中に説明した教示に従って、様々なタイプの汎用装置を用いてもよい。また、本明細書中に説明した方法ステップを行うように特殊化された装置を構成することも有益であろう。本発明を特定の例に関して説明してきたが、これらの例は、全ての点において限定ではなく例示を意図している。本発明を実施するのに、ハードウェア、ソフトウェア、及びファームウェアの多数の異なる組み合わせが適していることは、当業者には認められるであろう。例えば、本明細書中に説明したソフトウェアは、多種多様なプログラミング若しくはスクリプト言語(例えば、アセンブラ、C/C++、パール、シェル、PHP、Java(登録商標)など)で実施され得る。
更に、本明細書を考察してここに開示した本発明を実施することにより、当業者には、本発明の他の実施例が明らかとなるであろう。このデータ複製機能を備えたコンピュータ記憶システムには、ここに説明した実施形態の様々な態様及び/又は構成要素を単独で或いはあらゆる組み合わせで用いてもよい。本明細書及びここに挙げた実施例は、単なる例と見なすことが意図されており、本発明の真の範囲及び精神は、添付の特許請求の範囲により示されている。
100 システム
102 プロジェクタ
103 コンピュータ
104 カメラ
105 マイク
108 提示装置
111 情報
200 動作シーケンス
301、401、501 プレゼンテーションスライド
904、1001、1101 プレゼンテーションスライド
302、303 フォーカス部分
402、404 文字
502〜504 パン及びスキャンパス
601〜604 パンウィンドウ
701〜706、801〜808 ボックス
901 モバイル装置
902、903 位置
905〜910、1007〜1009、1103 関心領域
1002〜1004 連続画像
1102 注釈
1200 コンピュータシステム
1201 コンピュータプラットフォーム
1202 周辺装置
1203 ネットワーク資源
1214 ネットワークリンク

Claims (6)

  1. プレゼンテーションを再生したコンテンツ表現を作成する方法であって、
    キャプチャモジュールが、プレゼンタによって提供された前記プレゼンテーションを取り込み、
    プレゼンテーション分析モジュールが、前記プレゼンテーションにおける関心領域を分析して識別し、
    前記プレゼンテーション分析モジュールが、前記関心領域が変化する順序を、前記プレゼンテーションに含まれるオブジェクトが示す方向に従って識別し、
    ビデオ作成モジュールが、識別された前記プレゼンテーションにおける前記関心領域および前記順序に基づいて、識別された前記プレゼンテーションにおける前記識別された順序に従って変化する前記関心領域にフォーカスをしたプレゼンテーションの時間単位コンテンツ表現を作成する、
    ことを含むことを特徴とする、方法。
  2. 前記プレゼンテーションが、1セットの少なくとも1つの矢印を含むチャートを含み、
    識別された前記プレゼンテーションにおける前記関心領域が前記矢印によって示された方向を辿るように、前記順序が識別されることを特徴とする、請求項1に記載の方法。
  3. 前記チャートが、それぞれが1セットのいろいろな方向の矢印を有する複数の要素を含み、
    前記複数の要素の各要素と関連付けられた矢印の数に基づいて前記順序が識別されることを特徴とする、請求項2に記載の方法。
  4. モバイル装置が、ユーザによって用いられる前記モバイル装置の位置方向を検出し、前記プレゼンテーションの少なくとも一部を表示する、ことを更に含み、
    前記プレゼンテーション分析モジュールが、前記プレゼンテーションにおける前記関心領域を、検出された前記位置方向に基づいて識別する、
    ことを特徴とする、請求項1〜3の何れか1項に記載の方法。
  5. コンピュータを、
    プレゼンタによって提供されたプレゼンテーションを取り込むキャプチャモジュール、
    前記プレゼンテーションにおける関心領域を分析して識別すると共に、前記関心領域が変化する順序を、前記プレゼンテーションに含まれるオブジェクトが示す方向に従って識別するプレゼンテーション分析モジュール、及び
    識別された前記プレゼンテーションにおける前記関心領域および前記順序に基づいて、識別された前記プレゼンテーションにおける前記識別された順序に従って変化する前記関心領域にフォーカスをしたプレゼンテーションの時間単位コンテンツ表現を作成するビデオ作成モジュール
    として機能させるための、プレゼンテーションを再生したコンテンツ表現を作成するプログラム。
  6. プレゼンタによって提供されたプレゼンテーションを取り込むキャプチャモジュールと、
    前記プレゼンテーションにおける関心領域を分析して識別すると共に、前記関心領域が変化する順序を、前記プレゼンテーションに含まれるオブジェクトが示す方向に従って識別するプレゼンテーション分析モジュールと、
    識別された前記プレゼンテーションにおける前記関心領域および前記順序に基づいて、識別された前記プレゼンテーションにおける前記識別された順序に従って変化する前記関心領域にフォーカスをしたプレゼンテーションの時間単位コンテンツ表現を作成するビデオ作成モジュールと、
    を備えた、プレゼンテーションを再生したコンテンツ表現を作成するシステム。
JP2013001018A 2007-10-25 2013-01-08 コンテンツ表現を作成する、方法、プログラム、及びシステム Expired - Fee Related JP5556911B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/924,554 2007-10-25
US11/924,554 US20090113278A1 (en) 2007-10-25 2007-10-25 System and methods for generating automatic and user-controllable movies of presentations on small devices

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2008266112A Division JP2009123197A (ja) 2007-10-25 2008-10-15 方法、プログラム、及びコンピュータ化されたシステム

Publications (2)

Publication Number Publication Date
JP2013101657A JP2013101657A (ja) 2013-05-23
JP5556911B2 true JP5556911B2 (ja) 2014-07-23

Family

ID=40584479

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2008266112A Pending JP2009123197A (ja) 2007-10-25 2008-10-15 方法、プログラム、及びコンピュータ化されたシステム
JP2013001018A Expired - Fee Related JP5556911B2 (ja) 2007-10-25 2013-01-08 コンテンツ表現を作成する、方法、プログラム、及びシステム

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2008266112A Pending JP2009123197A (ja) 2007-10-25 2008-10-15 方法、プログラム、及びコンピュータ化されたシステム

Country Status (2)

Country Link
US (1) US20090113278A1 (ja)
JP (2) JP2009123197A (ja)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8977958B2 (en) * 2007-11-20 2015-03-10 Microsoft Technology Licensing, Llc Community-based software application help system
US20090132920A1 (en) * 2007-11-20 2009-05-21 Microsoft Corporation Community-based software application help system
US8510252B1 (en) * 2007-12-07 2013-08-13 Google, Inc. Classification of inappropriate video content using multi-scale features
US9177285B2 (en) * 2008-05-06 2015-11-03 Fuji Xerox Co., Ltd. Method and system for controlling a space based on media content
US20100118037A1 (en) * 2008-09-08 2010-05-13 Apple Inc. Object-aware transitions
KR20100053186A (ko) * 2008-11-12 2010-05-20 삼성전자주식회사 썸네일 생성 방법 및 화상형성장치
US20100218100A1 (en) * 2009-02-25 2010-08-26 HNTB Holdings, Ltd. Presentation system
TWI411982B (zh) * 2009-11-11 2013-10-11 Univ Nat Cheng Kung 提供地圖式課程整合之網路學習系統及平台伺服器
US20110176747A1 (en) * 2010-01-15 2011-07-21 Dumitru Dan Mihai Method and portable electronic device for processing
US8918737B2 (en) 2010-04-29 2014-12-23 Microsoft Corporation Zoom display navigation
US8331760B2 (en) 2010-06-02 2012-12-11 Microsoft Corporation Adaptive video zoom
CA3085121A1 (en) * 2010-06-15 2012-12-22 Scholarbox, Inc. Method, system and user interface for creating and displaying of presentations
WO2012053002A1 (en) * 2010-10-18 2012-04-26 Tata Consultancy Services Limited Multimedia presentation content synthesis
JP5910222B2 (ja) * 2012-03-23 2016-04-27 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
US8943020B2 (en) * 2012-03-30 2015-01-27 Intel Corporation Techniques for intelligent media show across multiple devices
US9933921B2 (en) 2013-03-13 2018-04-03 Google Technology Holdings LLC System and method for navigating a field of view within an interactive media-content item
EP3022934A1 (en) * 2013-07-19 2016-05-25 Google Technology Holdings LLC Small-screen movie-watching using a viewport
WO2015009865A1 (en) * 2013-07-19 2015-01-22 Google Inc. Visual storytelling on a mobile media-consumption device
US9779480B2 (en) 2013-07-19 2017-10-03 Google Technology Holdings LLC View-driven consumption of frameless media
US9226137B2 (en) 2013-09-30 2015-12-29 Qualcomm Incorporated Method and apparatus for real-time sharing of multimedia content between wireless devices
US9179096B2 (en) 2013-10-11 2015-11-03 Fuji Xerox Co., Ltd. Systems and methods for real-time efficient navigation of video streams
US9851868B2 (en) * 2014-07-23 2017-12-26 Google Llc Multi-story visual experience
US10341731B2 (en) * 2014-08-21 2019-07-02 Google Llc View-selection feedback for a visual experience
GB201516553D0 (en) 2015-09-18 2015-11-04 Microsoft Technology Licensing Llc Inertia audio scrolling
GB201516552D0 (en) * 2015-09-18 2015-11-04 Microsoft Technology Licensing Llc Keyword zoom
US11321667B2 (en) * 2017-09-21 2022-05-03 International Business Machines Corporation System and method to extract and enrich slide presentations from multimodal content through cognitive computing
US10873709B2 (en) * 2018-07-10 2020-12-22 Fuji Xerox Co., Ltd. Systems and methods for automatic detection and insetting of digital streams into a 360-degree video
CN109324735A (zh) * 2018-08-23 2019-02-12 珠海格力电器股份有限公司 一种屏幕截图的方法及装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3826604B2 (ja) * 1998-10-16 2006-09-27 富士ゼロックス株式会社 プレゼンテーション資料のシナリオ生成装置およびシナリオ生成方法
US7330875B1 (en) * 1999-06-15 2008-02-12 Microsoft Corporation System and method for recording a presentation for on-demand viewing over a computer network
WO2002047034A1 (fr) * 2000-12-04 2002-06-13 Rice Village L.L.C Dispositif de production d'informations de commande d'affichage d'image, procede d'affichage d'image et affichage d'image
US7085842B2 (en) * 2001-02-12 2006-08-01 Open Text Corporation Line navigation conferencing system
US7356763B2 (en) * 2001-09-13 2008-04-08 Hewlett-Packard Development Company, L.P. Real-time slide presentation multimedia data object and system and method of recording and browsing a multimedia data object
JP2005208292A (ja) * 2004-01-22 2005-08-04 Canon Inc 音声認識機能付き情報提示装置
US7707039B2 (en) * 2004-02-15 2010-04-27 Exbiblio B.V. Automatic modification of web pages
US8713418B2 (en) * 2004-04-12 2014-04-29 Google Inc. Adding value to a rendered document
FR2878641B1 (fr) * 2004-11-26 2007-07-06 Eastman Kodak Co Procede de navigation automatique contrainte vers des regions d'interet d'une image

Also Published As

Publication number Publication date
US20090113278A1 (en) 2009-04-30
JP2009123197A (ja) 2009-06-04
JP2013101657A (ja) 2013-05-23

Similar Documents

Publication Publication Date Title
JP5556911B2 (ja) コンテンツ表現を作成する、方法、プログラム、及びシステム
JP6237386B2 (ja) 映像ストリームをナビゲートするシステム、方法及びプログラム
US11537267B2 (en) Method and device for search page interaction, terminal and storage medium
JP6972743B2 (ja) オンライン会話ストリームに文書対話を持ち込むためのシステムおよび方法、コンピュータに実装された方法、プログラム、及びコンピュータ化システム
US9977584B2 (en) Navigating media playback using scrollable text
KR20220058857A (ko) 학습 상황 분석 방법 및 장치, 전자 기기 및 기억 매체, 컴퓨터 프로그램
US8108776B2 (en) User interface for multimodal information system
US20080079693A1 (en) Apparatus for displaying presentation information
US20070002077A1 (en) Methods and System for Providing Information Services Related to Visual Imagery Using Cameraphones
WO2022193597A1 (zh) 界面信息切换方法及装置
JP2004266831A (ja) ライブのおよび記録されたマルチメディアドキュメントをブックマークするシステムと方法
EP2891119A2 (en) Mobile video conferencing with digital annotation
JP2007006473A (ja) ディジタル情報を注釈するためのシステム、方法及び該方法を実行させる命令を記憶する記憶媒体
US11922694B2 (en) Systems and methods for augmented reality application for annotations and adding interfaces to control panels and screens
JP6337907B2 (ja) 表示制御装置、表示制御方法およびプログラム
US9558784B1 (en) Intelligent video navigation techniques
JP2009123199A (ja) メディアをリンクするためのシステム、方法、及び、プログラム
US9564177B1 (en) Intelligent video navigation techniques
KR101123370B1 (ko) 휴대단말용 객체기반 콘텐츠 제공방법 및 장치
JP2005352933A (ja) 表示装置、システムおよび表示方法
US20170110156A1 (en) System and method for collaborative annotations of streaming videos on mobile devices
JP4543694B2 (ja) コミュニケーションシステム、コミュニケーションシステムのサーバー、及びサーバーの処理方法
CN103838809A (zh) 信息处理设备、信息处理方法以及程序
CN113553466A (zh) 页面展示方法、装置、介质和计算设备
US10915778B2 (en) User interface framework for multi-selection and operation of non-consecutive segmented information

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131031

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131112

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140204

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140318

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140507

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140520

R150 Certificate of patent or registration of utility model

Ref document number: 5556911

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees