JP2008522309A - 関連コンテンツの抽出における時間類似性閾値の適応化 - Google Patents

関連コンテンツの抽出における時間類似性閾値の適応化 Download PDF

Info

Publication number
JP2008522309A
JP2008522309A JP2007543975A JP2007543975A JP2008522309A JP 2008522309 A JP2008522309 A JP 2008522309A JP 2007543975 A JP2007543975 A JP 2007543975A JP 2007543975 A JP2007543975 A JP 2007543975A JP 2008522309 A JP2008522309 A JP 2008522309A
Authority
JP
Japan
Prior art keywords
time
content item
candidate
difference
threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007543975A
Other languages
English (en)
Inventor
エム アー ディーデリクス,エルモ
デ スライス,バルテル エム ファン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2008522309A publication Critical patent/JP2008522309A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

類似するコンテンツアイテム又は文書の抽出が、生成又は使用時間などの関連する時間の類似性に基づき提供される。データベースなどにおける1以上の特定されたアンカー文書の時間が、時間メタデータを抽出することによって決定される。その後、第1閾値が、ベース時間又は現在の時間とアンカーアイテム時間との間で決定される基準時間差に基づき設定される。候補となる文書アイテム時間が特定され、候補となるコンテンツアイテムの時間メタデータが抽出されるかもしれない。ベース時間と候補時間との間の時間差が、候補時間差として決定されるかもしれない。候補となるコンテンツアイテムが、第1候補時間差と第1閾値とに基づく抽出について類似しているとして選択されるかもしれない。閾値を設定するための決定された粒度の基準時間差の概念が提供される。

Description

本発明は、コンテンツの抽出、管理及び提示の分野に関し、時間使用及びメタデータに基づくコンテンツアイテム類似性閾値の決定に関する。
近年、パーソナルコンピュータ上のハードドライブと他のタイプの記憶媒体を含む記憶装置及びデータベースの記憶容量は急速に増大してきている。ある予想では、記憶容量は毎年ほぼ2倍となり、ネットワーク帯域幅もまた大変急速に増大してきている。この結果、記憶装置は、それへのユーザアクセスが実現される必要があるより大量のコンテンツを格納している。ユーザは、記憶装置又はデータベース上、さらにユーザ自らのハードドライブ上に格納されているコンテンツに圧倒される可能性があり、コンテンツがユーザにとって便利なアクセスを提供するよう何れかの方法により管理又は整理されていない場合、インターネットなどのネットワーク上で利用可能なコンテンツを抽出することができないかもしれない。ユーザに透過な方法によりインデックス処理又は整理されていないコンテンツは、ユーザニーズに関する限り“欠落”してしまうかもしれず、抽出されないかもしれない。
多くのデータ抽出スキームが知られている。Farnhamらの米国特許出願公報第2003/0158855号は、コンピュータファイル間の数値として表される類似度が決定されるように、関連付けがオブジェクト又はメタデータの間で動的に生成される自動的なコンテクストの関連付けについて開示している。Stublerらの米国特許出願公報第2002/0188602号は、取得した画像のメタデータを抽出することによって、格納されている画像と取得した画像との類似性に基づき、取得した画像のキャプション又はセマティックラベルの生成について開示している。Plattの米国特許出願公報第2003/0221541号は、“所望されないシード(undesirable seed)”楽曲を含む複数のシード楽曲がプレイリスト上の楽曲を生成するのに使用される自動プレイリスト生成装置を開示している。Clutsの米国特許第5,616,876号は、エディタにより以前に書き込まれた各楽曲の“スタイルラベル”に基づき、第1楽曲セットと同様のさらなる楽曲を選択することを開示している。Gargiの米国特許出願公報第2004/0098362号は、生成時間を含む文書メタデータの自動的な伝搬について開示している。しかしながら、上記参考文献の何れも、ターゲットアイテムの選択又は拒絶における時間類似性に対して閾値を設定することについて開示していない。Princeの米国特許出願公報第2002/0099696号は、類似度にスコアが与えられ、抽出されるアイテムを選択するのに閾値が使用されるファジーデータベース抽出を開示している。しかしながら、Princeもその他の参考文献も、ベース時間に基づく閾値の設定について、またベース時間と特定されたアイテム時間との間の時間差に基づく閾値の設定については開示も示唆もされていない。
もちろんユーザがコンテンツアイテムを抽出することは可能であるが、特に所望のコンテンツのコンテンツタイプがユーザによって指定されず、又は知られていない場合、類似するアイテムを特定しようとすることは時間がかかり面倒な作業となる可能性がある。さらに、コンテンツアイテムがユーザにより制御される記憶装置又はデータベースに蓄積し続けるに従って、コンテンツアイテムを抽出する作業はさらに困難となる。
抽出システムの機能を実現又は実行する方法、システム、デバイス、装置及びコンピュータ可読媒体が提供される。
選択された候補となるコンテンツアイテムが提供される。ベース時間が決定される。このようなベース時間は、例えば、現在の時間であってもよい。第1時間は、第1の特定されたコンテンツアイテムの時間データを抽出することによって特定される。その後、第1閾値が、ベース時間と第1時間との間で決定される基準時間差に基づき設定されてもよい。候補となる時間が特定され、候補となるコンテンツアイテムの時間データが抽出される。ベース時間と第1の候補となる時間との間の差が、候補となる差として決定されてもよい。候補となるコンテンツアイテムが、データベースの整理のため、又は第1の候補となる時間差と第1閾値とに基づく抽出のため、類似として選択されてもよく、選択された候補となるコンテンツの選択信号がこれに応じて出力される。
閾値を設定するための時間決定された粒度の時間差の概念が提供され、これに従って、差分粒度はベース時間からさらに離れた時間に対してより、ベース時間により近い時間に対して大きなものとなるように設定される。
さらに、基準時間差に基づく第2閾値が設定されてもよく、第1閾値と一緒に第2閾値はある範囲を有し、第1の候補となる時間差が当該範囲内である場合、候補となるコンテンツアイテムが選択される。
第1時間は、コンテンツアイテム取得時間、コンテンツアイテムの直近の使用時間、又はコンテンツアイテムが最もよく使用される時間を含むかもしれない。この時間は、コンテンツアイテムベース時間、コンテンツアイテム直近変更時間、又はコンテンツアイテム生成時間であってもよい。
さらなる特定されたコンテンツアイテムが特定されてもよく、第1閾値がまたこれらの決定された基準時間差に基づき設定可能となるように、時間及び差分が決定される。
以下の説明及び上記図面は、発明者によって現在最も良く理解されるような出願人の発明の実施例を記載するが、本発明の多くの改良が可能であり、本発明が、本発明の趣旨から逸脱することなく他の形式により実現され、また他の方法により実現されてもよいということが理解されるであろう。さらに、記載される実施例のいくつかの特徴は、本発明の趣旨から逸脱することなく、省略され、選択的に若しくは全体的に他の実施例と組み合わされ、又は他の実施例若しくはその一部の特徴を置換するのに利用されてもよい。従って、図面及び詳細な説明は、本発明のいくつかの側面の例示的な説明として解釈されるべきものであり、本発明の範囲を限定するものと解釈されるべきでない。
図1に示されるように、抽出システム1−1は、後述されるいくつかのモジュールを有している。抽出システム1−1のモジュール、その一部及び/又は抽出システム全体は、ハードウェア、ソフトウェア、ファームウェア又は上記の組み合わせから構成可能であるが、一部のモジュールがハードウェアなどから構成され、他のモジュールがソフトウェア、ファームウェア又はそれらの組み合わせから構成されるようにしてもよい。
抽出システムのすべてのモジュールが同一の装置に配置又は統合されている必要はないということが理解されるであろう。分散化されたアーキテクチャはまた、既存の装置によって提供される適切なモジュールから“ピギーバック(piggy−back)”する抽出システムについて考えられる。
以下の説明は、有線又は無線接続を介しデータベース1−2に物理的に一体化又は接続される抽出システム1−1について言及する。クロック(図示せず)はまた、抽出システム1−1に統合又は接続されてもよい。データベース1−2は、パーソナルコンピュータ、パーソナルビデオレコーダ、エンターテイメントシステム、エレクトロニックオーガナイザ、パーソナル携帯装置、Jazドライブのハードドライブなどの記憶装置により実現されてもよく、又はディスクドライブなどの商用の記憶装置として実現されてもよい。データベース1−2は、このような装置の2以上におけるコンテンツアイテムの整理又はグループ化が可能となるように、接続されるいくつかの記憶装置を含むかもしれないということは理解されるであろう。さらに、データベースは、データベース1−2にロード及びそれにより抽出可能なCD、DVD、zipディスク、フロッピー(登録商標)ディスク、データカートリッジなどを含むディスクなどの1以上の記憶媒体を含むものであると理解されるかもしれない。しかしながら、抽出システム1−1はまた、LAN、WAN、インターネットなどのネットワーク1−9を介しコンテンツを抽出することが可能であるということが理解されるであろう。
図1に示されるように、抽出システム1−1は、コンテンツアイテムから特定のタイプのデータを収集するモジュールである時間データ抽出装置1−11を含む。コンテンツアイテムは、ビデオ、ビデオクリップ、ムービー、フォト、テキストファイル、音楽データ、オーディオファイル、又はJPEGファイルやXMLデータなどの他のタイプのマルチメディアデータであってもよい。例えば、ビデオは、デジタルビデオレコーダ上のホームビデオショットであってもよく、ムービーは、MPEG(MPEG−2、MPEG−3などを含む)として符号化されたフィルムなどの市販のフィルムデータであってもよく、フォトは、デジタル写真データ、写真又は写真アルバム群であってもよい。テキストファイルは、ワープロにより生成されたファイル、スプレッドシート、又はコンピュータコードファイルであってもよい。音楽データは、MP3ファイルなどであってもよい。
時間データ抽出装置1−11によって抽出される記述データは、コンテンツアイテムに関する使用データ又はメタデータなどの情報を含む。このような情報はまた、アイテムの生成時間、アイテムの取得時間、コンテンツアイテムの最後の/最初の/2番目などの再生及び/又は編集時間、最もよく使用される時間、例えば、当該アイテムは午後8時頃に、1週間、1月又は1年の所与の日に主として使用され、又は夜によく使用されるなどのコンテンツアイテムの時間データを含むものであってもよい。ここで使用される“主として”とは、平均使用時間、メディアン使用時間、使用時間のモードなどに基づくものであってもよい。このような使用履歴データは、ときにはメタデータとして知られるかもしれず、他方、メタデータのタイプはときには使用履歴データと呼ばれる。
ここに記載される時間情報は、1つ又は多くの当該類似性特徴であるかもしれず、又はそれは唯一の又は最も重要な特徴であるかもしれない。このようなファクタは、(そうであったとしても)重み付けされる程度は、ユーザニーズとアプリケーションに依存するであろう。
アイテムに関するこのような記述データは、アイテムから、インデックス又はデータベース管理ファイルから、インターネット1−9との有線又は無線接続を介し抽出システム1−1に接続されるワールドワイドウェブなどの外部ソースからを含む各種方法により配置及び抽出されてもよいということが理解されるであろう。
特定されたコンテンツアイテムは、いくつかの方法の1つにより特定されてもよい。ユーザは、“候補となるコンテンツアイテム”とときには呼ばれる他のアイテムがそれに基づき抽出されるアイテムを指定してもよい。あるいは、新たに追加又は生成されるコンテンツアイテムは、それに基づき他のアイテムが抽出される特定されたコンテンツアイテムとして自動的に指定されてもよい。
ベース時間が、ベース時間決定装置1−13により決定される。このようなベース時間は、ユーザによって入力又は設定され、以前にプログラムされ、クロック(図示せず)を参照して決定され、又はインターネット若しくは他のネットワーク又は上記の組み合わせによって決定される現在の時間であってもよい。ベース時間、特定されたコンテンツアイテムに係る時間及び候補となるコンテンツアイテムはそれぞれ、日付及び/又は時間を含むかもしれないということが理解されるであろう。いくつかのアプリケーションについて、時間のない日付で十分であり、又はより適切であるかもしれない。多くのアプリケーションについて、時間と日付の両方が使用される。このような日付情報と時間情報は、時間差計算と他の日付及び時間との比較を実現するフォーマットに変換可能であるということが理解されるであろう。
時間データ抽出装置1−11は、特定されたコンテンツアイテムに係る時間を決定し、特定されたコンテンツアイテムに係る時間とベース時間との間の時間差(すなわち、経過した時間)を決定する。この差分は、ときには第1基準時間差と呼ばれる。特定されたコンテンツアイテムに係る時間は、コンテンツアイテムにかかるメタデータを参照して、データベースインデックスによって、ワールドワイドウェブなどを含むネットワーク1−9を参照することによって、ユーザ入力を要求することによって、又は上記の組み合わせによって決定されるかもしれない。この時間差は、テーブルを参照することによって、計算によって、ユーザ入力を要求することによって、又は上記の組み合わせによって決定されてもよい。
閾値設定装置1−14は、候補となるコンテンツアイテムが選択されるため充足する必要がある閾値又は範囲を設定する。この閾値又は範囲は、第1基準時間差に基づき閾値設定装置1−14によって設定される。
候補となるコンテンツアイテム特定装置1−12は、データベースにおいて、ネットワーク接続を介し又は他のソースから、それらのメタデータ又は他の情報に関して類似し、及び/又はベース時間への第1の特定されたコンテンツアイテムの時間差に対するベース時間からのそれらの差分に基づく候補となるコンテンツアイテムを特定する。
コントローラ1−15は、抽出システム1−1の全体機能を調整し、ユーザインタフェース1−1、データベース1−2、サーバ1−9及び一般に外部とやりとりし、システム設定を処理する。
選択装置1−16は、適格性を有する候補となるコンテンツアイテムを選択し、結果出力1−17は、選択及び/又は拒絶された候補となるコンテンツアイテムについて結果信号を提供する。結果出力1−17は、ユーザ(図示せず)とのやりとりを含む、他の装置及び外部との通信とインタフェースをとる。特に、抽出結果出力1−17は、抽出システム1−1により抽出されたコンテンツアイテムをユーザインタフェースに通知する。ユーザインタフェース1−3は、独立した装置であってもよく、又はパーソナルコンピュータ、パーソナルビデオレコーダ、上述したストレージ及び他の装置の1以上などの他の装置又はシステムと統合されてもよい。
さらなる利用可能な特定されたコンテンツアイテムが存在するかもしれない。従って、当該時間メタデータ処理並びに/又は使用抽出及び時間差決定は、任意数の利用可能な特定されたコンテンツアイテム1〜N(Nは、1より大きな正の整数)に対して繰り返されるかもしれない。その後、候補となるコンテンツアイテムの選択が、このようなすべての基準時間差の平均に基づき実行される。
図1〜2を参照して、本発明の実施例の処理が説明される。上述したように、図1に示されるユーザインタフェース1−3を介しユーザによって、又はデータベース1−2の新たに追加されたコンテンツアイテム又は孤立したコンテンツアイテムを検出などすることによってシステムにより自動的に特定される。
S1において、上述したように、ベース時間決定装置1−13がベース時間を決定する。抽出システム1−1の時間データ抽出装置1−11は、図2のS2において示されるように、第1の特定されたコンテンツアイテムの第1時間データを抽出する。S2において、さらなる特定されたコンテンツアイテムが、例えば、ユーザ又はシステムがそれに基づきターゲット文書が抽出されるいくつかの“アンカー”文書を指定する場合など、同様に処理されるかもしれない。
S3において、基準時間差が、各特定されたコンテンツアイテムに対してベース時間と特定されたコンテンツアイテムの時間との間の時間差を決定することによって、時間メタデータ抽出装置1−11により決定される。S4において、そのような基準時間差は、平均的な基準時間差で到着するよう平均化されてもよい。ここで使用される平均とは、算術平均、モード又はメディアンの計算に基づき決定されるかもしれない。さらに、上記値の単純和が、選択された値の合成的な視点を提供するのに適切に選択された統計的機能と共に利用されてもよい。
S5において、閾値又は範囲が、基準時間差又は平均基準時間差に基づき設定される。例えば、1又は0の値は、ベース時間と第1の特定されたコンテンツアイテムとの間の時間差が僅かであることを示し、9又は10の値は時間差が大きいことを示すように、閾値が割り当てられてもよい。あるいは、1〜10のスケールを使用する代わりに、閾値は、例えば、“同一の時間”、“大変近い時間”、“近い時間”、“離れた時間”、“大変離れた時間”又はそのような指定などを表すものであってもよい。このような値の他の多数のスキームが、本発明の趣旨から逸脱することなく利用可能であるということは理解されるであろう。
さらに、第2閾値が同様にして選択されてもよい。第1閾値は最大時間差を表し、第2閾値は最小時間差を表し、一緒になってこれらの閾値がある範囲を構成する。候補となるアイテムは、それらの差分が当該範囲内に属する場合に限って(ベース時間と候補となるコンテンツアイテム時間との間の差分)、選択される。
S6において、図1の候補となるコンテンツアイテムの特定装置1−12は、データベースにおいて、ネットワークを介して又は何れかにおいて候補となるコンテンツアイテムを特定し、時間データ抽出装置1−11(図2)は、各候補となるコンテンツアイテムの時間データを抽出する。その後S7において、候補となるコンテンツアイテムの時間差の決定が実行される。さらなる特定されたコンテンツアイテムがまた利用可能であり、時間データを抽出し、時間差を決定する処理が、候補となるコンテンツアイテム1〜Mについて続けられる。
S8において、候補となるコンテンツアイテムの時間差は、選択装置1−16によって閾値又は範囲と対比される。その差分が閾値以下又は当該範囲内である場合、それが選択される。
例えば、ベース時間が2004年11月22日午後8時として決定され、第1の特定されたコンテンツアイテムの時間が2004年11月22日の午後6時であると決定される場合、ベース時間と第1の特定されたコンテンツアイテムとの間の差分を表す2時間の時間差が、第1基準時間差となる。この2時間の時間差に基づき、又は特定されたコンテンツアイテム1−Nから決定された基準時間差の平均に基づき、時間差閾値が、“4時間”、“同日”、“同一日数”、“近い時間差”又は“4”などとして設定される。(4は、0〜9で割り当てられた整数であり、0は実質的に同一な時間を意味し、9は大変離れた時間を意味する。)その後、候補となるコンテンツアイテムの差分が当該閾値と対比され、S8において、ベース時間からの候補となるコンテンツアイテムの時間差が4時間以内、“同日”中、“同一日数”内、“近い時間差”の範囲内、又は時間差スケールで“4”の閾値によるものである場合、候補となるアイテムが選択される。
本発明の特徴によると、差分粒度がベース時間からさらに離れた時間に対してよりもベース時間により近い時間に対して大きなものとなるように、閾値は設定される。このため、例えば、ベース時間からの距離が1〜10のスケールによりランク付けされている場合、ベース時間からの差分が増大するに従って、より大きな差分がスケールのより小さなグラデーションにより取り込まれるかもしれない。従って、基準時間差(ベース時間と特定された文書又はコンテンツアイテムとの間の差分)が1時間である場合、ベースからの候補となる差分が5時間であれば、第1の候補となるコンテンツアイテムは非類似と判断されるかもしれない。しかしながら、基準時間差が1000日である場合、ベースからの第2の候補となる差分が6000日であったとしても、第2の候補となる文書は類似と判断されるかもしれない。このような閾値は、しばしば人々は直感的により以前の時点の時間差をより最近の同じ長さの時間差ほど重要とは考えないという考えに基づくものである。すなわち、人が時間差において関連するベース時間から遠く離れるに従って、類似性を決定するのに時点間の時間差は重要でなくなる。このような閾値処理は、決定された粒度閾値処理の基準時間差と呼ばれる。
上述されるように、特定されたコンテンツアイテムの差分セットにおけるスプレッドに基づき、最大及び最小閾値を用いて、ある範囲が閾値設定装置1−14によってS5において生成されるかもしれない。従って、1つのみの特定されたコンテンツアイテムによる上述した具体例を用いて、最大閾値は記載されたようなものであり、最小閾値は、例えば、“異なる時間”、“少なくとも1時間”、大変近い時間“又は差分ランキング2”などとされる。このとき、選択されるコンテンツアイテムの範囲は、使用される閾値処理/範囲のシステムに応じて、“同日の異なる時間”、“同一期間の異なる時間”、“1〜4時間”、“時間近接した時間差の大変近い差分”、又は“2〜4”スケールであるかもしれない。
本発明の特徴によると、複数の“ベース”時間が利用可能であり、このような各ベース時間に対して、決定された粒度の基準時間差が個別に適用される。例えば、ユーザの結婚式の日付、子供の誕生日、記念日などの過去の重要なイベントの時間と実際の現在の時間が第2のベース時間となりうる。このため、粒度レベルは、ベース時間1からの差分により減少し(候補となる文書時間が過去になるほど、より多くの経過時間が類似すると考えられる)、ベース時間2からの時間差により同様に減少する。このアイデアは、例えば、ある日付に結婚式をした人にとって、第2ベース時間により近い時間差はより重要となり、このため、より高い粒度を必要とするというものである。
このような第2、第3、第L(Lは、3より大きな整数)ベース時間は、ユーザによって設定可能であるか、又は上述したベース時間を決定する方法に従ってシステムにより決定することが可能である。このため例えば、システムが、ユーザに係る文書の多く又は大きなパーセンテージ(ユーザのコンピュータ、データベース、携帯などにある文書など)が、ある時間にコンテンツアイテム時間(生成又は直近の使用日付/時間など)を有する場合、このような追加的なベース時間が設定可能である。例えば、説明のため、結婚式の写真、結婚式のビデオ、音楽、電子メールなどのコンテンツアイテムのユーザの過去の結婚式の日付に又はその近くに通常よりかなり高い集中度を示す統計関数に基づき、又は閾値を利用して、多くのコンテンツアイテムがこのようなさらなるベース時間として決定可能である。その後、基準時間差が決定可能であり、このようなさらなるベース時間に基づき、決定された粒度の基準時間差に従って閾値が設定される。
本発明の特徴によると、抽出されるコンテンツアイテムは、ユーザにより選択されたコンテンツアイテムのコンテンツタイプと異なるコンテンツタイプであってもよい。例えば、ユーザにより選択されたコンテンツアイテムが音楽ファイル、すなわち、MP3タイプである場合、抽出されたコンテンツアイテムは、写真データのコンテンツタイプであるかもしれない。このように、例えば、あるジャンルの写真が、時間類似性に基づきユーザにより選択された音楽に一致するよう抽出されるようにしてもよい。
この(又はこれらの)選択された候補となるコンテンツアイテムが、S9においてユーザ又はユーザインタフェースに提供される。データベース又はユーザインタフェース1−3に対する選択された候補となるアイテムの抽出を実行させるため、信号が直接データベース1−2に提供されてもよい。あるいは(又は加えて)、候補となるコンテンツアイテムが拒絶される場合、信号が提供されてもよい。
ユーザ(図示せず)に抽出可能なコンテンツアイテムを通知するための通知がユーザインタフェース1−3に提供されてもよい。この通知は、抽出されるコンテンツアイテムの特定、コンテンツアイテムの記述、コンテンツアイテムのURL又はリンク、コンテンツアイテム全体又はその一部の抽出、又は上記の組み合わせから構成されるかもしれない。システムはまた、データベースを整理するため、アンカーアイテムにより選択される抽出されたアイテムをグループ化するのに利用可能である。S10において、処理は終了する。
上記説明により提供された本発明の実施例は、単なる例示的な実施例として意図されている。しかしながら、本発明の範囲は請求項に与えられるということは理解されるであろう。
図1は、本発明の実施例による抽出システムの概略図である。 図2は、本発明の実施例によるシステムの処理のフローチャートである。

Claims (13)

  1. ベース時間を決定するステップと、
    第1の特定されたコンテンツアイテムの時間メタデータを第1時間として抽出するステップと、
    前記ベース時間と前記第1時間との間で決定される基準時間差に基づき第1閾値を設定するステップと、
    第1の候補となるコンテンツアイテムの時間メタデータを第1候補時間として抽出し、前記ベース時間と前記第1候補時間との間の差分を第1候補時間差として決定するステップと、
    前記第1候補時間差と前記第1閾値とに基づき前記第1候補コンテンツアイテムを選択するステップと、
    前記第1候補コンテンツアイテムが選択されると、前記第1候補コンテンツアイテムの選択信号を出力するステップと、
    を有するコンテンツアイテム抽出方法。
  2. 前記第1閾値が、決定された粒度の基準時間差に基づき設定される、請求項1記載の方法。
  3. 前記基準時間差に基づき、前記第1閾値と一緒になってある範囲を有する第2閾値を設定し、前記第1候補時間差が前記範囲内にあるとき、前記第1候補コンテンツアイテムを選択するステップをさらに有する、請求項1記載の方法。
  4. 前記第1時間と前記第1候補時間の少なくとも1つは、コンテンツアイテム取得時間、コンテンツアイテムを直近に使用した時間、コンテンツアイテムを最初に使用した時間及びコンテンツアイテムを最もよく使用する時間を有する、請求項1記載の方法。
  5. 前記第1時間と前記第1候補時間の少なくとも1つは、コンテンツアイテムの直近変更時間及びコンテンツアイテム生成時間を有する、請求項1記載の方法。
  6. 第2の特定されたコンテンツアイテムの時間メタデータを第2時間として抽出するステップと、
    前記ベース時間と前記第2時間との間の差分として決定される第2基準時間差にもまた基づき、前記第1閾値を設定するステップと、
    をさらに有する、請求項1記載の方法。
  7. ベース時間を決定するよう構成されるベース時間抽出装置と、
    第1の特定されたコンテンツアイテムの時間メタデータを第1時間として抽出し、前記ベース時間と前記第1時間との間の時間差を基準時間差として決定し、第1候補コンテンツアイテムのメタデータを第1候補時間として抽出し、前記ベース時間と前記第1候補時間との間の時間差を第1候補時間差として決定するよう構成される時間メタデータ抽出装置と、
    前記ベース時間と前記第1時間との間の差分として決定される基準時間差に基づき第1閾値を設定するよう構成される閾値設定装置と、
    前記第1候補時間差と前記第1閾値とに基づき前記第1候補コンテンツアイテムを選択するよう構成される選択装置と、
    前記第1候補時間が選択されると、前記第1候補コンテンツアイテムの選択信号を出力するよう構成される結果出力と、
    を有するコンテンツアイテム抽出システム。
  8. 前記第1閾値が、決定された粒度の基準時間差に基づき設定される、請求項7記載のシステム。
  9. 前記閾値設定装置はさらに、前記基準時間差に基づき、前記第1閾値と一緒にある範囲を有する第2閾値を設定し、
    前記選択装置は、前記第1候補時間差が前記範囲内にあるとき、前記第1候補コンテンツアイテムを選択する、請求項7記載のシステム。
  10. 前記第1時間と前記第1候補時間の少なくとも1つは、コンテンツアイテム取得時間、コンテンツアイテムを直近に使用した時間、コンテンツアイテムを最初に使用した時間及びコンテンツアイテムを最もよく使用した時間を有する、請求項7記載のシステム。
  11. 前記第1時間と前記第1候補時間の少なくとも1つは、コンテンツアイテム直近変更時間及びコンテンツアイテム生成時間を有する、請求項7記載のシステム。
  12. 前記第1時間と前記第1候補時間の少なくとも1つは、頻繁に使用される時間、ユーザにより直近に使用された時間及びユーザにより最もよく使用される時間の1つを有する、請求項7記載のシステム。
  13. 前記時間データ抽出装置は、第2の特定されたコンテンツアイテムの時間メタデータを第2時間として抽出するよう構成され、
    前記閾値設定装置は、前記ベース時間と前記第2時間との間の差分として決定される第2基準時間差にもまた基づき、前記第1閾値を設定するよう構成される、請求項7記載のシステム。
JP2007543975A 2004-12-01 2005-11-30 関連コンテンツの抽出における時間類似性閾値の適応化 Pending JP2008522309A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US63213604P 2004-12-01 2004-12-01
PCT/IB2005/053983 WO2006059293A1 (en) 2004-12-01 2005-11-30 Adaptation of time similarity threshold in associative content retrieval

Publications (1)

Publication Number Publication Date
JP2008522309A true JP2008522309A (ja) 2008-06-26

Family

ID=36169210

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007543975A Pending JP2008522309A (ja) 2004-12-01 2005-11-30 関連コンテンツの抽出における時間類似性閾値の適応化

Country Status (5)

Country Link
EP (1) EP1820125A1 (ja)
JP (1) JP2008522309A (ja)
KR (1) KR20070086805A (ja)
CN (1) CN101069180A (ja)
WO (1) WO2006059293A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008242966A (ja) * 2007-03-28 2008-10-09 Kddi Corp レコメンダシステム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102659788B1 (ko) * 2021-11-02 2024-04-23 주식회사 엠클라우독 시계열 패턴정보의 동적 변화를 이용한 맞춤형 문서 추천시스템

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2002323413A1 (en) * 2001-08-27 2003-03-10 Gracenote, Inc. Playlist generation, delivery and navigation
US6987221B2 (en) * 2002-05-30 2006-01-17 Microsoft Corporation Auto playlist generation with multiple seed songs
US6996390B2 (en) * 2002-06-26 2006-02-07 Microsoft Corporation Smart car radio
US7228054B2 (en) * 2002-07-29 2007-06-05 Sigmatel, Inc. Automated playlist generation

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008242966A (ja) * 2007-03-28 2008-10-09 Kddi Corp レコメンダシステム

Also Published As

Publication number Publication date
KR20070086805A (ko) 2007-08-27
WO2006059293A1 (en) 2006-06-08
CN101069180A (zh) 2007-11-07
EP1820125A1 (en) 2007-08-22

Similar Documents

Publication Publication Date Title
JP5015789B2 (ja) 関連コンテンツの抽出における位置類似性閾値の適応化
US10324899B2 (en) Methods for characterizing content item groups
CN100559868C (zh) 处理用户偏好的方法和***
US8117210B2 (en) Sampling image records from a collection based on a change metric
JP4643735B1 (ja) 電子機器及び映像処理方法
US8356034B2 (en) Image management apparatus, control method thereof and storage medium storing program
CN101128880A (zh) 基于通用内容id检索用于播放列表的内容项目
KR20090118752A (ko) 컨텐트 재생 목록 제공 방법 및 그 장치
US20060288042A1 (en) System and method for generating a play-list
JP5415516B2 (ja) 複数の文書からユーザが好む1つの文書を再生する方法及び装置
JP2008522311A (ja) コンテンツアイテムの関連付けに基づく自動的なコンテンツ整理
US10909999B2 (en) Music selections for personal media compositions
US9720997B2 (en) Method and apparatus for prioritizing metadata
JP2008522310A (ja) 関連コンテンツの抽出
US9665627B2 (en) Method and device for multimedia data retrieval
US20150331863A1 (en) Selection method, method for maintaining data list and electronic device
JP2008522309A (ja) 関連コンテンツの抽出における時間類似性閾値の適応化
Ushiama et al. A framework for personal content search and recommendation based on personal experiences