JP5222581B2 - 文書に注釈を付するシステムと方法 - Google Patents

文書に注釈を付するシステムと方法 Download PDF

Info

Publication number
JP5222581B2
JP5222581B2 JP2008032612A JP2008032612A JP5222581B2 JP 5222581 B2 JP5222581 B2 JP 5222581B2 JP 2008032612 A JP2008032612 A JP 2008032612A JP 2008032612 A JP2008032612 A JP 2008032612A JP 5222581 B2 JP5222581 B2 JP 5222581B2
Authority
JP
Japan
Prior art keywords
document
tag
profile
user
annotation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008032612A
Other languages
English (en)
Other versions
JP2008204454A (ja
Inventor
ホン リチャン
エイチ チー エド
ライ ピーター
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Palo Alto Research Center Inc
Original Assignee
Palo Alto Research Center Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Palo Alto Research Center Inc filed Critical Palo Alto Research Center Inc
Publication of JP2008204454A publication Critical patent/JP2008204454A/ja
Application granted granted Critical
Publication of JP5222581B2 publication Critical patent/JP5222581B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Document Processing Apparatus (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

以下は、一般に、文書に注釈を付し、その後そのような注釈を共有し、注釈付文書コレクションを探索するための方法、装置、および製造品に関連する。
ウェブページのソーシャルタグ付けを可能にするウェブサービスが今日、インターネット上で利用可能である。例えば、ヤフーのマイウェブ(MyWeb)やデリシャス(del.icio.us)などである。そのようウェブベースサービスを使用すると、ユーザは、興味あるウェブ文書(ウェブページなど)にタグを付け、ウェブ文書を共有または後で再び呼び出すことが可能である。これは、ユーザがウェブ文書をブックマークに記憶しておき、自由に選択されたタグ(またはキーワード)のセットをそのウェブ文書に付加することによって行い得る。ユーザは、自分のブックマークまたはタグを他のユーザと共有すると決めることも可能で、それらを、後で他のユーザが探索したり、ブラウズしたりすることが可能である。
ユーザが、他のユーザによって定義・共有されたタグを経由して、ブックマークに記憶されたページを発見し得ることに加えて、ソーシャルタグ付加から得られたデータは、また、文書探索を強化するのにも使用し得る。しかし、ソーシャルタグ付加システムは、タグ付けされたウェブページのコンテンツの性質(例えば、ウェブページのコンテンツがダイナミックであるとか、または、あるウェブページのコンテンツが別のウェブページのそれと同様であり得るとかの性質)を考慮しないので、限定的である。例えば、ユーザが、ウェブ文書に付いている、以前に定義され、そして他のユーザと共有されたタグをレビューし、更新しない限り、URL(ユニバーサル・リソース・ロケータ)に関連した各ユーザ指定タグは、同じままである。これは、URLで示されたウェブページの基底コンテンツのサブ文書エレメントが変化するときでさえも同様で、何故そのタグが文書に付されたかの理由が不正確になったり、あるいは全く反映されなくなったりする。
さらに、利用可能なソーシャルタグ付加システムは、公開ウェブ文書間の類似性を考慮していない。例えば、相異なるウェブサイトが同一または極めて類似のニュース記事を公開することもあり得る。この場合、利用可能なソーシャルタグ付加システムは、相異なるウェブ文書の公開コンテンツ間の類似性が考慮しないので、タグを同様なコンテンツに伝搬するようには適応していない。タグを付けた情報をそのように伝搬していければ、同様なコンテンツで公開された情報にタグを付けるユーザの努力が、有利に簡素化される筈である。また、利用可能なソーシャルタグ付加システムは、ウェブブラウザ(またはリーダ)内で統合が行われていない。その代わり、利用可能なソーシャルタグ付けシステムでは、ユーザは、現在読んでいるウェブ文書とは独立なウェブページにアクセスする必要がある。相互運用性をそのように欠いているので、ウェブ文書に対してタグを新たに付加したり、またはレビューしたりしているとき同時にそのウェブ文書を参照するというユーザ能力が損なわれている。
米国特許第6,360,951号
従って、サブ文書エレメント(ウェブ文書のパラグラフなど)のその場(in situ)タグ付加と、そのようなタグ付加されたデータ(または、より一般的には注釈されたデータ)の共有とをサポートするためのシステムと方法に対するニーズが依然として存在する。ウェブ文書のサブ文書エレメントにタブを付加するソリューションであって、ウェブブラウザと統合化されたソリューションがあれば、ウェブページに注釈を付加するために必要とされる認知的対話的オーバーヘッドの量が有利に減少する筈である。さらに、ウェブページのソーシャルタグ付けを容易にする統合ソリューションが提供されれば、ユーザは、相互協力やタグ付加されたデータの共有が有利に行い易くなる筈である。また、同様なコンテンツを有するウェブページにタグを自動的に伝搬したり、ウェブページのダイナミック性を考慮したりすることによって、タグとウェブページのサブ文書エレメントとの間の関連性の一貫性が維持される。
さらに、タグ付加された(または、より一般的には注釈が付加された)文書のコレクションを相互協力的タグ付加(または、より一般的には相互協力的注釈付加)によって探索するための改良されたシステムと方法に対するニーズが依然として存在する。従って、文書のタグベースのコレクションを探索するための改良されたシステムと方法を提供し、そのような文書コレクションを探索する確度および/または精度を増すことは、有利な筈である。
本開示のこれらと他の態様は、添付図面と関連させて以下の説明を読めば、容易に明快になることと思われる。なお、同じ様な部分には同じ参照数字を付してある。
A.用語の定義
以下で定義される用語は、特許請求の範囲と図面と含む本特許出願明細書を通じて、その示された意味を有する。
「文書」または「ウェブ文書」は、電子データのコレクションが閲覧されるときどのようにフォーマットにされているかに依拠して可変数のページを規定し得る電子データのコレクション、例えば、ウェブブラウザを使って閲覧し得る文書(例えば、ウェブページ、イメージ、ワード文書、およびポータブル・ドキュメント・フォーマット(pdf)形式の文書)を意味するのに本明細書では使用される。文書を構成する電子データは、静的および/または動的コンテンツから成り得る。
「サブ文書エレメント」は、単独に取り出されるとき、文書全体より小さいサイズの文書構造のエレメントを意味するのに本明細書では使用される。サブ文書エレメントは、ワード、イメージ、フレーズ、センテンス、パラグラフ、ページ、節、および章のセットから選択されるタイプであり得る。
「共同ユーザ」は、汎用コンピュータの「ユーザ」(アクセスコントロールおよび/またはブロックを使用して許可される)に認識または知悉され得るユーザ(例えば、個人または個人の代理)またはユーザのグループ(例えば、グループまたは組織内の配信リスト)であって、例えば、ユーザまたはログインネームのような識別子を使用して汎用コンピュータのユーザに知悉、または知悉させられ得るユーザを意味するのに本明細書では使用される。
B.ダイナミック注釈と探索のための操作環境
図1は、本明細書に開示の実施の形態を実行するための例示の操作環境100を示す。この例示の操作環境において、汎用コンピュータ104は、インターネットのようなネットワーク102上で共に通信し得るが、クライアント側またはサーバ側のいずれかの操作を実行するようにプログラムされている。当業者なら分かることであるが、クライアントサーバ配置の別法が存在する。例えば、中央ターミナルベース配置またはこれらの組み合わせ配置である。クライアント側操作は、クライアント側アプリケーションモジュール106をロードした汎用コンピュータ104で実行される。モジュール106は、注釈プラグイン108とウェブブラウザ110(例えば、インターネットエクスプローラ、ファイアフォックス、またはサファリ)を備える。サーバ側操作は、一個または複数個のサーバ側アプリケーションモジュール112をロードした汎用コンピュータで実行される。モジュール112は、一個または複数個の注釈モジュール114、ページタグ付加モジュール116、ウェブページ(またはウェブ文書)サーバ118、およびタグベース探索サーバ120のうちの一個またはそれらの組み合わせを備える。
図2は、本明細書に開示の実施の形態、例えば、図1に示される実施の形態を実行するための汎用コンピュータ104を示す。汎用コンピュータ104は、ハードウェア212とソフトウェア214とを備える。ハードウェア212は、プロセッサ(すなわち、CPU)216、メモリ218(ROM、RAMなど)、持続的記憶装置220(例えば、CD−ROM、ハードドライブ、フロッピー(登録商標)ドライブ、テープドライブなど)、ユーザI/O222、およびネットワークI/O224で構成される。ユーザI/O222は、カメラ204、マイクロフォン208、スピーカ206、キーボード226、ポインティングデバイス228(例えば、ポインティングスティック、マウスなど)、およびディスプレイ230を備え得る。ネットワークI/O224は、例えば、インターネットのようなネットワーク102に接続し得る。汎用コンピュータ104のソフトウェア214は、オペレーティングシステムソフトウェア236とアプリケーションソフト240を備え、クライアント側アプリケーションモジュール106またはサーバ側アプリケーションモジュール112の命令を含み得る。ソフトウェア214は、一般に、メモリ218に読み込まれ、プロセッサ216に指定された操作を実行させる。ソフトウェア214は、クライアント側アプリケーションモジュール106またはサーバ側アプリケーションモジュール112の命令とともにアプリケーションソフト240を含む。
C.ダイナミック注釈エレメントと操作
図3は、図1に示される例示の操作環境100における注釈サーバ113と注釈クライアント(複数を含む)111とによって実行される諸操作を示すフローチャートである。注釈サーバ113と注釈クライアント(複数を含む)111とにより、サブ文書エレメントのダイナミック注釈が可能となる。例示であって、限定目的ではないが、本明細書に記載の例は、ウェブページのパラグラフなるサブ文書エレメントの注釈に関する。当業者なら分かるように、相異なるサブ文書エレメントと文書、またはこれらの組み合わせも、本発明で可能となるダイナミック注釈の操作を行う時に代わりに使用し得る。
最初に302で、クライアント側アプリケーションモジュール106のウェブブラウザ110が注釈プラグイン108で初期化される。これには、サーバ側アプリケーションモジュール112と通信するための操作と、文書を増補するための操作とが含まれ、(a)ウェブブラウザ110の使って表示される文書の注釈のユーザ指定と、(b)ユーザ注釈と共同ユーザ注釈のデータの表示とが双方行われ得る。一般に、304と306との間のクライアント側で実行される操作と、305と307との間のサーバ側で実行される操作は、注釈でウェブページを増補することとユーザ注釈のための準備とに関し、一方、306と308との間のクライアント側で実行される操作と、307と309との間のサーバ側で実行される操作は、増補されたウェブページのユーザ注釈に関する。別の一つの実施の形態では、注釈プラグイン108の機能は、文書をユーザに送る前に注釈機能で文書を増補するプロキシサーバ(ネットワーク102上で操作)で提供し得る。
310で、ウェブブラウザ110は、ユーザリクェストを受理し、ウェブページをロードしてディスプレイする。312で、リクェストされたウェブページが、例えば、そのウェブページを記憶しているウェブページサーバ118のようなサーバのネットワーク102上に位置を識別するURL(ユニバーサル・リソース・ロケータ)を使用してアクセスされる。314で、312でのウェブページリクェストに呼応した注釈プラグイン108が、ウェブサーバ128経由で注釈サブレット126とリクェストされたウェブページとを通信させ(例えば、そのURLを送信して)、サービスがサーバ側注釈モジュール114で実行されるようにリクェストし、リクェストされたウェブページのコンテンツと同様なコンテンツに対してユーザと識別された共同ユーザとが行った注釈を識別する。
316で、サーバ側注釈モジュール114は、ウェブページサーバ118から当該ウェブページのコピーを(例えば、314で提供されたURLを使用して)検索する。別法として、312で検索されたウェブページのコピーを、314でのサービスリクェストに従ってクライアント側アプリケーションモジュール106で提供し得る。318で、サーバ側注釈モジュール114が、検索されたウェブページに一個または複数個のウェブページサブ文書エレメントを識別する。これらのサブ文書エレメントは、パラグラフのような単一のタイプでもよく、またはパラグラフと節のような諸タイプの組み合わせでもよい。320で、318で識別されたサブ文書エレメントであって、ユーザと選択された共同ユーザに関連しているサブ文書エレメントに対して、類似度測定が、類似度計算器124を使用して計算される。類似度は、一個または複数個の因子(ユニークな識別子または指紋として作用する)、例えば、(a)サブ文書エレメントに出現するワードの長さ、(b)サブ文書エレメントに出現する最初のn個のワードの最初の文字、(c)サブ文書エレメントに出現する同様なノンストップのワードの頻度、および(d)暗号ハッシュ関数の一つであるMD5(メッセージ・ダイジェスト・アルゴリズム5)に基づいて計算し得る。実施の形態の一つでは、類似度(または指紋)は、関連サブ文書エレメントに対して計算されるハッシュ値である。計算後は、注釈サーバ113に記憶された注釈済みサブ文書エレメントの指紋を、318で識別された、検索されたウェブページのサブ文書エレメントの指紋に対して比較し得る。
322で、ユーザまたは共同ユーザが以前に注釈したウェブページサブ文書エレメント(関連した注釈と類似度を有する)であって、320で計算された類似度と同等の類似度(すなわち、同一または同様な指紋である可能性が高いと考えられる)でデータベース122に記憶されているウェブページサブ文書エレメントが、識別される。324で、322で識別されたサブ文書エレメントの記憶された注釈データが、クライアント側アプリケーションモジュール106に提供される。
326で、ウェブページが増補され、ディスプレイと(さらなる)注釈が行われるが、それは、326(A)で、ウェブページ上の各ワードを別々に選択可能とするステップと、326(B)で、サブ文書エレメントの終わりにユーザネームのラベルと、322で識別されたサブ文書エレメントの関連する記憶されたユーザの注釈データであって、テキスト注釈(例えば、タグ、キーワード、またはコメント)、グラフィック注釈(例えば、グラフィックアイコン)、またはオーディオ/ビデオ注釈(例えば、オーディオまたはビデオクリップへのリンク)を含む注釈データとを挿入するステップと、326(C)で、322で識別された記憶・注釈されたデータと関連したウェブページのサブ文書エレメントのコンテンツに注釈(例えば、テキスト、グラフィックス、オーディオ、またはビデオを含み得るハイライトしたもの)を挿入するステップとで行われる。326(B)と326(C)とで、それぞれ、ウェブページに挿入された注釈は、サブ文書エレメントがデータベース122に322で記憶された注釈データのサブ文書エレメントに類似している(またはそのマッチングする指紋を有している)とき、318で識別・検索されたウェブページのサブ文書エレメント(またはサブ文書エレメントの組み合わせ、例えば、サブ文書エレメントの組み合わせで規定された文書の章)に付加し得る。
326での実施の形態の一つで、注釈プラグイン108は、ウェブページのHTMLコンテンツを増補することによって(例えば、AJAXを使用して)ウェブページ上の各ワードを選択可能にし得る。それは、(a)326(A)で、ウェブページの文書オブジェクトモデル(DOM)ツリーを、ウェブページがウェブブラウザ110でロードされる前にウェブページの各ワードをHTML(ハイパーテキストマークアップ言語)タグ<スパン>で囲むことによって変更するステップと、(b)326(D)で、ウェブページでユーザが実行したワード選択を検出するため各サブ文書エレメントにイベントリスナ、例えば、マウスイベントリスナを付加するステップとで行われる。
図4は、外接ボックス長方形を使用してサブ文書エレメントの諸ワードが個々に選択可能(および/または注釈可能)とされた例示的テキストコンテンツ402を示す。例えば、外接ボックス404内でマウスなどのポインティングデバイスで選択(および/または注釈)するユーザが、ワード「San」を選択したと決定したとする。ユーザの好みに依存するが、すでにワードに関連しているダイナミック操作を設定し、選択(および/または注釈)操作に超える優先性を持たせ得る。例えば、ワード「San」がハイパーリンクと関連していたイベントにおいて、上位優先性がハイパーリンクに与えられているときは、そのリンクが辿られる。そうでなく、より高い優先性が注釈プラグインに関連した操作に与えられているときは、選択(および/または注釈)操作が実行される。別の実施の形態では、フレーズやセンテンスのような、より高いレベルの構成物が、フレーズまたはセンテンスを囲むとき、外接ボックス(どんな数の相異なる形状をも取り得る)内で選択可能(および/または注釈可能)とされる。
326でウェブページを増補した後、ウェブページが330でディスプレイされ、ユーザに利用可能にされるが、その目的は、(a)ユーザまたは識別された共同ユーザが同じようなコンテンツに対して以前に付加した注釈を見たり、(b)さらに注釈を加えたりするためである。332で、注釈プラグインに内蔵のイベントハンドラが、表示されたウェブページで示されたユーザから受け取ったインプットに関連したイベントを受理し、これに応答する。注釈されるべきサブ文書エレメントの部分を示すイベントにより、データベース122にある注釈を(注釈に関連したサブ文書エレメントの類似度(または指紋)とともに)、それぞれ、334で送信し、342で記憶し、そして340でこれらの注釈をユーザに対してウェブページ上にディスプレイすることが行われる。例えば、図5は、その後に挿入されたユーザネームラベル504とともにサブ文書エレメント502を示す。この例では、ユーザは、先ず、テキストの最初(すなわち「CHI」)にマウスのポインタを合わせ、次いでマウスのポインタがテキスト文の最後(すなわち「2007」)に移動するまで左マウスボタンを押し続けて、下線が引かれたテキストをハイライトすることによって文書の注釈付けを行った。
ユーザによるワード選択を示すイベントにより、イベントハンドラは、ウェブページにタグコメントフィールドを開き、そのフィールド内に選択されたワードをタグとして挿入する(そして実施の形態の一つではネームラベルフィールドにも挿入する)。選択されたタグまたはキーワードを保存するということを示すイベントにより、イベントハンドラは、保存されるタグおよび/またはキーワードをサーバ側注釈モジュール114に送信し、336でエラーチェック(スペルおよび/または句読法エラーの訂正、矛盾点の解消、および/または特定の注釈の終端ワード削除を含む)を行い、その後に342で(ワード選択に関連したサブ文書エレメントの類似度(または指紋)とともに)記憶する。336で訂正された注釈は、338で注釈クライアント111に送り戻され、その後340でディスプレイされる。例えば、図6は、サブ文書エレメント602と、その後のユーザネームラベル604(図5に示されるものと同じ)とを示し、その間にワード選択がサブ文書エレメント602にタグ付けするために行われる。
具体的に説明すると、図6には、ビューアに表示されたウェブページのタグ付けをユーザが実行する際の一連のイメージフレームが示される。フレーム600では、サブ文書エレメント602の増補は、ユーザネームラベル604を後で挿入することと、サブ文書エレメント602の個々のワードを選択可能とすることによって行われる。フレーム606では、ワード「San」を選択するユーザインプットに応答し、ディスプレイされた文書は、選択されたワード「San」をユーザネームラベル604の後に続いている(すなわち、選択されたワードに関連するサブ文書エレメントの後に続いている、またはこれに関連する)タグコメントフィールド607に挿入することによってさらに増補されている。フレーム608では、表示された文書は、選択されたワードである「Jose,」、「April」、「28th,」、「2007」、「May」、および「3rd,」でさらに増補されている。「save」ボタン605がクリックされると、選択された(またはタイプされた)注釈文が、注釈サーバ113によって実施の形態の一つでは(または示されていないが、別の実施の形態では注釈プラグイン108によって)図3の336で訂正され(例えば、最初はワードの一部であると考えられていたコンマが除去され)、その後で選択されたワードが最終的に決定され、フレーム610に示されるようにユーザネームラベル604の後に続いて示される。別の実施の形態では(図示せず)、共同ユーザに関連したキーワードのリストと、最も頻繁におよび/または最も最近に使用されたキーワードの選択可能のリスト(ウェブページに、例えば、ユーザと共同ユーザのキーワードの後に続いて追加された)を、同様に選択可能とし、タグコメントフィールド607に追加し得る。さらに別の実施の形態では、選択れたワードを、最終決定が行われる前にタグコメントフィールド607に配置せず、代わりに、直ちに、フレーム610に示される形式で配置する。
有利なことであるが、ウェブページに注釈を加えた後、そのユーザ注釈は、データベース122にある注釈サーバ113に記憶され、同様なコンテンツを有するウェブページにその注釈を伝搬することが可能となる。換言すれば、注釈が伝搬するのは、注釈サーバ113が、記憶された注釈を注釈クライアント111に提供し、記憶されたコンテンツと同様なコンテンツを含む文書にその注釈を加える時である。さらに、注釈サーバ113は、クライアント111には、サブ文書エレメントのコンテンツの指紋とマッチしていない記憶された注釈についてはこれらを伝搬しない。たとえ、そのコンテンツが、ウェブページのサブ文書エレメントの注釈と指紋とが最初に記録されたときに閲覧中のウェブページに以前存在していた場合でも、そうである。
D.注釈の作成・共有のためのユーザインターフェイス
図7は、注釈を作成し、共有するための例示的ユーザインターフェイス700を示す。ユーザインターフェイス700のトップには、「remove」と「add」コマンドを含む制御エリア702があり、ユーザは、共同ユーザを指定して、その共同ユーザの注釈が、ユーザが閲覧中の文書中にディスプレイされるのを見たいかどうかを決め得る。
さらに、エリア702で、ユーザは、ユーザのページレベルタグ付けを指定し、指定された共同ユーザのページレベルタグを見ることが可能である。ページレベルのタグ付けは、サブ文書レベルでのタグ付けとは相異なって、単にタグ、キーワード、またはコメントをウェブページ(またはURL)と関連付けするものである。サブ文書エレメントのタグ付と同様に、ページレベルのタグ付けは、706に記録される。これは、実施の形態の一つでは、エリア702の「Save Page Tag」および「Update Page Tag」というコマンドを使い、ページタグサーブレット138によってウェブサーバ136経由でデータベース140にアクセスすることを含む(これは、別の実施の形態では、サーバ側注釈モジュール114と統合して、または一緒に操作し得る)。
制御エリア702の下には、文書エリア704がある。文書エリア704では、ウェブページコンテンツが増補され、それは、この例では、ユーザ(「lichan_hong」)と選択された共同ユーザ(「edhchi」と「kooltag」)に関連した注釈を含む。従って、制御エリア702と文書エリア704とを調べることによって、ユーザは、ディスプレイされた文書がページレベルで、および/またはサブ文書レベルで注釈されているかどうかを知ることが可能である。
E.タグベースの探索
ウェブベースの注釈サービス、例えば、クライアント側注釈モジュール106で利用可能となったものを使用して、ユーザは、ウェブ文書をブックマークに記憶し、ページレベルで文書ブックマークに(そして、別の実施の形態では、サブ文書エレメントレベルで文書エレメントに)タグまたはキーワードのセットを付加する(または、より一般的には、例えば、ハイライトしたりコメントを付けたりすることによる注釈付加する)能力が与えられる。従って、ユーザは、ユーザのタグのセットを使用して、ユーザの個人的ブックマークコレクションからその文書を探索し、検索し得る。さらに、ユーザは、自身のブックマーク(そして、関連タグまたはキーワード)をすべてのユーザに完全公開して、または選択された共同ユーザに半公開して共有するかを決定し得る。共有されたブックマークは、そうすれば他のユーザがブラウズしたり、探索したりするのが可能となる。ユーザが一所懸命に創り上げた文書ブックマークコレクションをこのように協力的に共有することによって、ユーザは、ユーザが共有する(すなわち、協力的に開発された)ブックマークコレクションを使用して諸々のブックマークに記憶された文書を発見するという便益を享受し得る。
図1に示された実施の形態の一つでは、データベース122と140に格納された協力的に共有されたブックマークコレクションは、ウェブブラウザ110上で作動するユーザインターフェイスを通じてタグベースの探索サーバ120を使用して探索し得る。ブックマークに記憶された文書を発見するための照会がユーザによって行い得る前に、ユーザのグループに関連したブックマークコレクションが処理され、キャッシュメモリに記憶され、ブックマークコレクション中のブックマークに記憶された文書に対するタグプロフィールと文書プロフィールが識別される。一般に、選択されたタグオブジェクト(例えば、TAG2)と選択された文書オブジェクト(例えば、URL1)に対するタグプロフィールと文書プロフィールは、エントリノードとしてバイグラフ(bigraph)中のその選択されたタグまたは文書オブジェクトを使用する活性化拡散を行って構成される。
図8は、タグベースの探索サービスで実行される操作を示すフローチャートで、タグと文書のプロフィールを識別し(802,804,806,808,810,および812で)、タグベースの照会に結果を提供する(814,816,818,および820で)ものである。最初に802で、ブックマークコレクションが識別される。これは、実施の形態の一つでは、文書識別子(例えば、URL)のリストとすることができる。この場合、ブックマークコレクション中の各ブックマークは、タグのセット(例えば、[URL1,TAG2,TAG6,…,TAGN])に関連したURL付の文書を識別するのである。804で、ブックマークコレクションはURL/TAGペアのセット(例えば、[URL1,TAG2]、[URL1,TAG6]、…[URL1,TAGN])に分解(すなわち、変換)される。[URL,TAG]タプルの形式のURL/TAGペアが与えられると、タグに対するバイグラフ(すなわち、二次元グラフ)が、806で構成される。バイグラフが構成されると、バイグラフはマトリックスとして表現される(808で)。別法としては、バイグラフは、例えば、隣接リストを使用して示し得る。
図9は、902の箇所でブックマークコレクションの例を示す。これは、904の箇所で識別され(図8の802で規定されたように)、そしてURL/TAGペアに処理され(図8の804で規定されたように)、906の箇所でバイグラフに処理され(図8の806で規定されたように)、そして908の箇所で、906に示されるバイグラフに対して、URLを識別する列とタグを識別する行とから成るマトリックスに処理される(図8の808で規定されたように)。
810で、バイグラフ行列(または、より一般的にはn次元行列)を使用して、バイグラフのノード範囲に対してタグプロフィールと文書プロフィールとを計算する。これらのプロフィールは、ベクトルAとして活性化拡散を繰り返し使用してプロフィールを計算することによって得られる。具体的には、以下の通りである。
〔数1〕
A[1] = E;
A[2] =αM*A[1]+βE;



A[n] =αM*A[n-1]+βE;

式中、
A[1],A[2],…A[n]は、URLとタグの繰り返し計算されたプロフィールベ
クトルで、
Eは、タグまたは文書エントリノードを表す単位ベクトルで、
Mは、選択されたエントリノードに従って列または行で配列されたバイグラフ(または、より一般的にはn次元グラフ)のマトリックス表現で、
αとβは、活性化拡散を調整するためのパラメータである。
活性化拡散を「n」ステップだけ繰り返して実行した後(ステップ「n」の数は、精度および/または性能に依存して変え得る)、活性化拡散は、バイグラフのタグ側またはバイグラフの文書側で停止され、従って、タグまたは文書エントリノードEに対するタグプロフィールベクトルまたは文書プロフィールベクトルを提供する。タグプロフィールベクトルと文書プロフィールベクトルにおける得られた重みパターンは、「タグプロフィール」と「文書プロフィール」をそれぞれ規定する。図10は、「n」=4ステップ、エントリノードEとして文書1(すなわち、URL1)、パラメータα=1、パラメータβ=0、文書D1に対して得られたタグプロフィールベクトルA[4]TAGおよび得られた文書プロフィールベクトルA[3]DOCを有する活性化拡散の例を示す。
図10に示されるように、各繰返し計算(すなわち、n=2、n=3、n=4)の後、得られた文書とタグのプロフィールベクトルが、初期エントリベクトルに対する最も興味あるタグまたは文書を識別する。この場合、ユーザは文書DOC1に興味を示したのである。すなわち、初期エントリベクトルは、DOC1に1の重みを割り当てたのである。ステップn=2で、図10は、DOC1がTAG1、TAG2、およびTAG3と関連していることを示す。図10はさらにステップn=3で、活性化拡散計算は、興味ある文書DOC1、DOC2、DOC3、およびDOC4を識別する。この場合各文書は、それぞれ、興味性の重み3、2、1、および1で関連している。最後に、ステップn=4で、活性化拡散計算は、得られたタグプロフィールベクトルA[4]TAGを識別し、TAG2とTAG3が、DOC1=1であるオリジナル文書エントリベクトルに対する最も高く重み付けされたタグであることを示す。
タグプロフィールと文書プロフィールとが、810で計算された後、それらは、実施の形態の一つではキャッシュメモリに記憶され(812で)、後で検索・探索目的に供される。別の実施の形態では、そのようなタグと文書のプロフィールは、オンデマンドでリアルタイムに計算される。ユーザは、ウェブブラウザ110を通して入手可能の図11に図示の探索インタフェース1100を使用して文書コレクションを探索し得る。探索インタフェース1100を使用すると、ユーザは、キーワードおよび/またはタグを(1102で)指定可能であり、次いでこれを使用して、関連したタグと文書(1104で)を識別する(1106で)。これは、1102でキーワードおよび/またはタグを取り、キャッシュメモリに記憶された活性化拡散計算(図8の812で)で、どんな他の文書とタグが関連し、興味あるものであるかを探し出すことによって行われる。文書プロフィールベクトルに規定された活性化拡散された文書は、1104にディスプレイされ、タグプロフィールベクトルに規定された活性化拡散されたタグは、1106にディスプレイされる。これらは、活性化拡散の重みに従って類似度でランク付けされた順序でディスプレイされる。
前記の探索結果は、1104に表示されたどの文書が適切であるかを、例えば、「適切性フィードバック」として技術に既知の方法を使用して規定することによって、ユーザがさらに改良し得る。実施の形態の一つでは、ユーザは、選択ボックスをクリックすることによって自分の興味を示す。選択される文書は、キャッシュメモリに記憶された計算結果(図8の812で)中に探し出し得るが、プロフィールベクトルにある対応する関連タグと文書も、将来の探索を通知するのに使用し得る。別法として、ユーザは、関連タグを指定し、それらのタグに対応するキャッシュメモリに記憶された計算結果(812での)を探し出し、現在の興味プロフィールに追加し、次いでこれを使用して、将来の探索を通知することもし得る。
より一般的には、キャッシュメモリに記憶された(812で)後は、タグプロフィールと文書プロフィールとは、検索、探索、および推薦事項のための相異なる類似度計算とルックアップの基礎を形成する。例えば、図8に示される実施の形態では、選択されたタグまたは文書に係わる関連したタグまたは文書を識別するようにという探索リクエストを受け取ると(814で)、選択されたタグまたは文書に対応するタグプロフィールまたは文書プロフィールがキャッシュメモリから取り出される(816で)。別法として816で、選択されたタグまたは文書が、812でキャッシュメモリに記憶された活性化拡散計算プロフィールに存在しない場合は、812でキャッシュメモリに記憶されたデータにあるタグおよび/または文書であって、行方不明のタグまたは文書と最も類似のもののプロフィールが選択される。ステップ816で、文書(およびタグ)の間の類似性は、例えば、文書ワードベクトルのコサイン類似性計算、または他の類似性計算、例えば、ユークリッド距離または他のベクトル距離計量を使用して決定し得る。
820で、識別されたタグプロフィールおよび/または文書プロフィールが分類され、関連したタグおよび/または文書が重要度に従ってランク付けされる。ランク付けされた、これらの非常に類似性の高いタグおよび/または文書は、例えば、図11に示されるユーザインターフェイス1100でリターンして提示される。図示のユーザインターフェイス1100は、各文書リンク(例えば「Dive into Greasemonkey」)とともに、最も高頻度で文書に付加されたタグのリスト(例えば、greasemonkey 65,firefox 54,javascript 33,programming 27,reference 18、およびweb 18)を含む。別の一つの実施の形態では、816で識別されたタグプロフィールまたは文書プロフィールが、818でシステムに含まれる他のすべての文書またはタグのプロフィールと対照して比較され、類似性の高いプロフィールが見出される。従って、選択されたタグおよび/または文書と対応または同様な識別されたタグおよび/または文書のプロフィールを使用して、816で識別されたものに加えて、または別のものとして、820で同様なタグまたは文書が識別される。
換言すれば、814,816,818,および820で、ユーザがある文書に関連した情報を見出したいと思えば、タグベースの探索サーバは以下のことを実行し得る。すなわち、(a)文書がそのキャッシュに記憶された(812で)活性化拡散計算によるプロフィールに既に存在すると仮定して、対応する文書プロフィールをルックアップし、そして適切性に従って、例えば、最高から最低までの重み付けで配列されたそのプロフィールで選択された文書を選択し、リターンし、ディスプレイすること(文書の配列は、さらに、ある閾値以上に重み付けされたもののみを残すようにフィルタ処理され得る)、(b)対応する文書プロフィールを使用し、これをシステムに含まれる他のすべての文書プロフィールと対照して比較し、類似性の高い文書プロフィールを見出し、そして、その後、適切性に従って配列されたそれらのプロフィールで選択された文書を選択し、リターンし、ディスプレイすること、および/または(c)情報検索技法、例えば、文書ワードベクトルの従来のコサイン類似性測定の計算を使用して、ユーザ指定文書がキャッシュに記憶された(812で)活性化拡散計算によるプロフィールに既に存在しないときは、URL/TAGバイグラフに最も類似度の高い文書を見出し、そしてその後に、(a)または(b)のいずれかの手順を使用して、関連する文書を選択し、リターンし、ディスプレイすることを実行し得る。別法として、814,816,818,および820で、ユーザがあるタグと関連した情報を見出したいと思えば、文書に対して実行された同様な操作を、タグと対応するタグプロフィール対して代わりに実行する。
別の実施の形態では、キーワード探索を使用し、キャッシュされた(812で)活性化拡散計算によるプロフィールに文書またはタグを識別し得る。これらのプロフィールを、後で使用し、関連した文書とタグを識別するのである。さらに他の実施の形態では、複数のキーワードが探索基準として提供されるとき、複数のキーワードに対応するタグと文書に関連したプロフィールベクトルが、一緒に合計され、ランク付けが行われ、その後、興味ある文書とタグを識別するために使用される。別法として、相異なるキーワードに対応するプロフィールベクトルが相異なるように重み付けられ、その後で一緒に合計され、ランク付けが行われ、その後、興味ある文書とタグを識別するために使用される。プロフィールベクトルのそのような合計をさらに使用し、結果を一層改良し得るが、それは、追加的キーワードおよび/または文書をプロフィールベクトルのセットに加えることによって行われ、当該ベクトルのセットは、最終的に一緒に合計され、ランク付けが行われ、その後、興味ある文書とタグを識別するために使用されるのである。
別のさらなる実施の形態では、本明細書に示された例示的実施の形態は、文書とタグとの間という二つの変数関係を越えて拡張し得る。そのような別法の実施の形態では、グラフは、例えば、二つの相異なる変数の間(例えば、文書とユーザの間)、または三つ以上の変数の間(例えば、文書、タグ、およびユーザの間)にて定義し得る。本技法は、三つ以上の変数に対しても有効である。なぜなら、活性化拡散技法を、これらの相異なる変数に対して実行し、キャッシュメモリに記憶し得るからである(例えば、タグプロフィール、文書プロフィール、およびユーザプロフィールが得られる)。
さらに、前述の実施の形態においては、ブックマークコレクションの共有について議論が行われたが、当業者ならば、別法として、ブックマークコレクション共有の代わりに、個々のブックマークの好みを記録するメタデータを備える文書のコレクションを各文書と共有することについても議論が成り立つことが分かるであろう。
F.雑
上記の説明を考慮すれば、ウェブページに注釈を付するための実施の形態は、以下の諸ステップ、すなわち、複数の文書識別子とタグのそれらの関連セットとをURL/TAGペアのセットに変換するステップと、前記URL/TAGペアセットを使用して二次元グラフを構成するステップと、前記二次元グラフを使用し、前記URL/TAGペアセットの文書識別子とタグに対する活性化拡散を用いタグプロフィールと文書プロフィールとを計算するステップと、選択されたタグまたは文書に対して、選択されたタグまたは文書に関連したタグプロフィールまたは文書プロフィールをそれぞれ識別するステップと、選択されたタグまたは文書に関連した、前記識別されたタグプロフィールまたは文書プロフィールのタグまたは文書を適切性に従って配列するステップとを備える方法によって実施し得る。
さらに、上記の説明を考慮すれば、前述の実施の形態は、以下の機能を備える。すなわち、タグプロフィールと文書プロフィールとは、活性化拡散を使用して計算し得る。文書プロフィールは、同様なプロフィールを識別するために他の文書プロフィールに対してランク付けされる。既定の閾値以上にランク付けされた同様なプロフィールの文書は、アウトプット用に識別される。本方法は、選択された文書(またはタグ)が二次元グラフにないときでも、二次元グラフを構成するのに使用された文書であって、同等な類似度を有する文書をそれに代替することによって、実行し得る。タグプロフィールは、同様なプロフィールを識別するために他のタグプロフィールに対して比較し、重みによって配列し得る。同様な文書またはタグのセットまたはタグと文書双方のセットは、選択されたタグまたは文書と関連したタグプロフィールまたは文書プロフィールを使用して計算し得る。複数の文書識別子は、ブックマークコレクションとし得るが、ブックマークコレクション中の各ブックマークは、タグのセットと関連付けられた識別子で文書を識別する。前記二次元グラフは、複数のユーザで規定され得る3番目の次元をさらに含み得る。
前述の仕様明細を使用して、本明細書に開示の諸実施の形態は、マシン(またはシステム)、プロセス(または方法)、または製造品として実装され、標準プログラミングおよび/またはエンジニアリング技法を使用することによって、プログラミングソフトウェア、ファームウェア、ハードウェア、またはこれらの組み合わせを製造し得る。当業者ならば分かることであるが、前記仕様明細に記載された諸フローチャートは相異なる可能な実施の形態の理解に便ならしめる意図で提供されたものである。従って、諸ステップの順序を変えること、一つまたは複数個のステップを並行的に実施すること、および/またはステップ数を追加したり、省略したりして実施することは、別の実施の形態で行い得る。
得られたプログラム(複数を含む)は、コンピュータ可読プログラムコードを有し、一種または複数種のコンピュータ使用可能の媒体、例えば、メモリ装置または伝送装置内に内蔵することによって、開示の実施の形態に基づいてコンピュータプログラム製品または製造品を作製し得る。従って、本明細書に使用される「製造品」および「コンピュータプログラム製品」は、どのようなコンピュータ使用可能の媒体、例えば、どのようなメモリ装置または伝送装置上に実装されるコンピュータプログラム存在品(恒久的、一時的、または過渡的)を網羅するものとする。
開示の実施の形態を具現化するマシンは、CPU、メモリ/記憶装置、通信リンク、通信/伝送装置、サーバ、I/O装置を含む一個または複数個の処理システムを備え得るが、これらに限定されない。または、ソフトウェア、ファームウェア、ハードウェア、またはこれらのコンビネーションまたはサブコンビネーションを含む一個または複数個の処理システムのサブコンポーネントまたは個々のパーツであって、特許請求の範囲に示された開示の実施の形態を具現化するものも含む。当業者なら理解することであるが、前記メモリ装置は、固定(ハード)ディスクドライブ、フロッピー(登録商標)ディスク(またはディスケット)、光ディスク、磁気テープ、RAM、ROM、Promのような半導体メモリを含むが、これらに限定されない。伝送装置は、インターネット、イントラネット、電子掲示板およびメッセージ/ノート交換、電話/モデムベースのネットワーク通信、通常有線/ケーブル通信ネットワーク、携帯電話通信、電波通信、衛星通信、および他の固定または移動ネットワークシステム/通信リンクを含むが、これらに限定されない。
例示の操作環境における注釈サーバと注釈クライアント(複数を含む)の実施の形態の説明図である。 図1に示される実施の形態のような本明細書に開示の実施の形態を実行するための汎用コンピュータの説明図である。 図1に示される例示の操作環境における注釈サーバと注釈クライアント(複数を含む)とによって実行される諸操作を示すフローチャートである。 サブ文書エレメントのワードが、外接ボックス長方形を使用して個々に選択可能とされたテキストコンテンツの例を示す図である。 ユーザのネームラベルが後で挿入されたサブ文書エレメントを示す図である。 ビューアに表示されたウェブページにユーザがタグ付けするとき一連の画像フレームを示す図である。 ウェブ文書に付加する注釈を作成し、共有するためのユーザインターフェイスの例を示す図である。 タグベースの探索サービスで実行される操作を示すフローチャートである。 図8に概略示されたように処理されたブックマークコレクションの例を示す図である。 4ステップに等しい「n」ステップで行われる活性化拡散の例を示す図である。 ウェブブラウザを通して利用可能とし得るタグベースの探索インタフェースを示す図である。
符号の説明
100 操作環境、102 ネットワーク、104 汎用コンピュータ、106 クライアント側アプリケーションモジュール、108 注釈プラグイン、110 ウェブブラウザ、112 サーバ側アプリケーションモジュール、114 注釈モジュール、116 ページ−タグ付加モジュール、118 ウェブページサーバ、120 タグベースの探索サーバ、212 ハードウェア、214 ソフトウェア、216 プロセッサ、218 メモリ、220 固定記憶装置、222 ユーザI/O、224 ネットワークI/O、204 カメラ、208 マイクロフォン、206 スピーカ、228 ポインティング装置、230 ディスプレイ、226 キーボード。

Claims (3)

  1. コンピュータに
    複数の文書識別子とタグのそれらの関連セットとをURL/TAGペアのセットに変換する手順と、
    前記URL/TAGペアセットを使用して二次元グラフを構成する手順と、
    前記二次元グラフを使用し、URL/TAGのセットの文書識別子とタグに対する活性化拡散を用いタグプロフィールと文書プロフィールとを計算する手順と、
    選択されたタグまたは文書に対して、選択されたタグまたは文書に関連したタグプロフィールまたは文書プロフィールをそれぞれ識別する手順と、
    選択されたタグまたは文書に関連した、前記識別されたタグプロフィールまたは文書プロフィールのタグまたは文書を適切性に従って配列する手順と、
    文書プロフィールを、同様なプロフィールを識別するために他の文書プロフィールに対してランク付けする手順と、
    既定の閾値以上にランク付けされたそれらの同様なプロフィールの文書を、アウトプット用に識別する手順と、
    を実行させるための探索プログラム。
  2. 請求項1に記載の探索プログラムにおいて、タグプロフィールと文書プロフィールとが、ベクトルAとして活性化拡散を繰り返し使用して、次式:

    A[1] = E;
    A[2] =αM*A[1]+βE;




    A[n] =αM*A[n-1]+βE;

    (式中、
    A[1],A[2],…A[n]は、URLとタグの繰り返し計算されたプロフィールベクトルで、
    Eは、タグまたは文書を表す単位ベクトルで、
    Mは、選択されたタグまたは文書に従って列または行で配列された二次元グラフのマトリックス表現で、
    αとβは、活性化拡散を調整するためのパラメータである)

    に従って計算されることを特徴とする探索プログラム
  3. 請求項記載の探索プログラムにおいて、前記ランク付けが、選択された文書が二次元グラフにないときでも、二次元グラフを構成するのに使用された文書であって、前記選択された文書と同等な類似度を有する文書をそれに代替することによって、実行されることを特徴とする探索プログラム
JP2008032612A 2007-02-16 2008-02-14 文書に注釈を付するシステムと方法 Active JP5222581B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US89046407P 2007-02-16 2007-02-16
US60/890,464 2007-02-16
US11/837,942 US8166056B2 (en) 2007-02-16 2007-08-13 System and method for searching annotated document collections
US11/837,942 2007-08-13

Publications (2)

Publication Number Publication Date
JP2008204454A JP2008204454A (ja) 2008-09-04
JP5222581B2 true JP5222581B2 (ja) 2013-06-26

Family

ID=39627640

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008032612A Active JP5222581B2 (ja) 2007-02-16 2008-02-14 文書に注釈を付するシステムと方法

Country Status (3)

Country Link
US (1) US8166056B2 (ja)
EP (1) EP1962208A3 (ja)
JP (1) JP5222581B2 (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8918717B2 (en) * 2007-05-07 2014-12-23 International Business Machines Corporation Method and sytem for providing collaborative tag sets to assist in the use and navigation of a folksonomy
US20090083278A1 (en) * 2007-09-26 2009-03-26 Yihong Zhao System and method for discovering and presenting social relationships between internet users and content
US20090119572A1 (en) * 2007-11-02 2009-05-07 Marja-Riitta Koivunen Systems and methods for finding information resources
US7953731B2 (en) * 2007-11-19 2011-05-31 Cisco Technology, Inc. Enhancing and optimizing enterprise search
US20120030553A1 (en) * 2008-06-13 2012-02-02 Scrible, Inc. Methods and systems for annotating web pages and managing annotations and annotated web pages
US20100094831A1 (en) * 2008-10-14 2010-04-15 Microsoft Corporation Named entity resolution using multiple text sources
KR101010997B1 (ko) * 2009-03-24 2011-01-26 한국과학기술원 다종 웹 서버 간 유사 사용자 추출 시스템 및 그 방법
CN101694666B (zh) * 2009-07-17 2011-03-30 刘二中 文件内容的特征词的输入和处理方法
US8365064B2 (en) * 2009-08-19 2013-01-29 Yahoo! Inc. Hyperlinking web content
GB2490838A (en) * 2010-02-03 2012-11-14 Occam Inc Intuitive, contextual information search and presentation systems and methods
US20110251837A1 (en) * 2010-04-07 2011-10-13 eBook Technologies, Inc. Electronic reference integration with an electronic reader
US8719285B2 (en) * 2011-12-22 2014-05-06 Yahoo! Inc. System and method for automatic presentation of content-related data with content presentation
CN102708192B (zh) * 2012-05-15 2017-11-28 华为技术有限公司 一种文档共享的方法及***、设备
US9898167B2 (en) * 2013-03-15 2018-02-20 Palantir Technologies Inc. Systems and methods for providing a tagging interface for external content
US9171173B1 (en) * 2014-10-02 2015-10-27 Terbium Labs LLC Protected indexing and querying of large sets of textual data
US9858349B2 (en) 2015-02-10 2018-01-02 Researchgate Gmbh Online publication system and method
US9753922B2 (en) 2015-05-19 2017-09-05 Researchgate Gmbh Enhanced online user-interaction tracking
WO2018156558A1 (en) * 2017-02-22 2018-08-30 Camelot Uk Bidco Limited Systems and methods for direct in-browser markup of elements in internet content
CN108717714B (zh) * 2018-05-23 2021-06-11 曜科智能科技(上海)有限公司 多相机标定方法、标定***、存储介质、及电子设备
CN109005049B (zh) * 2018-05-25 2021-10-15 浙江工业大学 一种互联网环境下基于Bigraph一致性算法的服务组合方法

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7171016B1 (en) * 1993-11-18 2007-01-30 Digimarc Corporation Method for monitoring internet dissemination of image, video and/or audio files
US5835905A (en) * 1997-04-09 1998-11-10 Xerox Corporation System for predicting documents relevant to focus documents by spreading activation through network representations of a linked collection of documents
US6564202B1 (en) * 1999-01-26 2003-05-13 Xerox Corporation System and method for visually representing the contents of a multiple data object cluster
US6687878B1 (en) * 1999-03-15 2004-02-03 Real Time Image Ltd. Synchronizing/updating local client notes with annotations previously made by other clients in a notes database
US9141717B2 (en) * 1999-03-22 2015-09-22 Esdr Network Solutions Llc Methods, systems, products, and devices for processing DNS friendly identifiers
US6615199B1 (en) * 1999-08-31 2003-09-02 Accenture, Llp Abstraction factory in a base services pattern environment
US6360951B1 (en) * 1999-12-16 2002-03-26 Xerox Corporation Hand-held scanning system for heuristically organizing scanned information
GB0023938D0 (en) * 2000-09-29 2000-11-15 British Telecomm Information access
US6907459B2 (en) * 2001-03-30 2005-06-14 Xerox Corporation Systems and methods for predicting usage of a web site using proximal cues
US7043535B2 (en) * 2001-03-30 2006-05-09 Xerox Corporation Systems and methods for combined browsing and searching in a document collection based on information scent
AU2003210803A1 (en) * 2002-02-01 2003-09-02 John Fairweather A system and method for real time interface translation
US7257774B2 (en) * 2002-07-30 2007-08-14 Fuji Xerox Co., Ltd. Systems and methods for filtering and/or viewing collaborative indexes of recorded media
US20070067297A1 (en) * 2004-04-30 2007-03-22 Kublickis Peter J System and methods for a micropayment-enabled marketplace with permission-based, self-service, precision-targeted delivery of advertising, entertainment and informational content and relationship marketing to anonymous internet users
US7707265B2 (en) * 2004-05-15 2010-04-27 International Business Machines Corporation System, method, and service for interactively presenting a summary of a web site
US7519573B2 (en) * 2004-08-23 2009-04-14 Fuji Xerox Co., Ltd. System and method for clipping, repurposing, and augmenting document content
US20070118794A1 (en) * 2004-09-08 2007-05-24 Josef Hollander Shared annotation system and method
US7702611B2 (en) * 2005-01-07 2010-04-20 Xerox Corporation Method for automatically performing conceptual highlighting in electronic text
WO2008045792A2 (en) * 2006-10-06 2008-04-17 Technorati, Inc. Methods and apparatus for conversational advertising
US20080147821A1 (en) * 2006-12-19 2008-06-19 Dietrich Bradley W Managed peer-to-peer content backup service system and method using dynamic content dispersal to plural storage nodes

Also Published As

Publication number Publication date
EP1962208A3 (en) 2009-01-07
EP1962208A2 (en) 2008-08-27
US20080201320A1 (en) 2008-08-21
JP2008204454A (ja) 2008-09-04
US8166056B2 (en) 2012-04-24

Similar Documents

Publication Publication Date Title
JP5384837B2 (ja) 文書に注釈を付するシステムと方法
JP5222581B2 (ja) 文書に注釈を付するシステムと方法
US8745039B2 (en) Method and system for user guided search navigation
JP4837040B2 (ja) ブログ文書のランク付け
JP5431727B2 (ja) 関連性判定方法、情報収集方法、オブジェクト組織化方法及び検索システム
US8819003B2 (en) Query refinement based on user selections
US8762326B1 (en) Personalized hot topics
AU2010343183B2 (en) Search suggestion clustering and presentation
US10162802B1 (en) Systems and methods for syndicating and hosting customized news content
US20100100607A1 (en) Adjusting Content To User Profiles
US20130339840A1 (en) System and method for logical chunking and restructuring websites
US7698329B2 (en) Method for improving quality of search results by avoiding indexing sections of pages
JP2010257453A (ja) サーチクエリデータを用いて文書にタグ付けするシステム
US7895337B2 (en) Systems and methods of generating a content aware interface
EP1962202A2 (en) System and method for annotating documents
US10235459B1 (en) Creating entries in at least one of a personal cache and a personal index
JP5379627B2 (ja) 検索制御装置、検索制御方法、及びプログラム
EP1962201A2 (en) System and method for annotating documents using a viewer
KR20120020558A (ko) 폭소노미 기반 개인화 웹 검색 방법 및 이를 수행하는 시스템
JP5416023B2 (ja) 閲覧端末及び方法
Liu et al. Post-processing of deep web information extraction based on domain ontology
JP5525424B2 (ja) 文書検索装置、文書検索方法及び文書検索プログラム
US10909127B2 (en) Method and server for ranking documents on a SERP
US9898544B2 (en) Guided web navigation tool
CN116861106A (zh) 数据处理方法、装置、设备、存储介质及计算机程序产品

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110208

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120621

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120703

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121001

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130311

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160315

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5222581

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250