JP5222581B2 - 文書に注釈を付するシステムと方法 - Google Patents
文書に注釈を付するシステムと方法 Download PDFInfo
- Publication number
- JP5222581B2 JP5222581B2 JP2008032612A JP2008032612A JP5222581B2 JP 5222581 B2 JP5222581 B2 JP 5222581B2 JP 2008032612 A JP2008032612 A JP 2008032612A JP 2008032612 A JP2008032612 A JP 2008032612A JP 5222581 B2 JP5222581 B2 JP 5222581B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- tag
- profile
- user
- annotation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Document Processing Apparatus (AREA)
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
以下で定義される用語は、特許請求の範囲と図面と含む本特許出願明細書を通じて、その示された意味を有する。
図1は、本明細書に開示の実施の形態を実行するための例示の操作環境100を示す。この例示の操作環境において、汎用コンピュータ104は、インターネットのようなネットワーク102上で共に通信し得るが、クライアント側またはサーバ側のいずれかの操作を実行するようにプログラムされている。当業者なら分かることであるが、クライアントサーバ配置の別法が存在する。例えば、中央ターミナルベース配置またはこれらの組み合わせ配置である。クライアント側操作は、クライアント側アプリケーションモジュール106をロードした汎用コンピュータ104で実行される。モジュール106は、注釈プラグイン108とウェブブラウザ110(例えば、インターネットエクスプローラ、ファイアフォックス、またはサファリ)を備える。サーバ側操作は、一個または複数個のサーバ側アプリケーションモジュール112をロードした汎用コンピュータで実行される。モジュール112は、一個または複数個の注釈モジュール114、ページタグ付加モジュール116、ウェブページ(またはウェブ文書)サーバ118、およびタグベース探索サーバ120のうちの一個またはそれらの組み合わせを備える。
図3は、図1に示される例示の操作環境100における注釈サーバ113と注釈クライアント(複数を含む)111とによって実行される諸操作を示すフローチャートである。注釈サーバ113と注釈クライアント(複数を含む)111とにより、サブ文書エレメントのダイナミック注釈が可能となる。例示であって、限定目的ではないが、本明細書に記載の例は、ウェブページのパラグラフなるサブ文書エレメントの注釈に関する。当業者なら分かるように、相異なるサブ文書エレメントと文書、またはこれらの組み合わせも、本発明で可能となるダイナミック注釈の操作を行う時に代わりに使用し得る。
図7は、注釈を作成し、共有するための例示的ユーザインターフェイス700を示す。ユーザインターフェイス700のトップには、「remove」と「add」コマンドを含む制御エリア702があり、ユーザは、共同ユーザを指定して、その共同ユーザの注釈が、ユーザが閲覧中の文書中にディスプレイされるのを見たいかどうかを決め得る。
ウェブベースの注釈サービス、例えば、クライアント側注釈モジュール106で利用可能となったものを使用して、ユーザは、ウェブ文書をブックマークに記憶し、ページレベルで文書ブックマークに(そして、別の実施の形態では、サブ文書エレメントレベルで文書エレメントに)タグまたはキーワードのセットを付加する(または、より一般的には、例えば、ハイライトしたりコメントを付けたりすることによる注釈付加する)能力が与えられる。従って、ユーザは、ユーザのタグのセットを使用して、ユーザの個人的ブックマークコレクションからその文書を探索し、検索し得る。さらに、ユーザは、自身のブックマーク(そして、関連タグまたはキーワード)をすべてのユーザに完全公開して、または選択された共同ユーザに半公開して共有するかを決定し得る。共有されたブックマークは、そうすれば他のユーザがブラウズしたり、探索したりするのが可能となる。ユーザが一所懸命に創り上げた文書ブックマークコレクションをこのように協力的に共有することによって、ユーザは、ユーザが共有する(すなわち、協力的に開発された)ブックマークコレクションを使用して諸々のブックマークに記憶された文書を発見するという便益を享受し得る。
〔数1〕
A[1] = E;
A[2] =αM*A[1]+βE;
・
・
・
A[n] =αM*A[n-1]+βE;
式中、
A[1],A[2],…A[n]は、URLとタグの繰り返し計算されたプロフィールベ
クトルで、
Eは、タグまたは文書エントリノードを表す単位ベクトルで、
Mは、選択されたエントリノードに従って列または行で配列されたバイグラフ(または、より一般的にはn次元グラフ)のマトリックス表現で、
αとβは、活性化拡散を調整するためのパラメータである。
上記の説明を考慮すれば、ウェブページに注釈を付するための実施の形態は、以下の諸ステップ、すなわち、複数の文書識別子とタグのそれらの関連セットとをURL/TAGペアのセットに変換するステップと、前記URL/TAGペアセットを使用して二次元グラフを構成するステップと、前記二次元グラフを使用し、前記URL/TAGペアセットの文書識別子とタグに対する活性化拡散を用いタグプロフィールと文書プロフィールとを計算するステップと、選択されたタグまたは文書に対して、選択されたタグまたは文書に関連したタグプロフィールまたは文書プロフィールをそれぞれ識別するステップと、選択されたタグまたは文書に関連した、前記識別されたタグプロフィールまたは文書プロフィールのタグまたは文書を適切性に従って配列するステップとを備える方法によって実施し得る。
Claims (3)
- コンピュータに
複数の文書識別子とタグのそれらの関連セットとをURL/TAGペアのセットに変換する手順と、
前記URL/TAGペアセットを使用して二次元グラフを構成する手順と、
前記二次元グラフを使用し、URL/TAGのセットの文書識別子とタグに対する活性化拡散を用いタグプロフィールと文書プロフィールとを計算する手順と、
選択されたタグまたは文書に対して、選択されたタグまたは文書に関連したタグプロフィールまたは文書プロフィールをそれぞれ識別する手順と、
選択されたタグまたは文書に関連した、前記識別されたタグプロフィールまたは文書プロフィールのタグまたは文書を適切性に従って配列する手順と、
文書プロフィールを、同様なプロフィールを識別するために他の文書プロフィールに対してランク付けする手順と、
既定の閾値以上にランク付けされたそれらの同様なプロフィールの文書を、アウトプット用に識別する手順と、
を実行させるための探索プログラム。 - 請求項1に記載の探索プログラムにおいて、タグプロフィールと文書プロフィールとが、ベクトルAとして活性化拡散を繰り返し使用して、次式:
A[1] = E;
A[2] =αM*A[1]+βE;
・
・
・
A[n] =αM*A[n-1]+βE;
(式中、
A[1],A[2],…A[n]は、URLとタグの繰り返し計算されたプロフィールベクトルで、
Eは、タグまたは文書を表す単位ベクトルで、
Mは、選択されたタグまたは文書に従って列または行で配列された二次元グラフのマトリックス表現で、
αとβは、活性化拡散を調整するためのパラメータである)
に従って計算されることを特徴とする探索プログラム。 - 請求項1に記載の探索プログラムにおいて、前記ランク付けが、選択された文書が二次元グラフにないときでも、二次元グラフを構成するのに使用された文書であって、前記選択された文書と同等な類似度を有する文書をそれに代替することによって、実行されることを特徴とする探索プログラム。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US89046407P | 2007-02-16 | 2007-02-16 | |
US60/890,464 | 2007-02-16 | ||
US11/837,942 US8166056B2 (en) | 2007-02-16 | 2007-08-13 | System and method for searching annotated document collections |
US11/837,942 | 2007-08-13 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008204454A JP2008204454A (ja) | 2008-09-04 |
JP5222581B2 true JP5222581B2 (ja) | 2013-06-26 |
Family
ID=39627640
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008032612A Active JP5222581B2 (ja) | 2007-02-16 | 2008-02-14 | 文書に注釈を付するシステムと方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8166056B2 (ja) |
EP (1) | EP1962208A3 (ja) |
JP (1) | JP5222581B2 (ja) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8918717B2 (en) * | 2007-05-07 | 2014-12-23 | International Business Machines Corporation | Method and sytem for providing collaborative tag sets to assist in the use and navigation of a folksonomy |
US20090083278A1 (en) * | 2007-09-26 | 2009-03-26 | Yihong Zhao | System and method for discovering and presenting social relationships between internet users and content |
US20090119572A1 (en) * | 2007-11-02 | 2009-05-07 | Marja-Riitta Koivunen | Systems and methods for finding information resources |
US7953731B2 (en) * | 2007-11-19 | 2011-05-31 | Cisco Technology, Inc. | Enhancing and optimizing enterprise search |
US20120030553A1 (en) * | 2008-06-13 | 2012-02-02 | Scrible, Inc. | Methods and systems for annotating web pages and managing annotations and annotated web pages |
US20100094831A1 (en) * | 2008-10-14 | 2010-04-15 | Microsoft Corporation | Named entity resolution using multiple text sources |
KR101010997B1 (ko) * | 2009-03-24 | 2011-01-26 | 한국과학기술원 | 다종 웹 서버 간 유사 사용자 추출 시스템 및 그 방법 |
CN101694666B (zh) * | 2009-07-17 | 2011-03-30 | 刘二中 | 文件内容的特征词的输入和处理方法 |
US8365064B2 (en) * | 2009-08-19 | 2013-01-29 | Yahoo! Inc. | Hyperlinking web content |
GB2490838A (en) * | 2010-02-03 | 2012-11-14 | Occam Inc | Intuitive, contextual information search and presentation systems and methods |
US20110251837A1 (en) * | 2010-04-07 | 2011-10-13 | eBook Technologies, Inc. | Electronic reference integration with an electronic reader |
US8719285B2 (en) * | 2011-12-22 | 2014-05-06 | Yahoo! Inc. | System and method for automatic presentation of content-related data with content presentation |
CN102708192B (zh) * | 2012-05-15 | 2017-11-28 | 华为技术有限公司 | 一种文档共享的方法及***、设备 |
US9898167B2 (en) * | 2013-03-15 | 2018-02-20 | Palantir Technologies Inc. | Systems and methods for providing a tagging interface for external content |
US9171173B1 (en) * | 2014-10-02 | 2015-10-27 | Terbium Labs LLC | Protected indexing and querying of large sets of textual data |
US9858349B2 (en) | 2015-02-10 | 2018-01-02 | Researchgate Gmbh | Online publication system and method |
US9753922B2 (en) | 2015-05-19 | 2017-09-05 | Researchgate Gmbh | Enhanced online user-interaction tracking |
WO2018156558A1 (en) * | 2017-02-22 | 2018-08-30 | Camelot Uk Bidco Limited | Systems and methods for direct in-browser markup of elements in internet content |
CN108717714B (zh) * | 2018-05-23 | 2021-06-11 | 曜科智能科技(上海)有限公司 | 多相机标定方法、标定***、存储介质、及电子设备 |
CN109005049B (zh) * | 2018-05-25 | 2021-10-15 | 浙江工业大学 | 一种互联网环境下基于Bigraph一致性算法的服务组合方法 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7171016B1 (en) * | 1993-11-18 | 2007-01-30 | Digimarc Corporation | Method for monitoring internet dissemination of image, video and/or audio files |
US5835905A (en) * | 1997-04-09 | 1998-11-10 | Xerox Corporation | System for predicting documents relevant to focus documents by spreading activation through network representations of a linked collection of documents |
US6564202B1 (en) * | 1999-01-26 | 2003-05-13 | Xerox Corporation | System and method for visually representing the contents of a multiple data object cluster |
US6687878B1 (en) * | 1999-03-15 | 2004-02-03 | Real Time Image Ltd. | Synchronizing/updating local client notes with annotations previously made by other clients in a notes database |
US9141717B2 (en) * | 1999-03-22 | 2015-09-22 | Esdr Network Solutions Llc | Methods, systems, products, and devices for processing DNS friendly identifiers |
US6615199B1 (en) * | 1999-08-31 | 2003-09-02 | Accenture, Llp | Abstraction factory in a base services pattern environment |
US6360951B1 (en) * | 1999-12-16 | 2002-03-26 | Xerox Corporation | Hand-held scanning system for heuristically organizing scanned information |
GB0023938D0 (en) * | 2000-09-29 | 2000-11-15 | British Telecomm | Information access |
US6907459B2 (en) * | 2001-03-30 | 2005-06-14 | Xerox Corporation | Systems and methods for predicting usage of a web site using proximal cues |
US7043535B2 (en) * | 2001-03-30 | 2006-05-09 | Xerox Corporation | Systems and methods for combined browsing and searching in a document collection based on information scent |
AU2003210803A1 (en) * | 2002-02-01 | 2003-09-02 | John Fairweather | A system and method for real time interface translation |
US7257774B2 (en) * | 2002-07-30 | 2007-08-14 | Fuji Xerox Co., Ltd. | Systems and methods for filtering and/or viewing collaborative indexes of recorded media |
US20070067297A1 (en) * | 2004-04-30 | 2007-03-22 | Kublickis Peter J | System and methods for a micropayment-enabled marketplace with permission-based, self-service, precision-targeted delivery of advertising, entertainment and informational content and relationship marketing to anonymous internet users |
US7707265B2 (en) * | 2004-05-15 | 2010-04-27 | International Business Machines Corporation | System, method, and service for interactively presenting a summary of a web site |
US7519573B2 (en) * | 2004-08-23 | 2009-04-14 | Fuji Xerox Co., Ltd. | System and method for clipping, repurposing, and augmenting document content |
US20070118794A1 (en) * | 2004-09-08 | 2007-05-24 | Josef Hollander | Shared annotation system and method |
US7702611B2 (en) * | 2005-01-07 | 2010-04-20 | Xerox Corporation | Method for automatically performing conceptual highlighting in electronic text |
WO2008045792A2 (en) * | 2006-10-06 | 2008-04-17 | Technorati, Inc. | Methods and apparatus for conversational advertising |
US20080147821A1 (en) * | 2006-12-19 | 2008-06-19 | Dietrich Bradley W | Managed peer-to-peer content backup service system and method using dynamic content dispersal to plural storage nodes |
-
2007
- 2007-08-13 US US11/837,942 patent/US8166056B2/en not_active Expired - Fee Related
-
2008
- 2008-02-12 EP EP20080151297 patent/EP1962208A3/en not_active Ceased
- 2008-02-14 JP JP2008032612A patent/JP5222581B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
EP1962208A3 (en) | 2009-01-07 |
EP1962208A2 (en) | 2008-08-27 |
US20080201320A1 (en) | 2008-08-21 |
JP2008204454A (ja) | 2008-09-04 |
US8166056B2 (en) | 2012-04-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5384837B2 (ja) | 文書に注釈を付するシステムと方法 | |
JP5222581B2 (ja) | 文書に注釈を付するシステムと方法 | |
US8745039B2 (en) | Method and system for user guided search navigation | |
JP4837040B2 (ja) | ブログ文書のランク付け | |
JP5431727B2 (ja) | 関連性判定方法、情報収集方法、オブジェクト組織化方法及び検索システム | |
US8819003B2 (en) | Query refinement based on user selections | |
US8762326B1 (en) | Personalized hot topics | |
AU2010343183B2 (en) | Search suggestion clustering and presentation | |
US10162802B1 (en) | Systems and methods for syndicating and hosting customized news content | |
US20100100607A1 (en) | Adjusting Content To User Profiles | |
US20130339840A1 (en) | System and method for logical chunking and restructuring websites | |
US7698329B2 (en) | Method for improving quality of search results by avoiding indexing sections of pages | |
JP2010257453A (ja) | サーチクエリデータを用いて文書にタグ付けするシステム | |
US7895337B2 (en) | Systems and methods of generating a content aware interface | |
EP1962202A2 (en) | System and method for annotating documents | |
US10235459B1 (en) | Creating entries in at least one of a personal cache and a personal index | |
JP5379627B2 (ja) | 検索制御装置、検索制御方法、及びプログラム | |
EP1962201A2 (en) | System and method for annotating documents using a viewer | |
KR20120020558A (ko) | 폭소노미 기반 개인화 웹 검색 방법 및 이를 수행하는 시스템 | |
JP5416023B2 (ja) | 閲覧端末及び方法 | |
Liu et al. | Post-processing of deep web information extraction based on domain ontology | |
JP5525424B2 (ja) | 文書検索装置、文書検索方法及び文書検索プログラム | |
US10909127B2 (en) | Method and server for ranking documents on a SERP | |
US9898544B2 (en) | Guided web navigation tool | |
CN116861106A (zh) | 数据处理方法、装置、设备、存储介质及计算机程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110208 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120621 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120703 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121001 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130212 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130311 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160315 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5222581 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |