JP2008071372A - Method and device for searching data of database - Google Patents

Method and device for searching data of database Download PDF

Info

Publication number
JP2008071372A
JP2008071372A JP2007315289A JP2007315289A JP2008071372A JP 2008071372 A JP2008071372 A JP 2008071372A JP 2007315289 A JP2007315289 A JP 2007315289A JP 2007315289 A JP2007315289 A JP 2007315289A JP 2008071372 A JP2008071372 A JP 2008071372A
Authority
JP
Japan
Prior art keywords
data
search
categories
category
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2007315289A
Other languages
Japanese (ja)
Inventor
Marc F Krellenstein
エフ. クレレスタイン マーク
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northern Light Technology LLC
Original Assignee
Northern Light Technology LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northern Light Technology LLC filed Critical Northern Light Technology LLC
Publication of JP2008071372A publication Critical patent/JP2008071372A/en
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99934Query formulation, input preparation, or translation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a method and a device suitable for searching a database comprising both pieces of information of the Internet and a rate system content. <P>SOLUTION: In this method and device for searching data of the database, search results are organized into a set of most relevant categories, and a user can thereby obtain only the most relevant data by clicking a mouse a few times. The search device searches the database containing the Internet data and the rate system content data, in response to a search command from the user, to generate a search result list corresponding to a set of the selected data. The search device processes the search result list to generate dynamically a set of search result categories. <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

本発明の分野
本発明は一般的にデータベースのデータを検索するための方法と装置に関わるものである。特に、本発明は、インターネットと料金制コンテンツの情報の両方から成るデータベースを検索するための方法と装置に関わるものである。
The present invention relates generally to a method and apparatus for retrieving data in a database. In particular, the present invention relates to a method and apparatus for searching a database comprising both the Internet and fee-based content information.

本発明の背景
毎日インターネットは数百万人もの人を魅了している。1995年末に1、000万人いたインターネットのユーザは、2000年には1億7千万人になると予想されている。インターネットの主だった魅力は、思い当たるいかなる題材についても大量の情報が入手できるということの可能性である。リサーチによると、ユーザによる主なインターネットの利用は、情報検索と(その検索した)情報を拾い読みすることを含んでいる。
Background of the Invention Every day the Internet attracts millions of people. The number of Internet users, which was 10 million at the end of 1995, is expected to be 170 million in 2000. The main attraction of the Internet is the possibility that a large amount of information is available on any material that comes to mind. According to research, the primary use of the Internet by users involves information retrieval and browsing the information (which it has retrieved).

検索のサービスを提供し、ユーザがインターネットの莫大で、急成長し、無限大に広がるデータの検索を提供している会社かいくつかある。多数のインターネットユーザは、1週間に数回、検索サービスを利用し、上位20%のインターネットユーザは一日に何度も検索エンジンを利用するのである。   There are several companies that offer search services, and users search for huge, fast-growing, infinite data on the Internet. Many Internet users use search services several times a week, and the top 20% of Internet users use search engines many times a day.

しかし、インターネットに欠点が無いわけではない。公共につながるインターネットには250ギガバイトもの文章の情報があり、多くのインターネットのユーザは次の理由で、情報の検索を妨害されている。(1)質の高い情報は常にインターネットには無い、(2)質の高い情報は存在はするが、独占された購読に基づくサイトに分散されている、(3)検索サービスが提供する情報が莫大すぎる、もしくは少なすぎる(4)検索サービスがユーザの要求に対応していない。   But the Internet is not without its drawbacks. The public Internet has 250 gigabytes of textual information, and many Internet users are blocked from searching for information for the following reasons: (1) High quality information is not always available on the Internet, (2) High quality information exists, but distributed on sites based on exclusive subscriptions, (3) Information provided by search services Too much or too few (4) Search service does not meet user requests.

インターネットは、製品カタログとしてはすばらしい種類の情報源である。しかし、インターネットは、論説の情報、参照の情報、論評の情報には非常に乏しい情報源である。この障害の一つの理由は、質の高い情報(つまり、料金制コンテンツ)がほとんどの場合にその情報にお金を出している会社(つまり、料金制コンテンツの所有者)によって作成されたり、提供されたりしているからである。インターネットのコストの要らない情報の伝統では、料金制コンテンツの所有者がインターネットを通じて利用可能な情報を提供することを妨げる。他の理由は、インターネットの料金制コンテンツを開発し、マーケットし、維持するのに必要なかなりの資金的そして資本の投機である。産業の観察筋では、インターネットの料金制コンテンツについて、どのビジネス・モデルが最終的に道理にかなった利益を実現するか、不確かであるとしている。これら要素の結果として、インターネットは、現在はいかなる論題においても最も認識されているコンテンツの主なる情報源であると思われていない。   The Internet is a great source of information for a product catalog. However, the Internet is a very scarce resource for editorial information, reference information, and commentary information. One reason for this impediment is that the quality information (ie, fee-based content) is created or provided by the company (ie, the owner of the fee-based content) that mostly pays for that information. It is because it is. The inexpensive information tradition of the Internet prevents fee-based content owners from providing information available through the Internet. Another reason is the considerable financial and capital speculation needed to develop, market and maintain Internet pricing content. Industry observers say it is uncertain which business model will ultimately make a reasonable profit for Internet-based content. As a result of these factors, the Internet is not currently considered the primary source of content that is most recognized on any topic.

上記理由にも関わらず、いくつかの料金制コンテンツの所有者は、典型的な購読サービスという形で、インターネットでの利用可能な情報を作り出している。しかし、これらのサービスにはたくさんの問題があり、従って常にインターネットのユーザにとっては良い解決手段にはならない。   Despite the above reasons, some fee-based content owners have created information available on the Internet in the form of typical subscription services. However, these services have many problems and are therefore not always a good solution for Internet users.

購読サービスの一つの問題は、ユーザは複数の検索をしなければならなく、検索されている題材についての広範囲の情報を得るために複数のサイト(頻繁には、サイト毎の複数のデータベースを含む)を検索することである。本当に満足のゆく結果を得るには、ユーザはよくインターネットから大量の情報を検索できるサーチ・エンジンを利用する。この検索情報を簡単にまとめあげる方法のないまま、ユーザはその価値にしては、このプロセスが厄介すぎて、時間のかかることであると感じるのである。他の問題は、ユーザは興味のある論題全てについてのニーズを満足するために複数の購読サービスにサイン・アップするのに高額な料金を支払わざるを得ないということである。普通ユーザは異なる興味を持ち、多くの人は複数の論題について複数の購読にサイン・アップすることを好まない。さらに他の問題は、ユーザが、全ての必要なものを前もって購読するために、何を検索するのか知っていることを要求されることである。現実には、多くのユーザの興味のある情報は、その場限りで持続期間の短いものである。購読サービスは、この種の情報のニーズを満たすことはできない。   One problem with the subscription service is that the user must do multiple searches and multiple sites (often including multiple databases per site) to obtain extensive information about the material being searched. ). To get really satisfying results, users often use search engines that can retrieve large amounts of information from the Internet. Without a simple way to organize this search information, the user feels that the process is too cumbersome and time consuming. Another problem is that users are forced to pay high fees to sign up for multiple subscription services to meet the needs of all topics of interest. Ordinary users have different interests and many people do not like to sign up for multiple subscriptions on multiple topics. Yet another problem is that the user is required to know what to search to subscribe in advance to everything they need. In reality, the information that many users are interested in is short-lived on an ad hoc basis. Subscription services cannot meet this type of information needs.

ユーザが最先端の検索エンジンの一つにアクセスすると、検索は数百もの、ひいては数千にも及ぶヒット(つまりデータ)を生じ得る。例えば、Alta Vista TM検索エンジンでは、「windows」という検索で数十万ものヒットを返してくる。この情報の洪水は普通検閲したり、選び分けたり、選択したりするには多すぎるのである。この問題は、検索エンジンが検索の結果のリストのヒットを、有意義な方法によってグループ分けしないので、ますます悪化している。上記の例では、Windows(登録商標)95のソフトウェア製品情報は建物の窓と個人的なページと一緒に検索結果のリストに含まれる。また、多くの最先端の検索エンジンは、個々のhtmlのページを個別のヒットとして見ており、従って100ページのウェブ・サイトは、100のヒットを検索結果のリストに生じることになるのである。この問題を処理するのに、幾つかの検索エンジンではウェブ・サイト毎のグループ・ヒットをするのである。 When a user accesses one of the state-of-the-art search engines, the search can result in hundreds and even thousands of hits (ie data). For example, the Alta Vista search engine returns hundreds of thousands of hits for a search for “windows”. This flood of information is usually too much to be censored, sorted out, or selected. This problem is exacerbated because the search engine does not group search result list hits in a meaningful way. In the example above, the software product information for Windows 95 is included in the search results list along with the building window and personal page. Also, many state-of-the-art search engines view individual html pages as individual hits, so a 100 page web site will yield 100 hits in the search results list. To deal with this problem, some search engines make group hits per web site.

多くの最先端の検索エンジンは、原始的ともいえる適切なランキングをつけるルーチンを使い、その結果、わずかか、まったく適切ではないランキングのついた検索結果をリストするのである。不十分にランク付けされた検索結果のリストは、消費者にとっては重要な問題である。もし、検索エンジンが100のヒットを生じる場合、一番興味のある情報が見つかるかどうかユーザは20もの画面の情報を閲覧しなければならない。ほとんどのユーザは、最初の数画面で諦めることが報告されている。したがって、もしとても適した情報が、後の画面にあったとしても、ほとんどのユーザは知ることもなく、検索が失敗に終わるのである。   Many state-of-the-art search engines use a routine that ranks properly, even primitive, and as a result lists search results with rankings that are slightly or not at all appropriate. A poorly ranked list of search results is an important issue for consumers. If the search engine produces 100 hits, the user must browse 20 screens to see if the most interesting information is found. Most users are reported to give up on the first few screens. Therefore, even if there is very suitable information on a later screen, most users will not know and the search will fail.

2つの最先端の検索エンジンであるExciteTMとYahooTMは、マニュアルでインターネットをカテゴリー分けし、見出しをつけている。このアプローチだと、ディレクトリ構造はウェブサイトの高い質の見出しと適切なカテゴリー分けのあるものとなる。しかし、これらの企業の編集スタッフは、インターネットの成長に追いつくことができないと考える。数百人もの編集のスタッフがいたとしても、これらの企業は充分なウェブ・サイトを訪れることができず、そしてサイトが変更する毎にすべてのサイトを再訪問することもできない。したがって、これらの企業はインターネットの大部分をカバーすることはできないのである。結果として、これらの検索エンジンを使った検索が役に立つ情報を返してくることは「ほとんど無い」のである。 Two state-of-the-art search engines, Excite and Yahoo , categorize the Internet in manuals and add headings. With this approach, the directory structure has a high quality headline and proper categorization of the website. But the editorial staff of these companies don't think they can keep up with the growth of the Internet. Even with hundreds of editorial staff, these companies can't visit enough web sites, and they can't revisit every site every time the site changes. Therefore, these companies cannot cover the majority of the Internet. As a result, searches using these search engines return almost no useful information.

本発明の要約
本発明は、インターネットと料金制コンテンツデータを含み得る、データベースを検索するための方法と装置に関わるものである。本発明は、ユーザがインターネットの豊富な情報と、インターネットに無い料金制コンテンツデータにユーザがアクセスすることを提供する。本発明は、意味のある検索結果のリストを検索結果のカテゴリーのセットという形式で提供する為に、詳細である関連性基準と共に複雑なカテゴリー分けする方法を使用する。ユーザには、最も関連性のあるデータのリストと共に、小数のカテゴリーを表示する。それぞれのカテゴリーは、さらに細かいカテゴリーおよび/または最も関連性のあるデータのリストを含むことができる。検索リストの結果をヒエラルキーとして整理することにより、ユーザはその結果に圧倒されることなく、これらの幾つかのインターネットのデータの検索を短時間にして興味のある対象に集中することができるのである。
SUMMARY OF THE INVENTION The present invention relates to a method and apparatus for searching a database that can include the Internet and fee-based content data. The present invention provides the user with access to a wealth of information on the Internet and fee-based content data not available on the Internet. The present invention uses a complex categorization method with detailed relevance criteria to provide a meaningful list of search results in the form of a set of search result categories. The user is presented with a small number of categories along with a list of the most relevant data. Each category can include a more detailed category and / or a list of the most relevant data. By organizing the search list results as a hierarchy, users can focus their search on these Internet data in a short amount of time without being overwhelmed by the results. .

一つの側面からすると、本発明はデータベースのデータを検索する方法を示す。データベースは、インターネットと料金制コンテンツデータを含むことができる。ユーザからの検索指示の応答としてデータベースが検索され、選択されたデータのセットを含む検索結果のリストを生成する。検索結果のリストの一部は、検索結果のカテゴリーを状況に合わせて作成するために処理される。実施例では、検索結果のリストの一部は、選択されたデータのセットの中で最も関連性のあるデータの最初の200(または100)となり得る。それぞれの検索結果のカテゴリーは、検索結果リスト内のデータのサブセットと関連付けられる。   From one aspect, the present invention shows a method for retrieving data in a database. The database can include the Internet and fee-based content data. The database is searched in response to a search instruction from the user, and a list of search results including the selected set of data is generated. A portion of the list of search results is processed to create search result categories tailored to the situation. In an embodiment, the portion of the list of search results may be the first 200 (or 100) of the most relevant data in the selected set of data. Each search result category is associated with a subset of the data in the search result list.

本発明は、検索結果のリストを編集するのにデータベースに蓄積されたデータを呼び出す為のカテゴリー分け(またはクラスタリング)の方法論を使用している。この方法論は、候補のカテゴリーを識別する、候補のカテゴリーを加重する、そして候補のカテゴリーから選択された検索結果のカテゴリーのセットを表示する、の3つの主なステップを持つ。   The present invention uses a categorization (or clustering) methodology for recalling data stored in a database to edit a list of search results. This methodology has three main steps: identifying candidate categories, weighting candidate categories, and displaying a set of search result categories selected from candidate categories.

検索リスト内のそれぞれのデータは、関連した件名、種類、ソース、そして言語の特徴を持つことが出来る。データに関連する共通した特徴は識別され、共通した特徴を持つデータは候補のカテゴリー別にグループ分けされる。候補のカテゴリーのリストは、可能性のある検索結果のカテゴリーの代表的なものとなり、編集される。各候補カテゴリーは候補カテゴリー内のデータの識別された共通特徴の関数として加重される。一つ以上の候補のカテゴリーが、データの識別された共通の特徴の関数として選択される。例えば、約5つから10の検索結果のカテゴリーが候補のカテゴリーから選択されることができるのである。カテゴリーによるグラフィカルな表示が、カテゴリーのユーザ画面にされる。カテゴリーは、ユーザ画面に多数のフォルダとして表示することができる。   Each piece of data in the search list can have associated subject, type, source, and language characteristics. Common features associated with the data are identified, and data with common features are grouped into candidate categories. The list of candidate categories is representative of potential search result categories and is edited. Each candidate category is weighted as a function of the identified common features of the data within the candidate category. One or more candidate categories are selected as a function of the identified common features of the data. For example, approximately 5 to 10 search result categories can be selected from the candidate categories. A graphical display by category is displayed on the category user screen. Categories can be displayed as multiple folders on the user screen.

他の面では、本発明は、データベースのデータを検索する検索装置としての特徴を持つ。データベースは、インターネットのデータと料金制コンテンツデータを含む多数のデータからなる。装置は、検索プロセッサとグルーピングプロセッサを含む。グルーピングプロセッサは、データプロセッサ、候補生成機、加重プロセッサ、ディスプレイプロセッサを含む。これらのそれぞれの構成はソフトウェアのモジュールである。代替案として、それぞれのプロセッサは、ハードウェアのモジュールまたは、ハードウェアとソフトウェアを合わせたモジュールにもなりうる。それぞれの検索プロセッサは、ユーザから検索指示を受ける。検索指示に対応して、データの選択されたセットを含む検索結果リストを作成すべく、検索プロセッサはデータベースを検索する。グルーピングプロセッサは、検索結果のカテゴリーのセットを状況に応じて動的に作成すべく検索結果リストの一部を処理する。検索結果のカテゴリーの一つ一つは、検索結果リストにあるデータのサブセットに関連付けられている。   In another aspect, the present invention has a feature as a retrieval device that retrieves data in a database. The database consists of a large number of data including Internet data and fee-based content data. The apparatus includes a search processor and a grouping processor. The grouping processor includes a data processor, a candidate generator, a weighting processor, and a display processor. Each of these components is a software module. Alternatively, each processor may be a hardware module or a combination of hardware and software. Each search processor receives a search instruction from the user. In response to the search instructions, the search processor searches the database to create a search result list that includes the selected set of data. The grouping processor processes a portion of the search result list to dynamically create a set of search result categories depending on the situation. Each search result category is associated with a subset of the data in the search result list.

装置は、状況に応じて検索結果のカテゴリーを作成するために多数の処理ステップを踏むのである。データプロセッサは、検索結果リスト内の各データと関連付けられた件名、種類、ソース、そして言語の特徴を識別する。候補生成機は、検索結果リスト内のデータと関連付けられた共通の特徴を識別し、候補のカテゴリーのリストを編集する。それぞれの候補のカテゴリーは、可能性のある検索結果のカテゴリーの代表的なものである。加重プロセッサは、候補のカテゴリー内のデータの識別された共通の特徴の関数として、それぞれの候補のカテゴリーを加重する。ディスプレイプロセッサは、それらの加重の最も大きな候補のカテゴリーに対応する、検索結果のカテゴリーを複数選択する。ディスプレイプロセッサは、検索結果のカテゴリーによるグラフィカルな表示をユーザのモニターの画面に提示する。   The device takes a number of processing steps to create a category of search results depending on the situation. The data processor identifies the subject, type, source, and language characteristics associated with each data in the search result list. The candidate generator identifies common features associated with the data in the search result list and edits the list of candidate categories. Each candidate category is representative of possible search result categories. A weighting processor weights each candidate category as a function of the identified common features of the data in the candidate category. The display processor selects a plurality of search result categories corresponding to the candidate category having the largest weight. The display processor presents a graphical display according to the category of search results on the screen of the user's monitor.

本発明は、大きなデータのセットを見たり、検索したりする効率的な方法を与え、長い直線的なリストに対して利点を提供するものである。本発明は、人間的な満足のいく方法で複数のステップの検索過程を通じてユーザを導くカテゴリー分けを使用する。ユーザは複雑な照会を簡単なステップを一度に一つずつ行うことによって作り上げることができる。本発明の利用により、ユーザは長い直線的なデータのリストを読み通すこと無しに迅速に数段階で検索をすることができる。   The present invention provides an efficient way to view and search large data sets and provides advantages over long linear lists. The present invention uses categorization that guides the user through a multi-step search process in a human satisfactory manner. Users can create complex queries by performing simple steps one at a time. By using the present invention, the user can quickly search in several steps without having to read through a long linear list of data.

詳細な説明
図1は本発明の原理を応用した検索装置の機能要素を表わすブロックダイアグラムである。装置10は検索プロセッサ12とグルーピングプロセッサ14とを含む。このグルーピングプロセッサは記録プロセッサ16と、候補生成機18、加重プロセッサ20と、ディスプレイプロセッサ22とから成る。これらの要素はソフトウエアのモジュールであり、単に本発明の機能を図説するために表わしたにすぎない。装置10はI/Oバス28を介してユーザ24(つまり、コンピュータ)と、インターネットおよび料金制コンテンツデータを含むデータベース26と通信する。装置10はワイドエリアネットワーク(たとえばインターネット)上で距離を隔てて位置する複数のユーザと通信する事ができる。
DETAILED DESCRIPTION FIG. 1 is a block diagram showing functional elements of a search device to which the principle of the present invention is applied. The apparatus 10 includes a search processor 12 and a grouping processor 14. The grouping processor includes a recording processor 16, a candidate generator 18, a weighting processor 20, and a display processor 22. These elements are software modules and are merely presented to illustrate the functionality of the present invention. Device 10 communicates with user 24 (i.e., computer) via I / O bus 28 and a database 26 that includes the Internet and fee-based content data. The device 10 can communicate with a plurality of users located at a distance on a wide area network (eg, the Internet).

図2は検索を実行するにあたってこの検索装置が使用するステップの流れを示すフローチャートである。図1および図2において、検索プロセッサ12は検索の指示(つまり照会)をユーザ24からバス28を介して受け取る(ステップ30)。検索プロセッサ12はデータベース26を検索し、選択されたデータのセットに対応する検索結果のリストを生成する(ステップ32)。この選択されたデータのセットは関連性条件に従ってランク付けされる。一つの実施例においては、データをランク付けするための関連性条件は次の規則を含み得る。
1 「ヒット」(検索条件にある単語にマッチするデータの単語)の数が多ければ、そのデータのランクは高くなる。
2 単語が個々にヒットするのでなく、検索の単語からなるフレーズがヒットした場合は、そのデータのランクは高くなる。
3 大文字小文字の区別が検索用語と同じであれば、そのデータのランクは高くなる。
4 検索用語が主題に入っていれば、そのデータのランクは高くなる。
5 検索用語が要旨に入っていれば、そのデータのランクは高くなる。
6 検索用語がキーワードに入っていれば、そのデータのランクは高くなる。
FIG. 2 is a flowchart showing a flow of steps used by the search apparatus when executing a search. 1 and 2, the search processor 12 receives search instructions (ie, queries) from the user 24 via the bus 28 (step 30). Search processor 12 searches database 26 and generates a list of search results corresponding to the selected set of data (step 32). This selected set of data is ranked according to the relevance condition. In one embodiment, the relevance condition for ranking data may include the following rules:
1 If the number of “hits” (words of data that matches words in the search condition) is large, the rank of the data becomes high.
2 When a phrase consisting of a search word is hit instead of hitting each word individually, the rank of the data becomes high.
3 If the case sensitivity is the same as the search term, the rank of the data will be higher.
4 If the search term is included in the subject, the rank of the data will be higher.
5 If the search term is included in the summary, the rank of the data is high.
6 If the search term is in the keyword, the rank of the data will be higher.

もしデータの数が特定の数(たとえば20)よりも小さい場合には、グルーピングプロセッサ36をバイパスする(ステップ34)。さもなければ、グルーピングプロセッサ14は検索結果のリストの一部を処理し、一組の検索結果のカテゴリーを状況に合わせて作る。ここで検索結果のカテゴリー一つ一つは検索結果のリストにあるデータのサブセットと関連付けられている。単に例としてであるが、処理される検索結果のリストの部分は選択されたデータの組みの中の最も関連性の高い、第1の200(または100)のデータとしてもよい。   If the number of data is smaller than a specific number (for example, 20), the grouping processor 36 is bypassed (step 34). Otherwise, the grouping processor 14 processes a portion of the search result list and creates a set of search result categories for the situation. Here, each search result category is associated with a subset of the data in the search result list. By way of example only, the portion of the search result list that is processed may be the first 200 (or 100) data that is most relevant in the selected data set.

グルーピングプロセッサ14は複数の処理ステップを実行し、状況に合わせて検索結果のカテゴリーの組みを作る。データプロセッサ16は検索結果のリストにある一つ一つのデータと関連付けられている数々の特徴(例えば、主題、種類、ソース、言語)を調べる(ステップ36)。候補生成機18は、検索結果のリストにあるデータと関連付けられている特徴のうち共通のものを調べ、候補となるカテゴリーのリストを一つ作り上げる(ステップ38)。候補生成機18は下記に述べる様々な規則を利用してこのリストを作る。加重プロセッサ20はそれぞれの候補であるカテゴリーを、候補であるカテゴリーの中にあるデータの調べられた共通の特徴の関数として加重する(ステップ40)。また、加重プロセッサ20は候補であるカテゴリーを加重するために下記に述べる様々な加重規則を利用する。ディスプレイプロセッサ22は加重の最も大きい候補カテゴリーに対応する複数(例えば5から10)の検索結果のカテゴリーを選択し(ステップ42)、ユーザのモニターで表示するために検索結果のカテゴリーのグラフィックな表記を提供する(ステップ44)。検索結果のカテゴリーはモニター上での複数のアイコン(例えばフォルダ)として表示するしてもよい。ユーザがある検索結果のカテゴリーを選択すると、その検索結果のカテゴリーにあるデータの数と、他の検索結果のカテゴリーと、最も関連例の強いデータのリストのグラフィックな表記をディスプレー上での表示のために提供する。   The grouping processor 14 executes a plurality of processing steps and creates a set of search result categories according to the situation. The data processor 16 examines a number of features (eg, subject, type, source, language) associated with each piece of data in the search result list (step 36). Candidate generator 18 examines common features associated with the data in the search result list and creates one candidate category list (step 38). The candidate generator 18 makes this list using various rules described below. The weighting processor 20 weights each candidate category as a function of the examined common features of the data in the candidate category (step 40). The weighting processor 20 also uses various weighting rules described below to weight the candidate categories. The display processor 22 selects a plurality (eg, 5 to 10) of search result categories corresponding to the weighted candidate category (step 42) and displays a graphical representation of the search result category for display on the user's monitor. Provide (step 44). The category of the search result may be displayed as a plurality of icons (for example, folders) on the monitor. When a user selects a search result category, the number of data in that search result category, the other search result categories, and a graphical representation of the most relevant list of data are displayed on the display. To provide for.

上で述べたように、ユーザは検索結果のカテゴリーを一つ選択し(ステップ46)、(もしもある特定の値よりもデータの数が多いのならば)そのカテゴリーに含まれるデータのリストに加えて他の検索結果のカテゴリーを見ることもできる。検索を狭めるためには、ユーザは追加の検索単語を与え得る(つまり細分命令)(ステップ48)。この追加の単語を受け取ると、検索プロセッサ12はデータベース26を検索し、細分されたデータの組みに対応する新しい検索結果のリストを生成する(ステップ50)。または、ユーザは単に次々と追加の検索結果のカテゴリーを開く事によって(実質的に)細分することができる。   As mentioned above, the user selects a category of search results (step 46) and adds to the list of data contained in that category (if there are more data than a certain value). You can also see other search result categories. To narrow the search, the user may provide additional search words (ie subdivision instructions) (step 48). Upon receipt of this additional word, the search processor 12 searches the database 26 and generates a new search result list corresponding to the subdivided data set (step 50). Alternatively, the user can subdivide (substantially) simply by opening additional search result categories one after another.

図3Aから3Cは検索装置10を使って検索をする際のユーザのディスプレイを示す例である。これらの表示は単に例であり、説明するために提供されているだけである。したがって、様々なキー、ボタン、アイコンのレイアウトは重要ではない。図3Aから3Cに関しては、ディスプレー60は、ユーザが検索指示を入力し得る検索フィールド62と、検索指示を実行するための検索アイコン64を含む。このディスプレーはまた、検索の助けるヒントアイコン66、その他の機能アイコン(例えば、検索アイコン68、ディレクトリアイコン70、サポートアイコン72、法律関連アイコン74)、検索アイコン(例えば、単純検索76、パワー検索78、健康関連検索80、会社検索82、コンピュータ検索84)を含む。   FIGS. 3A to 3C show examples of the user's display when searching using the search device 10. These displays are merely examples and are provided for illustrative purposes only. Therefore, the layout of the various keys, buttons, and icons is not important. With reference to FIGS. 3A-3C, display 60 includes a search field 62 where a user can enter a search instruction and a search icon 64 for executing the search instruction. The display also includes a hint icon 66 to assist in searching, other function icons (eg, search icon 68, directory icon 70, support icon 72, legal icon 74), search icons (eg, simple search 76, power search 78, Health related search 80, company search 82, computer search 84).

ユーザは検索の指示(つまり照会)をフィールド62に入力し、検索アイコン(図3B参照)を選択する。検索装置10はデータベース26を検索し状況に合わせて一組の検索結果のカテゴリー(86a−86n)を最も関連性の高いデータ(88a−88m)のリストとともに作成する。検索結果のカテゴリー(86a−86n)の一つ一つは件名のキャプションを一つ含み、データ(88a−88m)の一つ一つは「有料・無料」のインジケーターとともにキャプションを一つ含む。ユーザはアイコンを選択することによって一つのカテゴリーを見ることができ、またはアイコンを選択することによってある特定の一つのデータを見ることができる。あるいは、ユーザは検索やり直し用アイコン90を選択することによって新しい検索を実行することができ、または、テキストを検索フィールド62に入力し、検索アイコン64を選択することによって細分することができる。ユーザが一つのカテゴリーを選択すると、装置10はもう一つの組の検索結果のカテゴリーと、最も関連性の高いデータのリストをもう一つ作成する。ユーザは繰り返し一回毎に検索の範囲を更に狭め、関連するデータの数が予め定めた敷居値(例えば20)に低下するまでこのプロセスを繰り返すことがてきる。この時点で、装置10は単に最も関連性の高いデータのリストを一つ提供するのみとなる。   The user inputs a search instruction (ie, a query) in field 62 and selects a search icon (see FIG. 3B). The search device 10 searches the database 26 and creates a set of search result categories (86a-86n) together with a list of the most relevant data (88a-88m) according to the situation. Each of the search result categories (86a-86n) includes a caption for the subject, and each of the data (88a-88m) includes a caption with a “pay / free” indicator. The user can view a category by selecting an icon, or can view a specific piece of data by selecting an icon. Alternatively, the user can perform a new search by selecting the search redo icon 90 or can be subdivided by entering text into the search field 62 and selecting the search icon 64. When the user selects one category, the device 10 creates another set of search result categories and another list of the most relevant data. The user can repeat the process until the number of related data drops to a predetermined threshold value (eg, 20), further narrowing the search range for each iteration. At this point, the device 10 simply provides one list of the most relevant data.

ユーザは検索するプロセスの焦点を絞るためにディレクトリ(92a−92y)の予め定めたリストを利用することができる(図3c)。ユーザはフィールド62に検索の指示を入力し、一つ、またはそれ以上のディレクトリ(例えばディレクトリ92a、92b)を選択し、検索アイコン64を選択する(図3B)。検索装置10は、照会を満たし選択したディレクトリの中に入っているデータに焦点をあわせて、データベース26を検索する。装置はこれらのディレクトリに限定された検索結果のカテゴリーと最も関連性の高いデータとの一組を提供する。   The user can use a predetermined list of directories (92a-92y) to focus the search process (FIG. 3c). The user inputs a search instruction in the field 62, selects one or more directories (eg, directories 92a, 92b), and selects a search icon 64 (FIG. 3B). The search device 10 searches the database 26 with a focus on the data contained in the selected directory that satisfies the query. The device provides a set of search results categories that are limited to these directories and the most relevant data.

グルーピングプロセッサはカテゴリーに分けるためのアルゴリズムを実行し、状況に合わせて検索結果のカテゴリーのこの一組みを作成する。このアルゴリズムは、候補となるカテゴリーを調べる、カテゴリーを加重する、加重度の最も大きい複数のカテゴリーを表示する、の3つの主要なステップを含む。以下の実施例においては7つ(+/-2)カテゴリーを目標値として規則が作られているが、一般に規則はこの目標値とは独立したものである。   The grouping processor executes an algorithm for dividing into categories and creates this set of search result categories according to the situation. The algorithm includes three main steps: examine candidate categories, weight categories, and display multiple categories with the highest weight. In the following examples, rules are created with seven (+/− 2) categories as target values, but the rules are generally independent of these target values.

グルーピングプロセッサの利用するカテゴリーに分けるためのアルゴリズムの一つの実施例は論理的に下記に説明する。このアルゴリズムの実際の実行は、ステップを省略してもよく、並列または任意に実行してもよい。このアルゴリズムを説明するにあたって、次の用語を使う。「nrecs」という用語は、検索結果のリスト上でデータの全数の内の最初の200のデータか、結果のリストの全体の大きさで、数の小さい方を意味する。nrecsという用語は、データの数、またはデータのそのグループと同義である。「ncategories」という用語は、望まれるカテゴリーの数(+/-2つのカテゴリー)を意味する。「内部ドメインオーダリング」という用語は、ドメインを関連する情報の違いに基づいて区別する能力を強調してドメインの順序付けをする事を意味する。順序付けは、種類、件名、ソース、言語によることができる。「ユーザドメインオーダリング」という用語は、ドメインに関するユーザのアクセス性/見かけのユーザの値を強調してドメインの順序付けをする事を意味する。順序付けは、件名、ソース、種類、言語によることができる。「レベル」という用語は、そのカテゴリーに割り当てられたその特定のドメインに対する一つの値のドメインヒエラルキーにおけるレベルを意味する。ヒエラルキーレベルは1(全てのアイテム、例えば全ての件名)からN(通常の「トップ」のレベルのアイテムは6ケぐらいでがレベル2であるヒエラルキーの最低のレベル、)までの数であると仮定する。   One embodiment of an algorithm for dividing into categories used by the grouping processor is logically described below. The actual execution of this algorithm may omit steps and may be performed in parallel or arbitrarily. In describing this algorithm, the following terms are used: The term “nrecs” means the first 200 data out of the total number of data on the search result list or the overall size of the result list, whichever is smaller. The term nrecs is synonymous with the number of data, or that group of data. The term “ncategories” means the number of categories desired (+/− 2 categories). The term “internal domain ordering” means ordering domains with emphasis on the ability to distinguish domains based on differences in related information. Ordering can be by type, subject, source, and language. The term “user domain ordering” means to order the domains by emphasizing user accessibility / apparent user values for the domains. The ordering can be by subject, source, type and language. The term “level” means the level in the domain hierarchy of one value for that particular domain assigned to that category. The hierarchy level is assumed to be a number from 1 (all items, eg all subject lines) to N (the usual “top” level items are the lowest level of the hierarchy, which is level 2 but around 6). To do.

照会に応答して、検索プロセッサはデータベースを検索し、検索結果リストを作成する。このリストにあるデータの組みは上記の関連性の条件に従ってランク付けされる。その後の全ての処理はnrecsに関して行われる。もしnrecsが20(または、他の予め決められた値)より小さければ、唯一の候補カテゴリーは「全てのデータ」カテゴリーであり、プロセッサーはカテゴリー加重へとスキップする(下記に解説)。   In response to the query, the search processor searches the database and creates a search result list. Data sets in this list are ranked according to the above relevance conditions. All subsequent processing is done on nrecs. If nrecs is less than 20 (or some other predetermined value), the only candidate category is the “all data” category and the processor skips to category weighting (discussed below).

候補を生成する規則全てに対して、利用可能な種類、件名、言語、またはソースの値の組みは、照会において示される値、まはたこのような値のサブトリーによって限定される(例えば、一つの特定の件名に限定された検索は、その件名だけか、その件名の中のより限定的な件名を含む候補カテゴリーが結果として得られる)。もしこれらのフィールドに対する値が与えられない場合は、これらの特徴を持つドメイン全部が利用される。複数のフィールドに与えられた条件はその検索要求においてロジックのANDとして仮定される。   For all rules that generate candidates, the set of available type, subject, language, or source values is limited by the value indicated in the query or by a subtree of such values (e.g., one A search limited to one specific subject will result in a candidate category that includes just that subject or a more specific subject within that subject). If no value is given for these fields, all domains with these characteristics are used. Conditions given to multiple fields are assumed as logic AND in the search request.

グルーピングプロセッサは、候補のカテゴリーとして、nrecsが20%以上の種類−件名の組み合わせ全てを、件名のドメインと種類のドメインにある利用可能な全てのノードを利用して生成する。グルーピングプロセッサは、候補のカテゴリーとして、nrecsが20%以上の件名のドメインにある、件名のみのグループを全て生成し、利用可能な全てのノードからのものをまとめる。グルーピングプロセッサは、候補のカテゴリーとして、nrecsが20%以上の種類のドメインにある、種類のみのグループを全て生成し、利用可能な全てのノードからのものをまとめる。グルーピングプロセッサは、候補のカテゴリーとして、nrecsが20%より大きく80%より小さい言語のヒエラルキーにある全てのドメインを生成する。グルーピングプロセッサは、候補のカテゴリーとして、nrecsが20%より大きいソースのヒエラルキーにある、3つまたはそれ以上のデータを含むかウエブサイトか、他の全てのノードを生成する。グルーピングプロセッサは、候補のカテゴリーとして、まだ一つもカテゴリーを作っていないソースのヒエラルキーにある、トップレベルの全てのノードを生成する。こうして、nrecsに関してのみならず検索結果のリスト全体を完全に網羅する候補カテゴリーの少なくとも一つの組みが作られる。グルーピングプロセッサは、照会において指定される任意の2つのフィールドの利用できる全てのノードの一対の組み合わせの全てから成る、まだ生成されていない、nrecsが20%以上の候補カテゴリーを生成し、(例えば言語とソースを指定する照会はnrecsが20%以上の言語−ソースの組み合わせの全てに対する候補を生成する。最後に、グルーピングプロセッサは、そのカテゴリーにあるドメインのどれかが「未知」の値を持つカテゴリーは全て除く。   The grouping processor generates all types-subject combinations having nrecs of 20% or more as candidate categories using all available nodes in the subject domain and the type domain. The grouping processor creates all subject-only groups in the subject domain with nrecs of 20% or more as candidate categories, and collects all the available nodes. As a candidate category, the grouping processor generates all types-only groups in the types of domains with nrecs of 20% or more, and collects all the available nodes. The grouping processor generates all domains in the hierarchy of languages where nrecs is greater than 20% and less than 80% as candidate categories. The grouping processor generates all other nodes that contain three or more data or websites with nrecs in the source hierarchy greater than 20% as candidate categories. The grouping processor generates all top-level nodes in the source hierarchy that have not yet created any categories as candidate categories. This produces at least one set of candidate categories that completely covers the entire list of search results, not just nrecs. The grouping processor generates candidate categories that are not yet generated and have a nrecs of 20% or more, consisting of all pairs of all available pairs of nodes in any two fields specified in the query (eg, language And a source-specific query will generate candidates for all language-source combinations where nrecs is greater than 20% Finally, the grouping processor will create a category for which any domain in that category has a value of "unknown" Is excluded.

第二に、このアルゴリズムはカテゴリーに対して加重を付ける。加重を付ける規則によると、加重はカテゴリーに対して累積して与えられる(つまり、それぞれのカテゴリーの最終的な加重は受け取る加重の全合計となる)。規則の一つは内部ドメインオーダリングと一つのドメイン内における正確さのレベルを強調する。この規則によると全てのカテゴリーは、一つ一つのドメインに対するファクターとそのドメインに対する値のレベルの積である加重をそれぞれのドメイン対して受け取る。ここでのファクターとは、種類(10)、件名(6)、ソース(3)、言語(1)である。もう一つの規則によると、データの数の多いカテゴリーが強調される。この規則によると、どのカテゴリーもそのカテゴリーに含まれるnrecsのパーセンテージの20%に相当する加重を受け取る。最も関連性の高いカテゴリーを強調する規則は3つある。一つ目の規則によると、全てのカテゴリーにあるデータでnrecsのトップ5のデータにランクされたデータの数の10倍に等しい加重をそのカテゴリーが受ける。二つ目の規則によると、全てのカテゴリーにあるデータでnrecsの二番目のトップ5のデータにランクされたデータの数の5倍に等しい加重をそのカテゴリーが受ける。三つ目の規則によると、全てのカテゴリーにあるデータでnrecsの11番目から20番目のデータにランクされたデータの数の2倍に等しい加重をそのカテゴリーが受ける。   Second, the algorithm weights categories. According to the rules for weighting, weights are given cumulatively for a category (ie, the final weight for each category is the total sum of the weights received). One of the rules emphasizes internal domain ordering and the level of accuracy within a domain. According to this rule, every category receives a weight for each domain, which is the product of the factor for each domain and the level of values for that domain. The factors here are type (10), subject (6), source (3), and language (1). Another rule emphasizes categories with a large number of data. According to this rule, every category receives a weight corresponding to 20% of the percentage of nrecs contained in that category. There are three rules that highlight the most relevant categories. According to the first rule, a category receives a weight equal to 10 times the number of data in all categories ranked in the top 5 data of nrecs. According to the second rule, the category receives a weight equal to five times the number of data in all categories ranked in the second top 5 data of nrecs. According to the third rule, the category receives a weight equal to twice the number of data in all categories ranked in the 11th to 20th data of nrecs.

一つのドメイン内における広がりを示す4つの加重規則があり、全体のカバレッジを広げ重複を最小限にする。一つ目の規則によると、そのドメインに対するレベル2未満の値に対するカテゴリーがないようなレベル2のドメインの値を含む全てのカテゴリーは15の加重を受け取る。これは、そのカテゴリーのテーマ内に含まれるそれぞれのドメインに対して当てはまる。二つ目の規則によると、そのドメインに対するレベル3未満の値に対するカテゴリーがないようなレベル3のドメインの値を含む全てのカテゴリーは8の加重を受け取る。これは、そのカテゴリーのテーマ内に含まれるそれぞれのドメインに対して当てはまる。三つ目の規則によると、もし最も大きな加重を持つncategoriesがどの一つのドメインの値を網羅せず、一つのドメインを網羅するためにそのドメインからの値を加算できるカテゴリーが2つ以下しかない場合は、それら2つのカテゴリー一つ一つに対して25を加算する。しかし、もしこの事が当てはまるカテゴリー(同一のドメインかもう一つの異なるドメイン内の)が3つ以上ある場合は、指定されたカテゴリーの内で2つの和が最も加重の大きなを持つカテゴリーを選択する。引き分けになってしまった場合は、内部ドメインオーダリングに基づいて選択し、それでも引き分けになってしまった場合は、ランダムに選択する。四つ目の規則によると、データの内で70%以上が他のカテゴリーにないようなデータを含むカテゴリーは全て8の加重を受け取る。他のパーセンテージや加重値を利用してもよい。   There are four weighting rules that indicate the spread within one domain, extending the overall coverage and minimizing duplication. According to the first rule, all categories that contain a value for a level 2 domain such that there is no category for values below level 2 for that domain receive a weight of 15. This is true for each domain included within the theme of that category. According to the second rule, all categories that contain a value for a level 3 domain such that there is no category for a value below level 3 for that domain will receive a weight of 8. This is true for each domain included within the theme of that category. According to the third rule, if ncategories with the largest weight does not cover the value of any one domain, there can be no more than two categories that can add values from that domain to cover a single domain. In this case, 25 is added to each of the two categories. However, if there are more than two categories (in the same domain or in another different domain) for which this is true, select the category with the two most weighted sums of the specified categories. . If it is a draw, select based on internal domain ordering, and if it is still a draw, select randomly. According to the fourth rule, all categories that contain data where more than 70% of the data is not in other categories will receive a weight of 8. Other percentages and weights may be used.

別の規則により、ウェブサイトカテゴリーを強調している。この規則は、20%以上のnrecsを伴う、全ウェブサイトのみのカテゴリーが12の加重を受ける。また、別の規則は照会内で特定されたテーマを強調しており、値を特定されたユーザが10の加重を受けるためのドメインを含む全カテゴリーを提供する。最後に、組合せカテゴリーを強調する規則により、全組合せカテゴリーが8の加重を受けることを提供する。   Another rule emphasizes website categories. This rule weights 12 for all website-only categories with more than 20% nrecs. Another rule also highlights the themes identified in the query, providing all categories including domains for which the user whose value is identified receives a weight of 10. Finally, the rules that emphasize combination categories provide that all combination categories receive a weight of 8.

第三に、アルゴリズムは複数の検索結果カテゴリーを、最高加重を伴う候補カテゴリーから決定する。まず、プロセッサは最高加重を伴う候補カテゴリーを選択する。同じ場合には、ユーザドメインのオーダリングが、カテゴリーを選択するために用いられる。ncategories内の最低加重のカテゴリー、または2つの最低加重カテゴリーは、2番目に最高の加重カテゴリーからの顕著な低下を表し、ncategoriesは1つまたは2つだけ減少する。しかし、すでにncategories内にない2つの最高加重カテゴリーが、加重においてすでにncategories内にある最低カテゴリーよりもわずかにより低い場合、ncategoriesは1つまたは2つだけ増加する。他のパーセンテージおよび加重値も用いられ得ることは留意される。   Third, the algorithm determines multiple search result categories from the candidate category with the highest weight. First, the processor selects the candidate category with the highest weight. In the same case, user domain ordering is used to select a category. The lowest weighted category in ncategories, or the two lowest weighted categories, represents a significant decline from the second highest weighted category, and ncategories is reduced by one or two. However, if the two highest weighted categories not already in ncategories are slightly lower in weight than the lowest category already in ncategories, ncategories will increase by one or two. It is noted that other percentages and weights can also be used.

各検索結果カテゴリーについての名前を決定する際に、ドメイン(例えば、件名タイプ)の組合せのカテゴリーは、ハイフンにより分けられた各ドメインの値で名付けられる。2つのドメインの順序は、ユーザドメインオーダリングにより決定される。各検索結果カテゴリーについて、各カテゴリーにおけるデータの数のカウントが表示される。ウェブサイトカテゴリーはウェブサイトのドメインにより名付けられ、これはそのサイトのデフォルトホームページへのホットリンクであり得る。任意の表示されたカテゴリーが単なるウェブサイトカテゴリーであるか、もしくは組合せウェブサイトカテゴリーであるかに関わらず、ウェブサイトまたはウェブサイト組合せカテゴリー以外の任意のカテゴリーのデータリスト内における個々のデータの全ての例(occurrence)は、それらのデータを含むウェブサイトカテゴリーと置き換えられる。ウェブサイトカテゴリーが、3つ以下のデータを有する検索結果リスト内に埋め込まれ、データ「インライン」、すなわち個々のデータそれ自体がカテゴリー名を備えて示され得、カテゴリーを明示的に展開する必要性を排除することが可能である。検索結果カテゴリー内のデータは関連する順序にて、あるいは、ユーザのオプションにおいて逆日付順(reversedate order)(最近のもの)にてデフォルトにより表示される。データリスト内のウェブサイトカテゴリーは、ウェブサイトにおける最高ランク付けデータの値によりランク付けされる。   In determining the name for each search result category, the category of combinations of domains (eg, subject type) is named with the value of each domain separated by a hyphen. The order of the two domains is determined by user domain ordering. For each search result category, a count of the number of data in each category is displayed. A website category is named by the website domain, which can be a hot link to the default home page of the site. Regardless of whether any displayed category is just a website category or a combination website category, all of the individual data in the data list of any category other than the website or website combination category The occurrence is replaced with the website category that contains those data. Website categories can be embedded in a search results list with 3 or fewer data, the data "inline", ie the individual data itself can be shown with the category name, and the need to explicitly expand the category Can be eliminated. The data in the search result category is displayed by default in the relevant order or in reverse date order (recent) in the user's options. Website categories in the data list are ranked by the value of the highest ranking data on the website.

上記された数値的なパーセンテージ、割り当て加重、および詳細な規則は例示的であり、本発明の精神および範囲から逸脱することなく変更され得る。   The numerical percentages, assignment weights, and detailed rules described above are exemplary and can be modified without departing from the spirit and scope of the present invention.

機能するカテゴリー化方法論として、データベース内の各データ(インターネットデータおよび料金制コンテンツデータを含む)は、件名、種類、ソース、および言語特徴(すなわちメタデータ属性)により分類される。他の実施形態において、データは追加のメタデータ属性(例えば、困難性または一般性のレベル)、照会ベース属性、適切な名前、および実行タイムドキュメント分析特性により分類され得る。そのようなタスクがマニュアル的に行うには大きすぎるため、検索装置が全てのデータを適切なカテゴリーに実質的に自動分類する。   As a functioning categorization methodology, each data in the database (including Internet data and fee-based content data) is categorized by subject, type, source, and language characteristics (ie, metadata attributes). In other embodiments, data may be categorized by additional metadata attributes (eg, difficulty or generality level), query-based attributes, appropriate names, and execution time document analysis characteristics. Because such a task is too large to be done manually, the search device substantially automatically classifies all data into the appropriate categories.

各データは、1つ以上のタイプ(例えば、記事、本の論評、手紙)および単一のソース値(例えば、PC Week、パーソナルウェブページ)が、大抵の場合、自動的プロセス(インターネットデータ用には完全に自動的)を介して割り当てられる。しかし、所定の料金制コンテンツデータ用にいくつかの編集的な割り当ても存在する。また、各データは1つ以上の件名(例えば、分子生物学)および言語(例えば、フランス語)が、大抵の場合、自動的プロセス(インターネットデータ用には完全に自動的)を介して、一般的に割り当てられる。時折、データは件名および/または言語が割り当てられない。そのような場合には、データはそれらの特定のメタデータアイテム(または属性、またはフィールド、またはドメイン)用に「未知」の値が割り当てられる。件名、言語およびタイプ(しかしソースではない)の場合において、データが1つ以上の値を有することが可能である(例えば、これが2つ以上の異なる件名分野を実際にアドレスするため、もしくはこれが1つ以上の言語におけるテキストを含むためである)。   Each data has one or more types (eg, articles, book reviews, letters) and a single source value (eg, PC Week, personal web page), often an automatic process (for Internet data Are fully automatic). However, there are also some editorial assignments for certain fee-based content data. In addition, each data is generally available via one or more subject lines (eg, molecular biology) and language (eg, French), usually through an automatic process (completely automatic for Internet data). Assigned to. Occasionally, data is not assigned a subject and / or language. In such cases, the data is assigned an “unknown” value for those particular metadata items (or attributes, or fields, or domains). In the case of subject, language and type (but not source), it is possible for the data to have more than one value (for example, because this actually addresses two or more different subject areas, or this is 1 Because it contains text in more than one language).

さらに、それらのドメイン内の全ての値は、階層的に配置している(例えば、「分子生物学」は「生物学」に属し、「本の論評」は「論評」に属する)。データは所定のドメイン(例えば、タイプとして「本の論評」、件名として「分子生物学」)用に、ただ一つ(あるいは、おそらく2つ以上)の比較的特定的な値に自動的にまたはマニュアル的に分類され、それらの相対的なドメイン階層における値よりも高い全ての値を継承する。例えば、「分子生物学」に分類されたデータはまた、「生物学」の件名(分子生物学の親)および「科学」の件名(これは生物学の親)が与えられる。このことは、そのデータ用に追加の5つまたは6つの分類値をもたらし得る。各階層の最上レベルは比較的小さく、例えば件名ドメインとして約6個の件名分野(人文科学および社会学、ビジネス、等を含む)、その各々は3つまたは4つよりも多く分割されて、レベル2において18個の件名分野を作り、その各々は約35に分割されて、レベル3において約600個の件名分野を作るという具合に続く。   Furthermore, all values within those domains are arranged in a hierarchy (eg, “molecular biology” belongs to “biology” and “book reviews” belongs to “reviews”). The data is automatically or for a given domain (eg “book review” as type, “molecular biology” as subject), with only one (or perhaps more than two) relatively specific values It is classified manually and inherits all values higher than those in their relative domain hierarchy. For example, data classified as “molecular biology” is also given the subject of “biology” (the parent of molecular biology) and the subject of “science” (which is the parent of biology). This can result in an additional 5 or 6 classification values for the data. The top level of each hierarchy is relatively small, eg about 6 subject areas (including humanities and sociology, business, etc.) as subject domains, each of which is divided into more than 3 or 4 levels 2 create 18 subject areas, each of which is divided into approximately 35, followed by approximately 600 subject areas in level 3 and so on.

分類システムは、4つのデータ属性(すなわち、件名、種類、言語およびソース)を(それらの属性が発行者またはデータソースから編集的に利用可能でない場合に)、自動的に決定するために開発されてきた。分類システムは、(1)照会ベース分類プログラム、および(2)個々のプログラムのセット、という2つの主要な構成要素を含む。   The classification system was developed to automatically determine four data attributes (ie subject, type, language and source) (if those attributes are not editorially available from the publisher or data source). I came. The classification system includes two main components: (1) a query-based classification program, and (2) a set of individual programs.

照会ベース分類プログラムは、2万件以上の項目用語(term)を含む、選択された属性および属性値に対する分類を効率的に行う。属性および属性値のそれぞれに対し、ひとつの照会を必要とする(例えば、属性=件名、属性値=生物化学)。照会はデータのすべてに対して行われ、一致の強さを表す分類スコアが、各データおよび照会に対して計算される。その後データは、そのデータが最高の分類スコアを有する2つまたは3つの照会/属性値に分類される。   The query-based classification program efficiently classifies selected attributes and attribute values that contain more than 20,000 item terms. One query is required for each attribute and attribute value (eg, attribute = subject, attribute value = biochemistry). A query is performed on all of the data, and a classification score representing the strength of the match is calculated for each data and query. The data is then classified into two or three query / attribute values where the data has the highest classification score.

照会ベース分類プログラムは、以下の副構成要素を利用(draw on)する。(1)分類照会を特定するための分類言語、(2)プログラムによって使用される分類照会を自動的に作成するための手段およびソース、および(3)プログラムによって使用される数々のマニュアルにより(manually)構成された分類照会。   The query-based classification program uses (draws on) the following subcomponents: (1) a classification language for identifying classification queries, (2) means and sources for automatically creating classification queries used by the program, and (3) a number of manuals used by the program (manually ) Configured classification query.

分類照会を自動的に作成するための手段およびソースは、約5行の長さの照会を生成する。各照会は、その属性値に対する用例または模範データ(例えば、生物化学の百科事典記事)を分析し、そのデータに対する最も重要な用語を自動的に抽出することによって作成される。作成された「照会」は、他の同様のデータ(即ち、同じ値に分類できるデータ)との一致および検索に用いられる。用語の重要性は、データ内でその用語がいかに頻繁に用いられるか(即ち、頻度が高いほど重要性が高い)、および、例えば百科事典全体など、用いられる用例データの特定の本文においてその用語がいかに希であるか(即ち、希であるほど、重要性が高い)の両方によって決定される。頻度/頻度の少なさのどの値が正確に用いられるかは、経験的に決定され、用例データの特定のソースそれぞれに対して設定される。複数のソースを使用することができる。数々の関連プログラムツールも開発されている(例えば、百科事典記事を、項目階層内の用語に自動的に一致させるもの)。   Means and sources for automatically creating a classification query generate a query about 5 lines long. Each query is created by analyzing example or exemplary data (eg, biochemical encyclopedia articles) for that attribute value and automatically extracting the most important terms for that data. The created “query” is used for matching and searching with other similar data (that is, data that can be classified into the same value). The importance of a term depends on how frequently the term is used in the data (ie, the more frequently it is important) and in the specific text of the example data used, for example, the entire encyclopedia Is determined by both how rare (ie, the rarer is the more important). Which value of frequency / low frequency is used correctly is determined empirically and is set for each specific source of example data. Multiple sources can be used. A number of related program tools have also been developed (eg, automatically matching encyclopedia articles to terms in the item hierarchy).

マニュアルにより構成されたいくつかの分類照会は、以下の通りである。約2000のそのような件名照会、約50のマニュアルによるタイプ照会、および約6のマニュアルによる言語照会である。マニュアルによる照会は、極めて長い言語照会を除き平均して約15行の長さである。  Some classification queries organized by manual are: There are about 2000 such subject queries, about 50 manual type queries, and about six manual language queries. Manual queries are on average about 15 lines long, except for very long language queries.

分類システムの第2の構成要素は、照会ベースの方法が不適切であると見なされる場合に、データ属性の一つの特定の値(例えば、製法(recipe)および「個人のウェブページ」であり、例えば、製法の場合はデータ属性が「種類」、個人ページの場合は「ソース」である)に、データを分類するのに用いられる個々のプログラムおよび高次元の制御プログラムの組である。これらのプログラムは、Perlの数千行を含んでいる。これらのプログラムは、特定の語の存在のみならず、形式の手掛かり(cue)(例えば、タイプ製法または種類インタヴューのデータの特定形式)を検索する。これらの分類の結果を評価するための一組のテストツールも存在する。   The second component of the classification system is one specific value of the data attribute (eg recipe and “personal web page” if the query-based method is deemed inappropriate, For example, a data attribute is “kind” in the case of a manufacturing method, and “source” in the case of a personal page), and a set of individual programs and high-dimensional control programs used to classify data. These programs contain several thousand lines of Perl. These programs search not only for the presence of specific words, but also for cue forms (for example, specific forms of type recipes or type interview data). There is also a set of test tools for evaluating the results of these classifications.

分類データベースは、データ分類学(taxonomy)、階層、相互参照、および関連分類照会を作成し保守する。データベースは、複数ユーザ分類エディタ、および他のシステム構成要素(例えば検索エンジン)によって必要とされるレポートおよびデータファイルを生成する手段を含み、Microsoft Access、Microsoft形式、Data Access Objects、SQL、およびVisual Basicを用いて実施される。データベースには、約40の表、15の形式、25のレポート、および5000行のVisual Basicが含まれており、システムの他の部分に対する12の中間ファイルを作成する。   A taxonomy database creates and maintains data taxonomy, hierarchy, cross-references, and related taxonomy queries. The database includes a multi-user classification editor and means for generating reports and data files required by other system components (eg, search engines), including Microsoft Access, Microsoft Format, Data Access Objects, SQL, and Visual Basic. It is implemented using. The database contains about 40 tables, 15 formats, 25 reports, and 5000 rows of Visual Basic, creating 12 intermediate files for the rest of the system.

均等物
特定の好適な実施形態を参照して、本発明を詳しく図示、説明してきたが、添付の請求の範囲に規定される発明の精神および範囲から逸脱することなく、形式および詳細における様々な変更をこれに行い得ることは、当業者に理解される。
Although the invention has been illustrated and described in detail with reference to certain preferred embodiments, it is understood that various changes in form and detail may be made without departing from the spirit and scope of the invention as defined in the appended claims. Those skilled in the art will appreciate that changes can be made to this.

本発明のこれらのそして他の特色は、以下の詳細な説明と付随する図に記述され、インターネットと料金制コンテンツデータ情報の両方からなるデータベースを検索するための装置と方法を説明している。
図1は、本発明の原理を取り入れた検索装置の機能的な要素を説明しているブロック・ダイアグラムである。 図2は、本発明に従った検索を行う検索装置が使用する一連のステップを説明しているフローチャートである。 図3A−3Cは、検索装置を使って検索中のユーザ画面を説明している。 図3A−3Cは、検索装置を使って検索中のユーザ画面を説明している。 図3A−3Cは、検索装置を使って検索中のユーザ画面を説明している。
These and other features of the present invention are described in the following detailed description and accompanying figures, which illustrate an apparatus and method for searching a database consisting of both the Internet and pricing content data information.
FIG. 1 is a block diagram illustrating the functional elements of a search device incorporating the principles of the present invention. FIG. 2 is a flowchart illustrating a series of steps used by a search device that performs a search according to the present invention. 3A to 3C illustrate user screens that are being searched using the search device. 3A to 3C illustrate user screens that are being searched using the search device. 3A to 3C illustrate user screens that are being searched using the search device.

Claims (1)

データベースのデータを検索する方法であって、図2に示される方法。   A method for retrieving data in a database, the method shown in FIG.
JP2007315289A 1997-05-01 2007-12-05 Method and device for searching data of database Withdrawn JP2008071372A (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US08/846,850 US5924090A (en) 1997-05-01 1997-05-01 Method and apparatus for searching a database of records

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP54740898A Division JP2001522496A (en) 1997-05-01 1998-04-29 Method and apparatus for searching data in a database

Publications (1)

Publication Number Publication Date
JP2008071372A true JP2008071372A (en) 2008-03-27

Family

ID=25299114

Family Applications (4)

Application Number Title Priority Date Filing Date
JP54740898A Withdrawn JP2001522496A (en) 1997-05-01 1998-04-29 Method and apparatus for searching data in a database
JP2007315289A Withdrawn JP2008071372A (en) 1997-05-01 2007-12-05 Method and device for searching data of database
JP2007315288A Withdrawn JP2008097641A (en) 1997-05-01 2007-12-05 Method and apparatus for searching data of database
JP2009142808A Pending JP2009238241A (en) 1997-05-01 2009-06-15 Method and apparatus for searching data of database

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP54740898A Withdrawn JP2001522496A (en) 1997-05-01 1998-04-29 Method and apparatus for searching data in a database

Family Applications After (2)

Application Number Title Priority Date Filing Date
JP2007315288A Withdrawn JP2008097641A (en) 1997-05-01 2007-12-05 Method and apparatus for searching data of database
JP2009142808A Pending JP2009238241A (en) 1997-05-01 2009-06-15 Method and apparatus for searching data of database

Country Status (8)

Country Link
US (1) US5924090A (en)
EP (1) EP0979470B1 (en)
JP (4) JP2001522496A (en)
AU (1) AU736428B2 (en)
CA (1) CA2288745C (en)
DE (1) DE69839604D1 (en)
ES (1) ES2306474T3 (en)
WO (1) WO1998049637A1 (en)

Families Citing this family (396)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6339767B1 (en) * 1997-06-02 2002-01-15 Aurigin Systems, Inc. Using hyperbolic trees to visualize data generated by patent-centric and group-oriented data processing
US5822720A (en) 1994-02-16 1998-10-13 Sentius Corporation System amd method for linking streams of multimedia data for reference material for display
US5724571A (en) * 1995-07-07 1998-03-03 Sun Microsystems, Inc. Method and apparatus for generating query responses in a computer-based document retrieval system
AU3452097A (en) * 1996-07-09 1998-02-02 British Telecommunications Public Limited Company Access system for distributed storage
US6236365B1 (en) 1996-09-09 2001-05-22 Tracbeam, Llc Location of a mobile station using a plurality of commercial wireless infrastructures
US9134398B2 (en) 1996-09-09 2015-09-15 Tracbeam Llc Wireless location using network centric location estimators
US7903029B2 (en) 1996-09-09 2011-03-08 Tracbeam Llc Wireless location routing applications and architecture therefor
US6249252B1 (en) 1996-09-09 2001-06-19 Tracbeam Llc Wireless location using multiple location estimators
US7714778B2 (en) 1997-08-20 2010-05-11 Tracbeam Llc Wireless location gateway and applications therefor
US7764231B1 (en) 1996-09-09 2010-07-27 Tracbeam Llc Wireless location using multiple mobile station location techniques
GB2331166B (en) * 1997-11-06 2002-09-11 Ibm Database search engine
US6295533B2 (en) * 1997-02-25 2001-09-25 At&T Corp. System and method for accessing heterogeneous databases
GB2380300B (en) * 1997-09-21 2003-09-10 Microsoft Corp A data filtering system and method
US6167397A (en) * 1997-09-23 2000-12-26 At&T Corporation Method of clustering electronic documents in response to a search query
US6272492B1 (en) * 1997-11-21 2001-08-07 Ibm Corporation Front-end proxy for transparently increasing web server functionality
US6236991B1 (en) * 1997-11-26 2001-05-22 International Business Machines Corp. Method and system for providing access for categorized information from online internet and intranet sources
US6542888B2 (en) * 1997-11-26 2003-04-01 International Business Machines Corporation Content filtering for electronic documents generated in multiple foreign languages
US6021411A (en) * 1997-12-30 2000-02-01 International Business Machines Corporation Case-based reasoning system and method for scoring cases in a case database
US7010536B1 (en) * 1998-01-30 2006-03-07 Pattern Intelligence, Inc. System and method for creating and manipulating information containers with dynamic registers
US6032145A (en) * 1998-04-10 2000-02-29 Requisite Technology, Inc. Method and system for database manipulation
US6748376B1 (en) 1998-04-10 2004-06-08 Requisite Technology, Inc. Method and system for database manipulation
US6473659B1 (en) * 1998-04-10 2002-10-29 General Electric Company System and method for integrating a plurality of diagnostic related information
US6044375A (en) * 1998-04-30 2000-03-28 Hewlett-Packard Company Automatic extraction of metadata using a neural network
US6199061B1 (en) * 1998-06-17 2001-03-06 Microsoft Corporation Method and apparatus for providing dynamic help topic titles to a user
US6549940B1 (en) * 1998-06-29 2003-04-15 Sbc Technology Resources, Inc. Graphical user interface for providing and facilitating user for searching and accessing information with options of selecting one of carrier circuit, facility reroute, customer and cable
US6401118B1 (en) * 1998-06-30 2002-06-04 Online Monitoring Services Method and computer program product for an online monitoring search engine
US7602424B2 (en) * 1998-07-23 2009-10-13 Scenera Technologies, Llc Method and apparatus for automatically categorizing images in a digital camera
US20010012062A1 (en) * 1998-07-23 2001-08-09 Eric C. Anderson System and method for automatic analysis and categorization of images in an electronic imaging device
US6363377B1 (en) 1998-07-30 2002-03-26 Sarnoff Corporation Search data processor
US6035294A (en) * 1998-08-03 2000-03-07 Big Fat Fish, Inc. Wide access databases and database systems
AU5251099A (en) * 1998-08-03 2000-02-28 Robert D. Fish Self-evolving database and method of using same
NO984066L (en) * 1998-09-03 2000-03-06 Arendi As Computer function button
US7272604B1 (en) * 1999-09-03 2007-09-18 Atle Hedloy Method, system and computer readable medium for addressing handling from an operating system
US7496854B2 (en) * 1998-11-10 2009-02-24 Arendi Holding Limited Method, system and computer readable medium for addressing handling from a computer program
AU5822899A (en) 1998-09-18 2000-04-10 Tacit Knowledge Systems Method and apparatus for querying a user knowledge profile
US6115709A (en) * 1998-09-18 2000-09-05 Tacit Knowledge Systems, Inc. Method and system for constructing a knowledge profile of a user having unrestricted and restricted access portions according to respective levels of confidence of content of the portions
US8380875B1 (en) 1998-09-18 2013-02-19 Oracle International Corporation Method and system for addressing a communication document for transmission over a network based on the content thereof
CA2306083A1 (en) 1998-10-28 2000-05-04 Verticalone Corporation Apparatus and method for automated aggregation and delivery of electronic personal information or data
US6871220B1 (en) 1998-10-28 2005-03-22 Yodlee, Inc. System and method for distributed storage and retrieval of personal information
US6385602B1 (en) * 1998-11-03 2002-05-07 E-Centives, Inc. Presentation of search results using dynamic categorization
US8121891B2 (en) 1998-11-12 2012-02-21 Accenture Global Services Gmbh Personalized product report
US7076504B1 (en) 1998-11-19 2006-07-11 Accenture Llp Sharing a centralized profile
US6195651B1 (en) * 1998-11-19 2001-02-27 Andersen Consulting Properties Bv System, method and article of manufacture for a tuned user application experience
US8135413B2 (en) 1998-11-24 2012-03-13 Tracbeam Llc Platform and applications for wireless location and other complex services
EP1006467A3 (en) * 1998-11-25 2000-12-20 Canon Research Centre France S.A. Method and device for the automatic classification of sites or users of a communication network
US6366910B1 (en) 1998-12-07 2002-04-02 Amazon.Com, Inc. Method and system for generation of hierarchical search results
US6802042B2 (en) * 1999-06-01 2004-10-05 Yodlee.Com, Inc. Method and apparatus for providing calculated and solution-oriented personalized summary-reports to a user through a single user-interface
US7085997B1 (en) 1998-12-08 2006-08-01 Yodlee.Com Network-based bookmark management and web-summary system
US8069407B1 (en) 1998-12-08 2011-11-29 Yodlee.Com, Inc. Method and apparatus for detecting changes in websites and reporting results to web developers for navigation template repair purposes
US6517587B2 (en) * 1998-12-08 2003-02-11 Yodlee.Com, Inc. Networked architecture for enabling automated gathering of information from Web servers
US7672879B1 (en) 1998-12-08 2010-03-02 Yodlee.Com, Inc. Interactive activity interface for managing personal data and performing transactions over a data packet network
CA2288444A1 (en) * 1998-12-23 2000-06-23 Nortel Networks Corporation Auto-generation of multimedia computer telephony integration applications by using keywords
US6370527B1 (en) * 1998-12-29 2002-04-09 At&T Corp. Method and apparatus for searching distributed networks using a plurality of search devices
EP1171828A1 (en) * 1999-01-08 2002-01-16 Micro-Integration Corporation Search engine database and interface
US20060010136A1 (en) * 1999-01-28 2006-01-12 Deangelo Michael System and method for creating and manipulating information containers with dynamic registers
US6330564B1 (en) * 1999-02-10 2001-12-11 International Business Machines Corporation System and method for automated problem isolation in systems with measurements structured as a multidimensional database
US6834276B1 (en) * 1999-02-25 2004-12-21 Integrated Data Control, Inc. Database system and method for data acquisition and perusal
US7966328B2 (en) 1999-03-02 2011-06-21 Rose Blush Software Llc Patent-related tools and methodology for use in research and development projects
US7716060B2 (en) * 1999-03-02 2010-05-11 Germeraad Paul B Patent-related tools and methodology for use in the merger and acquisition process
EP1163607A2 (en) * 1999-03-05 2001-12-19 Accenture LLP Method and apparatus for creating an information summary
US6924828B1 (en) * 1999-04-27 2005-08-02 Surfnotes Method and apparatus for improved information representation
AU4989100A (en) * 1999-05-04 2000-11-17 Susan A. Capizzi Method and apparatus for categorizing and retrieving network pages and sites
US6175830B1 (en) 1999-05-20 2001-01-16 Evresearch, Ltd. Information management, retrieval and display system and associated method
US8438487B1 (en) * 1999-05-24 2013-05-07 Catherine Lin-Hendel Method and system for one-click navigation and browsing of electronic media and their category structure as well as tracking the navigation and browsing thereof
KR20000075203A (en) * 1999-05-31 2000-12-15 홍오성 General-purpose robot agent and real-time search method
US7752535B2 (en) 1999-06-01 2010-07-06 Yodlec.com, Inc. Categorization of summarized information
US6418434B1 (en) * 1999-06-25 2002-07-09 International Business Machines Corporation Two stage automated electronic messaging system
US7181438B1 (en) 1999-07-21 2007-02-20 Alberti Anemometer, Llc Database access system
EP1247148A2 (en) * 1999-08-10 2002-10-09 Seung Chul Joo Content service system and method using classification diagram
US6444072B1 (en) * 1999-08-11 2002-09-03 Southpac Trust International Process for producing holographic material
US6324534B1 (en) 1999-09-10 2001-11-27 Requisite Technology, Inc. Sequential subset catalog search engine
US6697799B1 (en) * 1999-09-10 2004-02-24 Requisite Technology, Inc. Automated classification of items using cascade searches
US6907424B1 (en) 1999-09-10 2005-06-14 Requisite Technology, Inc. Sequential subset catalog search engine
EP1286735A1 (en) 1999-09-24 2003-03-05 Dennis Jay Dupray Geographically constrained network services
EP1222806A2 (en) * 1999-09-24 2002-07-17 United Video Properties, Inc. Interactive television program guide with enhanced user interface
US6963863B1 (en) * 1999-09-28 2005-11-08 Thomas Bannon Network query and matching system and method
US7734680B1 (en) 1999-09-30 2010-06-08 Koninklijke Philips Electronics N.V. Method and apparatus for realizing personalized information from multiple information sources
US7386599B1 (en) * 1999-09-30 2008-06-10 Ricoh Co., Ltd. Methods and apparatuses for searching both external public documents and internal private documents in response to single search request
US6772338B1 (en) 1999-10-26 2004-08-03 Ricoh Co., Ltd. Device for transfering data between an unconscious capture device and another device
US6442555B1 (en) * 1999-10-26 2002-08-27 Hewlett-Packard Company Automatic categorization of documents using document signatures
US20020069134A1 (en) * 1999-11-01 2002-06-06 Neal Solomon System, method and apparatus for aggregation of cooperative intelligent agents for procurement in a distributed network
US20030074301A1 (en) * 1999-11-01 2003-04-17 Neal Solomon System, method, and apparatus for an intelligent search agent to access data in a distributed network
GB2371661B (en) * 1999-11-01 2004-06-09 Lockheed Corp System and method for the storage and access of electronic data in a web-based computer system
US20020046157A1 (en) * 1999-11-01 2002-04-18 Neal Solomon System, method and apparatus for demand-initiated intelligent negotiation agents in a distributed network
US20020055903A1 (en) * 1999-11-01 2002-05-09 Neal Solomon System, method, and apparatus for a cooperative communications network
WO2001037134A1 (en) * 1999-11-16 2001-05-25 Searchcraft Corporation Method for searching from a plurality of data sources
US7249315B2 (en) 1999-11-23 2007-07-24 John Brent Moetteli System and method of creating and following URL tours
GB9928210D0 (en) * 1999-11-29 2000-01-26 Medical Data Service Gmbh Method
US6556225B1 (en) 1999-11-30 2003-04-29 International Business Machines Corp. Graphical display of path through three-dimensional organization of information
CN1141638C (en) * 1999-11-30 2004-03-10 国际商业机器公司 Establish information display tactics for different display unit
US6501469B1 (en) 1999-11-30 2002-12-31 International Business Machines Corp. Arrangement of information to allow three-dimensional navigation through information displays with indication of intended starting point
US6507343B1 (en) 1999-11-30 2003-01-14 International Business Machines Corp. Arrangement of information to allow three-dimensional navigation through information displays
US6924797B1 (en) 1999-11-30 2005-08-02 International Business Machines Corp. Arrangement of information into linear form for display on diverse display devices
US6593943B1 (en) 1999-11-30 2003-07-15 International Business Machines Corp. Information grouping configuration for use with diverse display devices
US6754660B1 (en) 1999-11-30 2004-06-22 International Business Machines Corp. Arrangement of information for display into a continuum ranging from closely related to distantly related to a reference piece of information
KR20000012520A (en) * 1999-12-09 2000-03-06 홍윤택 Internet service method of information having scenario
DE19959850A1 (en) * 1999-12-10 2001-06-13 Deutsche Telekom Ag Communication system and method for providing Internet access by telephone
US6850906B1 (en) 1999-12-15 2005-02-01 Traderbot, Inc. Real-time financial search engine and method
US20010032189A1 (en) * 1999-12-27 2001-10-18 Powell Michael D. Method and apparatus for a cryptographically assisted commercial network system designed to facilitate idea submission, purchase and licensing and innovation transfer
EP1120722A3 (en) * 2000-01-13 2004-01-14 Applied Psychology Research Limited Method and apparatus for generating categorization data
WO2001052094A2 (en) * 2000-01-14 2001-07-19 Thinkstream, Inc. Distributed globally accessible information network
US8019757B2 (en) * 2000-01-14 2011-09-13 Thinkstream, Inc. Distributed globally accessible information network implemented to maintain universal accessibility
US20020087546A1 (en) * 2000-01-31 2002-07-04 Michael Slater Apparatus, methods, and systems for digital photo management
US6868525B1 (en) 2000-02-01 2005-03-15 Alberti Anemometer Llc Computer graphic display visualization system and method
JP4491893B2 (en) * 2000-02-03 2010-06-30 ソニー株式会社 Information sending device, information terminal device, and information providing method
US7262778B1 (en) 2000-02-11 2007-08-28 Sony Corporation Automatic color adjustment of a template design
WO2001059587A2 (en) 2000-02-11 2001-08-16 Kapow Aps User interface, system and method for performing a web-based transaction
US20010042060A1 (en) * 2000-02-18 2001-11-15 Homeportfolio Inc. A Massachusetts Corporation Attribute tagging and matching system and method for database management
US10002167B2 (en) 2000-02-25 2018-06-19 Vilox Technologies, Llc Search-on-the-fly/sort-on-the-fly by a search engine directed to a plurality of disparate data sources
US6760720B1 (en) 2000-02-25 2004-07-06 Pedestrian Concepts, Inc. Search-on-the-fly/sort-on-the-fly search engine for searching databases
US20030149940A1 (en) * 2000-02-25 2003-08-07 Fordyce Paul Mervyn Document assembly from a database
AU2001239997A1 (en) * 2000-03-02 2001-09-12 Mmc Webreporter Systems.Com, Inc. System and method for creating a book of reports over a computer network
AU2001240061A1 (en) * 2000-03-09 2001-09-17 The Web Access, Inc. Method and apparatus for organizing data by overlaying a searchable database with a directory tree structure
US6311194B1 (en) * 2000-03-15 2001-10-30 Taalee, Inc. System and method for creating a semantic web and its applications in browsing, searching, profiling, personalization and advertising
US7137067B2 (en) * 2000-03-17 2006-11-14 Fujitsu Limited Device and method for presenting news information
US20020038299A1 (en) * 2000-03-20 2002-03-28 Uri Zernik Interface for presenting information
US6633903B1 (en) * 2000-03-23 2003-10-14 Monkeymedia, Inc. Method and article of manufacture for seamless integrated searching
EP1269347A1 (en) * 2000-03-31 2003-01-02 Kapow APS Method of retrieving attributes from at least two data sources
US20020073079A1 (en) * 2000-04-04 2002-06-13 Merijn Terheggen Method and apparatus for searching a database and providing relevance feedback
US6760721B1 (en) * 2000-04-14 2004-07-06 Realnetworks, Inc. System and method of managing metadata data
US6654749B1 (en) 2000-05-12 2003-11-25 Choice Media, Inc. Method and system for searching indexed information databases with automatic user registration via a communication network
US6567805B1 (en) 2000-05-15 2003-05-20 International Business Machines Corporation Interactive automated response system
US6879332B2 (en) * 2000-05-16 2005-04-12 Groxis, Inc. User interface for displaying and exploring hierarchical information
KR20010104871A (en) * 2000-05-16 2001-11-28 임갑철 System for internet site search service having a function of automatic sorting of search results
US6704729B1 (en) * 2000-05-19 2004-03-09 Microsoft Corporation Retrieval of relevant information categories
US6876997B1 (en) 2000-05-22 2005-04-05 Overture Services, Inc. Method and apparatus for indentifying related searches in a database search system
US8082355B1 (en) 2000-05-26 2011-12-20 Thomson Licensing Internet multimedia advertisement insertion architecture
US10684350B2 (en) 2000-06-02 2020-06-16 Tracbeam Llc Services and applications for a communications network
US9875492B2 (en) 2001-05-22 2018-01-23 Dennis J. Dupray Real estate transaction system
US10641861B2 (en) 2000-06-02 2020-05-05 Dennis J. Dupray Services and applications for a communications network
US6721729B2 (en) 2000-06-09 2004-04-13 Thanh Ngoc Nguyen Method and apparatus for electronic file search and collection
US20020091836A1 (en) * 2000-06-24 2002-07-11 Moetteli John Brent Browsing method for focusing research
US20030120653A1 (en) * 2000-07-05 2003-06-26 Sean Brady Trainable internet search engine and methods of using
US6625595B1 (en) * 2000-07-05 2003-09-23 Bellsouth Intellectual Property Corporation Method and system for selectively presenting database results in an information retrieval system
US7490092B2 (en) * 2000-07-06 2009-02-10 Streamsage, Inc. Method and system for indexing and searching timed media information based upon relevance intervals
US20070027672A1 (en) * 2000-07-31 2007-02-01 Michel Decary Computer method and apparatus for extracting data from web pages
US6778986B1 (en) 2000-07-31 2004-08-17 Eliyon Technologies Corporation Computer method and apparatus for determining site type of a web site
US7617116B2 (en) * 2000-08-04 2009-11-10 Athenahealth, Inc. Practice management and billing automation system
DE10038494A1 (en) * 2000-08-08 2002-02-21 Abb Patent Gmbh Data processing method for equipment monitoring uses autocorrelation function to identify noise corruption
US7359951B2 (en) 2000-08-08 2008-04-15 Aol Llc, A Delaware Limited Liability Company Displaying search results
US7007008B2 (en) * 2000-08-08 2006-02-28 America Online, Inc. Category searching
US7225180B2 (en) * 2000-08-08 2007-05-29 Aol Llc Filtering search results
US7047229B2 (en) 2000-08-08 2006-05-16 America Online, Inc. Searching content on web pages
JP2002063180A (en) 2000-08-17 2002-02-28 Tsubasa System Co Ltd Method for retrieving used car retrieval support system
US20020026386A1 (en) * 2000-08-17 2002-02-28 Walden John C. Personalized storage folder & associated site-within-a-site web site
ATE288108T1 (en) * 2000-08-18 2005-02-15 Exalead SEARCH TOOL AND PROCESS FOR SEARCHING USING CATEGORIES AND KEYWORDS
EP1182580A1 (en) * 2000-08-23 2002-02-27 Matsushita Electric Industrial Co., Ltd. Document retrieval and classification method and apparatus
KR100407081B1 (en) * 2000-08-24 2003-11-28 마쯔시다덴기산교 가부시키가이샤 Document retrieval and classification method and apparatus
IL140241A (en) * 2000-12-11 2007-02-11 Celebros Ltd Interactive searching system and method
US7016853B1 (en) 2000-09-20 2006-03-21 Openhike, Inc. Method and system for resume storage and retrieval
US20020040311A1 (en) * 2000-10-04 2002-04-04 John Douglass Web browser page rating system
US20020040384A1 (en) * 2000-10-04 2002-04-04 John Moetteli Communication method using customisable banners
US7233942B2 (en) * 2000-10-10 2007-06-19 Truelocal Inc. Method and apparatus for providing geographically authenticated electronic documents
US6804662B1 (en) * 2000-10-27 2004-10-12 Plumtree Software, Inc. Method and apparatus for query and analysis
US6711570B1 (en) 2000-10-31 2004-03-23 Tacit Knowledge Systems, Inc. System and method for matching terms contained in an electronic document with a set of user profiles
US6678694B1 (en) 2000-11-08 2004-01-13 Frank Meik Indexed, extensible, interactive document retrieval system
WO2002041190A2 (en) * 2000-11-15 2002-05-23 Holbrook David M Apparatus and method for organizing and/or presenting data
US20070226640A1 (en) * 2000-11-15 2007-09-27 Holbrook David M Apparatus and methods for organizing and/or presenting data
US20020083468A1 (en) * 2000-11-16 2002-06-27 Dudkiewicz Gil Gavriel System and method for generating metadata for segments of a video program
US7444660B2 (en) 2000-11-16 2008-10-28 Meevee, Inc. System and method for generating metadata for video programming events
WO2002043353A2 (en) 2000-11-16 2002-05-30 Mydtv, Inc. System and methods for determining the desirability of video programming events
US20020152463A1 (en) * 2000-11-16 2002-10-17 Dudkiewicz Gil Gavriel System and method for personalized presentation of video programming events
US7016892B1 (en) * 2000-11-17 2006-03-21 Cnet Networks, Inc. Apparatus and method for delivering information over a network
US6983288B1 (en) 2000-11-20 2006-01-03 Cisco Technology, Inc. Multiple layer information object repository
US7103607B1 (en) 2000-11-20 2006-09-05 Cisco Technology, Inc. Business vocabulary data retrieval using alternative forms
US7062705B1 (en) 2000-11-20 2006-06-13 Cisco Technology, Inc. Techniques for forming electronic documents comprising multiple information types
US7139973B1 (en) * 2000-11-20 2006-11-21 Cisco Technology, Inc. Dynamic information object cache approach useful in a vocabulary retrieval system
US7007018B1 (en) 2000-11-20 2006-02-28 Cisco Technology, Inc. Business vocabulary data storage using multiple inter-related hierarchies
US6594670B1 (en) 2000-12-22 2003-07-15 Mathias Genser System and method for organizing search criteria match results
US6647396B2 (en) * 2000-12-28 2003-11-11 Trilogy Development Group, Inc. Classification based content management system
US20020087532A1 (en) * 2000-12-29 2002-07-04 Steven Barritz Cooperative, interactive, heuristic system for the creation and ongoing modification of categorization systems
US7174453B2 (en) 2000-12-29 2007-02-06 America Online, Inc. Message screening system
US6928433B2 (en) * 2001-01-05 2005-08-09 Creative Technology Ltd Automatic hierarchical categorization of music by metadata
US20040111386A1 (en) * 2001-01-08 2004-06-10 Goldberg Jonathan M. Knowledge neighborhoods
US7685224B2 (en) * 2001-01-11 2010-03-23 Truelocal Inc. Method for providing an attribute bounded network of computers
US6983270B2 (en) 2001-01-24 2006-01-03 Andreas Rippich Method and apparatus for displaying database search results
US20020107707A1 (en) * 2001-02-05 2002-08-08 Imagepaths.Com Llc System and method for providing personalized health interventions over a computer network
US7139762B2 (en) * 2001-02-27 2006-11-21 Microsoft Corporation System and method for filtering database records
US6938046B2 (en) 2001-03-02 2005-08-30 Dow Jones Reuters Business Interactive, Llp Polyarchical data indexing and automatically generated hierarchical data indexing paths
US7386792B1 (en) 2001-03-07 2008-06-10 Thomas Layne Bascom System and method for collecting, storing, managing and providing categorized information related to a document object
US7158971B1 (en) 2001-03-07 2007-01-02 Thomas Layne Bascom Method for searching document objects on a network
US20030018659A1 (en) * 2001-03-14 2003-01-23 Lingomotors, Inc. Category-based selections in an information access environment
US7085753B2 (en) * 2001-03-22 2006-08-01 E-Nvent Usa Inc. Method and system for mapping and searching the Internet and displaying the results in a visual form
JP2002297185A (en) * 2001-03-29 2002-10-11 Pioneer Electronic Corp Device and method for information processing
US20020194161A1 (en) * 2001-04-12 2002-12-19 Mcnamee J. Paul Directed web crawler with machine learning
US6957206B2 (en) 2001-04-19 2005-10-18 Quantum Dynamics, Inc. Computer system and method with adaptive N-level structures for automated generation of program solutions based on rules input by subject matter experts
US20020169770A1 (en) * 2001-04-27 2002-11-14 Kim Brian Seong-Gon Apparatus and method that categorize a collection of documents into a hierarchy of categories that are defined by the collection of documents
US7536413B1 (en) 2001-05-07 2009-05-19 Ixreveal, Inc. Concept-based categorization of unstructured objects
US7627588B1 (en) 2001-05-07 2009-12-01 Ixreveal, Inc. System and method for concept based analysis of unstructured data
US7194483B1 (en) 2001-05-07 2007-03-20 Intelligenxia, Inc. Method, system, and computer program product for concept-based multi-dimensional analysis of unstructured information
USRE46973E1 (en) 2001-05-07 2018-07-31 Ureveal, Inc. Method, system, and computer program product for concept-based multi-dimensional analysis of unstructured information
EP1256887A1 (en) * 2001-05-09 2002-11-13 Requisite Technology Inc. Sequential subset catalog search engine
US6920448B2 (en) 2001-05-09 2005-07-19 Agilent Technologies, Inc. Domain specific knowledge-based metasearch system and methods of using
US7519605B2 (en) 2001-05-09 2009-04-14 Agilent Technologies, Inc. Systems, methods and computer readable media for performing a domain-specific metasearch, and visualizing search results therefrom
AU785452B2 (en) * 2001-05-09 2007-07-12 Requisite Software, Inc. Sequential subset catalog search engine
US8082096B2 (en) 2001-05-22 2011-12-20 Tracbeam Llc Wireless location routing applications and architecture therefor
US7765378B1 (en) * 2001-06-01 2010-07-27 Sanbolic, Inc. Utilization of memory storage
US7840634B2 (en) * 2001-06-26 2010-11-23 Eastman Kodak Company System and method for managing images over a communication network
JP3907161B2 (en) * 2001-06-29 2007-04-18 インターナショナル・ビジネス・マシーンズ・コーポレーション Keyword search method, keyword search terminal, computer program
CN1535433A (en) * 2001-07-04 2004-10-06 库吉萨姆媒介公司 Category based, extensible and interactive system for document retrieval
US7043492B1 (en) 2001-07-05 2006-05-09 Requisite Technology, Inc. Automated classification of items using classification mappings
US7130861B2 (en) 2001-08-16 2006-10-31 Sentius International Corporation Automated creation and delivery of database content
US6947947B2 (en) * 2001-08-17 2005-09-20 Universal Business Matrix Llc Method for adding metadata to data
US20030061013A1 (en) * 2001-09-11 2003-03-27 Bentley William F. Optimal selection of IP modules for design integration
US20030050967A1 (en) * 2001-09-11 2003-03-13 Bentley William F. Apparatus and method for optimal selection of IP modules for design integration
WO2003042777A2 (en) * 2001-09-14 2003-05-22 Kent Ridge Digital Labs Method and system for personalized information management
US20030061161A1 (en) * 2001-09-21 2003-03-27 Black Daniel A. Business method for facilitating offsetting payables against receivables
AUPR796801A0 (en) * 2001-09-27 2001-10-25 Plugged In Communications Pty Ltd Computer user interface tool for navigation of data stored in directed graphs
AUPR796701A0 (en) * 2001-09-27 2001-10-25 Plugged In Communications Pty Ltd Database query system and method
AU2002366072A1 (en) * 2001-11-16 2003-06-10 Mydtv, Inc. Systems and methods relating to determining the desirability of and recording programming events
JP2003157376A (en) * 2001-11-21 2003-05-30 Ricoh Co Ltd Network system, identification information management method, server device, program and recording medium
US7134082B1 (en) 2001-12-04 2006-11-07 Louisiana Tech University Research Foundation As A Division Of The Louisiana Tech University Foundation Method and apparatus for individualizing and updating a directory of computer files
DE10160607A1 (en) * 2001-12-10 2003-06-26 Oce Printing Systems Gmbh Production of printed document such as newspaper, from multiple files containing page data, by creating cluster file from associated input files and storing in memory before transmission to printer
US7315848B2 (en) 2001-12-12 2008-01-01 Aaron Pearse Web snippets capture, storage and retrieval system and method
US8589413B1 (en) 2002-03-01 2013-11-19 Ixreveal, Inc. Concept-based method and system for dynamically analyzing results from search engines
US6910037B2 (en) * 2002-03-07 2005-06-21 Koninklijke Philips Electronics N.V. Method and apparatus for providing search results in response to an information search request
EP1345132A1 (en) * 2002-03-14 2003-09-17 Hewlett-Packard Company Process for storing and retrieving a document within a knowledge base of documents
US20030217291A1 (en) * 2002-03-18 2003-11-20 Merck & Company, Inc. Method and system for real-time secure transfer of personal information between websites
JP4352653B2 (en) * 2002-04-12 2009-10-28 三菱電機株式会社 Video content management system
US20050141028A1 (en) * 2002-04-19 2005-06-30 Toshiba Corporation And Toshiba Tec Kabushiki Kaisha Document management system for automating operations performed on documents in data storage areas
US8127217B2 (en) 2002-04-19 2012-02-28 Kabushiki Kaisha Toshiba Document management system for transferring a plurality of documents
US7376709B1 (en) * 2002-05-09 2008-05-20 Proquest Method for creating durable web-enabled uniform resource locator links
US7080059B1 (en) 2002-05-13 2006-07-18 Quasm Corporation Search and presentation engine
US8260786B2 (en) * 2002-05-24 2012-09-04 Yahoo! Inc. Method and apparatus for categorizing and presenting documents of a distributed database
US7231395B2 (en) * 2002-05-24 2007-06-12 Overture Services, Inc. Method and apparatus for categorizing and presenting documents of a distributed database
US20040002993A1 (en) * 2002-06-26 2004-01-01 Microsoft Corporation User feedback processing of metadata associated with digital media files
WO2004012431A1 (en) * 2002-07-29 2004-02-05 British Telecommunications Public Limited Company Improvements in or relating to information provision for call centres
US7136866B2 (en) * 2002-08-15 2006-11-14 Microsoft Corporation Media identifier registry
US8335779B2 (en) * 2002-08-16 2012-12-18 Gamroe Applications, Llc Method and apparatus for gathering, categorizing and parameterizing data
US20040049514A1 (en) * 2002-09-11 2004-03-11 Sergei Burkov System and method of searching data utilizing automatic categorization
US7076484B2 (en) * 2002-09-16 2006-07-11 International Business Machines Corporation Automated research engine
US6829599B2 (en) * 2002-10-02 2004-12-07 Xerox Corporation System and method for improving answer relevance in meta-search engines
US20040068514A1 (en) * 2002-10-04 2004-04-08 Parvathi Chundi System and method for biotechnology information access and data analysis
US20040083213A1 (en) * 2002-10-25 2004-04-29 Yuh-Cherng Wu Solution search
US7437703B2 (en) * 2002-10-25 2008-10-14 Sap Ag Enterprise multi-agent software system with services able to call multiple engines and scheduling capability
US6944612B2 (en) 2002-11-13 2005-09-13 Xerox Corporation Structured contextual clustering method and system in a federated search engine
US9805373B1 (en) 2002-11-19 2017-10-31 Oracle International Corporation Expertise services platform
US7640336B1 (en) 2002-12-30 2009-12-29 Aol Llc Supervising user interaction with online services
JP2004234157A (en) * 2003-01-29 2004-08-19 Sony Corp Information processor and method, and computer program
US20050149507A1 (en) * 2003-02-05 2005-07-07 Nye Timothy G. Systems and methods for identifying an internet resource address
US8117130B2 (en) * 2003-02-25 2012-02-14 Stragent, Llc Batch loading and self-registration of digital media files
US7945567B2 (en) * 2003-03-17 2011-05-17 Hewlett-Packard Development Company, L.P. Storing and/or retrieving a document within a knowledge base or document repository
US20040186833A1 (en) * 2003-03-19 2004-09-23 The United States Of America As Represented By The Secretary Of The Army Requirements -based knowledge discovery for technology management
US7769794B2 (en) 2003-03-24 2010-08-03 Microsoft Corporation User interface for a file system shell
US7823077B2 (en) 2003-03-24 2010-10-26 Microsoft Corporation System and method for user modification of metadata in a shell browser
US7240292B2 (en) 2003-04-17 2007-07-03 Microsoft Corporation Virtual address bar user interface control
US7421438B2 (en) 2004-04-29 2008-09-02 Microsoft Corporation Metadata editing control
US7627552B2 (en) 2003-03-27 2009-12-01 Microsoft Corporation System and method for filtering and organizing items based on common elements
US8533840B2 (en) * 2003-03-25 2013-09-10 DigitalDoors, Inc. Method and system of quantifying risk
US7925682B2 (en) 2003-03-27 2011-04-12 Microsoft Corporation System and method utilizing virtual folders
US7523095B2 (en) * 2003-04-29 2009-04-21 International Business Machines Corporation System and method for generating refinement categories for a set of search results
US20040230564A1 (en) * 2003-05-16 2004-11-18 Horatiu Simon Filtering algorithm for information retrieval systems
US7729990B2 (en) * 2003-05-28 2010-06-01 Stephen Michael Marceau Check image access system
US20040243536A1 (en) * 2003-05-28 2004-12-02 Integrated Data Control, Inc. Information capturing, indexing, and authentication system
US20040243627A1 (en) * 2003-05-28 2004-12-02 Integrated Data Control, Inc. Chat stream information capturing and indexing system
US20040243494A1 (en) * 2003-05-28 2004-12-02 Integrated Data Control, Inc. Financial transaction information capturing and indexing system
US7403939B1 (en) 2003-05-30 2008-07-22 Aol Llc Resolving queries based on automatic determination of requestor geographic location
US7613687B2 (en) * 2003-05-30 2009-11-03 Truelocal Inc. Systems and methods for enhancing web-based searching
US7206780B2 (en) * 2003-06-27 2007-04-17 Sbc Knowledge Ventures, L.P. Relevance value for each category of a particular search result in the ranked list is estimated based on its rank and actual relevance values
US7617203B2 (en) * 2003-08-01 2009-11-10 Yahoo! Inc Listings optimization using a plurality of data sources
US8473532B1 (en) 2003-08-12 2013-06-25 Louisiana Tech University Research Foundation Method and apparatus for automatic organization for computer files
US20050044060A1 (en) * 2003-08-18 2005-02-24 Yuh-Cherng Wu Filtering process for information retrieval systems
WO2005020104A1 (en) * 2003-08-18 2005-03-03 Sap Aktiengesellschaft User-requested search or modification of indices for search engines
US20050071310A1 (en) * 2003-09-30 2005-03-31 Nadav Eiron System, method, and computer program product for identifying multi-page documents in hypertext collections
US20050080770A1 (en) * 2003-10-14 2005-04-14 Microsoft Corporation System and process for presenting search results in a tree format
US8024335B2 (en) 2004-05-03 2011-09-20 Microsoft Corporation System and method for dynamically generating a selectable search extension
US7346494B2 (en) * 2003-10-31 2008-03-18 International Business Machines Corporation Document summarization based on topicality and specificity
US20050132305A1 (en) * 2003-12-12 2005-06-16 Guichard Robert D. Electronic information access systems, methods for creation and related commercial models
US8706686B2 (en) * 2003-12-24 2014-04-22 Split-Vision Kennis B.V. Method, computer system, computer program and computer program product for storage and retrieval of data files in a data storage means
NL1025129C2 (en) * 2003-12-24 2005-07-04 Split Vision Systemen B V Method, computer system, computer program and computer program product for storing and recovering data files in a data memory.
US7447678B2 (en) * 2003-12-31 2008-11-04 Google Inc. Interface for a universal search engine
US8121997B2 (en) * 2004-02-09 2012-02-21 Limelight Networks, Inc. Universal search engine
US20050177555A1 (en) * 2004-02-11 2005-08-11 Alpert Sherman R. System and method for providing information on a set of search returned documents
US7836083B2 (en) * 2004-02-20 2010-11-16 Factiva, Inc. Intelligent search and retrieval system and method
US8595146B1 (en) 2004-03-15 2013-11-26 Aol Inc. Social networking permissions
WO2005111868A2 (en) * 2004-05-03 2005-11-24 Microsoft Corporation System and method for dynamically generating a selectable search extension
US20050250439A1 (en) * 2004-05-06 2005-11-10 Garthen Leslie Book radio system
US20050248453A1 (en) * 2004-05-10 2005-11-10 Fechter Cary E Multiple deterrent, emergency response and localization system and method
US20050261962A1 (en) * 2004-05-18 2005-11-24 Khai Gan Chuah Anonymous page recognition
US9111284B2 (en) * 2004-05-21 2015-08-18 Google Inc. Maintaining a history of query results
US8370166B2 (en) * 2004-06-15 2013-02-05 Sap Aktiengesellschaft Script-based information retrieval
US7562069B1 (en) 2004-07-01 2009-07-14 Aol Llc Query disambiguation
US7519595B2 (en) * 2004-07-14 2009-04-14 Microsoft Corporation Method and system for adaptive categorial presentation of search results
US7698333B2 (en) 2004-07-22 2010-04-13 Factiva, Inc. Intelligent query system and method using phrase-code frequency-inverse phrase-code document frequency module
US7483918B2 (en) 2004-08-10 2009-01-27 Microsoft Corporation Dynamic physical database design
US7567962B2 (en) * 2004-08-13 2009-07-28 Microsoft Corporation Generating a labeled hierarchy of mutually disjoint categories from a set of query results
US7516149B2 (en) 2004-08-30 2009-04-07 Microsoft Corporation Robust detector of fuzzy duplicates
US7493301B2 (en) 2004-09-10 2009-02-17 Suggestica, Inc. Creating and sharing collections of links for conducting a search directed by a hierarchy-free set of topics, and a user interface therefor
US20060059135A1 (en) * 2004-09-10 2006-03-16 Eran Palmon Conducting a search directed by a hierarchy-free set of topics
US7321889B2 (en) * 2004-09-10 2008-01-22 Suggestica, Inc. Authoring and managing personalized searchable link collections
US20080320002A1 (en) * 2004-09-21 2008-12-25 Koninklijke Philips Electronics, N.V. Method of Providing Information
EP1794687A1 (en) * 2004-09-30 2007-06-13 British Telecommunications Public Limited Company Information retrieval
JP4958269B2 (en) * 2004-11-25 2012-06-20 株式会社スクウェア・エニックス How to search for user selection candidates
US11321408B2 (en) 2004-12-15 2022-05-03 Applied Invention, Llc Data store with lock-free stateless paging capacity
US8275804B2 (en) * 2004-12-15 2012-09-25 Applied Minds, Llc Distributed data store with a designated master to ensure consistency
US8996486B2 (en) * 2004-12-15 2015-03-31 Applied Invention, Llc Data store with lock-free stateless paging capability
US7774308B2 (en) * 2004-12-15 2010-08-10 Applied Minds, Inc. Anti-item for deletion of content in a distributed datastore
US7590635B2 (en) * 2004-12-15 2009-09-15 Applied Minds, Inc. Distributed data store with an orderstamp to ensure progress
US7272597B2 (en) 2004-12-29 2007-09-18 Aol Llc Domain expert search
US7349896B2 (en) * 2004-12-29 2008-03-25 Aol Llc Query routing
US7818314B2 (en) 2004-12-29 2010-10-19 Aol Inc. Search fusion
US7571157B2 (en) 2004-12-29 2009-08-04 Aol Llc Filtering search results
US7418410B2 (en) 2005-01-07 2008-08-26 Nicholas Caiafa Methods and apparatus for anonymously requesting bids from a customer specified quantity of local vendors with automatic geographic expansion
GB0502259D0 (en) * 2005-02-03 2005-03-09 British Telecomm Document searching tool and method
US8423541B1 (en) * 2005-03-31 2013-04-16 Google Inc. Using saved search results for quality feedback
US8195646B2 (en) 2005-04-22 2012-06-05 Microsoft Corporation Systems, methods, and user interfaces for storing, searching, navigating, and retrieving electronic information
US7734644B2 (en) * 2005-05-06 2010-06-08 Seaton Gras System and method for hierarchical information retrieval from a coded collection of relational data
US7665028B2 (en) 2005-07-13 2010-02-16 Microsoft Corporation Rich drag drop user interface
KR100645614B1 (en) * 2005-07-15 2006-11-14 (주)첫눈 Search method and apparatus considering a worth of information
WO2007011140A1 (en) * 2005-07-15 2007-01-25 Chutnoon Inc. Method of extracting topics and issues and method and apparatus for providing search results based on topics and issues
US8024338B2 (en) 2005-08-31 2011-09-20 Brei James E Systems, methods, and interfaces for reducing executions of overly broad user queries
WO2007028013A1 (en) * 2005-08-31 2007-03-08 Thomson Global Resources System and method presenting search results in a topical space
US7788251B2 (en) * 2005-10-11 2010-08-31 Ixreveal, Inc. System, method and computer program product for concept-based searching and analysis
GB2431742A (en) * 2005-10-27 2007-05-02 Hewlett Packard Development Co A method of retrieving data from a data repository
US7707506B2 (en) * 2005-12-28 2010-04-27 Sap Ag Breadcrumb with alternative restriction traversal
US7676485B2 (en) * 2006-01-20 2010-03-09 Ixreveal, Inc. Method and computer program product for converting ontologies into concept semantic networks
US8386469B2 (en) * 2006-02-16 2013-02-26 Mobile Content Networks, Inc. Method and system for determining relevant sources, querying and merging results from multiple content sources
US7917511B2 (en) * 2006-03-20 2011-03-29 Cannon Structures, Inc. Query system using iterative grouping and narrowing of query results
US8793244B2 (en) * 2006-04-17 2014-07-29 Teradata Us, Inc. Data store list generation and management
US8880569B2 (en) * 2006-04-17 2014-11-04 Teradata Us, Inc. Graphical user interfaces for custom lists and labels
EP2021913A4 (en) * 2006-05-19 2009-12-16 Jorn Lyseggen Source search engine
US20070291923A1 (en) * 2006-06-19 2007-12-20 Amy Hsieh Method and apparatus for the purchase, sale and facilitation of voice over internet protocol (VoIP) consultations
US7991769B2 (en) * 2006-07-07 2011-08-02 Yahoo! Inc. System and method for budgeted generalization search in hierarchies
US20080010250A1 (en) * 2006-07-07 2008-01-10 Yahoo! Inc. System and method for generalization search in hierarchies
US20080059485A1 (en) * 2006-08-23 2008-03-06 Finn James P Systems and methods for entering and retrieving data
US7606752B2 (en) 2006-09-07 2009-10-20 Yodlee Inc. Host exchange in bill paying services
CN101150529B (en) * 2006-09-21 2011-07-27 腾讯科技(深圳)有限公司 A method and system for mail search
US7644068B2 (en) * 2006-10-06 2010-01-05 International Business Machines Corporation Selecting records from a list with privacy protections
US7739247B2 (en) * 2006-12-28 2010-06-15 Ebay Inc. Multi-pass data organization and automatic naming
KR100934989B1 (en) * 2007-01-31 2009-12-31 삼성전자주식회사 Content management method and apparatus
US8220023B2 (en) * 2007-02-21 2012-07-10 Nds Limited Method for content presentation
US7705847B2 (en) 2007-03-05 2010-04-27 Oracle International Corporation Graph selection method
US8326852B2 (en) * 2007-03-13 2012-12-04 International Business Machines Corporation Determining query entities for an abstract database from a physical database table
US20080243777A1 (en) * 2007-03-29 2008-10-02 Osamuyimen Thompson Stewart Systems and methods for results list navigation using semantic componential-gradient processing techniques
US8122016B1 (en) * 2007-04-24 2012-02-21 Wal-Mart Stores, Inc. Determining concepts associated with a query
US8019760B2 (en) * 2007-07-09 2011-09-13 Vivisimo, Inc. Clustering system and method
US20090177648A1 (en) * 2007-09-15 2009-07-09 Bond Andrew R Systems and methods for organizing and managing trusted health care reference information
US8600966B2 (en) * 2007-09-20 2013-12-03 Hal Kravcik Internet data mining method and system
KR20090033728A (en) * 2007-10-01 2009-04-06 삼성전자주식회사 Method and apparatus for providing content summary information
US7877344B2 (en) * 2007-10-10 2011-01-25 Northern Light Group, Llc Method and apparatus for extracting meaning from documents using a meaning taxonomy comprising syntactic structures
US8881040B2 (en) 2008-08-28 2014-11-04 Georgetown University System and method for detecting, collecting, analyzing, and communicating event-related information
US9529974B2 (en) 2008-02-25 2016-12-27 Georgetown University System and method for detecting, collecting, analyzing, and communicating event-related information
US9489495B2 (en) 2008-02-25 2016-11-08 Georgetown University System and method for detecting, collecting, analyzing, and communicating event-related information
US9746985B1 (en) 2008-02-25 2017-08-29 Georgetown University System and method for detecting, collecting, analyzing, and communicating event-related information
US8205157B2 (en) * 2008-03-04 2012-06-19 Apple Inc. Methods and graphical user interfaces for conducting searches on a portable multifunction device
US7711622B2 (en) 2008-03-05 2010-05-04 Stephen M Marceau Financial statement and transaction image delivery and access system
US8261334B2 (en) 2008-04-25 2012-09-04 Yodlee Inc. System for performing web authentication of a user by proxy
US9317599B2 (en) * 2008-09-19 2016-04-19 Nokia Technologies Oy Method, apparatus and computer program product for providing relevance indication
US10223907B2 (en) 2008-11-14 2019-03-05 Apple Inc. System and method for capturing remote control device command signals
US9442933B2 (en) * 2008-12-24 2016-09-13 Comcast Interactive Media, Llc Identification of segments within audio, video, and multimedia items
US8713016B2 (en) 2008-12-24 2014-04-29 Comcast Interactive Media, Llc Method and apparatus for organizing segments of media assets and determining relevance of segments to a query
US11531668B2 (en) * 2008-12-29 2022-12-20 Comcast Interactive Media, Llc Merging of multiple data sets
US8555359B2 (en) 2009-02-26 2013-10-08 Yodlee, Inc. System and methods for automatically accessing a web site on behalf of a client
US8176043B2 (en) 2009-03-12 2012-05-08 Comcast Interactive Media, Llc Ranking search results
US8589374B2 (en) 2009-03-16 2013-11-19 Apple Inc. Multifunction device with integrated search and application selection
US9245243B2 (en) 2009-04-14 2016-01-26 Ureveal, Inc. Concept-based analysis of structured and unstructured data using concept inheritance
US8533223B2 (en) 2009-05-12 2013-09-10 Comcast Interactive Media, LLC. Disambiguation and tagging of entities
US9892730B2 (en) * 2009-07-01 2018-02-13 Comcast Interactive Media, Llc Generating topic-specific language models
JP5635247B2 (en) * 2009-08-20 2014-12-03 富士通株式会社 Multi-chip module
US8694505B2 (en) 2009-09-04 2014-04-08 Microsoft Corporation Table of contents for search query refinement
US8954893B2 (en) * 2009-11-06 2015-02-10 Hewlett-Packard Development Company, L.P. Visually representing a hierarchy of category nodes
US8650195B2 (en) * 2010-03-26 2014-02-11 Palle M Pedersen Region based information retrieval system
US8452765B2 (en) * 2010-04-23 2013-05-28 Eye Level Holdings, Llc System and method of controlling interactive communication services by responding to user query with relevant information from content specific database
GB2494598A (en) 2010-06-11 2013-03-13 Doat Media Ltd A system and methods thereof for enhancing a user's search experience
US10713312B2 (en) 2010-06-11 2020-07-14 Doat Media Ltd. System and method for context-launching of applications
US9069443B2 (en) 2010-06-11 2015-06-30 Doat Media Ltd. Method for dynamically displaying a personalized home screen on a user device
US8423555B2 (en) 2010-07-09 2013-04-16 Comcast Cable Communications, Llc Automatic segmentation of video
US9538493B2 (en) 2010-08-23 2017-01-03 Finetrak, Llc Locating a mobile station and applications therefor
US8838582B2 (en) 2011-02-08 2014-09-16 Apple Inc. Faceted search results
US9356849B2 (en) * 2011-02-16 2016-05-31 Hewlett Packard Enterprise Development Lp Population category hierarchies
US9858342B2 (en) 2011-03-28 2018-01-02 Doat Media Ltd. Method and system for searching for applications respective of a connectivity mode of a user device
US9235620B2 (en) 2012-08-14 2016-01-12 Amadeus S.A.S. Updating cached database query results
EP2541473A1 (en) 2011-06-27 2013-01-02 Amadeus S.A.S. Method and system for a pre-shopping reservation system with increased search efficiency
US20130073586A1 (en) * 2011-05-02 2013-03-21 Amadeus S.A.S. Database system using batch-oriented computation
US10467289B2 (en) 2011-08-02 2019-11-05 Comcast Cable Communications, Llc Segmentation of video according to narrative theme
US8843469B2 (en) 2011-08-04 2014-09-23 International Business Machines Corporation Faceted and selectable tabs within ephemeral search results
US8504561B2 (en) 2011-09-02 2013-08-06 Microsoft Corporation Using domain intent to provide more search results that correspond to a domain
US20130290324A1 (en) * 2012-04-26 2013-10-31 Amadeus S.A.S. Categorizing and ranking travel-related database query results
EP2657893A1 (en) * 2012-04-26 2013-10-30 Amadeus S.A.S. System and method of categorizing and ranking travel option search results
KR101916837B1 (en) * 2012-04-26 2019-01-24 아마데우스 에스.에이.에스. Database system using batch-oriented computation
US20140280042A1 (en) * 2013-03-13 2014-09-18 Sap Ag Query processing system including data classification
CN104462113B (en) * 2013-09-17 2018-10-23 腾讯科技(深圳)有限公司 Searching method, device and electronic equipment
US9443015B1 (en) * 2013-10-31 2016-09-13 Allscripts Software, Llc Automatic disambiguation assistance for similar items in a set
US10019520B1 (en) * 2013-12-13 2018-07-10 Joy Sargis Muske System and process for using artificial intelligence to provide context-relevant search engine results
US9275132B2 (en) 2014-05-12 2016-03-01 Diffeo, Inc. Entity-centric knowledge discovery
US9659106B2 (en) * 2014-06-19 2017-05-23 Go Daddy Operating Company, LLC Software application customized for target market
US9575961B2 (en) 2014-08-28 2017-02-21 Northern Light Group, Llc Systems and methods for analyzing document coverage
US11886477B2 (en) 2015-09-22 2024-01-30 Northern Light Group, Llc System and method for quote-based search summaries
US11544306B2 (en) 2015-09-22 2023-01-03 Northern Light Group, Llc System and method for concept-based search summaries
US10534783B1 (en) 2016-02-08 2020-01-14 Microstrategy Incorporated Enterprise search
US10224026B2 (en) * 2016-03-15 2019-03-05 Sony Corporation Electronic device, system, method and computer program
US11226946B2 (en) 2016-04-13 2022-01-18 Northern Light Group, Llc Systems and methods for automatically determining a performance index
WO2018070026A1 (en) * 2016-10-13 2018-04-19 楽天株式会社 Commodity information display system, commodity information display method, and program
US10839021B2 (en) 2017-06-06 2020-11-17 Salesforce.Com, Inc Knowledge operating system
JP7067109B2 (en) * 2018-02-20 2022-05-16 村田機械株式会社 Data management system
CN113157996B (en) * 2020-01-23 2022-09-16 久瓴(上海)智能科技有限公司 Document information processing method and device, computer equipment and readable storage medium

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05324726A (en) * 1992-05-25 1993-12-07 Fujitsu Ltd Document data classifying device and document classifying function constituting device
US5758257A (en) * 1994-11-29 1998-05-26 Herz; Frederick System and method for scheduling broadcast of and access to video programs and other data using customer profiles
US5721902A (en) * 1995-09-15 1998-02-24 Infonautics Corporation Restricted expansion of query terms using part of speech tagging
US5717914A (en) * 1995-09-15 1998-02-10 Infonautics Corporation Method for categorizing documents into subjects using relevance normalization for documents retrieved from an information retrieval system in response to a query
US5737734A (en) * 1995-09-15 1998-04-07 Infonautics Corporation Query word relevance adjustment in a search of an information retrieval system
US5659742A (en) * 1995-09-15 1997-08-19 Infonautics Corporation Method for storing multi-media information in an information retrieval system
US5640553A (en) * 1995-09-15 1997-06-17 Infonautics Corporation Relevance normalization for documents retrieved from an information retrieval system in response to a query
US5675788A (en) * 1995-09-15 1997-10-07 Infonautics Corp. Method and apparatus for generating a composite document on a selected topic from a plurality of information sources
US5742816A (en) * 1995-09-15 1998-04-21 Infonautics Corporation Method and apparatus for identifying textual documents and multi-mediafiles corresponding to a search topic

Also Published As

Publication number Publication date
CA2288745C (en) 2008-01-08
DE69839604D1 (en) 2008-07-24
AU736428B2 (en) 2001-07-26
JP2001522496A (en) 2001-11-13
US5924090A (en) 1999-07-13
CA2288745A1 (en) 1998-11-05
ES2306474T3 (en) 2008-11-01
WO1998049637A1 (en) 1998-11-05
JP2008097641A (en) 2008-04-24
JP2009238241A (en) 2009-10-15
EP0979470A1 (en) 2000-02-16
EP0979470B1 (en) 2008-06-11
AU7271798A (en) 1998-11-24

Similar Documents

Publication Publication Date Title
JP2008071372A (en) Method and device for searching data of database
US20220164401A1 (en) Systems and methods for dynamically creating hyperlinks associated with relevant multimedia content
US7702541B2 (en) Targeted e-commerce system
US7966337B2 (en) System and method for prioritizing websites during a webcrawling process
US8285724B2 (en) System and program for handling anchor text
USRE44794E1 (en) Method and apparatus for representing and navigating search results
CA2490451C (en) Dynamic content clustering
US20040220902A1 (en) System and method for generating refinement categories for a set of search results
US20020073079A1 (en) Method and apparatus for searching a database and providing relevance feedback
US20060129538A1 (en) Text search quality by exploiting organizational information
US7523109B2 (en) Dynamic grouping of content including captive data
US20020069203A1 (en) Internet information retrieval method and apparatus
Ali et al. An overview of Web search evaluation methods
Nicholson Bibliomining for automated collection development in a digital library setting: Using data mining to discover Web‐based scholarly research works
Jepsen et al. Characteristics of scientific Web publications: Preliminary data gathering and analysis
WO2000067161A2 (en) Method and apparatus for categorizing and retrieving network pages and sites
Liu et al. Visualizing document classification: A search aid for the digital library
KR20050070955A (en) Method of scientific information analysis and media that can record computer program thereof
Hall et al. Enabling the discovery of digital cultural heritage objects through wikipedia
EP1672544A2 (en) Improving text search quality by exploiting organizational information
Abdulmunim et al. Links Evaluation and Ranking Based on Semantic Metadata Analysis
Jia et al. Scientific referential metadata creation with information retrieval and labeled topic modeling
Van der Westhuizen The invisible web
Wang Evaluation of web search engines
Karwowski Search Tools for the Web

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080612

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080908

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080911

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20081111

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20081114

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090121

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20090409