JP2000090111A - Information retrieval agent device, and computer- readable recording medium recorded with program exhibiting function of information retrieval agent device - Google Patents

Information retrieval agent device, and computer- readable recording medium recorded with program exhibiting function of information retrieval agent device

Info

Publication number
JP2000090111A
JP2000090111A JP10260686A JP26068698A JP2000090111A JP 2000090111 A JP2000090111 A JP 2000090111A JP 10260686 A JP10260686 A JP 10260686A JP 26068698 A JP26068698 A JP 26068698A JP 2000090111 A JP2000090111 A JP 2000090111A
Authority
JP
Japan
Prior art keywords
data
search
unit
character string
display
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10260686A
Other languages
Japanese (ja)
Inventor
Ryuichi Shiomi
隆一 塩見
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP10260686A priority Critical patent/JP2000090111A/en
Publication of JP2000090111A publication Critical patent/JP2000090111A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To gather more necessary WWW(worldwide web) pages within a given time and a storage area. SOLUTION: A retrieval part 106 when receiving an instruction for retrieval from an input part 101 acquires the URL(uniform resource locator) of a retrieval starting point from a retrieval information storage part 103, acquires the corresponding HTML (hypertext markup language) text through a communication part 102 and analyzes it, and stores link destination URLs, anchor character strings, etc., in a hyperlink storage part 105. A character string is compared with key words stored in the retrieval information storage part 103 and an evaluated value of the degree of matching data specified by a link destination URL with the purpose of retrieval is calculated. The link destination URL having the largest evaluated value is extracted while a link destination URL having 'link', etc., in the character string, etc. The HTML text of the extracted URL is obtained and the retrieval is repeated up to a specific end condition. A display information generation part 107 rearranges character strings stored in a hyperlink storage part 105 according to specific selection standards by referring to a retrieval history and displays their list at a display part 109.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、他のドキュメント
へのリンクやハイパーリンクを定義するHTML(Hy
pertext Markup Language)テ
キストやXML(Extensible Markup
Language)テキストを検索する情報検索エー
ジェント装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an HTML (Hyper) for defining a link or a hyperlink to another document.
Pertext Markup Language (XML) or XML (Extensible Markup)
(Language) information retrieval agent device for searching text.

【0002】[0002]

【従来の技術】WWW(World Wide We
b)のページを閲覧するビューワーとして、マイクロソ
フト社の「インターネットエクスプローラ」やネットス
ケープ社の「ネットスケープナビゲーター」などがあ
る。これらのビューワーではURL(Uniform
Resouce Lacaters)を入力したり、W
WWページ中のハイパーリンクを指定することによって
必要なWWWページを表示させることができる。
2. Description of the Related Art WWW (World Wide Wed)
Viewers for browsing the page b) include "Internet Explorer" by Microsoft Corporation and "Netscape Navigator" by Netscape Corporation. These viewers use URLs (Uniform
Resource Lactors) or W
A required WWW page can be displayed by designating a hyperlink in the WWW page.

【0003】「インターネットエクスプローラ」や「ネ
ットスケープナビゲーター」を用いて、必要なWWWペ
ージを検索する場合、WWWページを取得する時間、ユ
ーザは待たなければならず、必要な情報をインタラクテ
ィブな操作で得るためには長い時間が必要である。
When searching for a required WWW page using "Internet Explorer" or "Netscape Navigator", the user has to wait for the time to acquire the WWW page, and to obtain necessary information by an interactive operation. Takes a long time.

【0004】そのため、AIソフト社の「Web Wh
acker」などのオートパイロットソフトを用いる
と、URLとWWWページの取得範囲を指定すると、指
定されたURLを起点としてハイパーリンクで指定され
たWWWページをまとめてダウンロードすることができ
る。
For this reason, AI Software's “Web Wh
When auto-pilot software such as “acker” is used, when a URL and a WWW page acquisition range are specified, WWW pages specified by hyperlinks can be downloaded collectively from the specified URL.

【0005】これによって、オートパイロットソフトで
はまとめてWWWページをダウンロードしてくれるの
で、ユーザーは長時間のインタラクティブな操作を回避
できる。しかし、余分なWWWページまでダウンロード
してしまうため、多大の記憶領域が必要である。また、
そのダウンロードに長い時間が必要である。また、ダウ
ンロードしたWWWページから必要なものを取り出す作
業も必要となる。
[0005] With this, the auto-pilot software downloads the WWW pages collectively, so that the user can avoid a long-time interactive operation. However, since an extra WWW page is downloaded, a large storage area is required. Also,
It takes a long time to download. In addition, it is necessary to extract necessary items from the downloaded WWW page.

【0006】そこで、できるだけ重要なWWWページだ
けを収集する方法が、情報処理学会研究会報告98−N
Lー124−12「分野を特定した自動収集によるWW
W情報検索」に紹介されている。
Therefore, a method of collecting only important WWW pages as much as possible is disclosed in IPSJ Technical Report 98-N.
L-124-12 "WW by field-specific automatic collection
W information search ".

【0007】図52は、この文献に記述されている重要
なWWWページを収集する動作を表すフローチャートで
ある。
FIG. 52 is a flowchart showing the operation of collecting important WWW pages described in this document.

【0008】最初に、未取得のWWWページのURLを
未取得URL集合Gとして、この集合Gに検索起点とな
るURLを登録する。また、このURLの評価値を高く
設定しておく(S5201)。次に、取得済みのWWW
ページのURLを取得済みURL集合Kとして、これを
空集合に初期化する(S5202)。集合Gから、最高
評価値のURLを1つ取り出す(S5203)。取り出
したURLの評価値が一定の値より小さければ検索を終
了する(S5204)。
First, a URL of an unacquired WWW page is set as an unacquired URL set G, and a URL serving as a search starting point is registered in this set G. Also, the evaluation value of the URL is set high (S5201). Next, the acquired WWW
The URL of the page is set as an acquired URL set K, and this is initialized to an empty set (S5202). One URL with the highest evaluation value is extracted from the set G (S5203). If the evaluation value of the extracted URL is smaller than a certain value, the search ends (S5204).

【0009】取り出したURLの評価値が一定の値より
大きければ、取り出したURLに対応するHTMLテキ
ストをネットワークを通じて取得する(S5205)。
取り出したURLを集合Gから削除し(S5206)、
集合Kに登録する(S5207)。取得したHTMLテ
キストを解析して、ハイパーリンク定義されているUR
Lを抽出する(S5208)。抽出したURLに対して
リンク重要度を式(1)を用いて計算する(S520
9)。
If the evaluation value of the extracted URL is larger than a predetermined value, an HTML text corresponding to the extracted URL is obtained through a network (S5205).
The extracted URL is deleted from the set G (S5206),
It is registered in the set K (S5207). Analyze the acquired HTML text and define the hyperlink defined UR
L is extracted (S5208). The link importance is calculated using the equation (1) for the extracted URL (S520).
9).

【0010】[0010]

【数1】 ここで、wは、検索する分野を特定するためのキーワー
ドを予め用意しておき、そのキーワードがHTMLテキ
スト中に出現する回数である。sはHTMLテキストの
大きさ(バイト数)である。tは、HTMLテキスト中
にハイパーリンク定義されているURLの数である。C
は適当な定数で、100が使用される。
(Equation 1) Here, w is the number of times that a keyword for specifying a field to be searched is prepared in advance and the keyword appears in the HTML text. s is the size (number of bytes) of the HTML text. t is the number of URLs defined as hyperlinks in the HTML text. C
Is an appropriate constant, and 100 is used.

【0011】次に、抽出したURLから1つを取り出し
(S5210)、URLが集合Kに含まれる場合は、な
にもしない(S5211)。URLが集合Kに含まれな
い場合は、URLが集合Gに含まれるか判定する(S5
212)。含まれない場合、そのURLを集合Gに登録
し、S5209で算出したリンク重要度をそのURLの
評価値とする(S5213)。含まれる場合は、集合G
に既に含まれているURLの評価値にS5209で算出
したリンク重要度を加える。これを抽出した全URLに
対して行う(S5210〜S5215)。抽出したUR
Lへの動作が終了すると、制御をS5203に移し、さ
らに動作を継続する。
Next, one is extracted from the extracted URLs (S5210), and if the URL is included in the set K, nothing is performed (S5211). If the URL is not included in the set K, it is determined whether the URL is included in the set G (S5).
212). If not included, the URL is registered in the set G, and the link importance calculated in S5209 is used as the evaluation value of the URL (S5213). If included, set G
The link importance calculated in S5209 is added to the URL evaluation value already included in the URL. This is performed for all the extracted URLs (S5210 to S5215). UR extracted
When the operation to L ends, the control is moved to S5203, and the operation is continued.

【0012】この手法では、検索する分野のより多くの
WWWページからリンクされるURLのHTMLテキス
トが、より必要なページであることを前提として検索を
行うようなしくみとなっている。
In this method, the search is performed on the assumption that the HTML text of the URL linked from more WWW pages in the field to be searched is a more necessary page.

【0013】[0013]

【発明が解決しようとする課題】ところが、上記文献に
示される重要なWWWページだけを収集する方法では、
リンク重要度の式(1)からわかる通り、1つのHTM
Lテキストにハイパーリンク定義されているすべてのU
RLには同じリンク重要度が適用される。よって、検索
初期段階では、すべてのURLを網羅的に検索し、ある
程度のHTMLテキストが収集された状態でないと、真
に重要度の高いWWWページが収集されるとは限らず、
検索したい分野から無関係のURLが検索されてしまう
可能性が高い。実際、上記文献では、5000個、30
000個のWWWページを収集して、その中から必要な
ページを取り出さなければならない。
However, in the method of collecting only important WWW pages shown in the above-mentioned documents,
As can be seen from equation (1) of link importance, one HTM
All U hyperlinks defined in L text
The same link importance applies to the RL. Therefore, in the initial stage of the search, all URLs are exhaustively searched, and unless a certain amount of HTML text is collected, a WWW page with a really high importance is not necessarily collected.
There is a high possibility that an unrelated URL will be searched from the field to be searched. In fact, in the above document, 5000, 30
000 WWW pages must be collected, and the necessary pages must be extracted from them.

【0014】本発明は、上記課題に鑑み、ユーザが望む
WWWページを少ない記憶領域を用いて、短時間に収集
でき、かつ、通信コストを節約できる情報検索エージェ
ント装置を提供することを目的とする。
The present invention has been made in view of the above problems, and has as its object to provide an information retrieval agent device capable of collecting a WWW page desired by a user in a short time by using a small storage area and reducing communication costs. .

【0015】更に、本発明の目的は、検索によって得ら
れたWWWページから更に検索を続行する場合に、同一
のWWWページを再検索する無駄を防止する情報検索エ
ージェント装置を提供することである。
It is a further object of the present invention to provide an information search agent apparatus for preventing the same WWW page from being re-searched when the search is continued from the WWW page obtained by the search.

【0016】[0016]

【課題を解決するための手段】上記課題を解決するため
本発明は、ネットワーク及びシステム上のアドレスで指
定されるデータを検索する情報検索エージェント装置で
あって、アドレスと検索開始の指示とを受けるか又はア
ドレスの通知を受けると、当該アドレスで指定されるデ
ータを取得するデータ取得手段と、取得された複数のデ
ータ要素からなるデータを記憶するデータ記憶手段と、
前記データ記憶手段に記憶されているデータを解析し、
データ要素に含まれる他のデータへのリンク先アドレス
と当該アドレスに関連する文字列とを抽出する抽出手段
と、抽出された文字列に基づいてリンク先アドレスで指
定されるデータの選択適性の評価値を計算する計算手段
と、評価テーブルに、文字列と、計算された評価値とを
リンク先アドレスごとに記載する評価テーブル記載手段
と、前記評価テーブルに記載された評価値が最高のリン
ク先アドレスを前記データ取得手段に通知するデータ取
得制御手段と、前記データ取得制御手段の処理を前記評
価テーブルの状況に応じて禁止する禁止手段と、前記評
価テーブルに記載された文字列を選択する選択手段と、
前記選択手段で選択された文字列を表示画面に一覧表示
させる一覧表示制御手段とを備えることとしている。
According to the present invention, there is provided an information retrieval agent apparatus for retrieving data specified by an address on a network and a system, wherein the information retrieval agent apparatus receives an address and an instruction to start retrieval. Or receiving the notification of the address, a data acquisition unit for acquiring data specified by the address, a data storage unit for storing data including the acquired plurality of data elements,
Analyzing the data stored in the data storage means,
Extraction means for extracting a link destination address to other data included in the data element and a character string related to the address, and evaluation of selectivity of data specified by the link destination address based on the extracted character string Calculation means for calculating a value; evaluation table writing means for writing a character string and a calculated evaluation value in the evaluation table for each link destination address; and a link destination having the highest evaluation value described in the evaluation table. Data acquisition control means for notifying an address to the data acquisition means, prohibition means for inhibiting the processing of the data acquisition control means according to the status of the evaluation table, and selection for selecting a character string described in the evaluation table Means,
A list display control means for displaying a list of the character strings selected by the selection means on a display screen.

【0017】[0017]

【発明の実施の形態】以下、本発明に係る情報検索エー
ジェント装置の実施の形態を、図面を参照しながら説明
する。 (実施の形態1) 1.1 構成 図1は、本発明に係る情報検索エージェント装置の実施
の形態1の構成図である。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of an information retrieval agent device according to the present invention will be described below with reference to the drawings. Embodiment 1 1.1 Configuration FIG. 1 is a configuration diagram of an information search agent device according to Embodiment 1 of the present invention.

【0018】この情報検索エージェント装置は、入力部
101と、通信部102と、検索情報記憶部103と、
関連語辞書104と、ハイパーリンク記憶部105と、
検索部106と、表示情報作成部107と、学習部10
8と、表示部109とを備えている。 1.1.1入力部101 入力部101は、キーボードやマウスなどによって構成
され、ユーザの指示を受け付ける。検索キーワードや検
索起点のURLを受け付けると、検索情報記憶部103
に記憶させる。 1.1.2 通信部102 通信部102は、通信検索部121と通信バッファ12
2とからなり、ネットワークとの通信を行う。
This information search agent device includes an input unit 101, a communication unit 102, a search information storage unit 103,
A related word dictionary 104, a hyperlink storage unit 105,
Search unit 106, display information creation unit 107, and learning unit 10
8 and a display unit 109. 1.1.1 Input Unit 101 The input unit 101 includes a keyboard, a mouse, and the like, and receives an instruction from a user. When the URL of the search keyword or the search starting point is received, the search information storage unit 103
To memorize. 1.1.2 Communication Unit 102 The communication unit 102 includes the communication search unit 121 and the communication buffer 12
2 and communicates with the network.

【0019】通信検索部121は、検索部106又は学
習部108から与えられたURLでネットワークを介し
てHTMLテキストやXMLテキスト、イメージデータ
などのリソースデータを取得する。
The communication search unit 121 acquires resource data such as HTML text, XML text, and image data via the network using the URL provided by the search unit 106 or the learning unit 108.

【0020】通信バッファ122は、磁気ディスクやメ
モリーなどによって構成され、通信検索部121で取得
されたリソースデータを記憶する。
The communication buffer 122 includes a magnetic disk, a memory, and the like, and stores the resource data obtained by the communication search unit 121.

【0021】図2は、URL「http://www.
a.ne.jp/abc/」が与えられ、通信検索部1
21で取得されたHTMLテキストの一例を示す図であ
る。
FIG. 2 shows the URL “http: // www.
a. ne. jp / abc / ", and the communication search unit 1
FIG. 3 is a diagram showing an example of an HTML text acquired at 21.

【0022】HTMLテキストの文法については「HT
ML入門 WWWページの作成と公開」(ローラ メリ
イ著 武舎広幸他訳 株式会社プレンティスホール)な
どに記載されている。ここでは、本実施の形態に関係す
る部分を簡単に説明する。記述211〜216は、ハイ
パーリンクを表す。記述216のハイパーリンクには画
像データへのリンクが含まれている。
For the grammar of the HTML text, see “HT
"Introduction to ML: Creation and Publication of WWW Pages" (Laura Merii, Translated by Takeshi Hiroyuki and others, Prentice Hall Co., Ltd.). Here, portions related to the present embodiment will be briefly described. Descriptions 211 to 216 represent hyperlinks. The hyperlink of the description 216 includes a link to image data.

【0023】図3は、リンクされる画像データの一例を
示す図である。
FIG. 3 is a diagram showing an example of linked image data.

【0024】図4は、図3の画像データと図2のHTM
LテキストからWebページが組み立てられて表示部1
09に表示されている状態をあらわす図である。
FIG. 4 shows the image data of FIG. 3 and the HTM of FIG.
Web page is assembled from L text and display unit 1
It is a figure showing the state displayed by 09.

【0025】図5を参照して、記述211、216のハ
イパーリンクについて説明する。記述211は典型的な
ハイパーリンクの記述方法である。「<A Href=
intro.htm>」501は、開始タグで、ハイパ
ーリンク記述の開始を表わし、「</A>」504は終
了タグで、ハイパーリンク記述の終了を表わす。開始タ
グ中の「intro.htm」502は、ハイパーリン
クのリンク先であるURLである。「自己紹介」503
はアンカー文字列で、表示部109には、図4に示す表
示401のように下線などで強調表示される。記述21
6は、アンカー文字列の代わりに画像データが用いられ
ている例である。「<A Href=http://w
ww.weather.com/>」505は開始タ
グ、「</A>」509は終了タグ、「http://
www.weather.com/」506は、リンク
先のURLである。「<IMG SRC=weathe
r.gif Alt=天気>」507は、表示する画像
データのリンク先を示すイメージタグである。「天気」
508は、画像データが表示できないテキスト専用ブラ
ウザが使用されたとき画像データに替えて表示されるA
LT属性文字列である。 1.1.3 検索情報記憶部103 検索情報記憶部103は、磁気ディスクやメモリーなど
によって構成され、検索や検索結果の表示に必要な情報
を記憶し、分野キーワード記憶部131と、トピックキ
ーワード記憶部132と、検索起点記憶部133と、学
習検索起点記憶部134と、検索履歴記憶部135とを
含む。 1.1.3.1 分野キーワード記憶部131 分野キーワード記憶部131は、ユーザによって入力部
101から入力された検索キーワードを記憶する。この
検索キーワードを分野キーワードと呼ぶことにする。図
6は、分野キーワード記憶部131に記憶されている分
野キーワードの一例を示す図である。「野球」601と
「タイカース」602の2つの分野キーワードを記憶し
ている。ここで2つの分野キーワードが記憶されている
が、本発明は、これに限定されるものではなく、分野キ
ーワード数は1でも、3でも実施可能である。 1.1.3.2 トピックキーワード記憶部132 トピックキーワード記憶部132は、学習部108によ
って獲得された検索キーワードとその重要度とを記憶し
ている。この検索キーワードをトピックキーワードと呼
ぶことにする。
Referring to FIG. 5, the hyperlinks of the descriptions 211 and 216 will be described. The description 211 is a typical hyperlink description method. "<A Href =
intro. “htm>” 501 is a start tag indicating the start of the hyperlink description, and “</A>” 504 is an end tag indicating the end of the hyperlink description. “Intro.htm” 502 in the start tag is a URL to which the hyperlink is linked. "Self-introduction" 503
Is an anchor character string, and is highlighted on the display unit 109 with an underline or the like as in a display 401 shown in FIG. Description 21
6 is an example in which image data is used instead of the anchor character string. "<A Href = http: // w
ww. weather. "com / >>" 505 is a start tag, "</A>" 509 is an end tag, and "http: // //
www. weather. com / ”506 is the URL of the link destination. "<IMG SRC = weather
r. “gif Alt = weather>” 507 is an image tag indicating a link destination of image data to be displayed. "weather"
Reference numeral 508 denotes A which is displayed instead of image data when a text-only browser that cannot display image data is used.
This is an LT attribute character string. 1.1.3 Search Information Storage Unit 103 The search information storage unit 103 is configured by a magnetic disk, a memory, or the like, stores information necessary for searching and displaying search results, and stores a field keyword storage unit 131 and a topic keyword storage. The storage unit 132 includes a unit 132, a search starting point storage unit 133, a learning search starting point storage unit 134, and a search history storage unit 135. 1.1.3.1 Field keyword storage unit 131 The field keyword storage unit 131 stores a search keyword input from the input unit 101 by the user. This search keyword is called a field keyword. FIG. 6 is a diagram illustrating an example of the field keyword stored in the field keyword storage unit 131. Two field keywords of “baseball” 601 and “Tykers” 602 are stored. Here, two field keywords are stored, but the present invention is not limited to this, and the number of field keywords may be one or three. 1.1.3.2 Topic Keyword Storage Unit 132 The topic keyword storage unit 132 stores the search keywords acquired by the learning unit 108 and their importance. This search keyword is called a topic keyword.

【0026】図7は、トピックキーワード記憶部132
に記憶されているトピックキーワードとその重要度との
一例を示す図である。トピックキーワード701〜70
8と対応する重要度をを示す数値711〜718とが記
載されている。ここでは、最大10個のトピックキーワ
ードを記憶できることとする。ただし、本発明はこれに
限定されるものではなくトピックキーワードの最大記憶
数は20や30でも実施可能である。 1.1.3.3 検索起点記憶部133 検索起点記憶部133は、ユーザによって入力部101
から入力された検索起点のURLを記憶する。
FIG. 7 shows a topic keyword storage unit 132
FIG. 5 is a diagram showing an example of topic keywords and their importance levels stored in the storage device. Topic keywords 701-70
8 and numerical values 711 to 718 indicating the corresponding importance are described. Here, it is assumed that a maximum of 10 topic keywords can be stored. However, the present invention is not limited to this, and the maximum number of topic keywords that can be stored is 20 or 30. 1.1.3.3 Search starting point storage unit 133 The search starting point storage unit 133 is operated by the user through the input unit 101.
The URL of the search start point input from is stored.

【0027】図8は、検索起点記憶部133に記憶され
ている検索起点の一例を示す図である。検索起点のUR
L「http://www.a.ne.jp/abc
/」801が記憶されている。ここで、検索起点は1つ
しか記憶していないが、本発明はこれに限定されるもの
ではない。2つ以上記憶しても実施可能である。 1.1.3.4 学習検索起点記憶部134 学習検索起点記憶部134は、学習部108によって獲
得された検索起点とその重要度とを記憶している。
FIG. 8 is a diagram showing an example of a search start point stored in the search start point storage unit 133. UR of search starting point
L "http://www.a.ne.jp/abc
/ ”801 is stored. Here, only one search starting point is stored, but the present invention is not limited to this. The present invention can be implemented even if two or more are stored. 1.1.3.4 Learning search starting point storage unit 134 The learning search starting point storage unit 134 stores the search starting point obtained by the learning unit 108 and its importance.

【0028】図9は、学習検索起点記憶部134に記憶
されている学習された検索起点とその重要度との一例を
示す図である。検索起点901、902とそれぞれに対
応する重要度911、912とが記載されている。ここ
では、最大5個の検索起点を記憶できることとする。た
だし、本発明はこれに限定されるものではなく検索起点
の最大記憶数は10や20でも実施可能である。 1.1.3.5 検索履歴記憶部135 検索履歴記憶部135は、学習部108によって学習さ
れた検索履歴を記憶する。1つの検索履歴は、URL、
表示回数および非連続表示回数の3つ組で構成される。
表示回数および非連続表示回数については、後で説明す
る。
FIG. 9 is a diagram showing an example of the learned search starting points stored in the learning search starting point storage unit 134 and their importance. Search starting points 901 and 902 and their corresponding degrees of importance 911 and 912 are described. Here, it is assumed that a maximum of five search starting points can be stored. However, the present invention is not limited to this, and the maximum storage number of the search starting point can be set to 10 or 20. 1.1.3.5 Search History Storage Unit 135 The search history storage unit 135 stores the search history learned by the learning unit 108. One search history is URL,
It is composed of three sets of the display count and the discontinuous display count.
The display count and the discontinuous display count will be described later.

【0029】図10は、検索履歴記憶部135に記憶さ
れている検索履歴の一例を示す図である。各検索履歴の
URL1001〜1007とそれぞれに対応する表示回
数1011〜1017、非連続表示回数1021〜10
27との組が記載されている。ここでは、最大10個の
検索履歴を記憶できることとする。ただし、本発明はこ
れに限定されるものではなく検索履歴の最大記憶数は2
0や30でも実施可能である。 1.1.4 関連語辞書104 関連語辞書104は、磁気ディスクなどによって構成さ
れ、関連語を記憶する。ここでの関連語とは、意味的に
同じ単語、上位概念や下位概念の語、よく一緒に使用さ
れる語などである。関連語辞書104は、1つの単語に
対して関連する関連語を参照できる構成となっており、
各関連語には関連度が対応付けられて記載されている。
FIG. 10 is a diagram showing an example of the search history stored in the search history storage unit 135. URLs 1001 to 1007 of the respective search histories and the corresponding display times 1011 to 1017 and the number of discontinuous display times 1021 to 10
27 is described. Here, it is assumed that a maximum of 10 search histories can be stored. However, the present invention is not limited to this.
It can be implemented with 0 or 30. 1.1.4 Related Word Dictionary 104 The related word dictionary 104 is configured by a magnetic disk or the like, and stores related words. Here, the related words are words having the same meaning, words having a higher concept or a lower concept, words often used together, and the like. The related word dictionary 104 is configured to refer to related words related to one word.
Each related word is described in association with the degree of relevance.

【0030】図11は、関連語辞書104の一例を示す
図である。関連語辞書104は見出し語欄1101と、
見出し語に対する関連語とその関連語の関連度とが記載
された関連語欄1102とからなる。見出し語「野球」
1110には、関連度「5」1112の関連語「ホーム
ラン」1111と関連度「2」1114の関連語「ヒッ
ト」1113との2語が記載されている。ここで関連度
は、見出し語と関連語との関連の強さを表わし、数値が
大きいほど関連が強いことを表わす。 1.1.5 ハイパーリンク記憶部105 ハイパーリンク記憶部105は、RAMなどによって構
成され、ハイパーリンクテーブルを記憶する。ハイパー
リンクテーブルには、検索部106によって抽出された
ハイパーリンクとその付随する情報や、表示情報作成部
107の計算結果などが記載されている。図12は、ハ
イパーリンク記憶部105に記憶されているハイパーリ
ンクテーブルの一例を示す図である。
FIG. 11 is a diagram showing an example of the related word dictionary 104. The related word dictionary 104 includes a headword column 1101,
A related word column 1102 contains a related word for the headword and the degree of relevance of the related word. Headword "baseball"
1110 describes two words, a related word “home run” 1111 with a related degree “5” 1112 and a related word “hit” 1113 with a related degree “2” 1114. Here, the degree of association indicates the strength of the association between the headword and the related word, and the larger the numerical value, the stronger the association. 1.1.5 Hyperlink Storage Unit 105 The hyperlink storage unit 105 is configured by a RAM or the like, and stores a hyperlink table. The hyperlink table describes the hyperlink extracted by the search unit 106 and its accompanying information, the calculation result of the display information creation unit 107, and the like. FIG. 12 is a diagram illustrating an example of the hyperlink table stored in the hyperlink storage unit 105.

【0031】ハイパーリンクテーブル1200は、UR
L欄1201と、取得フラグ欄1202と、リンク集フ
ラグ欄1203と、抽出元番号欄1204と、アンカー
文字列欄1205と、説明文字列欄1206と、ALT
属性文字列欄1207と、ページスコア欄1208と、
リンクスコア欄1209と、表示スコア欄1210とを
含んでいる。各欄1201〜1209には、検索部10
6によって抽出されるハイパーリンクごとに対応したハ
イパーリンクに関する情報が記載され、表示スコア欄1
210には、表示情報作成部107で計算された表示ス
コアが記載される。
The hyperlink table 1200 has a UR
L column 1201, acquisition flag column 1202, link collection flag column 1203, extraction source number column 1204, anchor character string column 1205, explanatory character string column 1206, ALT
An attribute character string column 1207, a page score column 1208,
A link score column 1209 and a display score column 1210 are included. Each column 1201 to 1209 includes a search unit 10
6, information about the hyperlink corresponding to each hyperlink extracted is described, and the display score column 1
In 210, the display score calculated by the display information creation unit 107 is described.

【0032】URL欄1201には、検索開始時に第
「0」行から検索起点記憶部133または学習検索起点
記憶部134が記憶する検索起点のURLが記憶され、
それ以降の行には、検索部106で抽出されたハイパー
リンクのリンク先のURLが記載される。
The URL column 1201 stores the URL of the search starting point stored in the search starting point storage unit 133 or the learning search starting point storage unit 134 from the “0” line at the start of the search.
Subsequent lines describe the URL of the link destination of the hyperlink extracted by the search unit 106.

【0033】取得フラグ欄1202には、取得フラグが
記載される。取得フラグには、URL欄1201に記載
されたURLに対応するHTMLテキストがネットワー
クから取得されていないときに「F」、取得されている
ときに「D」、これから取得することが決定されたとき
に「T」の値がそれぞれ記載される。
The acquisition flag column 1202 describes an acquisition flag. The acquisition flag includes “F” when the HTML text corresponding to the URL described in the URL column 1201 has not been acquired from the network, “D” when the HTML text has been acquired, and when it has been determined that the HTML text will be acquired from now. , The value of “T” is described.

【0034】リンク集フラグ欄1203には、リンク集
フラグが記載される。リンク集とは、ある基準に沿って
多くのWebページへのハイパーリンクを記述したWe
bページのことである。URL欄1201に記載のUR
Lで特定されるWebページがリンク集と予測できると
きに「T」、予測できないときに「F」の値が記載され
る。
The link collection flag column 1203 describes a link collection flag. A link collection is a Web that describes hyperlinks to many Web pages according to a certain standard.
It is page b. UR described in URL column 1201
The value of “T” is described when the Web page specified by L can be predicted as a link collection, and the value of “F” is described when the Web page cannot be predicted.

【0035】抽出元番号1204には、ハイパーリンク
の抽出元HTMLテキストを示す抽出元番号が記載され
る。ハイパーリンクはハイパーリンクテーブル1200
に登録(記載)されたURLに対応するHTMLテキス
トから抽出される。よって、その抽出元URLが登録さ
れているハイパーリンクテーブル1200の行番号を抽
出元番号として記載する。例えば、URL「http:
//www.a.ne.jp/abc/」に対応するH
TMLテキストを抽出元URLとする抽出元番号は
「0」となる。ただし、検索開始時には、ハイパーリン
クテーブル1200には検索起点記憶部133に記憶さ
れているURLが登録される。この際、抽出元番号に
「−1」の値を記載する。
The extraction source number 1204 describes the extraction source number indicating the HTML text of the extraction source of the hyperlink. Hyperlink is hyperlink table 1200
Is extracted from the HTML text corresponding to the URL registered (described) in. Therefore, the line number of the hyperlink table 1200 in which the extraction source URL is registered is described as the extraction source number. For example, the URL "http:
// www. a. ne. jp / abc / ”
The extraction source number that sets the TML text as the extraction source URL is “0”. However, at the start of the search, the URL stored in the search start point storage unit 133 is registered in the hyperlink table 1200. At this time, a value of “−1” is described in the extraction source number.

【0036】なお、行番号は、ハイパーリンクテーブル
1200のURL欄1201の各URLの左側に示して
いる。
The line number is shown on the left side of each URL in the URL column 1201 of the hyperlink table 1200.

【0037】アンカー文字列欄1205には、ハイパー
リンクのアンカー文字列が記載される。
An anchor character string column 1205 describes an anchor character string of a hyperlink.

【0038】説明文字列欄1206には、ハイパーリン
クの説明文字列が記載される。説明文字列は、ハイパー
リンクの抽出元がリンク集のときだけ抽出されるハイパ
ーリンクの後に記述される文字列である。説明文字列の
終端は、次のハイパーリンクの先頭、HTMLテキスト
の終端、あるいは一定の文字列長さを超えたときのいず
れかとされる。説明文字列は、HTMLタグを含まな
い。
An explanation character string column 1206 describes an explanation character string of the hyperlink. The description character string is a character string described after the hyperlink extracted only when the extraction source of the hyperlink is a link collection. The end of the description character string is any one of the head of the next hyperlink, the end of the HTML text, and when the character string length exceeds a certain length. The description character string does not include an HTML tag.

【0039】ALT属性文字列欄1207には、ALT
属性文字列が記載される。ハイパーリンク中にイメージ
タグが記述され、その中にALT属性文字列が記述され
ていれば、この項目に記載される。
The ALT attribute character string column 1207 contains ALT
Describes the attribute character string. If an image tag is described in the hyperlink and an ALT attribute character string is described in the image tag, the description is described in this item.

【0040】ページスコア欄1208には、ページスコ
アが記載される。ページスコアは、検索部106によっ
てURLに対応するHTMLテキストがネットワークを
介して取得されたときに計算される。HTMLテキスト
中に出現した分野キーワード、トピックキーワード、関
連語の出現回数とHTMLテキストのファイルサイズと
から計算され、そのHTMLテキストの検索目的合致度
を表わす。詳細は後述する。
The page score column 1208 describes a page score. The page score is calculated when the search unit 106 acquires the HTML text corresponding to the URL via the network. It is calculated from the number of appearances of the field keywords, topic keywords, and related words that have appeared in the HTML text and the file size of the HTML text, and indicates the search purpose matching degree of the HTML text. Details will be described later.

【0041】リンクスコア欄1209には、リンクスコ
アが記載される。リンクスコアは、検索部106によっ
てハイパーリンク中のアンカー文字列、説明文字列に出
現した検索キーワード、トピックキーワード、関連語の
出現回数から計算され、ハイパーリンクのリンク先のH
TMLテキストの検索目的合致度の予測値を表わす。
The link score column 1209 describes a link score. The link score is calculated by the search unit 106 from the number of appearances of the search keyword, topic keyword, and related word appearing in the anchor character string and the description character string in the hyperlink.
It represents the predicted value of the matching degree of the search purpose of the TML text.

【0042】表示スコア欄1210には、表示スコアが
記載される。表示スコアは、表示情報作成部107によ
って計算される。 1.1.6 検索部106 検索部106は、入力部101からのユーザの指示によ
り起動され、検索情報記憶部103に記憶されている情
報に基づいて検索を行う。サブモジュールとして、検索
制御部161と、検索初期化部162と、HTMLテキ
スト取得部163と、HTMLテキスト評価部164
と、ハイパーリンク抽出部165と、ハイパーリンク評
価部166と、検索終了判定部167と、ハイパーリン
ク選択部168とを有する。 1.1.6.1 検索制御部161 検索制御部161は、検索処理全体の制御を行う。検索
処理には、 (1)初期化処理 (2)HTML取得処理 (3)HTMLテキスト評価処理 (4)ハイパーリンク抽出処理 (5)ハイパーリンク評価処理 (6)終了判定 (7)ハイパーリンク選択処理 とを含み、(2)から(7)が繰り返し実行される。終
了判定で、終了が判定されると検索は終了する。 1.1.6.2 検索初期化部162 検索初期化部162は、初期化処理を以下の手順で行
う。 (1)ハイパーリンク記憶部105に記憶されているハ
イパーリンクテーブルをクリアーする。 (2)学習検索起点記憶部134に記憶されている検索
起点のURLをハイパーリンクテーブル1200のUR
L欄1201の第「0」行から登録する。学習検索起点
記憶部134に検索起点が記憶されていなければ、検索
起点記憶部133に記憶されている検索起点のURLを
登録する。 (3)取得フラグ欄1202には「T」を、リンク集フ
ラグ欄1203には「F」をそれぞれセットする。 (4)抽出元番号欄1204には、学習検索起点記憶部
134または検索起点記憶部133からURLが複写さ
れたことを表わす「−1」をセットする。
The display score column 1210 describes a display score. The display score is calculated by the display information creation unit 107. 1.1.6 Search Unit 106 The search unit 106 is activated by a user's instruction from the input unit 101, and performs a search based on information stored in the search information storage unit 103. As sub-modules, a search control unit 161, a search initialization unit 162, an HTML text acquisition unit 163, and an HTML text evaluation unit 164
, A hyperlink extraction unit 165, a hyperlink evaluation unit 166, a search end determination unit 167, and a hyperlink selection unit 168. 1.1.6.1 Search control unit 161 The search control unit 161 controls the entire search process. The search processing includes (1) initialization processing (2) HTML acquisition processing (3) HTML text evaluation processing (4) hyperlink extraction processing (5) hyperlink evaluation processing (6) termination determination (7) hyperlink selection processing And (2) to (7) are repeatedly executed. When the end is determined in the end determination, the search ends. 1.1.6.2 Search Initialization Unit 162 The search initialization unit 162 performs an initialization process in the following procedure. (1) Clear the hyperlink table stored in the hyperlink storage unit 105. (2) The URL of the search start point stored in the learning search start point storage unit 134 is stored in the UR of the hyperlink table 1200.
The registration is performed from the “0” line in the L column 1201. If the search start point is not stored in the learning search start point storage unit 134, the URL of the search start point stored in the search start point storage unit 133 is registered. (3) “T” is set in the acquisition flag column 1202, and “F” is set in the link collection flag column 1203. (4) In the extraction source number column 1204, “−1” indicating that the URL has been copied from the learning search starting point storage unit 134 or the search starting point storage unit 133 is set.

【0043】検索起点記憶部133に図8に示す検索起
点のURL801が記憶され、学習検索起点記憶部13
4に検索起点が記憶されていないとき、検索初期化部1
62は、図12に示したようにハイパーリンクテーブル
1200のURL欄1201、取得フラグ欄1202、
抽出元番号欄1203の各値を第「0」行に登録する。 1.1.6.3 HTMLテキスト取得部163 HTMLテキスト取得部163は、以下のHTML取得
処理を行う。 (1)ハイパーリンクテーブル1200から、取得フラ
グ欄1202に「T」が記載されたURL欄1201に
記載されたURLを抽出する。 (2)通信検索部121に抽出したURLを引き渡す。 (3)通信検索部121が引き渡されたURLに対応す
るHTMLテキストをネットワークを介して取得し、通
信バッファ122がそのHTMLテキストを記憶する
と、取得フラグ欄1202に「D」をセットする。
The search start point storage unit 133 stores the search start point URL 801 shown in FIG.
4 does not store the search start point, the search initialization unit 1
Reference numeral 62 denotes a URL column 1201, an acquisition flag column 1202, and a URL column 1202 of the hyperlink table 1200 as shown in FIG.
Each value of the extraction source number column 1203 is registered in the “0” line. 1.1.6.3 HTML Text Acquisition Unit 163 The HTML text acquisition unit 163 performs the following HTML acquisition processing. (1) The URL described in the URL column 1201 in which “T” is described in the acquisition flag column 1202 is extracted from the hyperlink table 1200. (2) The extracted URL is delivered to the communication search unit 121. (3) When the communication search unit 121 acquires the HTML text corresponding to the delivered URL via the network and the communication buffer 122 stores the HTML text, “D” is set in the acquisition flag column 1202.

【0044】図12に示すようなハイパーリンクテーブ
ル1200がハイパーリンク記憶部105に記憶されて
いるとき、URL「http://www.a.ne.
jp/abc/」に対応するHTMLテキストが取得さ
れ、図13に示すようなハイパーリンクテーブル130
0に更新される。また、図17に示すハイパーリンクテ
ーブル1700の状態のとき、URL「http://
www.a.ne.jp/abc/baseball.
htm」に対応するHTMLテキストが取得され、図1
8に示すようなハイパーリンクテーブル1800に更新
される。さらに、図23に示すハイパーリンクテーブル
2300の状態のとき、URL「http://ww
w.a.ne.jp/abc/link.htm」に対
応するHTMLテキストが取得され、図24に示すよう
なハイパーリンクテーブル2400に更新される。 1.1.6.4 HTMLテキスト評価部164 HTMLテキスト評価部164は、以下の手順で取得し
たHTMLテキストのページスコアを計算し、ページス
コア欄1208に登録する。 (1)HTMLテキスト中に分野キーワード記憶部13
1に記憶されている分野キーワードの出現する回数を計
数する。 (2)HTMLテキスト中にトピックキーワード記憶部
132に記憶されているトピックキーワードの出現する
回数を計数する。 (3)HTMLテキスト中に分野キーワード記憶部13
1に記憶されている分野キーワードの関連語の出現する
回数とその関連語との関連度の積和を算出する。たとえ
ば、関連度「2」の関連語が3回、関連度「3」の関連
語が1回出現すれば、3*2+1*3=9が算出され
る。 (4)HTMLテキストからHTMLタグを取り除いた
ファイルサイズを算出する。 (5)ページスコアは式(2)で計算する。
When the hyperlink table 1200 as shown in FIG. 12 is stored in the hyperlink storage unit 105, the URL “http://www.a.ne.
jp / abc / ”is obtained, and the hyperlink table 130 as shown in FIG.
Updated to 0. In the state of the hyperlink table 1700 shown in FIG. 17, the URL “http: //
www. a. ne. jp / abc / baseball.
HTML corresponding to ".htm" is obtained, and FIG.
8 is updated to the hyperlink table 1800 as shown in FIG. Further, in the state of the hyperlink table 2300 shown in FIG. 23, the URL "http: // www"
w. a. ne. jp / abc / link. The HTML text corresponding to “htm” is acquired and updated to the hyperlink table 2400 as shown in FIG. 1.1.6.4 HTML Text Evaluator 164 The HTML text evaluator 164 calculates the page score of the HTML text acquired in the following procedure and registers it in the page score column 1208. (1) Field keyword storage unit 13 in HTML text
The number of occurrences of the field keyword stored in 1 is counted. (2) Count the number of occurrences of the topic keywords stored in the topic keyword storage unit 132 in the HTML text. (3) Field keyword storage unit 13 in HTML text
The product sum of the number of occurrences of the related word of the field keyword stored in 1 and the degree of association with the related word is calculated. For example, if the related word having the related degree “2” appears three times and the related word having the related degree “3” appears once, 3 * 2 + 1 * 3 = 9 is calculated. (4) Calculate the file size by removing the HTML tag from the HTML text. (5) The page score is calculated by equation (2).

【0045】[0045]

【数2】 ここで、図2に示すHTMLテキスト201が取得さ
れ、分野キーワード記憶部131に図6に示す分野キー
ワードが記憶され、トピックキーワード部132に図7
に示すトピックキーワードとその重要度とが記憶され、
関連語辞書104に図11に示す見出し語と関連語とが
記憶されている場合、ページスコアは以下のように計算
される。
(Equation 2) Here, the HTML text 201 shown in FIG. 2 is obtained, the field keywords shown in FIG. 6 are stored in the field keyword storage unit 131, and the topic keywords shown in FIG.
The topic keywords and their importance shown in
When the headword and the related word shown in FIG. 11 are stored in the related word dictionary 104, the page score is calculated as follows.

【0046】図2と図6とから、HTMLテキスト20
1には、分野キーワード「野球」1110が1回出現し
ており、分野キーワード出現回数「1」が計数される。
From FIG. 2 and FIG. 6, the HTML text 20
In 1, the field keyword “baseball” 1110 appears once, and the field keyword appearance frequency “1” is counted.

【0047】図2と図7とから、HTMLテキスト20
1には、トピックキーワードが出現しておらず、トピッ
クキーワード出現回数「0」が計数される。
From FIG. 2 and FIG. 7, the HTML text 20
In 1, the topic keyword has not appeared, and the number of appearances of the topic keyword “0” is counted.

【0048】図2と図6と図11とから、HTMLテキ
スト201には、関連語が出現しておらず、関連語の出
現回数と関連度の積和「0」が抽出される。
From FIG. 2, FIG. 6, and FIG. 11, no related word appears in the HTML text 201, and the product sum “0” of the number of appearances of the related word and the degree of relevance is extracted.

【0049】HTMLテキスト201からHTMLタグ
を取り除いたファイルサイズが200バイトであると、
ページスコアは式(2)により、(1*10+0*5+
0)/200=0.05と計算される。図14は、ペー
ジスコア「0.05」が登録されたハイパーリンクテー
ブル1400の状態を表わす。
If the file size obtained by removing the HTML tag from the HTML text 201 is 200 bytes,
The page score is calculated by the equation (2) as (1 * 10 + 0 * 5 +
0) /200=0.05 is calculated. FIG. 14 shows a state of the hyperlink table 1400 in which the page score “0.05” is registered.

【0050】また、図19に示すHTMLテキスト19
01が取得された時には、以下のようにページスコアが
計算される。分野キーワード「野球」601が1回出現
することが計数され、トピックキーワード「半神」70
1、「シャイアンツ」702、「カーフ」703、「ヤ
グルト」704、「ヘイスターズ」705が各1回、合
計5回出現することが計数される。HTMLテキスト1
901のファイルサイズが105バイトとすると、(1
*10+5*5)/105=0.33と計算され、図2
0に示すようにページスコア「0.33」が登録され
る。
The HTML text 19 shown in FIG.
When 01 is obtained, the page score is calculated as follows. It is counted that the field keyword “baseball” 601 appears once, and the topic keyword “hanjin” 70
1. It is counted that "Shyants" 702, "Calf" 703, "Yagult" 704, and "Haystars" 705 appear once each, for a total of five times. HTML text 1
Assuming that the file size of the file 901 is 105 bytes, (1
* 10 + 5 * 5) /105=0.33.
A page score “0.33” is registered as shown in FIG.

【0051】また、図25に示すHTMLテキスト25
01が取得された時には、HTMLテキスト2501
に、分野キーワード「野球」601が2回、「半神」6
02が1回の合計3回出現していることが計数され、ト
ピックキーワード「タイカース」701、「プロ」70
6が各1回の合計2回出現していることが計数され、関
連語「ホームラン」1111が1回出現していることが
計数される。関連語「ホームラン」1111の関連度は
「5」なので、積和は1*5=5が計算される。ファイ
ルサイズが400バイトとすると(3*10+2*5+
5)/400=0.11が計算され、図26に示すよう
にページスコア「0.11」が登録される。 1.1.6.5 ハイパーリンク抽出部165 ハイパーリンク抽出部165は、以下のハイパーリンク
の抽出処理を行う。 (1)通信バッファ122に記憶された(取得された)
HTMテキストからハイパーリンクを抽出する。ハイパ
ーリンクのURLとハイパーリンク記憶部105に記憶
されているハイパーリンクテーブルのURL欄1201
に記載のURLとを比較し、一致するものがなければ以
下の処理を行う。 (2)ハイパーリンクテーブルのURL欄1201に抽
出したハイパーリンクのURLを記載する。 (3)取得フラグ1202に「F」を記載する。 (4)抽出元番号欄1205に抽出先の行番号をセット
する。 (6)アンカー文字列欄1205にアンカー文字列を記
載する。 (7)説明文字列欄1206に抽出元がリンク集なら説
明文字列を記載する。 (8)ALT属性文字列欄1207にハイパーリンク中
にイメージタグがあり、ALT属性文字列があれば、A
LT属性文字列を記載する。
The HTML text 25 shown in FIG.
01 is obtained, the HTML text 2501
, The field keyword "baseball" 601 twice, "Hanjin" 6
02 appearing a total of three times is counted, and the topic keywords “Tykers” 701 and “Pro” 70
6 is counted twice each time, and it is counted that the related word “home run” 1111 appears once. Since the related degree of the related word “home run” 1111 is “5”, the product sum is calculated as 1 * 5 = 5. If the file size is 400 bytes (3 * 10 + 2 * 5 +
5) /400=0.11 is calculated, and a page score “0.11” is registered as shown in FIG. 1.1.6.5 Hyperlink Extraction Unit 165 The hyperlink extraction unit 165 performs the following hyperlink extraction processing. (1) Stored (obtained) in the communication buffer 122
Extract hyperlinks from HTM text. URL of hyperlink and URL column 1201 of hyperlink table stored in hyperlink storage section 105
And the following processing is performed if there is no match. (2) The URL of the extracted hyperlink is described in the URL field 1201 of the hyperlink table. (3) “F” is described in the acquisition flag 1202. (4) The extraction destination line number is set in the extraction source number column 1205. (6) The anchor character string is described in the anchor character string column 1205. (7) If the extraction source is a link collection, the description character string is described in the description character string column 1206. (8) If there is an image tag in the hyperlink in the ALT attribute character string column 1207 and there is an ALT attribute character string, A
Describe the LT attribute character string.

【0052】ハイパーリンク記憶部105に図14に示
すようなハイパーリンクテーブル1400が記憶されて
いる場合に取得したHTMLテキスト201が取得され
たとき、ハイパーリンクの抽出処理が終わると、図15
に示すようハイパーリンクテーブル1500になる。ハ
イパーリンク211〜216(図2)は第「1」行〜第
「6」行に登録されている。
When the hyperlink table 1400 as shown in FIG. 14 is stored in the hyperlink storage unit 105 and the obtained HTML text 201 is obtained, when the extraction of the hyperlink is completed, FIG.
The result is a hyperlink table 1500 as shown in FIG. The hyperlinks 211 to 216 (FIG. 2) are registered in the “1” to “6” rows.

【0053】また、図20に示すようハイパーリンクテ
ーブル2000が記憶されている場合に、図19に示す
HTMLテキスト1901が取得されているとき、ハイ
パーリンクの抽出処理が終わると、図21に示すような
ハイパーリンクテーブル2100になる。ハイパーリン
ク1902は第「7」行に登録されるが、ハイパーリン
ク1903は、URLがすでにハイパーリンクテーブル
2000の第「0」行に登録されているので登録されな
い。
When the hyperlink table 2000 is stored as shown in FIG. 20, and when the HTML text 1901 shown in FIG. 19 is obtained, the extraction of the hyperlink ends, as shown in FIG. It becomes a hyperlink table 2100. The hyperlink 1902 is registered in the “7” line, but the hyperlink 1903 is not registered because the URL is already registered in the “0” line of the hyperlink table 2000.

【0054】また、図26に示すようなハイパーリンク
テーブル2600が記憶されている場合に、図25に示
すHTMLテキスト2501が取得されたとき、ハイパ
ーリンクの抽出処理が終わると、図27に示すようなハ
イパーリンクテーブル2800になる。ハイパーリンク
抽出元の第「7」行のリンク集フラグが「T」なので、
登録された第「8」行〜第「12」行のハイパーリンク
には、説明文字列欄1205に説明文字列が抽出されて
いる。 1.1.6.6ハイパーリンク評価部166 ハイパーリンク評価部166は、ハイパーリンクの評価
処理を行う。評価処理は、リンク集フラグ欄1203の
フラグの設定とリンクスコア欄1209のリンクスコア
の計算とその計算値の設定とを行う。
When the hyperlink table 2600 as shown in FIG. 26 is stored and the HTML text 2501 shown in FIG. 25 is acquired, when the extraction of the hyperlink is completed, as shown in FIG. Is a hyperlink table 2800. Since the link collection flag of line "7" from which the hyperlink is extracted is "T",
In the registered hyperlinks of the “8” -th to “12” -th rows, the explanation character string is extracted in the explanation character string field 1205. 1.1.6.6 Hyperlink Evaluation Unit 166 The hyperlink evaluation unit 166 performs a hyperlink evaluation process. In the evaluation processing, setting of a flag in the link collection flag column 1203, calculation of a link score in the link score column 1209, and setting of the calculated value are performed.

【0055】リンク集フラグは、URL、アンカー文字
列、ALT属性文字列のいずれかに「リンク」もしくは
大文字小文字を同一視して「link」の文字が含まれ
ていたら、リンク集フラグ欄1203に「T」をセット
する。そうでなければ「F」をセットする。
The link collection flag is set in the link collection flag field 1203 if any one of the URL, the anchor character string, and the ALT attribute character string includes the characters “link” or uppercase and lowercase characters. Set "T". Otherwise, set "F".

【0056】リンクスコアは、以下の手順で計算する。 (1)アンカー文字列と説明文字列中とに分野キーワー
ド記憶部131に記憶されている分野キーワードが出現
する回数を計数する。 (2)アンカー文字列と説明文字列中とにトピックキー
ワード記憶部132に記憶されているトピックキーワー
ドが出現する回数を計数する。 (3)アンカー文字列と説明文字列中とに分野キーワー
ド記憶部131に記憶されている分野キーワードの関連
語が出現する回数を計数する。 (4)得られた計数結果から式(3)を用いてリンクス
コアを計算し、その値をリンクスコア欄1209に登録
する。
The link score is calculated according to the following procedure. (1) Count the number of times that the field keyword stored in the field keyword storage unit 131 appears in the anchor character string and the description character string. (2) Count the number of times a topic keyword stored in the topic keyword storage unit 132 appears in the anchor character string and the description character string. (3) Count the number of times a related word of the field keyword stored in the field keyword storage unit 131 appears in the anchor character string and the description character string. (4) A link score is calculated from the obtained counting result using Expression (3), and the calculated value is registered in the link score column 1209.

【0057】[0057]

【数3】 図15に示すハイパーリンクテーブル1500のとき、
ハイパーリンクの評価処理を行うと、図16のようにな
る。ハイパーリンク1500の第「2」行のアンカー文
字列には分野キーワード「野球」601が含まれている
のでリンクスコアは「10」となるが、他の第「1」
行、第「3」〜「6」行は「0」であるなお、このリン
クスコアは、リンク先のHTMLテキストの検索目的合
致度の予測値を計算するものであるので、第「0」行に
ついては、計算されない。
(Equation 3) In the case of the hyperlink table 1500 shown in FIG.
FIG. 16 shows the result of the hyperlink evaluation processing. Since the field keyword “baseball” 601 is included in the anchor character string of the “2” line of the hyperlink 1500, the link score is “10”, but the other “1” is
The link score is “0” in the rows “3” to “6”. Since the link score is used to calculate a predicted value of the search purpose matching degree of the HTML text of the link destination, the link score is “0”. Is not calculated.

【0058】また、図21に示すハイパーリンクテーブ
ル2100のとき、ハイパーリンクの評価処理を行う
と、図22のようになる。ここで、ハイパーリンクテー
ブル2200の第「7」行には、アンカー文字列に「リ
ンク」を含むのでリンク集フラグ欄1203に「T」が
設定される。
In the case of the hyperlink table 2100 shown in FIG. 21, when the hyperlink evaluation processing is performed, the result is as shown in FIG. Here, in the “7” row of the hyperlink table 2200, “T” is set in the link collection flag field 1203 because “link” is included in the anchor character string.

【0059】また、図27に示すハイパーリンクテーブ
ル2700のとき、ハイパーリンクの評価処理を行う
と、図28のようになる。 1.1.6.7 検索終了判定部167 検索終了判定部167は、検索部106の検索の繰り返
しの終了判定を行う。終了条件は、以下のようなものが
ある。 (1)一定個数以上のハイパーリンクを収集した。 (2)一定時間以上の検索を行った。 (3)一定値以上のリンクスコアを持つハイパーリンク
が一定個数以上集まった。 (4)ハイパーリンク選択部168で選択するハイパー
リンクがなくなった。
In the case of the hyperlink table 2700 shown in FIG. 27, when the hyperlink evaluation processing is performed, the result becomes as shown in FIG. 1.1.6.7 Search End Determination Unit 167 The search end determination unit 167 determines whether the search unit 106 has repeated the search. The termination condition is as follows. (1) At least a certain number of hyperlinks were collected. (2) A search was performed for a certain time or more. (3) A certain number or more of hyperlinks having a link score of a certain value or more are collected. (4) The hyperlink selected by the hyperlink selection unit 168 has disappeared.

【0060】以上のいずれかの又は組み合わされた終了
条件が満たされれば、検索終了判定部167は自動検索
部106の処理を終了し、表示情報作成部107を起動
する。ここでは、リンクスコアが1以上のハイパーリン
クが3以上収集できたとき終了とする。図16、図22
に示すハイパーリンクテーブル1600,2200では
終了と判定しないが、図28に示すハイパーリンクテー
ブル2800では終了と判定する。 1.1.6.8 ハイパーリンク選択部168 ハイパーリング選択部168は、以下の基準で、ハイパ
ーリンクテーブル中の取得フラグ欄1202のフラグが
「F」のハイパーリンクから1つを選択する。 (基準1)リンク集フラグが「T」で、抽出元のページ
スコアがもっとも高いハイパーリンク。 (基準2)基準1に該当するハイパーリンクがないと
き、抽出元のハイパーリンクのリンク集フラグが「T」
で、リンクスコアがもっとも高い外部サイトへのハイパ
ーリンク。
If any or a combination of the above-mentioned end conditions is satisfied, the search end determination unit 167 ends the processing of the automatic search unit 106 and activates the display information creation unit 107. Here, the process ends when three or more hyperlinks with a link score of 1 or more have been collected. 16 and FIG.
Are not determined in the hyperlink tables 1600 and 2200 shown in FIG. 28, but are determined to be ended in the hyperlink table 2800 shown in FIG. 1.1.6.8 Hyperlink Selection Unit 168 The hyperring selection unit 168 selects one of the hyperlinks whose flag in the acquisition flag column 1202 in the hyperlink table is “F” based on the following criteria. (Criterion 1) A hyperlink whose link collection flag is “T” and whose page score of the extraction source is the highest. (Criterion 2) When there is no hyperlink corresponding to the criterion 1, the link collection flag of the extraction source hyperlink is “T”.
A hyperlink to an external site with the highest link score.

【0061】なお、外部サイトか否かは注目しているハ
イパーリンクと抽出元番号で示される行とのURL欄1
201の「//」と「/」とに挟まれている絶対パスが異
なるとき外部サイトと判断する。 (基準3)基準1、2に該当するハイパーリンクがない
とき、リンクスコアがもっとも高いハイパーリンク。た
だし、リンクスコア「0」のハイパーリンクは選択しな
い。 (基準4)基準1、2、3に該当するハイパーリンクが
ないとき、抽出元のページスコアがもっとも高いハイパ
ーリンク。ただし、ページスコア「0」から抽出された
ハイパーリンクは選択しない。
It should be noted that whether or not the site is an external site is determined in the URL column 1 between the hyperlink of interest and the line indicated by the extraction source number.
When the absolute path sandwiched between “//” and “/” in 201 is different, it is determined to be an external site. (Criterion 3) When there is no hyperlink corresponding to the criterion 1 or 2, the hyperlink having the highest link score. However, the hyperlink with the link score “0” is not selected. (Criterion 4) When there is no hyperlink corresponding to the criteria 1, 2, or 3, the hyperlink having the highest page score of the extraction source. However, the hyperlink extracted from the page score “0” is not selected.

【0062】ハイパーリンク選択部168は選択したハ
イパーリンクの、取得フラグ欄1202に「T」をセッ
トする。
The hyperlink selector 168 sets “T” in the acquisition flag field 1202 of the selected hyperlink.

【0063】図16に示すハイパーリンクテーブル16
00のとき、基準3によって第「2」行のハイパーリン
クが選択され、図17に示すように取得フラグ欄120
2に「T」がセットされる。
The hyperlink table 16 shown in FIG.
At the time of 00, the hyperlink in the “2” th row is selected according to the criterion 3, and as shown in FIG.
"T" is set to 2.

【0064】図22に示すハイパーリンクテーブル22
00のとき、基準1によって第「7」行のハイパーリン
クが選択され、図23に示すように取得フラグ欄120
2に「T」がセットされる。 1.1.7 表示情報作成部107 表示情報作成部107は、サブモジュールとして、表示
スコア検索部171と検索履歴検索部172と表示バッ
ファ173とを有し、ハイパーリンクテーブルに登録さ
れているハイパーリンクの表示スコアを計算し、検索履
歴を検索して、表示回数が少なく表示スコアの高いもの
から順にハイパーリンクを並び替え、表示情報を作成す
る。 1.1.7.1 表示スコア計算部171 表示スコア計算部171は、検索部106で作成され、
ハイパーリンク記憶部105に記憶されているハイパー
リンクテーブルの表示スコア欄1201の各表示スコア
を以下の手順で計算する。 (1)ハイパーリンクの抽出元のリンク集フラグが
「T」のとき、表示スコア欄1210に「500」を設
定し、そうでなければ「0」を設定する。 (2)ハイパーリンクのリンクスコアが「0」のとき、
表示スコアに「0」を設定し、リンクスコアが「1」以
上なら、その値を表示スコアに加える。
The hyperlink table 22 shown in FIG.
At the time of 00, the hyperlink of the “7” th row is selected according to the criterion 1, and as shown in FIG.
"T" is set to 2. 1.1.7 Display Information Creation Unit 107 The display information creation unit 107 has, as submodules, a display score search unit 171, a search history search unit 172, and a display buffer 173, and the hyperlink registered in the hyperlink table. The display score of the link is calculated, the search history is searched, and the hyperlinks are rearranged in descending order of display frequency and display score to create display information. 1.1.7.1 Display score calculation unit 171 The display score calculation unit 171 is created by the search unit 106,
Each display score in the display score column 1201 of the hyperlink table stored in the hyperlink storage unit 105 is calculated according to the following procedure. (1) When the link collection flag from which the hyperlink is extracted is “T”, “500” is set in the display score column 1210; otherwise, “0” is set. (2) When the link score of the hyperlink is “0”,
The display score is set to “0”, and if the link score is “1” or more, the value is added to the display score.

【0065】図28に示すハイパーリンクテーブル28
00のとき、表示スコア計算部171によって、図29
に示すような、ハイパーリンクテーブル2900にな
る。
The hyperlink table 28 shown in FIG.
At the time of 00, the display score calculation unit 171 performs the processing shown in FIG.
A hyperlink table 2900 as shown in FIG.

【0066】なお、本実施の形態では、表示スコアに設
定する値を「500」または「0」としているけれど
も、この値は適宜修正可能である。 1.1.7.2 検索履歴検索部172 検索履歴検索部172は、以下の手順でハイパーリンク
テーブルから表示するハイパーリンクを抽出し、検索履
歴記憶部135を参照して、ユーザの興味があるであろ
う順にハイパーリンクを並べ替え、表示バッファ173
に表示情報を作成する。 (1)ハイパーリンクテーブルから表示スコアが1以上
のものを抽出して、URL、アンカー文字列、説明文字
列、表示スコアを表示バッファ173に表示情報として
記載する。 (2)抽出したハイパーリンクのURLで検索履歴記憶
部135を検索する。一致するURLが検索できたとき
は、対応する表示回数を表示バッファ173の表示情報
表に記載する。検索できなかったときは、表示回数
「0」を記載する。 (3)まず、表示回数で昇順に並べ替える。 (4)表示回数が同じハイパーリンクは、表示スコアで
降順に並びかえる。
In this embodiment, the value set for the display score is "500" or "0", but this value can be modified as appropriate. 1.1.7.2 Search history search unit 172 The search history search unit 172 extracts a hyperlink to be displayed from the hyperlink table in the following procedure, refers to the search history storage unit 135, and is interested in the user. Sort the hyperlinks in the order in which
Create display information. (1) The one having a display score of 1 or more is extracted from the hyperlink table, and the URL, the anchor character string, the description character string, and the display score are described in the display buffer 173 as display information. (2) Search the search history storage unit 135 with the URL of the extracted hyperlink. When a matching URL can be searched, the corresponding display count is described in the display information table of the display buffer 173. If the search was not successful, the number of display times "0" is described. (3) First, the images are sorted in ascending order by the number of times of display. (4) Hyperlinks with the same number of display times are rearranged in descending order by display score.

【0067】今、図29に示すようなハイパーリンクテ
ーブル2900がハイパーリンク記憶部105に記憶さ
れ、検索履歴記憶部135に図10に示す検索履歴が記
憶されているとき、検索履歴検索部172は、ハイパー
リンクテーブル2900から、第「2」、「8」、
「9」、「10」行のURL欄1201、アンカー文字
列欄1205、説明文字列欄1206、表示スコア欄1
210の各記載を抽出し、表示バッファ173の表示情
報表に記載する。図30は、このときの表示バッファ1
73の内容を示している。表示情報表3000は、UR
L欄3001、アンカー文字列欄3002、説明文字列
欄3003、表示スコア欄3004および表示回数欄3
005とを有している。このとき、まだ表示回数欄30
05への記載はない。
Now, when the hyperlink table 2900 as shown in FIG. 29 is stored in the hyperlink storage unit 105 and the search history shown in FIG. 10 is stored in the search history storage unit 135, the search history search unit 172 , From the hyperlink table 2900, the second “2”, “8”,
URL column 1201, anchor character string column 1205, explanatory character string column 1206, display score column 1 of lines "9" and "10"
Each description of 210 is extracted and described in the display information table of the display buffer 173. FIG. 30 shows the display buffer 1 at this time.
73 shows the contents. The display information table 3000 is UR
L column 3001, anchor character string column 3002, explanatory character string column 3003, display score column 3004, and display count column 3
005. At this time, the display count column 30
There is no description in 05.

【0068】次に、検索履歴検索部172は、検索履歴
記憶部135を検索し、表示回数を獲得する。図30に
示す表示情報表3000の第「0」行のURLは、検索
履歴記憶部135に一致するものがないので表示回数は
「0」に設定される。他は、検索履歴記憶部135に記
憶されている表示回数が記載される。
Next, the search history search section 172 searches the search history storage section 135 to obtain the number of display times. Since the URL in the “0” th row of the display information table 3000 shown in FIG. 30 does not match the URL in the search history storage unit 135, the display count is set to “0”. For others, the number of display times stored in the search history storage unit 135 is described.

【0069】この結果、図30に示した表示情報表30
00は、図31に示す表示回数欄3005に表示回数が
記載された表示情報表3100に更新される。
As a result, the display information table 30 shown in FIG.
00 is updated to the display information table 3100 in which the number of times of display is described in the number of times of display column 3005 shown in FIG.

【0070】最後に、表示回数と表示スコアで並べ替え
を行うと図32に示すような表示情報表3200にな
る。 1.1.7.3 表示バッファ173 表示バッファ173は、RAMなどで構成され、図30
〜図32に示したように表示のために使用するハイパー
リンクのアンカー文字列、説明文字列などの表示情報の
一覧である表示情報表を記憶する。 1.1.8 学習部108 学習部108は、サブモジュールとして学習制御部18
1と、学習バッファ182と、キーワード学習部183
と、検索起点学習部184と、検索履歴学習部185と
を有し、表示情報作成部107が表示情報を作成すると
起動される。 1.1.8.1 学習制御部 学習部108が起動されると、学習制御部181は、学
習バッファ182を初期化し、検索履歴の学習を行うた
め検索履歴学習部185を起動し、表示バッファ173
の内容を表示部109に表示させる。図33は、図32
に示した表示バッファ173の表示情報が表示部109
に表示された状態を表わす。表示部109は、一覧表示
領域3301、ブラウザ領域3302、メッセージ表示
領域3303、エージェント表示領域3304、○評価
ボタン3305、×評価ボタン3306及び終了ボタン
3307を有している。
Lastly, when rearranged by the number of display times and the display score, a display information table 3200 as shown in FIG. 32 is obtained. 1.1.7.3 Display Buffer 173 The display buffer 173 is composed of a RAM or the like.
32, a display information table which is a list of display information such as anchor character strings and explanation character strings of hyperlinks used for display is stored. 1.1.8 Learning Unit 108 The learning unit 108 includes the learning control unit 18 as a submodule.
1, a learning buffer 182, and a keyword learning unit 183.
, A search starting point learning unit 184, and a search history learning unit 185, which are activated when the display information creating unit 107 creates display information. 1.1.8.1 Learning Control Unit When the learning unit 108 is activated, the learning control unit 181 initializes the learning buffer 182, activates the search history learning unit 185 for learning the search history, and displays the display buffer. 173
Is displayed on the display unit 109. FIG.
The display information of the display buffer 173 shown in FIG.
Represents the state displayed on the screen. The display unit 109 has a list display area 3301, a browser area 3302, a message display area 3303, an agent display area 3304, an 評 価 evaluation button 3305, an x evaluation button 3306, and an end button 3307.

【0071】一覧表示領域3301には、表示情報表の
アンカー文字列欄3002に記載されたアンカー文字列
が一覧表示される。表示されたアンカー文字列はユーザ
により選択可能である。
In the list display area 3301, a list of anchor character strings described in the anchor character string column 3002 of the display information table is displayed. The displayed anchor character string can be selected by the user.

【0072】学習制御部181は、アンカー文字列が入
力部101のマウスを用いてクリックされると、アンカ
ー文字列を反転表示し、対応する説明文字列をメッセー
ジ表示領域3303に表示させる。併せて、エージェン
ト表示領域3304に表示されるエージェント画像をア
ンカー文字列に対応する表示スコアが高いほど検索結果
に自信のある表情に変化させる。図33では、「タイカ
ース党」3313がクリックされた状態を表わしてい
る。アンカー文字列がダブルクリックされると、対応す
るURLを通信部102に引き渡してWebページを取
得し、ブラウザ領域3302に表示させる。また、ダブ
ルクリックされたときは、その情報をキーワード学習部
183に通知する。
When the anchor character string is clicked using the mouse of the input unit 101, the learning control unit 181 reversely displays the anchor character string and displays the corresponding explanatory character string in the message display area 3303. At the same time, the agent image displayed in the agent display area 3304 is changed to a more confident expression in the search result as the display score corresponding to the anchor character string is higher. FIG. 33 shows a state where the “Tykers Party” 3313 is clicked. When the anchor character string is double-clicked, the corresponding URL is delivered to the communication unit 102 to acquire a Web page and display the Web page in the browser area 3302. When double-clicked, the information is notified to the keyword learning unit 183.

【0073】○評価ボタン3305と×評価ボタン33
06は、ユーザがブラウザ領域3302に表示されたW
ebページの善し悪し(ユーザの興味の有無)を以後の
HTMLテキスト取得とエージェント画像とに反映する
ためのものである。○評価ボタン3305がクリックさ
れると、エージェント表示領域3304に表示されたエ
ージェント画像が喜んでいる画像を表示し、対応するメ
ッセージをメッセージ表示領域3303に表示する。ま
た、○評価ボタン3305がクリックされたことをキー
ワード学習部183に通知する。×評価ボタン3306
がクリックされると、エージェント表示領域に表示され
たエージェント画像が謝っている画像を表示し、対応す
るメッセージをメッセージ表示領域3303に表示す
る。また、×評価ボタン3306がクリックされたこと
をキーワード学習部183に通知する。
○ Evaluation button 3305 and × Evaluation button 33
06 is the W displayed on the browser area 3302 by the user.
This is to reflect the quality of the web page (whether or not the user is interested) in the subsequent HTML text acquisition and the agent image. When the evaluation button 3305 is clicked, an image in which the agent image displayed in the agent display area 3304 is happy is displayed, and a corresponding message is displayed in the message display area 3303. Also, it notifies the keyword learning unit 183 that the ○ evaluation button 3305 has been clicked. × Evaluation button 3306
When is clicked, an image in which the agent image displayed in the agent display area apologizes is displayed, and a corresponding message is displayed in the message display area 3303. Also, it notifies the keyword learning unit 183 that the X evaluation button 3306 has been clicked.

【0074】終了ボタン3307がクリックされると、
検索結果の表示を終了し、キーワード学習部183を起
動し、検索起点の学習を行うため検索起点学習部184
を起動する。 1.1.8.2 学習バッファ182 学習バッファ182は、RAMなどで構成され、表示部
109に表示されたアンカー文字列がダブルクリックさ
れた回数および、○評価ボタン3305、×評価ボタン
3306がクリックされた回数を記録する。図34は学
習バッファ182が学習制御部181によって初期化さ
れた状態を表わす。図34の第「0」〜「3」行の各行
は、図33のアンカー文字列3311〜3314に対応
する。各欄3401〜3403には、ダブルクリックさ
れたた回数、○評価ボタン3405がクリックされた回
数、×評価ボタン3406がクリックされた回数がそれ
ぞれ記録される。 1.1.8.3 キーワード学習部183 キーワード学習部183は、学習制御部181から通知
されたアンカー文字列のダブルクリック、○評価ボタン
3405、×評価ボタン3406のクリックを学習バッ
ファ182に記録する。
When the end button 3307 is clicked,
The display of the search result is ended, the keyword learning unit 183 is activated, and the search starting point learning unit 184 is used to learn the search starting point.
Start 1.1.8.2 Learning Buffer 182 The learning buffer 182 is composed of a RAM or the like, and the number of times the anchor character string displayed on the display unit 109 is double-clicked, and the 評 価 evaluation button 3305 and the × evaluation button 3306 are clicked. Record the number of times performed. FIG. 34 shows a state in which the learning buffer 182 has been initialized by the learning control unit 181. 34 correspond to the anchor character strings 3311 to 314 in FIG. In each of the columns 3401 to 3403, the number of times of double-clicking, the number of times of ○ evaluation button 3405, and the number of times of × evaluation button 3406 are recorded, respectively. 1.1.8.3 Keyword Learning Unit 183 The keyword learning unit 183 records in the learning buffer 182 the double click of the anchor character string notified from the learning control unit 181 and the clicks of the o evaluation button 3405 and the x evaluation button 3406. .

【0075】例えば図33を参照して、アンカー文字列
「タイカース党」3313がダブルクリックされると、
学習バッファ182の対応する第「2」行のダブルクリ
ック欄3401の値を「1」増加させる。アンカー文字
列「タイカース党」3313に対応するWebページが
表示されているとき、○評価ボタン3305がクリック
されると、学習バッファ182の対応する第「2」行の
○評価ボタン欄3402の値を「1」増加させる。ま
た、×評価ボタン3306がクリックされると、学習バ
ッファ183の対応する第「2」行の×評価ボタン欄3
403の値を「1」増加させる。
For example, referring to FIG. 33, when the anchor character string “Tikers Party” 3313 is double-clicked,
The value of the double-click column 3401 in the corresponding “2” th row of the learning buffer 182 is increased by “1”. When a Web page corresponding to the anchor character string “Tykers Party” 3313 is displayed, when the ○ evaluation button 3305 is clicked, the value of the ○ evaluation button column 3402 of the corresponding “2” line in the learning buffer 182 is changed. Increase by "1". When the x-evaluation button 3306 is clicked, the x-evaluation button column 3 of the corresponding “2” line in the learning buffer 183 is clicked.
The value of 403 is increased by “1”.

【0076】図35は、ユーザの操作によって変化した
学習バッファ182の内容を表わす。
FIG. 35 shows the contents of the learning buffer 182 changed by the operation of the user.

【0077】終了ボタン3307がクリックされると、
以下の手順で、キーワード学習部183は、学習バッフ
ァ182と表示バッファ173とを参照して、トピック
キーワード記憶部132のトピックキーワードの追加お
よび更新をする。 (1)表示バッファ173のアンカー文字列と説明文字
列とからキーワード抽出を行う。キーワード抽出は形態
素解析や字種(漢字、カタカナ、仮名)による切り出し
などによって行う。 (2)抽出されたキーワードからトピックキーワード候
補を抽出する。以下の条件のいづれかを満たすものを候
補とする。 (条件1)○評価ボタンのクリック回数が1以上の表示
情報(アンカー文字列と説明文字列)から抽出されたキ
ーワード (条件2)ダブルクリック回数が1以上の複数の表示情
報から抽出されたキーワード (条件3)ダブルクリック回数が1以上の表示情報から
抽出さえたキーワードで、ダブルクリックされていない
表示情報から抽出されていないキーワード (3)×評価ボタンのクリック回数が1以上の表示情報
から抽出されたキーワードをトピックキーワード候補か
ら削除する。 (4)分野キーワードと一致するものをトピックキーワ
ード候補から削除する。 (5)残ったトピックキーワード候補にスコアを与え
る。スコアは、キーワードが抽出された表示情報の(ダ
ブルクリック回数+○評価ボタンクリック回数*5)で
与える。 (6)トピックキーワード候補のスコアの上位5つだけ
を残す。 (7)トピックキーワード記憶部132に記憶されてい
るトピックキーワードとトピックキーワード候補を比較
する。 (7−1)一致したときは、トピックキーワード記憶部
132に記憶されていトピックキーワードの重要度にト
ピックキーワード候補のスコアを加える。 (7−2)不一致のときは、トピックキーワード候補を
トピックキーワードとして登録する。トピックキーワー
ドの重要度には、トピックキーワード候補のスコアを用
いる。なお、トピックキーワード記憶部132に記憶す
る語数を超えるときは、重要度のもっとも低いトピック
キーワードから削除する。 (8)トピックキーワード記憶部132に記憶されてい
る、トピックキーワード候補とまったく一致しなかった
トピックキーワードの重要度から一定値を減じる。
When the end button 3307 is clicked,
In the following procedure, the keyword learning unit 183 refers to the learning buffer 182 and the display buffer 173, and adds and updates a topic keyword in the topic keyword storage unit 132. (1) A keyword is extracted from the anchor character string and the description character string in the display buffer 173. Keyword extraction is performed by morphological analysis or cutout by character type (kanji, katakana, kana). (2) Extract topic keyword candidates from the extracted keywords. A candidate that satisfies one of the following conditions is a candidate. (Condition 1) ○ Keywords extracted from display information (anchor character string and description character string) in which the number of clicks of the evaluation button is 1 or more (Condition 2) Keywords extracted from a plurality of display information in which the number of double clicks is 1 or more (Condition 3) A keyword extracted from display information having a double-click count of 1 or more and not extracted from display information that has not been double-clicked (3) × Extracted from display information having an evaluation button click count of 1 or more Deleted keywords from topic keyword candidates. (4) Delete a keyword that matches the field keyword from the topic keyword candidates. (5) A score is given to the remaining topic keyword candidates. The score is given by (the number of double clicks + the number of clicks of the evaluation button * 5) of the display information from which the keyword is extracted. (6) Only the top five scores of the topic keyword candidates are left. (7) The topic keywords stored in the topic keyword storage unit 132 are compared with topic keyword candidates. (7-1) When they match, the score of the topic keyword candidate is added to the importance of the topic keyword stored in the topic keyword storage unit 132. (7-2) If they do not match, the candidate topic keyword is registered as a topic keyword. The score of the topic keyword candidate is used as the importance of the topic keyword. If the number of words exceeds the number of words stored in the topic keyword storage unit 132, the topic keywords with the lowest importance are deleted. (8) A certain value is subtracted from the importance of the topic keyword that did not match the topic keyword candidate stored in the topic keyword storage unit 132 at all.

【0078】表示バッファ173が図32、学習バッフ
ァ182が図35、トピックキーワード記憶部132が
図7のとき、以下のように学習が行われる。
When the display buffer 173 is as shown in FIG. 32, the learning buffer 182 is as shown in FIG. 35, and the topic keyword storage section 132 is as shown in FIG. 7, learning is performed as follows.

【0079】まず、表示バッファ173のアンカー文字
列と説明文字列からキーワード抽出を行う。ここでは形
態素解析によって名詞をキーワードとして抽出する。な
お、名詞以外の形容詞や動詞をキーワードとして抽出し
てもよい。図36(a)は、抽出されたキーワードを示
す。
First, a keyword is extracted from the anchor character string and the description character string in the display buffer 173. Here, nouns are extracted as keywords by morphological analysis. Note that adjectives and verbs other than nouns may be extracted as keywords. FIG. 36A shows the extracted keywords.

【0080】抽出されたキーワードからトピックキーワ
ード候補を抽出する。以下の条件のいずれかを満たすも
のを候補とする。第「2」行のキーワードは条件1によ
りすべてトピックキーワード候補となる。また、キーワ
ード「野球」は条件2によりトピックキーワード候補と
なる。また、「コーナー」「プロ」「リンク」「球団」
「公式」が条件3によりトピックキーワード候補とな
る。図36(b)は、トピックキーワード候補を示す。
A topic keyword candidate is extracted from the extracted keywords. Those that satisfy any of the following conditions are considered as candidates. All keywords in the “2” th row are topic keyword candidates according to the condition 1. The keyword “baseball” is a topic keyword candidate according to the condition 2. In addition, "corner""pro""link""ballteam"
“Official” is a topic keyword candidate according to condition 3. FIG. 36B shows topic keyword candidates.

【0081】次に、×評価ボタンのクリック回数が1以
上の表示情報から抽出されたキーワード(第「1」行)
をトピックキーワード候補から削除する。図36(c)
は、残ったトピックキーワード候補を示す。
Next, a keyword extracted from display information in which the number of clicks of the × evaluation button is 1 or more (the “first” line)
Is removed from topic keyword candidates. FIG. 36 (c)
Indicates the remaining topic keyword candidates.

【0082】分野キーワードと一致するものをトピック
キーワード候補から削除する。ここでは「タイカース」
が削除され図36(d)の状態になる。
[0101] Those that match the field keyword are deleted from the topic keyword candidates. Here, "Tykers"
Is deleted, and the state shown in FIG.

【0083】残ったトピックキーワード候補にスコアを
与える。スコアは、図36(e)のように、すべて6に
なる。トピックキーワード候補のスコアの上位5つだけ
を残す。ここでは全部同じなので最初の5つを選び、図
36(f)になる。
A score is given to the remaining topic keyword candidates. The scores are all 6 as shown in FIG. Only the top five scores of topic keyword candidates are left. Here, since all are the same, the first five are selected, and FIG.

【0084】トピックキーワード記憶部132に記憶さ
れているトピックキーワードとトピックキーワード候補
を比較する。
The topic keywords stored in the topic keyword storage section 132 are compared with topic keyword candidates.

【0085】トピックキーワード候補「半神」はトピッ
クキーワード「半神」701に一致するので、トピック
キーワードの重要度「23」711にトピックキーワー
ド候補のスコア「6」を加え「29」となる。
Since the topic keyword candidate “Semigod” matches the topic keyword “Semigod” 701, the topic keyword candidate score “6” is added to the topic keyword importance “23” 711 to be “29”.

【0086】不一致のときは、トピックキーワード候補
をトピックキーワードとして登録する。トピックキーワ
ードの重要度には、トピックキーワード候補のスコアを
用いる。なお、トピックキーワード記憶部132に記憶
する語数(ここでは「10」)を越えるときは、重要度
のもっとも低いトピックキーワードを削除する。ここで
は、「2」つしか新規登録するバッファがないので、重
要度が低いトピックキーワード「ヤグルト」705と
「プロ」706が削除される。図37は、この時点での
トピックキーワード記憶部132の内容を表わす。
[0086] If they do not match, a topic keyword candidate is registered as a topic keyword. The score of the topic keyword candidate is used as the importance of the topic keyword. When the number of words (here, “10”) stored in the topic keyword storage unit 132 is exceeded, the topic keyword with the lowest importance is deleted. Here, since there are only two buffers to be newly registered, the topic keywords “yagurt” 705 and “pro” 706 with low importance are deleted. FIG. 37 shows the contents of the topic keyword storage unit 132 at this point.

【0087】最後に、トピックキーワード記憶部132
に記憶されているトピックキーワード候補とまったく一
致しなかったトピックキーワードの重要度から一定値
「1」を減じる。図38、この時点でのトピックキーワ
ード記憶部132の内容を表わす。 1.1.8.4 検索起点学習部184 検索起点学習部184は、以下の手順で検索起点の学習
を行う。 (1)検索起点学習部184は、ハイパーリンクテーブ
ルから以下の条件を満たすリンク集のURLを検索起点
候補として抽出する。 (条件1)リンクスコアが「1」以上のハイパーリンク
が抽出されたリンク集 (条件2)学習バッファ182を参照し、ユーザにダブ
ルクリックされ、×評価ボタンをクリックされていない
アンカー文字列が抽出されたリンク集 なお、ユーザにダブルクリックされ、かつ○評価ボタン
をクリックされたアンカー文字列に対応するページとし
てもよい。 (2)検索起点候補から検索起点記憶部133に記憶さ
れている検索起点と一致するものを削除する。 (3)検索起点候補のスコアとし、検索起点候補から抽
出されたリンクスコアが「1」以上のハイパーリンク数
を与える。 (4)検索起点候補と学習検索起点記憶部134に記憶
されている検索起点とを比較する。 (4−1)一致したときは、学習検索起点記憶部134
に記憶されている検索起点の重要度に検索起点候補のス
コアを加える。 (4−2)不一致のときは、検索起点候補を検索起点と
して学習検索起点記憶部134に登録する。検索起点の
重要度には、検索起点候補のスコアを用いる。なお、学
習検索起点記憶部134に記憶されているURLの数が
所定の値を越えるときは、重要度のもっとも低い検索起
点を削除する。 (5)学習検索起点記憶部134に記憶されている、検
索起点候補とまったく一致しなかった検索起点の重要度
から一定値を減じる。
Finally, the topic keyword storage section 132
Is subtracted from the importance of a topic keyword that did not match any of the topic keyword candidates stored in. FIG. 38 shows the contents of the topic keyword storage unit 132 at this time. 1.1.8.4 Search starting point learning unit 184 The search starting point learning unit 184 learns the search starting point in the following procedure. (1) The search starting point learning unit 184 extracts a URL of a link collection satisfying the following conditions from the hyperlink table as a search starting point candidate. (Condition 1) A link collection from which a hyperlink with a link score of "1" or more is extracted. (Condition 2) An anchor character string that is double-clicked by the user and not clicked on the x evaluation button is extracted with reference to the learning buffer 182. Linked link It is also possible to set a page corresponding to the anchor character string that has been double-clicked by the user and clicked the ○ evaluation button. (2) A candidate that matches the search start point stored in the search start point storage unit 133 is deleted from the search start point candidates. (3) The number of hyperlinks whose link score extracted from the search starting point candidate is “1” or more is set as the search starting point candidate score. (4) The search starting point candidate is compared with the search starting point stored in the learning search starting point storage unit 134. (4-1) When they match, the learning search starting point storage unit 134
Is added to the search start point importance stored in the search start point. (4-2) When there is no match, the search starting point candidate is registered in the learning search starting point storage unit 134 as a search starting point. As the importance of the search start point, the score of the search start point candidate is used. When the number of URLs stored in the learning search starting point storage unit 134 exceeds a predetermined value, the search starting point with the lowest importance is deleted. (5) A certain value is subtracted from the importance of the search starting point that did not match the search starting point candidate stored in the learning search starting point storage unit 134 at all.

【0088】ハイパーリンクテーブルが図28、学習バ
ッファ182が図35、学習検索起点記憶部134が図
9に示す内容のであるとき、以下のように学習する。
When the hyperlink table has the contents shown in FIG. 28, the learning buffer 182 has the contents shown in FIG. 35, and the learning search starting point storage section 134 has the contents shown in FIG. 9, the learning is performed as follows.

【0089】図28を参照して第「7」行のハイパーリ
ンクが条件1を満たす。さらに、図35を参照して第
「7」行は条件2も満たす。よって、ハイパーリンクテ
ーブル2800の第「7」行のURL「http://
www.a.ne.jp/abc/link.htm」
が検索起点候補として抽出される。このURLは、検索
起点記憶部133に記憶されている検索起点とは不一致
なので、そのまま候補として残る。
Referring to FIG. 28, the hyperlink on line “7” satisfies condition 1. Further, referring to FIG. 35, the “7” th row also satisfies condition 2. Accordingly, the URL “http: //” of the “7” th row of the hyperlink table 2800
www. a. ne. jp / abc / link. htm "
Are extracted as search starting point candidates. Since the URL does not match the search start point stored in the search start point storage unit 133, the URL remains as a candidate.

【0090】検索起点候補のスコアとし、検索起点候補
から抽出されたリンクスコアが1以上のハイパーリンク
数「3」を与える。
The number of hyperlinks “3” whose link score extracted from the search starting point candidate is 1 or more is given as the score of the search starting point candidate.

【0091】次に検索起点候補と学習検索起点記憶部1
34に記憶されている検索起点とを比較すると、一致す
るので、学習検索起点記憶部134にが記憶されている
検索起点の重要度に検索起点候補のスコア「3」を加え
る。
Next, a search starting point candidate and a learning search starting point storage unit 1
When the search start point stored in the search start point storage unit 134 is compared, the score “3” of the search start point candidate is added to the importance of the search start point stored in the learning search start point storage unit 134.

【0092】最後に学習検索起点記憶部134に記憶さ
れている、検索起点候補とまったく一致しなかった検索
起点902の重要度912から一定値「1」を減じる。
図39は、この時点での学習検索起点記憶部134の内
容を表わす。重要度3901、3902の値が変更され
ている。 1.1.8.5 検索履歴学習部185 検索履歴学習部185は、以下の手順で検索履歴の学習
を行う。 (1)検索履歴学習部185は、表示バッファ173に
記憶されているハイパーリンクのURLと、検索履歴記
憶部135に記憶されている検索履歴のURLとを比較
する。 (1−1)一致したときは、検索履歴の表示回数を
「1」増加し、非連続表示回数を「0」にセットする。 (1−2)一致しないときは、表示バッファ173に記
憶されているハイパーリンクのURLを検索履歴として
登録する。表示回数に「1」、非連続表示回数に「0」
をセットする。なお、検索履歴記憶部135記憶される
個数を超えているときは、非連続表示回数のもっとも多
い検索履歴を削除する。 (2)表示バッファ173に記憶されているハイパーリ
ンクのURLと、まったく一致しなかった検索履歴の非
連続表示回数を「1」増加させる。
Finally, a certain value “1” is subtracted from the importance 912 of the search start point 902 stored in the learning search start point storage unit 134 and not matching the search start point candidate at all.
FIG. 39 shows the contents of the learning search starting point storage unit 134 at this time. The values of the importance levels 3901 and 3902 have been changed. 1.1.8.5 Search History Learning Unit 185 The search history learning unit 185 learns the search history in the following procedure. (1) The search history learning unit 185 compares the URL of the hyperlink stored in the display buffer 173 with the URL of the search history stored in the search history storage unit 135. (1-1) When there is a match, the display count of the search history is increased by “1” and the discontinuous display count is set to “0”. (1-2) If they do not match, the URL of the hyperlink stored in the display buffer 173 is registered as a search history. "1" for display count, "0" for non-continuous display count
Is set. If the number exceeds the number stored in the search history storage unit 135, the search history with the largest number of discontinuous displays is deleted. (2) The number of discontinuous display of the search history that does not match the URL of the hyperlink stored in the display buffer 173 at all is increased by “1”.

【0093】表示バッファ173が図32、検索履歴記
憶部135が図10に示す内容のとき、以下のように学
習する。
When the display buffer 173 has the contents shown in FIG. 32 and the search history storage section 135 has the contents shown in FIG. 10, learning is performed as follows.

【0094】表示バッファ173の第「1」行のURL
は検索履歴1005のURLと、第2行のURLは検索
履歴1003のURLと、第「3」行のURLは検索履
歴1004のいURLとそれぞれ一致する。そこで、検
索履歴の表示回数を「1」増加し、非連続表示回数を
「0」にセットする。
The URL of the "1" th line of the display buffer 173
The URL of the search history 1005 matches the URL of the search history 1003, the URL of the second row matches the URL of the search history 1003, and the URL of the third row matches the URL of the search history 1004. Therefore, the number of display times of the search history is increased by “1”, and the number of discontinuous display times is set to “0”.

【0095】また、表示バッファ173の第「0」行の
URLは検索履歴記憶部135のURLと一致しないの
で、表示回数を「1」、非連続表示回数を「0」とし
た、検索履歴を登録する。
Also, since the URL of the “0” th row of the display buffer 173 does not match the URL of the search history storage unit 135, the number of display times is set to “1” and the number of discontinuous display times is set to “0”. register.

【0096】最後に、表示バッファ173のURLと一
致しなかった検索履歴1001、1002、1006,
1007の非連続表示回数を「1」増加させる。図40
は、この時点での検索履歴記憶部135の記憶内容を表
わす。 1.1.9 表示部109 表示部109は、液晶ディスプレイなどで構成され、検
索結果やWebページを表示する。
Lastly, the search histories 1001, 1002, 1006, which did not match the URL of the display buffer 173.
The number of discontinuous displays of 1007 is increased by “1”. FIG.
Represents the content stored in the search history storage unit 135 at this time. 1.1.9 Display Unit 109 The display unit 109 is configured by a liquid crystal display or the like, and displays search results and Web pages.

【0097】図41は、情報検索エージェント装置が起
動された際の表示部109の表示内容を表わす。図33
と同様の部分には同一符号を付して説明を省略する。検
索ボタン4101は、ユーザがこれをクリックすると検
索部106が起動される。 1.2 動作 図42は、本実施の形態の動作を説明するフローチャー
トである。
FIG. 41 shows the contents displayed on display unit 109 when the information search agent device is activated. FIG.
The same parts as those described above are denoted by the same reference numerals and description thereof will be omitted. When the user clicks the search button 4101, the search unit 106 is activated. 1.2 Operation FIG. 42 is a flowchart illustrating the operation of the present embodiment.

【0098】情報検索エージェント装置は起動される
と、表示部109に図41に示すような起動画面が表示
される(S4201)。入力部101から検索の指示が
与えられると(S4202)、検索部106が起動され
る。検索初期化部162は、ハイパーリンク記憶部10
5に記憶されているハイパーリンクテーブルをクリアー
し、学習検索起点記憶部134もしくは検索起点記憶部
135が記憶されている検索起点を登録する初期化処理
を行う(ステップS4203)。HTMLテキスト取得
部163は、ハイパーリンクテーブルを参照して必要な
HTMLテキストをネットワークを介して取得する(S
4204)。HTMLテキスト評価部164は、取得し
たHTMLテキストの検索要求への合致度をキーワード
を用いて評価する(S4205)。ハイパーリンク抽出
部165は、取得したHTMLテキストからハイパーリ
ンクを抽出する(S4206)。ハイパーリンク評価部
166は、抽出されたハイパーリンクの検索要求への合
致度及びリンク集の判定などの評価を行う(S420
7)。検索終了判定部167は、繰り返し検索の終了を
判定する(S4208)。検索を継続する場合は、次に
取得するHTMLテキストを決定するため、ハイパーリ
ンクテーブルに登録されたハイパーリンクの選択を行い
(S4209)、制御をステップS4204へ移す。
When the information search agent device is started, a start screen as shown in FIG. 41 is displayed on the display unit 109 (S4201). When a search instruction is given from the input unit 101 (S4202), the search unit 106 is activated. The search initialization unit 162 stores the information in the hyperlink storage unit 10
Then, an initialization process of clearing the hyperlink table stored in No. 5 and registering the search starting point stored in the learning search starting point storage unit 134 or the search starting point storage unit 135 is performed (step S4203). The HTML text acquisition unit 163 acquires the required HTML text by referring to the hyperlink table via the network (S
4204). The HTML text evaluation unit 164 evaluates the matching degree of the acquired HTML text with the search request using the keyword (S4205). The hyperlink extraction unit 165 extracts a hyperlink from the acquired HTML text (S4206). The hyperlink evaluation unit 166 performs evaluation such as the degree of matching of the extracted hyperlink with the search request and the determination of the link collection (S420).
7). The search end determination unit 167 determines the end of the repeated search (S4208). If the search is to be continued, a hyperlink registered in the hyperlink table is selected to determine the next HTML text to be acquired (S4209), and the control moves to step S4204.

【0099】検索を終了すると、表示情報作成部107
が起動され、表示情報を作成する(S4210)。検索
履歴学習部184は、作成された表示情報から、検索履
歴を学習し検索履歴記憶部185を更新する(S421
1)。表示部109に、表示情報を参照して、検索結果
としてアンカー文字列を一覧表示する(S4212)。
When the search is completed, the display information creation unit 107
Is started, and display information is created (S4210). The search history learning unit 184 learns the search history from the created display information and updates the search history storage unit 185 (S421).
1). The display unit 109 refers to the display information and displays a list of anchor character strings as a search result (S4212).

【0100】学習制御部181は、学習バッファ183
をクリアーして初期化する(S4213)。
The learning control unit 181 has a learning buffer 183
Is cleared and initialized (S4213).

【0101】アンカー文字列がダブルクリックされると
(S4214)、キーワード学習部183は学習バッフ
ァ182のダブルクリック回数を「1」増加させて更新
する(S4215)。○評価ボタン3305がクリック
されると(S4216)、学習バッファ182の○評価
ボタンクリック回数を「1」増加させ更新する(S42
17)。×評価ボタン3306がクリックされると(S
4218)、学習バッファ182の×評価ボタンクリッ
ク回数を「1」増加させ更新する(S4219)。
When the anchor character string is double-clicked (S4214), the keyword learning unit 183 updates the learning buffer 182 by increasing the number of double-clicks by “1” (S4215). When the evaluation button 3305 is clicked (S4216), the number of times the evaluation button is clicked in the learning buffer 182 is increased by "1" and updated (S42).
17). X When the evaluation button 3306 is clicked (S
4218), the number of times the × evaluation button is clicked in the learning buffer 182 is increased by “1” and updated (S4219).

【0102】終了ボタン3407がクリックされると
(S4220)、検索起点学習部184は、ハイパーリ
ンクテーブルおよび学習バッファ182を参照して検索
起点候補を抽出し、学習検索起点記憶部134の更新お
よび登録を行う(S4221)。キーワード学習部18
3は、学習バッファ182と表示バッファ173を参照
してトピックキーワード候補を抽出し、トピックキーワ
ード記憶部132の更新および登録を行い(S422
2)、S4201に戻る。 2 実施の形態2 2.1 構成 図43は、本発明に係る情報検索エージェント装置の実
施の形態2の構成図である。
When end button 3407 is clicked (S4220), search starting point learning section 184 extracts a search starting point candidate by referring to the hyperlink table and learning buffer 182, and updates and registers learning starting point storage section 134. Is performed (S4221). Keyword learning unit 18
3 extracts a topic keyword candidate by referring to the learning buffer 182 and the display buffer 173, and updates and registers the topic keyword storage unit 132 (S422).
2) Return to S4201. 2. Embodiment 2 2.1 Configuration FIG. 43 is a configuration diagram of an information search agent device according to Embodiment 2 of the present invention.

【0103】この情報検索エージェント装置は、入力部
101と、通信部102と、検索情報記憶部103と、
関連語辞書104と、ハイパーリンク記憶部105と、
自動検索部106と、表示情報作成部107と、学習部
108と、表示部109と、検索情報管理部4301
と、検索情報制御部4302とを備えている。なお、上
記実施の形態1と同一の構成部分には同一の符号を付し
てその説明を省略し、本実施の形態固有の構成部分につ
いて説明する。 2.1.1 検索情報管理部4301 検索情報管理部4301は、磁気ディスクなどで構成さ
れ、検索情報記憶部103に複写するための検索情報を
名前をつけて複数記憶している。図44は、検索情報管
理部4301に記憶されている複数の検索情報の一例を
示す図である。
This information search agent device includes an input unit 101, a communication unit 102, a search information storage unit 103,
A related word dictionary 104, a hyperlink storage unit 105,
Automatic search unit 106, display information creation unit 107, learning unit 108, display unit 109, search information management unit 4301
And a search information control unit 4302. The same components as those in the first embodiment are denoted by the same reference numerals, and the description thereof will be omitted. The components unique to the present embodiment will be described. 2.1.1 Search Information Management Unit 4301 The search information management unit 4301 is composed of a magnetic disk or the like, and stores a plurality of search information to be copied in the search information storage unit 103 with a name. FIG. 44 is a diagram illustrating an example of a plurality of pieces of search information stored in the search information management unit 4301.

【0104】ここでは、名前として「野球」4411,
「競馬」4421、「料理」4431が付けられた3つ
の検索情報4410、4420、4430が記憶されて
いる。各検索情報4410、4420、4430には、
名前4411、4421、4431、分野キーワード4
412、4422、4432、トピックキーワード44
13、4423、4433、検索起点4414、442
4、4434、学習された検索起点4415、442
5、4435及び検索履歴4416、4426、443
6がそれぞれ記載されている。なお、検索履歴4416
は、例えば図40に示したような内容である。 2.1.2 検索情報制御部4302 検索情報制御部4302は、情報検索エージェント装置
が起動されたとき、検索情報管理部4301を参照し
て、検索情報に付けられた名前を表示部109に表示さ
せる。図45は、検索情報管理部4301に図44に示
す3つの検索情報4410、4420、4430が記憶
されているときの起動時の表示部109の表示画面を示
す図である。一覧表示領域3301には、検索情報の名
前「野球」4501、「競馬」4502、「料理」45
03が表示されている。ここで、表示された名前をユー
ザがクリックすることにより選択され、選択された検索
情報の名前は反転表示される。図45では、「野球」4
501が選択され、反転表示されている。ユーザによる
検索ボタン4101がクリックされると、検索情報制御
部4302は、選択された名前の検索情報を、検索情報
管理部4301から読出し、検索情報記憶部103に複
写する。例えば、検索情報4410が検索情報記憶部1
03の各記憶部131〜135に記載される。
Here, the name “baseball” 4411,
Three pieces of search information 4410, 4420, and 4430 to which "horse racing" 4421 and "cooking" 4431 are added are stored. Each of the search information 4410, 4420, 4430 includes:
Name 4411, 4421, 4431, field keyword 4
412, 4422, 4432, topic keyword 44
13, 4423, 4433, search starting points 4414, 442
4, 4434, learned search starting points 4415, 442
5, 4435 and search histories 4416, 4426, 443
6 are described respectively. The search history 4416
Has the contents as shown in FIG. 40, for example. 2.1.2 Search Information Control Unit 4302 The search information control unit 4302 refers to the search information management unit 4301 and displays the name given to the search information on the display unit 109 when the information search agent device is activated. Let it. FIG. 45 is a diagram showing a display screen of the display unit 109 at the time of startup when the three pieces of search information 4410, 4420, and 4430 shown in FIG. 44 are stored in the search information management unit 4301. In the list display area 3301, the names of the search information “baseball” 4501, “horse racing” 4502, and “dish” 45
03 is displayed. Here, the displayed name is selected by clicking on the name, and the name of the selected search information is highlighted. In FIG. 45, “baseball” 4
501 is selected and highlighted. When search button 4101 is clicked by the user, search information control section 4302 reads the search information of the selected name from search information management section 4301 and copies it to search information storage section 103. For example, the search information 4410 is stored in the search information storage unit 1
03 is stored in each of the storage units 131 to 135.

【0105】また、検索情報制御部4302は、検索結
果が表示されている状態で終了ボタン3307(図3
3)がクリックされると、検索情報記憶部103に記憶
されている検索情報を、起動時に選択された名前の検索
情報として検索情報管理部4301に記載する。 (実施の形態3) 3.1構成 図46は、本発明に係る情報検索エージェント装置の実
施の形態3の構成図である。
Further, the search information control unit 4302 sets the end button 3307 (FIG. 3) while the search result is displayed.
When 3) is clicked, the search information stored in the search information storage unit 103 is described in the search information management unit 4301 as search information of the name selected at the time of startup. Third Embodiment 3.1 Configuration FIG. 46 is a configuration diagram of an information search agent device according to a third embodiment of the present invention.

【0106】この情報検索エージェント装置は、入力部
101と、通信部102と、検索情報記憶部103と、
関連語辞書104と、ハイパーリンク記憶部105と、
検索部106と、表示情報作成部107と、学習部10
8と、表示部109と、一括取得部4601と、Web
ページ記憶部4602とを備えている。
This information search agent device includes an input unit 101, a communication unit 102, a search information storage unit 103,
A related word dictionary 104, a hyperlink storage unit 105,
Search unit 106, display information creation unit 107, and learning unit 10
8, the display unit 109, the batch acquisition unit 4601, and the Web
And a page storage unit 4602.

【0107】なお、上記実施の形態1と同一の構成部分
には、同一の符号を付してその説明を省略し、本実施の
形態固有の構成部分について説明する。 3.1.1 一括取得部4601 一括取得部4601は、表示情報作成部107で作成さ
れた表示情報のURLを順次、通信部102に引き渡
す。通信部102はURLに対応するWebページを構
成するHTMLテキストおよびイメージデータをネット
ワークを介して取得する。一括取得部4601は、通信
部102で取得されたWebページ(実際にはHTML
テキストおよびイメージデータ)をWebページ記憶部
4602に記憶させる。
The same components as those in the first embodiment are denoted by the same reference numerals, and the description thereof will be omitted. Only the components unique to the present embodiment will be described. 3.1.1 Batch Acquisition Unit 4601 The batch acquisition unit 4601 sequentially passes the URLs of the display information created by the display information creation unit 107 to the communication unit 102. The communication unit 102 acquires, via a network, HTML text and image data constituting a Web page corresponding to the URL. The batch acquisition unit 4601 receives the Web page (actually, HTML) acquired by the communication unit 102.
Text and image data) are stored in the Web page storage unit 4602.

【0108】一括取得を行うことにより、通信回線を切
断し、取得保存したWebページを閲覧するようするこ
とで、通信コストを削減することができる。 3.2.1 Webページ記憶部4602 Webページ記憶部4602は、磁気ディスクなどで構
成され、一括取得部4601で通信部102を介して取
得されたWebページを記憶している。
By performing the batch acquisition, the communication line is disconnected, and the acquired and saved Web page is browsed, so that the communication cost can be reduced. 3.2.1 Web Page Storage Unit 4602 The Web page storage unit 4602 is made up of a magnetic disk or the like, and stores Web pages acquired by the batch acquisition unit 4601 via the communication unit 102.

【0109】なお、上記実施の形態1〜3では、ページ
スコア、リンクスコア、表示スコア、トピックキーワー
ド候補のスコア、検索起点候補のスコアの各計算方法に
は所定の定数を用いた計算式を示したけれども、計算式
はこれらに限るものではなく、また定数も適宜修正可能
である。
In the first to third embodiments, the formulas for calculating the page score, the link score, the display score, the score of the topic keyword candidate, and the score of the search starting candidate are shown by using predetermined constants. However, the calculation formula is not limited to these, and the constants can be modified as appropriate.

【0110】また、上記実施の形態1〜3では、通信検
索部121で取得される情報をHTMLテキストとした
けれども、他のハイパーリンクが記述された例えばXM
L(Extensible Markup Langu
age)テキストであってもよい。 4 実施の形態の変形例 4.1 その1 上記実施の形態1〜3においてハイパーリンク評価部1
66は、ハイパーリンクの評価を決定する際、分野キー
ワード、トピックキーワード、関連語によって評価を行
っているが、この方法に限定されるものではない。ここ
で、HTMLテキストを提供するサイト情報を記憶する
サイト情報記憶部を設けても良い。
In the first to third embodiments, the information acquired by the communication search unit 121 is an HTML text.
L (Extensible Markup Langu)
age) It may be text. 4 Modifications of Embodiment 4.1 Part 1 Hyperlink Evaluation Unit 1 in First to Third Embodiments
When determining the evaluation of the hyperlink, the evaluation is performed using the field keyword, the topic keyword, and the related word, but the method is not limited to this method. Here, a site information storage unit for storing site information for providing an HTML text may be provided.

【0111】図47は、サイト情報記憶部に記憶されて
いる内容の一例を示す図である。ここで、サイト情報記
憶部は、サイトのURL4701と通信速度4702と
を記憶している。通信速度は単位時間あたりの平均送信
データ量(バイト数)のことで、通信部102で取得さ
れたデータのサイズを通信時間で割ることによって得ら
れるもので、過去の通信履歴から作成される。図47を
参照すると、例えば、URL「http://www.
a.ne.jp/」のサイトの通信速度は、URL「h
ttp://www.b.co.jp/」のサイトの通
信速度の2倍以上であり、同じ時間で倍以上の情報を得
られることがわかる。このサイト情報を利用して通信速
度の速いサイトのURLを持つハイパーリンクの評価値
を上げ、より速く多くの情報を収集することが可能とな
る。通信速度の評価値への組み込みの具体的な方法の1
つは、ハイパーリンクのURLのサイト部分とサイト情
報記憶部のURLを比較し、一致したときに通信速度を
一定値で割った値をハイパーリンクの評価値に加えるこ
とである。また、キーワードによって計算された評価値
に通信速度を掛ける方法などがある。 4.2 その2
FIG. 47 is a diagram showing an example of the contents stored in the site information storage section. Here, the site information storage unit stores the URL 4701 and the communication speed 4702 of the site. The communication speed is an average transmission data amount (the number of bytes) per unit time, which is obtained by dividing the size of data acquired by the communication unit 102 by the communication time, and is created from a past communication history. With reference to FIG. 47, for example, the URL “http: // www.
a. ne. jp / ", the communication speed of the URL" h
http: // www. b. co. jp / "is twice or more the communication speed of the site, and it can be seen that twice or more information can be obtained in the same time. Using this site information, the evaluation value of the hyperlink having the URL of the site with the fast communication speed can be increased, and more information can be collected more quickly. 1 of concrete method of incorporating into communication speed evaluation value
First, the site portion of the URL of the hyperlink is compared with the URL of the site information storage unit, and when they match, a value obtained by dividing the communication speed by a certain value is added to the evaluation value of the hyperlink. In addition, there is a method of multiplying an evaluation value calculated by a keyword by a communication speed. 4.2 Part 2

【0112】また、サイト情報として、ユーザにとって
有益な情報を提供しているかを記憶することもできる。
図48は、サイト情報記憶部に記憶されている内容の一
例を示す図である。ここで、サイト情報記憶部は、サイ
トのURL4801と表示回数4802とを記憶してい
る。表示回数はこれまでにユーザによって閲覧された回
数を記録したものである。表示部109に表示された回
数を計数することで作成される。また、単なる回数でな
く表示時間で計数しても良い。また、起動時からの全表
示回数もしくは表示時間でなく、最近の一定期間だけの
表示回数もしくは表示時間を計数することによって、そ
のときのユーザの好みを反映させることができる。この
表示回数あるいは表示時間の長いサイトは、ユーザにと
って有益な情報を多く提供していると考えることができ
る。このサイト情報を利用して有益な情報の多いサイト
のURLを持つハイパーリンクの評価値を上げ、より速
く有益な情報を収集することが可能となる。評価値への
組み込みの具体的な方法の1つは、ハイパーリンクのU
RLのサイト部分とサイト情報記憶部のURLのサイト
部分とを比較し、一致したときに表示回数を一定値で割
った値を評価値に加えることである。また、キーワード
によって計算された評価値に表示回数を掛ける方法など
がある。 4.3 その3
Further, it is also possible to store, as site information, whether information useful to the user is provided.
FIG. 48 is a diagram illustrating an example of the content stored in the site information storage unit. Here, the site information storage unit stores the URL 4801 and the number of times of display 4802 of the site. The display count is a record of the number of times the user has browsed so far. It is created by counting the number of times displayed on the display unit 109. Also, the count may be based on the display time instead of the simple count. In addition, by counting the number of display times or display time only for a recent certain period, instead of the total number of display times or display time since startup, the user's preference at that time can be reflected. It can be considered that a site having a long display count or long display time provides a lot of useful information for the user. By using this site information, the evaluation value of the hyperlink having the URL of the site having a lot of useful information can be increased, and the useful information can be collected more quickly. One of the specific methods of incorporating into the evaluation value is the U
The site part of the RL is compared with the site part of the URL in the site information storage unit, and when they match, a value obtained by dividing the display count by a certain value is added to the evaluation value. In addition, there is a method of multiplying the evaluation value calculated by the keyword by the number of times of display. 4.3 Part 3

【0113】また、一定期間の過去の検索参照履歴を記
憶する検索参照履歴記憶部を設け、これをハイパーリン
クの評価値に反映させても良い。検索参照履歴とは、検
索が行われたとき、表示部109に表示されたハイパー
リンクの一覧で、参照されなかった回数を記録したもの
である。この回数も最近の一定期間だけを計数すること
によって、そのときのユーザの好みを反映させることが
できる。図49は、検索参照履歴記憶部に記憶されてい
る検索参照履歴の一例を示す図である。URL4901
に対して、表示部105に表示されたにも拘わらず参照
されなかった回数4902が記憶される。この回数が多
いほどユーザにとって不要な情報といえる。評価値への
組み込みの具体的な方法の1つは、ハイパーリンクのU
RLと検索参照履歴記憶部のURLを比較し、一致した
ときに参照されなかった回数を一定値で割った値を評価
値から減じることである。また、この検索参照履歴記憶
部では参照されなかった回数のみを記憶しているが、参
照した回数も記録して、その回数を一定値で割った値を
評価値に加えることも可能である。 4.4 その4
Further, a search reference history storage unit for storing a past search reference history for a certain period may be provided, and this may be reflected in the evaluation value of the hyperlink. The search reference history is a list of hyperlinks displayed on the display unit 109 when the search is performed, and records the number of times that the search was not performed. By counting only the last certain period, the number of times can reflect the user's preference at that time. FIG. 49 is a diagram illustrating an example of the search reference history stored in the search reference history storage unit. URL4901
In response to this, the number of times 4902 that is not referred to despite being displayed on the display unit 105 is stored. It can be said that the greater the number of times, the more unnecessary information is for the user. One of the specific methods of incorporating into the evaluation value is the U
This is to compare the RL with the URL in the search reference history storage unit, and subtract a value obtained by dividing the number of times of non-reference when a match occurs by a certain value from the evaluation value. Although the search reference history storage unit stores only the number of unreferenced times, the number of times of reference is also recorded, and a value obtained by dividing the number of times by a certain value can be added to the evaluation value. 4.4 Part 4

【0114】また、ハイパーリンクの評価値を決定する
際、探索範囲を広げるために、一定の割合でランダムに
ハイパーリンクを選択することも可能である。 4.5 その5 また、上記実施の形態1〜3では、検索において、1つ
のハイパーリンクを選択し、対応するHTMLテキスト
を取得する繰り返しとしているが、これを複数のハイパ
ーリンクを選択し、それらすべての対応するHTMLテ
キストを取得することを1回の検索としても実施可能で
ある。また、ことのき、複数のハイパーリンクの決定方
法を用意して、それぞれの基準でハイパーリンクを選択
することも可能である。 4.6 その6
When determining the evaluation value of a hyperlink, it is also possible to randomly select a hyperlink at a fixed rate in order to widen the search range. 4.5 Fifth Embodiment In the first to third embodiments, one hyperlink is selected in the search and the corresponding HTML text is acquired repeatedly. However, this is performed by selecting a plurality of hyperlinks and retrieving them. Obtaining all corresponding HTML texts can be implemented as a single search. In addition, it is also possible to prepare a method for determining a plurality of hyperlinks and select a hyperlink based on each criterion. 4.6 Part 6

【0115】ハイパーリンクの選択基準にリンク集か否
かを主に用いたけれども、HTMLテキストの種類「目
次」、「コンテンツ」、「リンク集」なども判定し、表
示やハイパーリンクの選択に利用してもよい。 4.7 その7 また、上記実施の形態1〜3では、表示の際、表示バッ
ファ173に記憶されているすべての情報を表示したけ
れども、これを検索履歴記憶部135に記憶しているU
RLと一致するハイパーリンクだけに限定してもよい。
このように限定することにより、過去に良く参照したペ
ージの一覧表示を実現できる。また、一定の適合度(リ
ンクスコア)以上のハイパーリンクのみ表示しても良
い。また、表示の際、ハイパーリンクに対する適合度を
同時に表示してもよい。また、HTMLテキストの内容
である種別を表示しても良い。図50は、一覧表示領域
3301に適合度と種別も同時に表示した例である。こ
こで適合度は10以上のとき「◎」、5以上のとき
「○」で表示している。
Although the selection of a link is mainly used as a criterion for selecting a hyperlink, the type of the HTML text such as “table of contents”, “content”, and “link collection” are also determined and used for display and selection of a hyperlink. May be. 4.7 Seventh Embodiment In the first to third embodiments, all the information stored in the display buffer 173 is displayed at the time of display, but this is stored in the search history storage unit 135.
Only the hyperlink that matches the RL may be limited.
By limiting in this way, it is possible to display a list of pages frequently referred to in the past. Alternatively, only hyperlinks having a certain degree of matching (link score) or more may be displayed. Further, at the time of display, the degree of conformity to the hyperlink may be displayed at the same time. Further, the type, which is the content of the HTML text, may be displayed. FIG. 50 is an example in which the suitability and the type are also displayed in the list display area 3301 at the same time. Here, the degree of conformity is indicated by “◎” when it is 10 or more, and “○” when it is 5 or more.

【0116】4.8 その8 また、適合度や種別で並べ替えるのではなく、各HTM
Lテキストのリンク関係を反映した表示としてもよい。
図51は、一覧表示領域3301にHTMLテキストの
リンク関係と適合度とを表示している例である。ハイパ
ーリンクがツリー状に表示されている。上記変形例その
7と同様、各ハイパーリンクの適合度は10以上のとき
「◎」、5以上のとき「○」で表示している。 4.9 その9 なお、上記実施の形態1〜3において、ユーザが検索情
報を登録、削除、変更するための検索情報変更部を設け
るようにしてもよい。ユーザは、検索情報として、検索
情報の名前、分野キーワード、検索起点のURLを登録
することで、必要な検索情報を必要なだけ用意すること
ができる。これにより、Webページを閲覧中にユーザ
が有効なキーワードを見つけた場合、そのキーワードを
分野キーワードとして検索情報部変更部から追加するこ
とができる。
4.8 No. 8 In addition, instead of rearranging by conformity or type, each HTM
The display may reflect the link relationship of the L text.
FIG. 51 shows an example in which the list display area 3301 displays the link relation and the degree of matching of the HTML text. Hyperlinks are displayed as a tree. Similar to the seventh modification, the degree of conformity of each hyperlink is indicated by “◎” when it is 10 or more, and “○” when it is 5 or more. 4.9 Ninth Embodiment In the first to third embodiments, a search information changing unit for a user to register, delete, and change search information may be provided. By registering the name of the search information, the field keyword, and the URL of the search start point as the search information, the user can prepare as many necessary search information as necessary. Thus, when the user finds a valid keyword while browsing the Web page, the keyword can be added as a field keyword from the search information section changing unit.

【0117】また、使用しなくなった検索情報を削除す
ることで、検索情報の記憶領域を削減することができ
る。 4.10 その10 上記実施の形態1〜3では、トピックキーワードをアン
カー文字列や説明文字列から抽出したけれども、従来の
ようにHTMLテキスト全体からトピックキーワードを
抽出するようにしてもよい。 4.11 その11 また、上記実施の形態1〜3では、キーワード学習部1
83は、一覧表示されているハイパーリンクが選択され
たときに起動されているが、選択された後一定時間閲覧
された際に起動されても良い。ユーザがハイパーリンク
を選択し、対応するWebページを表示した結果、有益
な情報であれば、長く閲覧し、不要な情報であれば閲覧
を即やめることが考えられる。そこで、ハイパーリンク
の選択後、一定時間対応するWebページを表示してい
るときに限り、キーワード学習部183が学習バッファ
182のダブルクリック回数の更新を行うようにして、
より的確にユーザの好みを反映することができる。
Further, by deleting search information that is no longer used, the storage area for search information can be reduced. 4.10 Tenth Embodiment In the first to third embodiments, the topic keyword is extracted from the anchor character string and the description character string. However, the topic keyword may be extracted from the entire HTML text as in the related art. 4.11 Eleven In the first to third embodiments, the keyword learning unit 1
83 is activated when a hyperlink displayed in the list is selected, but may be activated when browsed for a certain period of time after selection. As a result of the user selecting the hyperlink and displaying the corresponding Web page, it is conceivable that the useful information is browsed for a long time, and the unnecessary information is immediately browsed. Therefore, after the hyperlink is selected, the keyword learning unit 183 updates the number of double clicks of the learning buffer 182 only when the corresponding Web page is displayed for a certain period of time.
It is possible to more accurately reflect user preferences.

【0118】4.12 その12 上記実施の形態1〜3の情報検索エージェント装置は、
サーバー・クライアントの形態で実現することも可能で
ある。クライアント側は入力部101,表示部109,
検索情報記憶部103、検索情報管理部4301,検索
情報制御部4302を備え、それ以外の構成要素はサー
バー側が備える。サーバーは、必要な検索情報をクライ
アント側から取得して検索処理を行う。また、サーバー
は検索結果をクライアントの表示部109に表示する。
検索情報は個人の嗜好を表す個人情報であり、各個人が
所有するパソコンなどのクライアントマシンで管理する
のが望ましい。また、検索処理は、処理能力が高い共用
のサーバーマシンを使用することによって高速化するこ
とができる。
4.12 Twelveth Information search agent devices according to the first to third embodiments are:
It can also be realized in the form of a server client. On the client side, the input unit 101, the display unit 109,
The server includes a search information storage unit 103, a search information management unit 4301, and a search information control unit 4302, and the other components are provided on the server side. The server acquires necessary search information from the client side and performs a search process. Further, the server displays the search result on the display unit 109 of the client.
The search information is personal information indicating personal preferences, and is preferably managed by a client machine such as a personal computer owned by each individual. Further, the search processing can be accelerated by using a shared server machine having a high processing capacity.

【0119】4.13 その13 上記実施の形態1〜3の情報検索エージェント装置は、
リンク集フラグを利用してリンク集を優先的に取得して
いた。しかし、XMLなどのハイパーリンク記述形式に
おいて、リンク先のページが多くのハイパーリンクを含
むことを表す属性を記述できるとき、この属性をリンク
集フラグの決定に利用しても良い。例えばハイパーリン
クの開始タグを「<A HREF=a.htm num
=10>」と記述し、このうちの「num=10」がハ
イパーリンク先のページに含まれるハイパーリンク個数
を表すとする。この個数が所定の値以上であればリンク
集フラグを「T」としてもよい。またリンク集フラグを
リンク集合スコアとし、このハイパーリンク個数を記憶
して、ハイパーリンク個数の多いページから優先的に取
得するようにしても良い。 4.14 その14
4.13 Thirteenth The information retrieval agent devices of the first to third embodiments are:
The link collection was acquired preferentially using the link collection flag. However, when an attribute indicating that a linked page includes many hyperlinks can be described in a hyperlink description format such as XML, the attribute may be used for determining a link collection flag. For example, if the start tag of the hyperlink is "<A HREF = a.htm num
= 10>",and" num = 10 "among them represents the number of hyperlinks included in the hyperlink destination page. If the number is equal to or more than a predetermined value, the link collection flag may be set to “T”. Alternatively, the link collection flag may be set as a link collection score, and the number of hyperlinks may be stored, and the page may be preferentially acquired from a page having a large number of hyperlinks. 4.14 Part 14

【0120】なお、本発明に係る情報検索エージェント
装置は、上記実施の形態1〜3において、それぞれ図
1、図43及び図46に構成図として示したけれども、
各構成部分の機能を発揮するプログラムを、フロッピー
ディスク等のコンピュータ読み取り可能な記録媒体に記
録して移送する、あるいは、通信回線を介して移送する
ことにより、独立した他のコンピュータシステムで容易
に実施することができる。
Although the information search agent device according to the present invention is shown in FIGS. 1, 43 and 46 in Embodiments 1 to 3, respectively,
A program that performs the function of each component is recorded on a computer-readable recording medium such as a floppy disk and transferred, or is transferred via a communication line, so that it can be easily implemented on another independent computer system. can do.

【0121】[0121]

【発明の効果】以上説明したように、本発明によれば、
ネットワーク及びシステム上のアドレスで指定されるデ
ータを検索する情報検索エージェント装置であって、ア
ドレスと検索開始の指示とを受けるか又はアドレスの通
知を受けると、当該アドレスで指定されるデータを取得
するデータ取得手段と、取得された複数のデータ要素か
らなるデータを記憶するデータ記憶手段と、前記データ
記憶手段に記憶されているデータを解析し、データ要素
に含まれる他のデータへのリンク先アドレスと当該アド
レスに関連する文字列とを抽出する抽出手段と、抽出さ
れた文字列に基づいてリンク先アドレスで指定されるデ
ータの選択適性の評価値を計算する計算手段と、評価テ
ーブルに、文字列と、計算された評価値とをリンク先ア
ドレスごとに記載する評価テーブル記載手段と、前記評
価テーブルに記載された評価値が最高のリンク先アドレ
スを前記データ取得手段に通知するデータ取得制御手段
と、前記データ取得制御手段の処理を前記評価テーブル
の状況に応じて禁止する禁止手段と、前記評価テーブル
に記載された文字列を選択する選択手段と、前記選択手
段で選択された文字列を表示画面に一覧表示させる一覧
表示制御手段とを備えることとしている。このような構
成によって、文字列に関連するリンク先アドレスで指定
されるデータを予め取得することなく、表示画面に文字
列を一覧表示させるので、無駄なデータ取得のための通
信コストを削減することができ、また、評価テーブルの
状況に応じて検索を終了するので、データの記憶領域も
少なくてよい。
As described above, according to the present invention,
An information search agent device that searches for data specified by an address on a network and a system, and upon receiving an address and a search start instruction or receiving a notification of an address, obtains data specified by the address. Data acquisition means, data storage means for storing the data comprising the acquired plurality of data elements, and data stored in the data storage means are analyzed, and a link destination address to other data included in the data element is analyzed. Extracting means for extracting a character string associated with the address; calculating means for calculating an evaluation value of selectivity of data specified by the link destination address based on the extracted character string; Means for writing a column and a calculated evaluation value for each link destination address; Data acquisition control means for notifying the data acquisition means of the highest link destination address obtained by the evaluation value, prohibition means for inhibiting the processing of the data acquisition control means according to the status of the evaluation table, and A selection unit for selecting the described character string, and a list display control unit for displaying a list of the character strings selected by the selection unit on a display screen are provided. With such a configuration, the character strings are displayed in a list on the display screen without previously acquiring the data specified by the link destination address related to the character strings, so that the communication cost for unnecessary data acquisition can be reduced. Since the search is terminated according to the status of the evaluation table, the data storage area may be small.

【0122】また、前記表示画面に表示された文字列の
選択をユーザから受け取ると、対応するリンク先アドレ
スを前記データ取得手段に通知するデータ取得通知手段
と、前記データ取得通知手段によるアドレスの通知の
後、前記データ記憶手段にデータが記憶されると、前記
抽出手段の処理を禁止して、記憶されているデータを解
析し、表示画面に表示させるデータ表示制御手段とを備
えることとしている。このような構成によって、ユーザ
が必要とするデータを容易に表示させることができる。
Further, when a selection of a character string displayed on the display screen is received from a user, a data acquisition notifying means for notifying the data acquiring means of a corresponding link destination address, and an address notification by the data acquisition notifying means. After that, when data is stored in the data storage means, a data display control means for prohibiting the processing of the extraction means, analyzing the stored data and displaying the data on a display screen is provided. With such a configuration, data required by the user can be easily displayed.

【0123】また、ユーザからキーワードの入力を受け
付けて記憶しているキーワード記憶手段と、見出し語
と、その見出し語に関連する関連語と、その関連語の見
出し語に対する関連度とが登録された関連語辞書とを備
え、前記文字列は、リンク先アドレスで指定されるデー
タの内容を示す文字列であり、文字列には説明文が付さ
れている場合があり、前記計算手段は、前記文字列及び
説明文に含まれる単語が前記キーワード記憶手段に記憶
されているキーワードと一致するとき、評価値を大きく
するキーワード評価部と、前記文字列及び説明文に含ま
れる単語が前記キーワード記憶手段に記憶されているキ
ーワードを前記関連語辞書の見出し語とする関連語と一
致するとき、その関連度に応じて評価値を大きくする関
連語評価部とを有することとしている。このような構成
によって、データの選択適性がユーザの興味あるキーワ
ードによって評価されるので、的確なデータの選択予測
が可能となり、無駄なデータ検索をすることが防止さ
れ、通信コストの削減が図れる。
A keyword storage means for receiving and storing a keyword input from a user, a headword, a related word related to the headword, and a degree of relevance of the relevant word to the headword are registered. A related word dictionary, wherein the character string is a character string indicating the content of data specified by a link destination address, and the character string may be accompanied by an explanatory sentence. A keyword evaluation unit that increases an evaluation value when a word included in a character string and a description matches a keyword stored in the keyword storage unit; And a related word evaluator that increases an evaluation value according to the degree of relevance when the keyword stored in the word matches a related word that is a headword of the related word dictionary. It is set to be. With such a configuration, the suitability of data selection is evaluated based on a keyword of interest to the user, so that accurate data selection prediction can be performed, unnecessary data search can be prevented, and communication costs can be reduced.

【0124】また、前記表示画面に表示された文字列の
選択をユーザから受け付けると、当該文字列を形態素解
析し、所定の条件により、当該文字列に含まれる単語を
トピックキーワードに決定するトピックキーワード決定
手段と、前記決定されたトピックキーワードを記憶する
トピックキーワード記憶手段とを備え、前記計算手段
は、前記文字列及び説明文に含まれる単語が前記トピッ
クキーワード記憶手段に記憶されているトピックキーワ
ードと一致するとき、評価値を大きくするトピックキー
ワード評価部を有することとしている。このような構成
によって、ユーザの表示データの選択を受けて、ユーザ
の興味を反映させつつ、データの選択適性を評価してい
るので、より的確なデータ検索をすることができる。
When the selection of the character string displayed on the display screen is received from the user, the character string is subjected to morphological analysis, and the topic included in the character string is determined as a topic keyword according to predetermined conditions. Determining means; and topic keyword storing means for storing the determined topic keywords, wherein the calculating means includes a topic keyword in which words included in the character string and the description are stored in the topic keyword storing means. When they match, a topic keyword evaluation unit that increases the evaluation value is provided. According to such a configuration, the selection of the display data by the user is reflected and the suitability of the data is evaluated while reflecting the interest of the user, so that more accurate data search can be performed.

【0125】また、前記データ取得制御手段は、前記評
価テーブルに記載されたリンク先アドレスと文字列との
いずれかに「リンク」又は「link」の文字列が含ま
れているか否かを判断する判断部と、前記判断部で含ま
れていると判断されたとき、当該リンク先アドレスを評
価値が最高のリンク先アドレスに優先して前記データ取
得手段に通知する優先通知部とを有することとしてい
る。このような構成によって、リンク先アドレス等に
「link」等の単語を含むデータはリンク集であるこ
とが予測され、そのデータからリンクされる他のデータ
を多数有しているので、効果的なデータ検索ができる。
Further, the data acquisition control means determines whether any of the link destination address and the character string described in the evaluation table includes a character string of “link” or “link”. A determination unit, and a priority notification unit that, when determined to be included in the determination unit, notifies the data acquisition unit of the link destination address in preference to the link destination address having the highest evaluation value. I have. With such a configuration, data including a word such as “link” in a link destination address or the like is predicted to be a link collection, and has a large number of other data linked from the data. Can search data.

【0126】また、前記一覧表示制御手段によって文字
列が表示されたとき、文字列ごとに表示回数を計数する
計数手段と、前記計数手段で計数された表示回数を対応
するリンク先アドレスごとに記憶する検索履歴記憶手段
とを備え、前記選択手段は、前記検索履歴記憶手段に記
憶されている表示回数の多いリンク先アドレスに対応す
る文字列を劣後する劣後部を有することとしている。こ
のような構成によって、何度も同じデータを表示させる
ことを防止することができ、新しいデータを優先的に表
示できる。
When a character string is displayed by the list display control means, a counting means for counting the number of display times for each character string, and a display number counted by the counting means are stored for each corresponding link destination address. Search history storage means, and the selection means has a subordinate part for subordinating a character string corresponding to a link destination address with a large number of display times stored in the search history storage means. With such a configuration, the same data can be prevented from being displayed many times, and new data can be displayed with priority.

【0127】また、前記データ表示制御手段でデータが
表示画面に表示されているときに、ユーザから興味の有
無に関するボタン操作を受け付ける受付手段と、前記受
付手段で興味「有」を受け付けたとき選択されている文
字列に対応するリンク先アドレスを検索起点として登録
する検索起点登録手段と、前記受付手段で興味「無」を
受け付けたとき選択されている文字列に対応するリンク
先アドレスが検索起点登録手段で登録されているとき、
その検索起点であるリンク先アドレスを削除する検索起
点削除手段とを備え、前記データ取得手段は、検索開始
の指示を受けたとき、検索起点登録手段に登録されてい
る当該アドレスで指定されるデータを取得することとし
ている。このような構成によって、ユーザが検索起点の
アドレスを入力しなくても、過去の履歴から検索開始の
データを決定でき、またユーザの興味の有無を反映させ
た新しいデータの検索ができる。
Further, when data is displayed on the display screen by the data display control means, a receiving means for receiving a button operation relating to the presence or absence of interest from the user; Search starting point registration means for registering a link destination address corresponding to a character string being searched as a search starting point, and a link destination address corresponding to a character string selected when the accepting means receives the interest "None". When registered by registration means,
A search starting point deleting unit that deletes a link destination address that is the search starting point, wherein the data acquisition unit receives, when receiving an instruction to start a search, data specified by the address registered in the search starting point registration unit. You are going to get. With such a configuration, it is possible to determine the search start data from the past history and to search for new data reflecting the user's interest, without the user inputting the search start address.

【0128】また、前記トピックキーワード記憶手段に
記憶されているトピックキーワードには、重要度が付さ
れており、前記データ表示制御手段でデータが表示画面
に表示されているときに、ユーザから興味の有無に関す
るボタン操作を受け付ける受付手段を備え、前記トピッ
クキーワード決定手段は、前記受付手段で興味「有」を
受け付けたとき、対応する文字列から決定されたトピッ
クキーワードの重要度を高くし、興味「無」を受け付け
たとき、対応する文字列から決定されたトピックキーワ
ードの重要度を低くする重要度評価部を有し、前記トピ
ックキーワード評価部は、この重要度を考慮することと
している。このような構成によって、ユーザの興味の有
無を反映させたデータ検索ができる。
The topic keywords stored in the topic keyword storage means are assigned importance, and when the data is displayed on the display screen by the data display control means, the user is interested in the topic keywords. Receiving means for receiving a button operation relating to the presence / absence of the key word; the topic keyword determining means increases the importance of the topic keyword determined from the corresponding character string when the receiving means receives the interest “Yes”; When “none” is received, the topic keyword evaluation unit has an importance evaluation unit that lowers the importance of the topic keyword determined from the corresponding character string, and the topic keyword evaluation unit considers this importance. With such a configuration, data search that reflects the presence or absence of the user's interest can be performed.

【0129】また、データ内容の分野別に名前を付し、
検索開始時のアドレスと、キーワードと、トピックキー
ワードと、前記一覧表示制御手段での表示履歴とを含む
検索情報を記憶する検索情報記憶手段と、検索終了時に
前記検索情報を更新する検索情報更新手段とを備え、前
記一覧表示制御手段は、ユーザから検索開始の指示を受
けると、前記名前を表示画面に一覧表示させる初期表示
部を有し、前記データ取得制御手段は、前記名前の選択
を受けると、対応する検索開始時のアドレスを前記デー
タ取得手段に通知する初期通知部を有することとしてい
る。このような構成によって、ユーザが選択した分野別
のデータの検索が容易にできる。
Further, a name is given for each field of data contents,
Search information storage means for storing search information including an address at the start of a search, a keyword, a topic keyword, and a display history in the list display control means, and search information updating means for updating the search information at the end of a search The list display control means has an initial display unit for displaying a list of the names on a display screen when a search start instruction is received from a user, and the data acquisition control means receives the selection of the names. And an initial notification unit for notifying the data acquisition unit of the address at the start of the corresponding search. With such a configuration, it is possible to easily search for data in each field selected by the user.

【0130】また、前記計算手段は、前記データ取得手
段がデータを取得するのに要した時間を計時し、取得し
たデータ量とから送信速度を計算する送信速度計算部
と、前記送信速度計算部で計算された送信速度を同一サ
イトのアドレスごとに記憶する送信速度記憶部と、送信
速度の速いサイトの評価値を大きくする送信速度評価部
とを有することとしている。このような構成によって、
短時間で取得できるサイトを優先するので、通信コスト
を削減できる。
The calculating means measures the time required for the data obtaining means to obtain data, and calculates a transmission speed from the obtained data amount, and a transmission speed calculating section. A transmission speed storage unit that stores the transmission speed calculated by the above for each address of the same site, and a transmission speed evaluation unit that increases the evaluation value of a site with a high transmission speed. With such a configuration,
Since a site that can be acquired in a short time is prioritized, communication costs can be reduced.

【0131】また、前記計算手段は、前記データ表示制
御手段でデータが表示画面に表示されたとき、その表示
回数を計数するデータ表示回数計数部と、計数された表
示回数を同一サイトのアドレス毎に記憶するデータ表示
回数記憶部と、前記データ表示回数の多いサイトの評価
値を大きくする表示回数評価部とを有することとしてい
る。このような構成によって、ユーザの興味のあるサイ
トからのデータの検索が容易にできる。
When the data is displayed on the display screen by the data display control means, the calculation means includes a data display number counting unit for counting the number of display times, and a data display number counting unit for counting the number of display times for each address of the same site. And a display number evaluation unit for increasing the evaluation value of a site having a large number of data display times. With such a configuration, it is possible to easily search for data from sites of interest to the user.

【0132】更に、本発明はネットワークやシステム上
の所定のアドレスで指定されるデータを検索する情報検
索エージェント装置であって、アドレスと検索開始の指
示とを又はアドレスの通知を受けると、当該アドレスで
指定されるデータを取得するデータ取得手段と、取得さ
れた複数のデータ要素からなるデータを記憶するデータ
記憶手段と、前記データ記憶手段に記憶されているデー
タを解析し、データ要素に含まれる他のデータへのリン
ク先アドレスと当該アドレスで指定されるデータに関連
する文字列とを抽出する抽出手段と、抽出された文字列
に基づいてリンク先アドレスで指定されるデータの選択
適性の評価値を計算する計算手段と、評価テーブルにリ
ンク先アドレスと、文字列と、計算された評価値とをリ
ンク先アドレスごとに記載する評価テーブル記載手段
と、前記評価テーブルに記載された評価値が最高のリン
ク先アドレスを前記データ取得手段に通知するデータ取
得制御手段と、前記データ取得制御手段の処理を前記評
価テーブルの状況に応じて禁止する禁止手段と、前記評
価テーブルに記載された所定の文字列を選択する選択手
段と、前記選択手段で選択された文字列に対応するリン
ク先アドレスで指定されるデータを順次取得する一括デ
ータ取得手段と、前記一括データ取得手段で取得された
データを記憶する一括データ記憶手段とを備えることと
している。このような構成によって、ユーザが興味を持
つデータを予測して取得しておくので、希望のデータを
時間を要せずして表示させることができる。
Further, the present invention relates to an information retrieval agent device for retrieving data designated by a predetermined address on a network or a system, wherein the information retrieval agent device receives an address and a retrieval start instruction or receives a notification of the address. A data acquisition unit for acquiring the data specified by the above, a data storage unit for storing the data composed of the plurality of acquired data elements, and analyzing the data stored in the data storage unit to be included in the data elements. Extraction means for extracting a link destination address to another data and a character string related to the data specified by the address, and evaluation of suitability for selection of the data specified by the link destination address based on the extracted character string Calculation means for calculating the value, a link destination address, a character string, and the calculated evaluation value in the evaluation table for each link destination address. Evaluation table writing means, a data acquisition control means for notifying the data acquisition means of the highest link destination address described in the evaluation table, and processing of the data acquisition control means of the evaluation table Prohibiting means for prohibiting according to the situation, selecting means for selecting a predetermined character string described in the evaluation table, and data specified by a link destination address corresponding to the character string selected by the selecting means sequentially. It is provided with a collective data acquisition means for acquiring, and a collective data storage means for storing the data acquired by the collective data acquisition means. With such a configuration, since the data that the user is interested in is predicted and acquired, desired data can be displayed without requiring time.

【0133】更に、本発明はコンピュータ読み取り可能
な記録媒体であって、 ネットワークやシステム上の所
定のアドレスで指定されるデータを検索する情報検索エ
ージェント装置の、アドレスと検索開始の指示とを又は
アドレスの通知を受けると、当該アドレスで指定される
データを取得するデータ取得手段と、取得された複数の
データ要素からなるデータを記憶領域に書き込むデータ
書込手段と、前記データ記憶領域に記憶されているデー
タを解析し、データ要素に含まれる他のデータへのリン
ク先アドレスと当該アドレスで指定されるデータに関連
する文字列とを抽出する抽出手段と、抽出された文字列
に基づいてリンク先アドレスで指定されるデータの選択
適性の評価値を計算する計算手段と、評価テーブルにリ
ンク先アドレスと、文字列と、計算された評価値とをリ
ンク先アドレスごとに記載する評価テーブル記載手段
と、前記評価テーブルに記載された評価値が最高のリン
ク先アドレスを前記データ取得手段に通知するデータ取
得制御手段と、前記データ取得制御手段の処理を前記評
価テーブルの状況に応じて禁止する禁止手段と、前記評
価テーブルに記載された所定の文字列を選択する選択手
段と、前記選択手段で選択された文字列を表示画面に一
覧表示させる一覧表示制御手段との各手段の機能を発揮
させるプログラムを記録することとしている。このよう
な構成によって、情報検索の効率が向上した情報検索エ
ージェント装置としてコンピュータを利用することがで
きる。
Further, the present invention is a computer-readable recording medium, comprising: an address of an information retrieval agent device for retrieving data specified by a predetermined address on a network or a system; Receiving the notification of, the data acquisition means for acquiring the data specified by the address, the data writing means for writing the data composed of the acquired plural data elements to the storage area, Extracting means for analyzing the data present and extracting a link destination address to other data included in the data element and a character string related to the data specified by the address; and a link destination based on the extracted character string. Calculating means for calculating an evaluation value of selectivity of data specified by an address; a link destination address in an evaluation table; Evaluation table writing means for writing a character string and a calculated evaluation value for each link destination address; and data acquisition control for notifying the data acquisition means of a link destination address having the highest evaluation value described in the evaluation table. Means, prohibition means for prohibiting the processing of the data acquisition control means in accordance with the status of the evaluation table, selection means for selecting a predetermined character string described in the evaluation table, and selection means selected by the selection means. A program for displaying the function of each unit including a list display control unit for displaying a character string in a list on a display screen is recorded. With such a configuration, a computer can be used as an information search agent device with improved information search efficiency.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明に係る情報検索エージェント装置の実施
の形態1の構成図である。
FIG. 1 is a configuration diagram of an information search agent device according to a first embodiment of the present invention.

【図2】上記実施の形態1の通信検索部で取得されたH
TMLテキストの一例を示す図である。
FIG. 2 shows H acquired by a communication search unit according to the first embodiment.
FIG. 3 is a diagram illustrating an example of a TML text.

【図3】上記実施の形態のHTMLテキストにリンクさ
れる画像データの一例を示す図である。
FIG. 3 is a diagram illustrating an example of image data linked to the HTML text according to the embodiment.

【図4】上記実施の形態の表示部に図2に示したHTM
Lテキストを表示させた表示例を示す図である。
FIG. 4 shows the HTM shown in FIG. 2 on the display unit of the above embodiment.
It is a figure showing the example of a display which displayed L text.

【図5】上記実施の形態で用いられるHTMLテキスト
のハイパーリンクの説明図である。
FIG. 5 is an explanatory diagram of a hyperlink of an HTML text used in the embodiment.

【図6】上記実施の形態の分野キーワード記憶部の記憶
内容の一例を示す図である。
FIG. 6 is a diagram illustrating an example of contents stored in a field keyword storage unit according to the embodiment.

【図7】上記実施の形態のトピックキーワード記憶部の
記憶内容の一例を示す図である。
FIG. 7 is a diagram showing an example of contents stored in a topic keyword storage unit according to the embodiment.

【図8】上記実施の形態の検索起点記憶部の記憶内容の
一例を示す図である。
FIG. 8 is a diagram illustrating an example of storage contents of a search start point storage unit according to the embodiment.

【図9】上記実施の形態の学習検索起点記憶部の記憶内
容の一例を示す図である。
FIG. 9 is a diagram illustrating an example of storage contents of a learning search starting point storage unit according to the embodiment.

【図10】上記実施の形態の検索履歴記憶部の記憶内容
の一例を示す図である。
FIG. 10 is a diagram showing an example of contents stored in a search history storage unit according to the embodiment.

【図11】上記実施の形態の関連語辞書の記憶内容の一
例を示す図である。
FIG. 11 is a diagram showing an example of stored contents of a related word dictionary according to the embodiment.

【図12】上記実施の形態のハイパーリンク記憶部の起
動直後の記憶内容の一例を示す図である。
FIG. 12 is a diagram illustrating an example of storage contents immediately after activation of the hyperlink storage unit according to the embodiment.

【図13】上記実施の形態のハイパーリンク記憶部の記
憶内容の一例を示す図である。
FIG. 13 is a diagram illustrating an example of storage contents of a hyperlink storage unit according to the embodiment.

【図14】上記実施の形態のハイパーリンク記憶部の記
憶内容の一例を示す図である。
FIG. 14 is a diagram illustrating an example of storage contents of a hyperlink storage unit according to the embodiment.

【図15】上記実施の形態のハイパーリンク記憶部の記
憶内容の一例を示す図である。
FIG. 15 is a diagram illustrating an example of storage contents of a hyperlink storage unit according to the embodiment.

【図16】上記実施の形態のハイパーリンク記憶部の記
憶内容の一例を示す図である。
FIG. 16 is a diagram illustrating an example of storage contents of a hyperlink storage unit according to the above embodiment.

【図17】上記実施の形態のハイパーリンク記憶部の記
憶内容の一例を示す図である。
FIG. 17 is a diagram illustrating an example of storage contents of a hyperlink storage unit according to the above embodiment.

【図18】上記実施の形態のハイパーリンク記憶部の記
憶内容の一例を示す図である。
FIG. 18 is a diagram illustrating an example of storage contents of a hyperlink storage unit according to the above embodiment.

【図19】上記実施の形態の通信検索部121で新たに
取得されたHTMLテキストを示す図である。
FIG. 19 is a diagram showing HTML text newly acquired by the communication search unit 121 according to the embodiment.

【図20】上記実施の形態のハイパーリンク記憶部の記
憶内容の一例を示す図である。
FIG. 20 is a diagram illustrating an example of storage contents of a hyperlink storage unit according to the above embodiment.

【図21】上記実施の形態のハイパーリンク記憶部の記
憶内容の一例を示す図である。
FIG. 21 is a diagram illustrating an example of storage contents of a hyperlink storage unit according to the above embodiment.

【図22】上記実施の形態のハイパーリンク記憶部の記
憶内容の一例を示す図である。
FIG. 22 is a diagram illustrating an example of storage contents of a hyperlink storage unit according to the above embodiment.

【図23】上記実施の形態のハイパーリンク記憶部の記
憶内容の一例を示す図である。
FIG. 23 is a diagram illustrating an example of storage contents of a hyperlink storage unit according to the above embodiment.

【図24】上記実施の形態のハイパーリンク記憶部の記
憶内容の一例を示す図である。
FIG. 24 is a diagram showing an example of contents stored in a hyperlink storage unit of the embodiment.

【図25】上記実施の形態の通信検索部121で新たに
取得されたHTMLテキストを示す図である。
FIG. 25 is a diagram illustrating an HTML text newly acquired by the communication search unit 121 according to the embodiment.

【図26】上記実施の形態のハイパーリンク記憶部の記
憶内容の一例を示す図である。
FIG. 26 is a diagram illustrating an example of storage contents of a hyperlink storage unit according to the above embodiment.

【図27】上記実施の形態のハイパーリンク記憶部の記
憶内容の一例を示す図である。
FIG. 27 is a diagram illustrating an example of storage contents of a hyperlink storage unit according to the above embodiment.

【図28】上記実施の形態のハイパーリンク記憶部の記
憶内容の一例を示す図である。
FIG. 28 is a diagram illustrating an example of storage contents of a hyperlink storage unit according to the above embodiment.

【図29】上記実施の形態のハイパーリンク記憶部の記
憶内容の一例を示す図である。
FIG. 29 is a diagram illustrating an example of storage contents of a hyperlink storage unit according to the above embodiment.

【図30】上記実施の形態の表示バッファの記憶内容の
一例を示す図である。
FIG. 30 is a diagram showing an example of stored contents of a display buffer according to the embodiment.

【図31】上記実施の形態の表示バッファの記憶内容の
一例を示す図である。
FIG. 31 is a diagram showing an example of stored contents of a display buffer according to the embodiment.

【図32】上記実施の形態の表示バッファの記憶内容の
一例を示す図である。
FIG. 32 is a diagram illustrating an example of storage contents of a display buffer according to the above embodiment.

【図33】上記実施の形態の表示部の表示内容の一例を
示す図である。
FIG. 33 is a diagram illustrating an example of display content of the display unit of the above embodiment.

【図34】上記実施の形態の学習バッファの初期化され
た状態を示す図である。
FIG. 34 is a diagram showing an initialized state of the learning buffer according to the embodiment.

【図35】上記実施の形態の学習バッファの変化した内
容を示す図である。
FIG. 35 is a diagram showing changed contents of the learning buffer according to the embodiment.

【図36】(a)は、上記実施の形態のキーワード学習
部によって抽出されたキーワードを示す図である。
(b)〜(f)は、上記実施の形態のキーワード学習部
によって抽出されたトピックキーワード候補を示す図で
ある。
FIG. 36 (a) is a diagram illustrating keywords extracted by the keyword learning unit of the embodiment.
(B)-(f) is a figure which shows the topic keyword candidate extracted by the keyword learning part of the said embodiment.

【図37】上記実施の形態のトピックキーワード記憶部
の記憶内容の一例を示す図である。
FIG. 37 is a diagram illustrating an example of storage contents of a topic keyword storage unit according to the above embodiment.

【図38】上記実施の形態のトピックキーワード記憶部
の記憶内容の一例を示す図である。
FIG. 38 is a diagram illustrating an example of storage contents of a topic keyword storage unit according to the above embodiment.

【図39】上記実施の形態の学習検索起点記憶部の記憶
内容の一例を示す図である。
FIG. 39 is a diagram showing an example of contents stored in a learning search starting point storage unit of the embodiment.

【図40】上記実施の形態の検索履歴記憶部の記憶内容
の一例を示す図である。
FIG. 40 is a diagram illustrating an example of storage contents of a search history storage unit according to the above embodiment.

【図41】上記実施の形態の情報検索エージェント装置
が起動された際の表示部の表示内容を示す図である。
FIG. 41 is a diagram showing display contents of a display unit when the information search agent device of the embodiment is started.

【図42】上記実施の形態の動作を説明するフローチャ
ートである。
FIG. 42 is a flowchart illustrating the operation of the above embodiment.

【図43】本発明に係る情報検索エージェント装置の実
施の形態2の構成図である。
FIG. 43 is a configuration diagram of an information search agent device according to a second embodiment of the present invention.

【図44】上記実施の形態の検索情報管理部に記憶され
ている記憶内容の一例を示す図である。
FIG. 44 is a diagram showing an example of storage contents stored in a search information management unit of the embodiment.

【図45】上記実施の形態の起動時の表示部の表示内容
の一例を示す図である。
FIG. 45 is a diagram showing an example of display contents of the display unit at the time of startup in the embodiment.

【図46】本発明に係る情報検索エージェント装置の実
施の形態3の構成図である。
FIG. 46 is a configuration diagram of an information search agent device according to a third embodiment of the present invention.

【図47】本発明に係る情報検索エージェント装置の上
記実施の形態の変形例のサイト情報記憶部に記憶されて
いる内容の一例を示す図である。
FIG. 47 is a diagram showing an example of contents stored in a site information storage unit of a modification of the above embodiment of the information search agent device according to the present invention.

【図48】別の変形例のサイト情報記憶部に記憶されて
いる内容の一例を示す図である。
FIG. 48 is a diagram showing an example of contents stored in a site information storage unit of another modification.

【図49】別の変形例の検索参照履歴記憶部に記憶され
ている内容の一例を示す図である。
FIG. 49 is a diagram showing an example of contents stored in a search reference history storage unit of another modification.

【図50】別の変形例の表示部の一覧表示領域に表示さ
れる表示例を示す図である。
FIG. 50 is a diagram showing a display example displayed in a list display area of a display unit of another modification.

【図51】別の変形例の表示部の一覧表示領域に表示さ
れる別の表示例を示す図である。
FIG. 51 is a diagram showing another display example displayed in the list display area of the display unit of another modification.

【図52】従来の情報検索方法を説明するフローチャー
トである。
FIG. 52 is a flowchart illustrating a conventional information search method.

【符号の説明】[Explanation of symbols]

101 入力部 102 通信部 103 検索情報記憶部 104 関連語辞書 105 ハイパーリンク記憶部 106 検索部 107 表示情報作成部 108 学習部 109 表示部 121 通信検索部 122 通信バッファ 131 分野キーワード記憶部 132 トピックキーワード記憶部 133 検索起点記憶部 134 学習検索起点記憶部 135 検索履歴記憶部 161 検索制御部 162 検索初期化部 163 HTMLテキスト取得部 164 HTMLテキスト評価部 165 ハイパーリンク抽出部 166 ハイパーリンク評価部 167 検索終了判定部 168 ハイパーリンク選択部 181 学習制御部 182 学習バッファ 183 キーワード学習部 184 検索起点学習部 185 検索履歴学習部 4301 検索情報管理部 4302 検索情報制御部 4601 一括取得部 4602 Webページ記憶部 101 input unit 102 communication unit 103 search information storage unit 104 related word dictionary 105 hyperlink storage unit 106 search unit 107 display information creation unit 108 learning unit 109 display unit 121 communication search unit 122 communication buffer 131 field keyword storage unit 132 topic keyword storage Unit 133 search start storage unit 134 learning search start storage unit 135 search history storage unit 161 search control unit 162 search initialization unit 163 HTML text acquisition unit 164 HTML text evaluation unit 165 hyperlink extraction unit 166 hyperlink evaluation unit 167 search end determination Unit 168 hyperlink selection unit 181 learning control unit 182 learning buffer 183 keyword learning unit 184 search starting point learning unit 185 search history learning unit 4301 search information management unit 4302 search information control unit 601 batch acquisition section 4602 Web page storage unit

Claims (13)

【特許請求の範囲】[Claims] 【請求項1】 ネットワーク及びシステム上のアドレス
で指定されるデータを検索する情報検索エージェント装
置であって、 アドレスと検索開始の指示とを受けるか又はアドレスの
通知を受けると、当該アドレスで指定されるデータを取
得するデータ取得手段と、 取得された複数のデータ要素からなるデータを記憶する
データ記憶手段と、 前記データ記憶手段に記憶されているデータを解析し、
データ要素に含まれる他のデータへのリンク先アドレス
と当該アドレスに関連する文字列とを抽出する抽出手段
と、 抽出された文字列に基づいてリンク先アドレスで指定さ
れるデータの選択適性の評価値を計算する計算手段と、 評価テーブルに、文字列と、計算された評価値とをリン
ク先アドレスごとに記載する評価テーブル記載手段と、 前記評価テーブルに記載された評価値が最高のリンク先
アドレスを前記データ取得手段に通知するデータ取得制
御手段と、 前記データ取得制御手段の処理を前記評価テーブルの状
況に応じて禁止する禁止手段と、 前記評価テーブルに記載された文字列を選択する選択手
段と、 前記選択手段で選択された文字列を表示画面に一覧表示
させる一覧表示制御手段とを備えることを特徴とする情
報検索エージェント装置。
1. An information retrieval agent device for retrieving data specified by an address on a network and a system, wherein the information retrieval agent device receives an address and a search start instruction or receives a notification of an address. Data acquisition means for acquiring data comprising: a plurality of acquired data elements; a data storage means for storing data comprising a plurality of acquired data elements; analyzing data stored in the data storage means;
Extraction means for extracting a link destination address to other data included in the data element and a character string related to the address, and evaluation of selectivity of data specified by the link destination address based on the extracted character string Calculation means for calculating a value; evaluation table writing means for writing a character string and a calculated evaluation value in an evaluation table for each link destination address; and a link destination having the highest evaluation value described in the evaluation table. Data acquisition control means for notifying the data acquisition means of an address; prohibition means for inhibiting the processing of the data acquisition control means according to the status of the evaluation table; and selection of selecting a character string described in the evaluation table Means, and a list display control means for displaying a list of the character strings selected by the selection means on a display screen. Cement equipment.
【請求項2】 請求項1記載の情報検索エージェント装
置は、更に、 前記表示画面に表示された文字列の選択をユーザから受
け取ると、対応するリンク先アドレスを前記データ取得
手段に通知するデータ取得通知手段と、 前記データ取得通知手段によるアドレスの通知の後、前
記データ記憶手段にデータが記憶されると、前記抽出手
段の処理を禁止して、記憶されているデータを解析し、
表示画面に表示させるデータ表示制御手段とを備えるこ
とを特徴とする情報検索エージェント装置。
2. The information retrieval agent device according to claim 1, further comprising, upon receiving a selection of a character string displayed on said display screen from a user, notifying a corresponding link destination address to said data acquisition means. Notification means, after the notification of the address by the data acquisition notification means, when data is stored in the data storage means, prohibits the processing of the extraction means, analyzes the stored data,
An information retrieval agent device, comprising: data display control means for displaying on a display screen.
【請求項3】 請求項1記載の情報エージェント装置
は、更に、 ユーザからキーワードの入力を受け付けて記憶している
キーワード記憶手段と、 見出し語と、その見出し語に関連する関連語と、その関
連語の見出し語に対する関連度とが登録された関連語辞
書とを備え、 前記文字列は、リンク先アドレスで指定されるデータの
内容を示す文字列であり、文字列には説明文が付されて
いる場合があり、 前記計算手段は、 前記文字列及び説明文に含まれる単語が前記キーワード
記憶手段に記憶されているキーワードと一致するとき、
評価値を大きくするキーワード評価部と、 前記文字列及び説明文に含まれる単語が前記キーワード
記憶手段に記憶されているキーワードを前記関連語辞書
の見出し語とする関連語と一致するとき、その関連度に
応じて評価値を大きくする関連語評価部とを有すること
を特徴とする情報検索エージェント装置。
3. The information agent device according to claim 1, further comprising: keyword storage means for receiving and storing a keyword input from a user; a headword; a related word related to the headword; And a related word dictionary in which the degree of relevance of the word to the headword is registered. The character string is a character string indicating the content of data specified by the link destination address, and a descriptive sentence is attached to the character string. When the words included in the character string and the description match the keywords stored in the keyword storage means,
A keyword evaluation unit for increasing an evaluation value; and when a word included in the character string and the description matches a related word in which a keyword stored in the keyword storage unit is used as a headword of the related word dictionary, An information retrieval agent device comprising: a related word evaluation unit that increases an evaluation value according to a degree.
【請求項4】 請求項3記載の情報検索エージェント装
置は、更に、 前記表示画面に表示された文字列の選択をユーザから受
け付けると、当該文字列を形態素解析し、所定の条件に
より、当該文字列に含まれる単語をトピックキーワード
に決定するトピックキーワード決定手段と、 前記決定されたトピックキーワードを記憶するトピック
キーワード記憶手段とを備え、 前記計算手段は、 前記文字列及び説明文に含まれる単語が前記トピックキ
ーワード記憶手段に記憶されているトピックキーワード
と一致するとき、評価値を大きくするトピックキーワー
ド評価部を有することを特徴とする情報検索エージェン
ト装置。
4. The information retrieval agent device according to claim 3, further comprising, when a selection of a character string displayed on the display screen is received from a user, morphologically analyze the character string and execute the character string according to a predetermined condition. A topic keyword determining unit that determines a word included in the column as a topic keyword; and a topic keyword storing unit that stores the determined topic keyword. The calculating unit determines whether the word included in the character string and the description is An information search agent device comprising a topic keyword evaluation unit for increasing an evaluation value when a topic keyword stored in the topic keyword storage means is matched.
【請求項5】 請求項1記載の情報検索エージェント装
置の前記データ取得制御手段は、 前記評価テーブルに記載されたリンク先アドレスと文字
列とのいずれかに「リンク」又は「link」の文字列
が含まれているか否かを判断する判断部と、 前記判断部で含まれていると判断されたとき、当該リン
ク先アドレスを評価値が最高のリンク先アドレスに優先
して前記データ取得手段に通知する優先通知部とを有す
ることを特徴とする情報検索エージェント装置。
5. The data retrieval control unit of the information search agent device according to claim 1, wherein the character string of “link” or “link” is included in any of the link destination address and the character string described in the evaluation table. And a determining unit that determines whether or not the link destination address is included in the data obtaining unit when the determination unit determines that the link destination address is included in the data obtaining unit in preference to the link destination address having the highest evaluation value. An information retrieval agent device, comprising: a priority notifying unit for notifying.
【請求項6】 請求項1記載の情報検索エージェント装
置は、更に、 前記一覧表示制御手段によって文字列が表示されたと
き、文字列ごとに表示回数を計数する計数手段と、 前記計数手段で計数された表示回数を対応するリンク先
アドレスごとに記憶する検索履歴記憶手段とを備え、 前記選択手段は、 前記検索履歴記憶手段に記憶されている表示回数の多い
リンク先アドレスに対応する文字列を劣後する劣後部を
有することを特徴とする情報検索エージェント装置。
6. The information search agent device according to claim 1, further comprising: a counting unit that counts the number of times of display for each character string when the character string is displayed by the list display control unit; Search history storage means for storing the displayed number of times for each corresponding link destination address, wherein the selecting means stores a character string corresponding to the link destination address having a large number of display times stored in the search history storage means. An information retrieval agent device having a subordinate subordinate part.
【請求項7】 請求項2記載の情報検索エージェント装
置は、更に、 前記データ表示制御手段でデータが表示画面に表示され
ているときに、ユーザから興味の有無に関するボタン操
作を受け付ける受付手段と、 前記受付手段で興味「有」を受け付けたとき選択されて
いる文字列に対応するリンク先アドレスを検索起点とし
て登録する検索起点登録手段と、 前記受付手段で興味「無」を受け付けたとき選択されて
いる文字列に対応するリンク先アドレスが検索起点登録
手段で登録されているとき、その検索起点であるリンク
先アドレスを削除する検索起点削除手段とを備え、 前記データ取得手段は、検索開始の指示を受けたとき、
検索起点登録手段に登録されている当該アドレスで指定
されるデータを取得することを特徴とする情報検索エー
ジェント装置。
7. The information search agent device according to claim 2, further comprising: a reception unit for receiving a button operation regarding whether or not the user is interested when the data is displayed on the display screen by the data display control unit; Search starting point registration means for registering a link destination address corresponding to the character string selected when the reception means receives the interest "yes" as a search starting point; selected when the reception means receives the interest "absence" When the link destination address corresponding to the character string is registered by the search start point registration means, the search start point deletion means for deleting the link destination address which is the search start point; When receiving instructions,
An information search agent device for acquiring data specified by the address registered in search start point registration means.
【請求項8】 請求項4記載の情報検索エージェント装
置は、更に、 前記トピックキーワード記憶手段に記憶されているトピ
ックキーワードには、重要度が付されており、 前記データ表示制御手段でデータが表示画面に表示され
ているときに、ユーザから興味の有無に関するボタン操
作を受け付ける受付手段を備え、 前記トピックキーワード決定手段は、前記受付手段で興
味「有」を受け付けたとき、対応する文字列から決定さ
れたトピックキーワードの重要度を高くし、興味「無」
を受け付けたとき、対応する文字列から決定されたトピ
ックキーワードの重要度を低くする重要度評価部を有
し、 前記トピックキーワード評価部は、この重要度を考慮す
ることを特徴とする情報検索エージェント装置。
8. The information search agent device according to claim 4, further comprising: a topic keyword stored in the topic keyword storage unit is assigned a degree of importance; and the data display control unit displays data. A receiving unit that receives a button operation related to the presence or absence of interest from the user when displayed on the screen, wherein the topic keyword determining unit determines from the corresponding character string when the receiving unit receives the interest “present” Topic keywords that have increased importance and interest “nothing”
Has an importance evaluation unit for lowering the importance of a topic keyword determined from a corresponding character string, wherein the topic keyword evaluation unit considers this importance. apparatus.
【請求項9】 請求項4記載の情報検索エージェント装
置は、更に、 データ内容の分野別に名前を付し、検索開始時のアドレ
スと、キーワードと、トピックキーワードと、前記一覧
表示制御手段での表示履歴とを含む検索情報を記憶する
検索情報記憶手段と、 検索終了時に前記検索情報を更新する検索情報更新手段
とを備え、 前記一覧表示制御手段は、ユーザから検索開始の指示を
受けると、前記名前を表示画面に一覧表示させる初期表
示部を有し、 前記データ取得制御手段は、 前記名前の選択を受けると、対応する検索開始時のアド
レスを前記データ取得手段に通知する初期通知部を有す
ることを特徴とする情報検索エージェント装置。
9. The information search agent device according to claim 4, further comprising: assigning a name to each field of data content, and displaying an address at the start of the search, a keyword, a topic keyword, and the list display control means. A search information storage unit that stores search information including a history, and a search information update unit that updates the search information at the end of the search, wherein the list display control unit receives a search start instruction from a user, An initial display unit for displaying a list of names on a display screen, the data acquisition control unit having an initial notification unit for notifying the data acquisition unit of an address at the start of a search when the selection of the name is received; An information retrieval agent device characterized in that:
【請求項10】 請求項1記載の情報検索エージェント
装置の前記計算手段は、 前記データ取得手段がデータを取得するのに要した時間
を計時し、取得したデータ量とから送信速度を計算する
送信速度計算部と、 前記送信速度計算部で計算された送信速度を同一サイト
のアドレスごとに記憶する送信速度記憶部と、 送信速度の速いサイトの評価値を大きくする送信速度評
価部とを有することを特徴とする情報検索エージェント
装置。
10. The transmission unit according to claim 1, wherein the calculation unit of the information search agent device measures a time required for the data acquisition unit to acquire data, and calculates a transmission speed from the acquired data amount. A speed calculation unit; a transmission speed storage unit that stores the transmission speed calculated by the transmission speed calculation unit for each address of the same site; and a transmission speed evaluation unit that increases the evaluation value of a site with a high transmission speed. An information retrieval agent device characterized by the following.
【請求項11】 請求項2記載の情報検索エージェント
装置の前記計算手段は、 前記データ表示制御手段でデータが表示画面に表示され
たとき、その表示回数を計数するデータ表示回数計数部
と、 計数された表示回数を同一サイトのアドレス毎に記憶す
るデータ表示回数記憶部と、 前記データ表示回数の多いサイトの評価値を大きくする
表示回数評価部とを有することを特徴とする情報検索エ
ージェント装置。
11. The data search number counting unit for counting the number of display times when data is displayed on a display screen by the data display control means, wherein the calculation means of the information search agent device according to claim 2 comprises: An information search agent device, comprising: a data display count storage unit that stores the displayed display count for each address of the same site; and a display count evaluation unit that increases an evaluation value of a site having a large data display count.
【請求項12】 ネットワークやシステム上の所定のア
ドレスで指定されるデータを検索する情報検索エージェ
ント装置であって、 アドレスと検索開始の指示とを又はアドレスの通知を受
けると、当該アドレスで指定されるデータを取得するデ
ータ取得手段と、 取得された複数のデータ要素からなるデータを記憶する
データ記憶手段と、 前記データ記憶手段に記憶されているデータを解析し、
データ要素に含まれる他のデータへのリンク先アドレス
と当該アドレスで指定されるデータに関連する文字列と
を抽出する抽出手段と、 抽出された文字列に基づいてリンク先アドレスで指定さ
れるデータの選択適性の評価値を計算する計算手段と、 評価テーブルにリンク先アドレスと、文字列と、計算さ
れた評価値とをリンク先アドレスごとに記載する評価テ
ーブル記載手段と、 前記評価テーブルに記載された評価値が最高のリンク先
アドレスを前記データ取得手段に通知するデータ取得制
御手段と、 前記データ取得制御手段の処理を前記評価テーブルの状
況に応じて禁止する禁止手段と、 前記評価テーブルに記載された所定の文字列を選択する
選択手段と、 前記選択手段で選択された文字列に対応するリンク先ア
ドレスで指定されるデータを順次取得する一括データ取
得手段と、 前記一括データ取得手段で取得されたデータを記憶する
一括データ記憶手段とを備えることを特徴とする情報検
索エージェント装置。
12. An information retrieval agent device for retrieving data specified by a predetermined address on a network or a system, wherein when receiving an address and a search start instruction or a notification of an address, the information retrieval agent device specifies the address. Data acquisition means for acquiring data comprising: a plurality of acquired data elements; a data storage means for storing data comprising a plurality of acquired data elements; analyzing data stored in the data storage means;
Extracting means for extracting a link destination address to other data included in the data element and a character string related to the data specified by the address; and data specified by the link destination address based on the extracted character string Calculating means for calculating an evaluation value of selectivity of the evaluation table; evaluation table writing means for writing a link destination address, a character string, and a calculated evaluation value in the evaluation table for each link destination address; A data acquisition control unit for notifying the data acquisition unit of a link destination address having the highest evaluated value, a prohibition unit for inhibiting a process of the data acquisition control unit in accordance with a status of the evaluation table, Selecting means for selecting the described predetermined character string; and data designated by a link destination address corresponding to the character string selected by the selecting means. And bulk data acquisition means for sequentially acquiring the data, information retrieval agent device, characterized in that it comprises a bulk data storage means for storing the data acquired by the batch data acquisition means.
【請求項13】コンピュータ読み取り可能な記録媒体で
あって、 ネットワークやシステム上の所定のアドレスで指定され
るデータを検索する情報検索エージェント装置の、 アドレスと検索開始の指示とを又はアドレスの通知を受
けると、当該アドレスで指定されるデータを取得するデ
ータ取得手段と、 取得された複数のデータ要素からなるデータを記憶領域
に書き込むデータ書込手段と、 前記データ記憶領域に記憶されているデータを解析し、
データ要素に含まれる他のデータへのリンク先アドレス
と当該アドレスで指定されるデータに関連する文字列と
を抽出する抽出手段と、 抽出された文字列に基づいてリンク先アドレスで指定さ
れるデータの選択適性の評価値を計算する計算手段と、 評価テーブルにリンク先アドレスと、文字列と、計算さ
れた評価値とをリンク先アドレスごとに記載する評価テ
ーブル記載手段と、 前記評価テーブルに記載された評価値が最高のリンク先
アドレスを前記データ取得手段に通知するデータ取得制
御手段と、 前記データ取得制御手段の処理を前記評価テーブルの状
況に応じて禁止する禁止手段と、 前記評価テーブルに記載された所定の文字列を選択する
選択手段と、 前記選択手段で選択された文字列を表示画面に一覧表示
させる一覧表示制御手段との各手段の機能を発揮させる
プログラムを記録したコンピュータ読み取り可能な記録
媒体。
13. A computer-readable recording medium for transmitting an address and a search start instruction or a notification of an address of an information search agent device for searching data specified by a predetermined address on a network or a system. Upon receiving the data, data acquisition means for acquiring data specified by the address, data writing means for writing data comprising the acquired plurality of data elements to a storage area, and data stored in the data storage area Analyze,
Extracting means for extracting a link destination address to other data included in the data element and a character string related to the data specified by the address; and data specified by the link destination address based on the extracted character string Calculating means for calculating an evaluation value of selectivity of the evaluation table; evaluation table writing means for writing a link destination address, a character string, and a calculated evaluation value in the evaluation table for each link destination address; A data acquisition control unit for notifying the data acquisition unit of a link destination address having the highest evaluated value, a prohibition unit for inhibiting a process of the data acquisition control unit in accordance with a status of the evaluation table, Selecting means for selecting the described predetermined character string; and a list display control means for displaying a list of the character strings selected by the selecting means on a display screen. Computer readable recording medium recording a program to perform the function of each means of the.
JP10260686A 1998-09-14 1998-09-14 Information retrieval agent device, and computer- readable recording medium recorded with program exhibiting function of information retrieval agent device Pending JP2000090111A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10260686A JP2000090111A (en) 1998-09-14 1998-09-14 Information retrieval agent device, and computer- readable recording medium recorded with program exhibiting function of information retrieval agent device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10260686A JP2000090111A (en) 1998-09-14 1998-09-14 Information retrieval agent device, and computer- readable recording medium recorded with program exhibiting function of information retrieval agent device

Publications (1)

Publication Number Publication Date
JP2000090111A true JP2000090111A (en) 2000-03-31

Family

ID=17351375

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10260686A Pending JP2000090111A (en) 1998-09-14 1998-09-14 Information retrieval agent device, and computer- readable recording medium recorded with program exhibiting function of information retrieval agent device

Country Status (1)

Country Link
JP (1) JP2000090111A (en)

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001337708A (en) * 2000-05-30 2001-12-07 Nec Corp Control system for production equipment and method of control
JP2001344269A (en) * 2000-05-31 2001-12-14 Penta Ocean Constr Co Ltd Method and system for providing information of commodity or service
JP2001350756A (en) * 2000-06-05 2001-12-21 Taito Corp Browsing assist device, server device and recording medium having browsing assist program recorded thereon
JP2002007454A (en) * 2000-06-16 2002-01-11 Nec Commun Syst Ltd Portal site providing method and portal site providing terminal
WO2002023397A1 (en) * 2000-09-11 2002-03-21 Sony Corporation Agent system, information providing method and information providing device and data recording medium
JP2002109085A (en) * 2000-09-28 2002-04-12 Uniden Corp Published information deletion request agent system and method
JP2002163276A (en) * 2000-11-27 2002-06-07 Nec Corp Document summarizing system and document summarizing method
JP2003016107A (en) * 2001-06-27 2003-01-17 Sharp Corp Device, method and program for retrieving information and recording medium with stored information retrieval program
JP2006235729A (en) * 2005-02-22 2006-09-07 Mitsubishi Electric Corp Alternative web information collecting device
US7136849B2 (en) 2001-08-10 2006-11-14 International Business Machines Corporation Method systems and computer program products for indicating links to external URLs
JP2006338313A (en) * 2005-06-01 2006-12-14 Nippon Telegr & Teleph Corp <Ntt> Similar image retrieving method, similar image retrieving system, similar image retrieving program, and recording medium
JP2007004779A (en) * 2005-05-26 2007-01-11 Tokyo Electric Power Co Inc:The Information processing method regarding link generation, link importance and similar document, and its device
US7203673B2 (en) 2000-12-27 2007-04-10 Fujitsu Limited Document collection apparatus and method for specific use, and storage medium storing program used to direct computer to collect documents
KR100779978B1 (en) * 2000-09-12 2007-11-27 소니 가부시끼 가이샤 Infomation providing system, information providing apparatus and information providing method and data recording medium
JP2009003928A (en) * 2007-06-22 2009-01-08 Fuji Xerox Co Ltd Search result presentation method, program for attaining function of presenting search result, search result presentation system
WO2009035102A1 (en) * 2007-09-13 2009-03-19 Ntt Docomo Inc. Information retrieval system and information retrieval method
JP2009116422A (en) * 2007-11-02 2009-05-28 Yahoo Japan Corp Query extraction method, query extractor, and query extraction program
JP2010086210A (en) * 2008-09-30 2010-04-15 Yahoo Japan Corp Retrieval method, program, and server for preferentially displaying page corresponding to amount of information
JP2010186474A (en) * 2009-02-12 2010-08-26 Nhn Corp Retrieval modeling system using association degree dictionary and method
CN103927325A (en) * 2014-03-13 2014-07-16 中国联合网络通信集团有限公司 URL (uniform resource locator) classifying method and device
JP2016115229A (en) * 2014-12-17 2016-06-23 株式会社富士通コンピュータテクノロジーズ Character recognition support program, character recognition support method and character recognition support device
CN106294587A (en) * 2016-07-28 2017-01-04 焦点科技股份有限公司 Special topic module drainage effect methods of exhibiting in the website of a kind of Rapid Implementation

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001337708A (en) * 2000-05-30 2001-12-07 Nec Corp Control system for production equipment and method of control
JP2001344269A (en) * 2000-05-31 2001-12-14 Penta Ocean Constr Co Ltd Method and system for providing information of commodity or service
JP2001350756A (en) * 2000-06-05 2001-12-21 Taito Corp Browsing assist device, server device and recording medium having browsing assist program recorded thereon
JP2002007454A (en) * 2000-06-16 2002-01-11 Nec Commun Syst Ltd Portal site providing method and portal site providing terminal
WO2002023397A1 (en) * 2000-09-11 2002-03-21 Sony Corporation Agent system, information providing method and information providing device and data recording medium
KR100748027B1 (en) * 2000-09-11 2007-08-09 소니 가부시끼 가이샤 Agent System, Information Providing Method and Information Providing Device and Data Recording Medium
KR100779978B1 (en) * 2000-09-12 2007-11-27 소니 가부시끼 가이샤 Infomation providing system, information providing apparatus and information providing method and data recording medium
JP2002109085A (en) * 2000-09-28 2002-04-12 Uniden Corp Published information deletion request agent system and method
JP2002163276A (en) * 2000-11-27 2002-06-07 Nec Corp Document summarizing system and document summarizing method
JP4649731B2 (en) * 2000-11-27 2011-03-16 日本電気株式会社 Document summarization system and document summarization method
US7203673B2 (en) 2000-12-27 2007-04-10 Fujitsu Limited Document collection apparatus and method for specific use, and storage medium storing program used to direct computer to collect documents
JP2003016107A (en) * 2001-06-27 2003-01-17 Sharp Corp Device, method and program for retrieving information and recording medium with stored information retrieval program
US7136849B2 (en) 2001-08-10 2006-11-14 International Business Machines Corporation Method systems and computer program products for indicating links to external URLs
JP4718205B2 (en) * 2005-02-22 2011-07-06 三菱電機株式会社 Selective Web information collection device
JP2006235729A (en) * 2005-02-22 2006-09-07 Mitsubishi Electric Corp Alternative web information collecting device
JP2007004779A (en) * 2005-05-26 2007-01-11 Tokyo Electric Power Co Inc:The Information processing method regarding link generation, link importance and similar document, and its device
JP2006338313A (en) * 2005-06-01 2006-12-14 Nippon Telegr & Teleph Corp <Ntt> Similar image retrieving method, similar image retrieving system, similar image retrieving program, and recording medium
JP4545641B2 (en) * 2005-06-01 2010-09-15 日本電信電話株式会社 Similar image retrieval method, similar image retrieval system, similar image retrieval program, and recording medium
JP2009003928A (en) * 2007-06-22 2009-01-08 Fuji Xerox Co Ltd Search result presentation method, program for attaining function of presenting search result, search result presentation system
WO2009035102A1 (en) * 2007-09-13 2009-03-19 Ntt Docomo Inc. Information retrieval system and information retrieval method
JP2009116422A (en) * 2007-11-02 2009-05-28 Yahoo Japan Corp Query extraction method, query extractor, and query extraction program
JP2010086210A (en) * 2008-09-30 2010-04-15 Yahoo Japan Corp Retrieval method, program, and server for preferentially displaying page corresponding to amount of information
JP2010186474A (en) * 2009-02-12 2010-08-26 Nhn Corp Retrieval modeling system using association degree dictionary and method
CN103927325A (en) * 2014-03-13 2014-07-16 中国联合网络通信集团有限公司 URL (uniform resource locator) classifying method and device
JP2016115229A (en) * 2014-12-17 2016-06-23 株式会社富士通コンピュータテクノロジーズ Character recognition support program, character recognition support method and character recognition support device
CN106294587A (en) * 2016-07-28 2017-01-04 焦点科技股份有限公司 Special topic module drainage effect methods of exhibiting in the website of a kind of Rapid Implementation
CN106294587B (en) * 2016-07-28 2019-05-10 焦点科技股份有限公司 Thematic module drainage effect methods of exhibiting in a kind of website of Rapid Implementation

Similar Documents

Publication Publication Date Title
JP2000090111A (en) Information retrieval agent device, and computer- readable recording medium recorded with program exhibiting function of information retrieval agent device
US9275106B2 (en) Dynamic search box for web browser
US9292578B2 (en) Relevancy sorting of user&#39;s browser history
US8868539B2 (en) Search equalizer
US7475074B2 (en) Web search system and method thereof
JP5740029B2 (en) System and method for improving interactive search queries
US8065145B2 (en) Keyword outputting apparatus and method
US8666962B2 (en) Speculative search result on a not-yet-submitted search query
KR101065071B1 (en) Expanded snippets
CN101061479B (en) Presentation of search results based on document structure
KR100672277B1 (en) Personalized Search Method Using Cookie Information And System For Enabling The Method
US20060248078A1 (en) Search engine with suggestion tool and method of using same
US20140222796A1 (en) Methods and apparatus for facilitating delivery of a service associated with a product
EP2199929A1 (en) Search system having user-interface for searching online information
JP2004280661A (en) Retrieval method and program
US20050114317A1 (en) Ordering of web search results
JP2002230037A (en) Retrieval system, retrieval method and program
JP2017117021A (en) Keyword extraction device, content generation system, keyword extraction method, and program
JP2002215660A (en) Retrieval system and software used for the same
JP5068304B2 (en) Extraction apparatus, method and program
JP6228425B2 (en) Advertisement generation apparatus and advertisement generation method
JPH11345245A (en) Data input device
JP2012014741A (en) Web page retrieval system