JPH117449A - ハイパーテキスト情報収集方法 - Google Patents

ハイパーテキスト情報収集方法

Info

Publication number
JPH117449A
JPH117449A JP9158302A JP15830297A JPH117449A JP H117449 A JPH117449 A JP H117449A JP 9158302 A JP9158302 A JP 9158302A JP 15830297 A JP15830297 A JP 15830297A JP H117449 A JPH117449 A JP H117449A
Authority
JP
Japan
Prior art keywords
information
address
hypertext
user
hypertext information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9158302A
Other languages
English (en)
Inventor
Takaaki Yamada
隆亮 山田
Hiroyuki Kojima
弘行 小嶋
Toshiyuki Yuasa
俊之 湯浅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP9158302A priority Critical patent/JPH117449A/ja
Publication of JPH117449A publication Critical patent/JPH117449A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

(57)【要約】 【課題】大量のコンテンツを廃棄するだけのインターネ
ットロボットでは、コンテンツがなかなか送られてこな
いで苛々しているユーザのブラウザシステム側のニーズ
を満たせない。 【解決手段】本発明によると、ハイパーテキスト情報収
集装置を持つサービス提供者に対して、ユーザが要望を
入力すると、サービス提供者が集めたコンテンツをユー
ザの要望に応じて選択的に記憶媒体に格納して、送り返
してもらうことができる。記憶媒体として比較的遅いC
D−ROMを用いても、情報転送速度は600KB/s程度は
期待できる。通信回線の20KB/sと比べ、格段に応答性能
が向上する。また、通信エラーで途切れることもない。
携帯することも可能であり、自由なときに媒体内に格納
されたハイパーテキスト情報を参照できる。加えて、サ
ービス提供者にとっても、本来破棄するだけだったコン
テンツデータを活用でき、システム資源の利用効率が高
まる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ハイパーテキスト
システムに関する。
【0002】
【従来の技術】ハイパーテキストシステムの場合、リン
クにより情報が関係つけられているので、順番にリンク
をたどっていかないと、次の情報が得られない。
【0003】WWW(World Wide Web)のような世界規模
の分散ハイパーテキストシステムにおいて、WWWのコ
ンテンツをブラウザで参照するユーザにとっては、通信
回線を通してリンクをたどるようなWWWの仕組みは、
多くのノードをたどろうとすると、非常に時間がかかっ
ていた。その大半は通信時間であった。ユーザがコンテ
ンツを参照する動機が、情報収集の場合、ユーザはブラ
ウザを装備した計算機の前で、コンテンツが表示される
まで待つしかなかった。「USP 5572643: Wed browser wi
th dynamic display of information objects during l
inking]では、この待ち時間を利用して、広告等を表示
する機能を提供していたが、ユーザに必要な情報ではな
く、ユーザにとって本質的な解決にはならなかった。
【0004】一方、「Fah-Chun Cheong: "Internet Agen
ts", New Riders,1996」にあるように、インターネット
ロボットは、初期値として与えられたノードのアドレス
(URL:uniform resource locator)から再帰的にリ
ンクをたどり、ネットワークを介して関係付けられたノ
ードの情報を収集し、自動的に各URLの索引を生成す
るシステムがあった。すなわち、各ノードの情報を解釈
し、URLとキーワードの表を生成する機能を提供して
いた。この表を元に、情報検索機能を提供することがで
きる。すなわち、キーワードを入力すると、関連するコ
ンテンツのURLを検索するような機能が実現できる。
しかしながら、インターネットロボット場合、せっかく
収集したコンテンツ自体は、通常その表が生成された後
に破棄されていた。ディスク装置の容量に限界があり、
コンテンツを保持しておく意味はなかったからである。
【0005】問題は、インターネットロボットを動かす
と、通常大規模な索引ができあがるので、そのシステム
を構成するディスクやメモリなどの資源が大量に必要と
なることと、通信回線の遅さなどの理由から、表の生成
までに数日間から数週間かかっていた。
【0006】
【発明が解決しようとする課題】大量のコンテンツを廃
棄するだけのインターネットロボットでは、コンテンツ
がなかなか送られてこないで苛々しているユーザのブラ
ウザシステム側のニーズを満たせない。本発明の目的
は、ユーザをブラウザを備えた計算機の前に束縛するこ
となく、時空間の束縛から離れたハイパーテキストシス
テムを提供することにある。
【0007】用いる技術は異なるが、例えば家庭用映像
記録用のVTR装置も、似た効果を生む。TVで番組を
見ようとすると、TVの前にユーザが束縛される。しか
しVTRの場合、テープを一時停止させて、別の時間に
再度続きをみたり、同じ放映シーンを何度も見ることが
できるという点で時間の束縛から開放されたといえる。
携帯用VTR装置の場合、空間的にもユーザの束縛を開
放した。しかしながら、当然既存のVTR装置ではハイ
パーテキスト情報を参照できない。
【0008】
【課題を解決するための手段】本発明の望ましい実施形
態においては、ハイパーテキスト情報収集装置は、ユー
ザの要望を入力する受付手段と、情報収集手段と、集め
たコンテンツを選択的に記憶媒体に格納する格納手段
と、記憶媒体とユーザ情報を管理する管理手段とを具備
した計算機システムとから構成される。上記目的は、入
力されたユーザの要望に応じて、本来破棄していたコン
テンツを選択的に格納した記憶媒体をユーザに送り届け
ることにより、達成される。
【0009】
【発明の実施の形態】本発明の望ましい実施形態の例を
図を用いて詳細に説明する。
【0010】図1は、ハイパーテキスト情報収集方法全
体のシステム構成図である。
【0011】ハイパーテキスト情報は、ネットワーク接
続された複数のサーバ1に、分散配置する。1つのサー
バ1内のあるノードは、いくつかの別のノードとリンク
により関係付けてある。1つのノードは一意的なアドレ
ス(URL)により指定できるようにする。複数のノー
ドからなるハイパーテキスト情報を、一元的にアクセス
できるプロクシ2は従来技術によって実現可能である。
【0012】本実施例におけるハイパーテキスト情報収
集装置3は、収集系統(通信手段4、解釈手段5、索引
生成手段6)、格納系統(受付手段7、管理手段8、格
納手段9)、インデックステーブル10、テンポラリフ
ァイル格納場所11を具備した計算機システムから構成
される。
【0013】インデックステーブル10は、ノードやリ
ンクの管理に用いるが、インデックステーブルの詳細に
ついては、図2を用いて、後で詳細に説明を加える。
【0014】収集系統の処理により、収集したハイパー
テキスト情報をユーザの要望に応じて、格納系統により
記憶媒体12に格納する。ユーザの元に記憶媒体12を
配送し、ユーザは記憶媒体12を自分のプロクシ13に
つないで利用する。ブラウザ14はハイパーテキスト情
報を表示できる。プロクシ13はユーザからアドレスの
入力があったとき、格納媒体12内に該当するノードが
存在すれば、格納媒体12内の情報を読み出してユーザ
に送り、ノードが存在しなければ、通信回線14を介し
て、指定されたアドレスの情報をサーバ1から読み込
み、ユーザに転送する。
【0015】図2は、インデックステーブルのレコード
の構成例である。
【0016】インデックステーブル21は、NO22,
URL23,KEY24,LINK25,FLAG2
6,VAL27の5つのフィールドから構成し、それぞ
れ、番号、アドレス、キーワード、リンク、訪問済みフ
ラグ、優先順位の情報を格納するために用いる。
【0017】図2を用いて、ユーザの要望の中に、「mon
ey」というキーワードがあった場合の「VAL」欄27
の計算方法を示す。「NO」欄22が2と4のレコード
を検索し、それぞれの「VAL」欄27に2を加える。
更に、その「LINK」欄25のリンク先を調べ、リン
ク先の「NO」に該当する1と4のレコードの「VA
L」欄に1を加える。その結果、「VAL」欄27は、
ユーザの要望に応じた優先順位を付けることができる。
優先順位をつける処理と他の処理との関わりは、後に図
を用いて詳細に説明する。
【0018】ハイパーテキスト情報収集装置における情
報の処理方法は、大きくは2系統(収集、格納)あり、
始めに図3を用いて収集系統の処理方法を以下に示す。
【0019】ステップ31において、インデックステー
ブルからFALG欄が未訪問になっているレコードを読
み込む。
【0020】ステップ32において、通信手段は、イン
デックステーブルのURL欄の内容に基づいて、そのア
ドレスの示す1つのノードの情報を取得する。
【0021】ステップ33において、取得した情報を、
テンポラリファイル格納場所に一時保存する。
【0022】ステップ34において、解釈手段は、格納
したテンポラリファイルを開き、ノード内の情報を解釈
することにより、上記アドレスで指定されたノードが、
どのノードと関係付けられているか(リンク)と、その
ノードを特徴づけるキーワードを読取る。
【0023】ステップ35において、索引生成手段は、
インデックステーブルを調べ、アドレスが新しいもので
あれば、URL、リンク、キーワードを1つのレコード
として、NO欄用に一意的な番号を生成し、新たにイン
デックステーブルに格納する。VAL欄は初期値として
「0」、FALG欄は未訪問としておく。また、取得し
たノードのFALG欄、すなわち訪問済みフラグを訪問
済みに更新する。
【0024】ステップ36において、インデックステー
ブルの次のレコードを調べ、まだ取得していない(未訪
問)ものであれば、そのアドレスによりステップ1以降
の処理を繰り返す。既に取得済みのものであれば、更に
次のレコードを調べる。
【0025】次に、格納系統の処理方法を図4を用いて
以下で説明する。
【0026】ステップ41において、ユーザが要望をキ
ーワードの形で入力する。ステップ42において、受付
手段は、キーワードとして受け取り、インデックステー
ブルを検索し、該当するキーワードをもつレコードに対
して、VAL欄に、1次マークとして「2」を加える。
またLINK欄を参照し、そのアドレスからリンクされ
ている別のレコードがあれば、そのレコードには、2次
マークとして「1」を加える。この処理により、ある1
つのレコードのVAL欄は、ユーザの要望に近いもの程
大きな数字となる。ステップ43において、管理手段
は、まず、インデックステーブルをVAL欄の大きなも
の順にソートして、優先順位を決定しておく。次に管理
手段は、現在取得してきたノードが所定の優先順位内
(ここでは、数字の大きなもの順で100個とする)で
あるかどうかを確認し、格納手段に指示を送る。ステッ
プ44において、格納手段は、テンポラリファイル格納
場所から、指定されたノードの情報を取得し、記憶媒体
に格納する。ステップ45において、所定の優先順位の
ノードを全て格納し終えているかどうかの確認を行い、
まだ残りがあるなら、ステップ44に戻って処理を繰り
返す。なお、格納手段において、複数のユーザの要望に
応じて、記憶媒体ごとにユーザ要望に沿った情報を振り
分けて格納する機能も、容易に拡張できる。
【0027】所定の優先順位のノードの情報を格納した
後は、記憶媒体をハイパーテキスト情報収集装置から外
し、ユーザのプロクシに接続する。この後のユーザ側の
プロクシでの処理について図5を用いて説明する。
【0028】ステップ51において、ユーザの希望する
アドレスを受け取る。ステップ52において、そのアド
レスに該当するノードの情報を格納したファイルが記憶
媒体内にあるかどうかを確認する。記憶媒体内にあれ
ば、ステップ53において、そのファイルを読み出す。
なければステップ54において、通信回線を介して、そ
のアドレスのサーバから取得する。ステップ55におい
て、読み出したファイルの情報をユーザに転送して返
す。
【0029】
【発明の効果】この一連の処理により、ユーザから見る
と、通常通りハイパーテキスト情報にアクセスしている
ようにみえる一方、ユーザが興味を持つ大半の情報を通
信回線を通さずに、記憶媒体から高速に読み出すことが
できる。ハイパーテキスト情報を利用するユーザにとっ
て、操作性、利便性が大幅に向上する。
【図面の簡単な説明】
【図1】本実施例の全体システム構成図である。
【図2】情報の収集、格納の戦略に関わるインデックス
テーブルの例である。
【図3】情報収集時における各機能ブロックの処理フロ
ーである。
【図4】情報格納時における各機能ブロックの処理フロ
ーである。
【図5】ユーザが利用するときのプロクシでの処理フロ
ーである。
【符号の説明】
1…サーバ、2…プロクシ、14…ブラウザ、10…イ
ンデックステーブル。

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】ノード同士をリンクによって関係付け、該
    リンクに基づいて、あるノードに続いて関連するノード
    を参照可能なハイパーテキストシステムに対して、1つ
    以上のリンクをたどりながら1つ以上のノードの情報を
    収集するハイパーテキスト情報収集方法であり、ハイパ
    ーテキスト情報収集手段と、ハイパーテキスト情報格納
    手段と、インデックステーブルを具備し、該ハイパーテ
    キスト情報収集手段は、通信手段と解釈手段と、索引生
    成手段を具備し、ハイパーテキスト情報を選択的に収集
    する機能を具備し、該ハイパーテキスト情報格納手段
    は、受付手段、管理手段、格納手段を具備し、ユーザの
    要望に応じてハイパーテキスト情報を記憶媒体に格納す
    る機能を具備し、ユーザからあるノードのアドレスの入
    力があったとき、該記憶媒体内に格納されたノードの情
    報を転送することを特徴としたハイパーテキスト情報収
    集方法。
  2. 【請求項2】特許請求項1のハイパーテキスト情報収集
    方法において、インデックステーブルは、番号、アドレ
    ス、キーワード、リンク、訪問済フラグ、要望度合のフ
    ィールドを具備したことを特徴としたハイパーテキスト
    情報収集方法。
  3. 【請求項3】特許請求項1のハイパーテキスト情報収集
    方法において、解釈手段が、ハイパーテキスト情報から
    アドレス、キーワード、リンクを生成し、索引生成手段
    が、番号と訪問済フラグ、要望度合のフィールドデータ
    初期値を含めたレコードを生成し、通信手段は、訪問済
    フラグが未訪問になっているノードのアドレスの情報を
    取得し、テンポラリファイルを作成することを特徴とし
    たハイパーテキスト情報収集方法。
  4. 【請求項4】特許請求項1のハイパーテキスト情報収集
    方法において、受付手段は、ユーザからキーワードを受
    取り、インデックステーブルのキーワードフィールドを
    検索し、該キーワードの存在するレコードにおいて、要
    望度合のフィールドのデータを更新し、該キーワードの
    存在するレコードのリンクフィールドに記載されたリン
    ク先のアドレスのレコードにおいて、要望度合のフィー
    ルドのデータを更新し、管理手段は、インデックステー
    ブルを要望度合のフィールドをキーにして並び替え、ユ
    ーザの要望する度合いを各アドレスごとに算出し、格納
    手段は、該度合いの高いアドレスの情報について、特許
    請求項1のハイパーテキスト情報収集方法で作成したテ
    ンポラリファイルを記憶媒体に格納することを特徴とし
    たハイパーテキスト情報収集方法。
  5. 【請求項5】特許請求項1のハイパーテキスト情報収集
    方法において、記憶媒体をプロクシに接続し、ユーザか
    らあるノードのアドレスの入力があったとき、該記憶媒
    体内に格納されたノードの情報を転送する該プロクシを
    具備したことを特徴としたハイパーテキスト情報収集方
    法。
  6. 【請求項6】特許請求項5のハイパーテキスト情報収集
    方法において、記憶媒体をプロクシに接続し、ユーザか
    らあるノードのアドレスの入力があったとき、該記憶媒
    体内に格納されたノードの情報に該アドレスに相当する
    情報がない場合、通信回線を介して該アドレスの情報を
    取得し、ユーザに該情報を転送する該プロクシを具備し
    たことを特徴としたハイパーテキスト情報収集方法。
  7. 【請求項7】特許請求項1のハイパーテキスト情報収集
    方法において、受付手段は、ユーザからアドレスを受取
    り、インデックステーブルのアドレスフィールドを検索
    し、該アドレスの存在するレコードにおいて、要望度合
    のフィールドのデータを更新し、該アドレスの存在する
    レコードのリンクフィールドに記載されたリンク先のア
    ドレスのレコードにおいて、要望度合のフィールドのデ
    ータを更新し、管理手段は、インデックステーブルを要
    望度合のフィールドをキーにして並び替え、ユーザの要
    望する度合いを各アドレスごとに算出し、格納手段は、
    該度合いの高いアドレスの情報について、特許請求項1
    のハイパーテキスト情報収集方法で作成したテンポラリ
    ファイルを記憶媒体に格納することを特徴としたハイパ
    ーテキスト情報収集方法。
  8. 【請求項8】特許請求項1のハイパーテキスト情報収集
    方法において、要望度合に基づいて、インデックステー
    ブルとテンポラリファイルを選択的に記憶媒体に格納す
    ることを特徴としたハイパーテキスト情報収集方法。
  9. 【請求項9】特許請求項1のハイパーテキスト情報収集
    方法において、要望度合に基づいて、インデックステー
    ブルとテンポラリファイルを選択的に格納した記憶媒体
    を特徴としたハイパーテキスト情報収集方法。
  10. 【請求項10】特許請求項1のハイパーテキスト情報収
    集方法において、ハイパーテキスト情報を格納した記憶
    媒体をユーザの指定するプロクシに移動させることを特
    徴としたハイパーテキスト情報収集方法。
JP9158302A 1997-06-16 1997-06-16 ハイパーテキスト情報収集方法 Pending JPH117449A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9158302A JPH117449A (ja) 1997-06-16 1997-06-16 ハイパーテキスト情報収集方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9158302A JPH117449A (ja) 1997-06-16 1997-06-16 ハイパーテキスト情報収集方法

Publications (1)

Publication Number Publication Date
JPH117449A true JPH117449A (ja) 1999-01-12

Family

ID=15668658

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9158302A Pending JPH117449A (ja) 1997-06-16 1997-06-16 ハイパーテキスト情報収集方法

Country Status (1)

Country Link
JP (1) JPH117449A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001005783A (ja) * 1999-06-23 2001-01-12 Namco Ltd 個人識別方式
JP2001054090A (ja) * 1999-08-09 2001-02-23 Fujitsu Ltd 情報受信装置および情報受信プログラムを記録したコンピュータ読み取り可能な記録媒体
WO2002044946A1 (fr) * 2000-11-29 2002-06-06 Kabushiki Kaisha Toshiba Moteur de recherche
JP2003018350A (ja) * 2001-07-02 2003-01-17 Murata Mach Ltd ファクシミリサーバ装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001005783A (ja) * 1999-06-23 2001-01-12 Namco Ltd 個人識別方式
JP2001054090A (ja) * 1999-08-09 2001-02-23 Fujitsu Ltd 情報受信装置および情報受信プログラムを記録したコンピュータ読み取り可能な記録媒体
WO2002044946A1 (fr) * 2000-11-29 2002-06-06 Kabushiki Kaisha Toshiba Moteur de recherche
JPWO2002044946A1 (ja) * 2000-11-29 2004-04-02 株式会社東芝 サーチエンジン、検索システム、検索システムにおけるデータベース作成方法、および記憶媒体
JP2003018350A (ja) * 2001-07-02 2003-01-17 Murata Mach Ltd ファクシミリサーバ装置

Similar Documents

Publication Publication Date Title
US5933827A (en) System for identifying new web pages of interest to a user
US5940831A (en) Hypermedia system and method of managing directories and directory data originating from a node link structure in a directory server
JP4318741B2 (ja) データベースシステム、データベース検索方法及び記録媒体
US6094657A (en) Apparatus and method for dynamic meta-tagging of compound documents
US6801906B1 (en) Method and apparatus for finding information on the internet
US6321228B1 (en) Internet search system for retrieving selected results from a previous search
US6223178B1 (en) Subscription and internet advertising via searched and updated bookmark sets
US6584548B1 (en) Method and apparatus for invalidating data in a cache
US5884301A (en) Hypermedia system
KR100885772B1 (ko) 제품 정보를 등록 및 검색하기 위한 방법 및 시스템
US6961751B1 (en) Method, apparatus, and article of manufacture for providing enhanced bookmarking features for a heterogeneous environment
JPH11191113A (ja) コンピュータシステムで地理的情報にアクセスする方法および装置
PL183401B1 (pl) Komputer serwera dołączany do sieci i sposób jego eksploatacji
JPH11213014A (ja) データベースシステム、データベース検索方法及び記録媒体
US6757724B1 (en) Method and apparatus for creating and displaying user specific and site specific guidance and navigation information
JPH117449A (ja) ハイパーテキスト情報収集方法
JPH1139349A (ja) ネットワークに接続されたユーザ端末機のキャッシュ運用方法
JP3588507B2 (ja) 情報フィルタリング装置
US7275085B1 (en) Method and apparatus for maintaining state information for web pages using a directory server
US6754697B1 (en) Method and apparatus for browsing and storing data in a distributed data processing system
JP2003271647A (ja) 閲覧ファイルデータ提供方法、閲覧頻度データ提供方法、そのための中継装置、プログラム及び記録媒体
WO2001075652A2 (en) Media exchange system and process
US20020059419A1 (en) Apparatus for retrieving data
JPH11265402A (ja) データ処理システム及びデータ処理システムを制御するプログラムを記録した記録媒体
JP4013354B2 (ja) データ固定化システム、データ固定化装置、データ中継装置、情報端末装置、データ固定化プログラムを記録したコンピュータ読み取り可能な記録媒体、データ中継プログラムを記録したコンピュータ読み取り可能な記録媒体、及び情報端末用プログラムを記録したコンピュータ読み取り可能な記録媒体