JPH1145257A - Web文書の検索支援装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents

Web文書の検索支援装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体

Info

Publication number
JPH1145257A
JPH1145257A JP9199618A JP19961897A JPH1145257A JP H1145257 A JPH1145257 A JP H1145257A JP 9199618 A JP9199618 A JP 9199618A JP 19961897 A JP19961897 A JP 19961897A JP H1145257 A JPH1145257 A JP H1145257A
Authority
JP
Japan
Prior art keywords
web
search
classification item
document
web document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9199618A
Other languages
English (en)
Inventor
Takashi Wakasugi
尚 若杉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JustSystems Corp
Original Assignee
JustSystems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JustSystems Corp filed Critical JustSystems Corp
Priority to JP9199618A priority Critical patent/JPH1145257A/ja
Publication of JPH1145257A publication Critical patent/JPH1145257A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 収集したWeb文書を予め用意した各カテゴ
リーに自動的に分類することを可能にし、Web文書の
分類作業に要する労力を軽減すること。 【解決手段】 Web文書を収集するWeb文書収集ソ
フト104と、収集したWeb文書を検索するために用
いる検索情報を格納する転置ファイル109と、検索条
件を入力し、入力した検索条件を分類項目として設定
し、Webクライアントからの要求に応じて、分類項目
を提示するカテゴリー管理ソフト105と、Webクラ
イアントで分類項目が選択されると、選択された分類項
目に基づいて、転置ファイル109に格納された検索情
報を用いて該当するWeb文書を検索する検索ソフト1
06と、を備え、カテゴリー管理ソフト105は、検索
ソフト106の検索結果に基づいて、該当するWeb文
書の一覧をWebクライアントに提示する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、収集したWeb文
書を予め用意した各カテゴリーに自動的に分類すること
を可能にし、Web文書の分類作業に要する労力を軽減
したWeb文書の検索支援装置およびその装置としてコ
ンピュータを機能させるためのプログラムを記録したコ
ンピュータ読み取り可能な記録媒体に関する。
【0002】
【従来の技術】インターネットには非常に多くの情報が
存在しているが、これらの中には体系立てて整理された
ものは少なく、所望の情報を見つけ出すことは困難であ
ることが多い。そこで、この問題を解決するために様々
な手法が開発されている。
【0003】その手法の代表的な例として、インデック
ス(索引)を用いたものと、検索エンジンを用いたもの
がある。インデックスを用いたものは、Web文書を収
集し、収集したWeb文書を芸術,コンピュータ,娯
楽,スポーツ等の様々なカテゴリーに分類し、分類した
カテゴリーを利用して必要な情報を探し出すことができ
るようにしたものである。各カテゴリーには、何層かの
サブカテゴリーを作成することができ、例えば、スポー
ツのカテゴリーからは、野球,バスケット,サッカー,
ホッケー等のサブカテゴリーを見つけ出すことができ
る。そして、興味のあるサブカテゴリーにたどり着く
と、関連するWeb文書の一覧が表示され、その中から
所望のWeb文書を選択することができる。
【0004】一方、検索エンジンを用いたものは、We
b文書を収集し、収集したWeb文書を用いて所望のW
eb文書を検索することができるようにしたデータベー
スを作成しておき、検索条件を検索エンジンに与え、検
索条件に該当するWeb文書をデータベースから検索す
るというものである。すなわち、検索条件を入力するこ
とにより、入力した検索条件に該当するWeb文書の一
覧が表示されるため、その中から所望のWeb文書を選
択することができる。
【0005】
【発明が解決しようとする課題】しかしながら、上記イ
ンデックスを用いたものにあっては、カテゴリー別にW
eb文書が分類されているため、所望のWeb文書を見
つけ易いという利点があるものの、Web文書をカテゴ
リー別に分類する作業を人手により行っているため、分
類作業に大変な労力が必要であるという問題点があっ
た。
【0006】また、上記検索エンジンを用いたものにあ
っては、検索条件を与えることによって、該当するWe
b文書の一覧を得ることができるため、カテゴリー別の
分類に左右されることなく、網羅的な検索結果を得るこ
とができて便利であるが、その反面、数千件のWeb文
書が検索結果として返って来ることがあり、検索結果の
検討に時間を要する場合があるという問題点があった。
【0007】本発明は上記に鑑みてなされたものであっ
て、収集したWeb文書を予め用意した各カテゴリーに
自動的に分類することを可能にし、Web文書の分類作
業に要する労力を軽減することを目的とする。
【0008】また、本発明は上記に鑑みてなされたもの
であって、カテゴリー別にWeb文書を自動的に分類す
ることにより、適切な数の検索結果を得ることができる
ようにすることを目的とする。
【0009】
【課題を解決するための手段】上記目的を達成するた
め、請求項1のWeb文書の検索支援装置は、予め設定
した分類項目に従ってインターネット上のWeb文書を
分類して管理し、Webクライアントの要求に応じて前
記分類項目を提示すると共に、前記Webクライアント
で選択された分類項目に該当するWeb文書の一覧を提
示することにより、Web文書の検索を支援するWeb
文書の検索支援装置であって、前記Web文書を収集す
る収集手段と、前記収集手段で収集したWeb文書を入
力し、入力したWeb文書を検索するために用いる検索
情報を生成して格納する格納手段と、検索条件を入力す
る検索条件入力手段と、前記検索条件入力手段で入力さ
れた検索条件を前記分類項目として設定する分類項目設
定手段と、前記Webクライアントからの要求に応じ
て、前記分類項目設定手段で設定した分類項目を提示す
る分類項目提示手段と、前記Webクライアントで前記
分類項目提示手段で提示した分類項目が選択されると、
選択された分類項目に基づいて、前記格納手段に格納さ
れた前記検索情報を用いて該当するWeb文書を検索す
る検索手段と、前記検索手段の検索結果に基づいて、該
当するWeb文書の一覧を前記Webクライアントに提
示するWeb文書一覧提示手段と、を備えたものであ
る。
【0010】また、請求項2のWeb文書の検索支援装
置は、請求項1に記載のWeb文書の検索支援装置にお
いて、さらに、ユーザ独自の分類項目を提示することが
できるように、前記分類項目をユーザ単位で保持するた
めの分類項目保持手段を備え、前記検索条件入力手段
が、前記Webクライアントから検索条件を入力し、前
記分類項目設定手段が、前記検索条件入力手段で入力さ
れた検索条件を前記分類項目として設定し、前記分類項
目保持手段が、前記分類項目設定手段で設定された分類
項目を保持し、前記分類項目提示手段が、Webクライ
アントからの要求に基づいて、前記分類項目保持手段か
ら該当する分類項目を読み出して提示するものである。
【0011】また、請求項3のWeb文書の検索支援装
置は、請求項1または2に記載のWeb文書の検索支援
装置において、さらに、前記分類項目設定手段で設定し
た分類項目の中からアンド条件の対象となる分類項目を
指定する指定手段を備え、前記指定手段で前記アンド条
件の対象となる分類項目が指定された場合、前記分類項
目設定手段が、前記検索条件入力手段で入力された検索
条件を入れ子の分類項目として前記アンド条件の対象と
なる分類項目の下位に配置するものである。
【0012】さらに、請求項4のコンピュータ読み取り
可能な記録媒体は、前記請求項1〜3のいずれか1つに
記載のWeb文書の検索支援装置の各手段としてコンピ
ュータを機能させるためのプログラムを記録したもので
ある。
【0013】
【発明の実施の形態】以下、本発明のWeb文書の検索
支援装置およびその装置としてコンピュータを機能させ
るためのプログラムを記録したコンピュータ読み取り可
能な記録媒体の一実施の形態について、添付の図面を参
照しつつ詳細に説明する。
【0014】図1は、本実施の形態のWeb文書の検索
支援装置のブロック構成図である。図1において、10
0はCPUを、101はROMを、102はRAMを、
103はWeb文書収集ソフト104,カテゴリー管理
ソフト105および検索ソフト106を格納したハード
ディスク装置を、107はキーボード,マウス等からな
る入力装置を、108はCRT等のディスプレイを、1
09は転置ファイルを、110はインターネット111
を介してWebクライアント(図示せず)と情報の送受
信を可能とする通信装置を、112は上記各部を接続す
るバスをそれぞれ示している。
【0015】図1において、Web文書収集ソフト10
4(例えば、スパイダー)は、Web文書に埋め込まれ
ているハイパーテキストのリンクを辿って世界中のWe
b文書を収集するものである。
【0016】転置ファイル109は、Web文書収集ソ
フト104で収集したWeb文書と、Web文書から後
述する方法で抽出した複数の索引語との関係を規定し、
ある索引語が各Web文書それぞれにおいてどの程度重
要な語彙であるかをベクター表現を用いて示したもので
あって、この索引語を用いて該当するWeb文書を検索
することができるようにしたものである。
【0017】この転置ファイル109は、後述する検索
ソフト106によって生成される。具体的には、1つの
Web文書を予め定め複数のセンテンスからなるサブド
キュメント単位に区切り、サブドキュメントから上記索
引語となる名詞句を抽出して、抽出した名詞句それぞれ
について、サブドキュメント中の出現頻度,収集したW
eb文書全体における分布等の統計情報を求め、求めた
名詞句毎の統計情報を用いて各サブドキュメントをベク
ター表現に変換する。そして、変換したサブドキュメン
トのベクター表現に基づいて、Web文書のベクター表
現を生成する。転置ファイル109は、このようにして
ベクター表現されたWeb文書を格納するものである。
【0018】なお、各索引語には、対応するWeb文書
中の重要度に応じた重み付けを行うことができる。ま
た、Web文書のベクター表現については、実際の検索
を行う際に、サブドキュメントのベクター表現に基づい
て生成することにしても良い。
【0019】カテゴリー管理ソフト105は、後に詳細
に説明するが、Web文書収集ソフト104で収集した
Web文書を分類するためのカテゴリーを設定し、管理
するためのものである。設定されたカテゴリーには、後
述する検索ソフト106が利用する検索条件が関連づけ
られ、この検索条件に基づいて検索ソフト106が転置
ファイル109から検索したWeb文書の一覧が表示さ
れる。
【0020】図2は、検索ソフト106の処理を示す概
略ブロック図である。検索ソフト106は、Web文書
収集ソフト104で収集したWeb文書を転置ファイル
109に登録する処理と、ベクトル空間検索を利用した
検索処理とを行うものである。
【0021】検索ソフト106において、転置ファイル
109に登録する処理は、自然言語処理モジュール20
1と、データベース・ビルド・コンポーネント205と
によって行われる。具体的に、自然言語処理モジュール
201は、Web文書収集ソフト104によって収集さ
れたWeb文書200を入力し、品詞情報等を格納した
辞書202および各単語の係り受け等を解析するための
文法辞書203を用いて形態素解析,構文解析,名詞句
抽出等の解析処理を行い、上述したサブドキュメント毎
の名詞句リストを含むドキュメント・セット204を生
成する。データベース・ビルド・コンポーネント205
は、自然言語処理モジュール201で生成したドキュメ
ント・セット204を入力し、入力したドキュメント・
セット204中の各サブドキュメントをベクター表現に
変換すると共に、サブドキュメントのベクター表現に基
づいて、Web文書のベクター表現を生成して転置ファ
イル109に登録する。
【0022】一方、検索処理は、自然言語処理モジュー
ル201と、クエリー・ビルド・コンポーネント207
と、検索エンジン209とによって行われる。具体的
に、自然言語処理モジュール201は、カテゴリー管理
ソフト105から検索条件206を入力し、品詞情報等
を格納した辞書202および各単語の係り受け等を解析
するための文法辞書203を用いて形態素解析,構文解
析,名詞句抽出等の解析処理を行い、検索条件206中
の名詞句のリストを含むドキュメント・セット204を
生成する。クエリー・ビルド・コンポーネント207
は、ドキュメント・セット204を入力し、検索条件2
06を構成する各名詞句について、検索条件206中の
出現頻度,Web文書全体における分布等の統計情報を
求め、求めた統計情報を用いて検索条件206をベクタ
ー表現に変換したクエリー・ドキュメント208を生成
する。検索エンジン209は、クエリー・ビルド・コン
ポーネント207で生成したクエリー・ドキュメント2
08を入力し、転置ファイル109中の各Web文書の
ベクトルとクエリー・ドキュメント208のベクトルと
を比較して、クエリー・ドキュメント208との類似度
に応じたスコアを各Web文書に付与し、所定の閾値を
超えるスコアが付与されたWeb文書リスト210を検
索結果として出力する。
【0023】なお、図1においては、Web文書の検索
支援装置を1台のコンピュータで構成した様子を示した
が、このWeb文書の検索支援装置で行う処理に応じて
複数台のコンピュータで構成することにしても良い。
【0024】次に、上述した構成を備えたWeb文書の
検索支援装置の動作について、(1)転置ファイルの生
成処理,(2)カテゴリーの設定処理,(3)カテゴリ
ーへの分類処理の順で詳細に説明する。
【0025】(1)転置ファイルの生成処理 図3は、転置ファイルの生成処理を示すフローチャート
である。Web文書収集ソフト104は、ハイパーテキ
ストのリンクを辿って世界中のWeb文書200を収集
する処理を行う(S301)。
【0026】検索ソフト106は、Web文書収集ソフ
ト104が収集したWeb文書200を入力し、入力し
たWeb文書200を転置ファイル109に登録するた
めの処理を開始する(S302)。
【0027】検索ソフト106において、自然言語処理
モジュール201は、ステップS302で入力したWe
b文書200を解析する処理を行う(S303)。具体
的には、入力したWeb文書200について、辞書20
2および文法辞書203を用いて形態素解析,係り受け
等の構文解析を行い、Web文書200を複数のサブド
キュメントに区分すると共に、区分したサブドキュメン
トから名詞句を抽出する等の処理を行う。
【0028】そして、自然言語処理モジュール201
は、ステップS303における処理の結果に基づいて、
サブドキュメント毎に名詞句リストを生成し、生成した
名詞句リストを含むドキュメント・セット204を生成
する(S304)。
【0029】その後、データベース・ビルド・コンポー
ネント205は、自然言語処理モジュール201で生成
したドキュメント・セット204を入力し、Web文書
のベクター表現を生成して転置ファイル109に登録す
る処理を行う(S305)。
【0030】具体的には、ドキュメント・セット204
中のサブドキュメントの各名詞句を転置ファイル109
の索引語として、サブドキュメント中の出現頻度,We
b文書200全体における分布等の統計情報を求め、求
めた名詞句毎の統計情報を用いてサブドキュメントをベ
クター表現に変換する。この処理をドキュメント・セッ
ト204中の全てのサブドキュメントについて行い、変
換したサブドキュメントのベクター表現に基づいて、W
eb文書200のベクター表現を生成して転置ファイル
109に登録する。
【0031】上述した処理は、Web文書収集ソフト1
03が新たなWeb文書200を収集して来る毎に行わ
れる。したがって、転置ファイル102には、常に最新
のWeb文書200に関する情報が格納されていること
になる。
【0032】(2)カテゴリーの設定処理 続いて、Web文書収集ソフト104で収集したWeb
文書200を分類するためのカテゴリーを設定する処理
について説明する。図4は、カテゴリーの設定処理を説
明するための説明図である。
【0033】カテゴリー管理ソフト105は、Web文
書の検索支援装置の管理者からの指示に応じて各カテゴ
リーを設定していく。まず、カテゴリーとして、例えば
「スポーツ」が入力されると、カテゴリー管理ソフト1
05は、図4に示すようにカテゴリー「スポーツ」を設
定する。そして、設定したカテゴリー「スポーツ」の下
位には、さらにサブカテゴリーを設定することができ
る。ここでは、サブカテゴリーとして「野球」,「サッ
カー」,「バスケット」,「テニス」が設定される。
【0034】続いて、作成したサブカテゴリーに、該当
するWeb文書200を検索して、その一覧を表示する
ための検索条件206を関連づける。この検索条件20
6は、検索式,検索文,キーワードの集合,例示用We
b文書等のいずれであっても良い。また、検索条件20
6として、サブカテゴリーに付したカテゴリー名を用い
ることにしても良い。したがって、ユーザがサブカテゴ
リーを選択すると、関連づけられた検索条件206が検
索ソフト106に出力された後、転置ファイル109か
ら検索条件206に該当するWeb文書200が検索さ
れ、検索されたWeb文書200の一覧が選択されたサ
ブカテゴリーに表示されることになる。
【0035】同様の処理を行うことにより、さらに、カ
テゴリー「芸術」,「ビジネス」等を設定していくこと
ができる。
【0036】なお、図5に示したサブカテゴリー「野
球」等だけではなく、カテゴリー「スポーツ」等につい
ても検索条件206を設定することができる。このよう
にして、サブカテゴリーをカテゴリーに対するアンド条
件にすることができる。その結果、カテゴリー「スポー
ツ」を選択した場合には、「スポーツ」に関するWeb
文書200が転置ファイル109から検索されて、その
一覧が表示される。また、サブカテゴリー「野球」が選
択された場合には、「スポーツ」に関するWeb文書
で、かつ、「野球」に関するWeb文書が転置ファイル
109から検索されて、その一覧が表示されることにな
る。
【0037】このようにして、図5に示すようなカテゴ
リーが設定される。設定されたカテゴリーはカテゴリー
管理ソフト105で管理され、要求に応じて、Webク
ライアントに提示される。
【0038】(3)カテゴリー毎の分類処理 続いて、上述したようにして設定したカテゴリーに基づ
いて、Web文書200を分類してWebクライアント
に提示するための処理について説明する。図6はカテゴ
リー毎の分類処理を示すフローチャートである。
【0039】カテゴリー管理ソフト105は、Webク
ライアントからの要求があると(S601)、設定した
カテゴリーをWebクライアントに提示する(S60
2)。
【0040】そして、カテゴリー管理ソフト105は、
Webクライアントからカテゴリーのいずれかを選択し
た結果を入力すると、該当するカテゴリーに関連づけら
れた検索条件206を検索ソフト105に出力する(S
603)。
【0041】本実施の形態を説明するにあたっては、図
5に示したカテゴリー「スポーツ」のサブカテゴリー
「野球」がWebクライアントによって選択されたもの
とする。したがって、カテゴリー管理ソフト105は、
検索条件206として、予め関連づけられた「野球」に
関する検索式,検索文,キーワードの集合または例示用
の文書を検索ソフト106に出力する。
【0042】検索ソフト106は、カテゴリー管理ソフ
ト105から検索条件206を入力し、自然言語処理モ
ジュール201が検索条件206の解析処理を行う(S
604)。具体的には、辞書202および文法辞書20
3を用いて形態素解析,係り受け等の構文解析処理を行
う。
【0043】そして、自然言語処理モジュール201
は、ステップS604での解析結果に基づいて、検索条
件206から転置ファイル109中の索引語に対応する
名詞句を抽出し、名詞句からなるドキュメント・セット
204を生成する(S605)。
【0044】続いて、クエリー・ビルド・コンポーネン
ト207は、自然言語処理モジュール201からドキュ
メント・セット204を入力し、入力したドキュメント
・セット204を構成する各名詞句について、検索条件
206中の出現頻度,Web文書200全体における分
布等の統計情報を求め、求めた統計情報を用いてドキュ
メント・セット204をベクター表現に変換したクエリ
ー・ドキュメント208を生成する(S606)。
【0045】検索エンジン209は、クエリー・ビルド
・コンポーネント207で生成したクエリー・ドキュメ
ント208を入力し、転置ファイル109中の各Web
文書200のベクトルとクエリー・ドキュメント208
のベクトルを比較して、クエリー・ドキュメント208
との類似度に応じたスコアを各Web文書200に付与
する(S607)。
【0046】なお、類似度に応じたスコアは、各Web
文書200とクエリー・ドキュメント208との類似度
を余弦距離に基づいて表現したものであり、スコアが大
きいWeb文書200がよりクエリー・ドキュメント2
08と類似していることを表している。
【0047】そして、検索エンジン209は、予め設定
されたスコアの閾値に基づいて、閾値を超えるスコアが
付与されたWeb文書200を選択し、選択したWeb
文書200に基づいて、Web文書リスト210を生成
して、検索結果として出力する(S608)。
【0048】図7は、Web文書リスト210の一例を
示す説明図である。図7に示すように、Web文書リス
ト210には、クエリー・ドキュメント208との類似
度に応じたスコアのランキング,Web文書名,URL
等が表示される。
【0049】カテゴリー管理ソフト105は、検索エン
ジン209からWeb文書リスト210を入力し、入力
したWeb文書リスト210に基づいて、上位のランキ
ングのWeb文書200から順に並べ、かつ、該当する
カテゴリーに関連づけてWeb文書200の一覧をWe
bクライアントに提示する(S609)。
【0050】図8は、Webクライアントで選択された
カテゴリーに関連づけてWeb文書200を一覧表示し
た様子の一例を示す説明図である。図8に示すように、
ステップS603で選択されたサブカテゴリー「野球」
に該当するWeb文書200が検索ソフト106によっ
て転置ファイル109から検索され、該当するWeb文
書200の一覧がWebクライアントに画面表示され
る。
【0051】図8においては、カテゴリーに関連づけら
れた検索条件206に最も近いWeb文書200から順
に表示することにしたため、ユーザがWeb文書200
を選択する際の基準を提供することができる。なお、こ
こでは類似度に応じてWeb文書200を表示すること
にしたが、もちろん、日付順,五十音順等でWeb文書
名を表示することにしても良い。
【0052】そして、Webクライアント側では、図8
に示したWeb文書200の一覧から所望のWeb文書
200を選択することにより、Web文書200の内容
を閲覧することができる。
【0053】このように、本実施の形態のWeb文書の
検索支援装置によれば、収集したWeb文書200を予
め用意した各カテゴリーに自動的に分類することを可能
にしたため、Web文書200の分類作業に要する労力
を軽減することができる。また、収集したWeb文書2
00によって転置ファイル102が常に更新されている
ため、各カテゴリーには、常に最新のWeb文書200
を分類してWebクライアントに提示することができ
る。さらに、カテゴリー別にWeb文書200を自動的
に分類することにより、適切な数のWeb文書200を
得ることができる。
【0054】また、Webクライアント側の操作自体
は、カテゴリーでWeb文書200を管理する通常のW
eb文書200の検索支援装置と同様であるため、We
b文書200を検索して表示しているということを意識
させることなく、Web文書200を予め分類しておい
たかのようにWebクライアントに提示することができ
る。
【0055】また、作成したカテゴリーのいくつかに当
てはまるようなWeb文書200については、検索ソフ
ト106による検索によって、該当する全てのカテゴリ
ーに表示されることになる。
【0056】また、各カテゴリーに表示されたWeb文
書200において、Webクライアントのユーザが分類
結果としてふさわしいと思うWeb文書200やふさわ
しくないと思うWeb文書200については、その結果
を本実施の形態のWeb文書の検索支援装置にフィード
バックすることができる。すなわち、ユーザは、分類結
果としてふさわしいと思うWeb文書200に対して、
正の重み、例えば「+」を指定することができ、検索結
果としてふさわしくないと思うWeb文書200に対し
て負の重み、例えば「−」を指定することができる。そ
の結果、入力した重みが正の指定である場合には、転置
ファイル109中の該当するWeb文書200の重みが
強化され、入力した重みが負の指定である場合には、W
eb文書200の重みが弱められる。
【0057】また、本実施の形態においては、ベクトル
空間法による検索を例にとって説明したが、ブーリアン
検索により検索処理を行うことにしても良い。
【0058】また、上述したカテゴリーは、本実施の形
態のWeb文書の検索支援装置の管理者側で設定するも
のであるため、Webクライアントのユーザが所望する
カテゴリーが存在しない場合も考えられる。したがっ
て、カテゴリー管理ソフト105に、ユーザ毎にカテゴ
リーを設定することができるような機能を持たせても良
い。具体的には、Webクライアントからカテゴリー管
理ソフト105を呼び出すことができるようにし、上述
したようにしてカテゴリーや検索条件の設定を行うこと
ができるようにする。設定したカテゴリーは、カテゴリ
ー管理ソフト105によってユーザ毎に管理する。カテ
ゴリー管理ソフト105は、Webクライアントのユー
ザから自己のカテゴリーの表示の要求を受信すると、該
当するカテゴリーをWebクライアントのユーザに提示
する。なお、その後の処理については、上述した通りで
あるため、ここではその説明を省略する。
【0059】さらに、本実施の形態で説明したWeb文
書の検索支援装置は、予め用意されたプログラムをコン
ピュータやワークステーションで実行することによって
実現される。このプログラムは、ハードディスク,フロ
ッピーディスク,CD−ROM,MO,DVD等のコン
ピュータで読み取り可能な記録媒体に記録され、コンピ
ュータによって記録媒体から読み出されることによって
実行される。また、このプログラムは、上記記録媒体を
介して、またはネットワークを介して配布することがで
きる。
【0060】
【発明の効果】以上説明したように、本発明のWeb文
書の検索支援装置(請求項1)によれば、Web文書を
収集する収集手段と、収集手段で収集したWeb文書を
入力し、入力したWeb文書を検索するために用いる検
索情報を生成して格納する格納手段と、検索条件を入力
する検索条件入力手段と、検索条件入力手段で入力され
た検索条件を前記分類項目として設定する分類項目設定
手段と、Webクライアントからの要求に応じて、前記
分類項目設定手段で設定した分類項目を提示する分類項
目提示手段と、Webクライアントで前記分類項目提示
手段で提示した分類項目が選択されると、選択された分
類項目に基づいて、前記格納手段に格納された前記検索
情報を用いて該当するWeb文書を検索する検索手段
と、検索手段の検索結果に基づいて、該当するWeb文
書の一覧を前記Webクライアントに提示するWeb文
書一覧提示手段と、を備えたため、Web文書の分類作
業に要する労力を軽減することができる。加えて、カテ
ゴリー別にWeb文書を自動的に分類することにより、
適切な数のWeb文書を得ることができる。
【0061】また、本発明のWeb文書の検索支援装置
(請求項2)によれば、請求項1に記載のWeb文書の
検索支援装置において、さらに、ユーザ独自の分類項目
を提示することができるように、前記分類項目をユーザ
単位で保持するための分類項目保持手段を備え、前記検
索条件入力手段は、前記Webクライアントから検索条
件を入力し、前記分類項目設定手段は、前記検索条件入
力手段で入力された検索条件を前記分類項目として設定
し、前記分類項目保持手段は、前記分類項目設定手段で
設定された分類項目を保持し、前記分類項目提示手段
は、Webクライアントからの要求に基づいて、前記分
類項目保持手段から該当する分類項目を読み出して提示
するため、Webクライアントのユーザが所望する分類
項目が用意されていない場合であっても、ユーザ独自の
分類項目を設定することができ、所望のWeb文書を得
ることができるようにすることができる。
【0062】また、本発明のWeb文書の検索支援装置
(請求項3)によれば、請求項1または2に記載のWe
b文書の検索支援装置において、さらに、前記分類項目
設定手段で設定した分類項目の中からアンド条件の対象
となる分類項目を指定する指定手段を備え、前記指定手
段で前記アンド条件の対象となる分類項目が指定された
場合、前記分類項目設定手段は、前記検索条件入力手段
で入力された検索条件を入れ子の分類項目として前記ア
ンド条件の対象となる分類項目の下位に配置するため、
より詳細な分類を可能とすることができる。
【0063】さらに、本発明のコンピュータ読み取り可
能な記録媒体(請求項4)によれば、請求項1〜3のい
ずれか1つに記載のWeb文書の検索支援装置の各手段
としてコンピュータを機能させるためのプログラムを記
録したため、このプログラムをコンピュータに実行させ
ることにより、Web文書の分類作業に要する労力を軽
減することができるWeb文書の検索支援装置を実現す
ることができる。
【図面の簡単な説明】
【図1】本実施の形態のWeb文書の検索支援装置のブ
ロック構成図である。
【図2】本実施の形態のWeb文書の検索支援装置にお
いて、検索ソフト106の処理を示す概略ブロック図で
ある。
【図3】本実施の形態のWeb文書の検索支援装置にお
いて、転置ファイルの生成処理を示すフローチャートで
ある。
【図4】本実施の形態のWeb文書の検索支援装置にお
いて、カテゴリーの設定処理を説明するための説明図で
ある。
【図5】本実施の形態のWeb文書の検索支援装置にお
いて、設定したカテゴリーの一例を示す説明図である。
【図6】本実施の形態のWeb文書の検索支援装置にお
いて、カテゴリー毎の分類処理を示すフローチャートで
ある。
【図7】本実施の形態のWeb文書の検索支援装置にお
いて、Web文書リストの一例を示す説明図である。
【図8】本実施の形態のWeb文書の検索支援装置にお
いて、Webクライアントで選択されたカテゴリーに関
連づけてWeb文書を一覧表示した様子の一例を示す説
明図である。
【符号の説明】
100 CPU 101 ROM 102 RAM 103 ハードディスク装置 104 Web文書収集ソフト 105 カテゴリー管理ソフト 106 検索ソフト 107 入力装置 108 ディスプレイ 109 転置ファイル 110 通信装置 111 インターネット 112 バス 200 Web文書 201 自然言語処理モジュール 202 辞書 203 文法辞書 204 ドキュメント・セット 205 データベース・ビルド・コンポーネント 206 検索条件 207 クエリー・ビルド・コンポーネント 208 クエリー・ドキュメント 209 検索エンジン 210 Web文書リスト

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 予め設定した分類項目に従ってインター
    ネット上のWeb文書を分類して管理し、Webクライ
    アントの要求に応じて前記分類項目を提示すると共に、
    前記Webクライアントで選択された分類項目に該当す
    るWeb文書の一覧を提示することにより、Web文書
    の検索を支援するWeb文書の検索支援装置であって、 前記Web文書を収集する収集手段と、 前記収集手段で収集したWeb文書を入力し、入力した
    Web文書を検索するために用いる検索情報を生成して
    格納する格納手段と、 検索条件を入力する検索条件入力手段と、 前記検索条件入力手段で入力された検索条件を前記分類
    項目として設定する分類項目設定手段と、 前記Webクライアントからの要求に応じて、前記分類
    項目設定手段で設定した分類項目を提示する分類項目提
    示手段と、 前記Webクライアントで前記分類項目提示手段で提示
    した分類項目が選択されると、選択された分類項目に基
    づいて、前記格納手段に格納された前記検索情報を用い
    て該当するWeb文書を検索する検索手段と、 前記検索手段の検索結果に基づいて、該当するWeb文
    書の一覧を前記Webクライアントに提示するWeb文
    書一覧提示手段と、 を備えたことを特徴とするWeb文書の検索支援装置。
  2. 【請求項2】 さらに、ユーザ独自の分類項目を提示す
    ることができるように、前記分類項目をユーザ単位で保
    持するための分類項目保持手段を備え、 前記検索条件入力手段は、前記Webクライアントから
    検索条件を入力し、 前記分類項目設定手段は、前記検索条件入力手段で入力
    された検索条件を前記分類項目として設定し、 前記分類項目保持手段は、前記分類項目設定手段で設定
    された分類項目を保持し、 前記分類項目提示手段は、Webクライアントからの要
    求に基づいて、前記分類項目保持手段から該当する分類
    項目を読み出して提示することを特徴とする請求項1に
    記載のWeb文書の検索支援装置。
  3. 【請求項3】 さらに、前記分類項目設定手段で設定し
    た分類項目の中からアンド条件の対象となる分類項目を
    指定する指定手段を備え、 前記指定手段で前記アンド条件の対象となる分類項目が
    指定された場合、前記分類項目設定手段は、前記検索条
    件入力手段で入力された検索条件を入れ子の分類項目と
    して前記アンド条件の対象となる分類項目の下位に配置
    することを特徴とする請求項1または2に記載のWeb
    文書の検索支援装置。
  4. 【請求項4】 前記請求項1〜3のいずれか1つに記載
    のWeb文書の検索支援装置の各手段としてコンピュー
    タを機能させるためのプログラムを記録したことを特徴
    とするコンピュータ読み取り可能な記録媒体。
JP9199618A 1997-07-25 1997-07-25 Web文書の検索支援装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 Pending JPH1145257A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9199618A JPH1145257A (ja) 1997-07-25 1997-07-25 Web文書の検索支援装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9199618A JPH1145257A (ja) 1997-07-25 1997-07-25 Web文書の検索支援装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体

Publications (1)

Publication Number Publication Date
JPH1145257A true JPH1145257A (ja) 1999-02-16

Family

ID=16410855

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9199618A Pending JPH1145257A (ja) 1997-07-25 1997-07-25 Web文書の検索支援装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JPH1145257A (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000054312A (ko) * 2000-06-01 2000-09-05 최우석 맞춤 웹정보 구축 제공 방법
JP2000293425A (ja) * 1999-04-01 2000-10-20 Nec Commun Syst Ltd インターネットWeb検索システム
JP2001075859A (ja) * 1999-08-31 2001-03-23 Just Syst Corp 情報巡回獲得装置
JP2001134616A (ja) * 1999-10-25 2001-05-18 Nec Corp 特定の話題に関するウェブ情報の構成方法とその構成システム
KR100461766B1 (ko) * 2001-06-14 2004-12-14 주식회사 로직플랜트 개인 정보 제공 시스템 및 그 제공 방법
JP2006092235A (ja) * 2004-09-24 2006-04-06 Fuji Xerox Co Ltd コンピュータを検索語更新装置として動作させるプログラム、検索語更新方法及び検索語更新装置
JP2006189972A (ja) * 2004-12-28 2006-07-20 Chugoku Electric Power Co Inc:The 情報管理システム
KR100621737B1 (ko) * 1999-12-27 2006-09-06 학교법인 포항공과대학교 웹사이트 자동 분류방법
KR100691686B1 (ko) 2001-12-27 2007-03-09 후지제롯쿠스 가부시끼가이샤 정보 제공 서버로부터 정보를 수집하는 장치 및 방법
JP4812212B2 (ja) * 1999-09-24 2011-11-09 ユナイテッド ビデオ プロパティーズ インク 拡張ユーザインターフェースを用いる双方向テレビ番組ガイド

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000293425A (ja) * 1999-04-01 2000-10-20 Nec Commun Syst Ltd インターネットWeb検索システム
JP2001075859A (ja) * 1999-08-31 2001-03-23 Just Syst Corp 情報巡回獲得装置
JP4812212B2 (ja) * 1999-09-24 2011-11-09 ユナイテッド ビデオ プロパティーズ インク 拡張ユーザインターフェースを用いる双方向テレビ番組ガイド
JP2001134616A (ja) * 1999-10-25 2001-05-18 Nec Corp 特定の話題に関するウェブ情報の構成方法とその構成システム
KR100621737B1 (ko) * 1999-12-27 2006-09-06 학교법인 포항공과대학교 웹사이트 자동 분류방법
KR20000054312A (ko) * 2000-06-01 2000-09-05 최우석 맞춤 웹정보 구축 제공 방법
KR100461766B1 (ko) * 2001-06-14 2004-12-14 주식회사 로직플랜트 개인 정보 제공 시스템 및 그 제공 방법
KR100691686B1 (ko) 2001-12-27 2007-03-09 후지제롯쿠스 가부시끼가이샤 정보 제공 서버로부터 정보를 수집하는 장치 및 방법
US7216120B2 (en) 2001-12-27 2007-05-08 Fuji Xerox Co., Ltd. Apparatus and method for collecting information from information providing server
JP2006092235A (ja) * 2004-09-24 2006-04-06 Fuji Xerox Co Ltd コンピュータを検索語更新装置として動作させるプログラム、検索語更新方法及び検索語更新装置
JP2006189972A (ja) * 2004-12-28 2006-07-20 Chugoku Electric Power Co Inc:The 情報管理システム
JP4623635B2 (ja) * 2004-12-28 2011-02-02 中国電力株式会社 社内情報管理システム

Similar Documents

Publication Publication Date Title
JP3755134B2 (ja) コンピュータベースの適合テキスト検索システムおよび方法
JP4241934B2 (ja) テキスト処理及び検索システム及び方法
JP3717808B2 (ja) 情報検索システム
JP3577819B2 (ja) 情報探索装置及び情報探索方法
JPH11102376A (ja) 検索照会に関係のあるデータベースから抽出されたテキストを自動表示する方法および装置
JP4091146B2 (ja) 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH1145257A (ja) Web文書の検索支援装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH11296537A (ja) 情報検索システム、情報提供装置、情報検索端末装置、情報検索方法および記憶媒体
JPH1145274A (ja) 単語間の共起性を用いたキーワードの拡張方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2003196294A (ja) 知識分析システムおよび知識分析方法
JP2004054882A (ja) 類義語検索装置、方法、プログラム及び記憶媒体
JPH1145268A (ja) 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH11338869A (ja) 情報推薦方法及びシステム及び情報推薦プログラムを格納した記憶媒体及び情報蓄積方法及び装置及び情報蓄積プログラムを格納した記憶媒体
JP2010286888A (ja) 情報収集システムおよび情報収集方法ならびにそのプログラム
JP2008234559A (ja) ドキュメント絞り込み検索装置、方法及びプログラム
JPH1145252A (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH11154164A (ja) 全文検索処理における適合度算出方法および該方法に係るプログラムを格納した記憶媒体
JP2002056009A (ja) 文書分類方法および装置
JP4384736B2 (ja) 画像検索装置およびその装置の各手段としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2000105769A (ja) 文書表示方法
JP4138048B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH1145254A (ja) 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH1145255A (ja) 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH1145238A (ja) 文書管理システムおよびそのシステムとしてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4368550B2 (ja) 文書検索装置、文書検索方法およびその方法をコンピュータに実行させるプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040721

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070529

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070730

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080115