JP2004295663A - Information processing method and computer program - Google Patents
Information processing method and computer program Download PDFInfo
- Publication number
- JP2004295663A JP2004295663A JP2003089074A JP2003089074A JP2004295663A JP 2004295663 A JP2004295663 A JP 2004295663A JP 2003089074 A JP2003089074 A JP 2003089074A JP 2003089074 A JP2003089074 A JP 2003089074A JP 2004295663 A JP2004295663 A JP 2004295663A
- Authority
- JP
- Japan
- Prior art keywords
- hit data
- score
- search keyword
- computer
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
【0001】
【発明の属する技術分野】
本発明は、検索キーワードを情報処理装置から検索システムに送信し、送信した検索キーワードにヒットしたヒットデータにスコアが付加されているヒットデータリストを情報処理装置で受信及び出力する情報処理方法、及び、コンピュータに、検索キーワードを送信させ、送信した検索キーワードにヒットしたヒットデータにスコアが付加されているヒットデータリストを受信させるコンピュータプログラムに関する。
【0002】
【従来の技術】
インターネットの普及に伴い、必要な情報をインターネットから検索する機会が増加する傾向にある。必要な情報を検索する際、検索サイトにアクセスし、必要な情報に関係する検索キーワードを入力して検索を行う。しかし、インターネット上の情報量は膨大であり、検索キーワードに大量のデータ(ウェブページ)がヒットする場合が多い。ヒットデータ(ヒットページ)が大量の場合、検索キーワードを再考する必要が生じたり、何度も検索をやり直す場合が多くなるため、検索には手間がかかる。
【0003】
検索サイトの中には、各ヒットデータ(ヒットページ)に、検索サイトが独自に算出したスコア(又はポイント)を付加して、ユーザがスコアを参考にしてヒットデータの閲覧を行えるようにしているところもある。スコアは、例えばヒットデータ内の検索キーワード数に基づいて決定したり、ヒットデータへのリンク数に基づいて決定するなど、各検索サイトが独自に決定しており、一般的に、スコアが高いほど、検索キーワードに関連の深い情報である場合が多い。
【0004】
また、過去に入力された検索キーワードをデータベース化し、ユーザの入力した文字に前方一致する検索キーワード候補リストを表示することにより、検索キーワードの入力を補助する方法もある(例えば、特許文献1参照)。
【0005】
【特許文献1】
特開2001−249933号公報
【0006】
【発明が解決しようとする課題】
各ヒットページにスコアを付加することにより、スコアを参考にして各ヒットページを閲覧できるが、従来と同様に、ユーザは大量のヒットページを含むヒットページリストを受取ることになる。また、検索キーワード候補リストを表示する方法では、検索キーワードの入力効率が向上するだけであり、従来と同様に、ユーザは大量のヒットページを含むヒットページリストを受取ることになる。
【0007】
また、インターネット内の情報は、日々変化しており、新しいページが追加されたり、アドレス(URL)が変更されたりしている。新しく追加されたページ又はアドレスが変更されたページを検索する場合も、上述したように、大量のヒットページを調べる必要があり、手間がかかる。
【0008】
本発明は斯かる事情に鑑みてなされたものであり、検索システムから受信したヒットデータリストの中から、スコアが目標スコア以上のヒットデータを抽出することにより、出力を行うヒットデータ数を減少させることが可能な情報処理方法及びコンピュータプログラムを提供することを目的とする。
【0009】
また、本発明は、スコアが目標スコア以上のヒットデータを抽出できなかった場合、元の検索キーワードを含み、最高スコアが目標スコア以上の検索キーワードを出力することにより、再検索用の検索キーワードの決定を補助することが可能なコンピュータプログラムを提供することを他の目的とする。
【0010】
また、本発明は、定期的に所定検索キーワードを検索システムに送信し、検索システムから受信したヒットデータリスト内のヒットデータを記憶部に記憶することにより、所定検索キーワードにヒットした目標スコア以上の新規ヒットデータの一覧を出力することが可能なコンピュータプログラムを提供することを他の目的とする。
【0011】
また、本発明は、アクセスできなくなったヒットデータに対して過去に行った検索に関する検索キーワード及び内容情報に基づいて、前記アクセスできなくなったヒットデータを検索することが可能なコンピュータプログラムを提供することを他の目的とする。
【0012】
【課題を解決するための手段】
第1発明に係る情報処理方法は、検索キーワードを情報処理装置から検索システムに送信し、送信した検索キーワードにヒットしたヒットデータにスコアが付加されているヒットデータリストを情報処理装置で受信及び出力する情報処理方法において、目標スコアを情報処理装置で受付けるステップと、受信したヒットデータリストの中から、スコアが前記受付けた目標スコア以上のヒットデータを情報処理装置で抽出するステップとを有し、前記抽出したヒットデータに関する情報を情報処理装置から出力することを特徴とする。
【0013】
第2発明に係るコンピュータプログラムは、コンピュータに、検索キーワードを検索システムへ送信させ、送信した検索キーワードにヒットしたヒットデータにスコアが付加されているヒットデータリストを受信させるコンピュータプログラムにおいて、コンピュータに、目標スコアを受付けさせる手順と、コンピュータに、受信したヒットデータリストの中から、スコアが前記受付けた目標スコア以上のヒットデータを抽出させる手順と、コンピュータに、前記抽出したヒットデータに関する情報を出力させる手順とを含むことを特徴とする。
【0014】
第3発明に係るコンピュータプログラムは、コンピュータに、複数キーワードの組合せ又は1キーワードを含む検索キーワードを検索システムへ送信させ、送信した検索キーワードにヒットしたヒットデータにスコアが付加されているヒットデータリストを受信させるコンピュータプログラムにおいて、コンピュータに、受信したヒットデータリストに含まれるヒットデータのスコアのうちの最高スコア及び該ヒットデータリストに対応する検索キーワードを所定記憶領域に記憶させる手順と、コンピュータに、目標スコアを受付けさせる手順と、コンピュータに、受信したヒットデータリストの中から、スコアが前記受付けた目標スコア以上のヒットデータを抽出させる手順と、コンピュータに、目標スコア以上のヒットデータが抽出できなかった場合、前記所定記憶領域から、前記受信したヒットデータリストに対応する検索キーワードを含み、しかも最高スコアが目標スコア以上のヒットデータリストに対応する検索キーワードを読出させる手順と、コンピュータに、前記抽出したヒットデータに関する情報又は前記読出した検索キーワードを出力させる手順とを含むことを特徴とする。
【0015】
第4発明に係るコンピュータプログラムは、コンピュータに、所定検索キーワードを定期的に検索システムへ送信させ、送信した所定検索キーワードにヒットしたヒットデータにスコアが付加されているヒットデータリストを受信させるコンピュータプログラムにおいて、コンピュータに、目標スコアを受付けさせる手順と、コンピュータに、受信したヒットデータリストの中から、スコアが前記受付けた目標スコア以上のヒットデータを抽出させる手順と、コンピュータに、前記抽出したヒットデータに関する情報を所定記憶領域に記憶させる手順と、コンピュータに、前記所定記憶領域に新しく記憶されたヒットデータに関する情報を検出させる手順と、コンピュータに、前記検出したヒットデータに関する情報を出力させる手順とを含むことを特徴とする。
【0016】
第5発明に係るコンピュータプログラムは、コンピュータに、検索キーワードを検索システムへ送信させ、送信した検索キーワードにヒットしたヒットデータが含まれるヒットデータリストを受信させるコンピュータプログラムにおいて、コンピュータに、受信したヒットデータリストに含まれるヒットデータのアドレス、内容情報及び検索キーワードを所定記憶領域に記憶させる手順と、コンピュータに、ヒットデータのアドレスを受付けさせる手順と、コンピュータに、前記受付けたアドレスに対応する内容情報及び検索キーワードを前記所定記憶領域から読出させる手順と、コンピュータに、前記読出した検索キーワードを検索システムへ送信させる手順と、コンピュータに、前記検索キーワードの送信に応じて受信したヒットデータリストに含まれるヒットデータの中から、内容情報が前記読出した内容情報に類似するヒットデータを抽出させる手順と、コンピュータに、前記抽出したヒットデータに関する情報を出力させる手順とを含むことを特徴とする。
【0017】
第1又は第2発明においては、目標スコアを受付け、検索システムから受信したヒットデータリストの中から、スコアが前記受付けた目標スコア以上のヒットデータを抽出し、抽出したヒットデータに関する情報を出力する。一般的に、検索システムから受信したヒットデータリストは、大量のヒットデータを含むことが多く、また、スコアが高いほど、検索キーワードに関連の深い情報である場合が多い。大量のヒットデータを含むヒットデータリストの中から、スコアが目標スコア以上のヒットデータを抽出することにより、出力を行うヒットデータ数を減少することが可能である。また、抽出したヒットデータのスコアは目標スコア以上であり、出力を行うヒットデータは、検索キーワードに関連の深い情報である可能性が高いと考えられる。
【0018】
第3発明においては、検索システムから受信したヒットデータリストに含まれるヒットデータのスコアのうちの最高スコア及び該ヒットデータリストに対応する検索キーワードを記憶部に記憶する。目標スコアを受付け、検索システムから受信したヒットデータリストの中から、スコアが前記受付けた目標スコア以上のヒットデータを抽出し、抽出したヒットデータに関する情報を出力する。また、スコアが目標スコア以上のヒットデータを抽出できなかった場合は、前記受信したヒットデータリストに対応する検索キーワードを含み、しかも最高スコアが目標スコア以上のヒットデータリストに対応する検索キーワードを前記記憶部から読出して、読出した検索キーワードを出力する。一般的に、スコアが高いヒットデータほど、検索キーワードに関連の深い情報であることが多く、ヒットデータリストに含まれるヒットデータのスコアのうちの最高スコアが目標スコアより低い場合は、検索キーワードに関連の深いヒットデータがあまり含まれていない可能性が高いと考えられる。出力を行った検索キーワードは、検索に使用した検索キーワードを含んでおり、絞込検索に使用できる検索キーワードであり、再検索の参考に用いることが可能である。また、前記出力を行った検索キーワードは、最高スコアが目標スコア以上であり、検索キーワードに関連の深い情報である可能性が高いと考えられる。
【0019】
第4発明においては、目標スコアを受付け、定期的に所定検索キーワードを検索システムに送信し、検索システムから受信したヒットデータリストの中から、スコアが前記受付けた目標スコア以上のヒットデータを抽出し、抽出したヒットデータに関する情報を記憶部に記憶する。記憶部に新しく記憶されたヒットデータに関する情報を検出し、検出したヒットデータに関する情報を出力する。定期的に所定検索キーワードを検索システムに送信し、検索システムから受信したヒットデータリスト内のヒットデータを記憶部に記憶しているため、記憶部に新しく記憶されたヒットデータは、新規に検索されたヒットデータであり、所定検索キーワードにヒットした新規のヒットデータの一覧を出力することが可能である。また、記憶部に記憶されているヒットデータは、スコアが目標スコア以上であり、検索キーワードに関連の深い情報である可能性が高いと考えられる。
【0020】
第5発明においては、検索システムから受信したヒットデータリストに含まれるヒットデータのアドレス、内容情報及び検索キーワードを記憶部に記憶する。ヒットデータのアドレスを受付け、受付けたアドレスのヒットデータの内容情報及び検索キーワードを記憶部から読出し、読出した検索キーワードを検索システムに送信する。検索キーワードの送信に応じて受信したヒットデータリストに含まれるヒットデータの中から、内容情報が前記読出した内容情報に類似するヒットデータを抽出し、抽出したヒットデータを出力する。インターネットなどの不特定多数のサーバが接続された通信ネットワークにおいては、新規データが追加又は変更されるのは勿論、公開されていたデータが他のサーバに移転される場合も多く、今までアクセスできていたデータに急にアクセスできなくなることもある。アクセスできなくなったデータのアドレスが記憶部に記憶されている場合は、前記アクセスできなくなったヒットデータに対して過去に行った検索に関する検索キーワード及び内容情報が取得でき、取得した検索キーワードで再度検索を行うことが可能である。検索結果のうち、内容情報が前記取得した内容情報と類似しているヒットデータは、前記アクセスできなくなったデータのアドレス移動先である可能性が高い。
【0021】
【発明の実施の形態】
以下、本発明をその実施の形態を示す図面に基づいて具体的に説明する。
(第1の実施の形態)
図1に本発明に係る情報処理装置10の例を示す。情報処理装置10は、CPU(Central Processing Unit)11と、DRAM等のRAM(Random Access Memory)12と、ハードディスクドライブ(以下、ハードディスクと略す)13と、フレキシブルディスクドライブ又はCD−ROMドライブ等の外部記憶部14と、キーボード又はマウス等の入力部15と、表示装置又はプリンタ等の出力部16と、インターネットなどの通信ネットワーク22との通信制御を行う通信部17とを備える。
【0022】
CPU11は、上述した各部12〜17の制御を行う。また、CPU11は、入力部15又は通信部17から受付けたプログラム又はデータ、あるいはハードディスク13又は外部記憶部14から読出したプログラム又はデータ等をRAM12に記憶し、RAM12に記憶したプログラムの実行又はデータの演算等の各種処理を行い、各種処理結果又は各種処理に用いる一時的なデータをRAM12に記憶する。RAM12に記憶した演算結果等のデータは、CPU11により、ハードディスク13に記憶されたり、出力部16又は通信部17から出力される。
【0023】
通信ネットワーク22には、検索システム20が接続されている。検索システム20は、検索キーワードを受付け、受付けた検索キーワードにヒットしたヒットデータの一覧であるヒットデータリストを返信する。本説明においては、検索システムは、受付けた検索キーワードにヒットした各ヒットデータにスコア(又はポイント)を付加している。スコアは、例えばヒットデータに含まれる検索キーワード数に応じて決定されたり、ヒットデータへのリンク数に応じて決定されるなど、検索システム毎に様々な方法で決定されており、一般的に、スコアが高いヒットデータは、スコアが低いヒットデータに比べて、検索キーワードに関連の深い情報である場合が多い。ヒットデータリスト内では、スコアが高い順にヒットデータが並べられている。
【0024】
情報処理装置10は、例えば入力部15で検索キーワードを受付け、入力部15で受付けた検索キーワードをCPU11の制御でRAM12に記憶して通信部17から検索システム20に送信する。また、情報処理装置10は、検索システム20から返信されたヒットデータリストを通信部17で受信し、受信したヒットデータリストをCPU11の制御でRAM12に記憶して出力部16に出力することが可能である。
【0025】
また、例えば通信部17でユーザ端末(通信ネットワーク22に接続されている図示しない端末装置)から検索キーワードを受付け、通信部17で受付けた検索キーワードをCPU11の制御でRAM12に記憶して通信部17から検索システム20に送信し、検索システム20から返信されたヒットデータリストを通信部17で受信し、受信したヒットデータリストをCPU11の制御でRAM12に記憶して通信部17から前記ユーザ端末に送信することも可能である。
【0026】
入力部15(又は通信部17)は、希望スコア(目標スコア)を受付ける手段として動作する。CPU11は、検索システム20から受信したヒットデータリストの中から、スコアが入力部15(又は通信部17)の受付けた希望スコア以上のヒットデータを抽出する手段として動作し、抽出したヒットデータに関する情報を出力部16に出力する(又は通信部17から送信する)。
【0027】
CD−ROM等の記録媒体19に記録されたコンピュータプログラムを外部記憶部14で読出してハードディスク13又はRAM12に記憶してCPU11に実行させることにより、CPU11を上述した各手段として動作させることが可能である。また、通信部17で他の装置からコンピュータプログラムを受付けてハードディスク13又はRAM12に記憶することも可能である。
【0028】
次に、本発明に係る情報処理装置を用いたデータ検索について説明する。本説明では、入力部15から検索キーワード及び希望スコア(目標スコア)を受付け、検索結果(ヒットデータリスト)を出力部15から出力するものとする。図2にデータ検索手順の例を示す。
【0029】
CPU11はハードディスク13に記憶されている検索画面をRAM12に読出して出力部16に出力するなどして、検索キーワード及び希望スコアを受付ける(S10)。検索画面の例を図3に示す。検索画面は、検索キーワードの入力欄32、希望スコアの入力欄34、検索ボタン36及びキャンセルボタン38などを有する。利用者は、例えば入力部15を操作して、入力欄32に検索キーワードを入力し、入力欄34に希望スコアを入力し、検索ボタン36をクリックする。検索ボタン36がクリックされた場合、CPU11の制御により、入力された検索キーワード及び希望スコアはRAM12に記憶されると共に、通信部17から検索システム20に送信される。
【0030】
情報処理装置10から検索キーワードを受付けた検索システム20は、受付けた検索キーワードにヒットしたヒットデータの一覧であるヒットデータリストを情報処理装置10に返信する。通信部17が検索システム20から受付けた(S12)ヒットデータリストは、CPU11の制御によりRAM12に記憶される。CPU11は、RAM12に記憶したヒットデータリストの中からスコアが希望スコア以上のヒットデータを抽出し(S16)、抽出したヒットデータに関する各種情報をRAM12に記憶する(S18)。CPU11は、前記抽出したヒットデータの一覧を出力部16に出力する(S20)。
【0031】
例えば検索システム20が1〜100のスコアをヒットデータに付加しており、希望スコアが80で、ヒットデータリスト内の全ヒットデータ数が386、スコアが80以上のヒットデータ数が63の場合、CPU11により、386個のヒットデータの中から、スコアが80以上の63個のヒットデータが抽出され、出力部16に出力される。
【0032】
上述した第1の実施の形態においては、インターネットなどの通信ネットワーク22に接続された情報処理装置10及び検索システム20を例にして説明を行ったが、例えば情報処理装置10及び検索システム20は社内LAN(Local Area Network)などの通信ネットワークに接続されていてもよい。
【0033】
(第2の実施の形態)
図4(a)に本発明に係る情報処理装置10の例を示す。情報処理装置10は、第1の実施の形態(図1)と同様に、CPU11、RAM12、ハードディスク13、外部記憶部14、入力部15、出力部16及び通信部17を備え、通信部17は通信ネットワーク22を介して検索システム20と接続されている。検索システム20は、第1の実施の形態と同様に、検索キーワードを受付けて、受付けた検索キーワードにヒットしたヒットデータの一覧であるヒットデータリストを返信する。各ヒットデータには、スコアが付加されている。
【0034】
本実施の形態では、通信ネットワーク22には、ユーザが操作するユーザ端末24が接続されており、情報処理装置10は、通信部17がユーザ端末24から受付けた検索キーワードを、CPU11の制御によって通信部17から検索システム20に送信し、検索システム20から受付けたヒットデータリストを、CPU11の制御によって通信部17から前記ユーザ端末24に出力(送信)する。
【0035】
ハードディスク13は、検索システム20から受信したヒットデータリストに含まれる各ヒットデータのスコアのうちの最高スコア及び該ヒットデータリストに対応する検索キーワードを記憶する記憶部として動作する。本説明では、受信したヒットデータリストに含まれる各ヒットデータのスコアのうちの最高スコア及び該ヒットデータリストに対応する検索キーワードを含む検索結果情報が、ハードディスク13に記憶されている。
【0036】
検索結果情報の例を図4(b)に示す。検索結果情報は、各検索キーワードに付与されたキーワードNo、検索に使用された検索キーワード(複数キーワードの組合せの場合もある)、前記検索キーワードにヒットしたヒットデータのうちの最高スコアなどを含む。CPU11は、通信部17が検索システム20からヒットデータリストを受信した場合、ヒットデータリストに含まれる各ヒットデータのスコアのうちの最高スコアを抽出し、抽出した最高スコアを検索キーワードと共に検索結果情報に登録する。
【0037】
通信部17は、希望スコア(目標スコア)を受付ける手段として動作する。また、CPU11は、通信部17が受信したヒットデータリストの中に、スコアが入力部15の受付けた希望スコア以上のヒットデータがある場合、スコアが希望スコア以上のヒットデータを抽出する手段、及び、スコアが前記希望スコア以上のヒットデータが無い場合は、ハードディスク13(検索結果情報)から、前記受信したヒットデータリストに対応する検索キーワードを含み、しかも最高スコアが前記希望スコア以上のヒットデータリストに対応する検索キーワードを読出す手段として動作し、抽出したヒットデータに関する情報又は読出した検索キーワードを通信部17からユーザ端末24に出力する。
【0038】
CD−ROM等の記録媒体19に記録されたコンピュータプログラムを外部記憶部14で読出してハードディスク13又はRAM12に記憶してCPU11に実行させることにより、CPU11を上述した各手段として動作させることが可能である。また、通信部17で他の装置からコンピュータプログラムを受付けてハードディスク13又はRAM12に記憶することも可能である。
【0039】
次に、本発明に係る情報処理装置を用いたデータ検索について説明する。図5にデータ検索手順の例を示す。
CPU11はハードディスク13に記憶されている検索画面を通信部17からユーザ端末24に送信するなどして、通信部17でユーザ端末24から検索キーワード及び希望スコア(目標スコア)を受付ける(S10)。利用者は、ユーザ端末を操作して、例えば図3に示した検索画面の入力欄32に検索キーワードを入力し、入力欄34に希望スコアを入力し、検索ボタン36をクリックする。検索ボタン36がクリックされた場合、ユーザ端末24から情報処理装置10に検索キーワード及び希望スコアが送信され、情報処理装置10の通信部17が受付けた検索キーワード及び希望スコアはCPU11の制御によってRAM12に記憶され、受付けた検索キーワードは通信部17から検索システム20に送信される。
【0040】
情報処理装置10から検索キーワードを受付けた検索システム20は、受付けた検索キーワードにヒットしたヒットデータの一覧であるヒットデータリストを情報処理装置10に返信する。通信部17が検索システム20から受付けた(S12)ヒットデータリストは、CPU11の制御によりRAM12に記憶される。CPU11は、RAM12に記憶したヒットデータリストの最高スコアを抽出してRAM12に記憶し、検索キーワード及び抽出した最高スコアを検索結果情報に登録する。CPU11は、前記ヒットデータリストから抽出した最高スコアとユーザ端末24から受付けた希望スコアとを比較し、最高スコアが希望スコア以上の場合(S14:YES)、スコアが希望スコア以上のヒットデータを抽出し(S16)、抽出したヒットデータに関する各種情報をRAM12に記憶する(S18)。CPU11は、抽出したヒットデータの一覧を通信部17からユーザ端末24に出力する(S20)。
【0041】
最高スコアが希望スコアよりも低い場合(S14:NO)、CPU11は、受付けた検索キーワードを包含する他の検索キーワードを検索結果情報から読出す(S22)。前記他の検索キーワードが無い場合(S24:NO)は、処理を終了する。前記他の検索キーワードがある場合(S24:YES)、CPU11により、前記読出した他の検索キーワードに対応するヒットデータの最高スコアを検索結果情報から読出して、前記読出した検索キーワードと共にRAM12に記憶し、読出した最高スコアと希望スコアとを比較する。読出した最高スコアが希望スコアよりも低い場合(S26:NO)、処理を終了する。読出した最高スコアが希望スコア以上の場合(S26:YES)、CPU11は、最高スコア及び前記読出した他の検索キーワードを通信部17からユーザ端末24に出力する(S28)。
【0042】
読出した他の検索キーワード及び最高スコアの出力画面の例を図6に示す。図6の例では、図3に示した検索画面の下段に、読出した他の検索キーワード及び最高スコアが表示されている。読出した他の検索キーワード(図6では「aaaa」,「bbbb」及び「cccc」と、「aaaa」,「bbbb」及び「dddd」)は、通信部17でユーザ端末24から受付けた元の検索キーワード(図6では「aaaa」及び「bbbb」)を含んだ検索キーワードである。利用者は、読出した他の検索キーワード及び最高スコアを参考にして、前記読出した他の検索キーワード又は新たな検索キーワードを入力欄32に入力して再検索を行うことが可能である。
【0043】
(第3の実施の形態)
図7に本発明に係る情報処理装置10の例を示す。情報処理装置10は、第2の実施の形態(図4)と同様に、CPU11、RAM12、ハードディスク13、外部記憶部14、入力部15、出力部16及び通信部17を備え、通信部17は通信ネットワーク22を介して検索システム20及びユーザ端末24と接続されている。検索システム20は、第1の実施の形態と同様に、検索キーワードを受付けて、受付けた検索キーワードにヒットしたヒットデータの一覧であるヒットデータリストを返信する。各ヒットデータにはスコアが付加されている。
【0044】
本実施の形態では、通信部17により、通信ネットワーク22に接続されたユーザ端末24から検索キーワード及び検索実行日時とを予め受付けておき、CPU11の制御により、受付けた検索実行日時に、受付けた検索キーワードを通信部17から検索システム20に送信し、検索を行う。また、CPU11の制御により、通信部17が検索システム20から受付けた検索結果(ヒットデータリスト)をハードディスク13に保存する。本説明では、インターネット上のウェブサイトを構成するHTML(Hyper Text Markup Language)データの検索を例にして説明を行う。各ヒットデータ(HTMLデータ)は、アドレス(URL:Universal Resource Locator)、タイトル及びテキスト(表示文字部分)を有する。
【0045】
通信部17は、ユーザ端末24から希望スコア(目標スコア)を受付ける手段として動作し、CPU11は、通信部17が受信したヒットデータリストの中から、スコアが通信部17の受付けた希望スコア以上のヒットデータを抽出する手段として動作し、ハードディスク13は、前記CPU11が抽出したヒットデータに関する情報を記憶する記憶部として動作する。また、CPU11は、ハードディスク13に新しく記憶されたヒットデータに関する情報を検出する手段として動作し、検出したヒットデータに関する情報を通信部17からユーザ端末24に出力(送信)する。
【0046】
ハードディスク13には、検索を行う利用者に関する利用者情報、利用者が指定した検索キーワード及び希望ヒット率などに関するキーワード情報、及び、利用者が指定した検索キーワードにヒットしたヒットデータに関するヒットデータ情報が記憶される。利用者情報の例を図8(a)に示す。利用者情報は、各利用者を識別する利用者No、利用者名、パスワード、電子メールアドレス、自動巡回頻度、巡回時刻などを含む。自動巡回頻度は、例えば毎日、毎週月曜日、又は、毎月10日などの頻度が設定される。利用者情報の「利用者名」、「パスワード」、「電子メールアドレス」、「自動巡回頻度」、「巡回時刻」などは、通信部17でユーザ端末24から受付けた設定に基づいて、CPU11で更新する。
【0047】
キーワード情報の例を図8(b)に示す。キーワード情報は、例えば利用者No、検索キーワード(複数キーワードの組合せの場合もあり)を識別するキーワードNo、検索キーワード、希望スコア、最高スコアなどを含む。キーワード情報の「検索キーワード」、「希望スコア」などは、通信部17でユーザ端末24から受付けた設定に基づいて、CPU11で更新する。また、キーワード情報の「最高スコア」は、例えば第2の実施の形態と同様にして、検索システム20から受付けたヒットデータリストに基づいてCPU11で更新することが可能である。
【0048】
ヒットデータ情報の例を図8(c)に示す。ヒットデータ情報は、例えば利用者No、ヒットデータを識別するヒットデータNo、ヒットデータ(HTMLデータ)のURL、ヒットデータのタイトル、ヒットデータの検索に使用したキーワードNo、ヒットデータのスコア、新着であるか否か(“1:新着”or“0:出力済み”)を示す新着フラグ、ヒットデータのテキストなどを含む。ヒットデータ情報の「URL」、「タイトル」、「キーワードNo」、「スコア」、「テキスト」は、例えば検索システム20から受付けたヒットデータリストに基づいてCPU11で更新することが可能である。また、ヒットデータ情報の「新着フラグ」は、例えば通信部17からユーザ端末24に出力する際、CPU11で“0”に更新することが可能である。
【0049】
CD−ROM等の記録媒体19に記録されたコンピュータプログラムを外部記憶部14で読出してハードディスク13又はRAM12に記憶してCPU11に実行させることにより、CPU11を上述した各手段として動作させることが可能である。また、通信部17で他の装置からコンピュータプログラムを受付けてハードディスク13又はRAM12に記憶することも可能である。
【0050】
次に、本発明に係る情報処理装置を用いたデータ検索について説明する。
検索キーワード、希望スコア、自動巡回頻度及び巡回時刻などの設定は、通信部17でユーザ端末24から受付け、CPU11によりハードディスク13の利用者情報又はキーワード情報に予め記憶されている。CPU11は、現日時を監視し、利用者情報に含まれる自動巡回頻度及び巡回時刻に達した場合は、自動巡回処理を行う。自動巡回処理の実行手順の例を図9に示す。
【0051】
CPU11は、ハードディスク13に記憶されているキーワード情報から、検索キーワード及び及び希望スコア(目標スコア)を読出して(S40)、RAM12に記憶する。CPU11の制御により、読出した検索キーワードは通信部17から検索システム20に送信される。情報処理装置10から検索キーワードを受付けた検索システム20は、受付けた検索キーワードにヒットしたヒットデータの一覧であるヒットデータリストを情報処理装置10に送信する。通信部17が検索システム20から受付けた(S42)ヒットデータリストは、CPU11の制御によりRAM12に記憶される。
【0052】
CPU11は、RAM12に記憶したヒットデータリストの最高スコアを抽出してRAM12に記憶し、抽出した最高スコアと希望スコアとを比較し、最高スコアが希望スコア以上の場合(S44:YES)、スコアが希望スコア以上のヒットデータを抽出し(S46)、ヒットデータ情報に基づいて、前記抽出したヒットデータのURLが新規であるか否かを判定する。URLが新規な場合(S48:YES)、CPU11は、抽出したヒットデータに関する各種情報をヒットデータ情報(ただし、新着フラグは“1”)に記憶する(S50)。
【0053】
抽出したヒットデータを記憶(S50)した場合、最高スコアが希望スコアよりも低い場合(S44:NO)、又は、URLが新規でない場合(S48:NO)、CPU11は、キーワード情報を参照して他の検索キーワードの有無を判定する。他の検索キーワードがある場合(S52:YES)、同様の検索処理を行う。他の検索キーワードが無い場合(S52:NO)、CPU11は、新規ヒットデータ(新着フラグ=“1”)の一覧を通信部17からユーザ端末24に出力する(S54)。出力した新規ヒットデータの新着フラグは、CPU11により、“0”に更新される。
【0054】
前記抽出したヒットデータの出力画面の例を図10に示す。図10に示す例では、キーワード情報に含まれる検索キーワード及び希望スコアと、ヒットデータ情報に含まれる前記抽出したヒットデータ(HTMLデータ)のタイトル、スコア及びURLが表示されている。
【0055】
上述した第3の実施の形態においては、情報処理装置10の通信部17でユーザ端末24から利用者情報及びキーワード情報に関する各種設定を受付け、新着情報を通信部17からユーザ端末24に出力したが、第1の実施の形態(図1)と同様に、ユーザ端末24を使用せず、入力部15でユーザから利用者情報及びキーワード情報に関する各種設定を受付け、新着情報を出力部16に出力することも可能である。
【0056】
(第4の実施の形態)
図11に本発明に係る情報処理装置10の例を示す。情報処理装置10は、第2の実施の形態(図4)と同様に、CPU11、RAM12、ハードディスク13、外部記憶部14、入力部15、出力部16及び通信部17を備え、通信部17は通信ネットワーク22を介して検索システム20及びユーザ端末24と接続されている。検索システム20は、第1の実施の形態と同様に、検索キーワードを受付けて、受付けた検索キーワードにヒットしたヒットデータの一覧であるヒットデータリストを返信する。
【0057】
本説明では、インターネット上のウェブサイトを構成するHTML(Hyper Text Markup Language)データの検索を例にして説明を行う。各ヒットデータ(HTMLデータ)は、URL(Universal Resource Locator)、タイトル及びテキスト(表示文字部分)を有する。本実施の形態において、ハードディスク13は、通信部17が検索システム20から受付けたヒットデータリストに含まれる各ヒットデータのアドレス、テキスト(内容情報)及び検索キーワードを含んだヒットデータ情報を記憶する記憶部として動作する。
【0058】
ヒットデータ情報の例を図12(a)に示す。ヒットデータ情報は、例えばヒットデータを識別するヒットデータNo、ヒットデータ(HTMLデータ)のURL、ヒットデータのタイトル、ヒットデータの検索に使用した検索キーワード(複数キーワードの組合せの場合もある)、ヒットデータのスコア、及び、ヒットデータのテキストなどを含む。ヒットデータ情報の「URL」、「タイトル」、「検索キーワード」、「スコア」、「テキスト」は、例えば検索システム20から受付けたヒットデータリストに基づいてCPU11で更新することが可能である。
【0059】
通信部17は、通信ネットワーク22に接続されたユーザ端末24から、ヒットデータ(HTMLデータ)のURL(アドレス)を受付ける手段として動作し、CPU11は、通信部17が受付けたURLのヒットデータに対応するテキスト(内容情報)及び検索キーワードをハードディスク(ヒットデータ情報)13から読出す手段、及び、読出した検索キーワードを通信部17から検索システム20に送信する手段として動作する。
【0060】
また、CPU11は、検索システム20から受信したヒットデータリストに含まれる各ヒットデータの中から、テキスト(内容情報)が前記読出したテキスト(内容情報)に類似するヒットデータを検出する手段として動作し、検出したヒットデータに関する情報をハードディスク13(URL変更情報)に記憶すると共に、通信部17からユーザ端末17に出力する。URL変更情報の例を図12(b)に示す。URL変更情報は、通信部17でユーザ端末24から受付けたURLのヒットデータのヒットデータNo、前記検出したヒットデータのURL(候補URL)及びタイトルを含む。
【0061】
CD−ROM等の記録媒体19に記録されたコンピュータプログラムを外部記憶部14で読出してハードディスク13又はRAM12に記憶してCPU11に実行させることにより、CPU11を上述した各手段として動作させることが可能である。また、通信部17で他の装置からコンピュータプログラムを受付けてハードディスク13又はRAM12に記憶することも可能である。
【0062】
次に、本発明に係る情報処理装置を用いたデータ検索について説明する。
CPU11は、通信部17でユーザ端末24から受付けた検索キーワードを通信部17から検索システム20に送信し、通信部17が検索システム20から受付けたヒットデータリストの各ヒットデータ(HTMLデータ)に関する情報及び検索キーワードをヒットデータ情報に記憶している。アクセスが不能になったURLの検索手順の例を図13に示す。
【0063】
CPU11は、通信部17でユーザ端末24からアクセス不能になったURLを受付けた(S60)場合、受付けたURLに関する検索キーワード及びテキストなどの各種情報をヒットデータ情報から読出して(S62)、RAM12に記憶する。前記受付けたURLに対応する検索キーワードを読出した場合(S64:YES)、CPU11により、前記読出した検索キーワードを通信部17から検索システム20に送信し、検索システム20からヒットデータリストを受付ける(S66)。検索キーワードを読出せなかった場合(S64:NO)は、処理を終了する。
【0064】
通信部17が検索システム20から受付けたヒットデータリストは、CPU11の制御により、RAM12に記憶され、候補URLの抽出が行われる(S68)。例えば、CPU11により、受付けたヒットデータリストの各ヒットデータのテキストを抽出してRAM12に記憶し、受付けたURLのヒットデータの中から、テキストが前記読出したテキストと類似するヒットデータを抽出する。テキストの類似は、テキスト内の文字一致部分の割合が所定値以上の場合、類似していると判定することが可能である。
【0065】
候補URLがある場合(S70:YES)、CPU11は、候補URLに関する情報をハードディスク13のURL変更情報に記憶すると共に、通信部17からユーザ端末24に出力する(S72)。候補URLがない場合(S70:NO)は、処理を終了する。候補URLに関する情報の出力画面の例を図14に示す。図14の例では、通信部17でユーザ端末24から受付けたURLと、受付けたURLに対応するヒットデータのタイトル及び検索キーワードと、候補URL及びタイトルが表示されている。
【0066】
上述した第1又は第2の実施の形態、第3の実施の形態及び第4の実施の形態は、3つのうちの任意の2つを組合せたり、3つ全てを組合せることが可能である。スコアは、検索システム側で各ヒットデータに付加する数値であり、検索システムごとに呼び名が変わる場合もあるが、数値が高いほどヒットデータリストの先頭側に配置される。また、スコアは、検索システム側が各ヒットデータに付加する指標であり、数値に限定はされず、例えば“A”〜“E”の5段階のレベルで表される場合、又は、棒グラフで表される場合などもある。
【0067】
(付記1) 検索キーワードを情報処理装置から検索システムに送信し、送信した検索キーワードにヒットしたヒットデータにスコアが付加されているヒットデータリストを情報処理装置で受信及び出力する情報処理方法において、
目標スコアを情報処理装置で受付けるステップと、
受信したヒットデータリストの中から、スコアが前記受付けた目標スコア以上のヒットデータを情報処理装置で抽出するステップと
を有し、前記抽出したヒットデータに関する情報を情報処理装置から出力することを特徴とする情報処理方法。
(付記2) 検索キーワードを情報処理装置から検索システムに送信し、送信した検索キーワードにヒットしたヒットデータにスコアが付加されているヒットデータリストを情報処理装置で受信する情報処理システムにおいて、
前記情報処理装置は、
目標スコアを受付ける受付手段と、
検索システムから受信したヒットデータリストの中から、スコアが受付手段の受付けた目標スコア以上のヒットデータを抽出する抽出手段と
を備え、該抽出手段が抽出したヒットデータに関する情報を出力するように構成されていることを特徴とする情報処理システム。
(付記3) 検索キーワードを検索システムに送信する送信手段を備え、該送信手段が送信した検索キーワードにヒットしたヒットデータにスコアが付加されているヒットデータリストを受信する情報処理装置において、
目標スコアを受付ける受付手段と、
受信したヒットデータリストの中から、スコアが受付手段の受付けた目標スコア以上のヒットデータを抽出する抽出手段と
を備え、該抽出手段が抽出したヒットデータに関する情報を出力するように構成されていることを特徴とする情報処理装置。
(付記4) コンピュータに、検索キーワードを検索システムへ送信させ、送信した検索キーワードにヒットしたヒットデータにスコアが付加されているヒットデータリストを受信させるコンピュータプログラムにおいて、
コンピュータに、目標スコアを受付けさせる手順と、
コンピュータに、受信したヒットデータリストの中から、スコアが前記受付けた目標スコア以上のヒットデータを抽出させる手順と、
コンピュータに、前記抽出したヒットデータに関する情報を出力させる手順と
を含むことを特徴とするコンピュータプログラム。
(付記5) コンピュータに、複数キーワードの組合せ又は1キーワードを含む検索キーワードを検索システムへ送信させ、送信した検索キーワードにヒットしたヒットデータにスコアが付加されているヒットデータリストを受信させるコンピュータプログラムにおいて、
コンピュータに、受信したヒットデータリストに含まれるヒットデータのスコアのうちの最高スコア及び該ヒットデータリストに対応する検索キーワードを所定記憶領域に記憶させる手順と、
コンピュータに、目標スコアを受付けさせる手順と、
コンピュータに、受信したヒットデータリストの中から、スコアが前記受付けた目標スコア以上のヒットデータを抽出させる手順と、
コンピュータに、目標スコア以上のヒットデータが抽出できなかった場合、前記所定記憶領域から、前記受信したヒットデータリストに対応する検索キーワードを含み、しかも最高スコアが目標スコア以上のヒットデータリストに対応する検索キーワードを読出させる手順と、
コンピュータに、前記抽出したヒットデータに関する情報又は前記読出した検索キーワードを出力させる手順と
を含むことを特徴とするコンピュータプログラム。
(付記6) コンピュータに、所定検索キーワードを定期的に検索システムへ送信させ、送信した所定検索キーワードにヒットしたヒットデータにスコアが付加されているヒットデータリストを受信させるコンピュータプログラムにおいて、
コンピュータに、目標スコアを受付けさせる手順と、
コンピュータに、受信したヒットデータリストの中から、スコアが前記受付けた目標スコア以上のヒットデータを抽出させる手順と、
コンピュータに、前記抽出したヒットデータに関する情報を所定記憶領域に記憶させる手順と、
コンピュータに、前記所定記憶領域に新しく記憶されたヒットデータに関する情報を検出させる手順と、
コンピュータに、前記検出したヒットデータに関する情報を出力させる手順と
を含むことを特徴とするコンピュータプログラム。
(付記7) コンピュータに、検索キーワードを検索システムへ送信させ、送信した検索キーワードにヒットしたヒットデータが含まれるヒットデータリストを受信させるコンピュータプログラムにおいて、
コンピュータに、受信したヒットデータリストに含まれるヒットデータのアドレス、内容情報及び検索キーワードを所定記憶領域に記憶させる手順と、
コンピュータに、ヒットデータのアドレスを受付けさせる手順と、
コンピュータに、前記受付けたアドレスに対応する内容情報及び検索キーワードを前記所定記憶領域から読出させる手順と、
コンピュータに、前記読出した検索キーワードを検索システムへ送信させる手順と、
コンピュータに、前記検索キーワードの送信に応じて受信したヒットデータリストに含まれるヒットデータの中から、内容情報が前記読出した内容情報に類似するヒットデータを抽出させる手順と、
コンピュータに、前記抽出したヒットデータに関する情報を出力させる手順と
を含むことを特徴とするコンピュータプログラム。
【0068】
【発明の効果】
第1又は第2発明によれば、検索システムから受信したヒットデータリストの中から、スコアが目標スコア以上のヒットデータを抽出することにより、出力を行うヒットデータ数を減少させることが可能である。また、抽出したヒットデータのスコアは目標スコアよりも高く、出力を行うヒットデータは、検索キーワードに関連の深い情報である可能性が高いと考えられる。
【0069】
第3発明によれば、スコアが目標スコア以上のヒットデータを抽出できなかった場合、検索に使用した検索キーワードを含み、最高スコアが目標スコア以上の検索キーワードを過去の検索結果から取得して出力することにより、再検索用の検索キーワードの決定を補助することが可能である。また、前記出力を行った検索キーワードは、最高スコアが目標スコア以上であり、検索キーワードに関連の深い情報である可能性が高いと考えられる。
【0070】
第4発明によれば、定期的に所定検索キーワードを検索システムに送信し、検索システムから受信したヒットデータリストから、スコアが目標スコア以上のヒットデータを抽出して記憶部に記憶することにより、所定検索キーワードにヒットした新規のヒットデータの一覧を出力することが可能である。また、前記出力される新規のヒットデータは、スコアが目標スコア以上であり、検索キーワードに関連の深い情報である可能性が高いと考えられる。
【0071】
第5発明によれば、検索システムから受信したヒットデータリストに含まれるヒットデータのアドレス、内容情報及び検索キーワードを記憶部に記憶しておくことにより、アクセスできなくなったヒットデータに対して過去に行った検索に関する検索キーワード及び内容情報を記憶部から取得することができ、取得した検索キーワード及び内容情報に基づいて、アクセスできなくなったヒットデータを検索することが可能である。
【図面の簡単な説明】
【図1】本発明に係る情報処理装置の例を示すブロック図である。
【図2】データ検索手順の例を示すフローチャートである。
【図3】検索画面の例を示す図である。
【図4】(a)は本発明に係る情報処理装置の例を示すブロック図であり、(b)は検索結果情報の例を示す図である。
【図5】データ検索手順の例を示すフローチャートである。
【図6】出力画面の例を示す図である。
【図7】本発明に係る情報処理装置の例を示すブロック図である。
【図8】(a)は利用者情報の例を示す図であり、(b)はキーワード情報の例を示す図であり、(c)はヒットデータ情報の例を示す図である。
【図9】自動巡回処理の実行手順の例を示すフローチャートである。
【図10】出力画面の例を示す図である。
【図11】本発明に係る情報処理装置の例を示すブロック図である。
【図12】(a)はヒットデータ情報の例を示す図であり、(b)はURL変更情報の例を示す図である。
【図13】アクセスが不能になったURLの検索手順の例を示すフローチャートである。
【図14】出力画面の例を示す図である。
【符号の説明】
10 情報処理装置
11 CPU
12 RAM
13 ハードディスク(記憶部)
14 外部記憶部
15 入力部
16 出力部
17 通信部
20 検索システム
22 通信ネットワーク[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to an information processing method of transmitting a search keyword from an information processing apparatus to a search system, and receiving and outputting, by the information processing apparatus, a hit data list in which a score is added to hit data hitting the transmitted search keyword, and The present invention relates to a computer program that causes a computer to transmit a search keyword and receive a hit data list in which a score is added to hit data that hits the transmitted search keyword.
[0002]
[Prior art]
With the spread of the Internet, the opportunity to search for necessary information from the Internet tends to increase. When searching for necessary information, access a search site and enter a search keyword related to the required information to perform a search. However, the amount of information on the Internet is enormous, and a large amount of data (web page) hits a search keyword in many cases. When there is a large amount of hit data (hit pages), it becomes necessary to reconsider the search keyword or to repeat the search many times.
[0003]
Some search sites add a score (or point) uniquely calculated by the search site to each hit data (hit page) so that the user can browse the hit data with reference to the score. There are places. The score is determined by each search site independently, for example, based on the number of search keywords in the hit data or based on the number of links to the hit data.In general, the higher the score, the higher the score In many cases, the information is closely related to the search keyword.
[0004]
Also, there is a method of assisting the input of a search keyword by creating a database of search keywords input in the past and displaying a search keyword candidate list that matches forward with the character input by the user (for example, see Patent Document 1). .
[0005]
[Patent Document 1]
JP 2001-249933 A
[0006]
[Problems to be solved by the invention]
By adding a score to each hit page, each hit page can be browsed with reference to the score. However, the user receives a hit page list including a large number of hit pages as in the related art. In the method of displaying the search keyword candidate list, only the input efficiency of the search keyword is improved, and the user receives a hit page list including a large number of hit pages as in the related art.
[0007]
In addition, information in the Internet changes every day, and new pages are added or addresses (URLs) are changed. When searching for a newly added page or a page whose address has been changed, as described above, it is necessary to check a large number of hit pages, which is troublesome.
[0008]
The present invention has been made in view of such circumstances, and reduces the number of hit data to be output by extracting hit data whose score is equal to or more than a target score from a hit data list received from a search system. It is an object of the present invention to provide an information processing method and a computer program capable of performing the same.
[0009]
Further, according to the present invention, when hit data whose score is equal to or higher than the target score cannot be extracted, the search keyword including the original search keyword and having the highest score equal to or higher than the target score is output, so that the search keyword for re-search is output. Another object is to provide a computer program capable of assisting a decision.
[0010]
In addition, the present invention periodically transmits a predetermined search keyword to a search system and stores hit data in a hit data list received from the search system in a storage unit, so that a target score equal to or more than a target score hit by the predetermined search keyword is obtained. It is another object to provide a computer program capable of outputting a list of new hit data.
[0011]
Further, the present invention provides a computer program capable of searching for the inaccessible hit data based on a search keyword and content information relating to a search performed in the past for the inaccessible hit data. For other purposes.
[0012]
[Means for Solving the Problems]
An information processing method according to a first invention transmits a search keyword from an information processing apparatus to a search system, and receives and outputs a hit data list in which a score is added to hit data hit by the transmitted search keyword. In the information processing method, a target score is received by the information processing device, and, from the received hit data list, the information processing device has a step of extracting hit data whose score is equal to or greater than the received target score by the information processing device, The information on the extracted hit data is output from an information processing device.
[0013]
A computer program according to a second aspect of the present invention is a computer program that causes a computer to transmit a search keyword to a search system and receive a hit data list in which a score is added to hit data hit by the transmitted search keyword. Receiving the target score, causing the computer to extract, from the received hit data list, hit data whose score is equal to or greater than the received target score, and causing the computer to output information on the extracted hit data. And a procedure.
[0014]
A computer program according to a third aspect of the present invention causes a computer to transmit a search keyword including a combination of a plurality of keywords or one keyword to a search system, and generates a hit data list in which a score is added to hit data hit by the transmitted search keyword. In the computer program to be received, a procedure for causing the computer to store the highest score among the scores of the hit data included in the received hit data list and a search keyword corresponding to the hit data list in a predetermined storage area; A step of receiving a score; and a step of causing a computer to extract, from the received hit data list, hit data whose score is equal to or greater than the received target score. If so, from the predetermined storage area, a step of causing the computer to read a search keyword corresponding to the hit data list including the search keyword corresponding to the received hit data list and having the highest score equal to or higher than the target score, Outputting information on the extracted hit data or the read search keyword.
[0015]
A computer program according to a fourth aspect of the present invention causes a computer to periodically transmit a predetermined search keyword to a search system, and to receive a hit data list in which a score is added to hit data that hits the transmitted predetermined search keyword. A step of causing the computer to receive a target score; a step of causing the computer to extract, from the received hit data list, hit data whose score is equal to or greater than the received target score; and A step of storing information about the hit data newly stored in the predetermined storage area, and a step of causing the computer to output information about the detected hit data. Including It is characterized in.
[0016]
A computer program according to a fifth aspect of the present invention is a computer program for causing a computer to transmit a search keyword to a search system and to receive a hit data list including hit data hit by the transmitted search keyword. A procedure for storing the address of the hit data, the content information, and the search keyword included in the list in a predetermined storage area; a procedure for causing the computer to accept the address of the hit data; A step of reading a search keyword from the predetermined storage area, a step of causing a computer to transmit the read search keyword to a search system, and a step of causing the computer to search for hit data received in response to the transmission of the search keyword. A step of extracting, from among the hit data included in the list, hit data whose content information is similar to the read content information, and a step of causing a computer to output information relating to the extracted hit data. I do.
[0017]
In the first or second invention, a target score is received, hit data whose score is equal to or greater than the received target score is extracted from the hit data list received from the search system, and information on the extracted hit data is output. . In general, the hit data list received from the search system often includes a large amount of hit data, and the higher the score, the more often the information is related to the search keyword. The number of hit data to be output can be reduced by extracting hit data whose score is equal to or greater than the target score from a hit data list including a large amount of hit data. The score of the extracted hit data is equal to or higher than the target score, and it is considered that the hit data to be output is likely to be information closely related to the search keyword.
[0018]
In the third invention, the highest score among the scores of the hit data included in the hit data list received from the search system and the search keyword corresponding to the hit data list are stored in the storage unit. A target score is received, hit data having a score equal to or higher than the received target score is extracted from the hit data list received from the search system, and information on the extracted hit data is output. If the hit data whose score is equal to or more than the target score cannot be extracted, the search keyword including the search keyword corresponding to the received hit data list and the highest score corresponding to the hit data list whose target score is equal to or more than the target score is used. The search keyword is read from the storage unit, and the read search keyword is output. In general, hit data with a higher score is often more relevant to the search keyword, and if the highest score among the hit data included in the hit data list is lower than the target score, It is highly likely that the hit data that is closely related is not included much. The output search keyword includes the search keyword used for the search, is a search keyword that can be used for a refined search, and can be used as a reference for a re-search. Further, it is considered that the output search keyword has the highest score equal to or higher than the target score, and is likely to be information closely related to the search keyword.
[0019]
In the fourth invention, a target score is received, a predetermined search keyword is periodically transmitted to a search system, and hit data whose score is equal to or greater than the received target score is extracted from a hit data list received from the search system. Then, information on the extracted hit data is stored in the storage unit. The information on the hit data newly stored in the storage unit is detected, and the information on the detected hit data is output. Since the predetermined search keyword is periodically transmitted to the search system and the hit data in the hit data list received from the search system is stored in the storage unit, the hit data newly stored in the storage unit is newly searched. It is possible to output a list of new hit data that hit the predetermined search keyword. The hit data stored in the storage unit has a score equal to or higher than the target score, and is considered to be highly likely to be information closely related to the search keyword.
[0020]
In the fifth invention, the address, the content information, and the search keyword of the hit data included in the hit data list received from the search system are stored in the storage unit. The address of the hit data is received, the content information of the hit data at the received address and the search keyword are read from the storage unit, and the read search keyword is transmitted to the search system. Hit data whose content information is similar to the read content information is extracted from hit data included in the hit data list received in response to the transmission of the search keyword, and the extracted hit data is output. In a communication network to which an unspecified number of servers such as the Internet are connected, not only new data is added or changed, but also published data is often transferred to another server, and it is possible to access until now. You may suddenly lose access to your data. In the case where the address of the inaccessible data is stored in the storage unit, a search keyword and content information relating to a search performed in the past with respect to the hit data inaccessible can be obtained, and the search is performed again using the obtained search keyword. It is possible to do. Of the search results, hit data whose content information is similar to the acquired content information is highly likely to be the address destination of the inaccessible data.
[0021]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, the present invention will be specifically described with reference to the drawings showing the embodiments.
(First Embodiment)
FIG. 1 shows an example of an
[0022]
The
[0023]
The
[0024]
The
[0025]
Further, for example, the
[0026]
The input unit 15 (or the communication unit 17) operates as a unit that receives a desired score (target score). The
[0027]
By reading out the computer program recorded on the
[0028]
Next, a data search using the information processing apparatus according to the present invention will be described. In this description, it is assumed that a search keyword and a desired score (target score) are received from the
[0029]
The
[0030]
The
[0031]
For example, when the
[0032]
In the first embodiment, the
[0033]
(Second embodiment)
FIG. 4A shows an example of the
[0034]
In the present embodiment, a
[0035]
The
[0036]
FIG. 4B shows an example of the search result information. The search result information includes the keyword No. assigned to each search keyword, the search keyword used in the search (may be a combination of a plurality of keywords), the highest score among the hit data hitting the search keyword, and the like. When the
[0037]
The
[0038]
By reading out the computer program recorded on the
[0039]
Next, a data search using the information processing apparatus according to the present invention will be described. FIG. 5 shows an example of the data search procedure.
The
[0040]
The
[0041]
When the highest score is lower than the desired score (S14: NO), the
[0042]
FIG. 6 shows an example of an output screen of another read keyword and the highest score. In the example of FIG. 6, the read other search keywords and the highest score are displayed in the lower part of the search screen shown in FIG. The other read search keywords (“aaaa”, “bbbb”, and “cccc”, and “aaaa”, “bbbb”, and “dddd” in FIG. 6) are the same as the original search keyword received from the
[0043]
(Third embodiment)
FIG. 7 shows an example of the
[0044]
In the present embodiment, the search keyword and the search execution date and time are received in advance from the
[0045]
The
[0046]
The
[0047]
FIG. 8B shows an example of the keyword information. The keyword information includes, for example, a user number, a keyword number for identifying a search keyword (in some cases, a combination of a plurality of keywords), a search keyword, a desired score, a highest score, and the like. The keyword information “search keyword”, “desired score”, and the like are updated by the
[0048]
FIG. 8C shows an example of hit data information. The hit data information includes, for example, a user No., a hit data No. identifying the hit data, a URL of the hit data (HTML data), a title of the hit data, a keyword No. used for searching the hit data, a score of the hit data, and a new arrival. A new arrival flag indicating whether or not there is (“1: new arrival” or “0: already output”), a text of hit data, and the like are included. The hit data information “URL”, “title”, “keyword No”, “score”, and “text” can be updated by the
[0049]
By reading out the computer program recorded on the
[0050]
Next, a data search using the information processing apparatus according to the present invention will be described.
Settings such as a search keyword, a desired score, an automatic tour frequency, and a tour time are received from the
[0051]
The
[0052]
The
[0053]
When the extracted hit data is stored (S50), when the highest score is lower than the desired score (S44: NO), or when the URL is not new (S48: NO), the
[0054]
FIG. 10 shows an example of an output screen of the extracted hit data. In the example shown in FIG. 10, a search keyword and a desired score included in the keyword information, and a title, a score, and a URL of the extracted hit data (HTML data) included in the hit data information are displayed.
[0055]
In the above-described third embodiment, the
[0056]
(Fourth embodiment)
FIG. 11 shows an example of the
[0057]
In this description, an example will be described in which HTML (Hyper Text Markup Language) data constituting a website on the Internet is searched. Each hit data (HTML data) has a URL (Universal Resource Locator), a title, and a text (display character portion). In the present embodiment, the
[0058]
FIG. 12A shows an example of hit data information. The hit data information includes, for example, hit data No for identifying hit data, URL of hit data (HTML data), title of hit data, search keyword used for search of hit data (may be a combination of plural keywords), hit It includes the score of the data and the text of the hit data. The “URL”, “title”, “search keyword”, “score”, and “text” of the hit data information can be updated by the
[0059]
The
[0060]
Further, the
[0061]
By reading out the computer program recorded on the
[0062]
Next, a data search using the information processing apparatus according to the present invention will be described.
The
[0063]
When the
[0064]
The hit data list received by the
[0065]
If there is a candidate URL (S70: YES), the
[0066]
In the first or second embodiment, the third embodiment, and the fourth embodiment, any two of the three can be combined or all three can be combined. . The score is a numerical value added to each hit data on the search system side, and the name may change for each search system. However, the higher the numerical value, the higher the score is placed at the head of the hit data list. The score is an index added to each hit data by the search system, and is not limited to a numerical value. For example, the score is represented by five levels of “A” to “E”, or is represented by a bar graph. There are some cases.
[0067]
(Supplementary Note 1) In an information processing method, a search keyword is transmitted from an information processing apparatus to a search system, and a hit data list in which a score is added to hit data hit by the transmitted search keyword is received and output by the information processing apparatus.
Receiving the target score by the information processing device;
Extracting, from the received hit data list, hit data whose score is equal to or greater than the received target score by the information processing device;
An information processing method comprising: outputting information on the extracted hit data from an information processing apparatus.
(Supplementary Note 2) In an information processing system, a search keyword is transmitted from an information processing apparatus to a search system, and a hit data list in which a score is added to hit data hit by the transmitted search keyword is received by the information processing apparatus.
The information processing device,
A receiving means for receiving the target score;
Extracting means for extracting, from the hit data list received from the search system, hit data whose score is equal to or higher than the target score received by the receiving means;
And an information processing system configured to output information relating to the hit data extracted by the extraction means.
(Supplementary Note 3) An information processing apparatus, comprising: a transmission unit that transmits a search keyword to a search system; and a hit data list in which a score is added to hit data that hits the search keyword transmitted by the transmission unit.
A receiving means for receiving the target score;
Extracting means for extracting hit data whose score is equal to or higher than the target score received by the receiving means from the received hit data list;
And an information processing apparatus configured to output information on the hit data extracted by the extraction means.
(Supplementary Note 4) In a computer program that causes a computer to transmit a search keyword to a search system and receive a hit data list in which a score is added to hit data that hits the transmitted search keyword,
Steps to get the computer to receive the target score,
A procedure for causing the computer to extract, from the received hit data list, hit data whose score is equal to or greater than the received target score,
Causing the computer to output information on the extracted hit data; and
A computer program characterized by including:
(Supplementary note 5) A computer program that causes a computer to transmit a search keyword including a combination of a plurality of keywords or one keyword to a search system and receive a hit data list in which a score is added to hit data that hits the transmitted search keyword. ,
A step of causing the computer to store, in a predetermined storage area, the highest score among the scores of the hit data included in the received hit data list and the search keyword corresponding to the hit data list;
Steps to get the computer to receive the target score,
A procedure for causing the computer to extract, from the received hit data list, hit data whose score is equal to or greater than the received target score,
If the computer does not extract hit data having a target score or more, the search data includes a search keyword corresponding to the received hit data list, and the highest score corresponds to the hit data list having the target score or more. A procedure for reading the search keyword;
Causing the computer to output information on the extracted hit data or the read search keyword;
A computer program characterized by including:
(Supplementary Note 6) In a computer program for causing a computer to periodically transmit a predetermined search keyword to a search system and receive a hit data list in which a score is added to hit data hitting the transmitted predetermined search keyword,
Steps to get the computer to receive the target score,
A procedure for causing the computer to extract, from the received hit data list, hit data whose score is equal to or greater than the received target score,
A procedure for causing a computer to store information on the extracted hit data in a predetermined storage area;
Causing the computer to detect information about hit data newly stored in the predetermined storage area;
Causing the computer to output information about the detected hit data; and
A computer program characterized by including:
(Supplementary Note 7) In a computer program for causing a computer to transmit a search keyword to a search system and receive a hit data list including hit data hit by the transmitted search keyword,
A procedure for causing the computer to store the address, the content information, and the search keyword of the hit data included in the received hit data list in a predetermined storage area;
Steps to make the computer accept the address of the hit data,
Causing the computer to read content information and a search keyword corresponding to the received address from the predetermined storage area;
Causing a computer to transmit the read search keyword to a search system;
Causing the computer to extract, from the hit data included in the hit data list received in response to the transmission of the search keyword, hit data whose content information is similar to the read content information,
Causing the computer to output information on the extracted hit data; and
A computer program characterized by including:
[0068]
【The invention's effect】
According to the first or second aspect of the present invention, it is possible to reduce the number of hit data to be output by extracting hit data whose score is equal to or more than the target score from the hit data list received from the search system. . Also, the score of the extracted hit data is higher than the target score, and it is considered that the hit data to be output is likely to be information closely related to the search keyword.
[0069]
According to the third invention, when hit data whose score is equal to or higher than the target score cannot be extracted, a search keyword including the search keyword used for the search and having the highest score equal to or higher than the target score is obtained from the past search results and output. By doing so, it is possible to assist in determining a search keyword for re-search. Further, it is considered that the output search keyword has the highest score equal to or higher than the target score, and is likely to be information closely related to the search keyword.
[0070]
According to the fourth aspect, a predetermined search keyword is periodically transmitted to the search system, and hit data having a score equal to or higher than the target score is extracted from the hit data list received from the search system and stored in the storage unit. It is possible to output a list of new hit data hitting the predetermined search keyword. In addition, the new hit data to be output has a score equal to or higher than the target score, and is considered to be highly likely to be information closely related to the search keyword.
[0071]
According to the fifth aspect, by storing the address, the content information, and the search keyword of the hit data included in the hit data list received from the search system in the storage unit, the hit data which cannot be accessed is stored in the past. The search keyword and the content information relating to the search performed can be acquired from the storage unit, and it is possible to search for hit data that has become inaccessible based on the acquired search keyword and content information.
[Brief description of the drawings]
FIG. 1 is a block diagram illustrating an example of an information processing apparatus according to the present invention.
FIG. 2 is a flowchart illustrating an example of a data search procedure.
FIG. 3 is a diagram showing an example of a search screen.
FIG. 4A is a block diagram illustrating an example of an information processing apparatus according to the present invention, and FIG. 4B is a diagram illustrating an example of search result information.
FIG. 5 is a flowchart illustrating an example of a data search procedure.
FIG. 6 is a diagram illustrating an example of an output screen.
FIG. 7 is a block diagram illustrating an example of an information processing apparatus according to the present invention.
8A is a diagram illustrating an example of user information, FIG. 8B is a diagram illustrating an example of keyword information, and FIG. 8C is a diagram illustrating an example of hit data information.
FIG. 9 is a flowchart illustrating an example of an execution procedure of an automatic patrol process.
FIG. 10 is a diagram illustrating an example of an output screen.
FIG. 11 is a block diagram illustrating an example of an information processing apparatus according to the present invention.
12A is a diagram illustrating an example of hit data information, and FIG. 12B is a diagram illustrating an example of URL change information.
FIG. 13 is a flowchart illustrating an example of a search procedure of a URL whose access has been disabled.
FIG. 14 is a diagram illustrating an example of an output screen.
[Explanation of symbols]
10 Information processing device
11 CPU
12 RAM
13 Hard disk (storage unit)
14 External storage unit
15 Input section
16 Output section
17 Communication unit
20 Search system
22 Communication Network
Claims (5)
目標スコアを前記情報処理装置で受付けるステップと、
受信したヒットデータリストの中から、スコアが前記受付けた目標スコア以上のヒットデータを前記情報処理装置で抽出するステップと
を有し、前記抽出したヒットデータに関する情報を前記情報処理装置から出力することを特徴とする情報処理方法。An information processing method of transmitting a search keyword from an information processing apparatus to a search system, and receiving and outputting, by the information processing apparatus, a hit data list in which a score is added to hit data hitting the transmitted search keyword,
Receiving a target score in the information processing device;
Extracting, from the received hit data list, hit data whose score is equal to or greater than the received target score by the information processing device, and outputting information on the extracted hit data from the information processing device. An information processing method characterized by the following.
コンピュータに、目標スコアを受付けさせる手順と、
コンピュータに、受信したヒットデータリストの中から、スコアが前記受付けた目標スコア以上のヒットデータを抽出させる手順と、
コンピュータに、前記抽出したヒットデータに関する情報を出力させる手順と
を含むことを特徴とするコンピュータプログラム。A computer program that causes a computer to transmit a search keyword to a search system and receive a hit data list in which a score is added to hit data that hits the transmitted search keyword.
Steps to get the computer to receive the target score,
A procedure for causing the computer to extract, from the received hit data list, hit data whose score is equal to or greater than the received target score,
Causing the computer to output information on the extracted hit data.
コンピュータに、受信したヒットデータリストに含まれるヒットデータのスコアのうちの最高スコア及び該ヒットデータリストに対応する検索キーワードを所定記憶領域に記憶させる手順と、
コンピュータに、目標スコアを受付けさせる手順と、
コンピュータに、受信したヒットデータリストの中から、スコアが前記受付けた目標スコア以上のヒットデータを抽出させる手順と、
コンピュータに、目標スコア以上のヒットデータが抽出できなかった場合、前記所定記憶領域から、前記受信したヒットデータリストに対応する検索キーワードを含み、しかも最高スコアが目標スコア以上のヒットデータリストに対応する検索キーワードを読出させる手順と、
コンピュータに、前記抽出したヒットデータに関する情報又は前記読出した検索キーワードを出力させる手順と
を含むことを特徴とするコンピュータプログラム。A computer program that causes a computer to transmit a search keyword including a combination of a plurality of keywords or one keyword to a search system and receive a hit data list in which a score is added to hit data that hits the transmitted search keyword.
A step of causing the computer to store, in a predetermined storage area, the highest score among the scores of the hit data included in the received hit data list and the search keyword corresponding to the hit data list;
Steps to get the computer to receive the target score,
A procedure for causing the computer to extract, from the received hit data list, hit data whose score is equal to or greater than the received target score,
If the computer does not extract hit data having a target score or more, the search data includes a search keyword corresponding to the received hit data list, and the highest score corresponds to the hit data list having the target score or more. A procedure for reading the search keyword;
Causing the computer to output the information on the extracted hit data or the read search keyword.
コンピュータに、目標スコアを受付けさせる手順と、
コンピュータに、受信したヒットデータリストの中から、スコアが前記受付けた目標スコア以上のヒットデータを抽出させる手順と、
コンピュータに、前記抽出したヒットデータに関する情報を所定記憶領域に記憶させる手順と、
コンピュータに、前記所定記憶領域に新しく記憶されたヒットデータに関する情報を検出させる手順と、
コンピュータに、前記検出したヒットデータに関する情報を出力させる手順と
を含むことを特徴とするコンピュータプログラム。A computer program for causing a computer to periodically transmit a predetermined search keyword to a search system and to receive a hit data list in which a score is added to hit data hitting the transmitted predetermined search keyword,
Steps to get the computer to receive the target score,
A procedure for causing the computer to extract, from the received hit data list, hit data whose score is equal to or greater than the received target score,
A procedure for causing a computer to store information on the extracted hit data in a predetermined storage area;
Causing the computer to detect information about hit data newly stored in the predetermined storage area;
Causing the computer to output information relating to the detected hit data.
コンピュータに、受信したヒットデータリストに含まれるヒットデータのアドレス、内容情報及び検索キーワードを所定記憶領域に記憶させる手順と、
コンピュータに、ヒットデータのアドレスを受付けさせる手順と、
コンピュータに、前記受付けたアドレスに対応する内容情報及び検索キーワードを前記所定記憶領域から読出させる手順と、
コンピュータに、前記読出した検索キーワードを検索システムへ送信させる手順と、
コンピュータに、前記検索キーワードの送信に応じて受信したヒットデータリストに含まれるヒットデータの中から、内容情報が前記読出した内容情報に類似するヒットデータを抽出させる手順と、
コンピュータに、前記抽出したヒットデータに関する情報を出力させる手順と
を含むことを特徴とするコンピュータプログラム。A computer program which causes a computer to transmit a search keyword to a search system and receive a hit data list including hit data hit by the transmitted search keyword,
A procedure for causing the computer to store the address, the content information, and the search keyword of the hit data included in the received hit data list in a predetermined storage area;
Steps to make the computer accept the address of the hit data,
Causing the computer to read content information and a search keyword corresponding to the received address from the predetermined storage area;
Causing a computer to transmit the read search keyword to a search system;
Causing the computer to extract, from the hit data included in the hit data list received in response to the transmission of the search keyword, hit data whose content information is similar to the read content information,
Causing the computer to output information on the extracted hit data.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003089074A JP2004295663A (en) | 2003-03-27 | 2003-03-27 | Information processing method and computer program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003089074A JP2004295663A (en) | 2003-03-27 | 2003-03-27 | Information processing method and computer program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004295663A true JP2004295663A (en) | 2004-10-21 |
Family
ID=33403041
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003089074A Pending JP2004295663A (en) | 2003-03-27 | 2003-03-27 | Information processing method and computer program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004295663A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8032524B2 (en) | 2008-03-27 | 2011-10-04 | Brother Kogyo Kabushiki Kaisha | Content management system and content management method |
US8239360B2 (en) | 2008-03-27 | 2012-08-07 | Brother Kogyo Kabushiki Kaisha | Content management device, content management system, and content management method |
-
2003
- 2003-03-27 JP JP2003089074A patent/JP2004295663A/en active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8032524B2 (en) | 2008-03-27 | 2011-10-04 | Brother Kogyo Kabushiki Kaisha | Content management system and content management method |
US8239360B2 (en) | 2008-03-27 | 2012-08-07 | Brother Kogyo Kabushiki Kaisha | Content management device, content management system, and content management method |
US8694484B2 (en) | 2008-03-27 | 2014-04-08 | Brother Kogyo Kabushiki Kaisha | Content management device, content management system, and content management method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10929487B1 (en) | Customization of search results for search queries received from third party sites | |
JP4638439B2 (en) | Personalized web search | |
US9104772B2 (en) | System and method for providing tag-based relevance recommendations of bookmarks in a bookmark and tag database | |
JP5084858B2 (en) | Summary creation device, summary creation method and program | |
US20080071739A1 (en) | Using anchor text to provide context | |
JP2009282957A (en) | Document processing system and document processing method | |
JP5379978B2 (en) | Search system and search method | |
JP2003091552A (en) | Retrieval requested information extraction method, its operating system and processing program of the same | |
JP4824070B2 (en) | Search processing apparatus, search processing method and program for selecting seed of crawler for specialized search using click log | |
JP5179564B2 (en) | Query segment position determination device | |
JP2001265774A (en) | Method and device for retrieving information, recording medium with recorded information retrieval program and hypertext information retrieving system | |
JP5141144B2 (en) | Information retrieval system and information retrieval program | |
JP4445849B2 (en) | File search method, file search device, and file search program | |
JP5524160B2 (en) | Important query extraction device, important query extraction method, and important query extraction program | |
JP2004295663A (en) | Information processing method and computer program | |
JP4477931B2 (en) | Search request device, search request method, search request program, and computer-readable recording medium storing search request program | |
JP2006236221A (en) | Management server for web page retrieval | |
JP2010072909A (en) | Document search device, document search method, and document search program | |
KR100371805B1 (en) | Method and system for providing related web sites for the current visitting of client | |
JP2010282403A (en) | Document retrieval method | |
JP4962973B2 (en) | Search server, method and program | |
JP3474803B2 (en) | Search system, search server, search method, and recording medium | |
JP2003122795A (en) | Device, method and program for displaying information, and computer readable recording medium stored with information display program | |
JP5108707B2 (en) | Search server device, search method and program | |
JP2008262442A (en) | Method for displaying retrieval key data, and server |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050407 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080403 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080415 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080826 |