JP4527770B2 - 情報検索装置、コンピュータプログラム及び記憶媒体 - Google Patents

情報検索装置、コンピュータプログラム及び記憶媒体 Download PDF

Info

Publication number
JP4527770B2
JP4527770B2 JP2007506942A JP2007506942A JP4527770B2 JP 4527770 B2 JP4527770 B2 JP 4527770B2 JP 2007506942 A JP2007506942 A JP 2007506942A JP 2007506942 A JP2007506942 A JP 2007506942A JP 4527770 B2 JP4527770 B2 JP 4527770B2
Authority
JP
Japan
Prior art keywords
information
search
user
search result
user data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007506942A
Other languages
English (en)
Other versions
JPWO2006095409A1 (ja
Inventor
信也 武井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MARS FLAG CORPORATION
Original Assignee
MARS FLAG CORPORATION
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MARS FLAG CORPORATION filed Critical MARS FLAG CORPORATION
Publication of JPWO2006095409A1 publication Critical patent/JPWO2006095409A1/ja
Application granted granted Critical
Publication of JP4527770B2 publication Critical patent/JP4527770B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Description

本発明は、ユーザから入力されたキーワードに基づいてインターネット上のWEBサイトを検索する情報検索装置、情報検索方法及びその方法をコンピュータに実行させるプログラムに関する。
ユーザの検索指示によりインターネット上のWEBサイト(WEBページ)を全文検索する検索エンジンとしては、ロボット型検索エンジンやディレクトリ型検索エンジンが従来から一般的に知られている。
ロボット型検索エンジンは、検索したい情報に関連するキーワードを指定すると、WEBロボットやスパイダーと呼ばれる WWW探索プログラムを用いて,インターネット上で見つけることのできる全WWWサーバ上の情報を定期的に収集し、その情報の索引付けを自動的に行うものである。このロボット型検索エンジンは,コンピュータによって自動的に全世界のWEBサイトのデータを収集しているため、情報量が多いという利点を有している。
ディレクトリ型検索エンジンは、作業者が予めWEBサイトのURL(Uniform Resource Locator)を、芸術、ビジネス、教育等のように分野別に人為的に分類しておき、ユーザは分野別にキーワードを指定して検索するものである。このディレクトリ型検索エンジンでは情報を分野別に分類しているので、ユーザは職業別電話帳のような使い方ができ、分野を決めてから探す場合に便利であるという利点を有している。
しかしながら、このような従来の検索エンジンには次のような問題がある。ロボット型検索エンジンの場合には、収集した情報量が多いという利点をもつ反面、検索ロボットは収集したWEBサイト情報に出てくる単語から単純に索引付けを行うため、キーワード検索した場合にWEBサイトが何万件と出てしまう場合が多い。このため、ユーザとは本来関係無いようなサイトまで検索結果として表示されてしまい、検索結果の品質が低く、ユーザは目的のWEBサイトを絞り込むのに膨大な時間を要してしまうという問題がある。
また、検索ロボットが検索を行うので、異なるユーザが検索した場合でも同一キーワードで検索する限り常に同じ検索結果しか得られず、異なるプロフィールや嗜好を有するユーザの全てに対して満足のいく検索結果が得られることは少ないという問題がある。
ディレクトリ型検索エンジンの場合には、WEBサイトのデータ入力及び分類を基本的に人手で行っているため、ロボット型検索エンジンによるサービスと比較して情報量が2、3桁少なく、有名なWEBサイト以外を探すことが出来ないという問題がある。また、WEBサイトのデータ入力と分類を作業者の事務処理能力に頼っているため、情報量を増大するのにも限界がある。
また、ディレクトリ型エンジンの場合には、単に収集したWEBサイトの情報を分野別に分類しているだけなので、ロボット型検索エンジンと同様に、異なるユーザが検索した場合でも同一キーワードで検索する限り常に同じ検索結果しか得られず、異なるプロフィールや嗜好等を有するユーザの全てに対して満足のいく検索結果が得られることは少ないという問題がある。
これに対して、ユーザの嗜好にあわせた検索結果を提供するシステムが提案されている(特許文献1を参照。)このシステムでは、ユーザが情報を取り扱うために当該情報を特定するための識別情報をユーザの操作に基づいてブックマーク登録するとともに、ユーザの意図に基づいてカテゴリを付与して分類可能としている。さらに、各カテゴリ内の情報のユーザ間での一致度を求めることにより、そのユーザと他のユーザとの嗜好の類似度を評価判定し、前記類似度が高いと判定された他のユーザが評価した情報を前記ユーザに紹介することができる。これによれば、ユーザは、嗜好が類似した他のユーザが評価した情報をシステムから紹介されるため、情報を探すための時間及び費用が節約できる。
特願2000−187666号公報
しかしながら、従来のシステムではユーザの嗜好の類似度に基づいて、提供を受けるユーザに未知の情報を提供することはできたが、キーワード検索時において、嗜好の共通するユーザの動向(例えば、共通の趣味を有するユーザがどのページを数多く参照しているか等)や、当該ページの直近の動向(例えば、直近に更新されたかどうか、あるいは、最近特に人気を集めているか等)を指標として、提供する情報を選別することはできない。
本発明はこのような問題点に鑑みてなされたものであり、キーワード検索時における検索結果をユーザにとってより価値のあるものとすることを目的とする。
以上の課題を解決するための本発明は、クライアント端末から入力された検索情報に基づいてインターネット上のWebページの情報を検索し、検索結果を前記クライアント端末に送信する情報検索装置であって、
Webページに関する登録情報を格納する登録情報格納手段と、
前記クライアント端末から前記検索情報を受信する受信手段と、
前記検索情報に含まれるキーワードに関連するWebページを検索用情報から検索し、第1の検索結果を生成する第1の検索結果生成手段と、
前記クライアント端末のユーザに固有のデータであって、対応するユーザについて、少なくとも、年齢、性別、地域属性、職種、未既婚、住居形態、年収、車の所有、及び、趣味のいずれかの種別に関する情報を含むユーザデータを、ユーザ毎に格納するユーザデータ格納手段と、
前記検索情報から、前記ユーザを特定するための識別情報を抽出する抽出手段と、
前記ユーザデータ格納手段に格納されたユーザデータのうち、前記識別情報に対応する第1のユーザデータを取得するユーザデータ取得手段と、
前記登録情報格納手段に格納された、前記第1の検索結果に含まれるWebページに関する登録情報から、前記検索情報に含まれる前記登録情報の利用の有無に関する設定情報と、前記第1のユーザデータとを利用して第1の登録情報を選択する選択手段と、
前記第1の登録情報に基づいて、前記第1の検索結果に含まれるWebページの重み付け値を、該Webページ毎に算出する算出手段と、
Webページ毎に算出された前記重み付け値に基づき、前記第1の検索結果に含まれるWebページの順位を決定する順位決定手段と、
決定された前記順位により前記第1の検索結果に含まれるWebページをソートして第2の検索結果を生成する第2の検索結果生成手段と、
前記第2の検索結果を前記クライアント端末に送信する送信手段と
を備え、
前記登録情報には、前記Webページについて、少なくとも、複数のユーザにより参照された回数の前記ユーザデータの種別毎の総計、直近の所定期間内に複数のユーザにより参照された回数の前記ユーザデータの種別毎の合計、該Webページをブックマークに登録している前記ユーザデータの種別毎のユーザ数のいずれかが含まれ、
前記設定情報は、前記重み付け値を算出するために利用する前記登録情報を指定する情報であって、
前記選択手段は、前記設定情報において指定された前記登録情報のうち、少なくとも前記第1のユーザデータに含まれる各種別に関する情報に対応する登録情報を、前記第1の登録情報として選択する。
以上のように、本発明によれば、キーワード検索時における検索結果をユーザにとってより価値のあるものとすることができる。本発明のその他の特徴及び利点は、添付図面を参照とした以下の説明により明らかになるであろう。なお、添付図面においては、同じ若しくは同様の構成には、同じ参照番号を付す。
添付図面は明細書に含まれ、その一部を構成し、本発明の実施の形態を示し、その記述と共に本発明の原理を説明するために用いられる。
本発明の実施形態に対応するシステムの全体構成の一例に対応する図である。 本発明の実施形態に対応するクライアント101の構成の一例に対応する図である。 本発明の実施形態に対応するサーバ103の構成の一例に対応する図である。 本発明の実施形態に対応するユーザデータベース104の登録内容の一例を示す図である。 本発明の実施形態に対応するブックマークデータベース105の登録内容の一例を示す図である。 本発明の実施形態に対応するURLデータベース106の登録内容の一例を示す図である。 本発明の実施形態に対応するURLデータベース106の登録内容の他の一例を示す図である。 本発明の実施形態に対応する、オンラインブックマークが利用される際のクライアント101・サーバ103間における処理の一例に対応するフローチャートである。 本発明の実施形態に対応するクライアント101のディスプレイ207に表示される表示画面の一例を示す図である。 本発明の実施形態に対応するクライアント101のディスプレイ207に表示される表示画面の他の一例を示す図である。 本発明の実施形態に対応するクライアント101のディスプレイ207に表示される表示画面の更に他の一例を示す図である。 本発明の実施形態に対応する検索処理が実行される際の、クライアント101・サーバ103間における処理の一例に対応するフローチャートである。 本発明の実施形態に対応する、サーバ103における検索処理の一例に対応するフローチャートである。
以下に、添付する図面を参照して本発明の実施形態を説明する。ただし、この実施の形態に記載されている構成要素はあくまでも例示であり、この発明の範囲をそれらのみに限定する趣旨のものではない。
<システム構成>
図1は、本実施形態に対応する検索システムの全体構成を示すブロック図である。ユーザが操作してコンテンツの閲覧を行うクライアント101a、101b、101c(以下、これらを総称して「クライアント101」という。)、検索を行うサーバ103、コンテンツを公開するコンテンツサーバ108が、それぞれインターネット102に接続されている。また、サーバ103には、ユーザデータベース104、ブックマークデータベース105、URLデータベース106、検索用データベース107が接続されている。
クライアント101は、ユーザが操作して、インターネット上に公開されたコンテンツを閲覧可能なクライアント端末としての情報処理装置であり、ノートパソコン、デスクトップパソコン、携帯情報端末、携帯電話等を含む。クライアント101には、所定のページ記述言語(例えば、HTML、XML、PDF或いはPS等)で記載されたコンテンツを表示画面上に表示可能なソフトウェアがインストールされているものとする。以下の本実施形態では、簡単のために、当該ソフトウェアとして、所謂インターネット・ブラウザがインストールされている場合を例として説明する。
クライアント101は、イーサネット(登録商標)等のネットワークケーブルを含むアクセス手段であるLANによってインターネット102に接続されている。尚、ネットワーク102へのアクセス手段はイーサネット(登録商標)ケーブルに限定されるものではなく、例えば、RS232Cインタフェースに準じた通信ケーブルや、無線LAN等の無線通信手段によって構成されていてもよい。後述するサーバ103、コンテンツサーバ108も同様のアクセス手段を備えているものとする。
インターネット102は、世界中のネットワークが互いに接続されたネットワークであるが、例えば、イントラネットのように特定の組織内においてのみ接続可能なネットワークであってもよい。
サーバ103は、クライアント101に検索サービスを提供する情報検索装置としての情報処理装置であり、ユーザデータベース104、ブックマークデータベース105、URLデータベース106、検索用データベース107に格納されている情報を管理している。サーバ103は、インターネット102上で閲覧可能なWebサイトに定期的にアクセスして、そこに含まれるURL、タイトル、全文データを収集し、URLデータベース106や検索用データベース107を更新する。
また、ブックマークデーベース105の更新を監視し、ユーザブックマークに新たなURLが追加されたり、削除されたりした場合には、対応するURLデータベース106に登録されている情報の更新を行う。また、クライアント101における、ブックマークに登録されたURLの選択動作を監視し、各ユーザの参照回数を記録している。サーバ103は、例えば、LANによって、ユーザデータベース104、ブックマークデータベース105、URLデータベース106、検索用データベース107に接続されている。
ユーザデータベース104、ブックマークデータベース105、URLデータベース106、検索用データベース107は、それぞれ所定のデータベース・ソフトウェアがインストールされた情報処理装置であり、各種データの管理を行う。ユーザデータベース104は、ユーザデータの情報を管理する。ブックマークデータベース105は、各ユーザのブックマークデータを管理する。URLデータベース106は、各ユーザがブックマークに登録しているページに関する登録情報を統一的に管理する。検索用データベース107は、検索処理用の情報を管理する。
コンテンツサーバ108は、ウェブページ等のコンテンツを提供する情報処理装置であり、例えば、ウェブサーバ等のソフトウェアがインストールされている。
尚、本明細書では、便宜上、サーバ103、ユーザデータベース104、ブックマークデータベース105、URLデータベース106、及び、検索用データベース107は、それぞれ物理的に独立した情報処理装置によって実現されるものとして説明するが、本発明の実施形態はこれに限られるものではない。例えば、これらが単一の情報処理装置によって実現されてもよい。また、ユーザデータベース104、ブックマークデータベース105、URLデータベース106及び検索用データベース107は、サーバ103とLAN等によって接続されているものとして説明するが、例えば、インターネット102や非図示のイントラネット経由でサーバ103と通信可能な形態をとってもよい。
<情報処理装置の構成>
次に、本実施形態に対応する検索システムを構成する情報処理装置の概略について説明する。図2は、クライアント101のハードウェア構成の一例を示すブロック図である。上述した情報処理装置としてのユーザデータベース104、ブックマークデータベース105、URLデータベース106及び検索用データベース107も、同様或いは同等のハードウェア構成として構成しても良い。
図2において、200はCPUであり、ハードディスク装置(以下、HDと呼ぶ)205に格納されているアプリケーションプログラム、オペレーティングシステム(OS)や制御プログラム等を実行し、RAM202にプログラムの実行に必要な情報、ファイル等を一時的に格納する制御を行う。
201はROMであり、内部には基本I/Oプログラム等のプログラム、文書処理の際に使用するフォントデータ、テンプレート用データ等の各種データを記憶する。202は各種データを一時記憶するためのRAMであり、CPU200の主メモリ、ワークエリア等として機能する。
203は記録媒体へのアクセスを実現するための外部記憶ドライブであり、メディア(記録媒体)204に記憶されたプログラム等を本コンピュータシステムにロードすることができる。尚、メディア204は、例えば、フレキシブルディスク(FD)、CD−ROM、CD−R、CD−RW、PCカード、DVD、ICメモリカード、MO、メモリスティック等を利用することができる。
205は外部記憶装置であり、本実施形態では大容量メモリとして機能するHDを用いている。HD205には、アプリケーションプログラム、OS、制御プログラム、関連プログラム等が格納される。
206は指示入力装置であり、キーボードやポインティングデバイス(マウス等)、タッチパネル等がこれに相当する。指示入力装置206を用いて、ユーザは、クライアント101に対して、装置を制御するコマンド等を入力指示する。
207はディスプレイであり、指示入力装置206から入力したコマンドや、それに対するクライアント101の応答出力等を表示したりするものである。
209はシステムバスであり、情報処理装置内のデータの流れを司るものである。208はインターフェイス(以下、I/Fという)であり、このI/F208を介して外部装置とのデータのやり取りを行う。
尚、以上の各装置と同等の機能を実現するソフトウェアにより、ハードウェア装置の代替として構成することもできる。
本実施形態では、メディア204から本実施形態に係るプログラム及び関連データを直接RAM202にロードして実行させる例を示すが、これ以外にも、本実施形態に係るプログラムを動作させる度に、既にプログラムがインストールされているHD205からRAM202にロードするようにしてもよい。また、本実施形態に係るプログラムをROM201に記録しておき、これをメモリマップの一部をなすように構成し、直接CPU200で実行することも可能である。
図3は、サーバ103の機器構成を示すブロック図である。CPU300、ROM301、RAM302、外部記憶ドライブ303、メディア304、HD305、指示入力装置306、ディスプレイ307、I/F308、システムバス309の機能及び用途、更には、これらの関係は、図2を用いて説明したものと同様或いは同等である。図3では、データベース310がシステムバス309に接続されていることに留意する。ここで、データベース310は、ユーザデータベース104、ブックマークデータベース105、URLデータベース106及び検索用データベース107を総称するものである。
<ユーザデータの構造>
図4Aは、ユーザデータベース104に格納されているユーザデータの構造の一例を説明する図である。ユーザデータは、個々のユーザの特徴や属性に関する種々の情報によって構成される。
図4Aにおいて、401はユーザIDであり、各ユーザを一意に識別するためにユニークに与えられた識別子である。402はパスワードであり、各ユーザが登録された個人情報にアクセスしたり、ブックマークを利用する際の認証に利用される。403はユーザ名、404はユーザのメールアドレス、405は年齢、406は性別、407は、ユーザが活動又は居住する地域属性、408は職種、409は未既婚、410は住居形態、411は年収、412は自家用車の所有、413は趣味である。それぞれのデータは予めユーザから提供されて、ユーザデータとして登録される。また、上記の内容はユーザデータの一例として上げたものであって、これら全てが登録されている必要はないし、また、これら以外にもユーザを特徴づける情報を登録しても良い。
<ブックマークの構成>
本実施形態においてブックマークはユーザにより作成・更新されるが、ブックマークデータはすべてサーバ103に接続されたブックマークデータベース105に各ユーザ毎に格納されており、ユーザがクライアント101においてウェブブラウザを起動した際に、クライアント101にダウンロードされて、ウェブブラウザ上に表示される。
ブックマークは、公知のディレクトリ構造において、URL及び当該URLを特定のまとまりとして格納するフォルダにより構成される。即ち、各URLはユーザごとのディレクトリツリー(以下、ブックマークディレクトリという)の中に登録され、ブックマークディレクトリの直下であっても、任意に作成されたフォルダ内にあってもよい。
図4Bは、ブックマーク内に登録されたページに関する情報の管理の一例を示す図である。図4Bにおいて、ユーザIDは当該ブックマークを利用するユーザの識別子であり、図4AにおけるユーザID401と対応する。これによりユーザとブックマークとの対応をとることができる。422には、登録対象となるWebページを識別するための情報が登録される。本実施形態ではURLデータベース106を利用して、各ページに関する情報を統一的に管理しているので、ユーザの個々のブックマークには対応するページのURLは格納されない。その代わりに、URLデータベース106において当該ページを管理するための識別番号(URL−ID)が格納される。なお、URLデータベース106を利用しない場合には、URLそのものを登録しても良い。
423は各ページに与えられたブックマーク名である。このブックマーク名423は、ユーザがブックマーク登録する際に、任意に設定した名称であっても良いし、当該ページに本来割り当てられている名称であっても良い。424は、当該ページが作成された日時(ネットワーク102上で初めて公開された日時に相当する。)を示す。425は、当該ページが最新に更新された日時を示す。426は、ユーザが最新に当該ページを参照した日時を示す。427は、ユーザによる当該ページの総参照回数を示す。総参照回数とは、ユーザがこれまでに当該ページを参照した回数の総計をいう。428は、ユーザによる当該ページの直近の参照回数を示す。ここで、直近の参照回数とは、直近の所定期間(例えば、1週間、1ヶ月など)において当該ページがユーザにより参照された回数の合計をいう。
なお、ブックマークに登録された各ページ間の関係や、当該ページを格納するフォルダに関する情報は、図4Bに示すテーブルとは別に、ブックマークデータベース105内にディレクトリテーブルが用意され、そこに格納される。
ここで、サーバ103は、上述の通りブックマーク登録されている各ページの更新を定期的に監視しており、更新があった場合には425の更新日時の内容を更新する。
<URLデータベースの構成>
URLデータベース106は、ブックマークデータベース105に登録されているURL−ID422に対応するページに関する情報を登録している。図4Cは、URLデータベース106におけるページに関する情報の管理の一例を示す図である。
図4Cにおいて、422は、URLに与えられたID(識別子)を表しており、図4BにおけるURL−ID422と対応する。429は、URL−ID422が与えられたURLを示す。430は、URLに対応するWebコンテンツが本来有するタイトルを示す。作成日時、更新日時は図4Bと同様である。431は、最終参照日時を示し、複数のブックマークユーザのいずれかが最新に、当該ページを参照した日時を示す。432は、複数のユーザの総参照回数427の合計、即ち、複数のユーザにより当該ページが参照された回数の総計を表す。
直近参照回数433は、複数のユーザの直近参照回数428の合計、即ち、直近の所定期間内に複数のユーザにより当該ページが参照された回数の合計を表す。従って、「直近の所定期間」については、図4Bの場合と同様である。例えば、最近立ち上げられたばかりであるが人気のあるページは、この直近参照回数433が高くなるので、ページ毎に直近の人気の度合いを判定することが可能となる。434は、増加アンカー数であって、当該ページについて直近の所定期間内に追加されたアンカー数を示す。本実施形態においてアンカーとは、ページ内に埋め込まれた、他のページへのリンク情報を言う。また、「直近の所定期間」については上記と同様である。また、435は、ブックマーク登録数であって、当該ページをブックマークに登録しているユーザ数を示す。
また、URLデータベース106は、ページをブックマークに登録しているユーザのユーザデータ毎の参照回数や、ブックマーク登録数を管理している。図4Dは、URLデータベース106におけるページに関する情報の管理の他の一例を示す図である。
図4Dでは、各ページ毎に、ユーザデータの詳細に対応する総参照回数、直近参照回数及びブックマーク登録数を登録している。422は、各ページに割り当てられたURL−IDを示す。440は、ユーザデータであり、図4Aに示した個々のユーザデータが登録される。441は総参照回数であり、ユーザデータ毎に集計された当該ページに対する参照回数の総計が登録される。442は、直近参照回数であって、ユーザデータ毎に集計された当該URLに対する直近の所定期間における参照回数の合計が登録される。「直近の所定期間」については、上記と同様である。また、443は、ブックマーク登録数であり、当該ページをブックマークに登録しているユーザ数をユーザデータ毎に合計した値が登録される。
図4Dでは、ユーザデータ440について、年齢405、趣味413、職種408が登録例を記載しているが、年齢405を参酌すると、「10代」、「20代」等のように一定の年齢層毎に総参照回数441、直近参照回数442、及び、ブックマーク登録数443が登録されている。つまり、10代のユーザが当該URLを参照した合計は100回であり、20代のユーザが当該URLを参照した合計は300回であることが、図4Dから読みとれる。
また、直近の参照回数については、10代が30回であり、20代が20回であることが読みとれる。即ち、このURLに対応するWebコンテンツには、全体的には20代のユーザが、10代のユーザよりも関心を強く示している一方、直近だけを見た場合には10代のユーザの関心が強くなっていることが分かる。また、ブックマーク登録数443を参照すれば、10代から40代などにおいて、どの年齢層がどれだけブックマーク登録しているかを把握することができる。
図4Aに示したとおり、ユーザデータ440には「年齢」、「趣味」、「職種」以外にも複数含まれており、これらのユーザデータそれぞれについて、総参照回数441、直近参照回数442及びブックマーク登録数443が登録されている。このようなユーザデータ毎の総参照回数441、直近参照回数442及びブックマーク登録数443のデータは、図4A及び図4Bに示したデータを利用すれば得られる。
なお、本実施形態では、図4Aから図4Dまでに例示したデータベースの個々の登録内容のことを登録情報と称する。
<検索用データベースの構成>
検索用データベース107は、ユーザから提供されるキーワードに関連するWebページを検索するための検索用情報として検索処理用の情報を管理するものであり、インターネット102上のWebサイトから収集された検索データが登録される。検索データは、主として各検索データの識別子、キーワード、属性、データ取得時間、データ取得URL、URLのタイトル、全文データ(Description)等から構成されるが、この他のデータを含めてもよい。
<オンラインブックマーク>
図5は、クライアント101においてオンラインブックマークが利用される際の、クライアント101・サーバ103間における処理の一例に対応するフローチャートである。まず、クライアント101においてWebブラウザが起動されると(ステップS551において「YES」)、ブックマークデータ要求がユーザID401と共にサーバ103に通知され(501)、サーバ103では、通知されたユーザID401に基づいて、ブックマークデータベース105を検索し、当該ユーザのブックマークデータを選択する(ステップS552)。選択されたブックマークデータはサーバ103からクライアント101に対して送信される(502)。
クライアント101では、起動されたWebブラウザをディスプレイ207上に表示し、Webブラウザのブックマーク表示領域にサーバ103から送信されたブックマークデータに基づくブックマーク情報を表示する(ステップS553)。
その後、クライアント101ではユーザからのブックマークに対する操作を受け付けたかどうかを監視し、もし操作を受け付けた場合には(ステップS554で「YES」)、サーバ103に対してブックマーク操作内容を通知する(503)。ここで、ユーザから受け付けるブックマークの操作には、例えば、ブックマークに登録されているURLの選択、新たなURLの追加、登録済みのURLの情報の編集(削除を含む)等がある。
クライアント101からブックマーク操作内容を受信すると、サーバ103では、受信した内容に基づいて各データベースを更新する。当該通知が、例えばユーザがあるURLを選択した通知であった場合には、対応するURLについての参照日時426、総参照回数427、直近参照回数428、最終参照日時431、総参照回数432、直近参照回数433、総参照回数441、直近参照回数442をそれぞれ更新する。
また、ユーザがWebブラウザの閲覧を終了する場合には、クライアント101からサーバ103に対して終了通知が送信され(504)、サーバ103からは終了応答が返される(505)。
以上により、サーバ103が管理するブックマークデータベース105及びURLデータベース106は、常にユーザから受け付けた操作に基づいて内容が更新されることとなる。
<検索処理その1(検索画面)>
次に、本実施形態におけるサーバ103を利用してクライアント101がWebページの検索処理を実行する場合の処理について具体的に説明する。
図6A乃至図6Cは、ユーザがクライアント101において検索処理を実行する場合に、ディスプレイ207に表示される画面の一例を示す図である。ユーザが検索処理を実行しようとする場合には、所定のURLを指定してサーバ103が提供する検索ページにアクセスする。この時最初にディスプレイ207に表示される画面が、図6A乃至図6Cに示すような画面600である。画面600は、検索画面601とブックマーク表示領域606とに大きく分割される。ブックマーク表示領域606には、前述のサーバ103から提供されたブックマークデータに基づくブックマーク表示がなされており、ユーザはブックマークに登録されたページを選択して、閲覧することができる。
図6Aに示すごとく、サーバ103は「○×△サーチ」という名称で検索サービスを提供しており、検索画面601には、キーワード入力領域602、検索実行ボタン603、オプション604、及び設定ボタン605が表示される。キーワード入力領域602は、ユーザが検索したいキーワードの入力を受け付ける領域である。検索実行ボタン603は、入力されたキーワードについて、設定されたオプションの内容に従った検索処理をサーバ103に指示するためのボタンである。オプション604では、図6Cに示すような、ページ情報や、ユーザデータに基づく検索結果のソーティングを行うかどうかの指示をユーザから受け付ける。即ち、「利用する」が選択されると、オプションとして設定された内容を利用した検索が行われる。一方、「利用しない」が選択されると、オプションとして設定された内容は利用せずに、通常の検索処理が実行され、この検索結果がクライアント101に通知される。
図6Aの場合では、「利用する」が選択されているので、オプションの設定内容を利用した検索が行われることとなる。また、「利用する」が選択された場合には、設定ボタン605がアクティブになり、この設定ボタン605の選択を受け付けると、図6Bに示すようなユーザID入力画面が表示され、検索を行おうするユーザがユーザデータベース104に登録されているか否かの確認が行われる。この確認の後、図6Cに示すようなオプションの設定画面が表示される。一方、「利用しない」が選択された場合には、設定ボタン605はグレーアウトされ、図6B及び図6Cのような表示画面は提供されない。
次に、図6Bについて説明する。図6Bは、図6Aにおいて設定ボタン605が選択された場合に、ディスプレイ207に表示される画面である。この画面は、ユーザがユーザデータベース104に登録されているか否かを確認するための画面である。
画面610において、611は、検索を行おうとするユーザから、ユーザ登録の有無に関する入力を受け付ける表示欄である。ここでは、「あり」、「なし」のいずれかが選択可能となっている。「あり」が選択された場合には、「ユーザ名」及び「パスワード」の入力を受け付ける入力欄612及び613が表示される。一方、「なし」が選択された場合には、これらの入力欄612及び613はグレーアウトされるか、全く表示されない。
また、614は、決定ボタンであって、入力内容を確定する場合に操作される。615はキャンセルボタンであって、ユーザが図6Aの画面に戻りたい場合に操作される。決定ボタン614が操作された際に、ユーザ登録611が「なし」の設定の場合には、サーバへのデータ送信は行わずに、画面を図6Cに切り替える。一方、ユーザ登録611が「あり」の設定で、「ユーザ名」及び「パスワード」を受け付けていれば、該受け付けたデータがサーバ103へ送信される。
サーバ103では、クライアント101から受信した「ユーザ名」及び「パスワード」と一致するユーザ名403及びパスワード402をユーザデータベース104から検索する。一致する「ユーザ名」が登録されている場合には、ユーザデータベース104に登録されているユーザデータの有無及びユーザID401がサーバ103からクライアント101に通知される。クライアント101では、サーバ103からの該通知を受信すると、図6Cの画面を表示する。一方、一致する「ユーザ名」が登録されていない場合には、エラーメッセージがサーバ103からクライアント101に通知される。クライアント101では、サーバ103からの該エラーメッセージを受信すると、図6Bの画面を表示して、再度「ユーザ名」及び「パスワード」の入力を受け付ける。
次に、図6Cについて説明する。図6Cは、図6Bにおいて決定ボタン614が選択された後に、ディスプレイ207に表示される画面である。また、この画面は、サーバ103における検索の際に利用されるオプション情報の設定、より具体的には、検索結果に含まれる各ページの重み付け値を算出するために利用する登録情報の指定を受け付けるための画面でもある。
オプション入力画面620には、大別すると、ページ情報621、ユーザデータ622及びおまかせ623が示される。ページ情報621について設定可能な項目には、更新日時、総参照回数、直近の参照回数、増加アンカー数、ブックマーク登録数がある。これらの項目は、URLデータベース106に登録されている図4Cの更新日時425、総参照回数432、直近参照回数433、増加アンカー数434、ブックマーク登録数435の登録情報にそれぞれ対応している。よって、これらの項目のいずれかが選択された場合、対応する登録情報は、(図8と対応して後述するように)サーバ103における検索結果に含まれるページついて、表示順を決定する際に利用される。
また、ユーザデータ622について設定可能な項目には、年齢、性別、地域属性、職種、未既婚、年収、車の有無、趣味がある。これらの項目は、URLデータベース106に登録されている図4Dの総参照回数441、直近参照回数442、ブックマーク登録数443についての登録情報のうち、指定されたユーザデータに関連するものにそれぞれ対応している。
例えば、ユーザデータ622のうち年齢が選択された場合には、図4Dにおけるユーザデータ440の年齢のうち、当該指定を行ったユーザの年齢に基づいて当該ユーザが属する世代が決定され、対応する登録情報が特定される。よって、これらの項目のいずれかが選択された場合、対応する登録情報は、(図8と対応して後述するように)サーバ103における検索結果に含まれるページついて、表示順を決定する際に利用される。
また、おまかせ623は、ユーザ側でページ情報621やユーザデータ622の指定を行わない場合に選択できる。おまかせ623が選択された場合には、例えば、全てのオプション情報を利用して検索を行っても良いし、あるいは、特定のページ情報621とユーザデータ622とを予め設定しておき、当該設定を利用した検索を行っても良い。
なお、オプションにおける設定項目は、上記のものに限定されることなく、当然にこれら以外が含まれても良い。
また、図6Bに示す画面では、ページ情報621とユーザデータ622とについて設定可能な項目が表示されているが、このような表示は、ユーザデータベース104に登録され、かつ、ユーザデータ622の各設定項目について図4Aに示すようにユーザデータを漏れなく登録していなければ意味がない。
例えば、ユーザによっては、ユーザデータベース104に登録されていない者もいるかもしれない。このような場合、ユーザデータ622の設定項目について設定を受け付けても、検索に利用することはできない。また、このようなユーザは、図6Bの画面において、ユーザ登録611を「なし」に設定しているはずである。そこで、係る設定内容に対応して、画面620にはページ情報621のみを表示し、ユーザデータ622はグレーアウトするのが好ましい。これによれば、ユーザデータベースに登録されていないユーザであっても、少なくともページの更新日時や直近の参照回数を利用した検索が可能となる。
また、一部のユーザデータのみを登録し、他のユーザデータは登録していない者もいるかもしれない。このような場合、登録していない項目について設定を受け付けても、検索に利用することはできない。そこで、サーバ103から受け付けたユーザデータベース104に登録されているユーザデータの有無に関する通知に基づき、ユーザデータ622の設定項目のうち、ユーザデータベース104に登録されているユーザデータに対応する項目のみを表示し、他をグレーアウトすることが好ましい。これによれば、ユーザは少なくとも自分の登録したユーザデータを用いた検索は可能となる。
ユーザはオプション入力を終了すると、決定ボタン624により入力したオプションの内容を確定することができる。決定ボタン624が選択されると、検索画面601は図6Aに示す内容に戻る。また、キャンセルボタン625を選択した場合は、図6Aの画面に戻る。その際、オプションの設定内容はリセットされても良いし、それまでの入力内容を保持したままでも良い。
<検索処理その2(検索処理)>
次に、実際に検索を実行する際の処理の流れについて、図7のフローチャートを参照して説明する。
まず、クライアント101において、サーバ103が提供する検索サービスのページのURLが選択されると(ステップS751において「YES」)、クライアント101からサーバ103に対して、検索画面情報の要求が通知される(701)。サーバ103では、クライアント101からの検索画面情報の要求に応じて、クライアント101において後述する検索情報を生成するための検索情報生成情報としての検索画面情報を送信する(702)。クライアント101は、サーバ103から検索画面情報を受信すると、ディスプレイ207上に図6Aの検索画面601に示すような検索画面を表示する(ステップS752)。
次に、ユーザからキーワードやオプション設定をするか否かなどの入力を受け付け(ステップS753)、オプション設定がなされる場合には図6Bの画面を表示して、ユーザ登録ありと設定されたか否かを判定する(ステップS754)。もし、オプション設定がなされない場合には、以下のステップS753からS756をスキップしてステップS757へ移行する。
図6Bに表示する画面において、ユーザ登録611が「なし」と設定された場合には、「ユーザ登録あり」と設定されたこととならないので(ステップS754において「NO」)、ステップS756に移行する。一方、ユーザ登録611が「あり」と設定され、入力欄612及び613に「ユーザ名」及び「パスワード」が入力された場合には、「ユーザ登録あり」と設定されたこととなる(ステップS754において「YES」)ので、これらの入力情報をユーザ認証用情報としてサーバ103に送信する(703)。
サーバ103では、クライアントから送信された「ユーザ名」及び「パスワード」を含むユーザ認証用情報を利用してユーザ認証、即ち、該ユーザがユーザデータベース104に登録されているユーザであるかを検証する(ステップS755)。検証の結果、該ユーザが登録されている場合には、該ユーザについて、ユーザID401とユーザデータベース104に登録されているユーザデータの有無に関する情報とを含むユーザ認証結果がクライアント101へ送信される(704)。また、該ユーザが登録されていない場合には、エラーメッセージを含むユーザ認証結果がクライアント101へ送信される(704)。
次に、ステップS756では、図6Cに示すようなオプション入力画面を表示して、オプション入力を受け付ける。続いて、検索実行ボタン603の選択による検索実行指示を受け付ける(ステップS757)。検索実行ボタン603が選択されると、サーバ103に対して、ステップS753及びS756で入力を受け付けたキーワードやオプション設定の内容と、ユーザ認証結果(704)を受信している場合には、そこに含まれていたユーザID401とを含む検索情報を送信する(705)。ここで、検索を行おうとするユーザが未登録ユーザの場合には、未登録であることを示す所定のコードをユーザID401の代わりに検索情報に含めて送信しても良い。
サーバ103では、クライアント101から送信された検索情報を受信すると、キーワードに基づいて検索処理を行い、オプション設定の内容に基づいて検索結果を作成し(ステップS758)、検索結果をクライアント101へ送信する(706)。クライアント101は、サーバ103から検索結果を受信すると、受信した検索結果をディスプレイ207の検索画面601に表示する(ステップS759)。
その後、ユーザからの入力に従って検索を再度実行する場合は、ステップS751からの処理を再開する。もし、ユーザがWebブラウザの閲覧を終了する場合には(ステップS760で「YES」)、クライアント101からサーバ103に対して終了通知が送信され(707)、サーバ103からは終了応答が返される(708)。
次に、図8を参照して、図7のステップS758における処理の詳細を説明する。図8は、サーバ103における検索処理の一例に対応するフローチャートである。
まず、ステップS801において、サーバ103は、クライアント101から送信された検索情報を受信すると共に、受信した検索情報の中から、検索を依頼したユーザ(検索依頼ユーザ)のユーザID401を抽出する。次に、ステップS802において、抽出されたユーザID401に基づいて、ユーザデータベース104からユーザデータを取得する。
なお、検索依頼ユーザがユーザデータベース104に未登録であった場合には、未登録ユーザを示すコードは含まれていても、ユーザID401は検索情報に含まれていない。また、ユーザデータベース104に本来は登録されているユーザであっても、図6Aにおいてオプション設定604を「利用しない」に設定した場合には、図7のユーザ認証結果(704)を受信しないので、検索情報にユーザID401が含まれていない。これらのユーザについては、ユーザデータの取得は当然に行われない。
次に、ステップS803において、検索情報に含まれるキーワードに基づいて公知の手法で検索用データベース107を検索し、ステップS804においてキーワードに基づく検索条件に合致するデータを検索結果1として取得する。この検索結果1は、検索処理によって得られた検索結果であって、ユーザデータ(即ち、検索依頼ユーザの職業や年齢など)や、ページの情報(更新日時や、参照回数等)とは無関係に、専らページ内に指定されたキーワードや当該キーワードに類似する語をどれだけ含むか、といった基準によりキーワードとの関連の度合いを決定し、その関連性の順にページを並べたものとして得られる。
ステップS805では、検索情報に基づいて、検索依頼ユーザのオプション設定604の内容を識別する。もし、オプション設定604においてオプションを「利用しない」と設定されていた場合には、ステップS816に移行して検索結果1をクライアント101へ送信する。一方、「利用する」と設定されていた場合には、ステップS806へ移行して、検索結果1の順位に基づいて各ページのポイントPsを算出する。例えば、検索結果1に100件のページが含まれていたとすると、その順位に基づいて頭からポイントを100、99、98・・・1のように付加することができる。また、上位10件のみに100、90、80・・10のポイントをそれぞれ与えても良い。いずれにしても、検索結果1の順位に基づく重み付けを、Psとして検索結果1に含まれる各ページについて与える。
次に、ステップS807では検索結果1に含まれるページの順位をNuとして、Nuを1に設定する。次に、ステップS808において、検索結果1における順位がNu番目のページを選択し、当該ページのURLに基づいて、当該ページについてURLデータベース106に情報が登録されていれば、該登録されている登録情報を全て取得する。次に、ステップS809において、検索情報において設定されたオプション設定の内容と、ステップS802において取得されているユーザデータがある場合には当該ユーザデータとに基づいて、取得した登録情報の中から、当該ページの重み付けに利用する登録情報を絞り込む。
例えば、図6Cの場合、ページ情報621は「直近の参照回数」のみが選択されており、ユーザデータ622については「年齢」と「職種」が選択されている。よって、図4C及び図4Dに示す登録情報のうち、直近参照回数433と、検索依頼ユーザの年齢及び職種に対応した総参照回数441、直近参照回数442、ブックマーク登録数443が選択され、これらの登録情報のみに絞り込みが行われる。
ここでは図4C及び図4Dに記載された登録情報をそれぞれ利用して絞り込みを行う場合を説明したが、どの登録情報を利用するかは、オプション設定の内容に基づいて決定されるため、図4C又は図4Dの一方のみを利用して絞り込みを行うことも当然に可能である。
なお、ステップS808及びステップS809においては、一旦登録情報を全て読み出し、その後で絞り込みをかけているが、これは一例として説明しただけである。即ち、検索情報において設定されたオプション設定の内容と、ユーザデータとに基づいて直接対応する登録情報をURLデータベース106から取得するようにしても良い。
次に、ステップS810では、絞り込まれた登録情報をPr、重み付け値をPwとして、登録情報に基づくポイント:Puを算出する(Pu=Pr×Pw)。
ここで、当該ページ自体がURLデータベース106に登録されていなかった場合や、当該ページ自体は登録されているものの、絞り込まれた登録情報に対応する情報が登録されていなかった場合(例えば、該ページには特定の趣味以外の人はアクセスしない場合もあり得る。)には、Pr=0として計算する。本発明では、このポイントPuを利用することで、当該ページと検索依頼ユーザとの関連性や、当該ページの情報の有用性を検索結果に反映させることが可能となる。即ち、総参照回数441や直近参照回数442、ブックマーク登録数443を利用することで、検索依頼ユーザと同種の職業を選択した他のユーザが数多く参照しているページや、ブックマークに登録しているページを検索結果の上位にランクさせることが可能となる。また、総参照回数432、直近参照回数433、増加アンカー数434、ブックマーク登録数435を利用することで、ユーザの職業や、趣味といった枠を越えて、幅広くユーザに支持されているページや、アンカーを増やして積極的に情報を更新しているページを検索結果の上位にランクさせることが可能となる。
ここで、Prは総参照回数など、カウントされた数値情報である場合にはそのまま数値として利用することができる。しかし、更新日時425のように、数値として直接には使えない情報については、現在の日時からの差分を求め、さらにその逆数を求めることにより、Pr値とすることができる。いずれにしても、現在の日時に近くなるほどPrの値が大きくなるように変換できればよい。また、重み付け値Pwについては、全ての登録情報について均一に与えられても良いし、特定の登録情報についてより高い値が与えられても良い。例えば、同じ総参照回数にしても、総参照回数441の重み付け値Pwを100とし、総参照回数432の重み付け値を10とする、といった方法もある。また、更新日時425のように、直接Pr値として用いることができない登録情報については、他の登録情報とは異なる重み付け値を用意しても良い。
次に、ステップS811では、ステップS810において算出された各登録情報についてのポイントPuを合計してPustを算出する。このポイントPustが登録情報に基づいて各ページに与えられた重み付けとなる。
ステップS812では、全てのページについてPustが算出されたかどうかが判定され、残っているページがある場合(ステップS812において「NO」)にはNuをインクリメントしてステップS808に戻りポイントPustの算出のための処理を継続する。一方、全てのページについてPustが算出された場合(ステップS812において「YES」)には、ステップS814に移行して各ページ毎に、検索結果2を決定するためのポイント:PuallをPuall=Ps+Pustにより算出する。これにより、検索結果と検索依頼ユーザのオプション設定内容との両方を反映した検索結果を得ることができる。尚、本実施形態ではPsとPustを単純に足し合わせる場合を記載したが、ここで更に重み付けを行って、例えばPuall=Ps+Pust・N(Nは所定数)としても良い。このようにすれば、ユーザのオプション設定の内容が生成される検索結果に更に反映されることとなる。また、検索結果1の順位を全く考慮しなくても良い。この場合は、ステップS806におけるPsの算出工程と、本工程とがスキップされ、Puall=Pustとなる。
次にステップS815では、ステップS814において算出されたPuallの値に基づいてPuallが大きい順にページの順位を決定し、検索結果1の並び順をソートして検索結果2を作成する。ステップS816では、検索結果2(ステップS805から直接移行してきた場合は検索結果1)をクライアント101へ送信する。
以上のように、本実施形態に対応するサーバ103では、検索依頼ユーザのユーザデータやページの内容以外の情報に基づいて検索処理を行い、検索結果を作成することができる。
より具体的には、職業、年齢、趣味といったユーザ個人の情報を独立した項目として取り扱い、項目の共通するユーザの統計的情報(例えば、10代のユーザの総参照回数や、ゴルフを趣味とするユーザの直近の参照回数など)を利用して、検索依頼ユーザに提供する価値のある検索結果を作成することができる。
また、検索に際しては、利用するユーザデータをオプション設定604によりユーザが予め指定することができる。これにより、積極的に利用すべきユーザデータの絞り込みをユーザ自らが行うこととなり、ユーザが本来意図したキーワードと関連性の高いページを高い確率で絞り込むことが可能となる。
例えば、趣味が「ゴルフ」で、職種が「コンピュータプログラマ」であるようなユーザが、キーワードとして「ドライバー」を入力した場合、ユーザが「趣味」と「職種」のどちらを優先的に扱うかを指定しなければ、ゴルフにおける「ドライバー」に関連するページと、コンピュータプログラムに関連する「ドライバー」に関連するページとが混合して検索結果に含まれることとなる。しかし、ユーザが予めオプション設定604において「趣味」を選択していれば、「職種」に関連するページは重み付けの対象から除外されるので、ゴルフにおける「ドライバー」と関連するページが確実に検索結果の上位にランクされるようになる。
また、本実施形態では、直近参照回数に基づいてページに重み付けを行っているので、最近立ち上げられたばかりで総参照回数はあまり大きくないページであっても、人気のあるページであれば、当然に直近の参照回数が大きくなり、他のページよりもポイント(Pu)が高くなる。従って、このようなページが検索結果の上位にランクされるようになる。また、リンク切れしているページがあっても、そのようなページは、直近参照回数が伸びないのが通常であるから、この直近参照回数を利用することで、検索結果から除外することが可能となる。
更に、増加アンカー数を利用すれば、ブログ(ウェブログ)等において、積極的に情報を収集し、公開しているようなページを検索結果の上位にランクすることが可能となる。
[その他の実施形態]
以上の処理(例えば上記図5、図7又は図8に示したフローチャートに従った処理等)をプログラムとしてCD−R、ROMやDVD−ROM、MO等の記憶媒体に記憶させ、この記憶媒体に記憶されているプログラムをコンピュータに読み込ませる(インストール、もしくはコピーさせる)、或いは、ネットワークを介して所定のサーバからダウンロードすることで、このコンピュータは以上の処理を行うことができる。よって、この記憶媒体も本発明の範疇にあることは明白である。本発明は上記実施の形態に制限されるものではなく、本発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、本発明の範囲を公にするために、以下の請求項を添付する。

Claims (7)

  1. クライアント端末から入力された検索情報に基づいてインターネット上のWebページの情報を検索し、検索結果を前記クライアント端末に送信する情報検索装置であって、
    Webページに関する登録情報を格納する登録情報格納手段と、
    前記クライアント端末から前記検索情報を受信する受信手段と、
    前記検索情報に含まれるキーワードに関連するWebページを検索用情報から検索し、第1の検索結果を生成する第1の検索結果生成手段と、
    前記クライアント端末のユーザに固有のデータであって、対応するユーザについて、少なくとも、年齢、性別、地域属性、職種、未既婚、住居形態、年収、車の所有、及び、趣味のいずれかの種別に関する情報を含むユーザデータを、ユーザ毎に格納するユーザデータ格納手段と、
    前記検索情報から、前記ユーザを特定するための識別情報を抽出する抽出手段と、
    前記ユーザデータ格納手段に格納されたユーザデータのうち、前記識別情報に対応する第1のユーザデータを取得するユーザデータ取得手段と、
    前記登録情報格納手段に格納された、前記第1の検索結果に含まれるWebページに関する登録情報から、前記検索情報に含まれる前記登録情報の利用の有無に関する設定情報と、前記第1のユーザデータとを利用して第1の登録情報を選択する選択手段と、
    前記第1の登録情報に基づいて、前記第1の検索結果に含まれるWebページの重み付け値を、該Webページ毎に算出する算出手段と、
    Webページ毎に算出された前記重み付け値に基づき、前記第1の検索結果に含まれるWebページの順位を決定する順位決定手段と、
    決定された前記順位により前記第1の検索結果に含まれるWebページをソートして第2の検索結果を生成する第2の検索結果生成手段と、
    前記第2の検索結果を前記クライアント端末に送信する送信手段と
    を備え、
    前記登録情報には、前記Webページについて、少なくとも、複数のユーザにより参照された回数の前記ユーザデータの種別毎の総計、直近の所定期間内に複数のユーザにより参照された回数の前記ユーザデータの種別毎の合計、該Webページをブックマークに登録している前記ユーザデータの種別毎のユーザ数のいずれかが含まれ、
    前記設定情報は、前記重み付け値を算出するために利用する前記登録情報を指定する情報であって、
    前記選択手段は、前記設定情報において指定された前記登録情報のうち、少なくとも前記第1のユーザデータに含まれる各種別に関する情報に対応する登録情報を、前記第1の登録情報として選択することを特徴とする情報検索装置。
  2. 前記登録情報には、前記Webページについて、少なくとも、複数のユーザにより参照された回数の総計、直近の所定期間内に複数のユーザにより参照された回数の合計、該Webページをブックマークに登録しているユーザ数、直近の所定期間内に追加されたアンカー数のいずれかが更に含まれ
    ることを特徴とする請求項1に記載の情報検索装置。
  3. 前記算出手段は、前記第1の検索結果に含まれるWebページの該第1の検索結果における順位に更に基づいて、前記重み付けを算出することを特徴とする請求項1または2に記載の情報検索装置。
  4. 前記設定情報に、前記重み付けを算出するために利用する前記登録情報の指定が無かった場合には、前記選択手段は前記第1の登録情報を選択せず、
    前記送信手段は、前記第1の検索結果を前記クライアント端末へ送信することを特徴とする請求項1乃至3のいずれか1項に記載の情報検索装置。
  5. 前記クライアント端末へ、前記検索情報を生成するための検索情報生成情報を送信する生成情報送信手段を更に備え、
    前記クライアント端末では、前記検索情報生成情報を利用して前記キーワードの入力と、前記登録情報の利用の有無に関する設定入力とが受け付けられることを特徴とする請求項1乃至4のいずれか1項に記載の情報検索装置。
  6. コンピュータを、請求項1乃至5のいずれか1項に記載の情報検索装置として機能させるためのコンピュータプログラム。
  7. 請求項6に記載のコンピュータプログラムを格納したコンピュータで読み取り可能な記憶媒体。
JP2007506942A 2005-03-07 2005-03-07 情報検索装置、コンピュータプログラム及び記憶媒体 Active JP4527770B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2005/003928 WO2006095409A1 (ja) 2005-03-07 2005-03-07 情報検索装置,コンピュータプログラム及び記憶媒体

Publications (2)

Publication Number Publication Date
JPWO2006095409A1 JPWO2006095409A1 (ja) 2008-08-14
JP4527770B2 true JP4527770B2 (ja) 2010-08-18

Family

ID=36953020

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007506942A Active JP4527770B2 (ja) 2005-03-07 2005-03-07 情報検索装置、コンピュータプログラム及び記憶媒体

Country Status (2)

Country Link
JP (1) JP4527770B2 (ja)
WO (1) WO2006095409A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4648455B2 (ja) * 2005-05-06 2011-03-09 エヌエイチエヌ コーポレーション 個人化検索方法および個人化検索システム
US20080010252A1 (en) * 2006-01-09 2008-01-10 Google, Inc. Bookmarks and ranking
US20080104042A1 (en) * 2006-10-25 2008-05-01 Microsoft Corporation Personalized Search Using Macros
JP2009003520A (ja) * 2007-06-19 2009-01-08 Mic 9 Co Ltd データベースサーバー装置及び検索サービス提供方法及び関連方法
JP5014252B2 (ja) * 2008-05-20 2012-08-29 ヤフー株式会社 コンテンツを検索する索引データを管理する方法、サーバ、およびプログラム
JP2023078847A (ja) * 2021-11-26 2023-06-07 三菱電機Itソリューションズ株式会社 文書管理装置、文書管理方法及び文書管理プログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002032401A (ja) * 2000-07-18 2002-01-31 Mitsubishi Electric Corp 文書検索方法及び文書検索装置及び文書検索方法をコンピュータに実現させるためのプログラムを記録したコンピュータで読取可能な記録媒体
JP2002215671A (ja) * 2001-01-16 2002-08-02 Nippon Hoso Kyokai <Nhk> 情報検索装置、および、情報検索方法
JP2002351916A (ja) * 2001-05-30 2002-12-06 Bevoid Corporation Ltd Web情報検索装置、web情報検索方法及びその方法をコンピュータに実行させるプログラム
JP2003281179A (ja) * 2002-03-22 2003-10-03 Hitachi Information Systems Ltd 検索サイトサーバ装置と検索情報表示制御方法およびプログラムと記録媒体

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4011906B2 (ja) * 2001-12-13 2007-11-21 富士通株式会社 プロファイル情報の情報検索方法、プログラム、記録媒体及び装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002032401A (ja) * 2000-07-18 2002-01-31 Mitsubishi Electric Corp 文書検索方法及び文書検索装置及び文書検索方法をコンピュータに実現させるためのプログラムを記録したコンピュータで読取可能な記録媒体
JP2002215671A (ja) * 2001-01-16 2002-08-02 Nippon Hoso Kyokai <Nhk> 情報検索装置、および、情報検索方法
JP2002351916A (ja) * 2001-05-30 2002-12-06 Bevoid Corporation Ltd Web情報検索装置、web情報検索方法及びその方法をコンピュータに実行させるプログラム
JP2003281179A (ja) * 2002-03-22 2003-10-03 Hitachi Information Systems Ltd 検索サイトサーバ装置と検索情報表示制御方法およびプログラムと記録媒体

Also Published As

Publication number Publication date
WO2006095409A1 (ja) 2006-09-14
JPWO2006095409A1 (ja) 2008-08-14

Similar Documents

Publication Publication Date Title
US11669493B2 (en) Generating file usage information
US6718365B1 (en) Method, system, and program for ordering search results using an importance weighting
US6865568B2 (en) Method, apparatus, and computer-readable medium for searching and navigating a document database
KR101130420B1 (ko) 통합 및 혼합 검색을 위한 시스템 및 방법
EP2894579B1 (en) A system and a method for presenting multiple sets of search results for a single query
AU2020221062B2 (en) Generating and provisioning of additional content for source perspective(s) of a document
US20090240546A1 (en) Workflow management system
JP2008513881A (ja) パーソナルウェブのドキュメントを検索し、ドキュメント間でナビゲートし、ドキュメントをランク付けするための方法、システムおよびコンピュータプログラムプロダクト
US20070157100A1 (en) System and method for organization and retrieval of files
JP4527770B2 (ja) 情報検索装置、コンピュータプログラム及び記憶媒体
US8171012B2 (en) Document management apparatus, method, system, medium storing a program thereof
JP2003281179A (ja) 検索サイトサーバ装置と検索情報表示制御方法およびプログラムと記録媒体
JP2011203964A (ja) 文書管理システム及び方法
JP2009265754A (ja) 情報提供装置、情報提供方法及び情報提供プログラム
JP4344596B2 (ja) コンテンツ検索システム、コンテンツ検索プログラムおよび記録媒体
CN110235121B (zh) 用于增强型在线调研的***和方法
JP4445849B2 (ja) ファイル検索方法、ファイル検索装置、および、ファイル検索プログラム
WO2020179537A1 (ja) ラベリング支援方法、ラベリング支援装置及びプログラム
US20090083259A1 (en) Information providing system, information providing method and information providing record medium
WO2006064573A1 (ja) Web情報提供装置及びその方法、プログラム
JP2009093554A (ja) 検索支援方法、検索支援システム、アプリケーションサーバ、及び検索支援プログラム
JP4528202B2 (ja) ファイル検索方法、ファイル検索装置、及びファイル検索プログラム
JP7501066B2 (ja) 情報処理装置およびプログラム
JP2018169770A (ja) 情報管理システム、情報管理方法および情報管理プログラム
JP2004086332A (ja) 知識共有システム、知識管理支援システムおよび共有文書の条件検索方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080828

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100219

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100420

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100517

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100603

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130611

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4527770

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160611

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250