JP4939637B2 - 情報提供装置、情報提供方法、プログラム、ならびに、情報記録媒体 - Google Patents

情報提供装置、情報提供方法、プログラム、ならびに、情報記録媒体 Download PDF

Info

Publication number
JP4939637B2
JP4939637B2 JP2010185370A JP2010185370A JP4939637B2 JP 4939637 B2 JP4939637 B2 JP 4939637B2 JP 2010185370 A JP2010185370 A JP 2010185370A JP 2010185370 A JP2010185370 A JP 2010185370A JP 4939637 B2 JP4939637 B2 JP 4939637B2
Authority
JP
Japan
Prior art keywords
information
search result
query
search
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010185370A
Other languages
English (en)
Other versions
JP2012043289A (ja
Inventor
圭祐 松尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rakuten Group Inc
Original Assignee
Rakuten Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to JP2010185370A priority Critical patent/JP4939637B2/ja
Application filed by Rakuten Inc filed Critical Rakuten Inc
Priority to US13/817,585 priority patent/US20130204864A1/en
Priority to CA2805964A priority patent/CA2805964A1/en
Priority to PCT/JP2011/068524 priority patent/WO2012023540A1/ja
Priority to EP11818181.7A priority patent/EP2608064A4/en
Priority to CN2011800401321A priority patent/CN103069419A/zh
Priority to BR112013003988A priority patent/BR112013003988A2/pt
Priority to KR1020137004100A priority patent/KR101324460B1/ko
Priority to TW100129860A priority patent/TWI417751B/zh
Publication of JP2012043289A publication Critical patent/JP2012043289A/ja
Application granted granted Critical
Publication of JP4939637B2 publication Critical patent/JP4939637B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9038Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、情報提供装置、情報提供方法、プログラム、ならびに、情報記録媒体に関し、既存の検索機能を活用しつつ、より適切な検索結果をユーザに提示するものである。
従来から、ユーザが興味を持っている商品やサービスを対比しやすくするための情報を提供する情報提供システムが、種々提案されている。
このような情報提供システムは、ネットワークを介して接続される端末装置と情報提供装置から構成されるのが一般的である。ネットワークとは、各種のコンピュータが互いに通信可能に接続されたものであり、コンピュータ通信網とも呼ばれ、現在最も広く用いられているネットワークは、インターネットである。
ここで、端末装置は、ユーザが入力した、当該ユーザが興味を持っている商品やサービスに関するキーワードを受け付ける。
一方、情報提供装置では、商品やサービスの内容を説明する説明文や宣伝文等のデータが、予め保持されている。
そして、端末装置に対して入力されたキーワードは、ネットワークを介して情報提供装置に伝達される。情報提供装置にて予め用意されたデータに対して、伝達されたキーワードを含むクエリによる検索が実行される。
検索の際には、クエリに係るキーワードが、商品やサービスの説明文や宣伝文に出現するか否かが判定される。この判定結果に基づいて、クエリにより表現される検索条件に合致するデータが取得される。
すると、情報提供装置は、取得されたデータを、合致の度合やデータの重要性を表すスコアの順に並べた検索結果を、端末装置に伝達する。
端末装置は、その画面に検索結果を表示して、ユーザの要望に沿った商品やサービスを提示する。検索結果には、商品やサービスの説明文や宣伝文、あるいは、その要約、概要を表すスニペットなどが含まれる。
情報提供システムから検索結果を提示されたユーザは、検索対象である商品やサービスに対する詳細情報の閲覧、購入、予約などの行動を促されることになる。
このように、情報提供システムによって、商品やサービスの宣伝文やその要約等がユーザに提示されることから、情報提供システムは、広告機能を果たすということができる。
多くの情報提供システムでは、ユーザに一度に提示する検索結果に含まれるデータの数やスニペットの数に上限を設けることとして計算や通信の負荷を低減したり、画面のレイアウトを適切に構成してユーザが対比をしやすくしたりしている。
現在では、ネットワークとして、インターネットが利用され、端末装置として、ウェブブラウザ機能を有する携帯電話やスマートフォン、PDA(Personal Data Assistant)、などの携帯端末や、パーソナルコンピュータ等が利用され、情報提供装置として、データの蓄積や検索を担うデータベース機能とウェブブラウザとのやりとりを担うウェブサーバ機能とを実現するサーバ用のコンピュータが利用される場合が多い。
さて、特許文献1においては、検索条件に合致するデータに対し、ユーザが過去に検索したデータを簡易な操作で優先的に閲覧できるようにする技術が提案されている。
また、特許文献2では、ユーザの属性に適合した広告をユーザに提供する検索技術が開示されている。この検索技術では、商品やサービスに関する種々の属性が予め付与されており、ユーザは、所望の属性を適宜選択して検索を行うことができる。
特開2008−250663号公報 特開2007−026456号公報
新たな商品やサービスが日々登場し、流行の移り変わりが激しい今日では、商品やサービスの説明文や宣伝文は、商品の販売者やサービスの提供者自身により作成されることも多い。したがって、情報提供システムからユーザに提示される商品やサービスに係るデータは、多数の商品販売者やサービス提供者により作成されたものとなる。
ところが、一部の商品販売者やサービス提供者が、自身の商品やサービスの提示される可能性を増やそうとして、適切ではない表現を含む説明文や宣伝文を作成してしまうことがありうる。
このような場合には、適切ではない説明文や宣伝文が検索結果の上位の順位に現れてしまうことがありうる。すると、表示された検索結果の上位のデータに、適切ではない表現が含まれていることを理由として、情報提供システム全体の信用が毀損されてしまうことになる。
したがって、商品やサービスの内容についての説明文や宣伝文が適切ではない表現を含む場合には、検索結果における当該商品やサービスに係るデータの表示を制御する技術が求められている。
本発明は、上記のような課題を解決するもので、既存の検索機能を活用しつつ、より適切な検索結果をユーザに提示するために好適な情報提供装置、情報提供方法、プログラム、ならびに、情報記録媒体を提供することを目的とする。
本発明の第1の観点に係る情報提供装置は、
クエリの入力を受け付けるクエリ受付部、
前記クエリを満たす検索対象の識別情報ならびにスニペットを含む合致情報から構成される検索結果を取得する取得部、
前記検索結果に含まれる合致情報について、当該合致情報に含まれるスニペットの文字列から前記クエリに含まれる文字列を除去することにより得られる文字列に基づいて、前記検索結果を修正する修正部、
前記修正された検索結果に含まれる合致情報を提示する提示部
を備えるように構成する。
また、本発明の情報提供装置において、
前記取得部は、前記クエリに基づいて外部の情報検索装置に検索対象を検索させて、前記検索結果を取得する
ように構成することができる。
また、本発明の情報提供装置は、
前記クエリに基づいて検索対象を検索する検索部
を備え、
前記取得部は、前記検索部により検索された検索結果を取得する
ように構成することができる。
また、本発明の情報提供装置において、
前記合致情報には、当該検索された検索対象の順位がさらに含まれ、
前記修正部は、前記得られた文字列に基づいて、前記検索結果を構成する合致情報の順位を変更することにより、当該検索結果を修正し、
前記提示部は、前記修正された検索結果に含まれる合致情報を、当該修正された順位に基づいて提示する
ように構成することができる。
また、本発明の情報提供装置において、
前記修正部は、前記得られた文字列に基づいて、前記検索結果に含まれる合致情報を絞り込むことにより、当該検索結果を修正する
ように構成することができる。
また、本発明の情報提供装置において、
前記修正部は、前記得られた文字列の長さに基づいて、前記検索結果を修正する
ように構成することができる。
また、本発明の情報提供装置において、
前記修正部は、所定の圧縮アルゴリズムを用いて前記得られた文字列を圧縮し、当該圧縮後のデータ量に基づいて、前記検索結果を修正する
ように構成することができる。
また、本発明の情報提供装置において、
前記修正部は、所定の圧縮アルゴリズムを用いて前記得られた文字列を圧縮し、当該圧縮後のデータ量と、前記スニペットのデータ量と、の比率に基づいて、前記検索結果を修正する
ように構成することができる。
また、本発明の情報提供装置において、
前記修正部は、前記合致情報に含まれるスニペットにおいて前記クエリに含まれる文字列が所定の回数以上出現しないように、前記スニペットを加工することにより、前記検索結果をさらに修正する
ように構成することができる。
本発明の第2の観点に係る情報提供方法は、クエリ受付部、取得部、修正部、提示部を備える情報提供装置が実行し、
前記クエリ受付部が、クエリの入力を受け付ける受付工程、
前記取得部が、前記クエリを満たす検索対象の識別情報ならびにスニペットを含む合致情報から構成される検索結果を取得する取得工程、
前記修正部が、前記検索結果に含まれる合致情報について、当該合致情報に含まれるスニペットの文字列から前記クエリに含まれる文字列を除去することにより得られる文字列に基づいて、前記検索結果を修正する修正工程、
前記提示部が、前記修正された検索結果に含まれる合致情報を提示する提示工程
を備えるように構成する。
本発明の第3の観点に係るプログラムは、コンピュータを、
クエリの入力を受け付けるクエリ受付部、
前記クエリを満たす検索対象の識別情報ならびにスニペットを含む合致情報から構成される検索結果を取得する取得部、
前記検索結果に含まれる合致情報について、当該合致情報に含まれるスニペットの文字列から前記クエリに含まれる文字列を除去することにより得られる文字列に基づいて、前記検索結果を修正する修正部、
前記修正された検索結果に含まれる合致情報を提示する提示部
として機能させるように構成する。
本発明の第4の観点に係るコンピュータ読取可能な情報記録媒体は、コンピュータを、
クエリの入力を受け付けるクエリ受付部、
前記クエリを満たす検索対象の識別情報ならびにスニペットを含む合致情報から構成される検索結果を取得する取得部、
前記検索結果に含まれる合致情報について、当該合致情報に含まれるスニペットの文字列から前記クエリに含まれる文字列を除去することにより得られる文字列に基づいて、前記検索結果を修正する修正部、
前記修正された検索結果に含まれる合致情報を提示する提示部
として機能させるプログラムを記録するように構成する。
すなわち、本発明のプログラムは、コンパクトディスク、フレキシブルディスク、ハードディスク、光磁気ディスク、ディジタルビデオディスク、磁気テープ、半導体メモリ等のコンピュータ読取可能な情報記録媒体に記録することができる。
上記プログラムは、プログラムが実行されるコンピュータとは独立して、コンピュータ通信網を介して配布・販売することができる。また、上記情報記録媒体は、コンピュータとは独立して配布・販売することができる。
本発明によれば、既存の検索機能を活用しつつ、より適切な検索結果をユーザに提示するために好適な情報提供装置、情報提供方法、プログラム、ならびに、情報記録媒体を提供することができる。
本発明の一つの実施形態に係る情報提供システムの概要構成を示す説明図である。 所定のプログラムを実行することにより、本実施形態に係る情報提供装置を実現するコンピュータの概要構成を示す説明図である。 本実施形態に係る情報提供装置の概要構成を示す説明図である。 本実施形態に係る情報提供装置の概要構成を示す説明図である。 本実施形態に係る情報提供装置にて実行される情報提供処理の制御の流れを示すフローチャートである。 従来技術において、端末装置がユーザに検索結果を提示する様子を示す説明図である。 本実施形態において、端末装置がユーザに検索結果を提示する様子を示す説明図である。
以下に本発明の実施形態を説明する。本実施形態は説明のためのものであり、本願発明の範囲を制限するものではない。したがって、当業者であればこれらの各要素もしくは全要素をこれと均等なものに置換した実施形態を採用することが可能であるが、これらの実施形態も本発明の範囲に含まれる。
(1.情報提供システム)
図1は、本実施形態に係る情報提供システムの概要構成を示す説明図である。以下、本図を参照して説明する。
情報提供システム11では、情報提供装置12と端末装置14が、インターネット16を介して通信可能に接続されている。さらに、本実施形態では、情報検索装置18が、情報提供装置12とインターネット16を介して通信可能に接続されている。
情報提供装置12、端末装置14、情報検索装置18は、それぞれ、特定の用途に適合したコンピュータの上で、その用途向けの機能を果たすためのプログラムを実行することによって実現される。
ここで、情報提供装置12は、商品やサービスに係るデータ等を蓄積するデータベース機能と、端末装置14との通信を担うウェブサーバ機能と、を実現する。また、本実施形態では、商品の通信販売やサービスの予約などを可能とする電子商取引機能を実現する。
商品やサービスを種々調べたいと希望するユーザは、自身の端末装置14を使用して、情報提供装置12から商品やサービスに関する情報の提供を受ける。
また、情報提供システム11に商品やサービスに関する情報を登録しようとする商品の販売者やサービスの提供者も、自身の端末装置14を利用する。商品の販売者やサービスの提供者は、商品やサービスに関する説明文、宣伝文など、各種の説明情報を含むデータを、端末装置14を使用して、情報提供装置12に登録する。
また、情報検索装置18は、情報提供装置12に登録されたデータを検索用に保持してインデキシング等の前処理を行い、クエリに基づく高速な検索を可能とする。
一般的な検索エンジンは、インターネット内で公開されている電子文書に対する検索を行う。本実施形態に係る前記検索エンジンの機能を情報提供装置12に登録されたデータに適用することで、情報検索装置18を実現することも可能である。なお、情報提供装置12に登録されたデータに特化したデータベースを利用して、情報検索装置18を実現しても良い。
このほか、本実施形態では、情報提供装置12と情報検索装置18を別のコンピュータにより実現しているが、情報提供装置12と情報検索装置18を一体のコンピュータ上に実現することとしても良い。
ユーザや、商品の販売者、サービスの提供者は、端末装置14のブラウザを利用して、情報提供装置12とのやりとりを行う。
さて、商品の販売者やサービスの提供者から商品やサービスに係るデータの登録が情報提供装置12に対してなされると、情報提供装置12は、登録された商品やサービスに識別情報を割り当てる。そして、当該識別情報と、説明情報と、を対応付けて、情報検索装置18に前処理を実行させる。
情報検索装置18では、前処理において、高速な検索を可能とするためのインデキシングを行う。このほか、識別情報に対応付けて、商品やサービスの説明情報の概要又は要約を表すスニペットを、予め生成することとしても良い。なお、スニペットの生成は、検索を実行する際に、与えられたクエリに応じて行うことも可能である。
ユーザは、端末装置14を介して、所望の商品やサービスに関するキーワードを指定したクエリを情報提供装置12に送る。
ついで、情報提供装置12は、後述する処理を適宜行って取得した検索結果を、端末装置14に送る。
検索結果には、検索された商品やサービスに関する情報毎に対応する合致情報が含まれている。各合致情報には、以下の情報が含まれる。
(a)商品やサービスの識別情報。
(b)商品やサービスに対するスニペット。
(c)商品やサービスの順位もしくはスコア。
クエリに合致する商品やサービスが複数である場合には、検索結果に含まれる合致情報も複数になる。一方、クエリに合致する商品やサービスがない場合には、検索結果には合致情報は含まれないことになる。
なお、順位もしくはスコアは、明示の情報とするのではなく、検索結果において合致情報が並べられている順番によって表現することとしても良い。例えば、検索結果として並べられた合致情報のうち、1番目の合致情報は、スコアが最大で順位1位であり、2番目の合致情報は、スコアが2番目に大きく順位2位である。
さて、端末装置14の画面に表示された検索結果から、ユーザがいずれかの合致情報を選択すると、選択された合致情報が、情報提供装置12に送信される。
なお、本実施形態における選択とは、当該商品やサービスのさらに詳細な情報の閲覧、当該商品の購入やサービスの予約の申込等をいう。
情報提供装置12は、各ユーザが過去に実行した商品やサービスの検索履歴、選択履歴などの履歴情報を管理している。すなわち、情報提供装置12は、当該ユーザにより検索された商品やサービスの識別情報や、当該ユーザにより選択された商品やサービスの識別情報を蓄積している。
また、情報提供装置12では、予めユーザが登録した種々の個人情報(例えば、氏名、性別、年齢、電話番号、メールアドレス、居住地域、家族の人数等)や、予めユーザに付与されたユーザ識別情報等を管理している。これらの情報は、ユーザ情報と呼ばれる。
さらに、商品の販売者やサービスの提供者は、自分が扱う商品やサービスが適合する情報(例えば、年齢、性別、独身者向け/カップル向け/ファミリー向け等)を設定することも可能である。これらの情報は、属性情報と呼ばれる。
従来の情報提供装置12は、外部の情報検索装置18によって検索された検索結果を取得して、当該取得された検索結果の表示順位のままで、ユーザの端末装置14に送信することとしていた。
本実施形態では、情報検索装置18による検索結果に、情報提供装置12において修正を加えることで、既存の情報検索装置18はそのまま利用しつつ、ユーザにとってより一層適切な検索結果を提供する点に特徴がある。
以下、本実施形態に係る情報提供装置12について、さらに詳細に説明する。
(2.情報提供装置)
本実施形態に係る情報提供装置12は、サーバ用のコンピュータにおいて、所定のプログラムを実行することによって実現される。
図2は、所定のプログラムを実行することにより、本実施形態に係る情報提供装置12を実現するコンピュータの概要構成を示す説明図である。以下、本図を参照して説明する。
本実施形態に係るコンピュータ101は、CPU(Central Processing Unit)102が、ハードディスク13に記録されたプログラムをRAM(Random Access Memory)104に読み出して実行し、NIC(Network Interface Card)105を制御することによって、情報提供装置12を実現する。
すなわち、CPU 102は、コンピュータ101全体の動作を制御し、各構成要素と接続され、制御信号やデータ信号をやりとりする。
ハードディスク103は、大容量外部記憶装置であり、CPU 102が実行するプログラムや、当該プログラムの処理の対象となるデータを記録する。
RAM 104は、CPU 102の処理の対象となるデータやプログラムを一時的に記憶して、加工等を可能とするためのものである。
NIC 105は、コンピュータ101をインターネット16に接続するためものである。
このほか、コンピュータ101には、情報提供装置12の管理者が各種の入力を行うための入力装置106、当該管理者に対して、情報提供装置12からの情報を表示するための表示装置107が用意されている。
なお、本図に示すコンピュータ101の各部の性能は、適宜変更が可能であるが、CPU 101がプログラムを実行して各部を制御することにより、各種の機器として実現する、という動作原理にかわりはない。例えば、コンピュータ101において、端末用プログラムを実行させれば、端末装置14が実現され、情報検索用プログラムを実行させれば、情報検索装置18が実現される。
また、情報提供装置12用のプログラムと、情報検索装置18用のプログラムと、を、並列に実行させることで、当該コンピュータ101の一台で、情報提供装置12用と情報検索装置18用を同時に実現することも可能である。
なお、各種の携帯電話やスマートフォン、PDA(Personal Data Assintant)などの携帯端末では、ハードディスク103にかえてフラッシュメモリなどを採用したり、NIC 15にかえて携帯電話網への通信インターフェースを採用してはいるものの、その機能な構成は、コンピュータ11と同様である。
図3、図4は、本実施形態に係る情報提供装置12の概要構成を示す説明図である。以下、本図を参照して説明する。
これらの図に示すように、情報提供装置12は、クエリ受付部201、取得部202、修正部203、提示部204を備える。
態様によっては、記憶部206、選択受付部207を備えるように構成しても良い。図3、図4では、これらの要素を備える構成が図示されている。
また、図3においては、検索部205を備えない構成が図示され、図4においては、検索部205を備える構成が図示されている。
クエリ受付部201は、ユーザが利用する端末装置14から送信されたクエリの入力を受け付ける。したがって、本実施形態では、コンピュータ101のCPU 102の制御の下、NIC 105等が、クエリ受付部201として機能する。
一方、取得部202は、前記クエリを満たす検索対象の識別情報ならびにスニペットを含む合致情報から構成される検索結果を取得する。
本実施形態では、コンピュータ101のNIC 105等が、CPU 102の制御の下、取得部202として機能する。
図3に示す実施形態では、取得部202は、受け付けられたクエリを、外部の情報検索装置18に送信し、外部の情報検索装置18に検索を実行させる。そして、取得部202は、外部の情報検索装置18から、検索結果を取得することとしている。
図4に示す実施形態では、情報提供装置12が備える検索部205が、外部の情報検索装置18と同様の機能を有する。したがって、検索部205は、当該クエリに基づいて、情報提供装置12の内部で検索を行う。
この場合、コンピュータ101において、データベースなどが記憶されるハードディスク103にCPU 102がアクセスし、処理の際の一時的な情報を管理する領域としてRAM(Random Access Memory)やハードディスク103等を利用することによって、検索部205が実現される。
取得部202により取得された検索結果は、一時的にRAM内に保持される。
ついで、修正部203は、検索結果を修正する。
検索結果の修正方法としては、ユーザの目にできるだけ触れさせない方が良い適切ではない合致情報を、検索結果から除去して絞り込みを行ったり、適切ではない合致情報の順位を下げる等の方法が採用できる。
したがって、コンピュータ101において、CPU 102がRAM 104やハードディスク103等と共働することによって、修正部203が実現される。
ついで、提示部204は、修正された検索結果に含まれる合致情報を提示する。
本実施形態では、情報提供装置12が修正された検索結果を端末装置14に送信する。端末装置14は、検索結果を受信し、当該受信された検索結果に含まれる合致情報は、端末装置14の画面に提示される。
したがって、本実施形態では、CPU 102の制御の下、NIC 105が端末装置14と通信することにより、提示部204として機能する。
さらに、選択受付部207は、提示された合致情報の選択指示をユーザから受け付ける。
すなわち、選択受付部207は、検索結果の提示を受けたユーザによる商品やサービスの詳細情報の閲覧要求、あるいは、商品やサービスの購入要求や予約要求を受け付けるものである。選択の指示を受け付けた後は、通常の通信販売等の処理が起動される。
したがって、本実施形態では、CPU 102の制御の下、NIC 105が端末装置14と通信することにより、選択受付部207として機能する。
このほか、記憶部206には、以下の情報が記憶される。
(a)商品やサービスの識別情報に対応付けられた商品やサービスに対する禁忌文字列。いわゆるNG(No Good)ワードである。
(b)商品やサービスのカテゴリ等を示す属性情報。
(c)ユーザのカテゴリ等を示すユーザ情報。
これらの情報は、頻繁に更新されることがあまりない情報である。
前記記憶部206に記憶されている情報のうち、属性情報ならびにユーザ情報については、商品販売者やサービス提供者、ユーザ自身が設定することが可能である。一方、禁忌文字列については、情報提供装置12の管理者が設定する。
また、SNS(Social Network System)等で広く利用されている公知の評価システムを用いて、商品やサービスに対する禁忌文字列を、ユーザに意識させずに設定する方法を採用しても良い。
さらに、記憶部206には、以下の情報も保存される。
(d)ユーザのクエリに対する(修正部203による修正前の)検索結果に含まれていた合致情報に対応する識別情報が、当該ユーザが検索済みの識別情報として保存される。なお、検索結果が膨大な数であった場合には、当該検索結果に含まれる全ての合致情報がユーザに提示される可能性が低いため、当該検索結果に含まれる合致情報の内、予め設定された順位まで、例えば上位100位までの合致情報に対応する識別情報のみ、当該ユーザが検索済みの識別情報として保存されるように構成しても良い。
(e)ユーザの選択指示により選択された合致情報に対応する識別情報が、前記ユーザが選択済みの識別情報として保存される。商品やサービスの詳細情報の閲覧要求、購入要求、予約要求がなされると、当該商品やサービスの識別情報が選択済みとなる。
これらの情報は、ユーザの行動によって頻繁に変化するものである。
本実施形態では、コンピュータ101において、CPU 102の制御の下、ハードディスク103等が商品・サービス情報データベースやユーザ情報データベースを構成することにより、記憶部206が実現される。
なお、上記(a)(b)(c)の情報と、上記(d)(e)の情報と、は、記憶される契機や設定の主体が異なるため、例えば複数のデータベースに分離して管理することも可能である。この場合、当該複数のデータベースが、全体として記憶部206を実現することになる。
図5は、本実施形態に係る情報提供装置12にて実行される情報提供処理の制御の流れを示すフローチャートである。以下、本図を参照して説明する。
本情報提供処理が開始されると、情報提供装置12は、端末装置14から送信されたクエリを受信する(ステップS301)。当該クエリの受信により、クエリ受付部201によるクエリの入力の受付が実行されることになる。
クエリが受け付けられると、取得部202は、外部の情報検索装置18に、当該クエリを送信する(ステップS302)。
ついで、情報提供装置12は、当該情報検索装置18から送信された検索結果を受信する(ステップS303)。当該検索結果を受信することにより、取得部202による検索結果の取得が実行されることになる。
ついで、修正部203は、検索結果に含まれる合致情報が適切か否かの判定処理を行う(ステップS304)。適切か否かの判定手法については、種々の態様を後述する。
ついで、合致情報が適切であると判定された場合(ステップS304;Yes)は、そのままステップS306に進む。
一方、合致情報が適切ではないと判定された場合(ステップS304;No)は、当該合致情報が含まれる検索結果を修正して(ステップS305)、ステップS306に進む。
検索結果の修正方法としては、以下のようなものがありうる。
(a)当該合致情報を、検索結果から削除する。
(b)当該合致情報の順位が下がるように、検索結果内での順位を変更する。
(c)当該合致情報の順位が下がるように、合致情報のスコアを下げる。
なお、ここでは、判定結果として、適切か否かのいずれかが得られるものとしているが、後述するように、「適切な度合」を計算し、この度合に応じて、合致情報のスコアや順位を調整するように構成しても良い。
また、検索結果内に合致情報が並べられる順番によって、合致情報の順位を示す場合には、検索結果内において合致情報が並べられる順番を変更することによって、順位を変更する修正ができる。
上記のように構成することによって、対象の合致情報の適切な度合が低いほど、すなわち、適切ではない度合が高いほど、当該合致情報の順位が下がるように、順位やスコアを変更することが可能となる。
このようにしてすべての合致情報について、当該合致情報が適切であるか否かを判定する判定処理が終了したか否かを判定する(ステップS306)。終了していると判定された場合(ステップS306;Yes)は、ステップS307に進み、終了していないと判定された場合(ステップS306;No)には、ステップS304に戻る。このようにして、すべての合致情報について適切であるか否かの判定処理を行うことで、適切ではない表現を含む合致情報についての修正を行った、ユーザに提示されるべき検索結果が得られる。
上述した検索結果においては、ユーザの目にできるだけ触れない方が良い商品やサービスの情報が削除され、もしくは、表示順位が低くなっている。したがって、ユーザの情報提供システム11に対する信頼は損なわれずに済む。
なお、ステップS304〜ステップS306においては、合致情報毎に検索結果の修正を行うこととしているが、検索結果の修正を一括して行うことも可能である。例えば、すべての合致情報についてスコアを変更した後、当該スコアに基づいて検索結果から合致情報を削除したり、検索結果における合致情報の順位を変更する等である。
ついで、検索結果が得られると、記憶部206は、その検索結果に含まれる合致情報に対応する識別情報を、当該クエリを送信したユーザが検索済みであるものとして、保存する(ステップS308)。
すなわち、ユーザが検索した結果に含まれる商品やサービスに対応する識別情報を、検索履歴として、当該ユーザのユーザ識別情報に対応付けて保存する。
ついで、提示部204は、修正済みの検索結果を、端末装置14に送信する(ステップS309)。
前記修正済みの検索結果を受信した端末装置14は、当該端末装置の表示手段、例えば、ブラウザに、修正された順位で検索結果に含まれる合致情報を表示する。
前記修正済みの検索結果に含まれる合致情報にはリンク情報(例えば、URL(Universal Resource Locator等)が含まれている。当該リンク情報に対するユーザ操作(例えば、マウスのクリックやタッチパネルのタップなど)に基づいて、当該合致情報に対するユーザの選択指示が、端末装置14から情報提供装置12に対して送信される。
一方、情報提供装置12は、端末装置14から送信されたユーザからの選択指示を受信する(ステップS310)。当該選択指示を受信することにより、選択受付部207による選択指示の受付が実行されることになる。
選択指示が受け付けられると、記憶部206は、当該選択された合致情報に対応する識別情報を、当該選択指示を送信したユーザが選択済みであるものとして、保存する(ステップS311)。
すなわち、ユーザによる詳細情報の閲覧要求、購入要求、予約要求に係る商品やサービスに対応する識別情報を選択履歴として、当該ユーザのユーザ識別情報に対応付けて保存する。
ついで、情報提供装置12は、ユーザからの選択指示に指定される識別情報に係る閲覧要求、購入要求、予約要求に対応する応答処理を、ウェブサーバ機能、電子商取引機能により実行し(ステップS312)、ステップS301に戻る。
ステップS312にて起動される応答処理では、商品やサービスの詳細情報の提供や、購入、予約などの申込処理が実行されるが、これらの詳細は、既存の商品やサービスのネット通信販売やネット予約に係るものと同様である。
このように、本実施形態においては、記憶部206が検索履歴と選択履歴を含むユーザの行動の履歴を保存するように構成したが、後述する判定において、ユーザの行動の履歴が不要である場合には、記憶部206ならびに履歴の保存処理を含まないように構成しても良い。
また、本実施形態では、記憶部206に商品やサービス、販売者や提供者の属性や、ユーザの属性が記憶されるように構成したが、後述する判定において、商品やサービス、販売者や提供者の属性や、ユーザの属性が不要である場合には、記憶部206ならびに属性の記憶処理を含まないように構成しても良い。
図6は、従来技術において、端末装置14がユーザに検索結果を提示する表示例を示す説明図であり、図7は、本実施形態において、端末装置14がユーザに検索結果を提示する表示例を示す説明図である。以下、これらの図を参照しながら、説明する。
これらの図による表示例は、コンピュータ101において、CPU 102が、ハードディスク13に記録されたブラウザプログラムをRAM 104に読み出して実行し、ユーザからの入力を入力装置106を介して受け付け、NIC 105を介して情報提供装置12に各種の情報を要求し、得られた情報を表示装置107に表示することによって得られるものである。
以下、表示装置107の画面601に表示されるブラウザに対する操作と、当該操作によって、図6、図7に示すように、検索結果が表示されるまでを説明する。
まず、ユーザがURL入力欄602に、情報提供装置12のURLを入力すると、情報提供装置12から端末装置14に対してHTML(HyperText Markup Language)文書が送信される。
HTML文書は、当該HTML文書内にて指定されるスタイルシート情報やタグ情報に基づいて整形され、ブラウザの画面601内のコンテンツ表示領域603に表示される。
情報提供装置12から送信されるHTML文書には、クエリ入力欄604を形成するためのタグ情報が含まれている。ユーザが、所望の商品やサービスについてのキーワードをクエリ入力欄604に入力すると、端末装置14から情報提供装置14に対して、当該クエリが送信される。
このほか、図7に示す本実施形態においては、ブラウザのアドオンもしくはプラグインとして用意された検索ツールバー605が用意されている。検索ツールバー605内にもクエリ入力欄606が用意されている。ユーザは、情報提供装置12のURLを入力してコンテンツ表示領域603にクエリ入力欄604が表示されるのを待たずとも、検索ツールバー605内のクエリ入力欄606にキーワードを直接入力すれば、端末装置14から情報提供装置12に対して、当該クエリが送信される。
なお、これらの図においては、ユーザは、ポイント付与の割合が50倍となるようなキャンペーンの対象となる商品やサービスに興味がある状況を示しており、クエリ入力欄606には「50倍」というキーワードが入力されている。
すると、情報提供装置12において、図5に示す情報提供処理が実行される。本実施形態に係る情報提供装置12は、修正ずみの検索結果に基づいて生成されたHTML文書を端末装置14に送信するが、従来技術に係る情報提供装置は、情報検索装置18や内部の検索部205から取得した検索結果を修正せずに、HTML文書を生成して端末装置14に送信する。
検索結果に基づいて生成されたHTML文書には、検索結果表示欄607を形成するためのタグ情報が含まれており、図6、図7とも、検索結果表示欄607には、複数の合致情報608が表示されている。上記のように、ユーザがキーワード「50倍」を入力しているので、合致情報608には、説明文や宣伝文などの説明情報にキーワード「50倍」を含む商品やサービスの識別情報609とスニペット610が含まれる。
なお、本図では、個々の合致情報608ならびに当該合致情報に含まれる識別情報609やスニペットを識別するため、符号に英小文字の添字を付している。
図6、図7においては、識別情報609は、商品やサービスの詳細情報を閲覧するためのリンクにより表現されており、選択可能なことを示すための下線が付されている。ユーザが当該リンクをマウスやキーボードで選択すると、端末装置14から情報提供装置12へ、選択指示が送信されることになる。
また、各スニペット610には、ユーザにより入力されたキーワード「50倍」が含まれている。
ここで、図6、図7に示される検索結果表示欄607を対比すると、表示されている合致情報608が少々異なることがわかる。
図6に示す通り、合致情報608a、合致情報608b、合致情報608c、合致情報608dは、それぞれ、商品A、商品B、商品C、商品Dに係る合致情報である。
合致情報608aでは、スニペット610aのほとんどを「50倍」が占めるほどに重複して利用されているが、合致情報608bのスニペット610b、合致情報608cのスニペット610c、合致情報608dのスニペット610dでは、「50倍」は1回乃至3回利用されている。本表示例では、スニペットにおけるキーワードの出現回数が多いものほど、高い順位となるような検索結果が表示されている。
一方、図7においては、合致情報608b、合致情報608c、合致情報608dは表示されているが、合致情報608aは表示されていない。これは、後述する判定手法1によるもので、スニペット610aに、ユーザにとって未知の情報がほとんど含まれていないため、合致情報608aは適切ではないと判定され、検索結果から削除されたからである。
また、合致情報608bのスニペット610b、合致情報608cのスニペット610c、合致情報608dのスニペット610dも、図6とは異なり、「50倍」は1回だけ、初めての利用の場所のみに表示されており、それ以降は、省略記号に置換する加工が行われている。
このように、本実施形態では、クエリを入力したユーザにとって有用な、適切な合致情報が優先して提示される。
以下、合致情報が適切か否かの判定手法について、種々の態様を説明する。
(3.判定手法1)
第1の判定手法は、ユーザが入力したクエリの文字列を活用するものである。
ユーザが所望のキーワードを指定して一般的な検索エンジンを利用すると、ユーザには、検索結果として、当該キーワードが出現する文書のURLのほか、当該文書の要約、概要を表すスニペットが提示される。
本実施形態において、商品やサービスの説明文又は宣伝文の要約等を表すスニペットが情報検索装置18において生成される態様では、合致情報毎に対応付けられて、情報提供装置12に送信される。
一方、情報提供装置12がスニペットそのものを管理する態様では、情報検索装置18からは、商品やサービスの識別情報が情報提供装置12に送信され、情報提供装置12が、識別情報とスニペットを対応付けて合致情報を構成する。
このスニペットは、ユーザが合致情報を対比検討する上で、重要な情報である。なお、前記スニペット内には、ユーザが指定したクエリに含まれているキーワード文字列が出現していることが殆どであるが、前記キーワード文字列は、ユーザが指定したものであるから、ユーザにとっては既知のものである。
したがって、前記スニペットからキーワード文字列を除去した加工後のスニペットに含まれる文字列が、ユーザにとって未知の、新しい有用な情報である、と考えることができる。
このように、本判定手法では、スニペットからクエリに含まれる文字列を除去した加工後のスニペットに含まれる文字列、すなわち、スニペットからクエリに含まれる文字列を除去した得られた文字列を用いて、合致情報が適切か否かの判定を行う。
一般に、加工後のスニペットに含まれる文字列における情報量が多い合致情報の方が、前記情報量が少ない合致情報にくらべて、ユーザにとってより有用であり、適切であると考えられ、加工後のスニペットに含まれる文字列における情報量が極端に少なければ、その合致情報はユーザにとって役に立たず、適切ではないと考えられる。
例えば、商品やサービスの購入の際に、ポイントが蓄積されるような電子商取引システムに、本実施形態が適用された場合を考える。ポイント付与の割合を50倍にしたキャンペーンに係る商品やサービスを検索しようとするユーザがキーワードとして「50倍」を指定したものとする。一方、商品の販売者やサービスの提供者が、前記キャンペーンの対象となる商品やサービスの宣伝文として、「50倍50倍50倍50倍50倍50倍50倍!」などのように、「50倍」を重複して利用する宣伝文を作成してしまったものとする。
すると、前記宣伝文から生成されるスニペットにおいても、「50倍50倍50倍50倍50倍50倍50倍!」などのように、「50倍」が重複して利用されることになる。
情報検索装置18は、宣伝文に「50倍」というキーワードが多数含まれていることから、前記商品や前記サービスを検索結果の上位に配置する。ところが、提示されるスニペットは特定のキーワードが並べられているだけであり、ユーザにとって有益な情報は少ない。
本例では、スニペット「50倍50倍50倍50倍50倍50倍50倍!」からキーワード「50倍」を除去する。すると、加工後のスニペットは「!」の1文字だけとなる。
本例では、加工後のスニペット「!」によって、前記商品や前記サービスに関する有益な情報の情報量を見積もることになる。
情報量の見積もりの方法であるが、最も単純には、加工後のスニペットに含まれる文字列が短かいほど、「適切ではない度合」が高いと判定する方法を採用することができる。
上記の例のように、商品販売者やサービス提供者によって、ユーザが検索に利用しそうなキーワードを重複して利用するだけの説明文や宣伝文が作成された場合には、スニペットにも当該キーワードが繰り返し登場するだけとなるが、クエリに当該キーワードが指定された場合には、上記加工処理の結果、ユーザが指定したクエリに当該キーワードが含まれている場合には、加工後のスニペットに含まれる文字列は極めて短くなる。
このため、キーワード重複利用型の説明文や宣伝文を利用した商品やサービスに関するデータに対応する合致情報は、適切ではないと判定され、当該合致情報の表示順位が変更されるので、ユーザの目に触れる機会が少なくなる。
また、加工後のスニペットに含まれる文字列の情報量をより正確に推定して、合致情報が適切か否かを判定する方法としては、適当な圧縮アルゴリズム、例えば、スライディング辞書法や算術符号圧縮法等により、加工後のスニペットに含まれる文字列を圧縮する方法がある。
本判定手法では、加工後のスニペットに含まれる文字列を圧縮した結果のビット数が多いほど、前記スニペットに対応する合致情報が適切である度合が高く、当該ビット数が少ないほど、適切である度合が低い、と判定することができる。
本判定手法では、適切度が数値によって得られるので、合致情報毎にスコアが割り当てられている場合に、これらの数値によってスコアを修正することができる。修正部203は、修正されたスコアによって、合致情報の順位を修正することによって、修正された検索結果を生成する。
一方、得られた適切度と予め設定した閾値を比較することにより、当該適切度に対応する合致情報が適切か否か判定するように構成しても良い。
ユーザがクエリとして入力する文字列は、情報提供装置12の管理者が予想できるものとは限らない。本判定手法では、いわゆるNGワードなどを情報提供装置12で一切管理しなくとも、適切ではない合致情報を除去したり順位を変更したりできる点に、一つの特徴がある。
なお、ユーザに合致情報を提示する際には、加工前のスニペットを提示することとしても良いし、加工後のスニペットを提示することとしても良い。また、適切度を判定するための加工とは別に、加工前のスニペットにおいて、ユーザが指定したキーワードが初めて出現する部分については削除せず、2番目以降の出現はすべて削除あるいは所定の省略文字等に置換するような変更を施した上で、当該変更後のスニペットをユーザに提示することとしても良い。
(4.判定手法2)
本判定手法は、ユーザの行動の履歴と、商品やサービス、商品販売者やサービス提供者に割り当てられた禁忌文字列と、を利用して適切か否かを判定するものである。
商品販売者やサービス提供者は、ユーザを増やそうとするあまり、本来ならば適合しない文字列を商品やサービスの説明文又は宣伝文に設定してしまうことがある。
例えば、繁華街の中にあるホテルの宿泊サービスに対しては、「閑静な」という文字列は、説明文として適切ではない。一方、人里離れたペンションの宿泊サービスに対しては、「閑静な」という文字列は、説明文として適切であると考えられる。
そこで、ユーザからのフィードバックや情報提供装置12の管理者によるチェックによって、このような適切ではない文字列を、商品やサービスごと、あるいは、商品販売者やサービス提供者ごとに記憶部206に設定する。この文字列を、禁忌文字列と呼ぶ。
卑猥、猥褻な単語や公序良俗に反する単語が検索エンジンにおけるNGワードとして採用されることは多い。
しかしながら、本判定手法では、単語単独では、卑猥、猥褻でもなく、公序良俗に反することもなく、ある商品やサービスに対しては適切であるが、当該商品やサービスに対しては適切ではないような、両義的なキーワードを、禁忌文字列として採用することができる点に特徴がある。
さて、判定手法として最も単純なものは、
条件(a)「合致情報に指定される識別情報に対応付けて記憶部206に記憶される禁忌文字列がクエリに含まれる」
が満たされる場合に、適切ではないと判定する方法である。この方法は、NGワードの技術を、商品やサービス単位で一層きめ細かく適用したものと考えることができる。
これに加えて、
条件(b)「合致情報に指定される識別情報が、ユーザが検索済みであるとして記憶部206に記憶されている」
条件(c)「合致情報に指定される識別情報が、ユーザが選択済みであるとして記憶部206に記憶されていない」
を合わせた3つの条件がすべて満たされる場合に、適切ではない、と判定する方法を採用しても良い。
条件(b)(c)は、ユーザに過去に提示はされたものの、ユーザが興味を示さなかった合致情報に対して成立する条件である。
このような合致情報であって、なおかつ適切ではないキーワードを説明文等に含む商品やサービスについては、表示順位や表示自体を制御した方が、ユーザにとって有用と考えられるからである。
なお、本判定手法は、適切ではないキーワードで検索したとしても、当該商品やサービスが検索結果に含まれないようにするものである。したがって、商品販売者やサービス提供者が、禁忌文字列を説明文や宣伝文から削除した場合であっても、情報提供装置12の管理者は、特段の作業を必要としない。禁忌文字列を削除した場合には、禁忌文字列が含まれるクエリに対しても当該商品やサービスが検索結果に含まれないのは、当然だからである。
なお、過去の全ユーザについての検索において、クエリに含まれるキーワードごとに、各合致情報に対して、条件(b)(c)が満たされるか否かを統計情報として蓄積するように構成しても良い。すなわち、あるキーワードで検索されたある合致情報について、条件(b)が成立するユーザ数Bと、条件(c)が成立するユーザ数Cを追跡する。
多数のユーザにより検索が行われ、Bが所定のサンプル数以上となり、十分に大きい値となっているにもかかわらず、Bに対するCの割合が所定の極めて小さい閾値以下であれば、当該キーワードは、当該合致情報に対して適切ではない、と推定することができる。当該所定のサンプル数や当該極めて小さい閾値は、適用対象に応じて、適宜設定が可能である。
当該所定のサンプル数としては、統計的に有意な検索回数の定数(たとえば、100や500、1000等)を採用することができる。また、たとえば1箇月おき等、定期的にキーワードが適切か否かの推定をして禁忌文字列の設定を行う場合には、期間毎に、記憶部206に記憶される識別情報について、条件(b)を満たすユーザ数と集計して、期間毎の条件(b)を満たすユーザ数の平均をとり、この平均に1未満の正定数(たとえば、0.1、0.3、0.5等)を乗じた値を次の期間におけるBとして採用しても良い。このほか、これらの平均やこれらのうち小さい側の数値を、次の期間におけるBとして採用することもできる。
当該極めて小さい閾値としては、1未満の正定数(たとえば、0.001、0.0001、0.00001、あるいは、0等)を採用することができる。また、上記のように定期的にキーワードが適切か否かの推定をして禁忌文字列の設定を行う場合には、以下のような手法を採用しても良い。すなわち、期間毎に、記憶部206に記憶される識別情報について、条件(c)を満たすユーザ数を集計して、期間毎にこれらの平均をとる。この平均に1未満の正定数(たとえば、0.1、0.01、0.001、あるいは、0等)を乗じた値を次の期間におけるCとして採用する。このほか、上記の手法の平均や、これらのうち小さい側の数値を、次の期間におけるCとして採用することもできる。
このような推定結果を利用すれば、ユーザの行動の履歴に基づいて、記憶部206における禁忌文字列の情報を適切に更新することができる。
(5.判定手法3)
商品販売者やサービス提供者は、ユーザを増やそうとするあまり、本来ならば適合しない属性情報を、商品やサービスに設定してしまうことがある。
例えば、シングルの部屋しかないホテルの宿泊サービスに対しては、「ファミリー向け」の属性は適切ではない。
そこで、判定手法3では、上記判定手法2の条件(b)(c)にかえて、
条件(d)「合致情報に指定される識別情報に対応付けて記憶部206に記憶されるデータの属性情報と、ユーザに対応付けて記憶部206記憶されるユーザの属性情報と、がマッチしない」
を採用する。
条件(d)を採用すれば、例えば、独身者に対して、ファミリー向けのホテルを紹介してしまう、などの状況を防止することができる。
なお、ユーザに関するユーザの属性情報と、商品やサービスに関するデータ属性情報と、のマッチの判定には、例えば、特許文献2に開示される技術を採用することも可能である。
(6.判定手法4)
上記の判定手法1乃至3は、適宜組み合わせることが可能である。例えば、判定手法1乃至3のすべてを適用して、これらの条件のいずれかを満たす場合に、合致情報の順位を下げたり提示をやめたりする等である。
また、判定手法2と判定手法3においては、条件(a)の判定が共通するため、この判定結果を再利用することにより、計算処理を高速化することができるようになる。
(7.その他の態様)
上記態様では、商品やサービスの電子商取引システムにおいて、商品やサービスという検索対象を検索する際に、当該商品やサービスの内容を説明する説明情報に適切ではない表現が含まれている場合に、その商品やサービスをユーザに提示するときの表示順位や表示の可否を制御するものであった。
本実施形態は、特に上記の判定手法1を、より広い検索システムに適用するものであり、端末装置14が、情報提供装置として機能する。
本実施形態における検索対象は、商品やサービスに関するデータではなく、インターネット16内で公開されている電子文書である。
情報検索装置18は、いわゆる検索エンジンとして機能する。すなわち、情報検索装置18は、定期的にインターネット16内で公開されている文書をクロールし、当該文書に含まれるキーワード、当該文書のURL、当該文書のキャッシュなど、各種の文書データを保持する。
ユーザが、端末装置14を用いて、情報検索装置18に対するクエリ入力欄604、あるいは、クエリ入力欄606から所望のキーワードを入力すると、当該キーワードがインターネット16を介して情報検索装置18に伝達される。
情報検索装置18は、端末装置14から伝達されたキーワードを含む文書を、自身が保持した文書データから検索し、検索の結果得られた文書のキャッシュから当該キーワードが出現する箇所ならびにその前後の文章を抽出したスニペットを生成する。また、検索の際には、文書に順位が付けられる。
そして、情報検索装置18は、文書のURLと文書のスニペットを組にして、文書の順位の順に当該組を並べたHTML文書を作成する。HTML文書は、構造化文書と呼ばれるものであり、各種のタグによって、文書に含まれる文字列の構造化がなされている。
HTML文書内では、文書のURLならびにスニペットを所定のタグで囲むことによって、これらが1つの文書に関する情報であることを明示し、タグで囲まれた情報を順に並べることによって、文書の順位を表す。
この処理で生成されたHTML文書が、検索結果に相当する。また、当該HTML文書の中の、タグで囲まれた文書のURLならびにスニペットの情報が、合致情報に相当する。
この後、情報検索装置18は、生成したHTML文書を端末装置14に送信する。
HTML文書を受信した端末装置14は、ブラウザの表示画面にHTML文書を整形して表示する。
従来、端末装置14のブラウザは、情報検索装置18から送信されたHTML文書を、そのまま整形してブラウザの表示画面に表示していた。
本実施形態では、端末装置14のブラウザにおいて、情報検索装置18から得られたHTML文書に対して、さらに処理を加える。
すなわち、端末装置14のブラウザは、検索結果のHTML文書を得ると、その構造を解析して、所定のタグで囲まれた文書のURLならびにスニペットからなる合致情報を順に取得する。
そして、取得された合致情報毎に、スニペットから検索の際に使用したキーワードを除去した得られた文字列を求め、当該得られた文字列の長さや当該得られた文字列を所定の圧縮アルゴリズムで圧縮した際の圧縮率から、当該合致情報が適切か否かを判定する。
そして、合致情報が適切ではない場合は、前記HTML文書から、当該適切ではない合致情報に係る部分を削除したり、あるいは、当該HTML文書内における当該適切ではない合致情報に係る部分を文書の後方に移動するのである。すなわち、端末装置14のブラウザにおいてHTML文書が動的に修正される。
このような処理を行い、HTML文書の修正が終了すると、端末装置14のブラウザの表示画面には、修正済みのHTML文書が表示されることになる。
なお、HTML文書に対する修正は、端末装置14におけるブラウザの表示画面に、当該HTML文書を表示しながら並行して行っても良いし、HTML文書の修正がすべて完了した後に、表示画面に当該HTML文書を表示することとしても良い。
このように、本実施形態では、外部の情報検索装置18により実現される既存の検索エンジンから得られた検索結果が端末装置14のブラウザで動的に修正される。
既存のブラウザに対しては、プラグインやアドオンとしてこのような動的な修正の機能を付加することができる。プラグインやアドオンのプログラムは、ブラウザで動作するスクリプト言語により記述され、DOM(Document Object Model)に基づいたHTML文書の動的な修正機能を用いることにより、上記の処理を実現する。
本実施形態によれば、端末装置14のブラウザから既存の検索エンジンを用いる際に、例えば特定のキーワードが重複利用されているような、ユーザにとって価値が低いと思われる文書の検索結果における表示の可否や表示順位を制御することができるようになる。
本発明によれば、既存の検索機能を活用しつつ、より適切な検索結果をユーザに提示するために好適な情報提供装置、情報提供方法、プログラム、ならびに、情報記録媒体を提供することができる。
11 情報提供システム
12 情報提供装置
14 端末装置
16 インターネット
18 情報検索装置
101 コンピュータ
102 CPU
103 ハードディスク
104 RAM
105 NIC
106 入力装置
107 表示装置
201 クエリ受付部
202 取得部
203 修正部
204 提示部
205 検索部
206 記憶部
207 選択受付部
601 画面
602 URL入力欄
603 コンテンツ表示領域
604 クエリ入力欄
605 検索ツールバー
606 クエリ入力欄
607 検索結果表示欄
608 合致情報
609 識別情報
610 スニペット

Claims (12)

  1. クエリの入力を受け付けるクエリ受付部、
    前記クエリを満たす検索対象の識別情報ならびにスニペットを含む合致情報から構成される検索結果を取得する取得部、
    前記検索結果に含まれる合致情報について、当該合致情報に含まれるスニペットの文字列から前記クエリに含まれる文字列を除去することにより得られる文字列に基づいて、前記検索結果を修正する修正部、
    前記修正された検索結果に含まれる合致情報を提示する提示部
    を備えることを特徴とする情報提供装置。
  2. 請求項1に記載の情報提供装置であって、
    前記取得部は、前記クエリに基づいて外部の情報検索装置に検索対象を検索させて、前記検索結果を取得する
    ことを特徴とする情報提供装置。
  3. 請求項1に記載の情報提供装置であって、
    前記クエリに基づいて検索対象を検索する検索部
    を備え、
    前記取得部は、前記検索部により検索された検索結果を取得する
    ことを特徴とする情報提供装置。
  4. 請求項1から3のいずれか1項に記載の情報提供装置であって、
    前記合致情報には、当該検索された検索対象の順位がさらに含まれ、
    前記修正部は、前記得られた文字列に基づいて、前記検索結果を構成する合致情報の順位を変更することにより、当該検索結果を修正する
    ことを特徴とする情報提供装置。
  5. 請求項1から3のいずれか1項に記載の情報提供装置であって、
    前記修正部は、前記得られた文字列に基づいて、前記検索結果に含まれる合致情報を絞り込むことにより、当該検索結果を修正する
    ことを特徴とする情報提供装置。
  6. 請求項4または5に記載の情報提供装置であって、
    前記修正部は、前記得られた文字列の長さに基づいて、前記検索結果を修正する
    ことを特徴とする情報提供装置。
  7. 請求項4または5に記載の情報提供装置であって、
    前記修正部は、所定の圧縮アルゴリズムを用いて前記得られた文字列を圧縮し、当該圧縮後のデータ量に基づいて、前記検索結果を修正する
    ことを特徴とする情報提供装置。
  8. 請求項4または5に記載の情報提供装置であって、
    前記修正部は、所定の圧縮アルゴリズムを用いて前記得られた文字列を圧縮し、当該圧縮後のデータ量と、前記スニペットのデータ量と、の比率に基づいて、前記検索結果を修正する
    ことを特徴とする情報提供装置。
  9. 請求項1から8のいずれか1項に記載の情報提供装置であって、
    前記修正部は、前記合致情報に含まれるスニペットにおいて前記クエリに含まれる文字列が所定の回数以上出現しないように、前記スニペットを加工することにより、前記検索結果をさらに修正する
    ことを特徴とする情報提供装置。
  10. クエリ受付部、取得部、修正部、提示部を備える情報提供装置が実行する情報提供方法であって、
    前記クエリ受付部が、クエリの入力を受け付ける受付工程、
    前記取得部が、前記クエリを満たす検索対象の識別情報ならびにスニペットを含む合致情報から構成される検索結果を取得する取得工程、
    前記修正部が、前記検索結果に含まれる合致情報について、当該合致情報に含まれるスニペットの文字列から前記クエリに含まれる文字列を除去することにより得られる文字列に基づいて、前記検索結果を修正する修正工程、
    前記提示部が、前記修正された検索結果に含まれる合致情報を提示する提示工程
    を備えることを特徴とする情報提供方法。
  11. コンピュータを、
    クエリの入力を受け付けるクエリ受付部、
    前記クエリを満たす検索対象の識別情報ならびにスニペットを含む合致情報から構成される検索結果を取得する取得部、
    前記検索結果に含まれる合致情報について、当該合致情報に含まれるスニペットの文字列から前記クエリに含まれる文字列を除去することにより得られる文字列に基づいて、前記検索結果を修正する修正部、
    前記修正された検索結果に含まれる合致情報を提示する提示部
    として機能させることを特徴とするプログラム。
  12. コンピュータを、
    クエリの入力を受け付けるクエリ受付部、
    前記クエリを満たす検索対象の識別情報ならびにスニペットを含む合致情報から構成される検索結果を取得する取得部、
    前記検索結果に含まれる合致情報について、当該合致情報に含まれるスニペットの文字列から前記クエリに含まれる文字列を除去することにより得られる文字列に基づいて、前記検索結果を修正する修正部、
    前記修正された検索結果に含まれる合致情報を提示する提示部
    として機能させることを特徴とするプログラムを記録したコンピュータ読取可能な情報記録媒体。
JP2010185370A 2010-08-20 2010-08-20 情報提供装置、情報提供方法、プログラム、ならびに、情報記録媒体 Active JP4939637B2 (ja)

Priority Applications (9)

Application Number Priority Date Filing Date Title
JP2010185370A JP4939637B2 (ja) 2010-08-20 2010-08-20 情報提供装置、情報提供方法、プログラム、ならびに、情報記録媒体
CA2805964A CA2805964A1 (en) 2010-08-20 2011-08-15 Information provision device, information provision method, program, and information recording medium
PCT/JP2011/068524 WO2012023540A1 (ja) 2010-08-20 2011-08-15 情報提供装置、情報提供方法、プログラム、ならびに、情報記録媒体
EP11818181.7A EP2608064A4 (en) 2010-08-20 2011-08-15 DEVICE FOR PROVIDING INFORMATION, METHOD FOR PROVIDING INFORMATION, PROGRAM THEREFOR AND MEDIUM FOR RECORDING INFORMATION
US13/817,585 US20130204864A1 (en) 2010-08-20 2011-08-15 Information provision device, information provision method, program, and information recording medium
CN2011800401321A CN103069419A (zh) 2010-08-20 2011-08-15 信息提供装置、信息提供方法、程序以及信息记录介质
BR112013003988A BR112013003988A2 (pt) 2010-08-20 2011-08-15 "dispositivo de provisão de informação, método de provisão de informação executado por um dispositivo de provisão de informação, e, meio de gravação de informação legível por computador não transitório".
KR1020137004100A KR101324460B1 (ko) 2010-08-20 2011-08-15 정보 제공 장치, 정보 제공 방법 및 정보 기록 매체
TW100129860A TWI417751B (zh) 2010-08-20 2011-08-19 Information providing device, information providing method, information application program, and information recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010185370A JP4939637B2 (ja) 2010-08-20 2010-08-20 情報提供装置、情報提供方法、プログラム、ならびに、情報記録媒体

Publications (2)

Publication Number Publication Date
JP2012043289A JP2012043289A (ja) 2012-03-01
JP4939637B2 true JP4939637B2 (ja) 2012-05-30

Family

ID=45605193

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010185370A Active JP4939637B2 (ja) 2010-08-20 2010-08-20 情報提供装置、情報提供方法、プログラム、ならびに、情報記録媒体

Country Status (9)

Country Link
US (1) US20130204864A1 (ja)
EP (1) EP2608064A4 (ja)
JP (1) JP4939637B2 (ja)
KR (1) KR101324460B1 (ja)
CN (1) CN103069419A (ja)
BR (1) BR112013003988A2 (ja)
CA (1) CA2805964A1 (ja)
TW (1) TWI417751B (ja)
WO (1) WO2012023540A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103294706A (zh) * 2012-02-28 2013-09-11 腾讯科技(深圳)有限公司 触摸式终端中的文本搜索方法和装置
US9443033B2 (en) * 2012-05-05 2016-09-13 Blackbaud, Inc. Systems, methods, and computer program products for data integration and data mapping
US9195716B2 (en) * 2013-02-28 2015-11-24 Facebook, Inc. Techniques for ranking character searches
US10409824B2 (en) * 2016-06-29 2019-09-10 International Business Machines Corporation System, method and recording medium for cognitive proximates
WO2018106261A1 (en) 2016-12-09 2018-06-14 Google Llc Preventing the distribution of forbidden network content using automatic variant detection
US10042957B2 (en) * 2017-01-12 2018-08-07 Innovationdock, Inc. Devices and methods for implementing dynamic collaborative workflow systems
JP2018128925A (ja) * 2017-02-09 2018-08-16 富士通株式会社 情報出力プログラム、情報出力方法及び情報出力装置

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6742047B1 (en) * 1997-03-27 2004-05-25 Intel Corporation Method and apparatus for dynamically filtering network content
US6425525B1 (en) * 1999-03-19 2002-07-30 Accenture Llp System and method for inputting, retrieving, organizing and analyzing data
US6442606B1 (en) * 1999-08-12 2002-08-27 Inktomi Corporation Method and apparatus for identifying spoof documents
GB0026353D0 (en) * 2000-10-27 2000-12-13 Canon Kk Apparatus and a method for facilitating searching
JP4071805B2 (ja) 2000-12-27 2008-04-02 楽天株式会社 広告送信サーバ、広告送信プログラム及びユーザ検索方法
US7406458B1 (en) * 2002-09-17 2008-07-29 Yahoo! Inc. Generating descriptions of matching resources based on the kind, quality, and relevance of available sources of information about the matching resources
US20050058972A1 (en) * 2003-08-27 2005-03-17 Mcdole Michael E. Method for censorship
US7293017B2 (en) * 2004-07-01 2007-11-06 Microsoft Corporation Presentation-level content filtering for a search result
US8631006B1 (en) * 2005-04-14 2014-01-14 Google Inc. System and method for personalized snippet generation
US20070100872A1 (en) * 2005-11-03 2007-05-03 Bodin William K Dynamic creation of user interfaces for data management and data rendering
US20080235209A1 (en) 2007-03-20 2008-09-25 Samsung Electronics Co., Ltd. Method and apparatus for search result snippet analysis for query expansion and result filtering
US7921092B2 (en) * 2006-12-04 2011-04-05 Yahoo! Inc. Topic-focused search result summaries
US7912847B2 (en) * 2007-02-20 2011-03-22 Wright State University Comparative web search system and method
JP4963620B2 (ja) 2007-03-30 2012-06-27 楽天株式会社 情報検索システム、情報検索装置、検索結果画面情報生成方法及び検索結果画面情報生成処理プログラム
US7853589B2 (en) * 2007-04-30 2010-12-14 Microsoft Corporation Web spam page classification using query-dependent data
US8032527B2 (en) * 2007-08-29 2011-10-04 Google Inc. Search filtering
US7822742B2 (en) * 2008-01-02 2010-10-26 Microsoft Corporation Modifying relevance ranking of search result items
US7853587B2 (en) * 2008-01-31 2010-12-14 Microsoft Corporation Generating search result summaries
US8412702B2 (en) * 2008-03-12 2013-04-02 Yahoo! Inc. System, method, and/or apparatus for reordering search results
US8577930B2 (en) * 2008-08-20 2013-11-05 Yahoo! Inc. Measuring topical coherence of keyword sets
US8032508B2 (en) * 2008-11-18 2011-10-04 Yahoo! Inc. System and method for URL based query for retrieving data related to a context
JP2010128928A (ja) * 2008-11-28 2010-06-10 Ntt Docomo Inc 検索システム及び検索方法
JP5426895B2 (ja) 2009-02-12 2014-02-26 富士重工業株式会社 車両用ラジエータユニット
US8250053B2 (en) * 2009-02-24 2012-08-21 Microsoft Corporation Intelligent enhancement of a search result snippet
US8555157B1 (en) * 2010-01-21 2013-10-08 Google Inc. Document update generation

Also Published As

Publication number Publication date
CN103069419A (zh) 2013-04-24
EP2608064A1 (en) 2013-06-26
CA2805964A1 (en) 2012-02-23
TW201211805A (en) 2012-03-16
WO2012023540A1 (ja) 2012-02-23
EP2608064A4 (en) 2014-02-26
KR101324460B1 (ko) 2013-10-31
US20130204864A1 (en) 2013-08-08
TWI417751B (zh) 2013-12-01
BR112013003988A2 (pt) 2019-09-24
JP2012043289A (ja) 2012-03-01
KR20130028796A (ko) 2013-03-19

Similar Documents

Publication Publication Date Title
US11681750B2 (en) System and method for providing content to users based on interactions by similar other users
US9355185B2 (en) Infinite browse
JP5603337B2 (ja) バーティカル提案により検索要求を支援するためのシステム及び方法
JP4939637B2 (ja) 情報提供装置、情報提供方法、プログラム、ならびに、情報記録媒体
US20100306249A1 (en) Social network systems and methods
JP2008507041A (ja) 検索結果内におけるプレーストコンテンツの順序付けのパーソナライズ
US20100192055A1 (en) Apparatus, method and article to interact with source files in networked environment
US20160299951A1 (en) Processing a search query and retrieving targeted records from a networked database system
JP4955841B2 (ja) 情報提供装置、情報提供方法、プログラム、ならびに、情報記録媒体
JP2012043290A (ja) 情報提供装置、情報提供方法、プログラム、ならびに、情報記録媒体
JP2004206492A (ja) ドキュメント表示方法およびそれを用いたリンク先選択機能付ゲートウェイ装置
JP6568284B1 (ja) 提供装置、提供方法及び提供プログラム
US20180165741A1 (en) Information providing device, information providing method, information providing program, and computer-readable storage medium storing the program
JP5777663B2 (ja) 検索支援装置及び検索支援プログラム
JP6228425B2 (ja) 広告生成装置および広告生成方法
JP4859891B2 (ja) コンテンツに関連する情報を提供するサーバ、システム及び方法
Xiao-Qing et al. Design of open source personalized information recommendation system for web pages in big data environment
JP3933617B2 (ja) 共有情報検索方法、共有情報検索プログラム、および情報共有システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120203

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20120203

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120221

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120224

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150302

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4939637

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250