JP4035623B2 - 情報処理装置およびプログラム - Google Patents

情報処理装置およびプログラム Download PDF

Info

Publication number
JP4035623B2
JP4035623B2 JP2006524541A JP2006524541A JP4035623B2 JP 4035623 B2 JP4035623 B2 JP 4035623B2 JP 2006524541 A JP2006524541 A JP 2006524541A JP 2006524541 A JP2006524541 A JP 2006524541A JP 4035623 B2 JP4035623 B2 JP 4035623B2
Authority
JP
Japan
Prior art keywords
information
search
target
word
target information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006524541A
Other languages
English (en)
Other versions
JPWO2006008919A1 (ja
Inventor
毅 相良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Tokyo NUC
Original Assignee
University of Tokyo NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Tokyo NUC filed Critical University of Tokyo NUC
Application granted granted Critical
Publication of JP4035623B2 publication Critical patent/JP4035623B2/ja
Publication of JPWO2006008919A1 publication Critical patent/JPWO2006008919A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、例えば、WEB上のホームページ等に記載されている店舗の対象情報を効率的に検索する情報処理装置やプログラム等に関するものである。
従来の第一の技術として、以下の技術がある。つまり、インターネット上に存在する大量のWebページから、属性に関する条件とハイパーリンクに関する条件を組み合わせて指定し、Webページの系列を検索するための問い合わせの処理方法において、Webページに関するインデックスを利用し、問い合わせに指定された条件から、未処理で、かつ他条件の処理結果に依存せずに処理結果を求めることのできる条件の処理コストと処理結果を予測し、問い合わせ処理の進行状況にあわせて最適な条件を選択し処理する操作を、問い合わせで指定された全ての条件を処理するまで繰り返し、問い合わせの条件を満たすWebページの系列を求める検索方法がある。かかる検索方法により、Webページの系列を高速に検索することができる(特許文献1参照)。
従来の第二の技術として、ユーザ端末により起点として指定されたホームページから、ホームページ間に定義されたハイパーリンクもしくはユーザの検索要求に応じてホームページ間の関連性を評価することによって動的に生成するリンクの展開を行なうステップと、展開されたホームページに記述されたテキスト、HTMLタグで指定されたホームページの属性、およびホームページ内の表現から抽出されたホームページの属性の評価を繰り返しながら、ユーザ端末から指定された問い合わせ内容に応じたホームページとリンクの系列を検索結果として出力するステップとを備える検索方法がある。かかる検索方法により、あるホームページを起点に情報間の関連性を辿りながら目的のホームページに到達することと、その情報へ到達するための情報の系列自体を獲得することができる(特許文献2参照)。
また、レストラン等の特定種類の店舗を検索するホームページが存在する(非特許文献1参照)。
特開2003−203089(第1頁、第1図等) 特開2001−344283(第1頁、第1図等) ぐるなびホームページ、インターネット<URL:http://www.gnavi.co.jp/>
しかしながら、上述した従来技術は、2以上のホームページから2以上のユーザが記載した情報を抽出して、多数のユーザの評価に基づいてレストラン等の情報を出力するものではなかった。つまり、ユーザは、多数のユーザの客観的情報に基づく、店舗等の情報を取得することができなかった。
本第一の発明の情報処理装置は、2以上の検索対象を特定する情報である検索情報を受け付ける受付部と、前記検索情報により特定される2以上の検索対象の評価に関する情報である2以上の対象情報を2以上の元情報から取得する対象情報取得部と、前記2以上の検索対象の対象情報を出力する出力部を具備する情報処理装置である。
かかる構成により、多数のホームページ等の元情報から、店舗等の検索対象の評価に関する情報を収集できる情報処理装置を提供できる。
本第二の発明の情報処理装置は、第一の発明の情報処理装置における出力部は、前記2以上の対象情報を要約し、2以上の要約情報を取得する要約手段と、前記2以上の要約情報を出力する要約情報出力手段を具備する。
かかる構成により、多数の元情報の要約情報を出力するので、限られた面積の表示画面を有効に利用できる。
本第三の発明の情報処理装置は、第二の発明の情報処理装置における要約手段は、前記対象情報から単語を抽出する単語抽出手段と、前記単語抽出手段が抽出した各単語における、検索対象毎の出現回数を算出する検索対象毎単語出現回数算出手段と、前記出現回数に基づいて、前記対象情報から各検索対象の要約情報を取得する要約取得手段を具備する。
かかる構成により、店舗等の検索対象の特徴を示す単語に着目して要約情報を取得することにより、好適な要約情報を得ることができる。
なお、要約手段は、前記単語抽出手段が抽出した各単語における、全部の検索対象の全対象情報中の出現回数を算出する単語全出現回数算出手段と、前記検索対象毎単語出現回数算出手段が算出した検索対象毎の出現回数と前記単語全出現回数算出手段が算出した全対象情報中の出現回数との割合を算出する割合算出手段と、前記割合算出手段が算出した割合が高い単語から並べて、検索対象毎の単語リストを作成する単語リスト作成手段をさらに具備し、第三の発明の情報処理装置の要約取得手段は、前記検索対象毎の単語リストに基づいて、前記対象情報から各検索対象の要約情報を取得することが好適である。
本第四の発明の情報処理装置は、上記の対象情報取得部は、対象情報が記載された情報の所在を示す情報であるリンク情報も取得し、前記受付部は、前記要約情報に対する指示である要約情報選択指示をも受け付け、前記受付部が要約情報選択指示を受け付けた場合に、前記要約情報選択指示に対応する要約情報の元になる対象情報が記載された元情報のリンク情報に基づいて、当該元情報を取得する元情報取得部をさらに具備し、前記出力部は、前記元情報取得部が取得した元情報をも出力する元情報出力手段をも具備する構成である。
かかる構成により、要約情報だけでは物足りないユーザにとって、容易に元情報を取得することができ好適である。
本第五の発明の情報処理装置は、上記の対象情報取得部は、対象情報が記載された情報の所在を示す情報であるリンク情報も取得し、前記出力部は、前記リンク情報に対応する情報であるリンクシンボル情報を出力するリンクシンボル出力手段をさらに具備し、前記受付部は、前記リンクシンボル情報に対する指示であるリンクシンボル選択指示をも受け付け、前記受付部がリンクシンボル選択指示を受け付けた場合に、前記指示されたリンクシンボル情報に対応するリンク情報に基づいて、当該リンク情報が示す対象情報が記載された情報である元情報を取得する元情報取得部をさらに具備し、前記出力部は、前記元情報取得部が取得した元情報をも出力する元情報出力手段をも具備する構成である。
かかる構成により、要約を読まずに元情報を取得したいユーザが、容易に元情報を取得することができ好適である。
本第六の発明の情報処理装置は、上記の出力部は、前記2以上の検索対象の対象情報に基づいて、前記2以上の検索対象を順位付けするランキング決定手段をさらに具備し、前記ランキング決定手段の順位付けに基づいて、前記2以上の検索対象の対象情報または/および要約情報を出力する。
かかる構成により、ユーザが欲しい店舗等の検索対象の情報が、ランキングされて出力される。したがって、ユーザが欲する情報を見やすい形態で出力できる。
本第七の発明の情報処理装置は、上記のランキング決定手段は、前記2以上の検索対象の対象情報の文字数、または/および当該対象情報に電話番号情報が含まれるか否か、または/および対象情報が記載されている元情報のページランキングに基づいて前記2以上の検索対象を順位付けする。
かかる構成により、特に、WEB上のホームページに記載されている店舗等の評判に基づいて、店舗等をランキングする場合に好適である。
本第八の発明の情報処理装置は、前記検索情報は、検索地点に関する情報である検索地点情報と、検索対象のグループを特定する情報である対象グループ情報を有する。
かかる構成により、ユーザの行動特性に合致した店舗等の検索が可能である。行動特定とは、駅を中心に行動するという都会派の人達の行動特性や、おいしい店であれば、駅から徒歩数分ぐらいは歩いて行くであろう、という行動特性である。
本第九の発明の情報処理装置は、対象情報取得部は、検索対象の名称を示す情報である検索対象名称情報と、検索対象の電話番号を示す情報である電話番号情報と、検索対象の住所を示す情報である住所情報を有する被検索対象情報を1以上有する被検索対象情報群を格納している被検索対象情報群格納手段と、前記検索情報に基づいて、前記被検索対象情報群格納手段から被検索対象情報の一部または全部を取得する被検索対象情報取得手段と、前記被検索対象情報取得手段が取得した被検索対象情報の一部または全部に基づいて、前記検索情報により特定される2以上の検索対象の対象に関する情報である対象情報を取得する対象情報取得手段を具備する。
かかる構成により、ユーザの要求に合致する店舗等の検索対象の絞込みが適切にできる。
本第十の発明の情報処理装置は、上記の検索情報は、さらに検索地点情報が示す検索地点からの検索範囲を特定する情報である検索範囲情報を含み、前記被検索対象情報取得手段は、前記検索情報が有する検索地点情報と前記検索対象の住所情報と前記検索範囲情報に基づいて、前記被検索対象情報群格納手段から1以上の被検索対象情報を選択し、当該選択した被検索対象情報の一部または全部を取得する。
かかる構成により、さらにユーザの行動特性に合致した店舗等の検索が可能である。
本第十一の発明の情報処理装置は、上記の被検索対象情報取得手段は、前記検索情報が有する検索地点情報の経緯度と、前記検索対象の住所情報の経緯度を取得し、当該2つの経緯度から前記検索地点情報が示す検索地点と前記住所情報が示す前記検索対象の地点の間の距離を算出し、当該距離に基づいて、前記検索範囲情報が示す条件に合致するか否かを判断することにより、前記被検索対象情報群格納手段から1以上の被検索対象情報を選択し、当該選択した被検索対象情報の一部または全部を取得する。
かかる構成により、例えば、駅から徒歩10分等の検索情報である場合に、かなり正確に対象となり得る店舗等の検索対象の情報を得ることができる。
本第十ニの発明の情報処理装置は、対象情報を取得する元になる情報である元情報は、階層化されたタグが付された情報であり、前記対象情報取得部は、一の元情報から複数の対象情報を取得する場合に、同一の階層レベルの情報を取得する構成である。
かかる構成により、高速に対象情報を得ることができる。
本第十三の発明の情報処理装置は、上記の対象情報取得部は、一の元情報から複数の対象情報を取得する場合に、一の元情報を検索し、電話番号情報、住所情報、郵便番号のうちの1以上の情報である場所情報を含む階層レベルを決定し、当該決定した階層レベルの情報を取得する構成である。
かかる構成により、正確に、かつ高速に対象情報を得ることができる。
本発明によれば、店舗等の客観的な情報が適切に取得できる。
以下、情報処理システム、情報処理装置等の実施形態について図面を参照して説明する。なお、実施の形態において同じ符号を付した構成要素は同様の動作を行うので、再度の説明を省略する場合がある。
(実施の形態1)
図1は、本実施の形態における情報処理システムの概念図である。本情報処理システムは、情報端末11、情報処理装置12、情報格納装置13を有する。情報端末11は、いわゆるクライアント端末であり、例えば、レストラン等の対象情報を出力する端末である。対象情報とは、検索情報により特定される2以上の検索対象(レストラン等)に関する情報である。かかる対象情報は、例えば、レストラン等の評価(美味しいや、お洒落や、まずい等)に関する情報である。情報処理装置12は、情報端末11の要求に応じて対象情報を取得して、当該対象情報を情報端末11に送信する装置である。情報処理装置12は、例えば、いわゆるサーチエンジンを搭載したアプリケーションサービスプロバイダーのサーバ装置である。情報格納装置13は、例えば、レストラン等の対象情報を格納している装置である。情報格納装置13は、例えば、情報ポータルに記載されたレストラン等の評価の情報や、個人のユーザが書き込んだレストラン等の評価を示す対象情報や、個人のユーザが記録した日記などの情報を格納している。情報処理システムにおいて、通常、情報格納装置13は複数存在する。対象情報が記載されている情報を元情報と言う。元情報は、例えば、いわゆるWEBのホームページである
図2は、本実施の形態における情報処理システムのブロック図である。情報端末11は、ユーザ入力受付部1101、要求送信部1102、情報受信部1103、情報出力部1104を有する。情報処理装置12は、受付部1201、対象情報取得部1202、元情報取得部1203、出力部1204、元情報受信部1205、元情報蓄積部1206、元情報格納部1207を具備する。対象情報取得部1202は、被検索対象情報群格納手段12021、被検索対象情報取得手段12022、対象情報取得手段12023を具備する。出力部1204は、ランキング決定手段12041、対象情報出力手段12042、要約手段12043、要約情報出力手段12044、元情報出力手段12045、リンクシンボル出力手段12046を具備する。要約手段12043は、単語抽出手段120431、検索対象毎単語出現回数算出手段120432、単語全出現回数算出手段120433、割合算出手段120434、単語リスト作成手段120435を具備する。情報格納装置13は、元情報格納部1301、元情報送信部1302を具備する。
ユーザ入力受付部1101は、ユーザから2以上の検索対象を特定する情報である検索情報を受け付ける。検索対象は、例えば、レストランや、英会話学校や、旅行先などである。検索情報とは、ユーザが欲しい情報を特定するための情報であり、いわゆる検索キーである。検索情報は、例えば、検索地点に関する情報である検索地点情報(渋谷駅などの駅名や、住所や、電話番号で特定される地域など)と、検索対象のグループを特定する情報である対象グループ情報(ラーメン[ラーメン屋という検索対象のグループを特定する情報]や、イタリヤレストランや、中華料理[中華料理屋という検索対象のグループを特定する情報]など)を有する。また、検索情報は、例えば、さらに検索地点情報が示す検索地点からの検索範囲を特定する情報である検索範囲情報(徒歩5分以内、1km以内など)を含んでも良い。さらに、検索情報は、その他の検索キーを含んでも良い。また、ユーザ入力受付部1101は、出力されている要約情報に対する指示である要約情報選択指示をも受け付ける。要約情報は、対象情報を要約した情報である。対象情報の要約方法は種々ある。対象情報の要約方法の例については、後述する。また、ユーザ入力受付部1101は、リンクシンボル情報に対する指示であるリンクシンボル選択指示をも受け付ける。リンクシンボル情報とは、対象情報が記載された元情報の所在を示す情報であるリンク情報に対応する情報である。リンクシンボル情報の具体例は、後述する。さらに、ユーザ入力受付部1101は、ユーザからの種々の指示や入力も受け付ける。検索情報等の入力手段は、テンキーやキーボードやマウスやメニュー画面によるもの等、何でも良い。ユーザ入力受付部1101は、テンキーやキーボード等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェア等で実現され得る。
要求送信部1102は、ユーザ入力受付部1101が受け付けた検索情報に基づいて、当該検索情報を有する要求情報を、情報処理装置12に送信する。要求情報は、検索情報に対応する検索対象の対象情報を取得する要求を示す情報である。要求情報のデータ構造は問わない。要求情報は、通常、情報処理装置12を特定する情報を含む。情報処理装置12を特定する情報とは、例えば、情報処理装置12の中の、対象情報が有するフォルダを示すURLやURI、または情報処理装置12のIPアドレス等である。要求送信部1102は、通常、無線または有線の通信手段を含むが、通信手段の変わりに放送手段でも良い。
情報受信部1103は、要求送信部1102における要求情報の送信に基づいて、対象情報や元情報等の情報を情報処理装置12から受信する。情報受信部1103は、通常、無線または有線の通信手段で実現されるが、放送受信手段でも実現され得る。
情報出力部1104は、情報受信部1103が受信した対象情報や元情報等の情報を出力する。ここでの出力とは、ディスプレイへの表示、プリンタへの印字、音出力が主であるが、外部の装置への送信等を含む概念である。情報出力部1104は、ディスプレイやスピーカー等の出力デバイスを含むと考えても含まないと考えても良い。情報出力部1104は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。なお、情報端末11におけるユーザ入力受付部1101、要求送信部1102、情報受信部1103、情報出力部1104などの処理は、例えば、いわゆるWEBブラウザの処理で実現可能である。
受付部1201は、2以上の検索対象を特定する情報である検索情報や、その他の情報の取得指示を受け付ける。なお、検索情報は要求情報に含まれる。また、その他の情報の取得指示は、例えば、URLを含む情報である。かかるその他の情報の取得指示を受け付けた場合は、当該URLで特定される情報(例えば、ホームページ)が情報端末11に返送される。受付部1201は、通常、要求情報を受信する。ここでの受け付けとは、通常、情報端末11からの受信を言う。ただし、一般的には、ユーザが手入力した情報の受け付けや、記録媒体からの読み出しなども含んでも良い。受付部1201は、通常、無線または有線の通信手段で実現されるが、放送を受信する手段で実現されても良い。また、受付部1201は、テンキーやキーボード等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェア等でも実現され得る。
対象情報取得部1202は、受付部1201が受け付けた検索情報により特定される2以上の検索対象に関する情報である対象情報を取得する。対象情報を取得する先は、2以上の情報格納装置13でも良いし、情報処理装置12の元情報格納部1207でも良い。対象情報取得部1202は、通常、MPUやメモリ等から実現され得る。対象情報取得部1202の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。なお、対象情報を外部装置から受信する場合は、対象情報取得部1202は、無線または有線の通信手段等も含む構成で実現され得る。
元情報取得部1203は、受付部1201が要約対象情報選択指示を受け付けた場合、当該要約対象情報選択指示に対応する要約対象情報の元になる対象情報が記載された元情報のリンク情報に基づいて、当該元情報を取得する。また、元情報取得部1203は、受付部1201がリンクシンボル選択指示を受け付けた場合に、当該リンクシンボル選択指示に対応するリンクシンボル情報に対応するリンク情報に基づいて、当該リンク情報が示す対象情報が記載された情報である元情報を取得する。リンク情報は、例えば、元情報の所在を示すURLやURI等である。かかる場合、元情報取得部1203は、例えば、URLやURI等に対応するホームページを取得する。元情報取得部1203は、通常、MPUやメモリ等から実現され得る。元情報取得部1203の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。なお、元情報を外部装置から受信する場合は、元情報取得部1203は、無線または有線の通信手段等も含む構成で実現され得る。
出力部1204は、2以上の検索対象の対象情報を出力する。また、出力部1204は、2以上の検索対象の対象情報を要約した情報である2以上の要約対象情報を出力しても良い。また、出力部1204は、下記に説明するように、2以上の検索対象の対象情報または/および要約対象情報を、ランキングして出力しても良い。さらに、出力部1204は、元情報取得部1203が取得した元情報をも出力しても良い。出力部1204は、リンク情報に対応する情報であるリンクシンボル情報をも出力しても良い。出力とは、ここでは、通常、情報端末11への送信であるが、ディスプレイへの表示、プリンタへの印字、音出力等を含む概念である。出力部1204は、通常、送信する情報を構成するソフトウェア、および無線または有線の通信手段で実現されるが、通信手段の変わりに放送手段でも良い。また、出力部1204は、出力部は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。出力部1204は、出力デバイスを含むと考えても含まないと考えても良い。
元情報受信部1205は、情報格納装置13から元情報を受信する。元情報は、対象情報を含む情報である。元情報は、例えば、HTMLやコンパクトHTML(以下、適宜「C−HTML」という。)やXML等の階層化されたタグが付された情報である。元情報は、例えば、いわゆるホームページである。元情報受信部1205が元情報を受信するタイミングやトリガーは問わない。ここでは、例えば、元情報受信部1205は、所定に時刻になると、自動的に多数の情報格納装置13から、元情報を取得する。元情報受信部1205は、通常、無線または有線の通信手段で実現されるが、放送を受信する手段で実現されても良い。
元情報蓄積部1206は、元情報受信部1205が受信した元情報を元情報格納部1207に蓄積する。元情報蓄積部1206は、通常、MPUやメモリ等から実現され得る。元情報蓄積部1206の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
元情報格納部1207は、元情報を格納している。元情報格納部1207は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。
被検索対象情報群格納手段12021は、検索対象の名称を示す情報である検索対象名称情報と、検索対象の電話番号を示す情報である電話番号情報と、検索対象の住所を示す情報である住所情報を有する被検索対象情報を1以上有する被検索対象情報群を格納している。なお、被検索対象情報は、郵便番号を示す情報である郵便番号情報を有しても良い。被検索対象情報群は、例えば、いわゆるイエローページの情報である。被検索対象情報群格納手段12021は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。
被検索対象情報取得手段12022は、検索情報に基づいて、被検索対象情報群格納手段12021から被検索対象情報の一部または全部を取得する。被検索対象情報取得手段12022は、例えば、検索情報が有する業種の情報(例えば、「英会話学校」や「ラーメン屋」など)を有する被検索対象情報の一部または全部を取得する。被検索対象情報取得手段12022は、通常、MPUやメモリ等から実現され得る。被検索対象情報取得手段12022の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
対象情報取得手段12023は、被検索対象情報取得手段12022が取得した被検索対象情報の一部または全部に基づいて、検索情報により特定される2以上の検索対象に関する情報である対象情報を取得する。対象情報取得手段12023は、一の元情報から複数の対象情報を取得する場合に、一の元情報を検索し、電話番号情報、住所情報、郵便番号のうちの1以上の情報である場所情報を含む階層レベルと所定の関係にある階層レベルを決定し、当該決定した階層レベルの情報を取得する。対象情報取得手段12023は、例えば、被検索対象情報取得手段12022が取得した電話番号情報と住所情報と郵便番号情報のうちの2以上の情報を含む、所定の塊の情報を取得する。所定の塊の情報とは、一段落の情報であっても、一ページの情報であっても、所定のタグ(例えば、「<tr>」)が付された情報であっても良い。対象情報取得手段12023は、通常、MPUやメモリ等から実現され得る。対象情報取得手段12023の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
ランキング決定手段12041は、2以上の検索対象の対象情報に基づいて、2以上の検索対象を順位付けする。ランキング決定手段12041は、例えば、全対象情報の文字数に基づいて2以上の検索対象を順位付けしても良いし、全対象情報の数(記載されている記事数)に基づいて2以上の検索対象を順位付けしても良い。ランキング決定手段12041は、2以上の検索対象の対象情報に電話番号情報が含まれるか否か、または対象情報が記載されている元情報のページランキングに基づいてランキングを決定しても良い。元情報(たとえば、WEBページ)のページランキングは、例えば、予め保持している、とする。WEBページのページランキングを決定する方法には、公知の種々の方法がある。公知の種々の方法とは、他のホームページにリンクされている数の多さによりランキングする方法等である。かかる公知の方法により、WEBページのページランキングを決定しても良い。その他、2以上の検索対象を順位付けするアルゴリズムは問わない。ランキング決定手段12041は、通常、MPUやメモリ等から実現され得る。ランキング決定手段12041の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
対象情報出力手段12042は、ランキング決定手段12041の順位付けに基づいて、2以上の検索対象の対象情報を出力する。対象情報出力手段12042は、通常、上位にランキングされている検索対象に関する情報(対象情報や要約情報や検索対象の名称など)からユーザに提示されるように情報を構成し、出力する。出力とは、ここでは、通常、情報端末11への送信であるが、ディスプレイへの表示、プリンタへの印字、音出力等を含む概念である。
要約手段12043は、2以上の対象情報を要約し、2以上の要約情報を取得する。要約の仕方は問わない。要約手段12043は、例えば、対象情報の先頭50文字を取得して、かかる文字列を要約情報とする。要約手段12043は、通常、MPUやメモリ等から実現され得る。要約手段12043の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
要約情報出力手段12044は、要約手段12043が取得した2以上の要約情報を出力する。出力とは、ディスプレイへの表示、プリンタへの印字、音出力、外部の装置への送信等を含む概念である。ここでは、通常、出力とは、情報端末11への送信である。要約情報出力手段12044は、例えば、無線または有線の通信手段で実現される。
元情報出力手段12045は、元情報取得部1203が取得した元情報を出力する。出力とは、ディスプレイへの表示、プリンタへの印字、音出力、外部の装置への送信等を含む概念である。ここでは、通常、出力とは、情報端末11への送信である。元情報出力手段12045は、例えば、無線または有線の通信手段で実現される。
リンクシンボル出力手段12046は、リンク情報に対応する情報であるリンクシンボル情報を出力する。リンクシンボル情報とは、例えば、レストラン等の評価情報のリンク元であることを示す文字列である「評価1」「評価2」や、レストラン等の評価情報のリンク元であることを示すイメージ(アイコン)等である。出力の概念は、上述したとおりである。リンクシンボル出力手段12046は、例えば、無線または有線の通信手段で実現される。
単語抽出手段120431は、対象情報から単語を抽出する。単語を抽出するアルゴリズムは種々ある。例えば、単語抽出手段120431は、辞書を保持しており、かかる辞書に登録している単語を抽出する。また、単語抽出手段120431は、名詞を抽出しても良い。かかる技術は、公知の言語処理技術であるので、詳細な説明は省略する。単語抽出手段120431は、通常、MPUやメモリ等から実現され得る。単語抽出手段120431の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
検索対象毎単語出現回数算出手段120432は、単語抽出手段120431が抽出した各単語における、検索対象毎の出現回数を算出する。検索対象毎単語出現回数算出手段120432は、通常、MPUやメモリ等から実現され得る。検索対象毎単語出現回数算出手段120432の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
単語全出現回数算出手段120433は、単語抽出手段120431が抽出した各単語における、全部の検索対象の全対象情報中の出現回数を算出する。単語全出現回数算出手段120433は、通常、MPUやメモリ等から実現され得る。単語全出現回数算出手段120433の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
割合算出手段120434は、検索対象毎単語出現回数算出手段120432が算出した検索対象毎の出現回数と単語全出現回数算出手段120433が算出した全対象情報中の出現回数との割合を算出する。割合算出手段120434は、通常、MPUやメモリ等から実現され得る。割合算出手段120434の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
単語リスト作成手段120435は、割合算出手段120434が算出した割合が高い単語から並べて、検索対象毎の単語リストを作成する。単語リスト作成手段120435は、通常、MPUやメモリ等から実現され得る。単語リスト作成手段120435の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
なお、出力部1204が保持している各出力手段は、通常、物理的に一の手段で実現されている。また、出力部1204は、通常、要約情報やリンクシンボル情報などの出力対象の情報から一のファイル(例えば、HTMLで記述されたファイル)を構成し、当該ファイルを情報端末11に送信する。また、出力部1204が、対象情報、要約情報、元情報、リンクシンボル情報のうちの1以上の情報を出力する場合は、出力部1204は、例えば、かかる情報を合成して、一のファイルを構成する処理を行う。さらに具体的には、出力部1204は、2以上の検索対象(例えば、2以上のレストラン)の対象情報、要約情報、元情報、リンクシンボル情報のうちの1以上の情報からなるWEBページを構成し、出力する。
元情報格納部1301は、1以上の元情報を格納している。元情報は、検索対象の対象情報を有する。元情報は、例えば、HTMLやC−HTMLやXML等で記述されたいわゆるページである。元情報格納部1301は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。
元情報送信部1302は、元情報格納部1301の元情報を送信する。元情報送信部1302が元情報を送信するトリガーやタイミングは問わない。元情報送信部1302は、例えば、情報処理装置12の要求により元情報を送信する。元情報送信部1302は、通常、無線または有線の通信手段で実現されるが、放送手段で実現されても良い。
以下、本情報処理システムの動作について説明する。まず、情報端末11の動作について図3のフローチャートを用いて説明する。
(ステップS301)ユーザ入力受付部1101は、ユーザからの入力を受け付けた否かを判断する。入力を受け付ければステップS302に行き、入力を受け付けなければステップS301に戻る。
(ステップS302)ユーザ入力受付部1101は、ステップS301で受け付けた入力が検索情報であるか否かを判断する。検索情報であればステップS303に行き、検索情報でなければステップS307に飛ぶ。
(ステップS303)要求送信部1102は、ステップS301で受け付けた検索情報に基づいて、要求情報を構成する。要求情報とは、検索対象の対象情報の取得を要求する情報である。
(ステップS304)要求送信部1102は、ステップS303、ステップS308またはステップS310で構成した情報を送信する。
(ステップS305)情報受信部1103は、対象情報等の情報を情報処理装置12から受信したか否かを判断する。情報を受信すればステップS306に行き、情報を受信しなければステップS305に戻る。
(ステップS306)情報出力部1104は、ステップS305で受信した情報を出力する。なお、かかる情報出力部1104は、例えば、情報受信部1103が受信したHTMLで記述されたファイルを解釈し、ページを構成して、当該ページをディスプレイに表示する。ステップS301に戻る。
(ステップS307)ユーザ入力受付部1101は、ステップS301で受け付けた入力が要約情報選択指示であるか否かを判断する。要約情報選択指示であればステップS308に行き、要約情報選択指示でなければステップS309に飛ぶ。
(ステップS308)要求送信部1102は、要約情報選択指示を含む情報取得の要求を構成する。なお、構成する情報は、要約情報選択指示に対応する要約情報の元になる対象情報が記載された元情報のリンク情報を含む。リンク情報は、例えば、元情報の所在を示すURLやURIである。テップS304に行く。
(ステップS309)ユーザ入力受付部1101は、ステップS301で受け付けた入力がリンクシンボル選択指示であるか否かを判断する。リンクシンボル選択指示であればステップS310に行き、リンクシンボル選択指示でなければステップS311に飛ぶ。
(ステップS310)要求送信部1102は、リンクシンボル選択指示を含む情報取得の要求を構成する。なお、構成する情報は、リンクシンボル選択指示に対応する元情報のリンク情報を含む。リンク情報は、例えば、元情報の所在を示すURLやURIである。ステップS304に行く。
(ステップS311)受け付けた入力に応じた処理を行う。かかる処理は種々ある。かかる処理は、例えば、いわゆるWEBブラウザが行う処理である。ステップS301に戻る。
なお、図3のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。
次に、情報処理装置12の動作について図4のフローチャートを用いて説明する。
(ステップS401)受付部1201は、情報を受け付けたか否かを判断する。情報を受け付ければステップS402に行き、情報を受け付けなければステップS401に戻る。
(ステップS402)受付部1201は、ステップS401で受け付けた情報が検索情報を含むか否かを判断する。検索情報を含む場合はステップS403に行き、検索情報を含まない場合はステップS406に飛ぶ。検索情報を含む場合とは、ここでは、上述した要求情報を受け付けた場合である。
(ステップS403)対象情報取得部1202は、ステップS401で受け付けた検索情報により特定される2以上の検索対象に関する情報である対象情報を取得する。かかる対象情報取得処理の詳細は、図5のフローチャートを用いて説明する。
(ステップS404)出力部1204は、情報端末11に送信する情報を構成する。かかる送信情報構成処理の詳細は、図6のフローチャートを用いて説明する。
(ステップS405)出力部1204は、ステップS404で構成した情報を出力する。ここでの出力は、情報端末11への送信である。ステップS401に戻る。
(ステップS406)受付部1201は、ステップS401で受け付けた情報が要約情報選択指示であるか否かを判断する。要約情報選択指示であればステップS407に行き、要約情報選択指示でなければステップS408に飛ぶ。
(ステップS407)元情報取得部1203は、要約対象情報選択指示に対応する要約対象情報の元になる対象情報が記載された元情報のリンク情報に基づいて、当該元情報を取得する。ステップS405に行く。
(ステップS408)受付部1201は、ステップS401で受け付けた情報がシンボル情報選択指示であるか否かを判断する。シンボル情報選択指示であればステップS408に行き、シンボル情報選択指示でなければステップS401に戻る。
(ステップS409)元情報取得部1203は、指示されたリンクシンボル情報に対するリンク情報に基づいて、当該リンク情報が示す対象情報が記載された情報である元情報を取得する。ステップS405に行く。
なお、図4のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。
次に、情報処理装置12の対象情報取得処理の動作について図5のフローチャートを用いて説明する。
(ステップS501)被検索対象情報取得手段12022は、カウンタiに1を代入する。
(ステップS502)被検索対象情報取得手段12022は、i番目の被検索対象情報が存在するか否かを判断する。i番目の被検索対象情報が存在すればステップS503に行き、i番目の被検索対象情報が存在しなければステップS506に飛ぶ。
(ステップS503)被検索対象情報取得手段12022は、i番目の被検索対象情報が、検索情報の要件を満たすか否か判断する。検索情報の要件を満たせばステップS504に行き、検索情報の要件を満たさなければステップS505に飛ぶ。なお、i番目の被検索対象情報が、検索情報の要件を満たすか否かの判断方法は種々ある。例えば、i番目の被検索対象情報が、すべての検索情報を構成する情報を有する場合に、検索情報の要件を満たすかと判断しても良い。また、例えば、i番目の被検索対象情報が、検索情報を構成する情報の中の所定数の情報を有する場合に、検索情報の要件を満たすかと判断しても良い。さらに、後述するように、i番目の被検索対象情報の位置、業種の情報等に基づいて、検索情報(たとえば、「JR山手線新宿から約徒歩10分のラーメン屋」など)に合致するか否かを判断しても良い。
(ステップS504)被検索対象情報取得手段12022は、検索情報の要件を満たした被検索対象情報の一部または全部を取得する。かかる被検索対象情報の一部または全部は、検索キーである。被検索対象情報取得手段12022は、検索キーを一時格納する。
(ステップS505)被検索対象情報取得手段12022は、カウンタiを1、インクリメントする。ステップS502に戻る。
(ステップS506)被検索対象情報取得手段12022は、カウンタiに1を代入する。
(ステップS507)対象情報取得手段12023は、i番目の検索キーが存在するか否かを判断する。i番目の検索キーが存在すればステップS508に行き、i番目の検索キーが存在しなければ上位関数にリターンする。
(ステップS508)対象情報取得手段12023は、カウンタjに1を代入する。
(ステップS509)対象情報取得手段12023は、元情報格納部1207に、j番目の元情報が存在するか否かを判断する。j番目の元情報が存在すればステップS510に行き、j番目の元情報が存在しなければステップS517に飛ぶ。
(ステップS510)対象情報取得手段12023は、i番目の検索キーに対応する検索対象タグが存在するか否かを判断する。検索対象タグが存在すればステップS511に行き、検索対象タグが存在しなければステップS518に飛ぶ。なお、すべての検索キーに対応する検索対象タグの初期値は、NULL(検索対象タグが存在しない)である。
(ステップS511)対象情報取得手段12023は、カウンタkに1を代入する。
(ステップS512)対象情報取得手段12023は、j番目の元情報の中に、k番目の検索対象タグが存在するか否かを判断する。k番目の検索対象タグが存在すればステップS513に行き、k番目の検索対象タグが存在しなければステップS516に飛ぶ。
(ステップS513)対象情報取得手段12023は、かかる検索対象タグに対応する情報を取得する。かかる情報は、対象情報の候補となる。
(ステップS514)対象情報取得手段12023は、ステップS513で取得した情報が、検索キーで示される条件に合致するか否かを判断する。条件に合致すればステップS515に行き、条件に合致しなければステップS521に飛ぶ。なお、検索キーで示される条件に合致するか否かは、種々のアルゴリズムにより決定され得る。例えば、ステップS513で取得した情報が、検索キーが有する2以上の情報(例えば、店舗名、住所情報、電話番号情報、郵便番号情報)のうち、1以上を含む場合に条件に合致する、と判断しても良い。また、例えば、ステップS513で取得した情報が、検索キーが有する店舗名を含み、住所情報の一部を含む場合に条件に合致する、と判断しても良い。
(ステップS515)対象情報取得手段12023は、ステップS513で取得した情報を一時格納する。かかる情報は、対象情報である。対象情報は、検索キーまたは被検索対象情報と対に格納される。
(ステップS516)対象情報取得手段12023は、カウンタjを1、インクリメントする。ステップS509に戻る。
(ステップS517)対象情報取得手段12023は、カウンタiを1、インクリメントする。ステップS507に戻る。
(ステップS518)対象情報取得手段12023は、j番目の元情報が、検索キーで示される条件に合致する箇所があるか否かを判断する。つまり、例えば、検索キーが「店舗名」「電話番号情報」「住所情報」を有する場合、「店舗名」「電話番号情報」「住所情報」のうち、2以上の情報を含む場合に、当該箇所が条件に合致する箇所であるとする。その他、j番目の元情報が、検索キーで示される条件に合致する箇所が存在するか否かを判断するアルゴリズムは、種々のアルゴリズムが考えられる。
(ステップS519)対象情報取得手段12023は、検索キーで示される条件に合致する箇所に対応するタグを取得する。
(ステップS520)対象情報取得手段12023は、j番目の元情報に対応する検索タグとして、ステップS519で取得したタグを登録する。ここで、登録とは、メモリや所定のバッファに書き込むことを言う。ステップS515に行く。
(ステップS521)対象情報取得手段12023は、カウンタkを1、インクリメントする。ステップS512に戻る。
なお、本フローチャートにおいて、対象情報取得手段12023は、元情報のタグ構造を利用して、一の元情報から複数の対象情報を取得する場合に、同一の階層レベルの情報を取得する処理を行った。しかし、本フローチャートにおける処理は、一の元情報から複数の対象情報を取得する場合に、同一の階層レベルの情報を取得する処理の一例である。例えば、まず、対象情報取得手段12023は、元情報のタグ構造木を構成し、その構造木の中に、2以上の場所情報(住所情報や電話番号情報や郵便番号情報など)を含むタグを検索タグとして登録しても良い。そして、検索時は、登録された検索タグに対応する情報のみを対象として、検索キーで示される条件に合致するか否かを判断しても良い。なお、上記で、2以上の場所情報を含むタグを検索タグとして登録するとしたが、1以上の場所情報を含むタグを検索タグとして登録しても良いし、3以上の場所情報を含むタグを検索タグとして登録しても良い。その他、対象情報取得手段12023は、一の元情報から複数の対象情報を取得する場合に、同一の階層レベルの情報を取得する処理を行えば良く、その処理手順等は問わないことは言うまでもない。
次に、情報処理装置12の送信情報構成処理の動作について図6のフローチャートを用いて説明する。
(ステップS601)ランキング決定手段12041は、2以上の検索対象の対象情報に基づいて、2以上の検索対象を順位付けする。かかる順位付けの処理であるランキング処理の詳細については、図7のフローチャートを用いて説明する。
(ステップS602)対象情報出力手段12042は、カウンタiに1を代入する。
(ステップS603)対象情報出力手段12042は、i番目の対象情報の見出しを構成する。見出しの構成方法は種々ある。具体的な見出しの構成方法は後述する。
(ステップS604)対象情報出力手段12042は、カウンタjに1を代入する。
(ステップS605)リンクシンボル出力手段12046は、j番目のリンクシンボル情報を構成する。リンクシンボル情報の構成の際に、元情報の所在を示すリンク情報を使用する。リンクシンボル情報が押下された場合に、元情報取得部1203が、リンク情報を用いて元情報にアクセスするためである。
(ステップS606)要約手段12043は、要約情報を取得する。要約情報を取得する処理である要約情報取得処理の詳細については、図8のフローチャートを用いて説明する。
(ステップS607)対象情報出力手段12042は、1以上の要約情報を用いて要約部を構成する。なお、要約部は、出力する情報を構成する情報である。要約部の構成には、要約部の要約情報と、当該要約情報が構成された元となる元情報のリンク情報も使用される。要約情報が押下された場合に、元情報取得部1203が、リンク情報を用いて元情報にアクセスするためである。
(ステップS608)カウンタjを1、インクリメントする。
(ステップS609)対象情報出力手段12042は、i番目の検索対象の全てのリンクシンボル情報、要約情報の処理が完了したか否か(jがラストか否か)を判断する。かかる判断は、先に抽出した要約情報の処理が完了したことにより行っても良いし、予め決められた所定数の要約情報の処理が完了したことにより行っても良い。jがラストであればステップS610に行き、jがラストでなければステップS605に戻る。
(ステップS610)対象情報出力手段12042は、カウンタiを1、インクリメントする。
(ステップS611)対象情報出力手段12042は、i番目の検索対象が存在するか否かを判断する。i番目の検索対象が存在すればステップS612に行き、i番目の検索対象が存在しなければステップS603に飛ぶ。
(ステップS612)対象情報出力手段12042は、出力する情報を構成する。かかる処理は、例えば、HTMLファイルの「</HTML>」等のタグをファイルの最終行に記録することである。つまり、送信する情報を構成するための後処理である。上位関数にリターンする。
次に、情報処理装置12のランキング処理の動作について図7のフローチャートを用いて説明する。
(ステップS701)ランキング決定手段12041は、カウンタiに1を代入する。
(ステップS702)ランキング決定手段12041は、i番目の検索対象が存在するか否かを判断する。i番目の検索対象が存在すればステップS703に行き、i番目の検索対象が存在しなければステップS713に飛ぶ。
(ステップS703)ランキング決定手段12041は、i番目の検索対象のポイント情報に0を代入する。ポイント情報とは、ランキングを決定するために利用する情報である。
(ステップS704)ランキング決定手段12041は、カウンタjに1を代入する。
(ステップS705)ランキング決定手段12041は、i番目の検索対象における、j番目の対象情報が存在するか否かを判断する。j番目の対象情報が存在すればステップS706に行き、j番目の対象情報が存在しなければステップS714に飛ぶ。
(ステップS706)ランキング決定手段12041は、j番目の対象情報のデータ量を取得する。データ量とは、文字数でも、バイト数(データ長)でも、単語数でも、文章数等でも良い。
(ステップS707)ランキング決定手段12041は、j番目の対象情報の元情報のページランクを取得する。情報処理装置12は、例えば、元情報に対応して、当該元情報のページランクを予め保持している、とする。
(ステップS708)ランキング決定手段12041は、j番目の対象情報の中に、i番目の検索対象の電話番号情報が含まれるか否かを判断する。電話番号情報が含まれればステップS709に行き、電話番号情報が含まれなければステップS715に飛ぶ。
(ステップS709)ランキング決定手段12041は、電話番号フラグにONを代入する。電話番号フラグとは、i番目の検索対象の電話番号情報が含まれるか否かを示すフラグである。
(ステップS710)ランキング決定手段12041は、ステップS706で取得したデータ量、ステップS707で取得した元情報のページランク、電話番号フラグの中の1以上の情報に基づいてポイントを算出する。具体的なポイント算出のアルゴリズムの例は、後述する。
(ステップS711)ランキング決定手段12041は、ステップS710で算出したポイントを、i番目の検索対象のポイント情報に加算する。
(ステップS712)ランキング決定手段12041は、カウンタjを1、インクリメントする。ステップS705に行く。
(ステップS713)ランキング決定手段12041は、ポイント情報をキーにして、検索対象をソートする。上位関数にリターンする。
(ステップS714)ランキング決定手段12041は、カウンタiを1、インクリメントする。ステップS702に行く。
(ステップS715)ランキング決定手段12041は、電話番号フラグにOFFを代入する。ステップS710に行く。
図7のフローチャートにおいて、ランキング決定手段12041は、2以上の検索対象の対象情報の文字数、および当該対象情報に電話番号情報が含まれるか否か、および対象情報が記載されている元情報のページランキングに基づいて2以上の検索対象を順位付けした。しかし、ランキング決定手段12041は、2以上の検索対象の対象情報の文字数、電話番号情報が含まれるか否か、ページランキングのうちの1以上の情報に基づいて、2以上の検索対象を順位付けしても良い。さらに、ランキング決定手段12041は、2以上の検索対象の記事の数など、他の情報に基づいて、2以上の検索対象を順位付けしても良い。
次に、情報処理装置12の要約情報取得処理の動作について図8のフローチャートを用いて説明する。
(ステップS801)要約手段12043は、カウンタiに1を代入する。
(ステップS802)要約手段12043は、i番目の検索対象が存在するか否かを判断する。i番目の検索対象が存在すればステップS803に行き、i番目の検索対象が存在しなければ上位関数にリターンする。
(ステップS803)単語抽出手段120431は、カウンタj、kに1を代入する。
(ステップS804)単語抽出手段120431は、j番目の対象情報からk番目の単語を抽出する。
(ステップS805)検索対象毎単語出現回数算出手段120432は、i番目の検索対象の全対象情報中における、ステップS804で抽出された単語の出現回数(第一出現回数)を算出する。
(ステップS806)単語全出現回数算出手段120433は、全部の検索対象の全対象情報中における、ステップS804で抽出された単語の出現回数(第二出現回数)を算出する。
(ステップS807)割合算出手段120434は、第一出現回数の第二出現回数に対する割合を算出する。
(ステップS808)単語リスト作成手段120435は、ステップS804で抽出された単語と、ステップS807で算出された割合の情報を対にして登録(一時蓄積)する。
(ステップS809)単語抽出手段120431は、カウンタkを1、インクリメントする。
(ステップS810)単語抽出手段120431は、j番目の対象情報からk番目の単語が存在するか否かを判断する。このk番目の単語とは、今まで未処理であった単語である。k番目の単語が存在すればステップS804に行き、k番目の単語が存在しなければステップS811に行く。
(ステップS811)カウンタjを1、インクリメントする。
(ステップS812)単語リスト作成手段120435は、i番目の検索対象のj番目の対象情報が存在するか否かを判断する。j番目の対象情報が存在すればステップS804に行き、j番目の対象情報が存在しなければステップS813に行く。
(ステップS813)単語リスト作成手段120435は、割合の情報に基づいて、単語をソートする。かかるソートにより上位にくる単語が、検索対象特有の単語であると、例えば、考える。
(ステップS814)要約手段12043は、カウンタmに1を代入する。
(ステップS815)要約手段12043は、i番目の検索対象の要約情報が所定のサイズより大きいか否かを判断する。なお、各検索対象の要約情報の初期値はNULLである。所定のサイズより大きければステップS818に行き、所定のサイズ以下であればステップS816に行く。
(ステップS816)要約手段12043は、m番目の単語が入っている文章を、i番目の検索対象の全対象情報から取得し、要約情報として追記する。
(ステップS817)要約手段12043は、カウンタmを、1インクリメントする。
(ステップS818)要約手段12043は、要約情報を所定のサイズ以内になるようにカットする。カットとは、所定のサイズより先の情報を消去する処理である。
(ステップS819)要約手段12043は、カウンタiを、1インクリメントする。ステップS802に行く。
なお、図8のフローチャートにおいて、検索対象の特徴となる単語に着目して要約情報を取得する一アルゴリズムを示した。しかし、要約手段12043は、対象情報から単語を抽出する単語抽出手段と、単語抽出手段が抽出した各単語における、検索対象毎の出現回数を算出する検索対象毎単語出現回数算出手段と、出現回数に基づいて、対象情報から各検索対象の要約情報を取得する要約取得手段を具備すれば良い。つまり、必ずしも、第一出現回数の第二出現回数に対する割合に基づいて単語リストを構成する必要はない。
別のアルゴリズムとして、例えば、以下のようなアルゴリズムもある。「i番目の検索対象の全対象情報に含まれる文の集合」から1文ずつ取り出し、その文に含まれる特徴単語の得点と割合でスコアリングしていく。たとえば「特製餃子がお勧め」という文に対し、「特製」が特徴単語5位(4.6ポイント)、「餃子」が特徴単語3位(5.0ポイント)だとすると、この文のスコアは9.6/単語数となる。一方、「このお店のお勧めは特製の黒豚を使用した餃子です」という文にも「特製」と「餃子」が含まれていますが、単語数が多いので前の例より低いスコアとなる。しかし、もし「黒豚」が特徴単語1位で十分にポイントが高いような場合には、こちらの文が優先的に選択されることになる。なお、特徴単語とは検索対象特有の単語であり、そのポイントとは、当該単語の検索対象の特有度合いを示す情報である。以上のように、出現回数は、上記のポイントの概念、その他の単語の出現度合いの概念を含む概念である。つまり、要約取得手段は、出現回数に基づいて、対象情報から各検索対象の要約情報を取得するような構成である。
以下、本実施の形態における情報処理システムの具体的な動作について説明する。情報処理システムの概念図は図1である。
情報端末11は、WEBブラウザが搭載された、例えば、パーソナルコンピュータである。情報端末11は、例えば、ラーメン屋等の対象情報を出力する端末である。情報処理装置12は、例えば、いわゆるサーチエンジンを搭載したサーバ装置である。情報格納装置13は、例えば、ラーメン屋のホームページを格納しているサーバ装置である。ホームページは、例えば、HTMLで記述されている。
図9は、情報処理装置12が、多数の情報格納装置13から受信したホームページの例を示す。かかるホームページは、上述した元情報に該当する。元情報受信部1205は、情報格納装置13からホームページを受信し、元情報蓄積部1206は、元情報受信部1205が受信した当該ホームページを元情報格納部1207に蓄積する。元情報格納部1207は、多数のホームページを格納している。
図10は、被検索対象情報群格納手段12021が格納している被検索対象情報群である。被検索対象情報群は、「検索対象名称情報」「郵便番号情報」「住所情報」「電話番号情報」を有する。「検索対象名称情報」は、例えば、店舗名である。被検索対象情報群は、例えば、いわゆるイエローページである。
図11は、情報ポータル管理表である。情報ポータル管理表は、信頼性の高い情報ポータルのHPのURLを管理している。かかる情報ポータル管理表に管理されているURLで識別されるホームページは、ページランクが高いホームページである。一方、情報ポータル管理表で管理されていないホームページは、ページランクが低いホームページである。なお、ページランクの情報は、ランキング決定手段12041が利用する。
今、ユーザは、情報端末11から情報処理装置12のホームページのURLを入力し、当該ホームページにアクセスしたとする。そして、情報端末11は、レストランの検索を行うためのホームページを受信し、表示した、とする。次に、ユーザは、検索したいレストラン(ここでは、ラーメン屋)の情報を得るためにホームページのフィールドに検索情報を入力する(図12参照)。検索情報は、ここでは、「検索地点」を示す情報、「範囲」を示す情報、「キーワード」を有する。そして、ユーザは、検索情報を入力後、「検索」ボタンを押下する、とする。図12において、ユーザは、JR山手線新宿から約徒歩10分以内の場所にあるラーメン屋を検索することとなる。
次に、情報端末11の要求送信部1102は、検索地点「JR山手線新宿」、範囲「約徒歩10分」、キーワード「ラーメン」を有する要求情報(図13参照)を構成し、当該要求情報を情報処理装置12に送信する。なお、図13の要求情報の「1」は検索をすることを指示する検索フラグである。また、要求情報の名称の「−」は名称が検索キーではないことを示す。
次に、情報処理装置12の受付部1201は、情報端末11から要求情報を受信する。要求情報は、2以上の検索対象を特定する情報である検索情報を有する。次に、被検索対象情報取得手段12022は、受信した検索情報(検索地点「JR山手線新宿」、範囲「約徒歩10分」、キーワード「ラーメン」)に基づいて、被検索対象情報群格納手段12021から被検索対象情報の一部または全部を取得する。具体的には、被検索対象情報取得手段12022は、JR山手線新宿から約徒歩10分の距離を算出する。かかる場合、例えば、被検索対象情報取得手段12022は、徒歩1分を80mとして算出し、JR山手線新宿から800m以内のラーメン店を、図10の被検索対象情報群から算出する。被検索対象情報取得手段12022は、例えば、JR山手線新宿等の多数の検索地点の住所を保持しており、かつ、住所を緯度経度に変換するための地図情報を保持している。そして、被検索対象情報取得手段12022は、JR山手線新宿の住所からJR山手線新宿の位置情報(緯度と経度)を取得する。次に、被検索対象情報取得手段12022は、図10の被検索対象情報群の住所情報から位置情報(緯度と経度)を取得する。そして、被検索対象情報取得手段12022は、JR山手線新宿の位置情報と検索対象の店舗の位置情報から距離を算出し、800m以内であるかどうか判断する。そして、被検索対象情報取得手段12022は、800m以内の店舗のレコードを図10の被検索対象情報群から取得する。次に、被検索対象情報取得手段12022は、当該取得したレコードの中から、「検索対象名称情報」の中に「ラーメン」の文字列を含むレコードを取得する。そして、かかるレコードの一部または全部が被検索対象情報である。なお、被検索対象情報の検索フローは問わない。つまり、被検索対象情報取得手段12022は、先にラーメン屋に該当するレコードを絞り込み、その後800m以内のラーメン屋の被検索対象情報を取得しても良い。また、ラーメン屋のレコードであるか否かの判断は、「検索対象名称情報」の中に「ラーメン」の文字列を含むか否かにより行なわれたが、図10の被検索対象情報は、業種の情報(ラーメン屋、イタリヤ料理屋、お寿司屋など)を保持しており、当該業種の情報に基づいて、ラーメン屋のレコードであるか否かが判断されても良い。そして、被検索対象情報取得手段12022は、図14の被検索対象情報中間表を得る。被検索対象情報中間表は、検索対象を示すレコードの集合である。
次に、対象情報取得手段12023は、被検索対象情報取得手段12022が取得した図14の被検索対象情報中間表に基づいて、元情報格納部1207を検索し、対象情報を取得する。対象情報とは、図14の被検索対象情報中間表の各レコードにより特定される店舗に関する情報である。つまり、対象情報取得手段12023は、まず、被検索対象情報中間表の第1レコードの「くまもと○○ラーメン」に関して記載された情報を、元情報格納部1207の全ホームページから検索する。かかる検索は、以下のアルゴリズムで行なう。
つまり、ホームページは、ここでは、HTML、XML等のタグにより階層化されたデータにより記述されている。例えば、ホームページは、HTMLで記述されている、とする。そして、対象情報取得手段12023は、ホームページからHTML構造木を構成する。HTML構造木は、例えば、図15に示すような、HTMLのタグの階層関係を示す情報である。図15において、<table>タグの下位に<tr>タグが存在し、<tr>タグの下位に<td>タグが存在することを示す。<table>タグは、表全体を指定するタグであり、<tr>タグは、表中の行(レコード)を指定するタグである。また、<td>タグは、セルを指定するタグである。かかる処理を行うのは、各店舗の情報は、HTMLタグ階層上の同じ階層に記述されていることが極めて多いからである。
次に、対象情報取得手段12023は、一のホームページ内を検索し、「くまもと○○ラーメン」の住所情報「東京都新宿区・・・」、電話番号情報「03−1122−3456」のうち、1以上の情報を含む文章群を取得する。文章群は、タグに囲まれた情報であり、対象情報である。そして、対象情報取得手段12023は、「くまもと○○ラーメン」の住所情報「東京都新宿区・・・」、電話番号情報「03−1122−3456」のうち、1以上の情報を含む階層のタグを取得する。ここで、対象情報取得手段12023は、<td>タグに住所情報「東京都新宿区・・・」を含むタグが存在すると検知したとする。つまり、対象情報取得手段12023は、当該一のホームページの<td>タグ内に対象情報が存在する、と判断する。なお、対象情報取得手段12023は、2以上の場所記述(住所情報等)が存在するタグを、上記の対象情報が存在するタグとして決定するアルゴリズムでも良い。そして、対象情報取得手段12023は、取得した対象情報を一時格納する。なお、対象情報を1以上の場所情報(住所情報、電話番号情報、郵便番号情報など)を含む文章群としたのは、店舗等の情報は、1以上の場所情報を含むことが多いからである。
次に、対象情報取得手段12023は、次のホームページ内を検索し、「くまもと○○ラーメン」の住所情報「東京都新宿区・・・」、電話番号情報「03−1122−3456」のうち、1以上の情報を含む対象情報、および対象情報が存在する階層のタグを取得する。
なお、対象情報取得手段12023は、ホームページ中に、「くまもと○○ラーメン」の住所情報「東京都新宿区・・・」、電話番号情報「03−1122−3456」のうち、1以上の情報を含む文章群が存在しなければ、次のホームページの検索処理に移行する。
このように、対象情報取得手段12023は、すべてのホームページから、「くまもと○○ラーメン」の住所情報「東京都新宿区・・・」、電話番号情報「03−1122−3456」のうち、1以上の情報(場所情報)を含む対象情報を取得する。
以上の処理を、2つ目の店舗「ラーメンABC」、3つ目の店舗「ラーメンXYZ」に対しても行い、それぞれの対象情報をすべて一時格納する。なお、例えば、2つ目の店舗「ラーメンABC」の対象情報を検索する場合、1つ目の店舗情報「くまもと○○ラーメン」の対象情報検索処理の際に抽出したタグ(店舗情報が存在するであろうタグ)に対応する情報を検索し、他のタグに対応する情報は検索としないことにより、ホームページにありがちな内容とは無関係な文章(バナー広告、左右のメニューなど)を除去することができる。また、対象情報の取得速度が高速化される。3つ目の店舗「ラーメンXYZ」の対象情報を検索する場合も同様である。なお、最初に、元情報ごとに、HTML構造木を構成し、場所情報を2以上含むタグを検索対象のタグとして登録し、当該登録されたタグに対応する情報のみを対象情報の候補としても良い。
以上の処理により、図16に示す対象情報管理表が得られる。つまり、対象情報取得手段12023は、元情報格納部1207の全ホームページを検索し、「くまもと○○ラーメン」の対象情報である、ID「1」から「n」のnの対象情報を取得した。また、対象情報取得手段12023は、同様に、「ラーメンABC」の対象情報である、ID「n+1」から「n+m」のmの対象情報を取得した。さらに、対象情報取得手段12023は、同様に、「ラーメンXYZ」の対象情報である、ID「n+m+1」から「n+m+p」のpの対象情報を取得した。
次に、送信情報構成処理の具体的処理について説明する。
ランキング決定手段12041は、図16の対象情報管理表のID「1」のレコードの「元情報URL」の属性値を取得し、当該属性値であるURLが図11の情報ポータル管理表に存在するか否かを判断する。例えば、図16の対象情報管理表のID「1」の元情報URL「http://www.グルメ.co.jp」は、図11の情報ポータル管理表に存在するので、ページランクを「高」とする。次に、ランキング決定手段12041は、図16の対象情報管理表のID「1」のレコードの「対象情報」の中に電話番号情報を含むか否かを判断する。ランキング決定手段12041は、電話番号情報を含めば「1」、含まなければ「0」として、後述するランキング中間表の属性値「電話番号」をセットする。次に、ランキング決定手段12041は、図16の対象情報管理表のID「1」のレコードの「対象情報」の文字数をカウントし、「384」を得る。そして、ランキング決定手段12041は、「ID」「検索対象名称情報」「ページランク」「電話番号」「文字数」を有するレコードを1以上有するランキング中間表を構成する。かかるランキング中間表を図17に示す。上記の処理により、図17のID「1」のレコードが構成された。
次に、ランキング決定手段12041は、図16の対象情報管理表のID「2」のレコードの「元情報URL」の属性値を取得し、当該属性値であるURLが図11の情報ポータル管理表に存在するか否かを判断する。対象情報管理表のID「2」のレコードの元情報URL「http://abc.・・・.com」は図11の情報ポータル管理表に存在しないので、ページランクを「低」とする。次に、ランキング決定手段12041は、図16の対象情報管理表のID「2」のレコードの「対象情報」の中に電話番号情報を含むので、電話番号「1」とする。次に、ランキング決定手段12041は、図16の対象情報管理表のID「2」のレコードの「対象情報」の文字数をカウントし、「129」を得る。かかる処理により、図17のID「2」のレコードが構成された。ランキング決定手段12041は、図16の対象情報管理表のID「3」以降のレコードに対して以上の処理を行い、図17のランキング中間表を得る。
次に、ランキング決定手段12041は、各店舗(検索対象名称情報)ごとのポイントを図17のランキング中間表に基づいて算出する。つまり、ランキング決定手段12041は、ページランク「高」の場合は倍数を「1」とし、ページランク「低」の場合は倍数を「0.3」とし、電話番号「1」の場合は倍数を「1」とし、電話番号「0」の場合は倍数を「0.5」とする。そして、ランキング決定手段12041は、「文字数」をページランクの倍数、電話番号の倍数に掛けてポイントを算出する。そして、ランキング決定手段12041は、ポイントを四捨五入により整数にする、とする。
具体的には、ランキング決定手段12041は、「くまもと○○ラーメン」のポイントを「384×1×1+129×0.3×1+・・・+291×1×1」の式により算出する。同様に、ランキング決定手段12041は、「ラーメンABC」と「ラーメンXYZ」のポイントを算出する。その結果、ランキング決定手段12041は、「くまもと○○ラーメン」のポイント「2522」、「ラーメンABC」ポイント「1529」、「ラーメンXYZ」のポイント「4211」と算出した、とする。なお、ポイント算出アルゴリズムは種々あり、他の算出式によりポイントを算出しても良いことは言うまでもない。ただし、ポイント算出において、ページランクと電話番号の有無を考慮することは好適である。ホームページの信頼性を加味した評価が可能となるからである。
次に、要約情報取得処理について説明する。まず、要約手段12043は、1番目の検索対象「くまもと○○ラーメン」のすべての対象情報(図16のID「1」からID「n」までの対象情報)を読み出す。単語抽出手段120431は、すべての対象情報から単語(名詞)「塩ラーメン」等を抽出する。そして、検索対象毎単語出現回数算出手段120432は、検索対象「くまもと○○ラーメン」の全対象情報中における、単語(名詞)「塩ラーメン」の出現回数(第一出現回数)を、例えば「10」と算出する。次に、同様の処理により、他の単語の第一出現回数も算出する。
次に、要約手段12043は、2番目の検索対象「ラーメンABC」のすべての対象情報(図16のID「n+1」から「n+m」までの対象情報)を読み出す。単語抽出手段120431は、すべての対象情報から単語(名詞)「特製えび入りラーメン」等を抽出する。そして、検索対象毎単語出現回数算出手段120432は、検索対象「ラーメンABC」の全対象情報中における、単語(名詞)「特製えび入りラーメン」の出現回数(第一出現回数)を、例えば「8」と算出する。次に、同様の処理により、他の単語の第一出現回数も算出する。
さらに、3番目の検索対象「ラーメンXYZ」に対しても同様の処理を行う。
次に、単語全出現回数算出手段120433は、「塩ラーメン」、「特製えび入りラーメン」等の単語の、全部の検索対象の全対象情報中における出現回数(第二出現回数)を算出する。そして、割合算出手段120434は、第一出現回数と第二出現回数の割合である割合の情報を算出する。さらに、単語リスト作成手段120435は、「割合」をキーにして、検索対象ごとに、単語をソートする。そして、要約手段12043は、図18の単語リスト管理表を得る。単語リスト管理表は、「検索対象名称情報」「単語」「第一出現回数」「第二出現回数」「割合」を有するレコードを1以上保持している。
次に、要約手段12043は、店舗ごとに、割合の大きい単語を含む対象情報中の文章を、所定のサイズ(例えば、512byte)になるまで、図16の対象情報から文章を取得する。そして、その際、要約手段12043は、当該対象情報に対応する元情報URLも取得する。そして、要約手段12043は、図19に示す要約情報管理表を得る。要約情報管理表は、「検索対象名称情報」「要約情報」「元情報URL」を有するレコードである。「要約情報」は、対象情報から、その店舗の特徴を示す単語が高い割合で出現する文章を、所定のサイズまで抽出されたものである。
次に、対象情報出力手段12042は、上記の処理により得られた要約情報等を利用して、以下の処理により出力する情報を構成する。対象情報出力手段12042が最終的に構成する情報の例を図20に示す。
つまり、対象情報出力手段12042は、ランキング1位の「ラーメンXYZ」の見出しの情報を構成する。この見出しの情報は、ランキングが1位であることを示す情報であれば何でも良い。ここでは、見出しの情報は、ランキング1位を示す数字「1」と、検索対象名称情報(店舗名)と、ポイントを切り上げした数の星(ポイント「4211」に対して星が5つ)を有する。そして、対象情報出力手段12042は、リンクシンボル情報を構成する。リンクシンボル情報は、図20において、「ラーメンXYZ」の見出し情報の直下にある「評価1」「評価2」などの情報である。そして、「評価1」等の情報はアンカーであり、1つ目の対象情報の元情報の所在を示すURLを保持している。つまり、「評価1」が押下されると1つ目の対象情報の元情報を表示することとなる。具体的には、対象情報出力手段12042は、図19の要約情報管理表のラーメンXYZの要約情報「ゴマラーメンのXYZ。」から「評価1」の文字列を構成し、元情報URL「http://www.グルメ.co.jp」をアンカーの情報として、「評価1」に付与する。文字列「評価1」の構成は、固定文字「評価」に要約情報の順番(数字)を結合して生成する。そして、図20の(1)の領域の情報の構成が完了する。
次に、対象情報出力手段12042は、要約手段12043が取得した要約情報を、図20の(1)の領域の下に追記する。要約情報もアンカーになっており、要約の対象である対象情報に対応する元情報の所在を示すURLが要約情報に付与されている。そして、対象情報出力手段12042は、図20の(2)の領域を得る。図20の(2)は、上述した要約部である。
以上の処理を、ランキング2位の「くまもと○○ラーメン」、3位の「ラーメンABC」の検索対象に対して行い、対象情報出力手段12042は、図20の出力する情報を得る。なお、図20は表示イメージであり、実際は、HTMLで記述されている。
次に、出力部1204は、構成した情報(図20の情報)を、情報端末11に送信する。
次に、情報端末11は、図20の情報(HTMLで記述された情報)を受信し、当該情報を解釈実行し、図20の画面を表示する。
さらに、情報端末11のユーザが、例えば、リンクシンボル情報、ラーメンXYZの「評価1」をマウスで押下した、とする。すると、情報端末11は、ラーメンXYZの「評価1」に対応するURL「http://www.グルメ.co.jp」に対応するページを、情報処理装置12に検索に行き、「http://www.グルメ.co.jp」に対応するページを表示する。かかる処理は、公知技術による処理であるので詳細な説明を省略する。
また、情報端末11のユーザが、例えば、要約情報「ゴマラーメンのXYZ。」をマウスで押下した、とする。すると、情報端末11は、要約情報「ゴマラーメンのXYZ。」に対応するURL「http://www.グルメ.co.jp」に対応するページを、情報処理装置12に検索に行き、「http://www.グルメ.co.jp」に対応するページを表示する。かかる処理も、公知技術による処理であるので詳細な説明を省略する。
以上、本実施の形態によれば、店舗等の客観的な情報が適切に取得できる。具体的には、目的とする地点(例えば、JR山手線新宿など)から、ユーザの行動に合致した(徒歩10分など)店舗等の検索が可能となる。また、いわゆるタウンページ等の住所録情報を用いて店舗等の絞込みを行なうことにより、精度の高い店舗等の検索が可能となる。また、HTMLファイル等の構造化された情報から店舗等の情報を検索する場合に、タグ構造に基づいた情報の分割、検索を行なうことにより、不要な情報を取り出す確率を減らすことができ、また、高速に必要な情報を取得できる。特に、電話番号情報、住所情報、郵便番号のうちの1以上の情報である場所情報を含む階層レベルと所定の関係にある階層レベルを決定し、当該決定した階層レベルの情報を取得することにより不要な情報を取り出す確率を減らすことができる。かかる処理により、具体的には、例えば、WEBページの広告の情報など、ユーザが検索したい情報ではない情報を取得することを防ぎ、良好な検索結果を得ることができる。また、従来から用いられてきた距離順や新着順の情報ランキングではなく、検索対象の店舗等の記述データ量等に基づいたランキングを行なうことにより、ユーザにとって適切な情報提示が可能となる。さらに、ページランクや電話番号の有無による情報の信頼性を加味したランキングを行なうことにより、さらにユーザにとって適切な情報提示が可能となる。さらに、検索対象の各ページでの単語の出現頻度を考慮して要約情報を構成することにより、検索対象(店舗等)に特有の文書部分が切出され、適切な要約情報が構成できた。
なお、本実施の形態において、要約手段は、対象情報から単語を抽出する単語抽出手段と、単語抽出手段が抽出した各単語における、検索対象毎の出現回数を算出する検索対象毎単語出現回数算出手段と、出現回数に基づいて、対象情報から各検索対象の要約を取得する要約取得手段を具備した。しかし、要約手段は、対象情報の先頭、例えば、100文字を切出すだけの処理でも良い。ただし、上述した単語の出現回数を考慮した要約方法により、店舗等の検索対象の特徴を良く現した要約情報を取得できる。
また、本実施の形態において、対象情報の要約がアンカーとなり、当該アンカーをマウス等で押下した場合に、対象情報の元情報にアクセスし、当該元情報を表示したが、かかることは必須ではない。つまり、出力部1204は、アンカーではない要約情報を出力するだけでも良い。
また、本実施の形態において、リンクシンボル出力手段12046は、リンクシンボル情報(「評価1」「評価2」など)を出力したが、リンクシンボル出力手段12046は必須ではない。つまり、リンクシンボル情報(「評価1」「評価2」など)を出力することは必須ではない。
また、本実施の形態において、2以上の検索対象を順位付けするランキング決定手段12041は必須ではない。つまり、ランキングしないで、処理した順に店舗情報等を出力しても良い。
また、本実施の形態において、ランキング決定手段12041は、2以上の検索対象の対象情報の文字数、または/および当該対象情報に電話番号情報が含まれるか否か、または/および対象情報が記載されている元情報のページランキングに基づいて2以上の検索対象を順位付けした。しかし、かかる処理以外でランキングしても良い。例えば、ランキング決定手段12041は、2以上の検索対象が記載されているホームページの数のみに基づいて2以上の検索対象を順位付けしても良い。
また、本実施の形態において、検索情報は、検索地点に関する情報である検索地点情報と、検索対象のグループを特定する情報である対象グループ情報を有した。対象グループ情報とは、キーワード「ラーメン」等である。しかし、検索情報は、検索地点情報のみであっても良いし、他の情報(店舗の広さや営業時間の情報など)を有しても良い。
また、本実施の形態において、主として、ラーメン屋などの食事どころ(レストラン)を検索対象としたが、英会話学校や本屋等、サービスや物品を販売、レンタルする店舗等、何でも良い。
また、本実施の形態において、対象情報を取得する元になる情報である元情報は、階層化されたタグが付された情報であり、対象情報取得部は、一の元情報から複数の対象情報を取得する場合に、同一の階層レベルの情報を取得した。しかし、対象情報取得部は、タグの階層情報を用いずに、単純な検索処理等により対象情報を検索しても良い。なお、タグの階層情報を用いて対象情報を検索した場合に、検索処理が高速化されることは言うまでもない。
また、本実施の形態において、対象情報取得部は、一の元情報から複数の対象情報を取得する場合に、一の元情報を検索し、電話番号情報、住所情報、郵便番号のうちの1以上の情報である場所情報を含む階層レベルと同一の階層レベルを決定し、当該決定した階層レベルの情報を取得した。しかし、対象情報取得部は、一の元情報から複数の対象情報を取得する場合に、一の元情報を検索し、電話番号情報、住所情報、郵便番号のうちの1以上の情報である場所情報を含む階層レベルと所定の関係にある階層レベルを決定し、当該決定した階層レベルの情報を取得しても良い。例えば、図21(a)に示すように、<td>タグに電話番号情報等の場所情報が含まれている場合に、<tr>タグ以下(ここで「以下」とは、階層における下位階層、という意味である。)のタグ内の情報を切出して、当該切出した情報を検索対象としても良い。なお、図21(a)のタグ構造を有するホームページは、図21(b)のように表の各行にレストラン等の、ユーザが欲する情報が含まれている。また、例えば、表の各行のある属性値として電話番号を有したり、別の属性値として住所を有したりする。
また、例えば、図22(a)に示すように、<td>タグに電話番号情報等の場所情報が含まれている場合に、<table>タグ以下のタグ内の情報を切出して、当該切出した情報を検索対象としても良い。なお、図22(a)のタグ構造を有するホームページは、図22(b)のように表のレコード中にレストラン等の、ユーザが欲する情報が含まれている。つまり、上述した「場所情報を含む階層レベルと所定の関係にある階層レベル」とは、「場所情報を含む階層レベル」と同一の階層レベルでも良いし、「場所情報を含む階層レベル」の一つ上位の階層のレベルでも、二つ上位の階層のレベルでも良い。
また、本実施の形態において、元情報は、WEBのホームページであったが、他の情報であっても良いことは言うまでもない。
さらに、本実施の形態における処理は、ソフトウェアで実現しても良い。そして、このソフトウェアをソフトウェアダウンロード等により配布しても良い。また、このソフトウェアをCD−ROMなどの記録媒体に記録して流布しても良い。なお、このことは、本明細書における他の実施の形態においても該当する。なお、本実施の形態における情報処理装置を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、コンピュータに、2以上の検索対象を特定する情報である検索情報を受け付ける受付ステップと、前記検索情報により特定される2以上の検索対象に関する情報である2以上の対象情報を2以上の元情報から取得する対象情報取得ステップと、前記2以上の検索対象の対象情報を出力する出力ステップを実行させるためのプログラムである。また、前記出力ステップは、前記2以上の対象情報を要約し、2以上の要約情報を取得する要約ステップと、前記2以上の要約情報を出力する要約情報出力ステップを具備しても良い。また、前記要約ステップは、前記対象情報から単語を抽出する単語抽出ステップと、前記単語抽出ステップで抽出した各単語における、検索対象毎の出現回数を算出する検索対象毎単語出現回数算出ステップと、前記出現回数に基づいて、前記対象情報から各検索対象の要約情報を取得する要約取得ステップを具備しても良い。また、前記要約ステップは、前記単語抽出ステップで抽出した各単語における、全部の検索対象の全対象情報中の出現回数を算出する単語全出現回数算出ステップと、前記検索対象毎単語出現回数算出ステップで算出した検索対象毎の出現回数と前記単語全出現回数算出ステップで算出した全対象情報中の出現回数との割合を算出する割合算出ステップと、前記割合算出ステップで算出した割合が高い単語から並べて、検索対象毎の単語リストを作成する単語リスト作成ステップをさらに具備し、前記要約取得ステップは、前記検索対象毎の単語リストに基づいて、前記対象情報から各検索対象の要約情報を取得しても良い。
さらに、前記対象情報取得ステップにおいて、対象情報が記載された情報の所在を示す情報であるリンク情報も取得し、前記受付ステップにおいて、前記要約情報に対する指示である要約情報選択指示をも受け付け、前記受付ステップで要約情報選択指示を受け付けた場合に、前記要約情報選択指示に対応する要約情報の元になる対象情報が記載された元情報のリンク情報に基づいて、当該元情報を取得する元情報取得ステップをさらに実行させ、前記出力ステップは、前記元情報取得ステップで取得した元情報をも出力する元情報出力ステップをも具備しても良い。
また、上記プログラムにおいて、前記対象情報取得ステップで、対象情報が記載された情報の所在を示す情報であるリンク情報も取得し、前記出力ステップは、前記リンク情報に対応する情報であるリンクシンボル情報を出力するリンクシンボル出力ステップをさらに具備し、前記受付ステップは、前記リンクシンボル情報に対する指示であるリンクシンボル選択指示をも受け付け、前記受付ステップにおいてリンクシンボル選択指示を受け付けた場合に、前記指示されたリンクシンボル情報に対応するリンク情報に基づいて、当該リンク情報が示す対象情報が記載された情報である元情報を取得する元情報取得ステップをさらに具備し、前記出力ステップにおいて、前記元情報取得ステップで取得した元情報をも出力する元情報出力ステップをも具備する構成でも良い。
また、上記出力ステップにおいて、前記2以上の検索対象の対象情報に基づいて、前記2以上の検索対象を順位付けするランキング決定ステップをさらに具備し、前記ランキング決定ステップの順位付けに基づいて、前記2以上の検索対象の対象情報または/および要約情報を出力しても良い。
また、ランキング決定ステップにおいて、前記2以上の検索対象の対象情報の文字数、または/および当該対象情報に電話番号情報が含まれるか否か、または/および対象情報が記載されている元情報のページランキングに基づいて前記2以上の検索対象を順位付けしても良い。
上記の検索情報は、検索地点に関する情報である検索地点情報と、検索対象のグループを特定する情報である対象グループ情報を有することが好適である。
また、検索対象の名称を示す情報である検索対象名称情報と、検索対象の電話番号を示す情報である電話番号情報と、検索対象の住所を示す情報である住所情報を有する被検索対象情報を1以上有する被検索対象情報群を格納しており、前記対象情報取得ステップにおいて、前記検索情報に基づいて、被検索対象情報の一部または全部を取得する被検索対象情報取得ステップと、前記被検索対象情報取得ステップで取得した被検索対象情報の一部または全部に基づいて、前記検索情報により特定される2以上の検索対象の対象に関する情報である対象情報を取得する対象情報取得ステップを具備しても良い。
また、検索情報は、さらに検索地点情報が示す検索地点からの検索範囲を特定する情報である検索範囲情報を含み、前記被検索対象情報取得ステップは、前記検索情報が有する検索地点情報と前記検索対象の住所情報と前記検索範囲情報に基づいて、1以上の被検索対象情報を選択し、当該選択した被検索対象情報の一部または全部を取得しても良い。
また、被検索対象情報取得ステップにおいて、前記検索情報が有する検索地点情報の経緯度と、前記検索対象の住所情報の経緯度を取得し、当該2つの経緯度から前記検索地点情報が示す検索地点と前記住所情報が示す前記検索対象の地点の間の距離を算出し、当該距離に基づいて、前記検索範囲情報が示す条件に合致するか否かを判断することにより、1以上の被検索対象情報を選択し、当該選択した被検索対象情報の一部または全部を取得しても良い。
また、前記対象情報を取得する元になる情報である元情報は、階層化されたタグが付された情報であり、前記対象情報取得ステップにおいて、一の元情報から複数の対象情報を取得する場合に、同一の階層レベルの情報を取得することが好適である。
また、対象情報取得ステップにおいて、一の元情報から複数の対象情報を取得する場合に、一の元情報を検索し、電話番号情報、住所情報、郵便番号のうちの1以上の情報である場所情報を含む階層レベルを決定し、当該決定した階層レベルの情報を取得しても良い。
また、対象情報取得ステップにおいて、場所情報を2以上含む階層レベルを決定し、当該決定した階層レベルの情報を取得しても良い。
なお、上記プログラムにおいて、情報を送信する送信ステップや、情報を受信する受信ステップなどでは、ハードウェアによって行われる処理、例えば、送信ステップにおけるモデムやインターフェースカードなどで行われる処理(ハードウェアでしか行われない処理)は含まれない。
また、上記各実施の形態において、各処理(各機能)は、単一の装置(システム)によって集中処理されることによって実現されてもよく、あるいは、複数の装置によって分散処理されることによって実現されてもよい。つまり、1以上の装置により、上記した処理の方法が実現されれば良い。具体的には、例えば、情報処理装置12は、被検索対象情報群格納手段12021を保持せず、他の装置が被検索対象情報群格納手段12021を保持していても良い。かかる場合、情報処理装置12は、当該他の装置を検索して、被検索対象情報を取得する。
また、上記情報処理システムにおいて、情報端末11と情報処理装置12が一の装置で実現されていても良い。かかる場合、情報処理装置12がユーザ入力受付部1101を保持し、出力部1204は、ディスプレイに情報を表示したり、スピーカーで音声出力したり等の処理を行う。
また、上記各実施の形態において、一の装置に存在する2以上の通信手段(情報送信部など)は、物理的に一の媒体で実現されても良いことは言うまでもない。
本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。
以上のように、本発明にかかる情報処理装置は、店舗等の客観的な情報が適切に出力できるという効果を有し、例えば、WEBにおけるサーチエンジンを有するサーバ装置等として有用である。
実施の形態における情報処理システムの概念図 同情報処理システムのブロック図 同情報端末の動作について説明するフローチャート 同情報処理装置の動作について説明するフローチャート 同対象情報取得処理について説明するフローチャート 同送信情報構成処理について説明するフローチャート 同ランキング処理について説明するフローチャート 同要約情報取得処理について説明するフローチャート 同ホームページの例を示す図 同被検索対象情報群を示す図 同情報ポータル管理表を示す図 同入力画面例を示す図 同要求情報を示す図 同被検索対象情報中間表を示す図 同HTML構造木を示す図 同対象情報管理表を示す図 同ランキング中間表を示す図 同単語リスト管理表を示す図 同要約情報管理表を示す図 同出力する情報の例を示す図 同HTML構造木を示す図 同HTML構造木を示す図
符号の説明
11 情報端末
12 情報処理装置
13 情報格納装置
1101 ユーザ入力受付部
1102 要求送信部
1103 情報受信部
1104 情報出力部
1201 受付部
1202 対象情報取得部
1203 元情報取得部
1204 出力部
1205 元情報受信部
1206 元情報蓄積部
1207 元情報格納部
1301 元情報格納部
1302 元情報送信部
12021 被検索対象情報群格納手段
12022 被検索対象情報取得手段
12023 対象情報取得手段
12041 ランキング決定手段
12042 対象情報出力手段
12043 要約手段
12044 要約情報出力手段
12045 元情報出力手段
12046 リンクシンボル出力手段
120431 単語抽出手段
120432 検索対象毎単語出現回数算出手段
120433 単語全出現回数算出手段
120434 割合算出手段
120435 単語リスト作成手段

Claims (7)

  1. 2以上の検索対象を特定する情報である検索情報を受け付ける受付部と、
    2以上の情報格納装置に格納されている元情報であり、階層化されたタグが付された情報である元情報から、前記検索情報により特定される2以上の検索対象に対するユーザ評価の情報である2以上の対象情報を取得する対象情報取得部と、
    前記2以上の検索対象の対象情報を出力する出力部を具備する情報処理装置であって、
    前記対象情報取得部は、
    一の元情報から複数の対象情報を取得する場合に、当該元情報内の同一の階層レベルの情報を取得し、
    検索対象の名称を示す情報である検索対象名称情報と、検索対象の電話番号を示す情報である電話番号情報と、検索対象の住所を示す情報である住所情報を有する被検索対象情報を1以上有する被検索対象情報群を格納している被検索対象情報群格納手段と、
    前記検索情報に基づいて、前記被検索対象情報群格納手段から被検索対象情報の一部または全部を取得する被検索対象情報取得手段と、
    前記被検索対象情報取得手段が取得した被検索対象情報の一部または全部を用いて、前記検索情報により特定される2以上の検索対象の対象に関する情報である対象情報を取得する手段であり、一の元情報から複数の対象情報を取得する場合に、一の元情報を検索し、電話番号情報、住所情報、郵便番号のうちの1以上の情報である場所情報を含む階層レベルを、情報を取得する階層レベルと決定し、当該決定した階層レベルの情報を取得する手段である対象情報取得手段を具備し、
    前記出力部は、
    前記2以上の対象情報を要約し、2以上の要約情報を取得する要約手段と、
    前記2以上の要約情報を出力する要約情報出力手段を具備し、
    前記要約手段は、
    前記対象情報から単語を抽出する単語抽出手段と、
    前記単語抽出手段が抽出した各単語における、検索対象毎の出現回数を算出する検索対象毎単語出現回数算出手段と、
    前記出現回数に基づいて、前記対象情報から各検索対象の要約情報を取得する要約取得手段と、
    前記単語抽出手段が抽出した各単語における、全部の検索対象の全対象情報中の出現回数を算出する単語全出現回数算出手段と、
    前記検索対象毎単語出現回数算出手段が算出した検索対象毎の出現回数と前記単語全出現回数算出手段が算出した全対象情報中の出現回数との割合を算出する割合算出手段と、
    前記割合算出手段が算出した割合が高い単語から並べて、検索対象毎の単語リストを作成する単語リスト作成手段を具備し、
    前記要約取得手段は、
    前記検索対象毎の単語リストに基づいて、前記対象情報から各検索対象の要約情報を取得する情報処理装置。
  2. 前記対象情報取得部は、
    対象情報が記載された元情報の所在を示す情報であるリンク情報も取得し、
    前記受付部は、
    前記要約情報に対する指示である要約情報選択指示をも受け付け、
    前記受付部が要約情報選択指示を受け付けた場合に、
    前記要約情報選択指示に対応する要約情報の元になる対象情報が記載された元情報のリンク情報に基づいて、当該元情報を取得する元情報取得部をさらに具備し、
    前記出力部は、前記元情報取得部が取得した元情報をも出力する元情報出力手段をも具備する請求項1記載の情報処理装置。
  3. 前記対象情報取得部は、
    対象情報が記載された元情報の所在を示す情報であるリンク情報も取得し、
    前記出力部は、
    前記リンク情報に対応する情報であるリンクシンボル情報を出力するリンクシンボル出力手段をさらに具備し、
    前記受付部は、前記リンクシンボル情報に対する指示であるリンクシンボル選択指示をも受け付け、
    前記受付部がリンクシンボル選択指示を受け付けた場合に、
    前記指示されたリンクシンボル情報に対応するリンク情報に基づいて、当該リンク情報が示す対象情報が記載された情報である元情報を取得する元情報取得部をさらに具備し、
    前記出力部は、前記元情報取得部が取得した元情報をも出力する元情報出力手段をも具備する請求項2記載の情報処理装置。
  4. 前記出力部は、
    前記2以上の検索対象の対象情報に基づいて、前記2以上の検索対象を順位付けするランキング決定手段をさらに具備し、
    前記ランキング決定手段の順位付けに基づいて、前記2以上の検索対象の対象情報または/および要約情報を出力する請求項3記載の情報処理装置。
  5. 前記ランキング決定手段は、
    前記2以上の検索対象の対象情報の文字数、または/および当該対象情報に電話番号情報が含まれるか否か、または/および対象情報が記載されている元情報のページランキングに基づいて前記2以上の検索対象を順位付けする請求項記載の情報処理装置。
  6. コンピュータに、
    2以上の検索対象を特定する情報である検索情報を受け付ける受付ステップと、
    2以上の情報格納装置に格納されている元情報であり、階層化されたタグが付された情報である元情報から、前記検索情報により特定される2以上の検索対象に対するユーザ評価の情報である2以上の対象情報を取得する対象情報取得ステップと、
    前記2以上の検索対象の対象情報を出力する出力ステップを実行させるためのプログラムであって、
    前記対象情報取得ステップは、
    一の元情報から複数の対象情報を取得する場合に、当該元情報内の同一の階層レベルの情報を取得し、
    検索対象の名称を示す情報である検索対象名称情報と、検索対象の電話番号を示す情報である電話番号情報と、検索対象の住所を示す情報である住所情報を有する被検索対象情報を1以上有する被検索対象情報群を格納している記憶媒体から、前記検索情報に基づいて、被検索対象情報の一部または全部を取得する被検索対象情報取得ステップと、
    前記被検索対象情報取得ステップで取得した被検索対象情報の一部または全部を用いて、前記検索情報により特定される2以上の検索対象の対象に関する情報である対象情報を取得するステップであり、一の元情報から複数の対象情報を取得する場合に、一の元情報を検索し、電話番号情報、住所情報、郵便番号のうちの1以上の情報である場所情報を含む階層レベルを、情報を取得する階層レベルと決定し、当該決定した階層レベルの情報を取得するステップである対象情報取得ステップを具備し、
    前記出力ステップは、
    前記2以上の対象情報を要約し、2以上の要約情報を取得する要約ステップと、
    前記2以上の要約情報を出力する要約情報出力ステップを具備し、
    前記要約ステップは、
    前記対象情報から単語を抽出する単語抽出ステップと、
    前記単語抽出ステップで抽出した各単語における、検索対象毎の出現回数を算出する検索対象毎単語出現回数算出ステップと、
    前記出現回数に基づいて、前記対象情報から各検索対象の要約情報を取得する要約取得ステップと、
    前記単語抽出ステップで抽出した各単語における、全部の検索対象の全対象情報中の出現回数を算出する単語全出現回数算出ステップと、
    前記検索対象毎単語出現回数算出ステップで算出した検索対象毎の出現回数と前記単語全 出現回数算出ステップで算出した全対象情報中の出現回数との割合を算出する割合算出ステップと、
    前記割合算出ステップで算出した割合が高い単語から並べて、検索対象毎の単語リストを作成する単語リスト作成ステップを具備し、
    前記要約取得ステップは、
    前記検索対象毎の単語リストに基づいて、前記対象情報から各検索対象の要約情報を取得するプログラム。
  7. 受付部、対象情報取得部、および出力部により実行させる情報処理方法であって、
    前記受付部により、2以上の検索対象を特定する情報である検索情報を受け付ける受付ステップと、
    前記対象情報取得部により、2以上の情報格納装置に格納されている元情報であり、階層化されたタグが付された情報である元情報から、前記検索情報により特定される2以上の検索対象に対するユーザ評価の情報である2以上の対象情報を取得する対象情報取得ステップと、
    前記出力部により、前記2以上の検索対象の対象情報を出力する出力ステップを具備する情報処理方法であって、
    前記対象情報取得ステップにおいて、
    一の元情報から複数の対象情報を取得する場合に、当該元情報内の同一の階層レベルの情報を取得し、
    検索対象の名称を示す情報である検索対象名称情報と、検索対象の電話番号を示す情報である電話番号情報と、検索対象の住所を示す情報である住所情報を有する被検索対象情報を1以上有する被検索対象情報群を格納している記憶媒体から、前記検索情報に基づいて、被検索対象情報の一部または全部を取得する被検索対象情報取得ステップと、
    前記被検索対象情報取得ステップで取得した被検索対象情報の一部または全部を用いて、前記検索情報により特定される2以上の検索対象の対象に関する情報である対象情報を取得するステップであり、一の元情報から複数の対象情報を取得する場合に、一の元情報を検索し、電話番号情報、住所情報、郵便番号のうちの1以上の情報である場所情報を含む階層レベルを、情報を取得する階層レベルと決定し、当該決定した階層レベルの情報を取得するステップである対象情報取得ステップを具備し、
    前記出力ステップは、
    前記2以上の対象情報を要約し、2以上の要約情報を取得する要約ステップと、
    前記2以上の要約情報を出力する要約情報出力ステップを具備し、
    前記要約ステップは、
    前記対象情報から単語を抽出する単語抽出ステップと、
    前記単語抽出ステップで抽出した各単語における、検索対象毎の出現回数を算出する検索対象毎単語出現回数算出ステップと、
    前記出現回数に基づいて、前記対象情報から各検索対象の要約情報を取得する要約取得ステップと、
    前記単語抽出ステップで抽出した各単語における、全部の検索対象の全対象情報中の出現回数を算出する単語全出現回数算出ステップと、
    前記検索対象毎単語出現回数算出ステップで算出した検索対象毎の出現回数と前記単語全出現回数算出ステップで算出した全対象情報中の出現回数との割合を算出する割合算出ステップと、
    前記割合算出ステップで算出した割合が高い単語から並べて、検索対象毎の単語リストを作成する単語リスト作成ステップを具備し、
    前記要約取得ステップは、
    前記検索対象毎の単語リストに基づいて、前記対象情報から各検索対象の要約情報を取得する情報処理方法。
JP2006524541A 2004-07-16 2005-06-28 情報処理装置およびプログラム Active JP4035623B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2004209780 2004-07-16
JP2004209780 2004-07-16
PCT/JP2005/011786 WO2006008919A1 (ja) 2004-07-16 2005-06-28 情報処理装置およびプログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2006313880A Division JP2007048328A (ja) 2004-07-16 2006-11-21 情報処理装置、情報処理方法およびプログラム

Publications (2)

Publication Number Publication Date
JP4035623B2 true JP4035623B2 (ja) 2008-01-23
JPWO2006008919A1 JPWO2006008919A1 (ja) 2008-05-01

Family

ID=35785042

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006524541A Active JP4035623B2 (ja) 2004-07-16 2005-06-28 情報処理装置およびプログラム

Country Status (2)

Country Link
JP (1) JP4035623B2 (ja)
WO (1) WO2006008919A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008040869A (ja) * 2006-08-08 2008-02-21 Pioneer Electronic Corp 地点情報評価装置、地点情報評価プログラム
WO2008142791A1 (ja) * 2007-05-24 2008-11-27 Fujitsu Limited 差分算出プログラム、差分算出装置および差分算出方法
JP6070951B2 (ja) * 2013-12-17 2017-02-01 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 評価の分析を支援する装置及び方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000207458A (ja) * 1999-01-08 2000-07-28 Recruit Co Ltd 商品情報サ―ビスシステム
JP2001357035A (ja) * 2000-06-13 2001-12-26 Open Door:Kk コンテンツ評価・検索システム
JP3408528B1 (ja) * 2001-11-20 2003-05-19 株式会社ジャストシステム 情報処理装置、情報処理方法、及び情報処理プログラム
JP2003167990A (ja) * 2001-11-30 2003-06-13 Fujitsu Ltd 商品情報収集システム及び方法
JP4808357B2 (ja) * 2002-03-19 2011-11-02 三菱電機株式会社 情報収集装置
JP2004185572A (ja) * 2002-12-06 2004-07-02 Nippon Telegr & Teleph Corp <Ntt> 口コミ情報解析方法及び装置

Also Published As

Publication number Publication date
WO2006008919A1 (ja) 2006-01-26
JPWO2006008919A1 (ja) 2008-05-01

Similar Documents

Publication Publication Date Title
JP4909334B2 (ja) サービス提案装置及びその方法、サービス提案システム、ユーザのお気に入りベースに基づくサービス提案装置及びその方法
US9152614B2 (en) System and method for bulk web domain generation and management
US20130304750A1 (en) Relevancy sorting of user&#39;s browser history
US20080215550A1 (en) Search support apparatus, computer program product, and search support system
US8150979B1 (en) Supporting multiple landing pages
EP2557511B1 (en) Information processing device, information processing method, information processing programme, and recording medium
KR20070092756A (ko) 위치 추출
CN103339597A (zh) 转换搜索引擎查询
JP5269938B2 (ja) 急上昇ワード関連付け装置及び方法
US20170351779A1 (en) System and method for operating a browsing application
JP2011527062A (ja) ホームページ統合サービス提供システム及び方法
CN102063194A (zh) 用于供用户进行文字输入的方法、设备、服务器和***
CN104376114A (zh) 一种搜索结果展示方法及装置
KR101011726B1 (ko) 스니펫 제공 장치 및 방법
KR100913733B1 (ko) 템플릿을 이용한 검색결과 제공방법
US20080312901A1 (en) Character input assist method, character input assist system, character input assist program, user terminal, character conversion method and character conversion program
JP4035623B2 (ja) 情報処理装置およびプログラム
JP2007233862A (ja) サービス検索システム及びサービス検索方法
KR20110050823A (ko) 지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 장치 및 방법
JP2017117021A (ja) キーワード抽出装置、コンテンツ生成システム、キーワード抽出方法、およびプログラム
JP6639040B2 (ja) 情報検索装置及びプログラム
JP4505389B2 (ja) 広告コンテンツ送信システム、広告コンテンツ送信方法
JP4002943B1 (ja) 検索最適化装置、方法、及びコンピュータプログラム
JP2007048328A (ja) 情報処理装置、情報処理方法およびプログラム
JP5084859B2 (ja) 情報処理装置、データ抽出方法、及びプログラム

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070927

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150