JP4027568B2 - インターネット上の複数の検索エンジンを使ってクリッピングサービスを行う情報処理装置 - Google Patents
インターネット上の複数の検索エンジンを使ってクリッピングサービスを行う情報処理装置 Download PDFInfo
- Publication number
- JP4027568B2 JP4027568B2 JP2000145098A JP2000145098A JP4027568B2 JP 4027568 B2 JP4027568 B2 JP 4027568B2 JP 2000145098 A JP2000145098 A JP 2000145098A JP 2000145098 A JP2000145098 A JP 2000145098A JP 4027568 B2 JP4027568 B2 JP 4027568B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- client
- information
- engine
- internet
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
【発明の属する技術分野】
本発明は、インターネット上で運用されている複数の検索エンジンを使ってWEBページの検索レポートを作成して依頼人に報告するクリッピングサービスを自動的に行う情報処理装置に関する。
【0002】
【従来の技術】
従来企業における業務の効率化、人員の削減、或いは多業種間での商品共同購入による事業コストの削減などをにらんだEコマース(電子商取引)サイトや、企業コンセプトなどを発信する企業ホームページがあらゆる業種において勃興しつつあり、また躍進著しいIT(情報関連)企業の提供する各種コミュニティサイトや掲示板システムなどもインターネット上においてその数を急速に伸ばしている。また、こういった大規模な企業のみならず個人においても趣味のホームページやごく小規模な個人電子商店等を立ち上げることが盛んになっており、インターネットにおけるWEBページの総数は膨大な数にのぼっている。
【0003】
そして、このように膨大なWEBページの中から所望の情報のみを検索抽出し、希望者に配送する情報クリッピングサービスなるものの需要が特に企業において根強い。自社や自社商品等に関係したキーワードに対し検索を行うクリッピングサービスにより、世間一般に流布されている自らのイメージを知り、以後の経営に生かす意向が強いためである。この情報クリッピングサービスは、当該サービスを提供する企業独自の情報検索システムの他、インターネット上のポータルサイト等に備えられた検索エンジンを用いて、所定のキーワードに対する全文検索を行い、その検索結果である文書情報を一定日時毎にメール配信するのが一般的である。
【0004】
【発明が解決しようとする課題】
しかしながら、例えばインターネット上の単独の検索エンジンを使ってクリッピング作業を行うとした場合、検索エンジン毎に登録整理されているWEBページのジャンルや数が異なり、単独の検索エンジンのみから得られる検索結果は限定的なものとなるから低い有用性しか発揮しえない。したがって、インターネットという、国籍、年齢、性別、趣味等を越えて極めて広範に亘った情報ソースの中から求めている情報を確実に獲得するという意義自体が薄れ、クリッピングサービスの信頼性、実用性の低下が否めない。
【0005】
一方、単独の検索エンジンに依存した場合の上記欠点を補う意味でメタ検索エンジンを用いることが考えられる。このメタ検索エンジンは所定のクエリーを同時に複数の検索エンジンに向けて発することで、今まで各検索エンジンにて逐一検索作業を行って別個の画面上で各検索結果を得ていたのが、複数の検索エンジンの検索結果について一括表示出来るようにしたものである。
【0006】
しかし、このメタ検索エンジンは、単に各検索エンジンにおいて得られる検索結果を羅列するに過ぎず、検索エンジン相互に発生している検索結果の重複を排除する機能もなく、また、更新以前の古い情報を除き常に最新の情報のみを抽出して表示するといった機能も備えていなかった。しかも、検索にヒットしたWEBページのURLに付す説明としては、各検索エンジンが一般に提供する説明文や各WEBページ先頭のHTMLを単純に抜粋して転載したものであり、検索キーワードに本当に対応した検索結果であるのか、一見して判断することは困難であった。
【0007】
してみれば、上記のような検索手法から得られた情報をもとに構成されたクリッピングサービスは、結局のところこのサービスを利用している各自で、配信された情報についてわざわざWEBページにアクセスしたりして確度と最新性とを高める必要がある情報しか提供できないのであった。他方、重複情報を除いて提供する情報精度を高めようとすれば、検索結果の妥当性や最新性の確認はほとんどすべて人間によらなければならない。つまり多数の利用者毎の異なる検索対象について得られた多様な検索結果全てに目を通し、重複部分については取り除き、最新の情報だけを取り出す手作業を、例えば一日で処理して毎日配信する作業が必要とされる。このため、配置されるべき人員や機材を想定すれば事業ベースに乗せることなど到底かなわないと言える。
【0008】
本発明はこのような従来の課題に着目してなされたもので、経時的にも内容的にも重複情報を確実に排除し、常に最新で明確な検索結果を多数の利用者に迅速に提供可能であるインターネット上で運用されている複数の検索エンジンを使ってWEBページの検索レポートを作成する情報処理装置を提供するものである。
【0009】
【課題を解決するための手段】
この発明に係る情報処理装置は、つぎの事項(1)〜(13)により特定されるものである。
(1)通信手段と、記憶手段と、制御手段を備えるコンピュータによって構成され、インターネット上の複数の検索エンジンを使ってクリッピングサービスを行う情報処理装置であること
(2)通信手段は、インターネットを介して他のコンピュータと通信可能であること
(3)記憶手段は、依頼人情報と、エンジン統合ヒットリストを、依頼人識別子に対応付けて格納すること
(4)依頼人情報は、アドレスと、検索キーワードを含むこと
(5)エンジン統合ヒットリストは、URLと更新日時の組みを複数含むこと
(6)制御手段は、依頼人コンピュータと通信して登録処理を可能とするとともに、第1〜第6処理からなる検索報告処理を定期的に繰り返し行うこと
(7)登録処理は、依頼人コンピュータから受信した依頼人情報を依頼人識別子に対応付けて記憶手段に格納すること
(8)第1処理は、インターネット上の複数の検索エンジンに対し、依頼人識別子Aに対応付けて記憶手段に格納されている検索キーワードBを含むクエリーCを送信すること
(9)第2処理は、第1処理にて送信したクエリーCに応答する各検索エンジンから、URLと更新日時の組みを含む検索レポートを受信すること
(10)第3処理は、第2処理にて受信した各エンジン別の検索レポートに含まれるURLを対照し、同一URLについて更新日時の新しい方を残して重複を排除したエンジン統合ヒットリストを作成し、これを依頼人識別子Aに対応付けて記憶手段に格納すること
(11)第4処理は、第3処理にて作成した今回分のエンジン統合ヒットリストと、依頼人識別子Aに対応付けて記憶手段に格納されている前回分のエンジン統合ヒットリストとを対照し、今回分リストに含まれていて前回分リストに含まれていないURLと、両リストに含まれていて今回分リストの方が更新日時の新しいURLを報告対象URLとして抽出すること
(12)第5処理は、第4処理にて抽出した報告対象URLをインターネットに送信して該当するWEBページを受信するとともに、WEBページから検索キーワードBを含む文字情報を抜粋してインデックスを作成すること
(13)第6処理は、第5処理にて作成したインデックスを含む検索レポートを、依頼人識別子Aに対応付けて記憶手段に格納されているアドレスに宛てて送信すること
【0010】
上記のように構成されたこの発明に係る情報処理装置において、望ましい実施形態として、依頼人情報には、抜粋範囲の文字数指定情報が含まれ、第5処理は、依頼人識別子Aに対応付けて記憶手段に格納されている文字数指定情報に基づいて文字情報を抜粋する構成とする。
【0017】
【発明の実施の形態】
本実施例においては、例えば自らの対外イメージや誹謗中傷記事などを客観的に調査したい企業を依頼人として設定し、この依頼人が自社や自社製品・サービスの名称、通称、愛称などを検索キーワードとして指定した場合を想定する。WEBページの検索レポート作成サービス(以後、クリッピングサービスと称する)を行うクリッピング業者は、前記検索キーワードに基づいてクリッピング作業を行うのである。
【0018】
クリッピング対象としての情報ソースは、一般的ニュースソースたる新聞や雑誌などのオンラインサービスの他に、各種電子掲示板、メーリングリスト、企業や個人のホームページなどが考えられる。基本的にはクリッピング業者がクリッピング作業に使用するコンピュータとネットワーク結合され、検索エンジンによる検索が可能な形式のものであれば、いかなる情報ソースでもクリッピング対象となりうる。
【0019】
====クリッピングサービスを実現する基本システム====
図1は本発明のWEBページの検索リポート作成方法を実現する基本システム図である。クリッピングサービスの提供を望む依頼人は例えばクリッピング結果(検索レポート)を受け取るための装置としてユーザコンピュータ10を備えている。このコンピュータ10は公衆回線を介してインターネットに接続されているものであり、電子メールソフトやWEBブラウザがインストールされている。一般にクリッピングサービスは商業ベースで運営されるものであるから、このユーザコンピュータ10は依頼人の数だけ広域的に多く並存しており、インターネットを介して下記のサーバコンピュータ20と集約的に結ばれている。
【0020】
一方、クリッピング業者は、依頼人から示された指定キーワードを含むクエリーを複数の検索エンジンに発行し、最終的に、前記クエリー中の検索キーワードに基づきヒットした各WEBページのインデックスを作成し、そのインデックス集合をエンジン統合検索レポートとして依頼人に送達するといったプロセスを実行するサーバコンピュータ20を備えている。
【0021】
このサーバコンピュータ20は、SMTP(Symple Mail Transfer Protocol)、POP(Post Office Protocol)などの標準的な電子メール転送用のプロトコルに基づき、インターネットを通じて他のコンピュータと電子メールの送受信を行う電子メールサーバとしての機能や、HTML(Hypertext Markup Language)ファイルをHTTP(Hypertext Transfer Protocol)を使ってクライアント(この場合、ユーザコンピュータ10)に配信し、クライアントのWEBブラウザが表示できるようにするWEBサーバとしての機能を備えるコンピュータである。このサーバコンピュータ20がインターネット上の各種検索エンジンを用いた検索作業等を行うわけであるから、勿論WEBブラウザや電子メールソフトもインストールされ使用可能となっている。
【0022】
上記のように、ユーザコンピュータ10とサーバコンピュータ20とがインターネットを介して結合されて、クリッピングサービスの依頼や検索キーワードの設定といった依頼人側からのアクションと、それに対するクリッピング結果の送達(例えば電子メールを利用)といったクリッピング業者からのリアクションが一定日時毎に往来することとなる。
【0023】
前記サーバコンピュータ20とインターネットを介して結びついて、クリッピング対象としての情報ソースを提供するのが、新聞や雑誌などのオンラインサービスを行っているニュースサーバ21や、メッセージ掲載希望者からインターネットを介して投稿されたメッセージを定型の画面データ(通常はHTML形式)に作成し、その画面データをインターネット上に公開する電子掲示板サーバー22、電子メールの送受信や管理等を行うメールサーバ23、および企業や個人のホームページなどを配信するWEBサーバ24などである。
【0024】
上述のユーザコンピュータ10、サーバコンピュータ20、並びにその他のサーバ類21、22、23、24はいずれもインターネットを介して接続されているとしたが、これに限定されず、利用目的や必要機能に応じてLANやパソコン通信等種々の接続手段を利用できるものとする。
【0025】
また、サーバコンピュータ20は、1つのサーバコンピュータに全ての機能を集約させて用いてもよいが、複数のサーバコンピュータをネットワーク結合させ種々の作業を分散処理することとしてもよい。
【0026】
====依頼人および検索キーワードの登録====
図2は本発明のWEBページの検索レポート作成方法を表す流れ図である。クリッピングサービスを希望する依頼人は、インターネットに接続されているユーザコンピュータ10により例えばクリッピングサービスを提供するWEBサイトのURLをサーバコンピュータ20に送信する。ユーザコンピュータ10とサーバコンピュータ20とが接続されると、登録申請画面(図示しない)がサーバコンピュータ20より送達される。
【0027】
登録申請画面には例えば検索条件としての、企業名(氏名)、住所、配信希望先メールアドレス、代金決済手段などの依頼人情報と、検索対象を絞り込むための検索キーワード(複数指定可能)や検索にヒットしたWEBページ上の抜粋範囲を設定するクエリー情報とを入力するブランクボックスやプルダウンメニューが設けられている。抜粋範囲とは、クエリー(検索キーワード含む)に対しヒットしたWEBページを記述しているHTMLのうち、検索キーワード前後の所定範囲について文字数として規定する範囲である。例えば“100文字”と指定すれば検索キーワード前後100文字分のHTMLを抜粋しサーバコンピュータ20内に取り込むのである。
【0028】
また、検索キーワードは依頼人の判断で決定されるべき性質のものであり、例えば自社商品のイメージを探るべく、「・・・株式会社」、「・・・ビール」、「イメージ」、「のどごし」、「きれ」などと設定すると、会社名とビール名とをAND検索で結びつけ、それ以下の「イメージ」、「のどごし」、「きれ」などのキーワードについてOR検索の条件付けを行うなどして効率的な検索が実行される。 他方、自社に対する誹謗中傷記事を探し出して早めの顧客対策を行いたいといった要望がある場合、自社名や商品名などの他に、「クレーム」、「告発」、「糾弾」といった検索キーワードを設定する。そのほかにも、自社の開発技術と関連する学術研究論文や、ニュース、外国機関発表記事などに対応付けされた検索キーワードを据えて世界の最新技術動向を知るといった設定も行える。
【0029】
依頼人が上述したような所定事項を記入・選択して登録操作を行うとユーザコンピュータ10は登録申請画面に記入された依頼人情報やクエリー情報などの検索条件をサーバコンピュータ20へ返送する。
【0030】
サーバコンピュータ20は、ユーザコンピュータ10から送られてきた検索条件に対して例えば「企業・個人は実在のもので、その決済手段が正当なものか」などの検証を行い、検証により正当と認められた場合はその内容を依頼人情報ファイル30に整理して記録する。もしくはこのクリッピングサービスを利用するにあたり予め郵送などにより申し込み書面を依頼人に提出させ、前記登録申請画面ではその依頼人情報の再度の確認と、検索キーワードの設定のみを行うとしてもよい。
【0031】
依頼人情報ファイル30は依頼人の企業名(氏名)、住所、電子メールアドレス等のID情報と、検索キーワードや検索にヒットしたWEBページ上の抜粋範囲を設定するクエリー情報とが依頼人ごと整理され検索条件として記録されるものであり、ハードディスク装置などの外部記憶装置上に作成される。なお、この依頼人情報ファイル30中には、例えば企業名を格納した企業名テーブル31、検索キーワードを格納した検索キーワードテーブル32が階層的に設けられている。
【0032】
このように、依頼人はクリッピング業者が提供する登録申請画面に検索キーワードなどの必要事項を記入し登録しておけば、一旦登録したこの検索条件に基づいて本発明を適用したクリッピングサービスによりインターネット上の所望の情報を例えば電子メールで定期的に通知してもらえるのである。
【0033】
====WEBページの検索レポートを作成する手順====
1.メインプログラム
本発明においてWEBページの検索レポートの作成を実際に行うメインプログラムとして、Perl(Practical Extraction and Report Language)言語でスクリプト記述をしたCGI(Common Gateway Interface)プログラムを想定する。このメインプログラムは、依頼人毎(ユーザコンピュータ10毎)に動作するものであり、前記の依頼人のID情報(名称そのまま、もしくは記号化されたID名)と電子メールアドレスとを引数とする。また、登録申請画面において入力したクエリー(検索キーワード含む)をサーバコンピュータ20内の検索キーワードテーブル32などから引き出し、SQL(Strucured Query Language)言語に変換して所定の検索エンジンSに発行する任を果たす。この際、企業名テーブル31から引き出した依頼人の企業名も検索キーワードに絡めて対応付けしておく。
【0034】
またこれに対し、所定の検索エンジンSは、各々の検索エンジンが備えるデータベース内のURLレコードに沿って前記検索キーワードに基づいた全文検索をし、その検索結果であるエンジン別検索レポートをメインプログラムへとそれぞれ返す。得られたエンジン別検索レポートは、各キーワード、各検索エンジンS毎に分類されてエンジン別ヒットテーブル40(ハードディスクなど外部記憶装置内に設けられる)へと記録される。以下得られる検索結果は対応したテーブル名を付けて外部記憶装置に適宜記録するものとする。
【0035】
メインプログラムが使用する検索エンジンSは複数あり、例えばクエリー発行順序を設定して使用序列を固定化しておく。なお、エンジン別ヒットテーブル40に記録された検索エンジンS毎のWEBページのヒット数が同一であれば、日時が更新されていたとしても新規のWEBページは無いものと判断して処理の高速化を図ると好ましい。
【0036】
各エンジン別検索レポートには前記クエリーに対してヒットしたWEBページのURLと更新日時のリストが含まれている。エンジン別検索レポートの前記リストのことをエンジン別ヒットリストと称する。このエンジン別ヒットリストを検索エンジンSに跨って相互に対照し、URLが同じであればその重複したWEBページを排除し更新日時が最新のデータを採択することで、更新日時情報を各々備えたURLリストを作成する。このURLリストのことをエンジン統合ヒットリストと称し、統合ヒットテーブル50に記録される。各検索エンジンS毎に同じWEBページがそれぞれ登録されている場合はかなり多く、このURLに基づいた重複排除を行わなければ迅速な検索は難しくなる。
【0037】
前記エンジン統合ヒットリストは、一旦登録しておいたクエリーを検索エンジンSに定期的に繰り返し発行することで、一定日時毎に繰り返し作成される。検索エンジンSの登録更新ペースに合わせて、例えば毎日、あるいは1週間毎に行われると効率的である。最新のエンジン統合ヒットリストの作成にあたっては、その直前に作成された古いものと当該リスト中のURLおよび更新日時について対照しその重複を排除する。
【0038】
例えば、最新リストには含まれているが古いリストには含まれていないURLは、対応する検索エンジンに新規登録されたものであるとしてこれを抽出し、新旧両リストに含まれているURLではあるが最新リストでは更新日時が新しくなっている場合、WEBページ内容が更新されているとしてこれも抽出する。このように得られた最新で重複のないURLを集約し報告対象URLとする。この報告対象URLは統合ヒットテーブル50内に収められる。
【0039】
従って、一番最初に作成したエンジン統合ヒットリストと比較して、繰り返し作成されればされるほどその重複部分は排除され、当該リストのサイズは絞られるのが普通である。このようにして統合ヒットテーブル50には常に最新のエンジン統合ヒットリストおよび報告対象URLのみが残されることとなる。
【0040】
2.ロボットプログラム
このプログラムは上記のエンジン統合ヒットリストにおいて特定された報告対象URLをインターネットに向けて送ることで、検索キーワードを含んだWEBページPにアクセスする。このWEBページPは、例えば、「・・・社の製品評価」、「・・・会社の告発」、「・・・技術報告」と、いわゆる告発サイトから純粋な研究機関による技術報までそのジャンルは様々であり、サイト運営者も個人、企業、研究機関などの境界は特にない。予めジャンル分けが必要とあらば、クエリー情報の登録段階において設定しておくか、ロボットプログラムによるアクセス時に制限をかけることなどで対処可能である。
【0041】
そして、このWEBページPを記述するHTMLを読み込み、検索キーワードを中心とした所定文字数分抜粋する。WEBページPにはリンク先が設けられているのが普通であるから、リンク先にもHTMLを読み込みに行き、検索キーワードを含む前後文を抜粋する。HTMLの抜粋が完了すればテキスト変換しサーバコンピュータ20の抜粋文テーブル60に向けてその抜粋文を送出する。ただし、ロボットプログラム自体に検索キーワードを中心とした所定文字数の抜粋機能を持たせずに、ロボットプログラムは単にWEBページPの全HTMLを読みとって、メインプログラムがその所定文字数分の抜粋作業を行ってもよい。
【0042】
3.WEBページの検索レポート送達
図3は本発明におけるWEBページの検索レポート70(エンジン統合検索レポート)の一例を示す説明図である。メインプログラムは、上述のように得られて統合ヒットテーブル50や抜粋文テーブル60において記録されたURLや更新日時、また検索キーワード前後の抜粋文といったクリッピング結果を、前記クエリー中の検索キーワード毎、或いは更新日時毎などのWEBページインデックス(図示しない)として整理してまとめる。そのインデックス集合をエンジン統合検索レポート70として依頼人に送達するのである。
【0043】
作成したエンジン統合検索レポート70(WEBページの検索レポート)は、様々な手段で依頼人に送達されることが考えられるが、通常は電子メールを利用する。メインプログラムが作成したエンジン統合検索レポート70は電子メールに転載され、インターネットを介して依頼人のユーザコンピュータ10へと送達される。
【0044】
====その他の実施形態====
(1)上記実施例においてはエンジン統合検索レポートの送達を、電子メールを利用して行った例を示したが、他にWEB画面上で表示する方法や、ファックスなどを利用することも可能である。依頼人の希望やインフラ状況に合わせていかようにも設定可能である。
【0045】
(2)ユーザコンピュータは、クリッピングサービスが送達するエンジン統合検索レポートの形式に応じて適宜変更可能なものであり、例えば、インターネット接続または電子メール受信可能な携帯電話や、PDA(Personal Digital Assistant)、WEB閲覧機能付きTV及びゲーム機、更にはファックス機といった様々な情報端末装置を適用できる。
【0046】
【発明の効果】
本発明によれば、従来手法が抱えていた、単独の検索エンジンからは限定的な検索結果しか得られず、インターネットという極めて広範に亘った情報ソース中から求める情報を確実に獲得するという意義自体が薄れ、クリッピングサービスの信頼性、実用性が低下するといった問題や、メタ検索エンジンを用いた際の、検索エンジン相互に発生している検索結果の重複や古い情報を排除できないなどの問題が解消される。
【0047】
つまり、複数の検索エンジンを組み合わせて利用するこでインターネット上の広範な情報ソースを検索対象とすることができ、さらにそこで得られた多様な検索結果における重複情報を排除し更新日時やURLの新規性が吟味されたエンジン統合ヒットリストを定期的に得ることが出来る。そして依頼人に対して、検索キーワードを含んだ抜粋文を掲載することで当該キーワードに対応したことが一見して明白であり、かつ重複のない最新の検索結果をエンジン統合検索レポートとして送達することが出来るのである。
【0048】
したがって、依頼人各自で、配信された情報についてわざわざ各WEBページにアクセスしたりして確度と最新性とを高める必要など無くなる。その上、クリッピングサービスを行う側としてもサービス提供用のサーバーなどを適宜数投入するだけで検索からレポート送達に至るまでのほぼ全ての業務を自動的に実施可能で、提供情報の精度を高めるための過大な人員や機材の配置なども必要ないのである。このため、サービス提供側はいかに利用者が増加しようと、その要求が複雑多岐に亘ろうとも、小規模な投資のみでコスト的にも効率的にも優れた運営を実現することができる。
【0049】
しかして、経時的にも内容的にも重複情報を確実に排除し、常に最新で明確な検索結果を多数の利用者に迅速に提供可能となるのである。
【図面の簡単な説明】
【図1】本発明のWEBページの検索リポート作成方法を実現する基本システム図である。
【図2】本発明のWEBページの検索リポート作成方法を表す流れ図である。
【図3】本発明におけるWEBページの検索レポート(エンジン統合検索レポート)の一例を示す説明図である。
S 検索エンジン
P WEBページ
10 ユーザコンピュータ
20 サーバコンピュータ
Claims (2)
- つぎの事項(1)〜(13)により特定される情報処理装置。
(1)通信手段と、記憶手段と、制御手段を備えるコンピュータによって構成され、インターネット上の複数の検索エンジンを使ってクリッピングサービスを行う情報処理装置であること
(2)通信手段は、インターネットを介して他のコンピュータと通信可能であること
(3)記憶手段は、依頼人情報と、エンジン統合ヒットリストを、依頼人識別子に対応付けて格納すること
(4)依頼人情報は、アドレスと、検索キーワードを含むこと
(5)エンジン統合ヒットリストは、URLと更新日時の組みを複数含むこと
(6)制御手段は、依頼人コンピュータと通信して登録処理を可能とするとともに、第1〜第6処理からなる検索報告処理を定期的に繰り返し行うこと
(7)登録処理は、依頼人コンピュータから受信した依頼人情報を依頼人識別子に対応付けて記憶手段に格納すること
(8)第1処理は、インターネット上の複数の検索エンジンに対し、依頼人識別子Aに対応付けて記憶手段に格納されている検索キーワードBを含むクエリーCを送信すること
(9)第2処理は、第1処理にて送信したクエリーCに応答する各検索エンジンから、URLと更新日時の組みを含む検索レポートを受信すること
(10)第3処理は、第2処理にて受信した各エンジン別の検索レポートに含まれるURLを対照し、同一URLについて更新日時の新しい方を残して重複を排除したエンジン統合ヒットリストを作成し、これを依頼人識別子Aに対応付けて記憶手段に格納すること
(11)第4処理は、第3処理にて作成した今回分のエンジン統合ヒットリストと、依頼人識別子Aに対応付けて記憶手段に格納されている前回分のエンジン統合ヒットリストとを対照し、今回分リストに含まれていて前回分リストに含まれていないURLと、両リストに含まれていて今回分リストの方が更新日時の新しいURLを報告対象URLとして抽出すること
(12)第5処理は、第4処理にて抽出した報告対象URLをインターネットに送信して該当するWEBページを受信するとともに、WEBページから検索キーワードBを含む文字情報を抜粋してインデックスを作成すること
(13)第6処理は、第5処理にて作成したインデックスを含む検索レポートを、依頼人識別子Aに対応付けて記憶手段に格納されているアドレスに宛てて送信すること - 依頼人情報には、抜粋範囲の文字数指定情報が含まれ、
第5処理は、依頼人識別子Aに対応付けて記憶手段に格納されている文字数指定情報に基づいて文字情報を抜粋する
請求項1に記載の情報処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000145098A JP4027568B2 (ja) | 2000-05-17 | 2000-05-17 | インターネット上の複数の検索エンジンを使ってクリッピングサービスを行う情報処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000145098A JP4027568B2 (ja) | 2000-05-17 | 2000-05-17 | インターネット上の複数の検索エンジンを使ってクリッピングサービスを行う情報処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001325275A JP2001325275A (ja) | 2001-11-22 |
JP4027568B2 true JP4027568B2 (ja) | 2007-12-26 |
Family
ID=18651656
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000145098A Expired - Fee Related JP4027568B2 (ja) | 2000-05-17 | 2000-05-17 | インターネット上の複数の検索エンジンを使ってクリッピングサービスを行う情報処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4027568B2 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8799975B2 (en) | 2001-12-06 | 2014-08-05 | Sony Corporation | System and method for providing content associated with a television broadcast |
US7778495B2 (en) | 2004-11-05 | 2010-08-17 | Brother Kogyo Kabushiki Kaisha | System and device for image processing |
JP2008529179A (ja) * | 2005-02-06 | 2008-07-31 | リンギット ゲーエムベーハー | 自然言語によってモバイル情報にアクセスするための方法及び装置 |
JP2006301975A (ja) * | 2005-04-20 | 2006-11-02 | Canon Inc | 情報処理装置及び情報処理方法並びにプログラム |
JP4561775B2 (ja) * | 2007-05-28 | 2010-10-13 | ソニー株式会社 | 動画像コンテンツ蓄積装置と情報機器からなるシステム、ならびに、放送受信機と動画像コンテンツ蓄積装置と情報機器からなるシステム |
JP4922240B2 (ja) * | 2008-06-04 | 2012-04-25 | ヤフー株式会社 | Web検索において選択的に擬似フィードバック処理を適用する検索処理装置、方法及びプログラム |
CN102663058B (zh) * | 2012-03-30 | 2013-12-18 | 华中科技大学 | 一种分布式网络爬虫***中的url去重方法 |
JP6554789B2 (ja) * | 2014-12-12 | 2019-08-07 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、その制御方法、及びプログラム |
JP6083546B1 (ja) | 2015-11-26 | 2017-02-22 | 株式会社パブセン | 情報管理装置、情報管理方法及びプログラム |
CN112561744A (zh) * | 2019-09-25 | 2021-03-26 | 北京国双科技有限公司 | 一种类似案件的检索报告的生成方法及装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1125020A (ja) * | 1997-07-08 | 1999-01-29 | Gaala:Kk | Www掲載番組の内容に変更があったことを依頼者に通知する調査代行サービス装置 |
US6999959B1 (en) * | 1997-10-10 | 2006-02-14 | Nec Laboratories America, Inc. | Meta search engine |
-
2000
- 2000-05-17 JP JP2000145098A patent/JP4027568B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2001325275A (ja) | 2001-11-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7054886B2 (en) | Method for maintaining people and organization information | |
US6523037B1 (en) | Method and system for communicating selected search results between first and second entities over a network | |
US6961902B2 (en) | Interactive system for and method of automating the generation of legal documents | |
JP3307625B2 (ja) | 電子掲示板システムおよびメールサーバー | |
US8438469B1 (en) | Embedded review and rating information | |
US8015194B2 (en) | Refining based on log content | |
US7849053B2 (en) | Coordination and tracking of workflows | |
EP2089817B1 (en) | Method and system for intelligent processing of electronic information | |
US20050222903A1 (en) | Rendering content-targeted ads with e-mail | |
US9002725B1 (en) | System and method for targeting information based on message content | |
US8095537B2 (en) | Log integrity verification | |
AU2001292747A1 (en) | Method and system for communicating selected search results between first and second entities over a network | |
US7970738B2 (en) | Always on and updated operation for document logs | |
JP2003091633A (ja) | 情報収集・管理システム、情報収集・管理装置、そのシステムの端末装置、収集情報を記録した記録媒体、収集情報を閲覧させる方法、これらのプログラム並びに該プログラムを格納した記録媒体 | |
JP2000155725A (ja) | 取引仲介システム、取引仲介管理方法、端末装置および情報送受信システム | |
JP2006099341A (ja) | 更新履歴生成装置及びプログラム | |
US20020099533A1 (en) | Data processing system for searching and communication | |
JP4027568B2 (ja) | インターネット上の複数の検索エンジンを使ってクリッピングサービスを行う情報処理装置 | |
EP1804180A1 (en) | Refining based on log content | |
JP2005122606A (ja) | 情報閲覧装置、情報閲覧システム、及び情報閲覧プログラム | |
US20030225842A1 (en) | Distribution of messages using an address book of a user | |
KR20030004653A (ko) | 실시간 웹검색을 통한 정보제공시스템 및 그 방법 | |
JP2003216639A (ja) | 情報配信システム、情報配信方法および情報配信プログラム | |
US20030212592A1 (en) | Internet-based system for gathering and providing contact information and distributing and receiving petitions | |
KR20000049986A (ko) | 이메일을 이용한 메세징 서비스 시스템 및 그 처리방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040622 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040823 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20040930 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20041026 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041130 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20050208 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20071010 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101019 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101019 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111019 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111019 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121019 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121019 Year of fee payment: 5 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121019 Year of fee payment: 5 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121019 Year of fee payment: 5 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131019 Year of fee payment: 6 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131019 Year of fee payment: 6 |
|
R370 | Written measure of declining of transfer procedure |
Free format text: JAPANESE INTERMEDIATE CODE: R370 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131019 Year of fee payment: 6 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131019 Year of fee payment: 6 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |