JP5552582B2 - コンテンツ検索装置 - Google Patents

コンテンツ検索装置 Download PDF

Info

Publication number
JP5552582B2
JP5552582B2 JP2008211301A JP2008211301A JP5552582B2 JP 5552582 B2 JP5552582 B2 JP 5552582B2 JP 2008211301 A JP2008211301 A JP 2008211301A JP 2008211301 A JP2008211301 A JP 2008211301A JP 5552582 B2 JP5552582 B2 JP 5552582B2
Authority
JP
Japan
Prior art keywords
keyword
category
book
content
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008211301A
Other languages
English (en)
Other versions
JP2010049372A (ja
Inventor
洋一 飯嶋
Original Assignee
株式会社G02
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社G02 filed Critical 株式会社G02
Priority to JP2008211301A priority Critical patent/JP5552582B2/ja
Publication of JP2010049372A publication Critical patent/JP2010049372A/ja
Application granted granted Critical
Publication of JP5552582B2 publication Critical patent/JP5552582B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、例えば、コンピュータネットワーク、電話回線などの通信手段を介して接続された、パーソナルコンピュータ、携帯端末などの端末装置から入力された情報に基づいて、書籍などのコンテンツを見つけ出すコンテンツ検索装置に関する。
現在、例えば、書籍、音楽、映画、ウェブサイトなどのコンテンツを見つけ出すことができるウェブサイト(以下、これを「検索サイト」という。)が、インターネット上に数多く存在する。
例えば、書籍の検索サイトは次のように書籍を見つけ出す。すなわち、書籍検索サイトは、コンピュータを書籍検索サイトとして機能させるためのプログラムおよびデータを、例えばサーバコンピュータで実行することにより実現される。このサーバコンピュータはインターネットに接続され、また、このサーバコンピュータは、書籍に関する情報を蓄積したデータベースが形成された記憶装置を備えている。以下、このサーバコンピュータを「書籍検索装置」という。
利用者が、インターネットに接続された、パーソナルコンピュータ、携帯端末などの端末装置を用いて、上記書籍検索装置に接続すると、書籍検索画面データが書籍検索装置から端末装置に送信され、これにより端末装置のモニタディスプレイには、書籍検索画面が表示される。この書籍検索画面中には、テキストを入力することができる入力欄および検索開始ボタンが配置されている。利用者が探し出したい書籍に係るキーワードを入力欄に入力し、検索開始ボタンをマウスでクリックすると、入力欄に入力されたキーワードが端末装置から書籍検索装置に送信され、書籍検索装置が、この送信されたキーワードを用いてデータベースを検索する。
書籍検索装置が有するデータベースには、書籍のタイトル、著者名、発行者名(例えば出版社名)、書籍の目次、発行者が作成した、書籍内容を紹介するための短い文章(以下、この短い文章を「書籍紹介文」という。)などの書籍情報が蓄積されている。書籍検索装置は、利用者が入力したキーワードと合致する文字列を含む書籍情報に対応する書籍のタイトルのリストを含む検索結果画面データを生成し、この検索結果画面データを書籍検索装置から端末装置に送信する。これにより、端末装置のモニタディスプレイには、検索結果画面が表示される。利用者は、この検索結果画面を見て、所望の書籍を探し出すことができる。
音楽、映画またはウェブサイトの検索装置も、上記書籍検索装置と同じような構成および動作により検索を実現している。
ところで、上述した従来の書籍検索装置では、利用者が入力したキーワードを用いて利用者が所望する書籍を正確に見つけ出すことができない場合がある。すなわち、利用者が入力したキーワードを用いて利用者が所望する書籍を見つけ出す正確さの程度を「検索精度」というとすれば、上述した従来の書籍検索装置は検索精度が高いとはいえない。
上述した従来の書籍検索装置では、利用者が入力したキーワードと合致する文字列を含む書籍情報に対応する書籍をリストアップする。そして、この書籍情報は、書籍のタイトル、著者名、発行者名、書籍の目次、書籍紹介文である。したがって、利用者が入力したキーワードが、利用者が所望する書籍のタイトル、著者名または発行者名に含まれる文字列と合致する場合には、検索精度が高まる。しかし、利用者が、書籍のタイトル、著者名、発行者名など、所望の書籍に関する具体的な情報を知らない場合には、書籍のタイトル、著者名または発行者名と合致するキーワードを入力するは困難であり、検索精度は低くなる。
また、書籍の目次、または書籍紹介文は、書籍の内容を端的に表現した文字列を含んでいる場合が多いとしても、書籍内容中のごく一部の情報を抽出しているにすぎず、また、ある1つの物事を表現する語は複数ある。このため、利用者が入力したキーワードが、書籍の目次または書籍紹介文に含まれる文字列と合致する可能性は低く、この結果、検索精度は低くなる。
また、利用者が、きわめて抽象的で上位概念を示すキーワードや、単一のきわめて短いキーワードを入力して検索を実行すると(例えば「投資信託」に関する書籍を見つけ出すために「金融」というキーワードを入力して検索を実行すると)、膨大な数の書籍がリストアップされてしまう場合がある。この場合には、所望の書籍を探し出すために、膨大な数の書籍タイトルが連なる書籍リストを精査する作業や、キーワードを追加しつつ検索を繰り返す作業など、煩雑な作業を利用者に強いることとなり、好ましくない。
一方、従来の書籍検索装置の中には、書籍の全文を書籍情報として蓄積しているものもある。確かに、このような書籍検索装置によれば、利用者が入力したキーワードが、利用者の所望する書籍全文のどこかに含まれていれば、その書籍がリストアップされるので、利用者が所望する書籍を確実に探し出すことができるとも思える。しかし、一般に書籍の全文には、その書籍のテーマとは関連性のない用語も多く含まれているため、利用者がキーワードを入力して検索を実行すると、利用者が所望する書籍の他に、利用者が所望する書籍とは関連性のない膨大な数の書籍がリストアップされてしまうことが多い。この結果、利用者は、膨大な数の書籍がリストアップされた書籍リストの中から所望の書籍を特定する作業や、キーワードを追加しつつ検索を繰り返す作業を行わなければならず、不便である。すなわち、書籍全文を対象とした単なるキーワード検索では、利用者が所望する書籍を、利用者が入力するキーワードにより適切に絞り込むことができず、検索効率が悪い。このような意味において、書籍全文を対象とした単なるキーワード検索は検索精度が高いとはいえない。
他方、現存する書籍検索装置の中には、カテゴリ(これをジャンルという場合もある。)により書籍の検索を行うものもある。しかし、このような書籍検索装置の検索精度は、実際上、高いとはいえない。この原因は、現存する書籍検索装置が、日本図書コードにおける分類コードに基づいて書籍のカテゴリを決めているためではないかと思われる。日本図書コードにおける分類コードは、書籍の発行者(例えば出版社)が任意に割り当てるため、この分類コードに基づく書籍のカテゴリは、書籍の内容に客観的に合致していない場合もあり得る。例えば、株式に関する書籍のカテゴリは、経済、経営、法律など複数考えられるが、1つの書籍に割り当てることができる分類コードは1つであるため、書籍の発行者は、経済、経営、法律などの複数のカテゴリの中から1つのカテゴリを任意に選択する。この任意の選択が適切でない場合には、分類コードに基づく書籍のカテゴリが、書籍の内容に客観的に合致しないといった事態が生じる。
また、書籍検索装置の場合と同様に、現存する、音楽、映画またはウェブサイトの検索装置についても、検索精度が高いとはいえないという問題がある。
本発明は例えば上述した問題に鑑みなされたものであり、本発明の課題は、コンテンツの検索精度を高めることができるコンテンツ検索装置を提供することにある。
上記課題を解決するために、本発明のコンテンツ検索装置は、コンテンツに含まれるまたはコンテンツを示すコンテンツキーワードを抽出し、抽出したコンテンツキーワードに対して重み付けを行い、前記コンテンツのタイトル、前記コンテンツキーワード、および前記コンテンツキーワードについての重み付けの程度を示す重み付け情報を相互に関連付けて記憶することにより形成されるコンテンツデータベースと、人為的手段により作成されたカテゴリと前記カテゴリに属するカテゴリキーワードとを相互に関連付けて記憶することにより形成されたカテゴリデータベースと、前記カテゴリデータベースに記憶されたカテゴリの中から任意のカテゴリを利用者に選択させるカテゴリ選択手段と、前記カテゴリ選択手段により利用者が選択したカテゴリに関連付けられたカテゴリキーワードを見つけ出すために前記カテゴリデータベースを検索するカテゴリキーワード検索手段と、前記カテゴリキーワード検索手段による検索によって見つけ出されたカテゴリキーワードを表示装置に表示し、前記表示装置に表示したカテゴリキーワードの中から任意のカテゴリキーワードを利用者に選択させるカテゴリキーワード選択手段と、前記カテゴリキーワード選択手段により利用者が選択したカテゴリキーワードに対応する前記コンテンツキーワードに関連付けられたコンテンツのタイトルと、当該コンテンツのタイトルに関連付けられたコンテンツキーワードの重み付け情報とを見つけ出すために前記コンテンツデータベースを検索するコンテンツタイトル検索手段と、前記コンテンツタイトル検索手段による検索によって見つけ出されたコンテンツのタイトルを、当該検索により見つけ出された重み付け情報が示す重み付けの程度が大きい順に前記表示装置に表示し、前記表示装置に表示したコンテンツのタイトルの中から任意のコンテンツのタイトルを利用者に選択させるコンテンツタイトル選択手段と、前記コンテンツタイトル選択手段により利用者が選択したコンテンツのタイトルに関連付けられたコンテンツキーワードを前記表示装置に表示するコンテンツキーワード表示手段とを備えている。
上記本発明のコンテンツ検索装置には、前記コンテンツキーワード表示手段により前記表示装置に表示されたコンテンツキーワードの中から任意のコンテンツキーワードを利用者に選択させるコンテンツキーワード選択手段を追加してもよい。この場合、前記コンテンツタイトル検索手段は、前記コンテンツキーワード選択手段により利用者が選択したコンテンツキーワードに関連付けられたコンテンツのタイトルを見つけ出すために前記コンテンツデータベースを検索し、前記コンテンツタイトル選択手段は、前記コンテンツタイトル検索手段による検索によって見つけ出されたコンテンツのタイトルを前記表示装置に表示する。
上述した本発明のコンテンツ検索装置には、複数のキーワード間の相互の関連性を記憶した関連キーワードデータベースと、任意のキーワードを利用者に入力させるキーワード入力手段と、前記キーワード入力手段により利用者が入力したキーワードと関連性を有する関連キーワードを見つけ出すために前記関連キーワードデータベースを検索する関連キーワード検索手段と、前記関連キーワード検索手段による検索によって見つけ出された関連キーワードを前記表示装置に表示し、前記表示装置に表示した関連キーワードの中から任意の関連キーワードを利用者に選択させる関連キーワード選択手段とを追加してもよい。この場合、前記コンテンツタイトル検索手段は、前記関連キーワード選択手段により利用者が選択した関連キーワードに対応するコンテンツキーワードに関連付けられたコンテンツのタイトルを見つけ出すために前記コンテンツデータベースを検索し、前記コンテンツタイトル選択手段は、前記コンテンツタイトル検索手段による検索によって見つけ出されたコンテンツのタイトルを前記表示装置に表示する。
上述した本発明のコンテンツ検索装置には、任意のキーワードを利用者に入力させるキーワード入力手段と、前記キーワード入力手段により利用者が入力したキーワードに対応する前記カテゴリキーワードに関連付けられた前記カテゴリを見つけ出すために前記カテゴリデータベースを検索するカテゴリ検索手段と、前記カテゴリ検索手段による検索によって見つけ出されたカテゴリを前記表示装置に表示するカテゴリ表示手段とを追加してもよい。
上述した本発明のコンテンツ検索装置には、前記コンテンツタイトル選択手段により利用者が選択したタイトルのコンテンツを購入する旨の指示を利用者に入力させる購入指示入力手段と、前記購入指示入力手段により前記コンテンツを購入する旨の指示を利用者が入力した場合に、前記カテゴリキーワード選択手段により利用者が選択したカテゴリキーワードに対応するコンテンツキーワードの重み付け情報が示す重み付けの程度を大きくする第1の重み付け変更手段とを追加してもよい。
上述した本発明のコンテンツ検索装置には、前記コンテンツタイトル選択手段により利用者が選択したタイトルのコンテンツにブックマークを付加する旨の指示を利用者に入力させるブックマーク付加指示入力手段と、前記ブックマーク付加指示入力手段により前記コンテンツにブックマークを付加する旨の指示を利用者が入力した場合に、前記カテゴリキーワード選択手段により利用者が選択したカテゴリキーワードに対応するコンテンツキーワードの重み付け情報が示す重み付けの程度を大きくする第2の重み付け変更手段とを追加してもよい。
上述した本発明によれば、コンテンツの検索精度を高めることができる。
以下、図面を参照しつつ、本発明の実施の形態について説明する。
(書籍検索システム)
図1は書籍検索システムを示している。図1中の書籍検索システム1は、書籍を検索するシステムである。書籍検索システム1は、本実施形態においては、一般の利用者に向けて、書籍検索サービスおよび書籍販売サービスを提供することを想定している。なお、書籍検索システム1は、図書館の従業員が館内の図書を管理するために用いることもでき、学校の職員が学校所有の図書を管理するたに用いることもでき、あるいは学術論文、技術文献、裁判例、議事録、政府刊行物などの検索システムとして用いることもできる。
書籍検索システム1は、書籍検索装置2、端末装置3および通信経路4を備えている。書籍検索装置2は、本発明のコンテンツ検索装置の実施形態であり、端末装置3からの入力に従って書籍を検索する装置である。書籍検索装置2は例えばサーバコンピュータである。端末装置3は、書籍検索システム1の利用者が書籍検索装置2に、所望の書籍を見つけ出すための種々の情報を入力するのに用いる装置である。端末装置3は例えばキーボードおよびマウスなどの入力装置およびモニタディスプレイなどの出力装置を有するパーソナルコンピュータである。なお、端末装置3は、ウェブコンテンツ閲覧機能を備えた携帯電話機などの携帯端末でもよい。通信経路4は例えばインターネットである。なお、通信経路4は、インターネット以外のコンピュータネットワークでもよいし、電話回線などの公衆回線でもよいし、専用回線でもよいし、有線、無線を問わない。書籍検索装置2と端末装置3は、通信経路4を介して相互に通信可能に接続されている。なお、通信経路4を介して書籍検索装置2に接続されている端末装置3は図1に示すように1台の場合もあり得るが、書籍検索装置2により一般の多くの利用者に書籍検索サービスまたは書籍販売サービスを提供する場合には、書籍検索装置2には通信経路4を介して複数の端末装置が接続される。
(書籍検索装置)
図1に示すように、書籍検索装置2は、制御部11、記憶部12、通信部13、操作部14および入出力部15を備え、これらの構成要素はバスを介して相互に接続されている。
制御部11は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)などを備えており、書籍検索装置2を制御し、後述のカテゴリ検索処理およびキーワード検索処理などを実行する。
記憶部12は、例えばハードディスクなどの不揮発性の記憶装置である。記憶部12には、書籍データベース16、カテゴリデータベース17および関連キーワードデータベース18が形成されている。
通信部13は、書籍検索装置2と端末装置3との間で相互通信を実現するための通信インタフェース回路を備えている。
操作部14は、データベース16、17、18の形成を行うための指示や情報などを書籍検索装置2に入力するために作業者が利用するキーボードおよびマウスなどの入力装置、および書籍検索装置2に関する情報などを表示するためのモニタディスプレイなどの出力装置を備えている。
入出力部15は、書籍内容のテキストデータなどを書籍検索装置2に対して入力するためのディスクドライブ装置、書籍検索装置2と他の装置とをローカルに接続するためのインタフェース機構などを備えている。
図2は制御部11の内部構造を示している。図2に示すように、制御部11の構成要素は、データベース形成セクション21、入出力制御・検索セクション22および基本制御セクション23に分かれている。
データベース形成セクション21は、書籍データベース16、カテゴリデータベース17または関連キーワードデータベース18を形成する機能を実現するための構成要素が属するセクションである。データベース形成セクション21には、書籍データ生成部25、カテゴリデータ生成部26、関連キーワードデータ生成部27および重み付け変更部28が属する。
入出力制御・検索セクション22は、利用者により端末装置3を介して入力される種々の情報に従って後述のカテゴリ検索処理またはキーワード検索処理を実行し、これらの検索に必要な情報および検索結果などを端末装置3に向けて出力する機能を実現するための構成要素が属するセクションである。入出力制御・検索セクション22には、カテゴリ選択部31、カテゴリキーワード検索部32、カテゴリキーワード選択部33、書籍タイトル検索部34、書籍タイトル選択部35、書籍キーワード表示・選択部36、キーワード入力制御部37、関連キーワード検索部38、関連キーワード選択部39、購入指示入力制御部40、ブックマーク付加指示入力制御部41およびカテゴリ検索部42が属する。
基本制御セクション23は、書籍検索装置2の基本的な動作、または他のセクション21、22に属する構成要素により実現される機能以外の機能を実現するための構成要素が属するセクションである。基本制御セクション23には、通信部13と協働し、書籍検索装置2と端末装置3との間における通信を制御する通信制御部45、および書籍検索装置2を総合的に制御する総合制御部46が属する。
制御部11のROMには、これらセクション21、22および23に属する構成要素25ないし28、31ないし42、45および46として制御部11を機能させるためのコンピュータプログラムが記憶されており、制御部11のCPUは、これらROMに記憶されたコンピュータプログラムを実行することにより、これら構成要素として制御部11を機能させる。制御部11のRAMは、制御部11のCPUが上記コンピュータプログラムを実行するときの作業メモリとして用いられる。
(書籍データベース)
図3は、書籍データベース16の具体的な内容を示している。書籍データベース16は、例えば次のように形成される。まず、作業者が、書籍の主要なページまたは全ページに印刷された情報(文字、図、写真などの画像)をスキャナで読み取り、読み取った情報を、例えば光学式文字読取装置(OCR)を用いてテキストデータに変換する。そして、作業者は、このテキストデータを、入出力部15を介して書籍検索装置2に入力する。
続いて、書籍データ生成部25が、形態素分析などの周知のテキストマイニングの手法を用いて、このテキストデータから書籍キーワード(所定の文字数以内の文字列)を抽出する。
続いて、書籍データ生成部25は、書籍から抽出した各書籍キーワードに対して重み付けを行い、各書籍キーワードの重み付けの程度を示す重み付け情報を生成する。書籍キーワードの重み付けは、周知のテキストマイニングの手法を用いて行う。具体的には、書籍におけるキーワードの出現頻度(出現率)を対数化して重み付けを算出し、文書正規化(コサイン正規化)およびピボット正規化を行う。また、ベクトル空間モデル解析を用いて書籍キーワードの重み付けを行ってもよい。重み付け情報は例えば各書籍キーワードの重み付けの程度を示す数値であり、その数値は重み付けの程度が大きいほど大きくなる。
続いて、書籍データ生成部25は、書籍から抽出した書籍キーワードのうち、重み付けの程度が所定の程度以上の書籍キーワードを書籍主要キーワードとして選定する。そして、書籍データ生成部25は、書籍から抽出した書籍主要キーワードのうち、重み付けの程度が所定の程度よりも小さく、かつ書籍主要キーワードに関連する書籍キーワードを書籍関連キーワードとして選定する。また、書籍データ生成部25は、書籍から抽出した書籍キーワードのうち、重み付けの程度が所定の程度よりも小さく、かついずれの書籍主要キーワードにも関連しない書籍キーワードを書籍非関連キーワードとして選定する。書籍キーワード間の関連性の解析には、周知のテキストマイニングの手法を用いる。
続いて、書籍データ生成部25は、書籍のタイトルと、書籍の著者名、発行者名(例えば出版社名)、価格などのデータである書誌データと、書籍主要キーワードと、書籍主要キーワードについての重み付け情報と、選定した書籍関連キーワード(書籍関連キーワード群)と、選定した書籍非関連キーワード(書籍非関連キーワード群)とを相互に関連付け、これらを図3に示すように書籍ごとに整理して記憶部12に記憶する。なお、書籍データベース16において、各書籍における書籍主要キーワードは、重み付けの程度が大きい順に配列することが望ましい。また、書誌データには、書籍の目次、発行者が作成した、書籍内容を紹介するための短い文章(書籍紹介文)などを含めてもよい。
書籍データベース16の形成は、書籍検索システム1による書籍検索サービスまたは書籍販売サービスの提供を開始する前に行われる。また、書籍データベース16の形成には、書籍データベース16の更新も含まれる。この意味の書籍データベース16の形成は、書籍検索システム1による書籍検索サービスまたは書籍販売サービスの提供を開始した後(例えば新たな書籍が発行されたときなど)にも行われる。カテゴリデータベース17の形成時期、および関連キーワードデータベース18の形成時期についても同様である。
書籍データベース16において、各書籍における各書籍主要キーワードの重み付け情報が示す重み付けの程度は、利用者が当該書籍を購入したこと、または利用者が当該書籍にブックマークを付加したことにより大きくなる。すなわち、図2中の重み付け変更部28は、購入指示入力制御部40により書籍を購入する旨の指示を利用者が入力した場合、またはブックマーク付加指示入力制御部41により書籍にブックマークを付加する旨の指示を利用者が入力した場合に、カテゴリキーワード選択部33により利用者が選択したカテゴリキーワードに対応する、書籍データベース16中の書籍主要キーワードの重み付け情報が示す重み付けの程度を大きくする。
(カテゴリデータベース)
図4はカテゴリデータベース17の具体的な内容を示している。カテゴリデータベース17は、例えば次のように形成される。まず、作業者が人為的手段によりカテゴリを作成する。カテゴリは、本実施形態では、大分類、中分類および小分類の3層の階層構造である。作業者は、大分類のカテゴリ、中分類のカテゴリおよび小分類のカテゴリ、大分類のカテゴリと中分類のカテゴリとの従属関係、並びに中分類のカテゴリと小分類のカテゴリとの従属関係をそれぞれ自ら考えて決める。続いて、作業者は、小分類のカテゴリに属するカテゴリキーワードを自ら考えて決める。
続いて、作業者は、操作部14を操作し、大分類のカテゴリ、中分類のカテゴリおよび小分類のカテゴリを、大分類のカテゴリと中分類のカテゴリとの従属関係および中分類のカテゴリと小分類のカテゴリとの従属関係を指定しながら、書籍検索装置2に入力する。さらに、作業者は、操作部14を操作し、各小分類のカテゴリに属するカテゴリキーワードを書籍検索装置2に入力する。
カテゴリデータ生成部26は、作業者による入力に従って、大分類のカテゴリ、中分類のカテゴリ、小分類のカテゴリ、カテゴリキーワード、大分類のカテゴリと中分類のカテゴリとの従属関係、中分類のカテゴリと小分類のカテゴリとの従属関係、小分類のカテゴリとカテゴリキーワードとの相互の関連付けを、図4に示すように整理して記憶部12に記憶する。
カテゴリデータベース17におけるカテゴリデータの一例は次の通りである。すなわち、大分類のカテゴリが「金融」である場合、この大分類のカテゴリに従属する中分類のカテゴリは、「政治・法律・制度」、「日銀・金融政策」、「国際/金融全般仕組み・制度」、「国内/金融全般仕組み・制度」、「金融機関」、「市場別/投資・仕組み・取引・理論」、「長期金融市場」などである。これら中分類のカテゴリのうち、「長期金融市場」に従属する小分類のカテゴリは、「債券市場」、「株式市場」などである。これら小分類のカテゴリのうち、「債券市場」に関連付けられたカテゴリキーワードは、「国債借り換え」、「国債整理基金」、「国債定期口座」、「国債満期構成」、「コンベンショナル方式」、「債券オペレーション」、「ジャンク・ボンド」、「私募債」などである。
なお、カテゴリの階層構造における階層数は3層に限らない。また、カテゴリの構造として階層構造以外の構造を採用してもよい。
(関連キーワードデータベース)
図5は関連キーワードデータベース18の具体的な内容を示している。関連キーワードデータベース18は、例えば次のように形成される。まず、関連キーワードデータ生成部27が、書籍データベース16から書籍主要キーワードおよび書籍関連キーワードを抽出し、カテゴリデータベース17からカテゴリキーワードを抽出する。続いて、関連キーワードデータ生成部27は、抽出した各キーワード間の相互の関連性を、書籍データベース16における書籍主要キーワードと書籍関連キーワードとの関連性、およびカテゴリデータベース17におけるカテゴリキーワードの分類(小分類とカテゴリキーワードとの関連付け)に基づいて分析する。続いて、関連キーワードデータ生成部27は、抽出した各キーワード間の相互の関連性を記憶部12に記憶する。具体的には、関連キーワードデータ生成部27は、図5に示すように、各キーワードと関連性を有する他のキーワード(関連キーワード群)とを関連付けて記憶部12に記憶する。また、各関連キーワード群に属する各関連キーワードには、当該関連キーワードが属するカテゴリ(代表的な小分類のカテゴリ)を示す情報が付加されている。
(カテゴリ検索)
図6は書籍検索装置2におけるカテゴリ検索処理を示している。利用者が端末装置3を操作し、カテゴリ検索を行う旨の指示を入力すると、その指示が端末装置3から書籍検索装置2に送信され、書籍検索装置2においてカテゴリ検索処理が開始される。
図6中のカテゴリ検索処理において、まず、制御部11のカテゴリ選択部31が、カテゴリデータベース17に記憶されたカテゴリの中から任意のカテゴリを利用者に選択させる(ステップS1、S2)。
具体的には、カテゴリ選択部31は、大分類のカテゴリをカテゴリデータベース17から読み出し、読み出した大分類のカテゴリのリストを含む大分類カテゴリ選択画面データを生成し、この大分類カテゴリ選択画面データを端末装置3に送信する。これにより、端末装置3のモニタディスプレイには、図8に示すような大分類カテゴリ選択画面が表示される。この大分類カテゴリ選択画面中には、大分類カテゴリリスト51が配置されている。大分類カテゴリリスト51において、各カテゴリ名の左側にはラジオボタン52が形成されている。また、大分類カテゴリ選択画面中において大分類カテゴリリスト51の下側には、カテゴリ選択確定ボタン(「次へ」のボタン)53が配置されている。利用者は、端末装置3のマウスを操作して、ラジオボタン52をクリックすることにより、大分類のカテゴリを選択することができる。利用者がマウスを操作して所望のカテゴリを選択した後、カテゴリ選択確定ボタン53をクリックすると、利用者が選択した大分類のカテゴリを示す情報が、カテゴリ選択入力として端末装置3から書籍検索装置2に送信される。カテゴリ選択部31はこのカテゴリ選択入力を受信する。
利用者が選択した大分類カテゴリを示すカテゴリ選択入力をカテゴリ選択部31が受信したとき、カテゴリ選択部31は、続いて、当該カテゴリ選択入力が示す大分類のカテゴリに属する中分類のカテゴリをカテゴリデータベース17から読み出し、読み出した中分類のカテゴリのリストを含む中分類カテゴリ選択画面データを生成し、この中分類カテゴリ選択画面データを端末装置3に送信する。これにより、端末装置3のモニタディスプレイには、図9に示すような中分類カテゴリ選択画面が表示される。この中分類カテゴリ選択画面中には、中分類カテゴリリスト54が配置されている。中分類カテゴリリスト54において、各カテゴリ名の左側にはラジオボタン55が形成されている。また、中分類カテゴリ選択画面中において中分類カテゴリリスト54の下側には、カテゴリ選択確定ボタン(「次へ」のボタン)56が配置されている。利用者は、端末装置3のマウスでラジオボタン55をクリックすることにより、中分類のカテゴリを選択することができる。利用者がマウスを操作して所望のカテゴリを選択した後、カテゴリ選択確定ボタン56をクリックすると、利用者が選択した中分類のカテゴリを示す情報が、カテゴリ選択入力として端末装置3から書籍検索装置2に送信される。カテゴリ選択部31はこのカテゴリ選択入力を受信する。
利用者が選択した中分類カテゴリを示すカテゴリ選択入力をカテゴリ選択部31が受信したとき、カテゴリ選択部31は、当該カテゴリ選択入力が示す中分類のカテゴリに属する小分類のカテゴリをカテゴリデータベース17から読み出し、読み出した小分類のカテゴリのリストを含む小分類カテゴリ選択画面データを生成し、この小分類カテゴリ選択画面データを端末装置3に送信する。これにより、端末装置3のモニタディスプレイには、図10に示すような小分類カテゴリ選択画面が表示される。この小分類カテゴリ選択画面中には、小分類カテゴリリスト57が配置されている。小分類カテゴリリスト57において、各カテゴリ名の左側にはラジオボタン58が形成されている。また、小分類カテゴリ選択画面中において小分類カテゴリリスト57の下側には、カテゴリ選択確定ボタン(「次へ」のボタン)59が配置されている。利用者は、端末装置3のマウスでラジオボタン58をクリックすることにより、小分類のカテゴリを選択することができる。利用者がマウスを操作して所望のカテゴリを選択した後、カテゴリ選択確定ボタン59をクリックすると、利用者が選択した小分類のカテゴリを示す情報が、カテゴリ選択入力として端末装置3から書籍検索装置2に送信される。カテゴリ選択部31はこのカテゴリ選択入力を受信する。
利用者が選択した小分類のカテゴリを示すカテゴリ選択入力をカテゴリ選択部31が受信したとき(ステップS2:YES)、続いて、カテゴリキーワード検索部32が、ステップS2において利用者が選択した小分類のカテゴリに関連付けられたカテゴリキーワードを見つけ出すためにカテゴリデータベース17(図4参照)を検索する(ステップS3)。
続いて、カテゴリキーワード選択部33が、ステップS3における検索により見つけ出されたカテゴリキーワードを端末装置3のモニタディスプレイに表示する(ステップS4)。そして、カテゴリキーワード選択部33は、端末装置3のモニタディスプレイに表示したカテゴリキーワードの中から任意のカテゴリキーワードを利用者に選択させる(ステップS5)。
具体的には、カテゴリキーワード選択部33は、ステップS3における検索により見つけ出されたカテゴリキーワードのリストを含むカテゴリキーワード選択画面データを生成し、このカテゴリキーワード選択画面データを端末装置3に送信する。これにより、端末装置3のモニタディスプレイに、図11に示すようなカテゴリキーワード選択画面が表示される。カテゴリキーワード選択画面中にはカテゴリキーワードリスト60が配置されている。カテゴリキーワードリスト60において、各カテゴリキーワードの左側にはチェックボックス61が形成されている。また、カテゴリキーワード選択画面中においてカテゴリキーワードリスト60の下側には、カテゴリキーワード選択確定ボタン(「次へ」のボタン)62が配置されている。利用者は、端末装置3のマウスでチェックボックス61をクリックすることにより、カテゴリキーワードを選択することができる。利用者がマウスを操作して所望のカテゴリキーワードを選択した後、カテゴリキーワード選択確定ボタン62をクリックすると、利用者が選択したカテゴリキーワードを示す情報が、カテゴリキーワード選択入力として端末装置3から書籍検索装置2に送信される。カテゴリキーワード選択部33はこのカテゴリキーワード選択入力を受信する。
利用者が選択したカテゴリキーワードを示すカテゴリキーワード選択入力をカテゴリキーワード選択部33が受信したとき(ステップS5:YES)、続いて、書籍タイトル検索部34が、ステップS5において利用者が選択したカテゴリキーワードに対応する書籍主要キーワードに関連付けられた書籍のタイトルと、当該書籍のタイトルに関連付けられた書籍キーワードの重み付け情報とを見つけ出すために書籍データベース16(図3参照)を検索する(ステップS6)。カテゴリキーワードに対応する書籍主要キーワードとは、本実施形態では、カテゴリキーワードに完全に一致する書籍主要キーワード、またはカテゴリキーワードの全部を一部分として含む書籍主要キーワードである。
続いて、書籍タイトル選択部35が、ステップS6における検索により見つけ出された書籍のタイトルを、ステップS6における検索により見つけ出された重み付け情報が示す重み付けの程度が大きい順に、端末装置3のモニタディスプレイに表示する(ステップS7)。そして、書籍タイトル選択部35は、書籍タイトル検索部35により端末装置3のモニタディスプレイに表示された書籍のタイトルの中から任意の書籍のタイトルを利用者に選択させる(ステップS8)。
具体的には、書籍タイトル選択部35は、ステップS6における検索により見つけ出された書籍のタイトルを、ステップS6における検索により見つけ出された重み付け情報が示す重み付けの程度(重み付けの程度を示す数値)が大きい順に配列した書籍タイトルリストを含む書籍タイトル選択画面データを生成し、この書籍タイトル選択画面データを端末装置3に送信する。これにより、端末装置3のモニタディスプレイには、図12に示すような書籍タイトル選択画面が表示される。この書籍タイトル選択画面中には、書籍タイトルリスト63が配置されている。書籍タイトルリスト63において、各書籍タイトルの左側にはチェックボックス64が形成されている。また、書籍タイトル選択画面中において書籍タイトルリスト63の下側には、書籍タイトル選択確定ボタン(「次へ」のボタン)65が配置されている。利用者は、端末装置3のマウスでチェックボックス64をクリックすることにより、書籍タイトルを選択することができる。利用者がマウスを操作して所望の書籍タイトルを選択した後、書籍タイトル選択確定ボタン65をクリックすると、利用者が選択した書籍タイトルを示す情報(または利用者が選択した書籍を特定する情報)が、書籍タイトル選択入力として端末装置3から書籍検索装置2に送信される。書籍タイトル選択部35はこの書籍タイトル選択入力を受信する。
利用者が選択した書籍タイトルを示す書籍タイトル選択入力を書籍タイトル選択部35が受信したとき(ステップS8:YES)、続いて、書籍キーワード表示・選択部36が、ステップS8において利用者が選択した書籍のタイトルに関連付けられた書籍キーワードを、当該書籍のタイトルおよび当該書籍の書誌データと共に、端末装置3のモニタディスプレイに表示する(ステップS9)。そして、書籍キーワード表示・選択部36は、端末装置3のモニタディスプレイに表示した書籍キーワードの中から任意の書籍キーワードを利用者が選択することができる状態にする(ステップS10)。これと同時に、ブックマーク付加指示入力制御部41は、利用者が選択したタイトルの書籍にブックマークを付加する旨の指示を利用者が入力することができる状態にする(ステップS11)。さらにこれと同時に、購入指示入力制御部40は、利用者が選択したタイトルの書籍を購入する旨の指示を利用者が入力することができる状態にする(ステップS14)。
具体的には、書籍キーワード表示・選択部36は、ステップS8において利用者が選択した書籍のタイトル、および当該書籍の書誌データ(例えば著者名、発行者名および価格)を書籍データベース16から読み出す。また、書籍キーワード表示・選択部36は、ステップS8において利用者が選択した書籍に関連付けられた書籍主要キーワード、当該書籍タイトルに関連付けられた重み付け情報、および当該書籍タイトルに関連付けられた書籍関連キーワード(書籍関連キーワード群)を見つけ出すために、書籍データベース16を検索する。そして、書籍キーワード表示・選択部36は、書籍データベース16から読み出した書籍のタイトル、書誌データ、および検索により見つけ出した書籍主要キーワードおよび書籍関連キーワードのリストを含む書籍情報画面データを生成し、この書籍情報画面データを端末装置3に送信する。これにより、端末装置3のモニタディスプレイには、図13に示すような書籍情報画面が表示される。
書籍情報画面中には、図13に示すように、利用者が選択した書籍のタイトル、著者名、発行者名および価格が表示されている。また、この書籍情報画面中には、書籍キーワードリスト66が表示されている。この書籍キーワードリスト66中には、当該書籍に関連付けられた書籍主要キーワード(リテール、決済、資産、バリューチェーン、セキュリティ、…)が、これら書籍主要キーワードの重み付け情報が示す重み付けの程度が大きい順に縦方向に配列され、さらに、当該書籍に関連付けられた書籍関連キーワード(ワンストップ、マーケティング、融資、クレジットカード、手数料、資産運用サービス、垂直統合、コミュニティ、クラッキング、フィッシング、…)が、それぞれ対応する書籍主要キーワードの右側に横方向に配列されている。書籍主要キーワードの左側の星印(★)の数は、書籍主要キーワードの重み付けの程度を示している。星印の数が多いほど、書籍主要キーワードの重み付けの程度が大きい。また、書籍キーワードリスト66中の書籍キーワード(書籍主要キーワードおよび書籍関連キーワード)は、それぞれハイパーテキストにより記述されている。利用者は、端末装置3のマウスを操作して、書籍キーワードをクリックすることにより、書籍キーワードを選択することができる。利用者がマウスを操作して所望の書籍キーワードを選択すると、利用者が選択した書籍キーワードを示す情報が、書籍キーワード選択入力として端末装置3から書籍検索装置2に送信される。書籍検索装置2の書籍キーワード表示・選択部36はこの書籍キーワード選択入力を受信する。
また、図13に示すように、書籍情報画面中において、書籍キーワードリスト66の下側には、ブックマーク付加指示入力ボタン67が配置されている。利用者がマウスを操作してブックマーク付加指示入力ボタン67をクリックすると、利用者が選択した書籍、すなわち書籍情報画面に表示されている書籍にブックマークを付加すべき旨の指示が、ブックマーク付加指示入力として端末装置3から書籍検索装置2に送信される。書籍検索装置2のブックマーク付加指示入力制御部41はこのブックマーク付加指示入力を受信する。
また、書籍情報画面中において、書籍キーワードリスト66の下側には、購入指示入力ボタン68が配置されている。利用者がマウスを操作して購入指示入力ボタン68をクリックすると、利用者が選択した書籍、すなわち書籍情報画面に表示されている書籍を購入すべき旨の指示が、購入指示入力として端末装置3から書籍検索装置2に送信される。書籍検索装置2の購入指示入力制御部40はこの購入指示入力を受信する。
さらに、書籍情報画面中において、書籍キーワードリスト66の下側には、検索終了指示入力ボタン69が配置されている。利用者がマウスを操作して検索終了指示入力ボタン69をクリックすると、カテゴリ検索処理を終了すべき旨の指示が端末装置3から書籍検索装置2に送信される。書籍検索装置2の総合制御部46はこの指示を受信する。
ステップS10において、利用者が選択した書籍キーワードを示す書籍キーワード選択入力を書籍キーワード表示・選択部36が受信したとき(ステップS10:YES)、続いて、書籍タイトル検索部34が、ステップS10において利用者が選択した書籍キーワードに関連付けられた書籍のタイトルを見つけ出すために書籍データベース16を検索し(ステップS6)、当該検索により見つけ出した書籍のタイトルを端末装置3のモニタディスプレイに表示する(ステップS7)。
ステップS11において、ブックマーク付加指示入力をブックマーク付加指示入力制御部41が受信したとき(ステップS11:YES)、ブックマーク付加指示入力制御部41は、利用者が選択した書籍にブックマークを付加する(ステップS12)。続いて、重み付け変更部28が、カテゴリキーワード選択部33により利用者が選択したカテゴリキーワードに対応する書籍キーワードの重み付け情報が示す重み付けの程度を大きくする(ステップS13)。具体的には、重み付け変更部28は、当該重み付け情報が示す重み付けの程度を大きくなるように、書籍データベース16における当該重み付け情報を書き換える。
ステップS14において、購入指示入力を購入指示入力制御部40が受信したとき(ステップS14:YES)、購入指示入力制御部40は、利用者が選択した書籍について購入処理(利用者の特定、商品の受け渡し方法および代金の支払い方法などの決定などを行う処理)を実行する(ステップS15)。続いて、重み付け変更部28が、カテゴリキーワード選択部33により利用者が選択したカテゴリキーワードに対応する書籍キーワードの重み付け情報が示す重み付けの程度を大きくする(ステップS16)。具体的には、重み付け変更部28は、当該重み付け情報が示す重み付けの程度を大きくなるように、書籍データベース16における当該重み付け情報を書き換える。
ステップS17において、カテゴリ検索処理を終了すべき旨の指示を総合制御部46が受信したとき(ステップS17:YES)、総合制御部46はカテゴリ検索処理を終了させる。
(キーワード検索)
図7は書籍検索装置2におけるキーワード検索処理を示している。利用者が端末装置3を操作し、キーワード検索を行う旨の指示を入力すると、その指示が端末装置3から書籍検索装置2に送信され、書籍検索装置2においてキーワード検索処理が開始される。
図7中のキーワード検索処理において、まず、制御部11のキーワード入力制御部37が、任意のキーワードを利用者に入力させる(ステップS21ないしS23)。
具体的には、キーワード入力制御部37は、キーワード入力画面データを生成し、このキーワード入力画面データを端末装置3に送信する。これにより、端末装置3のモニタディスプレイに、図14に示すようなキーワード入力画面が表示される(ステップS21)。キーワード入力画面中には、キーワード入力欄70が配置されている。利用者は、端末装置3のキーボードおよびマウスを操作し、所望のキーワードを、キーワード入力欄70に入力することができる(ステップS22)。さらに、利用者は、キーワードをキーワード入力欄70に一度入力した後に、別のキーワードを追加することも可能である(ステップS23、S24)。
利用者によりキーワード入力欄70に少なくとも1つのキーワードが入力された後(ステップS22:YES)、利用者がキーワード入力画面中に配置されたカテゴリ表示ボタン71をマウスでクリックすると(ステップS25:YES)、カテゴリ表示指示入力と、キーワード入力欄70に入力されているキーワード(テキストデータ)とが端末装置3から書籍検索装置2に送信される。キーワード入力制御部37はカテゴリ表示指示入力およびキーワードを受信し、続いて、カテゴリ検索部42は、キーワード入力欄70に入力されたキーワードに対応するカテゴリキーワードに関連付けられたカテゴリを見つけ出すために、カテゴリデータベース17を検索する。そして、カテゴリ検索部42は、検索により見つけ出されたカテゴリ(小分類のカテゴリ)のリストを含むフォーム74を生成し、このフォーム74を表示するためのデータを端末装置3に送信する。これにより、図15に示すように、端末装置3のモニタディスプレイには、検索により見つけ出されたカテゴリのリストを含むフォーム74が表示される(ステップS26)。カテゴリ検索部42の検索により複数のカテゴリが見つけ出された場合には、複数のカテゴリが表示される。また、複数のキーワードがキーワード入力欄70に入力されている場合には、これら複数のキーワードについてカテゴリの検索が行われ、これら複数のキーワードにそれぞれ対応するカテゴリキーワードのすべてと関連付けのあるカテゴリ(これら複数のキーワードにそれぞれ対応するカテゴリキーワードのうちのいずれかのカテゴリキーワードと関連付けのあるカテゴリを加えてもよい。)がフォーム74中に表示される。なお、フォーム74中に表示されたカテゴリを利用者がマウスなどで指定したときには、カテゴリ検索処理(図6中のステップS3)に移行してもよい。
続いて、利用者によりキーワード入力欄70に少なくとも1つのキーワードが入力され(ステップS22:YES)、キーワード入力画面中に関連キーワードリスト75(図16参照)がまだ表示されていない状態で(ステップS27:NO)、利用者がキーワード入力画面中に配置された関連キーワード表示ボタン72をマウスでクリックすると(ステップS28:YES)、関連キーワード表示指示入力と、キーワード入力欄70に入力されているキーワード(テキストデータ)とが端末装置3から書籍検索装置2に送信される。キーワード入力制御部37は関連キーワード表示指示入力およびキーワードを受信し、続いて、関連キーワード検索部38は、キーワード入力制御部37により受信されたキーワードに関連する関連キーワードを見つけ出すために、関連キーワードデータベース18を検索する(ステップS29)。そして、関連キーワード選択部39は、検索により見つけ出された関連キーワード、およびこの関連キーワードが属するカテゴリ(代表的な小分類のカテゴリ)を関連キーワードデータベース18から読み出し、これらを配列したリスト75を生成し、この関連キーワードリスト75を端末装置3に送信する。これにより、図16に示すように、端末装置3のモニタディスプレイに表示されているキーワード入力画面中に、関連キーワードリスト75が表示される(ステップS30)。続いて、関連キーワード選択部39は、端末装置3のモニタディスプレイに表示した関連キーワードの中から任意の関連キーワードを利用者が選択することができる状態にする(ステップS31)。
関連キーワードリスト75中に配列された関連キーワードは、ハイパーテキストにより記述されている。利用者が端末装置3のマウスで関連キーワードをクリックすることにより、関連キーワードを選択すると(ステップS31:YES)、利用者によりクリックされた関連キーワードがキーワード入力欄70に自動的に追加入力される(ステップS32)。
また、キーワード入力欄70に少なくとも1つのキーワードを入力し、または利用者が関連キーワードを選択した後、利用者がキーワード入力画面中に配置されたキーワード入力確定ボタン(「確定」のボタン)73をクリックすると、利用者により入力されたキーワード(具体的には、利用者がキーワード入力欄70に直接入力したキーワード、および利用者が関連キーワードを選択したことによりキーワード入力欄70に追加入力されたキーワード)を示す入力キーワード情報が、端末装置3から書籍検索装置2に送信される。この入力キーワード情報は書籍検索装置2のキーワード入力制御部37により受信される(ステップS33:YES)。
利用者がキーワード入力確定ボタン73をクリックし、これにより端末装置3から送信された入力キーワード情報をキーワード入力制御部37が受信した後の処理は、図6中のステップS6ないしS17とほぼ同じである。もっとも、キーワード検索処理の場合、ステップS6において、書籍タイトル検索部34は、利用者がキーワード入力欄70に入力したキーワードおよび利用者が関連キーワードリスト75中から選択した関連キーワードに対応する書籍キーワードに関連付けられた書籍のタイトルを見つけ出すために書籍データベース16を検索する。
以上、説明した通り、書籍検索装置2は、利用者が選択または入力したキーワードに基づいて、書籍データベース16を検索し、この検索により見つけ出した書籍タイトルを端末装置3のモニタディスプレイに表示する。書籍データベース16には、図3に示すように、各書籍の主要なページまたは全ページに印刷された情報からテキストマイニングの手法により抽出した豊富な書籍主要キーワードが記憶されている。これら書籍主要キーワードは、各書籍の主要なページまたは全ページに印刷された情報から抽出されたキーワードのうち、重み付けの程度が所定の程度以上のキーワードである。すなわち、書籍検索装置2は、書籍の主要なページまたは全ページに含まれる膨大な数のキーワードのうち、重み付けの程度が大きいキーワードに基づいて書籍の検索を行う。この点で、本発明の実施形態である書籍検索装置2は、書籍の全文を対象とした単なるキーワード検索(つまり書籍全文から抽出したキーワードについて重み付けをせず、書籍全文から抽出したすべてのキーワードを検索の対象とするキーワード検索)を行う従来の書籍検索装置とは異なる。これにより、利用者が選択または入力したキーワードに基づく検索の結果として表示される書籍タイトルは、いずれも利用者が所望する書籍およびその書籍と関連性のある書籍のタイトルである。すなわち、利用者が所望する書籍とは関連性のない書籍のタイトルが表示される可能性は低い。したがって、利用者は、所望する書籍のタイトルを高精度にかつ効率よく見つけ出すことができる。
また、書籍データベース16には、図3に示すように、各書籍主要キーワードの重み付けの程度を示す重み付け情報が記憶されている。そして、書籍検索装置2は、利用者が選択または入力したキーワードに基づいて見つけ出した書籍タイトルを、利用者が選択または入力したキーワードに対応する書籍主要キーワードの重み付けの程度が大きい順に端末装置3のモニタディスプレイに表示する(図12中の書籍タイトルリスト63参照)。これにより、書籍のタイトルを、利用者が希望に合致する程度が大きい順に表示することができる。したがって、端末装置3のモニタディスプレイを見ることにより、利用者は所望の書籍のタイトルを容易かつ迅速に発見することができる。
また、書籍検索装置2は、カテゴリ検索処理において、利用者が選択したカテゴリに関連付けられたカテゴリキーワードを端末装置3のモニタディスプレイに表示し、利用者にカテゴリキーワードを選択させ、利用者が選択したカテゴリキーワードに基づいて、利用者が所望する書籍のタイトルを見つけ出す(図8ないし図11参照)。これにより、利用者は、自分が所望する書籍のタイトル、著者名、発行者名、当該書籍に実際に用いられているキーワードを知らなくても、自分が求める情報のカテゴリおよびキーワードを概ね把握していれば、自分が所望する書籍を、書籍検索装置2を用いて容易にかつ高精度に探し出すことができる。すなわち、カテゴリ検索処理において、書籍検索装置2は、カテゴリに基づく検索キーワード(つまりカテゴリキーワード)の絞り込みを自動的に行う。この検索キーワードの自動的な絞り込みが、利用者の検索作業を効果的に支援し、書籍検索の容易性、効率性および精度を向上させているのである。
また、書籍検索装置2が有するカテゴリデータベース17の各カテゴリは、コンピュータによる分類処理ではなく、人為的手段により作成する。これにより、利用者が書籍を容易にかつ正確に選択することができるカテゴリを作成することができる。そして、このような人為的手段により作成されたカテゴリを用いることにより、高精度なカテゴリ検索処理を実現することが可能になる。
また、書籍検索装置2では、利用者が選択または入力したキーワードに基づいて見つけ出した書籍に関連付けられたキーワード、すなわち当該書籍からテキストマイニングの手法により抽出された書籍主要キーワードおよび書籍関連キーワードを書籍情報画面中に表示する(図13参照)。これにより、利用者は、検索の結果見つけ出された書籍の内容を、書籍情報画面中に表示された書籍主要キーワードおよび書籍関連キーワードに基づいて容易かつ正確に把握することができ、検索の結果見つけ出された書籍が、利用者の所望する書籍か否かを容易かつ正確に判断することができる。特に、書籍情報画面中には、書籍から抽出したキーワードのうち重み付けの程度が大きい書籍主要キーワードと、書籍から抽出したキーワードのうち重み付けの程度が小さい書籍関連キーワードとが、両者を識別することができると共に、両者の関連性(対応関係)を認識することができるように配列されている。これにより、利用者は、検索の結果見つけ出された書籍の内容を正確に判断することができる。
また、書籍検索装置2によれば、利用者は、書籍情報画面中に表示された書籍主要キーワードおよび書籍関連キーワードを用いて書籍の検索をさらに行うことができる。これにより、仮に1回目の検索で利用者が所望する書籍の検索が失敗した場合でも、この失敗により得られた詳細な情報を利用して、2回目の検索を行うことにより、利用者が所望する書籍を容易かつ高精度に探し出すことができる。
また、書籍検索装置2では、カテゴリ検索またはキーワード検索により見つけ出された書籍に利用者がブックマークを付し、または当該書籍を利用者が購入したとき、当該書籍を検索するのに利用者が選択または入力したキーワードに対応する書籍主要キーワードの重み付けの程度を大きくする。これにより、次回、利用者が、当該書籍主要キーワードに対応するキーワードを選択または入力して、当該書籍を検索すると、書籍タイトルリスト63中において、当該書籍のタイトルの配列順序が上がる。すなわち、利用者が書籍にブックマークを付し、または当該書籍を購入する度に、利用者が当該書籍の検索に用いたキーワードと、当該書籍との関係が親密になり、やがては利用者が当該キーワードを入力して検索すれば、当該書籍が、書籍タイトルリスト63中の最上位に配列されるようになる。このように、書籍検索装置2は、利用者が書籍にブックマークを付し、または書籍を購入するたびに、当該書籍を引き当てるのに適切なキーワードを学習し、書籍検索の精度を自ら向上させる。
また、書籍検索装置2は、キーワード検索において、利用者がキーワード入力画面中の関連キーワード表示指示入力ボタン72をマウスでクリックしたときに、利用者がキーワード入力欄70に入力したキーワードに関連する関連キーワードを表示する(図16参照)。そして、利用者は、表示された関連キーワードを、所望の書籍を検索するためのキーワードとして用いることができる。これにより、利用者は所望の書籍を検索するのに役立つ多数のキーワードを知ることができ、これら多数のキーワードを駆使して、所望の書籍を容易に探し出すことができる。また、書籍検索装置2は、関連キーワードと共に、関連キーワードが属するカテゴリを表示する。これにより、利用者は、関連キーワードが属するカテゴリを確認しながら、書籍を探し出すためのキーワードの選定などを行うことができる。
また、書籍検索装置2は、キーワード検索において、利用者が指定したキーワードに対応するカテゴリキーワードに関連付けられたカテゴリをフォーム74中に表示する(図15参照)。これにより、利用者は、キーワード入力欄70に任意に入力したキーワードが属するカテゴリを知ることができ、このカテゴリに基づいて、書籍を探し出すためのキーワードの選定を行い、または書籍のカテゴリ検索を行うことが可能になる。
なお、カテゴリ検索において、利用者は、大分類、中分類および小分類のカテゴリをそれぞれ複数選択することができる。カテゴリ選択部31は、複数の大分類のカテゴリが利用者により選択された場合には、選択された複数の大分類のカテゴリのいずれかに属する中分類のカテゴリのリストを含むカテゴリ選択画面データを生成し、複数の中分類のカテゴリが利用者により選択された場合には、選択された複数の中分類のカテゴリのいずれかに属する小分類のカテゴリのリストを含むカテゴリ選択画面データを生成する。また、複数の小分類のカテゴリが利用者により選択された場合には、カテゴリキーワード検索部32は、選択された複数の小分類のカテゴリのいずれかに関連付けられたカテゴリキーワードを見つけ出し、カテゴリキーワード選択部33は、カテゴリキーワード検索部32により見つけ出されたカテゴリキーワードのリストを含むカテゴリキーワード選択画面データを生成する。
また、カテゴリ検索において、利用者は複数のカテゴリキーワードを選択することができる。カテゴリキーワード選択画面中のカテゴリキーワードリスト60の中から複数のカテゴリキーワードが利用者により選択された場合には、書籍タイトル検索部34は、選択された複数のカテゴリキーワードにそれぞれ対応する複数の書籍主要キーワードにそれぞれ関連付けられた書籍のタイトルと、当該書籍のタイトルに関連付けられた書籍キーワードの重み付け情報とを見つけ出すために書籍データベース16を検索する。そして、書籍タイトル選択部35は、検索により見つけ出された書籍のタイトルを、当該検索により見つけ出された重み付け情報が示す重み付けの程度が大きい順に、端末装置3のモニタディスプレイに表示する。このとき、書籍タイトル選択部35は、各書籍タイトルの表示順位決定基準値の大小を相互に比較して書籍タイトルの表示順位を決める。すなわち、書籍タイトル選択部35は、1つの書籍主要キーワードが1つの書籍に関連付けられている場合には、当該1つの書籍に関連付けられている当該1つの書籍主要キーワードの重み付けの程度を示す数値を当該書籍タイトルの表示順位決定基準値とし、複数の書籍主要キーワードが1つの書籍に関連付けられている場合には、当該1つの書籍に関連付けられている当該複数の書籍主要キーワードの重み付けの程度を示す数値を相互に加算して得た数値を当該書籍タイトルの表示順位決定基準値とし、これら書籍タイトルの表示順位決定基準値が大きい順に書籍タイトルを表示する。また、ベクトル空間モデル解析を用いて書籍キーワードの重み付けを行った場合には、複数の書籍主要キーワード間の類似度に基づいて書籍タイトルの表示順位を決定してもよい。
また、キーワード検索において利用者がキーワード入力欄70に複数のキーワードを入力した場合、または利用者が関連キーワードを選択した結果、キーワード入力欄70に入力されたキーワードが複数になった場合も、利用者が複数のカテゴリキーワードを選択した場合と同様に、書籍タイトルの表示順序が決められる。
また、書籍検索装置2では、書籍データベース16を形成するに当たり、各書籍の主要ページまたは全ページに印刷された情報をスキャナで読み取り、読み取った情報を、光学式文字読取装置を用いてテキストデータに変換し、このテキストデータからテキストマイニングの手法を用いて書籍キーワードを抽出する場合を例にあげたが、本発明はこれに限らない。発行者などから書籍内容のテキストデータを入手することができる場合には、書籍ページをスキャナ読取およびスキャナ読取データのテキストデータへの変換を行うことなく、入出したテキストデータから直ちに書籍キーワードの抽出を行えばよい。
また、書籍検索装置2が有する書籍データベース16は、書籍の各ページに印刷された情報に含まれる書籍キーワードを抽出することにより形成される。しかし、本発明はこれに限らない。書籍について発行者が作成した書籍紹介文、書籍について一般読者が書き込んだ書評などから抽出した書籍キーワード(書籍を示す書籍キーワード)を書籍データベース16に追加してもよい。
また、書籍検索装置2では、通信経路4を介して接続された端末装置3により利用者による選択入力、指示入力、キーワード入力などを行う場合を例にあげたが、本発明はこれに限らない。書籍検索装置2が有するキーボード、マウス、モニタディスプレイなどを用い、利用者が選択入力、指示入力、キーワード入力などを書籍検索装置2に直接的に行う構成としてもよい。
また、書籍検索装置2では、主として、利用者が書籍を購入するために書籍を検索する場合を例にあげたが、本発明はこれに限らない。本発明の書籍検索装置は、書籍検索の目的を問わず、書籍検索を利用するのに相応しい様々な装置、システム、施設、環境などに適用することができる。
また、上述した実施形態では、本発明のコンテンツ検索装置を、書籍を検索する書籍検索装置に適用する場合を例にあげたが、本発明はこれに限らない。本発明のコンテンツ検索装置は、例えば、音楽、映画、ウェブサイトなどを検索する装置にも適用することができる。
また、図1中の書籍検索装置2がコンテンツ検索装置の具体例であり、書籍データベース16がコンテンツデータベースの具体例であり、カテゴリデータベース17がカテゴリデータベースの具体例であり、関連キーワードデータベース18が関連キーワードデータベースの具体例である。また、図2中の重み付け変更部28が第1および第2の重み付け変更手段の具体例であり、カテゴリ選択部31がカテゴリ選択手段の具体例であり、カテゴリキーワード検索部32がカテゴリキーワード検索手段の具体例であり、カテゴリキーワード選択部33がカテゴリキーワード選択手段の具体例であり、書籍タイトル検索部34がコンテンツタイトル検索手段の具体例であり、書籍タイトル選択部35がコンテンツタイトル選択手段の具体例であり、書籍キーワード表示・選択部36がコンテンツキーワード表示手段およびコンテンツキーワード選択手段の具体例である。また、キーワード入力制御部37がキーワード入力手段の具体例であり、関連キーワード検索部38が関連キーワード検索手段の具体例であり、関連キーワード選択部39が関連キーワード選択手段の具体例である。また、購入指示入力制御部40が購入指示入力手段の具体例であり、ブックマーク付加指示入力制御部41がブックマーク付加指示入力手段の具体例であり、カテゴリ検索部42がカテゴリ検索手段およびカテゴリ表示手段の具体例である。
また、本発明は、請求の範囲および明細書全体から読み取るこのできる発明の要旨または思想に反しない範囲で適宜変更可能であり、そのような変更を伴うコンテンツ検索装置もまた本発明の技術思想に含まれる。
本発明のコンテンツ検索装置の実施形態である書籍検索装置を含む書籍検索システムを示すブロック図である。 本発明のコンテンツ検索装置の実施形態である書籍検索装置の制御部の内部構造を示すブロック図である。 書籍データベースを示す説明図である。 カテゴリデータベースを示す説明図である。 関連キーワードデータベースを示す説明図である。 カテゴリ検索処理を示すフローチャートである。 キーワード検索処理を示すフローチャートである。 カテゴリ検索におけるカテゴリ(大分類)選択画面を示す説明図である。 カテゴリ検索におけるカテゴリ(中分類)選択画面を示す説明図である。 カテゴリ検索におけるカテゴリ(小分類)選択画面を示す説明図である。 カテゴリ検索におけるカテゴリキーワード選択画面を示す説明図である。 書籍タイトル選択画面を示す説明図である。 書籍情報画面を示す説明図である。 キーワード検索におけるキーワード入力画面を示す説明図である。 カテゴリ表示用のフォームを示す説明図である。 関連キーワードなどを表示した状態のキーワード入力画面を示す説明図である。
符号の説明
2 書籍検索装置
3 端末装置
11 制御部
12 記憶部
16 書籍データベース(コンテンツデータベース)
17 カテゴリデータベース
18 関連キーワードデータベース
28 重み付け変更部
31 カテゴリ選択部
32 カテゴリキーワード検索部
33 カテゴリキーワード選択部
34 書籍タイトル検索部
35 書籍タイトル選択部
36 書籍キーワード表示・選択部
37 キーワード入力制御部
38 関連キーワード検索部
39 関連キーワード選択部
40 購入指示入力制御部
41 ブックマーク付加指示入力制御部
42 カテゴリ検索部

Claims (6)

  1. コンテンツに含まれるまたはコンテンツを示すコンテンツキーワードを抽出し、抽出したコンテンツキーワードに対して重み付けを行い、前記コンテンツのタイトル、前記コンテンツキーワード、および前記コンテンツキーワードについての重み付けの程度を示す重み付け情報を相互に関連付けて記憶することにより形成されるコンテンツデータベースと、
    人為的手段により作成されたカテゴリと前記カテゴリに属するカテゴリキーワードとを相互に関連付けて記憶することにより形成されたカテゴリデータベースと、
    前記カテゴリデータベースに記憶されたカテゴリの中から任意のカテゴリを利用者に選択させるカテゴリ選択手段と、
    前記カテゴリ選択手段により利用者が選択したカテゴリに関連付けられたカテゴリキーワードを見つけ出すために前記カテゴリデータベースを検索するカテゴリキーワード検索手段と、
    前記カテゴリキーワード検索手段による検索によって見つけ出されたカテゴリキーワードを表示装置に表示し、前記表示装置に表示したカテゴリキーワードの中から任意のカテゴリキーワードを利用者に選択させるカテゴリキーワード選択手段と、
    前記カテゴリキーワード選択手段により利用者が選択したカテゴリキーワードに対応する前記コンテンツキーワードに関連付けられたコンテンツのタイトルと、当該コンテンツのタイトルに関連付けられたコンテンツキーワードの重み付け情報とを見つけ出すために前記コンテンツデータベースを検索するコンテンツタイトル検索手段と、
    前記コンテンツタイトル検索手段による検索によって見つけ出されたコンテンツのタイトルを、当該検索により見つけ出された重み付け情報が示す重み付けの程度が大きい順に前記表示装置に表示し、前記表示装置に表示したコンテンツのタイトルの中から任意のコンテンツのタイトルを利用者に選択させるコンテンツタイトル選択手段と、
    前記コンテンツタイトル選択手段により利用者が選択したコンテンツのタイトルに関連付けられたコンテンツキーワードを前記表示装置に表示するコンテンツキーワード表示手段とを備えていることを特徴とするコンテンツ検索装置。
  2. 前記コンテンツキーワード表示手段により前記表示装置に表示されたコンテンツキーワードの中から任意のコンテンツキーワードを利用者に選択させるコンテンツキーワード選択手段を備え、
    前記コンテンツタイトル検索手段は、前記コンテンツキーワード選択手段により利用者が選択したコンテンツキーワードに関連付けられたコンテンツのタイトルを見つけ出すために前記コンテンツデータベースを検索し、
    前記コンテンツタイトル選択手段は、前記コンテンツタイトル検索手段による検索によって見つけ出されたコンテンツのタイトルを前記表示装置に表示することを特徴とする請求項1に記載のコンテンツ検索装置。
  3. 複数のキーワード間の相互の関連性を記憶した関連キーワードデータベースと、
    任意のキーワードを利用者に入力させるキーワード入力手段と、
    前記キーワード入力手段により利用者が入力したキーワードと関連性を有する関連キーワードを見つけ出すために前記関連キーワードデータベースを検索する関連キーワード検索手段と、
    前記関連キーワード検索手段による検索によって見つけ出された関連キーワードを前記表示装置に表示し、前記表示装置に表示した関連キーワードの中から任意の関連キーワードを利用者に選択させる関連キーワード選択手段とを備え、
    前記コンテンツタイトル検索手段は、前記関連キーワード選択手段により利用者が選択した関連キーワードに対応するコンテンツキーワードに関連付けられたコンテンツのタイトルを見つけ出すために前記コンテンツデータベースを検索し、
    前記コンテンツタイトル選択手段は、前記コンテンツタイトル検索手段による検索によって見つけ出されたコンテンツのタイトルを前記表示装置に表示することを特徴とする請求項1に記載のコンテンツ検索装置。
  4. 任意のキーワードを利用者に入力させるキーワード入力手段と、
    前記キーワード入力手段により利用者が入力したキーワードに対応する前記カテゴリキーワードに関連付けられた前記カテゴリを見つけ出すために前記カテゴリデータベースを検索するカテゴリ検索手段と、
    前記カテゴリ検索手段による検索によって見つけ出されたカテゴリを前記表示装置に表示するカテゴリ表示手段とを備えていることを特徴とする請求項1に記載のコンテンツ検索装置。
  5. 前記コンテンツタイトル選択手段により利用者が選択したタイトルのコンテンツを購入する旨の指示を利用者に入力させる購入指示入力手段と、
    前記購入指示入力手段により前記コンテンツを購入する旨の指示を利用者が入力した場合に、前記カテゴリキーワード選択手段により利用者が選択したカテゴリキーワードに対応するコンテンツキーワードの重み付け情報が示す重み付けの程度を大きくする第1の重み付け変更手段とを備えていることを特徴とする請求項1に記載のコンテンツ検索装置。
  6. 前記コンテンツタイトル選択手段により利用者が選択したタイトルのコンテンツにブックマークを付加する旨の指示を利用者に入力させるブックマーク付加指示入力手段と、
    前記ブックマーク付加指示入力手段により前記コンテンツにブックマークを付加する旨の指示を利用者が入力した場合に、前記カテゴリキーワード選択手段により利用者が選択したカテゴリキーワードに対応するコンテンツキーワードの重み付け情報が示す重み付けの程度を大きくする第2の重み付け変更手段とを備えていることを特徴とする請求項1に記載のコンテンツ検索装置。
JP2008211301A 2008-08-20 2008-08-20 コンテンツ検索装置 Active JP5552582B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008211301A JP5552582B2 (ja) 2008-08-20 2008-08-20 コンテンツ検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008211301A JP5552582B2 (ja) 2008-08-20 2008-08-20 コンテンツ検索装置

Publications (2)

Publication Number Publication Date
JP2010049372A JP2010049372A (ja) 2010-03-04
JP5552582B2 true JP5552582B2 (ja) 2014-07-16

Family

ID=42066418

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008211301A Active JP5552582B2 (ja) 2008-08-20 2008-08-20 コンテンツ検索装置

Country Status (1)

Country Link
JP (1) JP5552582B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012084029A (ja) * 2010-10-14 2012-04-26 Kyocera Mita Corp 文書管理装置及び文書管理プログラム
TWI492616B (zh) * 2011-05-03 2015-07-11 Htc Corp 手持式電子裝置及其多媒體片段記錄方法
JP5877775B2 (ja) * 2012-09-03 2016-03-08 株式会社日立製作所 コンテンツ管理装置、コンテンツ管理システム、コンテンツ管理方法、プログラム、及び記憶媒体
JPWO2014196063A1 (ja) * 2013-06-06 2017-02-23 株式会社野村総合研究所 商品検索システムおよび商品検索プログラム
JP2017102977A (ja) * 2017-03-06 2017-06-08 株式会社野村総合研究所 商品検索システムおよび商品検索プログラム
JP6377200B2 (ja) * 2017-04-25 2018-08-22 東芝テック株式会社 情報処理装置およびプログラム
JP6325727B1 (ja) * 2017-07-24 2018-05-16 ヤフー株式会社 情報処理装置、情報処理方法および情報処理プログラム
CN109918555B (zh) * 2019-02-20 2021-10-15 百度在线网络技术(北京)有限公司 用于提供搜索建议的方法、装置、设备和介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005346119A (ja) * 2002-04-26 2005-12-15 Sony Corp コンテンツ管理装置および方法
US8086619B2 (en) * 2003-09-05 2011-12-27 Google Inc. System and method for providing search query refinements
WO2006028191A1 (ja) * 2004-09-09 2006-03-16 Jam Corporation 情報提供装置、コンピュータプログラム、プログラム格納媒体
JP3984263B2 (ja) * 2005-02-18 2007-10-03 株式会社つくばマルチメディア 地図情報システム連動サーチエンジンサーバーシステム。
JP2008123239A (ja) * 2006-11-13 2008-05-29 Hitachi Ltd キーワード抽出検索方式およびモバイル端末

Also Published As

Publication number Publication date
JP2010049372A (ja) 2010-03-04

Similar Documents

Publication Publication Date Title
JP5552582B2 (ja) コンテンツ検索装置
CA2702651C (en) System and method for searching for documents
US10460327B2 (en) Systems and methods for persistent context-aware guides
JP5431727B2 (ja) 関連性判定方法、情報収集方法、オブジェクト組織化方法及び検索システム
US7624102B2 (en) System and method for grouping by attribute
JP5518331B2 (ja) オープンウェブコンテンツへのアクセスを備えるペイフォーアクセス法律調査システム
US20130254189A1 (en) Using Anchor Text to Provide Context
US9659067B2 (en) Providing a search results document that includes a user interface for performing an action in connection with a web page identified in the search results document
US20010020238A1 (en) Document searching apparatus, method thereof, and record medium thereof
KR102237274B1 (ko) 키워드의 중요도에 의한 사용자간의 매칭정보를 제공하는 시스템 및 방법
JP5379978B2 (ja) 検索システム及び検索方法
US7216122B2 (en) Information processing device and method, recording medium, and program
CN107016020A (zh) 利用垂直建议辅助搜索请求的***和方法
US20030217056A1 (en) Method and computer program for collecting, rating, and making available electronic information
CN101273348A (zh) 结构化数据的导航
JP4430598B2 (ja) 情報共有システムおよび情報共有方法
JP2014112433A (ja) 代表者の信頼度を用いた検索結果順位化装置および方法
US20130117301A1 (en) Triggering social pages
CN106202146B (zh) 一种搜索引擎终端用户输入参考文件搜索提示信息的处理方法
CN105354344A (zh) 搜索引擎优化***及方法
CN110647504A (zh) 司法文书的检索方法及装置
CA2556232C (en) Research report search system
JP2012043258A (ja) 検索システム、検索装置、検索プログラム、記録媒体及び検索方法
JP4842921B2 (ja) 検索システムおよびその方法
KR100371805B1 (ko) 관련 웹 사이트 제공 방법 및 시스템

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110808

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110812

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130618

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130718

R150 Certificate of patent or registration of utility model

Ref document number: 5552582

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250