JP2009282593A - コンテンツを検索する索引データを管理する方法、サーバ、およびプログラム - Google Patents

コンテンツを検索する索引データを管理する方法、サーバ、およびプログラム Download PDF

Info

Publication number
JP2009282593A
JP2009282593A JP2008131603A JP2008131603A JP2009282593A JP 2009282593 A JP2009282593 A JP 2009282593A JP 2008131603 A JP2008131603 A JP 2008131603A JP 2008131603 A JP2008131603 A JP 2008131603A JP 2009282593 A JP2009282593 A JP 2009282593A
Authority
JP
Japan
Prior art keywords
users
index data
keyword
content
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008131603A
Other languages
English (en)
Other versions
JP5014252B2 (ja
Inventor
Haruhiro Tani
治寛 谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2008131603A priority Critical patent/JP5014252B2/ja
Publication of JP2009282593A publication Critical patent/JP2009282593A/ja
Application granted granted Critical
Publication of JP5014252B2 publication Critical patent/JP5014252B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】コンテンツの識別データの有用性に基づく索引データを管理する方法、サーバ、およびプログラムを提供すること。
【解決手段】検索サーバ10は、Webページを閲覧したユーザにより当該Webページに関連付けられた、ブックマークを受信し、受信したブックマークに含まれる、所定の種類の語句の集合を抽出し、抽出された語句の集合と、当該語句の集合が抽出されたブックマークに関連付けられたWebページと、の同一の組み合わせについて、当該関連付けが行われたユーザ数を、当該組み合わせと対応付けて記憶し、記憶されたユーザ数に基づいて、当該ユーザ数に対応する組み合わせについて、語句の集合に含まれる語句それぞれをキーワードとした索引データを生成する。
【選択図】図3

Description

本発明は、索引データを管理する方法、サーバ、およびプログラムに関する。
従来、インターネットにおいてWebページや画像ファイル等で提供されるコンテンツは、多種多量であるため、必要な情報を得ようとするユーザは、検索システムを利用して、キーワードによる検索を行ってきた。この検索システムは、検索の効率化を図るために、予めキーワードとコンテンツとを関連付けた索引データを生成しておくことが多い。
このような索引データには、コンテンツ内から抽出された単語や、コンテンツに付与されたタグがキーワードとして用いられる。これにより、ユーザは、コンテンツの内容を示すキーワードを入力することにより検索することができる。
また、ユーザが有用と認めたコンテンツに対しては、ブックマークを登録しておき、このブックマークを選択することにより、該当のコンテンツに素早く辿り着くようにすることも行われている。このブックマークは、ユーザが利用する端末装置に固有のものには限られず、所定のサーバにて複数ユーザが登録したブックマークが管理される場合もある。
ところで、このようなブックマークが多数登録された場合には、所望のブックマーク自体が発見され難いため、ブックマークを検索して検索結果を提示する管理方法も提案されている(例えば、特許文献1参照)。そこで、ブックマークから抽出される単語を、コンテンツ内の単語やタグ等と同様に、索引データのキーワードとすることも考えられる。
特開2001−357055号公報
しかしながら、コンテンツ内の単語や、タグ、ブックマーク等の識別データをキーワードとして検索を行う場合、抽出されたキーワードには、コンテンツの内容と関連度の低いものが含まれる場合がある。特に、ユーザにより指定されるタグやブックマークに基づくキーワードは、他のユーザからは分かり難いことも多い。このような関連度の低いキーワードにより検索の精度が低下したり、分かり難いキーワードにより無用の索引データが生成されたりすることが多かった。
したがって、個々のキーワードの有用性を考慮して索引データを生成することが重要である。そこで、本発明は、コンテンツの識別データの有用性に基づく索引データを管理する方法、サーバ、およびプログラムを提供することを目的とする。
本発明では、以下のような解決手段を提供する。
(1) キーワードと当該キーワードにより検索されるコンテンツとを対応付けた索引データをサーバが管理する方法であって、
ユーザにより当該コンテンツに関連付けられた、識別データを受信する受信ステップと、
前記受信ステップにより受信した識別データに含まれる、所定の種類の語句の集合を抽出する抽出ステップと、
前記抽出ステップにより抽出された語句の集合と、当該語句の集合が抽出された識別データに関連付けられたコンテンツと、の同一の組み合わせについて、当該関連付けが行われたユーザ数を、当該組み合わせと対応付けて記憶する記憶ステップと、
前記記憶ステップにより記憶された前記ユーザ数に基づいて、当該ユーザ数に対応する前記組み合わせについて、前記語句の集合に含まれる語句それぞれを前記キーワードとした前記索引データを生成する生成ステップと、を含む方法。
このような構成によれば、当該方法を実行するサーバは、コンテンツ(例えば、Webページや画像ファイル等)を閲覧したユーザにより当該コンテンツに関連付けられた、識別データ(例えば、ブックマークやタグ等)を受信し、受信した識別データに含まれる、所定の種類(例えば、名詞等)の語句の集合を抽出し、抽出された語句の集合と、当該語句の集合が抽出された識別データに関連付けられたコンテンツと、の同一の組み合わせについて、当該関連付けが行われたユーザ数を、当該組み合わせと対応付けて記憶し、記憶されたユーザ数に基づいて、当該ユーザ数に対応する組み合わせについて、語句の集合に含まれる語句それぞれをキーワードとした索引データを生成する。
このことにより、当該サーバは、ブックマークやタグ等の識別データに含まれるキーワードの集合を単位として、この集合が登録された数(ユーザ数)を記憶する。このユーザ数が多いことは、同一のキーワード集合が抽出される識別データを登録したユーザが多いことを示すため、このキーワード集合がコンテンツと深く関連し、有用なキーワードの組み合わせであると判断できる。そして、当該サーバは、この記憶されたユーザ数に基づいて、集合に含まれるキーワードに関する索引データを生成するので、多くのユーザに認知された有用なキーワードに基づいて索引データを生成することができる。
したがって、この索引データを用いる検索システムは、コンテンツとの関連度の高い有用な索引により精度の高い検索を実行できる。したがって、ユーザは、要求に合った有用なコンテンツを効率的に抽出して閲覧できる可能性がある。
(2) 前記記憶ステップは、所定の期間に前記受信ステップにより受信した識別データについて、前記ユーザ数を記憶することを特徴とする(1)に記載の方法。
このような構成によれば、当該方法を実行するサーバは、所定の期間において識別データの登録数(ユーザ数)を集計する。したがって、当該サーバは、現在の流行に合った索引データを生成することができる。
(3) 前記生成ステップは、前記ユーザ数が所定の閾値を超えた場合に、当該ユーザ数に対応する前記組み合わせについて、前記索引データを生成することを特徴とする(1)または(2)に記載の方法。
このような構成によれば、当該方法を実行するサーバは、識別データの登録数(ユーザ数)が所定の閾値を超えた場合に、この識別データが含むキーワードにより索引データを生成する。したがって、当該サーバは、所定数のユーザからの支持を得られたキーワード集合に含まれる有用性の高いキーワードにより、精度の高い索引データを生成できる可能性がある。
(4) 前記生成ステップは、前記記憶ステップにより記憶された前記組み合わせの中で、前記ユーザ数が多い順に所定数の組み合わせについて、前記索引データを生成することを特徴とする(1)から(3)のいずれかに記載の方法。
このような構成によれば、当該方法を実行するサーバは、識別データの登録数(ユーザ数)が多い順にキーワードを抽出して索引データを生成する。したがって、当該サーバは、現在多くの支持を得ているキーワード集合に含まれる有用性の高いキーワードにより、精度の高い索引データを生成できる可能性がある。
(5) 前記ユーザの数に基づいて、前記索引データの優先順位に係る重み付けを調整する調整ステップを更に含む(1)から(4)のいずれかに記載の方法。
このような構成によれば、当該方法を実行するサーバは、識別データの登録数(ユーザ数)に基づいて、例えば、登録数の多い識別データに含まれるキーワードに対するコンテンツの優先順位を高めることができる。その結果、多くのユーザに支持されたキーワードとコンテンツの組み合わせにより、有用性が高いコンテンツを容易に抽出して閲覧できる可能性がある。
(6) キーワードと当該キーワードにより検索されるコンテンツとを対応付けた索引データを管理するサーバであって、
ユーザにより当該コンテンツに関連付けられた、識別データを受信する受信手段と、
前記受信手段により受信した識別データに含まれる、所定の種類の語句の集合を抽出する抽出手段と、
前記抽出手段により抽出された語句の集合と、当該語句の集合が抽出された識別データに関連付けられたコンテンツと、の同一の組み合わせについて、当該関連付けが行われたユーザ数を、当該組み合わせと対応付けて記憶する記憶手段と、
前記記憶手段により記憶された前記ユーザ数に基づいて、当該ユーザ数に対応する前記組み合わせについて、前記語句の集合に含まれる語句それぞれを前記キーワードとした前記索引データを生成する生成手段と、を備えるサーバ。
このような構成によれば、当該サーバを運用することにより、(1)と同様の効果が期待できる。
(7) キーワードと当該キーワードにより検索されるコンテンツとを対応付けた索引データをサーバに管理させるプログラムであって、
ユーザにより当該コンテンツに関連付けられた、識別データを受信する受信ステップと、
前記受信ステップにより受信した識別データに含まれる、所定の種類の語句の集合を抽出する抽出ステップと、
前記抽出ステップにより抽出された語句の集合と、当該語句の集合が抽出された識別データに関連付けられたコンテンツと、の同一の組み合わせについて、当該関連付けが行われたユーザ数を、当該組み合わせと対応付けて記憶する記憶ステップと、
前記記憶ステップにより記憶された前記ユーザ数に基づいて、当該ユーザ数に対応する前記組み合わせについて、前記語句の集合に含まれる語句それぞれを前記キーワードとした前記索引データを生成する生成ステップと、を実行させるプログラム。
このような構成によれば、当該プログラムを実行することにより、(1)と同様の効果が期待できる。
本発明によれば、コンテンツの識別データの有用性に基づく索引データを管理することができる。
以下、本発明の実施形態について図を参照しながら説明する。なお、本発明に係るコンテンツをWebページ、識別データをブックマークのタイトルであるとして説明する。
[システム概要]
図1は、本実施形態に係る検索システムの全体構成を示す概略図である。検索サーバ10は、ブックマーク管理サーバ20、ユーザ端末30、およびコンテンツサーバ40と、ネットワークを介して接続されている。
検索サーバ10は、ユーザ端末30からの要求に応じて、コンテンツサーバ40により管理されるWebページを検索し、ユーザ端末30に検索結果を送信する。
ブックマーク管理サーバ20は、ユーザ端末30にて閲覧されたWebページに対するブックマークの登録を受け付ける。そして、ブックマーク管理サーバ20は、ユーザ毎に、ブックマークとWebページのURLとの組み合わせを記憶する。
ここで、検索サーバ10は、ブックマーク管理サーバ20から、ブックマーク情報を収集し、登録数に基づく索引データを生成することにより、検索の効率および精度を向上させる。
[ハードウェア構成]
図2は、本実施形態に係る検索サーバ10のハードウェア構成の一例を示す図である。検索サーバ10は、制御装置101を構成するCPU(Central Processing Unit)1(1010)(マルチプロセッサ構成ではCPU2(1012)等複数のCPUが追加されてもよい)、バスライン1005、通信I/F1040、メインメモリ1050、BIOS(Basic Input Output System)1060、USBポート1090、I/Oコントローラ1070、ならびにキーボードおよびマウス等の入力装置1100や表示装置1022を備える。
BIOS1060は、検索サーバ10の起動時に制御装置101が実行するブートプログラムや、検索サーバ10のハードウェアに依存するプログラム等を格納する。
I/Oコントローラ1070には、テープドライブ1072、ハードディスク1074、光ディスクドライブ1076、半導体メモリ1078等の記憶装置107を接続することができる。
記憶装置107を構成するハードディスク1074は、検索サーバ10がサーバとして機能するための各種プログラムおよび本発明の機能を実行するプログラムを記憶しており、更に必要に応じて各種データベースを構成可能である。
光ディスクドライブ1076としては、例えば、DVD−ROMドライブ、CD−ROMドライブ、DVD−RAMドライブ、CD−RAMドライブ等を使用することができる。この場合は各ドライブに対応した光ディスク1077を使用する。光ディスク1077から光ディスクドライブ1076によりプログラムまたはデータを読み取り、I/Oコントローラ1070を介してメインメモリ1050またはハードディスク1074に提供することもできる。また、同様にテープドライブ1072に対応したテープメディア1071を主としてバックアップのために使用することもできる。
検索サーバ10に提供されるプログラムは、ハードディスク1074、光ディスク1077、またはメモリーカード等の記録媒体に格納されて提供される。このプログラムは、I/Oコントローラ1070を介して、記録媒体から読み出され、または通信I/F1040を介してダウンロードされることによって、検索サーバ10にインストールされ実行されてもよい。
前述のプログラムは、内部または外部の記憶媒体に格納されてもよい。ここで、記憶装置107を構成する記憶媒体としては、ハードディスク1074、光ディスク1077、またはメモリーカードの他に、MD等の光磁気記録媒体、テープ媒体を用いることができる。また、専用通信回線やインターネットに接続されたサーバシステムに設けたハードディスク1074または光ディスクライブラリー等の記憶装置を記録媒体として使用し、通信回線を介してプログラムを検索サーバ10に提供してもよい。
ここで、表示装置1022は、ユーザにデータの入力を受け付ける画面を表示したり、検索サーバ10による演算処理結果の画面を表示したりするものであり、ブラウン管表示装置(CRT)、液晶表示装置(LCD)等のディスプレイ装置を含む。
ここで、入力装置1100は、ユーザによる入力の受け付けを行うものであり、キーボードおよびマウス等により構成してよい。
また、通信I/F1040は、検索サーバ10を専用ネットワークまたは公共ネットワークを介して端末と接続できるようにするためのネットワーク・アダプタである。通信I/F1040は、モデム、ケーブル・モデムおよびイーサネット(登録商標)・アダプタを含んでよい。
以上の例は、検索サーバ10について主に説明したが、コンピュータに、プログラムをインストールして、そのコンピュータをサーバ装置として動作させることにより上記で説明した機能を実現することもできる。したがって、本発明において一実施形態として説明した検索サーバ10により実現される機能は、上述の方法を当該コンピュータで実行することにより、あるいは、上述のプログラムを当該コンピュータに導入して実行することによっても実現可能である。
[機能構成]
図3は、本実施形態に係る検索サーバ10の機能構成を示すブロック図である。検索サーバ10は、制御装置101に、ブックマーク受信部11と、キーワード集合抽出部12と、ブックマークカウント部13と、索引生成部14と、優先度調整部15と、を備え、記憶装置107に、カウントDB16と、索引DB17と、を備える。
ブックマーク受信部11は、ブックマーク管理サーバ20が備えるブックマークDB21から、ブックマークデータを受信する。ここで、ブックマークデータは、ユーザ端末30のユーザにより登録されたWebページの識別データ(ブックマークのタイトル)とWebページのURLとを対応付けたデータである。
図4は、本実施形態に係るブックマークテーブルを示す図である。ここでは、ブックマークを登録したユーザのIDと、ブックマークのタイトルと、WebページのURLと、ブックマークの登録日時と、が関連付けて記憶されている。各ユーザは、自分が登録したブックマークのタイトルを選択することにより、対応するURLのWebページを取得し閲覧することができる。また、ブックマークは、他者へ公開できてもよく、ブックマークテーブルには、公開するか否かのフラグが付与される。
ブックマーク受信部11は、ブックマークテーブル(図4)に記憶されたブックマークデータのうち、登録日時が所定の期間のデータを受信する。この受信は所定の周期で行うこととしてよく、前回の受信から現在までに登録されたブックマークデータを受信する。
なお、受信するブックマークデータは、公開されたものに限定してもよい。このことによれば、検索サーバ10は、ユーザが他者に見せることを前提に名付けたブックマークのタイトルを利用して索引データを生成する。したがって、他者にも支持され易い有用なキーワードによる索引データが生成され、検索の精度を向上させられる可能性がある。
キーワード集合抽出部12は、ブックマーク受信部11により受信したブックマークのタイトルに含まれる、キーワードの集合を抽出する。具体的には、キーワード集合抽出部12は、ブックマークのタイトルを形態素解析することにより、名詞等、所定の種類の単語を抽出し、抽出した単語の組み合わせをキーワード集合とする。
ブックマークカウント部13は、キーワード集合抽出部12により抽出されたキーワード集合と、対応するブックマークデータに含まれるURLと、の組み合わせが現れた回数をカウントし、カウントDB16に記憶する。すなわち、ブックマークカウント部13は、同一のキーワード集合が含まれた同様のブックマークのタイトルが同一のWebページに対して登録された場合に、その登録数をカウントして記憶する。
図5は、本実施形態に係るカウントDB16に記憶されるカウントテーブルを示す図である。ここでは、キーワードの集合とWebページのURLとの組み合わせに対して、その組み合わせのブックマークを登録したユーザ数が記憶される。
索引生成部14は、カウントテーブル(図5)を参照し、検索処理に用いられる索引データを生成する。ここで、索引データは、キーワードとURLとの組み合わせを含むデータであって、Webページの検索処理において、検索エンジンが参照する。
具体的には、索引生成部14は、カウントテーブル(図5)から、登録数が相対的に多いキーワード集合とURLの組み合わせを抽出する。例えば、登録数が所定の閾値を超えている組み合わせや、登録数が多い順に所定数の組み合わせを抽出することとしてよい。そして、索引生成部14は、抽出した組み合わせについて、キーワード集合が含む個々のキーワードそれぞれとURLとを対応付けた索引データを生成し、索引DB17に記憶する。
なお、索引データは、個々のキーワードとURLとを対応付けることとしたが、これには限られず、キーワード集合または部分集合とURLとを対応付けてもよい。
優先度調整部15は、カウントテーブル(図5)の登録数に基づいて、索引DB17に記憶された索引データに関して、検索の優先順位を示す優先度の調整を行う。優先度は、検索結果としてのURLの順位(表示順序)を決定するための重み付けであってよく、登録数が多いほど、優先度を高く調整する。これにより、多数のユーザのブックマークで対応付けがなされたキーワードとURLの組み合わせについては、優先度が高まるため、検索され易くなる。
以上で説明した各機能は、検索サーバ10の各部により実現されることとしたが、これには限られず、適宜、複数のサーバに分散させてもよい。
[第1の処理]
図6は、本実施形態に係る検索サーバ10における第1の処理の流れを示す図である。この処理では、キーワード集合とURLとの組み合わせの登録数が所定の閾値以上である場合に索引データを生成する。
ステップS1では、制御装置101は、カウントDB16のカウントテーブル(図5)から、キーワード集合とURLの組み合わせを1件抽出する。
ステップS2では、制御装置101は、ステップS1にて抽出したデータについて、登録数が所定の閾値以上であるか否かを判定する。この判定がYESの場合はステップS3に移り、判定がNOの場合はステップS6に移る。
ステップS3では、制御装置101は、ステップS2にて登録数が閾値以上であると判定されたキーワード集合とURLとの組み合わせに関して、索引データが既に登録済みであるか否かを判定する。この判定がYESの場合はステップS5に移り、判定がNOの場合はステップS4に移る。
ステップS4では、制御装置101は、ステップS3にて索引データが登録されていないと判定されたキーワードとURLの組み合わせに関して、索引データを生成して索引DB17に登録する。
ステップS5では、制御装置101は、登録された索引データに対して、カウントテーブル(図5)から抽出した登録数に基づいて、検索の優先順位に関わる重み付けを行う。
ステップS6では、制御装置101は、カウントテーブル(図5)に記憶された全件を処理したか否かを判定する。この判定がYESの場合は処理を終了し、判定がNOの場合はステップS1に戻って次の1件に対して処理を行う。
[第2の処理]
図7は、本実施形態に係る検索サーバ10における第2の処理の流れを示す図である。この処理では、キーワード集合とURLの組み合わせのうち、登録数が最も多いもの、あるいは登録数が多いものから所定数について、索引データを生成する。
ステップS11では、制御装置101は、カウントテーブル(図5)のデータを、登録数によりソートする。
ステップS12では、制御装置101は、ステップS11にてソートしたデータのうち、登録数が上位のものから順に、キーワード集合とURLの組み合わせを1件抽出する。
ステップS13では、制御装置101は、ステップS12にて抽出したデータについて、登録数が所定の閾値以上であるか否かを判定する。この判定がYESの場合はステップS14に移り、判定がNOの場合は、登録数が閾値以上のデータがこれ以上無いと判断して、処理を終了する。
ステップS14では、制御装置101は、ステップS13にて登録数が閾値以上であると判定されたキーワード集合とURLとの組み合わせに関して、索引データが既に登録済みであるか否かを判定する。この判定がYESの場合はステップS16に移り、判定がNOの場合はステップS15に移る。
ステップS15では、制御装置101は、ステップS14にて索引データが登録されていないと判定されたキーワードとURLの組み合わせに関して、索引データを生成して索引DB17に登録する。
ステップS16では、制御装置101は、登録された索引データに対して、カウントテーブル(図5)から抽出した登録数に基づいて、検索の優先順位に関わる重み付けを行う。
ステップS17では、制御装置101は、カウントテーブル(図5)から索引データの生成対象となる所定数を抽出したか否かを判定する。この判定がYESの場合は処理を終了し、判定がNOの場合はステップS12に戻って次の1件に対して処理を行う。
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限るものではない。また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施形態に記載されたものに限定されるものではない。
本発明の実施形態に係る検索システムの全体構成を示す概略図である。 本発明の実施形態に係る検索サーバ10のハードウェア構成の一例を示す図である。 本発明の実施形態に係る検索サーバ10の機能構成を示すブロック図である。 本発明の実施形態に係るブックマークテーブルを示す図である。 本発明の実施形態に係るカウントテーブルを示す図である。 本発明の実施形態に係る検索サーバ10における第1の処理の流れを示す図である。 本発明の実施形態に係る検索サーバ10における第2の処理の流れを示す図である。
符号の説明
10 検索サーバ
11 ブックマーク受信部
12 キーワード集合抽出部
13 ブックマークカウント部
14 索引生成部
15 優先度調整部
16 カウントDB
17 索引DB
20 ブックマーク管理サーバ
21 ブックマークDB
30 ユーザ端末
40 コンテンツサーバ
101 制御装置
107 記憶装置

Claims (7)

  1. キーワードと当該キーワードにより検索されるコンテンツとを対応付けた索引データをサーバが管理する方法であって、
    ユーザにより当該コンテンツに関連付けられた、識別データを受信する受信ステップと、
    前記受信ステップにより受信した識別データに含まれる、所定の種類の語句の集合を抽出する抽出ステップと、
    前記抽出ステップにより抽出された語句の集合と、当該語句の集合が抽出された識別データに関連付けられたコンテンツと、の同一の組み合わせについて、当該関連付けが行われたユーザ数を、当該組み合わせと対応付けて記憶する記憶ステップと、
    前記記憶ステップにより記憶された前記ユーザ数に基づいて、当該ユーザ数に対応する前記組み合わせについて、前記語句の集合に含まれる語句それぞれを前記キーワードとした前記索引データを生成する生成ステップと、を含む方法。
  2. 前記記憶ステップは、所定の期間に前記受信ステップにより受信した識別データについて、前記ユーザ数を記憶することを特徴とする請求項1に記載の方法。
  3. 前記生成ステップは、前記ユーザ数が所定の閾値を超えた場合に、当該ユーザ数に対応する前記組み合わせについて、前記索引データを生成することを特徴とする請求項1または請求項2に記載の方法。
  4. 前記生成ステップは、前記記憶ステップにより記憶された前記組み合わせの中で、前記ユーザ数が多い順に所定数の組み合わせについて、前記索引データを生成することを特徴とする請求項1から請求項3のいずれかに記載の方法。
  5. 前記ユーザの数に基づいて、前記索引データの優先順位に係る重み付けを調整する調整ステップを更に含む請求項1から請求項4のいずれかに記載の方法。
  6. キーワードと当該キーワードにより検索されるコンテンツとを対応付けた索引データを管理するサーバであって、
    ユーザにより当該コンテンツに関連付けられた、識別データを受信する受信手段と、
    前記受信手段により受信した識別データに含まれる、所定の種類の語句の集合を抽出する抽出手段と、
    前記抽出手段により抽出された語句の集合と、当該語句の集合が抽出された識別データに関連付けられたコンテンツと、の同一の組み合わせについて、当該関連付けが行われたユーザ数を、当該組み合わせと対応付けて記憶する記憶手段と、
    前記記憶手段により記憶された前記ユーザ数に基づいて、当該ユーザ数に対応する前記組み合わせについて、前記語句の集合に含まれる語句それぞれを前記キーワードとした前記索引データを生成する生成手段と、を備えるサーバ。
  7. キーワードと当該キーワードにより検索されるコンテンツとを対応付けた索引データをサーバに管理させるプログラムであって、
    ユーザにより当該コンテンツに関連付けられた、識別データを受信する受信ステップと、
    前記受信ステップにより受信した識別データに含まれる、所定の種類の語句の集合を抽出する抽出ステップと、
    前記抽出ステップにより抽出された語句の集合と、当該語句の集合が抽出された識別データに関連付けられたコンテンツと、の同一の組み合わせについて、当該関連付けが行われたユーザ数を、当該組み合わせと対応付けて記憶する記憶ステップと、
    前記記憶ステップにより記憶された前記ユーザ数に基づいて、当該ユーザ数に対応する前記組み合わせについて、前記語句の集合に含まれる語句それぞれを前記キーワードとした前記索引データを生成する生成ステップと、を実行させるプログラム。
JP2008131603A 2008-05-20 2008-05-20 コンテンツを検索する索引データを管理する方法、サーバ、およびプログラム Active JP5014252B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008131603A JP5014252B2 (ja) 2008-05-20 2008-05-20 コンテンツを検索する索引データを管理する方法、サーバ、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008131603A JP5014252B2 (ja) 2008-05-20 2008-05-20 コンテンツを検索する索引データを管理する方法、サーバ、およびプログラム

Publications (2)

Publication Number Publication Date
JP2009282593A true JP2009282593A (ja) 2009-12-03
JP5014252B2 JP5014252B2 (ja) 2012-08-29

Family

ID=41453022

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008131603A Active JP5014252B2 (ja) 2008-05-20 2008-05-20 コンテンツを検索する索引データを管理する方法、サーバ、およびプログラム

Country Status (1)

Country Link
JP (1) JP5014252B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014071645A (ja) * 2012-09-28 2014-04-21 Ntt Docomo Inc サーバ装置、情報処理方法及びプログラム
JP2018055605A (ja) * 2016-09-30 2018-04-05 ジャパンモード株式会社 創作支援プログラム
JP2018055604A (ja) * 2016-09-30 2018-04-05 ジャパンモード株式会社 創作支援プログラム
JP2021108124A (ja) * 2019-12-29 2021-07-29 Deiシステムズ株式会社 アクセス対象検索システム

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10162126A (ja) * 1996-12-02 1998-06-19 Planet Computer:Kk 文書の電子化装置
JP2002014996A (ja) * 2000-06-30 2002-01-18 Nec Corp ブックマークシステム及びブックマークを利用したドキュメント提案方法並びにプログラム記録媒体
JP2003067328A (ja) * 2001-08-29 2003-03-07 Nec Corp ブックマーク管理システム及びブックマーク管理方法
JP2003271670A (ja) * 2002-03-19 2003-09-26 Mitsubishi Electric Corp 情報収集装置、情報収集方法及びプログラム
JP2005010882A (ja) * 2003-06-17 2005-01-13 Hidekazu Kondo ブラウザ装置、情報処理システムおよびプログラム
WO2005008527A1 (ja) * 2003-07-16 2005-01-27 Fujitsu Limited 動的にカテゴライズされるブックマーク管理装置
JP2006107200A (ja) * 2004-10-06 2006-04-20 Vodafone Kk 検索サービス提供システム
WO2006095409A1 (ja) * 2005-03-07 2006-09-14 Mars Flag Corporation 情報検索装置,コンピュータプログラム及び記憶媒体
JP2007072596A (ja) * 2005-09-05 2007-03-22 Nippon Telegr & Teleph Corp <Ntt> 情報共有システムおよび情報共有方法
JP2007133794A (ja) * 2005-11-14 2007-05-31 Hitachi Ltd 電子文書管理装置、電子文書管理プログラム、電子文書管理システム
JP2008112355A (ja) * 2006-10-31 2008-05-15 Fujitsu Ltd ブックマーク管理装置,ブックマーク管理プログラムおよびブックマーク管理方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10162126A (ja) * 1996-12-02 1998-06-19 Planet Computer:Kk 文書の電子化装置
JP2002014996A (ja) * 2000-06-30 2002-01-18 Nec Corp ブックマークシステム及びブックマークを利用したドキュメント提案方法並びにプログラム記録媒体
JP2003067328A (ja) * 2001-08-29 2003-03-07 Nec Corp ブックマーク管理システム及びブックマーク管理方法
JP2003271670A (ja) * 2002-03-19 2003-09-26 Mitsubishi Electric Corp 情報収集装置、情報収集方法及びプログラム
JP2005010882A (ja) * 2003-06-17 2005-01-13 Hidekazu Kondo ブラウザ装置、情報処理システムおよびプログラム
WO2005008527A1 (ja) * 2003-07-16 2005-01-27 Fujitsu Limited 動的にカテゴライズされるブックマーク管理装置
JP2006107200A (ja) * 2004-10-06 2006-04-20 Vodafone Kk 検索サービス提供システム
WO2006095409A1 (ja) * 2005-03-07 2006-09-14 Mars Flag Corporation 情報検索装置,コンピュータプログラム及び記憶媒体
JP2007072596A (ja) * 2005-09-05 2007-03-22 Nippon Telegr & Teleph Corp <Ntt> 情報共有システムおよび情報共有方法
JP2007133794A (ja) * 2005-11-14 2007-05-31 Hitachi Ltd 電子文書管理装置、電子文書管理プログラム、電子文書管理システム
JP2008112355A (ja) * 2006-10-31 2008-05-15 Fujitsu Ltd ブックマーク管理装置,ブックマーク管理プログラムおよびブックマーク管理方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014071645A (ja) * 2012-09-28 2014-04-21 Ntt Docomo Inc サーバ装置、情報処理方法及びプログラム
JP2018055605A (ja) * 2016-09-30 2018-04-05 ジャパンモード株式会社 創作支援プログラム
JP2018055604A (ja) * 2016-09-30 2018-04-05 ジャパンモード株式会社 創作支援プログラム
JP2021108124A (ja) * 2019-12-29 2021-07-29 Deiシステムズ株式会社 アクセス対象検索システム
JP7157474B2 (ja) 2019-12-29 2022-10-20 Deiシステムズ株式会社 アクセス対象検索システム

Also Published As

Publication number Publication date
JP5014252B2 (ja) 2012-08-29

Similar Documents

Publication Publication Date Title
JP4342575B2 (ja) キーワード提示のための装置、方法、及びプログラム
JP4857075B2 (ja) ウェブドキュメントの集合において効率的に日付を検索する方法、コンピュータプログラム
JP5264892B2 (ja) 多言語情報検索
US10552467B2 (en) System and method for language sensitive contextual searching
US9183261B2 (en) Lexicon based systems and methods for intelligent media search
US20080294619A1 (en) System and method for automatic generation of search suggestions based on recent operator behavior
EP1887485A2 (en) Keyword outputting apparatus, keyword outputting method, and keyword outputting computer program product
US7310633B1 (en) Methods and systems for generating textual information
JP4962986B2 (ja) コンテンツデータをカテゴリに分類する方法、サーバ、およびプログラム
JP2008071259A (ja) ブックマーク・タグ設定装置
JP2011008420A (ja) カテゴリを対応付けする装置、方法、およびプログラム
JP2017220204A (ja) 検索クエリに応答してホワイトリストとブラックリストを使用し画像とコンテンツをマッチングする方法及びシステム
US20160217181A1 (en) Annotating Query Suggestions With Descriptions
JP5226241B2 (ja) タグを付与する方法
JP4819628B2 (ja) ドキュメントデータを検索する方法、サーバ、およびプログラム
JP5014252B2 (ja) コンテンツを検索する索引データを管理する方法、サーバ、およびプログラム
JP2010257001A (ja) 検索サポートキーワード提示装置、方法及びプログラム
JP4796527B2 (ja) ドキュメント絞り込み検索装置、方法及びプログラム
WO2019231635A1 (en) Method and apparatus for generating digest for broadcasting
JP5072792B2 (ja) 情報量に応じたページを優先的に表示する検索方法、プログラム及びサーバ
JP5285491B2 (ja) 情報検索システム、方法及びプログラム、索引作成システム、方法及びプログラム、
JP2010055164A (ja) 文章検索装置、文章検索方法、文章検索プログラムおよびその記録媒体
CN107818091B (zh) 文档处理方法及装置
JP2008262442A (ja) 検索キーデータを表示させる方法及びサーバ
JP2014120080A (ja) キーワード提示プログラム、キーワード提示方法及びキーワード提示装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111031

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111108

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120106

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20120312

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120515

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120605

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150615

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5014252

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250