JP5155130B2 - カテゴリ提示装置 - Google Patents

カテゴリ提示装置 Download PDF

Info

Publication number
JP5155130B2
JP5155130B2 JP2008318398A JP2008318398A JP5155130B2 JP 5155130 B2 JP5155130 B2 JP 5155130B2 JP 2008318398 A JP2008318398 A JP 2008318398A JP 2008318398 A JP2008318398 A JP 2008318398A JP 5155130 B2 JP5155130 B2 JP 5155130B2
Authority
JP
Japan
Prior art keywords
category
input word
query input
user behavior
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008318398A
Other languages
English (en)
Other versions
JP2010140411A (ja
Inventor
洋信 井上
秀人 湯澤
健一 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2008318398A priority Critical patent/JP5155130B2/ja
Publication of JP2010140411A publication Critical patent/JP2010140411A/ja
Application granted granted Critical
Publication of JP5155130B2 publication Critical patent/JP5155130B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、インターネット等のネットワーク上のコンテンツを検索する技術に関する。
何らかの事項を調べる場合に、インターネット上のポータルサイト等により提供される検索エンジンがよく用いられる。その場合の検索は、Web上のサイトに掲載されている記事等のWeb情報を検索するWeb検索である場合が一般的であるが、質疑応答サイト、ブログ(日記風のサイト)、掲示板等の一般ユーザによる書き込み内容であるUGC(User Generated Contents)情報を対象とした検索が行われる場合もある。UGC情報は企業、団体等のサイトに比べて記事等の書き込みの頻度が高く、正確性はさほど高くないものの、鮮度の高い情報が多いため、現時点で話題となっている事項を調べる場合には有益と考えられる。
質疑応答サイトの一例として、特許文献1には、受信した質問情報をWWW(World Wide Web)のようなネットワーク上で公開し、質問情報に対する回答情報を迅速に受け付けて、質問情報の送信先に回答情報を配信する技術が開示されている。
特開2002−298000号公報
上述したように、従来よりWeb情報を対象とした検索サービスが提供されているが、一般にWeb検索結果はページランク(他のページからのリンク数やアクセス数をベースとした指標)等に基づく重要度を加味した優先順位で表示されるものであり、ヒットした順や更新された順に表示されるわけではなく、必ずしも情報鮮度の高いものばかりが表示されるわけではない。従って、現時点で話題となっている事項を調べる場合に、欲する情報が検索によって得られない場合が多いという問題があった。
また、UGC情報を対象とした検索サービスにおいては、一般にこの種のUGC情報はカテゴライズされているため、検索結果としてカテゴリを表示するものもあるが、最も話題となっているカテゴリを提示してくれることはない。
更に、Web検索結果とともにUGC検索結果を併せて表示する検索サービスも存在するが、単純に検索クエリに入力した検索ワードでヒットした内容を表示するものであり、抽出されるカテゴリもランダムであり、話題の情報を提供しているとは言い難く、検索結果の情報鮮度を上げるという点では貢献していない。
本発明は上記の従来の問題点に鑑み提案されたものであり、その目的とするところは、UGC情報の検索に基づき、情報鮮度の最も高い、現時点で最も話題となっているカテゴリを提示することのできるカテゴリ提示装置を提供することにある。
上記の課題を解決するため、本発明にあっては、請求項1に記載されるように、端末のブラウザにより検索ページに入力されたクエリ入力ワードを取得する検索受付部と、前記検索受付部から取得したクエリ入力ワードに基づいてUGC情報データベースを検索し、予め記事に対して付されたカテゴリに基づき、クエリ入力ワードを含む記事のカテゴリをクエリ入力ワード含有カテゴリとして取得するクエリ入力ワード含有カテゴリ取得部と、前記クエリ入力ワード含有カテゴリ取得部から取得したクエリ入力ワード含有カテゴリに対応するユーザ行動指標を取得するユーザ行動指標取得部と、前記ユーザ行動指標取得部から取得したクエリ入力ワード含有カテゴリに対応するユーザ行動指標に基づいて、当該ユーザ行動指標が適切な値を持つクエリ入力ワード含有カテゴリを特定するカテゴリ特定部と、前記カテゴリ特定部により特定されたクエリ入力ワード含有カテゴリを出力するUGC情報出力部と、クエリ入力ワードに基づいてWeb情報データベースを検索し、クエリ入力ワードを含む記事内容を取得するWeb情報検索部と、前記UGC情報出力部の出力内容と前記Web情報検索部の出力内容とを合成して前記端末のブラウザに向けて出力するページ合成部とを備えるカテゴリ提示装置を要旨としている。
また、請求項2に記載されるように、請求項1に記載のカテゴリ提示装置において、前記カテゴリ特定部により特定されたクエリ入力ワード含有カテゴリに基づいて前記UGC情報データベースからクエリ入力ワードを含む記事内容を取得するUGC情報取得部を更に備え、前記UGC情報出力部は特定されたクエリ入力ワード含有カテゴリとともに当該クエリ入力ワードを含む記事内容を前記端末のブラウザに向けて出力するようにすることができる。
また、請求項に記載されるように、請求項1または2のいずれか一項に記載のカテゴリ提示装置において、前記カテゴリ特定部は、先ずクエリ入力ワード含有カテゴリの最下位のカテゴリのユーザ行動指標に着目してクエリ入力ワード含有カテゴリの特定を行い、ユーザ行動指標に差がない場合は上位のカテゴリのユーザ行動指標に着目してクエリ入力ワード含有カテゴリを特定するようにすることができる。
また、請求項に記載されるように、カテゴリ提示装置が、端末のブラウザにより検索ページに入力されたクエリ入力ワードを取得する検索受付工程と、前記カテゴリ提示装置が、取得したクエリ入力ワードに基づいてUGC情報データベースを検索し、予め記事に対して付されたカテゴリに基づき、クエリ入力ワードを含む記事のカテゴリをクエリ入力ワード含有カテゴリとして取得するクエリ入力ワード含有カテゴリ取得工程と、前記カテゴリ提示装置が、取得したクエリ入力ワード含有カテゴリに対応するユーザ行動指標を取得するユーザ行動指標取得工程と、前記カテゴリ提示装置が、取得したクエリ入力ワード含有カテゴリに対応するユーザ行動指標に基づいて、当該ユーザ行動指標が適切な値を持つクエリ入力ワード含有カテゴリを特定するカテゴリ特定工程と、前記カテゴリ提示装置が、特定されたクエリ入力ワード含有カテゴリを出力するUGC情報出力工程と、クエリ入力ワードに基づいてWeb情報データベースを検索し、クエリ入力ワードを含む記事内容を取得するWeb情報検索工程と、前記UGC情報出力工程の出力内容と前記Web情報検索工程の出力内容とを合成して前記端末のブラウザに向けて出力するページ合成工程とを備えるカテゴリ提示方法として構成することができる。
本発明のカテゴリ提示装置にあっては、UGC情報の検索に基づき、情報鮮度の最も高い、現時点で最も話題となっているカテゴリを提示することができ、そのカテゴリに含まれる記事を総覧したり更に絞り込みをかけたりする等、効率的に情報の閲覧を進めていくことが可能となる。
以下、本発明の好適な実施形態につき説明する。
<構成>
図1は本発明の一実施形態にかかるシステムの構成例を示す図である。
図1において、インターネット等のネットワーク1には、ユーザが操作するPC(Personal Computer)、PDA(Portable Digital Assistants)、携帯電話等の端末2が複数接続されている。端末2は一般的なブラウザ21(Webブラウザ)21を備えている。ブラウザ21は、インターネットの標準プロトコルであるHTTP(Hyper Text Transfer Protocol)等に従い、HTML(Hyper Text Markup Language)等の言語で記述されたページデータの要求・取得・表示およびフォームデータの送信等を行う機能を有している。
一方、ネットワーク1には、ユーザの操作する端末2のブラウザ21からの検索要求に対して検索サービスを提供するカテゴリ提示装置3が接続されている。
カテゴリ提示装置3は、機能部として、検索受付部(クエリ入力ワード取得部)31とクエリ入力ワード含有カテゴリ取得部32とユーザ行動偏差値取得部33とカテゴリ特定部34とUGC情報取得部35とUGC情報出力部36とWeb情報検索部37とWeb情報出力部38とページ合成部39とを備えている。これらの機能部は、カテゴリ提示装置3を構成するコンピュータのCPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等のハードウェア資源上で実行されるコンピュータプログラムによって実現されるものである。これらの機能部は、単一のコンピュータ上に配置される必要はなく、必要に応じて分散される形態であってもよい。
また、カテゴリ提示装置3が参照するデータベースとして、UGC情報データベース41とユーザ行動偏差値データベース(ユーザ行動指標データベース)42とWeb情報データベース43とを備えている。これらのデータベースは、各データベースを保持するコンピュータ内のHDD(Hard Disk Drive)等の記憶媒体上に所定のデータを体系的に保持するものである。
検索受付部31は、端末2のブラウザ21に対して検索ページを提供するとともに、検索ページに入力された検索ワード(クエリ入力ワード)を取得して次段のクエリ入力ワード含有カテゴリ取得部32およびWeb情報検索部37に引き渡す機能を有している。
クエリ入力ワード含有カテゴリ取得部32は、検索受付部31から取得したクエリ入力ワードに基づいてUGC情報データベース41を検索し、クエリ入力ワードを含む記事のクエリ入力ワード含有カテゴリ(複数可)を取得してクエリ入力ワード含有カテゴリリストとし、クエリ入力ワードとともに次段のユーザ行動偏差値取得部33に引き渡す機能を有している。UGC情報とは、質疑応答サイト、ブログ、掲示板等の一般ユーザによる書き込み内容(UGC)のことである。なお、検索の高速化等の理由からUGC情報データベース41にUGC情報をいったん収集(クロール)し、このUGC情報データベース41を検索するようにしているが、質疑応答サイト、ブログ、掲示板等のサイトを直接に検索するようにしてもよい。
ユーザ行動偏差値取得部33は、クエリ入力ワード含有カテゴリ取得部32から取得したクエリ入力ワード含有カテゴリリストに基づいてユーザ行動偏差値データベース42を検索し、クエリ入力ワード含有カテゴリリストに含まれる各クエリ入力ワード含有カテゴリに対応するユーザ行動偏差値を取得し、各クエリ入力ワード含有カテゴリと対応付け、クエリ入力ワードとともに次段のカテゴリ特定部34に引き渡す機能を有している。ユーザ行動偏差値とは、各クエリ入力ワード含有カテゴリに含まれる記事の閲覧回数(PV(Page View)値)の総数(カテゴリ内に含まれる全てのコンテンツに対する閲覧回数を足し合わせた値)の所定期間内の平均値(ユーザ行動平均値)に対する直近の時間帯の偏差値をいい、話題の盛り上がり度合を示す指標として用いている。なお、ユーザ行動偏差値の算出の基礎としている記事の閲覧回数(PV値)に代え、あるいはそれとともに、書き込み回数等の他の取得可能な値(ユーザ行動データ)を用いてもよい。更に、ユーザ行動偏差値に代えて、ユーザの閲覧行動の盛り上がりを示す他の指標を用いてもよい。ユーザ行動偏差値を含め、ユーザの閲覧行動の盛り上がりを示す指標をユーザ行動指標とする。
カテゴリ特定部34は、ユーザ行動偏差値取得部33から取得した複数のクエリ入力ワード含有カテゴリとユーザ行動偏差値の対から、ユーザ行動偏差値の最も大きいクエリ入力ワード含有カテゴリを特定し、クエリ入力ワードとともに次段のUGC情報取得部35に引き渡す機能を有している。なお、ユーザ行動偏差値の比較は先ずクエリ入力ワード含有カテゴリの最下位のカテゴリに着目して行い、ユーザ行動偏差値に差がない場合は上位のカテゴリのユーザ行動偏差値に着目してクエリ入力ワード含有カテゴリを特定する。
UGC情報取得部35は、カテゴリ特定部34から取得したクエリ入力ワード含有カテゴリとクエリ入力ワードに基づいてUGC情報データベース41からクエリ入力ワードを含む記事内容を取得し、その記事内容をクエリ入力ワード含有カテゴリとともにUGC情報として次段のUGC情報出力部36に引き渡す機能を有している。なお、クエリ入力ワード含有カテゴリ取得部32にてUGC情報データベース41を検索した際に記事内容を併せて取得し、ユーザ行動偏差値取得部33、カテゴリ特定部34を経由してUGC情報取得部35に伝搬することで、UGC情報取得部35におけるUGC情報データベース41の検索を省略することもできる。この場合、UGC情報取得部35はカテゴリ特定部34で特定されたクエリ入力ワード含有カテゴリに対応する記事内容を選択するのみの処理となる。
UGC情報出力部36は、UGC情報取得部35から取得したクエリ入力ワード含有カテゴリおよび記事内容から、UGC検索結果の部分的画面データを生成し、次段のページ合成部39に引き渡す機能を有している。
Web情報検索部37は、検索受付部31から取得したクエリ入力ワードに基づいてWeb情報データベース43を検索し、クエリ入力ワードを含む記事内容の一部および記事URLをWeb情報として次段のWeb情報出力部38に引き渡す機能を有している。ここでWeb情報の対象となるのは、広く企業、団体、個人等の運営するサイトに掲載される記事内容である。なお、検索の高速化等の理由からWeb情報データベース43にWeb情報をいったん収集(クロール)し、このWeb情報データベース43を検索するようにしているが、対象となるサイトを直接に検索するようにしてもよい。
Web情報出力部38は、Web情報検索部37から取得したWeb情報から、Web検索結果の部分的画面データを生成し、次段のページ合成部39に引き渡す機能を有している。
ページ合成部39は、UGC情報出力部36から取得したUGC検索結果の部分的画面データとWeb情報出力部38から取得したWeb検索結果の部分的画面データとを合成し、端末2のブラウザ21に検索結果として送信する機能を有している。
図2はカテゴリ提示装置3のハードウェア構成例を示す図である。
図2において、カテゴリ提示装置3は、システムバス301に接続されたCPU302、ROM303、RAM304、NVRAM(Non-Volatile Random Access Memory)305、I/F(Interface)306と、I/F306に接続された、キーボード、マウス、モニタ、CD/DVD(Compact Disk/Digital Versatile Disk)ドライブ等のI/O(Input/Output Device)307、HDD308、NIC(Network Interface Card)309等を備えている。Mはプログラムもしくはデータが格納されたCD/DVD等のメディア(記録媒体)である。
図3はUGC情報データベース41のデータ構造等の例を示す図である。図3(a)はUGC情報データベース41のデータ構造例を示しており、「カテゴリ」「記事番号」「掲載日時」「掲載者」「記事URL」「記事内容」「抽出ターム」等の項目を有している。
「カテゴリ」は、図3(b)に示すような階層構造となっており、質疑応答サイト、ブログ、掲示板等への記事の書き込み時にカテゴリの割当が行われる。図3(b)の最下位のカテゴリが割り当てられることが多いが、それよりも上位のカテゴリが割り当てられる場合もある。
「記事番号」はUGC情報データベース41内で記事を特定する記号である。「掲載日時」は記事の書き込みが行われて掲載が行われた日時である。「掲載者」は記事の掲載を行ったユーザを特定する記号である。「記事URL」は記事の掲載されるサイトのアドレス(URL:Uniform Resource Locator)である。「記事内容」は記事のタイトルおよび本文の内容である。「抽出ターム」は記事内容検索のために抽出されたキーワードである。
図4はユーザ行動偏差値データベース42のデータ構造等の例を示す図である。図4(a)はユーザ行動偏差値データベース42のデータ構造例を示しており、「カテゴリ」「ユーザ行動偏差値」「ユーザ行動平均値」等の項目を有している。
「カテゴリ」は図3(b)に示した各階層のカテゴリである。最下位のカテゴリのみならず、その上位のカテゴリについてもエントリが設けられている。
「ユーザ行動偏差値」は、前述したように、各カテゴリに含まれる記事の閲覧回数(PV値)の所定期間内の平均値(ユーザ行動平均値)に対する直近の時間帯の偏差値である。「ユーザ行動平均値」は上記の所定期間内の平均値である。記事の閲覧回数(PV値)は、対象となる質疑応答サイト、ブログ、掲示板等のサイトから、あるいは、それらのサイトを監視するサーバ等から取得する。
図4(b)はあるカテゴリに含まれる記事についてのPV値の時間的な変化の例を示しており、現時点から所定期間(数日、数週間、数ヶ月等)だけ遡った期間におけるPV値の平均値に対する現時点の属する時間帯(数時間等)のPV値の偏差値がユーザ行動偏差値となる。従って、人気があってPV値が常に高いサイトであっても、PV値に大きな変化がなければユーザ行動偏差値は高くならない。反対に、PV値が低いサイトであっても、PV値に大きな変化があればユーザ行動偏差値は高くなる。
図5はWeb情報データベース43のデータ構造例を示す図であり、「記事URL」「記事内容」「抽出ターム」等の項目を有している。
「記事URL」は記事の掲載されるサイトのアドレス(URL)である。「記事内容」は記事のタイトルおよび本文の内容である。「抽出ターム」は記事内容検索のために抽出されたキーワードである。
<動作>
図6は上記の実施形態の処理例を示すシーケンス図である。
図6において、所望の情報を得ようとするユーザは、端末2のブラウザ21からカテゴリ提示装置3の検索受付部31に対して検索ページを要求する(ステップS101)。ポータルサイトのトップページが検索ページを兼ねている場合には、検索ページの要求はトップページへのアクセスを意味する。検索ページの要求は、インターネットの標準プロトコルであるHTTPに従ったGETメソッドとリクエストURI(Uniform Resource Indicator)等を含むメッセージが端末2のブラウザ21からカテゴリ提示装置3の検索受付部31に送信されることで行なわれる。
検索ページの要求を受信したカテゴリ提示装置3の検索受付部31は、内部的に保持してある検索ページのデータあるいは所定のアルゴリズムに従って動的に生成した検索ページのデータを、要求元である端末2のブラウザ21に応答として送信する(ステップS102)。検索ページはHTML等により記述され、HTTPのレスポンス等に従ってカテゴリ提示装置3の検索受付部31から端末2のブラウザ21に送信される。
検索ページのデータを受信した端末2のブラウザ21は、検索ページを表示する(ステップS103)。図7(a)は検索ページの画面例を示す図であり、検索ワードを入力する入力欄201と、検索ワードの入力後に検索を指示するための検索ボタン202とが設けられている。
図6に戻り、ユーザは端末2のブラウザ21において検索ページの入力欄に検索ワードを入力し、検索ボタンを押下して入力を完了する(ステップS104)。図7(b)は入力欄201に検索ワード「○○○○」を入力した状態を示している。ここでは、検索ワード「○○○○」をお笑い芸人のコンビ名であるものと想定している。
図6に戻り、検索ページへの入力完了により、端末2のブラウザ21はカテゴリ提示装置3の検索受付部31に検索ワードを含むクエリを送信する(ステップS105)。このクエリはHTTPのPOSTメソッドあるいはPUTメソッドに付加されたHTML等のデータとして端末2のブラウザ21からカテゴリ提示装置3の検索受付部31に送信される。
クエリを受信したカテゴリ提示装置3の検索受付部31は、クエリから検索ワード(クエリ入力ワード)を抽出し、クエリ入力ワード含有カテゴリ取得部32に引き渡すとともに(ステップS106)、同クエリ入力ワードをWeb情報検索部37に引き渡す(ステップS107)。このデータの引き渡しはカテゴリ提示装置3内の通信であるため、任意の形式とすることができる。
検索受付部31からクエリ入力ワードを受け取ったクエリ入力ワード含有カテゴリ取得部32は、クエリ入力ワードに基づいてUGC情報データベース41を検索し(ステップS108)、クエリ入力ワードを含む記事のクエリ入力ワード含有カテゴリ(複数可)を取得してクエリ入力ワード含有カテゴリリストとし、クエリ入力ワードとともに次段のユーザ行動偏差値取得部33に引き渡す(ステップS109)。このデータの引き渡しはカテゴリ提示装置3内の通信であるため、任意の形式とすることができる。
すなわち、クエリ入力ワード含有カテゴリ取得部32は図3(a)に示すUGC情報データベース41の記事内容もしくは抽出タームを対象にクエリ入力ワードをキーにして検索を行い、ヒットしたレコードのカテゴリをリスト化してクエリ入力ワード含有カテゴリリストとする。図8(a)はクエリ入力ワード含有カテゴリリストの例を示しており、お笑い芸人のコンビ名である検索ワード「○○○○」から、クエリ入力ワード含有カテゴリリストとして「エンタメ>お笑い>芸人(男性)」「エンタメ>お笑い>プロダクション」「エンタメ>スポーツ>相撲」が得られた状態を示している。「エンタメ>スポーツ>相撲」が含まれているのは、検索ワード「○○○○」が相撲用語にも存在することによる。
図6に戻り、クエリ入力ワード含有カテゴリ取得部32からクエリ入力ワード含有カテゴリリストとクエリ入力ワードを受け取ったユーザ行動偏差値取得部33は、クエリ入力ワード含有カテゴリリストに基づいてユーザ行動偏差値データベース42を検索し(ステップS110)、クエリ入力ワード含有カテゴリリストに含まれる各クエリ入力ワード含有カテゴリに対応するユーザ行動偏差値を取得し、各クエリ入力ワード含有カテゴリと対応付け、クエリ入力ワードとともに次段のカテゴリ特定部34に引き渡す(ステップS111)。このデータの引き渡しはカテゴリ提示装置3内の通信であるため、任意の形式とすることができる。
すなわち、ユーザ行動偏差値取得部33は、クエリ入力ワード含有カテゴリリストに含まれる各クエリ入力ワード含有カテゴリにつき、図4(a)に示すユーザ行動偏差値データベース42のカテゴリとの一致から該当するユーザ行動偏差値を取得し、クエリ入力ワード含有カテゴリリストの各クエリ入力ワード含有カテゴリと対応付ける。図8(b)はクエリ入力ワード含有カテゴリリストの各クエリ入力ワード含有カテゴリとユーザ行動偏差値とが対応付けられた状態を示している。
なお、ユーザ行動偏差値データベース42から予め算出されて格納されているユーザ行動偏差値を取得する手法に代え、記事の閲覧回数(PV値)や書き込み回数等のユーザ行動データをその時点で取得し、演算処理を行うことでユーザ行動偏差値ないしはユーザ行動指標をその都度に算出してもよい。
図6に戻り、ユーザ行動偏差値取得部33からクエリ入力ワード含有カテゴリリストの各クエリ入力ワード含有カテゴリに対応するユーザ行動偏差値とクエリ入力ワードを受け取ったカテゴリ特定部34は、ユーザ行動偏差値の最も大きいクエリ入力ワード含有カテゴリを特定し(ステップS112)、特定したクエリ入力ワード含有カテゴリをクエリ入力ワードとともに次段のUGC情報取得部35に引き渡す(ステップS113)。このデータの引き渡しはカテゴリ提示装置3内の通信であるため、任意の形式とすることができる。
図8(c)は図8(b)の3つのクエリ入力ワード含有カテゴリ「エンタメ>お笑い>芸人(男性)」「エンタメ>お笑い>プロダクション」「エンタメ>スポーツ>相撲」の中からユーザ行動偏差値が最も大きい「エンタメ>お笑い>芸人(男性)」が特定された状態を示している。なお、この例では各クエリ入力ワード含有カテゴリの最下位のカテゴリ(「エンタメ>お笑い>芸人(男性)」であれば「芸人(男性)」まで含めたカテゴリ)のユーザ行動偏差値の大小で特定が行われたので問題ないが、最下位のカテゴリでユーザ行動偏差値が同値となるものがある場合には上位のカテゴリに着目してユーザ行動偏差値の大小を判断し、特定できるまで上位にさかのぼる。例えば、「エンタメ>お笑い>芸人(男性)」と「エンタメ>スポーツ>相撲」のユーザ行動偏差値が同値となったとすると、その上位の「エンタメ>お笑い」と「エンタメ>スポーツ」のユーザ行動偏差値を比較することになる。このような場合に備え、ユーザ行動偏差値取得部33は最下位のみならず上位のカテゴリについてもユーザ行動偏差値を同時に取得しておくか、あるいは、カテゴリ特定部34からユーザ行動偏差値取得部33に対して比較に必要な上位のカテゴリのユーザ行動偏差値の取得をその都度に要求する。
また、ユーザ行動偏差値が最も大きいクエリ入力ワード含有カテゴリを特定する以外に、ユーザ行動偏差値が上位の複数のクエリ入力ワード含有カテゴリを特定するようにしてもよい。なお、ユーザ行動偏差値に代えて一般的なユーザ行動指標を基準にする場合には、当該ユーザ行動指標の性質に応じ、話題になり盛り上がっていることを示す観点から、ユーザ行動指標が適切な値を持つクエリ入力ワード含有カテゴリを特定することになる。
図6に戻り、カテゴリ特定部34から特定後のクエリ入力ワード含有カテゴリとクエリ入力ワードを受け取ったUGC情報取得部35は、特定されたクエリ入力ワード含有カテゴリの範囲内でUGC情報データベース41からクエリ入力ワードを含む記事内容(複数可)を検索して取得し(ステップS114)、その記事内容の一部および記事URLとクエリ入力ワード含有カテゴリをUGC情報として次段のUGC情報出力部36に引き渡す(ステップS115)。このデータの引き渡しはカテゴリ提示装置3内の通信であるため、任意の形式とすることができる。
すなわち、UGC情報取得部35は、図3に示すUGC情報データベース41のカテゴリに対してクエリ入力ワード含有カテゴリをキーにして検索を行うと同時に、記事内容もしくは抽出タームを対象にクエリ入力ワードをキーにして検索を行い、両者のAND条件でヒットしたレコードの記事内容および記事URLを取得する。
図6に戻り、UGC情報取得部35からUGC情報を受け取ったUGC情報出力部36は、クエリ入力ワード含有カテゴリ、記事内容および記事URLからUGC検索結果の部分的画面データ(レイアウト済UGC情報)を生成(ステップS116)し、次段のページ合成部39に引き渡す(ステップS117)。このデータの引き渡しはカテゴリ提示装置3内の通信であるため、任意の形式とすることができる。
すなわち、UGC情報出力部36は、クエリ入力ワード含有カテゴリおよび記事内容および見出しとなる定型語句や図形等から、当該記事へのリンク(ホットリンク)を含むHTML等による部分的なページデータを生成する。
一方、検索受付部31からクエリ入力ワードを受け取ったWeb情報検索部37は、クエリ入力ワードに基づいてWeb情報データベース43を検索し(ステップS118)、クエリ入力ワードを含む記事内容の一部(先頭の所定数の文字等)および記事URLをWeb情報として次段のWeb情報出力部38に引き渡す(ステップS119)。このデータの引き渡しはカテゴリ提示装置3内の通信であるため、任意の形式とすることができる。
すなわち、Web情報検索部37は、図5に示すWeb情報データベース43の記事内容もしくは抽出タームを対象にクエリ入力ワードをキーにして検索を行い、ヒットしたレコードの記事内容の一部および記事URLを取得する。
図6に戻り、Web情報検索部37からWeb情報を受け取ったWeb情報出力部38は、レコードの記事内容の一部および記事URLから、Web検索結果の部分的画面データ(レイアウト済検索結果)を生成し(ステップS120)、次段のページ合成部39に引き渡す(ステップS121)。このデータの引き渡しはカテゴリ提示装置3内の通信であるため、任意の形式とすることができる。
すなわち、Web情報出力部38は、記事内容の一部および記事URLおよび見出しとなる定型語句や図形等から、当該記事へのリンク(ホットリンク)を含むHTML等による部分的なページデータを生成する。
そして、UGC情報出力部36からレイアウト済UGC情報を受け取り、Web情報出力部38からレイアウト済検索結果を受け取ったページ合成部39は、両者のページを合成し(ステップS122)、要求元である端末2のブラウザ21に合成検索結果ページデータを送信する(ステップS123)。合成検索結果ページデータはHTML等により記述され、HTTPのレスポンス等に従ってカテゴリ提示装置3のページ合成部39から端末2のブラウザ21に送信される。検索結果ページデータを受け取った端末2のブラウザ21は、合成検索結果ページを表示する(ステップS124)。
図9は合成検索結果ページの画面例を示す図であり、再検索のための検索ワードの入力欄211および検索ボタン212の他に、Web検索結果表示欄213とUGC検索結果表示欄214とが設けられている。
Web検索結果表示欄213には、Web検索でヒットしたサイトの記事タイトル215、216が表示されている。表示する記事は、更新(掲載)が新しいものから優先的に表示することが望ましい。記事タイトル215、216の表示はホットリンクとなっており、記事タイトル215、216の表示をマウスクリック等により選択することで、該当する記事のページにジャンプすることができる。
また、UGC検索結果表示欄214には、UGC検索から特に話題性の高い記事のカテゴリ217と記事内容218が表示されている。表示する記事は、更新(掲載)が新しいものから優先的に表示することが望ましい。カテゴリ217の表示はホットリンクとなっており、カテゴリ217の表示をマウスクリック等により選択することで、そのカテゴリに属する記事を総覧するページにジャンプすることができる。また、記事内容218の表示もホットリンクとなっており、記事内容218の表示をマウスクリック等により選択することで、その記事のページにジャンプすることができ、当該記事のみならず、その記事に対する回答やコメント等も閲覧することができる。
なお、図9に示した例では、お笑い芸人のコンビ名「○○○○」を検索ワードとして入力したユーザの思い通りに、順当に芸人(男性)カテゴリの話題が表示されているが、仮に相撲で何かあって盛り上がっている場合は、相撲カテゴリが表示されることもあり、その場合、芸人「○○○○」しか想定していなかったユーザに「相撲で何かあったのか!?」という気付きを与えることができる。
図10は検索結果ページの他の画面例を示す図であり、図10(a)は再検索のための検索ワードの入力欄221および検索ボタン222の他にUGC検索結果表示欄223のみを設け、UGC検索結果表示欄223にはカテゴリ224と記事内容225とを表示するようにしたものである。図10(b)はUGC検索結果表示欄223から記事内容(225)を省略し、カテゴリ224のみを表示するようにしたものである。
<総括>
以上説明したように、本実施形態によれば、次のような利点がある。
(1)カテゴライズされたUGC情報に対してキーワード検索を行い、最も話題となっているカテゴリを提示することで、そのカテゴリに含まれる記事を総覧したり更に絞り込みをかけたりする等の操作につなげることができ、UGC情報から得られる鮮度の高い情報を提示することができる。
(2)カテゴリの提示に加え、キーワード検索でヒットした記事内容を併せて表示することで、検索ワードが含まれている特定の記事をピンポイントで閲覧することができ、そのカテゴリに含まれる記事を総覧したり更に絞り込みをかけたりする必要があるか否かを簡単にチェックすることができる。
(3)クエリに入力した検索ワードに対するWeb検索結果を併せて表示することで、話題になっている記事の他に一般的な語句の意味を知ることができ、より豊富な情報を提示することができる。一般的なWeb検索結果と比較した場合には、Web検索結果の弱点である情報鮮度に劣る点を補うものであるということができる。
以上、本発明の好適な実施の形態により本発明を説明した。ここでは特定の具体例を示して本発明を説明したが、特許請求の範囲に定義された本発明の広範な趣旨および範囲から逸脱することなく、これら具体例に様々な修正および変更を加えることができることは明らかである。すなわち、具体例の詳細および添付の図面により本発明が限定されるものと解釈してはならない。
本発明の一実施形態にかかるシステムの構成例を示す図である。 カテゴリ提示装置のハードウェア構成例を示す図である。 UGC情報データベースのデータ構造等の例を示す図である。 ユーザ行動偏差値データベースのデータ構造等の例を示す図である。 Web情報データベースのデータ構造例を示す図である。 実施形態の処理例を示すシーケンス図である。 検索ページの画面例を示す図である。 クエリ入力ワード含有カテゴリの特定の処理例を示す図である。 合成検索結果ページの画面例を示す図である。 検索結果ページの他の画面例を示す図である。
符号の説明
1 ネットワーク
2 端末
21 ブラウザ
3 カテゴリ提示装置
31 検索受付部
32 クエリ入力ワード含有カテゴリ取得部
33 ユーザ行動偏差値取得部
34 カテゴリ特定部
35 UGC情報取得部
36 UGC情報出力部
37 Web情報検索部
38 Web情報出力部
39 ページ合成部
301 システムバス
302 CPU
303 ROM
304 RAM
305 NVRAM
306 I/F
307 I/O
308 HDD
309 NIC
M メディア
41 UGC情報データベース
42 ユーザ行動偏差値データベース
43 Web情報データベース

Claims (4)

  1. 端末のブラウザにより検索ページに入力されたクエリ入力ワードを取得する検索受付部と、
    前記検索受付部から取得したクエリ入力ワードに基づいてUGC情報データベースを検索し、予め記事に対して付されたカテゴリに基づき、クエリ入力ワードを含む記事のカテゴリをクエリ入力ワード含有カテゴリとして取得するクエリ入力ワード含有カテゴリ取得部と、
    前記クエリ入力ワード含有カテゴリ取得部から取得したクエリ入力ワード含有カテゴリに対応するユーザ行動指標を取得するユーザ行動指標取得部と、
    前記ユーザ行動指標取得部から取得したクエリ入力ワード含有カテゴリに対応するユーザ行動指標に基づいて、当該ユーザ行動指標が適切な値を持つクエリ入力ワード含有カテゴリを特定するカテゴリ特定部と、
    前記カテゴリ特定部により特定されたクエリ入力ワード含有カテゴリを出力するUGC情報出力部と
    クエリ入力ワードに基づいてWeb情報データベースを検索し、クエリ入力ワードを含む記事内容を取得するWeb情報検索部と、
    前記UGC情報出力部の出力内容と前記Web情報検索部の出力内容とを合成して前記端末のブラウザに向けて出力するページ合成部と
    を備えたことを特徴とするカテゴリ提示装置。
  2. 請求項1に記載のカテゴリ提示装置において、
    前記カテゴリ特定部により特定されたクエリ入力ワード含有カテゴリに基づいて前記UGC情報データベースからクエリ入力ワードを含む記事内容を取得するUGC情報取得部を更に備え、
    前記UGC情報出力部は特定されたクエリ入力ワード含有カテゴリとともに当該クエリ入力ワードを含む記事内容を前記端末のブラウザに向けて出力する
    ことを特徴とするカテゴリ提示装置。
  3. 請求項1または2のいずれか一項に記載のカテゴリ提示装置において、
    前記カテゴリ特定部は、先ずクエリ入力ワード含有カテゴリの最下位のカテゴリのユーザ行動指標に着目してクエリ入力ワード含有カテゴリの特定を行い、ユーザ行動指標に差がない場合は上位のカテゴリのユーザ行動指標に着目してクエリ入力ワード含有カテゴリを特定する
    ことを特徴とするカテゴリ提示装置。
  4. カテゴリ提示装置が、端末のブラウザにより検索ページに入力されたクエリ入力ワードを取得する検索受付工程と、
    前記カテゴリ提示装置が、取得したクエリ入力ワードに基づいてUGC情報データベースを検索し、予め記事に対して付されたカテゴリに基づき、クエリ入力ワードを含む記事のカテゴリをクエリ入力ワード含有カテゴリとして取得するクエリ入力ワード含有カテゴリ取得工程と、
    前記カテゴリ提示装置が、取得したクエリ入力ワード含有カテゴリに対応するユーザ行動指標を取得するユーザ行動指標取得工程と、
    前記カテゴリ提示装置が、取得したクエリ入力ワード含有カテゴリに対応するユーザ行動指標に基づいて、当該ユーザ行動指標が適切な値を持つクエリ入力ワード含有カテゴリを特定するカテゴリ特定工程と、
    前記カテゴリ提示装置が、特定されたクエリ入力ワード含有カテゴリを出力するUGC情報出力工程と
    クエリ入力ワードに基づいてWeb情報データベースを検索し、クエリ入力ワードを含む記事内容を取得するWeb情報検索工程と、
    前記UGC情報出力工程の出力内容と前記Web情報検索工程の出力内容とを合成して前記端末のブラウザに向けて出力するページ合成工程と
    を備えたことを特徴とするカテゴリ提示方法。
JP2008318398A 2008-12-15 2008-12-15 カテゴリ提示装置 Expired - Fee Related JP5155130B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008318398A JP5155130B2 (ja) 2008-12-15 2008-12-15 カテゴリ提示装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008318398A JP5155130B2 (ja) 2008-12-15 2008-12-15 カテゴリ提示装置

Publications (2)

Publication Number Publication Date
JP2010140411A JP2010140411A (ja) 2010-06-24
JP5155130B2 true JP5155130B2 (ja) 2013-02-27

Family

ID=42350481

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008318398A Expired - Fee Related JP5155130B2 (ja) 2008-12-15 2008-12-15 カテゴリ提示装置

Country Status (1)

Country Link
JP (1) JP5155130B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102202906B (zh) * 2008-11-05 2014-03-26 埃克阿泰克有限责任公司 涂覆的塑料基板的部件标记

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103455523A (zh) 2012-06-05 2013-12-18 深圳市世纪光速信息技术有限公司 进行信息搜索的方法及服务器

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1049540A (ja) * 1996-07-31 1998-02-20 Nec Eng Ltd 情報検索システム
JP2002279047A (ja) * 2001-01-09 2002-09-27 Zuken:Kk 電子掲示板監視システム
JP2002342376A (ja) * 2001-05-18 2002-11-29 Nikon Corp サイト検索方法
JP4363868B2 (ja) * 2002-08-23 2009-11-11 株式会社東芝 検索キーワード分析プログラム及びシステム並びに方法
JP4247428B2 (ja) * 2002-12-27 2009-04-02 株式会社日本総合研究所 情報配信システム、情報配信方法およびその方法をコンピュータに実行させるプログラム
JP2004341960A (ja) * 2003-05-16 2004-12-02 Sony Corp 位置依存情報検索方法、位置依存情報検索装置、位置依存情報提供装置、および位置依存情報検索プログラム
JP2005107688A (ja) * 2003-09-29 2005-04-21 Nippon Telegr & Teleph Corp <Ntt> 情報表示方法及びシステム及び情報表示プログラム
JP2006309515A (ja) * 2005-04-28 2006-11-09 Dainippon Printing Co Ltd 情報配信方法および情報配信サーバ
JP2007122513A (ja) * 2005-10-28 2007-05-17 Dainippon Printing Co Ltd コンテンツ検索方法、及び、コンテンツ検索サーバ
JP4894580B2 (ja) * 2007-03-20 2012-03-14 日本電気株式会社 旬度解析システム、旬度解析方法、及び旬度解析プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102202906B (zh) * 2008-11-05 2014-03-26 埃克阿泰克有限责任公司 涂覆的塑料基板的部件标记

Also Published As

Publication number Publication date
JP2010140411A (ja) 2010-06-24

Similar Documents

Publication Publication Date Title
US7949647B2 (en) Navigation assistance for search engines
US9355185B2 (en) Infinite browse
US7788322B2 (en) Method, system and computer program product for cataloging content on a global computer network
US8438469B1 (en) Embedded review and rating information
JP4859892B2 (ja) 商品広告配信装置、商品広告配信方法、及び商品広告配信制御プログラム
KR101874060B1 (ko) 인터넷 검색 결과들 및 광고 컨텐츠의 배포
US9116992B2 (en) Providing time series information with search results
US20170075899A1 (en) Utilizing keystroke logging to determine items for presentation
JP2008071259A (ja) ブックマーク・タグ設定装置
JP4962980B2 (ja) クリックログを用いた検索結果分類装置及び方法
US20120130974A1 (en) Search engine for ranking a set of pages returned as search results from a search query
JP5185891B2 (ja) コンテンツ提供装置、コンテンツ提供方法およびコンテンツ提供プログラム
JP2009015589A (ja) 関連文書提示システム及びプログラム
JP5155130B2 (ja) カテゴリ提示装置
US8131752B2 (en) Breaking documents
JP2013008207A (ja) 情報提供装置、情報提供方法、情報提供プログラム、情報表示プログラム、及び情報提供プログラムを記憶するコンピュータ読取可能な記録媒体
US20110208718A1 (en) Method and system for adding anchor identifiers to search results
JP5138576B2 (ja) ファセットクエリを利用した検索ナビゲーション装置及び方法
JP4869311B2 (ja) 広告入札用語句提案装置、広告入札用語句提案システムおよび広告入札用語句提案方法
JP5331166B2 (ja) 検索サーバ及び方法
US9081831B2 (en) Methods and systems for presenting document-specific snippets
JP2010003256A (ja) 地名表示態様調整方法、地名表示態様調整装置及び地名表示態様調整システム
WO2016046650A1 (en) Method of and server for processing a message to determine intent
JP2006189980A (ja) 情報検索システム、情報検索サーバ、情報検索方法、及び情報検索プログラム
JP2011227572A (ja) 閲覧端末及び方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120228

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120419

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120717

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121015

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20121022

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121113

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121206

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151214

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5155130

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

LAPS Cancellation because of no payment of annual fees
R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350