JP5723830B2 - 興味分析方法 - Google Patents
興味分析方法 Download PDFInfo
- Publication number
- JP5723830B2 JP5723830B2 JP2012123669A JP2012123669A JP5723830B2 JP 5723830 B2 JP5723830 B2 JP 5723830B2 JP 2012123669 A JP2012123669 A JP 2012123669A JP 2012123669 A JP2012123669 A JP 2012123669A JP 5723830 B2 JP5723830 B2 JP 5723830B2
- Authority
- JP
- Japan
- Prior art keywords
- list
- concept
- content
- user
- condition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
第4の態様によれば、特徴スコアを用いて当該概念の下位概念のユーザ興味スコアを更新することで、選択した概念だけでなく、これらの下位概念についても合理的かつ的確に分析可能となる。
第5の態様によれば、算出されたユーザ興味スコアを用いてコンテンツに対するユーザの評価スコアを算出することで、ユーザの興味に合ったコンテンツを推薦することが可能となる。
図1は、本発明に係る情報推薦システムの全体構成図である。このシステムは、クライアント端末200と、コンテンツサーバ300と、興味分析装置100とを備える。クライアント端末200とコンテンツサーバ300との間、及びコンテンツサーバ300と興味分析装置100との間はそれぞれ通信ネットワークで接続される。ユーザは、クライアント端末200上での閲覧操作及び条件指定により、所望のコンテンツをコンテンツサーバ300から取得し、取得したコンテンツをクライアント端末200の画面に提示して閲覧することができる。
図4において、クライアント端末200は、履歴収集部210、履歴情報送信部220、コンテンツ提示部230、及びコンテンツ要求送信部240、一覧閲覧条件リスト要求送信部250、一覧閲覧条件リスト提示部260、閲覧条件選択履歴収集部270及び条件選択履歴送信部280を備える。
条件選択履歴送信部280は、閲覧条件選択履歴収集部270で収集された条件選択履歴をコンテンツサーバ300を介して興味分析装置100に送信する。
上記図4において、コンテンツサーバ300は、コンテンツ送信処理部310、ソート済み提示コンテンツリスト受信部320、提示コンテンツリスト送信部330、提示コンテンツリスト入力部340、履歴情報転送部350、コンテンツ要求転送部360、一覧閲覧条件リスト要求転送部370、一覧閲覧条件リスト転送部380及び条件選択履歴転送部390を備える。
提示コンテンツリスト入力部340には、サービス運用者により、ユーザの利用するクライアント端末200に提示するコンテンツを一覧にした提示コンテンツリストが入力される。提示コンテンツリスト送信部330は、上記入力された提示コンテンツリストを興味分析装置100へ通信ネットワークを介して送信する。
また、一覧閲覧条件リスト要求転送部370は、クライアント端末200の一覧閲覧条件リスト要求送信部250から送信される条件一覧要求データ(図9)を興味分析装置100に転送する。
条件選択履歴転送部390は、クライアント端末200の条件選択履歴送信部280から送られてくる条件選択履歴を興味分析装置100に転送する。
興味分析装置100は、履歴情報受信部110、特徴スコア算出部120、概念体系更新処理部130、概念体系/ユーザ興味スコアデータベース140、提示コンテンツリスト受信部150、コンテンツデータベース160、コンテンツ評価処理部170、ソート済みコンテンツスコアリスト送信部180、一覧閲覧条件リスト作成部185及び条件選択履歴受信部190を備える。
概念体系更新処理部130は、上記特徴スコアを用いて概念体系における概念間の関係情報(上位概念及び下位概念)に基づいて各概念に対するユーザ興味スコアを更新する。概念体系のグラフに含まれるノードは概念を表し、リンクは概念間の関係を表す。ユーザ興味スコアは、概念体系における各概念に対応するノードの値として保持する。概念体系において、上位に位置するノードほど抽象的な概念を表し、下位に位置するノードほど具体的な概念を表す。概念体系及び概念ID(ノード毎に付与される識別子)は、サービス運用者等が事前に設計し定義するものとする。
(コンテンツデータベース160)
図15にコンテンツデータベース160のデータ構造の一例を示す。コンテンツデータベース160は、コンテンツテーブルと、ユーザ履歴テーブルとを有する。コンテンツテーブルは、コンテンツID、概念ID/関連度リスト、コンテンツ本体、及びコンテンツ登録時刻を有し、提示コンテンツリスト受信部150で受信した各値が格納される。
図16に概念体系/ユーザ興味スコアデータベース140のデータ構造の一例を示す。概念体系/ユーザ興味スコア140は、ルート概念ノードIDと、概念体系テーブルと、ユーザ興味スコアテーブルとを有する。ルート概念ノードIDとは、概念体系構造において最上位にある概念ノードIDである。システム内に1つだけ存在する。概念体系テーブルは、自概念ID、親概念IDリスト、及び子概念IDリストを格納する。概念体系内の全ての自概念IDは、親概念ID及び子概念ID(ただし、自概念が最下位の場合には子概念IDは無し)と紐付けて保存されており、これにより概念構造が定義される。ユーザ興味スコアテーブルは、概念ID、ユーザID(もしくは、クライアント端末ID)、TotalZ(ユーザ興味スコア)、X、及びYの値を格納する。TotalZ、X、及びYの定義及び算出方法は後述する。
提示コンテンツリスト受信部150は、コンテンツサーバ300から上記図11のような提示コンテンツリストを受信し、コンテンツデータベース160に保存する。
(履歴情報受信部110)
図17に、履歴情報受信部110の処理フローを示す。ステップS11において、履歴情報受信部110は、クライアント端末200から送信されるユーザID(もしくは、クライアント端末ID)、一覧閲覧コンテンツリスト及び詳細閲覧コンテンツリストをコンテンツサーバ300を介して受信し、特徴スコア算出部120へ出力する。
条件選択履歴受信部190は、クライアント端末200の条件選択履歴送信部280から送信される一覧閲覧条件リスト及び条件選択リストをコンテンツサーバ300を介して受信し、特徴スコア算出部120へ出力する。また、条件選択履歴受信部190は、条件選択リストを一覧閲覧条件リスト作成部185及びコンテンツ評価処理部170へ出力する。
一覧閲覧条件リスト作成部185は、コンテンツサーバ300の一覧閲覧条件リスト要求転送部370から送られてくる一覧閲覧リスト要求データに基づいて提示用一覧閲覧条件リストを作成する。例えば、図9(a)のような条件検索キーワードが送られてきた場合は、当該キーワードに合致する検索結果を示す提示用一覧閲覧条件リストを作成する。図9(b)のような条件一覧要求が送られてきた場合は、条件一覧を例えば名前順に並び替えた提示用一覧閲覧条件リストを作成する。図9(c)のような親概念が送られてきた場合は、概念体系/ユーザ興味スコアデータベース140を参照して、当該親概念の直接の下位概念の一覧を抽出した提示用一覧閲覧条件リストを作成する。また、一覧閲覧条件リスト作成部185は、条件選択履歴受信部190から条件選択リストが入力されると、概念体系/ユーザ興味スコアデータベース140を参照して、条件選択リストで指定される条件に該当する下位概念を抽出した提示用一覧閲覧条件リストを作成する。作成された提示用一覧閲覧条件リストは、通信ネットワークを介してコンテンツサーバ300に送信される。
特徴スコア算出部120は、一覧閲覧コンテンツリスト及び詳細閲覧コンテンツリストを利用して、概念選択の統計モデルにより各概念の特徴スコア(後述するZ値)を算出する。また、特徴スコア算出部120は、条件選択履歴受信部190から入力される一覧閲覧条件リスト及び条件選択リストを利用して、条件として選択した各概念に対する特徴スコア(後述するZ´値)を算出する。
図18に、特徴スコア算出部120の処理フローを示す。特徴スコア算出部120には、履歴情報受信部110からユーザID(もしくは、クライアント端末ID)、一覧閲覧コンテンツリスト及び詳細閲覧コンテンツリストが入力される。
図19に、分析パラメータリストのデータ構成例を示す。分析パラメータリストは、クラスタID毎に、一覧閲覧コンテンツリストのコンテンツ総数S(第1の総数)、詳細閲覧コンテンツリストのコンテンツ総数a(第2の総数)、クラスタIDに紐づいた出現概念リスト内の概念ID毎に算出するNとnがある。N(第1の出現数)は、一覧閲覧コンテンツリストにおいて当該概念IDが付与されているコンテンツ数とする。n(第2の出現数)は詳細閲覧コンテンツリストにおける当該概念IDが付与されているコンテンツ数とする。なお、ステップS13にて追加した上位概念も含めて出現概念リスト内の概念IDすべてについて、Nとnを算出する。
そして、特徴スコア算出部120は、図21に示すように、上記算出した累積確率H1及びH2を用いて、標準正規分布の累積分布関数の逆関数により特徴スコアZを算出する。図20(c)に示すように、上記H1を累積確率とする標準正規分布の累積分布関数の逆関数により特徴スコアZを求める。なお、累積確率としてH2を利用する場合には、標準正規分布の累積分布関数の逆関数の返値の符号を負にして特徴スコアZを求める。この特徴スコアZを用いて、後述する概念体系更新処理部130は、「野球」という概念に対するユーザ興味スコア(TotalZ)を求める。
また、特徴スコア算出部120は、条件選択履歴受信部190から入力される一覧閲覧条件リスト及び条件選択リストを利用して、条件として選択した各概念に対する特徴スコア(Z´値)を算出する。
例えば、図22の概念体系において、ビール、あるいは赤ワインを絞り込み条件として指定した場合、“ワイン”配下の選択肢(“赤ワイン”、“白ワイン”、“ロゼ”)の中から、“赤ワイン”を絞り込み条件として選択する事が、偶然と比較しどの程度珍しいかの程度、あるいは、“洋酒”配下の選択肢(“ワイン”、“ビール”、“ウィスキー”)の中から、“ビール”を絞り込み条件として選択する事が、偶然と比較しどの程度珍しいかの程度を用いてユーザの興味スコアを推定することができる。
例えば、図26の概念体系において、ウィスキーを除外条件として指定した場合、“洋酒”配下の選択肢(“ワイン”、“ビール”、“ウィスキー”)の中から、“ウィスキー”を除外条件として選択する事が、偶然と比較しどの程度珍しいかの程度を用いてユーザの興味スコアを推定することができる。
図31に、概念体系更新処理部130の処理フローを示す。概念体系更新処理部130には、特徴スコア算出部120から、ユーザID(もしくは、クライアント端末ID)及び更新対象概念リスト{クラスタID,{概念ID,特徴スコア=Z,重み=w},…}が入力される。
減衰の計算式の例を示す。例えば、kを減衰率(例えばk=0・8)と設定し、以下のように算出することができる。
TotalZ(減衰後)=k×TotalZ(現在)
X(減衰後)=k2×X(現在)
Y(減衰後)=k2×Y(現在)
さらに、ステップS17において、概念体系更新処理部130は、「更新対象概念リスト」の各概念ID(出現概念及び上位概念)の下位概念を抽出し、下位概念のノード値を更新する。下位概念の抽出では、「更新対象概念リスト」の各概念IDについて、図16の概念体系/興味度データベース140の概念体系テーブルを参照し、子概念IDリストから概念IDのリストを抽出し、さらに各子概念IDリストの概念IDについて概念体系テーブルを参照して子概念リストを抽出する処理を繰り返す。
また、興味概念体系更新処理部130は、絞り込み条件または除外条件が指定された場合、特徴スコアZ´を用いて概念体系における概念間の関係情報(上位概念及び下位概念)に基づいて各概念に対するユーザ興味スコアを更新する。
興味概念体系更新処理部130は、図25のように算出された各選択についての特徴スコアを、図33に示すように子孫概念に伝播させる。例えば、“洋酒”について算出された特徴スコア(Z´=0.67)を“洋酒”の子ノードにも確率結合により加える。子孫概念に特徴スコアを伝播させ、かつ絞り込み条件選択経路の特定を考慮し、絞り込み条件に関する全ての選択を確率結合すると、図34に示す結果が得られる。あるいは、図23に示すような条件選択経路を特定しない場合は、図35に示す結果が得られる。なお、図34,図35中の値は、図17に示すユーザ興味スコアを算出するために用いる(Z,X,Y)の値を表す。
興味概念体系更新処理部130は、図29のように計算された各選択についての特徴スコアを図36に示すように子孫概念に伝播させる。例えば、“洋酒”について算出された特徴スコア(Z´=−0.67)を“洋酒”の子ノードにも確率結合により加える。子孫概念に特徴スコアを伝播させ、かつ除外条件選択経路の特定を考慮し、除外条件に関する全ての選択を確率結合すると、図36に示す結果が得られる。あるいは、図27に示すような除外条件選択経路を特定しない場合は、図37に示す結果が得られる。なお、図36,図37中の値は、図32に示すユーザ興味スコアを算出するために用いる(Z,X,Y)の値を表す。
さらに、図34に示す結果と図36に示す結果を統合すると図38に示す結果が得られる。図35に示す結果と図37に示す結果を統合すると図39に示す結果を得ることができる。
図40にコンテンツ評価処理部170の処理フローを示す。コンテンツ評価処理部170には、コンテンツサーバ300のコンテンツ要求転送部360からの通知を入力として、コンテンツデータベース160のコンテンツテーブルから図11のような形式の提示コンテンツリストを読み出して以下のコンテンツ評価処理を行う。コンテンツ要求転送部360からはユーザID(もしくは、クライアント端末ID)を含む、図5に示すようなコンテンツ要求データを受信する。また、上記提示コンテンツリストについては、サービス運用者もしくはサービス利用者(クライアント端末利用者)の事前設定により、過去何日以内に登録されたコンテンツのみを評価対象とするか(提示コンテンツリストに含めるか)を設定することができる。
変形例1としては、EntityZx=MAX(TotalZi*wi)により求める。MAX(TotalZi*wi)は、i∈pのTotalZi*wiの最大値を返す関数とする。
ステップS23において、コンテンツ評価処理部170は、コンテンツスコアリストに含まれるコンテンツを評価スコアEntityZxの降順にソートし、ソート済みコンテンツスコアリストをソート済みコンテンツスコアリスト送信部180に出力する。
ソート済みコンテンツスコアリスト送信部180は、コンテンツ評価処理部170から入力されるソート済みコンテンツスコアリストとユーザID(もしくは、クライアント端末ID)を通信ネットワークを介してコンテンツサーバ300に送信する。
また、本実施形態では、ユーザの履歴を用いた興味推定とユーザが行った条件指定履歴を用いた興味推定を組合せ、ユーザがその時点で望む情報を精度良く提示する事ができる。
Claims (5)
- コンピュータによって複数の概念に対するユーザ興味スコアを体系化した概念体系を用いてユーザの興味を分析する方法であって、
前記概念体系における絞り込み条件の選択候補となる複数の概念を一覧として閲覧した第1の条件リストと、前記第1の条件リストから前記ユーザにより選択された概念から成る第2の条件リストとを取得するステップと、
前記第1の条件リストに含まれる概念iの総数を第1の総数、前記第1の条件リストにおいて前記ユーザにより選択された概念iが出現する数を第1の出現数、前記第2の条件リストに含まれる概念iの総数を第2の総数、前記第2の条件リストにおいて前記ユーザにより選択された概念iが出現する数を第2の出現数としたとき、前記第1の総数、前記第1の出現数、及び前記第2の総数の条件下で、前記第1の条件リストから前記ユーザにより選択された概念iが前記第2の条件リストに出現する数が、前記第2の出現数以上となる第1の確率及び前記第2の出現数以下となる第2の確率を算出し、前記第1の確率及び前記第2の確率をもとに標準正規分布の累積分布関数の逆関数により特徴スコアを算出する算出ステップと、
前記特徴スコアを用いて前記概念iに対する前記ユーザ興味スコアを更新する更新ステップと
を有することを特徴とする興味分析方法。 - コンピュータによって複数の概念に対するユーザ興味スコアを体系化した概念体系を用いてユーザの興味を分析する方法であって、
前記概念体系における除外条件の選択候補となる複数の概念を一覧として閲覧した第1の条件リストと、前記第1の条件リストから前記ユーザにより選択された概念から成る第2の条件リストとを取得するステップと、
前記第1の条件リストに含まれる概念iの総数を第1の総数、前記第1の条件リストにおいて前記ユーザにより選択された概念iが出現する数を第1の出現数、前記第2の条件リストに含まれる概念iの総数を第2の総数、前記第2の条件リストにおいて前記ユーザにより選択された概念iが出現する数を第2の出現数としたとき、前記第1の総数、前記第1の出現数、及び前記第2の総数の条件下で、前記第1の条件リストから前記ユーザにより選択された概念iが前記第2の条件リストに出現する数が、前記第2の出現数以上となる第1の確率及び前記第2の出現数以下となる第2の確率を算出し、前記第1の確率及び前記第2の確率をもとに標準正規分布の累積分布関数の逆関数により特徴スコアを算出する算出ステップと、
前記特徴スコアを用いて前記概念iに対する前記ユーザ興味スコアを更新する更新ステップと
を有することを特徴とする興味分析方法。 - 前記算出ステップは、前記第2の条件リストに含まれる概念iをもとに前記概念体系における選択経路を特定し、前記選択経路に発生する各選択に対応する各概念について前記特徴スコアを算出することを特徴とする請求項1又は2に記載の興味分析方法。
- 前記更新ステップは、前記特徴スコアを用いて当該概念iの下位概念のユーザ興味スコアを更新することを特徴とする請求項1乃至3のいずれか1項に記載の興味分析方法。
- 1つ以上の概念が出現するコンテンツについて、当該コンテンツに出現する各概念の前記ユーザ興味スコアを用いて、当該コンテンツに対するユーザの評価スコアを算出する評価ステップをさらに有することを特徴とする請求項1乃至4のいずれか1項に記載の興味分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012123669A JP5723830B2 (ja) | 2012-05-30 | 2012-05-30 | 興味分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012123669A JP5723830B2 (ja) | 2012-05-30 | 2012-05-30 | 興味分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013250672A JP2013250672A (ja) | 2013-12-12 |
JP5723830B2 true JP5723830B2 (ja) | 2015-05-27 |
Family
ID=49849325
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012123669A Expired - Fee Related JP5723830B2 (ja) | 2012-05-30 | 2012-05-30 | 興味分析方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5723830B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6570978B2 (ja) * | 2015-11-17 | 2019-09-04 | 株式会社Nttドコモ | クラスタ選択装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012053863A (ja) * | 2010-08-06 | 2012-03-15 | Nippon Telegr & Teleph Corp <Ntt> | 情報推薦処理装置とそのプログラム |
-
2012
- 2012-05-30 JP JP2012123669A patent/JP5723830B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2013250672A (ja) | 2013-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5668007B2 (ja) | 興味分析方法、装置及びプログラム | |
CN102609523B (zh) | 基于物品分类和用户分类的协同过滤推荐方法 | |
JP5778255B2 (ja) | 垂直検索に基づいたクエリの方法、システム、および装置 | |
US8572116B2 (en) | System for recommending an article not present in an image | |
JP5668010B2 (ja) | 情報推薦方法、装置及びプログラム | |
JP2015509222A (ja) | 決定されたユーザグループに基づく情報推薦の提供 | |
KR20080028574A (ko) | 통합 검색 서비스 시스템 및 방법 | |
US11100169B2 (en) | Alternative query suggestion in electronic searching | |
JP5556711B2 (ja) | カテゴリ分類処理装置、カテゴリ分類処理方法、カテゴリ分類処理プログラム記録媒体、カテゴリ分類処理システム | |
JP5723835B2 (ja) | 興味分析方法、興味分析装置及びそのプログラム | |
JP2007018285A (ja) | 情報提供システム、情報提供方法、情報提供装置並びに情報提供プログラム | |
WO2017061038A1 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
JP7166116B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP5667959B2 (ja) | 影響度分析方法、影響度分析装置及びそのプログラム | |
CN112579854A (zh) | 信息处理方法、装置、设备和存储介质 | |
JP5836210B2 (ja) | 影響力推定方法、装置及びプログラム | |
US8700625B1 (en) | Identifying alternative products | |
JP5504213B2 (ja) | 興味分析方法及び興味分析装置 | |
US20100161659A1 (en) | Information supplying server | |
JP6357283B2 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
CN107239495A (zh) | 基于关系链权重的商品以及搜索排序展示方法 | |
JP2013105257A (ja) | キーワード取得装置、コンテンツ提供システム、キーワード取得方法、プログラム及びコンテンツ提供方法 | |
JP5723830B2 (ja) | 興味分析方法 | |
KR101180359B1 (ko) | 제품리뷰정보 구축 및 제공방법 | |
KR20100113421A (ko) | 키워드 추천방법 및 그 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140625 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141226 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150106 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150303 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150324 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150330 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5723830 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |