JP6040137B2 - Item recommendation device, item recommendation method, and item recommendation program - Google Patents
Item recommendation device, item recommendation method, and item recommendation program Download PDFInfo
- Publication number
- JP6040137B2 JP6040137B2 JP2013216573A JP2013216573A JP6040137B2 JP 6040137 B2 JP6040137 B2 JP 6040137B2 JP 2013216573 A JP2013216573 A JP 2013216573A JP 2013216573 A JP2013216573 A JP 2013216573A JP 6040137 B2 JP6040137 B2 JP 6040137B2
- Authority
- JP
- Japan
- Prior art keywords
- program
- topic
- item
- relevance
- calculated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、ある情報に関連するアイテムを推薦する装置、特に世の中のトレンドに基づいて、TVやVOD(ビデオオンデマンド)等の番組と関連するアイテムを推定し、推薦するためのアイテム推薦装置、方法、プログラムに関する。 The present invention is an apparatus for recommending items related to certain information, in particular, an item recommendation apparatus for estimating and recommending items related to programs such as TV and VOD (video on demand) based on the trend of the world, Methods and programs.
TVのデジタル化やインターネットの普及に伴い、単に番組を視聴するだけでなく、TVを媒介とした様々なサービスを利用できるようになった。具体的には、番組関連情報の閲覧やショッピング等のサービスが提供されている(例えば特許文献1、2、3参照)。
With the digitization of TV and the spread of the Internet, it has become possible not only to watch programs but also to use various services via TV. Specifically, services such as browsing of program related information and shopping are provided (see, for example,
特許文献1においては、推薦するアイテムについて、予め番組とアイテムが関連付けられていることが前提である。しかし、膨大な数のアイテムから、人手で関連するアイテムを選ぶのは、多大なコストを要する作業である。
In
これに対し、特許文献2によれば、電子番組表(EPG)やクローズドキャプション(CC)のメタデータを基に、映像データの所定のタイミングで関連情報を提供することができる。
On the other hand, according to
また、特許文献3によれば、ユーザの番組視聴履歴に基づいて、過去に視聴していた番組情報を解析し、ユーザの嗜好を把握することで、ユーザの好みに合った番組を推薦する方法が提案されている。
According to
尚、本発明においてトピック抽出の際に利用する、トピックモデルであるLatent Dirichlet Allocation(LDA)は非特許文献1に記載され、また本発明の番組トピック関連度計算部が、隣接行列に基づいて番組およびトピックの各特徴量を求める際に利用するPower Iterationの技術は非特許文献2に記載されている。
Note that the topic direc- tion allocation (LDA) used in topic extraction in the present invention is described in Non-Patent
しかし、従来の番組情報や視聴履歴を用いた技術は、ユーザの好みに基づいてアイテムを推薦できる一方で、世の中のトレンドに基づいた推薦はできなかった。例えばスポーツ番組を視聴しているユーザに対して、スポーツ映像や用品等のアイテムを推薦することはできるが、今何のスポーツ映像や用品に関する内容が話題になっているのかといった、今話題のトピックに関連するアイテムを推薦することができないという問題があった。 However, conventional techniques using program information and viewing history can recommend items based on user preferences, but cannot make recommendations based on trends in the world. For example, you can recommend items such as sports videos and equipment to users who are watching sports programs, but topics that are currently discussed, such as what sports videos and equipment are currently being discussed There was a problem that items related to could not be recommended.
また、特許文献2をはじめとする従来技術の多くは、推薦するアイテムを番組情報に基づいて検索しているが、用いる番組の情報量が不十分な場合が多く、番組と関連する多くのアイテムを推薦できないという問題がある。一般的な番組情報としては、放送波と共に配信されるEPGやクローズドキャプションCCがある。
In addition, many of the conventional techniques including
しかし、EPGは番組の概要であるため具体的な情報に乏しく、CCを含まない番組も多く存在する。例えば、箱根駅伝の視聴者にシューズやウェアを推薦したい場合、箱根駅伝の番組情報にはシューズという単語が含まれていることはなく、逆にシューズのメタデータにおいては箱根駅伝という単語が含まれていないため、従来技術では推薦することができない。これに対し、人手により番組情報を増やすサービスも存在するが、これは非常にコストがかかるという問題がある。 However, since the EPG is an outline of a program, there is a lack of specific information, and there are many programs that do not include a CC. For example, if you want to recommend shoes and wear to viewers of Hakone Ekiden, the program information for Hakone Ekiden will not include the word shoes, but conversely the shoe metadata will include the word Hakone Ekiden. Therefore, it cannot be recommended by the conventional technology. On the other hand, there is a service for manually increasing program information, but this has a problem that it is very expensive.
本発明は上記課題を解決するものであり、その目的は、世の中のトレンドに基づいた話題のトピックと関連し、かつ番組と関連するアイテムを推薦することができるアイテム推薦装置、方法、プログラムを提供することにある。 SUMMARY OF THE INVENTION The present invention solves the above-mentioned problems, and an object thereof is to provide an item recommendation device, method, and program capable of recommending an item related to a topic based on a trend in the world and related to a program. There is to do.
上記課題を解決するための本発明のアイテム推薦装置は、番組と関連するアイテムを推薦するアイテム推薦装置であって、テキストの集合が格納されたテキストストリーム記憶部から特徴語を含むトピックを抽出するトピック抽出手段と、前記トピック抽出手段により抽出されたトピックのトレンド度合いを表すトレンドスコアを計算し、前記トピックとともに記憶するトレンドスコア計算手段と、Web情報が格納されたWeb情報データベースから番組情報と関連するWeb情報を抽出し、該抽出した番組関連Web情報を記憶する番組関連Web情報抽出手段と、番組情報、前記番組関連Web情報抽出手段により抽出された番組関連Web情報および前記トレンドスコア計算手段により記憶されたトピックに基づいて、番組とトピックの関連度を計算する番組・トピック関連度計算手段と、アイテムとそれに関する情報が格納されたアイテム情報データベースと、前記アイテム情報データベース内のアイテム、前記番組・トピック関連度計算手段により計算された番組とトピックの関連度および前記トレンドスコア計算手段により計算し記憶されたトピックのトレンドスコアに基づいて、番組とアイテムの関連度を計算する番組・アイテム関連度計算手段と、前記番組・アイテム関連度計算手段によって計算された番組とアイテムの関連度に基づいて、当該番組において推薦するアイテムを出力する出力手段と、を備えたことを特徴としている。 An item recommendation device according to the present invention for solving the above-described problem is an item recommendation device for recommending an item related to a program, and extracts a topic including a feature word from a text stream storage unit in which a set of texts is stored. Topic extraction means, trend score calculation means for calculating the trend score of the topic extracted by the topic extraction means, and storing the trend score together with the topic; and related to program information from the Web information database storing the Web information Program-related Web information extracting means for extracting Web information to be stored and storing the extracted program-related Web information; program information; program-related Web information extracted by the program-related Web information extracting means; and the trend score calculating means Programs and topics based on memorized topics Program / topic relevance calculating means for calculating the relevance of items, item information database storing items and information related thereto, items in the item information database, programs calculated by the program / topic relevance calculating means Program / item relevance calculating means for calculating the relevance of a program and an item based on the topic relevance and the topic trend score calculated and stored by the trend score calculating means, and the program / item relevance calculation Output means for outputting an item recommended in the program based on the degree of association between the program and the item calculated by the means.
なお、テキストストリームとはマイクロブログ(例えばTwitter(登録商標))等のリアルタイム性の高いテキストを想定している。 The text stream is assumed to be text with high real-time properties such as a microblog (for example, Twitter (registered trademark)).
本発明によれば、世の中のトレンドに基づいた話題のトピックと関連し、かつ番組と関連するアイテムを推薦することができる。また、番組情報がEPGおよびCCのみの少ない情報量であっても、番組関連Web情報を抽出し利用しているので、幅広く番組とアイテムとを関連付け、関連アイテムを推薦することができる。 ADVANTAGE OF THE INVENTION According to this invention, the item relevant to the topic of a topic based on the trend of the world and relevant to a program can be recommended. Further, even if the program information has a small amount of information only of EPG and CC, since the program related Web information is extracted and used, it is possible to widely associate programs with items and recommend related items.
以下、図面を参照しながら本発明の実施の形態を説明するが、本発明は下記の実施形態例に限定されるものではない。図1は本発明の一実施形態例によるアイテム推薦装置の構成を示している。 Hereinafter, embodiments of the present invention will be described with reference to the drawings, but the present invention is not limited to the following embodiments. FIG. 1 shows the configuration of an item recommendation device according to an embodiment of the present invention.
図1に示すアイテム推薦装置は、テキストストリーム記憶部10、トピック抽出手段としてのトピック抽出部20、トレンドスコア計算手段を構成するトレンドスコア計算部30およびトピック・トレンドスコア記憶部40、Web情報DB50、番組関連Web情報抽出手段を構成する番組関連Web情報抽出部60および番組関連Web情報記憶部70、番組・トピック関連度計算手段としての番組・トピック関連度計算部80、アイテム情報DB90、番組・アイテム関連度計算手段としての番組・アイテム関連度計算部100、出力手段としての出力部110を備えている。
The item recommendation device shown in FIG. 1 includes a text
トピック抽出部20は、マイクロブログ(例えばTwitter)等のテキストの集合が格納されたテキストストリーム記憶部10から特徴語を含むトピックを抽出する。
The
トレンドスコア計算部30は、トピック抽出部20により抽出されたトピックのトレンド度合いを表すトレンドスコアを計算し、トピックとともにトピック・トレンドスコア記憶部40に記憶する。
The trend
番組関連Web情報抽出部60は、Web情報が格納されたWeb情報DB50から番組情報(EPG(電子番組表)、CC(クローズドキャプション)のデータ)と関連するWeb情報を抽出し、該抽出した番組関連Web情報を番組関連Web情報記憶部70に記憶する。
The program-related Web
番組・トピック関連度計算部80は、番組情報、番組関連Web情報記憶部70に記憶された番組関連Web情報およびトピック・トレンドスコア記憶部40に記憶されたトピックに基づいて、番組とトピックの関連度を計算する。
The program / topic
アイテム情報DB90には、アイテムとそれに関する情報が格納されている。 The item information DB 90 stores items and information related thereto.
番組・アイテム関連度計算部100は、アイテム情報DB90内のアイテム、番組・トピック関連度計算部80により計算された番組とトピックの関連度およびトピック・トレンドスコア記憶部40に記憶されたトピックのトレンドスコアに基づいて、番組とアイテムの関連度を計算する。
The program / item
出力部110は、番組・アイテム関連度計算部100によって計算された番組とアイテムの関連度に基づいて、当該番組において推薦するアイテムを出力する。
The
図1のアイテム推薦装置は、例えばコンピュータにより構成され、通常のコンピュータのハードウェアリソース、例えばROM、RAM、CPU、入力装置、出力装置、通信インターフェース、ハードディスク、記録媒体およびその駆動装置を備えている。 The item recommendation device in FIG. 1 is configured by a computer, for example, and includes hardware resources of a normal computer, such as a ROM, a RAM, a CPU, an input device, an output device, a communication interface, a hard disk, a recording medium, and a driving device thereof. .
このハードウェアリソースとソフトウェアリソース(OS、アプリケーションなど)との協働の結果、アイテム推薦装置は、図1に示すように、テキストストリーム記憶部10、トピック抽出部20、トレンドスコア計算部30、トピック・トレンドスコア記憶部40、Web情報DB50、番組関連Web情報抽出部60、番組関連Web情報記憶部70、番組・トピック関連度計算部80、アイテム情報DB90、番組・アイテム関連度計算部100、出力部110を実装する。
As a result of the cooperation between the hardware resource and the software resource (OS, application, etc.), as shown in FIG. 1, the item recommendation device has a text
前記テキストストリーム記憶部10、トピック・トレンドスコア記憶部40、Web情報DB50、番組関連Web情報記憶部70、アイテム情報DB90は、ハードディスクあるいはRAMなどの保存手段・記憶手段に構築されているものとする。
The text
次に、上記のように構成された装置の動作を具体的に説明する。本実施形態例における処理は、テキストストリームからのトレンドトピックの計算、番組と関連するトレンドトピックに基づくアイテム推薦の二つに分かれる。 Next, the operation of the apparatus configured as described above will be specifically described. The processing in the present embodiment is divided into two types: calculation of a trend topic from a text stream, and item recommendation based on a trend topic associated with a program.
最初に、テキストストリームからのトレンドトピックの計算について説明する。図2は、本発明の一実施の形態におけるテキストストリームからのトレンドトピックを計算する処理のフローチャートを示している。 First, calculation of trend topics from a text stream will be described. FIG. 2 shows a flowchart of processing for calculating a trend topic from a text stream according to an embodiment of the present invention.
<ステップS210> コンピュータは、一定時間分のテキストストリームに関して、発生時間、テキスト情報とテキストIDをテキストストリーム記憶部10に記憶する。記憶例を図3に示す。記憶されたテキストストリームは一定時間後削除され、再度新たに一定時間分のテキストストリームを記憶する。ここで、テキストストリームとはマイクロブログ(例えばTwitter)等のリアルタイム性の高いテキストを想定している。
<Step S210> The computer stores the generation time, text information, and text ID in the text
<ステップS220> トピック抽出部20が、テキストストリーム記憶部10に記憶されたテキストd∈Dからトピックz∈Zを抽出する。ここでDはテキスト集合、Zはトピック集合であり、トピックzは特徴語w∈Wの集合で表される(Wは語彙全体の集合)。トピック抽出のために、トピック抽出部20は形態素解析器を用いて、テキストを名詞・動詞・形容詞等の単語集合に分割する。トピックの抽出には、代表的なトピックモデルであるLatent Dirichlet Allocation(LDA)(非特許文献1)等、公知のものを用いることができる。図4に抽出されたトピックの例を示す。各トピックはトピックIDおよびトレンドスコアを持つ。トレンドスコアの算出方法は後述する。
<Step S220> The
<ステップS230> トレンドスコア計算部30が、抽出された各トピックziのトレンドスコアTziを計算する。トレンドスコアは、あるトピックに関係するテキストが多く発生しているほど、そのトピックはトレンド度合が高いとみなして算出する。例えば以下の式(1)のように算出する。
<Step S230> The trend
ここで、iおよびjはそれぞれトピックとテキストのIDであり、P(zi|dj)はテキストdjにおけるトピックziの生起確率である。図4に各トピックに関して計算されたトレンドスコアの例を示す。 Here, i and j are topic and text IDs, respectively, and P (z i | d j ) is the occurrence probability of topic z i in text d j . FIG. 4 shows an example of the trend score calculated for each topic.
<ステップS240> 抽出・計算したトピックとトレンドスコアを、トピック・トレンドスコア記憶部40に記憶する。記憶例は図4に示す通りである。
<Step S240> The extracted and calculated topic and trend score are stored in the topic / trend
次に、番組と関連するトレンドトピックに基づくアイテム推薦について説明する。図5は、本発明の一実施の形態における番組と関連するトレンドトピックに基づくアイテムを推薦する処理のフローチャートを示している。 Next, item recommendation based on trend topics related to programs will be described. FIG. 5 shows a flowchart of a process for recommending an item based on a trend topic associated with a program according to an embodiment of the present invention.
<ステップS310> Web情報DB50には、例えばインターネットをクロールして得られた、Wikipedia(登録商標)記事やTwitterの番組ハッシュタグ付きTweet(登録商標)等が格納されており、番組関連Web情報抽出部60からの要求に従って、番組EPGやCCと関連するWeb情報を送信する。番組関連Web情報抽出部60は、例えばEPGやCCとWeb情報DB50内のWeb情報のテキストを形態素解析器によって単語単位に分割した後、各テキストに関して出現する単語情報に基づき、テキストの特徴を表すベクトルを構築する。それら特徴ベクトルの関連度をコサイン類似度等によって計算し、番組と関連するWeb情報を抽出する。
<Step S310> The
<ステップS320> 番組関連Web情報抽出部60の要求に応じてWeb情報DB50から送信された情報を番組関連Web情報記憶部70に記憶する。視聴中の番組情報であるEPGやCCが時間と共に変わる度に、番組関連Web情報記憶部70に記憶される番組関連Web情報を更新する。
<Step S320> Information transmitted from the
<ステップS330> 番組・トピック関連度計算部80が番組(EPG・CCテキスト)を示すtv、番組関連Web情報記憶部70に記憶された番組関連Web情報a∈A(Aは番組関連Web情報の集合)、およびトピック・トレンドスコア記憶部40に記憶されたトピックz∈Zとの関連度を算出する。番組tvとトピックzとを幅広く関連付けるために、番組関連Web情報aをそれらの情報を繋ぐ橋渡しとして用いる。具体的には、例えば番組tv、番組関連Web情報a、トピックzおよび特徴語w∈Wとの関係を表すグラフを想定し、隣接行列Cを算出する。その隣接行列Cに基づいて、各々の特徴量を計算し、各特徴量を比較することで関連度を算出する。
<Step S330> tv indicating that the program / topic
隣接行列Cは番組情報やトピック、特徴語の関係を、図6に示すような一つの行列として表現したものである。隣接行列Cは次の手順で構築される。隣接行列として(1+|W|+|Z|+|A|)×(1+|W|+|Z|+|A|)の行列C=(cj,k)を用意する。jはj=1のときに番組を表し、2≦j≦|W|+1のときに特徴語を表す。また、|W|+2≦j≦|W|+|Z|+1のときにトピックを表し、|W|+|Z|+2≦j≦|W|+|Z|+|A|+1のとき番組関連Web情報を表す。これはkも同様とする。例えば、cj,k=1(j=1,2≦k≦|W|+1)は、行列中の番組と特徴語の関係を表す値が1であることを表す。 The adjacency matrix C expresses the relationship between program information, topics, and feature words as one matrix as shown in FIG. The adjacency matrix C is constructed by the following procedure. A matrix C = (c j , k ) of (1+ | W | + | Z | + | A |) × (1+ | W | + | Z | + | A |) is prepared as an adjacency matrix. j represents a program when j = 1, and represents a feature word when 2 ≦ j ≦ | W | +1. Also, a topic is represented when | W | + 2 ≦ j ≦ | W | + | Z | +1, and a program when | W | + | Z | + 2 ≦ j ≦ | W | + | Z | + | A | +1 Represents related Web information. The same applies to k. For example, c j, k = 1 (j = 1, 2 ≦ k ≦ | W | +1) represents that the value representing the relationship between the program in the matrix and the feature word is 1.
行列の各要素の値は次のように計算する。トピックzと特徴語wとの組み合わせを表す行列の値cj,kには、例えば前述の非特許文献1のLDAによって算出した、単語−トピック確率P(wk|zj)を代入する。番組tvおよび番組関連Web情報aと特徴語wとの組み合わせを表す行列の値cj,kには、例えばtvおよびaのテキスト中に単語wが発生する単語頻度tfに基づいて、tf/σを代入する。ここでσは定数である。最後に、まだ値の代入していない要素cj,kには0を代入する。
The value of each element of the matrix is calculated as follows: For example, the word-topic probability P (w k | z j ) calculated by the LDA of
番組tvとトピックzとの関連度を計算するために、構築した隣接行列Cに基づき、各々の特徴量を計算する。特徴量は、例えば以下の式(2)のように、隣接行列からグラフラプラシアンを構築し、固有値分解によって計算する。 In order to calculate the degree of association between the program tv and the topic z, each feature amount is calculated based on the constructed adjacency matrix C. The feature amount is calculated by constructing a graph Laplacian from the adjacency matrix and performing eigenvalue decomposition as in the following equation (2), for example.
ここでBは隣接行列Cの各行の和を対角成分の値に持つ対角行列、Pは固有ベクトルを列成分に保持した行列、∧は固有値を対角成分に保持した行列である。Pの行成分のベクトルをPiとしたとき、例えば、隣接行列において第一成分に位置する番組tvの特徴量はP1となる。この特徴量は、隣接行列Cに基づくグラフの内在的な構造を表しており、関連度の強いノードほど似た特徴量になる。したがって、これらの特徴量を比較することで関連度を計算できる。また、固有ベクトルPの算出は、非特許文献2に記載されたPower Iteration等の公知の技術を用いることができる。
Here, B is a diagonal matrix having the sum of each row of the adjacency matrix C as diagonal component values, P is a matrix holding eigenvectors as column components, and ∧ is a matrix holding eigenvalues as diagonal components. When the vector of the row component of P is P i , for example, the feature quantity of the program tv located at the first component in the adjacency matrix is P 1 . This feature amount represents the intrinsic structure of the graph based on the adjacency matrix C, and the more similar the node, the more similar the feature amount. Therefore, the degree of association can be calculated by comparing these feature amounts. The eigenvector P can be calculated using a known technique such as Power Iteration described in
上記の通りに算出した特徴量をもとに、番組tvとトピックzとの関連度Rtv,ziを、例えばコサイン類似度等によって以下の式(3)のように計算する。 Based on the feature amount calculated as described above, the degree of association R tv, zi between the program tv and the topic z is calculated by the following equation (3) based on the cosine similarity, for example.
ここで、iはトピックのIDを表す。 Here, i represents a topic ID.
<ステップS340> 番組・アイテム関連度計算部100が、アイテム情報DB90に記憶されたアイテムl∈Lと番組tvとの関連度を、トレンドトピックzとの関連度も考慮して計算する。図7にアイテム情報DB90の記憶例を示す。各アイテムに関してアイテムID、ジャンル、アイテム名、アイテムメタデータ等が記憶されている。
<Step S340> The program / item
まずアイテムとトピックの関連度Rlk,ziを算出する。関連度Rlk,ziは、例えば前述したテキストストリームにトピックモデル(LDA)を適用して抽出した結果(トピックzi)を用いて、以下の式(4)のように計算できる。 First, the degree of association R lk, zi between items and topics is calculated. The relevance R lk, zi can be calculated as shown in the following equation (4) using, for example, a result (topic z i ) extracted by applying the topic model (LDA) to the above-described text stream.
ここで、kはアイテムのIDを示す。またnlk(w)はアイテムメタデータlkにおいて単語wが発生する回数を表す。 Here, k indicates an item ID. N lk (w) represents the number of occurrences of the word w in the item metadata l k .
以上の通り計算した、トピックのトレンドスコアTzi、番組とトピックの関連度Rtv,zi、アイテムとトピックの関連度Rlk,zi、を用いて、最終的に番組tvとアイテムlkの関連度Rtv,lkを例えば次の式(5)ように算出する。 Using the topic trend score T zi , the program-topic relevance level R tv, zi , and the item-topic relevance level R lk, zi , the relationship between the program tv and the item l k is finally obtained . The degree R tv, lk is calculated , for example, by the following equation (5).
ここでλはトレンドスコアや関連度の比重を決定する定数である。 Here, λ is a constant that determines the specific gravity of the trend score and relevance.
<ステップS350> 出力部110は、番組tvとアイテムlkの関連度Rtv,lkに基づき、関連度の高い順にアイテムを出力する。ここで、出力とは、ディスプレイへの表示、プリンタへの印字、音出力、外部装置への送信等を含む概念である。出力部110は出力デバイスのドライバソフトまたは、出力デバイスのドライバソフトと出力デバイス等で実現され得る。出力の具体例を図8に示す。図8はマラソン番組を視聴中のユーザに話題のシューズを推薦する例である。SNS(Social Networking Service)においてトレンドトピックを特定することで、例えば話題の商品を検出し、番組関連Web情報によってマラソンとシューズを連想させることで、関連性のあるトレンドアイテムの推薦を可能にしている。
<Step S350> The
また、本実施形態のアイテム推薦装置における各手段の一部もしくは全部の機能をコンピュータのプログラムで構成し、そのプログラムをコンピュータを用いて実行して本発明を実現することができること、本実施形態のアイテム推薦方法における手順をコンピュータのプログラムで構成し、そのプログラムをコンピュータに実行させることができることは言うまでもなく、コンピュータでその機能を実現するためのプログラムを、そのコンピュータが読み取り可能な記録媒体、例えばFD(Floppy(登録商標) Disk)や、MO(Magneto−Optical disk)、ROM(Read Only Memory)、メモリカード、CD(Compact Disk)−ROM、DVD(Digital Versatile Disk)−ROM、CD−R、CD−RW、HDD、リムーバブルディスクなどに記録して、保存したり、配布したりすることが可能である。また、上記のプログラムをインターネットや電子メールなど、ネットワークを通して提供することも可能である。 In addition, a part or all of the functions of each unit in the item recommendation device of the present embodiment can be configured by a computer program, and the program can be executed using the computer to realize the present invention. It goes without saying that the procedure in the item recommendation method can be constituted by a computer program, and the program can be executed by the computer, and the computer-readable recording medium, for example, FD, can be realized by the computer. (Floppy (registered trademark) Disk), MO (Magneto-Optical disk), ROM (Read Only Memory), memory card, CD (Compact Disk) -ROM, DVD (Digital Versati) e Disk) -ROM, CD-R, CD-RW, HDD, and recorded in a removable disk, or stored, it is possible or distribute. It is also possible to provide the above program through a network such as the Internet or electronic mail.
本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。 The present invention is not limited to the above-described embodiments, and various modifications and applications can be made within the scope of the claims.
10…テキストストリーム記憶部
20…トピック抽出部
30…トレンドスコア計算部
40…トピック・トレンドスコア記憶部
50…Web情報DB
60…番組関連Web情報抽出部
70…番組関連Web情報記憶部
80…番組・トピック関連度計算部
90…アイテム情報DB
100…番組・アイテム関連度計算部
110…出力部
DESCRIPTION OF
60 ... Program-related Web
100: Program / item
Claims (5)
テキストの集合が格納されたテキストストリーム記憶部から特徴語を含むトピックを抽出するトピック抽出手段と、
前記トピック抽出手段により抽出されたトピックのトレンド度合いを表すトレンドスコアを計算し、前記トピックとともに記憶するトレンドスコア計算手段と、
Web情報が格納されたWeb情報データベースから番組情報と関連するWeb情報を抽出し、該抽出した番組関連Web情報を記憶する番組関連Web情報抽出手段と、
番組情報、前記番組関連Web情報抽出手段により抽出された番組関連Web情報および前記トレンドスコア計算手段により記憶されたトピックに基づいて、番組とトピックの関連度を計算する番組・トピック関連度計算手段と、
アイテムとそれに関する情報が格納されたアイテム情報データベースと、
前記アイテム情報データベース内のアイテム、前記番組・トピック関連度計算手段により計算された番組とトピックの関連度および前記トレンドスコア計算手段により計算し記憶されたトピックのトレンドスコアに基づいて、番組とアイテムの関連度を計算する番組・アイテム関連度計算手段と、
前記番組・アイテム関連度計算手段によって計算された番組とアイテムの関連度に基づいて、当該番組において推薦するアイテムを出力する出力手段と、
を備えたことを特徴とするアイテム推薦装置。 An item recommendation device for recommending items related to a program,
Topic extraction means for extracting a topic including a feature word from a text stream storage unit in which a set of texts is stored;
A trend score calculating means for calculating a trend score representing a trend degree of a topic extracted by the topic extracting means, and storing the trend score together with the topic;
Program-related Web information extracting means for extracting Web information related to program information from a Web information database in which Web information is stored, and storing the extracted program-related Web information;
Program / topic relevance calculating means for calculating relevance between a program and a topic based on program information, program related Web information extracted by the program related Web information extracting means, and a topic stored by the trend score calculating means; ,
An item information database storing items and information about them,
Based on the item in the item information database, the relevance between the program and the topic calculated by the program / topic relevance calculating means, and the trend score of the topic calculated and stored by the trend score calculating means, Program / item relevance calculation means for calculating relevance;
Output means for outputting an item recommended in the program based on the degree of association between the program and the item calculated by the program / item relevance calculating means;
An item recommendation device comprising:
前記番組・トピック関連度計算手段は、前記番組情報をtv、番組関連Web情報をa∈A(Aは番組関連Web情報の集合)、前記トピックをz∈Z(Zはトピック集合)、前記特徴語をw∈W(Wは語彙全体の集合)とし、これらとの関係を表すグラフを想定し、(1+|W|+|Z|+|A|)×(1+|W|+|Z|+|A|)の隣接行列C=(cj,k)を構築し、該隣接行列Cに基づいて番組tvおよびトピックzの各特徴量を求め、それらの特徴量を比較することによって番組とトピックの関連度Rtv,ziを算出し、
前記番組・アイテム関連度計算手段は、トピック−アイテム確率をP(zi|lk)、トピック−単語確率をP(zi|w)、単語−アイテム確率をP(w|lk)、テキストdjにおけるトピックziの生起確率をP(zi|dj)、アイテムメタデータlkにおいて単語wが発生する回数をnlk(w)とし、アイテムとトピックの関連度Rlk,ziを、
さらに、トレンドスコアおよび関連度の比重を決定する定数λ、前記トレンドスコア計算手段により計算されたトピックのトレンドスコアTzi、前記番組・トピック関連度計算手段により計算された番組とトピックの関連度Rtv,ziおよび前記算出されたアイテムとトピックの関連度Rlk,ziとによって、番組とアイテムの関連度Rtv,lkを、
ことを特徴とする請求項1に記載のアイテム推薦装置。 The trend score calculation means sets each text of the text set D stored in the text stream storage unit as d j , each extracted topic as z i, and the trend score Tz i of each topic z i ,
The program / topic relevance calculation means includes tv as the program information, aεA as program-related Web information (A is a set of program-related Web information), zεZ (Z is a topic set), and the features. A word is assumed as w∈W (W is a set of whole vocabulary), and a graph representing the relationship with these is assumed, and (1+ | W | + | Z | + | A |) × (1+ | W | + | Z | + | A |) is constructed, an adjacency matrix C = (c j , k ) is constructed, feature quantities of the program tv and topic z are obtained based on the adjacency matrix C, and the feature quantities are compared with each other. Calculate topic relevance R tv, zi ,
The program / item relevance calculation means has a topic-item probability P (z i | l k ), a topic-word probability P (z i | w), a word-item probability P (w | l k ), The occurrence probability of the topic z i in the text d j is P (z i | d j ), the number of occurrences of the word w in the item metadata l k is n lk (w), and the item-topic relevance R lk, zi The
Furthermore, a constant λ that determines the specific gravity of the trend score and the relevance degree, a trend score T zi of the topic calculated by the trend score calculation means, and a relevance degree R of the program and topic calculated by the program / topic relevance calculation means Based on tv, zi and the calculated item-topic relevance R lk, zi , the program-item relevance R tv, lk is
トピック抽出手段が、テキストの集合が格納されたテキストストリーム記憶部から特徴語を含むトピックを抽出するトピック抽出ステップと、
トレンドスコア計算手段が、前記トピック抽出手段により抽出されたトピックのトレンド度合いを表すトレンドスコアを計算し、前記トピックとともに記憶するトレンドスコア計算ステップと、
番組関連Web情報抽出手段が、Web情報が格納されたWeb情報データベースから番組情報と関連するWeb情報を抽出し、該抽出した番組関連Web情報を記憶する番組関連Web情報抽出ステップと、
番組・トピック関連度計算手段が、番組情報、前記番組関連Web情報抽出手段により抽出された番組関連Web情報および前記トレンドスコア計算手段により記憶されたトピックに基づいて、番組とトピックの関連度を計算する番組・トピック関連度計算ステップと、
番組・アイテム関連度計算手段が、アイテムとそれに関する情報が格納されたアイテム情報データベース内のアイテム、前記番組・トピック関連度計算手段により計算された番組とトピックの関連度および前記トレンドスコア計算手段により計算し記憶されたトピックのトレンドスコアに基づいて、番組とアイテムの関連度を計算する番組・アイテム関連度計算ステップと、
出力手段が、前記番組・アイテム関連度計算手段によって計算された番組とアイテムの関連度に基づいて、当該番組において推薦するアイテムを出力する出力ステップと、
を備えたことを特徴とするアイテム推薦方法。 An item recommendation method for recommending items related to a program,
A topic extraction means for extracting a topic including a feature word from a text stream storage unit in which a set of texts is stored;
A trend score calculating means for calculating a trend score representing a trend degree of the topic extracted by the topic extracting means, and storing the trend score together with the topic; and
A program-related Web information extracting unit, wherein a program-related Web information extracting unit extracts Web information related to program information from a Web information database in which Web information is stored, and stores the extracted program-related Web information;
The program / topic relevance calculating means calculates the relevance between the program and the topic based on the program information, the program related Web information extracted by the program related Web information extracting means, and the topic stored by the trend score calculating means. A program / topic relevance calculation step,
The program / item relevance calculating means includes an item in an item information database storing items and information related thereto, the relevance between the program and the topic calculated by the program / topic relevance calculating means, and the trend score calculating means. A program / item relevance calculating step for calculating a relevance between a program and an item based on a trend score of a topic calculated and stored;
An output step of outputting an item recommended in the program based on the degree of association between the program and the item calculated by the program / item relevance calculating unit;
Item recommendation method characterized by comprising.
前記番組・トピック関連度計算ステップは、前記番組情報をtv、番組関連Web情報をa∈A(Aは番組関連Web情報の集合)、前記トピックをz∈Z(Zはトピック集合)、前記特徴語をw∈W(Wは語彙全体の集合)とし、これらとの関係を表すグラフを想定し、(1+|W|+|Z|+|A|)×(1+|W|+|Z|+|A|)の隣接行列C=(cj,k)を構築し、該隣接行列Cに基づいて番組tvおよびトピックzの各特徴量を求め、それらの特徴量を比較することによって番組とトピックの関連度Rtv,ziを算出し、
前記番組・アイテム関連度計算ステップは、トピック−アイテム確率をP(zi|lk)、トピック−単語確率をP(zi|w)、単語−アイテム確率をP(w|lk)、テキストdjにおけるトピックziの生起確率をP(zi|dj)、アイテムメタデータlkにおいて単語wが発生する回数をnlk(w)とし、アイテムとトピックの関連度Rlk,ziを、
さらに、トレンドスコアおよび関連度の比重を決定する定数λ、前記トレンドスコア計算手段により計算されたトピックのトレンドスコアTzi、前記番組・トピック関連度計算手段により計算された番組とトピックの関連度Rtv,ziおよび前記算出されたアイテムとトピックの関連度Rlk,ziとによって、番組とアイテムの関連度Rtv,lkを、
ことを特徴とする請求項3に記載のアイテム推薦方法。 In the trend score calculation step, each text of the text set D stored in the text stream storage unit is d j , each extracted topic is z i, and the trend score Tz i of each topic z i is
In the program / topic relevance calculation step, the program information is tv, the program-related Web information is aεA (A is a set of program-related Web information), the topic is zεZ (Z is a topic set), and the features A word is assumed as w∈W (W is a set of whole vocabulary), and a graph representing the relationship with these is assumed, and (1+ | W | + | Z | + | A |) × (1+ | W | + | Z | + | A |) is constructed, an adjacency matrix C = (c j , k ) is constructed, feature quantities of the program tv and topic z are obtained based on the adjacency matrix C, and the feature quantities are compared with each other. Calculate topic relevance R tv, zi ,
In the program / item relevance calculation step, the topic-item probability is P (z i | l k ), the topic-word probability is P (z i | w), the word-item probability is P (w | l k ), The occurrence probability of the topic z i in the text d j is P (z i | d j ), the number of occurrences of the word w in the item metadata l k is n lk (w), and the item-topic relevance R lk, zi The
Furthermore, a constant λ that determines the specific gravity of the trend score and the relevance degree, a trend score T zi of the topic calculated by the trend score calculation means, and a relevance degree R of the program and topic calculated by the program / topic relevance calculation means Based on tv, zi and the calculated item-topic relevance R lk, zi , the program-item relevance R tv, lk is
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013216573A JP6040137B2 (en) | 2013-10-17 | 2013-10-17 | Item recommendation device, item recommendation method, and item recommendation program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013216573A JP6040137B2 (en) | 2013-10-17 | 2013-10-17 | Item recommendation device, item recommendation method, and item recommendation program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015079381A JP2015079381A (en) | 2015-04-23 |
JP6040137B2 true JP6040137B2 (en) | 2016-12-07 |
Family
ID=53010750
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013216573A Active JP6040137B2 (en) | 2013-10-17 | 2013-10-17 | Item recommendation device, item recommendation method, and item recommendation program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6040137B2 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101671740B1 (en) * | 2015-07-07 | 2016-11-16 | 숭실대학교산학협력단 | Apparatus and method for extracting topics |
CN111241380B (en) * | 2018-11-28 | 2023-10-03 | 富士通株式会社 | Method and apparatus for generating recommendations |
CN114610859A (en) * | 2022-04-24 | 2022-06-10 | 康键信息技术(深圳)有限公司 | Product recommendation method, device and equipment based on content and collaborative filtering |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5067556B2 (en) * | 2005-09-30 | 2012-11-07 | 日本電気株式会社 | Trend evaluation apparatus, method and program thereof |
JP2013097700A (en) * | 2011-11-04 | 2013-05-20 | Sony Corp | Information processing device, information processing method and program |
-
2013
- 2013-10-17 JP JP2013216573A patent/JP6040137B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015079381A (en) | 2015-04-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10706100B2 (en) | Method of and system for recommending media objects | |
US9471936B2 (en) | Web identity to social media identity correlation | |
US20130283303A1 (en) | Apparatus and method for recommending content based on user's emotion | |
US20180336202A1 (en) | System and method to represent documents for search in a graph | |
US10387915B2 (en) | Digital magazine recommendations by topic | |
Tran et al. | Exploiting character networks for movie summarization | |
JP2008293211A (en) | Item recommendation system | |
US10289733B2 (en) | Systems and methods for filtering techniques using metadata and usage data analysis | |
JP2011175362A (en) | Information processing apparatus, importance level calculation method, and program | |
JP6137960B2 (en) | Content search apparatus, method, and program | |
Natarajan et al. | Recommending news based on hybrid user profile, popularity, trends, and location | |
US20150019555A1 (en) | Method for enriching a multimedia content, and corresponding device | |
JP6434954B2 (en) | Information processing apparatus, information processing method, and program | |
JP6040137B2 (en) | Item recommendation device, item recommendation method, and item recommendation program | |
US11200288B1 (en) | Validating interests for a search and feed service | |
JP2016031675A (en) | Content recommendation device and program | |
JP2012059183A (en) | Content recommendation device, content recommendation program and recording medium therefor | |
JP6321945B2 (en) | Digest video generation device, digest video generation method, and digest video generation program | |
KR101496181B1 (en) | Methods and apparatuses for a content recommendations using content themes | |
Mirhasani et al. | Alleviation of cold start in movie recommendation systems using sentiment analysis of multi-modal social networks | |
JP5102883B2 (en) | User utterance extraction apparatus, method and program | |
JP2015049637A (en) | Interest content estimation device and interest content estimation program | |
JP6373767B2 (en) | Topic word ranking device, topic word ranking method, and program | |
Hölbling et al. | Content-based tag generation to enable a tag-based collaborative tv-recommendation system. | |
JP5938002B2 (en) | Content recommendation device and operation method thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160125 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161019 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161101 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161107 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6040137 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |