JP2013218485A - Content provision device, low-rank approximate matrix generation device, content provision method, low-rank approximate matrix generation method and program - Google Patents
Content provision device, low-rank approximate matrix generation device, content provision method, low-rank approximate matrix generation method and program Download PDFInfo
- Publication number
- JP2013218485A JP2013218485A JP2012087707A JP2012087707A JP2013218485A JP 2013218485 A JP2013218485 A JP 2013218485A JP 2012087707 A JP2012087707 A JP 2012087707A JP 2012087707 A JP2012087707 A JP 2012087707A JP 2013218485 A JP2013218485 A JP 2013218485A
- Authority
- JP
- Japan
- Prior art keywords
- content
- user
- reliability
- advertisement
- observation matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000011159 matrix material Substances 0.000 title claims abstract description 173
- 238000000034 method Methods 0.000 title claims description 34
- 238000012545 processing Methods 0.000 claims abstract description 56
- 238000004364 calculation method Methods 0.000 claims abstract description 42
- 238000009826 distribution Methods 0.000 claims description 62
- 238000011156 evaluation Methods 0.000 claims description 45
- 230000008569 process Effects 0.000 description 18
- 238000010586 diagram Methods 0.000 description 17
- 239000000047 product Substances 0.000 description 17
- 238000004458 analytical method Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 10
- 238000000605 extraction Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 7
- 230000004044 response Effects 0.000 description 6
- 238000000354 decomposition reaction Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000002308 calcification Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
本発明は、コンテンツ提供装置、低ランク近似行列生成装置、コンテンツ提供方法、低ランク近似行列生成方法およびプログラムに関する。 The present invention relates to a content providing apparatus, a low rank approximate matrix generating apparatus, a content providing method, a low rank approximate matrix generating method, and a program.
オンラインショッピングにおける商品のレコメンド処理において協調フィルタリングを行う場合などにはユーザや商品の間の関係性を行列で管理することが行われている。さらにこの関係性の行列を複数の低ランクの行列に分解する近似処理が行われている。例えば特許文献1では無限次元の行列因子分解を行うことにより大規模な関係性を処理することができるシステムが開示されている。
For example, when collaborative filtering is performed in a product recommendation process in online shopping, the relationship between users and products is managed in a matrix. Further, an approximation process is performed to decompose the relationship matrix into a plurality of low rank matrices. For example,
オンラインでの広告の配信に係るクリック率を広告の関係性として管理しようとする場合、広告のクリック率は低い(1%未満であることも多い)ことが知られている。したがって、1回のクリックがクリック率に与える影響が非常に大きく、特に広告の配信数が少ない場合には、クリック率自体の信頼度が低いことが生じうる。しかしながら、従来の低ランク近似では観測値自体は絶対的に正しいものとして近似処理を行っていたため、配信数が少ない広告のクリック率を観測して低ランク近似を行っても正確な関係性を予測することができないことがあった。
本発明は、このような背景を鑑みてなされたものであり、正確な関係性の予測を行うことのできるようにすることを目的とする。
It is known that the click rate of an advertisement is low (often less than 1%) when trying to manage the click rate related to online advertisement distribution as the relationship of the advertisement. Therefore, the influence of one click on the click rate is very large, and the reliability of the click rate itself may be low particularly when the number of advertisements delivered is small. However, in the conventional low rank approximation, since the observed value itself is an approximation that is absolutely correct, an accurate relationship is predicted even if low rank approximation is performed by observing the click rate of an advertisement with a small number of distributions. There was something I couldn't do.
The present invention has been made in view of such a background, and an object of the present invention is to enable accurate prediction of a relationship.
上記課題を解決するための本発明の主たる発明は、ユーザにコンテンツを提供する装置であって、前記ユーザと前記コンテンツとの関係性を評価した実績値を要素とする観測行列を生成する観測行列生成部と、前記実績値のそれぞれについて前記実績値の信頼度を算出する信頼度算出部と、前記実績値に対して前記信頼度に応じた重み付けをして、前記観測行列よりも低ランクの複数の行列の積を前記観測行列に近似させる低ランク近似処理部と、前記ユーザに提供可能な前記コンテンツである候補コンテンツのそれぞれについて、当該候補コンテンツ及び前記ユーザに対応する前記複数の行列の要素に基づいて前記候補コンテンツの評価値を算出する評価値算出部と、前記評価値に応じて、前記ユーザに提供する前記コンテンツである提供コンテンツを前記候補コンテンツの中から決定する提供コンテンツ決定部と、を備えることとする。 A main invention of the present invention for solving the above-described problem is an apparatus for providing content to a user, and an observation matrix that generates an observation matrix having an actual value obtained by evaluating a relationship between the user and the content as an element A generation unit, a reliability calculation unit that calculates the reliability of the actual value for each of the actual values, and weighting the actual value according to the reliability, so that the rank is lower than the observation matrix. A low rank approximation processing unit that approximates a product of a plurality of matrices to the observation matrix, and each of the candidate contents that are the contents that can be provided to the user, the candidate contents and elements of the plurality of matrices corresponding to the user An evaluation value calculation unit for calculating an evaluation value of the candidate content based on the content, and providing the content to be provided to the user according to the evaluation value Is referred to as that and a providing content determination unit for determining from among the candidate contents content.
また、本発明のコンテンツ提供装置では、前記コンテンツはオンラインで提供される広告であり、前記観測行列生成部は、前記ユーザによる前記広告のクリック率を前記実績値として算出し、前記信頼度算出部は、前記広告のクリック数および前記広告の閲覧数の少なくともいずれかに応じて前記信頼度を算出するようにしてもよい。 In the content providing apparatus of the present invention, the content is an advertisement provided online, and the observation matrix generation unit calculates a click rate of the advertisement by the user as the actual value, and the reliability calculation unit May calculate the reliability according to at least one of the number of clicks of the advertisement and the number of browsing of the advertisement.
また、本発明のコンテンツ提供装置では、前記信頼度算出部は、前記広告を前記ユーザが閲覧した閲覧数と、前記広告を前記ユーザがクリックしたクリック数とを取得し、ベータ分布Be(p,q)を事前分布として、前記クリック率のベイズ推定による事後分布Be(p+クリック数,q+閲覧数+クリック数)の分散を算出し、前記分散が小さいほど前記信頼度が高くなるように前記信頼度を決定するようにしてもよい。 In the content providing apparatus of the present invention, the reliability calculation unit obtains the number of browsing that the user has viewed the advertisement and the number of clicks that the user has clicked on the advertisement, and the beta distribution Be (p, The variance of the posterior distribution Be (p + clicks, q + views + clicks) based on Bayesian estimation of the click rate is calculated using q) as a prior distribution, and the reliability increases so that the reliability increases as the variance decreases. The degree may be determined.
また、本発明のコンテンツ提供装置では、前記信頼度算出部は、前記実績値に応じて所定の確率分布における分散を算出し、算出した分散を底とするべき乗値の逆数を前記信頼度として算出するようにしてもよい。 In the content providing apparatus of the present invention, the reliability calculation unit calculates a variance in a predetermined probability distribution according to the actual value, and calculates the reciprocal of a power value based on the calculated variance as the reliability. You may make it do.
また、本発明のコンテンツ提供装置では、前記確率分布はベータ分布であり、前記信頼度算出部は、所定の事前分布からベイズ推定を行った事後分布の分散を算出するようにしてもよい。 In the content providing apparatus of the present invention, the probability distribution may be a beta distribution, and the reliability calculation unit may calculate a variance of a posterior distribution obtained by performing Bayesian estimation from a predetermined prior distribution.
また、本発明の他の態様は、ユーザにコンテンツを提供する装置であって、前記ユーザを1つの以上の第1の分類に分類分けするユーザ分類部と、前記コンテンツを1つ以上の第2の分類に分類分けするユーザ分類部と、前記第1および第2の分類の間の関係性を評価した実績値を要素とする観測行列を生成する観測行列生成部と、前記実績値のそれぞれについて前記実績値の信頼度を算出する信頼度算出部と、前記実績値に対して前記信頼度に応じた重み付けをして、前記観測行列よりも低ランクの複数の行列の積を前記観測行列に近似させる低ランク近似処理部と、前記ユーザに提供可能な前記コンテンツである候補コンテンツのそれぞれについて、当該候補コンテンツが属する前記第1の分類および前記ユーザが属する前記第2の分類に対応する前記複数の行列の要素に基づいて前記候補コンテンツの評価値を算出する評価値算出部と、前記ユーザに提供する前記コンテンツである提供コンテンツを前記評価値に応じて前記候補コンテンツの中から決定する提供コンテンツ決定部と、を備えることとする。 According to another aspect of the present invention, there is provided an apparatus that provides content to a user, the user classifying unit classifying the user into one or more first classifications, and the content including one or more second classifications. For each of the above-mentioned actual values, a user classifying unit that classifies them into the above-mentioned categories, an observation matrix generating unit that generates an observation matrix whose element is an actual value that evaluates the relationship between the first and second classifications, and A reliability calculation unit that calculates the reliability of the actual value, and weighting the actual value according to the reliability, and a product of a plurality of lower rank matrices than the observation matrix is used as the observation matrix. For each of the candidate content that is the content that can be provided to the user and the low rank approximation processing unit to be approximated, the first classification to which the candidate content belongs and the second classification to which the user belongs An evaluation value calculation unit that calculates an evaluation value of the candidate content based on the corresponding elements of the plurality of matrices, and provided content that is the content to be provided to the user from the candidate content according to the evaluation value And a provision content determination unit to determine.
また、本発明のコンテンツ提供装置では、前記信頼度算出部は、前記実績値に応じて所定の確率分布における分散を算出し、算出した分散を底とするべき乗値の逆数を前記信頼度として算出するようにしてもよい。 In the content providing apparatus of the present invention, the reliability calculation unit calculates a variance in a predetermined probability distribution according to the actual value, and calculates the reciprocal of a power value based on the calculated variance as the reliability. You may make it do.
また、本発明の他の態様は、コンテンツを当該コンテンツに関係するユーザに提供するための、前記コンテンツと前記ユーザとの関係性を評価した評価値を要素とする関係行列に、低ランク近似により近似させた複数の行列を生成する装置であって、前記関係性を評価した実績値を要素とする観測行列を生成する観測行列生成部と、前記実績値のそれぞれについて前記実績値の信頼度を算出する信頼度算出部と、前記実績値に対して前記信頼度に応じた重み付けをしたうえで、前記観測行列よりも低ランクの複数の行列の積を前記観測行列に近似させる低ランク近似処理部と、を備えることとする。 In another aspect of the present invention, a low-rank approximation is applied to a relation matrix having an evaluation value that evaluates the relation between the content and the user for providing the content to a user related to the content. An apparatus that generates a plurality of approximated matrices, an observation matrix generation unit that generates an observation matrix whose elements are the actual values evaluated for the relationship, and the reliability of the actual values for each of the actual values A reliability calculation unit for calculating, and weighting corresponding to the reliability for the actual value, and a low rank approximation process for approximating a product of a plurality of lower rank matrices than the observation matrix to the observation matrix A part.
また、本発明の低ランク近似行列生成装置では、前記信頼度算出部は、前記実績値に応じて所定の確率分布における分散を算出し、算出した分散を底とするべき乗値の逆数を前記信頼度として算出するようにしてもよい。 In the low-rank approximate matrix generation device of the present invention, the reliability calculation unit calculates a variance in a predetermined probability distribution according to the actual value, and uses the inverse of the power value with the calculated variance as the base. It may be calculated as a degree.
また、本発明の他の態様は、ユーザにコンテンツを提供する方法であって、コンピュータが、前記ユーザと前記コンテンツとの関係性を評価した実績値を要素とする観測行列を生成するステップと、前記実績値のそれぞれについて前記実績値の信頼度を算出するステップと、前記実績値に対して前記信頼度に応じた重み付けをして、前記観測行列よりも低ランクの複数の行列の積を前記観測行列に近似させるステップと、前記ユーザに提供可能な前記コンテンツである候補コンテンツのそれぞれについて、当該候補コンテンツ及び前記ユーザに対応する前記複数の行列の要素に基づいて前記候補コンテンツの評価値を算出するステップと、前記評価値に応じて、前記ユーザに提供する前記コンテンツである提供コンテンツを前記候補コンテンツの中から決定するステップと、を実行することとする。 According to another aspect of the present invention, there is provided a method for providing content to a user, wherein the computer generates an observation matrix whose element is an actual value obtained by evaluating a relationship between the user and the content; Calculating the reliability of the actual value for each of the actual values, and weighting the actual value according to the reliability, and multiplying the product of a plurality of lower rank matrices than the observation matrix For each of candidate content that is the content that can be provided to the user and approximation to an observation matrix, an evaluation value of the candidate content is calculated based on the candidate content and elements of the plurality of matrices corresponding to the user And providing content that is the content to be provided to the user according to the evaluation value. And performing the steps of: determining from the.
また、本発明の他の態様は、コンテンツを当該コンテンツに関係するユーザに提供するための、前記コンテンツと前記ユーザとの関係性を評価した評価値を要素とする関係行列に、低ランク近似により近似させた複数の行列を生成する方法であって、コンピュータが、前記関係性を評価した実績値を要素とする観測行列を生成するステップと、前記実績値のそれぞれについて前記実績値の信頼度を算出するステップと、前記実績値に対して前記信頼度に応じた重み付けをしたうえで、前記観測行列よりも低ランクの複数の行列の積を前記観測行列に近似させるステップと、を実行することとする。 In another aspect of the present invention, a low-rank approximation is applied to a relation matrix having an evaluation value that evaluates the relation between the content and the user for providing the content to a user related to the content. A method of generating a plurality of approximated matrices, wherein the computer generates an observation matrix having elements of actual values evaluated for the relationship, and the reliability of the actual values for each of the actual values. Performing a step of calculating, and weighting the actual value according to the reliability, and approximating a product of a plurality of lower rank matrices than the observation matrix to the observation matrix And
また、本発明の他の態様は、ユーザにコンテンツを提供するためのプログラムであって、コンピュータに、前記ユーザと前記コンテンツとの関係性を評価した実績値を要素とする観測行列を生成するステップと、前記実績値のそれぞれについて前記実績値の信頼度を算出するステップと、前記実績値に対して前記信頼度に応じた重み付けをして、前記観測行列よりも低ランクの複数の行列の積を前記観測行列に近似させるステップと、
前記ユーザに提供可能な前記コンテンツである候補コンテンツのそれぞれについて、当該候補コンテンツ及び前記ユーザに対応する前記複数の行列の要素に基づいて前記候補コンテンツの評価値を算出するステップと、前記評価値に応じて、前記ユーザに提供する前記コンテンツである提供コンテンツを前記候補コンテンツの中から決定するステップと、を実行させることとする。
According to another aspect of the present invention, there is provided a program for providing content to a user, wherein the computer generates an observation matrix whose element is an actual value obtained by evaluating a relationship between the user and the content. Calculating the reliability of the actual value for each of the actual values, and weighting the actual value according to the reliability, and multiplying a plurality of matrices lower in rank than the observation matrix Approximating the observation matrix;
For each candidate content that is the content that can be provided to the user, calculating an evaluation value of the candidate content based on the candidate content and elements of the plurality of matrices corresponding to the user; In response, the step of determining the provision content that is the content to be provided to the user from the candidate content is executed.
また、本発明の他の態様は、コンテンツを当該コンテンツに関係性するユーザに提供するための、前記コンテンツと前記ユーザとの関係性を評価した評価値を要素とする関係行列に、低ランク近似により近似させた複数の行列を生成するためのプログラムであって、コンピュータに、前記関係性を評価した実績値を要素とする観測行列を生成するステップと、前記実績値のそれぞれについて前記実績値の信頼度を算出するステップと、前記実績値に対して前記信頼度に応じた重み付けをしたうえで、前記観測行列よりも低ランクの複数の行列の積を前記観測行列に近似させるステップと、を実行させることとする。 Another aspect of the present invention provides a low-rank approximation to a relation matrix having an evaluation value obtained by evaluating the relationship between the content and the user as an element for providing the content to a user related to the content. A program for generating a plurality of matrices approximated by the step of generating an observation matrix having elements of the actual values evaluated for the relationship, and for each of the actual values, A step of calculating a reliability, and a step of weighting the actual value according to the reliability, and approximating a product of a plurality of lower rank matrices than the observation matrix to the observation matrix. Let it be executed.
その他本願が開示する課題やその解決方法については、発明の実施形態の欄及び図面により明らかにされる。 Other problems and solutions to be disclosed by the present application will be made clear by the embodiments of the invention and the drawings.
本発明によれば、正確な関係性の予測を行うことができる。 According to the present invention, an accurate relationship can be predicted.
==(1)発明の概要==
以下、本発明の一実施形態に係る広告配信システムについて説明する。本実施形態において広告とは、Webページにおいてコンテンツの内容等に応じて表示される広告(リスティング広告と呼ばれる。)を想定する。
== (1) Summary of Invention ==
Hereinafter, an advertisement distribution system according to an embodiment of the present invention will be described. In the present embodiment, the advertisement is assumed to be an advertisement (referred to as a listing advertisement) that is displayed on the Web page in accordance with the content or the like.
本実施形態では、ユーザおよび広告に対してそれぞれクラスタリング処理を行い、ユーザに関するクラスタ(以下、ユーザクラスタという。)と広告に関するクラスタ(以下、広告クラスタという。)とを求め、ユーザクラスタと広告クラスタとの間でのクリック性向を示す行列(以下、性向行列という。)を作成する。ユーザは複数のユーザクラスタに属することができ、広告も複数の広告クラスタに属することができるものとする。また、ユーザは各ユーザクラスタに属する度合い(帰属度)が算出され、広告も各広告クラスタに対する帰属度が算出されるものとする。以下の説明において、ユーザの各ユーザクラスタに対する帰属度を要素とするベクトルをユーザベクトルといい、広告の各広告クラスタに対する帰属度を要素とするベクトルを広告ベクトルという。なお、クラスタリング処理には複数のクラスタへの帰属度を算出することのできる一般的な手法を用いるものとして本明細書では説明を省略する。 In the present embodiment, clustering processing is performed on each of the user and the advertisement to obtain a user-related cluster (hereinafter referred to as a user cluster) and an advertisement-related cluster (hereinafter referred to as an advertisement cluster). A matrix indicating the click tendency between the two (hereinafter referred to as a tendency matrix). A user can belong to a plurality of user clusters, and an advertisement can belong to a plurality of advertisement clusters. In addition, it is assumed that the degree to which a user belongs to each user cluster (attribution degree) is calculated, and the advertisement is also calculated for the degree of belonging to each advertisement cluster. In the following description, a vector whose element is the degree of attribution of the user to each user cluster is referred to as a user vector, and a vector whose element is the degree of belonging to each advertisement cluster is referred to as an advertisement vector. Note that the clustering process uses a general method that can calculate the degree of belonging to a plurality of clusters, and a description thereof is omitted in this specification.
ユーザクラスタの数をN、広告クラスタの数をMとすると、性向行列はN×Mの行列になる。性向行列は、ユーザクラスタと広告クラスタの各ペアについて、当該ユーザクラスタに帰属するユーザに対して当該広告クラスタに帰属する広告が表示された回数(インプレッション数と呼ばれる。)と、当該ユーザクラスタに属するユーザが当該広告クラスタに属する広告をクリックしたクリック数とをログから取得して、クリック率をインプレッション数で割った実クリック率(以下、実CTRと表記する。)を求めるものとする。なお、あるユーザがあるユーザクラスタに帰属するとは、当該ユーザの当該ユーザクラスタに対する帰属度が所定値(例えば0)より大きいことを意味し、同様にある広告がある広告クラスタに帰属するとは、当該広告の当該広告クラスタに対する帰属度が所定値(例えば0)より大きいことを意味するものとする。 If the number of user clusters is N and the number of advertisement clusters is M, the tendency matrix is an N × M matrix. For each pair of a user cluster and an advertisement cluster, the tendency matrix belongs to the user cluster and the number of times an advertisement belonging to the advertisement cluster is displayed to a user belonging to the user cluster (referred to as the number of impressions). The number of clicks that the user clicked on the advertisement belonging to the advertisement cluster is acquired from the log, and an actual click rate (hereinafter referred to as actual CTR) obtained by dividing the click rate by the number of impressions is obtained. In addition, belonging to a certain user cluster means that the degree of attribution of the user with respect to the user cluster is larger than a predetermined value (for example, 0). Similarly, belonging to an advertisement cluster with certain advertisement It means that the degree of attribution of the advertisement with respect to the advertisement cluster is larger than a predetermined value (for example, 0).
図1に示すように、あるユーザについてのユーザベクトル1(の転置ベクトル)と、性向ベクトル2と、ある広告についての広告ベクトル3とを乗算することにより、当該ユーザによる当該広告のクリック性向(期待クリック性向)が算出される。本実施形態では、この期待CTRを広告の評価値として、表示する広告を決定する。
本実施形態では、性向行列を複数の行列の積として分解する。行列の分解は例えば特異値分解(Singular Value Decomposition;SVD)や行列因子分解(Matrix Factorization)などが知られている。ユーザクラスタおよび広告クラスタは数百〜数千作られることが考えられるため、性向行列を複数の(性向行列よりも低ランクの)行列の積として表現することにより、性向行列を管理する情報量を圧縮することができる。また、ノイズが除去されるいわゆるスムージング効果も期待できる。
As shown in FIG. 1, by multiplying a user vector 1 (transposed vector), a
In this embodiment, the tendency matrix is decomposed as a product of a plurality of matrices. For example, singular value decomposition (SVD) or matrix factorization is known as matrix decomposition. Since hundreds to thousands of user clusters and advertisement clusters can be created, the amount of information for managing the tendency matrix can be reduced by expressing the tendency matrix as a product of a plurality of matrices (lower rank than the tendency matrix). Can be compressed. In addition, a so-called smoothing effect that eliminates noise can be expected.
==(2)行列因子分解(Matrix Factorization)==
本実施形態では、行列因子分解により性向行列を2つの行列に分解するものとする。行列因子分解では、ユーザクラスタと広告クラスタとに対応する広告の実CTRを観察値とした観察行列を作成し、観察値と2つの行列の積における対応する要素との差の合計が最小になるように2つの行列を決定する。例えばクラスタリングにより数百、数千のクラスタが作成されたときなどには、あるユーザクラスタのユーザにある広告クラスタの広告が配信されていないという状態、すなわち欠損値が存在する状態が発生し得るが、行列因子分解による低ランク近似を行うことにより欠損値を補完することもできる。
== (2) Matrix Factorization ==
In this embodiment, the tendency matrix is decomposed into two matrices by matrix factorization. In matrix factorization, an observation matrix is created in which the actual CTR of the advertisement corresponding to the user cluster and the advertisement cluster is an observation value, and the sum of the differences between the observation value and the corresponding element in the product of the two matrices is minimized. Determine two matrices as follows. For example, when hundreds or thousands of clusters are created by clustering, there may occur a state in which an advertisement of an advertisement cluster is not distributed to users of a certain user cluster, that is, a state in which a missing value exists. It is also possible to supplement missing values by performing low rank approximation by matrix factorization.
本実施形態では、観察行列における欠損値(すなわちインプレッション数が0である場合)以外の観測値のそれぞれについて、2つの行列UおよびAの積の対応する要素との差を最小化するように最適化計算を行う。なお、行列Uはユーザの属性を表す行列、行列Aは広告の属性を表す行列となる。ここで2つの低ランク行列UおよびAの積UAの要素である予測クリック率(以下、予測CTRと表記する。)の予測モデルは、予測CTRをr’、予測クリック率の平均をμ、ユーザクラスタの影響(例えば、気軽に広告をクリックしがちなユーザクラスタである場合など)による平均クリック率からの偏差をbuser、広告クラスタの影響(例えば、大ヒット商品の広告クラスタである場合など)による平均クリック率からの偏差をbadとして、次式とする。
In the present embodiment, for each of the observation values other than missing values in the observation matrix (that is, when the number of impressions is 0), it is optimal to minimize the difference between the corresponding elements of the products of the two matrices U and A Perform calcification. The matrix U is a matrix representing user attributes, and the matrix A is a matrix representing advertisement attributes. Here, a prediction model of a predicted click rate (hereinafter referred to as a predicted CTR) that is an element of the product UA of two low rank matrices U and A has a predicted CTR of r ′, an average of predicted CTRs of μ, and a user. the influence of the cluster (for example, feel free to such as when a click-prone user cluster the ad) the deviation from the average click-through rate by b user, the influence of advertising clusters (for example, such as when a blockbuster of advertising cluster) The deviation from the average click rate due to is defined as bad and the following equation is obtained.
一般的な行列因子分解の手法において、行列UおよびAを決定するための最適計算は、観測値(本実施形態の場合は、実クリック率である。以下、実CTRと表記する。)をr、予測CTRをr’として次式のような目的関数の最小化を行うことになる。
In a general matrix factorization technique, the optimum calculation for determining the matrices U and A is an observed value (in the case of this embodiment, an actual click rate; hereinafter referred to as an actual CTR) r. Then, the objective function as shown in the following equation is minimized by setting the predicted CTR to r ′.
ここで、式E2の目的関数において、実CTRと予測CTRとの差を底とし2を指数としたべき乗の項を損失関数といい、buser、bad、U、Aを含む第2項を正則化項という。また、行列因子分解は観測行列から性向行列に近似した行列を学習することができることから上記の目的関数を学習モデルとも称する。なお、正則化項においてどのような説明変数を用いるかについては一般的な行列因子分解の手法によるものとし本明細書では説明を省略する。 Here, in the objective function of Equation E2, the power term with the difference between the real CTR and the predicted CTR as the base and 2 as the exponent is called the loss function, and the second term including b user , b ad , U, and A is the second term. It is called a regularization term. In addition, since the matrix factorization can learn a matrix approximated to a tendency matrix from an observation matrix, the above objective function is also referred to as a learning model. Note that what kind of explanatory variable is used in the regularization term is based on a general matrix factorization technique, and the description is omitted in this specification.
上記のように一般的な行列因子分解の手法では、観測値(実CTR)の信頼度は考慮されていない。しかしながら、特に広告のクリック率のように通常非常に小さい値(広告のクリック率は一般に1%未満であることが多いことが知られている。)の場合には、クリックが発生せずに実CTRが0のままの状態が続いたり、インプレッション数が少ない間にたまたまクリックが発生したときには期待されるクリック率よりも非常に大きな値となってしまったりすることが考えられ、特にインプレッション数が少ない場合には実CTRの信頼度は低い。そこで本実施形態では、行列因子分解の最小化計算における目的関数に含まれる損失関数において信頼度を評価する。すなわち、実CTRと予測CTRとの差(上記E2式では差の二乗)に信頼度を乗じた値を最小化するようにする。 As described above, the general matrix factorization technique does not consider the reliability of the observed value (actual CTR). However, especially when the click rate of the advertisement is usually very small (it is generally known that the click rate of the advertisement is generally less than 1%), the click is not generated. It is possible that the CTR stays 0, or if the click occurs by chance while the number of impressions is small, the click rate may be much larger than the expected click rate, especially when the number of impressions is small. In some cases, the reliability of the actual CTR is low. Therefore, in this embodiment, the reliability is evaluated in the loss function included in the objective function in the matrix factorization minimization calculation. That is, the value obtained by multiplying the difference between the actual CTR and the predicted CTR (the square of the difference in the above E2) by the reliability is minimized.
本実施形態では、実CTRがベータ分布に従うものとして、ベータ分布の分散の逆数を信頼度として用いるものとする。ここで、事前分布をBe(p,q)とし、クリック数がcua、インプレッション数がiuaであった場合、ベイズ推定による事後分布はBe(p+cua,q+iua−cua)となり、この事後分布の分散vuaは次式で表される。
この分散vuaを底としたべき乗値(指数sは1であってもよい。)の1/vua sを信頼度として用いることにより、実CTRのばらつきが少ないほど信頼度が高くなることになる。なお、指数sには任意の値を設定することができる。また、事前分布Be(p,q)のパラメータp,qには任意の値を設定することが可能であり、例えば解析者が過去の実CTRの分布を解析して決定することができる。また、事前分布は一様分布であるものとして、Be(1,1)を事前分布として採用するようにしてもよい。
In this embodiment, it is assumed that the actual CTR follows the beta distribution, and the inverse of the variance of the beta distribution is used as the reliability. Here, when the prior distribution is Be (p, q), the number of clicks is c ua , and the number of impressions is i ua , the posterior distribution by Bayesian estimation is Be (p + c ua , q + i ua −c ua ), and this The variance v ua of the posterior distribution is expressed by the following equation.
By using 1 / v ua s of the power value (exponent s may be 1) based on this variance v ua as the reliability, the smaller the variation in the actual CTR, the higher the reliability. Become. An arbitrary value can be set for the index s. In addition, it is possible to set arbitrary values for the parameters p and q of the prior distribution Be (p, q). For example, an analyst can analyze and determine the distribution of past actual CTRs. Also, Be (1,1) may be adopted as the prior distribution assuming that the prior distribution is a uniform distribution.
以上より、本実施形態では次式を学習モデルとして最小化することになる。
As described above, in the present embodiment, the following expression is minimized as a learning model.
このようにベイズ推定の事後分布の分散の逆数(のべき乗)を信頼度とすることにより、インプレッション数が増えて実CTRのばらつきが小さくなるほど予測CTRと実CTRとの差を大きく評価し、インプレッション数が少なく実CTRのばらつきが大きい間の予測CTRと実CTRとの差は小さく評価した上で低ランク近似を行うことができる。 In this way, by using the reciprocal (power) of variance of the posterior distribution of Bayesian estimation as the reliability, the difference between the predicted CTR and the actual CTR is greatly evaluated as the number of impressions increases and the variation in the actual CTR becomes smaller. Low rank approximation can be performed after evaluating the difference between the predicted CTR and the actual CTR while the number is small and the variation in the actual CTR is large.
==(3)システム構成==
図2は本実施形態の広告配信システムの全体構成を示す図である。本実施形態の広告配信システムは、ユーザ端末10と通信ネットワーク30を介して通信可能に接続されるWebサーバ20を含んで構成される。
通信ネットワーク30は、例えば公衆電話回線網や専用通信回線網、携帯電話回線網、無線通信網、イーサネット(登録商標)などにより構築される、インターネットやLAN(Local Area Network)である。
== (3) System configuration ==
FIG. 2 is a diagram showing the overall configuration of the advertisement distribution system of this embodiment. The advertisement distribution system according to the present embodiment includes a
The
Webサーバ20は、画像や動画、テキストなどの各種のコンテンツをHTTP(HyperText Transfer Protocol)に従って提供する、例えばワークステーションやパーソナルコンピュータなどのコンピュータである。ユーザ端末10は、Webサーバ20が提供する各種のWebページを閲覧するブラウザを動作させる、例えばパーソナルコンピュータやタブレットコンピュータ、携帯電話端末、PDA(Personal Digital Assistant)などのコンピュータである。
The
==(4)Webサーバ20のハードウェア構成==
図3はWebサーバ20のハードウェア構成例を示す図である。Webサーバ20は、CPU201、メモリ202、記憶装置203、通信インタフェース204、入力装置205、出力装置206を備える。記憶装置203は、各種のデータやプログラムを記憶する、例えばハードディスクドライブやソリッドステートドライブ、フラッシュメモリなどである。通信インタフェース204は、通信ネットワーク30に接続するためのインタフェースであり、例えばイーサネット(登録商標)に接続するためのアダプタ、公衆電話回線網に接続するためのモデム、無線通信を行うための無線通信機、シリアル通信のためのUSB(Universal Serial Bus)コネクタやRS232Cコネクタなどである。入力装置205は、データを入力する、例えばキーボードやマウス、タッチパネル、ボタン、マイクロフォンなどである。出力装置206は、データを出力する、例えばディスプレイやプリンタ、スピーカなどである。
== (4) Hardware Configuration of
FIG. 3 is a diagram illustrating a hardware configuration example of the
==(5)Webサーバ20のソフトウェア構成==
図4はWebサーバ20のソフトウェア構成例を示す図である。Webサーバ20は、HTTP処理部211、Webページ作成部212、広告選択部213、ログ収集部214および解析処理部215の機能部と、Web情報データベース251、広告データベース252、ユーザデータベース253、近似行列記憶部254、インプレッションログ記憶部255およびクリックログ記憶部256の記憶部とを備えている。
== (5) Software Configuration of
FIG. 4 is a diagram illustrating a software configuration example of the
なお、上記各機能部は、Webサーバ20が備えるCPU201が記憶装置202に記憶されているプログラムを実行することにより実現され、上記各記憶部は、Webサーバ20が備えるメモリ202及び記憶装置203が提供する記憶領域の一部として実現される。
Each of the functional units is realized by the
==(6)記憶部の説明==
(6−1)Web情報データベース251
Web情報データベース251は、Webページを作成するための情報(以下、Web情報という。)を記憶する。Web情報は、例えば、HTMLで記述されたファイルや、CGI(Common Gateway Interface)などの仕組みにより実行されるプログラムを格納したプログラムファイル、画像ファイルなどである。Web情報データベース251は、例えば、Webサーバ20で動作するオペレーティングシステムが提供するファイルシステムのディレクトリやフォルダにより実現することができる。
== (6) Description of Storage Unit ==
(6-1)
The
(6−2)広告データベース252
広告データベース252は、広告を表示するための情報(以下、広告情報という。)を記憶する。図5は、広告データベース252に記憶される広告情報の構成例を示す図である。広告情報には、広告の識別情報である広告IDに対応付けて、広告のカテゴリ、広告に関するURL(Uniform Resource Locator)、広告のタイトル、入札額、実CTRおよび当該広告の各広告クラスタへの帰属度が含まれる。広告情報のURLが示すWebページはランディングページとも呼ばれ、広告がクリックされるとランディングページにリダイレクトされることになる。
(6-2)
The
入札額は、広告がクリックされた場合に広告主から支払われる最大の単価であり、広告主により決定される。
本実施形態ではタイトルの文字列をWebページの広告として表示するものとする。広告には広告IDを指定した所定のURL(ホスト名にWebサーバ20が指定されるものとする。以下、リダイレクトURLという。)へのリンクが設定される。Webページにおいて広告がクリックされると、広告IDを含むリクエストがWebサーバ20に送信され、後述するログ収集部214によりクリックされたことのログが収集され、HTTP処理部211により広告IDに対応する広告情報のURLにリダイレクトされる(例えば、当該URLをリダイレクト先として指定した応答が送信される。)。これにより、広告に応じたユーザの行動(クリック)を検知することができる。
The bid amount is the maximum unit price paid from the advertiser when the advertisement is clicked, and is determined by the advertiser.
In the present embodiment, it is assumed that the character string of the title is displayed as an advertisement on the Web page. In the advertisement, a link to a predetermined URL specifying the advertisement ID (
なお、広告として画像や動画などを表示し、あるいは音声を出力させるようにしてもよく、その場合には、例えば広告情報には、広告として表示する画像や動画のデータを示すURLを追加するようにすることができる。 In addition, you may make it display an image, a moving image, etc. as an advertisement, or you may make it output an audio | voice, and in that case, URL which shows the data of the image displayed as an advertisement, or a moving image may be added, for example Can be.
(6−3)ユーザデータベース253
ユーザデータベース253は、ユーザに関する情報(以下、ユーザ情報という。)を記憶する。図6はユーザデータベース253に記憶されるユーザ情報の構成例を示す図である。ユーザ情報には、ユーザの識別情報であるユーザIDに対応付けて、ユーザの性別やユーザが現在する都道府県、ユーザの趣味などのユーザの属性と、当該ユーザの各ユーザクラスタへの帰属度とが含まれる。なお、性別、都道府県、趣味以外にも各種のユーザについての属性をユーザ情報に含めることができる。
(6-3)
The
(6−4)近似行列記憶部254
図7は、近似行列記憶部254の構成例を示す図である。近似行列記憶部254は、観測行列の低ランク近似させた複数の行列(本実施形態では行列Uおよび行列A)を記憶する。行列AおよびUは、たとえば表形式で保存するようにしてもよいし、数式として記憶するようにしてもよい。図7に示すように、行列Uの行数はユーザクラスタの数Nであり、行列Aの列数は広告クラスタの数Mである。行列Uの列数および行列Aの行数はともにkであり、低ランク近似により設定される数である。行列Uと行列Aとを乗算することにより性向行列(の近似行列)を復元することができる。なお、kは解析者が任意の値に設定できるものとしてもよい。
(6-4) Approximate
FIG. 7 is a diagram illustrating a configuration example of the approximate
(6−5)インプレッションログ記憶部255
インプレッションログ記憶部255は、Webページに広告が表示されたこと(インプレッションと呼ばれる。)を示す情報(以下、インプレッションログという。)を記憶する。図8は、インプレッションログ記憶部255に記憶されるインプレッションログの構成例を示す図である。インプレッションログには、Webページに広告が表示された日時(すなわち、WebページがWebサーバ20から送信された日時である。以下、配信日時という。)、Webページを示すURL、表示された広告を示す広告ID、Webページを閲覧したユーザを示すユーザIDが含まれる。インプレッションログは1つの広告が表示されるにつき1つ登録される。すなわち、たとえば1つのWebページに3つの広告が表示された場合には、3つのインプレッションログが登録されることになる。
(6-5) Impression
The impression
(6−6)クリックログ記憶部256
クリックログ記憶部256は、Webページに表示された広告がクリックされたことを示す情報(以下、クリックログという。)を記憶する。図9は、クリックログ記憶部256に記憶されるクリックログの構成例を示す図である。クリックログには、クリックされた広告を示す広告ID、広告をクリックしたユーザを示すユーザID、広告が表示されたWebページを示すURL、および広告がクリックされた日時(クリック日時)が含まれる。
(6-6) Click
The click
==(7)機能部の説明==
(7−1)HTTP処理部211
HTTP処理部211は、HTTPの処理を行う。HTTP処理部211は、ユーザ端末10から送信されるHTTPのリクエストを受信する。
リクエストにリダイレクトURLが指定されていた場合、HTTP処理部211は、ログ収集部214を呼び出してクリックログを登録させた上で、リクエストに含まれている広告IDに対応する広告情報を広告データベース252から読み出し、読み出した広告情報に含まれているURLをリダイレクト先として指定した応答をユーザ端末10に応答する。
== (7) Description of Functional Units ==
(7-1)
The
When the redirect URL is specified in the request, the
リクエストにリダイレクトURL以外の、Webページを示すURLが指定された場合には、HTTP処理部211は、Webページ作成部212を呼び出してWebページを表示するための情報(以下、画面情報という。画面情報は例えばHTMLファイルである。)を作成させ、Webページ作成部212が作成した画像情報をユーザ端末10に応答し、ログ収集部214を呼び出してインプレッションログを登録させる。
When a URL indicating a Web page other than the redirect URL is specified in the request, the
(7−2)Webページ作成部212
Webページ作成部212は、Webページを表示するための画面情報を作成する。Webページ作成部212は、広告選択部213を呼び出してWebページに表示させる広告を選択させ、選択された広告がWebページに表示され、広告がクリックされた場合にはリダイレクトURLにアクセスするように、例えばリンクタグを設定した文字列を画面情報に挿入する。なお、Webページ作成部212が、広告以外の各種のコンテンツを作成する処理については、一般的なWebサーバによる処理を用いるものとして、ここでは説明を省略する。
(7-2) Web
The web
(7−3)広告選択部213
広告選択部213は、Webページに表示する広告を選択する。
広告選択部213は、配信候補抽出部221、評価値算出部222、広告決定部223を備えている。なお、配信候補抽出部221、評価値算出部222、広告決定部223も、CPU201が記憶装置203に記憶されているプログラムをメモリ202に読み出して実行することにより実現される。
(7-3)
The
The
(7−3−1)配信候補抽出部221
配信候補抽出部221は、広告の候補を決定する。配信候補抽出部221は、広告データベース252から所定数(例えば10個や50個、100個など、任意の数を指定することができる。)の広告情報を読み出す。本実施形態では、配信候補抽出部221は、ランダムに所定数の広告情報を読み出すものとするが、例えば、コンテンツの内容やユーザの属性に応じて広告情報を読み出すようにしてもよい。なお、配信候補抽出部221が、数ある広告の中から所定数の広告を選択する処理については、一般的な広告の選択処理を用いることもできる。
(7-3-1) Distribution
The distribution
(7−3−2)評価値算出部222
評価値算出部222は、広告の評価値を算出する。上述したように、期待クリック性向が評価値として用いられる。期待クリック性向は、ユーザが帰属するユーザクラスタおよび広告が帰属する広告クラスタに対応する行列U、Aの要素に基づいて算出される。本実施形態では、ユーザベクトル(の転置ベクトル)、行列U、行列Aおよび広告ベクトルを乗算して算出されるスカラ値を期待クリック性向とするが、ユーザが帰属するユーザクラスタと広告が帰属する広告クラスタとに対応する行列U,Aの要素(または行列U,Aを乗じて求められる性向行列の要素)に基づいて、合計、平均等任意の演算を行うことにより算出される値を期待クリック性向とすることができる。
(7-3-2) Evaluation
The evaluation
(7−3−3)広告決定部223
広告決定部223は、配信候補抽出部221が決定した候補の中から表示する広告を決定する。広告決定部223は、評価値算出部222が算出したxCTRの大きい順に所定数(図1の例では3)の広告を、表示する広告として決定する。
(7-3-3)
The
(7−4)ログ収集部214
ログ収集部214は、インプレッションログ及びクリックログを登録する。ログ収集部214は、HTTPにリダイレクトURLが指定されていた場合には、リダイレクトURLに指定されている広告IDに対応するカテゴリを広告データベース252から読み出し、当該広告ID、読み出したカテゴリ、及び現在の日時を設定したクリックログを作成してクリックログ記憶部256に登録する。HTTPにリダイレクトURL以外のURLが指定されていた場合には、ログ収集部214は、広告選択部213が選択した広告のそれぞれについて、現在日時、広告を示す広告ID、及び当該広告のカテゴリを含むインプレッションログを作成してインプレッションログ記憶部255に登録する。
(7-4)
The
(7−5)解析処理部215
解析処理部215は、低ランク近似により行列Uおよび行列Aを求める。解析処理部215は、クラスタリング処理部231、観測行列生成部232、信頼度算出部233、および低ランク近似処理部234を備える。なお、クラスタリング処理部231、観測行列生成部232、信頼度算出部233、および低ランク近似処理部234も、CPU201が記憶装置203に記憶されているプログラムをメモリ202に読み出して実行することにより実現される。
(7-5)
The
(7−5−1)クラスタリング処理部231
クラスタリング処理部231はデータクラスタリングを行い、ユーザをユーザクラスタに分類し、広告を広告クラスタに分類する。なお、クラスタリング処理部231が行うデータクラスタリングの処理は一般的なものを採用するものとするが、対象データが複数のクラスタの所属することを許容するソフトクラスタリングの手法を採用するものとする。
(7-5-1)
The
(7−5−2)観測行列生成部232
観測行列生成部232は、ユーザが広告をクリックした実CTRを観測値として観測行列を生成する。観測行列生成部232は、ユーザクラスタと広告クラスタとの全ての組合せについて、当該ユーザクラスタに帰属するユーザが、当該広告クラスタに帰属する広告を閲覧したインプレッション数および当該ユーザが当該広告をクリックしたクリック数を取得して、クリック数をインプレッション数で割って実CTRを算出する。
(7-5-2) Observation
The observation
(7−5−3)信頼度算出部233
信頼度算出部233は、観測行列の要素の信頼度を算出する。上述したように本実施形態では観測行列の要素の信頼度はベータ分布の分散のべき乗の逆数1/vua sであるものとする。なお、事前分布Be(p,q)のp、qは予め設定されているものとする。また、指数sも予め定められているものとする。
(7-5-3)
The
(7−5−4)低ランク近似処理部234
低ランク近似処理部234は、信頼度による重み付けを行った上で観測行列に対する低ランク近似を行う。低ランク近似処理部234は、重み付けした観測行列に行列U,Aを近似させて、近似させた行列U,Aを近似行列記憶部254に登録する。本実施形態では、低ランク近似として行列因子分解を用いるものとするが、特異値分解その他の各種の低ランク近似の手法を採用することができる。欠損値を許容しない低ランク近似の手法を採用する場合に欠損値が発生したときは、例えば0%を観測値として補完するなど、一般的な手法により欠損値を補完した上で低ランク近似を行うようにすることができる。
(7-5-4) Low rank
The low rank
==(8)解析処理==
図10は解析処理部215による解析処理の流れを示す図である。
クラスタリング処理部231は、例えばユーザ情報に含まれている属性、インプレッションログおよびクリックログなどに基づく行動履歴などを用いてユーザのクラスタリングを行い、ユーザクラスタを決定し、各ユーザの各ユーザクラスタへの帰属度を算出する(S311)。クラスタリング処理部231は、算出した帰属度を対応するユーザ情報に設定するようにユーザデータベース253を更新する(S312)。
== (8) Analysis processing ==
FIG. 10 is a diagram showing the flow of analysis processing by the
The
クラスタリング処理部231は、広告についても広告情報に含まれている項目の内容や、広告情報のURLが示すランディングページの内容を用いて広告のクラスタリングを行い、広告クラスタを決定し、各広告の各広告クラスタへの帰属度を算出する(S313)。クラスタリング処理部231は、算出した帰属度を広告情報に設定するように広告データベース252を更新する(S314)。
これにより各ユーザの各ユーザクラスタに対する帰属度がユーザ情報に設定され、各広告の各広告クラスタに対する帰属度が広告情報に設定される。
The
Thereby, the degree of attribution of each user with respect to each user cluster is set in the user information, and the degree of attribution with respect to each advertisement cluster of each advertisement is set in the advertisement information.
観測行列生成部232は、ユーザクラスタおよび広告クラスタについての実CTRを要素とする観測行列を作成する(S315)。図11は観測行列の作成処理の一例を示す図である。観測行列生成部232は、ユーザクラスタおよび各広告クラスタについて、以下の処理を行う。すなわち、観測行列生成部232は、当該ユーザクラスタへの帰属度が0(または所定の閾値)より大きいユーザ情報のユーザIDをユーザデータベース253から読み出してULとする(S331)。
The observation
観測行列生成部232は、当該広告クラスタへの帰属度が0(または所定の閾値)より大きい広告情報の広告IDを広告データベース252から読み出してALとする(S332)。観測行列生成部232は、インプレッションログ記憶部255に登録されているインプレッションログのうち、ユーザIDがULに含まれており、かつ、広告IDがALに含まれているものをカウントしてインプレッション数iuaとして算出する(S333)。観測行列生成部232は、クリックログ記憶部256に登録されているクリックログのうち、ユーザIDがULに含まれており、かつ、広告IDがALに含まれているものをカウントしてクリック数cuaとして算出する(S334)。
The observation
観測行列生成部232は、インプレッション数iuaが0でなければ(S335:YES)、クリック数cuaをインプレッション数iuaで割って実CTRを算出し(S336)、インプレッション数iuaが0であれば(S335:NO)、欠損値を表す値(例えば−1あるいはnull値とすることができる。)を実CTRとする(S337)。
観測行列生成部232は、以上の処理を各ユーザクラスタおよび広告クラスタについて繰り返した後、実CTRを要素とした観測行列を作成する(S338)。
If the impression number i ua is not 0 (S335: YES), the observation
The observation
次に信頼度算出部233が、欠損値以外の要素について、要素に対応するインプレッション数iuaおよびクリック数cuaと事前分布のパラメータp、qとを式E3に代入して分散vuaを算出し、算出した分散のvuaを底としsを指数とするべき乗値で1を割った値を信頼度1/vua sとして算出する(S317)。
Next, the
低ランク近似処理部234は、観測行列の欠損値以外の各要素について上述した式E4の目的関数を適用した値の合計が最小となるように、行列UおよびAを決定し(S318)、決定した行列UおよびAを近似行列記憶部254に登録する(S320)。
以上のようにして、観測行列の要素に信頼度を乗じたうえで低ランク近似が行われ、近似された行列U,Aが近似行列記憶部254に登録される。
The low rank
As described above, the rank of the observation matrix is multiplied by the reliability and the low rank approximation is performed, and the approximated matrices U and A are registered in the approximate
==(9)リクエスト処理==
図12は、Webサーバ20により行われる処理の流れを示す図である。
HTTP処理部211は、ユーザ端末10からHTTPのリクエストを受信する(S401)。なおリクエストには、URL、ユーザIDおよび現在日時が設定されているものとする。HTTP処理部211は、リクエストにリダイレクトURLが指定されているか否かにより、広告がクリックされたか否かを判定する(S402)。
== (9) Request processing ==
FIG. 12 is a diagram illustrating a flow of processing performed by the
The
広告がクリックされたと判定した場合(S402:YES)、ログ収集部214は、リダイレクトURLに設定されている広告IDに対応する広告情報を広告データベース252から読み出し、リクエストに設定されているユーザIDおよび現在日時ならびに広告IDを含むクリックログを作成してクリックログ記憶部256に登録する(S403)。HTTP処理部211は、広告情報のURLにリダイレクトするようにHTTPのレスポンスをユーザ端末10に送信する(S404)。
When it is determined that the advertisement is clicked (S402: YES), the
一方、広告がクリックされていないと判断した場合には(S402:NO)、図13の処理により、広告選択部213が選択した広告の広告情報を含む広告リストを作成する(S405)。なお、図13に示す広告情報の選択処理については後述する。
On the other hand, if it is determined that the advertisement has not been clicked (S402: NO), an advertisement list including advertisement information of the advertisement selected by the
Webページ作成部212は、リクエストに応じて各種のコンテンツを表示するためのHTMLファイルなどの画面情報を作成する(S406)。なお、ステップS406における画面情報の作成処理は、一般的なWebサーバによる処理を採用することができる。
The web
Webページ作成部212は、広告リストに含まれる各広告情報について、所定のURLの引数に広告情報に含まれる広告IDを設定したリダイレクトURLを作成する(S407)。リダイレクトURLは、例えば「www.foobar.com/ad?id=xxxx」という形式とすることができる。Webページ作成部212は、広告リストに含まれる各広告情報について、広告情報に含まれるタイトルを内容として含むリダイレクトURLへのリンクタグ(例えば、「<a href="http://www.foobar.com/ad?id=xxxx">タイトル</a>」という形式とすることができる。)を画面情報に挿入する(S408)。
The Web
HTTP処理部211は、作成された画面情報をリクエストへの応答としてユーザ端末10に送信する(S409)。ログ収集部214は、広告リストに含まれる各広告情報について、広告情報に含まれる広告IDと、リクエストに含まれていたURL、ユーザIDおよび現在日時とを含むインプレッションログを作成してインプレッションログ記憶部255に登録する(S410)。
The
==(10)広告の選択処理==
図13は、ステップS408における広告の選択処理の流れを示す図である。
配信候補抽出部221は、広告データベース252から所定数m個の広告情報を抽出する(S421)。なお、広告データベース252からどのような広告情報を抽出するかは任意に設定可能である。例えば、ランダムにm個の広告情報を抽出するようにしてもよいし、広告情報のタイトルがコンテンツにマッチする度合いの高い順にm個の広告情報を抽出するようにしてもよいし、ユーザが興味を有しているカテゴリをユーザ情報の属性として記憶しておき、そのカテゴリにマッチする広告情報をm個抽出するようにしてもよい。
== (10) Advertisement selection process ==
FIG. 13 is a diagram showing the flow of the advertisement selection process in step S408.
The distribution
評価値算出部222は、リクエストに設定されているユーザIDに対応するユーザ情報をユーザデータベース253から読み出し、読み出したユーザ情報に含まれている各ユーザクラスタへの帰属度を要素とするユーザベクトルuを作成する(S422)。評価値算出部222は、近似行列記憶部254から行列UおよびAを読み出す(S423)。
The evaluation
評価値算出部222は、抽出した広告情報のそれぞれについて以下の処理を行う。すなわち、評価値算出部222は、広告情報に含まれている各広告クラスタへの帰属度を要素とする広告ベクトルaを生成し(S424)、ユーザベクトルuの転置ベクトル、行列U、広告ベクトルaおよび行列Aを乗じた値を、当該広告IDが当該ユーザによりクリックされる傾向の評価値(期待クリック性向)を算出する(S425)。
The evaluation
評価値算出部222が以上の処理を各広告情報について行った後、広告決定部223は、期待クリック性向の大きい順にn個の広告情報を選択して広告リストとする(S425)。なお、広告決定部223は、期待クリック性向に広告情報の入札額を乗じた値の大きい順にn個の広告情報を選択するようにしてもよい。
After the evaluation
==(11)効果==
以上説明したように、本実施形態の広告配信システムでは、ユーザと広告との関係性の観測値(本実施形態では実CTR)に、その信頼度による重み付けをする補正をしたうえで、低ランク近似を行っている。したがって、例えば信頼度の小さな観測値については観測値と予測値との差が小さく評価され、信頼度の高い観測値については観測値と予測値との差が大きく評価され、この評価値を最小化するように近似が行われるので、結果として信頼度の高い関係性を予測可能な近似の行列を作成することができる。
== (11) Effect ==
As described above, in the advertisement distribution system according to the present embodiment, the observation value of the relationship between the user and the advertisement (actual CTR in the present embodiment) is corrected by weighting according to the reliability, and the low rank Approximation is performed. Thus, for example, for observations with low confidence, the difference between the observed value and the predicted value is evaluated to be small, and for observations with high reliability, the difference between the observed value and the predicted value is highly evaluated. As a result, an approximate matrix that can predict a highly reliable relationship can be created.
また、低ランク近似を行うことにより行列のランクを低くすることができるので、関係性(クリック率)に関するノイズを除去することができる。 Further, since the rank of the matrix can be lowered by performing the low rank approximation, it is possible to remove noise related to the relationship (click rate).
また、本実施形態では、関係性としてクリック率を想定しているところ、オンライン広告におけるクリック率は非常に小さい値(1%未満であることも多い。)となることが知られている。したがって、特にインプレッション数が少ない間では、1度のクリックによる関係性への影響は非常に大きく、商品の購入回数が少ない間における1度の購入や、ランキングの評価回数が少ない間における1度のランキング付けなどを行った場合に比べて、関係性の予測値としては信頼度が著しく低くなる。よって、本実施形態のように信頼度を用いて観測値を補正することにより、クリックによる過度な影響を抑えることが可能となり、近似によるノイズ除去をより効果的に行うことができる。 Further, in the present embodiment, when the click rate is assumed as the relationship, it is known that the click rate in the online advertisement is a very small value (often less than 1%). Therefore, especially when the number of impressions is small, the influence on the relationship by a single click is very large. One purchase when the number of product purchases is small, and one time when the number of ranking evaluations is small. Compared to ranking, etc., the reliability is remarkably lowered as a predicted value of the relationship. Therefore, by correcting the observed value using the reliability as in the present embodiment, it is possible to suppress an excessive influence due to the click, and noise removal by approximation can be performed more effectively.
また、本実施形態では観測値(実CTR)の分散を底とするべき乗値の逆数を信頼度として使用している。したがって、観測値のばらつきが小さいほど信頼度が高くなるようにすることができる。低ランク近似は観測値と近似行列の積との差を最小化することになるため、観測値自体にばらつきが大きい場合には、最小化による近似の信頼度も低くなると考えられる。よって、本実施形態のように、ばらつきが小さい程信頼度を高くすることにより、最小化による近似の結果の信頼度も高くなることが期待される。 In this embodiment, the reciprocal of the power value based on the variance of the observed value (actual CTR) is used as the reliability. Therefore, the reliability can be made higher as the variation in the observed values is smaller. Since the low rank approximation minimizes the difference between the observed value and the product of the approximate matrix, if the observed value itself has a large variation, the reliability of approximation by minimization is considered to be low. Therefore, it is expected that the reliability of the approximation result by minimization is increased by increasing the reliability as the variation is small as in the present embodiment.
また、本実施形態の広告配信システムでは、クリック率はベータ分布に従うものとし、ベイズ推定による推定後の事後分布の分散が小さいほど信頼度が高くなるようにしている。一般に広告のインプレッション数が増えるに従って実クリック率の信頼度も上がると考えられるところ、ベイズ推定でも学習が進むにつれて分散が小さくなっていく。したがって、本実施形態のように事後分布の分散の小ささを信頼度とする妥当性が担保され、妥当な信頼度を用いて観測値を補正することができる。 In the advertisement distribution system of the present embodiment, the click rate follows the beta distribution, and the reliability increases as the variance of the posterior distribution after estimation by Bayesian estimation decreases. In general, the reliability of the actual click rate is considered to increase as the number of impressions of the advertisement increases. However, even with Bayesian estimation, the variance decreases as learning progresses. Therefore, as in this embodiment, the validity of the reliability of the small posterior distribution variance is ensured, and the observation value can be corrected using the appropriate reliability.
また、本実施形態の広告配信システムでは、ユーザおよび広告をクラスタに分類した上で関係性(クリック率)を観測し行列で管理しているので、大量のユーザや広告が存在する場合であっても、関係性の管理を容易に行うことが可能となり、観測値や関係性の管理にかかるリソースを低減することができる。また、広告クラスタごとにクリック率を観測することができるので欠損値を減らすことができる。よって、近似させた行列を用いた関係性の予測の精度を向上することができる。 In the advertisement distribution system of the present embodiment, since the relationship (click rate) is observed and managed in a matrix after classifying users and advertisements into clusters, there are a large number of users and advertisements. However, it becomes possible to easily manage the relationship, and it is possible to reduce resources for managing the observation value and the relationship. Further, since the click rate can be observed for each advertisement cluster, the missing value can be reduced. Therefore, the accuracy of the relationship prediction using the approximated matrix can be improved.
また、本実施形態の広告配信システムでは、配信する広告を決定する際に、期待クリック性向の大きい順に広告を選択しているので、ユーザのニーズに合わせた広告を配信することを可能とするとともに、広告のクリックによる広告収益を向上させることができる。 Further, in the advertisement distribution system of the present embodiment, when the advertisement to be distributed is determined, the advertisement is selected in descending order of expected click tendency, so that it is possible to distribute the advertisement according to the user's needs. , And improve your ad revenue from clicks on your ads.
==(11)変形例==
なお、本実施形態では、クリック率はベータ分布に従うものとしてベイズ推定の事後分布の分散に応じて信頼度を決定するものとしたが、クリック率は正規分布に従うものとして正規分布の分散に応じて信頼度を決定するようにしてもよい。この場合、分散vuaはクリック率をrとして、次式により算出することができる。
この分散を底として指数をsとするべき乗値の逆数を信頼度としてもよい。
== (11) Modification ==
In the present embodiment, the reliability is determined according to the variance of the posterior distribution of the Bayesian estimation assuming that the click rate follows the beta distribution, but the click rate depends on the variance of the normal distribution as follows the normal distribution. The reliability may be determined. In this case, the variance v ua can be calculated by the following equation, where the click rate is r.
Based on this variance, the reciprocal of a power value with an exponent of s may be used as the reliability.
また、クリック数およびインプレッション数の少なくともいずれかに応じて信頼度を決定してもよい。例えばインプレッション数やクリック数そのものを信頼度としてもよい。また、クリック数を底としたべき乗値とインプレッション数を底としたべき乗値との積を信頼度としてもよい。また、クリック数またはインプレッション数の対数を信頼度としてもよいし、クリック数の対数とインプレッション数の対数との合計値を信頼度としてもよい。 Further, the reliability may be determined according to at least one of the number of clicks and the number of impressions. For example, the number of impressions or the number of clicks may be used as the reliability. Further, the product of the power value with the click number as the base and the power value with the impression number as the base may be used as the reliability. Further, the click number or the logarithm of the impression number may be used as the reliability, or the total value of the logarithm of the click number and the logarithm of the impression number may be used as the reliability.
また、本実施形態ではインプレッション数を問わずに分散に応じて信頼度を決定するものとしたが、インプレッション数が所定の閾値を超えた場合には信頼度を1として補正を行わないようにしてもよい。 In this embodiment, the reliability is determined according to the dispersion regardless of the number of impressions. However, when the number of impressions exceeds a predetermined threshold, the reliability is set to 1 and correction is not performed. Also good.
また、本実施形態では、ユーザベクトル、行列U、行列Aおよび広告ベクトルを乗算して期待クリック性向を算出するものとしたが、行列UおよびAを乗じて性向行列を作成し、作成した性向行列を近似行列記憶部254に記憶するようにして、ユーザベクトルと性向行列と広告ベクトルを乗算して期待クリック性向を算出するようにしてもよい。
In this embodiment, the expected click tendency is calculated by multiplying the user vector, the matrix U, the matrix A, and the advertisement vector, but the tendency matrix is created by multiplying the matrices U and A. May be stored in the approximate
また、予測モデルE1を用いて予測CTRを算出し、予測CTRを広告の評価値として算出するようにしてもよい。 Further, the predicted CTR may be calculated using the prediction model E1, and the predicted CTR may be calculated as the evaluation value of the advertisement.
また、本実施形態ではソフトクラスタリングによりユーザおよび広告はそれぞれ複数のクラスタの帰属することが可能であるものとしたが、ハードクラスタリングにより1つのクラスタにのみ帰属可能としてもよい。この場合、評価値算出部222は、ユーザが帰属するユーザクラスタに対応する要素を行列Uから読み出し、広告が帰属する広告クラスタに対応する要素を行列Aから読み出し、読み出した要素に基づいて評価値を決定することができる。この場合、読み出した要素は、平均をとってもよいし、合計してもよい。また、行列Uおよび行列Aを乗じて性向行列を作成し、作成した性向行列からユーザが帰属するユーザクラスタと広告が所属する広告クラスタとに対応する要素を読み出し、読み出した要素に応じて評価値を決定するようにしてもよい。
In the present embodiment, a user and an advertisement can be attributed to a plurality of clusters by soft clustering, but may be attributed to only one cluster by hard clustering. In this case, the evaluation
==(12)他の適用例==
本実施形態では広告の配信を想定しているが、広告の配信に限らず、各種のコンテンツの提供を行うシステムに適用してもよい。また、コンテンツとユーザとの関係性もクリック率に限らず、ユーザがコンテンツを嗜好する度合いなど各種の関係性とすることができる。また、本実施形態の低ランク近似の処理は商品のレコメンド処理における協調フィルタリングなどに適用することもできる。
== (12) Other Application Examples ==
In this embodiment, advertisement distribution is assumed. However, the present invention is not limited to advertisement distribution, and may be applied to a system that provides various contents. In addition, the relationship between the content and the user is not limited to the click rate, and various relationships such as the degree to which the user likes the content can be used. Further, the low-rank approximation processing of the present embodiment can also be applied to collaborative filtering in the product recommendation processing.
以上、本実施形態について説明したが、上記実施形態は本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。本発明は、その趣旨を逸脱することなく、変更、改良され得ると共に、本発明にはその等価物も含まれる。 Although the present embodiment has been described above, the above embodiment is intended to facilitate understanding of the present invention and is not intended to limit the present invention. The present invention can be changed and improved without departing from the gist thereof, and the present invention includes equivalents thereof.
211 HTTP処理部
212 Webページ作成部
213 広告選択部
214 ログ収集部
215 解析処理部
221 配信候補抽出部
222 評価値算出部
223 広告決定部
231 クラスタリング処理部
232 観測行列生成部
233 信頼度算出部
234 低ランク近似処理部
251 Web情報データベース
252 広告データベース
253 ユーザデータベース
254 近似行列記憶部
255 インプレッションログ記憶部
256 クリックログ記憶部
211
Claims (13)
前記ユーザと前記コンテンツとの関係性を評価した実績値を要素とする観測行列を生成する観測行列生成部と、
前記実績値のそれぞれについて前記実績値の信頼度を算出する信頼度算出部と、
前記実績値に対して前記信頼度に応じた重み付けをして、前記観測行列よりも低ランクの複数の行列の積を前記観測行列に近似させる低ランク近似処理部と、
前記ユーザに提供可能な前記コンテンツである候補コンテンツのそれぞれについて、当該候補コンテンツ及び前記ユーザに対応する前記複数の行列の要素に基づいて前記候補コンテンツの評価値を算出する評価値算出部と、
前記評価値に応じて、前記ユーザに提供する前記コンテンツである提供コンテンツを前記候補コンテンツの中から決定する提供コンテンツ決定部と、
を備えることを特徴とするコンテンツ提供装置。 An apparatus for providing content to a user,
An observation matrix generation unit that generates an observation matrix having elements of actual values obtained by evaluating the relationship between the user and the content;
A reliability calculation unit for calculating the reliability of the actual value for each of the actual values;
A low rank approximation processing unit that weights the actual value according to the reliability and approximates the product of a plurality of lower rank matrices than the observation matrix to the observation matrix;
For each candidate content that is the content that can be provided to the user, an evaluation value calculation unit that calculates an evaluation value of the candidate content based on the candidate content and elements of the plurality of matrices corresponding to the user;
A provision content determination unit that determines, from among the candidate contents, a provision content that is the content to be provided to the user according to the evaluation value;
A content providing apparatus comprising:
前記コンテンツはオンラインで提供される広告であり、
前記観測行列生成部は、前記ユーザによる前記広告のクリック率を前記実績値として算出し、
前記信頼度算出部は、前記広告のクリック数および前記広告の閲覧数の少なくともいずれかに応じて前記信頼度を算出すること、
を特徴とするコンテンツ提供装置。 The content providing apparatus according to claim 1,
The content is an advertisement provided online;
The observation matrix generation unit calculates a click rate of the advertisement by the user as the actual value,
The reliability calculation unit calculates the reliability according to at least one of the number of clicks of the advertisement and the number of browsing of the advertisement;
A content providing apparatus characterized by the above.
前記信頼度算出部は、前記広告を前記ユーザが閲覧した閲覧数と、前記広告を前記ユーザがクリックしたクリック数とを取得し、ベータ分布Be(p,q)を事前分布として、前記クリック率のベイズ推定による事後分布Be(p+クリック数,q+閲覧数+クリック数)の分散を算出し、前記分散が小さいほど前記信頼度が高くなるように前記信頼度を決定すること、
を特徴とするコンテンツ提供装置。 The content providing apparatus according to claim 2,
The reliability calculation unit obtains the number of browsing that the user has viewed the advertisement and the number of clicks that the user has clicked on the advertisement, and uses the beta distribution Be (p, q) as a prior distribution, and the click rate Calculating the variance of the posterior distribution Be (p + clicks, q + views + clicks) based on Bayesian estimation, and determining the reliability such that the smaller the variance, the higher the reliability.
A content providing apparatus characterized by the above.
前記信頼度算出部は、前記実績値に応じて所定の確率分布における分散を算出し、算出した分散を底とするべき乗値の逆数を前記信頼度として算出すること、
を特徴とするコンテンツ提供装置。 The content providing apparatus according to claim 1,
The reliability calculation unit calculates a variance in a predetermined probability distribution according to the actual value, and calculates a reciprocal of a power value based on the calculated variance as the reliability.
A content providing apparatus characterized by the above.
前記確率分布はベータ分布であり、
前記信頼度算出部は、所定の事前分布からベイズ推定を行った事後分布の分散を算出すること、
を特徴とするコンテンツ提供装置。 The content providing apparatus according to claim 4,
The probability distribution is a beta distribution;
The reliability calculation unit calculates a variance of a posterior distribution obtained by performing Bayesian estimation from a predetermined prior distribution;
A content providing apparatus characterized by the above.
前記ユーザを1つの以上の第1の分類に分類分けするユーザ分類部と、
前記コンテンツを1つ以上の第2の分類に分類分けするユーザ分類部と、
前記第1および第2の分類の間の関係性を評価した実績値を要素とする観測行列を生成する観測行列生成部と、
前記実績値のそれぞれについて前記実績値の信頼度を算出する信頼度算出部と、
前記実績値に対して前記信頼度に応じた重み付けをして、前記観測行列よりも低ランクの複数の行列の積を前記観測行列に近似させる低ランク近似処理部と、
前記ユーザに提供可能な前記コンテンツである候補コンテンツのそれぞれについて、当該候補コンテンツが属する前記第1の分類および前記ユーザが属する前記第2の分類に対応する前記複数の行列の要素に基づいて前記候補コンテンツの評価値を算出する評価値算出部と、
前記ユーザに提供する前記コンテンツである提供コンテンツを前記評価値に応じて前記候補コンテンツの中から決定する提供コンテンツ決定部と、
を備えることを特徴とするコンテンツ提供装置。 An apparatus for providing content to a user,
A user classifying unit for classifying the user into one or more first classifications;
A user classification unit for classifying the content into one or more second classifications;
An observation matrix generation unit that generates an observation matrix having an actual value obtained by evaluating the relationship between the first and second classifications as an element;
A reliability calculation unit for calculating the reliability of the actual value for each of the actual values;
A low rank approximation processing unit that weights the actual value according to the reliability and approximates the product of a plurality of lower rank matrices than the observation matrix to the observation matrix;
For each candidate content that is the content that can be provided to the user, the candidate based on the elements of the plurality of matrices corresponding to the first classification to which the candidate content belongs and the second classification to which the user belongs An evaluation value calculation unit for calculating the evaluation value of the content;
A provision content determination unit that determines the provision content that is the content to be provided to the user from the candidate content according to the evaluation value;
A content providing apparatus comprising:
前記信頼度算出部は、前記実績値に応じて所定の確率分布における分散を算出し、算出した分散を底とするべき乗値の逆数を前記信頼度として算出すること、
を特徴とするコンテンツ提供装置。 The content providing apparatus according to claim 6,
The reliability calculation unit calculates a variance in a predetermined probability distribution according to the actual value, and calculates a reciprocal of a power value based on the calculated variance as the reliability.
A content providing apparatus characterized by the above.
前記関係性を評価した実績値を要素とする観測行列を生成する観測行列生成部と、
前記実績値のそれぞれについて前記実績値の信頼度を算出する信頼度算出部と、
前記実績値に対して前記信頼度に応じた重み付けをしたうえで、前記観測行列よりも低ランクの複数の行列の積を前記観測行列に近似させる低ランク近似処理部と、
を備えることを特徴とする低ランク近似行列生成装置。 An apparatus for generating a plurality of matrices approximated by low rank approximation to a relation matrix having an evaluation value obtained by evaluating the relationship between the content and the user as an element for providing the content to a user related to the content Because
An observation matrix generation unit that generates an observation matrix having an actual value obtained by evaluating the relationship as an element;
A reliability calculation unit for calculating the reliability of the actual value for each of the actual values;
A low rank approximation processing unit that approximates a product of a plurality of lower rank matrices than the observation matrix to the observation matrix after weighting according to the reliability with respect to the actual value,
A low-rank approximate matrix generation device comprising:
前記信頼度算出部は、前記実績値に応じて所定の確率分布における分散を算出し、算出した分散を底とするべき乗値の逆数を前記信頼度として算出すること、
を特徴とする低ランク近似行列生成装置。 The low rank approximate matrix generation device according to claim 8,
The reliability calculation unit calculates a variance in a predetermined probability distribution according to the actual value, and calculates a reciprocal of a power value based on the calculated variance as the reliability.
A low-rank approximate matrix generator characterized by
コンピュータが、
前記ユーザと前記コンテンツとの関係性を評価した実績値を要素とする観測行列を生成するステップと、
前記実績値のそれぞれについて前記実績値の信頼度を算出するステップと、
前記実績値に対して前記信頼度に応じた重み付けをして、前記観測行列よりも低ランクの複数の行列の積を前記観測行列に近似させるステップと、
前記ユーザに提供可能な前記コンテンツである候補コンテンツのそれぞれについて、当該候補コンテンツ及び前記ユーザに対応する前記複数の行列の要素に基づいて前記候補コンテンツの評価値を算出するステップと、
前記評価値に応じて、前記ユーザに提供する前記コンテンツである提供コンテンツを前記候補コンテンツの中から決定するステップと、
を実行することを特徴とするコンテンツ提供方法。 A method of providing content to a user,
Computer
Generating an observation matrix whose element is an actual value obtained by evaluating the relationship between the user and the content;
Calculating the reliability of the actual value for each of the actual values;
Weighting the actual value according to the reliability and approximating a product of a plurality of lower rank matrices than the observation matrix to the observation matrix;
For each candidate content that is the content that can be provided to the user, calculating an evaluation value of the candidate content based on the candidate content and elements of the plurality of matrices corresponding to the user;
Determining provided content, which is the content to be provided to the user, from the candidate content according to the evaluation value;
The content providing method characterized by performing.
コンピュータが、
前記関係性を評価した実績値を要素とする観測行列を生成するステップと、
前記実績値のそれぞれについて前記実績値の信頼度を算出するステップと、
前記実績値に対して前記信頼度に応じた重み付けをしたうえで、前記観測行列よりも低ランクの複数の行列の積を前記観測行列に近似させるステップと、
を実行することを特徴とする低ランク近似行列生成方法。 A method of generating a plurality of matrices approximated by low rank approximation to a relationship matrix having evaluation values obtained by evaluating the relationship between the content and the user as elements, in order to provide the content to a user related to the content Because
Computer
Generating an observation matrix whose elements are actual values obtained by evaluating the relationship;
Calculating the reliability of the actual value for each of the actual values;
Weighting the actual value according to the reliability, and approximating a product of a plurality of lower rank matrices than the observation matrix to the observation matrix;
A low-rank approximate matrix generation method characterized by:
コンピュータに、
前記ユーザと前記コンテンツとの関係性を評価した実績値を要素とする観測行列を生成するステップと、
前記実績値のそれぞれについて前記実績値の信頼度を算出するステップと、
前記実績値に対して前記信頼度に応じた重み付けをして、前記観測行列よりも低ランクの複数の行列の積を前記観測行列に近似させるステップと、
前記ユーザに提供可能な前記コンテンツである候補コンテンツのそれぞれについて、当該候補コンテンツ及び前記ユーザに対応する前記複数の行列の要素に基づいて前記候補コンテンツの評価値を算出するステップと、
前記評価値に応じて、前記ユーザに提供する前記コンテンツである提供コンテンツを前記候補コンテンツの中から決定するステップと、
を実行させるためのプログラム。 A program for providing content to a user,
On the computer,
Generating an observation matrix whose element is an actual value obtained by evaluating the relationship between the user and the content;
Calculating the reliability of the actual value for each of the actual values;
Weighting the actual value according to the reliability and approximating a product of a plurality of lower rank matrices than the observation matrix to the observation matrix;
For each candidate content that is the content that can be provided to the user, calculating an evaluation value of the candidate content based on the candidate content and elements of the plurality of matrices corresponding to the user;
Determining provided content, which is the content to be provided to the user, from the candidate content according to the evaluation value;
A program for running
コンピュータに、
前記関係性を評価した実績値を要素とする観測行列を生成するステップと、
前記実績値のそれぞれについて前記実績値の信頼度を算出するステップと、
前記実績値に対して前記信頼度に応じた重み付けをしたうえで、前記観測行列よりも低ランクの複数の行列の積を前記観測行列に近似させるステップと、
を実行させるためのプログラム。 Generating a plurality of matrices approximated by low rank approximation to a relation matrix having an evaluation value obtained by evaluating the relationship between the content and the user as an element for providing the content to a user related to the content A program for
On the computer,
Generating an observation matrix whose elements are actual values obtained by evaluating the relationship;
Calculating the reliability of the actual value for each of the actual values;
Weighting the actual value according to the reliability, and approximating a product of a plurality of lower rank matrices than the observation matrix to the observation matrix;
A program for running
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012087707A JP5507607B2 (en) | 2012-04-06 | 2012-04-06 | Content providing apparatus, low rank approximate matrix generating apparatus, content providing method, low rank approximate matrix generating method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012087707A JP5507607B2 (en) | 2012-04-06 | 2012-04-06 | Content providing apparatus, low rank approximate matrix generating apparatus, content providing method, low rank approximate matrix generating method, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013218485A true JP2013218485A (en) | 2013-10-24 |
JP5507607B2 JP5507607B2 (en) | 2014-05-28 |
Family
ID=49590519
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012087707A Active JP5507607B2 (en) | 2012-04-06 | 2012-04-06 | Content providing apparatus, low rank approximate matrix generating apparatus, content providing method, low rank approximate matrix generating method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5507607B2 (en) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015210627A (en) * | 2014-04-25 | 2015-11-24 | Kddi株式会社 | Menu generation server, menu display program, menu display method, and menu display system |
JP2016062411A (en) * | 2014-09-19 | 2016-04-25 | ヤフー株式会社 | Information analysis device, information analysis method, and information analysis program |
JP2016119123A (en) * | 2016-03-16 | 2016-06-30 | ヤフー株式会社 | Information processing device, terminal device, information processing method, and information processing program |
JP2016177628A (en) * | 2015-03-20 | 2016-10-06 | ヤフー株式会社 | Evaluated value calculating method, evaluated value calculating program, and evaluated value calculating device |
JP2017097801A (en) * | 2015-11-27 | 2017-06-01 | ヤフー株式会社 | Selection device, selection method and selection program |
JP2018519572A (en) * | 2016-01-12 | 2018-07-19 | ▲騰▼▲訊▼科技(深▲セン▼)有限公司 | Information distribution method, apparatus, server, and storage medium |
JP2018181101A (en) * | 2017-04-18 | 2018-11-15 | ヤフー株式会社 | Estimation device, estimation method, and estimation program |
CN113674012A (en) * | 2020-05-14 | 2021-11-19 | 南宁富桂精密工业有限公司 | Advertisement information pushing method and system |
KR20220033943A (en) * | 2020-09-10 | 2022-03-17 | 주식회사 엘지유플러스 | Method and Apparatus for VOD Content Recommendation |
WO2022107596A1 (en) * | 2020-11-18 | 2022-05-27 | ソニーグループ株式会社 | Information processing device and method, and program |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002269143A (en) * | 2001-03-13 | 2002-09-20 | Nec Corp | System, method and program for filtering information |
JP2005165632A (en) * | 2003-12-02 | 2005-06-23 | Sony Corp | Information processor and information processing method and its program and information processing system and method |
JP2010244380A (en) * | 2009-04-08 | 2010-10-28 | Sony Corp | Information processing apparatus and method, and program thereof |
-
2012
- 2012-04-06 JP JP2012087707A patent/JP5507607B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002269143A (en) * | 2001-03-13 | 2002-09-20 | Nec Corp | System, method and program for filtering information |
JP2005165632A (en) * | 2003-12-02 | 2005-06-23 | Sony Corp | Information processor and information processing method and its program and information processing system and method |
JP2010244380A (en) * | 2009-04-08 | 2010-10-28 | Sony Corp | Information processing apparatus and method, and program thereof |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015210627A (en) * | 2014-04-25 | 2015-11-24 | Kddi株式会社 | Menu generation server, menu display program, menu display method, and menu display system |
JP2016062411A (en) * | 2014-09-19 | 2016-04-25 | ヤフー株式会社 | Information analysis device, information analysis method, and information analysis program |
JP2016177628A (en) * | 2015-03-20 | 2016-10-06 | ヤフー株式会社 | Evaluated value calculating method, evaluated value calculating program, and evaluated value calculating device |
JP2017097801A (en) * | 2015-11-27 | 2017-06-01 | ヤフー株式会社 | Selection device, selection method and selection program |
US11144950B2 (en) | 2016-01-12 | 2021-10-12 | Tencent Technology (Shenzhen) Company Limited | Information delivery method and apparatus, server, and storage medium |
JP2018519572A (en) * | 2016-01-12 | 2018-07-19 | ▲騰▼▲訊▼科技(深▲セン▼)有限公司 | Information distribution method, apparatus, server, and storage medium |
JP2016119123A (en) * | 2016-03-16 | 2016-06-30 | ヤフー株式会社 | Information processing device, terminal device, information processing method, and information processing program |
JP2018181101A (en) * | 2017-04-18 | 2018-11-15 | ヤフー株式会社 | Estimation device, estimation method, and estimation program |
JP6990983B2 (en) | 2017-04-18 | 2022-01-12 | ヤフー株式会社 | Estimator, estimation method, and estimation program |
US11755623B2 (en) | 2017-04-18 | 2023-09-12 | Yahoo Japan Corporation | Estimation device, estimation method, and non-transitory computer-readable recording medium |
CN113674012A (en) * | 2020-05-14 | 2021-11-19 | 南宁富桂精密工业有限公司 | Advertisement information pushing method and system |
KR20220033943A (en) * | 2020-09-10 | 2022-03-17 | 주식회사 엘지유플러스 | Method and Apparatus for VOD Content Recommendation |
KR102391644B1 (en) * | 2020-09-10 | 2022-04-27 | 주식회사 엘지유플러스 | Method and Apparatus for VOD Content Recommendation |
WO2022107596A1 (en) * | 2020-11-18 | 2022-05-27 | ソニーグループ株式会社 | Information processing device and method, and program |
Also Published As
Publication number | Publication date |
---|---|
JP5507607B2 (en) | 2014-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5507607B2 (en) | Content providing apparatus, low rank approximate matrix generating apparatus, content providing method, low rank approximate matrix generating method, and program | |
US10825047B2 (en) | Apparatus and method of selection and placement of targeted messages into a search engine result page | |
US20170091805A1 (en) | Advertisement Recommendation Method and Advertisement Recommendation Server | |
Shan et al. | Predicting ad click-through rates via feature-based fully coupled interaction tensor factorization | |
CN111125574B (en) | Method and device for generating information | |
US20120150626A1 (en) | System and Method for Automated Recommendation of Advertisement Targeting Attributes | |
US20140278939A1 (en) | Advertisement extraction device and advertisement extraction method | |
CN108805598B (en) | Similarity information determination method, server and computer-readable storage medium | |
EP3126940A1 (en) | Systems and methods for optimizing content layout using behavior metrics | |
CN111095330B (en) | Machine learning method and system for predicting online user interactions | |
JP5485311B2 (en) | Advertisement evaluation apparatus, advertisement evaluation method and program | |
CN105678317B (en) | Information processing method and server | |
CN112508256B (en) | User demand active prediction method and system based on crowdsourcing | |
JP6976207B2 (en) | Information processing equipment, information processing methods, and programs | |
JP5507622B2 (en) | Advertisement billing amount determination device, advertisement billing amount determination method and program | |
CN111429214B (en) | Transaction data-based buyer and seller matching method and device | |
CN113032668A (en) | Product recommendation method, device and equipment based on user portrait and storage medium | |
US8423558B2 (en) | Targeting online ads by grouping and mapping user properties | |
JP5506867B2 (en) | Content distribution device | |
CN115204943A (en) | Advertisement recall method, device, equipment and storage medium | |
JP6228719B2 (en) | Document distribution device, document distribution method, program, and non-transitory recording medium | |
JP6100741B2 (en) | Extraction apparatus, extraction method and extraction program | |
JP5847867B2 (en) | Equipment for providing reference information for advertisers | |
JP2019113945A (en) | Information processing device, information processing method, and program | |
TWI818213B (en) | System and method of product recommendation and computer readable medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140217 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140225 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140319 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5507607 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |