JP4839358B2 - 購入予測方法、購入予測装置、購入予測プログラム、および、記録媒体 - Google Patents

購入予測方法、購入予測装置、購入予測プログラム、および、記録媒体 Download PDF

Info

Publication number
JP4839358B2
JP4839358B2 JP2008227235A JP2008227235A JP4839358B2 JP 4839358 B2 JP4839358 B2 JP 4839358B2 JP 2008227235 A JP2008227235 A JP 2008227235A JP 2008227235 A JP2008227235 A JP 2008227235A JP 4839358 B2 JP4839358 B2 JP 4839358B2
Authority
JP
Japan
Prior art keywords
probability
purchase
class
user
degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008227235A
Other languages
English (en)
Other versions
JP2010061456A (ja
Inventor
具治 岩田
晋治 渡部
武士 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2008227235A priority Critical patent/JP4839358B2/ja
Publication of JP2010061456A publication Critical patent/JP2010061456A/ja
Application granted granted Critical
Publication of JP4839358B2 publication Critical patent/JP4839358B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、複数のユーザの複数の商品に対する時系列の購買データに基づいて、その後の購買状況を予測する技術に関する。
近年、オンライン技術やデータベース技術の発展により、膨大な購買データを日々収集できるようになった。購買データに基づいてその後の購買状況を予測することで、ユーザにお勧めの商品を教示したり、購買傾向を解析したりすることが可能となる。
従来の購買状況の予測法として、購買データから頻出する購買順序パターンを抽出し、そのパターンを基に予測する手法がある(非特許文献1参照)。この手法では、購買の時間情報(何月何日に購入したか等)が考慮されない。また、購買の時間情報を考慮して購買状況を予測する手法もある(非特許文献2)。
岩田具治、山田武士、上田修功、"購買順序を効率的に用いた協調フィルタリング"、情報処理学会論文誌:数理モデル化と応用、Vol.49、No.SIG4(TOM20)、p.125−134、2008 岩田具治、田中利幸、山田武士、上田修功、"分布が変化するデータにおけるモデル学習法"、情報論的学習理論ワークショップ(IBIS2007)、p.170−175、2007
しかし、非特許文献1の技術では、購買の時間情報が考慮されないため、流行の変化や興味の変化などに対応できないという問題がある。また、非特許文献2の技術では、データが追加されるたびに、全データを読み込み、計算を行う必要があるため、日々膨大なデータが蓄積される場合、逐次対応することが困難という問題がある。
そこで、本発明は、前記問題に鑑みてなされたものであり、購買の時間情報を考慮して購買データの経時的な変化に対応しながらも少ない計算量で購買状況を予測することを課題とする。
前記課題を解決するために、本発明は、複数のユーザの複数の商品に対する購買のデータが時系列に沿って予め集められた購買データに基づいて、任意のユーザの任意の商品に対するその後の購入の可能性を予測する場合に、複数のユーザを複数のクラスに分け、同じクラスに属するユーザは同じ確率で任意の商品を購入すると仮定する確率モデルを用いて購入の可能性を予測する購入予測装置であって、購買データ、ユーザごとのクラスそれぞれに属する確率の集合であるクラス確率集合、ユーザのクラスに属する確率が変わらない度合いを示すクラス確率不変化度をパラメータとして持つ、ユーザのクラス確率の事前確率、クラスごとの商品それぞれがそのクラスのユーザによって購入される確率の集合である購入確率集合、および、クラスに属するユーザによって商品を購入される確率が変わらない度合いを示す購入確率不変化度をパラメータとして持つ、クラスの購入確率の事前確率、を記憶する記憶部と、クラス確率不変化度の尤度と購入確率不変化度の尤度とが最大になるように、クラス確率不変化度と購入確率不変化度とを繰り返し計算し、その計算したクラス確率不変化度と購入確率不変化度とを用いて、クラス確率集合および購入確率集合を更新するモデル推定部と、更新したクラス確率集合および購入確率集合を用いて、ユーザが商品を購入する確率を算出する購入予測部と、を備えることを特徴とする。また、この購入予測装置を用いて購入予測方法を実行することもできる。
かかる発明によれば、複数のユーザが複数のクラスに分けられるという前提でモデル推定部がクラス確率集合および購入確率集合を推定(更新)し、購入予測部がそのクラス確率集合および購入確率集合に基づいて購買状況(購入の可能性)を予測することで、時系列の購買データの経時的な変化に対応しながらも少ない計算量で購買状況を予測することができる。
また、本発明は、記憶部が、購買データの最新時刻以前の所定時間分のクラス確率集合、ユーザのクラス確率の事前確率、購入確率集合、および、クラスの購入確率の事前確率、を記憶しており、モデル推定部が、所定時間分のクラス確率不変化度の尤度と、所定時間分の購入確率不変化度の尤度と、が最大になるように、所定時間分のクラス確率不変化度と、所定時間分の購入確率不変化度と、を繰り返し計算し、その計算した所定時間分のクラス確率不変化度と、所定時間分の購入確率不変化度と、を用いて、所定時間分のクラス確率集合、および、所定時間分の購入確率集合を更新し、購入予測部が、更新した所定時間分のクラス確率集合、および、所定時間分の購入確率集合を用いて、ユーザが商品を購入する確率を算出することが好ましい。
かかる発明によれば、クラス確率集合および購入確率集合が、購買データの最新時刻分だけでなく、それ以前の所定時間分を考慮したものであることで、購買データの最新時刻分だけのときに比べて予測の精度を高くすることができる。
また、本発明は、コンピュータを、購入予測装置の各部として機能させるための購入予測プログラムである。これにより、このプログラムをインストールされたコンピュータは、このプログラムに基づいた各機能を実現することができる。
また、本発明は、前記購入予測プログラムが記録されたことを特徴とするコンピュータに読み取り可能な記録媒体である。これにより、この記録媒体を装着されたコンピュータは、この記録媒体に記録されたプログラムに基づいた各機能を実現することができる。
本発明によれば、購買の時間情報を考慮して購買データの経時的な変化に対応しながらも少ない計算量で購買状況を予測することができる。
以下、本発明を実施するための最良の形態(以下、「実施形態」という。)について、詳細に説明する。なお、本実施形態では、複数のユーザの複数の商品に対する購買のデータが時系列に沿って予め集められた購買データに基づいて、任意のユーザの任意の商品に対するその後の購入の可能性を予測する場合に、複数のユーザを複数のクラスに分け、属するクラスが同じユーザは同じ確率で任意の商品を購入すると仮定する確率モデルを用いることを前提とする。
また、以下において、「購入の可能性の予測」、「購入する確率の推定(算出)」、「購買状況の予測」、「興味の予測」などの表現は同義である。さらに、以下の各数式において、太字の文字(θなど)は、複数の成分を有していることを示す。また、それらの太字の文字について、文章中では太字で示していないが、各数式と整合をとったものであるものとする。
図1は、本実施形態の興味予測装置の構成を示すブロック図である。図1に示すように、興味予測装置1(購入予測装置)は、演算手段2と、入力手段3と、記憶手段4と、出力手段5とを備えており、それらはバスライン11に接続されている。
演算手段2は、モデル推定部21と、興味予測部22(購入予測部)と、メモリ23とを含んで構成される。演算手段2は、例えば、CPU(Central Processing Unit)およびRAM(Random Access Memory)から構成され、CPUが記憶手段4からモデル推定プログラム41と興味予測プログラム42とを読み込み、RAMであるメモリ23に格納し、実行することで、モデル推定部21と興味予測部22とがそれぞれ実現される。
入力手段3は、キーボードやディスクドライブ装置などから構成される。入力データは入力手段3を介して興味予測装置1の管理者などによって入力され、記憶手段4に記憶される。
記憶手段4は、ハードディスク装置などから構成され、プログラム格納部40aと、データ格納部40bと、を有する。プログラム格納部40aは、モデル推定プログラム41と、興味予測プログラム42と、を記憶する。また、データ格納部40bは、入力データ43、クラス集合44、クラス確率集合45、購入確率集合46、クラス確率不変化度集合47、購入確率不変化度集合48を記憶する。
入力データ43は、複数のユーザの複数の商品に対する購買のデータが時系列に沿って予め集められた購買データである。クラス集合44は、入力データ43における複数のユーザを分ける複数のクラスの集合データである。
クラス確率集合45は、ユーザごとのクラスそれぞれに属する確率の集合である。購入確率集合46は、クラスごとの、商品それぞれがそのクラスのユーザによって購入される確率の集合である。
クラス確率不変化度集合47は、ユーザごとのクラスそれぞれに属する確率が変わらない度合いの集合である。購入確率不変化度集合48は、クラスごとの、商品それぞれがそのクラスのユーザによって購入される確率が変わらない度合いの集合である。
出力手段5は、例えば、グラフィックボード及びそれに接続されたモニタであり、興味予測を行った結果などを表示するものである。
本実施形態では、ユーザuが時刻tにおいて商品iを購入する確率P(i|u,t)を推定(算出)する。つまり、確率P(i|u,t)は、ユーザuの時刻tにおける商品iに対する興味の度合いを表す。時刻tは離散値とし、単位時間として1日、1週間など任意の期間を用いることができる。
確率P(i|u,t)を推定する場合、ユーザの合計数をU、商品の合計数をIとしたとき、各時刻において、U(I−1)個のパラメータが必要となる。なお、「U(I−1)」において、「I」ではなく「I−1」となっているのは、「I−1」個のパラメータが決まれば、残りの1つのパラメータは、パラメータの全体合計値から「I−1」個のパラメータの合計値を減算することで自動的に決定するからである。通常、U(I−1)はUやIに比べて非常に多く、推定が困難である。そこで、隠れ変数であるクラスzを導入して、式(1)のように確率P(i|u,t)をモデル化する。
Figure 0004839358
Zをクラスの合計数とすると、このとき各時刻のパラメータの合計数はU(Z−1)+Z(I−1)となり、Z≪U、Z≪Iであるため、パラメータの合計数を大幅に削減でき、頑健な推定が可能となる。ここで、P(,t)は時刻tでのユーザuがクラスzに帰属する確率、P(i|z,t)は時刻tでのクラスzで商品iが購入される確率を表す。
商品に対する興味の変化、人気の変化に対応するため、P(z|u,t)、および、P(i|z,t)は、以下の式(2)、式(3)のように、1時刻前の状態を引数とするある関数Fで時間発展するものとする。
Figure 0004839358
時間発展として、例えば、状態空間モデルを用いて、カルマンフィルタで推定することができる。また、φtuz=P(z|t,u)(=P(z|u,t))、θtzi=P(i|z,t)とし、以下のような時間発展も考えられる。
ここで、時刻tのユーザuのクラス確率φtuの事前確率は、1時刻前のユーザuのクラス確率φt−1u(「t−1u」は「(t−1)u」の意。以下、他の変数についても同様)およびユーザuのクラス確率不変化度αtuをパラメータとして持つ、以下の式(4)のようなディリクレ分布であるとする。
Figure 0004839358
なお、この分布の平均値Eは1時刻前のクラス確率に一致し
(E(φtu|φt−1u,αtu)=φt−1u)、
分散varはαtu+1に反比例する(var(φtuz|φt−1u,αtu)=
(φt−1uz(1−φt−1uz))/αtu+1)。
また、時刻tのクラスzの購入確率θtzの事前確率も同様に、1時刻前のクラスzの購入確率θt−1zおよびクラスzの購入確率不変化度βtzをパラメータとして持つ、以下の式(5)のようなディリクレ分布であるとする。なお、Γ()はガンマ関数である。
Figure 0004839358
<モデル推定部>
図2、図3を参照しながら、モデル推定部21について説明する。図2は、本実施形態の興味予測装置のモデル推定部のブロック図を含む説明図である。図2に示すように、モデル推定部21は、入力データ読み込み部211と、パラメータ読み込み部212と、初期化部213と、クラス推定部214と、クラス確率不変化度推定部215と、購入確率不変化度推定部216と、パラメータ書き込み部217と、を備えている。
図3は、モデル推定部の処理の流れを示すフローチャートである。まず、ステップS1において、入力データ読み込み部211により入力データ43を読み込み、パラメータ読み込み部212により1時刻前のデータを用いて推定した(ステップS1〜S7の処理を行った)クラス確率集合45、購入確率集合46を読み込む。なお、1時刻前のクラス確率集合45および購入確率集合46がない場合、つまりt=0の場合、クラス確率および購入確率は一様分布とする。
次に、ステップS2において、初期化部213により、クラス集合44、クラス確率不変化度集合47、購入確率不変化度集合48を初期化する。例えば、クラス集合44はランダムな値となるように初期化し、クラス確率不変化度集合47および購入確率不変化度集合48は全て「1」に初期化する。
次に、クラス推定部214によるクラス集合44の計算(ステップS3)、クラス確率不変化度推定部215によるクラス確率不変化度集合47の計算(ステップS4)、購入確率不変化度推定部216による購入確率不変化度集合48の計算(ステップS5)を繰り返す(ステップS6(終了条件を満たすか否かの判断)でNo→ステップS3)ことにより、クラス集合44、クラス確率不変化度集合47および購入確率不変化度集合48の現在の推定値が、どのくらい入力データ43をもっともらしく説明できているかを表す尤度を最大化する。例えば、商品に対して同じ興味を持つユーザの購買(購買データ。以下同様)が同じクラスに帰属していたり、共通ユーザ(クラスが共通であるユーザ)に購入されやすい商品の購買が同じクラスに帰属していたりする場合、尤度は高くなる。尤度計算は、入力データ43、1時刻前のクラス確率集合45および購入確率集合46を用いることで実現できる。例えば、次の式(6)を尤度として用いることができる。
Figure 0004839358
ここで、xtujは時刻tでユーザuがj番目に購入した商品であり、xtu={xtujは時刻tでユーザuが購入した商品集合であるとすると、X={xtuは時刻tでの全ユーザの購入商品集合である。また、φtuz=P(z|t,u)は時刻tでのユーザuがクラスzに帰属する確率(式(4)参照)、φtu={φtuzは時刻tでのユーザuのクラス確率、Φ={φtuは時刻tでのクラス確率集合、θtzi=P(i|z,t)は時刻tでのクラスzで商品iが購入される確率(式(5)参照)、θtz={θtziは時刻tでのクラスzの購入確率、Θ={θtzは時刻tでの購入確率集合とする。また、α={αはクラス確率不変化度集合、β={βは購入確率不変化度集合を表す。
ステップS3において、クラス推定部214では、各購買mがどのクラスに帰属するかを計算する。クラス推定部214によって、クラス計算は、入力として、購買mを除いた時刻tでユーザuの購買がクラスkである数ntuk\m、購買mを除いた時刻tでユーザuの購買数ntu\m、購買mを除いた時刻tで商品iの購買がクラスkである数ntik\m、購買mを除いた時刻tで購買がクラスkである数ntk\mをとり、例えば、ギブスサンプリングに基づく次の式(7)により計算される。ここで、Zt\m={ztnn≠mは購買mを除いた時刻tでのクラス集合を表す。
Figure 0004839358
ステップS4において、クラス確率不変化度推定部215では、各ユーザuのクラス確率不変化度αtuを、尤度が高くなるように計算する。例えば、次の式(8)の計算を繰り返すことで尤度が高いαtuを計算することができる。ここで、「←」は代入、Ψ(・)はディガンマ関数(ガンマ関数の対数の一階導関数)を表す。
Figure 0004839358
ステップS5において、購入確率不変化度推定部216では、各クラスzの購入確率不変化度βtzを、尤度が高くなるように計算する。例えば、次の式(9)の計算を繰り返すことで尤度が高いβtzを計算することができる。
Figure 0004839358
繰り返しの終了条件(ステップS6)としては、クラス集合44、クラス確率不変化度集合47、購入確率不変化度集合48が収束する、あるいは、繰り返し数がある一定以上になる、などが考えられる。本実施形態では、例えば、前記収束を終了条件とする。
終了条件を満たした後(ステップS6でYes)、パラメータ書き込み部217によって、次の式(10)で計算される時刻tのユーザuのクラスzに属する確率をクラス確率集合45に格納し、次の式(11)で計算される時刻tのクラスzの商品iの購入確率を購入確率集合46に格納する(ステップS7)。
Figure 0004839358
<興味予測部>
図4を参照しながら、興味予測部22について説明する。図4は、本実施形態の興味予測装置の興味予測部のブロック図を含む説明図である。図4に示すように、興味予測部22は、パラメータ読み込み部221と、興味計算部222と、興味出力部223とを備えている。
興味予測部22では、まず、パラメータ読み込み部221により、モデル推定部21によって計算された最新のクラス確率集合45および購入確率集合46を読み込む。次に、興味計算部222において、クラス確率集合45および購入確率集合46を用いて、次の式(12)に基づき、時刻tにおけるユーザuの商品iに対する興味、つまり、そのユーザがその商品を購入する確率を計算する。
Figure 0004839358
最後に、興味出力部223により、出力手段5に、予測した興味の結果を出力する。
(変形例)
興味予測装置1では、前記したように1時刻前のパラメータ(クラス確率集合45および購入確率集合46)のみ用いるのではなく、L時刻前から1時刻前までのパラメータ(所定時間分のパラメータ)を用いて、興味を予測することも可能である。つまり、φtuがl(エル)時刻前のユーザuのクラス確率φt−1uおよびl(エル)時刻前からのユーザuのクラス確率不変化度αtulをパラメータとして持つ、次の式(13)のようなディリクレ分布に従うとする。
Figure 0004839358
また、θtzも同様に、l(エル)時刻前のクラスzの購入確率θt−1uおよびl(エル)時刻前からのクラスzの購入確率不変化度βtzlをパラメータとして持つ、次の式(14)のようなディリクレ分布に従うとする。
Figure 0004839358
L時刻前から1時刻前までのパラメータを用いることにより、1時刻前のパラメータのみを用いる場合に比べ、モデル推定が安定化し、予測精度が高まることが期待できる。この変形例において、モデル推定部21による処理の際、式(7)、式(8)、式(9)、式(10)および式(11)を、それぞれ次のような式(15)、式(16)、式(17)、式(18)および式(19)に変更する。この変形例において、興味予測部22による処理の内容に変更はない。
Figure 0004839358
このように、本実施形態の興味予測装置1によれば、複数のユーザが複数のクラスに分けられるという前提でモデル推定部21が確率モデルを推定し、興味予測部22がその確率モデルに基づいてユーザの興味(その後の購買状況(購入確率))を予測することで、入力データ43(時系列の購買データ)の経時的な変化に対応しながらも少ない計算量でユーザの興味を予測することができる。つまり、この予測により、各ユーザに対して適したお勧めの商品を教示したり、どの商品が同じユーザに購入されやすいか、どの商品がいつ人気があったかなどの購買傾向を解析したりすることが可能となる。
また、クラス確率集合45および購入確率集合46が、入力データ43の最新時刻分だけでなく、それ以前の所定時間分を考慮したものであることで、予測の精度を高くすることができる。
さらに、クラス確率集合45および購入確率集合46を用いて表した入力データ43に対する尤度(式(6)参照)を計算し、その尤度の最大化を図ることで確率モデルを推定するので、確率モデルひいては予測の精度を高くすることができる。
また、興味予測装置1は、一般的なコンピュータに、前記した各処理のプログラムを実行させることで実現することができる。このプログラムは、通信回線を介して提供することが可能であるし、CD−ROM(Compact Disc−Read Only Memory)等の記録媒体に書き込んで配布することも可能である。
以上で本実施形態の説明を終えるが、本発明の態様はこれらに限定されるものではない。例えば、本発明は、任意の確率モデルや尤度計算式に適用が可能である。また、本実施形態では、uをユーザ、iを商品としたが、時間発展する離散変数であれば、uおよびiは任意の情報でよい。例えば、uを文書、iを単語とし、各文書でどの単語が使われやすいかの時間発展のモデル化にも適用できる。その他、ハードウェアやフローチャート等の具体的な構成について、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
次に、本実施形態の興味予測装置1の実施例について説明する。本実施形態の興味予測装置1を評価するため、購買データの予測実験を行った。単位時間は1日とした。前日までのデータを学習データとして用い、各日の各ユーザの購買を予測する問題の正答率で評価を行った。
購買データとして、動画および漫画配信のオンラインストアでのログを用いた。動画データは、2007年5月14日から2007年8月31日までの110日間のログで、ユーザ数は70,122、商品数は7,469、全購買数は11,243,935であった。漫画データは、2006年1月1日から2006年5月31日までの151日間のログで、ユーザ数は143,212、商品数は206、全購買数は12,642,505であった、なお、各データともに、購買数が10未満の商品、10未満のユーザは省いた。また、各データともに、新商品が1週間ごとに発売されている。
比較手法として、比較例1(LDAall)、比較例2(LDAonline)、比較例3(LDAone)を用いた。LDAは、本実施形態の興味予測装置1の処理内容からクラス確率集合45および購入確率集合46の時間発展を除いた手法である。比較例1(LDAall)ではログ開始日から前日までの全データを用いてLDAを学習し、比較例2(LDAonline)では前日のデータおよびそれ以前のデータで推定したクラス集合を用いてLDAを学習し、比較例3(LDAone)では前日のデータのみを用いてLDAを学習する。
図5は、(a)が動画、(b)が漫画について、日毎の3ベスト正答率を示すグラフであり、縦軸が正答率(%)を、横軸が日を示している。3ベスト正答率とは、予測により得られた正解候補の上位3つのいずれかが実際に正解していた場合の割合(%)のことである。また、実施例1(OurMethod7)は、7日前から前日までのパラメータを用いた場合の興味予測装置1による予測結果を示し、実施例2(OurMethod1)は、1日前のパラメータのみを用いた場合の興味予測装置1による予測結果を示す。
図5の(a)において、実施例1(OurMethod7)および実施例2(OurMethod1)の3ベスト正答率は、比較例1〜3の3ベスト正答率と比べて、総じて高いことがわかる。また、図5の(b)において、実施例1(OurMethod7)の3ベスト正答率は、比較例1〜3の3ベスト正答率と比べて、総じて高いことがわかる。さらに、図5の(a)および(b)において、特に、実施例1(OurMethod7)、実施例2(OurMethod1)および比較例3(LDAone)について、1週間ごとの谷の部分は、新商品が発売されたことにより正答率が低くなっていることを示している。
また、その全時間で平均した正答率(%)を表1に示す。表1において、(a)は動画、(b)は漫画の場合の結果である。なお、正答率に付随する括弧書きの数字(「0.9」など)は標準偏差を表す。(a)および(b)の表において、最左列の「1」〜「5」は、「1ベスト正答率」〜「5ベスト正答率」を表している。(a)および(b)の表において、実施例1(OurMethod7)の正答率が最も高く、正確にユーザの興味を予測できていることが確認できる。実施例2(OurMethod1)の正答率も、動画ではいずれの比較例よりも高く、漫画では比較例1とは同等であるが比較例2,3よりは高い。
Figure 0004839358
また、この場合の、Xeon(登録商標) 2.93GHzのCPUのPC(Personal Computer)における各手法の1時刻あたりの平均計算時間(秒)を表2に示す。表2において、(a)は動画、(b)は漫画の場合の結果である。なお、平均計算時間の値に付随する括弧書きの数字(「40.4」など)は標準偏差を表す。比較例1は、漫画データにおける正答率(表1の(b)参照)が実施例1および実施例2とほぼ同等であった。この比較例1は、全データを用いるため、動画および漫画の場合ともに、他手法と比べ、多くの計算量が必要となっていることがわかる。一方、動画および漫画の場合ともに、実施例1および実施例2では、比較例1と比べ、1/10以下の時間で計算が終っており、大規模データでも高速に計算できていることがわかる。
Figure 0004839358
このように、本実施例から、本実施形態の興味予測装置1による計算は、計算精度と計算時間の2つの観点から見た場合、比較例1〜3の計算と比べて優れていることがわかる。
本実施形態の興味予測装置の構成を示すブロック図である。 本実施形態の興味予測装置のモデル推定部のブロック図を含む説明図である。 モデル推定部の処理の流れを示すフローチャートである。 本実施形態の興味予測装置の興味予測部のブロック図を含む説明図である。 本実施形態の興味予測方法を含む各手法の日毎の3ベスト正答率を示すグラフである。
符号の説明
1 興味予測装置(購入予測装置)
2 演算手段
3 入力手段
4 記憶手段
5 出力手段
11 バスライン
21 モデル推定部
22 興味予測部(購入予測部)
23 メモリ
40a プログラム格納部
40b データ格納部
41 モデル推定プログラム
42 興味予測プログラム
43 入力データ
44 クラス集合
45 クラス確率集合
46 購入確率集合
47 クラス確率不変化度集合
48 購入確率不変化度集合

Claims (8)

  1. 複数のユーザの複数の商品に対する購買のデータが時系列に沿って予め集められた購買データに基づいて、任意の前記ユーザの任意の前記商品に対するその後の購入の可能性を予測する場合に、前記複数のユーザを複数のクラスに分け、同じ前記クラスに属する前記ユーザは同じ確率で任意の前記商品を購入すると仮定する確率モデルを用いて前記購入の可能性を予測する購入予測装置による購入予測方法であって、
    前記購入予測装置は、
    前記購買データ、
    前記ユーザごとの前記クラスそれぞれに属する確率の集合であるクラス確率集合、
    前記ユーザの前記クラスに属する確率が変わらない度合いを示すクラス確率不変化度をパラメータとして持つ、前記ユーザのクラス確率の事前確率、
    前記クラスごとの前記商品それぞれがそのクラスのユーザによって購入される確率の集合である購入確率集合、および、
    前記クラスに属する前記ユーザによって商品を購入される確率が変わらない度合いを示す購入確率不変化度をパラメータとして持つ、前記クラスの購入確率の事前確率、を記憶する記憶部と、
    モデル推定部と、購入予測部と、を備えており、
    前記モデル推定部は、前記クラス確率不変化度の尤度と前記購入確率不変化度の尤度とが最大になるように、前記クラス確率不変化度と前記購入確率不変化度とを繰り返し計算し、その計算した前記クラス確率不変化度と前記購入確率不変化度とを用いて、前記クラス確率集合および前記購入確率集合を更新し
    前記購入予測部は、前記更新した前記クラス確率集合および前記購入確率集合を用いて、前記ユーザが前記商品を購入する確率を算出す
    とを特徴とする購入予測方法。
  2. 前記ユーザのクラス確率の事前確率は、ディリクレ分布として定義されており、
    前記クラスの購入確率の事前確率は、ディリクレ分布として定義されている
    ことを特徴とする請求項1に記載の購入予測方法。
  3. 前記記憶部は、前記購買データの最新時刻以前の所定時間分の前記クラス確率集合、前記ユーザのクラス確率の事前確率、前記購入確率集合、および、前記クラスの購入確率の事前確率、を記憶しており、
    前記モデル推定部は、前記所定時間分の前記クラス確率不変化度の尤度と、前記所定時間分の前記購入確率不変化度の尤度と、が最大になるように、前記所定時間分の前記クラス確率不変化度と、前記所定時間分の前記購入確率不変化度と、を繰り返し計算し、その計算した前記所定時間分の前記クラス確率不変化度と、前記所定時間分の前記購入確率不変化度と、を用いて、前記所定時間分の前記クラス確率集合、および、前記所定時間分の前記購入確率集合を更新し、
    前記購入予測部は、前記更新した前記所定時間分の前記クラス確率集合、および、前記所定時間分の前記購入確率集合を用いて、前記ユーザが前記商品を購入する確率を算出する
    ことを特徴とする請求項1または請求項2に記載の購入予測方法。
  4. 複数のユーザの複数の商品に対する購買のデータが時系列に沿って予め集められた購買データに基づいて、任意の前記ユーザの任意の前記商品に対するその後の購入の可能性を予測する場合に、前記複数のユーザを複数のクラスに分け、同じ前記クラスに属する前記ユーザは同じ確率で任意の前記商品を購入すると仮定する確率モデルを用いて前記購入の可能性を予測する購入予測装置であって、
    前記購買データ、
    前記ユーザごとの前記クラスそれぞれに属する確率の集合であるクラス確率集合、
    前記ユーザの前記クラスに属する確率が変わらない度合いを示すクラス確率不変化度をパラメータとして持つ、前記ユーザのクラス確率の事前確率、
    前記クラスごとの前記商品それぞれがそのクラスのユーザによって購入される確率の集合である購入確率集合、および、
    前記クラスに属する前記ユーザによって商品を購入される確率が変わらない度合いを示す購入確率不変化度をパラメータとして持つ、前記クラスの購入確率の事前確率、を記憶する記憶部と、
    前記クラス確率不変化度の尤度と前記購入確率不変化度の尤度とが最大になるように、前記クラス確率不変化度と前記購入確率不変化度とを繰り返し計算し、その計算した前記クラス確率不変化度と前記購入確率不変化度とを用いて、前記クラス確率集合および前記購入確率集合を更新するモデル推定部と、
    前記更新した前記クラス確率集合および前記購入確率集合を用いて、前記ユーザが前記商品を購入する確率を算出する購入予測部と、
    を備えることを特徴とする購入予測装置。
  5. 前記ユーザのクラス確率の事前確率は、ディリクレ分布として定義されており、
    前記クラスの購入確率の事前確率は、ディリクレ分布として定義されている
    ことを特徴とする請求項4に記載の購入予測装置。
  6. 前記記憶部は、前記購買データの最新時刻以前の所定時間分の前記クラス確率集合、前記ユーザのクラス確率の事前確率、前記購入確率集合、および、前記クラスの購入確率の事前確率、を記憶しており、
    前記モデル推定部は、前記所定時間分の前記クラス確率不変化度の尤度と、前記所定時間分の前記購入確率不変化度の尤度と、が最大になるように、前記所定時間分の前記クラス確率不変化度と、前記所定時間分の前記購入確率不変化度と、を繰り返し計算し、その計算した前記所定時間分の前記クラス確率不変化度と、前記所定時間分の前記購入確率不変化度と、を用いて、前記所定時間分の前記クラス確率集合、および、前記所定時間分の前記購入確率集合を更新し、
    前記購入予測部は、前記更新した前記所定時間分の前記クラス確率集合、および、前記所定時間分の前記購入確率集合を用いて、前記ユーザが前記商品を購入する確率を算出する
    ことを特徴とする請求項4または請求項5に記載の購入予測装置。
  7. コンピュータを請求項4から請求項6のいずれか一項に記載の購入予測装置の各部として機能させるための購入予測プログラム。
  8. 請求項に記載の購入予測プログラムが記録されたことを特徴とするコンピュータに読み取り可能な記録媒体。
JP2008227235A 2008-09-04 2008-09-04 購入予測方法、購入予測装置、購入予測プログラム、および、記録媒体 Expired - Fee Related JP4839358B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008227235A JP4839358B2 (ja) 2008-09-04 2008-09-04 購入予測方法、購入予測装置、購入予測プログラム、および、記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008227235A JP4839358B2 (ja) 2008-09-04 2008-09-04 購入予測方法、購入予測装置、購入予測プログラム、および、記録媒体

Publications (2)

Publication Number Publication Date
JP2010061456A JP2010061456A (ja) 2010-03-18
JP4839358B2 true JP4839358B2 (ja) 2011-12-21

Family

ID=42188178

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008227235A Expired - Fee Related JP4839358B2 (ja) 2008-09-04 2008-09-04 購入予測方法、購入予測装置、購入予測プログラム、および、記録媒体

Country Status (1)

Country Link
JP (1) JP4839358B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102346894B (zh) * 2010-08-03 2017-03-01 阿里巴巴集团控股有限公司 推荐信息的输出方法、***及服务器
JP5775425B2 (ja) * 2011-11-18 2015-09-09 日本電信電話株式会社 購買データ解析装置、方法、及びプログラム
JP5860795B2 (ja) * 2012-11-06 2016-02-16 日本電信電話株式会社 生存率推定装置、方法、及びプログラム
JP6078014B2 (ja) * 2014-02-27 2017-02-08 日本電信電話株式会社 購買意欲学習装置、購買予測装置、方法、及びプログラム
KR101813805B1 (ko) * 2016-09-28 2017-12-29 한양대학교 산학협력단 머신 러닝을 이용한 사용자의 구매 확률 예측 방법 및 장치
CN110796280A (zh) * 2018-08-02 2020-02-14 北京京东尚科信息技术有限公司 用户行为预测方法、装置和计算机可读存储介质
CN111091416A (zh) * 2019-12-10 2020-05-01 北京云迹科技有限公司 一种预测酒店购买机器人的概率的方法和装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002279279A (ja) * 2001-03-22 2002-09-27 Just Syst Corp 商品推薦装置、商品推薦方法、及び商品推薦プログラム
JP2004054439A (ja) * 2002-07-17 2004-02-19 Nippon Telegr & Teleph Corp <Ntt> 顧客行動分析に基づくマーケティング戦略策定支援方法、装置、およびプログラム
JP4751242B2 (ja) * 2006-05-29 2011-08-17 日本電信電話株式会社 リコメンド装置、リコメンド方法、リコメンドプログラムおよびそのプログラムを記録した記録媒体

Also Published As

Publication number Publication date
JP2010061456A (ja) 2010-03-18

Similar Documents

Publication Publication Date Title
JP4839358B2 (ja) 購入予測方法、購入予測装置、購入予測プログラム、および、記録媒体
US11379901B2 (en) Methods and apparatuses for deep learning-based recommendation, electronic devices, and media
Varoquaux et al. Scikit-learn: Machine learning without learning the machinery
Rodríguez et al. Label switching in Bayesian mixture models: Deterministic relabeling strategies
Cantoni et al. Variable selection for marginal longitudinal generalized linear models
Marimoutou et al. Energy markets and CO2 emissions: Analysis by stochastic copula autoregressive model
JP4847916B2 (ja) 購買順序を考慮したリコメンド装置、リコメンド方法、リコメンドプログラムおよびそのプログラムを記録した記録媒体
US11935049B2 (en) Graph data processing method and apparatus, computer device, and storage medium
Maldonado et al. Advanced conjoint analysis using feature selection via support vector machines
JP6299759B2 (ja) 予測関数作成装置、予測関数作成方法、及びプログラム
CN112801706B (zh) 一种游戏用户行为数据挖掘方法及***
Petropoulos et al. A hidden Markov model with dependence jumps for predictive modeling of multidimensional time-series
US11977978B2 (en) Finite rank deep kernel learning with linear computational complexity
CN111242283A (zh) 评估交互事件的自编码器的训练方法及装置
Rytgaard et al. Estimation of time‐specific intervention effects on continuously distributed time‐to‐event outcomes by targeted maximum likelihood estimation
Jimenez et al. An approximate innovation method for the estimation of diffusion processes from discrete data
JP5560154B2 (ja) モデルパラメータ推定装置およびそのプログラム
US20210042820A1 (en) Extending finite rank deep kernel learning to forecasting over long time horizons
CN111309706A (zh) 模型训练方法、装置、可读存储介质及电子设备
JP2010237864A (ja) アノテーションデータ解析装置、アノテーションデータ解析プログラムおよびそのプログラムを記録した記録媒体
Wang et al. Computational methods for a class of network models
Wong Machine learning in portfolio management
Lindström et al. Optimal adaptive sequential calibration of option models
Duan et al. Sequential Monte Carlo optimization and statistical inference
JP7251642B2 (ja) 学習装置、推定装置、学習方法、推定方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100721

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110712

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20110811

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110826

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110920

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111003

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141007

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees