JP3832720B2 - 協調的フィルタリングにおけるデフォルト値設定方法及びシステム - Google Patents
協調的フィルタリングにおけるデフォルト値設定方法及びシステム Download PDFInfo
- Publication number
- JP3832720B2 JP3832720B2 JP2001060704A JP2001060704A JP3832720B2 JP 3832720 B2 JP3832720 B2 JP 3832720B2 JP 2001060704 A JP2001060704 A JP 2001060704A JP 2001060704 A JP2001060704 A JP 2001060704A JP 3832720 B2 JP3832720 B2 JP 3832720B2
- Authority
- JP
- Japan
- Prior art keywords
- evaluation
- default value
- value
- default
- correlation coefficient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Complex Calculations (AREA)
Description
【発明の属する技術分野】
本発明は、協調的フィルタリングにおけるデフォルト値設定方法及びシステムに関する。
【0002】
【従来の技術】
従来、協調的フィルタリングを用いて特定の利用者の評価を予測する方法の1つに、利用者間の相関係数を利用するものがある。この利用者間の相関係数を求めるためには、相関を求める利用者二者が共に評価しているアイテムの評価データを利用するが、対象アイテムによっては二者共に評価しているアイテムが非常に少ないことがある。そこで従来では、各々の利用者が評価していないアイテムに評価デフォルト値を設定し、相関係数を求めるために利用することのできるアイテムを増やす手法がとられている。
【0003】
【発明が解決しようとする課題】
しかし一般に、相関係数を求める際に未評価のアイテムに対する評価データにデフォルト値を設定すると、評価デフォルト値を設定しない場合と比べて、求められる相関係数の値が変化し、結果として利用者の評価の予測値も変化してしまう。例えば、本来の評価データに比べて評価予測値が低い場合には予測値を高めることが求められ、反対に評価予測値が本来の評価データに比べて高い場合には予測値を低くすることが求められる。したがって、本来の評価データと評価予測値との関係によって、設定するデフォルト値を適当に変更調整する必要がある。
【0004】
ところが従来、このような複数の利用者各々が未評価のアイテムに対して評価データデフォルト値を設定し、任意の利用者二者間の相関係数を求め、その相関係数を利用して、特定の利用者の未評価のアイテムに対する評価予測値を求める方法において、最適な評価デフォルト値がどのような値であるかを探る工夫がされることはなかった。
【0005】
本発明は、このような従来の技術的課題を解決するためになされたもので、最適な評価デフォルト値を設定することができる協調的フィルタリングにおけるデフォルト値設定方法及びシステムを提供すること目的とする。
【0006】
【課題を解決するための手段】
請求項1の発明の協調的フィルタリングにおけるデフォルト値設定方法は、評価デフォルト値設定手段が、1又は複数の利用者それぞれの未評価の1又は複数の対象アイテムそれぞれに複数種の評価デフォルト値の中から選んだ1つを設定するステップ(1)と、相関係数演算手段が、現実の評価データとステップ(1)で設定された評価デフォルト値とを用いて、特定の利用者と他の任意の利用者それぞれとの二者間の相関係数を演算するステップ(2)と、評価予測値演算手段が、ステップ(2)で得られた相関係数を用いて特定の対象アイテムに対する前記特定の利用者の前記評価デフォルト値に対応する評価予測値を演算するステップ(3)を有し、前記ステップ(1)で複数種の評価デフォルト値の中から選ぶ評価デフォルト値を変更して前記ステップ(2)及び(3)を実行し、前記特定の対象アイテムに対する前記特定の利用者の現実の評価データと近似度の高い評価予測値を与える評価デフォルト値を最適な評価デフォルト値として決定することを特徴とするものである。
【0007】
請求項1の発明の協調的フィルタリングにおけるデフォルト値設定方法では、複数の利用者各々が未評価の1又は複数の対象アイテムそれぞれに対して評価デフォルト値を設定し、特定の利用者と他の任意の利用者との間の相関係数を計算し、この相関係数を利用して特定の対象アイテムに対する特定の利用者の評価予測値を算出する手順を複数種の評価デフォルト値に対して繰り返す。そして、得られた複数種の評価予測値を比較し、最も現実に即した評価予測値を前記特定の対象アイテムに対する評価データとして採用する。これにより、精度の高い協調的フィルタリングを可能とする。
【0008】
請求項2の発明の協調的フィルタリングにおけるデフォルト値設定方法は、評価デフォルト値設定手段が、1又は複数の利用者それぞれの未評価の1又は複数の対象アイテムそれぞれに複数種の評価デフォルト値の中から選んだ1つを設定するステップ(1)と、相関係数演算手段が、現実の評価データとステップ(1)で設定された評価デフォルト値とを用いて、特定の利用者と他の任意の利用者それぞれとの二者間の相関係数を演算するステップ(2)と、評価予測値演算手段が、ステップ(2)で得られた相関係数を用いて特定の対象アイテムに対する前記特定の利用者の前記評価デフォルト値に対応する評価予測値を演算するステップ(3)と、比較手段が、前記特定の対象アイテムに対する前記特定の利用者の現実の評価データとステップ(3)で得られた前記評価デフォルト値に対応する評価予測値とを比較するステップ(4)を有し、前記ステップ(1)で複数種の評価デフォルト値の中から選ぶ評価デフォルト値を変更して前記ステップ(2)〜(4)を実行し、前記特定の対象アイテムに対する前記特定の利用者の現実の評価データと近似度の高い評価予測値を与える評価デフォルト値を最適な評価デフォルト値として決定することを特徴とするものである。
【0009】
請求項2の発明の協調的フィルタリングにおけるデフォルト値設定方法では、複数の利用者各々が未評価の1又は複数の対象アイテムそれぞれに対して評価デフォルト値を設定し、特定の利用者と他の任意の利用者との間の相関係数を計算し、この相関係数を利用して特定の対象アイテムに対する特定の利用者の評価予測値を演算し、前述の評価デフォルト値を変更した場合に現実の評価データと各評価デフォルト値に対応する評価予測値とがどの程度一致するかにより、最適な評価デフォルト値を決定する。こうして決定された評価デフォルト値は、同種の利用者あるいは同種の対象アイテムに対する協調的フィルタリングにおける評価デフォルト値として利用する。これにより、精度の高い協調的フィルタリングを可能とする。
【0010】
請求項3の発明は、請求項2の発明の協調的フィルタリングにおけるデフォルト値設定方法において、前記ステップ(4)は、前記評価デフォルト値に対応する評価予測値と現実の評価データとの絶対偏差を求めるステップを含み、前記最適なデフォルト値として、前記絶対偏差を最も小さくする評価予測値を与える評価デフォルト値が決定される。これにより最適な評価デフォルト値の客観的な決定が可能となる。
【0011】
請求項4の発明の協調的フィルタリングにおけるデフォルト値設定システムは、複数の対象アイテムそれぞれに対する複数の利用者それぞれの評価データを保存する評価データ保存手段と、前記評価データに基づき、前記複数の利用者それぞれの評価平均値を求める平均値演算手段と、前記複数の対象アイテムそれぞれに対する前記複数の利用者それぞれの未評価アイテムに対して複数種の評価デフォルト値の1つを設定する評価デフォルト値設定手段と、前記任意の利用者二者間の前記評価データ及び評価デフォルト値に基づいて当該二者をメンバーとする両者間の相関係数を計算する相関係数演算手段と、前記評価デフォルト値設定手段が複数種の評価デフォルト値の中から設定する評価デフォルト値を変更して前記相関係数演算手段に前記相関係数を計算させる評価デフォルト値変更手段と、前記任意の利用者の特定の対象アイテムに関して、前記複数の利用者それぞれの評価データと評価平均値と前記評価デフォルト値変更手段及び前記評価デフォルト値設定手段による複数種の評価デフォルト値、及び当該利用者を一方のメンバーとする前記相関係数を用いて、複数種の評価デフォルト値毎の評価データの予測演算を行う評価予測値演算手段とを備えたものである。
【0012】
請求項4の発明の協調的フィルタリングにおけるデフォルト値設定システムでは、平均値演算手段が評価データ保存手段に保存されている評価データに基づき、複数の利用者それぞれの評価平均値を求め、評価デフォルト値設定手段が複数の対象アイテムそれぞれに対する複数の利用者それぞれの未評価アイテムに対して複数種の評価デフォルト値の1つを設定し、相関係数演算手段が任意の利用者二者間の評価データ及び評価デフォルト値に基づいて当該二者をメンバーとする両者間の相関係数を計算する。そして、評価デフォルト値変更手段が、評価デフォルト値設定手段の設定する評価デフォルト値を変更し、相関係数演算手段に相関係数を再計算させ、評価予測値演算手段が、任意の利用者の特定の対象アイテムに関して、複数の利用者それぞれの評価データと評価平均値と複数種の評価デフォルト値、及び当該利用者を一方のメンバーとする相関係数を用いて、設定した複数種の評価デフォルト値毎の評価予測値を算出することにより、複数種の異なる評価デフォルト値それぞれに対応する評価予測値を得る。
【0013】
これにより、オペレータは得られる複数種の異なる評価デフォルト値それぞれに対応する評価予測値を比較し、現実の評価データに最も近しい評価予測値を与える評価デフォルト値がいずれであるかを容易に決定することができる。
【0014】
請求項5の発明の協調的フィルタリングにおけるデフォルト値設定システムは、複数の対象アイテムそれぞれに対する複数の利用者それぞれの評価データを保存する評価データ保存手段と、前記評価データに基づき、前記複数の利用者それぞれの評価平均値を求める平均値演算手段と、前記複数の対象アイテムそれぞれに対する前記複数の利用者それぞれの未評価アイテムに対して複数種の評価デフォルト値の1つを設定する評価デフォルト値設定手段と、前記任意の利用者二者間の前記評価データ及び評価デフォルト値に基づいて当該二者をメンバーとする両者間の相関係数を計算する相関係数演算手段と、前記評価デフォルト値設定手段が複数種の評価デフォルト値の中から設定する評価デフォルト値を変更して前記相関係数演算手段に前記相関係数を計算させる評価デフォルト値変更手段と、前記任意の利用者の特定の対象アイテムに関して、前記複数の利用者それぞれの評価データと評価平均値と前記評価デフォルト値変更手段及び前記評価デフォルト値設定手段による複数種の評価デフォルト値、及び当該利用者を一方のメンバーとする前記相関係数を用いて、複数種の評価デフォルト値毎の評価データの予測演算を行う評価予測値演算手段と、前記特定の対象アイテムに対する現実の評価データと前記評価予測値演算手段の算出した複数種のデフォルト値それぞれに対する評価予測値とを比較する比較手段とを備えたものである。
【0015】
請求項5の発明の協調的フィルタリングにおけるデフォルト値設定システムでは、平均値演算手段が評価データ保存手段に保存されている評価データに基づき、複数の利用者それぞれの評価平均値を求め、評価デフォルト値設定手段が複数の対象アイテムそれぞれに対する複数の利用者それぞれの未評価アイテムに対して複数種の評価デフォルト値の1つを設定し、相関係数演算手段が任意の利用者二者間の評価データ及び評価デフォルト値に基づいて当該二者をメンバーとする両者間の相関係数を計算する。そして、評価デフォルト値変更手段が、評価デフォルト値設定手段の設定する評価デフォルト値を変更し、相関係数演算手段に相関係数を再計算させ、評価予測値演算手段が、任意の利用者の特定の対象アイテムに関して、複数の利用者それぞれの評価データと評価平均値と複数種の評価デフォルト値、及び当該利用者を一方のメンバーとする相関係数を用いて、複数種の異なる評価デフォルト値それぞれに対応する評価予測値を得る。そして、比較手段が、特定の対象アイテムに対する現実の評価データと前記評価予測値演算手段の算出した複数種のデフォルト値それぞれに対する評価予測値とを比較して評価デフォルト値の適否を評価する。
【0016】
これにより、現実の評価データと複数種の評価デフォルト値それぞれに対応する評価予測値とがどの程度一致するかにより、最適な評価デフォルト値を決定することができ、当該最適な評価デフォルト値を、同種の利用者あるいは同種の対象アイテムに対する協調的フィルタリングにおける評価デフォルト値として利用することにより、精度の高い協調的フィルタリングを可能とする。
【0017】
請求項6の発明は、請求項5の協調的フィルタリングにおけるデフォルト値設定システムにおいて、前記比較手段は、前記評価デフォルト値に対応する評価予測値と現実の評価データとの絶対偏差を求め、当該絶対偏差を最も小さくする評価予測値を与える評価デフォルト値を最適なものと決定することを特徴とするものであり、最適な評価デフォルト値の客観的な決定が可能となる。
【0018】
請求項7の発明の協調的フィルタリングにおけるデフォルト値設定方法は、ランク設定手段が、既存の評価データ群を所定の指標に従って複数群にランク分けするステップ(1)と、評価予測値演算手段が、ステップ(1)でランク分けされたそれぞれのランク又は全体での既存の評価データの平均値を求め、未評価のアイテムに対して複数種の評価デフォルト値の1つを設定し、特定の利用者の評価データと他の利用者の評価データとの二者間の相関係数を演算し、特定の対象アイテムについての特定の利用者の評価予測値を求めるステップ(2)と、評価デフォルト値変更手段が、前記ステップ(2)で複数種の評価デフォルト値の中から設定する評価デフォルト値を変更して前記ステップ(2)の演算を繰り返させるステップ(3)と、評価手段が、既存の評価データと、複数種の評価デフォルト値それぞれを用いて評価予測を行った場合の評価予測値それぞれとを比較し、絶対偏差を最小にする評価予測値を与える評価デフォルト値をランク毎に求めるステップ(4)と、最適評価予測値算出手段が、同種の対象アイテムに対して協調的フィルタリングを行う際に、対象とするそれぞれのアイテムについて、既存の評価データ群が属するランクに対してステップ(4)で求めた最適な評価デフォルト値をそのアイテムに対する最適な評価デフォルト値として採用し、特定のアイテムに対する評価予測値を求めるステップ(5)とから成るものである。
【0019】
請求項7の発明の協調的フィルタリングにおけるデフォルト値設定方法では、既存の評価データ群を所定の指標に従って複数群にランク分けし、このランク分けされたそれぞれのランク又は全体での既存の評価データの平均値を求め、未評価のアイテムに対して複数種の評価デフォルト値の1つを設定し、特定の利用者の評価データと他の利用者の評価データとの二者間の相関係数を演算し、特定の対象アイテムについての特定の利用者の評価予測値を求める。さらに、評価デフォルト値を変更して上記の演算処理を繰り返して、複数種の評価デフォルト値それぞれを用いた場合の評価予測値を得る。そして、既存の評価データと複数種の評価デフォルト値それぞれを用いて評価予測を行った場合の評価予測値それぞれとを比較し、絶対偏差を最小にする評価予測値を与える評価デフォルト値をランク毎に求めて保持しておく。
【0020】
そして、同種の対象アイテムに対して協調的フィルタリングを行う際に、対象とするそれぞれのアイテムについての既存の評価データ群が属するランクに対して上記の演算処理で求めた最適な評価デフォルト値を全対象アイテムに対する最適な評価デフォルト値として採用し、特定のアイテムに対する評価予測値を求める。
【0021】
これにより、複数種の対象アイテムそれぞれに対する既存データに対して最適な評価デフォルト値を選定し、それを用いて特定の対象アイテムに対する特定の利用者の評価予測値を求めることができ、精度の高い協調的フィルタリングが可能となる。
【0022】
請求項8の発明の協調的フィルタリングにおけるデフォルト値設定システムは、複数の対象アイテムそれぞれに対する複数の利用者それぞれの評価データを保存する評価データ保存手段と、前記評価データ保存手段に保存されている評価データに対し、所定の指標に従って複数種のランクにランク分けするランク設定手段と、前記評価データ保存手段に保存されている評価データに基づき、前記ランク設定手段により設定された複数種のランクの1つに属する評価データ又は全評価データの平均値を求める平均値演算手段と、複数の対象アイテムそれぞれに対する複数の利用者それぞれの未評価アイテムに対して複数種の評価デフォルト値の1つを設定するデフォルト値設定手段と、指定された任意の利用者二者間の評価データ及び評価デフォルト値に基づいて当該二者をメンバーとする両者間の相関係数を計算する相関係数演算手段と、前記評価デフォルト値設定手段が複数種の評価デフォルト値の中から設定する評価デフォルト値を変更して前記相関係数演算手段に前記相関係数を計算させる評価デフォルト値変更手段と、指定された任意の利用者の特定の対象アイテムに関して、複数の利用者それぞれの評価データと評価平均値と前記評価デフォルト値変更手段及び前記評価デフォルト値設定手段による複数種の評価デフォルト値、及び当該利用者を一方のメンバーとする相関係数を用いて、複数種の評価デフォルト値毎の評価予測値を算出する評価予測値演算手段と、特定の対象アイテムに対する現実の評価データと評価予測値演算手段の算出した複数種のデフォルト値それぞれに対する評価予測値とを比較し、絶対偏差を最小とする評価予測値に対応する評価デフォルト値を該当するランクにおける最適な評価デフォルト値と決定する評価手段と、前記評価手段が最適な評価デフォルト値と決定した評価デフォルト値をそれに対応するランクと対照させた形で保持するランク別デフォルト値データ保持手段と、同種の対象アイテムに対して協調的フィルタリングを行う際に、対象とするそれぞれのアイテムについて、既存の評価データ群をランク付けし、前記デフォルト値設定手段により、当該ランクに対する最適な評価デフォルト値を前記ランク別デフォルト値データ保持手段から読み出して対象アイテムに対する最適な評価デフォルト値として採用し、全対象アイテムのうちの未評価のアイテムに対して設定させ、前記相関係数演算手段により、指定された任意の利用者二者間の評価データ及び評価デフォルト値に基づいて当該二者をメンバーとする両者間の相関係数を計算させ、前記評価予測値演算手段により、指定された任意の利用者の特定の対象アイテムに関して、最適な評価デフォルト値による評価予測値を算出させる最適評価予測値算出手段とを備えたものである。
【0023】
請求項8の発明の協調的フィルタリングにおけるデフォルト値設定システムでは、評価データ保存手段に保存されている評価データに対し、ランク設定手段により所定の指標に従って複数種のランクにランク分けし、平均値演算手段により、複数種のランクの1つに属する評価データ又は全評価データの平均値を求め、デフォルト値設定手段により、複数の対象アイテムそれぞれに対する複数の利用者それぞれの未評価アイテムに対して複数種の評価デフォルト値の1つを設定し、相関係数演算手段により、指定された任意の利用者二者間の評価データ及び評価デフォルト値に基づいて当該二者をメンバーとする両者間の相関係数を計算する。そして、評価予測値演算手段により、指定された任意の利用者の特定の対象アイテムに関して、複数の利用者それぞれの評価データと評価平均値と評価デフォルト値、及び当該利用者を一方のメンバーとする相関係数を用いて、複数種の評価デフォルト値毎の評価データの予測演算を行う。さらに、評価デフォルト値変更手段により、評価デフォルト値設定手段が設定する評価デフォルト値を変更し、相関係数演算手段により相関係数を再計算させ、評価手段により、特定の対象アイテムに対する現実の評価データと評価予測値演算手段の算出した複数種のデフォルト値それぞれに対する評価予測値とを比較し、絶対偏差を最小とする評価予測値に対応する評価デフォルト値を該当するランクにおける最適な評価デフォルト値と決定し、ランク別デフォルト値データ保持手段により、ランク毎の最適な評価デフォルト値をそれに対応するランクと対照させた形で保持する。
【0024】
そして、同種の対象アイテムに対して協調的フィルタリングを行う際に、最適評価予測値算出手段が、対象とするそれぞれのアイテムについての既存の評価データが属するランクに対する最適な評価デフォルト値をランク別デフォルト値データ保持手段から読み出して全対象アイテムに対する最適な評価デフォルト値として採用し、デフォルト値設定手段により、全対象アイテムのうちの未評価のアイテムに対してそのデフォルト値を設定させ、相関係数演算手段により、指定された任意の利用者二者間の評価データ及び評価デフォルト値に基づいて当該二者をメンバーとする両者間の相関係数を計算させ、評価予測値演算手段により、指定された任意の利用者の特定の対象アイテムに関して、最適な評価デフォルト値による評価予測値を算出させる。
【0025】
これにより、複数種の対象アイテムそれぞれに対する既存データに対して最適な評価デフォルト値を選定し、それを用いて特定の対象アイテムに対する特定の利用者の評価予測値を求めることができ、精度の高い協調的フィルタリングが可能となる。
【0026】
【発明の実施の形態】
以下、本発明の実施の形態を図に基づいて詳説する。図1は本発明の1つの実施の形態の協調的フィルタリングにおけるデフォルト値設定システムの機能的構成を示し、評価データ保存部1、平均値演算部2、評価デフォルト値設定部3、相関係数演算部4、評価予測値演算部5、評価部6から構成されている。
【0027】
評価データ保存部1は、複数の対象アイテムそれぞれに対する複数の利用者それぞれの評価データを保存する。平均値演算部2は、この評価データ保存部1に保存されている評価データに基づき、複数の利用者それぞれの評価平均値を求める。評価デフォルト値設定部3は、複数の対象アイテムそれぞれに対する複数の利用者それぞれの未評価アイテムに対して複数種の評価デフォルト値を設定する。相関係数計算部4は、任意の利用者二者間の評価データ及び評価デフォルト値に基づいて当該二者をメンバーとする両者間の相関係数を計算する。評価予測値演算部5は、任意の利用者の特定の対象アイテムに関して、複数の利用者それぞれの評価データと評価平均値と複数種の評価デフォルト値、及び当該利用者を一方のメンバーとする相関係数を用いて、複数種の評価デフォルト値毎の評価データの予測演算を行う。評価部6は、特定の対象アイテムに対する現実の評価データと評価予測値演算部5の算出した複数種のデフォルト値それぞれに対する評価予測値とを比較し評価する。
【0028】
なお、本実施の形態のシステムは、コンピュータシステムに所要のプログラムをインストールすることにより実現されるものであるが、ここではコンピュータシステムの実行する各機能を構成要素として分けて示している。
【0029】
次に、上記構成の協調的フィルタリングにおけるデフォルト値設定システムによるデフォルト値設定方法について、図2のフローチャートを用いて説明する。評価データ保存部1には、あらかじめ、少なくても一群の複数種の対象アイテム(例えば、複数種の映画、複数種の音楽、複数種の雑誌、複数種の番組あるいは複数種の商品)それぞれに対する、多数の利用者それぞれの評価データがアンケートその他の方法によって収集され、保存されている。
【0030】
そこで、本実施の形態のシステムでは、平均値演算部2が評価データ保存部1から利用者各々iの評価データvi,j を読み出し、平均値演算を次の数1式によって行う(ステップS1,S3)。
【0031】
【数1】
ただし、j:個々の対象アイテム、vi,j:利用者iが対象アイテムjに対して行った評価データ、Ii :利用者iが評価している対象アイテム群、|Ii |:対象アイテム群Ii に含まれるアイテム数である。
【0032】
次に、評価デフォルト値設定部3によって、各利用者の未評価の対象アイテムそれぞれに1つの評価デフォルト値D1を設定する(ステップS5)。そして、相関係数演算部4によって、評価予測をしようとしている利用者aを特定し(ステップS7)、この利用者aと他のすべての登録されている利用者iとの相関係数w(a,i)を次の数2式によって計算する(ステップS9)。
【0033】
【数2】
ただし、j:利用者a,iが共に評価している対象アイテムそれぞれ、va,j:利用者aが対象アイテムjに対して行った評価データ又は評価デフォルト値、vi,j:利用者iが対象アイテムjに対して行った評価データ又は評価デフォルト値、va ,vi (バー):数1式で求めた利用者a,jそれぞれの実評価データの平均値である。
【0034】
次に、評価予測値演算部5は、相関係数演算部4が算出した相関係数w(a,i)(ただし、iは登録利用者数分だけ存在する)を用いて、次の数3式により利用者aが対象アイテムjに対して下す評価の予測値pa,j を求める(ステップS11)。
【0035】
【数3】
ここで、w(a,i):数2式で得た利用者aと利用者iとの相関係数、κ:正規化係数である。
【0036】
続いて、別の評価デフォルト値D2を用いて、ステップS5〜S11の演算処理を繰り返し、以下、用いることができるすべての評価デフォルト値D3〜Dnについて同様にステップS5〜S11の演算処理を繰り返す(ステップS13)。
【0037】
次に、評価部6において、オペレータとの対話形式により、複数種の評価デフォルト値D1,D2,…,Dnそれぞれを用いた場合の利用者aの対象アイテムjに対する評価予測値pa,j −1,pa,j −2,…,pa,j −nを現実の評価データva,j と比較することにより、いずれの評価デフォルト値を用いた場合の評価予測値が現実の評価データによく近似するか評価し、最適な評価デフォルト値を決定する(ステップS15,S17)。
【0038】
これにより、協調的フィルタリングを用いて特定の利用者が特定の対象アイテムに対してどのような評価を下すかを予測するのに、最適な評価デフォルト値を用いて、登録されている多数の利用者それぞれの未評価の対象アイテムにその評価デフォルト値を設定し、相関係数を算出し、この相関係数を利用して特定の対象アイテムに対する特定の利用者の下す評価を精度良く予測することができるようになる。
【0039】
以下、さらに具体的に数字を例示して本発明の第1の実施の形態の特徴を説明する。いま、利用者a,b,cそれぞれが5つの対象アイテムI〜Vそれぞれについて、表1の評価を下しているとする。これは評価データ保存部1に登録されたデータである。
【0040】
【表1】
このような評価データに対して、利用者aが未評価のアイテムVに対して下すであろう評価データpa,V を、評価デフォルト値を用いずに相関係数を用いて評価予測したのが表2に示すものである。
【0041】
【表2】
この評価デフォルト値を用いないで行った評価予測では、利用者aが対象アイテムVに対して下す評価予測値pa,V =2である。
【0042】
次に、評価デフォルト値「2」を利用者a,b,cそれぞれの未評価の対象アイテムそれぞれに対して設定し、実評価データおよび評価デフォルト値を用いて相関係数を計算し、この相関係数に基づき利用者aが対象アイテムVに対して下すであろう評価データpa,V を計算したのが表3に示すものである。
【0043】
【表3】
これによると、利用者aが対象アイテムVに対して下す評価予測値pa,V =1.0である。したがって、実評価データだけを用いて計算した場合とは、評価予測値が異なっている。ところが従来は、1つの評価デフォルト値だけを用いて評価予測を行っており、評価デフォルト値の最適化を図ることはなかった。
【0044】
本発明の場合は、さらに評価デフォルト値を変化させ、それぞれの評価デフォルト値を用いた場合の評価予測値を計算する。その計算例は、次の表4に示すものである。
【0045】
【表4】
この表4では、表3で用いた評価デフォルト値D=2の他に、D=3,4それぞれについて計算している。そして評価デフォルト値D=3を用いた場合、利用者aが対象アイテムVに対して下す評価予測値pa,V =2.1であり、評価デフォルト値D=4を用いた場合、同様の評価予測値pa,V =3.0である。
【0046】
このようにして、評価デフォルト値Dに種々の値を設定し、それぞれの場合の相関係数を求め、得られた相関係数を用いて特定の利用者の特定の対象アイテムに対する評価予測を行い、これを現実の評価データと比較して近似度の高い結果を与える評価デフォルト値を最適なものと決定する。
【0047】
なお、この評価デフォルト値の最適値は必ずしも一意的に決定するものではなく、例えば映画、音楽、雑誌、番組、商品それぞれの対象アイテムによって大きく異なり、また年齢層、男性、女性、地域等の利用者層によっても大きく異なり、さらに標本数によっても大きく異なるものである。したがって、協調的フィルタリングに用いるための評価デフォルト値を決定する場合、それらの多種多様な対象アイテムや利用者層に応じて種々決定する必要がある。
【0048】
次に、本発明の第2の実施の形態の協調的フィルタリングにおけるデフォルト値設定方法について、説明する。この第2の実施の形態に使用するデフォルト値設定システムは、図1に示した第1の実施の形態のシステムと共通する。ただし、各構成要素の演算処理機能は一部下記のように、第1の実施の形態と異なる。
【0049】
第2の実施の形態の協調的フィルタリングにおけるデフォルト値設定方法は、コンピュータの演算処理手順として採用されるものであり、その演算処理手順は図3のフローチャートに示すものである。以下、これについて説明する。
【0050】
図3に示すフローチャートにおいて、ステップS1〜S13の処理は第1の実施の形態による図2のフローチャートと共通する。ただし、本実施の形態の場合には、第1の実施の形態の場合とは異なり、評価データ保存部1には、最適な評価デフォルト値を設定するために算出しようとする特定の対象アイテムにもすでに評価データが設定されているものとする。
【0051】
上記の特定の対象アイテムjに対して、複数種の評価デフォルト値それぞれに対応する評価予測値が算出されれば、本実施の形態の場合にはステップS150において、それぞれの評価予測値を現実の評価データと比較することによって評価し、続くステップS17において最適な評価デフォルト値を決定する。
【0052】
ステップS150における評価予測値の評価は、図4に示すフローチャートに従う。最初に、特定の対象アイテムjに対する複数種の評価デフォルト値それぞれによる評価予測値pi,j を取込み、現実の評価データvi,j を評価データ保存部1から取り込む(ステップS150‐1,S150‐3)。そして次の数4式にしたがって絶対偏差Sj の演算を行う(ステップS150‐5)。
【0053】
【数4】
ここで、mj は、アイテムjに関して予測を行った数である。
【0054】
したがって、数4式の絶対偏差Sj は、個々の評価予測値の誤差を平均したものとなる。
【0055】
続いて、この数4式で求めた絶対偏差Sj を最小とする評価予測値pi,j を決定してメインフローに戻る(ステップS150‐7)。
【0056】
図3のフローチャートにおけるステップS17においては、絶対偏差Sj を最小とする評価予測値pi,j に対応する評価デフォルト値を最適なものとして決定する。
【0057】
このようにして、第2の実施の形態の協調的フィルタリングにおけるデフォルト値設定方法では、すでに評価データが得られている特定の対象アイテムに対して、複数種の評価デフォルト値を用いてそれぞれの評価予測値を算出し、評価データとの絶対偏差を最小にする評価予測値に対応する評価デフォルト値を最適なものと決定するので、客観的に最適な評価デフォルト値を得ることができる。
【0058】
以下、さらに具体的に数字を例示して、本発明の第2の実施の形態の特徴を説明する。いま、利用者a,b,cそれぞれが5つの対象アイテムI〜Vそれぞれについて、表5の評価を下しているとする。これは評価データ保存部1に登録されたデータである。
【0059】
【表5】
このような評価データを利用して、利用者aが既存の評価「3」を行っている特定の対象アイテムVに対して、複数種の評価デフォルト値D=2,3,4それぞれを用いた場合の評価予測を行ってみる。
【0060】
評価デフォルト値D=2を利用者a,b,cそれぞれの未評価の対象アイテムそれぞれに対して設定し、実評価データおよび評価デフォルト値を用いて相関係数を計算し、この相関係数に基づき利用者aが対象アイテムVに対して下すであろう評価予測値pa,V を計算すると、pa,V =1.0である。そして、評価デフォルト値D=3の場合、同じ対象アイテムVに対する評価予測値pa,V =2.10であり、評価デフォルト値D=4の場合、pa,V =3.00である。
【0061】
そしてこれらの評価予測値pa,V と同じ対象アイテムVに対する利用者aの既存の評価データはva,V =3であるので、各評価デフォルト値それぞれに対して、評価予測値pa,V の絶対偏差|pa,V −va,V |は、D=2ときに2.00、D=3のときに0.90、そしてD=4のときに0.00(最小)となる。したがって、最適な評価デフォルト値はD=4であると決定できることになる。
【0062】
次に、本発明の第3の実施の形態の協調的フィルタリングにおけるデフォルト値設定システム及びそれによるデフォルト値設定方法について説明する。
【0063】
第3の実施の形態では、まず、既存の評価データ群を所定の指標に従って複数群にランク分けし、それぞれのランク及び全体での既存の評価データの平均値を求め、相関係数を演算し、特定の対象アイテムについての既存の評価データと評価デフォルト値を用いて評価予測を行った場合の評価予測値と比較し、絶対偏差を最小にする評価予測値を与える評価デフォルト値をランク毎に求めて保存しておく。そして、同種の対象アイテムに対して協調的フィルタリングを行う際に、対象とするアイテムについて前記と同様の指標に従ってランク付けし、該当するランクに対して前段階で求めて保存してある最適な評価デフォルト値を全対象アイテムに対する最適な評価デフォルト値として採用し、特定のアイテムに対する評価予測値を求めるのである。
【0064】
この所定の指標に従ってランク分けする手法としては、(1)評価データの平均値によってランク分けする場合、(2)標本数に従ってランク分けする場合、(3)標本数に従って大ランクにランク分けし、さらに標本数による大ランクごとに評価データの平均値に従って小ランクにランク分けする場合がある。
【0065】
この第3の実施の形態の協調的フィルタリングにおけるデフォルト値設定システムについて、図5及び図6を用いて説明する。図5は、本実施の形態の評価デフォルト値設定システムの機能的構成を示し、図1に示した第1の実施の形態のシステムと同様の評価データ保存部1、平均値演算部2、評価デフォルト値設定部3、相関係数演算部4、評価予測値演算部5及び評価部6を備えており、さらに、本実施の形態の特徴的要素として、ランク設定部7及びデフォルト値データテーブル8を備えている。
【0066】
評価データ保存部1は、複数の対象アイテムそれぞれに対する複数の利用者それぞれの評価データを保存する。平均値演算部2は、この評価データ保存部1に保存されている評価データに基づき、指定されたランクに属する評価データ又は全評価データの平均値を求める。評価デフォルト値設定部3は、複数の対象アイテムそれぞれに対する複数の利用者それぞれの未評価アイテムに対して複数種の評価デフォルト値を設定する。相関係数計算部4は、指定された任意の利用者二者間の評価データ及び評価デフォルト値に基づいて当該二者をメンバーとする両者間の相関係数を計算する。評価予測値演算部5は、指定された任意の利用者の特定の対象アイテムに関して、複数の利用者それぞれの評価データと評価平均値と複数種の評価デフォルト値、及び当該利用者を一方のメンバーとする相関係数を用いて、複数種の評価デフォルト値毎の評価データの予測演算を行う。評価部6は、特定の対象アイテムに対する現実の評価データと評価予測値演算部5の算出した複数種のデフォルト値それぞれに対する評価予測値とを比較し評価する。
【0067】
そして、ランク設定部7は、評価データ保存部1に保存された既存の評価データ群を評価データによって複数群にランク分けする。デフォルト値データテーブル8は、ランク設定部7が設定した各ランク毎の最適評価デフォルト値を登録する。
【0068】
なお、本実施の形態のシステムもコンピュータシステムに所要のプログラムをインストールすることにより実現されるものであるが、ここではコンピュータシステムの実行する各機能を構成要素として分けて示している。
【0069】
次に、上記構成の協調的フィルタリングにおけるデフォルト値設定システムによるデフォルト値設定方法について、図6のフローチャートを用いて説明する。評価データ保存部1には、第1の実施の形態と同様に、複数種の対象アイテムそれぞれに対する多数の利用者それぞれの評価データがアンケートその他の方法によって収集され、保存されている。
【0070】
そこで、ランク設定部7は評価データ保存部1の評価データ群を見て、所定指標に従ってランク分けする。このランク分けの指標には上で列挙したような3つの場合が考えられる(ステップS21,S23)。
【0071】
次に、平均値演算部2は、1つのランクを選択し、そのランクに属する評価データの平均値を前述の数1式によって算出する。平均値演算部2はまた、既存の評価データの全体の平均値も算出する(ステップS25)。
【0072】
次に、評価デフォルト値設定部3によって、各利用者の未評価の対象アイテムそれぞれに1つの評価デフォルト値(デフォルト値設定せずも含む)を設定し、相関係数演算部4によって、評価予測をしようとしている利用者を特定し、相関係数を前述の数2式によって計算する(ステップS27,S29)。
【0073】
次に、評価予測値演算部5は、相関係数演算部4が算出した相関係数を用いて、前述の数3式により利用者が対象アイテムに対して下す評価の予測値を求める(ステップS31)。続いて、別の評価デフォルト値を用いて、ステップS27〜S31の演算処理を繰り返し、以下、用いることができるすべての評価デフォルト値について同様にステップS27〜S31の演算処理を繰り返す(ステップS33)。
【0074】
次に、評価部6において、複数種の評価デフォルト値それぞれを用いた場合の利用者の対象アイテムに対する評価予測値を現実の評価データと比較することにより、ある1つのランクにおいていずれの評価デフォルト値を用いた場合の評価予測値による絶対偏差が最小になるかにより、最適な評価デフォルト値を決定する(ステップS35,S37)。なお、このステップS35の処理は、第2の実施の形態と同様に図4のフローチャートに示すものである。
【0075】
こうして、ある1つのランクにおける最適な評価デフォルト値が決定されると、他のランクについてもステップS25〜S37の処理を繰り返し、各ランク毎の最適な評価デフォルト値を決定する。そして得られた各ランク毎の最適デフォルト値は、デフォルト値データテーブル8に登録する(ステップS37,S39)。
【0076】
こうして、ある対象アイテムについて、ランク毎の最適な評価デフォルト値が決定できれば、後に同種の対象アイテムについて協調的フィルタリングを行う際には、図7のフローチャートに示すように、所定の指標に従ってランク付けし(ステップS51,S53)、デフォルト値データテーブル8に登録された各ランク毎の評価デフォルト値から該当ランクの最適な評価デフォルト値を選択して未評価のアイテムに対して設定し(ステップS55)、特定の対象アイテムに対する評価予測値を、第2の実施の形態と同様の処理により求める(ステップS57〜S61)。
【0077】
これにより、第3の実施の形態の協調的フィルタリングにおけるデフォルト値設定システム及びデフォルト値設定方法によると、より精度の高い協調的フィルタリングが可能になる。
【0078】
次に、本実施の形態の協調的フィルタリングにおけるデフォルト値設定方法を、具体的な数値を用いて詳しく説明する。
【0079】
<評価データの平均値に基づいて分割する例>
実際に映画500作品についてのアンケートで得られた評価データ群を利用して説明する。利用者の評価は、各作品について1.0(良い)〜0.0(悪い)まで0.2刻みで与えられている。そして、評価データの平均値が0.0〜0.2に属する作品から0.8〜1.0に属する作品まで5ランクに分け、それぞれのランクにおいて、そのランクに属する作品を見ていない利用者に対する評価デフォルト値として次の表6に示すものを設定し、絶対偏差を計算してみた。
【0080】
【表6】
この表6によると、評価の平均値が0.0〜0.2の評価ランクの作品では、評価デフォルト値として0.6を設定したものが最も良く、0.2〜0.4の評価ランクの作品では、評価デフォルト値を設定しない場合が最も良く、0.6〜0.8の評価ランクの作品では、評価デフォルト値0.4、0.8〜1.0の評価ランクの作品では、評価デフォルト値0.4のものが最も良いことが判った。
【0081】
この結果に基づいて、全評価データの平均値に対応する評価デフォルト値を設定し評価予測を行うと、次の表7のようになり、本発明により採用した評価デフォルト値による評価予測値の絶対偏差が最小となった。
【0082】
【表7】
<評価者の人数に基づいて分割する例>
実際に映画500作品について得られた評価データを利用して、評価者の人数に基づいて複数種のランクに分割し、それぞれのランクのアイテムに対して相関係数を求め、評価デフォルト値を設定しない場合、評価デフォルト値を0.0〜1.0まで0.2刻みで設定した場合それぞれでの評価予測値を既存の評価データと比較し、絶対偏差を求めたのが、次の表8である。
【0083】
【表8】
この表によれば、評価者の人数が0〜100のランクの作品では、評価デフォルト値を設定しないものが最も良く、100〜400のランクの作品でも、評価デフォルト値なしのものが最も良く、400〜1600のランクの作品では、評価デフォルト値0.6、1600〜6400のランクの作品では、評価デフォルト値0.6、6400以上のランクの作品では、評価デフォルト値0.4のものが最も良いことが判った。
【0084】
この結果に基づいて、評価者の人数に対応する評価デフォルト値を設定し評価予測を行うと、次の表9のようになり、本発明により採用した評価デフォルト値による評価予測値の絶対偏差が最小となった。
【0085】
【表9】
<評価値の平均値と評価者の人数に基づいて分割する例>
実際に映画500作品について得られた評価データを利用して、評価データの平均値及び評価者の人数に基づいて複数種のランクに分割し、それぞれのランクのアイテムに対して相関係数を求め、評価デフォルト値を設定しない場合、評価デフォルト値を0.0〜1.0まで0.2刻みで設定した場合それぞれでの評価予測値を既存の評価データと比較し、絶対偏差を求めたのが、次の表10である。
【0086】
【表10】
この表によれば、評価データの平均が0.0〜0.2で評価者の人数が0〜100のランクの作品では、評価デフォルト値0.4を設定するのが最も良く、評価者の人数が100〜400のランクの作品では、評価デフォルト値0.4、400〜1600のランクの作品では、評価デフォルト値0.6、1600〜6400のランクの作品では、評価デフォルト値0.6を設定するのが最も良いことが判った。
【0087】
同様に、評価データの平均が0.2〜0.4の場合、評価者の人数が0〜100のランクの作品では、評価デフォルト値0.2、100〜400のランクの作品では、評価デフォルト値0.4、400〜1600のランクの作品では評価デフォルト値0.6、1600〜6400のランクの作品では評価デフォルト値0.6、6400以上のランクの作品では、評価デフォルト値0.8のものが最も良いことが判った。
【0088】
また、評価データの平均が0.4〜0.6の場合には、評価者の人数が0〜100のランクの作品では、評価デフォルト値を設定しない場合が最も良く、100〜400のランクの作品でも、評価デフォルト値を設定しない場合が最も良く、400〜1600のランクの作品では、評価デフォルト値0.6、1600〜6400のランクの作品では、評価デフォルト値0.6、6400以上のランクの作品では、評価デフォルト値0.8で設定するものが最も良いことが判った。
【0089】
また、評価データの平均が0.6〜0.8の場合には、評価者の人数が0〜100のランクの作品では、評価デフォルト値0.0に設定するのが最も良く、100〜400のランクの作品では、評価デフォルト値を設定しない場合が最も良く、400〜1600のランクの作品では、評価デフォルト値0.6、1600〜6400のランクの作品では、評価デフォルト値0.4、6400以上のランクの作品では、評価デフォルト値0.2に設定するものが最も良いことが判った。そして、本評価データの平均が0.8〜1.0の場合には、評価者の人数が6400以上のランクでは、評価デフォルト値0.4のものが最も良いことが判った。
【0090】
この結果に基づいて、評価値の平均と評価者の人数に対応する評価デフォルト値を設定し評価予測を行うと、次の表11のようになり、本発明により採用した評価デフォルト値による評価予測値の絶対偏差が最小となった。
【0091】
【表11】
このようにして、既存の評価データを一定の基準(指標)に基づいていくつかのランクに分割し、それぞれのランクでの最適な評価デフォルト値をあらかじめ求めておき、それをテーブル形式で保存しておく。そして現実のアンケート結果、その他で取得した評価データに基づいて、協調的フィルタリングによりある利用者の特定の対象アイテムに対する評価予測値を得る場合には、当該対象アイテムを所定の指標に従ってランク付けし、そのランクに対応する最適な評価デフォルト値を前述のテーブルから取り出して、未評価のアイテムに対してその評価デフォルト値を設定して、特定の利用者と他のすべての利用者との相関係数を計算し、この相関係数群と評価データ、評価デフォルト値を用いて特定の対象アイテムに対する評価予測値を算出するようにすれば、精度の高い評価予測値を得ることができることになる。
【0092】
なお、上記の実施の形態では映画作品について例示し、評価データを0.2刻みでランク分けし、また評価者の人数によってランク分けし、さらにはそれらの組合せによってランク分けしたが、評価データは必ずしも0.0〜1.0の範囲に限定されるものではなく、例えば1〜5までの5段階評価や、1〜3までの3段階評価等の段階評価であってもよく、特に限定されることはない。また対象アイテムも映画作品に限定されるものではなく、種々のコンテンツ、書籍、テレビ番組、ゲーム、音楽等を対象とすることができ、アンケート対象となる種々のアイテムを対象とすることができる。
【0093】
【発明の効果】
以上のように、本発明によれば、協調的フィルタリングにおける評価デフォルト値として最適なもの設定することができ、精度の高い評価予測を可能にし、協調的フィルタリングを精度の高いものにすることができる。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態の協調的フィルタリングにおけるデフォルト値設定システムの機能的構成を示すブロック図。
【図2】上記の第1の実施の形態による最適な評価デフォルト値の決定処理のフローチャート。
【図3】本発明の第2の実施の形態の協調的フィルタリングにおけるデフォルト値設定システムによる最適な評価デフォルト値の決定処理のフローチャート。
【図4】上記のフローチャートにおける評価予測値の評価ステップの詳しい処理内容を示すフローチャート。
【図5】本発明の第3の実施の形態の協調的フィルタリングにおけるデフォルト値設定システムの機能的構成を示すブロック図。
【図6】上記の第3の実施の形態によるランク毎の最適な評価デフォルト値の決定処理のフローチャート。
【図7】上記の第3の実施の形態による評価予測値の演算処理のフローチャート。
【符号の説明】
1 評価データ保存部
2 平均値演算部
3 評価デフォルト値設定部
4 相関係数演算部
5 評価予測値演算部
6 評価部
7 ランク設定部
8 デフォルト値データテーブル
Claims (8)
- 評価デフォルト値設定手段が、1又は複数の利用者それぞれの未評価の1又は複数の対象アイテムそれぞれに複数種の評価デフォルト値の中から選んだ1つを設定するステップ(1)と、
相関係数演算手段が、現実の評価データとステップ(1)で設定された評価デフォルト値とを用いて、特定の利用者と他の任意の利用者それぞれとの二者間の相関係数を演算するステップ(2)と、
評価予測値演算手段が、ステップ(2)で得られた相関係数を用いて特定の対象アイテムに対する前記特定の利用者の前記評価デフォルト値に対応する評価予測値を演算するステップ(3)を有し、
前記ステップ(1)で複数種の評価デフォルト値の中から選ぶ評価デフォルト値を変更して前記ステップ(2)及び(3)を実行し、前記特定の対象アイテムに対する前記特定の利用者の現実の評価データと近似度の高い評価予測値を与える評価デフォルト値を最適な評価デフォルト値として決定することを特徴とする協調的フィルタリングにおけるデフォルト値設定方法。 - 評価デフォルト値設定手段が、1又は複数の利用者それぞれの未評価の1又は複数の対象アイテムそれぞれに複数種の評価デフォルト値の中から選んだ1つを設定するステップ(1)と、
相関係数演算手段が、現実の評価データとステップ(1)で設定された評価デフォルト値とを用いて、特定の利用者と他の任意の利用者それぞれとの二者間の相関係数を演算するステップ(2)と、
評価予測値演算手段が、ステップ(2)で得られた相関係数を用いて特定の対象アイテムに対する前記特定の利用者の前記評価デフォルト値に対応する評価予測値を演算するステップ(3)と、
比較手段が、前記特定の対象アイテムに対する前記特定の利用者の現実の評価データとステップ(3)で得られた前記評価デフォルト値に対応する評価予測値とを比較するステップ(4)を有し、
前記ステップ(1)で複数種の評価デフォルト値の中から選ぶ評価デフォルト値を変更して前記ステップ(2)〜(4)を実行し、前記特定の対象アイテムに対する前記特定の利用者の現実の評価データと近似度の高い評価予測値を与える評価デフォルト値を最適な評価デフォルト値として決定することを特徴とする協調的フィルタリングにおけるデフォルト値設定方法。 - 前記ステップ(4)は、前記評価デフォルト値に対応する評価予測値と現実の評価データとの絶対偏差を求めるステップを含み、前記最適なデフォルト値として、前記絶対偏差を最も小さくする評価予測値を与える評価デフォルト値が決定されることを特徴とする請求項2に記載の協調的フィルタリングにおけるデフォルト値設定方法。
- 複数の対象アイテムそれぞれに対する複数の利用者それぞれの評価データを保存する評価データ保存手段と、
前記評価データに基づき、前記複数の利用者それぞれの評価平均値を求める平均値演算手段と、
前記複数の対象アイテムそれぞれに対する前記複数の利用者それぞれの未評価アイテムに対して複数種の評価デフォルト値の1つを設定する評価デフォルト値設定手段と、
前記任意の利用者二者間の前記評価データ及び評価デフォルト値に基づいて当該二者をメンバーとする両者間の相関係数を計算する相関係数演算手段と、
前記評価デフォルト値設定手段が複数種の評価デフォルト値の中から設定する評価デフォルト値を変更して前記相関係数演算手段に前記相関係数を計算させる評価デフォルト値変更手段と、
前記任意の利用者の特定の対象アイテムに関して、前記複数の利用者それぞれの評価データと評価平均値と前記評価デフォルト値変更手段及び前記評価デフォルト値設定手段による複数種の評価デフォルト値、及び当該利用者を一方のメンバーとする前記相関係数を用いて、複数種の評価デフォルト値毎の評価データの予測演算を行う評価予測値演算手段とを備えて成る協調的フィルタリングにおけるデフォルト値設定システム。 - 複数の対象アイテムそれぞれに対する複数の利用者それぞれの評価データを保存する評価データ保存手段と、
前記評価データに基づき、前記複数の利用者それぞれの評価平均値を求める平均値演算手段と、
前記複数の対象アイテムそれぞれに対する前記複数の利用者それぞれの未評価アイテムに対して複数種の評価デフォルト値の1つを設定する評価デフォルト値設定手段と、
前記任意の利用者二者間の前記評価データ及び評価デフォルト値に基づいて当該二者をメンバーとする両者間の相関係数を計算する相関係数演算手段と、
前記評価デフォルト値設定手段が複数種の評価デフォルト値の中から設定する評価デフォルト値を変更して前記相関係数演算手段に前記相関係数を計算させる評価デフォルト値変更手段と、
前記任意の利用者の特定の対象アイテムに関して、前記複数の利用者それぞれの評価データと評価平均値と前記評価デフォルト値変更手段及び前記評価デフォルト値設定手段による複数種の評価デフォルト値、及び当該利用者を一方のメンバーとする前記相関係数を用いて、複数種の評価デフォルト値毎の評価データの予測演算を行う評価予測値演算手段と、
前記特定の対象アイテムに対する現実の評価データと前記評価予測値演算手段の算出した複数種のデフォルト値それぞれに対する評価予測値とを比較する比較手段とを備えて成る協調的フィルタリングにおけるデフォルト値設定システム。 - 前記比較手段は、前記評価デフォルト値に対応する評価予測値と現実の評価データとの絶対偏差を求め、当該絶対偏差を最も小さくする評価予測値を与える評価デフォルト値を最適なものと決定することを特徴とする請求項5に記載の協調的フィルタリングにおけるデフォルト値設定システム。
- ランク設定手段が、既存の評価データ群を所定の指標に従って複数群にランク分けするステップ(1)と、
評価予測値演算手段が、ステップ(1)でランク分けされたそれぞれのランク又は全体での既存の評価データの平均値を求め、未評価のアイテムに対して複数種の評価デフォルト値の1つを設定し、特定の利用者の評価データと他の利用者の評価データとの二者間の相関係数を演算し、特定の対象アイテムについての特定の利用者の評価予測値を求めるステップ(2)と、
評価デフォルト値変更手段が、前記ステップ(2)で複数種の評価デフォルト値の中から設定する評価デフォルト値を変更して前記ステップ(2)の演算を繰り返させるステップ(3)と、
評価手段が、既存の評価データと、複数種の評価デフォルト値それぞれを用いて評価予測を行った場合の評価予測値それぞれとを比較し、絶対偏差を最小にする評価予測値を与える評価デフォルト値をランク毎に求めるステップ(4)と、
最適評価予測値算出手段が、同種の対象アイテムに対して協調的フィルタリングを行う際に、対象とするそれぞれのアイテムについて、既存の評価データ群が属するランクに対してステップ(4)で求めた最適な評価デフォルト値をそのアイテムに対する最適な評価デフォルト値として採用し、特定のアイテムに対する評価予測値を求めるステップ(5)とから成る協調的フィルタリングにおけるデフォルト値設定方法。 - 複数の対象アイテムそれぞれに対する複数の利用者それぞれの評価データを保存する評価データ保存手段と、
前記評価データ保存手段に保存されている評価データに対し、所定の指標に従って複数種のランクにランク分けするランク設定手段と、
前記評価データ保存手段に保存されている評価データに基づき、前記ランク設定手段により設定された複数種のランクの1つに属する評価データ又は全評価データの平均値を求める平均値演算手段と、
複数の対象アイテムそれぞれに対する複数の利用者それぞれの未評価アイテムに対して複数種の評価デフォルト値の1つを設定するデフォルト値設定手段と、
指定された任意の利用者二者間の評価データ及び評価デフォルト値に基づいて当該二者をメンバーとする両者間の相関係数を計算する相関係数演算手段と、
前記評価デフォルト値設定手段が複数種の評価デフォルト値の中から設定する評価デフォルト値を変更して前記相関係数演算手段に前記相関係数を計算させる評価デフォルト値変更手段と、
指定された任意の利用者の特定の対象アイテムに関して、複数の利用者それぞれの評価データと評価平均値と前記評価デフォルト値変更手段及び前記評価デフォルト値設定手段による複数種の評価デフォルト値、及び当該利用者を一方のメンバーとする相関係数を用いて、複数種の評価デフォルト値毎の評価予測値を算出する評価予測値演算手段と、
特定の対象アイテムに対する現実の評価データと評価予測値演算手段の算出した複数種のデフォルト値それぞれに対する評価予測値とを比較し、絶対偏差を最小とする評価予測値に対応する評価デフォルト値を該当するランクにおける最適な評価デフォルト値と決定する評価手段と、
前記評価手段が最適な評価デフォルト値と決定した評価デフォルト値をそれに対応するランクと対照させた形で保持するランク別デフォルト値データ保持手段と、
同種の対象アイテムに対して協調的フィルタリングを行う際に、対象とするそれぞれのアイテムについて、既存の評価データ群をランク付けし、前記デフォルト値設定手段により、当該ランクに対する最適な評価デフォルト値を前記ランク別デフォルト値データ保持手段から読み出して対象アイテムに対する最適な評価デフォルト値として採用し、全対象アイテムのうちの未評価のアイテムに対して設定させ、前記相関係数演算手段により、指定された任意の利用者二者間の評価データ及び評価デフォルト値に基づいて当該二者をメンバーとする両者間の相関係数を計算させ、前記評価予測値演算手段により、指定された任意の利用者の特定の対象アイテムに関して、最適な評価デフォルト値による評価予測値を算出させる最適評価予測値算出手段とを備えて成る協調的フィルタリングにおけるデフォルト値設定システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001060704A JP3832720B2 (ja) | 2001-03-05 | 2001-03-05 | 協調的フィルタリングにおけるデフォルト値設定方法及びシステム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001060704A JP3832720B2 (ja) | 2001-03-05 | 2001-03-05 | 協調的フィルタリングにおけるデフォルト値設定方法及びシステム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002259438A JP2002259438A (ja) | 2002-09-13 |
JP3832720B2 true JP3832720B2 (ja) | 2006-10-11 |
Family
ID=18920090
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001060704A Expired - Fee Related JP3832720B2 (ja) | 2001-03-05 | 2001-03-05 | 協調的フィルタリングにおけるデフォルト値設定方法及びシステム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3832720B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8244721B2 (en) * | 2008-02-13 | 2012-08-14 | Microsoft Corporation | Using related users data to enhance web search |
EP3480766A1 (en) * | 2015-04-23 | 2019-05-08 | Rovi Guides, Inc. | Systems and methods for improving accuracy in media asset recommendation models |
CN106471491A (zh) * | 2015-05-29 | 2017-03-01 | 深圳市汇游智慧旅游网络有限公司 | 一种时变的协同过滤推荐方法 |
-
2001
- 2001-03-05 JP JP2001060704A patent/JP3832720B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2002259438A (ja) | 2002-09-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ning et al. | A comprehensive survey of neighborhood-based recommendation methods | |
KR101030653B1 (ko) | 정보 엔트로피를 이용하여 유사도를 보정하는 사용자 기반 협업 필터링 추천 시스템 | |
KR101062927B1 (ko) | 적어도 한 명의 사용자의 성향을 고려하여 타사용자 또는 사물을 추천하기 위한 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체 | |
JP5533880B2 (ja) | コンテンツ推薦システム、推薦方法及び推薦プログラム | |
WO1997002537A1 (en) | Method and apparatus for item recommendation using automated collaborative filtering | |
JP2005530255A (ja) | 適応性ステレオタイプ・プロフィールを適用してユーザに関心アイテムを推奨するための方法及び装置 | |
US8510235B2 (en) | Information processing apparatus, information processing method, and program | |
JP2005509964A (ja) | 選択された第三者の好みに基づいて興味のあるアイテムを推薦するための方法及び装置 | |
WO2002103488A9 (en) | Compensation data prediction | |
JPH09265478A (ja) | 情報フィルタリング方式 | |
KR20100086676A (ko) | 컨텐츠에 대한 선호도 예측 방법 및 장치와, 샘플 컨텐츠 선정 방법 및 장치 | |
CN106951527B (zh) | 一种歌曲推荐方法及装置 | |
KR101725510B1 (ko) | 사용자 성향을 고려한 소셜 이벤트 추천 방법 및 장치 | |
US9325754B2 (en) | Information processing device and information processing method | |
KR20150113644A (ko) | 협업필터링 기반의 상품 추천 시스템에서 추천 기법을 선택하는 방법 | |
KR101143508B1 (ko) | 개인 맞춤형 다중 추천 학습 방법 | |
AU2008362901B2 (en) | Method and apparatus for default rating estimation | |
Liu et al. | Document recommendations based on knowledge flows: A hybrid of personalized and group‐based approaches | |
JP3832720B2 (ja) | 協調的フィルタリングにおけるデフォルト値設定方法及びシステム | |
KR20200080355A (ko) | 빅데이터를 이용한 레시피 추천 시스템 | |
Guan et al. | Preference of online users and personalized recommendations | |
CN106055665B (zh) | 基于异常值剔除的情境感知Web服务推荐方法和*** | |
JPH11184872A (ja) | 多属性データ群に対する検索支援システム | |
Kowald et al. | The unfairness of popularity bias in music recommendation: A reproducibility study | |
KR101689499B1 (ko) | 신규 논문 추천 방법 및 상기 방법을 수행하는 신규 논문 추천 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060419 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060613 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060712 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060713 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120728 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |