JP3832720B2 - Default value setting method and system in collaborative filtering - Google Patents

Default value setting method and system in collaborative filtering Download PDF

Info

Publication number
JP3832720B2
JP3832720B2 JP2001060704A JP2001060704A JP3832720B2 JP 3832720 B2 JP3832720 B2 JP 3832720B2 JP 2001060704 A JP2001060704 A JP 2001060704A JP 2001060704 A JP2001060704 A JP 2001060704A JP 3832720 B2 JP3832720 B2 JP 3832720B2
Authority
JP
Japan
Prior art keywords
evaluation
default value
value
default
correlation coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001060704A
Other languages
Japanese (ja)
Other versions
JP2002259438A (en
Inventor
茂樹 村松
直己 井ノ上
和夫 橋本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2001060704A priority Critical patent/JP3832720B2/en
Publication of JP2002259438A publication Critical patent/JP2002259438A/en
Application granted granted Critical
Publication of JP3832720B2 publication Critical patent/JP3832720B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Complex Calculations (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、協調的フィルタリングにおけるデフォルト値設定方法及びシステムに関する。
【0002】
【従来の技術】
従来、協調的フィルタリングを用いて特定の利用者の評価を予測する方法の1つに、利用者間の相関係数を利用するものがある。この利用者間の相関係数を求めるためには、相関を求める利用者二者が共に評価しているアイテムの評価データを利用するが、対象アイテムによっては二者共に評価しているアイテムが非常に少ないことがある。そこで従来では、各々の利用者が評価していないアイテムに評価デフォルト値を設定し、相関係数を求めるために利用することのできるアイテムを増やす手法がとられている。
【0003】
【発明が解決しようとする課題】
しかし一般に、相関係数を求める際に未評価のアイテムに対する評価データにデフォルト値を設定すると、評価デフォルト値を設定しない場合と比べて、求められる相関係数の値が変化し、結果として利用者の評価の予測値も変化してしまう。例えば、本来の評価データに比べて評価予測値が低い場合には予測値を高めることが求められ、反対に評価予測値が本来の評価データに比べて高い場合には予測値を低くすることが求められる。したがって、本来の評価データと評価予測値との関係によって、設定するデフォルト値を適当に変更調整する必要がある。
【0004】
ところが従来、このような複数の利用者各々が未評価のアイテムに対して評価データデフォルト値を設定し、任意の利用者二者間の相関係数を求め、その相関係数を利用して、特定の利用者の未評価のアイテムに対する評価予測値を求める方法において、最適な評価デフォルト値がどのような値であるかを探る工夫がされることはなかった。
【0005】
本発明は、このような従来の技術的課題を解決するためになされたもので、最適な評価デフォルト値を設定することができる協調的フィルタリングにおけるデフォルト値設定方法及びシステムを提供すること目的とする。
【0006】
【課題を解決するための手段】
請求項1の発明の協調的フィルタリングにおけるデフォルト値設定方法は、評価デフォルト値設定手段が、1又は複数の利用者それぞれの未評価の1又は複数の対象アイテムそれぞれに複数種の評価デフォルト値の中から選んだ1つを設定するステップ(1)と、相関係数演算手段が、現実の評価データとステップ(1)で設定された評価デフォルト値とを用いて、特定の利用者と他の任意の利用者それぞれとの二者間の相関係数を演算するステップ(2)と、評価予測値演算手段が、ステップ(2)で得られた相関係数を用いて特定の対象アイテムに対する前記特定の利用者の前記評価デフォルト値に対応する評価予測値を演算するステップ(3)を有し、前記ステップ(1)で複数種の評価デフォルト値の中から選ぶ評価デフォルト値を変更して前記ステップ(2)及び(3)を実行し、前記特定の対象アイテムに対する前記特定の利用者の現実の評価データと近似度の高い評価予測値を与える評価デフォルト値を最適な評価デフォルト値として決定することを特徴とするものである。
【0007】
請求項1の発明の協調的フィルタリングにおけるデフォルト値設定方法では、複数の利用者各々が未評価の1又は複数の対象アイテムそれぞれに対して評価デフォルト値を設定し、特定の利用者と他の任意の利用者との間の相関係数を計算し、この相関係数を利用して特定の対象アイテムに対する特定の利用者の評価予測値を算出する手順を複数種の評価デフォルト値に対して繰り返す。そして、得られた複数種の評価予測値を比較し、最も現実に即した評価予測値を前記特定の対象アイテムに対する評価データとして採用する。これにより、精度の高い協調的フィルタリングを可能とする。
【0008】
請求項2の発明の協調的フィルタリングにおけるデフォルト値設定方法は、評価デフォルト値設定手段が、1又は複数の利用者それぞれの未評価の1又は複数の対象アイテムそれぞれに複数種の評価デフォルト値の中から選んだ1つを設定するステップ(1)と、相関係数演算手段が、現実の評価データとステップ(1)で設定された評価デフォルト値とを用いて、特定の利用者と他の任意の利用者それぞれとの二者間の相関係数を演算するステップ(2)と、評価予測値演算手段が、ステップ(2)で得られた相関係数を用いて特定の対象アイテムに対する前記特定の利用者の前記評価デフォルト値に対応する評価予測値を演算するステップ(3)と、比較手段が、前記特定の対象アイテムに対する前記特定の利用者の現実の評価データとステップ(3)で得られた前記評価デフォルト値に対応する評価予測値とを比較するステップ(4)を有し、前記ステップ(1)で複数種の評価デフォルト値の中から選ぶ評価デフォルト値を変更して前記ステップ(2)〜(4)を実行し、前記特定の対象アイテムに対する前記特定の利用者の現実の評価データと近似度の高い評価予測値を与える評価デフォルト値を最適な評価デフォルト値として決定することを特徴とするものである。
【0009】
請求項2の発明の協調的フィルタリングにおけるデフォルト値設定方法では、複数の利用者各々が未評価の1又は複数の対象アイテムそれぞれに対して評価デフォルト値を設定し、特定の利用者と他の任意の利用者との間の相関係数を計算し、この相関係数を利用して特定の対象アイテムに対する特定の利用者の評価予測値を演算し、前述の評価デフォルト値を変更した場合に現実の評価データと各評価デフォルト値に対応する評価予測値とがどの程度一致するかにより、最適な評価デフォルト値を決定する。こうして決定された評価デフォルト値は、同種の利用者あるいは同種の対象アイテムに対する協調的フィルタリングにおける評価デフォルト値として利用する。これにより、精度の高い協調的フィルタリングを可能とする。
【0010】
請求項3の発明は、請求項2の発明の協調的フィルタリングにおけるデフォルト値設定方法において、前記ステップ(4)は、前記評価デフォルト値に対応する評価予測値と現実の評価データとの絶対偏差を求めるステップを含み、前記最適なデフォルト値として、前記絶対偏差を最も小さくする評価予測値を与える評価デフォルト値決定される。これにより最適な評価デフォルト値の客観的な決定が可能となる。
【0011】
請求項4の発明の協調的フィルタリングにおけるデフォルト値設定システムは、複数の対象アイテムそれぞれに対する複数の利用者それぞれの評価データを保存する評価データ保存手段と、前記評価データに基づき、前記複数の利用者それぞれの評価平均値を求める平均値演算手段と、前記複数の対象アイテムそれぞれに対する前記複数の利用者それぞれの未評価アイテムに対して複数種の評価デフォルト値の1つを設定する評価デフォルト値設定手段と、前記任意の利用者二者間の前記評価データ及び評価デフォルト値に基づいて当該二者をメンバーとする両者間の相関係数を計算する相関係数演算手段と、前記評価デフォルト値設定手段が複数種の評価デフォルト値の中から設定する評価デフォルト値を変更して前記相関係数演算手段に前記相関係数を計算させる評価デフォルト値変更手段と、前記任意の利用者の特定の対象アイテムに関して、前記複数の利用者それぞれの評価データと評価平均値と前記評価デフォルト値変更手段及び前記評価デフォルト値設定手段による複数種の評価デフォルト値、及び当該利用者を一方のメンバーとする前記相関係数を用いて、複数種の評価デフォルト値毎の評価データの予測演算を行う評価予測値演算手段とを備えたものである。
【0012】
請求項4の発明の協調的フィルタリングにおけるデフォルト値設定システムでは、平均値演算手段が評価データ保存手段に保存されている評価データに基づき、複数の利用者それぞれの評価平均値を求め、評価デフォルト値設定手段が複数の対象アイテムそれぞれに対する複数の利用者それぞれの未評価アイテムに対して複数種の評価デフォルト値の1つを設定し、相関係数演算手段が任意の利用者二者間の評価データ及び評価デフォルト値に基づいて当該二者をメンバーとする両者間の相関係数を計算する。そして、評価デフォルト値変更手段が、評価デフォルト値設定手段の設定する評価デフォルト値を変更し、相関係数演算手段に相関係数を再計算させ、評価予測値演算手段が、任意の利用者の特定の対象アイテムに関して、複数の利用者それぞれの評価データと評価平均値と複数種の評価デフォルト値、及び当該利用者を一方のメンバーとする相関係数を用いて、設定した複数種の評価デフォルト値毎の評価予測値を算出することにより、複数種の異なる評価デフォルト値それぞれに対応する評価予測値を得る。
【0013】
これにより、オペレータは得られる複数種の異なる評価デフォルト値それぞれに対応する評価予測値を比較し、現実の評価データに最も近しい評価予測値を与える評価デフォルト値がいずれであるかを容易に決定することができる。
【0014】
請求項5の発明の協調的フィルタリングにおけるデフォルト値設定システムは、複数の対象アイテムそれぞれに対する複数の利用者それぞれの評価データを保存する評価データ保存手段と、前記評価データに基づき、前記複数の利用者それぞれの評価平均値を求める平均値演算手段と、前記複数の対象アイテムそれぞれに対する前記複数の利用者それぞれの未評価アイテムに対して複数種の評価デフォルト値の1つを設定する評価デフォルト値設定手段と、前記任意の利用者二者間の前記評価データ及び評価デフォルト値に基づいて当該二者をメンバーとする両者間の相関係数を計算する相関係数演算手段と、前記評価デフォルト値設定手段が複数種の評価デフォルト値の中から設定する評価デフォルト値を変更して前記相関係数演算手段に前記相関係数を計算させる評価デフォルト値変更手段と、前記任意の利用者の特定の対象アイテムに関して、前記複数の利用者それぞれの評価データと評価平均値と前記評価デフォルト値変更手段及び前記評価デフォルト値設定手段による複数種の評価デフォルト値、及び当該利用者を一方のメンバーとする前記相関係数を用いて、複数種の評価デフォルト値毎の評価データの予測演算を行う評価予測値演算手段と、前記特定の対象アイテムに対する現実の評価データと前記評価予測値演算手段の算出した複数種のデフォルト値それぞれに対する評価予測値とを比較する比較手段とを備えたものである。
【0015】
請求項5の発明の協調的フィルタリングにおけるデフォルト値設定システムでは、平均値演算手段が評価データ保存手段に保存されている評価データに基づき、複数の利用者それぞれの評価平均値を求め、評価デフォルト値設定手段が複数の対象アイテムそれぞれに対する複数の利用者それぞれの未評価アイテムに対して複数種の評価デフォルト値の1つを設定し、相関係数演算手段が任意の利用者二者間の評価データ及び評価デフォルト値に基づいて当該二者をメンバーとする両者間の相関係数を計算する。そして、評価デフォルト値変更手段が、評価デフォルト値設定手段の設定する評価デフォルト値を変更し、相関係数演算手段に相関係数を再計算させ、評価予測値演算手段が、任意の利用者の特定の対象アイテムに関して、複数の利用者それぞれの評価データと評価平均値と複数種の評価デフォルト値、及び当該利用者を一方のメンバーとする相関係数を用いて、複数種の異なる評価デフォルト値それぞれに対応する評価予測値を得る。そして、比較手段が、特定の対象アイテムに対する現実の評価データと前記評価予測値演算手段の算出した複数種のデフォルト値それぞれに対する評価予測値とを比較して評価デフォルト値の適否を評価する。
【0016】
これにより、現実の評価データと複数種の評価デフォルト値それぞれに対応する評価予測値とがどの程度一致するかにより、最適な評価デフォルト値を決定することができ、当該最適な評価デフォルト値を、同種の利用者あるいは同種の対象アイテムに対する協調的フィルタリングにおける評価デフォルト値として利用することにより、精度の高い協調的フィルタリングを可能とする。
【0017】
請求項6の発明は、請求項5の協調的フィルタリングにおけるデフォルト値設定システムにおいて、前記比較手段は、前記評価デフォルト値に対応する評価予測値と現実の評価データとの絶対偏差を求め、当該絶対偏差を最も小さくする評価予測値を与える評価デフォルト値を最適なものと決定することを特徴とするものであり、最適な評価デフォルト値の客観的な決定が可能となる。
【0018】
請求項7の発明の協調的フィルタリングにおけるデフォルト値設定方法は、ランク設定手段が、既存の評価データ群を所定の指標に従って複数群にランク分けするステップ(1)と、評価予測値演算手段が、ステップ(1)でランク分けされたそれぞれのランク又は全体での既存の評価データの平均値を求め、未評価のアイテムに対して複数種の評価デフォルト値の1つを設定し、特定の利用者の評価データと他の利用者の評価データとの二者間の相関係数を演算し、特定の対象アイテムについての特定の利用者の評価予測値を求めるステップ(2)と、評価デフォルト値変更手段が、前記ステップ(2)で複数種の評価デフォルト値の中から設定する評価デフォルト値を変更して前記ステップ(2)の演算を繰り返させるステップ(3)と、評価手段が、既存の評価データと、複数種の評価デフォルト値それぞれを用いて評価予測を行った場合の評価予測値それぞれとを比較し、絶対偏差を最小にする評価予測値を与える評価デフォルト値をランク毎に求めるステップ(4)と、最適評価予測値算出手段が、同種の対象アイテムに対して協調的フィルタリングを行う際に、対象とするそれぞれのアイテムについて、既存の評価データ群が属するランクに対してステップ(4)で求めた最適な評価デフォルト値をそのアイテムに対する最適な評価デフォルト値として採用し、特定のアイテムに対する評価予測値を求めるステップ(5)とから成るものである。
【0019】
請求項7の発明の協調的フィルタリングにおけるデフォルト値設定方法では、既存の評価データ群を所定の指標に従って複数群にランク分けし、このランク分けされたそれぞれのランク又は全体での既存の評価データの平均値を求め、未評価のアイテムに対して複数種の評価デフォルト値の1つを設定し、特定の利用者の評価データと他の利用者の評価データとの二者間の相関係数を演算し、特定の対象アイテムについての特定の利用者の評価予測値を求める。さらに、評価デフォルト値を変更して上記の演算処理を繰り返して、複数種の評価デフォルト値それぞれを用いた場合の評価予測値を得る。そして、既存の評価データと複数種の評価デフォルト値それぞれを用いて評価予測を行った場合の評価予測値それぞれとを比較し、絶対偏差を最小にする評価予測値を与える評価デフォルト値をランク毎に求めて保持しておく。
【0020】
そして、同種の対象アイテムに対して協調的フィルタリングを行う際に、対象とするそれぞれのアイテムについての既存の評価データ群が属するランクに対して上記の演算処理で求めた最適な評価デフォルト値を全対象アイテムに対する最適な評価デフォルト値として採用し、特定のアイテムに対する評価予測値を求める。
【0021】
これにより、複数種の対象アイテムそれぞれに対する既存データに対して最適な評価デフォルト値を選定し、それを用いて特定の対象アイテムに対する特定の利用者の評価予測値を求めることができ、精度の高い協調的フィルタリングが可能となる。
【0022】
請求項8の発明の協調的フィルタリングにおけるデフォルト値設定システムは、複数の対象アイテムそれぞれに対する複数の利用者それぞれの評価データを保存する評価データ保存手段と、前記評価データ保存手段に保存されている評価データに対し、所定の指標に従って複数種のランクにランク分けするランク設定手段と、前記評価データ保存手段に保存されている評価データに基づき、前記ランク設定手段により設定された複数種のランクの1つに属する評価データ又は全評価データの平均値を求める平均値演算手段と、複数の対象アイテムそれぞれに対する複数の利用者それぞれの未評価アイテムに対して複数種の評価デフォルト値の1つを設定するデフォルト値設定手段と、指定された任意の利用者二者間の評価データ及び評価デフォルト値に基づいて当該二者をメンバーとする両者間の相関係数を計算する相関係数演算手段と、前記評価デフォルト値設定手段が複数種の評価デフォルト値の中から設定する評価デフォルト値を変更して前記相関係数演算手段に前記相関係数を計算させる評価デフォルト値変更手段と、指定された任意の利用者の特定の対象アイテムに関して、複数の利用者それぞれの評価データと評価平均値と前記評価デフォルト値変更手段及び前記評価デフォルト値設定手段による複数種の評価デフォルト値、及び当該利用者を一方のメンバーとする相関係数を用いて、複数種の評価デフォルト値毎の評価予測値を算出する評価予測値演算手段と、特定の対象アイテムに対する現実の評価データと評価予測値演算手段の算出した複数種のデフォルト値それぞれに対する評価予測値とを比較し、絶対偏差を最小とする評価予測値に対応する評価デフォルト値を該当するランクにおける最適な評価デフォルト値と決定する評価手段と、前記評価手段が最適な評価デフォルト値と決定した評価デフォルト値をそれに対応するランクと対照させた形で保持するランク別デフォルト値データ保持手段と、同種の対象アイテムに対して協調的フィルタリングを行う際に、対象とするそれぞれのアイテムについて、既存の評価データ群をランク付けし、前記デフォルト値設定手段により、当該ランクに対する最適な評価デフォルト値を前記ランク別デフォルト値データ保持手段から読み出して対象アイテムに対する最適な評価デフォルト値として採用し、全対象アイテムのうちの未評価のアイテムに対して設定させ、前記相関係数演算手段により、指定された任意の利用者二者間の評価データ及び評価デフォルト値に基づいて当該二者をメンバーとする両者間の相関係数を計算させ、前記評価予測値演算手段により、指定された任意の利用者の特定の対象アイテムに関して、最適な評価デフォルト値による評価予測値を算出させる最適評価予測値算出手段とを備えたものである。
【0023】
請求項8の発明の協調的フィルタリングにおけるデフォルト値設定システムでは、評価データ保存手段に保存されている評価データに対し、ランク設定手段により所定の指標に従って複数種のランクにランク分けし、平均値演算手段により、複数種のランクの1つに属する評価データ又は全評価データの平均値を求め、デフォルト値設定手段により、複数の対象アイテムそれぞれに対する複数の利用者それぞれの未評価アイテムに対して複数種の評価デフォルト値の1つを設定し、相関係数演算手段により、指定された任意の利用者二者間の評価データ及び評価デフォルト値に基づいて当該二者をメンバーとする両者間の相関係数を計算する。そして、評価予測値演算手段により、指定された任意の利用者の特定の対象アイテムに関して、複数の利用者それぞれの評価データと評価平均値と評価デフォルト値、及び当該利用者を一方のメンバーとする相関係数を用いて、複数種の評価デフォルト値毎の評価データの予測演算を行う。さらに、評価デフォルト値変更手段により、評価デフォルト値設定手段が設定する評価デフォルト値を変更し、相関係数演算手段により相関係数を再計算させ、評価手段により、特定の対象アイテムに対する現実の評価データと評価予測値演算手段の算出した複数種のデフォルト値それぞれに対する評価予測値とを比較し、絶対偏差を最小とする評価予測値に対応する評価デフォルト値を該当するランクにおける最適な評価デフォルト値と決定し、ランク別デフォルト値データ保持手段により、ランク毎の最適な評価デフォルト値をそれに対応するランクと対照させた形で保持する。
【0024】
そして、同種の対象アイテムに対して協調的フィルタリングを行う際に、最適評価予測値算出手段が、対象とするそれぞれのアイテムについての既存の評価データが属するランクに対する最適な評価デフォルト値をランク別デフォルト値データ保持手段から読み出して全対象アイテムに対する最適な評価デフォルト値として採用し、デフォルト値設定手段により、全対象アイテムのうちの未評価のアイテムに対してそのデフォルト値を設定させ、相関係数演算手段により、指定された任意の利用者二者間の評価データ及び評価デフォルト値に基づいて当該二者をメンバーとする両者間の相関係数を計算させ、評価予測値演算手段により、指定された任意の利用者の特定の対象アイテムに関して、最適な評価デフォルト値による評価予測値を算出させる。
【0025】
これにより、複数種の対象アイテムそれぞれに対する既存データに対して最適な評価デフォルト値を選定し、それを用いて特定の対象アイテムに対する特定の利用者の評価予測値を求めることができ、精度の高い協調的フィルタリングが可能となる。
【0026】
【発明の実施の形態】
以下、本発明の実施の形態を図に基づいて詳説する。図1は本発明の1つの実施の形態の協調的フィルタリングにおけるデフォルト値設定システムの機能的構成を示し、評価データ保存部1、平均値演算部2、評価デフォルト値設定部3、相関係数演算部4、評価予測値演算部5、評価部6から構成されている。
【0027】
評価データ保存部1は、複数の対象アイテムそれぞれに対する複数の利用者それぞれの評価データを保存する。平均値演算部2は、この評価データ保存部1に保存されている評価データに基づき、複数の利用者それぞれの評価平均値を求める。評価デフォルト値設定部3は、複数の対象アイテムそれぞれに対する複数の利用者それぞれの未評価アイテムに対して複数種の評価デフォルト値を設定する。相関係数計算部4は、任意の利用者二者間の評価データ及び評価デフォルト値に基づいて当該二者をメンバーとする両者間の相関係数を計算する。評価予測値演算部5は、任意の利用者の特定の対象アイテムに関して、複数の利用者それぞれの評価データと評価平均値と複数種の評価デフォルト値、及び当該利用者を一方のメンバーとする相関係数を用いて、複数種の評価デフォルト値毎の評価データの予測演算を行う。評価部6は、特定の対象アイテムに対する現実の評価データと評価予測値演算部5の算出した複数種のデフォルト値それぞれに対する評価予測値とを比較し評価する。
【0028】
なお、本実施の形態のシステムは、コンピュータシステムに所要のプログラムをインストールすることにより実現されるものであるが、ここではコンピュータシステムの実行する各機能を構成要素として分けて示している。
【0029】
次に、上記構成の協調的フィルタリングにおけるデフォルト値設定システムによるデフォルト値設定方法について、図2のフローチャートを用いて説明する。評価データ保存部1には、あらかじめ、少なくても一群の複数種の対象アイテム(例えば、複数種の映画、複数種の音楽、複数種の雑誌、複数種の番組あるいは複数種の商品)それぞれに対する、多数の利用者それぞれの評価データがアンケートその他の方法によって収集され、保存されている。
【0030】
そこで、本実施の形態のシステムでは、平均値演算部2が評価データ保存部1から利用者各々iの評価データvi,j を読み出し、平均値演算を次の数1式によって行う(ステップS1,S3)。
【0031】
【数1】

Figure 0003832720
ただし、j:個々の対象アイテム、vi,j:利用者iが対象アイテムjに対して行った評価データ、Ii :利用者iが評価している対象アイテム群、|Ii |:対象アイテム群Ii に含まれるアイテム数である。
【0032】
次に、評価デフォルト値設定部3によって、各利用者の未評価の対象アイテムそれぞれに1つの評価デフォルト値D1を設定する(ステップS5)。そして、相関係数演算部4によって、評価予測をしようとしている利用者aを特定し(ステップS7)、この利用者aと他のすべての登録されている利用者iとの相関係数w(a,i)を次の数2式によって計算する(ステップS9)。
【0033】
【数2】
Figure 0003832720
ただし、j:利用者a,iが共に評価している対象アイテムそれぞれ、va,j:利用者aが対象アイテムjに対して行った評価データ又は評価デフォルト値、vi,j:利用者iが対象アイテムjに対して行った評価データ又は評価デフォルト値、va ,vi (バー):数1式で求めた利用者a,jそれぞれの実評価データの平均値である。
【0034】
次に、評価予測値演算部5は、相関係数演算部4が算出した相関係数w(a,i)(ただし、iは登録利用者数分だけ存在する)を用いて、次の数3式により利用者aが対象アイテムjに対して下す評価の予測値pa,j を求める(ステップS11)。
【0035】
【数3】
Figure 0003832720
ここで、w(a,i):数2式で得た利用者aと利用者iとの相関係数、κ:正規化係数である。
【0036】
続いて、別の評価デフォルト値D2を用いて、ステップS5〜S11の演算処理を繰り返し、以下、用いることができるすべての評価デフォルト値D3〜Dnについて同様にステップS5〜S11の演算処理を繰り返す(ステップS13)。
【0037】
次に、評価部6において、オペレータとの対話形式により、複数種の評価デフォルト値D1,D2,…,Dnそれぞれを用いた場合の利用者aの対象アイテムjに対する評価予測値pa,j −1a,j −2,…,a,j −nを現実の評価データva,j と比較することにより、いずれの評価デフォルト値を用いた場合の評価予測値が現実の評価データによく近似するか評価し、最適な評価デフォルト値を決定する(ステップS15,S17)。
【0038】
これにより、協調的フィルタリングを用いて特定の利用者が特定の対象アイテムに対してどのような評価を下すかを予測するのに、最適な評価デフォルト値を用いて、登録されている多数の利用者それぞれの未評価の対象アイテムにその評価デフォルト値を設定し、相関係数を算出し、この相関係数を利用して特定の対象アイテムに対する特定の利用者の下す評価を精度良く予測することができるようになる。
【0039】
以下、さらに具体的に数字を例示して本発明の第1の実施の形態の特徴を説明する。いま、利用者a,b,cそれぞれが5つの対象アイテムI〜Vそれぞれについて、表1の評価を下しているとする。これは評価データ保存部1に登録されたデータである。
【0040】
【表1】
Figure 0003832720
このような評価データに対して、利用者aが未評価のアイテムVに対して下すであろう評価データpa,V を、評価デフォルト値を用いずに相関係数を用いて評価予測したのが表2に示すものである。
【0041】
【表2】
Figure 0003832720
この評価デフォルト値を用いないで行った評価予測では、利用者aが対象アイテムVに対して下す評価予測値pa,V =2である。
【0042】
次に、評価デフォルト値「2」を利用者a,b,cそれぞれの未評価の対象アイテムそれぞれに対して設定し、実評価データおよび評価デフォルト値を用いて相関係数を計算し、この相関係数に基づき利用者aが対象アイテムVに対して下すであろう評価データpa,V を計算したのが表3に示すものである。
【0043】
【表3】
Figure 0003832720
これによると、利用者aが対象アイテムVに対して下す評価予測値pa,V =1.0である。したがって、実評価データだけを用いて計算した場合とは、評価予測値が異なっている。ところが従来は、1つの評価デフォルト値だけを用いて評価予測を行っており、評価デフォルト値の最適化を図ることはなかった。
【0044】
本発明の場合は、さらに評価デフォルト値を変化させ、それぞれの評価デフォルト値を用いた場合の評価予測値を計算する。その計算例は、次の表4に示すものである。
【0045】
【表4】
Figure 0003832720
この表4では、表3で用いた評価デフォルト値D=2の他に、D=3,4それぞれについて計算している。そして評価デフォルト値D=3を用いた場合、利用者aが対象アイテムVに対して下す評価予測値pa,V =2.1であり、評価デフォルト値D=4を用いた場合、同様の評価予測値pa,V =3.0である。
【0046】
このようにして、評価デフォルト値Dに種々の値を設定し、それぞれの場合の相関係数を求め、得られた相関係数を用いて特定の利用者の特定の対象アイテムに対する評価予測を行い、これを現実の評価データと比較して近似度の高い結果を与える評価デフォルト値を最適なものと決定する。
【0047】
なお、この評価デフォルト値の最適値は必ずしも一意的に決定するものではなく、例えば映画、音楽、雑誌、番組、商品それぞれの対象アイテムによって大きく異なり、また年齢層、男性、女性、地域等の利用者層によっても大きく異なり、さらに標本数によっても大きく異なるものである。したがって、協調的フィルタリングに用いるための評価デフォルト値を決定する場合、それらの多種多様な対象アイテムや利用者層に応じて種々決定する必要がある。
【0048】
次に、本発明の第2の実施の形態の協調的フィルタリングにおけるデフォルト値設定方法について、説明する。この第2の実施の形態に使用するデフォルト値設定システムは、図1に示した第1の実施の形態のシステムと共通する。ただし、各構成要素の演算処理機能は一部下記のように、第1の実施の形態と異なる。
【0049】
第2の実施の形態の協調的フィルタリングにおけるデフォルト値設定方法は、コンピュータの演算処理手順として採用されるものであり、その演算処理手順は図3のフローチャートに示すものである。以下、これについて説明する。
【0050】
図3に示すフローチャートにおいて、ステップS1〜S13の処理は第1の実施の形態による図2のフローチャートと共通する。ただし、本実施の形態の場合には、第1の実施の形態の場合とは異なり、評価データ保存部1には、最適な評価デフォルト値を設定するために算出しようとする特定の対象アイテムにもすでに評価データが設定されているものとする。
【0051】
上記の特定の対象アイテムjに対して、複数種の評価デフォルト値それぞれに対応する評価予測値が算出されれば、本実施の形態の場合にはステップS150において、それぞれの評価予測値を現実の評価データと比較することによって評価し、続くステップS17において最適な評価デフォルト値を決定する。
【0052】
ステップS150における評価予測値の評価は、図4に示すフローチャートに従う。最初に、特定の対象アイテムjに対する複数種の評価デフォルト値それぞれによる評価予測値pi,j を取込み、現実の評価データvi,j を評価データ保存部1から取り込む(ステップS150‐1,S150‐3)。そして次の数4式にしたがって絶対偏差Sj の演算を行う(ステップS150‐5)。
【0053】
【数4】
Figure 0003832720
ここで、mj は、アイテムjに関して予測を行った数である。
【0054】
したがって、数4式の絶対偏差Sj は、個々の評価予測値の誤差を平均したものとなる。
【0055】
続いて、この数4式で求めた絶対偏差Sj を最小とする評価予測値pi,j を決定してメインフローに戻る(ステップS150‐7)。
【0056】
図3のフローチャートにおけるステップS17においては、絶対偏差Sj を最小とする評価予測値pi,j に対応する評価デフォルト値を最適なものとして決定する。
【0057】
このようにして、第2の実施の形態の協調的フィルタリングにおけるデフォルト値設定方法では、すでに評価データが得られている特定の対象アイテムに対して、複数種の評価デフォルト値を用いてそれぞれの評価予測値を算出し、評価データとの絶対偏差を最小にする評価予測値に対応する評価デフォルト値を最適なものと決定するので、客観的に最適な評価デフォルト値を得ることができる。
【0058】
以下、さらに具体的に数字を例示して、本発明の第2の実施の形態の特徴を説明する。いま、利用者a,b,cそれぞれが5つの対象アイテムI〜Vそれぞれについて、表5の評価を下しているとする。これは評価データ保存部1に登録されたデータである。
【0059】
【表5】
Figure 0003832720
このような評価データを利用して、利用者aが既存の評価「3」を行っている特定の対象アイテムVに対して、複数種の評価デフォルト値D=2,3,4それぞれを用いた場合の評価予測を行ってみる。
【0060】
評価デフォルト値D=2を利用者a,b,cそれぞれの未評価の対象アイテムそれぞれに対して設定し、実評価データおよび評価デフォルト値を用いて相関係数を計算し、この相関係数に基づき利用者aが対象アイテムVに対して下すであろう評価予測値pa,V を計算すると、pa,V =1.0である。そして、評価デフォルト値D=3の場合、同じ対象アイテムVに対する評価予測値pa,V =2.10であり、評価デフォルト値D=4の場合、pa,V =3.00である。
【0061】
そしてこれらの評価予測値pa,V と同じ対象アイテムVに対する利用者aの既存の評価データはva,V =3であるので、各評価デフォルト値それぞれに対して、評価予測値pa,V の絶対偏差|pa,V −va,V |は、D=2ときに2.00、D=3のときに0.90、そしてD=4のときに0.00(最小)となる。したがって、最適な評価デフォルト値はD=4であると決定できることになる。
【0062】
次に、本発明の第3の実施の形態の協調的フィルタリングにおけるデフォルト値設定システム及びそれによるデフォルト値設定方法について説明する。
【0063】
第3の実施の形態では、まず、既存の評価データ群を所定の指標に従って複数群にランク分けし、それぞれのランク及び全体での既存の評価データの平均値を求め、相関係数を演算し、特定の対象アイテムについての既存の評価データと評価デフォルト値を用いて評価予測を行った場合の評価予測値と比較し、絶対偏差を最小にする評価予測値を与える評価デフォルト値をランク毎に求めて保存しておく。そして、同種の対象アイテムに対して協調的フィルタリングを行う際に、対象とするアイテムについて前記と同様の指標に従ってランク付けし、該当するランクに対して前段階で求めて保存してある最適な評価デフォルト値を全対象アイテムに対する最適な評価デフォルト値として採用し、特定のアイテムに対する評価予測値を求めるのである。
【0064】
この所定の指標に従ってランク分けする手法としては、(1)評価データの平均値によってランク分けする場合、(2)標本数に従ってランク分けする場合、(3)標本数に従って大ランクにランク分けし、さらに標本数による大ランクごとに評価データの平均値に従って小ランクにランク分けする場合がある。
【0065】
この第3の実施の形態の協調的フィルタリングにおけるデフォルト値設定システムについて、図5及び図6を用いて説明する。図5は、本実施の形態の評価デフォルト値設定システムの機能的構成を示し、図1に示した第1の実施の形態のシステムと同様の評価データ保存部1、平均値演算部2、評価デフォルト値設定部3、相関係数演算部4、評価予測値演算部5及び評価部6を備えており、さらに、本実施の形態の特徴的要素として、ランク設定部7及びデフォルト値データテーブル8を備えている。
【0066】
評価データ保存部1は、複数の対象アイテムそれぞれに対する複数の利用者それぞれの評価データを保存する。平均値演算部2は、この評価データ保存部1に保存されている評価データに基づき、指定されたランクに属する評価データ又は全評価データの平均値を求める。評価デフォルト値設定部3は、複数の対象アイテムそれぞれに対する複数の利用者それぞれの未評価アイテムに対して複数種の評価デフォルト値を設定する。相関係数計算部4は、指定された任意の利用者二者間の評価データ及び評価デフォルト値に基づいて当該二者をメンバーとする両者間の相関係数を計算する。評価予測値演算部5は、指定された任意の利用者の特定の対象アイテムに関して、複数の利用者それぞれの評価データと評価平均値と複数種の評価デフォルト値、及び当該利用者を一方のメンバーとする相関係数を用いて、複数種の評価デフォルト値毎の評価データの予測演算を行う。評価部6は、特定の対象アイテムに対する現実の評価データと評価予測値演算部5の算出した複数種のデフォルト値それぞれに対する評価予測値とを比較し評価する。
【0067】
そして、ランク設定部7は、評価データ保存部1に保存された既存の評価データ群を評価データによって複数群にランク分けする。デフォルト値データテーブル8は、ランク設定部7が設定した各ランク毎の最適評価デフォルト値を登録する。
【0068】
なお、本実施の形態のシステムもコンピュータシステムに所要のプログラムをインストールすることにより実現されるものであるが、ここではコンピュータシステムの実行する各機能を構成要素として分けて示している。
【0069】
次に、上記構成の協調的フィルタリングにおけるデフォルト値設定システムによるデフォルト値設定方法について、図6のフローチャートを用いて説明する。評価データ保存部1には、第1の実施の形態と同様に、複数種の対象アイテムそれぞれに対する多数の利用者それぞれの評価データがアンケートその他の方法によって収集され、保存されている。
【0070】
そこで、ランク設定部7は評価データ保存部1の評価データ群を見て、所定指標に従ってランク分けする。このランク分けの指標には上で列挙したような3つの場合が考えられる(ステップS21,S23)。
【0071】
次に、平均値演算部2は、1つのランクを選択し、そのランクに属する評価データの平均値を前述の数1式によって算出する。平均値演算部2はまた、既存の評価データの全体の平均値も算出する(ステップS25)。
【0072】
次に、評価デフォルト値設定部3によって、各利用者の未評価の対象アイテムそれぞれに1つの評価デフォルト値(デフォルト値設定せずも含む)を設定し、相関係数演算部4によって、評価予測をしようとしている利用者を特定し、相関係数を前述の数2式によって計算する(ステップS27,S29)。
【0073】
次に、評価予測値演算部5は、相関係数演算部4が算出した相関係数を用いて、前述の数3式により利用者が対象アイテムに対して下す評価の予測値を求める(ステップS31)。続いて、別の評価デフォルト値を用いて、ステップS27〜S31の演算処理を繰り返し、以下、用いることができるすべての評価デフォルト値について同様にステップS27〜S31の演算処理を繰り返す(ステップS33)。
【0074】
次に、評価部6において、複数種の評価デフォルト値それぞれを用いた場合の利用者の対象アイテムに対する評価予測値を現実の評価データと比較することにより、ある1つのランクにおいていずれの評価デフォルト値を用いた場合の評価予測値による絶対偏差が最小になるかにより、最適な評価デフォルト値を決定する(ステップS35,S37)。なお、このステップS35の処理は、第2の実施の形態と同様に図4のフローチャートに示すものである。
【0075】
こうして、ある1つのランクにおける最適な評価デフォルト値が決定されると、他のランクについてもステップS25〜S37の処理を繰り返し、各ランク毎の最適な評価デフォルト値を決定する。そして得られた各ランク毎の最適デフォルト値は、デフォルト値データテーブル8に登録する(ステップS37,S39)。
【0076】
こうして、ある対象アイテムについて、ランク毎の最適な評価デフォルト値が決定できれば、後に同種の対象アイテムについて協調的フィルタリングを行う際には、図7のフローチャートに示すように、所定の指標に従ってランク付けし(ステップS51,S53)、デフォルト値データテーブル8に登録された各ランク毎の評価デフォルト値から該当ランクの最適な評価デフォルト値を選択して未評価のアイテムに対して設定し(ステップS55)、特定の対象アイテムに対する評価予測値を、第2の実施の形態と同様の処理により求める(ステップS57〜S61)。
【0077】
これにより、第3の実施の形態の協調的フィルタリングにおけるデフォルト値設定システム及びデフォルト値設定方法によると、より精度の高い協調的フィルタリングが可能になる。
【0078】
次に、本実施の形態の協調的フィルタリングにおけるデフォルト値設定方法を、具体的な数値を用いて詳しく説明する。
【0079】
<評価データの平均値に基づいて分割する例>
実際に映画500作品についてのアンケートで得られた評価データ群を利用して説明する。利用者の評価は、各作品について1.0(良い)〜0.0(悪い)まで0.2刻みで与えられている。そして、評価データの平均値が0.0〜0.2に属する作品から0.8〜1.0に属する作品まで5ランクに分け、それぞれのランクにおいて、そのランクに属する作品を見ていない利用者に対する評価デフォルト値として次の表6に示すものを設定し、絶対偏差を計算してみた。
【0080】
【表6】
Figure 0003832720
この表6によると、評価の平均値が0.0〜0.2の評価ランクの作品では、評価デフォルト値として0.6を設定したものが最も良く、0.2〜0.4の評価ランクの作品では、評価デフォルト値を設定しない場合が最も良く、0.6〜0.8の評価ランクの作品では、評価デフォルト値0.4、0.8〜1.0の評価ランクの作品では、評価デフォルト値0.4のものが最も良いことが判った。
【0081】
この結果に基づいて、全評価データの平均値に対応する評価デフォルト値を設定し評価予測を行うと、次の表7のようになり、本発明により採用した評価デフォルト値による評価予測値の絶対偏差が最小となった。
【0082】
【表7】
Figure 0003832720
<評価者の人数に基づいて分割する例>
実際に映画500作品について得られた評価データを利用して、評価者の人数に基づいて複数種のランクに分割し、それぞれのランクのアイテムに対して相関係数を求め、評価デフォルト値を設定しない場合、評価デフォルト値を0.0〜1.0まで0.2刻みで設定した場合それぞれでの評価予測値を既存の評価データと比較し、絶対偏差を求めたのが、次の表8である。
【0083】
【表8】
Figure 0003832720
この表によれば、評価者の人数が0〜100のランクの作品では、評価デフォルト値を設定しないものが最も良く、100〜400のランクの作品でも、評価デフォルト値なしのものが最も良く、400〜1600のランクの作品では、評価デフォルト値0.6、1600〜6400のランクの作品では、評価デフォルト値0.6、6400以上のランクの作品では、評価デフォルト値0.4のものが最も良いことが判った。
【0084】
この結果に基づいて、評価者の人数に対応する評価デフォルト値を設定し評価予測を行うと、次の表9のようになり、本発明により採用した評価デフォルト値による評価予測値の絶対偏差が最小となった。
【0085】
【表9】
Figure 0003832720
<評価値の平均値と評価者の人数に基づいて分割する例>
実際に映画500作品について得られた評価データを利用して、評価データの平均値及び評価者の人数に基づいて複数種のランクに分割し、それぞれのランクのアイテムに対して相関係数を求め、評価デフォルト値を設定しない場合、評価デフォルト値を0.0〜1.0まで0.2刻みで設定した場合それぞれでの評価予測値を既存の評価データと比較し、絶対偏差を求めたのが、次の表10である。
【0086】
【表10】
Figure 0003832720
この表によれば、評価データの平均が0.0〜0.2で評価者の人数が0〜100のランクの作品では、評価デフォルト値0.4を設定するのが最も良く、評価者の人数が100〜400のランクの作品では、評価デフォルト値0.4、400〜1600のランクの作品では、評価デフォルト値0.6、1600〜6400のランクの作品では、評価デフォルト値0.6を設定するのが最も良いことが判った。
【0087】
同様に、評価データの平均が0.2〜0.4の場合、評価者の人数が0〜100のランクの作品では、評価デフォルト値0.2、100〜400のランクの作品では、評価デフォルト値0.4、400〜1600のランクの作品では評価デフォルト値0.6、1600〜6400のランクの作品では評価デフォルト値0.6、6400以上のランクの作品では、評価デフォルト値0.8のものが最も良いことが判った。
【0088】
また、評価データの平均が0.4〜0.6の場合には、評価者の人数が0〜100のランクの作品では、評価デフォルト値を設定しない場合が最も良く、100〜400のランクの作品でも、評価デフォルト値を設定しない場合が最も良く、400〜1600のランクの作品では、評価デフォルト値0.6、1600〜6400のランクの作品では、評価デフォルト値0.6、6400以上のランクの作品では、評価デフォルト値0.8で設定するものが最も良いことが判った。
【0089】
また、評価データの平均が0.6〜0.8の場合には、評価者の人数が0〜100のランクの作品では、評価デフォルト値0.0に設定するのが最も良く、100〜400のランクの作品では、評価デフォルト値を設定しない場合が最も良く、400〜1600のランクの作品では、評価デフォルト値0.6、1600〜6400のランクの作品では、評価デフォルト値0.4、6400以上のランクの作品では、評価デフォルト値0.2に設定するものが最も良いことが判った。そして、本評価データの平均が0.8〜1.0の場合には、評価者の人数が6400以上のランクでは、評価デフォルト値0.4のものが最も良いことが判った。
【0090】
この結果に基づいて、評価値の平均と評価者の人数に対応する評価デフォルト値を設定し評価予測を行うと、次の表11のようになり、本発明により採用した評価デフォルト値による評価予測値の絶対偏差が最小となった。
【0091】
【表11】
Figure 0003832720
このようにして、既存の評価データを一定の基準(指標)に基づいていくつかのランクに分割し、それぞれのランクでの最適な評価デフォルト値をあらかじめ求めておき、それをテーブル形式で保存しておく。そして現実のアンケート結果、その他で取得した評価データに基づいて、協調的フィルタリングによりある利用者の特定の対象アイテムに対する評価予測値を得る場合には、当該対象アイテムを所定の指標に従ってランク付けし、そのランクに対応する最適な評価デフォルト値を前述のテーブルから取り出して、未評価のアイテムに対してその評価デフォルト値を設定して、特定の利用者と他のすべての利用者との相関係数を計算し、この相関係数群と評価データ、評価デフォルト値を用いて特定の対象アイテムに対する評価予測値を算出するようにすれば、精度の高い評価予測値を得ることができることになる。
【0092】
なお、上記の実施の形態では映画作品について例示し、評価データを0.2刻みでランク分けし、また評価者の人数によってランク分けし、さらにはそれらの組合せによってランク分けしたが、評価データは必ずしも0.0〜1.0の範囲に限定されるものではなく、例えば1〜5までの5段階評価や、1〜3までの3段階評価等の段階評価であってもよく、特に限定されることはない。また対象アイテムも映画作品に限定されるものではなく、種々のコンテンツ、書籍、テレビ番組、ゲーム、音楽等を対象とすることができ、アンケート対象となる種々のアイテムを対象とすることができる。
【0093】
【発明の効果】
以上のように、本発明によれば、協調的フィルタリングにおける評価デフォルト値として最適なもの設定することができ、精度の高い評価予測を可能にし、協調的フィルタリングを精度の高いものにすることができる。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態の協調的フィルタリングにおけるデフォルト値設定システムの機能的構成を示すブロック図。
【図2】上記の第1の実施の形態による最適な評価デフォルト値の決定処理のフローチャート。
【図3】本発明の第2の実施の形態の協調的フィルタリングにおけるデフォルト値設定システムによる最適な評価デフォルト値の決定処理のフローチャート。
【図4】上記のフローチャートにおける評価予測値の評価ステップの詳しい処理内容を示すフローチャート。
【図5】本発明の第3の実施の形態の協調的フィルタリングにおけるデフォルト値設定システムの機能的構成を示すブロック図。
【図6】上記の第3の実施の形態によるランク毎の最適な評価デフォルト値の決定処理のフローチャート。
【図7】上記の第3の実施の形態による評価予測値の演算処理のフローチャート。
【符号の説明】
1 評価データ保存部
2 平均値演算部
3 評価デフォルト値設定部
4 相関係数演算部
5 評価予測値演算部
6 評価部
7 ランク設定部
8 デフォルト値データテーブル[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a default value setting method and system in collaborative filtering.
[0002]
[Prior art]
Conventionally, one method for predicting the evaluation of a specific user using collaborative filtering is to use a correlation coefficient between users. In order to obtain the correlation coefficient between users, the evaluation data of the items evaluated by the two users who are seeking the correlation is used. There are few things. Therefore, conventionally, a method has been adopted in which an evaluation default value is set for an item that is not evaluated by each user, and the number of items that can be used for obtaining a correlation coefficient is increased.
[0003]
[Problems to be solved by the invention]
However, in general, when the default value is set in the evaluation data for an unevaluated item when calculating the correlation coefficient, the calculated correlation coefficient value changes compared to the case where the evaluation default value is not set. The predicted value of the evaluation will also change. For example, when the predicted evaluation value is lower than the original evaluation data, it is required to increase the predicted value. Conversely, when the estimated evaluation value is higher than the original evaluation data, the predicted value is decreased. Desired. Therefore, it is necessary to appropriately change and adjust the default value to be set according to the relationship between the original evaluation data and the estimated evaluation value.
[0004]
However, conventionally, a plurality of such users each set an evaluation data default value for an unevaluated item, obtain a correlation coefficient between any two users, and use the correlation coefficient, In a method for obtaining an evaluation prediction value for an unevaluated item of a specific user, there has been no contrivance to find out what value is the optimum evaluation default value.
[0005]
The present invention has been made to solve such a conventional technical problem, and an object of the present invention is to provide a default value setting method and system in collaborative filtering that can set an optimal evaluation default value. .
[0006]
[Means for Solving the Problems]
The default value setting method in the collaborative filtering of the invention of claim 1 is: Evaluation default value setting means A step (1) of setting one selected from a plurality of types of evaluation default values for each of one or a plurality of target items that are not yet evaluated by each of one or a plurality of users; Correlation coefficient calculation means A step (2) of calculating a correlation coefficient between the specific user and each of the other arbitrary users using the actual evaluation data and the evaluation default value set in step (1); , Evaluation estimated value calculation means, Step (3) of calculating an estimated prediction value corresponding to the evaluation default value of the specific user for the specific target item using the correlation coefficient obtained in Step (2) Have Said Choose from multiple types of default evaluation values in step (1) The evaluation default value is changed and the steps (2) and (3) are executed, An evaluation default value that gives an evaluation predicted value having a high degree of approximation with the actual evaluation data of the specific user for the specific target item is determined as an optimal evaluation default value. Is.
[0007]
In the default value setting method in the collaborative filtering of the invention of claim 1, each of a plurality of users sets an evaluation default value for each of one or a plurality of target items that have not been evaluated, and a specific user and another arbitrary The correlation coefficient between users is calculated, and the procedure for calculating the predicted predicted value of a specific user for a specific target item using this correlation coefficient is repeated for multiple types of evaluation default values. . Then, the obtained plural kinds of evaluation prediction values are compared, and the evaluation prediction value that is most realistic is adopted as the evaluation data for the specific target item. This enables highly accurate collaborative filtering.
[0008]
The default value setting method in the collaborative filtering of the invention of claim 2 is: Evaluation default value setting means A step (1) of setting one selected from a plurality of types of evaluation default values for each of one or a plurality of target items that are not yet evaluated by each of one or a plurality of users; Correlation coefficient calculation means A step (2) of calculating a correlation coefficient between the specific user and each of the other arbitrary users using the actual evaluation data and the evaluation default value set in step (1); , Evaluation estimated value calculation means, A step (3) of calculating an evaluation prediction value corresponding to the evaluation default value of the specific user for the specific target item using the correlation coefficient obtained in step (2); Comparison means (4) comparing the actual evaluation data of the specific user with respect to the specific target item and the evaluation predicted value corresponding to the evaluation default value obtained in step (3) Have Said Choose from multiple types of default evaluation values in step (1) The evaluation default value is changed and the steps (2) to (4) are executed, An evaluation default value that gives an evaluation predicted value having a high degree of approximation with the actual evaluation data of the specific user for the specific target item is determined as an optimal evaluation default value. Is.
[0009]
In the default value setting method in the collaborative filtering of the invention of claim 2, each of a plurality of users sets an evaluation default value for each of one or a plurality of target items that have not been evaluated, and a specific user and other arbitrary values are set. When a correlation coefficient is calculated between a user and a user, an evaluation prediction value of a specific user for a specific target item is calculated using the correlation coefficient, and the evaluation default value described above is changed. The optimum evaluation default value is determined according to how much the evaluation data of the evaluation data and the evaluation predicted value corresponding to each evaluation default value match. The evaluation default value thus determined is used as an evaluation default value in collaborative filtering for the same type of user or the same type of target item. This enables highly accurate collaborative filtering.
[0010]
The invention of claim 3 is the default value setting method in the collaborative filtering of the invention of claim 2, wherein the step (4) is performed. Is An absolute deviation between an estimated evaluation value corresponding to the evaluation default value and actual evaluation data is obtained. The optimal default value is Evaluation default value that gives the predicted value that minimizes the absolute deviation But Decision Is The This It is possible to objectively determine an optimal evaluation default value.
[0011]
The default value setting system in the collaborative filtering of the invention of claim 4 includes: evaluation data storage means for storing evaluation data of each of a plurality of users for each of a plurality of target items; and the plurality of users based on the evaluation data. Average value calculation means for obtaining each evaluation average value, and evaluation default value setting means for setting one of a plurality of kinds of evaluation default values for each of the plurality of users' unevaluated items for each of the plurality of target items A correlation coefficient calculating means for calculating a correlation coefficient between the two users who are members based on the evaluation data and the evaluation default value between the two arbitrary users, and the evaluation default value setting means But From multiple types of evaluation default values An evaluation default value changing means for changing the evaluation default value to be set and causing the correlation coefficient calculating means to calculate the correlation coefficient; and an evaluation of each of the plurality of users with respect to a specific target item of the arbitrary user Data and average rating By the evaluation default value changing means and the evaluation default value setting means Evaluation prediction value calculation means for performing prediction calculation of evaluation data for each of a plurality of types of evaluation default values by using a plurality of types of evaluation default values and the correlation coefficient having the user as one member It is.
[0012]
In the default value setting system in the collaborative filtering of the invention of claim 4, the average value calculation means obtains the evaluation average value of each of a plurality of users based on the evaluation data stored in the evaluation data storage means, and the evaluation default value The setting means sets one of a plurality of kinds of evaluation default values for each unevaluated item of each of a plurality of users for each of a plurality of target items, and the correlation coefficient calculating means sets evaluation data between any two users. Then, based on the evaluation default value, the correlation coefficient between the two members as members is calculated. Then, the evaluation default value changing means changes the evaluation default value set by the evaluation default value setting means, causes the correlation coefficient calculating means to recalculate the correlation coefficient, and the evaluation predicted value calculating means is used by any user. For a specific target item, multiple types of evaluation defaults are set using the evaluation data of each of multiple users, the average evaluation value, multiple types of evaluation default values, and the correlation coefficient with the user as one member. By calculating an evaluation prediction value for each value, an evaluation prediction value corresponding to each of a plurality of different evaluation default values is obtained.
[0013]
As a result, the operator compares the evaluation predicted values corresponding to the different types of different evaluation default values obtained, and easily determines which evaluation default value gives the evaluation predicted value closest to the actual evaluation data. be able to.
[0014]
The system for setting a default value in collaborative filtering according to claim 5 is an evaluation data storage unit that stores evaluation data of each of a plurality of users for each of a plurality of target items, and the plurality of users based on the evaluation data. Average value calculation means for obtaining each evaluation average value, and evaluation default value setting means for setting one of a plurality of kinds of evaluation default values for each of the plurality of users' unevaluated items for each of the plurality of target items A correlation coefficient calculating means for calculating a correlation coefficient between the two users who are members based on the evaluation data and the evaluation default value between the two arbitrary users, and the evaluation default value setting means But From multiple types of evaluation default values An evaluation default value changing means for changing the evaluation default value to be set and causing the correlation coefficient calculating means to calculate the correlation coefficient; and an evaluation of each of the plurality of users with respect to a specific target item of the arbitrary user Data and average rating By the evaluation default value changing means and the evaluation default value setting means Evaluation predicted value calculation means for performing prediction calculation of evaluation data for each of a plurality of types of evaluation default values, using the plurality of types of evaluation default values and the correlation coefficient having the user as one member, and the specific Comparing means for comparing actual evaluation data for the target item with evaluation predicted values for each of a plurality of types of default values calculated by the evaluation predicted value calculating means is provided.
[0015]
In the default value setting system in the collaborative filtering of the invention of claim 5, the average value calculation means obtains the evaluation average value of each of a plurality of users based on the evaluation data stored in the evaluation data storage means, and the evaluation default value The setting means sets one of a plurality of kinds of evaluation default values for each unevaluated item of each of a plurality of users for each of a plurality of target items, and the correlation coefficient calculating means sets evaluation data between any two users. Then, based on the evaluation default value, the correlation coefficient between the two members as members is calculated. Then, the evaluation default value changing means changes the evaluation default value set by the evaluation default value setting means, causes the correlation coefficient calculating means to recalculate the correlation coefficient, and the evaluation predicted value calculating means is used by any user. For a specific target item, multiple different evaluation default values using the evaluation data, average evaluation values, multiple types of evaluation default values, and a correlation coefficient with the user as one member An evaluation prediction value corresponding to each is obtained. Then, the comparison means compares the actual evaluation data for the specific target item with the evaluation predicted values for each of the plurality of types of default values calculated by the evaluation predicted value calculation means to evaluate the suitability of the evaluation default value.
[0016]
Thereby, it is possible to determine the optimal evaluation default value according to how much the actual evaluation data and the evaluation predicted value corresponding to each of the plurality of types of evaluation default values match. Highly accurate collaborative filtering is enabled by using it as an evaluation default value in collaborative filtering for the same type of user or target item of the same type.
[0017]
According to a sixth aspect of the present invention, in the default value setting system in the collaborative filtering of the fifth aspect, the comparison means obtains an absolute deviation between an evaluation predicted value corresponding to the evaluation default value and actual evaluation data, and It is characterized in that the evaluation default value that gives the evaluation predicted value that minimizes the deviation is determined to be optimal, and the optimal evaluation default value can be objectively determined.
[0018]
The default value setting method in the collaborative filtering of the invention of claim 7 is: Rank setting means (1) ranking the existing evaluation data group into a plurality of groups according to a predetermined index; Evaluation estimated value calculation means, Calculate the average value of the existing evaluation data in each rank or in the whole rank ranked in step (1), set one of multiple types of evaluation default values for the unevaluated items, and select a specific user Calculating a correlation coefficient between the evaluation data of the user and the evaluation data of the other user to obtain a specific user evaluation prediction value for the specific target item (2); The evaluation default value changing means sets from a plurality of types of evaluation default values in the step (2). Step (2) by changing the evaluation default value Operations Repeat Make Step (3); Evaluation means Comparing existing evaluation data and evaluation prediction values when evaluation prediction is performed using each of multiple types of evaluation default values, and providing an evaluation default value for each rank that gives an evaluation prediction value that minimizes absolute deviation Obtaining step (4); The optimal evaluation predicted value calculation means When performing collaborative filtering on the same type of target item, for each target item, the optimal evaluation default value obtained in step (4) for the rank to which the existing evaluation data group belongs is assigned to that item. It is adopted as an optimal evaluation default value, and comprises a step (5) for obtaining an evaluation predicted value for a specific item.
[0019]
In the default value setting method in the collaborative filtering of the invention of claim 7, the existing evaluation data group is ranked into a plurality of groups according to a predetermined index, and each rank or all of the existing evaluation data in the rank is classified. Obtain an average value, set one of multiple types of default evaluation values for unevaluated items, and calculate the correlation coefficient between the evaluation data of a specific user and the evaluation data of other users. Calculation is performed to obtain an evaluation predicted value of a specific user for a specific target item. Furthermore, the evaluation default value is changed, and the above arithmetic processing is repeated to obtain an evaluation predicted value when each of the plural types of evaluation default values is used. Then, the existing evaluation data is compared with each evaluation prediction value when evaluation prediction is performed using each of a plurality of types of evaluation default values, and the evaluation default value that gives the evaluation prediction value that minimizes the absolute deviation is determined for each rank. Seek to keep.
[0020]
Then, when collaborative filtering is performed on the same type of target item, the optimal evaluation default values obtained by the above calculation process are all calculated for the rank to which the existing evaluation data group for each target item belongs. Adopted as an optimal evaluation default value for the target item, and an evaluation prediction value for a specific item is obtained.
[0021]
As a result, it is possible to select an optimal evaluation default value for the existing data for each of the multiple types of target items, and use it to obtain an evaluation prediction value of a specific user for the specific target item, which is highly accurate Collaborative filtering is possible.
[0022]
The system for setting a default value in the collaborative filtering according to the invention of claim 8 includes an evaluation data storage unit that stores evaluation data of each of a plurality of users for each of a plurality of target items, and an evaluation stored in the evaluation data storage unit. Rank setting means for classifying the data into a plurality of types of ranks according to a predetermined index, and one of a plurality of types of ranks set by the rank setting means based on the evaluation data stored in the evaluation data storage means An average value calculating means for obtaining an average value of evaluation data belonging to one or all evaluation data, and setting one of a plurality of types of evaluation default values for an unevaluated item of each of a plurality of users for each of a plurality of target items Default value setting means and evaluation data and evaluation diff between two specified users A correlation coefficient calculation means for calculating a correlation coefficient between the two to members of the two parties on the basis of the belt value, said evaluation default value setting means From multiple types of evaluation default values Evaluation default value changing means for changing the evaluation default value to be set and causing the correlation coefficient calculating means to calculate the correlation coefficient; and for a specific target item of a specified arbitrary user, each of a plurality of users Evaluation data and average evaluation value By the evaluation default value changing means and the evaluation default value setting means Evaluation prediction value calculation means for calculating an evaluation prediction value for each of the plurality of types of evaluation default values using a plurality of types of evaluation default values and a correlation coefficient having the user as one member, and a specific target item The actual evaluation data is compared with the evaluation predicted values for each of the multiple types of default values calculated by the evaluation predicted value calculation means, and the evaluation default value corresponding to the evaluation predicted value that minimizes the absolute deviation is the optimum in the corresponding rank. An evaluation means for determining an evaluation default value, a default value data holding means for each rank for holding the evaluation default value determined by the evaluation means and the evaluation default value determined by comparing with the corresponding rank, and similar objects When collaborative filtering is performed on an item, the existing evaluation data group is obtained for each target item. The default value setting means reads the optimum evaluation default value for the rank from the rank-specific default value data holding means and adopts it as the optimum evaluation default value for the target item. Correlation coefficient between the two users who are set as the evaluation item and based on the evaluation data between the two arbitrary users specified by the correlation coefficient calculation means and the evaluation default value And an estimated evaluation value calculation means for calculating an estimated evaluation value based on an optimum evaluation default value for a specific target item of a specified arbitrary user by the evaluation predicted value calculation means. is there.
[0023]
In the default value setting system in the collaborative filtering of the invention of claim 8, the evaluation data stored in the evaluation data storage means is ranked into a plurality of ranks according to a predetermined index by the rank setting means, and an average value calculation is performed. By means, the average value of the evaluation data belonging to one of the plurality of types of ranks or all the evaluation data is obtained, and by the default value setting means, a plurality of types for each of the unevaluated items of a plurality of users for each of the plurality of target items Set one of the evaluation default values, and use correlation coefficient calculation means to specify the evaluation data between any two specified users and the correlation between the two members as members based on the evaluation default value Calculate the number. Then, with respect to a specific target item of a specified arbitrary user by the evaluation predicted value calculation means, the evaluation data, the average evaluation value, the evaluation default value, and the user as one member of each of the plurality of users A prediction calculation of evaluation data for each of a plurality of types of evaluation default values is performed using the correlation coefficient. Furthermore, the evaluation default value set by the evaluation default value setting unit is changed by the evaluation default value changing unit, the correlation coefficient is recalculated by the correlation coefficient calculating unit, and the actual evaluation for the specific target item is performed by the evaluation unit. The evaluation default value corresponding to the evaluation predicted value that minimizes the absolute deviation is compared with the evaluation predicted value for each of the multiple types of default values calculated by the evaluation predicted value calculation means, and the optimal evaluation default value in the corresponding rank The rank-specific default value data holding means holds the optimum evaluation default value for each rank in a form that is compared with the corresponding rank.
[0024]
When collaborative filtering is performed on the same type of target item, the optimal evaluation predicted value calculation means determines the optimal evaluation default value for the rank to which the existing evaluation data for each target item belongs by default. Read out from the value data holding means and adopt it as the optimum evaluation default value for all target items, and let the default value setting means set the default value for unevaluated items among all target items, and calculate the correlation coefficient Based on the evaluation data between the specified arbitrary two users and the evaluation default value, the correlation coefficient between the two members as members is calculated by the means, and the evaluation predicted value calculation means specifies Calculates the estimated predicted value based on the optimal evaluation default value for a specific target item of any user. Make.
[0025]
As a result, it is possible to select an optimal evaluation default value for the existing data for each of the multiple types of target items, and use it to obtain an evaluation prediction value of a specific user for the specific target item, which is highly accurate Collaborative filtering is possible.
[0026]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. FIG. 1 shows a functional configuration of a default value setting system in collaborative filtering according to an embodiment of the present invention, which includes an evaluation data storage unit 1, an average value calculation unit 2, an evaluation default value setting unit 3, and a correlation coefficient calculation. The unit 4 includes an evaluation predicted value calculation unit 5 and an evaluation unit 6.
[0027]
The evaluation data storage unit 1 stores evaluation data for each of a plurality of users for each of a plurality of target items. Based on the evaluation data stored in the evaluation data storage unit 1, the average value calculation unit 2 calculates an average evaluation value for each of a plurality of users. The evaluation default value setting unit 3 sets a plurality of types of evaluation default values for each unevaluated item of each of a plurality of users for each of a plurality of target items. The correlation coefficient calculation unit 4 calculates a correlation coefficient between the two users who are members based on the evaluation data and the evaluation default value between any two users. The evaluation predicted value calculation unit 5 relates to a specific target item of an arbitrary user, the evaluation data of each of the plurality of users, the evaluation average value, a plurality of types of evaluation default values, and a phase in which the user is one member. Using the number of relationships, prediction calculation of evaluation data for each of a plurality of types of evaluation default values is performed. The evaluation unit 6 compares and evaluates the actual evaluation data for the specific target item and the evaluation predicted values for each of the plurality of types of default values calculated by the evaluation predicted value calculation unit 5.
[0028]
Note that the system according to the present embodiment is realized by installing a required program in a computer system, but here, each function executed by the computer system is shown separately as a component.
[0029]
Next, a default value setting method by the default value setting system in the collaborative filtering with the above configuration will be described with reference to the flowchart of FIG. In the evaluation data storage unit 1, at least a group of a plurality of types of target items (for example, a plurality of types of movies, a plurality of types of music, a plurality of types of magazines, a plurality of types of programs, or a plurality of types of products) are previously stored. Evaluation data for each of a large number of users is collected and stored by questionnaires or other methods.
[0030]
Therefore, in the system according to the present embodiment, the average value calculation unit 2 receives the evaluation data v for each user i from the evaluation data storage unit 1. i, j And average value calculation is performed by the following equation (1) (steps S1 and S3).
[0031]
[Expression 1]
Figure 0003832720
Where j: individual target item, v i, j : Evaluation data performed by user i on the target item j, I i : Target item group evaluated by user i, | I i |: Target item group I i This is the number of items included in.
[0032]
Next, the evaluation default value setting unit 3 sets one evaluation default value D1 for each unevaluated target item of each user (step S5). Then, the correlation coefficient calculation unit 4 identifies the user a who is going to make an evaluation prediction (step S7), and the correlation coefficient w () between this user a and all other registered users i ( a, i) is calculated by the following equation (2) (step S9).
[0033]
[Expression 2]
Figure 0003832720
Where j: each of the target items evaluated by the users a and i, v a, j : Evaluation data or evaluation default value performed by user a for the target item j, v i, j : Evaluation data or evaluation default value performed by user i for the target item j, v a , v i (Bar): The average value of the actual evaluation data of each of the users a and j obtained by the equation 1.
[0034]
Next, the evaluation predicted value calculation unit 5 uses the correlation coefficient w (a, i) calculated by the correlation coefficient calculation unit 4 (where i exists for the number of registered users) to Predicted value p of evaluation given by user a to target item j according to equation (3) a, j Is obtained (step S11).
[0035]
[Equation 3]
Figure 0003832720
Here, w (a, i) is a correlation coefficient between the user a and the user i obtained by Equation 2, and κ is a normalization coefficient.
[0036]
Subsequently, the calculation process of steps S5 to S11 is repeated using another evaluation default value D2, and the calculation process of steps S5 to S11 is repeated in the same manner for all the evaluation default values D3 to Dn that can be used. Step S13).
[0037]
Next, in the evaluation unit 6, the estimated predicted value p for the target item j of the user a when using a plurality of types of evaluation default values D1, D2,. a, j −1 , p a, j −2 , ..., p a, j −n is the actual evaluation data v a, j Is compared with the actual evaluation data, and the optimum evaluation default value is determined (steps S15 and S17).
[0038]
This allows collaborative filtering to be used to predict how a specific user will evaluate a specific target item, using the optimal default value for the evaluation, Set an evaluation default value for each unevaluated target item of each user, calculate a correlation coefficient, and accurately predict an evaluation made by a specific user for a specific target item using this correlation coefficient Will be able to.
[0039]
Hereinafter, the features of the first embodiment of the present invention will be described with reference to more specific numbers. Now, it is assumed that each of the users a, b, and c has evaluated Table 5 for each of the five target items I to V. This is data registered in the evaluation data storage unit 1.
[0040]
[Table 1]
Figure 0003832720
For such evaluation data, evaluation data p that the user a would give to the unevaluated item V a, V Table 2 shows the prediction of the evaluation using the correlation coefficient without using the evaluation default value.
[0041]
[Table 2]
Figure 0003832720
In the evaluation prediction performed without using the evaluation default value, the evaluation prediction value p that the user a gives to the target item V a, V = 2.
[0042]
Next, an evaluation default value “2” is set for each unevaluated target item for each of the users a, b, and c, and a correlation coefficient is calculated using the actual evaluation data and the evaluation default value. Evaluation data p that user a will give to target item V based on the number of relations a, V Is calculated as shown in Table 3.
[0043]
[Table 3]
Figure 0003832720
According to this, the estimated predicted value p that the user a gives to the target item V a, V = 1.0. Therefore, the evaluation predicted value is different from that calculated using only actual evaluation data. However, conventionally, evaluation prediction is performed using only one evaluation default value, and the evaluation default value is not optimized.
[0044]
In the case of the present invention, the evaluation default value is further changed, and the evaluation predicted value when each evaluation default value is used is calculated. An example of the calculation is shown in Table 4 below.
[0045]
[Table 4]
Figure 0003832720
In Table 4, in addition to the evaluation default value D = 2 used in Table 3, each of D = 3 and 4 is calculated. And when the evaluation default value D = 3 is used, the evaluation predicted value p that the user a gives to the target item V a, V = 2.1 and when the evaluation default value D = 4 is used, the same evaluation prediction value p a, V = 3.0.
[0046]
In this way, various values are set as the evaluation default value D, the correlation coefficient in each case is obtained, and evaluation prediction for a specific target item of a specific user is performed using the obtained correlation coefficient. Then, this is compared with the actual evaluation data, and an evaluation default value that gives a result with a high degree of approximation is determined to be optimal.
[0047]
Note that the optimum value of the default value for evaluation is not necessarily determined uniquely. For example, it varies greatly depending on the target items of movies, music, magazines, programs, products, and the use of age groups, men, women, regions, etc. It varies greatly depending on the demographic, and also varies greatly depending on the number of specimens. Therefore, when determining an evaluation default value for use in collaborative filtering, it is necessary to make various determinations according to the various target items and user groups.
[0048]
Next, a default value setting method in collaborative filtering according to the second embodiment of this invention will be described. The default value setting system used in the second embodiment is common to the system of the first embodiment shown in FIG. However, the arithmetic processing function of each component is partially different from the first embodiment as described below.
[0049]
The default value setting method in the collaborative filtering of the second embodiment is adopted as a computer processing procedure, and the processing procedure is shown in the flowchart of FIG. This will be described below.
[0050]
In the flowchart shown in FIG. 3, the processes in steps S1 to S13 are the same as those in the flowchart of FIG. 2 according to the first embodiment. However, in the case of the present embodiment, unlike the case of the first embodiment, the evaluation data storage unit 1 includes a specific target item to be calculated in order to set an optimal evaluation default value. Assume that evaluation data has already been set.
[0051]
If evaluation prediction values corresponding to each of a plurality of types of evaluation default values are calculated for the specific target item j, in the case of the present embodiment, each evaluation prediction value is converted to an actual value in step S150. Evaluation is performed by comparing with the evaluation data, and an optimum evaluation default value is determined in the subsequent step S17.
[0052]
The evaluation prediction value in step S150 is evaluated according to the flowchart shown in FIG. First, an estimated prediction value p by each of a plurality of kinds of evaluation default values for a specific target item j i, j Actual evaluation data v i, j From the evaluation data storage unit 1 (steps S150-1 and S150-3). And the absolute deviation S according to the following equation (4) j (Step S150-5).
[0053]
[Expression 4]
Figure 0003832720
Where m j Is the number of predictions for item j.
[0054]
Therefore, the absolute deviation S in Equation 4 j Is an average of the errors of the individual evaluation prediction values.
[0055]
Subsequently, the absolute deviation S obtained by this equation 4 j Evaluation value p that minimizes i, j And return to the main flow (step S150-7).
[0056]
In step S17 in the flowchart of FIG. j Evaluation value p that minimizes i, j The evaluation default value corresponding to is determined as the optimum value.
[0057]
In this way, in the default value setting method in collaborative filtering according to the second embodiment, a plurality of types of evaluation default values are used to evaluate each specific target item for which evaluation data has already been obtained. Since the prediction value is calculated and the evaluation default value corresponding to the evaluation prediction value that minimizes the absolute deviation from the evaluation data is determined to be optimal, an objectively optimal evaluation default value can be obtained.
[0058]
Hereinafter, the characteristics of the second embodiment of the present invention will be described with reference to more specific numbers. Now, it is assumed that each of the users a, b, and c has evaluated Table 5 for each of the five target items I to V. This is data registered in the evaluation data storage unit 1.
[0059]
[Table 5]
Figure 0003832720
Using such evaluation data, a plurality of types of evaluation default values D = 2, 3, and 4 are used for the specific target item V for which the user a is performing the existing evaluation “3”. Try to estimate the case.
[0060]
An evaluation default value D = 2 is set for each unevaluated target item of each of the users a, b, and c, and a correlation coefficient is calculated using the actual evaluation data and the evaluation default value. Evaluation predicted value p that user a will give to target item V based on a, V , P a, V = 1.0. And in the case of the evaluation default value D = 3, the evaluation predicted value p for the same target item V a, V = 2.10, and the evaluation default value D = 4, p a, V = 3.00.
[0061]
And these evaluation prediction values p a, V The existing evaluation data of user a for the same target item V is v a, V = 3, so that for each evaluation default value, the evaluation predicted value p a, V Absolute deviation | p a, V -V a, V | Is 2.00 when D = 2, 0.90 when D = 3, and 0.00 (minimum) when D = 4. Therefore, it can be determined that the optimum evaluation default value is D = 4.
[0062]
Next, a default value setting system and a default value setting method in the collaborative filtering according to the third embodiment of the present invention will be described.
[0063]
In the third embodiment, first, an existing evaluation data group is ranked into a plurality of groups according to a predetermined index, an average value of each rank and the entire existing evaluation data is obtained, and a correlation coefficient is calculated. The evaluation default value that gives the evaluation prediction value that minimizes the absolute deviation is compared with the evaluation prediction value when the evaluation prediction is performed using the existing evaluation data and the evaluation default value for the specific target item for each rank. Seek and save. Then, when collaborative filtering is performed on the same type of target item, the target item is ranked according to the same index as described above, and the optimal evaluation that is obtained and stored in the previous stage for the corresponding rank The default value is adopted as the optimum evaluation default value for all target items, and the evaluation prediction value for a specific item is obtained.
[0064]
As a method of ranking according to this predetermined index, (1) when ranking according to the average value of evaluation data, (2) when ranking according to the number of samples, (3) ranking according to the number of samples, Furthermore, there are cases where the rank is divided into small ranks according to the average value of the evaluation data for each large rank based on the number of samples.
[0065]
A default value setting system in collaborative filtering according to the third embodiment will be described with reference to FIGS. FIG. 5 shows a functional configuration of the evaluation default value setting system of the present embodiment, and the same evaluation data storage unit 1, average value calculation unit 2, evaluation as those of the system of the first embodiment shown in FIG. A default value setting unit 3, a correlation coefficient calculation unit 4, an evaluation predicted value calculation unit 5, and an evaluation unit 6 are provided. Further, as characteristic elements of the present embodiment, a rank setting unit 7 and a default value data table 8 are provided. It has.
[0066]
The evaluation data storage unit 1 stores evaluation data for each of a plurality of users for each of a plurality of target items. Based on the evaluation data stored in the evaluation data storage unit 1, the average value calculation unit 2 obtains an average value of evaluation data belonging to the specified rank or all evaluation data. The evaluation default value setting unit 3 sets a plurality of types of evaluation default values for each unevaluated item of each of a plurality of users for each of a plurality of target items. The correlation coefficient calculation unit 4 calculates a correlation coefficient between the two members who are members based on the evaluation data and the evaluation default value between any two specified users. The estimated predicted value calculation unit 5 has, for a specific target item of a specified arbitrary user, evaluation data, an average evaluation value, a plurality of types of evaluation default values for each of a plurality of users, and the user as one member Is used to predict evaluation data for each of a plurality of types of evaluation default values. The evaluation unit 6 compares and evaluates the actual evaluation data for the specific target item and the evaluation predicted values for each of the plurality of types of default values calculated by the evaluation predicted value calculation unit 5.
[0067]
Then, the rank setting unit 7 ranks the existing evaluation data groups stored in the evaluation data storage unit 1 into a plurality of groups based on the evaluation data. The default value data table 8 registers the optimum evaluation default value for each rank set by the rank setting unit 7.
[0068]
The system of the present embodiment is also realized by installing a required program in a computer system, but here, each function executed by the computer system is shown separately as a component.
[0069]
Next, a default value setting method by the default value setting system in the collaborative filtering with the above configuration will be described with reference to the flowchart of FIG. Similar to the first embodiment, the evaluation data storage unit 1 collects and stores evaluation data of a large number of users for each of a plurality of types of target items by a questionnaire or other method.
[0070]
Therefore, the rank setting unit 7 looks at the evaluation data group of the evaluation data storage unit 1 and ranks it according to a predetermined index. There are three possible cases for the ranking index as listed above (steps S21 and S23).
[0071]
Next, the average value calculation unit 2 selects one rank, and calculates the average value of the evaluation data belonging to that rank by the above-described equation (1). The average value calculation unit 2 also calculates the average value of the entire existing evaluation data (step S25).
[0072]
Next, the evaluation default value setting unit 3 sets one evaluation default value (including the case where the default value is not set) for each unevaluated target item of each user, and the correlation coefficient calculation unit 4 sets the evaluation prediction. The user who wants to perform the identification is specified, and the correlation coefficient is calculated by the above-described equation (2) (steps S27 and S29).
[0073]
Next, the estimated predicted value calculation unit 5 uses the correlation coefficient calculated by the correlation coefficient calculation unit 4 to obtain an estimated predicted value that the user gives to the target item according to the above equation (3) (step) S31). Subsequently, the calculation process of steps S27 to S31 is repeated using another evaluation default value, and the calculation process of steps S27 to S31 is similarly repeated for all the evaluation default values that can be used (step S33).
[0074]
Next, in the evaluation unit 6, any evaluation default value in a certain rank is obtained by comparing the evaluation predicted value for the target item of the user when each of the plural types of evaluation default values is used with the actual evaluation data. The optimum evaluation default value is determined depending on whether the absolute deviation due to the evaluation predicted value when using is minimized (steps S35 and S37). The processing in step S35 is shown in the flowchart of FIG. 4 as in the second embodiment.
[0075]
Thus, when the optimum evaluation default value in one rank is determined, the processes in steps S25 to S37 are repeated for the other ranks, and the optimum evaluation default value for each rank is determined. The obtained optimum default value for each rank is registered in the default value data table 8 (steps S37 and S39).
[0076]
In this way, if an optimum evaluation default value for each rank can be determined for a certain target item, when collaborative filtering is performed for the same type of target item later, as shown in the flowchart of FIG. 7, ranking is performed according to a predetermined index. (Steps S51 and S53), the optimum evaluation default value of the corresponding rank is selected from the evaluation default values for each rank registered in the default value data table 8, and set for the unevaluated item (Step S55). An evaluation prediction value for a specific target item is obtained by the same process as in the second embodiment (steps S57 to S61).
[0077]
Thereby, according to the default value setting system and the default value setting method in the collaborative filtering of the third embodiment, collaborative filtering with higher accuracy becomes possible.
[0078]
Next, the default value setting method in the collaborative filtering of this embodiment will be described in detail using specific numerical values.
[0079]
<Example of dividing based on the average value of evaluation data>
An explanation will be given using an evaluation data group actually obtained by a questionnaire about 500 movies. User evaluations are given in increments of 0.2 from 1.0 (good) to 0.0 (bad) for each work. And the average value of evaluation data is divided into 5 ranks from works belonging to 0.0 to 0.2 to works belonging to 0.8 to 1.0, and in each rank, the works that do not see works belonging to that rank The evaluation default values for the persons were set as shown in Table 6 below, and the absolute deviation was calculated.
[0080]
[Table 6]
Figure 0003832720
According to this table 6, in the works with the evaluation rank of the average evaluation value of 0.0 to 0.2, it is best to set the evaluation default value to 0.6, and the evaluation rank of 0.2 to 0.4 It is best not to set an evaluation default value for works of No., and for works with an evaluation rank of 0.6 to 0.8, for works with an evaluation rank of 0.4 and 0.8 to 1.0, An evaluation default value of 0.4 was found to be the best.
[0081]
Based on this result, when the evaluation default value corresponding to the average value of all the evaluation data is set and the evaluation prediction is performed, it becomes as shown in the following Table 7, and the absolute value of the evaluation prediction value by the evaluation default value adopted by the present invention is as follows. Deviation is minimized.
[0082]
[Table 7]
Figure 0003832720
<Example of dividing based on the number of evaluators>
Using the evaluation data actually obtained for 500 movies, it is divided into multiple ranks based on the number of evaluators, the correlation coefficient is obtained for each rank item, and an evaluation default value is set In the case where the evaluation default value is set in increments of 0.2 from 0.0 to 1.0, the evaluation predicted value in each is compared with the existing evaluation data, and the absolute deviation is obtained as shown in Table 8 below. It is.
[0083]
[Table 8]
Figure 0003832720
According to this table, it is best to set an evaluation default value in a work with the number of evaluators of 0 to 100 ranks, and even a work with a rank of 100 to 400 is best with no evaluation default value. For works with ranks of 400 to 1600, evaluation default value 0.6, for works with rank of 1600-6400, evaluation default value 0.6, for works with rank of 6400 or more, evaluation default value 0.4 is the most. I found it good.
[0084]
Based on this result, when an evaluation default value corresponding to the number of evaluators is set and evaluation prediction is performed, the result shown in the following Table 9 is obtained, and the absolute deviation of the evaluation predicted value based on the evaluation default value adopted by the present invention is It became the minimum.
[0085]
[Table 9]
Figure 0003832720
<Example of dividing based on the average evaluation value and the number of evaluators>
Using the evaluation data actually obtained for 500 movies, it is divided into multiple ranks based on the average value of the evaluation data and the number of evaluators, and the correlation coefficient is obtained for each rank item. When the evaluation default value is not set, when the evaluation default value is set in increments of 0.2 from 0.0 to 1.0, the evaluation predicted value in each is compared with the existing evaluation data, and the absolute deviation is obtained. Is the following Table 10.
[0086]
[Table 10]
Figure 0003832720
According to this table, it is best to set an evaluation default value of 0.4 for works with an average evaluation data of 0.0 to 0.2 and a rank of 0 to 100. For works with a rank of 100 to 400, the evaluation default value is 0.4, for works with a rank of 400 to 1600, an evaluation default value of 0.6, and for works with a rank of 1600 to 6400, the evaluation default value is 0.6. I found it best to set.
[0087]
Similarly, when the average of the evaluation data is 0.2 to 0.4, the evaluation default value is 0.2 for the works whose rank is 0 to 100, and the evaluation default is for the works whose rank is 100 to 400. For works with ranks of 0.4 and 400-1600, the default rating value is 0.6, for works with ranks of 1600-6400, the default rating value is 0.6, for works with ranks of 6400 or higher, the default rating value is 0.8. The thing turned out to be the best.
[0088]
Moreover, when the average of the evaluation data is 0.4 to 0.6, it is best not to set the evaluation default value in the works having the rank of 0 to 100 as the number of evaluators. Even for works, it is best not to set an evaluation default value. For works with a rank of 400 to 1600, evaluation works with a default value of 0.6, for works with a rank of 1600 to 6400, a rank with an evaluation default value of 0.6, 6400 or higher. It was found that the setting with the default value of 0.8 is the best for the works.
[0089]
When the average of the evaluation data is 0.6 to 0.8, it is best to set the evaluation default value 0.0 to 100 to 400 for works whose rank is 0 to 100. It is best not to set an evaluation default value for works with a rank of, and for works with a rank of 400 to 1600, evaluation default values of 0.6, and for works with a rank of 1600 to 6400, evaluation default values of 0.4 and 6400. It was found that works with the above ranks are best set to an evaluation default value of 0.2. And when the average of this evaluation data was 0.8-1.0, it turned out that the thing of evaluation default value 0.4 is the best in the rank whose number of evaluators is 6400 or more.
[0090]
Based on this result, when an evaluation default value corresponding to the average of the evaluation values and the number of evaluators is set and the evaluation prediction is performed, the result is as shown in Table 11 below, and the evaluation prediction based on the evaluation default value adopted by the present invention is used. The absolute value deviation was minimized.
[0091]
[Table 11]
Figure 0003832720
In this way, the existing evaluation data is divided into several ranks based on a certain standard (indicator), the optimal evaluation default value for each rank is obtained in advance, and it is stored in a table format. Keep it. And based on the actual questionnaire results and other evaluation data acquired in other cases, when obtaining an evaluation prediction value for a specific target item of a user by collaborative filtering, the target item is ranked according to a predetermined index, The optimal evaluation default value corresponding to the rank is extracted from the above table, and the evaluation default value is set for the unevaluated item, and the correlation coefficient between a specific user and all other users is set. , And an evaluation prediction value for a specific target item is calculated using the correlation coefficient group, the evaluation data, and the evaluation default value, so that a highly accurate evaluation prediction value can be obtained.
[0092]
In the above embodiment, movie works are exemplified, and evaluation data is ranked in increments of 0.2, is ranked according to the number of evaluators, and is further ranked according to a combination thereof. It is not necessarily limited to a range of 0.0 to 1.0, and may be a stage evaluation such as a five-stage evaluation from 1 to 5 or a three-stage evaluation from 1 to 3, for example. Never happen. Also, the target item is not limited to a movie work, and various items of content, books, TV programs, games, music, etc. can be targeted, and various items to be surveyed can be targeted.
[0093]
【The invention's effect】
As described above, according to the present invention, it is possible to set an optimal evaluation default value in collaborative filtering, to enable highly accurate evaluation prediction, and to make collaborative filtering highly accurate. .
[Brief description of the drawings]
FIG. 1 is a block diagram showing a functional configuration of a default value setting system in collaborative filtering according to a first embodiment of this invention.
FIG. 2 is a flowchart of optimum evaluation default value determination processing according to the first embodiment.
FIG. 3 is a flowchart of determination processing of an optimum evaluation default value by a default value setting system in collaborative filtering according to the second embodiment of this invention.
FIG. 4 is a flowchart showing detailed processing contents of an evaluation predicted value evaluation step in the flowchart.
FIG. 5 is a block diagram showing a functional configuration of a default value setting system in collaborative filtering according to the third embodiment of this invention;
FIG. 6 is a flowchart of determination processing for an optimum evaluation default value for each rank according to the third embodiment.
FIG. 7 is a flowchart of an evaluation predicted value calculation process according to the third embodiment.
[Explanation of symbols]
1 Evaluation data storage
2 Average value calculator
3 Evaluation default value setting part
4 correlation coefficient calculator
5 Evaluation prediction value calculation part
6 Evaluation Department
7 Rank setting section
8 Default value data table

Claims (8)

評価デフォルト値設定手段が、1又は複数の利用者それぞれの未評価の1又は複数の対象アイテムそれぞれに複数種の評価デフォルト値の中から選んだ1つを設定するステップ(1)と、
相関係数演算手段が、現実の評価データとステップ(1)で設定された評価デフォルト値とを用いて、特定の利用者と他の任意の利用者それぞれとの二者間の相関係数を演算するステップ(2)と、
評価予測値演算手段が、ステップ(2)で得られた相関係数を用いて特定の対象アイテムに対する前記特定の利用者の前記評価デフォルト値に対応する評価予測値を演算するステップ(3)を有し、
前記ステップ(1)で複数種の評価デフォルト値の中から選ぶ評価デフォルト値を変更して前記ステップ(2)及び(3)を実行し、前記特定の対象アイテムに対する前記特定の利用者の現実の評価データと近似度の高い評価予測値を与える評価デフォルト値を最適な評価デフォルト値として決定することを特徴とする協調的フィルタリングにおけるデフォルト値設定方法。
A step (1) in which an evaluation default value setting means sets one selected from a plurality of types of evaluation default values for each of one or a plurality of target items that are not yet evaluated by each of one or a plurality of users;
The correlation coefficient calculating means calculates the correlation coefficient between the specific user and each of the other arbitrary users using the actual evaluation data and the evaluation default value set in step (1). Calculating step (2);
A step (3) in which the evaluation prediction value calculation means calculates an evaluation prediction value corresponding to the evaluation default value of the specific user for the specific target item using the correlation coefficient obtained in step (2) ; Have
Steps (2) and (3) are executed by changing an evaluation default value selected from a plurality of types of evaluation default values in the step (1), and the real user's actuality for the specific target item is executed . default value setting method in collaborative filtering you and determines the evaluation default value which gives a high evaluation prediction value of the approximation degree evaluation data as the optimum evaluation default value.
評価デフォルト値設定手段が、1又は複数の利用者それぞれの未評価の1又は複数の対象アイテムそれぞれに複数種の評価デフォルト値の中から選んだ1つを設定するステップ(1)と、
相関係数演算手段が、現実の評価データとステップ(1)で設定された評価デフォルト値とを用いて、特定の利用者と他の任意の利用者それぞれとの二者間の相関係数を演算するステップ(2)と、
評価予測値演算手段が、ステップ(2)で得られた相関係数を用いて特定の対象アイテムに対する前記特定の利用者の前記評価デフォルト値に対応する評価予測値を演算するステップ(3)と、
比較手段が、前記特定の対象アイテムに対する前記特定の利用者の現実の評価データとステップ(3)で得られた前記評価デフォルト値に対応する評価予測値とを比較するステップ(4)を有し、
前記ステップ(1)で複数種の評価デフォルト値の中から選ぶ評価デフォルト値を変更して前記ステップ(2)〜(4)を実行し、前記特定の対象アイテムに対する前記特定の利用者の現実の評価データと近似度の高い評価予測値を与える評価デフォルト値を最適な評価デフォルト値として決定することを特徴とする協調的フィルタリングにおけるデフォルト値設定方法。
A step (1) in which an evaluation default value setting means sets one selected from a plurality of types of evaluation default values for each of one or a plurality of target items that are not yet evaluated by each of one or a plurality of users;
The correlation coefficient calculating means calculates the correlation coefficient between the specific user and each of the other arbitrary users using the actual evaluation data and the evaluation default value set in step (1). Calculating step (2);
A step (3) in which an evaluation prediction value calculating means calculates an evaluation prediction value corresponding to the evaluation default value of the specific user for the specific target item using the correlation coefficient obtained in step (2); ,
Comparison means has a step (4) for comparing the evaluation prediction value corresponding to the evaluation default values obtained in the evaluation data and the step of reality the specific user with respect to the specific target item (3) ,
Steps (2) to (4) are executed by changing an evaluation default value selected from a plurality of types of evaluation default values in the step (1), and the actual user's actuality for the specific target item is executed . default value setting method in collaborative filtering you and determines the evaluation default value which gives a high evaluation prediction value of the approximation degree evaluation data as the optimum evaluation default value.
前記ステップ(4)は、前記評価デフォルト値に対応する評価予測値と現実の評価データとの絶対偏差を求めるステップを含み、前記最適なデフォルト値として、前記絶対偏差を最も小さくする評価予測値を与える評価デフォルト値決定されることを特徴とする請求項2に記載の協調的フィルタリングにおけるデフォルト値設定方法。Step (4) includes the step asking you to absolute deviation between the evaluation prediction value and the actual evaluation data corresponding to the evaluation default value, the optimum as a default value, before Symbol absolute deviation smallest evaluate predict default value setting method in collaborative filtering according to claim 2 is determined evaluation default value which gives the values, characterized in Rukoto. 複数の対象アイテムそれぞれに対する複数の利用者それぞれの評価データを保存する評価データ保存手段と、
前記評価データに基づき、前記複数の利用者それぞれの評価平均値を求める平均値演算手段と、
前記複数の対象アイテムそれぞれに対する前記複数の利用者それぞれの未評価アイテムに対して複数種の評価デフォルト値の1つを設定する評価デフォルト値設定手段と、
前記任意の利用者二者間の前記評価データ及び評価デフォルト値に基づいて当該二者をメンバーとする両者間の相関係数を計算する相関係数演算手段と、
前記評価デフォルト値設定手段が複数種の評価デフォルト値の中から設定する評価デフォルト値を変更して前記相関係数演算手段に前記相関係数を計算させる評価デフォルト値変更手段と、
前記任意の利用者の特定の対象アイテムに関して、前記複数の利用者それぞれの評価データと評価平均値と前記評価デフォルト値変更手段及び前記評価デフォルト値設定手段による複数種の評価デフォルト値、及び当該利用者を一方のメンバーとする前記相関係数を用いて、複数種の評価デフォルト値毎の評価データの予測演算を行う評価予測値演算手段とを備えて成る協調的フィルタリングにおけるデフォルト値設定システム。
Evaluation data storage means for storing evaluation data of each of a plurality of users for each of a plurality of target items;
Based on the evaluation data, average value calculating means for obtaining an average evaluation value for each of the plurality of users;
An evaluation default value setting means for setting one of a plurality of types of evaluation default values for each unevaluated item of each of the plurality of users for each of the plurality of target items;
Correlation coefficient calculation means for calculating a correlation coefficient between the two users based on the evaluation data and the evaluation default value between the two arbitrary users,
An evaluation default value changing means for causing the correlation coefficient calculating means to calculate the correlation coefficient by changing an evaluation default value set by the evaluation default value setting means from a plurality of types of evaluation default values ;
With respect to the specific target item of the arbitrary user, the evaluation data, the evaluation average value, the evaluation default value changing unit, the evaluation default value setting unit, and the plurality of types of evaluation default values of the plurality of users, and the use A default value setting system in collaborative filtering, comprising: an evaluation prediction value calculation means for performing prediction calculation of evaluation data for each of a plurality of types of evaluation default values using the correlation coefficient with a person as one member.
複数の対象アイテムそれぞれに対する複数の利用者それぞれの評価データを保存する評価データ保存手段と、
前記評価データに基づき、前記複数の利用者それぞれの評価平均値を求める平均値演算手段と、
前記複数の対象アイテムそれぞれに対する前記複数の利用者それぞれの未評価アイテムに対して複数種の評価デフォルト値の1つを設定する評価デフォルト値設定手段と、
前記任意の利用者二者間の前記評価データ及び評価デフォルト値に基づいて当該二者をメンバーとする両者間の相関係数を計算する相関係数演算手段と、
前記評価デフォルト値設定手段が複数種の評価デフォルト値の中から設定する評価デフォルト値を変更して前記相関係数演算手段に前記相関係数を計算させる評価デフォルト値変更手段と、
前記任意の利用者の特定の対象アイテムに関して、前記複数の利用者それぞれの評価データと評価平均値と前記評価デフォルト値変更手段及び前記評価デフォルト値設定手段による複数種の評価デフォルト値、及び当該利用者を一方のメンバーとする前記相関係数を用いて、複数種の評価デフォルト値毎の評価データの予測演算を行う評価予測値演算手段と、
前記特定の対象アイテムに対する現実の評価データと前記評価予測値演算手段の算出した複数種のデフォルト値それぞれに対する評価予測値とを比較する比較手段とを備えて成る協調的フィルタリングにおけるデフォルト値設定システム。
Evaluation data storage means for storing evaluation data of each of a plurality of users for each of a plurality of target items;
Based on the evaluation data, average value calculating means for obtaining an average evaluation value for each of the plurality of users;
An evaluation default value setting means for setting one of a plurality of types of evaluation default values for each unevaluated item of each of the plurality of users for each of the plurality of target items;
Correlation coefficient calculation means for calculating a correlation coefficient between the two users based on the evaluation data and the evaluation default value between the two arbitrary users,
An evaluation default value changing means for causing the correlation coefficient calculating means to calculate the correlation coefficient by changing an evaluation default value set by the evaluation default value setting means from a plurality of types of evaluation default values ;
With respect to the specific target item of the arbitrary user, the evaluation data, the evaluation average value, the evaluation default value changing unit, the evaluation default value setting unit, and the plurality of types of evaluation default values of the plurality of users, and the use Evaluation predicted value calculation means for performing prediction calculation of evaluation data for each of a plurality of types of evaluation default values, using the correlation coefficient with a person as one member;
A default value setting system in collaborative filtering, comprising: comparison means for comparing actual evaluation data for the specific target item and evaluation prediction values for each of a plurality of types of default values calculated by the evaluation prediction value calculation means.
前記比較手段は、前記評価デフォルト値に対応する評価予測値と現実の評価データとの絶対偏差を求め、当該絶対偏差を最も小さくする評価予測値を与える評価デフォルト値を最適なものと決定することを特徴とする請求項5に記載の協調的フィルタリングにおけるデフォルト値設定システム。The comparison means obtains an absolute deviation between an evaluation predicted value corresponding to the evaluation default value and actual evaluation data, and determines an evaluation default value giving an evaluation predicted value that minimizes the absolute deviation as an optimum value. The default value setting system in collaborative filtering according to claim 5. ランク設定手段が、既存の評価データ群を所定の指標に従って複数群にランク分けするステップ(1)と、
評価予測値演算手段が、ステップ(1)でランク分けされたそれぞれのランク又は全体での既存の評価データの平均値を求め、未評価のアイテムに対して複数種の評価デフォルト値の1つを設定し、特定の利用者の評価データと他の利用者の評価データとの二者間の相関係数を演算し、特定の対象アイテムについての特定の利用者の評価予測値を求めるステップ(2)と、
評価デフォルト値変更手段が、前記ステップ(2)で複数種の評価デフォルト値の中から設定する評価デフォルト値を変更して前記ステップ(2)の演算を繰り返させるステップ(3)と、
評価手段が、既存の評価データと、複数種の評価デフォルト値それぞれを用いて評価予測を行った場合の評価予測値それぞれとを比較し、絶対偏差を最小にする評価予測値を与える評価デフォルト値をランク毎に求めるステップ(4)と、
最適評価予測値算出手段が、同種の対象アイテムに対して協調的フィルタリングを行う際に、対象とするそれぞれのアイテムについて、既存の評価データ群が属するランクに対してステップ(4)で求めた最適な評価デフォルト値をそのアイテムに対する最適な評価デフォルト値として採用し、特定のアイテムに対する評価予測値を求めるステップ(5)とから成る協調的フィルタリングにおけるデフォルト値設定方法。
The rank setting means ranks the existing evaluation data group into a plurality of groups according to a predetermined index;
The evaluation predicted value calculation means obtains an average value of the existing evaluation data in each rank or the entire rank ranked in step (1), and calculates one of a plurality of evaluation default values for the unevaluated item. A step of calculating a correlation coefficient between the two of the evaluation data of the specific user and the evaluation data of the other user, and obtaining a predicted evaluation value of the specific user for the specific target item (2 )When,
Evaluation change_default means, and repeatedly causes the step of calculation of the change evaluation default values set from among the plurality of types of evaluation default value in step (2) Step (2) (3),
The evaluation means compares the existing evaluation data with each of the evaluation prediction values when the evaluation prediction is performed using each of the plural types of evaluation default values, and gives an evaluation default value that minimizes the absolute deviation. (4) for each rank,
When the optimal evaluation predicted value calculation means performs collaborative filtering on the same type of target item, the optimum obtained in step (4) for the rank to which the existing evaluation data group belongs for each target item A default value setting method in collaborative filtering comprising the step (5) of adopting a default evaluation default value as an optimal evaluation default value for the item and obtaining a predicted evaluation value for the specific item.
複数の対象アイテムそれぞれに対する複数の利用者それぞれの評価データを保存する評価データ保存手段と、
前記評価データ保存手段に保存されている評価データに対し、所定の指標に従って複数種のランクにランク分けするランク設定手段と、
前記評価データ保存手段に保存されている評価データに基づき、前記ランク設定手段により設定された複数種のランクの1つに属する評価データ又は全評価データの平均値を求める平均値演算手段と、
複数の対象アイテムそれぞれに対する複数の利用者それぞれの未評価アイテムに対して複数種の評価デフォルト値の1つを設定するデフォルト値設定手段と、
指定された任意の利用者二者間の評価データ及び評価デフォルト値に基づいて当該二者をメンバーとする両者間の相関係数を計算する相関係数演算手段と、
前記評価デフォルト値設定手段が複数種の評価デフォルト値の中から設定する評価デフォルト値を変更して前記相関係数演算手段に前記相関係数を計算させる評価デフォルト値変更手段と、
指定された任意の利用者の特定の対象アイテムに関して、複数の利用者それぞれの評価データと評価平均値と前記評価デフォルト値変更手段及び前記評価デフォルト値設定手段による複数種の評価デフォルト値、及び当該利用者を一方のメンバーとする相関係数を用いて、複数種の評価デフォルト値毎の評価予測値を算出する評価予測値演算手段と、
特定の対象アイテムに対する現実の評価データと評価予測値演算手段の算出した複数種のデフォルト値それぞれに対する評価予測値とを比較し、絶対偏差を最小とする評価予測値に対応する評価デフォルト値を該当するランクにおける最適な評価デフォルト値と決定する評価手段と、
前記評価手段が最適な評価デフォルト値と決定した評価デフォルト値をそれに対応するランクと対照させた形で保持するランク別デフォルト値データ保持手段と、
同種の対象アイテムに対して協調的フィルタリングを行う際に、対象とするそれぞれのアイテムについて、既存の評価データ群をランク付けし、前記デフォルト値設定手段により、当該ランクに対する最適な評価デフォルト値を前記ランク別デフォルト値データ保持手段から読み出して対象アイテムに対する最適な評価デフォルト値として採用し、全対象アイテムのうちの未評価のアイテムに対して設定させ、前記相関係数演算手段により、指定された任意の利用者二者間の評価データ及び評価デフォルト値に基づいて当該二者をメンバーとする両者間の相関係数を計算させ、前記評価予測値演算手段により、指定された任意の利用者の特定の対象アイテムに関して、最適な評価デフォルト値による評価予測値を算出させる最適評価予測値算出手段とを備えて成る協調的フィルタリングにおけるデフォルト値設定システム。
Evaluation data storage means for storing evaluation data of each of a plurality of users for each of a plurality of target items;
Rank setting means for ranking the evaluation data stored in the evaluation data storage means into a plurality of ranks according to a predetermined index;
Based on the evaluation data stored in the evaluation data storage means, average value calculation means for obtaining an average value of evaluation data belonging to one of a plurality of types of ranks set by the rank setting means or all evaluation data;
A default value setting means for setting one of a plurality of types of evaluation default values for each of valuated items of a plurality of users for each of a plurality of target items;
Correlation coefficient calculating means for calculating a correlation coefficient between the two members who are members based on the evaluation data and the evaluation default value between any two specified users,
An evaluation default value changing means for causing the correlation coefficient calculating means to calculate the correlation coefficient by changing an evaluation default value set by the evaluation default value setting means from a plurality of types of evaluation default values ;
With respect to a specific target item of an arbitrary user specified, a plurality of types of evaluation default values by the evaluation data, evaluation average value, evaluation default value changing means and evaluation default value setting means of each of a plurality of users, and An evaluation predicted value calculation means for calculating an evaluation predicted value for each of a plurality of types of evaluation default values using a correlation coefficient with a user as one member;
Compares the actual evaluation data for a specific target item with the evaluation prediction values for each of the multiple types of default values calculated by the evaluation prediction value calculation means, and applies the evaluation default value corresponding to the evaluation prediction value that minimizes the absolute deviation An optimal evaluation default value in the rank to be determined and an evaluation means for determining;
Rank-specific default value data holding means for holding the evaluation default value determined by the evaluation means as an optimum evaluation default value in a form contrasted with the corresponding rank;
When performing collaborative filtering on the same type of target item, rank the existing evaluation data group for each target item, and the default value setting means determines the optimal evaluation default value for the rank. It is read from the rank-specific default value data holding means, adopted as the optimum evaluation default value for the target item, set for unevaluated items among all target items, and specified by the correlation coefficient calculating means. Based on the evaluation data and the evaluation default value between the two users, the correlation coefficient between the two members is calculated, and the specified predicted user is identified by the evaluation predicted value calculation means Optimal evaluation prediction value calculation that calculates the evaluation prediction value by the optimal evaluation default value for the target item of Default value setting system in collaborative filtering comprising a means.
JP2001060704A 2001-03-05 2001-03-05 Default value setting method and system in collaborative filtering Expired - Fee Related JP3832720B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001060704A JP3832720B2 (en) 2001-03-05 2001-03-05 Default value setting method and system in collaborative filtering

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001060704A JP3832720B2 (en) 2001-03-05 2001-03-05 Default value setting method and system in collaborative filtering

Publications (2)

Publication Number Publication Date
JP2002259438A JP2002259438A (en) 2002-09-13
JP3832720B2 true JP3832720B2 (en) 2006-10-11

Family

ID=18920090

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001060704A Expired - Fee Related JP3832720B2 (en) 2001-03-05 2001-03-05 Default value setting method and system in collaborative filtering

Country Status (1)

Country Link
JP (1) JP3832720B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8244721B2 (en) * 2008-02-13 2012-08-14 Microsoft Corporation Using related users data to enhance web search
EP3480766A1 (en) * 2015-04-23 2019-05-08 Rovi Guides, Inc. Systems and methods for improving accuracy in media asset recommendation models
WO2016191959A1 (en) * 2015-05-29 2016-12-08 深圳市汇游智慧旅游网络有限公司 Time-varying collaborative filtering recommendation method

Also Published As

Publication number Publication date
JP2002259438A (en) 2002-09-13

Similar Documents

Publication Publication Date Title
KR101030653B1 (en) User-based collaborative filtering recommender system amending similarity using information entropy
KR101062927B1 (en) Method, system and computer-readable recording medium for recommending other users or objects by considering at least one user&#39;s preference
JP2800769B2 (en) Information filtering method
JP5533880B2 (en) Content recommendation system, recommendation method and recommendation program
WO1997002537A1 (en) Method and apparatus for item recommendation using automated collaborative filtering
JP2005530255A (en) Method and apparatus for applying adaptive stereotype profiles to recommend items of interest to users
US8510235B2 (en) Information processing apparatus, information processing method, and program
JP2005509964A (en) Method and apparatus for recommending items of interest based on selected third party preferences
KR20100086676A (en) Method and apparatus of predicting preference rating for contents, and method and apparatus for selecting sample contents
JP2013029872A (en) Information recommendation system, method, and program
CN106951527B (en) Song recommendation method and device
KR101725510B1 (en) Method and apparatus for recommendation of social event based on users preference
US9325754B2 (en) Information processing device and information processing method
KR20150113644A (en) Method for selecting recommendation type in product recommeding system
KR101143508B1 (en) Method For Personalized Multi Recommendation Learning
AU2008362901B2 (en) Method and apparatus for default rating estimation
Liu et al. Document recommendations based on knowledge flows: A hybrid of personalized and group‐based approaches
JP3832720B2 (en) Default value setting method and system in collaborative filtering
KR20200080355A (en) Recipe Recommendation System using Big Data
Guan et al. Preference of online users and personalized recommendations
JPH11184872A (en) Retrieval support system for multi-attribute data group
Geng et al. Multi-criteria recommender systems based on multi-objective hydrologic cycle optimization
CN106055665B (en) Context-aware Web service recommendation method and system based on abnormal value elimination
Kowald et al. The unfairness of popularity bias in music recommendation: A reproducibility study
JP2000132557A (en) Retrieval system, and computer-readable recording medium recording program of the retrieval system

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060419

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060613

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060712

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060713

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120728

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees