CN105005582A - 多媒体信息的推荐方法及装置 - Google Patents

多媒体信息的推荐方法及装置 Download PDF

Info

Publication number
CN105005582A
CN105005582A CN201510337705.7A CN201510337705A CN105005582A CN 105005582 A CN105005582 A CN 105005582A CN 201510337705 A CN201510337705 A CN 201510337705A CN 105005582 A CN105005582 A CN 105005582A
Authority
CN
China
Prior art keywords
multimedia
user
classification
class object
score value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510337705.7A
Other languages
English (en)
Other versions
CN105005582B (zh
Inventor
肖磊
刘大鹏
罗川江
赵丽丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Tencent Computer Systems Co Ltd
Original Assignee
Shenzhen Tencent Computer Systems Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Tencent Computer Systems Co Ltd filed Critical Shenzhen Tencent Computer Systems Co Ltd
Priority to CN201510337705.7A priority Critical patent/CN105005582B/zh
Publication of CN105005582A publication Critical patent/CN105005582A/zh
Application granted granted Critical
Publication of CN105005582B publication Critical patent/CN105005582B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种多媒体信息的推荐方法及装置,属于互联网技术领域。包括:根据第一用户对多媒体信息的历史点击行为确定第一用户感兴趣的第一多媒体类目;根据第一用户的各个第一多媒体类目及多个第二用户对多媒体信息的历史点击行为确定第一用户历史未点击的潜在感兴趣的第二多媒体类目;根据第一用户感兴趣的第一多媒体类目和第一用户潜在感兴趣的第二多媒体类目确定目标多媒体类目;推荐目标多媒体类目的多媒体信息。本发明在推荐信息时,除根据第一用户历史已点击的多媒体信息所属的多媒体类目实现外,还根据第一用户潜在感兴趣的多媒体类目实现,使确定的目标多媒体类目更准确,不仅能提高推荐的多媒体信息的点击率,且能节省资源和财力。

Description

多媒体信息的推荐方法及装置
技术领域
本发明涉及互联网技术领域,特别涉及一种多媒体信息的推荐方法及装置。
背景技术
随着市场经济的迅猛增长,市场竞争越来越激烈。各商家为了更好地推广自己的产品或服务,通常会制作与自己的产品或服务相关的多媒体信息,并通过各种公共平台向用户推荐这些多媒体信息。当公共平台所推荐的多媒体信息正好满足用户需求时,能够增加产品或服务的成交率,从而能够增加商家的收入。在此种场景下,如何向用户推荐其感兴趣或者与其需求相关的多媒体信息显得十分重要。
现有技术中,在推荐多媒体信息时,公共平台会对用户最近一段时间内所点击的多媒体信息进行分析,得到用户感兴趣的多媒体信息所属的多媒体类目,并推荐这些多媒体类目的多媒体信息。
在实现本发明的过程中,发明人发现相关技术至少存在以下问题:
在现有技术中,是直接根据用户最近一段时间内点击的多媒体类目来确定用户感兴趣的多媒体类目,而最近一段时间内点击的多媒体类目由于数据量小或可能存在偶然性等原因,可能不能涵盖用户感兴趣的多媒体类目,从而具有一定的局限性,导致通过这种方式确定的用户感兴趣的多媒体类目不够准确,进而使得当推荐这些多媒体类目的多媒体信息时,很多时候推荐的多媒体信息不能引起用户注意,进而导致推荐的多媒体信息针对性不强,而且导致推荐的多媒体信息的点击率不高,从而导致浪费资源和财力。
发明内容
为了解决现有技术的问题,本发明实施例提供了一种多媒体信息的推荐方法及装置。所述技术方案如下:
第一方面,提供了一种多媒体信息的推荐方法,所述方法包括:
根据第一用户对多媒体信息的历史点击行为,确定所述第一用户感兴趣的第一多媒体类目,所述第一多媒体类目为用户历史点击的多媒体信息所属类目;
根据所述第一用户的各个第一多媒体类目及多个第二用户对多媒体信息的历史点击行为,确定所述第一用户潜在感兴趣的第二多媒体类目,所述第二多媒体类目为用户历史未点击的多媒体信息所属类目;
根据所述第一用户感兴趣的第一多媒体类目和所述第一用户潜在感兴趣的第二多媒体类目,确定目标多媒体类目;
向所述第一用户推荐所述目标多媒体类目的多媒体信息。
第二方面,提供了一种多媒体信息的推荐装置,所述装置包括:
第一确定模块,用于根据第一用户对多媒体信息的历史点击行为,确定所述第一用户感兴趣的第一多媒体类目,所述第一多媒体类目为用户历史点击的多媒体信息所属类目;
第二确定模块,用于根据所述第一用户的各个第一多媒体类目及多个第二用户对多媒体信息的历史点击行为,确定所述第一用户潜在感兴趣的第二多媒体类目,所述第二多媒体类目为用户历史未点击的多媒体信息所属类目;
第三确定模块,用于根据所述第一用户感兴趣的第一多媒体类目和所述第一用户潜在感兴趣的第二多媒体类目,确定目标多媒体类目;
推荐模块,用于向所述第一用户推荐所述目标多媒体类目的多媒体信息。
本发明实施例提供的技术方案带来的有益效果是:
通过确定第一用户感兴趣的第一多媒体类目,并确定第一用户历史未点击的潜在感兴趣的第二多媒体类目,从而根据第一用户感兴趣的第一多媒体类目及第一用户潜在感兴趣的第二类目确定目标多媒体类目,使得在推荐多媒体信息时,除了根据第一用户历史已点击的多媒体信息所属的多媒体类目实现外,还根据第一用户潜在感兴趣的多媒体类目实现,确定的目标多媒体类目更准确,从而使得所推荐的目标多媒体类目的多媒体信息能够充分引起用户注意,不仅能够提高推荐的多媒体信息的点击率,使得推荐的多媒体信息更具针对性,而且能节省资源和财力。另外,当目标多媒体类目包括第一用户潜在感兴趣的任一第二多媒体类目时,由于第一用户历史未点击该第二多媒体类目,因此,推荐的多媒体信息对第一用户具有一定的新鲜度。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明另一实施例提供的一种多媒体信息的推荐方法的流程图;
图2是本发明另一实施例提供的一种多媒体信息的推荐方法的流程图;
图3是本发明另一实施例提供的一种确定目标多媒体类目的过程示意图;
图4是本发明另一实施例提供的一种多媒体信息的推荐装置的结构示意图;
图5是本发明另一实施例提供的一种服务器的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
图1是根据一示例性实施例提供的一种多媒体信息的推荐方法的流程图。参见图1,本发明实施例提供的方法流程包括:
101、根据第一用户对多媒体信息的历史点击行为,确定第一用户感兴趣的第一多媒体类目,其中,第一多媒体类目为用户历史点击的多媒体信息所属类目。
102、根据第一用户的各个第一多媒体类目及多个第二用户对多媒体信息的历史点击行为,确定第一用户潜在感兴趣的第二多媒体类目,其中,第二多媒体类目为用户历史未点击的多媒体信息所属类目。
103、根据第一用户感兴趣的第一多媒体类目和第一用户潜在感兴趣的第二多媒体类目,确定目标多媒体类目。
104、向第一用户推荐目标多媒体类目的多媒体信息。
本发明实施例提供的方法,通过确定第一用户感兴趣的第一多媒体类目,并确定第一用户历史未点击的潜在感兴趣的第二多媒体类目,从而根据第一用户感兴趣的第一多媒体类目及第一用户潜在感兴趣的第二类目确定目标多媒体类目,使得在推荐多媒体信息时,除了根据第一用户历史已点击的多媒体信息所属的多媒体类目实现外,还根据第一用户潜在感兴趣的多媒体类目实现,确定的目标多媒体类目更准确,从而使得所推荐的目标多媒体类目的多媒体信息能够充分引起用户注意,不仅能够提高推荐的多媒体信息的点击率,使得推荐的多媒体信息更具针对性,而且能节省资源和财力。另外,当目标多媒体类目包括第一用户潜在感兴趣的任一第二多媒体类目时,由于第一用户历史未点击该第二多媒体类目,因此,推荐的多媒体信息对第一用户具有一定的新鲜度。
在另一个实施例中,根据第一用户对多媒体信息的历史点击行为,确定第一用户感兴趣的第一多媒体类目,包括:
根据第一用户对多媒体信息的历史点击行为,确定第一用户的各个第一多媒体类目的兴趣分值;
根据第一用户的各个第一多媒体类目的兴趣分值,确定第一用户感兴趣的第一多媒体类目;
根据第一用户的各个第一多媒体类目及多个第二用户对多媒体信息的历史点击行为,确定第一用户潜在感兴趣的第二多媒体类目,包括:
根据第一用户的各个第一多媒体类目的兴趣分值及多个第二用户对多媒体信息的历史点击行为,确定第一用户的各个第二多媒体类目的兴趣分值;
根据第一用户的各个第二多媒体类目的兴趣分值,确定第一用户潜在感兴趣的第二多媒体类目;
根据第一用户感兴趣的第一多媒体类目和第一用户潜在感兴趣的第二多媒体类目,确定目标多媒体类目,包括:
根据第一用户感兴趣的第一多媒体类目的兴趣分值及第一用户潜在感兴趣的第二多媒体类目的兴趣分值,确定向第一用户推荐的目标多媒体类目。
在另一个实施例中,根据第一用户对多媒体信息的历史点击行为,确定第一用户的各个第一多媒体类目的兴趣分值,包括:
当将第一用户的任一第一多媒体类目作为指定第一多媒体类目时,对于指定第一多媒体类目,根据第一用户对多媒体信息的历史点击行为,确定第一用户点击指定第一多媒体类目的次数为第一次数;
根据第一用户对多媒体信息的历史点击行为,确定第一用户点击所有多媒体类目的次数之和为第二次数;
获取点击指定第一多媒体类目的用户数量以及所有用户数量;
根据第一次数、第二次数、用户数量及所有用户数量,确定指定第一多媒体类目的兴趣分值。
在另一个实施例中,根据第一次数、第二次数、用户数量及所有用户数量,确定指定第一多媒体类目的兴趣分值,包括:
根据第一次数、第二次数、用户数量及所有用户数量,通过如下公式确定指定第一多媒体类目的兴趣分值:
TF 1 = CK i , j Σ j = 1 n CK i , j
IDF 1 = log N N j
S1=TF1×IDF1
式中,j表示指定第一多媒体类目,i表示第一用户,CKi,j为第一用户i点击指定第一多媒体类目j的第一次数,n为所有多媒体类目的数量,表示第一用户i点击所有多媒体类目的第二次数,Nj为点击指定第一多媒体类目j的用户数量,N为所有用户数量,S1为指定第一多媒体类目j的兴趣分值。
在另一个实施例中,根据第一用户对多媒体信息的历史点击行为,确定第一用户的各个第一多媒体类目的兴趣分值,包括:
当将第一用户任一第一多媒体类目作为指定第一多媒体类目时,对于指定第一多媒体类目,根据第一用户对多媒体信息的历史点击行为,确定第一用户点击指定第一多媒体类目的次数为第一次数;
根据第一用户对多媒体信息的历史点击行为,确定第一用户点击所有多媒体类目的次数之和为第二次数;
获取点击指定第一多媒体类目的用户数量以及所有用户数量;
根据第一用户点击指定第一多媒体类目的时刻,确定指定第一多媒体类目的权重;
根据第一次数、第二次数、用户数量、所有用户数量及指定第一多媒体类目的权重,确定指定第一多媒体类目的兴趣分值。
在另一个实施例中,根据第一用户点击指定第一多媒体类目的时刻,确定指定第一多媒体类目的权重,包括:
根据第一用户点击指定第一多媒体类目的时刻,通过如下公式确定指定第一多媒体类目的权重:
w j = 1 1 + e - t
式中,t表示第一用户点击指定第一多媒体类目j的时刻与当前时刻之间的差值;
根据第一次数、第二次数、用户数量、所有用户数量及指定第一多媒体类目的权重,确定指定第一多媒体类目的兴趣分值,包括:
根据第一次数、第二次数、用户数量、所有用户数量及指定第一多媒体类目的权重,通过如下公式确定指定第一多媒体类目的兴趣分值:
TF 2 = CK i , j × w j Σ j = 1 n ( CK i , j × w j )
IDF 2 = log N N j
S2=TF2×IDF2
式中,j表示指定第一多媒体类目,i表示第一用户,CKi,j为第一用户i点击指定第一多媒体类目j的第一次数,n为所有多媒体类目的数量,表示第一用户i点击所有多媒体类目的第二次数,Nj为点击指定第一多媒体类目j的用户数量,N为所有用户数量,wj为指定第一多媒体类目j的权重,S2为指定第一多媒体类目j的兴趣分值。
在另一个实施例中,根据第一用户的各个第一多媒体类目的兴趣分值及多个第二用户对多媒体信息的历史点击行为,确定第一用户的各个第二多媒体类目的兴趣分值,包括:
对于任一第二用户,根据第二用户对多媒体信息的历史点击行为,确定第二用户的各个第一多媒体类目的兴趣分值;
根据第一用户的各个第一多媒体类目的兴趣分值及第二用户的各个第一多媒体类目的兴趣分值,确定第一用户与第二用户在点击多媒体信息时的第一相关度;
从所有第二用户中选择第一数值的目标第二用户,其中,任一目标第二用户与第一用户在点击多媒体信息时的第一相关度满足第一指定条件;
当将第一用户的任一第二多媒体类目作为指定第二多媒体类目时,对于指定第二多媒体类目,根据第一用户的各个第一多媒体类目的兴趣分值、每个目标第二用户的各个第一多媒体类目的兴趣分值及第一用户与每个目标第二用户之间的第一相关度,确定指定第二多媒体类目的兴趣分值。
在另一个实施例中,根据第一用户的各个第一多媒体类目的兴趣分值及第二用户的各个第一多媒体类目的兴趣分值,确定第一用户与第二用户在点击多媒体信息时的第一相关度,包括:
根据第一用户的各个第一多媒体类目的兴趣分值及第二用户的各个第一多媒体类目的兴趣分值,通过如下公式确定第一用户与第二用户在点击多媒体信息时的第一相关度:
sim ( i , y ) = Σ k = 1 m ( r i , k - r i ‾ ) ( r y , k - r y ‾ ) Σ k = 1 m ( r i , k - r i ‾ ) 2 Σ k = 1 m ( r y , k - r y ‾ ) 2
式中,i为第一用户,y为任一第二用户,m为第一用户i的第一多媒体类目中与第二用户y的第一多媒体类目中共有多媒体类目的数量,k为第一用户的第一多媒体类目和第二用户的第一多媒体类目中共有的任一多媒体类目,ri,k为第一用户i的第一多媒体类目k的兴趣分值,ry,k为第二用户y的第一多媒体类目k的兴趣分值,为第一用户i的所有第一多媒体类目的兴趣分值平均值,为第二用户y的所有第一多媒体类目的兴趣分值平均值;
根据第一用户的各个第一多媒体类目的兴趣分值、每个目标第二用户的各个第一多媒体类目的兴趣分值及第一用户与每个目标第二用户之间的第一相关度,确定指定第二多媒体类目的兴趣分值,包括:
根据第一用户的各个第一多媒体类目的兴趣分值、每个目标第二用户的各个第一多媒体类目的兴趣分值及第一用户与每个目标第二用户之间的第一相关度,通过如下公式确定指定第二多媒体类目的兴趣分值:
r i , h = r i ‾ + Σ u ′ ∈ U sim ( i , u ′ ) ( r u ′ , h - r u ′ ‾ ) Σ u ′ ∈ U sim ( i , u ′ )
式中,U为目标第二用户的集合,u'为任一目标第二用户,h为指定第二多媒体类目,ri,h为指定第二多媒体类目h的兴趣分值,sim(i,u')为第一用户i与目标第二用户u'之间的第一相关度,ru',h为目标第二用户u'的第一多媒体类目h的兴趣分值,为目标第二用户u'的所有第一多媒体类目的兴趣分值平均值。
在另一个实施例中,根据第一用户的各个第一多媒体类目的兴趣分值及多个第二用户对多媒体信息的历史点击行为,确定第一用户的各个第二多媒体类目的兴趣分值,包括:
根据每个第二用户对多媒体信息的历史点击行为,确定每个第二用户的各个第一多媒体类目的兴趣分值;
根据第一用户的各个第一多媒体类目的兴趣分值及所有第二用户的各个第一多媒体类目的兴趣分值,确定所有多媒体类目中任两个多媒体类目之间的第二相关度;
当将第一用户的任一第二多媒体类目作为指定第二多媒体类目时,对于指定第二多媒体类目,从第一用户的所有第一多媒体类目中选择第二数值的目标第一多媒体类目,其中,任一目标第一多媒体类目与指定第二多媒体类目之间的第二相关度满足第二指定条件;
根据各个目标第一多媒体类目的兴趣分值、各个目标第一多媒体类目与指定第二多媒体类目之间的第二相关度及所有第二用户对指定第二多媒体类目的兴趣分值,确定指定第二多媒体类目的兴趣分值。
在另一个实施例中,根据第一用户的各个第一多媒体类目的兴趣分值及所有第二用户的各个第一多媒体类目的兴趣分值,确定所有多媒体类目中任两个多媒体类目之间的第二相关度,包括:
对于任两个多媒体类目,根据第一用户的各个第一多媒体类目的兴趣分值及所有第二用户的各个第一多媒体类目的兴趣分值,通过如下公式确定所有多媒体类目中任两个多媒体类目之间的第二相关度:
sim ( a , b ) = Σ d = 1 N ( r a , d - r a ‾ ) ( r b , d - r b ‾ ) Σ d = 1 N ( r a , d - r a ‾ ) 2 Σ d = 1 N ( r b , d - r b ‾ ) 2
式中,a为任一多媒体类目,b为与a不同的其它任一多媒体类目,N为所有用户数量,d为任一用户,ra,d为用户d的多媒体类目a的兴趣分值,为所有用户的多媒体类目a的兴趣分值平均值,rb,d为用户d的多媒体类目b的兴趣分值,为所有用户的多媒体类目b的兴趣分值平均值;
根据各个目标第一多媒体类目的兴趣分值、各个目标第一多媒体类目与指定第二多媒体类目之间的第二相关度及所有第二用户对指定第二多媒体类目的兴趣分值,确定指定第二多媒体类目的兴趣分值,包括:
根据各个目标第一多媒体类目的兴趣分值、各个目标第一多媒体类目与指定第二多媒体类目之间的第二相关度及所有第二用户对指定第二多媒体类目的兴趣分值,通过如下公式确定指定第二多媒体类目的兴趣分值:
r i , f = r f ‾ + Σ g ′ ∈ G sim ( f , g ′ ) ( r g ′ , i - r g ′ ‾ ) Σ g ′ ∈ G sim ( f , g ′ )
式中,f为指定第二多媒体类目,ri,f为指定第二多媒体类目f的兴趣分值,为所有第二用户对指定第二多媒体类目f的兴趣分值平均值,G为目标第一多媒体类目的集合,g'为任一目标第一多媒体类目,sim(f,g')为目标第一多媒体类目g'与指定第二多媒体类目f之间的第二相关度,rg',i为第一用户i的目标第一多媒体类目g'的兴趣分值,为所有第二用户对目标第一多媒体类目g'的兴趣分值平均值。
在另一个实施例中,根据第一用户对多媒体信息的历史点击行为,确定第一用户感兴趣的第一多媒体类目,包括:
根据第一用户对多媒体信息的历史点击行为,确定第一用户对第一用户的各个第一多媒体类目的点击次数;
根据第一用户对第一用户的各个第一多媒体类目的点击次数,确定第一用户感兴趣的第一多媒体类目;
根据第一用户的各个第一多媒体类目及多个第二用户对多媒体信息的历史点击行为,确定第一用户潜在感兴趣的第二多媒体类目,包括:
根据第一用户的各个第一多媒体类目及多个第二用户对多媒体信息的历史点击行为,确定任两个多媒体类目之间的第三相关度;
根据任两个多媒体类目之间的第三相关度及第一用户感兴趣的第一多媒体类目,确定第一用户潜在感兴趣的第二多媒体类目。
结合图1所对应实施例的内容,图2是根据一示例性实施例提供的一种多媒体信息的推荐方法的流程图。参见图2,本发明实施例提供的方法流程包括:
201、根据第一用户对多媒体信息的历史点击行为,确定第一用户感兴趣的第一多媒体类目,其中,第一多媒体类目为用户历史点击的多媒体信息所属类目。
第一用户为推荐多媒体信息的对象,需要推荐的多媒体信息将发送至第一用户的终端。多媒体信息可以为任何形式的信息,如多媒体信息可以为文本信息、图像信息、音频信息、图文信息或视频信息中的一种或至少两种的组合等。具体地,多媒体信息的形式包括但不限于为广告等。
本发明实施例在向第一用户推荐多媒体信息时,通过深度挖掘各个用户对多媒体信息的历史点击行为,以确定第一用户感兴趣的第一多媒体类目和第一用户潜在感兴趣的第二多媒体类目。其中,第一用户的第一多媒体类目为第一用户历史点击的多媒体信息所属的类目,因此,在推荐多媒体信息时,先根据第一用户对多媒体信息的历史点击行为确定第一用户感兴趣的第一多媒体类目。为了便于说明,在本发明实施例中,将第一用户历史已点击的某一条多媒体信息所属的多媒体类目定义为第一用户的一个第一多媒体类目。例如,如果第一用户历史已点击的某一条多媒体信息a所属的多媒体类目为多媒体类目A,则将多媒体类目A作为第一用户的一个第一多媒体类目。
历史点击行为包括用户对历史展示的多媒体信息的显性反馈点击行为和隐性反馈点击行为。显性反馈点击行为是指第一用户对历史展示的多媒体信息,直接点击喜欢或不喜欢等显性标识,进行对多媒体信息是否感兴趣的反馈。隐形反馈点击行为是指第一用户对历史展示的多媒体信息,通过点击或者不点击等行为,隐性进行对多媒体信息是否感兴趣的反馈。
具体地,根据第一用户对多媒体信息的历史点击行为,确定第一用户感兴趣的第一多媒体类目,包括但不限于有如下第一种方式和第二种方式两种实现方式:
第一种方式:通过对第一用户的各个第一多媒体类目进行打分,以确定第一用户的每个第一多媒体类目的兴趣分值,并根据第一用户的所有第一多媒体类目的兴趣分值,确定第一用户感兴趣的第一多媒体类目。具体地,该第一种方式可以通过如下步骤2011和步骤2012实现:
2011、根据第一用户对多媒体信息的历史点击行为,确定第一用户的各个第一多媒体类目的兴趣分值。
具体地,根据第一用户对多媒体信息的历史点击行为,确定第一用户的各个第一多媒体类目的兴趣分值,包括但不限于有如下第1种和第2种两种实现方式:
第1种:结合TF-IDF(Term Frequency-Inverse Document Frequency,词频-逆向文件频率)思想实现。为了便于说明,在本发明实施例中,第一用户的各个第一多媒体类目中的任一第一多媒体类目定义为指定第一多媒体类目。在该第1种方式下,在确定第一用户的各个第一多媒体类目中的任一第一多媒体类目的兴趣分值时,可以通过如下步骤2011A至步骤2011D来实现:
2011A、根据第一用户对多媒体信息的历史点击行为,确定第一用户点击指定第一多媒体类目的次数为第一次数。
其中,在向第一用户推荐信息之前,可以对第一用户历史点击的多媒体信息进行统计,并基于该统计数据确定第一用户点击每个第一多媒体类目的第一次数。具体地,对于历史推荐的多媒体信息,第一用户每对一条多媒体信息进行一次点击行为,则确定一次该多媒体信息所属的多媒体类目,并将该多媒体类目对应的点击次数增加一次。在此基础上,根据历史统计数据,即可确定第一用户点击该指定第一多媒体类目的第一次数。
例如,该指定第一多媒体类目为多媒体类目A,如果截止当前时刻之前,已统计得到第一用户点击了1000条属于多媒体类目A的多媒体信息,则第一用户点击该多媒体类目A的第一次数为1000次。
2011B、根据第一用户对多媒体信息的历史点击行为,确定第一用户点击所有多媒体类目的次数之和为第二次数。
具体地,在推荐信息之前,可以预先确定所有的多媒体类目。结合上述步骤2011A中的内容,对于第一用户的每个第一多媒体类目,均执行统计第一用户点击该多媒体类目的第一次数,即可得到第一用户历史点击的每个第一多媒体类目的第一次数。将用户点击的每个第一多媒体类目的第一次数进行叠加,即可得到第一用户点击所有多媒体类目的次数之和,即第二次数。
例如,如果所有的多媒体类目包括多媒体类目A、多媒体类目B、多媒体类目C、多媒体类目D及多媒体类目E,且基于统计数据得到,第一用户点击多媒体类目A1000次、第一用户点击多媒体类目B1500次、第一用户点击多媒体类目C1300次、第一用户点击多媒体类目E1200次,则可以确定第一用户点击所有多媒体类目的第二次数为5000。
2011C、获取点击指定第一多媒体类目的用户数量以及所有用户数量。
点击指定第一多媒体类目的用户数量为历史上点击过属于该指定第一多媒体类目的多媒体信息的用户数量之和。例如,如果历史上,有50个用户点击过属于该指定第一多媒体类目的多媒体信息,则点击指定第一多媒体类目的用户数量为50。其中,在获取点击指定第一多媒体类目的用户数量时,也可以基于统计数据实现。
所有用户数量是指所统计所有推荐信息的对象的数量。其中,获取所有用户数量时,包括但不限于根据已注册用户数量确定。例如,如果目前已有10000个用户进行了注册,则所有用户数量为10000个。
2011D、根据第一次数、第二次数、用户数量及所有用户数量,确定指定第一多媒体类目的兴趣分值。
具体地,可以根据第一次数、第二次数、用户数量及所有用户数量,通过如下公式确定指定第一多媒体类目的兴趣分值:
TF 1 = CK i , j Σ j = 1 n CK i , j
IDF 1 = log N N j
S1=TF1×IDF1
式中,j表示指定第一多媒体类目,i表示第一用户,CKi,j为第一用户i点击指定第一多媒体类目j的第一次数,n为所有多媒体类目的数量,表示第一用户i点击所有多媒体类目的第二次数,Nj为点击指定第一多媒体类目j的用户数量,N为所有用户数量,S1为指定第一多媒体类目j的兴趣分值。其中,log的底数可以为2、10或e中的任一个,本发明实施例对此不作具体限定。
对第一用户的每个多媒体类目均进行上述步骤2011A至步骤2011D,即可确定第一用户的所有第一多媒体类目的兴趣分值。
第2种:对于第一用户在不同时间点击的第一多媒体类目,分配不同的权重,并通过TF-IDF方式实现。为了便于说明,在本发明实施例中,第一用户的各个第一多媒体类目中的任一第一多媒体类目定义为指定第一多媒体类目。在该第2种方式下,在确定第一用户的各个第一多媒体类目中的任一第一多媒体类目的兴趣分值时,可以通过如下步骤2011a至步骤2011e来实现:
2011a、根据第一用户对多媒体信息的历史点击行为,确定第一用户点击指定第一多媒体类目的次数为第一次数。
2011b、根据第一用户对多媒体信息的历史点击行为,确定第一用户点击所有多媒体类目的次数之和为第二次数。
2011c、获取点击指定第一多媒体类目的用户数量以及所有用户数量。
其中,步骤2011a至步骤2011c的原理同上述步骤2011A至步骤2011C的原理一致,具体可参见上述步骤2011A至步骤2011C中的内容,此处不再赘述。
2011d、根据第一用户点击指定第一多媒体类目的时刻,确定指定第一多媒体类目的权重。
具体地,可以根据第一用户点击指定第一多媒体类目的时刻,通过如下公式确定指定第一多媒体类目的权重:
w j = 1 1 + e - t
式中,t表示第一用户点击指定第一多媒体类目j的时刻与当前时刻之间的差值。
需要说明的是,在确定第一用户点击指定第一多媒体类目的时刻与当前时刻之间的差值t时,需要结合预设时间窗口T的单位实现。
例如,如果预设时间窗口T的单位为月份,则T=12,此时,第一用户点击指定第一多媒体类目的时刻与当前时刻之间的差值为:第一用户点击指定多媒体类目的月份与当前月份之间的差值。如,第一用户点击指定多媒体类目j的月份为2015年1月,当前月份为2015年5月,则t=4。
又例如,如果预设时间窗口T的单位为天,则T=365,此时,第一用户点击指定第一多媒体类目的时刻与当前时刻之间的差值为:第一用户点击指定多媒体类目的日期与当前日期之间的差值。如,第一用户点击指定多媒体类目j的日期为2015年1月1日,当前日期为2015年3月1日,则t=59。
2011e、根据第一次数、第二次数、用户数量、所有用户数量及指定第一多媒体类目的权重,确定指定第一多媒体类目的兴趣分值。
关于根据第一次数、第二次数、用户数量、所有用户数量及指定第一多媒体类目的权重,确定指定第一多媒体类目的兴趣分值的方式,本发明实施例不作具体限定。具体实施时,包括但不限于通过如下公式实现:
TF 2 = CK i , j × w j Σ j = 1 n ( CK i , j × w j )
IDF 2 = log N N j
S2=TF2×IDF2
式中,j表示指定第一多媒体类目,i表示第一用户,CKi,j为第一用户i点击指定第一多媒体类目j的第一次数,n为所有多媒体类目的数量,表示第一用户i点击所有多媒体类目的第二次数,Nj为点击指定第一多媒体类目j的用户数量,N为所有用户数量,wj为指定第一多媒体类目j的权重,S2为指定第一多媒体类目j的兴趣分值。
对第一用户的每个第一多媒体类目均进行上述步骤2011a至步骤2011e,即可确定第一用户的所有第一多媒体类目的兴趣分值。
通过该第2种方式确定第一用户的各个第一多媒体类目的兴趣分值时,可以根据第一用户点击第一多媒体类目的时刻,为不同时刻点击的第一多媒体类目分配不同的权重。因此,通过该第2种方式确定的第一用户的各个第一多媒体类目的兴趣分值时,可以分析出第一用户感兴趣的第一多媒体类目随时间迁移的变化,使得后续确定的第一用户感兴趣的第一多媒体类目更加准确。
2012、根据第一用户的各个第一多媒体类目的兴趣分值,确定第一用户感兴趣的第一多媒体类目。
具体地,可以确定一个第一用户感兴趣的第一多媒体类目,也可以确定多个第一用户感兴趣的第一多媒体类目。关于确定的第一用户感兴趣的第一多媒体类目的数量,本发明实施例不作具体限定。
其中,在根据第一用户的各个第一多媒体类目的兴趣分值,确定第一用户感兴趣的第一多媒体类目时,可以根据第一用户的各个第一多媒体类目的兴趣分值,对第一用户的所有第一多媒体类目的兴趣分值进行排序,并根据排序结果确定第一用户感兴趣的第一多媒体类目。
在根据排序结果确定第一用户感兴趣的第一多媒体类目时,可以结合预设的第一用户感兴趣的第一多媒体类目的数量实现。具体地,可以根据排序结果,从第一用户的所有第一多媒体类目中,筛选出兴趣分值高的预设数量的多媒体类目作为第一用户感兴趣的第一多媒体类目。
第二种方式:根据第一用户对多媒体类目的点击次数确定第一用户感兴趣的第一多媒体类目。
在该第二种方式下,可以根据第一用户对多媒体信息的历史点击行为,确定第一用户对第一用户的各个第一多媒体类目的点击次数;根据第一用户对第一用户的各个第一多媒体类目的点击次数,确定第一用户感兴趣的第一多媒体类目。
具体地,第一用户每点击一条多媒体信息,则确定一次该多媒体信息所属的多媒体类目,并将该多媒体类目对应的点击次数增加一次。对于第一用户的所有第一多媒体类目均执行该操作,即可基于统计数据,确定第一用户对第一用户的各个第一多媒体类目的点击次数。
另外,在根据第一用户对第一用户的各个第一多媒体类目的点击次数,确定第一用户感兴趣的第一多媒体类目时,可以对第一用户的所有第一多媒体类目的点击次数进行排序,并根据排序结果确定第一用户感兴趣的第一多媒体类目。
具体地,在根据排序结果确定第一用户感兴趣的第一多媒体类目时,可以结合预设的第一用户感兴趣的第一多媒体类目的数量实现。具体地,可以根据排序结果,从第一用户的所有第一多媒体类目中,筛选出点击次数多的预设数量的多媒体类目作为第一用户感兴趣的第一多媒体类目。
202、根据第一用户的各个第一多媒体类目及多个第二用户对多媒体信息的历史点击行为,确定第一用户潜在感兴趣的第二多媒体类目,其中,第二多媒体类目为用户历史未点击的多媒体信息所属类目。
其中,第二用户为第一用户以外的其它用户。第一用户的第二多媒体类目为第一用户历史未点击、且为至少一个第二用户历史已点击的多媒体信息所属的类目。
为了实现准确向第一用户推荐信息,本发明实施例除通过上述步骤201确定第一用户感兴趣的第一多媒体类目外,还继续确定第一用户潜在感兴趣的第二多媒体类目。其中,第一用户潜在感兴趣的第二多媒体类目可能与第一用户的各个第一多媒体类目及多个第二用户对多媒体信息的历史点击有关,因此,需要根据第一用户的各个第一多媒体类目及多个第二用户对多媒体信息的历史点击行为,确定第一用户潜在感兴趣的第二多媒体类目。
具体地,在根据第一用户的各个第一多媒体类目及多个第二用户对多媒体信息的历史点击行为,确定第一用户潜在感兴趣的第二多媒体类目时,包括但不限于有如下第一种方式和第二种方式两种实现方式:
第一种方式:通过对第一用户的各个第二多媒体类目进行打分,以确定第一用户的每个第二多媒体类目的兴趣分值,并根据第一用户的所有第二多媒体类目的兴趣分值,确定第一用户潜在感兴趣的第二多媒体类目。具体地,该第一种方式可以通过如下步骤2021和步骤2022实现:
2021、根据第一用户的各个第一多媒体类目的兴趣分值及多个第二用户对多媒体信息的历史点击行为,确定第一用户的各个第二多媒体类目的兴趣分值。
具体地,在根据第一用户的各个第一多媒体类目的兴趣分值及多个第二用户对多媒体信息的历史点击行为,确定第一用户的各个第二多媒体类目的兴趣分值时,包括但不限于有如下第1种和第2种两种实现方式:
第1种:通过不同用户在点击多媒体信息时的相关度来实现。具体地,不同用户在点击多媒体信息时,所点击的多媒体信息所属多媒体类目之间可能存在一定的相关度。如表1所示,其示出了一种不同用户点击多媒体类目的示意表。
表1
A B C D
U1 4 2 6 3
U2 3 2 1
U3 2 1 2 2
其中,表1中的行表示各个多媒体类目,列表示各个用户,各个元素可以表示点击次数,也可以表示兴趣分值,“?”代表待推断的元素。结合表1,如果U2和U3在点击多媒体类目时,点击多媒体类目A的次数或兴趣分值比较相近,点击多媒体类目C的次数或兴趣分值比较相近,则可以推断用户U2和U3点击多媒体类目B时也具有一定的相似度。在此种情况下,如果已知用户U3点击多媒体类目B的次数或兴趣分值,则可以推断用户U2点击多媒体类目B的次数或兴趣分值。
结合上述内容,在该第1种方式下,可以通过如下步骤2021A至步骤2021D确定第一用户的各个第二多媒体类目的兴趣分值:
2021A、对于任一第二用户,根据第二用户对多媒体信息的历史点击行为,确定第二用户的各个第一多媒体类目的兴趣分值。
其中,根据第二用户对多媒体信息的历史点击行为,确定第二用户的各个第一多媒体类目的兴趣分值的方式可以与上述步骤2011中根据第一用户对多媒体信息的历史点击行为,确定第一用户的各个第一多媒体类目的兴趣分值的方式相同,具体实施时,可以参见上述步骤2011中根据第一用户对多媒体信息的历史点击行为,确定第一用户的各个第一多媒体类目的兴趣分值中的内容,此处不再赘述。
对于所有的第二用户均执行该步骤2021A,即可确定所有第二用户的各个第一多媒体类目的兴趣分值。
2021B、根据第一用户的各个第一多媒体类目的兴趣分值及第二用户的各个第一多媒体类目的兴趣分值,确定第一用户与第二用户在点击多媒体信息时的第一相关度。
具体地,可以先确定第一用户的各个第一多媒体类目与每个第二用户的各个第一多媒体类目之间所共有的第一多媒体类目,并基于该共有的第一多媒体类目,确定第一用户与第二用户在点击多媒体信息时的第一相关度。具体地,可以根据第一用户的各个第一多媒体类目的兴趣分值及第二用户的各个第一多媒体类目的兴趣分值,通过如下公式确定第一用户与第二用户在点击多媒体信息时的第一相关度:
sim ( i , y ) = Σ k = 1 m ( r i , k - r i ‾ ) ( r y , k - r y ‾ ) Σ k = 1 m ( r i , k - r i ‾ ) 2 Σ k = 1 m ( r y , k - r y ‾ ) 2
式中,i为第一用户,y为任一第二用户,m为第一用户i的第一多媒体类目中与第二用户y的第一多媒体类目中共有多媒体类目的数量,k为第一用户的第一多媒体类目和第二用户的第一多媒体类目中共有的任一多媒体类目,ri,k为第一用户i的第一多媒体类目k的兴趣分值,ry,k为第二用户y的第一多媒体类目k的兴趣分值,为第一用户i的所有第一多媒体类目的兴趣分值平均值,为第二用户y的所有第一多媒体类目的兴趣分值平均值。
需要说明的是,此处仅列举了一种确定第一用户与第二用户在点击多媒体信息时的第一相关度的方式,然而,在具体实施时,还可以通过其它方式确定第一用户与第二用户在点击多媒体信息时的第一相关度,如,可以采用cos(夹角余弦)公式等,本发明实施例不对确定第一用户与第二用户在点击多媒体信息时的第一相关度的方式进行限定。
2021C、从所有第二用户中选择第一数值的目标第二用户,其中,任一目标第二用户与第一用户在点击多媒体信息时的第一相关度满足第一指定条件。
关于第一数值的具体数值,本发明实施例不作具体限定。具体实施时。可以根据需要设定。另外,本发明实施例同样不对第一指定条件的内容进行限定,具体地,第一指定条件的内容可以与第一数值相关。例如,当第一数值为10时,目标第二用户可以为所有第二用户中,与第一用户在点击多媒体信息时的第一相关度排在前10位的第二用户。
2021D、当将第一用户的任一第二多媒体类目作为指定第二多媒体类目时,对于指定第二多媒体类目,根据第一用户的各个第一多媒体类目的兴趣分值、每个目标第二用户的各个第一多媒体类目的兴趣分值及第一用户与每个目标第二用户之间的第一相关度,确定指定第二多媒体类目的兴趣分值。
为了便于说明,本发明实施例将第一用户的任一第二多媒体类目定义为指定第二多媒体类目。对于任一指定第二多媒体类目,可以根据第一用户的各个第一多媒体类目的兴趣分值、每个目标第二用户的各个第一多媒体类目的兴趣分值及第一用户与每个目标第二用户之间的第一相关度,通过如下公式确定该指定第二多媒体类目的兴趣分值:
r i , h = r i ‾ + Σ u ′ ∈ U sim ( i , u ′ ) ( r u ′ , h - r u ′ ‾ ) Σ u ′ ∈ U sim ( i , u ′ )
式中,U为目标第二用户的集合,u'为任一目标第二用户,h为指定第二多媒体类目,ri,h为指定第二多媒体类目h的兴趣分值,sim(i,u')为第一用户i与目标第二用户u'之间的第一相关度,ru',h为目标第二用户u'的第一多媒体类目h的兴趣分值,为目标第二用户u'的所有第一多媒体类目的兴趣分值平均值。
对第一用户的每个多媒体类目均进行上述步骤2021D,即可确定第一用户的所有第二多媒体类目的兴趣分值。
第2种:通过多媒体类目之间的相关度来实现。具体地,不同多媒体类目之间可能存在一定的相关度,手机类目与手机配件类目之间存在一定的相关度,装修类目可能与家用电器之间存在一定的相关度。因此,可以通过该第2种方式来确定第一用户的各个第二多媒体类目的兴趣分值。
具体地,在该第2种方式下,可以通过如下步骤2021a至步骤2021d确定第一用户的各个第二多媒体类目的兴趣分值:
2021a、根据每个第二用户对多媒体信息的历史点击行为,确定每个第二用户的各个第一多媒体类目的兴趣分值。
其中,根据第二用户对多媒体信息的历史点击行为,确定第二用户的各个第一多媒体类目的兴趣分值的方式可以与上述步骤2011中根据第一用户对多媒体信息的历史点击行为,确定第一用户的各个第一多媒体类目的兴趣分值的方式相同,具体实施时,可以参见上述步骤2011中根据第一用户对多媒体信息的历史点击行为,确定第一用户的各个第一多媒体类目的兴趣分值中的内容,此处不再赘述。
2021b、根据第一用户的各个第一多媒体类目的兴趣分值及所有第二用户的各个第一多媒体类目的兴趣分值,确定所有多媒体类目中任两个多媒体类目之间的第二相关度。
也就是说,该步骤通过所有用户的各个第一多媒体类目,确定任两个多媒体类目之间的第二相关度。
具体地,可以根据第一用户的各个第一多媒体类目的兴趣分值及所有第二用户的各个第一多媒体类目的兴趣分值,通过如下公式确定所有多媒体类目中任两个多媒体类目之间的第二相关度:
sim ( a , b ) = Σ d = 1 N ( r a , d - r a ‾ ) ( r b , d - r b ‾ ) Σ d = 1 N ( r a , d - r a ‾ ) 2 Σ d = 1 N ( r b , d - r b ‾ ) 2
式中,a为任一多媒体类目,b为与a不同的其它任一多媒体类目,N为所有用户数量,d为任一用户,ra,d为用户d的多媒体类目a的兴趣分值,为所有用户的多媒体类目a的兴趣分值平均值,rb,d为用户d的多媒体类目b的兴趣分值,为所有用户的多媒体类目b的兴趣分值平均值。
需要说明的是,此处仅列举了一种确定任两个多媒体类目之间的第二相关度的方式,然而,在具体实施时,还可以通过其它方式确定任两个多媒体类目之间的第二相关度,如,可以采用cos(夹角余弦)公式等,本发明实施例不对确定任两个多媒体类目之间的第二相关度的方式进行限定。
对于所有的多媒体类目均执行该步骤2021b,即可得到任两个多媒体类目之间的第二相关度。
2021c、当将第一用户的任一第二多媒体类目作为指定第二多媒体类目时,对于指定第二多媒体类目,从第一用户的所有第一多媒体类目中选择第二数值的目标第一多媒体类目,其中,任一目标第一多媒体类目与指定第二多媒体类目之间的第二相关度满足第二指定条件。
关于第二数值的具体数值,本发明实施例不作具体限定。具体实施时。可以根据需要设定。另外,本发明实施例同样不对第二指定条件的内容进行限定,具体地,第二指定条件的内容可以与第二数值相关。例如,当第二数值为5时,目标第一多媒体类目可以为所有多媒体类目中,与该指定第二多媒体类目的第二相关度排在前5的第一用户的第一多媒体类目。
2021d、根据各个目标第一多媒体类目的兴趣分值、各个目标第一多媒体类目与指定第二多媒体类目之间的第二相关度及所有第二用户对指定第二多媒体类目的兴趣分值,确定指定第二多媒体类目的兴趣分值。
具体地,可以根据各个目标第一多媒体类目的兴趣分值、各个目标第一多媒体类目与指定第二多媒体类目之间的第二相关度及所有第二用户对指定第二多媒体类目的兴趣分值,通过如下公式确定指定第二多媒体类目的兴趣分值:
r i , f = r f ‾ + Σ g ′ ∈ G sim ( f , g ′ ) ( r g ′ , i - r g ′ ‾ ) Σ g ′ ∈ G sim ( f , g ′ )
式中,f为指定第二多媒体类目,ri,f为指定第二多媒体类目f的兴趣分值,为所有第二用户对指定第二多媒体类目f的兴趣分值平均值,G为目标第一多媒体类目的集合,g'为任一目标第一多媒体类目,sim(f,g')为目标第一多媒体类目g'与指定第二多媒体类目f之间的第二相关度,rg',i为第一用户i的目标第一多媒体类目g'的兴趣分值,为所有第二用户对目标第一多媒体类目g'的兴趣分值平均值。
2022、根据第一用户的各个第二多媒体类目的兴趣分值,确定第一用户潜在感兴趣的第二多媒体类目。
具体地,可以确定一个第一用户潜在感兴趣的第一多媒体类目,也可以确定多个第一用户潜在感兴趣的第一多媒体类目。关于确定的第一用户潜在感兴趣的第一多媒体类目的数量,本发明实施例不作具体限定。
其中,在根据第一用户的各个第一多媒体类目的兴趣分值,确定第一用户潜在感兴趣的第一多媒体类目时,可以根据第一用户的各个第二多媒体类目的兴趣分值,对第一用户的所有第二多媒体类目的兴趣分值进行排序,并根据排序结果确定第一用户潜在感兴趣的第二多媒体类目。
在根据排序结果确定第一用户潜在感兴趣的第二多媒体类目时,可以结合预设的第一用户潜在感兴趣的第二多媒体类目的数量实现。具体地,可以根据排序结果,从第一用户的所有第二多媒体类目中,筛选出兴趣分值高的预设数量的多媒体类目作为第一用户潜在感兴趣的第二多媒体类目。
第二种方式:根据第一用户的各个第一多媒体类目及多个第二用户对多媒体信息的历史点击行为,确定任两个多媒体类目之间的第三相关度;根据任两个多媒体类目之间的第三相关度及第一用户感兴趣的第一多媒体类目,确定第一用户潜在感兴趣的第二多媒体类目。
其中,根据第一用户的各个第一多媒体类目及多个第二用户对多媒体信息的历史点击行为,确定任两个多媒体类目之间的第三相关度的原理,可以与上述步骤2021a和步骤2021b中根据第一用户的各个第一多媒体类目的兴趣分值及所有第二用户的各个第一多媒体类目的兴趣分值,确定所有多媒体类目中任两个多媒体类目之间的第二相关度的原理一致,具体实施时,可以参见上述步骤2021a和步骤2021b中的内容,此处不再赘述。
另外,在根据任两个多媒体类目之间的第三相关度及第一用户感兴趣的第一多媒体类目,确定第一用户潜在感兴趣的第二多媒体类目时,可以在确定第一用户感兴趣的第一多媒体类目后,查找与该第一用户感兴趣的第一多媒体类目之间的第三相关度最大的第三数值的多媒体类目,将这些多媒体类目作为第一用户潜在感兴趣的第二多媒体类目。
203、根据第一用户感兴趣的第一多媒体类目和第一用户潜在感兴趣的第二多媒体类目,确定目标多媒体类目。
其中,目标多媒体类目可以是一定数值的第一多媒体类目,也可以是一定数值的第一多媒体类目,还可以同时包括第一多媒体类目和第二多媒体类目。
结合上述确定第一用户感兴趣的第一多媒体类目中的第一种方式和确定第一用户潜在感兴趣的第二多媒体类目中的第一种方式,在根据第一用户感兴趣的第一多媒体类目和第一用户潜在感兴趣的第二多媒体类目,确定目标多媒体类目时,可以根据第一用户感兴趣的第一多媒体类目的兴趣分值及第一用户潜在感兴趣的第二多媒体类目的兴趣分值,确定向第一用户推荐的目标多媒体类目。
结合上述步骤201和步骤202对本发明实施例在向第一用户推荐信息时,确定第一用户感兴趣的第一多媒体类目和潜在感兴趣的第二多媒体类目的过程进行了详细解释。如图3所示,其示出了一种确定目标多媒体类目的过程示意图。
204、当检测到第一用户登录时,向第一用户推荐目标多媒体类目的多媒体信息。
为了能够及时向第一用户推荐目标多媒体类目的多媒体信息,可以在检测到第一用户登录时,向第一用户推荐该目标多媒体类目的多媒体信息。具体地,当检测到第一用户登录时,向第一用户推送该目标多媒体类目的多媒体信息,并使该推荐的多媒体信息显示于第一用户终端屏幕的指定区域中。其中,该指定区域可以为屏幕的上方、右方等。另外,可以将目标多媒体类目的多媒体信息永久显示于该指定区域,也可以每隔指定时长更新一次所显示的目标多媒体类目的多媒体信息。此外,还可以通过弹窗方式显示该目标多媒体类目的多媒体信息等。
其中,在检测第一用户是否登录时,可以通过检测第一用户是否在登录界面输入了账号和密码,且输入的账号和密码与第一用户注册时提交的账号和密码匹配来实现。当检测到第一用户在登录界面输入了账号和密码,且输入的账号和密码与第一用户注册时提交的账号和密码匹配,则确定第一用户已登录。
当然,此处仅以当第一用户登录时向其推荐信息为例进行了说明,然而,在具体实施时,向第一用户推荐信息还可以有其它场景。例如,当检测到第一用户浏览网页时,或者当检测到第一用户搜索目标多媒体类目的相关信息等,本发明实施例不对向第一用户推荐信息的场景进行限定。
本发明实施例提供的方法,通过确定第一用户感兴趣的第一多媒体类目,并确定第一用户历史未点击的潜在感兴趣的第二多媒体类目,从而根据第一用户感兴趣的第一多媒体类目及第一用户潜在感兴趣的第二类目确定目标多媒体类目,使得在推荐多媒体信息时,除了根据第一用户历史已点击的多媒体信息所属的多媒体类目实现外,还根据第一用户潜在感兴趣的多媒体类目实现,确定的目标多媒体类目更准确,从而使得所推荐的目标多媒体类目的多媒体信息能够充分引起用户注意,不仅能够提高推荐的多媒体信息的点击率,使得推荐的多媒体信息更具针对性,而且能节省资源和财力。另外,当目标多媒体类目包括第一用户潜在感兴趣的任一第二多媒体类目时,由于第一用户历史未点击该第二多媒体类目,因此,推荐的多媒体信息对第一用户具有一定的新鲜度。
图4是根据一示例性实施例提供的一种多媒体信息的推荐装置的结构示意图,该多媒体信息的推荐装置可以用于执行上述图1或图2所对应实施例提供的多媒体信息的推荐方法。参见图4,该多媒体信息的推荐装置包括:
第一确定模块401,用于根据第一用户对多媒体信息的历史点击行为,确定第一用户感兴趣的第一多媒体类目,其中,第一多媒体类目为用户历史点击的多媒体信息所属类目;
第二确定模块402,用于根据第一用户的各个第一多媒体类目及多个第二用户对多媒体信息的历史点击行为,确定第一用户潜在感兴趣的第二多媒体类目,其中,第二多媒体类目为用户历史未点击的多媒体信息所属类目;
第三确定模块403,用于根据第一用户感兴趣的第一多媒体类目和第一用户潜在感兴趣的第二多媒体类目,确定目标多媒体类目;
推荐模块404,用于向第一用户推荐目标多媒体类目的多媒体信息。
本发明实施例提供的装置,通过确定第一用户感兴趣的第一多媒体类目,并确定第一用户历史未点击的潜在感兴趣的第二多媒体类目,从而根据第一用户感兴趣的第一多媒体类目及第一用户潜在感兴趣的第二类目确定目标多媒体类目,使得在推荐多媒体信息时,除了根据第一用户历史已点击的多媒体信息所属的多媒体类目实现外,还根据第一用户潜在感兴趣的多媒体类目实现,确定的目标多媒体类目更准确,从而使得所推荐的目标多媒体类目的多媒体信息能够充分引起用户注意,不仅能够提高推荐的多媒体信息的点击率,使得推荐的多媒体信息更具针对性,而且能节省资源和财力。另外,当目标多媒体类目包括第一用户潜在感兴趣的任一第二多媒体类目时,由于第一用户历史未点击该第二多媒体类目,因此,推荐的多媒体信息对第一用户具有一定的新鲜度。
在另一个实施例中,第一确定模块401包括:
第一确定单元,用于根据第一用户对多媒体信息的历史点击行为,确定第一用户的各个第一多媒体类目的兴趣分值;
第二确定单元,用于根据第一用户的各个第一多媒体类目的兴趣分值,确定第一用户感兴趣的第一多媒体类目;
第二确定模块402包括:
第三确定单元,用于根据第一用户的各个第一多媒体类目的兴趣分值及多个第二用户对多媒体信息的历史点击行为,确定第一用户的各个第二多媒体类目的兴趣分值;
第四确定单元,用于根据第一用户的各个第二多媒体类目的兴趣分值,确定第一用户潜在感兴趣的第二多媒体类目;
第三确定模块403,用于根据第一用户感兴趣的第一多媒体类目的兴趣分值及第一用户潜在感兴趣的第二多媒体类目的兴趣分值,确定向第一用户推荐的目标多媒体类目。
在另一个实施例中,第一确定单元包括:
第一确定子单元,用于当将第一用户的任一第一多媒体类目作为指定第一多媒体类目时,对于指定第一多媒体类目,根据第一用户对多媒体信息的历史点击行为,确定第一用户点击指定第一多媒体类目的次数为第一次数;
第二确定子单元,用于根据第一用户对多媒体信息的历史点击行为,确定第一用户点击所有多媒体类目的次数之和为第二次数;
第一获取子单元,用于获取点击指定第一多媒体类目的用户数量以及所有用户数量;
第三确定子单元,用于根据第一次数、第二次数、用户数量及所有用户数量,确定指定第一多媒体类目的兴趣分值。
在另一个实施例中,第三确定子单元,还用于根据第一次数、第二次数、用户数量及所有用户数量,通过如下公式确定指定第一多媒体类目的兴趣分值:
TF 1 = CK i , j Σ j = 1 n CK i , j
IDF 1 = log N N j
S1=TF1×IDF1
式中,j表示指定第一多媒体类目,i表示第一用户,CKi,j为第一用户i点击指定第一多媒体类目j的第一次数,n为所有多媒体类目的数量,表示第一用户i点击所有多媒体类目的第二次数,Nj为点击指定第一多媒体类目j的用户数量,N为所有用户数量,S1为指定第一多媒体类目j的兴趣分值。
在另一个实施例中,第一确定单元包括:
第四确定子单元,用于当将第一用户任一第一多媒体类目作为指定第一多媒体类目时,对于指定第一多媒体类目,根据第一用户对多媒体信息的历史点击行为,确定第一用户点击指定第一多媒体类目的次数为第一次数;
第五确定子单元,用于根据第一用户对多媒体信息的历史点击行为,确定第一用户点击所有多媒体类目的次数之和为第二次数;
第二获取子单元,用于获取点击指定第一多媒体类目的用户数量以及所有用户数量;
第六确定子单元,用于根据第一用户点击指定第一多媒体类目的时刻,确定指定第一多媒体类目的权重;
第七确定子单元,用于根据第一次数、第二次数、用户数量、所有用户数量及指定第一多媒体类目的权重,确定指定第一多媒体类目的兴趣分值。
在另一个实施例中,第六确定子单元,还用于根据第一用户点击指定第一多媒体类目的时刻,通过如下公式确定指定第一多媒体类目的权重:
w j = 1 1 + e - t
式中,t表示第一用户点击指定第一多媒体类目j的时刻与当前时刻之间的差值;
第七确定子单元,还用于根据第一次数、第二次数、用户数量、所有用户数量及指定第一多媒体类目的权重,通过如下公式确定指定第一多媒体类目的兴趣分值:
TF 2 = CK i , j × w j Σ j = 1 n ( CK i , j × w j )
IDF 2 = log N N j
S2=TF2×IDF2
式中,j表示指定第一多媒体类目,i表示第一用户,CKi,j为第一用户i点击指定第一多媒体类目j的第一次数,n为所有多媒体类目的数量,表示第一用户i点击所有多媒体类目的第二次数,Nj为点击指定第一多媒体类目j的用户数量,N为所有用户数量,wj为指定第一多媒体类目j的权重,S2为指定第一多媒体类目j的兴趣分值。
在另一个实施例中,第三确定单元包括:
第八确定子单元,用于对于任一第二用户,根据第二用户对多媒体信息的历史点击行为,确定第二用户的各个第一多媒体类目的兴趣分值;
第九确定子单元,用于根据第一用户的各个第一多媒体类目的兴趣分值及第二用户的各个第一多媒体类目的兴趣分值,确定第一用户与第二用户在点击多媒体信息时的第一相关度;
第一选择子单元,用于从所有第二用户中选择第一数值的目标第二用户,其中,任一目标第二用户与第一用户在点击多媒体信息时的第一相关度满足第一指定条件;
第十确定子单元,用于当将第一用户的任一第二多媒体类目作为指定第二多媒体类目时,对于指定第二多媒体类目,根据第一用户的各个第一多媒体类目的兴趣分值、每个目标第二用户的各个第一多媒体类目的兴趣分值及第一用户与每个目标第二用户之间的第一相关度,确定指定第二多媒体类目的兴趣分值。
在另一个实施例中,第九确定子单元,还用于根据第一用户的各个第一多媒体类目的兴趣分值及第二用户的各个第一多媒体类目的兴趣分值,通过如下公式确定第一用户与第二用户在点击多媒体信息时的第一相关度:
sim ( i , y ) = Σ k = 1 m ( r i , k - r i ‾ ) ( r y , k - r y ‾ ) Σ k = 1 m ( r i , k - r i ‾ ) 2 Σ k = 1 m ( r y , k - r y ‾ ) 2
式中,i为第一用户,y为任一第二用户,m为第一用户i的第一多媒体类目中与第二用户y的第一多媒体类目中共有多媒体类目的数量,k为第一用户的第一多媒体类目和第二用户的第一多媒体类目中共有的任一多媒体类目,ri,k为第一用户i的第一多媒体类目k的兴趣分值,ry,k为第二用户y的第一多媒体类目k的兴趣分值,为第一用户i的所有第一多媒体类目的兴趣分值平均值,为第二用户y的所有第一多媒体类目的兴趣分值平均值;
第十确定子单元,还用于根据第一用户的各个第一多媒体类目的兴趣分值、每个目标第二用户的各个第一多媒体类目的兴趣分值及第一用户与每个目标第二用户之间的第一相关度,通过如下公式确定指定第二多媒体类目的兴趣分值:
r i , h = r i ‾ + Σ u ′ ∈ U sim ( i , u ′ ) ( r u ′ , h - r u ′ ‾ ) Σ u ′ ∈ U sim ( i , u ′ )
式中,U为目标第二用户的集合,u'为任一目标第二用户,h为指定第二多媒体类目,ri,h为指定第二多媒体类目h的兴趣分值,sim(i,u')为第一用户i与目标第二用户u'之间的第一相关度,ru',h为目标第二用户u'的第一多媒体类目h的兴趣分值,为目标第二用户u'的所有第一多媒体类目的兴趣分值平均值。
在另一个实施例中,第三确定单元包括:
第十一确定子单元,用于根据每个第二用户对多媒体信息的历史点击行为,确定每个第二用户的各个第一多媒体类目的兴趣分值;
第十二确定子单元,用于根据第一用户的各个第一多媒体类目的兴趣分值及所有第二用户的各个第一多媒体类目的兴趣分值,确定所有多媒体类目中任两个多媒体类目之间的第二相关度;
第二选择子单元,用于当将第一用户的任一第二多媒体类目作为指定第二多媒体类目时,对于指定第二多媒体类目,从第一用户的所有第一多媒体类目中选择第二数值的目标第一多媒体类目,其中,任一目标第一多媒体类目与指定第二多媒体类目之间的第二相关度满足第二指定条件;
第十三确定子单元,用于根据各个目标第一多媒体类目的兴趣分值、各个目标第一多媒体类目与指定第二多媒体类目之间的第二相关度及所有第二用户对指定第二多媒体类目的兴趣分值,确定指定第二多媒体类目的兴趣分值。
在另一个实施例中,第十二确定子单元,还用于对于任两个多媒体类目,根据第一用户的各个第一多媒体类目的兴趣分值及所有第二用户的各个第一多媒体类目的兴趣分值,通过如下公式确定所有多媒体类目中任两个多媒体类目之间的第二相关度:
sim ( a , b ) = Σ d = 1 N ( r a , d - r a ‾ ) ( r b , d - r b ‾ ) Σ d = 1 N ( r a , d - r a ‾ ) 2 Σ d = 1 N ( r b , d - r b ‾ ) 2
式中,a为任一多媒体类目,b为与a不同的其它任一多媒体类目,N为所有用户数量,d为任一用户,ra,d为用户d的多媒体类目a的兴趣分值,为所有用户的多媒体类目a的兴趣分值平均值,rb,d为用户d的多媒体类目b的兴趣分值,为所有用户的多媒体类目b的兴趣分值平均值;
第十三确定子单元,还用于根据各个目标第一多媒体类目的兴趣分值、各个目标第一多媒体类目与指定第二多媒体类目之间的第二相关度及所有第二用户对指定第二多媒体类目的兴趣分值,通过如下公式确定指定第二多媒体类目的兴趣分值:
r i , f = r f ‾ + Σ g ′ ∈ G sim ( f , g ′ ) ( r g ′ , i - r g ′ ‾ ) Σ g ′ ∈ G sim ( f , g ′ )
式中,f为指定第二多媒体类目,ri,f为指定第二多媒体类目f的兴趣分值,为所有第二用户对指定第二多媒体类目f的兴趣分值平均值,G为目标第一多媒体类目的集合,g'为任一目标第一多媒体类目,sim(f,g')为目标第一多媒体类目g'与指定第二多媒体类目f之间的第二相关度,rg',i为第一用户i的目标第一多媒体类目g'的兴趣分值,为所有第二用户对目标第一多媒体类目g'的兴趣分值平均值。
在另一个实施例中,第一确定模块401,还用于根据第一用户对多媒体信息的历史点击行为,确定第一用户对第一用户的各个第一多媒体类目的点击次数;根据第一用户对第一用户的各个第一多媒体类目的点击次数,确定第一用户感兴趣的第一多媒体类目;
第二确定模块402,还用于根据第一用户的各个第一多媒体类目及多个第二用户对多媒体信息的历史点击行为,确定任两个多媒体类目之间的第三相关度;根据任两个多媒体类目之间的第三相关度及第一用户感兴趣的第一多媒体类目,确定第一用户潜在感兴趣的第二多媒体类目。
图5是根据一示例性实施例示出的一种服务器的结构示意图,该服务器可以用于执行上述图1或图2所对应实施例提供的多媒体信息的推荐方法。参照图5,服务器500包括处理组件522,其进一步包括一个或多个处理器,以及由存储器532所代表的存储器资源,用于存储可由处理组件522的执行的指令,例如应用程序。存储器532中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件522被配置为执行指令,以执行上述图1或图2所对应实施例提供的多媒体信息的推荐方法。
服务器500还可以包括一个电源组件526被配置为执行服务器500的电源管理,一个有线或无线网络接口550被配置为将服务器500连接到网络,和一个输入输出(I/O)接口558。服务器500可以操作基于存储在存储器532的操作***,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
其中,一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行,所述一个或者一个以上程序包含用于进行以下操作的指令:
根据第一用户对多媒体信息的历史点击行为,确定第一用户感兴趣的第一多媒体类目,其中,第一多媒体类目为用户历史点击的多媒体信息所属类目;
根据第一用户的各个第一多媒体类目及多个第二用户对多媒体信息的历史点击行为,确定第一用户潜在感兴趣的第二多媒体类目,其中,第二多媒体类目为用户历史未点击的多媒体信息所属类目;
根据第一用户感兴趣的第一多媒体类目和第一用户潜在感兴趣的第二多媒体类目,确定目标多媒体类目;
向第一用户推荐目标多媒体类目的多媒体信息。
假设上述为第一种可能的实施方式,则在第一种可能的实施方式作为基础而提供的第二种可能的实施方式中,服务器的存储器中,还包含用于执行以下操作的指令:
根据第一用户对多媒体信息的历史点击行为,确定第一用户感兴趣的第一多媒体类目,包括:
根据第一用户对多媒体信息的历史点击行为,确定第一用户的各个第一多媒体类目的兴趣分值;
根据第一用户的各个第一多媒体类目的兴趣分值,确定第一用户感兴趣的第一多媒体类目;
根据第一用户的各个第一多媒体类目及多个第二用户对多媒体信息的历史点击行为,确定第一用户潜在感兴趣的第二多媒体类目,包括:
根据第一用户的各个第一多媒体类目的兴趣分值及多个第二用户对多媒体信息的历史点击行为,确定第一用户的各个第二多媒体类目的兴趣分值;
根据第一用户的各个第二多媒体类目的兴趣分值,确定第一用户潜在感兴趣的第二多媒体类目;
根据第一用户感兴趣的第一多媒体类目和第一用户潜在感兴趣的第二多媒体类目,确定目标多媒体类目,包括:
根据第一用户感兴趣的第一多媒体类目的兴趣分值及第一用户潜在感兴趣的第二多媒体类目的兴趣分值,确定向第一用户推荐的目标多媒体类目。
在第二种可能的实施方式作为基础而提供的第三种可能的实施方式中,服务器的存储器中,还包含用于执行以下操作的指令:
根据第一用户对多媒体信息的历史点击行为,确定第一用户的各个第一多媒体类目的兴趣分值,包括:
当将第一用户的任一第一多媒体类目作为指定第一多媒体类目时,对于指定第一多媒体类目,根据第一用户对多媒体信息的历史点击行为,确定第一用户点击指定第一多媒体类目的次数为第一次数;
根据第一用户对多媒体信息的历史点击行为,确定第一用户点击所有多媒体类目的次数之和为第二次数;
获取点击指定第一多媒体类目的用户数量以及所有用户数量;
根据第一次数、第二次数、用户数量及所有用户数量,确定指定第一多媒体类目的兴趣分值。
在第三种可能的实施方式作为基础而提供的第四种可能的实施方式中,服务器的存储器中,还包含用于执行以下操作的指令:根据第一次数、第二次数、用户数量及所有用户数量,确定指定第一多媒体类目的兴趣分值,包括:
根据第一次数、第二次数、用户数量及所有用户数量,通过如下公式确定指定第一多媒体类目的兴趣分值:
TF 1 = CK i , j Σ j = 1 n CK i , j
IDF 1 = log N N j
S1=TF1×IDF1
式中,j表示指定第一多媒体类目,i表示第一用户,CKi,j为第一用户i点击指定第一多媒体类目j的第一次数,n为所有多媒体类目的数量,表示第一用户i点击所有多媒体类目的第二次数,Nj为点击指定第一多媒体类目j的用户数量,N为所有用户数量,S1为指定第一多媒体类目j的兴趣分值。
在第二种可能的实施方式作为基础而提供的第五种可能的实施方式中,服务器的存储器中,还包含用于执行以下操作的指令:
根据第一用户对多媒体信息的历史点击行为,确定第一用户的各个第一多媒体类目的兴趣分值,包括:
当将第一用户任一第一多媒体类目作为指定第一多媒体类目时,对于指定第一多媒体类目,根据第一用户对多媒体信息的历史点击行为,确定第一用户点击指定第一多媒体类目的次数为第一次数;
根据第一用户对多媒体信息的历史点击行为,确定第一用户点击所有多媒体类目的次数之和为第二次数;
获取点击指定第一多媒体类目的用户数量以及所有用户数量;
根据第一用户点击指定第一多媒体类目的时刻,确定指定第一多媒体类目的权重;
根据第一次数、第二次数、用户数量、所有用户数量及指定第一多媒体类目的权重,确定指定第一多媒体类目的兴趣分值。
在第五种可能的实施方式作为基础而提供的第六种可能的实施方式中,服务器的存储器中,还包含用于执行以下操作的指令:根据第一用户点击指定第一多媒体类目的时刻,确定指定第一多媒体类目的权重,包括:
根据第一用户点击指定第一多媒体类目的时刻,通过如下公式确定指定第一多媒体类目的权重:
w j = 1 1 + e - t
式中,t表示第一用户点击指定第一多媒体类目j的时刻与当前时刻之间的差值;
根据第一次数、第二次数、用户数量、所有用户数量及指定第一多媒体类目的权重,确定指定第一多媒体类目的兴趣分值,包括:
根据第一次数、第二次数、用户数量、所有用户数量及指定第一多媒体类目的权重,通过如下公式确定指定第一多媒体类目的兴趣分值:
TF 2 = CK i , j × w j Σ j = 1 n ( CK i , j × w j )
IDF 2 = log N N j
S2=TF2×IDF2
式中,j表示指定第一多媒体类目,i表示第一用户,CKi,j为第一用户i点击指定第一多媒体类目j的第一次数,n为所有多媒体类目的数量,表示第一用户i点击所有多媒体类目的第二次数,Nj为点击指定第一多媒体类目j的用户数量,N为所有用户数量,wj为指定第一多媒体类目j的权重,S2为指定第一多媒体类目j的兴趣分值。
在第二种可能的实施方式作为基础而提供的第七种可能的实施方式中,服务器的存储器中,还包含用于执行以下操作的指令:
根据第一用户的各个第一多媒体类目的兴趣分值及多个第二用户对多媒体信息的历史点击行为,确定第一用户的各个第二多媒体类目的兴趣分值,包括:
对于任一第二用户,根据第二用户对多媒体信息的历史点击行为,确定第二用户的各个第一多媒体类目的兴趣分值;
根据第一用户的各个第一多媒体类目的兴趣分值及第二用户的各个第一多媒体类目的兴趣分值,确定第一用户与第二用户在点击多媒体信息时的第一相关度;
从所有第二用户中选择第一数值的目标第二用户,其中,任一目标第二用户与第一用户在点击多媒体信息时的第一相关度满足第一指定条件;
当将第一用户的任一第二多媒体类目作为指定第二多媒体类目时,对于指定第二多媒体类目,根据第一用户的各个第一多媒体类目的兴趣分值、每个目标第二用户的各个第一多媒体类目的兴趣分值及第一用户与每个目标第二用户之间的第一相关度,确定指定第二多媒体类目的兴趣分值。
在第七种可能的实施方式作为基础而提供的第八种可能的实施方式中,服务器的存储器中,还包含用于执行以下操作的指令:
根据第一用户的各个第一多媒体类目的兴趣分值及第二用户的各个第一多媒体类目的兴趣分值,确定第一用户与第二用户在点击多媒体信息时的第一相关度,包括:
根据第一用户的各个第一多媒体类目的兴趣分值及第二用户的各个第一多媒体类目的兴趣分值,通过如下公式确定第一用户与第二用户在点击多媒体信息时的第一相关度:
sim ( i , y ) = Σ k = 1 m ( r i , k - r i ‾ ) ( r y , k - r y ‾ ) Σ k = 1 m ( r i , k - r i ‾ ) 2 Σ k = 1 m ( r y , k - r y ‾ ) 2
式中,i为第一用户,y为任一第二用户,m为第一用户i的第一多媒体类目中与第二用户y的第一多媒体类目中共有多媒体类目的数量,k为第一用户的第一多媒体类目和第二用户的第一多媒体类目中共有的任一多媒体类目,ri,k为第一用户i的第一多媒体类目k的兴趣分值,ry,k为第二用户y的第一多媒体类目k的兴趣分值,为第一用户i的所有第一多媒体类目的兴趣分值平均值,为第二用户y的所有第一多媒体类目的兴趣分值平均值;
根据第一用户的各个第一多媒体类目的兴趣分值、每个目标第二用户的各个第一多媒体类目的兴趣分值及第一用户与每个目标第二用户之间的第一相关度,确定指定第二多媒体类目的兴趣分值,包括:
根据第一用户的各个第一多媒体类目的兴趣分值、每个目标第二用户的各个第一多媒体类目的兴趣分值及第一用户与每个目标第二用户之间的第一相关度,通过如下公式确定指定第二多媒体类目的兴趣分值:
r i , h = r i ‾ + Σ u ′ ∈ U sim ( i , u ′ ) ( r u ′ , h - r u ′ ‾ ) Σ u ′ ∈ U sim ( i , u ′ )
式中,U为目标第二用户的集合,u'为任一目标第二用户,h为指定第二多媒体类目,ri,h为指定第二多媒体类目h的兴趣分值,sim(i,u')为第一用户i与目标第二用户u'之间的第一相关度,ru',h为目标第二用户u'的第一多媒体类目h的兴趣分值,为目标第二用户u'的所有第一多媒体类目的兴趣分值平均值。
在第二种可能的实施方式作为基础而提供的第九种可能的实施方式中,服务器的存储器中,还包含用于执行以下操作的指令:
根据第一用户的各个第一多媒体类目的兴趣分值及多个第二用户对多媒体信息的历史点击行为,确定第一用户的各个第二多媒体类目的兴趣分值,包括:
根据每个第二用户对多媒体信息的历史点击行为,确定每个第二用户的各个第一多媒体类目的兴趣分值;
根据第一用户的各个第一多媒体类目的兴趣分值及所有第二用户的各个第一多媒体类目的兴趣分值,确定所有多媒体类目中任两个多媒体类目之间的第二相关度;
当将第一用户的任一第二多媒体类目作为指定第二多媒体类目时,对于指定第二多媒体类目,从第一用户的所有第一多媒体类目中选择第二数值的目标第一多媒体类目,其中,任一目标第一多媒体类目与指定第二多媒体类目之间的第二相关度满足第二指定条件;
根据各个目标第一多媒体类目的兴趣分值、各个目标第一多媒体类目与指定第二多媒体类目之间的第二相关度及所有第二用户对指定第二多媒体类目的兴趣分值,确定指定第二多媒体类目的兴趣分值。
在第九种可能的实施方式作为基础而提供的第十种可能的实施方式中,服务器的存储器中,还包含用于执行以下操作的指令:
根据第一用户的各个第一多媒体类目的兴趣分值及所有第二用户的各个第一多媒体类目的兴趣分值,确定所有多媒体类目中任两个多媒体类目之间的第二相关度,包括:
对于任两个多媒体类目,根据第一用户的各个第一多媒体类目的兴趣分值及所有第二用户的各个第一多媒体类目的兴趣分值,通过如下公式确定所有多媒体类目中任两个多媒体类目之间的第二相关度:
sim ( a , b ) = Σ d = 1 N ( r a , d - r a ‾ ) ( r b , d - r b ‾ ) Σ d = 1 N ( r a , d - r a ‾ ) 2 Σ d = 1 N ( r b , d - r b ‾ ) 2
式中,a为任一多媒体类目,b为与a不同的其它任一多媒体类目,N为所有用户数量,d为任一用户,ra,d为用户d的多媒体类目a的兴趣分值,为所有用户的多媒体类目a的兴趣分值平均值,rb,d为用户d的多媒体类目b的兴趣分值,为所有用户的多媒体类目b的兴趣分值平均值;
根据各个目标第一多媒体类目的兴趣分值、各个目标第一多媒体类目与指定第二多媒体类目之间的第二相关度及所有第二用户对指定第二多媒体类目的兴趣分值,确定指定第二多媒体类目的兴趣分值,包括:
根据各个目标第一多媒体类目的兴趣分值、各个目标第一多媒体类目与指定第二多媒体类目之间的第二相关度及所有第二用户对指定第二多媒体类目的兴趣分值,通过如下公式确定指定第二多媒体类目的兴趣分值:
r i , f = r f ‾ + Σ g ′ ∈ G sim ( f , g ′ ) ( r g ′ , i - r g ′ ‾ ) Σ g ′ ∈ G sim ( f , g ′ )
式中,f为指定第二多媒体类目,ri,f为指定第二多媒体类目f的兴趣分值,为所有第二用户对指定第二多媒体类目f的兴趣分值平均值,G为目标第一多媒体类目的集合,g'为任一目标第一多媒体类目,sim(f,g')为目标第一多媒体类目g'与指定第二多媒体类目f之间的第二相关度,rg',i为第一用户i的目标第一多媒体类目g'的兴趣分值,为所有第二用户对目标第一多媒体类目g'的兴趣分值平均值。
在第一种可能的实施方式作为基础而提供的第十一种可能的实施方式中,服务器的存储器中,还包含用于执行以下操作的指令:
根据第一用户对多媒体信息的历史点击行为,确定第一用户感兴趣的第一多媒体类目,包括:
根据第一用户对多媒体信息的历史点击行为,确定第一用户对第一用户的各个第一多媒体类目的点击次数;
根据第一用户对第一用户的各个第一多媒体类目的点击次数,确定第一用户感兴趣的第一多媒体类目;
根据第一用户的各个第一多媒体类目及多个第二用户对多媒体信息的历史点击行为,确定第一用户潜在感兴趣的第二多媒体类目,包括:
根据第一用户的各个第一多媒体类目及多个第二用户对多媒体信息的历史点击行为,确定任两个多媒体类目之间的第三相关度;
根据任两个多媒体类目之间的第三相关度及第一用户感兴趣的第一多媒体类目,确定第一用户潜在感兴趣的第二多媒体类目。
本发明实施例提供的服务器,通过确定第一用户感兴趣的第一多媒体类目,并确定第一用户历史未点击的潜在感兴趣的第二多媒体类目,从而根据第一用户感兴趣的第一多媒体类目及第一用户潜在感兴趣的第二类目确定目标多媒体类目,使得在推荐多媒体信息时,除了根据第一用户历史已点击的多媒体信息所属的多媒体类目实现外,还根据第一用户潜在感兴趣的多媒体类目实现,确定的目标多媒体类目更准确,从而使得所推荐的目标多媒体类目的多媒体信息能够充分引起用户注意,不仅能够提高推荐的多媒体信息的点击率,使得推荐的多媒体信息更具针对性,而且能节省资源和财力。另外,当目标多媒体类目包括第一用户潜在感兴趣的任一第二多媒体类目时,由于第一用户历史未点击该第二多媒体类目,因此,推荐的多媒体信息对第一用户具有一定的新鲜度。
需要说明的是:上述实施例提供的多媒体信息的推荐装置在推荐多媒体信息时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的多媒体信息的推荐装置及服务器与多媒体信息的推荐方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (22)

1.一种多媒体信息的推荐方法,其特征在于,所述方法包括:
根据第一用户对多媒体信息的历史点击行为,确定所述第一用户感兴趣的第一多媒体类目,所述第一多媒体类目为用户历史点击的多媒体信息所属类目;
根据所述第一用户的各个第一多媒体类目及多个第二用户对多媒体信息的历史点击行为,确定所述第一用户潜在感兴趣的第二多媒体类目,所述第二多媒体类目为用户历史未点击的多媒体信息所属类目;
根据所述第一用户感兴趣的第一多媒体类目和所述第一用户潜在感兴趣的第二多媒体类目,确定目标多媒体类目;
向所述第一用户推荐所述目标多媒体类目的多媒体信息。
2.根据权利要求1所述的方法,其特征在于,所述根据第一用户对多媒体信息的历史点击行为,确定所述第一用户感兴趣的第一多媒体类目,包括:
根据第一用户对多媒体信息的历史点击行为,确定所述第一用户的各个第一多媒体类目的兴趣分值;
根据所述第一用户的各个第一多媒体类目的兴趣分值,确定所述第一用户感兴趣的第一多媒体类目;
所述根据所述第一用户的各个第一多媒体类目及多个第二用户对多媒体信息的历史点击行为,确定所述第一用户潜在感兴趣的第二多媒体类目,包括:
根据所述第一用户的各个第一多媒体类目的兴趣分值及多个第二用户对多媒体信息的历史点击行为,确定所述第一用户的各个第二多媒体类目的兴趣分值;
根据所述第一用户的各个第二多媒体类目的兴趣分值,确定所述第一用户潜在感兴趣的第二多媒体类目;
所述根据所述第一用户感兴趣的第一多媒体类目和所述第一用户潜在感兴趣的第二多媒体类目,确定目标多媒体类目,包括:
根据所述第一用户感兴趣的第一多媒体类目的兴趣分值及所述第一用户潜在感兴趣的第二多媒体类目的兴趣分值,确定向所述第一用户推荐的目标多媒体类目。
3.根据权利要求2所述的方法,其特征在于,所述根据第一用户对多媒体信息的历史点击行为,确定所述第一用户的各个第一多媒体类目的兴趣分值,包括:
当将第一用户的任一第一多媒体类目作为指定第一多媒体类目时,对于所述指定第一多媒体类目,根据第一用户对多媒体信息的历史点击行为,确定所述第一用户点击所述指定第一多媒体类目的次数为第一次数;
根据所述第一用户对多媒体信息的历史点击行为,确定所述第一用户点击所有多媒体类目的次数之和为第二次数;
获取点击所述指定第一多媒体类目的用户数量以及所有用户数量;
根据所述第一次数、所述第二次数、所述用户数量及所述所有用户数量,确定所述指定第一多媒体类目的兴趣分值。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一次数、所述第二次数、所述用户数量及所述所有用户数量,确定所述指定第一多媒体类目的兴趣分值,包括:
根据所述第一次数、所述第二次数、所述用户数量及所述所有用户数量,通过如下公式确定所述指定第一多媒体类目的兴趣分值:
TF 1 = CK i , j Σ j = 1 n CK i , j
IDF 1 = log N N j
S1=TF1×IDF1
式中,j表示指定第一多媒体类目,i表示第一用户,CKi,j为第一用户i点击指定第一多媒体类目j的第一次数,n为所有多媒体类目的数量,表示第一用户i点击所有多媒体类目的第二次数,Nj为点击指定第一多媒体类目j的用户数量,N为所有用户数量,S1为指定第一多媒体类目j的兴趣分值。
5.根据权利要求2所述的方法,其特征在于,所述根据第一用户对多媒体信息的历史点击行为,确定所述第一用户的各个第一多媒体类目的兴趣分值,包括:
当将第一用户任一第一多媒体类目作为指定第一多媒体类目时,对于所述指定第一多媒体类目,根据第一用户对多媒体信息的历史点击行为,确定所述第一用户点击所述指定第一多媒体类目的次数为第一次数;
根据所述第一用户对多媒体信息的历史点击行为,确定所述第一用户点击所有多媒体类目的次数之和为第二次数;
获取点击所述指定第一多媒体类目的用户数量以及所有用户数量;
根据所述第一用户点击所述指定第一多媒体类目的时刻,确定所述指定第一多媒体类目的权重;
根据所述第一次数、所述第二次数、所述用户数量、所述所有用户数量及所述指定第一多媒体类目的权重,确定所述指定第一多媒体类目的兴趣分值。
6.根据权利要求5所述的方法,其特征在于,所述根据所述第一用户点击所述指定第一多媒体类目的时刻,确定所述指定第一多媒体类目的权重,包括:
根据所述第一用户点击所述指定第一多媒体类目的时刻,通过如下公式确定所述指定第一多媒体类目的权重:
w j = 1 1 + e - t
式中,t表示所述第一用户点击所述指定第一多媒体类目j的时刻与当前时刻之间的差值;
所述根据所述第一次数、所述第二次数、所述用户数量、所述所有用户数量及所述指定第一多媒体类目的权重,确定所述指定第一多媒体类目的兴趣分值,包括:
根据所述第一次数、所述第二次数、所述用户数量、所述所有用户数量及所述指定第一多媒体类目的权重,通过如下公式确定所述指定第一多媒体类目的兴趣分值:
TF 2 = CK i , j × w j Σ j = 1 n ( CK i , j × w j )
IDF 2 = log N N j
S2=TF2×IDF2
式中,j表示指定第一多媒体类目,i表示第一用户,CKi,j为第一用户i点击指定第一多媒体类目j的第一次数,n为所有多媒体类目的数量,表示第一用户i点击所有多媒体类目的第二次数,Nj为点击指定第一多媒体类目j的用户数量,N为所有用户数量,wj为指定第一多媒体类目j的权重,S2为指定第一多媒体类目j的兴趣分值。
7.根据权利要求2所述的方法,其特征在于,所述根据所述第一用户的各个第一多媒体类目的兴趣分值及多个第二用户对多媒体信息的历史点击行为,确定所述第一用户的各个第二多媒体类目的兴趣分值,包括:
对于任一第二用户,根据所述第二用户对多媒体信息的历史点击行为,确定所述第二用户的各个第一多媒体类目的兴趣分值;
根据所述第一用户的各个第一多媒体类目的兴趣分值及所述第二用户的各个第一多媒体类目的兴趣分值,确定所述第一用户与所述第二用户在点击多媒体信息时的第一相关度;
从所有第二用户中选择第一数值的目标第二用户,任一目标第二用户与所述第一用户在点击多媒体信息时的第一相关度满足第一指定条件;
当将第一用户的任一第二多媒体类目作为指定第二多媒体类目时,对于所述指定第二多媒体类目,根据所述第一用户的各个第一多媒体类目的兴趣分值、每个目标第二用户的各个第一多媒体类目的兴趣分值及所述第一用户与每个目标第二用户之间的第一相关度,确定所述指定第二多媒体类目的兴趣分值。
8.根据权利要求7所述的方法,其特征在于,所述根据所述第一用户的各个第一多媒体类目的兴趣分值及所述第二用户的各个第一多媒体类目的兴趣分值,确定所述第一用户与所述第二用户在点击多媒体信息时的第一相关度,包括:
根据所述第一用户的各个第一多媒体类目的兴趣分值及所述第二用户的各个第一多媒体类目的兴趣分值,通过如下公式确定所述第一用户与所述第二用户在点击多媒体信息时的第一相关度:
sim ( i , y ) = Σ k = 1 m ( r i , k - r i ‾ ) ( r y , k - r y ‾ ) Σ k = 1 m ( r i , j - r i ‾ ) 2 Σ k = 1 m ( r y , k - r y ‾ ) 2
式中,i为第一用户,y为任一第二用户,m为第一用户i的第一多媒体类目中与第二用户y的第一多媒体类目中共有多媒体类目的数量,k为第一用户的第一多媒体类目和第二用户的第一多媒体类目中共有的任一多媒体类目,ri,k为第一用户i的第一多媒体类目k的兴趣分值,ry,k为第二用户y的第一多媒体类目k的兴趣分值,为第一用户i的所有第一多媒体类目的兴趣分值平均值,为第二用户y的所有第一多媒体类目的兴趣分值平均值;
所述根据所述第一用户的各个第一多媒体类目的兴趣分值、每个目标第二用户的各个第一多媒体类目的兴趣分值及所述第一用户与每个目标第二用户之间的第一相关度,确定所述指定第二多媒体类目的兴趣分值,包括:
根据所述第一用户的各个第一多媒体类目的兴趣分值、每个目标第二用户的各个第一多媒体类目的兴趣分值及所述第一用户与每个目标第二用户之间的第一相关度,通过如下公式确定所述指定第二多媒体类目的兴趣分值:
r i , h = r i ‾ + Σ u ′ ∈ U sim ( i , u ′ ) ( r u ′ , h - r u ′ ‾ ) Σ u ′ ∈ U sim ( i , u ′ )
式中,U为目标第二用户的集合,u'为任一目标第二用户,h为指定第二多媒体类目,ri,h为指定第二多媒体类目h的兴趣分值,sim(i,u')为第一用户i与目标第二用户u'之间的第一相关度,ru',h为目标第二用户u'的第一多媒体类目h的兴趣分值,为目标第二用户u'的所有第一多媒体类目的兴趣分值平均值。
9.根据权利要求2所述的方法,其特征在于,所述根据所述第一用户的各个第一多媒体类目的兴趣分值及多个第二用户对多媒体信息的历史点击行为,确定所述第一用户的各个第二多媒体类目的兴趣分值,包括:
根据每个第二用户对多媒体信息的历史点击行为,确定每个第二用户的各个第一多媒体类目的兴趣分值;
根据所述第一用户的各个第一多媒体类目的兴趣分值及所有第二用户的各个第一多媒体类目的兴趣分值,确定所有多媒体类目中任两个多媒体类目之间的第二相关度;
当将第一用户的任一第二多媒体类目作为指定第二多媒体类目时,对于所述指定第二多媒体类目,从第一用户的所有第一多媒体类目中选择第二数值的目标第一多媒体类目,任一目标第一多媒体类目与所述指定第二多媒体类目之间的第二相关度满足第二指定条件;
根据各个目标第一多媒体类目的兴趣分值、各个目标第一多媒体类目与所述指定第二多媒体类目之间的第二相关度及所有第二用户对所述指定第二多媒体类目的兴趣分值,确定所述指定第二多媒体类目的兴趣分值。
10.根据权利要求9所述的方法,其特征在于,所述根据所述第一用户的各个第一多媒体类目的兴趣分值及所有第二用户的各个第一多媒体类目的兴趣分值,确定所有多媒体类目中任两个多媒体类目之间的第二相关度,包括:
对于任两个多媒体类目,根据所述第一用户的各个第一多媒体类目的兴趣分值及所有第二用户的各个第一多媒体类目的兴趣分值,通过如下公式确定所有多媒体类目中任两个多媒体类目之间的第二相关度:
sim ( a , b ) = Σ d = 1 N ( r a , b - r a ‾ ) ( r b , d - r b ‾ ) Σ d = 1 N ( r a , d - r a ‾ ) 2 Σ d = 1 N ( r b , d - r b ‾ ) 2
式中,a为任一多媒体类目,b为与a不同的其它任一多媒体类目,N为所有用户数量,d为任一用户,ra,d为用户d的多媒体类目a的兴趣分值,为所有用户的多媒体类目a的兴趣分值平均值,rb,d为用户d的多媒体类目b的兴趣分值,为所有用户的多媒体类目b的兴趣分值平均值;
所述根据各个目标第一多媒体类目的兴趣分值、各个目标第一多媒体类目与所述指定第二多媒体类目之间的第二相关度及所有第二用户对所述指定第二多媒体类目的兴趣分值,确定所述指定第二多媒体类目的兴趣分值,包括:
根据各个目标第一多媒体类目的兴趣分值、各个目标第一多媒体类目与所述指定第二多媒体类目之间的第二相关度及所有第二用户对所述指定第二多媒体类目的兴趣分值,通过如下公式确定所述指定第二多媒体类目的兴趣分值:
r i , f = r f ‾ + Σ g ′ ∈ G sim ( f , g ′ ) ( r g ′ , i - r g ′ ‾ ) Σ g ′ ∈ G sim ( f , g ′ )
式中,f为指定第二多媒体类目,ri,f为指定第二多媒体类目f的兴趣分值,为所有第二用户对指定第二多媒体类目f的兴趣分值平均值,G为目标第一多媒体类目的集合,g'为任一目标第一多媒体类目,sim(f,g')为目标第一多媒体类目g'与指定第二多媒体类目f之间的第二相关度,rg',i为第一用户i的目标第一多媒体类目g'的兴趣分值,为所有第二用户对目标第一多媒体类目g'的兴趣分值平均值。
11.根据权利要求1所述的方法,其特征在于,所述根据第一用户对多媒体信息的历史点击行为,确定所述第一用户感兴趣的第一多媒体类目,包括:
根据第一用户对多媒体信息的历史点击行为,确定所述第一用户对所述第一用户的各个第一多媒体类目的点击次数;
根据所述第一用户对所述第一用户的各个第一多媒体类目的点击次数,确定所述第一用户感兴趣的第一多媒体类目;
所述根据所述第一用户的各个第一多媒体类目及多个第二用户对多媒体信息的历史点击行为,确定所述第一用户潜在感兴趣的第二多媒体类目,包括:
所述根据所述第一用户的各个第一多媒体类目及多个第二用户对多媒体信息的历史点击行为,确定任两个多媒体类目之间的第三相关度;
根据任两个多媒体类目之间的第三相关度及所述第一用户感兴趣的第一多媒体类目,确定所述第一用户潜在感兴趣的第二多媒体类目。
12.一种多媒体信息的推荐装置,其特征在于,所述装置包括:
第一确定模块,用于根据第一用户对多媒体信息的历史点击行为,确定所述第一用户感兴趣的第一多媒体类目,所述第一多媒体类目为用户历史点击的多媒体信息所属类目;
第二确定模块,用于根据所述第一用户的各个第一多媒体类目及多个第二用户对多媒体信息的历史点击行为,确定所述第一用户潜在感兴趣的第二多媒体类目,所述第二多媒体类目为用户历史未点击的多媒体信息所属类目;
第三确定模块,用于根据所述第一用户感兴趣的第一多媒体类目和所述第一用户潜在感兴趣的第二多媒体类目,确定目标多媒体类目;
推荐模块,用于向所述第一用户推荐所述目标多媒体类目的多媒体信息。
13.根据权利要求12所述的装置,其特征在于,所述第一确定模块包括:
第一确定单元,用于根据第一用户对多媒体信息的历史点击行为,确定所述第一用户的各个第一多媒体类目的兴趣分值;
第二确定单元,用于根据所述第一用户的各个第一多媒体类目的兴趣分值,确定所述第一用户感兴趣的第一多媒体类目;
所述第二确定模块包括:
第三确定单元,用于根据所述第一用户的各个第一多媒体类目的兴趣分值及多个第二用户对多媒体信息的历史点击行为,确定所述第一用户的各个第二多媒体类目的兴趣分值;
第四确定单元,用于根据所述第一用户的各个第二多媒体类目的兴趣分值,确定所述第一用户潜在感兴趣的第二多媒体类目;
所述第三确定模块,用于根据所述第一用户感兴趣的第一多媒体类目的兴趣分值及所述第一用户潜在感兴趣的第二多媒体类目的兴趣分值,确定向所述第一用户推荐的目标多媒体类目。
14.根据权利要求13所述的装置,其特征在于,所述第一确定单元包括:
第一确定子单元,用于当将第一用户的任一第一多媒体类目作为指定第一多媒体类目时,对于所述指定第一多媒体类目,根据第一用户对多媒体信息的历史点击行为,确定所述第一用户点击所述指定第一多媒体类目的次数为第一次数;
第二确定子单元,用于根据所述第一用户对多媒体信息的历史点击行为,确定所述第一用户点击所有多媒体类目的次数之和为第二次数;
第一获取子单元,用于获取点击所述指定第一多媒体类目的用户数量以及所有用户数量;
第三确定子单元,用于根据所述第一次数、所述第二次数、所述用户数量及所述所有用户数量,确定所述指定第一多媒体类目的兴趣分值。
15.根据权利要求14所述的装置,其特征在于,所述第三确定子单元,还用于根据所述第一次数、所述第二次数、所述用户数量及所述所有用户数量,通过如下公式确定所述指定第一多媒体类目的兴趣分值:
TF 1 = CK i , j Σ j = 1 n CK i , j
IDF 1 = log N N j
S1=TF1×IDF1
式中,j表示指定第一多媒体类目,i表示第一用户,CKi,j为第一用户i点击指定第一多媒体类目j的第一次数,n为所有多媒体类目的数量,表示第一用户i点击所有多媒体类目的第二次数,Nj为点击指定第一多媒体类目j的用户数量,N为所有用户数量,S1为指定第一多媒体类目j的兴趣分值。
16.根据权利要求13所述的装置,其特征在于,所述第一确定单元包括:
第四确定子单元,用于当将第一用户任一第一多媒体类目作为指定第一多媒体类目时,对于所述指定第一多媒体类目,根据第一用户对多媒体信息的历史点击行为,确定所述第一用户点击所述指定第一多媒体类目的次数为第一次数;
第五确定子单元,用于根据所述第一用户对多媒体信息的历史点击行为,确定所述第一用户点击所有多媒体类目的次数之和为第二次数;
第二获取子单元,用于获取点击所述指定第一多媒体类目的用户数量以及所有用户数量;
第六确定子单元,用于根据所述第一用户点击所述指定第一多媒体类目的时刻,确定所述指定第一多媒体类目的权重;
第七确定子单元,用于根据所述第一次数、所述第二次数、所述用户数量、所述所有用户数量及所述指定第一多媒体类目的权重,确定所述指定第一多媒体类目的兴趣分值。
17.根据权利要求16所述的装置,其特征在于,所述第六确定子单元,还用于根据所述第一用户点击所述指定第一多媒体类目的时刻,通过如下公式确定所述指定第一多媒体类目的权重:
w j = 1 1 + e - t
式中,t表示所述第一用户点击所述指定第一多媒体类目j的时刻与当前时刻之间的差值;
所述第七确定子单元,还用于根据所述第一次数、所述第二次数、所述用户数量、所述所有用户数量及所述指定第一多媒体类目的权重,通过如下公式确定所述指定第一多媒体类目的兴趣分值:
TF 2 = CK i , j × w j Σ j = 1 n ( CK i , j × w j )
IDF 2 = log N N j
S2=TF2×IDF2
式中,j表示指定第一多媒体类目,i表示第一用户,CKi,j为第一用户i点击指定第一多媒体类目j的第一次数,n为所有多媒体类目的数量,表示第一用户i点击所有多媒体类目的第二次数,Nj为点击指定第一多媒体类目j的用户数量,N为所有用户数量,wj为指定第一多媒体类目j的权重,S2为指定第一多媒体类目j的兴趣分值。
18.根据权利要求13所述的装置,其特征在于,所述第三确定单元包括:
第八确定子单元,用于对于任一第二用户,根据所述第二用户对多媒体信息的历史点击行为,确定所述第二用户的各个第一多媒体类目的兴趣分值;
第九确定子单元,用于根据所述第一用户的各个第一多媒体类目的兴趣分值及所述第二用户的各个第一多媒体类目的兴趣分值,确定所述第一用户与所述第二用户在点击多媒体信息时的第一相关度;
第一选择子单元,用于从所有第二用户中选择第一数值的目标第二用户,任一目标第二用户与所述第一用户在点击多媒体信息时的第一相关度满足第一指定条件;
第十确定子单元,用于当将第一用户的任一第二多媒体类目作为指定第二多媒体类目时,对于所述指定第二多媒体类目,根据所述第一用户的各个第一多媒体类目的兴趣分值、每个目标第二用户的各个第一多媒体类目的兴趣分值及所述第一用户与每个目标第二用户之间的第一相关度,确定所述指定第二多媒体类目的兴趣分值。
19.根据权利要求18所述的装置,其特征在于,所述第九确定子单元,还用于根据所述第一用户的各个第一多媒体类目的兴趣分值及所述第二用户的各个第一多媒体类目的兴趣分值,通过如下公式确定所述第一用户与所述第二用户在点击多媒体信息时的第一相关度:
sim ( i , y ) = Σ k = 1 m ( r i , k - r i ‾ ) ( r y , k - r y ‾ ) Σ k = 1 m ( r i , j - r i ‾ ) 2 Σ k = 1 m ( r y , k - r y ‾ ) 2
式中,i为第一用户,y为任一第二用户,m为第一用户i的第一多媒体类目中与第二用户y的第一多媒体类目中共有多媒体类目的数量,k为第一用户的第一多媒体类目和第二用户的第一多媒体类目中共有的任一多媒体类目,ri,k为第一用户i的第一多媒体类目k的兴趣分值,ry,k为第二用户y的第一多媒体类目k的兴趣分值,为第一用户i的所有第一多媒体类目的兴趣分值平均值,为第二用户y的所有第一多媒体类目的兴趣分值平均值;
所述第十确定子单元,还用于根据所述第一用户的各个第一多媒体类目的兴趣分值、每个目标第二用户的各个第一多媒体类目的兴趣分值及所述第一用户与每个目标第二用户之间的第一相关度,通过如下公式确定所述指定第二多媒体类目的兴趣分值:
r i , h = r i ‾ + Σ u ′ ∈ U sim ( i , u ′ ) ( r u ′ , h - r u ′ ‾ ) Σ u ′ ∈ U sim ( i , u ′ )
式中,U为目标第二用户的集合,u'为任一目标第二用户,h为指定第二多媒体类目,ri,h为指定第二多媒体类目h的兴趣分值,sim(i,u')为第一用户i与目标第二用户u'之间的第一相关度,ru',h为目标第二用户u'的第一多媒体类目h的兴趣分值,为目标第二用户u'的所有第一多媒体类目的兴趣分值平均值。
20.根据权利要求13所述的装置,其特征在于,所述第三确定单元包括:
第十一确定子单元,用于根据每个第二用户对多媒体信息的历史点击行为,确定每个第二用户的各个第一多媒体类目的兴趣分值;
第十二确定子单元,用于根据所述第一用户的各个第一多媒体类目的兴趣分值及所有第二用户的各个第一多媒体类目的兴趣分值,确定所有多媒体类目中任两个多媒体类目之间的第二相关度;
第二选择子单元,用于当将第一用户的任一第二多媒体类目作为指定第二多媒体类目时,对于所述指定第二多媒体类目,从第一用户的所有第一多媒体类目中选择第二数值的目标第一多媒体类目,任一目标第一多媒体类目与所述指定第二多媒体类目之间的第二相关度满足第二指定条件;
第十三确定子单元,用于根据各个目标第一多媒体类目的兴趣分值、各个目标第一多媒体类目与所述指定第二多媒体类目之间的第二相关度及所有第二用户对所述指定第二多媒体类目的兴趣分值,确定所述指定第二多媒体类目的兴趣分值。
21.根据权利要求20所述的装置,其特征在于,所述第十二确定子单元,还用于对于任两个多媒体类目,根据所述第一用户的各个第一多媒体类目的兴趣分值及所有第二用户的各个第一多媒体类目的兴趣分值,通过如下公式确定所有多媒体类目中任两个多媒体类目之间的第二相关度:
sim ( a , b ) = Σ d = 1 N ( r a , b - r a ‾ ) ( r b , d - r b ‾ ) Σ d = 1 N ( r a , d - r a ‾ ) 2 Σ d = 1 N ( r b , d - r b ‾ ) 2
式中,a为任一多媒体类目,b为与a不同的其它任一多媒体类目,N为所有用户数量,d为任一用户,ra,d为用户d的多媒体类目a的兴趣分值,为所有用户的多媒体类目a的兴趣分值平均值,rb,d为用户d的多媒体类目b的兴趣分值,为所有用户的多媒体类目b的兴趣分值平均值;
所述第十三确定子单元,还用于根据各个目标第一多媒体类目的兴趣分值、各个目标第一多媒体类目与所述指定第二多媒体类目之间的第二相关度及所有第二用户对所述指定第二多媒体类目的兴趣分值,通过如下公式确定所述指定第二多媒体类目的兴趣分值:
r i , f = r f ‾ + Σ g ′ ∈ G sim ( f , g ′ ) ( r g ′ , i - r g ′ ‾ ) Σ g ′ ∈ G sim ( f , g ′ )
式中,f为指定第二多媒体类目,ri,f为指定第二多媒体类目f的兴趣分值,为所有第二用户对指定第二多媒体类目f的兴趣分值平均值,G为目标第一多媒体类目的集合,g'为任一目标第一多媒体类目,sim(f,g')为目标第一多媒体类目g'与指定第二多媒体类目f之间的第二相关度,rg',i为第一用户i的目标第一多媒体类目g'的兴趣分值,为所有第二用户对目标第一多媒体类目g'的兴趣分值平均值。
22.根据权利要求12所述的装置,其特征在于,所述第一确定模块,还用于根据第一用户对多媒体信息的历史点击行为,确定所述第一用户对所述第一用户的各个第一多媒体类目的点击次数;根据所述第一用户对所述第一用户的各个第一多媒体类目的点击次数,确定所述第一用户感兴趣的第一多媒体类目;
所述第二确定模块,还用于所述根据所述第一用户的各个第一多媒体类目及多个第二用户对多媒体信息的历史点击行为,确定任两个多媒体类目之间的第三相关度;根据任两个多媒体类目之间的第三相关度及所述第一用户感兴趣的第一多媒体类目,确定所述第一用户潜在感兴趣的第二多媒体类目。
CN201510337705.7A 2015-06-17 2015-06-17 多媒体信息的推荐方法及装置 Active CN105005582B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510337705.7A CN105005582B (zh) 2015-06-17 2015-06-17 多媒体信息的推荐方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510337705.7A CN105005582B (zh) 2015-06-17 2015-06-17 多媒体信息的推荐方法及装置

Publications (2)

Publication Number Publication Date
CN105005582A true CN105005582A (zh) 2015-10-28
CN105005582B CN105005582B (zh) 2017-09-15

Family

ID=54378258

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510337705.7A Active CN105005582B (zh) 2015-06-17 2015-06-17 多媒体信息的推荐方法及装置

Country Status (1)

Country Link
CN (1) CN105005582B (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105574132A (zh) * 2015-12-15 2016-05-11 海信集团有限公司 一种多媒体文件推荐方法和终端
CN105956086A (zh) * 2016-04-29 2016-09-21 合网络技术(北京)有限公司 多媒体资源的推荐方法和装置
CN106297605A (zh) * 2016-08-25 2017-01-04 深圳前海弘稼科技有限公司 多媒体信息的播放方法、播放装置和种植设备
CN106682111A (zh) * 2016-12-06 2017-05-17 腾讯科技(深圳)有限公司 一种数据推荐方法及其设备
CN108230101A (zh) * 2017-12-29 2018-06-29 百度在线网络技术(北京)有限公司 信息推荐方法和装置
WO2018133566A1 (zh) * 2017-01-17 2018-07-26 腾讯科技(深圳)有限公司 推广信息新鲜度确定方法及装置、电子设备及存储介质
CN109241301A (zh) * 2018-08-31 2019-01-18 北京优酷科技有限公司 资源推荐方法及装置
CN109388739A (zh) * 2017-08-03 2019-02-26 合信息技术(北京)有限公司 多媒体资源的推荐方法及装置
CN109460512A (zh) * 2018-10-25 2019-03-12 腾讯科技(北京)有限公司 推荐信息处理方法、装置、设备及存储介质
CN109559140A (zh) * 2017-09-26 2019-04-02 广州市动景计算机科技有限公司 拓展用户兴趣度组别的方法、装置、计算设备及存储介质
CN110727705A (zh) * 2019-10-12 2020-01-24 腾讯科技(深圳)有限公司 信息推荐方法、装置、电子设备及计算机可读存储介质
CN111711838A (zh) * 2020-06-23 2020-09-25 广州酷狗计算机科技有限公司 视频切换方法、装置、终端、服务器及存储介质
CN112036988A (zh) * 2020-09-24 2020-12-04 上海风秩科技有限公司 标签生成方法和装置、存储介质及电子设备
CN113051471A (zh) * 2021-03-15 2021-06-29 北京线点科技有限公司 数据推荐方法、装置和***

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113254780A (zh) * 2021-06-08 2021-08-13 武汉卓尔数字传媒科技有限公司 信息处理的方法、装置、电子设备及计算机存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102411596A (zh) * 2010-09-21 2012-04-11 阿里巴巴集团控股有限公司 一种信息推荐方法及***
WO2013139239A1 (en) * 2012-03-21 2013-09-26 Tencent Technology (Shenzhen) Company Limited Method for recommending users in social network and the system thereof
CN104391999A (zh) * 2014-12-15 2015-03-04 北京国双科技有限公司 信息推荐方法和装置
CN104504059A (zh) * 2014-12-22 2015-04-08 合一网络技术(北京)有限公司 多媒体资源推荐方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102411596A (zh) * 2010-09-21 2012-04-11 阿里巴巴集团控股有限公司 一种信息推荐方法及***
WO2013139239A1 (en) * 2012-03-21 2013-09-26 Tencent Technology (Shenzhen) Company Limited Method for recommending users in social network and the system thereof
CN104391999A (zh) * 2014-12-15 2015-03-04 北京国双科技有限公司 信息推荐方法和装置
CN104504059A (zh) * 2014-12-22 2015-04-08 合一网络技术(北京)有限公司 多媒体资源推荐方法

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105574132A (zh) * 2015-12-15 2016-05-11 海信集团有限公司 一种多媒体文件推荐方法和终端
CN105956086A (zh) * 2016-04-29 2016-09-21 合网络技术(北京)有限公司 多媒体资源的推荐方法和装置
CN105956086B (zh) * 2016-04-29 2020-03-17 合一网络技术(北京)有限公司 多媒体资源的推荐方法和装置
CN106297605A (zh) * 2016-08-25 2017-01-04 深圳前海弘稼科技有限公司 多媒体信息的播放方法、播放装置和种植设备
CN106682111A (zh) * 2016-12-06 2017-05-17 腾讯科技(深圳)有限公司 一种数据推荐方法及其设备
CN106682111B (zh) * 2016-12-06 2019-09-13 腾讯科技(深圳)有限公司 一种数据推荐方法及其设备
WO2018133566A1 (zh) * 2017-01-17 2018-07-26 腾讯科技(深圳)有限公司 推广信息新鲜度确定方法及装置、电子设备及存储介质
CN109388739A (zh) * 2017-08-03 2019-02-26 合信息技术(北京)有限公司 多媒体资源的推荐方法及装置
CN109559140A (zh) * 2017-09-26 2019-04-02 广州市动景计算机科技有限公司 拓展用户兴趣度组别的方法、装置、计算设备及存储介质
CN108230101A (zh) * 2017-12-29 2018-06-29 百度在线网络技术(北京)有限公司 信息推荐方法和装置
CN109241301A (zh) * 2018-08-31 2019-01-18 北京优酷科技有限公司 资源推荐方法及装置
CN109460512A (zh) * 2018-10-25 2019-03-12 腾讯科技(北京)有限公司 推荐信息处理方法、装置、设备及存储介质
CN110727705A (zh) * 2019-10-12 2020-01-24 腾讯科技(深圳)有限公司 信息推荐方法、装置、电子设备及计算机可读存储介质
CN110727705B (zh) * 2019-10-12 2021-05-25 腾讯科技(深圳)有限公司 信息推荐方法、装置、电子设备及计算机可读存储介质
CN111711838A (zh) * 2020-06-23 2020-09-25 广州酷狗计算机科技有限公司 视频切换方法、装置、终端、服务器及存储介质
CN112036988A (zh) * 2020-09-24 2020-12-04 上海风秩科技有限公司 标签生成方法和装置、存储介质及电子设备
CN112036988B (zh) * 2020-09-24 2023-04-07 上海风秩科技有限公司 标签生成方法和装置、存储介质及电子设备
CN113051471A (zh) * 2021-03-15 2021-06-29 北京线点科技有限公司 数据推荐方法、装置和***

Also Published As

Publication number Publication date
CN105005582B (zh) 2017-09-15

Similar Documents

Publication Publication Date Title
CN105005582A (zh) 多媒体信息的推荐方法及装置
US10693981B2 (en) Provisioning personalized content recommendations
CN107222566B (zh) 信息推送方法、装置及服务器
KR102064203B1 (ko) 이모티콘 추천 방법 및 장치
US8583685B2 (en) Determination of category information using multiple stages
CN106326391B (zh) 多媒体资源推荐方法及装置
CN108090208A (zh) 融合数据处理方法及装置
CN105335409A (zh) 一种目标用户的确定方法、设备和网络服务器
CN103942712A (zh) 基于产品相似度的电子商务推荐***及其方法
CN105095256A (zh) 基于用户之间相似度进行信息推送的方法及装置
CN109074366B (zh) 用于计算机网络路由基础架构的增益调整组件
US20180307733A1 (en) User characteristic extraction method and apparatus, and storage medium
CN106326297B (zh) 一种应用程序推荐方法及装置
CN104750760A (zh) 一种推荐应用软件的实现方法及装置
US20200272933A1 (en) Method and apparatus for mining target feature data
CN105022807A (zh) 信息推荐方法及装置
WO2015185020A1 (en) Information category obtaining method and apparatus
CN111523035B (zh) App浏览内容的推荐方法、装置、服务器和介质
US20240089177A1 (en) Heterogeneous Graph Clustering Using a Pointwise Mutual Information Criterion
CN102959539B (zh) 一种业务交叉时的项目推荐方法及***
CN104199836A (zh) 一种基于子兴趣划分的标注用户模型建构方法
US10785332B2 (en) User lifetime revenue allocation associated with provisioned content recommendations
CN104123321A (zh) 一种确定推荐图片的方法及装置
CN108345620B (zh) 品牌信息处理方法、装置、存储介质及电子设备
CN104166722A (zh) 一种推荐网站的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant