CN110427545B - 一种信息推送方法及*** - Google Patents

一种信息推送方法及*** Download PDF

Info

Publication number
CN110427545B
CN110427545B CN201810387677.3A CN201810387677A CN110427545B CN 110427545 B CN110427545 B CN 110427545B CN 201810387677 A CN201810387677 A CN 201810387677A CN 110427545 B CN110427545 B CN 110427545B
Authority
CN
China
Prior art keywords
product
user
similarity
label
products
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810387677.3A
Other languages
English (en)
Other versions
CN110427545A (zh
Inventor
黄亮亮
黄永宝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Suzhou Software Technology Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Suzhou Software Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Suzhou Software Technology Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201810387677.3A priority Critical patent/CN110427545B/zh
Publication of CN110427545A publication Critical patent/CN110427545A/zh
Application granted granted Critical
Publication of CN110427545B publication Critical patent/CN110427545B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种信息推送方法及***,用以解决现有技术中存在的云平台不能快速、准确的向用户推送符合其真实需求的产品信息的技术问题。包括:首先,收集用户在云平台中的操作记录;然后,计算任一用户对每个产品的兴趣度:从所有产品中,确定与每个产品相似度达到预设阈值的产品;基于各操作记录及各相似产品,计算每个产品与每个相似产品之间的操作相似度;基于所有的相似产品及操作相似度和修正因子,按照预设算法计算任一用户对每个产品的兴趣度;最后,按预设的规则,对所有的兴趣度进行排序,根据排序结果获得预设数量的产品信息并将预设数量的产品信息推送给任一用户。

Description

一种信息推送方法及***
技术领域
本发明涉及云计算领域,尤其是涉及一种信息推送方法及***。
背景技术
随着云计算技术的发展,越来越多的客户选择在公有云上托管业务。然而,随着公有云的普及,其在给用户提供便利性的同时,也正在给公有云平台带来挑战。
公有云平台为了帮助用户更合理地使用其产品,需要帮助用户发现自身对产品的需求,这就需要公有云平台能够利用推荐***分析用户潜在的需求,并将合适的产品信息推送给用户。
在目前的推荐***中,按照推荐算法可简单分为基于内容的推荐、基于关联规则推荐、基于效用推荐、基于知识推荐、基于协同过滤算法(Collaborative Filtering,CF)的推荐等。其中,以协同过滤算法的应用较为广泛。
协同过滤算法的基本思想,是根据用户之前的喜好以及其他兴趣相近的用户的选择来给用户推荐物品。常见的协同过滤算法分为基于用户的协同过滤(User-based CF)以及基于物品的协同过滤(Item-based CF)。其中,基于用户的协同过滤算法可以是:如果用户A和用户B喜好相似,那么推荐用户B喜欢的东西给用户A。而基于物品的协同过滤,则是基于另外一种思想:如果用户A喜欢物品B,而物品B和物品C相似,那么推荐物品C给用户A。
然而,如果采用传统的User-based CF算法,将公有云平台上的产品推荐给用户,则需要维护用户和用户对应的计算矩阵,其计算量会随着用户数量的增加而飞快增加。由于公有云平台的特点是用户数量增长非常迅速,但产品的数量不会像电商一样快速增长。因此,在公有云平台上,传统的User-based CF算法会带来数据矩阵的稀疏性问题,致使运算速度较慢、进而导致推荐结果不够准确、快速的问题。
而如果采用传统的Item-based CF算法,将公有云平台上的产品推荐给用户,由于这种算法的关键是计算两个物品间的相似度。尽管该算法适用于公有云平台,但由于公有云平台的物品数量相对于用户数目太少,因此如果使用此算法,将会导致物品和物品的相似边界会很模糊,进而使推荐给用户的产品不够准确、不能反映用户的真实需求。
因此,如何快速、准确的向用户推送符合其真实需求的产品信息,成为一个亟待解决的技术问题。
发明内容
本发明提供一种信息推送方法及***,用以解决现有技术中存在的云平台不能快速、准确的向用户推荐符合其真实需求的产品的技术问题。
第一方面,为解决上述技术问题,本发明实施例提供的一种信息推送方法的技术方案如下:
收集用户在所述云平台中的操作记录,获得操作记录集合;
计算任一用户对每个产品的兴趣度:
从所有产品中,确定与所述每个产品相似度达到预设阈值的产品,获得相似产品集;
基于所述操作记录集合及所述相似产品集,计算所述每个产品与所述相似产品集中的每个相似产品之间的操作相似度,获得操作相似度集;其中,所述操作相似度是指用户对所述每个产品与所述每个相似产品之间进行操作的相似程度;
基于所述相似产品集及所述操作相似度和修正因子,按照预设算法计算所述任一用户对所述每个产品的兴趣度;其中,所述修正因子用于降低活跃用户对产品的兴趣度的影响,所述活跃用户为对产品操作次数达到预设数值的用户;
将所有的所述每个产品的兴趣度构建成一个集合,获得所述任一用户对所有产品的兴趣度集,并按预设的规则,对所述兴趣度集中的兴趣度进行排序,根据排序结果获得预设数量的产品信息并将所述预设数量的产品信息推送给所述任一用户。
在计算产品兴趣度时,通过先将产品相似度达到预设阈值的产品确定为相似产品,再对由相似产品构成的相似产品集中的每个产品的操作相似度进行计算,最后按照预设算法及相似产品集中各产品对应的操作相似度、修正因子,计算用户对各产品的兴趣度,进而按照预设的规则对各产品的兴趣度进行排序,并根据排序结果,将预设数量的产品信息推送给任一用户。这样便能将用户的行为、分类融入进用户的操作中,以便反映出用户对产品兴趣度的影响,进而提升推送信息的可信度,准确的反映用户的真实需求。
可选的,从所有产品中,确定与所述每个产品相似度达到预设阈值的产品之前,还包括:
基于产品分类标签集,按照第一相似度公式计算所述每个产品与所述其它任一产品的产品标签相似度,获得产品标签相似度集;
对所述产品标签相似度集中的产品标签相似度进行和运算,获得所述产品相似度。
由于一个产品通常可能同时具有多种属性,本发明通过产品分类标签集,计算任一产品在任一产品标签上的相似度,并将任一产品在所有产品标签上的相似度进行和运算,以得到该任一产品的产品相似度,从而实现将产品分类标签融入到产品相似度之中,进而通过产品相似度全面的反应出不同产品之间的相似程度,确保计算产品兴趣度的准确性。
可选的,所述第一相似度公式,具体为:
Figure BDA0001642634420000041
其中,T为产品分类标签集,t为T中的一个产品分类标签,Pj t为待计算兴趣度的每个产品,Pi t为除Pj t之外的其它任一产品,|Pi t|为具有产品分类标签t的产品Pi的值,|Pj t|为具有产品分类标签t的产品Pj的值,|Pi T∩Pj T|为产品Pi、产品Pj具有相同产品分类标签的数量,c为一预设常量。
可选的,计算所述每个产品与所述相似产品集中的每个相似产品之间的操作相似度,包括:
通过操作行为评分机制及所述操作记录集合,计算所述每个产品与任一相似产品的操作分值集;其中,所述操作分值集中的操作分值是所述每个产品与所述任一相似产品所共有的操作对应的操作评分值;
基于所述操作分值集及所述每个产品与所述任一相似产品所具有的相同操作类型的总数量,按照第二相似度计算公式进行计算,获得所述每个产品与所述任一相似产品的操作相似度;其中,所述操作相似度与所述总数量成反比,与所述操作分值集中的各评分值之和成正比。
通过操作评分机制,将用户对产品的操作行为融入进操作相似度的计算当中,通过操作相似度反应用户对不同产品在操作上的相似性,为计算用户对产品的兴趣做好准备。
可选的,所述第二相似度计算公式,具体为:
Figure BDA0001642634420000042
其中,simc(Pi C,Pj C)为所述任一相似产品Pi与所述每个产品Pj之间的操作相似度,C为所有用户对云平台中的产品产生的操作记录集合,c为C中的一个操作,Pi C为用户对产品Pi的操作集合,Pj C为用户对产品Pj的操作集合,Pi C∩Pj C为用户对产品Pi、Pj执行了相同操作的操作类型的集合,m为所述相同操作的操作集合中的一类操作,|Pi C∩Pj C|为所述相同操作的操作集合中的元素总数量,scorem为所述操作集合中操作类型为m所对应的评分值。
可选的,按照预设算法计算所述任一用户对所述每个产品的兴趣度,包括:
基于用户的用户分类标签,针对所述任一用户计算每个用户分类标签与剩余的其它任一用户分类标签之间的用户标签相似度;
对所述任一用户所具有的各用户标签相似度进行加权计算;
对加权后的各用户标签相似度进行和运算,获得所述任一用户对所述每个产品的兴趣度。
第二方面,本发明实施例提供了一种用于信息推荐的***,包括:
收集单元,用于收集用户在所述云平台中的操作记录,获得操作记录集合;
处理单元,用于计算任一用户对每个产品的兴趣度:
从所有产品中,确定与所述每个产品相似度达到预设阈值的产品,获得相似产品集;
基于所述操作记录集合及所述相似产品集,计算所述每个产品与所述相似产品集中的每个相似产品之间的操作相似度,获得操作相似度集;其中,所述操作相似度是指用户对所述每个产品与所述每个相似产品之间进行操作的相似程度;
基于所述相似产品集及所述操作相似度和修正因子,按照预设算法计算所述任一用户对所述每个产品的兴趣度;其中,所述修正因子用于降低活跃用户对产品的兴趣度的影响,所述活跃用户为对产品操作次数达到预设数值的用户;
推送单元,用于将所有的所述每个产品的兴趣度构建成一个集合,获得所述任一用户对所有产品的兴趣度集,并按预设的规则,对所述兴趣度集中的兴趣度进行排序,根据排序结果获得预设数量的产品信息并将所述预设数量的产品信息推送给所述任一用户。
可选的,从所有产品中,确定与所述每个产品相似度达到预设阈值的产品之前,所述处理单元还用于:
基于产品分类标签集,按照第一相似度公式计算所述每个产品与所述其它任一产品的产品标签相似度,获得产品标签相似度集;
对所述产品标签相似度集中的产品标签相似度进行和运算,获得所述产品相似度。
可选的,所述第一相似度公式,具体为:
Figure BDA0001642634420000061
其中,T为产品分类标签集,t为T中的一个产品分类标签,Pj t为待计算兴趣度的每个产品,Pi t为除Pj t之外的其它任一产品,|Pi t|为具有产品分类标签t的产品Pi的值,|Pj t|为具有产品分类标签t的产品Pj的值,|Pi T∩Pj T|为产品Pi、产品Pj具有相同产品分类标签的数量,c为一预设常量。
可选的,计算所述每个产品与所述相似产品集中的每个相似产品之间的操作相似度时,所述处理单元还用于:
通过操作行为评分机制及所述操作记录集合,计算所述每个产品与任一相似产品的操作分值集;其中,所述操作分值集中的操作分值是所述每个产品与所述任一相似产品所共有的操作对应的操作评分值;
基于所述操作分值集及所述每个产品与所述任一相似产品所具有的相同操作类型的总数量,按照第二相似度计算公式进行计算,获得所述每个产品与所述任一相似产品的操作相似度;其中,所述操作相似度与所述总数量成反比,与所述操作分值集中的各评分值之和成正比。
可选的,所述第二相似度计算公式,具体为:
Figure BDA0001642634420000062
其中,simc(Pi C,Pj C)为所述任一相似产品Pi与所述每个产品Pj之间的操作相似度,C为所有用户对云平台中的产品产生的操作记录集合,c为C中的一个操作,Pi C为用户对产品Pi的操作集合,Pj C为用户对产品Pj的操作集合,Pi C∩Pj C为用户对产品Pi、Pj执行了相同操作的操作类型的集合,m为所述相同操作的操作集合中的一类操作,|Pi C∩Pj C|为所述相同操作的操作集合中的元素总数量,scorem为所述操作集合中操作类型为m所对应的评分值。
可选的,按照预设算法计算所述任一用户对所述每个产品的兴趣度时,所述处理单元还用于:
基于用户的用户分类标签,针对所述任一用户计算每个用户分类标签与剩余的其它任一用户分类标签之间的用户标签相似度;
对所述任一用户所具有的各用户标签相似度进行加权计算;
对加权后的各用户标签相似度进行和运算,获得所述任一用户对所述每个产品的兴趣度。
第三方面,本发明实施例还提供一种用于信息推送的装置,包括:
至少一个处理器,以及
与所述至少一个处理器连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述至少一个处理器通过执行所述存储器存储的指令,执行如上述第一方面所述的方法。
第四方面,本发明实施例还提供一种计算机可读存储介质,包括:
所述计算机可读存储介质存储有计算机指令,当所述计算机指令在计算机上运行时,使得计算机执行如上述第一方面所述的方法。
通过本发明实施例的上述一个或多个实施例中的技术方案,本发明实施例至少具有如下技术效果:
通过本发明提供的上述实施例,使得在计算产品兴趣度时,能够通过先将产品相似度达到预设阈值的产品确定为相似产品,再对由相似产品构成的相似产品集中的每个产品的操作相似度进行计算,最后按照预设算法及相似产品集中各产品对应的操作相似度、修正因子,计算用户对各产品的兴趣度,进而按照预设的规则对各产品的兴趣度进行排序,并根据排序结果,将预设数量的产品信息推送给任一用户。这样便能将用户的行为、分类融入进用户的操作中,以便反映出用户对产品兴趣度的影响,进而提升推送信息的可信度,准确的反映用户的真实需求。
附图说明
图1为本发明实施例提供的一种信息推送方法的流程图;
图2为本发明实施例提供的一种信息推送***的结构示意图。
具体实施方式
本发明实施列提供一种信息推送方法,以解决现有技术中存在的云平台不能快速、准确的向用户推送符合其真实需求的产品信息的技术问题。
本申请实施例中的技术方案为解决上述的技术问题,总体思路如下:
提供一种信息推送方法,包括:首先,收集用户在云平台中的操作记录,获得操作记录集合;然后,计算任一用户对每个产品的兴趣度:从所有产品中,确定与每个产品相似度达到预设阈值的产品,获得相似产品集;基于操作记录集合及相似产品集,计算每个产品与相似产品集中的每个相似产品之间的操作相似度,获得操作相似度集;其中,操作相似度是指用户对每个产品与每个相似产品之间进行操作的相似程度;基于相似产品集及操作相似度和修正因子,按照预设算法计算任一用户对每个产品的兴趣度;其中,修正因子用于降低活跃用户对产品的兴趣度的影响,活跃用户为对产品操作次数达到预设数值的用户;最后,将所有的每个产品的兴趣度构建成一个集合,获得任一用户对所有产品的兴趣度集,并按预设的规则,对兴趣度集中的兴趣度进行排序,根据排序结果获得预设数量的产品信息并将预设数量的产品信息推送给任一用户。
由于在上述方案中,在计算产品兴趣度时,通过先将产品相似度达到预设阈值的产品确定为相似产品,再对由相似产品构成的相似产品集中的每个产品的操作相似度进行计算,最后按照预设算法及相似产品集中各产品对应的操作相似度、修正因子,计算用户对各产品的兴趣度,进而按照预设的规则对各产品的兴趣度进行排序,并根据排序结果,将预设数量的产品信息推送给任一用户。这样便能将用户的行为、分类融入进用户的操作中,以便反映出用户对产品兴趣度的影响,进而提升推送信息的可信度,准确的反映用户的真实需求。
为了更好的理解上述技术方案,下面通过附图以及具体实施例对本发明技术方案做详细的说明,应当理解本发明实施例以及实施例中的具体特征是对本发明技术方案的详细的说明,而不是对本发明技术方案的限定,在不冲突的情况下,本发明实施例以及实施例中的技术特征可以相互组合。
请参考图1,本发明实施例提供一种信息推荐方法,该方法的处理过程如下。
步骤101:收集用户在云平台中的操作记录,获得操作记录集合。
随着云计算技术的发展,越来越多的用户选择在云平台上托管业务,这样做的好处不仅可以降低企业成本、还能使企业通过使用云平台上的资源使其需要在云平台上运行的业务更加稳定。
用户在使用云平台上的产品进行业务托管前,通常会浏览云平台所提供的产品,并执行相应的操作。
如,在浏览产品的过程中浏览到符合其需求的产品,可能会进一步的浏览产品的详情介绍页,根据详情页的介绍认为可以将该产品作为备选项时,则可能执行收藏操作、分享操作、试用操作等,在经过对产品的比较分析之后,可能会对产品进行订购操作,进而进行付款,或者在付款时听说还有更合适的产品则会选择暂时不付款,或者用户正在使用的产品快到期了,用户选择继续续订该产品等等。
在云平台中,可以将用户在其平台上执行的各种操作都记录下来,形成操作记录集合。
例如,用户A在2018.3.16对短信服务进行了浏览操作和试用操作;用户A在2018.3.18对邮件服务进行了定稿操作;用户B在2018.3.15对浏览服务进行了续订操作。
在记录了用户的操作记录之后,便可执行步骤102。
步骤102:计算任一用户对每个产品的兴趣度。
步骤103:将所有的每个产品的兴趣度构建成一个集合,获得任一用户对所有产品的兴趣度集,并按预设的规则,对兴趣度集中的兴趣度进行排序,根据排序结果获得预设数量的产品信息并将预设数量的产品信息推送给任一用户。
其中,预设的规则具体为:
对产品集中的进行过滤,获得过滤后的产品集;
基于排序规则或推荐理由,对过滤后的产品集中的产品的兴趣度进行排序,获得排序结果。
例如,对产品集中的产品进行过滤,可以是将用户已收藏的产品滤除在外,也可以是将该用户账户无法购买的产品进行过滤。然后,对过滤后的产品集中的产品的兴趣度进行排序,或进行推荐理由组合排序,根据排序结果获得预设数量的产品信息并将预设数量的产品信息推送给任一用户。
通过步骤101收集了所有用户的操作记录之后,需要通过一种度量指标,来预测用户可能对哪些产品较感兴趣,进而将这些产品推荐给用户。
在本发明实施例中,是利用步骤102计算任一用户对每个产品的兴趣度,通过用户对产品的兴趣度指标,进行预测。具体的,每个用户对云平台中的产品的兴趣度的计算,可以通过以下方式来实现:
步骤102a:从所有产品中,确定与每个产品相似度达到预设阈值的产品,获得相似产品集。
在从所有产品中,确定与每个产品相似度达到预设阈值的产品之前,还需要先计算出每个产品的产品相似度,具体的计算方式如下:
首先,基于产品分类标签集,按照第一相似度公式计算每个产品与其它任一产品的产品标签相似度,获得产品标签相似度集;
然后,对产品标签相似度集中的产品标签相似度进行和运算,获得产品相似度。
在云平台中,将其为用户提供的产品进行标签化,以便对各类产品进行管理。
例如,可以根据产品的资源类别将产品分为云主机、云硬盘等,还可以根据产品的目标客户将产品分为互联网客户产品、集团客户产品或政企客户产品等,还可以根据产品的价格区间,将产品分为低价位产品、中价位产品、高价位产品等。
具体产品标签的设置方式,可以根据云平台的实际情况进行设置,在此不做限定。
由于一个产品通常可能同时具有多种属性,本发明通过产品分类标签集,计算任一产品在任一产品标签上的相似度,并将任一产品在所有产品标签上的相似度进行和运算,以得到该任一产品的产品相似度,从而实现将产品分类标签融入到产品相似度之中,进而通过产品相似度全面的反应出不同产品之间的相似程度,确保计算产品兴趣度的准确性。
通过上述方式,对产品进行标签化后,可以基于产品分类标签集,按照第一相似度公式计算每个产品与其它任一产品的产品标签相似度。
具体的,第一相似度公式为;
Figure BDA0001642634420000111
其中,T为产品分类标签集,t为T中的一个产品分类标签,Pj t为待计算兴趣度的每个产品,Pi t为除Pj t之外的其它任一产品,|Pi t|为具有产品分类标签t的产品Pi的值,|Pj t|为具有产品分类标签t的产品Pj的值,|Pi T∩Pj T|为产品Pi、产品Pj具有相同产品分类标签的数量,c为一预设常量。
具体实例1,在操作集合中,用户A对产品1执行了浏览操作、收藏操作,对产品2进行了浏览操作、收藏操作、订购未付款操作、试用操作,对产品3执行了浏览操作、分享操作、续订操作。其中,产品标签集中的产品标签分为云主机、云硬盘、云专有网络,对应的产品标签值依次为1、2、3;产品1具有云主机标签、云硬盘标签,产品2具有云硬盘标签、云专有网络标签,主机2具有云主机标签、云专有网络标签,假设c为0。
则,用户A对产品1相对于产品2的云主机的产品标签相似度为:
Figure BDA0001642634420000121
同理可得到产品相对于产品2的云硬盘及云专有网络标签的产品标签相似度均为0。
在通过公式(1)计算出每个产品与其它任一产的产品标签相似度之后,便可将这些产品标签相似度构建为一个集合,从而获得产品标签相似度集。
之后,对产品标签相似度集中的产品标签进行和运算,便能获得每个产品的产品相似度。
具体的,产品相似度的计算公式如下:
simp=∑t∈T(simt(Pi T,Pj T)) (2)
其中,simp为产品Pj与产品Pi之间的产品相似度。
依然以具体实例1中参数为例,可以计算出产品1相对于产品2的产品相似度为:0.707+0+0=0.707。
通过公式(2)可以计算出每个产品与其它任一产品的产品相似度,进而获得每个产品的产品相似度集。
在获得每个产品的产品相似度集之后,还需要计算每个产品的操作相似度,并获得操作相似度集。具体请见步骤102b。
步骤102b:基于操作记录集合及相似产品集,计算每个产品与相似产品集中的每个相似产品之间的操作相似度,获得操作相似度集;其中,操作相似度是指用户对每个产品与每个相似产品之间进行操作的相似程度。
具体的,计算每个产品与相似产品集中的每个相似产品之间的操作相似度,可以通过以下方式来实现:
首先,通过操作行为评分机制及操作记录集合,计算每个产品与任一相似产品的操作分值集;其中,操作分值集中的操作分值是每个产品与任一相似产品所共有的操作对应的操作评分值;
然后,基于操作分值集及每个产品与任一相似产品所具有的相同操作类型的总数量,按照第二相似度计算公式进行计算,获得每个产品与任一相似产品的操作相似度;其中,操作相似度与总数量成反比,与操作分值集中的各评分值之和成正比。
预设的操作行为评分机制,可以是为不同的操作设置不同的分值。
例如:可以将浏览详情页操作评定为1分,订购操作评定为2分,分享操作评定为2分,订购单未付款操作评定为3分,收藏操作评定为3分,试用操作评定为4分,定购成功评定为4分,续订操作评定为5分等。
通过操作评分机制,将用户对产品的操作行为融入进操作相似度的计算当中,通过操作相似度反应用户对不同产品在操作上的相似性,为计算用户对产品的兴趣做好准备。
根据上述评分机制,对操作记录集合中的操作记录进行评分,进而计算每个产品与任一相似产品的操作分值集。然后,根据操作分值集及每个产品与任一相似产品所具有的相同操作类型的总数量,按照第二相似度计算公式计算得每个产品与任一相似产品的操作相似度。
具体的,第二相似度计算公式为:
Figure BDA0001642634420000131
其中,simc(Pi C,Pj C)为任一相似产品Pi与每个产品Pj之间的操作相似度,C为所有用户对云平台中的产品产生的操作记录集合,c为C中的一个操作,Pi C为用户对产品Pi的操作集合,Pj C为用户对产品Pj的操作集合,Pi C∩Pj C为用户对产品Pi、Pj执行了相同操作的操作类型的集合,m为相同操作的操作集合中的一类操作,|Pi C∩Pj C|为相同操作的操作集合中的元素总数量,scorem为操作集合中操作类型为m所对应的评分值。
依然以具体实例1中产品1、2、3的例子为例,其中,假设浏览操作、分享操作、订购未付款操作、收藏操作、试用操作、续订操作对应的值依次分别为:1、3、4、5、6、8,则根据公式(3)计算产品1相对于产品2的操作相似度为:
Figure BDA0001642634420000141
同理,可以计算的产品1相对于产品3的操作相似度为1。
需要理解的是,在本发明中,无论是先计算产品相似度再计算操作相似度,还是先计算操作相似度再计算产品相似度都是一样的,故,上述对步骤102a、步骤102b的描述并不应被理解为对本发明计算先后顺序的限定。
通过步骤102a、步骤102b计算得到每个产品的产品相似度集和操作相似度之后,便可执行步骤102c。
步骤102c:基于相似产品集及操作相似度和修正因子,按照预设算法计算任一用户对每个产品的兴趣度;其中,修正因子用于降低活跃用户对产品的兴趣度的影响,活跃用户为对产品操作次数达到预设数值的用户。
修正因子的计算公式如下:
Figure BDA0001642634420000142
其中,C为修正因子,c为一经验值常量,N为一用户在云平台中总的操作次数,x为正整数。
例如,用户A在云平台中,对其下的产品总共执行了500次操作,c为3,x为e≈2.71828,则C=1/ln(3+500)=1/6.22=0.161。用户B在云平台上,对其下的产品总共执行了50次操作,c为3,则C=1/ln(3+50)=1/3.97=0.252。
具体的,按照预设算法计算任一用户对每个产品的兴趣度,包括:
首先,基于用户的用户分类标签,针对任一用户计算每个用户分类标签与剩余的其它任一用户分类标签之间的用户标签相似度。
其次,对任一用户所具有的各用户标签相似度进行加权计算。
最后,对加权后的各用户标签相似度进行和运算,获得任一用户对每个产品的兴趣度。
其中,用户标签相似度的计算公式为:
simuL(Pi,Pj)=simp×simc×C (5)
其中,simuL(Pi,Pj)为用户u对产品Pj和Pi在用户标签L上的用户标签相似度。
以前面公式(2)、(3)、(4)中的例子为例,可以计算出用户u在用户标签L上的用户标签相似度为:0.707×3.5×0.161=0.398。
同样的方式,可以计算关于用户u在所有用户标签上的相似度,让通过对用户u在所有标签上的相似度进行加权计算,具体为用户标签相似度乘以对应用户标签的权重。
例如,用户标签集是由互联网用户标签、省集团用户标签、内部用户标签、政企集团用户标签,这些用户标签对应的权重依次为1、2、3、4,产品1以及产品2在用户标签集中对应的各用户标签相似度依次为0.892、0.635、0.796、0.126,则对用户u在对用户标签集中的用户标签相似度进行加权后,得到的值依次为0.892、1.27、2.388、0.504。
在计算出每个用户标签的加权值之后,对加权后的各用户标签相似度进行和运算,获得任一用户对每个产品的兴趣度。
通过步骤102,计算出云平台中任一用户对每个产品的兴趣度之后,便可通过步骤103,将所有的每个产品的兴趣度构建成一个集合,获得任一用户对所有产品的兴趣度集,并按预设的规则,对兴趣度集中的兴趣度进行排序,根据排序结果获得预设数量的产品信息并将预设数量的产品信息推送给任一用户。
基于同一发明构思,本发明一实施例中提供一种用于信息推送的***,该***的信息推送方法的具体实施方式可参见方法实施例部分的描述,重复之处不再赘述,请参见图2,该***包括:
收集单元201,用于收集用户在所述云平台中的操作记录,获得操作记录集合;
处理单元202,用于计算任一用户对每个产品的兴趣度:
从所有产品中,确定与所述每个产品相似度达到预设阈值的产品,获得相似产品集;
基于所述操作记录集合及所述相似产品集,计算所述每个产品与所述相似产品集中的每个相似产品之间的操作相似度,获得操作相似度集;其中,所述操作相似度是指用户对所述每个产品与所述每个相似产品之间进行操作的相似程度;
基于所述相似产品集及所述操作相似度和修正因子,按照预设算法计算所述任一用户对所述每个产品的兴趣度;其中,所述修正因子用于降低活跃用户对产品的兴趣度的影响,所述活跃用户为对产品操作次数达到预设数值的用户;
推送单元203,用于将所有的所述每个产品的兴趣度构建成一个集合,获得所述任一用户对所有产品的兴趣度集,并按预设的规则,对所述兴趣度集中的兴趣度进行排序,根据排序结果获得预设数量的产品信息并将所述预设数量的产品信息推送给所述任一用户。
可选的,从所有产品中,确定与所述每个产品相似度达到预设阈值的产品之前,所述处理单元202还用于:
基于产品分类标签集,按照第一相似度公式计算所述每个产品与所述其它任一产品的产品标签相似度,获得产品标签相似度集;
对所述产品标签相似度集中的产品标签相似度进行和运算,获得所述产品相似度。
可选的,所述第一相似度公式,具体为:
Figure BDA0001642634420000171
其中,T为产品分类标签集,t为T中的一个产品分类标签,Pj t为待计算兴趣度的每个产品,Pi t为除Pj t之外的其它任一产品,|Pi t|为具有产品分类标签t的产品Pi的值,|Pj t|为具有产品分类标签t的产品Pj的值,|Pi T∩Pj T|为产品Pi、产品Pj具有相同产品分类标签的数量,c为一预设常量。
可选的,计算所述每个产品与所述相似产品集中的每个相似产品之间的操作相似度时,所述处理单元202还用于:
通过操作行为评分机制及所述操作记录集合,计算所述每个产品与任一相似产品的操作分值集;其中,所述操作分值集中的操作分值是所述每个产品与所述任一相似产品所共有的操作对应的操作评分值;
基于所述操作分值集及所述每个产品与所述任一相似产品所具有的相同操作类型的总数量,按照第二相似度计算公式进行计算,获得所述每个产品与所述任一相似产品的操作相似度;其中,所述操作相似度与所述总数量成反比,与所述操作分值集中的各评分值之和成正比。
可选的,所述第二相似度计算公式,具体为:
Figure BDA0001642634420000172
其中,simc(Pi C,Pj C)为所述任一相似产品Pi与所述每个产品Pj之间的操作相似度,C为所有用户对云平台中的产品产生的操作记录集合,c为C中的一个操作,Pi C为用户对产品Pi的操作集合,Pj C为用户对产品Pj的操作集合,Pi C∩Pj C为用户对产品Pi、Pj执行了相同操作的操作类型的集合,m为所述相同操作的操作集合中的一类操作,|Pi C∩Pj C|为所述相同操作的操作集合中的元素总数量,scorem为所述操作集合中操作类型为m所对应的评分值。
可选的,按照预设算法计算所述任一用户对所述每个产品的兴趣度时,所述处理单元202还用于:
基于用户的用户分类标签,针对所述任一用户计算每个用户分类标签与剩余的其它任一用户分类标签之间的用户标签相似度;
对所述任一用户所具有的各用户标签相似度进行加权计算;
对加权后的各用户标签相似度进行和运算,获得所述任一用户对所述每个产品的兴趣度。
基于同一发明构思,本发明实施例中提供了一种用于信息推送的装置,包括:至少一个处理器,以及
与所述至少一个处理器连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述至少一个处理器通过执行所述存储器存储的指令,执行如上所述的信息推送方法。
基于同一发明构思,本发明实施例还提一种计算机可读存储介质,包括:
所述计算机可读存储介质存储有计算机指令,当所述计算机指令在计算机上运行时,使得计算机执行如上所述的信息推送方法。
通过本发明提供的上述实施例,使得在计算产品兴趣度时,能够通过先将产品相似度达到预设阈值的产品确定为相似产品,再对由相似产品构成的相似产品集中的每个产品的操作相似度进行计算,最后按照预设算法及相似产品集中各产品对应的操作相似度、修正因子,计算用户对各产品的兴趣度,进而按照预设的规则对各产品的兴趣度进行排序,并根据排序结果,将预设数量的产品信息推送给任一用户。这样便能将用户的行为、分类融入进用户的操作中,以便反映出用户对产品兴趣度的影响,进而提升推送信息的可信度,准确的反映用户的真实需求。
本领域内的技术人员应明白,本发明实施例可提供为方法、***、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种信息推送方法,应用于云平台,其特征在于,包括:
收集用户在所述云平台中的操作记录,获得操作记录集合;
计算任一用户对每个产品的兴趣度:
从所有产品中,确定与所述每个产品相似度达到预设阈值的产品,获得相似产品集;
基于所述操作记录集合及所述相似产品集,计算所述每个产品与所述相似产品集中的每个相似产品之间的操作相似度,获得操作相似度集;其中,所述操作相似度是指用户对所述每个产品与所述每个相似产品之间进行操作的相似程度;
基于所述相似产品集及所述操作相似度和修正因子,按照预设算法计算所述任一用户对所述每个产品的兴趣度;其中,所述修正因子用于降低活跃用户对产品的兴趣度的影响,所述活跃用户为对产品操作次数达到预设数值的用户,其中,所述每个产品的兴趣度是基于用户的用户分类标签,计算所述任一用户计算每个用户分类标签与其它任一用户分类标签之间的用户标签相似度,并对所述任一用户所具有的各用户标签相似度进行加权计算以及和运算获得的;
将所有的所述每个产品的兴趣度构建成一个集合,获得所述任一用户对所有产品的兴趣度集,并按预设的规则,对所述兴趣度集中的兴趣度进行排序,根据排序结果获得预设数量的产品信息并将所述预设数量的产品信息推送给所述任一用户。
2.如权利要求1所述的方法,其特征在于,从所有产品中,确定与所述每个产品相似度达到预设阈值的产品之前,还包括:
基于产品分类标签集,按照第一相似度公式计算所述每个产品与其它任一产品的产品标签相似度,获得产品标签相似度集;
对所述产品标签相似度集中的产品标签相似度进行和运算,获得所述产品相似度。
3.如权利要求2所述的方法,其特征在于,所述第一相似度公式,具体为:
Figure FDA0003182544750000021
其中,T为产品分类标签集,t为T中的一个产品分类标签,Pj t为待计算兴趣度的每个产品,Pi t为除Pj t之外的其它任一产品,|Pi t|为具有产品分类标签t的产品Pi的值,|Pj t|为具有产品分类标签t的产品Pj的值,|Pi T∩Pj T|为产品Pi、产品Pj具有相同产品分类标签的数量,c为一预设常量。
4.如权利要求1所述的方法,其特征在于,计算所述每个产品与所述相似产品集中的每个相似产品之间的操作相似度,包括:
通过操作行为评分机制及所述操作记录集合,计算所述每个产品与任一相似产品的操作分值集;其中,所述操作分值集中的操作分值是所述每个产品与所述任一相似产品所共有的操作对应的操作评分值;
基于所述操作分值集及所述每个产品与所述任一相似产品所具有的相同操作类型的总数量,按照第二相似度计算公式进行计算,获得所述每个产品与所述任一相似产品的操作相似度;其中,所述操作相似度与所述总数量成反比,与所述操作分值集中的各评分值之和成正比。
5.如权利要求4所述的方法,其特征在于,所述第二相似度计算公式,具体为:
Figure FDA0003182544750000022
其中,simc(Pi C,Pj C)为所述任一相似产品Pi与所述每个产品Pj之间的操作相似度,C为所有用户对云平台中的产品产生的操作记录集合,c为C中的一个操作,Pi C为用户对产品Pi的操作集合,Pj C为用户对产品Pj的操作集合,Pi C∩Pj C为用户对产品Pi、Pj执行了相同操作的操作类型的集合,m为所述相同操作的操作集合中的一类操作,|Pi C∩Pj C|为所述相同操作的操作集合中的元素总数量,scorem为所述操作集合中操作类型为m所对应的评分值。
6.如权利要求1-5任一权项所述的方法,其特征在于,按照预设算法计算所述任一用户对所述每个产品的兴趣度,包括:
基于用户的用户分类标签,针对所述任一用户计算每个用户分类标签与剩余的其它任一用户分类标签之间的用户标签相似度;
对所述任一用户所具有的各用户标签相似度进行加权计算;
对加权后的各用户标签相似度进行和运算,获得所述任一用户对所述每个产品的兴趣度。
7.一种信息推送***,应用于云平台,其特征在于,包括:
收集单元,用于收集用户在所述云平台中的操作记录,获得操作记录集合;
处理单元,用于计算任一用户对每个产品的兴趣度:
从所有产品中,确定与所述每个产品相似度达到预设阈值的产品,获得相似产品集;
基于所述操作记录集合及所述相似产品集,计算所述每个产品与所述相似产品集中的每个相似产品之间的操作相似度,获得操作相似度集;其中,所述操作相似度是指用户对所述每个产品与所述每个相似产品之间进行操作的相似程度;
基于所述相似产品集及所述操作相似度和修正因子,按照预设算法计算所述任一用户对所述每个产品的兴趣度;其中,所述修正因子用于降低活跃用户对产品的兴趣度的影响,所述活跃用户为对产品操作次数达到预设数值的用户,其中,所述每个产品的兴趣度是基于用户的用户分类标签,计算所述任一用户计算每个用户分类标签与其它任一用户分类标签之间的用户标签相似度,并对所述任一用户所具有的各用户标签相似度进行加权计算以及和运算获得的;
推送单元,用于将所有的所述每个产品的兴趣度构建成一个集合,获得所述任一用户对所有产品的兴趣度集,并按预设的规则,对所述兴趣度集中的兴趣度进行排序,根据排序结果获得预设数量的产品信息并将所述预设数量的产品信息推送给所述任一用户。
8.如权利要求7所述的***,其特征在于,从所有产品中,确定与所述每个产品相似度达到预设阈值的产品之前,所述处理单元还用于:
基于产品分类标签集,按照第一相似度公式计算所述每个产品与其它任一产品的产品标签相似度,获得产品标签相似度集;
对所述产品标签相似度集中的产品标签相似度进行和运算,获得所述产品相似度。
9.一种信息推送装置,应用于云平台,其特征在于,包括:
至少一个处理器,以及
与所述至少一个处理器连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述至少一个处理器通过执行所述存储器存储的指令,执行如权利要求1-6任一项所述的方法。
10.一种计算机可读存储介质,其特征在于:
所述计算机可读存储介质存储有计算机指令,当所述计算机指令在计算机上运行时,使得计算机执行如权利要求1-6中任一项所述的方法。
CN201810387677.3A 2018-04-26 2018-04-26 一种信息推送方法及*** Active CN110427545B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810387677.3A CN110427545B (zh) 2018-04-26 2018-04-26 一种信息推送方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810387677.3A CN110427545B (zh) 2018-04-26 2018-04-26 一种信息推送方法及***

Publications (2)

Publication Number Publication Date
CN110427545A CN110427545A (zh) 2019-11-08
CN110427545B true CN110427545B (zh) 2021-11-02

Family

ID=68408237

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810387677.3A Active CN110427545B (zh) 2018-04-26 2018-04-26 一种信息推送方法及***

Country Status (1)

Country Link
CN (1) CN110427545B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021163856A1 (zh) * 2020-02-17 2021-08-26 深圳市欢太科技有限公司 内容推送方法、装置、服务器及存储介质
CN115114531B (zh) * 2021-12-07 2023-04-25 创贸科技(深圳)集团有限公司 基于电商行为大数据的信息推送方法及人工智能预测***
CN114218493A (zh) * 2021-12-23 2022-03-22 淄博云科互联网信息技术有限公司 基于人工智能的云端业务大数据挖掘方法及云计算***

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103886047A (zh) * 2014-03-12 2014-06-25 浙江大学 面向流式数据的分布式在线推荐方法
CN105718545A (zh) * 2016-01-18 2016-06-29 合一网络技术(北京)有限公司 多媒体资源的推荐方法和装置
CN106503140A (zh) * 2016-10-20 2017-03-15 安徽大学 一种基于Hadoop云平台Web资源个性化推荐***及方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10373079B2 (en) * 2008-12-18 2019-08-06 Oracle International Corporation Method and apparatus for generating recommendations from descriptive information

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103886047A (zh) * 2014-03-12 2014-06-25 浙江大学 面向流式数据的分布式在线推荐方法
CN105718545A (zh) * 2016-01-18 2016-06-29 合一网络技术(北京)有限公司 多媒体资源的推荐方法和装置
CN106503140A (zh) * 2016-10-20 2017-03-15 安徽大学 一种基于Hadoop云平台Web资源个性化推荐***及方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
推荐***关键技术研究;任磊;《中国博士学位论文全文数据库》;20121115;全文 *

Also Published As

Publication number Publication date
CN110427545A (zh) 2019-11-08

Similar Documents

Publication Publication Date Title
JP6356744B2 (ja) ウェブサイト横断情報を表示する方法およびシステム
Perlich et al. Machine learning for targeted display advertising: Transfer learning in action
Suchacka et al. Using association rules to assess purchase probability in online stores
US11042909B2 (en) Target identification using big data and machine learning
Rakesh et al. Project recommendation using heterogeneous traits in crowdfunding
CN108805598B (zh) 相似度信息确定方法、服务器及计算机可读存储介质
US20130332385A1 (en) Methods and systems for detecting and extracting product reviews
US20160285672A1 (en) Method and system for processing network media information
TW201501059A (zh) 訊息推薦方法及裝置
CN108648058B (zh) 产品排序方法及装置,电子设备、存储介质
US20140147048A1 (en) Document quality measurement
CN110427545B (zh) 一种信息推送方法及***
CN113516496B (zh) 广告转化率预估模型构建方法、装置、设备及其介质
CN109446402B (zh) 一种搜索方法及装置
US10733244B2 (en) Data retrieval system
CN113191896A (zh) 一种招标信息的推荐方法、装置及计算机设备
CN111626767A (zh) 资源数据的发放方法、装置及设备
US10049375B1 (en) Automated graph-based identification of early adopter users
CN111680213A (zh) 信息推荐方法、数据处理方法及装置
CN113327132A (zh) 多媒体推荐方法、装置、设备及存储介质
CN113158032B (zh) 一种信息推送方法和装置
JP6664580B2 (ja) 算出装置、算出方法および算出プログラム
CN111460300B (zh) 网络内容推送方法、装置及存储介质
CN114385931A (zh) 一种获得推荐表单的方法、装置及电子设备
JP4962950B2 (ja) ネットワーク上のユーザに対するレコメンデーションの方法、レコメンデーションサーバ及びプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant