CN109726311A - 一种视频推荐方法、装置及设备 - Google Patents

一种视频推荐方法、装置及设备 Download PDF

Info

Publication number
CN109726311A
CN109726311A CN201811574236.0A CN201811574236A CN109726311A CN 109726311 A CN109726311 A CN 109726311A CN 201811574236 A CN201811574236 A CN 201811574236A CN 109726311 A CN109726311 A CN 109726311A
Authority
CN
China
Prior art keywords
feature
value
user
weight value
weight
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811574236.0A
Other languages
English (en)
Inventor
黄哲为
周欢
陈昶
陈捷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Cubesili Information Technology Co Ltd
Original Assignee
Guangzhou Huaduo Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Huaduo Network Technology Co Ltd filed Critical Guangzhou Huaduo Network Technology Co Ltd
Priority to CN201811574236.0A priority Critical patent/CN109726311A/zh
Publication of CN109726311A publication Critical patent/CN109726311A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种视频推荐方法、装置及设备。方案包括:获取用户曾经观看的视频品类信息;确定视频品类信息对应的用户行为数据;根据所述行为数据确定所述视频品类对应的各个特征,得到第一特征集合;根据所述各个特征之间的相关性从所述第一特征集合中确定第二特征集合;对所述第二特征集合中各个特征的权重进行计算,得到第一权重值集合;所述第一权重值集合中包含所述第二特征集合中各个特征对应的特征权重值;对所述特征权重值进行调整,得到第二权重值集合;根据所述第二权重值集合计算用户兴趣度;根据所述用户兴趣度为用户推荐视频品类。通过上述方法,能更准确的预测用户对视频品类的喜好,提高视频推荐的可靠性。

Description

一种视频推荐方法、装置及设备
技术领域
本申请涉及计算机技术领域,尤其涉及一种视频推荐方法、装置及设备。
背景技术
现有技术中,随着网络技术的快速发展,移动直播技术已经成为社会热点之一。用户可以通过终端设备中的直播软件做直播,直播视频被推送至直播平台展示时,通常按照每个直播视频当前的观众数进行排序,人气高的直播视频被排在平台页面靠前的位置展示。对于人气低的直播视频,被排在页面靠后的位置。但是有可能人气低的直播视频反而是用户感兴趣的视频,此时,会导致推荐可靠性低,影响用户体验。
因此,现有技术中,用户兴趣度挖掘还停留而根据如个人经验,或者是简单的关联规则,为用户推荐相关内容。无法快速有效的挖掘用户的观看兴趣,无法准确预测用户的兴趣视频品类,不能给用户推荐其真正感兴趣的直播内容,达不到高质量推荐品类的效果。
发明内容
有鉴于此,本申请实施例提供了一种视频推荐方法、装置及设备,用于更准确的预测用户对视频品类的喜好,提高视频推荐的可靠性。
为解决上述技术问题,本说明书实施例是这样实现的:
本说明书实施例提供的一种视频推荐方法,包括:
获取用户曾经观看的视频品类信息;
确定所述视频品类信息对应的用户行为数据;
根据所述行为数据确定所述视频品类对应的各个特征,得到第一特征集合;
根据所述各个特征之间的相关性从所述第一特征集合中确定第二特征集合;
对所述第二特征集合中各个特征的权重进行计算,得到第一权重值集合;所述第一权重值集合中包含所述第二特征集合中各个特征对应的特征权重值;
对所述特征权重值进行调整,得到第二权重值集合;
根据所述第二权重值集合计算用户兴趣度;
根据所述用户兴趣度为用户推荐视频品类。
可选的,所述根据所述各个特征之间的相关性从所述第一特征集合中确定第二特征集合,具体包括:
确定所述第一特征集合中各个特征的差异显著程度;
确定所述第一特征集合中各个特征的覆盖度;
确定所述第一特征集合中各个特征的相关度;
根据所述第一特征集合中各个特征的差异显著程度、覆盖度以及相关度从所述第一特征集合剔除异常特征值,得到所述第二特征集合。
可选的,所述确定所述第一特征集合中各个特征的差异显著程度,具体包括:
利用Z检验获取所述第一特征集合中各个特征的差异显著程度;
所述确定所述第一特征集合中各个特征的相关度,具体包括:
利用皮尔逊相关系数获取所述第一特征集合中各个特征的相关度;
所述根据所述第一特征集合中各个特征的差异显著程度、覆盖度以及相关度从所述第一特征集合剔除异常特征值,得到所述第二特征集合,具体包括:
从所述第一特征集合中剔除不满足预设差异显著程度阈值的特征值,得到第一正常特征值集合;
从所述第一正常特征值集合中剔除不满足预设覆盖度阈值的特征值,得到第二正常特征值集合;
从所述第二正常特征值集合中剔除不满足预设相关度阈值的特征,得到所述第二特征集合。
可选的,所述对所述第二特征集合中各个特征的权重进行计算,得到第一权重值集合;所述第一权重值集合中包含所述第二特征集合中各个特征对应的特征权重值,具体包括:
采用公式:
对所述第二特征集合中各个特征的权重进行计算,得到第一权重值集合;
其中,wj表示特征的权重值,m表示特征数量,j表示第j个特征,j=1,2,3….,m;dj表示信息熵的冗余度。
可选的,所述对所述特征权重值进行调整,得到第二权重值集合,具体包括:
计算所述各个视频品类对应的特征调整值;
根据所述特征调整值对相应特征的权重值进行调整,得到第二权重值集合。
可选的,所述根据所述特征调整值对相应特征的权重值进行调整,得到第二权重值集合,具体包括:
对于同一权重数值下的特征,根据所述特征调整值将流行品类对应的特征权重值调低,将小众品类对应的特征权重值调高。
可选的,所述计算所述各个视频品类对应的特征调整值,具体包括:
采用公式:
确定所述特征调整值;
其中,D表示特征对出现的次数,dj表示D在j品类下的用户子集,分母表示某品类中的特征数值总和。
可选的,所述根据所述特征调整值对相应特征的权重值进行调整,得到第二权重值集合,具体包括:
采用公式:
w'j=wj*idfi
对相应特征的权重值进行调整;
其中,w'j表示调整之后得到的特征权重值,idfi表示特征调整值,wj表示特征的权重值。
可选的,所述根据所述第二权重值集合计算用户兴趣度,具体包括:
采用公式:
计算用户兴趣度;
其中,xi为特征值,I为同一品类下的特征数。
可选的,所述根据所述第二权重值集合计算用户兴趣度之后,还包括:
根据所述用户兴趣度与品类的留存率或转化率调整特征选取的规则和阈值,直到评分对业务效果特征显著并且数据时效性未过为止。
一种视频推荐装置,包括:
品类获取模块,用于获取用户曾经观看的视频品类信息;
行为数据确定模块,用于确定所述视频品类信息对应的用户行为数据;
第一特征集合确定模块,用于根据所述行为数据确定所述视频品类对应的各个特征,得到第一特征集合;
第二特征集合确定模块,用于根据所述各个特征之间的相关性从所述第一特征集合中确定第二特征集合;
第一权重值集合确定模块,用于对所述第二特征集合中各个特征的权重进行计算,得到第一权重值集合;所述第一权重值集合中包含所述第二特征集合中各个特征对应的特征权重值;
第二权重值集合确定模块,用于对所述特征权重值进行调整,得到第二权重值集合;
兴趣度计算模块,用于根据所述第二权重值集合计算用户兴趣度;
推荐模块,用于根据所述用户兴趣度为用户推荐视频品类。
一种视频推荐设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行所述一种视频推荐方法。
一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,所述指令被处理器执行时实现所述一种视频推荐方法的方法步骤。
本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果:通过使用不同的统计方法筛选特征,并计算各个特征的权重值,并采用特征权重调整值平衡不同视频品类之间用户观看的数量差距造成的分值分布不平衡的问题。能更准确的预测用户对视频品类的喜好,给用户推荐其真正感兴趣的直播内容,提高视频推荐的可靠性。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本说明书实施例提供的一种视频推荐方法的流程示意图;
图2为本说明书实施例1提供的一种视频推荐方法的流程示意图;
图3为本说明书实施例1提供的视频推荐导航界面示意图;
图4为本说明书实施例1提供的视频推荐分析过程界面示意图;
图5本说明书实施例提供的对应于图1的一种视频推荐装置的结构示意图;
图6为本说明书实施例提供的对应于图1的一种视频推荐设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
以下结合附图,详细说明本申请各实施例提供的技术方案。
现有技术中在为用户推荐视频品类时,一般是根据视频品类的点击率进行推荐,通常按照每个直播视频当前的观众数进行排序,人气高的直播视频被排在平台页面靠前的位置展示。对于人气低的直播视频被排在页面靠后的位置,会使用户错过人气低,但是用户自身感兴趣的视频品类。
因此,现有技术中的方法,无法快速有效的挖掘用户的观看兴趣,无法准确预测用户的兴趣视频品类,不能给用户推荐其真正感兴趣的直播内容,达不到高质量推荐品类的效果。
图1为本说明书实施例提供的一种视频推荐方法的流程示意图。从程序角度而言,流程的执行主体可以为搭载于应用服务器的程序或应用客户端。
如图1所示,该流程可以包括以下步骤:
S101:获取用户曾经观看的视频品类信息;
S102:确定所述视频品类信息对应的用户行为数据;
用户行为数据可以表示用户在网站上发生的所有行为,如搜索、浏览、打分、点评、打赏、送礼物、聊天、收藏、与主播互动等行为。
视频品类可以指的是主播视频的内容分类,例如:音乐、脱口秀、舞蹈、户外、游戏、美食、时尚、综艺、体育等各种短视频或者直播视频。
用户在直播平台上对各个视频品类的行为数据都存储在用户行为数据库中,从所述用户行为数据库中可以得到用户观看视频品类对应的特征。
S103:根据所述行为数据确定所述视频品类对应的各个特征,得到第一特征集合;
衡量用户与视频品类之间的关系时,可以通过用户与视频品类之间的一些行为特征来判断,例如:用户与视频品类之间的互动性可以是用户与主播之间的交流、用户的针对某直播点赞的频率、次数、用户给某视频品类送礼金额、用户日均观看某品类次数占总观看次数比例、用户浏览某视频品类的时长等等。
例如:从用户行为数据库中获取用户观看的视频品类为音乐、体育、舞蹈和美食,这些视频品类对应的特征是:用户日平均浏览时长、用户浏览频率、用户的点赞率以及用户对品类主播的送礼次数。得到第一特征集合为{用户日平均浏览时长、用户浏览频率、用户的点赞率以及用户对品类主播的送礼次数}。
S104:根据所述各个特征之间的相关性从所述第一特征集合中确定第二特征集合。
通过特征相关性选取特征可以是特征抽取整合原始特征,进而产生一些新的特征,而在进行特征的选择时,可以是剔除无关紧要的或冗余的特征,保留其他原始特征。特征选择时,首先会检测相关特征,然后摒弃冗余特征,以获得特征子集。
S105:对所述第二特征集合中各个特征的权重进行计算,得到第一权重值集合;所述第一权重值集合中包含所述第二特征集合中各个特征对应的特征权重值。
为了区分用户对品类的喜好,采用见特征权重的方法,计算特征权重时,可以采用熵权法进行计算,信息熵越大,越能更好的区分用户对品类的喜好。
S106:对所述特征权重值进行调整,得到第二权重值集合。
不同视频品类之间用户观看的数量差距可能会影响对用户兴趣度的判断,例如:某一视频品类A(例如音乐、搞笑),属于大多数人都喜欢观看的直播,而视频品类B(例如:理财分析、房价管控)属于少数人才会观看的直播,假设用户X从某一月份的最后3天开始接触理财分析,并且开始感兴趣,而此时到月末统计的时候,用户X对视频品类A的浏览次数或者兴趣度大于用户X对视频品类B的兴趣度,此时,不能因此判定用户X对视频品类B(例如:理财分析)不感兴趣。而应该联系用户的固有喜好以及从众心理对两种视频品类的兴趣度进行调整。
例如:音乐、搞笑、理财分析、房价管控对应的第一权重值集合为{N1,N2,N3,N4},此时不能直接根据第一权重集合来计算兴趣度,而是应该对第一权重集合进行调整,得到第二权重集合为{n1,n2,n3,n4},并根据第二权重集合来计算用户兴趣度。
S107:根据所述第二权重值集合计算用户兴趣度。
用户兴趣度就是用来衡量用户对某视频品类的感兴趣程度,根据第二权重集合中的权重值计算用户的兴趣度,比较用户对个视频品类的兴趣度大小,因此来判断用户的喜好。
S108:根据所述用户兴趣度为用户推荐视频品类。
为了让用户能有更好的用户体验,根据用户的兴趣度为用户推荐用户喜好的视频品类,也可以为用户推荐同品类的活跃主播,制定品类导航目录的投放策略或个性化导航。
图1中的方法,通过对现有技术中仅推荐点击率高(人气较高)的视频品类进行改进,通过使用不同的统计方法筛选特征,并计算个特征的权重值,采用特征权重调整值,平衡不同视频品类之间用户观看的数量差距造成的分值分布不平衡的问题。能更准确的预测用户对视频品类的喜好,提高视频推荐的可靠性。
基于图1的方法,本说明书实施例还提供了该方法的一些具体实施方案,下面进行说明。
在实际应用中,所述根据所述各个特征之间的相关性从所述第一特征集合中确定第二特征集合,具体可以包括:
确定所述第一特征集合中各个特征的差异显著程度;
确定所述第一特征集合中各个特征的覆盖度;
确定所述第一特征集合中各个特征的相关度;
根据所述第一特征集合中各个特征的差异显著程度、覆盖度以及相关度从所述第一特征集合剔除异常特征值,得到所述第二特征集合。
上述方式中所提到的相关性可以包括各个特征的差异显著程度、覆盖度以及相关度,通过这些相关的统计方法筛选特征。
更为具体的,所述确定所述第一特征集合中各个特征的差异显著程度,具体可以包括:
利用Z检验获取所述第一特征集合中各个特征的差异显著程度;
所述确定所述第一特征集合中各个特征的相关度,具体可以包括:
利用皮尔逊相关系数获取所述第一特征集合中各个特征的相关度;
所述根据所述第一特征集合中各个特征的差异显著程度、覆盖度以及相关度从所述第一特征集合剔除异常特征值,得到所述第二特征集合,具体可以包括:
从所述第一特征集合中剔除不满足预设差异显著程度阈值的特征值,得到第一正常特征值集合;
从所述第一正常特征值集合中剔除不满足预设覆盖度阈值的特征值,得到第二正常特征值集合;
从所述第二正常特征值集合中剔除不满足预设相关度阈值的特征,得到所述第二特征集合。
Z检验(Z Test)是一般用于大样本(即样本容量大于30)平均值差异性检验的方法。用标准正态分布的理论来推断差异发生的概率,从而比较两个平均数的差异是否显著。当已知标准差时,验证一组数的均值是否与某一期望值相等时,用Z检验进行验证。
建设需要检验来自两个的两组样本平均数的差异性,从而判断它们各自代表的总体的差异是否显著。其Z值计算公式为:
其中:
x1,x2是样本1,样本2的平均数;
S1,S2是样本1,样本2的标准差;
n1,n2是样本1,样本2的容量。
比较计算所得Z值与理论Z值,推断发生的概率,依据Z值与差异显著性关系表做出判断。
覆盖度=有相关特征的用户数/活跃用户数。
皮尔逊相关系数(Pearson correlation coefficient),又称皮尔逊积矩相关系数(Pearson product-moment correlation coefficient,简称PPMCC或PCCs)。
例如:第一特征集合为{A,B,C,D,E,F},通过Z检验从所述第一特征集合中剔除不满足预设差异显著程度阈值的特征值A和C,得到第一正常特征值集合为{B,D,E,F};根据覆盖度从所述第一正常特征值集合中剔除不满足预设覆盖度阈值的特征值B,得到第二正常特征值集合为{D,E,F};通过皮尔逊相关系数从所述第二正常特征值集合中剔除不满足预设相关度阈值的特征F,得到所述第二特征集合为{D,E}。
在上述具体实施方式中,通过采用不同的统计方法,这里所指的统计方法包括但不仅限于上述方式中介绍的Z检验、覆盖度以及皮尔逊系数等,筛选出用户对品类喜好所依据的特征,降低了人为因素的干扰,提高判断用户喜好的准确率。
在应用上述方式筛选出特征集合后,需要对各个特征计算权重值,具体的,所述对所述第二特征集合中各个特征的权重进行计算,得到第一权重值集合;所述第一权重值集合中包含所述第二特征集合中各个特征对应的特征权重值,具体可以包括:
采用公式:
对所述第二特征集合中各个特征的权重进行计算,得到第一权重值集合。
其中,wj表示特征的权重值,m表示特征数量,j表示第j个特征,j=1,2,3….,m;dj表示信息熵的冗余度。
在计算出各个特征的权重之后,由于考虑到用户的固有喜好以及从众心理,不能仅根据上述方式计算得到的权重值来计算用户兴趣度,因此,需要对上述特征权重值进行调整。
所述对所述特征权重值进行调整,得到第二权重值集合,具体可以包括:
计算所述各个视频品类对应的特征调整值;
根据所述特征调整值对相应特征的权重值进行调整,得到第二权重值集合;对于同一权重数值下的特征,根据所述特征调整值将流行品类对应的特征权重值调低,将小众品类对应的特征权重值调高。
例如:某直播软件界面上显示热门搜索为音乐和搞笑,由于大众的从众心理,用户可能也会点击打开流行品类(音乐以及搞笑品类)的直播进行观看,但是用户本人特别喜爱相声(小众品类),而该用户由于刚使用该直播软件,而界面上并未推送相声品类的直播,因此,用户在使用该直播软件20天后,才找到有相应的相声品类的直播,在用户使用该软件满一个月时,该直播软件***自动统计用户使用视频品类的兴趣度,得到用户兴趣度从低到高依次为:音乐、搞笑、美食、相声。此时不能认定用户对相声的兴趣度小于音乐、搞笑和美食。又或者某直播软件平台在某一月份中的下半个月退出一款新的视频品类,此时也不能仅仅依据兴趣度来判断用户喜好。而应该特征品类间的权重差异或者平衡不同视频品类之间用户观看的数量差距造成的用户兴趣同一化问题(例如:直播软件在11月15日之后发布一个视频品类X,用户在视频品类X发布之前,点击音乐类直播5次、搞笑10次,在发布视频品类X之后,用户点击了视频品类X 5次、搞笑10次,在统计时,发现视频品类X与音乐类直播点击次数相同),但此时不能判定用户对视频品类X与音乐类直播的兴趣度相同。上面提到的流行品类可以指的是大多数用户经常会点击的视频品类或者是比较常见的视频品类;而小众品类可以指的是仅有少数用户会点击的视频品类或者是直播软件平台推出时间较短的视频品类。
在具体应用时,所述计算所述各个视频品类对应的特征调整值,具体可以包括:
采用公式:
确定所述特征调整值;
其中,D表示特征对出现的次数,dj表示D在j品类下的用户子集,分母表示某品类中的特征数值总和。
所述根据所述特征调整值对相应特征的权重值进行调整,得到第二权重值集合,具体包括:
采用公式:
w'j=wj*idfi
对相应特征的权重值进行调整;
其中,w'j表示调整之后得到的特征权重值,idfi表示特征调整值,wj表示特征的权重值。
上述方式中,在计算特征频率调整值时,采用的是类逆向文件频率(IDF,inversedocument frequency)的逆向特征频率算法,调整权重,使计算得到的特征权重值更贴合用户使用心理,进一步合理地衡量用户对不同品类的兴趣度,使评分更具有合理性。
所述根据所述第二权重值集合计算用户兴趣度,具体包括:
采用公式:
计算用户兴趣度;
其中,xi为特征值,I为同一品类下的特征数。
所述根据所述第二权重值集合计算用户兴趣度之后,还包括:
根据所述用户兴趣度与品类的留存率或转化率调整特征选取的规则和阈值,直到评分对业务效果特征显著并且数据时效性未过为止。
上述方式通过根据结果指标调整评分特征的选取和特征权重,能根据实际使用情况调整其倾向性,更新评分权重,能不断的改进使用效果,确保评分模型的时效性。
基于图1的方法,本说明书实施例还提供了该方法的具体实施方式,下面进行说明。
实施例1
图2为本说明书实施例1提供的一种视频推荐方法的流程示意图。
如图2所述,一种视频推荐方法具体实施步骤如下:
S201:从用户行为数据库中获取用户观看的视频品类信息;
S202:确定所述视频品类信息对应的各个特征,得到第一特征集合;
S203:根据所述第一特征集合中各个特征的差异显著程度、覆盖度以及相关度从所述第一特征集合剔除异常特征值,得到所述第二特征集合;
S204:对所述第二特征集合中各个特征的权重进行计算,得到第一权重值集合;所述第一权重值集合中包含所述第二特征集合中各个特征对应的特征权重值;
S205:利用类逆向文件频率(IDF,inverse document frequency)计算所述第一权重值集合中各个视频品类对应的特征权重调整值;
S206:利用所述特征权重调整值对所述特征权重值进行调整,得到第二权重值集合;
S207:根据所述第二权重值集合计算用户兴趣度;
S208:根据所述用户兴趣度与品类的留存率或转化率调整特征选取的规则和阈值,直到评分对业务效果特征显著并且数据时效性未过为止。
S209:根据所述用户兴趣度为用户推荐视频品类。
例如:从用户行为数据库中获取用户观看的品类为:音乐、搞笑、体育、时尚、美食以及健身,确定这些品类对应的特征可以为:用户品类观看天数f1,用户日均观看某品类时长f2,用户日均观看某品类次数f3,用户日均观看某品类次数占总观看次数比例f4,用户对某品类主播的送礼金额f5,用户对某品类主播的送礼次数f6;对f1–f6分别抽取2组大量等量的样本的数据,可以利用公式
计算Z值,
其中:x1,x2是样本1,样本2的平均数;S1,S2是样本1,样本2的标准差;n1,n2是样本1,样本2的容量。
分别计算f1-f6的z-score分别为:1.2,1.3,1.6,1.1,1.9,1.3,设置差异显著程度阈值为小于1.8,因此,1.9不满足设定阈值,因此,剔除特征f5,得到第一正常特征值集合为{f1,f2,f3,f4,f6}。
计算第一正常特征值集合中的特征f1,f2,f3,f4,f6的覆盖度,根据覆盖度=相关特征的用户数/活跃用户数,计算得到覆盖度值分别为:f1=0.3,f2=0.7,f3=0.9,f4=0.6,f6=0.8,设定覆盖度阈值为不小于0.5,因此f1=0.3不满足覆盖度设定阈值,因此,剔除特征f1,得到第一正常特征值集合为{f2,f3,f4,f6}。
计算第二正常特征值集合中的特征f2,f3,f4,f6的皮尔逊相关系数。可以利用公式:
计算两个变量之间的协方差和标准差的商,即为皮尔逊相关系数。
其中,希腊小写字母ρ代表皮尔逊相关系数。估算样本的协方差和标准差,可得到皮尔逊相关系数,常用英文小写字母ρ表示
计算得到f2,f3,f4,f6的皮尔逊相关系数分别为:f2=0.4,f3=0.5,f4=0.7,f6=0.8。预设的相关度阈值为不高于0.6,因此,f4=0.7,f6=0.7不满足预设相关度阈值,应该剔除f4,f6。得到第二特征集合{f2,f3}。
但是在这种情况下,也可以在综合考虑其他因素,比如:f4为二级特征,这里的二级特征指的是:在从用户行为数据中提取出来的特征的基础上,进一步对特征进行细化的小特征。例如:从用户行为数据库中提取出来的特征为:用户对某视频品类A在一个月内的浏览次数,那么二级特征可以指的是:用户对某视频品类A在平均一天内的浏览次数;再或者从用户行为数据库中提取出来的特征为:用户与某视频品类B的互动频率,那么二级特征可以指的是:用户对某视频品类B的月打赏金额。因此,二级特征更能体现品类间的比例,此时,可以保留f4,得到第二特征集合{f2,f3,f4}。
在计算权重时,可以采用熵权法进行计算。
具体的,可以根据公式
计算得到第二特征集合{f2,f3,f4}的特征权重。计算得到的特征权重分别为:w2、w3、w4,得到第一权重值集合为{w2,w3,w4}。
根据类逆向文件频率(IDF,inverse document frequency)计算第一权重值集合中各个视频品类对应的特征权重调整值。
具体的,采用公式:
计算第一权重值集合中各个视频品类对应的特征权重调整值,计算得到的特征权重调整值分别为:idf2、idf3、idf4。
根据特征权重调整值对第一权重值集合中的权重值进行调整,得到新的权重值为:W’2=idf2*w2、W’3=idf3*w3、W’3=idf3*w3。得到第二权重值集合为{W’2,W’3,W’3}。
根据上述的新的权重值计算用户的兴趣度。具体可以采用公式:
计算用户兴趣度,得到兴趣度集合为{Y1,Y2,Y3},根据兴趣度大小得到用户的品类偏好为:音乐>脱口秀>舞蹈,则根据用户兴趣度为用户推荐喜好的视频品类。
图2中的方法,采用各种统计方法量化用户对品类的喜好,为运营和推荐的各种策略提供数据基础,降低人为主观因素的干扰;引入的逆向频率调整权重的算法更贴合用户使用心理,使评分更具有合理性;根据结果特征调整评分特征的选取和特征权重,能根据实际使用情况调整其倾向性,能不断的改进使用效果。
图3为本说明书实施例1提供视频推荐导航界面示意图;推荐导航界面如图3所示,运营进行品类投放,页面排版提供重要参考。运营可统计用户的品类评分来制定品类导航目录的投放策略或个性化导航。其中图3中长条框中的音乐、脱口秀、舞蹈、户外以及吃鸡等就为用户推荐导航的视频品类。推荐之后,会生成相关的用户标签。
图4为本说明书实施例1提供的视频推荐分析过程界面示意图。
如图4所示,根据兴趣度大小,并对用户的使用流失进行分析,结合用户实际启动次数为用户排出前三个用户偏好的视频品类,图4中的室内秀场、音乐和综合就是综合分析后得到的用户偏好视频品类,并将这三个偏好品类推送给用户。
基于同样的思路,本说明书实施例还提供了上述方法对应的装置。图5本说明书实施例提供的对应于图1的一种视频推荐装置的结构示意图。
如图5所示,该装置可以包括:
品类获取模块501,用于获取用户曾经观看的视频品类信息;
行为数据确定模块502,用于确定所述视频品类信息对应的用户行为数据;
第一特征集合确定模块503,用于根据所述行为数据确定所述视频品类对应的各个特征,得到第一特征集合;
第二特征集合确定模块504,用于根据所述各个特征之间的相关性从所述第一特征集合中确定第二特征集合;
第一权重值集合确定模块505,用于对所述第二特征集合中各个特征的权重进行计算,得到第一权重值集合;所述第一权重值集合中包含所述第二特征集合中各个特征对应的特征权重值;
第二权重值集合确定模块506,用于对所述特征权重值进行调整,得到第二权重值集合;
兴趣度计算模块507,用于根据所述第二权重值集合计算用户兴趣度;
推荐模块508,用于根据所述用户兴趣度为用户推荐视频品类。
基于同样的思路,本说明书实施例还提供了上述方法对应的设备。
图6为本说明书实施例提供的对应于图1的一种视频推荐设备的结构示意图。如图6所示,设备600可以包括:
至少一个处理器610;以及,
与所述至少一个处理器通信连接的存储器630;其中,
所述存储器630存储有可被所述至少一个处理器610执行的指令620,所述指令被所述至少一个处理器610执行,以使所述至少一个处理器610能够:
获取用户曾经观看的视频品类信息;
确定所述视频品类信息对应的用户行为数据;
根据所述行为数据确定所述视频品类对应的各个特征,得到第一特征集合;
根据所述各个特征之间的相关性从所述第一特征集合中确定第二特征集合;
对所述第二特征集合中各个特征的权重进行计算,得到第一权重值集合;所述第一权重值集合中包含所述第二特征集合中各个特征对应的特征权重值;
对所述特征权重值进行调整,得到第二权重值集合;
根据所述第二权重值集合计算用户兴趣度;
根据所述用户兴趣度为用户推荐视频品类。
基于同样的思路,本说明书实施例还提供了上述方法对应的计算机可读存储介质。
一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,其特征在于,所述指令被处理器执行时实现以下步骤:
获取用户曾经观看的视频品类信息;
确定所述视频品类信息对应的用户行为数据;
根据所述行为数据确定所述视频品类对应的各个特征,得到第一特征集合;
根据所述各个特征之间的相关性从所述第一特征集合中确定第二特征集合;
对所述第二特征集合中各个特征的权重进行计算,得到第一权重值集合;所述第一权重值集合中包含所述第二特征集合中各个特征对应的特征权重值;
对所述特征权重值进行调整,得到第二权重值集合;
根据所述第二权重值集合计算用户兴趣度;
根据所述用户兴趣度为用户推荐视频品类。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、***或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (13)

1.一种视频推荐方法,其特征在于,包括:
获取用户曾经观看的视频品类信息;
确定所述视频品类信息对应的用户行为数据;
根据所述行为数据确定所述视频品类对应的各个特征,得到第一特征集合;
根据所述各个特征之间的相关性从所述第一特征集合中确定第二特征集合;
对所述第二特征集合中各个特征的权重进行计算,得到第一权重值集合;所述第一权重值集合中包含所述第二特征集合中各个特征对应的特征权重值;
对所述特征权重值进行调整,得到第二权重值集合;
根据所述第二权重值集合计算用户兴趣度;
根据所述用户兴趣度为用户推荐视频品类。
2.如权利要求1所述的方法,其特征在于,所述根据所述各个特征之间的相关性从所述第一特征集合中确定第二特征集合,具体包括:
确定所述第一特征集合中各个特征的差异显著程度;
确定所述第一特征集合中各个特征的覆盖度;
确定所述第一特征集合中各个特征的相关度;
根据所述第一特征集合中各个特征的差异显著程度、覆盖度以及相关度从所述第一特征集合剔除异常特征值,得到所述第二特征集合。
3.如权利要求2所述的方法,其特征在于,所述确定所述第一特征集合中各个特征的差异显著程度,具体包括:
利用Z检验获取所述第一特征集合中各个特征的差异显著程度;
所述确定所述第一特征集合中各个特征的相关度,具体包括:
利用皮尔逊相关系数获取所述第一特征集合中各个特征的相关度;
所述根据所述第一特征集合中各个特征的差异显著程度、覆盖度以及相关度从所述第一特征集合剔除异常特征值,得到所述第二特征集合,具体包括:
从所述第一特征集合中剔除不满足预设差异显著程度阈值的特征值,得到第一正常特征值集合;
从所述第一正常特征值集合中剔除不满足预设覆盖度阈值的特征值,得到第二正常特征值集合;
从所述第二正常特征值集合中剔除不满足预设相关度阈值的特征,得到所述第二特征集合。
4.如权利要求1所述的方法,其特征在于,所述对所述第二特征集合中各个特征的权重进行计算,得到第一权重值集合;所述第一权重值集合中包含所述第二特征集合中各个特征对应的特征权重值,具体包括:
采用公式:
对所述第二特征集合中各个特征的权重进行计算,得到第一权重值集合;
其中,wj表示特征的权重值,m表示特征数量,j表示第j个特征,j=1,2,3….,m;dj表示信息熵的冗余度。
5.如权利要求1所述的方法,其特征在于,所述对所述特征权重值进行调整,得到第二权重值集合,具体包括:
计算所述各个视频品类对应的特征调整值;
根据所述特征调整值对相应特征的权重值进行调整,得到第二权重值集合。
6.如权利要求5所述的方法,其特征在于,所述根据所述特征调整值对相应特征的权重值进行调整,得到第二权重值集合,具体包括:
对于同一权重数值下的特征,根据所述特征调整值将流行品类对应的特征权重值调低,将小众品类对应的特征权重值调高。
7.如权利要求5所述的方法,其特征在于,所述计算所述各个视频品类对应的特征调整值,具体包括:
采用公式:
确定所述特征调整值;
其中,D表示特征对出现的次数,dj表示D在j品类下的用户子集,分母表示某品类中的特征数值总和。
8.如权利要求5所述的方法,其特征在于,所述根据所述特征调整值对相应特征的权重值进行调整,得到第二权重值集合,具体包括:
采用公式::
w'j=wj*idfi
对相应特征的权重值进行调整;
其中,w'j表示调整之后得到的特征权重值,idfi表示特征调整值,wj表示特征的权重值。
9.根据权利要求1所述的方法,其特征在于,所述根据所述第二权重值集合计算用户兴趣度,具体包括:
采用公式:
计算用户兴趣度;
其中,xi为特征值,I为同一品类下的特征数。
10.根据权利要求1所述的方法,其特征在于,所述根据所述第二权重值集合计算用户兴趣度之后,还包括:
根据所述用户兴趣度与品类的留存率或转化率调整特征选取的规则和阈值,直到评分对业务效果特征显著并且数据时效性未过为止。
11.一种视频推荐装置,其特征在于,包括:
品类获取模块,用于获取用户曾经观看的视频品类信息;
行为数据确定模块,用于确定所述视频品类信息对应的用户行为数据;
第一特征集合确定模块,用于根据所述行为数据确定所述视频品类对应的各个特征,得到第一特征集合;
第二特征集合确定模块,用于根据所述各个特征之间的相关性从所述第一特征集合中确定第二特征集合;
第一权重值集合确定模块,用于对所述第二特征集合中各个特征的权重进行计算,得到第一权重值集合;所述第一权重值集合中包含所述第二特征集合中各个特征对应的特征权重值;
第二权重值集合确定模块,用于对所述特征权重值进行调整,得到第二权重值集合;
兴趣度计算模块,用于根据所述第二权重值集合计算用户兴趣度;
推荐模块,用于根据所述用户兴趣度为用户推荐视频品类。
12.一种视频推荐设备,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1-10任意一项所述的视频推荐方法。
13.一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,其特征在于,所述指令被处理器执行时实现权利要求1-10所述的任一项方法的步骤。
CN201811574236.0A 2018-12-21 2018-12-21 一种视频推荐方法、装置及设备 Pending CN109726311A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811574236.0A CN109726311A (zh) 2018-12-21 2018-12-21 一种视频推荐方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811574236.0A CN109726311A (zh) 2018-12-21 2018-12-21 一种视频推荐方法、装置及设备

Publications (1)

Publication Number Publication Date
CN109726311A true CN109726311A (zh) 2019-05-07

Family

ID=66296892

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811574236.0A Pending CN109726311A (zh) 2018-12-21 2018-12-21 一种视频推荐方法、装置及设备

Country Status (1)

Country Link
CN (1) CN109726311A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112312216A (zh) * 2020-10-16 2021-02-02 山东海看新媒体研究院有限公司 基于模因理论的可追溯电视推荐方法及***

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105100164A (zh) * 2014-05-20 2015-11-25 深圳市腾讯计算机***有限公司 网络服务推荐方法和装置
CN106055617A (zh) * 2016-05-26 2016-10-26 乐视控股(北京)有限公司 一种数据推送方法及装置
CN106326474A (zh) * 2016-08-31 2017-01-11 南京炫佳网络科技有限公司 动漫视频个性化推荐方法
CN107103049A (zh) * 2017-03-31 2017-08-29 努比亚技术有限公司 一种推荐方法及网络设备
CN108647364A (zh) * 2018-05-21 2018-10-12 广东工业大学 一种基于移动终端应用数据的预测推荐方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105100164A (zh) * 2014-05-20 2015-11-25 深圳市腾讯计算机***有限公司 网络服务推荐方法和装置
CN106055617A (zh) * 2016-05-26 2016-10-26 乐视控股(北京)有限公司 一种数据推送方法及装置
CN106326474A (zh) * 2016-08-31 2017-01-11 南京炫佳网络科技有限公司 动漫视频个性化推荐方法
CN107103049A (zh) * 2017-03-31 2017-08-29 努比亚技术有限公司 一种推荐方法及网络设备
CN108647364A (zh) * 2018-05-21 2018-10-12 广东工业大学 一种基于移动终端应用数据的预测推荐方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112312216A (zh) * 2020-10-16 2021-02-02 山东海看新媒体研究院有限公司 基于模因理论的可追溯电视推荐方法及***
CN112312216B (zh) * 2020-10-16 2022-08-16 山东海看新媒体研究院有限公司 基于模因理论的可追溯电视推荐方法及***

Similar Documents

Publication Publication Date Title
CN103823908B (zh) 基于用户偏好的内容推荐方法和服务器
CN107832437B (zh) 音/视频推送方法、装置、设备及存储介质
CN109408665A (zh) 一种信息推荐方法及装置、存储介质
CN110532479A (zh) 一种信息推荐方法、装置及设备
CN103038769B (zh) 用于将内容导引到社交网络引擎用户的***和方法
US20130035989A1 (en) Conducting market research using social games
CN105095431A (zh) 根据用户的行为信息推送视频的方法和装置
CN106294783A (zh) 一种视频推荐方法及装置
Ghosh et al. Learning and incentives in user-generated content: Multi-armed bandits with endogenous arms
CN106454536B (zh) 信息推荐度的确定方法及装置
CN106326391A (zh) 多媒体资源推荐方法及装置
JP2008542870A (ja) コンテンツに対するユーザの群の全体の関心を推定するため方法及び装置
CN109639786A (zh) 多媒体资源的分发方法、装置、服务器及存储介质
CN108595492A (zh) 内容的推送方法和装置、存储介质、电子装置
CN113535991B (zh) 一种多媒体资源推荐方法、装置、电子设备及存储介质
CN111435371B (zh) 视频推荐方法及其***、计算机程序产品、可读存储介质
CN110933473A (zh) 一种视频播放热度确定方法及装置
CN109922357A (zh) 视频推荐的方法及装置
CN109862013A (zh) 一种直播间推荐方法、存储介质、电子设备及***
CN109086822A (zh) 一种主播用户分类方法、装置、设备及存储介质
CN106156351B (zh) 多媒体资源推荐信息生成方法及装置
JP2004362019A (ja) 情報推薦装置、情報推薦方法、情報推薦プログラム及び記録媒体
CN106980666A (zh) 一种推荐视频的方法和装置
CN105956061A (zh) 一种用户间相似度确定方法及装置
CN109684546A (zh) 推荐方法、装置、存储介质及终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20210111

Address after: 511442 3108, 79 Wanbo 2nd Road, Nancun Town, Panyu District, Guangzhou City, Guangdong Province

Applicant after: GUANGZHOU CUBESILI INFORMATION TECHNOLOGY Co.,Ltd.

Address before: 511442 24 floors, B-1 Building, Wanda Commercial Square North District, Wanbo Business District, 79 Wanbo Second Road, Nancun Town, Panyu District, Guangzhou City, Guangdong Province

Applicant before: GUANGZHOU HUADUO NETWORK TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20190507

Assignee: GUANGZHOU HUADUO NETWORK TECHNOLOGY Co.,Ltd.

Assignor: GUANGZHOU CUBESILI INFORMATION TECHNOLOGY Co.,Ltd.

Contract record no.: X2021440000054

Denomination of invention: Video recommendation method, device and equipment

License type: Common License

Record date: 20210208

EE01 Entry into force of recordation of patent licensing contract
RJ01 Rejection of invention patent application after publication

Application publication date: 20190507

RJ01 Rejection of invention patent application after publication