CN109947983A - 视频推荐方法、***、终端及计算机可读存储介质 - Google Patents
视频推荐方法、***、终端及计算机可读存储介质 Download PDFInfo
- Publication number
- CN109947983A CN109947983A CN201710850056.XA CN201710850056A CN109947983A CN 109947983 A CN109947983 A CN 109947983A CN 201710850056 A CN201710850056 A CN 201710850056A CN 109947983 A CN109947983 A CN 109947983A
- Authority
- CN
- China
- Prior art keywords
- matrix
- video
- user
- log data
- singular vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
本发明提供了一种视频推荐方法、***、终端及计算机可读存储介质,其中方法包括:获取用户历史观看视频的行为日志数据;根据行为日志数据构建用户‑视频评分矩阵;对用户‑视频评分矩阵进行满秩分解,得到与用户‑视频矩阵对应的左奇异向量矩阵、右奇异向量矩阵以及对角矩阵;根据左奇异向量矩阵、右奇异向量矩阵以及对角矩阵计算得到用户的相似邻居集合;根据相似邻居集合和行为日志数据获取视频推荐列表,并根据视频推荐列表进行视频推荐。本发明可以解决现有基于协同过滤算法中用户‑视频评分矩阵普遍存在的数据稀疏的问题,提升推荐***的视频推荐效果;还可以降低视频推荐过程中用户或视频最近邻计算的时间复杂度。
Description
技术领域
本发明属于视频推荐技术领域,尤其涉及一种视频推荐方法、***、终端及计算机可读存储介质。
背景技术
随着移动互联网的快速发展和移动设备的普及,视频观看已经成为人们生活中消磨时光不可或缺的一部分,如何有效提高用户粘性和留存率是当前各大视频运营方重点关注的问题。视频推荐***能够在用户无明确目的的前提下,主动推荐用户可能感兴趣的视频信息,对提高用户粘性和留存率非常有效,目前已被各大视频运行方广泛采用。
视频推荐***的核心之一是推荐算法,推荐算法的设计策略或方法选择将直接影响整个推荐***是否优劣,现有的视频推荐算法大致分为三类:社会化推荐算法、基于内容的推荐算法和协同过滤推荐算法,其中协同过滤推荐算法只需用户的行为日志数据就能产生很好的推荐效果,因而被广泛应用于各大主流视频网站的视频推荐***。然而,目前基于协同过滤推荐算法的视频推荐***存在有以下问题:
1)协同过滤推荐算法大都基于用户的行为日志数据生成“用户-视频”评分矩阵进行视频推荐,若用户历史观看视频的数量有限,则“用户-视频”评分矩阵会存在严重的数据稀疏问题,从而导致大量用户间缺乏相同视频或者大量视频间缺乏相同用户这一共性,用户的最近邻列表几乎为空,最终导致视频推荐效果不佳;
2)随着视频用户的不断增加,“用户-视频”评分矩阵的维度将会越来越高,导致后续视频推荐计算过程中用户或视频最近邻计算的时间复杂度非常高,推荐***的视频推荐结果可能无法及时更新,影响用户体验。
发明内容
有鉴于此,本发明提供了一种视频推荐方法、***、终端及计算机可读存储介质,以解决现有技术中若用户历史观看视频的数量有限,则“用户-视频”评分矩阵会存在严重的数据稀疏,导致视频推荐效果不佳以及随着视频用户的不断增加,视频推荐过程中用户或视频最近邻计算的时间复杂度较高的问题。
本发明的第一方面提供了一种视频推荐方法,包括:
获取用户历史观看视频的行为日志数据;
根据所述行为日志数据构建用户-视频评分矩阵;
对所述用户-视频评分矩阵进行满轶分解,得到与所述用户-视频矩阵对应的左奇异向量矩阵、右奇异向量矩阵以及对角矩阵;
根据所述左奇异向量矩阵、所述右奇异向量矩阵以及所述对角矩阵计算得到所述用户的相似邻居集合;
根据所述相似邻居集合和所述行为日志数据获取视频推荐列表,并根据所述视频推荐列表进行视频推荐。
本发明的第二方面提供了一种视频推荐***,包括:
行为数据获取单元,用于获取用户历史观看视频的行为日志数据;
评分矩阵构建单元,用于根据所述行为日志数据构建用户-视频评分矩阵;
评分矩阵分解单元,用于对所述用户-视频评分矩阵进行满轶分解,得到与所述用户-视频矩阵对应的左奇异向量矩阵、右奇异向量矩阵以及对角矩阵;
相似邻居计算单元,用于根据所述左奇异向量矩阵、所述右奇异向量矩阵以及所述对角矩阵计算得到所述用户的相似邻居集合;
视频推荐单元,用于根据所述相似邻居集合和所述行为日志数据获取视频推荐列表,并根据所述视频推荐列表进行视频推荐。
本发明的第三方面提供了一种终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现如上述第一方面所述方法的步骤。
本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其中,所述计算机程序被处理器执行时实现如上述第一方面所述方法的步骤。
本发明由于通过获取用户历史观看视频的行为日志数据;根据所述行为日志数据构建用户-视频评分矩阵;对所述用户-视频评分矩阵进行满轶分解,得到与所述用户-视频矩阵对应的左奇异向量矩阵、右奇异向量矩阵以及对角矩阵;根据所述左奇异向量矩阵、所述右奇异向量矩阵以及所述对角矩阵计算得到所述用户的相似邻居集合;根据所述相似邻居集合和所述行为日志数据获取视频推荐列表,并根据所述视频推荐列表进行视频推荐,从而可以有效解决解决现有基于协同过滤算法中用户-视频评分矩阵普遍存在的数据稀疏的问题,提升推荐***的视频推荐效果;同时,还可以降低视频推荐过程中用户或视频最近邻计算的时间复杂度,有效解决了现有推荐***因用户量或视频暴增导致视频推荐结果可能无法及时更新,影响用户体验的问题。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一提供的视频推荐方法的示意流程图;
图2是本发明实施例二提供的视频推荐方法的示意流程图;
图3是本发明实施例三提供的视频推荐***的示意性框图;
图4是本发明实施例四提供的视频推荐***的示意性框图;
图5是本发明实施例五提供的终端的示意性框图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定***结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的***、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
图1是本发明实施例一提供的视频推荐方法的示意流程图。参见图1所示,本实施例提供的一种视频推荐方法可以包括以下步骤:
步骤S101,获取用户历史观看视频的行为日志数据。
在本实施例中,所述用户历史观看视频的行为日志数据包括显性反馈数据和隐性反馈数据。其中,所述显性反馈数据包括但不限于用户对视频的收藏、购买、评分以及评论等行为数据,所述隐形反馈数据包括但不限于用户的浏览、观看以及在观看视频过程中的点击、搜索等行为数据。
步骤S102,根据所述行为日志数据构建用户-视频评分矩阵。
在本实施例中,可针对不同的应用场景对用户的行为日志数据进行分组归类,对不同类型的行为数据进行加权处理,如用户的显性反馈数据权重一般高于隐性反馈数据,经过对用户的所有行为进行完整的加权后,这样就能够得到用户的观看视频的爱好趋向,最终得到用户观看视频偏好的高维矩阵,即用户- 视频评分矩阵。
步骤S103,对所述用户-视频评分矩阵进行满轶分解,得到与所述用户-视频矩阵对应的左奇异向量矩阵、右奇异向量矩阵以及对角矩阵。
在本实施例中,步骤S103具体包括:
若所述用户-视频评分矩阵X是一个m×n的矩阵,定义X的SVD奇异值分解的降维矩阵为:X=UΣVT,其中U为X的左奇异向量矩阵,Σ为X的对角矩阵,VT为的右奇异向量矩阵,那么X分解后的U、Σ、VT的求解方式如下:
将所述用户-视频评分矩阵X的转置XT和X做矩阵乘法,得到n×n的一个方阵XTX,对方阵XTX进行特征分解,得到XTX的n个特征值λi和n个特征向量vi,方阵XTX的特征分解公式为:(XTX)vi=λivi;其中,i=1,2,3.......n,n为正整数;
将所述用户-视频评分矩阵X和X的转置XT做矩阵乘法,得到m×m的一个方阵XXT,对方阵XXT进行特征分解,得到XXT的m个特征值λj和m个特征向量 uj,方阵XXT的特征分解公式为:(XXT)uj=λjuj;其中,j=1,2,3.......m,m为正整数;
根据所述用户-视频矩阵X、所述左奇异向量矩阵U以及所述右奇异向量矩阵VT求解得出对角矩阵Σ中各个奇异值σk,求解公式为:σk=Avi/uj或者其中k=1,2,3......n,n≤m。
步骤S104,根据所述左奇异向量矩阵、所述右奇异向量矩阵以及所述对角矩阵计算得到所述用户的相似邻居集合。
在本实施例中,用户-视频评分矩阵降维前是高维稀疏矩阵,其中矩阵中存大量为0的值,会导致用户或视频间相似度的计算结果为0,从而出现这些用户或视频的最近邻列表几乎为空的问题。用户-视频评分矩阵降维后,用户-视频评分矩阵被映射到低维的潜在特征空间中,得到的用户或视频特征矩阵是低维的稠密矩阵,稠密矩阵中的值基本不为0,因此基于矩阵降维后的用户或视频特征矩阵进行相似度计算的结果基本上不为0,从而使得用户或视频对应的最近邻列表不会出现为空的问题。
步骤S105,根据所述相似邻居集合和所述行为日志数据获取视频推荐列表,并根据所述视频推荐列表进行视频推荐。
在本实施例中,所述相似邻居集合包括最近邻用户列表和最近邻视频列表,步骤S105具体包括:
根据所述相似邻居集合获取最近邻用户列表,获取所述最近邻用户列表观看的视频列表;和/或,根据所述相似邻居集合获取最近邻视频列表;
根据所述行为日志数据剔除所述视频列表和/或所述最近邻视频列表中用户已观看过的视频,获取到所述视频推荐列表。
在本实施例中,所述行为日志数据中记录有用户历史观看过的视频,因此在获取到最近邻用户列表中所有用户观看的视频列表和/或最近邻视频列表后,将其中用户历史观看过的视频剔除后,即可获取视频推荐列表。
优选的,在本实施例中,可根据所述行为日志数据中记录的用户对各个类型视频的评论或评分计算所述视频推荐列表中各个视频的分数,并按照分数高低顺序对视频推荐列表中的视频进行排序,并将排序后的视频推荐列表推荐给用户或者仅将排序靠前的几个视频推荐给用户。
以上可以看出,本实施例提供的视频推荐方法由于基于降维后的用户或视频特征矩阵计算与用户或用户观看过的视频相似的最近邻集合,从而有效的解决了现有基于协同过滤算法中用户-视频评分矩阵普遍存在的数据稀疏的问题,提升了推荐***的视频推荐效果;同时,还降低了视频推荐过程中用户或视频最近邻计算的时间复杂度,有效解决了现有推荐***因用户量或视频暴增导致视频推荐结果可能无法及时更新,影响用户体验的问题。
图2是本发明实施例二提供的视频推荐方法的示意流程图。参见图2所示,相对于上一实施例,本实施例提供的一种视频推荐方法在所述根据所述行为日志数据构建用户-视频评分矩阵之前还包括:
步骤S202,对所述行为日志数据进行过滤,去除与视频推荐无关的冗余数据。
在本实施例中,用户历史观看视频的行为日志数据采集过程中可能会存在程序log数据、网络状态数据等于视频推荐无关的数据,本实施例中,在构建用户-视频评分矩阵前,将行为日志数据中与视频推荐无关的数据直接删除,这样可以降低后续数据处理量,提高后续数据处理效率。
步骤S203,对过滤后的行为日志数据进行结构化处理。
在本实施例中,所述行为日志数据一般是一行行的字符串,是非结构化的,数据结构化处理是指将所述行为日志数据中的每一行字符串切分成一个个有效的字段以及转换成指定分割符的文本数据,并且以文本或者数据库表的形式存储起来,这样方便后续操作。
步骤S204,对结构化处理后的行为日志数据进行归一化和缺失数据补全处理。
在本实施例中,结构化处理后的数据中有些数值型字段的内容,如视频的评分,需限定其归一化取值范围,比如需要将所有视频的评分值映射到0~1之间;有些字段的值为空,就需要将这些为空的缺失数据补全,比如将字段的值为空的值设为0,或者将字段的值为设为所有非0值的平均值。
需要说明的是,本实施例中的步骤S201以及步骤S205~步骤S208的实现方式由于分别与上一实施例中步骤S101~步骤S105的实现方式完全相同,因此,在此不再赘述。
以上可以看出,相对于上述实施例,本实施例中由于在构建用户-视频评分矩阵前,先对用户历史观看视频的行为日志数据进行过滤、结构化处理以及归一化补全处理等数据预处理,从而可以使得后续构建用户-视频评分模型的效率和精度更高,进而提高了后续推荐的视频与用户的匹配度,提升了视频推荐效果。
图3是本发明实施例三提供的视频推荐***的示意性框图。为了便于说明,仅仅示出了与本实施例相关的部分。
参见图3所示,本实施例提供的一种视频推荐***3,包括:
行为数据获取单元31,用于获取用户历史观看视频的行为日志数据;
评分矩阵构建单元32,用于根据所述行为日志数据构建用户-视频评分矩阵;
评分矩阵分解单元33,用于对所述用户-视频评分矩阵进行满轶分解,得到与所述用户-视频矩阵对应的左奇异向量矩阵、右奇异向量矩阵以及对角矩阵;
相似邻居计算单元34,用于根据所述左奇异向量矩阵、所述右奇异向量矩阵以及所述对角矩阵计算得到所述用户的相似邻居集合;
视频推荐单元35,用于根据所述相似邻居集合和所述行为日志数据获取视频推荐列表,并根据所述视频推荐列表进行视频推荐。
可选的,所述评分矩阵分解单元33具体用于:
若所述用户-视频评分矩阵X是一个m×n的矩阵,定义X的SVD奇异值分解的降维矩阵为:X=UΣVT,其中U为X的左奇异向量矩阵,Σ为X的对角矩阵, VT为的右奇异向量矩阵,那么X分解后的U、Σ、VT的求解方式如下:
将所述用户-视频评分矩阵X的转置XT和X做矩阵乘法,得到n×n的一个方阵XTX,对方阵XTX进行特征分解,得到XTX的n个特征值λi和n个特征向量vi,方阵XTX的特征分解公式为:(XTX)vi=λivi;其中,i=1,2,3.......n,n为正整数;
将所述用户-视频评分矩阵X和X的转置XT做矩阵乘法,得到m×m的一个方阵XXT,对方阵XXT进行特征分解,得到XXT的m个特征值λj和m个特征向量 uj,方阵XXT的特征分解公式为:(XXT)uj=λjuj;其中,j=1,2,3.......m,m为正整数;
根据所述用户-视频矩阵X、所述左奇异向量矩阵U以及所述右奇异向量矩阵VT求解得出对角矩阵Σ中各个奇异值σk,求解公式为:σk=Avi/uj或者其中k=1,2,3......n,n≤m。
可选的,所述视频推荐单元35具体用于:
根据所述相似邻居集合获取最近邻用户列表,获取所述最近邻用户列表观看的视频列表;和/或,根据所述相似邻居集合获取最近邻视频列表;
根据所述行为日志数据剔除所述视频列表和/或所述最近邻视频列表中用户已观看过的视频,获取到所述视频推荐列表。
可选的,参见图4所示,所述的视频推荐***3还包括:
数据过滤单元36,用于对所述行为日志数据进行过滤,去除与视频推荐无关的冗余数据;
结构化处理单元37,用于对过滤后的行为日志数据进行结构化处理;
归一化补全单元38,用于对结构化处理后的行为日志数据进行归一化和缺失数据补全处理。
需要说明的是,本发明实施例提供的上述***中的各个单元,由于与本发明方法实施例基于同一构思,其带来的技术效果与本发明方法实施例相同,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
因此,可以看出本发明实施例提供的视频推荐***同样可以有效的解决现有基于协同过滤算法中用户-视频评分矩阵普遍存在的数据稀疏的问题,提升推荐***的视频推荐效果;同时,还能够降低视频推荐过程中用户或视频最近邻计算的时间复杂度,有效解决了现有推荐***因用户量或视频暴增导致视频推荐结果可能无法及时更新,影响用户体验的问题。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
图5是本发明实施例五提供的终端的示意图。如图5所示,该实施例的终端5包括:处理器50、存储器51以及存储在所述存储器51中并可在所述处理器50上运行的计算机程序52。所述处理器50执行所述计算机程序52时实现上述各个方法实施例中的步骤,例如图1所示的步骤101至105。或者,所述处理器50执行所述计算机程序52时实现上述各装置实施例中各模块/单元的功能,例如图3所示模块31至35的功能。
示例性的,所述计算机程序52可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器51中,并由所述处理器50执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序52在所述终端5中的执行过程。例如,所述计算机程序52可以被分割成行为数据获取单元31、评分矩阵构建单元32、评分矩阵分解单元33、相似邻居计算单元34以及视频推荐单元35,各个单元具体功能如下:
行为数据获取单元31,用于获取用户历史观看视频的行为日志数据;
评分矩阵构建单元32,用于根据所述行为日志数据构建用户-视频评分矩阵;
评分矩阵分解单元33,用于对所述用户-视频评分矩阵进行满轶分解,得到与所述用户-视频矩阵对应的左奇异向量矩阵、右奇异向量矩阵以及对角矩阵;
相似邻居计算单元34,用于根据所述左奇异向量矩阵、所述右奇异向量矩阵以及所述对角矩阵计算得到所述用户的相似邻居集合;
视频推荐单元35,用于根据所述相似邻居集合和所述行为日志数据获取视频推荐列表,并根据所述视频推荐列表进行视频推荐。
所述终端设备5可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端可包括,但不仅限于,处理器50、存储器51。本领域技术人员可以理解,图5仅仅是终端5的示例,并不构成对终端设备5的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端还可以包括输入输出设备、网络接入设备、总线等。
所称处理器50可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列 (Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器51可以是所述终端5的内部存储单元,例如终端5的硬盘或内存。所述存储器51也可以是所述终端5的外部存储设备,例如所述终端5上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器51还可以既包括所述终端5的内部存储单元也包括外部存储设备。所述存储器51用于存储所述计算机程序以及所述终端所需的其他程序和数据。所述存储器51还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述***中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.一种视频推荐方法,其特征在于,包括:
获取用户历史观看视频的行为日志数据;
根据所述行为日志数据构建用户-视频评分矩阵;
对所述用户-视频评分矩阵进行满秩分解,得到与所述用户-视频矩阵对应的左奇异向量矩阵、右奇异向量矩阵以及对角矩阵;
根据所述左奇异向量矩阵、所述右奇异向量矩阵以及所述对角矩阵计算得到所述用户的相似邻居集合;
根据所述相似邻居集合和所述行为日志数据获取视频推荐列表,并根据所述视频推荐列表进行视频推荐。
2.如权利要求1所述的视频推荐方法,其特征在于,所述对所述用户-视频评分矩阵进行满秩分解,得到与所述用户-视频矩阵对应的左奇异向量矩阵、右奇异向量矩阵以及对角矩阵包括:
若所述用户-视频评分矩阵X是一个m×n的矩阵,定义X的SVD奇异值分解的降维矩阵为:X=UΣVT,其中U为X的左奇异向量矩阵,Σ为X的对角矩阵,VT为的右奇异向量矩阵,那么X分解后的U、Σ、VT的求解方式如下:
将所述用户-视频评分矩阵X的转置XT和X做矩阵乘法,得到n×n的一个方阵XTX,对方阵XTX进行特征分解,得到XTX的n个特征值λi和n个特征向量vi,方阵XTX的特征分解公式为:(XTX)vi=λivi;其中,i=1,2,3.......n,n为正整数;
将所述用户-视频评分矩阵X和X的转置XT做矩阵乘法,得到m×m的一个方阵XXT,对方阵XXT进行特征分解,得到XXT的m个特征值λj和m个特征向量uj,方阵XXT的特征分解公式为:(XXT)uj=λjuj;其中,j=1,2,3.......m,m为正整数;
根据所述用户-视频矩阵X、所述左奇异向量矩阵U以及所述右奇异向量矩阵VT求解得出对角矩阵Σ中各个奇异值σk,求解公式为:σk=Avi/uj或者其中k=1,2,3......n,n≤m。
3.如权利要求1所述的视频推荐方法,其特征在于,所述根据所述行为日志数据构建用户-视频评分矩阵之前还包括:
对所述行为日志数据进行过滤,去除与视频推荐无关的冗余数据;
对过滤后的行为日志数据进行结构化处理;
对结构化处理后的行为日志数据进行归一化和缺失数据补全处理。
4.如权利要求1所述的视频推荐方法,其特征在于,所述根据所述相似邻居集合和所述行为日志数据获取视频推荐列表包括:
根据所述相似邻居集合获取最近邻用户列表,获取所述最近邻用户列表观看的视频列表;和/或,根据所述相似邻居集合获取最近邻视频列表;
根据所述行为日志数据剔除所述视频列表和/或所述最近邻视频列表中用户已观看过的视频,获取到所述视频推荐列表。
5.一种视频推荐***,其特征在于,包括:
行为数据获取单元,用于获取用户历史观看视频的行为日志数据;
评分矩阵构建单元,用于根据所述行为日志数据构建用户-视频评分矩阵;
评分矩阵分解单元,用于对所述用户-视频评分矩阵进行满秩分解,得到与所述用户-视频矩阵对应的左奇异向量矩阵、右奇异向量矩阵以及对角矩阵;
相似邻居计算单元,用于根据所述左奇异向量矩阵、所述右奇异向量矩阵以及所述对角矩阵计算得到所述用户的相似邻居集合;
视频推荐单元,用于根据所述相似邻居集合和所述行为日志数据获取视频推荐列表,并根据所述视频推荐列表进行视频推荐。
6.如权利要求5所述的视频推荐***,其特征在于,所述评分矩阵分解单元具体用于:
若所述用户-视频评分矩阵X是一个m×n的矩阵,定义X的SVD奇异值分解的降维矩阵为:X=UΣVT,其中U为X的左奇异向量矩阵,Σ为X的对角矩阵,VT为的右奇异向量矩阵,那么X分解后的U、Σ、VT的求解方式如下:
将所述用户-视频评分矩阵X的转置XT和X做矩阵乘法,得到n×n的一个方阵XTX,对方阵XTX进行特征分解,得到XTX的n个特征值λi和n个特征向量vi,方阵XTX的特征分解公式为:(XTX)vi=λivi;其中,i=1,2,3.......n,n为正整数;
将所述用户-视频评分矩阵X和X的转置XT做矩阵乘法,得到m×m的一个方阵XXT,对方阵XXT进行特征分解,得到XXT的m个特征值λj和m个特征向量uj,方阵XXT的特征分解公式为:(XXT)uj=λjuj;其中,j=1,2,3.......m,m为正整数;
根据所述用户-视频矩阵X、所述左奇异向量矩阵U以及所述右奇异向量矩阵VT求解得出对角矩阵Σ中各个奇异值σk,求解公式为:σk=Avi/uj或者其中k=1,2,3......n,n≤m。
7.如权利要求5所述的视频推荐***,其特征在于,还包括:
数据过滤单元,用于对所述行为日志数据进行过滤,去除与视频推荐无关的冗余数据;
结构化处理单元,用于对过滤后的行为日志数据进行结构化处理;
归一化补全单元,用于对结构化处理后的行为日志数据进行归一化和缺失数据补全处理。
8.如权利要求5所述的视频推荐***,其特征在于,所述视频推荐单元具体用于:
根据所述相似邻居集合获取最近邻用户列表,获取所述最近邻用户列表观看的视频列表;和/或,根据所述相似邻居集合获取最近邻视频列表;
根据所述行为日志数据剔除所述视频列表和/或所述最近邻视频列表中用户已观看过的视频,获取到所述视频推荐列表。
9.一种终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至4任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710850056.XA CN109947983A (zh) | 2017-09-19 | 2017-09-19 | 视频推荐方法、***、终端及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710850056.XA CN109947983A (zh) | 2017-09-19 | 2017-09-19 | 视频推荐方法、***、终端及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109947983A true CN109947983A (zh) | 2019-06-28 |
Family
ID=67003978
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710850056.XA Pending CN109947983A (zh) | 2017-09-19 | 2017-09-19 | 视频推荐方法、***、终端及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109947983A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110866181A (zh) * | 2019-10-12 | 2020-03-06 | 平安国际智慧城市科技股份有限公司 | 资源推荐的方法、装置及存储介质 |
CN112135193A (zh) * | 2020-09-24 | 2020-12-25 | 湖南快乐阳光互动娱乐传媒有限公司 | 视频推荐方法及装置 |
CN112380389A (zh) * | 2020-11-18 | 2021-02-19 | 中信银行股份有限公司 | 一种视频推荐方法、装置、电子设备和可读存储介质 |
CN116028727A (zh) * | 2023-03-30 | 2023-04-28 | 南京邮电大学 | 一种基于图像数据处理的视频推荐方法 |
CN117235366A (zh) * | 2023-09-19 | 2023-12-15 | 北京学说科技有限公司 | 基于内容关联性的协同推荐方法及*** |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040158497A1 (en) * | 2003-02-06 | 2004-08-12 | Brand Matthew E. | On-line recommender system |
CN103620592A (zh) * | 2011-04-19 | 2014-03-05 | 诺基亚公司 | 用于推荐结果的灵活多样化的方法和装置 |
CN105426392A (zh) * | 2015-10-28 | 2016-03-23 | 浪潮软件集团有限公司 | 一种协同过滤推荐方法及*** |
US20160147768A1 (en) * | 2014-11-25 | 2016-05-26 | Samsung Electronics Co., Ltd. | Device and method for providing media resource |
CN106649540A (zh) * | 2016-10-26 | 2017-05-10 | Tcl集团股份有限公司 | 一种视频推荐方法及*** |
-
2017
- 2017-09-19 CN CN201710850056.XA patent/CN109947983A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040158497A1 (en) * | 2003-02-06 | 2004-08-12 | Brand Matthew E. | On-line recommender system |
CN103620592A (zh) * | 2011-04-19 | 2014-03-05 | 诺基亚公司 | 用于推荐结果的灵活多样化的方法和装置 |
US20160147768A1 (en) * | 2014-11-25 | 2016-05-26 | Samsung Electronics Co., Ltd. | Device and method for providing media resource |
CN105426392A (zh) * | 2015-10-28 | 2016-03-23 | 浪潮软件集团有限公司 | 一种协同过滤推荐方法及*** |
CN106649540A (zh) * | 2016-10-26 | 2017-05-10 | Tcl集团股份有限公司 | 一种视频推荐方法及*** |
Non-Patent Citations (1)
Title |
---|
吴奕: "一种改进的协同过滤技术在视频推荐中的应用", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110866181A (zh) * | 2019-10-12 | 2020-03-06 | 平安国际智慧城市科技股份有限公司 | 资源推荐的方法、装置及存储介质 |
CN110866181B (zh) * | 2019-10-12 | 2022-04-22 | 平安国际智慧城市科技股份有限公司 | 资源推荐的方法、装置及存储介质 |
CN112135193A (zh) * | 2020-09-24 | 2020-12-25 | 湖南快乐阳光互动娱乐传媒有限公司 | 视频推荐方法及装置 |
CN112380389A (zh) * | 2020-11-18 | 2021-02-19 | 中信银行股份有限公司 | 一种视频推荐方法、装置、电子设备和可读存储介质 |
CN116028727A (zh) * | 2023-03-30 | 2023-04-28 | 南京邮电大学 | 一种基于图像数据处理的视频推荐方法 |
CN116028727B (zh) * | 2023-03-30 | 2023-08-18 | 南京邮电大学 | 一种基于图像数据处理的视频推荐方法 |
CN117235366A (zh) * | 2023-09-19 | 2023-12-15 | 北京学说科技有限公司 | 基于内容关联性的协同推荐方法及*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109947983A (zh) | 视频推荐方法、***、终端及计算机可读存储介质 | |
US20210173711A1 (en) | Integrated value chain risk-based profiling and optimization | |
CN111506801B (zh) | 一种应用App中子应用的排序方法及装置 | |
CN110020122A (zh) | 一种视频推荐方法、***及计算机可读存储介质 | |
WO2023065859A1 (zh) | 物品推荐方法、装置及存储介质 | |
CN110135942A (zh) | 产品推荐方法、装置及计算机可读存储介质 | |
CN109471978B (zh) | 一种电子资源推荐方法及装置 | |
CN113918832B (zh) | 基于社交关系的图卷积协同过滤推荐*** | |
CN113918833B (zh) | 通过社交网络关系的图卷积协同过滤实现的产品推荐方法 | |
CN112085615A (zh) | 图神经网络的训练方法及装置 | |
CN112507098B (zh) | 问题处理方法、装置、电子设备、存储介质及程序产品 | |
CN113918834B (zh) | 融合社交关系的图卷积协同过滤推荐方法 | |
CN107894827A (zh) | 应用清理方法、装置、存储介质及电子设备 | |
CN109087138A (zh) | 数据处理方法及***、计算机***和可读存储介质 | |
WO2023087914A1 (zh) | 推荐内容的选择方法、装置、设备、存储介质及程序产品 | |
CN109977264A (zh) | 一种基于元路径相似度的用户推荐方法、***、服务器及存储介质 | |
Truong et al. | Exploring cross-modality utilization in recommender systems | |
Park et al. | On the power of gradual network alignment using dual-perception similarities | |
CN109450963A (zh) | 消息推送方法及终端设备 | |
Provalov et al. | Synevarec: A framework for evaluating recommender systems on synthetic data classes | |
CN113761350A (zh) | 一种数据推荐方法、相关装置和数据推荐*** | |
CN112989170A (zh) | 应用于信息搜索的关键词匹配方法、信息搜索方法及装置 | |
CN110276283B (zh) | 图片识别方法、目标识别模型训练方法及装置 | |
Gupta et al. | Framework to Analyze Customer’s Feedback in Smartphone Industry Using Opinion Mining. | |
CN109886299B (zh) | 一种用户画像方法、装置、可读存储介质及终端设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190628 |