CN117235366A - 基于内容关联性的协同推荐方法及*** - Google Patents

基于内容关联性的协同推荐方法及*** Download PDF

Info

Publication number
CN117235366A
CN117235366A CN202311204350.5A CN202311204350A CN117235366A CN 117235366 A CN117235366 A CN 117235366A CN 202311204350 A CN202311204350 A CN 202311204350A CN 117235366 A CN117235366 A CN 117235366A
Authority
CN
China
Prior art keywords
content
click
user
obtaining
scoring matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311204350.5A
Other languages
English (en)
Other versions
CN117235366B (zh
Inventor
陈皓
王正位
袁伟
梁昱
万朝晔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology Beijing USTB
Original Assignee
University of Science and Technology Beijing USTB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology Beijing USTB filed Critical University of Science and Technology Beijing USTB
Priority to CN202311204350.5A priority Critical patent/CN117235366B/zh
Publication of CN117235366A publication Critical patent/CN117235366A/zh
Application granted granted Critical
Publication of CN117235366B publication Critical patent/CN117235366B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种基于内容关联性的协同推荐方法及***,计算视频内容之间的相似度simij;对内容点击集合CKi进行离差标准化,得到用户的内容喜好权重向量集合COEi;基于内容喜好权重向量集合COEi计算得到用户i对相关内容集合的接受度集合Ai;使用蒙特卡洛模拟法模拟用户对相关内容集合CRi的点击情况,得到用户的内容点击扩展集合CIKi;基于内容点击集合CK和内容点击扩展集合CKI构建当前用户的内容评分矩阵Rn×m;使用奇异值分解算法得到内容评分矩阵的预测评分矩阵,基于预测评分矩阵得到内容推荐列表。该基于内容关联性的协同推荐方法解决现有推荐***无法反映推荐内容相关性、且用户体验较差、页面转化率较低的问题。

Description

基于内容关联性的协同推荐方法及***
技术领域
本发明涉及计算机技术领域,具体涉及一种基于内容关联性的协同推荐方法、***、电子设备及存储介质。
背景技术
随着移动互联网快速发展,互联网用户规模已接近增长的顶点,当海量的信息充斥我们的生活时,能够高效快速地获取对自己有价值的信息显得十分重要;
现有的推荐***作为一种高效的信息过滤工具,可以很好地使用户精准高效获取信息其中,协同过滤是应用最广泛的推荐算法,在推荐领域占有极其重要的地位。协同过滤简单来说是利用某兴趣相投、拥有共同经验群体的喜好来推荐用户感兴趣的信息,个人通过合作的机制给予信息相当程度的回应并记录下来以达到过滤的目的进而帮助别人筛选信息。协同过滤的方法优点在于无需领域知识,并且算法易于分布式实现、可以处理海量数据集。但是协同过滤的方法也存在数据稀疏、无法反映推荐内容相关性的缺点。
亟需一种可以反映推荐内容相关性、且能够提高用户体验、增加页面转化率的协同推荐方法。
发明内容
本发明实施例的目的在于提供一种基于内容关联性的协同推荐方法、***、电子设备及存储介质,用以解决现有推荐***无法反映推荐内容相关性、且用户体验较差、页面转化率较低的问题。
为实现上述目的,本发明实施例提供一种基于内容关联性的协同推荐方法,所述方法具体包括:
S101,获取若干个视频内容,并计算所述视频内容之间的相似度simij
S102,基于用户i在预设时间内的点击行为数据得到内容点击集合CKi,对所述内容点击集合CKi进行离差标准化,得到用户的内容喜好权重向量集合COEi
S103,获取与所述内容点击集合CKi中所有视频有相关性的相关内容集合CRi,并基于所述内容喜好权重向量集合COEi计算得到用户i对相关内容集合的接受度集合Ai
S104,使用蒙特卡洛模拟法模拟用户对相关内容集合CRi的点击情况,得到用户的内容点击扩展集合CIKi
S105,重复步骤S102-S104获得所有用户的内容点击集合CK与内容点击扩展集合CKI,并基于所述内容点击集合CK和所述内容点击扩展集合CKI构建当前用户的内容评分矩阵Rn×m
S106,使用奇异值分解算法得到所述内容评分矩阵的预测评分矩阵,基于所述预测评分矩阵得到内容推荐列表。
在上述技术方案的基础上,本发明还可以做如下改进:
进一步地,所述获取若干个视频内容,并计算所述视频内容之间的相似度simij,包括:
通过ASR技术提取每个所述视频内容的文本数据,基于所述文本数据和视频内容属性得到每个所述视频内容对应的文本描述texti
计算文本描述texti与文本描述textj之间的相似度simij,基于所述相似度simij得到视频内容i与视频内容j之间的相似度simij
进一步地,所述基于用户i在预设时间内的点击行为数据得到内容点击集合CKi,对所述内容点击集合CKi进行离差标准化,得到用户的内容喜好权重向量集合COEi,包括:
通过公式1计算用户i的内容喜好权重向量;
式中,为内容喜好权重向量,/>CKi为内容点击集合。
进一步地,所述使用蒙特卡洛模拟法模拟用户对相关内容集合CRi的点击情况,得到用户的内容点击扩展集合CIKi,包括:
通过用户i的接受度集合Ai构建用户i对相关内容集合CRi的点击的概率集合Pi
基于所述概率集合Pi计算得到用户的内容点击扩展集合CIKi
进一步地,所述重复步骤S102-S104获得所有用户的内容点击集合CK与内容点击扩展集合CKI,并基于所述内容点击集合CK和所述内容点击扩展集合CKI构建当前用户的内容评分矩阵Rn×m,包括:
对所述内容评分矩阵Rn×m进行分解处理;
将进行分解处理后的内容评分矩阵Rn×m进行降维处理。
进一步地,所述重复步骤S102-S104获得所有用户的内容点击集合CK与内容点击扩展集合CKI,并基于所述内容点击集合CK和所述内容点击扩展集合CKI构建当前用户的内容评分矩阵Rn×m,还包括:
降维处理后,通过公式2计算将视频内容i推荐给用户u的推荐分数;
式中,为将视频内容i推荐给用户u的推荐分数,pu为用户u的特征向量,/>为视频内容i的特征向量。
进一步地,所述基于内容关联性的协同推荐方法还包括:
对所述推荐分数进行排序得到内容推荐列表,基于所述内容推荐列表生成推荐页面。
一种基于内容关联性的协同推荐***,包括:
获取模块,用于获取若干个视频内容;
相似度计算模块,用于计算所述视频内容之间的相似度simij
内容点击集合确定模块,用于基于用户i在预设时间内的点击行为数据得到内容点击集合CKi
内容喜好权重向量集合确定模块,用于对所述内容点击集合CKi进行离差标准化,得到用户的内容喜好权重向量集合COEi
相关内容集合确定模块,用于获取与所述内容点击集合CKi中所有视频有相关性的相关内容集合CRi
接受度集合确定模块,用于基于所述内容喜好权重向量集合COEi计算得到用户i对相关内容集合的接受度集合Ai
内容点击扩展集合确定模块,用于使用蒙特卡洛模拟法模拟用户对相关内容集合CRi的点击情况,得到用户的内容点击扩展集合CIKi
内容评分矩阵确定模块,用于获得所有用户的内容点击集合CK与内容点击扩展集合CKI,并基于所述内容点击集合CK和所述内容点击扩展集合CKI构建当前用户的内容评分矩阵Rn×m
内容推荐列表确定模块,用于使用奇异值分解算法得到所述内容评分矩阵的预测评分矩阵,基于所述预测评分矩阵得到内容推荐列表。
一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如所述方法的步骤。
一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述方法的步骤。
本发明实施例具有如下优点:
本发明中基于内容关联性的协同推荐方法,获取若干个视频内容,并计算所述视频内容之间的相似度simij;基于用户i在预设时间内的点击行为数据得到内容点击集合CKi,对所述内容点击集合CKi进行离差标准化,得到用户的内容喜好权重向量集合COEi;获取与所述内容点击集合CKi中所有视频有相关性的相关内容集合CRi,并基于所述内容喜好权重向量集合COEi计算得到用户i对相关内容集合的接受度集合Ai;使用蒙特卡洛模拟法模拟用户对相关内容集合CRi的点击情况,得到用户的内容点击扩展集合CIKi;重复步骤S102-S104获得所有用户的内容点击集合CK与内容点击扩展集合CKI,并基于所述内容点击集合CK和所述内容点击扩展集合CKI构建当前用户的内容评分矩阵Rn×m;使用奇异值分解算法得到所述内容评分矩阵的预测评分矩阵,基于所述预测评分矩阵得到内容推荐列表,解决了现有技术中推荐***无法反映推荐内容相关性、且用户体验较差、页面转化率较低的问题。
附图说明
为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引申获得其它的实施附图。
本说明书所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本发明可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本发明所能产生的功效及所能达成的目的下,均应仍落在本发明所揭示的技术内容能涵盖的范围内。
图1为本发明基于内容关联性的协同推荐方法的流程图;
图2为本发明基于内容关联性的协同推荐***的架构图;
图3为本发明提供的电子设备实体结构示意图。
其中附图标记为:
获取模块10,相似度计算模块20,内容点击集合确定模块30,内容喜好权重向量集合确定模块40,相关内容集合确定模块50,接受度集合确定模块60,内容点击扩展集合确定模块70,内容评分矩阵确定模块80,内容推荐列表确定模块90,电子设备100,处理器1001,存储器1002,总线1003。
具体实施方式
以下由特定的具体实施例说明本发明的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本发明的其他优点及功效,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例
图1为本发明基于内容关联性的协同推荐方法实施例流程图,如图1所示,本发明实施例提供的一种基于内容关联性的协同推荐方法包括以下步骤:
S101,获取若干个视频内容,并计算视频内容之间的相似度;
具体的,通过ASR技术提取每个所述视频内容的文本数据,基于所述文本数据和视频内容属性得到每个所述视频内容对应的文本描述texti;视频内容属性包括领域、作者、机构等;
表1为内容文本描述表;如表1所示;
表1
通过大语言模型LLaMA计算文本描述texti与文本描述textj之间的相似度simij,基于所述相似度simij得到视频内容i与视频内容j之间的相似度simij,simij∈[0,1),simij越大表示视频内容i与视频内容j之间的相关性越高,simij=0表示视频内容i与视频内容j之间无相关性。
表2为内容相关性表:
表2
S102,基于用户i在预设时间内的点击行为数据得到内容点击集合,对内容点击集合进行离差标准化,得到用户的内容喜好权重向量集合;
具体的,通过公式1计算用户i的内容喜好权重向量;
式中,为内容喜好权重向量,/>CKi为内容点击集合。
优选的,预设时间为近一个月内,内容点击集合定义内容集合Ci为用户点击内容集合;
表3为用户点击行为表;
表3
表4为用户对内容主题的喜好权重;
表4
S103,获取与内容点击集合中所有视频有相关性的相关内容集合,并基于内容喜好权重向量集合计算得到用户i对相关内容集合的接受度集合;
具体的,CRi中的视频内容为用户近一个月内未点击过的视频内容并且如果j∈Ci、u∈CRi,存在simju∈(0,1);
即CRi为用户近一个月内未点击过并且与用户点击过的内容有相关性的内容集合,对于用户i的j∈Ci点击内容集合与u∈CRi相关内容集合,存在u的相关性集合SIMu={…simju…},j∈Ci;用户i对内容u∈CRi的接受度为:
根据上述得到用户i对其相关内容集合CRi的接受度集合为u,k∈CRi
表5为相关内容接受度表;
表5
S104,使用蒙特卡洛模拟法模拟用户对相关内容集合的点击情况,得到用户的内容点击扩展集合。
具体的,每次试验有多种可能结果,但是每种结果只会出现一个;
每次试验相互独立,每次试验结果都不受其他次试验结果的影响。
通过用户i的接受度集合Ai构建用户i对相关内容集合CRi的点击的概率集合Piu,k∈CRi;可知,SUUM(Pi)=1;
根据概率集合Pi可知每次试验结果都有各自发生的概率,并且所有结果的发生概率之和为1。
根据上述可知,用户i对其相关内容集合CRi中内容的点击呈现多项分布,其每次点击结果出现的概率为Pi;因此可以使用蒙特卡洛模拟法进行试验模拟。进行n次试验模拟得到用户i的内容点击扩展集合为
表6为模拟用户点击行为数据表;
表6
S105,重复步骤S102-S104获得所有用户的内容点击集合CK与内容点击扩展集合CKI,并基于内容点击集合CK和内容点击扩展集合CKI构建当前用户的内容评分矩阵;
具体的,对所述内容评分矩阵Rn×m进行分解处理;
R=U∑VT,其中,U为n*n的正交矩阵,V为m*m的正交矩阵,∑为n*m的矩阵。
将进行分解处理后的内容评分矩阵Rn×m进行降维处理,保留部分较大的奇异值,其对角线元素赋值0。
降维处理后得到:降维从物理意义上是把用户和内容都映射到一个k维空间,降维之后即可通过用户向量与内容向量点积的方式计算推荐分数,
通过公式2计算将视频内容i推荐给用户u的推荐分数;
式中,为将视频内容i推荐给用户u的推荐分数,pu为用户u的特征向量,/>为视频内容i的特征向量。
根据奇异值分解的损失函数:
将把用户和内容映射到一个k维空间的问题转化为机器学习的问题,常用的求解方法有随机梯度下降法和交替最小二乘法,本发明采用交替最小二乘法法求解;
表7为用户-内容评分矩阵;
表7
/>
/>
/>
/>
S106,使用奇异值分解算法得到内容评分矩阵的预测评分矩阵,基于预测评分矩阵得到内容推荐列表;
具体的,对目标用户未评分部分的预测评分进行排序,选择预测评分最高的内容形成推荐列表;
表8为用户推荐列表;
表8
对所述推荐分数进行排序得到内容推荐列表,基于所述内容推荐列表生成推荐页面。
该基于内容关联性的协同推荐方法,获取若干个视频内容,并计算所述视频内容之间的相似度simij;基于用户i在预设时间内的点击行为数据得到内容点击集合CKi,对所述内容点击集合CKi进行离差标准化,得到用户的内容喜好权重向量集合COEi;获取与所述内容点击集合CKi中所有视频有相关性的相关内容集合CRi,并基于所述内容喜好权重向量集合COEi计算得到用户i对相关内容集合的接受度集合Ai;使用蒙特卡洛模拟法模拟用户对相关内容集合CRi的点击情况,得到用户的内容点击扩展集合CIKi;重复步骤S102-S104获得所有用户的内容点击集合CK与内容点击扩展集合CKI,并基于所述内容点击集合CK和所述内容点击扩展集合CKI构建当前用户的内容评分矩阵Rn×m;使用奇异值分解算法得到所述内容评分矩阵的预测评分矩阵,基于所述预测评分矩阵得到内容推荐列表。解决了现有推荐***无法反映推荐内容相关性、且用户体验较差、页面转化率较低的问题。
图2为本发明基于内容关联性的协同推荐***实施例流程图;如图2所示,本发明实施例提供的一种基于内容关联性的协同推荐***,包括以下步骤:
获取模块10,用于获取若干个视频内容;
相似度计算模块20,用于计算所述视频内容之间的相似度simij
内容点击集合确定模块30,用于基于用户i在预设时间内的点击行为数据得到内容点击集合CKi
内容喜好权重向量集合确定模块40,用于对所述内容点击集合CKi进行离差标准化,得到用户的内容喜好权重向量集合COEi
相关内容集合确定模块50,用于获取与所述内容点击集合CKi中所有视频有相关性的相关内容集合CRi
接受度集合确定模块60,用于基于所述内容喜好权重向量集合COEi计算得到用户i对相关内容集合的接受度集合Ai
内容点击扩展集合确定模块70,用于使用蒙特卡洛模拟法模拟用户对相关内容集合CRi的点击情况,得到用户的内容点击扩展集合CIKi
内容评分矩阵确定模块80,用于获得所有用户的内容点击集合CK与内容点击扩展集合CKI,并基于所述内容点击集合CK和所述内容点击扩展集合CKI构建当前用户的内容评分矩阵Rn×m
内容推荐列表确定模块90,用于使用奇异值分解算法得到所述内容评分矩阵的预测评分矩阵,基于所述预测评分矩阵得到内容推荐列表。
本发明的一种基于内容关联性的协同推荐***,通过获取模块10获取若干个视频内容;通过相似度计算模块20计算所述视频内容之间的相似度simij;通过内容点击集合确定模块30基于用户i在预设时间内的点击行为数据得到内容点击集合CKi;通过内容喜好权重向量集合确定模块40对所述内容点击集合CKi进行离差标准化,得到用户的内容喜好权重向量集合COEi;通过相关内容集合确定模块50获取与所述内容点击集合CKi中所有视频有相关性的相关内容集合CRi;通过接受度集合确定模块60基于所述内容喜好权重向量集合COEi计算得到用户i对相关内容集合的接受度集合Ai;通过内容点击扩展集合确定模块70使用蒙特卡洛模拟法模拟用户对相关内容集合CRi的点击情况,得到用户的内容点击扩展集合CIKi;通过内容评分矩阵确定模块80获得所有用户的内容点击集合CK与内容点击扩展集合CKI,并基于所述内容点击集合CK和所述内容点击扩展集合CKI构建当前用户的内容评分矩阵Rn×m;通过内容推荐列表确定模块90使用奇异值分解算法得到所述内容评分矩阵的预测评分矩阵,基于所述预测评分矩阵得到内容推荐列表。该基于内容关联性的协同推荐方法解决现有推荐***无法反映推荐内容相关性、且用户体验较差、页面转化率较低的问题。
图3为本发明实施例提供的电子设备实体结构示意图,如图3所示,电子设备100包括:处理器1001(processor)、存储器1002(memory)和总线1003;
其中,处理器1001、存储器1002通过总线1003完成相互间的通信;
处理器1001用于调用存储器1002中的程序指令,以执行上述各方法实施例所提供的方法,例如包括:获取若干个视频内容,并计算所述视频内容之间的相似度simij;基于用户i在预设时间内的点击行为数据得到内容点击集合CKi,对所述内容点击集合CKi进行离差标准化,得到用户的内容喜好权重向量集合COEi;获取与所述内容点击集合CKi中所有视频有相关性的相关内容集合CRi,并基于所述内容喜好权重向量集合COEi计算得到用户i对相关内容集合的接受度集合Ai;使用蒙特卡洛模拟法模拟用户对相关内容集合CRi的点击情况,得到用户的内容点击扩展集合CIKi;获得所有用户的内容点击集合CK与内容点击扩展集合CKI,并基于所述内容点击集合CK和所述内容点击扩展集合CKI构建当前用户的内容评分矩阵Rn×m;使用奇异值分解算法得到所述内容评分矩阵的预测评分矩阵,基于所述预测评分矩阵得到内容推荐列表。
本实施例提供一种非暂态计算机可读存储介质,非暂态计算机可读存储介质存储计算机指令,计算机指令使计算机执行上述各方法实施例所提供的方法,例如包括:获取若干个视频内容,并计算所述视频内容之间的相似度simij;基于用户i在预设时间内的点击行为数据得到内容点击集合CKi,对所述内容点击集合CKi进行离差标准化,得到用户的内容喜好权重向量集合COEi;获取与所述内容点击集合CKi中所有视频有相关性的相关内容集合CRi,并基于所述内容喜好权重向量集合COEi计算得到用户i对相关内容集合的接受度集合Ai;使用蒙特卡洛模拟法模拟用户对相关内容集合CRi的点击情况,得到用户的内容点击扩展集合CIKi;获得所有用户的内容点击集合CK与内容点击扩展集合CKI,并基于所述内容点击集合CK和所述内容点击扩展集合CKI构建当前用户的内容评分矩阵Rn×m;使用奇异值分解算法得到所述内容评分矩阵的预测评分矩阵,基于所述预测评分矩阵得到内容推荐列表。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的存储介质。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各实施例或者实施例的某些部分的方法。
虽然,上文中已经用一般性说明及具体实施例对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。

Claims (10)

1.一种基于内容关联性的协同推荐方法,其特征在于,所述方法具体包括:
S101,获取若干个视频内容,并计算所述视频内容之间的相似度simij
S102,基于用户i在预设时间内的点击行为数据得到内容点击集合CKi,对所述内容点击集合CKi进行离差标准化,得到用户的内容喜好权重向量集合COEi
S103,获取与所述内容点击集合CKi中所有视频有相关性的相关内容集合CRi,并基于所述内容喜好权重向量集合COEi计算得到用户i对相关内容集合的接受度集合Ai
S104,使用蒙特卡洛模拟法模拟用户对相关内容集合CRi的点击情况,得到用户的内容点击扩展集合CIKi
S105,重复步骤S102-S104获得所有用户的内容点击集合CK与内容点击扩展集合CKI,并基于所述内容点击集合CK和所述内容点击扩展集合CKI构建当前用户的内容评分矩阵Rn×m
S106,使用奇异值分解算法得到所述内容评分矩阵的预测评分矩阵,基于所述预测评分矩阵得到内容推荐列表。
2.根据权利要求1所述基于内容关联性的协同推荐方法,其特征在于,所述获取若干个视频内容,并计算所述视频内容之间的相似度simij,包括:
通过ASR技术提取每个所述视频内容的文本数据,基于所述文本数据和视频内容属性得到每个所述视频内容对应的文本描述texti
计算文本描述texti与文本描述textj之间的相似度simij,基于所述相似度simij得到视频内容i与视频内容j之间的相似度simij
3.根据权利要求1所述基于内容关联性的协同推荐方法,其特征在于,所述基于用户i在预设时间内的点击行为数据得到内容点击集合CKi,对所述内容点击集合CKi进行离差标准化,得到用户的内容喜好权重向量集合COEi,包括:
通过公式1计算用户i的内容喜好权重向量;
式中,为内容喜好权重向量,/>CKi为内容点击集合。
4.根据权利要求1所述基于内容关联性的协同推荐方法,其特征在于,所述使用蒙特卡洛模拟法模拟用户对相关内容集合CRi的点击情况,得到用户的内容点击扩展集合CIKi,包括:
通过用户i的接受度集合Ai构建用户i对相关内容集合CRi的点击的概率集合Pi
基于所述概率集合Pi计算得到用户的内容点击扩展集合CIKi
5.根据权利要求1所述基于内容关联性的协同推荐方法,其特征在于,所述重复步骤S102-S104获得所有用户的内容点击集合CK与内容点击扩展集合CKI,并基于所述内容点击集合CK和所述内容点击扩展集合CKI构建当前用户的内容评分矩阵Rn×m,包括:
对所述内容评分矩阵Rn×m进行分解处理;
将进行分解处理后的内容评分矩阵Rn×m进行降维处理。
6.根据权利要求5所述基于内容关联性的协同推荐方法,其特征在于,所述重复步骤S102-S104获得所有用户的内容点击集合CK与内容点击扩展集合CKI,并基于所述内容点击集合CK和所述内容点击扩展集合CKI构建当前用户的内容评分矩阵Rn×m,还包括:
降维处理后,通过公式2计算将视频内容i推荐给用户u的推荐分数;
式中,为将视频内容i推荐给用户u的推荐分数,pu为用户u的特征向量,/>为视频内容i的特征向量。
7.根据权利要求6所述基于内容关联性的协同推荐方法,其特征在于,所述基于内容关联性的协同推荐方法还包括:
对所述推荐分数进行排序得到内容推荐列表,基于所述内容推荐列表生成推荐页面。
8.一种基于内容关联性的协同推荐***,其特征在于,包括:
获取模块,用于获取若干个视频内容;
相似度计算模块,用于计算所述视频内容之间的相似度simij
内容点击集合确定模块,用于基于用户i在预设时间内的点击行为数据得到内容点击集合CKi
内容喜好权重向量集合确定模块,用于对所述内容点击集合CKi进行离差标准化,得到用户的内容喜好权重向量集合COEi
相关内容集合确定模块,用于获取与所述内容点击集合CKi中所有视频有相关性的相关内容集合CRi
接受度集合确定模块,用于基于所述内容喜好权重向量集合COEi计算得到用户i对相关内容集合的接受度集合Ai
内容点击扩展集合确定模块,用于使用蒙特卡洛模拟法模拟用户对相关内容集合CRi的点击情况,得到用户的内容点击扩展集合CIKi
内容评分矩阵确定模块,用于获得所有用户的内容点击集合CK与内容点击扩展集合CKI,并基于所述内容点击集合CK和所述内容点击扩展集合CKI构建当前用户的内容评分矩阵Rn×m
内容推荐列表确定模块,用于使用奇异值分解算法得到所述内容评分矩阵的预测评分矩阵,基于所述预测评分矩阵得到内容推荐列表。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中的任一项所述的方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中的任一项所述的方法的步骤。
CN202311204350.5A 2023-09-19 2023-09-19 基于内容关联性的协同推荐方法及*** Active CN117235366B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311204350.5A CN117235366B (zh) 2023-09-19 2023-09-19 基于内容关联性的协同推荐方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311204350.5A CN117235366B (zh) 2023-09-19 2023-09-19 基于内容关联性的协同推荐方法及***

Publications (2)

Publication Number Publication Date
CN117235366A true CN117235366A (zh) 2023-12-15
CN117235366B CN117235366B (zh) 2024-06-18

Family

ID=89092552

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311204350.5A Active CN117235366B (zh) 2023-09-19 2023-09-19 基于内容关联性的协同推荐方法及***

Country Status (1)

Country Link
CN (1) CN117235366B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104063481A (zh) * 2014-07-02 2014-09-24 山东大学 一种基于用户实时兴趣向量的电影个性化推荐方法
KR20160064447A (ko) * 2014-11-28 2016-06-08 이종찬 협력적 필터링의 예측 선호도를 이용한 처음 사용자에 대한 추천 제공 방법
CN107515909A (zh) * 2017-08-11 2017-12-26 深圳市耐飞科技有限公司 一种视频推荐方法及***
CN108804683A (zh) * 2018-06-13 2018-11-13 重庆理工大学 结合矩阵分解和协同过滤算法的电影推荐方法
CN109947983A (zh) * 2017-09-19 2019-06-28 Tcl集团股份有限公司 视频推荐方法、***、终端及计算机可读存储介质
CN114912011A (zh) * 2021-12-27 2022-08-16 天翼数字生活科技有限公司 一种基于内容提取与评分预测的视频推荐方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104063481A (zh) * 2014-07-02 2014-09-24 山东大学 一种基于用户实时兴趣向量的电影个性化推荐方法
KR20160064447A (ko) * 2014-11-28 2016-06-08 이종찬 협력적 필터링의 예측 선호도를 이용한 처음 사용자에 대한 추천 제공 방법
CN107515909A (zh) * 2017-08-11 2017-12-26 深圳市耐飞科技有限公司 一种视频推荐方法及***
CN109947983A (zh) * 2017-09-19 2019-06-28 Tcl集团股份有限公司 视频推荐方法、***、终端及计算机可读存储介质
CN108804683A (zh) * 2018-06-13 2018-11-13 重庆理工大学 结合矩阵分解和协同过滤算法的电影推荐方法
CN114912011A (zh) * 2021-12-27 2022-08-16 天翼数字生活科技有限公司 一种基于内容提取与评分预测的视频推荐方法

Also Published As

Publication number Publication date
CN117235366B (zh) 2024-06-18

Similar Documents

Publication Publication Date Title
Kosinski et al. Mining big data to extract patterns and predict real-life outcomes.
WO2018218708A1 (zh) 一种基于深度学习的舆情热点类别划分方法
US11842257B2 (en) System and method for predicting and scoring a data model
JP5827416B2 (ja) ユーザ質問の処理方法及び処理システム
CN111898703B (zh) 多标签视频分类方法、模型训练方法、装置及介质
Wilkens Digital humanities and its application in the study of literature and culture
US20130204835A1 (en) Method of extracting named entity
CN111984792A (zh) 网站分类方法、装置、计算机设备及存储介质
CN111522886B (zh) 一种信息推荐方法、终端及存储介质
CN111951079B (zh) 一种基于知识图谱的信用评级方法、装置及电子设备
CN112836754A (zh) 一种面向图像描述模型泛化能力评估方法
CN112487263A (zh) 一种信息处理方法、***、设备及计算机可读存储介质
CN113569018A (zh) 问答对挖掘方法及装置
CN116777646A (zh) 基于人工智能的风险识别方法、装置、设备及存储介质
CN117235366B (zh) 基于内容关联性的协同推荐方法及***
US20140324524A1 (en) Evolving a capped customer linkage model using genetic models
US20220300836A1 (en) Machine Learning Techniques for Generating Visualization Recommendations
US20140324523A1 (en) Missing String Compensation In Capped Customer Linkage Model
CN114491296A (zh) 提案联名人推荐方法、***、计算机设备及可读存储介质
JP6509391B1 (ja) 計算機システム
CN114202428A (zh) 基于图卷积神经网络的资产数据处理方法、装置及设备
CN113469819A (zh) 基金产品的推荐方法、相关装置及计算机存储介质
CN111581382B (zh) 问答社区中的热门问题的预测方法及***
CN112118486A (zh) 内容项投放方法、装置、计算机设备及存储介质
CN113705873B (zh) 影视作品评分预测模型的构建方法及评分预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant