CN114385902A - 一种内容推荐方法、装置及存储介质 - Google Patents
一种内容推荐方法、装置及存储介质 Download PDFInfo
- Publication number
- CN114385902A CN114385902A CN202011139934.5A CN202011139934A CN114385902A CN 114385902 A CN114385902 A CN 114385902A CN 202011139934 A CN202011139934 A CN 202011139934A CN 114385902 A CN114385902 A CN 114385902A
- Authority
- CN
- China
- Prior art keywords
- content
- target
- interactive
- subject
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 230000002452 interceptive effect Effects 0.000 claims abstract description 333
- 239000013598 vector Substances 0.000 claims description 107
- 238000000605 extraction Methods 0.000 claims description 16
- 230000011218 segmentation Effects 0.000 claims description 16
- 238000012545 processing Methods 0.000 claims description 15
- 230000004927 fusion Effects 0.000 claims description 7
- 238000012163 sequencing technique Methods 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 238000005065 mining Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 206010003645 Atopy Diseases 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 101100153581 Bacillus anthracis topX gene Proteins 0.000 description 1
- 101150041570 TOP1 gene Proteins 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种内容推荐方法、装置及存储介质;获取目标内容的内容主题集、以及用户针对目标内容的多个互动内容主题;提取内容主题集共同对应的内容主题特征信息,以及每个互动内容主题的互动内容特征信息;基于内容主题特征信息与互动内容特征信息,确定内容主题集与每个互动内容主题之间的第一相似度;基于第一相似度,从互动内容主题中确定目标互动内容主题;获取多个候选推荐内容对应的候选推荐内容主题,确定候选推荐内容主题与目标互动内容主题之间的第二相似度,以便从多个候选推荐内容中确定目标推荐内容,对目标推荐内容进行推荐,可以将目标推荐内容存储到云服务器中,方便后续进行信息读取。本方案可以提高内容推荐的准确率。
Description
技术领域
本申请涉及通信技术领域,具体涉及一种内容推荐方法、装置及存储介质。
背景技术
随着信息技术的飞速发展,可以基于用户的当前阅读内容,向用户推荐与当前阅读内容相似的相关内容,比如,可以通过云服务器向用户推荐与当前阅读内容相似的相关内容。
在对相关技术的研究和实践过程中,本申请的发明人发现目前确定与用户的当前阅读内容相关的相关内容时,是基于各阅读内容本身的内容属性,与用户的当前阅读内容进行相关度比较,来从多个阅读内容中确定与当前阅读内容相关的相关内容,然后对该相关内容进行推荐,内容推荐的准确率较低。
发明内容
本申请实施例提供一种内容推荐方法、装置及存储介质,可以提高内容推荐的准确率。
本申请实施例提供了一种内容推荐方法,包括:
获取目标内容的内容主题集、以及用户针对所述目标内容的多个互动内容主题,所述内容主题集包括所述目标内容的多个内容主题;
提取所述内容主题集共同对应的内容主题特征信息,以及每个互动内容主题的互动内容特征信息;
基于所述内容主题特征信息与所述互动内容特征信息,确定所述内容主题集与所述每个互动内容主题之间的第一相似度;
基于所述第一相似度,从所述互动内容主题中确定目标互动内容主题;
获取多个候选推荐内容对应的候选推荐内容主题,确定所述候选推荐内容主题与所述目标互动内容主题之间的第二相似度;
基于所述第二相似度,从所述多个候选推荐内容中确定目标推荐内容,对所述目标推荐内容进行推荐。
相应的,本申请实施例提供了一种内容推荐装置,包括:
第一获取单元,用于获取目标内容的内容主题集、以及用户针对所述目标内容的多个互动内容主题,所述内容主题集包括所述目标内容的多个内容主题;
提取单元,用于提取所述内容主题集共同对应的内容主题特征信息,以及每个互动内容主题的互动内容特征信息;
相似度确定单元,用于基于所述内容主题特征信息与所述互动内容特征信息,确定所述内容主题集与所述每个互动内容主题之间的第一相似度;
主题确定单元,用于基于所述第一相似度,从所述互动内容主题中确定目标互动内容主题;
第二获取单元,用于获取多个候选推荐内容对应的候选推荐内容主题,确定所述候选推荐内容主题与所述目标互动内容主题之间的第二相似度;
内容确定单元,用于基于所述第二相似度,从所述多个候选推荐内容中确定目标推荐内容,对所述目标推荐内容进行推荐。
在一实施例中,所述第一获取单元,包括:
第一分词子单元,用于对目标内容进行分词处理,得到目标内容词组;
第一主题确定子单元,用于基于所述目标内容词组在所述目标内容中的分布信息,从所述目标内容词组中确定所述目标内容的内容主题,得到所述目标内容的内容主题集;
获取子单元,用于获取用户针对所述目标内容的多个互动内容主题。
在一实施例中,所述获取子单元还用于获取用户针对所述目标内容的多个互动内容;对所述多个互动内容进行分词处理,得到互动内容词组;基于所述互动内容词组在对应的互动内容中的分布信息,从所述互动内容词组中确定多个互动内容主题。
在一实施例中,所述提取单元,包括:
第一向量化子单元,用于对所述内容主题集中的多个内容主题进行向量化,得到多个内容主题词向量;
融合子单元,用于对所述多个内容主题词向量进行向量融合,得到所述内容主题集共同对应的内容主题集词向量;
第一特征提取子单元,用于对所述内容主题集词向量进行特征提取,得到所述内容主题集共同对应的内容主题特征信息;
第二向量化子单元,用于对每个互动内容主题进行向量化,得到多个互动内容主题词向量;
第二特征提取子单元,用于对所述多个互动内容主题词向量进行特征提取,得到所述每个互动内容主题的互动内容特征信息。
在一实施例中,所述主题确定单元,包括:
第一排序子单元,用于基于所述第一相似度,对所述互动内容主题进行排序;
主题确定子单元,用于基于排序结果与第一预定选择规则,从所述互动内容主题中确定目标互动内容主题。
在一实施例中,所述第二获取单元,包括:
第二分词子单元,用于对多个候选推荐内容进行分词处理,得到目标候选推荐内容词组;
第二主题确定子单元,用于基于所述目标候选推荐内容词组在对应待推荐内容中的分布信息,确定所述多个候选推荐内容对应的至少一个原始候选推荐内容主题;
第三主题确定子单元,用于确定所述至少一个原始候选推荐内容共同对应的候选推荐内容主题;
计算子单元,用于计算所述候选推荐内容主题与所述目标互动内容主题之间的第二相似度。
在一实施例中,所述计算子单元还用于提取所述候选推荐内容主题的词向量、以及所述目标互动内容主题的词向量;计算所述待推荐内容主题的词向量与所述目标互动内容主题的词向量之间的向量相似度,得到所述候选推荐内容主题与所述目标互动内容主题之间的第二相似度。
在一实施例中,所述内容确定单元,包括:
第二排序子单元,用于基于所述第二相似度,对所述多个候选推荐内容进行排序;
内容确定子单元,用于基于排序结果与第二预定选择规则,从所述多个候选推荐内容中确定目标候选推荐内容,对所述目标推荐内容进行推荐。
相应的,本申请实施例还提供了一种计算机设备,包括存储器,处理器及存储在储存器上并可在处理器上运行的计算机程序,其中,所述处理器执行本申请实施例任一提供的内容推荐方法中的步骤。
相应的,本申请实施例还提供一种存储介质,所述存储介质存储有多条指令,所述指令适用于处理器进行加载,以执行本申请实施例任一提供的内容推荐方法中的步骤。
本申请实施例可以获取目标内容的内容主题集、以及用户针对所述目标内容的多个互动内容主题,所述内容主题集包括所述目标内容的多个内容主题;提取所述内容主题集共同对应的内容主题特征信息,以及每个互动内容主题的互动内容特征信息;基于所述内容主题特征信息与所述互动内容特征信息,确定所述内容主题集与所述每个互动内容主题之间的第一相似度;基于所述第一相似度,从所述互动内容主题中确定目标互动内容主题;获取多个候选推荐内容对应的候选推荐内容主题,确定所述候选推荐内容主题与所述目标互动内容主题之间的第二相似度;基于所述第二相似度,从所述多个候选推荐内容中确定目标推荐内容,对所述目标推荐内容进行推荐。本方案可以通过已知的目标阅读内容的内容主题与多个互动内容主题的相似度,确定与目标阅读内容主题最相关的互动内容主题,然后基于最相关的互动内容主题从多个候选推荐内容中召回与最相关的互动主题的目标推荐内容,因为召回的目标推荐内容是与最相关的互动内容主题最相关的推荐内容,所以召回的目标推荐内容与目标阅读内容也是最相关的推荐内容,既用到了用户侧用户针对目标内容带来的互动内容主题多样性,同时利用相似度为基础的召回方式,来确定目标推荐内容,在后续对目标推荐内容进行推荐,可以提高内容推荐的准确率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的内容推荐方法的场景示意图;
图2a是本申请实施例提供的内容推荐方法的流程图;
图2b是本申请实施例提供的内容推荐方法的相似度确定流程图;
图2c是本申请实施例提供的内容推荐方法的目标推荐内容确定流程图;
图3是本申请实施例提供的内容推荐方法的另一流程图;
图4a是本申请实施例提供的内容推荐方法的装置图;
图4b是本申请实施例提供的内容推荐方法的另一装置图;
图4c是本申请实施例提供的内容推荐方法的另一装置图;
图4d是本申请实施例提供的内容推荐方法的另一装置图;
图4e是本申请实施例提供的内容推荐方法的另一装置图;
图4f是本申请实施例提供的内容推荐方法的另一装置图;
图5是本申请实施例提供的计算机设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供一种内容推荐方法、装置、计算机设备及存储介质。具体地,本申请实施例提供适用于计算机设备的内容推荐装置。其中,该计算机设备可以为终端或服务器等设备,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式***,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
参考图1,以计算机设备为云服务器为例,该云服务器可以获取目标内容的内容主题集、以及用户针对目标内容的多个互动内容主题,内容主题集包括目标内容的多个内容主题;提取内容主题集共同对应的内容主题特征信息,以及每个互动内容主题的互动内容特征信息;基于内容主题特征信息与互动内容特征信息,确定内容主题集与每个互动内容主题之间的第一相似度;基于第一相似度,从互动内容主题中确定目标互动内容主题;获取多个候选推荐内容对应的候选推荐内容主题,确定候选推荐内容主题与目标互动内容主题之间的第二相似度;基于第二相似度,从多个候选推荐内容中确定目标推荐内容,对目标推荐内容进行推荐。
其中,该目标内容的内容主题集、以及用户针对目标内容的多个互动内容主题可以基于云平台技术进行获取,而云平台也称云计算平台,是指基于硬件资源和软件资源的服务,提供计算、网络和存储能力。本实施例中的云平台可以理解为基于上述云服务器构成的平台,该平台可以为用户提供各种需要的服务,例如为用户提供公司网站构建和运营服务等等,用户可以在该云平台上购买云服务器资源,例如存储资源和计算资源等等,用户可以基于购买的资源和云服务器提供的各种组件,完成各种任务。
云计算(cloud computing)是一种计算模式,它将计算任务分布在大量计算机构成的资源池上,使各种应用***能够根据需要获取计算力、存储空间和信息服务。提供资源的网络被称为“云”。“云”中的资源在使用者看来是可以无限扩展的,并且可以随时获取,按需使用,随时扩展,按使用付费。
由以上可知,本申请实施例可以通过已知的目标阅读内容的内容主题与多个互动内容主题的相似度,确定与目标阅读内容主题最相关的互动内容主题,然后基于最相关的互动内容主题从多个候选推荐内容中召回与最相关的互动主题的目标推荐内容,因为召回的目标推荐内容是与最相关的互动内容主题最相关的推荐内容,所以召回的目标推荐内容与目标阅读内容也是最相关的推荐内容,既用到了用户侧用户针对目标内容带来的互动内容主题多样性,同时利用相似度为基础的召回方式,来确定目标推荐内容,在后续对目标推荐内容进行推荐,可以提高内容推荐的准确率。
本实施例可以以下分别进行详细说明,需说明的是,以下实施例的描述顺序不作为对实施例优选顺序的限定。
本申请实施例提供一种内容推荐方法,该方法可以由终端或服务器执行,也可以由终端和服务器共同执行;本申请实施例以内容推荐方法由服务器执行为例来进行说明,具体的,由集成在服务器中的内容推荐装置来执行。如图2a所示,该内容推荐方法的具体流程可以如下:
201、获取目标内容的内容主题集、以及用户针对目标内容的多个互动内容主题,内容主题集包括目标内容的多个内容主题。
其中,内容主题指的是目标内容的主题,内容主题可以表征目标内容的内容语义,而目标内容的多个互动内容主题可以是通过对目标互动内容的多个互动内容进行主题提取得到的,同样的,互动内容主题可以表征互动内容的内容语义。
在一示例中,以目标内容为文章为例进行说明,获取的内容主题集就是文章的主题集,该主题集可以包括文章的多个文章主题,而用户针对目标内容的多个互动内容主题,可以是用户针对文章的多个评论对应的评论主题。
在一实施例中,步骤“获取目标内容的内容主题集、以及用户针对目标内容的多个互动内容主题”,可以包括:
对目标内容进行分词处理,得到目标内容词组;
基于目标内容词组在目标内容中的分布信息,从目标内容词组中确定目标内容的内容主题,得到目标内容的内容主题集;
获取用户针对目标内容的多个互动内容主题。
其中,分布信息可以包括分布规律信息,比如,目标内容词组在目标内容中的分布规律,如目标内容词组在目标内容中的分布概率等信息、互动内容词组在对应的互动内容中的分布规律,如互动内容词组在对应的互动内容中的分布概率等信息,分布信息还可以包括其他信息。
在一实施例中,步骤“获取用户针对目标内容的多个互动内容主题”,可以包括:
获取用户针对目标内容的多个互动内容;
对多个互动内容进行分词处理,得到互动内容词组;
基于互动内容词组在对应的互动内容中的分布信息,从互动内容词组中确定多个互动内容主题。
202、提取内容主题集共同对应的内容主题特征信息,以及每个互动内容主题的互动内容特征信息。
其中,内容主题特征信息为表征目标内容的语义特征的特征信息,互动内容特征信息为表征对应互动内容的语义特征的特征信息。
在一实施例中,步骤“提取内容主题集共同对应的内容主题特征信息,以及每个互动内容主题的互动内容特征信息”,可以包括:
对内容主题集中的多个内容主题进行向量化,得到多个内容主题词向量;
对多个内容主题词向量进行向量融合,得到内容主题集共同对应的内容主题集词向量;
对内容主题集词向量进行特征提取,得到内容主题集共同对应的内容主题特征信息;
对每个互动内容主题进行向量化,得到多个互动内容主题词向量;
对多个互动内容主题词向量进行特征提取,得到每个互动内容主题的互动内容特征信息。
在一示例中,内容主题集可以包括内容主题1、内容主题2、内容主题3、以及内容主题4,分别提取各内容主题对应的词向量,可以得到内容主题词向量1、内容主题词向量2、内容主题词向量3、以及内容主题词向量4,对各内容主题词向量进行向量融合,可以通过对内容主题词向量1、内容主题词向量2、内容主题词向量3、以及内容主题词向量4进行累加,然后归一化实现,之后可以得到目标内容的主题embedding(词向量),即可以得到内容主题集共同对应的内容主题集词向量。
203、基于内容主题特征信息与互动内容特征信息,确定内容主题集与每个互动内容主题之间的第一相似度。
其中,第一相似度表征内容主题集和每个互动内容主题之间的相似度,可以通过内容主题特征信息和互动内容特征信息来确定,也可以根据内容主题集共同对应的内容主题词向量和每个互动内容词向量之间的余弦相似度来确定,这是因为词向量是将自然语言中的词转化为稠密的向量,语义相似的词会有相似的向量表示,所以可以通过计算内容主题集共同对应的词向量和每个互动内容词向量之间的余弦相似度来确定内容主题集与每个互动内容主题的相似度,还可以通过其他的方式来确定。
在一实施例中,如图2b所示,还可以通过提取内容主题集共同对应的内容主题embedding,与每个互动内容主题对应的互动内容主题embedding,然后计算它们之间的余弦相似度来确定内容主题集和每个互动内容主题之间的第一相似度。假设目标内容的主题集为aTopic=[内容主题1,内容主题2,内容主题3,…],对应互动内容主题取top1主题,即comment1(互动内容1):互动内容主题1,comment2(互动内容2):互动内容主题2,等等,这里取互动内容主题集合[互动内容主题1,互动内容主题2,互动内容主题3,…],里面每个元素代表一个互动内容对应的主题。提取主题的方式可以通过LDA算法。之后,可以用word2vec将目标内容对应的topic(主题)集合(即[内容主题1,内容主题2,内容主题3,…])进行embedding化,形成文章topic对应的embedding向量;具体方式是每个topic对应的word2vec累加,归一化形成100dimension(维)的embedding向量。之后用同样的方式,找到每条互动内容主题对应的embedding向量,再利用cos(余弦相似度)相似度计算方式,可以算出内容主题集与每个互动内容主题之间的第一相似度。
在一实施例中,可以利用内容库中的至少100w篇历史内容集合,训练一版100维的word2vec词集,作为embedding化的依赖;内容主题集合分别有topic1到topic4等的四个内容主题关键词组成,每个内容主题关键词都可在word2vec中找到对应的topic vector(词向量)作为topic的embedding,之后将四个topic对应的embedding累加,并归一化,获得内容的主题embedding,即article(主题)embedding。同理,每条互动内容的互动内容主题也可在word2vec中寻找对应的互动内容主题embedding。之后可以通过cos相似度计算:cos<article Embedding,互动内容主题Embedding>,接着再倒排,即可以得到最相关的互动内容主题embedding。
204、基于第一相似度,从互动内容主题中确定目标互动内容主题。
在一实施例中,提取主题集为aTopic=[内容主题1,内容主题2,内容主题3,…]共同对应的内容主题的embedding向量,再提取每条互动内容主题对应的embedding向量后,可以利用cos(余弦相似度)相似度计算方式,计算出目标内容对应最相似的互动内容主题,可以去取top 3,得到top 3的互动内容的embedding向量,即得到目标互动内容主题,还可以取top4的互动内容的embedding向量,作为目标互动内容主题,取值的范围可以根据实际情况配置,在这里就不再赘述。
在一实施例中,步骤“基于第一相似度,从互动内容主题中确定目标互动内容主题”,可以包括:
基于第一相似度,对互动内容主题进行排序;
基于排序结果与第一预定选择规则,从互动内容主题中确定目标互动内容主题。
其中,第一预定选择规则为用于确定目标互动内容主题的规则,比如,第一预定选择规则可以包括目标互动内容主题的主题预设数量,基于排序结果和主题预设数量,可以从互动内容主题中确定目标互动内容主题,如,目标互动内容主题的主题预设数量为3,则可以从互动内容主题中选择根据第一相似度进行排序,排在前面的3个互动内容主题为目标互动内容主题。
在一示例中,在信息流推荐侧,高曝光高点击文章,或者有C侧后验评论的文章,我们往往希望得到更多类似主题的相关文章。而文章对应的评论内容风格迥异,主题多样;举个例子:一篇描述欧洲足球的文章,对应评论板块可能会有这几种内容:“我们拜仁慕尼黑是冠军”;“哎,中国足球什么时候才能有这水平…”;“楼上就在这胡扯”;“世界杯怎么还不来呀,无聊死了”。当我们将文章中所有评论数据利用上的时候,就会发现文章的主题挖掘变得更加多样化,立体化。通过一篇讲述欧洲足球的文章的评论,可以挖掘出类似“拜仁慕尼黑”、“中国足球”、“中国足球”这种主题,并且不需要额外的依赖;而类似于评论3这种,就是无效评论,挖掘不出可用的主题用来帮助召回相关文章,可以通过文章主题与评论主题进行相似度计算,然后基于相似度过滤掉无效的评论。
205、获取多个候选推荐内容对应的候选推荐内容主题,确定候选推荐内容主题与目标互动内容主题之间的第二相似度。
其中,候选推荐内容主题和目标互动内容主题之间的第二相似度,可以通过各候选内容主题对应的候选内容主题特征信息和目标互动内容主题的目标互动内容特征信息来确定,还可以根据各待推荐内容主题对应的词向量和目标互动内容主题的词向量之间的向量相似度来确定,还可以通过其他的方式来确定。
在一实施例中,步骤“获取多个候选推荐内容对应的候选推荐内容主题,确定候选推荐内容主题与目标互动内容主题之间的第二相似度”,可以包括:
对多个候选推荐内容进行分词处理,得到目标候选推荐内容词组;
基于目标候选推荐内容词组在对应待推荐内容中的分布信息,确定多个候选推荐内容对应的至少一个原始候选推荐内容主题;
确定至少一个原始候选推荐内容共同对应的候选推荐内容主题;
计算候选推荐内容主题与目标互动内容主题之间的第二相似度。
在一示例中,可以获取每个候选推荐内容的候选推荐内容主题,然后提取候选推荐内容主题的候选内容主题特征信息与目标互动内容主题的目标互动内容特征信息,最后基于候选内容主题特征信息与目标互动内容特征信息,确定候选推荐内容主题与目标互动内容主题之间的第二相似度。
在一实施例中,步骤“计算候选推荐内容主题与目标互动内容主题之间的第二相似度”,可以包括:
提取候选推荐内容主题的词向量、以及目标互动内容主题的词向量;
计算待推荐内容主题的词向量与目标互动内容主题的词向量之间的向量相似度,得到候选推荐内容主题与目标互动内容主题之间的第二相似度。
在一实施例中,如图2c所示,可以利用上述流程得到的与目标内容的内容主题最集相似的目标互动内容主题,将目标互动内容主题的互动内容特征信息(如互动内容特征信息1、互动内容特征信息2、互动内容特征信息3,等等,互动内容特征信息的数量具体可以根据目标互动内容主题的数量来确定)去和内容库中各候选推荐内容的候选内容主题特征信息做相关性计算,具体方式是将候选推荐内容分别进行和目标内容相同的操作方式:候选内容的内容主题挖掘、候选推荐内容主题embedding化,得到候选内容主题embedding。之后可以将目标互动内容主题的embedding和候选内容主题embedding做cos相似度计算,获取top N候选推荐内容作为最终的相关文章,即将获取的top N候选推荐内容确定为目标推荐内容,用作相关内容板块的推荐策略。最后可以对目标推荐内容进行推荐,比如,在用户阅读目标内容的页面,展示目标推荐内容的概括信息,用以推荐该目标推荐内容。
206、基于第二相似度,从多个候选推荐内容中确定目标推荐内容,对目标推荐内容进行推荐。
其中,目标推荐内容为在多个候选推荐内容中,与目标内容最相关的内容,比如,内容语义最相关,等等。
在一实施例中,步骤“基于第二相似度,从多个候选推荐内容中确定目标推荐内容,对目标推荐内容进行推荐”,可以包括:
基于第二相似度,对多个候选推荐内容进行排序;
基于排序结果与第二预定选择规则,从多个候选推荐内容中确定目标候选推荐内容,对目标推荐内容进行推荐。
其中,第二预定选择规则为用于确定目标推荐内容的规则,比如,第二预定选择规则可以包括目标推荐内容的内容预设数量,基于排序结果和内容预设数量,可以从多个候选推荐内容中确定目标推荐内容,如,内容预设数量为4,则可以从多个候选推荐内容中根据第二相似度进行排序,排在前面的4个候选推荐内容确定为目标推荐内容。
在一实施例中,本申请的方案可以提供一种基于后验评论数据主题挖掘的信息流推荐侧相关文章召回策略,在业务层面上将用户的主动反馈信息在评论当中的体现,用作相关文章召回板块的拓展,然后对召回的相关文章进行推荐。增加相关推荐板块主多样性,进而提升用户体验。
其中,本申请可以实现信息流图文推荐场景下,利用用户针对目标内容的互动内容,比如,用户针对目标内容的评论数据来辅助进行相关候选推荐内容的召回及推荐。区别于传统的基于文章固有属性特征的相关召回,本申请着重利用目标内容对应互动内容的主题特性,以及互动内容主题-目标内容主题的相关性、互动内容主题-其他候选推荐内容主题相关性来召回其他相关候选推荐内容,提升信息流推荐侧的内容推荐效率和后验指标。
由以上可知,本申请实施例可以通过已知的目标阅读内容的内容主题与多个互动内容主题的相似度,确定与目标阅读内容主题最相关的互动内容主题,然后基于最相关的互动内容主题从多个候选推荐内容中召回与最相关的互动主题的目标推荐内容,因为召回的目标推荐内容是与最相关的互动内容主题最相关的推荐内容,所以召回的目标推荐内容与目标阅读内容也是最相关的推荐内容,既用到了用户侧用户针对目标内容带来的互动内容主题多样性,同时利用相似度为基础的召回方式,来确定目标推荐内容,在后续对目标推荐内容进行推荐,可以提高内容推荐的准确率。
根据上述介绍的内容,下面将举例来进一步说明本申请的内容推荐方法。参考图3,一种内容推荐方法,具体流程可以如下:
301、服务器获取目标内容的多个内容主题、以及用户针对目标内容的多个互动内容主题。
在一示例中,可以通过主题挖掘模型挖掘目标内容的多个内容主题、以及用户针对目标内容的多个互动内容的多个互动内容主题,比如,可以通过LDA(Latent DirichletAllocation,文档主题生成模型),挖掘目标内容和多个互动内容的主题,还可以通过其他方式挖掘目标内容和多个互动内容的主题。
其中,LDA也称为一个三层贝叶斯概率模型,包含词、主题、和文档三层结构,所谓生成模型,就是一篇文章的每个词都通过“以一定额度概率选择了某个主题,并且从这个主题中以一定概率选择某个词语”这样的一个过程得到,文档主题服从多项式分布,主题到词服从多项式分布。LDA是一种非监督机器学习技术,可以用来识别大规模文档集(documentcollection)或语料库(corpus)中潜藏的主题信息。
302、服务器对多个内容主题与多个互动内容主题进行向量化,得到多个内容主题词向量与多个互动内容主题词向量。
在一实施例中,可以通过word2vec将目标内容对应的多个内容主题和多个互动内容主题进行embedding化,分别形成多个内容主题对应的embedding向量即多个内容主题词向量,和多个内容主题对应的embedding向量,即多个互动内容主题词向量,还可以通过其他的方式对多个内容主题和多个互动内容主题进行向量化,比如,还可以通过ELMo(Embeddings from Language Models,词向量模型)、BERT(Bidirectional EncoderRepresentations from Transformers,词向量模型)等对目标内容对应的多个内容主题和多个互动内容主题进行向量化。
303、服务器对多个内容主题词向量进行融合,得到多个内容主题共同对应的内容主题集词向量。
在一示例中,融合可以理解为将多个内容主题词向量进行累加,并归一化,可以得到多个内容主题共同对应的内容主题集词向量,向量累加是为了把多个词向量累加成一个词向量,比如,可以将第一个词向量的第一位的数值加上第二个词向量的第一位的数值,然后再加上第三个词向量的第一位的数数,等等,然后可以得到多个内容主题共同对应的内容主题集词向量。
304、服务器提取内容主题集词向量的内容主题特征信息、以及每个互动内容主题词向量的互动内容特征信息。
其中,内容主题特征信息和互动内容特征信息,可以用于确定内容主题集与每个互动内容主题之间的第一相似度,即,内容主题特征信息和互动内容特征信息可以用于确定互动内容与目标内容之间的相关度,也就是说,基于内容主题特征信息和互动内容特征信息,计算内容主题集和每个互动内容之间的相似度,通过相似度的大小,可以确定每个互动内容与目标内容之间的相关度,比如,相似度大的,对应的互动内容与目标内容之间的相关度就大,该互动内容与目标内容越相关。
305、服务器基于内容主题特征信息与互动内容特征信息,确定包含多个内容主题的内容主题集与每个互动内容主题之间的第一相似度。
在一实施例中,可以通过内容主题词向量和互动内容特征信息,确定内容主题集和每个互动内容主题之间的相似度,还可以通过计算内容主题集词向量和每个互动内容主题对应的互动内容词向量的向量相似度,来确定包含多个内容主题的内容主题集和每个互动内容主题之间的第一相似度。
306、服务器基于第一相似度,从互动内容主题中确定目标互动内容主题。
在一示例中,可以基于内容主题集与每个互动内容主题之间第一相似度的大小,对多个互动内容主题进行排序,然后基于实际需求,确定排在前几位的互动内容主题为目标互动内容主题。
其中,容易知道,目标互动内容主题对应的互动内容与目标内容的相关性最高,目标互动内容主题对应的互动内容的在语义上与目标内容更相似。
307、服务器获取多个候选推荐内容对应的候选推荐内容主题,确定候选推荐内容主题与目标互动内容主题之间的第二相似度。
其中,计算候选推荐内容主题与目标互动内容主题之间的第二相似度,是为了从多个候选推荐内容中确定与目标内容最相关的推荐内容,即步骤308中的目标推荐内容。
在一实施例中,从多个候选推荐内容中确定与目标内容最相关的推荐内容后,可以基于目标内容,对该推荐内容进行推荐,还可以通过此方法去内容库中和海量的文章进行相关文章召回。
308、服务器基于第二相似度,从多个候选推荐内容中确定目标推荐内容,对目标推荐内容进行推荐。
在一实施例中,基于互动内容主题挖掘、目标内容主题挖掘、以及相似度计算策略的联合召回方式,既用到了用户侧用户针对目标内容主动带来的主题多样性,同时利用cos相似度为基础的无监督召回方式,增加了召回的模糊性,进一步增强推荐侧相关内容板块的多样性,同时保证了相关内容推荐板块的连贯性和一致性,提升推荐侧的用户体验。
本申请在进行内容推荐的过程中,可以通过增加后验互动内容的特征,比如后验评论数据的特征,增加目标内容的主题判别的多样性,使得在信息流推荐中,相关内容推荐板块包含的主题更丰富、更多样。
由以上可知,本申请实施例可以通过已知的目标阅读内容的内容主题与多个互动内容主题的相似度,确定与目标阅读内容主题最相关的互动内容主题,然后基于最相关的互动内容主题从多个候选推荐内容中召回与最相关的互动主题的目标推荐内容,因为召回的目标推荐内容是与最相关的互动内容主题最相关的推荐内容,所以召回的目标推荐内容与目标阅读内容也是最相关的推荐内容,既用到了用户侧用户针对目标内容带来的互动内容主题多样性,同时利用相似度为基础的召回方式,来确定目标推荐内容,在后续对目标推荐内容进行推荐,可以提高内容推荐的准确率。
为了更好地实施以上方法,相应的,本申请实施例还提供一种内容推荐装置,其中,该内容推荐装置具体可以集成在服务器中,参考图4a,该内容推荐装置可以包括第一获取单元401、提取单元402、相似度确定单元403、主题确定单元404、第二获取单元405和内容确定单元406,如下:
(1)第一获取单元401;
第一获取单元401,用于获取目标内容的内容主题集、以及用户针对目标内容的多个互动内容主题,内容主题集包括目标内容的多个内容主题。
在一实施例中,如图4b所示,第一获取单元401,包括:
第一分词子单元4011,用于对目标内容进行分词处理,得到目标内容词组;
第一主题确定子单元4012,用于基于目标内容词组在目标内容中的分布信息,从目标内容词组中确定目标内容的内容主题,得到目标内容的内容主题集;
获取子单元4013,用于获取用户针对目标内容的多个互动内容主题。
在一实施例中,获取子单元4013还用于获取用户针对目标内容的多个互动内容;对多个互动内容进行分词处理,得到互动内容词组;基于互动内容词组在对应的互动内容中的分布信息,从互动内容词组中确定多个互动内容主题。
(2)提取单元402;
提取单元402,用于提取内容主题集共同对应的内容主题特征信息,以及每个互动内容主题的互动内容特征信息。
在一实施例中,如图4c所示,提取单元402,包括:
第一向量化子单元4021,用于对内容主题集中的多个内容主题进行向量化,得到多个内容主题词向量;
融合子单元4022,用于对多个内容主题词向量进行向量融合,得到内容主题集共同对应的内容主题集词向量;
第一特征提取子单元4023,用于对内容主题集词向量进行特征提取,得到内容主题集共同对应的内容主题特征信息;
第二向量化子单元4024,用于对每个互动内容主题进行向量化,得到多个互动内容主题词向量;
第二特征提取子单元4025,用于对多个互动内容主题词向量进行特征提取,得到每个互动内容主题的互动内容特征信息。
(3)相似度确定单元403;
相似度确定单元403,用于基于内容主题特征信息与互动内容特征信息,确定内容主题集与每个互动内容主题之间的第一相似度。
(4)主题确定单元404;
主题确定单元404,用于基于第一相似度,从互动内容主题中确定目标互动内容主题。
在一实施例中,如图4d所示,主题确定单元404,包括:
第一排序子单元4041,用于基于第一相似度,对互动内容主题进行排序;
主题确定子单元4042,用于基于排序结果与第一预定选择规则,从互动内容主题中确定目标互动内容主题。
(5)第二获取单元405;
第二获取单元405,用于获取多个候选推荐内容对应的候选推荐内容主题,确定候选推荐内容主题与目标互动内容主题之间的第二相似度。
在一实施例中,如图4e所示,第二获取单元405,包括:
第二分词子单元4051,用于对多个候选推荐内容进行分词处理,得到目标候选推荐内容词组;
第二主题确定子单元4052,用于基于目标候选推荐内容词组在对应待推荐内容中的分布信息,确定多个候选推荐内容对应的至少一个原始候选推荐内容主题;
第三主题确定子单元4053,用于确定至少一个原始候选推荐内容共同对应的候选推荐内容主题;
计算子单元4054,用于计算候选推荐内容主题与目标互动内容主题之间的第二相似度。
在一实施例中,计算子单元4054还用于提取候选推荐内容主题的词向量、以及目标互动内容主题的词向量;计算待推荐内容主题的词向量与目标互动内容主题的词向量之间的向量相似度,得到候选推荐内容主题与目标互动内容主题之间的第二相似度。
(6)内容确定单元406;
内容确定单元406,用于基于第二相似度,从多个候选推荐内容中确定目标推荐内容,对目标推荐内容进行推荐。
在一实施例中,如图4f所示,内容确定单元406,包括:
第二排序子单元4061,用于基于第二相似度,对多个候选推荐内容进行排序;
内容确定子单元4062,用于基于排序结果与第二预定选择规则,从多个候选推荐内容中确定目标候选推荐内容,对目标推荐内容进行推荐。
由以上可知,本申请实施例的内容推荐装置的第一获取单元401获取目标内容的内容主题集、以及用户针对目标内容的多个互动内容主题,内容主题集包括目标内容的多个内容主题;然后,由提取单元402提取内容主题集共同对应的内容主题特征信息,以及每个互动内容主题的互动内容特征信息;由相似度确定单元403基于内容主题特征信息与互动内容特征信息,确定内容主题集与每个互动内容主题之间的第一相似度;由主题确定单元404基于第一相似度,从互动内容主题中确定目标互动内容主题;由第二获取单元405获取多个候选推荐内容对应的候选推荐内容主题,确定候选推荐内容主题与目标互动内容主题之间的第二相似度;由内容确定单元406基于第二相似度,从多个候选推荐内容中确定目标推荐内容,对目标推荐内容进行推荐。该方案可以通过已知的目标阅读内容的内容主题与多个互动内容主题的相似度,确定与目标阅读内容主题最相关的互动内容主题,然后基于最相关的互动内容主题从多个候选推荐内容中召回与最相关的互动主题的目标推荐内容,因为召回的目标推荐内容是与最相关的互动内容主题最相关的推荐内容,所以召回的目标推荐内容与目标阅读内容也是最相关的推荐内容,既用到了用户侧用户针对目标内容带来的互动内容主题多样性,同时利用相似度为基础的召回方式,来确定目标推荐内容,在后续对目标推荐内容进行推荐,可以提高内容推荐的准确率。
此外,本申请实施例还提供一种计算机设备,该计算机设备可以为终端或者服务器等设备,如图5所示,其示出了本申请实施例所涉及的计算机设备的结构示意图,具体来讲:
该计算机设备可以包括一个或者一个以上处理核心的处理器501、一个或一个以上存储介质的存储器502、电源503和输入单元504等部件。本领域技术人员可以理解,图5中示出的计算机设备结构并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
处理器501是该计算机设备的控制中心,利用各种接口和线路连接整个计算机设备的各个部分,通过运行或执行存储在存储器502内的软件程序和/或模块,以及调用存储在存储器502内的数据,执行计算机设备的各种功能和处理数据,从而对计算机设备进行整体监控。可选的,处理器501可包括一个或多个处理核心;优选的,处理器501可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作***、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器501中。
存储器502可用于存储软件程序以及模块,处理器501通过运行存储在存储器502的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器502可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据计算机设备的使用所创建的数据等。此外,存储器502可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器502还可以包括存储器控制器,以提供处理器501对存储器502的访问。
计算机设备还包括给各个部件供电的电源503,优选的,电源503可以通过电源管理***与处理器501逻辑相连,从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。电源503还可以包括一个或一个以上的直流或交流电源、再充电***、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
该计算机设备还可包括输入单元504,该输入单元504可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
尽管未示出,计算机设备还可以包括显示单元等,在此不再赘述。具体在本实施例中,计算机设备中的处理器501会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器502中,并由处理器501来运行存储在存储器502中的应用程序,从而实现各种功能,如下:
获取目标内容的内容主题集、以及用户针对目标内容的多个互动内容主题,内容主题集包括目标内容的多个内容主题;提取内容主题集共同对应的内容主题特征信息,以及每个互动内容主题的互动内容特征信息;基于内容主题特征信息与互动内容特征信息,确定内容主题集与每个互动内容主题之间的第一相似度;基于第一相似度,从互动内容主题中确定目标互动内容主题;获取多个候选推荐内容对应的候选推荐内容主题,确定候选推荐内容主题与目标互动内容主题之间的第二相似度;基于第二相似度,从多个候选推荐内容中确定目标推荐内容,对目标推荐内容进行推荐。
由以上可知,本申请实施例可以通过已知的目标阅读内容的内容主题与多个互动内容主题的相似度,确定与目标阅读内容主题最相关的互动内容主题,然后基于最相关的互动内容主题从多个候选推荐内容中召回与最相关的互动主题的目标推荐内容,因为召回的目标推荐内容是与最相关的互动内容主题最相关的推荐内容,所以召回的目标推荐内容与目标阅读内容也是最相关的推荐内容,既用到了用户侧用户针对目标内容带来的互动内容主题多样性,同时利用相似度为基础的召回方式,来确定目标推荐内容,在后续对目标推荐内容进行推荐,可以提高内容推荐的准确率。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一存储介质中,并由处理器进行加载和执行。
为此,本申请实施例提供一种存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本申请实施例所提供的任一种内容推荐方法中的步骤。例如,该指令可以执行如下步骤:
获取目标内容的内容主题集、以及用户针对目标内容的多个互动内容主题,内容主题集包括目标内容的多个内容主题;提取内容主题集共同对应的内容主题特征信息,以及每个互动内容主题的互动内容特征信息;基于内容主题特征信息与互动内容特征信息,确定内容主题集与每个互动内容主题之间的第一相似度;基于第一相似度,从互动内容主题中确定目标互动内容主题;获取多个候选推荐内容对应的候选推荐内容主题,确定候选推荐内容主题与目标互动内容主题之间的第二相似度;基于第二相似度,从多个候选推荐内容中确定目标推荐内容,对目标推荐内容进行推荐。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该存储介质中所存储的指令,可以执行本申请实施例所提供的任一种内容推荐方法中的步骤,因此,可以实现本申请实施例所提供的任一种内容推荐方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
其中,根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述发明内容和实施例中提供的内容推荐方法。
以上对本申请实施例所提供的一种内容推荐方法、装置、计算机设备及存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种内容推荐方法,其特征在于,包括:
获取目标内容的内容主题集、以及用户针对所述目标内容的多个互动内容主题,所述内容主题集包括所述目标内容的多个内容主题;
提取所述内容主题集共同对应的内容主题特征信息,以及每个互动内容主题的互动内容特征信息;
基于所述内容主题特征信息与所述互动内容特征信息,确定所述内容主题集与所述每个互动内容主题之间的第一相似度;
基于所述第一相似度,从所述互动内容主题中确定目标互动内容主题;
获取多个候选推荐内容对应的候选推荐内容主题,确定所述候选推荐内容主题与所述目标互动内容主题之间的第二相似度;
基于所述第二相似度,从所述多个候选推荐内容中确定目标推荐内容,对所述目标推荐内容进行推荐。
2.根据权利要求1所述的方法,其特征在于,所述获取目标内容的内容主题集、以及用户针对所述目标内容的多个互动内容主题,包括:
对目标内容进行分词处理,得到目标内容词组;
基于所述目标内容词组在所述目标内容中的分布信息,从所述目标内容词组中确定所述目标内容的内容主题,得到所述目标内容的内容主题集;
获取用户针对所述目标内容的多个互动内容主题。
3.根据权利要求2所述的方法,其特征在于,所述获取用户针对所述目标内容的多个互动内容主题,包括:
获取用户针对所述目标内容的多个互动内容;
对所述多个互动内容进行分词处理,得到互动内容词组;
基于所述互动内容词组在对应的互动内容中的分布信息,从所述互动内容词组中确定多个互动内容主题。
4.根据权利要求1所述的方法,其特征在于,所述提取所述内容主题集共同对应的内容主题特征信息,以及每个互动内容主题的互动内容特征信息,包括:
对所述内容主题集中的多个内容主题进行向量化,得到多个内容主题词向量;
对所述多个内容主题词向量进行向量融合,得到所述内容主题集共同对应的内容主题集词向量;
对所述内容主题集词向量进行特征提取,得到所述内容主题集共同对应的内容主题特征信息;
对每个互动内容主题进行向量化,得到多个互动内容主题词向量;
对所述多个互动内容主题词向量进行特征提取,得到所述每个互动内容主题的互动内容特征信息。
5.根据权利要求1所述的方法,其特征在于,所述基于所述第一相似度,从所述互动内容主题中确定目标互动内容主题,包括:
基于所述第一相似度,对所述互动内容主题进行排序;
基于排序结果与第一预定选择规则,从所述互动内容主题中确定目标互动内容主题。
6.根据权利要求1所述的方法,其特征在于,所述获取多个候选推荐内容对应的候选推荐内容主题,确定所述候选推荐内容主题与所述目标互动内容主题之间的第二相似度,包括:
对多个候选推荐内容进行分词处理,得到目标候选推荐内容词组;
基于所述目标候选推荐内容词组在对应待推荐内容中的分布信息,确定所述多个候选推荐内容对应的至少一个原始候选推荐内容主题;
确定所述至少一个原始候选推荐内容共同对应的候选推荐内容主题;
计算所述候选推荐内容主题与所述目标互动内容主题之间的第二相似度。
7.根据权利要求6所述的方法,其特征在于,所述计算所述候选推荐内容主题与所述目标互动内容主题之间的第二相似度,包括:
提取所述候选推荐内容主题的词向量、以及所述目标互动内容主题的词向量;
计算所述待推荐内容主题的词向量与所述目标互动内容主题的词向量之间的向量相似度,得到所述候选推荐内容主题与所述目标互动内容主题之间的第二相似度。
8.根据权利要求1所述的方法,其特征在于,所述基于所述第二相似度,从所述多个候选推荐内容中确定目标推荐内容,对所述目标推荐内容进行推荐,包括:
基于所述第二相似度,对所述多个候选推荐内容进行排序;
基于排序结果与第二预定选择规则,从所述多个候选推荐内容中确定目标候选推荐内容,对所述目标推荐内容进行推荐。
9.一种内容推荐装置,其特征在于,包括:
第一获取单元,用于获取目标内容的内容主题集、以及用户针对所述目标内容的多个互动内容主题,所述内容主题集包括所述目标内容的多个内容主题;
提取单元,用于提取所述内容主题集共同对应的内容主题特征信息,以及每个互动内容主题的互动内容特征信息;
相似度确定单元,用于基于所述内容主题特征信息与所述互动内容特征信息,确定所述内容主题集与所述每个互动内容主题之间的第一相似度;
主题确定单元,用于基于所述第一相似度,从所述互动内容主题中确定目标互动内容主题;
第二获取单元,用于获取多个候选推荐内容对应的候选推荐内容主题,确定所述候选推荐内容主题与所述目标互动内容主题之间的第二相似度;
内容确定单元,用于基于所述第二相似度,从所述多个候选推荐内容中确定目标推荐内容,对所述目标推荐内容进行推荐。
10.一种存储介质,其特征在于,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1至8任一项所述的内容推荐方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011139934.5A CN114385902B (zh) | 2020-10-22 | 2020-10-22 | 一种内容推荐方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011139934.5A CN114385902B (zh) | 2020-10-22 | 2020-10-22 | 一种内容推荐方法、装置及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114385902A true CN114385902A (zh) | 2022-04-22 |
CN114385902B CN114385902B (zh) | 2024-01-30 |
Family
ID=81193053
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011139934.5A Active CN114385902B (zh) | 2020-10-22 | 2020-10-22 | 一种内容推荐方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114385902B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102096680A (zh) * | 2009-12-15 | 2011-06-15 | 北京大学 | 信息有效性分析的方法和装置 |
CN102254038A (zh) * | 2011-08-11 | 2011-11-23 | 武汉安问科技发展有限责任公司 | 一种分析网络评论相关度的***及其分析方法 |
US20170053013A1 (en) * | 2015-08-18 | 2017-02-23 | Facebook, Inc. | Systems and methods for identifying and grouping related content labels |
TWI656448B (zh) * | 2017-11-01 | 2019-04-11 | 中華電信股份有限公司 | 主題提供裝置及其雲儲存檔案提示方法 |
CN109819280A (zh) * | 2017-11-22 | 2019-05-28 | 上海全土豆文化传播有限公司 | 弹幕展示方法及装置 |
CN110008395A (zh) * | 2018-09-17 | 2019-07-12 | 北京字节跳动网络技术有限公司 | 评论内容的呈现方法、装置、存储介质及终端 |
US20190236141A1 (en) * | 2018-01-29 | 2019-08-01 | Boe Technology Group Co., Ltd. | Method, device and system for analyzing comment data about target |
CN111382262A (zh) * | 2020-03-19 | 2020-07-07 | 北京百度网讯科技有限公司 | 用于输出信息的方法和装置 |
-
2020
- 2020-10-22 CN CN202011139934.5A patent/CN114385902B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102096680A (zh) * | 2009-12-15 | 2011-06-15 | 北京大学 | 信息有效性分析的方法和装置 |
CN102254038A (zh) * | 2011-08-11 | 2011-11-23 | 武汉安问科技发展有限责任公司 | 一种分析网络评论相关度的***及其分析方法 |
US20170053013A1 (en) * | 2015-08-18 | 2017-02-23 | Facebook, Inc. | Systems and methods for identifying and grouping related content labels |
TWI656448B (zh) * | 2017-11-01 | 2019-04-11 | 中華電信股份有限公司 | 主題提供裝置及其雲儲存檔案提示方法 |
CN109819280A (zh) * | 2017-11-22 | 2019-05-28 | 上海全土豆文化传播有限公司 | 弹幕展示方法及装置 |
US20190236141A1 (en) * | 2018-01-29 | 2019-08-01 | Boe Technology Group Co., Ltd. | Method, device and system for analyzing comment data about target |
CN110008395A (zh) * | 2018-09-17 | 2019-07-12 | 北京字节跳动网络技术有限公司 | 评论内容的呈现方法、装置、存储介质及终端 |
CN111382262A (zh) * | 2020-03-19 | 2020-07-07 | 北京百度网讯科技有限公司 | 用于输出信息的方法和装置 |
Non-Patent Citations (1)
Title |
---|
卢盛祺 等: "LDA模型在网络视频推荐中的应用", 微型机与应用, no. 11 * |
Also Published As
Publication number | Publication date |
---|---|
CN114385902B (zh) | 2024-01-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111324774B (zh) | 一种视频去重方法和装置 | |
CN113392651B (zh) | 训练词权重模型及提取核心词的方法、装置、设备和介质 | |
CN110472002B (zh) | 一种文本相似度获取方法和装置 | |
CN110619051A (zh) | 问题语句分类方法、装置、电子设备及存储介质 | |
CN114329029B (zh) | 对象检索方法、装置、设备及计算机存储介质 | |
CN110717038A (zh) | 对象分类方法及装置 | |
CN110852047A (zh) | 一种文本配乐方法、装置、以及计算机存储介质 | |
CN111324773A (zh) | 一种背景音乐构建方法、装置、电子设备和存储介质 | |
CN113392179A (zh) | 文本标注方法及装置、电子设备、存储介质 | |
CN110888970B (zh) | 文本生成方法、装置、终端和存储介质 | |
CN114741581A (zh) | 一种图像分类方法、装置、计算机设备及介质 | |
CN110162769B (zh) | 文本主题输出方法和装置、存储介质及电子装置 | |
CN112988954B (zh) | 文本分类方法、装置、电子设备和计算机可读存储介质 | |
CN113761192B (zh) | 文本处理方法、文本处理装置及文本处理设备 | |
Li et al. | EMOD: an efficient on-device mobile visual search system | |
CN114328800A (zh) | 文本处理方法、装置、电子设备和计算机可读存储介质 | |
CN111988668B (zh) | 一种视频推荐方法、装置、计算机设备及存储介质 | |
CN113408282A (zh) | 主题模型训练和主题预测方法、装置、设备及存储介质 | |
CN114281935A (zh) | 搜索结果分类模型的训练方法、装置、介质及设备 | |
CN114329016B (zh) | 图片标签生成方法和文字配图方法 | |
CN114385902B (zh) | 一种内容推荐方法、装置及存储介质 | |
CN113392220B (zh) | 一种知识图谱生成方法、装置、计算机设备及存储介质 | |
CN116955763A (zh) | 内容推荐方法、装置、计算机设备及计算机可读存储介质 | |
CN115129930A (zh) | 一种视频的信息处理方法、装置、计算机设备和存储介质 | |
CN116415624A (zh) | 模型训练方法及装置、内容推荐方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |