CN110569447A - 一种网络资源的推荐方法、装置及存储介质 - Google Patents
一种网络资源的推荐方法、装置及存储介质 Download PDFInfo
- Publication number
- CN110569447A CN110569447A CN201910867402.4A CN201910867402A CN110569447A CN 110569447 A CN110569447 A CN 110569447A CN 201910867402 A CN201910867402 A CN 201910867402A CN 110569447 A CN110569447 A CN 110569447A
- Authority
- CN
- China
- Prior art keywords
- network resource
- sample
- characteristic
- network
- resources
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种网络资源的推荐方法、装置及存储介质,属于数据处理领域。所述方法包括:获取参考网络资源的显性特征和隐性特征,基于参考网络资源的显性特征和隐性特征,以及第一网络资源库中每个网络资源的显性特征和隐性特征,通过关联模型,确定第一网络资源库中的每个网络资源与参考网络资源之间的相似度,基于第一网络资源库中的每个网络资源与参考网络资源之间的相似度,为用户进行资源推荐。本申请通过网络资源的属性特征、统计特征和隐性特征,来评估任意两个样本网络资源的相似度,然后基于网络资源的相似度进行资源推荐,可以使得相似性的评估更加全面和准确,提高了确定网络资源相似性的准确度,进而提高了推荐准确度。
Description
技术领域
本申请涉及数据处理领域,特别涉及一种网络资源的推荐推荐方法、装置及存储介质。
背景技术
随着科技的不断发展,用户能够在网络上浏览的网络资源也越来越多,该网络资源可以为歌曲、视频或新闻等。而且,为了满足用户的浏览需求,在用户浏览网络资源的过程中,资源平台还需要根据用户的历史浏览记录,为用户推荐相似的网络资源。比如,当用户在歌曲播放平台收听歌曲时,歌曲播放平台可以根据用户的歌曲播放记录,为用户推荐相似的歌曲。
在相关技术中,资源平台一般是根据网络资源的属性相似性,来为用户进行资源推荐。比如,对于用户浏览过的参考网络资源,资源平台可以获取参考网络资源的标题或标签等属性,然后根据网络资源库中每个网络资源的属性与参考网络资源的属性之间的相似度,确定该网络资源库中每个网络资源与参考网络资源的相似度,再基于该网络资源库中每个网络资源与参考网络资源的相似度,为用户进行资源推荐。比如,将网络资源库中与参考网络资源的相似度最大的网络资源推荐给用户。
但是,仅根据两个网络资源的属性之间的相似性,来评估两个网络资源的相似性的评估方式对比片面,导致确定出的相似度准确度较低,进而导致网络资源的推荐准确度较低。
发明内容
本申请提供了一种网络资源的推荐方法、装置及存储介质,可以解决相关技术的仅根据两个网络资源的属性之间的相似性,来评估两个网络资源的相似性的评估方式对比片面,导致确定出的相似度准确度较低,进而导致网络资源的推荐准确度较低的问题。所述技术方案如下:
一方面,提供了一种网络资源的推荐方法,所述方法包括:
获取参考网络资源的显性特征和隐性特征,所述显性特征包括属性特征和统计特征,所述隐性特征是指映射到隐含空间的向量表示,所述参考网络资源为用户浏览过的网络资源;
基于所述参考网络资源的显性特征和隐性特征,以及第一网络资源库中每个网络资源的显性特征和隐性特征,通过关联模型,确定所述第一网络资源库中的每个网络资源与所述参考网络资源之间的相似度,所述关联模型用于确定任意两个网络资源之间的相似度;
基于所述第一网络资源库中的每个网络资源与所述参考网络资源之间的相似度,为所述用户进行资源推荐。
可选地,所述获取所述参考网络资源的隐性特征,包括:
将所述参考网络资源映射到浏览行为空间中,得到所述参考网络资源的第一词嵌入向量,将所述参考网络资源的第一词嵌入向量,确定为所述参考网络资源的隐性特征;或者,
将所述参考网络资源映射到浏览行为空间中,得到所述参考网络资源的第一词嵌入向量;将所述参考网络资源映射到资源内容空间中,得到所述参考网络资源的第二词嵌入向量;将所述参考网络资源的第一词嵌入向量和第二词嵌入向量,确定为所述参考网络资源的隐性特征。
可选地,当所述参考网络资源为歌曲时,所述属性特征包括演唱者、所属流派、所属专辑、发行时间和演唱者所处地域中的至少一种,所述统计特征包括播放量、收藏量和评论量中的至少一种。
可选地,所述基于所述参考网络资源的显性特征和隐性特征,以及第一网络资源库中每个网络资源的显性特征和隐性特征,通过关联模型,确定所述第一网络资源库中的每个网络资源与所述参考网络资源之间的相似度,包括:
对于所述第一网络资源库中的第一网络资源,将所述参考网络资源的显性特征和隐性特征,以及所述第一网络资源的显性特征和隐性特征作为所述关联模型的输入,通过所述关联模型确定所述第一网络资源与所述参考网络资源之间的相似度,所述第一网络资源为所述第一网络资源库中的任一网络资源。
可选地,所述基于所述参考网络资源的显性特征和隐性特征,以及第一网络资源库中每个网络资源的显性特征和隐性特征,通过关联模型,确定所述第一网络资源库中的每个网络资源与所述参考网络资源之间的相似度,包括:
将所述参考网络资源的统计特征,与所述第一网络资源库中每个网络资源的统计特征进行对比处理,得到所述第一网络资源库中的每个网络资源与所述参考网络资源之间的对比特征;
对于所述第一网络资源库中的第一网络资源,将所述参考网络资源的显性特征和隐性特征,以及所述第一网络资源的显性特征、隐性特征以及与所述参考网络资源之间的对比特征作为所述关联模型的输入,通过所述关联模型确定所述第一网络资源与所述参考网络资源之间的相似度,所述第一网络资源为所述第一网络资源库中的任一网络资源。
可选地,所述基于所述第一网络资源库中的每个网络资源与所述参考网络资源之间的相似度,为所述用户进行资源推荐,包括:
按照与所述参考网络资源之间的相似度从大到小的顺序,对所述第一网络资源库中的网络资源进行排序;
从排序结果中获取排序在前的n个网络资源,将所述排序在前的n个网络资源推荐给所述用户,n为正整数。
可选地,所述基于所述参考网络资源的显性特征和隐性特征,以及第一网络资源库中每个网络资源的显性特征和隐性特征,通过关联模型,确定所述第一网络资源库中的每个网络资源与所述参考网络资源之间的相似度之前,还包括:
获取多个样本网络资源的隐性特征,所述样本网络资源为样本用户浏览过的网络资源;
根据所述多个样本网络资源中每个样本网络资源的隐性特征,从第二网络资源库中确定每个样本网络资源的k个相似网络资源,所述k为大于1的整数;
基于所述多个样本网络资源中每个样本网络资源的k个相似网络资源的关联推荐结果,确定多个第一正样本数据和多个第一负样本数据;
其中,每个第一正样本数据包括第一样本网络资源和所述第一样本网络资源的一个正相似网络资源,每个第一负样本数据包括第二样本网络资源和所述第二样本网络资源的一个负相似网络资源,所述第一样本网络资源和所述第二样本网络资源均为所述多个样本网络资源中的任一个,所述正相似网络资源是指所述第一样本网络资源的k个相似网络资源中在推荐给用户后被用户接受的相似网络资源,所述负相似网络资源是指所述第二样本网络资源的k个相似网络资源中在推荐给用户后未被用户接受的相似网络资源;
基于所述多个第一正样本数据和多个第一负样本数据,确定多个第二正样本数据和多个第二负样本数据;
其中,每个第二正样本数据包括所述第一样本网络资源的显性特征和隐性特征,以及所述第一样本网络资源的一个正相似网络资源的显性特征和隐性特征,每个第二负样本数据包括所述第二样本网络资源的显性特征和隐性特征,以及所述第二样本网络资源的一个负相似网络资源的显性特征和隐性特征;
基于所述多个第二正样本数据和所述多个第二负样本数据,对待训练关联模型进行训练,得到所述关联模型。
可选地,所述根据所述多个样本网络资源中每个样本网络资源的隐性特征,从第二网络资源库中确定每个样本网络资源的k个相似网络资源,包括:
对于所述多个样本网络资源中的任一样本网络资源,根据所述任一样本网络资源在浏览行为空间上的第一词嵌入向量,以及所述第二网络资源库中每个网络资源在浏览行为空间上的第一词嵌入向量,确定所述第二网络资源库中每个网络资源与所述任一样本网络资源的相似度;基于所述第二网络资源库中每个网络资源与所述任一样本网络资源的相似度,从所述第二网络资源库中确定所述任一样本网络资源的k个相似网络资源;或者,
对于所述多个样本网络资源中的任一样本网络资源,根据所述任一样本网络资源在资源内容空间上的第二词嵌入向量,以及所述第二网络资源库中每个网络资源在资源内容空间上的第二词嵌入向量,确定所述第二网络资源库中每个网络资源与所述任一样本网络资源的相似度;基于所述第二网络资源库中每个网络资源与所述任一样本网络资源的相似度,从所述第二网络资源库中确定所述任一样本网络资源的k个相似网络资源。
可选地,所述基于所述多个第一正样本数据和多个第一负样本数据,确定多个第二正样本数据和多个第二负样本数据,包括:
对于所述多个第一正样本数据中的任一第一正样本数据,分别提取所述任一第一正样本数据包括的所述第一样本网络资源和所述第一样本网络资源的正相似网络资源的显性特征;基于所述第一样本网络资源的显性特征和隐性特征,以及所述第一样本网络资源的正相似网络资源的显性特征和隐性特征,确定所述任一第一正样本数据对应的第二正样本数据;
对于所述多个第一负样本数据中的任一第一负样本数据,分别提取所述任一第一负样本数据包括的所述第二样本网络资源和所述第二样本网络资源的负相似网络资源的显性特征;基于所述第二样本网络资源的显性特征和隐性特征,以及所述第二样本网络资源的负相似网络资源的显性特征和隐性特征,确定所述任一第一负样本数据对应的第二负样本数据。
可选地,所述基于所述第一样本网络资源的显性特征和隐性特征,以及所述第一样本网络资源的正相似网络资源的显性特征和隐性特征,确定所述任一第一正样本数据对应的第二正样本数据,包括:
将所述第一样本网络资源的显性特征和隐性特征,以及所述第一样本网络资源的正相似网络资源的显性特征和隐性特征,确定为所述任一第一正样本数据对应的第二正样本数据;或者;
将所述第一样本网络资源的统计特征和所述第一样本网络资源的正相似网络资源的统计特征进行对比处理,得到所述第一样本网络资源的正相似网络资源与所述第一样本网络资源之间的对比特征;将所述第一样本网络资源的显性特征和隐性特征,所述第一样本网络资源的正相似网络资源的显性特征和隐性特征,以及所述第一样本网络资源的正相似网络资源与所述第一样本网络资源之间的对比特征,确定为所述任一第一正样本数据对应的第二正样本数据。
可选地,所述基于所述第二样本网络资源的显性特征和隐性特征,以及所述第二样本网络资源的负相似网络资源的显性特征和隐性特征,确定所述任一第一负样本数据对应的第二负样本数据,包括:
将所述第二样本网络资源的显性特征和隐性特征,以及所述第二样本网络资源的负相似网络资源的显性特征和隐性特征,确定为所述任一第一负样本数据对应的第二负样本数据;或者;
将所述第二样本网络资源的统计特征和所述第二样本网络资源的正相似网络资源的统计特征进行对比处理,得到所述第二样本网络资源的负相似网络资源与所述第二样本网络资源之间的对比特征;将所述第二样本网络资源的显性特征和隐性特征,所述第二样本网络资源的负相似网络资源的显性特征和隐性特征,以及所述第二样本网络资源的负相似网络资源与所述第二样本网络资源之间的对比特征,确定为所述任一第一负样本数据对应的第二负样本数据。
另一方面,提供了一种网络资源的推荐装置,所述装置包括:
第一获取模块,用于获取参考网络资源的显性特征和隐性特征,所述显性特征包括属性特征和统计特征,所述隐性特征是指映射到隐含空间的向量表示,所述参考网络资源为用户浏览过的网络资源;
第一确定模块,用于基于所述参考网络资源的显性特征和隐性特征,以及第一网络资源库中每个网络资源的显性特征和隐性特征,通过关联模型,确定所述第一网络资源库中的每个网络资源与所述参考网络资源之间的相似度,所述关联模型用于确定任意两个网络资源之间的相似度;
推荐模块,用于基于所述第一网络资源库中的每个网络资源与所述参考网络资源之间的相似度,为所述用户进行资源推荐。
可选地,所述获取模块用于:
将所述参考网络资源映射到浏览行为空间中,得到所述参考网络资源的第一词嵌入向量,将所述参考网络资源的第一词嵌入向量,确定为所述参考网络资源的隐性特征;或者,
将所述参考网络资源映射到浏览行为空间中,得到所述参考网络资源的第一词嵌入向量;将所述参考网络资源映射到资源内容空间中,得到所述参考网络资源的第二词嵌入向量;将所述参考网络资源的第一词嵌入向量和第二词嵌入向量,确定为所述参考网络资源的隐性特征。
可选地,当所述参考网络资源为歌曲时,所述属性特征包括演唱者、所属流派、所属专辑、发行时间和演唱者所处地域中的至少一种,所述统计特征包括播放量、收藏量和评论量中的至少一种。
可选地,所述第一确定模块用于:
对于所述第一网络资源库中的第一网络资源,将所述参考网络资源的显性特征和隐性特征,以及所述第一网络资源的显性特征和隐性特征作为所述关联模型的输入,通过所述关联模型确定所述第一网络资源与所述参考网络资源之间的相似度,所述第一网络资源为所述第一网络资源库中的任一网络资源。
可选地,所述第一确定模块用于:
将所述参考网络资源的统计特征,与所述第一网络资源库中每个网络资源的统计特征进行对比处理,得到所述第一网络资源库中的每个网络资源与所述参考网络资源之间的对比特征;
对于所述第一网络资源库中的第一网络资源,将所述参考网络资源的显性特征和隐性特征,以及所述第一网络资源的显性特征、隐性特征以及与所述参考网络资源之间的对比特征作为所述关联模型的输入,通过所述关联模型确定所述第一网络资源与所述参考网络资源之间的相似度,所述第一网络资源为所述第一网络资源库中的任一网络资源。
可选地,所述推荐模块用于:
按照与所述参考网络资源之间的相似度从大到小的顺序,对所述第一网络资源库中的网络资源进行排序;
从排序结果中获取排序在前的n个网络资源,将所述排序在前的n个网络资源推荐给所述用户,n为正整数。
可选地,所述装置还包括:
第二获取模块,用于获取多个样本网络资源的隐性特征,所述样本网络资源为样本用户浏览过的网络资源;
第二确定模块,用于根据所述多个样本网络资源中每个样本网络资源的隐性特征,从第二网络资源库中确定每个样本网络资源的k个相似网络资源,所述k为大于1的整数;
第三确定模块,用于基于所述多个样本网络资源中每个样本网络资源的k个相似网络资源的关联推荐结果,确定多个第一正样本数据和多个第一负样本数据;
第四确定模块,用于基于所述多个第一正样本数据和多个第一负样本数据,确定多个第二正样本数据和多个第二负样本数据;
其中,每个第一正样本数据包括第一样本网络资源和所述第一样本网络资源的一个正相似网络资源,每个第一负样本数据包括第二样本网络资源和所述第二样本网络资源的一个负相似网络资源,所述第一样本网络资源和所述第二样本网络资源均为所述多个样本网络资源中的任一个,所述正相似网络资源是指所述第一样本网络资源的k个相似网络资源中在推荐给用户后被用户接受的相似网络资源,所述负相似网络资源是指所述第二样本网络资源的k个相似网络资源中在推荐给用户后未被用户接受的相似网络资源;其中,每个第二正样本数据包括所述第一样本网络资源的显性特征和隐性特征,以及所述第一样本网络资源的一个正相似网络资源的显性特征和隐性特征,每个第二负样本数据包括所述第二样本网络资源的显性特征和隐性特征,以及所述第二样本网络资源的一个负相似网络资源的显性特征和隐性特征;
训练模块,用于基于所述多个第二正样本数据和所述多个第二负样本数据,对待训练关联模型进行训练,得到所述关联模型。
可选地,所述第二确定模块包括:
第一确定单元,用于对于所述多个样本网络资源中的任一样本网络资源,根据所述任一样本网络资源在浏览行为空间上的第一词嵌入向量,以及所述第二网络资源库中每个网络资源在浏览行为空间上的第一词嵌入向量,确定所述第二网络资源库中每个网络资源与所述任一样本网络资源的相似度;基于所述第二网络资源库中每个网络资源与所述任一样本网络资源的相似度,从所述第二网络资源库中确定所述任一样本网络资源的k个相似网络资源;
第二确定单元,用于对于所述多个样本网络资源中的任一样本网络资源,根据所述任一样本网络资源在资源内容空间上的第二词嵌入向量,以及所述第二网络资源库中每个网络资源在资源内容空间上的第二词嵌入向量,确定所述第二网络资源库中每个网络资源与所述任一样本网络资源的相似度;基于所述第二网络资源库中每个网络资源与所述任一样本网络资源的相似度,从所述第二网络资源库中确定所述任一样本网络资源的k个相似网络资源。
可选地,所述第四确定模块包括:
第一提取单元,用于对于所述多个第一正样本数据中的任一第一正样本数据,分别提取所述任一第一正样本数据包括的第一样本网络资源和所述第一样本网络资源的正相似网络资源的显性特征;
第三确定单元,用于基于所述第一样本网络资源的显性特征和隐性特征,以及所述第一样本网络资源的正相似网络资源的显性特征和隐性特征,确定所述任一第一正样本数据对应的第二正样本数据;
第二提取单元,用于对于所述多个第一负样本数据中的任一第一负样本数据,分别提取所述任一第一负样本数据包括的第二样本网络资源和所述第二样本网络资源的负相似网络资源的显性特征;
第四确定单元,用于基于所述第二样本网络资源的显性特征和隐性特征,以及所述第二样本网络资源的负相似网络资源的显性特征和隐性特征,确定所述任一第一负样本数据对应的第二负样本数据。
可选地,所述第三确定单元用于:
将所述第一样本网络资源的显性特征和隐性特征,以及所述第一样本网络资源的正相似网络资源的显性特征和隐性特征,确定为所述任一第一正样本数据对应的第二正样本数据;
将所述第一样本网络资源的统计特征和所述第一样本网络资源的正相似网络资源的统计特征进行对比处理,得到所述第一样本网络资源的正相似网络资源与所述第一样本网络资源之间的对比特征;将所述第一样本网络资源的显性特征和隐性特征,所述第一样本网络资源的正相似网络资源的显性特征和隐性特征,以及所述第一样本网络资源的正相似网络资源与所述第一样本网络资源之间的对比特征,确定为所述任一第一正样本数据对应的第二正样本数据。
可选地,所述第四确定单元用于:
将所述第二样本网络资源的显性特征和隐性特征,以及所述第二样本网络资源的负相似网络资源的显性特征和隐性特征,确定为所述任一第一负样本数据对应的第二负样本数据;
将所述第二样本网络资源的统计特征和所述第二样本网络资源的正相似网络资源的统计特征进行对比处理,得到所述第二样本网络资源的负相似网络资源与所述第二样本网络资源之间的对比特征;将所述第二样本网络资源的显性特征和隐性特征,所述第二样本网络资源的负相似网络资源的显性特征和隐性特征,以及所述第二样本网络资源的负相似网络资源与所述第二样本网络资源之间的对比特征,确定为所述任一第一负样本数据对应的第二负样本数据。
另一方面,提供了一种服务器,所述终端包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集由所述处理器加载并执行以实现上述所述的网络资源的推荐方法。
另一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集由处理器加载并执行以实现上述所述的网络资源的推荐方法。
另一方面,提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述所述的网络资源的推荐方法。
本申请提供的技术方案至少可以带来以下有益效果:
本申请实施例中,对于用户浏览过的参考网络资源,可以获取参考网络资源的显性特征和隐性特征,基于参考网络资源的显性特征和隐性特征,以及第一网络资源库中每个网络资源的显性特征和隐性特征,通过关联模型,确定第一网络资源库中的每个网络资源与所述参考网络资源之间的相似度,然后基于第一网络资源库中的每个网络资源与所述参考网络资源之间的相似度,为用户进行资源推荐。由于显性特征包括属性特征和统计特征,隐性特征是指映射到隐含空间的向量表示,因此,本申请可以结合网络资源的属性特征、统计特征和隐性特征,来评估任意两个样本网络资源的相似度,然后基于网络资源的相似度进行资源推荐,如此使得相似性的评估更加全面和准确,提高了确定网络资源相似性的准确度,进而提高了推荐准确度。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种实施环境的示意图;
图2是本申请实施例提供的一种关联模型的训练方法的流程图;
图3是本申请实施例提供的一种网络资源的推荐方法的流程图;
图4是本申请实施例提供的一种网络资源的推荐装置的结构示意图;
图5是本申请实施例提供的一种服务器的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
在对本申请实施例提供的一种网络资源的推荐方法进行详细的解释说明之前,先对本申请实施例提供的应用场景进行介绍。
本申请实施例提供的网络资源的推荐方法应用于基于用户所浏览的网络资源的相似性,为用户推荐相似网络资源的场景中,该网络资源可以为歌曲、视频或新闻等。比如,在用户通过音乐软件收听歌曲时,音乐软件可以通过本申请实施例提供的方法为用户进行歌曲推荐。或者,在用户通过视频软件观看视频时,视频软件可以通过本申请实施例提供的方法为用户进行视频推荐。或者,在用户通过新闻软件阅读新闻时,新闻软件可以通过本申请实施例提供的方法为用户进行新闻推荐等。当然,本申请实施例提供的网络资源的推荐方法也可以应用于其他场景,本申请实施例对此不做限定。
需要说明的是,本申请中的术语“第一”和“第二”等是为了区别不同对象,而不是用于描述特定顺序。
接下来对本申请实施例提供的实施环境进行介绍。
图1是本申请实施例提供的一种实施环境的示意图,如图1所示,该实施环境包括终端10和服务器20,终端10和服务器20可以通过有线网络或无线网络进行通信。终端10可以是计算机、手机或平板电脑等设备。终端10中安装有资源软件,该资源软件用于为用户提供网络资源,具体可以为音乐软件、视频软件或新闻软件等。服务器20为资源软件的后台服务器,可以在用户使用资源软件浏览网络资源的过程中,按照本申请实施例提供的方法为用户进行资源推荐。
需要说明的是,本申请实施例可以利用关联模型来确定网络资源的相似度,然后根据网络资源的相似度来为用户进行资源推荐。其中,该关联模型用于根据任意两个网络资源的显性特征和隐性特征,来确定这两个网络资源的相似度。而在利用关联模型确定网络资源的相似度之前,需要先利用样本数据进行模型训练来得到该关联模型。接下来,先对该关联模型的训练过程进行介绍。
图2是本申请实施例提供的一种关联模型的训练方法的流程图,该方法可以应用于上述图1所示的服务器中,如图2所示,该方法包括如下步骤:
步骤201:获取多个样本网络资源的隐性特征,样本网络资源为样本用户浏览过的网络资源。
其中,多个样本网络资源是为训练关联模型所选定的网络资源,且为样本用户浏览过的网络资源,比如可以为用户浏览过的歌曲、视频或新闻等资源。样本用户是为训练关联模型所选定的用户。
比如,样本网络资源可以为样本用户播放过的歌曲或收藏过的歌曲,可以从样本用户的歌曲播放列表或歌曲收藏列表中获取得到。再比如,样本网络资源可以为样本用户观看过或收藏过的视频,可以从样本用户的观看记录或收藏列表中获取得到。再比如,样本网络资源可以为样本用户阅读过或收藏过的新闻,可以从样本用户的阅读记录或收藏列表中获取得到。
对于多个网络资源中的每个网络资源,可以获取每个网络资源的隐性特征。隐性特征是指映射到隐含空间的向量表示。示例的,该向量表示可以为词嵌入(embedding)向量,词嵌入向量是指用于在隐含空间上表示样本网络资源的一个低维向量。
作为一个示例,该隐性特征至少包括在浏览行为空间上的词嵌入向量。进一步地,隐性特征还可以包括在浏览行为空间上的词嵌入向量,以及在资源内容空间上的词嵌入向量。
在一些实施例中,获取样本网络资源的隐性特征的操作可以包括以下两种实现方式:
第一种实现方式:将样本网络资源映射到浏览行为空间中,得到样本网络资源的第一词嵌入向量,将样本网络资源的第一词嵌入向量,确定为样本网络资源的隐性特征。
将样本网络资源映射到浏览行为空间上,即可得到样本网络资源在浏览行为空间上的第一词嵌入向量。样本网络资源在浏览行为空间上的第一词嵌入向量可以指示用户对该样本网络资源的浏览行为,比如可以指示有多少个用户浏览了该样本网络资源,或者有哪些用户浏览了该样本网络资源。第一词嵌入向量可以是一个N维向量,示例的,N为100。
比如,若样本网络资源为样本歌曲,则可以将样本歌曲映射到用户播放行为空间上,得到在播放播放行为空间上的词嵌入向量,和/或,将样本歌曲映射到用户收藏行为空间上,得到在收藏行为空间上的词嵌入向量。在播放行为空间上的词嵌入向量可以指示有多少个用户播放了该样本歌曲,或者有哪些用户播放了该样本歌曲。同样的,在收藏行为空间上的词嵌入向量可以指示有哪些用户收藏了该样本歌曲,或者有哪些用户收藏了该样本歌曲。
通过将样本网络资源映射到浏览行为空间上的第一词嵌入向量作为样本网络资源的隐性特征,可以便于后续结合网络资源在用户浏览行为这一方面的相似性,来评估网络资源之间的相似性。
作为一个示例,可以通过item2vec算法,计算样本网络资源的第一词嵌入向量。比如,若网络资源为歌曲,则可以基于样本用户的歌曲播放流水和歌曲收藏流水,来获取多个样本歌曲,作为模型训练的样本数据。若样本歌曲为样本用户的播放歌曲列表中的歌曲,则可以通过item2vec算法计算得到该样本歌曲的第一词嵌入向量,记作song_play_i。若样本歌曲为样本用户的歌曲收藏列表中的歌曲,则可以通过item2vec算法计算得到该样本歌曲的第一词嵌入向量,记作song_favor_i。
第二种实现方式:将样本网络资源映射到浏览行为空间中,得到样本网络资源的第一词嵌入向量;将样本网络资源映射到资源内容空间中,得到样本网络资源的第二词嵌入向量;将样本网络资源的第一词嵌入向量和第二词嵌入向量,确定为样本网络资源的隐性特征。
也即是,在第二种实现方式中,样本网络资源的隐性特征既包括在浏览行为空间上的第一词嵌入向量,也包括在资源内容空间上的第二词嵌入向量。样本网络资源在浏览行为空间上的第一词嵌入向量可以指示用户对该样本网络资源的浏览行为,样本网络资源在资源内容空间上的第二词嵌入向量可以指示样本网络资源的具体内容,如此,可以便于后续结合网络资源在用户浏览行为和资源内容这两个方面的相似性,来评估网络资源之间的相似性。
示例的,第二词嵌入向量可以是一个N维向量,也即是,可以通过一个N维的embedding向量来表示该样本网络资源的资源内容。示例的,N为100。
作为一个示例,将样本网络资源映射到资源内容空间中,得到样本网络资源的第二词嵌入向量的过程可以包括:提取样本网络资源的资源内容,基于该样本网络资源的资源内容,通过item2vec算法,计算得到该样本网络资源的第二词嵌入向量。或者,提取样本网络资源的资源内容,基于该样本网络资源的资源内容,通过词嵌入向量模型,确定该样本网络资源的第二词嵌入向量。其中,该词嵌入向量模型用于基于任一网络资源的资源内容,确定该任一网络资源的第二词嵌入向量,该词嵌入向量模型可以基于item2vec算法的计算结果训练得到。
其中,若样本网络资源为样本歌曲,则样本歌曲的资源内容可以为歌曲频谱,或者为歌曲频谱形成的频谱图像;若样本网络资源为样本视频,则样本视频的资源内容可以为视频图像;若样本网络资源为样本新闻,则样本新闻的资源内容可以为新闻内容。
示例的,若样本网络资源为样本歌曲,则可以提取该样本歌曲的歌曲频谱,基于该样本歌曲的歌曲频谱,确定该样本歌曲的频谱图像,基于该样本歌曲的频谱图像,通过该词嵌入向量模型,确定该样本歌曲的第二词嵌入向量。
步骤202:根据多个样本网络资源中每个样本网络资源的隐性特征,从第二网络资源库中确定每个样本网络资源的k个相似网络资源。
其中,该k为大于1的整数,k的具体取值可以预先设置,具体可以由服务器默认设置,也可以由用户设置。例如,k可以为2、5或10等。
其中,第二网络资源库中包含有大量的可用于推荐的网络资源,可以为资源软件的网络资源库,比如歌曲软件的歌曲库或视频软件的视频库等。相似网络资源是指与样本网络资源相似的网络资源,比如与样本歌曲相似的歌曲,或者与样本视频相似的视频等。本申请实施例中,可以根据样本网络资源的隐性特征确定k个相似网络资源,也即是,确定的k个相似网络资源是指第二网络资源库中隐性特征与样本网络资源的隐性特征相似的k个网络资源。
作为一个示例,根据多个样本网络资源中每个样本网络资源的隐性特征,从第一网络资源库中确定每个样本网络资源的k个相似网络资源的操作可以包括以下两种实现方式:
第一种实现方式:对于多个样本网络资源中的任一样本网络资源,根据该任一样本网络资源在浏览行为空间上的第一词嵌入向量,以及第二网络资源库中每个网络资源在浏览行为空间上的第一词嵌入向量,确定第二网络资源库中每个网络资源与该任一样本网络资源的相似度;基于第二网络资源库中每个网络资源与任一样本网络资源的相似度,从第二网络资源库中确定任一样本网络资源的k个相似网络资源。
在一些实施例中,可以根据该任一样本网络资源在浏览行为空间上的第一词嵌入向量,以及第二网络资源库中每个网络资源在浏览行为空间上的第一词嵌入向量,通过ANN(Approximate Nearest Neighbors,近似最近邻)算法,计算第二网络资源库中每个网络资源与该任一样本网络资源的相似度。该ANN算法是一种解决相似搜索问题的算法,示例的,该ANN算法可以为Annoy(Approximate Nearest Neighbors Oh Yeah,近似最邻近)算法或PQ(Product Quantization,乘积量化)算法等。
在一些实施例中,基于第二网络资源库中每个网络资源与任一样本网络资源的相似度,从第二网络资源库中确定任一样本网络资源的k个相似网络资源的操作包括:基于第二网络资源库中每个网络资源与任一样本网络资源的相似度,按照与该任一网络资源的相似度从大到小的顺序,从第二网络资源库中选取排序在前的k个网络资源,作为该任一样本网络资源的k个相似网络资源。
第二种实现方式:对于多个样本网络资源中的任一样本网络资源,根据任一样本网络资源在资源内容空间上的第二词嵌入向量,以及第二网络资源库中每个网络资源在资源内容空间上的第二词嵌入向量,确定第二网络资源库中每个网络资源与任一样本网络资源的相似度;基于第二网络资源库中每个网络资源与任一样本网络资源的相似度,从第二网络资源库中确定任一样本网络资源的k个相似网络资源。
在一些实施例中,可以根据任一样本网络资源在资源内容空间上的第二词嵌入向量,以及第二网络资源库中每个网络资源在资源内容空间上的第二词嵌入向量,通过ANN算法,计算第二网络资源库中每个网络资源与该任一样本网络资源的相似度。示例的,该ANN算法可以为annoy算法或PQ算法等。
第三种实现方式:对于多个样本网络资源中的任一样本网络资源,根据任一样本网络资源在浏览行为空间上的第一词嵌入向量和在资源内容空间上的第二词嵌入向量,以及第二网络资源库中每个网络资源在浏览行为空间上的第一词嵌入向量和在资源内容空间上的第二词嵌入向量,确定第二网络资源库中每个网络资源与任一样本网络资源的相似度;基于第二网络资源库中每个网络资源与任一样本网络资源的相似度,从第二网络资源库中确定任一样本网络资源的k个相似网络资源。
在一些实施例中,可以根据任一样本网络资源在浏览行为空间上的第一词嵌入向量和在资源内容空间上的第二词嵌入向量,以及第二网络资源库中每个网络资源在浏览行为空间上的第一词嵌入向量和在资源内容空间上的第二词嵌入向量,通过ANN算法,计算第二网络资源库中每个网络资源与该任一样本网络资源的相似度。示例的,该ANN算法可以为Annoy算法或PQ算法等。
步骤203:基于多个样本网络资源中每个样本网络资源的k个相似网络资源的关联推荐结果,确定多个第一正样本数据和多个第一负样本数据。
其中,每个第一正样本数据包括第一样本网络资源和第一样本网络资源的一个正相似网络资源,第一样本网络资源为多个样本网络资源中的任一个,正相似网络资源是指第一样本网络资源的k个相似网络资源中在推荐给用户后被用户接受的相似网络资源,比如推荐给用户后被用户点击的相似网络资源。
其中,每个第一负样本数据包括第二样本网络资源和第二样本网络资源的一个负相似网络资源,第二样本网络资源为多个样本网络资源中的任一个,负相似网络资源是指第二样本网络资源的k个相似网络资源中在推荐给用户后未被用户接受的相似网络资源,比如推荐给用户后未被用户点击的相似网络资源。
在计算得到每个样本网络资源的k个相似网络资源后,可以将这k个相似网络资源推荐给浏览过该样本网络资源的用户,这种推荐方式称之为关联推荐。关联推荐结果用于指示推荐给用户的相似网络资源是否被用户接受,比如,推荐给用户的相似网络资源是否被用户点击。
之后,即可基于关联推荐结果确定正负样本数据,比如,根据关联推荐的点击数据确定正负样本数据。若某个样本网络资源的一个相似网络资源的推荐被用户接受,比如曝光给用户后被用户点击,则可以将该样本网络资源和该相似网络资源组成的一组网络资源对作为一个第一正样本数据;若某个样本网络资源的一个相似网络资源的推荐未被用户接受,比如曝光给用户后未被用户点击,则可以将该样网络资源和该相似网络资源组成的一组网络资源对作为一个第一负样本数据。
示例的,若样本网络资源为样本歌曲,可以将每个样本歌曲的k个相似歌曲在线上关联推荐给用户,推荐给用户后,被用户点击的相似歌曲为正相似网络资源,正相似歌曲与对应的样本歌曲形成一个第一正样本数据,而未被用户点击的相似歌曲为负相似网络资源,负相似歌曲与对应的样本歌曲形成一个第一负样本数据。
示例的,第一正样本数据可以表示为<(source_song,target_song),1>,第一负正样本数据可以表示为<(source_song,target_song),0>。source_song表示样本歌曲,target_song表示样本歌曲的一个相似歌曲,1表示推荐的target_song被用户点击,0表示未被点击。
需要说明的是,该步骤的实施可以得到在从第二网络资源库中所获取的k个相似网络资源中哪些相似网络资源更容易被用户所浏览,比如,任一首样本歌曲的k首相似歌曲的哪几首歌曲更容易被样本用户所喜爱。
步骤204:基于多个第一正样本数据和多个第一负样本数据,确定多个第二正样本数据和多个第二负样本数据。
其中,每个第二正样本数据包括第一样本网络资源的显性特征和隐性特征,以及第一样本网络资源的一个正相似网络资源的显性特征和隐性特征,由一个第一正样本数据确定得到。其中,每个第二负样本数据包括第二样本网络资源的显性特征和隐性特征,以及第二样本网络资源的一个负相似网络资源的显性特征和隐性特征,由一个第一负样本数据确定得到。
其中,显性特征包括属性特征和统计特征。属性特征用于指示样本网络资源的自身属性,如标题、标签、名称、发布者或发布时间等属性。统计特征可以通过对用户浏览该样本网络资源的行为进行统计得到,可以包括样本网络资源的浏览量、收藏量、评论量或点赞量等。
比如,当样本网络资源为样本歌曲时,样本歌曲的属性特征可以包括演唱者、所属流派、所属专辑、发行时间和演唱者所处地域中的至少一种,样本歌曲的统计特征包括播放量、收藏量、评论量和收藏量的至少一种。
进一步地,每个第二正样本数据还可以包括第一样本网络资源的统计特征与第一样本网络资源的一个正相似网络资源的统计特征之间的对比特征,每个第二负样本数据也可以包括第二样本网络资源的统计特征与第二样本网络资源的一个负相似网络资源的统计特征之间的对比特征。
具体地,基于多个第一正样本数据和多个第一负样本数据,确定多个第二正样本数据和多个第二负样本数据可以包括以下两种情况:
第一种情况:对于多个第一正样本数据中的任一第一正样本数据,分别提取该任一第一正样本数据包括的第一样本网络资源和第一样本网络资源的正相似网络资源的显性特征和隐性特征;基于第一样本网络资源的显性特征和隐性特征,以及第一样本网络资源的正相似网络资源的显性特征和隐性特征,确定任一第一正样本数据对应的第二正样本数据。
比如,可以将第一样本网络资源的显性特征和隐性特征,以及第一样本网络资源的正相似网络资源的显性特征和隐性特征,直接确定为任一第一正样本数据对应的第二正样本数据。
或者,也可以将第一样本网络资源的统计特征和第一样本网络资源的正相似网络资源的统计特征进行对比处理,得到第一样本网络资源的正相似网络资源与第一样本网络资源之间的对比特征;将第一样本网络资源的显性特征和隐性特征,第一样本网络资源的正相似网络资源的显性特征和隐性特征,以及第一样本网络资源的正相似网络资源与第一样本网络资源之间的对比特征,确定为任一第一正样本数据对应的第二正样本数据。
其中,第一样本网络资源的正相似网络资源与第一样本网络资源之间的对比特征可以为两个网络资源的统计特征之间的比值,比如浏览量、收藏量、评论量或点赞量的比值等。
第二种情况:对于多个第一负样本数据中的任一第一负样本数据,分别提取任一第一负样本数据包括的第二样本网络资源和第二样本网络资源的负相似网络资源的显性特征;基于第二样本网络资源的显性特征和隐性特征,以及第二样本网络资源的负相似网络资源的显性特征和隐性特征,确定任一第一负样本数据对应的第二负样本数据。
比如,可以将第二样本网络资源的显性特征和隐性特征,以及第二样本网络资源的负相似网络资源的显性特征和隐性特征,确定为该任一第一负样本数据对应的第二负样本数据。
或者,也可以将第二样本网络资源的统计特征和第二样本网络资源的正相似网络资源的统计特征进行对比处理,得到第二样本网络资源的负相似网络资源与第二样本网络资源之间的对比特征;将第二样本网络资源的显性特征和隐性特征,第二样本网络资源的负相似网络资源的显性特征和隐性特征,以及第二样本网络资源的负相似网络资源与第二样本网络资源之间的对比特征,确定为任一第一负样本数据对应的第二负样本数据。
其中,第二样本网络资源的负相似网络资源与第二样本网络资源之间的对比特征可以为两个网络资源的统计特征之间的比值,比如浏览量、收藏量、评论量或点赞量的比值等。
其中该步骤的实施通过得到样本网络资源、正相似网络资源和负相似网络资源的显性特征和隐性特征以及样本网络资源与正相似网络资源的对比特征的显性特征和隐性特征以及样本网络资源与负相似网络资源的对比特征的显性特征和隐性特征,可以通过多方面的对比处理,得到更为精确的相似度,从而提高关联模型为用户推荐网络资源的准确度。
步骤205:基于多个第二正样本数据和多个第二负样本数据,对待训练关联模型进行训练,得到该关联模型。
其中,该关联模型为神经网络模型,具体可以为CNN(Convolutional NeuralNetworks,卷积神经网络)、RNN(Recurrent Neural Network,循环神经网络)或LSTM(LongShort-Term Memory,长短期记忆网络)模型等,本申请实施例对此不做限定。通过基于多个第二正样本数据和多个第二负样本数据,对待训练关联模型进行训练,即可得到能够根据任意两个网络资源的显性特征和隐性特征,确定该任意两个网络资源之间的相似度的关联模型。
通过将多对相似网络资源的显性特征和隐性特征,或者多对相似网络资源的显性特征和隐性特征,以及两者的对比特征作为训练样本进行模型训练,可以使得模型在训练过程中,能够融合相似网络资源的多个方面来学习评估任意两个网络资源之间的相似度,使得相似度的评估更加全面和准确,也即是,通过该关联模型,能够更加准确地确定出任意两个网络资源之间的相似度。
在一些实施例中,可以将多个第二正样本数据和多个第二负样本数据作为待训练关联模型的输入,通过待训练关联模型输出每个样本数据的预测相似度,将每个样本数据的预测相似度与真实相似度进行比较,基于比较结果,采用随机梯度下降法对待训练关联模型中的模型参数进行调整,得到该关联模型。
示例的,可以基于多个第二正样本数据和多个第二负样本数据,以hinge-loss作为损失函数,对待训练关联模型进行训练,得到该关联模型。
在训练得到该关联模型之后,可以将该关联模型部署在线上,在线上为用户提供更优质的相似网络资源的排序或推荐服务。
本申请实施例中,可以获取多个样本网络资源的隐性特征,根据多个样本网络资源中每个样本网络资源的隐性特征,从第二网络资源库中确定每个样本网络资源的k个相似网络资源,基于多个样本网络资源中每个样本网络资源的k个相似网络资源的关联推荐结果,确定多个第二正样本数据和多个第二负样本数据,然后基于多个第二正样本数据和多个第二负样本数据,对待训练关联模型进行训练,如此,可以通过多对相似网络资源的显性特征和隐性特征,或者多对相似网络资源的显性特征和隐性特征,以及两者的对比特征作为训练样本进行模型训练,使得模型在训练过程中,能够融合相似网络资源的多个方面来学习评估任意两个网络资源之间的相似度,保证了训练出的关联模型对网络资源的相似度的评估更加全面和准确,进而能够更加准确地确定出任意两个网络资源之间的相似度。
需要说明的是,在对关联模型训练完成之后,即可利用该关联模型确定网络资源之间的相似度,然后根据网络资源的相似度进行资源推荐。接下来,对本申请实施例提供的网络资源的推荐过程进行详细介绍。
图3是本申请实施例提供的一种网络资源的推荐方法的流程图,该方法可以应用于上述图1所示的服务器中。请参考图3,该方法包括如下步骤。
步骤301:获取参考网络资源的显性特征和隐性特征,该显性特征包括属性特征和统计特征,该隐性特征是指映射在隐含空间的向量表示,参考网络资源为用户浏览过的网络资源。
其中,参考网络资源可以为用户浏览过的任一网络资源,比如用户播放过或收藏过的歌曲,观看过或收藏过的视频,阅读过或收藏过的新闻等。示例的,若参考网络资源为参考歌曲,则参考歌曲可以为用户歌曲播放列表或歌曲收藏列表中的歌曲。
其中,属性特征用于指示参考网络资源的自身属性,如标题、标签、名称、发布者或发布时间等属性。统计特征可以通过对用户浏览参考网络资源的行为进行统计得到,可以包括参考网络资源的浏览量、收藏量、评论量或点赞量等。
比如,当参考网络资源为参考歌曲时,参考歌曲的属性特征可以包括演唱者、所属流派、所属专辑、发行时间和演唱者所处地域中的至少一种,参考歌曲的统计特征包括播放量、收藏量、评论量和收藏量的至少一种。
作为一个示例,参考网络资源的隐性特征至少包括参考网络资源在浏览行为空间上的词嵌入向量。进一步地,参考网络资源的隐性特征还可以包括参考网络资源在浏览行为空间上的词嵌入向量和在资源内容空间上的词嵌入向量。
在一些实施例中,获取参考网络资源的隐性特征的操作可以包括以下两种实现方式:
第一种实现方式:将参考网络资源映射到浏览行为空间中,得到参考网络资源的第一词嵌入向量,将参考网络资源的第一词嵌入向量,确定为参考网络资源的隐性特征。
通过将参考网络资源映射到浏览行为空间上的第一词嵌入向量作为参考网络资源的隐性特征,可以便于后续结合网络资源在用户浏览行为这一方面的相似性,来评估网络资源之间的相似性。
第二种实现方式:将参考网络资源映射到浏览行为空间中,得到参考网络资源的第一词嵌入向量;将参考网络资源映射到资源内容空间中,得到参考网络资源的第二词嵌入向量;将参考网络资源的第一词嵌入向量和第二词嵌入向量,确定为参考网络资源的隐性特征。
其中,参考网络资源在浏览行为空间上的第一词嵌入向量可以指示用户对该参考网络资源的浏览行为,参考网络资源在资源内容空间上的第二词嵌入向量可以指示该参考网络资源的具体内容。通过将参考网络资源在浏览行为空间上的第一词嵌入向量,以及在资源内容空间上的第二词嵌入向量作为参考网络资源的隐性特征,可以便于后续结合网络资源在用户浏览行为和资源内容这两个方面的相似性,来评估网络资源之间的相似性。
需要说明的是,将参考网络资源映射到浏览行为空间中,得到参考网络资源的第一词嵌入向量,以及将参考网络资源映射到资源内容空间中,得到参考网络资源的第二词嵌入向量的实现方式与图2实施例中对样本网络资源的处理方式同理,本申请实施例在此不再赘述。
步骤302:基于参考网络资源的显性特征和隐性特征,以及第一网络资源库中每个网络资源的显性特征和隐性特征,通过关联模型,确定第一网络资源库中的每个网络资源与参考网络资源之间的相似度。
其中,第一网络资源库中包含有大量的可用于推荐的网络资源,可以为资源软件的网络资源库,比如歌曲软件的歌曲库或视频软件的视频库等。第一网络资源库与上述图2实施例的模型训练过程中所使用的第第二网络资源库可以相同,也可以不同,本申请实施例对此不做限定。
其中,关联模型用于确定任意两个网络资源的相似度,可以通过上述图2实施例的模型训练方法训练得到。任意两个网络资源的相似度用于指示这任意两个网络资源之间的相似程度。
在一些实施例中,基于参考网络资源的显性特征和隐性特征,以及第一网络资源库中每个网络资源的显性特征和隐性特征,通过关联模型,确定第一网络资源库中的每个网络资源与参考网络资源之间的相似度的操作可以包括以下两种实现方式:
第一种实现方式:对于第一网络资源库中的第一网络资源,将参考网络资源的显性特征和隐性特征,以及第一网络资源的显性特征和隐性特征作为该关联模型的输入,通过该关联模型确定第一网络资源与参考网络资源之间的相似度,第一网络资源为第一网络资源库中的任一网络资源。
也即是,对于第一网络资源库中的任一网络资源,可以将该任一网络资源的显性特征和隐性特征,以及参考网络资源的显性特征和隐性特征输入至该关联模型中,通过关联模型对输入数据进行处理,即可输出该任一网络资源与参考网络资源之间的相似度。
以网络资源为歌曲为例,歌曲软件的后台服务器可以提取用户播放过或收藏过的参考歌曲的显性特征和隐性特征,并将歌曲库中的任一首歌曲的显性特征和隐性特征,以及参考歌曲的显性特征和隐性特征作为关联模型的输入,通过关联模型输出该任一首歌曲与参考歌曲之间的相似度。
第二种实现方式:将参考网络资源的统计特征,与第一网络资源库中每个网络资源的统计特征进行对比处理,得到第一网络资源库中的每个网络资源与参考网络资源之间的对比特征;对于第一网络资源库中的第一网络资源,将参考网络资源的显性特征和隐性特征,以及第一网络资源的显性特征、隐性特征以及与参考网络资源之间的对比特征作为该关联模型的输入,通过该关联模型确定第一网络资源与参考网络资源之间的相似度,第一网络资源为第一网络资源库中的任一网络资源。
其中,第一网络资源库中的每个网络资源与参考网络资源之间的对比特征可以为第一网络资源库中的每个网络资源的统计特征与参考网络资源的统计特征之间的比值,比如,可以为浏览量的比值、收藏量的比值或评论量的比值等。
也即是,对于第一网络资源库中的任一网络资源,可以将该任一网络资源的显性特征和隐性特征,参考网络资源的显性特征和隐性特征,以及这两个网络资源的对比特征输入至该关联模型中,通过关联模型对输入数据进行处理,即可输出该任一网络资源与参考网络资源之间的相似度。
以网络资源为歌曲为例,歌曲软件的后台服务器可以提取用户播放过或收藏过的参考歌曲的显性特征和隐性特征,并将歌曲库中的任一首歌曲的显性特征和隐性特征,参考歌曲的显性特征和隐性特征,以及任一首歌曲与参考歌曲之间的对比特征作为关联模型的输入,通过关联模型输出该任一首歌曲与参考歌曲之间的相似度。
在第二种实现方式中,通过在任意两个网络资源的显性特征和隐性特征基础上,再结合这两个网络资源之间的对比特征,来评估这两个网络资源的相似度,能够使得网络资源的相似度的评估更加全面和准确。
步骤303:基于第一网络资源库中的每个网络资源与参考网络资源之间的相似度,为该用户进行资源推荐。
在一些实施例中,基于第一网络资源库中的每个网络资源与参考网络资源之间的相似度,为该用户进行资源推荐的操作包括:按照与参考网络资源之间的相似度从大到小的顺序,对第一网络资源库中的网络资源进行排序;从排序结果中获取排序在前的n个网络资源,将排序在前的n个网络资源推荐给用户。
其中,n为正整数,n的具体取值可以由服务器默认设置,也可以由用户设置,本申请实施例对此不做限定。例如,n可以为1、2或5等。
比如,歌曲软件的后台服务器可以将线上所有歌曲按照与参考歌曲之间的相似度从大到小的顺序进行排序,并从排序结果中选取排序在前的n首歌曲推荐给用户。
在另一些实施例中,还可以基于第一网络资源库中的每个网络资源与参考网络资源之间的相似度,采用其他方式为用户进行资源推荐,本申请实施例对此不做限定。
需要说明的是,对于在网络资源软件中新发布的网络资源即新网络资源,由于新网络资源的属性是已知的,但是其统计特征和在浏览行为空间上的特征是未知的,因此,对于新网络资源来说,若要计算新网络资源与其他网络资源之间的相似度,还可以获取新网络资源的属性特征,然后基于新网络资源的属性特征,以及其他网络资源的属性特征,通过该关联模型,确定新网络资源与其他网络资源的相似度。其中,该其他网络资源可以为新网络资源,也可以为网络资源软件中已发布一段时间的旧网络资源。
在另一实施例中,对于新网络资源来说,若要计算新网络资源与其他网络资源之间的相似度,还可以获取新网络资源的属性特征,然后基于新网络资源的属性特征,以及其他网络资源的显性特征和隐性特征,通过该关联模型,确定新网络资源与其他网络资源的相似度。其中,该其他网络资源为网络资源软件中已发布一段时间的旧网络资源。
比如,对于歌曲软件上新发布的新歌来说,可以获取新歌的属性特征,然后基于新歌的属性特征,以及其他歌曲的属性特征,通过该关联模型,确定新歌与其他歌曲之间的似度。或者,基于新歌的属性特征,以及其他歌曲的显性特征和隐性特征,通过该关联模型,确定新歌与其他歌曲之间的似度。
本申请实施例中,对于用户浏览过的参考网络资源,可以获取参考网络资源的显性特征和隐性特征,基于参考网络资源的显性特征和隐性特征,以及第一网络资源库中每个网络资源的显性特征和隐性特征,通过关联模型,确定第一网络资源库中的每个网络资源与所述参考网络资源之间的相似度,然后基于第一网络资源库中的每个网络资源与所述参考网络资源之间的相似度,为用户进行资源推荐。由于显性特征包括属性特征和统计特征,隐性特征是指映射到隐含空间的向量表示,因此,本申请可以结合网络资源的属性特征、统计特征和隐性特征,来评估任意两个样本网络资源的相似度,然后基于网络资源的相似度进行资源推荐,如此使得相似性的评估更加全面和准确,提高了确定网络资源相似性的准确度,进而提高了推荐准确度。
图4是本申请实施例提供的一种网络资源的推荐装置的结构示意图,该网络资源的推荐装置可以由软件、硬件或者两者的结合实现成为服务器的部分或者全部,服务器可以为图1所示的服务器。请参考图4,该装置包括:第一获取模块401、第一确定模块402和推荐模块403。
第一获取模块401,用于获取参考网络资源的显性特征和隐性特征,该显性特征包括属性特征和统计特征,该隐性特征是指映射到隐含空间的向量表示,该参考网络资源为用户浏览过的网络资源;
第一确定模块402,用于基于该参考网络资源的显性特征和隐性特征,以及第一网络资源库中每个网络资源的显性特征和隐性特征,通过关联模型,确定该第一网络资源库中的每个网络资源与该参考网络资源之间的相似度,该关联模型用于确定任意两个网络资源之间的相似度;
推荐模块403,用于基于该第一网络资源库中的每个网络资源与该参考网络资源之间的相似度,为该用户进行资源推荐。
可选地,该获取模块401用于:
将该参考网络资源映射到浏览行为空间中,得到该参考网络资源的第一词嵌入向量,将该参考网络资源的第一词嵌入向量,确定为该参考网络资源的隐性特征;或者,
将该参考网络资源映射到浏览行为空间中,得到该参考网络资源的第一词嵌入向量;将该参考网络资源映射到资源内容空间中,得到该参考网络资源的第二词嵌入向量;将该参考网络资源的第一词嵌入向量和第二词嵌入向量,确定为该参考网络资源的隐性特征。
可选地,当该参考网络资源为歌曲时,该属性特征包括演唱者、所属流派、所属专辑、发行时间和演唱者所处地域中的至少一种,该统计特征包括播放量、收藏量和评论量中的至少一种。
可选地,该第一确定模块402用于:
对于该第一网络资源库中的第一网络资源,将该参考网络资源的显性特征和隐性特征,以及该第一网络资源的显性特征和隐性特征作为该关联模型的输入,通过该关联模型确定该第一网络资源与该参考网络资源之间的相似度,该第一网络资源为该第一网络资源库中的任一网络资源。
可选地,该第一确定模块402用于:
将该参考网络资源的统计特征,与该第一网络资源库中每个网络资源的统计特征进行对比处理,得到该第一网络资源库中的每个网络资源与该参考网络资源之间的对比特征;
对于该第一网络资源库中的第一网络资源,将该参考网络资源的显性特征和隐性特征,以及该第一网络资源的显性特征、隐性特征以及与该参考网络资源之间的对比特征作为该关联模型的输入,通过该关联模型确定该第一网络资源与该参考网络资源之间的相似度,该第一网络资源为该第一网络资源库中的任一网络资源。
可选地,该推荐模块403用于:
按照与该参考网络资源之间的相似度从大到小的顺序,对该第一网络资源库中的网络资源进行排序;
从排序结果中获取排序在前的n个网络资源,将该排序在前的n个网络资源推荐给该用户,n为正整数。
可选地,该装置还包括:
第二获取模块,用于获取多个样本网络资源的隐性特征,该样本网络资源为样本用户浏览过的网络资源;
第二确定模块,用于根据该多个样本网络资源中每个样本网络资源的隐性特征,从第二网络资源库中确定每个样本网络资源的k个相似网络资源,该k为大于1的整数;
第三确定模块,用于基于该多个样本网络资源中每个样本网络资源的k个相似网络资源的关联推荐结果,确定多个第一正样本数据和多个第一负样本数据;
第四确定模块,用于基于该多个第一正样本数据和多个第一负样本数据,确定多个第二正样本数据和多个第二负样本数据;
其中,每个第一正样本数据包括第一样本网络资源和该第一样本网络资源的一个正相似网络资源,每个第一负样本数据包括第二样本网络资源和该第二样本网络资源的一个负相似网络资源,该第一样本网络资源和该第二样本网络资源均为该多个样本网络资源中的任一个,该正相似网络资源是指该第一样本网络资源的k个相似网络资源中在推荐给用户后被用户接受的相似网络资源,该负相似网络资源是指该第二样本网络资源的k个相似网络资源中在推荐给用户后未被用户接受的相似网络资源;其中,每个第二正样本数据包括该第一样本网络资源的显性特征和隐性特征,以及该第一样本网络资源的一个正相似网络资源的显性特征和隐性特征,每个第二负样本数据包括该第二样本网络资源的显性特征和隐性特征,以及该第二样本网络资源的一个负相似网络资源的显性特征和隐性特征;
训练模块,用于基于该多个第二正样本数据和该多个第二负样本数据,对待训练关联模型进行训练,得到该关联模型。
可选地,该第二确定模块包括:
第一确定单元,用于对于该多个样本网络资源中的任一样本网络资源,根据该任一样本网络资源在浏览行为空间上的第一词嵌入向量,以及该第二网络资源库中每个网络资源在浏览行为空间上的第一词嵌入向量,确定该第二网络资源库中每个网络资源与该任一样本网络资源的相似度;基于该第二网络资源库中每个网络资源与该任一样本网络资源的相似度,从该第二网络资源库中确定该任一样本网络资源的k个相似网络资源;
第二确定单元,用于对于该多个样本网络资源中的任一样本网络资源,根据该任一样本网络资源在资源内容空间上的第二词嵌入向量,以及该第二网络资源库中每个网络资源在资源内容空间上的第二词嵌入向量,确定该第二网络资源库中每个网络资源与该任一样本网络资源的相似度;基于该第二网络资源库中每个网络资源与该任一样本网络资源的相似度,从该第二网络资源库中确定该任一样本网络资源的k个相似网络资源。
可选地,该第四确定模块包括:
第一提取单元,用于对于该多个第一正样本数据中的任一第一正样本数据,分别提取该任一第一正样本数据包括的第一样本网络资源和该第一样本网络资源的正相似网络资源的显性特征;
第三确定单元,用于基于该第一样本网络资源的显性特征和隐性特征,以及该第一样本网络资源的正相似网络资源的显性特征和隐性特征,确定该任一第一正样本数据对应的第二正样本数据;
第二提取单元,用于对于该多个第一负样本数据中的任一第一负样本数据,分别提取该任一第一负样本数据包括的第二样本网络资源和该第二样本网络资源的负相似网络资源的显性特征;
第四确定单元,用于基于该第二样本网络资源的显性特征和隐性特征,以及该第二样本网络资源的负相似网络资源的显性特征和隐性特征,确定该任一第一负样本数据对应的第二负样本数据。
可选地,该第三确定单元用于:
将该第一样本网络资源的显性特征和隐性特征,以及该第一样本网络资源的正相似网络资源的显性特征和隐性特征,确定为该任一第一正样本数据对应的第二正样本数据;
将该第一样本网络资源的统计特征和该第一样本网络资源的正相似网络资源的统计特征进行对比处理,得到该第一样本网络资源的正相似网络资源与该第一样本网络资源之间的对比特征;将该第一样本网络资源的显性特征和隐性特征,该第一样本网络资源的正相似网络资源的显性特征和隐性特征,以及该第一样本网络资源的正相似网络资源与该第一样本网络资源之间的对比特征,确定为该任一第一正样本数据对应的第二正样本数据。
可选地,该第四确定单元用于:
将该第二样本网络资源的显性特征和隐性特征,以及该第二样本网络资源的负相似网络资源的显性特征和隐性特征,确定为该任一第一负样本数据对应的第二负样本数据;
将该第二样本网络资源的统计特征和该第二样本网络资源的正相似网络资源的统计特征进行对比处理,得到该第二样本网络资源的负相似网络资源与该第二样本网络资源之间的对比特征;将该第二样本网络资源的显性特征和隐性特征,该第二样本网络资源的负相似网络资源的显性特征和隐性特征,以及该第二样本网络资源的负相似网络资源与该第二样本网络资源之间的对比特征,确定为该任一第一负样本数据对应的第二负样本数据。
本申请实施例中,对于用户浏览过的参考网络资源,可以获取参考网络资源的显性特征和隐性特征,基于参考网络资源的显性特征和隐性特征,以及第一网络资源库中每个网络资源的显性特征和隐性特征,通过关联模型,确定第一网络资源库中的每个网络资源与该参考网络资源之间的相似度,然后基于第一网络资源库中的每个网络资源与该参考网络资源之间的相似度,为用户进行资源推荐。由于显性特征包括属性特征和统计特征,隐性特征是指映射到隐含空间的向量表示,因此,本申请可以结合网络资源的属性特征、统计特征和隐性特征,来评估任意两个样本网络资源的相似度,然后基于网络资源的相似度进行资源推荐,如此使得相似性的评估更加全面和准确,提高了确定网络资源相似性的准确度,进而提高了推荐准确度。
需要说明的是:上述实施例提供的一种网络资源的推荐装置在进行网络资源的推荐时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的一种网络资源的推荐装置与一种网络资源的推荐方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图5是本申请实施例提供的一种服务器500的结构示意图,该服务器500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processingunits,CPU)501和一个或一个以上的存储器502,其中,所述存储器502中存储有至少一条指令,所述至少一条指令由所述处理器501加载并执行以实现上述各个方法实施例提供的网络资源的推荐方法。当然,该服务器500还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器500还可以包括其他用于实现设备功能的部件,在此不做赘述。
在一些实施例中,还提供了一种计算机可读存储介质,该存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现上述实施例中网络资源的推方法。例如,所述计算机可读存储介质可以是ROM、RAM、CD-ROM、磁带、软盘和光数据存储设备等。
值得注意的是,本申请提到的计算机可读存储介质可以为非易失性存储介质,换句话说,可以是非瞬时性存储介质。
应当理解的是,实现上述实施例的全部或部分步骤可以通过软件、硬件、固件或者其任意结合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。所述计算机指令可以存储在上述计算机可读存储介质中。
也即是,在一些实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述所述的网络资源的推荐方法。
以上所述为本申请提供的实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (24)
1.一种网络资源的推荐方法,其特征在于,所述方法包括:
获取参考网络资源的显性特征和隐性特征,所述显性特征包括属性特征和统计特征,所述隐性特征是指映射到隐含空间的向量表示,所述参考网络资源为用户浏览过的网络资源;
基于所述参考网络资源的显性特征和隐性特征,以及第一网络资源库中每个网络资源的显性特征和隐性特征,通过关联模型,确定所述第一网络资源库中的每个网络资源与所述参考网络资源之间的相似度,所述关联模型用于确定任意两个网络资源之间的相似度;
基于所述第一网络资源库中的每个网络资源与所述参考网络资源之间的相似度,为所述用户进行资源推荐。
2.根据权利要求1所述的方法,其特征在于,所述获取所述参考网络资源的隐性特征,包括:
将所述参考网络资源映射到浏览行为空间中,得到所述参考网络资源的第一词嵌入向量,将所述参考网络资源的第一词嵌入向量,确定为所述参考网络资源的隐性特征;或者,
将所述参考网络资源映射到浏览行为空间中,得到所述参考网络资源的第一词嵌入向量;将所述参考网络资源映射到资源内容空间中,得到所述参考网络资源的第二词嵌入向量;将所述参考网络资源的第一词嵌入向量和第二词嵌入向量,确定为所述参考网络资源的隐性特征。
3.根据权利要求1所述的方法,其特征在于,当所述参考网络资源为歌曲时,所述属性特征包括演唱者、所属流派、所属专辑、发行时间和演唱者所处地域中的至少一种,所述统计特征包括播放量、收藏量和评论量中的至少一种。
4.根据权利要求1所述的方法,其特征在于,所述基于所述参考网络资源的显性特征和隐性特征,以及第一网络资源库中每个网络资源的显性特征和隐性特征,通过关联模型,确定所述第一网络资源库中的每个网络资源与所述参考网络资源之间的相似度,包括:
对于所述第一网络资源库中的第一网络资源,将所述参考网络资源的显性特征和隐性特征,以及所述第一网络资源的显性特征和隐性特征作为所述关联模型的输入,通过所述关联模型确定所述第一网络资源与所述参考网络资源之间的相似度,所述第一网络资源为所述第一网络资源库中的任一网络资源。
5.根据权利要求1所述的方法,其特征在于,所述基于所述参考网络资源的显性特征和隐性特征,以及第一网络资源库中每个网络资源的显性特征和隐性特征,通过关联模型,确定所述第一网络资源库中的每个网络资源与所述参考网络资源之间的相似度,包括:
将所述参考网络资源的统计特征,与所述第一网络资源库中每个网络资源的统计特征进行对比处理,得到所述第一网络资源库中的每个网络资源与所述参考网络资源之间的对比特征;
对于所述第一网络资源库中的第一网络资源,将所述参考网络资源的显性特征和隐性特征,以及所述第一网络资源的显性特征、隐性特征以及与所述参考网络资源之间的对比特征作为所述关联模型的输入,通过所述关联模型确定所述第一网络资源与所述参考网络资源之间的相似度,所述第一网络资源为所述第一网络资源库中的任一网络资源。
6.根据权利要求1所述的方法,其特征在于,所述基于所述第一网络资源库中的每个网络资源与所述参考网络资源之间的相似度,为所述用户进行资源推荐,包括:
按照与所述参考网络资源之间的相似度从大到小的顺序,对所述第一网络资源库中的网络资源进行排序;
从排序结果中获取排序在前的n个网络资源,将所述排序在前的n个网络资源推荐给所述用户,n为正整数。
7.根据权利要求1所述的方法,其特征在于,所述基于所述参考网络资源的显性特征和隐性特征,以及第一网络资源库中每个网络资源的显性特征和隐性特征,通过关联模型,确定所述第一网络资源库中的每个网络资源与所述参考网络资源之间的相似度之前,还包括:
获取多个样本网络资源的隐性特征,所述样本网络资源为样本用户浏览过的网络资源;
根据所述多个样本网络资源中每个样本网络资源的隐性特征,从第二网络资源库中确定每个样本网络资源的k个相似网络资源,所述k为大于1的整数;
基于所述多个样本网络资源中每个样本网络资源的k个相似网络资源的关联推荐结果,确定多个第一正样本数据和多个第一负样本数据;
其中,每个第一正样本数据包括第一样本网络资源和所述第一样本网络资源的一个正相似网络资源,每个第一负样本数据包括第二样本网络资源和所述第二样本网络资源的一个负相似网络资源,所述第一样本网络资源和所述第二样本网络资源均为所述多个样本网络资源中的任一个,所述正相似网络资源是指所述第一样本网络资源的k个相似网络资源中在推荐给用户后被用户接受的相似网络资源,所述负相似网络资源是指所述第二样本网络资源的k个相似网络资源中在推荐给用户后未被用户接受的相似网络资源;
基于所述多个第一正样本数据和多个第一负样本数据,确定多个第二正样本数据和多个第二负样本数据;
其中,每个第二正样本数据包括所述第一样本网络资源的显性特征和隐性特征,以及所述第一样本网络资源的一个正相似网络资源的显性特征和隐性特征,每个第二负样本数据包括所述第二样本网络资源的显性特征和隐性特征,以及所述第二样本网络资源的一个负相似网络资源的显性特征和隐性特征;
基于所述多个第二正样本数据和所述多个第二负样本数据,对待训练关联模型进行训练,得到所述关联模型。
8.根据权利要求7所述的方法,其特征在于,所述根据所述多个样本网络资源中每个样本网络资源的隐性特征,从第二网络资源库中确定每个样本网络资源的k个相似网络资源,包括:
对于所述多个样本网络资源中的任一样本网络资源,根据所述任一样本网络资源在浏览行为空间上的第一词嵌入向量,以及所述第二网络资源库中每个网络资源在浏览行为空间上的第一词嵌入向量,确定所述第二网络资源库中每个网络资源与所述任一样本网络资源的相似度;基于所述第二网络资源库中每个网络资源与所述任一样本网络资源的相似度,从所述第二网络资源库中确定所述任一样本网络资源的k个相似网络资源;或者,
对于所述多个样本网络资源中的任一样本网络资源,根据所述任一样本网络资源在资源内容空间上的第二词嵌入向量,以及所述第二网络资源库中每个网络资源在资源内容空间上的第二词嵌入向量,确定所述第二网络资源库中每个网络资源与所述任一样本网络资源的相似度;基于所述第二网络资源库中每个网络资源与所述任一样本网络资源的相似度,从所述第二网络资源库中确定所述任一样本网络资源的k个相似网络资源。
9.根据权利要求7所述的方法,其特征在于,所述基于所述多个第一正样本数据和多个第一负样本数据,确定多个第二正样本数据和多个第二负样本数据,包括:
对于所述多个第一正样本数据中的任一第一正样本数据,分别提取所述任一第一正样本数据包括的所述第一样本网络资源和所述第一样本网络资源的正相似网络资源的显性特征;基于所述第一样本网络资源的显性特征和隐性特征,以及所述第一样本网络资源的正相似网络资源的显性特征和隐性特征,确定所述任一第一正样本数据对应的第二正样本数据;
对于所述多个第一负样本数据中的任一第一负样本数据,分别提取所述任一第一负样本数据包括的所述第二样本网络资源和所述第二样本网络资源的负相似网络资源的显性特征;基于所述第二样本网络资源的显性特征和隐性特征,以及所述第二样本网络资源的负相似网络资源的显性特征和隐性特征,确定所述任一第一负样本数据对应的第二负样本数据。
10.根据权利要求9所述的方法,其特征在于,所述基于所述第一样本网络资源的显性特征和隐性特征,以及所述第一样本网络资源的正相似网络资源的显性特征和隐性特征,确定所述任一第一正样本数据对应的第二正样本数据,包括:
将所述第一样本网络资源的显性特征和隐性特征,以及所述第一样本网络资源的正相似网络资源的显性特征和隐性特征,确定为所述任一第一正样本数据对应的第二正样本数据;或者;
将所述第一样本网络资源的统计特征和所述第一样本网络资源的正相似网络资源的统计特征进行对比处理,得到所述第一样本网络资源的正相似网络资源与所述第一样本网络资源之间的对比特征;将所述第一样本网络资源的显性特征和隐性特征,所述第一样本网络资源的正相似网络资源的显性特征和隐性特征,以及所述第一样本网络资源的正相似网络资源与所述第一样本网络资源之间的对比特征,确定为所述任一第一正样本数据对应的第二正样本数据。
11.根据权利要求9所述的方法,其特征在于,所述基于所述第二样本网络资源的显性特征和隐性特征,以及所述第二样本网络资源的负相似网络资源的显性特征和隐性特征,确定所述任一第一负样本数据对应的第二负样本数据,包括:
将所述第二样本网络资源的显性特征和隐性特征,以及所述第二样本网络资源的负相似网络资源的显性特征和隐性特征,确定为所述任一第一负样本数据对应的第二负样本数据;或者;
将所述第二样本网络资源的统计特征和所述第二样本网络资源的正相似网络资源的统计特征进行对比处理,得到所述第二样本网络资源的负相似网络资源与所述第二样本网络资源之间的对比特征;将所述第二样本网络资源的显性特征和隐性特征,所述第二样本网络资源的负相似网络资源的显性特征和隐性特征,以及所述第二样本网络资源的负相似网络资源与所述第二样本网络资源之间的对比特征,确定为所述任一第一负样本数据对应的第二负样本数据。
12.一种网络资源的推荐装置,其特征在于,所述装置包括:
第一获取模块,用于获取参考网络资源的显性特征和隐性特征,所述显性特征包括属性特征和统计特征,所述隐性特征是指映射到隐含空间的向量表示,所述参考网络资源为用户浏览过的网络资源;
第一确定模块,用于基于所述参考网络资源的显性特征和隐性特征,以及第一网络资源库中每个网络资源的显性特征和隐性特征,通过关联模型,确定所述第一网络资源库中的每个网络资源与所述参考网络资源之间的相似度,所述关联模型用于确定任意两个网络资源之间的相似度;
推荐模块,用于基于所述第一网络资源库中的每个网络资源与所述参考网络资源之间的相似度,为所述用户进行资源推荐。
13.根据权利要求12所述的装置,其特征在于,所述获取模块用于:
将所述参考网络资源映射到浏览行为空间中,得到所述参考网络资源的第一词嵌入向量,将所述参考网络资源的第一词嵌入向量,确定为所述参考网络资源的隐性特征;或者,
将所述参考网络资源映射到浏览行为空间中,得到所述参考网络资源的第一词嵌入向量;将所述参考网络资源映射到资源内容空间中,得到所述参考网络资源的第二词嵌入向量;将所述参考网络资源的第一词嵌入向量和第二词嵌入向量,确定为所述参考网络资源的隐性特征。
14.根据权利要求12所述的装置,其特征在于,当所述参考网络资源为歌曲时,所述属性特征包括演唱者、所属流派、所属专辑、发行时间和演唱者所处地域中的至少一种,所述统计特征包括播放量、收藏量和评论量中的至少一种。
15.根据权利要求12所述的装置,其特征在于,所述第一确定模块用于:
对于所述第一网络资源库中的第一网络资源,将所述参考网络资源的显性特征和隐性特征,以及所述第一网络资源的显性特征和隐性特征作为所述关联模型的输入,通过所述关联模型确定所述第一网络资源与所述参考网络资源之间的相似度,所述第一网络资源为所述第一网络资源库中的任一网络资源。
16.根据权利要求12所述的装置,其特征在于,所述第一确定模块用于:
将所述参考网络资源的统计特征,与所述第一网络资源库中每个网络资源的统计特征进行对比处理,得到所述第一网络资源库中的每个网络资源与所述参考网络资源之间的对比特征;
对于所述第一网络资源库中的第一网络资源,将所述参考网络资源的显性特征和隐性特征,以及所述第一网络资源的显性特征、隐性特征以及与所述参考网络资源之间的对比特征作为所述关联模型的输入,通过所述关联模型确定所述第一网络资源与所述参考网络资源之间的相似度,所述第一网络资源为所述第一网络资源库中的任一网络资源。
17.根据权利要求12所述的装置,其特征在于,所述推荐模块用于:
按照与所述参考网络资源之间的相似度从大到小的顺序,对所述第一网络资源库中的网络资源进行排序;
从排序结果中获取排序在前的n个网络资源,将所述排序在前的n个网络资源推荐给所述用户,n为正整数。
18.根据权利要求12所述的装置,其特征在于,所述装置还包括:
第二获取模块,用于获取多个样本网络资源的隐性特征,所述样本网络资源为样本用户浏览过的网络资源;
第二确定模块,用于根据所述多个样本网络资源中每个样本网络资源的隐性特征,从第二网络资源库中确定每个样本网络资源的k个相似网络资源,所述k为大于1的整数;
第三确定模块,用于基于所述多个样本网络资源中每个样本网络资源的k个相似网络资源的关联推荐结果,确定多个第一正样本数据和多个第一负样本数据;
第四确定模块,用于基于所述多个第一正样本数据和多个第一负样本数据,确定多个第二正样本数据和多个第二负样本数据;
其中,每个第一正样本数据包括第一样本网络资源和所述第一样本网络资源的一个正相似网络资源,每个第一负样本数据包括第二样本网络资源和所述第二样本网络资源的一个负相似网络资源,所述第一样本网络资源和所述第二样本网络资源均为所述多个样本网络资源中的任一个,所述正相似网络资源是指所述第一样本网络资源的k个相似网络资源中在推荐给用户后被用户接受的相似网络资源,所述负相似网络资源是指所述第二样本网络资源的k个相似网络资源中在推荐给用户后未被用户接受的相似网络资源;其中,每个第二正样本数据包括所述第一样本网络资源的显性特征和隐性特征,以及所述第一样本网络资源的一个正相似网络资源的显性特征和隐性特征,每个第二负样本数据包括所述第二样本网络资源的显性特征和隐性特征,以及所述第二样本网络资源的一个负相似网络资源的显性特征和隐性特征;
训练模块,用于基于所述多个第二正样本数据和所述多个第二负样本数据,对待训练关联模型进行训练,得到所述关联模型。
19.根据权利要求18所述的装置,其特征在于,所述第二确定模块包括:
第一确定单元,用于对于所述多个样本网络资源中的任一样本网络资源,根据所述任一样本网络资源在浏览行为空间上的第一词嵌入向量,以及所述第二网络资源库中每个网络资源在浏览行为空间上的第一词嵌入向量,确定所述第二网络资源库中每个网络资源与所述任一样本网络资源的相似度;基于所述第二网络资源库中每个网络资源与所述任一样本网络资源的相似度,从所述第二网络资源库中确定所述任一样本网络资源的k个相似网络资源;
第二确定单元,用于对于所述多个样本网络资源中的任一样本网络资源,根据所述任一样本网络资源在资源内容空间上的第二词嵌入向量,以及所述第二网络资源库中每个网络资源在资源内容空间上的第二词嵌入向量,确定所述第二网络资源库中每个网络资源与所述任一样本网络资源的相似度;基于所述第二网络资源库中每个网络资源与所述任一样本网络资源的相似度,从所述第二网络资源库中确定所述任一样本网络资源的k个相似网络资源。
20.根据权利要求18所述的装置,其特征在于,所述第四确定模块包括:
第一提取单元,用于对于所述多个第一正样本数据中的任一第一正样本数据,分别提取所述任一第一正样本数据包括的第一样本网络资源和所述第一样本网络资源的正相似网络资源的显性特征;
第三确定单元,用于基于所述第一样本网络资源的显性特征和隐性特征,以及所述第一样本网络资源的正相似网络资源的显性特征和隐性特征,确定所述任一第一正样本数据对应的第二正样本数据;
第二提取单元,用于对于所述多个第一负样本数据中的任一第一负样本数据,分别提取所述任一第一负样本数据包括的第二样本网络资源和所述第二样本网络资源的负相似网络资源的显性特征;
第四确定单元,用于基于所述第二样本网络资源的显性特征和隐性特征,以及所述第二样本网络资源的负相似网络资源的显性特征和隐性特征,确定所述任一第一负样本数据对应的第二负样本数据。
21.根据权利要求20所述的装置,其特征在于,所述第三确定单元用于:
将所述第一样本网络资源的显性特征和隐性特征,以及所述第一样本网络资源的正相似网络资源的显性特征和隐性特征,确定为所述任一第一正样本数据对应的第二正样本数据;
将所述第一样本网络资源的统计特征和所述第一样本网络资源的正相似网络资源的统计特征进行对比处理,得到所述第一样本网络资源的正相似网络资源与所述第一样本网络资源之间的对比特征;将所述第一样本网络资源的显性特征和隐性特征,所述第一样本网络资源的正相似网络资源的显性特征和隐性特征,以及所述第一样本网络资源的正相似网络资源与所述第一样本网络资源之间的对比特征,确定为所述任一第一正样本数据对应的第二正样本数据。
22.根据权利要求20所述的装置,其特征在于,所述第四确定单元用于:
将所述第二样本网络资源的显性特征和隐性特征,以及所述第二样本网络资源的负相似网络资源的显性特征和隐性特征,确定为所述任一第一负样本数据对应的第二负样本数据;
将所述第二样本网络资源的统计特征和所述第二样本网络资源的正相似网络资源的统计特征进行对比处理,得到所述第二样本网络资源的负相似网络资源与所述第二样本网络资源之间的对比特征;将所述第二样本网络资源的显性特征和隐性特征,所述第二样本网络资源的负相似网络资源的显性特征和隐性特征,以及所述第二样本网络资源的负相似网络资源与所述第二样本网络资源之间的对比特征,确定为所述任一第一负样本数据对应的第二负样本数据。
23.一种服务器,其特征在于,所述服务器包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集由所述处理器加载并执行以实现如权利要求1至11任一所述的一种网络资源的推荐方法。
24.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集由处理器加载并执行以实现如权利要求1至11任一所述的一种网络资源的推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910867402.4A CN110569447B (zh) | 2019-09-12 | 2019-09-12 | 一种网络资源的推荐方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910867402.4A CN110569447B (zh) | 2019-09-12 | 2019-09-12 | 一种网络资源的推荐方法、装置及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110569447A true CN110569447A (zh) | 2019-12-13 |
CN110569447B CN110569447B (zh) | 2022-03-15 |
Family
ID=68779853
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910867402.4A Active CN110569447B (zh) | 2019-09-12 | 2019-09-12 | 一种网络资源的推荐方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110569447B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111581505A (zh) * | 2020-04-28 | 2020-08-25 | 海南太美航空股份有限公司 | 基于组合推荐的航班推荐方法及*** |
CN112685648A (zh) * | 2021-01-21 | 2021-04-20 | 深圳市欢太科技有限公司 | 一种资源推荐方法、电子设备及计算机可读存储介质 |
Citations (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101370055A (zh) * | 2008-09-24 | 2009-02-18 | 中国电信股份有限公司 | 个性化回铃音推荐信息的推送方法、平台及*** |
CN106600052A (zh) * | 2016-12-12 | 2017-04-26 | 西安交通大学 | 一种基于时空轨迹的用户属性与社会网络检测*** |
CN107133277A (zh) * | 2017-04-12 | 2017-09-05 | 浙江大学 | 一种基于动态主题模型和矩阵分解的旅游景点推荐方法 |
CN107391575A (zh) * | 2017-06-20 | 2017-11-24 | 浙江理工大学 | 一种基于词向量模型的隐式特征识别方法 |
CN107609116A (zh) * | 2017-09-13 | 2018-01-19 | 星环信息科技(上海)有限公司 | 一种创建跨域迁移深度网络的方法及设备 |
CN107729509A (zh) * | 2017-10-23 | 2018-02-23 | 中国电子科技集团公司第二十八研究所 | 基于隐性高维分布式特征表示的篇章相似度判定方法 |
CN107908701A (zh) * | 2017-11-06 | 2018-04-13 | 广东欧珀移动通信有限公司 | 音乐推荐的方法、装置、存储介质及终端设备 |
CN108205537A (zh) * | 2016-12-16 | 2018-06-26 | 北京酷我科技有限公司 | 一种视频推荐方法及*** |
WO2018121156A1 (zh) * | 2016-12-30 | 2018-07-05 | 华为技术有限公司 | 一种应用程序排序的方法及装置 |
CN108536856A (zh) * | 2018-04-17 | 2018-09-14 | 重庆邮电大学 | 基于双边网络结构的混合协同过滤电影推荐模型 |
CN108647273A (zh) * | 2018-04-28 | 2018-10-12 | 北京百度网讯科技有限公司 | 交友推荐方法及装置 |
CN108984731A (zh) * | 2018-07-12 | 2018-12-11 | 腾讯音乐娱乐科技(深圳)有限公司 | 歌单推荐方法、装置及存储介质 |
CN109547814A (zh) * | 2018-12-13 | 2019-03-29 | 北京达佳互联信息技术有限公司 | 视频推荐方法、装置、服务器及存储介质 |
CN109543066A (zh) * | 2018-10-31 | 2019-03-29 | 北京达佳互联信息技术有限公司 | 视频推荐方法、装置和计算机可读存储介质 |
CN109684510A (zh) * | 2018-10-31 | 2019-04-26 | 北京达佳互联信息技术有限公司 | 视频排序方法、装置、电子设备及存储介质 |
CN109871858A (zh) * | 2017-12-05 | 2019-06-11 | 北京京东尚科信息技术有限公司 | 预测模型建立、对象推荐方法及***、设备及存储介质 |
CN110008399A (zh) * | 2019-01-30 | 2019-07-12 | 阿里巴巴集团控股有限公司 | 一种推荐模型的训练方法及装置、一种推荐方法及装置 |
CN110046952A (zh) * | 2019-01-30 | 2019-07-23 | 阿里巴巴集团控股有限公司 | 一种推荐模型的训练方法及装置、一种推荐方法及装置 |
CN110162703A (zh) * | 2019-05-13 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 内容推荐方法、训练方法、装置、设备及存储介质 |
-
2019
- 2019-09-12 CN CN201910867402.4A patent/CN110569447B/zh active Active
Patent Citations (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101370055A (zh) * | 2008-09-24 | 2009-02-18 | 中国电信股份有限公司 | 个性化回铃音推荐信息的推送方法、平台及*** |
CN106600052A (zh) * | 2016-12-12 | 2017-04-26 | 西安交通大学 | 一种基于时空轨迹的用户属性与社会网络检测*** |
CN108205537A (zh) * | 2016-12-16 | 2018-06-26 | 北京酷我科技有限公司 | 一种视频推荐方法及*** |
WO2018121156A1 (zh) * | 2016-12-30 | 2018-07-05 | 华为技术有限公司 | 一种应用程序排序的方法及装置 |
CN108279954A (zh) * | 2016-12-30 | 2018-07-13 | 华为技术有限公司 | 一种应用程序排序的方法及装置 |
CN107133277A (zh) * | 2017-04-12 | 2017-09-05 | 浙江大学 | 一种基于动态主题模型和矩阵分解的旅游景点推荐方法 |
CN107391575A (zh) * | 2017-06-20 | 2017-11-24 | 浙江理工大学 | 一种基于词向量模型的隐式特征识别方法 |
CN107609116A (zh) * | 2017-09-13 | 2018-01-19 | 星环信息科技(上海)有限公司 | 一种创建跨域迁移深度网络的方法及设备 |
CN107729509A (zh) * | 2017-10-23 | 2018-02-23 | 中国电子科技集团公司第二十八研究所 | 基于隐性高维分布式特征表示的篇章相似度判定方法 |
CN107908701A (zh) * | 2017-11-06 | 2018-04-13 | 广东欧珀移动通信有限公司 | 音乐推荐的方法、装置、存储介质及终端设备 |
CN109871858A (zh) * | 2017-12-05 | 2019-06-11 | 北京京东尚科信息技术有限公司 | 预测模型建立、对象推荐方法及***、设备及存储介质 |
CN108536856A (zh) * | 2018-04-17 | 2018-09-14 | 重庆邮电大学 | 基于双边网络结构的混合协同过滤电影推荐模型 |
CN108647273A (zh) * | 2018-04-28 | 2018-10-12 | 北京百度网讯科技有限公司 | 交友推荐方法及装置 |
CN108984731A (zh) * | 2018-07-12 | 2018-12-11 | 腾讯音乐娱乐科技(深圳)有限公司 | 歌单推荐方法、装置及存储介质 |
CN109543066A (zh) * | 2018-10-31 | 2019-03-29 | 北京达佳互联信息技术有限公司 | 视频推荐方法、装置和计算机可读存储介质 |
CN109684510A (zh) * | 2018-10-31 | 2019-04-26 | 北京达佳互联信息技术有限公司 | 视频排序方法、装置、电子设备及存储介质 |
CN109547814A (zh) * | 2018-12-13 | 2019-03-29 | 北京达佳互联信息技术有限公司 | 视频推荐方法、装置、服务器及存储介质 |
CN110008399A (zh) * | 2019-01-30 | 2019-07-12 | 阿里巴巴集团控股有限公司 | 一种推荐模型的训练方法及装置、一种推荐方法及装置 |
CN110046952A (zh) * | 2019-01-30 | 2019-07-23 | 阿里巴巴集团控股有限公司 | 一种推荐模型的训练方法及装置、一种推荐方法及装置 |
CN110162703A (zh) * | 2019-05-13 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 内容推荐方法、训练方法、装置、设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
王智圣 等: "基于隐式用户反馈数据流的实时个性化推荐", 《计算机学报》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111581505A (zh) * | 2020-04-28 | 2020-08-25 | 海南太美航空股份有限公司 | 基于组合推荐的航班推荐方法及*** |
CN111581505B (zh) * | 2020-04-28 | 2023-07-07 | 海南太美航空股份有限公司 | 基于组合推荐的航班推荐方法及*** |
CN112685648A (zh) * | 2021-01-21 | 2021-04-20 | 深圳市欢太科技有限公司 | 一种资源推荐方法、电子设备及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110569447B (zh) | 2022-03-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107832434B (zh) | 基于语音交互生成多媒体播放列表的方法和装置 | |
CN108921221B (zh) | 用户特征的生成方法、装置、设备及存储介质 | |
KR102281863B1 (ko) | 머신 학습을 이용한 라이브-스트림 콘텐츠의 추천 | |
CN106326391B (zh) | 多媒体资源推荐方法及装置 | |
KR102068790B1 (ko) | 컴퓨터 실행 방법, 시스템 및 컴퓨터 판독 가능 매체 | |
WO2017096877A1 (zh) | 一种推荐方法和装置 | |
CN110149540B (zh) | 多媒体资源的推荐处理方法、装置、终端及可读介质 | |
CN109511015B (zh) | 多媒体资源推荐方法、装置、存储介质及设备 | |
CN108776676B (zh) | 信息推荐方法、装置、计算机可读介质及电子设备 | |
CN109165302A (zh) | 多媒体文件推荐方法及装置 | |
CN112052387B (zh) | 一种内容推荐方法、装置和计算机可读存储介质 | |
CN107832437A (zh) | 音/视频推送方法、装置、设备及存储介质 | |
CN109753601B (zh) | 推荐信息点击率确定方法、装置及电子设备 | |
US20220107978A1 (en) | Method for recommending video content | |
CN111858969B (zh) | 多媒体数据推荐方法、装置、计算机设备和存储介质 | |
CN113779381B (zh) | 资源推荐方法、装置、电子设备和存储介质 | |
CN111368141B (zh) | 视频标签的扩展方法、装置、计算机设备和存储介质 | |
CN111314732A (zh) | 确定视频标签的方法、服务器及存储介质 | |
CN111159563A (zh) | 用户兴趣点信息的确定方法、装置、设备及存储介质 | |
CN111930974A (zh) | 一种音视频类型的推荐方法、装置、设备及存储介质 | |
CN110569447B (zh) | 一种网络资源的推荐方法、装置及存储介质 | |
CN114845149B (zh) | 视频片段的剪辑方法、视频推荐方法、装置、设备及介质 | |
CN113672758A (zh) | 歌单生成方法、装置、介质和计算设备 | |
CN113537215A (zh) | 一种视频标签标注的方法及设备 | |
CN113407775A (zh) | 视频搜索方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20230524 Address after: 518000 Room 201, building A, 1 front Bay Road, Shenzhen Qianhai cooperation zone, Shenzhen, Guangdong Patentee after: TENCENT MUSIC ENTERTAINMENT (SHENZHEN) Co.,Ltd. Address before: 518000 Room 201, building A, 1 front Bay Road, Shenzhen Qianhai cooperation zone, Shenzhen, Guangdong Patentee before: TENCENT MUSIC ENTERTAINMENT TECHNOLOGY (SHENZHEN) Co.,Ltd. |
|
TR01 | Transfer of patent right |