CN117216365A - 资源推荐的兴趣向量生成方法、装置、设备及存储介质 - Google Patents

资源推荐的兴趣向量生成方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN117216365A
CN117216365A CN202211612006.5A CN202211612006A CN117216365A CN 117216365 A CN117216365 A CN 117216365A CN 202211612006 A CN202211612006 A CN 202211612006A CN 117216365 A CN117216365 A CN 117216365A
Authority
CN
China
Prior art keywords
sample
sample object
vector
interest
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211612006.5A
Other languages
English (en)
Inventor
吴焕钦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202211612006.5A priority Critical patent/CN117216365A/zh
Publication of CN117216365A publication Critical patent/CN117216365A/zh
Pending legal-status Critical Current

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例公开了一种资源推荐的兴趣向量生成方法、装置、设备及存储介质,该方法包括:获取多个样本对象的多个样本数据,样本数据包括样本对象标识向量序列以及样本对象行为向量序列;基于样本对象标识向量序列和样本对象行为向量序列生成对应的样本输入向量序列,并基于样本对象行为向量序列获取兴趣类目序列;将样本输入向量序列和兴趣类目序列输入兴趣向量生成模型进行训练;当获取到目标对象的目标对象标识时,基于目标对象标识生成目标对象标识向量序列并输入兴趣向量生成模型以输出目标对象的目标兴趣类目向量序列,目标兴趣类目向量序列用于目标对象的兴趣资源推荐。采用本申请,提高生成对象的多个兴趣向量的准确性,适用性高。

Description

资源推荐的兴趣向量生成方法、装置、设备及存储介质
技术领域
本申请涉及互联网技术领域,尤其涉及一种资源推荐的兴趣向量生成方法、装置、设备以及存储介质。
背景技术
随着智能手机、平板电脑等终端的功能日益强大,应用于智能手机、平板电脑等终端上的应用程序(或简称应用)的功能也随之日益丰富多样,人们可以通过应用获取自己感兴趣的信息,信息的多样化给终端用户带来了丰富多样的用户体验。如今,应用随着科技进步变得更加人性化,为了给终端用户带来更好的体验感受,各大应用针对终端用户的多媒体资源推荐也更加个性化。
一般来说,应用可以将用户对各类多媒体资源的历史行为记录进行整合,以根据用户的历史行为记录确定用户感兴趣的兴趣类别,通过兴趣类别的差异可以对不同用户进行表征,以在用户集合中对兴趣类别相近的用户进行匹配。然而,由于存在热点现象,大多数用户都会点击或者浏览热门的多媒体资源,即不同用户的历史行为记录的差异性较小,应用根据历史行为记录得到的不同用户的兴趣类别相近,降低了通过兴趣类别表征用户的准确性。
发明内容
本申请实施例提供一种资源推荐的兴趣向量生成方法、装置、计算机设备以及计算机可读存储介质,可以提高多个兴趣向量表征对象的准确性,适用性高。
第一方面,本申请实施例提供了一种资源推荐的兴趣向量生成方法,该方法包括:
获取多个样本对象对应的多个样本数据,其中,任一样本对象对应的样本数据中包括样本对象标识向量序列以及样本对象行为向量序列,上述任一样本对象对应的上述样本对象标识向量序列中包括基于上述任一样本对象的样本对象标识生成的多个样本对象标识向量;
基于上述任一样本对象对应的上述样本对象标识向量序列和上述样本对象行为向量序列生成上述任一样本对象对应的样本输入向量序列,并基于上述任一样本对象对应的上述样本对象行为向量序列获取兴趣类目序列,上述兴趣类目序列中包括的类目数量与上述样本对象标识向量序列中包括的向量数量相同;
将上述多个样本对象中各个样本对象对应的样本输入向量序列和兴趣类目序列输入兴趣向量生成模型,基于上述各个样本对象对应的上述样本输入向量序列及其对应的兴趣类目序列对上述兴趣向量生成模型进行训练,以使上述兴趣向量生成模型获得基于输入的任一对象的对象标识向量序列生成上述任一对象的兴趣类目向量序列的能力;
当获取到目标对象的目标对象标识时,基于上述目标对象标识生成上述目标对象对应的目标对象标识向量序列并输入上述兴趣向量生成模型,通过上述兴趣向量生成模型基于上述目标对象标识向量序列输出上述目标对象的目标兴趣类目向量序列,上述目标兴趣类目向量序列用于上述目标对象的兴趣资源推荐。
在一种可能的实现方式中,上述基于上述各个样本对象对应的上述样本输入向量序列及其对应的兴趣类目序列对上述兴趣向量生成模型进行训练包括:
基于上述各个样本对象对应的上述样本输入向量序列及其对应的兴趣类目序列训练上述兴趣向量生成模型的第一损失函数;
对上述各个样本对象对应的上述样本输入向量序列中的样本对象行为向量序列进行对象行为向量标记以生成上述各个样本对象的样本对象行为向量标记序列,基于上述样本输入向量序列、上述各个样本对象对应的上述样本输入向量序列中的上述样本对象标识向量序列和上述样本对象行为向量标记序列训练上述兴趣向量生成模型的第二损失函数;
基于上述第一损失函数和上述第二损失函数生成上述兴趣向量生成模型的损失函数,以使上述兴趣向量生成模型基于上述损失函数获得输入的任一对象的对象标识向量序列输出上述任一对象的兴趣类目向量序列。
在一种可能的实现方式中,上述对上述各个样本对象对应的上述样本输入向量序列中的样本对象行为向量序列进行对象行为标记以生成上述各个样本对象的样本对象行为向量标记序列,基于上述样本输入向量序列、上述各个样本对象对应的上述样本输入向量序列中的上述样本对象标识向量序列和上述样本对象行为向量标记序列训练上述兴趣向量生成模型的第二损失函数包括:
将上述各个样本对象对应的上述样本对象行为向量序列中包括的部分样本对象行为向量标记为目标符号以生成上述各个样本对象的样本对象行为向量标记序列;
将上述各个样本对象对应的上述样本输入向量序列中的上述样本对象标识向量序列和上述样本对象行为向量标记序列进行拼接以生成上述各个样本对象的样本标记输入向量序列;
基于上述各个样本对象的样本标记输入向量序列和上述样本输入向量序列训练上述兴趣向量生成模型的第二损失函数。
在一种可能的实现方式中,上述获取多个样本对象对应的多个样本数据包括:
获取上述多个样本对象中任一样本对象的任一样本对象标识,基于多个哈希函数对上述任一样本对象标识进行哈希计算以获取上述任一样本对象标识对应的多个样本对象扩展标识;
基于上述多个样本对象扩展标识从对象标识向量集合中确定出各个样本对象扩展标识对应的样本对象标识向量,以得到上述多个样本对象扩展标识对应的多个样本对象标识向量;
基于上述多个样本对象标识向量生成上述任一样本对象对应的上述样本对象标识向量序列,以得到上述各个样本对象对应的样本对象标识向量序列。
在一种可能的实现方式中,上述获取多个样本对象对应的多个样本数据还包括:
获取上述多个样本对象中任一样本对象的多个样本对象行为数据,基于上述多个样本对象行为数据从对象行为向量集合中确定出各个样本对象行为数据对应的样本对象行为向量,以得到上述多个样本对象行为数据对应的多个样本对象行为向量;
基于上述多个样本对象行为向量生成上述任一样本对象对应的上述样本对象行为向量序列,以得到上述各个样本对象对应的样本对象行为向量序列。
在一种可能的实现方式中,上述基于上述任一样本对象对应的上述样本对象行为向量序列获取兴趣类目序列包括:
获取任一样本对象对应的上述样本对象行为向量序列中各个样本对象行为向量的行为属性特征,上述行为属性特征包括资源观看时长特征、或者资源操作频次特征中的至少一种;
基于上述各个样本对象行为向量的行为属性特征,从上述样本对象行为向量序列中包括的所有样本对象行为向量中确定出行为属性特征的取值较大的K个样本对象行为向量;
将上述K个样本对象行为向量对应的资源类目确定为上述任一样本对象对应的K个兴趣类目,并基于上述K个兴趣类目生成上述任一样本对象对应的兴趣类目序列,其中K为正整数。
第二方面,本申请实施例还提供了一种资源推荐的兴趣向量生成装置,该装置包括:
获取模块,用于获取多个样本对象对应的多个样本数据,其中,任一样本对象对应的样本数据中包括样本对象标识向量序列以及样本对象行为向量序列,上述任一样本对象对应的上述样本对象标识向量序列中包括基于上述任一样本对象的样本对象标识生成的多个样本对象标识向量;
输入向量序列生成模块,用于基于上述任一样本对象对应的上述样本对象标识向量序列和上述样本对象行为向量序列生成上述任一样本对象对应的样本输入向量序列,并基于上述任一样本对象对应的上述样本对象行为向量序列获取兴趣类目序列,上述兴趣类目序列中包括的类目数量与上述样本对象标识向量序列中包括的向量数量相同;
训练模块,用于将上述多个样本对象中各个样本对象对应的样本输入向量序列和兴趣类目序列输入兴趣向量生成模型,基于上述各个样本对象对应的上述样本输入向量序列及其对应的兴趣类目序列对上述兴趣向量生成模型进行训练,以使上述兴趣向量生成模型获得基于输入的任一对象的对象标识向量序列生成上述任一对象的兴趣类目向量序列的能力;
兴趣向量序列生成模块,用于在获取到目标对象的目标对象标识时,基于上述目标对象标识生成上述目标对象对应的目标对象标识向量序列并输入上述兴趣向量生成模型,通过上述兴趣向量生成模型基于上述目标对象标识向量序列输出上述目标对象的目标兴趣类目向量序列,上述目标兴趣类目向量序列用于上述目标对象的兴趣资源推荐。
其中,上述训练模块包括:
第一网络单元,用于基于上述各个样本对象对应的上述样本输入向量序列及其对应的兴趣类目序列训练上述兴趣向量生成模型的第一损失函数;
第二网络单元,用于对上述各个样本对象对应的上述样本输入向量序列中的样本对象行为向量序列进行对象行为向量标记以生成上述各个样本对象的样本对象行为向量标记序列,基于上述样本输入向量序列、上述各个样本对象对应的上述样本输入向量序列中的上述样本对象标识向量序列和上述样本对象行为向量标记序列训练上述兴趣向量生成模型的第二损失函数;
第三网络单元,用于基于上述第一损失函数和上述第二损失函数生成上述兴趣向量生成模型的损失函数,以使上述兴趣向量生成模型基于上述损失函数获得输入的任一对象的对象标识向量序列输出上述任一对象的兴趣类目向量序列。
其中,上述第二网络单元包括:
标记子单元,用于将上述各个样本对象对应的上述样本对象行为向量序列中包括的部分样本对象行为向量标记为目标符号以生成上述各个样本对象的样本对象行为向量标记序列;
生成子单元,用于将上述各个样本对象对应的上述样本输入向量序列中的上述样本对象标识向量序列和上述样本对象行为向量标记序列进行拼接以生成上述各个样本对象的样本标记输入向量序列;
训练子单元,用于基于上述各个样本对象的样本标记输入向量序列和上述样本输入向量序列训练上述兴趣向量生成模型的第二损失函数。
其中,上述获取模块包括:
第一获取单元,用于获取上述多个样本对象中任一样本对象的任一样本对象标识,基于多个哈希函数对上述任一样本对象标识进行哈希计算以获取上述任一样本对象标识对应的多个样本对象扩展标识;
第二获取单元,用于基于上述多个样本对象扩展标识从对象标识向量集合中确定出各个样本对象扩展标识对应的样本对象标识向量,以得到上述多个样本对象扩展标识对应的多个样本对象标识向量;
第三获取单元,用于基于上述多个样本对象标识向量生成上述任一样本对象对应的上述样本对象标识向量序列,以得到上述各个样本对象对应的样本对象标识向量序列。
其中,上述获取模块还包括:
第一确定单元,获取上述多个样本对象中任一样本对象的多个样本对象行为数据,基于上述多个样本对象行为数据从对象行为向量集合中确定出各个样本对象行为数据对应的样本对象行为向量,以得到上述多个样本对象行为数据对应的多个样本对象行为向量;
第一生成单元,基于上述多个样本对象行为向量生成上述任一样本对象对应的上述样本对象行为向量序列,以得到上述各个样本对象对应的样本对象行为向量序列。
其中,上述输入向量序列生成模块包括:
第四获取单元,用于获取任一样本对象对应的上述样本对象行为向量序列中各个样本对象行为向量的行为属性特征,上述行为属性特征包括资源观看时长特征、或者资源操作频次特征中的至少一种;
第二确定单元,用于基于上述各个样本对象行为向量的行为属性特征,从上述样本对象行为向量序列中包括的所有样本对象行为向量中确定出行为属性特征的取值较大的K个样本对象行为向量;
第三确定单元,用于将上述K个样本对象行为向量对应的资源类目确定为上述任一样本对象对应的K个兴趣类目,并基于上述K个兴趣类目生成上述任一样本对象对应的兴趣类目序列,其中K为正整数。
第三方面,本申请实施例还提供了一种计算机设备,该计算机设备包括:处理器、存储器以及网络接口;
上述处理器与上述存储器、上述网络接口相连,其中,上述网络接口用于提供数据通信功能,上述存储器用于存储程序代码,上述处理器用于调用上述程序代码,以执行本申请实施例中的方法。
第四方面,本申请实施例还提供了一种计算机可读存储介质,上述计算机可读存储介质存储有计算机程序,上述计算机程序包括程序指令,上述程序指令被处理器执行时,执行本申请实施例中的方法。
本申请实施例提供的兴趣向量生成方法可以获取多个样本对象中任一样本对象的样本数据,该样本数据包括样本对象的样本对象标识向量序列以及样本对象行为向量序列。进一步的,可以基于多个样本对象中任一样本对象的样本对象标识获取多个样本对象标识向量,并基于多个样本对象标识向量获取该样本对象相应的样本对象标识向量序列。本申请实施例将任一样本对象对应的上述样本对象标识向量序列以及样本对象行为向量序列进行拼接生成样本输入序列,并将多个样本对象的多个样本输入序列输入至兴趣向量生成模型。此外,本申请实施例还可以基于上述样本对象行为向量序列获取样本对象的兴趣类目序列并传输给兴趣向量生成模型。兴趣向量生成模型可以对样本输入序列中的样本对象行为向量序列和相应的样本对象标识向量序列进行交互学习,同时基于上述兴趣类目序列对兴趣向量生成模型进行训练,以使得兴趣向量生成模型获得可以基于任一对象的对象标识向量序列生成该对象的兴趣类目向量序列的能力。本申请实施例提供的兴趣向量生成方法可以基于目标对象的目标对象标识生成目标对象对应的目标对象标识向量序列并输入兴趣向量生成模型,通过兴趣向量生成模型基于目标对象标识向量序列输出上述目标对象的目标兴趣类目向量序列,且该目标兴趣类目向量序列中包括的多个目标兴趣类目向量分别用于表征目标对象对不同资源类目的感兴趣程度。因此,本申请实施例的兴趣向量生成方法可以利用对象的对象标识生成相应的兴趣类目向量序列,以增强表征对象的多个兴趣向量的准确性,适用性高。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种***架构示意图;
图2是本申请实施例提供的资源推荐的兴趣向量生成方法的一种流程示意图;
图3是本申请实施例提供的资源推荐的兴趣向量生成方法的另一种流程示意图;
图4是本申请实施例资源推荐的兴趣向量生成方法提供的一种应用场景示意图;
图5是本申请实施例资源推荐的兴趣向量生成方法提供的另一种流程示意图;
图6是本申请实施例资源推荐的兴趣向量生成方法提供的另一种流程示意图;
图7是本申请实施例资源推荐的兴趣向量生成方法提供的另一种应用场景示意图;
图8是本申请实施例提供的资源推荐的兴趣向量生成方法的一种框架示意图;
图9是本申请实施例提供的资源推荐的兴趣向量生成装置的一种结构示意图;
图10是本申请实施例提供的计算机设备的一种结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互***、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
自然语言处理(Nature Language processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
本申请实施例提供的方案涉及人工智能的自然语言处理技术以及深度学***台等基础云计算服务的云服务器。终端设备(包括终端设备200a、终端设备200b、终端设备200c、……、终端设备200n)可以是掌上电脑、智能手机、笔记本电脑、台式计算机、平板电脑、移动互联网设备(mobile internet device,MID)、可穿戴设备(例如智能手表、智能手环等)、智能电脑、智能车载等智能终端,但并不局限于此。其中,业务服务器100与终端集群中的各终端设备可以建立通信连接,终端集群中的各终端设备之间也可建立通信连接。换句话说,业务服务器100可与终端设备200a、终端设备200b、终端设备200c、……、终端设备200n中的各终端设备建立通信连接,例如终端设备200a与业务服务器100之间可建立通信连接。终端设备200a与终端设备200b之间可建立通信连接,终端设备200a与终端设备200c之间也可建立通信连接。其中,上述通信连接不限定连接方式,可以通过有线通信方式进行直接或间接地连接,也可以通过无线通信方式进行直接或间接地连接等,具体可根据实际应用场景确定,本申请在此不做限制。
应该理解,如图1所示的终端集群中的每个终端设备均可以安装有应用客户端,当该应用客户端运行于各终端设备中时,可以分别与上述图1所示的业务服务器100之间进行数据交互,使得业务服务器100可以接收来自于每个终端设备的业务数据,或者业务服务器100向各终端设备推送业务数据(比如多媒体资源)。其中,上述应用客户端可以为新闻应用、学习应用、社交应用、即时通信应用、直播应用、短视频应用、视频应用、音乐应用、购物应用、小说应用、支付应用等具有显示文字、图像以及视频等数据信息功能的应用客户端,具体可根据实际应用场景需求确定,在此不做限制。其中,该应用客户端可以为独立的客户端,也可以为集成在某客户端(例如即时通信客户端、社交客户端等)中的嵌入式子客户端,具体可根据实际应用场景确定,在此不做限定。为方便描述,以目标客户端为例,各操作对象在通过终端设备使用目标客户端的过程中,可以通过终端设备查看、点击、收藏、分享目标应用中的多媒体资源。可以理解,上述多媒体资源可以为任意一种多媒体数据,具体可以包括但不限于音频、图片或者视频等,具体可根据实际应用场景确定,在此不做限制。业务服务器100作为多媒体资源推荐应用的服务器,可以为包括该应用客户端对应的后台服务器、数据处理服务器等多个服务器的集合。业务服务器100可以接收到来自每个终端设备的兴趣向量生成模型的多个样本对象对应的样本数据,也可以接收目标对象的目标对象标识。上述应用客户端可以为用于向操作对象推荐多媒体资源的应用客户端。具体的,该应用客户端可以接收多个样本对应的多个样本对象标识向量序列和多个样本对象行为向量序列,并基于任一样本对象的样本对象标识向量序列和样本对象行为向量序列拼接生成该样本对象对应的样本输入序列,并将多个样本对象的多个样本输入序列输入至兴趣向量生成模型。此外,该应用客户端还可以基于样本对象的样本对象行为向量序列生成相应的兴趣类目序列。上述兴趣向量生成模型可以基于样本对象对应的样本输入序列和兴趣类目序列进行训练,以获得基于任一对象的对象标识向量序列生成该对象的兴趣类目向量序列的能力。上述应用客户端可以接收目标对象的目标对象标识,并基于该目标对象标识生成目标对象的兴趣类目向量序列,应用客户端可以将目标对象的兴趣类目向量序列发送给业务服务器100,以使业务服务器100基于目标对象的兴趣类目向量序列确定向应用客户端的发送的多媒体资源。
可以理解的是,在本申请的具体实施方式中,涉及到用户信息等相关的数据,当本申请实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本申请实施例提供的资源推荐的兴趣向量生成方法(为方便描述可简称为兴趣向量生成方法或者方法)适用于基于应用程序(比如上述目标客户端)中的多媒体资源推荐。可以理解的是,上述兴趣向量生成方法所适用的终端设备包括但不限于智能手机、计算机、平板电脑、个人数码助理(personal digitalassistant,PDA)、移动互联网设备(mobileInternet device,MID)以及可穿戴设备等。可选的,终端设备也可为上述智能手机、计算机、平板电脑、PDA、MID以及可穿戴设备对应的服务器等,具体可根据实际应用场景确定,在此不做限制。对应的,本申请实施例提供的资源推荐的兴趣向量生成装置(或简称兴趣向量生成装置)包括但不限于智能手机、计算机、平板电脑、PDA、MID以及可穿戴设备等。为方便描述,本申请实施例提供的兴趣向量生成装置和/或终端设备将以智能手机(或简称手机)为例进行说明。
可以理解的是,本申请实施例提供的兴趣向量生成方法可以由如图1所示的业务服务器100执行,也可以由终端设备(如图1所示的终端设备200a、终端设备200b、……、终端设备200n中的任意一个)执行,还可以由终端设备和业务服务器共同执行,具体可根据实际应用场景确定,此处不做限制。为便于后续理解和说明,本申请实施例可以在图1所示的终端设备集群中选择一个终端设备作为目标终端设备,例如以终端设备200b作为目标终端设备。
在一些可行的实施方式中,推荐***可以接收操作对象的行为序列作为输入序列,并且通过序列建模模型基于该操作对象的行为序列将操作对象表示为连续且稠密的兴趣向量。可以理解的是,由于存在热点现象,很多操作对象都会点击或者分享相同的热点视频或者热点文章,使得很多操作对象的行为序列差异性不大,其中,操作对象的行为序列通常包括几十甚至几百个行为数据,而上述序列建模模型只能够依据操作对象对应的行为序列中包括的多个行为数据来建立操作对象的兴趣向量。由此可见,热点现象会使得序列建模模型生成的不同操作对象的兴趣向量差异性不大,导致表征操作对象的兴趣向量准确度较低,推荐***难以实现资源推荐的个性化。
可以理解的是,本申请实施例提供的资源推荐的兴趣向量生成方法可以获取多个样本对象中任一样本对象的样本数据,该样本数据包括样本对象的样本对象标识向量序列以及样本对象行为向量序列。进一步的,可以基于多个样本对象中任一样本对象的样本对象标识获取多个样本对象标识向量,并基于多个样本对象标识向量获取该样本对象相应的样本对象标识向量序列。本申请实施例将任一样本对象对应的上述样本对象标识向量序列以及样本对象行为向量序列进行拼接生成样本输入序列,并将多个样本对象的多个样本输入序列输入至兴趣向量生成模型。此外,本申请实施例还可以基于上述样本对象行为向量序列获取样本对象的兴趣类目序列并传输给兴趣向量生成模型。兴趣向量生成模型可以对样本输入序列中的样本对象行为向量序列和相应的样本对象标识向量序列进行交互学习,同时基于上述兴趣类目序列对兴趣向量生成模型进行训练,以使得兴趣向量生成模型获得可以基于任一对象的对象标识向量序列生成该对象的兴趣类目向量序列的能力。本申请实施例提供的兴趣向量生成方法可以基于目标对象的目标对象标识生成目标对象对应的目标对象标识向量序列并输入兴趣向量生成模型,通过兴趣向量生成模型基于目标对象标识向量序列输出上述目标对象的目标兴趣类目向量序列,且该目标兴趣类目向量序列中包括的多个目标兴趣类目向量分别用于表征目标对象对不同资源类目的感兴趣程度。因此,本申请实施例的兴趣向量生成方法可以利用对象的对象标识生成相应的兴趣类目向量序列,以增强表征对象的多个兴趣向量的准确性,从而实现针对不同对象的个性化多媒体资源推荐,适用性高。
本申请实施例提供的兴趣向量生成方法可以基于多个哈希函数和相应的对象标识向量集合将对象标识转换为多个对象扩展标识,并且通过结合对象的对象行为向量序列将多个对象扩展标识转换为该对象的兴趣类目向量序列,且该兴趣类目向量序列中包括的多个兴趣类目向量分别用于表征该对象对不同资源类目的感兴趣程度,因此可以有效提高通过兴趣向量表征不同对象的准确性,适用性高。本申请实施例提供的资源推荐的兴趣向量生成方法可适用于多种类型的多媒体资源推荐的应用,其中,上述针对多种类型的多媒体资源推荐的应用包括但不限于:多媒体类应用、浏览器类应用、游戏类应用、购物类应用、工具类应用、社交类应用、旅行类应用以及教育类应用等具有处理多媒体资源功能的应用客户端,在此不做限制。其中,上述同一个类型的应用中可包括多款应用,在此不做限制。例如,上述多媒体类应用可包括影视播放器、音乐播放器、摄影应用、美图应用以及音频录入应用等。上述浏览器类应用包括但不限于QQ浏览器。上述游戏类应用包括但不限于王者荣耀、QQ飞车等。上述购物类应用包括但不限于影视购票应用、美食订位应用以及生活必需品购置应用等。上述工具类应用包括但不限于文件编辑、邮件、闹钟、日历、相册、设置以及指南针等。上述社交应用类包括但不限于微信以及QQ等。上述旅行类应用包括铁路12306、滴滴出行以及携程旅行等。上述教育类应用包括但不限于微信阅读以及QQ阅读等。
进一步的,请参阅图2,图2是本申请实施例提供的资源推荐的兴趣向量生成方法的一种流程示意图。为了便于理解,本申请实施例以终端设备为例进行说明,即以图2中的终端设备200b为例进行叙述,业务服务器可以为上述图1所对应实施例的业务服务器100。本申请实施例可应用于各种场景,包括但不限于云技术、人工智能等。在图2所示的资源推荐的兴趣向量生成方法中,兴趣向量生成的各个步骤可由上述图1中的终端设备200b上来执行,如图2所示,该兴趣向量生成方法至少可以包括以下步骤S101-步骤S104。
步骤S101、获取多个样本对象对应的多个样本数据,其中,任一样本对象对应的样本数据中包括样本对象标识向量序列以及样本对象行为向量序列,上述任一样本对象对应的上述样本对象标识向量序列中包括基于上述任一样本对象的样本对象标识生成的多个样本对象标识向量。
在一些可行的实施方式中,为了可以基于不同操作对象(即终端设备)的对象标识获取该操作对象的兴趣向量(即兴趣类别),以根据每个操作对象的兴趣向量向该操作对象推荐可能感兴趣的多媒体资源,终端设备200b可以获取多个样本对象的多个样本数据,从而对兴趣向量生成模型进行训练。
可以理解的是,操作对象通过终端设备200b上装载的目标客户端进行实名信息注册,在操作对象通过上述目标客户端获得与操作对象唯一对应的对象标识后,通过装载在终端设备200b上的目标客户端获取多媒体资源推荐的多个样本对象对应的多个样本数据。其中,上述多媒体资源推荐的多个样本对象对应的多个样本数据为在上述目标客户端已完成注册的各个终端用户的样本对象的样本数据,或是在上述目标客户端发布的多媒体资源推荐的多个样本对象的样本数据,具体可根据实际应用场景确定,在此不做限制。具体的,每个样本对象对应的样本数据中均包括该样本对象的样本对象标识向量序列和样本对象行为向量序列,在获取到多个样本对象的多个样本数据后,可以基于多个样本数据中的样本对象标识向量序列和样本对象行为向量序列对上述兴趣向量模型进行训练,以获得基于任一操作对象的对象标识生成该操作对象的兴趣类目向量序列的能力,即在只获取任一操作对象对应的对象标识的情况下,本申请实施例的兴趣向量生成方法可以根据该操作对象的对象标识生成并输出该操作对象的兴趣类目向量序列。进一步的,每个样本对象对应的样本对象标识向量序列均包括多个样本对象标识向量,该样本对象标识向量可以理解为用于表征样本对象的样本对象标识,基于每个样本对象对应的样本对象标识可以生成多个上述样本对象标识向量,通过样本对象的多个样本对象标识向量可以生成该样本对象的样本对象标识向量序列。
在一些可行的实施方式中,请参阅图3,图3是本申请实施例提供的资源推荐的兴趣向量生成方法的另一种流程示意图。本申请实施例的兴趣向量生成方法可以根据如图3所示的流程获取上述任一样本对象对应的样本对象标识向量序列。具体的,如图3所示,首先可以获取上述多个样本对象中任一样本对象的样本对象标识。由上述内容可知,当任一个样本对象在上述目标客户端中注册成功时,可以得到针对目标客户端的样本对象标识,该样本对象标识可以理解为在目标客户端上注册成功的该样本对象的应用账号。在目标客户端上注册成功的每个样本对象的对象标识均不相同,通过样本对象对应的样本对象标识可以对不同的样本对象进行区分。同理的,可以通过获取已在目标客户端上注册成功的多个样本对象以获取对应的多个样本对象标识。此外,由上述内容可知,还可以通过接收目标客户端发布的多媒体资源的样本数据,该样本数据可以理解为包括多个样本对象及对应的多个样本对象标识。如图3所示,在获取任一样本对象对应的任一样本对象标识后,可以基于多个哈希函数对任一个样本对象标识进行哈希计算,以获得任一个样本对象对应的样本对象标识的多个样本对象扩展标识。具体的,请参阅图4,图4是本申请实施例资源推荐的兴趣向量生成方法提供的一种应用场景示意图。如图4所示的样本对象标识A可以理解为任一样本对象对应的样本对象标识。进一步的,样本对象标识A经过第一哈希函数hash 1计算后可以获得第一样本对象扩展标识a1,样本对象标识A经过第二哈希函数hash 2计算后可以获得第二样本对象扩展标识a2,样本对象标识A经过第三哈希函数hash 3计算后可以获得第三样本对象扩展标识a3,……,样本对象A经过第k哈希函数hash k计算后可以获得第k样本对象扩展标识ak。可以理解的是,上述哈希函数(即第一哈希函数、第二哈希函数、第三哈希函数、……、第k哈希函数)可以理解为用于将目标客户端存储的哈希表中元素的关键键值映射为元素存储位置的函数。可以理解的是,通过不同哈希函数计算得到样本对象标识A的多个样本对象扩展标识(即第一样本对象扩展标识a2、第二样本对象扩展标识a2、第三样本对象扩展标识a3、……、第k样本对象扩展标识ak),每个样本对象扩展标识均作为哈希表中对应的一个元素的关键键值,因此不同哈希函数计算得到的多个样本对象扩展标识可以将样本对象标识A映射至不同的元素存储位置,从而基于任一个样本对象的样本对象标识获得仍然与样本对象相关联的多个样本对象扩展标识。此外,由于各个哈希函数的计算方式不相同,样本对象标识A经过不同哈希函数计算得到的各个样本对象扩展标识也不相同,即每个样本对象扩展标识一定会被映射至不同的元素存储位置。进一步的,本申请实施例中多个样本对象对应的多个样本对象标识可以是任意长度的数据,在经过多个哈希函数的计算之后输出的任一样本对象标识对应的多个样本对象扩展标识可以为具有固定长度的多个数据,即多个样本对象扩展标识的长度均相等。具体的,哈希函数可以理解为一种将任何一种数据(例如上述样本对象标识)压缩成数据摘要(即上述样本对象扩展标识),使得数据量变小,将数据的格式(即样本对象扩展标识的长度)固定下来的计算方法。任一样本对象标识经过多个哈希函数计算后输出的多个样本对象扩展标识可以理解为一个短的随机字母和数字组成的字符串。总的来说,在实际应用中,由于不同目标客户端针对操作对象或者样本对象在完成注册时创建的对象标识的数据长度是不固定的,存在对象标识的数据长度各不相同以及数据长度很大的情况,本申请实施例提供的兴趣向量生成方法采用的哈希函数可以处理数据长度很大的输入数据,并将不同长度的对象标识计算转换为固定长度的多个对象扩展标识(即上述样本对象扩展标识),以方便后续进一步对多个对象扩展标识进行处理。
在一些可行的实施方式中,如图3所示,在基于多个哈希函数对任一样本对象标识进行计算以获得该样本对象的多个样本对象扩展标识之后,可以基于上述多个样本对象扩展标识从目标客户端存储的对象标识向量集合中确定出各个样本对象扩展标识对应的样本对象标识向量,以得到上述多个样本对象扩展标识对应的多个样本对象标识向量。可以理解的是,在对样本对象标识进行哈希函数计算之后获得多个样本对象扩展标识,为了便于后续进一步对样本对象的多个样本对象扩展标识进行处理,本申请实施例中兴趣向量生成方法还需要将上述多个样本对象扩展标识转换为相应的样本对象标识向量。具体的,由上述内容可知,在经过多个哈希函数的计算之后输出的多个样本对象扩展标识被映射至哈希表中相应的元素存储位置。目标客户端存储的对象标识向量集合中包括上述哈希表中每个元素存储位置对应的对象标识向量,因此,在获取样本对象的多个样本对象扩展标识之后,可以根据每个样本对象扩展标识相应的元素存储位置在对象标识向量集合中查找该元素存储位置对应的对象标识向量。例如,如图4所示,样本对象标识A经过第一哈希函数hash1计算后获得第一样本对象扩展标识a1,此时,可以在上述对象标识向量集合中查找与第一样本对象扩展标识a1对应的元素存储位置相匹配的对象标识向量,并将该对象标识向量确定为第一样本对象扩展标识a1的第一样本对象标识向量b2。同理的,由于对象标识向量集合包括与每个哈希表的元素存储位置相对应的对象标识向量,因此,可以按照上述查找第一样本对象扩展标识a1对应的第一样本对象标识向量b1的方法获取第二样本对象扩展标识a2对应的第二样本对象标识向量b2、第三样本对象扩展标识a3对应的第三样本对象标识向量b3以及第k样本对象扩展标识ak对应的第k样本对象标识向量bk。总而言之,本申请实施例中从目标客户端存储的对象标识向量集合中对多个样本对象标识相应的对象标识向量进行查找,以获得与上述多个样本对象标识对应的多个样本对象标识向量,从而获得任一样本对象的多个样本对象标识向量。
在一些可行的实施方式中,如图3所示,在获取多个样本对象中任一样本对象的多个样本对象标识向量之后,可以基于多个样本对象标识向量获取该样本对象的样本对象标识向量序列。具体的,如图4所示,可以将第一样本对象标识向量b1、第二样本对象标识向量b2、第三样本对象标识向量b3、……、第k样本对象标识向量bk依次进行排列,以获得在向量空间中的序列,即上述样本对象标识向量序列。进一步的,各个样本对象标识向量可以根据实际应用的需要进行采取不同的排列方式,具体可根据实际应用场景需求确定,本申请实施例在此不做限制。
在一些可行的实施方式中,多个样本对象对应的多个样本数据包括任一样本对象对应的样本对象标识向量序列和样本对象行为向量序列,在获取样本对象对应的样本对象标识向量序列的同时,本申请实施例提供的兴趣向量生成方法还用于获取多个样本对象对应的样本对象行为向量序列。具体的,请参阅图5,图5是本申请实施例资源推荐的兴趣向量生成方法提供的另一种流程示意图。本申请实施例的兴趣向量生成方法可以根据如图5所示的流程获取上述任一样本对象对应的样本对象行为向量序列。具体的,如图5所示,首先可以获取上述多个样本对象中任一样本对象的多个样本对象行为数据。具体的,由上述内容可知,样本对象在通过终端设备200b上装载的目标客户端完成注册时可以获取与样本对象唯一对应的样本对象标识。目标客户端是具有处理多媒体资源功能的应用,样本对象可以在目标客户端上对各种多媒体资源执行不同操作,目标客户端可以记录上述样本对象的行为数据,如样本对象针对多媒体资源的观看、收藏、分享等操作,以形成上述多个样本对象行为数据。由此可见,该样本对象行为数据可以理解为记录样本对象在目标客户端每一次访问的行为产生的日志,任一样本对象的多个样本对象行为数据可以被目标客户端存储至与该样本对象相应的样本对象标识相匹配的存储空间,即可以根据样本对象相应的样本对象标识获取该样本对象的多个样本行为数据。可以理解的是,各个样本行为数据分别携带不同类型的行为记录。举例而言,假设多个样本行为数据包括第一样本行为数据、第二样本行为数据、第三样本行为数据、……、第n样本行为数据,其中,第一样本行为数据可以包括样本对象的观看视频类型,第二样本行为数据可以包括样本对象的使用音频类型,第三样本行为数据可以包括样本对象的阅读信息类型等。此外,可以通过获取目标客户端发布的多媒体资源推荐的多个样本对象的样本数据,以获取任一样本对象对应的多个样本对象行为数据,具体可根据实际应用场景确定,在此不做限制。可以理解的是,通过获取样本对象的多个样本对象行为数据,可以更清楚、全面地表征样本对象的行为特征。
在一些可行的实施方式中,如图5所示,在获取多个样本对象对应的多个样本对象行为数据之后,可以基于多个样本对象行为数据从对象行为向量集合中确定出各个样本对象行为数据对应的样本对象行为向量,从而得到上述多个样本对象行为数据对应的多个样本对象行为向量。可以理解的是,在获取样本对象对应的多个样本对象行为数据之后,为了便于后续进一步对样本对象的多个样本对象行为数据进行处理,本申请实施例中兴趣向量生成方法还需要将上述多个样本对象行为数据转换为相应的样本对象行为向量。具体的,可以基于各个样本对象行为数据在目标客户端存储的对象行为向量集合中进行查找,该对象行为向量集合中包括与每个样本对象行为数据相匹配的多个对象行为向量,基于任一样本对象的多个样本对象行为数据将上述对象行为向量集合中与样本对象行为数据相匹配的多个对象行为向量确定为多个样本对象行为向量,以获得任一样本对象的多个样本对象行为向量。
在一些可行的实施方式中,如图5所示,在获取多个样本对象中任一样本对象的多个样本对象行为向量之后,可以基于多个样本对象行为向量获取该样本对象的样本对象行为向量序列。具体的,可以将多个样本对象行为向量进行排列,以获得在向量空间中的序列,即上述样本对象行为向量序列。进一步的,各个样本对象行为向量可以根据实际应用的需要进行采取不同的排列方式,具体可根据实际应用场景需求确定,本申请实施例在此不做限制。
步骤S102、基于上述任一样本对象对应的上述样本对象标识向量序列和上述样本对象行为向量序列生成上述任一样本对象对应的样本输入向量序列,并基于上述任一样本对象对应的上述样本对象行为向量序列获取兴趣类目序列,上述兴趣类目序列中包括的类目数量与上述样本对象标识向量序列中包括的向量数量相同。
在一些可行的实施方式中,基于上述内容中获取任一样本对象对应的样本对象标识向量序列和样本对象行为向量序列之后,本申请实施例提供的兴趣向量生成方法还用于对任一样本对象的样本对象标识向量序列和样本对象行为向量序列进行拼接,以生成任一样本对象的样本输入向量序列,该样本输入向量序列可以理解为用于输入至兴趣向量生成模型中进行训练的向量序列。具体的,可以将上述样本对象标识向量序列的尾部与上述样本对象行为序列的头部进行拼接,以获得上述样本对象行为向量序列。进一步的,样本对象行为向量序列与样本对象标识向量序列可以根据实际应用的需要进行采取不同的方式进行拼接,具体可根据实际应用场景需求确定,本申请实施例在此不做限制。可以理解的是,本申请实施例通过将样本对象标识向量序列和样本对象行为向量序列拼接生成样本输入序列,便于后续基于样本输入序列进一步对兴趣向量生成模型进行训练。
在一些可行的实施方式中,为了使得兴趣向量生成模型可以根据样本输入序列生成相应的兴趣类目向量序列,在获得任一样本对象对应的上述样本对象行为向量序列之后,本申请实施例提供的兴趣向量生成方法还可以基于样本对象行为向量序列获取样本对象对应的兴趣类目序列。可以理解的是,通常资源推荐的兴趣向量生成是基于操作对象的过往行为数据,如操作对象对某类多媒体资源的点击率、观看时长、观看次数等特征生成操作对象的兴趣向量,或者基于兴趣相投或者拥有共同经验(即兴趣向量相近)的对象群体的需求或者喜好确定操作对象的兴趣向量,从而基于操作对象的兴趣向量向该操作对象推荐可能感兴趣的多媒体资源。但是由于热点现象的存在,很多操作对象都会对热点文章或者热点视频进行点击或者转发,使得很多操作对象的过往行为数据相近,因此目标客户端基于不同操作对象的过往行为数据获取的多个兴趣向量差异性很小。然而,不同操作对象的资源需求或者喜好往往存在较大的差异性,热点现象造成兴趣向量相似的问题会降低目标客户端表征不同操作对象的兴趣向量的准确性,降低根据兴趣向量进行资源推荐的个性化效果。为此,本申请实施例资源推荐的兴趣向量生成方法基于样本对象行为向量序列获取上述兴趣类目序列,该兴趣类目序列包括多个兴趣类目,且每个兴趣类目均基于上述多个样本对象行为向量获得,该兴趣类目可以理解为用于表征样本对象对不同资源类目的感兴趣程序的类目向量。进一步的,兴趣向量生成模型可以根据基于兴趣类目序列对上述样本输入序列进行学习,并基于样本输入序列生成任一样本对象对应的目标兴趣类目向量序列,且该样本对象的目标兴趣类目向量序列与输入兴趣类目序列相同,即兴趣向量生成模型可以以上述兴趣类目序列为训练目标,对基于样本输入序列获得相应的兴趣类目向量序列的过程进行训练。经过上述训练过程之后兴趣向量生成模型从而可以基于任一对象的输入序列(例如样本输入序列)标识生成该对象的兴趣类目向量序列,且该兴趣类目向量序列包括多个用于表征对象对不同类型资源的感兴趣程度的兴趣类目向量。可以理解的是,由于兴趣向量生成模型基于输入序列输出的兴趣类目向量序列包括的多个兴趣类目向量表征的是不同类型资源的感兴趣程度,因此,可以避免热点现象造成的行为数据相似的问题,从而提高表征不同对象的兴趣类目向量的准确性。总的来说,本申请实施例的兴趣向量生成方法基于任一样本对象的样本对象行为向量序列生成该样本对象的兴趣类目序列,通过将该兴趣类目序列和上述样本输入序列传输给兴趣向量生成模型,使得兴趣向量生成模型基于该兴趣类目序列对样本输入序列进行学习,以获得相应的兴趣类目向量序列。
在一些可行的实施方式中,可以通过对多个样本对象行为向量进行统计、总结,以获得相应的兴趣类目序列。具体的,在实际应用中,目标客户端无需对样本对象的行为日记进行归类以获得多个不同类型的样本对象行为数据,即所述多个样本对象行为数据可以是相近或者相同类型的行为记录数据。此时,在基于多个样本对象行为数据进行查找以获得对应的多个样本对象行为向量之后,可以通过多个样本对象行为向量进行统计、总结,以将表征相同多媒体资源类目的的样本对象行为向量进行归类计算,从而获得表征样本对象对不同资源类目的感兴趣程度的多个兴趣类目,从而获得该样本对象的兴趣类目序列。进一步的,可以根据实际应用的需要进行采取不同的方式获取上述兴趣类目序列,具体可根据实际应用场景需求确定,本申请实施例在此不做限制。
在一些可行的实施方式中,请参阅图6,图6是本申请实施例资源推荐的兴趣向量生成方法提供的另一种流程示意图。本申请实施例的兴趣向量生成方法可以根据如图6所示的流程获取上述任一样本对象对应的兴趣类目序列。具体的,如图6所示,首先可以获取任一样本对象对应的上述样本对象行为向量序列中各个样本对象行为向量的行为属性特征,上述行为属性特征包括资源观看时长特征、或者资源操作频次特征中的至少一种。具体的,样本对象的多个样本对象行为向量中可以包括相应的行为属性特征,上述行为属性特征包括资源观看时长特征、或者资源操作频次特征中的至少一种。其中,上述任一样本对象行为向量对应的资源观看时长特征可以理解为用于表征该样本对象针对目标多媒体资源的观看总时长。可以理解的是,样本对象针对目标多媒体资源的观看总时长越长,可以表示样本对象对该目标多媒体资源的喜好程序越高。上述任一样本对象行为向量对应的资源操作频次特征可以理解为用于表征该样本对象在某一段时间内针对目标多媒体资源的点击观看次数或者频率、或者分享次数或者频率等。可以理解的是,样本对象针对目标多媒体资源的点击观看次数越多,可以表示样本对象对该目标多媒体资源的喜好程序越高。此外,任一样本对象的样本对象行为向量还可以包括资源互动时长特征,上述资源互动时长特征可以理解为用于表征该样本对象针对目标多媒体资源的互动,如点赞、评论、分享等操作。此外,上述多个样本对象行为向量的行为属性特征的实际含义可根据实际应用场景确定,本申请在此不做限制。为方便描述,假设本申请实施例中的上述各样本对象行为向量中均包括针对上述资源操作频次特征和资源观看时长特征。
举例而言,假设第一样本对象行为数据与第一样本对象行为向量相对应,且第一样本对象行为数据为样本对象的观看娱乐视频资源的行为记录数据,则与第一样本对象行为数据相对应的第一样本对象行为向量中包括了用于表征上述样本对象观看娱乐视频资源的总时长的行为属性特征以及用于表征上述样本对象针对娱乐视频资源的点击观看次数的行为属性特征。通过对该第一样本对象行为向量中包括的行为属性特征进行获取,可以得到第一样本对象行为向量对应的娱乐视频资源观看时长特征和娱乐视频资源操作频次特征。同理的,本申请实施例通过对任一样本对象的多个样本对象行为向量进行统计,可以分别获取各个样本对象行为向量中包括的多个行为属性特征。可以理解的是,在获取任一样本对象的多个样本对象行为数据时,可以对不同类型的样本对象行为数据进行获取,以保证样本对象的各个样本对象行为向量均不相同。例如,假设样本对象行为数据包括第一样本对象行为数据、第二样本对象行为数据和第三样本对象行为数据,其中,第一样本对象行为数据中可以包括观看娱乐视频资源的行为记录数据,第二样本对象行为数据中可以包括观看体育视频资源的行为记录数据,第三样本对象行为数据中可以包括观看学习视频资源的行为记录数据,即三个样本对象行为数据记录的资源类目都不相同。此时,当基于多个样本对象行为数据确定对应的多个样本对象行为向量,并根据多个样本对象行为向量获取相应的多个行为属性特征时,可以理解的是,上述多个行为属性特征包括用于表征样本对象针对娱乐视频资源的观看总时长和操作总频次的第一行为属性特征,用于表征样本对象针对体育视频资源的观看总时长和操作总频次的第二行为属性特征,以及用于表征样本对象针对学习视频资源的观看总时长和操作总频次的第三行为属性特征。进一步的,可以根据实际应用的需要获取样本对象行为向量针对不同的目标多媒体资源(例如上述娱乐视频资源、体育视频资源、学习视频资源或者其他音频资源、图像资源等)的行为属性特征,具体可根据实际应用场景需求确定,本申请实施例在此不做限制。
在一些可行的实施方式中,如图6所示,在获取任一样本对象对应的样本对象行为对象序列中各个样本对象行为向量的行为属性特征之后,可以基于各个样本对象行为向量的行为属性特征,从上述样本对象行为向量序列中包括的所有样本对象行为向量中确定出行为属性特征的取值较大的K个样本对象行为向量。具体的,由上述内容可知,各个样本对象行为向量中包括相应的行为属性特征,该行为属性特征可以理解为用于表征样本对象针对目标多媒体资源的资源观看时长特征和资源操作频次特征。可以理解的是,样本对象针对目标多媒体资源的资源观看时长特征表征样本对象观看目标多媒体资源的总时长,总时长的取值越大,即资源观看时长特征的取值越大,代表样本对象对该目标多媒体资源的感兴趣越高。同理的,样本对象针对目标多媒体资源的资源操作频次特征表征样本对象点击目标多媒体资源的总次数,总次数的取值越大,即资源操作频次特征的取值越大,代表样本对象对该目标多媒体资源的感兴趣越高。因此,本申请实施例通过各个样本对象行为向量对应的行为属性特征的取值,可以判断样本对象对该样本对象向量对应的目标多媒体资源的感兴趣程度,其中,样本对象向量对应的行为属性特征的取值较大,即可理解为样本对象对该样本对象向量对应的目标多媒体资源的感兴趣程度较高。可以理解的是,本申请实施例可以基于各个样本对象行为向量对应的行为属性特征的取值对多个样本对象行为向量进行排序,以获得行为属性特征的取值较大的K个样本对象行为向量,并基于K个样本行为向量确定样本对象对应的兴趣类目序列。
在一些可行的实施方式中,本申请实施例将上述K个样本对象行为向量对应的资源类目确定为上述任一样本对象对应的K个兴趣类目,并基于上述K个兴趣类目生成上述任一样本对象对应的兴趣类目序列,其中K为正整数。其中,上述K个样本对象行为向量对应的资源类目可以理解为每个样本对象行为向量对应的样本对象行为数据所记录的多媒体资源类目,即上述目标多媒体资源。
举例而言,假设第一样本对象行为数据与第一样本对象行为向量相对应,且第一样本对象行为数据为样本对象的观看娱乐视频资源的行为记录数据,则与第一样本对象行为数据相对应的第一样本对象行为向量对应的资源类目为娱乐视频资源,第一样本对象行为向量对应的行为属性特征的取值可以理解为用于表征上述样本对象对娱乐视频资源的感兴趣程度。同时,假设第二样本对象行为数据与第二样本对象行为向量相对应,且第二样本对象行为数据为样本对象的观看体育视频资源的行为记录数据,则与第二样本对象行为数据相对应的第二样本对象行为向量对应的资源类目为体育视频资源,第二样本对象行为向量对应的行为属性特征的取值可以理解为用于表征上述样本对象对体育视频资源的感兴趣程度。此外,假设第三样本对象行为数据与第三样本对象行为向量相对应,且第三样本对象行为数据为样本对象的观看学习视频资源的行为记录数据,则与第三样本对象行为数据相对应的第三样本对象行为向量对应的资源类目为学习视频资源,第三样本对象行为向量对应的行为属性特征的取值可以理解为用于表征上述样本对象对学习视频资源的感兴趣程度。同理的,可以按照相同的原理获取任一样本对象的样本对象行为序列中的各个样本对象行为向量对应的行为属性特征的取值和资源类目,并基于行为属性特征的取值对样本对象行为向量序列中的所有样本对象行为向量进行排序。由上述内容可知,样本对象行为向量对应的行为属性特征的取值越大,代表着样本对象对该样本对象行为向量对应的资源类目的感兴趣程度越高,因此,本申请实施例中可以将经过排序后,行为属性特征的取值排在前K的K个样本对象行为向量对应的K个资源类目确定为样本对象最感兴趣的K个兴趣类目。例如,假设行为属性特征的取值按照从大到小的次序进行排列,依次序分别为上述第一样本对象行为向量、第二样本对象行为向量、第三样本对象行为向量、……、第n样本对象行为向量,假设K=3,则可以将第一样本对象行为向量、第二样本对象行为向量和第三样本对象行为向量对应的资源类目确定为样本对象对应的3个兴趣类目,由上述可知,第一样本对象行为向量对应的资源类目可以为娱乐视频资源,第二样本对象行为向量对应的资源类目可以为娱乐视频资源,第三样本对象行为向量对应的资源类目可以为学习视频资源,即可以确定样本对象对应的3个兴趣类目分别为娱乐视频资源、娱乐视频资源和学习视频资源。进一步的,可以根据实际应用的需要确定K值的大小,具体可根据实际应用场景需求确定,本申请实施例在此不做限制。
在一些可行的实施方式中,在获取多个样本对象中任一样本对象的上述样本输入序列和上述兴趣类目序列后,可以将任一样本对象对应的样本输入序列和兴趣类目序列输入给兴趣向量生成模型进行训练,其中,兴趣向量生成模型可以以兴趣类目序列中包括的多个兴趣类目为训练目标,即将兴趣类目序列中的多个兴趣类目作为多个目标兴趣类目,使得兴趣向量生成模型在训练过程中基于上述多个样本对象的样本输入序列生成多个初始兴趣类目,并以多个目标兴趣类目为参考值,基于多个初始兴趣类目与多个目标兴趣类目对兴趣向量生成模型进行更新,最终使得兴趣向量生成模型可以基于多个样本对象的样本输入序列生成任一样本对象对应的兴趣类目向量序列。其中,兴趣向量生成模型可以将样本对象行为向量序列与对应的样本对象标识向量序列进行交互学习,以将样本对象标识向量序列的多个样本对象标识向量转换为上述多个初始兴趣类目,由于初始兴趣类目与目标兴趣类目(即兴趣类目序列中的多个兴趣类目)的数量相同,因此,本申请实施例中任一样本对象对应的兴趣类目序列中包括的类目数量与上述样本对象标识向量序列中包括的向量数量相同。进一步的,可以根据实际应用的需要确定兴趣类目序列中包括的类目向量以及样本对象标识向量序列中包括的向量数量,具体可根据实际应用场景需求确定,本申请实施例在此不做限制。
步骤S103、将上述多个样本对象中各个样本对象对应的样本输入向量序列和兴趣类目序列输入兴趣向量生成模型,基于上述各个样本对象对应的上述样本输入向量序列及其对应的兴趣类目序列对上述兴趣向量生成模型进行训练,以使上述兴趣向量生成模型获得基于输入的任一对象的对象标识向量序列生成上述任一对象的兴趣类目向量序列的能力。
在一些可行的实施方式中,由上述内容可知,获取多个样本对象中任一样本对象的上述样本输入序列和上述兴趣类目序列后,可以将各个样本对象对应的样本输入序列和兴趣类目序列输入给兴趣向量生成模型,兴趣向量生成模型可以基于多个样本对象对应的样本输入序列和兴趣类目序列进行训练。具体的,兴趣向量生成模型可以将兴趣类目序列中包括的多个兴趣类目确定为训练目标并基于相应的样本输入序列进行训练。进一步的,兴趣向量生成模型在训练过程中对多个样本对象对应的样本输入序列中的样本对象标识向量序列和样本对象行为向量序列进行充分的交互学习,以基于上述样本对象行为向量序列将对应的样本对象标识向量序列中的多个样本对象标识向量转换为多个初始兴趣类目,并基于上述多个初始兴趣类目和相应的兴趣类型序列中多个兴趣类目对兴趣向量生成模型进行更新,最终使得兴趣向量生成模型可以基于多个样本对象的样本输入序列生成上述兴趣类目序列。
在一些可行的实施方式中,请参阅图7和图8,图7是本申请实施例资源推荐的兴趣向量生成方法提供的另一种应用场景示意图,图8是本申请实施例提供的资源推荐的兴趣向量生成方法的一种框架示意图。如图7所示,首先可以通过K个不同的哈希函数将多个样本对象中的任一样本对象的样本对象标识计算得到K个不同的样本对象扩展标识,同时,获取多个样本对象中任一样本对象的多个样本对象行为数据。如图8所示,可以将上述多个样本对象扩展标识和多个样本对象行为数据输入至深度理解嵌入层(embedding层)。具体的,该embedding层包括对象标识向量集合和对象行为向量集合,在embedding层中可以基于K个不同的样本对象扩展标识从对象标识向量集合中确定K个样本对象扩展标识对应的K个样本对象标识向量,以获得如图7所示的样本对象标识对应的多个样本对象标识向量,并基于多个样本对象标识向量获取对应的样本对象标识向量序列。同时,可以在embedding层基于多个样本对象中任一样本对象的多个样本对象行为数据从对象行为向量集合中确定各个样本对象行为数据对应的多个样本对象行为向量,以获得如图7所示的多个样本对象行为数据对应的多个样本对象行为向量,并基于多个样本对象行为向量获得上述样本对象行为向量序列。在获得样本对象对应的上述样本对象行为向量和上述样本对象标识向量之后,可以将该样本对象对应的上述样本对象行为向量和上述样本对象标识向量进行拼接后获得上述样本输入序列,并将样本输入序列输入至兴趣向量生成模型。此外,如图7所示,本申请实施例的兴趣向量生成方法还用于基于样本对象行为向量序列生成上述兴趣类目序列,并将该兴趣类目序列输入至兴趣向量生成模型。由上述内容可知,该兴趣向量生成模型可以基于多个样本对象对应的样本输入序列和兴趣类目序列进行训练,以获得基于输入的任一对象的对象标识向量序列生成任一对象的兴趣类目向量序列的能力,其中,上述兴趣类目向量序列可以从如图8所示的输出层输出,以提供给下游的资源推荐***进行使用。
在一些可行的实施方式中,如图7所示,上述兴趣向量生成模型中包括、图神经网络(transformer网络)、第一网络和第二网络。其中,当兴趣向量生成模型接收到多个样本对象中任一样本对象的样本输入序列时,可以将该样本对象的样本输入序列输入至上述transformer网络。当兴趣向量生成模型接收到多个样本对象中任一样本对象的兴趣类目序列时,可以将该样本对象的兴趣类目序列输入至上述第一网络。具体的,兴趣向量生成模型的transformer网络可以对样本输入序列中的样本对象行为向量序列与对应的样本对象标识向量序列进行交互学习,以将样本对象标识向量序列的多个样本对象标识向量转换为上述多个初始兴趣类目,其中,上述多个初始兴趣类目表征transformer网络基于样本对象行为向量序列学习到的该样本对象的多个兴趣类目,由于在经过充分的训练之前transformer网络的学习过程不一定完善,即生成的多个初始兴趣类目不一定满足对该样本对象的多个兴趣类目向量进行准确表征的要求。因此,本申请实施例还可以将transformer网络在训练过程中生成的多个初始兴趣类目传输给上述第一网络。由上述内容可知,第一网络中包括的兴趣类目序列可以作为兴趣向量生成模型的训练目标。具体的,可以将上述多个初始兴趣类目和对应的兴趣类目序列对第一网络的第一损失函数进行训练,并计算此时第一损失函数的第一损失,通过将第一损失函数的第一损失返回给transformer网络,以使transformer网络基于第一损失函数的第一损失进行更新。具体的,经过多次更新后transformer网络可以输出经过多次更新的多个初始兴趣类目并传输给上述第一网络,第一网络基于更新后的多个初始兴趣类目和上述兴趣类目序列对第一损失函数进行多次训练并逐渐收敛。可以理解的是,当经过多次训练后的第一损失函数收敛至损失阈值时,transformer网络基于任一样本对象的样本输入序列生成的多个初始兴趣类目与相应的兴趣类目序列中的多个兴趣类目相同,此时,兴趣向量生成模型获得基于任一对象的对象标识生成该对象的兴趣类目向量序列的能力。
在一些可行的实施方式中,由上述内容可知,transformer网络可以基于输入的样本输入序列对相应的样本对象行为向量序列与对应的样本对象标识向量序列进行交互学习。具体的,transformer网络可以在交互学习的过程中基于上述样本对象行为向量序列,将样本对象标识向量序列的多个样本对象标识向量转换为上述多个初始兴趣类目。为了保证transformer网络可以对样本对象行为向量序列与对应的样本对象标识向量序列进行充分的交互学习,以提高生成上述初始兴趣类目的准确性,本申请实施例可以对第二网络的第二损失函数进行训练。具体的,如图7所示,对上述各个样本对象对应的上述样本输入向量序列中的样本对象行为向量序列进行对象行为向量标记以生成上述各个样本对象的样本对象行为向量标记序列,该样本对象行为向量标记序列可以理解为对样本对象行为向量序列中的部分对象行为向量进行标记(即对象行为向量标记)后获得的向量序列。可以理解的是,该样本对象行为向量标记序列中的向量数量与对应的样本对象行为向量序列中的向量数量相等。如图7所示,可以将经过上述对象行为向量标记获得的各个样本对象的样本对象行为向量标记序列与对应的样本对象标识向量序列传输给兴趣向量生成模型的transformer网络,并将未经过对象行为向量标记的样本对象行为向量序列传输给趣向量生成模型的第二网络。可以理解的是,transformer网络可以基于输入的样本对象行为向量标记序列和对应的样本对象标识向量序列进行交互学习并输出初始样本对象行为向量序列,该初始样本对象行为向量序列可以理解为由transformer网络在训练过程中对上述样本对象行为向量标记序列中被标记的部分样本对象行为向量进行还原后获得。可以理解的是,若transformer网络在训练过程中可以对上述样本对象行为向量标记序列和对应的样本对象标识向量序列进行了充分的交互学习,则样本对象行为向量标记序列中被标记的部分样本对象行为向量可以在上述交互学习的过程中被全部还原,从而获得初始样本对象行为向量序列,且该初始样本对象行为向量序列与相应的样本对象行为向量序列相同。相反的,若transformer网络在训练过程中可以未对上述样本对象行为向量标记序列和对应的样本对象标识向量序列进行充分的交互学习,则样本对象行为向量标记序列中被标记的部分样本对象行为向量不能在上述交互学习的过程中被全部还原,从而使得生成的初始样本对象行为向量序列与样本对象行为向量序列存在误差。为此,可以将transformer网络在训练过程中生成的初始样本对象行为向量序列传输给第二网络,第二网络基于初始样本对象行为向量序列和对应的样本对象行为向量序列对第二损失函数进行训练,并计算此时第二损失函数的第二损失通过将第二损失函数的第二损失返回给transformer网络,以使transformer网络基于第二损失函数的第二损失进行更新。具体的,经过多次更新后transformer网络可以输出经过多次更新的初始样本对象行为向量序列并传输给上述第二网络,第二网络基于更新后的初始样本对象行为向量序列和对应的样本对象行为向量序列对第二损失函数进行多次训练并逐渐收敛。可以理解的是,当经过多次训练后的第二损失函数收敛至损失阈值时,transformer网络可以对任一输入序列中的对象标识向量序列和对象行为向量序列进行充分学习,以提高获取对象的兴趣类目向量序列的准确性。
在一种可行的实施方式中,进一步的,如图7所示,可以通过对样本对象行为向量序列中的部分样本对象行为向量执行掩码操作,从而将该部分样本对象行为向量标记为目标符号以生成上述各个样本对象的样本对象行为向量标记序列。本申请实施例还可以将上述各个样本对象的样本对象行为向量标记序列和相应的样本对象标识向量序列进行拼接,以生成样本标记输入向量序列,并将该样本标记输入向量序列输入至兴趣向量生成模型的transformer网络,transformer网络对样本标记输入向量序列中的样本对象行为向量标记序列和相应的样本对象标识向量序列进行交互学习,以生成上述初始样本对象行为向量序列。通过将上述初始样本对象行为向量序列和相应的样本对象行为向量序列传输给第二网络,可以基于初始样本对象行为向量序列和样本对象行为向量序列对第二网络的第二损失函数进行训练以使该第二损失函数收敛,从而使得兴趣向量生成模型的transformer网络可以对任一对象的对象行为向量序列和对应的对象标识向量序列进行充分的交互学习,提高生成兴趣向量的准确性。
在一些可行的实施方式中,本申请实施例还可以基于上述第一损失函数和上述第二损失函数生成上述兴趣向量生成模型的损失函数,以使上述兴趣向量生成模型基于上述损失函数获得输入的任一对象的对象标识向量序列输出上述任一对象的兴趣类目向量序列。具体的,由上述内容可知,通过训练第一损失函数直至第一损失函数收敛,可以使得兴趣向量生成模型获得基于任一对象的对象标识生成该对象的兴趣类目向量序列的能力,且该兴趣类目向量序列中包括的多个兴趣类目分别表征该对象对不同资源类目的感兴趣程度。可以理解的是,通过多个兴趣类目可以全面、准确地表征对象对不同资源类目的感兴趣程度。同时,通过训练第二损失函数直至第二损失函数收敛,可以使得兴趣向量生成模型可以对任一样本对象对应的样本对象行为向量序列和样本对象标识向量序列进行充分的交互学习,以提高兴趣向量生成模型基于任一对象的对象标识向量序列生成相应的兴趣类目向量序列的准确度。
步骤S104、当获取到目标对象的目标对象标识时,基于目标对象标识生成目标对象对应的目标对象标识向量序列并输入兴趣向量生成模型,通过兴趣向量生成模型基于目标对象标识向量序列输出目标对象的目标兴趣类目向量序列,目标兴趣类目向量序列用于目标对象的兴趣资源推荐。
在一些可行的实施方式中,通过上述兴趣向量生成方法的步骤S101至步骤S103可以获得训练完成的兴趣向量生成模型,此时,该兴趣向量生成模型可以基于任一对象的对象标识向量序列生成相应的兴趣类目向量序列。具体的,如图7所示,首先可以获取目标对象的目标对象标识,由上述内客可知,当该目标对象通过终端设备200b上装载的目标客户端进行实名信息注册时,上述目标客户端可以获得与该目标对象唯一对应的对象标识,即目标对象标识。本申请实施例的兴趣向量生成方法可以基于多个不同哈希函数对目标对象标识进行计算以获得多个目标对象扩展标识。进一步的,基于目标对象的多个目标对象扩展标识在目标客户端存储的对象标识向量集合中进行查找,并将分别与多个目标对象扩展标识相匹配的多个对象标识向量确定为目标对象的多个目标对象标识向量。如图7所示,可以将目标对象的多个目标对象标识向量输入至兴趣向量生成模型的transformer网络。transformer网络可以将上述多个目标对象标识向量转换生成兴趣类目向量序列。可以理解的是,兴趣类目向量序列中包括的每个兴趣类目用于表征目标对象对不同资源的感兴趣程度。本申请实施例的兴趣向量生成模型可以将该目标对象的兴趣类目向量序列传输给下游的资源推荐***,资源推荐***能够基于该目标对象的兴趣类目向量序列确定向目标对象推荐的可能感兴趣的资源类目。
在一些可行的实施方式中,本申请实施例中兴趣向量生成模型基于目标对象的目标对象标识生成的兴趣类目向量序列可以用于在操作对象集合中查找与该目标对象兴趣相近的其他操作对象。具体的,本申请实施例的兴趣向量生成方法可以获取操作对象集合中的任一个操作对象的兴趣类目向量序列。通过将任一操作对象兴趣类目向量序列中的多个兴趣类目向量与目标对象的兴趣类目向量序列中的多个兴趣类目向量进行比较,从而将兴趣类目向量序列相同的操作对象确定为该目标对象的相似对象。进一步的,通过本申请实施例的兴趣向量生成方法生成的兴趣类目向量序列查找到的相似对象的行为对应的类目重叠度和标签重叠度均高于其他常规的兴趣向量生成方法,具体如下表所示:
本申请实施例提供的兴趣向量生成方法通过多个不同哈希函数对样本对象的样本对象标识进行计算以获得样本对象的多个样本对象扩展标识。进一步的,基于样本对象的多个样本对象扩展标识在目标客户端存储的对象标识向量集合中进行查找,并将分别与多个样本对象扩展标识相匹配的多个对象标识向量确定为样本对象的多个样本对象标识向量,并基于多个样本对象标识向量生成该样本对象的样本对象标识向量序列。同时,本申请实施例还可以获取样本对象对应的多个样本对象行为数据,并基于多个样本对象行为数据在目标客户端存储的对象行为向量集合中进行查找,并将分别与多个样本对象行为数据相匹配的多个对象行为向量确定为样本对象的多个样本对象行为向量,并基于多个样本对象行为向量生成该样本对象的样本对象行为向量序列。此外,本申请实施例还可以基于上述样本对象行为向量序列获取样本对象的兴趣类目序列并传输给兴趣向量生成模型。进一步的,将样本对象对应的上述样本对象行为向量序列和上述样本对象标识向量序列进行拼接生成样本输入序列,并传输给兴趣向量生成模型。兴趣向量生成模型可以对样本输入序列中的样本对象行为向量序列和相应的样本对象标识向量序列进行交互学习,同时基于上述兴趣类目序列对兴趣向量生成模型中的损失函数进行训练,以使得兴趣向量生成模型获得可以基于任一对象的对象标识向量序列生成该对象的兴趣类目向量序列的能力。本申请实施例提供的兴趣向量生成方法可以基于多个哈希函数和相应的对象标识向量集合将对象标识转换为多个对象扩展标识,并且通过结合对象的对象行为向量序列将多个对象扩展标识转换为该对象的兴趣类目向量序列,且该兴趣类目向量序列中包括的多个兴趣类目向量分别用于表征该对象对不同资源类目的感兴趣程度,因此可以有效提高通过兴趣向量表征不同对象的准确性。由此可见,本申请实施例的兴趣向量生成方法可以利用任一对象的对象标识生成相应的兴趣类目向量序列,以增强表征对象的多个兴趣向量的准确性,从而实现针对不同对象的个性化多媒体资源推荐,适用性高。
基于上述资源推荐的兴趣向量生成方法实施例的描述,本申请实施例还公开了一种资源推荐的兴趣向量生成装置。该资源推荐的兴趣向量生成装置可以被应用于图1至图8所示实施例的兴趣向量生成方法中,以用于执行资源推荐的兴趣向量生成方法中的步骤。这里资源推荐的兴趣向量生成装置可以是上述图1至图8所示实施例中的业务服务器或者终端设备,即该资源推荐的兴趣向量生成装置可以为上述图1至图8所示实施例中资源推荐的兴趣向量生成方法的执行主体。请参阅图9,图9是本申请实施例提供的资源推荐的兴趣向量生成装置的一种结构示意图。在本申请实施例中,该装置可运行如下模块:
获取模块1,用于获取多个样本对象对应的多个样本数据,其中,任一样本对象对应的样本数据中包括样本对象标识向量序列以及样本对象行为向量序列,上述任一样本对象对应的上述样本对象标识向量序列中包括基于上述任一样本对象的样本对象标识生成的多个样本对象标识向量;
输入向量序列生成模块2,用于基于上述任一样本对象对应的上述样本对象标识向量序列和上述样本对象行为向量序列生成上述任一样本对象对应的样本输入向量序列,并基于上述任一样本对象对应的上述样本对象行为向量序列获取兴趣类目序列,上述兴趣类目序列中包括的类目数量与上述样本对象标识向量序列中包括的向量数量相同;
训练模块3,用于将上述多个样本对象中各个样本对象对应的样本输入向量序列和兴趣类目序列输入兴趣向量生成模型,基于上述各个样本对象对应的上述样本输入向量序列及其对应的兴趣类目序列对上述兴趣向量生成模型进行训练,以使上述兴趣向量生成模型获得基于输入的任一对象的对象标识向量序列生成上述任一对象的兴趣类目向量序列的能力;
兴趣向量序列生成模块4,用于在获取到目标对象的目标对象标识时,基于上述目标对象标识生成上述目标对象对应的目标对象标识向量序列并输入上述兴趣向量生成模型,通过上述兴趣向量生成模型基于上述目标对象标识向量序列输出上述目标对象的目标兴趣类目向量序列,上述目标兴趣类目向量序列用于上述目标对象的兴趣资源推荐。
根据上述图2所对应的实施例,图2所示的资源推荐的兴趣向量生成方法中步骤S101至S104所描述的实现方式可由图9所示的装置的各个模块执行。例如,上述图2所示的资源推荐的兴趣向量生成方法中步骤S101所描述的实现方式可由图9所示的装置中获取模块1来执行,步骤S102所描述的实现方式可由和输入向量序列生成模块2来执行,步骤S103所描述的实现方式可由训练模块3来执行,步骤S104所描述的实现方式可由兴趣向量序列生成模块4来执行,其中,上述获取模块1、输入向量序列生成模块2、训练模块3以及兴趣向量序列生成模块4所执行的实现方式可参见上述图2所对应的实施例中各个步骤所提供的实现方式,在此不再赘述。
其中,上述训练模块3包括:
第一网络单元31,用于基于上述各个样本对象对应的上述样本输入向量序列及其对应的兴趣类目序列训练上述兴趣向量生成模型的第一损失函数;
第二网络单元32,用于对上述各个样本对象对应的上述样本输入向量序列中的样本对象行为向量序列进行对象行为向量标记以生成上述各个样本对象的样本对象行为向量标记序列,基于上述样本输入向量序列、上述各个样本对象对应的上述样本输入向量序列中的上述样本对象标识向量序列和上述样本对象行为向量标记序列训练上述兴趣向量生成模型的第二损失函数;
第三网络单元33,用于基于上述第一损失函数和上述第二损失函数生成上述兴趣向量生成模型的损失函数,以使上述兴趣向量生成模型基于上述损失函数获得输入的任一对象的对象标识向量序列输出上述任一对象的兴趣类目向量序列。
其中,上述第二网络单元32包括:
标记子单元321,用于将上述各个样本对象对应的上述样本对象行为向量序列中包括的部分样本对象行为向量标记为目标符号以生成上述各个样本对象的样本对象行为向量标记序列;
生成子单元322,用于将上述各个样本对象对应的上述样本输入向量序列中的上述样本对象标识向量序列和上述样本对象行为向量标记序列进行拼接以生成上述各个样本对象的样本标记输入向量序列;
训练子单元323,用于基于上述各个样本对象的样本标记输入向量序列和上述样本输入向量序列训练上述兴趣向量生成模型的第二损失函数。
其中,上述获取模块1包括:
第一获取单元11,用于获取上述多个样本对象中任一样本对象的任一样本对象标识,基于多个哈希函数对上述任一样本对象标识进行哈希计算以获取上述任一样本对象标识对应的多个样本对象扩展标识;
第二获取单元12,用于基于上述多个样本对象扩展标识从对象标识向量集合中确定出各个样本对象扩展标识对应的样本对象标识向量,以得到上述多个样本对象扩展标识对应的多个样本对象标识向量;
第三获取单元13,用于基于上述多个样本对象标识向量生成上述任一样本对象对应的上述样本对象标识向量序列,以得到上述各个样本对象对应的样本对象标识向量序列。
其中,上述获取模块1还包括:
第一确定单元14,获取上述多个样本对象中任一样本对象的多个样本对象行为数据,基于上述多个样本对象行为数据从对象行为向量集合中确定出各个样本对象行为数据对应的样本对象行为向量,以得到上述多个样本对象行为数据对应的多个样本对象行为向量;
第一生成单元15,基于上述多个样本对象行为向量生成上述任一样本对象对应的上述样本对象行为向量序列,以得到上述各个样本对象对应的样本对象行为向量序列。
其中,上述输入向量序列生成模块2包括:
第四获取单元21,用于获取任一样本对象对应的上述样本对象行为向量序列中各个样本对象行为向量的行为属性特征,上述行为属性特征包括资源观看时长特征、或者资源操作频次特征中的至少一种;
第二确定单元22,用于基于上述各个样本对象行为向量的行为属性特征,从上述样本对象行为向量序列中包括的所有样本对象行为向量中确定出行为属性特征的取值较大的K个样本对象行为向量;
第三确定单元23,用于将上述K个样本对象行为向量对应的资源类目确定为上述任一样本对象对应的K个兴趣类目,并基于上述K个兴趣类目生成上述任一样本对象对应的兴趣类目序列,其中K为正整数。
本申请实施例提供的资源推荐的兴趣向量生成装置通过多个不同哈希函数对样本对象的样本对象标识进行计算以获得样本对象的多个样本对象扩展标识。进一步的,基于样本对象的多个样本对象扩展标识在目标客户端存储的对象标识向量集合中进行查找,并将分别与多个样本对象扩展标识相匹配的多个对象标识向量确定为样本对象的多个样本对象标识向量,并基于多个样本对象标识向量生成该样本对象的样本对象标识向量序列。同时,本申请实施例还可以获取样本对象对应的多个样本对象行为数据,并基于多个样本对象行为数据在目标客户端存储的对象行为向量集合中进行查找,并将分别与多个样本对象行为数据相匹配的多个对象行为向量确定为样本对象的多个样本对象行为向量,并基于多个样本对象行为向量生成该样本对象的样本对象行为向量序列。此外,本申请实施例还可以基于上述样本对象行为向量序列获取样本对象的兴趣类目序列并传输给兴趣向量生成模型。进一步的,将样本对象对应的上述样本对象行为向量序列和上述样本对象标识向量序列进行拼接生成样本输入序列,并传输给兴趣向量生成模型。兴趣向量生成模型可以对样本输入序列中的样本对象行为向量序列和相应的样本对象标识向量序列进行交互学习,同时基于上述兴趣类目序列对兴趣向量生成模型中的损失函数进行训练,以使得兴趣向量生成模型获得可以基于任一对象的对象标识向量序列生成该对象的兴趣类目向量序列的能力。本申请实施例提供的兴趣向量生成方法可以基于多个哈希函数和相应的对象标识向量集合将对象标识转换为多个对象扩展标识,并且通过结合对象的对象行为向量序列将多个对象扩展标识转换为该对象的兴趣类目向量序列,且该兴趣类目向量序列中包括的多个兴趣类目向量分别用于表征该对象对不同资源类目的感兴趣程度,因此可以有效提高通过兴趣向量表征不同对象的准确性。由此可见,申请实施例的兴趣向量生成方法可以利用对象的对象标识生成相应的兴趣类目向量序列,以增强表征对象的多个兴趣向量的准确性,从而实现针对不同对象的个性化多媒体资源推荐,适用性高。
在本申请实施例中,上述图所示的装置中的各个模块可以分别或全部合并为一个或若干个另外的模块来构成,或者其中的某个(些)模块还可以再拆分为功能上更小的多个模块来构成,这可以实现同样的操作,而不影响本申请实施例的技术效果的实现。上述模块是基于逻辑功能划分的,在实际应用中,一个模块的功能也可以由多个模块来实现,或者多个模块的功能由一个模块实现。在本申请的其它可行的实现方式中,上述装置也可以包括其它模块,在实际应用中,这些功能也可以由其它模块协助实现,并且可以由多个模块协作实现,在此不做限制。
请参阅图10,图10是本申请实施例提供的计算机设备的一种结构示意图。如图10所示,该计算机设备1000可以为上述图2-图8所对应实施例中的终端设备。该计算机设备1000可以包括:处理器1001,网络接口1004和存储器1005,此外,该计算机设备1000还可以包括:用户接口1003,和至少一个通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。其中,用户接口1003可以包括显示屏(Display)、键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器1005可选的还可以是至少一个位于远离前述处理器1001的存储装置。如图10所示,作为一种计算机可读存储介质的存储器1005中可以包括操作***、网络通信模块、用户接口模块以及设备控制应用程序。
其中,该计算机设备1000中的网络接口1004还可以与上述图1所对应实施例中的终端200b进行网络连接,且可选用户接口1003还可以包括显示屏(Display)、键盘(Keyboard)。在图10所示的计算机设备1000中,网络接口1004可提供网络通讯功能;而用户接口1003主要用于为开发人员提供输入的接口;而处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现前文图2所对应实施例中资源推荐的兴趣向量生成方法。
应当理解,本申请实施例中所描述的计算机设备1000可执行前文图2所对应实施例中对资源推荐的兴趣向量生成方法的描述,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
此外,这里需要指出的是本申请实施例还提供了一种计算机可读存储介质,且上述计算机可读存储介质中存储有前文提及的多资源推荐的兴趣向量生成装置所执行的计算机程序,且上述计算机程序包括程序指令,当上述处理器执行上述程序指令时,能够执行前文图2所对应实施例中对资源推荐的兴趣向量生成方法的描述,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机可读存储介质实施例中未披露的技术细节,请参照本申请方法实施例的描述。
上述计算机可读存储介质可以是前述任一实施例提供的文本处理装置或者上述计算机设备的内部存储单元,例如计算机设备的硬盘或内存。该计算机可读存储介质也可以是该计算机设备的外部存储设备,例如该计算机设备上配备的插接式硬盘,智能存储卡(smart media card,SMC),安全数字(secure digital,SD)卡,闪存卡(flash card)等。进一步地,该计算机可读存储介质还可以既包括该计算机设备的内部存储单元也包括外部存储设备。该计算机可读存储介质用于存储该计算机程序以及该计算机设备所需的其他程序和数据。该计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
本申请实施例的说明书和权利要求书及附图中的术语“第一”、“第二”等是用于区别不同对象,而非用于描述特定顺序。此外,术语“包括”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或设备没有限定于已列出的步骤或模块,而是可选地还包括没有列出的步骤或模块,或可选地还包括对于这些过程、方法、装置、产品或设备固有的其他步骤单元。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例提供的方法及相关装置是参照本申请实施例提供的方法流程图和/或结构示意图来描述的,具体可由计算机程序指令实现方法流程图和/或结构示意图的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。这些计算机程序指令可提供到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或结构示意图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或结构示意图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或结构示意一个方框或多个方框中指定的功能的步骤。
以上所揭露的仅为本申请较佳实施例而已,当然不能以此来限定本申请之权利范围,因此依本申请权利要求所作的等同变化,仍属本申请所涵盖的范围。

Claims (10)

1.一种资源推荐的兴趣向量生成方法,其特征在于,包括:
获取多个样本对象对应的多个样本数据,其中,任一样本对象对应的样本数据中包括样本对象标识向量序列以及样本对象行为向量序列,所述任一样本对象对应的所述样本对象标识向量序列中包括基于所述任一样本对象的样本对象标识生成的多个样本对象标识向量;
基于所述任一样本对象对应的所述样本对象标识向量序列和所述样本对象行为向量序列生成所述任一样本对象对应的样本输入向量序列,并基于所述任一样本对象对应的所述样本对象行为向量序列获取兴趣类目序列,所述兴趣类目序列中包括的类目数量与所述样本对象标识向量序列中包括的向量数量相同;
将所述多个样本对象中各个样本对象对应的样本输入向量序列和兴趣类目序列输入兴趣向量生成模型,基于所述各个样本对象对应的所述样本输入向量序列及其对应的兴趣类目序列对所述兴趣向量生成模型进行训练,以使所述兴趣向量生成模型获得基于输入的任一对象的对象标识向量序列生成所述任一对象的兴趣类目向量序列的能力;
当获取到目标对象的目标对象标识时,基于所述目标对象标识生成所述目标对象对应的目标对象标识向量序列并输入所述兴趣向量生成模型,通过所述兴趣向量生成模型基于所述目标对象标识向量序列输出所述目标对象的目标兴趣类目向量序列,所述目标兴趣类目向量序列用于所述目标对象的兴趣资源推荐。
2.根据权利要求1所述的方法,其特征在于,所述基于所述各个样本对象对应的所述样本输入向量序列及其对应的兴趣类目序列对所述兴趣向量生成模型进行训练包括:
基于所述各个样本对象对应的所述样本输入向量序列及其对应的兴趣类目序列训练所述兴趣向量生成模型的第一损失函数;
对所述各个样本对象对应的所述样本输入向量序列中的样本对象行为向量序列进行对象行为向量标记以生成所述各个样本对象的样本对象行为向量标记序列,基于所述样本输入向量序列、所述各个样本对象对应的所述样本输入向量序列中的所述样本对象标识向量序列和所述样本对象行为向量标记序列训练所述兴趣向量生成模型的第二损失函数;
基于所述第一损失函数和所述第二损失函数生成所述兴趣向量生成模型的损失函数,以使所述兴趣向量生成模型基于所述损失函数获得输入的任一对象的对象标识向量序列输出所述任一对象的兴趣类目向量序列。
3.根据权利要求2所述的方法,其特征在于,所述对所述各个样本对象对应的所述样本输入向量序列中的样本对象行为向量序列进行对象行为标记以生成所述各个样本对象的样本对象行为向量标记序列,基于所述样本输入向量序列、所述各个样本对象对应的所述样本输入向量序列中的所述样本对象标识向量序列和所述样本对象行为向量标记序列训练所述兴趣向量生成模型的第二损失函数包括:
将所述各个样本对象对应的所述样本对象行为向量序列中包括的部分样本对象行为向量标记为目标符号以生成所述各个样本对象的样本对象行为向量标记序列;
将所述各个样本对象对应的所述样本输入向量序列中的所述样本对象标识向量序列和所述样本对象行为向量标记序列进行拼接以生成所述各个样本对象的样本标记输入向量序列;
基于所述各个样本对象的样本标记输入向量序列和所述样本输入向量序列训练所述兴趣向量生成模型的第二损失函数。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述获取多个样本对象对应的多个样本数据包括:
获取所述多个样本对象中任一样本对象的任一样本对象标识,基于多个哈希函数对所述任一样本对象标识进行哈希计算以获取所述任一样本对象标识对应的多个样本对象扩展标识;
基于所述多个样本对象扩展标识从对象标识向量集合中确定出各个样本对象扩展标识对应的样本对象标识向量,以得到所述多个样本对象扩展标识对应的多个样本对象标识向量;
基于所述多个样本对象标识向量生成所述任一样本对象对应的所述样本对象标识向量序列,以得到所述各个样本对象对应的样本对象标识向量序列。
5.根据权利要求4所述的方法,其特征在于,所述获取多个样本对象对应的多个样本数据还包括:
获取所述多个样本对象中任一样本对象的多个样本对象行为数据,基于所述多个样本对象行为数据从对象行为向量集合中确定出各个样本对象行为数据对应的样本对象行为向量,以得到所述多个样本对象行为数据对应的多个样本对象行为向量;
基于所述多个样本对象行为向量生成所述任一样本对象对应的所述样本对象行为向量序列,以得到所述各个样本对象对应的样本对象行为向量序列。
6.根据权利要求5所述的方法,其特征在于,所述基于所述任一样本对象对应的所述样本对象行为向量序列获取兴趣类目序列包括:
获取任一样本对象对应的所述样本对象行为向量序列中各个样本对象行为向量的行为属性特征,所述行为属性特征包括资源观看时长特征、或者资源操作频次特征中的至少一种;
基于所述各个样本对象行为向量的行为属性特征,从所述样本对象行为向量序列中包括的所有样本对象行为向量中确定出行为属性特征的取值较大的K个样本对象行为向量;
将所述K个样本对象行为向量对应的资源类目确定为所述任一样本对象对应的K个兴趣类目,并基于所述K个兴趣类目生成所述任一样本对象对应的兴趣类目序列,其中K为正整数。
7.一种资源推荐的兴趣向量生成装置,其特征在于,包括:
获取模块,用于获取多个样本对象对应的多个样本数据,其中,任一样本对象对应的样本数据中包括样本对象标识向量序列以及样本对象行为向量序列,所述任一样本对象对应的所述样本对象标识向量序列中包括基于所述任一样本对象的样本对象标识生成的多个样本对象标识向量;
输入向量序列生成模块,用于基于所述任一样本对象对应的所述样本对象标识向量序列和所述样本对象行为向量序列生成所述任一样本对象对应的样本输入向量序列,并基于所述任一样本对象对应的所述样本对象行为向量序列获取兴趣类目序列,所述兴趣类目序列中包括的类目数量与所述样本对象标识向量序列中包括的向量数量相同;
训练模块,用于将所述多个样本对象中各个样本对象对应的样本输入向量序列和兴趣类目序列输入兴趣向量生成模型,基于所述各个样本对象对应的所述样本输入向量序列及其对应的兴趣类目序列对所述兴趣向量生成模型进行训练,以使所述兴趣向量生成模型获得基于输入的任一对象的对象标识向量序列生成所述任一对象的兴趣类目向量序列的能力;
兴趣向量序列生成模块,用于在获取到目标对象的目标对象标识时,基于所述目标对象标识生成所述目标对象对应的目标对象标识向量序列并输入所述兴趣向量生成模型,通过所述兴趣向量生成模型基于所述目标对象标识向量序列输出所述目标对象的目标兴趣类目向量序列,所述目标兴趣类目向量序列用于所述目标对象的兴趣资源推荐。
8.根据权利要求7所述的装置,其特征在于,所述训练模块还包括:
第一网络单元,用于基于所述各个样本对象对应的所述样本输入向量序列及其对应的兴趣类目序列训练所述兴趣向量生成模型的第一损失函数;
第二网络单元,用于对所述各个样本对象对应的所述样本输入向量序列中的样本对象行为向量序列进行对象行为向量标记以生成所述各个样本对象的样本对象行为向量标记序列,基于所述样本输入向量序列、所述各个样本对象对应的所述样本输入向量序列中的所述样本对象标识向量序列和所述样本对象行为向量标记序列训练所述兴趣向量生成模型的第二损失函数;
第三网络单元,用于基于所述第一损失函数和所述第二损失函数生成所述兴趣向量生成模型的损失函数,以使所述兴趣向量生成模型基于所述损失函数获得输入的任一对象的对象标识向量序列输出所述任一对象的兴趣类目向量序列。
9.一种计算机设备,其特征在于,包括:处理器、存储器以及网络接口;
所述处理器与所述存储器、所述网络接口相连,其中,所述网络接口用于提供数据通信功能,所述存储器用于存储程序代码,所述处理器用于调用所述程序代码,以执行权利要求1至6中任一项所述方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行时,执行权利要求1至6中任一项所述方法的步骤。
CN202211612006.5A 2022-12-13 2022-12-13 资源推荐的兴趣向量生成方法、装置、设备及存储介质 Pending CN117216365A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211612006.5A CN117216365A (zh) 2022-12-13 2022-12-13 资源推荐的兴趣向量生成方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211612006.5A CN117216365A (zh) 2022-12-13 2022-12-13 资源推荐的兴趣向量生成方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN117216365A true CN117216365A (zh) 2023-12-12

Family

ID=89037603

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211612006.5A Pending CN117216365A (zh) 2022-12-13 2022-12-13 资源推荐的兴趣向量生成方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN117216365A (zh)

Similar Documents

Publication Publication Date Title
US20220391773A1 (en) Method and system for artificial intelligence learning using messaging service and method and system for relaying answer using artificial intelligence
CN110781347A (zh) 一种视频处理方法、装置、设备以及可读存储介质
US20050223315A1 (en) Information sharing device and information sharing method
CN111738010B (zh) 用于生成语义匹配模型的方法和装置
CN103781522A (zh) 用于生成并加入经验共享的方法和***
CN103946886A (zh) 社交网络***上的结构对象和动作
US20240061899A1 (en) Conference information query method and apparatus, storage medium, terminal device, and server
CN109460503A (zh) 答案输入方法、装置、存储介质及电子设备
CN109933217A (zh) 用于推送语句的方法和装置
CN111897950A (zh) 用于生成信息的方法和装置
CN116775815B (zh) 对话数据的处理方法、装置、电子设备及存储介质
CN116955591A (zh) 用于内容推荐的推荐语生成方法、相关装置和介质
US20230367972A1 (en) Method and apparatus for processing model data, electronic device, and computer readable medium
CN112182255A (zh) 用于存储媒体文件和用于检索媒体文件的方法和装置
CN112446214A (zh) 广告关键词的生成方法、装置、设备及存储介质
CN111933133A (zh) 智能客服应答的方法及装置、电子设备、存储介质
CN114419514B (zh) 一种数据处理方法、装置、计算机设备及存储介质
CN112749553B (zh) 视频文件的文本信息处理方法、装置和服务器
CN117216365A (zh) 资源推荐的兴趣向量生成方法、装置、设备及存储介质
CN112307324B (zh) 信息处理方法、装置、设备和介质
CN113761272A (zh) 一种数据处理方法、设备以及计算机可读存储介质
CN111611420A (zh) 用于生成图像描述信息的方法和装置
CN111897951A (zh) 用于生成信息的方法和装置
CN112348614A (zh) 用于推送信息的方法和装置
CN112182290A (zh) 一种信息处理方法、装置和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication