CN117009556A - 一种基于评估模型的内容推荐方法及相关装置 - Google Patents

一种基于评估模型的内容推荐方法及相关装置 Download PDF

Info

Publication number
CN117009556A
CN117009556A CN202211523991.2A CN202211523991A CN117009556A CN 117009556 A CN117009556 A CN 117009556A CN 202211523991 A CN202211523991 A CN 202211523991A CN 117009556 A CN117009556 A CN 117009556A
Authority
CN
China
Prior art keywords
full
scene
media content
candidate media
connection layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211523991.2A
Other languages
English (en)
Inventor
陈煜钊
罗达
黄春振
林康熠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202211523991.2A priority Critical patent/CN117009556A/zh
Publication of CN117009556A publication Critical patent/CN117009556A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/435Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/438Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及人工智能技术领域,提供一种基于评估模型的内容推荐方法及相关装置,用以提高评估值的预测准确性,从而提高推荐准确性,其中,评估模型包括元网络模块和预测模块,该方法包括:获取候选媒体内容的属性特征后,将属性特征中的场景特异特征,分别输入至元网络模块的各第一全连接层进行参数预测,获得相应的模型参数集,然后,基于获得的各模型参数集,分别对各第二全连接层进行参数配置,并分别将属性特征输入至各第二全连接层中进行预测,获得相应的评估值,最后,基于评估值进行内容推荐。这样,可以有效地提取出数据源相关的关键信息,使得模型参数可以根据数据源动态进行调整,从而提高了评估值的预测准确性。

Description

一种基于评估模型的内容推荐方法及相关装置
技术领域
本申请涉及人工智能技术领域,提供一种基于评估模型的内容推荐方法及相关装置。
背景技术
随着科技的发展,推荐***广泛应用于在电商、搜索、视频等领域。推荐***中,采用评估模型来预测目标对象针对各候选媒体内容的点击率,进而基于预测的点击率,从各候选媒体内容中,确定向目标对象推荐的目标媒体内容。
相关技术中,通常对待训练的评估模型进行模型训练,得到训练后的评估模型,然后采用训练后的评估模型,预测目标对象针对各候选媒体内容的点击率。
然而,训练后的评估模型的模型参数在训练结束后往往是固定的,针对数据源不同的各候选媒体内容,其内容形态不同,固定的模型参数难以准确衡量来自不同数据源的推荐内容之间的差异,从而导致评估模型难以准确地进行点击率预测,最终使得推荐***的召回不够精确,导致推荐的多媒体内容的准确性较低。
发明内容
本申请实施例提供一种基于评估模型的内容推荐方法及相关装置,用以提高评估值的预测准确性,从而提高推荐准确性。
第一方面,本申请实施例提供一种基于评估模型的内容推荐方法,所述评估模型包括元网络模块和预测模块,所述元网络模块包含各第一全连接层,所述预测模块包含与所述各第一全连接层对应的节点数相同的各第二全连接层,所述方法包括:
获取候选媒体内容的属性特征,所述属性特征中包含场景特异特征;
将所述场景特异特征,分别输入至所述各第一全连接层进行参数预测,获得所述各第一全连接层各自输出的模型参数集;所述各第一全连接层是通过模型训练得到的;
基于获得的各模型参数集,分别对所述各第二全连接层进行参数配置,并分别将所述属性特征输入至所述各第二全连接层中进行预测,获得所述候选媒体内容的评估值;
当所述评估值满足预设推荐条件时,将所述候选媒体内容作为目标推荐内容。
第二方面,本申请实施例提供一种基于评估模型的内容推荐装置,所述评估模型包括元网络模块和预测模块,所述元网络模块包含各第一全连接层,所述预测模块包含与所述各第一全连接层对应的节点数相同的各第二全连接层,所述装置包括:
获取单元,用于获取候选媒体内容的属性特征,所述属性特征中包含场景特异特征;
元网络单元,用于将所述场景特异特征,分别输入至所述各第一全连接层进行参数预测,获得所述各第一全连接层各自输出的模型参数集;所述各第一全连接层是通过模型训练得到的;
预估单元,用于基于获得的各模型参数集,分别对所述各第二全连接层进行参数配置,并分别将所述属性特征输入至所述各第二全连接层中进行预测,获得所述候选媒体内容的评估值;
推荐单元,用于当所述评估值满足预设推荐条件时,将所述候选媒体内容作为目标推荐内容。
作为一种可能的实现方式,所述基于获得的各模型参数集,分别对所述各第二全连接层进行参数配置时,预估单元具体用于:
基于所述各第二全连接层之间的设定连接顺序,依次针对所述各第二全连接层中的每个第二全连接层,执行以下操作:
针对一个第二全连接层,基于所述各第一全连接层与所述各第二全连接层之间的对应关系,从所述各第一全连接层中,确定与所述一个第二全连接层对应的一个第一全连接层;
基于所述一个第一全连接层输出的模型参数集,对所述一个第二全连接层进行参数配置。
作为一种可能的实现方式,所述各第二全连接层按照设定连接顺序连接,所述分别将所述属性特征输入至所述各第二全连接层中进行预测,获得所述候选媒体内容的评估值时,预估单元具体用于:
基于所述设定连接顺序,针对所述各第二全连接层中的每个第二全连接层,依次执行以下操作:
针对一个第二全连接层,对前一个第二全连接层输出的映射特征进行线性变换,得到线性映射特征;其中,第一个第二全连接层的输入为所述属性特征;
对所述线性映射特征进行非线性映射,得到所述一个第二全连接层输出的映射特征,其中,所述候选媒体内容的评估值是基于最后一个第二全连接层输出的映射特征得到的。
作为一种可能的实现方式,所述获取候选媒体内容的属性特征时,获取单元具体用于:
针对目标对象和所述候选媒体内容,基于设定的对象属性,获得所述目标对象的对象特征,以及基于设定的内容属性,获得所述候选媒体内容的内容特征;
基于所述候选媒体内容与所述目标对象之间的历史推荐信息,获得所述候选媒体内容的场景特异特征;
基于所述场景特异特征、所述对象特征和所述内容特征,得到所述候选媒体内容的属性特征。
作为一种可能的实现方式,所述基于所述候选媒体内容与所述目标对象之间的历史推荐信息,获得所述候选媒体内容的场景特异特征时,获取单元1301具体用于:
基于针对所述候选媒体内容所属的目标数据源设定的目标场景属性,对所述候选媒体内容与所述目标对象之间的历史推荐信息进行信息提取,获得所述候选媒体内容的目标场景特征;
基于针对其他数据源设定的其他场景属性,采用设定属性值,作为所述候选媒体内容的其他场景特征;
基于所述目标场景特征和所述其他场景特征,获得所述场景特异特征。
作为一种可能的实现方式,所述基于针对所述候选媒体内容所属的目标数据源设定的目标场景属性,对所述候选媒体内容与所述目标对象之间的历史推荐信息进行信息提取,获得所述候选媒体内容的目标场景特征时,获取单元具体用于:
若所述候选媒体信息为图文信息,所述图文信息所属的目标数据源为第一数据源,则基于针对所述第一数据源设定的目标场景属性,对所述图文信息与所述目标对象之间的历史推荐信息进行信息提取,获得所述目标场景特征;
若所述候选媒体信息为视频,所述视频所属的目标数据源为第二数据源,则基于针对所述第二数据源设定的目标场景属性,对所述视频与所述目标对象之间的历史推荐信息进行信息提取,获得所述目标场景特征。
作为一种可能的实现方式,所述评估值用于表征所述目标对象点击所述候选媒体内容的概率;
所述当所述评估值满足预设推荐条件时,将所述候选媒体内容作为目标推荐内容时,推荐单元具体用于;
获取其他媒体内容的评估值,并基于所述其他媒体内容和所述媒体内容各自的评估值,对所述其他媒体内容和所述媒体内容进行排序;
当基于排序结果,确定所述候选媒体内容位于设定次序范围内时,将所述候选媒体内容作为目标推荐内容。
第三方面,本申请实施例提供一种电子设备,包括处理器和存储器,其中,所述存储器存储有计算机程序,当所述计算机程序被所述处理器执行时,使得所述处理器执行上述基于评估模型的内容推荐方法的步骤。
第四方面,本申请实施例提供一种计算机可读存储介质,其包括计算机程序,当所述计算机程序在电子设备上运行时,所述计算机程序用于使所述电子设备执行上述基于评估模型的内容推荐方法的步骤。
第五方面,本申请实施例提供一种计算机程序产品,所述程序产品包括计算机程序,所述计算机程序存储在计算机可读存储介质中,电子设备的处理器从所述计算机可读存储介质中读取并执行所述计算机程序,使得电子设备执行上述基于评估模型的内容推荐方法的步骤。
本申请实施例中,提供一种基于评估模型的内容推荐方法,评估模型由元网络模块和预测模块构成,具体的,获取候选媒体内容的属性特征,然后,将属性特征中的场景特异特征,分别输入至元网络模块的各第一全连接层进行参数预测,获得各第一全连接层各自输出的模型参数集;之后,基于获得的各模型参数集,分别对各第二全连接层进行参数配置,并分别将属性特征输入至各第二全连接层中进行预测,获得相应的评估值,最后,当评估值满足预设推荐条件时,将候选媒体内容作为目标推荐内容。
这样,利用候选媒体内容的场景特异特征,采用元网络模块得到预测模块的模型参数,可以有效地从候选媒体内容的复杂特征中提取出数据源相关的关键信息,使得预测模块的模型参数可以根据数据源动态进行调整,从而提高评估模型的评估准确性,进而提高推荐准确性。此外,由于利用场景特异特征得到模型参数,即便多种信息源的内容占比差距较大,模型参数也可以较好的体现出不同信息源之间的差异性,从而进一步提高了评估模型的评估准确性。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例中提供的一种应用场景示意图;
图2为本申请实施例中提供的一种评估模型的结构示意图;
图3A为本申请实施例中提供的一种元网络模块的结构示意图;
图3B为本申请实施例中提供的一种预估模块的结构示意图;
图4为本申请实施例中提供的一种属性特征的结构示意图;
图5为本申请实施例中提供的一种评估模型训练方法的流程示意图;
图6为本申请实施例中提供的一种元网络模块的参数预测过程的流程示意图;
图7为本申请实施例中提供的一种特征矩阵的获得过程的逻辑示意图;
图8为本申请实施例中提供的一种参数配置的逻辑示意图;
图9为本申请实施例中提供的一种针对第一层第二全连接层的参数配置的逻辑示意图;
图10为本申请实施例中提供的一种基于评估模型的内容推荐方法的流程示意图;
图11为本申请实施例中提供的一种应用场景中的推荐过程的逻辑示意图;
图12为本申请实施例中提供的另一种应用场景中的推荐过程的逻辑流程示意图;
图13为本申请实施例中提供的一种装置的结构示意图;
图14为本申请实施例中提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请技术方案的一部分实施例,而不是全部的实施例。基于本申请文件中记载的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请技术方案保护的范围。
本申请实施例涉及人工智能和机器学习技术,主要基于人工智能中的机器学习而设计。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互***、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习、自动驾驶、智慧交通等几大方向。
机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习等技术。人工神经网络(Artificial Neural Network,ANN),从信息处理角度对人脑神经元网络进行抽象,建立某种简单模型,按不同的连接方式组成不同的网络。神经网络是一种运算模型,由大量的节点(或称神经元)之间相互联接构成,每个节点代表一种特定的输出函数,称为激励函数(activation function),每两个节点间的连接都代表一个对于通过该连接信号的加权值,称之为权重,这相当于人工神经网络的记忆,网络的输出则依网络的连接方式,权重值和激励函数的不同而不同,而网络自身通常都是对自然界某种算法或者函数的逼近,也可能是对一种逻辑策略的表达。
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服、车联网、自动驾驶、智慧交通等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
本申请实施例提供的方案涉及人工智能的机器学习技术。本申请实施例中利用样本媒体内容采用机器学习技术得到评估模型,进而在实际的内容推荐过程中,利用学习得到的评估模型,对候选媒体内容进行评估,得到相应的目标评估值。
具体的,本申请实施例中涉及训练部分和应用部分。其中,在训练部分中,通过机器学习这一技术训练评估模型,使得基于本申请实施例中给出的训练样本对以及训练方法训练评估模型,并通过优化算法不断调整模型参数,直至模型收敛;应用部分用于使用在训练部分训练得到的评估模型进行参数值评估,进而进行内容推荐。另外,还需要说明的是,本申请实施例中评估可以是在线训练,也可以是离线训练,在此不做具体限定,在本文中是以离线训练为例进行举例说明的。
相关技术中,针对推荐***,通常对待训练的评估模型进行模型训练,得到训练后的评估模型,然后采用训练后的评估模型,预测目标对象针对各候选内容的点击率,进而基于预测的点击率,从各候选内容中确定向目标对象推荐的目标内容。
然而,然而,训练后的评估模型的模型参数在训练结束后往往是固定的,针对数据源不同的各候选媒体内容,其内容形态不同,固定的模型参数难以准确衡量来自不同数据源的推荐内容之间的差异,从而导致评估模型难以准确地进行点击率预测,最终使得推荐***的召回不够精确,导致推荐的媒体内容的准确性较低。
鉴于此,本申请实施例中,提供一种基于评估模型的内容推荐方法,评估模型由元网络模块和预测模块构成,具体的,获取候选媒体内容的属性特征,然后,将属性特征中的场景特异特征,分别输入至元网络模块的各第一全连接层进行参数预测,获得各第一全连接层各自输出的模型参数集;之后,基于获得的各模型参数集,分别对各第二全连接层进行参数配置,并分别将属性特征输入至各第二全连接层中进行预测,获得相应的评估值,最后,当评估值满足预设推荐条件时,将候选媒体内容作为目标推荐内容。
这样,利用候选媒体内容的场景特异特征,采用元网络模块得到预测模块的模型参数,可以有效地从候选媒体内容的复杂特征中提取出数据源相关的关键信息,使得预测模块的模型参数可以根据数据源动态进行动态调整,从而提高评估模型的评估准确性,进而提高推荐准确性。此外,由于利用场景特异特征得到模型参数,即便多种信息源的内容占比差距较大,模型参数也可以较好的体现出不同信息源之间的差异性,从而进一步提高了评估模型的评估准确性。
下面对本申请实施例的技术方案能够适用的应用场景做一些简单介绍,需要说明的是,以下介绍的应用场景仅用于说明本申请实施例而非限定。在具体实施过程中,可以根据实际需要灵活地应用本申请实施例提供的技术方案。
参阅图1所示,为本申请实施例提供的一种应用场景示意图,在该场景中,可以包括终端设备101和服务器102。
在一种实施方式中,终端设备101例如可以为目标对象自身拥有的设备,如可以为手机、平板电脑(PAD)、笔记本电脑、台式电脑、智能电视、智能车载设备以及智能可穿戴设备等。终端设备101可以安装有具有内容推荐功能的应用,例如视频应用、购物应用、即时通讯应用等,本申请实施例涉及的应用可以是软件客户端,也可以是网页、小程序等客户端,服务器则是与软件或是网页、小程序等相对应的后台服务器,不限制客户端的具体类型。
服务器102可以为终端设备101上安装的具有内容推荐功能的应用所对应的后台服务器,其可以提供推荐***的后台服务功能,例如实现本申请实施例所提供的评估模型的训练方法以及内容推荐方法的步骤。服务器102例如可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式***,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、即内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器,但并不局限于此。
在一种实施方式中,评估模型的训练过程可以由服务器102来执行,以利用服务器102的计算资源快速的实现评估模型的训练,也可以由终端设备101执行。评估模型的训练过程可以由服务器102来执行,还可以是有终端设备101参与执行的。例如,终端设备101获取候选媒体内容的属性特征后,向服务器102传输候选媒体内容的属性特征,服务器102利用训练得到的评估模型,确定候选媒体内容的目标评估值,进而根据目标评估值进行内容推荐。或者,终端设备101可以将候选媒体内容的场景特异特征传输给服务器102,服务器102基于候选媒体内容的场景特异特征,获得候选媒体内容的属性特征,然后利用训练得到的评估模型,确定候选媒体内容的目标评估值,进而根据目标评估值进行内容推荐。
终端设备101和服务器102之间可以通过一个或者多个网络进行直接或间接的通信连接。该网络可以是有线网络,也可以是无线网络,例如无线网络可以是移动蜂窝网络,或者可以是无线保真(Wireless-Fidelity,WIFI)网络,当然还可以是其他可能的网络,本发明实施例对此不做限制。
需要说明的是,在本申请实施例中,终端设备101的数量可以为一个,也可以为多个,同样的,服务器102的数量也可以为一个,也可以为多个,也就是说对于,终端设备101或者服务器102的数量并不进行限制。
在一种可能的应用场景中,本申请实施例中涉及的相关数据(如特征向量等)以及模型参数可以采用云存储(cloud storage)技术进行存储。云存储是在云计算概念上延伸和发展出来的一个新的概念,分布式云存储***是指通过集群应用、网格技术以及分布存储文件***等功能,将网络中大量各种不同类型的存储设备(或称存储节点)通过应用软件或应用接口集合起来协同工作,共同对外提供数据存储和业务访问功能的一个存储***。
当然,本申请实施例提供的方法并不限用于图1所示的应用场景中,还可以用于其他可能的应用场景,本申请实施例并不进行限制。对于图1所示的应用场景的各个设备所能实现的功能将在后续的方法实施例中一并进行描述,在此先不过多赘述。
本申请各实施例中提供的方法流程,可以通过图1中的服务器102或者终端设备101来执行,也可以由服务器102和终端设备101共同执行,这里主要以服务器102来执行为例进行介绍。
本申请实施例中,推荐模型的训练过程是一个利用训练样本进行多次循环迭代训练的过程,其主要可以包括模型设计阶段、数据准备阶段和迭代训练阶段,下面将分别进行介绍。
(1)模型设计阶段
参阅图2所示,其为本申请实施例的评估参数预测模型的架构示意图。其中,评估参数预测模型包括元网络模块、预估模块,元网络模块用于对场景特异特征进行识别,获得相应的模型参数,预估模块用于对混排特征进行评估,获得相应的评估值。
如图2所示,元网络模块对场景特异特征进行识别,获得相应的模型参数后,将模型参数传递给预估模块,预估模块将来自元网络模块的模型参数,作为预估模块的模型参数,然后对属性特征进行评估,获得相应的评估值。
在一种实施方式中,元网络模块包含各第一全连接层,预测模块包含与各第一全连接层对应的节点数相同的各第二全连接层。下面以全连接层的数量为L为例。
参阅图3A所示,其为本申请实施例中提供的一种元网络模块的结构示意图。元网络模块中包含有L个第一全连接层,L个第一全连接层之间为并列关系。每个第一全连接层用于基于样本媒体内容或候选媒体内容的场景特异特征进行参数预测,获得相应的模型参数集,模型参数集也可以称为元权重,通过L个第一全连接层,可以得到L个元权重。
参阅图3B所示,其为本申请实施例中提供的一种预估模块的结构示意图。预估模块中,以样本媒体内容或候选媒体内容的属性特征作为输入,将L个元权重以全连接网络的形式,对应属性特征进行动态交叉,以得到相应的评估值,具体的,预估模块中包含有L个第二全连接层,L个第二全连接层分别与L个第一全连接层对应,L个第二全连接层中,每一层的输入为前面一层的输出。图3B中,采用圆圈表示全连接层中的节点,假设,L个第一全连接层各自的节点数分别为D1、D2、……、DL-1、1,第一个第一全连接层和第一个第二全连接层的节点数均为D1,第二个第一全连接层和第二个第二全连接层的节点数均为D2,类似的,不再赘述。
上述模型所执行的数据处理过程将在后续的过程中进行详细的介绍,因而在此不在过多赘述。
(2)数据准备阶段
本申请实施例中,各样本数据通常为多源异构数据,多源异构数据是指数据源不同、数据类型不同的数据,各样本数据也可以称为混排数据。例如,在即时通讯应用中包含订阅号和视频号,订阅号消息的数据类型通常为图文,视频号消息的数据类型通常为视频,订阅号消息和视频号消息为多源异构数据。又例如,在购物应用中,商品和直播间为多源异构数据。再例如,在视频应用中,长视频和短视频为多源异构数据。需要说明的是,本申请实施例中,不同数据源也可以直接理解为不同应用场景。
本申请实施例中,为所有的样本数据维护一套统一的特征字段,称为混排统一特征。混排统一特征也可以称为属性特征。需要说明的是,本申请实施例中,样本数据也可以称为样本媒体内容。
在一种实现方式中,一个样本媒体内容的混排统一特征可以包含样本对象的对象属性、该样本媒体内容的内容属性以及场景特异特征。
具体的,任意一个样本媒体内容的属性特征均可以通过以下方式得到:
首先,针对一个样本媒体内容,基于设定的对象属性,获得样本对象的对象特征,以及基于设定的内容属性,获得样本媒体内容的内容特征;
其次,基于样本媒体内容与样本对象之间的历史推荐信息,获得样本媒体内容的场景特异特征;
最后,基于场景特异特征、对象特征和内容特征,得到样本媒体内容的属性特征。
其中,对象属性包含但不限于是对象标识、对象感兴趣的类目、样本对象在一定时间内(如过去一周)的曝光点击率等。内容属性包括但不限于是内容标识等。对象标识、内容标识可以采用序列号(ID)表示,但不局限于此。历史推荐信息包含但不限于曝光次数、点击次数和曝光点击率中的一项或多项。
例如,样本媒体内容为来自视频号A的视频1,样本对象为小明,视频号A为科普类视频号,视频1为鸟类鉴别视频,基于对象属性:对象ID,获得小明的对象特征,小明的对象特征的取值为useID1001,基于对象属性:内容ID,获得视频1的内容特征,视频1的内容特征的取值为itemID2334,然后,基于小明与视频1之间的历史推荐信息,获得样本媒体内容的场景特异特征,之后,基于场景特异特征、对象特征和内容特征,得到样本媒体内容的属性特征。
通过上述实现方式,由于属性特征中包含有场景特异特征、对象特征和内容特征,即对象与媒体内容的各项属性,后续进行模型训练时,可以使评估模型学习到对象与媒体内容之间的关系,进而输出对象点击媒体内容的概率。
在一种实现方式中,场景特异特征中包含有各数据源的场景属性对应的场景特征。一个数据源的场景属性中可以包含有以下属性中的一项或多项:样本对象在第一时长内对样本媒体内容的历史推荐信息;样本对象在第二时长内对样本媒体内容所属的数据源的历史推荐信息。
具体的,任意一个样本媒体内容场景特异特征可以通过以下方式得到:
首先,基于针对样本媒体内容所属的目标数据源设定的目标场景属性,对样本媒体内容与样本对象之间的历史推荐信息进行信息提取,获得样本媒体内容的目标场景特征;
其次,基于针对其他数据源设定的其他场景属性,采用设定属性值,作为候选媒体内容的其他场景特征;
最后,基于目标场景特征和其他场景特征,获得场景特异特征。
其中,样本对象在第二时长内对样本媒体内容所属的数据源的历史推荐信息是指,样本对象在第一时长内针对该数据源中的各项媒体内容的历史推荐信息的汇总数据,汇总数据可以是总值,也可以是均值,但不局限于此。第一时长、第二时长可以是一段时间,也可以是多段时间,对此不作限制。第一时长与第二时长可以相同,也可以不同。
以即时通讯应用中订阅号消息和视频号消息的混合排序推荐场景为例进行说明,针对订阅号设定的场景属性包括:样本对象在第一时长内对图文信息的历史推荐信息、样本对象在第二时长内对样本订阅号消息所属的订阅号的历史推荐信,针对视频号设定的场景属性包括:样本对象在第一时长内对样本视频的历史推荐信息、样本对象在第二时长内对样本视频所属的视频号的历史推荐信息。
针对一个样本数据,场景特异特征中各数据源的场景属性的取值,取决于该样本数据中样本媒体内容所属的数据源。作为一种情况,若样本媒体信息为图文信息,图文信息所属的目标数据源为第一数据源,则基于针对第一数据源设定的目标场景属性,对图文信息与样本对象之间的历史推荐信息进行信息提取,获得目标场景特征。作为另一种情况,若样本媒体信息为视频,视频所属的目标数据源为第二数据源,则基于针对第二数据源设定的目标场景属性,对视频与样本对象之间的历史推荐信息进行信息提取,获得目标场景特征。在订阅号消息和视频号消息的混合排序推荐场景中,第一数据源为订阅号,第二数据源为视频号。需要说明的是,本申请实施例中仅以两个数据源进行说明,在实际应用过程中,数据源的数目也可以超过两个。
也就是说,参阅图4所示,属性特征中包括对象特征、内容特征和场景特异特征,其中,场景特异特征包括订阅号的场景属性和视频号的场景属性对应的特征,如果样本媒体内容为订阅号消息,即图文信息,那么订阅号的场景属性有取值,而视频号的场景属性采用设定属性值。如果样本媒体内容为视频号消息,那么视频号的场景属性有取值,而订阅号的场景属性采用设定属性值。示例性的,设定属性值为0。
例如,样本推荐内容为来自视频号A的视频1,样本对象为小明,视频号1中还发布有视频2和视频3,样本数据的场景特异特征包含:小明在过去1天、过去7天内对视频1、视频2和视频3的总曝光次数、总点击次数和总曝光点击率;小明在过去1天、过去7天内对视频1的曝光次数、点击次数和曝光点击率;小明在过去1天、过去7天内对订阅号的总曝光次数、总点击次数和总曝光点击率;小明在过去1天、过去7天内对样本视频的总曝光次数、总点击次数和总曝光点击率,其中,小明在过去1天、过去7天内对订阅号的总曝光次数、总点击次数和总曝光点击率的取值均为0,小明在过去1天、过去7天内对样本视频的总曝光次数、总点击次数和总曝光点击率的取值均为0。
通过上述实现方式,通过场景特异特征中融合各数据源的场景特征,使得模型支持多源异构数据的输入,进而通过模型中元网络模块的学习,可以针对来自不同的数据源的媒体内容,即来自不同的应用场景的媒体数据,获取到更为准确的与应用场景对应的模型参数,从而提高模型的评估准确率,进而提高推荐***的推荐效果。
需要说明的是,场景特异特征可以是先验的业务知识和专家经验设定的,在实际应用过程中,可根据应用场景进行调整,对此不作限定。
(3)迭代训练阶段
本申请实施例中,训练数据准备完成后,则可以利用这些训练数据对构建的模型进行训练。
在一种实施方式中,可以根据上述模型的结构,设置好批次(batch)、迭代次数(epoch)和学习率(learning rate)等超参数后,开始训练,最终得到评估模型。
例如,设置评估模型的batch为128,epoch为1000,learning rate为0.0001,即迭代训练1000次,每一次迭代将训练样本分为128批次进行学习。当然,这里的训练参数仅仅为一种可能的示例,在实际情况中还可以根据需求进行调整。
参见图5所示,为本申请实施例提供的评估模型训练方法的流程示意图。在迭代训练过程中,将所有训练样本划分为指定的批次,并基于各个次批次的训练样本进行训练,由于每一次迭代过程中针对每一批次进行训练时所执行的步骤是类似的,因此这里以针对一个批次的训练为例进行说明。
S501、将各样本媒体内容各自的场景特异特征,分别输入至各第一全连接层进行参数预测,获得相应的各第一全连接层各自输出的模型参数集。
本申请实施例中,每个样本媒体内容可以对应设置有真实标签,真实标签表征样本对象是否点击样本媒体内容。例如,样本推荐内容为来自视频号A的视频1,样本对象为小明,视频1对应的真实标签表征小明点击视频1。
具体的,参阅图6所示,其为本申请实施例中元网络模块的参数预测过程的流程示意图。这里,仅以样本媒体内容x为例进行说明,样本媒体内容x为各样本媒体内容中的任意一个样本媒体内容。
S601、将样本媒体内容x的场景特异特征,分别输入至各第一全连接层进行特征映射处理,获得相应的映射向量,每个映射向量中包含有对应的第一全连接层输出的各模型参数。
在一种实施方式中,由于场景特异特征中的各场景特征的维度为多维数据,为了降低计算量,可以对场景特异特征进行池化处理,进而将池化场景特征作为元网络模块的输入。这里的池化处理可以采用均值池化方式,但不局限于此。
具体的,执行S601时,可以采用但不限于以下步骤:
S6011、对场景特异特征进行池化处理,获得池化场景特征。
采用(F,d0)表示场景特异特征的维度,其中,F表征每个场景特征的维度,d0表示特征数量。对场景特征的特征维度进行平均池化运算,得到特征维度为(1,d0)的池化场景特征。
例如,假设,场景特异特征的维度为(5,10),对场景特异特征进行池化处理,获得特征维度为(1,10)池化场景特征。
S6012、将得池化场景特征,分别输入至各第一全连接层进行特征映射处理,获得相应的映射向量。
本申请实施例中,各第一全连接层不区分先后顺序。
各第一全连接层包括第一全连接层1、第一全连接层2、……、第一全连接层L等L个第一全连接层,采用D0表示属性特征中包含的各项特征的总数量。参阅图7所示,针对第一层,对特征维度为(F,d0)的场景特征进行平均池化运算,得到特征维度为(1,d0)的池化场景特征,将池化场景特征输入至第一全连接层1进行特征映射处理,得到映射向量1,映射向量1的维度为(1,D0×D1)。类似的,针对第二层,将池化场景特征输入至第一全连接层2进行特征映射处理,得到映射向量2,映射向量2的维度为(1,D1×D2),针对第L层,将池化场景特征输入至第一全连接层L进行特征映射处理,得到映射向量L,映射向量L的维度为(1,DL-1×1)。
S602、基于设定的向量维度,分别对获得的各映射向量进行拆分处理,获得相应的特征矩阵,每个特征矩阵中包含的各元素为对应的各模型参数。
本申请实施例中,可以采用Reshape操作对获得的各映射向量进行拆分处理,进而将拆分获得的各模型参数,分别重组成矩阵,每个矩阵对应一个模型参数集,每个矩阵中包含的各元素均为对应的模型参数集中的模型参数。
仍参阅图7所示,基于设定的向量维度,对获得的映射向量1进行拆分,获得特征矩阵1,特征矩阵1的维度为(D0,D1),矩阵1中包含的D0×D1个元素为第一全连接层1对应的各模型参数,类似的,对获得的映射向量2进行拆分,获得特征矩阵2,特征矩阵2的维度为(D1,D2),矩阵2中包含的D1×D2个元素为第一全连接层2对应的各模型参数,以及,对获得的映射向量L进行拆分,获得特征矩阵L,特征矩阵的维度L为(DL-1,1),矩阵L中包含的DL-1×1个元素为第一全连接层3对应的各模型参数。
例如,特征矩阵1的维度为(12,10),特征矩阵2的维度为(10,8),特征矩阵的维度L为(4,1),矩阵1中包含的120个元素为第一全连接层1对应的各模型参数,矩阵2中包含的80个元素为第一全连接层2对应的各模型参数,类似的,矩阵L中包含的4个元素为第一全连接层3对应的各模型参数。
S502、基于获得的各模型参数集,分别对各第二全连接层进行参数配置。
具体的,针对每个样本媒体内容,基于各第二全连接层之间的设定连接顺序,依次针对各第二全连接层中的每个第二全连接层,执行以下操作:
针对第二全连接层x,基于各第一全连接层与各第二全连接层之间的对应关系,从各第一全连接层中,确定与第二全连接层x对应的第一全连接层y;
基于第一全连接层y输出的模型参数集,对第二全连接层x进行参数配置。
其中,通过基于第一全连接层y输出的模型参数集,对第二全连接层x进行参数配置,实现将第一全连接层y输出的模型参数集,作为第二全连接层x的模型参数。
参阅图8所示,各第二全连接层包括第二全连接层1、第二全连接层2、……、第二全连接层L等L个第二全连接层,假设,各第一全连接层与各第二全连接层之间的对应关系中,第一全连接层1对应于第二全连接层1,第一全连接层2对应于第二全连接层2,……,第一全连接层L对应于第二全连接层L。
需要说明的是,对属性特征进行池化处理,获得池化属性特征,进而将池化属性特征作为预估模块的模型输入。属性特征的特征维度为(F,D0),池化属性特征的特征维度为(1,D0)。
针对第一层,基于对应关系,从L个第一全连接层中,确定与第二全连接层1对应的第一全连接层为第一全连接层1,将第一全连接层1输出的模型参数集:维度为(D0,D1)的特征矩阵1,作为第二全连接层1的模型参数。
针对第二层,基于对应关系,从L个第一全连接层中,确定与第二全连接层2对应的第一全连接层为第一全连接层2,将第一全连接层2输出的模型参数集:维度为(D1,D2)的特征矩阵1,作为第二全连接层2的模型参数。
类似的,针对第L层,基于对应关系,从L个第一全连接层中,确定与第二全连接层L对应的第一全连接层为第一全连接层L,将第一全连接层L输出的模型参数集:维度为(DL-1,1)的特征矩阵1,作为第二全连接层L的模型参数。
仅以第1层为例,参阅图9所示,假设,第一全连接层1和第二全连接层1的节点数均为10,第二全连接层1的输入特征的特征维度为(1,12),第一全连接层1输出维度为(12,10)特征矩阵1,特征矩阵1中包含的w1,1、w1,2、w1,3、……、w12,10等120个模型参数,将w1,1、w1,2、w1,3、……、w12,10等120个模型参数,作为第二全连接层1的模型参数,其中,w1,1、w1,2、w1-3、……、w12,10的取值分别为0、0.15、0.25、……、0.15。
通过上述实现方式,利用对应的第一全连接层输出的模型参数集,对第二全连接层进行参数配置,实现将模型参数集以全连接网络的形式,对多源异构内容进行动态较差。
S503、将各样本媒体内容各自的属性特征,分别输入至各第二全连接层中进行预测,获得各样本媒体内容各自的评估值。
本申请实施例中,评估值包括但不限于是点击率(CTR)。
具体的,针对每个样本媒体内容,均可以采用以下方式获得各自的评估值:
以样本媒体内容为例,基于设定连接顺序,针对各第二全连接层中的每个第二全连接层,依次执行以下操作:
针对第二全连接层x,对前一个第二全连接层输出的映射特征进行线性变换,得到线性映射特征;其中,第一个第二全连接层的输入为属性特征;
对线性映射特征进行非线性映射,得到第二全连接层x输出的映射特征。
其中,样本媒体内容x的评估值是基于最后一个第二全连接层输出的映射特征得到的。示例性的,对最后一个第二全连接层输出的映射特征,进行sigmoid函数映射,得到样本媒体内容各自的评估值。
针对第一层,对特征维度为(1,D0)的属性特征X进行线性变换,得到线性映射特征,由于第二全连接层1的模型参数的特征维度为(D0,D1),因此,线性映射特征的特征维度为(1,D1),然后,对线性映射特征进行非线性映射,得到第二全连接层1输出的映射特征X1,映射特征X1的特征维度为(1,D1)。
针对第二层,对特征维度为(1,D1)的属性特征X1进行线性变换,得到线性映射特征,由于第二全连接层2的模型参数的特征维度为(D1,D2),因此,线性映射特征的特征维度为(1,D2),然后,对线性映射特征进行非线性映射,得到第二全连接层2输出的映射特征X2,映射特征X2的特征维度为(1,D2)。
类似的,针对第L层,对特征维度为(1,DL-1)的属性特征XL-1进行线性变换,得到线性映射特征,由于第二全连接层L的模型参数的特征维度为(DL-1,1),因此,线性映射特征的特征维度为(1,1),然后,对线性映射特征进行非线性映射,得到第二全连接层L输出的映射特征XL,映射特征XL的特征维度为(1,1)。
最后,对第二全连接层L输出的映射特征XL进行激活函数(如sigmoid函数)映射,得到样本媒体内容x的评估值。
通过上述实现方式,通过线性映射以及非线性映射,对特征进行处理,使得当前层第二全连接层输出的特征向量可以作为下一层第二全连接层的输入。
S504、基于获得的各评估值以及相应的真实标签,确定评估模型对应的总损失值。
本申请实施例中,可以基于获得的各评估值,判断样本对象是否点击相应的样本媒体内容,然后,基于各判断结果以及相应的真实标签,确定评估模型对应的总损失值,但不局限于此。
在一种可能的实现方式中,若评估值不小于预设评估门限值,则判断结果表征该评估值表征样本对象点击样本媒体内容,否则判断结果表征该评估值未点击样本媒体内容。
S505、判断评估模型是否满足收敛条件。
本申请实施例中,收敛条件可以包括如下条件的至少一个:
(1)总损失值不大于预设的损失值阈值。
(2)迭代次数达到预设的次数上限值。
S506:若步骤S505的判断结果为否,则基于总损失值对评估模型进行参数调整。
若满足上述条件,则确定评估模型已满足收敛条件,则训练结束,否则确定评估模型还未满足收敛条件,那么则需要对模型参数继续进行调整,并利用调整后的评估模型进入下一次训练过程,即跳转至S501执行。
本申请实施例中,可以采用AUC(ROC曲线下面积)对评估模型进行评估,当AUC数值满足一定条件时,输出训练后的评估模型,否则可以对评估模型重新训练,其中,AUC用于评估模型的性能表现的指标,数值越高,模型的性能表现越好。
本申请实施例中,在评估模型训练结束之后,可以基于训练得到的评估模型进行内容推荐。
结合图2所示的评估模型,参阅图10所示,其为本申请实施例中,基于评估模型的内容推荐方法的流程示意图,具体流程如下。
S1001、获取候选媒体内容的属性特征,属性特征中包含场景特异特征。具体参阅数据准备阶段中样本媒体内容的属性特征获取过程,在此不再赘述。
例如,参阅图11所示,候选媒体内容为图文信息1,获取图文信息1的属性特征1,目标对象为小明,属性特征1中包含小明的对象ID、图文信息1的内容ID、场景特异特征1,场景特异特征1中包含订阅号的场景特征和视频号的场景特征,假设,图文信息1的数据源为订阅号A,订阅号A还发布有图文信息2,订阅号的场景特征包括:小明在过去1天、过去7天内对图文信息1和图文信息2的总曝光次数、总点击次数和总曝光点击率;小明在过去1天、过去7天内对图文信息1的总曝光次数、总点击次数和总曝光点击率,视频号的场景特征中,视频号的场景特征的取值均为0。
S1002、将场景特异特征,分别输入至各第一全连接层进行参数预测,获得各第一全连接层各自输出的模型参数集;各第一全连接层是通过模型训练得到的。具体参见S501,在此不再赘述。
例如,参阅图11所示,将场景特异特征1,分别输入至各第一全连接层进行参数预测,获得各第一全连接层各自输出的模型参数集。
S1003、基于获得的各模型参数集,分别对各第二全连接层进行参数配置,并分别将属性特征输入至各第二全连接层中进行预测,获得候选媒体内容的评估值。具体参见S502和S503,在此不再赘述。
例如,参阅图11所示,基于获得的各模型参数集,分别对各第二全连接层进行参数配置,并分别将属性特征1输入至各第二全连接层中进行预测,获得图文信息1的评估值1,评估值1为0.9,即点击率为90%。
S1004、当评估值满足预设推荐条件时,将候选媒体内容作为目标推荐内容。
本申请实施例中,作为一种可能的实现方式,获取其他媒体内容的评估值,并基于其他媒体内容和候选媒体内容各自的评估值,对其他媒体内容和媒体内容进行排序,以及当基于排序结果,确定候选媒体内容位于设定次序范围内时,将候选媒体内容作为目标推荐内容。
其中,其他媒体内容的数目可以是一个,也可以是多个。其他媒体内容的评估值可以是基于评估模型得到的,具体过程不再赘述。排序可以是按照从大到小排序,也可以是按从小到大排序,对此不作限定。以按照从大到小的顺序对其他媒体内容和媒体内容进行排序为例,设定次序范围可以是前k个,k的取值为正整数。
例如,仍参阅图11所示,其他媒体内容包括视频1、图文信息2等9个,其中,视频1为动画片,图文信息2为购买食材的图文信息,类似的,基于视频1的场景特异特征2和属性特征2,得到视频1的评估值0.7,基于图文信息2的场景特异特征3和属性特征3,得到图文信息2的评估值0.9,然后,基于其他媒体内容和候选媒体内容各自的评估值,按照从大到小的顺序,对其他媒体内容和候选媒体内容进行排序,假设,设定次序范围为前3个,排序结果表征图文信息1位于第二个,此时,图文信息1位于设定次序范围内,将候图文信息1作为目标推荐内容,进一步的,若视频1、图文信息2也位于前3个,则视频1、图文信息2也可以作为目标推荐内容。
通过上述实现方式,针对多源异构数据,可以通过模型输出的评估值,从各媒体内容中,确定出目标推荐内容,实现媒体内容的精准推荐,提高推荐***的推荐精度。
需要说明的是,本申请实施例中,仅以一个候选媒体内容为例进行说明,候选媒体内容的数目可以是一个或多个,若候选媒体内容的数目为多个,则基于评估值,针对多个候选媒体内容进行排序,确定目标媒体内容。基于评估值,针对多个候选媒体内容进行排序,确定目标媒体内容的过程,与基于评估值,针对其他媒体内容和候选媒体内容进行排序,确定目标媒体内容的过程类似,在此不再赘述。
下面,结合一个具体的应用场景进行说明。
在模型训练阶段,利用购物场景中的各样本媒体内容对待训练的评估模型进行模型训练,训练后得到评估模型。
参阅图12所示,假设,候选媒体内容为商品1,商品1为草莓,获取商品1的属性特征4,目标对象为小王,属性特征中包含小王的对象ID、商品1的内容ID、场景特异特征4,场景特异特征4中包含商品的场景特征和直播间的场景特征,假设,商品1的数据源为水果店铺z,水果店铺z还发布有菠萝、橘子等商品,商品的场景特征包括:小王在过去1天、过去7天内对水果店铺z发布的各商品的总曝光次数、总点击次数和总曝光点击率;小明在过去1天、过去7天内对商品1的总曝光次数、总点击次数和总曝光点击率,视频号的场景特征中,直播间的场景特征的取值均为0。
针对商品1,将场景特异特征4,分别输入至各第一全连接层进行参数预测,获得各第一全连接层各自输出的模型参数集,然后,基于获得的各模型参数集,分别对各第二全连接层进行参数配置,并分别将属性特征4输入至各第二全连接层中进行预测,获得商品1的评估值4,评估值1为0.9。
其他媒体内容包括xx直播间等100个媒体内容,以xx直播间为例,获取xx直播间的属性特征5,目标对象为小王,属性特征中包含小王的对象ID、xx直播间的内容ID、场景特异特征5,场景特异特征5中包含商品的场景特征和直播间的场景特征,假设,商品1的数据源为小刘,视频号的场景特征包括:小王在过去1天、过去7天内对小刘的各场直播的总曝光次数、总点击次数和总曝光点击率,而商品的场景特征其取值均为0。
针对xx直播间,将场景特异特征5,分别输入至各第一全连接层进行参数预测,获得各第一全连接层各自输出的模型参数集,然后,基于获得的各模型参数集,分别对各第二全连接层进行参数配置,并分别将属性特征5输入至各第二全连接层中进行预测,获得xx直播间的评估值5,评估值4为0.6。
进一步的,基于100个其他媒体内容与商品1各自的评估值,按照从大到小的顺序,对其他媒体内容和候选媒体内容进行排序,排序结果表征商品1和xx直播间为前两个,将商品1和xx直播间作为目标推荐内容。
显然,本申请实施例中,引入一个元学习模型(即元网络模块),来对不同数据源的媒体内容包含的不同数据模式做动态筛选。对于输入特征[a,b,c,d],元学习模型认为对于样本1而言,其重要的数据模式为[a’,b’,c’,d’],对样本2而言,其重要的数据模式为[a”,b”,c”,d”],其是对整体特征做的动态交叉。进而,对于元学习模型来说,提取到的表征向量为f([a,b,c,d],w=g([a,b,c,d])),其中,f是从输入到目标的映射函数,参数w是由元网络动态决定的。对于样本1,表征向量为f([a,b,c,d],w=[a’,b’,c’,d’]);对于样本2,表征向量为f([a,b,c,d],w=[a”,b”,c”,d”])。
显然,利用候选媒体内容的场景特异特征,采用元网络模块得到预测模块的模型参数,可以有效地从候选媒体内容的复杂特征中提取出数据源相关的关键信息,使得预测模块的模型参数可以根据数据源动态进行动态调整,从而提高评估模型的评估准确性,进而提高推荐准确性。此外,由于利用场景特异特征得到模型参数,即便多种信息源的内容占比差距较大,模型参数也可以较好的体现出不同信息源之间的差异性,从而进一步提高了评估模型的评估准确性。
可以理解的是,在本申请的具体实施方式中,涉及到用户信息如上述的对象属性、历史使用信息等相关的数据,当本申请以上实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
基于相同的发明构思,本申请实施例提供一种基于评估模型的内容推荐装置。如图13所示,其为基于评估模型的内容推荐装置1300的结构示意图,所述评估模型包括元网络模块和预测模块,所述元网络模块包含各第一全连接层,所述预测模块包含与所述各第一全连接层对应的节点数相同的各第二全连接层,所述装置包括:
获取单元1301,用于获取候选媒体内容的属性特征,所述属性特征中包含场景特异特征;
元网络单元1302,用于将所述场景特异特征,分别输入至所述各第一全连接层进行参数预测,获得所述各第一全连接层各自输出的模型参数集;所述各第一全连接层是通过模型训练得到的;
预估单元1303,用于基于获得的各模型参数集,分别对所述各第二全连接层进行参数配置,并分别将所述属性特征输入至所述各第二全连接层中进行预测,获得所述候选媒体内容的评估值;
推荐单元1304,用于当所述评估值满足预设推荐条件时,将所述候选媒体内容作为目标推荐内容。
作为一种可能的实现方式,所述将所述场景特异特征,分别输入至所述各第一全连接层进行参数预测,获得所述各第一全连接层各自输出的模型参数集时,元网络单元1302具体用于:
将所述场景特异特征,分别输入至所述各第一全连接层进行特征映射处理,获得相应的映射向量,每个映射向量中包含有对应的第一全连接层输出的各模型参数;
基于设定的向量维度,分别对获得的各映射向量进行拆分处理,获得相应的特征矩阵,每个特征矩阵中包含的各元素为对应的各模型参数。
作为一种可能的实现方式,所述将所述场景特异特征,分别输入至所述各第一全连接层进行特征映射处理,获得相应的映射向量时,元网络单元1302具体用于:
对所述场景特异特征进行池化处理,获得池化场景特征;
将所述得池化场景特征,分别输入至所述各第一全连接层进行特征映射处理,获得相应的映射向量。
作为一种可能的实现方式,所述将所述场景特异特征,分别输入至所述各第一全连接层进行特征映射处理,获得相应的映射向量时,元网络单元1302具体用于:
对所述场景特异特征进行池化处理,获得池化场景特征;
将所述得池化场景特征,分别输入至所述各第一全连接层进行特征映射处理,获得相应的映射向量。
作为一种可能的实现方式,所述基于获得的各模型参数集,分别对所述各第二全连接层进行参数配置时,预估单元1303具体用于:
基于所述各第二全连接层之间的设定连接顺序,依次针对所述各第二全连接层中的每个第二全连接层,执行以下操作:
针对一个第二全连接层,基于所述各第一全连接层与所述各第二全连接层之间的对应关系,从所述各第一全连接层中,确定与所述一个第二全连接层对应的一个第一全连接层;
基于所述一个第一全连接层输出的模型参数集,对所述一个第二全连接层进行参数配置。
作为一种可能的实现方式,所述各第二全连接层按照设定连接顺序连接,所述分别将所述属性特征输入至所述各第二全连接层中进行预测,获得所述候选媒体内容的评估值时,预估单元1303具体用于:
基于所述设定连接顺序,针对所述各第二全连接层中的每个第二全连接层,依次执行以下操作:
针对一个第二全连接层,对前一个第二全连接层输出的映射特征进行线性变换,得到线性映射特征;其中,第一个第二全连接层的输入为所述属性特征;
对所述线性映射特征进行非线性映射,得到所述一个第二全连接层输出的映射特征,其中,所述候选媒体内容的评估值是基于最后一个第二全连接层输出的映射特征得到的。
作为一种可能的实现方式,所述获取候选媒体内容的属性特征时,获取单元1301具体用于:
针对目标对象和所述候选媒体内容,基于设定的对象属性,获得所述目标对象的对象特征,以及基于设定的内容属性,获得所述候选媒体内容的内容特征;
基于所述候选媒体内容与所述目标对象之间的历史推荐信息,获得所述候选媒体内容的场景特异特征;
基于所述场景特异特征、所述对象特征和所述内容特征,得到所述候选媒体内容的属性特征。
作为一种可能的实现方式,所述基于所述候选媒体内容与所述目标对象之间的历史推荐信息,获得所述候选媒体内容的场景特异特征时,获取单元1301具体用于:
基于针对所述候选媒体内容所属的目标数据源设定的目标场景属性,对所述候选媒体内容与所述目标对象之间的历史推荐信息进行信息提取,获得所述候选媒体内容的目标场景特征;
基于针对其他数据源设定的其他场景属性,采用设定属性值,作为所述候选媒体内容的其他场景特征;
基于所述目标场景特征和所述其他场景特征,获得所述场景特异特征。
作为一种可能的实现方式,所述基于针对所述候选媒体内容所属的目标数据源设定的目标场景属性,对所述候选媒体内容与所述目标对象之间的历史推荐信息进行信息提取,获得所述候选媒体内容的目标场景特征时,获取单元1301具体用于:
若所述候选媒体信息为图文信息,所述图文信息所属的目标数据源为第一数据源,则基于针对所述第一数据源设定的目标场景属性,对所述图文信息与所述目标对象之间的历史推荐信息进行信息提取,获得所述目标场景特征;
若所述候选媒体信息为视频,所述视频所属的目标数据源为第二数据源,则基于针对所述第二数据源设定的目标场景属性,对所述视频与所述目标对象之间的历史推荐信息进行信息提取,获得所述目标场景特征。
作为一种可能的实现方式,所述评估值用于表征所述目标对象点击所述候选媒体内容的概率;
所述当所述评估值满足预设推荐条件时,将所述候选媒体内容作为目标推荐内容时,推荐单元1304具体用于;
获取其他媒体内容的评估值,并基于所述其他媒体内容和所述媒体内容各自的评估值,对所述其他媒体内容和所述媒体内容进行排序;
当基于排序结果,确定所述候选媒体内容位于设定次序范围内时,将所述候选媒体内容作为目标推荐内容。
为了描述的方便,以上各部分按照功能划分为各模块(或单元)分别描述。当然,在实施本申请时可以把各模块(或单元)的功能在同一个或多个软件或硬件中实现。
关于上述实施例中的装置,其中各个单元执行请求的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
所属技术领域的技术人员能够理解,本申请的各个方面可以实现为***、方法或程序产品。因此,本申请的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“***”。
基于相同的发明构思,本申请实施例还提供一种电子设备。在一种实施例中,该电子设备可以是服务器,也可以是终端设备。参阅图14所示,其为本申请实施例中提供的一种可能的电子设备的结构示意图,图14中,电子设备1400包括:处理器1410和存储器1420。
其中,存储器1420存储有可被处理器1410执行的计算机程序,处理器1410通过执行存储器1420存储的指令,可以执行上述基于评估模型的内容推荐方法的步骤。
存储器1420可以是易失性存储器(volatile memory),例如随机存取存储器(random-access memory,RAM);存储器1420也可以是非易失性存储器(non-volatilememory),例如只读存储器(Read-Only Memory,ROM),快闪存储器(flash memory),硬盘(hard disk drive,HDD)或固态硬盘(solid-state drive,SSD);或者存储器1420是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器1420也可以是上述存储器的组合。
处理器1410可以包括一个或多个中央处理单元(central processing unit,CPU)或者为数字处理单元等等。处理器1410,用于执行存储器1420中存储的计算机程序时实现上述基于评估模型的内容推荐方法。
在一些实施例中,处理器1410和存储器1420可以在同一芯片上实现,在一些实施例中,它们也可以在独立的芯片上分别实现。
本申请实施例中不限定上述处理器1410和存储器1420之间的具体连接介质。本申请实施例中以处理器1410和存储器1420之间通过总线连接为例,总线在图14中以粗线描述,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。总线可以分为地址总线、数据总线、控制总线等。为便于描述,图14中仅用一条粗线描述,但并不描述仅有一根总线或一种类型的总线。
基于同一发明构思,本申请实施例提供了一种计算机可读存储介质,其包括计算机程序,当计算机程序在电子设备上运行时,计算机程序用于使电子设备执行上述基于评估模型的内容推荐方法的步骤。在一些可能的实施方式中,本申请提供的基于评估模型的内容推荐方法的各个方面还可以实现为一种程序产品的形式,其包括计算机程序,当程序产品在电子设备上运行时,计算机程序用于使电子设备执行上述基于评估模型的内容推荐方法中的步骤,例如,电子设备可以执行如图5中所示的步骤。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、RAM、ROM、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(Compact Disk Read Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
本申请的实施方式的程序产品可以采用CD-ROM并包括计算机程序,并可以在电子设备上运行。然而,本申请的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储计算机程序的有形介质,该计算机程序可以被命令执行***、装置或者器件使用或者与其结合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读计算机程序。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由命令执行***、装置或者器件使用或者与其结合使用的计算机程序。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (15)

1.一种基于评估模型的内容推荐方法,其特征在于,所述评估模型包括元网络模块和预测模块,所述元网络模块包含各第一全连接层,所述预测模块包含与所述各第一全连接层对应的节点数相同的各第二全连接层,所述方法包括:
获取候选媒体内容的属性特征,所述属性特征中包含场景特异特征;
将所述场景特异特征,分别输入至所述各第一全连接层进行参数预测,获得所述各第一全连接层各自输出的模型参数集;所述各第一全连接层是通过模型训练得到的;
基于获得的各模型参数集,分别对所述各第二全连接层进行参数配置,并分别将所述属性特征输入至所述各第二全连接层中进行预测,获得所述候选媒体内容的评估值;
当所述评估值满足预设推荐条件时,将所述候选媒体内容作为目标推荐内容。
2.如权利要求1所述的方法,其特征在于,所述将所述场景特异特征,分别输入至所述各第一全连接层进行参数预测,获得所述各第一全连接层各自输出的模型参数集,包括:
将所述场景特异特征,分别输入至所述各第一全连接层进行特征映射处理,获得相应的映射向量,每个映射向量中包含有对应的第一全连接层输出的各模型参数;
基于设定的向量维度,分别对获得的各映射向量进行拆分处理,获得相应的特征矩阵,每个特征矩阵中包含的各元素为对应的各模型参数。
3.如权利要求2所述的方法,其特征在于,所述将所述场景特异特征,分别输入至所述各第一全连接层进行特征映射处理,获得相应的映射向量,包括:
对所述场景特异特征进行池化处理,获得池化场景特征;
将所述得池化场景特征,分别输入至所述各第一全连接层进行特征映射处理,获得相应的映射向量。
4.如权利要求1、2或3所述的方法,其特征在于,所述基于获得的各模型参数集,分别对所述各第二全连接层进行参数配置,包括:
基于所述各第二全连接层之间的设定连接顺序,依次针对所述各第二全连接层中的每个第二全连接层,执行以下操作:
针对一个第二全连接层,基于所述各第一全连接层与所述各第二全连接层之间的对应关系,从所述各第一全连接层中,确定与所述一个第二全连接层对应的一个第一全连接层;
基于所述一个第一全连接层输出的模型参数集,对所述一个第二全连接层进行参数配置。
5.如权利要求1、2或3所述的方法,其特征在于,所述各第二全连接层按照设定连接顺序连接,所述分别将所述属性特征输入至所述各第二全连接层中进行预测,获得所述候选媒体内容的评估值,包括:
基于所述设定连接顺序,针对所述各第二全连接层中的每个第二全连接层,依次执行以下操作:
针对一个第二全连接层,对前一个第二全连接层输出的映射特征进行线性变换,得到线性映射特征;其中,第一个第二全连接层的输入为所述属性特征;
对所述线性映射特征进行非线性映射,得到所述一个第二全连接层输出的映射特征,其中,所述候选媒体内容的评估值是基于最后一个第二全连接层输出的映射特征得到的。
6.如权利要求1、2或3所述的方法,其特征在于,所述获取候选媒体内容的属性特征,包括:
针对目标对象和所述候选媒体内容,基于设定的对象属性,获得所述目标对象的对象特征,以及基于设定的内容属性,获得所述候选媒体内容的内容特征;
基于所述候选媒体内容与所述目标对象之间的历史推荐信息,获得所述候选媒体内容的场景特异特征;
基于所述场景特异特征、所述对象特征和所述内容特征,得到所述候选媒体内容的属性特征。
7.如权利要求6所述的方法,其特征在于,所述基于所述候选媒体内容与所述目标对象之间的历史推荐信息,获得所述候选媒体内容的场景特异特征,包括:
基于针对所述候选媒体内容所属的目标数据源设定的目标场景属性,对所述候选媒体内容与所述目标对象之间的历史推荐信息进行信息提取,获得所述候选媒体内容的目标场景特征;
基于针对其他数据源设定的其他场景属性,采用设定属性值,作为所述候选媒体内容的其他场景特征;
基于所述目标场景特征和所述其他场景特征,获得所述场景特异特征。
8.如权利要求7所述的方法,其特征在于,所述基于针对所述候选媒体内容所属的目标数据源设定的目标场景属性,对所述候选媒体内容与所述目标对象之间的历史推荐信息进行信息提取,获得所述候选媒体内容的目标场景特征,包括:
若所述候选媒体信息为图文信息,所述图文信息所属的目标数据源为第一数据源则基于针对所述第一数据源设定的目标场景属性,对所述图文信息与所述目标对象之间的历史推荐信息进行信息提取,获得所述目标场景特征;
若所述候选媒体信息为视频,所述视频所属的目标数据源为第二数据源,则基于针对所述第二数据源设定的目标场景属性,对所述视频与所述目标对象之间的历史推荐信息进行信息提取,获得所述目标场景特征。
9.如权利要求6所述的方法,其特征在于,所述评估值用于表征所述目标对象点击所述候选媒体内容的概率;
所述当所述评估值满足预设推荐条件时,将所述候选媒体内容作为目标推荐内容,包括:
获取其他媒体内容的评估值,并基于所述其他媒体内容和所述候选媒体内容各自的评估值,对所述其他媒体内容和所述媒体内容进行排序;
当基于排序结果,确定所述候选媒体内容位于设定次序范围内时,将所述候选媒体内容作为目标推荐内容。
10.一种基于评估模型的内容推荐装置,其特征在于,所述评估模型包括元网络模块和预测模块,所述元网络模块包含各第一全连接层,所述预测模块包含与所述各第一全连接层对应的节点数相同的各第二全连接层,所述装置包括:
获取单元,用于获取候选媒体内容的属性特征,所述属性特征中包含场景特异特征;
元网络单元,用于将所述场景特异特征,分别输入至所述各第一全连接层进行参数预测,获得所述各第一全连接层各自输出的模型参数集;所述各第一全连接层是通过模型训练得到的;
预估单元,用于基于获得的各模型参数集,分别对所述各第二全连接层进行参数配置,并分别将所述属性特征输入至所述各第二全连接层中进行预测,获得所述候选媒体内容的评估值;
推荐单元,用于当所述评估值满足预设推荐条件时,将所述候选媒体内容作为目标推荐内容。
11.如权利要求10所述的装置,其特征在于,所述将所述场景特异特征,分别输入至所述各第一全连接层进行参数预测,获得所述各第一全连接层各自输出的模型参数集时,元网络单元具体用于:
将所述场景特异特征,分别输入至所述各第一全连接层进行特征映射处理,获得相应的映射向量,每个映射向量中包含有对应的第一全连接层输出的各模型参数;
基于设定的向量维度,分别对获得的各映射向量进行拆分处理,获得相应的特征矩阵,每个特征矩阵中包含的各元素为对应的各模型参数。
12.如权利要求11所述的装置,其特征在于,所述将所述场景特异特征,分别输入至所述各第一全连接层进行特征映射处理,获得相应的映射向量时,元网络模块具体用于:
对所述场景特异特征进行池化处理,获得池化场景特征;
将所述得池化场景特征,分别输入至所述各第一全连接层进行特征映射处理,获得相应的映射向量。
13.一种电子设备,其特征在于,其包括处理器和存储器,其中,所述存储器存储有计算机程序,当所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求1~9中任一所述方法的步骤。
14.一种计算机可读存储介质,其特征在于,其包括计算机程序,当所述计算机程序在电子设备上运行时,所述计算机程序用于使所述电子设备执行权利要求1~9中任一所述方法的步骤。
15.一种计算机程序产品,其特征在于,其包括计算机程序,所述计算机程序存储在计算机可读存储介质中,电子设备的处理器从所述计算机可读存储介质读取并执行所述计算机程序,使得所述电子设备执行权利要求1~9中任一所述方法的步骤。
CN202211523991.2A 2022-11-30 2022-11-30 一种基于评估模型的内容推荐方法及相关装置 Pending CN117009556A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211523991.2A CN117009556A (zh) 2022-11-30 2022-11-30 一种基于评估模型的内容推荐方法及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211523991.2A CN117009556A (zh) 2022-11-30 2022-11-30 一种基于评估模型的内容推荐方法及相关装置

Publications (1)

Publication Number Publication Date
CN117009556A true CN117009556A (zh) 2023-11-07

Family

ID=88562533

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211523991.2A Pending CN117009556A (zh) 2022-11-30 2022-11-30 一种基于评估模型的内容推荐方法及相关装置

Country Status (1)

Country Link
CN (1) CN117009556A (zh)

Similar Documents

Publication Publication Date Title
CN109919316B (zh) 获取网络表示学习向量的方法、装置和设备及存储介质
CN111966914B (zh) 基于人工智能的内容推荐方法、装置和计算机设备
CN110728317A (zh) 决策树模型的训练方法、***、存储介质及预测方法
CN114265979B (zh) 确定融合参数的方法、信息推荐方法和模型训练方法
WO2022148186A1 (zh) 行为序列数据处理方法及装置
CN113515690A (zh) 内容召回模型的训练方法、内容召回方法、装置及设备
CN117217284A (zh) 一种数据处理方法及其装置
CN115186192A (zh) 信息处理方法、装置、存储介质及设备
CN115631008B (zh) 商品推荐方法、装置、设备及介质
CN115130536A (zh) 特征提取模型的训练方法、数据处理方法、装置及设备
CN116910373B (zh) 房源推荐方法、装置、电子设备及存储介质
WO2024051707A1 (zh) 训练推荐模型的方法、推荐资源的方法及其装置
CN112989182A (zh) 信息处理方法、装置、信息处理设备及存储介质
CN117573961A (zh) 信息推荐方法、装置、电子设备、存储介质及程序产品
CN116975686A (zh) 训练学生模型的方法、行为预测方法和装置
Sunitha et al. Political optimizer-based automated machine learning for skin lesion data
CN117033997A (zh) 数据切分方法、装置、电子设备和介质
CN114611015A (zh) 交互信息处理方法、装置和云服务器
CN115858911A (zh) 信息推荐方法、装置、电子设备及计算机可读存储介质
CN117009556A (zh) 一种基于评估模型的内容推荐方法及相关装置
CN112417260B (zh) 本地化推荐方法、装置及存储介质
Mohammed et al. Location-aware deep learning-based framework for optimizing cloud consumer quality of service-based service composition
CN116628236B (zh) 多媒体信息的投放方法、装置、电子设备及存储介质
CN116980379A (zh) 红点消息推送方法及相关装置
CN117745382A (zh) 对象推荐方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication