CN111966914A - 基于人工智能的内容推荐方法、装置和计算机设备 - Google Patents

基于人工智能的内容推荐方法、装置和计算机设备 Download PDF

Info

Publication number
CN111966914A
CN111966914A CN202011152259.XA CN202011152259A CN111966914A CN 111966914 A CN111966914 A CN 111966914A CN 202011152259 A CN202011152259 A CN 202011152259A CN 111966914 A CN111966914 A CN 111966914A
Authority
CN
China
Prior art keywords
content
target domain
user
domain
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011152259.XA
Other languages
English (en)
Other versions
CN111966914B (zh
Inventor
朱勇椿
葛凯凯
张旭
林乐宇
庄福振
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202011152259.XA priority Critical patent/CN111966914B/zh
Publication of CN111966914A publication Critical patent/CN111966914A/zh
Application granted granted Critical
Publication of CN111966914B publication Critical patent/CN111966914B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种基于人工智能的内容推荐方法、装置和计算机设备。所述方法包括:获取目标域的新用户在源域对应的源域用户特征;通过经过训练的任务导向映射模型,对所述源域用户特征进行特征映射,得到从所述源域映射至所述目标域的映射用户特征;通过预训练的内容推荐模型,分别根据所述映射用户特征和所述目标域中每个候选内容的目标域内容特征,进行推荐内容的点击预测;根据点击预测的结果从候选内容中筛选待推荐的内容;向所述目标域的所述新用户推送所述待推荐的内容。采用本方法能够有效提高对新用户进行内容推荐的精准度。

Description

基于人工智能的内容推荐方法、装置和计算机设备
技术领域
本申请涉及互联网技术领域,特别是涉及一种基于人工智能的内容推荐方法、装置、计算机设备和存储介质。
背景技术
随着互联网技术的迅速发展,基于大数据和人工智能的推荐技术应运而生,出现了很多推荐***,能够智能地向用户推荐用户感兴趣的内容。推荐***通常可以通过分析用户的历史行为信息预测用户的喜好,从而为用户推荐其感兴趣的信息,以满足用户的个性化推荐需求。
在推荐***中,对于在该领域没有历史数据的新用户而言,常用的做法是按照信息的热度排名,向新用户推荐热度比较高的信息。然而,传统的方式中由于缺乏新用户的用户行为特征,难以预测用户自身的兴趣,无法准确地向新用户进行个性化内容推荐,导致信息推荐的精准度不高。
发明内容
基于此,有必要针对上述技术问题,提供一种能够有效提高对新用户进行内容推荐的精准度的基于人工智能的内容推荐方法、装置、计算机设备和存储介质。
一种基于人工智能的内容推荐方法,所述方法包括:
获取目标域的新用户在源域对应的源域用户特征;
通过经过训练的任务导向映射模型,对所述源域用户特征进行特征映射,得到从所述源域映射至所述目标域的映射用户特征;
通过预训练的内容推荐模型,分别根据所述映射用户特征和所述目标域中每个候选内容的目标域内容特征,进行推荐内容的点击预测;
根据点击预测的结果从候选内容中筛选待推荐的内容;
向所述目标域的所述新用户推送所述待推荐的内容。
一种基于人工智能的内容处理方法,所述方法包括:
获取历史交互信息和对应的点击记录标签;所述历史交互信息包括历史用户在源域的样本源域用户特征以及在目标域的样本目标域内容特征;
通过待训练的任务导向映射模型,对所述样本源域用户特征进行特征映射,得到从所述源域映射至所述目标域的样本映射用户特征;
将所述样本映射用户特征和所述样本目标域内容特征输入至预训练的内容推荐模型,进行样本目标域内容的点击预测;
根据点击预测的结果和所述点击记录标签确定任务导向损失值;
根据所述任务导向损失值调整所述任务导向映射模型的参数并继续训练,直至满足训练停止条件时结束训练。
一种基于人工智能的内容推荐装置,所述装置包括:
数据获取模块,用于获取目标域的新用户在源域对应的源域用户特征;
特征映射模块,用于通过经过训练的任务导向映射模型,对所述源域用户特征进行特征映射,得到从所述源域映射至所述目标域的映射用户特征;
内容预测模块,用于通过预训练的内容推荐模型,分别根据所述映射用户特征和所述目标域中每个候选内容的目标域内容特征,进行推荐内容的点击预测;
内容推荐模块,用于根据点击预测的结果从候选内容中筛选待推荐的内容;向所述目标域的所述新用户推送所述待推荐的内容。
在其中一个实施例中,所述数据获取模块还用于根据所述目标域中所述新用户的用户标识,在多个源域中,查找存在与所述用户标识对应的交互行为信息的源域;从所述源域中获取所述用户标识对应的源域用户特征;所述源域用户特征是基于所述用户标识在所述源域中的交互行为信息进行特征提取获得的。
在其中一个实施例中,所述数据获取模块还用于获取第一子应用中的新用户对应的访问请求,所述访问请求包括用户标识;所述第一子应用对应所述目标域;所述第一子应用运行于母应用提供的环境中;根据所述用户标识,查找运行于所述母应用中的存在与所述用户标识对应的交互行为信息的第二子应用;所述第二子应用对应所述源域;所述第二子应用中包括基于所述用户标识的交互行为信息获得的源域用户特征。
在其中一个实施例中,所述内容推荐模型通过第一阶段训练步骤训练获得,所述装置还包括第一模型训练模块,用于获取所述目标域中的历史交互信息和对应的点击记录标签;所述历史交互信息包括所述目标域中的历史用户对应的样本目标域用户特征和样本目标域内容特征;所述点击记录标签是所述目标域中的样本目标域内容的点击记录;将所述样本目标域用户特征和所述样本目标域内容特征输入至待训练的内容推荐模型,进行样本目标域内容的点击预测;根据点击预测的结果和所述点击记录标签确定点击预测损失值;根据所述点击预测损失值调整所述内容推荐模型的参数并继续训练,直至满足训练停止条件时结束训练。
在其中一个实施例中,所述任务导向映射模型通过第二阶段训练步骤训练获得,所述装置还包括第二模型训练模块,用于获取历史交互信息和对应的点击记录标签;所述历史交互信息包括历史用户在源域的样本源域用户特征以及在目标域的样本目标域内容特征;通过待训练的任务导向映射模型,对所述样本源域用户特征进行特征映射,得到从所述源域映射至所述目标域的样本映射用户特征;将所述样本映射用户特征和所述样本目标域内容特征输入至预训练的内容推荐模型,进行样本目标域内容的点击预测;根据点击预测的结果和所述点击记录标签确定任务导向损失值;根据所述任务导向损失值调整所述任务导向映射模型的参数并继续训练,直至满足训练停止条件时结束训练。
一种基于人工智能的内容处理装置,所述装置包括:
样本获取模块,用于获取历史交互信息和对应的点击记录标签;所述历史交互信息包括历史用户在源域的样本源域用户特征以及在目标域的样本目标域内容特征;
特征映射模块,用于通过待训练的任务导向映射模型,对所述样本源域用户特征进行特征映射,得到从所述源域映射至所述目标域的样本映射用户特征;
内容预测模块,用于将所述样本映射用户特征和所述样本目标域内容特征输入至预训练的内容推荐模型,进行样本目标域内容的点击预测;
参数调整模块,用于根据点击预测的结果和所述点击记录标签确定任务导向损失值;根据所述任务导向损失值调整所述任务导向映射模型的参数并继续训练,直至满足训练停止条件时结束训练。
在其中一个实施例中,所述样本获取模块还用于获取所述源域和所述目标域中共享的历史用户对应的用户标识;根据所述用户标识分别获取所述历史用户在所述源域和所述目标域中的历史交互信息;从所述历史交互信息中提取所述历史用户在所述源域的样本源域用户特征和在所述目标域的样本目标域内容特征,以及所述目标域中的历史交互信息对应的点击记录标签;所述点击记录标签是所述目标域的历史交互信息中各样本目标域内容对应的点击记录。
在其中一个实施例中,所述特征映射模块还用于将所述样本源域用户特征输入至待训练的任务导向映射模型中,通过所述任务导向映射模型的映射层对所述样本源域用户特征进行特征矩阵变换;根据特征矩阵变换的结果,输出将所述样本源域用户特征映射至所述目标域中的样本映射用户特征。
在其中一个实施例中,所述内容预测模块还用于将所述样本映射用户特征和所述样本目标域内容特征输入至预训练的内容推荐模型中,通过所述内容推荐模型预测所述历史用户对各样本目标域内容的样本兴趣度;根据所述样本兴趣度对各所述样本目标域内容进行点击预测,得到各所述样本目标域内容对应的点击预测的结果。
在其中一个实施例中,所述参数调整模块还用于根据点击预测的结果与所述点击记录标签之间的差异,确定任务导向损失值;根据所述任务导向损失值调整所述任务导向映射模型的参数,以使所述任务导向映射模型在迭代训练的过程中,使所述点击预测的结果与所述点击记录标签之间的差异减小。
在其中一个实施例中,所述内容推荐模型通过第一阶段训练步骤训练获得,所述任务导向映射模型通过第二阶段训练步骤训练获得,所述装置还包括第一模型训练模块,用于获取所述目标域中的历史交互信息和对应的点击记录标签;所述历史交互信息包括所述目标域中的历史用户对应的样本目标域用户特征和样本目标域内容特征;所述点击记录标签是所述目标域中的样本目标域内容的点击记录;将所述样本目标域用户特征和所述样本目标域内容特征输入至待训练的内容推荐模型,进行样本目标域内容的点击预测;根据点击预测的结果和所述点击记录标签确定点击预测损失值;根据所述点击预测损失值调整所述内容推荐模型的参数并继续训练,直至满足训练停止条件时结束训练。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取目标域的新用户在源域对应的源域用户特征;
通过经过训练的任务导向映射模型,对所述源域用户特征进行特征映射,得到从所述源域映射至所述目标域的映射用户特征;
通过预训练的内容推荐模型,分别根据所述映射用户特征和所述目标域中每个候选内容的目标域内容特征,进行推荐内容的点击预测;
根据点击预测的结果从候选内容中筛选待推荐的内容;
向所述目标域的所述新用户推送所述待推荐的内容。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取目标域的新用户在源域对应的源域用户特征;
通过经过训练的任务导向映射模型,对所述源域用户特征进行特征映射,得到从所述源域映射至所述目标域的映射用户特征;
通过预训练的内容推荐模型,分别根据所述映射用户特征和所述目标域中每个候选内容的目标域内容特征,进行推荐内容的点击预测;
根据点击预测的结果从候选内容中筛选待推荐的内容;
向所述目标域的所述新用户推送所述待推荐的内容。
上述基于人工智能的内容推荐方法、装置、计算机设备和存储介质,获取目标域的新用户在源域对应的源域用户特征;由于新用户在目标域中没有完善的用户特征信息,而源域用户特征是基于用户标识在源域中的交互行为信息进行特征提取获得的,通过经过训练的任务导向映射模型,对源域用户特征进行特征映射,从而能够有效地获得从源域映射至目标域的映射用户特征。服务器进一步通过预训练的内容推荐模型,分别根据映射用户特征和目标域中每个候选内容的目标域内容特征,进行推荐内容的点击预测,从而能够精准有效地对目标域中的候选内容进行点击预测,以获得较为准确合理的点击预测的结果。服务器则根据点击预测的结果从候选内容中筛选待推荐的内容,并向目标域的新用户推送待推荐的内容,由此向目标域中的新用户进行内容推荐时,能够根据新用户在源域中的源域用户特征学习到该新用户在目标域中的映射用户特征,并使用该映射用户特征进行内容推荐,能够有效解决新用户在目标域中的用户特征不足的问题,从而能够有效提高对目标域中的新用户进行内容推荐的精准度。
附图说明
图1为一个实施例中基于人工智能的内容推荐方法的应用环境图。
图2为一个实施例中基于人工智能的内容推荐方法的流程示意图。
图3为另一个实施例中一种基于人工智能的内容推荐方法的流程示意图。
图4为一个实施例中第一阶段训练步骤的流程示意图。
图5为一个实施例中一种基于人工智能的内容处理方法的流程示意图。
图6为一个具体的实施例中一种基于人工智能的内容处理方法的流程示意图。
图7为一个实施例中基于人工智能的内容推荐装置的结构框图。
图8为另一个实施例中基于人工智能的内容推荐装置的结构框图。
图9为一个实施例中基于人工智能的内容处理装置的结构框图。
图10为另一个实施例中基于人工智能的内容处理装置的结构框图。
图11为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的基于人工智能的内容推荐方法,可以应用于计算机设备中。计算机设备可以为终端或服务器。可以理解的是,本申请提供的基于人工智能的内容推荐方法,可以应用于终端,也可以应用于服务器,还可以应用于包括终端和服务器的***,并通过终端和服务器的交互实现。
本申请提供的基于人工智能的内容推荐方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。其中,终端102可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。服务器104可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式***,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端102以及服务器104可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
云计算(cloud computing)是一种计算模式,它将计算任务分布在大量计算机构成的资源池上,使各种应用***能够根据需要获取计算力、存储空间和信息服务。提供资源的网络被称为“云”。作为云计算的基础能力提供商,会建立云计算资源池(简称云平台,一般称为IaaS(Infrastructure as a Service,基础设施即服务)平台,在资源池中部署多种类型的虚拟资源,供外部客户选择使用。云计算资源池中主要包括:计算设备(为虚拟化机器,包含操作***)、存储设备、网络设备。按照逻辑功能划分,在IaaS(Infrastructure asa Service,基础设施即服务)层上可以部署PaaS(Platform as a Service,平台即服务)层,PaaS层之上再部署SaaS (Software as a Service,软件即服务)层,也可以直接将SaaS部署在IaaS上。PaaS为软件运行的平台,如数据库、web容器等。SaaS为各式各样的业务软件,如web门户网站、内容推荐***等。
具体地,用户可以通过对应的终端102向服务器104发送访问请求,若该访问请求为目标域中的新用户发起的,服务器104则获取目标域的新用户在源域对应的源域用户特征,通过经过训练的任务导向映射模型,对源域用户特征进行特征映射,得到从源域映射至目标域的映射用户特征;进而通过预训练的内容推荐模型,分别根据映射用户特征和目标域中每个候选内容的目标域内容特征,进行推荐内容的点击预测;服务器104则根据点击预测的结果从候选内容中筛选待推荐的内容,并向目标域的新用户对应的终端102推送待推荐的内容。
可以理解,本申请各实施例中的基于人工智能的内容推荐方法,采用人工智能技术中的机器学习技术训练出任务导向映射模型以及内容推荐模型,由此能够精准地向目标域中的向用户进行内容推荐。人工智能(Artificial Intelligence ,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。可以理解,在本申请一些实施例中预训练的任务导向映射模型和内容推荐模型,就是使用机器学习技术训练的,基于该机器学习技术训练任务导向映射模型和内容推荐模型,能够训练出特征映射更加精准的任务导向映射模型,以及信息推荐精准度更高的内容推荐模型。
在一个实施例中,如图2所示,提供了一种基于人工智能的内容推荐方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
S202,获取目标域的新用户在源域对应的源域用户特征。
其中,目标域,也称为目标领域,是指需要处理当前的目标任务的场景领域。源域,也称为源领域,是指与目标域具有关联的相似信息。在迁移学习中,已有知识的领域叫做源域,待学习新知识的领域叫做目标域。迁移学习的目标是从一个或者多个源领域任务中提取有用知识信息并将其用在新的目标域任务上,具体可适用于跨领域推荐,跨领域推荐是将多个领域数据联合起来,共同作用于目标领域推荐。比如通过使用一个辅助域,即源域中的交互数据来辅助目标域中的推荐任务处理,以提升推荐效果。
可以理解的是,领域概念可以表示成任何可以区分的场景,如针对各种推荐内容的推荐应用场景。其中,推荐的内容,也即推荐的对象,内容可以包括物品、资源推广信息等。物品,可以包括虚拟物品和真实物品。在一个实施例中,物品包括能够通过资源转移方式进行交易的对象。资源推广信息,是用于推广各种资源的信息,比如文章、新闻内容、视频分享内容、网页内容、广告内容等各种推荐信息。
各个产品领域通常都有各自的推荐***。例如,网络中存在用户-物品的交互信息,而用户之间的交互称为社交信息,两者是异构的,可以通过跨领域的内容推荐处理,完成从信息领域到社交领域用户的物品推荐。
可以理解,目标域的新用户表示在当前的目标域对应的业务推荐***中没有任何交互数据的用户,而该用户在源域中存在历史交互数据。
其中,特征也即特征向量,通常指线性变换的特征向量。一个线性变换通常可以由其特征值和特征向量完全描述,相同特征值的特征向量集合称之为特征空间。各个领域分别具有各自的特征空间,比如同一个用户在不同推荐***中的特征向量表示也是不同的,即特征空间不同。
需要说明的是,源域用户特征是指该目标域的新用户在源域中的用户特征,源域用户特征是基于对该用户在源域中的历史交互行为信息进行特征提取得到的。其中,源域用户特征包括用户的多个属性特征,例如包括性别、年龄、常驻地、兴趣偏好、行为类型等信息对应的特征。
在其中一个实施例中,源域用户特征还可以包括用户在源域中对应的静态用户特征和动态用户特征,静态用户特征指用户的身份属性特征,包括性别、年龄、常驻地等信息对应的属性特征;动态用户特征指用户的行为特征,包括行为类型、行为偏好、物品偏好等特征。其中,动态用户特征可以反映用户的兴趣爱好。
具体地,用户的终端中运行有目标域对应的应用程序,用户可以通过终端中的应用程序向目标域对应的业务推荐***发起访问请求。服务器还可以对该访问请求对应的用户,进行新用户识别,具体地可以查询该用户在目标域中是否存在历史交互数据,从而判断该用户是否为新用户。目标域对应的服务器接收终端发送的访问请求,当识别出访问请求对应的用户是目标域中的新用户时,获取该新用户在具有历史交互数据的源域中所对应的源域用户特征。
在一个实施例中,获取目标域的新用户在源域对应的源域用户特征,包括:根据目标域中新用户的用户标识,在多个源域中,查找存在与用户标识对应的交互行为信息的源域;从源域中获取用户标识对应的源域用户特征;源域用户特征是基于用户标识在源域中的交互行为信息进行特征提取获得的。
其中,用户标识是指用户在应用***中用于识别用户身份的账户标识,例如可以为账户名称、手机号、应用号等标识。用户标识通常是标识用户身份的唯一的标识符。同一用户在不同领域应用中的用户标识可能是相同的。
当服务器识别出目标域中发起访问请求的用户是新用户时,该新用户可能在其他领域的应用中存在历史的交互行为信息。服务器则根据该新用户的用户标识,在多个源域中查找存在与用户标识对应的交互行为信息的源域,进而从源域中获取用户标识对应的源域用户特征。
其中,源域中的源域用户特征,是根据用户标识在源域中的交互行为信息进行特征提取获得的。源域中包括已经提取出的用户标识对应的源域用户特征,因此,服务器可以直接根据用户标识从源域中获取对应的源域特征。
S204,通过经过训练的任务导向映射模型,对源域用户特征进行特征映射,得到从源域映射至目标域的映射用户特征。
其中,任务导向映射模型是经过训练后具有将源域用户特征进行任务导向的特征映射,以映射至目标域对应的用户特征的能力的机器学习模型。任务导向映射模型是通过对源域和目标域中共享的历史用户的历史行为信息进行训练得到的。具体是以历史用户在源域的样本源域用户特征和在目标域的样本目标域内容特征作为训练样本,在目标域中的样本目标域内容对应的点击记录作为训练标签,以对样本目标域内容进行点击预测的任务导向为目标,进行训练得到的任务导向映射模型。
其中,任务导向映射模型中包括源域与目标域之间的映射函数,映射函数通过基于对样本目标域内容的点击预测对应的任务导向,进行迁移学习得到。
可以理解,特征映射,是指将源域和目标域的数据从原始特征空间映射到新的特征空间中去,即将源域中的特征空间映射到目标域中的特征空间,在该空间中,源领域数据与目标领域数据拥有相同的分布。从而可以在新的空间中,更好地利用源领域已有的有标记数据样本进行模型训练。只要源域和目标域之间具有一定的关联关系,在训练目标域中的任务导向映射模型时,就可以借助从源领域数据和特征中已经提取的知识,实现已学习知识在相似或相关领域间的复用和迁移。
服务器获取该新用户在源域对应的源域用户特征后,将获取的源域用户特征输入至预训练的任务导向映射模型,通过任务导向映射模型对源域用户特征进行特征映射,从而可以得到从源域映射至目标域的映射用户特征。
通过预训练的任务导向映射模型对源域中的源域用户特征进行特征映射处理,能够将该新用户在源域中的相关用户特征映射到目标域中的特征空间中,从而使得映射得到的映射用户特征具有在目标域的相关用户特征,由此可以获得该新用户在目标域中针对目标域内容的用户特征,有效弥补了该新用户在目标域中没有相关的用户特征,从而能够有效提高对目标域中的新用户进行内容推荐的精准度。
S206,通过预训练的内容推荐模型,分别根据映射用户特征和目标域中每个候选内容的目标域内容特征,进行推荐内容的点击预测。
可以理解,目标域中包括大量候选的待推荐的内容,也即目标域内容。内容可以包括但不限于物品、文章、图片、视频、广告、网页、应用程序或UGC(User Generated Content,用户内容)即用户生成内容,待推荐的内容具体可以包括文本、图像、音频、视频、网页等各种形式、以及各种形式组合的信息内容。
可以理解,内容推荐模型是目标域中,经过预先训练的具有对目标域中待推荐的内容进行点击预测能力的机器学习模型。内容推荐模型可以通过对目标域中的历史用户的历史行为信息进行训练得到。内容推荐模型用于根据用户在目标域中的用户特征,向用户推荐目标域中待推荐的内容。
服务器通过任务导向映射模型得到从源域映射至目标域的映射用户特征,由此获得了新用户在目标域中的用户特征。服务器则进一步通过预训练的内容推荐模型,分别根据映射用户特征和目标域中每个候选内容的目标域内容特征,进行推荐内容的点击预测。
服务器通过内容推荐模型,分别计算该新用户对目标域中的每个候选内容对应的点击预测值,从而得到每个候选内容对应的点击预测的结果。由此能够精准地预测出新用户对各个候选内容的兴趣度以及可能点击的概率,从而根据预测的结果向新用户推荐相应的内容,能够有效提高内容推荐的精准度。
S208,根据点击预测的结果从候选内容中筛选待推荐的内容。
其中,点击预测的结果可以反映新用户对各个候选内容所预测的兴趣程度,点击率预测是对目标域内容的点击情况进行预测,用于判断内容被用户点击的概率。点击率预测值用于对目标域中的内容进行推荐。
服务器获得目标域中的每个候选内容对应的点击预测的结果后,进而根据点击预测的结果从候选内容中筛选待推荐的内容。具体地,服务器筛选出点击预测值达到预设阈值的候选内容,并将筛选出的点击预测值达到预设阈值的候选内容,作为针对该新用户的待推荐的内容。
S210,向目标域的新用户推送待推荐的内容。
服务器筛选出待推荐的内容后,则向目标域的新用户推送待推荐的内容。进一步地,服务器还可以根据点击预测的结果确定待推荐的内容的推荐顺序,具体可以根据每个候选内容对应的点击预测值,对每个候选内容进行降序排序,从而按照排序后的推荐顺序向目标域的新用户推送待推荐的内容。新用户对应的终端获取到服务器推送的待推荐的内容后,则按照推荐顺序依次在终端的界面上展示相应的所推荐的内容。
传统的迁移学习中,通常是分别学习两个领域间的用户向量和物品向量的映射关系,用户向量也即用户特征,物品向量即物品特征。也就是通过分别学习源域用户特征与目标域用户特征间的映射关系、源域物品特征与目标域物品特征间的映射关系,以学习两个领域间的映射函数,这种方式是基于映射导向的损失函数学习映射函数。然而,目标领域的目标域用户向量本身可能不够精确,无法很好地体现用户兴趣,导致从源域映射至目标域的映射特征可能存在噪声影响,使用该映射得到的用户特征可能存在较大误差。
本实施例中的任务导向映射模型,并非通过学习两个领域间用户向量和物品向量两两之间的映射关系,而是以源域和目标域中共享的历史用户,在源域的样本源域用户特征和在目标域的样本目标域内容特征作为训练样本,在目标域中的样本目标域内容对应的点击记录作为训练标签,通过基于对样本目标域内容的点击预测对应的任务导向,利用任务导向的损失进行训练得到的。由此避开了目标域中的目标域用户特征,进而能够有效提高对目标域中的新用户进行内容推荐的精准度。
上述基于人工智能的内容推荐方法中,获取目标域的新用户在源域对应的源域用户特征;由于新用户在目标域中没有完善的用户特征信息,而源域用户特征是基于用户标识在源域中的交互行为信息进行特征提取获得的,通过经过训练的任务导向映射模型,对源域用户特征进行特征映射,从而能够有效地获得从源域映射至目标域的映射用户特征。服务器进一步通过预训练的内容推荐模型,分别根据映射用户特征和目标域中每个候选内容的目标域内容特征,进行推荐内容的点击预测,从而能够精准有效地对目标域中的候选内容进行点击预测,以获得较为准确合理的点击预测的结果。服务器则根据点击预测的结果从候选内容中筛选待推荐的内容,并向目标域的新用户推送待推荐的内容,由此向目标域中的新用户进行内容推荐时,能够根据新用户在源域中的源域用户特征学习到该新用户在目标域中的映射用户特征,并使用该映射用户特征进行内容推荐,能够有效解决新用户在目标域中的用户特征不足的问题,从而能够有效提高对目标域中的新用户进行内容推荐的精准度,有效提升了跨领域冷启动推荐的推荐效果。
在一个实施例中,通过经过训练的任务导向映射模型,对源域用户特征进行特征映射,得到从源域映射至目标域的映射用户特征,包括:将源域用户特征输入至经过训练的任务导向映射模型中,通过任务导向映射模型的映射层对源域用户特征进行特征矩阵变换;根据特征矩阵变换的结果,输出将源域用户特征映射至目标域中的映射用户特征。
可以理解,特征矩阵变换,表示从一个空间向量到另一个空间向量的映射且进行相应的向量计算。特征矩阵变换可以是一种非线性变换,以将源域中的源于用户特征映射至目标域中的特征空间,从而变换得到在目标域的特征空间中的映射用户特征。
其中,任务导向映射模型可以包括映射层,映射层中包括线性层-激活函数-线性层,其中,一个线性层-激活函数-线性层可以为视为一个矩阵变换层,映射层中还可以包括多个矩阵变换层。
服务器将源域用户特征输入至经过训练的任务导向映射模型后,通过任务导向映射模型的映射层中的线性矩阵,对源域用户特征进行特征矩阵变换,通过线性矩阵的变换之后,则可以将原始的源域用户特征变换为在目标域的特征空间的向量表示,进而得到将源域用户特征映射至目标域中的映射用户特征。预训练的任务导向映射模型包含了源域与目标域之间针对源域内容和目标域内容对应的用户特征分布以及相应映射关系。例如,线性矩阵变换过程具体可以采用基于再生核希尔伯特空间的特征映射或基于拉普拉斯特征映射等方式。
本实施例中,通过预训练的任务导向映射模型将源域用户特征进行特征映射处理,由此可以获得该新用户在目标域中针对目标域内容的用户特征,能够有效解决新用户在目标域中的用户特征不足的问题,从而能够有效提高对目标域中的新用户进行内容推荐的精准度。
在一个实施例中,通过预训练的内容推荐模型,分别根据映射用户特征和目标域中每个候选内容的目标域内容特征,进行推荐内容的点击预测,包括:将映射用户特征和目标域中候选内容的目标域内容特征,输入至预训练的内容推荐模型中,通过内容推荐模型预测新用户对每个候选内容的兴趣度;根据兴趣度对每个候选内容进行点击预测评分,得到每个候选内容对应的点击预测的结果。
其中,预先训练的内容推荐模型可以是由人工神经网络构成的模型。神经网络模型比如CNN(Convolutional Neural Network,卷积神经网络)模型、DNN(Deep NeuralNetwork,深度神经网络)模型、RNN(Recurrent Neural Network,循环神经网络)模型、LSTM(Long Short-Term Memory Neural Network,长短时记忆神经网络)模型等。内容推荐模型也可以是多种神经网络模型的组合。
可以理解,深度神经网络通常包括输入层、隐含层和输出层,层与层之间是全连接的关系。内容推荐模型中还包括预测层。预测层中可以包括多头自注意力机制层(MultiMhead self-attention),位置全链接层(position-wise Feed Forward),中间层可以包括多层残差连接层(Layer Normalization)以及FFN(前馈神经网络),每个子层之间有残差连接,用于进行层归一化。预测层中包括预测函数,预测函数可以是预设的损失函数,内容推荐模型的损失可以采用基于Point-wise点的排序学习、基于Pair-wise成对同步学习、基于List-wise列表学习或基于Metric-loss度量学习等方式学习得到对应的损失。损失函数具体可以采用Sigmoid函数、Tanh函数、ReLu函数、Softmax函数或交叉熵损失函数等函数。预测层用于对用户对目标域中的候选内容的点击概率进行预测。
服务器获得新用户对应的映射用户特征后,则将映射用户特征,以及目标域中多个候选内容对应的目标域内容特征输入至内容推荐模型中,通过内容推荐模型中预测层的各神经网络,根据用户的映射用户特征预测用户对目标域中每个候选内容的兴趣度,并根据预测的兴趣度对每个候选内容的点击概率进行预测,得到对每个候选内容的点击预测评分,点击预测评分即为候选内容的点击预测结果。
例如,每个用户包括对应的用户标识,例如表示为User ID,每个候选内容,即目标域内容,也包括对应的内容标识,例如表示为Item ID。用户在源域中的源域用户特征可以表示为User ID embedding,目标域中候选内容的目标域内容特征可以表示为Item IIDembedding。通过经过训练的任务导向映射模型对User ID embedding进行特征映射,将User ID embedding从源域Mapping至目标域的特征空间中,从而得到映射后的映射用户特征,映射用户特征可以表示为Transformed ID embedding。然后将Transformed IDembedding和多个Item IID embedding输入至目标域中预训练的内容推荐模型中,对各个Item IID embedding进行点击预测,进而根据点击预测的结果筛选出针对新用户待推荐的内容。
本实施例中,通过内容推荐模型根据映射用户特征和候选内容对应的目标域内容特征,对目标域中的新用户进行推荐内容的点击预测,能够精准地预测出新用户对各个候选内容的兴趣度以及可能点击的概率,从而根据预测的结果向新用户推荐相应的内容,能够有效提高内容推荐的精准度。
在一个实施例中,如图3所示,还提供了另一种基于人工智能的内容推荐方法,包括以下步骤:
S302,获取第一子应用中的新用户对应的访问请求,访问请求包括用户标识;第一子应用对应目标域;第一子应用运行于母应用提供的环境中。
S304,根据用户标识,查找运行于母应用中的存在与用户标识对应的交互行为信息的第二子应用;第二子应用对应源域;第二子应用中包括基于用户标识的交互行为信息获得的源域用户特征。
S306,获取目标域的新用户在源域对应的源域用户特征。
S308,通过经过训练的任务导向映射模型,对源域用户特征进行特征映射,得到从源域映射至目标域的映射用户特征。
S310,通过预训练的内容推荐模型,分别根据映射用户特征和目标域中每个候选内容的目标域内容特征,进行推荐内容的点击预测。
S312,根据点击预测的结果从候选内容中筛选待推荐的内容。
S314,向目标域的新用户推送待推荐的内容。
其中,母应用是指可独立运行的应用,是直接运行于操作***上的原生应用程序。母应用具体可以是承载子应用的应用程序,且能够提供运行环境给子应用运行的应用。子应用是指不需要下载安装即可使用的应用,但子应用需要在母应用上运行。
可以理解的是,子应用可以是附属于母应用的各种业务应用场景,还可以是运行于母应用程序中的子应用程序。各个子应用对应不同的领域。母应用、子应用均包括但不限于即时通信应用、SNS应用、短视频应用、长视频应用、游戏应用、文章应用、音乐分享应用、UGC应用,但不限于此。
以母应用为即时通讯应用为例,母应用中包括多个子应用,例如子应用可以为文章应用、短视频应用、游戏应用等。
可以理解,用户在母应用中具有对应的用户标识,用户在母应用的各子应用中的用户标识,可以与在母应用中的用户标识相同。例如可以为相同的应用账户标识,如应用账户;或者身份标识,如手机号码等。
用户对应的终端中运行有母应用,用户可以通过对应的终端向母应用中的第一子应用发送访问请求,并通过第一子应用对该访问请求进行处理,以向用户推荐第一子应用中的候选内容。
服务器获取第一子应用中的新用户对应的访问请求后,根据访问请求中携带的用户标识识别该用户是否为新用户。若该用户为新用户时,服务器则根据用户标识,查找运行于母应用中的存在与用户标识对应的交互行为信息的第二子应用,并将第一子应用作为目标域,将第二子应用作为源域。其中,第二子应用中包括基于用户标识的交互行为信息进行特征提取获得的源域用户特征。
接着,服务器则从第二子应用中,获取该目标域的新用户在源域对应的源域用户特征。服务器进一步通过经过训练的任务导向映射模型,对源域用户特征进行特征映射,得到从第二子应用映射至第一子应用的映射用户特征。通过预训练的内容推荐模型,分别根据映射用户特征和第一子应用中每个候选内容的目标域内容特征,进行推荐内容的点击预测。服务器进而根据点击预测的结果从候选内容中筛选待推荐的内容,并向新用户推送第一子应用中筛选出的待推荐的内容。
本实施例中,针对母应用中运行的第一子应用中的新用户,将第一子应用作为目标域,根据该新用户的用户标识,获取该新用户在母应用中存在交互行为信息对应的第二子应用中获取源域用户特征,从而能够有效获取到该新用户在其他领域有过交互行为的用户特征,通过对第二子应用中的源域用户特征进行特征映射,获得该新用户在目标域中较为精准的映射用户特征,进而能够根据映射用户特征向该新用户推荐第一子应用中的内容,从而有效提高了对新用户的推荐精准度。
在一个实施例中,内容推荐模型通过第一阶段训练步骤训练获得,如图4所示,为一个实施例中,第一阶段训练步骤的流程示意图,包括以下步骤:
S402,获取目标域中的历史交互信息和对应的点击记录标签;历史交互信息包括目标域中的历史用户对应的样本目标域用户特征和样本目标域内容特征;点击记录标签是目标域中的样本目标域内容的点击记录。
S404,将样本目标域用户特征和样本目标域内容特征输入至待训练的内容推荐模型,进行样本目标域内容的点击预测。
S406,根据点击预测的结果和点击记录标签确定点击预测损失值。
S408,根据点击预测损失值调整内容推荐模型的参数并继续训练,直至满足训练停止条件时结束训练。
可以理解的是,第一阶段训练是指模型训练处理过程的其中一个阶段,第一阶段训练是用于区分第二阶段训练,以及第一阶段训练与第二阶段训练的先后顺序,即需要首先经过第一阶段训练,然后再进行第二阶段训练,也就是需要先训练出内容推荐模型后,然后再训练任务导向映射模型。
可以理解,历史交互信息,是指在目标域对应的应用中的历史用户与相应的业务***发生用户信息行为的信息,用户信息行为是指用户寻求其所需求的信息时所表现出来的需求表达、信息获取、信息利用等行为。历史交互信息也就是用户在过去一段时间内在目标域应用中所产生的历史交互数据。
其中,目标域中的历史交互信息包括多个历史用户对应的用户标识,以及与其用户标识对应的历史交互内容,每个历史用户可以包括与多个历史交互内容对应的历史交互信息。历史交互信息可以是从预设样本库中获取的,也可以从各种目标域的应用平台中获取的,如社交网络、视频分享网络、社区论坛和博客等应用中历史用户的历史交互信息。历史交互内容可以包括文本、文章、图片、音频、视频、广告等各种形式的内容。
服务器获取目标域中的历史交互信息和对应的点击记录标签后,将历史交互信息作为训练内容推荐模型的训练样本,并将点击记录标签作为训练标签,以及将历史交互内容作为样本目标域内容。其中,历史交互信息包括目标域中的历史用户对应的样本目标域用户特征和样本目标域内容特征,点击记录标签是历史交互信息中各个样本目标域内容的点击记录。
可以理解的是,样本目标域用户特征和样本目标域内容特征可以是预先提取获得的,也可以直接将历史交互信息输入至内容推荐模型中,通过内容推荐模型对历史交互信息进行特征提取,分别提取出样本目标域用户特征和样本目标域内容特征。
服务器将获得的样本目标域用户特征和样本目标域内容特征输入至内容推荐模型,通过根据样本目标域用户特征对历史用户对样本目标域内容的点击概率进行预测,得到点击预测的结果,并根据点击预测的结果和点击记录标签确定点击预测损失值。服务器进而根据点击预测损失值调整内容推荐模型的参数并继续训练,直至满足训练停止条件时结束训练。
其中,点击预测的结果包括各样本目标域内容的点击预测值,具体可以根据各样本目标域内容的点击预测值与点击记录标签的差异,计算点击预测损失值。点击预测损失值可以采用损失函数来衡量,例如可以选择平均绝对值损失函数、平滑平均绝对误差、交叉熵损失函数等函数作为损失函数。
可以理解,训练条件是结束模型训练的条件。训练停止条件可以是达到预设的迭代次数,或者是调整参数后的内容推荐模型的预测性能指标达到预设指标,以实现对目标域中的内容进行精准推荐。
本实施例中,通过样本目标域用户特征和样本目标域内容特征,以及点击记录标签训练内容推荐模型,并根据点击预测损失值逐步对内容推荐模型中的参数进行调整。由此在参数调整过程中,使得内容推荐模型能够捕捉用户特征与内容特征与点击率之间的隐含关系,从而有效提高了内容的点击预测的准确性,从而能够训练得到推荐准确度较高的内容推荐模型。
在一个实施例中,服务器可以获取用户通过终端向目标域发送的访问请求,当服务器识别出访问请求对应的用户并非新用户时,即表示该用户在目标域中存在历史的交互行为信息。服务器则可以直接获取对该用户对应的交互行为信息进行特征提取,得到对应的目标域用户特征。服务器进而通过经过训练的内容推荐模型,根据该用户的目标域用户特征,以及目标域中候选内容对应的目标域内容特征,预测该用户对各个候选内容的兴趣度,并输出各个候选内容的点击预测评分。服务器进而根据预测出的点击预测评分从候选内容中筛选出满足推送条件的待推荐的内容,并将筛选出的待推荐的内容推送至该用户对应的终端。
在一个实施例中,任务导向映射模型通过第二阶段训练步骤训练获得,第二阶段训练步骤包括:获取历史交互信息和对应的点击记录标签;历史交互信息包括历史用户在源域的样本源域用户特征以及在目标域的样本目标域内容特征;通过待训练的任务导向映射模型,对样本源域用户特征进行特征映射,得到从源域映射至目标域的样本映射用户特征;将样本映射用户特征和样本目标域内容特征输入至预训练的内容推荐模型,进行样本目标域内容的点击预测;根据点击预测的结果和点击记录标签确定任务导向损失值;根据任务导向损失值调整任务导向映射模型的参数并继续训练,直至满足训练停止条件时结束训练。
具体地,服务器从源域和目标域中共享的历史用户的历史行为信息中,获取历史用户在源域的样本源域用户特征和在目标域的样本目标域内容特征,以及对各样本目标域内容分别对应的点击记录标签。
接着将样本源域用户特征输入至待训练的任务导向映射模型中,通过待训练的任务导向映射模型,对样本源域用户特征进行特征映射,以将各历史用户在源域中的相关用户特征映射到目标域中的特征空间中,从而得到从源域映射至目标域的样本映射用户特征。
服务器通过任务导向映射模型获得从源域映射至目标域的样本映射用户特征后,然后将样本映射用户特征和样本目标域内容特征输入至预训练的内容推荐模型,通过内容推荐模型,分别计算各历史用户对目标域中的每个样本目标域内容对应的点击预测值,从而得到各个历史用户对每个样本目标域内容对应的点击预测的结果。
服务器进而根据点击预测的结果和点击记录标签确定任务导向损失值,并根据任务导向损失值,调整任务导向映射模型的参数并继续训练,以对任务导向映射模型进行迭代训练,直至满足训练停止条件时结束训练。
其中,任务导向映射模型的损失可以与第一阶段所训练的内容推荐模型的损失一致,是基于对样本目标域内容的进行点击预测对应的任务导向的损失。
可以理解,训练条件是结束模型训练的条件。通过避开目标域中的目标域用户特征训练任务导向映射模型,减小了将源域用户特征映射至目标域中的映射用户特征的误差,从而能够有效提高任务导向映射模型将源域用户特征映射至目标域中的用户特征的准确度。
在一个实施例中,如图5所示,提供了一种基于人工智能的内容处理方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
S502,获取历史交互信息和对应的点击记录标签;历史交互信息包括历史用户在源域的样本源域用户特征以及在目标域的样本目标域内容特征。
其中,历史交互信息包括源域和目标域中共享的历史用户的历史行为信息,历史交互信息中还包括样本源域内容和样本目标域内容,以及各历史用户对各样本源域内容和样本目标域内容分别对应的点击记录标签。
在一个实施例中,获取历史交互信息和对应的点击记录标签,包括:获取源域和目标域中共享的历史用户对应的用户标识;根据用户标识分别获取历史用户在源域和目标域中的历史交互信息;从历史交互信息中提取历史用户在源域的样本源域用户特征和在目标域的样本目标域内容特征,以及目标域中的历史交互信息对应的点击记录标签;点击记录标签是目标域的历史交互信息中各样本目标域内容对应的点击记录。
服务器具体可以首先查找源域和目标域中共享的历史用户对应的用户标识,然后根据用户标识分别获取在源域和目标域中的历史交互信息。服务器进一步对历史交互信息进行特征提取,提取出各历史用户在源域的样本源域用户特征,以及在目标域的样本目标域内容特征。
服务器在训练任务导向映射模型的过程中,将各历史用户在源域的样本源域用户特征,以及在目标域的样本目标域内容特征作为训练任务导向映射模型的训练样本,并将各样本目标域内容对应的点击记录标签作为训练标签。
例如,两个领域共享的历史用户有N个,平均每个历史用户在目标领域有M次交互,即对M个样本目标域内容有过交互,进而可以直接使用N*M个样本目标域内容对应的样本,作为训练样本,来训练任务导向映射模型。由此大大增加了训练样本的数量,能够有效缓解过拟合的问题,从而能够有效提高任务导向映射模型的训练精准度。
S504,通过待训练的任务导向映射模型,对样本源域用户特征进行特征映射,得到从源域映射至目标域的样本映射用户特征。
服务器获取各历史用户对应的样本源域用户特征和样本目标域内容特征后,将样本源域用户特征输入至待训练的任务导向映射模型中,通过待训练的任务导向映射模型,对样本源域用户特征进行特征映射,以将各历史用户在源域中的相关用户特征映射到目标域中的特征空间中,从而得到从源域映射至目标域的样本映射用户特征。
S506,将样本映射用户特征和样本目标域内容特征输入至预训练的内容推荐模型,进行样本目标域内容的点击预测。
S508,根据点击预测的结果和点击记录标签确定任务导向损失值。
S510,根据任务导向损失值调整任务导向映射模型的参数并继续训练,直至满足训练停止条件时结束训练。
服务器通过任务导向映射模型获得从源域映射至目标域的样本映射用户特征后,然后将样本映射用户特征和样本目标域内容特征输入至预先训练的内容推荐模型,通过内容推荐模型,根据各样本映射用户特征和每个目标域中的样本目标域内容的目标域内容特征,分别计算各历史用户对目标域中的每个样本目标域内容对应的点击预测值,从而得到各个历史用户对每个样本目标域内容对应的点击预测的结果。
服务器进而根据点击预测的结果和点击记录标签确定任务导向损失值,具体地,根据各个样本目标域内容的点击预测值与相应的点击几率标签的差异,计算任务导向损失值。其中,点击预测损失值可以采用目标损失函数来衡量,例如可以选择平均绝对值损失函数、平滑平均绝对误差、交叉熵损失函数等函数作为损失函数。
在其中一个实施例中,训练的目标损失函数可以如下:
Figure 67235DEST_PATH_IMAGE001
其中,L θ 是任务导向映射模型的目标损失函数,Da是样本数据集,x是样本数据中的每一个样本,L task 是预测任务对应的任务导向的损失。例如,样本数据集中包括N*M个样本,其中,两个领域共享的历史用户有N个,每个历史用户在目标领域的样本目标域内容有M次交互,则将N*M个样本目标域内容对应的样本,M为用户数量,N为样本目标域内容对应的项目数量。
例如,以L task 损失函数为基于Point-wise点方式学习的损失为例,L task 损失函数可以如下:
Figure 993603DEST_PATH_IMAGE002
其中,假设有M个用户和N 个样本目标域内容对应的项目,分别用i和j来对应表示索引,u i 表示每一个用户的隐向量,v i 表示每一个样本目标域内容对应的项目的隐向量,r ij 表示用户i对项目j的点击预测。矩阵RM×N表示用户-项目交互的打分矩阵,包括所有已知用户对各样本目标域内容对应项目的点击记录标签。R ij 为第i个用户对第j个样本目标域内容的打分信息。其中,R ij 为1表示用户i与项目j之间存在正关系;R ij 为0代表用户i与项目j之间存在负关系,或关系未知。σ是将输出转换成概率的函数,例如可以是sigmoid函数。最后,计算用户隐向量和样本目标域内容的隐向量之间的点乘,将点击预测的结果与真实值R ij 进行比较,对任务导向映射模型中的网络参数进行优化。
可以理解,在另外的实施例中,还可以采用基于Pair-wise成对同步学习、基于List-wise列表学习或基于Metric-loss度量学习等方式学习对应的损失,也可以采用其他例如Softmax函数或交叉熵损失函数等函数作为损失函数,在此不作限定。
服务器进而根据任务导向损失值,调整任务导向映射模型的参数并继续训练,以对任务导向映射模型进行迭代训练,直至满足训练停止条件时结束训练。可以理解,训练条件是结束模型训练的条件。训练停止条件可以是达到预设的迭代次数,或者是调整参数后的内容推荐模型的预测性能指标达到预设指标,以实现对目标域中的内容进行精准推荐。
在一个实施例中,根据点击预测的结果和点击记录标签确定任务导向损失值,包括:根据点击预测的结果与点击记录标签之间的差异,确定任务导向损失值;
根据任务导向损失值调整任务导向映射模型的参数并继续训练,包括:根据任务导向损失值调整任务导向映射模型的参数,以使任务导向映射模型在迭代训练的过程中,使点击预测的结果与点击记录标签之间的差异减小。
服务器在训练任务导向映射模型的过程中,根据每次点击预测的结果,分别与相应的样本目标域内容的点击记录标签之间的差异,计算任务导向损失值。进而根据对比损失值更新任务导向映射模型的参数。
具体地,根据任务导向损失值更新任务导向映射模型的参数,以对任务导向映射模型进行迭代训练的过程中,不断使点击预测的结果与点击记录标签之间的差异减小,使得样本映射特征越来越接近,具有点击记录标签的样本目标域内容所对应的目标域用户特征。由此减小了将源域用户特征映射至目标域中的映射用户特征的误差,从而能够有效提高基于点击预测任务导向的映射至目标域中的用户特征的准确度。
可以理解,上述任务导向映射模型可以采用有监督式学习(SupervisedLearning)、半监督式学习(Semi-Supervised Learning)、开放式学习(无监督,unsupervised learning)、少次学习训练等方式训练任务导向映射模型,在此不作限定。
在其中一个实施例中,可以采用有监督的模型训练方式。在监督式学习下,输入模型的数据为训练数据,每组训练数据都有一个明确的标识,即每组样本都包括一个历史用户对应的样本源域用户特征、样本目标域内容特征以及样本目标域内容对应的点击记录标签。在采用监督式学习方式训练任务导向映射模型的过程中,将每次的预测结果与相应的样本目标域内容的点击记录标签进行比较,得到相应的差异,并根据差异不断调整任务导向映射模型的参数,直到任务导向映射模型的预测结果达到一个预期的准确率。
以采用反向传播算法为例,在迭代训练任务导向映射模型的过程中,基于反向传播算法,朝着梯度下降的方向更新参数,调整权重和偏置使得整体误差最小,并逐渐调整任务导向映射模型的参数,以迭代训练任务导向映射模型。
在另一个实施例中,可以采用半监督的模型训练方式。其中,半监督学习中可以采用大量的无标记数据,并同时采用有标记数据进行模式识别工作。通过采用半监督学习时,能够有效减少处理数据的资源消耗,同时能够带来比较高的准确性。
上述基于人工智能的内容处理方法,通过以源域和目标域中共享的历史用户,在源域的样本源域用户特征和在目标域的样本目标域内容特征作为训练样本,在目标域中的样本目标域内容对应的点击记录作为训练标签,通过基于对样本目标域内容的点击预测对应的任务导向,利用任务导向的损失值进行训练,由此避开了目标域中的目标域用户特征,减小了将源域用户特征映射至目标域中的映射用户特征的误差,从而能够有效提高基于点击预测任务导向的映射至目标域中的用户特征的准确度,进而能够有效提高对目标域中的新用户进行内容推荐的精准度。
在一个实施例中,通过待训练的任务导向映射模型,对样本源域用户特征进行特征映射,得到从源域映射至目标域的样本映射用户特征,包括:将样本源域用户特征输入至待训练的任务导向映射模型中,通过任务导向映射模型的映射层对样本源域用户特征进行特征矩阵变换;根据特征矩阵变换的结果,输出将样本源域用户特征映射至目标域中的样本映射用户特征。
其中,任务导向映射模型中包括映射层,映射层中包括线性层-激活函数-线性层,其中,一个线性层-激活函数-线性层可以为视为一个矩阵变换层,映射层中还可以包括多个矩阵变换层。
服务器获取各历史用户对应的样本源域用户特征和样本目标域内容特征后,将样本源域用户特征输入至待训练的任务导向映射模型中,通过待训练的任务导向映射模型,对样本源域用户特征进行特征映射。
具体地,通过任务导向映射模型的映射层对样本源域用户特征进行特征矩阵变换,以将各历史用户在源域中的相关用户特征映射到目标域中的特征空间中,从而得到从源域映射至目标域的样本映射用户特征。
具体地,源域中包括各源域内容的类别以及相应的权重,目标域中也包括各目标域内容以及相应的权重。源域用户特征包括用户在源域中对个源域内容的兴趣偏好,例如兴趣偏好可以基于对用户所偏好的目标域内容,根据相应的类别和权重进行加权,得到历史用户对各个目标域内容的兴趣度。预训练的任务导向映射模型包含了源域与目标域之间针对源域内容和目标域内容对应的用户特征分布以及相应映射关系。通过根据源域用户特征对样本目标域内容的点击预测任务导向,利用任务导向的损失,迭代训练任务导向映射模型,从而能够得到用户在源域中的样本源域特征,针对目标域中的样本目标域内容的兴趣所对应的映射关系。由此能够有效提高基于点击预测任务导向的映射至目标域中的用户特征的准确度。
在一个实施例中,将样本映射用户特征和样本目标域内容特征输入至预训练的内容推荐模型,进行样本目标域内容的点击预测,包括:将样本映射用户特征和样本目标域内容特征输入至预训练的内容推荐模型中,通过内容推荐模型预测历史用户对各样本目标域内容的样本兴趣度;根据样本兴趣度对各样本目标域内容进行点击预测,得到各样本目标域内容对应的点击预测的结果。
服务器获得各个历史用户对应的样本映射用户特征后,则将样本映射用户特征,以及目标域中多样本目标域内容特征输入至经过训练的内容推荐模型中,通过内容推荐模型中预测层的各神经网络,根据历史用户的样本映射用户特征预测用户对目标域中每个样本目标域内容的样本兴趣度,并根据预测的兴趣度对各个样本目标域内容的点击概率进行预测,得到对各个样本目标域内容的样本点击预测评分,点击预测评分也可以是样本点击预测值,即为样本目标域内容的点击预测结果。
服务器进而根据点击预测的结果和点击记录标签确定任务导向损失值,并根据任务导向损失值,调整任务导向映射模型的参数并继续训练,以对任务导向映射模型进行迭代训练,直至满足训练停止条件时结束训练。
在一个实施例中,内容推荐模型通过第一阶段训练步骤训练获得,任务导向映射模型通过第二阶段训练步骤训练获得,第一阶段训练步骤包括:获取目标域中的历史交互信息和对应的点击记录标签;历史交互信息包括目标域中的历史用户对应的样本目标域用户特征和样本目标域内容特征;点击记录标签是目标域中的样本目标域内容的点击记录;将样本目标域用户特征和样本目标域内容特征输入至待训练的内容推荐模型,进行样本目标域内容的点击预测;根据点击预测的结果和点击记录标签确定点击预测损失值;根据点击预测损失值调整内容推荐模型的参数并继续训练,直至满足训练停止条件时结束训练。
可以理解的是,第一阶段训练是指模型训练处理过程的其中一个阶段,第一阶段训练是用于区分第二阶段训练,以及第一阶段训练与第二阶段训练的先后顺序,即需要首先经过第一阶段训练,然后再进行第二阶段训练,也就是需要先训练出内容推荐模型后,然后再训练任务导向映射模型。
服务器获取目标域中的历史交互信息和对应的点击记录标签后,将历史交互信息作为训练内容推荐模型的训练样本,并将点击记录标签作为训练标签,以及将历史交互内容作为样本目标域内容。其中,历史交互信息包括目标域中的历史用户对应的样本目标域用户特征和样本目标域内容特征,点击记录标签是历史交互信息中各个样本目标域内容的点击记录。
服务器将获得的样本目标域用户特征和样本目标域内容特征输入至内容推荐模型,通过根据样本目标域用户特征对历史用户对样本目标域内容的点击概率进行预测,得到点击预测的结果,并根据点击预测的结果和点击记录标签确定点击预测损失值。服务器进而根据点击预测损失值调整内容推荐模型的参数并继续训练,直至满足训练停止条件时结束训练。其中,点击预测的结果包括各样本目标域内容的点击预测值,具体可以根据各样本目标域内容的点击预测值与点击记录标签的差异,计算点击预测损失值。
在其中一个实施例中,服务器还可以采用同样的训练方式,获取源域中的历史交互信息和对应的点击记录标签,以历史交互内容作为样本源域内容,将源域中的历史交互信息作为训练内容推荐模型的训练样本,并将点击记录标签作为训练标签,以训练出源域中的内容推荐模型。源域中的内容推荐模型的训练方式与上述训练方式同理,在此不再赘述。可以理解的是,目标域中的内容推荐模型和源域中的内容推荐模型,均可以为是在第一阶段训练获得的。
本实施例中,通过样本目标域用户特征和样本目标域内容特征,以及点击记录标签训练内容推荐模型,并根据点击预测损失值逐步对内容推荐模型中的参数进行调整。由此在参数调整过程中,使得内容推荐模型能够捕捉用户特征与内容特征与点击率之间的隐含关系,从而有效提高了内容的点击预测的准确性,从而能够训练得到推荐准确度较高的内容推荐模型。
在一个实施例中,如图6所示,提供了一种具体的基于人工智能的内容处理方法,包括以下步骤:
其中,内容推荐模型通过第一阶段训练步骤训练获得的,第一阶段训练步骤包括:
S602,获取目标域中的历史交互信息和对应的点击记录标签;历史交互信息包括目标域中的历史用户对应的样本目标域用户特征和样本目标域内容特征;点击记录标签是目标域中的样本目标域内容的点击记录。
S604,将样本目标域用户特征和样本目标域内容特征输入至待训练的内容推荐模型,进行样本目标域内容的点击预测。
S606,根据点击预测的结果和点击记录标签确定点击预测损失值。
S608,根据点击预测损失值调整内容推荐模型的参数并继续训练,直至满足训练停止条件时结束训练,得到经过训练的内容推荐模型。
其中,任务导向映射模型通过第二阶段训练步骤训练获得的,第二阶段训练步骤包括:
S610,获取源域和目标域中共享的历史用户的历史行为信息和对应的点击记录标签;历史交互信息包括历史用户在源域的样本源域用户特征以及在目标域的样本目标域内容特征;点击记录标签是目标域中的样本目标域内容的点击记录。
S612,通过待训练的任务导向映射模型,对样本源域用户特征进行特征映射,得到从源域映射至目标域的样本映射用户特征。
S614,将样本映射用户特征和样本目标域内容特征输入至预训练的内容推荐模型,进行样本目标域内容的点击预测。
S616,根据点击预测的结果和点击记录标签确定任务导向损失值。
S618,根据任务导向损失值调整任务导向映射模型的参数并继续训练,直至满足训练停止条件时结束训练,得到经过训练的任务导向映射模型。
通过以源域和目标域中共享的历史用户,在源域的样本源域用户特征和在目标域的样本目标域内容特征作为训练样本,在目标域中的样本目标域内容对应的点击记录作为训练标签,通过基于对样本目标域内容的点击预测对应的任务导向,利用任务导向的损失值进行训练,由此避开了目标域中的目标域用户特征,减小了将源域用户特征映射至目标域中的映射用户特征的误差,从而能够有效提高基于点击预测任务导向的映射至目标域中的用户特征的准确度,进而有效提高了对目标域中的新用户进行内容推荐的精准度。
本申请还提供一种具体的应用场景。具体地,母应用可以为即时通信应用,例如母应用为微信应用。微信应用中包括“看一看”应用,即一种文章推荐应用,是微信应用中的公众号内容推荐平台,可以根据用户在微信及关联平台上的兴趣,推荐个性化定制的公众号文章、视频信息流。微信应用中还包括“视频号”应用,即一种视频推荐应用,是微信应用中短视频推荐平台,可以根据用户在微信及关联平台上的兴趣推荐个性化定制的短视频内容。可以将看一看应用作为微信应用中的第一子应用,将视频号应用作为微信应用中的第二子应用。
对于微信应用中的用户,通常用户在各个子应用中的用户标识,与母应用微信应用中的用户标识是一致的。看一看应用中包括多个用于推荐的候选内容,即候选待推荐的文章分享内容。同样,视频号应用中包括多个用于推荐的候选内容,即候选待推荐的视频分享内容。通常每个产品领域的应用都有各自对应的推荐***。其中,看一看应用中包括对应领域的预训练的内容推荐模型,视频号应用中也包括对应领域的预训练的内容推荐模型。看一看应用中还包括针对视频号应用与看一看应用间的预训练的任务导向映射模型。
对于微信应用中的用户,可以访问“看一看”应用,以及“视频号”应用。例如有的用户在某一个产品领域的应用中没有任何交互数据,即历史交互行为信息。比如针对一个新加入的用户,如这个新用户刚开始使用视频号应用时,在视频号应用中不存在交互行为信息。但是该用户可能在其他的产品应用中,比如看一看应用上有过交互数据,即存在看一看应用中存在该用户的交互行为信息。此时该用户则为看一看应用中的新用户,可以将看一看应用这个第一子应用作为目标域,将视频号应用这个第二子应用作为源域。
当该新用户访问看一看应用时,则根据用户标识,查找运行于母应用中的存在与用户标识对应的交互行为信息的第二子应用,即视频号应用。进而从视频号应用获取该用户的交互行为信息,并从交互行为信息中提取源域用户特征,也可以直接从视频号应用中获取预先提取出的源域用户特征。
然后通过针对视频号应用与看一看应用间的预训练的任务导向映射模型,对视频号应用中的源域用户特征进行特征映射,得到从视频号应用映射至看一看应用的映射用户特征,从而能够有效获得看一看应用中的新用户在目标域中较为精准的映射用户特征。进而通过看一看应用中预训练的内容推荐模型,分别根据映射用户特征和看一看应用中每个候选内容的目标域内容特征,进行推荐内容的点击预测。
进一步地,根据点击预测的结果从候选内容中筛选待推荐的内容,并向新用户推送看一看应用中筛选出的待推荐的内容。由此向看一看应用目标域中的新用户进行内容推荐时,能够根据新用户在视频号应用源域中的源域用户特征学习到该新用户在看一看应用中的映射用户特征,并使用该映射用户特征进行内容推荐,能够有效解决新用户在看一看应用中的用户特征不足的问题,从而能够有效提高对目标域中的新用户进行内容推荐的精准度,有效提升了跨领域冷启动推荐的推荐效果。
应该理解的是,虽然图2-6的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-6中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图7所示,提供了一种基于人工智能的内容推荐装置700,该装置可以采用软件模块或硬件模块,或者是二者的结合成为计算机设备的一部分,该装置具体包括:数据获取模块702、特征映射模块704、内容预测模块706和内容推荐模块708,其中:
数据获取模块702,用于获取目标域的新用户在源域对应的源域用户特征;
特征映射模块704,用于通过经过训练的任务导向映射模型,对源域用户特征进行特征映射,得到从源域映射至目标域的映射用户特征;
内容预测模块706,用于通过预训练的内容推荐模型,分别根据映射用户特征和目标域中每个候选内容的目标域内容特征,进行推荐内容的点击预测;
内容推荐模块708,用于根据点击预测的结果从候选内容中筛选待推荐的内容;向目标域的新用户推送待推荐的内容。
在一个实施例中,数据获取模块702还用于根据目标域中新用户的用户标识,在多个源域中,查找存在与用户标识对应的交互行为信息的源域;从源域中获取用户标识对应的源域用户特征;源域用户特征是基于用户标识在源域中的交互行为信息进行特征提取获得的。
在一个实施例中,特征映射模块704还用于将源域用户特征输入至经过训练的任务导向映射模型中,通过任务导向映射模型的映射层对源域用户特征进行特征矩阵变换;根据特征矩阵变换的结果,输出将源域用户特征映射至目标域中的映射用户特征。
在一个实施例中,内容预测模块706还用于将映射用户特征和目标域中候选内容的目标域内容特征,输入至预训练的内容推荐模型中,通过内容推荐模型预测新用户对每个候选内容的兴趣度;根据兴趣度对每个候选内容进行点击预测评分,得到每个候选内容对应的点击预测的结果。
在一个实施例中,数据获取模块702还用于获取第一子应用中的新用户对应的访问请求,访问请求包括用户标识;第一子应用对应目标域;第一子应用运行于母应用提供的环境中;根据用户标识,查找运行于母应用中的存在与用户标识对应的交互行为信息的第二子应用;第二子应用对应源域;第二子应用中包括基于用户标识的交互行为信息获得的源域用户特征。
在一个实施例中,内容推荐模型通过第一阶段训练步骤训练获得,装置还包括第一模型训练模块,用于获取目标域中的历史交互信息和对应的点击记录标签;历史交互信息包括目标域中的历史用户对应的样本目标域用户特征和样本目标域内容特征;点击记录标签是目标域中的样本目标域内容的点击记录;将样本目标域用户特征和样本目标域内容特征输入至待训练的内容推荐模型,进行样本目标域内容的点击预测;根据点击预测的结果和点击记录标签确定点击预测损失值;根据点击预测损失值调整内容推荐模型的参数并继续训练,直至满足训练停止条件时结束训练。
在一个实施例中,如图8所示,提供了另一种基于人工智能的内容推荐装置700,任务导向映射模型通过第二阶段训练步骤训练获得,装置还包括第二模型训练模块7011和第二模型训练模块7012,第二模型训练模块,用于获取历史交互信息和对应的点击记录标签;历史交互信息包括历史用户在源域的样本源域用户特征以及在目标域的样本目标域内容特征;通过待训练的任务导向映射模型,对样本源域用户特征进行特征映射,得到从源域映射至目标域的样本映射用户特征;将样本映射用户特征和样本目标域内容特征输入至预训练的内容推荐模型,进行样本目标域内容的点击预测;根据点击预测的结果和点击记录标签确定任务导向损失值;根据任务导向损失值调整任务导向映射模型的参数并继续训练,直至满足训练停止条件时结束训练。
在一个实施例中,如图9所示,提供了一种基于人工智能的内容处理装置900,该装置可以采用软件模块或硬件模块,或者是二者的结合成为计算机设备的一部分,该装置具体包括:样本获取模块902、特征映射模块904、内容预测模块906和参数调整模块908,其中:
样本获取模块902,用于获取历史交互信息和对应的点击记录标签;历史交互信息包括历史用户在源域的样本源域用户特征以及在目标域的样本目标域内容特征;
特征映射模块904,用于通过待训练的任务导向映射模型,对样本源域用户特征进行特征映射,得到从源域映射至目标域的样本映射用户特征;
内容预测模块906,用于将样本映射用户特征和样本目标域内容特征输入至预训练的内容推荐模型,进行样本目标域内容的点击预测;
参数调整模块908,用于根据点击预测的结果和点击记录标签确定任务导向损失值;根据任务导向损失值调整任务导向映射模型的参数并继续训练,直至满足训练停止条件时结束训练。
在一个实施例中,样本获取模块902还用于获取源域和目标域中共享的历史用户对应的用户标识;根据用户标识分别获取历史用户在源域和目标域中的历史交互信息;从历史交互信息中提取历史用户在源域的样本源域用户特征和在目标域的样本目标域内容特征,以及目标域中的历史交互信息对应的点击记录标签;点击记录标签是目标域的历史交互信息中各样本目标域内容对应的点击记录。
在一个实施例中,特征映射模块904还用于将样本源域用户特征输入至待训练的任务导向映射模型中,通过任务导向映射模型的映射层对样本源域用户特征进行特征矩阵变换;根据特征矩阵变换的结果,输出将样本源域用户特征映射至目标域中的样本映射用户特征。
在一个实施例中,内容预测模块906还用于将样本映射用户特征和样本目标域内容特征输入至预训练的内容推荐模型中,通过内容推荐模型预测历史用户对各样本目标域内容的样本兴趣度;根据样本兴趣度对各样本目标域内容进行点击预测,得到各样本目标域内容对应的点击预测的结果。
在一个实施例中,参数调整模块908还用于根据点击预测的结果与点击记录标签之间的差异,确定任务导向损失值;根据任务导向损失值调整任务导向映射模型的参数,以使任务导向映射模型在迭代训练的过程中,使点击预测的结果与点击记录标签之间的差异减小。
在一个实施例中,如图10所示,提供了另一种基于人工智能的内容处理装置900,内容推荐模型通过第一阶段训练步骤训练获得,任务导向映射模型通过第二阶段训练步骤训练获得,上述内容处理装置900装置还包括第一模型训练模块901,用于获取目标域中的历史交互信息和对应的点击记录标签;历史交互信息包括目标域中的历史用户对应的样本目标域用户特征和样本目标域内容特征;点击记录标签是目标域中的样本目标域内容的点击记录;将样本目标域用户特征和样本目标域内容特征输入至待训练的内容推荐模型,进行样本目标域内容的点击预测;根据点击预测的结果和点击记录标签确定点击预测损失值;根据点击预测损失值调整内容推荐模型的参数并继续训练,直至满足训练停止条件时结束训练。
关于基于人工智能的内容处理装置的具体限定可以参见上文中对于基于人工智能的内容处理装置方法的限定,在此不再赘述。上述基于人工智能的内容处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图11所示。该计算机设备包括通过***总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储源域用户特征、候选内容、待推荐的内容、交互行为信息等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于人工智能的内容处理装置方法。
本领域技术人员可以理解,图11中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (15)

1.一种基于人工智能的内容推荐方法,其特征在于,所述方法包括:
获取目标域的新用户在源域对应的源域用户特征;
通过经过训练的任务导向映射模型,对所述源域用户特征进行特征映射,得到从所述源域映射至所述目标域的映射用户特征;
通过预训练的内容推荐模型,分别根据所述映射用户特征和所述目标域中每个候选内容的目标域内容特征,进行推荐内容的点击预测;
根据点击预测的结果从候选内容中筛选待推荐的内容;
向所述目标域的所述新用户推送所述待推荐的内容。
2.根据权利要求1所述的方法,其特征在于,所述获取目标域的新用户在源域对应的源域用户特征,包括:
根据所述目标域中所述新用户的用户标识,在多个源域中,查找存在与所述用户标识对应的交互行为信息的源域;
从所述源域中获取所述用户标识对应的源域用户特征;所述源域用户特征是基于所述用户标识在所述源域中的交互行为信息进行特征提取获得的。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取第一子应用中的新用户对应的访问请求,所述访问请求包括用户标识;所述第一子应用对应所述目标域;所述第一子应用运行于母应用提供的环境中;
根据所述用户标识,查找运行于所述母应用中的存在与所述用户标识对应的交互行为信息的第二子应用;所述第二子应用对应所述源域;所述第二子应用中包括基于所述用户标识的交互行为信息获得的源域用户特征。
4.根据权利要求1至3任意一项所述的方法,其特征在于,所述内容推荐模型通过第一阶段训练步骤训练获得,所述第一阶段训练步骤包括:
获取所述目标域中的历史交互信息和对应的点击记录标签;所述历史交互信息包括所述目标域中的历史用户对应的样本目标域用户特征和样本目标域内容特征;所述点击记录标签是所述目标域中的样本目标域内容的点击记录;
将所述样本目标域用户特征和所述样本目标域内容特征输入至待训练的内容推荐模型,进行样本目标域内容的点击预测;
根据点击预测的结果和所述点击记录标签确定点击预测损失值;
根据所述点击预测损失值调整所述内容推荐模型的参数并继续训练,直至满足训练停止条件时结束训练。
5.根据权利要求1至3任意一项所述的方法,其特征在于,所述任务导向映射模型通过第二阶段训练步骤训练获得,所述第二阶段训练步骤包括:
获取历史交互信息和对应的点击记录标签;所述历史交互信息包括历史用户在源域的样本源域用户特征以及在目标域的样本目标域内容特征;
通过待训练的任务导向映射模型,对所述样本源域用户特征进行特征映射,得到从所述源域映射至所述目标域的样本映射用户特征;
将所述样本映射用户特征和所述样本目标域内容特征输入至预训练的内容推荐模型,进行样本目标域内容的点击预测;
根据点击预测的结果和所述点击记录标签确定任务导向损失值;
根据所述任务导向损失值调整所述任务导向映射模型的参数并继续训练,直至满足训练停止条件时结束训练。
6.一种基于人工智能的内容处理方法,其特征在于,所述方法包括:
获取历史交互信息和对应的点击记录标签;所述历史交互信息包括历史用户在源域的样本源域用户特征以及在目标域的样本目标域内容特征;
通过待训练的任务导向映射模型,对所述样本源域用户特征进行特征映射,得到从所述源域映射至所述目标域的样本映射用户特征;
将所述样本映射用户特征和所述样本目标域内容特征输入至预训练的内容推荐模型,进行样本目标域内容的点击预测;
根据点击预测的结果和所述点击记录标签确定任务导向损失值;
根据所述任务导向损失值调整所述任务导向映射模型的参数并继续训练,直至满足训练停止条件时结束训练。
7.根据权利要求6所述的方法,其特征在于,所述获取历史交互信息和对应的点击记录标签,包括:
获取所述源域和所述目标域中共享的历史用户对应的用户标识;
根据所述用户标识分别获取所述历史用户在所述源域和所述目标域中的历史交互信息;
从所述历史交互信息中提取所述历史用户在所述源域的样本源域用户特征和在所述目标域的样本目标域内容特征,以及所述目标域中的历史交互信息对应的点击记录标签;所述点击记录标签是所述目标域的历史交互信息中各样本目标域内容对应的点击记录。
8.根据权利要求6所述的方法,其特征在于,所述通过待训练的任务导向映射模型,对所述样本源域用户特征进行特征映射,得到从所述源域映射至所述目标域的样本映射用户特征,包括:
将所述样本源域用户特征输入至待训练的任务导向映射模型中,通过所述任务导向映射模型的映射层对所述样本源域用户特征进行特征矩阵变换;
根据特征矩阵变换的结果,输出将所述样本源域用户特征映射至所述目标域中的样本映射用户特征。
9.根据权利要求6所述的方法,其特征在于,所述将所述样本映射用户特征和所述样本目标域内容特征输入至预训练的内容推荐模型,进行样本目标域内容的点击预测,包括:
将所述样本映射用户特征和所述样本目标域内容特征输入至预训练的内容推荐模型中,通过所述内容推荐模型预测所述历史用户对各样本目标域内容的样本兴趣度;
根据所述样本兴趣度对各所述样本目标域内容进行点击预测,得到各所述样本目标域内容对应的点击预测的结果。
10.根据权利要求6所述的方法,其特征在于,所述根据点击预测的结果和所述点击记录标签确定任务导向损失值,包括:
根据点击预测的结果与所述点击记录标签之间的差异,确定任务导向损失值;
所述根据所述任务导向损失值调整所述任务导向映射模型的参数并继续训练,包括:
根据所述任务导向损失值调整所述任务导向映射模型的参数,以使所述任务导向映射模型在迭代训练的过程中,使所述点击预测的结果与所述点击记录标签之间的差异减小。
11.根据权利要求6至10任意一项所述的方法,其特征在于,所述内容推荐模型通过第一阶段训练步骤训练获得,所述任务导向映射模型通过第二阶段训练步骤训练获得,所述第一阶段训练步骤包括:
获取所述目标域中的历史交互信息和对应的点击记录标签;所述历史交互信息包括所述目标域中的历史用户对应的样本目标域用户特征和样本目标域内容特征;所述点击记录标签是所述目标域中的样本目标域内容的点击记录;
将所述样本目标域用户特征和所述样本目标域内容特征输入至待训练的内容推荐模型,进行样本目标域内容的点击预测;
根据点击预测的结果和所述点击记录标签确定点击预测损失值;
根据所述点击预测损失值调整所述内容推荐模型的参数并继续训练,直至满足训练停止条件时结束训练。
12.一种基于人工智能的内容推荐装置,其特征在于,所述装置包括:
数据获取模块,用于获取目标域的新用户在源域对应的源域用户特征;
特征映射模块,用于通过经过训练的任务导向映射模型,对所述源域用户特征进行特征映射,得到从所述源域映射至所述目标域的映射用户特征;
内容预测模块,用于通过预训练的内容推荐模型,分别根据所述映射用户特征和所述目标域中每个候选内容的目标域内容特征,进行推荐内容的点击预测;
内容推荐模块,用于根据点击预测的结果从候选内容中筛选待推荐的内容;向所述目标域的所述新用户推送所述待推荐的内容。
13.一种基于人工智能的内容处理装置,其特征在于,所述装置包括:
样本获取模块,用于获取历史交互信息和对应的点击记录标签;所述历史交互信息包括历史用户在源域的样本源域用户特征以及在目标域的样本目标域内容特征;
特征映射模块,用于通过待训练的任务导向映射模型,对所述样本源域用户特征进行特征映射,得到从所述源域映射至所述目标域的样本映射用户特征;
内容预测模块,用于将所述样本映射用户特征和所述样本目标域内容特征输入至预训练的内容推荐模型,进行样本目标域内容的点击预测;
参数调整模块,用于根据点击预测的结果和所述点击记录标签确定任务导向损失值;根据所述任务导向损失值调整所述任务导向映射模型的参数并继续训练,直至满足训练停止条件时结束训练。
14.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至11中任一项所述的方法的步骤。
15.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至11中任一项所述的方法的步骤。
CN202011152259.XA 2020-10-26 2020-10-26 基于人工智能的内容推荐方法、装置和计算机设备 Active CN111966914B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011152259.XA CN111966914B (zh) 2020-10-26 2020-10-26 基于人工智能的内容推荐方法、装置和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011152259.XA CN111966914B (zh) 2020-10-26 2020-10-26 基于人工智能的内容推荐方法、装置和计算机设备

Publications (2)

Publication Number Publication Date
CN111966914A true CN111966914A (zh) 2020-11-20
CN111966914B CN111966914B (zh) 2021-01-15

Family

ID=73387222

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011152259.XA Active CN111966914B (zh) 2020-10-26 2020-10-26 基于人工智能的内容推荐方法、装置和计算机设备

Country Status (1)

Country Link
CN (1) CN111966914B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112417293A (zh) * 2020-12-03 2021-02-26 京东数字科技控股股份有限公司 信息推送方法和***、模型训练方法及相关设备
CN112669078A (zh) * 2020-12-30 2021-04-16 上海众源网络有限公司 一种行为预测模型训练方法、装置、设备及存储介质
CN112765470A (zh) * 2021-01-25 2021-05-07 腾讯科技(深圳)有限公司 内容推荐模型的训练方法、内容推荐方法、装置及设备
CN113065066A (zh) * 2021-03-31 2021-07-02 北京达佳互联信息技术有限公司 预测方法、装置、服务器及存储介质
CN113779380A (zh) * 2021-08-12 2021-12-10 阿里巴巴(中国)有限公司 跨域推荐、内容推荐方法、装置及设备
CN114036389A (zh) * 2021-11-17 2022-02-11 北京百度网讯科技有限公司 对象推荐方法、推荐模型的训练方法及装置
CN114239859A (zh) * 2022-02-25 2022-03-25 杭州海康威视数字技术股份有限公司 一种基于迁移学习的时序数据预测方法、装置及存储介质
CN114254193A (zh) * 2021-12-20 2022-03-29 北京达佳互联信息技术有限公司 内容推荐方法、装置、电子设备及存储介质
CN114626434A (zh) * 2022-01-28 2022-06-14 腾讯科技(深圳)有限公司 特征提取模型的训练方法以及对象数据处理方法
CN114647775A (zh) * 2020-12-21 2022-06-21 北京达佳互联信息技术有限公司 信息推送方法、装置及电子设备
CN118070139A (zh) * 2024-04-24 2024-05-24 中国科学技术大学 一种跨领域推荐方法、装置、电子设备及存储介质
WO2024114034A1 (zh) * 2022-11-29 2024-06-06 腾讯科技(深圳)有限公司 内容推荐方法、装置、设备、介质和程序产品

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160179835A1 (en) * 2014-12-17 2016-06-23 Yahoo! Inc. Generating user recommendations
CN106951547A (zh) * 2017-03-27 2017-07-14 西安电子科技大学 一种基于交叉用户的跨域推荐方法
US20190066186A1 (en) * 2017-08-24 2019-02-28 Artivatic Data Labs Private Limited Cross domain recommendation system and method
CN109544306A (zh) * 2018-11-30 2019-03-29 苏州大学 一种基于用户行为序列特征的跨领域推荐方法及装置
CN110232153A (zh) * 2019-05-29 2019-09-13 华南理工大学 一种基于内容的跨领域推荐方法
US20200142935A1 (en) * 2018-11-05 2020-05-07 Samsung Electronics Co., Ltd. System and method for cross-domain recommendations
CN111242310A (zh) * 2020-01-03 2020-06-05 腾讯科技(北京)有限公司 特征有效性评估方法、装置、电子设备及存储介质
CN111538912A (zh) * 2020-07-07 2020-08-14 腾讯科技(深圳)有限公司 内容推荐方法、装置、设备及可读存储介质
CN111723287A (zh) * 2020-06-03 2020-09-29 开普云信息科技股份有限公司 一种基于大规模机器学习的内容和服务推荐方法及其***

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160179835A1 (en) * 2014-12-17 2016-06-23 Yahoo! Inc. Generating user recommendations
CN106951547A (zh) * 2017-03-27 2017-07-14 西安电子科技大学 一种基于交叉用户的跨域推荐方法
US20190066186A1 (en) * 2017-08-24 2019-02-28 Artivatic Data Labs Private Limited Cross domain recommendation system and method
US20200142935A1 (en) * 2018-11-05 2020-05-07 Samsung Electronics Co., Ltd. System and method for cross-domain recommendations
CN109544306A (zh) * 2018-11-30 2019-03-29 苏州大学 一种基于用户行为序列特征的跨领域推荐方法及装置
CN110232153A (zh) * 2019-05-29 2019-09-13 华南理工大学 一种基于内容的跨领域推荐方法
CN111242310A (zh) * 2020-01-03 2020-06-05 腾讯科技(北京)有限公司 特征有效性评估方法、装置、电子设备及存储介质
CN111723287A (zh) * 2020-06-03 2020-09-29 开普云信息科技股份有限公司 一种基于大规模机器学习的内容和服务推荐方法及其***
CN111538912A (zh) * 2020-07-07 2020-08-14 腾讯科技(深圳)有限公司 内容推荐方法、装置、设备及可读存储介质

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022116862A1 (zh) * 2020-12-03 2022-06-09 京东科技控股股份有限公司 信息推送方法和***、模型训练方法及相关设备
CN112417293A (zh) * 2020-12-03 2021-02-26 京东数字科技控股股份有限公司 信息推送方法和***、模型训练方法及相关设备
CN114647775A (zh) * 2020-12-21 2022-06-21 北京达佳互联信息技术有限公司 信息推送方法、装置及电子设备
CN112669078A (zh) * 2020-12-30 2021-04-16 上海众源网络有限公司 一种行为预测模型训练方法、装置、设备及存储介质
CN112765470A (zh) * 2021-01-25 2021-05-07 腾讯科技(深圳)有限公司 内容推荐模型的训练方法、内容推荐方法、装置及设备
CN113065066A (zh) * 2021-03-31 2021-07-02 北京达佳互联信息技术有限公司 预测方法、装置、服务器及存储介质
CN113065066B (zh) * 2021-03-31 2024-05-07 北京达佳互联信息技术有限公司 预测方法、装置、服务器及存储介质
CN113779380A (zh) * 2021-08-12 2021-12-10 阿里巴巴(中国)有限公司 跨域推荐、内容推荐方法、装置及设备
CN113779380B (zh) * 2021-08-12 2023-11-21 阿里巴巴(中国)有限公司 跨域推荐、内容推荐方法、装置及设备
CN114036389B (zh) * 2021-11-17 2023-05-05 北京百度网讯科技有限公司 对象推荐方法、推荐模型的训练方法及装置
CN114036389A (zh) * 2021-11-17 2022-02-11 北京百度网讯科技有限公司 对象推荐方法、推荐模型的训练方法及装置
CN114254193A (zh) * 2021-12-20 2022-03-29 北京达佳互联信息技术有限公司 内容推荐方法、装置、电子设备及存储介质
CN114626434A (zh) * 2022-01-28 2022-06-14 腾讯科技(深圳)有限公司 特征提取模型的训练方法以及对象数据处理方法
CN114239859A (zh) * 2022-02-25 2022-03-25 杭州海康威视数字技术股份有限公司 一种基于迁移学习的时序数据预测方法、装置及存储介质
WO2024114034A1 (zh) * 2022-11-29 2024-06-06 腾讯科技(深圳)有限公司 内容推荐方法、装置、设备、介质和程序产品
CN118070139A (zh) * 2024-04-24 2024-05-24 中国科学技术大学 一种跨领域推荐方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN111966914B (zh) 2021-01-15

Similar Documents

Publication Publication Date Title
CN111966914B (zh) 基于人工智能的内容推荐方法、装置和计算机设备
CN111444428B (zh) 基于人工智能的信息推荐方法、装置、电子设备及存储介质
CN111538912B (zh) 内容推荐方法、装置、设备及可读存储介质
CN111460130B (zh) 信息推荐方法、装置、设备和可读存储介质
WO2022016522A1 (zh) 推荐模型的训练方法、推荐方法、装置及计算机可读介质
CN111680217A (zh) 内容推荐方法、装置、设备及存储介质
CN109471978B (zh) 一种电子资源推荐方法及装置
WO2021155691A1 (zh) 用户画像生成方法、装置、存储介质及设备
CN111382283A (zh) 资源类别标签标注方法、装置、计算机设备和存储介质
CN111831924A (zh) 内容推荐方法、装置、设备及可读存储介质
CN111429161B (zh) 特征提取方法、特征提取装置、存储介质及电子设备
CN112199600A (zh) 目标对象识别方法和装置
CN113515690A (zh) 内容召回模型的训练方法、内容召回方法、装置及设备
CN116452263A (zh) 一种信息推荐方法、装置、设备及存储介质、程序产品
CN113657087A (zh) 信息的匹配方法及装置
CN115618024A (zh) 多媒体推荐方法、装置及电子设备
CN116955591A (zh) 用于内容推荐的推荐语生成方法、相关装置和介质
CN114817692A (zh) 确定推荐对象的方法、装置和设备及计算机存储介质
CN114358807A (zh) 基于可预测用户特征属性的用户画像方法及***
CN111897943A (zh) 会话记录搜索方法、装置、电子设备及存储介质
CN116484085A (zh) 一种信息投放方法、装置、设备及存储介质、程序产品
CN113094584A (zh) 推荐学习资源的确定方法和装置
CN111860870A (zh) 交互行为确定模型的训练方法、装置、设备及介质
CN116628236B (zh) 多媒体信息的投放方法、装置、电子设备及存储介质
CN117786234B (zh) 一种基于两阶段对比学习的多模态资源推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant