CN111241394A

CN111241394A - 数据处理方法、装置、计算机可读存储介质及电子设备

Info

Publication number: CN111241394A
Application number: CN202010014261.4A
Authority: CN
Inventors: 丘志杰; 谢若冰; 刘毅; 饶君; 张博
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2020-01-07
Filing date: 2020-01-07
Publication date: 2020-06-05
Anticipated expiration: 2040-01-07
Also published as: WO2021139415A1; US20220171760A1; CN111241394B

Abstract

本公开提供了一种数据处理方法、装置、计算机可读存储介质及电子设备。该方法包括：根据第一业务行为特征生成第一业务嵌入向量，根据第二业务行为特征生成第二业务嵌入向量，并根据业务场景特征生成场景表征向量；根据场景表征向量、第一业务嵌入向量和第二业务嵌入向量，获得第一业务嵌入向量的第一权重和第二业务嵌入向量的第二权重；根据第一业务嵌入向量及其第一权重生成第一业务特征向量，并根据第二业务嵌入向量及其第二权重，生成第二业务特征向量；根据第一业务特征向量和第二业务特征向量，获得对象嵌入向量；获取第一业务候选项目；根据对象嵌入向量，从第一业务候选项目中确定第一业务目标项目。

Description

数据处理方法、装置、计算机可读存储介质及电子设备

技术领域

本公开涉及计算机技术领域，具体而言，涉及一种数据处理方法、装置、计算机可读存储介质及电子设备。

背景技术

在一些应用平台中，可能同时存在多个不同的业务推荐场景，用户在平台上消费多样的内容，同一个用户往往会对这个平台上的不同的业务具有不同的消费行为，但是，相关技术中的推荐***在召回阶段并不能同时考虑这些不同业务之间的相互影响，也未考虑用户所处的业务场景对不同业务的影响，使得召回的项目不够准确，从而影响了最终的推荐结果的精准度。

需要说明的是，在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

本公开实施例的目的在于提供一种数据处理方法、装置、计算机可读存储介质及电子设备，进而至少在一定程度上克服相关技术中存在的多业务场景中，召回的项目不够准确的问题。

本公开的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本公开的实践而习得。

根据本公开实施例的一方面，提供了一种数据处理方法，包括：获取对象的第一业务行为特征、第二业务行为特征以及业务场景特征；根据所述第一业务行为特征生成第一业务嵌入向量，根据所述第二业务行为特征生成第二业务嵌入向量，并根据所述业务场景特征生成场景表征向量；根据所述场景表征向量、所述第一业务嵌入向量和所述第二业务嵌入向量，获得所述第一业务嵌入向量的第一权重和所述第二业务嵌入向量的第二权重；根据所述第一业务嵌入向量及其第一权重生成第一业务特征向量，并根据所述第二业务嵌入向量及其第二权重，生成第二业务特征向量；根据所述第一业务特征向量和所述第二业务特征向量，获得对象嵌入向量；获取第一业务候选项目；根据所述对象嵌入向量，从所述第一业务候选项目中确定第一业务目标项目。

根据本公开实施例的一方面，提供了一种数据处理装置，包括：特征信息获取单元，用于获取对象的第一业务行为特征、第二业务行为特征以及业务场景特征；行为场景获取单元，用于根据所述第一业务行为特征生成第一业务嵌入向量，根据所述第二业务行为特征生成第二业务嵌入向量，并根据所述业务场景特征生成场景表征向量；业务权重获得单元，用于根据所述场景表征向量、所述第一业务嵌入向量和所述第二业务嵌入向量，获得所述第一业务嵌入向量的第一权重和所述第二业务嵌入向量的第二权重；业务权重调整单元，用于根据所述第一业务嵌入向量及其第一权重生成第一业务特征向量，并根据所述第二业务嵌入向量及其第二权重，生成第二业务特征向量；对象向量获得单元，用于根据所述第一业务特征向量和所述第二业务特征向量，获得对象嵌入向量；候选信息获取单元，用于获取第一业务候选项目；目标项目确定单元，用于根据所述对象嵌入向量，从所述第一业务候选项目中确定第一业务目标项目。

根据本公开实施例的一方面，提供了一种计算机可读存储介质，其上存储有计算机程序，所述程序被处理器执行时实现如上述实施例中所述的数据处理方法。

根据本公开实施例的一方面，提供了一种电子设备，包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如上述实施例中所述的数据处理方法。

在本公开的一些实施例所提供的技术方案中，一方面，通过根据第一业务行为特征生成第一业务嵌入向量，根据第二业务行为特征生成第二业务嵌入向量，并根据业务场景特征生成场景表征向量，且根据场景表征向量、第一业务嵌入向量和第二业务嵌入向量，获得第一业务嵌入向量的第一权重和第二业务嵌入向量的第二权重，从而可以根据第一业务嵌入向量及其第一权重生成第一业务特征向量，并根据第二业务嵌入向量及其第二权重，生成第二业务特征向量，即可以针对对象当前所处的业务场景调整不同业务的行为特征的重要程度；另一方面，同时根据第一业务特征向量和第二业务特征向量获得对象嵌入向量，可以有效的融合多种业务信息，从而可以有效利用相关业务辅助当前待推荐的业务的项目召回。由此，综合考虑了对象当前所处的业务场景以及其他业务对当前待推荐的业务的辅助信息，可以提高召回的项目的准确性，最终有助于改善个性化推荐结果的精准性。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。在附图中：

图1示出了可以应用本公开实施例的数据处理方法或数据处理装置的示例性***架构的示意图；

图2示出了适于用来实现本公开实施例的电子设备的计算机***的结构示意图；

图3示意性示出了根据本公开的一实施例的数据处理方法的流程图；

图4示出了图3中所示的步骤S320在一实施例中的处理过程示意图；

图5示出了图3中所示的步骤S350在一实施例中的处理过程示意图；

图6示出了图5中所示的步骤S355在一实施例中的处理过程示意图；

图7示出了图3中所示的步骤S350在另一实施例中的处理过程示意图；

图8示意性示出了根据本公开的一实施例的组注意力机制的示意图；

图9示意性示出了根据本公开的另一实施例的数据处理方法的流程图；

图10示出了图3中所示的步骤S350在又一实施例中的处理过程示意图；

图11示意性示出了根据本公开的一实施例的不同业务场景下不同的业务特征的权重的热力图；

图12示意性示出了根据本公开的一实施例的特征域内部交互特征的热力图；

图13示出了图3中所示的步骤S370在一实施例中的处理过程示意图；

图14示意性示出了根据本公开的一实施例的召回框架的网络结构示意图；

图15示意性示出了根据本公开的又一实施例的数据处理方法的流程图；

图16示意性示出了根据本公开的一实施例的召回模型应用在推荐***中的示意图；

图17示意性示出了根据本公开的一个实施例的数据处理装置的框图。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而，示例实施方式能够以多种形式实施，且不应被理解为限于在此阐述的范例；相反，提供这些实施方式使得本公开将更加全面和完整，并将示例实施方式的构思全面地传达给本领域的技术人员。

此外，所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中，提供许多具体细节从而给出对本公开的实施例的充分理解。然而，本领域技术人员将意识到，可以实践本公开的技术方案而没有特定细节中的一个或更多，或者可以采用其它的方法、组元、装置、步骤等。在其它情况下，不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。

附图中所示的方框图仅仅是功能实体，不一定必须与物理上独立的实体相对应。即，可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

附图中所示的流程图仅是示例性说明，不是必须包括所有的内容和操作/步骤，也不是必须按所描述的顺序执行。例如，有的操作/步骤还可以分解，而有的操作/步骤可以合并或部分合并，因此实际执行的顺序有可能根据实际情况改变。

图1示出了可以应用本公开实施例的数据处理方法或数据处理装置的示例性***架构100的示意图。

如图1所示，***架构100可以包括终端设备101、102、103中的一种或多种，网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。比如服务器105可以是多个服务器组成的服务器集群、云端服务器等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互，以接收或发送消息等。终端设备101、102、103可以是具有显示屏的各种电子设备，包括但不限于智能手机、平板电脑、便携式计算机、可穿戴智能设备、智能家居设备和台式计算机等等。

服务器105可以是提供各种服务的服务器。例如服务器105可以基于用户在终端设备103(也可以是终端设备101或102)上对第一业务和第二业务的行为，获取用户的第一业务行为特征和第二业务行为特征，并获取用户当前所处的业务场景特征。服务器105可以基于第一业务行为特征生成第一业务嵌入向量，根据第二业务行为特征生成第二业务嵌入向量，并根据业务场景特征生成场景表征向量；根据场景表征向量、第一业务嵌入向量和第二业务嵌入向量，获得第一业务嵌入向量的第一权重和第二业务嵌入向量的第二权重；根据第一业务嵌入向量及其第一权重生成第一业务特征向量，并根据第二业务嵌入向量及其第二权重，生成第二业务特征向量；根据第一业务特征向量和第二业务特征向量，获得对象嵌入向量；获取第一业务候选项目；根据对象嵌入向量，从第一业务候选项目中确定第一业务目标项目。服务器105可以进一步对第一业务目标项目进行筛选和排序，并将最终筛选出来的第一业务目标项目以排序后的顺序反馈给终端设备103，进而用户可以基于终端设备103上显示的内容获得其个性化推荐结果。

图2示出了适于用来实现本公开实施例的电子设备的计算机***的结构示意图。

需要说明的是，图2示出的电子设备的计算机***200仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。

如图2所示，计算机***200包括中央处理单元(CPU)201，其可以根据存储在只读存储器(ROM)202中的程序或者从存储部分208加载到随机访问存储器(RAM)203中的程序而执行各种适当的动作和处理。在RAM 203中，还存储有***操作所需的各种程序和数据。CPU201、ROM 202以及RAM 203通过总线204彼此相连。输入/输出(I/O)接口205也连接至总线204。

以下部件连接至I/O接口205：包括键盘、鼠标等的输入部分206；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分207；包括硬盘等的存储部分208；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分209。通信部分209经由诸如因特网的网络执行通信处理。驱动器210也根据需要连接至I/O接口205。可拆卸介质211，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器210上，以便于从其上读出的计算机程序根据需要被安装入存储部分208。

特别地，根据本公开的实施例，下文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读存储介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分209从网络上被下载和安装，和/或从可拆卸介质211被安装。在该计算机程序被中央处理单元(CPU)201执行时，执行本申请的***中限定的各种功能。

需要说明的是，本公开所示的计算机可读存储介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本公开中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读存储介质，该计算机可读存储介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读存储介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、RF等等，或者上述的任意合适的组合。

附图中的流程图和框图，图示了按照本公开各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的***来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本公开实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现，所描述的单元也可以设置在处理器中。其中，这些单元的名称在某种情况下并不构成对该单元本身的限定。

作为另一方面，本申请还提供了一种计算机可读存储介质，该计算机可读存储介质可以是上述实施例中描述的电子设备中所包含的；也可以是单独存在，而未装配入该电子设备中。上述计算机可读存储介质承载有一个或者多个程序，当上述一个或者多个程序被一个该电子设备执行时，使得该电子设备实现如下述实施例中所述的方法。例如，所述的电子设备可以实现如图3或图4或图5或图6或图7或图9或图10或图11或图13所示的各个步骤。

人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互***、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

机器学习(Machine Learning，ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。

随着人工智能技术研究和进步，人工智能技术在多个领域展开研究和应用，例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等，相信随着技术的发展，人工智能技术将在更多的领域得到应用，并发挥越来越重要的价值。

本申请实施例提供的方案涉及人工智能的机器学习等技术，具体通过如下实施例进行说明：

首先对本公开实施例中涉及的一些术语进行解释说明。

短视频：是指在各种媒体平台上播放的、适合在移动状态和短时休闲状态下观看的、高频推送的视频内容，播放时长通常在几秒到几分钟不等。

小视频：通常比短视频的播放时长更短，生产方式更便利。一般小视频的播放时长在十几秒到1分钟左右。

关键词(Tag)：是一种关键词标记，可以用于表达业务的主题内容。例如，对于文章而言，可以从文章的正文和/或标题等中抽取表示该文章的核心内容的一个/组词，如一篇介绍国内手机性能比较的文章，其关键词可以为“手机”、“国内”、“性能”等。再例如，对于视频而言，可以从视频的名称和/或剧情介绍等中提取能够表达该视频的关键内容的一个/组词，如一个根据聊斋志异拍摄的故事，其关键词可以为“聊斋”、“画皮”等。

类目(Category，以下简写为Cate)：是对业务的一个抽象描述，将同一业务中多个描述相似内容的项目映射到同一个类目。例如，对于文章而言，可以将多篇描述相似内容的文章归类到同一个类目下，如搞笑类、体育类、新闻类、财经类等。再例如，对于视频而言，可以将多个讲述类似内容的视频归类到同一个类目下，如武侠类、娱乐类、综艺类、资讯类等。

项目(item)：是指业务中的一个消费(例如，阅读，观看等)单元，在不同的业务场景中，项目的具体含义不同。例如，对于文章业务而言，一个项目就是一篇文章。再例如，对于视频业务而言，一个视频就是一个项目。再例如，对于短视频业务而言，一个短视频就是一个项目。再例如，对于小视频而言，一个小视频就是一个项目。

Encoding(编码)：将输入的数据编码成一个向量。

Decoding：结合编码生成的向量预测可能的输出项目，在本公开实施例中为通过用户的行为编码向量(即对象嵌入向量)预测下一个项目。

Cosine相似度：余弦相似度，又称为余弦相似性，是通过计算两个向量的夹角余弦值来评估他们的相似度。余弦相似度将向量根据坐标值，绘制到向量空间中，如最常见的二维空间。

Self-Attention：自注意力机制，计算相关性的数据为同源数据。

Attention：注意力机制，通过与多个数据进行相关性计算，得到相关性分布的差异，从而可以对更重要的部分给予更多的关注。

冷启动：在互联网环境当中，冷启动一般指的是在数据分析领域，起初的时候没有大量的数据积累，所以在前期需要积累数据之后才能进行进一步的挖掘分析，而前期的这一个阶段，一般就称之为冷启动。本公开实施例中是指新业务在前期时没有大量的用户消费行为，无法基于新业务的用户消费行为进行新业务的推荐，这个阶段称之为新业务的冷启动。

召回：是指从大量例如上百万、千万的item中，筛选出较少的例如几百上千的item，以供后续的rank(排序)模型进行排序。

在个性化推荐场景中，可能同时存在很多不同的业务推荐场景，例如包括且不止文章推荐、视频(这里的视频是相对短视频和小视频而言的，在下面的实施例中也可以称之为长视频)推荐、短视频推荐、小视频推荐等。用户使用应用程序(application，APP)例如某一款即时通讯APP去消费多样的内容，同一个用户往往有不同的业务消费行为。

相关技术中，针对上述场景，提供的推荐方法是使用单业务信息进行单业务的推荐，即只使用了本业务内部的行为特征，例如需要给用户推荐文章时，仅使用该用户的历史文章阅读行为信息训练一个预测模型用于完成文章推荐；需要给用户推荐长视频时，仅使用该用户的历史长视频观看行为信息训练另一个预测模型用于完成长视频推荐；需要给用户推荐小视频时，仅使用该用户的历史小视频观看行为信息训练又一个预测模型用于完成小视频推荐。

采用上述相关技术中的方案，至少存在以下两个问题：

第一，在***面临着多种业务的个性化推荐问题时，需要针对不同的业务分别开发各自的独立的模型，线上需要同时运行和维护多个模型，耗费较多的运算资源，占据较大的存储空间，且调用和管理较为复杂。

第二，实际情况中，还会面临着随时可能会有新的业务场景融入到信息流中，这就面临着新业务的冷启动推荐问题。例如，这里假设小视频是一个新业务，由于其积累的用户的历史小视频观看行为信息较少，用于训练其对应的预测模型的样本数据较少，从而导致训练获得的模型的预测准确度较低，很难提供比较好的个性化推荐。

基于上述问题，在本公开的一个实施例中提出了一种数据处理方法，以对上述问题进行优化处理。具体参照图3所示，该数据处理方法适用于前述实施例中所述的电子设备，并可以包括步骤S310至步骤S370：

在步骤S310中，获取对象的第一业务行为特征、第二业务行为特征以及业务场景特征。

本公开实施例中，均以对象为用户为例进行举例说明，但本公开并不限定于此，在不同的场景中，对象可以具有不同的含义。第一业务和第二业务可以是文章、视频、短视频和小视频等中的任意一种，且这里假设文章、视频和短视频是平台中比较成熟的业务，小视频是新业务，在下面的实施例中，均以第一业务为文章，第二业务为视频为例进行举例说明，但本公开的保护范围并不限定于此。

用户通过平台，可以阅读文章和观看视频，从用户的阅读历史和观看历史中，可以提取出用户的第一业务行为特征和第二业务行为特征，例如第一业务行为特征可以包括用户的历史阅读过的文章阅读序列、历史阅读过的文章的tag和category信息等，第二业务行为特征可以包括用户的历史观看过的视频的视频播放序列、历史观看过的视频的tag和category信息等。

在示例性实施例中，业务场景特征可以包括业务类型(BusinessType)、网络类型(NetType)和频道标识(ChannelID)。

业务类型例如可以为文章、视频、短视频、小视频等中的任意一种，例如当BusinessType为“文章”时，说明当前要预测的是用户下一步可能感兴趣的文章是什么，当BusinessType为“小视频”时，说明当前要预测的是用户下一步可能感兴趣的小视频是什么。

网络类型例如可以为是否wifi环境下，不同的网络类型也会影响到推荐给用户的item，例如若用户当前处于wifi环境下，则可以给用户推荐播放时长长一些的视频，这样不会造成视频播放时卡顿，也不会浪费用户的流量；若用户当前处于非wifi环境下，则可以给用户推荐播放时长短一些的小视频，给用户流畅的播放体验。

频道标识和业务类型均是与业务场景相关的特征，频道标识这个特征是比业务类型更加细化的用于描述场景信息的特征，用于表达当前用户所处的信息展示页面，某个业务会至少在某个ChannelID下出现。

例如，可以预先设置信息流的主页面的ChannelID为“1”，主页面上可以同时包括视频、短视频、小视频和文章，当用户当前处于主页面时，下一步可以向用户推荐视频、短视频、小视频和文章中的任意一种；当用户滑动主页面时，对某个视频感兴趣时，其可以点击该视频进入视频流页面，假设预先设置了视频流页面的ChannelID为“2”，表示当前用户处于全部是视频的页面，下一步可以向用户推荐视频；短视频流页面的ChannelID为“3”，表示当前用户处于全部是短视频的页面，下一步可以向用户推荐短视频；小视频流页面的ChannelID为“4”，表示当前用户处于全部是小视频的页面，下一步可以向用户推荐小视频。

再例如，可以预先根据信息流的内容和格式的不同，设定视频频道、小说频道、图片频道、热点频道、科技频道、娱乐频道、体育频道、游戏频道、动漫频道、旅游频道、财经频道、汽车频道、时尚频道等，并对这些频道分别设定不同的ChannelID，用户可以切换至所选择的频道，在相应的频道中查看相应的信息流，此时可以通过ChannelID获知用户当前具体所处的频道，从而给用户推荐相应频道的item，以达到更精准的个性化推荐。

可以理解的是，当业务不同时，业务行为特征和业务场景特征可以发生相应的改变，并不限于上述举例说明。

在步骤S320中，根据所述第一业务行为特征生成第一业务嵌入向量，根据所述第二业务行为特征生成第二业务嵌入向量，并根据所述业务场景特征生成场景表征向量。

具体如何生成第一业务嵌入向量和第二业务嵌入向量可以参照下述图4的实施例。

在示例性实施例中，根据所述业务场景特征生成场景表征向量，可以包括：分别将所述业务类型、所述网络类型和所述频道标识中的特征值向量化，获得所述业务类型的特征值向量、所述网络类型的特征值向量和所述频道标识的特征值向量；根据所述业务类型的特征值向量、所述网络类型的特征值向量和所述频道标识的特征值向量，生成所述场景表征向量。

例如，假设业务类型为“文章”、网络类型为“wifi”和频道标识为“1”，可以将其分别映射为一个相同维数的嵌入向量，假设均用一个4(并不限定于此)维的向量来表示，然后，将这3个4维向量(a1，a2，a3，a4)、(b1，b2，b3，b4)和(c1，c2，c3，c4)进行聚合(Aggregate)，生成一个新的4维向量(d1，d2，d3，d4)作为场景表征向量。这里的聚合可以是对这3个4维向量进行平均池化(average-pooling)或者最大池化(max-pooling)等操作。以平均池化为例，相当于对这3个4维向量进行向量求平均运算，即d1＝(a1+b1+c1)/3，d2＝(a2+b2+c2)/3，d3＝(a3+b3+c3)/3，d4＝(a4+b4+c4)/3。平均池化在减少参数、节约计算资源的同时，更有利信息的完整传递，可以控制过拟合以及提高模型性能。

在步骤S330中，根据所述场景表征向量、所述第一业务嵌入向量和所述第二业务嵌入向量，获得所述第一业务嵌入向量的第一权重和所述第二业务嵌入向量的第二权重。

本公开实施例中，可以使用场景表征向量来调整不同的业务的特征的权重信息。

例如，可以通过以下公式获得第一业务嵌入向量的第一权重α₁：

其中，A表示场景表征向量，f₁表示第一业务嵌入向量，f₂表示第二业务嵌入向量。T表示矩阵的转置。

类似的，可以通过以下公式获得第二业务嵌入向量的第二权重α₂：

在步骤S340中，根据所述第一业务嵌入向量及其第一权重生成第一业务特征向量，并根据所述第二业务嵌入向量及其第二权重，生成第二业务特征向量。

例如，可以通过以下公式获得第一业务特征向量g₁：

g₁＝α₁×f₁ (3)

例如，可以通过以下公式获得第二业务特征向量g₂：

g₂＝α₂×f₂ (4)

在步骤S350中，根据所述第一业务特征向量和所述第二业务特征向量，获得对象嵌入向量。

本公开实施例中，不同的业务的特征可以使用Self-Attention方式自动学习不同的特征之间的相互联系即关联性，生成对象嵌入向量，例如用户观看过的短视频的tag和小视频的tag之间的相互影响等。这样，一方面，在不同的业务场景学习不同的业务的特征的权重信息，可以侧重与用户当前所处的业务场景相匹配的业务，提高召回的数据的准确性。另一方面，使用特征之间的Self-Attention有效的学习不同的业务的特征之间的关联性，这样可以有效的利用不同的业务信息辅助当前待推荐的单业务的个性化推荐，进一步提高召回的item的精准度。此外，若当前待推荐的业务是新业务例如小视频，则可以利用成熟的其他业务信息辅助新业务的个性化推荐，从而有利于新业务的冷启动。

在步骤S360中，获取第一业务候选项目。

例如，假设第一业务是文章，则可以实现设定一些规则(例如排版布局是否美观等)，提取一些优质文章放入到文章候选池中。当BusinessType为“文章”时，将文章候选池中的文章作为候选item。

在步骤S370中，根据所述对象嵌入向量，从所述第一业务候选项目中确定第一业务目标项目。

具体确定第一业务目标项目的过程可以参考图11的描述。

本公开实施方式提供的数据处理方法，一方面，通过根据第一业务行为特征生成第一业务嵌入向量，根据第二业务行为特征生成第二业务嵌入向量，并根据业务场景特征生成场景表征向量，且根据场景表征向量、第一业务嵌入向量和第二业务嵌入向量，获得第一业务嵌入向量的第一权重和第二业务嵌入向量的第二权重，从而可以根据第一业务嵌入向量及其第一权重生成第一业务特征向量，并根据第二业务嵌入向量及其第二权重，生成第二业务特征向量，即可以针对对象当前所处的业务场景调整不同业务的行为特征的重要程度；另一方面，同时根据第一业务特征向量和第二业务特征向量获得对象嵌入向量，可以有效的融合多种业务信息，从而可以有效利用相关业务辅助当前待推荐的业务的项目召回。由此，综合考虑了对象当前所处的业务场景以及其他业务对当前待推荐的业务的辅助信息，可以提高召回的项目的准确性，最终有助于改善个性化推荐结果的精准性。

图4示出了图3中所示的步骤S320在一实施例中的处理过程示意图。

如图4所示，本公开实施例中，上述步骤S320可以进一步包括以下步骤。

在步骤S321中，将所述第一业务行为特征中的特征值向量化，获得所述第一业务行为特征中的特征值向量。

例如，可以将第一业务行为特征中的每个特征值(一个特征值是一个元素)进行向量化，这里假设将每个特征值用一个4维向量进行表示，则获得第一业务行为特征的每个特征值向量。

在步骤S322中，根据所述第一业务行为特征中的特征值向量，生成第一业务表征向量。

本公开实施例中，可以对第一业务行为特征中的全部特征值向量进行聚合。例如，对第一业务行为特征中的全部特征值向量进行一次平均池化操作，求取全部特征值向量的平均向量作为第一业务表征向量x₁。

在步骤S323中，将所述第一业务表征向量进行空间映射，生成所述第一业务嵌入向量。

例如，可以通过以下公式获得第一业务嵌入向量f₁：

f₁＝x₁W₁+b₁ (5)

上述公式中，W₁为第一空间矩阵，b₁为第一偏置矩阵，均可以在模型训练阶段确定。

在其他实施例中，上述步骤S320可以进一步包括：将第二业务行为特征中的特征值向量化，获得第二业务行为特征中的特征值向量；根据所述第二业务行为特征中的特征值向量，生成第二业务表征向量；将第二业务表征向量进行空间映射，生成第二业务嵌入向量。

例如，可以将第二业务行为特征中的每个特征值进行向量化，这里假设将每个特征值用一个4维向量进行表示，则获得第二业务行为特征的每个特征值向量。可以对第二业务行为特征中的全部特征值向量进行聚合。例如，对第二业务行为特征中的全部特征值向量进行一次平均池化操作，求取全部特征值向量的平均向量作为第二业务表征向量x₂。

例如，可以通过以下公式获得第二业务嵌入向量f₂：

f₂＝x₂W+b (6)

本公开实施例，通过对业务中的多个特征值向量进行平均池化操作，在减少参数、降低计算量的同时，更有利信息的完整传递，可以控制过拟合以及提高模型性能。

图5示出了图3中所示的步骤S350在一实施例中的处理过程示意图。

如图5所示，本公开实施例中，上述步骤S350可以进一步包括以下步骤。

在步骤S351中，根据所述第一业务特征向量g₁和所述第二业务特征向量g₂生成第一矩阵K和第二矩阵V。

例如，可以通过以下公式获得第一矩阵K：

K＝＜g₁,g₂＞W₂+b₂ (7)

上述公式中，W₂为第二空间矩阵，b₂为第二偏置矩阵，均可以在模型训练阶段确定。

例如，可以通过以下公式获得第二矩阵V：

V＝＜g₁,g₂＞W₃+b₃ (8)

上述公式中，W₃为第三空间矩阵，b₃为第三偏置矩阵，均可以在模型训练阶段确定。

在步骤S352中，根据所述第一业务特征向量生成第三矩阵Q₁。

例如，可以通过以下公式获得第三矩阵Q₁：

Q₁＝g₁W₄+b₄ (9)

上述公式中，W₄为第四空间矩阵，b₄为第四偏置矩阵，均可以在模型训练阶段确定。

在步骤S353中，根据所述第一矩阵获得n个第一子矩阵，根据所述第二矩阵获得n个第二子矩阵，并根据所述第三矩阵获得n个第三子矩阵，n为大于1的正整数。

例如，以n＝8为例，假设第一矩阵K、第二矩阵V和第三矩阵Q₁均是9*64维的矩阵，则可以将第一矩阵K拆分成8个9*8维的第一子矩阵，将第二矩阵V拆分成8个9*8维的第二子矩阵，将第三矩阵Q₁拆分成8个9*8维的第三子矩阵。n的取值可以根据实际情况进行设定，并不限于这里的举例说明。

在步骤S354中，根据n个所述第一子矩阵、n个所述第二子矩阵和n个所述第三子矩阵，生成n个第一头矩阵。

若是基于Self-Attention对第一业务特征向量g₁和第二业务特征向量g₂进行建模，则可以根据以下公式对这两个特征进行重新编码：

其中，softmax是激活函数。假设Q₁是一个k*d_k维的矩阵，K是一个d_k*m维的矩阵，V是一个m*d_v维的矩阵，k、d_k、m、d_v均为大于或等于1的正整数，若忽略softmax的影响，则这是一个attention层，将k*d_k的序列Q₁编码成了一个新的k*d_v的序列。

起到调节作用，使得内积不至于太大，太大的话softmax后得到的结果就是非0即1了。

本公开实施例中，使用多头(multi-head)自注意力机制，每一个头可以表示为：

上述公式中，i为大于或等于1且小于或等于n的正整数。head_1i表示第i个第一头矩阵，Q_1i表示第i个第一子矩阵，K_i表示第i个第二子矩阵，V_i表示第i个第三子矩阵。W_i5为第i个第五空间矩阵，可以在模型训练阶段确定。

在步骤S355中，根据n个所述第一头矩阵生成第一业务特征组向量。

第一业务特征组向量的生成过程可以参照图6实施例。如图6所示，本公开实施例中，上述步骤S355可以进一步包括以下步骤。

在步骤S3551中，拼接n个所述第一头矩阵。

在步骤S3552中，根据拼接后的n个所述第一头矩阵和映射矩阵，生成所述第一业务特征组向量。

例如，可以使用以下公式计算第一业务特征组向量group₁：

group₁＝[head₁₁,head₁₂,head₁₃,...,head_1n]W^o (12)

上述公式中，W^o表示映射矩阵。

图7示出了图3中所示的步骤S350在另一实施例中的处理过程示意图。

如图7所示，本公开实施例中，上述步骤S350可以进一步包括以下步骤。

在步骤S356中，根据所述第二业务特征向量生成第四矩阵。

例如，可以通过以下公式获得第四矩阵Q₂：

Q₂＝g₂W₆+b₆ (13)

上述公式中，W₆为第六空间矩阵，b₆为第六偏置矩阵，均可以在模型训练阶段确定。

在步骤S357中，根据所述第四矩阵获得n个第四子矩阵。

例如，以n＝8为例，假设第四矩阵Q₂均是9*64维的矩阵，则可以第四矩阵Q₂拆分成8个9*8维的第四子矩阵。

在步骤S358中，根据n个所述第一子矩阵、n个所述第二子矩阵和n个所述第四子矩阵，生成n个第二头矩阵。

其中，假设Q₂是一个k*d_k维的矩阵。

上述公式中，head_2i表示第i个第二头矩阵，Q_2i表示第i个第四子矩阵。W_i7为第i个第七空间矩阵，可以在模型训练阶段确定。

在步骤S359中，根据n个所述第二头矩阵生成第二业务特征组向量。

例如，可以使用以下公式计算第二业务特征组向量group₂：

group₂＝[head₂₁,head₂₂,head₂₃,...,head_2n]W^o (16)

图8示意性示出了根据本公开的一实施例的组注意力机制的示意图。

如图8所示，组(group)是指将用户的行为特征划分为了不同的特征组，例如上述举例说明中的m＝2，组E1对应的是第一业务特征向量g₁，组E2对应的是第二业务特征向量g₂，经过多头尺度点乘(multi-head Scale Dot-Product)自注意力层后，生成组1和组2，即第一业务特征组向量group₁和第二业务特征组向量group₂。

本公开实施例中，经过上述自注意力层后，每个group的业务特征组向量融入了全局的所有group的信息。

图9示意性示出了根据本公开的另一实施例的数据处理方法的流程图。

如图9所示，与上述实施例的不同之处在于，本公开实施例提供的方法还可以进一步包括以下步骤。

在步骤S910中，获取所述对象的基础属性特征和社交特征。

用户的基础属性特征例如可以包括性别、年龄、当前所处的位置等，社交特征例如可以包括用户的好友信息、用户发布的动态信息、用户与其好友的互动信息等。

在步骤S920中，根据所述基础属性特征生成基础属性向量。

例如，以用户的性别、年龄、当前所处的位置为例，首先将这3个特征用相同维度例如4维向量表示，对这3个4维向量进行平均池化操作，即进行向量求平均，获得一个新的4维向量作为用户的基础属性向量。

在步骤S930中，根据所述社交特征生成社交嵌入向量。

根据用户的社交特征可以构建该用户的社交关系图或者社交网络(socialnetwork)，社交关系图中的一个节点代表一个用户，将具有社交关系例如好友关系、同事关系、亲人关系等的两个用户进行连线，将社交关系图输入至图嵌入模型例如Node2vec(nodeto vector，节点至向量)、DeepWalk和LINE(large-scale information Network，大规模信息网络)等中，图嵌入模型可以自动输出该用户的社交嵌入向量。

图10示出了图3中所示的步骤S350在又一实施例中的处理过程示意图。

如图10所示，本公开实施例中，上述步骤S350可以进一步包括以下步骤。

在步骤S3510中，根据所述第一业务特征组向量、所述第二业务特征组向量、所述基础属性向量和所述社交嵌入向量，获得拼接特征向量。

将第一业务特征组向量、第二业务特征组向量、基础属性向量和社交嵌入向量依次拼接起来，形成一个更大维度的拼接特征向量，不仅融合多种业务行为特征，还同时融合了用户的基础属性特征和用户的社交特征。

在步骤S3511中，通过前馈神经网络对所述拼接特征向量进行处理，获得所述对象嵌入向量。

本公开实施例设计了上下文可感知的多业务融合模型，可以融合多种业务行为特征(即多业务融合)，且可以根据业务场景特征调整不同业务行为特征的权重分配(即上下文可感知)，并可以使用前馈神经网络(feed forward neural network，FNN)处理生成对象嵌入向量例如用户嵌入向量。在建模的过程中，还会引入社交属性，从用户的社交关系上帮助提供一些召回的候选项目。

其中，前馈神经网络，简称前馈网络，是人工神经网络的一种。前馈神经网络采用一种单向多层结构。其中每一层包含若干个神经元。在此种神经网络中，各神经元可以接收前一层神经元的信号，并产生输出到下一层。第0层叫输入层，最后一层叫输出层，其他中间层叫做隐含层(或隐藏层、隐层)。隐层可以是一层，也可以是多层。整个网络中无反馈，信号从输入层向输出层单向传播。

下面通过一个具体的举例对上述实施例提供的方法进行举例说明。

假设用户U1最近点击了文章A1,A2,A3，即文章阅读序列为[A1,A2,A3]，这里要预测用户U1下一篇可能阅读的文章A4，此外还收集用户最近观看的视频播放序列[B1,B2,B3]和小视频播放序列[C1,C2,C3]，这些可以称之为用户近期兴趣(user short-terminterests)中的近期行为(short-term behaviors)。具体的特征例举如下表1所示。需要说明的是，这里的“最近”并不限定具体是不是最近一周，只要是用户最近阅读的文章或者浏览的视频等即可。

表1

用户的基础属性	男，34岁，北京
		文章阅读序列	A1,A2,A3
历史阅读文章中的Tag	ATag1,ATag2,ATag3,ATag4
		历史阅读文章所属Category	ACate1,ACate2,ACate3
视频播放序列	B1,B2,B3
		历史播放视频中的Tag	BTag1,BTagB2,BTag3,BTag4
历史播放视频所属Category	BCate1,BCate2,BCate3
		小视频播放序列	C1,C2,C3
历史播放小视频中的Tag	CTag1,CTagB2,CTag3,CTag4
		历史播放小视频所属Category	CCate1,CCate2,CCate3
BusinessType	文章
		ChannelId	1
NetType	Wifi

通过本公开实施例提供的模型，将上述表1中每个特征的每一个元素映射为一个嵌入向量(即特征值向量)，表1中的每一行可以称之为一个特征组，每一个特征组简称为Field Group，有些特征组内部有多个元素，有些特征组内部只有一个元素。

BusinessType，ChannelID和NetType特征是上下文场景相关的特征，将这三个特征通过一个网络生成场景表征向量，这里假设使用ContextEmbed表示场景表征向量。

其他的特征分为两部分，一部分是用户的基础属性特征，一部分是用户的近期业务行为特征。用户的基础属性特征部分直接做Aggregate，例如直接做一个AveragePooling生成用户的基础属性向量。

用户的近期业务行为特征总共包含9个特征组，将这9个特征组先分别Aggregate在一起，生成9个特征表征向量(即这里将每个业务表征向量用三个特征表征向量来表示，例如第一业务表征向量包括文章阅读序列的第一特征表征向量，历史阅读文章中的Tag的第二特征表征向量，历史阅读文章所属Category的第三特征表征向量)。这里可以使用Average Pooling进行Aggregate，对同一个特征组内的各个元素的向量进行向量求平均，生成一个新的向量作为相应特征组的特征表征向量，这样，因为不同的用户的同一个特征组包含的元素个数可能相差很大，但是经过向量求平均后，最终每个特征组可以用一个相同维度的向量表达。

然后将这9个特征表征向量进行一次空间映射，将不同的特征映射到相同的特征空间，具体的就是一个矩阵乘法计算，可以参考上述公式(5)和(6)，这时，公式中的x_j代表第j个特征表征向量，j为大于或等于1且小于或等于9的正整数。映射之后获得9个特征嵌入向量表示为Embed_1-9。

接下来使用ContextEmbed去重新调整近期业务中的九个特征组的权重。具体的可以使用Attention，参考上述公式(1)-(4)，可以根据以下公式计算：

NemEmbed_j＝α_jEmbed_j (18)

上述公式中，α_j表示第j个特征嵌入向量的权重，n_f表示与近期业务行为相关的特征组数量，n_f为大于或等于1的正整数，j为大于或等于1且小于或等于n_f的正整数，例如这里n_f＝9。Embed_j表示第j个特征嵌入向量，NemEmbed_j表示第j个业务特征向量，A表示ContextEmbed。

利用上述公式(17)计算得到每个特征组在当前的业务场景下的权重分配，然后利用公式(18)将权重值分别乘到相应的特征组的特征嵌入向量上，经过Attention权重调整之后的业务特征向量表示为NewEmbed_1-9。

在实际的场景中，不同的场景下不同的业务特征起到的作用是不一样的，本公开实施例通过使用Contextual Attention(基于上下文的注意力机制)的解决方式，可以在不同的业务场景下，完成对不同的业务特征的权重的重新分配。通过数据统计分析，确认本公开实施例提供的方法可以完成按业务场景对业务特征的重新调整权重。对于比较成熟的业务，相关的业务场景特征起到了主导作用。而对于冷启动业务而言，泛化的特征起到了重要的作用，此时其他的相关业务的特征的权重得到了明显的提升，从而可以辅助冷启动业务完成推荐结果的召回。图11绘制了不同业务场景下不同的业务特征的权重的热力图(heatmap)。

如图11所示，文章的ID、Cate和Tag分别表示文章阅读序列、历史阅读文章中的Tag和历史阅读文章所属Category；长视频的ID、Cate和Tag分别表示视频播放序列、历史播放视频中的Tag和历史播放视频所属Category；小视频的ID、Cate和Tag分别表示小视频播放序列、历史播放小视频中的Tag和历史播放小视频所属Category。文章推荐业务中，文章相关的特征组起到了决定性的作用，而在小视频(冷启动业务)推荐业务中，除了小视频相关的特征起到了重要作用外，长视频相关的特征也起到了重要的作用。这说明这种建模方式能够学习到不同的业务场景下的业务特征分配权重，当应用于冷启动业务时，可以很好地学习到其他业务特征对于冷启动业务的辅助信息。

接着使用Self-Attention对新生成的九个业务特征向量进行建模。Self-Attention层的好处是能够一步到位捕捉到全局的联系，解决了长距离依赖，因为它直接把序列两两比较，而且可以进行并行计算。

这里使用的是multi-head Scale Dot-Product自注意力层，将这九个与近期业务行为相关的特征组进行重新编码，具体计算方法如下：

上述公式(19)中，K和V分别是对NewEmbed_1-9经过类似公式(5)空间映射生成的，对求取下述的group₁至group₉是相同的，但Q对于group₁至group₉中的每个group是不同的，在计算group₁时，Q是根据NewEmbed₁进行类似公式(5)的空间映射获得的；在计算group₂时，Q是根据NewEmbed₂进行类似公式(5)的空间映射获得的；其他依此类推，直至计算group₉时，Q是根据NewEmbed₉进行类似公式(5)的空间映射获得的。需要说明的是，空间映射过程中的空间矩阵和偏置矩阵均是通过模型训练过程中获得的。

在本公开实施例中，利用了多头自注意力机制，下面以计算group₁为例，每一个头head可以表示为：

q为大于或等于2且小于或等于n的正整数，n为K,V,Q中的每一个矩阵所拆分成的子矩阵的个数，例如，假设K，V，Q均是9*64维的矩阵，若将K，V，Q分别分成8个9*8维的子矩阵，则n＝8，q的取值为1至8的正整数，根据K，V，Q的相应子矩阵进行相应head的计算，获得8个9*8维的head：head₁、head₂、head₃、head₄、head₅、head₆、head₇、head₈。多头自注意力机制是注意力机制的完善，把Q,K,V通过空间矩阵映射后，然后再做Attention，把这个过程重复做多次，再把结果拼接起来。所谓“多头”，就是指多做几次同样的事情(参数不共享)，然后把结果拼接，在序列内部做Attention，寻找序列内部的联系。

然后，将每个特征组的业务特征组向量表示为多个head的拼接，再乘以映射矩阵W^o，将拼接之后的向量重新映射到一个多维空间中：

group_j＝[head₁,head₂,head₃,...,head_n]W^o (21)

上述公式中，group_j表示第j个特征组的业务特征组向量，j为大于或等于1且小于或等于n_f的正整数，例如这里n_f＝9。例如，若n＝8，则将head₁,head₂,head₃,...,head₈进行拼接，形成一个新的9*64维的矩阵。需要说明的是，对于每个group，head₁,head₂,head₃,...,head_n是不同的，因此，每个group也是不同的。

经过上述的Attention之后，每个特征组的业务特征组向量会融入全局的所有group的信息。

为了可视化交互注意力机制(Interaction Attention)的有效性，分析了来自小视频通道的用户在所有特征域之间的多头自注意力热力图。大多数heads关注的是目标小视频通道的特征字段，而图12显示的两个heads分别从其他异构通道获取了重要信息。在图12左侧的热力图中，在构建小视频和长视频通道的ID和Cate embeddings(嵌入向量)时，multi-head attention放大了长视频通道的ID和Cate特性。而在右侧的热力图中，multi-head attention在构建两个视频通道的Tag embeddings(嵌入向量)时，突出了文章的Tag和ID特征。结果表明，本公开实施例提供的方法能够有效地解决具有不同头的特征域之间的交互模式。此外，这也证实了单独考虑每个特征域的有效性，因为它们在特征交互中通常表现不同。

经过Self-Attention操作之后，得到了最后的9个特征组的最新的业务特征组向量，将这些特征组的业务特征组向量与用户的基础属性特征组的基础属性向量以及用户的社交嵌入向量进行拼接操作，得到一个长维度的拼接特征向量，经过一个多层的前馈神经网络(例如，下图12中的三个顺次相连的全连接层&激活函数，激活函数可以是Tanh函数，即每一个全连接层后面接一个ReLU(Rectified Linear Unit，线性整流函数)激活函数，但本公开并不限定于此)得到用户最终的用户嵌入向量，假设这个用户嵌入向量为E_u。

图13示出了图3中所示的步骤S370在一实施例中的处理过程示意图。

如图13所示，本公开实施例中，上述步骤S370可以进一步包括以下步骤。

在步骤S371中，计算所述对象嵌入向量与所述第一业务候选项目之间的相似度。

例如，还是以第一业务为文章为例，可以使用上述实施例中的用户嵌入向量E_u去预测需要推荐的文章，这里假设优质文章候选池包括N篇文章[X₁,X₂,X₃,…X_N]作为候选item，N为大于或等于1的正整数，分别获得各个候选item的嵌入向量，然后将各个候选item的嵌入向量分别于用户嵌入向量E_u计算相似度。

本公开实施例中，以余弦相似度为例，可以根据以下公式计算候选item与用户嵌入向量E_u之间的相似度：

上述公式中，u和v均为M维的向量，M为大于或等于1的正整数，u可以用于表示用户嵌入向量E_u，v可以用于表示任意一个候选item的嵌入向量，u_i表示u中的第i个特征值，v_i表示v中的第i个特征值。

需要说明的是，相似度的计算方式并不限于上述例举的余弦相似度，其他计算方式也属于本公开的保护范围。

在步骤S372中，根据所述相似度从所述第一业务候选项目中选取所述第一业务目标项目。

可以根据各个候选item与用户嵌入向量之间的相似度，将各个候选item进行降序排列，从中选取排在前(top)的K个候选item作为召回的第一业务目标项目。然后将召回的第一业务目标项目返回给上层应用方，例如推荐***中的rank(排序)模块。

例如，对于上述表1的用户U1，将其近期的文章阅读行为特征、视频播放行为特征、小视频播放行为特征与用户画像(包括用户的基础属性特征和社交特征)有效融合，编码成用户嵌入向量E_u，计算用户嵌入向量E_u与每个候选item的Cosine相似度分值，假设优质文章候选池内有10篇文章，计算之后得到与用户嵌入向量E_u最相似的候选item为X3，X5，X7，于是将它们作为召回候选item，至此，***已经完成了对于用户U1的候选item召回。

图14示意性示出了根据本公开的一实施例的召回框架的网络结构示意图。

如图14所示，假设用户近期兴趣包括用户对多个不同业务的近期行为，将用户的近期行为分为特征组1、特征组2、…、特征组m，m为大于或等于2的正整数，将每个特征组内的特征值用相同维数的嵌入向量表示(例如，这里假设为4维)，然后对每个特征组的特征值向量进行向量求平均，获得每个特征组的一个新的4维向量作为每个特征组的业务表征向量，这里将特征组的业务表征向量称之为异构特征(heterogeneous feature)，是因为每个特征组表达了不同的含义，可以是同一业务的不同行为特征信息，例如文章阅读序列、历史阅读文章中的tag和历史阅读文章所属Category；也可以是不同业务的行为特征信息，例如文章阅读序列和视频播放序列。然后，通过场景表征向量调整不同特征组的业务表征向量的权重，生成每个特征组的业务特征向量，基于注意力机制可感知上下文业务场景信息(contextual attention，上下文注意力)。接着，通过自注意力机制，对特征组的业务特征向量进行融合处理，获得每个特征组的业务特征组向量，每个特征组的业务特征组向量融合了全部特征组的业务特征信息，即所谓的“交互注意力(Interactive attention)”。

继续参考图14，除了用户近期兴趣，还可以收集用户长期属性(user long-termprofiles)，例如用户的社交网络、基础属性和内容属性，其中内容属性是用户长期行为内的内容(contents in users long-term behaviors)，是与用户的近期行为相对的一个概念，用户的近期行为例如可以包括用户最近阅读的文章、最近观看的视频、最近播放的小视频等等，用户长期行为综合了用户历史上很长一段时间以来，例如从用户在APP上注册登录以来的全部历史阅读文章、全部历史播放视频、全部历史播放小视频等等，从这些长期行为中可以提取出该用户历史上所有文章阅读序列、所有历史阅读文章中的Tag、所有历史阅读文章所属Category、所有视频播放序列、所有历史播放视频中的Tag、所有历史播放视频所属Category、所有小视频播放序列、所有历史播放小视频中的Tag、所有历史播放小视频所属Category等长期行为特征，将这些长期行为特征表示为嵌入向量，通过神经网络对长期行为特征的嵌入向量进行处理，可以获得长期行为特征向量。

图14实施例中，可以将表征用户近期兴趣的每个特征组的业务特征组向量、表征用户长期属性的社交嵌入向量、基础属性向量和长期行为特征向量进行拼接，然后将拼接后的向量输入至一个多层的前馈神经网络，这里以3层顺次连接的全连接层&激活函数为例进行举例说明，但本公开并不限定于此，前馈神经网络中每层的具体结构，以及所包括的总层数可以根据实际需要进行设置，这里通过前馈神经网络的最后一个全连接层&激活函数输出用户嵌入向量。

图14可以分为两个阶段，第一个阶段是离线训练模型，第二个阶段是利用训练好的模型提供在线服务。在离线训练模型阶段，首先获取训练数据集，训练数据集中包括用户近期兴趣和长期属性以及该用户的标签，用户的标签可以根据用户历史上是否阅读过某篇文章、是否播放过某个视频或者小视频来确定，例如用户历史上阅读过某篇文章，则将该用户作为训练数据集中的正样本，用户历史上没有阅读过某篇文章，则将该用户作为训练数据集中的负样本。将训练数据集中的用户近期兴趣和长期属性输入至模型中，会获得用户嵌入向量，将用户嵌入向量输入至模型的输出层，输出分类概率，从分类概率中选择概率最大的那个分类结果作为预测结果，根据预测结果与用户的标签进行比较，计算误差函数，通过梯度回传优化模型的参数，迭代执行，直至满足停止条件，例如达到设定的迭代次数，或者误差小于设定值。至此，模型训练完毕。

在在线服务阶段，将当前待预测的用户的近期兴趣和长期属性输入至上述训练好的模型中，获得用户嵌入向量，将用户嵌入向量与各个候选item进行相似度的计算，从中选择相似度最大的前K个item作为召回的item，即所谓的最近邻索引(Nearest NeighborIndex)，就是根据数据的相似性，从数据库中寻找与目标数据(例如这里的用户嵌入向量)最相似的项目。这种相似性通常会被量化到空间上数据之间的距离，可以认为数据在空间中的距离越近，则数据之间的相似性越高。

对于近期兴趣部分来说，可以用于实时收集用户行为反馈，并可以选取加入至训练样本中，实时抽取近期业务行为特征，并近乎实时地更新模型，这样可以将用户的最新兴趣近乎实时地体现在推荐结果里。

对于离线部分而言，通过对线上用户长期以来的行为数据的存储和清理，整理离线训练数据，并周期性地更新模型。对于超大规模数据和基于机器学***台来对离线训练进行支持。

图15示意性示出了根据本公开的又一实施例的数据处理方法的流程图。

如图15所示，与上述实施例的不同之处在于，本公开实施例提供的方法还可以进一步包括以下步骤。

在步骤S1510中，计算所述第一业务目标项目的预估点击率。

本公开实施例中，可以通过推荐***中的rank模块计算召回的item的CTR。

在步骤S1520中，根据所述预估点击率对所述第一业务目标项目进行排序。

根据召回的item的CTR对召回的item进行降序排列，但本公开并不限定于此，例如也可以进行升序排列。

在步骤S1530中，将排序后的第一业务目标项目展示于所述对象。

将排序后的召回的item按顺序返回至用户对应的终端设备，显示于该终端设备的显示屏上，例如可以显示于该用户的即时通讯APP中的信息流界面中。

图16示意性示出了根据本公开的一实施例的召回模型应用在推荐***中的示意图。

如图16所示，是将本公开实施例提出的召回模型(将上述图14所示的模型称之为上下文可感知的多业务融合模型)应用于即时通讯APP上的信息流推荐***中，其可以包括用户/文章网络、交互和上下文注意力网络以及检索模型，需要说明的是，这里之所以称之为用户/文章网络，是假设要预测的是用户感兴趣的下一篇文章，若待测的业务类型发生变化，相应的网络名称可以发生变化，例如用户/视频网络，用户/小视频网络等等。

可以从数据***中存储的用户行为和用户属性中采集用户的近期业务行为特征、基础属性特征和社交特征，还可以从数据***中存储的文章/视频/小视频等不同业务的项目中提取候选item，例如这里假设为候选文章，然后将用户用户的近期业务行为特征、基础属性特征、社交特征和候选文章输入至用户/文章网络，可以生成每个特征组的业务嵌入向量和候选文章的嵌入向量，再将每个特征组的业务嵌入向量输入至交互和上下文注意力网络，可以生成每个特征组的业务特征组向量，基于每个特征组的业务特征组向量可以生成用户嵌入向量，具体生成过程可以参照上述实施例的描述。

这里的检索模型是用于根据用户嵌入向量和候选item的嵌入向量，来确定召回的候选item。在图14实施例中，是基于最近邻检索从候选item中找到相似度最大的K个item作为召回的候选item，由于最近邻检索是线性复杂度的，不能满足对于大规模数据检索的时间性能要求。图16实施例中，采用了近似最近邻检索(Approximate Nearest Neighbor，ANN)。ANN服务器是指基于ANN算法，计算候选item与用户嵌入向量之间的余弦相似度的服务器或者服务器集群。近似最近邻检索搜索可能是近邻的数据项而不再只局限于返回最可能的项目，在可接受范围内的精度的情况下提高检索效率。

图16实施例中的推荐***包括召回逻辑、初选逻辑和排序模块。

其中召回逻辑的作用是，利用上下文可感知的多业务融合模型对多种业务场景提供召回服务，获取用户多种业务的近期行为特征如最近点击阅读行为等、以及用户的基础属性信息和社交信息，利用训练好的模型进行encoding，然后按照上述实施例中描述的策略选择相似度分值最高的一些item进行召回推荐。召回逻辑依据特定用户的画像信息，按照各种个性化、热度等维度进行数据拉取(召回)，这里假设ANN服务器召回了K个候选item。

初选逻辑主要负责对召回结果按照特定规则(例如，用户文章相关性，时效性，地域，多样性等)进行初步筛选，例如利用上下文可感知的多业务融合模型中计算好的用户嵌入向量作为初选中的特征，为初选提供精细的语义特征，从K个候选item中选择K’个候选item，K’为大于或等于1且小于或等于K的正整数，以减少rank模块的计算规模。对于推荐***而言，初选逻辑是可选的。

rank模块利用特征生成***抽取的特征，计算预估点击率CTR，以对这K’个候选item排序，呈现给用户。在另一些实施例中，rank模块后，还可以加上一些业务策略，例如去已读、推荐多样化、加入广告等各种业务策略，之后形成最终推荐结果展示给用户。

本公开实施方式提供的数据处理方法，使用上下文业务场景相关的特征去动态调节不同业务特征组的权重，可以针对不同的业务场景建模出不同特征的重要程度；并使用multi-head Self-Attention学习特征组的相互关系，设计的模型可以有效的融合多种业务信息，提供一个多业务有效融合的框架，可以实现所有业务使用同一个模型进行推荐。此外，若待推荐的业务是新业务，该框架还可以巧妙地使用已有的成熟业务辅助新业务的冷启动推荐。

以下介绍本公开的装置实施例，可以用于执行本公开上述的数据处理方法。对于本公开装置实施例中未披露的细节，请参照本公开上述的数据处理方法的实施例。

参照图17所示，根据本公开的一个实施例的数据处理装置1700可以包括：特征信息获取单元1710、行为场景获取单元1720、业务权重获得单元1730、业务权重调整单元1740、对象向量获得单元1750、候选信息获取单元1760以及目标项目确定单元1770。

具体地，特征信息获取单元1710可以用于获取对象的第一业务行为特征、第二业务行为特征以及业务场景特征。行为场景获取单元1720可以用于根据所述第一业务行为特征生成第一业务嵌入向量，根据所述第二业务行为特征生成第二业务嵌入向量，并根据所述业务场景特征生成场景表征向量。业务权重获得单元1730可以用于根据所述场景表征向量、所述第一业务嵌入向量和所述第二业务嵌入向量，获得所述第一业务嵌入向量的第一权重和所述第二业务嵌入向量的第二权重。业务权重调整单元1740可以用于根据所述第一业务嵌入向量及其第一权重生成第一业务特征向量，并根据所述第二业务嵌入向量及其第二权重，生成第二业务特征向量。对象向量获得单元1750可以用于根据所述第一业务特征向量和所述第二业务特征向量，获得对象嵌入向量。候选信息获取单元1760可以用于获取第一业务候选项目。目标项目确定单元1770可以用于根据所述对象嵌入向量，从所述第一业务候选项目中确定第一业务目标项目。

在示例性实施例中，行为场景获取单元1720可以包括：特征值向量获得单元，可以用于将所述第一业务行为特征中的特征值向量化，获得所述第一业务行为特征中的特征值向量；第一业务表征向量生成单元，可以用于根据所述第一业务行为特征中的特征值向量，生成第一业务表征向量；第一业务嵌入向量生成单元，可以用于将所述第一业务表征向量进行空间映射，生成所述第一业务嵌入向量。

在示例性实施例中，所述业务场景特征可以包括业务类型、网络类型和频道标识。其中，行为场景获取单元1720可以包括：业务场景特征向量化单元，可以用于分别将所述业务类型、所述网络类型和所述频道标识中的特征值向量化，获得所述业务类型的特征值向量、所述网络类型的特征值向量和所述频道标识的特征值向量；场景表征向量生成单元，可以用于根据所述业务类型的特征值向量、所述网络类型的特征值向量和所述频道标识的特征值向量，生成所述场景表征向量。

在示例性实施例中，业务权重获得单元1730可以通过公式(1)获得所述第一业务嵌入向量的第一权重a₁。

在示例性实施例中，对象向量获得单元1750可以包括：第一二矩阵生成单元，可以用于根据所述第一业务特征向量和所述第二业务特征向量生成第一矩阵和第二矩阵；第三矩阵生成单元，可以用于根据所述第一业务特征向量生成第三矩阵；第一二三子矩阵获得单元，可以用于根据所述第一矩阵获得n个第一子矩阵，根据所述第二矩阵获得n个第二子矩阵，并根据所述第三矩阵获得n个第三子矩阵，n为大于1的正整数；第一头矩阵生成单元，可以用于根据n个所述第一子矩阵、n个所述第二子矩阵和n个所述第三子矩阵，生成n个第一头矩阵；第一业务特征组向量生成单元，可以用于根据n个所述第一头矩阵生成第一业务特征组向量。

在示例性实施例中，第一业务特征组向量生成单元可以包括：第一头矩阵拼接单元，可以用于拼接n个所述第一头矩阵；第一业务特征组向量获得单元，可以用于根据拼接后的n个所述第一头矩阵和映射矩阵，生成所述第一业务特征组向量。

在示例性实施例中，对象向量获得单元1750还可以包括：第四矩阵生成单元，可以用于根据所述第二业务特征向量生成第四矩阵；第四子矩阵获得单元，可以用于根据所述第四矩阵获得n个第四子矩阵；第二头矩阵生成单元，可以用于根据n个所述第一子矩阵、n个所述第二子矩阵和n个所述第四子矩阵，生成n个第二头矩阵；第二业务特征组向量生成单元，可以用于根据n个所述第二头矩阵生成第二业务特征组向量。

在示例性实施例中，数据处理装置1700还可以包括：对象属性特征获取单元，可以用于获取所述对象的基础属性特征和社交特征；基础属性向量生成单元，可以用于根据所述基础属性特征生成基础属性向量；社交嵌入向量生成单元，可以用于根据所述社交特征生成社交嵌入向量。

在示例性实施例中，对象向量获得单元1750还可以包括：拼接特征向量获得单元，可以用于根据所述第一业务特征组向量、所述第二业务特征组向量、所述基础属性向量和所述社交嵌入向量，获得拼接特征向量；对象嵌入向量获得单元，可以用于通过前馈神经网络对所述拼接特征向量进行处理，获得所述对象嵌入向量。

在示例性实施例中，目标项目确定单元1770可以包括：相似度计算单元，可以用于计算所述对象嵌入向量与所述第一业务候选项目之间的相似度；第一业务目标项目选取单元，可以用于根据所述相似度从所述第一业务候选项目中选取所述第一业务目标项目。

在示例性实施例中，数据处理装置1700还可以包括：预估点击率计算单元，可以用于计算所述第一业务目标项目的预估点击率；排序单元，可以用于根据所述预估点击率对所述第一业务目标项目进行排序；项目展示单元，可以用于将排序后的第一业务目标项目展示于所述对象。

应当注意，尽管在上文详细描述中提及了用于动作执行的设备的若干单元，但是这种划分并非强制性的。实际上，根据本公开的实施方式，上文描述的两个或更多单元的特征和功能可以在一个单元中具体化。反之，上文描述的一个单元的特征和功能可以进一步划分为由多个单元来具体化。

通过以上的实施方式的描述，本领域的技术人员易于理解，这里描述的示例实施方式可以通过软件实现，也可以通过软件结合必要的硬件的方式来实现。因此，根据本公开实施方式的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM，U盘，移动硬盘等)中或网络上，包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本公开实施方式的方法。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种数据处理方法，其特征在于，包括：

获取对象的第一业务行为特征、第二业务行为特征以及业务场景特征；

根据所述第一业务行为特征生成第一业务嵌入向量，根据所述第二业务行为特征生成第二业务嵌入向量，并根据所述业务场景特征生成场景表征向量；

根据所述场景表征向量、所述第一业务嵌入向量和所述第二业务嵌入向量，获得所述第一业务嵌入向量的第一权重和所述第二业务嵌入向量的第二权重；

根据所述第一业务嵌入向量及其第一权重生成第一业务特征向量，并根据所述第二业务嵌入向量及其第二权重生成第二业务特征向量；

根据所述第一业务特征向量和所述第二业务特征向量，获得对象嵌入向量；

获取第一业务候选项目；

根据所述对象嵌入向量，从所述第一业务候选项目中确定第一业务目标项目。

2.根据权利要求1所述的数据处理方法，其特征在于，根据所述第一业务行为特征生成第一业务嵌入向量，包括：

将所述第一业务行为特征中的特征值向量化，获得所述第一业务行为特征中的特征值向量；

根据所述第一业务行为特征中的特征值向量，生成第一业务表征向量；

将所述第一业务表征向量进行空间映射，生成所述第一业务嵌入向量。

3.根据权利要求1所述的数据处理方法，其特征在于，所述业务场景特征包括业务类型、网络类型和频道标识；其中，根据所述业务场景特征生成场景表征向量，包括：

分别将所述业务类型、所述网络类型和所述频道标识中的特征值向量化，获得所述业务类型的特征值向量、所述网络类型的特征值向量和所述频道标识的特征值向量；

根据所述业务类型的特征值向量、所述网络类型的特征值向量和所述频道标识的特征值向量，生成所述场景表征向量。

4.根据权利要求1所述的数据处理方法，其特征在于，通过以下公式获得所述第一业务嵌入向量的第一权重a₁：

其中，A表示所述场景表征向量，f₁表示所述第一业务嵌入向量，f₂表示所述第二业务嵌入向量。

5.根据权利要求1所述的数据处理方法，其特征在于，根据所述第一业务特征向量和所述第二业务特征向量，获得对象嵌入向量，包括：

根据所述第一业务特征向量和所述第二业务特征向量生成第一矩阵和第二矩阵；

根据所述第一业务特征向量生成第三矩阵；

根据所述第一矩阵获得n个第一子矩阵，根据所述第二矩阵获得n个第二子矩阵，并根据所述第三矩阵获得n个第三子矩阵，n为大于1的正整数；

根据n个所述第一子矩阵、n个所述第二子矩阵和n个所述第三子矩阵，生成n个第一头矩阵；

根据n个所述第一头矩阵生成第一业务特征组向量。

6.根据权利要求5所述的数据处理方法，其特征在于，根据所述n个第一头矩阵生成第一业务特征组向量，包括：

拼接n个所述第一头矩阵；

根据拼接后的n个所述第一头矩阵和映射矩阵，生成所述第一业务特征组向量。

7.根据权利要求5所述的数据处理方法，其特征在于，根据所述第一业务特征向量和所述第二业务特征向量，获得对象嵌入向量，还包括：

根据所述第二业务特征向量生成第四矩阵；

根据所述第四矩阵获得n个第四子矩阵；

根据n个所述第一子矩阵、n个所述第二子矩阵和n个所述第四子矩阵，生成n个第二头矩阵；

根据n个所述第二头矩阵生成第二业务特征组向量。

8.根据权利要求7所述的数据处理方法，其特征在于，还包括：

获取所述对象的基础属性特征和社交特征；

根据所述基础属性特征生成基础属性向量；

根据所述社交特征生成社交嵌入向量。

9.根据权利要求8所述的数据处理方法，其特征在于，根据所述第一业务特征向量和所述第二业务特征向量，获得对象嵌入向量，还包括：

根据所述第一业务特征组向量、所述第二业务特征组向量、所述基础属性向量和所述社交嵌入向量，获得拼接特征向量；

通过前馈神经网络对所述拼接特征向量进行处理，获得所述对象嵌入向量。

10.根据权利要求1所述的数据处理方法，其特征在于，根据所述对象嵌入向量，从所述第一业务候选项目中确定第一业务目标项目，包括：

计算所述对象嵌入向量与所述第一业务候选项目之间的相似度；

根据所述相似度从所述第一业务候选项目中选取所述第一业务目标项目。

11.根据权利要求1所述的数据处理方法，其特征在于，还包括：

计算所述第一业务目标项目的预估点击率；

根据所述预估点击率对所述第一业务目标项目进行排序；

将排序后的第一业务目标项目展示于所述对象。

12.一种数据处理装置，其特征在于，包括：

特征信息获取单元，用于获取对象的第一业务行为特征、第二业务行为特征以及业务场景特征；

行为场景获取单元，用于根据所述第一业务行为特征生成第一业务嵌入向量，根据所述第二业务行为特征生成第二业务嵌入向量，并根据所述业务场景特征生成场景表征向量；

业务权重获得单元，用于根据所述场景表征向量、所述第一业务嵌入向量和所述第二业务嵌入向量，获得所述第一业务嵌入向量的第一权重和所述第二业务嵌入向量的第二权重；

业务权重调整单元，用于根据所述第一业务嵌入向量及其第一权重生成第一业务特征向量，并根据所述第二业务嵌入向量及其第二权重，生成第二业务特征向量；

对象向量获得单元，用于根据所述第一业务特征向量和所述第二业务特征向量，获得对象嵌入向量；

候选信息获取单元，用于获取第一业务候选项目；

目标项目确定单元，用于根据所述对象嵌入向量，从所述第一业务候选项目中确定第一业务目标项目。

13.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现如权利要求1至11中任一项所述的数据处理方法。

14.一种电子设备，其特征在于，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如权利要求1至11中任一项所述的数据处理方法。