CN115982452A

CN115982452A - 一种信息推荐方法、装置、电子设备及存储介质

Info

Publication number: CN115982452A
Application number: CN202211633738.2A
Authority: CN
Inventors: 陆凯
Original assignee: Ping An Life Insurance Company of China Ltd
Current assignee: Ping An Life Insurance Company of China Ltd
Priority date: 2022-12-19
Filing date: 2022-12-19
Publication date: 2023-04-18

Abstract

本申请实施例提供了一种信息推荐方法、装置、电子设备及存储介质，属于人工智能技术领域。该方法包括：获取目标对象的对象行为序列；所述对象行为序列包括目标对象的行为信息；将所述对象行为序列输入嵌入层模型，得到对象编码信息；所述嵌入层模型用于对所述行为信息发生的时间间隔进行建模；将所述对象编码信息输入编码器模型，得到语义表示向量；所述编码器模型用于建模对象行为序列中的语义信息；基于所述语义表示向量，向所述目标对象进行信息推荐。本申请实施例有利于提升信息推荐的准确度，同时，提升方法的适用性。

Description

一种信息推荐方法、装置、电子设备及存储介质

技术领域

本申请涉及人工智能技术领域，尤其涉及一种信息推荐方法、装置、电子设备及存储介质。

背景技术

在推荐、广告、风控等领域，对象行为序列是一种重要的信息，对对象行为序列进行建模，以更好的进行信息推荐，是提升服务品质和满意度的重要方法。相关技术中，通常的做法是对行为特征进行建模，重点关注特征的设计过程，需要较多的专家经验，模型准确率不高，信息推荐效果不理想。

发明内容

本申请实施例的主要目的在于提出一种信息推荐方法、装置、电子设备及存储介质，旨在提高信息推荐的准确性。

为实现上述目的，本申请实施例的第一方面提出了一种信息推荐方法，所述方法包括：

获取目标对象的对象行为序列；所述对象行为序列包括目标对象的行为信息；

将所述对象行为序列输入嵌入层模型，得到对象编码信息；所述嵌入层模型用于对所述行为信息发生的时间间隔进行建模；

将所述对象编码信息输入编码器模型，得到语义表示向量；所述编码器模型用于建模对象行为序列中的语义信息；

基于所述语义表示向量，向所述目标对象进行信息推荐。通过将对象行为序列中的时间间隔进行建模，在进行信息推荐时，便于区分对象的连续相关行为和空闲行为，同时不依赖于专家经验，有利于提升推荐准确度；基于嵌入层进行建模，便于实现与其它模型的融合，提升模型的适用性。

在一些实施例，所述将所述对象行为序列输入嵌入层模型，得到对象编码信息，包括：

根据所述对象行为序列，构建词序列；所述词序列包括间隔设置的行为信息和时间间隔信息；

根据所述词序列，确定对象编码信息；所述对象编码信息包括基于所述词序列设置的位置编码信息、词类型编码信息和词取值编码信息。

在一些实施例，所述对象行为序列用于表征按照时间先后顺序排列的若干行为信息；根据所述对象行为序列，构建词序列，包括：

在每两个行为信息之间***时间间隔信息，构建词序列；所述时间间隔信息用于表征该时间间隔信息前后两个行为信息之间的时间间隔；

以递增的方式，更新词序列中各个词信息的角标；其中，所述角标从零开始编码。

在一些实施例，根据所述词序列，确定对象编码信息，包括以下步骤：

对所述词信息的角标进行embedding编码处理，得到对应位置处的位置编码信息；

对所述词信息的类型进行embedding编码处理，得到对应位置处的词类型编码信息；所述词信息的类型包括行为和时间间隔。

若词序列中的词信息属于行为信息，确定词取值编码信息为对应行为信息的行为特征信息；

若词序列中的词信息属于时间间隔信息，通过下列向量确定词取值编码信息：

其中，convert(K_i)用于表征将时间间隔转化为业务所需的最小时间单位；K_i用于表征时间间隔信息，E_time用于表征预设域向量。

在一些实施例，将所述对象编码信息输入编码器模型，得到语义表示向量，包括：

通过transformer结构处理所述对象编码信息，得到语义表示向量。

在一些实施例，所述方法还包括：

通过平均池化，更新所述语义表示向量。

为实现上述目的，本申请实施例的第二方面提出了一种信息推荐装置，所述装置包括：

第一模块，用于获取目标对象的对象行为序列；所述对象行为序列包括目标对象的行为信息；

第二模块，用于将所述对象行为序列输入嵌入层模型，得到对象编码信息；所述嵌入层模型用于对所述行为信息发生的时间间隔进行建模；

第三模块，用于将所述对象编码信息输入编码器模型，得到语义表示向量；所述编码器模型用于建模对象行为序列中的语义信息；

第四模块，用于基于所述语义表示向量，向所述目标对象进行信息推荐。

为实现上述目的，本申请实施例的第三方面提出了一种电子设备，所述电子设备包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现第一方面所述的信息推荐方法。

为实现上述目的，本申请实施例的第四方面提出了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现如第一方面所述的信息推荐方法。

本申请提出的信息推荐方法、装置、电子设备及存储介质,该方法包括：获取目标对象的对象行为序列；所述对象行为序列包括目标对象的行为信息；将所述对象行为序列输入嵌入层模型，得到对象编码信息；所述嵌入层模型用于对所述行为信息发生的时间间隔进行建模；通过将对象行为序列中的时间间隔进行建模，在进行信息推荐时，便于区分对象的连续相关行为和空闲行为，以提升推荐准确度；基于嵌入层进行建模，便于实现与其它模型的融合，提升模型的适用性。同时，将所述对象编码信息输入编码器模型，得到语义表示向量；所述编码器模型用于建模对象行为序列中的语义信息；基于所述语义表示向量，向所述目标对象进行信息推荐。通过该方法，有利于提升信息推荐的准确度，同时，提升方法的适用性。

附图说明

图1是本申请实施例提供的信息推荐方法的流程图；

图2是图1中的步骤S200的一种实施例的流程图；

图3是图2中的步骤S210的一种实施例的流程图；

图4是图2中的步骤S220的一种实施例的流程图；

图5是本申请实施例提供的信息推荐装置的结构示意图；

图6是本申请实施例提供的电子设备的硬件结构示意图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本申请，并不用于限定本申请。

需要说明的是，虽然在装置示意图中进行了功能模块划分，在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于装置中的模块划分，或流程图中的顺序执行所示出或描述的步骤。说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的，不是旨在限制本申请。

首先，对本申请中涉及的若干名词进行解析：

人工智能(artificial intelligence，AI)：是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用***的一门新的技术科学；人工智能是计算机科学的一个分支，人工智能企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器，该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家***等。人工智能可以对人的意识、思维的信息过程的模拟。人工智能还是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。

自然语言处理(Nature Language processing，NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此，这一领域的研究将涉及自然语言，即人们日常使用的语言，所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、信息抽取、语义理解、机器翻译、机器人问答、知识图谱等众多方向。

嵌入(Embedding)：是一个将离散变量转为连续向量表示的一个方式。在神经网络中，embedding可以减少离散变量的空间维数，还可以对向量进行意思表示，在可视化不同离散变量之间的关系、作为监督性学习任务的输入、查找最近邻等方面具有突出的效果。

随着互联网应用的不断发展，对象会在互联网上、平台上留下大量的对象行为。对于推荐、广告、风控等领域，对象行为序列是一种重要的信息，对对象行为序列进行建模，以更好的进行信息推荐，是提升服务品质和满意度的重要方法。对象行为序列通常为对象具体行为组成的列表，列表中的每一个具体行为通常包括两项，该行为发生的时间和对象的具体行为。

相关技术中，通常通过对行为序列计算统计特征来建模对象历史行为序列。该类方法的重点在于如何设计特征，需要较多的专家经验和特征工程。且目前在深度学***台浏览商品时，相近时间间隔时通常在浏览相似的同一品类的商品，而较长时间间隔后通常会开始浏览另一品类的其它商品；因此，可以通过对时间间隔进行建模，对对象行为进行一定的预判。

基于此，本申请实施例提供了一种信息推荐方法、装置、电子设备及存储介质，旨在提高推荐的准确性。首先，获取目标对象的对象行为序列；所述对象行为序列包括目标对象的行为信息；将所述对象行为序列输入嵌入层模型，得到对象编码信息；所述嵌入层模型用于对所述行为信息发生的时间间隔进行建模；通过将对象行为序列中的时间间隔进行建模，在进行信息推荐时，便于区分对象的连续相关行为和空闲行为，以提升推荐准确度；基于嵌入层进行建模，便于实现与其它模型的融合，提升模型的适用性。其次，将所述对象编码信息输入编码器模型，得到语义表示向量；所述编码器模型用于建模对象行为序列中的语义信息；基于所述语义表示向量，向所述目标对象进行信息推荐。通过该方法，有利于提升信息推荐的准确度，同时，提升方法的适用性。

本申请实施例提供的信息推荐方法、装置、电子设备及存储介质，具体通过如下实施例进行说明，首先描述本申请实施例中的信息推荐方法。

本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中，人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。

人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互***、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

本申请实施例提供的信息推荐方法，涉及人工智能技术领域。本申请实施例提供的信息推荐方法可应用于终端中，也可应用于服务器端中，还可以是运行于终端或服务器端中的软件。在一些实施例中，终端可以是智能手机、平板电脑、笔记本电脑、台式计算机等；服务器端可以配置成独立的物理服务器，也可以配置成多个物理服务器构成的服务器集群或者分布式***，还可以配置成提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN以及大数据和人工智能平台等基础云计算服务的云服务器；软件可以是实现信息推荐方法的应用等，但并不局限于以上形式。

本申请可用于众多通用或专用的计算机***环境或配置中。例如：个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器***、基于微处理器的***、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何***或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

需要说明的是，在本申请的各个具体实施方式中，当涉及到需要根据用户信息、用户行为数据，用户历史数据以及用户位置信息等与用户身份或特性相关的数据进行相关处理时，都会先获得用户的许可或者同意，而且，对这些数据的收集、使用和处理等，都会遵守相关国家和地区的相关法律法规和标准。此外，当本申请实施例需要获取用户的敏感个人信息时，会通过弹窗或者跳转到确认页面等方式获得用户的单独许可或者单独同意，在明确获得用户的单独许可或者单独同意之后，再获取用于使本申请实施例能够正常运行的必要的用户相关数据。

图1是本申请实施例提供的信息推荐方法的一个可选的流程图，图1中的方法可以包括但不限于包括步骤S100至步骤S400。

步骤S100，获取目标对象的对象行为序列；所述对象行为序列包括目标对象的行为信息；

在一些实施例中，目标对象为需要进行信息推荐的对象。示例性地，在购物类应用中，通过终端向目标对象推荐购物品类或某个单品。或者，在新闻类应用中，通过在终端的屏幕显著位置显示某类型新闻，实现对目标对象的信息推荐。同时，本申请中的方法还可以用于广告、风控等领域，本申请并不作限制。具体地，通过对目标对象的对象行为序列的建模分析，得到目标对象需要的信息；在一些可能的实现方式中，需要获取目标对象的对象行为序列。具体地，行为序列可以用于表征时间维度上按照一定顺序发生的若干行为事件组成的序列。示例性地，在短视频类应用中，对象的行为信息可以是对象的一系列点击动作，用于表征对象选中感兴趣的短视频类目。本申请通过获取上述点击行为，对对象的行为进行建模分析。即通过获取目标对象的对象行为序列，便于后续对对象行为序列进行建模分析，以确定对目标对象的推荐信息。

步骤S200，将所述对象行为序列输入嵌入层模型，得到对象编码信息；所述嵌入层模型用于对所述行为信息发生的时间间隔进行建模；

在一些实施例中，通过嵌入层模型，对行为信息发生的时间间隔进行建模，在对对象行为进行信息推荐的过程中，加入时间间隔影响因素，提升信息推荐的准确度。在一些可能的实现方式中，通过在embedding层建立嵌入层模型，在实现了时间建模的同时，也易于与其它行为模型相结合进行预测或推荐工作，提升信息推荐的应用广度。具体地，本申请通过嵌入层模型的作用，最终输出一个embedding列表，在embedding中引入时间间隔相关的信息，实现基于时间间隔的信息推荐。

在一些可能实现方式中，嵌入层模型的输入为对象行为序列。具体地，对象行为序列可以为一个列表，列表长度为L。列表中的每一个行为序列包括时间戳和具体行为信息。且该列表已经按照行为发生的时间先后顺序进行排序，列表中越靠前的行为发生时间越早，列表中越靠后的行为发生时间越晚。对于上述实施例中的对象行为序列输入嵌入层模型，输出可以是通过embedding表示的对象编码信息E,单个样本的大小为(M,H)。M为embedding列表的长度，M＝2*L-1。H为embedding隐向量长度。示例性地，对于上述短视频类应用场景而言，对于对象的一系列点击动作而言，每两个不同的点击动作之间的时间间隔用于可以用于表征对象对于选中的短视频类目的喜爱程度，通过时间间隔，可以对对象的行为进行预测；进而用于信息推荐领域。

步骤S300，将所述对象编码信息输入编码器模型，得到语义表示向量；所述编码器模型用于建模对象行为序列中的语义信息；

在一些实施例中，通过编码器模型，得到对象行为的语义表示向量，便于后续的信息推荐。具体地，以推荐中的点击率预估为例，客户历史行为建模是实现点击率预测的重要方法，通常将客户历史行为建模成一个固定大小的语义向量，然后与其它特征拼embedding，输入到机器学习训练模型中，对点击率进行概率预测，进而实现对目标对象的信息推荐。因此，通过编码器，将含有时间间隔信息的对象编码信息转换成固定大小的语义向量，实现与其它语义特征的拼接，进而实现信息推荐。当然，本申请并不限制其它特征的建模过程、拼接过程及模型的选用和训练过程。

步骤S400，基于所述语义表示向量，向所述目标对象进行信息推荐。

在一些实施例中，语义表示向量中包括目标对象的行为信息的时间间隔，基于语义表示向量，向目标对象进行信息推荐；能够充分考虑到对象行为的时间间隔对对象行为预测的影响，提升信息推荐的准确度。示例性地，可以通过DNN模型实现对象行为的预测，进而提供推荐信息。可以理解的是，还可以通过其它人工智能模型实现对象行为的预测。本申请并不限制具体的模型选择。

由此可知，本申请提供了一种信息推荐方法，通过获取目标对象的对象行为序列；所述对象行为序列包括目标对象的行为信息；将所述对象行为序列输入嵌入层模型，得到对象编码信息；所述嵌入层模型用于对所述行为信息发生的时间间隔进行建模；通过将对象行为序列中的时间间隔进行建模，在进行信息推荐时，便于区分对象的连续相关行为和空闲行为，以提升推荐准确度；基于嵌入层进行建模，便于实现与其它模型的融合，提升模型的适用性。同时，将所述对象编码信息输入编码器模型，得到语义表示向量；所述编码器模型用于建模对象行为序列中的语义信息；基于所述语义表示向量，向所述目标对象进行信息推荐。通过该方法，有利于提升信息推荐的准确度，同时，提升方法的适用性。

请参阅图2，在一些实施例中，步骤S200可以包括但不限于包括步骤S210至步骤S220：

步骤S210，根据所述对象行为序列，构建词序列；所述词序列包括间隔设置的行为信息和时间间隔信息；

步骤S220，根据所述词序列，确定对象编码信息；所述对象编码信息包括基于所述词序列设置的位置编码信息、词类型编码信息和词取值编码信息。

在一些实施例中，嵌入层模型基于行为信息发生的时间进行建模，具体地，可以将行为信息的时间间隔写入对象行为序列，生成词序列。示例性地，词序列可以是token序列。输入为对象行为序列B，长度为L；对应的输出为：token序列K，长度为M，M＝2*L-1。如对象行为序列可以通过下列向量B表示：

B＝[B₀,B₁,…,B_L-1] 公式(1)

其中,B_i是第i个具体的对象行为；B_i＝[A_i,T_i]，A_i为具体行为信息，T_i为该行为发生的时间。

可以理解的是，通过上述对象行为序列的一种实施例可知，对象行为序列中包括行为信息和行为信息的发生时间，而需要的时间间隔需要通过在对象行为序列中添加时间间隔信息的方式实现，便于后续的对时间间隔和行为信息进行分析推荐。在一些可能的实现方式中，本申请通过将行为信息和时间间隔信息顺序排列组成词序列，因此，词序列中的词信息可能表征不同类型的数据，对于不同类型的数据，通过对象编码信息统一进行表示，便于后续的语义表示和信息推荐。具体地，基于词信息的具***置、类型和取值设置三个编码信息，分别为位置编码信息、词类型编码信息和词取值编码信息。通过上述词序列的设置，能够实现时间间隔信息的建模，提升信息推荐的准确度。

请参阅图3，在一些实施例中，所述对象行为序列用于表征按照时间先后顺序排列的若干行为信息；步骤S210可以包括但不限于包括步骤S211至步骤S212：

S211，在每两个行为信息之间***时间间隔信息，构建词序列；所述时间间隔信息用于表征该时间间隔信息前后两个行为信息之间的时间间隔；

S212，以递增的方式，更新词序列中各个词信息的角标；其中，所述角标从零开始编码。

在一些实施例中，时间间隔信息可以置于行为信息之间，用于表征其前后两个行为信息之间的时间间隔。对于原始的对象行为序列，***新的时间间隔信息后，行为信息对应的角标需要更新。基于上述实施例中的对象行为序列B，对应的输出词序列为：token序列K，长度为M，M＝2*L-1。在B中***时间间隔信息，token序列K通过下列向量进行表示：

K＝[K₀,K₁,…,K_M-1] 公式(2)

其中，K_i是第i个词信息。具体地，token序列K中包含两种token的embedding，一种是对象的具体行为(行为信息)，另一种是时间间隔信息。示例性地，K_i与上述实施例中的B_i的关系为：当i为偶数时，K_i是一个具体行为，K_i＝A_i/2；当i为奇数时，K_i表示两个相邻行为之间的时间间隔信息，此时K_i＝T_(i+1)/2-T_(i-1)/2。通过上述实施例实现了词序列的构建，便于后续对时间间隔信息进行建模分析。

请参阅图4，在一些实施例中，步骤S220可以包括但不限于包括步骤S221至步骤S222：

步骤S221，对所述词信息的角标进行embedding编码处理，得到对应位置处的位置编码信息；

步骤S222，对所述词信息的类型进行embedding编码处理，得到对应位置处的词类型编码信息；所述词信息的类型包括行为和时间间隔。

在一些实施例中，基于不同位置的词信息，进行位置编码和类型编码。具体地，位置编码信息可以通过每个词信息的角标获得，每个下标位置取对应embedding，得到位置编码信息。即位置编码信息通过下列向量进行表示：

e^position＝[e₀ ^position,e₁ ^position,…] 公式(3)

其中，e₀ ^position、e₁ ^position用于表征位置信息的embedding编码。需要说明的是，使用位置信息的Embedding编码表示词信息出现在词序列中的位置，其中embedding编码可以通过训练得到，也可以使用预设公式计算得到，本申请并不作限制。

同样，词序列通过行为信息和时间间隔信息交叉排列组成，用于区分行为部分和时间间隔部分。对于每项不同的类型，将词序列中的每项类型取对应embedding，得到词类型编码信息。词类型编码信息通过下列向量进行表示：

e^token type＝[e₀ ^token type,e₁ ^token type,…] 公式(4)

其中，所述e_i ^token type用于表征第i个词信息所属的类型的embedding编码。同样，使用类型信息的Embedding编码表示词信息的具体类型，其中embedding编码可以通过训练得到，也可以使用预设公式计算得到，本申请并不作限制。可以理解的是，通过embedding编码处理后的位置编码信息和词类型编码信息具有相同的维度。

在一些实施例中，步骤S220可以包括但不限于包括步骤S2201至步骤S2202：

S2201，若词序列中的词信息属于行为信息，确定词取值编码信息为对应行为信息的行为特征信息；

S2202，若词序列中的词信息属于时间间隔信息，通过下列向量确定词取值编码信息：

在一些实施例中，词序列中包括行为信息和时间间隔信息两种类型的词信息，对于不同的类型，词取值编码信息的表征方式也不同。具体地，对于行为类型的词信息，词取值编码信息可以对相应的行为特征取对应的embedding。对于时间间隔类型的词信息，词取值编码信息可以通过公式(5)所示的向量进行表示。convert()函数可用于把日期转换为特定数据类型的函数,同时，可用不同的格式显示日期/时间数据。本申请中，convert(K_i)将时间间隔K_i转化为业务所需的最小时间单位，通常可以以秒为单位。可以理解的是，时间差分布相差较大，从几秒到几天、几年跨度较大，因此，采用log函数进行归一化处理。同时，时间差会出现不到一秒甚至0秒的情况，采用log函数可能会出现较大负数，甚至出错的情况。因此，采用convert(K_i)+1的方式进行向量表示，保证log之后的数值在合理范围之内。需要说明的是，上述实施例属于示例性举例，并不限制词取值编码信息的具体表示方法。

在一些可能的实现方式中，词取值编码信息通过下列向量进行表示：

e^value＝[e₀ ^value,e₁ ^value,…] 公式(6)

其中，所述e_i ^value用于表征第i个词信息的词取值编码信息。

基于位置编码信息、词类型编码信息和词取值编码信息，最终的对象编码信息可以通过下列向量进行表示：

e＝[e₀,e₁,……] 公式(7)

其中，e_i＝e_i ^position+e_i ^tokentype+e_i ^value。通过公式(7)得到对象编码信息的向量表示，其中，表征了时间间隔的对象行为序列，便于后续基于时间间隔，提升信息推荐的准确度。

在一些实施例中，步骤S300可以包括但不限于包括步骤S310：

步骤S310，通过transformer结构处理所述对象编码信息，得到语义表示向量。

在一些实施例中，transformer结构不同于深度学习任务里面使用到的CNN和RNN，其中，Bert模型为基于transformer结构构建的模型。transformer结构采用了encoer-decoder的架构，比Attention模型更加复杂，效果更为明显。具体地，本申请提供的实施例，上述对象编码信息E可以通过transformer结构处理，得到混合语义向量列表A＝[A₁,A₂,…,A_L-1]，单个样本的大小为(L,H)。通过语义表示，便于后续的信息推荐处理。

在一些实施例中，该信息推荐方法可以包括但不限于包括步骤S320：

步骤S320，通过平均池化，更新所述语义表示向量。

在一些实施例中，通过平均池化处理，抽取更高阶的特征，提升信息推荐的准确度。具体地，对上述混合语义向量列表A做平均池化处理，得到对象行为序列的语义表示向量，通过下列向量进行表示：

其中，S_i为的S的第i个值。

本申请提出一种信息推荐方法，该方法包括：获取目标对象的对象行为序列；所述对象行为序列包括目标对象的行为信息；将所述对象行为序列输入嵌入层模型，得到对象编码信息；所述嵌入层模型用于对所述行为信息发生的时间间隔进行建模；通过将对象行为序列中的时间间隔进行建模，在进行信息推荐时，便于区分对象的连续相关行为和空闲行为，以提升推荐准确度；基于嵌入层进行建模，便于实现与其它模型的融合，提升模型的适用性。同时，将所述对象编码信息输入编码器模型，得到语义表示向量；所述编码器模型用于建模对象行为序列中的语义信息；基于所述语义表示向量，向所述目标对象进行信息推荐。通过该方法，有利于提升信息推荐的准确度，同时，提升方法的适用性。

需要说明的是，本申请中的信息推荐方法还可以用于视频播放类应用中，通过获取对象行为信息，如发送弹幕的行为，分享视频连接的行为等；对行为序列中的时间间隔通过本申请提供的方法进行建模分析，以提升信息推荐的准确性。可以理解的是，对于广告、风控等其它推荐领域，本申请提供的方法同样适用。

请参阅图5，本申请实施例还提供一种信息推荐装置，可以实现上述信息推荐方法，该装置包括：

第一模块510，用于获取目标对象的对象行为序列；所述对象行为序列包括目标对象的行为信息；

第二模块520，用于将所述对象行为序列输入嵌入层模型，得到对象编码信息；所述嵌入层模型用于对所述行为信息发生的时间间隔进行建模；

第三模块530，用于将所述对象编码信息输入编码器模型，得到语义表示向量；所述编码器模型用于建模对象行为序列中的语义信息；

第四模块540，用于基于所述语义表示向量，向所述目标对象进行信息推荐。

在一些实施例中，第二模块包括第一单元，第一单元用于根据所述对象行为序列，构建词序列；所述词序列包括间隔设置的行为信息和时间间隔信息；根据所述词序列，确定对象编码信息；所述对象编码信息包括基于所述词序列设置的位置编码信息、词类型编码信息和词取值编码信息。

在一些实施例中，所述对象行为序列用于表征按照时间先后顺序排列的若干行为信息，第一单元还用于在每两个行为信息之间***时间间隔信息，构建词序列；所述时间间隔信息用于表征该时间间隔信息前后两个行为信息之间的时间间隔；以递增的方式，更新词序列中各个词信息的角标；其中，所述角标从零开始编码。

在一些实施例中，第一单元还用于对所述词信息的角标进行embedding编码处理，得到对应位置处的位置编码信息；对所述词信息的类型进行embedding编码处理，得到对应位置处的词类型编码信息；所述词信息的类型包括行为和时间间隔。

在一些实施例中，第二模块还用于若词序列中的词信息属于行为信息，确定词取值编码信息为对应行为信息的行为特征信息；若词序列中的词信息属于时间间隔信息，通过下列向量确定词取值编码信息：

在一些实施例中，第三模块还用于通过transformer结构处理所述对象编码信息，得到语义表示向量。

在一些实施例中，第三模块还用于通过平均池化，更新所述语义表示向量。

该信息推荐装置的具体实施方式与上述信息推荐方法的具体实施例基本相同，在此不再赘述。

该装置包括第一模块、第二模块、第三模块和第四模块，具体地，通过获取目标对象的对象行为序列；所述对象行为序列包括目标对象的行为信息；将所述对象行为序列输入嵌入层模型，得到对象编码信息；所述嵌入层模型用于对所述行为信息发生的时间间隔进行建模；通过将对象行为序列中的时间间隔进行建模，在进行信息推荐时，便于区分对象的连续相关行为和空闲行为，以提升推荐准确度；基于嵌入层进行建模，便于实现与其它模型的融合，提升模型的适用性。同时，将所述对象编码信息输入编码器模型，得到语义表示向量；所述编码器模型用于建模对象行为序列中的语义信息；基于所述语义表示向量，向所述目标对象进行信息推荐。通过上述信息推荐装置，有利于提升信息推荐的准确度，同时，提升方法的适用性。

本申请实施例还提供了一种电子设备，电子设备包括存储器和处理器，存储器存储有计算机程序，处理器执行计算机程序时实现上述信息推荐方法。该电子设备可以为包括平板电脑、车载电脑等任意智能终端。

请参阅图6，图6示意了另一实施例的电子设备的硬件结构，电子设备包括：

处理器601，可以采用通用的CPU(CentralProcessingUnit，中央处理器)、微处理器、应用专用集成电路(ApplicationSpecificIntegratedCircuit，ASIC)、或者一个或多个集成电路等方式实现，用于执行相关程序，以实现本申请实施例所提供的技术方案；

存储器602，可以采用只读存储器(ReadOnlyMemory，ROM)、静态存储设备、动态存储设备或者随机存取存储器(RandomAccessMemory，RAM)等形式实现。存储器602可以存储操作***和其他应用程序，在通过软件或者固件来实现本说明书实施例所提供的技术方案时，相关的程序代码保存在存储器602中，并由处理器601来调用执行本申请实施例的信息推荐方法；

输入/输出接口603，用于实现信息输入及输出；

通信接口604，用于实现本设备与其他设备的通信交互，可以通过有线方式(例如USB、网线等)实现通信，也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信；

总线605，在设备的各个组件(例如处理器601、存储器602、输入/输出接口603和通信接口604)之间传输信息；

其中处理器601、存储器602、输入/输出接口603和通信接口604通过总线605实现彼此之间在设备内部的通信连接。

本申请实施例还提供了计算机可读存储介质，该计算机可读存储介质存储有计算机程序，该计算机程序被处理器执行时实现上述信息推荐方法。

存储器作为一种非暂态计算机可读存储介质，可用于存储非暂态软件程序以及非暂态性计算机可执行程序。此外，存储器可以包括高速随机存取存储器，还可以包括非暂态存储器，例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中，存储器可选包括相对于处理器远程设置的存储器，这些远程存储器可以通过网络连接至该处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

本申请提出的信息推荐方法、装置、电子设备及存储介质,其通过获取目标对象的对象行为序列；所述对象行为序列包括目标对象的行为信息；将所述对象行为序列输入嵌入层模型，得到对象编码信息；所述嵌入层模型用于对所述行为信息发生的时间间隔进行建模；通过将对象行为序列中的时间间隔进行建模，在进行信息推荐时，便于区分对象的连续相关行为和空闲行为，以提升推荐准确度；基于嵌入层进行建模，便于实现与其它模型的融合，提升模型的适用性。同时，将所述对象编码信息输入编码器模型，得到语义表示向量；所述编码器模型用于建模对象行为序列中的语义信息；基于所述语义表示向量，向所述目标对象进行信息推荐。通过该方法，有利于提升信息推荐的准确度，同时，提升方法的适用性。

本申请实施例描述的实施例是为了更加清楚的说明本申请实施例的技术方案，并不构成对于本申请实施例提供的技术方案的限定，本领域技术人员可知，随着技术的演变和新应用场景的出现，本申请实施例提供的技术方案对于类似的技术问题，同样适用。

本领域技术人员可以理解的是，图1-6中示出的技术方案并不构成对本申请实施例的限定，可以包括比图示更多或更少的步骤，或者组合某些步骤，或者不同的步骤。

以上所描述的装置实施例仅仅是示意性的，其中作为分离部件说明的单元可以是或者也可以不是物理上分开的，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

本领域普通技术人员可以理解，上文中所公开方法中的全部或某些步骤、***、设备中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。

本申请的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

应当理解，在本申请中，“至少一个(项)”是指一个或者多个，“多个”是指两个或两个以上。“和/或”，用于描述关联对象的关联关系，表示可以存在三种关系，例如，“A和/或B”可以表示：只存在A，只存在B以及同时存在A和B三种情况，其中A，B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达，是指这些项中的任意组合，包括单项(个)或复数项(个)的任意组合。例如，a，b或c中的至少一项(个)，可以表示：a，b，c，“a和b”，“a和c”，“b和c”，或“a和b和c”，其中a，b，c可以是单个，也可以是多个。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，上述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

上述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括多指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例的方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-On ly Memory，简称ROM)、随机存取存储器(Random Access Memory，简称RAM)、磁碟或者光盘等各种可以存储程序的介质。

以上参照附图说明了本申请实施例的优选实施例，并非因此局限本申请实施例的权利范围。本领域技术人员不脱离本申请实施例的范围和实质内所作的任何修改、等同替换和改进，均应在本申请实施例的权利范围之内。

Claims

1.一种信息推荐方法，其特征在于，所述方法包括：

基于所述语义表示向量，向所述目标对象进行信息推荐。

2.根据权利要求1所述的推荐方法，其特征在于，所述将所述对象行为序列输入嵌入层模型，得到对象编码信息，包括：

3.根据权利要求2所述的推荐方法，其特征在于，所述对象行为序列用于表征按照时间先后顺序排列的若干行为信息；所述根据所述对象行为序列，构建词序列，包括：

4.根据权利要求3所述的推荐方法，其特征在于，所述根据所述词序列，确定对象编码信息，包括以下步骤：

5.根据权利要求3所述的推荐方法，其特征在于，所述根据所述词序列，确定对象编码信息，包括以下步骤：

6.根据权利要求1所述的推荐方法，其特征在于，所述将所述对象编码信息输入编码器模型，得到语义表示向量，包括：

7.根据权利要求6所述的推荐方法，其特征在于，所述方法还包括：

通过平均池化，更新所述语义表示向量。

8.一种信息推荐装置，其特征在于，所述装置包括：

9.一种电子设备，其特征在于，所述电子设备包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现权利要求1至7任一项所述的信息推荐方法。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的信息推荐方法。