CN110941764A

CN110941764A - 对象推荐方法、装置、计算机设备和存储介质

Info

Publication number: CN110941764A
Application number: CN201911221646.1A
Authority: CN
Inventors: 缪畅宇
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2019-12-03
Filing date: 2019-12-03
Publication date: 2020-03-31

Abstract

本申请涉及一种对象推荐方法、装置、计算机设备和存储介质，该方法包括：获取根据用户行为确定的第一时间跨度内的长期行为序列和第二时间跨度内的短期行为序列；第一时间跨度大于第二时间跨度；根据长期行为序列得到长期兴趣向量；根据短期行为序列及短期行为序列的时序得到短期兴趣向量；根据长期兴趣向量和短期兴趣向量确定用户的长短期兴趣向量；基于长短期兴趣向量为用户确定推荐对象；向用户推荐确定的推荐对象。该方法使用户兴趣分析和推荐目标一致，均是确定推荐对象，基于二者目标的一致性，使确定的推荐对象直接反应了用户的长期稳定兴趣和短期变化的兴趣，符合用户的兴趣特征，提高了对象推荐的准确度。

Description

对象推荐方法、装置、计算机设备和存储介质

技术领域

本发明涉及互联网技术领域，特别是涉及一种对象推荐方法、装置、计算机设备和存储介质。

背景技术

随着互联网技术的快速发展，人们花费在互联网的时间越来越多，这就为基于互联网实现对象推荐提供了良好的基础。近几年来，推荐技术得到了长远发展，被广泛应用在新闻、视频、音乐、有声读物、电商等领域。

对象推荐是指基于互联网技术，向用户推荐用户可能喜欢的产品，增加用户的停留时长和点击转化率。大部分推荐问题都可以归纳为：根据用户、产品、上下文等特征，预测用户喜欢的产品，形成推荐列表。其中，对用户特征进行分析的一种方式是分析用户兴趣，即根据用户兴趣，预测用户喜欢的产品，形成推荐列表。

但传统的推荐技术，通常是预先对用户行为进行分析，将用户兴趣映射到用户画像上，再基于用户画像做推荐。由于推荐对象是根据用户画像确定的，在用户画像不准确的情况下，将影响对象推荐的准确度。

发明内容

基于此，有必要针对传统方法对象推荐准确度低的问题，提供一种对象推荐方法、装置、计算机设备和存储介质。

一种对象推荐方法，所述方法包括：

获取根据用户行为确定的第一时间跨度内的长期行为序列和第二时间跨度内的短期行为序列；所述第一时间跨度大于所述第二时间跨度；

根据所述长期行为序列得到长期兴趣向量；

根据所述短期行为序列及所述短期行为序列的时序得到短期兴趣向量；

根据所述长期兴趣向量和所述短期兴趣向量确定用户的长短期兴趣向量；

基于所述长短期兴趣向量为所述用户确定推荐对象；

向所述用户推荐确定的所述推荐对象。

一种对象推荐装置，所述装置包括：

行为序列获取模块，用于获取根据用户行为确定的第一时间跨度内的长期行为序列和第二时间跨度内的短期行为序列；所述第一时间跨度大于所述第二时间跨度；

长期兴趣向量提取模块，用于根据所述长期行为序列得到长期兴趣向量；

短期兴趣向量提取模块，用于根据所述短期行为序列及所述短期行为序列的时序得到短期兴趣向量；

融合模块，用于根据所述长期兴趣向量和所述短期兴趣向量确定用户的长短期兴趣向量；

预测模块，用于基于所述长短期兴趣向量为所述用户确定推荐对象；

推荐模块，用于向所述用户推荐确定的所述推荐对象。

一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行如上述各实施例任一项所述方法的步骤。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行上述各实施例任一项所述方法的步骤。

上述的对象推荐方法、装置、计算机设备和存储介质，通过根据用户在较长的第一时间跨度内的长期行为序列得到长期兴趣向量，根据用户在较短的第二时间跨度内的短期行为序列以及短期行为序列的时序得到短期兴趣向量，根据长期兴趣向量和短期兴趣向量得到长短期兴趣向量，并根据长短期兴趣向量为用户确定推荐对象，从而，用户在较长时间的用户行为是长期稳定兴趣的体现，用户在较短时间的用户行为是在这段时间的短期兴趣及变化的体现，通过综合长期兴趣和短期兴趣，将长短期兴趣向量提取作为对象推荐的一环，推荐对象根据用户的长短期兴趣向量直接确定，这就使用户兴趣分析和推荐目标一致，均是确定推荐对象，基于二者目标的一致性，使确定的推荐对象直接反应了用户的长期稳定兴趣和短期变化的兴趣，符合用户的兴趣特征，提高了对象推荐的准确度。

附图说明

图1为一个实施例中对象推荐方法的应用场景图；

图2为一个实施例中对象推荐方法的流程示意图；

图3为一个实施例中根据交互行为更新长期行为序列和短期行为序列的过程示意图；

图4为一个实施例中利用推荐模型确定推荐对象的步骤的流程图；

图5为一个实施例中推荐***的结构示意图；

图6为一个实施例中对象推荐模型的训练过程的流程图；

图7为一个实施例中对象推荐装置的结构框图；

图8为一个实施例中计算机设备的框图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互***、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

机器学习(Machine Learning,ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。

随着人工智能技术研究和进步，人工智能技术在多个领域展开研究和应用，例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等，相信随着技术的发展，人工智能技术将在更多的领域得到应用，并发挥越来越重要的价值。

本申请实施例提供的方案涉及人工智能的机器学习等技术，具体通过如下实施例进行说明:

图1为一个实施例的对象推荐***，包括用户终端110以及服务器130。用户终端110与服务器130网络连接。通过用户终端110，用户进行操作访问互联网，与应用产品进行交互，如查看新闻，听音乐，观看视频等，因交互而产生用户行为数据。用户终端110向服务器130上报用户行为数据。服务器130获取根据用户行为确定的第一时间跨度内的长期行为序列和第二时间跨度内的短期行为序列，第一时间跨度大于第二时间跨度，服务器130上根据长期行为序列得到长期兴趣向量，根据短期行为序列及短期行为序列的时序得到短期兴趣向量，根据长期兴趣向量和短期兴趣向量确定用户的长短期兴趣向量，基于长短期兴趣向量为用户确定推荐对象。其中，可以通过服务器上的推荐模型进行上述处理，得到推荐对象。服务器130将推荐对象发送至用户终端110。用户终端110接收推荐对象并展示。其中，对于不同的应用程序，推荐对象的实际产品不同。推荐对象具体可以为音乐列表，商品列表、视频列表和新闻列表等。

其中，用户终端110可以为多种类型的终端设备，比如智能可穿戴设备、便携式智能终端和台式电脑，便携式智能终端包括手机、平板电脑和笔记本电脑等中的至少一种。服务器130可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

图2为一个实施例的对象推荐方法的流程图，该对象推荐方法可执行于如图1所示的服务器130，如图2所示，该方法包括：

S202，获取根据用户行为确定的第一时间跨度内的长期行为序列和第二时间跨度内的短期行为序列，第一时间跨度大于第二时间跨度。

用户行为是指用户终端接收到的用户在应用程序的操作行为，尤其是对应用程序的产品，如对推荐产品列表的交互行为。不同的应用程序提供不同的产品，如音乐类应用程序，其对应的产品为歌曲。如视频类音乐程序，其对应的产品为视频。如新闻类应用程序，其对应的产品为新闻。用户行为就是用户对应用程序的产品交互的操作行为，如通过音乐类应用程序播放某一首歌曲，通过视频类应用程序播放某一段视频，通过新闻类应用程序，查看某一条新闻。

为获得较全面的用户行为数据，可以基于同一用户标识获取用户在不同应用程序的用户行为。如，获取同一注册手机号码在视频类应用、新闻类应用、社交类应用以及音乐类应用的全部用户行为。

基于对应用程序的产品的交互行为，产生用户行为数据，并上报至服务器。服务器根据用户行为数据确定长期行为序列和短期行为序列。其中，长期行为序列的时间跨度大于短期行为序列的时间跨度。

行为序列是一系列的行为信息，每一个行为信息代表一个用户行为。行为信息通过对行为数据进行处理，提取所需的参数得到，用于表征用户行为。一个实施例中，行为信息的格式为(用户名，交互产品，相关信息)。其中，相关信息可以根据需要进行设置提取，用于增加用为序列的信息量。相关信息如时间、终端品牌、设备和地点等。

长期行为序列的时间跨度大于短期行为序列的时间跨度。具体地，长期行为序列第一时间跨度内的用户一系列行为信息，长期行为序列的时间跨度很长，比如一个月、一年等等，一种实施方式中，长期行为序列包括了用户在一年内的行为信息。短期行为序列是第二时间跨度内的用户一系列行为信息，第一时间跨度大于第二时间跨度。具体地，第二时间跨度是第一时间跨度的一部分，短期行为序列是长期行为序列中最接近当前时间的一个小片段，比如一小时内、一天内的行为，一种实施方式中，短期行为序列包括了用户在一小时、半天或一天内的行为信息。

S204，根据长期行为序列得到长期兴趣向量。

通常，用户的日常行为是其兴趣的体现。通过对日常行为的分析，能够把握用户的兴趣。用户兴趣包括了长期兴趣和短期兴趣，而用户的行为是用户长期兴趣和短期兴趣共同作用的结果。例如用户小明在早上心情愉悦的时候想听一首周杰伦的七里香。这个行为里蕴含了小明的长期兴趣(对周杰伦的喜爱)和短期兴趣(早上心情好，想听歌)。

具体地，长期兴趣是用户相对稳定的特征，跟时间和当前环境关系不大，比如用户性别、年龄、爱教育水平和认知水平等。如，一个年龄在15岁的女高中生，喜欢看她的偶像主演的电视剧，而年龄在35岁的企业男高管，更喜欢看财经新闻。这种兴趣差异反应了不同用户年龄、性别和受教育水平不同所带来的行为差异。

长期兴趣向量是根据长期行为序列确定的，在对长期行为序列的分析中确定的用户在长期行为所表现出来的兴趣的向量表示。可以认为，用户的长期行为反映了用户的长期兴趣。

S206，根据短期行为序列及短期行为序列的时序得到短期兴趣向量。

短期兴趣是用户随时间和当前环境变化的特征，反应了用户在较短的一个时间内的状态，比如，心率、注意力和心情等。如，用户小明上班犯困，通过外卖应用程序点了一杯奶茶。用户小明心情好，听了一首歌。这些不同的行为，是不同情绪导致的行为差异。

短期行为序列的时序是短期行为的发生时间或行为时间的先后顺序。由于短期兴趣是用户随时间变化的特征，与时间的关系密切，故而根据短期行为序列和短期行为序列的时序确定短期兴趣向量。短期兴趣向量是在对短期行为序列的分析中确定的用户在短期行为所表现出来的兴趣的向量表示。可以认为，用户的短期行为反应了用户的短期兴趣。

S208，根据长期兴趣向量和短期兴趣向量确定用户的长短期兴趣向量。

长短期兴趣向量是指根据长期兴趣向量和短期兴趣向量得到的，综合了用户的长期兴趣和短期兴趣。其中，长短期兴趣向量可以通过拼接长期兴趣向量和短期兴趣向量得到，或是对长期兴趣向量和短期兴趣向量加权平均得到。

S210，基于长短期兴趣向量为用户确定推荐对象。

具体地，将长短期兴趣向量作为推荐***的一环，直接用于确定推荐对象，使用户兴趣分析和推荐目标一致，均是确定推荐对象，推荐对象直接根据用户的长短期兴趣向量确定。

推荐对象是根据用户的长短期兴趣向量，预测的用户未来可能交互的产品列表。比如，推荐对象是用户可能喜欢的歌曲列表，用户可能购买的商品列表，用户可能观看的新闻列表等。对象推荐的确定可以看成分类问题，如，给定一个产品类别，预测用户是否喜欢。对象推荐的确定还可以看成排序问题，如给定用户可能喜欢的产品列表，对列表里的产品进行排序。对象推荐的确定还可以看成是序列推荐问题，如，按照先后顺序生成用户可能喜欢的产品列表。

S212，向用户推荐确定的推荐对象。

具体地，对象推荐可应用于不同的场景，可以是在用户启动相关用户程序时，将确定的推荐对象，如歌曲列表、新闻列表或商品列表推送至用户终端。

上述的对象推荐方法，通过根据用户在较长的第一时间跨度内的长期行为序列得到长期兴趣向量，根据用户在较短的第二时间跨度内的短期行为序列以及短期行为序列的时序得到短期兴趣向量，根据长期兴趣向量和短期兴趣向量得到长短期兴趣向量，并根据长短期兴趣向量为用户确定推荐对象，从而，用户在较长时间的用户行为是长期稳定兴趣的体现，用户在较短时间的用户行为是在这段时间的短期兴趣及变化的体现，通过综合长期兴趣和短期兴趣，将长短期兴趣向量提取作为对象的一环，推荐对象根据用户的长短期兴趣向量直接确定，这就使用户兴趣分析和推荐目标一致，均是确定推荐对象，基于二者目标的一致性，使确定的推荐对象直接反应了用户的长期稳定兴趣和短期变化的兴趣，符合用户的兴趣特征，提高了对象推荐的准确度。

一个实施例中，获取根据用户行为确定的第一时间跨度内的长期行为序列，包括：获取用户在第一时间跨度中的历史交互行为数据；对历交互行为数据进行提取处理，得到各交互行为数据的行为信息；去除各行为信息的时间因素，得到用户的长期行为序列。

具体地，第一时间跨度是一段较长时间，比如一个月，一年等等。用户在第一时间跨度中的历史交互行为数据，是指用户在第一时间跨度中，基于对应用程序的产品的交互行为，产生的用户交互行为数据。如通过音乐类应用程序播放某一首歌曲，通过视频类应用程序播放某一段视频，通过新闻类应用程序查看某一条新闻，通过购物类应用程序购买某一件商品等等。

在一个实施例中，所述对所述历交互行为数据进行提取处理，得到各所述交互行为数据的行为信息，包括：识别所述历史交互行为数据中的关键字段，从所述历史交互行为数据中提取用户标识、交互产品信息和行为相关信息；所述行为相关信息包括时间因素；根据所述用户标识、交互产品信息和行为相关信息，得到各交互行为数据的行为信息。

其中，用户标识是用户的身份识别，通过用户标识能够确定一个用户行为的实施者。通过用户标识，将同一用户的多个用户行为组成该用户的行为序列。

其中，用户标识可以为手机号码，通过用户标识，可以整合同一用户在不同应用程序的历史交互行为数据。

交互产品就是交互行为所作用的应用程序的产品，如视频类应用程序的视频名称，购物类应用程序的商品名称，新闻类应用程序的新闻标题等。

行为相关信息是指与一个行为相关的设置关注信息，可以根据所关注的信息设置进行设置，用于增加用为序列的信息量。行为相关信息如时间、终端品牌、设备和地点等。

用户标识、交互产品和行为相关信息分别是不同类别的信息元素，对于所需的信息元素，可以根据需要进行设置。通过对历史交互行为数据的关键字段进行识别，如识别关键字段“id”，提取用户标识。例如，识别关键字段“click item”提取交互产品信息，识别关键字段“time”提取行为相关信息中的时间信息。对于提取的用户标识、交互产品信息和行为相关信息，得到交互行为数据对应的统一格式的行为信息(用户标识，交互产品，相关信息)。

而长期兴趣与时间的关系不大，若加入时间因素则会破坏长期兴趣的特征表达，因此，长期行为序列去除了行为信息的时间因素。其中，时间因素可以为交互行为的行为时间，也可以为交互行的行为时间离当前时间点的时间间隔。

在另一个实施例中，获取根据用户行为确定的第二时间跨度内的短期行为序列，包括：从行为信息中提取与当前时间最近的第二时间跨度中的行为信息，得到短期行为序列，行为信息包括时间因素。

具体地，对于处理得到统一格式的行为信息，从行为信息中提取与当前时间最近的第二时间跨度中的行为信息，作为短期行为信息。其中，第二时间跨度是第一时间跨度中距离当前时间最近的一个时间片段，比如过去的一个小时，或是过去的一天。

用户的短期兴趣，时间是一个关键因素，越接近当前时间的用户行为，越能体现用户当前的兴趣。用户在一个较短时间内的行为变化，能够反应在这段时间内，用户的兴趣变化。因此时间是短期行为序列的一个关键因素。对于短期行为信息，保留其时间信息，用于表征时间相关性。时间信息可以为交互行为的行为时间，也可以为交互行的行为时间离当前时间点的时间间隔。

在一个实施例中，根据长期兴趣向量和短期兴趣向量确定用户的长短期兴趣向量，包括：融合长期兴趣向量和短期兴趣向量，得到用户的长短期兴趣向量。

其中，融合是指将长期兴趣向量X_long和短期兴趣向量X_short融合为一个向量表示。融合处理的方式很多，只要是将两个向量处理成一个向量的方法都可以，即f(X_long,X_short)＝X_mix。

一个实施例中，融合长期兴趣向量和短期兴趣向量，得到用户的长短期兴趣向量，包括：对长期兴趣向量和短期兴趣向量进行拼接处理，得到用户的长短期兴趣向量。

具体地，拼接处理是直接将长期兴趣向量和短期兴趣向量拼接成一个更大的向量，即，X_mix＝[X_long,X_short]。

一个实施例中，融合长期兴趣向量和短期兴趣向量，得到用户的长短期兴趣向量，包括：对长期兴趣向量和短期兴趣向量进行加权平均处理，得到用户的长短期兴趣向量。

其中，长期兴趣向量和短期兴趣向量的权重可以利用模型学***均处理具体为X_mix＝a*X_long+(1-a)*X_short，其中，权重a为推荐模型训练学习到的权重参数。

利用门控机制学***均处理的权重参数a，可以通过更复杂的门控机制(gate)然后再加权平均，即a＝g(W,X_long,X_short)。

g是一个函数，可以用来学到标量a，W是g的参数。因为a的大小在0～1之间，可以看成一个『门』来控制X_long和X_short的比例。

在另一个实施例中，对象推荐方法还包括：当获取到针对推荐对象的交互行为时，根据更新规则更新短期行为序列和长期行为序列。

在将推荐对象推荐至用户终端后，若用户针对推荐对象有交互操作，即点击了该推荐对象，该交互行为便是一个有效的交互行为，则根据更新规则更新短期行为序列和长期行为序列。

其中，针对推荐的交互操作，如，在音乐类应用程序，对于确定的推荐音乐列表，用户播放了其中的一首音乐。又如，在视频类应用程序，对于确定的推荐视频列表，用户播放了其中的一段视频。又如，在购物类应用程序，对于确定的推荐商品列表，用户点击浏览了其中一件商品。

具体地，更新规则具体是指更新时间规则。其中，由于长期兴趣和短期兴趣与时间的关系不同，长期行为序列和短期行为序列的更新时间规则也不同。具体地，长期兴趣不会轻易改变，则长期行为序列可以隔一段时间更新。如，长期行为序列的更新周期可以为一天，一个星期，则长期行为序列的更新时间可以为每天的零点，每周一的零点。在获取到针对推荐对象的交互行为时，当达到了长期行为序列的更新时间时，更新长期行为序列。

具体地，根据更新规则更新短期行为序列和长期行为序列，包括：识别交互行为的交互行为数据中的关键字段，从交互行为数据中提取用户标识、交互产品信息和行为相关信息；行为相关信息包括时间因素；根据用户标识、交互产品信息和行为相关信息，得到交互行为数据的行为信息；当达到长期行为序列的更新时间时，去除行为信息的时间因素，根据去除时间因素后的行为信息更新用户的长期行为序列；当达到短期行为序列的更新时间时，根据行为信息更新用户的短期行为序列。

其中，当用户针对推荐对象有交互行为时，对应产生新增交互行为数据。从新增交互行为数据提取用户标识、交互产品信息和行为相关信息，得到新增行为信息的方式，与前面实施例中从交互行为数据中提取得到行为信息的方式相同，此处不再赘述。处理后的行为信息格式与历史交互行为信息格式相同，如行为信息的格式为(用户标识，交互产品，行为相关信息)。

对新增交互行为数据的新增行为信息，去除新增行为信息的时间因素，得到新增长期行为，将新增长期行增加到长期行为序列中，更新长期行为序列。

用户的短期兴趣随时间和当前环境变化，与时间关系密切，因此，短期行为序列的更新周期较短。如短期行为序列的更新周期可以为一小时，一分钟，甚至发生在一次交互后，则短期行为序列的更新时间可以为每一个整点，每一分钟，每一次交互后。当达到短期行为序列的更新时间时，根据新增行为信息更新用户的短期行为序列。其中，新增为信息包括时间因素。

具体地，如图3所示，当用户打开应用程序时，显示推荐***确定的推荐对象列表，如一个推荐音乐列表。当用户与点击了其中一首歌曲播放时，如播放周杰伦的《听妈妈的话》，产生了与该行为对应的行为数据。用户终端110将行为数据上报至服务器，服务器对行为数据进行处理，处理成统一的行为信息格式，如(用户标识，交互产品，相关信息)。当达长期行为序列的更新时间时，如每周一的零点，则对行为信息去除时间因素后，增加到长期行为序列。当达到短期行为序列的更新时间时，如每个整点，将行为信息增加到短期行为序列。由此，更新了长期行为序列和短期行为序列。

在一个实施例中，如图4所示，利用推荐模型确定推荐对象的步骤，包括：

S402，将长期行为序列输入训练好的推荐模型的长期序列编码网络，得到用户的长期兴趣向量。

一个实施例的推荐模型的结构图如图5所示，包括长期序列编码模型502、短期序列编码模型504、向量融合模块506和预测模型508。推荐模型由这四个模块拼接组成。

其中，将长期行为序列输入推荐模型的长期序列编码模型502，得到用户的长期兴趣向量。长期行为序列反应用户的长期行为，是用户长期兴趣的体现，如前面提到的，用户的长期兴趣与时间无关，所以在将用户长期行为序列输入至长期序列编码模型502时，无需关心长期行为序列的输入顺序。

在一个实施例中，将长期行为序列随意打乱输入推荐模型的长期序列编码模型，得到用户的长期兴趣向量。由于用户的长期兴趣与时间关系不大，通过将长期行为序列随意打乱，输入至长期序列编码模型，能够避免长期序列编码模型学习出与顺序相关的信息，使得到的长期兴趣向量真实的表征用户的长期兴趣。

S404，将短期行为序列按行为时间依次输入推荐模型的短期序列编码模型，得到用户的短期兴趣向量。

短期行为序列反应用户的短期行为，是用户短期兴趣的体现。而用户的短期兴趣时，时间是一个关键因素，越接近当前时间的用户行为，越能体现用户当前的兴趣。用户在一个较短时间内的行为变化，能够反应在这段时间内，用户的兴趣变化。因此，短期行为序列在输入短期序列编码模型504时，需要按序输入。

其中，行为时间是指用户对应用程序的产品操作产生行为数据的时间。通过将短期行为序列t1、t2、t3……按行为时间依次输入短期序列编码模型，体现行为产生的先后顺序，从而在短期兴趣向量提取时，将行为时间作为一个因素，考虑了用户行为的先后顺序，提取符合短期行为特征的短期兴趣向量。其中，t1、t2、t3……，代表用户行为序列的时间戳，每个时间戳都对应一个用户行为。具体地，如图5所示，如按行为时间(dt1,dt2,dt3……)的顺序将短期行为序列依次输入到推荐模型的短期序列编码模型504。

长期序列编码模型和短期序列编码模型可采用任何一种能够对序列编码的模型结构实现，如RNN(RecurrentNeuralNetwork,循环神经网络)、LSTM(Long Short-TermMemory，长短期记忆网络)、CNN(Convolutional Neural Networks，卷积神经网络)、BERT(Bidirectional Encoder Representations from Transformers，基于Transformer的双向编码器表征)。其中，长期序列编码模型和短期序列编码模型的模型结构可以统一，如二者均采用卷积神经网络。长期序列编码模型和短期序列编码模型的模型结构也可以不统一，如长期序列编码模型采用卷积神经网络，短期序列编码模型采用长短期记忆网络。

对于二者采用相同的网络结构的情况，若长期序列编码模型和短期序列编码模型均采用卷积神经网络(CNN)，卷积神经网络是一个跟时间序列无关的模型，直接把输入当作一个整体。对于短期行为序列，要严格按照行为时间顺序排列好之后，再一起输入卷积神经网络结构的短期序列编码模型。而长期行为序列则可以随意输入，并可以进行随机打乱，在打乱后一起输入卷积神经网络结构的长期序列编码模型。

若长期序列编码模型和短期序列编码模型均采用长短期记忆网络(LSTM),长短期记忆网络是典型的时间序列相关的特征，每一步的输入对应一个时间序列上某个时间点的行为.对于短期行为序列，要严格按照顺序依次输入到长短期记忆网络结构的短期序列编码模型中。而长期行为序列则可以随意输入，并可以进行随机打乱，在打乱后一起输入长短期记忆网络结构的长期序列编码模型。

若长期序列编码模型和短期序列编码模型均采用基于Transformer的双向编码器表征(Bert),Bert与卷积神经经网络类似，并不是一个时间序列模型，但可以通过加入位置编码来告诉模型这个行为处在该序列中的位置。因此，短期行为序列输入Bert网络结构的短期序列编码模型时，要加入位置编码。长期行为序列则不需要。

为了更好地适应用户长期兴趣和短期兴趣的特点，一个实施例中，长期序列编码模型采用非时间序列模型结构；短期序列编码模型采用时间序列模型结构。其中，时间序列模型结构是指考虑了前后关系的模型结构。由于短期兴趣与时间关系密切，可将LSTM、bert等能有效建模时间序列的模型来作为短期编码模型的模型结构，以有效行为时间先后与短期兴趣的关系。非时间序列模型结构是指不考虑前后关系的模型结构，如可采用逻辑回归、SVM、fasttext、cnn等非时间序列模型来作为长期编码模型的模型结构。由于长期兴趣与时间关系不大，因此，可以不用考虑行为时间先后对长期兴趣的影响。

S406，融合长期兴趣向量和短期兴趣向量，得到用户的长短期兴趣向量。

对于通过长期序列编码模型得到的长期兴趣向量(记为X_long)和通过短期充列编码模型得到的短期兴趣向量(记为X_short)，通过推荐模型的向量融合模块506将这两个向量进行融合处理，融合成为一个向量，得到长短期兴趣向量(记为X_mix)。

其中，融合处理的方式很多，只要是将两个向量处理成一个向量的方法都可以，即f(X_long,X_short)＝X_mix。

一个实施例中，融合长期兴趣向量和短期兴趣向量，得到用户的长短期兴趣向量，包括：根据推荐模型训练得到的权重，对长期兴趣向量和短期兴趣向量进行加权平均处理，得到用户的长短期兴趣向量。

具体地，将权重作为推荐模型的模型参数，在推荐模型的训练过程中学***均处理具体为X_mix＝a*X_long+(1-a)*X_short，其中，权重a为推荐模型训练学习到的权重参数。

一个实施例中，融合长期兴趣向量和短期兴趣向量，得到用户的长短期兴趣向量，包括：利用门控机制学***均处理，得到用户的长短期兴趣向量。

具体地，加权平均处理的权重参数a，可以通过更复杂的门控机制(gate)然后再加权平均，即a＝g(W,X_long,X_short)。

S408，将长短期兴趣向量输入推荐模型的预测模型，为用户确定推荐对象。

具体地，将长短期兴趣向量输入推荐模型的预测模型508，通过预测模型508输出为用户确定的推荐对象。

其中，预测模型508是推荐***的最后一环，根据长短期兴趣向量，预测用户未来可能会交互的产品列表。比如，推荐对象是用户可能喜欢的歌曲列表，用户可能购买的商品列表，用户可能观看的新闻列表等。对象推荐的确定可以看成分类问题，如，给定一个产品类别，预测用户是否喜欢。对象推荐的确定还可以看成排序问题，如给定用户可能喜欢的产品列表，对列表里的产品进行排序。对象推荐的确定还可以看成是序列推荐问题，如，按照先后顺序生成用户可能喜欢的产品列表。其中，预测模型可采用深度神经网络，如DNN,AE,CNN等。

在另一个实施例中，对象推荐方法还包括对象推荐模型的训练过程。

具体地，如图6所示，对象推荐模型的训练过程包括以下步骤：

S602，获取根据用户行为确定的行为序列。

S604,从行为序列中抽取一个时间段的行为序列作为训练样本的标注推荐对象；从时间段之前的行为序列中获取用户的训练长期行为序列和训练短期行为序列，得到训练样本。

具体地，训练样本是用于训练推荐模型的样本数据。对于用户而言，其历史行为也是长短期兴趣共同作用的结果，可以将某段时间的用户交互产品，作为基于用户的历史行为(这一段时间之前)所确定的长短期兴趣确定的推荐对象且推荐成功的产品。

故而，本实施例中的训练样本可以抽取一个时间段的行为序列交互产品作为标注推荐对象。训练样本包括了训练长期行为序列和训练短期行为序列。其中，训练长期行为序列是该时间段之前的一个较长时间，如一年的行为数据，对于抽取的较长时间的行为序列，去除时间因素，得到训练长期行为序列。训练短期行为序列是该时间段之前的一个较短时间，如一周的行为数据，根据抽取的较短时间的行为序列，得到训练短期行为序列。将该时间段的行为序列的交互产品，如时间段为2019年/11月/26日零点至2019年/11月/26日24点的行为序列，将这段时间的行为序列的交互产品作为训练样本的标注推荐对象。将2019年/11月/26日之前一年内的行为序列作为长期行为序列，将2019年/11月/26日之前一周内的行为序列作为短期行为序列，从而得到训练样本。

本实施例中，从用户的历史行为中抽取用户的行为数据作为训练样本的标注数据，从而标注数据的获取无需人工干预，节省了大量人工。

S606，将训练长期行为序列输入推荐模型的长期序列编码模型，得到用户的训练长期兴趣向量。

训练过程中将长期行为序列输入长期序列编码模型的处理，与预测阶段的处理相同，不再赘述。

S608，将训练短期行为序列输入推荐模型的短期序列编码模型，得到用户的训练短期兴趣向量。

训练过程中将短期行为序列输入短期序列编码模型的处理，与预测阶段的处理相同，不再赘述。

S610，融合训练长期兴趣向量和训练短期兴趣向量，得到用户的训练长短期兴趣向量。

融合训练长期兴趣向量和训练短期兴趣向量，得到用户的训练长短期兴趣向量的处理过程，与预测过程的处理相同，不再赘述。

需要注意的是，对于融合方式为加权平均处理的推荐模型而言，在训练时，可以将长期兴趣向量和短期兴趣向量的权重作为模型参数进行训练。

S612，将训练长短期兴趣向量输入推荐模型的预测模型，为用户确定训练推荐对象。

根据训练长短期兴趣向量为用户确定训练推荐对象的过程，与预测阶段相同，不再赘述。

S614，根据训练推荐对象和标注推荐对象，训练推荐模型。

具体地，根据训练推荐对象和标注推荐对象的差异，进行反向传播，调整模型参数。当训练推荐对象和标注推荐对象接近时，或模型训练的迭代次数达到最大要求时，停止模型训练，得到推荐模型。

本实施例中，推荐模型的将长短期信息向量提取模型，向量融合模块以及预测模型整合成为一个大模型，模型的训练直接优化整个流程，统一长短期兴趣向量提取与对象推荐的目标，直接根据长短期兴趣向量确定推荐对象，从而，推荐对象直接反应了长期兴趣和短期兴趣，避免了目标不一致导致的对象推荐不准确的问题。

现在，结合具体案例对本申请的对象推荐方法进行详细说明。

该方法包括三个阶段，第一阶段为对象推荐模型，第二阶段为利用训练好的推荐模型进行对象推荐。第三阶段为根据对推荐对象的交互行为，更新长期行为序列和短期行为序列。

第一阶段：对象推荐模型。

一个实施例的推荐模型的结构图如图5所示，包括长期序列编码模型502、短期序列编码模型504、向量融合模块506和预测模型508。

训练过程，具体为：获取根据用户行为确定的行为序列，从行为序列中抽取一个时间段的行为序列作为训练样本的标注推荐对象；从时间段之前的行为序列中获取用户的训练长期行为序列和训练短期行为序列，得到训练样本，将训练长期行为序列输入推荐模型的长期序列编码模型502，得到用户的训练长期兴趣向量，将训练短期行为序列输入推荐模型的短期序列编码模型504，得到用户的训练短期兴趣向量，通过向量融合模块506融合训练长期兴趣向量和训练短期兴趣向量，得到用户的训练长短期兴趣向量，通过预测模块508根据训练长短期兴趣向量为用户确定训练推荐对象，根据训练推荐对象和标注推荐对象，训练推荐模型。

第二阶段：利用训练好的推荐模型进行对象推荐阶段。

具体地，预测过程包括以下步骤：获取根据用户行为确定的长期行为序列和短期行为序列，将长期行为序列输入推荐模型的长期序列编码模型502，得到用户的长期兴趣向量，将短期行为序列输入推荐模型的短期序列编码模型504，得到用户的短期兴趣向量，通过向量融合模块506融合长期兴趣向量和短期兴趣向量，得到用户的长短期兴趣向量，通过预测模块508根据长短期兴趣向量为用户确定推荐对象。

第三阶段：根据对推荐对象的交互行为，更新长期行为序列和短期行为序列。

当获取到针对推荐对象的交互行为时，根据更新规则更新短期行为序列和长期行为序列。具体地，一旦用户发生了交互，比如点击新闻、播放音乐、点击商品，则该交互行为便可以被添加到行为序列中，更新长期行为序列和短期行为序列，作为新的输入，输入到整个推荐***中，继续预测出用户接下来可能有交互的产品列表。实际使用中，长期行为序列可以隔一段时间更新(比如一天、一个星期)，因为用户的长期兴趣不会轻易改变，短期行为序列可以实时更新(比如一小时、一分钟，甚至用户发生一次交互后)。

本实施例的对象推荐方法，可以应用在当前任何一个推荐***，作为实时推荐。如音乐推荐、新闻推荐、视频推荐、商品推荐等等。

如图7所示，提供一种对象推荐装置，装置包括：

行为序列获取模块701，用于获取根据用户行为确定的第一时间跨度内的长期行为序列和第二时间跨度内的短期行为序列；第一时间跨度大于第二时间跨度。

长期兴趣向量提取模块702，用于根据长期行为序列得到长期兴趣向量。

短期兴趣向量提取模块703，用于根据短期行为序列及短期行为序列的时序得到短期兴趣向量。

融合模块704，用于根据长期兴趣向量和短期兴趣向量确定用户的长短期兴趣向量。

预测模块705，用于基于长短期兴趣向量为用户确定推荐对象。

推荐模块706，用于向用户推荐确定的推荐对象。

通过根据用户在较长的第一时间跨度内的长期行为序列得到长期兴趣向量，根据用户在较短的第二时间跨度内的短期行为序列以及短期行为序列的时序得到短期兴趣向量，根据长期兴趣向量和短期兴趣向量得到长短期兴趣向量，并根据长短期兴趣向量为用户确定推荐对象，从而，用户在较长时间的用户行为是长期稳定兴趣的体现，用户在较短时间的用户行为是在这段时间的短期兴趣及变化的体现，通过综合长期兴趣和短期兴趣，将长短期兴趣向量提取作为对象推荐的一环，推荐对象根据用户的长短期兴趣向量直接确定，这就使用户兴趣分析和推荐目标一致，均是确定推荐对象，基于二者目标的一致性，使确定的推荐对象直接反应了用户的长期稳定兴趣和短期变化的兴趣，符合用户的兴趣特征，提高了对象推荐的准确度。

在一个实施例中，行为序列获取模块包括：

行为数据获取模块，用于获取用户在第一时间跨度中的历史交互行为数据。

提取模块，用于对历交互行为数据进行提取处理，得到各交互行为数据的行为信息。

长期行为序列处理模块，用于去除各行为信息的时间因素，得到用户的长期行为序列。

在另一个实施例中，行为序列获取模块，还包括：

短期行为序列处理模块，用于从行为信息中提取与当前时间最近的第二时间跨度中的行为信息，得到短期行为序列，行为信息包括时间因素。

在另一个实施例中，提取模块，包括：

识别模块，用于识别历史交互行为数据中的关键字段，从历史交互行为数据中提取用户标识、交互产品信息和行为相关信息；行为相关信息包括时间因素。

行为处理模块，用于根据用户标识、交互产品信息和行为相关信息，得到各交互行为数据的行为信息。

在另一个实施例中，融合模块704，用于融合长期兴趣向量和短期兴趣向量，得到用户的长短期兴趣向量。

具体地，融合模块，用于对长期兴趣向量和短期兴趣向量进行拼接处理，得到用户的长短期兴趣向量。

具体地，融合模块，用于对长期兴趣向量和短期兴趣向量进行加权平均处理，得到用户的长短期兴趣向量。

在另一个实施例中，对象推荐装置还包括更新模块，用于当获取到针对推荐对象的交互行为时，根据更新规则更新短期行为序列和长期行为序列。

具体地，识别模块，还用于识别交互行为的交互行为数据中的关键字段，从交互行为数据中提取用户标识、交互产品信息和行为相关信息；行为相关信息包括时间因素。

行为处理模块，还用于根据用户标识、交互产品信息和行为相关信息，得到交互行为数据的行为信息。

长期行为序列处理模块，还用于当达到长期行为序列的更新时间时，去除行为信息的时间因素，根据去除时间因素后的行为信息更新用户的长期行为序列。

短期行为序列处理模块，还用于当达到短期行为序列的更新时间时，根据行为信息更新用户的短期行为序列。

在另一个实施例中，对象推荐装置还包括：

长期序列编码模块，用于将长期行为序列输入训练好的推荐模型的长期序列编码模型，得到用户的长期兴趣向量。

短期序列编码模块，用于将短期行为序列输入推荐模型的短期序列编码模型，得到用户的短期兴趣向量。

推荐对象预测模块，用于将长短期兴趣向量按行为时间依次输入推荐模型的预测模型，为用户确定推荐对象。

在一个实施例中，向量融合模块，根据推荐模型训练得到的权重，或利用门控机制学***均处理，得到用户的长短期兴趣向量。

在一个实施例中，对象推荐装置还包括训练数据处理模块和训练模块，其中：

训练数据处理模块，用于获取根据用户行为确定的行为序列；从行为序列中抽取一个时间段的行为序列作为训练样本的标注推荐对象；从时间段之前的行为序列中获取用户的训练长期行为序列和训练短期行为序列，得到训练样本。

长期序列编码模块，还用于将训练长期行为序列输入推荐模型的长期序列编码模型，得到用户的训练长期兴趣向量。

短期序列编码模块，还用于将训练短期行为序列输入推荐模型的短期序列编码模型，得到用户的训练短期兴趣向量。

向量融合模块，还用于融合训练长期兴趣向量和训练短期兴趣向量，得到用户的训练长短期兴趣向量。

预测模块，还用于将训练长短期兴趣向量输入推荐模型的预测模型，为用户确定训练推荐对象。

训练模块，用于根据训练推荐对象和标注推荐对象，训练推荐模型。

图8为一个实施例中计算机设备的框图。参照图8，该计算机设备可以图1中的服务器130。该计算机设备包括通过***总线连接的处理器、存储器和网络接口。其中，存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质可存储操作***和计算机程序。该计算机程序被执行时，可使得处理器执行一种对象推荐方法。该计算机设备的处理器用于提供计算和控制能力，支撑整个计算机设备的运行。该内存储器中可储存有计算机程序，该计算机程序被处理器执行时，可使得处理器执行一种对象推荐方法。计算机设备的网络接口用于进行网络通信。

本领域技术人员可以理解，图8中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，本申请提供的对象推荐装置可以实现为一种计算机程序的形式，计算机程序可在如图8所示的计算机设备上运行，计算机设备的非易失性存储介质可存储组成该对象推荐装置的各个程序模块。比如，图7所示的行为序列获取模块701、长期兴趣向量提取模块702以及短期兴趣向量提取模块703。各个程序模块所组成的计算机程序用于使该计算机设备执行本说明书中描述的本申请各个实施例的对象推荐方法中的步骤。

比如，计算机设备可以通过如图7所示的对象推荐装置中的行为序列获取模块701获取根据用户行为确定的长期行为序列和短期行为序列。计算机设备可以通过长期兴趣向量提取模块702根据长期行为序列得到长期兴趣向量。计算机设备可以通过短期兴趣向量提取模块703根据短期行为序列及短期行为序列的时序得到短期兴趣向量。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，存储器存储有计算机程序，计算机程序被处理器执行时，使得处理器执行上述对象推荐方法的步骤。此处对象推荐方法的步骤可以是上述各个实施例的对象推荐方法中的步骤。

在一个实施例中，提供了一种计算机可读存储介质，存储有计算机程序，计算机程序被处理器执行时，使得处理器执行上述对象推荐方法的步骤。此处对象推荐方法的步骤可以是上述各个实施例的对象推荐方法中的步骤。

需要说明的是，本申请各实施例中的“第一”和“第二”等仅用作区分，而并不用于大小、先后、从属等方面的限定。

应该理解的是，虽然本申请各实施例中的各个步骤并不是必然按照步骤标号指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，各实施例中至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一非易失性计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上所述实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。

Claims

1.一种对象推荐方法，所述方法包括：

根据所述长期行为序列得到长期兴趣向量；

基于所述长短期兴趣向量为所述用户确定推荐对象；

向所述用户推荐确定的所述推荐对象。

2.根据权利要求1所述的方法，其特征在于，获取根据用户行为确定的第一时间跨度内的长期行为序列，包括：

获取用户在第一时间跨度中的历史交互行为数据；

对所述历交互行为数据进行提取处理，得到各所述交互行为数据的行为信息；

去除各所述行为信息的时间因素，得到用户的长期行为序列。

3.根据权利要求2所述的方法，其特征在于，获取根据用户行为确定的第二时间跨度内的短期行为序列，包括：

从所述行为信息中提取与当前时间最近的第二时间跨度中的行为信息，得到短期行为序列，所述行为信息包括时间因素。

4.根据权利要求2所述的方法，其特征在于，所述对所述历交互行为数据进行提取处理，得到各所述交互行为数据的行为信息，包括：

识别所述历史交互行为数据中的关键字段，从所述历史交互行为数据中提取用户标识、交互产品信息和行为相关信息；所述行为相关信息包括时间因素；

根据所述用户标识、交互产品信息和行为相关信息，得到各交互行为数据的行为信息。

5.根据权利要求1所述的方法，其特征在于，所述根据所述长期兴趣向量和所述短期兴趣向量确定用户的长短期兴趣向量，包括：

融合所述长期兴趣向量和所述短期兴趣向量，得到用户的长短期兴趣向量。

6.根据权利要求5所述的方法，其特征在于，所述融合所述长期兴趣向量和所述短期兴趣向量，得到用户的长短期兴趣向量，包括：

对所述长期兴趣向量和所述短期兴趣向量进行拼接处理，得到用户的长短期兴趣向量。

7.根据权利要求5所述的方法，其特征在于，所述融合所述长期兴趣向量和所述短期兴趣向量，得到用户的长短期兴趣向量，包括：

对所述长期兴趣向量和所述短期兴趣向量进行加权平均处理，得到用户的长短期兴趣向量。

8.根据权利要求1所述的方法，其特征在于，所述方法还包括：

当获取到针对所述推荐对象的交互行为时，根据更新规则更新所述短期行为序列和所述长期行为序列。

9.根据权利要求8所述的方法，其特征在于，所述根据更新规则更新所述短期行为序列和所述长期行为序列，包括：

识别所述交互行为的交互行为数据中的关键字段，从所述交互行为数据中提取用户标识、交互产品信息和行为相关信息；所述行为相关信息包括时间因素；

根据所述用户标识、交互产品信息和行为相关信息，得到所述交互行为数据的行为信息；

当达到所述长期行为序列的更新时间时，去除所述行为信息的时间因素，根据去除时间因素后的所述行为信息更新用户的所述长期行为序列；

当达到所述短期行为序列的更新时间时，根据所述行为信息更新用户的所述短期行为序列。

10.根据权利要求1所述的方法，其特征在于，

根据所述长期行为序列得到长期兴趣向量，包括：将所述长期行为序列输入训练好的推荐模型的长期序列编码模型，得到用户的长期兴趣向量；

根据所述短期行为序列及所述短期行为序列的时序得到短期兴趣向量，包括：将所述短期行为序列按行为时间依次输入所述推荐模型的短期序列编码模型，得到用户的短期兴趣向量；

所述基于所述长短期兴趣向量为所述用户确定推荐对象，包括：将所述长短期兴趣向量输入所述推荐模型的预测模型，为所述用户确定推荐对象。

11.根据权利要求10所述的方法，其特征在于，所述根据所述长期兴趣向量和所述短期兴趣向量确定用户的长短期兴趣向量，包括：根据所述推荐模型训练得到的权重，或利用门控机制学***均处理，得到用户的长短期兴趣向量。

12.根据权利要求10所述的方法，其特征在于，所述方法还包括：

获取根据用户行为确定的行为序列；

从所述行为序列中抽取一个时间段的行为序列作为训练样本的标注推荐对象；从所述时间段之前的行为序列中获取用户的训练长期行为序列和训练短期行为序列，得到训练样本；

将所述训练长期行为序列输入推荐模型的长期序列编码模型，得到用户的训练长期兴趣向量；

将所述训练短期行为序列输入所述推荐模型的短期序列编码模型，得到用户的训练短期兴趣向量；

融合所述训练长期兴趣向量和训练所述短期兴趣向量，得到用户的训练长短期兴趣向量；

将所述训练长短期兴趣向量输入所述推荐模型的预测模型，为所述用户确定训练推荐对象；

根据所述训练推荐对象和所述标注推荐对象，训练所述推荐模型。

13.一种对象推荐装置，所述装置包括：

推荐模块，用于向所述用户推荐确定的所述推荐对象。

14.一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行如权利要求1至12中任一项所述方法的步骤。

15.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行如权利要求1至12中任一项所述方法的步骤。