CN114764470A

CN114764470A - 获取用户画像的方法、装置和设备及存储介质

Info

Publication number: CN114764470A
Application number: CN202110035190.0A
Authority: CN
Inventors: 缪畅宇
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2021-01-12
Filing date: 2021-01-12
Publication date: 2022-07-19

Abstract

本申请公开了一种获取用户画像的方法、装置和设备及存储介质，涉及计算机技术领域，用于获取用户相对于流媒体方面的表示向量，提高用户画像的全面性和准确性。该方法中可以根据目标用户和非目标用户的用户行为序列构建训练样本集合，并对差异度学习模型进行迭代训练，进而在模型收敛时学习到各个用户之间的差异，从而最终更新所得到的目标用户的表示向量则可以作为目标用户在流媒体方面的表示，使得用户画像的内容更为丰富，提升用户画像的全面性和准确性，为后续的流媒体对象推荐和用户分析奠定基础，进而提升用户推荐的精准性。

Description

获取用户画像的方法、装置和设备及存储介质

技术领域

本申请涉及计算机技术领域，尤其涉及人工智能(Artificial Intelligence，AI)技术领域，提供一种获取用户画像的方法、装置和设备及存储介质。

背景技术

用户画像，简言之，就是使用一个向量来表示一个用户或者一个用户的一种特征。在涉及音乐或者视频等流媒体对象的场景中，通常需要为用户进行流媒体对象推荐。以音乐为例，为了实现为用户准确进行音乐推荐常常需要使用到用户的表示，也就是用户画像，用户音乐方面的画像可以表达用户对于音乐的喜好，可以辅助为用户进行个性化的音乐推荐。除此之外，在用户群体划分以及分析等场景中也需要使用到用户画像，准确的用户画像是后续进行推荐以及用户分析等准确进行的前提，因此准确的用户画像也是十分必要的。

因此，如何提高用户画像的准确性是需要考虑的问题。

发明内容

本申请实施例提供一种获取用户画像的方法、装置和设备及存储介质，用于获取用户相对于流媒体方面的表示向量，提高用户画像的全面性和准确性。

一方面，提供一种获取用户画像的方法，所述方法包括：

获取目标用户和多个非目标用户的用户行为序列；其中，一个用户行为序列包括一个用户操作过的多个流媒体对象；

根据各个用户行为序列构建训练样本集合；其中，一个训练样本包括所述目标用户的用户行为序列中至少两个流媒体对象组成的第一对象集合，以及一个所述非目标用户的用户行为序列中至少两个流媒体对象组成的第二对象集合，且所述第一对象集合和所述第二对象集合存在交集；

根据所述训练样本集合对差异度学习模型进行迭代训练；其中，在每一次训练时，根据所述目标用户的用户表示向量，以及各个训练样本的第一对象集合与第二对象集合相应获得多个损失值，一个损失值用于表征所述目标用户与相应非目标用户之间的差异度，并根据所述多个损失值更新所述用户表示向量；

在根据所述多个损失值确定所述差异度学习模型收敛时，根据所述用户表示向量获得所述目标用户的用户画像。

一方面，提供一种流媒体对象推荐方法，所述方法包括：

通过上述方面所述的方法获取目标用户的用户表示向量；

根据所述目标用户的用户表示向量与各流媒体对象的对象表示向量的匹配结果，将匹配度大于设定的匹配度阈值的流媒体对象推荐给所述目标用户；或者，

将目标用户的用户表示向量与其他用户的用户表示向量进行相似匹配，确定相似度大于设定的相似度阈值的相似用户，将位于所述相似用户的用户行为序列中的流媒体对象推荐给所述目标用户。

一方面，提供一种获取用户画像的装置，所述装置包括：

用户序列获取单元，用于获取目标用户和多个非目标用户的用户行为序列；其中，一个用户行为序列包括一个用户操作过的多个流媒体对象；

训练样本构建单元，用于根据各个用户行为序列构建训练样本集合；其中，一个训练样本包括所述目标用户的用户行为序列中至少两个流媒体对象组成的第一对象集合，以及一个所述非目标用户的用户行为序列中至少两个流媒体对象组成的第二对象集合，且所述第一对象集合和所述第二对象集合存在交集；

训练单元，用于根据所述训练样本集合对差异度学习模型进行迭代训练；其中，在每一次训练时，根据所述目标用户的用户表示向量，以及各个训练样本的第一对象集合与第二对象集合相应获得多个损失值，一个损失值用于表征所述目标用户与相应非目标用户之间的差异度，并根据所述多个损失值更新所述用户表示向量；

画像单元，用于在根据所述多个损失值确定所述差异度学习模型收敛时，根据所述用户表示向量获得所述目标用户的用户画像。

可选的，所述第一对象集合由所述目标用户的用户行为序列中连续的至少两个流媒体对象组成，所述第二对象集合由所述非目标用户的用户行为序列中连续的至少两个流媒体对象组成。

可选的，每个训练样本中第一对象集合与第二对象集合的交集、所述第一对象集合与所述交集的差集以及所述第二对象集合与所述交集的差集组成一个三元组；

则所述训练单元，具体用于：

根据所述目标用户的用户表示向量以及各个训练样本各自对应的三元组，获得各个训练样本各自对应的三元组损失值。

可选的，所述训练单元，具体用于：

针对每个训练样本，根据所述用户表示向量以及所述每个训练样本中流媒体对象的对象表示向量，分别获得所述目标用户的用户行为序列包括所述第一对象集合的第一概率和包括所述第二对象集合的第二概率；

根据所述第一概率和所述第二概率得到所述每个训练样本的损失值，其中，损失值与所述第一概率呈正相关，与所述第二概率呈负相关。

可选的，所述第一对象集合包括第一流媒体对象和第二流媒体对象，所述第二对象集合包括所述第二流媒体对象和第三流媒体对象；

则所述训练单元，具体用于：

获取所述第一流媒体对象和所述第二流媒体对象相对于所述用户表示向量的第一关联度，以及获取所述第二流媒体对象和所述第三流媒体对象相对于所述用户表示向量的第二关联度；

根据所述第一关联度得到所述第一概率，以及根据所述第二关联度得到所述第二概率；其中，关联度值与概率值呈正相关。

可选的，所述差异度学习模型的收敛条件包括：

每个训练样本的损失值不小于设定的第一阈值；和/或，

所有训练样本的损失值之和不小于设定的第二阈值，所述第二阈值大于所述第一阈值。

可选的，所述装置还包括对象向量获取单元，用于：

分别根据各个流媒体对象的流媒体数据，获取每个流媒体对象的特征向量序列；

分别根据各个流媒体对象的特征向量序列进行向量编码，得到每个流媒体对象的对象表示向量。

可选的，所述对象向量获取单元，具体用于：

分别对各个音频的音频数据进行采样得到每个音频对应的音频频谱图；

其中，所述音频频谱图包括每个音频在时间上连续的多个时间片段的频率序列，一个时间片段的频率序列对应所述特征向量序列中的一个特征向量。

可选的，所述对象向量获取单元，具体用于：

针对每个音频，按照设定的时间间隔对所述每个音频的音频数据进行时域采样，得到所述每个音频在时域上的多个时间序列；

按照设定的时间片段长度对所述多个时间序列进行组合，得到多个时间序列组合；

针对每个时间序列组合，对所述每个时间序列组合进行时频转换后，按照设定的频率间隔对所述频域信号进行采样，得到所述每个时间序列组合对应的频率序列。

一方面，提供一种流媒体对象推荐装置，所述装置包括：

用户向量获取单元，用于通过如上述方面所述的方法获取目标用户的用户表示向量；

推荐单元，用于根据所述目标用户的用户表示向量与各流媒体对象的对象表示向量的匹配结果，将匹配度大于设定的匹配度阈值的流媒体对象推荐给所述目标用户；或者，将目标用户的用户表示向量与其他用户的用户表示向量进行相似匹配，确定相似度大于设定的相似度阈值的相似用户，将位于所述相似用户的用户行为序列中的流媒体对象推荐给所述目标用户。

一方面，提供一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述任一种方法的步骤。

一方面，提供一种计算机存储介质，其上存储有计算机程序指令，该计算机程序指令被处理器执行时实现上述任一种方法的步骤。

一方面，提供一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述任一种方法的步骤。

本申请实施例提供的获取用户画像的方法中，可以根据目标用户和非目标用户的用户行为序列构建训练样本集合，并对差异度学习模型进行迭代训练。其中，每一训练样本包括位于目标用户的用户行为序列的第一对象集合和位于非目标用户的用户行为序列的第二对象集合，可分别用于表征目标用户的喜好信息和非目标用户的喜好信息，进而在每一训练过程中，根据每个训练样本中所包括的目标对象的表示以及各个流媒体对象的表示，来得到表征目标用户和非目标用户之间差异度的损失值，进而根据损失值来更新目标用户的表示，通过上述的训练过程来学习各个用户之间的差异，从而最终更新所得到的目标用户的表示向量则可以作为目标用户在流媒体方面的表示，使得用户画像的内容更为丰富，提升用户画像的全面性和准确性。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本申请实施例提供的场景示意图；

图2为本申请实施例提供的另一场景示意图；

图3为本申请实施例提供的获取用户画像的方法的流程示意图；

图4为本申请实施例提供的基于triplet loss算法的差异度学习模型的模型架构；

图5为本申请实施例提供的差异度学习模型的训练流程示意图；

图6为本申请实施例提供的音频采样获取音频频谱图的流程示意图；

图7为本申请实施例提供的音频分解之后的频谱示意图；

图8为本申请实施例提供的获取用户画像的装置的一种结构示意图；

图9为本申请实施例提供的流媒体对象推荐装置的一种结构示意图；

图10为本申请实施例提供的计算机设备的一种结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚明白，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互任意组合。并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

为便于理解本申请实施例提供的技术方案，这里先对本申请实施例使用的一些关键名词进行解释：

流媒体对象：可以包括采用流媒体技术传输的对象，例如可以包括音频、视频或者图像等等。

用户行为序列：为用户的操作行为所针对的***作对象所构成的序列，以流媒体对象为音频为例，则用户行为序列可以为用户的历史播放过的多首音乐，比如用户历史播放过的音乐顺序依次为S1、S2、S3和S4，那么该用户的用户行为序列则可以为{S1，S2，S3，S4}。

目前，通常可以直接建模的方式获取用户画像，也就是说，通过对用户的基本信息以及历史数据等进行加工、提取以及表示，以得到用户画像。但是这种方式仅能够表征用户本身的基本信息，忽略了用户之间的差异，进而得到的用户标识向量表征的信息也是不全面的，继而在后续推荐时也就无法准确的进行推荐。

考虑到不同用户对于音乐等流媒体对象的爱好之间的差异实质上能够反映出用户之间的差异，并且在音乐推荐等场景中基于用户之间的差异也能够更准确的为用户进行个性化推荐。

鉴于此，本申请实施例提供一种获取用户画像的方法，在该方法中，可以根据目标用户和非目标用户的用户行为序列构建训练样本集合，并对差异度学习模型进行迭代训练。其中，每一训练样本包括位于目标用户的用户行为序列的第一对象集合和位于非目标用户的用户行为序列的第二对象集合，可分别用于表征目标用户的喜好信息和非目标用户的喜好信息，进而在每一训练过程中，根据每个训练样本中所包括的目标对象的表示以及各个流媒体对象的表示，来得到表征目标用户和非目标用户之间差异度的损失值，进而根据损失值来更新目标用户的表示，通过上述的训练过程来学习各个用户之间的差异，从而最终更新所得到的目标用户的表示向量则可以作为目标用户在流媒体方面的表示，使得用户画像的内容更为丰富，提升用户画像的全面性和准确性。

此外，本申请实施例利用三元组损失(triplet loss)的思想，最大化目标用户的第一对象集合与非目标用户的第二对象集合之间的差异性，从而使得能够更容易的区分目标用户与非目标用户，也就相当于学习目标用户与非目标用户之间的差异，进而学习得到的表示向量可以用于刻画目标用户的画像。

在介绍完本申请实施例的设计思想之后，下面对本申请实施例涉及的技术进行简单介绍。

人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互***、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

语音技术(Speech Technology)的关键技术有自动语音识别技术(ASR)和语音合成技术(TTS)以及声纹识别技术。让计算机能听、能看、能说、能感觉，是未来人机交互的发展方向，其中语音成为未来最被看好的人机交互方式之一。

机器学习(Machine Learning，ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。

本申请实施例提供的方案主要涉及属于人工智能领域下属的语音处理技术以及机器学习/深度学习等技术，具体通过后续的实施例进行说明。

下面，对本申请实施例的技术方案能够适用的应用场景做一些简单介绍，需要说明的是，以下介绍的应用场景仅用于说明本申请实施例而非限定。在具体实施过程中，可以根据实际需要灵活地应用本申请实施例提供的技术方案。

本申请实施例提供的方案可以适用于大多数需要在涉及流媒体对象的场景中获取用户画像以及用户分析或者个性化推荐场景中。

请参见图1所示，为本申请实施例能够适用的一种场景示意图，该场景中包括服务器101以及多个终端102。

服务器101可以包括一个或多个处理器1011、存储器1012以及与终端交互的I/O接口1013等。此外，服务器101还可以配置数据库1014，数据库1014可以用于存储学习得到的各用户的表示向量以及训练得到的模型参数等。其中，服务器101例如可以是音频或者视频等流媒体对象播放应用的后台服务器。

服务器101可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式***，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器，但并不局限于此。

其中，服务器101的存储器1012中可以存储本申请实施例提供的获取用户画像的方法的程序指令，这些程序指令被处理器1011执行时能够用以实现本申请实施例提供的获取用户画像的方法的步骤，以获取用户有关于流媒体对象方面的表示。此外，服务器101的存储器1012中还可以存储本申请实施例提供的流媒体对象推荐方法的程序指令，这些程序指令被处理器1011执行时能够用以实现本申请实施例提供的流媒体对象推荐方法的步骤，可以根据上述方法得到用户的表示向量为用户进行个性化的流媒体对象的推荐。

服务器101以及多个终端102之间可以通过一个或者多个网络103进行直接或间接的通信连接。该网络103可以是有线网络，也可以是无线网络，例如无线网络可以是移动蜂窝网络，或者可以是无线保真(Wireless-Fidelity，WIFI)网络，当然还可以是其他可能的网络，本申请实施例对此不做限制。

请参见图2所示，为本申请实施例提供的另一场景示意图，在该场景中，可以包括流媒体对象服务器201、数据库202、计算集群203、向量存储服务器204以及用户终端205。

流媒体对象服务器201可以为提供流媒体对象的服务器，例如可以为音频应用或者视频应用的应用服务器或者音频网站或者视频网站的网站服务器。

数据库202可以用于存储用户在对流媒体对象进行操作行为时产生的用户行为数据和流媒体对象的流媒体数据，在获取用户画像时，可以根据实际需求从数据库202中获取相应的用户行为数据和相应流媒体对象的流媒体数据。其中，数据库202可以采用结构化查询语言(Structured Query Language，SQL)数据库、基于HIVE的Hadoop分布式文件***(Hadoop Distributed File System/HIVE，HDFS/HIVE)或者键值(Key-Value，KV)非关系数据存储等多种数据存储方案。

计算集群203可以用于为用户的表示向量的获取过程提供计算资源。

向量存储服务器204可以用于存储获取的用户的表示向量，并可向流媒体对象服务器201提供向量查询和匹配等功能。在需要进行相似用户匹配时，流媒体对象服务器201可以给向量存储服务器204提供待匹配的用户，向量存储服务器204则可以根据该用户的表示向量进行向量匹配，并向流媒体对象服务器201返回匹配的相似用户。

或者，需要向用户推荐流媒体对象时，流媒体对象服务器201可以给向量存储服务器204提供待推荐的用户，向量存储服务器204则可以根据该用户的表示向量进行向量匹配，并向流媒体对象服务器201返回匹配的流媒体对象。用户终端205中可以安装与流媒体对象服务器201对应的应用，进而可以在该应用中查看到为其推荐的流媒体对象。

在实际应用中，上述的流媒体对象服务器201、数据库202、计算集群203、向量存储服务器204可以是相互不同的设备，也可以是部分或者全部设备通过相同的设备实现，例如，流媒体对象服务器201和向量存储服务器204可以是相同的设备。

此外，本申请实施例的技术方案还可以应用于车载场景中，例如车载音乐或者视频平台中的用户表示以及音乐或者视频推荐。

当然，本申请实施例提供的方法并不限用于图1或者图2所示的应用场景中，还可以用于其他可能的应用场景，本申请实施例并不进行限制。请参见图3，为本申请实施例提供的获取用户画像的方法的流程示意图，该方法可以通过图1中的服务器101或者图2所示的计算集群203来执行，该方法的流程介绍如下。

步骤301：获取目标用户和多个非目标用户的用户行为序列。

在获取一个用户的表示向量时，为了能够学习到该用户与其他所有用户的差异，因此可以先获取***中全量用户的用户行为序列，当然，在针对某些特定场景时，只需要涉及部分用户，那么也可以仅获取这些用户的用户行为序列，其中，一个用户行为序列包括一个用户操作过的多个流媒体对象。

由于各个用户中每一用户的用户画像过程类似，因此这里具体以一个用户为例进行介绍，其中，需要进行用户画像称为目标用户，对于目标用户的滑翔过程，上述各个用户中的其他用户则相对的为非目标用户。

用户对于流媒体对象的操作是能够反映出用户的喜好的，因此可以获取用户的操作行为数据，进而基于用户的操作行为数据来获取流媒体对象的表示向量。

具体的，在获取各个用户的操作行为数据之后，则可以基于每个用户的操作行为数据来获取每个用户的用户行为序列。例如，对于音乐而言，用户的操作行为可以为播放操作，那么可以获取各个用户的历史播放数据，从而整理得到各个用户的播放序列，例如用户A历史播放过的音乐顺序依次为S1、S2、S3和S4，那么该用户的用户行为序列则可以为{S1，S2，S3，S4}，用户B历史播放过的音乐顺序依次为S2、S5和S6，那么该用户的用户行为序列则可以为{S2，S5，S6}。

步骤302：根据各个用户行为序列构建训练样本集合。

本申请实施例中，在获取各个用户的用户行为序列之后，则可以获知各个用户的用户行为序列中所包括的流媒体对象，进而根据这些流媒体对象结合用户行为序列构建训练样本集合。

其中，一个训练样本包括目标用户的用户行为序列中至少两个流媒体对象组成的第一对象集合，以及一个非目标用户的用户行为序列中至少两个流媒体对象组成的第二对象集合，且第一对象集合和第二对象集合存在交集。

本申请实施例中，由于连续的对象操作更能够反映用户的喜好，因此，第一对象集合可以由目标用户的用户行为序列中连续的至少两个流媒体对象组成，第二对象集合可以由所述非目标用户的用户行为序列中连续的至少两个流媒体对象组成。以音乐为例，那么第一对象集合为用户u的连续播放过的多个音乐，而第二对象集合则为不同于用户u的其他用户的连续播放过的多个音乐。

在一种可能的实施方式中，第一对象集合可以包括位于目标用户的用户行为序列的第一流媒体对象S1和第二流媒体对象S2，第二对象集合包括位于非目标用户的用户行为序列的第二流媒体对象S2和第三流媒体对象S3。以音乐为例，S1和S2则为用户u的听歌序列的相邻音乐，而S2和S3为不同于用户u的其他用户的听歌序列的相邻音乐。

示例性的，针对目标用户的用户行为序列{S1，S2，S3，S4}，一个非目标用户的用户行为序列{S2，S5，S6}，那么可能的一个训练样本为{S2，S3，S5}，其中，{S2，S3}为第一对象集合，{S2，S5}为第二对象集合。

或者，按照另一训练样本构建的方式，针对目标用户的用户行为序列{S1，S2，S3，S4，S5}，一个非目标用户的用户行为序列{S2，S3，S4，S5，S6}，那么可能的一个训练样本为{S2，S3，S4，S5}，其中，{S2，S3，S4}为第一对象集合，{S3，S4，S5}为第二对象集合。

步骤303：根据所述训练样本集合对差异度学习模型进行迭代训练。

本申请实施例中，各个用户的初始用户表示向量的初始化可以是随机进行赋值，也可以是采用初始化算法来得到各个用户的初始用户表示向量，或者，也可以基于用户的基本信息进行特征提取来得到用户的初始用户表示向量，用户的基本信息可以包括用户的昵称、年龄、地域以及对于流媒体对象进行操作的历史数据等等。

通过训练样本集合以及目标用户的初始用户表示向量，来对差异度学习模型进行迭代训练，直至差异度学习模型达到收敛条件。其中，迭代训练包括多次训练过程，而每一次训练过程的数据处理均是类似的，因此，下面主要以一次训练过程为例进行介绍。

具体的，在每一次训练时，可以根据目标用户的用户表示向量，以及各个训练样本的第一对象集合与第二对象集合相应获得多个损失值，一个损失值用于表征目标用户与相应非目标用户之间的差异度，并根据多个损失值更新用户表示向量。

其中，任意能够基于两个存在交集的对象集合来计算损失值的算法都可以应用于本申请实施例中，一种可能的算法为triplet loss算法，那么每个训练样本中第一对象集合与第二对象集合的交集、第一对象集合与交集的差集以及第二对象集合与交集的差集可以组成一个三元组，进而可以根据目标用户的用户表示向量以及各个训练样本各自对应的三元组，获得各个训练样本各自对应的三元组损失值。其中，三元组中每一成员的表示可以通过该成员包括的流媒体对象的对象表示向量来得到，例如三元组的成员之一，第一对象集合与第二对象集合的交集，可以通过该交集内的流媒体对象的对象表示向量来表示。

下面以第一对象集合包括第一流媒体对象S1和第二流媒体对象S2，第二对象集合包括第二流媒体对象S2和第三流媒体对象S3为例，对triplet loss算法进行介绍。

参见图4所示，为基于triplet loss算法的差异度学习模型的模型架构。

具体的，利用triplet loss的思想可以对如图4所示的从左到右三个流媒体对象S1、S2和S3进行最大化间隔的分类，这三个流媒体对象中，S1和S2是目标用户u的用户行为序列中的相邻对象，S2和S3是非目标用户的用户行为序列中的相邻对象，即与目标用户u不同的其他用户的相邻对象。

如图5所示，为差异度学习模型的训练流程示意图。

步骤501：针对每个训练样本，根据目标用户的用户特征向量，分别预测目标用户的用户行为序列包括第一对象集合的第一概率和包括第二对象集合的第二概率。

本申请实施例中，差异度学习的目的在于学习各个用户之间的差异，而各个用户之间的差异是体现在用户的行为中的，比如用户A连续播放哪几首歌的可能性较大，用户B连续播放另外几首歌的概率较大，进而体现出用户A和用户B的差异性。因此，对于给定的目标用户，可以依据该目标用户的用户特征向量，来预测第一对象集合位于该目标用户的用户行为序列的第一概率，以及预测第二对象集合位于该目标用户的用户行为序列的第二概率。理论上来讲，因为第一对象集合是从目标用户的用户行为序列中提取的，因而对于第一概率的期望为越大越好，而第二对象集合是从非目标用户的用户行为序列提取的，因而对于第二概率的期望为越小越好，从而最大化的凸显出目标用户与非目标用户之间的差异性。

如图4所示，S1的特征向量序列通过差异度学习模型的向量编码(encoder)层进行向量编码后得到S1的对象特征向量h1，S2的特征向量序列通过向量编码层进行向量编码后得到S2的对象特征向量h2，依次类推。对于各个流媒体对象的对象特征向量的获取在后续会进行详细介绍，在此先不过多赘述。

Triplet loss的定义如下：

J＝max(0，f(h1，h2)-f(h2，h3)-δ)

其中，J为一个训练样本中的{S1，S2，S3}的损失值；f为一个映射函数，将多个向量映射到一个打分数值上，f(h1，h2)即是将S1和S2对应的对象特征向量h1和h2映射至一个打分数值，f(h2，h3)即是将S2和S3对应的对象特征向量h2和h3映射至另一个打分数值，该打分数值例如可以用于表征相似度、距离以及属于某一用户的行为的概率等；δ是一个小的正整数，也称之为间隔。

由于S1和S2是目标用户u的用户行为序列中的相邻对象，相对于目标用户u而言，{S1，S2}可以认为是能够表征目标用户u行为的正样本，而S2和S3是非目标用户的用户行为序列中的相邻对象，相对于目标用户u而言，{S2，S3}可以认为是目标用户u的负样本。J的目的，是使得{S1，S2}的正样本的打分数值，与{S2，S3}的负样本的打分数值之间的差值要大于δ，从而最大化正负样本的差异性。由于{S1，S2}是来自目标用户u，{S2，S3}是来自其他用户，所以最大化正负样本的差异，实质上等价于去学习出目标用户u和其他用户的差异，从而可以学习得到能够表征目标用户u与其他用户之间差异的表示向量，进而用来刻画目标用户u的画像。

在具体应用时，为了得到用户跟流媒体对象相关的表示，可以将初始化的目标用户u的初始用户表示向量hu与h1～h3一起输入到triplet loss中，从而上述公式可以变形为如下公式：

J＝max(0，f(h1，h2，hu))-f(h2，h3，hu)-δ)

其中，f(h1，h2，hu)为目标用户的用户行为序列包括第一对象集合的第一概率，f(h2，h3，hu)为目标用户的用户行为序列包括第二对象集合的第二概率。

本申请实施例中，引入hu之后，模型便可以知道这个triplet loss是目标用户u所独有的，比如两个用户u1和u2，即便他们有些样本是相同的，比如他们都先后播放过S1和S2，而未先后播放过S2和S3，但这两个用户总会有其他的样本是不同的，因而模型便可以根据hu的引入，来学习出u1和u2之间的差异性。

具体的，在获取第一概率和第二概率时，可以获取第一流媒体对象和第二流媒体对象相对于目标用户的用户特征向量的第一关联度，以及获取第二流媒体对象和第三流媒体对象相对于目标用户的用户特征向量的第二关联度，根据第一关联度得到第一对象集合的第一概率，以及根据第二关联度得到第二对象集合的第二概率；其中，关联度值与概率值呈正相关。也就是说，从目标用户的角度出发，来看待第一流媒体对象和第二流媒体对象之间的关联程度，以及第二流媒体对象和第三流媒体对象之间的关联程度，一般而言，相对目标用户而言的关联度越高，则一个流媒体对象集合位于该用户的用户行为序列的概率是越高的。

步骤502：根据第一概率和第二概率得到每个训练样本的损失值，其中，损失值与第一概率呈正相关，与第二概率呈负相关。

本申请实施例中，获取第一对象集合对应的第一概率和第二对象集合对应的第二概率之后，则可以根据第一概率和第二概率得到每个训练样本的损失值，其中，损失值与第一概率呈正相关，与第二概率呈负相关。

具体的，可以通过上述公式根据f(h1，h2，hu)和f(h2，h3，hu)计算得到损失值，损失值与第一概率和第二概率之间的差值有关。

步骤503：确定是否满足收敛条件。

在步骤503的确定结果为是时，即模型已满足收敛条件，结束训练。

步骤504：在步骤503的确定结果为否时，更新目标用户的用户特征向量，并跳转至步骤501。

通过上述的过程，则可以得到所有的训练样本对应的损失值，进而可以根据损失值判断差异度学习模型是否收敛，若已满足收敛条件，则结束迭代训练，若未满足收敛条件，则可以对目标用户的用户特征向量进行更新，进入下一次的训练流程。其中，目标用户的用户特征向量可以视为差异度学习模型的模型参数，跟随训练过程逐渐得以更新，当然，除了目标用户的用户特征向量之外，还可以包括其他的模型参数，在训练的过程中也会逐渐进行优化。

具体的，收敛条件可以包括以下条件中的一个或者多个：

(1)每个训练样本的损失值不小于设定的第一阈值。

(2)所有训练样本的损失值之和不小于设定的第二阈值，所述第二阈值大于所述第一阈值。

下面请继续参见图3。

步骤304：在差异度学习模型收敛时，根据所述用户表示向量获得所述目标用户的用户画像。

在差异度学习模型收敛时，也就是最大化目标用户与非目标用户之间的差异性时，模型便可以知道这个triplet loss是目标用户u所独有的，进而最终模型收敛时的目标用户的用户表示向量则可以作为目标用户在流媒体对象方面的表示，加入到u的画像中。

下面，对流媒体对象的对象特征向量的获取过程进行介绍，由于各个流媒体对象的对象特征向量的获取过程类似，因而下面以一个流媒体对象为例具体进行介绍。

在具体应用时，可以获取各个流媒体对象的流媒体数据，进而根据各个流媒体对象的流媒体数据，以获取每个流媒体对象的特征向量序列，该特征向量序列能够表达流媒体对象的自身的流媒体数据信息，进而根据流媒体对象的特征向量序列进行向量编码，得到每个流媒体对象的对象表示向量。

当流媒体对象为视频时，则可以根据各个视频的视频流数据获取对应的特征向量序列。

具体的，针对一个视频，可以根据将该视频的视频流数据在时间上划分为多个视频片段数据，进而针对各个视频片段数据进行特征提取，一个视频片段数据可以得到一个特征向量，从而得到由该视频的多个视频片段的特征向量组成的特征向量序列。其中，在进行特征提取时可以采用卷积神经网络(Convolutional Neural Networks，CNN)分别针对每个视频片段进行特征提取，也可以采用如长短期记忆网络(Long Short-Term Memory，LSTM)进行特征提取的同时，还能够提取得到各个视频片段之间的时间序列信息，提取的特征更为丰富。

当流媒体对象为音频时，则在获取音频的特征向量序列时，可以根据针对每一个音频的音频数据进行采样，以得到每一个音频对应的音频频谱图。其中，音频频谱图包括每个音频在时间上连续的多个时间片段的频率序列，一个时间片段的频率序列对应所述特征向量序列中的一个特征向量。

本申请实施例中，在获取音频的特征向量序列时，可以根据针对每一个音频的音频数据进行采样，以得到每一个音频对应的音频频谱图。其中，所述音频频谱图包括每个音频在时间上连续的多个时间片段的频率序列，一个时间片段的频率序列对应所述特征向量序列中的一个特征向量。

如图6所示，为音频采样获取音频频谱图的流程示意图。

S601：按照设定的时间间隔对每一音频的音频数据进行时域采样，得到每一音频在时域上的多个时间序列。

通常而言，音频信号有时域和频域这两种维度的表达，既可以表达为一个时间序列，也可以表达为一个频率序列，因此先对音频信号进行时间维度的采样，比如可以每隔0.1s采样一个音频信号，得到离散的时间序列T1～Tn，每个值代表音频在该采样点上的大小。

当然，在实际应用时，也可以先对频域进行采样，即实际操作中频域与时域调换，本申请实施例对此并不进行限制。

S602：按照设定的时间片段长度对多个时间序列进行组合，得到多个时间序列组合。

在得到离散的时间序列T1～Tn后，再按设定的时间段长度进行组合，比如时间段长度为3s采样间隔0.1s，那每组序列就包含了3s/0.1s＝30个值，比如T1～T30就是一组，命名为G1，T31～T60命名为G2，依次类推，最终得到多个时间序列组合G1～Gm。

S603：针对每一时间序列组合，对每一时间序列组合进行时频转换后，按照设定的频率间隔对频域信号进行采样，得到每一时间序列组合对应的频率序列。

针对每一时间序列组合Gi，对其进行做时频转换，例如可以采用快速傅立叶变换(fast Fourier transform，FFT)、梅尔频率倒谱系数(Mel Frequency CepstrumCoefficient，MFCC)、离散傅里叶变换(Discrete Fourier Transform，DFT)等算法，来得到每一时间序列组合Gi的频率信号，一个频率信号代表一组时间序列里面包含的不同频率的分布。

进而，按照设定的频率间隔对每一时间序列组合Gi的频率信号也进行采样，比如频率间隔可以为10hz，这样就得到一个离散的频率序列，假设频率的上下限是0～f，那么每个频率序列的个数是f/10，每个Gi都可以表示成这么多个频率序列，只不过区别在于不同Gi的同样频率的值大小不同，对应到音频上，即音频的某些部分低音很重，那这些Gi的低频值就很大，有些部分高音很高，那这些Gi的高频值很大。假设有n个Gi，m个频率，那就得到一个mxn的矩阵，该矩阵即为频谱图。参见图7所示，为一个音频分解之后的频谱示意图，其中，横轴为时间轴，划分时间段的间隔为1.75s左右，也就是每个Gi的时间片段长度为1.75s，竖轴为频率轴，表示每个时间片段对应的频率，频率的上下限值为110hz～3520hz，灰度值大小表征不同频率对应的值的大小。

综上所述，通过流媒体对象和用户行为，来为每位用户生成一个跟流媒体对象相关的画像，得到的画像作为用户基础画像的一部分，更精细地刻画用户喜好。

本申请实施例中，可以通过上述过程获取各个用户的表示向量，用户的表示向量可以用于流媒体对象推荐过程中。

具体的，需要向用户推荐流媒体对象时，可以针对待推荐的目标用户，将该目标用户的表示向量与各个流媒体对象的对象表示向量进行向量匹配，进而将匹配度大于设定的匹配度阈值的流媒体对象推荐给目标用户。

或者，还可以根据相似用户来进行流媒体对象推荐。具体的，可以将目标用户的用户表示向量与其他用户的用户表示向量进行相似匹配，确定相似度大于设定的相似度阈值的相似用户，进而将位于相似用户的用户行为序列中的流媒体对象推荐给目标用户。

请参见图8，基于同一发明构思，本申请实施例还提供了一种获取用户画像的装置80，该装置包括：

用户序列获取单元801，用于获取目标用户和多个非目标用户的用户行为序列；其中，一个用户行为序列包括一个用户操作过的多个流媒体对象；

训练样本构建单元802，用于根据各个用户行为序列构建训练样本集合；其中，一个训练样本包括目标用户的用户行为序列中至少两个流媒体对象组成的第一对象集合，以及一个非目标用户的用户行为序列中至少两个流媒体对象组成的第二对象集合，且第一对象集合和第二对象集合存在交集；

训练单元803，用于根据训练样本集合对差异度学习模型进行迭代训练；其中，在每一次训练时，根据目标用户的用户表示向量，以及各个训练样本的第一对象集合与第二对象集合相应获得多个损失值，一个损失值用于表征目标用户与相应非目标用户之间的差异度，并根据多个损失值更新用户表示向量；

画像单元804，用于在根据多个损失值确定差异度学习模型收敛时，根据用户表示向量获得目标用户的用户画像。

可选的，第一对象集合由目标用户的用户行为序列中连续的至少两个流媒体对象组成，第二对象集合由非目标用户的用户行为序列中连续的至少两个流媒体对象组成。

可选的，每个训练样本中第一对象集合与第二对象集合的交集、第一对象集合与交集的差集以及第二对象集合与交集的差集组成一个三元组；

则训练单元803，具体用于：

根据目标用户的用户表示向量以及各个训练样本各自对应的三元组，获得各个训练样本各自对应的三元组损失值。

可选的，训练单元803，具体用于：

针对每个训练样本，根据用户表示向量以及每个训练样本中流媒体对象的对象表示向量，分别获得目标用户的用户行为序列包括第一对象集合的第一概率和包括第二对象集合的第二概率；

根据第一概率和第二概率得到每个训练样本的损失值，其中，损失值与第一概率呈正相关，与第二概率呈负相关。

可选的，第一对象集合包括第一流媒体对象和第二流媒体对象，第二对象集合包括第二流媒体对象和第三流媒体对象；

则训练单元803，具体用于：

获取第一流媒体对象和第二流媒体对象相对于用户表示向量的第一关联度，以及获取第二流媒体对象和第三流媒体对象相对于用户表示向量的第二关联度；

根据第一关联度得到第一概率，以及根据第二关联度得到第二概率；其中，关联度值与概率值呈正相关。

可选的，差异度学习模型的收敛条件包括：

每个训练样本的损失值不小于设定的第一阈值；和/或，

所有训练样本的损失值之和不小于设定的第二阈值，第二阈值大于第一阈值。

可选的，该装置还包括对象向量获取单元805，用于：

可选的，对象向量获取单元805，具体用于：

其中，音频频谱图包括每个音频在时间上连续的多个时间片段的频率序列，一个时间片段的频率序列对应特征向量序列中的一个特征向量。

可选的，对象向量获取单元805，具体用于：

针对每个音频，按照设定的时间间隔对每个音频的音频数据进行时域采样，得到每个音频在时域上的多个时间序列；

按照设定的时间片段长度对多个时间序列进行组合，得到多个时间序列组合；

针对每个时间序列组合，对每个时间序列组合进行时频转换后，按照设定的频率间隔对频域信号进行采样，得到每个时间序列组合对应的频率序列。

该装置可以用于执行图3～图7所示的实施例中所示的方法，因此，对于该装置的各功能模块所能够实现的功能等可参考图3～图7所示的实施例的描述，不多赘述。

请参见图9，基于同一发明构思，本申请实施例还提供了一种流媒体对象推荐装置90，该装置包括：

用户向量获取单元901，用于通过上述获取用户画像的方法获取目标用户的用户表示向量；

推荐单元902，用于根据所述目标用户的用户表示向量与各流媒体对象的对象表示向量的匹配结果，将匹配度大于设定的匹配度阈值的流媒体对象推荐给所述目标用户；或者，将目标用户的用户表示向量与其他用户的用户表示向量进行相似匹配，确定相似度大于设定的相似度阈值的相似用户，将位于所述相似用户的用户行为序列中的流媒体对象推荐给所述目标用户。

该装置可以用于执行流媒体对象推荐过程的步骤，因此，对于该装置的各功能模块所能够实现的功能等可参考上述流媒体对象推荐过程的实施例的描述，不多赘述。

请参见图10，基于同一技术构思，本申请实施例还提供了一种计算机设备100，可以包括存储器1001和处理器1002。

所述存储器1001，用于存储处理器1002执行的计算机程序。存储器1001可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作***、至少一个功能所需的应用程序等；存储数据区可存储根据计算机设备的使用所创建的数据等。处理器1002，可以是一个中央处理单元(central processing unit，CPU)，或者为数字处理单元等等。本申请实施例中不限定上述存储器1001和处理器1002之间的具体连接介质。本申请实施例在图10中以存储器1001和处理器1002之间通过总线1003连接，总线1003在图10中以粗线表示，其它部件之间的连接方式，仅是进行示意性说明，并不引以为限。所述总线1003可以分为地址总线、数据总线、控制总线等。为便于表示，图10中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

存储器1001可以是易失性存储器(volatile memory)，例如随机存取存储器(random-access memory，RAM)；存储器1001也可以是非易失性存储器(non-volatilememory)，例如只读存储器，快闪存储器(flash memory)，硬盘(hard disk drive，HDD)或固态硬盘(solid-state drive，SSD)、或者存储器1001是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。存储器1001可以是上述存储器的组合。

处理器1002，用于调用所述存储器1001中存储的计算机程序时执行如图3～图7所示的实施例或者上述流媒体对象推荐过程的实施例中设备所执行的方法。

在一些可能的实施方式中，本申请提供的方法的各个方面还可以实现为一种程序产品的形式，其包括程序代码，当所述程序产品在计算机设备上运行时，所述程序代码用于使所述计算机设备执行本说明书上述描述的根据本申请各种示例性实施方式的方法中的步骤，例如，所述计算机设备可以执行如图3～图7所示的实施例上述流媒体对象推荐过程的实施例中设备所执行的方法。

所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

尽管已描述了本申请的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。

显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

Claims

1.一种获取用户画像的方法，其特征在于，所述方法包括：

2.如权利要求1所述的方法，其特征在于，所述第一对象集合由所述目标用户的用户行为序列中连续的至少两个流媒体对象组成，所述第二对象集合由所述非目标用户的用户行为序列中连续的至少两个流媒体对象组成。

3.如权利要求1所述的方法，其特征在于，每个训练样本中第一对象集合与第二对象集合的交集、所述第一对象集合与所述交集的差集以及所述第二对象集合与所述交集的差集组成一个三元组；

则根据所述目标用户的用户表示向量，以及各个训练样本的第一对象集合与第二对象集合相应获得多个损失值，包括：

4.如权利要求1所述的方法，其特征在于，根据所述目标用户的用户表示向量，以及各个训练样本的第一对象集合与第二对象集合相应获得多个损失值，包括：

5.如权利要求4所述的方法，其特征在于，所述第一对象集合包括第一流媒体对象和第二流媒体对象，所述第二对象集合包括所述第二流媒体对象和第三流媒体对象；

则针对每个训练样本，根据所述用户表示向量以及所述每个训练样本中流媒体对象的对象表示向量，分别获得所述目标用户的用户行为序列包括所述第一对象集合的第一概率和包括所述第二对象集合的第二概率，包括：

6.如权利要求1所述的方法，其特征在于，所述差异度学习模型的收敛条件包括：

每个训练样本的损失值不小于设定的第一阈值；和/或，

7.如权利要求1所述的方法，其特征在于，在根据所述训练样本集合对差异度学习模型进行迭代训练之前，所述方法还包括：

8.如权利要求7所述的方法，其特征在于，所述目标流媒体对象为音频，则所述分别根据各个流媒体对象的流媒体数据，获取每个流媒体对象的特征向量序列，包括：

9.如权利要求8所述的方法，其特征在于，分别对各个音频的音频数据进行采样得到每个音频对应的音频频谱图，包括：

10.一种获取用户画像的装置，其特征在于，所述装置包括：

确定单元，用于在根据所述多个损失值确定所述差异度学习模型收敛时，根据所述用户表示向量获得所述目标用户的用户画像。

11.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，

所述处理器执行所述计算机程序时实现权利要求1至9任一项所述方法的步骤。

12.一种计算机存储介质，其上存储有计算机程序指令，其特征在于，

该计算机程序指令被处理器执行时实现权利要求1至9任一项所述方法的步骤。