CN117609605A

CN117609605A - 一种基于多模态知识图谱的兴趣点推荐方法及装置

Info

Publication number: CN117609605A
Application number: CN202311516368.9A
Authority: CN
Inventors: 陈晋鹏; 刘晓倩; 王永恒; 段曼妮; 金雄男
Original assignee: Beijing University of Posts and Telecommunications; Zhejiang Lab
Current assignee: Beijing University of Posts and Telecommunications; Zhejiang Lab
Priority date: 2023-11-13
Filing date: 2023-11-13
Publication date: 2024-02-27

Abstract

本说明书提供一种基于多模态知识图谱的兴趣点推荐方法及装置，获取用户已到达的各历史地点，根据各历史地点，获取与各历史地点关联的图文信息，以所述用户、所述用户已到达的各历史地点以及与各历史地点关联的图文信息为节点，以各节点之间的关系为边，构建多模态知识图谱，将所述多模态知识图谱输入到预测模型，通过所述预测模型提取所述多模态知识图谱中包含的各实体的特征，并通过所述预测模型基于所述各实体的特征，确定所述用户感兴趣的目标地点并推荐给用户。通过这种方法，在考虑用户和地点交互的时序信息的基础上，还考虑了对地点的描述性信息，能够高效、准确地为用户推荐可能感兴趣的地点。

Description

一种基于多模态知识图谱的兴趣点推荐方法及装置

技术领域

本说明书涉及计算机技术领域，尤其涉及一种基于多模态知识图谱的兴趣点推荐方法及装置。

背景技术

随着支持全球定位***(Global Positioning System，GPS)的移动设备的普及，人们通过基于位置的社交网络平台来确定出行目的地已十分常见，而准确的预测用户可能感兴趣的地点能够大大提升用户的软件使用体验。同时，海量用户时空数据的积累，也为对下一兴趣点推荐任务的研究提供了便利。

为此，如何更加准确的为用户推荐下一兴趣点成为一个亟待解决的问题。

发明内容

本说明书实施例提供一种基于多模态知识图谱的兴趣点推荐方法及装置，以部分解决上述现有技术存在的问题。

本说明书实施例采用下述技术方案：

本说明书提供的一种基于多模态知识图谱的兴趣点推荐方法，所述方法包括：

获取用户已到达的各历史地点；

根据各历史地点，获取与各历史地点关联的图文信息；

以所述用户、所述用户已到达的各历史地点以及与各历史地点关联的图文信息为节点，以各节点之间的关系为边，构建多模态知识图谱；

将所述多模态知识图谱输入到预测模型，通过所述预测模型提取所述多模态知识图谱中包含的各实体的特征，并通过所述预测模型基于所述各实体的特征，确定所述用户感兴趣的目标地点；

将所述目标地点推荐给用户。

可选地，所述预测模型包括多模态特征提取网络、预测网络；

通过所述预测模型提取所述多模态知识图谱中包含的各实体的特征，具体包括：

通过多模态特征提取网络提取所述多模态知识图谱中包含的各实体的特征；

通过所述预测模型基于所述各实体的特征，确定所述用户感兴趣的目标地点，具体包括：

将所述多模态知识图谱中包含的各实体的特征输入预测网络，通过所述预测网络，确定各候选地点的预测得分，所述预测得分用于表征所述用户对各候选地点的最终感兴趣程度；

根据所述各候选地点的预测得分，在各候选地点中确定所述用户感兴趣的目标地点。

可选地，所述多模态特征提取网络包括：图特征提取子网络、文本特征提取子网络、图注意力子网络；

通过多模态特征提取网络提取所述多模态知识图谱中包含的各实体的特征，具体包括：

将所述多模态知识图谱中与各历史地点关联的图片输入到图特征提取子网络，获取所述图片的初始特征；

将所述多模态知识图谱中与各历史地点关联的文本信息输入到文本特征提取子网络，获取所述文本信息的初始特征；

将所述多模态知识图谱中除所述图片和文本信息外的其他实体特征进行初始化，获得所述其他实体的初始特征；

将所述图片的初始特征、文本信息的初始特征和其他实体的初始特征输入到图注意力子网络，获取所述用户的特征。

可选地，将所述图片的初始特征、文本信息的初始特征和其他实体的初始特征输入到图注意力子网络，获取所述用户的特征，具体包括：

针对所述用户，根据所述多模态知识图谱中各边的关系，通过图注意力子网络，确定与该用户通过边相连的各相邻实体的注意力权重；

根据所述注意力权重、所述用户的初始特征以及所述用户的各相邻实体的初始特征，确定该用户的特征。

可选地，将所述多模态知识图谱中包含的各实体的特征输入预测网络，具体包括：

确定各历史时间段；

针对每个历史时间段，确定所述用户在该历史时间段内到达的各历史地点；

根据所述用户在该历史时间段内到达的各历史地点，从所述多模态知识图谱中提取该历史时间段对应的多模态知识图谱子图；

将所述多模态知识图谱中包含的各实体的特征和各历史时间段分别对应的多模态知识图谱子图输入预测网络。

可选地，所述预测网络包括类别子网络和兴趣点子网络；

通过所述预测网络，确定各候选地点的预测得分，具体包括：

通过所述类别子网络，确定各候选类别的第一得分，所述第一得分用于表征所述用户对各候选类别的感兴趣程度；

通过所述兴趣点子网络，确定各候选地点的第二得分，所述第二得分用于表征所述用户对各候选地点的初始感兴趣程度；

根据所述第一得分和所述第二得分，确定所述各候选地点的预测得分。

可选地，所述类别子网络包括第一复制生成网络；

通过所述类别子网络，确定各候选类别的第一得分，具体包括：

确定各候选类别中所述用户已到达的各历史地点所属的类别，作为历史类别；

通过所述类别子网络中的复制子网，确定所述用户对各历史类别的感兴趣程度；以及，通过所述类别子网络中的生成子网，确定所述用户对每个候选类别的感兴趣程度；

针对每个候选类别，根据所述类别子网络中的复制子网确定的所述用户对该候选类别的感兴趣程度，以及所述类别子网络中的生成子网确定的所述用户对该候选类别的感兴趣程度，确定该候选类别的第一得分。

可选地，所述兴趣点子网络包括第二复制生成网络；

通过所述兴趣点子网络，确定各候选地点的第二得分，具体包括：

确定各候选地点中所述用户已到达的各历史地点，作为候选历史地点；

通过所述兴趣点子网络中的复制子网，确定所述用户对各候选历史地点的感兴趣程度；以及，通过所述兴趣点子网络中的生成子网，确定所述用户对每个候选地点的感兴趣程度；

针对每个候选地点，根据所述兴趣点子网络中的复制子网确定的所述用户对该候选地点的感兴趣程度，以及所述兴趣点子网络中的生成子网确定的所述用户对该候选地点的感兴趣程度，确定该候选地点的第二得分。

可选地，根据所述第一得分和所述第二得分，确定所述各候选地点的预测得分，具体包括：

针对每个候选地点，确定该候选地点所属的候选类别；

根据该候选地点的第二得分以及该候选地点所属的候选类别的第一得分，确定所述各候选地点的预测得分。

本说明书提供的一种基于多模态知识图谱的兴趣点推荐装置，所述装置包括：

第一获取模块，用于获取用户已到达的各历史地点；

第二获取模块，用于根据各历史地点，获取与各历史地点关联的图文信息；

构建模块，用于以所述用户、所述用户已到达的各历史地点以及与各历史地点关联的图文信息为节点，以各节点之间的关系为边，构建多模态知识图谱；

确定模块，用于将所述多模态知识图谱输入到预测模型，通过所述预测模型提取所述多模态知识图谱中包含的各实体的特征，并通过所述预测模型基于所述各实体的特征，确定所述用户感兴趣的目标地点；

推荐模块，用于将所述目标地点推荐给用户。

本说明书提供的一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述的基于多模态知识图谱的兴趣点推荐方法。

本说明书提供的一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述的基于多模态知识图谱的兴趣点推荐方法。

本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果：

本说明书实施例提供的一种基于多模态知识图谱的兴趣点推荐方法，获取用户已到达的各历史地点以及与各历史地点关联的图文信息，利用知识图谱强大的信息组织能力和知识表征能力，将用户和地点交互的时序信息、与地点相关联的图文信息组织成完整的多模态知识图谱，通过预测模型提取所述多模态知识图谱中包含的各实体的特征，并通过所述预测模型基于所述各实体的特征，确定所述用户感兴趣的目标地点并推荐给用户。通过这种方法，在考虑用户和地点交互的时序信息的基础上，还考虑了诸如图片和评论等对于地点的描述性信息，有效的提升了用户感兴趣地点的推荐性能，让基于位置的社交网络平台能够更加高效、准确地为用户推荐可能感兴趣的地点。

附图说明

此处所说明的附图用来提供对本说明书的进一步理解，构成本说明书的一部分，本说明书的示意性实施例及其说明用于解释本说明书，并不构成对本说明书的不当限定。在附图中：

图1是本说明书实施例提供的一种基于多模态知识图谱的兴趣点推荐方法的流程示意图；

图2是本说明书实施例提供的一种基于多模态知识图谱的兴趣点推荐方法的流程示意图；

图3是本说明书实施例提供的一种基于多模态知识图谱的兴趣点推荐方法的流程示意图；

图4是本说明书实施例提供的一种基于多模态知识图谱的兴趣点推荐方法的流程示意图；

图5为本说明书实施例提供的一种基于多模态知识图谱的兴趣点推荐装置的结构示意图；

图6为本说明书实施例提供的一种基于多模态知识图谱的兴趣点推荐方法的电子设备的结构示意图。

具体实施方式

为使本说明书的目的、技术方案和优点更加清楚，下面将结合本说明书具体实施例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本说明书一部分实施例，而不是全部的实施例。基于本说明书中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本说明书保护的范围。

以下结合附图，详细说明本说明书各实施例提供的技术方案。

图1为本说明书中一种基于多模态知识图谱的兴趣点推荐方法的流程示意图，具体可包括以下步骤：

S100：获取用户已到达的各历史地点。

在本申请实施例中，用户可能使用各种应用或者服务来获取推荐的出行目的地点，这些应用允许用户在特定地点进行签到或标记，以记录用户已经到达的历史地点。同时，这些平台通常还提供一些功能，如查看和编辑历史地点列表、与其他用户分享到达的地点、查看附近的热门地点等。所以为用户推荐感兴趣地点的可以是这些应用后台的服务器，以服务器为例，服务器可先获取用户已到达的各历史地点，通过分析用户到达过的历史地点数据，获取用户的实际行为和偏好，为用户提供准确的推荐结果，提升用户的社交互动体验。此外，也可以发现用户可能感兴趣但尚未去过的地点，丰富用户的选择。

S102：根据各历史地点，获取与各历史地点关联的图文信息。

具体的，上述有地点推荐功能的应用为海量的用户提供服务，所以服务器除记录所述用户历史到达地点外，还可以记录其他用户历史到达的地点，以及其他用户在达到所述历史地点后针对该地点发表的与地点相关的图文信息。所以，在获取到所述用户已经到达过的各历史地点后，可以根据这些历史地点，获取与这些历史地点相关联的图文信息。

S104：以所述用户、所述用户已到达的各历史地点以及与各历史地点关联的图文信息为节点，以各节点之间的关系为边，构建多模态知识图谱。

在获取地点和图文信息后，可以将用户、用户已到达的各历史地点以及与各历史地点关联的图文信息作为节点，以各节点之间的关系为边，构建多模态知识图谱。例如，对于上面提到的有地点推荐功能的应用，所述与地点关联的图文信息可以为用户在到达过某地点后针对该地点发表的图片和评论信息。

知识图谱是由一系列节点和边组成的拓扑图，节点表示实体或概念，边表示实体之间的关系。知识图谱的核心思想是将各种知识点连接起来，形成一个网络，使得知识之间的关系更加清晰和可见。而多模态知识图谱是在传统知识图谱的基础上，结合多种模态数据的知识图谱，多模态数据包括文本、图像、音频、视频等。传统的知识图谱主要基于单模态数据，但现实世界中的知识往往是多模态的，包含了丰富的视觉、声音和其他感知数据。多模态知识图谱通过将文本、图像、音频等不同模态的数据进行融合，能够提供更全面、准确和丰富的知识表示，促进不同模态数据之间的交互和融合，从而提升智能***的性能和用户体验，在推荐任务中也表现出了优秀的性能。

进一步的，在本申请构建的多模态知识图谱中，还可以有用户到达的各历史地点所属类别这一实体，连接各实体的边包含了实体之间的关系。具体的，连接用户和地点的边表示用户曾经到达过该地点，并包含了用户到达该地点的具体日期、时间段等信息，地点和评论之间的边表示该评论是针对该地点发表的，地点与图片之间的边表示该图片是针对该地点发表的，地点和类别之间的边表示所述地点属于与地点连接的类别。

进一步的，可以定义5种不同的知识图谱元组，用于表征多模态知识图谱中存在的实体与关系，具体定义如表1所示：

表1

S106：将所述多模态知识图谱输入到预测模型，通过所述预测模型提取所述多模态知识图谱中包含的各实体的特征，并通过所述预测模型基于所述各实体的特征，确定所述用户感兴趣的目标地点。

可以将多模态知识图谱输入到预测模型中，以提取其中包含的各实体的特征，并基于这些特征确定用户感兴趣的目标地点。首先，可确定历史时刻，根据所述历史时刻确定用户在所述历史时刻之前到达的各参考历史地点，以及与所述各参考历史地点相关的图文信息。根据所述用户、所述用户在所述历史时刻之前到达的各参考历史地点，以及与所述各参考历史地点相关的图文信息，构建多模态知识图谱，作为预测模型的样本，输入到预测模型中，得到用户可能感兴趣地点，将所述历史时刻后用户到达的参考历史地点作为用户实际感兴趣地点，即作为模型的标注，以用户可能感兴趣地点和用户实际感兴趣地点差异最小化为目标对模型进行训练。

S108：将所述目标地点推荐给用户。

通过预测模型确定用户感兴趣的目标地点后，需要将该目标地点推荐给用户，为用户的出行提供参考，准确的推荐给用户可能感兴趣地点不仅能提升用户的软件使用体验，还可以为用户节省考虑时间从而提高用户确定出行的目标地点的效率。

基于图1提供的一种基于多模态知识图谱的兴趣点推荐方法，获取用户已到达的各历史地点以及与各历史地点关联的图文信息，利用知识图谱强大的信息组织能力和知识表征能力，将用户和地点交互的时序信息、与地点相关联的图文信息组织成完整的多模态知识图谱，通过预测模型提取所述多模态知识图谱中包含的各实体的特征，并通过所述预测模型基于所述各实体的特征，确定所述用户感兴趣的目标地点并推荐给用户。通过这种方法，在考虑用户和地点交互的时序信息的基础上，还考虑了诸如图片和评论等对于地点的描述性信息，有效的提升了用户感兴趣地点的推荐性能，让基于位置的社交网络平台能够更加高效、准确地为用户推荐可能感兴趣的地点。

其中，步骤S106中所述预测模型包括多模态特征提取网络、预测网络。

具体的，本申请中用于预测用户感兴趣地点的预测模型可以分为两个子网络，包括多模态特征提取网络和预测网络。多模态特征提取网络用于对构建的多模态知识图谱中的各实体的特征进行提取，而预测网络基于各实体的特征来预测用户可能感兴趣的地点。

从而，上述图1所述的S106步骤，通过所述预测模型提取所述多模态知识图谱中包含的各实体的特征可具体为通过多模态特征提取网络提取所述多模态知识图谱中包含的各实体的特征；通过所述预测模型基于所述各实体的特征，确定所述用户感兴趣的目标地点可具体为，将所述多模态知识图谱中包含的各实体的特征输入预测网络，通过所述预测网络，确定各候选地点的预测得分，所述预测得分用于表征所述用户对各候选地点的最终感兴趣程度，根据所述各候选地点的预测得分，在各候选地点中确定所述用户感兴趣的目标地点，具体为如图2所示。

S1060：将所述多模态知识图谱输入到预测模型。

对于所述的用于预测用户感兴趣地点的预测模型而言，上述构建好的多模态知识图谱是预测模型的输入。

S1062：通过多模态特征提取网络提取所述多模态知识图谱中包含的各实体的特征。

具体的，针对输入的多模态知识图谱，需要对该多模态知识图谱中的各实体的特征进行提取，作为后续子网络模型的输入，例如，提取用户的特征，图谱中与用户已到达历史地点相关联的图文信息等实体的特征，将实体转化为向量表示。基于此，使用上述预测模型中的多模态特征提取网络提取多模态知识图谱中各个实体的特征。

S1064：将所述多模态知识图谱中包含的各实体的特征输入预测网络，通过所述预测网络，确定各候选地点的预测得分，所述预测得分用于表征所述用户对各候选地点的最终感兴趣程度。

将步骤S1062提取的各实体的特征，作为预测网络这一子网络的输入，通过这个预测网络，可以获取各个候选地点的预测得分。用户对候选地点的可能感兴趣程度越大，预测网络给出的预测得分就会更高，故这些预测得分可以用来表征用户对各个候选地点的最终感兴趣程度，得分较高的候选地点更符合用户的兴趣和偏好。

S1066：根据所述各候选地点的预测得分，在各候选地点中确定所述用户感兴趣的目标地点。

因为预测得分可以用来表征用户对各个候选地点的最终感兴趣程度，所以预测得分最高的候选地点即为确定的感兴趣的目标地点。

进一步的，上述步骤S1062，通过多模态特征提取网络提取所述多模态知识图谱中包含的各实体的特征，可具体为如图3所示。其中所述多模态特征提取网络包括：图特征提取子网络、文本特征提取子网络、图注意力子网络。通过多模态特征提取网络中的所述三个子网络，对多模态知识图谱中不同的实体的特征进行提取。

S10620：将所述多模态知识图谱中与各历史地点关联的图片输入到图特征提取子网络，获取所述图片的初始特征。

对于所述多模态知识图谱中与各历史地点关联的图片，通过图特征提取子网络对图片的初始特征进行提取，这些特征可以用于后续的分析和处理。这里提到的图特征提取子网络为预先训练好的图特征提取模型，例如，可以为视觉自注意力模型(VisionTransformer，ViT)，ViT是一种基于Transformer架构的图特征提取模型，通过将图像转换为序列数据，利用Transformer的自注意力机制来处理图像。在训练过程中，ViT使用大量的图像数据进行监督学习，通过最小化预测标签与真实标签之间的差距来优化模型参数。在训练完成后，ViT可以用于图像特征提取、图像分类、目标检测、图像生成等各种计算机视觉任务。具体的图特征提取模型类型本说明书不做限制。

S10622：将所述多模态知识图谱中与各历史地点关联的文本信息输入到文本特征提取子网络，获取所述文本信息的初始特征。

对于多模态知识图谱中与各历史地点关联的文本信息，例如评论，通过文本特征提取子网络对文本的初始特征进行提取，用于后续的处理。这里提到的文本特征提取子网络也为预先训练好的文本特征提取模型，例如，可以为S-Bert模型，S-BERT模型是使用Siamese BERT进行句子嵌入的模型，通过训练语义相似度任务来学习句子的语义表示。具体的本文特征提取模型类型本说明书不做限制。

S10624：将所述多模态知识图谱中除所述图片和文本信息外的其他实体特征进行初始化，获得所述其他实体的初始特征。

在多模态知识图谱中，除了图片和文本信息之外的其他实体的特征会被随机初始化为嵌入向量，以获得这些实体的初始特征。具体来说，多模态知识图谱除了包含上述文本信息和图片之外，还可能有其他特征，比如用户、用户已到达的历史地点等。为了在多模态知识图谱中对这些实体进行表示，需要将这些实体的特征转化为向量形式，这里提到的随机初始化嵌入是一种常见的方法，它会为所述其他实体中的各实体的特征随机生成一个初始向量，以便后续的模型训练和推理过程中使用。

值得注意的是，步骤S10620、S10622、S10624执行顺序不分先后，可以同时执行，也可以按照随机顺序进行执行，具体执行顺序本说明书不做限定。

S10626：将所述图片的初始特征、文本信息的初始特征和其他实体的初始特征输入到图注意力子网络，获取所述用户的特征。

需要注意的是，上述获得的图片的初始特征和文本信息的初始特征可能具有不同的维度，为了方便后续的处理和训练，可以先通过池化层将它们映射到相同的维度。这里提到的池化层可以对输入的特征进行降维或者升维，使得它们具有相同的维度，使得不同类型的特征在后续的模型训练中更容易进行融合和处理，同时也减少了维度不匹配可能带来的问题。

然后，通过上述步骤S10620～S10624获得各实体的初始特征后，将所述初始特征输入到图注意力子网络中，以获得用户的特征。具体来说，这里提到的图注意力子网络是一种具有注意力机制的图神经网络模型(Graph Attention Network，GAT)，该网络能通过自适应地学习节点之间的重要性，从而更好地捕捉图结构数据中的关系和特征信息。在这个模型中，图片的初始特征、文本信息的初始特征和其他实体的初始特征被作为输入，经过图注意力子网络的处理，将多模态知识图谱中的不同类型的信息融合起来，得到更全面和准确的用户特征，为后续的任务和应用提供更有效的输入。

进一步的，步骤S10626，将所述图片的初始特征、文本信息的初始特征和其他实体的初始特征输入到图注意力子网络，获取所述用户的特征，可具体为针对所述用户，根据所述多模态知识图谱中各边的关系，通过图注意力子网络，确定与该用户通过边相连的各相邻实体的注意力权重，根据所述注意力权重、所述用户的初始特征以及所述用户的各相邻实体的初始特征，确定该用户的特征。

具体的，GAT模型中的注意力机制可以根据构建的多模态知识图谱中实体之间的关系和相互作用，确定与用户通过边相连的各相邻实体的注意力分数，从而确定与该用户通过边相连的各相邻实体的注意力权重，该权重表示该相邻实体对于当前用户的重要性和关注程度，从而确定该用户的最终特征。

例如，对于构造的知识图谱评论实体的初始特征是通过预训练模型S-Bert提取得到的，图片实体的初始特征是通过预训练模型ViT提取得到的，而其他实体的初始特征随机初始化得到的。对于实体v_i的关于关系b的邻居结点定义为v_j，v_j对于v_i的注意力得分如下计算：

其中e_i,e_j是实体v_i,v_j的初始特征，[·||·]表示级联运算，是共享权重矩阵，/>是权重向量。

然后对关系b下的分数进行归一化，以获得归一化后的注意力分数：

其中表示关系b下的v_j实体对于v_i实体的归一化分数。因此，关系b下实体v_i的嵌入可以如下计算：

由于存在多种关系，因此实体v_i的最终特征可以如下计算：

其中σ表示sigmod函数，Sigmoid函数也称为Logistic函数，是一种常用的非线性激活函数，可以将输入的实数值映射到一个介于0和1之间的值。

进一步的，步骤S1064中，将所述多模态知识图谱中包含的各实体的特征输入预测网络，可具体为确定各历史时间段，针对每个历史时间段，确定所述用户在该历史时间段内到达的各历史地点，根据所述用户在该历史时间段内到达的各历史地点，从所述多模态知识图谱中提取该历史时间段对应的多模态知识图谱子图，将所述多模态知识图谱中包含的各实体的特征和各历史时间段分别对应的多模态知识图谱子图输入预测网络。

具体的，除了将通过预测模型中的多模态特征提取网络提取的用户的特征作为预测网络的输入外，还需将由构建的多模态知识图谱提取出的多个多模态知识图谱子图作为输入，输入到预测网络中。这里提到的多模态知识图谱子图是根据图谱中用户和地点之间的边包含的用户历史到达各个地点的历史时间段信息进行提取的，每个多模态知识图谱子图包含了用户在同一历史时间段到达过的地点以及与所述地点相关联的图文信息。

进一步的，步骤S1064中提到的预测网络包括类别子网络和兴趣点子网络，通过所述预测网络，确定各候选地点的预测得分，可具体为如图4所示。

S10640：通过所述类别子网络，确定各候选类别的第一得分，所述第一得分用于表征所述用户对各候选类别的感兴趣程度。

将用户可能感兴趣地点所属的类别，作为候选类别，通过类别子网络模型，在输入上述用户的特征和多模态知识图谱子图后，可以获得各候选类别的预测分数，将该预测分数作为各候选类别的第一得分，用来表示所述用户对各候选类别的感兴趣程度，第一得分越高，说明用户对该候选类别感兴趣程度越大，对该候选类别所包含的地点感兴趣程度也越大。

S10642：通过所述兴趣点子网络，确定各候选地点的第二得分，所述第二得分用于表征所述用户对各候选地点的初始感兴趣程度。

与确定候选类别的第一得分过程类似，首先将用户可能感兴趣的目的地点作为候选地点，将所述用户的特征和多模态知识图谱子图输入到兴趣点子网络，可以获得各候选地点的预测分数，将该预测分数作为各候选地点的第二得分，用来表示所述用户对各候选地点的初始感兴趣程度。第二得分越高，说明当前用户对候选地点的感兴趣程度越大。

值得注意的是，步骤S10640和步骤S10642的执行顺序不分先后，可以先执行步骤S10640确定候选类别的第一得分，也可以先执行步骤S10642确定候选地点的第二得分，也可以同时执行，具体执行顺序本说明书不做限定。

S10644：根据所述第一得分和所述第二得分，确定所述各候选地点的预测得分。

具体的，可以将用于表征所述用户对各候选类别的感兴趣程度的候选类别的第一得分和用于表征所述用户对各候选地点的初始感兴趣程度的候选地点的第二得分相结合，以确定用于表征所述用户对各候选地点的最终感兴趣程度的所述候选地点的预测得分。

进一步的，步骤S10640中，所述类别子网络可包括第一复制生成网络。通过所述类别子网络，确定各候选类别的第一得分，可具体为确定各候选类别中所述用户已到达的各历史地点所属的类别，作为历史类别，通过所述类别子网络中的复制子网，确定所述用户对各历史类别的感兴趣程度；以及，通过所述类别子网络中的生成子网，确定所述用户对每个候选类别的感兴趣程度，针对每个候选类别，根据所述类别子网络中的复制子网确定的所述用户对该候选类别的感兴趣程度，以及所述类别子网络中的生成子网确定的所述用户对该候选类别的感兴趣程度，确定该候选类别的第一得分。

这里提到的复制生成网络是基于CyGNet模型的思想设计的，CyGNet模型是一种基于时间感知复制生成机制的时态知识图表示学习模型，有复制子网和生成子网两个子网络。其中，复制子网的目的是识别具有递归性的事实，并根据已知的历史事实进行复制，参考已发生事实，从而预测未来的事实。对于特定的历史词汇表，CyGNet将增加在历史词汇表中选择的对象实体的估计概率，预测的结果为历史词汇表中的实体。而生成子网则是从整个实体词汇表中预测实体，结果可能为整个实体词汇表中的任一实体，解决了复制网络仅根据历史事实进行预测具有局限性的问题。

基于此，可以将各候选类别中所述用户已到达的各历史地点所属的类别，作为历史类别，类别子网络中的复制子网通过重复复制用户历史类别来确定所述用户对各历史类别的感兴趣程度。而类别子网络中的生成子网根据所有候选类别来确定所述用户对各候选类别的感兴趣程度，从而解决复制子网仅根据历史类别预测的局限性。

具体的，从知识图谱预测的角度来看，可以将类别预测任务视为预测在多模态知识图谱元组中<u,r,c,d>的尾实体c。首先，我们为每天d_n定义知识图谱快照包含时间段d_n的所有元组。对于d_k+1天，我们累加快照/>从而构造词汇表/>因此标记了在d_k+1天之前用户u所有去过的类别。为了降低未访问类别的概率，给/>中未访问的类别分配一个小的负值，得到/>

对于类别子网络中的复制子网，复制子网首先生成索引向量v：

d_k+1＝d_k+d_u

v＝tanh(W_c[u||r||d_k+1]+b_c)

其中d_u＝d₁表示时间单元，而u,r,d_k+1分别表示用户特征、关系中包含的时间段、时间特征。W_c和b_c均为可训练参数。

接着，将索引向量v与相加，通过这种方式使未访问过的类别趋向于更低的值(接近于0)。并利用softmax函数计算历史签到类别的预测分数：

为了弥补复制子网仅根据历史类别预测的局限，我们利用生成子网从所有候选类别中进行预测，得到所有候选类别的预测分数：

g＝W_g[u||r||d_k+1]+b_g

其中W_g,b_g为可训练的参数。

针对每个候选类别，根据所述类别子网络中的复制子网确定的所述用户对该候选类别的感兴趣程度，以及所述类别子网络中的生成子网确定的所述用户对该候选类别的感兴趣程度，确定该候选类别的第一得分。即结合复制子网分数和生成子网分数/>可以确定候选类别的第一得分/>用于表征用户对各候选类别的感兴趣程度。

具体的，在确定候选类别的第一得分时，针对每个候选类别，可以根据复制子网确定的用户对各历史类别的感兴趣程度确定该候选类别的历史类别分数，根据生成子网确定的用户对各候选类别的感兴趣程度确定该候选类别的候选类别分数，根据所述历史类别分数和所述候选类别分数确定平均值，将所述平均值作为该候选类别的第一得分。也可以根据具体情况预先设置相应的权重，根据权重将该候选类别的历史类别分数和候选类别分数相结合，具体确定候选类别的第一得分的方法本说明书不做限制。

进一步的，步骤S10642中，通过所述兴趣点子网络，确定各候选地点的第二得分，可具体为确定各候选地点中所述用户已到达的各历史地点，作为候选历史地点，通过所述兴趣点子网络中的复制子网，确定所述用户对各候选历史地点的感兴趣程度；以及，通过所述兴趣点子网络中的生成子网，确定所述用户对每个候选地点的感兴趣程度，针对每个候选地点，根据所述兴趣点子网络中的复制子网确定的所述用户对该候选地点的感兴趣程度，以及所述兴趣点子网络中的生成子网确定的所述用户对该候选地点的感兴趣程度，确定该候选地点的第二得分。

具体的，与步骤S10640类似，所述兴趣点子网络包括第二复制生成网络，这里的复制生成网络构建方法与第一复制生成网络相同，可以将各候选地点中所述用户已到达的各历史地点，作为候选历史地点，兴趣点子网络中的复制子网通过重复复制用户历史候选地点确定所述用户对各候选历史地点的感兴趣程度。而兴趣点子网络中的生成子网根据所有候选地点确定所述用户对各候选地点的感兴趣程度。接着，针对每个候选地点，根据所述兴趣点子网络中的复制子网确定的该候选地点分数，以及所述兴趣点子网络中的生成子网确定的该候选地点分数，确定该候选地点的第二得分。在确定候选地点的第二得分时，针对每个候选地点，可以根据复制子网确定的所述用户对各候选历史地点的感兴趣程度确定历史地点分数，根据生成子网确定的所述用户对各候选地点的感兴趣程度确定候选地点分数，根据所述历史地点分数和候选地点分数确定平均值，将所述平均值作为该候选地点的第二得分。也可以根据具体情况预先设置相应的权重，根据权重将该候选地点的历史地点分数和候选地点分数相结合，具体确定候选地点的第二得分的方法本说明书不做限制。

进一步的，步骤S10644，根据所述第一得分和所述第二得分，确定所述各候选地点的预测得分。可具体为针对每个候选地点，确定该候选地点所属的候选类别，根据该候选地点的第二得分以及该候选地点所属的候选类别的第一得分，确定所述各候选地点的预测得分。

具体的，针对每个候选地点，在确定该候选地点所属的候选类别后，可以根据该候选地点的第二得分以及该候选地点所属的候选类别的第一得分，确定所述各候选地点的预测得分。具体计算方式可以如下所示：

其中，表示各候选地点的预测得分，/>表示候选地点的第二得分，/>表示候选地点所属的候选类别的第一得分，α为预先设置的权重因子。这只是给出的参考计算方法，具体计算方法本说明书不做限定。

另外，在确定候选类别的第一得分和候选地点的第二得分后，由于用户历史到达地点与地点所属类别关系密切，表现出类别规律性，在确定候选地点的预测得分时，可以利用类别对候选地点进行初步筛选，具体可以为，根据确定的通过类别子网络获得候选地点的第一得分，确定筛选候选类别，针对每个候选地点，判断该候选地点是否属于所述筛选候选类别，若是，则根据该候选地点所属类别的第一得分和该候选地点的第二得分确定该候选地点的预测得分；若不是，则该地点所属类别的第一得分设为固定值0，即，仅根据该候选地点的第二得分确定该候选地点的预测得分。

具体的，在通过类别子网络获得候选地点的第一得分后，可以对所述第一得分进行排序并选取得分最高的K个类别作为当前用户的筛选候选类别，这里筛选候选类别的个数可以根据具体情况进行设置，本说明书不做限定。针对每个候选地点，若该候选地点属于所述确定的筛选候选类别，则可以先确定该候选地点的第二得分，具体确定方式可以为上述提到的根据该侯选地点的所述历史地点分数和候选地点分数确定平均值，将所述平均值作为该候选地点的第二得分，接着，将该候选地点所属的候选类别的第一得分作为该候选地点的最终类别得分，再根据所述候选地点的第二得分和所述最终类别得分确定该候选地点的预测得分。若该候选地点不属于所述确定的筛选候选类别，则不再计算该候选地点的最终类别得分，仅根据该候选地点的第二得分确定该候选地点的预测得分。例如，可以将该候选地点的最终类别得分的值设为某一固定值0，具体如下所示：

以上为本说明书实施例提供的芯片控制方法，基于同样的思路，本说明书还提供了相应的装置、存储介质和电子设备。

图5为本说明书实施例提供的一种基于多模态知识图谱的兴趣点推荐装置的结构示意图，所述装置包括：

第一获取模块，用于获取用户已到达的各历史地点；

构建模块，用于以所述用户、用户已到达的各历史地点以及与各历史地点关联的图文信息为节点，以各节点之间的关系为边，构建多模态知识图谱；

推荐模块，用于将所述目标地点推荐给用户。

可选地，所述预测模型包括多模态特征提取网络、预测网络；所述确定模块506具体用于，通过多模态特征提取网络提取所述多模态知识图谱中包含的各实体的特征，将所述多模态知识图谱中包含的各实体的特征输入预测网络，通过所述预测网络，确定各候选地点的预测得分，所述预测得分用于表征所述用户对各候选地点的最终感兴趣程度，根据所述各候选地点的预测得分，在各候选地点中确定所述用户感兴趣的目标地点。

可选地，所述多模态特征提取网络包括：图特征提取子网络、文本特征提取子网络、图注意力子网络；所述确定模块506具体用于，将所述多模态知识图谱中与各历史地点关联的图片输入到图特征提取子网络，获取所述图片的初始特征，将所述多模态知识图谱中与各历史地点关联的文本信息输入到文本特征提取子网络，获取所述文本信息的初始特征，将所述多模态知识图谱中除所述图片和文本信息外的其他实体特征进行初始化，获得所述其他实体的初始特征，将所述图片的初始特征、文本信息的初始特征和其他实体的初始特征输入到图注意力子网络，获取所述用户的特征。

可选地，所述确定模块506具体用于，针对所述用户，根据所述多模态知识图谱中各边的关系，通过图注意力子网络，确定与该用户通过边相连的各相邻实体的注意力权重，根据所述注意力权重、所述用户的初始特征以及所述用户的各相邻实体的初始特征，确定该用户的特征。

可选地，所述确定模块506具体用于，确定各历史时间段，针对每个历史时间段，确定所述用户在该历史时间段内到达的各历史地点，根据所述用户在该历史时间段内到达的各历史地点，从所述多模态知识图谱中提取该历史时间段对应的多模态知识图谱子图，将所述多模态知识图谱中包含的各实体的特征和各历史时间段分别对应的多模态知识图谱子图输入预测网络。

可选地，所述确定模块506具体用于，通过所述类别子网络，确定各候选类别的第一得分，所述第一得分用于表征所述用户对各候选类别的感兴趣程度，通过所述兴趣点子网络，确定各候选地点的第二得分，所述第二得分用于表征所述用户对各候选地点的初始感兴趣程度，根据所述第一得分和所述第二得分，确定所述各候选地点的预测得分。

可选地，所述类别子网络包括第一复制生成网络；所述确定模块506具体用于，确定各候选类别中所述用户已到达的各历史地点所属的类别，作为历史类别；通过所述类别子网络中的复制子网，确定所述用户对各历史类别的感兴趣程度；以及，通过所述类别子网络中的生成子网，确定所述用户对每个候选类别的感兴趣程度；针对每个候选类别，根据所述类别子网络中的复制子网确定的所述用户对该候选类别的感兴趣程度，以及所述类别子网络中的生成子网确定的所述用户对该候选类别的感兴趣程度，确定该候选类别的第一得分。

可选地，所述兴趣点子网络包括第二复制生成网络；所述确定模块506具体用于，确定各候选地点中所述用户已到达的各历史地点，作为候选历史地点，通过所述兴趣点子网络中的复制子网，确定所述用户对各候选历史地点的感兴趣程度；以及，通过所述兴趣点子网络中的生成子网，确定所述用户对每个候选地点的感兴趣程度，针对每个候选地点，根据所述兴趣点子网络中的复制子网确定的所述用户对该候选地点的感兴趣程度，以及所述兴趣点子网络中的生成子网确定的所述用户对该候选地点的感兴趣程度，确定该候选地点的第二得分。

可选地，所述确定模块506具体用于，针对每个候选地点，确定该候选地点所属的候选类别，根据该候选地点的第二得分以及该候选地点所属的候选类别的第一得分，确定所述各候选地点的预测得分。

本说明书还提供了一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时可用于执行上述图1提供的基于多模态知识图谱的兴趣点推荐方法。

基于图1所示的基于多模态知识图谱的兴趣点推荐方法，本说明书实施例还提供了图6所示的电子设备的结构示意图。如图6，在硬件层面，该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器，当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，以实现上述图1所述的基于多模态知识图谱的兴趣点推荐方法。

当然，除了软件实现方式之外，本说明书并不排除其他实现方式，比如逻辑器件抑或软硬件结合的方式等等，也就是说以下处理流程的执行主体并不限定于各个逻辑单元，也可以是硬件或逻辑器件。

在20世纪90年代，对于一个技术的改进可以很明显地区分是硬件上的改进(例如，对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray，FPGA))就是这样一种集成电路，其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字***“集成”在一片PLD上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言(Hardware Description Language，HDL)，而HDL也并非仅有一种，而是有许多种，如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等，目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现，例如，控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程逻辑控制器和嵌入微控制器的形式，控制器的例子包括但不限于以下微控制器：ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320，存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的***、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白，本说明书的实施例可提供为方法、***、或计算机程序产品。因此，本说明书可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本说明书是参照根据本说明书实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本说明书的实施例可提供为方法、***或计算机程序产品。因此，本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于***实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本说明书的实施例而已，并不用于限制本说明书。对于本领域技术人员来说，本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本说明书的权利要求范围之内。

Claims

1.一种基于多模态知识图谱的兴趣点推荐方法，其特征在于，所述方法包括：

获取用户已到达的各历史地点；

根据各历史地点，获取与各历史地点关联的图文信息；

将所述目标地点推荐给用户。

2.如权利要求1所述的方法，其特征在于，所述预测模型包括多模态特征提取网络、预测网络；

3.如权利要求2所述的方法，其特征在于，所述多模态特征提取网络包括：图特征提取子网络、文本特征提取子网络、图注意力子网络；

4.如权利要求3所述的方法，其特征在于，将所述图片的初始特征、文本信息的初始特征和其他实体的初始特征输入到图注意力子网络，获取所述用户的特征，具体包括：

5.如权利要求2所述的方法，其特征在于，将所述多模态知识图谱中包含的各实体的特征输入预测网络，具体包括：

确定各历史时间段；

6.如权利要求2所述的方法，其特征在于，所述预测网络包括类别子网络和兴趣点子网络；

7.如权利要求6所述的方法，其特征在于，所述类别子网络包括第一复制生成网络；

8.如权利要求6所述的方法，其特征在于，所述兴趣点子网络包括第二复制生成网络；

9.如权利要求6所述的方法，其特征在于，根据所述第一得分和所述第二得分，确定所述各候选地点的预测得分，具体包括：

针对每个候选地点，确定该候选地点所属的候选类别；

10.一种装置，其特征在于，所述装置包括：

第一获取模块，用于获取用户已到达的各历史地点；

推荐模块，用于将所述目标地点推荐给用户。

11.一种计算机可读存储介质，其特征在于，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述权利要求1-9任一项所述的方法。

12.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现上述权利要求1-9任一项所述的方法。