CN117593090A

CN117593090A - 基于多任务学习的图结构预测模型训练方法和相关装置

Info

Publication number: CN117593090A
Application number: CN202311651225.9A
Authority: CN
Inventors: 金沛璇
Original assignee: Agricultural Bank of China
Current assignee: Agricultural Bank of China
Priority date: 2023-12-04
Filing date: 2023-12-04
Publication date: 2024-02-23

Abstract

本申请公开了基于多任务学习的图结构预测模型训练方法和相关装置，可应用于人工智能领域。本申请可用于为客户推荐产品。获取邻接矩阵A以及特征向量矩阵Z，并输入至多任务学习网络模型，多任务学习网络模型中的链接预测模块可以得到预测邻接矩阵S，节点分类模块可以预测所有节点分别属于各个预设类型的预测概率；通过节点分类模块对应的第一损失函数以及链接预测模块对应的第二损失函数训练多任务学习网络模型，训练完毕后，将多任务学习网络模型与全连接层连接，以构建得到图结构预测模型；基于图结构预测模型输出的图结构为客户推荐产品。由于使用了多任务学习网路模型，所以得到的图结构比较准确，从而基于图结构为客户推荐产品比较准确。

Description

基于多任务学习的图结构预测模型训练方法和相关装置

技术领域

本申请涉及人工智能领域，更具体的说，是涉及基于多任务学习的图结构预测模型训练方法和相关装置。

背景技术

随着经济的快速发展，越来越多的客户期望在金融产品中进行投资；但是目前金融产品种类繁多，客户无法快速找到适合自己的金融产品，因此，向客户推荐金融产品的技术应运而生。

目前向客户推荐金融产品的方法是通过训练得到的机器学习模型向客户推荐金融产品。但是目前训练得到的机器学习模型不是很准确，导致向客户推荐的金融产品也不是很准确。

综上，如何训练得到比较准确的机器学习模型是本领域技术人员急需解决的技术问题。

发明内容

有鉴于此，本申请提供了一种基于多任务学习的图结构预测模型训练方法和相关装置。

为实现上述目的，本申请提供如下技术方案：

根据本公开实施例的第一方面，提供一种基于多任务学习的图结构预测模型训练方法，包括：

获取邻接矩阵A，所述邻接矩阵A中的每一元素为两个节点的关联值，所述两个节点中一个节点为客户或产品，另一个节点为客户或产品；若所述两个节点具有关联，所述两个节点的关联值为1，若所述两个节点不具有关联，所述两个节点的关联值为0；

获取所述邻接矩阵A涉及的所有节点的属性信息，以得到特征向量矩阵Z，所述特征向量矩阵Z中每一行向量为一个所述节点的属性信息的向量表示；

将所述邻接矩阵A以及所述特征向量矩阵Z输入至多任务学习网络模型的输入端，通过所述多任务学习网络模型的第一输出端输出所述所有节点分别属于各个预设类型的预测概率，以及通过所述多任务学习网络模型的第二输出端输出预测邻接矩阵S；

其中，所述多任务学习网络模型包括链接预测模块以及节点分类模块，所述节点分类模块的输出端为所述第一输出端，所述链接预测模块的输出端为第二输出端；

基于所述所有节点分别属于各个预设类型的预测概率与所述所有节点分别对应的标注节点类型，获得第一损失函数；

基于所述邻接矩阵A与所述预测邻接矩阵S，获得第二损失函数；

通过所述第一损失函数与所述第二损失函数训练所述多任务学习网络模型；

返回所述获取邻接矩阵A，直至迭代次数达到预设阈值，以得到训练完毕的所述多任务学习网络模型；

确定所述多任务学习网络模型的所述第一输出端和所述第二输出端与全连接层相连，以得到图结构预测模型；所述图结构预测模型的输出端为所述全连接层的输出端，所述图结构预测模型的输入端为所述多任务学习网络模型的输入端；所述图结构预测模型用于输出包含产品的属性信息和客户的属性信息作为节点的图结构，所述图结构中任意的两两节点具有边表征两两节点具有关联性，若两两节点之间无边表征两两节点不具有关联性。

根据本公开实施例的第二方面，提供一种基于多任务学习的图结构预测模型训练装置，包括：

第一获取模块，用于获取邻接矩阵A，所述邻接矩阵A中的每一元素为两个节点的关联值，所述两个节点中一个节点为客户或产品，另一个节点为客户或产品；若所述两个节点具有关联，所述两个节点的关联值为1，若所述两个节点不具有关联，所述两个节点的关联值为0；

第二获取模块，用于获取所述邻接矩阵A涉及的所有节点的属性信息，以得到特征向量矩阵Z，所述特征向量矩阵Z中每一行向量为一个所述节点的属性信息的向量表示；

第三获取模块，用于将所述邻接矩阵A以及所述特征向量矩阵Z输入至多任务学习网络模型的输入端，通过所述多任务学习网络模型的第一输出端输出所述所有节点分别属于各个预设类型的预测概率，以及通过所述多任务学习网络模型的第二输出端输出预测邻接矩阵S；

第四获取模块，用于基于所述所有节点分别属于各个预设类型的预测概率与所述所有节点分别对应的标注节点类型，获得第一损失函数；

第五获取模块，用于基于所述邻接矩阵A与所述预测邻接矩阵S，获得第二损失函数；

训练模块，用于通过所述第一损失函数与所述第二损失函数训练所述多任务学习网络模型；

触发模块，用于触发所述第一获取模块，直至迭代次数达到预设阈值，以得到训练完毕的所述多任务学习网络模型；

第一确定模块，用于确定所述多任务学习网络模型的所述第一输出端和所述第二输出端与全连接层相连，以得到图结构预测模型；所述图结构预测模型的输出端为所述全连接层的输出端，所述图结构预测模型的输入端为所述多任务学习网络模型的输入端；所述图结构预测模型用于输出包含产品的属性信息和客户的属性信息作为节点的图结构，所述图结构中任意的两两节点具有边表征两两节点具有关联性，若两两节点之间无边表征两两节点不具有关联性。

根据本公开实施例的第三方面，提供一种服务器，包括：

处理器；

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述指令，以实现如第一方面所述基于多任务学习的图结构预测模型训练方法。

根据本公开实施例的第四方面，提供一种计算机可读存储介质，当所述计算机可读存储介质中的指令由服务器的处理器执行时，使得服务器能够执行如第一方面所述基于多任务学习的图结构预测模型训练方法。

经由上述的技术方案可知，本申请提供了一种基于多任务学习的图结构预测模型训练方法，获取邻接矩阵A，邻接矩阵A中每一元素表征两两节点之间的关联关系；获取特征向量矩阵Z，特征向量矩阵Z中每一行向量为一个节点的属性信息的向量表示。将邻接矩阵A以及特征向量矩阵Z输入至多任务学习网络模型，多任务学习网络模型包括链接预测模块以及节点分类模块，链接预测模块可以预测节点和节点之间是否有边，即链接预测模块可以得到预测邻接矩阵S；节点分类模块可以预测所有节点分别属于各个预设类型的预测概率；可以基于所有节点分别属于各个预设类型的预测概率与所有节点分别对应的标注节点类型，获得第一损失函数；基于邻接矩阵A与预测邻接矩阵S，获得第二损失函数；通过第一损失函数与第二损失函数训练多任务学习网络模型，训练完毕后，确定多任务学习网络模型的第一输出端和第二输出端与全连接层相连，以得到图结构预测模型；可以通过图结构预测模型输出包含产品的属性信息和客户的属性信息作为节点的图结构，从而可以基于图结构预测模型输出的图结构为客户推荐产品。由于多任务学习网络模型包括链接预测模块以及节点分类模块，链接预测模块分析了节点和节点之间潜在的关联性，节点分类模块分析了节点的潜在的类型，所以得到的图结构预测模型输出的图结构比较准确，从而基于图结构预测模型输出的图结构为客户推荐产品比较准确。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1是根据一示例性实施例示出的一种硬件架构的示意图；

图2是根据一示例性实施例示出的一种基于多任务学习的图结构预测模型训练方法的流程图；

图3是根据一示例性实施例示出的一种邻接矩阵A的示意图；

图4是根据一示例性实施例示出的一种特征向量矩阵Z的示意图；

图5是根据一示例性实施例示出的一种多任务学习网络模型的结构示意图；

图6是根据一示例性实施例示出的与图5对应的一种多任务学习网络模型的另一种表示方式的示意图；

图7是根据一示例性实施例示出的一种基于多任务学习的图结构预测模型训练装置框图；

图8是根据一示例性实施例示出的一种用于服务器的装置的框图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

需要说明的是，本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)，均为经用户授权或者经过各方充分授权的信息和数据，且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。

本申请实施例提供了一种基于多任务学习的图结构预测模型训练方法及相关装置。在介绍本申请的技术方案之前，先对本申请涉及的硬件架构进行说明。

图1是根据一示例性实施例示出的一种硬件架构的示意图，该硬件架构包括但不限于：电子设备11和服务器12。

示例性的，电子设备11可以为客户手持的终端设备。示例性的，电子设备11运行有手机银行应用程序。客户可以通过自己持有的电子设备11获得适合自己的产品。

示例性的，电子设备11可以为任何一种可与用户通过键盘、触摸板、触摸屏、遥控器、语音交互或手写设备等一种或多种方式进行人机交互的电子产品，例如，手机、平板电脑、掌上电脑、个人计算机、可穿戴设备、智能电视等。

示例性的，服务器12可以为一台服务器，也可以是由多台服务器组成的服务器集群，或者，是一个云计算服务中心。

示例性的，服务器12可以为位于银行侧的服务器。

服务器12可以执行本申请实施例提供的基于多任务学习的图结构预测模型训练方法。

示例性的，客户可以通过电子设备11向服务器12发送产品推荐请求；服务器12可以通过训练完毕的图结构预测模型输出的目标图结构，得到适合客户的产品，从而将适合客户的产品推荐至电子设备11。

本领域技术人员应能理解上述电子设备和服务器仅为举例，其他现有的或今后可能出现的电子设备或服务器如可适用于本公开，也应包含在本公开保护范围以内，并在此以引用方式包含于此。

下面结合上述硬件架构对本申请实施例提供的基于多任务学习的图结构预测模型训练方法进行说明。

图2是根据一示例性实施例示出的一种基于多任务学习的图结构预测模型训练方法的流程图，如图2所示，基于多任务学习的图结构预测模型训练方法用于服务器12中，包括以下步骤S21至步骤S28。

步骤S21：获取邻接矩阵A。

所述邻接矩阵A中的每一元素为两个节点的关联值，所述两个节点中一个节点为客户或产品，另一个节点为客户或产品；若所述两个节点具有关联，所述两个节点的关联值为1，若所述两个节点不具有关联，所述两个节点的关联值为0。

下面举例对邻接矩阵A进行说明。

图3是根据一示例性实施例示出的一种邻接矩阵A的示意图。

假设邻接矩阵A涉及的所有节点包括M个客户以及Q个产品。那么，邻接矩阵A涉及的所有节点的总数目为M+Q。M为大于1的正整数，Q为大于1的正整数。

下面对两个节点的关联值进行说明。

若两个节点中一个节点为客户，另一个节点为产品，若客户购买过该产品或者客户浏览过该产品，则两个节点的关联值为1，否则为0。

若两个节点中一个节点为客户，另一个节点也为客户，若两个客户具有关联关系，比如，两个客户属于家人或同事，则两个节点的关联值为1，否则为0。

若两个节点中一个节点为产品，另一个节点也为产品，若两个产品被同一客户购买过的频次高于设定频次，或者两个产品属于同一风险等级，则两个节点的关联值为1，否则为0。

综上，可以基于已知的情况构建邻接矩阵A。

步骤S22：获取所述邻接矩阵A涉及的所有节点的属性信息，以得到特征向量矩阵Z，所述特征向量矩阵Z中每一行向量为一个所述节点的属性信息的向量表示。

示例性的，客户的属性信息包括但不限于：年龄、收入、消费***、购物习惯、婚姻状况、从众心理、子女个数、社交软件、常驻地址、民族信仰等属性特征。

示例性的，产品的属性信息包括但不限于：产品类型、风险等级、预期年收益率、期限、购买基数、产品的发行者、是否可以提前赎回等属性特征。

示例性的，产品类型包括但不限于：国债、金融债、央行票据、基金、债券、金融证券、外币理财产品。

可以理解的是，不同客户的属性信息包含的属性特征的数目相同；不同产品的属性信息包含的属性特征的数目相同，但是客户的属性信息中的属性特征的数目与产品的属性信息中属性特征的数目可能不同，可能相同。

若客户的属性信息中的属性特征的数目与产品的属性信息中属性特征的数目不同，则可以补特定标识，如“0”。

为了本领域技术人员更加理解特征向量矩阵Z，下面结合邻接矩阵A的例子进行说明。图4是根据一示例性实施例示出的一种特征向量矩阵Z的示意图。

假设邻接矩阵A涉及的所有节点包括M个客户以及Q个产品。那么，邻接矩阵A涉及的所有节点的总数目为M+Q，那么，特征向量矩阵Z具有M+Q个行向量。假设，产品的属性信息中的属性特征的数目小于客户的属性信息中属性特征的数目，则产品对应的行向量中相应位置补“0”。

客户e的属性信息包括：属性特征1e1、属性特征1e2、…属性特征1eF；其中，1≤e≤M，F为大于1的正整数；产品g的属性信息包括：属性特征2g1、属性特征2g2、…，其中，1≤g≤Q。

步骤S23：将所述邻接矩阵A以及所述特征向量矩阵Z输入至多任务学习网络模型的输入端，通过所述多任务学习网络模型的第一输出端输出所述所有节点分别属于各个预设类型的预测概率，以及通过所述多任务学习网络模型的第二输出端输出预测邻接矩阵S。

其中，所述多任务学习网络模型包括链接预测模块以及节点分类模块，所述节点分类模块的输出端为所述第一输出端，所述链接预测模块的输出端为第二输出端。

为了本领域技术人员更加理解多任务学习网络模型，下面举例对多任务学习网络模型的结构进行说明。

图5是根据一示例性实施例示出的一种多任务学习网络模型的结构示意图。该多任务学习网络模型包括：卷积神经网络模块41、共享特征提取模块42以及任务特定模块43。

示例性的，卷积神经网络模块41可以为GAT(Graph Attention Networks，图注意力神经网络)模块，或，GCN(Graph Convolutional Network，图神经网络)模块。

示例性的，共享特征提取模块可以包括神经网络模型、逻辑回归模型、线性回归模型、支持向量机(SVM)、Adaboost、XGboost、Transformer-Encoder模型、ARIMA(Autoregressive Integrated Moving Average Model，自回归综合移动平均模型)中任一种模型。

示例性的，神经网络模型可以为基于循环神经网络的模型、基于卷积神经网络的模型、基于Transformer-encoder的分类模型中的任一种。

其中，卷积神经网络模块41的输入端为多任务学习网络模型的输入端，卷积神经网络模块41的输出端与共享特征提取模块42的一端相连，共享特征提取模块42的另一端与任务特定模块43相连。

图6是根据一示例性实施例示出的与图5对应的一种多任务学习网络模型的另一种表示方式的示意图。

图6中的输入“Input graph”是由邻接矩阵A以及特征向量矩阵Z表征的图网络G。

示例性的，图6中在任务特定模块43与共享特征提取模块42之间，还有全连接层51。

示例性的，图5中在任务特定模块43与共享特征提取模块42之间，也可以有全连接层，也可以没有全连接层。

本申请实施例提供的图5和图6所示的模型为一种新的多任务网络表示学习(MTNRL)框架，通过共享节点的中间嵌入表示，同时执行包括节点分类和链接预测在内的多个任务。

其中，任务特定模块43包括链接预测模块以及节点分类模块。

其中，链接预测模块用于预测任意两个节点之间是否存在边。示例性的，链接预测模块可以通过相似度计算公式预测任意两个节点之间是否存在边，例如，两个节点的属性特征的相似度高于或等于预设值，确定两个节点有边，否则无边。

示例性的，相似度计算公式可以为余弦相似度计算公式。

其中，节点分类模块用于预测节点属于各个预设类型的概率。

可以理解的是，节点分类模块可以挖掘出客户的潜在分类和产品的潜在分类。例如，针对客户1，专家标注的标注节点类型不包括预设类型1，但是经过节点分类模块挖掘后，认为客户1也可以对应预设类型1。

示例性的，针对客户的预设类型包括但不限于：保守型类型、激进型类型；示例性的，针对产品的预设类型包括但不限于：长期类型、短期类型、高收益类型、低收益类型、低风险类型、高风险类型。

步骤S24：基于所述所有节点分别属于各个预设类型的预测概率与所述所有节点分别对应的标注节点类型，获得第一损失函数。

示例性的，第一损失函数L_NC为：

其中，V_L为具有所述标注节点类型的节点的集合，v表示任一节点v；C表示所述预设类型的总数目；y_v,k是节点v属于预设类型K的真实值，P_v,k是所述第一输出端输出的节点v属于预设类型K预测概率。

下面举例对步骤S24进行说明。假设预设类型的数目为3个，且分别为预设类型1、预设类型2和预设类型3；假设所有节点的总数目为2个，且分别为节点1和节点2。

假设节点1对应的标注节点类型为预设类型1和预设类型2；节点2对应的标注节点类型为预设类型3。那么，节点1属于预设类型1的真实值为1；节点1属于预设类型2的真实值为1；节点1属于预设类型3的真实值为0；节点2属于预设类型1的真实值为0；节点2属于预设类型2的真实值为0；节点2属于预设类型3的真实值为1。

假设多任务学习网络模型中的节点分类模块预测得到的节点1属于预设类型1的预测概率为概率11，预测得到的节点1属于预设类型2的预测概率为概率12，预测得到的节点1属于预设类型3的预测概率为概率13；预测得到的节点2属于预设类型1的预测概率为概率21，预测得到的节点2属于预设类型2的预测概率为概率22，预测得到的节点2属于预设类型3的预测概率为概率23。

步骤S25：基于所述邻接矩阵A与所述预测邻接矩阵S，获得第二损失函数。

示例性的，第二损失函数L_LP为：

其中，Ai,j为所述邻接矩阵A中的第i行，第j列的元素，S_i,j为所述预测邻接矩阵S中第i行，第j列的元素，n为所述所有节点的总数目。

步骤S26：通过所述第一损失函数与所述第二损失函数训练所述多任务学习网络模型。

示例性的，通过总体损失函数L＝L_NC+αL_LP，训练所述多任务学习网络模型，所述α为预设值。

步骤S27：返回步骤S21，直至迭代次数达到预设阈值，以得到训练完毕的所述多任务学习网络模型。

示例性的，预设阈值可以基于实际情况而定，这里不进行限定。

步骤S28：确定所述多任务学习网络模型的所述第一输出端和所述第二输出端与全连接层相连，以得到图结构预测模型。

所述图结构预测模型的输出端为所述全连接层的输出端，所述图结构预测模型的输入端为所述多任务学习网络模型的输入端；所述图结构预测模型用于输出包含产品的属性信息和客户的属性信息作为节点的图结构，所述图结构中任意的两两节点具有边表征两两节点具有关联性，若两两节点之间无边表征两两节点不具有关联性。

本申请实施还提供了以下方法，该方法包括以下步骤B11至步骤B14。

步骤B11：将待测邻接矩阵以及待测特征向量矩阵输入至所述图结构预测模型，通过所述图结构预测模型输出目标图结构。

其中，所述待测邻接矩阵中的每一元素为两个节点的所述关联值，所述待测特征向量矩阵中每一行向量为所述待测接矩阵涉及的一个节点的属性信息的向量表示。

针对待测邻接矩阵的描述可以参见针对邻接矩阵A的描述，这里不进行赘述。针对待测特征向量矩阵的描述可以参见针对特征向量矩阵Z的描述，这里不进行赘述。

步骤B12：获取待推荐产品的第一客户的属性信息。

示例性的，第一客户可以操作电子设备11，从而向服务器发送产品推荐请求，使得服务器12可以获得待推荐产品的第一客户的属性信息。

步骤B13：从所述目标图结构中获取属性信息与所述第一客户的属性信息相似度最高的第二客户。

步骤B14：确定所述目标图结构中与所述第二客户的属性特征具有边的产品为向所述第一客户推荐的产品。

本申请实施例提供了一种基于多任务学习的图结构预测模型训练方法，获取邻接矩阵A，邻接矩阵A中每一元素表征两两节点之间的关联关系；获取特征向量矩阵Z，特征向量矩阵Z中每一行向量为一个节点的属性信息的向量表示。将邻接矩阵A以及特征向量矩阵Z输入至多任务学习网络模型，多任务学习网络模型包括链接预测模块以及节点分类模块，链接预测模块可以预测节点和节点之间是否有边，即链接预测模块可以得到预测邻接矩阵S；节点分类模块可以预测所有节点分别属于各个预设类型的预测概率；可以基于所有节点分别属于各个预设类型的预测概率与所有节点分别对应的标注节点类型，获得第一损失函数；基于邻接矩阵A与预测邻接矩阵S，获得第二损失函数；通过第一损失函数与第二损失函数训练多任务学习网络模型，训练完毕后，确定多任务学习网络模型的第一输出端和第二输出端与全连接层相连，以得到图结构预测模型；可以通过图结构预测模型输出包含产品的属性信息和客户的属性信息作为节点的图结构，从而可以基于图结构预测模型输出的图结构为客户推荐产品。由于多任务学习网络模型包括链接预测模块以及节点分类模块，链接预测模块分析了节点和节点之间潜在的关联性，节点分类模块分析了节点的潜在的类型，所以得到的图结构预测模型输出的图结构比较准确，从而基于图结构预测模型输出的图结构为客户推荐产品比较准确。

本申请实施采用了多任务学习即链路预测模块以及节点分类模块，相比相关技术中单任务(即仅包括链路预测模块或节点分类模块)学习，效率更高、效果更好。下面给出实验结果：

表1：链路预测对比试验

AUC(Area Under Curve)被定义为ROC(receiver operating characteristiccurve，接受者操作特性曲线)曲线下与坐标轴围成的面积。

AP(average precision)值是recall-precision曲线下的面积。

模型输出的图结构的准确率，可以用AUC值和AP值表征。

Cora数据集、Citeseer数据集、Pubmed数据集均为现有技术中存在的数据集。

为了能够对比得到本申请的多任务学习网络模型的效果，申请人构建了模型1、模型2、模型3和模型4，其中，模型1、模型2、模型3和模型4中均包括：卷积神经网络模块、共享特征提取模块以及链路预测模块，但是不包括节点分类模块。模型1中的卷积神经网络模块为GAE(AutoEncoder,自编码器)；模型2中的卷积神经网络模块为VGAE(Variational GraphAuto-Encoders，变分图自编码器)；模型3中的卷积神经网络模块为LoNGAE(Localneighborhood graph autoencoder,局部邻域图自动编码器)；模型4中的卷积神经网络模块为GCN(Graph Convolutional Network，图积网络)。

通过表1可知，本申请的图结构预测模型得到的图结构比模型1、模型2、模型3和模型4得到的图结构的准确率都高。

表2：节点分类准确率对比试验

为了能够对比得到本申请的多任务学习网络模型的效果，申请人构建了模型5、模型6和模型7，其中，模型5、模型6和模型7中均包括：卷积神经网络模块、共享特征提取模块以及节点分类模块，但是不包括链路预测模块。模型5中的卷积神经网络模块为GAE(AutoEncoder,自编码器)；模型6中的卷积神经网络模块为αLoNGAE(αLocal neighborhoodgraph autoencoder，变体局部邻域图自动编码器)；模型7中的卷积神经网络模块为GAE。

通过表2可知，本申请的图结构预测模型得到的图结构比模型5、模型6和模型7得到的图结构的准确率都高。

上述本申请公开的实施例中详细描述了方法，对于本申请的方法可采用多种形式的装置实现，因此本申请还公开了一种装置，下面给出具体的实施例进行详细说明。

图7是根据一示例性实施例示出的一种基于多任务学习的图结构预测模型训练装置框图。参照图7，该装置包括：第一获取模块71、第二获取模块72、第三获取模块73、第四获取模块74、第五获取模块75、训练模块76、触发模块77，以及第一确定模块78，其中：

第一获取模块71，用于获取邻接矩阵A，所述邻接矩阵A中的每一元素为两个节点的关联值，所述两个节点中一个节点为客户或产品，另一个节点为客户或产品；若所述两个节点具有关联，所述两个节点的关联值为1，若所述两个节点不具有关联，所述两个节点的关联值为0；

第二获取模块72，用于获取所述邻接矩阵A涉及的所有节点的属性信息，以得到特征向量矩阵Z，所述特征向量矩阵Z中每一行向量为一个所述节点的属性信息的向量表示；

第三获取模块73，用于将所述邻接矩阵A以及所述特征向量矩阵Z输入至多任务学习网络模型的输入端，通过所述多任务学习网络模型的第一输出端输出所述所有节点分别属于各个预设类型的预测概率，以及通过所述多任务学习网络模型的第二输出端输出预测邻接矩阵S；

第四获取模块74，用于基于所述所有节点分别属于各个预设类型的预测概率与所述所有节点分别对应的标注节点类型，获得第一损失函数；

第五获取模块75，用于基于所述邻接矩阵A与所述预测邻接矩阵S，获得第二损失函数；

训练模块76，用于通过所述第一损失函数与所述第二损失函数训练所述多任务学习网络模型；

触发模块77，用于触发所述第一获取模块，直至迭代次数达到预设阈值，以得到训练完毕的所述多任务学习网络模型；

第一确定模块78，用于确定所述多任务学习网络模型的所述第一输出端和所述第二输出端与全连接层相连，以得到图结构预测模型；所述图结构预测模型的输出端为所述全连接层的输出端，所述图结构预测模型的输入端为所述多任务学习网络模型的输入端；所述图结构预测模型用于输出包含产品的属性信息和客户的属性信息作为节点的图结构，所述图结构中任意的两两节点具有边表征两两节点具有关联性，若两两节点之间无边表征两两节点不具有关联性。

在一可选实现方式中，还包括：

第六获取模块，用于将待测邻接矩阵以及待测特征向量矩阵输入至所述图结构预测模型，通过所述图结构预测模型输出目标图结构；

其中，所述待测邻接矩阵中的每一元素为两个节点的所述关联值，所述待测特征向量矩阵中每一行向量为所述待测接矩阵涉及的一个节点的属性信息的向量表示；

第七获取模块，用于获取待推荐产品的第一客户的属性信息；

第八获取模块，用于从所述目标图结构中获取属性信息与所述第一客户的属性信息相似度最高的第二客户；

第二确定模块，用于确定所述目标图结构中与所述第二客户的属性特征具有边的产品为向所述第一客户推荐的产品。

在一可选实现方式中，所述第一损失函数L_NC为：

在一可选实现方式中，所述第二损失函数L_LP为：

在一可选实现方式中，训练模块具体用于：通过总体损失函数L＝L_NC+αL_LP，训练所述多任务学习网络模型，所述α为预设值。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

服务器包括但不限于：处理器81、存储器82、网络接口83、I/O控制器84以及通信总线85。

需要说明的是，本领域技术人员可以理解，图8中示出的服务器的结构并不构成对服务器的限定，服务器可以包括比图8所示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

下面结合图8对服务器的各个构成部件进行具体的介绍：

处理器81是服务器的控制中心，利用各种接口和线路连接整个服务器的各个部分，通过运行或执行存储在存储器82内的软件程序和/或模块，以及调用存储在存储器82内的数据，执行服务器的各种功能和处理数据，从而对服务器进行整体监控。处理器81可包括一个或多个处理单元；示例性的，处理器81可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作***、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器81中。

处理器81可能是一个中央处理器(Central Processing Unit，CPU)，或者是特定集成电路ASIC(Application Specific Integrated Circuit)，或者是被配置成实施本发明实施例的一个或多个集成电路等；

存储器82可能包含内存，例如高速随机存取存储器(Random-Access Memory，RAM)821和只读存储器(Read-Only Memory，ROM)822，也可能还包括大容量存储设备823，例如至少1个磁盘存储器等。当然，该服务器还可能包括其他业务所需要的硬件。

其中，上述的存储器82，用于存储上述处理器81可执行指令。上述处理器81具有执行基于多任务学习的图结构预测模型训练方法的功能。

一个有线或无线网络接口83被配置为将服务器连接到网络。

处理器81、存储器82、网络接口83和I/O控制器84可以通过通信总线85相互连接，该通信总线可以是ISA(Industry Standard Architecture，工业标准体系结构)总线、PCI(Peripheral Component Interconnect，外设部件互连标准)总线或EISA(ExtendedIndustry Standard Architecture，扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。

在示例性实施例中，服务器可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述基于多任务学习的图结构预测模型训练方法。

在示例性实施例中，本公开实施例提供了一种包括指令的存储介质，例如包括指令的存储器82，上述指令可由服务器的处理器81执行以完成上述方法。可选地，存储介质可以是非临时性计算机可读存储介质，例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

在示例性实施例中，还提供了一种计算机可读存储介质，可直接加载到计算机的内部存储器，例如上述存储器82中，并含有软件代码，该计算机程序经由计算机载入并执行后能够实现上述基于多任务学习的图结构预测模型训练方法。

在示例性实施例中，还提供一种计算机程序产品，可直接加载到计算机的内部存储器，例如所述服务器包含的存储器中，并含有软件代码，该计算机程序经由计算机载入并执行后能够实现上述所述基于多任务学习的图结构预测模型训练方法。

需要说明的是，本说明书中的各个实施例中记载的特征可以相互替换或者组合。对于装置或***类实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块，或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种基于多任务学习的图结构预测模型训练方法，其特征在于，包括：

2.根据权利要求1所述基于多任务学习的图结构预测模型训练方法，其特征在于，还包括：

将待测邻接矩阵以及待测特征向量矩阵输入至所述图结构预测模型，通过所述图结构预测模型输出目标图结构；

获取待推荐产品的第一客户的属性信息；

从所述目标图结构中获取属性信息与所述第一客户的属性信息相似度最高的第二客户；

确定所述目标图结构中与所述第二客户的属性特征具有边的产品为向所述第一客户推荐的产品。

3.根据权利要求1或2所述基于多任务学习的图结构预测模型训练方法，其特征在于，所述第一损失函数L_NC为：

4.根据权利要求3所述基于多任务学习的图结构预测模型训练方法，其特征在于，所述第二损失函数L_LP为：

5.根据权利要求4所述基于多任务学习的图结构预测模型训练方法，其特征在于，所述通过所述第一损失函数与所述第二损失函数训练所述多任务学习网络模型步骤包括：

通过总体损失函数L＝L_NC+αL_LP，训练所述多任务学习网络模型，所述α为预设值。

6.一种基于多任务学习的图结构预测模型训练装置，其特征在于，包括：

7.根据权利要求6所述基于多任务学习的图结构预测模型训练装置，其特征在于，还包括：

8.根据权利要求6或7所述基于多任务学习的图结构预测模型训练装置，其特征在于，所述第一损失函数L_NC为：

9.一种服务器，其特征在于，包括：

处理器；

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述指令，以实现如权利要求1至5任一所述基于多任务学习的图结构预测模型训练方法。

10.一种计算机可读存储介质，当所述计算机可读存储介质中的指令由服务器的处理器执行时，使得服务器能够执行如权利要求1至5中任一项所述基于多任务学习的图结构预测模型训练方法。