CN110110139B

CN110110139B - 一种对推荐结果进行解释的方法、装置及电子设备

Info

Publication number: CN110110139B
Application number: CN201910317239.4A
Authority: CN
Inventors: 孙成龙; 郭正凯; 宋华
Original assignee: Beijing QIYI Century Science and Technology Co Ltd
Current assignee: Beijing QIYI Century Science and Technology Co Ltd
Priority date: 2019-04-19
Filing date: 2019-04-19
Publication date: 2021-06-22
Anticipated expiration: 2039-04-19
Also published as: CN110110139A

Abstract

本发明实施例提供了一种对推荐结果进行解释的方法、装置及电子设备，所述方法包括：获取待解释推荐结果对应的预测模型和接收该待解释推荐结果的目标用户，并构建初始样本，该初始样本包括：待解释推荐结果所包括的推荐内容的内容特征和目标用户的用户特征；将预测模型和初始样本输入到预设的与预测模型无关的局部特征诊断模型中，得到每个特征对于预测点击概率的重要性值；根据该重要性值，对待解释推荐结果进行解释。应用本发明实施例，由于预设的局部特征诊断模型，是一种与预测模型无关的模型，可以适用于任何预测模型。因此，提高了解释方法的通用性。

Description

一种对推荐结果进行解释的方法、装置及电子设备

技术领域

本发明涉及机器学习技术领域，特别是涉及一种对推荐结果进行解释的方法、装置及电子设备。

背景技术

目前，很多网络应用***都会向用户推荐一些内容，以更好的满足用户需求。例如：视频播放***会为用户推荐一些视频，供用户选择。具体的推荐方法主要包括如下步骤：

首先，采集训练样本，包括用户已经观看过的视频以及用户的个人信息等；然后，用采集的样本来训练推荐模型；最后将候选视频和目标用户的信息输入训练好的推荐模型中。首先，推荐模型中的预测模型，从候选视频和目标用户的信息中提取特征，包括：视频特征和用户特征，对候选视频被目标用户点击的概率进行预测，得出目标用户对各个候选视频的预测点击概率，然后，推荐模型将预测点击概率最高的候选视频，作为待推荐视频，推荐给目标用户。

为了对预测模型进行改进，需要确定提取出的各个特征对预测结果，即预测被点击的概率所起的作用，进而对推荐结果进行解释。

目前，推荐***常用的预测模型有多种，都能够根据输入的样本的特征，对点击概率进行预测。比如：GBDT(Gradient Boosting Decision Tree，梯度提升决策树)预测模型、GBDT和FM(Factorization Machine，因子分解机)组合而成的预测模型，或者GBDT和LR(Logistic Regression Classifier，逻辑回归)组合而成的预测模型等。

对于GBDT这样的树模型，现有技术中可以采用信息增益法对预测结果进行分析，信息增益法是通过对样本的每个特征计算信息增益后进行排序，按排序结果来判断特征的重要性，进而对推荐结果进行解释。例如：用信息增益法得出特征A和特征B重要性最高，则解释时可以是由于待推荐视频中有这2个对应重要性最高的特征，所以预测的点击概率高。

然而，发明人在实现本发明的过程中发现，现有方案至少存在如下问题：

现有的信息增益法只能对GBDT这样的树模型的预测结果进行分析，不能对组合模型的预测结果进行分析，例如：不能对GBDT和FM组合而成的预测模型，或GBDT和LR组合而成的预测模型的预测结果进行分析，而且在引入了百万级别以上数量的特征后，信息增益法也无法再一一计算特征信息增益了，无法确定各个特征的重要性。

可见，现有技术中对推荐结果进行解释的方法，对于有些预测模型，无法确定各个特征的重要性，因此不能适用于所有的推荐模型，通用性不高。

发明内容

本发明实施例的目的在于提供一种对推荐结果进行解释的方法、装置及电子设备，以提高解释方法的通用性。

为达到上述目的，本发明实施例公开了一种对推荐结果进行解释的方法，包括：

获得待解释推荐结果对应的预测模型和目标用户；所述待解释推荐结果包含推荐内容；所述目标用户为接收所述待解释推荐结果的用户；

构建初始样本；所述初始样本，包括：所述推荐内容的内容特征和目标用户的用户特征；

将所述预测模型和初始样本，输入至预设的与所述预测模型无关的局部特征诊断模型中；对初始样本中的内容特征和/或用户特征进行多次扰动，获得多个扰动样本；并将所述初始样本输入至所述预测模型，获得对应的初始预测点击概率，将各个扰动样本分别输入至所述预测模型，获得对应的多个扰动后预测点击概率；并根据初始预测点击概率和各个扰动后预测点击概率之间的差异，得到每个特征对于预测点击概率的重要性值；其中，所述预测点击概率为：所述预测模型根据输入样本预测的所述目标用户对所述推荐内容的点击概率；

根据所述每个特征的重要性值，对所述待解释推荐结果进行解释。

可选的，所述对初始样本中的内容特征和/或用户特征进行多次扰动，获得多个扰动样本的步骤，包括：

从初始样本中的内容特征和用户特征中，选择一个未扰动过的特征，作为待定特征；

从所述初始样本中，隐藏所述待定特征，完成一次扰动，获得待定特征对应的扰动样本；返回所述从初始样本中的内容特征和用户特征中，选择一个未扰动过的特征，作为待定特征的步骤。

可选的，所述将所述初始样本输入至所述预测模型，获得对应的初始预测点击概率的步骤，包括：

将初始样本中的内容特征和用户特征输入所述预测模型，获得对应的初始预测点击概率；

所述将各个扰动样本分别输入至所述预测模型，获得对应的多个扰动后预测点击概率的步骤，包括：

将各个待定特征对应的扰动样本中的内容特征和用户特征输入所述预测模型，获得各个待定特征对应的扰动后预测点击概率。

可选的，所述根据初始预测点击概率和各个扰动后预测点击概率之间的差异，得到每个特征对于预测点击概率的重要性值的步骤，包括：

分别计算初始预测点击概率与各个待定特征对应的扰动后预测点击概率之间的差值；

将获得的各个差值作为对应的待定特征的重要性值。

可选的，所述预测模型，包含：第一子模型和第二子模型；

在将所述预测模型和初始样本，输入至预设的与所述预测模型无关的局部特征诊断模型中的步骤之前，还包括：

对初始样本中的内容特征和用户特征，按预设算法，将所有特征划分为稠密特征和稀疏特征；

将所述稠密特征输入至第一子模型，获得组合特征；

所述将所述初始样本输入至所述预测模型，获得对应的初始预测点击概率的步骤，包括：

将所述组合特征和稀疏特征输入所述第二子模型，获得初始预测点击概率。

可选的，所述将所述预测模型和初始样本，输入至预设的与所述预测模型无关的局部特征诊断模型中的步骤，包括：

将所述组合特征和稀疏特征进行拼接，获得拼接后的特征；

将所述预测模型和所述拼接后的特征，输入至预设的与所述预测模型无关的局部特征诊断模型中。

对所述拼接后的特征进行多次扰动，获得多个扰动样本；

对于每个扰动样本，从该扰动样本中，获得扰动稠密特征后的样本或扰动稀疏特征后的样本；

将扰动稠密特征后的样本输入至第一子模型，获得第一扰动后组合特征；

将所述第一扰动后组合特征和扰动稠密特征后的样本中的稀疏特征输入所述第二子模型，获得该扰动稠密特征后的样本对应的扰动后预测点击概率；

或，将扰动稀疏特征后的样本的稠密特征输入至第一子模型，获得第二扰动后组合特征；

将所述第二扰动后组合特征和扰动稀疏特征后的样本中的稀疏特征输入所述第二子模型，获得该扰动稀疏特征后的样本对应的扰动后预测点击概率。

可选的，所述第一子模型为：梯度提升决策树GBDT模型，所述第二子模型为逻辑回归LR模型或因子分解机FM模型。

为了达到上述目的，本发明实施例还公开了一种对推荐结果进行解释的装置，包括：第一获得模块、构建模块、第二获得模块和解释模块，其中，

所述第一获得模块，用于获得待解释推荐结果对应的预测模型和目标用户；所述待解释推荐结果包含推荐内容；所述目标用户为接收所述待解释推荐结果的用户；

所述构建模块，用于构建初始样本；所述初始样本，包括：所述推荐内容的内容特征和目标用户的用户特征；

所述第二获得模块，包括：输入子模块、扰动子模块、初始概率获得子模块、扰动概率获得子模块和重要性值获得子模块；

所述输入子模块，用于将所述预测模型和初始样本，输入至预设的与所述预测模型无关的局部特征诊断模型中；

所述扰动子模块，用于对初始样本中的内容特征和/或用户特征进行多次扰动，获得多个扰动样本；

所述初始概率获得子模块，用于将所述初始样本输入至所述预测模型，获得对应的初始预测点击概率；

所述扰动概率获得子模块，用于将各个扰动样本分别输入至所述预测模型，获得对应的多个扰动后预测点击概率；

所述重要性值获得子模块，用于根据初始预测点击概率和各个扰动后预测点击概率之间的差异，得到每个特征对于预测点击概率的重要性值；其中，所述预测点击概率为：所述预测模型根据输入样本预测的所述目标用户对所述推荐内容的点击概率；

所述解释模块，用于根据所述每个特征的重要性值，对所述待解释推荐结果进行解释。

可选的，所述扰动子模块，包括：

选择单元，用于从初始样本中的内容特征和用户特征中，选择一个未扰动过的特征，作为待定特征；

扰动单元，用于从所述初始样本中，隐藏所述待定特征，完成一次扰动，获得待定特征对应的扰动样本，触发所述选择单元。

可选的，所述初始概率获得子模块，具体用于将初始样本中的内容特征和用户特征输入所述预测模型，获得对应的初始预测点击概率；

所述扰动概率获得子模块，具体用于将各个待定特征对应的扰动样本中的内容特征和用户特征输入所述预测模型，获得各个待定特征对应的扰动后预测点击概率。

可选的，所述重要性值获得子模块，具体用于分别计算初始预测点击概率与各个待定特征对应的扰动后预测点击概率之间的差值；将获得的各个差值作为对应的待定特征的重要性值。

可选的，所述预测模型，包含：第一子模型和第二子模型；

所述装置，还包括：

划分模块，用于在将所述预测模型和初始样本，输入至预设的与所述预测模型无关的局部特征诊断模型中之前，对初始样本中的内容特征和用户特征，按预设算法，将所有特征划分为稠密特征和稀疏特征；

输入模块，用于将所述稠密特征输入至第一子模型，获得组合特征；

所述初始概率获得子模块，具体用于将所述组合特征和稀疏特征输入所述第二子模型，获得初始预测点击概率。

可选的，所述输入子模块，包括：

拼接单元，用于将所述组合特征和稀疏特征进行拼接，获得拼接后的特征；

第一输入单元，用于将所述预测模型和所述拼接后的特征，输入至预设的与所述预测模型无关的局部特征诊断模型中。

可选的，所述扰动子模块，具体用于对所述拼接后的特征进行多次扰动，获得多个扰动样本；

所述扰动概率获得子模块，包括：获得单元、第二输入单元和第三输入单元，或者包括：获得单元、第四输入单元和第五输入单元；

所述获得单元，用于对于每个扰动样本，从该扰动样本中，获得扰动稠密特征后的样本或扰动稀疏特征后的样本；

所述第二输入单元，用于将扰动稠密特征后的样本输入至第一子模型，获得第一扰动后组合特征；

所述第三输入单元，用于将所述第一扰动后组合特征和扰动稠密特征后的样本中的稀疏特征输入所述第二子模型，获得该扰动稠密特征后的样本对应的扰动后预测点击概率；

所述第四输入单元，用于将扰动稀疏特征后的样本中的稠密特征输入至第一子模型，获得第二扰动后组合特征；

所述第五输入单元，用于将所述第二扰动后组合特征和扰动稀疏特征后的样本中的稀疏特征输入所述第二子模型，获得该扰动稀疏特征后的样本对应的扰动后预测点击概率。

可选地，所述第一子模型为：梯度提升决策树GBDT模型，所述第二子模型为逻辑回归LR模型或因子分解机FM模型。

为了达到上述目的，本发明实施例还公开了一种对推荐结果进行解释的电子设备，包括处理器、通信接口、存储器和通信总线，其中，所述处理器，所述通信接口，所述存储器通过所述通信总线完成相互间的通信；

所述存储器，用于存放计算机程序；

所述处理器，用于执行所述存储器上所存放的程序时，实现以上任一所述对推荐结果进行解释的方法步骤。

在本发明实施的又一方面，还提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述任一所述的对推荐结果进行解释的方法。

在本发明实施的又一方面，本发明实施例还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述任一所述的对推荐结果进行解释的方法。

由上述技术方案可见，本发明实施例提供的对推荐结果进行解释的方法、装置及电子设备，获取待解释推荐结果对应的预测模型和接收该待解释推荐结果的目标用户，并构建初始样本，该初始样本包括：待解释推荐结果所包括的推荐内容的内容特征和目标用户的用户特征；将预测模型和初始样本输入预设的与预测模型无关的局部特征诊断模型中，得到每个特征对于预测点击概率的重要性值，根据该重要性值，对待解释推荐结果进行解释。由于预设的局部特征诊断模型，是一种与预测模型无关的模型，可以适用于任何预测模型。因此，可以提高解释方法的通用性。

当然，实施本发明的任一产品或方法必不一定需要同时达到以上所述的所有优点。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。

图1a为本发明实施例提供的对推荐结果进行解释的方法的一种流程示意图；

图1b为图1a所示实施例中局部特征诊断模型的处理过程的示意图；

图2为本发明实施例提供的对推荐结果进行解释的方法的另一种流程示意图；

图3为本发明实施例提供的对推荐结果进行解释的方法的又一种流程示意图；

图4为本发明实施例提供的对推荐结果进行解释的装置的结构示意图；

图5为本发明实施例提供的对推荐结果进行解释的电子设备示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行描述。

为了解决现有技术问题，本发明实施例提供了一种对推荐结果进行解释的方法、装置及电子设备。该方法及装置可以应用于各种电子设备。下面首先对本发明实施例提供的一种对推荐结果进行解释的方法进行介绍。

如图1a所示，图1a为本发明实施例提供的对推荐结果进行解释的方法的一种流程示意图，可以包括：

S101：获得待解释推荐结果对应的预测模型和目标用户；该待解释推荐结果包含推荐内容；该目标用户为接收该待解释推荐结果的用户。

在实际应用中，预测模型可以是单一的模型，比如GBDT或者DNN(Deep NeuralNetwork，深度神经网络)等模型，也可以是多个模型的组合模型，比如GBDT和LR的组合模型或者DNN和FM的组合模型等。例如：对于视频推荐来说，该预测模型可以是通过输入多个用户已经观看过的视频和用户的个人信息以及用户点击这些已经观看过的视频的概率，经过多次训练，得到的训练完成的预测模型。

S102：构建初始样本；该初始样本，包括：推荐内容的内容特征和目标用户的用户特征。

例如：对于视频推荐来说，该初始样本，可以包括：推荐的视频的特征和目标用户的用户特征。

S103：将预测模型和初始样本，输入至预设的与预测模型无关的局部特征诊断模型中；对初始样本中的内容特征和/或用户特征进行多次扰动，获得多个扰动样本；并将初始样本输入至预测模型，获得对应的初始预测点击概率，将各个扰动样本分别输入至预测模型，获得对应的多个扰动后预测点击概率；并根据初始预测点击概率和各个扰动后预测点击概率之间的差异，得到每个特征对于预测点击概率的重要性值。

在S103中，每个特征对于预测点击概率的重要性值是指：初始样本的每个特征对于预测点击概率的重要性值。

如图1b所示，局部特征诊断模型的处理过程包括：

1)初始样本输入到局部特征诊断模型中，局部特征诊断模型对其进行扰动，获得多个扰动样本；

具体的，局部特征诊断模型对初始样本中的内容特征和或用户特征进行多次扰动，获得多个扰动样本。

2)同时，局部特征诊断模型还直接将初始样本输入至预测模型，获得对应的初始预测点击概率。

3)然后，局部特征诊断模型将各个扰动样本分别输入至预测模型，获得对应的多个扰动后预测点击概率。

4)然后，局部诊断模型根据初始预测点击概率和各个扰动后预测点击概率，计算初始样本的每个特征对于预测点击率的重要性值。

具体的，局部特征诊断模型可以先计算出初始预测点击概率和各个扰动后预测点击概率之间的差异，然后根据初始预测点击概率和各个扰动后预测点击概率之间的差异，得到初始样本的每个特征对于预测点击概率的重要性值。

5)最后，局部特征诊断模型输出计算得到的重要性值。

以上为局部特征诊断模型的处理过程，通过该处理过程，可以获得初始样本的每个特征对于预测点击概率的重要性值，从而可以进一步地利用该重要性值对待解释推荐结果进行解释。

S104：根据每个特征的重要性值，对待解释推荐结果进行解释。

初始样本的每个特征的重要性值，可以代表该特征对于预测点击概率的贡献大小。

应用图1a所示的实施例，将待解释推荐结果对应的预测模型和构建的初始样本输入预设的与预测模型无关的局部特征诊断模型中，得到每个特征对于预测点击概率的重要性值，根据该重要性值，对待解释推荐结果进行解释。由于预设的局部特征诊断模型，是一种与预测模型无关的模型，可以适用于任何预测模型。因此，提高了解释方法的通用性。

更进一步的，本发明实施例提供了对推荐结果进行解释的方法的另一种流程图，该实施例中，利用局部特征诊断模型，从初始样本中的内容特征和用户特征中选择未扰动的特征，将该特征隐藏，得到扰动样本，从而得到各个特征的重要性值，以解释待解释推荐结果。具体的，如图2所示，可以包括：

S201：获得待解释推荐结果对应的预测模型和目标用户；该待解释推荐结果包含推荐内容；该目标用户为接收该待解释推荐结果的用户。

推荐内容，可以是视频，也可以是音频或者图像等，具体不做限定。待解释推荐结果对应的预测模型，可以预测该推荐结果被目标用户点击的概率。

S202：构建初始样本；该初始样本，包括：推荐内容的内容特征和目标用户的用户特征。

在一种情况下，推荐内容是视频，则推荐内容的内容特征，可以是视频的标签，如演员、电影、情景喜剧等，或者视频时长、视频发行时间等。目标用户的用户特征，可以是用户的个人信息，如用户性别、用户年龄等，或者用户在视频播放***的注册号等。这样，构建初始样本，可以是构建初始样本的内容特征和用户特征。

本实施例中，可以构建一个或多个初始样本。具体的，当目标用户为一个时，可以利用该目标用户的用户特征，和该目标用户所接收的待解释推荐结果的推荐内容的内容特征来构建一个初始样本。当目标用户为多个时，可以针对每个目标用户，利用该目标用户的用户特征，和该目标用户所接收的待解释推荐结果的推荐内容的内容特征来构建一个初始样本，从而构建多个初始样本。

S203：将预测模型和初始样本，输入至预设的与预测模型无关的局部特征诊断模型中；对初始样本中的内容特征和/或用户特征进行多次扰动，获得多个扰动样本；将初始样本中的内容特征和用户特征输入预测模型，获得对应的初始预测点击概率；将各个待定特征对应的扰动样本中的内容特征和用户特征输入预测模型，获得各个待定特征对应的扰动后预测点击概率；分别计算初始预测点击概率与各个待定特征对应的扰动后预测点击概率之间的差值；将获得的各个差值作为对应的待定特征的重要性值；其中，预测点击概率为：预测模型根据输入样本预测的目标用户对推荐内容的点击概率。

一种情况下，如果构建一个初始样本，则可以将预测模型和初始样本的特征形成向量，输入上述局部特征诊断模型中。

另一种情况下，如果构建多个初始样本，则可以将多个初始样本以矩阵的形式输入上述局部特征诊断模型中，在该矩阵中，每一行为一个初始样本，上述局部特征诊断模型可以对矩阵中的数据逐行进行处理。这里的处理包括：上述步骤103中的处理1)-5)。

S203中对初始样本中的内容特征和/或用户特征进行多次扰动，获得多个扰动样本，可以包括如下步骤：

1)、从初始样本中的内容特征和用户特征中，选择一个未扰动过的特征，作为待定特征。

2)、从初始样本中，隐藏待定特征，完成一次扰动，获得待定特征对应的扰动样本。

其中，隐藏待定特征，可以是将待定特征的值设置为0。

3)、返回从初始样本中的内容特征和用户特征中，选择一个未扰动过的特征，作为待定特征的步骤。

通过上述三个步骤，可以对初始样本中的每个特征进行一次扰动，从而获得多个扰动样本。

举例来说，假定初始样本中的内容特征和用户特征为A、B、C、D、E五个特征，选择一个未扰动过的特征A，作为待定特征，将特征A隐藏，得到特征A对应的扰动样本为[0、B、C、D、E]，然后再选择一个未扰动过的特征B，作为待定特征，将特征B隐藏，得到特征B对应的扰动样本为[A、0、C、D、E]，以此类推，获得多个扰动样本。

在获得多个扰动样本后，可以将初始样本中的内容特征和用户特征输入预测模型，获得对应的初始预测点击概率；将各个待定特征对应的扰动样本中的内容特征和用户特征输入预测模型，获得各个待定特征对应的扰动后预测点击概率；分别计算初始预测点击概率与各个待定特征对应的扰动后预测点击概率之间的差值；将获得的各个差值作为对应的待定特征的重要性值。

延续上述例子，假定将初始样本中的内容特征和用户特征A、B、C、D、E，输入预测模型，获得初始预测点击概率为0.6，将特征A隐藏，将特征A对应的扰动样本[0、B、C、D、E]输入预测模型，获得特征A对应的扰动后预测点击概率为0.1，则计算初始预测点击概率与特征A对应的扰动后预测点击概率之间的差值，得到该差值为0.6-0.1＝0.5，这样，该差值0.5就是待定特征A的重要性值。

当然，该差值也可以是负数，比如，将待定特征B隐藏后，得到特征B对应的扰动样本[A、0、C、D、E]，将该扰动样本输入预测模型，获得特征B对应的扰动后预测点击概率为0.8，则计算初始预测点击概率与特征B对应的扰动后预测点击概率之间的差值，得到该差值为0.6-0.8＝-0.2，这样，差值-0.2就是待定特征B的重要性值。

上述输入样本是指：目标用户的用户特征和候选推荐结果的特征。例如，候选推荐结果为：候选视频。

S204：根据每个特征的重要性值，对待解释推荐结果进行解释。

由于初始预测点击概率与待定特征对应的扰动后预测点击概率之间的差值可以是正数、负数或0，且该差值就代表重要性值，所以，每个特征的重要性值，也可以是正数、负数或0。

该重要性值可以代表特征对于预测点击概率的贡献大小。重要性值越大，对应的特征对于预测点击概率的贡献越大，相反地，重要性值越小，对应的特征对于预测点击概率的贡献越小。

举例来说，假定特征A的重要性值为0.1，特征B的重要性值为-0.3，则特征A对待解释推荐结果起到正向贡献，而特征B对待解释推荐结果起到负向贡献。

一种情况下，根据每个特征的重要性值，对待解释推荐结果进行解释，可以是：对每个特征的重要性值，按大小进行排序，按照排序结果，选取预设数量个最大的重要性值对应的特征，解释待解释推荐结果。

比如，特征A的重要性值为0.1，特征B的重要性值为-0.3，特征C的重要性值为0.5，特征D的重要性值为0.8，则选取重要性值最大的两个特征D和C，解释待解释推荐结果。

另一种情况下，也可以对每个特征的贡献值，按贡献值大小进行排序，根据贡献值大小，选取预设数量个贡献值最大的特征，解释待解释推荐结果；或者选取对待解释推荐结果起到正向贡献的特征，解释待解释推荐结果。

比如，延续上述例子，选取贡献值最大的特征D，解释待解释推荐结果；或者选取对待解释推荐结果起到正向贡献的特征D、C和A，解释待解释推荐结果。

应用图2所述的实施例，通过获得待解释推荐结果对应的预测模型和接收该待解释推荐结果的目标用户，并构建初始样本，将预测模型和初始样本输入局部特征诊断模型中；从初始样本中的内容特征和用户特征中选择未扰动的特征，将该特征隐藏，得到扰动样本，从而得到初始样本与扰动样本的差值，作为被隐藏特征的重要性值，以解释待解释推荐结果。由于预设的局部特征诊断模型，是一种与预测模型无关的模型，可以适用于任何预测模型。因此，提高了解释方法的通用性。

更进一步的，本发明实施例还提供了对推荐结果进行解释的方法的又一种流程图，该实施例中，预测模型，可以包含第一子模型和第二子模型，将初始样本中的所有特征进行组合和拼接，得到拼接特征，输入预设的局部特征诊断算法中，获得每个特征的重要性值，以解释推荐结果。具体的，如图3所示，可以包括：

S301：获得待解释推荐结果对应的预测模型和目标用户；该待解释推荐结果包含推荐内容；该目标用户为接收该待解释推荐结果的用户。

一种情况下，待解释推荐结果对应的预测模型，可以包括第一子模型和第二子模型，第一子模型可以是GBDT或者DNN，用于处理稠密特征，不支持处理高维稀疏特征；第二子模型可以是LR或者FM，用于处理稀疏特征。

S302：构建初始样本；该初始样本，包括：推荐内容的内容特征和目标用户的用户特征。

S303：对初始样本中的内容特征和用户特征，按预设算法，将所有特征划分为稠密特征和稀疏特征。

举例而言，如果初始样本包括推荐的视频的特征和目标用户的用户特征，则该初始样本的特征中可以包括用户年龄、用户性别或视频时长等稠密特征，和用户的注册号或视频标签等稀疏特征。

在构建初始样本之后，可以对初始样本中所有特征进行编号，按预设算法，将所有特征划分为稠密特征和稀疏特征。具体的，可以将初始样本中的每个特征表示为向量，将向量的长度作为特征的编号，将小于预设阈值的编号对应的特征划分为稠密特征，将大于预设阈值的编号对应的特征划分为稀疏特征。比如，预设阈值为10万，则将编号小于10万的特征确定为稠密特征，将编号大于10万的特征确定为稀疏特征。

S304：将稠密特征输入至第一子模型，获得组合特征。

在实际应用中，将稠密特征输入第一子模型后，稠密特征会自动遍历第一子模型中的所有特征类别，根据熵增益，将稠密特征中的所有特征进行自动选择，从而使得稠密特征的所有特征被分成多类，每一类为一个组合特征，将每一类中的特征离散化编码，得到组合特征向量，以便机器识别处理。由于初始样本的特征数量庞大，一般得到的组合特征为高维组合特征。

一种情况下，在获得组合特征之后，可以将组合特征和稀疏特征输入预测模型的第二子模型，第二子模型可以对输入的特征进行计算，获得初始预测点击概率。

S305：将组合特征和稀疏特征进行拼接，获得拼接后的特征。

一种情况下，将组合特征和稀疏特征进行拼接，获得拼接后的特征，可以是将组合特征生成的特征向量，和由稀疏特征生成的高维稀疏特征向量进行拼接，得到拼接特征向量。

举例来说，组合特征的特征向量为[a₁、a₂、…a_n]，高维稀疏特征向量为[b₁、0、0、0…b₂]，将组合特征的特征向量与高维稀疏特征向量进行拼接，得到的拼接特征向量为[a₁、a₂、…a_n、b₁、0、0、0…b₂]。

S306：将预测模型和拼接后的特征，输入至预设的与预测模型无关的局部特征诊断模型中，得到每个特征对于预测点击概率的重要性值。

在实际应用中，利用局部特征诊断模型，对输入的拼接后的特征进行多次扰动，获得多个扰动样本；对于每个扰动样本，从该扰动样本中，获得扰动稠密特征后的样本或扰动稀疏特征后的样本；

比如，延续上述例子，对于输入的拼接后的特征[a₁、a₂、…a_n、b₁、0、0、0…b₂]，将稠密特征A₁对应的向量元素a₁隐藏，得到扰动稠密特征A₁后的样本[0、a₂、…a_n、b₁、0、0、0…b₂]，或者将稀疏特征B₁对应的向量元素b₁隐藏，得到扰动稀疏特征B₁后的样本[a₁、a₂、…a_n、0、0、0、0…b₂]。

将扰动稠密特征后的样本输入至第一子模型，获得第一扰动后组合特征；将第一扰动后组合特征和扰动稠密特征后的样本中的稀疏特征输入第二子模型，获得该扰动稠密特征后的样本对应的扰动后预测点击概率；

具体的，第一子模型对扰动稠密特征后的样本中的稠密特征进行处理，获得第一扰动后组合特征，第二子模型对第一扰动后组合特征和扰动稠密特征后的样本中的稀疏特征进行处理，获得该扰动稠密特征后的样本对应的扰动后预测点击概率。

或者，将扰动稀疏特征后的样本中的稠密特征输入至第一子模型，获得第二扰动后组合特征；将第二扰动后组合特征和扰动稀疏特征后的样本中的稀疏特征输入第二子模型，获得该扰动稀疏特征后的样本对应的扰动后预测点击概率。

具体的，第一子模型对扰动稀疏特征后的样本中的稠密特征进行处理，获得第二扰动后组合特征，第二子模型对第二扰动后组合特征和扰动稀疏特征后的样本中的稀疏特征进行处理，获得该扰动稀疏特征后的样本对应的扰动后预测点击概率。

在获得扰动稠密特征后的样本对应的扰动后预测点击概率之后，根据初始预测点击概率和各个扰动稠密特征后的样本对应的扰动后预测点击概率之间的差异，或者，在获得扰动稀疏特征后的样本对应的扰动后预测点击概率之后，根据初始预测点击概率和各个扰动稀疏特征后的样本对应的扰动后预测点击概率之间的差异，得到每个特征对于预测点击概率的重要性值。这里，每个特征对于预测点击概率的重要性值是指：拼接特征向量中的每一特征对于预测点击概率的重要性值。

S307：根据每个特征的重要性值，对待解释推荐结果进行解释。

应用图3所示的实施例，通过对初始样本的特征进行组合、拼接，得到拼接特征，将拼接特征输入预设的与预测模型无关的局部特征诊断模型中，获得每个特征对于预测点击概率的重要性值，并根据该重要性值，解释推荐结果。由于预设的局部特征诊断模型，是一种与预测模型无关的模型，可以适用于任何预测模型。因此，提高了解释方法的通用性。

相应于图1a所示的方法实施例，本发明实施例还提供了一种对推荐结果进行解释的装置，如图4所示，所述装置可以包括：第一获得模块401、构建模块402、第二获得模块403和解释模块404，其中，

所述第一获得模块401，用于获得待解释推荐结果对应的预测模型和目标用户；所述待解释推荐结果包含推荐内容；所述目标用户为接收所述待解释推荐结果的用户；

所述构建模块402，用于构建初始样本；所述初始样本，包括：所述推荐内容的内容特征和目标用户的用户特征；

所述第二获得模块403，包括：输入子模块、扰动子模块、初始概率获得子模块、扰动概率获得子模块和重要性值获得子模块；

所述解释模块404，用于根据所述每个特征的重要性值，对所述待解释推荐结果进行解释。

应用图4所示的实施例，获取待解释推荐结果对应的预测模型和接收该待解释推荐结果的目标用户，并构建初始样本，该初始样本包括：待解释推荐结果所包括的推荐内容的内容特征和目标用户的用户特征；将预测模型和初始样本输入预设的与预测模型无关的局部特征诊断模型中，得到每个特征对于预测点击概率的重要性值，根据该重要性值，对待解释推荐结果进行解释。由于预设的局部特征诊断模型，是一种与预测模型无关的模型，可以适用于任何预测模型。因此，提高了解释方法的通用性。

具体的，在本实施例中，所述扰动子模块，可以包括：

具体的，在本实施例中，所述初始概率获得子模块，具体用于将初始样本中的内容特征和用户特征输入所述预测模型，获得对应的初始预测点击概率；

具体的，在本实施例中，所述重要性值获得子模块，具体用于分别计算初始预测点击概率与各个待定特征对应的扰动后预测点击概率之间的差值；将获得的各个差值作为对应的待定特征的重要性值。

具体的，在本实施例中，所述预测模型，包含：第一子模型和第二子模型；

所述装置，还包括：

划分模块(图中未示出)，用于在将所述预测模型和初始样本，输入至预设的与所述预测模型无关的局部特征诊断模型中之前，对初始样本中的内容特征和用户特征，按预设算法，将所有特征划分为稠密特征和稀疏特征；

输入模块(图中未示出)，用于将所述稠密特征输入至第一子模型，获得组合特征；

具体的，在本实施例中，所述输入子模块，包括：

具体的，在本实施例中，所述扰动子模块，具体用于对所述拼接后的特征进行多次扰动，获得多个扰动样本；

所述获得单元，用于对于每个扰动样本，从该扰动样本中，获得扰动后稠密特征后的样本或扰动后稀疏特征后的样本；

具体的，在本实施例中，所述第一子模型为：梯度提升决策树GBDT模型，所述第二子模型为逻辑回归LR模型或因子分解机FM模型。

本发明实施例还提供了一种对推荐结果进行解释的电子设备，如图5所示，包括处理器501、通信接口502、存储器503和通信总线504，其中，处理器501，通信接口502，存储器503通过通信总线504完成相互间的通信，

存储器503，用于存放计算机程序；

处理器501，用于执行存储器503上所存放的程序时，实现如下步骤：

可见，本发明实施例所提供的方案中，获取待解释推荐结果对应的预测模型和接收该待解释推荐结果的目标用户，并构建初始样本，该初始样本包括：待解释推荐结果所包括的推荐内容的内容特征和目标用户的用户特征；将预测模型和初始样本的特征输入预设的与预测模型无关的局部特征诊断模型中，得到每个特征对于预测点击概率的重要性值，根据该重要性值，对待解释推荐结果进行解释。由于预设的局部特征诊断模型，是一种与预测模型无关的模型，可以适用于任何预测模型。因此，提高了解释方法的通用性。

上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect，简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture，简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述电子设备与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory，简称RAM)，也可以包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，简称CPU)、网络处理器(Network Processor，简称NP)等；还可以是数字信号处理器(Digital Signal Processing，简称DSP)、专用集成电路(Application SpecificIntegrated Circuit，简称ASIC)、现场可编程门阵列(Field－Programmable Gate Array，简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本发明提供的又一实施例中，还提供了一种计算机可读存储介质，该计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述实施例中任一所述的对推荐结果进行解释的方法，以获得相同的技术效果。

在本发明提供的又一实施例中，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述实施例中任一所述的对推荐结果进行解释的方法，以获得相同的技术效果。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置实施例、设备实施例和存储介质实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

Claims

1.一种对推荐结果进行解释的方法，其特征在于，所述方法包括：

根据所述每个特征的重要性值，对所述待解释推荐结果进行解释；

所述对初始样本中的内容特征和/或用户特征进行多次扰动，获得多个扰动样本的步骤，包括：

2.根据权利要求1所述的方法，其特征在于，

3.根据权利要求2所述的方法，其特征在于，

所述根据初始预测点击概率和各个扰动后预测点击概率之间的差异，得到每个特征对于预测点击概率的重要性值的步骤，包括：

将获得的各个差值作为对应的待定特征的重要性值。

4.根据权利要求1所述的方法，其特征在于，所述预测模型，包含：第一子模型和第二子模型；

将所述稠密特征输入至第一子模型，获得组合特征；

5.根据权利要求4所述的方法，其特征在于，

所述将所述预测模型和初始样本，输入至预设的与所述预测模型无关的局部特征诊断模型中的步骤，包括：

将所述组合特征和稀疏特征进行拼接，获得拼接后的特征；

6.根据权利要求5所述的方法，其特征在于，

对所述拼接后的特征进行多次扰动，获得多个扰动样本；

7.根据权利要求4～6任一项所述的方法，其特征在于，所述第一子模型为：梯度提升决策树GBDT模型，所述第二子模型为逻辑回归LR模型或因子分解机FM模型。

8.一种对推荐结果进行解释的装置，其特征在于，所述装置包括：第一获得模块、构建模块、第二获得模块和解释模块，其中，

所述解释模块，用于根据所述每个特征的重要性值，对所述待解释推荐结果进行解释；

所述扰动子模块，包括：

9.根据权利要求8所述的装置，其特征在于，

所述初始概率获得子模块，具体用于将初始样本中的内容特征和用户特征输入所述预测模型，获得对应的初始预测点击概率；

10.根据权利要求9所述的装置，其特征在于，

所述重要性值获得子模块，具体用于分别计算初始预测点击概率与各个待定特征对应的扰动后预测点击概率之间的差值；将获得的各个差值作为对应的待定特征的重要性值。

11.根据权利要求8所述的装置，其特征在于，所述预测模型，包含：第一子模型和第二子模型；

所述装置，还包括：

12.根据权利要求11所述的装置，其特征在于，所述输入子模块，包括：

13.根据权利要求12所述的装置，其特征在于，

所述扰动子模块，具体用于对所述拼接后的特征进行多次扰动，获得多个扰动样本；

14.根据权利要求11～13任一项所述的装置，其特征在于，所述第一子模型为：梯度提升决策树GBDT模型，所述第二子模型为逻辑回归LR模型或因子分解机FM模型。

15.一种电子设备，其特征在于，包括处理器、通信接口、存储器和通信总线，其中，所述处理器，所述通信接口，所述存储器通过所述通信总线完成相互间的通信；

所述存储器，用于存放计算机程序；

所述处理器，用于执行所述存储器上所存放的程序时，实现权利要求1-7任一所述的方法步骤。