CN112435103B

CN112435103B - 一种事后多样性解释的智能推荐方法及***

Info

Publication number: CN112435103B
Application number: CN202011507787.2A
Authority: CN
Inventors: 杨晓春; 丁蕊; 马红; 王斌
Original assignee: 东北大学
Priority date: 2020-12-18
Filing date: 2020-12-18
Publication date: 2023-11-24
Anticipated expiration: 2040-12-18
Also published as: CN112435103A

Abstract

本发明提供一种事后多样性解释的智能推荐方法及***，根据用户历史交易记录收集包含商品解释说明信息的样本数据，构建样本集，并对样本集中的每条样本数据进行预处理，然后将无可解释的推荐模型作为黑盒模型，将n种可解释算法作为黑盒模型的基线模型，利用预处理后的样本数据对模型进行训练，根据生成的KL散度值筛选出最优匹配基线模型，本发明给出了一种精确度与可解释性同时兼顾的推荐方法，为没有可解释的算法提供了高精度的事后可解释，同时赋予推荐结果多样的解释，提高了用户对推荐算法的忠诚度与满意度。

Description

一种事后多样性解释的智能推荐方法及***

技术领域

本发明涉及计算机技术领域，具体涉及一种事后多样性解释的智能推荐方法及***。

背景技术

在推荐***中，可解释推荐的目的是向用户解释为什么的回答，解决推荐的原因，有助于提高推荐***的透明度、说服力、有效性、可信度和用户满意度。早期基于内容的推荐就可以直接向用户解释为什么要从众多的候选物品里推荐这个物品给用户；协同过滤通过群体智慧进行解释，但它对于很多基于内容的推荐算法解释性不够直观；隐语义模型(LFM)，包括基于协调过滤(CF)的矩阵分解方法可解释性较差；近几年深度学习对个性化推荐的性能有所提升，但是由于深度模型的黑盒特性，使得推荐模型的可解释性有一定困难；近年来，在人工智能究领域的研究者们也意识到可解释人工智能(Expainable AI)的重要性，在深度学习，计算机视觉，自动驾驶，自然语言处理等任务中都需要解决可解释人工智能(Expainable AI)这个任务。

可解释性和有效性被认为是模型设计中两个相互冲突的目标，物品们必须权衡——我们可以选择一个简单的模型来获得更好的可解释性，或者选择一个复杂的模型来获得更好的准确性，同时将牺牲可解释性。然而，最近的证据表明，在设计推荐模型时，这两个目标不一定相互冲突。例如，最先进的技术如深度表示学习方法，可以帮助我们设计既有效又可解释的推荐模型。开发可解释的深度模型在更广泛的AI领域中也是一个具有吸引力的方向，这不仅推动了可解释推荐研究的进展，也推动了可解释机器学习问题的基本原理的进展。

事后可解释推荐致力于寻找一种方法对深度学习训练后的黑盒推荐算法进行解释，用一个可解释的模型逼近黑盒模型可以在维持精确度的基础上提高模型的可解释性。这类方法在固定原有推荐算法的基础上去探究黑盒模型的分布，因而不会改变精确率。事后可解释推荐吸引了相关专家学者的注意，进而涌现出一系列可解释推荐算法，主要包括基于知识图谱的可解释推荐，基于关联规则的可解释推荐，基于因果推理的可解释推荐等，但通过这些方法得到的解释都比较单一，无法获得多样的可解释。

发明内容

针对现有技术的不足，本发明提出一种事后多样性解释的智能推荐方法，包括：

步骤1：根据用户历史交易记录收集包含商品解释说明信息的样本数据，构建样本集；

步骤2：对样本集中的每条样本数据进行预处理，包括：

步骤2.1：对每条样本数据是否有文本评论、社交关系、商品特征进行标记；

步骤2.2：利用公式(1)对每条样本数据中的商品评分值进行归一化处理，将商品评分值限制在(0,1)范围内，

式中，x表示每条样本数据中的商品评分值，x_max表示样本集中所有样本数据评分值中的最大值，x_min表示样本集中所有样本数据评分值中的最小值，x^*表示归一化处理后的商品评分值；

步骤3：将无可解释的推荐模型作为黑盒模型，将n种可解释算法作为黑盒模型的基线模型；

步骤4：利用预处理后的样本数据对黑盒模型、基线模型同时进行训练，输出推荐结果，并生成相应模型参数的概率分布；

步骤5：筛选出与黑盒模型推荐结果一致的基线模型，作为候选基线模型；

步骤6：利用KL散度计算黑盒模型生成的概率分布与各候选基线模型生成的概率分布之间的散度值；

步骤7：将所有的散度值进行从小到大排序，选取前K个散度值对应的基线模型作为黑盒模型的最优匹配基线模型，其中K小于等于n；

步骤8：利用K个最优匹配基线模型生成黑盒模型输出的推荐商品的K种可解释说明。

所述KL散度表述为：

式中，P为黑盒模型的模型参数的概率分布，Q为基线模型的模型参数的概率分布，KL(P||Q)为概率分布P、Q的KL散度值。

一种实现事后多样性解释的智能推荐方法的推荐***，包括样本采集模块、样本数据预处理模块、可解释说明输出模块；

所述样本采集模块用于提取用户历史交易记录中包含商品解释说明信息的样本数据；

所述样本数据预处理模块用于对每条样本数据进行预处理；

所述可解释说明输出模块用于构建黑盒模型的基线模型，并对黑盒模型、基线模型同时进行训练，根据KL散度值寻找最优匹配基线模型，利用最优匹配基线模型输出黑盒模型输出的推荐商品的K种可解释说明。

本发明的有益效果是：

本发明提出了一种事后多样性解释的智能推荐方法及***，将无可解释的推荐模型作为黑盒模型，可解释较强的可解释算法作为黑盒模型的基线模型，通过构建的样本集同时对黑盒模型、基线模型进行训练，利用KL散度值寻找与黑盒模型最为匹配的基线模型，本发明给出了一种精确度与可解释性同时兼顾的推荐方法，为没有可解释的算法提供了高精度的事后可解释，同时赋予推荐结果多样的解释，提高了用户对推荐算法的忠诚度与满意度。

附图说明

图1为本发明中的事后多样性解释的智能推荐方法流程图。

图2为本发明中的所述推荐***框图。

具体实施方式

下面结合附图和具体实施实例对发明做进一步说明。现有的可解释模型主要分为两类，基于模型的可解释推荐算法和事后可解释推荐算法。基于模型的可解释推荐算法大多需要引入一些附加信息，包括文本评论、商品特征及社交信息等，基于此用深度学习进行建模，提取特征。这类方法存在的两个主要缺点是：(1)附加信息的获得代价较高，(2)基于特征的建模将可解释性目标与精确度目标联合训练，一般会存在互斥性，即精确度好的可解释性差，可解释性强的精确度又受到影响。事后可解释推荐致力于寻找一种方法对深度学习训练后的黑盒推荐算法进行解释，用一个可解释的模型逼近黑盒模型可以在维持精确度的基础上提高模型的可解释性。这类方法在固定原有推荐算法的基础上去探究黑盒模型的分布，因而不会改变精确率。基于知识图谱的可解释推荐、基于关联规则的可解释推荐、基于因果推理的可解释推荐等，这些方法得到的解释都比较单一，例如：基于关联规则的只能获得诸如啤酒-》炸鸡类似的可解释形式，无法获得多样的可解释。基于这个难点，本发明着眼于设计一个解释多样的事后可解释推荐方法和***，可用来为许多传统黑盒方法预测分布，提供合理的解释。

如图1所示，一种事后多样性解释的智能推荐方法，包括：

步骤1：从movielens电影官网上收集用户一段时间内购买电影的历史交易记录，例如从movielens官网收集注册用户的账号Id，根据用户Id爬取用户的购买商品的历史交易记录，然后根据用户历史交易记录收集包含商品解释说明信息的样本数据，构建样本集；

步骤2：对样本集中的每条样本数据进行预处理，包括：

步骤2.1：对样本数据是否有文本评论、社交关系、商品特征进行标记整理，具体表述为设置文本字段表示评论信息，根据注册用户的“已关注好友”构建好友关系矩阵，为商品添加特征信息，如导演，主演；

调研现有的可解释性较强的算法作为基线模型，如经典的基于特征的显因子模型(EFM)算法，它将商品特征进行建模引入可解释建模，基于社交网络的可解释算法(NNF算法)，它将好友关系纳入考虑，基于知识图谱的策略指导的路径推理算法(KGPR算法)，它在社交图谱上收集的路径信息作为解释展示给用户。

本实施方式中，选取的可解释较强的算法作为基线模型，包括经典的基于特征的显因子模型(EFM)算法，它将商品特征进行建模引入可解释建模；基于社交网络的可解释算法(NNF算法)，它将好友关系纳入考虑；基于知识图谱的策略指导的路径推理算法(KGPR算法)，它在社交图谱上收集的路径信息作为解释展示给用户。选取的无可解释的算法包括贝叶斯个性化排序算法(BPR算法)，对抗个性化排序算法(APR算法)。

选择现有的无可解释性的推荐模型作为黑盒模型，即不关心黑盒推荐模型的内部结构而只想为其赋予可解释性。用KL散度衡量黑盒模型与这些基线模型的分布差异并对基线模型进行微调来更好的拟合黑盒模型。

步骤4：利用预处理后的样本数据对黑盒模型、基线模型同时进行训练，通过黑盒模型、基线模型生成相应模型参数的概率分布；

步骤4.1：用高斯分布初始化黑盒模型和基线模型的参数概率分布；

步骤4.2：用Adam梯度下降方法对黑盒模型的损失函数和基线模型的损失函数进行训练，使两个损失函数下降至基本保持稳定；

对基线模型结果进行过滤，保留推荐结果与黑盒模型推荐结果一致的基线模型的KL散度值，根据KL散度分布值进行排序，其中KL散度小的排序较高，KL散度大的排序较低，选择top-K的可解释形式展示给用户，这样可为用户提供K种解释形式，触及用户的关注点。

步骤6：利用KL散度计算黑盒模型生成的概率分布与各候选基线模型生成的概率分布之间的散度值；散度值越小表明两个分布越相似；

所述KL散度(又称交叉熵)表述为：

一种采用事后多样性解释的智能推荐方法的推荐***，可以采用python编程语言基于pycharm编程平台实现，另外在训练阶段使用深度学习工具包tensorflow，如图2所示，包括样本采集模块、样本数据预处理模块、可解释说明输出模块；

所述样本数据预处理模块用于对每条样本数据进行预处理；

Claims

1.一种事后多样性解释的智能推荐方法，其特征在于，包括如下步骤：

步骤2：对样本集中的每条样本数据进行预处理，包括：

步骤7：利用K个最优匹配基线模型生成黑盒模型输出的推荐商品的K种可解释说明。

2.根据权利要求1所述的一种事后多样性解释的智能推荐方法，其特征在于，所述KL散度表述为：

3.一种实现事后多样性解释的智能推荐方法的推荐***，其特征在于，包括样本采集模块、样本数据预处理模块、可解释说明输出模块；

所述样本数据预处理模块用于对每条样本数据进行预处理；