CN116071119B

CN116071119B - 一种基于多行为推荐模型的模型不可知反事实解释方法

Info

Publication number: CN116071119B
Application number: CN202210983716.2A
Authority: CN
Inventors: 王庆先; 常奥; 黄庆; 曾昌强; 吴苏强
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2022-08-16
Filing date: 2022-08-16
Publication date: 2023-12-08
Anticipated expiration: 2042-08-16
Also published as: CN116071119A

Abstract

本发明涉及互联网领域，具体涉及一种基于多行为推荐模型的模型不可知反事实解释方法，S1、确定要进行解释的模型；S2、交互物品项的各行为类型重要性排序；S3、过滤行为类型子集；S4、过滤候选解释；S5、确定待定解释；S6、获得更多候选解释；S7、决定最终解释，通过对单行为与多行为推荐***中交互历史、偏好、结果的因果分析，以及对行为类型间关系的分析，明确了在指定被解释项、指定交互物品的情况下，各行为类型的重要性分数，以及行为类型子集的过滤与重要性分数，实现了依据行为类型对候选解释搜索空间的过滤；解决了传统模型不可知解释方法不能对多行为推荐模型进行真实而有操作性的解释的问题。

Description

一种基于多行为推荐模型的模型不可知反事实解释方法

技术领域

本发明涉及互联网领域，具体涉及一种基于多行为推荐模型的模型不可知反事实解释方法。

背景技术

为了向用户提供个性化的内容，基于异构信息网络的推荐***将从用户收集的各种数据集成到一个通常很复杂的排名模型中，因此，推荐结果可能会让用户感到困惑，让他们想知道为什么会向他们推荐某些特定的项目，为了解决可解释性问题，研究人员转向了可解释的推荐模型，希望它不仅能产生有效的推荐，还能对人类进行直观的解释，通常，可解释的模型可以是模型内在的或模型不可知的也称为事后的。

模型不可知解释不假设潜在的推荐模型，而允许决策机制成为一个黑盒，并将在决策做出后提供解释，现有的大部分对推荐***的可解释性成果，都仅考虑了单一类型的用户-物品交互行为，然而，在许多实际的推荐场景中，用户-道具交互是多元的，表现出本质上的关系多样性，以电子商务***为例，用户与商品之间存在多种行为如查看页面、添加到收藏夹、添加到购物车和购买，这些行为是相互依存的，在这种情况下，由于忽略了不同类型的用户-物品交互行为之间的多模态关系，现有大部分成果并不能轻易应用于多行为推荐模型。

此外，对于一般的事后解释方法，其解释是不真实的，是对另一个***所构建的观察到的输入和输出的合理化，并且可能不是可推知的和可操作的，但如许多现有成果所展示的，使用反事实推理的可解释性方法不受该问题影响，反事实使用推荐***本身进行预期输出，所以其解释机制与特定于模型的解释具有相同的保真度，通过研究在数据中存在关联关系的前提下，表示出行为类型与推荐结果的因果关系，从而提高对推荐列表的解释的真实有效性与可操作性，对模型不可知的多行为推荐模型进行解释是具有现实意义的。

发明内容

为了解决传统模型不可知解释方法不能对多行为推荐模型进行真实而有操作性的解释的问题，提供一种基于多行为推荐模型的模型不可知反事实解释方法。

本发明采用的技术方案如下：

一种基于多行为推荐模型的模型不可知反事实解释方法，包括以下步骤：

S1、获取数据集，并确定要进行不可知解释的多行为推荐模型；基于获取的数据集中的用户交互历史作为多行为推荐模型的输入，通过多行为推荐模型输出得到被推荐项以及对应每个推荐项的推荐分数；

S2、确定要解释的被推荐项与被推荐的用户，依据用户交互历史中的每个交互物品项以及被推荐项分数，计算每个交互物品的各个行为类型的重要性分数，并基于所述重要性分数对每个交互物品项的各行为类型进行重要性排序；

S3、根据被推荐项分数与交互物品项的各行为类型的重要性顺序，对每个该用户的被推荐项所对应的每个交互过的物品进行过滤，得到部分行为类型子集，并生成对应部分行为类型子集的重要性分数；

S4、根据重要性分数对用户交互历史中的候选解释进行过滤；

S5、基于过滤后的候选解释确定待定解释；

S6、基于待定解释获取更多的候选解释；

S7、若S6中获取的候选解释能够作为解释的，则取代S5中确定的待定解释，返回S6；若S6中所获取的候选解释中没有作为解释的，则S5中获取的待定解释为最终解释。

优选的，所述数据集中的数据包括click、fav、cart以及buy行为类型；将任意一个行为类型作为目标行为输入多行为推荐模型中，得到用户对各物品进行的所对应的行为类型的预测结果。

优选的，所述步骤S2包括以下步骤：

S21、基于推荐项得到做出推荐时的用户历史交互行为集为H；

S22、在用户历史交互行为集为H基础上，其子集表示为H_i,o，其中i表示物品，o为集合或数字；i物品以外的物品及行为类型不变；若为数字，则取0-y，y为物品i行为类型数，0表示该物品i所有行为类型在该子集中都不保留，1-y分别表示为该物品i仅在该子集中保留一种行为类型；若为集合，集合中的每个元素表示一种行为类型，表示该物品i在该子集中需去除集合中的行为类型，即若有集合X_j，j表示集合中行为类型数量，取1-y，j等于y时，H_i,0等同于对于当前用户的每个交互物品，得到反事实的用户历史交互行为子集H_i,0；

S23、对于交互物品的每种行为类型，都有一个仅包括本行为类型交互的反事实行为集H_i,j；将不同反事实行为集H_i,j导入多行为推荐模型得到交互物品i的行为类型j的重要性分数为：

式中：表示在用户历史交互行为集H中物品i仅保留一种行为类型j的反事实行为集下，第k个推荐项的得分；/>表示在用户历史交互行为集H中物品i去除所有行为类型j的反事实行为集下，第k个推荐项的得分；α_<i,j,k>表示在第k个推荐项下，交互物品i的行为类型j的重要性分数；

S24、将解释第k项被推荐项时，交互物品i的各行为类型按重要性分数进行降序排序。

4.根据权利要求1所述的基于多行为推荐模型的模型不可知反事实解释方法，其特征在于，所述步骤S3中部分行为类型子集的重要性分数计算方法如下所述：

式中：表示在用户历史交互行为集H下，第k个推荐项的得分；/>表示在用户历史交互行为集H中物品i去除X_j中行为类型的反事实行为集下，第k个推荐项的得分；表示在第k个推荐项下，交互物品i的行为类型子集X_j的重要性分数。

优选的，步骤S4中，描述的候选解释是针对某个在被推荐列表中的被推荐项目，候选解释本身是一个用户交互历史的子集，若交互历史去掉该子集后，得到的被推荐列表中没有那项被推荐项目，该子集即对该被推荐项目的解释；描述的过滤是指得到各自包括不同各物品总行为类型数量的候选解释，各过滤后的候选解释在类型数量的条件下，拥有同类型数量候选解释中重要性分数和的最大值。

优选的，步骤S4中，过滤方法包括以下分步骤：

S41、在指定要解释的被推荐项情况下，对于每个该用户交互过的物品，已知其不同个数行为类型子集和对应的重要性分数；解释第k项被推荐项时，交互物品i行为类型为y种，且已由S24得到物品i物品i行为类型重要性的降序排序，则物品i的拥有最大重要性分数不同行为类型数量的行为类型子集为X_j，j为整数从1取到y，分别表示按降序顺序要去除的不同数量的行为类型集合。由此，候选解释的过滤方法实际上是有所变化的0-1背包问题；

S42、这个问题表示为，候选解释中最大包括L个各物品总行为类型，用户共有N个交互物品，每个物品若在候选解释中，则有其交互历史行为类型数量y种被选取情况。以w_i,j表示物品i的第j种情况下的行为类型数，即j；v_i,j表示物品i的第j种情况下的重要性分数，即DP表示这个问题的状态转移矩阵，是一个N*L的矩阵，dp_n,l为矩阵中一项，表示在限定前n项交互物品且最大包括l个各物品总行为类型的条件下，能得到的最大重要性分数和。在求得该和的过程中，对包括进的物品与行为类型进行记录，能得到每项最大重要性分数和对应的候选解释。求每项的公式如下：

其中，j在物品i行为类型数量范围内任取整值，且取值须大于等于l。对矩阵DP，由左至右、由上至下得到每一矩阵项结果。在得到结果时，记录其是否包括某物品、包括该物品几种行为类型。第N行结果即为候选解释重要性分数和，由记录可得候选解释具体内容。

优选的，所述步骤S5中,将过滤后的候选解释以包括类型数量升序排序,根据顺序选择候选解释，实验将候选解释从原始交互中删掉后，目标被解释推荐项目是否脱离被推荐列表，直到选择到的一个候选解释使得目标被解释推荐项目脱离被推荐列表，或者所有候选解释都无法使得目标被解释推荐项目脱离被推荐列表，若都不能作为解释，即该用户没有做任何交互也会被推荐该物品，则该被推荐物品是推荐***冷启动的推荐物品，直接用冷启动作为推荐理由。

优选的，所述步骤S6中,新候选解释获得方法为：在待定解释的基础上，随机加入未进入待定解释的物品，并对原本包括的部分物品进行随机删除，直到候选解释各物品行为类型总数比待定解释的小。加入物品的行为类型都默认为最大数量。取候选解释时，第一个候选解释随机加入一个物品，第二个候选解释随机加入两个，依次递增，直至不能满足行为类型总数条件，停止取候选解释，每个候选解释计算优先级公式：

其中，τ为超参数，范围取(0,1)，m为设定的推荐列表长度，t为被解释推荐项目，C为候选解释，rank(t；C)为当用候选解释C为输入时t的被推荐顺序，i为候选解释中每个物品。β_<i,Xj,k>指示每个物品在候选解释中的行为类型重要性分数和，对于存在于待定解释的物品，取行为类型和类型数量都不变，因此此项不变；对于相比待定解释增加的物品，j取该物品能取的最大值，即该物品行为类型数，|C|为候选解释各物品行为类型总数。

优选的，所述步骤S7中,为每个候选解释按优先级分数降序排序。

本发明的有益效果包括：

1、本发明通过对单行为与多行为推荐***中交互历史、偏好、结果的因果分析，以及对行为类型间关系的分析，明确了在指定被解释项、指定交互物品的情况下，各行为类型的重要性分数，以及行为类型子集的过滤与重要性分数，实现了依据行为类型对候选解释搜索空间的过滤，进一步实现了使用模型不可知反事实解释方法来解释多行为推荐模型。

2、本发明模型的选取只要满足可以对用户交互历史进行修改来作输入，能够得到对该用户的推荐及推荐分数来作输出，就可以进行解释，不需要也不能对模型内部结构有任何涉及。

附图说明

图1为一种基于多行为推荐模型的模型不可知反事实解释方法的流程图。

图2为单行为推荐***的因果图。

图3为多行为推荐***的因果图。

图4为四种行为类型情况下可能的行为类型间关系示意图。

图5为指定用户对指定物品的可能的行为类型间关系示意图。

具体实施方式

下面对本发明的具体实施方式进行描述，以便于本技术领域的技术人员理解本发明，但应该清楚，本发明不限于具体实施方式的范围，对本技术领域的普通技术人员来讲，只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内，这些变化是显而易见的，一切利用本发明构思的发明创造均在保护之列。

实施例

如图1所示，本实施例，一种基于多行为推荐模型的模型不可知反事实解释方法，包括以下步骤：

S1、确定要进行解释的模型、该模型进行推荐基于的数据集，在对一个用户作推荐时，输入为用户的交互历史，输出为被推荐项与每项的推荐分数；

其中，要进行的解释是模型不可知解释，要点就是要将模型当作黑盒，在对模型内部结构一概不知的情况下进行解释，因此模型的选取只要满足可以对用户交互历史进行修改来作输入，能够得到对该用户的推荐及推荐分数来作输出，就可以进行解释。不需要也不能对模型内部结构有任何涉及。

其中，确定要进行解释的模型需为多行为推荐模型，其进行推荐基于的数据需要包括多种行为类型，如click、fav、cart、buy等，并且需要以一种行为作为目标行为。目标行为，为支持的行为类型中的一种，模型最终得出的结果是对用户进行该类型行为对象的预测。如目标行为是buy，模型最终得到的结果是对用户对各物品进行buy行为的可能性的预测。

其中，本发明所述的被解释模型为对包括上述四种行为类型的数据集进行处理的多行为推荐模型，但本发明提供的一种基于多行为推荐模型的模型不可知反事实解释方法能够应用于并非是基于上述四种行为类型的多行为推荐模型来进行解释。

其中，对每个用户进行推荐得到的结果，就是被解释的对象，即是说需要解释为什么对该用户进行了该推荐，解释，即该用户历史交互行为集的一个子集。在此基础上，通过反事实这一方法的特性，能够进一步得到有可操作性的解释，即如果没有上述进行该推荐的原因，那该用户会被推荐什么。

这里要进行解释的模型采用MBGMN，能够满足可以对用户交互历史进行修改来作输入，能够得到对该用户的推荐及推荐分数来作输出这两个条件。数据集采用被广泛应用的电商数据集，包括click、fav、cart、buy四种行为，目标行为是buy，并在预处理阶段去掉交互次数小于5的用户和物品。

S2、确定一个要解释的被推荐项与被推荐的用户，依据用户交互历史中的每个交互物品项，确定每个交互物品项的各行为类型重要性排序；

如图2所示，在单行为推荐***情况下，H为用户交互历史，P为用户对物品的偏好，S为模型预测的结果。三者之间有着明显的因果关系，推荐***通过交互历史得到用户对物品的偏好，再将其结合交互历史得到预测结果。这其中隐含着行为类型，如点击或购买等，只是在单行为条件下，行为类型本身不是一个变量，而是模型隐含的描述。如单行为为点击，H为用户点击交互历史，P为用户对物品进行点击的偏好，S为模型预测用户对物品进行点击行为的结果。但是如图3所示，在多行为推荐***情况下，例如一共有四种行为类型，其中一种为目标行为，H为用户包含至少一种行为类型的交互历史，P1～P2为用户对物品进行四种行为的偏好，S为模型预测用户对物品进行目标行为的结果。交互历史、偏好、结果三者之间依然有着明显的因果关系，但相对于单行为推荐***，多行为推荐***中因为拥有多种行为类型，用户对物品的偏好根据行为类型分开了。其中，对于每个用户而言，即使H中只有一种行为类型，P1～P2也会存在，因为推荐模型会关联其他用户。此外，因为在多行为这一异质性数据环境下，行为类型之间有着复杂的依赖关系，在预测用户对物品进行目标行为时，这里不会仅考虑用户对物品进行目标行为的偏好，而是会考虑多种行为偏好。因此，对于使用模型不可知方法来解释多行为推荐模型这个问题而言，可知，对于一个用户，其交互历史中的每个物品的每种行为类型，对不同的被推荐项的作用不同。

如图4所示，即使是指定用户与指定交互物品，其交互历史中行为类型间也有着复杂的依赖关系，其外在表现就是从一种行为类型到另一种行为类型的这种时序上的变化。在具有click、fav、cart、buy四种行为类型的环境下，对于指定用户与指定交互物品，若其交互历史中具有四种交互类型，其行为类型间关系可能表达为图5。需要注意，图5仅是图4一种可能的子集，其它满足条件的子集也有可能。图5描述了在目标行为是buy的情况下，各行为类型间一种可能的关系。这种关系不是单纯时序上的行为类型转换，而是在以buy为目标行为的前提下，各行为类型到目标行为的可能路径。因为是到目标行为的可能路径，buy不向其它行为类型指，其它双向箭头也取到目标行为更为可能的路径方向。这种路径隐含的是一名用户在行为类型上的抽象习惯，并且在不同的物品上，这种抽象的在不同行为类型间转变的习惯不同。即是说行为类型间的关系不确定；在不同物品上，行为类型间的关系会变化。

即在不同的被推荐项情况下，交互历史中同一物品的各行为类型对结果作用的强度不同，强度排序也不同。而在指定被推荐项情况下，交互历史中同一物品的各行为类型对结果作用的强度仍然不同，但用户在该物品上行为类型转化的抽象习惯是一定的，被推荐项是确定的，那么用户交互该物品各行为类型对被推荐项的重要程度排序就是确定的。

由此引入行为类型重要性分数，该重要性分数排序即为对于指定被推荐项指定交互物品的各行为类型重要性排序，于是步骤S2包括以下分步骤：

S21、已知对于目标需要被解释的推荐项，做出推荐时的用户历史交互行为集为H；

S22、在用户历史交互行为集为H基础上，其子集表示为H_i,o，其中i表示物品，o为集合或数字；i物品以外的物品及行为类型不变；若为数字，则取0-y，y为物品i行为类型数，0表示该物品i所有行为类型在该子集中都不保留，1-y分别表示为该物品i仅在该子集中保留一种行为类型；若为集合，集合中的每个元素表示一种行为类型，表示该物品i在该子集中需去除集合中的行为类型，即若有集合X_j，j表示集合中行为类型数量，取1-y，j等于y时，H_i,0等同于

S23、对于交互物品的每种行为类型，都有一个仅包括本行为类型交互的反事实行为集H_i,j。将不同行为集导入模型得到结果，在行为集H_i,j情况下，得到的被推荐项每项对应分数为对于第k项被推荐项，其分数为/>则解释第k项被推荐项时，交互物品i的行为类型j的重要性分数为：

S3、根据被推荐项分数与交互物品项的各行为类型重要性顺序，对每个该用户的被推荐项，为该用户的每个交互过的物品过滤出部分行为类型子集，并生成重要性分数；

其中，用户的每个交互过的物品过滤出的部分行为类型子集，在解释第k项被推荐项，交互物品为i的情况下，与其各行为类型重要性分数降序顺序与行为类型数量有关。解释第k项被推荐项时，交互物品i行为类型为y种，且已由S24得到物品i物品i行为类型重要性的降序排序，则物品i的拥有最大重要性分数不同行为类型数量的行为类型子集为X_j，j为整数从1取到y，分别表示按降序顺序要去除的不同数量的行为类型集合。则其中等同于H_i,0。则交互过的物品过滤出的部分行为类型子集重要性分数为：

S4、根据重要性分数对候选解释进行过滤；

其中，候选解释是针对某个在被推荐列表中的被推荐项目来说的，候选解释本身是一个用户交互历史的子集，若交互历史去掉该子集后，得到的被推荐列表中没有那项被推荐项目，该子集即叫做对该被推荐项目的解释。

其中，过滤是指得到各自包括不同各物品总行为类型数量的候选解释，各过滤后的候选解释在类型数量的条件下，拥有同类型数量候选解释中重要性分数和的最大值。

过滤方法包括以下分步骤：

其中，j在物品i行为类型数量范围内任取整值，且取值须大于等于l。对矩阵DP，

由左至右、由上至下得到每一矩阵项结果。在得到结果时，记录其是否包括某物品、包括该物品几种行为类型。第N行结果即为候选解释重要性分数和，由记录可得候选解释具体内容。

S5、得到作为解释的候选解释，称为待定解释；

其中，将过滤后的候选解释以包括类型数量升序排序,根据顺序选择候选解释，实验将候选解释从原始交互中删掉后，目标被解释推荐项目是否脱离被推荐列表，直到选择到的一个候选解释使得目标被解释推荐项目脱离被推荐列表，或者所有候选解释都无法使得目标被解释推荐项目脱离被推荐列表。

若都不能作为解释，即该用户没有做任何交互也会被推荐该物品，则该被推荐物品是推荐***冷启动的推荐物品，直接用冷启动作为推荐理由。

S6、获得更多候选解释；

其中，新候选解释获得方法为：在待定解释的基础上，随机加入未进入待定解释的物品，并对原本包括的部分物品进行随机删除，直到候选解释各物品行为类型总数比待定解释的小。加入物品的行为类型都默认为最大数量。取候选解释时，第一个候选解释随机加入一个物品，第二个候选解释随机加入两个，依次递增，直至不能满足行为类型总数条件，停止取候选解释。

为每个候选解释计算优先级公式：

其中，τ为超参数，范围取(0,1)，m为设定的推荐列表长度，t为被解释推荐项目，C为候选解释，rank(t；C)为当用候选解释C为输入时t的被推荐顺序，i为候选解释中每个物品。β_<i,Xj,k>指示每个物品在候选解释中的行为类型重要性分数，对于存在于待定解释的物品，取行为类型和类型数量都不变，因此此项不变；对于相比待定解释增加的物品，j取该物品能取的最大值，即该物品行为类型数。|C|为候选解释各物品行为类型总数。

S7、若新候选解释中有作为解释的，取代原待定解释，回到S6；若没有，待定解释就是最终解释。

其中，为每个候选解释按优先级分数降序排序。将按序的第一个可作为解释的候选解释取代原待定解释，回到S6。若这些候选解释中没有可作为解释的，待定解释就是最终解释。

一种基于多行为推荐模型的模型不可知反事实解释方法，使用反事实方法做模型不可知解释是一种公认可行且在原理上具备真实有效性与可操作性的做法，但对于这种解释方法而言，其候选解释的搜索空间过于庞大，以至于效率太低，需要对候选解释进行过滤，并且，传统的推荐***可解释性，不管是模型不可知还是基于模型，都没有涉及拥有异质性数据的多行为推荐***，本发明通过对单行为与多行为推荐***中交互历史、偏好、结果的因果分析，以及对行为类型间关系的分析，明确了在指定被解释项、指定交互物品的情况下，各行为类型的重要性分数，以及行为类型子集的过滤与重要性分数，实现了依据行为类型对候选解释搜索空间的过滤，进一步实现了使用模型不可知反事实解释方法来解释多行为推荐模型。

以上实施例仅用以说明本发明而并非限制本发明所描述的技术方案，尽管本说明书参照上述的各个实施例对本发明已进行了详细的说明，但本发明不局限于上述具体实施方式，因此任何对本发明进行修改或等同替换；而一切不脱离发明的精神和范围的技术方案及其改进，其均应涵盖在本发明的权利要求范围当中。

Claims

1.一种基于多行为推荐模型的模型不可知反事实解释方法，其特征在于，包括以下步骤：

S5、基于过滤后的候选解释确定待定解释；

S6、基于待定解释获取更多的候选解释；

S7、若S6中获取的候选解释能够作为解释的，则取代S5中确定的待定解释，返回S6；若S6中所获取的候选解释中没有作为解释的，则S5中获取的待定解释为最终解释；

所述数据集中的数据包括click、fav、cart以及buy行为类型；将任意一个行为类型作为目标行为输入多行为推荐模型中，得到用户对各物品进行的所对应的行为类型的预测结果，

所述步骤S2包括以下步骤：

S21、基于推荐项得到做出推荐时的用户历史交互行为集为H；

S24、将解释第k项被推荐项时，交互物品i的各行为类型按重要性分数进行降序排序，

所述步骤S3中部分行为类型子集的重要性分数计算方法如下所述：

式中：表示在用户历史交互行为集H下，第k个推荐项的得分；/>表示在用户历史交互行为集H中物品i去除X_j中行为类型的反事实行为集下，第k个推荐项的得分；

表示在第k个推荐项下，交互物品i的行为类型子集X_j的重要性分数；

步骤S4中，过滤方法包括以下分步骤：

S41、在指定要解释的被推荐项情况下，对于每个该用户交互过的物品，已知其不同个数行为类型子集和对应的重要性分数；解释第k项被推荐项时，交互物品i行为类型为y种，且已由S24得到物品i行为类型重要性的降序排序，则物品i的拥有最大重要性分数不同行为类型数量的行为类型子集为X_j，j为整数从1取到y，分别表示按降序顺序要去除的不同数量的行为类型集合，由此，候选解释的过滤方法实际上是有所变化的0-1背包问题；

S42、这个问题表示为，候选解释中最大包括L个各物品总行为类型，用户共有N个交互物品，每个物品若在候选解释中，则有其交互历史行为类型数量y种被选取情况，以w_i,j表示物品i的第j种情况下的行为类型数，即j；v_i,j表示物品i的第j种情况下的重要性分数，即β_<i,Xj,k>，DP表示这个问题的状态转移矩阵，是一个N*L的矩阵，dp_n,l为矩阵中一项，表示在限定前n项交互物品且最大包括l个各物品总行为类型的条件下，能得到的最大重要性分数和，在求得该和的过程中，对包括进的物品与行为类型进行记录，能得到每项最大重要性分数和对应的候选解释，求每项的公式如下：

dp_1,l＝max{0,β_<n,Xj,k>}

dp_n,l＝max{dp_n-1,l,dp_n-1,l-wi,j+v_i,j}

其中，j在物品i行为类型数量范围内任取整值，且取值须大于等于l，对矩阵DP，由左至右、由上至下得到每一矩阵项结果，在得到结果时，记录其是否包括某物品、包括该物品几种行为类型，第N行结果即为候选解释重要性分数和，由记录可得候选解释具体内容。

2.根据权利要求1所述的基于多行为推荐模型的模型不可知反事实解释方法，其特征在于，步骤S4中，描述的候选解释是针对某个在被推荐列表中的被推荐项目，候选解释本身是一个用户交互历史的子集，若交互历史去掉该子集后，得到的被推荐列表中没有那项被推荐项目，该子集即对该被推荐项目的解释；描述的过滤是指得到各自包括不同各物品总行为类型数量的候选解释，各过滤后的候选解释在类型数量的条件下，拥有同类型数量候选解释中重要性分数和的最大值。

3.根据权利要求1所述的基于多行为推荐模型的模型不可知反事实解释方法，其特征在于，所述步骤S5中,将过滤后的候选解释以包括类型数量升序排序,根据顺序选择候选解释，实验将候选解释从原始交互中删掉后，目标被解释推荐项目是否脱离被推荐列表，直到选择到的一个候选解释使得目标被解释推荐项目脱离被推荐列表，或者所有候选解释都无法使得目标被解释推荐项目脱离被推荐列表，若都不能作为解释，即该用户没有做任何交互也会被推荐该物品，则该被推荐物品是推荐***冷启动的推荐物品，直接用冷启动作为推荐理由。

4.根据权利要求1所述的基于多行为推荐模型的模型不可知反事实解释方法，其特征在于，所述步骤S6中，新候选解释获得方法为：在待定解释的基础上，随机加入未进入待定解释的物品，并对原本包括的部分物品进行随机删除，直到候选解释各物品行为类型总数比待定解释的小，加入物品的行为类型都默认为最大数量，取候选解释时，第一个候选解释随机加入一个物品，第二个候选解释随机加入两个，依次递增，直至不能满足行为类型总数条件，停止取候选解释，每个候选解释计算优先级公式：

其中，τ为超参数，范围取(0,1)，m为设定的推荐列表长度，t为被解释推荐项目，C为候选解释，rank(t；C)为当用候选解释C为输入时t的被推荐顺序，i为候选解释中每个物品，β_<i,Xj,k>指示每个物品在候选解释中的行为类型重要性分数，对于存在于待定解释的物品，取行为类型和类型数量都不变，因此此项不变；对于相比待定解释增加的物品，j取该物品能取的最大值，即该物品行为类型数，|C|为候选解释各物品行为类型总数。

5.根据权利要求1所述的基于多行为推荐模型的模型不可知反事实解释方法，其特征在于，所述步骤S7中,为每个候选解释按优先级分数降序排序。