CN112435103B - 一种事后多样性解释的智能推荐方法及*** - Google Patents
一种事后多样性解释的智能推荐方法及*** Download PDFInfo
- Publication number
- CN112435103B CN112435103B CN202011507787.2A CN202011507787A CN112435103B CN 112435103 B CN112435103 B CN 112435103B CN 202011507787 A CN202011507787 A CN 202011507787A CN 112435103 B CN112435103 B CN 112435103B
- Authority
- CN
- China
- Prior art keywords
- model
- black box
- sample data
- baseline
- interpretation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 25
- 238000009826 distribution Methods 0.000 claims description 26
- 238000007781 pre-processing Methods 0.000 claims description 12
- 238000012549 training Methods 0.000 claims description 10
- 238000010606 normalization Methods 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 238000013135 deep learning Methods 0.000 description 6
- 238000001914 filtration Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000001364 causal effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 235000013194 Lyophyllum decastes Nutrition 0.000 description 1
- 240000005856 Lyophyllum decastes Species 0.000 description 1
- 230000003042 antagnostic effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种事后多样性解释的智能推荐方法及***,根据用户历史交易记录收集包含商品解释说明信息的样本数据,构建样本集,并对样本集中的每条样本数据进行预处理,然后将无可解释的推荐模型作为黑盒模型,将n种可解释算法作为黑盒模型的基线模型,利用预处理后的样本数据对模型进行训练,根据生成的KL散度值筛选出最优匹配基线模型,本发明给出了一种精确度与可解释性同时兼顾的推荐方法,为没有可解释的算法提供了高精度的事后可解释,同时赋予推荐结果多样的解释,提高了用户对推荐算法的忠诚度与满意度。
Description
技术领域
本发明涉及计算机技术领域,具体涉及一种事后多样性解释的智能推荐方法及***。
背景技术
在推荐***中,可解释推荐的目的是向用户解释为什么的回答,解决推荐的原因,有助于提高推荐***的透明度、说服力、有效性、可信度和用户满意度。早期基于内容的推荐就可以直接向用户解释为什么要从众多的候选物品里推荐这个物品给用户;协同过滤通过群体智慧进行解释,但它对于很多基于内容的推荐算法解释性不够直观;隐语义模型(LFM),包括基于协调过滤(CF)的矩阵分解方法可解释性较差;近几年深度学习对个性化推荐的性能有所提升,但是由于深度模型的黑盒特性,使得推荐模型的可解释性有一定困难;近年来,在人工智能究领域的研究者们也意识到可解释人工智能(Expainable AI)的重要性,在深度学习,计算机视觉,自动驾驶,自然语言处理等任务中都需要解决可解释人工智能(Expainable AI)这个任务。
可解释性和有效性被认为是模型设计中两个相互冲突的目标,物品们必须权衡——我们可以选择一个简单的模型来获得更好的可解释性,或者选择一个复杂的模型来获得更好的准确性,同时将牺牲可解释性。然而,最近的证据表明,在设计推荐模型时,这两个目标不一定相互冲突。例如,最先进的技术如深度表示学习方法,可以帮助我们设计既有效又可解释的推荐模型。开发可解释的深度模型在更广泛的AI领域中也是一个具有吸引力的方向,这不仅推动了可解释推荐研究的进展,也推动了可解释机器学习问题的基本原理的进展。
事后可解释推荐致力于寻找一种方法对深度学习训练后的黑盒推荐算法进行解释,用一个可解释的模型逼近黑盒模型可以在维持精确度的基础上提高模型的可解释性。这类方法在固定原有推荐算法的基础上去探究黑盒模型的分布,因而不会改变精确率。事后可解释推荐吸引了相关专家学者的注意,进而涌现出一系列可解释推荐算法,主要包括基于知识图谱的可解释推荐,基于关联规则的可解释推荐,基于因果推理的可解释推荐等,但通过这些方法得到的解释都比较单一,无法获得多样的可解释。
发明内容
针对现有技术的不足,本发明提出一种事后多样性解释的智能推荐方法,包括:
步骤1:根据用户历史交易记录收集包含商品解释说明信息的样本数据,构建样本集;
步骤2:对样本集中的每条样本数据进行预处理,包括:
步骤2.1:对每条样本数据是否有文本评论、社交关系、商品特征进行标记;
步骤2.2:利用公式(1)对每条样本数据中的商品评分值进行归一化处理,将商品评分值限制在(0,1)范围内,
式中,x表示每条样本数据中的商品评分值,xmax表示样本集中所有样本数据评分值中的最大值,xmin表示样本集中所有样本数据评分值中的最小值,x*表示归一化处理后的商品评分值;
步骤3:将无可解释的推荐模型作为黑盒模型,将n种可解释算法作为黑盒模型的基线模型;
步骤4:利用预处理后的样本数据对黑盒模型、基线模型同时进行训练,输出推荐结果,并生成相应模型参数的概率分布;
步骤5:筛选出与黑盒模型推荐结果一致的基线模型,作为候选基线模型;
步骤6:利用KL散度计算黑盒模型生成的概率分布与各候选基线模型生成的概率分布之间的散度值;
步骤7:将所有的散度值进行从小到大排序,选取前K个散度值对应的基线模型作为黑盒模型的最优匹配基线模型,其中K小于等于n;
步骤8:利用K个最优匹配基线模型生成黑盒模型输出的推荐商品的K种可解释说明。
所述KL散度表述为:
式中,P为黑盒模型的模型参数的概率分布,Q为基线模型的模型参数的概率分布,KL(P||Q)为概率分布P、Q的KL散度值。
一种实现事后多样性解释的智能推荐方法的推荐***,包括样本采集模块、样本数据预处理模块、可解释说明输出模块;
所述样本采集模块用于提取用户历史交易记录中包含商品解释说明信息的样本数据;
所述样本数据预处理模块用于对每条样本数据进行预处理;
所述可解释说明输出模块用于构建黑盒模型的基线模型,并对黑盒模型、基线模型同时进行训练,根据KL散度值寻找最优匹配基线模型,利用最优匹配基线模型输出黑盒模型输出的推荐商品的K种可解释说明。
本发明的有益效果是:
本发明提出了一种事后多样性解释的智能推荐方法及***,将无可解释的推荐模型作为黑盒模型,可解释较强的可解释算法作为黑盒模型的基线模型,通过构建的样本集同时对黑盒模型、基线模型进行训练,利用KL散度值寻找与黑盒模型最为匹配的基线模型,本发明给出了一种精确度与可解释性同时兼顾的推荐方法,为没有可解释的算法提供了高精度的事后可解释,同时赋予推荐结果多样的解释,提高了用户对推荐算法的忠诚度与满意度。
附图说明
图1为本发明中的事后多样性解释的智能推荐方法流程图。
图2为本发明中的所述推荐***框图。
具体实施方式
下面结合附图和具体实施实例对发明做进一步说明。现有的可解释模型主要分为两类,基于模型的可解释推荐算法和事后可解释推荐算法。基于模型的可解释推荐算法大多需要引入一些附加信息,包括文本评论、商品特征及社交信息等,基于此用深度学习进行建模,提取特征。这类方法存在的两个主要缺点是:(1)附加信息的获得代价较高,(2)基于特征的建模将可解释性目标与精确度目标联合训练,一般会存在互斥性,即精确度好的可解释性差,可解释性强的精确度又受到影响。事后可解释推荐致力于寻找一种方法对深度学习训练后的黑盒推荐算法进行解释,用一个可解释的模型逼近黑盒模型可以在维持精确度的基础上提高模型的可解释性。这类方法在固定原有推荐算法的基础上去探究黑盒模型的分布,因而不会改变精确率。基于知识图谱的可解释推荐、基于关联规则的可解释推荐、基于因果推理的可解释推荐等,这些方法得到的解释都比较单一,例如:基于关联规则的只能获得诸如啤酒-》炸鸡类似的可解释形式,无法获得多样的可解释。基于这个难点,本发明着眼于设计一个解释多样的事后可解释推荐方法和***,可用来为许多传统黑盒方法预测分布,提供合理的解释。
如图1所示,一种事后多样性解释的智能推荐方法,包括:
步骤1:从movielens电影官网上收集用户一段时间内购买电影的历史交易记录,例如从movielens官网收集注册用户的账号Id,根据用户Id爬取用户的购买商品的历史交易记录,然后根据用户历史交易记录收集包含商品解释说明信息的样本数据,构建样本集;
步骤2:对样本集中的每条样本数据进行预处理,包括:
步骤2.1:对样本数据是否有文本评论、社交关系、商品特征进行标记整理,具体表述为设置文本字段表示评论信息,根据注册用户的“已关注好友”构建好友关系矩阵,为商品添加特征信息,如导演,主演;
步骤2.2:利用公式(1)对每条样本数据中的商品评分值进行归一化处理,将商品评分值限制在(0,1)范围内,
式中,x表示每条样本数据中的商品评分值,xmax表示样本集中所有样本数据评分值中的最大值,xmin表示样本集中所有样本数据评分值中的最小值,x*表示归一化处理后的商品评分值;
步骤3:将无可解释的推荐模型作为黑盒模型,将n种可解释算法作为黑盒模型的基线模型;
调研现有的可解释性较强的算法作为基线模型,如经典的基于特征的显因子模型(EFM)算法,它将商品特征进行建模引入可解释建模,基于社交网络的可解释算法(NNF算法),它将好友关系纳入考虑,基于知识图谱的策略指导的路径推理算法(KGPR算法),它在社交图谱上收集的路径信息作为解释展示给用户。
本实施方式中,选取的可解释较强的算法作为基线模型,包括经典的基于特征的显因子模型(EFM)算法,它将商品特征进行建模引入可解释建模;基于社交网络的可解释算法(NNF算法),它将好友关系纳入考虑;基于知识图谱的策略指导的路径推理算法(KGPR算法),它在社交图谱上收集的路径信息作为解释展示给用户。选取的无可解释的算法包括贝叶斯个性化排序算法(BPR算法),对抗个性化排序算法(APR算法)。
选择现有的无可解释性的推荐模型作为黑盒模型,即不关心黑盒推荐模型的内部结构而只想为其赋予可解释性。用KL散度衡量黑盒模型与这些基线模型的分布差异并对基线模型进行微调来更好的拟合黑盒模型。
步骤4:利用预处理后的样本数据对黑盒模型、基线模型同时进行训练,通过黑盒模型、基线模型生成相应模型参数的概率分布;
步骤4.1:用高斯分布初始化黑盒模型和基线模型的参数概率分布;
步骤4.2:用Adam梯度下降方法对黑盒模型的损失函数和基线模型的损失函数进行训练,使两个损失函数下降至基本保持稳定;
对基线模型结果进行过滤,保留推荐结果与黑盒模型推荐结果一致的基线模型的KL散度值,根据KL散度分布值进行排序,其中KL散度小的排序较高,KL散度大的排序较低,选择top-K的可解释形式展示给用户,这样可为用户提供K种解释形式,触及用户的关注点。
步骤5:筛选出与黑盒模型推荐结果一致的基线模型,作为候选基线模型;
步骤6:利用KL散度计算黑盒模型生成的概率分布与各候选基线模型生成的概率分布之间的散度值;散度值越小表明两个分布越相似;
所述KL散度(又称交叉熵)表述为:
式中,P为黑盒模型的模型参数的概率分布,Q为基线模型的模型参数的概率分布,KL(P||Q)为概率分布P、Q的KL散度值。
步骤7:将所有的散度值进行从小到大排序,选取前K个散度值对应的基线模型作为黑盒模型的最优匹配基线模型,其中K小于等于n;
步骤8:利用K个最优匹配基线模型生成黑盒模型输出的推荐商品的K种可解释说明。
一种采用事后多样性解释的智能推荐方法的推荐***,可以采用python编程语言基于pycharm编程平台实现,另外在训练阶段使用深度学习工具包tensorflow,如图2所示,包括样本采集模块、样本数据预处理模块、可解释说明输出模块;
所述样本采集模块用于提取用户历史交易记录中包含商品解释说明信息的样本数据;
所述样本数据预处理模块用于对每条样本数据进行预处理;
所述可解释说明输出模块用于构建黑盒模型的基线模型,并对黑盒模型、基线模型同时进行训练,根据KL散度值寻找最优匹配基线模型,利用最优匹配基线模型输出黑盒模型输出的推荐商品的K种可解释说明。
Claims (3)
1.一种事后多样性解释的智能推荐方法,其特征在于,包括如下步骤:
步骤1:根据用户历史交易记录收集包含商品解释说明信息的样本数据,构建样本集;
步骤2:对样本集中的每条样本数据进行预处理,包括:
步骤2.1:对每条样本数据是否有文本评论、社交关系、商品特征进行标记;
步骤2.2:利用公式(1)对每条样本数据中的商品评分值进行归一化处理,将商品评分值限制在(0,1)范围内,
式中,x表示每条样本数据中的商品评分值,xmax表示样本集中所有样本数据评分值中的最大值,xmin表示样本集中所有样本数据评分值中的最小值,x*表示归一化处理后的商品评分值;
步骤3:将无可解释的推荐模型作为黑盒模型,将n种可解释算法作为黑盒模型的基线模型;
步骤4:利用预处理后的样本数据对黑盒模型、基线模型同时进行训练,输出推荐结果,并生成相应模型参数的概率分布;
步骤5:筛选出与黑盒模型推荐结果一致的基线模型,作为候选基线模型;
步骤6:利用KL散度计算黑盒模型生成的概率分布与各候选基线模型生成的概率分布之间的散度值;
步骤7:将所有的散度值进行从小到大排序,选取前K个散度值对应的基线模型作为黑盒模型的最优匹配基线模型,其中K小于等于n;
步骤7:利用K个最优匹配基线模型生成黑盒模型输出的推荐商品的K种可解释说明。
2.根据权利要求1所述的一种事后多样性解释的智能推荐方法,其特征在于,所述KL散度表述为:
式中,P为黑盒模型的模型参数的概率分布,Q为基线模型的模型参数的概率分布,KL(P||Q)为概率分布P、Q的KL散度值。
3.一种实现事后多样性解释的智能推荐方法的推荐***,其特征在于,包括样本采集模块、样本数据预处理模块、可解释说明输出模块;
所述样本采集模块用于提取用户历史交易记录中包含商品解释说明信息的样本数据;
所述样本数据预处理模块用于对每条样本数据进行预处理;
所述可解释说明输出模块用于构建黑盒模型的基线模型,并对黑盒模型、基线模型同时进行训练,根据KL散度值寻找最优匹配基线模型,利用最优匹配基线模型输出黑盒模型输出的推荐商品的K种可解释说明。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011507787.2A CN112435103B (zh) | 2020-12-18 | 2020-12-18 | 一种事后多样性解释的智能推荐方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011507787.2A CN112435103B (zh) | 2020-12-18 | 2020-12-18 | 一种事后多样性解释的智能推荐方法及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112435103A CN112435103A (zh) | 2021-03-02 |
CN112435103B true CN112435103B (zh) | 2023-11-24 |
Family
ID=74696799
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011507787.2A Active CN112435103B (zh) | 2020-12-18 | 2020-12-18 | 一种事后多样性解释的智能推荐方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112435103B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113486242A (zh) * | 2021-07-13 | 2021-10-08 | 同济大学 | 一种基于推荐***的无侵入个性化解释方法及*** |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108550046A (zh) * | 2018-03-07 | 2018-09-18 | 阿里巴巴集团控股有限公司 | 一种资源和营销推荐方法、装置及电子设备 |
CN111222332A (zh) * | 2020-01-06 | 2020-06-02 | 华南理工大学 | 一种结合注意力网络和用户情感的商品推荐方法 |
CN111259238A (zh) * | 2020-01-13 | 2020-06-09 | 山西大学 | 一种基于矩阵分解的事后可解释性推荐方法及装置 |
-
2020
- 2020-12-18 CN CN202011507787.2A patent/CN112435103B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108550046A (zh) * | 2018-03-07 | 2018-09-18 | 阿里巴巴集团控股有限公司 | 一种资源和营销推荐方法、装置及电子设备 |
CN111222332A (zh) * | 2020-01-06 | 2020-06-02 | 华南理工大学 | 一种结合注意力网络和用户情感的商品推荐方法 |
CN111259238A (zh) * | 2020-01-13 | 2020-06-09 | 山西大学 | 一种基于矩阵分解的事后可解释性推荐方法及装置 |
Non-Patent Citations (2)
Title |
---|
基于深度学习的推荐***研究综述;黄立威;江碧涛;吕守业;刘艳博;李德毅;;计算机学报(07);191-219 * |
机器学习隐私保护研究综述;谭作文;张连福;;软件学报(07);201-230 * |
Also Published As
Publication number | Publication date |
---|---|
CN112435103A (zh) | 2021-03-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9710760B2 (en) | Multi-facet classification scheme for cataloging of information artifacts | |
Pal et al. | Pattern recognition algorithms for data mining | |
AU2011269676B2 (en) | Systems of computerized agents and user-directed semantic networking | |
Akerkar et al. | Intelligent techniques for data science | |
CN102855268A (zh) | 基于属性关系进行图像排序的方法和*** | |
Akerkar | Advanced data analytics for business | |
Kumar et al. | Sentic computing for aspect-based opinion summarization using multi-head attention with feature pooled pointer generator network | |
Ahmed et al. | Pattern Recognition: An Introduction | |
Ma et al. | A visual analytical approach for transfer learning in classification | |
Chakraborty et al. | Data classification and incremental clustering in data mining and machine learning | |
CN112435103B (zh) | 一种事后多样性解释的智能推荐方法及*** | |
Matthews et al. | The introduction of a design heuristics extraction method | |
CN108363759A (zh) | 基于结构化数据的主题树生成方法及***及智能对话方法 | |
Sivaselvan | Data mining: Techniques and trends | |
Liu | [Retracted] Art Painting Image Classification Based on Neural Network | |
Jones et al. | The Unsupervised Learning Workshop: Get started with unsupervised learning algorithms and simplify your unorganized data to help make future predictions | |
US11599588B1 (en) | Apparatus and method of entity data aggregation | |
CN109697257A (zh) | 一种基于预分类和特征学习抗噪的网络信息检索方法 | |
Pirozmand et al. | Improving the similarity search between images of agricultural products: An approach based on fuzzy rough theory | |
Neau et al. | In defense of scene graph generation for human-robot open-ended interaction in service robotics | |
TU | Online Text Retrieval Method Based on Convolution Neural Network. | |
US12008409B1 (en) | Apparatus and a method for determining resource distribution | |
Kannan | Visualizing the interactions and relationships from sales data and data-driven automatic product bundling to increase cross-selling | |
Klawonn | Combining Supervised Machine Learning and Structured Knowledge for Difficult Perceptual Tasks | |
Alfaqeeh | uncovering latent structure in social networks using graph embeddings |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |