CN114742643A - 一种金融风控领域的检测交互特征的模型可解释方法 - Google Patents

一种金融风控领域的检测交互特征的模型可解释方法 Download PDF

Info

Publication number
CN114742643A
CN114742643A CN202210487256.4A CN202210487256A CN114742643A CN 114742643 A CN114742643 A CN 114742643A CN 202210487256 A CN202210487256 A CN 202210487256A CN 114742643 A CN114742643 A CN 114742643A
Authority
CN
China
Prior art keywords
model
interactive
gam
training
features
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210487256.4A
Other languages
English (en)
Inventor
苗雨提
王冠
杨根科
褚健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ningbo Institute Of Artificial Intelligence Shanghai Jiaotong University
Original Assignee
Ningbo Institute Of Artificial Intelligence Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ningbo Institute Of Artificial Intelligence Shanghai Jiaotong University filed Critical Ningbo Institute Of Artificial Intelligence Shanghai Jiaotong University
Priority to CN202210487256.4A priority Critical patent/CN114742643A/zh
Publication of CN114742643A publication Critical patent/CN114742643A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Technology Law (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种金融风控领域的检测交互特征的模型可解释方法,涉及图神经网络技术与模型可解释领域,所述方法包括以下步骤:步骤1、根据已有的训练特征和训练标签训练一个加性模型;步骤2、使用交互特征检测模块检测存在的交互特征对,使用得到的所述交互特征对、所述训练标签和所述步骤1的残差再构造一个GAM模型,再将所述加性模型和所述GAM模型相加,得到一个包含所述交互特征对的GAM2模型;步骤3、根据高阶交互存在当且仅当其所有低阶交互均存在的原则,对所述GAM2模型进行多轮迭代,直到某轮迭代交互特征阶数不再增加,得到一个GAMn模型;步骤4、实现可视化与报告导出。

Description

一种金融风控领域的检测交互特征的模型可解释方法
技术领域
本发明涉及图神经网络技术与模型可解释领域,尤其涉及一种金融风控领域的检测交互特征的模型可解释方法。
背景技术
近年来,以机器学习(Machine Learning),尤其是深度学习(DeepLearning)为道标的新一代人工智能技术不断朝着更加先进、复杂和自主的方向发展,给经济和社会的发展带来新的变革机遇。AI的应用引来“物种大爆发”,日益渗透到各行各业和人类生活的方方面面,有望塑造新的经济和社会形态。与此同时,科技伦理也日益成为当前AI技术发展与产业应用中的“必选项”,各界纷纷探索AI的伦理原则、框架和治理机制。
科技伦理的一个核心议题是AI透明度与可解释性(Transparency和Explainability)。2021年11月,***教科文组织(United Nations Educational,Scientific and Cultural Organization,UNESCO)通过首个全球性AI伦理协议《人工智能伦理建议书》(Recommendation on the ethics of artificial intelligence),提出的十大AI原则就包括“透明度与可解释性”,即算法的工作方式和算法训练数据应具有透明度与可解释性。
虽然并非所有的AI***都是“黑盒(black box)算法”,也并非比非AI技术、传统软件或人工程序更加不可解释,但当前而言,机器学习模型,尤其是深度学习模型,往往不透明,难以为人类所理解。在未来,AI的持续进步有望带来感知、学习、决策和行动的自主***。然而,这些***的实际效用受限于机器是否能够充分地向人类用户解释其思想与行动。如果用户想要理解、信任并有效管理新一代人工智能伙伴,AI***的透明度与可解释性就至关重要。因此,近年来,可解释AI(Explainable Artificial Intelligence,XAI)成为AI研究的新兴领域,学术界与产业界纷纷探索理解AI***行为的方法和工具,特别地,可解释性在金融与医疗领域显得尤为关键。
金融科技在互联网的飞速发展使得人们能够很便捷地获取银行提供的金融服务,包括基金、存钱、转账等。涉及借贷业务时,客户也能够以较低的门槛获取一定的借款。因此,在金融服务便捷化的同时,随之而生的欺诈手段也在很快地升级迭代,欺诈的智能化、虚拟化、隐蔽性在提升。从最早的线下为主的线下金融欺诈到有目的性、有组织的团体化金融欺诈,需要银行不断迭代更新风控***,以减少坏账损失。
为了最大程度的减少坏账损失,需要引入精度更高的模型,然而精度更高的模型意味着更高的模型复杂度与更差的可解释性,即在判定坏客户时越难给出合理解释,换而言之,业务人员无法理解模型为什么拒绝一个客户,对于银行是一个比较难以接受的问题。针对上述情况,中国人民银行于2021年3月发布的《人工智能算法金融应用评价规范》中对可解释性评价部分有明确的规定。规定特征需满足下列可解释要求:
1、特征定义应满足相关业务逻辑与规则。
2、特征定义应在***中有明确记录。
3、特征定义应有可详细的数据抽取转换装载(Extraction、Transform、Load,ETL)的指标加工过程的记录。
规定特征衍生需满足下列要求:
1、特征衍生应合理。对于资金类场景,只允许离散的特征交叉,不允许复杂、毫无业务意义的特征交叉。
2、基于业务的特征衍生,应有详细ETL特征衍生加工过程。
3、基于算法的特征衍生,需能展示算法特征衍生的过程和逻辑。
因此,如果模型的算法没有可解释性,那么模型的选择将受到很大程度的限制。
已有的方法主要是用于解释深度学习在图像分析领域的作用,而且通常解释精度较低。对于拥有模糊边界的应用而言,比如图像识别,相对较低的解释精是可以接受。但是对于安全应用,即使对于一个字节的解释偏差,也会导致严重的误解或者错误,相对较低的解释精度变得不可接受。
此外,目前的可解释性方法极大的受限于算法、模型结构、应用场景等因素,尽管可以用来解释深度学习模型的行为决策和预测结果,但是在以下几种情况下,可解释方法可能无法正常工作:
1、如果模型为互动模型,如随机森林,由于目前的可解释性仍然达不到实时的解释,所以解释互动建模的模型还有待研究。
2、特征是否相互关联、特征之间的相互作用会极大地增加模型解释的难度,不仅要考虑特征的显著性,而且要评估不同特征之间的关联性对模型决策的影响。
3、如果模型没有正确地建模因果关系,由于可解释方法直接对模型进行解释,因而缺乏前期对模型建模正确性的测试。
4、如果解释方法的参数设置不正确,那么参数设置会影响解释结果,参数的稳定性直接会影响可解释性的可信度。
因此,本领域的技术人员致力于开发一种金融风控领域的检测交互特征的模型可解释方法,弥补现有技术中关于金融领域AI模型的可解释与交互特征检测方案的缺失。
发明内容
有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是如何优化现有模型解释算法,如局部可信解释方法(Local Interpretable Model-Agnostic Explanations,LIME)、SHAP(ShapleyAdditive exPlanation)、Parzen(Parzen Window)、局部关系图(Partial Dependency Plot,PDP)等,使得现有模型解释算法能够针对特征的关联性个性化地提供带有交互特征的解释结果,且保持与树模型相当的精度。其中某一交互特征示例如下:
Figure BDA0003630447520000031
目前主流的针对金融风控领域的表格型数据的可解释算法包括LIME、SHAP、可解释加速机(Explainable Boosting Machine,EBM)等。其中,大部分可解释算法仅能够提供单个特征的解释结果,而无法检测其中的交互作用,而EBM使用GAM2算法,能够检测两两之间的特征交互,其对比图如图1(LIME)和图2(EBM)所示,其中,EBM的解释结果中包含feature1×feature2的解释项,即为所提供的解释结果中的交互特征解释项。
为实现上述目的,本发明提供了一种金融风控领域的检测交互特征的模型可解释方法,包括以下步骤:
步骤1、根据已有的训练特征和训练标签训练一个加性模型,所述加性模型的分类器表示为F(x):
F(x)=∑fi(xi)
其中,F(x)∈[0,1],xi为所述训练特征或所述训练标签,fi(xi)为每一个xi对整体预测结果的贡献度;
步骤2、使用交互特征检测模块检测存在的交互特征对,使用得到的所述交互特征对、所述训练标签和所述步骤1的残差再构造一个GAM模型,再将所述加性模型和所述GAM模型相加,得到一个包含所述交互特征对的GAM2模型,所述GAM2模型的分类器表示为F2(x):
Figure BDA0003630447520000032
其中,F2(x)∈[0,1],En为所述交互特征检测模块检测出的所述交互特征对的集合,{i,j}表示其中的任一所述交互特征对,fij为针对所述交互特征对{i,j}∈En中的关于xi、xj的变换函数;
步骤3、根据高阶交互存在当且仅当其所有低阶交互均存在的原则,对所述GAM2模型进行多轮迭代,直到某轮迭代交互特征阶数不再增加,得到一个GAMn模型,所述GAMn模型包含n阶交互的分类器表示为Fn(x):
Figure BDA0003630447520000033
其中,Fn(x)∈[0,1],n阶交互的最高阶是n,(xi,xj,...xn)表示一组高维交互特征;
步骤4、实现可视化与报告导出。
进一步地,所述步骤2中的所述交互特征检测模块是基于图神经网络。
进一步地,所述交互特征检测模块中的所述图神经网络为L0-SIGN模型,包括一个L0-边检测模型与一个SIGN模型。
进一步地,所述L0-SIGN模型的输入是一个不包含边信息的图,其中,每一个所述训练特征为一个节点Xn,所述训练特征之间的交互对应各条边En,即一个数据样本n是一个图表示为:
Gn(Xn,En)
其中,
Figure BDA0003630447520000043
(en)ij∈{1,0}
其中,1表示{i,j}之间存在一条边,0表示{i,j}之间不存在交互。
进一步地,在预测过程中,所述L0-边检测模型Fep(Xn;ω)用于分析所述图中的边是否存在,其中,ω为Fep的参数,输出为一个边集合E′n
进一步地,所述L0-边检测模型是一个单独的检测模块,使用矩阵分解法方法。
进一步地,所述SIGN模型为一个图分类器,提供基于Gn(Xn,E′n)的预测结果,再通过L0正则化,限制检测到的所述交互特征对的数量。
进一步地,所述L0-SIGN模型对由边连接的初始节点进行交互建模,再通过汇总所有相应的建模结果来更新每个所述初始节点的表示,最后,对所有更新后的所述初始节点表征进行汇总,得到最终的预测。
进一步地,所述SIGN模型会得到一个预测函数fS,用于预测分类结果,再在随机梯度下降迭代法拟合参数的过程中使用所述L0正则化得到最终的用于预测分类结果的预测函数fLS,所述SIGN模型预测函数的一般形式是:
Figure BDA0003630447520000041
其中,所述预测函数fS为没有经过正则化的预测函数,所述预测函数fLS为经过所述L0正则化处理的所述预测函数fS,θ为所述图神经网络中的参数集合。
进一步地,最初的输入不需要边信息,
Figure BDA0003630447520000042
本发明所提供的一种金融风控领域的检测交互特征的模型可解释方法至少具有以下技术效果:
1、本发明所提供的技术方案提出基于图神经网络的交互特征检测模块,能够嵌入网络获取更高可信度的交互特征对,解决当前模型可解释领域解释精度不低但无法获得带有效交互特征解释的问题;
2、本发明所提供的技术方案通过改进已有的EBM模型,嵌入基于图神经网络的交互特征检测模块,解决了GAM线性模型由于结构简单而存在的过拟合问题,提高了模型解释的可信度和有效性;
3、本发明所提供的技术方案将EBM模型推广到识别高维特征交互,使得深度学习等高精度黑盒模型能够引入到金融风控这一类需要高解释性的领域。
以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果。
附图说明
图1是LIME算法解释单个样本的解释结果图;
图2是EBM算法解释单个样本的解释结果图;
图3是交互特征检测网络L0-IGN算法示意图。
具体实施方式
以下参考说明书附图介绍本发明的多个优选实施例,使其技术内容更加清楚和便于理解。本发明可以通过许多不同形式的实施例来得以体现,本发明的保护范围并非仅限于文中提到的实施例。
本发明提供的一种金融风控领域的检测交互特征的模型可解释方法,是一种与树模型精度相当的能够针对样本提供个性化解释的白盒建模方法,即模型自身可解释,主要分为两个部分:基于图神经网络的交互特征检测模块和采用GAMN的模型拟合方法。
一、基于图神经网络的交互特征检测模块:
图神经网络(Graph Neural Networks,GNNs)可以促进学习实体及其整体关系。现有的工作利用GNNs在各个领域进行关系推理,而在本发明实施例中则是将关系推理用于交互特征检测方面。本发明实施例采用的图神经网络为L0-SIGN(L0-Norm StatisticalInteraction Graph Neural Network),其中每个数据样本被视为一个图,特征是节点,特征之间的相互作用是边。L0-SIGN神经网络可以检测具有最大贡献的交互特征对,然后使用Top-K个交互特征作为接下来的GAMN模型的一部分输入。
相比于EBM模型中分别计算两两之间的所有交互特征强度,基于图神经网络的交互特征检测模块仅采用检测到的交互特征作为输入。此外,EBM仅捕捉到了每个单独的特征交互对预测的贡献,而没有捕捉到一组交互特征对的整体贡献。
二、GAMN的模型拟合:
EBM模型采用两步法计算交互特征对于整体模型的贡献强度,而在本发明实施例中,在基础EBM模型的两步计算法上做一定的改进,将第二步计算交互特征强度的部分不再采用EBM模型的快速交互检测(Fast Interaction Detection,FAST)算法,转而集成基于图神经网络的交互特征检测模块。
同时,对EBM模型的GAM2做一定改进,基于已有理论推导,将2阶特征交互映射到更高阶。
三、可视化与报告导出模块:
将局部可解释模块、全局解释模块集成在同一个可视化窗口,用户可以通过输入每一条数据对应的ID号查询其对应的预测结果与解释结果。同时,可以通过可视化窗口的导出功能一键导出各客户的解释报告,表明客户画像中存在的可疑点。
在银行风控领域,当前检测客户欺诈风险、信用风险等的技术难度与时间花费均较高,现有模型会存在一定的偏差,而人工审核需要深入探索各客户的原始数据,并从中发现客户数据中的异常点,对于从业人员的精力、专业程度都是相当大的考验。本发明所提供的技术方案旨在降低从业人员的人工审核成本,减少模型错判的可能性,并为后续特征工程提供一定的指导意见。
本发明实施例提供的一种金融风控领域的检测交互特征的模型可解释方法,包括以下步骤:
步骤1、根据已有的训练特征和训练标签训练一个加性模型,加性模型的分类器表示为F(x):
F(x)=∑fi(xi)
其中,F(x)∈[0,1],xi为训练特征或训练标签,fi(xi)为每一个xi对整体预测结果的贡献度;
步骤2、使用交互特征检测模块检测存在的交互特征对,使用得到的交互特征对、训练标签和步骤1的残差再构造一个GAM模型,再将加性模型和GAM模型相加,得到一个包含交互特征对的GAM2模型,GAM2模型的分类器表示为F2(x):
Figure BDA0003630447520000061
其中,F2(x)∈[0,1],En为交互特征检测模块检测出的交互特征对的集合,{i,j}表示其中的任一交互特征对,fij为针对交互特征对{i,j}∈En中的关于xi、xj的变换函数;
步骤3、根据高阶交互存在当且仅当其所有低阶交互均存在的原则,对GAM2模型进行多轮迭代,直到某轮迭代交互特征阶数不再增加,得到一个GAMn模型,GAMn模型包含n阶交互的分类器表示为Fn(x):
Figure BDA0003630447520000062
其中,Fn(x)∈[0,1],n阶交互的最高阶是n,(xi,xj,...xn)表示一组高维交互特征;
“高阶交互存在当且仅当其所有低阶交互均存在”的原则具体为:x1x2x3存在当且仅当其子集{x1x2,x2x3,x1x3}均存在,并将其推广到高维空间。但是,由于维度高后其子集呈O(2n)的复杂度,所以每推广高一维,交互的要求均会提高。譬如,将交互拓展到4维空间,则需要其
Figure BDA0003630447520000063
个子集均存在,会使得本发明所提供的算法不会检测出很高维的特征交互,但又保证重要交互存在。
步骤4、实现可视化与报告导出。
使用JAVA构造前后端,其解释运算结果基于Python的Microsoft开源框架Interpret中的EBM部分改写,嵌入图神经网络的交互特征检测模块,最终实现个性化查询解释结果的功能。
其中,步骤2中的交互特征检测模块是基于图神经网络。
交互特征检测模块中的图神经网络为L0-SIGN模型,包括一个L0-边检测模型与一个SIGN模型,如图3所示。
L0-SIGN模型的输入是一个不包含边信息的图,其中,每一个训练特征为一个节点Xn,训练特征之间的交互对应各条边En,即一个数据样本n是一个图表示为:
Gn(Xn,En)
其中,
Figure BDA0003630447520000073
(n)ij∈{1,0}
其中,1表示{,j}之间存在一条边,0表示{i,j}之间不存在交互,最初的输入不需要边信息,
Figure BDA0003630447520000071
在预测过程中,L0-边检测模型Fep(Xn;ω)用于分析图中的边是否存在,其中,ω为Fep的参数,输出为一个边集合E′n
L0-边检测模型是一个单独的检测模块,使用矩阵分解法方法(MatrixFactorization,MF)。
SIGN模型为一个图分类器,提供基于Gn(Xn,E′n)的预测结果,再通过L0正则化,限制检测到的交互特征对的数量。
L0-SIGN模型对由边连接的初始节点进行交互建模,再通过汇总所有相应的建模结果来更新每个初始节点的表示,最后,对所有更新后的初始节点表征进行汇总,得到最终的预测。
SIGN模型会得到一个预测函数fS,用于预测分类结果,再在随机梯度下降迭代法拟合参数的过程中使用L0正则化得到最终的用于预测分类结果的预测函数fLS,SIGN模型预测函数的一般形式是:
Figure BDA0003630447520000072
其中,预测函数fS为没有经过正则化的预测函数,预测函数fLS为经过L0正则化处理的预测函数fS,θ为图神经网络中的参数集合。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

Claims (10)

1.一种金融风控领域的检测交互特征的模型可解释方法,其特征在于,所述方法包括以下步骤:
步骤1、根据已有的训练特征和训练标签训练一个加性模型,所述加性模型的分类器表示为F(x):
F(x)=∑fi(xi)
其中,F(x)∈[0,1],xi为所述训练特征或所述训练标签,fi(xi)为每一个xi对整体预测结果的贡献度;
步骤2、使用交互特征检测模块检测存在的交互特征对,使用得到的所述交互特征对、所述训练标签和所述步骤1的残差再构造一个GAM模型,再将所述加性模型和所述GAM模型相加,得到一个包含所述交互特征对的GAM2模型,所述GAM2模型的分类器表示为F2(x):
Figure FDA0003630447510000011
其中,F2(x)∈[0,1],En为所述交互特征检测模块检测出的所述交互特征对的集合,{i,j}表示其中的任一所述交互特征对,fij为针对所述交互特征对{i,j}∈En中的关于xi、xj的变换函数;
步骤3、根据高阶交互存在当且仅当其所有低阶交互均存在的原则,对所述GAM2模型进行多轮迭代,直到某轮迭代交互特征阶数不再增加,得到一个GAMn模型,所述GAMn模型包含n阶交互的分类器表示为Fn(x):
Figure FDA0003630447510000012
其中,Fn(x)∈[0,1],n阶交互的最高阶是n,(xi,xj,...xn)表示一组高维交互特征;
步骤4、实现可视化与报告导出。
2.如权利要求1所述的金融风控领域的检测交互特征的模型可解释方法,其特征在于,所述步骤2中的所述交互特征检测模块是基于图神经网络。
3.如权利要求2所述的金融风控领域的检测交互特征的模型可解释方法,其特征在于,所述交互特征检测模块中的所述图神经网络为L0-SIGN模型,包括一个L0-边检测模型与一个SIGN模型。
4.如权利要求3所述的金融风控领域的检测交互特征的模型可解释方法,其特征在于,所述L0-SIGN模型的输入是一个不包含边信息的图,其中,每一个所述训练特征为一个节点Xn,所述训练特征之间的交互对应各条边En,即一个数据样本n是一个图表示为:
Gn(Xn,En)
其中,
Figure FDA0003630447510000023
(en)ij∈{1,0}
其中,1表示{i,j}之间存在一条边,0表示{i,j}之间不存在交互。
5.如权利要求4所述的金融风控领域的检测交互特征的模型可解释方法,其特征在于,在预测过程中,所述L0-边检测模型Fep(Xn;ω)用于分析所述图中的边是否存在,其中,ω为Fep的参数,输出为一个边集合E′n
6.如权利要求5所述的金融风控领域的检测交互特征的模型可解释方法,其特征在于,所述L0-边检测模型是一个单独的检测模块,使用矩阵分解法方法。
7.如权利要求5所述的金融风控领域的检测交互特征的模型可解释方法,其特征在于,所述SIGN模型为一个图分类器,提供基于Gn(Xn,E′n)的预测结果,再通过L0正则化,限制检测到的所述交互特征对的数量。
8.如权利要求7所述的金融风控领域的检测交互特征的模型可解释方法,其特征在于,所述L0-SIGN模型对由边连接的初始节点进行交互建模,再通过汇总所有相应的建模结果来更新每个所述初始节点的表示,最后,对所有更新后的所述初始节点表征进行汇总,得到最终的预测。
9.如权利要求8所述的金融风控领域的检测交互特征的模型可解释方法,其特征在于,所述SIGN模型会得到一个预测函数fs,用于预测分类结果,再在随机梯度下降迭代法拟合参数的过程中使用所述L0正则化得到最终的用于预测分类结果的预测函数fLS,所述SIGN模型预测函数的一般形式是:
Figure FDA0003630447510000021
其中,所述预测函数fS为没有经过正则化的预测函数,所述预测函数fLS为经过所述L0正则化处理的所述预测函数fS,θ为所述图神经网络中的参数集合。
10.如权利要求4所述的金融风控领域的检测交互特征的模型可解释方法,其特征在于,最初的输入不需要边信息,
Figure FDA0003630447510000022
CN202210487256.4A 2022-05-06 2022-05-06 一种金融风控领域的检测交互特征的模型可解释方法 Pending CN114742643A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210487256.4A CN114742643A (zh) 2022-05-06 2022-05-06 一种金融风控领域的检测交互特征的模型可解释方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210487256.4A CN114742643A (zh) 2022-05-06 2022-05-06 一种金融风控领域的检测交互特征的模型可解释方法

Publications (1)

Publication Number Publication Date
CN114742643A true CN114742643A (zh) 2022-07-12

Family

ID=82285853

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210487256.4A Pending CN114742643A (zh) 2022-05-06 2022-05-06 一种金融风控领域的检测交互特征的模型可解释方法

Country Status (1)

Country Link
CN (1) CN114742643A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115953248A (zh) * 2023-03-01 2023-04-11 支付宝(杭州)信息技术有限公司 基于沙普利可加性解释的风控方法、装置、设备及介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115953248A (zh) * 2023-03-01 2023-04-11 支付宝(杭州)信息技术有限公司 基于沙普利可加性解释的风控方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
Liang et al. Explaining the black-box model: A survey of local interpretation methods for deep neural networks
US11681925B2 (en) Techniques for creating, analyzing, and modifying neural networks
CN110119446A (zh) 可解释人工智能
CN112765896A (zh) 一种基于lstm的水处理时序数据异常检测方法
US11640539B2 (en) Techniques for visualizing the operation of neural networks using samples of training data
CN107346286A (zh) 一种基于核主成分分析和极限学习机的软件缺陷预测方法
US20210012209A1 (en) Techniques for modifying neural network definitions
CN114818999B (zh) 基于自编码器和生成对抗网络的账户识别方法及***
CN114036531A (zh) 一种基于多尺度代码度量的软件安全漏洞检测方法
EP3997629A1 (en) Techniques for modifying the operation of neural networks
CN114742643A (zh) 一种金融风控领域的检测交互特征的模型可解释方法
Ayoobi et al. SpArX: Sparse argumentative explanations for neural networks
Xiang et al. Computation of cnn’s sensitivity to input perturbation
Kan et al. Event log anomaly detection method based on auto-encoder and control flow
Mohamad et al. An analysis on deep learning approach performance in classifying big data set
CN117764536B (zh) 一种基于人工智能的创新创业项目辅助管理***
Li et al. On Testing and Evaluation of Artificial Intelligence Models
Krichen Convolutional Neural Networks. Computers 2023, 12, 151
Magomedov et al. Application of Artificial Intelligence Technologies for the Monitoring of Transactions in AML-Systems Using the Example of the Developed Classification Algorithm
US11822564B1 (en) Graphical user interface enabling interactive visualizations using a meta-database constructed from autonomously scanned disparate and heterogeneous sources
Fernandes et al. A Stratified Sampling Algorithm for Artificial Neural Networks
Priyadharsini et al. Performance Investigation of Handwritten Equation Solver using CNN for Betterment
US11928128B2 (en) Construction of a meta-database from autonomously scanned disparate and heterogeneous sources
US20230368013A1 (en) Accelerated model training from disparate and heterogeneous sources using a meta-database
US20240112045A1 (en) Synthetic data generation for machine learning models

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination