CN111523678A - 业务的处理方法、装置、设备及存储介质 - Google Patents

业务的处理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN111523678A
CN111523678A CN202010319159.5A CN202010319159A CN111523678A CN 111523678 A CN111523678 A CN 111523678A CN 202010319159 A CN202010319159 A CN 202010319159A CN 111523678 A CN111523678 A CN 111523678A
Authority
CN
China
Prior art keywords
service
interpretation
data
model
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010319159.5A
Other languages
English (en)
Inventor
南晓杰
王逸聪
曹大瀛
励强超
仲杉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JD Digital Technology Holdings Co Ltd
Original Assignee
JD Digital Technology Holdings Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JD Digital Technology Holdings Co Ltd filed Critical JD Digital Technology Holdings Co Ltd
Priority to CN202010319159.5A priority Critical patent/CN111523678A/zh
Publication of CN111523678A publication Critical patent/CN111523678A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例提供的业务的处理方法、装置、设备及存储介质,通过采用业务处理模型对待处理的业务请求所对应的业务数据进行处理,得到业务处理模型的目标变量的预测结果,并采用预设局部解释方式对目标变量的预测结果进行解释处理,得到与目标变量的预测结果对应的局部业务解释。可见,本申请实施例中通过将机器学习模型与模型解释相结合的方式,使得机器学习模型白盒化,得到关于机器学习模型的相关业务解释信息,提高了机器学习模型的可解释性,一方面提高了模型可信度,有利于提高机器学习模型在对模型可解释性要求较高的技术领域的利用率;另一方面还以便于结合上述业务解释信息来确定适合待处理的业务的用户群。

Description

业务的处理方法、装置、设备及存储介质
技术领域
本申请实施例涉及计算机技术领域,尤其涉及一种业务的处理方法、装置、设备及存储介质。
背景技术
随着大数据和人工智能的发展,机器学习技术得到越来越广泛的应用。
现有技术中,许多机器学习模型是黑箱子模型,无法去感知它内部的工作状态,可解释性比较差。对于互联网金融、电子商务等对模型可解释性要求较高的领域,现有的黑箱子模型存在可解释性比较差,导致模型可信度较低的问题。
发明内容
本申请实施例提供一种业务的处理方法、装置、设备及存储介质,用于解决现有技术中黑箱子模型的可解释性比较差,导致模型可信度较低的问题。
第一方面,本申请实施例提供一种业务的处理方法,包括:
根据待处理的业务请求,获取与业务处理模型相关的业务数据;
采用所述业务处理模型对所述业务数据进行处理,得到所述业务处理模型的目标变量的预测结果;
采用预设局部解释方式对所述目标变量的预测结果进行解释处理,得到与所述目标变量的预测结果对应的局部业务解释;其中,所述预设局部解释方式是指用于确定所述预测结果对应的局部业务解释的计算方式。
在一种可能的实现方式中,所述方法还包括:
获取所述待处理的业务对应的专家性解释和预设模型解释;
根据所述专家性解释和/或所述预设模型解释,判断所述局部业务解释是否符合业务逻辑。
在一种可能的实现方式中,所述方法还包括:
在确定所述局部业务解释符合业务逻辑时,获取所述业务数据的各特征对所述预测结果的贡献度;
将所述各特征对所述预测结果的贡献度中大于预设贡献度的各贡献度所对应的特征作为优化特征;
基于所述优化特征,确定与所述待处理的业务相关的用户群。
在一种可能的实现方式中,所述方法还包括:
在确定所述局部业务解释不符合业务逻辑时,根据所述预设模型解释中的全局业务解释重新确定与所述业务处理模型相关的待获取业务数据;其中,所述待获取业务数据用于指示与所述业务处理模型相关的待获取的业务数据的类型。
在一种可能的实现方式中,所述业务处理模型的获取方式包括:
获取样本数据,并对所述样本数据进行预处理;
根据所述预处理后的样本数据对预配置的初始化业务处理模型进行训练,得到所述业务处理模型。
在一种可能的实现方式中,所述方法还包括:
采用预设全局解释方式对所述预处理后的样本数据进行解释处理,并根据解释结果确定与所述业务处理模型相关的待获取业务数据;其中,所述待获取业务数据用于指示与所述业务处理模型相关的待获取的业务数据的类型。
在一种可能的实现方式中,所述采用预设全局解释方式对所述预处理后的样本数据进行解释处理,并根据解释结果确定与所述业务处理模型相关的待获取业务数据,包括:
对于所述预处理后的样本数据的每个特征,获取所述特征的重要性指示信息;
判断所述特征与其他特征的交互性是否明显;
在确定所述特征与其他特征的交互性不明显时,采用累积局部效果图或者部分依赖图,判断所述特征对所述业务处理模型的目标变量的预测结果是否符合业务逻辑;
在确定所述特征对所述预测结果符合业务逻辑时,将所述特征对应的数据作为与所述业务处理模型相关的待获取业务数据。
在一种可能的实现方式中,所述方法还包括:
在确定所述特征与其他特征的交互性明显时,采用SHAP图或者累积局部效果图,判断所述特征对所述业务处理模型的目标变量的预测结果是否符合业务逻辑;
在确定所述特征对所述预测结果符合业务逻辑时,将所述特征对应的数据作为与所述业务处理模型相关的待获取业务数据。
在一种可能的实现方式中,所述方法还包括:
对所述特征进行衍生处理,以获取衍生的新的特征;
在确定所述新的特征对所述预测结果符合业务逻辑时,将所述新的特征对应的数据作为与所述业务处理模型相关的待获取业务数据。
在一种可能的实现方式中,所述方法还包括:
在确定所述特征对所述预测结果不符合业务逻辑时,重新对所述业务处理模型进行训练处理。
第二方面,本申请实施例提供一种业务的处理装置,包括:
第一获取模块,用于根据待处理的业务请求,获取与业务处理模型相关的业务数据;
第二获取模块,用于采用所述业务处理模型对所述业务数据进行处理,得到所述业务处理模型的目标变量的预测结果;
第三获取模块,用于采用预设局部解释方式对所述目标变量的预测结果进行解释处理,得到与所述目标变量的预测结果对应的局部业务解释;其中,所述预设局部解释方式是指用于确定所述预测结果对应的局部业务解释的计算方式。
在一种可能的实现方式中,所述装置还包括:
第四获取模块,用于获取所述待处理的业务对应的专家性解释和预设模型解释;
判断模块,用于根据所述专家性解释和/或所述预设模型解释,判断所述局部业务解释是否符合业务逻辑。
在一种可能的实现方式中,所述装置还包括:第五获取模块;
其中,所述第五获取模块用于:
在所述判断模块确定所述局部业务解释符合业务逻辑时,获取所述业务数据的各特征对所述预测结果的贡献度;
将所述各特征对所述预测结果的贡献度中大于预设贡献度的各贡献度所对应的特征作为优化特征;
基于所述优化特征,确定与所述待处理的业务相关的用户群。
在一种可能的实现方式中,所述装置还包括:第六获取模块;
其中,所述第六获取模块用于:
在所述判断模块确定所述局部业务解释不符合业务逻辑时,根据所述预设模型解释中的全局业务解释重新确定与所述业务处理模型相关的待获取业务数据;其中,所述待获取业务数据用于指示与所述业务处理模型相关的待获取的业务数据的类型。
在一种可能的实现方式中,所述装置还包括:第七获取模块;
其中,所述第七获取模块,用于:
获取样本数据,并对所述样本数据进行预处理;
根据所述预处理后的样本数据对预配置的初始化业务处理模型进行训练,得到所述业务处理模型。
在一种可能的实现方式中,所述装置还包括:第八获取模块;
其中,所述第八获取模块用于:
采用预设全局解释方式对所述预处理后的样本数据进行解释处理,并根据解释结果确定与所述业务处理模型相关的待获取业务数据;其中,所述待获取业务数据用于指示与所述业务处理模型相关的待获取的业务数据的类型。
第三方面,本申请实施例提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面的任一项所述的业务的处理方法。
第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现上述第一方面的任一项所述的业务的处理方法。
本申请实施例提供的业务的处理方法、装置、设备及存储介质,通过根据待处理的业务请求获取与业务处理模型相关的业务数据;进一步地,采用所述业务处理模型对所述业务数据进行处理,得到所述业务处理模型的目标变量的预测结果,并采用预设局部解释方式对所述目标变量的预测结果进行解释处理,得到与所述目标变量的预测结果对应的局部业务解释。可见,本申请实施例中通过将机器学习模型与模型解释相结合的方式,使得机器学习模型白盒化,得到关于机器学习模型的相关业务解释信息,提高了机器学习模型的可解释性,一方面以便于有据可依地向业务人员或者客户展示业务办理结果的办理依据,从而提高了模型可信度,有利于提高机器学习模型在对模型可解释性要求较高的技术领域的利用率;另一方面还以便于结合上述业务解释信息来确定适合待处理的业务的用户群(或者客户群)。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1为本申请实施例提供的应用架构示意图;
图2为本申请一实施例提供的业务的处理方法的流程示意图;
图3为本申请另一实施例提供的业务的处理方法的流程示意图;
图4为本申请另一实施例提供的业务的处理方法的流程示意图;
图5为本申请另一实施例提供的业务的处理方法的流程示意图;
图6为本申请另一实施例提供的业务的处理方法的流程示意图;
图7为本申请实施例提供的业务的处理装置的结构示意图;
图8为本申请实施例提供的电子设备的结构示意图。
通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
首先对本申请实施例所涉及的名词进行解释。
本申请实施例涉及的业务处理模型为机器学习模型,可以包括但不限于:梯度提升树模型或深度学习模型。例如,本申请实施例中的业务处理模型可以为梯度提升迭代决策树(Gradient Boosting Decision Tree,GBDT)、梯度提升决策树模型(eXtremeGradient Boosting,Xgboost)、或轻量梯度提升机(Light Gradient Boosting Machine,lightGBM)等机器学习模型。
本申请实施例涉及的局部业务解释是指:业务处理模型的不同特征对所述业务处理模型的单个样本或单个客户的业务数据所对应的目标变量的预测结果的贡献度。
本申请实施例涉及的全局业务解释是指:业务处理模型的不同特征对所述业务处理模型的所有样本或所有客户的业务数据所对应的目标变量的预测结果的贡献度。
本申请实施例涉及的任意业务对应的专家性解释可以用于判断所述业务对应的业务解释是否符合业务逻辑的一种基准解释。示例性地,专家性解释可以包括但不限于:专家性局部解释,和/或,专家性全局解释。
本申请实施例涉及的任意业务对应的预设模型解释可以是在所述业务对应的业务处理模型的训练过程中所得到关于所述业务处理模型的解释,用于判断所述业务对应的业务解释是否符合业务逻辑的另一种基准解释。示例性地,预设模型解释可以包括但不限于:局部业务解释,和/或,全局业务解释。
本申请实施例提供的业务的处理方法可以应用在互联网金融、电子商务等对模型可解释性要求较高的应用场景;当然还可以应用在其它应用场景,本申请实施例中对此并不作限定。
示例性地,本申请实施例的业务的处理方法可以应用在消费信贷的业务处理场景。
图1为本申请实施例提供的应用架构示意图。如图1所示,本申请实施例的应用架构中可以包括:终端10和业务处理设备11;其中,终端10用于向业务处理设备11发送业务请求;业务处理设备11用于执行本申请实施例提供的业务的处理方法。
示例性地,本申请实施例涉及的终端10可以包括但不限于以下任一项:手机、笔记本电脑、平板电脑、台式电脑。
示例性地,本申请实施例涉及的业务处理设备11可以包括但不限于以下任一项:个人计算机、大中型计算机、计算机集群。
现有技术中,许多机器学习模型是黑箱子模型,无法去感知它内部的工作状态,可解释性比较差。对于互联网金融、电子商务等对模型可解释性要求较高的领域,现有的黑箱子模型存在可解释性比较差,导致模型可信度较低的问题,使得黑箱子模型在这些技术领域的利用率较低。
针对上述技术问题,本申请实施例提供的业务的处理方法,通过机器学习模型和模型解释方式相结合,使得可解释性较差的“黑箱子”机器学习模型白盒化,得到关于机器学习模型的相关业务解释信息,提高了机器学习模型的可解释性,以便于有据可依地向业务人员或者客户展示业务办理结果的办理依据,从而提高了模型可信度,有利于提高机器学习模型在对模型可解释性要求较高的技术领域的利用率。
下面以具体地实施例对本发明的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本发明的实施例进行描述。
图2为本申请一实施例提供的业务的处理方法的流程示意图。本申请实施例的执行主体可以为上述业务处理设备,或者所述业务处理设备中的业务处理装置(为了便于描述,本实施例中以执行主体为上述业务处理设备为例进行说明)。示例性地,所述业务处理装置可以通过软件和/或硬件实现。如图2所示,本申请实施例提供的业务的处理方法可以包括:
步骤S201、根据待处理的业务请求,获取与业务处理模型相关的业务数据。
本申请实施例中,上述业务处理设备中可以预置有训练好的业务处理模型以及与所述业务处理模型相关的待获取业务数据(用于指示与所述业务处理模型相关的待获取的业务数据的类型)。需要说明的是,上述业务处理模型可以为上述业务处理设备预先训练好的,或者可以为上述业务处理设备从其它设备处获取的。
本申请实施例中,上述业务处理设备可以接收业务人员或者客户通过终端发送的待处理的业务请求(例如,消费信贷的业务申请请求),其中,上述业务请求中可以包括:客户的标识(Identity,ID)信息;当然,上述业务请求中还可以包括其他信息(例如待处理的业务标识信息等),本申请实施例中对此并不作限定。
示例性地,上述客户的标识信息可以包括但不限于以下至少一项:客户的姓名、身份证号。
本步骤中,上述业务处理设备可以根据上述业务处理模型相关的待获取业务数据和上述业务请求中的客户的标识信息,从数据库或者其他设备处获取上述客户对应的上述业务处理模型相关的业务数据。其中,上述业务处理模型相关的业务数据可以用于指示上述客户的多个特征。
示例性地,若上述待处理的业务请求为消费信贷的业务申请请求,则上述业务处理模型相关的业务数据可以包括但不限于以下至少一项:客户的属性特征数据(例如,性别、年龄、学历、职业、婚姻状态、地址等)、支付行为特征数据(例如,支付金额或支付笔数等)、金融理财特征数据(例如,基金、保险理财、券商理财等)、历史还款行为特征数据、消费行为特征数据(例如,网购消费信息、优惠券使用信息、购物浏览信息、风险订单、品类偏好、下单行为、评论文本数据等)、社会关系网络特征数据、借贷征信特征数据(例如,多头借贷数据、征信数据等)。
当然,上述业务处理设备可以通过其它方式,获取到上述待处理的业务请求,本申请实施例中对此并不作限定。
步骤S202、采用所述业务处理模型对所述业务数据进行处理,得到所述业务处理模型的目标变量的预测结果。
示例性地,本申请实施例涉及的业务处理模型为机器学习模型,可以包括但不限于:梯度提升树模型或深度学习模型。例如,本申请实施例中的业务处理模型可以为GBDT、Xgboost、或lightGBM等机器学习模型。
本步骤中,上述业务处理设备可以将上述步骤S201中获取的与上述业务处理模型相关的业务数据输入到上述业务处理模型,便可获取到与上述业务数据对应的上述业务处理模型的目标变量的预测结果,从而可以根据上述目标变量的预测结果处理上述业务请求。
应理解,上述业务处理设备还可以将上述业务处理模型的目标变量的预测结果和上述业务请求的业务办理结果返回给上述终端;其中,上述业务请求的业务办理结果可以包括但不限于:审批通过上述业务请求,或者拒绝通过上述业务请求。
示例性地,若上述待处理的业务请求为消费信贷的业务申请请求,则上述业务处理模型的目标变量可以为客户违约的风险概率。例如,若目标变量的预测结果为0,则上述业务处理设备可以将所述目标变量的预测结果(例如0)转换为信用评分后,其所在的信用等级较高,以便于审批通过上述业务请求;若目标变量的预测结果为1,则上述业务处理设备可以将所述目标变量的预测结果(例如1)转换为信用评分后,其所在的信用等级较低,以便于拒绝通过上述业务请求。
步骤S203、采用预设局部解释方式对所述目标变量的预测结果进行解释处理,得到与所述目标变量的预测结果对应的局部业务解释。
示例性地,本申请实施例涉及的预设局部解释方式是指用于确定上述目标变量的预测结果对应的局部业务解释的计算方式。
示例性地,本申请实施例涉及的局部业务解释是指:上述业务处理模型的不同特征对所述业务处理模型的单个样本或单个客户的业务数据所对应的目标变量的预测结果的贡献度。
本步骤中,上述业务处理设备可以采用预设局部解释方式对上述步骤S202中获取的目标变量的预测结果进行解释处理,得到与所述目标变量的预测结果对应的局部业务解释,即上述业务处理模型的不同特征对上述客户的业务数据所对应的目标变量的预测结果的贡献度(或者影响程度)。
应理解,上述业务处理设备还可以将上述局部业务解释,经过包装后返回给上述终端,一方面以便于业务人员或者客户可以客观地获知关于上述业务请求的业务办理结果的办理依据;另一方面还以便于结合上述局部业务解释信息来确定适合待处理的业务的用户群(或者客户群)。
可选地,上述业务处理设备可以采用与本地可解释模型无关的解释(LocalInterpretable Model-agnostic Explanations,LIME)、Shapley值可加性解释(ShapleyAdditive exPlanations,SHAP)或者锚点(Anchors)等预设局部解释方式,对上述目标变量的预测结果进行解释处理,得到与所述目标变量的预测结果对应的局部业务解释。
示例性地,若预设局部解释方式为LIME,则上述业务处理设备可以通过在局部训练出一个可解释的代理模型(例如可以是线性回归模型或者决策树等可解释性模型),然后利用所述代理模型对上述目标变量的预测结果进行解释处理,从而得到与所述目标变量的预测结果对应的局部业务解释。需要说明的是,通过LIME方式对上述目标变量的预测结果进行解释处理的具体实现方式,可以参考相关技术中提供的LIME方式的可实现方式。
又一示例性地,若预设局部解释方式为SHAP,则上述业务处理设备可以通过分别计算上述业务处理模型的每个特征的Shaply值(Values),然后将每个特征的ShaplyValues进行线性组合,便可以得到与所述目标变量的预测结果对应的局部业务解释;其中,每个特征的Shaply值是所述特征在上述业务处理模型所选择(或者所对应)的特征序列中的平均边际贡献。需要说明的是,通过SHAP方式对上述目标变量的预测结果进行解释处理的具体实现方式,可以参考相关技术中提供的SHAP方式的可实现方式。
又一示例性地,若预设局部解释方式为Anchors(基于扰动技术对目标变量的预测结果做出局部解释),则上述业务处理设备可以基于获取的if-then规则对上述目标变量的预测结果做出局部解释,从而得到与所述目标变量的预测结果对应的局部业务解释。需要说明的是,通过Anchors方式对上述目标变量的预测结果进行解释处理的具体实现方式,可以参考相关技术中提供的Anchors方式的可实现方式。
综上所述,本申请实施例中,通过根据待处理的业务请求获取与业务处理模型相关的业务数据;进一步地,采用所述业务处理模型对所述业务数据进行处理,得到所述业务处理模型的目标变量的预测结果,并采用预设局部解释方式对所述目标变量的预测结果进行解释处理,得到与所述目标变量的预测结果对应的局部业务解释。可见,本申请实施例中通过将机器学习模型与模型解释相结合的方式,使得机器学习模型白盒化,得到关于机器学习模型的相关业务解释信息,提高了机器学习模型的可解释性,一方面以便于有据可依地向业务人员或者客户展示业务办理结果的办理依据,从而提高了模型可信度,有利于提高机器学习模型在对模型可解释性要求较高的技术领域的利用率;另一方面还可以结合上述业务解释信息确定适合待处理的业务的用户群(或者客户群)。
图3为本申请另一实施例提供的业务的处理方法的流程示意图,如图3所示,在上述实施例的基础上,上述业务处理设备在执行完上述步骤S203之后,还可以包括:
步骤S301、获取所述待处理的业务对应的专家性解释和预设模型解释。
示例性地,本申请实施例涉及的任意业务对应的专家性解释可以用于判断所述业务对应的业务解释是否符合业务逻辑的一种基准解释。示例性地,专家性解释可以包括但不限于:专家性局部解释,和/或,专家性全局解释。
示例性地,本申请实施例涉及的任意业务对应的预设模型解释可以是在所述业务对应的业务处理模型的训练过程中所得到关于所述业务处理模型的解释,用于判断所述业务对应的业务解释是否符合业务逻辑的另一种基准解释。示例性地,预设模型解释可以包括但不限于:局部业务解释,和/或,全局业务解释。
本步骤中,上述业务处理设备可以从数据库或者其他设备处获取上述待处理的业务所对应的专家性解释和预设模型解释;当然,还可以通过其他方式获取上述待处理的业务所对应的专家性解释和预设模型解释,本申请实施例中对此并不作限定。
步骤S302、根据所述专家性解释和/或所述预设模型解释,判断所述局部业务解释是否符合业务逻辑。
本步骤中,上述业务处理设备可以根据上述专家性解释中的专家性局部解释和/或上述预设模型解释中的局部业务解释,判断上述步骤S203所获取的局部业务解释是否符合业务逻辑。
示例性地,上述业务处理设备可以根据上述专家性解释中的专家性局部解释,判断上述步骤S203所获取的局部业务解释是否符合业务逻辑。
例如,若上述步骤S203所获取的局部业务解释与上述专家性解释中的专家性局部解释有冲突,则上述业务处理设备可以确定上述步骤S203所获取的局部业务解释不符合业务逻辑。若上述步骤S203所获取的局部业务解释与上述专家性解释中的专家性局部解释无冲突,则上述业务处理设备可以确定上述步骤S203所获取的局部业务解释符合业务逻辑。
又一示例性地,上述业务处理设备可以根据上述预设模型解释中的局部业务解释,判断上述步骤S203所获取的局部业务解释是否符合业务逻辑。
例如,若上述步骤S203所获取的局部业务解释与上述预设模型解释中的局部业务解释有冲突,则上述业务处理设备可以确定上述步骤S203所获取的局部业务解释不符合业务逻辑。若上述步骤S203所获取的局部业务解释与上述预设模型解释中的局部业务解释无冲突,则上述业务处理设备可以确定上述步骤S203所获取的局部业务解释符合业务逻辑。
又一示例性地,上述业务处理设备可以根据上述专家性解释中的专家性局部解释和上述预设模型解释中的局部业务解释,判断上述步骤S203所获取的局部业务解释是否符合业务逻辑。
例如,若上述步骤S203所获取的局部业务解释与上述专家性解释中的专家性局部解释有冲突,和/或,上述步骤S203所获取的局部业务解释与上述预设模型解释中的局部业务解释有冲突,则上述业务处理设备可以确定上述步骤S203所获取的局部业务解释不符合业务逻辑。若上述步骤S203所获取的局部业务解释与上述专家性解释中的专家性局部解释无冲突,且上述步骤S203所获取的局部业务解释与上述预设模型解释中的局部业务解释无冲突,则上述业务处理设备可以确定上述步骤S203所获取的局部业务解释符合业务逻辑。
可选地,上述业务处理设备在根据上述专家性解释中的专家性局部解释和/或上述预设模型解释中的局部业务解释确定上述步骤S203所获取的局部业务解释符合业务逻辑时,还可以进一步结合上述专家性解释中的专家性全局解释和/或上述预设模型解释中的全局业务解释,来进一步判断上述步骤S203所获取的局部业务解释是否符合业务逻辑。
进一步地,在确定所述局部业务解释符合业务逻辑时,则执行步骤S303;在确定所述局部业务解释不符合业务逻辑时,则执行步骤S304。
步骤S303、获取所述业务数据的各特征对所述目标变量的预测结果的贡献度、将所述各特征对所述预测结果的贡献度中大于预设贡献度的各贡献度所对应的特征作为优化特征,并基于所述优化特征,确定与所述待处理的业务相关的用户群。
本步骤中,上述业务处理设备可以根据上述步骤S203所获取的局部业务解释获取上述客户的业务数据的各特征对目标变量的预测结果的贡献度。其次,上述业务处理设备可以将上述各特征对预测结果的贡献度中大于预设贡献度的各贡献度所对应的特征作为优化特征(即对目标变量的预设结果影响程度较大的特征)。然后,所述业务处理设备可以基于所述优化特征,确定与所述待处理的业务相关的用户群。
示例性地,若上述待处理的业务请求为消费信贷的业务申请请求,则上述优化特征可以包括但不限于:年龄、学历、职业、支付行为特征数据、消费行为特征数据,一方面以便于在处理上述业务请求过程中可增强关于上述优化特征的审核,另一方面上述业务处理设备还可以基于上述优化特征筛选和甄别出适合所述待处理的业务的用户群(或者客户群),为所述待处理的业务发展提供战略层面的支撑。
步骤S304、根据所述预设模型解释中的全局业务解释重新确定与所述业务处理模型相关的待获取业务数据。
本步骤中,上述业务处理设备可以根据上述待处理业务对应的预设模型解释中的全局业务解释重新确定与所述业务处理模型相关的待获取业务数据,一方面以便于下次根据待处理的业务请求可以获取到与业务处理模型更加相关的业务数据,不仅有利于提高业务处理模型的目标变量的预测结果的准确性,还有利于提高局部业务解释的准确性;另一方面还以便于下次更新上述业务处理模型时可以采用与业务处理模型更加相关的业务数据,从而还可以提高模型训练效率。
图4为本申请另一实施例提供的业务的处理方法的流程示意图。在上述实施例的基础上,本申请实施例中对上述业务处理模型的获取方式进行介绍。如图4所示,本申请实施例的方法可以包括:
步骤S401、获取样本数据,并对所述样本数据进行预处理。
示例性地,本申请实施例中的样本数据可以包括多个样本(或者多个客户)对应的业务数据;其中,任意客户对应的业务数据可以包括但不限于:所述客户的标识信息、所述客户对应的业务处理模型相关的业务数据和所述客户对应的所述业务处理模型的目标变量的真实结果。例如,对于消费信贷的应用场景,所述客户对应的业务处理模型相关的业务数据可以包括但不限于以下至少一项:客户的属性特征数据、客户的支付行为特征数据、金融理财特征数据、历史还款行为特征数据(用于指示所述客户对应的目标变量的真实结果)、消费行为特征数据、社会关系网络特征数据、借贷征信特征数据。
本步骤中,上述业务处理设备可以从数据库或者其它设备处获取上述样本数据,并对上述样本数据进行预处理,以便于提高模型训练的效率,其中,所述预处理可以包括但不限于:分类处理、特征衍生处理和筛选处理。
示例性地,上述业务处理设备可以先将上述样本数据中的每个样本(或客户)对应的业务数据划分为以下至少一种分类:分类特征数据(例如,客户的性别、职业、学历等)、连续类特征数据(例如客户的年龄、支付笔数等)、文本类特征数据(例如,地址、评论文本数据等)、关系网络类特征数据(例如社会关系网络特征数据等)、浏览序列特征数据(例如,购物浏览信息、下单行为等)。
进一步地,上述业务处理设备可以对每种分类数据进行特征衍生处理,使得上述样本数据中的每个样本(或客户)对应的特征数据越完善。
1)对于分类特征数据:上述业务处理设备可以通过暴力衍生、求占比、独热(one-hot)编码,和/或,证据权重(Weight of evidence,WOE)编码等方式对上述分类特征数据进行特征组合。
2)对于上述连续类特征数据:上述业务处理设备可以通过取最大、取最小、取分位数(例如50%分位数、75%分位数等)、做时间切片、汇总、求平均,和/或,求占比等方式,得到上述连续类特征数据对应的统计性描述特征。
3)对于上述文本类特征数据:上述业务处理设备可以对上述文本类特征数据进行词向量处理。
4)对于上述关系网络类特征数据:上述业务处理设备可以对上述关系网络类特征数据进行分析,挖掘与目标变量相关的特征信息。例如,针对消费信贷的应用场景,上述业务处理设备可以对上述关系网络类特征数据进行分析,挖掘与客户相关的违约风险信息,如主要关联人中有多少人逾期还款等。
5)对于上述浏览序列特征数据:上述业务处理设备可以通过嵌入(embedding)方式或做图嵌入等方式对上述浏览序列特征数据进行特征挖掘。
进一步地,上述业务处理设备可以通过对上述特征衍生处理之后得到的衍生样本数据(可以包括原始特征数据和上述衍生处理所得到的衍生特征数据)进行筛选处理,得到预处理后的样本数据,其中,筛选处理可以包括但不限于以下至少一项:唯一性处理、缺失值处理、极端值处理。应理解,上述衍生样本数据在上述业务处理设备中可以以宽表的形式存在,当然,还可以以其它形式存在,本申请实施例中对此并不作限定。
1)唯一性处理:是指根据样本(或客户)的标识信息删除上述衍生样本数据中重复的其它样本对应的业务数据。例如,对于同一客户,上述衍生样本数据中包括所述客户对应的一组业务数据。
2)缺失值处理可以包括:横向缺失值处理和纵向缺失值处理。其中,横向缺失值处理是指将缺失关键特征的样本(或客户)对应的业务数据删除。例如,若某一样本(或客户)对应的业务数据中缺失性别、年龄、学历等关键特征数据,则可以将所述样本(或客户)对应的业务数据从上述衍生样本数据中删除。纵向缺失值处理是指将上述衍生样本数据中缺失率大于预设缺失率的特征数据删除,还可以按照预设规则(例如预设值填充规则等)填充上述衍生样本数据中缺失率不大于所述预设缺失率的特征数据。例如,当上述衍生样本数据中关于国外消费次数的缺失率大于预设确实率,则可以将上述衍生样本数据中关于国外消费次数这一列特征数据删除。
3)极端值处理:是指将上述衍生样本数据中大于预设上限阈值的数据设置为所述预设上限阈值。
步骤S402、根据所述预处理后的样本数据对预配置的初始化业务处理模型进行训练,得到所述业务处理模型。
本步骤中,上述业务处理设备可以根据上述业务处理模型相关的待获取业务数据从通过上述步骤S401得到的预处理后的样本数据中确定出与上述业务处理模型相关的业务数据,然后根据与上述业务处理模型相关的业务数据对预配置的初始化业务处理模型进行训练,直至模型预测指标满足预设业务指标为止,从而得到上述业务处理模型,以便于在接收到待处理的业务请求时,可以根据上述业务处理模型准确地确定出与上述业务处理模型相关的业务数据对应的目标变量的预测结果。示例性地,上述模型预测指标可以包括但不限于以下至少一项:准确率指标、ROC曲线下方的面积(Area Under roc Curve,AUC)指标、KS(Kolmogorov-Smirnov)检验指标等。
示例性地,上述业务处理设备一方面可以根据上述业务处理模型的特征之间的交互性、特征对目标变量的区分度,和/或,特征在样本数据中的稳定性选择第一特征;另一方面上述业务处理设备可以将上述第一特征与上述业务处理模型对应的特征重要性排序做交叉得到的第二特征,从而将上述第二特征对应的数据作为上述业务处理模型相关的待获取业务数据。
又一示例性地,上述业务处理设备还可以通过上述预设模型解释中的全局业务解释来确定上述业务处理模型相关的待获取业务数据,或者,还可以通过本申请下述实施例涉及的预设全局解释方式对应的全局业务解释来确定上述业务处理模型相关的待获取业务数据。
当然,上述业务处理设备还可以通过其它方式,确定上述业务处理模型相关的待获取业务数据,本申请实施例中对此并不作限定。
进一步地,在上述实施例的基础上,上述业务处理设备还可以采用预设全局解释方式对上述预处理后的样本数据进行解释处理,并根据解释结果确定与上述业务处理模型相关的待获取业务数据。一方面以便于上述业务处理设备可以根据上述预处理后的样本数据中与上述待获取业务数据对应的业务数据,对上述预配置的初始化业务处理模型进行有针对性的训练或者进一步对上述业务处理模型进行更新训练,提高了训练效率;另一方面以便于上述业务处理设备根据待处理的业务请求可以获取到与业务处理模型更加相关的业务数据,有利于提高业务处理模型的目标变量的预测结果的准确性。
例如,若全局解释用于指示特征数据1~特征数据10对上述业务处理模型的目标变量的预测结果的贡献度较大,则上述业务处理设备可以确定上述特征1数据~特征数据10作为与上述业务处理模型相关的待获取业务数据。
图5为本申请另一实施例提供的业务的处理方法的流程示意图,在上述实施例的基础上,本申请实施例对上述解释处理和确定待获取业务数据的可实现方式进行介绍。如图5所示,本申请实施例的方法可以包括:
步骤S501、对于所述预处理后的样本数据的每个特征,获取所述特征的重要性指示信息。
本步骤中,对于上述预处理后的样本数据的每个特征,上述业务处理设备可以计算所述特征的重要性指示信息(用于指示所述特征相对于业务处理模型的重要性),以便于后续可以根据重要性指示信息按照重要性由高到低顺序来判断每个特征与其他特征的交互性是否明显,和/或,输出上述业务处理模型的业务解释信息(例如上述局部业务解释和/或上述全局业务解释)。例如,上述重要性指示信息可以包括但不限于:重要性信息和/或权重分配信息。
示例性地,对于所述预处理后的样本数据的每个特征(或者称之为特征数据),上述业务处理设备可以通过置换(Permutation)或者SHAP等方式获取所述特征的重要性指示信息。
又一示例性地,若上述业务处理模型为树模型,则对于所述预处理后的样本数据的每个特征(或者称之为特征数据),上述业务处理设备可以通过平均基尼指数、特征划分的次数或者特征划分的样本数等方式获取所述特征的重要性指示信息。
步骤S502、判断所述特征与其他特征的交互性是否明显。
一种可能的实现方式中,上述业务处理设备可以通过相关系数、方差分析或者H统计量(Statistic)等方式,计算上述特征与其他特征之间的相关性,然后通过将上述特征与其他特征之间的相关性与预设相关性阈值对比的方式,来判断上述特征与其他特征之间的交互性是否明显。若上特征与其他特征之间的相关性大于预设相关性阈值,则可以确定上述特征与其他特征之间的交互性明显;若上特征与其他特征之间的相关性不大于预设相关性阈值,则可以确定上述特征与其他特征之间的交互性不明显。
另一种可能的实现方式中,上述业务处理设备可以通过特征交互(FeatureInteraction)或SHAP绘制多维图来判断上述特征与其他特征之间的交互性是否明显。
示例性地,若根据特征交互绘制二维图,所述二维图的横坐标可以为上述特征的取值范围,纵坐标可以为上述特征对目标变量的预测结果的贡献度;若根据特征交互绘制三维图,所述三维图的x坐标可以为上述特征的取值范围,y坐标可以为一个其他特征的取值范围,z坐标可以交互特征为对目标变量的预测结果的贡献度。
又一示例性地,若根据SHAP绘制多维图(或者称之为SHAP图),所述SHAP图用于指示上述特征与其它特征交互对目标变量的预测结果的贡献度,其横坐标可以为上述特征的取值范围,纵坐标可以包括双坐标,其中一个纵坐标为一个其他特征的取值范围,另一个纵坐标为交互特征的SHAP值。
当然,上述业务处理设备还可以通过其它方式,判断所述特征与其他特征的交互性是否明显,本申请实施例中对此并不作限定。
进一步地,在确定所述特征与其他特征的交互性不明显时,则执行步骤S503;在确定所述特征与其他特征的交互性明显时,则执行步骤S506。
步骤S503、采用累积局部效果图(Accumulated Local Effects,ALE)或者部分依赖图(Partial Dependence Plot,PDP),判断所述特征对所述业务处理模型的目标变量的预测结果是否符合业务逻辑。
本申请实施例中涉及的累积局部效果图可以是指通过对所述特征的每个取值区间内置换上下界求对应的目标变量的预测结果的差,其次对这些预测结果的差累积并求平均得到所述特征在该取值区间内的变动对目标变量的预测结果的影响,然后将每个取值区间的影响累积起来所得到图。例如,上述累积局部效果图的横坐标可以为所述特征的取值范围,纵坐标可以为所述特征对目标变量的预测结果的贡献度。
示例性地,上述部分依赖图用于指示所述特征对目标变量的预测结果的边际效应。例如,上述部分依赖图的横坐标可以为所述特征的取值范围,纵坐标可以为所述特征对目标变量的预测结果的贡献度。
本步骤中,上述业务处理设备可以根据上述累积局部效果图或者部分依赖图,确定出所述特征对所述目标变量的预测结果对应的全局业务解释,然后可以结合专家性解释来判断所述特征对所述目标变量的预测结果对应的全局业务解释是否符合业务逻辑,即判断所述特征对所述业务处理模型的目标变量的预测结果是否符合业务逻辑。
示例性地,上述业务处理设备可以根据上述专家性解释中的专家性全局解释,判断所述特征对目标变量的预测结果对应的全局业务解释是否符合业务逻辑。
例如,若上述特征对目标变量的预测结果对应的全局业务解释与上述专家性解释中的专家性全局解释有冲突,则上述业务处理设备可以确定上述特征对目标变量的预测结果对应的全局业务解释不符合业务逻辑,即所述特征对所述业务处理模型的目标变量的预测结果不符合业务逻辑。若上述特征对目标变量的预测结果对应的全局业务解释与上述专家性解释中的专家性全局解释无冲突,则上述业务处理设备可以确定上述特征对目标变量的预测结果对应的全局业务解释符合业务逻辑,即所述特征对所述业务处理模型的目标变量的预测结果符合业务逻辑。
进一步地,在确定所述特征对所述预测结果符合业务逻辑时,则执行步骤S504;在确定所述特征对所述预测结果不符合业务逻辑时,则执行步骤S505。
步骤S504、将所述特征对应的数据(或者称之为特征数据)作为与所述业务处理模型相关的待获取业务数据。
可见,上述业务处理设备可以根据全局解释结果确定与所述业务处理模型相关的待获取业务数据,不仅有利于上述业务处理设备可以根据上述预处理后的样本数据中与上述待获取业务数据对应的业务数据,对上述预配置的初始化业务处理模型进行有针对性的训练或者进一步对上述业务处理模型进行更新训练,提高了训练效率;而且还有利于上述业务处理设备根据待处理的业务请求可以获取到与业务处理模型更加相关的业务数据,提高了业务处理模型的目标变量的预测结果的准确性。
步骤S505、重新对所述业务处理模型进行训练处理。
本步骤中,上述业务处理设备可以对已有的业务处理模型进一步训练,以得到训练后的业务处理模型,或者可以对预配置的初始化业务处理模型进行训练以得到重新训练后的业务处理模型,实现了根据全局解释结果指导业务处理模型的训练,有利于提高模型的准确性。
步骤S506、采用SHAP图或者累积局部效果图(ALE),判断所述特征对所述业务处理模型的目标变量的预测结果是否符合业务逻辑。
本步骤中,上述业务处理设备可以根据上述SHAP图或者累积局部效果图,确定出所述特征对所述目标变量的预测结果对应的全局业务解释,然后可以结合专家性解释来判断所述特征对所述目标变量的预测结果对应的全局业务解释是否符合业务逻辑,即判断所述特征对所述业务处理模型的目标变量的预测结果是否符合业务逻辑。
示例性地,上述业务处理设备可以根据上述专家性解释中的专家性全局解释,判断所述特征对目标变量的预测结果对应的全局业务解释是否符合业务逻辑。
例如,若上述特征对目标变量的预测结果对应的全局业务解释与上述专家性解释中的专家性全局解释有冲突,则上述业务处理设备可以确定上述特征对目标变量的预测结果对应的全局业务解释不符合业务逻辑,即上述特征对所述业务处理模型的目标变量的预测结果不符合业务逻辑。若上述特征对目标变量的预测结果对应的全局业务解释与上述专家性解释中的专家性全局解释无冲突,则上述业务处理设备可以确定上述特征对目标变量的预测结果对应的全局业务解释符合业务逻辑,即上述特征对所述业务处理模型的目标变量的预测结果符合业务逻辑。
进一步地,在确定所述特征对所述预测结果符合业务逻辑时,则执行步骤S507;在确定所述特征对所述预测结果不符合业务逻辑时,则执行步骤S505。
步骤S507、将所述特征对应的数据(或者称之为特征数据)作为与所述业务处理模型相关的待获取业务数据。
可选地,上述业务处理设备在执行上述步骤S507之后,还可以对所述特征进行衍生处理,以获取衍生的新的特征,并在确定所述新的特征对所述预测结果符合业务逻辑时,将所述新的特征对应的数据(或者称之为特征数据)作为与所述业务处理模型相关的待获取业务数据,以便于降低模型的干扰性。
图6为本申请另一实施例提供的业务的处理方法的流程示意图,在上述实施例的基础上,本申请实施例中结合上述预设局部解释方式和全局解释方式对上述业务处理模型的训练过程的可实现方式进行介绍。如图6所示,本申请实施例的方法可以包括:
步骤S601、获取样本数据。
步骤S602、对所述样本数据进行预处理。
其中,步骤S601和S602的可实现方式,可以参考上述步骤S401的相关内容,此处不再赘述。
步骤S603、根据所述业务处理模型相关的待获取业务数据从所述样本数据中确定与所述业务处理模型相关的业务数据(或者称之为特征数据,或者变量数据)。
步骤S604、训练业务处理模型。
其中,步骤S603和S604的可实现方式,可以参考上述步骤S402的相关内容,此处不再赘述。
步骤S605A、采用预设全局解释方式进行解释处理,得到不同特征数据的全局业务解释。
本步骤的可实现方式,可以参考上述步骤S501-S507中的相关内容,此处不再赘述。
步骤S605B、采用预设局部解释方式进行解释处理,得到不同特征数据的局部业务解释。
本步骤的可实现方式,可以参考上述步骤S203和步骤S301-S304中的相关内容,此处不再赘述。
步骤S606、判断所述不同特征数据的全局业务解释和局部业务解释是否符合业务逻辑。
示例性地,上述业务处理设备可以根据获取的专家性解释中的专家性全局解释,判断不同特征的全局业务解释是否符合业务逻辑,以及根据获取的专家性解释中的专家性局部解释,判断不同特征数据的局部业务解释是否符合业务逻辑。
进一步地,若不同特征数据的全局业务解释和局部业务解释均符合业务逻辑,则执行步骤S607;若任意特征数据的全局业务解释和/或局部业务解释不符合业务逻辑,则上述业务处理设备可以根据符合业务逻辑的各特征数据和上述步骤S603中未选择的特征数据重新返回执行上述步骤S603-步骤S606的过程,直至所选择的所有特征数据的全局业务解释和局部业务解释均符合业务解释为止。
步骤S607、根据所述全局业务解释和局部业务解释,确定业务处理策略。
本步骤中,上述业务处理设备可以根据符合业务逻辑的上述全局业务解释得到不同特征对所有样本数据的目标变量的预测结果的贡献度排序,以及确定出上述业务处理模型相关的待获取业务数据,一方面以便于上述业务处理设备根据待处理的业务请求可以获取到与业务处理模型更加相关的业务数据,有利于提高业务处理模型的目标变量的预测结果的准确性,同时还可以有据可依地向业务人员或者客户展示业务办理结果的办理依据,从而提高了业务办理的合理性和准确性;另一方面以便于在获客阶段筛选和甄别出适合上述待处理的业务的客户群,有助于实现精准营销,提高获客质量与转化率。
另外,上述业务处理设备可以根据符合业务逻辑的上述局部业务解释得到不同特征对单个样本数据的目标变量的预测结果的贡献度排序,不仅以便于后续在业务审核过程中可以着重审核对预测结果的贡献度较大的特征以及在获客阶段可以结合上述局部业务解释来确定适合上述待处理的业务的客户群,还以便于有据可依地向业务人员或者客户展示业务办理结果的办理依据,提高了模型可信度。
例如,对于消费信贷的应用场景,假设上述局部业务解释指示“逾期次数”特征对于目标变量(如客户违约的风险概率)的影响较大,且逾期次数越多的客户越容易发生违约,则上述业务处理设备在业务审核(或者称之为风险控制)过程中便可增强对于客户逾期次数的区分和审核。
图7为本申请实施例提供的业务的处理装置的结构示意图。如图7所示,本申请实施例提供的业务的处理装置可以包括:第一获取模块701、第二获取模块702和第三获取模块703。
期中,第一获取模块701,用于根据待处理的业务请求,获取与业务处理模型相关的业务数据;
第二获取模块702,用于采用所述业务处理模型对所述业务数据进行处理,得到所述业务处理模型的目标变量的预测结果;
第三获取模块703,用于采用预设局部解释方式对所述目标变量的预测结果进行解释处理,得到与所述目标变量的预测结果对应的局部业务解释;其中,所述预设局部解释方式是指用于确定所述预测结果对应的局部业务解释的计算方式。
在一种可能的实现方式中,所述装置还包括:
第四获取模块,用于获取所述待处理的业务对应的专家性解释和预设模型解释;
判断模块,用于根据所述专家性解释和/或所述预设模型解释,判断所述局部业务解释是否符合业务逻辑。
在一种可能的实现方式中,所述装置还包括:
第四获取模块,用于获取所述待处理的业务对应的专家性解释和预设模型解释;
判断模块,用于根据所述专家性解释和/或所述预设模型解释,判断所述局部业务解释是否符合业务逻辑。
在一种可能的实现方式中,所述装置还包括:第五获取模块;
其中,所述第五获取模块用于:
在所述判断模块确定所述局部业务解释符合业务逻辑时,获取所述业务数据的各特征对所述预测结果的贡献度;
将所述各特征对所述预测结果的贡献度中大于预设贡献度的各贡献度所对应的特征作为优化特征;
基于所述优化特征,确定与所述待处理的业务相关的用户群。
在一种可能的实现方式中,所述装置还包括:第六获取模块;
其中,所述第六获取模块用于:
在所述判断模块确定所述局部业务解释不符合业务逻辑时,根据所述预设模型解释中的全局业务解释重新确定与所述业务处理模型相关的待获取业务数据;其中,所述待获取业务数据用于指示与所述业务处理模型相关的待获取的业务数据的类型。
在一种可能的实现方式中,所述装置还包括:第七获取模块;
其中,所述第七获取模块,用于:
获取样本数据,并对所述样本数据进行预处理;
根据所述预处理后的样本数据对预配置的初始化业务处理模型进行训练,得到所述业务处理模型。
在一种可能的实现方式中,所述装置还包括:第八获取模块;
其中,所述第八获取模块用于:
采用预设全局解释方式对所述预处理后的样本数据进行解释处理,并根据解释结果确定与所述业务处理模型相关的待获取业务数据;其中,所述待获取业务数据用于指示与所述业务处理模型相关的待获取的业务数据的类型。
在一种可能的实现方式中,所述第八获取模块具体用于:
对于所述预处理后的样本数据的每个特征,获取所述特征的重要性指示信息;
判断所述特征与其他特征的交互性是否明显;
在确定所述特征与其他特征的交互性不明显时,采用累积局部效果图或者部分依赖图,判断所述特征对所述业务处理模型的目标变量的预测结果是否符合业务逻辑;
在确定所述特征对所述预测结果符合业务逻辑时,将所述特征对应的数据作为与所述业务处理模型相关的待获取业务数据。
在一种可能的实现方式中,所述第八获取模块还用于:
在确定所述特征与其他特征的交互性明显时,采用SHAP图或者累积局部效果图,判断所述特征对所述业务处理模型的目标变量的预测结果是否符合业务逻辑;
在确定所述特征对所述预测结果符合业务逻辑时,将所述特征对应的数据作为与所述业务处理模型相关的待获取业务数据。
在一种可能的实现方式中,所述第八获取模块还用于:
对所述特征进行衍生处理,以获取衍生的新的特征;
在确定所述新的特征对所述预测结果符合业务逻辑时,将所述新的特征对应的数据作为与所述业务处理模型相关的待获取业务数据。
在一种可能的实现方式中,所述第八获取模块还用于:
在确定所述特征对所述预测结果不符合业务逻辑时,重新对所述业务处理模型进行训练处理。
本申请实施例提供的业务的处理装置,可以用于执行本申请上述业务的处理方法实施例中的技术方案,其实现原理和技术效果类似,此处不再赘述。
图8为本申请实施例提供的电子设备的结构示意图。示例性地,本申请实施例提供的电子设备可以为本申请上述实施例中的业务处理设备。如图8示,本申请实施例提供的电子设备可以包括:存储器801、处理器802及存储在所述存储器801上并可在所述处理器802上运行的计算机程序。示例性地,所述电子设备还可以包括用于与其它设备通信的通信接口803,其中,所述存储器801、处理器802和所述通信接口803可以通过***总线连接。
期中,所述处理器802执行所述计算机程序时实现本申请上述业务的处理方法实施例中的技术方案,其实现原理和技术效果类似,此处不再赘述。
可选的,上述处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
在示例性实施例中,上述电子设备还可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
可选地,上述存储器可能包含高速RAM存储器,也可能还包括非易失性存储NVM,例如至少一个磁盘存储器。
可选地,上述***总线可以是工业标准体系结构(Industry StandardArchitecture,ISA)总线、外部设备互连(Peripheral Component Interconnect,PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本申请附图中的总线并不限定仅有一根总线或一种类型的总线。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现本申请上述业务的处理方法实施例中的技术方案,其实现原理和技术效果类似,此处不再赘述。
示例性地,上述的存储器(存储介质)可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。可读存储介质可以是通用或专用计算机能够存取的任何可用介质。
本领域普通技术人员可以理解,在本申请的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本发明旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求书指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求书来限制。

Claims (18)

1.一种业务的处理方法,其特征在于,包括:
根据待处理的业务请求,获取与业务处理模型相关的业务数据;
采用所述业务处理模型对所述业务数据进行处理,得到所述业务处理模型的目标变量的预测结果;
采用预设局部解释方式对所述目标变量的预测结果进行解释处理,得到与所述目标变量的预测结果对应的局部业务解释;其中,所述预设局部解释方式是指用于确定所述预测结果对应的局部业务解释的计算方式。
2.根据权利要求1所述的方法,其特征在于,还包括:
获取所述待处理的业务对应的专家性解释和预设模型解释;
根据所述专家性解释和/或所述预设模型解释,判断所述局部业务解释是否符合业务逻辑。
3.根据权利要求2所述的方法,其特征在于,还包括:
在确定所述局部业务解释符合业务逻辑时,获取所述业务数据的各特征对所述预测结果的贡献度;
将所述各特征对所述预测结果的贡献度中大于预设贡献度的各贡献度所对应的特征作为优化特征;
基于所述优化特征,确定与所述待处理的业务相关的用户群。
4.根据权利要求2所述的方法,其特征在于,还包括:
在确定所述局部业务解释不符合业务逻辑时,根据所述预设模型解释中的全局业务解释重新确定与所述业务处理模型相关的待获取业务数据;其中,所述待获取业务数据用于指示与所述业务处理模型相关的待获取的业务数据的类型。
5.根据权利要求1至4任一所述的方法,其特征在于,所述业务处理模型的获取方式包括:
获取样本数据,并对所述样本数据进行预处理;
根据所述预处理后的样本数据对预配置的初始化业务处理模型进行训练,得到所述业务处理模型。
6.根据权利要求5所述的方法,其特征在于,还包括:
采用预设全局解释方式对所述预处理后的样本数据进行解释处理,并根据解释结果确定与所述业务处理模型相关的待获取业务数据;其中,所述待获取业务数据用于指示与所述业务处理模型相关的待获取的业务数据的类型。
7.根据权利要求6所述的方法,其特征在于,所述采用预设全局解释方式对所述预处理后的样本数据进行解释处理,并根据解释结果确定与所述业务处理模型相关的待获取业务数据,包括:
对于所述预处理后的样本数据的每个特征,获取所述特征的重要性指示信息;
判断所述特征与其他特征的交互性是否明显;
在确定所述特征与其他特征的交互性不明显时,采用累积局部效果图或者部分依赖图,判断所述特征对所述业务处理模型的目标变量的预测结果是否符合业务逻辑;
在确定所述特征对所述预测结果符合业务逻辑时,将所述特征对应的数据作为与所述业务处理模型相关的待获取业务数据。
8.根据权利要求7所述的方法,其特征在于,还包括:
在确定所述特征与其他特征的交互性明显时,采用SHAP图或者累积局部效果图,判断所述特征对所述业务处理模型的目标变量的预测结果是否符合业务逻辑;
在确定所述特征对所述预测结果符合业务逻辑时,将所述特征对应的数据作为与所述业务处理模型相关的待获取业务数据。
9.根据权利要求8所述的方法,其特征在于,还包括:
对所述特征进行衍生处理,以获取衍生的新的特征;
在确定所述新的特征对所述预测结果符合业务逻辑时,将所述新的特征对应的数据作为与所述业务处理模型相关的待获取业务数据。
10.根据权利要求7或8所述的方法,其特征在于,还包括:
在确定所述特征对所述预测结果不符合业务逻辑时,重新对所述业务处理模型进行训练处理。
11.一种业务的处理装置,其特征在于,包括:
第一获取模块,用于根据待处理的业务请求,获取与业务处理模型相关的业务数据;
第二获取模块,用于采用所述业务处理模型对所述业务数据进行处理,得到所述业务处理模型的目标变量的预测结果;
第三获取模块,用于采用预设局部解释方式对所述目标变量的预测结果进行解释处理,得到与所述目标变量的预测结果对应的局部业务解释;其中,所述预设局部解释方式是指用于确定所述预测结果对应的局部业务解释的计算方式。
12.根据权利要求11所述的装置,其特征在于,还包括:
第四获取模块,用于获取所述待处理的业务对应的专家性解释和预设模型解释;
判断模块,用于根据所述专家性解释和/或所述预设模型解释,判断所述局部业务解释是否符合业务逻辑。
13.根据权利要求12所述的装置,其特征在于,还包括:第五获取模块;
其中,所述第五获取模块用于:
在所述判断模块确定所述局部业务解释符合业务逻辑时,获取所述业务数据的各特征对所述预测结果的贡献度;
将所述各特征对所述预测结果的贡献度中大于预设贡献度的各贡献度所对应的特征作为优化特征;
基于所述优化特征,确定与所述待处理的业务相关的用户群。
14.根据权利要求12所述的装置,其特征在于,还包括:第六获取模块;
其中,所述第六获取模块用于:
在所述判断模块确定所述局部业务解释不符合业务逻辑时,根据所述预设模型解释中的全局业务解释重新确定与所述业务处理模型相关的待获取业务数据;其中,所述待获取业务数据用于指示与所述业务处理模型相关的待获取的业务数据的类型。
15.根据权利要求11至14任一所述的装置,其特征在于,还包括:第七获取模块;
其中,所述第七获取模块,用于:
获取样本数据,并对所述样本数据进行预处理;
根据所述预处理后的样本数据对预配置的初始化业务处理模型进行训练,得到所述业务处理模型。
16.根据权利要求15所述的装置,其特征在于,还包括:第八获取模块;
其中,所述第八获取模块用于:
采用预设全局解释方式对所述预处理后的样本数据进行解释处理,并根据解释结果确定与所述业务处理模型相关的待获取业务数据;其中,所述待获取业务数据用于指示与所述业务处理模型相关的待获取的业务数据的类型。
17.一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至10任一项所述的业务的处理方法。
18.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1至10任一项所述的业务的处理方法。
CN202010319159.5A 2020-04-21 2020-04-21 业务的处理方法、装置、设备及存储介质 Pending CN111523678A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010319159.5A CN111523678A (zh) 2020-04-21 2020-04-21 业务的处理方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010319159.5A CN111523678A (zh) 2020-04-21 2020-04-21 业务的处理方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN111523678A true CN111523678A (zh) 2020-08-11

Family

ID=71903813

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010319159.5A Pending CN111523678A (zh) 2020-04-21 2020-04-21 业务的处理方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN111523678A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112116159A (zh) * 2020-09-21 2020-12-22 贝壳技术有限公司 信息交互方法、装置、计算机可读存储介质及电子设备
CN112200392A (zh) * 2020-11-30 2021-01-08 上海冰鉴信息科技有限公司 业务预测方法及装置
CN112328657A (zh) * 2020-11-03 2021-02-05 中国平安人寿保险股份有限公司 特征衍生方法、装置、计算机设备及介质
CN112907145A (zh) * 2021-03-31 2021-06-04 重庆度小满优扬科技有限公司 模型解释方法以及电子设备
CN113468237A (zh) * 2021-06-11 2021-10-01 北京达佳互联信息技术有限公司 一种业务数据处理模型生成方法、***构建方法及装置
CN113570260A (zh) * 2021-07-30 2021-10-29 北京房江湖科技有限公司 任务分配方法和计算机可读存储介质、电子设备
CN114140219A (zh) * 2021-11-23 2022-03-04 四川新网银行股份有限公司 一种征信报告特征的挖掘方法
CN115858418A (zh) * 2023-02-09 2023-03-28 成都有为财商教育科技有限公司 一种数据缓存的方法及***

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112116159A (zh) * 2020-09-21 2020-12-22 贝壳技术有限公司 信息交互方法、装置、计算机可读存储介质及电子设备
CN112116159B (zh) * 2020-09-21 2021-08-27 贝壳找房(北京)科技有限公司 信息交互方法、装置、计算机可读存储介质及电子设备
CN112328657A (zh) * 2020-11-03 2021-02-05 中国平安人寿保险股份有限公司 特征衍生方法、装置、计算机设备及介质
CN112200392A (zh) * 2020-11-30 2021-01-08 上海冰鉴信息科技有限公司 业务预测方法及装置
US11250368B1 (en) 2020-11-30 2022-02-15 Shanghai Icekredit, Inc. Business prediction method and apparatus
CN112907145A (zh) * 2021-03-31 2021-06-04 重庆度小满优扬科技有限公司 模型解释方法以及电子设备
CN112907145B (zh) * 2021-03-31 2024-05-28 重庆度小满优扬科技有限公司 模型解释方法以及电子设备
CN113468237A (zh) * 2021-06-11 2021-10-01 北京达佳互联信息技术有限公司 一种业务数据处理模型生成方法、***构建方法及装置
CN113468237B (zh) * 2021-06-11 2024-05-17 北京达佳互联信息技术有限公司 一种业务数据处理模型生成方法、***构建方法及装置
CN113570260A (zh) * 2021-07-30 2021-10-29 北京房江湖科技有限公司 任务分配方法和计算机可读存储介质、电子设备
CN114140219A (zh) * 2021-11-23 2022-03-04 四川新网银行股份有限公司 一种征信报告特征的挖掘方法
CN115858418A (zh) * 2023-02-09 2023-03-28 成都有为财商教育科技有限公司 一种数据缓存的方法及***

Similar Documents

Publication Publication Date Title
CN111523678A (zh) 业务的处理方法、装置、设备及存储介质
CN108133013B (zh) 信息处理方法、装置、计算机设备和存储介质
CN107862339B (zh) 用于输出信息的方法和装置
CN111783039B (zh) 风险确定方法、装置、计算机***和存储介质
CN113095408A (zh) 风险的确定方法、装置和服务器
CN112950347B (zh) 资源数据处理的优化方法及装置、存储介质、终端
CN113254542A (zh) 数据可视化处理方法及装置、电子设备
CN113742492A (zh) 保险方案生成方法、装置、电子设备及存储介质
CN113393299A (zh) 推荐模型训练方法、装置、电子设备和存储介质
EP3869398A2 (en) Method and apparatus for processing image, device and storage medium
CN111815435A (zh) 一种群体风险特征的可视化方法、装置、设备及存储介质
CN111695988A (zh) 信息处理方法、装置、电子设备和介质
WO2020150597A1 (en) Systems and methods for entity performance and risk scoring
CN116468547A (zh) 一种基于数据挖掘的***资源分配方法及***
CN115827994A (zh) 一种数据处理方法、装置、设备、存储介质
CN114820196A (zh) 信息推送方法、装置、设备及介质
CN113239273B (zh) 用于生成文本的方法、装置、设备以及存储介质
CN113052512A (zh) 风险预测方法、装置和电子设备
CN114119107A (zh) 一种钢贸企业交易测评方法、装置、设备及存储介质
CN113094595A (zh) 对象识别方法、装置、计算机***及可读存储介质
CN114066513A (zh) 一种用户分类的方法和装置
CN109344386B (zh) 文本内容标识方法、装置、设备及计算机可读存储介质
CN111815204A (zh) 风险评估方法、装置以及***
CN113344066A (zh) 一种模型训练方法、业务分配方法、装置及设备
CN113591932A (zh) 基于一类支持向量机的用户异常行为处理方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: Room 221, 2 / F, block C, 18 Kechuang 11th Street, Daxing District, Beijing, 100176

Applicant after: Jingdong Digital Technology Holding Co., Ltd

Address before: Room 221, 2 / F, block C, 18 Kechuang 11th Street, Beijing Economic and Technological Development Zone, 100176

Applicant before: JINGDONG DIGITAL TECHNOLOGY HOLDINGS Co.,Ltd.

CB02 Change of applicant information
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40032783

Country of ref document: HK

CB02 Change of applicant information

Address after: Room 221, 2 / F, block C, 18 Kechuang 11th Street, Daxing District, Beijing, 100176

Applicant after: Jingdong Technology Holding Co.,Ltd.

Address before: Room 221, 2 / F, block C, 18 Kechuang 11th Street, Daxing District, Beijing, 100176

Applicant before: Jingdong Digital Technology Holding Co., Ltd

CB02 Change of applicant information