CN115564450B - 一种风控方法、装置、存储介质及设备 - Google Patents

一种风控方法、装置、存储介质及设备 Download PDF

Info

Publication number
CN115564450B
CN115564450B CN202211556873.1A CN202211556873A CN115564450B CN 115564450 B CN115564450 B CN 115564450B CN 202211556873 A CN202211556873 A CN 202211556873A CN 115564450 B CN115564450 B CN 115564450B
Authority
CN
China
Prior art keywords
service
abnormal
typical
determining
reason
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211556873.1A
Other languages
English (en)
Other versions
CN115564450A (zh
Inventor
赵闻飙
彭凤超
刘腾飞
徐恪
李琦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202211556873.1A priority Critical patent/CN115564450B/zh
Publication of CN115564450A publication Critical patent/CN115564450A/zh
Application granted granted Critical
Publication of CN115564450B publication Critical patent/CN115564450B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4016Transaction verification involving fraud or risk level assessment in transaction processing

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Computer Security & Cryptography (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本说明书公开了一种风控方法、装置、存储介质及设备,通过根据异常业务的业务数据对各异常业务进行聚类,得到各业务簇及各业务簇分别对应的典型业务。以针对每个典型业务,根据该典型业务的业务数据,通过解释模型确定该典型业务被识别为异常的原因。并根据剩余异常业务与各典型业务的相似度及各典型业务被识别为异常业务的原因,确定剩余异常业务被识别为异常业务的原因,以根据各异常业务被识别为异常业务的原因执行风控业务。可通过聚类确定用于输入解释模型的典型业务,基于模型输出的典型业务被识别为异常业务的原因确定其他异常业务被识别为异常业务的原因,减少输入模型的数据量,减少模型计算耗时,提升确定原因的效率以提升风控效率。

Description

一种风控方法、装置、存储介质及设备
技术领域
本说明书涉及风控技术领域,尤其涉及一种风控方法、装置、存储介质及设备。
背景技术
目前,用户对隐私数据越来越关注。异常检测为常见的风控方式之一。通过异常检测,可识别业务是否异常。
但通过异常检测仅能够得出业务是否异常的分类结果,并无法得到异常业务被识别为异常的原因。而合理评估一个业务的风险,通常需要参考相应的原因。因此,目前在通过异常检测模型确定出异常业务后,还需确定异常业务被识别为异常的原因。
但现有的确定异常业务被识别为异常的原因的方法存在效率低,导致风控效率低的问题。
发明内容
本说明书提供一种风控方法、装置、存储介质及设备,以至少部分的解决上述问题。
本说明书采用下述技术方案:
本说明书提供了一种风控方法,包括:
确定各异常业务的业务数据;
根据所述业务数据,对所述各异常业务进行聚类,得到各业务簇以及各业务簇分别对应的聚类中心,根据所述各业务簇的聚类中心,分别确定所述各业务簇的典型业务;
针对每个典型业务,根据该典型业务的业务数据,通过解释模型,确定该典型业务被识别为异常业务的原因;
根据剩余异常业务与各典型业务的相似度,以及所述各典型业务被识别为异常业务的原因,确定剩余异常业务被识别为异常业务的原因;
根据各异常业务被识别为异常业务的原因执行风控业务。
本说明书提供了一种风控装置,包括:
确定模块,用于确定各异常业务的业务数据;
聚类模块,用于根据所述业务数据,对所述各异常业务进行聚类,得到各业务簇以及各业务簇分别对应的聚类中心,根据所述各业务簇的聚类中心,分别确定所述各业务簇的典型业务;
原因确定模块,用于针对每个典型业务,根据该典型业务的业务数据,通过解释模型,确定该典型业务被识别为异常业务的原因;
原因传播模块,用于根据剩余异常业务与各典型业务的相似度,以及所述各典型业务被识别为异常业务的原因,确定剩余异常业务被识别为异常业务的原因;
风控模块,用于根据各异常业务被识别为异常业务的原因执行风控业务。
本说明书提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述风控方法。
本说明书提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述风控方法。
本说明书采用的上述至少一个技术方案能够达到以下有益效果:
在上述风控方法中,通过根据异常业务的业务数据对各异常业务进行聚类,得到各业务簇及各业务簇分别对应的典型业务。以针对每个典型业务,根据该典型业务的业务数据,通过解释模型确定该典型业务被识别为异常的原因。并根据剩余异常业务与各典型业务的相似度及各典型业务被识别为异常业务的原因,确定剩余异常业务被识别为异常业务的原因,以根据各异常业务被识别为异常业务的原因执行风控业务。
从上述内容中可以看出,本说明书中提供的风控方法可通过聚类确定用于输入解释模型的典型业务,基于解释模型输出的典型业务被识别为异常业务的原因,确定其他异常业务被识别为异常业务的原因,实现高效率的异常原因的传播,减少输入解释模型的数据量,减少解释模型计算耗时,提升确定异常业务被识别为异常的原因的效率以提升风控效率。
附图说明
此处所说明的附图用来提供对本说明书的进一步理解,构成本说明书的一部分,本说明书的示意性实施例及其说明用于解释本说明书,并不构成对本说明书的不当限定。在附图中:
图1为本说明书提供的一种风控方法的流程示意图;
图2为本说明书提供的一种解释模型的示意图;
图3为本说明书提供的一种风控装置的示意图;
图4为本说明书提供的一种电子设备的示意图。
具体实施方式
目前,在通过异常检测模型确定出异常业务后,通常需要将确定出的异常业务的数据分别输入用于解释业务被识别为异常业务的原因其他模型,以分别确定异常业务被识别为异常的原因。即,通过其他模型,对异常检测模型的输出进行解释。
由于对每个异常业务皆需通过模型进行解释,且现有的用于解释原因的模型存在运行效率低的问题,导致在确定异常业务被识别为异常的原因时,需要消耗大量的时间,导致确定原因的效率低(即,解释效率低),进一步导致风控效率低,甚至会导致风控不及时,造成业务损失。
为了至少部分的解决上述问题,本说明书提供了一种风控方法。通过该风控方法,可根据异常业务的业务数据,通过聚类将异常业务聚类到不同的业务簇中,并分别确定各业务簇中的典型业务。其中,每个业务簇可对应一种风险类型。
之后,可将典型业务作为对应的业务簇中的代表,输入到解释模型,得到典型业务被识别为异常业务的原因。在得到典型业务被识别为异常业务的原因后,则可根据剩余异常业务与典型业务的相似度,以及典型业务被识别为异常业务的原因,确定剩余异常业务被识别为异常业务的原因,实现原因的传播。如此可得到所有异常业务对应的原因,但无需分别将每个异常业务输入解释模型,可大大提升对异常业务的解释效率以能够提升风控效率。
为使本说明书的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书保护的范围。
以下结合附图,详细说明本说明书各实施例提供的技术方案。
图1为本说明书中一种风控方法的流程示意图,具体包括以下步骤:
S100:确定各异常业务的业务数据。
在本说明书中,该风控方法可由服务器执行。该服务器可以是单独的一台服务器,或者也可以是多台服务器,例如,可以是分布式***。
该服务器可周期性的确定各异常业务,并确定各异常业务被识别为异常业务的原因,以基于确定出的原因执行风控业务。
例如,可以一天为一个周期,如,可在当天零点确定前一天的各业务,并通过异常检测模型确定各业务中的异常业务,以进一步通过该风控方法确定各异常业务被识别为异常业务的原因。
在确定各异常业务被识别为异常业务的原因时,首先,该服务器可确定各异常业务的业务数据。
S102:根据所述业务数据,对所述各异常业务进行聚类,得到各业务簇以及各业务簇分别对应的聚类中心,根据所述各业务簇的聚类中心,分别确定所述各业务簇的典型业务。
在确定出各异常业务的业务数据后,该服务器则可根据业务数据,对各异常业务进行聚类,得到各业务簇以及各业务簇分别对应的聚类中心,以根据各业务簇的聚类中心,分别确定各业务簇的典型业务。
如上所述,一个业务簇可对应一种风险类型。例如,风险类型可包括洗钱风险、刷单风险、优惠券套现风险等等。针对每个业务簇,根据该业务簇的聚类中心从该业务簇的各异常业务中,确定出的典型业务,即该业务簇的风险类型对应的典型业务。
由于典型业务是基于聚类中心确定出的,因此,典型业务为业务簇中具有代表性的,能够表示业务簇的各异常业务的风险状况的普遍水平的异常业务。
本说明书对采用的聚类算法不做限制,例如,可采用k均值(k-means)聚类算法、基于密度的聚类算法(Density-Based Spatial Clustering Of Applications With Noise,DBSCAN)等。
S104:针对每个典型业务,根据该典型业务的业务数据,通过解释模型,确定该典型业务被识别为异常业务的原因。
在确定出各业务簇对应的典型业务后,该服务器则可针对每个典型业务,根据该典型业务的业务数据,通过解释模型,确定该典型业务被识别为异常业务的原因。
S106:根据剩余异常业务与各典型业务的相似度,以及所述各典型业务被识别为异常业务的原因,确定剩余异常业务被识别为异常业务的原因。
由于相似的异常业务被识别为异常业务的原因通常存在共性,因此,在确定出各典型业务被识别为异常业务的原因之后,该服务器则可根据剩余异常业务与各典型业务的相似度,以及各典型业务被识别为异常业务的原因,确定剩余的异常业务被识别为异常业务的原因。
S108:根据各异常业务被识别为异常业务的原因执行风控业务。
在确定出各异常业务被识别为异常业务的原因后,该服务器则可根据各异常业务被识别为异常业务的原因执行风控业务。
基于图1所示的方法,通过根据异常业务的业务数据对各异常业务进行聚类,得到各业务簇及各业务簇分别对应的典型业务。以针对每个典型业务,根据该典型业务的业务数据,通过解释模型确定该典型业务被识别为异常的原因。并根据剩余异常业务与各典型业务的相似度及各典型业务被识别为异常业务的原因,确定剩余异常业务被识别为异常业务的原因,以根据各异常业务被识别为异常业务的原因执行风控业务。
从上述方法中可以看出,本方法可通过聚类确定出用于输入解释模型的典型业务,基于解释模型输出的典型业务被识别为异常业务的原因,确定其他异常业务被识别为异常业务的原因,实现高效率的异常原因的传播,减少输入解释模型的数据量,减少解释模型计算耗时,提升确定异常业务被识别为异常的原因的效率以提升风控效率。
由于在执行业务后,会生成业务记录,用于存储业务的相关数据,如业务的执行时间、涉及的业务主体、业务内容等等,是确定业务是否异常的重要依据。因此,业务记录可用于确定异常业务被识别为异常业务的原因。
在本说明书一个或多个实施例中,在步骤S100中确定各异常业务的业务数据时,该服务器可针对每个异常业务,将该异常业务的业务记录,作为该异常业务的业务数据。即,将执行该异常业务所生成的业务记录,作为该异常业务的业务数据。
或者,由于业务记录中可能存在一些噪声数据,因此,该服务器可从业务记录中提取能够用于确定异常业务被识别为异常业务的原因的业务特征,以基于业务特征确定业务数据。
于是,在步骤S100中确定各异常业务的业务数据时,具体的,该服务器可针对每个异常业务,确定该异常业务的业务记录。之后,可根据确定出的业务记录,确定该异常业务对应的预设的各业务特征的特征值,得到该异常业务的特征向量,作为该异常业务的业务数据。
在本说明书一个或多个实施例中,用于确定该异常业务的特征向量的业务记录可以是执行该异常业务所生成的业务记录。或者,也可不限制于执行该异常业务所生成的业务记录,例如,还可包括该异常业务涉及的业务主体历史上执行的业务的业务记录。则,至少部分预设的业务特征的特征值,可以是基于多个业务记录确定出的。如,业务特征“频率”可基于异常业务对应的业务主体的多个业务的业务记录确定。
以业务是交易为例,通常交易涉及的业务主体可包括买家、卖家,以及促成交易的服务方(如,为交易提供技术支持的服务方、为促成交易策划活动、派发优惠券的服务方等等)。
则,预设的各业务特征可包括业务本身的特征,以及业务对应的业务主体的特征。例如,交易业务本身的特征可以包括交易金额、交易时间等。如上所述,业务对应的业务主体可包括:服务方、卖家、买家等。则,业务主体的特征可包括:买家的定位、买家的交易频率、买家与卖家是否为亲友关系、买家与卖家是否为团伙关系等。基于这些业务主体的特征能够识别交易是否涉嫌洗钱、刷单、优惠券套现等违规行为。
其中,卖家与买家是否为亲友关系可基于卖家与买家在该服务器对应的业务平台注册的账号确定,或者,可基于买家与卖家的实名认证信息确定。需要说明的是,本说明书中所确定的信息均为经过用户授权后,通过合法途径获取的。
买家与卖家是否为团伙关系,可根据卖家与买家在预设时间内的交易次数以及预设的阈值确定,例如,当卖家与买家在预设时间内的交易次数大于预设的阈值时,可确定卖家与买家为团伙关系。
另外,在本说明书一个或多个实施例中,在步骤S102根据各业务簇的聚类中心,分别确定各业务簇的典型业务时,由于聚类中心能够表示所属业务簇中各异常业务的普遍水平,因此,该服务器可针对每个业务簇,将该业务簇中的聚类中心,作为该业务簇的典型业务。
需要说明的是,通过聚类算法确定出的聚类中心未必对应实际存在的异常业务。即,聚类中心处未必存在异常业务。该服务器可不论确定出的聚类中心是否存在异常业务,皆将确定出的聚类中心作为对应的业务簇中的典型业务。
或者,该服务器还可针对每个业务簇,当该业务簇的聚类中心存在异常业务时,将该业务簇的聚类中心作为该业务簇的典型业务。当该业务簇的聚类中心不存在异常业务时,则可根据该业务簇中各异常业务与该业务簇的聚类中心的距离,从该业务簇的各异常业务中,确定该业务簇的典型业务。
其中,该业务簇的聚类中心存在异常业务,即,该聚类中心的业务数据与该业务簇的至少一个异常业务相同。该业务簇的聚类中心不存在异常业务,即,该聚类中心的业务数据与该业务簇的任意异常业务皆不同。
在本说明书一个或多个实施例中,该服务器可确定距离该聚类中心距离最近的异常业务,作为典型业务。
在本说明书一个或多个实施例中,当该聚类中心所属业务簇中存在多个与该聚类中心距离相同,且与该聚类中心距离皆为该业务簇中各异常业务中最近的业务时,即,当距离该聚类中心距离最近的异常业务有多个时,该服务器可将距离该聚类中心距离最近的异常业务,作为待定业务。之后,可针对每个待定业务,确定该待定业务分别与所属业务簇中其他异常业务间的距离和,并将得到的距离和最小的异常业务,作为该业务簇中的典型业务。
在本说明书一个或多个实施例中,该服务器可根据该业务簇的各异常业务的特征向量与该业务簇的聚类中心的特征向量,确定各异常业务分别与该业务簇的聚类中心的距离。
另外,在本说明书中,对采用的解释模型不做限制,可采用现有的解释模型,例如,可采用夏普利加性解释(Shapley Additive explanation,SHAP)模型。则,在本说明书步骤S104中,在针对每个典型业务,根据该典型业务的业务数据,通过解释模型,确定该典型业务被识别为异常业务的原因时,具体的,该服务器可针对每个典型业务,将该典型业务的业务数据输入该解释模型,得到该典型业务的各业务特征分别对应的特征权重。
之后,该服务器可将得到的各业务特征的特征权重,作为该典型业务被识别为异常业务的原因。或者,该服务器可根据各业务特征的特征权重,筛选部分业务特征,以将筛选得到的业务特征及其业务特征作为该典型业务被识别为异常业务的原因。
其中,特征权重用于表示业务特征对于将典型业务识别为异常业务的贡献度。并且,特征权重与贡献度正相关。即,业务特征对应的特征权重越大,业务特征对于所属的业务被识别为异常业务的贡献越大。
当然,在本说明书中,还可采用其他的解释模型。例如,由于风险具有多样性,异常业务也不存在可标签化的固定模式,因此,相比于有监督学习模型,通过无监督或自监督方式训练得到的解释模型,更利于准确确定异常业务被识别为异常业务的原因。
例如,解释模型可以是通过对比学习训练得到的。解释模型的输入可包括异常业务对应的业务数据以及正常业务的业务数据,使得解释模型在训练过程中可对比学习正常业务以及异常业务的业务数据的差异,使得在应用解释模型时,解释模型能够准确输出异常业务被识别为异常业务的原因。
为了便于理解,本说明书先对解释模型的训练过程进行说明:
首先服务器可确定由异常业务以及正常业务构成的业务组的业务数据作为一个训练样本。其中,一个业务组对应的正常业务的数量可根据需要设置。例如,由于正常业务中也可能存在与异常业务相似的业务,在训练解释模型时,除了以使解释模型能够区分异常业务以及正常业务,学习异常业务以及正常业务的业务特征的差异为目的进行训练。另外,为了使解释模型能够学习异常业务、与异常业务相似的正常业务以及一般正常业务间,业务特征的差异,使得相比于一般的正常业务,对于与异常业务相似的正常业务,解释模型也能够准确区分。于是,一个训练样本可包括一个异常业务的业务数据、一个与该异常业务相似的正常业务的业务数据,以及一个其他的正常业务的业务数据。
在本说明书一个或多个实施例中,该解释模型可包括嵌入(embedding)层以及注意力层。
在一个实施例中,该注意力层可由一个单隐藏层以及一个线性整流函数构成。
该服务器可将训练样本输入解释模型的嵌入层,分别根据输入的各业务数据以及嵌入层的参数,得到该训练样本的各业务数据分别对应的嵌入特征。之后,可将该训练样本的各嵌入特征拼接(concat),并输入该注意力层,得到注意力层输出的该训练样本对应的注意力权重。其中,嵌入特征为矩阵。注意力权重为向量。
然后,该服务器可根据该注意力权重,确定取反注意力权重。例如,该注意力权重与该取反注意力权重相同维度的值之和可为1。
该服务器可根据该注意力权重对该训练样本的各嵌入特征分别加权,得到第一三元组。并根据该取反注意力权重对该训练样本的各嵌入特征分别加权,得到第二三元组。
之后,该服务器可确定第一三元组对应的三元组损失(Triplet Loss)作为第一损失,以及第二三元组对应的三元组损失,作为第二损失。并根据第一损失以及第二损失,确定总损失。以根据该总损失,调整该解释模型的参数。
在本说明书一个或多个实施例中,确定总损失的公式可具体如下:
Figure 961315DEST_PATH_IMAGE002
其中,L即总损失,L 1即第一损失,L 2即第二损失。
Figure DEST_PATH_IMAGE004
为预设的超参数。
或者,可对一个批次(batch)的训练样本确定一个总损失,则确定总损失的公式还可如下:
Figure DEST_PATH_IMAGE006
其中,L 1i即由一个batch训练样本构成的集合Q中,第i个训练样本的第一损失,L2i即集合Q中,第i个训练样本的第二损失。
为了便于理解,本说明书还该提供了图2所示的解释模型的示意图。
如图2,由一个矩形与其中的三个圆形构成的图形表示一个业务的业务数据。一个训练样本包括一个异常业务的业务数据以及两个正常业务的业务数据。训练样本首先被输入到解释模型的嵌入层,根据该训练样本对应的各业务数据以及嵌入层的参数可得到该训练样本对应的各嵌入特征。在将各嵌入特征拼接后,可将得到的拼接后的嵌入特征输入解释模型的注意力层。注意力层输出的注意力权重以及各嵌入特征用于确定损失。
根据注意力层输出的注意力权重以及各嵌入特征,可确定第一损失。根据该注意力权重对应的取反注意力权重以及各嵌入特征,可确定第二损失。根据第一损失与第二损失,可确定总损失。其中,嵌入层的参数以及注意力权重用于确定输入该解释模型的业务数据中,异常业务的业务数据包含的各业务特征的特征权重。
相应的,在本说明书一个或多个实施例中,在步骤S104中针对每个典型业务,根据该典型业务的业务数据,通过解释模型,确定该典型业务被识别为异常业务的原因时,该服务器首先可确定各正常业务的业务数据。之后,可针对每个典型业务,根据各正常业务与该典型业务的相似度,从各正常业务中确定两个该典型业务对应的相关业务,与该典型业务构成业务组。即,一个业务组包含一个异常业务以及该异常业务对应的两个相关业务。
然后,该服务器可根据该业务组的各业务数据,通过该解释模型,确定该典型业务被识别为异常业务的原因。
其中,输入解释模型的正常业务用于使解释模型学习正常业务与异常业务间的差异,以及与异常业务相似的正常业务,与其他的正常业务间的差异。
在根据各正常业务与该典型业务的相似度,从各正常业务中确定两个该典型业务对应的相关业务时,该服务器可确定各正常业务分别与该典型业务的相似度。之后,根据确定出的相似度,从各正常业务中确定与该典型业务相似度最高的相似业务。
然后,该服务器可从剩余的各正常业务中随机筛选一个正常业务,并将筛选出的正常业务与该相似业务作为该典型业务的相关业务。
在本说明书一个或多个实施例中,该服务器还可确定各正常业务分别与该典型业务的相似度。之后,根据确定出的相似度,从各正常业务中确定与该典型业务相似度最高的相似业务,并从剩余正常业务中,确定对应的相似度小于预设的第一阈值的正常业务,并从对应的相似度小于第一阈值的正常业务中,随机筛选一个正常业务。然后,该服务器可将筛选出的正常业务与该相似业务作为该典型业务的相关业务。
再或者,该服务器还可确定各正常业务分别与该典型业务的相似度。之后,根据确定出的相似度,从对应的相似度大于预设的第二阈值的各正常业务中,随机确定一个相关业务,并从对应的相似度小于第一阈值的正常业务中,随机确定另一个相关业务。在本说明书一个或多个实施例中,该服务器可根据通过该解释模型确定的该典型业务的各业务特征的特征权重,确定该典型业务被识别为异常业务的原因。
在根据业务组的各业务数据,通过解释模型,确定该典型业务被识别为异常业务的原因时,具体的,该服务器可将该典型业务的业务组的各业务的业务数据输入嵌入层。之后,针对该业务组的每个业务数据,可根据该嵌入层的参数以及该业务数据,得到该业务数据对应的嵌入特征。
然后,该服务器可将该业务组对应的各嵌入特征拼接后,输入注意力层,得到该业务组对应的注意力权重。
之后,该服务器可根据该注意力权重以及嵌入层的参数,确定该典型业务的各业务特征分别对应的特征权重,以根据该典型业务的各业务特征对应的特征权重,确定该典型业务被识别为异常业务的原因。
其中,该特征权重用于表示业务特征对于将该典型业务识别为异常业务的贡献度。
在根据该典型业务的各业务特征对应的特征权重,确定该典型业务被识别为异常业务的原因时,具体的,该服务器可根据该典型业务的各业务特征对应的特征权重,对该典型业务的各业务特征进行排序,以根据排序结果以及预设的数量,从该典型业务的各业务特征中,确定该典型业务被识别为异常业务的原因。
例如,可将权重最高的业务特征,作为该典型业务被识别为异常业务的原因。或者,也可根据预设的数量,根据排序结果,以特征权重自高到低的顺序确定部分业务特征及其特征权重,作为该典型业务被识别为异常业务的原因。
进一步地,由于同一业务簇中的异常业务皆为对应相同风险类型的相似的业务,因此,该服务器可针对每个典型业务,将该典型业务被识别为异常的原因,作为该典型业务对应的业务簇中各其他异常业务被识别为异常的原因。
或者,在步骤S106中根据剩余异常业务与各典型业务的相似度,以及各典型业务被识别为异常业务的原因,确定剩余异常业务被识别为异常业务的原因时,该服务器还可针对每个典型业务,确定该典型业务所属业务簇中,与该典型业务间相似度大于预设的第三阈值的异常业务,作为命中业务。并将该典型业务被识别为异常业务的原因,作为该典型业务对应的命中业务被识别为异常业务的原因。对于非命中业务,可分别输入到解释模型,以根据解释模型的输出,确定非命中业务的解释。
或者,该服务器还可针对每个剩余异常业务,根据该剩余异常业务的业务数据以及各典型业务的业务数据,分别确定该剩余异常业务与各典型业务的相似度。并根据确定出的各相似度,确定该剩余异常业务对应的总相似度。
之后,该服务器可针对每个典型业务,根据该剩余异常业务与该典型业务的相似度以及该总相似度,确定该剩余异常业务被识别为异常业务的原因为该典型业务对应的原因的概率。即,确定该异剩余常业务被识别为异常业务的原因,与该典型业务被识别为异常业务的原因相同的概率。
然后,该服务器可根据该剩余异常业务分别与各典型业务被识别为异常业务的原因对应的概率,以及各典型业务被识别为异常业务的原因,确定该剩余异常业务被识别为异常业务的原因。
例如,假设通过聚类得到2个业务簇,其中一个业务簇的典型业务1被识别为异常业务的原因为交易频率这一业务特征,另一个业务簇的典型业务2被识别为异常业务的原因为团伙这一业务特征。且一个剩余异常业务与典型业务1对应的概率为,与典型业务2对应的概率为0.6。则该剩余异常业务被识别为异常业务的原因为:0.3的概率为交易频率导致被识别为异常业务,0.6的概率为团伙导致被识别为异常业务。
其中,业务间的相似度可基于业务的业务数据确定出的业务间的距离(如欧氏距离)确定,且确定出的距离与相似度负相关。例如,可将业务间的距离的倒数,作为相似度。
具体的,该服务器可针对每个典型业务,确定该典型业务与该异常业务间的相似度与该总相似度的比值,作为该异常业务被识别为异常业务的原因为该典型业务对应的原因的概率。
另外,在步骤S108中根据各异常业务被识别为异常业务的原因执行风控业务时,该服务器还可针对每个典型业务,根据该典型业务的各业务特征的特征值,以及预设的各风险类型分别对应的匹配条件,确定该典型业务对应的风险类型。
之后,可根据剩余异常业务与各典型业务的相似度,以及各典型业务对应的风险类型,确定剩余异常业务对应的风险类型,以根据各异常业务被识别为异常业务的原因以及风险类型,执行风控业务。
该服务器可针对每个典型业务,根据剩余异常业务与该典型业务的相似度以及各剩余异常业务与该典型业务总相似度,确定该剩余异常业务存在该典型业务对应的风险类型的概率。之后,可根据该剩余异常业务分别与各典型业务的风险类型对应的概率,以及各典型业务被的风险类型,确定该剩余异常业务存在各种风险类型的概率。
例如,假设聚类得到的业务簇为2,则,典型业务的数量也为2。假设一个剩余异常业务与其中一个典型业务(后续称为第一典型业务)的相似度为0.2,与另一个典型业务(后续称为第二典型业务)的相似度为0.6,则总相似度为0.8。该异常业务存在第一典型业务对应的第一风险类型的概率为0.25,存在第二典型业务对应的第二风险类型的概率为0.75。
在本说明书一个或多个实施例中,为了使基于异常业务的业务特征确定出的异常业务被识别为异常的原因更准确,在步骤S106根据该典型业务的业务数据,通过解释模型,确定该典型业务被识别为异常业务的原因时,该服务器还可根据该典型业务的业务数据,通过解释模型,确定该典型业务的各业务特征对应的特征权重。之后,可根据该典型业务所属业务簇中各异常业务,确定各业务特征对应的高斯模型。
之后,该服务器可根据各业务特征对应的高斯模型,确定该典型业务的各业务特征的似然值,以针对每个业务特征,根据该典型业务的该业务特征的似然值以及特征权重,确定该业务特征的更新权重。
最后,该服务器可根据该典型业务的各业务特征对应的更新权重,确定该典型业务被识别为异常业务的原因。
在本说明书一个或多个实施例中,该服务器可针对每个业务特征,根据该典型业务所属业务簇中各异常业务与该业务特征对应的特征值,提供高斯建模,确定该业务特征的高斯模型。
在本说明书一个或多个实施例中,业务特征的似然值即业务特征对应的高斯模型的输出。即,该服务器可针对该典型业务的每个业务特征,将该业务特征的特征值输入该业务特征对应的高斯模型,得到该典型业务的该业务特征对应的似然值(likelihood)。
在本说明书一个或多个实施例中,在确定出各业务特征对应的高斯模型后,该服务器还可先根据该典型业务的各业务特征对应的特征权重,对各业务特征进行排序。以根据排序结果以及预设的特征数量,筛选部分业务特征,作为待定特征。例如,假设该典型业务包含200个业务特征,可筛选10个或20个业务特征,作为待定特征。
之后,该服务器可根据待定特征的特征值,通过待定特征对应的高斯模型,确定待定特征对应的似然值。以根据待定特征的似然值以及特征权重,确定该典型业务的待定特征的更新权重。
然后,该服务器可根据该典型业务的待定特征的更新权重,确定该典型业务被识别为异常业务的原因。
另外,为了辅助执行风控业务的用户从多个角度,更方便清晰地理解异常业务存在的风险,或者,为了使被执行风控业务的对象清楚地确定自身被风控的原因,该服务器还可确定异常业务对应的报文。报文能够实现将异常业务特征粒度的被识别为异常的原因,在异常业务对应的主体的粒度进行汇聚,以实现对异常业务对应的原因进行整合,使得对业务被识别为异常业务的原因的解释更通俗易懂。
其中,报文可包括:业务本身对应的报文,以及业务主体对应的报文。例如,业务本身对应的解释报文中可包括业务被识别为异常业务的原因、涉及到的业务资源等。其中,涉及到的业务资源可以是业务的交易金额,数据流量等等。或者,也可以是业务对应的需提供给服务方的业务资源,例如曝光时长,推荐次数等等。
在步骤S108根据各异常业务被识别为异常业务的原因执行风控业务时,该服务器可针对每个异常业务,确定该异常业务对应的业务主体,并针对每个业务主体,根据该业务主体的各异常业务被识别为异常业务的原因以及预设的报文模板,确定该业务主体对应的解释报文。以根据各业务主体对应的异常业务被识别为异常业务的原因,对各业务主体执行风控业务,并将确定出的解释报文发送至对应的业务主体。
例如,可根据各主体对应的异常业务被识别为异常业务的原因,以及预设的风控规则,确定需被执行风控业务的业务主体,并将对应的解释报文发送至确定出的业务主体。
或者,该服务器也可针对每个异常业务,根据该异常业务被识别为异常业务的原因,以及预设的报文模板,确定该异常业务对应的解释报文。以根据该异常业务被识别为异常的原因执行风控业务,并将该异常业务对应的解释报文发送至该异常业务对应的业务主体。
或者,在根据各异常业务的原因执行风控业务时,该服务器还可根据各异常业务被识别为异常的原因,以及各异常业务对应的解释报文,展示解释页面。用户可通过解释页面中展示的解释报文,确定对异常业务执行的风控策略,以根据确定出的风控业务执行风控业务。
因此,该服务器可响应于用户在解释页面的操作,执行风控业务。
另外,在风控场景中,可基于异常业务对应的不同业务主体间的业务关系,进行风险探寻。例如,由于买家的异常可导致与卖家的业务异常,进一步会导致卖家对应的服务商的业务异常。因此,买家、卖家的业务被识别为异常的原因可作为服务方的业务被识别为异常的原因,买家、卖家以及服务商可涉及的异常业务的量级不同,且以买家、卖家、服务方的顺序增加。于是,可以以:买家、卖家、服务方的顺序,对异常业务的被识别为异常业务的原因进行统计汇聚,并分别对买家、卖家、服务方三种量级类型的业务主体生成相应的报文。
在得到各种量级类型的业务主体的报文后,可以以服务方、卖家买家的顺序,基于对应的报文进行风险探索。
除了按照业务主体涉及的异常业务的量级对异常业务进行分类,还可针对每个量级类型的各业务主体,根据业务主体的属性,对各业务主体进行分类,将不同业务主体划分至不同的属性类型。
例如,对于买家,属性可包括:少年人、青年人、中年人、老年人、男性、女性等。对于卖家,属性则可包括:餐饮门店、超市、服装店等等。对于服务方,可不确定属性类型。
基于各量级类型和/或属性类型,可将各业务主体关联,得到连接各业务主体的报文的风险探索路径。用户可基于该风险探索路径进行风险探索,一条风险探索路径可包含若干锚点。不同报文间的跳转可由用户对对应的锚点的点击操作实现。
因此,在本说明书一个或多个实施例中,该服务器还可确定各异常业务对应的业务主体、各业务主体的类型以及各业务主体的解释报文。以针对每个类型,根据该类型的业务主体对应的解释报文,确定该类型的统计报文。其中,该类型可以是量级类型,或者,也可以是属性类型。
之后,该服务器可针对每个统计报文,根据该统计报文中包含的业务主体和业务主体的类型中的至少一种,确定该统计报文中的锚点。该锚点连接该统计报文中包含的业务主体的解释报文,或该锚点连接该统计报文中包含的业务主体的类型的统计报文。
该服务器可响应于用户的选择操作,确定目标报文。
当用户需要查看与目标报文相关的其他报文时,可对目标报文中对应的锚点进行点击。
该服务器则可响应于用户对目标报文中锚点的点击操作,展示点击的锚点对应的统计报文或解释报文。
该服务器还可响应于用户的确定操作,将用户确定的统计报文或解释报文发送至被执行风控业务的对象。
其中,业务主体对应的报文可包括单一的业务主体对应的解释报文,以及一个类型的业务主体对应的统计报文。
业务主体对应的解释报文可包括统计得到的业务主体的异常业务数量,以及异常业务被识别为异常的原因。
一个类型的业务主体对应的统计报文可包括一个类型的业务主体的异常业务数量,以及异常业务被识别为异常的原因。
或者,业务主体对应的解释报文中也可包括业务主体对应的类型,用户可通过点击类型对应的锚点,获取该类型对应的统计报文。
例如,统计报文可为:1000个老年人在50家餐饮门店进行了2万笔相同金额、频率高、位置分散的交易,涉及到业务营销资金10万。其中,老年人,即买家量级类型的业务主体的属性类型。餐饮门店为卖家量级类型的业务主体的属性类型。金额、频率、位置皆为业务被识别为异常业务的原因的业务特征,两种属性类型的业务主体对应的各异常业务的数量为2万笔,涉及到的佣金金额为10万。用户可通过点击“老年人”锚点,获取老年人类型对应的统计报文,或者1000个老年人中的至少部分分别对应的解释报文。用户可通过点击“餐饮门店”锚点,获取餐饮门店类型对应的统计报文,或者50家餐饮门店中的至少部分分别对应的统计报文。
在本说明书中,通过确定风险探索路径,根据风险探索路径以服务方、卖家、买家的顺序进行风险探寻,例如,根据服务方的报文,可确定风险来源于哪些卖家。用户可进一步确定卖家的报文,确定卖家存在风险的原因。以进一步锁定存在风险的买家,并查看买家的报文。
另外,报文中还可包括业务对应的风险类型。并且,该服务器可将各典型业务分别作为各典型业务对应的风险类型的典型案例。
确定出的典型案例可发至对应的业务主体,如服务方。或者,可发至被执行风控业务的对象。
再或者,在解释页面中,也可展示各风险类型对应的典型案例。
另外,在本说明书一个或多个实施例中,基于风险探索路径,除了获取报文,用户还可在确定出存在风险的业务主体后,获取业务主体的相关数据,例如,异常业务的交易明细、业务主体的主体信息等,以提取报文中包含的内容以外的异常信息。
图3为本说明书提供的一种风控装置示意图,装置包括:
确定模块200,用于确定各异常业务的业务数据;
聚类模块201,用于根据所述业务数据,对所述各异常业务进行聚类,得到各业务簇以及各业务簇分别对应的聚类中心,根据所述各业务簇的聚类中心,分别确定所述各业务簇的典型业务;
原因确定模块202,用于针对每个典型业务,根据该典型业务的业务数据,通过解释模型,确定该典型业务被识别为异常业务的原因;
原因传播模块203,用于根据剩余异常业务与各典型业务的相似度,以及所述各典型业务被识别为异常业务的原因,确定剩余异常业务被识别为异常业务的原因;
风控模块204,用于根据各异常业务被识别为异常业务的原因执行风控业务。
可选地,所述确定模块200,还用于针对每个异常业务,确定该异常业务的业务记录;
根据所述业务记录,确定该异常业务对应的预设的各业务特征的特征值,得到该异常业务的特征向量,作为该异常业务的业务数据。
可选地,所述聚类模块201,还用于针对每个业务簇,当该业务簇的聚类中心存在异常业务时,将所述聚类中心作为该业务簇的典型业务,当该业务簇的聚类中心不存在异常业务时,根据该业务簇中各异常业务与该业务簇的聚类中心的距离,从该业务簇的各异常业务中,确定该业务簇的典型业务。
可选地,所述原因确定模块202,还用于确定各正常业务的业务数据,针对每个典型业务,根据各正常业务与该典型业务的相似度,从所述各正常业务中确定两个该典型业务对应的相关业务,与该典型业务构成业务组,根据所述业务组的各业务数据,通过解释模型,确定该典型业务被识别为异常业务的原因。
可选地,所述解释模型包括嵌入层以及注意力层,所述原因确定模块202,还用于将所述业务组的各业务的业务数据输入所述嵌入层,针对所述业务组的每个业务数据,根据所述嵌入层的参数以及该业务数据,得到该业务数据对应的嵌入特征,将所述业务组对应的各嵌入特征拼接后,输入所述注意力层,得到所述业务组对应的注意力权重,根据所述注意力权重以及所述嵌入层的参数,确定该典型业务的各业务特征对应的特征权重,根据该典型业务的各业务特征对应的特征权重,确定该典型业务被识别为异常业务的原因,其中,所述特征权重用于表示业务特征对于将该典型业务识别为异常业务的贡献度。
可选地,所述原因确定模块202,还用于根据该典型业务的各业务特征对应的特征权重,对该典型业务的各业务特征进行排序,根据排序结果以及预设的数量,从该典型业务的各业务特征中,确定该典型业务被识别为异常业务的原因。
可选地,所述风控模块204,还用于针对每个典型业务,根据该典型业务的各业务特征的特征值,以及预设的各风险类型分别对应的匹配条件,确定该典型业务对应的风险类型,根据剩余异常业务与各典型业务的相似度,以及所述各典型业务对应的风险类型,确定剩余异常业务对应的风险类型,根据各异常业务被识别为异常业务的原因以及风险类型,执行风控业务。
可选地,所述原因传播模块203,还用于针对每个剩余异常业务,根据该剩余异常业务的业务数据以及各典型业务的业务数据,分别确定该剩余异常业务与各典型业务的相似度,根据确定出的各相似度,确定该剩余异常业务对应的总相似度,针对每个典型业务,根据该剩余异常业务与该典型业务的相似度以及所述总相似度,确定该剩余异常业务被识别为异常业务的原因为该典型业务对应的原因的概率,根据该剩余异常业务分别与各典型业务被识别为异常业务的原因对应的概率,以及各典型业务被识别为异常业务的原因,确定该剩余异常业务被识别为异常业务的原因。
可选地,所述原因确定模块202,还用于根据该典型业务的业务数据,通过解释模型,确定该典型业务的各业务特征对应的特征权重,根据该典型业务所属业务簇中各异常业务,确定各业务特征对应的高斯模型,根据各业务特征对应的高斯模型,确定该典型业务的各业务特征的似然值,针对每个业务特征,根据该典型业务的该业务特征的似然值以及特征权重,确定该业务特征的更新权重,根据该典型业务的各业务特征对应的更新权重,确定该典型业务被识别为异常业务的原因。
可选地,所述风控模块204,还用于针对每个异常业务,确定该异常业务对应的业务主体,针对每个业务主体,根据该业务主体的各异常业务被识别为异常业务的原因以及预设的报文模板,确定该业务主体对应的解释报文,根据各业务主体对应的异常业务被识别为异常业务的原因,对各业务主体执行风控业务,并将确定出的解释报文发送至对应的业务主体。
可选地,所述装置还包括:
发送模块205,用于确定各异常业务对应的业务主体、各业务主体的类型以及各业务主体的解释报文,针对每个类型,根据该类型的业务主体对应的解释报文,确定该类型的统计报文,针对每个统计报文,根据该统计报文中包含的业务主体和业务主体的类型中的至少一种,确定该统计报文中的锚点,所述锚点连接该统计报文中包含的业务主体的解释报文,或所述锚点连接该统计报文中包含的业务主体的类型的统计报文,响应于用户的选择操作,确定目标报文,响应于所述用户对所述目标报文中锚点的点击操作,展示点击的所述锚点对应的统计报文或解释报文,响应于所述用户的确定操作,将所述用户确定的统计报文或解释报文发送至被执行风控业务的对象。
本说明书还提供了一种计算机可读存储介质,该存储介质存储有计算机程序,计算机程序可用于执行上述风控方法。
本说明书还提供了图4所示的电子设备的示意结构图。如图4所述,在硬件层面,该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,以实现上述风控方法。当然,除了软件实现方式之外,本说明书并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device, PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字***“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20 以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的***、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书的实施例可提供为方法、***或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于***实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。

Claims (14)

1.一种风控方法,包括:
确定各异常业务的业务数据;
根据所述业务数据,对所述各异常业务进行聚类,得到各业务簇以及各业务簇分别对应的聚类中心,根据所述各业务簇的聚类中心,分别确定所述各业务簇的典型业务;
针对每个典型业务,根据该典型业务的业务数据,通过解释模型,确定该典型业务被识别为异常业务的原因;
根据剩余异常业务与各典型业务的相似度,以及所述各典型业务被识别为异常业务的原因,确定剩余异常业务被识别为异常业务的原因;
根据各异常业务被识别为异常业务的原因执行风控业务。
2.如权利要求1所述的方法,确定各异常业务的业务数据,具体包括:
针对每个异常业务,确定该异常业务的业务记录;
根据所述业务记录,确定该异常业务对应的预设的各业务特征的特征值,得到该异常业务的特征向量,作为该异常业务的业务数据。
3.如权利要求1所述的方法,根据所述各业务簇的聚类中心,分别确定所述各业务簇的典型业务,具体包括:
针对每个业务簇,当该业务簇的聚类中心存在异常业务时,将所述聚类中心作为该业务簇的典型业务;
当该业务簇的聚类中心不存在异常业务时,根据该业务簇中各异常业务与该业务簇的聚类中心的距离,从该业务簇的各异常业务中,确定该业务簇的典型业务。
4.如权利要求2所述的方法,针对每个典型业务,根据该典型业务的业务数据,通过解释模型,确定该典型业务被识别为异常业务的原因,具体包括:
确定各正常业务的业务数据;
针对每个典型业务,根据各正常业务与该典型业务的相似度,从所述各正常业务中确定两个该典型业务对应的相关业务,与该典型业务构成业务组;
根据所述业务组的各业务数据,通过解释模型,确定该典型业务被识别为异常业务的原因。
5.如权利要求4所述的方法,所述解释模型包括嵌入层以及注意力层;
根据所述业务组的各业务数据,通过解释模型,确定该典型业务被识别为异常业务的原因,具体包括:
将所述业务组的各业务的业务数据输入所述嵌入层;
针对所述业务组的每个业务数据,根据所述嵌入层的参数以及该业务数据,得到该业务数据对应的嵌入特征;
将所述业务组对应的各嵌入特征拼接后,输入所述注意力层,得到所述业务组对应的注意力权重;
根据所述注意力权重以及所述嵌入层的参数,确定该典型业务的各业务特征对应的特征权重;
根据该典型业务的各业务特征对应的特征权重,确定该典型业务被识别为异常业务的原因;
其中,所述特征权重用于表示业务特征对于将该典型业务识别为异常业务的贡献度。
6.如权利要求5所述的方法,根据该典型业务的各业务特征对应的特征权重,确定该典型业务被识别为异常业务的原因,具体包括:
根据该典型业务的各业务特征对应的特征权重,对该典型业务的各业务特征进行排序;
根据排序结果以及预设的数量,从该典型业务的各业务特征中,确定该典型业务被识别为异常业务的原因。
7.如权利要求1所述的方法,根据各异常业务被识别为异常业务的原因执行风控业务,具体包括:
针对每个典型业务,根据该典型业务的各业务特征的特征值,以及预设的各风险类型分别对应的匹配条件,确定该典型业务对应的风险类型;
根据剩余异常业务与各典型业务的相似度,以及所述各典型业务对应的风险类型,确定剩余异常业务对应的风险类型;
根据各异常业务被识别为异常业务的原因以及风险类型,执行风控业务。
8.如权利要求1所述的方法,根据剩余异常业务与各典型业务的相似度,以及所述各典型业务被识别为异常业务的原因,确定剩余异常业务被识别为异常业务的原因,具体包括:
针对每个剩余异常业务,根据该剩余异常业务的业务数据以及各典型业务的业务数据,分别确定该剩余异常业务与各典型业务的相似度;
根据确定出的各相似度,确定该剩余异常业务对应的总相似度;
针对每个典型业务,根据该剩余异常业务与该典型业务的相似度以及所述总相似度,确定该剩余异常业务被识别为异常业务的原因为该典型业务对应的原因的概率;
根据该剩余异常业务分别与各典型业务被识别为异常业务的原因对应的概率,以及各典型业务被识别为异常业务的原因,确定该剩余异常业务被识别为异常业务的原因。
9.如权利要求1所述的方法,根据该典型业务的业务数据,通过解释模型,确定该典型业务被识别为异常业务的原因,具体包括:
根据该典型业务的业务数据,通过解释模型,确定该典型业务的各业务特征对应的特征权重;
根据该典型业务所属业务簇中各异常业务,确定各业务特征对应的高斯模型;
根据各业务特征对应的高斯模型,确定该典型业务的各业务特征的似然值;
针对每个业务特征,根据该典型业务的该业务特征的似然值以及特征权重,确定该业务特征的更新权重;
根据该典型业务的各业务特征对应的更新权重,确定该典型业务被识别为异常业务的原因。
10.如权利要求1所述的方法,根据各异常业务被识别为异常业务的原因执行风控业务,具体包括:
针对每个异常业务,确定该异常业务对应的业务主体;
针对每个业务主体,根据该业务主体的各异常业务被识别为异常业务的原因以及预设的报文模板,确定该业务主体对应的解释报文;
根据各业务主体对应的异常业务被识别为异常业务的原因,对各业务主体执行风控业务,并将确定出的解释报文发送至对应的业务主体。
11.如权利要求1所述的方法,所述方法还包括:
确定各异常业务对应的业务主体、各业务主体的类型以及各业务主体的解释报文;
针对每个类型,根据该类型的业务主体对应的解释报文,确定该类型的统计报文;
针对每个统计报文,根据该统计报文中包含的业务主体和业务主体的类型中的至少一种,确定该统计报文中的锚点,所述锚点连接该统计报文中包含的业务主体的解释报文,或所述锚点连接该统计报文中包含的业务主体的类型的统计报文;
响应于用户的选择操作,确定目标报文;
响应于所述用户对所述目标报文中锚点的点击操作,展示点击的所述锚点对应的统计报文或解释报文;
响应于所述用户的确定操作,将所述用户确定的统计报文或解释报文发送至被执行风控业务的对象。
12.一种风控装置,包括:
确定模块,用于确定各异常业务的业务数据;
聚类模块,用于根据所述业务数据,对所述各异常业务进行聚类,得到各业务簇以及各业务簇分别对应的聚类中心,根据所述各业务簇的聚类中心,分别确定所述各业务簇的典型业务;
原因确定模块,用于针对每个典型业务,根据该典型业务的业务数据,通过解释模型,确定该典型业务被识别为异常业务的原因;
原因传播模块,用于根据剩余异常业务与各典型业务的相似度,以及所述各典型业务被识别为异常业务的原因,确定剩余异常业务被识别为异常业务的原因;
风控模块,用于根据各异常业务被识别为异常业务的原因执行风控业务。
13.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1~11任一项所述的方法。
14.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述权利要求1~11任一项所述的方法。
CN202211556873.1A 2022-12-06 2022-12-06 一种风控方法、装置、存储介质及设备 Active CN115564450B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211556873.1A CN115564450B (zh) 2022-12-06 2022-12-06 一种风控方法、装置、存储介质及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211556873.1A CN115564450B (zh) 2022-12-06 2022-12-06 一种风控方法、装置、存储介质及设备

Publications (2)

Publication Number Publication Date
CN115564450A CN115564450A (zh) 2023-01-03
CN115564450B true CN115564450B (zh) 2023-03-10

Family

ID=84770875

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211556873.1A Active CN115564450B (zh) 2022-12-06 2022-12-06 一种风控方法、装置、存储介质及设备

Country Status (1)

Country Link
CN (1) CN115564450B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117933575B (zh) * 2024-03-21 2024-07-05 深圳市智岩科技有限公司 物流运输管理方法及其装置、设备、介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109255499A (zh) * 2018-10-25 2019-01-22 阿里巴巴集团控股有限公司 投诉、投诉案件处理方法、装置及设备
CN110262937A (zh) * 2019-05-06 2019-09-20 阿里巴巴集团控股有限公司 一种指标异常原因的识别方法及装置
CN111367971A (zh) * 2020-03-30 2020-07-03 中国建设银行股份有限公司 一种基于数据挖掘的金融***异常辅助分析方法及装置
CN112418864A (zh) * 2020-11-09 2021-02-26 北京三快在线科技有限公司 一种数据发送的方法及装置
CN113515434A (zh) * 2021-01-04 2021-10-19 腾讯科技(深圳)有限公司 异常分类方法、装置、异常分类设备及存储介质
CN114492555A (zh) * 2020-11-13 2022-05-13 中国石油大学(北京) 一种输送管道运行异常原因识别方法及装置
CN115034315A (zh) * 2022-06-16 2022-09-09 中国平安人寿保险股份有限公司 基于人工智能的业务处理方法、装置、计算机设备及介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7797264B2 (en) * 2007-02-02 2010-09-14 Microsoft Corporation Detecting and displaying exceptions in tabular data

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109255499A (zh) * 2018-10-25 2019-01-22 阿里巴巴集团控股有限公司 投诉、投诉案件处理方法、装置及设备
CN110262937A (zh) * 2019-05-06 2019-09-20 阿里巴巴集团控股有限公司 一种指标异常原因的识别方法及装置
CN111367971A (zh) * 2020-03-30 2020-07-03 中国建设银行股份有限公司 一种基于数据挖掘的金融***异常辅助分析方法及装置
CN112418864A (zh) * 2020-11-09 2021-02-26 北京三快在线科技有限公司 一种数据发送的方法及装置
CN114492555A (zh) * 2020-11-13 2022-05-13 中国石油大学(北京) 一种输送管道运行异常原因识别方法及装置
CN113515434A (zh) * 2021-01-04 2021-10-19 腾讯科技(深圳)有限公司 异常分类方法、装置、异常分类设备及存储介质
CN115034315A (zh) * 2022-06-16 2022-09-09 中国平安人寿保险股份有限公司 基于人工智能的业务处理方法、装置、计算机设备及介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于移相加权球面单簇聚类的周期时间序列异常检测;王骏等;《自动化学报》;20110815(第08期);全文 *

Also Published As

Publication number Publication date
CN115564450A (zh) 2023-01-03

Similar Documents

Publication Publication Date Title
US20230031926A1 (en) Method, medium, and system for surfacing recommendations
CN111309614B (zh) A/b测试方法、装置及电子设备
CN109508879B (zh) 一种风险的识别方法、装置及设备
CN108416616A (zh) 投诉举报类别的排序方法和装置
CN110781971B (zh) 一种商户类型识别方法、装置、设备和可读介质
CN115862088A (zh) 一种身份识别方法及装置
US20230409906A1 (en) Machine learning based approach for identification of extremely rare events in high-dimensional space
CN111639687A (zh) 一种模型训练以及异常账号识别方法及装置
CN109918678B (zh) 一种字段含义识别方法和装置
US11861698B2 (en) Vehicle selection platform
CN115564450B (zh) 一种风控方法、装置、存储介质及设备
CN110738562B (zh) 一种风险提醒信息的生成方法、装置及设备
CN114943307A (zh) 一种模型训练的方法、装置、存储介质以及电子设备
CN110263817B (zh) 一种基于用户账号的风险等级划分方法及装置
CN117313141A (zh) 一种异常检测方法、装置、设备及可读存储介质
CN115567371B (zh) 一种异常检测方法、装置、设备及可读存储介质
CN116822606A (zh) 一种异常检测模型的训练方法、装置、设备及存储介质
CN110969483A (zh) 一种识别商户位置的方法、装置及电子设备
CN115660105A (zh) 一种模型训练的方法、业务风控的方法及装置
CN112967044B (zh) 一种支付业务的处理方法及装置
US10885160B1 (en) User classification
CN111401641B (zh) 业务数据处理方法、装置及电子设备
CN110163482B (zh) 确定活动方案的安全方案数据的方法、终端设备及服务器
CN113554448A (zh) 一种用户流失预测方法、装置及电子设备
CN109902170A (zh) 一种文本的分类方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant