CN117592998A - 一种风控的方法、装置、存储介质及电子设备 - Google Patents

一种风控的方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN117592998A
CN117592998A CN202311559950.3A CN202311559950A CN117592998A CN 117592998 A CN117592998 A CN 117592998A CN 202311559950 A CN202311559950 A CN 202311559950A CN 117592998 A CN117592998 A CN 117592998A
Authority
CN
China
Prior art keywords
user
winded
wind control
sample
initial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311559950.3A
Other languages
English (en)
Inventor
郑开元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202311559950.3A priority Critical patent/CN117592998A/zh
Publication of CN117592998A publication Critical patent/CN117592998A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4016Transaction verification involving fraud or risk level assessment in transaction processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Accounting & Taxation (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Security & Cryptography (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本说明书公开了一种风控的方法、装置、存储介质及电子设备,基于指定属性,对各待风控用户进行分组处理,将各用户组对应的用户数据输入风控模型,得到各用户组的第一特征。将各待风控的用户数据输入风控模型得到各待风控用户的初始特征,对初始特征进行缩放,得到第二特征。将第一特征与第二特征进行融合,得到融合特征,将融合特征输入风控模型,得到风控结果,基于风控结果对各待风控用户进行风控。该方法对各用户进行分组处理,得到各用户在其对应的分组下的特征的同时,对各用户对应的用户数据的初始特征进行缩放,将缩放后的特征与各用户在其对应的分组下的特征进行融合,调节分组后的用户的特征的离散程度,提高模型的输出结果的准确度。

Description

一种风控的方法、装置、存储介质及电子设备
技术领域
本申请涉及计算机技术领域,尤其涉及一种风控的方法、装置、存储介质及电子设备。
背景技术
随着科技的发展,隐私数据日益受到大众的关注,人工智能技术飞速发展,其中,机器学***台可通过机器学***台的健康性以及可持续性发展。
通常,在对模型进行训练的过程中,可基于样本数据的不同维度的特征,对样本数据进行分桶处理也即分bin处理,或者说可基于用户的不同属性,对用户进行分组处理,以离散化特征,从而达到增强特征的可解释性、增强模型的性能以及避免模型过拟合等目标。例如:在对某平台的用户进行风控时,可基于用户在平台中的数据对模型进行训练,以用于风控。用户在平台中的数据可包括多个特征维度,如用户的个人信息:年龄维度、性别维度等,用户的交易数据:交易时间维度、交易金额维度等,也即用户可有年龄属性、交易时间属性、交易金额属性等等,则可基于年龄属性对不同年龄的用户进行分组处理,如:0~30岁为bin1,31~60岁为bin2,61~100为bin3,从而可基于不同分bin的数据对模型进行训练,以使模型学习到年龄段与用户是否存在风险或用户的风险程度等的关系。
然而,对样本数据的特征进行分组处理会损失特征的连续性信息,因此,如何在对特征分组处理的同时保证特征的连续性信息不损失是一个难点问题。
基于此,本申请说明书提供了一种风控的方法。
发明内容
本说明书提供一种风控的方法、装置、存储介质及电子设备,以至少部分的解决现有技术存在的上述问题。
本说明书采用下述技术方案:
本说明书提供了一种风控的方法,所述方法包括:
确定各待风控用户,并获取所述各待风控用户的用户数据;
根据所述各待风控用户的指定属性,对所述各待风控用户进行分组,得到各用户组,将所述各用户组对应的用户数据分别输入风控模型,得到所述各用户组对应的第一特征;
将所述各待风控用户的用户数据输入所述风控模型,得到所述各待风控用户对应的初始特征;
根据所述指定属性对应的属性区间,对所述初始特征进行特征缩放,得到所述各待风控用户对应的第二特征;
将得到的各第一特征以及所述第二特征进行融合,得到融合特征;
将所述融合特征输入所述风控模型,得到所述风控模型输出的风控结果;
基于所述风控结果,对所述各待风控用户进行风控。
可选地,对所述初始特征进行特征缩放,得到所述各待风控用户对应的第二特征,具体包括:
根据所述属性区间以及所述初始特征,确定所述各待风控用户对应的初始特征的标准值;
针对每个待风控用户,根据该待风控用户对应的初始特征的标准值以及该待风控用户对应的初始特征,得到该待风控用户对应的第二特征。
可选地,确定所述各待风控用户对应的初始特征的标准值,具体体包括:
基于Min-Max标准化方法,对所述初始特征进行归一化,得到所述各待风控用户对应的初始特征的标准值。
可选地,根据该待风控用户对应的初始特征的标准值以及该待风控用户对应的初始特征,得到该待风控用户对应的第二特征,具体包括:
将该待风控用户对应的初始特征的标准值以及该待风控用户对应的初始特征的乘积,作为该待风控用户对应的第二特征。
可选地,将得到的各第一特征以及所述第二特征进行融合,得到融合特征,具体包括:
针对每个待风控用户,确定该待风控用户所在的用户组,并根据该待风控用户所在的用户组对应的第一特征,确定该待风控用户对应的第三特征;
将该待风控用户对应的第三特征以及该待风控用户对应的第二特征进行融合,得到该待风控用户的融合特征。
可选地,所述风控模型采用下述方法训练:
获取各样本用户的样本用户数据以及所述样本用户数据对应的风控标注;
对所述各样本用户进行分组,得到各样本用户组,将所述各样本用户组对应的样本用户数据分别输入待训练的风控模型,得到所述待训练的风控模型输出的所述各样本用户组对应的第一样本特征;
将所述各样本用户的样本用户数据输入所述待训练的风控模型,得到所述各样本用户对应的初始样本特征,对所述初始样本特征进行特征缩放,得到所述各样本用户对应的第二样本特征;
将得到的各第一样本特征以及所述第二样本特征进行融合,得到融合样本特征;
将所述融合样本特征输入所述待训练的风控模型,得到所述待训练的风控模型输出的预测结果;
基于所述预测结果以及所述风控标注,对所述待训练的风控模型进行训练。
本说明书提供了一种风控的装置,包括:
获取模块,用于确定各待风控用户,并获取所述各待风控用户的用户数据;
第一输入模块,用于根据所述各待风控用户的指定属性,对所述各待风控用户进行分组,得到各用户组,将所述各用户组对应的用户数据分别输入风控模型,得到所述各用户组对应的第一特征;
第二输入模块,用于将所述各待风控用户的用户数据输入所述风控模型,得到所述各待风控用户对应的初始特征;
特征缩放模块,用于根据所述指定属性对应的属性区间,对所述初始特征进行特征缩放,得到所述各待风控用户对应的第二特征;
特征融合模块,用于将得到的各第一特征以及所述第二特征进行融合,得到融合特征;
输出模块,用于将所述融合特征输入所述风控模型,得到所述风控模型输出的风控结果;
风控模块,用于基于所述风控结果,对所述各待风控用户进行风控。
可选地,所述特征缩放模块具体用于,根据所述属性区间以及所述初始特征,确定所述各待风控用户对应的初始特征的标准值;针对每个待风控用户,根据该待风控用户对应的初始特征的标准值以及该待风控用户对应的初始特征,得到该待风控用户对应的第二特征。
可选地,所述特征缩放模块具体用于,基于Min-Max标准化方法,对所述初始特征进行归一化,得到所述各待风控用户对应的初始特征的标准值。
可选地,所述特征缩放模块具体用于,将该待风控用户对应的初始特征的标准值以及该待风控用户对应的初始特征的乘积,作为该待风控用户对应的第二特征。
可选地,所述特征融合模块具体用于,针对每个待风控用户,确定该待风控用户所在的用户组,并根据该待风控用户所在的用户组对应的第一特征,确定该待风控用户对应的第三特征;将该待风控用户对应的第三特征以及该待风控用户对应的第二特征进行融合,得到该待风控用户的融合特征。
可选地,所述装置还包括训练模块;
所述训练模块具体用于,获取各样本用户的样本用户数据以及所述样本用户数据对应的风控标注;对所述各样本用户进行分组,得到各样本用户组,将所述各样本用户组对应的样本用户数据分别输入待训练的风控模型,得到所述待训练的风控模型输出的所述各样本用户组对应的第一样本特征;将所述各样本用户的样本用户数据输入所述待训练的风控模型,得到所述各样本用户对应的初始样本特征,对所述初始样本特征进行特征缩放,得到所述各样本用户对应的第二样本特征;将得到的各第一样本特征以及所述第二样本特征进行融合,得到融合样本特征;将所述融合样本特征输入所述待训练的风控模型,得到所述待训练的风控模型输出的预测结果;基于所述预测结果以及所述风控标注,对所述待训练的风控模型进行训练。
本说明书提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述风控的方法。
本说明书提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述风控的方法。
本说明书采用的上述至少一个技术方案能够达到以下有益效果:
从本说明书提供的风控的方法中可以看出,在对各待风控用户进行风控时,首先可对各待风控用户进行分组处理,并基于用户的指定属性,将各用户组对应的用户数据输入风控模型,得到各用户组的第一特征。然后可将各待风控的用户数据输入风控模型得到各待风控用户的初始特征,并基于用户的指定属性对应的属性区间对初始特征进行缩放,得到第二特征。最后可将第一特征与第二特征进行融合,得到融合特征,并将融合特征输入风控模型,得到风控结果,以基于风控结果对各待风控用户进行风控。该方法对各用户进行分组处理,得到各用户在其对应的分组下的特征的同时,对各用户对应的用户数据的初始特征进行缩放,并与各用户在其对应的分组下的特征进行融合,以用于调节分组后的用户的特征的离散程度,修正特征的重要性表达,提高了模型输出的结果的准确度。
附图说明
此处所说明的附图用来提供对本说明书的进一步理解,构成本说明书的一部分,本说明书的示意性实施例及其说明用于解释本说明书,并不构成对本说明书的不当限定。在附
图中:
图1为本说明书中一种风控的方法的流程示意图;
图2a为本说明书提供的一种信息的连续性表征示意图;
图2b为本说明书提供的一种分组后的信息的连续性表征示意图;
图3为本说明书提供的一种风控的装置示意图;
图4为本说明书提供的对应于图1的电子设备示意图。
具体实施方式
为使本说明书的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
以下结合附图,详细说明本申请各实施例提供的技术方案。
图1为本说明书提供的一种风控的方法的流程示意图,具体可包括以下步骤:
S100:确定各待风控用户,并获取所述各待风控用户的用户数据。
执行本说明书技术方案的执行主体可为任意具备计算能力的电子设备,如服务器、终端等。
在使用风控模型对某平台中的用户进行风控时,该计算设备可以先确定出各待风控用户。其中,该各待风控用户中的用户可以是在该平台正在执行业务的用户中选择出的用户,也可以是基于该平台中的历史业务数据确定出的用户。并且该计算设备可获取各待风控用户的用户数据。其中,该用户数据可为结构化数据,如表格数据,该用户数据可包括:用户的个人信息,该个人信息具体可为年龄、性别等等,用户的交易数据,该交易数据具体可为交易时间、交易金额以及交易次数等等,用户的其他行为数据,该其他行为数据具体可为用户在该平台中的浏览物品、浏览时间等等。
S102:根据所述各待风控用户的指定属性,对所述各待风控用户进行分组,得到各用户组,将所述各用户组对应的用户数据分别输入风控模型,得到所述各用户组对应的第一特征。
为了提高风控模型输出的风控结果的准确度、增强特征的可解释性以及避免风控模型过拟合等,该计算设备可对各待风控用户进行分组处理,得到各用户组。具体的,该计算设备可根据各待风控用户的指定属性,对各待风控用户进行分组,其中,用户的属性可为用户的年龄、交易时间、交易金额等等,具体本说明书不做限制。例如:各待风控用户为用户A、用户B、用户C以及用户D,用户数据为用户A~D的年龄、性别、交易金额、交易次数以及交易金额。则可基于年龄这一属性,将用户A~D进行分组。
需要说明的是,在将各待风控用户进行分组时,该指定属性的个数不做具体限制,可根据具体需求以及业务场景进行设置。沿用上例,可基于年龄与性别这两种属性,将用户A~D进行分组。
进而该计算设备可将各分组各用户组对应的用户数据分别输入风控模型,得到各用户组对应的第一特征。
S104:将所述各待风控用户的用户数据输入所述风控模型,得到所述各待风控用户对应的初始特征。
S106:根据所述指定属性对应的属性区间,对所述初始特征进行特征缩放,得到所述各待风控用户对应的第二特征。
若只是对用户进行分组,并基于各用户组的特征得到预测结果时,会使得用户数据的特征的连续性信息损失,从而使得风控模型欠缺特征的连续性信息的重要性表达。如图2a所示,为本申请说明书提供的信息的连续性表征示意图,如图2b所示,为本申请说明书提供的分组后的信息的连续性表征示意图,可见对用户分组,各用户组具备自身特征的连续性,而在整体上,各用户组之间的信息的连续性信息存在丢失。因此该计算设备可将各待风控用户的用户数据输入风控模型,得到各待风控用户对应的初始特征,并可根据指定属性对应的属性区间,对初始特征进行缩放,得到第二特征,并在后续步骤中融合第一特征以及第二特征,以消除分组带来的连续性信息的丢失,从而提高了风控结果的准确度。
具体的,在对初始特征进行特征缩放时,该计算设备可根据属性区间以及初始特征,对各待风控用户对应的初始特征进行归一化,得到各待风控用户对应的初始特征的标准值,并针对每个待风控用户,根据该待风控用户对应的初始特征的标准值以及该待风控用户对应的初始特征,得到该待风控用户对应的第二特征。在本说明书的一个或多个实施例中,可将该待风控用户对应的初始特征的标准值与该待风控用户对应的初始特征的乘积,作为该待风控用户对应的第二特征。
需要说明的是,对各待风控用户对应的初始特征进行归一化时,所采用的归一化方法,或者说,对特征进行特征缩放时所采用的方法本说明书不做具体限制,例如:可采用Min-Max标准化方法、Scale to[-1,1]标准化方法以及Gauss Rank标准化方法等等。也就是说,在本说说明书的一个或多个实施例中,该计算设备可基于Min-Max标准化方法,对各待风控用户对应的初始特征进行归一化,得到各待风控用户对应的初始特征的标准值,也可基于Gauss Rank标准化方法,对各待风控用户对应的初始特征进行归一化,得到各待风控用户对应的初始特征的标准值。或者说,在本说说明书的一个或多个实施例中,该计算设备可基于Min-Max标准化方法,对初始特征进行特征缩放,也可基于Gauss Rank标准化方法,对初始特征进行特征缩放。
S108:将得到的各第一特征以及所述第二特征进行融合,得到融合特征。
由于步骤S106中得到的第二特征是对所有待风控用户的用户数据的特征进行特征缩放后得到的,也即各第二特征表征对用户数据对应的初始特征的连续性的度量,或者说线性度量,因此在本说明书中,该计算设备可将各第一特征以及第二特征进行融合,得到融合特征,以利用第二特征表征的连续性调节上述步骤S102中对用户进行分组得到的第一特征的离散程度,在不增加用户的分组的数量的情况下,保留了特征的连续性信息,提高预测结果的准确度。
在本说明书的一个或多个实施例中,在对各第一特征以及第二特征进行融合时,具体的该计算设备可针对每个待风控用户,确定该待风控用户所在的用户组,并根据该待风控用户所在的用户组对应的第一特征,确定该待风控用户对应的第三特征。也即该第三特征指的是在该待风控用户所在的用户组下,该待风控用户对应的用户数据的特征,或者说,在该待风控用户所在的用户组对应的第一特征中,属于该待风控用户的用户数据的第一特征为第三特征。进而可将该待风控用户对应的第三特征以及该待风控用户对应的第二特征进行融合,得到该待风控用户的融合特征。在本说明书的一个或多个实施例中,可将每个待风控用户的第三特征以及第二特征的和,作为该待风控用户的融合特征。
S110:将所述融合特征输入所述风控模型,得到所述风控模型输出的风控结果。
S112:基于所述风控结果,对所述各待风控用户进行风控。
最后该计算设备可将融合特征输入风控模型,得到该风控输出的风控结果,并可基于该风控结果,对各待风控用户进行风控。
需要说明的是,该风控结果可根据具体场景以及该平台提供的具体业务确定,例如该风控结果可为风控等级、风控力度、风险概率等。当然,不同的风控等级或者风控力度对应不同的风控策略。例如:该平台提供支付交易业务,则该风控结果可该用户支付交易的风险等级,如高、中以及低,不同等级对应的策略可为限制用户的交易金额、次数以及禁止用户交易等等。
基于图1所示的风控的方法,在对各待风控用户进行风控时,首先可基于待风控用户的指定属性,对各待风控用户进行分组处理,并将各用户组对应的用户数据输入风控模型,得到各用户组的第一特征。然后可将各待风控的用户数据输入风控模型得到各待风控用户的初始特征,并基于待风控用户的指定属性的属性区间,对初始特征进行缩放,得到第二特征。最后可将第一特征与第二特征进行融合,得到融合特征,并将融合特征输入风控模型,得到风控结果,以基于风控结果对各待风控用户进行风控。该方法对各用户进行分组处理,得到各用户在其对应的分组下的特征的同时,对各用户对应的用户数据的初始特征进行缩放,并与各用户在其对应的分组下的特征进行融合,以用于调节分组后的用户的特征的离散程度,修正特征的重要性表达,提高了模型输出的结果的准确度。
通常,将结构化的数据的特征进行分组处理时,要想使得分组后的特征的连续性信息不损失,需要提高分组的数量,但是分组的数量越多往往意味着模型参数的增多,更具体的为嵌入层参数增多。而本方案对数据的初始特征进行标准化处理如Min-Max标准化处理,实现对初始特征的特征缩放,并将分组的特征作为偏置,修正特征的重要性表达,将特征的连续性信息融入分组后的特征中,间接的调节了特征分组的离散程度,也即可在分组数量少的情况下,不丧失特征的连续性信息。经实验证明,基于本方案提供的方法,对特征分64组也即分bin64得到的模型的预测结果的准确率,高于传统的对特征分bin64的模型的预测结果,达到了对特征进行分256组也即分bin256得到的模型的预测结果的准确率,而对特征分64组的模型的参数量远远低于对特征进行分256组的参数量。
进一步的,在本说明书的一个或多个实施例中,还提供了该风控模型的训练方法。具体的,该计算设备可获取各样本用户的样本用户数据以及样本用户数据对应的风控标注。然后,对各样本用户进行分组,得到各样本用户组,将各样本用户组对应的样本用户数据分别输入待训练的风控模型,得到待训练的风控模型输出的各样本用户组对应的第一样本特征,并将各样本用户的样本用户数据输入待训练的风控模型,得到各样本用户对应的初始样本特征,对初始样本特征进行特征缩放,得到各样本用户对应的第二样本特征。接着,将得到的各第一样本特征以及第二样本特征进行融合,得到融合样本特征,将融合样本特征输入待训练的风控模型,得到待训练的风控模型输出的预测结果。最后,基于预测结果以及风控标注,对待训练的风控模型进行训练。
其中,该风控标注可根据具体场景以及该平台提供的具体业务确定,例如该风控标注可为风控等级、风控力度、风险概率等。当然,在实际应用中,不同的风控等级或者风控力度或者风控概率应对应不同的风控策略。例如:该平台提供支付交易业务,则该风控结果可该用户支付交易的风险等级,如高、中以及低,不同等级对应的策略可为限制用户的交易金额、次数以及禁止用户交易等等。
基于上述内容所述的风控的方法,本说明书实施例还对应的提供一种用于风控的装置示意图,如图3所示。
图3为本说明书实施例提供的一种风控的装置的示意图,所述装置包括:
获取模块300,用于确定各待风控用户,并获取所述各待风控用户的用户数据;
第一输入模块302,用于根据所述各待风控用户的指定属性,对所述各待风控用户进行分组,得到各用户组,将所述各用户组对应的用户数据分别输入风控模型,得到所述各用户组对应的第一特征;
第二输入模块304,用于将所述各待风控用户的用户数据输入所述风控模型,得到所述各待风控用户对应的初始特征;
特征缩放模块306,用于根据所述指定属性对应的属性区间,对所述初始特征进行特征缩放,得到所述各待风控用户对应的第二特征;
特征融合模块308,用于将得到的各第一特征以及所述第二特征进行融合,得到融合特征;
输出模块310,用于将所述融合特征输入所述风控模型,得到所述风控模型输出的风控结果;
风控模块312,用于基于所述风控结果,对所述各待风控用户进行风控。
可选地,所述特征缩放模块306具体用于,根据所述属性区间以及所述初始特征,确定所述各待风控用户对应的初始特征的标准值;针对每个待风控用户,根据该待风控用户对应的初始特征的标准值以及该待风控用户对应的初始特征,得到该待风控用户对应的第二特征。
可选地,所述特征缩放模块306具体用于,基于Min-Max标准化方法,对所述初始特征进行归一化,得到所述各待风控用户对应的初始特征的标准值。
可选地,所述特征缩放模块306具体用于,将该待风控用户对应的初始特征的标准值以及该待风控用户对应的初始特征的乘积,作为该待风控用户对应的第二特征。
可选地,所述特征融合模块308具体用于,针对每个待风控用户,确定该待风控用户所在的用户组,并根据该待风控用户所在的用户组对应的第一特征,确定该待风控用户对应的第三特征;将该待风控用户对应的第三特征以及该待风控用户对应的第二特征进行融合,得到该待风控用户的融合特征。
可选地,所述装置还包括训练模块314;
所述训练模块314具体用于,获取各样本用户的样本用户数据以及所述样本用户数据对应的风控标注;对所述各样本用户进行分组,得到各样本用户组,将所述各样本用户组对应的样本用户数据分别输入待训练的风控模型,得到所述待训练的风控模型输出的所述各样本用户组对应的第一样本特征;将所述各样本用户的样本用户数据输入所述待训练的风控模型,得到所述各样本用户对应的初始样本特征,对所述初始样本特征进行特征缩放,得到所述各样本用户对应的第二样本特征;将得到的各第一样本特征以及所述第二样本特征进行融合,得到融合样本特征;将所述融合样本特征输入所述待训练的风控模型,得到所述待训练的风控模型输出的预测结果;基于所述预测结果以及所述风控标注,对所述待训练的风控模型进行训练。
本说明书实施例还提供了一种计算机可读存储介质,该存储介质存储有计算机程序,计算机程序可用于执行上述内容所述的风控的方法。
基于上述内容所述的风控的方法,本说明书实施例还提出了图4所示的电子设备的示意结构图。如图4,在硬件层面,该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,以实现上述内容所述的风控的方法。
当然,除了软件实现方式之外,本说明书并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字***“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的***、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书的实施例可提供为方法、***、或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书是参照根据本说明书实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书的实施例可提供为方法、***或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于***实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。

Claims (14)

1.一种风控的方法,所述方法包括:
确定各待风控用户,并获取所述各待风控用户的用户数据;
根据所述各待风控用户的指定属性,对所述各待风控用户进行分组,得到各用户组,将所述各用户组对应的用户数据分别输入风控模型,得到所述各用户组对应的第一特征;
将所述各待风控用户的用户数据输入所述风控模型,得到所述各待风控用户对应的初始特征;
根据所述指定属性对应的属性区间,对所述初始特征进行特征缩放,得到所述各待风控用户对应的第二特征;
将得到的各第一特征以及所述第二特征进行融合,得到融合特征;
将所述融合特征输入所述风控模型,得到所述风控模型输出的风控结果;
基于所述风控结果,对所述各待风控用户进行风控。
2.如权利要求1所述的方法,对所述初始特征进行特征缩放,得到所述各待风控用户对应的第二特征,具体包括:
根据所述属性区间以及所述初始特征,确定所述各待风控用户对应的初始特征的标准值;
针对每个待风控用户,根据该待风控用户对应的初始特征的标准值以及该待风控用户对应的初始特征,得到该待风控用户对应的第二特征。
3.如权利要求2所述的方法,确定所述各待风控用户对应的初始特征的标准值,具体体包括:
基于Min-Max标准化方法,对所述初始特征进行归一化,得到所述各待风控用户对应的初始特征的标准值。
4.如权利要求2所述的方法,根据该待风控用户对应的初始特征的标准值以及该待风控用户对应的初始特征,得到该待风控用户对应的第二特征,具体包括:
将该待风控用户对应的初始特征的标准值以及该待风控用户对应的初始特征的乘积,作为该待风控用户对应的第二特征。
5.如权利要求1所述的方法,将得到的各第一特征以及所述第二特征进行融合,得到融合特征,具体包括:
针对每个待风控用户,确定该待风控用户所在的用户组,并根据该待风控用户所在的用户组对应的第一特征,确定该待风控用户对应的第三特征;
将该待风控用户对应的第三特征以及该待风控用户对应的第二特征进行融合,得到该待风控用户的融合特征。
6.如权利要求1所述的方法,所述风控模型采用下述方法训练:
获取各样本用户的样本用户数据以及所述样本用户数据对应的风控标注;
对所述各样本用户进行分组,得到各样本用户组,将所述各样本用户组对应的样本用户数据分别输入待训练的风控模型,得到所述待训练的风控模型输出的所述各样本用户组对应的第一样本特征;
将所述各样本用户的样本用户数据输入所述待训练的风控模型,得到所述各样本用户对应的初始样本特征,对所述初始样本特征进行特征缩放,得到所述各样本用户对应的第二样本特征;
将得到的各第一样本特征以及所述第二样本特征进行融合,得到融合样本特征;
将所述融合样本特征输入所述待训练的风控模型,得到所述待训练的风控模型输出的预测结果;
基于所述预测结果以及所述风控标注,对所述待训练的风控模型进行训练。
7.一种风控的装置,所述装置具体包括:
获取模块,用于确定各待风控用户,并获取所述各待风控用户的用户数据;
第一输入模块,用于根据所述各待风控用户的指定属性,对所述各待风控用户进行分组,得到各用户组,将所述各用户组对应的用户数据分别输入风控模型,得到所述各用户组对应的第一特征;
第二输入模块,用于将所述各待风控用户的用户数据输入所述风控模型,得到所述各待风控用户对应的初始特征;
特征缩放模块,用于根据所述指定属性对应的属性区间,对所述初始特征进行特征缩放,得到所述各待风控用户对应的第二特征;
特征融合模块,用于将得到的各第一特征以及所述第二特征进行融合,得到融合特征;
输出模块,用于将所述融合特征输入所述风控模型,得到所述风控模型输出的风控结果;
风控模块,用于基于所述风控结果,对所述各待风控用户进行风控。
8.如权利要求7所述的装置,所述特征缩放模块具体用于,根据所述属性区间以及所述初始特征,确定所述各待风控用户对应的初始特征的标准值;针对每个待风控用户,根据该待风控用户对应的初始特征的标准值以及该待风控用户对应的初始特征,得到该待风控用户对应的第二特征。
9.如权利要求8所述的装置,所述特征缩放模块具体用于,基于Min-Max标准化方法,对所述初始特征进行归一化,得到所述各待风控用户对应的初始特征的标准值。
10.如权利要求8所述的装置,所述特征缩放模块具体用于,将该待风控用户对应的初始特征的标准值以及该待风控用户对应的初始特征的乘积,作为该待风控用户对应的第二特征。
11.如权利要求7所述的装置,所述特征融合模块具体用于,针对每个待风控用户,确定该待风控用户所在的用户组,并根据该待风控用户所在的用户组对应的第一特征,确定该待风控用户对应的第三特征;将该待风控用户对应的第三特征以及该待风控用户对应的第二特征进行融合,得到该待风控用户的融合特征。
12.如权利要求7所述的装置,所述装置还包括训练模块;
所述训练模块具体用于,获取各样本用户的样本用户数据以及所述样本用户数据对应的风控标注;对所述各样本用户进行分组,得到各样本用户组,将所述各样本用户组对应的样本用户数据分别输入待训练的风控模型,得到所述待训练的风控模型输出的所述各样本用户组对应的第一样本特征;将所述各样本用户的样本用户数据输入所述待训练的风控模型,得到所述各样本用户对应的初始样本特征,对所述初始样本特征进行特征缩放,得到所述各样本用户对应的第二样本特征;将得到的各第一样本特征以及所述第二样本特征进行融合,得到融合样本特征;将所述融合样本特征输入所述待训练的风控模型,得到所述待训练的风控模型输出的预测结果;基于所述预测结果以及所述风控标注,对所述待训练的风控模型进行训练。
13.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1-6任一所述的方法。
14.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述权利要求1-6任一所述的方法。
CN202311559950.3A 2023-11-21 2023-11-21 一种风控的方法、装置、存储介质及电子设备 Pending CN117592998A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311559950.3A CN117592998A (zh) 2023-11-21 2023-11-21 一种风控的方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311559950.3A CN117592998A (zh) 2023-11-21 2023-11-21 一种风控的方法、装置、存储介质及电子设备

Publications (1)

Publication Number Publication Date
CN117592998A true CN117592998A (zh) 2024-02-23

Family

ID=89912783

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311559950.3A Pending CN117592998A (zh) 2023-11-21 2023-11-21 一种风控的方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN117592998A (zh)

Similar Documents

Publication Publication Date Title
CN115618964B (zh) 一种模型训练的方法、装置、存储介质及电子设备
CN115828162A (zh) 一种分类模型训练的方法、装置、存储介质及电子设备
CN116578877B (zh) 一种模型训练及二次优化打标的风险识别的方法及装置
CN116091895B (zh) 一种面向多任务知识融合的模型训练方法及装置
CN117592998A (zh) 一种风控的方法、装置、存储介质及电子设备
CN111242195B (zh) 模型、保险风控模型训练方法、装置及电子设备
CN116109008B (zh) 一种业务执行的方法、装置、存储介质及电子设备
CN115017915B (zh) 一种模型训练、任务执行的方法及装置
CN117194992B (zh) 一种模型训练、任务执行方法、装置、存储介质及设备
CN116434787B (zh) 一种语音情感识别的方法、装置、存储介质及电子设备
CN111461352B (zh) 模型训练、业务节点识别方法、装置及电子设备
CN116996397B (zh) 一种网络丢包优化的方法、装置、存储介质及电子设备
CN115827880B (zh) 一种基于情感分类的业务执行方法及装置
CN116501852B (zh) 一种可控对话模型训练方法、装置、存储介质及电子设备
CN117034926A (zh) 一种针对多领域文本分类模型的模型训练的方法及装置
CN117079274A (zh) 一种识别模型的训练方法、装置、存储介质及电子设备
CN117593003A (zh) 一种模型训练的方法、装置、存储介质及电子设备
CN116363418A (zh) 一种训练分类模型的方法、装置、存储介质及电子设备
CN117454247A (zh) 一种模型的训练方法、装置、存储介质及电子设备
CN116150685A (zh) 一种数据分类方法、装置、设备及存储介质
CN117743824A (zh) 一种模型训练、业务执行方法、装置、存储介质及设备
CN118115288A (zh) 反欺诈预测方法、装置及设备
CN117592581A (zh) 一种模型训练方法、装置、存储介质及电子设备
CN117351946A (zh) 一种语音识别方法、装置、存储介质及电子设备
CN117828360A (zh) 一种模型训练、代码生成方法、装置、存储介质及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination