CN109242107A - 基于迁移学习的反欺诈模型训练方法、***和反欺诈方法 - Google Patents
基于迁移学习的反欺诈模型训练方法、***和反欺诈方法 Download PDFInfo
- Publication number
- CN109242107A CN109242107A CN201811057185.4A CN201811057185A CN109242107A CN 109242107 A CN109242107 A CN 109242107A CN 201811057185 A CN201811057185 A CN 201811057185A CN 109242107 A CN109242107 A CN 109242107A
- Authority
- CN
- China
- Prior art keywords
- feature data
- fraud
- value
- fraud model
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/02—Banking, e.g. interest calculation or account maintenance
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本申请提供了电子银行业务中基于迁移学习的反欺诈模型训练方法、***和反欺诈方法,其中,电子银行反欺诈模型训练方法包括如下步骤:获取辅助业务场景的第一特征数据和目标业务场景的第二特征数据;根据所述第一特征数据和所述第二特征数据确定所述反欺诈模型中参数的第一数值;基于所述第一数值、反欺诈模型以及第二特征数据,确定特征概率值;根据所述第二特征数据和所述特征概率值确定所述反欺诈模型中参数的第二数值,并使用所述第二数值更新所述反欺诈模型。本申请把迁移学习的策略方法引入到电子银行反欺诈***中来,同时考虑了目标业务场景和辅助业务场景的操作特征数据,使反欺诈模型的欺诈识别准确率得到了大幅度的提升。
Description
技术领域
本申请涉及计算机信息技术领域,尤其是涉及基于迁移学习的反欺诈模型训练方法、***和反欺诈方法。
背景技术
互联网的快速发展以及智能终端的普及,使得人们在使用电子银行办理查询余额、转账、购物支付、理财等业务时获得了极大的便捷,但同时伴随的则是电子银行面临的安全隐患和遭到恶意侵害带来的风险。
调查显示,网络犯罪日益复杂并向不同行业渗透,每年给全球带来高达4450亿美元的经济损失。并且欺诈行为已发展成为一个组织严密、专业分工明确的黑色产业链条,为银行发展网络金融业务带来了严峻挑战。
目前业内的电子银行反欺诈***防控策略一般使用两种实现方案:一是基于专家规则的方法,单纯的专家规则难以适应现在的电子银行反欺诈***的需求,二是采用机器学习算法对业务全流程的风险特征进行机器学习以及对历史数据进行离线分析。
现有的基于机器学习的方法是把机器学习反欺诈模型不加改造的直接应用到当前的场景中来,虽然相对于专家规则在一定程度上避免了人为的主观性,但是忽略了不同业务场景的电子银行业务***在操作流程和操作特征数据上的复杂性和多样性,不区分业务场景的直接进行反欺诈模型训练将会给机器学习带来困难。
发明内容
本申请提出了电子银行业务中基于迁移学习的反欺诈模型训练方法、***和反欺诈方法,本申请同时考虑了电子银行业务中目标业务场景和辅助业务场景的操作特征数据,使用辅助业务场景辅助目标业务场景下的欺诈操作请求的识别,使反欺诈模型的欺诈识别准确率得到了大幅度的提升。
第一方面,本申请实施例提供了一种基于迁移学习的反欺诈模型训练方法,包括如下步骤:
获取模块获取辅助业务场景的第一特征数据和目标业务场景的第二特征数据;
第一计算模块根据所述第一特征数据和所述第二特征数据确定所述反欺诈模型中参数的第一数值;
第二计算模块基于所述第一数值、反欺诈模型以及第二特征数据,确定特征概率值;
第三计算模块根据所述第二特征数据和所述特征概率值确定所述反欺诈模型中参数的第二数值,并使用所述第二数值更新所述反欺诈模型。
结合第一方面,本申请实施例提供了第一方面的第一种可能的实施方式,其中还包括如下步骤:
获取模块获取操作类型;
第一计算模块根据所述操作类型对所述第一特征数据和所述第二特征数据进行分类;
第一计算模块根据相同操作类型的第一特征数据和第二特征数据,确定该操作类型对应的反欺诈模型中参数的所述第一数值。
结合第一方面和第一方面的第一种可能的实施方式,本申请实施例提供了第一方面的第二种可能的实施方式,其中第一训练模块基于第一特征数据确定反欺诈模型中参数的第三数值;
残差计算模块基于所述第三数值、反欺诈模型和所述第二特征数据确定第一残差值;
压缩计算模块将所述第三数值和所述第一残差值乘以预设系数,得到反欺诈模型中参数的第四数值和第二残差值;
第二训练模块基于所述第二残差值、反欺诈模型和所述第二特征数据确定反欺诈模型中参数的第五数值;
参数生成模块将第四数值和第五数值加权求和得到所述第一数值。
结合第一方面的第二种可能的实施方式,本申请实施例提供了第一方面的第三种可能的实施方式,其中所述预设系数大于等于0,并且所述预设系数小于等于1。
结合第一方面的第一种可能的实施方式,本申请实施例提供了第一方面的第四种可能的实施方式,其中所述操作类型包括注册、登录、转账、缴费或消费。
结合第一方面、第一方面的第一种可能的实施方式,本申请实施例提供了第一方面的第五种可能的实施方式,其中数据预处理模块对所述获取模块获取的所述特征数据和所述历史特征数据进行预处理,所述预处理过程包括如下步骤:
将所述第一特征数据和所述第二特征数据进行向量化处理;
将向量化的所述第一特征数据和所述第二特征数据进行数据清洗处理;
将清洗后的所述第一特征数据和所述第二特征数据进行数据增强处理,所述数据增强处理增加欺诈操作请求的第一特征数据和第二特征数据的数量;
去掉冗余的所述第一特征数据和所述第二特征数据;
将所述第一特征数据和所述第二特征数据映射到相同的数值范围。
结合第一方面,本申请实施例提供了第一方面的第六种可能的实施方式,其中所述第一特征数据为与所述第二特征数据的业务场景相近的辅助数据。
第二方面,基于相同的技术构思,本申请实施例还提供一种基于迁移学习的反欺诈模型训练***,其特征在于,包括获取模块、第一计算模块、第二计算模块和第三计算模块:
所述获取模块,用于获取辅助业务场景的第一特征数据和目标业务场景的第二特征数据;
所述第一计算模块,用于根据所述第一特征数据和所述第二特征数据确定所述反欺诈模型中参数的第一数值;
所述第二计算模块,用于基于所述第一数值、反欺诈模型以及第二特征数据,确定特征概率值;
所述第三计算模块,用于根据所述第二特征数据和所述特征概率值确定所述参数的第二数值,使用所述第二数值更新所述反欺诈模型。
结合第二方面,本申请实施例提供了第二方面的第一种可能的实施方式,其中所述第一计算模块包括第一训练模块、残差计算模块、压缩计算模块、第二训练模块和参数生成模块:
所述第一训练模块,用于基于第一特征数据确定反欺诈模型中参数的第三数值;
所述残差计算模块,用于基于所述第三数值、反欺诈模型和所述第二特征数据确定第一残差值;
所述压缩计算模块,用于将所述第三数值和所述第一残差值乘以预设系数,得到反欺诈模型中参数的第四数值和第二残差值;
所述第二训练模块,用于基于所述第二残差值、反欺诈模型和所述第二特征数据确定反欺诈模型中参数的第五数值;
所述参数生成模块,用于将第四数值和第五数值加权求和得到所述第一数值。
第三方面,基于相同的技术构思,本申请实施例还提供一种反欺诈方法,包括如下步骤:
获取操作请求和操作请求对应的第三特征数据;
调用反欺诈模型对所述第三特征数据进行计算得到反欺诈概率值;
当所述反欺诈概率值高于预设阈值时,发起对所述操作请求的拦截;
其中,所述反欺诈模型应用如权利要求1-7任一所述反欺诈模型训练方法或如权利要求8或9任一所述反欺诈模型训练***进行反欺诈模型训练。
本申请相对于传统的机器学习方法,接受来自不同业务场景的特征数据,利用机器学习算法根据不同业务场景下的相对应的特征数据进行的反欺诈模型训练。本申请在反欺诈模型训练中使用迁移学习的策略,同时考虑了目标业务场景和辅助业务场景的操作特征数据,使用辅助业务场景辅助目标业务场景下的欺诈操作请求的识别,使反欺诈模型的欺诈识别准确率得到了大幅度的提升;
进一步,为了更好地实现对目标业务场景特征数据和辅助业务场景特征数据的迁移学习,本申请将辅助场景特征通过两种方式迁移到目标场景中来:一种是在反欺诈模型的训练过程同时考虑了目标业务场景和辅助业务场景的特征数据,另一种是利用了辅助业务场景反欺诈模型的训练概率输出结果。相比于只针对单一业务场景下的算法建模思路,本申请利用了其他业务场景下的更多的特征数据,使反欺诈模型的欺诈识别准确率得到了大幅度的提升。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例一所提供的基于迁移学习的反欺诈模型训练方法的流程图;
图2示出了具体使用迁移学习策略进行反欺诈模型训练方法的流程图;
图3示出了反欺诈模型f_total(x)的功能结构示意图的一个具体的例子;
图4示出了本申请实施例二所提供的另一种基于迁移学习的反欺诈模型训练方法的流程图;
图5示出了本申请实施例三具体进行数据预处理过程方法的流程图;
图6示出了本申请实施例四所提供的一种基于迁移学习的反欺诈模型训练***的结构示意图;
图7示出了反欺诈模型训练***中第一计算模块的具体结构示意图;
图8示出了使用本申请实施例五进行反欺诈模型训练的反欺诈***使用时的***风控流程示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
为便于对本实施例进行理解,首先对本申请实施例所公开的基于迁移学习的反欺诈模型训练方法进行详细介绍。
实施例一
本实施例提供了基于迁移学习的反欺诈模型训练方法,该方法可以应用于对各种电子银行的业务操作中的反欺诈识别***进行反欺诈模型训练,例如用于对网上银行、手机银行、直销银行和/或微信银行业务操作中的反欺诈识别***进行反欺诈模型训练。
具体的,如图1所示,本实施例的方法包括如下步骤:
S101:获取辅助业务场景的第一特征数据和目标业务场景的第二特征数据。
这里,所述第一特征数据为与所述第二特征数据业务场景相近的辅助数据。第二特征数据是需要进行反欺诈分析的目标业务场景的特征数据。具体的,例如将本申请反欺诈模型训练方法用于网上银行业务场景中的反欺诈识别***时,第一特征数据是与网上银行相近的、与网上银行业务场景具有联系的手机银行、直销银行和/或微信银行业务场景中操作请求对应的特征数据;第二特征数据是网上银行业务场景中操作请求对应的特征数据。这里,第一特征数据可以是手机银行、直销银行或微信银行的任一个业务场景中操作请求对应的特征数据,也可以是任两个业务场景、或者三个业务场景收集的特征数据。
S102第一计算模块根据所述第一特征数据和所述第二特征数据确定所述反欺诈模型中参数的第一数值。
这里,所述使用反欺诈模型进行反欺诈模型训练的过程如图2所示,包括如下步骤:
S201第一训练模块基于第一特征数据确定反欺诈模型中参数的第三数值。
具体的,例如将本申请反欺诈模型训练方法用于网上银行业务场景中的反欺诈识别***时,假设第一特征数据是手机银行业务场景的特征数据,使用手机银行作为反欺诈模型训练时的辅助业务场景;第二特征数据是网上银行业务场景的特征数据,网上银行就是反欺诈模型训练时的目标业务场景。首先使用手机银行业务场景的特征数据,即利用辅助业务场景的特征数据对反欺诈模型进行反欺诈模型训练,得到针对辅助业务场景的反欺诈模型f_n(x)。
S202残差计算模块基于所述第三数值、反欺诈模型和所述第二特征数据确定第一残差值。
具体的,例如将本申请反欺诈模型训练方法用于网上银行业务场景中的反欺诈识别***时,假设第一特征数据是手机银行业务场景的特征数据,针对利用辅助业务场景的特征数据训练得到反欺诈模型,带入网上银行业务场景的特征数据进行计算,得到每一个特征数据的残差值γ_n。
S203压缩计算模块将所述第三数值和所述第一残差值乘以预设系数,得到反欺诈模型中参数的第四数值和第二残差值。
为了增强反欺诈模型的鲁棒性,对于已训练出的反欺诈模型f_n(x)的预测结果给予一定比例的压缩即ηf_n(x),相应的第一残差值也会按照相同比例压缩即变成ηγ_n,即将第三数值和所述第一残差值乘以预设系数。这里,预设系数η的取值范围一般在[0,1]。
S204第二训练模块基于所述第二残差值、反欺诈模型和所述第二特征数据确定反欺诈模型中参数的第五数值。
具体的,例如将本申请反欺诈模型训练方法用于网上银行业务场景中的反欺诈识别***时,基于网上银行业务场景的特征数据和压缩后的第一残差值ηγ_n,调用压缩后的利用辅助业务场景的特征数据训练得到反欺诈模型ηf_n(x)接着进行迭代算法训练,得到反欺诈模型f_m(x)。
S205参数生成模块将第四数值和第五数值加权求和得到所述第一数值。
即最终,反欺诈模型的算法公式为f_total(x)=ηf_n(x)+f_m(x)。
这样对针对目标业务场景的特征数据的反欺诈模型训练过程中,很好地利用到了辅助业务场景的特征数据,很好地体现了迁移学习的思想,具体的,例如将本申请反欺诈模型训练方法用于网上银行业务场景中的反欺诈识别***时,假设第一特征数据是手机银行业务场景的特征数据,得到的反欺诈模型f_total(x)的功能结构示意图如图3所示。
S103第二计算模块基于所述第一数值、反欺诈模型以及第二特征数据,确定特征概率值。
具体的,例如将本申请反欺诈模型训练方法用于网上银行业务场景中的反欺诈识别***时,使用经过步骤S102的反欺诈模型训练得到的反欺诈模型对网上银行业务场景的特征数据进行计算,得到特征概率值。
S104第三计算模块根据所述第二特征数据和所述特征概率值确定所述反欺诈模型中参数的第二数值,并使用所述第二数值更新所述反欺诈模型。
具体的,例如将本申请反欺诈模型训练方法用于网上银行业务场景中的反欺诈识别***时,利用步骤S103得到的特征概率值加入到网上银行业务场景的特征数据中,得到扩展后的网上银行业务场景特征数据F_扩展,然后将扩展后的网上银行业务场景特征数据F_扩展输入反欺诈模型进行反欺诈模型训练,从而得到针对网上银行业务场景的反欺诈模型。
这里,反欺诈模型可以使用机器学习领域任一惯用的机器学习算法,具体的,例如梯度提升决策树GBDT算法。
实施例二
如图4所示是本申请所述的反欺诈模型训练方法的实施例二,包括如下步骤:
S401:获取模块获取操作类型。
这里,获取模块除了获取第一特征数据和第二特征数据之外,还获取操作类型。
这里,操作类型可以包括基础操作和业务操作;
所述基础操作包括注册或登录;
所述业务操作包括转账、缴费或消费。
S402第一计算模块根据所述操作类型对所述第一特征数据和所述第二特征数据进行分类,第一计算模块根据相同操作类型的第一特征数据和第二特征数据,确定该操作类型对应的反欺诈模型中参数的所述第一数值。
具体的,第一特征数据按照具体的业务场景可以分为X1_注册、X1_登录、X1_转账、X1_缴费以及X1_消费子特征数据;第二特征数据可以分为X2_注册、X2_登录、X2_转账、X2_缴费以及X2_消费子特征数据。
具体的,例如将本申请反欺诈模型训练方法用于网上银行业务场景中的反欺诈识别***时,假设第一特征数据是手机银行业务场景的特征数据,则X1_注册、X1_登录、X1_转账、X1_缴费以及X1_消费为手机银行业务场景中针对不同操作类型的特征数据;X2_注册、X2_登录、X2_转账、X2_缴费以及X2_消费为网上银行业务场景中针对不同操作类型的特征数据。
分类后,针对不同操作类型的特征数据,具体的例如针对转账这一操作类型的特征数据,调用对应转账类型的反欺诈模型,根据X1_转账和X2_转账这两组特征数据进行反欺诈模型训练,并更新对应转账这一操作类型的反欺诈模型。
S403:第二计算模块基于所述每个操作类型对应的第一数值、反欺诈模型以及每个操作类型对应的第二特征数据,确定多个特征概率值。
具体的,例如将本申请反欺诈模型训练方法用于网上银行业务场景中的反欺诈识别***时,假设第一特征数据是手机银行业务场景的特征数据。
例如针对转账这一操作类型的特征数据,第二计算模块使用S201步骤训练后的反欺诈模型对X2_转账这一组特征数据进行计算,得到针对转账操作类别的特征概率值。
S404:第三计算模块根据所述预设类别的第二特征数据和所述对应类别的特征概率值使用对应类别的反欺诈模型进行反欺诈模型训练。
具体的,例如将本申请反欺诈模型训练方法用于网上银行业务场景中的反欺诈识别***时,假设第一特征数据是手机银行业务场景的特征数据。
例如针对转账这一操作类型的特征数据,调用对应转账这一操作类型的反欺诈模型,根据X2_转账这一组特征数据和步骤S202得到的针对转账操作类别的特征概率值进行反欺诈模型训练,得到针对网上银行业务场景中转账这一操作类型的反欺诈模型。
类似的,针对其他操作类型,也可以使用本申请所述实施例二的反欺诈模型训练方法进行反欺诈模型训练。
实施例三
如图5所示的是本申请所述反欺诈模型训练方法的一种实施例三,其中所述数据预处理过程包括如下步骤:
S501:将所述第一特征数据和所述第二特征数据进行向量化处理。
这里,因为原始特征数据形式不规范,不利于计算机进行自动化处理,而数据的向量化表示是把不规范的特征数据转化为格式一致的方便于计算机处理的形式;对于数值的特征则直接使用其对应的数值表示,将不是数值表示的特征数据对应成0和1组成的向量。
S502:将向量化的所述第一特征数据和所述第二特征数据进行数据清洗处理。
这里因为特征数据在采集和传输的过程中可能出现错误与丢失,因此,数据清洗处理清除异常数据和填充缺失数据。
S503:将清洗后的所述第一特征数据和所述第二特征数据进行数据增强处理,所述数据增强处理增加欺诈操作请求的第一特征数据和第二特征数据的数量。
因为经过清洗的数据中的正负样本很不均衡,即正常用户行为数量远大于欺诈用户的行为数量,不均衡的样本会给模型的训练带来很大的困难,因此反复进行数据增强操作可以生成任意数量的欺诈操作请求对应的特征数据,增加欺诈操作请求的样本数据量,最后控制生成的欺诈操作请求对应的数据量和正常操作请求对应的数据量之间的比例在预设范围。
S504:去掉冗余的所述第一特征数据和所述第二特征数据。
这里,为了进行特征的降维,把重要程度较低的特征去掉,以便模型训练速度的提升和模型识别准确率的提高。
S505:将所述第一特征数据和所述第二特征数据映射到相同的数值范围。
这里,将特征数据映射到相同的数值范围,目的是消除不同特征之间的量纲影响,能更加有利于识别欺诈用户和模型的训练。
实施例四
图6示出了本申请实施例四所提供的一种基于迁移学习的反欺诈模型训练***的结构示意图,包括601获取模块、602第一计算模块、603第二计算模块和604第三计算模块:
601获取模块,用于获取辅助业务场景的第一特征数据和目标业务场景的第二特征数据。
602第一计算模块,用于根据所述第一特征数据和所述第二特征数据确定所述反欺诈模型中参数的第一数值。
其中,图7示出了反欺诈模型训练***中第一计算模块的具体结构示意图,第一计算模块包括701第一训练模块、702残差计算模块、703压缩计算模块、704第二训练模块和705参数生成模块。
701第一训练模块,用于基于第一特征数据确定反欺诈模型中参数的第三数值;
702残差计算模块,用于基于所述第三数值、反欺诈模型和所述第二特征数据确定第一残差值;
703压缩计算模块,用于将所述第三数值和所述第一残差值乘以预设系数,得到反欺诈模型中参数的第四数值和第二残差值;
704第二训练模块,用于基于所述第二残差值、反欺诈模型和所述第二特征数据确定反欺诈模型中参数的第五数值;
705参数生成模块,用于将第四数值和第五数值加权求和得到所述第一数值。
603第二计算模块,用于基于所述第一数值、反欺诈模型以及第二特征数据,确定特征概率值。
604第三计算模块,用于根据所述第二特征数据和所述特征概率值确定所述参数的第二数值,使用所述第二数值更新所述反欺诈模型。
实施例五
图8示出了本申请实施例五的反欺诈***的风控流程示意图,这里,具体的举出手机银行和网上银行两个业务场景为例来讲解本申请实施例五的反欺诈***的风控流程,在实际的运用中可以按照把其他多种银行场景扩展进来,例如包括网上银行、手机银行、直销银行和/或微信银行等。
这里,所述反欺诈模型应用如权利要求1-7任一所述反欺诈模型训练方法或如权利要求8或9任一所述反欺诈模型训练***进行反欺诈模型训练。
本申请实施例五的反欺诈***是整个风控流程的核心模块,所述反欺诈***在图中分别对接了手机银行渠道的业务***和网上银行渠道的业务***,通过接受来自手机银行或网上银行的操作请求,对操作请求的风险值进行评估,并把风险评估结果反馈给手机银行渠道的业务***或者网上银行渠道的业务***,手机银行渠道的业务***和网上银行渠道的业务***可以利用反馈的风险评估结果进行风险的规避操作,例如,包括拦截操作或放行操作。
下面将将大致讲解反欺诈***的智能判断流程,并讲解各个功能模块的功能和这些功能模型之间传递的数据类型:
1.首先由手机用户或者网上银行用户分别对手机银行渠道的业务***(809)或者网上银行渠道的业务***(810)发起操作请求,从操作类型上讲,用户对于手机银行和网上银行的操作请求可以分为:注册操作请求、登录操作请求、转账操作请求、缴费操作请求以及其他操作请求,其中部分操作请求如登录操作请求、注册操作请求和转账操作请求在这两个银行的业务***之下是非常相似的,整体来说这些不同操作类型的操作请求将对应于不同银行渠道的不同业务场景,拥有各自特定的业务模式;
2.手机银行渠道的业务***把用户的操作请求转发给反欺诈***(801),网上银行业务渠道的***也会把用户的操作请求转发给反欺诈***(802),该***使用本申请基于迁移学习反欺诈模型训练方法训练得到的反欺诈模型进行用户操作请求对应的特征数据的分析工作。具体的反欺诈模型训练方法如前文所述,这里具体的,在对手机银行的反欺诈模型进行训练时,利用手机银行的特征数据作为第二特征数据,利用网上银行的特征数据作为第一特征数据;相应的,在对网上银行的反欺诈模型进行训练时,利用手机银行的特征数据作为第一特征数据,利用网上银行的特征数据作为第二特征数据(805、807)。分析结果以概率值的形式体现出来,概率越高说明对应操作请求的风险值越高,并将该概率值反馈给手机银行渠道的业务***(803)或者网上银行渠道的业务***(804);
3.当第2步骤中得出的概率值高出一定的专家阈值时,这个阈值一般由业务专家根据经验提前设定,那么就说明当前发起的操作请求为欺诈操作的可能性比较大,那么就由反欺诈***向手机银行渠道的业务***或者网上银行渠道的业务***发起对该操作请求的拦截指示,并把这个拦截信息以及手机银行和/或网上银行内部记录的所有与该用户相关的历史操作信息作为数据沉淀写入对应的手机银行(806)或者网上银行(808)的数据库中;
4.当第2步骤得出的概率值低于步骤3中提到的专家阈值,说明当前发起的操作请求经过反欺诈***判定是正常行为,那么就把操作请求放行指示转发给手机银行或者网上银行的业务***,接下来就是手机银行渠道的业务***或者网上银行渠道的业务***中的一些正常处理流程;
5.当手机银行数据库和网上银行数据库在一段时间之内积累了一定量的训练数据之后,这部分数据来源包括线上识别、用户反馈、专家标注或者其他渠道黑产数据库,会将这些新的训练数据发送给反欺诈***,由该***内部的定时器定期启动基于迁移学习的反欺诈模型训练训练过程,并更新线上的基于迁移学习的反欺诈模型。
本申请基于迁移学习的反欺诈模型训练方法、***以及反欺诈方法的实验环境为:
操作***:CentOs 6.0
主要编程语言:Python 2.7
调用的第三方库:Xgboost 0.72
内存大小:64G
硬盘大小:500G
中央处理器型号:英特尔Xeon(R)CPU四核
本申请实施例所提供的进行一种电子银行线上反欺诈方法及***的计算机程序产品,包括存储了处理器可执行的非易失的程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种基于迁移学习的反欺诈模型训练方法,其特征在于,包括如下步骤:
获取模块获取辅助业务场景的第一特征数据和目标业务场景的第二特征数据;
第一计算模块根据所述第一特征数据和所述第二特征数据确定所述反欺诈模型中参数的第一数值;
第二计算模块基于所述第一数值、反欺诈模型以及第二特征数据,确定特征概率值;
第三计算模块根据所述第二特征数据和所述特征概率值确定所述反欺诈模型中参数的第二数值,并使用所述第二数值更新所述反欺诈模型。
2.根据权利要求1所述的方法,其特征在于,还包括如下步骤:
获取模块获取操作类型;
第一计算模块根据所述操作类型对所述第一特征数据和所述第二特征数据进行分类;
第一计算模块根据相同操作类型的第一特征数据和第二特征数据,确定该操作类型对应的反欺诈模型中参数的所述第一数值。
3.根据权利要求1或2所述的方法,其特征在于,利用如下步骤确定所述第一数值:
第一训练模块基于第一特征数据确定反欺诈模型中参数的第三数值;
残差计算模块基于所述第三数值、反欺诈模型和所述第二特征数据确定第一残差值;
压缩计算模块将所述第三数值和所述第一残差值乘以预设系数,得到反欺诈模型中参数的第四数值和第二残差值;
第二训练模块基于所述第二残差值、反欺诈模型和所述第二特征数据确定反欺诈模型中参数的第五数值;
参数生成模块将第四数值和第五数值加权求和得到所述第一数值。
4.根据权利要求3所述的方法,其特征在于,所述预设系数大于等于0,并且所述预设系数小于等于1。
5.根据权利要求2所述的方法,其特征在于,所述操作类型包括注册、登录、转账、缴费或消费。
6.根据权利要求1或2的方法,其特征在于,数据预处理模块对所述获取模块获取的所述特征数据和所述历史特征数据进行预处理,所述预处理过程包括如下步骤:
将所述第一特征数据和所述第二特征数据进行向量化处理;
将向量化的所述第一特征数据和所述第二特征数据进行数据清洗处理;
将清洗后的所述第一特征数据和所述第二特征数据进行数据增强处理,所述数据增强处理为增加欺诈操作请求的第一特征数据和第二特征数据的数量;
去掉冗余的所述第一特征数据和所述第二特征数据;
将所述第一特征数据和所述第二特征数据映射到相同的数值范围。
7.根据权利要求1所述的方法,其特征在于,所述第一特征数据为与所述第二特征数据的业务场景相近的辅助数据。
8.一种基于迁移学习的反欺诈模型训练***,其特征在于,包括获取模块、第一计算模块、第二计算模块和第三计算模块:
所述获取模块,用于获取辅助业务场景的第一特征数据和目标业务场景的第二特征数据;
所述第一计算模块,用于根据所述第一特征数据和所述第二特征数据确定所述反欺诈模型中参数的第一数值;
所述第二计算模块,用于基于所述第一数值、反欺诈模型以及第二特征数据,确定特征概率值;
所述第三计算模块,用于根据所述第二特征数据和所述特征概率值确定所述参数的第二数值,使用所述第二数值更新所述反欺诈模型。
9.根据权利要求8所述的***,其特征在于,所述第一计算模块包括第一训练模块、残差计算模块、压缩计算模块、第二训练模块和参数生成模块:
所述第一训练模块,用于基于第一特征数据确定反欺诈模型中参数的第三数值;
所述残差计算模块,用于基于所述第三数值、反欺诈模型和所述第二特征数据确定第一残差值;
所述压缩计算模块,用于将所述第三数值和所述第一残差值乘以预设系数,得到反欺诈模型中参数的第四数值和第二残差值;
所述第二训练模块,用于基于所述第二残差值、反欺诈模型和所述第二特征数据确定反欺诈模型中参数的第五数值;
所述参数生成模块,用于将第四数值和第五数值加权求和得到所述第一数值。
10.一种反欺诈方法,其特征在于,包括如下步骤:
获取操作请求和操作请求对应的第三特征数据;
调用反欺诈模型对所述第三特征数据进行计算得到反欺诈概率值;
当所述反欺诈概率值高于预设阈值时,发起对所述操作请求的拦截;
其中,所述反欺诈模型应用如权利要求1-7任一所述反欺诈模型训练方法或如权利要求8或9任一所述反欺诈模型训练***进行反欺诈模型训练。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811057185.4A CN109242107B (zh) | 2018-09-11 | 2018-09-11 | 基于迁移学习的反欺诈模型训练方法、***和反欺诈方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811057185.4A CN109242107B (zh) | 2018-09-11 | 2018-09-11 | 基于迁移学习的反欺诈模型训练方法、***和反欺诈方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109242107A true CN109242107A (zh) | 2019-01-18 |
CN109242107B CN109242107B (zh) | 2019-08-30 |
Family
ID=65067719
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811057185.4A Active CN109242107B (zh) | 2018-09-11 | 2018-09-11 | 基于迁移学习的反欺诈模型训练方法、***和反欺诈方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109242107B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110322357A (zh) * | 2019-05-30 | 2019-10-11 | 深圳壹账通智能科技有限公司 | 数据的异常评估方法、装置、计算机设备和介质 |
CN110880117A (zh) * | 2019-10-31 | 2020-03-13 | 北京三快在线科技有限公司 | 虚假业务识别方法、装置、设备和存储介质 |
CN111768285A (zh) * | 2019-04-01 | 2020-10-13 | 杭州金智塔科技有限公司 | 信贷风控模型构建***、方法、风控***及存储介质 |
CN112241549A (zh) * | 2020-05-26 | 2021-01-19 | ***股份有限公司 | 安全的隐私计算方法、服务器、***以及存储介质 |
CN112347392A (zh) * | 2020-10-21 | 2021-02-09 | 上海淇玥信息技术有限公司 | 一种基于迁移学习的反欺诈评估方法、装置及电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104881783A (zh) * | 2015-05-14 | 2015-09-02 | 中国科学院信息工程研究所 | 电子银行账户欺诈行为及风险检测方法与*** |
CN106408413A (zh) * | 2016-09-23 | 2017-02-15 | 快睿登信息科技(上海)有限公司 | 一种多循环分期决策的方法及*** |
CN107240024A (zh) * | 2017-05-22 | 2017-10-10 | 中国平安人寿保险股份有限公司 | 保险理赔的反欺诈识别方法及装置 |
CN107330785A (zh) * | 2017-07-10 | 2017-11-07 | 广州市触通软件科技股份有限公司 | 一种基于大数据智能风控的小额贷款***及方法 |
CN107679859A (zh) * | 2017-07-18 | 2018-02-09 | ***股份有限公司 | 一种基于迁移深度学习的风险识别方法以及*** |
-
2018
- 2018-09-11 CN CN201811057185.4A patent/CN109242107B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104881783A (zh) * | 2015-05-14 | 2015-09-02 | 中国科学院信息工程研究所 | 电子银行账户欺诈行为及风险检测方法与*** |
CN106408413A (zh) * | 2016-09-23 | 2017-02-15 | 快睿登信息科技(上海)有限公司 | 一种多循环分期决策的方法及*** |
CN107240024A (zh) * | 2017-05-22 | 2017-10-10 | 中国平安人寿保险股份有限公司 | 保险理赔的反欺诈识别方法及装置 |
CN107330785A (zh) * | 2017-07-10 | 2017-11-07 | 广州市触通软件科技股份有限公司 | 一种基于大数据智能风控的小额贷款***及方法 |
CN107679859A (zh) * | 2017-07-18 | 2018-02-09 | ***股份有限公司 | 一种基于迁移深度学习的风险识别方法以及*** |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111768285A (zh) * | 2019-04-01 | 2020-10-13 | 杭州金智塔科技有限公司 | 信贷风控模型构建***、方法、风控***及存储介质 |
CN110322357A (zh) * | 2019-05-30 | 2019-10-11 | 深圳壹账通智能科技有限公司 | 数据的异常评估方法、装置、计算机设备和介质 |
CN110880117A (zh) * | 2019-10-31 | 2020-03-13 | 北京三快在线科技有限公司 | 虚假业务识别方法、装置、设备和存储介质 |
CN112241549A (zh) * | 2020-05-26 | 2021-01-19 | ***股份有限公司 | 安全的隐私计算方法、服务器、***以及存储介质 |
CN112347392A (zh) * | 2020-10-21 | 2021-02-09 | 上海淇玥信息技术有限公司 | 一种基于迁移学习的反欺诈评估方法、装置及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN109242107B (zh) | 2019-08-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109242107B (zh) | 基于迁移学习的反欺诈模型训练方法、***和反欺诈方法 | |
WO2021174966A1 (zh) | 训练风险识别模型的方法及装置 | |
CN109410036A (zh) | 一种欺诈检测模型训练方法和装置及欺诈检测方法和装置 | |
CN109345260A (zh) | 一种欺诈检测模型训练方法和装置及欺诈检测方法和装置 | |
CN111861174B (zh) | 一种针对用户画像的信用评估方法 | |
CN109598331A (zh) | 一种欺诈识别模型训练方法、欺诈识别方法及装置 | |
CN109166032A (zh) | 一种电子银行线上反欺诈方法及*** | |
CN110309840A (zh) | 风险交易识别方法、装置、服务器及存储介质 | |
CN109784934A (zh) | 一种交易风险控制方法、装置以及相关设备和介质 | |
CN108537671A (zh) | 一种交易风险评估方法及*** | |
CN109472610A (zh) | 一种银行交易反欺诈方法及***、设备和存储介质 | |
CN109460889B (zh) | 风险管控方法、***、服务器及计算机可读存储介质 | |
KR102092461B1 (ko) | 투자성공률 제공방법 | |
CN113724010A (zh) | 客户流失预测方法及装置 | |
CN109522317A (zh) | 一种反欺诈预警方法及*** | |
CN113052705A (zh) | 一种供应链金融服务流程管理方法及装置 | |
CN116450951A (zh) | 业务推荐方法、装置、存储介质及电子设备 | |
CN111353812A (zh) | 链式智能营销方法及装置 | |
CN109345376A (zh) | 一种电子银行反欺诈方法及*** | |
CN114154672A (zh) | 一种用于客户流失预测的数据挖掘方法 | |
CN114219497A (zh) | 账户信息确定方法、装置及服务器 | |
KR102541147B1 (ko) | 블록체인 기반 매출채권 거래 플랫폼 서비스 제공 방법, 장치 및 시스템 | |
CN113935738A (zh) | 交易数据处理方法、装置、存储介质及设备 | |
CN110245985A (zh) | 一种信息处理方法及装置 | |
CN114764714A (zh) | 贵金属租赁交易的风险评级方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |