CN110634067A - 银行账户异常交易识别方法 - Google Patents

银行账户异常交易识别方法 Download PDF

Info

Publication number
CN110634067A
CN110634067A CN201910916250.2A CN201910916250A CN110634067A CN 110634067 A CN110634067 A CN 110634067A CN 201910916250 A CN201910916250 A CN 201910916250A CN 110634067 A CN110634067 A CN 110634067A
Authority
CN
China
Prior art keywords
transaction
features
original
final
bank account
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910916250.2A
Other languages
English (en)
Inventor
刘云翔
唐泽莘
鞠兴忠
原鑫鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Institute of Technology
Original Assignee
Shanghai Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Institute of Technology filed Critical Shanghai Institute of Technology
Priority to CN201910916250.2A priority Critical patent/CN110634067A/zh
Publication of CN110634067A publication Critical patent/CN110634067A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Technology Law (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种银行账户异常交易识别方法,通过在底层引入极端梯度提升树模型进行特征优化,将优化后的特征与原始特征相结合,作为中间层长短时记忆网络的输入,通过这样来学习序列间的特征,并将各笔交易记录内的特征时序化。将学习获得的序列间特征与原始交易内特征相结合,得到最终交易特征向量,以此为基础,为更好地将时序特征进行融合学习,此方法在顶层叠加了随机森林模型,以此作为最终的银行账户异常交易判别分类器。通过上述方式,有效避免序列化交易特征学习能力弱和各笔交易记录内特征学习能力受限等弊端,以此提升银行账户异常交易识别模型的运行效率和性能。

Description

银行账户异常交易识别方法
技术领域
本发明涉及一种银行账户异常交易识别方法。
背景技术
银行卡的异常交易不仅给银行业带来了极大的风险,而且严重地影响商户和银行客户的利益,造成了不同程度的直接或间接重大损失。精准高效的异常交易识别模型的设计是减少这些损失的关键,越来越多的算法依靠先进的机器学习技术来协助风控调查员。
深度交易特征学习能力有限:基于规则和一般机器学习的银行账户异常交易识别模型在学习比较复杂的序列化交易特征时,结果总是不那么尽如人意,而且需定期耗费大量资源总结交易业务和更新规则,造成资源消耗和增加时延。同时深度学习模型的优势是能对规则自我学习,但单一深度学习模型不擅长各笔交易记录内的特征学习。传统银行账户异常交易识别模型都是基于规则算法。
发明内容
本发明的目的在于提供一种银行账户异常交易识别方法。
为解决上述问题,本发明提供一种银行账户异常交易识别方法,包括:
在底层引入极端梯度提升树模型对各笔交易记录的原始特征的组合进行特征优化,得到优化后的特征;
将各笔交易记录的优化后的特征与各笔交易记录的原始特征的组合相结合,作为中间层长短时记忆网络的输入,以学习序列间的特征,并将各笔交易记录内的特征时序化;
将各笔交易记录的序列间的特征与该各笔交易记录的原始特征的组合相结合,得到最终交易特征向量;
基于所述最终交易特征向量,并在顶层叠加随机森林模型,以得到最终的银行账户异常交易判别分类器。
进一步的,在上述方法中,在底层引入极端梯度提升树模型对各笔交易记录的原始特征的组合进行特征优化,得到优化后的特征,包括:
使用极端梯度提升树模型对各笔交易记录的原始特征的组合进行学习,得到第一预测结果。
进一步的,在上述方法中,所述第一预测结果包括对于训练集和测试集的预测结果。
进一步的,在上述方法中,将各笔交易记录的优化后的特征与各笔交易记录的原始特征的组合相结合,作为中间层长短时记忆网络的输入,以学习序列间的特征,包括:
将所述第一预测结果会作为新特征,加入所述各笔交易记录的原始特征的组合中,作为第二层长短时记忆网络的输入特征,以得到第二预测结果。
进一步的,在上述方法中,将各笔交易记录的序列间的特征与该各笔交易记录的原始特征的组合相结合,得到最终交易特征向量,包括:
将所述第二预测结果再次作为新特征,将所述第二预测结果与第一预测结果和原始特征相结合,得到最终交易特征向量。
进一步的,在上述方法中,在底层引入极端梯度提升树模型对各笔交易记录的原始特征的组合进行特征优化,得到优化后的特征中,
底层使用基于Apache Spark分布式的开源深度学习库BigDL。
进一步的,在上述方法中,将各笔交易记录的优化后的特征与各笔交易记录的原始特征的组合相结合,作为中间层长短时记忆网络的输入,以学习序列间的特征中,
在中间层使用优化的Tensorflow。
进一步的,在上述方法中,基于所述最终交易特征向量,并在顶层叠加随机森林模型,以得到最终的银行账户异常交易判别分类器中,
在顶层使用python工具。
与现有技术相比,本发明在底层引入极端梯度提升树模型进行特征优化,将优化后的特征与原始特征相结合,作为中间层长短时记忆网络的输入,通过这样来学习序列间的特征,并将各笔交易记录内的特征时序化。将学习获得的序列间特征与原始交易内特征相结合,得到最终交易特征向量,以此为基础,为更好地将时序特征进行融合学习,此方法在顶层叠加了随机森林模型,以此作为最终的银行账户异常交易判别分类器。通过上述方式,有效避免序列化交易特征学习能力弱和各笔交易记录内特征学习能力受限等弊端,以此提升银行账户异常交易识别模型的运行效率和性能。
附图说明
图1是本发明一实施例的银行账户异常交易识别方法的原理图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1所示,本发明提供一种银行账户异常交易识别方法,包括:
步骤S1,在底层引入极端梯度提升树模型对各笔交易记录的原始特征的组合进行特征优化,得到优化后的特征;
步骤S2,将各笔交易记录的优化后的特征与各笔交易记录的原始特征的组合相结合,作为中间层长短时记忆网络的输入,以学习序列间的特征,并将各笔交易记录内的特征时序化;
步骤S3,将各笔交易记录的序列间的特征与该各笔交易记录的原始特征的组合相结合,得到最终交易特征向量;
步骤S4,基于所述最终交易特征向量,并在顶层叠加随机森林模型,以得到最终的银行账户异常交易判别分类器。
在此,针对现有技术中的不足,本发明提出基于三层结构的银行账户异常交易识别方法,通过多层学习的方法,有效避免序列化交易特征学习能力弱和各笔交易记录内特征学习能力受限等弊端。
首先从底层的极端梯度提升树模型到中间层的长短时记忆网络,针对单一长短时记忆网络方法在各笔交易记录内特征学习能力不足的不足,在底层引入极端梯度提升树模型进行特征优化,将优化后的特征与原始特征相结合,作为中间层长短时记忆网络的输入,通过这样来学习序列间的特征,并将各笔交易记录内的特征时序化。
将各笔交易记录的序列间的特征与该各笔交易记录的原始特征相结合,得到最终交易特征向量,以此为基础,为更好地将时序特征进行融合学习,此方法在顶层叠加了随机森林模型,以此作为最终的银行账户异常交易判别分类器。将各笔交易记录的序列间的特征与该各笔交易记录的原始特征相结合,得到最终交易特征向量,以此为基础,为更好地将时序特征进行融合学习,此方法在顶层叠加了随机森林模型,以此作为最终的银行账户异常交易判别分类器。
传统的基于机器学习的银行账户异常交易识别模型对于序列化的交易特征学习能力弱,同时单一深度学习模型不擅长各笔交易记录内的特征学习。利用本发明的三层结构的银行账户异常交易识别方法,可以最大程度上有效避免这些弊端,提升银行账户异常交易识别模型的运行效率和性能。
本发明的银行账户异常交易识别方法一实施例中,步骤S1,在底层引入极端梯度提升树模型对各笔交易记录的原始特征的组合进行特征优化,得到优化后的特征,包括:
使用极端梯度提升树模型对各笔交易记录的原始特征的组合进行学习,得到第一预测结果。
本发明的银行账户异常交易识别方法一实施例中,所述第一预测结果包括对于训练集和测试集的预测结果。
本发明的银行账户异常交易识别方法一实施例中,步骤S2,将各笔交易记录的优化后的特征与各笔交易记录的原始特征的组合相结合,作为中间层长短时记忆网络的输入,以学习序列间的特征,包括:
将所述第一预测结果会作为新特征,加入所述各笔交易记录的原始特征的组合中,作为第二层长短时记忆网络的输入特征,以得到第二预测结果。
本发明的银行账户异常交易识别方法一实施例中,步骤S3,将各笔交易记录的序列间的特征与该各笔交易记录的原始特征的组合相结合,得到最终交易特征向量,包括:
将所述第二预测结果再次作为新特征,将所述第二预测结果与第一预测结果和原始特征相结合,得到最终交易特征向量。
在此,从中间层长短时记忆网络到第三层随机森林模型,在中间层,将长短时记忆网络的输出作为序列间特征学习的一环,将学习获得的序列间特征与原始交易内特征相结合,得到最终交易特征向量。
具体的,请参阅图1,本发明实施例包括:
例如某一银行账户在凌晨出现了几笔小额支付行为后,紧接又出现了一笔异地大额交易,基于三层结构的银行账户异常交易识别模型通过前端“极端梯度提升树模型→长短时记忆网络”学习的过程,可以学习诸如此类集成特性1(“凌晨+小额”)和集成特性2(“凌晨+大额”)之间的时序关系。此作用可以说是将“集成特性的时序化”。而加上后端“长短时记忆网络→随机森林模型”阶段后,又可以更深层次学习到诸如此类将时序特征1(多次小额试探+大额套现)和时序特性2(此刻交易发生地和前n次交易为异地)实现再融合的异常特征。前述将时序特性的集成化的功能最大限度的提高模型的特征学习能力。
可选地,选用下述技术进行流程化建模,包括:在底层使用基于Apache Spark分布式的开源深度学习库BigDL,能给使用者带来更大的一致性和高效性。在中间层使用了优化的Tensorflow来达到优化***负载的目的。在顶层使用python工具,用在数据预处理、转换、建模分析和最后预测等阶段任务的构建模块,从而尽可能最大程度提升整个模型的运行效率。
最后以上述研究为出发点,设计一种新的基于三层结构的银行账户异常交易识别模型,通过多层学习的方法,可以最大程度上有效避免这些弊端,提升银行账户异常交易识别模型的运行效率和性能。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
显然,本领域的技术人员可以对发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包括这些改动和变型在内。

Claims (8)

1.一种银行账户异常交易识别方法,其特征在于,包括:
在底层引入极端梯度提升树模型对各笔交易记录的原始特征的组合进行特征优化,得到优化后的特征;
将各笔交易记录的优化后的特征与各笔交易记录的原始特征的组合相结合,作为中间层长短时记忆网络的输入,以学习序列间的特征,并将各笔交易记录内的特征时序化;
将各笔交易记录的序列间的特征与该各笔交易记录的原始特征的组合相结合,得到最终交易特征向量;
基于所述最终交易特征向量,并在顶层叠加随机森林模型,以得到最终的银行账户异常交易判别分类器。
2.如权利要求1所述的银行账户异常交易识别方法,其特征在于,在底层引入极端梯度提升树模型对各笔交易记录的原始特征的组合进行特征优化,得到优化后的特征,包括:
使用极端梯度提升树模型对各笔交易记录的原始特征的组合进行学习,得到第一预测结果。
3.如权利要求2所述的银行账户异常交易识别方法,其特征在于,所述第一预测结果包括对于训练集和测试集的预测结果。
4.如权利要求1所述的银行账户异常交易识别方法,其特征在于,将各笔交易记录的优化后的特征与各笔交易记录的原始特征的组合相结合,作为中间层长短时记忆网络的输入,以学习序列间的特征,包括:
将所述第一预测结果会作为新特征,加入所述各笔交易记录的原始特征的组合中,作为第二层长短时记忆网络的输入特征,以得到第二预测结果。
5.如权利要求1所述的银行账户异常交易识别方法,其特征在于,将各笔交易记录的序列间的特征与该各笔交易记录的原始特征的组合相结合,得到最终交易特征向量,包括:
将所述第二预测结果再次作为新特征,将所述第二预测结果与第一预测结果和原始特征相结合,得到最终交易特征向量。
6.如权利要求1所述的银行账户异常交易识别方法,其特征在于,在底层引入极端梯度提升树模型对各笔交易记录的原始特征的组合进行特征优化,得到优化后的特征中,
底层使用基于Apache Spark分布式的开源深度学习库BigDL。
7.如权利要求1所述的银行账户异常交易识别方法,其特征在于,将各笔交易记录的优化后的特征与各笔交易记录的原始特征的组合相结合,作为中间层长短时记忆网络的输入,以学习序列间的特征中,
在中间层使用优化的Tensorflow。
8.如权利要求1所述的银行账户异常交易识别方法,其特征在于,基于所述最终交易特征向量,并在顶层叠加随机森林模型,以得到最终的银行账户异常交易判别分类器中,
在顶层使用python工具。
CN201910916250.2A 2019-09-25 2019-09-25 银行账户异常交易识别方法 Pending CN110634067A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910916250.2A CN110634067A (zh) 2019-09-25 2019-09-25 银行账户异常交易识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910916250.2A CN110634067A (zh) 2019-09-25 2019-09-25 银行账户异常交易识别方法

Publications (1)

Publication Number Publication Date
CN110634067A true CN110634067A (zh) 2019-12-31

Family

ID=68974326

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910916250.2A Pending CN110634067A (zh) 2019-09-25 2019-09-25 银行账户异常交易识别方法

Country Status (1)

Country Link
CN (1) CN110634067A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113807857A (zh) * 2021-09-23 2021-12-17 中国工商银行股份有限公司 一种资金交易异常的存款账户识别方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105279691A (zh) * 2014-07-25 2016-01-27 ***股份有限公司 基于随机森林模型的金融交易检测方法和设备
CN108428132A (zh) * 2018-03-15 2018-08-21 阿里巴巴集团控股有限公司 欺诈交易识别方法、装置、服务器及存储介质
CN110020938A (zh) * 2019-01-23 2019-07-16 阿里巴巴集团控股有限公司 交易信息处理方法、装置、设备及存储介质
CN110045209A (zh) * 2019-05-10 2019-07-23 广东电网有限责任公司 用电数据异常的检测方法、装置、设备及可读存储介质
CN110046672A (zh) * 2019-04-24 2019-07-23 哈尔滨工程大学 一种基于半监督学习的银行电子渠道异常交易确定方法
CN110276679A (zh) * 2019-05-23 2019-09-24 武汉大学 一种面向深度学习的网络个人信贷欺诈行为检测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105279691A (zh) * 2014-07-25 2016-01-27 ***股份有限公司 基于随机森林模型的金融交易检测方法和设备
CN108428132A (zh) * 2018-03-15 2018-08-21 阿里巴巴集团控股有限公司 欺诈交易识别方法、装置、服务器及存储介质
CN110020938A (zh) * 2019-01-23 2019-07-16 阿里巴巴集团控股有限公司 交易信息处理方法、装置、设备及存储介质
CN110046672A (zh) * 2019-04-24 2019-07-23 哈尔滨工程大学 一种基于半监督学习的银行电子渠道异常交易确定方法
CN110045209A (zh) * 2019-05-10 2019-07-23 广东电网有限责任公司 用电数据异常的检测方法、装置、设备及可读存储介质
CN110276679A (zh) * 2019-05-23 2019-09-24 武汉大学 一种面向深度学习的网络个人信贷欺诈行为检测方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113807857A (zh) * 2021-09-23 2021-12-17 中国工商银行股份有限公司 一种资金交易异常的存款账户识别方法及装置

Similar Documents

Publication Publication Date Title
CN109255506B (zh) 一种基于大数据的互联网金融用户贷款逾期预测方法
EP3989131A1 (en) Method and system for realizing machine learning modeling process
CN111784502A (zh) 异常交易账户群体识别方法及装置
CN107015983A (zh) 一种用于智能问答中提供知识信息的方法与设备
CN111325619A (zh) 一种基于联合学习的***欺诈检测模型更新方法及装置
CN112288455B (zh) 标签生成方法及装置、计算机可读存储介质、电子设备
CN109543925A (zh) 基于机器学习的风险预测方法、装置、计算机设备和存储介质
Li et al. Transaction fraud detection using gru-centered sandwich-structured model
CN111325248A (zh) 降低贷前业务风险的方法及***
CN112068962B (zh) 一种基于深度学习的云渲染资源兑换方法
CN108492001A (zh) 一种用于担保贷款网络风险管理的方法
CN110197426B (zh) 一种信用评分模型的建立方法、装置及可读存储介质
CN115545886A (zh) 逾期风险识别方法、装置、设备及存储介质
CN110634067A (zh) 银行账户异常交易识别方法
CN111221873A (zh) 基于关联网络的企业间同名人识别方法及***
CN110288465A (zh) 对象确定方法及装置、存储介质、电子装置
CN110399617A (zh) 审计数据处理方法、***和可读存储介质
CN115757779A (zh) 基于深度学习模型的金融风险预警方法及装置
CN113723593B (zh) 一种基于神经网络的切负荷预测方法及***
CN113344581A (zh) 业务数据处理方法及装置
Wenning What Influence Does the AI Strategy Have on Possible Outcomes of Chinese Foreign Policy and Economic Development?
Yi Deep Learning in Data Mining Management of Industrial and Commercial Enterprises
CN117093727B (zh) 基于时间关系感知的时序知识图谱补全方法
Zhang et al. Research on Credit Risk Prediction Based on Cart Classification Tree
CN112101952B (zh) 银行可疑交易评估、数据处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20191231