CN111369339A - 一种基于过采样改进svdd的银行客户交易行为异常识别方法 - Google Patents

一种基于过采样改进svdd的银行客户交易行为异常识别方法 Download PDF

Info

Publication number
CN111369339A
CN111369339A CN202010137063.7A CN202010137063A CN111369339A CN 111369339 A CN111369339 A CN 111369339A CN 202010137063 A CN202010137063 A CN 202010137063A CN 111369339 A CN111369339 A CN 111369339A
Authority
CN
China
Prior art keywords
abnormal
data
behaviors
behavior
svdd
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010137063.7A
Other languages
English (en)
Inventor
杨健颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Suoxinda Data Technology Co ltd
Original Assignee
Shenzhen Suoxinda Data Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Suoxinda Data Technology Co ltd filed Critical Shenzhen Suoxinda Data Technology Co ltd
Priority to CN202010137063.7A priority Critical patent/CN111369339A/zh
Publication of CN111369339A publication Critical patent/CN111369339A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4016Transaction verification involving fraud or risk level assessment in transaction processing

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Engineering & Computer Science (AREA)
  • Finance (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Technology Law (AREA)
  • Development Economics (AREA)
  • Computer Security & Cryptography (AREA)
  • Complex Calculations (AREA)

Abstract

一种基于过采样改进svdd的银行客户交易行为异常识别方法,涉及银行风控数据处理技术领域,步骤:S1,对原始数据进行一致性检查;S2,设置一个数值p,使用smote过采样算法将数据中有异常行为的数据扩充p倍;S3,对扩充p倍后的有异常行为的数据建立svdd模型,计算svdd模型的球心a和半径R;S4,计算不知是否异常行为的数据到svdd模型球心a的距离,将该距离小于svdd模型半径R的交易行为判断为异常行为,否则判断为无异常行为。改善银行客户交易行为中现有异常识别算法的不足,从而识别出异常的银行客户交易行为。最后,将识别出来的异常交易行为报告到验证模块做进一步的安全验证来达到更好防范银行交易风险的目的。

Description

一种基于过采样改进svdd的银行客户交易行为异常识别方法
技术领域
本发明涉及银行风控数据处理技术领域,具体涉及银行风控中关于客户交易行为异常识别的数据分析方法改进方面。
背景技术
风控是银行业最重要的环节之一,对客户交易行为的异常识别可以有效提高银行的风控能力和水平。
一般客户异常行为识别方法通常是构建有监督的分类模型来进行分析,有异常的是一类,没有异常的是另一类。这种方法有一个明显的缺陷:对于一个客户的交易行为,例如银行客户的***被盗刷,那可以确定这时的交易行为是异常的,但没有异常的交易行为只能视作暂时没有出现异常,以后也可能会出现异常。所以有监督的模型在这种情况下并不适用,因为没有异常的这一类数据并不完全准确。这种情况下,我们可以使用半监督模型svdd来识别异常交易行为。
半监督模型svdd需要在有标签这类数据量较大的情况下才能更精确。在银行的客户交易行为异常识别中,有标签的数据指确定有风险的数据,例如***被盗刷的交易,这类数据占比往往很少。
发明内容
本发明的目的是改善银行客户交易行为中现有异常识别算法的不足,提供一种基于过采样改进svdd的银行客户交易行为异常识别方法,这是一种有效的半监督算法。先对有异常行为的这类数据使用smote过采样算法进行扩充,通过分析客户交易行为数据中的规律,判断不知是否异常的交易行为的异常性,从而识别出异常的银行客户交易行为。最后将识别出来的异常交易行为报告到验证模块做进一步的安全验证来达到更好防范银行交易风险的目的。
为解决本发明所提出的技术问题,采用的技术方案为:一种基于过采样改进svdd的银行客户交易行为异常识别方法,其特征在于:包括以下步骤:
S1,给定银行客户交易行为的原始数据,对原始数据进行一致性检查,清除无效数据和重复数据,填补缺失值,并将类别变量转化为数值型变量,根据原始数据中记录的结果,将原始数据分为有异常行为和暂时没有出现异常行为两类;将暂时没有出现异常行为这类视作不知是否有异常;
S2,设置一个数值p,使用smote过采样算法将数据中有异常行为的数据扩充p倍;
S3,对扩充p倍后的有异常行为的数据建立svdd模型,计算svdd模型的球心a和半径R;
S4,计算不知是否异常行为的数据到svdd模型球心a的距离,将该距离小于svdd模型半径R的交易行为判断为异常行为,否则判断为无异常行为。
作为对本发明进一步限定的技术方案包括有:
所述步骤S2包括:
设有异常行为的数据集为Q,共有q个样本;
计算有异常行为的数据集Q中的每一个样本xi(i=1,2,...q)的m近邻点,从这m个近邻点中随机选取一个样本点xit再生成一个0至1的随机数λj,基于xi生成的第j个新样本点
Figure BDA0002397702470000021
对每一个xi进行p次这样的运算,得到基于smote过采样算法扩充p倍后的有异常行为数据集。
所述步骤S3包括:
用(x,y)表示有异常行为的数据集,x表示特征,y表示有异常。对有异常行为的数据集(x,y)构建一个超球体,该超球体可以描述为
Figure BDA0002397702470000022
使得(xi-a)T(xi-a)≤R2i,其中C是惩罚参数,ξi是松弛变量。
将超球体的描述转化为如下形式:L=∑αiK(xi,xj)-∑αiαjK(xi,xj),其中K是核函数,αi是拉格朗日乘子,使用凸优化计算出αi
计算超球体的半径R2=K(xi,xi)-2∑αiK(xi,xj)+∑∑αiαjK(xi,xj)和球心a=∑αixi
计算不知是否有异常行为的数据到球心a的距离,将该距离小于超球体半径R的行为判断为异常,将识别出来的异常行为报告到验证模块做进一步的安全验证。
本发明的有益效果为:本发明使用的过采样改进svdd是一种有效的数据类别不均衡时的半监督方法。从数据的可获取性看,通常只能确定银行的客户交易行为有异常,而难以保证该交易行为没有异常,svdd是一种高效的半监督方法,该方法只需要知道有异常的数据,对这部分数据建模,再将建立的模型用于分析不知道是否异常的交易行为即可,这非常符合银行客户交易行为数据的实际情况,得到精确的结果。从数据类别均衡性看,svdd需要在有标签这类数据量较大的情况下才能更精确,为保证其精度,在建模前先使用smote过采样算法对异常行为数据进行扩充,再使用扩充后的样本量更大的数据来建模可以得到更精确的结果。
附图说明
图1为本发明的一种基于过采样改进svdd的银行客户交易行为异常识别方法的流程图。
具体实施方式
为了使本发明能更加易于理解,下面结合附图对其具体的实施方式进行详细说明:
参照图1中所示,本发明一种基于过采样改进svdd的银行客户交易行为异常识别方法:
S1,给定银行客户交易行为的原始数据,对原始数据进行一致性检查,清除无效数据和重复数据,填补缺失值,并将类别变量转化为数值型变量,根据原始数据中记录的结果,将原始数据分为有异常行为和暂时没有出现异常行为两类。将暂时没有出现异常行为这类视作不知是否有异常;
S2,设置一个数值p,使用smote过采样算法将数据中有异常行为的数据扩充p倍;
S3,对扩充p倍后的有异常行为的数据建立svdd模型,计算svdd模型的球心a和半径R;
S4,计算不知是否异常行为的数据到svdd模型球心a的距离,将该距离小于svdd模型半径R的交易行为判断为异常行为,否则判断为无异常行为。
作为对本发明进一步限定的技术方案包括有:
所述步骤S2包括:
设有异常行为的数据集为Q,共有q个样本;
计算有异常行为的数据集Q中的每一个样本xi(i=1,2,...q)的m近邻点,从这m个近邻点中随机选取一个样本点xit再生成一个0至1的随机数λj,基于xi生成的第j个新样本点
Figure BDA0002397702470000041
对每一个xi进行p次这样的运算,得到基于smote过采样扩充p倍后的有异常行为数据集。
所述步骤S3包括:
用(x,y)表示有异常行为的数据集,x表示特征,y表示有异常。对有异常行为的数据集(x,y)构建一个超球体,该超球体可以描述为
Figure BDA0002397702470000042
使得(xi-a)T(xi-a)≤R2i,其中C是惩罚参数,ξi是松弛变量。
将超球体的描述转化为如下形式:L=∑αiK(xi,xj)-∑αiαjK(xi,xj),其中K是核函数,αi是拉格朗日乘子,使用凸优化计算出αi
计算超球体的半径R2=K(xi,xi)-2∑αiK(xi,xj)+∑∑αiαjK(xi,xj)和球心a=∑αixi
计算不知是否有异常行为的数据到球心a的距离,将该距离小于超球体半径R的行为判断为异常,将识别出来的异常行为报告到验证模块做进一步的安全验证。
本发明使用smote过采样算法将有异常的这类数据进行扩充,再对扩充后的有异常的这类数据使用svdd进行异常识别。
以上显示和描述了本发明的基本原理、主要特征及优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (3)

1.一种基于过采样改进svdd的银行客户交易行为异常识别方法,其特征在于:包括以下步骤:
S1,给定银行客户交易行为的原始数据,对原始数据进行一致性检查,清除无效数据和重复数据,填补缺失值,并将类别变量转化为数值型变量,根据原始数据中记录的结果,将原始数据分为有异常行为和暂时没有出现异常行为两类;将暂时没有出现异常行为这类视作不知是否有异常;
S2,设置一个数值p,使用smote过采样算法将数据中有异常行为的数据扩充p倍;
S3,对扩充p倍后的有异常行为的数据建立svdd模型,计算svdd模型的球心a和半径R;
S4,计算不知是否异常行为的数据到svdd模型球心a的距离,将该距离小于svdd模型半径R的交易行为判断为异常行为,否则判断为无异常行为。
2.根据权利要求1所述的一种基于过采样改进svdd的银行客户交易行为异常识别方法,其特征在于,所述步骤S2包括:
设有异常行为的数据集为Q,共有q个样本;
计算有异常行为的数据集Q中的每一个样本xi(i=1,2,...q)的m近邻点,从这m个近邻点中随机选取一个样本点xit再生成一个0至1的随机数λj,基于xi生成的第j个新样本点
Figure FDA0002397702460000011
对每一个样本xi进行p次线性插值运算,每次生成一个新样本,得到基于smote过采样算法扩充p倍后的有异常行为数据集。
3.根据权利要求1所述的一种基于过采样改进svdd的银行客户交易行为异常识别方法,其特征在于,所述步骤S3包括:
用(x,y)表示有异常行为的数据集,x表示特征,y表示有异常;对有异常行为的数据集(x,y)构建一个超球体,该超球体描述为
Figure FDA0002397702460000012
使得(xi-a)T(xi-a)≤R2i,其中C是惩罚参数,ξi是松弛变量;
将超球体的描述转化为如下形式:L=∑αiK(xi,xj)-∑αiαjK(xi,xj),其中K是核函数,αi是拉格朗日乘子,计算超球体的球心a和半径R;
计算超球体的半径R2=K(xi,xi)-2∑αiK(xi,xj)+∑∑αiαjK(xi,xj)和球心a=∑αixi
计算不知是否有异常行为的数据到球心a的距离,将该距离小于超球体半径R的行为判断为异常,将识别出来的异常行为报告到验证模块做进一步的安全验证。
CN202010137063.7A 2020-03-02 2020-03-02 一种基于过采样改进svdd的银行客户交易行为异常识别方法 Pending CN111369339A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010137063.7A CN111369339A (zh) 2020-03-02 2020-03-02 一种基于过采样改进svdd的银行客户交易行为异常识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010137063.7A CN111369339A (zh) 2020-03-02 2020-03-02 一种基于过采样改进svdd的银行客户交易行为异常识别方法

Publications (1)

Publication Number Publication Date
CN111369339A true CN111369339A (zh) 2020-07-03

Family

ID=71206532

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010137063.7A Pending CN111369339A (zh) 2020-03-02 2020-03-02 一种基于过采样改进svdd的银行客户交易行为异常识别方法

Country Status (1)

Country Link
CN (1) CN111369339A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112306835A (zh) * 2020-11-02 2021-02-02 平安科技(深圳)有限公司 用户数据监控分析方法、装置、设备及介质
CN113191409A (zh) * 2021-04-20 2021-07-30 国网江苏省电力有限公司营销服务中心 标签数据扩充与深度学习的居民异常用电行为检测方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130097103A1 (en) * 2011-10-14 2013-04-18 International Business Machines Corporation Techniques for Generating Balanced and Class-Independent Training Data From Unlabeled Data Set
CN104091073A (zh) * 2014-07-11 2014-10-08 中国人民解放军国防科学技术大学 虚拟资产不平衡交易数据的采样方法
CN107563431A (zh) * 2017-08-28 2018-01-09 西南交通大学 一种结合cnn迁移学习和svdd的图像异常检测方法
CN108848068A (zh) * 2018-05-29 2018-11-20 上海海事大学 基于深度信念网络-支持向量数据描述的apt攻击检测方法
CN109766956A (zh) * 2018-07-19 2019-05-17 西北工业大学 基于快递大数据的异常检测方法
CN110825545A (zh) * 2019-08-31 2020-02-21 武汉理工大学 一种云服务平台异常检测方法与***

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130097103A1 (en) * 2011-10-14 2013-04-18 International Business Machines Corporation Techniques for Generating Balanced and Class-Independent Training Data From Unlabeled Data Set
CN104091073A (zh) * 2014-07-11 2014-10-08 中国人民解放军国防科学技术大学 虚拟资产不平衡交易数据的采样方法
CN107563431A (zh) * 2017-08-28 2018-01-09 西南交通大学 一种结合cnn迁移学习和svdd的图像异常检测方法
CN108848068A (zh) * 2018-05-29 2018-11-20 上海海事大学 基于深度信念网络-支持向量数据描述的apt攻击检测方法
CN109766956A (zh) * 2018-07-19 2019-05-17 西北工业大学 基于快递大数据的异常检测方法
CN110825545A (zh) * 2019-08-31 2020-02-21 武汉理工大学 一种云服务平台异常检测方法与***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张浩等: "基于数据增强和模型更新的异常流量检测技术", 《信息网络安全》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112306835A (zh) * 2020-11-02 2021-02-02 平安科技(深圳)有限公司 用户数据监控分析方法、装置、设备及介质
CN112306835B (zh) * 2020-11-02 2024-05-28 平安科技(深圳)有限公司 用户数据监控分析方法、装置、设备及介质
CN113191409A (zh) * 2021-04-20 2021-07-30 国网江苏省电力有限公司营销服务中心 标签数据扩充与深度学习的居民异常用电行为检测方法

Similar Documents

Publication Publication Date Title
CN107103171B (zh) 机器学习模型的建模方法及装置
WO2018103456A1 (zh) 一种基于特征匹配网络的社团划分方法、装置及电子设备
US8543522B2 (en) Automatic rule discovery from large-scale datasets to detect payment card fraud using classifiers
CN102291392B (zh) 一种基于Bagging算法的复合式入侵检测方法
CN111798312A (zh) 一种基于孤立森林算法的金融交易***异常识别方法
CN111325248A (zh) 降低贷前业务风险的方法及***
CN110084609B (zh) 一种基于表征学习的交易欺诈行为深度检测方法
CN117155706B (zh) 网络异常行为检测方法及其***
CN111369339A (zh) 一种基于过采样改进svdd的银行客户交易行为异常识别方法
CN114818999A (zh) 基于自编码器和生成对抗网络的账户识别方法及***
CN116400168A (zh) 一种基于深度特征聚类的电网故障诊断方法及***
Sun et al. Intrusion detection system based on in-depth understandings of industrial control logic
CN113283901A (zh) 一种面向区块链平台的基于字节码的诈骗合约检测方法
Ezeme et al. An imputation-based augmented anomaly detection from large traces of operating system events
CN116805245A (zh) 基于图神经网络与解耦表示学习的欺诈检测方法及***
CN115907954A (zh) 账户的识别方法、装置、计算机设备和存储介质
CN115567224A (zh) 一种用于检测区块链交易异常的方法及相关产品
CN115330368A (zh) 集成无监督机器学习的区块链异常交易识别方法及***
CN112270548B (zh) 一种基于深度学习的***欺诈检测方法
CN114792007A (zh) 代码检测方法、装置、设备、存储介质和计算机程序产品
CN114462510A (zh) 一种用于物联网精准防护的设备分类方法及***
CN113781056A (zh) 预测用户欺诈行为的方法及装置
CN112860573A (zh) 一种智能手机恶意软件检测方法
CN111401783A (zh) 一种电力***运行数据集成特征选择方法
Balne et al. Credit card fraud detection using autoencoders

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination