CN113935574B - 异常交易的监测方法、装置、计算机设备和存储介质 - Google Patents
异常交易的监测方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN113935574B CN113935574B CN202111044443.7A CN202111044443A CN113935574B CN 113935574 B CN113935574 B CN 113935574B CN 202111044443 A CN202111044443 A CN 202111044443A CN 113935574 B CN113935574 B CN 113935574B
- Authority
- CN
- China
- Prior art keywords
- transaction
- aggregation characteristic
- characteristic value
- value
- aggregation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Educational Administration (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Technology Law (AREA)
- Debugging And Monitoring (AREA)
Abstract
本申请涉及一种异常交易的监测方法、装置、计算机设备和存储介质。该方法包括:获取交易元组信息以及交易数据;根据每个时间周期内的交易数据以及聚合函数计算得到对应时间周期的交易聚合特征值集;并且计算每个交易聚合特征值在n个历史交易聚合特征值集内的动态阈值;根据每个交易聚合特征值的动态阈值按照特定规则计算每个交易聚合特征值的交易异常分数;获取当前时间周期内的每个交易聚合特征值的交易聚合特征值权重,根据每个交易聚合特征值权重以及其对应的交易异常分数按照加权规则得到当前时间周期内的交易聚合特征值集的交易异常总分数。采用本方法能够更为精确的对异常交易进行分析监测。
Description
技术领域
本申请涉及金融风控领域,尤其是涉及一种异常交易的监测方法、装置、计算机设备和存储介质。
背景技术
随着金融监管的日益严格,异常交易监测变得尤为重要,尤其在互联网金融的推动下,支付场景更加多元化,业务类型也更加复杂,不同类型的交易数据具有不同的格式和特征,因此,异常交易监测面临的数据规模也更大、监测指标更多、分析维度也更加复杂等。那么,如何有效识别异常交易,避免持卡人资金损失,是金融机构日常经营中面临的重要问题之一。
一般异常交易的类型分为虚假交易、自买自卖、互为对手方交易等。其中大部分都可以归结为某些指标的异常,比如,虚假交易的表现是同一交易实体发起交易的数量或金额较大,同时交易撤销的比例较高;自买自卖是指同一个交易实体控制的账户之间大量或频繁交易;互为对手方交易的特征是两个固定交易实体控制的账户之间大量或频繁交易;而传统的监测方法是根据交易类型划分多个数据模块,比如快捷交易模块、网关交易模块等,每个数据模块对应一个数据特征库,然后根据实际需求对数据特征库中的特征进行选择,再利用机器学习、人工智能等技术实现交易的异常分析监测。
然而,在大部分交易异常分析的过程中,我们要研究的核心对象是交易实体,判定一个交易实体是否异常需要考虑该交易实体的整体交易行为,而不仅仅是关注于某种类型的交易。传统监测方法虽然便于数据特征的管理,但由于不同类型的数据特征相互分离,而且数据特征维度多种多样,如果对不同数据特征库中的数据特征按照交易实体进行合并计算,则会出现计算逻辑复杂、数据分析不够灵活等诸多问题。
发明内容
基于此,有必要针对上述技术问题,提供一种异常交易的监测方法、装置、计算机设备和存储介质。
一方面,提供一种异常交易的监测方法,该方法包括:
根据交易记录,获取交易元组信息;交易记录是从不同交易平台获取的;
根据交易元组信息,获取交易数据;其中,交易数据包括当前时间周期内的交易数据和n个历史时间周期内的交易数据;
根据每个时间周期内的交易数据以及聚合函数计算得到对应时间周期的交易聚合特征值集;
根据n个历史交易聚合特征值集,计算每个交易聚合特征值在n个历史交易聚合特征值集内的动态阈值;根据每个交易聚合特征值的动态阈值按照特定规则计算每个交易聚合特征值的交易异常分数;
获取当前时间周期内的每个交易聚合特征值的交易聚合特征值权重,根据每个交易聚合特征值权重以及其对应的交易异常分数按照加权规则得到当前时间周期内的交易聚合特征值集的交易异常总分数;其中,交易异常总分数表征交易元组信息的整体交易异常程度。
在其中一个实施例中,上述的根据n个历史交易聚合特征值集,计算每个交易聚合特征值在n个历史交易聚合特征值集内的动态阈值;根据每个交易聚合特征值的动态阈值按照特定规则计算每个交易聚合特征值的交易异常分数,包括:
根据每个交易聚合特征值集内的交易聚合特征值,计算每个交易聚合特征值在n个历史时间周期内的最大值、最小值以及平均值;
根据每个交易聚合特征值的最大值、最小值、平均值以及动态阈值公式计算得到每个交易聚合特征值的动态阈值;
将当前时间周期内的每个交易聚合特征值与n个历史时间周期内对应的交易聚合特征值进行比较,统计两者之差大于动态阈值的频次;
根据每个交易聚合特征值与n个历史时间周期内对应的交易聚合特征值之差超出所述动态阈值的频次与n的比值计算得到每个交易聚合特征值的交易异常分数。
在其中一个实施例中,上述的获取当前时间周期内的每个交易聚合特征值的交易聚合特征值权重,根据每个交易聚合特征值权重以及其对应的交易异常分数按照加权规则得到当前时间周期内的交易聚合特征值集的交易异常总分数;其中,交易异常总分数表征交易元组信息的整体交易异常程度,包括:
获取当前时间周期内的每个交易聚合特征值的交易聚合特征值权重以及其对应的交易异常分数的乘积,得到交易聚合特征异常值;
将当前时间周期内的交易聚合特征值集内的所有交易聚合特征异常值进行加和,得到当前时间周期内的交易聚合特征值集的交易异常总分数。
在其中一个实施例中,还包括:
将交易元组信息映射到3D交易网格图,3D交易网格图由多个单元立方体组成,每个单元立方体表征一个交易属性异常总分数;
根据每个交易属性异常总分数绘制三维热力图,三维热力图的颜色表征交易异常的程度。
在其中一个实施例中,上述的将交易元组信息映射到3D交易网格图,3D交易网格图由多个单元立方体组成,每个单元立方体表征一个交易属性异常总分数,还包括:
获取交易元组信息内的交易行为的多个交易属性;
获取每个交易属性的权重以及对应于每个交易属性的交易异常总分数;
根据每个交易属性的权重以及其对应的交易异常总分数的乘积,得到交易属性特征异常值;
将多个交易属性对应的交易属性特征异常值进行加和,得到每个单元立方体的交易属性异常总分数。
在其中一个实施例中,上述的将交易元组信息映射到3D交易网格图,3D交易网格图由多个单元立方体组成,每个单元立方体表征一个交易属性异常总分数,还包括:
获取3D交易网格中每个单元立方体的交易总金额;
在单元立方体的交易总金额大于等于交易金额阈值时,对3D交易网格中的单元立方体的交易数据进行分析;
根据不同交易场景,分析操作包括切线、切片、切块、钻取、上卷以及降维压缩中的任意一项;
在单元立方体的交易总金额小于交易金额阈值时,将当前单元立方体标记为空。
在其中一个实施例中,上述的根据交易元组信息,获取交易数据;其中,交易数据包括当前时间周期内的交易数据和n个历史时间周期内的交易数据,包括:
对n个历史时间周期内的交易数据进行采样,采样方式包括连续采样、周期采用以及随机采样中的至少一项。
另一方面,提供了一种异常交易的监测装置,该装置包括:
第一获取模块,用于根据交易记录,获取交易元组信息;交易记录是从不同交易平台获取的;
第二获取模块,用于根据交易元组信息,获取交易数据;其中,交易数据包括当前时间周期内的交易数据和n个历史时间周期内的交易数据;
第一计算模块,用于根据每个时间周期内的交易数据以及聚合函数计算得到对应时间周期的交易聚合特征值集;
第二计算模块,用于根据n个历史交易聚合特征值集,计算每个交易聚合特征值在n个历史交易聚合特征值集内的动态阈值;根据每个交易聚合特征值的动态阈值按照特定规则计算每个交易聚合特征值的交易异常分数;
结果计算模块,用于获取当前时间周期内的每个交易聚合特征值的交易聚合特征值权重,根据每个交易聚合特征值权重以及其对应的交易异常分数按照加权规则得到当前时间周期内的交易聚合特征值集的交易异常总分数;其中,交易异常总分数表征交易元组信息的整体交易异常程度。
再一方面,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
根据交易记录,获取交易元组信息;交易记录是从不同交易平台获取的;
根据交易元组信息,获取交易数据;其中,交易数据包括当前时间周期内的交易数据和n个历史时间周期内的交易数据;
根据每个时间周期内的交易数据以及聚合函数计算得到对应时间周期的交易聚合特征值集;
根据n个历史交易聚合特征值集,计算每个交易聚合特征值在n个历史交易聚合特征值集内的动态阈值;根据每个交易聚合特征值的动态阈值按照特定规则计算每个交易聚合特征值的交易异常分数;
获取当前时间周期内的每个交易聚合特征值的交易聚合特征值权重,根据每个交易聚合特征值权重以及其对应的交易异常分数按照加权规则得到当前时间周期内的交易聚合特征值集的交易异常总分数;其中,交易异常总分数表征交易元组信息的整体交易异常程度。
又一方面,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
根据交易记录,获取交易元组信息;交易记录是从不同交易平台获取的;
根据交易元组信息,获取交易数据;其中,交易数据包括当前时间周期内的交易数据和n个历史时间周期内的交易数据;
根据每个时间周期内的交易数据以及聚合函数计算得到对应时间周期的交易聚合特征值集;
根据n个历史交易聚合特征值集,计算每个交易聚合特征值在n个历史交易聚合特征值集内的动态阈值;根据每个交易聚合特征值的动态阈值按照特定规则计算每个交易聚合特征值的交易异常分数;
获取当前时间周期内的每个交易聚合特征值的交易聚合特征值权重,根据每个交易聚合特征值权重以及其对应的交易异常分数按照加权规则得到当前时间周期内的交易聚合特征值集的交易异常总分数;其中,交易异常总分数表征交易元组信息的整体交易异常程度。
上述一种异常交易的监测方法、装置、计算机设备和存储介质,首先,根据交易记录,获取交易元组信息,根据交易元组信息,获取交易数据;然后,根据每个时间周期内的交易数据以及聚合函数计算得到对应时间周期的交易聚合特征值集;接着,根据n个历史交易聚合特征值集,计算每个交易聚合特征值在n个历史交易聚合特征值集内的动态阈值;根据每个交易聚合特征值的动态阈值按照特定规则计算每个交易聚合特征值的交易异常分数;最后,获取当前时间周期内的每个交易聚合特征值的交易聚合特征值权重,根据每个交易聚合特征值权重以及其对应的交易异常分数按照加权规则得到当前时间周期内的交易聚合特征值集的交易异常总分数;上述过程,根据交易元组信息对交易数据进行聚合计算,同时,划分多个时间周期,通过对历史时间周期内的交易聚合特征值进行计算,求出相应的动态阈值,按照特定规则计算出每个交易聚合特征值的交易异常分数,再通过对一系列的交易异常分数加权求和,最终可以得到交易实体交易元组的交易异常总分数,用于表征交易元组信息的整体交易异常程度。通过层层递进的计算过程,最终得到交易异常总分数,其交易异常总分数的大小即可表征交易异常程度,针对每个交易元组的交易状况都可以实现对其的异常监测,具有监测全面,且数据分析精确,准确度高的优点。
附图说明
图1为一个实施例中异常交易的监测方法的应用环境图;
图2为一个实施例中异常交易的监测方法的流程示意图;
图3为一个实施例中计算交易异常分数的流程示意图;
图4为一个实施例中计算交易异常总分数的流程示意图;
图5为一个实施例中异常交易的监测装置的结构框图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的一种异常交易的监测方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104通过网络进行通信。服务器104根据交易记录,获取交易元组信息,再根据交易元组信息,获取交易数据;然后,根据每个时间周期内的交易数据以及聚合函数计算得到对应时间周期的交易聚合特征值集;接着根据n个历史交易聚合特征值集,计算每个交易聚合特征值在n个交易聚合特征值集内的动态阈值;根据每个交易聚合特征值的动态阈值按照特定规则计算每个交易聚合特征值的交易异常分数;最后,服务器104获取当前时间周期内的每个交易聚合特征值的交易聚合特征值权重,根据每个交易聚合特征值权重以及其对应的交易异常分数按照加权规则得到当前时间周期内的交易聚合特征值集的交易异常总分数。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑等设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种异常交易的监测方法,以该方法应用于图1中的终端为例进行说明,包括以下步骤:
步骤202,根据交易记录,获取交易元组信息;交易记录是从不同交易平台获取的。
这里,交易元组信息是指包含在交易记录中的四大交易特征信息,四大交易特征是指交易主体、交易客体、交易时间以及交易动作,通过四大交易特征构成交易元组,其表现形式如下:
SOTA=(S,O,T,A)
其中,S表示交易主体,指发起交易或在交易过程中有主动权的一方,O表示交易客体,指交易过程中被动的一方,即交易对象,T表示交易时间,A表示交易行为。
上述的交易主体和交易客体统称为交易实体,它们可以是账户,也可以是账户持有者。对于双账户交易,例如网关支付、快捷支付等,其资金是从其中一个账户流入到另一个账户,那么,交易主体和交易客体即为交易双方。而对于单账户交易,比如充值、提现等,默认交易主体为账户的持有者,交易客体为账户本身。
这里,交易记录是指从不同业务场景和不同交易类型的交易平台获取的交易数据,当服务器从交易平台获取到交易数据后,需要对获取到的交易数据进行标准化;因为从不同交易类型和不同业务场景获取的交易数据不仅在格式上会有所不同,在交易实体层面也可能存在差异,即不同业务场景下对同一交易实体的标识会采用不同的方式。因此,需要先对其进行标准化。
首先,从交易数据中提取出交易实体、交易时间以及交易行为等属性,如果缺少其中某一个或多个属性,则用固定值(比如0)进行填充,如果属性冗余,则将多余的属性删除;然后,通过对交易实体信息进行回溯以及关联匹配,将同一交易实体在不同交易场景下的标识进行统一;最后,将经过加工统一后的交易数据形成交易记录用于后期的异常分析。
步骤204,根据交易元组信息,获取交易数据;其中,交易数据包括当前时间周期内的交易数据和n个历史时间周期内的交易数据。
这里,交易数据包括指交易金额和交易笔数,每个交易数据和每个时间周期相对应。例如,a给b在一周内采用快捷转账方式进行转钱,其转账的笔数和每笔的钱数即为一个时间周期对应的交易数据,n个历史时间周期内的交易数据即为过去n个一周内的交易数据。
步骤206,根据每个时间周期内的交易数据以及聚合函数计算得到对应时间周期的交易聚合特征值集。
每个交易聚合特征值集包括多个交易聚合特征值;其中,交易聚合特征值集包括但不限于交易总笔数、交易总金额、交易金额平均值、交易金额变异系数、交易金额偏度和峰度、交易金额的一阶差分序列的峰度和偏度以及交易金额的一阶比值序列的峰度和偏度等。每个时间周期内的交易数据和每个交易聚合特征值集相对应。
这里具体说明一下:例如,一个时间周期内的交易数据用X表示,X表示一系列的交易金额;
X={x1,x2,……,xN},各个交易聚合特征值的计算如下:
交易总笔数:对交易笔数进行计数,即用count(X)=N表示。
交易总金额:对交易金额进行求和,即用sum(X)=x1+x2+…+xN表示。
交易金额平均值:对交易金额进行求平均,即用avg(X)=sum(X)/N表示。
交易金额变异系数:为交易金额平均值与金额标准差的比值,即用
CV(X)=μ/σ表示,其中,μ表示交易金额平均值即为avg(X),σ表示金额的标准差,由于X、N以及μ都是已知的,根据标准差公式直接计算便可得到σ,此处就不详细赘述了。
交易金额的偏度:其是用来衡量交易金额数据分布的非对称程度,用Skew(X)表示,计算公式如下:
其中,μ为均值,N为交易笔数,i为1、2、3…N。
当交易金额的偏度<0时,称为负偏(左偏);
当交易金额的偏度>0时,称为正偏(右偏);
当交易金额的偏度=0时,数据基本对称地分布在平均值两侧。
交易金额的峰度:其用来反映交易金额数据分布的陡峭程度,用Kurt(X)表示,计算公式如下:
其中,σ为标准差,μ为均值,N为交易笔数,i为1、2、3…N。
当交易金额的峰度值越大,表明概率密度曲线越陡峭,数据分布越集中;当交易金额的峰度值越小,表明概率密度曲线越平滑,数据分布越分散。
由于一些非法交易主体在伪卡盗刷或者是恶意催收等场景下,往往会用金额递增或者是递减的方式进行尝试性扣款,因此,其交易金额通常会呈现等差序列或者是等比序列。
针对上述情况,工作人员将特定交易主体与交易客体在一定时间窗口内的多笔交易金额按大小排序并去重,排序并去重可以防止规律***易金额乱序或重复出现导致无法识别的问题,当对交易金额进行排序并去重后,对相邻两次交易金额求差值,得到交易金额的一阶差分序列,用Y={y1,y2,……,yN}表示。
同理,可得到排序并去重后的Y序列的交易总笔数、交易总金额、交易金额平均值以及交易金额变异系数,通过交易总笔数、交易总金额、交易
金额平均值以及交易金额变异系数可得到Y序列的交易金额的一阶差分序列的偏度为以及交易金额的一阶差分序列的峰度,其计算过程同上,此处不再重复赘述。
当交易金额的一阶差分序列的偏度和峰度均为0或接近于0时,则交易金额原始序列为等差序列。
当对交易金额进行排序并去重后,对相邻两次交易金额求比值,得到金额的一阶比值序列,用Z={z1,z2,……,zN}表示。
同理,可得到排序并去重后的Z序列的交易总笔数、交易总金额、交易金额平均值以及交易金额变异系数,通过交易总笔数、交易总金额、交易金额平均值以及交易金额变异系数可得到Z序列的交易金额的一阶差分序列的偏度为以及交易金额的一阶差分序列的峰度,其计算过程同上,此处不再重复赘述。
当交易金额的一阶比值序列的偏度和峰度均为0或接近于0时,则交易金额原始序列为等比序列。
以此类推,可以得到每个时间周期对应的交易聚合特征值集,每个交易聚合特征值集内的所有交易聚合特征值都是后期用来分析异常交易的关键。
步骤208,根据n个历史交易聚合特征值集,计算每个交易聚合特征值在n个历史交易聚合特征值集内的动态阈值;根据每个交易聚合特征值的动态阈值按照特定规则计算每个交易聚合特征值的交易异常分数。
仍然采用上述例子,通过上述计算,得到a给b在其它五个一周内采用快捷转账方式进行转账的五个交易聚合特征值集,计算交易聚合特征值集内的每个交易聚合特征值的动态阈值,根据每个交易聚合特征值的动态阈值按照特定规则计算每个交易聚合特征值的交易异常分数。
步骤210,获取当前时间周期内的每个交易聚合特征值的交易聚合特征值权重,根据每个交易聚合特征值权重以及其对应的交易异常分数按照加权规则得到当前时间周期内的交易聚合特征值集的交易异常总分数;其中,交易异常总分数表征交易元组信息的整体交易异常程度。
这里,交易聚合特征值权重是工作人员根据自己的经验值给定的,对于不同的交易聚合特征值权重工作人员给定的分值不同;服务器获取到每个交易聚合特征值权重后,根据每个交易聚合特征值权重以及其对应的交易异常分数按照加权规则得到交易聚合特征值集的交易异常总分数,用于表示异常交易程度。
上述一种异常交易的监测方法、装置、计算机设备和存储介质,首先,根据交易记录,获取交易元组信息,根据交易元组信息,获取交易数据;然后,根据每个时间周期内的交易数据以及聚合函数计算得到对应时间周期的交易聚合特征值集;接着,根据n个历史交易聚合特征值集,计算每个交易聚合特征值在n个历史交易聚合特征值集内的动态阈值;根据每个交易聚合特征值的动态阈值按照特定规则计算每个交易聚合特征值的交易异常分数;最后,获取当前时间周期内的每个交易聚合特征值的交易聚合特征值权重,根据每个交易聚合特征值权重以及其对应的交易异常分数按照加权规则得到当前时间周期内的交易聚合特征值集的交易异常总分数;上述过程,根据交易元组信息对交易数据进行聚合计算,同时,划分多个时间周期,通过对历史时间周期内的交易聚合特征值进行计算,求出相应的动态阈值,按照特定规则计算出每个交易聚合特征值的交易异常分数,再通过对一系列的交易异常分数加权求和,最终可以得到交易实体交易元组的交易异常总分数,用于表征交易元组信息的整体交易异常程度。通过层层递进的计算过程,最终得到交易异常总分数,其交易异常总分数的大小即可表征交易异常程度,针对每个交易元组的交易状况都可以实现对其的异常监测,具有监测全面,且数据分析精确,准确度高的优点。
在其中一个实施例中,上述的根据n个历史交易聚合特征值集,计算每个交易聚合特征值在n个历史交易聚合特征值集内的动态阈值;根据每个交易聚合特征值的动态阈值按照特定规则计算每个交易聚合特征值的交易异常分数,具体还包括如下步骤:
如图3所示,步骤2082,根据每个交易聚合特征值集内的交易聚合特征值,计算每个交易聚合特征值在n个历史时间周期内的最大值、最小值以及平均值。
其中,每个交易聚合特征值在n个历史时间周期内的最大值用max表示,最小值用min表示,平均值用avg表示。这里以一个交易聚合特征值为例:例如,交易总笔数在五个时间周期内的值分别为15、14、13、12、15,那么其最大值为max=15,最小值为min=12,平均值为avg=13.8。
步骤2084,根据每个交易聚合特征值的最大值、最小值、平均值以及动态阈值公式计算得到每个交易聚合特征值的动态阈值。
这里,动态阈值公式为:threshold=max(max-avg,avg-min),其中max()表示取max-avg,avg-min中的最大值;根据上述的例子,这里max-avg=1.2;avg-min=1.8,取其里面的最大值即为1.8,即交易总笔数的动态阈值为1.8。
步骤2086,将当前时间周期内的每个交易聚合特征值与n个历史时间周期内对应的交易聚合特征值进行比较,统计两者之差大于动态阈值的频次。
这里,将当前时间周期内的交易聚合特征值与n个历史时间周期内对应的交易聚合特征值进行比较,即将当前时间周期内的交易聚合特征值分别与n个历史时间周期内对应的交易聚合特征值进行做差,统计两者之差大于动态阈值的频次;例如,当前时间周期内的交易总笔数的值设为15,将15分别和15、14、13、12、15进行做差,得到其差值为0、1、2、3、0,其中,两者之差大于1.8的次数为2次。
步骤2088,根据每个交易聚合特征值与n个历史时间周期内对应的交易聚合特征值之差超出动态阈值的频次与n的比值计算得到每个交易聚合特征值的交易异常分数。
这里,将每个交易聚合特征值与n个历史时间周期内对应的交易聚合特征值之差超出动态阈值的频次与n做比,如上述例子可知,其频次为2,n为5,那么得到其比值为2/5,即0.4,则其交易总笔数的交易异常总分数为0.4。
其它交易聚合特征值的交易异常总分数的计算方式以此类推,此处不再赘述。
通过上述步骤2082-2088的计算,可以得到每个交易聚合特征值的交易异常总分数,方便后期进一步的计算分析。
在其中一个实施例中,上述的获取当前时间周期内的每个交易聚合特征值的交易聚合特征值权重,根据每个交易聚合特征值权重以及其对应的交易异常分数按照加权规则得到当前时间周期内的交易聚合特征值集的交易异常总分数;其中,交易异常总分数表征交易元组信息的整体交易异常程度,具体还包括如下步骤:
如图4所示,步骤2102,获取当前时间周期内的每个交易聚合特征值的交易聚合特征值权重以及其对应的交易异常分数的乘积,得到交易聚合特征异常值。
这里获取交易聚合特征值权重,其交易聚合特征值权重是工作人员根据自己的经验设定的,例如:交易总笔数的权重设为R1,通过上述一系列计算得到的对应于交易总笔数的交易异常分数设为H1,那么,交易总笔数的交易聚合特征异常值为R1×H1,以此类推,其它的交易聚合特征异常值分别为R2×H2、R3×H3…RK×HK等。
步骤2104,将当前时间周期内的交易聚合特征值集内的所有交易聚合特征异常值进行加和,得到当前时间周期内的交易聚合特征值集的交易异常总分数。
这里将交易聚合特征值集内的所有交易聚合特征异常值进行加和,得到当前时间周期内的交易聚合特征值集的交易异常总分数。其具体计算公式如下:
R_G=normalization(R1*H1+R2*H2+……+Rk*Hk)
其中,normalization()为标准化函数,作用是将计算得到的交易异常总分数的值标准化为0到1之间的小数,方便后期的分析。
通过上述步骤2102-2104的计算,即可得到当前时间周期内的交易聚合特征值集的交易异常总分数,由于交易异常总分数可以表征异常交易情况,因此,上述计算结果可以实现对当前交易情况的异常监测。
在其中一个实施例中,还包括:
将交易元组信息映射到3D交易网格图,3D交易网格图由多个单元立方体组成,每个单元立方体表征一个交易属性异常总分数。
这里之所以将交易元组信息映射到3D交易网格图,是为了将交易元组信息更为直观的在三维坐标轴内展示出来,实现对交易元组信息的可视化,方便后期对交易元组的异常交易情况进行监测。由于交易元组信息包括交易主体、交易客体、交易时间以及交易行为信息,这里在基于交易元组信息构建3D交易网格图时,是以交易主体、交易客体、交易时间三个维度的信息进行映射构建的,每个维度表示一个坐标轴,每个单元立方体表征一个交易属性异常总分数。
根据每个交易属性异常总分数绘制三维热力图,三维热力图的颜色表征交易异常的程度。
这里,每个单元立方体代表一个热力点,根据每个单元立方体的交易属性异常总分数绘制三维热力图,单元立方体的交易属性异常总分数越高,其颜色温度就越高,说明交易存在异常的程度就越高。
上述操作,通过将交易元组映射到3D交易网格中,使得数据可解释性更强,3D交易网格本质上是一个三维的数据立方体,每一个单元立方体表征一个交易属性异常总分数。再根据每个交易属性异常总分数绘制三维热力图,根据三维热力图的颜色,更为直观的实现对异常交易的监测。
在其中一个实施例中,上述的将交易元组信息映射到3D交易网格图,3D交易网格图由多个单元立方体组成,每个单元立方体表征一个交易属性异常总分数,具体还包括:
获取交易元组信息内的交易行为的多个交易属性。
由于交易元组信息包括交易行为信息,而交易行为信息包括多个交易属性,例如,交易类型以及交易场景等。
获取每个交易属性的权重以及对应于每个交易属性的交易异常总分数。
这里举例说明一下,以交易类型为例,比如有快捷交易、网关交易以及代收交易等,根据之前的计算已经得出a给b在一周内采用快捷转账方式进行转账的交易异常总分数;a给b在一周内采用网关交易方式进行转账的交易异常总分数;a给b在一周内采用代收交易方式进行转账的交易异常总分数,即可得到三个交易异常总分数。需要说明的是这里的每个交易属性的权重也是工作人员根据经验给出的。
根据每个交易属性的权重以及其对应的交易异常总分数的乘积,得到交易属性特征异常值。
此处类似于上面的交易异常总分数的计算,例如,获取的快捷交易的权重设为r1,网关交易的权重设为r2,代收交易的权重设为r3,快捷交易的交易异常总分数为h1,网关交易的交易异常总分数为h2,代收交易的交易异常总分数为h3,则快捷交易的交易属性特征异常值为d1×h1;则网关交易的交易属性特征异常值为d2×h2;代收交易的交易属性特征异常值为d3×h3。
将多个交易属性对应的交易属性特征异常值进行加和,得到每个单元立方体的交易属性异常总分数。
这里将多个交易属性对应的交易属性特征异常值进行加和,即可得到每个单元立方体的交易属性异常总分数,用R_g表示。
R_g=normalization(d1×h1+d2×h2+……+dK×hK)
其中,normalization()亦为标准化函数,作用是将计算得到的交易属性异常总分数的值标准化为0到1之间的小数,方便后期的分析。
在其中一个实施例中,上述的将交易元组信息映射到3D交易网格图,3D交易网格图由多个单元立方体组成,每个单元立方体表征一个交易属性异常总分数,还包括:
获取3D交易网格中每个单元立方体的交易总金额。
这里,当将交易元组映射到3D交易网格中后,对每个单元立方体的交易属性异常总分数的计算称为立方体的物化,完全立方体物化就是对三个维度的所有组合进行计算,其时间复杂度是维度的指数,计算代价非常大,而且消耗大量的存储空间和***资源。而实际中,3D交易网格的交易数据分布往往是非常稀疏的,许多单元立方体为空,或者是被大量度量值很小的交易数据占据,所以,一般采用对部分单元立方体进行物化的方法,仅物化其交易数据大于某个交易阈值的单元立方体,其交易数据一般即为交易总金额,即需要获取3D交易网格中每个单元立方体的交易总金额。
在单元立方体的交易总金额大于等于交易金额阈值时,对3D交易网格中的单元立方体的交易数据进行分析。
在单元立方体的交易总金额大于等于交易金额阈值时,对3D交易网格中的单元立方体的交易数据进行分析操作,比如,只物化交易总金额超过10万的单元立方体。这样不仅节省时间和空间,而且更便于交易数据的聚合分析和异常监测。
根据不同交易场景,分析操作包括切线、切片、切块、钻取、上卷以及降维压缩中的任意一项。
根据不同交易场景,从不同角度不同层面对各个单元立方体的交易数据进行异常监测,其采用的分析操作有:
切线:两个维度取特定的值,对剩余的单个维度进行特征分析。比如,分析交易主体与交易客体的交易数据在交易时间维度上的异常情况;此种分析方式适用于:例如收到客户投诉,某某机构对某人的某某银行卡进行恶意的扣款,即确定了交易主体和交易客体这两个维度,只需要关注此特定交易主体和交易客体在不同交易时间内的交易数据来进行分析。
切片:一个维度取特定的值,对剩余的两个维度进行特征分析。比如,分析交易主体与各个交易客体的交易数据在不同交易时间维度上的异常情况;此种分析方式适用于:通过新闻报道说明某机构经营异常,存在洗钱行为,不知道对应于哪个交易客体,就需要对不同交易客体和不同交易时间内的交易情况进行监测。
切块:三个维度取特定区间的值,对局部的三维数据块进行特征分析。比如,分析某种类型的交易主体与某种类型的交易客体的交易数据在某个交易时间内的交易情况;此种方式适用于:某种类型的交易主体和某种类型的交易客体在一定时间内的交易情况,例如,电商平台在北京的交易情况变化。
钻取:将某个维度的数据拆分成更细的粒度。比如,将交易时间窗口的大小由1天拆分成24个小时,即只关注某个机构在某一天内存在的异常交易情况。
上卷:将某个维度的数据聚合成更粗的粒度。比如,将交易时间窗口的大小由1天聚合成1周;或者将交易主体的对象由账户变成账户所有者,一个所有者可能拥有多个账户,因此要对同一所有者的账户数据进行聚合;例如,一个人可能开100个账户,每个账户都没有问题,但是,当所有的账户都加起来就会出现交易异常情况。
降维压缩:对某个维度的数据进行全部聚合,将3D交易网格压缩成二维平面网格,包括以下情况:
在交易客体维度压缩,将同一交易主体对不同交易客体的交易数据聚合起来,得到交易主体与交易时间两个维度的数据特征。其中,每个矩形单元格都包含了一个交易主体在一个交易时间窗口内的交易情况。
在交易主体维度压缩,与交易客体维度压缩类似,就是将同一交易客体对不同交易主体的交易数据聚合到一起,得到交易客体与交易时间两个维度的数据特征。其中,每个矩形单元格都包含了一个交易客体在一个交易时间窗口内的交易情况。
在时间维度压缩,就是将同一交易主体对同一交易客体在多个交易时间窗口的交易数据聚合到一起,得到交易主体与交易客体两个维度的数据特征。其中,每个矩形单元都包含了一对交易主客体的交易特征集。
在单元立方体的交易总金额小于交易金额阈值时,将当前单元立方体标记为空。
这里,当单元立方体的交易总金额小于交易金额阈值时,说明此单元立方体的度量值很小,可以忽略不计,因此,直接设置为空。
在其中一个实施例中,上述的根据交易元组信息,获取交易数据;其中,交易数据包括当前时间周期内的交易数据和n个历史时间周期内的交易数据,具体包括:
对n个历史时间周期内的交易数据进行采样,采样方式包括连续采样、周期采用以及随机采样中的至少一项。
这里,在分析数据时,需要对n个历史时间周期内的交易数据进行采样时,可以采用不同的采样方式,具体包括:
连续采样:选取连续多个交易时间窗口的交易数据进行分析,调整所选取的交易时间窗口的数量,可以实现对短期、中长期和长期等不同时间长度的序列挖掘,从而分析交易实体在连续多个交易时间内的交易数据变化情况,结合业务场景、行业竞争、市场环境等因素的影响,对当前交易实体的风险状况做出评估。
周期采样:对于交易具有周期性的交易实体,根据交易周期长度对交易时间窗口进行周期性采样,这里的交易周期长度是交易时间窗口长度的整数倍,通过周期采样将不同交易周期同一时段的交易时间窗口重组在一起,从而实现对交易数据进行更直观的对比分析。
随机采样:对于交易没有明显规律的交易实体,通过大量随机采样从较宽范围的交易时间轴上选取若干历史交易时间窗口,因为一次或少量的随机采样结果具有较大的偶然性,而大量随机采样的结果就具备了一定的普适性和代表性,因此将大量随机选取的历史交易时间窗口内的交易数据与当前交易时间窗口的交易数据进行对比,能够对当前的交易状况进行更好的风险评估。
这里需要进一步说明的是,当不明确交易笔数随时间发展是否有规律变化时,首先采用连续采样方式,选取与当前交易日期相邻的连续多个交易时间窗口内的交易笔数进行序列分析(现有技术,此处不再赘述)。选取的交易时间窗口越多,序列越长。通过时序分析,可以识别出当前交易笔数随交易时间的变化特点,分为周期变化和随机变化两大类。
如果是周期变化,则下一步使用周期采样的方式进行分析,例如,交易周期为30天,则每30个交易时间窗口采样一次,抽取不同月份同一日期的交易笔数进行分析,使得结果更加准确。因为具有周期变化的交易数据在特定日期可能会呈现规律性突增的现象,例如,每个月的15号交易笔数明显高于平时,如果连续采样分析的话,很容易在15号发出突增预警,而周期采样分析就会避免这些错误告警,提升告警准确率。
如果是随机变化,则下一步使用随机采样的方式进行分析,由于交易没有明显规律,所以数据采样也不必遵循特定的规则,随机采样的好处是可以从更宽范围的交易时间轴上选取交易数据,不一定是与当前日期相邻的,也不一定是连续的,更能代表过往较长一段交易时间内的交易数据的变化趋势。虽然连续采样也可以扩大交易时间范围,但它要求是连续且与当前日期相邻的交易时间窗口,因此交易时间范围的扩大就会导致交易时间窗口激增、数据规模扩大、执行效率下降等现象,而随机采样通过设置特定的采样数量可以很好地解决上述问题。
应该理解的是,虽然图2至图4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2至图4中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图5所示,提供了一种交易异常的监测装置,包括:第一获取模块302、第二获取模块304、第一计算模块306、第二计算模块308以及结果计算模块310,其中:
第一获取模块302,用于根据交易记录,获取交易元组信息;交易记录是从不同交易平台获取的。
第二获取模块304,用于根据交易元组信息,获取交易数据;其中,交易数据包括当前时间周期内的交易数据和n个历史时间周期内的交易数据。
第一计算模块306,用于根据每个时间周期内的交易数据以及聚合函数计算得到对应时间周期的交易聚合特征值集。
第二计算模块308,用于根据n个历史交易聚合特征值集,计算每个交易聚合特征值在n个历史交易聚合特征值集内的动态阈值;根据每个交易聚合特征值的动态阈值按照特定规则计算每个交易聚合特征值的交易异常分数。
结果计算模块310,用于获取当前时间周期内的每个交易聚合特征值的交易聚合特征值权重,根据每个交易聚合特征值权重以及其对应的交易异常分数按照加权规则得到当前时间周期内的交易聚合特征值集的交易异常总分数;其中,交易异常总分数表征交易元组信息的整体交易异常程度。
在一个实施例中,第二计算模块308,还用于:
根据每个交易聚合特征值集内的交易聚合特征值,计算每个交易聚合特征值在n个历史时间周期内的最大值、最小值以及平均值;
根据每个交易聚合特征值的最大值、最小值、平均值以及动态阈值公式计算得到每个交易聚合特征值的动态阈值;
将当前时间周期内的每个交易聚合特征值与n个历史时间周期内对应的交易聚合特征值进行比较,统计两者之差大于动态阈值的频次;
根据每个交易聚合特征值与n个历史时间周期内对应的交易聚合特征值之差超出动态阈值的频次与n的比值计算得到每个交易聚合特征值的交易异常分数。
在一个实施例中,结果计算模块310,还用于:
获取当前时间周期内的每个交易聚合特征值的交易聚合特征值权重以及其对应的交易异常分数的乘积,得到交易聚合特征异常值;
将当前时间周期内的交易聚合特征值集内的所有交易聚合特征异常值进行加和,得到当前时间周期内的交易聚合特征值集的交易异常总分数。
在一个实施例中,该装置还用于:
将交易元组信息映射到3D交易网格图,3D交易网格图由多个单元立方体组成,每个单元立方体表征一个交易属性异常总分数;
根据每个交易属性异常总分数绘制三维热力图,三维热力图的颜色表征交易异常的程度。
在一个实施例中,上述的将交易元组信息映射到3D交易网格图,3D交易网格图由多个单元立方体组成,每个单元立方体表征一个交易属性异常总分数,还用于:
获取交易元组信息内的交易行为的多个交易属性;
获取每个交易属性的权重以及对应于每个交易属性的交易异常总分数;
根据每个交易属性的权重以及其对应的交易异常总分数的乘积,得到交易属性特征异常值;
将多个交易属性对应的交易属性特征异常值进行加和,得到每个单元立方体的交易属性异常总分数。
在一个实施例中,上述的将交易元组信息映射到3D交易网格图,3D交易网格图由多个单元立方体组成,每个单元立方体表征一个交易属性异常总分数,还用于:
获取3D交易网格中每个单元立方体的交易总金额;
在单元立方体的交易总金额大于等于交易金额阈值时,对3D交易网格中的单元立方体的交易数据进行分析;
根据不同交易场景,分析操作包括切线、切片、切块、钻取、上卷以及降维压缩中的任意一项;
在单元立方体的交易总金额小于交易金额阈值时,将当前单元立方体标记为空。
在一个实施例中,上述的根据交易元组信息,获取交易数据;其中,交易数据包括当前时间周期内的交易数据和n个历史时间周期内的交易数据,还用于:
对n个历史时间周期内的交易数据进行采样,采样方式包括连续采样、周期采用以及随机采样中的至少一项。
关于一种交易异常的监测装置的具体限定可以参见上文中对于一种交易异常的监测方法的限定,在此不再赘述。上述一种交易异常的监测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图6所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***和计算机程序。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种交易异常的监测方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
根据交易记录,获取交易元组信息;交易记录是从不同交易平台获取的;
根据交易元组信息,获取交易数据;其中,交易数据包括当前时间周期内的交易数据和n个历史时间周期内的交易数据;
根据每个时间周期内的交易数据以及聚合函数计算得到对应时间周期的交易聚合特征值集;
根据n个历史交易聚合特征值集,计算每个交易聚合特征值在n个历史交易聚合特征值集内的动态阈值;根据每个交易聚合特征值的动态阈值按照特定规则计算每个交易聚合特征值的交易异常分数;
获取当前时间周期内的每个交易聚合特征值的交易聚合特征值权重,根据每个交易聚合特征值权重以及其对应的交易异常分数按照加权规则得到当前时间周期内的交易聚合特征值集的交易异常总分数;其中,交易异常总分数表征交易元组信息的整体交易异常程度。
在一个实施例中,在处理器执行计算机程序实现上述的根据n个历史交易聚合特征值集,计算每个交易聚合特征值在n个历史交易聚合特征值集内的动态阈值;根据每个交易聚合特征值的动态阈值按照特定规则计算每个交易聚合特征值的交易异常分数的步骤时,具体实现以下步骤:
根据每个交易聚合特征值集内的交易聚合特征值,计算每个交易聚合特征值在n个历史时间周期内的最大值、最小值以及平均值;
根据每个交易聚合特征值的最大值、最小值、平均值以及动态阈值公式计算得到每个交易聚合特征值的动态阈值;
将当前时间周期内的每个交易聚合特征值与n个历史时间周期内对应的交易聚合特征值进行比较,统计两者之差大于动态阈值的频次;
根据每个交易聚合特征值与n个历史时间周期内对应的交易聚合特征值之差超出动态阈值的频次与n的比值计算得到每个交易聚合特征值的交易异常分数。
在一个实施例中,在处理器执行计算机程序实现上述的获取当前时间周期内的每个交易聚合特征值的交易聚合特征值权重,根据每个交易聚合特征值权重以及其对应的交易异常分数按照加权规则得到当前时间周期内的交易聚合特征值集的交易异常总分数;其中,交易异常总分数表征交易元组信息的整体交易异常程度的步骤时,具体实现以下步骤:
获取当前时间周期内的每个交易聚合特征值的交易聚合特征值权重以及其对应的交易异常分数的乘积,得到交易聚合特征异常值;
将当前时间周期内的交易聚合特征值集内的所有交易聚合特征异常值进行加和,得到当前时间周期内的交易聚合特征值集的交易异常总分数。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
将交易元组信息映射到3D交易网格图,3D交易网格图由多个单元立方体组成,每个单元立方体表征一个交易属性异常总分数;
根据每个交易属性异常总分数绘制三维热力图,三维热力图的颜色表征交易异常的程度。
在一个实施例中,在处理器执行计算机程序实现上述的将交易元组信息映射到3D交易网格图,3D交易网格图由多个单元立方体组成,每个单元立方体表征一个交易属性异常总分数的步骤时,具体实现以下步骤:
获取交易元组信息内的交易行为的多个交易属性;
获取每个交易属性的权重以及对应于每个交易属性的交易异常总分数;
根据每个交易属性的权重以及其对应的交易异常总分数的乘积,得到交易属性特征异常值;
将多个交易属性对应的交易属性特征异常值进行加和,得到每个单元立方体的交易属性异常总分数。
在一个实施例中,在处理器执行计算机程序实现上述的将交易元组信息映射到3D交易网格图,3D交易网格图由多个单元立方体组成,每个单元立方体表征一个交易属性异常总分数的步骤时,具体还实现以下步骤:
获取3D交易网格中每个单元立方体的交易总金额;
在单元立方体的交易总金额大于等于交易金额阈值时,对3D交易网格中的单元立方体的交易数据进行分析;
根据不同交易场景,分析操作包括切线、切片、切块、钻取、上卷以及降维压缩中的任意一项;
在单元立方体的交易总金额小于交易金额阈值时,将当前单元立方体标记为空。
在一个实施例中,在处理器执行计算机程序实现上述的根据交易元组信息,获取交易数据;其中,交易数据包括当前时间周期内的交易数据和n个历史时间周期内的交易数据的步骤时,具体还实现以下步骤:
对n个历史时间周期内的交易数据进行采样,采样方式包括连续采样、周期采用以及随机采样中的至少一项。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
根据交易记录,获取交易元组信息;交易记录是从不同交易平台获取的;
根据交易元组信息,获取交易数据;其中,交易数据包括当前时间周期内的交易数据和n个历史时间周期内的交易数据;
根据每个时间周期内的交易数据以及聚合函数计算得到对应时间周期的交易聚合特征值集;
根据n个历史交易聚合特征值集,计算每个交易聚合特征值在n个历史交易聚合特征值集内的动态阈值;根据每个交易聚合特征值的动态阈值按照特定规则计算每个交易聚合特征值的交易异常分数;
获取当前时间周期内的每个交易聚合特征值的交易聚合特征值权重,根据每个交易聚合特征值权重以及其对应的交易异常分数按照加权规则得到当前时间周期内的交易聚合特征值集的交易异常总分数;其中,交易异常总分数表征交易元组信息的整体交易异常程度。
在一个实施例中,在计算机程序被处理器执行上述的根据n个历史交易聚合特征值集,计算每个交易聚合特征值在n个历史交易聚合特征值集内的动态阈值;根据每个交易聚合特征值的动态阈值按照特定规则计算每个交易聚合特征值的交易异常分数的步骤时,具体实现以下步骤:
根据每个交易聚合特征值集内的交易聚合特征值,计算每个交易聚合特征值在n个历史时间周期内的最大值、最小值以及平均值;
根据每个交易聚合特征值的最大值、最小值、平均值以及动态阈值公式计算得到每个交易聚合特征值的动态阈值;
将当前时间周期内的每个交易聚合特征值与n个历史时间周期内对应的交易聚合特征值进行比较,统计两者之差大于动态阈值的频次;
根据每个交易聚合特征值与n个历史时间周期内对应的交易聚合特征值之差超出动态阈值的频次与n的比值计算得到每个交易聚合特征值的交易异常分数。
在一个实施例中,在计算机程序被处理器执行上述的获取当前时间周期内的每个交易聚合特征值的交易聚合特征值权重,根据每个交易聚合特征值权重以及其对应的交易异常分数按照加权规则得到当前时间周期内的交易聚合特征值集的交易异常总分数;其中,交易异常总分数表征交易元组信息的整体交易异常程度的步骤时,具体实现以下步骤:
获取当前时间周期内的每个交易聚合特征值的交易聚合特征值权重以及其对应的交易异常分数的乘积,得到交易聚合特征异常值;
将当前时间周期内的交易聚合特征值集内的所有交易聚合特征异常值进行加和,得到当前时间周期内的交易聚合特征值集的交易异常总分数。
在一个实施例中,在计算机程序被处理器执行时还实现以下步骤:
将交易元组信息映射到3D交易网格图,3D交易网格图由多个单元立方体组成,每个单元立方体表征一个交易属性异常总分数;
根据每个交易属性异常总分数绘制三维热力图,三维热力图的颜色表征交易异常的程度。
在一个实施例中,在计算机程序被处理器执行上述的将交易元组信息映射到3D交易网格图,3D交易网格图由多个单元立方体组成,每个单元立方体表征一个交易属性异常总分数的步骤时,具体实现以下步骤:
获取交易元组信息内的交易行为的多个交易属性;
获取每个交易属性的权重以及对应于每个交易属性的交易异常总分数;
根据每个交易属性的权重以及其对应的交易异常总分数的乘积,得到交易属性特征异常值;
将多个交易属性对应的交易属性特征异常值进行加和,得到每个单元立方体的交易属性异常总分数。
在一个实施例中,在计算机程序被处理器执行上述的将交易元组信息映射到3D交易网格图,3D交易网格图由多个单元立方体组成,每个单元立方体表征一个交易属性异常总分数的步骤时,具体还实现以下步骤:
获取3D交易网格中每个单元立方体的交易总金额;
在单元立方体的交易总金额大于等于交易金额阈值时,对3D交易网格中的单元立方体的交易数据进行分析;
根据不同交易场景,分析操作包括切线、切片、切块、钻取、上卷以及降维压缩中的任意一项;
在单元立方体的交易总金额小于交易金额阈值时,将当前单元立方体标记为空。
在一个实施例中,在计算机程序被处理器执行上述的根据交易元组信息,获取交易数据;其中,交易数据包括当前时间周期内的交易数据和n个历史时间周期内的交易数据的步骤时,具体还实现以下步骤:
对n个历史时间周期内的交易数据进行采样,采样方式包括连续采样、周期采用以及随机采样中的至少一项。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (6)
1.一种异常交易的监测方法,其特征在于,所述方法包括:
根据交易记录,获取交易元组信息;所述交易记录是从不同交易平台获取的,所述交易元组信息是指包含在交易记录中的四大交易特征信息,四大交易特征是指交易主体、交易客体、交易时间以及交易动作,通过四大交易特征构成交易元组;
根据所述交易元组信息,获取交易数据;其中,所述交易数据包括当前时间周期内的交易数据和n个历史时间周期内的交易数据;
根据每个时间周期内的交易数据以及聚合函数计算得到对应时间周期的交易聚合特征值集;
根据每个所述交易聚合特征值集内的交易聚合特征值,计算每个所述交易聚合特征值在n个历史时间周期内的最大值、最小值以及平均值;
根据每个所述交易聚合特征值的最大值、最小值、平均值以及动态阈值公式计算得到每个所述交易聚合特征值的动态阈值;其中,所述动态阈值公式为:,其中/>表示取/>中的最大值;
将当前时间周期内的每个所述交易聚合特征值与n个历史时间周期内对应的交易聚合特征值进行比较,统计两者之差大于所述动态阈值的频次;
根据每个所述交易聚合特征值与n个历史时间周期内对应的所述交易聚合特征值之差超出所述动态阈值的频次与n的比值计算得到每个所述交易聚合特征值的交易异常分数;
获取当前时间周期内的每个所述交易聚合特征值的交易聚合特征值权重以及其对应的交易异常分数的乘积,得到交易聚合特征异常值;
将当前时间周期内的所述交易聚合特征值集内的所有交易聚合特征异常值进行加和,得到当前时间周期内的所述交易聚合特征值集的交易异常总分数;其中,所述交易异常总分数表征所述交易元组信息的整体交易异常程度;
将所述交易元组信息映射到3D交易网格图,所述3D交易网格图由多个单元立方体组成,每个所述单元立方体表征一个交易属性异常总分数;
获取所述交易元组信息内的交易行为的多个交易属性;
获取每个所述交易属性的权重以及对应于每个所述交易属性的交易异常总分数;
根据每个所述交易属性的权重以及其对应的交易异常总分数的乘积,得到交易属性特征异常值;
将多个所述交易属性对应的交易属性特征异常值进行加和,得到每个所述单元立方体的交易属性异常总分数;
根据每个所述交易属性异常总分数绘制三维热力图,所述三维热力图的颜色表征交易异常的程度。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述3D交易网格中每个所述单元立方体的交易总金额;
在所述单元立方体的交易总金额大于等于交易金额阈值时,对所述3D交易网格中的所述单元立方体的交易数据进行分析;
根据不同交易场景,分析操作包括切线、切片、切块、钻取、上卷以及降维压缩中的任意一项;
在所述单元立方体的交易总金额小于交易金额阈值时,将当前所述单元立方体标记为空。
3.根据权利要求1所述的方法,其特征在于,所述根据所述交易元组信息,获取交易数据;其中,所述交易数据包括当前时间周期内的交易数据和n个历史时间周期内的交易数据,包括:
对n个历史时间周期内的交易数据进行采样,采样方式包括连续采样、周期采样以及随机采样中的至少一项。
4.一种交易异常的监测装置,其特征在于,所述装置包括:
第一获取模块,用于根据交易记录,获取交易元组信息;所述交易记录是从不同交易平台获取的,所述交易元组信息是指包含在交易记录中的四大交易特征信息,四大交易特征是指交易主体、交易客体、交易时间以及交易动作,通过四大交易特征构成交易元组;
第二获取模块,用于根据所述交易元组信息,获取交易数据;其中,所述交易数据包括当前时间周期内的交易数据和n个历史时间周期内的交易数据;
第一计算模块,用于根据每个时间周期内的交易数据以及聚合函数计算得到对应时间周期的交易聚合特征值集;
第二计算模块,用于根据每个所述交易聚合特征值集内的交易聚合特征值,计算每个所述交易聚合特征值在n个历史时间周期内的最大值、最小值以及平均值;根据每个所述交易聚合特征值的最大值、最小值、平均值以及动态阈值公式计算得到每个所述交易聚合特征值的动态阈值;其中,所述动态阈值公式为:,其中/>表示取/>中的最大值;将当前时间周期内的每个所述交易聚合特征值与n个历史时间周期内对应的交易聚合特征值进行比较,统计两者之差大于所述动态阈值的频次;根据每个所述交易聚合特征值与n个历史时间周期内对应的所述交易聚合特征值之差超出所述动态阈值的频次与n的比值计算得到每个所述交易聚合特征值的交易异常分数;
第三计算模块,用于获取当前时间周期内的每个所述交易聚合特征值的交易聚合特征值权重以及其对应的交易异常分数的乘积,得到交易聚合特征异常值;将当前时间周期内的所述交易聚合特征值集内的所有交易聚合特征异常值进行加和,得到当前时间周期内的所述交易聚合特征值集的交易异常总分数;其中,所述交易异常总分数表征所述交易元组信息的整体交易异常程度;
结果可视化模块,用于将所述交易元组信息映射到3D交易网格图,所述3D交易网格图由多个单元立方体组成,每个所述单元立方体表征一个交易属性异常总分数;获取所述交易元组信息内的交易行为的多个交易属性;获取每个所述交易属性的权重以及对应于每个所述交易属性的交易异常总分数;根据每个所述交易属性的权重以及其对应的交易异常总分数的乘积,得到交易属性特征异常值;将多个所述交易属性对应的交易属性特征异常值进行加和,得到每个所述单元立方体的交易属性异常总分数;根据每个所述交易属性异常总分数绘制三维热力图,所述三维热力图的颜色表征交易异常的程度。
5.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至3中任一项所述方法的步骤。
6.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至3中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111044443.7A CN113935574B (zh) | 2021-09-07 | 2021-09-07 | 异常交易的监测方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111044443.7A CN113935574B (zh) | 2021-09-07 | 2021-09-07 | 异常交易的监测方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113935574A CN113935574A (zh) | 2022-01-14 |
CN113935574B true CN113935574B (zh) | 2023-09-29 |
Family
ID=79275270
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111044443.7A Active CN113935574B (zh) | 2021-09-07 | 2021-09-07 | 异常交易的监测方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113935574B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20010064681A (ko) * | 2000-06-27 | 2001-07-11 | 정영근 | 주식 불공정 거래 실시간 적발 방법 및 시스템 |
US7624062B1 (en) * | 2002-03-18 | 2009-11-24 | Chicago Mercantile Exchange Inc. | Method and system for generating and trading composite contracts |
CN106156795A (zh) * | 2016-07-05 | 2016-11-23 | ***股份有限公司 | 一种可疑洗钱账户的确定方法及装置 |
KR101834260B1 (ko) * | 2017-01-18 | 2018-03-06 | 한국인터넷진흥원 | 이상 거래 탐지 방법 및 장치 |
CN108537544A (zh) * | 2018-04-04 | 2018-09-14 | 中南大学 | 一种交易***实时监控方法及其监控*** |
WO2018228408A1 (zh) * | 2017-06-16 | 2018-12-20 | 腾讯科技(深圳)有限公司 | 交易结算方法、装置、服务器以及存储介质 |
CN110400082A (zh) * | 2019-07-29 | 2019-11-01 | 中国工商银行股份有限公司 | 异常交易企业的识别方法和装置 |
CN111626860A (zh) * | 2020-07-24 | 2020-09-04 | 成都寻道数财科技有限公司 | 结合历史和实时财务数据判断高频交易的***及方法 |
CN112347425A (zh) * | 2021-01-08 | 2021-02-09 | 同盾控股有限公司 | 基于时间序列的密集子图检测的方法和*** |
CN112989338A (zh) * | 2021-01-04 | 2021-06-18 | 腾讯科技(深圳)有限公司 | 异常应用数据检测方法、装置、电子设备及存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI367452B (en) * | 2009-08-21 | 2012-07-01 | Shih Chin Lee | Method for detecting abnormal transactions of financial assets and information processing device performing the method |
US20210142400A1 (en) * | 2019-11-12 | 2021-05-13 | Seven Scott Kinker | Method and System for Displaying Trading Volumes of a Financial Asset by Time and Price |
US11526422B2 (en) * | 2019-11-18 | 2022-12-13 | Bmc Software, Inc. | System and method for troubleshooting abnormal behavior of an application |
-
2021
- 2021-09-07 CN CN202111044443.7A patent/CN113935574B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20010064681A (ko) * | 2000-06-27 | 2001-07-11 | 정영근 | 주식 불공정 거래 실시간 적발 방법 및 시스템 |
US7624062B1 (en) * | 2002-03-18 | 2009-11-24 | Chicago Mercantile Exchange Inc. | Method and system for generating and trading composite contracts |
CN106156795A (zh) * | 2016-07-05 | 2016-11-23 | ***股份有限公司 | 一种可疑洗钱账户的确定方法及装置 |
KR101834260B1 (ko) * | 2017-01-18 | 2018-03-06 | 한국인터넷진흥원 | 이상 거래 탐지 방법 및 장치 |
WO2018228408A1 (zh) * | 2017-06-16 | 2018-12-20 | 腾讯科技(深圳)有限公司 | 交易结算方法、装置、服务器以及存储介质 |
CN108537544A (zh) * | 2018-04-04 | 2018-09-14 | 中南大学 | 一种交易***实时监控方法及其监控*** |
CN110400082A (zh) * | 2019-07-29 | 2019-11-01 | 中国工商银行股份有限公司 | 异常交易企业的识别方法和装置 |
CN111626860A (zh) * | 2020-07-24 | 2020-09-04 | 成都寻道数财科技有限公司 | 结合历史和实时财务数据判断高频交易的***及方法 |
CN112989338A (zh) * | 2021-01-04 | 2021-06-18 | 腾讯科技(深圳)有限公司 | 异常应用数据检测方法、装置、电子设备及存储介质 |
CN112347425A (zh) * | 2021-01-08 | 2021-02-09 | 同盾控股有限公司 | 基于时间序列的密集子图检测的方法和*** |
Non-Patent Citations (2)
Title |
---|
Monitoring Blockchain Cryptocurrency Transactions to Improve the Trustworthiness of the Fourth Industrial Revolution;Kamyar Sabri-Laghaie;electronics;全文 * |
基于时间序列建模和控制图的异常交易检测方法;刘卓军;李晓明;;数学的实践与认识(第10期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113935574A (zh) | 2022-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11810204B2 (en) | Artificial intelligence transaction risk scoring and anomaly detection | |
US8121962B2 (en) | Automated entity identification for efficient profiling in an event probability prediction system | |
WO2020062702A9 (zh) | 短信发送的方法、装置、计算机设备和存储介质 | |
CN109829721B (zh) | 基于异质网络表征学习的线上交易多主体行为建模方法 | |
US20210334673A1 (en) | Online unsupervised anomaly detection | |
CN108170830B (zh) | 群组事件数据可视化方法及*** | |
US20110099101A1 (en) | Automated validation reporting for risk models | |
US20210125272A1 (en) | Using Inferred Attributes as an Insight into Banking Customer Behavior | |
CN113360548A (zh) | 基于数据资产分析的数据处理方法、装置、设备及介质 | |
CN113034046A (zh) | 一种数据风险计量方法、装置、电子设备及存储介质 | |
CN113763502A (zh) | 一种图表生成方法、装置、设备和存储介质 | |
CN112581270A (zh) | 风险账户的识别方法、装置、电子设备和存储介质 | |
CN115526700A (zh) | 风险的预测方法、装置及电子设备 | |
Balakayeva et al. | The solution to the problem of processing Big Data using the example of assessing the solvency of borrowers | |
US20210073693A1 (en) | Systems and methods of dynamically presenting datasets in a graphical user interface | |
CN113935574B (zh) | 异常交易的监测方法、装置、计算机设备和存储介质 | |
CN116596674A (zh) | 基于大数据分析的对外贸易风险评估方法 | |
CN115913745A (zh) | 车辆安全事件预测方法、装置、计算机设备和存储介质 | |
CN114495137B (zh) | 票据异常检测模型生成方法与票据异常检测方法 | |
CN114565452A (zh) | 转账风险识别方法、装置、计算机设备和存储介质 | |
CN113761082A (zh) | 一种数据可视化方法、装置和*** | |
CN112926991A (zh) | 一种套现团伙严重等级划分方法及*** | |
Momen et al. | Modeling the operational risk in Iranian commercial banks: case study of a private bank | |
CN118171213A (zh) | 异常检测方法、装置、计算机设备和存储介质 | |
Yu | Analysis of Individual User’s Financial Debt Default--Based on the Construction of Logistic Regression Model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |