CN117808601B - 一种基于大数据的资金追溯方法及*** - Google Patents
一种基于大数据的资金追溯方法及*** Download PDFInfo
- Publication number
- CN117808601B CN117808601B CN202410217985.7A CN202410217985A CN117808601B CN 117808601 B CN117808601 B CN 117808601B CN 202410217985 A CN202410217985 A CN 202410217985A CN 117808601 B CN117808601 B CN 117808601B
- Authority
- CN
- China
- Prior art keywords
- transaction
- fund
- user
- fluctuation
- tracing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000012544 monitoring process Methods 0.000 claims abstract description 34
- 238000012545 processing Methods 0.000 claims abstract description 26
- 238000007781 pre-processing Methods 0.000 claims abstract description 14
- 238000004364 calculation method Methods 0.000 claims description 35
- 230000000694 effects Effects 0.000 claims description 21
- 238000010586 diagram Methods 0.000 claims description 16
- 238000012546 transfer Methods 0.000 claims description 11
- 238000004140 cleaning Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 9
- 238000005516 engineering process Methods 0.000 claims description 4
- 230000001186 cumulative effect Effects 0.000 claims description 3
- 238000007405 data analysis Methods 0.000 claims description 3
- 230000010365 information processing Effects 0.000 claims description 2
- 230000006399 behavior Effects 0.000 abstract description 15
- 238000004458 analytical method Methods 0.000 abstract description 7
- 238000004900 laundering Methods 0.000 description 4
- 230000008520 organization Effects 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 238000013480 data collection Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Landscapes
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明公开了一种基于大数据的资金追溯方法及***,具体涉及大数据技术领域,包括多源数据采集模块、数据预处理模块、资金流向图数据库存储模块、数据处理模块、资金流动实时监控模块、资金追溯执行模块,以及追溯结果输出模块;通过资金流向图数据库存储模块,存储经过预处理的数据,并构建用户的资金流向图,便于分析和追溯资金路径;通过数据处理模块将多条交易记录进行整合,计算相关数据,提供了对用户行为的深入洞察;通过资金流动实时监控模块计算风险波动指数,发出报警信息;通过资金追溯执行模块接收报警信息,执行资金追溯操作并生成资金追溯报告,揭示资金的完整流动路径和相关联的交易信息。
Description
技术领域
本发明涉及大数据技术领域,更具体地说,本发明涉及一种基于大数据的资金追溯方法及***。
背景技术
在当前的金融领域,资金的流动和交易数据是巨大的。为了确保资金的安全和合规性,需要对这些数据进行有效的监控和管理。
现有的资金追溯方法主要依赖于传统的数据库和数据处理技术,这些方法在处理大量数据时效率低下,且难以实现实时监控和快速的资金追溯;资金追溯通常面临数据孤岛、信息不全面和分析能力不足等问题,导致无法快速准确地追踪资金流向;此外,现有的资金追溯方法往往无法有效地整合多源数据,导致资金流向的不清晰,增加了监管的难度;因此,急需一种基于大数据的资金追溯方法及***,能够高效地处理和分析大量的金融数据,实现资金的实时监控和快速追溯。
发明内容
为了克服现有技术的上述缺陷,本发明提供一种基于大数据的资金追溯方法及***,通过多源数据采集模块从银行、证券和保险金融领域采集所有用户的交易数据,为***提供全面的数据集,确保能够追踪到所有可能的资金流动路径;通过数据预处理模块对采集到的数据进行清洗、去重、格式化,以及特征工程预处理操作,保证数据的质量和一致性,为分析提供准确、可靠的数据;通过资金流向图数据库存储模块,存储经过预处理的数据,并构建用户的资金流向图,便于分析和追溯资金路径,加速数据检索过程;通过数据处理模块将多条交易记录进行整合,计算相关数据,提供了对用户行为的深入洞察,有助于识别异常模式和风险行为;通过资金流动实时监控模块,对资金流动进行实时监控,计算风险波动指数,将风险波动指数和预先设定的风险波动指数阈值进行判断对比,发出报警信息传输至资金追溯执行模块,从而实时响应可能的非法活动或欺诈行为,减少损失;通过资金追溯执行模块,接收资金流动实时监控模块传输的报警信息后,立即执行资金追溯操作,从资金流向图数据库存储模块中进行检索,并生成资金追溯报告,揭示资金的完整流动路径和相关联的交易信息,为监管机构和金融机构提供了强有力的工具来打击洗钱和其他金融犯罪;通过追溯结果输出模块将追溯结果以网络图展示,帮助监管机构理解复杂的资金关系网,并做出相应的决策,有助于制定针对性的监管措施;以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种基于大数据的资金追溯***,包括:
多源数据采集模块:用于从银行、证券和保险金融领域采集所有用户的交易数据,包括个人转账记录、股票交易记录、投保记录,以及消费记录;
数据预处理模块:用于对采集到的数据进行清洗、去重、格式化,以及特征工程预处理操作;
资金流向图数据库存储模块:用于存储经过预处理的数据,并构建用户的资金流向图;
数据处理模块:用于在本地服务器对预处理后的数据进行初步处理,将多条交易记录进行整合,计算每个用户在给定时间窗口内的交易次数、平均交易金额、交易时间间隔、累积交易金额,以及交易对手方数量,每个用户在每个时间窗口内不同交易类型的数量和频率,传输至资金流动实时监控模块;
资金流动实时监控模块包括数据计算单元、风险波动指数计算单元和风险判断单元,用于通过实时数据分析技术,对资金流动进行实时监控,计算风险波动指数,将风险波动指数和预先设定的风险波动指数阈值进行判断对比,发出报警信息传输至资金追溯执行模块;
资金追溯执行模块:用于接收资金流动实时监控模块传输的报警信息后,立即执行资金追溯操作,从资金流向图数据库存储模块中进行检索,并生成资金追溯报告,揭示资金的完整流动路径和相关联的交易信息;
追溯结果输出模块:用于将追溯结果以网络图展示,帮助监管机构理解复杂的资金关系网,并做出相应的决策。
在一个优选的实施方式中,所述数据处理模块的具体处理过程为:
A1、将预处理后的数据按照n个时间窗口T进行划分,依次编号为Mj,j=1,2,3……n;
A2、对于数据Mj,将个人转账记录、股票交易记录、投保记录,以及消费记录按照同一参与方的所有交易记录合并为一条记录,得到n个时间窗口中m个参与方的k条交易记录;所述交易记录包括交易时间、交易次数、交易类型,以及交易金额;
A3、统计每个用户在给定时间窗口内的交易次数记作Cai;
A4、计算每个用户在给定时间窗口内的平均交易金额Pei,
,其中k表示交易记录总数,Zeiv表示参与方i的第v条交易记录的交易金额,Cai表示参与方i的交易次数;
A5、统计每个用户在给定时间窗口内的交易时间间隔Tyi;
A6、计算每个用户在给定时间窗口内的累积交易金额Lei,,其中k表示交易记录总数,Zeiv表示参与方i的第v条交易记录的交易金额,Cai表示参与方i的交易次数;
A7、统计每个用户在给定时间窗口内的交易对手方数量记作Dsi;
A8、统计每个用户在每个时间窗口内不同交易类型的数量为Zsi,计算其频率,,其中Cai表示参与方i的交易次数。
在一个优选的实施方式中,所述资金流动实时监控模块的具体计算过程为:
B1、计算交易活跃度、交易多样性指数、平均交易规模,以及网络连接度;
B2、计算每个用户在所有时间窗口内的交易活跃度波动均值、交易多样性指数波动均值、平均交易规模的波动均值,以及网络连接度波动均值。
在一个优选的实施方式中,所述交易活跃度Hy的计算公式为:,其中Cai表示参与方i的交易次数,Tyi表示参与方i的交易时间间隔;
所述交易多样性指数Dy的计算公式为:,其中pi表示第i种交易类型的比例,M表示交易类型的种类;
所述平均交易规模Gm的计算公式为:,其中Cai表示参与方i的交易次数,Lei表示参与方i的累积交易金额;
所述网络连接度Ld,具体通过构建一个网络图,节点是用户,边是交易关系,根据节点和边的数量,计算网络连接度Ld:,其中Sx表示与节点x相连的边的数量,U表示网络中节点的总数。
在一个优选的实施方式中,所述交易活跃度波动均值PHy的计算公式为:,其中Hyj表示用户在第j个时间窗口的交易活跃度,Hy j+1表示用户在第j+1个时间窗口的交易活跃度,n表示时间窗口的数量;
所述交易多样性指数波动均值PDy的计算公式为:
,其中Dyj表示用户在第j个时间窗口的交易多样性指数,Dy j+1表示用户在第j+1个时间窗口的交易多样性指数,n表示时间窗口的数量;
所述平均交易规模的波动均值PGm的计算公式为:
,其中Gmj表示用户在第j个时间窗口的平均交易规模,Gm j+1表示用户在第j+1个时间窗口的平均交易规模,n表示时间窗口的数量;
所述网络连接度波动均值PLd的计算公式为:,其中Ldj表示用户在第j个时间窗口的网络连接度,Ld j+1表示用户在第j+1个时间窗口的网络连接度,n表示时间窗口的数量。
在一个优选的实施方式中,所述风险波动指数计算单元用于计算风险波动指数,具体计算过程为:
C1、将交易活跃度波动均值、交易多样性指数波动均值、平均交易规模的波动均值,以及网络连接度波动均值进行标准化处理;
C2、根据标准化后的交易活跃度波动均值PHy、交易多样性指数波动均值PDy、平均交易规模的波动均值PGm,以及网络连接度波动均值PLd,计算风险波动指数Qz,,其中γ1、γ2、γ3、γ4表示各项的比例系数。
在一个优选的实施方式中,所述风险判断单元用于将风险波动指数和预先设定的风险波动指数阈值进行判断对比,发出报警信息传输至资金追溯执行模块;具体是将风险波动指数Qz,和预先设定的风险波动指数阈值Qz阈进行判断对比,若Qz≥Qz阈则表示用户的行为存在较高的风险,发出报警信息;反之则表示用户的行为存在较低的风险。
为实现上述目的,本发明提供如下技术方案:一种基于大数据的资金追溯方法,包括以下步骤:
步骤S1、从银行、证券和保险金融领域采集所有用户的交易数据;
步骤S2、对采集到的数据进行清洗、去重、格式化,以及特征工程预处理操作;
步骤S3、存储经过预处理的数据,并构建用户的资金流向图;
步骤S4、在本地服务器对预处理后的数据进行初步处理,将多条交易记录进行整合,计算每个用户在给定时间窗口内的交易次数、平均交易金额、交易时间间隔、累积交易金额,以及交易对手方数量,每个用户在每个时间窗口内不同交易类型的数量和频率;
步骤S5、计算风险波动指数,将风险波动指数和预先设定的风险波动指数阈值进行判断对比,发出报警信息;
步骤S6、接收报警信息后,立即执行资金追溯操作,从资金流向图数据库存储模块中进行检索,并生成资金追溯报告;
步骤S7、将追溯结果以网络图展示。
本发明的技术效果和优点:
本发明通过多源数据采集模块从银行、证券和保险金融领域采集所有用户的交易数据,为***提供全面的数据集,确保能够追踪到所有可能的资金流动路径;通过数据预处理模块对采集到的数据进行清洗、去重、格式化,以及特征工程预处理操作,保证数据的质量和一致性,为分析提供准确、可靠的数据;通过资金流向图数据库存储模块,存储经过预处理的数据,并构建用户的资金流向图,便于分析和追溯资金路径,加速数据检索过程;通过数据处理模块将多条交易记录进行整合,计算相关数据,提供了对用户行为的深入洞察,有助于识别异常模式和风险行为;通过资金流动实时监控模块,对资金流动进行实时监控,计算风险波动指数,将风险波动指数和预先设定的风险波动指数阈值进行判断对比,发出报警信息传输至资金追溯执行模块,从而实时响应可能的非法活动或欺诈行为,减少损失;通过资金追溯执行模块,接收资金流动实时监控模块传输的报警信息后,立即执行资金追溯操作,从资金流向图数据库存储模块中进行检索,并生成资金追溯报告,揭示资金的完整流动路径和相关联的交易信息,为监管机构和金融机构提供了强有力的工具来打击洗钱和其他金融犯罪;通过追溯结果输出模块将追溯结果以网络图展示,帮助监管机构理解复杂的资金关系网,并做出相应的决策,有助于制定针对性的监管措施;本发明能够满足现代金融领域对于资金流动监控和追溯的需求,具有很高的实用价值和市场前景。
附图说明
图1为本发明的整体结构框图。
图2为本发明的步骤方法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供了如图1-图2所示的一种基于大数据的资金追溯方法及***,包括多源数据采集模块、数据预处理模块、资金流向图数据库存储模块、数据处理模块、资金流动实时监控模块、资金追溯执行模块,以及追溯结果输出模块;
所述多源数据采集模块用于从银行、证券和保险金融领域采集所有用户的交易数据,包括个人转账记录、股票交易记录、投保记录,以及消费记录;所述个人转账记录包括交易参与方、账号、转账金额,以及转账时间;所述股票交易记录包括交易价格、交易数量、交易时间、持仓数,以及盈亏比;所述投保记录包括投保人姓名、投保日期、保险金额、保费金额、理赔金额,以及理赔时间;所述消费记录包括消费类型和消费金额;
本实施需要具体说明的是,所述多源数据采集模块的采集方式为:通过与银行、证券和保险金融机构的***进行接口对接,实现对个人转账记录、股票交易记录和投保记录敏感财务数据的收集;与相关的消费记录提供方进行合作,通过数据接口获取消费记录;
所述数据预处理模块用于对采集到的数据进行清洗、去重、格式化,以及特征工程预处理操作,以确保数据的质量和一致性,为后续分析提供可靠的数据基础;所述对采集到的数据进行清洗、去重、格式化,以及特征工程预处理操作,属于现有技术手段,因此本实施例未做出具体说明;
所述资金流向图数据库存储模块用于存储经过预处理的数据,并构建用户的资金流向图;其中资金流向图的构建,具体是将交易数据转换为图形结构,节点表示交易实体,例如,用户、银行账户和证券账户,边表示资金流动;
需要说明的是,资金流向图数据库存储模块将处理后的数据进行结构化存储,以便于快速检索和分析;通过构建资金流向图,可以帮助揭示用户资产的流动路径,包括资金的来源、去向、金额,以及时间信息;
所述数据处理模块用于在本地服务器对预处理后的数据进行初步处理,将多条交易记录进行整合,计算每个用户在给定时间窗口内的交易次数、平均交易金额、交易时间间隔、累积交易金额,以及交易对手方数量,每个用户在每个时间窗口内不同交易类型的数量和频率,传输至资金流动实时监控模块;
本实施需要具体说明的是,所述数据处理模块的具体处理过程为:
A1、将预处理后的数据按照n个时间窗口T进行划分,依次编号为Mj,j=1,2,3……n;
A2、对于数据Mj,将个人转账记录、股票交易记录、投保记录,以及消费记录按照同一参与方的所有交易记录合并为一条记录,得到n个时间窗口中m个参与方的k条交易记录;所述交易记录包括交易时间、交易次数、交易类型,以及交易金额;
A3、统计每个用户在给定时间窗口内的交易次数记作Cai;
A4、计算每个用户在给定时间窗口内的平均交易金额Pei,
,其中k表示交易记录总数,Zeiv表示参与方i的第v条交易记录的交易金额,Cai表示参与方i的交易次数;
A5、统计每个用户在给定时间窗口内的交易时间间隔Tyi;
A6、计算每个用户在给定时间窗口内的累积交易金额Lei,,其中k表示交易记录总数,Zeiv表示参与方i的第v条交易记录的交易金额,Cai表示参与方i的交易次数,以分析用户的交易增长趋势;
A7、统计每个用户在给定时间窗口内的交易对手方数量记作Dsi,以分析用户的交易网络和关联方;
A8、统计每个用户在每个时间窗口内不同交易类型的数量为Zsi,计算其频率,,其中Cai表示参与方i的交易次数;
所述资金流动实时监控模块包括数据计算单元、风险波动指数计算单元和风险判断单元,用于通过实时数据分析技术,对资金流动进行实时监控,计算风险波动指数,将风险波动指数和预先设定的风险波动指数阈值进行判断对比,发出报警信息传输至资金追溯执行模块;
本实施需要具体说明的是,所述数据计算单元用于计算每个用户在所有时间窗口内的交易活跃度波动均值、交易多样性指数波动均值、平均交易规模的波动均值,以及网络连接度波动均值,具体计算过程为:
B1、计算交易活跃度、交易多样性指数、平均交易规模,以及网络连接度;
所述交易活跃度Hy的计算公式为:,其中Cai表示参与方i的交易次数,Tyi表示参与方i的交易时间间隔;通过分析个体的交易活跃度,可以标识出频繁进行交易的节点,这些节点可能是重点监控对象,尤其是在资金流动快速且频繁的情况下,异常高的活跃度可能表明有洗钱或其他非法资金流动的风险;
所述交易多样性指数Dy的计算公式为:,其中pi表示第i种交易类型的比例,M表示交易类型的种类;多样化的交易类型可能暗示着用户在进行正常的商业活动,而交易类型的突然变化或单一化可能指向规避监管的行为;缺乏交易多样性可能表明资金用于专门的非法目的或来自特定的犯罪活动;
所述平均交易规模Gm的计算公式为:,其中Cai表示参与方i的交易次数,Lei表示参与方i的累积交易金额;大额交易可能引起关注,特别是如果不符合个体的正常交易模式;对于资金追溯而言,平均交易规模的分析有助于识别资金的集中流动和大额资金的异常转移;
所述网络连接度Ld,具体通过构建一个网络图,节点是用户,边是交易关系,根据节点和边的数量,计算网络连接度Ld:,其中Sx表示与节点x相连的边的数量,U表示网络中节点的总数;该数值衡量一个节点与其它节点的直接联系数量,反映了该节点在网络中的活跃程度和影响力;在资金追溯的背景下,网络连接度揭示了个体与其它个体间的关联程度,有助于描绘出潜在的合谋网络或组织架构;高度连接的节点可能在资金流动网络中扮演关键角色,因此是监控和调查的重点;
B2、计算每个用户在所有时间窗口内的交易活跃度波动均值、交易多样性指数波动均值、平均交易规模的波动均值,以及网络连接度波动均值;
所述交易活跃度波动均值PHy的计算公式为:,其中Hyj表示用户在第j个时间窗口的交易活跃度,Hy j+1表示用户在第j+1个时间窗口的交易活跃度,n表示时间窗口的数量;该数值表明用户交易频率的稳定性,高波动性可能表示与正常的业务活动不符;
所述交易多样性指数波动均值PDy的计算公式为:
,其中Dyj表示用户在第j个时间窗口的交易多样性指数,Dy j+1表示用户在第j+1个时间窗口的交易多样性指数,n表示时间窗口的数量;该数值反映用户交易类型的多样性和变化情况,如果一个用户通常进行多种类型的交易,但突然之间只进行少数几种交易,这可能是操纵或欺诈的迹象;
所述平均交易规模的波动均值PGm的计算公式为:
,其中Gmj表示用户在第j个时间窗口的平均交易规模,Gm j+1表示用户在第j+1个时间窗口的平均交易规模,n表示时间窗口的数量;该数值显示用户交易金额的变化程度,稳定的交易规模可能符合常规业务模式;
所述网络连接度波动均值PLd的计算公式为:,其中Ldj表示用户在第j个时间窗口的网络连接度,Ld j+1表示用户在第j+1个时间窗口的网络连接度,n表示时间窗口的数量;频繁变化的连接度可能表明用户正在尝试避免被追踪或与多个不同的个体进行可疑交易;
需要说明的是,这些波动均值的意义在于可以帮助识别那些行为模式不一致或不符合正常业务行为的用户,在资金追溯***中,这种行为的不一致性可能是非法活动,如洗钱、欺诈的指示器,通过监测这些指标的波动,金融机构和监管机构可以更有效地识别和防范潜在的金融犯罪,同时提高***的透明度和合规性;
本实施需要具体说明的是,所述风险波动指数计算单元用于计算风险波动指数,具体计算过程为:
C1、将交易活跃度波动均值、交易多样性指数波动均值、平均交易规模的波动均值,以及网络连接度波动均值进行标准化处理,以确保在同一尺度上可以进行比较;所述标准化处理属于现有技术手段,因此本实施例未做出具体说明;
C2、根据标准化后的交易活跃度波动均值PHy、交易多样性指数波动均值PDy、平均交易规模的波动均值PGm,以及网络连接度波动均值PLd,计算风险波动指数Qz,,其中γ1、γ2、γ3、γ4表示各项的比例系数,比例系数的大小是为了将各个参数进行量化得到的一个具体的数值,便于后续比较,关于比例系数的大小,只要不影响参数与量化后数值的比例关系即可;
本实施需要具体说明的是,所述风险判断单元用于将风险波动指数和预先设定的风险波动指数阈值进行判断对比,发出报警信息传输至资金追溯执行模块;具体是将风险波动指数Qz,和预先设定的风险波动指数阈值Qz阈进行判断对比,若Qz≥Qz阈则表示用户的行为存在较高的风险,发出报警信息;反之则表示用户的行为存在较低的风险;其中预先设定的风险波动指数阈值Qz阈,可依据具体情况具体设定,本实施例不对具体数据做具体限定;
所述资金追溯执行模块用于接收资金流动实时监控模块传输的报警信息后,立即执行资金追溯操作,从资金流向图数据库存储模块中进行检索,并生成资金追溯报告,揭示资金的完整流动路径和相关联的交易信息;所述资金追溯报告记录每一笔资金交易的详细信息,包括金额、时间、交易双方以及资金的流入和流出节点;
所述追溯结果输出模块用于将追溯结果以网络图展示,帮助监管机构理解复杂的资金关系网,并做出相应的决策;
本实施例中,需要具体说明的是,一种基于大数据的资金追溯方法,包括以下步骤:
步骤S1、从银行、证券和保险金融领域采集所有用户的交易数据;
步骤S2、对采集到的数据进行清洗、去重、格式化,以及特征工程预处理操作;
步骤S3、存储经过预处理的数据,并构建用户的资金流向图;
步骤S4、在本地服务器对预处理后的数据进行初步处理,将多条交易记录进行整合,计算每个用户在给定时间窗口内的交易次数、平均交易金额、交易时间间隔、累积交易金额,以及交易对手方数量,每个用户在每个时间窗口内不同交易类型的数量和频率;
步骤S5、计算风险波动指数,将风险波动指数和预先设定的风险波动指数阈值进行判断对比,发出报警信息;
步骤S6、接收报警信息后,立即执行资金追溯操作,从资金流向图数据库存储模块中进行检索,并生成资金追溯报告;
步骤S7、将追溯结果以网络图展示。
最后:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
Claims (5)
1.一种基于大数据的资金追溯***,其特征在于,包括:
多源数据采集模块:用于从银行、证券和保险金融领域采集所有用户的交易数据,包括个人转账记录、股票交易记录、投保记录,以及消费记录;
数据预处理模块:用于对采集到的数据进行清洗、去重、格式化,以及特征工程预处理操作;
资金流向图数据库存储模块:用于存储经过预处理的数据,并构建用户的资金流向图;
数据处理模块:用于在本地服务器对预处理后的数据进行初步处理,将多条交易记录进行整合,计算每个用户在给定时间窗口内的交易次数、平均交易金额、交易时间间隔、累积交易金额,以及交易对手方数量,每个用户在每个时间窗口内不同交易类型的数量和频率,传输至资金流动实时监控模块;
资金流动实时监控模块包括数据计算单元、风险波动指数计算单元和风险判断单元,用于通过实时数据分析技术,对资金流动进行实时监控,计算风险波动指数,将风险波动指数和预先设定的风险波动指数阈值进行判断对比,发出报警信息传输至资金追溯执行模块;
所述资金流动实时监控模块的具体计算过程为:
B1、计算交易活跃度、交易多样性指数、平均交易规模,以及网络连接度;
B2、计算每个用户在所有时间窗口内的交易活跃度波动均值、交易多样性指数波动均值、平均交易规模的波动均值,以及网络连接度波动均值;
所述交易活跃度Hy的计算公式为:,其中Cai表示参与方i的交易次数,Tyi表示参与方i的交易时间间隔;
所述交易多样性指数Dy的计算公式为:,其中pi表示第i种交易类型的比例,M表示交易类型的种类;
所述平均交易规模Gm的计算公式为:,其中Cai表示参与方i的交易次数,Lei表示参与方i的累积交易金额;
所述网络连接度Ld,具体通过构建一个网络图,节点是用户,边是交易关系,根据节点和边的数量,计算网络连接度Ld:,其中Sx表示与节点x相连的边的数量,U表示网络中节点的总数;
所述交易活跃度波动均值PHy的计算公式为:,其中Hyj表示用户在第j个时间窗口的交易活跃度,Hy j+1表示用户在第j+1个时间窗口的交易活跃度,n表示时间窗口的数量;
所述交易多样性指数波动均值PDy的计算公式为:
,其中Dyj表示用户在第j个时间窗口的交易多样性指数,Dy j+1表示用户在第j+1个时间窗口的交易多样性指数,n表示时间窗口的数量;
所述平均交易规模的波动均值PGm的计算公式为:
,其中Gmj表示用户在第j个时间窗口的平均交易规模,Gm j+1表示用户在第j+1个时间窗口的平均交易规模,n表示时间窗口的数量;
所述网络连接度波动均值PLd的计算公式为:,其中Ldj表示用户在第j个时间窗口的网络连接度,Ld j+1表示用户在第j+1个时间窗口的网络连接度,n表示时间窗口的数量;
资金追溯执行模块:用于接收资金流动实时监控模块传输的报警信息后,立即执行资金追溯操作,从资金流向图数据库存储模块中进行检索,并生成资金追溯报告,揭示资金的完整流动路径和相关联的交易信息;
追溯结果输出模块:用于将追溯结果以网络图展示,帮助监管机构理解复杂的资金关系网,并做出相应的决策。
2.根据权利要求1所述的一种基于大数据的资金追溯***,其特征在于:
所述数据处理模块的具体处理过程为:
A1、将预处理后的数据按照n个时间窗口T进行划分,依次编号为Mj,j=1,2,3……n;
A2、对于数据Mj,将个人转账记录、股票交易记录、投保记录,以及消费记录按照同一参与方的所有交易记录合并为一条记录,得到n个时间窗口中m个参与方的k条交易记录;所述交易记录包括交易时间、交易次数、交易类型,以及交易金额;
A3、统计每个用户在给定时间窗口内的交易次数记作Cai;
A4、计算每个用户在给定时间窗口内的平均交易金额Pei,
,其中k表示交易记录总数,Zeiv表示参与方i的第v条交易记录的交易金额,Cai表示参与方i的交易次数;
A5、统计每个用户在给定时间窗口内的交易时间间隔Tyi;
A6、计算每个用户在给定时间窗口内的累积交易金额Lei,,其中k表示交易记录总数,Zeiv表示参与方i的第v条交易记录的交易金额,Cai表示参与方i的交易次数;
A7、统计每个用户在给定时间窗口内的交易对手方数量记作Dsi;
A8、统计每个用户在每个时间窗口内不同交易类型的数量为Zsi,计算其频率,,其中Cai表示参与方i的交易次数。
3.根据权利要求1所述的一种基于大数据的资金追溯***,其特征在于:所述风险波动指数计算单元用于计算风险波动指数,具体计算过程为:
C1、将交易活跃度波动均值、交易多样性指数波动均值、平均交易规模的波动均值,以及网络连接度波动均值进行标准化处理;
C2、根据标准化后的交易活跃度波动均值PHy、交易多样性指数波动均值PDy、平均交易规模的波动均值PGm,以及网络连接度波动均值PLd,计算风险波动指数Qz,,其中γ1、γ2、γ3、γ4表示各项的比例系数。
4.根据权利要求1所述的一种基于大数据的资金追溯***,其特征在于:所述风险判断单元用于将风险波动指数和预先设定的风险波动指数阈值进行判断对比,发出报警信息传输至资金追溯执行模块;具体是将风险波动指数Qz,和预先设定的风险波动指数阈值Qz阈进行判断对比,若Qz≥Qz阈则表示用户的行为存在较高的风险,发出报警信息;反之则表示用户的行为存在较低的风险。
5.一种基于大数据的资金追溯方法,所述方法用于实现上述权利要求1-4任一所述的一种基于大数据的资金追溯***,其特征在于,包括以下步骤:
步骤S1、从银行、证券和保险金融领域采集所有用户的交易数据;
步骤S2、对采集到的数据进行清洗、去重、格式化,以及特征工程预处理操作;
步骤S3、存储经过预处理的数据,并构建用户的资金流向图;
步骤S4、在本地服务器对预处理后的数据进行初步处理,将多条交易记录进行整合,计算每个用户在给定时间窗口内的交易次数、平均交易金额、交易时间间隔、累积交易金额,以及交易对手方数量,每个用户在每个时间窗口内不同交易类型的数量和频率;
步骤S5、计算风险波动指数,将风险波动指数和预先设定的风险波动指数阈值进行判断对比,发出报警信息;
步骤S6、接收报警信息后,立即执行资金追溯操作,从资金流向图数据库存储模块中进行检索,并生成资金追溯报告;
步骤S7、将追溯结果以网络图展示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410217985.7A CN117808601B (zh) | 2024-02-28 | 2024-02-28 | 一种基于大数据的资金追溯方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410217985.7A CN117808601B (zh) | 2024-02-28 | 2024-02-28 | 一种基于大数据的资金追溯方法及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117808601A CN117808601A (zh) | 2024-04-02 |
CN117808601B true CN117808601B (zh) | 2024-05-24 |
Family
ID=90425849
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410217985.7A Active CN117808601B (zh) | 2024-02-28 | 2024-02-28 | 一种基于大数据的资金追溯方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117808601B (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015088037A (ja) * | 2013-10-31 | 2015-05-07 | 株式会社日立ソリューションズ | 資金フロー分析装置及び方法 |
CN104867055A (zh) * | 2015-06-16 | 2015-08-26 | 咸宁市公安局 | 一种金融网络可疑资金追踪与识别方法 |
CN109919608A (zh) * | 2018-11-28 | 2019-06-21 | 阿里巴巴集团控股有限公司 | 一种高危交易主体的识别方法、装置及服务器 |
JP2021149505A (ja) * | 2020-03-19 | 2021-09-27 | 株式会社クリプタクト | 情報処理システムおよび情報提供方法 |
CN114119026A (zh) * | 2022-01-26 | 2022-03-01 | 成都无糖信息技术有限公司 | 一种虚拟货币交易追踪溯源方法及*** |
CN114493864A (zh) * | 2022-01-04 | 2022-05-13 | 中科金审(北京)科技有限公司 | 一种基于资金大数据异常检测***及方法 |
CN114819965A (zh) * | 2021-01-21 | 2022-07-29 | 成都链安科技有限公司 | 区块链虚拟货币监测*** |
CN115439030A (zh) * | 2022-11-09 | 2022-12-06 | 山东民昊健康科技有限公司 | 一种基于大数据分析的资金往来信息管理*** |
CN115631042A (zh) * | 2022-10-29 | 2023-01-20 | 复旦大学 | 一种面向账户模型区块链的风险交易检测方法 |
CN115631039A (zh) * | 2019-09-26 | 2023-01-20 | 支付宝(杭州)信息技术有限公司 | 资金追踪方法、装置及设备 |
WO2023109116A1 (zh) * | 2021-12-14 | 2023-06-22 | 同济大学 | 一种基于交易图谱的快速反洗钱检测方法 |
CN116957598A (zh) * | 2023-06-02 | 2023-10-27 | 华侨大学 | 一种基于路径束的可疑资金流向追溯方法及*** |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030233319A1 (en) * | 2001-03-20 | 2003-12-18 | David Lawrence | Electronic fund transfer participant risk management clearing |
-
2024
- 2024-02-28 CN CN202410217985.7A patent/CN117808601B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015088037A (ja) * | 2013-10-31 | 2015-05-07 | 株式会社日立ソリューションズ | 資金フロー分析装置及び方法 |
CN104867055A (zh) * | 2015-06-16 | 2015-08-26 | 咸宁市公安局 | 一种金融网络可疑资金追踪与识别方法 |
CN109919608A (zh) * | 2018-11-28 | 2019-06-21 | 阿里巴巴集团控股有限公司 | 一种高危交易主体的识别方法、装置及服务器 |
CN115631039A (zh) * | 2019-09-26 | 2023-01-20 | 支付宝(杭州)信息技术有限公司 | 资金追踪方法、装置及设备 |
JP2021149505A (ja) * | 2020-03-19 | 2021-09-27 | 株式会社クリプタクト | 情報処理システムおよび情報提供方法 |
CN114819965A (zh) * | 2021-01-21 | 2022-07-29 | 成都链安科技有限公司 | 区块链虚拟货币监测*** |
WO2023109116A1 (zh) * | 2021-12-14 | 2023-06-22 | 同济大学 | 一种基于交易图谱的快速反洗钱检测方法 |
CN114493864A (zh) * | 2022-01-04 | 2022-05-13 | 中科金审(北京)科技有限公司 | 一种基于资金大数据异常检测***及方法 |
CN114119026A (zh) * | 2022-01-26 | 2022-03-01 | 成都无糖信息技术有限公司 | 一种虚拟货币交易追踪溯源方法及*** |
CN115631042A (zh) * | 2022-10-29 | 2023-01-20 | 复旦大学 | 一种面向账户模型区块链的风险交易检测方法 |
CN115439030A (zh) * | 2022-11-09 | 2022-12-06 | 山东民昊健康科技有限公司 | 一种基于大数据分析的资金往来信息管理*** |
CN116957598A (zh) * | 2023-06-02 | 2023-10-27 | 华侨大学 | 一种基于路径束的可疑资金流向追溯方法及*** |
Non-Patent Citations (3)
Title |
---|
TRacer: Scalable Graph-Based Transaction Tracing for Account-Based Blockchain Trading Systems;Wu, ZY等;《IEEE TRANSACTIONS ON INFORMATION FORENSICS AND SECURITY》;20230612;第18卷;全文 * |
商业银行资金异常识别研究;刘璇;张朋柱;李嘉;陈智高;;***管理学报;20130515(第03期);全文 * |
基于互联网金融的反洗钱模型探索;王达山;;金融电子化;20160315(03);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN117808601A (zh) | 2024-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109461078B (zh) | 一种基于资金交易网络的异常交易识别方法及*** | |
CN109948704A (zh) | 一种交易监测方法与装置 | |
CN110852878B (zh) | 一种可信度确定方法、装置、设备和存储介质 | |
CN101236638A (zh) | 一种基于Web的银行卡风险监测方法及*** | |
CN111476660A (zh) | 一种基于数据分析的智能风控***及方法 | |
CN112116464B (zh) | 基于事件序列频繁项集的异常交易行为分析方法和*** | |
CN111553563A (zh) | 企业欺诈风险的确定方法及装置 | |
CN110675078A (zh) | 上市公司风险诊断方法、***、计算机终端及存储介质 | |
Zhang et al. | A study on SMIE credit evaluation model based on blockchain technology | |
CN112581270A (zh) | 风险账户的识别方法、装置、电子设备和存储介质 | |
CN117829994A (zh) | 一种基于图计算的洗钱风险分析方法 | |
CN117808601B (zh) | 一种基于大数据的资金追溯方法及*** | |
CN109919667A (zh) | 一种用于识别企业ip的方法和装置 | |
CN108198073A (zh) | 一种股权融资的投后管理方法及*** | |
KR20210155501A (ko) | 중소기업 매출채권 감소 및 부실방지를 위한 빅데이터 기반 매출채권회수지원 시스템 | |
KR101710649B1 (ko) | 네트워크 자동 추론을 통한 기업 가치 측정 서비스 시스템 | |
CN109360085A (zh) | 一种银行客户尽职调查方法及*** | |
CN115689564A (zh) | 一种基于大数据的线上支付信息安全管理***及方法 | |
CN114971912A (zh) | 一种资金交易中账户特征分析方法、***和存储介质 | |
CN114493864A (zh) | 一种基于资金大数据异常检测***及方法 | |
CN114529402A (zh) | 一种基于大数据风控的信贷管理方法、设备及介质 | |
CN110738570A (zh) | 基于多通道异质数据的信息型操纵自动识别方法 | |
Salhi et al. | Alarm system for credit losses impairment under IFRS 9 | |
CN117688055B (zh) | 一种基于关联网络分析技术的保险黑产识别与应对*** | |
KR102566466B1 (ko) | 개인의 신용도 평가를 위한 대체 신용 평가 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |