CN111160745A - 用户账户数据的处理方法及装置 - Google Patents

用户账户数据的处理方法及装置 Download PDF

Info

Publication number
CN111160745A
CN111160745A CN201911334802.5A CN201911334802A CN111160745A CN 111160745 A CN111160745 A CN 111160745A CN 201911334802 A CN201911334802 A CN 201911334802A CN 111160745 A CN111160745 A CN 111160745A
Authority
CN
China
Prior art keywords
user account
account data
information
account
risk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911334802.5A
Other languages
English (en)
Inventor
刘永波
唐啸
肖雷
曾凡麟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
Original Assignee
China Construction Bank Corp
CCB Finetech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Bank Corp, CCB Finetech Co Ltd filed Critical China Construction Bank Corp
Priority to CN201911334802.5A priority Critical patent/CN111160745A/zh
Publication of CN111160745A publication Critical patent/CN111160745A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明公开了一种用户账户数据的处理方法及装置,其中,该方法包括:获取用户账户数据,用户账户数据包括:用户工商信息、账户基本信息、账户资金信息、司法信息;将用户账户数据输入至预先训练的风险识别模型,以输出账户风险信息;根据账户风险信息执行预警操作。通过本发明,可以快速地预测该账户是否存在风险,从而可以高效地协助有权机关办案。

Description

用户账户数据的处理方法及装置
技术领域
本发明涉及数据处理领域,具体涉及一种用户账户数据的处理方法及装置。
背景技术
随着国家打击电信网络违法犯罪工作力度的加大,个人开户及账户交易得到 严格管控,主要存在以下技术问题:通过EXCEL(电子表格)导出大量的涉案对 公账户资金交易明细,通过编写宏来统计分析对公账户的关系,耗时又费力。
目前银行***已经通过知识图谱技术建立了“账户-资金往来-企业关系”,银 行协助有权机关办理案件,主要通过统计分析工具来对账户资金来往、账户信息 进行分析,但是耗时较长且差错率较高。
发明内容
有鉴于此,本发明提供一种用户账户数据的处理方法及装置,以解决上述提 及的至少一个问题。
根据本发明的第一方面,提供一种用户账户数据的处理方法,所述方法包括: 获取用户账户数据,所述用户账户数据包括:用户工商信息、账户基本信息、账 户资金信息、司法信息;将所述用户账户数据输入至预先训练的风险识别模型, 以输出账户风险信息;根据所述账户风险信息执行预警操作。
根据本发明的第二方面,提供一种用户账户数据的处理装置,所述装置包括: 数据获取单元,用于获取用户账户数据,所述用户账户数据包括:用户工商信息、 账户基本信息、账户资金信息、司法信息;风险信息输出单元,用于将所述用户 账户数据输入至预先训练的风险识别模型,以输出账户风险信息;预警单元,用 于根据所述账户风险信息执行预警操作。
根据本发明的第三方面,提供一种电子设备,包括存储器、处理器及存储在 存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上 述用户账户数据的处理方法的步骤。
根据本发明的第四方面,本发明提供一种计算机可读存储介质,其上存储有 计算机程序,该计算机程序被处理器执行时实现上述用户账户数据的处理方法的 步骤。
由上述技术方案可知,通过将获取的用户账户数据输入到预先训练的风险识 别模型,以预测该账户的风险,并根据该风险信息执行相应的预警操作,由于用 户账户数据包括了用户工商信息、账户基本信息、账户资金信息和司法信息,因 而可以快速地预测该账户是否存在风险,从而可以高效地协助有权机关办案。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例 或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的 附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳 动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的用户账户数据的处理方法的流程图;
图2是根据本发明实施例的风险识别模型构建示意图;
图3是根据本发明实施例的账户涉案预测概率的详细流程示意图;
图4是根据本发明实施例的用户账户数据的处理装置的结构框图;
图5是根据本发明实施例的用户账户数据的处理装置的详细结构框图;
图6是根据本发明实施例的模型训练单元46的结构框图;
图7是根据本发明实施例的电子设备的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实 施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所 描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实 施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施 例,都属于本发明保护的范围。
目前,对于虚假对公账户的追踪,银行***已经建立了“账户-资金往来-企业 关系”的关联信息,然而该关联信息中还缺乏案件与有权机关的相关信息,不足 以全面表达虚假对公账户的上下关系,导致在协助有权机关办案的过程中,耗时 较长且差错率较高。并且,由于对公企业关系数据在工商机关,账户资金交易以 及协查案件信息在银行***,因此,有权机关方也无法对案件关联实体进行整体 关系的分析,这里的有权机关包括:省、市、县的公安、高院、监察委、***、 银***等。基于此,本发明实施例提供一种用户账户数据的处理方法,以克服 上述问题。
本发明实施例提供了一种用户账户数据的处理方法,图1是该方法的流程图, 如图1所示,该方法包括:
步骤101,获取用户账户数据,所述用户账户数据包括:用户工商信息、账户 基本信息、账户资金信息、司法信息。
这里的用户工商信息可以是企业的工商信息。
账户基本信息包括:企业名称、企业编号、统一信用代码、单位地址、注册 时间、注册地等。
账户资金信息包括:该账户的资金变化信息、及与该资金变化相关的账户信 息。
司法信息包括:该账户的被有权机关查询次数、冻结次数、扣划次数,风险 等级、风险状态等。
步骤102,将所述用户账户数据输入至预先训练的风险识别模型,以输出账户 风险信息。
步骤103,根据所述账户风险信息执行预警操作。
通过将获取的用户账户数据输入到预先训练的风险识别模型,以预测该账户 的风险,并根据该风险信息执行相应的预警操作,由于用户账户数据包括了用户 工商信息、账户基本信息、账户资金信息和司法信息,因而可以快速地预测该账 户是否存在风险,即,是否为虚假对公账户,从而可以高效地协助有权机关办案。
在实际操作中,可以基于图数据结构构建所述用户账户数据的知识图谱。根 据用户账户数据中的用户工商信息、账户基本信息、账户资金信息、司法信息构 建“企业-账户-有权机关-资金”的知识图谱,使得案件的上下关系更加全面,便 于有权机关的分析。
在步骤103之后,可以根据所述预警操作对用户账户数据的知识图谱进行更 新。具体而言,当风险识别模型识别出虚假账户、进行司法查冻扣信息反查关联 账户时,更新知识图谱。
例如,当某个有权机关对某个账号做一笔查询(或冻结、扣划)业务时,银 行协查***会发送分布式消息,***通知更新知识图谱,知识图谱***在收到消 息后将该账号的属性“被有权机关查询次数”加1。
在一个实施例中,当银行业务***维护用户(或称为客户)与账户信息、产 生资金流水时,业务***会发布分布式消息。后台定时任务异步订阅消息,同时 更新上述知识图谱。
例如,银行账务***发生从一个账号转账到另一个账号的业务时,银行账务 ***会发送一笔分布式消息,通知更新知识图谱,知识图谱***在收到消息后将 增加该账号到另一账号的借关系,同时赋值借关系属性“金额、笔数、时间段、 金额占比、笔数占比”等。
上述的风险识别模型可以通过如下方式训练:获取多个历史用户账户数据, 并提取各历史用户账户数据的特征信息;根据所述特征信息生成训练集、验证集 和测试集;根据所述训练集对所述风险识别模型进行训练。
在实际操作中,可以预先选择多个识别模型,根据上述生成的训练集分别对 多个识别模型进行训练,并根据测试集和验证集对训练的多个识别模型进行预测 和验证,从预测和验证结果中选择效果最优的识别模型为风险识别模型。
在一个实施例中,还可以根据预定规则对所述风险识别模型进行调优操作。 这里的预定规则可以是专家法或者专家经验。
以下基于银行对公账户为例,结合图2所示的风险识别模型构建示意图来详 细描述本发明实施例。
如图2所示,风险识别模型构建包括如下几个步骤:
步骤21:构建企业账户资金有权机关知识图谱。
(1)使用图数据库存储企业(即,银行对公客户)、银行账号、有权机关等 实体以及实体之间的关系。具体而言,存储企业工商信息、企业账户信息、资金 往来信息以及有权机关司法查询冻结扣划信息等信息。
上述银行对公客户信息包括:客户名称、客户编号、统一信用代码、单位地 址、注册时间、注册地、被有权机关查询、风险等级、风险状态等。
银行账号信息包括:被有权机关查询次数、冻结次数、扣划次数,风险等级、 风险状态等。
上述的实体之间的关系如下所示:
实体关系实体
对公客户→名下账号→账号
对公客户→法人→对公客户
对公客户→投资→对公客户
对公客户→担保→对公客户
对公客户→分支机构→对公客户
账号→借→账号
账号→贷→账号
账号→共用终端→账号
账号→共用IP→账号
账号→共用MAC→账号
图数据库存储以上实体及实体属性、实体与实体间的关系、关系及关系属性, 其中:
(1)实体及实体的属性如下所示:
实体-银行对公客户的属性包括:客户名称、客户编号、统一信用代码、单位 地址、注册时间、注册地、被有权机关查询、风险等级、风险状态等。
实体-账号的属性包括:被有权机关查询次数、冻结次数、扣划次数,风险等 级、风险状态等。
实体-有权机关的属性包括:有权机关类型(公安、高院、监察委、***、 银***)、地区(省、市、县)等。
(2)实体与实体间的关系如下所示:
实体关系实体
对公客户→名下账号→账号
对公客户→法人→对公客户
对公客户→投资→对公客户
对公客户→担保→对公客户
对公客户→分支机构→对公客户
账号→借→账号
账号→贷→账号
账号→共用终端→账号
账号→共用IP→账号
账号→共用MAC→账号
(3)关系及关系属性如下所示:
关系-名下账号
关系-法人
关系-投资,属性:投资比例、投资金额、投资日期、币种
关系-担保,属性:担保金额、币种
分支机构
关系-借,属性:金额、笔数、时间段、金额占比、笔数占比
关系-贷,属性:金额、笔数、时间段、金额占比、笔数占比
关系-共用终端,属性:次数
关系-共用IP,属性:次数
关系-共用MAC,属性:次数
基于上述信息完成知识图谱之后,当账户信息或资金发生变化、有权机关对 于该账户存在查扣等操作时,更新知识图谱。
步骤22:构建特征工程。
建立对公账户的特征库,为每个对公账户抽取特征,根据抽取的特征,对对 公账户进行特征表示。
具体而言,根据已知的涉案账户,查询其相关交易信息、IP(Internet Protocol,互联网协议)信息、MAC(Media Access Control Address,局域网地址)信息等账 户信息和法定代表人等企业相关人员信息。
根据上述查询到的信息,继续查询与其存在实控、高管、法人、投资、担保 关系的个人和企业,及其在线上渠道登陆使用的IP段、注册登记等来源获得的地 址等,并拓展探查多度关系及相关信息,包括相关人年龄、籍贯,企业注册时间 等。
步骤23:模型构建。
(1)抽取样本特征,进行样本特征标记,生成训练样本。
(2)进行模型训练。具体而言,可以采用多种机器学习模型进行训练,得出 每种模型的评估指标,并根据模型效果进行模型调优,选择较优的虚假对公开户 模型(即,上述风险识别模型)。
在本发明实施例中,上述机器学习模型可以是:
XGBoost(eXtreme Gradient Boosting,极端梯度提升)模型,XGBoost是GBDT(gradient boosting decision tree,梯度提升迭代决策树)的改进,既可以用于分类 也可以用于回归问题。
LR(Logistic Regression,逻辑回归)模型,是从特征学习出一个0/1分类模 型,这个模型是将特性的线性组合作为自变量。
RF(Random Forest,随机森林)模型,是利用多棵树对样本进行训练并预测 的一种分类器。
对上述模型的评估指标包括如下三种:Precision(精确率)、Recall(召回率)、 F1score(F1值),其中:
Precision:用于预测正确的正例数据占预测为正例数据的比例;
Recall:用于预测为正例的数据占实际为正例数据的比例;
F1-score:用于综合考虑precision值和recall值的指标。多类别分类时,有宏 平均(macro-average)和微平均(micro-average)两种。
对于训练集样本训练出的模型,通过验证集进行模型预测,根据预测结果计 算模型的评估指标,对于评估指标达不到预期的数值,则重新调整模型的变量, 经过训练与验证后计算模型的评估指标值。这样循环往复,直到模型的评估指标 值达到预期的数据为止。
(3)通过实际涉案对公账户信息,根据涉案账户关联的账户信息,预处理这 些账户的特征工程,通过模型预测输出账户涉案概率,通过专家审核分析结果反 馈账户涉案情况,调整模型参数,以得到最优的模型。
在实际操作中,对公虚假开户涉案账户是由公安机关提供的已经明确为涉案 的账户,但对公虚假开户一般是团伙做案。公安机关给定一个涉案账户后,需要 金融机构提供关联的涉案嫌疑账户。在上述构建的“企业-账户-在权机关-资金” 的关系图中,通过名下账号、法人、联系方式、实际控制人、疑似股权实际控制 人、高管、投资、担保、分支机构、借、贷、共用终端、共用IP、共用MAC、配 偶、亲属等关系,设定筛选的关系层级值,若在关系层级范围内,与涉案账户存 在以上任何一种关系,则认为该账户是涉案账户关联账户。
根据特征工程建立的帐户特征信息,主要包括:过渡账户、虚假对公开户同 区域、虚构注册地址、被司法查控、高频资金汇集账户、涉案账户干系人、开户 时间、开户机构、客户年龄、联系方式、交易笔数、交易金额、借贷比例、对手 账户数量、摘要种类数量、交易时间分布、交易IP分布、交易余额、对手账户对 公对私、对手账户行内行外等,将涉案账户关联账户的特征信息按照模型预测要 求的待预测集格式(例如,账户ID,特征1值,特征2值....)进行处理。
利用调优后的模型,将待预测集作为模型输入,模型运行输出待预测账户的 涉案概率。案件侦办专家根据案件实际发生结果,对预测的结果反馈账户是否涉 案,计算模型评估指标,根据指标数据结果按照一定步长调整模型的变量,同时 将实际的涉案账户纳入到样本数据,重新训练与验证模型。
图3是根据本发明实施例的账户涉案预测概率的详细流程示意图,如图3所 示,首先需要获取公安历史涉案对公账户信息和行内核心风险数据库数据,以用 于如下流程:
步骤1,根据账户原始样本选取本年周期的数据,该数据包括:账户ID、原 始特征、标签等。
步骤2,进行数据探索和预处理,主要是统计分析字段、标签数量分布。
步骤3,进行特征工程操作,对数据的特征进行加工和特征选择,具体包括:
步骤3.1,根据账户历史交易进行特征提取;
步骤3.2,对账户基本静态特征进行提取;
步骤3.3,对核心风险库风险特征进行提取,这里的风险特征包括:查冻扣信 息和风险等级;
根据步骤3的特征工程操作生成特征表。
步骤4,根据特征表中的数据生成最终训练样本数据。
步骤5,切分训练集、测试集和验证集数据。
步骤6,采用多种模型进行模型训练操作,并进行比对,这里采用的多种模型 包括:LR模型、RF模型和XGBoost模型。
步骤7,根据测试集基于评估指标评估各模型效果,并根据效果对步骤6中采 用的模型进行调优操作;
步骤8,根据步骤7的模型调优操作,得到最优模型,生成模型文件;
在得到最优模型后,就可以使用该最优模型,对新的公安涉案对公账户信息 和行内账户信息进行账户涉案预测操作,具体包括如下步骤:
步骤9,查询过滤涉案账户的关联账户信息;
步骤10,对查询到的数据进行预处理和特征工程操作,之后将预处理和特征 工程操作后的数据发送至步骤8中的模型文件,进行预测。
步骤11,预测账户涉案概率。
步骤12,进行人工复核操作。
由以上描述可知,通过建立上述模型,并通过专家法对模型进行调优处理, 使得最优模型能够快速预测不法分子创造多种多样的案件场景,实现对多种案件 类型的分析。
基于相似的发明构思,本发明实施例还提供一种用户账户数据的处理装置, 优选地,该装置用于实现上述方法实施例的步骤。
图4是根据本发明实施例的用户账户数据的处理装置的结构框图,如图4所 示,该装置包括:数据获取单元41、风险信息输出单元42和预警单元43,其中:
数据获取单元41,用于获取用户账户数据,所述用户账户数据包括:用户工 商信息、账户基本信息、账户资金信息、司法信息;
风险信息输出单元42,用于将所述用户账户数据输入至预先训练的风险识别 模型,以输出账户风险信息;
预警单元43,用于根据所述账户风险信息执行预警操作。
通过风险信息输出单元42将数据获取单元41获取的用户账户数据输入到预 先训练的风险识别模型,以预测该账户的风险,预警单元43根据该风险信息执行 相应的预警操作,由于用户账户数据包括了用户工商信息、账户基本信息、账户 资金信息和司法信息,因而可以快速地预测该账户是否存在风险,即,是否为虚 假对公账户,从而可以高效地协助有权机关办案。
在实际操作中,如图5所示,上述装置还包括:知识图谱构建单元44和知识 图谱更新单元45,其中:
知识图谱构建单元44,用于基于图数据结构构建所述用户账户数据的知识图 谱。
具体而言,知识图谱构建单元44根据用户账户数据中的用户工商信息、账户 基本信息、账户资金信息、司法信息构建“企业-账户-有权机关-资金”的知识图 谱,使得案件的上下关系更加全面,便于有权机关的分析。
知识图谱更新单元45,用于根据所述预警操作对所述用户账户数据的知识图 谱进行更新。也就是说,当风险识别模型识别出虚假账户、进行司法查冻扣信息 反查关联账户时,知识图谱更新单元45更新知识图谱。
在一个实施例中,当银行业务***维护用户(或称为客户)与账户信息、产 生资金流水、司法有权机关发起查冻扣业务时,业务***会发布分布式消息。后 台定时任务异步订阅消息,同时知识图谱更新单元45更新上述知识图谱。
继续参见图5,上述装置还包括:模型训练单元46,用于训练所述风险识别 模型。
图6是模型训练单元46的结构框图,如图6所示,该模型训练单元46包括: 历史数据获取模块461、特征提取模块462、训练集生成模块463和模型训练模块 464,其中:
历史数据获取模块461,用于获取多个历史用户账户数据;
特征提取模块462,用于提取各历史用户账户数据的特征信息;
训练集生成模块463,用于根据所述特征信息生成训练集;
模型训练模块464,用于根据所述训练集对所述风险识别模型进行训练。
具体地,模型训练模块464包括:验证测试集生成子模块4641、模型训练子 模块4642和风险识别模型确定子模块4643,其中:
验证测试集生成子模块4641,用于根据所述特征信息生成验证集和测试集;
模型训练子模块4642,用于根据所述训练集分别对预先选择的多个识别模型 进行训练;
风险识别模型确定子模块4643,用于根据所述验证集和测试集从训练的多个 识别模型中确定所述风险识别模型。具体地,风险识别模型确定子模块4643根据 测试集和验证集对训练的多个识别模型进行预测和验证,从预测和验证结果中选 择效果最优的识别模型为风险识别模型。
继续参见图5,上述装置还包括:调优单元47,用于根据预定规则对所述风 险识别模型进行调优操作。这里的预定规则可以是专家经验,通过调优单元47可 以对风险识别模型进一步进行调优操作,以得到更准确地预测效果。
上述各单元、各模块、各子模块的具体执行过程,可以参见上述方法实施例 中的描述,此处不再赘述。
在实际操作中,上述各单元、各模块、各子模块可以组合设置、也可以单一 设置,本发明不限于此。
图7是根据本发明实施例的电子设备的示意图。图7所示的电子设备为通用 数据处理装置,其包括通用的计算机硬件结构,其至少包括处理器701和存储器 702。处理器701和存储器702通过总线703连接。存储器702适于存储处理器701 可执行的一条或多条指令或程序。该一条或多条指令或程序被处理器701执行以 实现上述用户账户数据的处理方法中的步骤。
上述处理器701可以是独立的微处理器,也可以是一个或者多个微处理器集 合。由此,处理器701通过执行存储器702所存储的命令,从而执行如上所述的 本发明实施例的方法流程实现对于数据的处理和对于其他装置的控制。总线703 将上述多个组件连接在一起,同时将上述组件连接到显示控制器704和显示装置 以及输入/输出(I/O)装置705。输入/输出(I/O)装置705可以是鼠标、键盘、 调制解调器、网络接口、触控输入装置、体感输入装置、打印机以及本领域公知 的其他装置。典型地,输入/输出(I/O)装置705通过输入/输出(I/O)控制器706 与***相连。
其中,存储器702可以存储软件组件,例如操作***、通信模块、交互模块 以及应用程序。以上所述的每个模块和应用程序都对应于完成一个或多个功能和 在发明实施例中描述的方法的一组可执行程序指令。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该 计算机程序被处理器执行时以实现上述用户账户数据的处理方法的步骤。
综上所述,本发明实施例提供了一种用户账户数据的处理方案,通过司法查 冻扣信息、企业账户关系信息、账户资金来往信息为基础建立了“企业-账户-有权 机关-资金”的知识图谱,使得案件的上下文关系更加全面;并且,通过建立虚假 对公账户识别模型,基于专家法对模型进行调整,使得虚假对公账户能快速响应 不法分子创造多种多样的案件场景;以及,建立了基于专家法与机器学习算法的 特征工程,抽取并表示了“企业-账户-有权机关-资金”实体的特征,从而可以满 足多种案件类型的分析。相比于现有技术,本发明实施例可以协助有权机关方有 效地对案件关联实体进行整体关系的分析,较为准确地预测虚假对公账户。
以上参照附图描述了本发明的优选实施方式。这些实施方式的许多特征和优 点根据该详细的说明书是清楚的,因此权利要求旨在覆盖这些实施方式的落入其 真实精神和范围内的所有这些特征和优点。此外,由于本领域的技术人员容易想 到很多修改和改变,因此不是要将本发明的实施方式限于所例示和描述的精确结 构和操作,而是可以涵盖落入其范围内的所有合适修改和等同物。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算 机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软 件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计 算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、 光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品 的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框 图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可 提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编 程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处 理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框 图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以 特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令 产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或 方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得 在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从 而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多 个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实 施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的 一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之 处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (14)

1.一种用户账户数据的处理方法,其特征在于,所述方法包括:
获取用户账户数据,所述用户账户数据包括:用户工商信息、账户基本信息、账户资金信息、司法信息;
将所述用户账户数据输入至预先训练的风险识别模型,以输出账户风险信息;
根据所述账户风险信息执行预警操作。
2.根据权利要求1所述的用户账户数据的处理方法,其特征在于,所述方法还包括:
基于图数据结构构建所述用户账户数据的知识图谱。
3.根据权利要求2所述的用户账户数据的处理方法,其特征在于,根据所述账户风险信息执行预警操作之后,所述方法还包括:
根据所述预警操作对所述用户账户数据的知识图谱进行更新。
4.根据权利要求1所述的用户账户数据的处理方法,其特征在于,所述风险识别模型通过如下方式训练:
获取多个历史用户账户数据,并提取各历史用户账户数据的特征信息;
根据所述特征信息生成训练集;
根据所述训练集对所述风险识别模型进行训练。
5.根据权利要求4所述的用户账户数据的处理方法,其特征在于,所述方法还包括:
根据预定规则对所述风险识别模型进行调优操作。
6.根据权利要求5所述的用户账户数据的处理方法,其特征在于,根据所述训练集对所述风险识别模型进行训练包括:
根据所述特征信息生成验证集和测试集;
根据所述训练集分别对预先选择的多个识别模型进行训练;
根据所述验证集和测试集从训练的多个识别模型中确定所述风险识别模型。
7.一种用户账户数据的处理装置,其特征在于,所述装置包括:
数据获取单元,用于获取用户账户数据,所述用户账户数据包括:用户工商信息、账户基本信息、账户资金信息、司法信息;
风险信息输出单元,用于将所述用户账户数据输入至预先训练的风险识别模型,以输出账户风险信息;
预警单元,用于根据所述账户风险信息执行预警操作。
8.根据权利要求7所述的用户账户数据的处理装置,其特征在于,所述装置还包括:
知识图谱构建单元,用于基于图数据结构构建所述用户账户数据的知识图谱。
9.根据权利要求8所述的用户账户数据的处理装置,其特征在于,所述装置还包括:
知识图谱更新单元,用于根据所述预警操作对所述用户账户数据的知识图谱进行更新。
10.根据权利要求7所述的用户账户数据的处理装置,其特征在于,所述装置还包括:模型训练单元,用于训练所述风险识别模型,
所述模型训练单元包括:
历史数据获取模块,用于获取多个历史用户账户数据;
特征提取模块,用于提取各历史用户账户数据的特征信息;
训练集生成模块,用于根据所述特征信息生成训练集;
模型训练模块,用于根据所述训练集对所述风险识别模型进行训练。
11.根据权利要求10所述的用户账户数据的处理装置,其特征在于,所述装置还包括:
调优单元,用于根据预定规则对所述风险识别模型进行调优操作。
12.根据权利要求11所述的用户账户数据的处理装置,其特征在于,所述模型训练模块包括:
验证测试集生成子模块,用于根据所述特征信息生成验证集和测试集;
模型训练子模块,用于根据所述训练集分别对预先选择的多个识别模型进行训练;
风险识别模型确定子模块,用于根据所述验证集和测试集从训练的多个识别模型中确定所述风险识别模型。
13.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至6中任一项所述用户账户数据的处理方法的步骤。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述用户账户数据的处理方法的步骤。
CN201911334802.5A 2019-12-23 2019-12-23 用户账户数据的处理方法及装置 Pending CN111160745A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911334802.5A CN111160745A (zh) 2019-12-23 2019-12-23 用户账户数据的处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911334802.5A CN111160745A (zh) 2019-12-23 2019-12-23 用户账户数据的处理方法及装置

Publications (1)

Publication Number Publication Date
CN111160745A true CN111160745A (zh) 2020-05-15

Family

ID=70557654

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911334802.5A Pending CN111160745A (zh) 2019-12-23 2019-12-23 用户账户数据的处理方法及装置

Country Status (1)

Country Link
CN (1) CN111160745A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112053237A (zh) * 2020-09-30 2020-12-08 中国银行股份有限公司 一种银行对公客户的工商信息识别方法、装置及设备
CN112150139A (zh) * 2020-09-30 2020-12-29 中国银行股份有限公司 一种数据分析方法及装置
CN112488719A (zh) * 2020-11-17 2021-03-12 中信银行股份有限公司 一种账户风险识别方法和装置
CN112766974A (zh) * 2021-01-19 2021-05-07 中国农业银行股份有限公司广州分行 风险账户识别方法、装置、计算机设备和存储介质
CN113051409A (zh) * 2021-04-09 2021-06-29 北京基智科技有限公司 基于多维度信息计算的知产行业商机推荐***及存储介质
CN113643123A (zh) * 2021-08-23 2021-11-12 中国农业银行股份有限公司佛山分行 一种银行的线上开户方法及线上开户***
CN113837886A (zh) * 2021-09-16 2021-12-24 之江实验室 一种基于知识图谱的车险理赔欺诈风险识别方法和***
CN116402512A (zh) * 2023-05-31 2023-07-07 无锡锡商银行股份有限公司 一种基于人工智能的账户安全排查管理方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160328710A1 (en) * 2010-10-19 2016-11-10 The 41St Parameter, Inc. Variable risk engine
CN107316198A (zh) * 2016-04-26 2017-11-03 阿里巴巴集团控股有限公司 账户风险识别方法及装置
US20180013777A1 (en) * 2016-07-08 2018-01-11 Accenture Global Solutions Limited Identifying network security risks
CN109003089A (zh) * 2018-06-28 2018-12-14 中国工商银行股份有限公司 风险识别方法及装置
CN110033279A (zh) * 2019-04-04 2019-07-19 银清科技(北京)有限公司 基于知识图谱技术的可疑账户交易确认方法及装置
CN110046993A (zh) * 2018-12-15 2019-07-23 深圳壹账通智能科技有限公司 非法所得合法化行为监测方法、***、计算机装置及介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160328710A1 (en) * 2010-10-19 2016-11-10 The 41St Parameter, Inc. Variable risk engine
CN107316198A (zh) * 2016-04-26 2017-11-03 阿里巴巴集团控股有限公司 账户风险识别方法及装置
US20180013777A1 (en) * 2016-07-08 2018-01-11 Accenture Global Solutions Limited Identifying network security risks
CN109003089A (zh) * 2018-06-28 2018-12-14 中国工商银行股份有限公司 风险识别方法及装置
CN110046993A (zh) * 2018-12-15 2019-07-23 深圳壹账通智能科技有限公司 非法所得合法化行为监测方法、***、计算机装置及介质
CN110033279A (zh) * 2019-04-04 2019-07-19 银清科技(北京)有限公司 基于知识图谱技术的可疑账户交易确认方法及装置

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112053237A (zh) * 2020-09-30 2020-12-08 中国银行股份有限公司 一种银行对公客户的工商信息识别方法、装置及设备
CN112150139A (zh) * 2020-09-30 2020-12-29 中国银行股份有限公司 一种数据分析方法及装置
CN112150139B (zh) * 2020-09-30 2023-09-26 中国银行股份有限公司 一种数据分析方法及装置
CN112053237B (zh) * 2020-09-30 2024-02-02 中国银行股份有限公司 一种银行对公客户的工商信息识别方法、装置及设备
CN112488719A (zh) * 2020-11-17 2021-03-12 中信银行股份有限公司 一种账户风险识别方法和装置
CN112766974A (zh) * 2021-01-19 2021-05-07 中国农业银行股份有限公司广州分行 风险账户识别方法、装置、计算机设备和存储介质
CN113051409A (zh) * 2021-04-09 2021-06-29 北京基智科技有限公司 基于多维度信息计算的知产行业商机推荐***及存储介质
CN113643123A (zh) * 2021-08-23 2021-11-12 中国农业银行股份有限公司佛山分行 一种银行的线上开户方法及线上开户***
CN113837886A (zh) * 2021-09-16 2021-12-24 之江实验室 一种基于知识图谱的车险理赔欺诈风险识别方法和***
CN113837886B (zh) * 2021-09-16 2024-05-31 之江实验室 一种基于知识图谱的车险理赔欺诈风险识别方法和***
CN116402512A (zh) * 2023-05-31 2023-07-07 无锡锡商银行股份有限公司 一种基于人工智能的账户安全排查管理方法
CN116402512B (zh) * 2023-05-31 2023-08-22 无锡锡商银行股份有限公司 一种基于人工智能的账户安全排查管理方法

Similar Documents

Publication Publication Date Title
CN111160745A (zh) 用户账户数据的处理方法及装置
Ntakaris et al. Benchmark dataset for mid‐price forecasting of limit order book data with machine learning methods
CN110998608B (zh) 用于各种计算机应用程序的机器学习***
US7930242B2 (en) Methods and systems for multi-credit reporting agency data modeling
CN110633316A (zh) 一种多场景融合双随机市场监管方法
US20230237583A1 (en) System and method for implementing a trust discretionary distribution tool
CN113609193A (zh) 训练用于预测客户交易行为的预测模型的方法及装置
CN111951050A (zh) 理财产品推荐方法及装置
US11995667B2 (en) Systems and methods for business analytics model scoring and selection
CN113822488A (zh) 融资租赁的风险预测方法、装置、计算机设备及存储介质
Kumar et al. Credit score prediction system using deep learning and k-means algorithms
US20200184344A1 (en) System and method for measuring model efficacy in highly regulated environments
CN117132383A (zh) 一种信贷数据处理方法、装置、设备及可读存储介质
KR20110114181A (ko) 예측 정확성이 향상된 대출 심사 방법
CN109636627B (zh) 基于区块链的保险产品管理方法、装置、介质及电子设备
CN116664306A (zh) 风控规则的智能推荐方法、装置、电子设备及介质
CN115952186A (zh) 一种问题数据及其链路追溯方法及装置
Zang Construction of Mobile Internet Financial Risk Cautioning Framework Based on BP Neural Network
CN114612239A (zh) 基于算法、大数据、人工智能的股票舆情监测和风控***
Bai et al. Commercial Bank Credit Grading Model Using Genetic Optimization Neural Network and Cluster Analysis
CN114331728A (zh) 一种证券分析管理***
CN114048330A (zh) 风险传导概率知识图谱生成方法、装置、设备及存储介质
Danenas Intelligent financial fraud detection and analysis: a survey of recent patents
Mendes Forecasting bitcoin prices: ARIMA vs LSTM
Lee PREDICTIVE ANALYTICS: the New Tool to Combat Fraud, Waste and Abuse.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20220909

Address after: 25 Financial Street, Xicheng District, Beijing 100033

Applicant after: CHINA CONSTRUCTION BANK Corp.

Address before: 25 Financial Street, Xicheng District, Beijing 100033

Applicant before: CHINA CONSTRUCTION BANK Corp.

Applicant before: Jianxin Financial Science and Technology Co.,Ltd.

TA01 Transfer of patent application right
RJ01 Rejection of invention patent application after publication

Application publication date: 20200515

RJ01 Rejection of invention patent application after publication