CN111461865B - 一种数据分析方法及装置 - Google Patents

一种数据分析方法及装置 Download PDF

Info

Publication number
CN111461865B
CN111461865B CN202010246736.2A CN202010246736A CN111461865B CN 111461865 B CN111461865 B CN 111461865B CN 202010246736 A CN202010246736 A CN 202010246736A CN 111461865 B CN111461865 B CN 111461865B
Authority
CN
China
Prior art keywords
target object
consumption
information
risk
consumption information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010246736.2A
Other languages
English (en)
Other versions
CN111461865A (zh
Inventor
黄文强
季蕴青
胡路苹
胡玮
黄雅楠
胡传杰
浮晨琪
李蚌蚌
申亚坤
王畅畅
徐晨敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bank of China Ltd
Original Assignee
Bank of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank of China Ltd filed Critical Bank of China Ltd
Priority to CN202010246736.2A priority Critical patent/CN111461865B/zh
Publication of CN111461865A publication Critical patent/CN111461865A/zh
Application granted granted Critical
Publication of CN111461865B publication Critical patent/CN111461865B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Finance (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Accounting & Taxation (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明公开了一种数据分析方法及装置,包括筛选高风险目标对象,获取高风险目标对象在第一时间段内的消费信息和目标对象所属客户的基本信息;将高风险的目标对象在第一时间段内的消费信息和所述高风险目标对象所属客户的基本信息输入到预设的消费预测模型中,得到高风险目标对象在第二时间段内的消费信息;基于高风险目标对象在第二时间段内真实的消费信息、目标对象在第二时间段内预测的消费信息以及预设的评分模型,得到高风险目标对象的评分结果,基于高风险目标对象的评分与预设的阈值的关系,确定高风险目标对象是否存在异常消费情况。这样,这样能够及时发现***可能会出现的被借用的风险,从而尽可能的降低银行承担的风险。

Description

一种数据分析方法及装置
技术领域
本发明涉及金融领域,尤其涉及一种数据分析方法及装置。
背景技术
随着生活水平的提高和消费观念的转变,***逐渐成为人们用于消费的一种方式。银行在发放***时,为了降低风险,银行会基于客户的还款能力,设定***的额度。
但是,现实生活中,经常会出现将***借给他人使用的情况,这种行为很有可能增加客户的还款压力,导致客户无法按时还款,这无形中也增加了银行的风险。
发明内容
有鉴于此,本发明实施例公开了一种数据分析方法及装置,通过对***消费情况的分析,预测是否出现了异常消费的风险。
本发明实施例公开了一种数据分析方法,包括:
获取目标对象的还款信息和目标对象对应的用户的身份信息;所述目标对象为借贷类产品;
基于目标对象的还款信息和目标对象所属的用户的身份信息,筛选高风险目标对象;所述高风险目标对象表示可能会存在异常消费的目标对象获取高风险目标对象在第一时间段内的消费信息和所述目标对象所属客户的基本信息;
将所述高风险的目标对象在第一时间段内的消费信息和所述高风险目标对象所属客户的基本信息输入到预设的消费预测模型中,得到高风险目标对象在第二时间段内的消费信息;
获取高风险目标对象在第二时间段内真实的消费信息;
基于所述高风险目标对象在第二时间段内真实的消费信息、预测的消费信息和预设的评分模型,得到高风险目标对象的评分结果;所述目标对象评分结果是基于所述真实消费信息和预测的消费信息之间的相关性确定的,所述评分模型是通过预设的第二数据集进行训练后得到的;
基于高风险目标对象的评分与预设的阈值的关系,确定所述高风险目标对象是否存在异常消费情况。
可选的,所述基于目标对象的还款信息和目标对象所属的用户的身份信息,筛选高风险目标对象,包括:
判断目标对象的还款信息和目标对象所属的用户的身份信息是否一致;
若目标对象的还款信息和目标对象所属用户的身份信息不一致,则表示所述目标对象为高风险目标对象。
可选的,所述评分模型的训练过程包括:
构建神经网络模型;
获取第二数据集;所述第二数据集包括高风险目标对象在同一时间段内真实的消费信息和预测的消费信息,所述第二数据集中的目标对象标记有评分结果;
获取所述神经网络的初始参数值;
基于所述神经网络的初始参数值和第二数据集对所述神经网络模型进行训练。
可选的,所述评分模型的训练过程包括:
获取计算真实消费信息中每个消费对象与预设的消费信息中每个消费对象匹配度的计算方法;
确定真实消费信息中每个消费对象的评分规则;
确定真实消费信息中所有消费对象的评分统计规则;
基于真实消费信息中每个消费对象与预设的消费信息中每个消费对象匹配度的计算方法、真实消费信息中没给消费对象的评分规则以及真实消费信息中所有消费对象的评分统计规则,训练预设的专家***。
可选的,所述基于高风险目标对象的评分与预设的阈值的关系,确定所述高风险客户是否存在异常消费情况,包括:
若高风险目标对象的评分大于预设阈值,则表示目标对象的消费行为未出现异常;
若高风险目标对象的评分小于等于预设的阈值,则表示目标对象的消费行为异常。
可选的,还包括:
确定第二时间段真实消费信息包括的消费对象的总数量;
基于第二时间段真实消费信息包括的消费对象的总数量,确定阈值。
可选的,还包括:
在检测到目标对象存在消费异常行为的情况下,监测目标对象的使用动态;
当监测到目标对象再次使用时,获取使用目标对象的消费者的人脸信息;
判断所述消费者的人脸信息是否与预设的所述目标对象所属的用户的人脸信息是否一致;
若述消费者的人脸信息是否与预设的所述目标对象所属的用户的人脸信息不一致,则向目标对象所属的用户发送消费异常提醒。
本发明实施例公开了一种数据分析装置,包括:
第一获取单元,用于获取目标对象的还款信息和目标对象对应的用户的身份信息;所述目标对象为借贷类产品;
筛选单元,用于基于目标对象的还款信息和目标对象所属的用户的身份信息,筛选高风险目标对象;所述高风险目标对象表示可能会存在异常消费的目标对象获取高风险目标对象在第一时间段内的消费信息和所述目标对象所属客户的基本信息;
第二获取单元,用于获取高风险目标对象在第一时间段内的消费信息和所述目标对象所属客户的基本信息;
消费预测模型,用于将所述高风险的目标对象在第一时间段内的消费信息和所述高风险目标对象所属客户的基本信息输入到预设的消费预测模型中,得到高风险目标对象在第二时间段内的消费信息;
第三获取单元,用于获取高风险目标对象在第二时间段内真实的消费信息;
评分结果确定单元,用于基于所述高风险目标对象在第二时间段内真实的消费信息、预测的消费信息和预设的评分模型,得到高风险目标对象的评分结果;所述目标对象评分结果是基于所述真实消费信息和预测的消费信息之间的相关性确定的,所述评分模型是通过预设的第二数据集进行训练后得到的;
异常消费识别单元,用于基于高风险目标对象的评分与预设的阈值的关系,确定所述高风险目标对象是否存在异常消费情况。
可选的,所述筛选单元,包括:
第一筛选子单元,用于判断目标对象的还款信息和目标对象所属的用户的身份信息是否一致;
第二筛选子单元,用于若目标对象的还款信息和目标对象所属用户的身份信息不一致,则表示所述目标对象为高风险目标对象。
可选的,还包括:
第一评分模型的训练单元,用于:
构建神经网络模型;
获取第二数据集;所述第二数据集包括高风险目标对象在同一时间段内真实的消费信息和预测的消费信息,所述第二数据集中的目标对象标记有评分结果;
获取所述神经网络的初始参数值;
基于所述神经网络的初始参数值和第二数据集对所述神经网络模型进行训练。
本发明实施例公开了一种数据分析方法,首先,基于目标对象的还款信息和目标对象所属的用户的身份信息,筛选高风险目标对象,从而降低了需要检测的目标对象的数据量,提升了数据处理效率。然后,获取高风险目标对象在第一时间段内的消费信息和所述目标对象所属客户的基本信息;将所述高风险的目标对象在第一时间段内的消费信息和所述高风险目标对象所属客户的基本信息输入到预设的消费预测模型中,得到高风险目标对象在第二时间段内的消费信息;基于高风险目标对象在第二时间段内真实的消费信息、和目标对象在第二时间段内预测的消费信息以及预设的评分模型,得到高风险目标对象的评分结果,其中,该目标对象评分结果是基于真实消费信息和预测的消费信息之间的相关性确定的,该评分模型是通过预设的第二数据集进行训练后得到的。并基于高风险目标对象的评分与预设的阈值的关系,确定高风险目标对象是否存在异常消费情况。这样,这样能够及时发现***可能会出现的被借用的风险,从而尽可能的降低银行承担的风险。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1示出了本发明实施例提供的一种数据分析方法的流程示意图;
图2示出了本发明实施例提供的一种评分模型训练方法的流程示意图;
图3示出了本发明实施例提供的一种评分模型的又一训练方法的流程示意图;
图4示出了本发明实施例提供的一种数据分析装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参考图1,示出了本发明实施例提供的一种数据分析方法的流程示意图,在本实施例中,该方法包括:
S101:获取目标对象的还款信息和目标对象所属的客户身份的信息;所述目标对象为借贷类产品;
本实施例中,借贷类产品包括***、或者可以实现分期付款的其它信贷类产品。
本实施例中,目标对象的还款信息包括对信贷类产品进行还款的还款方的信息,具体的指的是还款方的身份信息。目标对象所属用户的身份信息指的是申请信贷类产品时登记的用户的身份信息。其中,还款方的身份信息获取方式可以包括多种,本实施例中不进行限定,例如可以包括如下的两种方式:
方法一、接收用户上传的还款方的身份信息;
方法二、获取目标对象的还款方式;
基于目标对象的还款方式,调取目标对象还款方的身份信息。
举例说明:还款方式可以包括:银行卡还款、微信还款或者支付宝还款等,若还款方式为银行卡还款方式时,可以调取还款银行卡账号所属的客户的身份信息。若还款方式为微信还款方式或者支付宝还款方式,则可以调取还款微信的客户信息或者还款支付宝的客户信息。
S102:基于目标对象的还款信息和目标对象所属的用户的身份信息,筛选高风险目标对象;所述高风险目标对象表示可能会存在异常消费的目标对象;
本实施例中,为了降低由于***借用带来的风险,银行后台***需要对所有的***的使用情况进行监测,但是拥有***的客户的数量非常庞大,在这种情况下,容易导致数据的处理效率降低。
并且申请人还发现,在对***进行还款时,客户通过自己名下的资产进行还款,也可以通过其它人名下的资产进行还款,例如:客户可以通过客户名下的银行卡对***进行还款,也可以通过其他人名下的银行卡对银行卡进行还款,银行对于如何还款不进行限定。但是,申请人通过大数据分析可知,在客户通过其它人名下的财产进行还款时,那么该客户存在异常消费的可能性较高,即客户很有可能存在将***借用给他人使用的情况。
因此,为了提高数据处理的效率,可以如下的方式,对客户进行筛选,筛选出风险较高的目标对象,具体的,包括:
目标对象的还款信息和目标对象所属的用户的身份信息是否一致;
若目标对象的还款信息和目标对象所属用户的身份信息不一致,则表示所述目标对象为高风险目标对象。
本实施例中,高风险目标对象为存在消费异常的可能性比较大的目标对象,为了进一步确认高风险目标对象是否存在异常的消费情况,针对每个高风险目标对象执行如下操作:
S103:获取高风险目标对象在第一时间段内的消费信息和所述目标对象所属客户的基本信息;
本实施例中,第一时间段内的消费信息为目标对象(例如***)在历史时间中某一时间段内的消费信息。
其中,消费信息包括用户通过消费购买的商品信息,以***消费为例,历史消费信息可以表示为用户通过***消费购买的商品信息。
目标对象所属的客户基本信息例如可以包括:用户年龄、家庭状况、学历、收入水平、爱好等。
举例说明:若目标对象为***,则目标对象对应的客户的信息表示申请***时登记的客户的基本信息,例如可以包括:用户年龄、家庭状况、学历、收入水平、爱好等。
S104:将所述高风险的目标对象在第一时间段内的消费信息和所述高风险目标对象所属客户的基本信息输入到预设的消费预测模型中,得到高风险目标对象在第二时间段内的消费信息;
其中,所述消费预测模型是基于第一数据集进行训练后得到的,所述第一数据集包括高风险目标对象第三时间段内的消费信息以及高风险目标所属客户的基本信息;
本实施例中,第三时间段内的消费信息表示目标对象在历史时间内的某一时间段内的消费信息。
其中,第一时间段表示为待预测的时间段,第三时间段的时间早于第一时间段的时间。
举例说明:若要对***2020年9月份的消费信息进行预测,那么第二时间段可以理解为2020年9月份,第一时间段和第三时间段均是早于9月份的历史时间段,并且,第三时间段的时间早于第一时间段的时间,例如第一时间段可以是2020年1月到7月的时间段,第二时间段可以为2020年8月份。
本实施例中,消费预测模型是通过第三时间段目标对象的消费信息和目标对象所属客户的基本信息对预设的机器学习模型进行训练后得到的。其中,预设的机器学习模型可以是任何一种可以通过训练实现对消费情况进行预测的模型。本实施例中,不对机器学习模型进行限定,机器学习模型可以是卷积神经网络模型、SVM模型或者随机森林模型等。
S105:获取高风险目标对象在第二时间段内真实的消费信息;
本实施例中,第二时间段内真实的消费信息,表示为目标对象在第二时间段内实际的消费情况。
举例说明:若目标对象为***,消费信息可以通过***的消费记录获得,那么第二时间段内真实的消费信息可以通过***在第二时间段内的消费记录获得。
S106:基于所述高风险目标对象在第二时间段内真实的消费信息、预测的消费信息和预设的评分模型,得到高风险目标对象的评分结果;所述目标对象评分结果是基于所述真实消费信息和预测的消费信息之间的相关性确定的,所述评分模型是通过预设的第二数据集进行训练后得到的;
本实施例中,评分模型可以通过多种训练方式得到,本实施例中不进行限定,优选的,本实施例中提供如下的两种训练方式:
方法一、
S201:构建神经网络模型;
本实施例中,神经网络模型可以包括多种,本实施例中不进行限定。
S202:获取第二数据集;所述第二数据集包括高风险目标对象在同一时间段内真实的消费信息和预测的消费信息,所述第二数据集中的目标对象标记有评分结果;
本实施例中,目标对象可以是通过预设的规则进行标记的,该规则是基于真实消费信息和预测的消费信息之间的相关性原则,具体的可以理解为:
计算真实消费信息中每个消费对象与预测的消费信息中消费对象的匹配程度;
基于真实消费信息中每个消费对象与预测的消费信息中消费对象的匹配程度对真实消费信息中每个消费对象进行打分;
基于所述真实消费信息中每个消费对象的分值,计算该目标对象的评分。
其中,针对真实消费信息中的每个消费对象来说,该消费对象与预测的消费信息中的消费对象的匹配度越高,则分值越高,匹配度越低,则分值越低,若完全不匹配,分值可以为零分或者负值。
除此之外,还可以通过预设的评分模型对真实消费信息中的每个消费对象进行打分,其中,预设的评分模型可以通过第三数据集进行训练得到,其中第三数据集包括目标对象在同一时间段内真实的消费信息和预测的消费信息,其中,真实的消费信息中的每个消费对象进行了评分标记。
或者,还可以通过评价函数的方法计算真实的消费信息和预测的消费信息的匹配度。
S203:获取所述神经网络的初始参数值;
本实施例中,神经网络的初始参数值可以包括:初始权值和阈值等。
S204:基于所述神经网络的初始参数值和第二数据集对所述神经网络模型进行训练。
方法二、
S301:获取计算真实消费信息中每个消费对象与预测的消费信息中每个消费对象匹配度的计算方法;
本实施例中可以设置多种方法,计算真实消费信息中每个消费对象与预测的消费信息中每个消费对象的匹配度,本实施例中不进行限定。优选的,可以采用如下的方法:
方法一、针对真实消费信息中每个消费对象:
获取真实消费信息中消费对象的属性信息;
获取预测的消费信息中所有消费对象的属性信息;
计算真实消费信息中消费对象的属性信息与预设的消费信息中包含的消费对象的属性信息的匹配程度。
方法二、通过已训练的分类模型计算真实消费信息中每个消费对象与预测的消费信息中每个消费对象的匹配度;
其中,分类模型的训练方法包括:
获取第三数据集;所述第三数据集中包括:两个本体数据集;每个本体数据集中包含不同的消费对象;
生成两个本体数据集中各个消费对象之间的匹配关系;
基于不同维度的属性信息计算各个消费对象之间的匹配度,从而得到第三数据集;
基于上述第三数据集对分类模型进行训练,从而得到能够用于计算不同的消费信息中消费对象的匹配度的方法。
S302:确定真实消费信息中每个消费对象的评分规则;其中,该评分规则是基于真实消费信息中每个消费对象与预测的消费信息中每个消费对象的匹配程度确定的。举例说明:对于匹配程度高的消费对象,可以设置较高的得到,对于匹配程度较低的消费对象,可以设置较低的得分,对于无法匹配的消费对象可以设置为0分或者负分。
S303:确定真实消费信息中所有消费对象评分的统计规则;
统计规则表示为如何统计真实消费信息中所有消费对象的得分。
例如:可以将真实消费信息中所有消费对象的得分相加,或者将真实消费信息中所有消费对象进行加权求和。
S304:基于真实消费信息中每个消费对象与预测的消费信息中每个消费对象匹配度的计算方法、真实消费信息中每个消费对象的评分规则以及真实消费信息中所有消费对象评分的统计规则,训练预设的专家***。
由此得到的专家***在输入了目标对象真实消费信息与预测的消费信息后,可以计算出目标对象的最终得分。
S107:基于高风险目标对象的评分与预设的阈值的关系,确定所述高风险客户是否存在异常消费情况。
本实施例中,由于高风险目标对象的总评分与真实消费情况中的消费对象有关,在不同的场景下,或者不同的时间段,真实消费情况中的消费对象是不断发生变化的,该变化包括消费对象的数量的变化。因此,在真实消费情况所包含的消费对象的数量发生变化的情况下,若预设的阈值不发生变化,则会影响计算的相似度结果的准确性,有鉴于此,为了提升最终判定结果的准确度,预设阈值可以基于真实消费情况中所包含消费对象数量的变化而发生变化,基于此,本实施例还包括:
确定第二时间段真实消费信息包括的消费对象的总数量;
基于第二时间段真实消费信息包括的消费对象的总数量,确定阈值。
本实施例中,基于所述高风险目标对象的评分和预设阈值的关系,确定用户的消费行为是否异常的情况包括如下的两种:
若高风险目标对象的评分大于预设阈值,则表示目标对象的消费行为未出现异常;
若高风险目标对象的评分小于等于预设的阈值,则表示目标对象的消费行为异常。
其中,针对***来说,若用户的消费行为出现异常,可以认为当前***存在借给他人使用的风险。
本实施例中,在检测到目标对象存在消费异常行为的情况下,当检测到目标对象再次被使用的情况下,获取消费者的人脸信息;识别消费者的人脸信息,并且判断所述消费者信息是否与目标对象所属的用户的人脸信息是否一致;若消费者信息与目标对象所述的用户的信息不一致,验证所述消费者是否符合预设的身份。
其中,预设的身份可以包括:目标对象所属的用户设置的能够对目标对象进行消费的人,或者与目标对象所属的用户属于三代亲属关系的人。
若检测到消费者不是目标对象所述的用户,且消费者不符合预设的身份,则向目标对象所属的用户发送消费异常提醒。
本实施例中,在监测到***再次被消费的情况下,可以通过调取商铺摄像头获取消费者的人脸信息。
本实施例中,首先,基于目标对象的还款信息和目标对象所属的用户的身份信息,筛选高风险目标对象,从而降低了需要检测的目标对象的数据量,提升了数据处理效率。然后,获取高风险目标对象在第一时间段内的消费信息和所述目标对象所属客户的基本信息;将所述高风险的目标对象在第一时间段内的消费信息和所述高风险目标对象所属客户的基本信息输入到预设的消费预测模型中,得到高风险目标对象在第二时间段内的消费信息;基于高风险目标对象在第二时间段内真实的消费信息、和目标对象在第二时间段内预测的消费信息以及预设的评分模型,得到高风险目标对象的评分结果,其中,该目标对象评分结果是基于真实消费信息和预测的消费信息之间的相关性确定的,该评分模型是通过预设的第二数据集进行训练后得到的。并基于高风险目标对象的评分与预设的阈值的关系,确定高风险目标对象是否存在异常消费情况。这样,这样能够及时发现***可能会出现的被借用的风险,从而尽可能的降低银行承担的风险。
参考图4,示出了本发明实施例公开的一种数据分析装置的结构示意图,在本实施例中,该装置包括:
第一获取单元401,用于获取目标对象的还款信息和目标对象对应的用户的身份信息;所述目标对象为借贷类产品;
筛选单元402,用于基于目标对象的还款信息和目标对象所属的用户的身份信息,筛选高风险目标对象;所述高风险目标对象表示可能会存在异常消费的目标对象获取高风险目标对象在第一时间段内的消费信息和所述目标对象所属客户的基本信息;
第二获取单元403,用于获取高风险目标对象在第一时间段内的消费信息和所述目标对象所属客户的基本信息;
消费预测模型404,用于将所述高风险的目标对象在第一时间段内的消费信息和所述高风险目标对象所属客户的基本信息输入到预设的消费预测模型中,得到高风险目标对象在第二时间段内的消费信息;
第三获取单元405,用于获取高风险目标对象在第二时间段内真实的消费信息;
评分结果确定单元406,用于基于所述高风险目标对象在第二时间段内真实的消费信息、预测的消费信息和预设的评分模型,得到高风险目标对象的评分结果;所述目标对象评分结果是基于所述真实消费信息和预测的消费信息之间的相关性确定的,所述评分模型是通过预设的第二数据集进行训练后得到的;
异常消费识别单元407,用于基于高风险目标对象的评分与预设的阈值的关系,确定所述高风险目标对象是否存在异常消费情况。
可选的,所述筛选单元,包括:
第一筛选子单元,用于判断目标对象的还款信息和目标对象所属的用户的身份信息是否一致;
第二筛选子单元,用于若目标对象的还款信息和目标对象所属用户的身份信息不一致,则表示所述目标对象为高风险目标对象。
可选的,还包括:
第一评分模型的训练单元,用于:
构建神经网络模型;
获取第二数据集;所述第二数据集包括高风险目标对象在同一时间段内真实的消费信息和预测的消费信息,所述第二数据集中的目标对象标记有评分结果;
获取所述神经网络的初始参数值;
基于所述神经网络的初始参数值和第二数据集对所述神经网络模型进行训练。
可选的,第二评分模型的训练单元,用于:
获取计算真实消费信息中每个消费对象与预设的消费信息中每个消费对象匹配度的计算方法;
确定真实消费信息中每个消费对象的评分规则;
确定真实消费信息中所有消费对象的评分统计规则;
基于真实消费信息中每个消费对象与预设的消费信息中每个消费对象匹配度的计算方法、真实消费信息中没给消费对象的评分规则以及真实消费信息中所有消费对象的评分统计规则,训练预设的专家***。
可选的,所述异常消费识别单元,具体用于:
若高风险目标对象的评分大于预设阈值,则表示目标对象的消费行为未出现异常;
若高风险目标对象的评分小于等于预设的阈值,则表示目标对象的消费行为异常。
可选的,还包括:
确定第二时间段真实消费信息包括的消费对象的总数量;
基于第二时间段真实消费信息包括的消费对象的总数量,确定阈值。
可选的,还包括:
异常提醒检测单元,用于:
在检测到目标对象存在消费异常行为的情况下,监测目标对象的使用动态;
当监测到目标对象再次使用时,获取使用目标对象的消费者的人脸信息;
判断所述消费者的人脸信息是否与预设的所述目标对象所属的用户的人脸信息是否一致;
若述消费者的人脸信息是否与预设的所述目标对象所属的用户的人脸信息不一致,则向目标对象所属的用户发送消费异常提醒。
通过本实施例的装置,基于目标对象的还款信息和目标对象所属的用户的身份信息,筛选高风险目标对象,从而降低了需要检测的目标对象的数据量,提升了数据处理效率。然后,获取高风险目标对象在第一时间段内的消费信息和所述目标对象所属客户的基本信息;将所述高风险的目标对象在第一时间段内的消费信息和所述高风险目标对象所属客户的基本信息输入到预设的消费预测模型中,得到高风险目标对象在第二时间段内的消费信息;基于高风险目标对象在第二时间段内真实的消费信息、和目标对象在第二时间段内预测的消费信息以及预设的评分模型,得到高风险目标对象的评分结果,其中,该目标对象评分结果是基于真实消费信息和预测的消费信息之间的相关性确定的,该评分模型是通过预设的第二数据集进行训练后得到的。并基于高风险目标对象的评分与预设的阈值的关系,确定高风险目标对象是否存在异常消费情况。这样,这样能够及时发现***可能会出现的被借用的风险,从而尽可能的降低银行承担的风险。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (8)

1.一种数据分析方法,其特征在于,包括:
获取目标对象的还款信息和目标对象所属的用户的身份信息;所述目标对象为借贷类产品;
基于目标对象的还款信息和目标对象所属的用户的身份信息,筛选高风险目标对象;所述高风险目标对象表示可能会存在异常消费的目标对象,获取高风险目标对象在第一时间段内的消费信息和所述目标对象所属用户的基本信息;
将所述高风险目标对象在第一时间段内的消费信息和所述高风险目标对象所属用户的基本信息输入到预设的消费预测模型中,得到高风险目标对象在第二时间段内的消费信息;
获取高风险目标对象在第二时间段内真实的消费信息;
基于所述高风险目标对象在第二时间段内真实的消费信息、预测的消费信息和预设的评分模型,得到高风险目标对象的评分结果;所述目标对象的评分结果是基于所述真实的消费信息和预测的消费信息之间的相关性确定的,所述评分模型是通过预设的第二数据集进行训练后得到的;
基于高风险目标对象的评分与预设的阈值的关系,确定所述高风险目标对象是否存在异常消费情况;
其中,所述基于目标对象的还款信息和目标对象所属的用户的身份信息,筛选高风险目标对象,包括:
判断目标对象的还款信息和目标对象所属的用户的身份信息是否一致;
若目标对象的还款信息和目标对象所属用户的身份信息不一致,则表示所述目标对象为高风险目标对象。
2.根据权利要求1所述的方法,其特征在于,所述评分模型的训练过程包括:
构建神经网络模型;
获取第二数据集;所述第二数据集包括高风险目标对象在同一时间段内真实的消费信息和预测的消费信息,所述第二数据集中的目标对象标记有评分结果;
获取所述神经网络的初始参数值;
基于所述神经网络的初始参数值和第二数据集对所述神经网络模型进行训练。
3.根据权利要求1所述的方法,其特征在于,所述评分模型的训练过程包括:
获取计算真实消费信息中每个消费对象与预设的消费信息中每个消费对象匹配度的计算方法;
确定真实消费信息中每个消费对象的评分规则;
确定真实消费信息中所有消费对象的评分统计规则;
基于真实消费信息中每个消费对象与预设的消费信息中每个消费对象匹配度的计算方法、真实消费信息中每个消费对象的评分规则以及真实消费信息中所有消费对象的评分统计规则,训练预设的专家***。
4.根据权利要求1所述的方法,其特征在于,所述基于高风险目标对象的评分与预设的阈值的关系,确定所述高风险目标对象是否存在异常消费情况,包括:
若高风险目标对象的评分大于预设阈值,则表示目标对象的消费行为未出现异常;
若高风险目标对象的评分小于等于预设的阈值,则表示目标对象的消费行为异常。
5.根据权利要求1所述的方法,其特征在于,还包括:
确定第二时间段真实消费信息包括的消费对象的总数量;
基于第二时间段真实消费信息包括的消费对象的总数量,确定所述阈值。
6.根据权利要求1所述的方法,其特征在于,还包括:
在检测到目标对象存在消费异常行为的情况下,监测目标对象的使用动态;
当监测到目标对象再次使用时,获取使用目标对象的消费者的人脸信息;
判断所述消费者的人脸信息是否与预设的所述目标对象所属的用户的人脸信息是否一致;
若所述消费者的人脸信息与预设的所述目标对象所属的用户的人脸信息不一致,则向目标对象所属的用户发送消费异常提醒。
7.一种数据分析装置,其特征在于,包括:
第一获取单元,用于获取目标对象的还款信息和目标对象所属的用户的身份信息;所述目标对象为借贷类产品;
筛选单元,用于基于目标对象的还款信息和目标对象所属的用户的身份信息,筛选高风险目标对象;所述高风险目标对象表示可能会存在异常消费的目标对象;
第二获取单元,用于获取高风险目标对象在第一时间段内的消费信息和所述目标对象所属用户的基本信息;
预设的消费预测模型,用于输入所述高风险目标对象在第一时间段内的消费信息和所述高风险目标对象所属用户的基本信息,得到高风险目标对象在第二时间段内的消费信息;
第三获取单元,用于获取高风险目标对象在第二时间段内真实的消费信息;
评分结果确定单元,用于基于所述高风险目标对象在第二时间段内真实的消费信息、预测的消费信息和预设的评分模型,得到高风险目标对象的评分结果;所述目标对象的评分结果是基于所述真实的消费信息和预测的消费信息之间的相关性确定的,所述评分模型是通过预设的第二数据集进行训练后得到的;
异常消费识别单元,用于基于高风险目标对象的评分与预设的阈值的关系,确定所述高风险目标对象是否存在异常消费情况;
其中,所述筛选单元,包括:
第一筛选子单元,用于判断目标对象的还款信息和目标对象所属的用户的身份信息是否一致;
第二筛选子单元,用于若目标对象的还款信息和目标对象所属用户的身份信息不一致,则表示所述目标对象为高风险目标对象。
8.根据权利要求7所述的装置,其特征在于,还包括:
第一评分模型的训练单元,用于:
构建神经网络模型;
获取第二数据集;所述第二数据集包括高风险目标对象在同一时间段内真实的消费信息和预测的消费信息,所述第二数据集中的目标对象标记有评分结果;
获取所述神经网络的初始参数值;
基于所述神经网络的初始参数值和第二数据集对所述神经网络模型进行训练。
CN202010246736.2A 2020-03-31 2020-03-31 一种数据分析方法及装置 Active CN111461865B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010246736.2A CN111461865B (zh) 2020-03-31 2020-03-31 一种数据分析方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010246736.2A CN111461865B (zh) 2020-03-31 2020-03-31 一种数据分析方法及装置

Publications (2)

Publication Number Publication Date
CN111461865A CN111461865A (zh) 2020-07-28
CN111461865B true CN111461865B (zh) 2024-02-02

Family

ID=71684266

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010246736.2A Active CN111461865B (zh) 2020-03-31 2020-03-31 一种数据分析方法及装置

Country Status (1)

Country Link
CN (1) CN111461865B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107679982A (zh) * 2017-09-29 2018-02-09 电子科技大学 一种基于点过程的***风险检测方法
CN110895758A (zh) * 2019-12-02 2020-03-20 中国银行股份有限公司 存在作弊交易的***账户的筛选方法、装置及***

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104839962B (zh) * 2015-04-28 2017-03-08 百度在线网络技术(北京)有限公司 一种智能钱包及其信息处理方法和装置
CN107203883B (zh) * 2016-03-17 2020-06-26 阿里巴巴集团控股有限公司 一种风险控制方法和设备
CN105844501A (zh) * 2016-05-18 2016-08-10 上海亿保健康管理有限公司 一种消费行为的风险控制***及方法
US11238518B2 (en) * 2017-12-14 2022-02-01 Wells Fargo Bank, N.A. Customized predictive financial advisory for a customer
CN109785162A (zh) * 2018-12-13 2019-05-21 平安科技(深圳)有限公司 医保异常检测方法、装置、设备和计算机存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107679982A (zh) * 2017-09-29 2018-02-09 电子科技大学 一种基于点过程的***风险检测方法
CN110895758A (zh) * 2019-12-02 2020-03-20 中国银行股份有限公司 存在作弊交易的***账户的筛选方法、装置及***

Also Published As

Publication number Publication date
CN111461865A (zh) 2020-07-28

Similar Documents

Publication Publication Date Title
TWI706422B (zh) 風險控制方法、裝置、伺服器及儲存媒體
US20200234305A1 (en) Improved detection of fraudulent transactions
EP1361526A1 (en) Electronic data processing system and method of using an electronic processing system for automatically determining a risk indicator value
CN110689438A (zh) 企业类金融风险评分方法、装置、计算机设备及存储介质
US20100257092A1 (en) System and method for predicting a measure of anomalousness and similarity of records in relation to a set of reference records
CN112200402B (zh) 一种基于风险画像的风险量化方法、装置及设备
CN110659961A (zh) 一种用于识别线下商户的方法和装置
CN111882420A (zh) 响应率的生成方法、营销方法、模型训练方法及装置
CN112232950A (zh) 针对借贷风险的评估方法及装置、设备、计算机可读存储介质
CN110533525A (zh) 用于评估实体风险的方法及装置
CN115205026A (zh) 信用评估方法、装置、设备及计算机存储介质
CN110991650A (zh) 训练养卡识别模型、识别养卡行为的方法及装置
CN111144899A (zh) 识别虚假交易的方法及装置和电子设备
CN113673870A (zh) 一种企业数据分析方法及相关组件
CN112884480A (zh) 异常交易识别模型的构造方法、装置、计算机设备和介质
CN111461865B (zh) 一种数据分析方法及装置
US20230169511A1 (en) Self Learning Machine Learning Transaction Scores Adjustment via Normalization Thereof Accounting for Underlying Transaction Score Bases
CN111461866B (zh) 一种数据分析方法及装置
JP2005346730A (ja) 履歴情報を用いたクレジットカードの不正利用の判定方法
CN113822751A (zh) 一种线上贷款的风险预测方法
CN114626863A (zh) 出口骗税企业的检测方法、装置、设备及存储介质
CN113870020A (zh) 一种逾期风险控制方法及装置
CN110766544A (zh) 信用风险的检测方法及装置、存储介质、电子装置
CN110675240A (zh) 风险雷达预警的监控方法及***
EP4310755A1 (en) Self learning machine learning transaction scores adjustment via normalization thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant