CN110363407A - 基于用户行为轨迹的欺诈风险评估方法及装置 - Google Patents

基于用户行为轨迹的欺诈风险评估方法及装置 Download PDF

Info

Publication number
CN110363407A
CN110363407A CN201910567908.3A CN201910567908A CN110363407A CN 110363407 A CN110363407 A CN 110363407A CN 201910567908 A CN201910567908 A CN 201910567908A CN 110363407 A CN110363407 A CN 110363407A
Authority
CN
China
Prior art keywords
user
data
risk
characteristic
fraud
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910567908.3A
Other languages
English (en)
Inventor
陈雪清
张涵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Qifu Information Technology Co Ltd
Original Assignee
Shanghai Qifu Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Qifu Information Technology Co Ltd filed Critical Shanghai Qifu Information Technology Co Ltd
Priority to CN201910567908.3A priority Critical patent/CN110363407A/zh
Publication of CN110363407A publication Critical patent/CN110363407A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Technology Law (AREA)
  • Quality & Reliability (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Tourism & Hospitality (AREA)
  • Educational Administration (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了基于用户行为轨迹的欺诈风险评估方法及装置,方法包括:获取申请用户数据;清洗所述申请用户数据,得到清洗后数据;基于所述清洗后数据进行特征提取,得到用户的行为轨迹;构建基于用户的行为轨迹的欺诈风险评估模型,并进行实时风险评估。本发明在用户提交资料和存在网络公开行为的情形下,将由用户操作行为产生的信息及与之有相关联的其他账户行为之间的交互及其他账号的风险程度进行特征提取,由此预先检测出用户的异常行为和高危轨迹,从而为客户的风险定价、额度调整和逾期预测提供参考。

Description

基于用户行为轨迹的欺诈风险评估方法及装置
技术领域
本发明涉及计算机领域,尤其涉及一种基于用户行为轨迹的欺诈风险评估方法及装置。
背景技术
由于互联网金融能够极大地方便用户,因此发展普及迅速,人们越来越多的使用线上平台进行业务申请。但是随着经济的快速发展,人员流动性大大增加,行为也越来越多样化。这给目前信贷审核中对于用户所在区域的界定及与之相关策略的制定带来了极大的挑战。欺诈风险是互联网金融行业面临的主要风险之一,是信贷风险管理的重要环节。
在此背景下,如何判定用户的欺诈风险成为一项重要课题,需要设计基于用户行为轨迹的欺诈风险评估方法及装置。
在所述背景技术部分公开的上述信息仅用于加强对本公开的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
鉴于上述问题,提出了本说明书以便提供一种克服上述问题或者至少部分地解决上述问题的
本发明公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
第一方面,本发明公开了一种基于用户行为轨迹的欺诈风险评估方法,包括:
获取申请用户数据;
清洗所述申请用户数据,得到清洗后数据;
基于所述清洗后数据进行特征提取,得到用户的行为轨迹;
构建基于用户的行为轨迹的欺诈风险评估模型,并进行实时风险评估。
在本公开的一种示例性实施例中,所述清洗所述申请用户数据,得到清洗后数据包括:
将所述申请用户数据分为用户本人特征数据和相关联用户特征数据分别进行清洗。
在本公开的一种示例性实施例中,在所述获得申请用户数据之前,获得存量用户数据库数据。
在本公开的一种示例性实施例中,将申请用户数据与存量用户数据库数据进行比较,判断是否匹配到存量用户数据库中的存量用户,若匹配到则进行所述清洗所述申请用户数据,若未匹配到则结束评估方法。
在本公开的一种示例性实施例中,所述将所述申请用户数据分为用户本人特征数据和相关联用户特征数据分别进行清洗包括:
提取所述用户本人特征数据中的字符型数据和数值型变量。
在本公开的一种示例性实施例中,所述将所述申请用户数据分为用户本人特征数据和相关联用户特征数据分别进行清洗还包括:
提取所述相关联用户特征数据中的字符型数据、数值型变量、关联关系性质变量和关联用户资质标签。
在本公开的一种示例性实施例中,对所述用户本人特征数据中的字符型数据以及所述相关联用户特征数据中的字符型数据采用one-hot编码处理;
对所述用户本人特征数据中的数值型变量以及所述相关联用户特征数据中的数值型变量根据数值分布情况进行分段处理。
在本公开的一种示例性实施例中,将所述相关联用户特征数据中的关联关系性质变量形成有方向性的特征变量。
在本公开的一种示例性实施例中,采用xgboost构建基于用户的行为轨迹的欺诈风险评估模型。
在本公开的一种示例性实施例中,存储实时风险评估得到的异常行为或高危轨迹的用户群。
在本公开的一种示例性实施例中,所述用户行为轨迹包括:
用户操作行为产生的信息。
在本公开的一种示例性实施例中,所述用户行为轨迹还包括:
与该用户相关联的其他存量用户的操作行为。
第二方面,本发明提供一种基于用户行为轨迹的欺诈风险评估装置,包括:
获取模块,用于获取申请用户数据;
清洗模块,用于清洗所述申请用户数据,得到清洗后数据;
行为轨迹模块,用于基于所述清洗后数据进行特征提取,得到用户的行为轨迹;
模型评估模块,用于构建基于用户的行为轨迹的欺诈风险评估模型,并进行实时风险评估。
在本公开的一种示例性实施例中,所述清洗模块包括:
用户本人特征数清洗据单元和相关联用户特征数据清洗单元。
在本公开的一种示例性实施例中,存量用户数据库模块,用于在所述获得申请用户数据之前,获得存量用户数据库数据。
在本公开的一种示例性实施例中,匹配模块,用于将申请用户数据与存量用户数据库数据进行比较,判断是否匹配到存量用户数据库中的存量用户,若匹配到则进行所述清洗所述申请用户数据,若未匹配到则结束评估方法。
在本公开的一种示例性实施例中,所述用户本人特征数清洗据单元包括:
用户本人字符型数据子单元和用户本人数值型变量子单元。
在本公开的一种示例性实施例中,所述相关联用户特征数据清洗单元包括:
相关联用户字符型数据子单元、相关联用户数值型变量子单元、关联关系性质变量子单元和关联用户资质标签子单元。
在本公开的一种示例性实施例中,编码模块,用于对所述用户本人特征数据中的字符型数据以及所述相关联用户特征数据中的字符型数据采用one-hot编码处理;
分段处理模块,用于对所述用户本人特征数据中的数值型变量以及所述相关联用户特征数据中的数值型变量根据数值分布情况进行分段处理。
在本公开的一种示例性实施例中,特征变量模块,用于将所述相关联用户特征数据中的关联关系性质变量形成有方向性的特征变量。
在本公开的一种示例性实施例中,xgboost算法模块,用于采用xgboost构建基于用户的行为轨迹的欺诈风险评估模型。
在本公开的一种示例性实施例中,存储模块,用于存储实时风险评估得到的异常行为或高危轨迹的用户群。
在本公开的一种示例性实施例中,所述行为轨迹模块包括:
用户操作行为单元,用于获取用户操作行为产生的信息。
在本公开的一种示例性实施例中,所述行为轨迹模块还包括:
关联操作行为单元,用于获取与该用户相关联的其他存量用户的操作行为。
第三方面,本说明书提供一种服务器,包括处理器和存储器:所述存储器用于存储上述任一项所述方法的程序;所述处理器被配置为用于执行所述存储器中存储的程序实现上述任一项所述方法的步骤。
第四方面,本说明书实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一项所述方法的步骤。
本发明在用户提交资料和存在网络公开行为的情形下,将由用户操作行为产生的信息及与之有相关联的其他账户行为之间的交互及其他账号的风险程度进行特征提取,由此预先检测出用户的异常行为和高危轨迹,从而为客户的风险定价、额度调整和逾期预测提供参考。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据一示例性实施例示出的一种基基于用户行为轨迹的欺诈风险评估方法的流程图。
图2是图1所示方法的详细流程图。
图3是根据另一示例性实施例示出的一种基于用户行为轨迹的欺诈风险评估装置的框图。
图4是根据一示例性实施例示出的一种服务器的框图。
具体实施方式
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
然而,下述的示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的实施例;相反,提供这些实施例使得本公开将全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
应理解,虽然本文中可能使用术语第一、第二、第三等来描述各种组件,但这些组件不应受这些术语限制。这些术语乃用以区分一组件与另一组件。因此,下文论述的第一组件可称为第二组件而不偏离本公开概念的教示。如本文中所使用,术语“及/或”包括相关联的列出项目中的任一个及一或多者的所有组合。
本领域技术人员可以理解,附图只是示例实施例的示意图,附图中的模块或流程并不一定是实施本公开所必须的,因此不能用于限制本公开的保护范围。
本发明提供了一种基于用户行为轨迹的欺诈风险评估方法,用于解决现有技术中用户行为多样化,不利于对用户进行界定和制定策略的问题,为了解决上述问题,本发明的总体思路如下:
基于用户行为轨迹的欺诈风险评估方法,包括:
获取申请用户数据;
清洗所述申请用户数据,得到清洗后数据;
基于所述清洗后数据进行特征提取,得到用户的行为轨迹;
构建基于用户的行为轨迹的欺诈风险评估模型,并进行实时风险评估。
利用数据库存储的数据,对用户数据进行清洗,描绘出用户行为的轨迹。同时,建立模型,实现对信贷申请或借款用户的实时风险评分,找出存在异常行为或者高危轨迹的用户群,从而为客户的风险定价、额度调整和逾期预测提供参考。
首先需要说明书的是,在本发明各个实施例中,所涉及的术语为:
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
下面,通过几个具体的实施例对本发明的技术方案进行详细介绍和说明。
见图1,本实施例的基于用户行为轨迹的欺诈风险评估方法,包括:
S101:获取申请用户数据;比如在某次公司营销活动,A用户可能做为推荐人推荐很多其他用户参与活动。用户的推荐行为将产生新增用户信息,A用户的申请信息和其推荐的用户的申请信息都属于申请用户数据。为了结合A用户以往的行为以及与A用户相关的其他用户以往的行为,在所述获得申请用户数据之前,获得存量用户数据库数据。存量用户数据库是存放历史用户数据的数据库,这个数据库中会包含A用户以前的相关数据(A用户在该平台的其他行为留下的数据和其他网络公开数据)以及其他用户在该平台留下的数据和网络公开数据。将申请用户数据与存量用户数据库数据进行比较,判断是否匹配到存量用户数据库中的存量用户,若匹配到则说明可以对A用户和与其关联的存量用户进行分析,因此就可以进行所述清洗所述申请用户数据,若未匹配到则结束评估方法。进行这一步操作的目的主要是:在用户提交资料和存在网络公开行为的情形下,将由用户操作行为产生的信息及与之有相关联的其他账户行为之间的交互及其他账号的信息收集起来,用于后续进行特征提取,由此预先检测出用户的异常行为和高危轨迹。
S102:清洗所述申请用户数据,得到清洗后数据;对数据进行清洗时,将所述申请用户数据分为用户本人特征数据和相关联用户特征数据分别进行清洗。
S103:基于所述清洗后数据进行特征提取,得到用户的行为轨迹;用户的行为轨迹用户最近操作和历史操作行为及与之关联的用户的各节点的风险情况。
具体来说,对用户本人的数据,提取所述用户本人特征数据中的字符型数据和数值型变量,用户最新操作会同时产生字符型和数值型两方面的数据,对于字符数据,用one-hot编码加工,对于数值型数据根据数值分布情况进行分段处理。
对与用户相关联的存量用户来说,提取所述相关联用户特征数据中的字符型数据、数值型变量、关联关系性质变量和关联用户资质标签。由于该用户群与用户本人同时存在多种形式的关联关系,这种不同的关联关系可以形成有方向性的特征变量。与此同时匹配到的关联用户本身资质也是特征工程加工非常重要的一个维度。对于这部分人的资质在公司内部若有风险表现则直接用其表现情况作为风险标记,若尚无表现则可以用异常值检测作为其风险标记。
比如,A用户可能做为推荐人推荐很多其他用户参与活动,这部分新增信息可以放置于A用户以往授信或者借款申请活动所形成的信息轨迹进行考察,进行特征工程提取,比如用户操作行为是否异常(如是否和以前登记信息一致、是否更换了注册设备等)或者有其他高风险存在(比如登记的地址/电话信息属于危险标记信息)等等。与此同时,A用户推荐的人形成用户的新增关系网,通过对这部分新增关系网中每个关联节点的风险情况进行鉴别,形成用户新的关系图谱(比如建立以A用户为中心的网络图/树状图等)。在A用户本身新增信息和与其关联的存量用户信息的基础上进行特征提取。
在进行特征提取后,进行特征加工。特征加工则包含原始特征及其交叉组合而成的复杂变量。其中核心在于复杂变量的加工,原因在于每个变量的缺失值分布不同,变量的融合可以降低缺失值的占比,同时部分变量之间也存在非线性相关性,通过对部分变量预先进行LR或者多项式拟合,能显著提升变量的区分度。
S104:构建基于用户的行为轨迹的欺诈风险评估模型,并进行实时风险评估。
具体来说,本实施例采用xgboost构建基于用户的行为轨迹的欺诈风险评估模型。模型通过不断调整超参数以达到最优预测效果,比如通过循环搜索最优参数配置实现。
存储实时风险评估得到的异常行为或高危轨迹的用户群,并对其进行分类,形成新的规则集合。
本实施例通过综合用户最近操作和历史操作行为及与之关联的用户的各节点的风险情况,对用户是否存在异常行为或者出没过高危地点等异常高风险客户提前进行预判。
本实施例采用用户实时数据,使得提取特征更能反映用户性质,同时对用户与数据库存量用户之间庞大的关系网进行计算,因而其特征也更为强大和多样。本发明能够降低高风险用户的覆盖率,同时提高其命中率,使得高风险用户的精准度大大提升。
本发明的另一个实施例如图2,评估方法开始后,根据申请用户数据判断是否匹配到数据库的存量用户,如果否则跳过直接结束,如果匹配到了存量用户,则进行数据清洗,提取用户本人及关联人数据。将提取的数据分成用户本人特征和相关联用户特征分别进行特征提取。其中,用户本人特征提取字符型数据和数值型变量,相关联用户特征则提取字符型数据、数值型变量、关联关系性质变量和关联用户资质标签。将前述这些变量进行融合,并进行复杂变量的加工,采用xgboost构建基于用户的行为轨迹的欺诈风险评估模型,形成新的评估规则。
基于与前述实施例中一种基于用户行为轨迹的欺诈风险评估方法同样的发明构思,本发明还提供一种基于用户行为轨迹的欺诈风险评估的装置,其上存储有计算机程序,该程序被处理器执行时实现前文所述一种信息处理方法的任一方法的步骤。
下述为本公开装置实施例,可以用于执行本发明方法实施例。对于本实施例的装置实施例中未披露的细节,请参照本公开方法实施例。
如图3,基于用户行为轨迹的欺诈风险评估装置,包括:
存量用户数据库模块,用于存储存量用户数据;
获取模块301,用于获取申请用户数据;比如在某次公司营销活动,A用户可能做为推荐人推荐很多其他用户参与活动。用户的推荐行为将产生新增用户信息,A用户的申请信息和其推荐的用户的申请信息都属于申请用户数据。为了结合A用户以往的行为以及与A用户相关的其他用户以往的行为,在所述获得申请用户数据之前,获得存量用户数据库数据。存量用户数据库是存放历史用户数据的数据库,这个数据库中会包含A用户以前的相关数据(A用户在该平台的其他行为留下的数据和其他网络公开数据)以及其他用户在该平台留下的数据和网络公开数据。将申请用户数据与存量用户数据库数据进行比较,判断是否匹配到存量用户数据库中的存量用户,若匹配到则说明可以对A用户和与其关联的存量用户进行分析,因此就可以进行所述清洗所述申请用户数据,若未匹配到则结束评估方法。进行这一步操作的目的主要是:在用户提交资料和存在网络公开行为的情形下,将由用户操作行为产生的信息及与之有相关联的其他账户行为之间的交互及其他账号的信息收集起来,用于后续进行特征提取,由此预先检测出用户的异常行为和高危轨迹。
清洗模块302,用于清洗所述申请用户数据,得到清洗后数据;对数据进行清洗时,将所述申请用户数据分为用户本人特征数据和相关联用户特征数据分别进行清洗
行为轨迹模块303,用于基于所述清洗后数据进行特征提取,得到用户的行为轨迹;用户的行为轨迹用户最近操作和历史操作行为及与之关联的用户的各节点的风险情况。
模型评估模块304,用于构建基于用户的行为轨迹的欺诈风险评估模型,并进行实时风险评估。
所述清洗模块302包括:
用户本人特征数清洗据单元和相关联用户特征数据清洗单元。用户本人特征数清洗据单元包括:用户本人字符型数据子单元和用户本人数值型变量子单元。相关联用户特征数据清洗单元包括:相关联用户字符型数据子单元、相关联用户数值型变量子单元、关联关系性质变量子单元和关联用户资质标签子单元。
具体的,为了方便对用户数据和存量用户数据进行分析,还包括匹配模块,用于将申请用户数据与存量用户数据库数据进行比较,判断是否匹配到存量用户数据库中的存量用户,若匹配到则进行所述清洗所述申请用户数据,若未匹配到则结束评估方法。
具体来说,清洗模块302包括(1)编码模块,用于对所述用户本人特征数据中的字符型数据以及所述相关联用户特征数据中的字符型数据采用one-hot编码处理;(2)分段处理模块,用于对所述用户本人特征数据中的数值型变量以及所述相关联用户特征数据中的数值型变量根据数值分布情况进行分段处理;(3)特征变量模块,用于将所述相关联用户特征数据中的关联关系性质变量形成有方向性的特征变量。由于该用户群与用户本人同时存在多种形式的关联关系,这种不同的关联关系可以形成有方向性的特征变量。与此同时匹配到的关联用户本身资质也是特征工程加工非常重要的一个维度。对于这部分人的资质在公司内部若有风险表现则直接用其表现情况作为风险标记,若尚无表现则可以用异常值检测作为其风险标记。在进行特征提取后,进行特征加工。特征加工则包含原始特征及其交叉组合而成的复杂变量。其中核心在于复杂变量的加工,原因在于每个变量的缺失值分布不同,变量的融合可以降低缺失值的占比,同时部分变量之间也存在非线性相关性,通过对部分变量预先进行LR或者多项式拟合,能显著提升变量的区分度。
行为轨迹模块包括:用户操作行为单元,用于获取用户操作行为产生的信息;和关联操作行为单元,用于获取与该用户相关联的其他存量用户的操作行为。
模型评估模块304包括xgboost算法模块,用于采用xgboost构建基于用户的行为轨迹的欺诈风险评估模型。模型通过不断调整超参数以达到最优预测效果,比如通过循环搜索最优参数配置实现。
优选的,还包括存储模块,用于存储实时风险评估得到的异常行为或高危轨迹的用户群,并对其进行分类,形成新的规则集合。
本说明书第三实施例还提供了一种服务器,包括存储器402、处理器401及存储在存储器402上并可在处理器401上运行的计算机程序,所述处理器401执行所述程序时实现前文所述方法的步骤。为了便于说明,仅示出了与本说明书实施例相关的部分,具体技术细节未揭示的,请参照本说明书实施例方法部分。该服务器,可以是包括各种电子设备形成的服务器设备,PC电脑、网络云服务器,甚至手机、平板电脑、PDA(Personal DigitalAssistant,个人数字助理)、POS(Point of Sales,销售终端)、车载电脑、台式电脑等任意电子设备上设置的服务器功能。
具体地,图4示出的与本说明书实施例提供的技术方案相关的服务器组成结构框图,总线400可以包括任意数量的互联的总线和桥,其将包括由处理器401代表的一个或多个处理器和存储器402代表的存储器的各种电路链接在一起。总线400还可以将诸如***设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口403在总线400和接收器和/或发送器404之间提供接口,接收器和/或发送器404可以是分开独立的接收器或发送器也可以是同一个元件如收发机,提供用于在传输介质上与各种其他装置通信的单元。处理器401负责管理总线400和通常的处理,而存储器402可以被用于存储处理器401在执行操作时所使用的数据。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个计算机可读存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、或者网络设备等)执行根据本公开实施方式的上述方法。
所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该计算机可读介质实现如下功能:获取历史信贷数据集,所述历史信贷数据集包括用户的多维度属性信息及逾期信息;基于所述多维度属性信息对所述历史信贷数据集进行自动分档处理以生成多个子数据集;根据所述逾期信息计算所述多个子数据集中每一个子数据集对应的逾期率;以及根据子数据集及其对应的所述逾期率生成信贷风险控制规则。
本领域技术人员可以理解上述各模块可以按照实施例的描述分布于装置中,也可以进行相应变化唯一不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
通过以上的实施例的描述,本领域的技术人员易于理解,这里描述的示例实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本公开实施例的方法。
尽管已描述了本说明书的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本说明书范围的所有变更和修改。
以上具体地示出和描述了本公开的示例性实施例。应可理解的是,本公开不限于这里描述的详细结构、设置方式或实现方法;相反,本公开意图涵盖包含在所附权利要求的精神和范围内的各种修改和等效设置。此外,本说明书说明书附图所示出的结构、比例、大小等,均仅用以配合说明书所公开的内容,以供本领域技术人员了解与阅读,并非用以限定本公开可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本公开所能产生的技术效果及所能实现的目的下,均应仍落在本公开所公开的技术内容得能涵盖的范围内。同时,本说明书中所引用的如“上”、“第一”、“第二”及“一”等的用语,也仅为便于叙述的明了,而非用以限定本公开可实施的范围,其相对关系的改变或调整,在无实质变更技术内容下,当也视为本公开可实施的范畴。

Claims (10)

1.基于用户行为轨迹的欺诈风险评估方法,包括:
获取申请用户数据;
清洗所述申请用户数据,得到清洗后数据;
基于所述清洗后数据进行特征提取,得到用户的行为轨迹;
构建基于用户的行为轨迹的欺诈风险评估模型,并进行实时风险评估。
2.根据权利要求1所述的基于用户行为轨迹的欺诈风险评估方法,包括:
所述清洗所述申请用户数据,得到清洗后数据包括:
将所述申请用户数据分为用户本人特征数据和相关联用户特征数据分别进行清洗。
3.根据权利要求1至2任一项所述的基于用户行为轨迹的欺诈风险评估方法,还包括:
在所述获得申请用户数据之前,获得存量用户数据库数据。
4.根据权利要求1至3任一项所述的基于用户行为轨迹的欺诈风险评估方法,包括:
将申请用户数据与存量用户数据库数据进行比较,判断是否匹配到存量用户数据库中的存量用户,若匹配到则进行所述清洗所述申请用户数据,若未匹配到则结束评估方法。
5.根据权利要求1至4任一项所述的基于用户行为轨迹的欺诈风险评估方法,包括:
所述将所述申请用户数据分为用户本人特征数据和相关联用户特征数据分别进行清洗包括:
提取所述用户本人特征数据中的字符型数据和数值型变量。
6.根据权利要求1至5任一项所述的基于用户行为轨迹的欺诈风险评估方法,包括:
所述将所述申请用户数据分为用户本人特征数据和相关联用户特征数据分别进行清洗还包括:
提取所述相关联用户特征数据中的字符型数据、数值型变量、关联关系性质变量和关联用户资质标签。
7.根据权利要求1至6任一项所述的基于用户行为轨迹的欺诈风险评估方法,包括:
对所述用户本人特征数据中的字符型数据以及所述相关联用户特征数据中的字符型数据采用one-hot编码处理;
对所述用户本人特征数据中的数值型变量以及所述相关联用户特征数据中的数值型变量根据数值分布情况进行分段处理。
8.基于用户行为轨迹的欺诈风险评估装置,包括:
获取模块,用于获取申请用户数据;
清洗模块,用于清洗所述申请用户数据,得到清洗后数据;
行为轨迹模块,用于基于所述清洗后数据进行特征提取,得到用户的行为轨迹;
模型评估模块,用于构建基于用户的行为轨迹的欺诈风险评估模型,并进行实时风险评估。
9.一种服务器,包括处理器和存储器:
所述存储器用于存储执行权利要求1至7任一项所述方法的程序;
所述处理器被配置为用于执行所述存储器中存储的程序。
10.一种计算机可读存储介质,其存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1至7任一项所述方法的步骤。
CN201910567908.3A 2019-06-27 2019-06-27 基于用户行为轨迹的欺诈风险评估方法及装置 Pending CN110363407A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910567908.3A CN110363407A (zh) 2019-06-27 2019-06-27 基于用户行为轨迹的欺诈风险评估方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910567908.3A CN110363407A (zh) 2019-06-27 2019-06-27 基于用户行为轨迹的欺诈风险评估方法及装置

Publications (1)

Publication Number Publication Date
CN110363407A true CN110363407A (zh) 2019-10-22

Family

ID=68215811

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910567908.3A Pending CN110363407A (zh) 2019-06-27 2019-06-27 基于用户行为轨迹的欺诈风险评估方法及装置

Country Status (1)

Country Link
CN (1) CN110363407A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110827144A (zh) * 2019-11-13 2020-02-21 北京顶象技术有限公司 用户的申请风险评估方法、申请风险评估装置及电子设备
CN111629235A (zh) * 2020-01-20 2020-09-04 全息空间(深圳)智能科技有限公司 直播平台用户数据分析方法、装置及存储介质
CN112017059A (zh) * 2020-07-14 2020-12-01 北京淇瑀信息科技有限公司 一种分级优化的风险控制方法、装置和电子设备
CN112348661A (zh) * 2020-10-21 2021-02-09 上海淇玥信息技术有限公司 基于用户行为轨迹的服务策略分配方法、装置及电子设备
CN112348320A (zh) * 2020-10-21 2021-02-09 上海淇玥信息技术有限公司 基于lbs行为轨迹的风险识别方法、装置及电子设备
CN112464058A (zh) * 2020-11-30 2021-03-09 上海欣方智能***有限公司 一种基于XGBoost算法的电信互联网诈骗识别方法
CN112651433A (zh) * 2020-12-17 2021-04-13 广州锦行网络科技有限公司 一种特权账号异常行为分析方法
CN113902551A (zh) * 2021-10-20 2022-01-07 长安汽车金融有限公司 车贷申请欺诈识别的方法和设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108492173A (zh) * 2018-03-23 2018-09-04 上海氪信信息技术有限公司 一种基于双模网络图挖掘算法的***反欺诈预测方法
CN109657837A (zh) * 2018-11-19 2019-04-19 平安科技(深圳)有限公司 违约概率预测方法、装置、计算机设备和存储介质
CN109840778A (zh) * 2018-12-21 2019-06-04 上海拍拍贷金融信息服务有限公司 欺诈用户的识别方法及装置、可读存储介质
CN109918511A (zh) * 2019-01-29 2019-06-21 华融融通(北京)科技有限公司 一种基于bfs和lpa的知识图谱反欺诈特征提取方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108492173A (zh) * 2018-03-23 2018-09-04 上海氪信信息技术有限公司 一种基于双模网络图挖掘算法的***反欺诈预测方法
CN109657837A (zh) * 2018-11-19 2019-04-19 平安科技(深圳)有限公司 违约概率预测方法、装置、计算机设备和存储介质
CN109840778A (zh) * 2018-12-21 2019-06-04 上海拍拍贷金融信息服务有限公司 欺诈用户的识别方法及装置、可读存储介质
CN109918511A (zh) * 2019-01-29 2019-06-21 华融融通(北京)科技有限公司 一种基于bfs和lpa的知识图谱反欺诈特征提取方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110827144A (zh) * 2019-11-13 2020-02-21 北京顶象技术有限公司 用户的申请风险评估方法、申请风险评估装置及电子设备
CN111629235A (zh) * 2020-01-20 2020-09-04 全息空间(深圳)智能科技有限公司 直播平台用户数据分析方法、装置及存储介质
CN112017059A (zh) * 2020-07-14 2020-12-01 北京淇瑀信息科技有限公司 一种分级优化的风险控制方法、装置和电子设备
CN112348661A (zh) * 2020-10-21 2021-02-09 上海淇玥信息技术有限公司 基于用户行为轨迹的服务策略分配方法、装置及电子设备
CN112348320A (zh) * 2020-10-21 2021-02-09 上海淇玥信息技术有限公司 基于lbs行为轨迹的风险识别方法、装置及电子设备
CN112348661B (zh) * 2020-10-21 2024-04-23 上海淇玥信息技术有限公司 基于用户行为轨迹的服务策略分配方法、装置及电子设备
CN112464058A (zh) * 2020-11-30 2021-03-09 上海欣方智能***有限公司 一种基于XGBoost算法的电信互联网诈骗识别方法
CN112651433A (zh) * 2020-12-17 2021-04-13 广州锦行网络科技有限公司 一种特权账号异常行为分析方法
CN112651433B (zh) * 2020-12-17 2021-12-14 广州锦行网络科技有限公司 一种特权账号异常行为分析方法
CN113902551A (zh) * 2021-10-20 2022-01-07 长安汽车金融有限公司 车贷申请欺诈识别的方法和设备
CN113902551B (zh) * 2021-10-20 2023-09-01 长安汽车金融有限公司 车贷申请欺诈识别的方法和设备

Similar Documents

Publication Publication Date Title
CN110363407A (zh) 基于用户行为轨迹的欺诈风险评估方法及装置
WO2020037918A1 (zh) 基于预测模型的风险控制策略的确定方法及相关装置
US11775412B2 (en) Machine learning models applied to interaction data for facilitating modifications to online environments
CN110363417A (zh) 金融风险策略生成方法、装置及电子设备
CN110363636A (zh) 基于关系网络的欺诈风险识别方法及装置
Cao Social security and social welfare data mining: An overview
Lien et al. Using institutional grammar to improve understanding of the form and function of payment for ecosystem services programs
CN112330412A (zh) 一种产品推荐方法、装置、计算机设备及存储介质
WO2010031699A1 (en) Governing service identification in a service oriented architecture ('soa') governance model
CN110033123A (zh) 用于业务评估的方法和装置
US20220374814A1 (en) Resource configuration and management system for digital workers
Pagoni et al. System dynamics approaches to public–private partnerships: A literature review
CN112910953B (zh) 业务数据的推送方法、装置和服务器
Gathungu et al. Contextual factors affecting e-government strategy implementation and its impact on public sector performance in Kenya
CN109829593A (zh) 目标对象的信用度确定方法、装置、存储介质及电子装置
CN109636627B (zh) 基于区块链的保险产品管理方法、装置、介质及电子设备
CN111639916A (zh) 一种基于区块链技术及深度学习的在线审计方法、***和可读存储介质
CN115660814A (zh) 风险预测方法、装置、计算机可读存储介质及电子设备
CN112967062B (zh) 基于谨慎度的用户身份识别方法
CN113327161A (zh) 一种用于信贷业务的智能风控决策***
CN110362981A (zh) 基于可信设备指纹判断异常行为的方法及***
WO2020173148A1 (zh) 一种订单自动生成方法及***、存储介质
Baida et al. E-business cases assessment: From business value to system feasibility
CN110348190A (zh) 基于用户操作行为的用户设备归属判断方法及装置
Blume Behavior identification in markets-using visualization and network analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 201500 room a3-5588, 58 Fumin Branch Road, Hengsha Township, Chongming District, Shanghai (Shanghai Hengtai Economic Development Zone)

Applicant after: Qifu Shuke (Shanghai) Technology Co.,Ltd.

Address before: 201500 room a3-5588, 58 Fumin Branch Road, Hengsha Township, Chongming District, Shanghai (Shanghai Hengtai Economic Development Zone)

Applicant before: Shanghai Qifu Information Technology Co.,Ltd.

CB02 Change of applicant information
CB02 Change of applicant information

Country or region after: China

Address after: 200062 room 1027, floor 10, No. 89, Yunling East Road, Putuo District, Shanghai

Applicant after: Qifu Shuke (Shanghai) Technology Co.,Ltd.

Address before: 201500 room a3-5588, 58 Fumin Branch Road, Hengsha Township, Chongming District, Shanghai (Shanghai Hengtai Economic Development Zone)

Applicant before: Qifu Shuke (Shanghai) Technology Co.,Ltd.

Country or region before: China

CB02 Change of applicant information