CN110363407A

CN110363407A - 基于用户行为轨迹的欺诈风险评估方法及装置

Info

Publication number: CN110363407A
Application number: CN201910567908.3A
Authority: CN
Inventors: 陈雪清; 张涵
Original assignee: Shanghai Qifu Information Technology Co Ltd
Current assignee: Shanghai Qifu Information Technology Co Ltd
Priority date: 2019-06-27
Filing date: 2019-06-27
Publication date: 2019-10-22

Abstract

本发明公开了基于用户行为轨迹的欺诈风险评估方法及装置，方法包括：获取申请用户数据；清洗所述申请用户数据，得到清洗后数据；基于所述清洗后数据进行特征提取，得到用户的行为轨迹；构建基于用户的行为轨迹的欺诈风险评估模型，并进行实时风险评估。本发明在用户提交资料和存在网络公开行为的情形下，将由用户操作行为产生的信息及与之有相关联的其他账户行为之间的交互及其他账号的风险程度进行特征提取，由此预先检测出用户的异常行为和高危轨迹，从而为客户的风险定价、额度调整和逾期预测提供参考。

Description

基于用户行为轨迹的欺诈风险评估方法及装置

技术领域

本发明涉及计算机领域，尤其涉及一种基于用户行为轨迹的欺诈风险评估方法及装置。

背景技术

由于互联网金融能够极大地方便用户，因此发展普及迅速，人们越来越多的使用线上平台进行业务申请。但是随着经济的快速发展，人员流动性大大增加，行为也越来越多样化。这给目前信贷审核中对于用户所在区域的界定及与之相关策略的制定带来了极大的挑战。欺诈风险是互联网金融行业面临的主要风险之一，是信贷风险管理的重要环节。

在此背景下，如何判定用户的欺诈风险成为一项重要课题，需要设计基于用户行为轨迹的欺诈风险评估方法及装置。

在所述背景技术部分公开的上述信息仅用于加强对本公开的背景的理解，因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

鉴于上述问题，提出了本说明书以便提供一种克服上述问题或者至少部分地解决上述问题的

本发明公开的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本公开的实践而习得。

第一方面，本发明公开了一种基于用户行为轨迹的欺诈风险评估方法，包括：

获取申请用户数据；

清洗所述申请用户数据，得到清洗后数据；

基于所述清洗后数据进行特征提取，得到用户的行为轨迹；

构建基于用户的行为轨迹的欺诈风险评估模型，并进行实时风险评估。

在本公开的一种示例性实施例中，所述清洗所述申请用户数据，得到清洗后数据包括：

将所述申请用户数据分为用户本人特征数据和相关联用户特征数据分别进行清洗。

在本公开的一种示例性实施例中，在所述获得申请用户数据之前，获得存量用户数据库数据。

在本公开的一种示例性实施例中，将申请用户数据与存量用户数据库数据进行比较，判断是否匹配到存量用户数据库中的存量用户，若匹配到则进行所述清洗所述申请用户数据，若未匹配到则结束评估方法。

在本公开的一种示例性实施例中，所述将所述申请用户数据分为用户本人特征数据和相关联用户特征数据分别进行清洗包括：

提取所述用户本人特征数据中的字符型数据和数值型变量。

在本公开的一种示例性实施例中，所述将所述申请用户数据分为用户本人特征数据和相关联用户特征数据分别进行清洗还包括：

提取所述相关联用户特征数据中的字符型数据、数值型变量、关联关系性质变量和关联用户资质标签。

在本公开的一种示例性实施例中，对所述用户本人特征数据中的字符型数据以及所述相关联用户特征数据中的字符型数据采用one-hot编码处理；

对所述用户本人特征数据中的数值型变量以及所述相关联用户特征数据中的数值型变量根据数值分布情况进行分段处理。

在本公开的一种示例性实施例中，将所述相关联用户特征数据中的关联关系性质变量形成有方向性的特征变量。

在本公开的一种示例性实施例中，采用xgboost构建基于用户的行为轨迹的欺诈风险评估模型。

在本公开的一种示例性实施例中，存储实时风险评估得到的异常行为或高危轨迹的用户群。

在本公开的一种示例性实施例中，所述用户行为轨迹包括：

用户操作行为产生的信息。

在本公开的一种示例性实施例中，所述用户行为轨迹还包括：

与该用户相关联的其他存量用户的操作行为。

第二方面，本发明提供一种基于用户行为轨迹的欺诈风险评估装置，包括：

获取模块，用于获取申请用户数据；

清洗模块，用于清洗所述申请用户数据，得到清洗后数据；

行为轨迹模块，用于基于所述清洗后数据进行特征提取，得到用户的行为轨迹；

模型评估模块，用于构建基于用户的行为轨迹的欺诈风险评估模型，并进行实时风险评估。

在本公开的一种示例性实施例中，所述清洗模块包括：

用户本人特征数清洗据单元和相关联用户特征数据清洗单元。

在本公开的一种示例性实施例中，存量用户数据库模块，用于在所述获得申请用户数据之前，获得存量用户数据库数据。

在本公开的一种示例性实施例中，匹配模块，用于将申请用户数据与存量用户数据库数据进行比较，判断是否匹配到存量用户数据库中的存量用户，若匹配到则进行所述清洗所述申请用户数据，若未匹配到则结束评估方法。

在本公开的一种示例性实施例中，所述用户本人特征数清洗据单元包括：

用户本人字符型数据子单元和用户本人数值型变量子单元。

在本公开的一种示例性实施例中，所述相关联用户特征数据清洗单元包括：

相关联用户字符型数据子单元、相关联用户数值型变量子单元、关联关系性质变量子单元和关联用户资质标签子单元。

在本公开的一种示例性实施例中，编码模块，用于对所述用户本人特征数据中的字符型数据以及所述相关联用户特征数据中的字符型数据采用one-hot编码处理；

分段处理模块，用于对所述用户本人特征数据中的数值型变量以及所述相关联用户特征数据中的数值型变量根据数值分布情况进行分段处理。

在本公开的一种示例性实施例中，特征变量模块，用于将所述相关联用户特征数据中的关联关系性质变量形成有方向性的特征变量。

在本公开的一种示例性实施例中，xgboost算法模块，用于采用xgboost构建基于用户的行为轨迹的欺诈风险评估模型。

在本公开的一种示例性实施例中，存储模块，用于存储实时风险评估得到的异常行为或高危轨迹的用户群。

在本公开的一种示例性实施例中，所述行为轨迹模块包括：

用户操作行为单元，用于获取用户操作行为产生的信息。

在本公开的一种示例性实施例中，所述行为轨迹模块还包括：

关联操作行为单元，用于获取与该用户相关联的其他存量用户的操作行为。

第三方面，本说明书提供一种服务器，包括处理器和存储器：所述存储器用于存储上述任一项所述方法的程序；所述处理器被配置为用于执行所述存储器中存储的程序实现上述任一项所述方法的步骤。

第四方面，本说明书实施例提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述任一项所述方法的步骤。

本发明在用户提交资料和存在网络公开行为的情形下，将由用户操作行为产生的信息及与之有相关联的其他账户行为之间的交互及其他账号的风险程度进行特征提取，由此预先检测出用户的异常行为和高危轨迹，从而为客户的风险定价、额度调整和逾期预测提供参考。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性的，并不能限制本公开。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是根据一示例性实施例示出的一种基基于用户行为轨迹的欺诈风险评估方法的流程图。

图2是图1所示方法的详细流程图。

图3是根据另一示例性实施例示出的一种基于用户行为轨迹的欺诈风险评估装置的框图。

图4是根据一示例性实施例示出的一种服务器的框图。

具体实施方式

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

然而，下述的示例实施例能够以多种形式实施，且不应被理解为限于在此阐述的实施例；相反，提供这些实施例使得本公开将全面和完整，并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分，因而将省略对它们的重复描述。

此外，所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中，提供许多具体细节从而给出对本公开的实施例的充分理解。然而，本领域技术人员将意识到，可以实践本公开的技术方案而没有特定细节中的一个或更多，或者可以采用其它的方法、组元、装置、步骤等。在其它情况下，不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。

附图中所示的方框图仅仅是功能实体，不一定必须与物理上独立的实体相对应。即，可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

附图中所示的流程图仅是示例性说明，不是必须包括所有的内容和操作/步骤，也不是必须按所描述的顺序执行。例如，有的操作/步骤还可以分解，而有的操作/步骤可以合并或部分合并，因此实际执行的顺序有可能根据实际情况改变。

应理解，虽然本文中可能使用术语第一、第二、第三等来描述各种组件，但这些组件不应受这些术语限制。这些术语乃用以区分一组件与另一组件。因此，下文论述的第一组件可称为第二组件而不偏离本公开概念的教示。如本文中所使用，术语“及/或”包括相关联的列出项目中的任一个及一或多者的所有组合。

本领域技术人员可以理解，附图只是示例实施例的示意图，附图中的模块或流程并不一定是实施本公开所必须的，因此不能用于限制本公开的保护范围。

本发明提供了一种基于用户行为轨迹的欺诈风险评估方法，用于解决现有技术中用户行为多样化，不利于对用户进行界定和制定策略的问题，为了解决上述问题，本发明的总体思路如下：

基于用户行为轨迹的欺诈风险评估方法，包括：

获取申请用户数据；

清洗所述申请用户数据，得到清洗后数据；

基于所述清洗后数据进行特征提取，得到用户的行为轨迹；

利用数据库存储的数据，对用户数据进行清洗，描绘出用户行为的轨迹。同时，建立模型，实现对信贷申请或借款用户的实时风险评分，找出存在异常行为或者高危轨迹的用户群，从而为客户的风险定价、额度调整和逾期预测提供参考。

首先需要说明书的是，在本发明各个实施例中，所涉及的术语为：

本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

下面，通过几个具体的实施例对本发明的技术方案进行详细介绍和说明。

见图1，本实施例的基于用户行为轨迹的欺诈风险评估方法，包括：

S101：获取申请用户数据；比如在某次公司营销活动，A用户可能做为推荐人推荐很多其他用户参与活动。用户的推荐行为将产生新增用户信息，A用户的申请信息和其推荐的用户的申请信息都属于申请用户数据。为了结合A用户以往的行为以及与A用户相关的其他用户以往的行为，在所述获得申请用户数据之前，获得存量用户数据库数据。存量用户数据库是存放历史用户数据的数据库，这个数据库中会包含A用户以前的相关数据(A用户在该平台的其他行为留下的数据和其他网络公开数据)以及其他用户在该平台留下的数据和网络公开数据。将申请用户数据与存量用户数据库数据进行比较，判断是否匹配到存量用户数据库中的存量用户，若匹配到则说明可以对A用户和与其关联的存量用户进行分析，因此就可以进行所述清洗所述申请用户数据，若未匹配到则结束评估方法。进行这一步操作的目的主要是：在用户提交资料和存在网络公开行为的情形下，将由用户操作行为产生的信息及与之有相关联的其他账户行为之间的交互及其他账号的信息收集起来，用于后续进行特征提取，由此预先检测出用户的异常行为和高危轨迹。

S102：清洗所述申请用户数据，得到清洗后数据；对数据进行清洗时，将所述申请用户数据分为用户本人特征数据和相关联用户特征数据分别进行清洗。

S103：基于所述清洗后数据进行特征提取，得到用户的行为轨迹；用户的行为轨迹用户最近操作和历史操作行为及与之关联的用户的各节点的风险情况。

具体来说，对用户本人的数据，提取所述用户本人特征数据中的字符型数据和数值型变量，用户最新操作会同时产生字符型和数值型两方面的数据，对于字符数据，用one-hot编码加工，对于数值型数据根据数值分布情况进行分段处理。

对与用户相关联的存量用户来说，提取所述相关联用户特征数据中的字符型数据、数值型变量、关联关系性质变量和关联用户资质标签。由于该用户群与用户本人同时存在多种形式的关联关系，这种不同的关联关系可以形成有方向性的特征变量。与此同时匹配到的关联用户本身资质也是特征工程加工非常重要的一个维度。对于这部分人的资质在公司内部若有风险表现则直接用其表现情况作为风险标记，若尚无表现则可以用异常值检测作为其风险标记。

比如，A用户可能做为推荐人推荐很多其他用户参与活动，这部分新增信息可以放置于A用户以往授信或者借款申请活动所形成的信息轨迹进行考察，进行特征工程提取，比如用户操作行为是否异常(如是否和以前登记信息一致、是否更换了注册设备等)或者有其他高风险存在(比如登记的地址/电话信息属于危险标记信息)等等。与此同时，A用户推荐的人形成用户的新增关系网，通过对这部分新增关系网中每个关联节点的风险情况进行鉴别，形成用户新的关系图谱(比如建立以A用户为中心的网络图/树状图等)。在A用户本身新增信息和与其关联的存量用户信息的基础上进行特征提取。

在进行特征提取后，进行特征加工。特征加工则包含原始特征及其交叉组合而成的复杂变量。其中核心在于复杂变量的加工，原因在于每个变量的缺失值分布不同，变量的融合可以降低缺失值的占比，同时部分变量之间也存在非线性相关性，通过对部分变量预先进行LR或者多项式拟合，能显著提升变量的区分度。

S104：构建基于用户的行为轨迹的欺诈风险评估模型，并进行实时风险评估。

具体来说，本实施例采用xgboost构建基于用户的行为轨迹的欺诈风险评估模型。模型通过不断调整超参数以达到最优预测效果，比如通过循环搜索最优参数配置实现。

存储实时风险评估得到的异常行为或高危轨迹的用户群，并对其进行分类，形成新的规则集合。

本实施例通过综合用户最近操作和历史操作行为及与之关联的用户的各节点的风险情况，对用户是否存在异常行为或者出没过高危地点等异常高风险客户提前进行预判。

本实施例采用用户实时数据，使得提取特征更能反映用户性质，同时对用户与数据库存量用户之间庞大的关系网进行计算，因而其特征也更为强大和多样。本发明能够降低高风险用户的覆盖率，同时提高其命中率，使得高风险用户的精准度大大提升。

本发明的另一个实施例如图2，评估方法开始后，根据申请用户数据判断是否匹配到数据库的存量用户，如果否则跳过直接结束，如果匹配到了存量用户，则进行数据清洗，提取用户本人及关联人数据。将提取的数据分成用户本人特征和相关联用户特征分别进行特征提取。其中，用户本人特征提取字符型数据和数值型变量，相关联用户特征则提取字符型数据、数值型变量、关联关系性质变量和关联用户资质标签。将前述这些变量进行融合，并进行复杂变量的加工，采用xgboost构建基于用户的行为轨迹的欺诈风险评估模型，形成新的评估规则。

基于与前述实施例中一种基于用户行为轨迹的欺诈风险评估方法同样的发明构思，本发明还提供一种基于用户行为轨迹的欺诈风险评估的装置，其上存储有计算机程序，该程序被处理器执行时实现前文所述一种信息处理方法的任一方法的步骤。

下述为本公开装置实施例，可以用于执行本发明方法实施例。对于本实施例的装置实施例中未披露的细节，请参照本公开方法实施例。

如图3，基于用户行为轨迹的欺诈风险评估装置，包括：

存量用户数据库模块，用于存储存量用户数据；

获取模块301，用于获取申请用户数据；比如在某次公司营销活动，A用户可能做为推荐人推荐很多其他用户参与活动。用户的推荐行为将产生新增用户信息，A用户的申请信息和其推荐的用户的申请信息都属于申请用户数据。为了结合A用户以往的行为以及与A用户相关的其他用户以往的行为，在所述获得申请用户数据之前，获得存量用户数据库数据。存量用户数据库是存放历史用户数据的数据库，这个数据库中会包含A用户以前的相关数据(A用户在该平台的其他行为留下的数据和其他网络公开数据)以及其他用户在该平台留下的数据和网络公开数据。将申请用户数据与存量用户数据库数据进行比较，判断是否匹配到存量用户数据库中的存量用户，若匹配到则说明可以对A用户和与其关联的存量用户进行分析，因此就可以进行所述清洗所述申请用户数据，若未匹配到则结束评估方法。进行这一步操作的目的主要是：在用户提交资料和存在网络公开行为的情形下，将由用户操作行为产生的信息及与之有相关联的其他账户行为之间的交互及其他账号的信息收集起来，用于后续进行特征提取，由此预先检测出用户的异常行为和高危轨迹。

清洗模块302，用于清洗所述申请用户数据，得到清洗后数据；对数据进行清洗时，将所述申请用户数据分为用户本人特征数据和相关联用户特征数据分别进行清洗

行为轨迹模块303，用于基于所述清洗后数据进行特征提取，得到用户的行为轨迹；用户的行为轨迹用户最近操作和历史操作行为及与之关联的用户的各节点的风险情况。

模型评估模块304，用于构建基于用户的行为轨迹的欺诈风险评估模型，并进行实时风险评估。

所述清洗模块302包括：

用户本人特征数清洗据单元和相关联用户特征数据清洗单元。用户本人特征数清洗据单元包括：用户本人字符型数据子单元和用户本人数值型变量子单元。相关联用户特征数据清洗单元包括：相关联用户字符型数据子单元、相关联用户数值型变量子单元、关联关系性质变量子单元和关联用户资质标签子单元。

具体的，为了方便对用户数据和存量用户数据进行分析，还包括匹配模块，用于将申请用户数据与存量用户数据库数据进行比较，判断是否匹配到存量用户数据库中的存量用户，若匹配到则进行所述清洗所述申请用户数据，若未匹配到则结束评估方法。

具体来说，清洗模块302包括(1)编码模块，用于对所述用户本人特征数据中的字符型数据以及所述相关联用户特征数据中的字符型数据采用one-hot编码处理；(2)分段处理模块，用于对所述用户本人特征数据中的数值型变量以及所述相关联用户特征数据中的数值型变量根据数值分布情况进行分段处理；(3)特征变量模块，用于将所述相关联用户特征数据中的关联关系性质变量形成有方向性的特征变量。由于该用户群与用户本人同时存在多种形式的关联关系，这种不同的关联关系可以形成有方向性的特征变量。与此同时匹配到的关联用户本身资质也是特征工程加工非常重要的一个维度。对于这部分人的资质在公司内部若有风险表现则直接用其表现情况作为风险标记，若尚无表现则可以用异常值检测作为其风险标记。在进行特征提取后，进行特征加工。特征加工则包含原始特征及其交叉组合而成的复杂变量。其中核心在于复杂变量的加工，原因在于每个变量的缺失值分布不同，变量的融合可以降低缺失值的占比，同时部分变量之间也存在非线性相关性，通过对部分变量预先进行LR或者多项式拟合，能显著提升变量的区分度。

行为轨迹模块包括：用户操作行为单元，用于获取用户操作行为产生的信息；和关联操作行为单元，用于获取与该用户相关联的其他存量用户的操作行为。

模型评估模块304包括xgboost算法模块，用于采用xgboost构建基于用户的行为轨迹的欺诈风险评估模型。模型通过不断调整超参数以达到最优预测效果，比如通过循环搜索最优参数配置实现。

优选的，还包括存储模块，用于存储实时风险评估得到的异常行为或高危轨迹的用户群，并对其进行分类，形成新的规则集合。

本说明书第三实施例还提供了一种服务器，包括存储器402、处理器401及存储在存储器402上并可在处理器401上运行的计算机程序，所述处理器401执行所述程序时实现前文所述方法的步骤。为了便于说明，仅示出了与本说明书实施例相关的部分，具体技术细节未揭示的，请参照本说明书实施例方法部分。该服务器，可以是包括各种电子设备形成的服务器设备，PC电脑、网络云服务器，甚至手机、平板电脑、PDA(Personal DigitalAssistant，个人数字助理)、POS(Point of Sales，销售终端)、车载电脑、台式电脑等任意电子设备上设置的服务器功能。

具体地，图4示出的与本说明书实施例提供的技术方案相关的服务器组成结构框图，总线400可以包括任意数量的互联的总线和桥，其将包括由处理器401代表的一个或多个处理器和存储器402代表的存储器的各种电路链接在一起。总线400还可以将诸如***设备、稳压器和功率管理电路等之类的各种其他电路链接在一起，这些都是本领域所公知的，因此，本文不再对其进行进一步描述。总线接口403在总线400和接收器和/或发送器404之间提供接口，接收器和/或发送器404可以是分开独立的接收器或发送器也可以是同一个元件如收发机，提供用于在传输介质上与各种其他装置通信的单元。处理器401负责管理总线400和通常的处理，而存储器402可以被用于存储处理器401在执行操作时所使用的数据。

通过以上的实施方式的描述，本领域的技术人员易于理解，这里描述的示例实施方式可以通过软件实现，也可以通过软件结合必要的硬件的方式来实现。因此，根据本公开实施方式的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个计算机可读存储介质(可以是CD-ROM，U盘，移动硬盘等)中或网络上，包括若干指令以使得一台计算设备(可以是个人计算机、服务器、或者网络设备等)执行根据本公开实施方式的上述方法。

所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输，包括但不限于无线、有线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络，包括局域网(LAN)或广域网(WAN)，连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被一个该设备执行时，使得该计算机可读介质实现如下功能：获取历史信贷数据集，所述历史信贷数据集包括用户的多维度属性信息及逾期信息；基于所述多维度属性信息对所述历史信贷数据集进行自动分档处理以生成多个子数据集；根据所述逾期信息计算所述多个子数据集中每一个子数据集对应的逾期率；以及根据子数据集及其对应的所述逾期率生成信贷风险控制规则。

本领域技术人员可以理解上述各模块可以按照实施例的描述分布于装置中，也可以进行相应变化唯一不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块，也可以进一步拆分成多个子模块。

通过以上的实施例的描述，本领域的技术人员易于理解，这里描述的示例实施例可以通过软件实现，也可以通过软件结合必要的硬件的方式来实现。因此，根据本公开实施例的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM，U盘，移动硬盘等)中或网络上，包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本公开实施例的方法。

尽管已描述了本说明书的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本说明书范围的所有变更和修改。

以上具体地示出和描述了本公开的示例性实施例。应可理解的是，本公开不限于这里描述的详细结构、设置方式或实现方法；相反，本公开意图涵盖包含在所附权利要求的精神和范围内的各种修改和等效设置。此外，本说明书说明书附图所示出的结构、比例、大小等，均仅用以配合说明书所公开的内容，以供本领域技术人员了解与阅读，并非用以限定本公开可实施的限定条件，故不具技术上的实质意义，任何结构的修饰、比例关系的改变或大小的调整，在不影响本公开所能产生的技术效果及所能实现的目的下，均应仍落在本公开所公开的技术内容得能涵盖的范围内。同时，本说明书中所引用的如“上”、“第一”、“第二”及“一”等的用语，也仅为便于叙述的明了，而非用以限定本公开可实施的范围，其相对关系的改变或调整，在无实质变更技术内容下，当也视为本公开可实施的范畴。

Claims

1.基于用户行为轨迹的欺诈风险评估方法，包括：

获取申请用户数据；

清洗所述申请用户数据，得到清洗后数据；

基于所述清洗后数据进行特征提取，得到用户的行为轨迹；

2.根据权利要求1所述的基于用户行为轨迹的欺诈风险评估方法，包括：

所述清洗所述申请用户数据，得到清洗后数据包括：

3.根据权利要求1至2任一项所述的基于用户行为轨迹的欺诈风险评估方法，还包括：

在所述获得申请用户数据之前，获得存量用户数据库数据。

4.根据权利要求1至3任一项所述的基于用户行为轨迹的欺诈风险评估方法，包括：

将申请用户数据与存量用户数据库数据进行比较，判断是否匹配到存量用户数据库中的存量用户，若匹配到则进行所述清洗所述申请用户数据，若未匹配到则结束评估方法。

5.根据权利要求1至4任一项所述的基于用户行为轨迹的欺诈风险评估方法，包括：

所述将所述申请用户数据分为用户本人特征数据和相关联用户特征数据分别进行清洗包括：

提取所述用户本人特征数据中的字符型数据和数值型变量。

6.根据权利要求1至5任一项所述的基于用户行为轨迹的欺诈风险评估方法，包括：

所述将所述申请用户数据分为用户本人特征数据和相关联用户特征数据分别进行清洗还包括：

7.根据权利要求1至6任一项所述的基于用户行为轨迹的欺诈风险评估方法，包括：

对所述用户本人特征数据中的字符型数据以及所述相关联用户特征数据中的字符型数据采用one-hot编码处理；

8.基于用户行为轨迹的欺诈风险评估装置，包括：

获取模块，用于获取申请用户数据；

清洗模块，用于清洗所述申请用户数据，得到清洗后数据；

9.一种服务器，包括处理器和存储器：

所述存储器用于存储执行权利要求1至7任一项所述方法的程序；

所述处理器被配置为用于执行所述存储器中存储的程序。

10.一种计算机可读存储介质，其存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求1至7任一项所述方法的步骤。