CN108985583A

CN108985583A - 基于人工智能的金融数据风险控制方法及装置

Info

Publication number: CN108985583A
Application number: CN201810677096.3A
Authority: CN
Inventors: 霍雨佳; 张帆; 许超
Original assignee: Bank of China Ltd
Current assignee: Bank of China Ltd
Priority date: 2018-06-27
Filing date: 2018-06-27
Publication date: 2018-12-11

Abstract

本发明实施例提供了一种基于人工智能的金融数据风险控制方法及装置，金融数据风险控制方法包括：采集历史金融数据样本，其中，所述历史金融数据样本中包含有各个交易信息及对应的交易类型标签；基于预设规则、根据所述历史金融数据样本中的各个交易信息及对应的交易类型标签，建立金融数据风控模型；以及，根据所述金融数据风控模型对目标金融数据的交易类型进行预测，并根据预测结果对该目标金融数据进行风险控制。本发明能够有效提高金融数据风险控制的准确性，风险控制过程效率高且智能化程度高。

Description

基于人工智能的金融数据风险控制方法及装置

技术领域

本发明涉及数据处理技术领域，具体涉及一种基于人工智能的金融数据风险控制方法及装置。

背景技术

金融科技的迅猛发展正在深刻改变金融发展模式，同时也引发了金融业务面临的层出不穷的多方面风险。包括信贷中介、不法分子、恶意欺诈等在内的金融风险会使银行以及客户遭受重大财产损失的威胁。因此，需要进行金融数据的风险控制，来确定恶意用户信息，识别客户在支付、活动、理财、风控等业务环节遇到的欺诈威胁，减少资损率，降低企业的损失。

现有技术中，对金融数据进行风险控制的方式通常为根据业务专家的经验积累，通过领域专家的经验制定风控规则因子，并根据该风控规则因子对金融数据进行风险控制。

然而，人为制定风控规则因子的方式方案不仅消耗大量人力成本，而且受限于单个专家掌握的知识领域其规则因子往往不是全局最优方案，也就是说，该方式存在风控效率低、周期长且风控结果不准确的问题。

发明内容

针对现有技术中的问题，本发明提供一种基于人工智能的金融数据风险控制方法及装置，能够有效提高金融数据风险控制的准确性，风险控制过程效率高且智能化程度高。

为解决上述技术问题，本发明提供以下技术方案：

第一方面，本发明提供一种基于人工智能的金融数据风险控制方法，所述金融数据风险控制方法包括：

采集历史金融数据样本，其中，所述历史金融数据样本中包含有各个交易信息及对应的交易类型标签；

基于预设规则、根据所述历史金融数据样本中的各个交易信息及对应的交易类型标签，建立金融数据风控模型；

以及，根据所述金融数据风控模型对目标金融数据的交易类型进行预测，并根据预测结果对该目标金融数据进行风险控制。

一实施例中，所述基于预设规则、根据所述历史金融数据中的各个交易信息及对应的交易类型标签，建立金融数据风控模型，包括：

对所述历史金融数据样本进行预处理；

将预处理后的历史金融数据样本进行抽样，得到训练数据；

基于所述训练数据进行模型特征选择，得到训练特征；

以及，根据所述训练特征对预设分类算法进行模型训练，得到所述金融数据风控模型。

一实施例中，所述对所述历史金融数据样本进行预处理，包括：

对所述历史金融数据样本进行数据清洗处理，筛除噪音数据及重复数据；

以及，对经数据清洗处理后的历史金融数据样本进行数据预分析处理，得到所述经数据清洗处理后的历史金融数据样本的数据结构特征。

一实施例中，所述将预处理后的历史金融数据样本进行抽样，得到训练数据，包括：

根据所述经数据清洗处理后的历史金融数据样本的数据结构特征，对所述经数据清洗处理后的历史金融数据样本进行抽样，得到作为机器学习的训练数据；

其中，所述训练数据中包含有正例样本以及反例样本，且所述正例样本对应第一交易类型标签，所述反例样本对应第二交易类型标签。

一实施例中，所述基于所述训练数据进行模型特征选择，得到训练特征，包括：

根据第一预设规则对所述训练数据进行预处理；

以及，基于第二预设规则将预处理后的训练数据进行筛选，得到所述训练特征。

一实施例中，所述第一预设规则为特征编码、特征归一化、特征离散化和特征降维的方式中的一种方式、全部方式或任意组合；

所述第二预设规则为信息增益判断方式和/或用于体现特征之间的线性关系的相关系数判断方式。

一实施例中，所述根据所述训练特征对预设分类算法进行模型训练，得到所述金融数据风控模型，包括：

根据各个所述训练特征和对应的交易类型标签构建所述预设分类算法的输入特征序列；

以及，基于输入特征序列对所述对预设分类算法进行模型训练，得到所述金融数据风控模型；

其中，所述预设分类算法为决策树算法或随机森林算法。

一实施例中，所述根据所述金融数据风控模型对目标金融数据的交易类型进行预测，并根据预测结果对该目标金融数据进行风险控制，包括：

根据所述金融数据风控模型对目标金融数据的交易类型进行预测，预测得到所述目标金融数据对应的交易类型标签为第一交易类型标签或第二交易类型标签；

以及，若所述交易类型标签为第一交易类型标签，则输出对应的第一预设风险控制结果；

若所述交易类型标签为第二交易类型标签，则输出对应的第二预设风险控制结果。

一实施例中，在所述采集历史金融数据样本之前，所述金融数据风险控制方法还包括：

在各个交易过程完成后，获取各个所述交易过程对应的交易信息；

以及，根据各个交易过程对应的交易类型生成各个交易信息对应的交易类型标签；

将各个所述交易信息存储至历史金融数据样本数据库中，其中，所述历史金融数据样本数据库中存储有各个所述交易信息和交易类型标签之间的对应关系。

一实施例中，所述历史金融数据样本数据库为分布式数据库，且该分布式数据库存储在区块链网络中。

第二方面，本发明提供一种基于人工智能的金融数据风险控制***，所述金融数据风险控制***包括：

历史金融数据样本采集模块，用于采集历史金融数据样本，其中，所述历史金融数据样本中包含有各个交易信息及对应的交易类型标签；

金融数据风控模型构建模块，用于基于预设规则、根据所述历史金融数据样本中的各个交易信息及对应的交易类型标签，建立金融数据风控模型；

风险控制模块，用于根据所述金融数据风控模型对目标金融数据的交易类型进行预测，并根据预测结果对该目标金融数据进行风险控制。

第三方面，本发明提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现所述的基于人工智能的金融数据风险控制方法的步骤。

第四方面，本发明提供一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现所述的基于人工智能的金融数据风险控制方法的步骤。

由上述技术方案可知，本发明提供一种基于人工智能的金融数据风险控制方法实施例，通过采集历史金融数据样本，其中，所述历史金融数据样本中包含有各个交易信息及对应的交易类型标签；基于预设规则、根据所述历史金融数据样本中的各个交易信息及对应的交易类型标签，建立金融数据风控模型；以及，根据所述金融数据风控模型对目标金融数据的交易类型进行预测，并根据预测结果对该目标金融数据进行风险控制，通过直接采集带有交易类型标签的历史金融数据样本建立金融数据风控模型，能够有效提高金融数据风控模型的构建效率，根据金融数据风控模型实现对目标金融数据的智能化数据预测，能够有效提高预测结果的预测效率和准确率，进而能够有效提高金融数据风险控制的准确性，风险控制过程效率高且智能化程度高，也能够满足需要进行金融数据风险控制的目标用户的用户需求并提高用户体验，使得目标用户能够准确识别恶意用户信息，识别客户在支付、活动、理财、风控等业务环节遇到的欺诈威胁，减少资损率，降低企业的损失。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明的基于人工智能的金融数据风险控制方法实施例的流程示意图。

图2为本发明的金融数据风险控制方法实施例的信息交互示意图。

图3为本发明的金融数据风险控制方法实施例中步骤200的具体流程示意图。

图4为本发明的金融数据风险控制方法实施例中的步骤200中的数据处理示意图。

图5为本发明的金融数据风险控制方法实施例中步骤201的具体流程示意图。

图6为本发明的金融数据风险控制方法实施例中步骤203的具体流程示意图。

图7为本发明的金融数据风险控制方法实施例中步骤204的具体流程示意图。

图8为本发明的金融数据风险控制方法实施例中步骤300的具体流程示意图。

图9为本发明的金融数据风险控制方法实施例中的步骤300中的数据处理示意图。

图10为本发明的金融数据风险控制方法实施例中步骤001至003的具体流程示意图。

图11为本发明的金融数据风险控制方法实施例中的步骤001至003中的数据处理示意图。

图12为本发明的金融数据风险控制方法的信息交互示意图。

图13为本发明的基于人工智能的金融数据风险控制方法应用实例的流程示意图。

图14为本发明的金融数据风险控制方法应用实例中的模型训练和模型验证示意图。

图15为本发明的金融数据风险控制方法应用实例中的智能预测示意图。

图16为本发明的基于人工智能的金融数据风险控制***实施例的结构示意图。

图17为本发明的基于人工智能的金融数据风险控制***实施例的另一种结构示意图。

图18为本发明的电子设备实施例的种结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整的描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明的实施例提供一种基于人工智能的金融数据风险控制方法的具体实施方式，参见图1和图2，所述基于人工智能的金融数据风险控制方法具体包括如下内容：

步骤100：采集历史金融数据样本，其中，所述历史金融数据样本中包含有各个交易信息及对应的交易类型标签。

在步骤100中，所述基于人工智能的金融数据风险控制***采集历史金融数据样本，用于构建金融数据风控模型。可以理解的是，所述基于人工智能的金融数据风险控制***可以体现为一种服务器，所述基于人工智能的金融数据风险控制***的硬件组成中也可以包括终端设备，所述终端设备可以具有显示功能。具体地，所述终端设备可以包括智能手机、平板电子设备、网络机顶盒、便携式计算机、台式电脑、个人数字助理(PDA)、车载设备、智能穿戴设备等。其中，所述智能穿戴设备可以包括智能眼镜、智能手表、智能手环等。

所述服务器可以与所述终端设备进行通信。所述服务器与所述终端设备之间可以使用任何合适的网络协议进行通信，包括在本申请提交日尚未开发出的网络协议。所述网络协议例如可以包括TCP/IP协议、UDP/IP协议、HTTP协议、HTTPS协议等。当然，所述网络协议例如还可以包括在上述协议之上使用的RPC协议(Remote Procedure Call Protocol，远程过程调用协议)、REST协议(Representational State Transfer，表述性状态转移协议)等。

在上述描述中，针对目标金融***，需要根据用户需求及具体应用环境建立符合目标金融***的金融数据风控模型，因此，对于每一种目标金融***，均需要采集该目标金融***的历史金融数据样本，并针对该目标金融***的历史金融数据样本建立专用于该种目标金融***的金融数据风控模型，以进一步提高对目标金融数据的智能化数据预测的针对性和准确性。在一种具体举例中，所述金融数据风险控制***采集某金融机构风控***功能测试环境的历史交易数据样本。

可以理解的是，所述交易类型标签用户显示历史金融数据样本的交易类型，且根据目标金融***的具体需求，所述交易类型标签可以设置为两类及两类以上，且后续的金融数据风控模型输出的预测结果即为各类所述交易类型标签中的某一种，也就是说，所述金融数据风控模型实际为一种用于预测金融数据对应的交易类型标签的分类模型，可以根据输入的数据，输出该数据所对应的交易类型标签。在一种举例中，所述目标金融***的交易类型标签有两种，分别为“正常交易”标签和“欺诈交易”标签，为进一步提供数据预测的准确性，所述目标金融***的交易类型标签除了前述两种，还可以包含有“存疑交易”标签、“非欺诈但交易失败”标签等，以进一步提高金融数据风险控制的智能化程度。

步骤200：基于预设规则、根据所述历史金融数据样本中的各个交易信息及对应的交易类型标签，建立金融数据风控模型。

在步骤200中，在采集到用于构建金融数据风控模型的历史金融数据样本之后，所述金融数据风险控制***继续基于预设规则、根据所述历史金融数据样本中的各个交易信息及对应的交易类型标签，建立金融数据风控模型。可以理解的是，所述交易信息用于表示金融用户在目标金融***的交易过程的状态信息，所述交易信息可以包含有金融用户信息、金融用户的账户信息、交易类型、时间、金额等状态信息。

步骤300：根据所述金融数据风控模型对目标金融数据的交易类型进行预测，并根据预测结果对该目标金融数据进行风险控制。

在步骤300中，在构建所述金融数据风控模型之后，所述金融数据风险控制***对外开放，而后接收目标金融***的授权人员在发送风控指令，并根据该风控指令开始根据所述金融数据风控模型对目标金融数据的交易类型进行预测，得到目标金融数据的交易类型标签，进而根据该交易类型标签对该目标金融数据进行风险控制。

从上述描述可知，本发明的实施例提供的基于人工智能的金融数据风险控制方法，通过直接采集带有交易类型标签的历史金融数据样本建立金融数据风控模型，能够有效提高金融数据风控模型的构建效率，根据金融数据风控模型实现对目标金融数据的智能化数据预测，能够有效提高预测结果的预测效率和准确率，进而能够有效提高金融数据风险控制的准确性，风险控制过程效率高且智能化程度高，也能够满足需要进行金融数据风险控制的目标用户的用户需求并提高用户体验，使得目标用户能够准确识别恶意用户信息，识别客户在支付、活动、理财、风控等业务环节遇到的欺诈威胁，减少资损率，降低企业的损失。

在一种具体实施方式中，本发明还提供所述金融数据风险控制方法中步骤200的具体实施方式，参见图3和图4，所述步骤200具体包括如下内容：

步骤201：对所述历史金融数据样本进行预处理。

在步骤201中，参见图5，所述步骤201还具体包括如下内容：

步骤201a：对所述历史金融数据样本进行数据清洗处理，筛除噪音数据及重复数据。

步骤201b：对经数据清洗处理后的历史金融数据样本进行数据预分析处理，得到所述经数据清洗处理后的历史金融数据样本的数据结构特征。

可以理解的是，所述金融数据风险控制***通过数据清洗去除不可信的样本；去除无意义的数据项等；并通过数据预分析了解数据概况及数据分布情况。

步骤202：将预处理后的历史金融数据样本进行抽样，得到训练数据。

在步骤202中，所述步骤202还具体包括如下内容：

所述金融数据风险控制***根据所述经数据清洗处理后的历史金融数据样本的数据结构特征，对所述经数据清洗处理后的历史金融数据样本进行抽样，得到作为机器学习的训练数据；其中，所述训练数据中包含有正例样本以及反例样本，且所述正例样本对应第一交易类型标签，所述反例样本对应第二交易类型标签。可以理解的是，所述金融数据风险控制***分别选择欺诈样本以及非欺诈样本作为机器学习的训练数据。

在上述描述中，所述第一交易类型标签为“正常交易”标签，所述第二交易类型标签为“欺诈交易”标签。可以理解的是，所述交易类型标签还可以包含有第三交易类型标签及第四交易类型标签等，且所述第三交易类型标签可以为“存疑交易”标签，以及，第四交易类型标签可以为“非欺诈但交易失败”标签等。

步骤203：基于所述训练数据进行模型特征选择，得到训练特征。

在步骤203中，参见图6，所述步骤203还具体包括如下内容：

步骤203a：根据第一预设规则对所述训练数据进行预处理。

其中，所述第一预设规则为特征编码、特征归一化、特征离散化和特征降维的方式中的一种方式、全部方式或任意组合。可以理解的是，所述根据第一预设规则对所述训练数据进行预处理为特征工程的处理过程，所述特征工程具体包含有：特征编码、特征归一化、特征离散化和特征降维等。

步骤203b：基于第二预设规则将预处理后的训练数据进行筛选，得到所述训练特征。

其中，所述第二预设规则为信息增益判断方式和/或用于体现特征之间的线性关系的相关系数判断方式。

可以理解的是，若所述第二预设规则为信息增益判断方式，则所述金融数据风险控制***计算所有特征的初始分类熵，计算按某一特征进行分类后的熵值，两次熵值之差就是该特征的信息增益。特征的信息增益越大，其重要程度越高；将信息增益大的特征保留、丢弃信息增益小的特征，用于模型训练。

若所述第二预设规则为相关系数判断方式，则若某些特征的相关系数越大，说明特征存在较强的线性关系。具有强线性关系的特征蕴含的信息对于模型训练是冗余的，舍弃强线性关系的特征可以提高模型训练的效率。

另外，所述金融数据风险控制***可以分别以信息增益判断方式和相关系数判断方式对将预处理后的训练数据进行两次筛选，得到所述训练特征。以进一步提高特征选取的准确性。

步骤204：根据所述训练特征对预设分类算法进行模型训练，得到所述金融数据风控模型。

在步骤204中，参见图7，所述步骤204还具体包括如下内容：

步骤204a：根据各个所述训练特征和对应的交易类型标签构建所述预设分类算法的输入特征序列。

步骤204b：基于输入特征序列对所述对预设分类算法进行模型训练，得到所述金融数据风控模型。其中，所述预设分类算法为决策树算法或随机森林算法。

可以理解的是，所述金融数据风险控制***使用决策树、随机森林等算法训练智能风控模型用于识别欺诈类交易。具体为将经步骤203中的特征选择的特征作为终选特征，并提取终选特征对应原始交易数据的交易类型标签(正常交易、欺诈交易)；根据终选特征与交易类型标签构建决策树、随机森林等算法的输入序列；使用输入特征序列利用决策树、随机森林算法进行是否为欺诈交易的分类训练，最终得到用于事实判断一笔交易是否为欺诈交易的智能风控模型。

从上述描述可知，本发明的实施例提供的基于人工智能的金融数据风险控制方法，通过直接采集带有交易类型标签的历史金融数据样本建立金融数据风控模型，能够有效提高金融数据风控模型的构建效率、可靠性和准确性。

在一种具体实施方式中，本发明还提供所述金融数据风险控制方法中步骤300的具体实施方式，参见图8和图9，所述步骤300具体包括如下内容：

步骤301：根据所述金融数据风控模型对目标金融数据的交易类型进行预测，预测得到所述目标金融数据对应的交易类型标签为第一交易类型标签或第二交易类型标签。

步骤302：若所述交易类型标签为第一交易类型标签，则输出对应的第一预设风险控制结果。

步骤303：若所述交易类型标签为第二交易类型标签，则输出对应的第二预设风险控制结果。

在上述描述中，所述第一交易类型标签为“正常交易”标签，对应的第一预设风险控制结果则为“拒绝”动作，所述第二交易类型标签为“欺诈交易”标签，对应的第二预设风险控制结果则为“放行”动作。可以理解的是，所述交易类型标签还可以包含有第三交易类型标签及第四交易类型标签等，且所述第三交易类型标签为“存疑交易”标签且第四交易类型标签为“非欺诈但交易失败”标签等时，可以输出对于的第三预设风险控制结果，且第三预设风险控制结果可以为“待判定”动作，使得目标金融***对该目标金融数据进行二次判定。在一种举例中，所述金融数据风险控制***对联机请求发送的每一个样本，进行数据清洗，特征选择，缺失值填充，特征编码等过程，由训练模型对输入特征进行预测，对“正常交易”做出“放行”或对“欺诈交易”做出“拒绝”的决策，此时智能风控***就具备了人工智慧的判断能力。

从上述描述可知，本发明的实施例提供的基于人工智能的金融数据风险控制方法，能替代业务专家进行客户行为是否为欺诈行为的判断，可大量降低人力成本，捕获欺诈行为，提高预测准确率，减少企业与客户的资产损失。

在一种具体实施方式中，本发明还提供所述金融数据风险控制方法中在步骤100之前执行的步骤001至步骤003的具体实施方式，参见图10和图11，所述步骤001至步骤003具体包括如下内容：

步骤001：在各个交易过程完成后，获取各个所述交易过程对应的交易信息。

步骤002：根据各个交易过程对应的交易类型生成各个交易信息对应的交易类型标签。

在步骤002中，在历史金融数据样本存储时即生成对应的交易类型标签，以有效提高后续对数据处理及识别的效率。

步骤003：将各个所述交易信息存储至历史金融数据样本数据库中，其中，所述历史金融数据样本数据库中存储有各个所述交易信息和交易类型标签之间的对应关系。

在步骤003中，所述历史金融数据样本数据库为分布式数据库，且该分布式数据库存储在区块链网络中。

从上述描述可知，本发明的实施例提供的基于人工智能的金融数据风险控制方法，通过为历史金融数据样本提供一种可靠且无法篡改的存储方式，能够有效保证构建金融数据风控模型的数据基础的准确性，进而能够有效提高金融数据风险控制的准确性和控制效率。

为进一步的说明本方案，本发明还提供一种基于人工智能的金融数据风险控制方法的具体应用实例，参见图12和图13，所述基于人工智能的金融数据风险控制方法的具体应用实例具体包括如下内容：

首先从分布式数据库中获取包含欺诈与非欺诈的样本。分别从正负样本中随机选取部分样本作为训练，其余作为验证，验证达标的模型，进行联机预测。所述基于人工智能的金融数据风险控制方法具体包含以下步骤：

S1：采集风控***功能测试环境带标签的样本作为智能风控***的训练样本，从数据库导出结构化的数据进行存储。

S2：对训练样本数据进行数据清洗，主要包括去除不可信样本，以及无意义或重复的数据项等。

S3：对数据清洗后的样本进行特征工程，主要包括特征筛选、缺失值填充等，然后进行特征编码，参见表1，将定量和定性的特征向量化，训练样本对原始特征项建模，经过特征编码后转换为固定维度的向量，这样对于整个训练集就获得了一个由训练数据构成的m*n矩阵(横向是n个特征、纵向m条训练样本)；提取样本中的标签数据，得到m维的列向量。

表1

S4：将前面步骤获得的矩阵和列向量作为参数输入分类算法进行机器学习训练，训练后会得到分类模型，供预测步骤使用。

S5：对联机请求的新数据进行数据清洗、特征提取等，得到特征向量，输入训练模型，获取预测结果。

其中，采集风控***功能测试环境带标签的样本作为智能风控***的训练样本，其中包括终端标识、证件信息等描述客户行为的数据项，进行数据存储，作为机器学习的原始样本。

样本获取数据项，作为样本特征，对训练样本进行了数据预分析，数据清洗，缺失值填充。从缺失率，业务等角度出发，筛选描述客户行为的特征项。

参见图14，对本发明应用实例中模型训练的方法进行详细说明：将上述步骤获得的矩阵和列向量作为参数输入分类算法进行机器学习训练数据，训练时从数据集随机选取部分数据作为训练集，剩余数据作为验证集。可使用的分类算法包括：决策树、随机森林，训练后会得到预测模型。

然后利用验证集对得到的模型进行验证，即检查已获取模型的准确率性能，选择符合指标(准确率较高)的模型供后续的预测环节使用。

另外，智能预测环节使用通过超文本传送协议方式提供预测服务，使用开源分布式服务框架通过超文本传送协议方式访问智能预测模块，参见图15，对本发明应用实例中智能预测的方法进行详细说明：

对于开源分布式服务框架发送的一个联机请求，请求为标准的json报文，首先对测试样本进行数据清洗，特征提取，以及特征编码等过程，得到向量化的数据表示，将其输入到上一步训练得到的多个模型中，可以得到每个模型作出的“放行”或“拒绝”的决策，通过德尔菲专家调查法法确定最佳预测结果，将结果以json报文的形式传给请求方。

从上述描述可知，本发明的应用实例提供的基于人工智能的金融数据风险控制方法，提供了低成本、高效率、高准确性的基于人工智能的风控方法。通过对已有历史客户行为数据的学习和训练，让程序具备与人脑类似的判断能力。传统的风控***依赖业务专家规则，需要配合大量的专家经验，并消耗大量人力成本；可根据历史数据自动学习，生成智能风控决策树，对欺诈客户行为进行捕获，一定程度上与专家规则***相互补充，能有效降低人力成本，可以一定程度准确识别恶意用户信息，识别客户在支付、活动、理财、风控等业务环节遇到的欺诈威胁，减少资损率，降低企业的损失；对适用的环境要求很低，迁移性好，Windows或者Unix/Linux环境都能普遍适用。

本发明的实施例提供一种能够实现所述基于人工智能的金融数据风险控制方法的基于人工智能的金融数据风险控制***的具体实施方式，参见图16，所述基于人工智能的金融数据风险控制***具体包括如下内容：

历史金融数据样本采集模块10，用于采集历史金融数据样本，其中，所述历史金融数据样本中包含有各个交易信息及对应的交易类型标签。

金融数据风控模型构建模块20，用于基于预设规则、根据所述历史金融数据样本中的各个交易信息及对应的交易类型标签，建立金融数据风控模型。

风险控制模块30，用于根据所述金融数据风控模型对目标金融数据的交易类型进行预测，并根据预测结果对该目标金融数据进行风险控制。

本申请提供的基于人工智能的金融数据风险控制***的实施例具体可以用于执行上述基于人工智能的金融数据风险控制方法的实施例的处理流程，其功能在此不再赘述，可以参照上述方法实施例的详细描述。

从上述描述可知，本发明的实施例提供的基于人工智能的金融数据风险控制***，通过直接采集带有交易类型标签的历史金融数据样本建立金融数据风控模型，能够有效提高金融数据风控模型的构建效率，根据金融数据风控模型实现对目标金融数据的智能化数据预测，能够有效提高预测结果的预测效率和准确率，进而能够有效提高金融数据风险控制的准确性，风险控制过程效率高且智能化程度高，也能够满足需要进行金融数据风险控制的目标用户的用户需求并提高用户体验，使得目标用户能够准确识别恶意用户信息，识别客户在支付、活动、理财、风控等业务环节遇到的欺诈威胁，减少资损率，降低企业的损失。

在一种具体实施方式中，本发明还提供所述金融数据风险控制***中金融数据风控模型构建模块20的具体实施方式，所述金融数据风控模型构建模块20具体包括如下内容：

历史金融数据样预处理单元21，用于对所述历史金融数据样本进行预处理。

在历史金融数据样预处理单元21中，所述历史金融数据样预处理单元21还具体包括如下内容：

数据清洗子单元21a，用于对所述历史金融数据样本进行数据清洗处理，筛除噪音数据及重复数据。

数据预分析子单元21b，用于对经数据清洗处理后的历史金融数据样本进行数据预分析处理，得到所述经数据清洗处理后的历史金融数据样本的数据结构特征。

训练数据获取单元22，用于将预处理后的历史金融数据样本进行抽样，得到训练数据。

在训练数据获取单元22中，所述训练数据获取单元22还具体包括如下内容：

所述训练数据获取单元22根据所述经数据清洗处理后的历史金融数据样本的数据结构特征，对所述经数据清洗处理后的历史金融数据样本进行抽样，得到作为机器学习的训练数据；其中，所述训练数据中包含有正例样本以及反例样本，且所述正例样本对应第一交易类型标签，所述反例样本对应第二交易类型标签。可以理解的是，所述金融数据风险控制***分别选择欺诈样本以及非欺诈样本作为机器学习的训练数据。

模型特征选择单元23，用于基于所述训练数据进行模型特征选择，得到训练特征。

在模型特征选择单元23中，所述模型特征选择单元23还具体包括如下内容：

训练数据预处理子单元23a，用于根据第一预设规则对所述训练数据进行预处理。

训练数据筛选子单元23b，用于基于第二预设规则将预处理后的训练数据进行筛选，得到所述训练特征。

金融数据风控模型构建单元24，用于根据所述训练特征对预设分类算法进行模型训练，得到所述金融数据风控模型。

在金融数据风控模型构建单元24中，所述金融数据风控模型构建单元24还具体包括如下内容：

输入特征序列构建子单元24a，用于根据各个所述训练特征和对应的交易类型标签构建所述预设分类算法的输入特征序列。

模型训练子单元24b，用于基于输入特征序列对所述对预设分类算法进行模型训练，得到所述金融数据风控模型。其中，所述预设分类算法为决策树算法或随机森林算法。

可以理解的是，所述模型训练子单元24b使用决策树、随机森林等算法训练智能风控模型用于识别欺诈类交易。具体为将经步骤203中的特征选择的特征作为终选特征，并提取终选特征对应原始交易数据的交易类型标签(正常交易、欺诈交易)；根据终选特征与交易类型标签构建决策树、随机森林等算法的输入序列；使用输入特征序列利用决策树、随机森林算法进行是否为欺诈交易的分类训练，最终得到用于事实判断一笔交易是否为欺诈交易的智能风控模型。

从上述描述可知，本发明的实施例提供的基于人工智能的金融数据风险控制***，通过直接采集带有交易类型标签的历史金融数据样本建立金融数据风控模型，能够有效提高金融数据风控模型的构建效率、可靠性和准确性。

在一种具体实施方式中，本发明还提供所述金融数据风险控制***中风险控制模块30的具体实施方式，所述风险控制模块30具体包括如下内容：

预测单元31，用于根据所述金融数据风控模型对目标金融数据的交易类型进行预测，预测得到所述目标金融数据对应的交易类型标签为第一交易类型标签或第二交易类型标签。

第一预设风险控制结果输出单元32，用于若所述交易类型标签为第一交易类型标签，则输出对应的第一预设风险控制结果。

第二预设风险控制结果输出单元33，用于若所述交易类型标签为第二交易类型标签，则输出对应的第二预设风险控制结果。

从上述描述可知，本发明的实施例提供的基于人工智能的金融数据风险控制***，能替代业务专家进行客户行为是否为欺诈行为的判断，可大量降低人力成本，捕获欺诈行为，提高预测准确率，减少企业与客户的资产损失。

在一种具体实施方式中，本发明还提供所述金融数据风险控制***包含有交易信息获取模块01、交易类型标签生成模块02和交易信息存储模块03的具体实施方式，参见图17，所述交易信息获取模块01、交易类型标签生成模块02和交易信息存储模块03具体包括如下内容：

交易信息获取模块01，用于在各个交易过程完成后，获取各个所述交易过程对应的交易信息。

交易类型标签生成模块02，用于根据各个交易过程对应的交易类型生成各个交易信息对应的交易类型标签。

在交易类型标签生成模块02中，在历史金融数据样本存储时即生成对应的交易类型标签，以有效提高后续对数据处理及识别的效率。

交易信息存储模块03，用于将各个所述交易信息存储至历史金融数据样本数据库中，其中，所述历史金融数据样本数据库中存储有各个所述交易信息和交易类型标签之间的对应关系。

在交易信息存储模块03中，所述历史金融数据样本数据库为分布式数据库，且该分布式数据库存储在区块链网络中。

从上述描述可知，本发明的实施例提供的基于人工智能的金融数据风险控制***，通过为历史金融数据样本提供一种可靠且无法篡改的存储方式，能够有效保证构建金融数据风控模型的数据基础的准确性，进而能够有效提高金融数据风险控制的准确性和控制效率。

本发明的实施例提供能够实现上述实施例一中的基于人工智能的金融数据风险控制方法中全部步骤的一种电子设备的具体实施方式，参见图18，所述电子设备具体包括如下内容：

处理器(processor)601、存储器(memory)602、通信接口(CommunicationsInterface)603和总线604；

其中，所述处理器601、存储器602、通信接口603通过所述总线1204完成相互间的通信；所述通信接口603用于实现用户终端、目标金融***以及区块链网络等相关设备之间的信息传输；

所述处理器601用于调用所述存储器602中的计算机程序，所述处理器执行所述计算机程序时实现上述实施例一中的全部步骤，例如，所述处理器执行所述计算机程序时实现下述步骤：

从上述描述可知，本发明的实施例提供的电子设备，通过直接采集带有交易类型标签的历史金融数据样本建立金融数据风控模型，能够有效提高金融数据风控模型的构建效率，根据金融数据风控模型实现对目标金融数据的智能化数据预测，能够有效提高预测结果的预测效率和准确率，进而能够有效提高金融数据风险控制的准确性，风险控制过程效率高且智能化程度高，也能够满足需要进行金融数据风险控制的目标用户的用户需求并提高用户体验，使得目标用户能够准确识别恶意用户信息，识别客户在支付、活动、理财、风控等业务环节遇到的欺诈威胁，减少资损率，降低企业的损失。

本发明的实施例提供能够实现上述实施例一中的基于人工智能的金融数据风险控制方法中全部步骤的一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述实施例一的全部步骤，例如，所述处理器执行所述计算机程序时实现下述步骤：

从上述描述可知，本发明的实施例提供的计算机可读存储介质，通过直接采集带有交易类型标签的历史金融数据样本建立金融数据风控模型，能够有效提高金融数据风控模型的构建效率，根据金融数据风控模型实现对目标金融数据的智能化数据预测，能够有效提高预测结果的预测效率和准确率，进而能够有效提高金融数据风险控制的准确性，风险控制过程效率高且智能化程度高，也能够满足需要进行金融数据风险控制的目标用户的用户需求并提高用户体验，使得目标用户能够准确识别恶意用户信息，识别客户在支付、活动、理财、风控等业务环节遇到的欺诈威胁，减少资损率，降低企业的损失。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于硬件+程序类实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

虽然本申请提供了如实施例或流程图所述的方法操作步骤，但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式，不代表唯一的执行顺序。在实际中的装置或客户端产品执行时，可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。

控制器可以按任何适当的方式实现，例如，控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程逻辑控制器和嵌入微控制器的形式，控制器的例子包括但不限于以下微控制器：ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320，存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的***、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、车载人机交互设备、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

虽然本说明书实施例提供了如实施例或流程图所述的方法操作步骤，但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式，不代表唯一的执行顺序。在实际中的装置或终端产品执行时，可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境，甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下，并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。

为了描述的方便，描述以上装置时以功能分为各种模块分别描述。当然，在实施本说明书实施例时可以把各模块的功能在同一个或多个软件和/或硬件中实现，也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

本领域技术人员应明白，本说明书的实施例可提供为方法、***或计算机程序产品。因此，本说明书实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本说明书实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本说明书实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书实施例，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于***实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本说明书实施例的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

以上所述仅为本说明书实施例的实施例而已，并不用于限制本说明书实施例。对于本领域技术人员来说，本说明书实施例可以有各种更改和变化。凡在本说明书实施例的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本说明书实施例的权利要求范围之内。

Claims

1.一种基于人工智能的金融数据风险控制方法，其特征在于，所述金融数据风险控制方法包括：

2.根据权利要求1所述的金融数据风险控制方法，其特征在于，所述基于预设规则、根据所述历史金融数据中的各个交易信息及对应的交易类型标签，建立金融数据风控模型，包括：

对所述历史金融数据样本进行预处理；

将预处理后的历史金融数据样本进行抽样，得到训练数据；

基于所述训练数据进行模型特征选择，得到训练特征；

3.根据权利要求2所述的金融数据风险控制方法，其特征在于，所述对所述历史金融数据样本进行预处理，包括：

4.根据权利要求3所述的金融数据风险控制方法，其特征在于，所述将预处理后的历史金融数据样本进行抽样，得到训练数据，包括：

5.根据权利要求2所述的金融数据风险控制方法，其特征在于，所述基于所述训练数据进行模型特征选择，得到训练特征，包括：

根据第一预设规则对所述训练数据进行预处理；

6.根据权利要求5所述的金融数据风险控制方法，其特征在于，所述第一预设规则为特征编码、特征归一化、特征离散化和特征降维的方式中的一种方式、全部方式或任意组合；

7.根据权利要求2所述的金融数据风险控制方法，其特征在于，所述根据所述训练特征对预设分类算法进行模型训练，得到所述金融数据风控模型，包括：

其中，所述预设分类算法为决策树算法或随机森林算法。

8.根据权利要求1所述的金融数据风险控制方法，其特征在于，所述根据所述金融数据风控模型对目标金融数据的交易类型进行预测，并根据预测结果对该目标金融数据进行风险控制，包括：

9.根据权利要求1至8任一项所述的金融数据风险控制方法，其特征在于，在所述采集历史金融数据样本之前，所述金融数据风险控制方法还包括：

10.根据权利要求9所述的金融数据风险控制方法，其特征在于，所述历史金融数据样本数据库为分布式数据库，且该分布式数据库存储在区块链网络中。

11.一种基于人工智能的金融数据风险控制***，其特征在于，所述金融数据风险控制***包括：

12.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现权利要求1至10任一项所述的基于人工智能的金融数据风险控制方法的步骤。

13.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现权利要求1至10任一项所述的基于人工智能的金融数据风险控制方法的步骤。