CN111898879A

CN111898879A - 一种ai智能风控建模方法

Info

Publication number: CN111898879A
Application number: CN202010679678.2A
Authority: CN
Inventors: 崔忠浩
Original assignee: Beijing Haien Lianxintai Information Technology Co ltd
Current assignee: Beijing Haien Lianxintai Information Technology Co ltd
Priority date: 2020-07-15
Filing date: 2020-07-15
Publication date: 2020-11-06

Abstract

本发明公开一种AI智能风控建模方法，包括如下步骤：准备数据，数据预处理，数据集划分，建立训练模型，使用训练模型训练，评估优化，公布，数据沉淀并反馈。本发明建立了数据处理通路自动化、可溯源、数据易于解释的AI算法，可以兼容多种数据库文件格式，提高其兼容性、提高使用过程中的简便性；同时，训练模型可以自动分析出模型的主要关联属性，并与模型一同公布，便于操作人员理解，降低使用门槛，适合进行广泛的市场推广。

Description

一种AI智能风控建模方法

技术领域

本发明涉及金融科技模型技术领域，具体为一种AI智能风控建模方法。

背景技术

风险控制是指风险管理者采取各种措施和方法，消除或减少风险事件发生的各种可能性，或者风险管理者减少风险事件发生时造成的损失。风险控制可以有效的对各种风险进行管理，有利于企业做出正确的决策，有利于保护企业资产的安全和完整、有利于实现企业的经营活动目标，对于金融领域的企业具有重要的意义。

现有各金融单位使用的软件和数据库不同，因此其生成的数据库文件格式不同。在使用数据库文件进行建模时，难以兼容建模速度较慢。并且，建模后输出的模型的溯源性较差，可解释性较差；建模完成后需要专业的人士进行分析和解释，高度依赖专业人士的主观经验，使用门槛较高。并且，现有建模***的学习周期较长，优化和更新速度较慢。

发明内容

针对现有技术中存在的上述不足，本发明提供一种AI智能风控建模方法。本发明通过以下技术方案实现。

一种AI智能风控建模方法，包括如下步骤：

S1.准备数据，收集存量数据样本；

S2.对数据样本进行预处理，根据数据样本的属性建立宽表数据集；

S3.对所述数据集进行划分，将数据集划分成训练集、测试集和验证集；

S4.建立训练模型；

S5.使用训模型训练，并调整损失函数和优化器；

S6.评估优化，使用S2中所述测试机评估训练模型的测试准确度；

S7.公布，并在业务场景中应用；

S8.应用的数据沉淀并反馈至S1处进入收集的样本中。

作为改进，S4中所述训练模型采用PyTorch开源AI算法框架建立，并通过配置参数对训练过程中的PyTorch开源AI算法框架的调用及数据参数。

作为改进，所述数据样本包括用户的基本信息数据，银行交易流水信息数据，产品持有信息数据，征信数据。

作为改进，S2中所述对数据样本预处理包括整理样本数据的特征，并根据特征标签化建立宽表数据集。

作为改进，S7中所述公布前使用验证集验证模型后发布。

作为改进，所述S7在公布模型时，还同时公布与模型相关的样本属性，并根据与模型相关性从高至低依次排列。

本发明的有益效果：

本发明建立了数据处理通路自动化、可溯源、数据易于解释的AI算法，可以兼容多种数据库文件格式，提高其兼容性、提高使用过程中的简便性；同时，训练模型可以自动分析出模型的主要关联属性，并与模型一同公布，便于操作人员理解，降低使用门槛。

附图说明

图1为本发明一种AI智能风控建模方法运行示意图。

具体实施方式

下面结合具体实施例对本发明的技术方案作更为详细、完整的说明。

实施例1

本实施例公开了一种AI智能风控建模方法，包括如下步骤：

S1.准备数据，收集存量数据样本；数据样本包括用户的基本信息数据，银行交易流水信息数据，用户在银行内的产品持有信息数据，用户征信数据等。

S2.对数据样本进行预处理，根据数据样本的属性建立宽表数据集：由于用户在银行中可能进行多次交易并持有多种产品。因此，将用户的数据与银行交易信息数据和产品持有信息数据按照1：N的方式对应；而用户的基本信息数据和征信数据按照1:1的方式对应；对应完毕后，根据数据的特征，标签化建立宽表数据集。

S3.对所述数据集进行划分，将数据集划分成训练集、测试集和验证集。

S4.建立训练模型：使用PyTorch开源AI算法框架建立，并通过配置参数对训练过程中的PyTorch开源AI算法框架的调用及数据参数。

S5.使用训模型训练，并在训练模型的过程中调整损失函数和优化器：由于样本集中数据无法保证与AI算法中的条件一一对应，因此会产生损失的函数；在训练模型的过程中调整损失函数和优化器，以在对训练结果影响较小的情况下提高训练速度。

S6.评估优化，使用S2中所述测试集评估训练模型的测试准确度。

S7.公布；评估完成后，使用验证集进行验证发布，并在业务场景中应用；在公布模型时，还同时公布与模型相关的样本属性，并根据与模型相关性从高至低依次排列。

S8.应用的数据沉淀并反馈至S1处进入收集的样本中。

本实施例可以兼容多种数据库文件格式，使企业可以更加便捷的建立宽表，减少因文件格式问题带来的麻烦。本实施例在使用训练模型进行训练时，可以根据数据的状态自由调整损失函数和优化器，提高训练结果的精度和训练速度。训练完成后公布的建模模型可以充分反省数据样本的风险状况，并从高至低依次排列与风险模型相关的样本属性，如：用户在企业中的存款金额，用户近24个月内的提现金额，用户近24个月内的提现次数等。因此，本发明公布的风险模型可解释性强，便于理解，无需过度依赖高度专业的技术人才进行风险模型分析，普通操作人员也可以根据模型进行风险评估，使用门槛较低，可以广泛进行市场推广。

显然，所描述的实施例仅是本发明的个别实施例，而不是全部实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施，都属于本发明的保护范围。

Claims

1.一种AI智能风控建模方法，其特征在于，包括如下步骤：

S1.准备数据，收集存量数据样本；

S4.建立训练模型；

S5.使用训模型训练，并调整损失函数和优化器；

S7.公布，并在业务场景中应用；

S8.应用的数据沉淀并反馈至S1处进入收集的样本中。

2.根据权利要求1所述的一种AI智能风控建模方法，其特征在于，S4中所述训练模型采用PyTorch开源AI算法框架建立，并通过配置参数对训练过程中的PyTorch开源AI算法框架的调用及数据参数。

3.根据权利要求1所述的一种AI智能风控建模方法，其特征在于，所述数据样本包括用户的基本信息数据，银行交易流水信息数据，产品持有信息数据，征信数据。

4.根据权利要求1所述的一种AI智能风控建模方法，其特征在于，S2中所述对数据样本预处理包括整理样本数据的特征，并根据特征标签化建立宽表数据集。

5.根据权利要求1所述的一种AI智能风控建模方法，其特征在于，S7中所述公布前使用验证集验证模型后发布。

6.根据权利要求1所述的一种AI智能风控建模方法，其特征在于，所述S7在公布模型时，还同时公布与模型相关的样本属性，并根据与模型相关性从高至低依次排列。