CN111898879A - 一种ai智能风控建模方法 - Google Patents
一种ai智能风控建模方法 Download PDFInfo
- Publication number
- CN111898879A CN111898879A CN202010679678.2A CN202010679678A CN111898879A CN 111898879 A CN111898879 A CN 111898879A CN 202010679678 A CN202010679678 A CN 202010679678A CN 111898879 A CN111898879 A CN 111898879A
- Authority
- CN
- China
- Prior art keywords
- data
- model
- training
- modeling method
- wind control
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 22
- 238000012549 training Methods 0.000 claims abstract description 36
- 238000007781 pre-processing Methods 0.000 claims abstract description 6
- 238000012360 testing method Methods 0.000 claims description 7
- 238000012795 verification Methods 0.000 claims description 6
- 238000011835 investigation Methods 0.000 claims description 4
- 238000010200 validation analysis Methods 0.000 claims 1
- 238000012545 processing Methods 0.000 abstract description 2
- 230000001376 precipitating effect Effects 0.000 abstract 1
- 230000006870 function Effects 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 4
- 238000005457 optimization Methods 0.000 description 2
- 238000012954 risk control Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Educational Administration (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开一种AI智能风控建模方法,包括如下步骤:准备数据,数据预处理,数据集划分,建立训练模型,使用训练模型训练,评估优化,公布,数据沉淀并反馈。本发明建立了数据处理通路自动化、可溯源、数据易于解释的AI算法,可以兼容多种数据库文件格式,提高其兼容性、提高使用过程中的简便性;同时,训练模型可以自动分析出模型的主要关联属性,并与模型一同公布,便于操作人员理解,降低使用门槛,适合进行广泛的市场推广。
Description
技术领域
本发明涉及金融科技模型技术领域,具体为一种AI智能风控建模方法。
背景技术
风险控制是指风险管理者采取各种措施和方法,消除或减少风险事件发生的各种可能性,或者风险管理者减少风险事件发生时造成的损失。风险控制可以有效的对各种风险进行管理,有利于企业做出正确的决策,有利于保护企业资产的安全和完整、有利于实现企业的经营活动目标,对于金融领域的企业具有重要的意义。
现有各金融单位使用的软件和数据库不同,因此其生成的数据库文件格式不同。在使用数据库文件进行建模时,难以兼容建模速度较慢。并且,建模后输出的模型的溯源性较差,可解释性较差;建模完成后需要专业的人士进行分析和解释,高度依赖专业人士的主观经验,使用门槛较高。并且,现有建模***的学习周期较长,优化和更新速度较慢。
发明内容
针对现有技术中存在的上述不足,本发明提供一种AI智能风控建模方法。本发明通过以下技术方案实现。
一种AI智能风控建模方法,包括如下步骤:
S1.准备数据,收集存量数据样本;
S2.对数据样本进行预处理,根据数据样本的属性建立宽表数据集;
S3.对所述数据集进行划分,将数据集划分成训练集、测试集和验证集;
S4.建立训练模型;
S5.使用训模型训练,并调整损失函数和优化器;
S6.评估优化,使用S2中所述测试机评估训练模型的测试准确度;
S7.公布,并在业务场景中应用;
S8.应用的数据沉淀并反馈至S1处进入收集的样本中。
作为改进,S4中所述训练模型采用PyTorch开源AI算法框架建立,并通过配置参数对训练过程中的PyTorch开源AI算法框架的调用及数据参数。
作为改进,所述数据样本包括用户的基本信息数据,银行交易流水信息数据,产品持有信息数据,征信数据。
作为改进,S2中所述对数据样本预处理包括整理样本数据的特征,并根据特征标签化建立宽表数据集。
作为改进,S7中所述公布前使用验证集验证模型后发布。
作为改进,所述S7在公布模型时,还同时公布与模型相关的样本属性,并根据与模型相关性从高至低依次排列。
本发明的有益效果:
本发明建立了数据处理通路自动化、可溯源、数据易于解释的AI算法,可以兼容多种数据库文件格式,提高其兼容性、提高使用过程中的简便性;同时,训练模型可以自动分析出模型的主要关联属性,并与模型一同公布,便于操作人员理解,降低使用门槛。
附图说明
图1为本发明一种AI智能风控建模方法运行示意图。
具体实施方式
下面结合具体实施例对本发明的技术方案作更为详细、完整的说明。
实施例1
本实施例公开了一种AI智能风控建模方法,包括如下步骤:
S1.准备数据,收集存量数据样本;数据样本包括用户的基本信息数据,银行交易流水信息数据,用户在银行内的产品持有信息数据,用户征信数据等。
S2.对数据样本进行预处理,根据数据样本的属性建立宽表数据集:由于用户在银行中可能进行多次交易并持有多种产品。因此,将用户的数据与银行交易信息数据和产品持有信息数据按照1:N的方式对应;而用户的基本信息数据和征信数据按照1:1的方式对应;对应完毕后,根据数据的特征,标签化建立宽表数据集。
S3.对所述数据集进行划分,将数据集划分成训练集、测试集和验证集。
S4.建立训练模型:使用PyTorch开源AI算法框架建立,并通过配置参数对训练过程中的PyTorch开源AI算法框架的调用及数据参数。
S5.使用训模型训练,并在训练模型的过程中调整损失函数和优化器:由于样本集中数据无法保证与AI算法中的条件一一对应,因此会产生损失的函数;在训练模型的过程中调整损失函数和优化器,以在对训练结果影响较小的情况下提高训练速度。
S6.评估优化,使用S2中所述测试集评估训练模型的测试准确度。
S7.公布;评估完成后,使用验证集进行验证发布,并在业务场景中应用;在公布模型时,还同时公布与模型相关的样本属性,并根据与模型相关性从高至低依次排列。
S8.应用的数据沉淀并反馈至S1处进入收集的样本中。
本实施例可以兼容多种数据库文件格式,使企业可以更加便捷的建立宽表,减少因文件格式问题带来的麻烦。本实施例在使用训练模型进行训练时,可以根据数据的状态自由调整损失函数和优化器,提高训练结果的精度和训练速度。训练完成后公布的建模模型可以充分反省数据样本的风险状况,并从高至低依次排列与风险模型相关的样本属性,如:用户在企业中的存款金额,用户近24个月内的提现金额,用户近24个月内的提现次数等。因此,本发明公布的风险模型可解释性强,便于理解,无需过度依赖高度专业的技术人才进行风险模型分析,普通操作人员也可以根据模型进行风险评估,使用门槛较低,可以广泛进行市场推广。
显然,所描述的实施例仅是本发明的个别实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施,都属于本发明的保护范围。
Claims (6)
1.一种AI智能风控建模方法,其特征在于,包括如下步骤:
S1.准备数据,收集存量数据样本;
S2.对数据样本进行预处理,根据数据样本的属性建立宽表数据集;
S3.对所述数据集进行划分,将数据集划分成训练集、测试集和验证集;
S4.建立训练模型;
S5.使用训模型训练,并调整损失函数和优化器;
S6.评估优化,使用S2中所述测试机评估训练模型的测试准确度;
S7.公布,并在业务场景中应用;
S8.应用的数据沉淀并反馈至S1处进入收集的样本中。
2.根据权利要求1所述的一种AI智能风控建模方法,其特征在于,S4中所述训练模型采用PyTorch开源AI算法框架建立,并通过配置参数对训练过程中的PyTorch开源AI算法框架的调用及数据参数。
3.根据权利要求1所述的一种AI智能风控建模方法,其特征在于,所述数据样本包括用户的基本信息数据,银行交易流水信息数据,产品持有信息数据,征信数据。
4.根据权利要求1所述的一种AI智能风控建模方法,其特征在于,S2中所述对数据样本预处理包括整理样本数据的特征,并根据特征标签化建立宽表数据集。
5.根据权利要求1所述的一种AI智能风控建模方法,其特征在于,S7中所述公布前使用验证集验证模型后发布。
6.根据权利要求1所述的一种AI智能风控建模方法,其特征在于,所述S7在公布模型时,还同时公布与模型相关的样本属性,并根据与模型相关性从高至低依次排列。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010679678.2A CN111898879A (zh) | 2020-07-15 | 2020-07-15 | 一种ai智能风控建模方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010679678.2A CN111898879A (zh) | 2020-07-15 | 2020-07-15 | 一种ai智能风控建模方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111898879A true CN111898879A (zh) | 2020-11-06 |
Family
ID=73192724
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010679678.2A Pending CN111898879A (zh) | 2020-07-15 | 2020-07-15 | 一种ai智能风控建模方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111898879A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113408207A (zh) * | 2021-06-24 | 2021-09-17 | 上海硕恩网络科技股份有限公司 | 基于社会网络分析技术的数据挖掘的一种方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070016542A1 (en) * | 2005-07-01 | 2007-01-18 | Matt Rosauer | Risk modeling system |
CN107368936A (zh) * | 2016-05-12 | 2017-11-21 | 阿里巴巴集团控股有限公司 | 风控模型训练方法和装置 |
CN107886425A (zh) * | 2017-10-25 | 2018-04-06 | 上海壹账通金融科技有限公司 | 信贷评估方法、装置、设备及计算机可读存储介质 |
CN108985583A (zh) * | 2018-06-27 | 2018-12-11 | 中国银行股份有限公司 | 基于人工智能的金融数据风险控制方法及装置 |
CN109034658A (zh) * | 2018-08-22 | 2018-12-18 | 重庆邮电大学 | 一种基于大数据金融的违约用户风险预测方法 |
-
2020
- 2020-07-15 CN CN202010679678.2A patent/CN111898879A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070016542A1 (en) * | 2005-07-01 | 2007-01-18 | Matt Rosauer | Risk modeling system |
CN107368936A (zh) * | 2016-05-12 | 2017-11-21 | 阿里巴巴集团控股有限公司 | 风控模型训练方法和装置 |
CN107886425A (zh) * | 2017-10-25 | 2018-04-06 | 上海壹账通金融科技有限公司 | 信贷评估方法、装置、设备及计算机可读存储介质 |
CN108985583A (zh) * | 2018-06-27 | 2018-12-11 | 中国银行股份有限公司 | 基于人工智能的金融数据风险控制方法及装置 |
CN109034658A (zh) * | 2018-08-22 | 2018-12-18 | 重庆邮电大学 | 一种基于大数据金融的违约用户风险预测方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113408207A (zh) * | 2021-06-24 | 2021-09-17 | 上海硕恩网络科技股份有限公司 | 基于社会网络分析技术的数据挖掘的一种方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108846520B (zh) | 贷款逾期预测方法、装置以及计算机可读存储介质 | |
CN109271374B (zh) | 一种基于机器学习的数据库健康度打分方法和打分*** | |
CN110428322A (zh) | 一种业务数据的适配方法及装置 | |
CN111177250A (zh) | 一种异常交易监测方法、***及存储介质 | |
CN113468296A (zh) | 可配置业务逻辑的模型自迭代式智能客服质检***与方法 | |
CN107643956A (zh) | 定位异常数据的异常起源的方法和装置 | |
CN111898879A (zh) | 一种ai智能风控建模方法 | |
CN115221380A (zh) | 一种城建档案的批量管理方法、***和平台 | |
CN111429155A (zh) | 银行卡争议处理方法及装置 | |
CN113569988A (zh) | 一种算法模型评测方法及*** | |
CN111222033A (zh) | 一种基于海量数据监管网络餐饮企业的方法和*** | |
CN115564276A (zh) | 项目统计储备管理***、方法及存储介质 | |
CN113177733B (zh) | 基于卷积神经网络的中小微企业数据建模方法及*** | |
CN115170295A (zh) | 一种企业信用风险评估处理方法及装置 | |
CN113449923A (zh) | 一种多模型标的物行情预测方法和装置 | |
CN115080732A (zh) | 投诉工单处理方法、装置、电子设备和存储介质 | |
CN110414819B (zh) | 一种工单评分方法 | |
CN113516544A (zh) | 一种基于大数据的智能风控管理***及方法 | |
CN113313531A (zh) | 一种基于用户需求的电商试用评价与推荐*** | |
CN111951099A (zh) | 一种***发卡模型及其运用方法 | |
CN114066593A (zh) | 一种养殖经营户信贷决策方法 | |
CN110956471A (zh) | 装修行业征信数据的分析方法 | |
CN110020802A (zh) | 一种金融行业的理财安全*** | |
CN112863490B (zh) | 一种语料获取方法及装置 | |
Kobayashi et al. | Using self-learning RPA to automate a greater range of business tasks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201106 |
|
RJ01 | Rejection of invention patent application after publication |