CN108154430A - 一种基于机器学习和大数据技术的信用评分构建方法 - Google Patents

一种基于机器学习和大数据技术的信用评分构建方法 Download PDF

Info

Publication number
CN108154430A
CN108154430A CN201711465724.3A CN201711465724A CN108154430A CN 108154430 A CN108154430 A CN 108154430A CN 201711465724 A CN201711465724 A CN 201711465724A CN 108154430 A CN108154430 A CN 108154430A
Authority
CN
China
Prior art keywords
data
credit
risk
machine learning
human
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711465724.3A
Other languages
English (en)
Inventor
周春英
朱明杰
闵薇
朱敏
袁克皋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Krypton Information Technology Co Ltd
Original Assignee
Shanghai Krypton Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Krypton Information Technology Co Ltd filed Critical Shanghai Krypton Information Technology Co Ltd
Priority to CN201711465724.3A priority Critical patent/CN108154430A/zh
Publication of CN108154430A publication Critical patent/CN108154430A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • General Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Marketing (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Educational Administration (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Technology Law (AREA)
  • Evolutionary Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于机器学习和大数据技术的信用评分构建方法,其特征在于,具体包括以下步骤:构建信贷主体人统一用户ID;将具有统一用户ID的信贷主体人数据进行提取和预处理成训练样本数据;通过机器学习分类算法‑集成树模型构建信用风险模型,根据信用风险模型获取风险概率;将风险概率自动转换为信用风险评分。本发明通过ID‑Mapping技术实现了信贷主体人的全域多维度大数据的高效准确的集成与融合,为信用风险模型的构建提供了信贷主体人的全域数据,并在此之上运用机器学习和大数据技术对信贷主体人进行定量信用风险分析从而提升了金融风控能力和降低信贷风险。

Description

一种基于机器学习和大数据技术的信用评分构建方法
技术领域
本发明涉及金融风控技术领域,特别是涉及一种基于机器学习和大数据技术的信用评分构建方法。
背景技术
当下,我国金融改革持续深化,以互联网金融为代表的普惠金融呈爆发式增长。2015年我国消费信贷规模达到19万亿,同比增长23.3%,据第三方权威报告预计2019年将达到41.1万亿之巨。风口背后,一方面是传统金融未服务到的人群基数庞大,且长期缺乏金融产品,因此普惠金融是刚需,规模、潜力巨大;另一方面,移动互联网设备迅速普及,新型交互模式极大提升信贷效率,且数据爆发时代使得海量数据获取成本和难度大幅降低,在此之上运用机器学习技术对庞大人群进行定量风险分析并对应匹配合理的金融服务不仅成为可能,而且规模效应明显。
因此,整个金融行业正在技术、资本和市场的共同作用下发生数字化重构,面对剧烈变化的商业竞争格局和愈加完善的政府监管措施,金融机构纷纷寻求成熟的相关技术以强化其数据化风险体系。
但在实际操作中,由于互联网数据(如行为,电商,社交等数据)与传统征信数据(如信贷记录,银行流水,房产证件等数据)存在天然的巨大差别,传统的金融风险数据技术往往难以对新型互联网数据进行有效的风险价值提取,更无法支撑普惠金融下高并发实时的金融业务需求,具体难点分解如下:
(1)数据融合困难,数据一般来自多个渠道和***,异质异构,且形式多样,诸如文本,时序,影像等类型,数据打通具有较大难度;
(2)数据使用困难,由于数据复杂度极大提升,且具有非结构化,低饱和,稀疏等特性,人工定义特征普遍耗时耗力,效率低;
(3)数据风险建模困难,特征加工之后往往会产生上千甚至上万维度变量,远远超出传统风控建模基于LR和评分卡体系的处理能力范围,急需更前沿的机器学习算法处理相应特征;
(4)模型集成困难,由于单一模型可能存在性能不稳定的问题,往往需要对不同模型进行集成以增强稳定性和泛化能力,传统方式缺乏相应的探索与验证;
(5)数据链条整合困难,从数据接入,预处理,特征加工到风险建模与迭代,形成持续优化的完整闭环***,并且能够快速迁移和复用进不同金融业务取得实际效果,也需要较长时间的积累和打磨。
因此,金融风控领域急需一套更加科学合理以及成熟的基于机器学习和全域大数据技术的信用风险评分构建方法来提升金融风控能力、降低信贷风险。
发明内容
本发明的目的是克服现有技术的不足,设计出一种基于机器学习和大数据技术的信用评分构建方法。
为达到上述目的,本发明所采用的技术方案是:
一种基于机器学习和大数据技术的信用评分构建方法,具体包括以下步骤:
步骤1:构建信贷主体人统一用户ID;
步骤2:将具有统一用户ID的信贷主体人数据进行提取和预处理成训练样本数据;
步骤3:通过机器学习分类算法-集成树模型构建信用风险模型;
具体地,首先,对所述训练样本数据的文本数据、时序数据和移动设备行为数据进行分析,自动提取得到其样本特征;其次,预设超参数最佳选择空间,根据特征选择后的训练样本数据和机器学习分类算法-集成树模型的标准性能指标,利用贝叶斯优化算法自动寻找出最佳超参数组合;根据机器学习分类算法-集成树模型以及最佳超参数组合构建出行为风险子模型、社交风险子模型和语义风险子模型;然后,根据行为风险子模型、社交风险子模型和语义风险子模型获得信用风险集成模型;最后,根据信用风险集成模型获取风险概率;
步骤4:将风险概率自动转换为信用风险评分。
作为优选地,所述步骤1中构建信贷主体人统一用户ID的具体步骤为:
首先,从主流数据平台获取同一信贷主体人的各类身份原始数据;
然后,利用ID-Mapping技术将获取的各类数据信息会聚融合成可唯一标识信贷主体人身份的统一用户ID。
作为优选地,所述主流数据平台包括关系型数据库、分布式数据存贮***、本地文件、在线实时服务调用数据接口。
作为优选地,所述同一信贷主体人的各类身份原始数据包括身份证号、手机号、设备号、用户编号。
作为优选地,所述步骤2中将具有统一用户ID的信贷主体人身份数据预处理成训练样本数据的具体步骤为:
判断信贷主体人身份数据的数据类型,所述数据类型包括离散型数据和连续型数据;
当所述信贷主体人身份数据为离散型数据时,对该数据进行去重复值处理、离散数据填补缺失值处理、去噪音处理以及离散数据特征变换处理;所述离散数据填补缺失值处理包括用户选择、直接丢弃、归为新类别和最高频类别;所述离散数据特征变换处理为二值化/哑编码处理;
当所述信贷主体人身份数据为连续型数据时,对该数据进行去重复值处理、连续数据填补缺失值处理、去噪音处理以及连续数据特征变换处理;所述连续数据填补缺失值处理包括用户选择、均值、归为新类和直接丢弃;所述连续数据特征变换处理包括用户选择、无量纲化、归一化/标准化、取对数。
作为优选地,所述训练样本数据的样本特征包括身份属性、履约能力、信贷历史、行为特质、消费偏好和社交影响。
作为优选地,所述机器学习分类算法-集成树模型采用LightGBM集成树模型、随机森林或XGBoost集成树模型。
作为优选地,所述贝叶斯优化算法采用Grid Search算法、Random Search算法或Hyperopt/skopt算法。
作为优选地,所述步骤4中风险概率转换为信用风险评分的计算公式为:
Factor = pdo/ln(2);
Odds0 = (1-prob_1)/ prob_1;
Offset = score0 – Factor*ln(Odds0));
Score = offset + Factor*ln(Odds));
其中,Factor为Offset计算时使用的调整系数;pdo为好坏比增加一倍时增加的信用分数;Offset为计算Score时使用的调整分数变量;score0为好坏比为1时所对应的信用分,一般取值575;Odds为好坏比,好定义为未违约,坏为违约;prob_1为风险概率输出;Score 为最终计算出的信用风险评分。
本发明的积极有益效果:
1、本发明的基于机器学习和大数据技术的信用评分构建方法,通过ID-Mapping技术实现了信贷主体人的全域多维度大数据的高效准确的集成与融合,为信用风险模型的构建提供了信贷主体人的全域数据,并在此之上运用机器学习和大数据技术对信贷主体人进行定量信用风险分析从而提升了金融风控能力和降低信贷风险。
2、通过采用互联网级别的机器学习分类算法-集成树算法,极大提升了对高维、稀疏、低饱和的大数据的处理和风控建模能力,提升了模型算法训练时间性能、模型的准确性、稳定性。
3、本发明实现了模型算法的并行化(时间性能优化)、参数预置、自动调参、模型评估,形成Piepline式建模方式,从而使得模型构建智能化、标准化、快速化。
附图说明
图1为本发明方法流程图。
图2为将多种身份数据融合成统一用户ID的示意图。
图3为构建信贷主体人统一用户ID的流程图。
图4为信贷主体人数据预处理的流程图。
图5为构建信用风险模型的流程图。
图6为训练样本数据特征提取的流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明了,下面通过附图中示出的具体实施例来描述本发明。但是应该理解,这些描述只是示例性的,而并非要限制本发明的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本发明的概念。
结合图1说明本实施方式,本发明的基于机器学习和大数据技术的信用评分构建方法,可以汇聚信贷主体人的全域多维度大数据,包括移动互联网行为数据、贷款App内行为数据、信贷历史、运营商数据等,在此之上运用机器学习和大数据技术对信贷主体人进行定量信用风险分析从而提升了金融风控能力和降低信贷风险。
具体包括以下步骤:
步骤1:构建信贷主体人统一用户ID。
具体地,首先,从关系型数据库、分布式数据存贮***、本地文件或在线实时服务调用数据接口(如REST API接口)等主流数据平台获取同一信贷主体人的各类身份原始数据,所述身份原始数据包括身份证号、手机号、手机设备号、用户编号、社交网络账号、cookie、mac等数据。然后,利用ID-Mapping技术将获取的各类数据信息会聚融合成可唯一标识信贷主体人身份的统一用户ID。
步骤2:将具有统一用户ID的信贷主体人数据进行提取和预处理成训练样本数据。
机器学习分类模型的训练样本数据一般要求数据完整、二值化、量纲一致等,因此,需要对具有统一用户ID的信贷主体人数据进行预处理操作,所述预处理操作具体包括以下步骤:
首先,判断信贷主体人身份数据的数据类型,所述数据类型包括离散型数据和连续型数据。然后,对数据进行预处理操作。
当所述信贷主体人身份数据为离散型数据时,对该数据进行去重复值处理、离散数据填补缺失值处理、去噪音处理以及离散数据特征变换处理;所述离散数据的填补缺失值处理包括用户选择、直接丢弃、归为新类别和最高频类别;所述离散数据的特征变换处理为二值化/哑编码处理。
当所述信贷主体人身份数据为连续型数据时,对该数据进行去重复值处理、连续数据填补缺失值处理、去噪音处理以及连续数据特征变换处理;所述连续数据填补缺失值处理包括用户选择、均值、归为新类和直接丢弃;所述连续数据特征变换处理包括用户选择、无量纲化、归一化/标准化、取对数。
步骤3:通过机器学习分类算法-集成树模型构建信用风险模型。
具体地,首先,采用统计学方法对所述训练样本数据的文本数据、时序数据和移动设备行为数据进行分析,自动提取得到其样本特征,所述样本特征包括身份属性、履约能力、信贷历史、行为特质、消费偏好和社交影响,所述统计学方法包括描述和推断统计、物理动量以及计量学方法。图5所示,针对训练样本数据的文本数据和时序数据,通过上述统计学方法提取出其描述统计特征、推断统计特征、信息论特征和物理能量相关特征,从而得到最大值第一次出现的位置、估计信息熵、绝对动能等特征数据。针对训练样本数据的移动设备行为数据,通过提取出其金融领域知识特征、基于统计的特征,得到近一个月的通话总次数、联系人数量、安装APP总数等特征数据,所述移动设备行为数据包括通话记录、通讯录、移动APP安装信息、移动设备信息等数据。以电商交易数据这一时序数据为例,利用上述方法,可获得“最近一个月交易次数”,“最近一个月交易金额”等特征数据。
其次,根据机器学习分类算法-集成树模型构建出行为风险子模型、社交风险子模型和语义风险子模型。
由于复杂机器学习模型超参数较多并且参数之间互相依赖,例如LightGBM有多达几十个参数, learning_rate与n_estimators之间存在强依赖关系,使得在模型构建过程中,人工调参不仅对建模人员在算法原理上要求很高并且也很耗时。为了解决人工调参技术门槛高和效率低的问题,本申请中,在集成树模型算法进行数据拟合之前,预设超参数最佳选择空间,根据特征选择后的训练样本数据和机器学习分类算法-集成树模型的标准性能指标(例如AUC/ accuracy),利用贝叶斯优化算法自动调参寻找出模型效果最佳的最佳超参数组合。本实施例具体支持三种贝叶斯优化算法:Grid Search算法、Random Search算法或Hyperopt/skopt算法。
Grid Search算法: 根据预设超参数最佳选择空间,枚举出所有参数组合,针对每个参数组合训练模型并评估,寻找最优参数组合。最耗时,但一定是最优解。
Random Search算法:根据超参数最佳选择空间和取值分布,对参数组合进行随机抽样形成备选参数组合,针对每一个参数组合训练模型并评估,寻找到最优参数组合。时间效率较Grid Search有很大提升,但不保证是最优解。
Hyperopt/skopt算法:基本思想是利用模型算法(目前支持三种算法:GP、GBRT、RF)对优化目标与参数之间进行拟合,并根据贝叶斯编程思想,根据每一轮的拟合结果预测下一轮能使优化目标最大化的最佳参数,迭代进行N轮直到优化目标达到收敛。
根据机器学习分类算法-集成树模型以及最佳超参数组合构建出行为风险子模型、社交风险子模型和语义风险子模型;所述机器学习分类算法-集成树模型可采用LightGBM集成树模型、随机森林或XGBoost集成树模型。
然后,根据行为风险子模型、社交风险子模型和语义风险子模型获得信用风险集成模型;
最后,根据信用风险集成模型获取风险概率;
步骤4:将风险概率自动转换为信用风险评分。
风险概率转换为信用风险评分的计算公式为:
Factor = pdo/ln(2);
Odds0 = (1-prob_1)/ prob_1;
Offset = score0 – Factor*ln(Odds0));
Score = offset + Factor*ln(Odds));
其中,Factor为Offset计算时使用的调整系数,根据pdo计算得到;pdo为好坏比增加一倍时增加的信用分数;Offset最后计算Score时使用的调整分数变量,取值由score0,Factor和Odds计算得到;score0为好坏比为1时所对应的信用分,一般取值575;Odds为好坏比(好定义为未违约,坏为违约);prob_1为风险概率输出;Score 为最终计算出的信用分。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制;尽管参照较佳实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解;依然可以对本发明的具体实施方式进行修改或者对部分技术特征进行等同替换;而不脱离本发明技术方案的精神,其均应涵盖在本发明请求保护的技术方案范围当中。

Claims (9)

1.一种基于机器学习和大数据技术的信用评分构建方法,其特征在于,具体包括以下步骤:
步骤1:构建信贷主体人统一用户ID;
步骤2:将具有统一用户ID的信贷主体人数据进行提取和预处理成训练样本数据;
步骤3:通过机器学习分类算法-集成树模型构建信用风险模型;
具体地,首先,对所述训练样本数据的文本数据、时序数据和移动设备行为数据进行分析,自动提取得到其样本特征;
其次,预设超参数最佳选择空间,根据特征选择后的训练样本数据和机器学习分类算法-集成树模型的标准性能指标,利用贝叶斯优化算法自动寻找出最佳超参数组合;根据机器学习分类算法-集成树模型以及最佳超参数组合构建出行为风险子模型、社交风险子模型和语义风险子模型;
然后,根据行为风险子模型、社交风险子模型和语义风险子模型获得信用风险集成模型;
最后,根据信用风险集成模型获取风险概率;
步骤4:将风险概率自动转换为信用风险评分。
2.根据权利要求1所述的基于机器学习和大数据技术的信用评分构建方法,其特征在于,所述步骤1中构建信贷主体人统一用户ID的具体步骤为:
首先,从主流数据平台获取同一信贷主体人的各类身份原始数据;
然后,利用ID-Mapping技术将获取的各类数据信息会聚融合成可唯一标识信贷主体人身份的统一用户ID。
3.根据权利要求2所述的基于机器学***台包括关系型数据库、分布式数据存贮***、本地文件、在线实时服务调用数据接口。
4.根据权利要求2所述的基于机器学习和大数据技术的信用评分构建方法,其特征在于,所述同一信贷主体人的各类身份原始数据包括身份证号、手机号、设备号、用户编号。
5.根据权利要求1所述的基于机器学习和大数据技术的信用评分构建方法,其特征在于,所述步骤2中将具有统一用户ID的信贷主体人身份数据预处理成训练样本数据的具体步骤为:
判断信贷主体人身份数据的数据类型,所述数据类型包括离散型数据和连续型数据;
当所述信贷主体人身份数据为离散型数据时,对该数据进行去重复值处理、离散数据填补缺失值处理、去噪音处理以及离散数据特征变换处理;所述离散数据填补缺失值处理包括用户选择、直接丢弃、归为新类别和最高频类别;所述离散数据特征变换处理为二值化/哑编码处理;
当所述信贷主体人身份数据为连续型数据时,对该数据进行去重复值处理、连续数据填补缺失值处理、去噪音处理以及连续数据特征变换处理;所述连续数据填补缺失值处理包括用户选择、均值、归为新类和直接丢弃;所述连续数据特征变换处理包括用户选择、无量纲化、归一化/标准化、取对数。
6.根据权利要求1所述的基于机器学习和大数据技术的信用评分构建方法,其特征在于,所述训练样本数据的样本特征包括身份属性、履约能力、信贷历史、行为特质、消费偏好和社交影响。
7.根据权利要求1所述的基于机器学习和大数据技术的信用评分构建方法,其特征在于,所述机器学习分类算法-集成树模型采用LightGBM集成树模型、随机森林或XGBoost集成树模型。
8.根据权利要求1所述的基于机器学习和大数据技术的信用评分构建方法,其特征在于,所述贝叶斯优化算法采用Grid Search算法、Random Search算法或Hyperopt/skopt算法。
9.根据权利要求1所述的基于机器学习和大数据技术的信用评分构建方法,其特征在于,所述步骤4中风险概率转换为信用风险评分的计算公式为:
Factor = pdo/ln(2);
Odds0 = (1-prob_1)/ prob_1;
Offset = score0 – Factor*ln(Odds0);
Score = offset + Factor*ln(Odds);
其中,Factor为Offset计算时使用的调整系数;pdo为好坏比增加一倍时增加的信用分数;Offset为计算Score时使用的调整分数变量;score0为好坏比为1时所对应的信用分;Odds为好坏比,好定义为未违约,坏为违约;prob_1为风险概率输出;Score 为最终计算出的信用风险评分。
CN201711465724.3A 2017-12-28 2017-12-28 一种基于机器学习和大数据技术的信用评分构建方法 Pending CN108154430A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711465724.3A CN108154430A (zh) 2017-12-28 2017-12-28 一种基于机器学习和大数据技术的信用评分构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711465724.3A CN108154430A (zh) 2017-12-28 2017-12-28 一种基于机器学习和大数据技术的信用评分构建方法

Publications (1)

Publication Number Publication Date
CN108154430A true CN108154430A (zh) 2018-06-12

Family

ID=62463496

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711465724.3A Pending CN108154430A (zh) 2017-12-28 2017-12-28 一种基于机器学习和大数据技术的信用评分构建方法

Country Status (1)

Country Link
CN (1) CN108154430A (zh)

Cited By (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108898479A (zh) * 2018-06-28 2018-11-27 中国农业银行股份有限公司 信用评价模型的构建方法及装置
CN109034658A (zh) * 2018-08-22 2018-12-18 重庆邮电大学 一种基于大数据金融的违约用户风险预测方法
CN109299887A (zh) * 2018-11-05 2019-02-01 阿里巴巴集团控股有限公司 一种数据处理方法、装置及电子设备
CN109389494A (zh) * 2018-10-25 2019-02-26 北京芯盾时代科技有限公司 借贷欺诈检测模型训练方法、借贷欺诈检测方法及装置
CN109582724A (zh) * 2018-12-07 2019-04-05 厦门铅笔头信息科技有限公司 分布式自动特征工程***架构
CN109598446A (zh) * 2018-12-09 2019-04-09 国网江苏省电力有限公司扬州供电分公司 一种基于机器学习算法的电费回收风险预警***
CN109657805A (zh) * 2018-12-07 2019-04-19 泰康保险集团股份有限公司 超参数确定方法、装置、电子设备及计算机可读介质
CN109670940A (zh) * 2018-11-12 2019-04-23 深圳壹账通智能科技有限公司 基于机器学习的信用风险评估模型生成方法及相关设备
CN109767071A (zh) * 2018-12-14 2019-05-17 深圳壹账通智能科技有限公司 用户信用评级方法、装置、计算机设备以及存储介质
CN109858633A (zh) * 2019-02-22 2019-06-07 中国工商银行股份有限公司 一种特征信息识别方法及***
CN110097459A (zh) * 2019-05-08 2019-08-06 重庆斐耐科技有限公司 一种基于大数据技术的金融风险评估方法及***
CN110135509A (zh) * 2019-05-21 2019-08-16 重庆斐耐科技有限公司 一种基于神经网络的智能金融信用评分方法
CN110163743A (zh) * 2019-04-28 2019-08-23 钛镕智能科技(苏州)有限公司 一种基于超参数优化的信用评分方法
CN110334814A (zh) * 2019-07-01 2019-10-15 阿里巴巴集团控股有限公司 用于构建风险控制模型的方法和***
CN110348581A (zh) * 2019-06-19 2019-10-18 平安科技(深圳)有限公司 用户特征群中用户特征寻优方法、装置、介质及电子设备
CN110363417A (zh) * 2019-07-02 2019-10-22 北京淇瑀信息科技有限公司 金融风险策略生成方法、装置及电子设备
CN110399818A (zh) * 2019-07-15 2019-11-01 联动优势科技有限公司 一种风险预测的方法和设备
CN110415111A (zh) * 2019-08-01 2019-11-05 信雅达***工程股份有限公司 基于用户数据与专家特征合并逻辑回归信贷审批的方法
CN110458685A (zh) * 2019-06-27 2019-11-15 上海淇馥信息技术有限公司 基于机器学习评分模型识别伪冒风险的方法、装置、电子设备
CN110659741A (zh) * 2019-09-03 2020-01-07 浩鲸云计算科技股份有限公司 一种基于分片式自动学习的ai模型训练***和方法
CN110688373A (zh) * 2019-09-17 2020-01-14 杭州绿度信息技术有限公司 一种基于逻辑回归的offset方法
CN110738564A (zh) * 2019-10-16 2020-01-31 信雅达***工程股份有限公司 贷后风险评估方法及装置、存储介质
CN110765163A (zh) * 2019-10-17 2020-02-07 华普通用技术研究(广州)有限公司 一种大数据处理流程的执行计划生成方法
WO2020114110A1 (zh) * 2018-12-04 2020-06-11 阿里巴巴集团控股有限公司 商户风险防控方法及装置
CN111507829A (zh) * 2020-04-22 2020-08-07 广州东百信息科技有限公司 境外***风控模型迭代方法、装置、设备以及存储介质
CN111652710A (zh) * 2020-06-03 2020-09-11 北京化工大学 一种基于集成树特征提取和Logistic回归的个人信用风险评估方法
CN111798303A (zh) * 2020-07-06 2020-10-20 浙江公共安全技术研究院有限公司 一种法院被执行人履行能力评估的方法
WO2020220810A1 (zh) * 2019-04-30 2020-11-05 京东城市(南京)科技有限公司 数据融合的方法和装置
CN112134847A (zh) * 2020-08-26 2020-12-25 郑州轻工业大学 基于用户流量行为基线的攻击检测方法
CN112734568A (zh) * 2021-01-29 2021-04-30 深圳前海微众银行股份有限公司 信用评分卡模型构建方法、装置、设备及可读存储介质
WO2021093320A1 (zh) * 2019-11-13 2021-05-20 北京百度网讯科技有限公司 用于输出信息的方法和装置
CN113064883A (zh) * 2020-09-28 2021-07-02 开鑫金服(南京)信息服务有限公司 物流风控模型的构建方法、计算机设备和存储介质
TWI733270B (zh) * 2019-12-11 2021-07-11 中華電信股份有限公司 機器學習模型的最佳超參數組態的訓練裝置和訓練方法
CN113298438A (zh) * 2021-06-22 2021-08-24 中国平安财产保险股份有限公司 区域风险等级的评估方法、装置、计算机设备及存储介质
CN113793212A (zh) * 2021-09-24 2021-12-14 重庆富民银行股份有限公司 一种信用评估方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106296301A (zh) * 2016-08-17 2017-01-04 北京集奥聚合科技有限公司 一种房产销售线索的挖掘方法
CN106408184A (zh) * 2016-09-12 2017-02-15 中山大学 一种基于多源异构数据的用户信用评估模型
US20170213280A1 (en) * 2016-01-27 2017-07-27 Huawei Technologies Co., Ltd. System and method for prediction using synthetic features and gradient boosted decision tree

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170213280A1 (en) * 2016-01-27 2017-07-27 Huawei Technologies Co., Ltd. System and method for prediction using synthetic features and gradient boosted decision tree
CN106296301A (zh) * 2016-08-17 2017-01-04 北京集奥聚合科技有限公司 一种房产销售线索的挖掘方法
CN106408184A (zh) * 2016-09-12 2017-02-15 中山大学 一种基于多源异构数据的用户信用评估模型

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
YUFEI XIA 等: "A boosted decision tree approach using Bayesian hyper-parameter optimization for credit scoring", 《EXPERT SYSTEMS WITH APPLICATIONS》 *
张万军: "基于大数据的个人信用风险评估模型研究", 《中国博士学位论文全文数据库 经济与管理科学辑》 *
集奥聚合: "集奥聚合带你解密大数据ID-Mapping", 《WWW.CBDIO.COM/BIGDATA/2016-06/27/CONTENT_5027136.HTM》 *

Cited By (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108898479A (zh) * 2018-06-28 2018-11-27 中国农业银行股份有限公司 信用评价模型的构建方法及装置
CN109034658A (zh) * 2018-08-22 2018-12-18 重庆邮电大学 一种基于大数据金融的违约用户风险预测方法
CN109389494A (zh) * 2018-10-25 2019-02-26 北京芯盾时代科技有限公司 借贷欺诈检测模型训练方法、借贷欺诈检测方法及装置
CN109389494B (zh) * 2018-10-25 2021-11-05 北京芯盾时代科技有限公司 借贷欺诈检测模型训练方法、借贷欺诈检测方法及装置
CN109299887A (zh) * 2018-11-05 2019-02-01 阿里巴巴集团控股有限公司 一种数据处理方法、装置及电子设备
CN109299887B (zh) * 2018-11-05 2022-04-19 创新先进技术有限公司 一种数据处理方法、装置及电子设备
CN109670940A (zh) * 2018-11-12 2019-04-23 深圳壹账通智能科技有限公司 基于机器学习的信用风险评估模型生成方法及相关设备
WO2020114110A1 (zh) * 2018-12-04 2020-06-11 阿里巴巴集团控股有限公司 商户风险防控方法及装置
CN109657805A (zh) * 2018-12-07 2019-04-19 泰康保险集团股份有限公司 超参数确定方法、装置、电子设备及计算机可读介质
CN109657805B (zh) * 2018-12-07 2021-04-23 泰康保险集团股份有限公司 超参数确定方法、装置、电子设备及计算机可读介质
CN109582724B (zh) * 2018-12-07 2022-04-08 厦门铅笔头信息科技有限公司 分布式自动特征工程***架构
CN109582724A (zh) * 2018-12-07 2019-04-05 厦门铅笔头信息科技有限公司 分布式自动特征工程***架构
CN109598446A (zh) * 2018-12-09 2019-04-09 国网江苏省电力有限公司扬州供电分公司 一种基于机器学习算法的电费回收风险预警***
CN109767071A (zh) * 2018-12-14 2019-05-17 深圳壹账通智能科技有限公司 用户信用评级方法、装置、计算机设备以及存储介质
CN109858633A (zh) * 2019-02-22 2019-06-07 中国工商银行股份有限公司 一种特征信息识别方法及***
CN110163743A (zh) * 2019-04-28 2019-08-23 钛镕智能科技(苏州)有限公司 一种基于超参数优化的信用评分方法
WO2020220810A1 (zh) * 2019-04-30 2020-11-05 京东城市(南京)科技有限公司 数据融合的方法和装置
CN110097459A (zh) * 2019-05-08 2019-08-06 重庆斐耐科技有限公司 一种基于大数据技术的金融风险评估方法及***
CN110135509A (zh) * 2019-05-21 2019-08-16 重庆斐耐科技有限公司 一种基于神经网络的智能金融信用评分方法
CN110348581A (zh) * 2019-06-19 2019-10-18 平安科技(深圳)有限公司 用户特征群中用户特征寻优方法、装置、介质及电子设备
CN110348581B (zh) * 2019-06-19 2023-08-18 平安科技(深圳)有限公司 用户特征群中用户特征寻优方法、装置、介质及电子设备
CN110458685A (zh) * 2019-06-27 2019-11-15 上海淇馥信息技术有限公司 基于机器学习评分模型识别伪冒风险的方法、装置、电子设备
CN110334814B (zh) * 2019-07-01 2023-05-02 创新先进技术有限公司 用于构建风险控制模型的方法和***
CN110334814A (zh) * 2019-07-01 2019-10-15 阿里巴巴集团控股有限公司 用于构建风险控制模型的方法和***
CN110363417A (zh) * 2019-07-02 2019-10-22 北京淇瑀信息科技有限公司 金融风险策略生成方法、装置及电子设备
CN110399818A (zh) * 2019-07-15 2019-11-01 联动优势科技有限公司 一种风险预测的方法和设备
CN110415111A (zh) * 2019-08-01 2019-11-05 信雅达***工程股份有限公司 基于用户数据与专家特征合并逻辑回归信贷审批的方法
CN110659741A (zh) * 2019-09-03 2020-01-07 浩鲸云计算科技股份有限公司 一种基于分片式自动学习的ai模型训练***和方法
CN110688373A (zh) * 2019-09-17 2020-01-14 杭州绿度信息技术有限公司 一种基于逻辑回归的offset方法
CN110738564A (zh) * 2019-10-16 2020-01-31 信雅达***工程股份有限公司 贷后风险评估方法及装置、存储介质
CN110765163A (zh) * 2019-10-17 2020-02-07 华普通用技术研究(广州)有限公司 一种大数据处理流程的执行计划生成方法
WO2021093320A1 (zh) * 2019-11-13 2021-05-20 北京百度网讯科技有限公司 用于输出信息的方法和装置
TWI733270B (zh) * 2019-12-11 2021-07-11 中華電信股份有限公司 機器學習模型的最佳超參數組態的訓練裝置和訓練方法
CN111507829A (zh) * 2020-04-22 2020-08-07 广州东百信息科技有限公司 境外***风控模型迭代方法、装置、设备以及存储介质
CN111652710A (zh) * 2020-06-03 2020-09-11 北京化工大学 一种基于集成树特征提取和Logistic回归的个人信用风险评估方法
CN111652710B (zh) * 2020-06-03 2024-01-30 北京化工大学 一种基于集成树特征提取和Logistic回归的个人信用风险评估方法
CN111798303A (zh) * 2020-07-06 2020-10-20 浙江公共安全技术研究院有限公司 一种法院被执行人履行能力评估的方法
CN112134847A (zh) * 2020-08-26 2020-12-25 郑州轻工业大学 基于用户流量行为基线的攻击检测方法
CN113064883A (zh) * 2020-09-28 2021-07-02 开鑫金服(南京)信息服务有限公司 物流风控模型的构建方法、计算机设备和存储介质
CN112734568B (zh) * 2021-01-29 2024-01-12 深圳前海微众银行股份有限公司 信用评分卡模型构建方法、装置、设备及可读存储介质
CN112734568A (zh) * 2021-01-29 2021-04-30 深圳前海微众银行股份有限公司 信用评分卡模型构建方法、装置、设备及可读存储介质
CN113298438A (zh) * 2021-06-22 2021-08-24 中国平安财产保险股份有限公司 区域风险等级的评估方法、装置、计算机设备及存储介质
CN113793212A (zh) * 2021-09-24 2021-12-14 重庆富民银行股份有限公司 一种信用评估方法

Similar Documents

Publication Publication Date Title
CN108154430A (zh) 一种基于机器学习和大数据技术的信用评分构建方法
CN107423442A (zh) 基于用户画像行为分析的应用推荐方法及***,储存介质及计算机设备
CN106709754A (zh) 一种用基于文本挖掘的电力用户分群方法
CN104778173A (zh) 目标用户确定方法、装置及设备
CN104933622A (zh) 一种基于用户和微博主题的微博流行度预测方法及***
CN109376772A (zh) 一种基于神经网络模型的电力负荷组合预测方法
CN110119948B (zh) 基于时变权重动态组合的电力用户信用评价方法及***
Feng et al. [Retracted] Design and Simulation of Human Resource Allocation Model Based on Double‐Cycle Neural Network
CN107145573A (zh) 人工智能客服机器人的问题解答方法及***
CN107918639A (zh) 基于电力大数据主变高峰负荷预测方法及数据仓库***
CN105024886B (zh) 一种基于用户元数据的快速Web服务QoS预测方法
CN109754122A (zh) 一种基于随机森林特征提取的bp神经网络的数值预测方法
CN110147389A (zh) 帐号处理方法和装置、存储介质及电子装置
CN111967971A (zh) 银行客户数据处理方法及装置
Jiang Credit scoring model based on the decision tree and the simulated annealing algorithm
CN108228787A (zh) 按照多级类目处理信息的方法和装置
CN107329887A (zh) 一种基于推荐***的数据处理方法以及装置
CN117291655B (zh) 基于实体、网络协同映射的消费者生命周期运营分析方法
CN111275485A (zh) 基于大数据分析的电网客户等级划分方法、***、计算机设备及存储介质
Si et al. Establishment and improvement of financial decision support system using artificial intelligence and big data
CN117078312A (zh) 一种基于人工智能的广告投放管理方法及***
CN109977977A (zh) 一种识别***的方法及对应装置
CN110738565A (zh) 基于数据集合的房产金融人工智能复合风控模型
Sui et al. [Retracted] Optimization Simulation of Supply‐Side Structure of Agricultural Economy Based on Big Data Analysis in Data Sharing Environment
CN113138977A (zh) 交易转化分析方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180612