CN112734559B - 企业信用风险评价方法、装置及电子设备 - Google Patents

企业信用风险评价方法、装置及电子设备 Download PDF

Info

Publication number
CN112734559B
CN112734559B CN202011643781.8A CN202011643781A CN112734559B CN 112734559 B CN112734559 B CN 112734559B CN 202011643781 A CN202011643781 A CN 202011643781A CN 112734559 B CN112734559 B CN 112734559B
Authority
CN
China
Prior art keywords
risk
enterprise
data
target
exogenous
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011643781.8A
Other languages
English (en)
Other versions
CN112734559A (zh
Inventor
任亮
傅雨梅
王璞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhiyin Intelligent Technology Co ltd
Original Assignee
Beijing Zhiyin Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhiyin Intelligent Technology Co ltd filed Critical Beijing Zhiyin Intelligent Technology Co ltd
Priority to CN202011643781.8A priority Critical patent/CN112734559B/zh
Publication of CN112734559A publication Critical patent/CN112734559A/zh
Application granted granted Critical
Publication of CN112734559B publication Critical patent/CN112734559B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/06Asset management; Financial planning or analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Technology Law (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Artificial Intelligence (AREA)
  • Educational Administration (AREA)
  • Operations Research (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Tourism & Hospitality (AREA)
  • Medical Informatics (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明提供了一种企业信用风险评价方法、装置及电子设备,涉及数据处理技术领域,在对目标企业进行企业信用风险评价时,先获取目标企业的风险评估数据;然后根据风险评估数据和预先构建的指标体系,确定目标内生风险特征和目标外生风险特征;其中,该指标体系包括内生风险指标和基于知识图谱得到的外生风险指标;根据目标内生风险特征、目标外生风险特征、训练后的内生风险评价模型和训练后的外生风险评价模型,确定目标企业的信用风险评价结果。与现有的基于规则的评价方式相比,这种基于数理统计和机器学习的评价方式,以数据的统计规律为主,受人为的主观风险偏好影响较小,且运行相对稳定,使得效果更加稳定,提高了风险评价结果的可靠性。

Description

企业信用风险评价方法、装置及电子设备
技术领域
本发明涉及数据处理技术领域,尤其是涉及一种企业信用风险评价方法、装置及电子设备。
背景技术
企业信用风险又称违约风险,是指企业因种种原因,不愿或无力履行合同条件而构成违约,致使银行、投资者或交易对方遭受损失的可能性。
目前的企业信用风险评价方案通常是基于专家制定的相关规则,也即根据人工设定的风险传播规则来进行企业信用风险的评价。由于该类方案受专家主观影响较大,因此容易出现人为偏差,且效果不稳定,导致风险评价结果的可靠性较差。
发明内容
本发明的目的在于提供一种企业信用风险评价方法、装置及电子设备,以提高风险评价结果的可靠性。
本发明实施例提供了一种企业信用风险评价方法,包括:
获取目标企业的风险评估数据;
根据所述风险评估数据和预先构建的指标体系,确定目标内生风险特征和目标外生风险特征;其中,所述指标体系包括内生风险指标和基于知识图谱得到的外生风险指标;
根据所述目标内生风险特征、所述目标外生风险特征、训练后的内生风险评价模型和训练后的外生风险评价模型,确定所述目标企业的信用风险评价结果。
进一步地,获取目标企业的风险评估数据的步骤,包括:
通过预设的数据服务商采购目标企业的风险评估数据,所述风险评估数据包括工商数据、司法数据、股市债市交易数据、公告数据、企业经营数据、财务数据、企业关系数据、企业担保数据和评级数据。
进一步地,根据所述风险评估数据和预先构建的指标体系,确定目标内生风险特征和目标外生风险特征的步骤,包括:
通过预设的关系型数据库对所述风险评估数据进行数据加工和整合,得到数据报表;所述数据报表包括企业基础信息表、关系类报表、财务类报表、经营类报表、公告类报表、舆情类报表、担保类报表、金融市场交易类报表、外部评级类报表、司法类报表和企业信贷类报表;
根据所述数据报表,生成与所述内生风险指标对应的目标内生风险特征和与所述外生风险指标对应的目标外生风险特征;其中,所述内生风险指标包括管理结构、企业属性、违法信息、信用记录、盈利能力、资产结构评价、偿债能力、现金流量、收益质量、成长能力和司法涉诉;所述外生风险指标包括结构指标、规模指标、衰减因子和免疫因子,所述结构指标与内部成员数和平均出入度有关,所述规模指标与总资产、总负债、总收入、总利润和利润为负的客户数量有关,所述衰减因子与不良客户数量和存量授信余额的客户数量有关,所述免疫因子与违约概率成负相关。
进一步地,根据所述目标内生风险特征、所述目标外生风险特征、训练后的内生风险评价模型和训练后的外生风险评价模型,确定所述目标企业的信用风险评价结果的步骤,包括:
将所述目标内生风险特征和所述目标外生风险特征分别输入训练后的内生风险评价模型和训练后的外生风险评价模型,得到所述内生风险评价模型输出的内生风险违约概率和所述外生风险评价模型输出的外生风险违约概率;
根据所述内生风险违约概率和所述外生风险违约概率,确定所述目标企业的信用风险评价结果。
进一步地,根据所述内生风险违约概率和所述外生风险违约概率,确定所述目标企业的信用风险评价结果的步骤,包括:
将所述内生风险违约概率和所述外生风险违约概率分别与预设概率阈值进行比较,得到比较结果;
根据所述比较结果,确定所述目标企业的信用风险评价结果。
进一步地,所述方法还包括:
获取训练集样本,所述训练集样本包括历史信贷企业在预测窗口内的历史评估数据和预测时间点的实际信贷违约结果;
根据所述历史评估数据和所述指标体系,确定样本内生风险特征和样本外生风险特征;
根据所述样本内生风险特征和所述实际信贷违约结果,对初始内生风险评价模型进行训练,得到训练后的内生风险评价模型;
根据所述样本外生风险特征和所述实际信贷违约结果,对初始外生风险评价模型进行训练,得到训练后的外生风险评价模型。
进一步地,根据所述样本内生风险特征和所述实际信贷违约结果,对初始内生风险评价模型进行训练,得到训练后的内生风险评价模型的步骤,包括:
根据所述样本内生风险特征和所述实际信贷违约结果,通过K折交叉验证和网格搜索算法对预设的多种初始机器学习模型进行训练,得到多种训练后的机器学习模型;
将多种所述机器学习模型中的最优模型确定为训练后的内生风险评价模型。
本发明实施例还提供了一种企业信用风险评价装置,包括:
数据获取模块,用于获取目标企业的风险评估数据;
特征确定模块,用于根据所述风险评估数据和预先构建的指标体系,确定目标内生风险特征和目标外生风险特征;其中,所述指标体系包括内生风险指标和基于知识图谱得到的外生风险指标;
结果确定模块,用于根据所述目标内生风险特征、所述目标外生风险特征、训练后的内生风险评价模型和训练后的外生风险评价模型,确定所述目标企业的信用风险评价结果。
本发明实施例还提供了一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的企业信用风险评价方法。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述的企业信用风险评价方法。
本发明实施例提供的企业信用风险评价方法、装置及电子设备,在对目标企业进行企业信用风险评价时,先获取目标企业的风险评估数据;然后根据风险评估数据和预先构建的指标体系,确定目标内生风险特征和目标外生风险特征;其中,该指标体系包括内生风险指标和基于知识图谱得到的外生风险指标;根据目标内生风险特征、目标外生风险特征、训练后的内生风险评价模型和训练后的外生风险评价模型,确定目标企业的信用风险评价结果。这样利用机器学习和知识图谱理论工具,构建了可以做到分时频率更新企业信用风险评价结果。与现有的基于规则的评价方式相比,这种基于数理统计和机器学习的评价方式,以数据的统计规律为主,受人为的主观风险偏好影响较小,且运行相对稳定,使得效果更加稳定,提高了风险评价结果的可靠性。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种企业信用风险评价方法的流程示意图;
图2为本发明实施例提供的一种模型训练的流程示意图;
图3为本发明实施例提供的一种企业信用风险评价方法的实施架构示意图;
图4为本发明实施例提供的一种企业信用风险评价方法的结果展示示意图;
图5为本发明实施例提供的一种企业信用风险评价装置的结构示意图;
图6为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
机器学习是研究怎样使用计算机模拟或实现人类学习活动的科学,其理论和方法已被广泛应用于解决工程应用和科学领域的复杂问题,是人工智能中最具智能特征,最前沿的研究领域之一。自20世纪80年代以来,机器学习作为实现人工智能的途径,在人工智能界引起了广泛的兴趣,特别是近十几年来,机器学习领域的研究工作发展很快,它已成为人工智能的重要课题之一。机器学习不仅在基于知识的***中得到应用,而且在自然语言理解、非单调推理、机器视觉、模式识别等许多领域也得到了广泛应用。一个***是否具有学习能力已成为是否具有“智能”的一个标志。机器学习的研究主要分为两类研究方向:第一类是传统机器学习的研究,该类研究主要是研究学习机制,注重探索模拟人的学习机制;第二类是大数据环境下机器学习的研究,该类研究主要是研究如何有效利用信息,注重从巨量数据中获取隐藏的、有效的、可理解的知识。
基于此,本发明实施例提供的一种企业信用风险评价方法、装置及电子设备,大数据背景下,借助机器学习和知识图谱理论工具,解决企业内部风险和外部风险的量化和评价问题,可以提高风险评价结果的可靠性。
为便于对本实施例进行理解,首先对本发明实施例所公开的一种企业信用风险评价方法进行详细介绍。
本发明实施例提供了一种企业信用风险评价方法,该方法可以由具有数据处理能力的电子设备执行,该电子设备例如是台式电脑、笔记本电脑、平板电脑或手机等。参见图1所示的一种企业信用风险评价方法的流程示意图,该方法主要包括如下步骤S102~步骤S106:
步骤S102,获取目标企业的风险评估数据。
在一些可能的实施例中,可以通过第三渠道的诸如大智慧、汇法、元素等预设的数据服务商采购目标企业的风险评估数据,该风险评估数据可以包括工商数据、司法数据、股市债市交易数据、公告数据、企业经营数据、财务数据、企业关系数据、企业担保数据和评级数据等。
步骤S104,根据风险评估数据和预先构建的指标体系,确定目标内生风险特征和目标外生风险特征;其中,该指标体系包括内生风险指标和基于知识图谱得到的外生风险指标。
在一些可能的实施例中,可以先通过预设的关系型数据库对风险评估数据进行数据加工和整合,得到数据报表;该数据报表包括企业基础信息表、关系类报表、财务类报表、经营类报表、公告类报表、舆情类报表、担保类报表、金融市场交易类报表、外部评级类报表、司法类报表和企业信贷类报表等。然后根据该数据报表,生成与内生风险指标对应的目标内生风险特征和与外生风险指标对应的目标外生风险特征;其中,内生风险指标包括管理结构、企业属性、违法信息、信用记录、盈利能力、资产结构评价、偿债能力、现金流量、收益质量、成长能力和司法涉诉;外生风险指标包括结构指标、规模指标、衰减因子和免疫因子,结构指标与内部成员数和平均出入度有关,规模指标与总资产、总负债、总收入、总利润和利润为负的客户数量有关,衰减因子与不良客户数量和存量授信余额的客户数量有关,免疫因子与违约概率成负相关(一般违约概率越高,免疫因子越低)。
上述外生风险指标是基于知识图谱构建得到的,该知识图谱也称为历史企业图谱网络,是通过调研数据、文献等形成的。企业外生风险可以通过历史企业图谱网络中的关系传播给企业,也即关联风险传播。关联风险传播与衰减因子和免疫因子有关,其中,衰减因子指企业外生风险通过图谱中的关系传播给企业的衰减程度系数,一般衰减程度越大,外部风险传播的路径和影响力越小,衰减因子(也可称为衰减系数)主要与历史企业图谱网络中的稳态不良客户率有关,不同大小历史企业图谱网络的稳态不良客户率不同,衰减因子也不同;免疫因子(也可称为免疫系数)指企业对外生风险的承受能力,一般免疫因子越高,企业对外生风险的承受能力越大,免疫因子=1-违约概率。
具体实现时,上述风险评估数据采购接入后,可以存储在预设的关系型数据库中,并进行数据加工和整合,整合完毕后形成上述数据报表。之后可以进行数据清洗和加工:根据已经构建完成的指标体系中各个指标(内生风险指标和外生风险指标)的定义,完成指标体系加工,并针对异常值和空缺值统一进行零值填充,从而得到与内生风险指标对应的目标内生风险特征和与外生风险指标对应的目标外生风险特征。
步骤S106,根据目标内生风险特征、目标外生风险特征、训练后的内生风险评价模型和训练后的外生风险评价模型,确定目标企业的信用风险评价结果。
在一些可能的实施例中,可以将目标内生风险特征和目标外生风险特征分别输入训练后的内生风险评价模型和训练后的外生风险评价模型,得到内生风险评价模型输出的内生风险违约概率和外生风险评价模型输出的外生风险违约概率;然后根据内生风险违约概率和外生风险违约概率,确定目标企业的信用风险评价结果。
进一步,上述根据内生风险违约概率和外生风险违约概率,确定目标企业的信用风险评价结果的步骤,可以通过如下过程实现:将内生风险违约概率和外生风险违约概率分别与预设概率阈值进行比较,得到比较结果;根据该比较结果,确定目标企业的信用风险评价结果。
进一步,上述信用风险评价结果可以包括与内生风险违约概率对应的企业内生风险评价、与外生风险违约概率对应的企业外生风险评价和与综合违约概率对应的企业综合风险评价;其中,企业内生风险评价指企业自身生产经营活动中产生风险的量化和评价;企业外生风险评价指企业受到外部风险的量化和评价,外部风险指企业所在的图谱关系网络中其他企业的影响;企业综合风险评价指企业内生风险和外生风险的综合量化和评价,综合违约概率为内生风险违约概率和外生风险违约概率之和。
上述预设概率阈值可以根据实际需求设置,这里不做限定。例如预设概率阈值为0.5,若上述比较结果为仅内生风险违约概率大于0.5,则目标企业的信用风险评价结果为企业内生风险较高;若上述比较结果为仅外生风险违约概率大于0.5,则目标企业的信用风险评价结果为企业外生风险较高;若上述比较结果为内生风险违约概率和外生风险违约概率之和大于0.5,则目标企业的信用风险评价结果为企业综合风险较高;若上述比较结果为内生风险违约概率和外生风险违约概率之和小于或等于0.5,则目标企业的信用风险评价结果为企业综合风险较低。
本发明实施例提供的企业信用风险评价方法,利用机器学习和图谱网络理论,构建了可以做到分时频率更新企业内部和外部风险量化评价结果。与现有的基于规则的评价方式相比,这种基于数理统计和机器学习的评价方式,以数据的统计规律为主,受人为的主观风险偏好影响较小,且运行相对稳定,使得效果更加稳定,提高了风险评价结果的可靠性。
本发明实施例还提供了上述内生风险评价模型和外生风险评价模型的训练流程,参见图2所示的一种模型训练的流程示意图,内生风险评价模型和外生风险评价模型的训练过程包括如下步骤:
步骤S202,获取训练集样本,该训练集样本包括历史信贷企业在预测窗口内的历史评估数据和预测时间点的实际信贷违约结果。
在获取样本时,先选择预测时间点和预测窗口,预测窗口可以选择6个月或1年,根据预测时间点取得特征宽表,按照预测窗口选取历史信贷企业作为样本,并按照一定比例随机分为训练集样本和测试集样本。例如根据预测时间点2018年06月30日取得特征宽表,以1年期历史信贷企业来构建样本,并将历史逾期企业作为目标样本,按诸如7:3随机分为训练集样本和测试集样本。上述实际信贷违约结果可以细分为内生风险导致的违约、外生风险导致的违约、综合风险导致的违约和未违约五类。
步骤S204,根据上述历史评估数据和指标体系,确定样本内生风险特征和样本外生风险特征。
样本内生风险特征和样本外生风险特征均由预测时间点的截面数据构成,步骤S204的具体过程可以参见前述步骤S104的相应内容,这里不再赘述。
步骤S206,根据样本内生风险特征和实际信贷违约结果,对初始内生风险评价模型进行训练,得到训练后的内生风险评价模型。
在一些可能的实施例中,可以根据样本内生风险特征和实际信贷违约结果,通过K折交叉验证和网格搜索算法对预设的多种初始机器学习模型进行训练,得到多种训练后的机器学习模型;将多种机器学习模型中的最优模型确定为训练后的内生风险评价模型。
初始机器学***衡模型精确率和召回率,来选择最优模型。例如,运用这四种主流的机器学习模型和不均衡样本处理方法进行模型训练,以F1值为标准,择优取最终内生风险评价模型。
步骤S208,根据样本外生风险特征和实际信贷违约结果,对初始外生风险评价模型进行训练,得到训练后的外生风险评价模型。
该步骤S208的具体过程可以参见步骤S206的相应内容,这里不再赘述。
为了便于理解,本发明实施例还提供了该企业信用风险评价方法的实施过程,如下:
第一步:准备工作,进行数据调研、文献调研、行业内专家调研等,构建风险特征指标库,构建基于大数据的Oscar数据库+指标体系,开发环境、基础代码、模型代码等基础工作准备完成,建立切实可行的技术方案实施路线。
如图3所示,数据层涵盖了工商、司法、经营、财报、评级、征信、交易、市场、公告、舆情、集团、担保、行业、地域等14个层面,风险指标层包括内生风险指标和外生风险指标的近400指标,内生风险指标包括管理结构、企业属性、违法信息、信用记录、盈利能力、资产结构评价、偿债能力、现金流量、收益质量、成长能力和司法涉诉等,外生风险指标包括(1)结构指标:内部成员数和平均出入度;(2)规模指标:总资产、总负债、总收入、总利润和利润为负的客户数量;(3)衰减因子:不良客户数量和存量授信余额的客户数量;(4)免疫因子:违约概率。
第二步:整合各个数据源,并清洗和加工数据,形成指标因子特征。数据源可以包括近100个财经类网站,相关数据包括工商数据、司法数据、股市债市交易数据、公告数据、企业经营数据、财务数据、担保数据、评级数据和投资关系数据等。
第三步:将指标因子特征分为内生风险特征和外生风险特征两类,以1年期历史信贷客户构建样本,历史逾期客户作为目标样本。
如图3所示,在风险发生层进行内生风险识别和外生风险传播。
第四步:如图3所示,在风险评价模型层,运用四种机器学习模型训练好模型,训练好的内生风险评价模型可以输出单个企业的内生风险违约概率D,以内生风险违约概率作为企业内生风险评价。
第五步:计算衰减因子和免疫因子。
第六步:如图3所示,在风险评价模型层,通过结构指标、规模指标、衰减因子和免疫因子构建外生风险评价模型:外生风险违约概率=F(结构指标、规模指标、衰减因子和免疫因子)。
第七步:输出企业信用风险评价结果。
如图3所示,在评价结果输出层,输出内容如下:仅内生风险违约概率>0.5,输出企业内生风险较高;仅外生风险违约概率>0.5,输出企业外生风险较高;内生风险违约概率+外生风险违约概率>0.5,输出企业综合风险较高;内生风险违约概率+外生风险违约概率≤0.5,输出企业综合风险较低。
第八步:内生风险评价模型和外生风险评价模型构建好以后,可以实时输入风险特征,实时对企业的内生风险、外生风险和综合风险进行评价。
本发明实施例还提供了上述企业信用风险评价方法的结果展示示例,参见图4所示的一种企业信用风险评价方法的结果展示示意图,这是XX银行公司客户风险预警监控平台,主要包括模型监控区和预警名单区。模型监控区包括两个子区域,一个子区域用于展示如下内容:总行预警客户统计及较上期变动、分支机构预警客户统计及较上期变动、行业预警客户统计及较上期变动和区域预警客户统计及较上期变动;另一个子区域用于展示如下内容:查准率、查全率、KS(Kolmogorov-Smirnov)、AUC(Area Under Curve)、有效预警率、误警率和漏警率。预警名单区主要展示了如下内容:客户号、客户名称、隶属集团、隶属分支机构、行业、区域、预警原因、预警等级和预警反馈。
对应于上述的企业信用风险评价方法,本发明实施例还提供了一种企业信用风险评价装置,参见图5所示的一种企业信用风险评价装置的结构示意图,该装置包括:
数据获取模块52,用于获取目标企业的风险评估数据;
特征确定模块54,用于根据风险评估数据和预先构建的指标体系,确定目标内生风险特征和目标外生风险特征;其中,指标体系包括内生风险指标和基于知识图谱得到的外生风险指标;
结果确定模块56,用于根据目标内生风险特征、目标外生风险特征、训练后的内生风险评价模型和训练后的外生风险评价模型,确定目标企业的信用风险评价结果。
本发明实施例提供的企业信用风险评价装置,利用机器学习和图谱网络理论,构建了可以做到分时频率更新企业内部和外部风险量化评价结果。与现有的基于规则的评价方式相比,这种基于数理统计和机器学习的评价方式,以数据的统计规律为主,受人为的主观风险偏好影响较小,且运行相对稳定,使得效果更加稳定,提高了风险评价结果的可靠性。
进一步,上述数据获取模块52具体用于:通过预设的数据服务商采购目标企业的风险评估数据,该风险评估数据包括工商数据、司法数据、股市债市交易数据、公告数据、企业经营数据、财务数据、企业关系数据、企业担保数据和评级数据。
进一步,上述特征确定模块54具体用于:通过预设的关系型数据库对风险评估数据进行数据加工和整合,得到数据报表;该数据报表包括企业基础信息表、关系类报表、财务类报表、经营类报表、公告类报表、舆情类报表、担保类报表、金融市场交易类报表、外部评级类报表、司法类报表和企业信贷类报表;根据该数据报表,生成与内生风险指标对应的目标内生风险特征和与外生风险指标对应的目标外生风险特征;其中,内生风险指标包括管理结构、企业属性、违法信息、信用记录、盈利能力、资产结构评价、偿债能力、现金流量、收益质量、成长能力和司法涉诉;外生风险指标包括结构指标、规模指标、衰减因子和免疫因子,结构指标与内部成员数和平均出入度有关,规模指标与总资产、总负债、总收入、总利润和利润为负的客户数量有关,衰减因子与不良客户数量和存量授信余额的客户数量有关,免疫因子与违约概率成负相关。
进一步,上述结果确定模块56具体用于:将目标内生风险特征和目标外生风险特征分别输入训练后的内生风险评价模型和训练后的外生风险评价模型,得到内生风险评价模型输出的内生风险违约概率和外生风险评价模型输出的外生风险违约概率;根据内生风险违约概率和外生风险违约概率,确定目标企业的信用风险评价结果。
进一步,上述结果确定模块56还用于:将内生风险违约概率和外生风险违约概率分别与预设概率阈值进行比较,得到比较结果;根据该比较结果,确定目标企业的信用风险评价结果。
进一步,上述装置还包括与结果确定模块56连接的训练模块,用于:
获取训练集样本,该训练集样本包括历史信贷企业在预测窗口内的历史评估数据和预测时间点的实际信贷违约结果;
根据历史评估数据和指标体系,确定样本内生风险特征和样本外生风险特征;
根据样本内生风险特征和实际信贷违约结果,对初始内生风险评价模型进行训练,得到训练后的内生风险评价模型;
根据样本外生风险特征和实际信贷违约结果,对初始外生风险评价模型进行训练,得到训练后的外生风险评价模型。
进一步,上述训练模块具体用于:根据样本内生风险特征和实际信贷违约结果,通过K折交叉验证和网格搜索算法对预设的多种初始机器学习模型进行训练,得到多种训练后的机器学习模型;将多种机器学习模型中的最优模型确定为训练后的内生风险评价模型。
本实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
参见图6,本发明实施例还提供一种电子设备100,包括:处理器60,存储器61,总线62和通信接口63,所述处理器60、通信接口63和存储器61通过总线62连接;处理器60用于执行存储器61中存储的可执行模块,例如计算机程序。
其中,存储器61可能包含随机存取存储器(Random Access Memory,简称RAM),也可能还包括非易失性存储器(non-volatile memory,简称NVM),例如至少一个磁盘存储器。通过至少一个通信接口63(可以是有线或者无线)实现该***网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。
总线62可以是工业标准体系结构(Industry Standard Architecture,简称ISA)总线、外设部件互连标准(Peripheral Component Interconnect,简称PCI)总线或扩展工业标准结构(Extended Industry Standard Architecture,简称EISA)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器61用于存储程序,所述处理器60在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流程定义的装置所执行的方法可以应用于处理器60中,或者由处理器60实现。
处理器60可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器60中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器60可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital SignalProcessing,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现成可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器61,处理器60读取存储器61中的信息,结合其硬件完成上述方法的步骤。
本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行前面方法实施例中所述的企业信用风险评价方法。该计算机可读存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,简称ROM)、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
在这里示出和描述的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制,因此,示例性实施例的其他示例可以具有不同的值。
附图中的流程图和框图显示了根据本发明的多个实施例的方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (9)

1.一种企业信用风险评价方法,其特征在于,包括:
获取目标企业的风险评估数据;
根据所述风险评估数据和预先构建的指标体系,确定目标内生风险特征和目标外生风险特征;其中,所述指标体系包括内生风险指标和基于知识图谱得到的外生风险指标;
根据所述目标内生风险特征、所述目标外生风险特征、训练后的内生风险评价模型和训练后的外生风险评价模型,确定所述目标企业的信用风险评价结果;
根据所述风险评估数据和预先构建的指标体系,确定目标内生风险特征和目标外生风险特征的步骤,包括:
通过预设的关系型数据库对所述风险评估数据进行数据加工和整合,得到数据报表;所述数据报表包括企业基础信息表、关系类报表、财务类报表、经营类报表、公告类报表、舆情类报表、担保类报表、金融市场交易类报表、外部评级类报表、司法类报表和企业信贷类报表;
根据所述数据报表,生成与所述内生风险指标对应的目标内生风险特征和与所述外生风险指标对应的目标外生风险特征;其中,所述内生风险指标包括管理结构、企业属性、违法信息、信用记录、盈利能力、资产结构评价、偿债能力、现金流量、收益质量、成长能力和司法涉诉;所述外生风险指标包括结构指标、规模指标、衰减因子和免疫因子,所述结构指标与内部成员数和平均出入度有关,所述规模指标与总资产、总负债、总收入、总利润和利润为负的客户数量有关,所述衰减因子与不良客户数量和存量授信余额的客户数量有关,所述免疫因子与违约概率成负相关。
2.根据权利要求1所述的企业信用风险评价方法,其特征在于,获取目标企业的风险评估数据的步骤,包括:
通过预设的数据服务商采购目标企业的风险评估数据,所述风险评估数据包括工商数据、司法数据、股市债市交易数据、公告数据、企业经营数据、财务数据、企业关系数据、企业担保数据和评级数据。
3.根据权利要求1所述的企业信用风险评价方法,其特征在于,根据所述目标内生风险特征、所述目标外生风险特征、训练后的内生风险评价模型和训练后的外生风险评价模型,确定所述目标企业的信用风险评价结果的步骤,包括:
将所述目标内生风险特征和所述目标外生风险特征分别输入训练后的内生风险评价模型和训练后的外生风险评价模型,得到所述内生风险评价模型输出的内生风险违约概率和所述外生风险评价模型输出的外生风险违约概率;
根据所述内生风险违约概率和所述外生风险违约概率,确定所述目标企业的信用风险评价结果。
4.根据权利要求3所述的企业信用风险评价方法,其特征在于,根据所述内生风险违约概率和所述外生风险违约概率,确定所述目标企业的信用风险评价结果的步骤,包括:
将所述内生风险违约概率和所述外生风险违约概率分别与预设概率阈值进行比较,得到比较结果;
根据所述比较结果,确定所述目标企业的信用风险评价结果。
5.根据权利要求1所述的企业信用风险评价方法,其特征在于,所述方法还包括:
获取训练集样本,所述训练集样本包括历史信贷企业在预测窗口内的历史评估数据和预测时间点的实际信贷违约结果;
根据所述历史评估数据和所述指标体系,确定样本内生风险特征和样本外生风险特征;
根据所述样本内生风险特征和所述实际信贷违约结果,对初始内生风险评价模型进行训练,得到训练后的内生风险评价模型;
根据所述样本外生风险特征和所述实际信贷违约结果,对初始外生风险评价模型进行训练,得到训练后的外生风险评价模型。
6.根据权利要求5所述的企业信用风险评价方法,其特征在于,根据所述样本内生风险特征和所述实际信贷违约结果,对初始内生风险评价模型进行训练,得到训练后的内生风险评价模型的步骤,包括:
根据所述样本内生风险特征和所述实际信贷违约结果,通过K折交叉验证和网格搜索算法对预设的多种初始机器学习模型进行训练,得到多种训练后的机器学习模型;
将多种所述机器学习模型中的最优模型确定为训练后的内生风险评价模型。
7.一种企业信用风险评价装置,其特征在于,包括:
数据获取模块,用于获取目标企业的风险评估数据;
特征确定模块,用于根据所述风险评估数据和预先构建的指标体系,确定目标内生风险特征和目标外生风险特征;其中,所述指标体系包括内生风险指标和基于知识图谱得到的外生风险指标;
结果确定模块,用于根据所述目标内生风险特征、所述目标外生风险特征、训练后的内生风险评价模型和训练后的外生风险评价模型,确定所述目标企业的信用风险评价结果;
所述特征确定模块具体用于:通过预设的关系型数据库对所述风险评估数据进行数据加工和整合,得到数据报表;所述数据报表包括企业基础信息表、关系类报表、财务类报表、经营类报表、公告类报表、舆情类报表、担保类报表、金融市场交易类报表、外部评级类报表、司法类报表和企业信贷类报表;根据所述数据报表,生成与所述内生风险指标对应的目标内生风险特征和与所述外生风险指标对应的目标外生风险特征;其中,所述内生风险指标包括管理结构、企业属性、违法信息、信用记录、盈利能力、资产结构评价、偿债能力、现金流量、收益质量、成长能力和司法涉诉;所述外生风险指标包括结构指标、规模指标、衰减因子和免疫因子,所述结构指标与内部成员数和平均出入度有关,所述规模指标与总资产、总负债、总收入、总利润和利润为负的客户数量有关,所述衰减因子与不良客户数量和存量授信余额的客户数量有关,所述免疫因子与违约概率成负相关。
8.一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-6中任一项所述的方法。
9.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行权利要求1-6中任一项所述的方法。
CN202011643781.8A 2020-12-30 2020-12-30 企业信用风险评价方法、装置及电子设备 Active CN112734559B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011643781.8A CN112734559B (zh) 2020-12-30 2020-12-30 企业信用风险评价方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011643781.8A CN112734559B (zh) 2020-12-30 2020-12-30 企业信用风险评价方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN112734559A CN112734559A (zh) 2021-04-30
CN112734559B true CN112734559B (zh) 2024-04-30

Family

ID=75609282

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011643781.8A Active CN112734559B (zh) 2020-12-30 2020-12-30 企业信用风险评价方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN112734559B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113313615A (zh) * 2021-06-23 2021-08-27 北京鼎泰智源科技有限公司 一种对企业司法风险进行量化评分定级的方法及装置
CN113506173A (zh) * 2021-08-06 2021-10-15 国网电子商务有限公司 一种信用风险评估方法及其相关设备
CN113822761A (zh) * 2021-09-26 2021-12-21 深圳微众信用科技股份有限公司 一种信用风险评估方法及其***
CN114004491A (zh) * 2021-10-29 2022-02-01 中国建设银行股份有限公司 一种零售风险暴露的分池方法、装置、计算机设备及介质
CN114019942B (zh) * 2021-11-04 2023-08-29 哈尔滨工业大学 一种基于分时频率的工业机器人***安全威胁评价方法
CN114462891A (zh) * 2022-04-07 2022-05-10 国家电投集团科学技术研究院有限公司 一种碳排放检测方法及其装置
CN117112808B (zh) * 2023-10-24 2024-01-19 中国标准化研究院 一种信用失信主体的信息知识图谱构建方法
CN117610941B (zh) * 2024-01-18 2024-04-26 杭州智诚惠通科技有限公司 基于数据库处理的大件运输信用评价方法、***和介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109409677A (zh) * 2018-09-27 2019-03-01 深圳壹账通智能科技有限公司 企业信用风险评估方法、装置、设备及存储介质
CN109657894A (zh) * 2018-09-27 2019-04-19 深圳壹账通智能科技有限公司 企业信用风险预警方法、装置、设备及存储介质
CN110163741A (zh) * 2019-04-16 2019-08-23 深圳壹账通智能科技有限公司 基于信贷风控模型的信贷决策方法、装置、设备及介质
CN110443458A (zh) * 2019-07-05 2019-11-12 深圳壹账通智能科技有限公司 风险评估方法、装置、计算机设备和存储介质
CN111784508A (zh) * 2020-07-01 2020-10-16 北京知因智慧科技有限公司 企业风险评估方法、装置及电子设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109409677A (zh) * 2018-09-27 2019-03-01 深圳壹账通智能科技有限公司 企业信用风险评估方法、装置、设备及存储介质
CN109657894A (zh) * 2018-09-27 2019-04-19 深圳壹账通智能科技有限公司 企业信用风险预警方法、装置、设备及存储介质
CN110163741A (zh) * 2019-04-16 2019-08-23 深圳壹账通智能科技有限公司 基于信贷风控模型的信贷决策方法、装置、设备及介质
CN110443458A (zh) * 2019-07-05 2019-11-12 深圳壹账通智能科技有限公司 风险评估方法、装置、计算机设备和存储介质
CN111784508A (zh) * 2020-07-01 2020-10-16 北京知因智慧科技有限公司 企业风险评估方法、装置及电子设备

Also Published As

Publication number Publication date
CN112734559A (zh) 2021-04-30

Similar Documents

Publication Publication Date Title
CN112734559B (zh) 企业信用风险评价方法、装置及电子设备
CN108564286B (zh) 一种基于大数据征信的人工智能金融风控授信评定方法和***
JP5566422B2 (ja) 高リスク調達の解析およびスコアリング・システム
US20200090268A1 (en) Method and apparatus for determining level of risk of user, and computer device
US20200234218A1 (en) Systems and methods for entity performance and risk scoring
KR102628559B1 (ko) 부동산 담보대출 자동심사 플랫폼 제공방법 및 제공장치
CN112966189A (zh) 一种基金产品推荐***
CN110991936A (zh) 企业评分评级方法、装置、设备及介质
Bruni et al. Lending decisions under uncertainty: a DEA approach
Grize Applications of statistics in the field of general insurance: An overview
CN114638695A (zh) 信用评估方法、装置、设备及介质
CN111626855A (zh) 债券信用利差预测方法及***
CN112950359B (zh) 一种用户识别方法和装置
CN112785112A (zh) 一种风险规则提取方法及风险规则提取装置
CN114418776A (zh) 一种数据处理方法、装置、终端设备及介质
CN113421014A (zh) 一种目标企业确定方法、装置、设备和存储介质
Momen et al. Modeling the operational risk in Iranian commercial banks: case study of a private bank
US20220261824A1 (en) System and method for determining and managing reputation of entities and industries through use of behavioral connections
CN117934154A (zh) 交易风险预测方法、模型训练方法、装置、设备、介质和程序产品
CN115409636A (zh) 产品风险预测方法、装置、设备及介质
KR20230094936A (ko) 근무행동 데이터를 활용한 행동주의 대안신용평가 모델 및 그 제공 방법
CN118096170A (zh) 风险预测方法及装置、设备、存储介质和程序产品
CN117934061A (zh) 用户复购行为的预测方法、装置、电子设备及存储介质
CN114897564A (zh) 目标客户推荐方法及装置、电子设备和存储介质
CN116308615A (zh) 产品推荐方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant