CN111242191A - 基于多分类器集成的信用评级方法及装置 - Google Patents

基于多分类器集成的信用评级方法及装置 Download PDF

Info

Publication number
CN111242191A
CN111242191A CN202010009078.5A CN202010009078A CN111242191A CN 111242191 A CN111242191 A CN 111242191A CN 202010009078 A CN202010009078 A CN 202010009078A CN 111242191 A CN111242191 A CN 111242191A
Authority
CN
China
Prior art keywords
credit rating
classifier model
historical
classifier
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010009078.5A
Other languages
English (en)
Inventor
杨占栋
陈朝明
叶振栋
任婷婷
郭文琳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
Original Assignee
China Construction Bank Corp
CCB Finetech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Bank Corp, CCB Finetech Co Ltd filed Critical China Construction Bank Corp
Priority to CN202010009078.5A priority Critical patent/CN111242191A/zh
Publication of CN111242191A publication Critical patent/CN111242191A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • G06F18/2193Validation; Performance evaluation; Active pattern learning techniques based on specific statistical tests
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • G06F18/24155Bayesian classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/06Asset management; Financial planning or analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Probability & Statistics with Applications (AREA)
  • Accounting & Taxation (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Human Resources & Organizations (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明公开了一种基于多分类器集成的信用评级方法及装置,该方法包括:获取债券发行人的财务特征数据;将所述财务特征数据分别输入到训练好的朴素贝叶斯分类器模型、梯度提升决策树分类器模型以及随机森林分类器模型中,得到各分类器模型输出的信用评级结果,其中,所述朴素贝叶斯分类器模型、所述梯度提升决策树分类器模型以及所述随机森林分类器模型均为根据历史的财务特征数据和历史的信用评级数据训练得出;根据各分类器模型输出的信用评级结果确定所述债券发行人的信用评级。本发明的基于多分类器集成的信用评级方法提高了信用评级的稳定性以及准确率。

Description

基于多分类器集成的信用评级方法及装置
技术领域
本发明涉及信用服务技术领域,具体而言,涉及一种基于多分类器集成的信用评级方法及装置。
背景技术
近年来,债务违约逐渐呈现增长的态势。债券违约势必会对债券投资人造成经济上的损伤以及情绪上的打击,目前,出现信用风险的债券发行人已经涉及到了央企、国企、名企等各大类企业。因此,急需要一种能够利用市场上的***息来判断出债券发行人的信用风险等级的方法,保护投资者利益,避免财产损失。
发明内容
本发明为了解决上述背景技术中的至少一个技术问题,提出了一种基于多分类器集成的信用评级方法及装置。
为了实现上述目的,根据本发明的一个方面,提供了一种基于多分类器集成的信用评级方法,该方法包括:
获取债券发行人的财务特征数据;
将所述财务特征数据分别输入到训练好的朴素贝叶斯分类器模型、梯度提升决策树分类器模型以及随机森林分类器模型中,得到各分类器模型输出的信用评级结果,其中,所述朴素贝叶斯分类器模型、所述梯度提升决策树分类器模型以及所述随机森林分类器模型均为根据历史的财务特征数据和历史的信用评级数据训练得出;
根据各分类器模型输出的信用评级结果确定所述债券发行人的信用评级。
可选的,所述财务特征数据包括:四个季度的营业收入增长率、四个季度扣除非经常性损益后的净利润的增长率、营业收入与固定资产比以及流动资产与流动负债比中的至少一个。
可选的,该方法还包括:获取历史的财务特征数据和历史的信用评级数据;根据历史的财务特征数据、历史的信用评级数据以及预设的朴素贝叶斯分类算法训练出所述朴素贝叶斯分类器模型,以根据训练出的所述朴素贝叶斯分类器模型对债券发行人进行信用评级。
可选的,该方法还包括:获取历史的财务特征数据和历史的信用评级数据;根据历史的财务特征数据、历史的信用评级数据以及预设的梯度提升决策树算法训练出所述梯度提升决策树分类器模型,以根据训练出的所述梯度提升决策树分类器模型对债券发行人进行信用评级。
可选的,该方法还包括:获取历史的财务特征数据和历史的信用评级数据;根据历史的财务特征数据、历史的信用评级数据以及预设的随机森林算法训练出所述随机森林分类器模型,以根据训练出的所述随机森林分类器模型对债券发行人进行信用评级。
为了实现上述目的,根据本发明的另一方面,提供了一种基于多分类器集成的信用评级装置,该装置包括:
财务特征数据确定单元,用于获取债券发行人的财务特征数据;
多分类器信用评级单元,用于将所述财务特征数据分别输入到训练好的朴素贝叶斯分类器模型、梯度提升决策树分类器模型以及随机森林分类器模型中,得到各分类器模型输出的信用评级结果,其中,所述朴素贝叶斯分类器模型、所述梯度提升决策树分类器模型以及所述随机森林分类器模型均为根据历史的财务特征数据和历史的信用评级数据训练得出;
债券发行人信用评级确定单元,用于根据各分类器模型输出的信用评级结果确定所述债券发行人的信用评级。
可选的,所述财务特征数据包括:四个季度的营业收入增长率、四个季度扣除非经常性损益后的净利润的增长率、营业收入与固定资产比以及流动资产与流动负债比中的至少一个。
可选的,该装置还包括:朴素贝叶斯分类器模型训练单元,用于获取历史的财务特征数据和历史的信用评级数据;并根据历史的财务特征数据、历史的信用评级数据以及预设的朴素贝叶斯分类算法训练出所述朴素贝叶斯分类器模型,以根据训练出的所述朴素贝叶斯分类器模型对债券发行人进行信用评级。
可选的,该装置还包括:梯度提升决策树分类器模型训练单元,用于获取历史的财务特征数据和历史的信用评级数据;并根据历史的财务特征数据、历史的信用评级数据以及预设的梯度提升决策树算法训练出所述梯度提升决策树分类器模型,以根据训练出的所述梯度提升决策树分类器模型对债券发行人进行信用评级。
可选的,该装置还包括:随机森林分类器模型训练单元,用于获取历史的财务特征数据和历史的信用评级数据;并根据历史的财务特征数据、历史的信用评级数据以及预设的随机森林算法训练出所述随机森林分类器模型,以根据训练出的所述随机森林分类器模型对债券发行人进行信用评级。
为了实现上述目的,根据本发明的另一方面,还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于多分类器集成的信用评级方法中的步骤。
为了实现上述目的,根据本发明的另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序在计算机处理器中执行时实现上述基于多分类器集成的信用评级方法中的步骤。
本发明的有益效果为:本发明根据债券发行人的财务特征数据采用多个分类器方法,包括朴素贝叶斯(NB)、梯度提升决策树(GBDT)、随机森林(RF),进行模式识别,得出每个分类器方法下的信用评级结果。最后通过预设规则得出最终的信用评级结果,从而避免了某一种分类器在局部特性的数据上识别结果偏差较大的情况,提高了信用评级的稳定性以及准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1是本发明实施例基于多分类器集成的信用评级方法的流程图;
图2是本发明实施例基于多分类器集成的信用评级装置的结构框图;
图3是本发明实施例计算机设备示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
图1是本发明实施例基于多分类器集成的信用评级方法的流程图,如图1所示,本实施例的基于多分类器集成的信用评级方法包括步骤S101至步骤S103。
步骤S101,获取债券发行人的财务特征数据。
在本发明中债券发行人可以为公司、企业或其他机构。在本发明的可选实施例中所述财务特征数据包括:四个季度的营业收入增长率、四个季度扣除非经常性损益后的净利润的增长率、营业收入与固定资产比以及流动资产与流动负债比中的至少一个。
在本发明可选实施例中财务特征数据具体由以下步骤确定得出。首先获取债券发行人的财务数据,并对财务数据进行预处理。财务数据可以包括盈利能力、杠杆水平、资本结构、资产质量、偿债能力、融资能力、扩张程度等等,具体的有营业总收入、毛利润、归属净利润、销售毛利率、营业净利率等等。预处理包括将重复的数据、数据中缺失较多的数据去掉,对于数据中缺失的值进行补全等。进而对预处理后的财务数据进行特征提取或计算,得到财务特征数据。
四个季度的营业收入增长率Revenue Growth可以由以下公式计算得出:
Figure BDA0002356455430000051
其中,Total Revenuet-1为企业在最近一个季度披露的总收入,Total Revenuet-5为企业在五个季度前披露的总收入。
四个季度扣除非经常性损益后的净利润的增长率Earnings Growth可以由以下公式计算得出:
Figure BDA0002356455430000052
其中,NPADNGLt为企业在t日的最近一个季报披露的扣除非经常性损益后的净利润,
Figure BDA0002356455430000055
为企业在t日的最近第四个季报披露的扣除非经常性损益后的净利润。
营业收入与固定资产比Fixed Asset Turnover可以由以下公式计算得出:
Figure BDA0002356455430000053
其中,Core Revenuet-i为股票在最近第i个季度披露的营业收入,Fixed Assett-i为企业在最近第i个季度披露的固定资产。
流动资产与流动负债比Current Ratio可以由以下公式计算得出:
Figure BDA0002356455430000054
其中Current Assett为企业在t日的最近一个季报披露的流动资产,CurrentLiabilityt为企业在t日的最近一个季报披露的流动负债。
在本发明实施例中,本步骤的债券发行人的财务特征数据为债券发行人当前的财务特征数据。本发明在训练分类器模型时用的是多个债券发行人的历史财务特征数据。
步骤S102,将所述财务特征数据分别输入到训练好的朴素贝叶斯分类器模型、梯度提升决策树分类器模型以及随机森林分类器模型中,得到各分类器模型输出的信用评级结果,其中,所述朴素贝叶斯分类器模型、所述梯度提升决策树分类器模型以及所述随机森林分类器模型均为根据历史的财务特征数据和历史的信用评级数据训练得出。
在本发明实施例中,本发明先根据多个债券发行人的历史财务特征数据以及对应的历史的信用评级数据分别根据朴素贝叶斯分类算法、梯度提升决策树算法以及随机森林算法训练出对应的分类器模型。进而根据训练出的三个分类器模型基于目标债券发行人的当前财务特征数据对该目标债券发行人进行信用评级,分别得到分类器模型输出的信用评级结果。在本发明可选实施例中债券发行人(企业)的历史信用评级数据可以为国内外评级机构做出的评级数据。
步骤S103,根据各分类器模型输出的信用评级结果确定所述债券发行人的信用评级。
在本发明实施例中,各分类器模型输出的信用评级结果可以为信用评级等级。在本发明实施例中,朴素贝叶斯分类器模型、梯度提升决策树分类器模型以及随机森林分类器模型输出的评级等级依次为I1,I2,I3。本发明先将分类器模型输出的评级等级转化为对应的评级分数,即:
S1=f1(I1)
S2=f2(I2)
S3=f3(I3)
S1、S2、S3分别为朴素贝叶斯分类器模型、梯度提升决策树分类器模型以及随机森林分类器模型输出的评级结果对应的评级分数。f1、f2、f3、f4为预设的关系函数。
在本发明的一可选实施例中,可以对三个分类器模型输出的评级结果对应的评级分数做平均计算,即:
Figure BDA0002356455430000061
在本发明的其他可选实施例中,可以对三个分类器模型输出的评级结果对应的评级分数根据预设的权重比进行加权平均计算得到最终的信用评级分数S。
将S作为最终的信用评级分数并转化为信用评级等级,即:
I=f4(S)
则该信用评级等级I为债券发行人最终的信用评级结果。
由以上描述可以看出,本发明根据债券发行人的财务特征数据采用多个分类器方法,包括朴素贝叶斯(NB)、梯度提升决策树(GBDT)、随机森林(RF),进行模式识别,得出每个分类器方法下的信用评级结果。最后通过预设规则得出最终的信用评级结果,从而避免了某一种分类器在局部特性的数据上识别结果偏差较大的情况,提高了信用评级的稳定性以及准确率。
下面对本发明的朴素贝叶斯分类器模型、梯度提升决策树分类器模型以及随机森林分类器模型的具体训练过程进行介绍。在本发明实施例中,朴素贝叶斯分类器模型、梯度提升决策树分类器模型以及随机森林分类器模型为根据获取的多个债券发行人的历史财务特征数据以及对应的历史的信用评级数据作为训练数据训练得出。所述财务特征数据包括:四个季度的营业收入增长率、四个季度扣除非经常性损益后的净利润的增长率、营业收入与固定资产比以及流动资产与流动负债比等。在本发明实施例中,本发明可以以一年的数据为一个样本,例如A企业2000年的财务特征数据为一个财务特征数据样本,A企业2000年的信用评级等级为该财务特征数据样本对应的信用评级数据。由此,我们得到了财务特征数据样本集合,
Figure BDA0002356455430000071
其中,
Figure BDA0002356455430000072
表示i个样本中的j个财务特征数据。
以及信用评级数据样本集合,
Figure BDA0002356455430000073
其中,c=22,代表以下22个信用评级等级,
Figure BDA0002356455430000074
表示i个样本中的信用评级等级,即第i个样本信用评级为j时,则
Figure BDA0002356455430000075
yi中的其他数据则为0。
在本发明实施例中,信用评级数据通常用信用评级等级来表示,信用评级等级的含义可以如下表1:
Figure BDA0002356455430000076
Figure BDA0002356455430000081
表1
进而本发明可以将上述财务特征数据样本集合,
Figure BDA0002356455430000082
以及信用评级数据样本集合,
Figure BDA0002356455430000083
其中,c=22,作为训练数据,并结合朴素贝叶斯分类算法、梯度提升决策树算法以及随机森林算法训练出对应的分类器模型。下面对三个模型的训练过程分别进行解释。
1、朴素贝叶斯(NB)分类器模型
对上述财务特征数据样本集合xi做进一步的处理,具体处理如下:
Figure BDA0002356455430000084
其中,[]为取整,
Figure BDA0002356455430000085
为已知值,
Figure BDA0002356455430000086
N为已知正数。
最后经过处理后的财务特征数据样本集合为:
Figure BDA0002356455430000087
基于朴素贝叶斯(NB)的判定准则是:
Figure BDA0002356455430000088
其中,c表示具体的信用评级等级类别,y表示所有类别的集合,P(c)表示c属于具体某一信用评级等级的先验概率,P(xi′|c)表示c在某一信用评级等级前提下样本xi′的条件概率,xi′指数据中1到d个财务特征数据中的第i个财务特征数据。
为了提高计算效率,本发明对上述公式进行简化,进行取对数,并不会影响结果,并且将乘法变为加法,避免连乘带来的下溢的数据溢出,即:
Figure BDA0002356455430000091
其中,Pc和P(xi′|c)根据已知的训练数据,进行训练得出,最终形成训练好的朴素贝叶斯分类器模型。然后目标债券发行人的财务特征数据输入到训练好的朴素贝叶斯分类器模型中,得出朴素贝叶斯分类器模型的信用评级结果。
2、梯度提升决策树(GBDT)分类器模型
X与Y分别为输入和输出变量,并且Y是连续变量,给定训练数据集:
D={(x1,y1),(x2,y2),…,(xN,yN)}
其中,N数据集的样本个数。
在训练数据集所在的输入空间中,递归的将每个区域分成两个子区域,并决定每个子区域上的输出值,构建二叉决策树,具体步骤如下:
1)选择最优切分j与切分点s,求解:
Figure BDA0002356455430000092
遍历变量j,对固定的切分变量j扫描切分点s,选择使上式达到最小值的对(j,s)。
2)用选定的对(j,s)划分区域并决定相应的输出值:
R1(j,s)={x|x(j)≤s},R2(j,s)={x|x(j)>s}
Figure BDA0002356455430000093
3)继续对两个子区域调用步骤1)、2),直到满足停止条件。
4)将输入空间划分为M个区域R1,R2,…,RM,在每个单元Rm上有个固定的输出值cm,生成决策树为:
Figure BDA0002356455430000094
梯度提升决策树(Gradient Boosting Decision Tree),提升方法采用加法模型(即基函数的线性组合)与前向分布算法。以决策树为基函数的提升方法则为提升树,提升树是迭代多个回归树来共同决策。提升树的模型即:
Figure BDA0002356455430000101
其中,T(x;θm)表示决策树,θm为决策树的参数,M为树的个数。
在GBDT的迭代中,利用梯度下降的近似方法,即利用损失函数的负梯度在当前模型的值,即,
Figure BDA0002356455430000102
作为回归问题中提升树算法的残差近似值。当前损失函数使用均方误差,即:
Figure BDA0002356455430000103
负梯度为:
Figure BDA0002356455430000104
即为残差。
具体的算法步骤如下:
1)初始化f0(x)=0
2)对m=1,2…,M
a)计算残差,即:
rmi=yi-fm-1(xi),i=1,2,…,N
b)拟合残差rmi学习一个回归树,得到T(x;θm)
c)更新回归树,即:
fm(x)=fm-1(x)+T(x;θm)
3)得到输出的最终梯度提升决策树分类器模型,即:
Figure BDA0002356455430000105
在得到梯度提升决策树分类器模型后,可以将目标债券发行人的财务特征数据输入到分类器模型中,得到梯度提升决策树分类器模型输出的信用评级结果。
3、随机森林(RF)分类器模型
首先基于决策树,对提取的特征进行信用评级模式识别,具体采用C4.5决策树算法,增益率为:
Figure BDA0002356455430000111
其中,
Figure BDA0002356455430000112
Figure BDA0002356455430000113
通过有监督的数据,对模型进行训练,得出参数θtree,然后通过新的特征数据,与已知参数进行计算,得出最终的信用评级模式的结果,即:
I=f(θtree,F3)
随机选择样本、随机选择特征,建立N个决策树,然后每个决策树输出一个信用评级模式结果,然后通过投票机制来确定出最终的信用评级模式,得到随机森林分类器模型。
由以上描述可以看出,本发明至少实现了以下有益效果:
本发明基于多种分类器不同特性的基础上,提出了集成分类器的方式对债券发行人信用进行模式识别的新的方法,该方法的核心在与利用了不同分类器的不同特性,以及具体的特征提取方式、集成分类器进行最终确定信用评级的方式。这样避免了某一种分类器在局部特性的数据上识别结果偏差较大的情况,提高了识别的稳定性以及准确率。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
基于同一发明构思,本发明实施例还提供了一种基于多分类器集成的信用评级装置,可以用于实现上述实施例所描述的基于多分类器集成的信用评级方法,如下面的实施例所述。由于基于多分类器集成的信用评级装置解决问题的原理与基于多分类器集成的信用评级方法相似,因此基于多分类器集成的信用评级装置的实施例可以参见基于多分类器集成的信用评级方法的实施例,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图2是本发明实施例基于多分类器集成的信用评级装置的结构框图,如图2所示,本发明实施例基于多分类器集成的信用评级装置包括:财务特征数据确定单元1、多分类器信用评级单元2和债券发行人信用评级确定单元3。
财务特征数据确定单元1,用于获取债券发行人的财务特征数据。
在本发明可选实施例中,所述财务特征数据包括:四个季度的营业收入增长率、四个季度扣除非经常性损益后的净利润的增长率、营业收入与固定资产比以及流动资产与流动负债比中的至少一个。
多分类器信用评级单元2,用于将所述财务特征数据分别输入到训练好的朴素贝叶斯分类器模型、梯度提升决策树分类器模型以及随机森林分类器模型中,得到各分类器模型输出的信用评级结果,其中,所述朴素贝叶斯分类器模型、所述梯度提升决策树分类器模型以及所述随机森林分类器模型均为根据历史的财务特征数据和历史的信用评级数据训练得出。
债券发行人信用评级确定单元3,用于根据各分类器模型输出的信用评级结果确定所述债券发行人的信用评级。
在本发明可选实施例中,本发明的基于多分类器集成的信用评级装置还包括:朴素贝叶斯分类器模型训练单元,用于获取历史的财务特征数据和历史的信用评级数据;并根据历史的财务特征数据、历史的信用评级数据以及预设的朴素贝叶斯分类算法训练出所述朴素贝叶斯分类器模型,以根据训练出的所述朴素贝叶斯分类器模型对债券发行人进行信用评级。
在本发明可选实施例中,本发明的基于多分类器集成的信用评级装置还包括:梯度提升决策树分类器模型训练单元,用于获取历史的财务特征数据和历史的信用评级数据;并根据历史的财务特征数据、历史的信用评级数据以及预设的梯度提升决策树算法训练出所述梯度提升决策树分类器模型,以根据训练出的所述梯度提升决策树分类器模型对债券发行人进行信用评级。
在本发明可选实施例中,本发明的基于多分类器集成的信用评级装置还包括:随机森林分类器模型训练单元,用于获取历史的财务特征数据和历史的信用评级数据;并根据历史的财务特征数据、历史的信用评级数据以及预设的随机森林算法训练出所述随机森林分类器模型,以根据训练出的所述随机森林分类器模型对债券发行人进行信用评级。
为了实现上述目的,根据本申请的另一方面,还提供了一种计算机设备。如图3所示,该计算机设备包括存储器、处理器、通信接口以及通信总线,在存储器上存储有可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述实施例方法中的步骤。
处理器可以为中央处理器(Central Processing Unit,CPU)。处理器还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及单元,如本发明上述方法实施例中对应的程序单元。处理器通过运行存储在存储器中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及作品数据处理,即实现上述方法实施例中的方法。
存储器可以包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需要的应用程序;存储数据区可存储处理器所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个单元存储在所述存储器中,当被所述处理器执行时,执行上述实施例中的方法。
上述计算机设备具体细节可以对应参阅上述实施例中对应的相关描述和效果进行理解,此处不再赘述。
为了实现上述目的,根据本申请的另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序在计算机处理器中执行时实现上述基于多分类器集成的信用评级方法中的步骤。本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(RandomAccessMemory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (12)

1.一种基于多分类器集成的信用评级方法,其特征在于,包括:
获取债券发行人的财务特征数据;
将所述财务特征数据分别输入到训练好的朴素贝叶斯分类器模型、梯度提升决策树分类器模型以及随机森林分类器模型中,得到各分类器模型输出的信用评级结果,其中,所述朴素贝叶斯分类器模型、所述梯度提升决策树分类器模型以及所述随机森林分类器模型均为根据历史的财务特征数据和历史的信用评级数据训练得出;
根据各分类器模型输出的信用评级结果确定所述债券发行人的信用评级。
2.根据权利要求1所述的基于多分类器集成的信用评级方法,其特征在于,所述财务特征数据包括:四个季度的营业收入增长率、四个季度扣除非经常性损益后的净利润的增长率、营业收入与固定资产比以及流动资产与流动负债比中的至少一个。
3.根据权利要求1或2所述的基于多分类器集成的信用评级方法,其特征在于,还包括:
获取历史的财务特征数据和历史的信用评级数据;
根据历史的财务特征数据、历史的信用评级数据以及预设的朴素贝叶斯分类算法训练出所述朴素贝叶斯分类器模型,以根据训练出的所述朴素贝叶斯分类器模型对债券发行人进行信用评级。
4.根据权利要求1或2所述的基于多分类器集成的信用评级方法,其特征在于,还包括:
获取历史的财务特征数据和历史的信用评级数据;
根据历史的财务特征数据、历史的信用评级数据以及预设的梯度提升决策树算法训练出所述梯度提升决策树分类器模型,以根据训练出的所述梯度提升决策树分类器模型对债券发行人进行信用评级。
5.根据权利要求1或2所述的基于多分类器集成的信用评级方法,其特征在于,还包括:
获取历史的财务特征数据和历史的信用评级数据;
根据历史的财务特征数据、历史的信用评级数据以及预设的随机森林算法训练出所述随机森林分类器模型,以根据训练出的所述随机森林分类器模型对债券发行人进行信用评级。
6.一种基于多分类器集成的信用评级装置,其特征在于,包括:
财务特征数据确定单元,用于获取债券发行人的财务特征数据;
多分类器信用评级单元,用于将所述财务特征数据分别输入到训练好的朴素贝叶斯分类器模型、梯度提升决策树分类器模型以及随机森林分类器模型中,得到各分类器模型输出的信用评级结果,其中,所述朴素贝叶斯分类器模型、所述梯度提升决策树分类器模型以及所述随机森林分类器模型均为根据历史的财务特征数据和历史的信用评级数据训练得出;
债券发行人信用评级确定单元,用于根据各分类器模型输出的信用评级结果确定所述债券发行人的信用评级。
7.根据权利要求6所述的基于多分类器集成的信用评级装置,其特征在于,所述财务特征数据包括:四个季度的营业收入增长率、四个季度扣除非经常性损益后的净利润的增长率、营业收入与固定资产比以及流动资产与流动负债比中的至少一个。
8.根据权利要求6或7所述的基于多分类器集成的信用评级装置,其特征在于,还包括:
朴素贝叶斯分类器模型训练单元,用于获取历史的财务特征数据和历史的信用评级数据;并根据历史的财务特征数据、历史的信用评级数据以及预设的朴素贝叶斯分类算法训练出所述朴素贝叶斯分类器模型,以根据训练出的所述朴素贝叶斯分类器模型对债券发行人进行信用评级。
9.根据权利要求6或7所述的基于多分类器集成的信用评级装置,其特征在于,还包括:
梯度提升决策树分类器模型训练单元,用于获取历史的财务特征数据和历史的信用评级数据;并根据历史的财务特征数据、历史的信用评级数据以及预设的梯度提升决策树算法训练出所述梯度提升决策树分类器模型,以根据训练出的所述梯度提升决策树分类器模型对债券发行人进行信用评级。
10.根据权利要求6或7所述的基于多分类器集成的信用评级装置,其特征在于,还包括:
随机森林分类器模型训练单元,用于获取历史的财务特征数据和历史的信用评级数据;并根据历史的财务特征数据、历史的信用评级数据以及预设的随机森林算法训练出所述随机森林分类器模型,以根据训练出的所述随机森林分类器模型对债券发行人进行信用评级。
11.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5任一项所述的方法。
12.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序在计算机处理器中执行时实现如权利要求1至5任意一项所述的方法。
CN202010009078.5A 2020-01-06 2020-01-06 基于多分类器集成的信用评级方法及装置 Pending CN111242191A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010009078.5A CN111242191A (zh) 2020-01-06 2020-01-06 基于多分类器集成的信用评级方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010009078.5A CN111242191A (zh) 2020-01-06 2020-01-06 基于多分类器集成的信用评级方法及装置

Publications (1)

Publication Number Publication Date
CN111242191A true CN111242191A (zh) 2020-06-05

Family

ID=70872449

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010009078.5A Pending CN111242191A (zh) 2020-01-06 2020-01-06 基于多分类器集成的信用评级方法及装置

Country Status (1)

Country Link
CN (1) CN111242191A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111782807A (zh) * 2020-06-19 2020-10-16 西北工业大学 一种基于多方法集成学习的自承认技术债务检测分类方法
CN112529695A (zh) * 2020-12-23 2021-03-19 招联消费金融有限公司 信用风险确定方法、装置、计算机设备和存储介质
CN112818899A (zh) * 2021-02-22 2021-05-18 招联消费金融有限公司 人脸图像处理方法、装置、计算机设备和存储介质
CN112819069A (zh) * 2021-01-29 2021-05-18 中国农业银行股份有限公司 一种事件的定级方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106803204A (zh) * 2017-01-17 2017-06-06 上海聚赟大数据有限公司 一种基于机器学习的债券发行人违约分析方法
CN107248030A (zh) * 2017-05-26 2017-10-13 谢首鹏 一种基于机器学习算法的债券风险预测方法及***
CN107766418A (zh) * 2017-09-08 2018-03-06 广州汪汪信息技术有限公司 一种基于融合模型的信用评估方法、电子设备和存储介质
CN110490726A (zh) * 2019-07-11 2019-11-22 林宏伟 信用债风险管理方法、装置、设备及存储介质
CN110503459A (zh) * 2019-07-19 2019-11-26 平安科技(深圳)有限公司 基于大数据的用户信用度评估方法、装置及存储介质
CN110580268A (zh) * 2019-08-05 2019-12-17 西北大学 一种基于深度学习的信用评分集成分类***和方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106803204A (zh) * 2017-01-17 2017-06-06 上海聚赟大数据有限公司 一种基于机器学习的债券发行人违约分析方法
CN107248030A (zh) * 2017-05-26 2017-10-13 谢首鹏 一种基于机器学习算法的债券风险预测方法及***
CN107766418A (zh) * 2017-09-08 2018-03-06 广州汪汪信息技术有限公司 一种基于融合模型的信用评估方法、电子设备和存储介质
CN110490726A (zh) * 2019-07-11 2019-11-22 林宏伟 信用债风险管理方法、装置、设备及存储介质
CN110503459A (zh) * 2019-07-19 2019-11-26 平安科技(深圳)有限公司 基于大数据的用户信用度评估方法、装置及存储介质
CN110580268A (zh) * 2019-08-05 2019-12-17 西北大学 一种基于深度学习的信用评分集成分类***和方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
李艳秋: "基于集成学习的人脸识别研究", 《中国博士学位论文全文数据库 信息科技辑》, no. 02, 15 February 2019 (2019-02-15), pages 45 - 102 *
王冲: "《现代信息检索技术基本原理教程》", 西安电子科技大学出版社, pages: 98 - 102 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111782807A (zh) * 2020-06-19 2020-10-16 西北工业大学 一种基于多方法集成学习的自承认技术债务检测分类方法
CN111782807B (zh) * 2020-06-19 2024-05-24 西北工业大学 一种基于多方法集成学习的自承认技术债务检测分类方法
CN112529695A (zh) * 2020-12-23 2021-03-19 招联消费金融有限公司 信用风险确定方法、装置、计算机设备和存储介质
CN112819069A (zh) * 2021-01-29 2021-05-18 中国农业银行股份有限公司 一种事件的定级方法及装置
CN112818899A (zh) * 2021-02-22 2021-05-18 招联消费金融有限公司 人脸图像处理方法、装置、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
Xia et al. Cost-sensitive boosted tree for loan evaluation in peer-to-peer lending
CN111967971B (zh) 银行客户数据处理方法及装置
CN111242191A (zh) 基于多分类器集成的信用评级方法及装置
CN108665366A (zh) 确定用户风险等级的方法、终端设备及计算机可读存储介质
CN108898476A (zh) 一种贷款客户信用评分方法和装置
WO2019062006A1 (zh) 基于机器学习的择时入股方法、装置及终端设备
CN113095927B (zh) 一种反洗钱可疑交易识别方法及设备
KR102342321B1 (ko) 딥러닝 기반의 주식 스크리닝과 이를 이용한 포트폴리오 자동화 및 고도화 방법 및 장치
Song Stock trend prediction: Based on machine learning methods
Khodaee et al. Forecasting turning points in stock price by applying a novel hybrid CNN-LSTM-ResNet model fed by 2D segmented images
CN110796485A (zh) 一种提高预测模型的预测精度的方法及装置
CN112613997A (zh) 货币基金的组合投资预测方法和预测装置
CN112434862B (zh) 上市企业财务困境预测方法及装置
Sutkatti et al. Stock market forecasting techniques: A survey
CN111667307B (zh) 一种理财产品销量的预测方法及装置
CN108629381A (zh) 基于大数据的人群筛选方法及终端设备
Ochotorena et al. Robust stock trading using fuzzy decision trees
CN115186898A (zh) 一种银行开户量预测方法及装置
CN114722941A (zh) 信贷违约识别方法、装置、设备和介质
CN111191688A (zh) 一种用户分期期数管理方法、装置和电子设备
Borovkova et al. Deep learning prediction of the eurostoxx 50 with news sentiment
CN111340632A (zh) 资源管控方法以及装置
CN111080433A (zh) 一种信用风险评估方法与装置
Wang Forecasting Credit Card Defaults Using Light Gradient Boosting Machine with Dart Algorithm
Zhang et al. Large-scale uncertainty estimation and its application in revenue forecast of SMEs

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20220908

Address after: 25 Financial Street, Xicheng District, Beijing 100033

Applicant after: CHINA CONSTRUCTION BANK Corp.

Address before: 25 Financial Street, Xicheng District, Beijing 100033

Applicant before: CHINA CONSTRUCTION BANK Corp.

Applicant before: Jianxin Financial Science and Technology Co.,Ltd.

TA01 Transfer of patent application right