CN106022517A - 一种基于核极限学习机的风险预测的方法和装置 - Google Patents

一种基于核极限学习机的风险预测的方法和装置 Download PDF

Info

Publication number
CN106022517A
CN106022517A CN201610326839.3A CN201610326839A CN106022517A CN 106022517 A CN106022517 A CN 106022517A CN 201610326839 A CN201610326839 A CN 201610326839A CN 106022517 A CN106022517 A CN 106022517A
Authority
CN
China
Prior art keywords
rightarrow
grey wolf
core
wolf
learning machine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610326839.3A
Other languages
English (en)
Inventor
陈慧灵
赵学华
王名镜
童长飞
蔡振闹
李俊
沈立明
王科杰
朱彬磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wenzhou University
Original Assignee
Wenzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wenzhou University filed Critical Wenzhou University
Priority to CN201610326839.3A priority Critical patent/CN106022517A/zh
Publication of CN106022517A publication Critical patent/CN106022517A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Educational Administration (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明适用于计算机领域,提供了一种基于核极限学习机的风险预测的方法和装置,旨在解决现有技术中无法确定核极限学习机的惩罚系数和核宽的最佳值,导致风险预测精确度不高的问题。方法包括:获取预定数量的企业的经营数据;对经营数据进行标准化;利用灰狼算法优化核极限学习机的惩罚系数和核宽,得到优化后的惩罚系数和核宽;基于优化后的惩罚系数和核宽构建核极限学习机的预测模型;根据预测模型进行风险预测。通过本发明的技术方案,将灰狼算法融入核极限学习机来确定惩罚系数和核宽的最佳值,构建出更加准确的预测模型,实现对风险的有效预测,提高预测精确度,在辅助金融机构对企业经营风险进行科学合理有效的预测中具有重要的应用价值。

Description

一种基于核极限学习机的风险预测的方法和装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于核极限学习机的风险预测的方法和装置。
背景技术
为了减少企业经营风险尤其是破产风险对金融机构造成的损失,通过建立安全有效的风险预警机制并对企业经营风险进行预测的方法,是金融机构保持投资回报的有效方式。
目前已有的企业经营风险预测方法主要可分为两类,即基于统计学模型的方法和基于人工智能的方法。基于统计学模型的预测方法主要有单变量分析法、多元判别分析法、罗吉斯特回归模型和因子分析法。相比于基于统计学模型的预测方法,基于人工智能的预测方法因其优越的性能而被广泛应用于金融风险预测领域。
当前,基于人工智能的预测方法主要有基于人工神经网络、基于支持向量机、基于k近邻、基于贝叶斯模型、基于极限学习机、基于混合模型以及集成学习等方法,这些方法都已经成功的应用于金融风险预测领域。其中,基于人工神经网络的方法由于其能够较好地捕捉数据中的非线性关系而得到广泛地应用收。但基于人工神经网络的方法因通常采用梯度下降法进行学习而存在易陷入局部最小值的不足,同时网络构建过程也需要对大量的参数进行调整而难以建立起最优的模型。为了克服神经网络的这些缺点,出现了一种新的神经网络学习方法即极限学习机。由于极限学习机具有良好的学习泛化能力,基于极限学习的模型已经开始应用于金融破产预测、经济生命周期预测和企业信用评估等风险预测和评估中。由于极限学习机的输入参数值随机产生,导致模型的性能不够稳定,为了解决该问题,核极限学习机的概念被提出。相比于极限学习机,核极限学习机不需要随机设置输入层和隐藏层的权值,因而能够获得更高的训练速度,基于核极限学习机的企业经营风险预测相比其他预测方法更加准确。
然而,现有研究表明核极限学习机的性能易受两个参数影响,即惩罚系数和核宽。惩罚系数用于确定拟合误差最小化和输入之间的权衡重量最小化,核宽定义了从输入空间到高维特征空间的非线性映射关系。这两个关键参数需要预先确定,如何确定最优的惩罚系数和最优的核宽,一直未获得较好的解决,目前,通常采用的方法是利用网格搜索方法确定它们的值,但网络搜索方法易陷入局部最优,因而导致风险预测的精确度不高。
发明内容
本发明的目的在于提供一种基于核极限学习机的风险预测的方法和装置,旨在解决现有技术中无法确定核极限学习机的惩罚系数和核宽的最佳值,导致风险预测的精确度不高的问题。
本发明的第一方面,提供一种基于核极限学习机的风险预测的方法,包括:
获取预定数量的企业的经营数据,所述经营数据包括预定个数的属性特征的特征值;
对所述经营数据进行标准化;
基于标准化后的所述经营数据,利用灰狼算法优化核极限学习机的惩罚系数和核宽,得到优化后的惩罚系数和优化后的核宽,所述优化后的惩罚系数用于确定拟合误差最小化以及输入数据之间的权衡重量最小化,所述优化后的核宽为从输入空间到高维特征空间的非线性映射关系;
基于所述优化后的惩罚系数和所述优化后的核宽构建所述核极限学习机的预测模型;
根据所述预测模型进行风险预测。
本发明的第二方面,提供一种基于核极限学习机的风险预测的装置,包括:
数据获取模块,用于获取预定数量的企业的经营数据,所述经营数据包括预定个数的属性特征的特征值;
标准化模块,用于对所述经营数据进行标准化;
灰狼优化模块,用于基于标准化后的所述经营数据,利用灰狼算法优化核极限学习机的惩罚系数和核宽,得到优化后的惩罚系数和优化后的核宽,所述优化后的惩罚系数用于确定拟合误差最小化以及输入数据之间的权衡重量最小化,所述优化后的核宽为从输入空间到高维特征空间的非线性映射关系;
模型构建模块,用于基于所述优化后的惩罚系数和所述优化后的核宽构建所述核极限学习机的预测模型;
预测模块,用于根据所述预测模型进行风险预测。
本发明与现有技术相比存在的有益效果是:通过将灰狼算法融入核极限学习机来确定核极限学习机的惩罚系数和核宽,由于灰狼算法通过模仿自然界中狼群的社会等级和猎食行为获得问题的最优解,因此具有更好的搜索能力,能够确定核极限学习机的惩罚系数和核宽的最佳值,从而可以构建出更加准确的核极限学习机的预测模型,实现对企业经营风险的有效预测,并大大提高了预测的精确度,在辅助金融机构对企业经营风险进行科学合理有效的预测中具有重要的应用价值。
附图说明
图1是本发明实施例一提供的一种基于核极限学习机的风险预测的方法的流程图;
图2是本发明实施例二提供的一种基于核极限学习机的风险预测的方法的流程图;
图3是本发明实施例三提供的一种基于核极限学习机的风险预测的装置的结构示意图;
图4是本发明实施例四提供的一种基于核极限学习机的风险预测的装置的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
以下结合具体附图对本发明的实现进行详细的描述。
实施例一:
图1是本发明实施例一提供的一种基于核极限学习机的风险预测的方法的流程图,具体包括步骤S101至S104,详述如下:
S101、获取预定数量的企业的经营数据,该经营数据包括预定个数的属性特征的特征值。
具体地,企业经营数据指从会计学角度定义的企业当前经济状况的属性特征,属性特征代表一系列的金融比率,具体可以但不限于包括现金/流动负债比(cash/currentliabilities)、现金/总资产比(cash/total assets)、流动资产/流动负载比(currentassets/current liabilities)、流动资产/总资产比(current assets/total assets)、营运资金/总资产比(working capital/total assets)、营运资金/销售额比(workingcapital/sales)、销售额/库存比(sales/inventory)、销售额/应收账款比(sales/receivables)等。
在预定数量的企业中,每一个企业都提供预定个数的属性特征,这些预定数量的企业的预定个数的属性特征的特征值构成全部经营数据。
S102、对经营数据进行标准化。
具体地,在每一个企业的经营数据中,对每一个属性特征均进行标准化处理,使得标准化处理后的经营数据能够准确有效的支撑灰狼算法的实现。
进一步地,可以按照公式(1)对经营数据进行标准化处理:
s y [ i ] ′ = s y [ i ] - s [ i ] min s [ i ] m a x - s [ i ] m i n - - - ( 1 )
其中,sy[i]'为第y个企业的第i个属性特征标准化后的特征值,sy[i]为第y个企业的第i个属性特征的特征值,s[i]max为预定数量的企业的第i个属性特征的最大值,s[i]min为预定数量的企业的第i个属性特征的最小值,y∈[1,Y],Y为预定数量的企业,i∈[1,I],I为预定个数的属性特征。
S103、基于标准化后的经营数据,利用灰狼算法优化核极限学习机的惩罚系数和核宽,得到优化后的惩罚系数和优化后的核宽,优化后的惩罚系数用于确定拟合误差最小化以及输入数据之间的权衡重量最小化,优化后的核宽为从输入空间到高维特征空间的非线性映射关系。
具体地,灰狼算法的过程是根据标准化后的经营数据计算灰狼的位置,并确定排在前三位的灰狼的位置,并根据这前三位灰狼的位置,使其他的灰狼跟随着这三只最优秀的灰狼去围捕猎物,即让其他灰狼的位置不断围绕和接近这三只灰狼,每更新一次位置即完成一次迭代过程,并得到狼群的一个新的位置集合,反复迭代直到达到预置的最大迭代次数为止。
每一只灰狼的位置包括两个参数,即惩罚系数和核宽,惩罚系数用于确定拟合误差最小化以及输入数据之间的权衡重量最小化,核宽为从输入空间到高维特征空间的非线性映射关系。因此,在通过灰狼算法得到的狼群的最终位置集合中,排在第一位的灰狼即头狼的位置的两个参数即为优化后的惩罚系数和优化后的核宽。
S104、基于优化后的惩罚系数和优化后的核宽构建核极限学习机的预测模型。
具体地,基于步骤S103得到的优化后的惩罚系数和优化后的核宽,进行核极限学习机的预测模型的构建。
S105、根据预测模型进行风险预测。
具体地,根据步骤S104构建的核极限学习机的预测模型,可以对企业经营风险进行预测。
本实施例中,通过将灰狼算法融入核极限学习机来确定核极限学习机的惩罚系数和核宽,由于灰狼算法通过模仿自然界中狼群的社会等级和猎食行为获得问题的最优解,因此具有更好的搜索能力,能够确定核极限学习机的惩罚系数和核宽的最佳值,从而可以构建出更加准确的核极限学习机的预测模型,实现对企业经营风险的有效预测,并大大提高了预测的精确度,在辅助金融机构对企业经营风险进行科学合理有效的预测中具有重要的应用价值。
实施例二:
图2是本发明实施例二提供的一种基于核极限学习机的风险预测的方法的流程图,具体包括步骤S201至S208,详述如下:
S201、获取预定数量的企业的经营数据,该经营数据包括预定个数的属性特征的特征值。
具体地,企业经营数据指从会计学角度定义的企业当前经济状况的属性特征,属性特征代表一系列的金融比率,具体可以但不限于包括现金/流动负债比(cash/currentliabilities)、现金/总资产比(cash/total assets)、流动资产/流动负载比(currentassets/current liabilities)、流动资产/总资产比(current assets/total assets)、营运资金/总资产比(working capital/total assets)、营运资金/销售额比(workingcapital/sales)、销售额/库存比(sales/inventory)、销售额/应收账款比(sales/receivables)等。
在预定数量的企业中,每一个企业都提供预定个数的属性特征,这些预定数量的企业的预定个数的属性特征的特征值构成了全部经营数据。
S202、对经营数据进行标准化。
在每一个企业的经营数据中,对每一个属性特征均进行标准化处理,使得标准化处理后的经营数据能够准确有效的支撑灰狼算法的实现。
具体地,可以按照公式(2)对经营数据进行标准化处理:
s y [ i ] ′ = s y [ i ] - s [ i ] m i n s [ i ] m a x - s [ i ] m i n - - - ( 2 )
其中,sy[i]'为第y个企业的第i个属性特征标准化后的特征值,sy[i]为第y个企业的第i个属性特征的特征值,s[i]max为预定数量的企业的第i个属性特征的最大值,s[i]min为预定数量的企业的第i个属性特征的最小值,y∈[1,Y],Y为预定数量的企业,i∈[1,I],I为预定个数的属性特征。
S203、初始化灰狼参数,该灰狼参数包括最大迭代次数T、灰狼个数M、惩罚系数C的搜索范围[Cmin,Cmax]和核宽γ的搜索范围[γminmax]。
具体地,对灰狼算法中需要用到的灰狼参数进行初始化,可以但不限于包括最大迭代次数T、灰狼个数M、惩罚系数C的搜索范围[Cmin,Cmax]和核宽γ的搜索范围[γminmax]。
S204、设置每一只灰狼的位置Xm,并建立灰狼位置矩阵
具体地,按照公式(3)设置每一只灰狼的位置Xm
Xm=(xm1,xm2) (3)
其中,xm1为灰狼m在当前位置时惩罚系数的值,xm2为灰狼m在当前位置时核宽的值,m∈[1,M],xm1∈[Cmin,Cmax],xm2∈[γminmax]。
根据每一只灰狼的位置Xm,按照公式(4)构建灰狼位置矩阵
X → = x 11 x 12 x 21 x 22 . . . x M 1 x M 2 - - - ( 4 )
S205、计算每一只灰狼的适应度fm
具体地,适应度fm为基于Xm计算得到的核极限学***均准确度,核极限学习机的准确度ACC按照公式(5)计算得到:
A C C = Σ 1 K acc k K - - - ( 5 )
其中,acck为第k折交叉验证的准确度,K为大于0的整数。
交叉验证(Cross-validation)是指在给定的建模样本中,拿出大部分样本进行模型构建,留小部分样本对所建立的模型进行预报,并求这小部分样本的预报误差,这个过程一直进行,直到所有的样本都被预报了一次而且仅被预报一次。交叉验证的目的是为了得到可靠稳定的模型。K折交叉验证(K-fold cross-validation)是交叉验证的一种具体形式,常用的K折交叉验证为10折交叉验证(10-fold cross validation)。
在本实施例中,K折交叉验证(K-fold cross-validation)是指将步骤S202得到的标准化后的经营数据分割成K个子样本,轮流将其中一个子样本作为测试数据,其他K-1个子样本作为训练数据,保证每一个子样本都有一次作为测试数据的机会。交叉验证重复K次,每个子样本验证一次,每一次交叉验证的结果即为acck,平均K次交叉验证的结果得到一个单一估测值,即核极限学习机的准确度ACC。
S206、按照适应度fm对灰狼进行排序,得到具有最高适应度的灰狼α的位置具有次高适应度的灰狼β的位置和适应度第三高的灰狼δ的位置
具体地,对灰狼按照步骤S205得到的适应度fm的值进行排序,得到具有最高适应度的灰狼α的位置具有次高适应度的灰狼β的位置和适应度第三高的灰狼δ的位置其中具有最高适应度的灰狼α作为头狼。
S207、分别计算灰狼α、灰狼β和灰狼δ距离猎物的距离
具体地,按照公式(6)计算计算灰狼α、灰狼β和灰狼δ距离猎物的距离
D α → = | C 1 → · X α → - X → | D β → = | C 2 → · X β → - X → | D δ → = | C 3 → · X δ → - X → | - - - ( 6 )
其中,通过公式计算得到,为[0,1]之间的随机数,即取不同的随机数分别得到 为当前的灰狼位置矩阵,为在当前灰狼位置矩阵中排在前三位的灰狼的位置。
S208、完成对灰狼位置矩阵的更新。
具体地,按照公式(7)对灰狼位置矩阵进行更新:
X → = X 1 → + X 2 → + X 3 → 3 X 1 → = X α → - A 1 → · ( D α → ) X 2 → = X β → - A 2 → · ( D β → ) X 3 → = X δ → - A 3 → · ( D δ → ) - - - ( 7 )
其中,通过公式计算得到,t为当前迭代次数,t∈[1,T],随着迭代次数t的增加会在2到0之间线性递减,为[0,1]之间的随机数,即取不同的随机数分别得到 通过公式(6)计算得到。
灰狼算法的核心思想是让除去排在狼群前三位的其他灰狼跟随着这三只优秀的灰狼去围捕猎物,这是灰狼算法的算法生物学核心意义所在。在具体算法中,这个核心思想是通过公式(7)来模拟实现的。其中,的含义是让狼群中除去灰狼α之外的其他灰狼跟随着灰狼α去猎食,即其他灰狼的位置不断接近灰狼α,的含义是让狼群中除去灰狼β之外的其他灰狼跟随着灰狼β去猎食,即其他灰狼的位置不断接近灰狼β,的含义是让狼群中除去灰狼δ之外的其他灰狼跟随着灰狼δ去猎食,即其他灰狼的位置不断接近灰狼δ,的含义则是对围绕着这三只优秀的灰狼产生的新的狼群的三个灰狼位置矩阵进行平均,所得到的即为此次迭代后更新的狼群的灰狼位置矩阵
S209、判断当前迭代次数t是否达到所述最大迭代次数T,如果是,则执行步骤S210,否则根据更新后的灰狼位置矩阵返回步骤S205继续执行。
具体地,如果当前迭代次数t是否达到所述最大迭代次数T,则灰狼优化完成,执行步骤S210,否则根据更新后的灰狼位置矩阵返回步骤S205继续进行迭代。
S210、输出灰狼α的位置Xα=(xα1,xα2),其中xα1为优化后的惩罚系数C,xα2为优化后的核宽γ。
具体地,当前迭代次数t达到所述最大迭代次数T时,此时最新的灰狼位置矩阵中排在第一位的头狼的位置的参数即为优化后的惩罚系数C和优化后的核宽γ。即灰狼α的位置Xα=(xα1,xα2)中,xα1为优化后的惩罚系数C,xα2为优化后的核宽γ。
S211、基于优化后的惩罚系数C和优化后的核宽γ构建核极限学习机的预测模型。
具体地,基于优化后的惩罚系数C和优化后的核宽γ,按照公式(8)构建核极限学习机的预测模型:
f ( s ) = K ( s , s 1 ) . . . K ( s , s N ) ( 1 C + Ω E L M ) - 1 T K ( s , s n ) = exp ( - γ | | s - s n | | 2 ) - - - ( 8 )
其中,s为待测试样本,s1,…,sN为训练样本,N为预置的训练样本数,n∈[1,N],ΩELM为预置的符合Mercer定理构造的核矩阵。
待测试样本是指在现有的数据集即步骤S202得到的标准化后的经营数据中,按照预设的规则取一定数量的样本,作为检测模型性能的数据,训练样本是指除去待检测样本的其他样本,作为训练模型的训练样本。待测试样本和训练样本的样本个数由N的取值决定。
Mercer定理是指任何半正定的函数都可以作为核函数。
S212、根据预测模型进行风险预测。
具体地,根据步骤S211构建的核极限学习机的预测模型,可以对企业经营风险进行预测。
本实施例中,通过将灰狼算法融入核极限学习机来确定核极限学习机的惩罚系数和核宽,具体地,将惩罚系数和核宽设定为灰狼的位置参数并设置灰狼位置矩阵,通过计算灰狼的适应度并对适应度的值进行排序,得到适应度排在前三位的灰狼的位置,并根据前三位的灰狼位置不断更新灰狼位置矩阵,使其他灰狼的位置不断接近这三只灰狼,即通过模仿自然界中狼群的社会等级和猎食行为获得问题的最优解,即核极限学习机的惩罚系数和核宽的最佳值,从而可以构建出更加准确的核极限学习机的预测模型,实现对企业经营风险的有效预测,并大大提高了预测的精确度,在辅助金融机构对企业经营风险进行科学合理有效的预测中具有重要的应用价值。
实施例三:
图3是本发明实施例三提供的一种基于核极限学习机的风险预测的装置的结构示意图,为了便于说明,仅示出了与本发明实施例相关的部分。图3示例的一种基于核极限学习机的风险预测的装置可以是前述实施例一提供的一种基于核极限学习机的风险预测的方法的执行主体。图3示例的集中基于核极限学习机的风险预测的装置主要包括:数据获取模块31、标准化模块32、灰狼优化模块33、模型构建模块34和预测模块35。各功能模块详细说明如下:
数据获取模块31,用于获取预定数量的企业的经营数据,该经营数据包括预定个数的属性特征的特征值;
标准化模块32,用于对经营数据进行标准化;
灰狼优化模块33,用于基于标准化后的经营数据,利用灰狼算法优化核极限学习机的惩罚系数和核宽,得到优化后的惩罚系数和优化后的核宽,优化后的惩罚系数用于确定拟合误差最小化以及输入数据之间的权衡重量最小化,优化后的核宽为从输入空间到高维特征空间的非线性映射关系;
模型构建模块34,用于基于优化后的惩罚系数和优化后的核宽构建核极限学习机的预测模型;
预测模块35,用于根据预测模型进行风险预测。
本实施例提供的一种基于核极限学习机的风险预测的装置中各模块实现各自功能的过程,具体可参考前述图1所示实施例的描述,此处不再赘述。
从上述图3示例的一种基于核极限学习机的风险预测的装置可知,本实施例中,通过将灰狼算法融入核极限学习机来确定核极限学习机的惩罚系数和核宽,由于灰狼算法通过模仿自然界中狼群的社会等级和猎食行为获得问题的最优解,因此具有更好的搜索能力,能够确定核极限学习机的惩罚系数和核宽的最佳值,从而可以构建出更加准确的核极限学习机的预测模型,实现对企业经营风险的有效预测,并大大提高了预测的精确度,在辅助金融机构对企业经营风险进行科学合理有效的预测中具有重要的应用价值。
实施例四:
图4是本发明实施例四提供的一种基于核极限学习机的风险预测的装置的结构示意图,为了便于说明,仅示出了与本发明实施例相关的部分。图4示例的一种基于核极限学习机的风险预测的装置可以是前述实施例二提供的一种基于核极限学习机的风险预测的方法的执行主体。图4示例的集中基于核极限学习机的风险预测的装置主要包括:数据获取模块41、标准化模块42、灰狼优化模块43、模型构建模块44和预测模块45。各功能模块详细说明如下:
数据获取模块41,用于获取预定数量的企业的经营数据,该经营数据包括预定个数的属性特征的特征值;
标准化模块42,用于对经营数据进行标准化;
灰狼优化模块43,用于基于标准化后的经营数据,利用灰狼算法优化核极限学习机的惩罚系数和核宽,得到优化后的惩罚系数和优化后的核宽,优化后的惩罚系数用于确定拟合误差最小化以及输入数据之间的权衡重量最小化,优化后的核宽为从输入空间到高维特征空间的非线性映射关系;
模型构建模块44,用于基于优化后的惩罚系数和优化后的核宽构建核极限学习机的预测模型;
预测模块45,用于根据预测模型进行风险预测。
进一步地,标准化模块42,还用于:
按如下公式对经营数据进行标准化:
s y [ i ] ′ = s y [ i ] - s [ i ] m i n s [ i ] m a x - s [ i ] m i n
其中,sy[i]'为第y个企业的第i个属性特征标准化后的特征值,sy[i]为第y个企业的第i个属性特征的特征值,s[i]max为所述预定数量的企业的第i个属性特征的最大值,s[i]min为所述预定数量的企业的第i个属性特征的最小值,y∈[1,Y],Y为所述预定数量的企业,i∈[1,I],I为所述预定个数的属性特征。
进一步地,灰狼优化模块43包括:
初始化子模块431,用于初始化灰狼参数,该灰狼参数包括最大迭代次数T、灰狼个数M、惩罚系数C的搜索范围[Cmin,Cmax]和核宽γ的搜索范围[γminmax];
位置设置子模块432,用于按如下公式设置每一只灰狼的位置Xm,并建立灰狼位置矩阵
Xm=(xm1,xm2)
X → = x 11 x 12 x 21 x 22 . . . x M 1 x M 2
其中,xm1为灰狼m在当前位置时惩罚系数的值,xm2为灰狼m在当前位置时核宽的值,m∈[1,M],xm1∈[Cmin,Cmax],xm2∈[γminmax];
优化迭代子模块433,用于根据标准化后的经营数据计算灰狼的适应度,并按照适应度对灰狼进行排序,更新灰狼位置得到更新后的灰狼位置矩阵完成一次灰狼优化迭代,并根据更新后的灰狼位置矩阵继续进行灰狼优化迭代,直到达到最大迭代次数T为止,输出当前灰狼位置矩阵中头狼的位置,根据头狼的位置得到优化后的惩罚系数C和优化后的核宽γ。
进一步地,优化迭代子模块433,还用于:
计算每一只灰狼的适应度fm,该适应度fm为基于Xm计算得到的核极限学***均准确度,准确度ACC的计算公式为:
A C C = Σ 1 K acc k K
其中,acck为第k折交叉验证的准确度,K为大于0的整数;
按照适应度fm对灰狼进行排序,得到具有最高适应度的灰狼α的位置具有次高适应度的灰狼β的位置和适应度第三高的灰狼δ的位置
按照如下公式分别计算灰狼α、灰狼β和灰狼δ距离猎物的距离
D α → = | C 1 → · X α → - X → |
D β → = | C 2 → · X β → - X → |
D δ → = | C 3 → · X δ → - X → |
其中,通过公式计算得到,为[0,1]之间的随机数;
按照如下公式完成对灰狼位置矩阵的更新:
X → = X 1 → + X 2 → + X 3 → 3
X 1 → = X α → - A 1 → · ( D α → )
X 2 → = X β → - A 2 → · ( D β → )
X 3 → = X δ → - A 3 → · ( D δ → )
其中,通过公式计算得到,t为当前迭代次数,t∈[1,T],为[0,1]之间的随机数;
如果当前迭代次数t尚未达到最大迭代次数T,则根据更新后的灰狼位置矩阵继续进行灰狼优化迭代,直到当前迭代次数t达到最大迭代次数T为止;
输出灰狼α的位置Xα=(xα1,xα2),其中xα1为优化后的惩罚系数C,xα2为优化后的核宽γ。
进一步地,模型构建模块44包括:
预测模型构建子模块441,用于基于优化后的惩罚系数C和优化后的核宽γ,按照如下公式构建核极限学习机的预测模型:
f ( s ) = K ( s , s 1 ) . . . K ( s , s N ) ( 1 C + Ω E L M ) - 1 T
K(s,sn)=exp(-γ||s-sn||2)
其中,s为待测试样本,s1,…,sN为训练样本,N为预置的训练样本数,n∈[1,N],ΩELM为预置的符合Mercer定理构造的核矩阵。
本实施例提供的一种基于核极限学习机的风险预测的装置中各模块实现各自功能的过程,具体可参考前述图2所示实施例的描述,此处不再赘述。
从上述图4示例的一种基于核极限学习机的风险预测的装置可知,本实施例中,通过将灰狼算法融入核极限学习机来确定核极限学习机的惩罚系数和核宽,具体地,将惩罚系数和核宽设定为灰狼的位置参数并设置灰狼位置矩阵,通过计算灰狼的适应度并对适应度的值进行排序,得到适应度排在前三位的灰狼的位置,并根据前三位的灰狼位置不断更新灰狼位置矩阵,使其他灰狼的位置不断接近这三只灰狼,即通过模仿自然界中狼群的社会等级和猎食行为获得问题的最优解,即核极限学习机的惩罚系数和核宽的最佳值,从而可以构建出更加准确的核极限学习机的预测模型,实现对企业经营风险的有效预测,并大大提高了预测的精确度,在辅助金融机构对企业经营风险进行科学合理有效的预测中具有重要的应用价值。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每一个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同或者相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
值得注意的是,上述装置实施例中,所包括的各个模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能模块的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
本领域普通技术人员可以理解,实现上述各实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,相应的程序可以存储于一计算机可读取存储介质中,所述的存储介质,如ROM/RAM、磁盘或光盘等。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于核极限学习机的风险预测的方法,其特征在于,包括:
获取预定数量的企业的经营数据,所述经营数据包括预定个数的属性特征的特征值;
对所述经营数据进行标准化;
基于标准化后的所述经营数据,利用灰狼算法优化核极限学习机的惩罚系数和核宽,得到优化后的惩罚系数和优化后的核宽,所述优化后的惩罚系数用于确定拟合误差最小化以及输入数据之间的权衡重量最小化,所述优化后的核宽为从输入空间到高维特征空间的非线性映射关系;
基于所述优化后的惩罚系数和所述优化后的核宽构建所述核极限学习机的预测模型;
根据所述预测模型进行风险预测。
2.根据权利要求1所述的基于核极限学习机的风险预测的方法,其特征在于,所述对所述经营数据进行标准化包括:
按如下公式对所述经营数据进行标准化:
s y [ i ] ′ = s y [ i ] - s [ i ] m i n s [ i ] m a x - s [ i ] m i n
其中,sy[i]'为第y个企业的第i个属性特征标准化后的特征值,sy[i]为第y个企业的第i个属性特征的特征值,s[i]max为所述预定数量的企业的第i个属性特征的最大值,s[i]min为所述预定数量的企业的第i个属性特征的最小值,y∈[1,Y],Y为所述预定数量的企业,i∈[1,I],I为所述预定个数的属性特征。
3.根据权利要求1所述的基于核极限学习机的风险预测的方法,其特征在于,所述基于标准化后的所述经营数据,利用灰狼算法优化核极限学习机的惩罚系数和核宽,得到优化后的惩罚系数和优化后的核宽包括:
初始化灰狼参数,所述灰狼参数包括最大迭代次数T、灰狼个数M、惩罚系数C的搜索范围[Cmin,Cmax]和核宽γ的搜索范围[γminmax];
按如下公式设置每一只灰狼的位置Xm,并建立灰狼位置矩阵
Xm=(xm1,xm2)
X → = x 11 x 12 x 21 x 22 . . . x M 1 x M 2
其中,xm1为灰狼m在当前位置时所述惩罚系数的值,xm2为灰狼m在当前位置时所述核宽的值,m∈[1,M],xm1∈[Cmin,Cmax],xm2∈[γminmax];
根据标准化后的所述经营数据计算灰狼的适应度,并按照所述适应度对灰狼进行排序,更新灰狼位置得到更新后的灰狼位置矩阵完成一次灰狼优化迭代,并根据所述更新后的灰狼位置矩阵继续进行所述灰狼优化迭代,直到达到所述最大迭代次数T为止,输出当前灰狼位置矩阵中头狼的位置,根据所述头狼的位置得到优化后的惩罚系数C和优化后的核宽γ。
4.根据权利要求3所述的基于核极限学习机的风险预测的方法,其特征在于,所述根据标准化后的所述经营数据计算灰狼的适应度,并按照所述适应度对灰狼进行排序,更新灰狼位置得到更新后的灰狼位置矩阵完成一次灰狼优化迭代,并根据所述更新后的灰狼位置矩阵继续进行所述灰狼优化迭代,直到达到所述最大迭代次数T为止,输出当前灰狼位置矩阵中头狼的位置,根据所述头狼的位置得到优化后的惩罚系数C和优化后的核宽γ包括:
计算所述每一只灰狼的适应度fm,所述适应度fm为基于Xm计算得到的所述核极限学***均准确度,所述准确度ACC的计算公式为:
A C C = Σ 1 K acc k K
其中,acck为第k折交叉验证的准确度,K为大于0的整数;
按照所述适应度fm对灰狼进行排序,得到具有最高适应度的灰狼α的位置具有次高适应度的灰狼β的位置和适应度第三高的灰狼δ的位置
按照如下公式分别计算所述灰狼α、所述灰狼β和所述灰狼δ距离猎物的距离
D α → = | C 1 → · X α → - X → |
D β → = | C 2 → · X β → - X → |
D δ → = | C 3 → · X δ → - X → |
其中,通过公式计算得到,为[0,1]之间的随机数;
按照如下公式完成对灰狼位置矩阵的更新:
X → = X 1 → + X 2 → + X 3 → 3
X 1 → = X α → - A 1 → · ( D α → )
X 2 → = X β → - A 2 → · ( D β → )
X 3 → = X δ → - A 3 → · ( D δ → )
其中,通过公式计算得到,t为当前迭代次数,t∈[1,T],为[0,1]之间的随机数;
如果所述当前迭代次数t尚未达到所述最大迭代次数T,则根据更新后的灰狼位置矩阵继续进行灰狼优化迭代,直到所述当前迭代次数t达到所述最大迭代次数T为止;
输出灰狼α的位置Xα=(xα1,xα2),其中xα1为优化后的惩罚系数C,xα2为优化后的核宽γ。
5.根据权利要求1所述的基于核极限学习机的风险预测的方法,其特征在于,所述基于所述优化后的惩罚系数和所述优化后的核宽构建所述核极限学习机的预测模型包括:
基于所述优化后的惩罚系数C和所述优化后的核宽γ,按照如下公式构建所述核极限学习机的预测模型:
f ( s ) = K ( s , s 1 ) . . . K ( s , s N ) ( 1 C + Ω E L M ) - 1 T
K(s,sn)=exp(-γ||s-sn||2)
其中,s为待测试样本,s1,…,sN为训练样本,N为预置的训练样本数,n∈[1,N],ΩELM为预置的符合Mercer定理构造的核矩阵。
6.一种基于核极限学习机的风险预测的装置,其特征在于,包括:
数据获取模块,用于获取预定数量的企业的经营数据,所述经营数据包括预定个数的属性特征的特征值;
标准化模块,用于对所述经营数据进行标准化;
灰狼优化模块,用于基于标准化后的所述经营数据,利用灰狼算法优化核极限学习机的惩罚系数和核宽,得到优化后的惩罚系数和优化后的核宽,所述优化后的惩罚系数用于确定拟合误差最小化以及输入数据之间的权衡重量最小化,所述优化后的核宽为从输入空间到高维特征空间的非线性映射关系;
模型构建模块,用于基于所述优化后的惩罚系数和所述优化后的核宽构建所述核极限学习机的预测模型;
预测模块,用于根据所述预测模型进行风险预测。
7.根据权利要求6所述的基于核极限学习机的风险预测的装置,其特征在于,所述标准化模块包括:
标准化处理子模块,用于按如下公式对所述经营数据进行标准化:
s y [ i ] ′ = s y [ i ] - s [ i ] m i n s [ i ] m a x - s [ i ] m i n
其中,sy[i]'为第y个企业的第i个属性特征标准化后的特征值,sy[i]为第y个企业的第i个属性特征的特征值,s[i]max为所述预定数量的企业的第i个属性特征的最大值,s[i]min为所述预定数量的企业的第i个属性特征的最小值,y∈[1,Y],Y为所述预定数量的企业,i∈[1,I],I为所述预定个数的属性特征。
8.根据权利要求6所述的基于核极限学习机的风险预测的装置,其特征在于,所述灰狼优化模块包括:
初始化子模块,用于初始化灰狼参数,所述灰狼参数包括最大迭代次数T、灰狼个数M、惩罚系数C的搜索范围[Cmin,Cmax]和核宽γ的搜索范围[γminmax];
位置设置子模块,用于按如下公式设置每一只灰狼的位置Xm,并建立灰狼位置矩阵
Xm=(xm1,xm2)
X → = x 11 x 12 x 21 x 22 . . . x M 1 x M 2
其中,xm1为灰狼m在当前位置时所述惩罚系数的值,xm2为灰狼m在当前位置时所述核宽的值,m∈[1,M],xm1∈[Cmin,Cmax],xm2∈[γminmax];
优化迭代子模块,用于根据标准化后的所述经营数据计算灰狼的适应度,并按照所述适应度对灰狼进行排序,更新灰狼位置得到更新后的灰狼位置矩阵完成一次灰狼优化迭代,并根据所述更新后的灰狼位置矩阵继续进行所述灰狼优化迭代,直到达到所述最大迭代次数T为止,输出当前灰狼位置矩阵中头狼的位置,根据所述头狼的位置得到优化后的惩罚系数C和优化后的核宽γ。
9.根据权利要求8所述的基于核极限学习机的风险预测的装置,其特征在于,所述优化迭代子模块,还用于:
计算所述每一只灰狼的适应度fm,所述适应度fm为基于Xm计算得到的所述核极限学***均准确度,所述准确度ACC的计算公式为:
A C C = Σ 1 K acc k K
其中,acck为第k折交叉验证的准确度,K为大于0的整数;
按照所述适应度fm对灰狼进行排序,得到具有最高适应度的灰狼α的位置具有次高适应度的灰狼β的位置和适应度第三高的灰狼δ的位置
按照如下公式分别计算所述灰狼α、所述灰狼β和所述灰狼δ距离猎物的距离
D α → = | C 1 → · X α → - X → |
D β → = | C 2 → · X β → - X → |
D δ → = | C 3 → · X δ → - X → |
其中,通过公式计算得到,为[0,1]之间的随机数;
按照如下公式完成对灰狼位置矩阵的更新:
X → = X 1 → + X 2 → + X 3 → 3
X 1 → = X α → - A 1 → · ( D α → )
X 2 → = X β → - A 2 → · ( D β → )
X 3 → = X δ → - A 3 → · ( D δ → )
其中,通过公式计算得到,t为当前迭代次数,t∈[1,T],为[0,1]之间的随机数;
如果所述当前迭代次数t尚未达到所述最大迭代次数T,则根据更新后的灰狼位置矩阵继续进行灰狼优化迭代,直到所述当前迭代次数t达到所述最大迭代次数T为止;
输出灰狼α的位置Xα=(xα1,xα2),其中xα1为优化后的惩罚系数C,xα2为优化后的核宽γ。
10.根据权利要求6所述的基于核极限学习机的风险预测的装置,其特征在于,所述模型构建模块包括:
预测模型构建子模块,用于基于所述优化后的惩罚系数C和所述优化后的核宽γ,按照如下公式构建所述核极限学习机的预测模型:
f ( s ) = K ( s , s 1 ) . . . K ( s , s N ) ( 1 C + Ω E L M ) - 1 T
K(s,sn)=exp(-γ||s-sn||2)
其中,s为待测试样本,s1,…,sN为训练样本,N为预置的训练样本数,n∈[1,N],ΩELM为预置的符合Mercer定理构造的核矩阵。
CN201610326839.3A 2016-05-17 2016-05-17 一种基于核极限学习机的风险预测的方法和装置 Pending CN106022517A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610326839.3A CN106022517A (zh) 2016-05-17 2016-05-17 一种基于核极限学习机的风险预测的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610326839.3A CN106022517A (zh) 2016-05-17 2016-05-17 一种基于核极限学习机的风险预测的方法和装置

Publications (1)

Publication Number Publication Date
CN106022517A true CN106022517A (zh) 2016-10-12

Family

ID=57098183

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610326839.3A Pending CN106022517A (zh) 2016-05-17 2016-05-17 一种基于核极限学习机的风险预测的方法和装置

Country Status (1)

Country Link
CN (1) CN106022517A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107908688A (zh) * 2017-10-31 2018-04-13 温州大学 一种基于改进灰狼优化算法的数据分类预测方法及***
CN108229536A (zh) * 2017-12-01 2018-06-29 温州大学 分类预测模型的优化方法、装置及终端设备
CN108491923A (zh) * 2018-04-10 2018-09-04 吉林大学 基于改进狼群算法优化贝叶斯网络的害虫图像识别方法
CN108805253A (zh) * 2017-04-28 2018-11-13 普天信息技术有限公司 一种pm2.5浓度预测方法
CN109242141A (zh) * 2018-07-24 2019-01-18 杭州汇数智通科技有限公司 一种商品库存数量的预测方法及装置
CN110132596A (zh) * 2019-04-24 2019-08-16 昆明理工大学 一种基于小波包和gwo-svm的滚动轴承故障诊断的方法
CN110348708A (zh) * 2019-06-26 2019-10-18 北京理工大学 一种基于极限学习机的地面目标动态威胁评估方法
CN110930237A (zh) * 2019-10-21 2020-03-27 江苏大学 一种基于sagwo算法的中小企业信用预测分类方法
CN111598461A (zh) * 2020-05-19 2020-08-28 北京海致星图科技有限公司 一种基于企业知识图谱实时的风险泛化与传导分析方法
CN117726461A (zh) * 2024-02-07 2024-03-19 湖南招采猫信息技术有限公司 一种用于电子招采辅助的金融风险预测方法及***

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108805253A (zh) * 2017-04-28 2018-11-13 普天信息技术有限公司 一种pm2.5浓度预测方法
CN107908688A (zh) * 2017-10-31 2018-04-13 温州大学 一种基于改进灰狼优化算法的数据分类预测方法及***
CN108229536A (zh) * 2017-12-01 2018-06-29 温州大学 分类预测模型的优化方法、装置及终端设备
CN108491923A (zh) * 2018-04-10 2018-09-04 吉林大学 基于改进狼群算法优化贝叶斯网络的害虫图像识别方法
CN109242141A (zh) * 2018-07-24 2019-01-18 杭州汇数智通科技有限公司 一种商品库存数量的预测方法及装置
CN109242141B (zh) * 2018-07-24 2020-12-25 杭州汇数智通科技有限公司 一种商品库存数量的预测方法及装置
CN110132596A (zh) * 2019-04-24 2019-08-16 昆明理工大学 一种基于小波包和gwo-svm的滚动轴承故障诊断的方法
CN110348708A (zh) * 2019-06-26 2019-10-18 北京理工大学 一种基于极限学习机的地面目标动态威胁评估方法
CN110930237A (zh) * 2019-10-21 2020-03-27 江苏大学 一种基于sagwo算法的中小企业信用预测分类方法
CN111598461A (zh) * 2020-05-19 2020-08-28 北京海致星图科技有限公司 一种基于企业知识图谱实时的风险泛化与传导分析方法
CN111598461B (zh) * 2020-05-19 2022-01-25 北京海致星图科技有限公司 一种基于企业知识图谱实时的风险泛化与传导分析方法
CN117726461A (zh) * 2024-02-07 2024-03-19 湖南招采猫信息技术有限公司 一种用于电子招采辅助的金融风险预测方法及***

Similar Documents

Publication Publication Date Title
CN106022517A (zh) 一种基于核极限学习机的风险预测的方法和装置
Dharma et al. Prediction of Indonesian inflation rate using regression model based on genetic algorithms
Salcedo-Sanz Modern meta-heuristics based on nonlinear physics processes: A review of models and design procedures
Lappas et al. A machine learning approach combining expert knowledge with genetic algorithms in feature selection for credit risk assessment
Jin et al. Data-driven evolutionary optimization
Xu et al. Composite quantile regression neural network with applications
Giannakoglou et al. Aerodynamic shape design using evolutionary algorithms and new gradient-assisted metamodels
Rasmussen Evaluation of Gaussian processes and other methods for non-linear regression
Gülpınar et al. Simulation and optimization approaches to scenario tree generation
Khalili-Damghani et al. A hybrid fuzzy rule-based multi-criteria framework for sustainable project portfolio selection
Yang et al. Multiobjective reservoir operating rules based on cascade reservoir input variable selection method
Celik et al. Evaluating and forecasting banking crises through neural network models: An application for Turkish banking sector
Salazar et al. A simulation model of capital budgeting under uncertainty
Kroetz et al. A two-level kriging-based approach with active learning for solving time-variant risk optimization problems
Roy et al. An inventory model for a deteriorating item with displayed stock dependent demand under fuzzy inflation and time discounting over a random planning horizon
Chen et al. The Oxford handbook of computational economics and finance
Dong et al. ITÖ algorithm with local search for large scale multiple balanced traveling salesmen problem
Meng A hybrid particle swarm optimization algorithm for satisficing data envelopment analysis under fuzzy chance constraints
Xu et al. Deep reinforcement learning for optimal hydropower reservoir operation
Kontou et al. DNN surrogates for turbulence closure in CFD-based shape optimization
Drahokoupil Application of the XGBoost algorithm and Bayesian optimization for the Bitcoin price prediction during the COVID-19 period
Walsh Development and applications of particle swarm optimization for constructing optimal experimental designs
Gao et al. Novel strategies based on a gradient boosting regression tree predictor for dynamic multi-objective optimization
Kyriacou et al. Design of a matrix hydraulic turbine using a metamodel-assisted evolutionary algorithm with PCA-driven evolution operators
Homayounfar et al. A novel solution for stochastic dynamic game of water allocation from a reservoir using collocation method

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20161012