CN111832839A

CN111832839A - 基于充分增量学习的能耗预测方法

Info

Publication number: CN111832839A
Application number: CN202010723405.3A
Authority: CN
Inventors: 刘晶; 于兵; 董瑶; 赵佳; 金玉蓉
Original assignee: Hebei University of Technology
Current assignee: Hebei University of Technology
Priority date: 2020-07-24
Filing date: 2020-07-24
Publication date: 2020-10-27
Anticipated expiration: 2040-07-24
Also published as: CN111832839B

Abstract

本发明公开了一种基于充分增量学习的能耗预测方法，包含以下内容：对能耗数据的多维参数进行整理，提取不同轮毂的型号并用于加权核主成分分析法对样本进行有效特征提取；然后对数据分组后通过在每一轮增量学习的过程中计算并判断相似度值，按照相似度值的不同程度进行多轮增量学习，同时不断动态调整判断阈值、数据样本及权重值；最后使用误差反向传播神经网络进行能耗预测，并使用均方根误差RMSE值对预测结果进行评价。本发明验证了预测方法的有效性，最终得到的RMSE值低至0.000112，相对于其他对比方法效果最优。

Description

基于充分增量学习的能耗预测方法

技术领域

本发明涉及能耗预测技术领域，尤其涉及一种基于充分增量学习的能耗预测方法。

背景技术

能源消耗与环境污染是伴随我国经济持续高速发展的一大严峻考验，其中工业能耗占我国社会总能耗比重近70％，所以在工业领域，提高能源使用效率、降低能源消耗是加快推进工业绿色转型的重点。随着车辆的全民化，车辆配件也越来越被大众所关注，为了满足顾客对车辆配件的个性化定制要求，且轮毂作为车辆配件的重要组成部分在外观上具有装饰性，所以个性化的轮毂也越来越受欢迎。但是在生产轮毂时，对能耗的使用无法得到有效的控制，而能耗数据会影响生产轮毂的成本，所以对轮毂产品的能耗进行研究具有重要意义。

目前在工业领域，对能耗的使用逐渐获得更多的关注。在工业4.0的变革时代，物联网、人工智能、工业互联网等先进技术的融合，工业生产过程中数据采集、数据管理、分析建模等方法的应用，均为能源需求的预测提供了支撑。目前主要采用时间序列预测、神经网络、灰色预测、极限学***均模型相结合的组合预测法，结合自适应噪声和变分模态分解法，采用季节差分自回归滑动平均模型对数据进行建模预测，大大提升了能耗预测的精度。文章[郭久俊.基于LSTM-Adaboost的多晶硅生产的能耗预测[J].计算机应用与软件,2018,35(12):71-75+117.]提出基于LSTM-Adaboost循环神经网络多晶硅生产过程的能耗预测模型，结合PCA算法，使用正则化方法优化LSTM的目标函数并引入Adaboost算法对LSTM模型进行优化得到预测模型，实现了有效的能耗预测。文章[丁飞鸿等.基于遗传优化决策树的建筑能耗短期预测模型[J].计算机工程,2019,45(06):280-289+296.]提出一种遗传优化决策树模型，通过遗传算法优化梯度来提升决策树的子树生成过程，得到了较高的预测精度。文章[高学金等.基于ISOA的LS-SVM地铁站空调***能耗预测模型[J].计算机与现代化,2018(10):36-43.]提出一种从算法搜索步长和搜索方向两个方面进行改进的人群搜索算法对LS-SVM建模过程中的模型参数进行优化的方法，提升了预测的精度和速度。文章[王坤等.基于EMD与果蝇参数寻优的LSSVM的机场能耗预测[J].计算机时代,2017(04):35-40.]提出一种结合经验模式分解和果蝇参数寻优的最小二乘支持向量机的能耗预测方法，提高了预测的精度。

从上述文献可以看出，在进行能耗预测的过程中，虽然使用了降维和增量学习等方法，但是没有充分利用数据本身属性的信息，且增量学习的过程中只解决了冗余节点的问题，而针对日益增长的数据，选取有效的数据进行高效的能耗预测，是目前急需解决的问题。所以本发明针对降维过程中对标签的使用进行了改进，将轮毂的不同型号这一属性作为标签在权重中使用，以此实现数据信息的高效利用；在增量学习过程中，一方面在实现提高有效数据权重的同时，另一方面减少低效数据的权重，而一次筛选完毕对数据的利用并不充分，所以通过循环进行多层筛选增量学习，最终留下所有有效数据，最终实现更精准的能耗预测。

发明内容

本发明的目的在于：

本发明提供一种基于充分增量学习的能耗预测方法，结合轮毂的型号并使用加权核主成分分析法对样本进行有效特征提取，然后通过计算并判断相似度值，按照相似度值的不同程度进行多轮增量学习，并不断动态调整判断阈值，最后使用误差反向传播模型进行能耗预测。该方法与原始方法相比，通过对数据的特征提取，最大限度的保留了有效信息，通过多轮增量学习，有效解决了能耗数据之间包含的重要程度关系，实现了对能耗数据的动态调整，达到了高效利用数据信息的效果，最终实现了准确的能耗预测。

本发明所采取的技术方案为：

一种基于充分增量学习的能耗预测方法，包括下述步骤：

(1)对能耗数据的多维参数进行整理，并提取出不同轮毂的型号；

(2)对整理好的能耗数据采用加权核主成分分析法进行降维；

(3)将降维后的数据划分为训练数据和测试数据，对训练数据进行分组后赋予初始权重值；

(4)对第一组训练样本及权重值进行增量学***均相似度值；

(5)将剩余数据不断输入到增量学习的模型中，通过分别与第一组训练数据比较判断相似度值进行不同操作；

(6)当样本之间的相似度大于平均相似度值时，增大现有样本权重值；当样本之间的相似度值小于平均相似度值时，减小现有样本的权重值，并统一存在一起用于下一轮的增量学习，通过多轮增量学习实现充分的增量学习；

(7)在进行上述操作的过程中，每一轮增量学习的阈值参数、数据样本及权重值都会随着数据的不同进行调整；

(8)当某次用于增量学***均相似度值小于初始平均相似度值的1/2时，增量学习结束，此时，删除所有权重值小于初始权重值1/2的数据；

(9)将得到的数据输入到误差反向传播模型中进行能耗预测；

(10)采用评价指标RMSE值对能耗预测结果进行评价。

其中，步骤(2)中的加权核主成分分析法的权重是以不同轮毂的型号作为样本的标签，加工为权值进行计算的，通过将标签的信息值融合在核矩阵中构造加权核矩阵，加权核矩阵中数据对应的权值为

其中u_i表示第i个样本对应的权值向量。

步骤(5)中，将欧式距离用于计算多维数据的相似度值，相似度值计算公式如下：

其中dist(x,y)表示新增特征x和现有特征y两个不同故障特征的欧氏距离(现有特征包含初始特征和完成新增操作的新增特征)，即

其中，x_i和y_i代表新增特征x的第i个值和现有特征y的第i个值，x和y之间的差异性越小，欧式距离越小，则相似度值越大，以此衡量新增特征与现有特征之间的相似度。

步骤(6)中充分增量学习的过程包括下述步骤：

在整个充分增量学***均相似度值，然后将其余新增数据分别与第一组数据计算相似度值，当大于已有平均相似度值时，增大现有样本的权重值；当小于已有平均相似度值时，减小现有样本的权重值并将所有数据存到一起，用于进行下一轮的增量学***均相似度值，然后将其余新增数据分别与第一组数据计算相似度值，当大于该平均相似度值时，增大现有样本的权重值；当小于该平均相似度值时，减小现有样本的权重值并将所有数据存到一起，用于进行下一轮的增量学***均相似度值小于初始平均相似度值的1/2时，增量学习结束，此时，删除所有权重值小于初始权重值1/2的数据，完成充分增量学习的全过程。

为了解决轮毂在生产过程中的能耗问题，本专利提出一种基于充分增量学习的能耗预测方法，使用加权核主成分分析法对样本进行有效特征提取，然后通过计算并判断相似度值，按照相似度值的不同条件采用充分增量学习对初始数据样本和新增数据样本的权重进行动态调整，最后使用误差反向传播模型对能耗进行预测，实现高效的增量学习和准确的能耗预测。

一、本发明方法的理论依据：

1、加权核主成分分析法：核主成分分析法虽然可以处理非线性问题，但是忽略了数据标签中的信息，所以本发明采用加权核主成分分析法(WKPCA)对能耗数据进行降维，尽可能多的保留有效信息，进而提高能耗预测的效率并减小能耗预测值的误差。

2、充分增量学***均相似度值，然后将其余新增数据分别与第一组数据计算相似度值，当大于已有平均相似度值时，增大现有样本的权重值；当小于已有平均相似度值时，减小现有样本的权重值并将所有数据存到一起，用于进行下一轮的增量学***均相似度值，然后将其余新增数据分别与第一组数据计算相似度值，当大于该平均相似度值时，增大现有样本的权重值；当小于该平均相似度值时，减小现有样本的权重值并将所有数据存到一起，用于进行下一轮的增量学***均相似度值小于初始平均相似度值的1/2时，增量学习结束，此时，删除所有权重值小于初始权重值1/2的数据，完成充分增量学习的全过程。

3、BP神经网络(BPNN)：使用误差反向传播算法模型通过对数据的训练，实现对能耗的准确预测。

二、基于充分增量学习的能耗预测方法设计：

基于充分增量学习的能耗预测方法工作原理如下：对将多维参数进行整理后的数据采用加权核主成分分析法进行特征提取，使数据变得更加高效，同时提高数据处理的效率；将提取的特征进行多轮增量学习，在保留原始数据信息的基础上不断学习新的知识，实现充分的增量学习，在增量学习的过程中不断动态调整判断阈值、数据样本以及权重值；最终将训练得到的数据输入到误差反向传播算法中对能耗进行准确预测，方法的操作如图1所示。

1、基于充分增量学习的能耗预测方法结构

本发明中加权核主成分分析法通过特征提取以减少数据样本的维度，进而提高数据处理的效率。将得到的数据进行多轮增量学习，通过计算相似度值动态调整判断阈值、数据样本以及权重值，将得到的包含信息量最多的数据输入到误差反向传播算法中进行能耗预测。

2、算法具体实现

基于充分增量学习的能耗预测方法步骤描述如下，流程图如图2所示。

(2)对整理好的能耗数据采用加权核主成分分析法进行降维；

(4)对第一组训练样本及权重值进行增量学***均相似度值；

(9)将得到的数据输入到BPNN中进行能耗预测；

(10)采用评价指标均方误差根RMSE值对能耗预测结果进行评价。

采用上述技术方案所产生的有益效果在于：

本发明提出了基于充分增量学习的能耗预测方法，对能耗数据特征提取、增量学习及能耗预测三个过程进行处理。该模型先使用加权核主成分分析法保留了带有标签信息的有效数据样本，然后通过计算相似度值并依据判断条件对数据进行多轮增量学习后进行能耗的预测，从而实现了高效的增量学习和准确的能耗预测。通过实验分析，将加权核主成分分析法、充分增量学习与误差反向传播模型结合在一起，能耗预测的RMSE值为0.000112，同时通过实验对比可知本发明的方法优于长短期记忆网络(LSTM)、支持向量回归机(SVR)，原始误差反向传播模型(BP)，能够实现准确的能耗预测。

附图说明

图1是本发明基于充分增量学习的能耗预测方法结构图；

图2是本发明基于充分增量学习的能耗预测方法流程图；

图3是本发明方法中BP算法的中间层输出维数为7时的训练数据集RMSE值和测试数据集RMSE值；

图4是本发明方法中BP算法的中间层输出维数为4时的训练数据集RMSE值和测试数据集RMSE值；

图5是本发明方法中迭代次数选取3000时的训练数据集RMSE值和测试数据集RMSE值；

具体实施方式

为更好的理解本发明的技术方案，下面结合附图和实施例，对本发明的具体实施方式作进一步详细描述。

本发明实施例中，一种基于充分增量学习的能耗预测方法，包括下述步骤：

(1)以预测轮毂单品耗电量为例，选取20种轮毂型号进行实验，由于可用数据量较少，故用Python仿真了部分数据，共得到2015年1月到2018年12月份的相关数据，对所有能耗数据的多维参数进行整理，并提取出不同轮毂的型号；

(2)对整理好的能耗数据采用加权核主成分分析法进行降维；

核主成分分析法虽然可以处理非线性问题，但是忽略了数据标签中的信息，所以本发明采用加权核主成分分析法(WKPCA)对能耗数据进行降维，尽可能多的保留有效信息，进而减小预测值的误差。假定一个高维数据集X＝[x₁,…,x_i,…,x_N]，x_i表示数据集X的第i个样本，N表示样本数，c表示样本类别。设样本的权值向量为[u₁,…,u_i,…,u_N]，其中u_i表示第i个样本x_i对应的权值向量。设样本的标签信息值为{l₁,…,l_j,…,l_c}，其中l_j表示第j个标签信息值。样本x_i的权值由类别信息确定，即样本x_i属于第j类时，

u_i＝l_j

其中，i＝1,2,…,N，j＝1,2,…,c。由于采用的是高斯核函数，所以核函数

其中，K(x_i,x_j)表示i行j列的核矩阵，σ表示函数的宽度参数，控制了函数的径向作用范围。根据样本的权值信息构造一个加权核矩阵

其中，K_w(x_i,x_j)表示i行j列的加权核矩阵，w_ij为权值矩阵中的第i行第j列的权值，且

以此构造权值矩阵W＝{w_ij}。

所以得到K_w(x_i,x_j)如下：

根据上式可知，当u_i＝u_j时，样本x_i与样本x_j属于同一型号，w_ij＝1，此时加权核矩阵就是原始核矩阵K(x_i,x_j)；当u_i≠u_j时，样本x_i与样本x_j属于不同型号，此时w_ij是一个大于0的正数，并且样本间的类别信息被引入到加权核矩阵K_w(x_i,x_j)中。

运用Jacobi方法计算K_w的特征值λ₁,…,λ_i,…,λ_N和特征向量α₁,…,α_i,…,α_N，其中λ_i表示第i个特征值，α_i表示第i个特征向量，i＝1,2,…,N；其次将特征值λ_i进行降序排列，并调整与其对应的特征向量α_i；然后利用Gram-Schmidt正交法单位正交化特征向量，得到正交特征向量β_i，其中β_i表示第i个正交特征向量。对上述得到的特征值计算其累计贡献率B₁,…,B_i,…,B_n，其中B_i表示第i个累积贡献率，i＝1,2,…,n，根据给定的贡献率值p，如果B_t≥p，则提取t个主成分β₁,…,β_i,…,β_t，最后计算已标准化的样本X在提取出的特征向量上的投影Y，由Y＝K_w(i,j)·β得到，其中β＝(β₁,…,β_i,…,β_t)，所得投影Y即为从原始数据中使用WKPCA特征提取后得到的数据。

(4)对第一组训练样本及权重值进行增量学***均相似度值；

计算新增特征与现有特征之间的相似度值时，采用欧式距离计算多维数据的相似度值Sim(x,y)

其中dist(x,y)表示新增特征x和现有特征y之间的欧式距离

(6)当样本之间的相似度大于平均相似度值时，增大该样本权重值；当样本之间的相似度值小于平均相似度值时，减小对应样本的权重值，并统一存在一起用于下一轮的增量学习，通过多轮增量学习实现充分的增量学习；

使用步骤(5)中的公式计算新增特征与现有特征的相似度，选取最大值Sim(x,y)作为该特征的相似度值，并根据以下原则判定如何处理特征的权重：

使用a_i代表第i轮增量学***均值：

(1)若a_i＜Sim(x,y)，则表示新增特征与现有特征高度相似，所以增大现有特征的权重值。

(2)若Sim(x,y)＜a_i，则表示新增特征与现有特征的相似度低于平均相似度值，代表该新增特征与现有特征的相似度不够高，故将满足该条件的数据存放到一起并相应的减小对应现有特征的权重值，然后进行下一轮的增量学习。

根据新增特征增量原则来计算特征的动态权重，用以衡量该特征随时间变化的重要性改变程度。由于新增特征与现有特征的相似度能够在一定程度上反映该新增特征对当前模型的重要性，所以对相似度值使用下式归一化处理，并计算其动态权重。

其中，Sim(x,y)_norm表示归一化处理后的新增特征x与现有特征y的相似度值，minSim(x,y)表示新增特征x和现有特征y之间相似度的最小值，maxSim(x,y)表示新增特征x和现有特征y之间相似度的最大值。

对满足原则(1)中条件的特征，由于其具有较高的相似度值，所以增加其权重以增强并记住有效特征。其动态权重计算方法如下。

W_i+1＝W_i+Sim(x,y)_norm

其中，W_i+1表示第i+1次提高现有特征y的权重值，W_i表示第i次提高现有特征y的权重值，将W_i与新增特征x和现有特征y的相似度值相加得到W_i+1，初次合并时i＝0，W₀为初始权重值。

对满足原则(2)中条件的特征，说明其相似度较低，所以减小其权重值，待第一轮增量学习完毕后，用于第二轮增量学习，计算方法如下。

W_i+1＝W_i-Sim(x,y)_norm

其中，W_i+1表示第i+1次减少现有特征y的权重值，W_i表示第i次减少现有特征y的权重值，将W_i与新增特征x和现有特征y的相似度值做差得到W_i+1，新增特征x的权重值初次减少时i＝0，W₀为初始权重值。

(9)将得到的数据输入到BPNN中进行能耗预测；

基于充分增量学习的能耗预测方法的试验验证：

1、数据描述

实验数据来源于某轮毂制造公司的轮毂特征参数和能耗数据，该公司在各生产线中均安装了智能仪器，用来获得生产过程中所消耗的电能、水以及天然气。本次实验以预测轮毂单品耗电量为例，选取20种轮毂型号进行实验，由于可用数据量较少，故用Python仿真了部分数据，共得到2015年1月到2018年12月份的相关数据。如下表1所示：

表1特征参数描述

2、实验过程

针对20种轮毂型号的能耗数据，首先将其参数“单品型号”提取出来作为数据的标签，然后使用加权核主成分分析法对剩下的10种参数进行降维，提取出最重要的参数。在进行降维的过程中，首先对所有的能耗数据进行标准化处理，排除因计量单位不同而导致的差异；然后将结合标签的能耗数据输入到降维模型中，计算出加权核矩阵、特征值和特征向量，并将特征向量单位化；累计贡献率设置为0.85，根据累计贡献率的值最终将特征降至二维。

接下来对降维后的数据进行充分增量学***均相似度值α，然后计算新增数据与第一组数据之间的相似度值，当相似度值大于已有平均相似度值时，增大现有样本的权重值；当相似度值小于已有平均相似度值时，减小现有样本的权重值并将所有数据存到一起，用于进行下一轮的增量学***均相似度值α，然后计算其余新增数据与第一组数据之间的相似度值，当相似度值大于该平均相似度值时，增大现有样本的权重值；当相似度值小于该平均相似度值时，减小现有样本的权重值并将所有数据存到一起，用于进行下一轮的增量学***均相似度值小于初始平均相似度值的1/2时，增量学***均相似度值α、所有能耗数据及对应的权重值是不断动态调整。通过充分增量学习的训练，最终得到的数据分布如表2所示：

表2数据分布情况

然后将表2中通过充分增量学习得到的712个数据输入到误差反向传播模型(BP)中进行能耗预测。在进行能耗预测实验之前，需要通过实验选取中间层输出维数和迭代次数。首先对中间层的输出维数进行选取，我们采用均方根误差RMSE来衡量能耗预测的结果。所有的RMSE值和运行时间如表3所示。

表3 RMSE值和运行时间

从表3可知，当中间层输出维数为7时，RMSE值最小，为0.000431。相应的训练RMSE和测试RMSE值如图3所示。对比中间层输出维数为4时的RMSE值如图4所示。

中间层维数确定为7后，可以得到最小的RMSE值，接下来选取迭代次数。将迭代次数设置为3000，得到的结果如表4所示。可以看到RMSE值在测试样本上的差异非常小，通过对比不同迭代次数的RMSE值和运行时间，当迭代次数为1800次时，RMSE值最小，为0.000112，此时的运行时间为691.28秒。其中，当迭代次数为3000次时，训练数据和测试数据的RMSE值如图5所示。所以最终选取的中间层输出维数和迭代次数分别为7和1800。

表4 RMSE值和运行时间

将经过降维和充分增量学习的数据输入到LSTM模型和SVR模型中进行能耗预测，得到的RMSE值和运行时间如表5所示。

表5 RMSE值和运行时间

从表5可知，在改进的方法中，BP算法的RMSE值最小，比LSTM的RMSE值小0.07856，比SVR的RMSE值小0.240259。虽然运行时间不是最短的，但是相比LSTM预测方法来说大大的减少了训练时间，说明使用BP算法结合降维和充分增量学习进行能耗预测，效果最好。将BP算法结合降维和充分增量学习进行能耗预测的结果与使用原始BP、原始LSTM以及原始SVR方法进行能耗预测的结果相比，如表5所示，可以看到本发明所提方法的RMSE值远远小于使用原始方法进行能耗预测的RMSE值，其中本发明所使用的方法比原始BP的RMSE值小0.018945，比原始LSTM的RMSE值小2.491674，比原始SVR的RMSE值小1.047864，所以本发明使用的降维和充分增量学习的方法实现了对数据的高效利用。但是从运行时间来看，由于进行了充分的增量学习，所以相比原始BP方法进行能耗预测，所使用的时间较长，但整体来看，运行时间适中，因此，本发明所提的加权核主成分分析法和充分增量学习与BP算法的结合对能耗预测是有效的，满足数据不断更新的能耗预测的需求。

3、结论

为了避免轮毂在生产时对能耗的浪费，本发明将降维、增量学习和能耗预测的方法相结合，首先通过加权核主成分分析法在充分利用型号信息的同时，对其他参数进行降维，然后通过计算相似度值并判断进行循环多次的增量学习，最后使用BP算法对能耗进行预测，并使用RMSE作为评价指标进行评价，从而实现了高效的增量学习和准确的能耗预测。由实验结果分析可知，通过充分增量学习可以让数据更加高效地使用，同时与加权核主成分分析法以及BP算法相结合，能耗预测的RMSE值为0.000112，分别比结合加权核主成分分析法和充分增量学习的LSTM算法、结合加权核主成分分析法和充分增量学习的SVR算法、直接使用原始BP算法、直接使用LSTM算法以及直接使用SVR算法分别小0.07856、0.240259、0.018945、2.491674、1.047864。所以本发明的方法能够实现对轮毂准确的能耗预测。

Claims

1.一种基于充分增量学习的能耗预测方法，其特征在于，包括下述步骤：

(2)对整理好的能耗数据采用加权核主成分分析法进行降维；

(4)对第一组训练样本及权重值进行增量学***均相似度值；

(9)将得到的数据输入到BP神经网络中进行能耗预测；

(10)采用评价指标均方误差根(RMSE：root mean square error)对能耗预测结果进行评价。

2.根据权利要求1所述的基于充分增量学习的能耗预测方法，其特征在于：所述步骤(2)中，加权核主成分分析法的权重是以不同轮毂的型号作为标签用于权值进行计算的，通过将标签的信息值融合在核矩阵中构造加权核矩阵，加权核矩阵中数据对应的权值为

其中u_i表示第i个样本对应的权值向量。

3.根据权利要求1所述的基于充分增量学习的能耗预测方法，其特征在于：所述步骤(5)中，将欧式距离用于计算多维数据的相似度值，相似度值计算公式如下：

其中dist(x,y)表示新增特征x和现有特征y两个不同故障特征的欧氏距离，即

4.根据权利要求1所述的基于充分增量学习的能耗预测方法，其特征在于：所述步骤(6)中充分增量学习的过程包括下述步骤：

首先赋予全部数据初始权重值，其次计算第一组数据之间的相似度值，计算得到平均相似度值，然后将其余新增数据分别与第一组数据计算相似度值，当大于已有平均相似度值时，增大现有样本的权重值；当小于已有平均相似度值时，减小现有样本的权重值并将所有数据存到一起，用于进行下一轮的增量学***均相似度值，然后将其余新增数据分别与第一组数据计算相似度值，当大于该平均相似度值时，增大现有样本的权重值；当小于该平均相似度值时，减小现有样本的权重值并将所有数据存到一起，用于进行下一轮的增量学***均相似度值小于初始平均相似度值的1/2时，增量学习结束，此时，删除所有权重值小于初始权重值1/2的数据，完成充分增量学习的全过程。