CN111832839A - 基于充分增量学习的能耗预测方法 - Google Patents
基于充分增量学习的能耗预测方法 Download PDFInfo
- Publication number
- CN111832839A CN111832839A CN202010723405.3A CN202010723405A CN111832839A CN 111832839 A CN111832839 A CN 111832839A CN 202010723405 A CN202010723405 A CN 202010723405A CN 111832839 A CN111832839 A CN 111832839A
- Authority
- CN
- China
- Prior art keywords
- data
- value
- incremental learning
- energy consumption
- similarity value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000005265 energy consumption Methods 0.000 title claims abstract description 109
- 238000000034 method Methods 0.000 title claims abstract description 80
- 230000008569 process Effects 0.000 claims abstract description 24
- 238000012847 principal component analysis method Methods 0.000 claims abstract description 22
- 238000013528 artificial neural network Methods 0.000 claims abstract description 6
- 238000012549 training Methods 0.000 claims description 35
- 230000009467 reduction Effects 0.000 claims description 17
- 239000011159 matrix material Substances 0.000 claims description 15
- 238000012360 testing method Methods 0.000 claims description 11
- 239000013598 vector Substances 0.000 claims description 11
- 238000011156 evaluation Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 abstract description 5
- 230000000694 effects Effects 0.000 abstract description 3
- 238000004422 calculation algorithm Methods 0.000 description 23
- 238000004519 manufacturing process Methods 0.000 description 8
- 238000002474 experimental method Methods 0.000 description 6
- 238000005457 optimization Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000000354 decomposition reaction Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000001186 cumulative effect Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000004883 computer application Methods 0.000 description 3
- 238000003066 decision tree Methods 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 241000283153 Cetacea Species 0.000 description 2
- 241000255588 Tephritidae Species 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 2
- 229910021420 polycrystalline silicon Inorganic materials 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000010845 search algorithm Methods 0.000 description 2
- 230000001932 seasonal effect Effects 0.000 description 2
- 241000728173 Sarima Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004378 air conditioning Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003912 environmental pollution Methods 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012843 least square support vector machine Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000003345 natural gas Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/80—Management or planning
- Y02P90/82—Energy audits or management systems therefor
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Entrepreneurship & Innovation (AREA)
- Software Systems (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Mathematical Physics (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Molecular Biology (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于充分增量学习的能耗预测方法,包含以下内容:对能耗数据的多维参数进行整理,提取不同轮毂的型号并用于加权核主成分分析法对样本进行有效特征提取;然后对数据分组后通过在每一轮增量学习的过程中计算并判断相似度值,按照相似度值的不同程度进行多轮增量学习,同时不断动态调整判断阈值、数据样本及权重值;最后使用误差反向传播神经网络进行能耗预测,并使用均方根误差RMSE值对预测结果进行评价。本发明验证了预测方法的有效性,最终得到的RMSE值低至0.000112,相对于其他对比方法效果最优。
Description
技术领域
本发明涉及能耗预测技术领域,尤其涉及一种基于充分增量学习的能耗预测方法。
背景技术
能源消耗与环境污染是伴随我国经济持续高速发展的一大严峻考验,其中工业能耗占我国社会总能耗比重近70%,所以在工业领域,提高能源使用效率、降低能源消耗是加快推进工业绿色转型的重点。随着车辆的全民化,车辆配件也越来越被大众所关注,为了满足顾客对车辆配件的个性化定制要求,且轮毂作为车辆配件的重要组成部分在外观上具有装饰性,所以个性化的轮毂也越来越受欢迎。但是在生产轮毂时,对能耗的使用无法得到有效的控制,而能耗数据会影响生产轮毂的成本,所以对轮毂产品的能耗进行研究具有重要意义。
目前在工业领域,对能耗的使用逐渐获得更多的关注。在工业4.0的变革时代,物联网、人工智能、工业互联网等先进技术的融合,工业生产过程中数据采集、数据管理、分析建模等方法的应用,均为能源需求的预测提供了支撑。目前主要采用时间序列预测、神经网络、灰色预测、极限学***均模型相结合的组合预测法,结合自适应噪声和变分模态分解法,采用季节差分自回归滑动平均模型对数据进行建模预测,大大提升了能耗预测的精度。文章[郭久俊.基于LSTM-Adaboost的多晶硅生产的能耗预测[J].计算机应用与软件,2018,35(12):71-75+117.]提出基于LSTM-Adaboost循环神经网络多晶硅生产过程的能耗预测模型,结合PCA算法,使用正则化方法优化LSTM的目标函数并引入Adaboost算法对LSTM模型进行优化得到预测模型,实现了有效的能耗预测。文章[丁飞鸿等.基于遗传优化决策树的建筑能耗短期预测模型[J].计算机工程,2019,45(06):280-289+296.]提出一种遗传优化决策树模型,通过遗传算法优化梯度来提升决策树的子树生成过程,得到了较高的预测精度。文章[高学金等.基于ISOA的LS-SVM地铁站空调***能耗预测模型[J].计算机与现代化,2018(10):36-43.]提出一种从算法搜索步长和搜索方向两个方面进行改进的人群搜索算法对LS-SVM建模过程中的模型参数进行优化的方法,提升了预测的精度和速度。文章[王坤等.基于EMD与果蝇参数寻优的LSSVM的机场能耗预测[J].计算机时代,2017(04):35-40.]提出一种结合经验模式分解和果蝇参数寻优的最小二乘支持向量机的能耗预测方法,提高了预测的精度。
从上述文献可以看出,在进行能耗预测的过程中,虽然使用了降维和增量学习等方法,但是没有充分利用数据本身属性的信息,且增量学习的过程中只解决了冗余节点的问题,而针对日益增长的数据,选取有效的数据进行高效的能耗预测,是目前急需解决的问题。所以本发明针对降维过程中对标签的使用进行了改进,将轮毂的不同型号这一属性作为标签在权重中使用,以此实现数据信息的高效利用;在增量学习过程中,一方面在实现提高有效数据权重的同时,另一方面减少低效数据的权重,而一次筛选完毕对数据的利用并不充分,所以通过循环进行多层筛选增量学习,最终留下所有有效数据,最终实现更精准的能耗预测。
发明内容
本发明的目的在于:
本发明提供一种基于充分增量学习的能耗预测方法,结合轮毂的型号并使用加权核主成分分析法对样本进行有效特征提取,然后通过计算并判断相似度值,按照相似度值的不同程度进行多轮增量学习,并不断动态调整判断阈值,最后使用误差反向传播模型进行能耗预测。该方法与原始方法相比,通过对数据的特征提取,最大限度的保留了有效信息,通过多轮增量学习,有效解决了能耗数据之间包含的重要程度关系,实现了对能耗数据的动态调整,达到了高效利用数据信息的效果,最终实现了准确的能耗预测。
本发明所采取的技术方案为:
一种基于充分增量学习的能耗预测方法,包括下述步骤:
(1)对能耗数据的多维参数进行整理,并提取出不同轮毂的型号;
(2)对整理好的能耗数据采用加权核主成分分析法进行降维;
(3)将降维后的数据划分为训练数据和测试数据,对训练数据进行分组后赋予初始权重值;
(4)对第一组训练样本及权重值进行增量学***均相似度值;
(5)将剩余数据不断输入到增量学习的模型中,通过分别与第一组训练数据比较判断相似度值进行不同操作;
(6)当样本之间的相似度大于平均相似度值时,增大现有样本权重值;当样本之间的相似度值小于平均相似度值时,减小现有样本的权重值,并统一存在一起用于下一轮的增量学习,通过多轮增量学习实现充分的增量学习;
(7)在进行上述操作的过程中,每一轮增量学习的阈值参数、数据样本及权重值都会随着数据的不同进行调整;
(8)当某次用于增量学***均相似度值小于初始平均相似度值的1/2时,增量学习结束,此时,删除所有权重值小于初始权重值1/2的数据;
(9)将得到的数据输入到误差反向传播模型中进行能耗预测;
(10)采用评价指标RMSE值对能耗预测结果进行评价。
其中,步骤(2)中的加权核主成分分析法的权重是以不同轮毂的型号作为样本的标签,加工为权值进行计算的,通过将标签的信息值融合在核矩阵中构造加权核矩阵,加权核矩阵中数据对应的权值为其中ui表示第i个样本对应的权值向量。
步骤(5)中,将欧式距离用于计算多维数据的相似度值,相似度值计算公式如下:
其中dist(x,y)表示新增特征x和现有特征y两个不同故障特征的欧氏距离(现有特征包含初始特征和完成新增操作的新增特征),即
其中,xi和yi代表新增特征x的第i个值和现有特征y的第i个值,x和y之间的差异性越小,欧式距离越小,则相似度值越大,以此衡量新增特征与现有特征之间的相似度。
步骤(6)中充分增量学习的过程包括下述步骤:
在整个充分增量学***均相似度值,然后将其余新增数据分别与第一组数据计算相似度值,当大于已有平均相似度值时,增大现有样本的权重值;当小于已有平均相似度值时,减小现有样本的权重值并将所有数据存到一起,用于进行下一轮的增量学***均相似度值,然后将其余新增数据分别与第一组数据计算相似度值,当大于该平均相似度值时,增大现有样本的权重值;当小于该平均相似度值时,减小现有样本的权重值并将所有数据存到一起,用于进行下一轮的增量学***均相似度值小于初始平均相似度值的1/2时,增量学习结束,此时,删除所有权重值小于初始权重值1/2的数据,完成充分增量学习的全过程。
为了解决轮毂在生产过程中的能耗问题,本专利提出一种基于充分增量学习的能耗预测方法,使用加权核主成分分析法对样本进行有效特征提取,然后通过计算并判断相似度值,按照相似度值的不同条件采用充分增量学习对初始数据样本和新增数据样本的权重进行动态调整,最后使用误差反向传播模型对能耗进行预测,实现高效的增量学习和准确的能耗预测。
一、本发明方法的理论依据:
1、加权核主成分分析法:核主成分分析法虽然可以处理非线性问题,但是忽略了数据标签中的信息,所以本发明采用加权核主成分分析法(WKPCA)对能耗数据进行降维,尽可能多的保留有效信息,进而提高能耗预测的效率并减小能耗预测值的误差。
2、充分增量学***均相似度值,然后将其余新增数据分别与第一组数据计算相似度值,当大于已有平均相似度值时,增大现有样本的权重值;当小于已有平均相似度值时,减小现有样本的权重值并将所有数据存到一起,用于进行下一轮的增量学***均相似度值,然后将其余新增数据分别与第一组数据计算相似度值,当大于该平均相似度值时,增大现有样本的权重值;当小于该平均相似度值时,减小现有样本的权重值并将所有数据存到一起,用于进行下一轮的增量学***均相似度值小于初始平均相似度值的1/2时,增量学习结束,此时,删除所有权重值小于初始权重值1/2的数据,完成充分增量学习的全过程。
3、BP神经网络(BPNN):使用误差反向传播算法模型通过对数据的训练,实现对能耗的准确预测。
二、基于充分增量学习的能耗预测方法设计:
基于充分增量学习的能耗预测方法工作原理如下:对将多维参数进行整理后的数据采用加权核主成分分析法进行特征提取,使数据变得更加高效,同时提高数据处理的效率;将提取的特征进行多轮增量学习,在保留原始数据信息的基础上不断学习新的知识,实现充分的增量学习,在增量学习的过程中不断动态调整判断阈值、数据样本以及权重值;最终将训练得到的数据输入到误差反向传播算法中对能耗进行准确预测,方法的操作如图1所示。
1、基于充分增量学习的能耗预测方法结构
本发明中加权核主成分分析法通过特征提取以减少数据样本的维度,进而提高数据处理的效率。将得到的数据进行多轮增量学习,通过计算相似度值动态调整判断阈值、数据样本以及权重值,将得到的包含信息量最多的数据输入到误差反向传播算法中进行能耗预测。
2、算法具体实现
基于充分增量学习的能耗预测方法步骤描述如下,流程图如图2所示。
(1)对能耗数据的多维参数进行整理,并提取出不同轮毂的型号;
(2)对整理好的能耗数据采用加权核主成分分析法进行降维;
(3)将降维后的数据划分为训练数据和测试数据,对训练数据进行分组后赋予初始权重值;
(4)对第一组训练样本及权重值进行增量学***均相似度值;
(5)将剩余数据不断输入到增量学习的模型中,通过分别与第一组训练数据比较判断相似度值进行不同操作;
(6)当样本之间的相似度大于平均相似度值时,增大现有样本权重值;当样本之间的相似度值小于平均相似度值时,减小现有样本的权重值,并统一存在一起用于下一轮的增量学习,通过多轮增量学习实现充分的增量学习;
(7)在进行上述操作的过程中,每一轮增量学习的阈值参数、数据样本及权重值都会随着数据的不同进行调整;
(8)当某次用于增量学***均相似度值小于初始平均相似度值的1/2时,增量学习结束,此时,删除所有权重值小于初始权重值1/2的数据;
(9)将得到的数据输入到BPNN中进行能耗预测;
(10)采用评价指标均方误差根RMSE值对能耗预测结果进行评价。
采用上述技术方案所产生的有益效果在于:
本发明提出了基于充分增量学习的能耗预测方法,对能耗数据特征提取、增量学习及能耗预测三个过程进行处理。该模型先使用加权核主成分分析法保留了带有标签信息的有效数据样本,然后通过计算相似度值并依据判断条件对数据进行多轮增量学习后进行能耗的预测,从而实现了高效的增量学习和准确的能耗预测。通过实验分析,将加权核主成分分析法、充分增量学习与误差反向传播模型结合在一起,能耗预测的RMSE值为0.000112,同时通过实验对比可知本发明的方法优于长短期记忆网络(LSTM)、支持向量回归机(SVR),原始误差反向传播模型(BP),能够实现准确的能耗预测。
附图说明
图1是本发明基于充分增量学习的能耗预测方法结构图;
图2是本发明基于充分增量学习的能耗预测方法流程图;
图3是本发明方法中BP算法的中间层输出维数为7时的训练数据集RMSE值和测试数据集RMSE值;
图4是本发明方法中BP算法的中间层输出维数为4时的训练数据集RMSE值和测试数据集RMSE值;
图5是本发明方法中迭代次数选取3000时的训练数据集RMSE值和测试数据集RMSE值;
具体实施方式
为更好的理解本发明的技术方案,下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。
本发明实施例中,一种基于充分增量学习的能耗预测方法,包括下述步骤:
(1)以预测轮毂单品耗电量为例,选取20种轮毂型号进行实验,由于可用数据量较少,故用Python仿真了部分数据,共得到2015年1月到2018年12月份的相关数据,对所有能耗数据的多维参数进行整理,并提取出不同轮毂的型号;
(2)对整理好的能耗数据采用加权核主成分分析法进行降维;
核主成分分析法虽然可以处理非线性问题,但是忽略了数据标签中的信息,所以本发明采用加权核主成分分析法(WKPCA)对能耗数据进行降维,尽可能多的保留有效信息,进而减小预测值的误差。假定一个高维数据集X=[x1,…,xi,…,xN],xi表示数据集X的第i个样本,N表示样本数,c表示样本类别。设样本的权值向量为[u1,…,ui,…,uN],其中ui表示第i个样本xi对应的权值向量。设样本的标签信息值为{l1,…,lj,…,lc},其中lj表示第j个标签信息值。样本xi的权值由类别信息确定,即样本xi属于第j类时,
ui=lj
其中,i=1,2,…,N,j=1,2,…,c。由于采用的是高斯核函数,所以核函数
其中,K(xi,xj)表示i行j列的核矩阵,σ表示函数的宽度参数,控制了函数的径向作用范围。根据样本的权值信息构造一个加权核矩阵 其中,Kw(xi,xj)表示i行j列的加权核矩阵,wij为权值矩阵中的第i行第j列的权值,且以此构造权值矩阵W={wij}。
所以得到Kw(xi,xj)如下:
根据上式可知,当ui=uj时,样本xi与样本xj属于同一型号,wij=1,此时加权核矩阵就是原始核矩阵K(xi,xj);当ui≠uj时,样本xi与样本xj属于不同型号,此时wij是一个大于0的正数,并且样本间的类别信息被引入到加权核矩阵Kw(xi,xj)中。
运用Jacobi方法计算Kw的特征值λ1,…,λi,…,λN和特征向量α1,…,αi,…,αN,其中λi表示第i个特征值,αi表示第i个特征向量,i=1,2,…,N;其次将特征值λi进行降序排列,并调整与其对应的特征向量αi;然后利用Gram-Schmidt正交法单位正交化特征向量,得到正交特征向量βi,其中βi表示第i个正交特征向量。对上述得到的特征值计算其累计贡献率B1,…,Bi,…,Bn,其中Bi表示第i个累积贡献率,i=1,2,…,n,根据给定的贡献率值p,如果Bt≥p,则提取t个主成分β1,…,βi,…,βt,最后计算已标准化的样本X在提取出的特征向量上的投影Y,由Y=Kw(i,j)·β得到,其中β=(β1,…,βi,…,βt),所得投影Y即为从原始数据中使用WKPCA特征提取后得到的数据。
(3)将降维后的数据划分为训练数据和测试数据,对训练数据进行分组后赋予初始权重值;
(4)对第一组训练样本及权重值进行增量学***均相似度值;
(5)将剩余数据不断输入到增量学习的模型中,通过分别与第一组训练数据比较判断相似度值进行不同操作;
计算新增特征与现有特征之间的相似度值时,采用欧式距离计算多维数据的相似度值Sim(x,y)
其中dist(x,y)表示新增特征x和现有特征y之间的欧式距离
其中,xi和yi代表新增特征x的第i个值和现有特征y的第i个值,x和y之间的差异性越小,欧式距离越小,则相似度值越大,以此衡量新增特征与现有特征之间的相似度。
(6)当样本之间的相似度大于平均相似度值时,增大该样本权重值;当样本之间的相似度值小于平均相似度值时,减小对应样本的权重值,并统一存在一起用于下一轮的增量学习,通过多轮增量学习实现充分的增量学习;
使用步骤(5)中的公式计算新增特征与现有特征的相似度,选取最大值Sim(x,y)作为该特征的相似度值,并根据以下原则判定如何处理特征的权重:
使用ai代表第i轮增量学***均值:
(1)若ai<Sim(x,y),则表示新增特征与现有特征高度相似,所以增大现有特征的权重值。
(2)若Sim(x,y)<ai,则表示新增特征与现有特征的相似度低于平均相似度值,代表该新增特征与现有特征的相似度不够高,故将满足该条件的数据存放到一起并相应的减小对应现有特征的权重值,然后进行下一轮的增量学习。
根据新增特征增量原则来计算特征的动态权重,用以衡量该特征随时间变化的重要性改变程度。由于新增特征与现有特征的相似度能够在一定程度上反映该新增特征对当前模型的重要性,所以对相似度值使用下式归一化处理,并计算其动态权重。
其中,Sim(x,y)norm表示归一化处理后的新增特征x与现有特征y的相似度值,minSim(x,y)表示新增特征x和现有特征y之间相似度的最小值,maxSim(x,y)表示新增特征x和现有特征y之间相似度的最大值。
对满足原则(1)中条件的特征,由于其具有较高的相似度值,所以增加其权重以增强并记住有效特征。其动态权重计算方法如下。
Wi+1=Wi+Sim(x,y)norm
其中,Wi+1表示第i+1次提高现有特征y的权重值,Wi表示第i次提高现有特征y的权重值,将Wi与新增特征x和现有特征y的相似度值相加得到Wi+1,初次合并时i=0,W0为初始权重值。
对满足原则(2)中条件的特征,说明其相似度较低,所以减小其权重值,待第一轮增量学习完毕后,用于第二轮增量学习,计算方法如下。
Wi+1=Wi-Sim(x,y)norm
其中,Wi+1表示第i+1次减少现有特征y的权重值,Wi表示第i次减少现有特征y的权重值,将Wi与新增特征x和现有特征y的相似度值做差得到Wi+1,新增特征x的权重值初次减少时i=0,W0为初始权重值。
(7)在进行上述操作的过程中,每一轮增量学习的阈值参数、数据样本及权重值都会随着数据的不同进行调整;
(8)当某次用于增量学***均相似度值小于初始平均相似度值的1/2时,增量学习结束,此时,删除所有权重值小于初始权重值1/2的数据;
(9)将得到的数据输入到BPNN中进行能耗预测;
(10)采用评价指标均方误差根RMSE值对能耗预测结果进行评价。
基于充分增量学习的能耗预测方法的试验验证:
1、数据描述
实验数据来源于某轮毂制造公司的轮毂特征参数和能耗数据,该公司在各生产线中均安装了智能仪器,用来获得生产过程中所消耗的电能、水以及天然气。本次实验以预测轮毂单品耗电量为例,选取20种轮毂型号进行实验,由于可用数据量较少,故用Python仿真了部分数据,共得到2015年1月到2018年12月份的相关数据。如下表1所示:
表1特征参数描述
2、实验过程
针对20种轮毂型号的能耗数据,首先将其参数“单品型号”提取出来作为数据的标签,然后使用加权核主成分分析法对剩下的10种参数进行降维,提取出最重要的参数。在进行降维的过程中,首先对所有的能耗数据进行标准化处理,排除因计量单位不同而导致的差异;然后将结合标签的能耗数据输入到降维模型中,计算出加权核矩阵、特征值和特征向量,并将特征向量单位化;累计贡献率设置为0.85,根据累计贡献率的值最终将特征降至二维。
接下来对降维后的数据进行充分增量学***均相似度值α,然后计算新增数据与第一组数据之间的相似度值,当相似度值大于已有平均相似度值时,增大现有样本的权重值;当相似度值小于已有平均相似度值时,减小现有样本的权重值并将所有数据存到一起,用于进行下一轮的增量学***均相似度值α,然后计算其余新增数据与第一组数据之间的相似度值,当相似度值大于该平均相似度值时,增大现有样本的权重值;当相似度值小于该平均相似度值时,减小现有样本的权重值并将所有数据存到一起,用于进行下一轮的增量学***均相似度值小于初始平均相似度值的1/2时,增量学***均相似度值α、所有能耗数据及对应的权重值是不断动态调整。通过充分增量学习的训练,最终得到的数据分布如表2所示:
表2数据分布情况
然后将表2中通过充分增量学习得到的712个数据输入到误差反向传播模型(BP)中进行能耗预测。在进行能耗预测实验之前,需要通过实验选取中间层输出维数和迭代次数。首先对中间层的输出维数进行选取,我们采用均方根误差RMSE来衡量能耗预测的结果。所有的RMSE值和运行时间如表3所示。
表3 RMSE值和运行时间
从表3可知,当中间层输出维数为7时,RMSE值最小,为0.000431。相应的训练RMSE和测试RMSE值如图3所示。对比中间层输出维数为4时的RMSE值如图4所示。
中间层维数确定为7后,可以得到最小的RMSE值,接下来选取迭代次数。将迭代次数设置为3000,得到的结果如表4所示。可以看到RMSE值在测试样本上的差异非常小,通过对比不同迭代次数的RMSE值和运行时间,当迭代次数为1800次时,RMSE值最小,为0.000112,此时的运行时间为691.28秒。其中,当迭代次数为3000次时,训练数据和测试数据的RMSE值如图5所示。所以最终选取的中间层输出维数和迭代次数分别为7和1800。
表4 RMSE值和运行时间
将经过降维和充分增量学习的数据输入到LSTM模型和SVR模型中进行能耗预测,得到的RMSE值和运行时间如表5所示。
表5 RMSE值和运行时间
从表5可知,在改进的方法中,BP算法的RMSE值最小,比LSTM的RMSE值小0.07856,比SVR的RMSE值小0.240259。虽然运行时间不是最短的,但是相比LSTM预测方法来说大大的减少了训练时间,说明使用BP算法结合降维和充分增量学习进行能耗预测,效果最好。将BP算法结合降维和充分增量学习进行能耗预测的结果与使用原始BP、原始LSTM以及原始SVR方法进行能耗预测的结果相比,如表5所示,可以看到本发明所提方法的RMSE值远远小于使用原始方法进行能耗预测的RMSE值,其中本发明所使用的方法比原始BP的RMSE值小0.018945,比原始LSTM的RMSE值小2.491674,比原始SVR的RMSE值小1.047864,所以本发明使用的降维和充分增量学习的方法实现了对数据的高效利用。但是从运行时间来看,由于进行了充分的增量学习,所以相比原始BP方法进行能耗预测,所使用的时间较长,但整体来看,运行时间适中,因此,本发明所提的加权核主成分分析法和充分增量学习与BP算法的结合对能耗预测是有效的,满足数据不断更新的能耗预测的需求。
3、结论
为了避免轮毂在生产时对能耗的浪费,本发明将降维、增量学习和能耗预测的方法相结合,首先通过加权核主成分分析法在充分利用型号信息的同时,对其他参数进行降维,然后通过计算相似度值并判断进行循环多次的增量学习,最后使用BP算法对能耗进行预测,并使用RMSE作为评价指标进行评价,从而实现了高效的增量学习和准确的能耗预测。由实验结果分析可知,通过充分增量学习可以让数据更加高效地使用,同时与加权核主成分分析法以及BP算法相结合,能耗预测的RMSE值为0.000112,分别比结合加权核主成分分析法和充分增量学习的LSTM算法、结合加权核主成分分析法和充分增量学习的SVR算法、直接使用原始BP算法、直接使用LSTM算法以及直接使用SVR算法分别小0.07856、0.240259、0.018945、2.491674、1.047864。所以本发明的方法能够实现对轮毂准确的能耗预测。
Claims (4)
1.一种基于充分增量学习的能耗预测方法,其特征在于,包括下述步骤:
(1)对能耗数据的多维参数进行整理,并提取出不同轮毂的型号;
(2)对整理好的能耗数据采用加权核主成分分析法进行降维;
(3)将降维后的数据划分为训练数据和测试数据,对训练数据进行分组后赋予初始权重值;
(4)对第一组训练样本及权重值进行增量学***均相似度值;
(5)将剩余数据不断输入到增量学习的模型中,通过分别与第一组训练数据比较判断相似度值进行不同操作;
(6)当样本之间的相似度大于平均相似度值时,增大现有样本权重值;当样本之间的相似度值小于平均相似度值时,减小现有样本的权重值,并统一存在一起用于下一轮的增量学习,通过多轮增量学习实现充分的增量学习;
(7)在进行上述操作的过程中,每一轮增量学习的阈值参数、数据样本及权重值都会随着数据的不同进行调整;
(8)当某次用于增量学***均相似度值小于初始平均相似度值的1/2时,增量学习结束,此时,删除所有权重值小于初始权重值1/2的数据;
(9)将得到的数据输入到BP神经网络中进行能耗预测;
(10)采用评价指标均方误差根(RMSE:root mean square error)对能耗预测结果进行评价。
4.根据权利要求1所述的基于充分增量学习的能耗预测方法,其特征在于:所述步骤(6)中充分增量学习的过程包括下述步骤:
首先赋予全部数据初始权重值,其次计算第一组数据之间的相似度值,计算得到平均相似度值,然后将其余新增数据分别与第一组数据计算相似度值,当大于已有平均相似度值时,增大现有样本的权重值;当小于已有平均相似度值时,减小现有样本的权重值并将所有数据存到一起,用于进行下一轮的增量学***均相似度值,然后将其余新增数据分别与第一组数据计算相似度值,当大于该平均相似度值时,增大现有样本的权重值;当小于该平均相似度值时,减小现有样本的权重值并将所有数据存到一起,用于进行下一轮的增量学***均相似度值小于初始平均相似度值的1/2时,增量学习结束,此时,删除所有权重值小于初始权重值1/2的数据,完成充分增量学习的全过程。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010723405.3A CN111832839B (zh) | 2020-07-24 | 2020-07-24 | 基于充分增量学习的能耗预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010723405.3A CN111832839B (zh) | 2020-07-24 | 2020-07-24 | 基于充分增量学习的能耗预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111832839A true CN111832839A (zh) | 2020-10-27 |
CN111832839B CN111832839B (zh) | 2021-04-30 |
Family
ID=72924843
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010723405.3A Active CN111832839B (zh) | 2020-07-24 | 2020-07-24 | 基于充分增量学习的能耗预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111832839B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112613650A (zh) * | 2020-12-14 | 2021-04-06 | 燕山大学 | 一种新型三阶段短期电力负荷预测方法 |
CN115032891A (zh) * | 2022-08-11 | 2022-09-09 | 科大智能物联技术股份有限公司 | 一种基于时间序列预测的多晶硅还原炉控制方法 |
CN116996076A (zh) * | 2023-09-27 | 2023-11-03 | 湖北华中电力科技开发有限责任公司 | 一种用于校园设备的电气能耗数据智能管理方法 |
RU222420U1 (ru) * | 2023-10-12 | 2023-12-25 | федеральное государственное автономное образовательное учреждение высшего образования "Южный федеральный университет" | Устройство мониторинга и прогнозирования электропотребления в электро-энергетических системах на основе нейронных структур |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080112424A1 (en) * | 2006-11-15 | 2008-05-15 | Samsung Electronics Co., Ltd. | Apparatus for reducing contention in prioritized contention access of wireless personal area network and method of using the same |
CN104463381A (zh) * | 2015-01-04 | 2015-03-25 | 福州大学 | 基于kpca与wlssvm的建筑能耗预测方法 |
CN104462846A (zh) * | 2014-12-22 | 2015-03-25 | 山东鲁能软件技术有限公司 | 一种基于支持向量机的设备故障智能诊断方法 |
CN106778795A (zh) * | 2015-11-24 | 2017-05-31 | 华为技术有限公司 | 一种基于增量学习的分类方法及装置 |
CN107316046A (zh) * | 2017-03-09 | 2017-11-03 | 河北工业大学 | 一种基于增量补偿动态自适应增强的故障诊断方法 |
CN107784325A (zh) * | 2017-10-20 | 2018-03-09 | 河北工业大学 | 基于数据驱动增量融合的螺旋式故障诊断模型 |
CN110070145A (zh) * | 2019-04-30 | 2019-07-30 | 天津开发区精诺瀚海数据科技有限公司 | 基于增量聚类的lstm轮毂单品能耗预测 |
CN110901648A (zh) * | 2018-09-13 | 2020-03-24 | 通用汽车环球科技运作有限责任公司 | 用于实时生态路线选择和自适应驱动控制的车辆、***和逻辑 |
CN111260138A (zh) * | 2020-01-18 | 2020-06-09 | 湖南大学 | 加权和自适应并行关联规则的火电机组能耗动态优化方法 |
-
2020
- 2020-07-24 CN CN202010723405.3A patent/CN111832839B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080112424A1 (en) * | 2006-11-15 | 2008-05-15 | Samsung Electronics Co., Ltd. | Apparatus for reducing contention in prioritized contention access of wireless personal area network and method of using the same |
CN104462846A (zh) * | 2014-12-22 | 2015-03-25 | 山东鲁能软件技术有限公司 | 一种基于支持向量机的设备故障智能诊断方法 |
CN104463381A (zh) * | 2015-01-04 | 2015-03-25 | 福州大学 | 基于kpca与wlssvm的建筑能耗预测方法 |
CN106778795A (zh) * | 2015-11-24 | 2017-05-31 | 华为技术有限公司 | 一种基于增量学习的分类方法及装置 |
CN107316046A (zh) * | 2017-03-09 | 2017-11-03 | 河北工业大学 | 一种基于增量补偿动态自适应增强的故障诊断方法 |
CN107784325A (zh) * | 2017-10-20 | 2018-03-09 | 河北工业大学 | 基于数据驱动增量融合的螺旋式故障诊断模型 |
CN110901648A (zh) * | 2018-09-13 | 2020-03-24 | 通用汽车环球科技运作有限责任公司 | 用于实时生态路线选择和自适应驱动控制的车辆、***和逻辑 |
CN110070145A (zh) * | 2019-04-30 | 2019-07-30 | 天津开发区精诺瀚海数据科技有限公司 | 基于增量聚类的lstm轮毂单品能耗预测 |
CN111260138A (zh) * | 2020-01-18 | 2020-06-09 | 湖南大学 | 加权和自适应并行关联规则的火电机组能耗动态优化方法 |
Non-Patent Citations (3)
Title |
---|
JING LIU等: "Helical fault diagnosis model based on data-driven incremental mergence", 《COMPUTERS & INDUSTRIAL ENGINEERING》 * |
叶青等: "基于近邻分类的增量学习分类算法研究", 《计算机工程与应用》 * |
许巧玲等: "基于KPCA-WLSSVM的公共建筑能耗预测", 《江南大学学报(自然科学版)》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112613650A (zh) * | 2020-12-14 | 2021-04-06 | 燕山大学 | 一种新型三阶段短期电力负荷预测方法 |
CN115032891A (zh) * | 2022-08-11 | 2022-09-09 | 科大智能物联技术股份有限公司 | 一种基于时间序列预测的多晶硅还原炉控制方法 |
CN115032891B (zh) * | 2022-08-11 | 2022-11-08 | 科大智能物联技术股份有限公司 | 一种基于时间序列预测的多晶硅还原炉控制方法 |
CN116996076A (zh) * | 2023-09-27 | 2023-11-03 | 湖北华中电力科技开发有限责任公司 | 一种用于校园设备的电气能耗数据智能管理方法 |
CN116996076B (zh) * | 2023-09-27 | 2023-12-19 | 湖北华中电力科技开发有限责任公司 | 一种用于校园设备的电气能耗数据智能管理方法 |
RU222420U1 (ru) * | 2023-10-12 | 2023-12-25 | федеральное государственное автономное образовательное учреждение высшего образования "Южный федеральный университет" | Устройство мониторинга и прогнозирования электропотребления в электро-энергетических системах на основе нейронных структур |
Also Published As
Publication number | Publication date |
---|---|
CN111832839B (zh) | 2021-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111738512B (zh) | 一种基于cnn-ipso-gru混合模型的短期电力负荷预测方法 | |
CN111832839B (zh) | 基于充分增量学习的能耗预测方法 | |
CN111027772B (zh) | 基于pca-dbilstm的多因素短期负荷预测方法 | |
CN109461025B (zh) | 一种基于机器学习的电能替代潜在客户预测方法 | |
CN111860982A (zh) | 一种基于vmd-fcm-gru的风电场短期风电功率预测方法 | |
Cui et al. | Research on power load forecasting method based on LSTM model | |
CN111260136A (zh) | 一种基于arima-lstm组合模型的楼宇短期负荷预测方法 | |
CN113205207A (zh) | 一种基于XGBoost算法的用电短期负荷波动预测方法及*** | |
CN102789539B (zh) | 一种飞行器升力面结构优化设计方法 | |
CN111861013A (zh) | 一种电力负荷预测方法及装置 | |
CN116757057A (zh) | 基于pso-ga-lstm模型的空气质量预测方法 | |
CN113139596A (zh) | 低压台区线损神经网络的优化算法 | |
CN115358437A (zh) | 基于卷积神经网络的供电负荷预测方法 | |
CN114912195A (zh) | 一种商用车空气动力学序列优化方法 | |
CN115099461A (zh) | 基于双分支特征提取的太阳辐射预测方法及*** | |
CN112508286A (zh) | 一种基于Kmeans-BiLSTM-DMD模型的短期负荷预测方法 | |
CN111598313A (zh) | 一种风功率预测方法 | |
CN114707422A (zh) | 一种基于负荷预测的智能电力缉查方法 | |
CN114819395A (zh) | 一种基于长短期记忆神经网络和支持向量回归组合模型的行业中长期负荷预测方法 | |
CN113762591B (zh) | 一种基于gru和多核svm对抗学习的短期电量预测方法及*** | |
CN110956304A (zh) | 一种基于ga-rbm的分布式光伏发电量短期预测方法 | |
CN114564787A (zh) | 用于目标相关翼型设计的贝叶斯优化方法、装置及存储介质 | |
CN113033898A (zh) | 基于k均值聚类与bi-lstm神经网络的电负荷预测方法及*** | |
CN112288187A (zh) | 一种基于大数据的售电量预测方法 | |
CN117151770A (zh) | 一种基于注意力机制的lstm碳价预测方法和*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |