CN112258251B - 基于灰色关联的电动汽车换电需求的集成学习预测方法及*** - Google Patents

基于灰色关联的电动汽车换电需求的集成学习预测方法及*** Download PDF

Info

Publication number
CN112258251B
CN112258251B CN202011294838.8A CN202011294838A CN112258251B CN 112258251 B CN112258251 B CN 112258251B CN 202011294838 A CN202011294838 A CN 202011294838A CN 112258251 B CN112258251 B CN 112258251B
Authority
CN
China
Prior art keywords
training set
day
training
sample
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011294838.8A
Other languages
English (en)
Other versions
CN112258251A (zh
Inventor
张玉利
于浩洁
梁熙栋
张倩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN202011294838.8A priority Critical patent/CN112258251B/zh
Publication of CN112258251A publication Critical patent/CN112258251A/zh
Application granted granted Critical
Publication of CN112258251B publication Critical patent/CN112258251B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/60Other road transportation technologies with climate change mitigation effect
    • Y02T10/70Energy storage systems for electromobility, e.g. batteries
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/60Other road transportation technologies with climate change mitigation effect
    • Y02T10/7072Electromobility specific charging systems or methods for batteries, ultracapacitors, supercapacitors or double-layer capacitors

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Data Mining & Analysis (AREA)
  • General Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Health & Medical Sciences (AREA)
  • Water Supply & Treatment (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Public Health (AREA)
  • Human Resources & Organizations (AREA)
  • Primary Health Care (AREA)
  • Tourism & Hospitality (AREA)
  • Artificial Intelligence (AREA)
  • Game Theory and Decision Science (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于灰色关联的电动汽车换电需求的集成学习预测方法及***,包括:构建数据集并进行预处理,将预处理后的数据集分为训练集和测试集;选择k个基学习器,采用交叉验证方式让每个基学习器对训练集的样本进行训练并预测;对于测试集中的每一个输入样本,通过灰色关联分析选择其最佳相似日训练集;根据各基学习器在最佳相似日训练集中的预测结果,建立预测偏差最小化优化模型,并采用带正则化系数的L1范数作为正则项;基于优化模型求解得到各基学习器的权重系数,进而得到集成预测器;基于集成预测器得到集成学习预测结果。本发明能够有效降低预测偏差,对于随机波动性大的数据具有更好的预测效果,能够更加适应实际中获取的数据集。

Description

基于灰色关联的电动汽车换电需求的集成学习预测方法及 ***
技术领域
本发明涉及机器学习技术领域,具体涉及一种基于灰色关联的电动汽车换电需求的集成学习预测方法及***。
背景技术
汽车是人们日常的出行方式,但是传统燃油汽车会带来严重的环境污染问题,如大汽和水资源的污染、全球变暖等。而电动汽车的出现能够减少对传统化石能源的使用,进而减少污染物的排放,对环境起到一定的保护作用。电动汽车的换电模式可以减少充电时间,提高用户的便利性。例如,2017年,北京汽车工业控股有限公司(BAIC)宣布实施“擎天柱计划”,旨在通过电池交换模式促进新能源和电动汽车的一体化发展。BAIC计划在2022年底前建造3000个光存储交换站。
虽然电动汽车换电模式相比充电模式有很多优势,但是目前换电模式普及率远低于充电模式。其主要原因是目前我国换电站等基础设施建设不完善,导致电动汽车用户往往不能够及时找到换电站进行换电。除此之外,换电站对电池的不合理的管理和运行也成为了电动汽车换电模式发展的阻碍。由于换电站运营商缺乏对未来短期内顾客数量或电池需求变化的了解,导致经常出现供应电池的数量不足或排队充电的问题,使得电动汽车无法及时更换电池,从而极大的降低了用户的满意度,特别是对时间敏感的用户。
为了提高服务水平和电池充电效率,换电站运营商需要准确预测电动汽车的换电需求,为此需要对电动汽车换电需求进行准确预测。对于预测方法主要有三种,包括基于蒙特卡洛的模拟分析、时间序列分析和机器学习方法等。而机器学习有着非常高的预测准确率,被广泛的应用于各个领域。
对于单个类型的机器学习方法(通常称为基学习器),在设计之初都有其工作偏向,在其不适应的数据集上其预测准确率较低。为了克服单一预测器的缺点,从而渐渐出现了集成预测方法,即结合多种基学习器构建集成预测器来提高预测准确率。目前集成预测方法有投票法(voting)、袋装法(bagging)、提升法(boosting)、堆叠法(stacking)等等。由于实际中得到的数据集分布并不均匀,而且如电动汽车换电需求,其波动性更大,有着极强的不确定性。
发明内容
针对现有技术中存在的上述问题,本发明提供一种基于灰色关联的电动汽车换电需求的集成学习预测方法及***,其采用类似于堆叠法的集成预测方法来提高模型的泛化性与预测结果的准确性。
本发明公开了一种基于灰色关联的电动汽车换电需求的集成学习预测方法,包括:
构建数据集并进行预处理,将预处理后的数据集分为训练集和测试集;
选择k个基学习器,采用交叉验证方式让每个基学习器对训练集的样本进行训练并预测;
对于所述测试集中的每一个输入样本,通过灰色关联分析选择其最佳相似日训练集;
根据各基学习器在最佳相似日训练集中的预测结果,建立预测偏差最小化优化模型,并采用带权重系数的L1范数作为正则项;
基于优化模型求解得到的各基学习器的权重系数,得到集成预测器,基于集成预测器得到集成学习预测结果;其中,集成预测器的输出是各基学习器输出的线性加权组合。
作为本发明的进一步改进,所述数据集为T={(x1,Y1),...,(xn,Yn)},
Figure BDA0002785076530000021
式中,T为数据集,xi为第i个样本,i取1,···,n,n为样本数;
Figure BDA0002785076530000022
为样本i的第j个特征,j取1,···,m,m为特征数;Yi为样本i的标签,即电动汽车换电需求量,i取1,···,n。
作为本发明的进一步改进,所述特征包括:
x(1)为星期,编码从1到7;
x(2)为是否为周末,是则编码为1,否则为0;
x(3)为天气,分为晴天、阴天、雨天或雪天,并分别编码为1,2,3;
x(4)为当日的最高气温值;
x(5)为当日的最低气温值;
x(6)为上周同一天的所有电动汽车换电需求量;
x(7)为预测日的前一天所有电动汽车的换电需求量;
x(8)为所有电动汽车在预测日前一天的行驶里程;
x(9)~x(13)分别为在预测日前一天所有车辆结束行驶时,其电池剩余量(SOC)在区间[0,20%]、[20%,40%]、[40%,60%]、[60%,80%]、[80%,100%]的车辆占所有电动汽车的比例。
作为本发明的进一步改进,所述数据集的预处理,包括:先对数据进行标准化,而后采用PCA进行降维处理;
所述训练集包括训练子集和验证集,所述训练子集为总数据量的70%,所述验证集和测试集均为总数据量的15%;
所述基学习器包括K近邻(KNN)、支持向量机(SVR)、梯度提升回归树(GBRT)、随机森林(RF)和岭回归(RR)。
作为本发明的进一步改进,所述采用交叉验证方式让每个基学习器对训练集的样本进行训练并预测,包括:
采用六折交叉验证;
将训练集平均分成6份,分别为T1、T2、T3、T4、T5、T6,将其中5份作为训练子集来训练基学习器,另一份作为验证集用基学习器进行预测;
进行多次训练和预测后,得到每个基学习器在训练集中的预测结果;其中,fr(·)为第r个基学习器,r=1,2,3,4,5,通过交叉验证方式,可以得到5个基学习器在训练集中的预测结果fr(xi);
将所有基学习器在整个训练子集上进行训练。
作为本发明的进一步改进,使用灰色关联分析选择在训练集中与第i个样本最相关的R(i1,i2,…,iR)天,作为相似日训练集Ti
Figure BDA0002785076530000031
式中,
Figure BDA0002785076530000032
为第k个基学习器对第R天样本i的预测结果。
作为本发明的进一步改进,灰色关联分析包括:
首先计算灰色关联系数(ξ0i),然后计算灰色关联度(γ0i),对于输入的测试集样本x0和训练集中的样本xi,灰色关联系数计算公式为:
Figure BDA0002785076530000033
其中ξ0i(c)为测试集样本x0和训练集中的样本xi在第c个特征的灰色关联系数,
Figure BDA0002785076530000041
Figure BDA0002785076530000042
计算出输入的测试集样本与训练集中集所有样本在每个特征的灰色关联系数后,需要计算出输入的测试集样本和训练集中每个样本的灰色关联度,其公式为
Figure BDA0002785076530000043
即取每个灰色关联系数的平均值,计算出来的灰色关联度值越大相关性越高;根据计算出来灰色关联度,从训练集中选取最相关的R个样本作为相似日训练集。
作为本发明的进一步改进,优化模型为:
Figure BDA0002785076530000044
该公式可等价为如下线性规划:
Figure BDA0002785076530000045
s.t.α≥0
Figure BDA0002785076530000046
Figure BDA0002785076530000047
Figure BDA0002785076530000048
式中,E[]为对括号里面的公式求期望,在离散情况下即为求均值;Y是一个随机变量,即训练集中某样本实际的预测值,Yi为第i个样本的实际值;f=(f1,...,fk),即k个基预测器分别在Y对应的样本的预测值,‖α‖1=|α1|+...+|αk|,w为权重系数,k为基学习器的个数;z和νi为引入的中间变量,求解该优化模型,可得到决策变量α=(α1,..,αk)。
作为本发明的进一步改进,对于某一测试集样本xi,最终的预测结果F(xi)=α1f1(xi)+...+αkfk(xi)。
本发明还公开了一种实现上述集成学习预测方法的预测***,包括:
构建模块,用于构建数据集并进行预处理,将预处理后的数据集分为训练集和测试集;
训练模块,用于选择k个基学习器,采用交叉验证方式让每个基学习器对训练集的样本进行训练并预测;
分析模块,用于对于所述测试集中的每一个输入样本,通过灰色关联分析选择其最佳相似日训练集;
建立模块,用于根据各基学习器在最佳相似日训练集中的预测结果,建立预测偏差最小化优化模型,并采用带权重系数的L1范数作为正则项;
预测模块,用于基于优化模型求解得到的各基学习器的权重系数,得到集成预测器,基于集成预测器得到集成学习预测结果;其中,集成预测器的输出是各基学习器输出的线性加权组合。
与现有技术相比,本发明的有益效果为:
本发明考虑了集成预测器的预测准确度和泛化性,与预测效果最好的基学习器相比能够有效降低预测偏差,对于随机波动性大的数据具有更好的预测效果,能够更加适应实际中获取的数据集,并且可以应用于其他数据集,实用性更强。
附图说明
图1为本发明一种实施例公开的基于灰色关联的电动汽车换电需求的集成学习预测方法的流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供一种基于灰色关联的电动汽车换电需求的集成学习预测方法及***,属于机器学习技术领域;该方法涉及到两层结构,即多个基学习器和一个集成预测器,集成预测器是多个基学习器的加权组合。为提高预测精度,本发明对于每个输入的预测样本,基于灰色关联分析选择其最佳相似日训练集,进而为集成预测器权重的求解提供最相关的训练集来提高模型的预测精度。为了提高集成预测器的泛化性,本发明建立了一个带有加权的L1范数正则项的优化模型,该优化模型等价于一个线性规划问题,权重系数将通过该优化模型来求解。本发明考虑了集成预测器的预测准确度和泛化性,与预测效果最好的基学习器相比能够有效降低预测偏差,对于随机波动性大的数据具有更好的预测效果,能够更加适应实际中获取的数据集,并且可以应用于其他数据集,实用性更强。
下面结合附图对本发明做进一步的详细描述:
如图1所示,本发明提供一种基于灰色关联的电动汽车换电需求的集成学习预测方法,包括:
步骤1、特征选择、构建数据集并进行预处理,将预处理后的数据集分为训练集和测试集;其中,
对于采集到的电动汽车行驶记录数据,其特征包括:
x(1)为星期,编码从1到7;
x(2)为是否为周末,是则编码为1,否则为0;
x(3)为天气,分为晴天、阴天、雨天或雪天,并分别编码为1,2,3;
x(4)为当日的最高气温值;
x(5)为当日的最低气温值;
x(6)为上周同一天的所有电动汽车换电需求量;
x(7)为预测日的前一天所有电动汽车的换电需求量;
x(8)为所有电动汽车在预测日前一天的行驶里程;
x(9)~x(13)分别为在预测日前一天所有车辆结束行驶时,其电池剩余量(SOC)在区间[0,20%]、[20%,40%]、[40%,60%]、[60%,80%]、[80%,100%]的车辆占所有电动汽车的比例;
Y为对应日期所有的电动汽车换电需求量,即数据集的标签,假设有n个样本,每个样本有m个特征,那么最终数据集为T={(x1,Y1),...,(xn,Yn)},
Figure BDA0002785076530000061
式中,T为数据集,xi为第i个样本,i取1,···,n,n为样本数;
Figure BDA0002785076530000062
为样本i的第j个特征,j取1,···,m,m为特征数;Yi为样本i的标签,即电动汽车换电需求量,i取1,···,n;
数据集的预处理,包括:先采用公式
Figure BDA0002785076530000063
对数据进行标准化,而后采用PCA进行降维处理,标准化之后的数据集降维后由13个特征降为12个特征。
训练集包括训练子集和验证集,训练子集为总数据量的70%,验证集和测试集均为总数据量的15%。
进一步,为了便于数据提取,可以将日期(年-月-日)添加到数据集中,但不作为特征输入到模型中。
步骤2、选择k个基学习器,采用交叉验证方式让每个基学习器对训练集的样本进行训练并预测;其中,
基学习器的数量为5个,包括K近邻(KNN)、支持向量机(SVR)、梯度提升回归树(GBRT)、随机森林(RF)和岭回归(RR);
交叉验证采用六折交叉验证,假设fr(·)为第r个基学习器(r=1,2,3,4,5),通过交叉验证方式,可以得到5个基学习器在训练集中的预测结果fr(xi)。
具体的:
采用六折交叉验证;将训练集平均分成6份,分别为T1、T2、T3、T4、T5、T6,将其中5份作为训练子集来训练基学习器,另一份作为验证集用基学习器进行预测;进行多次训练和预测后,得到每个基学习器在训练集中的预测结果,并将该结果记录下来;将所有基学习器在整个训练子集上进行训练。
由于最终的集成预测方法是结合基学习器而集成的,所以基学习器预测准确率提高必然会提高集成预测方法的准确率。所以在进行训练和预测的时候,所有基学习器超参数均采用python中sklearn包中的默认值。
步骤3、对于测试集中的每一个输入样本,通过灰色关联分析选择其最佳相似日训练集;
其中,
使用灰色关联分析选择在训练集中与第i个样本最相关的R(i1,i2,…,iR)天,作为相似日训练集Ti
Figure BDA0002785076530000071
式中,
Figure BDA0002785076530000072
为第k个基学习器对第R天样本i的预测结果;
灰色关联分析包括:
首先计算灰色关联系数(ξ0i),然后计算灰色关联度(γ0i),对于输入的测试集样本x0和训练集中的样本xi,灰色关联系数计算公式为:
Figure BDA0002785076530000081
其中ξ0i(c)为测试集样本x0和训练集中的样本xi在第c个特征的灰色关联系数,
Figure BDA0002785076530000082
Figure BDA0002785076530000083
计算出输入的测试集样本与训练集中集所有样本在每个特征的灰色关联系数后,需要计算出输入的测试集样本和训练集中每个样本的灰色关联度,其公式为
Figure BDA0002785076530000084
即取每个灰色关联系数的平均值,计算出来的灰色关联度值越大相关性越高;根据计算出来灰色关联度,从训练集中选取最相关的R个样本作为相似日训练集;其中,,其中R通常取训练集样本总量的75%。
步骤4、根据各基学习器在最佳相似日训练集中的预测结果,建立预测偏差最小化优化模型,并采用带权重系数的L1范数作为正则项;
其中,优化模型为:
Figure BDA0002785076530000085
该公式可等价为如下线性规划:
Figure BDA0002785076530000086
s.t.α≥0
Figure BDA0002785076530000087
Figure BDA0002785076530000088
Figure BDA0002785076530000089
式中,E[]为对括号里面的公式求期望,在离散情况下即为求均值;Y是一个随机变量,即训练集中某样本实际的预测值,Yi为第i个样本的实际值;f=(f1,...,fk),即k个基预测器分别在Y对应的样本的预测值,‖α‖1=|α1|+...+|αk|,w为权重系数,k为基学习器的个数;z和vi为引入的中间变量,求解该优化模型,可得到决策变量α=(α1,..,αk)。
其中,其中w可以在训练集中采用交叉验证的方式寻找最佳的R,即将训练集平均分为6份,选取其中五份作为训练集,另一份作为验证集进行预测,每一份预测均可得到一个评估指标,由于分为了6份,便可以得到6个评估指标,取该6个评估指标的平均值作为该参数在某一数值最终的预测效果表现,通过不断循坏迭代,找到评估指标最优的值作为预测时参数所取得值,本实例中优选得评估指标为均方误差MAE和对称平均绝对百分比误差(SMAPE)。
步骤5、基于优化模型求解得到的各基学习器的权重系数,得到集成预测器,基于集成预测器得到集成学习预测结果;其中,集成预测器的输出是各基学习器输出的线性加权组合,即对于某一测试集样本xi,最终的预测结果F(xi)=α1f1(xi)+...+αkfk(xi)。
本发明提供一种实现上述集成学习预测方法的预测***,包括:
构建模块,用于实现上述步骤1;
训练模块,用于实现上述步骤2;
分析模块,用于实现上述步骤3;
建立模块,用于实现上述步骤4;
预测模块,用于实现上述步骤5。
与现有技术相比,本发明的有益效果为:
本发明考虑了集成预测器的预测准确度和泛化性,与预测效果最好的基学习器相比能够有效降低预测偏差,对于随机波动性大的数据具有更好的预测效果,能够更加适应实际中获取的数据集,并且可以应用于其他数据集,实用性更强。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种基于灰色关联的电动汽车换电需求的集成学习预测方法,其特征在于,包括:
构建数据集并进行预处理,将预处理后的数据集分为训练集和测试集;
选择k个基学习器,采用交叉验证方式让每个基学习器对训练集的样本进行训练并预测;
对于所述测试集中的每一个输入样本,通过灰色关联分析选择其最佳相似日训练集;
根据各基学习器在最佳相似日训练集中的预测结果,建立预测偏差最小化优化模型,并采用带正则化系数的L1范数作为正则项;其中,优化模型为:
Figure FDA0003912888520000011
该模型等价为如下线性规划:
Figure FDA0003912888520000012
s.t.αq≥0,q取1,…,k
Figure FDA0003912888520000013
Figure FDA0003912888520000014
Figure FDA0003912888520000015
式中,E[]为对括号里面的公式求期望,在离散情况下即为求均值;Y是一个随机变量,即所述最佳相似日训练集中某样本实际的需求值,Yp为所述最佳相似日训练集中第p 个样本的实际值;f=(f1,...,fk),即k个基预测器分别在Y对应的样本的预测值,||α||1=|α1|+...+|αk|,w为正则化系数,k为基学习器的个数;z和vp为引入的中间变量,求解该优化模型,得到决策变量α=(α1,..,αk),其中,α1,..,αk为各基学习器的权重系数;R为所述最佳相似日训练集的样本数量;
基于所述优化模型求解得到的各基学习器的权重系数,得到集成预测器,基于集成预测器得到集成学习预测结果;其中,集成预测器的输出是各基学习器输出的线性加权组合。
2.如权利要求1所述的集成学习预测方法,其特征在于,所述数据集为T={(x1,Y1),...,(xn,Yn)},
Figure FDA0003912888520000021
式中,T为数据集,xi为第i个样本,i取1,…,n,n为样本数;
Figure FDA0003912888520000022
为样本i的第j个特征,j取1,…,m,m为特征数;Yi为样本i的标签,即电动汽车换电需求量,i取1,…,n。
3.如权利要求2所述的集成学习预测方法,其特征在于,所述特征包括:
x(1)为星期,编码从1到7;
x(2)为是否为周末,是则编码为1,否则为0;
x(3)为天气,分为晴天、阴天、雨天或雪天,并将晴天编码为1、阴天编码为2、雨天或雪天编码为3;
x(4)为当日的最高气温值;
x(5)为当日的最低气温值;
x(6)为上周同一天的所有电动汽车换电需求量;
x(7)为预测日的前一天所有电动汽车的换电需求量;
x(8)为所有电动汽车在预测日前一天的行驶里程;
x(9)~x(13)分别为在预测日前一天所有车辆结束行驶时,其电池剩余量(SOC)在区间[0,20%]、[20%,40%]、[40%,60%]、[60%,80%]、[80%,100%]的车辆占所有电动汽车的比例。
4.如权利要求2所述的集成学习预测方法,其特征在于,所述数据集的预处理,包括:先对数据进行标准化,而后采用PCA进行降维处理;
所述基学习器包括K近邻、支持向量机、梯度提升回归树、随机森林和岭回归。
5.如权利要求4所述的集成学习预测方法,其特征在于,所述采用交叉验证方式让每个基学习器对训练集的样本进行训练并预测,包括:
采用六折交叉验证;
将训练集平均分成6份,分别为T1、T2、T3、T4、T5、T6,将其中5份作为训练子集来训练基学习器,另一份作为验证集用基学习器进行预测;
进行多次训练和预测后,得到每个基学习器在训练集中的预测结果;其中,fr(·)为第r个基学习器,r=1,2,3,4,5,通过交叉验证方式,得到5个基学习器在训练集中的预测结果fr(xi);
将所有基学习器在整个训练子集上进行训练。
6.如权利要求5所述的集成学习预测方法,其特征在于,使用灰色关联分析选择在训练集中与第i个样本最相关的R天,表示为i1,i2,...,iR,获得相似日训练集Ti
Figure FDA0003912888520000031
式中,
Figure FDA0003912888520000032
为第k个基学习器对与第i个样本最相关的R天的预测结果。
7.如权利要求6所述的集成学习预测方法,其特征在于,灰色关联分析包括:
首先计算灰色关联系数ξ0i,然后计算灰色关联度γ0i,具体包括:
对于输入的测试集样本x0和训练集中的样本xi,灰色关联系数计算公式为:
Figure FDA0003912888520000033
其中ξ0i(c)为测试集样本x0和训练集中的样本xi在第c个特征的灰色关联系数,
Figure FDA0003912888520000034
Figure FDA0003912888520000035
ρ∈[0,1],计算出输入的测试集样本与训练集中所有样本在每个特征的灰色关联系数后,需要计算出输入的测试集样本和训练集中每个样本的灰色关联度,其公式为
Figure FDA0003912888520000036
即取每个灰色关联系数的平均值,计算出来的灰色关联度值越大相关性越高;根据计算出来灰色关联度,从训练集中选取最相关的R个样本作为相似日训练集。
8.如权利要求7所述的集成学习预测方法,其特征在于,对于某一测试集样本xi,最终的预测结果F(xi)=α1f1(xi)+...+αkfk(xi)。
9.一种如权利要求1~8中任一项所述的集成学习预测方法的预测***,其特征在于,包括:
构建模块,用于构建数据集并进行预处理,将预处理后的数据集分为训练集和测试集;
训练模块,用于选择k个基学习器,采用交叉验证方式让每个基学习器对训练集的样本进行训练并预测;
分析模块,用于对于所述测试集中的每一个输入样本,通过灰色关联分析选择其最佳相似日训练集;
建立模块,用于根据各基学习器在最佳相似日训练集中的预测结果,建立预测偏差最小化优化模型,并采用带正则化系数的L1范数作为正则项;
预测模块,用于基于优化模型求解得到的各基学习器的权重系数,得到集成预测器,基于集成预测器得到集成学习预测结果;其中,集成预测器的输出是各基学习器输出的线性加权组合。
CN202011294838.8A 2020-11-18 2020-11-18 基于灰色关联的电动汽车换电需求的集成学习预测方法及*** Active CN112258251B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011294838.8A CN112258251B (zh) 2020-11-18 2020-11-18 基于灰色关联的电动汽车换电需求的集成学习预测方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011294838.8A CN112258251B (zh) 2020-11-18 2020-11-18 基于灰色关联的电动汽车换电需求的集成学习预测方法及***

Publications (2)

Publication Number Publication Date
CN112258251A CN112258251A (zh) 2021-01-22
CN112258251B true CN112258251B (zh) 2022-12-27

Family

ID=74266200

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011294838.8A Active CN112258251B (zh) 2020-11-18 2020-11-18 基于灰色关联的电动汽车换电需求的集成学习预测方法及***

Country Status (1)

Country Link
CN (1) CN112258251B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112949948B (zh) * 2021-04-28 2022-06-21 北京理工大学 电动汽车分时段换电需求区间预测的集成学习方法及***
CN113283174B (zh) * 2021-06-09 2022-08-30 中国石油天然气股份有限公司 基于算法集成与自控制的储层产能预测方法、***及终端
CN113643758B (zh) * 2021-09-22 2023-04-07 华南农业大学 面向肠杆科细菌获得抗β-内酰胺类耐药性基因的预测方法
CN115204417B (zh) * 2022-09-13 2022-12-27 鱼快创领智能科技(南京)有限公司 基于集成学习的车辆重量预测方法、***及存储介质
CN115829120B (zh) * 2022-11-29 2023-07-18 中国环境科学研究院 基于机器学习方法的水质预测预警***
CN117236527B (zh) * 2023-11-13 2024-02-06 宁德市天铭新能源汽车配件有限公司 一种基于集成学习的汽车零部件需求预测方法及***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108846517A (zh) * 2018-06-12 2018-11-20 清华大学 一种分位数概率性短期电力负荷预测集成方法
CN110414788A (zh) * 2019-06-25 2019-11-05 国网上海市电力公司 一种基于相似日和改进lstm的电能质量预测方法
CN110517494A (zh) * 2019-09-03 2019-11-29 中国科学院自动化研究所 基于集成学习的交通流预测模型、预测方法、***、装置
CN111400180A (zh) * 2020-03-13 2020-07-10 上海海事大学 一种基于特征集划分和集成学习的软件缺陷预测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW202018727A (zh) * 2018-11-09 2020-05-16 財團法人工業技術研究院 整體式學習預測方法與系統

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108846517A (zh) * 2018-06-12 2018-11-20 清华大学 一种分位数概率性短期电力负荷预测集成方法
CN110414788A (zh) * 2019-06-25 2019-11-05 国网上海市电力公司 一种基于相似日和改进lstm的电能质量预测方法
CN110517494A (zh) * 2019-09-03 2019-11-29 中国科学院自动化研究所 基于集成学习的交通流预测模型、预测方法、***、装置
CN111400180A (zh) * 2020-03-13 2020-07-10 上海海事大学 一种基于特征集划分和集成学习的软件缺陷预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
电动汽车充换电需求分析与预测;刘斌 等;《城市建设理论研究(电子版)》;20151231;第5卷(第36期);第1-2页 *

Also Published As

Publication number Publication date
CN112258251A (zh) 2021-01-22

Similar Documents

Publication Publication Date Title
CN112258251B (zh) 基于灰色关联的电动汽车换电需求的集成学习预测方法及***
CN111080032A (zh) 一种基于Transformer结构的负荷预测方法
CN106485262A (zh) 一种母线负荷预测方法
CN110619419B (zh) 城市轨道交通的客流预测方法
CN111999649A (zh) 一种基于XGBoost算法的锂电池剩余寿命预测方法
CN109492748B (zh) 一种基于卷积神经网络的电力***的中长期负荷预测模型建立方法
CN114358185B (zh) 一种基于改进K均值聚类CCA-BiLSTM多维度短期电力负荷预测方法
CN109086926B (zh) 一种基于组合神经网络结构的短时轨道交通客流预测方法
US20220261655A1 (en) Real-time prediction method for engine emission
CN106156895A (zh) 一种基于模糊c均值聚类和分步网格搜索支持向量回归的电动汽车充电负荷预测方法
CN113762387B (zh) 一种基于混合模型预测的数据中心站多元负荷预测方法
CN111815026A (zh) 一种基于特征聚类的多能源***负荷预测方法
CN112330052A (zh) 一种配变负荷预测方法
CN115730635A (zh) 一种电动汽车负荷预测方法
CN113298318A (zh) 一种新型的配电变压器重过载预测方法
CN113762591B (zh) 一种基于gru和多核svm对抗学习的短期电量预测方法及***
CN112949948B (zh) 电动汽车分时段换电需求区间预测的集成学习方法及***
CN116596129A (zh) 一种电动汽车充电场站短期负荷预测模型构建方法
CN115481788B (zh) 相变储能***负荷预测方法及***
CN116796892A (zh) 一种基于复合分位数回归的短期电动汽车充电负荷概率预测方法
CN116500480A (zh) 一种基于特征迁移学习混合模型的智能电池健康监测方法
CN116167465A (zh) 基于多变量时间序列集成学习的太阳辐照度预测方法
CN110619422A (zh) 一种智能车站客流状况预测方法和***
CN116644562A (zh) 一种新能源电站运维费用评估***
CN115511230A (zh) 一种电能替代潜力分析预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant