CN107506865B - 一种基于lssvm优化的负荷预测方法及*** - Google Patents

一种基于lssvm优化的负荷预测方法及*** Download PDF

Info

Publication number
CN107506865B
CN107506865B CN201710767106.8A CN201710767106A CN107506865B CN 107506865 B CN107506865 B CN 107506865B CN 201710767106 A CN201710767106 A CN 201710767106A CN 107506865 B CN107506865 B CN 107506865B
Authority
CN
China
Prior art keywords
data
particle
value
particles
load
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201710767106.8A
Other languages
English (en)
Other versions
CN107506865A (zh
Inventor
戴彬
王曼
徐方琳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong University of Science and Technology
Original Assignee
Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong University of Science and Technology filed Critical Huazhong University of Science and Technology
Priority to CN201710767106.8A priority Critical patent/CN107506865B/zh
Publication of CN107506865A publication Critical patent/CN107506865A/zh
Application granted granted Critical
Publication of CN107506865B publication Critical patent/CN107506865B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/003Load forecast, e.g. methods or systems for forecasting future load demand

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Human Resources & Organizations (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Power Engineering (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于LSSVM优化的负荷预测方法及***,包括:(1)在获取原始的历史负荷数据之后,甄别并修正其中的异常数据,构建特征向量,对特征向量进行k均值聚类,根据聚类效果,选择输入变量;(2)以LSSVM模型的惩罚因子C和核函数宽度参数σ,作为粒子群算法的粒子在搜索空间的位置坐标,选择使得适应度值最小的粒子坐标向量值[C,σ]作为粒子群算法的输出;(3)利用优化处理后的输入变量数据作为LSSVM模型的输入和输出,利用步骤(2)中得到的[C,σ],求解负荷预测回归方程,利用回归方程进行负荷预测。本发明修正了异常数据,找到最适宜的惩罚因子和核函数宽度参数,从而提高基于LSSVM的负荷预测精度。

Description

一种基于LSSVM优化的负荷预测方法及***
技术领域
本发明属于负荷预测领域,更具体地,涉及一种基于LSSVM优化的负荷预测方法及***。
背景技术
在现有的负荷预测技术中,LSSVM具有计算速度快、预测精度高、推广性能好的优点,非常适用于非线性、高维度、小样本的负荷预测应用场景。通过对建筑负荷的实时预测,将预测值与实际负荷值进行对比,可以及时发现建筑能耗使用异常及存在的设备故障,采取补救措施,避免可能带来的损失;分析建筑的节能状态和节能潜力,调整节能策略,为合理分配能量提供决策依据。
在基于LSSVM技术进行负荷预测时,对预测结果影响较大的主要是样本数据的质量和模型的参数。提高LSSVM负荷预测精度和速度的关键在于提高数据的质量和选择合适的惩罚因子和核函数宽度参数。在数据质量方面,传统的横向比较法,是利用负荷曲线中连续的两点不会产生突变的性质,如果前后两个时刻的负荷之差超过一定的阈值,则认为该处有异常点,取前后两个时刻平均值进行修正,由于负荷数据中连续异常值的存在,传统的横向比较法不能充分修正存在的异常数据;训练样本集不能充分体现负荷的内在特征;输入变量的维数过多及变量之间的相关性,使模型结构复杂化,对负荷的影响因素进行属性约简可以起到降维的作用,但是舍弃了其余因素中携带的信息,且无法解决变量之间相关问题。
在参数选择方面,LSSVM负荷预测模型的主要缺点在于惩罚项参数C和核函数宽度参数的选择没有一定的依据,只能依靠预测人员的经验或是实验方法。基于经验选择参数的方法随机性太强,基于网格搜索、交叉验证等实验方法计算量比较大,非常耗时。基于标准的PSO粒子群算法可以对LSSVM的模型参数进行寻优,但PSO算法在寻找最佳参数的过程中,粒子容易向局部极值靠拢,造成早熟收敛问题。
综上,现有技术基于LSSVM技术进行负荷预测时,模型数据样本的质量不高、惩罚项参数C以及核函数宽度参数σ选择困难为基于LSSVM的实时负荷预测带来了困难。
发明内容
针对现有技术的缺陷,本发明的目的在于解决现有技术基于LSSVM技术进行负荷预测时,模型数据样本的质量不高、惩罚项参数C以及核函数宽度参数σ选择困难为基于LSSVM的实时负荷预测带来了困难的技术问题。
为实现上述目的,一方面,本发明提供一种基于LSSVM优化的负荷预测方法,包括以下步骤:
(1)在获取原始的历史负荷数据之后,利用双向比较法处理数据,甄别并修正其中的异常数据;然后以温度、日期类型、负荷数据构建特征向量,对特征向量进行k均值聚类,根据聚类效果,选择与待预测日数据特征相似度较高的日期的数据作为训练样本的输入变量;对输入变量进行主成分分析降维处理,去除冗余信息。
(2)以LSSVM模型的惩罚因子C和核函数宽度参数σ,作为粒子群算法的粒子在搜索空间的位置坐标,将每次迭代过程中每个粒子的位置向量[C,σ]输入到LSSVM模型,并计算训练集的预测值和实际值的误差作为适应度;在迭代过程中选择适应度好的粒子作为父代粒子,进行交叉操作,然后对粒子的位置变量进行变异;选择使得适应度值最小的粒子坐标向量值[C,σ]作为粒子群算法的输出。
(3)利用步骤(1)中优化处理后的输入变量数据作为LSSVM模型的输入和输出,利用步骤(2)中得到的[C,σ]的坐标值C作为LSSVM模型的惩罚因子,坐标值σ作为LSSVM模型的核函数宽度参数,求解负荷预测回归方程,利用回归方程进行负荷预测。
可选地,在步骤(2)中,将经过步骤(1)优化处理后的输入变量数据作为步骤(2)中所述的训练集的输入输出。
可选地,所述LSSVM负荷预测模型利用Correct-Cluster-PCA算法优化模型完成所述步骤(1),所述步骤(1)具体包括以下步骤:
步骤1-1、对于原始的n天历史负荷数据,从第d天的第2个时刻点开始,计算t时刻点相对于t-1时刻点负荷的变化量D(d,t)=L(d,t)-L(d,t-1)和n天负荷变化量的平均值
Figure GDA0002574029830000031
判断每天的负荷变化量是否超过阈值,即判断D(d,t)>λα(t)是否成立,若是,跳到步骤1-2,否则跳到步骤1-4,λ为修正因子常数,1≤d≤n,2≤t≤∞,L(d,t)为第d天第t时刻的负荷量。
步骤1-2、计算双向比较法的横向阈值
Figure GDA0002574029830000032
Figure GDA0002574029830000033
i=1,2,…,n,若待判定的负荷数据值满足
Figure GDA0002574029830000034
判断该待判定的负荷数据为异常数据,跳到步骤1-3,否则跳到步骤1-4。
步骤1-3、筛选出异常数据,统计异常数据的个数。
步骤1-4、统计判定为正常的数据,计算正常数据的平均值,作为异常数据的修正值。
步骤1-5、修正异常数据。
步骤1-6、判断第d天的数据修正是否完成,若是,则跳到步骤1-7,若否,则t+1,跳到步骤1-1。
步骤1-7、判断n天的数据是否修正完成,若是,则结束算法的Correct部分,若否,则d+1,跳到步骤1-1。
步骤1-8、利用步骤1-7中修正完成后的负荷数据和日平均温度数据、日期类型数据构成相似日特征向量,对n天的相似日特征向量进行k均值聚类,完成算法的Cluster部分。
步骤1-9、根据步骤1-8中的聚类结果,选择与待预测日同一类的日期的数据作为训练样本,利用PCA算法,即主成分分析法,对输入向量进行降维处理,完成算法的PCA部分。
可选地,所述的LSSVM模型利用Improved-PSO-LSSVM参数寻优算法找到模型最适宜的惩罚因子参数C和核函数宽度参数σ,步骤(2)具体包括以下步骤:
步骤2-1、初始化粒子群PSO算法的粒子群规模、参数C的搜索范围和参数σ的搜索范围、最大迭代次数maxgen、惯性因子参数w、加速参数c1和c2、速度上限参数vmax,交叉概率pc和变异概率pm。
步骤2-2、在C和σ的搜索范围内初始化粒子的位置,将每个粒子的当前位置作为其个体历史最优位置Pid
步骤2-3、将步骤2-2中粒子的初始化位置向量[C,σ]的坐标值分别作为LSSVM模型的惩罚因子C和核函数宽度参数σ,以步骤1-9中得到的Correct-Cluster-PCA算法处理后的数据作为输入,以历史负荷数据作为输出,计算预测负荷值与实际预测值之间的平均绝对误差作为适应度值;在每个粒子的个体历史最优位置中找出适应度值最小的位置作为群体最优位置Pgd
步骤2-4、在第n+1次迭代时粒子的速度更新公式为:
Figure GDA0002574029830000041
Figure GDA0002574029830000042
位置更新公式为
Figure GDA0002574029830000043
Figure GDA0002574029830000044
分别按照速度更新公式和位置更新公式更新粒子的位置,式中,
Figure GDA0002574029830000045
为第n次迭代时粒子的速度,
Figure GDA0002574029830000046
为第n次迭代时粒子的位置,w为第n次迭代时粒子的惯性因子常数,
Figure GDA0002574029830000047
为第n次迭代时粒子的个体最优位置,
Figure GDA0002574029830000051
为第n次迭代时粒子的群体最优位置,c1、c2为加速常数因子,r1、r2为取值范围为[0,1]的随机数。
步骤2-5、按照适应度值的大小将粒子进行排序。
步骤2-6、选择适应度好的粒子构成粒子池,按照概率pc选择粒子池中的粒子作为父代粒子,进行交叉操作,子代粒子的速度更新公式为:
Figure GDA0002574029830000052
位置更新公式为:
Figure GDA0002574029830000053
式中p为取值范围为[0,1]的随机数,parent1(Vi)、parent1(Xi)为父代粒子1的速度和位置,parent2(Vi)、parent2(Xi)分别为父代粒子2的速度和位置,child1(Vi)、child1(Xi)为子代粒子1的速度和位置,child2(Vi)、child2(Xi)为子代粒子2的速度和位置,式中i为微粒迭代的次数。
步骤2-7、按照概率pm对步骤2-6中得到的子代粒子执行变异操作,变异公式为X'i=Xi+rand×η,式中rand为取值范围为[0,1]的随机数,η为与Xi同维的服从(0,1)标准正态分布的随机向量,X'i为执行变异操作后粒子在空间中的位置,Xi为执行变异操作前粒子在空间中的位置。
步骤2-8、计算经过选择、交叉、变异后的粒子的适应度值,更新个体最优位置Pid和群体最优位置Pgd
步骤2-9、判断是否到达最大迭代次数或群体迄今搜索到的最优位置适应度值是否小于预设的阈值,若是,结束算法,若否则返回步骤2-4继续执行。
另一方面,本发明提供一种基于LSSVM优化的负荷预测***,包括:
训练样本处理单元,用于在获取原始的历史负荷数据之后,利用双向比较法处理数据,甄别并修正其中的异常数据;然后以温度、日期类型、负荷数据构建特征向量,对特征向量进行k均值聚类,根据聚类效果,选择与待预测日数据特征相似度较高的日期的数据作为训练样本的输入变量;对输入变量进行主成分分析降维处理,去除冗余信息。
模型参数确定单元,用于以LSSVM模型的惩罚因子C和核函数宽度参数σ,作为粒子群算法的粒子在搜索空间的位置坐标,将每次迭代过程中每个粒子的位置向量[C,σ]输入到LSSVM模型,并计算训练集的预测值和实际值的误差作为适应度;在迭代过程中选择适应度好的粒子作为父代粒子,进行交叉操作,然后对粒子的位置变量进行变异;选择使得适应度值最小的粒子坐标向量值[C,σ]作为粒子群算法的输出。
负荷预测单元,用于利用训练样本处理单元优化处理后的输入变量数据作为LSSVM模型的输入和输出,利用模型参数确定单元得到的[C,σ]的坐标值C作为LSSVM模型的惩罚因子,坐标值σ作为LSSVM模型的核函数宽度参数,求解负荷预测回归方程,利用回归方程进行负荷预测。
可选地,将经过训练样本处理单元优化处理后的输入变量数据作为模型参数确定单元中所述的训练集的输入输出。
可选地,所述训练样本处理单元,用于执行以下步骤:
步骤1-1、对于原始的n天历史负荷数据,从第d天的第2个时刻点开始,计算t时刻点相对于t-1时刻点负荷的变化量D(d,t)=L(d,t)-L(d,t-1)和n天负荷变化量的平均值
Figure GDA0002574029830000061
判断每天的负荷变化量是否超过阈值,即判断D(d,t)>λα(t)是否成立,若是,跳到步骤1-2,否则跳到步骤1-4,λ为修正因子常数,1≤d≤n,2≤t≤∞,L(d,t)为第d天第t时刻的负荷量。
步骤1-2、计算双向比较法的横向阈值
Figure GDA0002574029830000071
Figure GDA0002574029830000072
i=1,2,…,n,若待判定的负荷数据值满足
Figure GDA0002574029830000073
判断该待判定的负荷数据为异常数据,跳到步骤1-3,否则跳到步骤1-4。
步骤1-3、筛选出异常数据,统计异常数据的个数。
步骤1-4、统计判定为正常的数据,计算正常数据的平均值,作为异常数据的修正值。
步骤1-5、修正异常数据。
步骤1-6、判断第d天的数据修正是否完成,若是,则跳到步骤1-7,若否,则t+1,跳到步骤1-1。
步骤1-7、判断n天的数据是否修正完成,若是,则结束算法的Correct部分,若否,则d+1,跳到步骤1-1。
步骤1-8、利用步骤1-7中修正完成后的负荷数据和日平均温度数据、日期类型数据构成相似日特征向量,对n天的相似日特征向量进行k均值聚类,完成算法的Cluster部分。
步骤1-9、根据步骤1-8中的聚类结果,选择与待预测日同一类的日期的数据作为训练样本,利用PCA算法,即主成分分析法,对输入向量进行降维处理,完成算法的PCA部分。
可选地,所述模型参数确定单元,用于执行以下步骤:
步骤2-1、初始化粒子群PSO算法的粒子群规模、参数C的搜索范围和参数σ的搜索范围、最大迭代次数maxgen、惯性因子参数w、加速参数c1和c2、速度上限参数vmax,交叉概率pc和变异概率pm。
步骤2-2、在C和σ的搜索范围内初始化粒子的位置,将每个粒子的当前位置作为其个体历史最优位置Pid
步骤2-3、将步骤2-2中粒子的初始化位置向量[C,σ]的坐标值分别作为LSSVM模型的惩罚因子C和核函数宽度参数σ,以步骤1-9中得到的Correct-Cluster-PCA算法处理后的数据作为输入,以历史负荷数据作为输出,计算预测负荷值与实际预测值之间的平均绝对误差作为适应度值;在每个粒子的个体历史最优位置中找出适应度值最小的位置作为群体最优位置Pgd
步骤2-4、在第n+1次迭代时粒子的速度更新公式为:
Figure GDA0002574029830000081
Figure GDA0002574029830000082
位置更新公式为
Figure GDA0002574029830000083
Figure GDA0002574029830000084
分别按照速度更新公式和位置更新公式更新粒子的位置,式中,
Figure GDA0002574029830000085
为第n次迭代时粒子的速度,
Figure GDA0002574029830000086
为第n次迭代时粒子的位置,w为第n次迭代时粒子的惯性因子常数,
Figure GDA0002574029830000087
为第n次迭代时粒子的个体最优位置,
Figure GDA0002574029830000088
为第n次迭代时粒子的群体最优位置,c1、c2为加速常数因子,r1、r2为取值范围为[0,1]的随机数。
步骤2-5、按照适应度值的大小将粒子进行排序。
步骤2-6、选择适应度好的粒子构成粒子池,按照概率pc选择粒子池中的粒子作为父代粒子,进行交叉操作,子代粒子的速度更新公式为:
Figure GDA0002574029830000089
位置更新公式为:
Figure GDA00025740298300000810
式中p为取值范围为[0,1]的随机数,parent1(Vi)、parent1(Xi)为父代粒子1的速度和位置,parent2(Vi)、parent2(Xi)分别为父代粒子2的速度和位置,child1(Vi)、child1(Xi)为子代粒子1的速度和位置,child2(Vi)、child2(Xi)为子代粒子2的速度和位置,式中i为微粒迭代的次数。
步骤2-7、按照概率pm对步骤2-6中得到的子代粒子执行变异操作,变异公式为X'i=Xi+rand×η,式中rand为取值范围为[0,1]的随机数,η为与Xi同维的服从(0,1)标准正态分布的随机向量,X'i为执行变异操作后粒子在空间中的位置,Xi为执行变异操作前粒子在空间中的位置。
步骤2-8、计算经过选择、交叉、变异后的粒子的适应度值,更新个体最优位置Pid和群体最优位置Pgd
步骤2-9、判断是否到达最大迭代次数或群体迄今搜索到的最优位置适应度值是否小于预设的阈值,若是,结束算法,若否则返回步骤2-4继续执行。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,具有以下有益效果:
本发明中,采集到的历史负荷数据后,首先经过Correct-Cluster-PCA算法处理,修正了其中的异常数据,并选择了与待预测日相似度高的预测日的数据作为训练样本,同时对输入变量进行了降维和精简,大大提高了LSSVM模型的输入输出数据的质量,同时利用Improved-PSO-LSSVM算法,找到最适宜的惩罚因子和核函数宽度参数,从而提高基于LSSVM的负荷预测精度。
附图说明
图1为本发明提供的基于LSSVM优化的负荷预测方法流程示意图;
图2为本发明提供的数据处理模块的Correct-Cluster-PCA算法流程图;
图3为本发明提供的参数寻优模块的Improved-PSO-LSSVM参数寻优算法流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
图1为本发明提供的***的基于LSSVM优化的负荷预测方法流程示意图。包括:
步骤1、在获取原始的历史负荷数据之后,利用双向比较法处理数据,甄别并修正其中的异常数据;然后以温度、日期类型、负荷数据构建特征向量,对特征向量进行k均值聚类,根据聚类效果,选择与待预测日数据相似度较高的日期的数据作为训练样本的输入变量;对输入变量进行主成分分析降维处理,提取其中的主要信息,去除冗余信息。
步骤2、以LSSVM模型的惩罚因子C和核函数宽度参数σ,作为粒子在搜索空间的位置坐标,将每次迭代过程中每个粒子的位置向量[C,σ],输入LSSVM模型,并计算训练集的预测值和实际值的误差作为适应度;在迭代过程中选择适应度较好的粒子作为父代粒子,进行交叉操作,然后对粒子的位置变量进行变异;选择使得适应度值最小的粒子坐标向量值[C,σ],作为粒子群算法的输出;
步骤3、利用步骤1中优化处理后的数据作为LSSVM模型的输入和输出,利用步骤2中得到的[C,σ]的坐标值C作为LSSVM模型的惩罚因子,坐标值σ作为模型的核函数宽度参数,求解负荷预测回归方程,利用回归方程进行负荷预测。
图2给出了本发明实施中优化数据质量的Correct-Cluster-PCA算法流程图。该过程包括:
步骤10:输入待处理的n天的历史负荷数据。
步骤11:从第d天的第2个时刻点开始,计算t时刻点相对于t-1时刻点负荷的变化量D(d,t)=L(d,t)-L(d,t-1)和n天负荷变化量的平均值
Figure GDA0002574029830000111
Figure GDA0002574029830000112
步骤12:判断每天的负荷变化量是否超过阈值,即判断D(d,t)>λα(t)是否成立,若是,跳到步骤13,否则跳到步骤15。
其中,步骤10至步骤12对应步骤1-1。
步骤13:计算双向比较法的横向阈值
Figure GDA0002574029830000113
Figure GDA0002574029830000114
i=1,2,…,n,若满足
Figure GDA0002574029830000115
判断其为异常数据,跳到步骤14,否则跳到步骤15。
其中,步骤13对应步骤1-2。
步骤14:筛选出异常数据,统计异常数据的个数。
步骤15:统计判定为正常的数据,计算正常数据的平均值,作为异常数据的修正值。
步骤16:对步骤14筛选出的异常数据进行修正。
步骤17:判断第d天的数据修正是否完成,若是,则跳到步骤18,若否,则t+1,跳到步骤10。
其中,步骤14至步骤17分别对应步骤1-3至步骤1-6。
步骤18:判断n天的数据是否修正完成,若是,则跳到步骤19,若否,则d+1,跳到步骤10。
步骤19:输出修正后的数据,结束算法的Correct部分;
其中,步骤18至步骤19对应步骤1-7。
步骤20:利用步骤19中修正完成后的负荷数据和日平均温度数据、日期类型数据构成相似日特征向量,对n天的相似日特征向量进行k均值聚类,完成算法的Cluster部分。
步骤21:根据步骤20中的聚类结果,选择与待预测日同一类的日期的数据作为训练样本,利用PCA算法,对输入向量进行降维处理,完成算法的PCA部分。
其中,步骤20至步骤21分别对应步骤1-8至步骤1-9。
图3给出了本发明的参数寻优模块的Improved-PSO-LSSVM算法流程,该过程包括:
步骤30:初始化粒子群PSO算法的粒子群规模sizepop、参数C的搜索范围[Cmin,Cmax]、参数σ的搜索范围[σmin,σmax]、最大迭代次数maxgen、惯性因子参数w、加速参数c1和c2、速度上限参数vmax,交叉概率pc和变异概率pm
步骤31:在C和σ的搜索范围内初始化粒子的位置,将每个粒子的当前位置作为其个体历史最优位置Pid的初始值;
步骤32:将步骤31中粒子的初始化位置向量[C,σ]的坐标值分别作为LSSVM模型的惩罚因子C和核函数宽度参数σ,以步骤15中得到的Correct-Cluster-PCA算法处理后的数据作为输入,以历史负荷数据作为输出,计算预测负荷值与实际预测值之间的平均绝对误差作为适应度值;在每个粒子的个体历史最优位置中找出适应度值最小的位置作为群体最优位置Pgd
步骤33:在n+1次迭代时粒子的速度更新公式为:
Figure GDA0002574029830000121
Figure GDA0002574029830000122
位置更新公式为
Figure GDA0002574029830000123
分别按照速度更新公式和位置更新公式更新粒子的位置。
步骤34:按照适应度值的大小将粒子进行排序;
步骤35:选择适应度较好的粒子构成粒子池;
步骤36:按照一定的概率pc选择粒子池中的粒子作为父代粒子,进行交叉操作,子代粒子的速度更新公式为:
Figure GDA0002574029830000131
位置更新公式为:
Figure GDA0002574029830000132
步骤37:按照一定的概率pm对步骤3-6中得到的子代粒子执行变异操作,变异公式为X'i=Xi+rand×η。
步骤38:判断是否到达最大迭代次数或群体迄今搜索到的最优位置适应度值是否小于预设的阈值,若是,跳到步骤39,若否则返回步骤33继续执行。
步骤39:输出最优解[C,σ],位置坐标分别为LSSVM模型选择的最优惩罚因子C和核函数宽度参数σ,结束算法。
其中,步骤30至步骤39与步骤2-1至步骤2-9的对应关系本发明将不做赘述。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种基于LSSVM优化的负荷预测方法,其特征在于,包括以下步骤:
(1)在获取原始的历史负荷数据之后,利用双向比较法处理数据,甄别并修正其中的异常数据;然后以温度、日期类型、负荷数据构建特征向量,对特征向量进行k均值聚类,根据聚类效果,选择与待预测日数据特征相似度较高的日期的数据作为训练样本的输入变量;对输入变量进行主成分分析降维处理,去除冗余信息;
LSSVM负荷预测模型利用Correct-Cluster-PCA算法优化模型完成所述步骤(1),所述步骤(1)具体包括以下步骤:
步骤1-1、对于原始的n天历史负荷数据,从第d天的第2个时刻点开始,计算t时刻点相对于t-1时刻点负荷的变化量D(d,t)=L(d,t)-L(d,t-1)和n天负荷变化量的平均值
Figure FDA0002494643250000011
判断每天的负荷变化量是否超过阈值,即判断D(d,t)>λα(t)是否成立,若是,跳到步骤1-2,否则跳到步骤1-4,λ为修正因子常数,1≤d≤n,2≤t≤∞,L(d,t)为第d天第t时刻的负荷量;
步骤1-2、计算双向比较法的横向阈值
Figure FDA0002494643250000012
Figure FDA0002494643250000013
若待判定的负荷数据值满足
Figure FDA0002494643250000014
判断该待判定的负荷数据为异常数据,跳到步骤1-3,否则跳到步骤1-4;
步骤1-3、筛选出异常数据,统计异常数据的个数;
步骤1-4、统计判定为正常的数据,计算正常数据的平均值,作为异常数据的修正值;步
骤1-5、修正异常数据;
步骤1-6、判断第d天的数据修正是否完成,若是,则跳到步骤1-7,若否,则t+1,跳到步骤1-1;
步骤1-7、判断n天的数据是否修正完成,若是,则结束算法的Correct部分,若否,则d+1,跳到步骤1-1;
步骤1-8、利用步骤1-7中修正完成后的负荷数据和日平均温度数据、日期类型数据构成相似日特征向量,对n天的相似日特征向量进行k均值聚类,完成算法的Cluster部分;
步骤1-9、根据步骤1-8中的聚类结果,选择与待预测日同一类的日期的数据作为训练样本,利用PCA算法,即主成分分析法,对输入向量进行降维处理,完成算法的PCA部分;
(2)以LSSVM模型的惩罚因子C和核函数宽度参数σ,作为粒子群算法的粒子在搜索空间的位置坐标,将每次迭代过程中每个粒子的位置向量[C,σ]输入到LSSVM模型,并计算训练集的预测值和实际值的误差作为适应度;在迭代过程中选择适应度好的粒子作为父代粒子,进行交叉操作,然后对粒子的位置变量进行变异;选择使得适应度值最小的粒子坐标向量值[C,σ]作为粒子群算法的输出;
(3)利用步骤(1)中优化处理后的输入变量数据作为LSSVM模型的输入和输出,利用步骤(2)中得到的[C,σ]的坐标值C作为LSSVM模型的惩罚因子,坐标值σ作为LSSVM模型的核函数宽度参数,求解负荷预测回归方程,利用回归方程进行负荷预测。
2.根据权利要求1所述的负荷预测方法,其特征在于,在步骤(2)中,将经过步骤(1)优化处理后的输入变量数据作为步骤(2)中所述的训练集的输入输出。
3.根据权利要求1所述的负荷预测方法,其特征在于,所述的LSSVM模型利用Improved-PSO-LSSVM参数寻优算法找到模型最适宜的惩罚因子参数C和核函数宽度参数σ,步骤(2)具体包括以下步骤:
步骤2-1、初始化粒子群PSO算法的粒子群规模、参数C的搜索范围和参数σ的搜索范围、最大迭代次数maxgen、惯性因子参数w、加速参数c1和c2、速度上限参数vmax,交叉概率pc和变异概率pm;
步骤2-2、在C和σ的搜索范围内初始化粒子的位置,将每个粒子的当前位置作为其个体历史最优位置Pid
步骤2-3、将步骤2-2中粒子的初始化位置向量[C,σ]的坐标值分别作为LSSVM模型的惩罚因子C和核函数宽度参数σ,以步骤1-9中得到的Correct-Cluster-PCA算法处理后的数据作为输入,以历史负荷数据作为输出,计算预测负荷值与实际预测值之间的平均绝对误差作为适应度值;在每个粒子的个体历史最优位置中找出适应度值最小的位置作为群体最优位置Pgd
步骤2-4、在第n+1次迭代时粒子的速度更新公式为:
Figure FDA0002494643250000021
Figure FDA0002494643250000022
位置更新公式为
Figure FDA0002494643250000023
分别按照速度更新公式和位置更新公式更新粒子的位置,式中,
Figure FDA0002494643250000024
为第n次迭代时粒子的速度,
Figure FDA0002494643250000025
为第n次迭代时粒子的位置,w为第n次迭代时粒子的惯性因子常数,
Figure FDA0002494643250000026
为第n次迭代时粒子的个体最优位置,
Figure FDA0002494643250000027
为第n次迭代时粒子的群体最优位置,c1、c2为加速常数因子,r1、r2为取值范围为[0,1]的随机数;
步骤2-5、按照适应度值的大小将粒子进行排序;
步骤2-6、选择适应度好的粒子构成粒子池,按照概率pc选择粒子池中的粒子作为父代粒子,进行交叉操作,子代粒子的速度更新公式为:
Figure FDA0002494643250000028
位置更新公式为:
Figure FDA0002494643250000029
式中p为取值范围为[0,1]的随机数,parent1(Vi)、parent1(Xi)为父代粒子1的速度和位置,parent2(Vi)、parent2(Xi)分别为父代粒子2的速度和位置,child1(Vi)、child1(Xi)为子代粒子1的速度和位置,child2(Vi)、child2(Xi)为子代粒子2的速度和位置,式中i为微粒迭代的次数;
步骤2-7、按照概率pm对步骤2-6中得到的子代粒子执行变异操作,变异公式为Xi′=Xi+rand×η,式中rand为取值范围为[0,1]的随机数,η为与Xi同维的服从(0,1)标准正态分布的随机向量,Xi′为执行变异操作后粒子在空间中的位置,Xi为执行变异操作前粒子在空间中的位置;
步骤2-8、计算经过选择、交叉、变异后的粒子的适应度值,更新个体最优位置Pid和群体最优位置Pgd
步骤2-9、判断是否到达最大迭代次数或群体迄今搜索到的最优位置适应度值是否小于预设的阈值,若是,结束算法,若否则返回步骤2-4继续执行。
4.一种基于LSSVM优化的负荷预测***,其特征在于,包括:
训练样本处理单元,用于在获取原始的历史负荷数据之后,利用双向比较法处理数据,甄别并修正其中的异常数据;然后以温度、日期类型、负荷数据构建特征向量,对特征向量进行k均值聚类,根据聚类效果,选择与待预测日数据特征相似度较高的日期的数据作为训练样本的输入变量;对输入变量进行主成分分析降维处理,去除冗余信息;
所述训练样本处理单元,用于执行以下步骤:
步骤1-1、对于原始的n天历史负荷数据,从第d天的第2个时刻点开始,计算t时刻点相对于t-1时刻点负荷的变化量D(d,t)=L(d,t)-L(d,t-1)和n天负荷变化量的平均值
Figure FDA0002494643250000031
判断每天的负荷变化量是否超过阈值,即判断D(d,t)>λα(t)是否成立,若是,跳到步骤1-2,否则跳到步骤1-4,λ为修正因子常数,1≤d≤n,2≤t≤∞,L(d,t)为第d天第t时刻的负荷量;
步骤1-2、计算双向比较法的横向阈值
Figure FDA0002494643250000032
Figure FDA0002494643250000033
若待判定的负荷数据值满足
Figure FDA0002494643250000034
判断该待判定的负荷数据为异常数据,跳到步骤1-3,否则跳到步骤1-4;
步骤1-3、筛选出异常数据,统计异常数据的个数;
步骤1-4、统计判定为正常的数据,计算正常数据的平均值,作为异常数据的修正值;
步骤1-5、修正异常数据;
步骤1-6、判断第d天的数据修正是否完成,若是,则跳到步骤1-7,若否,则t+1,跳到步骤1-1;
步骤1-7、判断n天的数据是否修正完成,若是,则结束算法的Correct部分,若否,则d+1,跳到步骤1-1;
步骤1-8、利用步骤1-7中修正完成后的负荷数据和日平均温度数据、日期类型数据构成相似日特征向量,对n天的相似日特征向量进行k均值聚类,完成算法的Cluster部分;
步骤1-9、根据步骤1-8中的聚类结果,选择与待预测日同一类的日期的数据作为训练样本,利用PCA算法,即主成分分析法,对输入向量进行降维处理,完成算法的PCA部分;
模型参数确定单元,用于以LSSVM模型的惩罚因子C和核函数宽度参数σ,作为粒子群算法的粒子在搜索空间的位置坐标,将每次迭代过程中每个粒子的位置向量[C,σ]输入到LSSVM模型,并计算训练集的预测值和实际值的误差作为适应度;在迭代过程中选择适应度好的粒子作为父代粒子,进行交叉操作,然后对粒子的位置变量进行变异;选择使得适应度值最小的粒子坐标向量值[C,σ]作为粒子群算法的输出;
负荷预测单元,用于利用训练样本处理单元优化处理后的输入变量数据作为LSSVM模型的输入和输出,利用模型参数确定单元得到的[C,σ]的坐标值C作为LSSVM模型的惩罚因子,坐标值σ作为LSSVM模型的核函数宽度参数,求解负荷预测回归方程,利用回归方程进行负荷预测。
5.根据权利要求4所述的负荷预测***,其特征在于,将经过训练样本处理单元优化处理后的输入变量数据作为模型参数确定单元中所述的训练集的输入输出。
6.根据权利要求4所述的负荷预测***,其特征在于,所述模型参数确定单元,用于执行以下步骤:
步骤2-1、初始化粒子群PSO算法的粒子群规模、参数C的搜索范围和参数σ的搜索范围、最大迭代次数maxgen、惯性因子参数w、加速参数c1和c2、速度上限参数vmax,交叉概率pc和变异概率pm;
步骤2-2、在C和σ的搜索范围内初始化粒子的位置,将每个粒子的当前位置作为其个体历史最优位置Pid
步骤2-3、将步骤2-2中粒子的初始化位置向量[C,σ]的坐标值分别作为LSSVM模型的惩罚因子C和核函数宽度参数σ,以步骤1-9中得到的Correct-Cluster-PCA算法处理后的数据作为输入,以历史负荷数据作为输出,计算预测负荷值与实际预测值之间的平均绝对误差作为适应度值;在每个粒子的个体历史最优位置中找出适应度值最小的位置作为群体最优位置Pgd
步骤2-4、在第n+1次迭代时粒子的速度更新公式为:
Figure FDA0002494643250000041
Figure FDA0002494643250000042
位置更新公式为
Figure FDA0002494643250000043
分别按照速度更新公式和位置更新公式更新粒子的位置,式中,
Figure FDA0002494643250000044
为第n次迭代时粒子的速度,
Figure FDA0002494643250000045
为第n次迭代时粒子的位置,w为第n次迭代时粒子的惯性因子常数,
Figure FDA0002494643250000046
为第n次迭代时粒子的个体最优位置,
Figure FDA0002494643250000047
为第n次迭代时粒子的群体最优位置,c1、c2为加速常数因子,r1、r2为取值范围为[0,1]的随机数;
步骤2-5、按照适应度值的大小将粒子进行排序;
步骤2-6、选择适应度好的粒子构成粒子池,按照概率pc选择粒子池中的粒子作为父代粒子,进行交叉操作,子代粒子的速度更新公式为:
Figure FDA0002494643250000048
位置更新公式为:
Figure FDA0002494643250000051
式中p为取值范围为[0,1]的随机数,parent1(Vi)、parent1(Xi)为父代粒子1的速度和位置,parent2(Vi)、parent2(Xi)分别为父代粒子2的速度和位置,child1(Vi)、child1(Xi)为子代粒子1的速度和位置,child2(Vi)、child2(Xi)为子代粒子2的速度和位置,式中i为微粒迭代的次数;
步骤2-7、按照概率pm对步骤2-6中得到的子代粒子执行变异操作,变异公式为Xi′=Xi+rand×η,式中rand为取值范围为[0,1]的随机数,η为与Xi同维的服从(0,1)标准正态分布的随机向量,Xi′为执行变异操作后粒子在空间中的位置,Xi为执行变异操作前粒子在空间中的位置;
步骤2-8、计算经过选择、交叉、变异后的粒子的适应度值,更新个体最优位置Pid和群体最优位置Pgd
步骤2-9、判断是否到达最大迭代次数或群体迄今搜索到的最优位置适应度值是否小于预设的阈值,若是,结束算法,若否则返回步骤2-4继续执行。
CN201710767106.8A 2017-08-30 2017-08-30 一种基于lssvm优化的负荷预测方法及*** Expired - Fee Related CN107506865B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710767106.8A CN107506865B (zh) 2017-08-30 2017-08-30 一种基于lssvm优化的负荷预测方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710767106.8A CN107506865B (zh) 2017-08-30 2017-08-30 一种基于lssvm优化的负荷预测方法及***

Publications (2)

Publication Number Publication Date
CN107506865A CN107506865A (zh) 2017-12-22
CN107506865B true CN107506865B (zh) 2020-09-08

Family

ID=60694376

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710767106.8A Expired - Fee Related CN107506865B (zh) 2017-08-30 2017-08-30 一种基于lssvm优化的负荷预测方法及***

Country Status (1)

Country Link
CN (1) CN107506865B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109034476B (zh) * 2018-07-27 2020-11-17 中南大学 一种高速铁路沿线极端风速大数据聚类预测方法
CN110322048B (zh) * 2019-05-31 2023-09-26 南京航空航天大学 一种生产物流输送装备故障预警方法
CN110674947B (zh) * 2019-09-02 2021-02-19 三峡大学 基于Stacking集成框架的光谱特征变量选择与优化方法
CN110837857A (zh) * 2019-10-31 2020-02-25 杭州中恒云能源互联网技术有限公司 工业用电负荷预测方法、***及其存储介质
CN111598255A (zh) * 2020-04-27 2020-08-28 同济大学 一种磁浮列车悬浮间隙传感器齿槽效应的补偿方法
CN112541296A (zh) * 2020-07-22 2021-03-23 华北电力大学(保定) 一种基于pso-lssvm的so2预测方法
CN112417363B (zh) * 2020-11-11 2022-06-24 深圳供电局有限公司 一种变电站的负载分析方法及***
CN112686571B (zh) * 2021-01-12 2023-01-20 山东电力工程咨询院有限公司 基于动态自适应建模的综合智慧能源优化调度方法及***
CN113177597A (zh) * 2021-04-30 2021-07-27 平安国际融资租赁有限公司 模型训练数据确定方法、检测模型训练方法、装置及设备
CN113516291A (zh) * 2021-05-24 2021-10-19 国网河北省电力有限公司经济技术研究院 电力负荷预测方法、装置及设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106503788A (zh) * 2016-10-28 2017-03-15 中国矿业大学 基于自适应粒子群的最小二乘支持向量机预测方法
CN106529124A (zh) * 2016-10-14 2017-03-22 云南电网有限责任公司昆明供电局 基于主成分分析与支持向量机的变压器绝缘状态评估方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160203419A1 (en) * 2013-03-09 2016-07-14 Bigwood Technology, Inc. Metaheuristic-guided trust-tech methods for global unconstrained optimization

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106529124A (zh) * 2016-10-14 2017-03-22 云南电网有限责任公司昆明供电局 基于主成分分析与支持向量机的变压器绝缘状态评估方法
CN106503788A (zh) * 2016-10-28 2017-03-15 中国矿业大学 基于自适应粒子群的最小二乘支持向量机预测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
基于最小二乘支持向量机的短期负荷预测;龚文龙;《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》;20150415(第2015/04期);第29,32-35,39页,图4.1,图4.2 *
改进的遗传粒子群混合优化算法;陈璐璐 等;《计算机工程与设计》;20170228;第38卷(第2期);395-399 *
电力***短期负荷预测建模仿真研究;王惠中 等;《计算机仿真》;20160229;第33卷(第2期);第176-178页,图2 *

Also Published As

Publication number Publication date
CN107506865A (zh) 2017-12-22

Similar Documents

Publication Publication Date Title
CN107506865B (zh) 一种基于lssvm优化的负荷预测方法及***
CN111861013B (zh) 一种电力负荷预测方法及装置
CN109861211B (zh) 一种基于数据驱动的配电网动态重构方法
CN113449919B (zh) 一种基于特征和趋势感知的用电量预测方法及***
CN110987436B (zh) 基于激励机制的轴承故障诊断方法
CN111738477A (zh) 基于深层特征组合的电网新能源消纳能力预测方法
CN114492279A (zh) 一种模拟集成电路的参数优化方法及***
CN112540849A (zh) 一种分布式计算作业的参数配置优化方法及***
CN112990420A (zh) 一种用于卷积神经网络模型的剪枝方法
CN115578248A (zh) 一种基于风格引导的泛化增强图像分类算法
CN113139570A (zh) 一种基于最优混合估值的大坝安全监测数据补全方法
CN116187835A (zh) 一种基于数据驱动的台区理论线损区间估算方法及***
CN113743538A (zh) 基于ipso-bp神经网络的智能楼宇能耗预测方法、设备和介质
CN113935557A (zh) 一种基于深度学习的相同模式能耗大数据预测方法
CN111985845A (zh) 一种异构Spark集群的节点优先级调优方法
CN109492816B (zh) 一种基于混合智能的煤与瓦斯突出动态预测方法
CN115277354A (zh) 一种面向指挥控制网络管理***的故障检测方法
Bi et al. Self-adaptive Teaching-learning-based Optimizer with Improved RBF and Sparse Autoencoder for Complex Optimization Problems
CN113033898A (zh) 基于k均值聚类与bi-lstm神经网络的电负荷预测方法及***
CN112364098A (zh) 一种基于Hadoop的分布式电力***异常数据识别方法及***
CN111027760A (zh) 一种基于最小二乘向量机的电力负荷预测方法
CN113762591B (zh) 一种基于gru和多核svm对抗学习的短期电量预测方法及***
CN115619028A (zh) 一种基于聚类算法融合的电力负荷精准预测方法
CN106960260B (zh) 一种便于电力调度的风电功率预测***
CN112749211B (zh) 一种基于电力大数据的茶叶产量预测新方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20200908

Termination date: 20210830

CF01 Termination of patent right due to non-payment of annual fee