CN111027229B - 基于稀疏异方差多样条回归的风功率曲线拟合的方法 - Google Patents

基于稀疏异方差多样条回归的风功率曲线拟合的方法 Download PDF

Info

Publication number
CN111027229B
CN111027229B CN201911367126.1A CN201911367126A CN111027229B CN 111027229 B CN111027229 B CN 111027229B CN 201911367126 A CN201911367126 A CN 201911367126A CN 111027229 B CN111027229 B CN 111027229B
Authority
CN
China
Prior art keywords
spline
regression
sparse
heteroscedastic
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911367126.1A
Other languages
English (en)
Other versions
CN111027229A (zh
Inventor
汪运
邹润民
李意芬
杨佳欣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University
Original Assignee
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University filed Critical Central South University
Priority to CN201911367126.1A priority Critical patent/CN111027229B/zh
Publication of CN111027229A publication Critical patent/CN111027229A/zh
Application granted granted Critical
Publication of CN111027229B publication Critical patent/CN111027229B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Mathematics (AREA)
  • Algebra (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Wind Motors (AREA)

Abstract

本发明提供了一种基于稀疏异方差多样条回归的风功率曲线拟合的方法,包括:采用模糊C均值算法自动检测异常点,针对原始风电数据获取去除异常点的数据;根据获取到的数据构建稀疏异方差多样条回归模型;采用变分贝叶斯方法对构建的稀疏异方差多样条回归模型进行优化,得到模型中所有参数的后验分布情况及参数公式;初始化模型参数,根据模型中所有参数的后验分布情况及参数公式,利用迭代的方法,求出参数的估计值。本发明所提供的基于稀疏异方差多样条回归的风功率曲线拟合的方法综合了多个样条基函数,增加了模型的非线性拟合能力,避免了冗余信息对最终回归结果的影响。

Description

基于稀疏异方差多样条回归的风功率曲线拟合的方法
技术领域
本发明涉及新能源领域和统计领域,特别涉及一种基于稀疏异方差多样条回归的风功率曲线拟合的方法。
背景技术
新能源的开发和利用成为解决世界性能源短缺和环境污染问题的重要途径。风能作为一种清洁、对环境友好且取之不尽用之不竭的可再生能源受到了越来越多的关注。一个准确的风功率曲线在风能的广泛应用中起到重要的作用。
通常,风机的生产厂商给自己生产的风机提供相应的理论功率曲线。这些理论的功率曲线一般是在固定的空气密度下得到的。然而,气候环境会随着时间和地理位置的不同而发生变化。因此,同一台风机在不同的季节和不同的风场中的性能都是有差异的。所以有必要从实际的数据中挖掘出反映风机实际性能的真实的功率曲线。根据建模理论,功率曲线的建模方法可以分成两大类,即曲线拟合方法和基于人工智能的方法。
曲线拟合模型通常的形状是S型,通常也可以分成两类:截断的曲线拟合模型和完整的曲线拟合模型。分段的曲线拟合模型包括线性分段模型、多项式模型、基于Sigmoid函数和高斯累计分布函数的风功率曲线模型。而完整的曲线拟合模型主要包括三参数逻辑函数(3-PLF)、四参数逻辑函数(4-PLF)、五参数逻辑函数(5-PLF)、六参数逻辑函数(6-PLF)以及修正的双曲正切模型(MHTan)。对于基于人工智能的方法来说,它们可以自动地学习处风速与功率之间的复杂非线性关系。比较流行的方法包括支持向量机(SVM)、高斯过程(GP)、极限学习机(ELM)、基于样条回归的模型、自适应神经模糊推理***(ANFIS)、单调回归模型以及copula模型等。
当前,很多学者提出一些其他策略来增加功率曲线拟合精度。首先,提高数据质量。在开放环境下,收集到的数据中包含很多不确定性,如异常点和缺失数据。这些不确定性都会影响到功率曲线模型的训练。为了处理风电数据中的异常点,常用的方法有基于聚类的方法(如模糊C均值聚类和K均值聚类)和基于统计的方法(如3sigma原则等)。其次,开发新的考虑风功率了曲线拟合任务的相关特性的功率曲线拟合新方法。目前,已有一些文献发现功率曲线拟合任务的一些特性,如拟合误差的异方差特性以及复杂的非高斯特性,但并没有讨论考虑不同特性模型之间的差异性。根据发现的任务特性,学者们提出了异方差样条回归(HSRM)、鲁棒样条回归(RSRM)、基于混合非对称高斯分布的非对称样条回归(MoAG-ASR)以及基于混合非对称指数幂分布的非对称样条回归(MoAEP-ASR)。
在实际中,由于气候环境的复杂性,真实的功率曲线也将会很复杂。在此种情况下,真实的功率曲线很难用单一模型充分地描述。因此,开发具有超强非线性拟合能力的模型有助于得到更加精确的风功率曲线。另外,也需要考虑在模型中嵌入功率曲线任务的特性。这样才能构建解决特定问题的人工智能方法,并且需要对比考虑不同功率曲线拟合任务下模型的性能差异性,分析出哪种任务特性更适合于所研究的任务。
发明内容
本发明提供了一种基于稀疏异方差多样条回归的风功率曲线拟合的方法,其目的是为了解决现有功率曲线拟合的两大缺陷,导致功率曲线拟合精度较低误差较大的问题。
为了达到上述目的,本发明的实施例提供了一种基于稀疏异方差多样条回归的风功率曲线拟合的方法,包括:
步骤1,采用模糊C均值算法自动检测异常点,针对原始风电数据获取去除异常点的数据;
步骤2,根据获取到的数据构建稀疏异方差多样条回归模型,具体包括:
给定N个输入数据{xi}i=1,…,N,根据不同的样条基函数以及不同的节点数,可计算K个样条基函数矩阵H1,H2,…,HK;在上述矩阵中,得到的映射特征的维度分别为M1,…,MK
利用如下公式将基函数矩阵转化成维度相同的矩阵:
Figure GDA0003311217840000031
其中,
Figure GDA0003311217840000032
表示的是一个
Figure GDA0003311217840000033
的0矩阵,
Figure GDA0003311217840000034
所述稀疏异方差多样条回归模型为:
Figure GDA0003311217840000035
其中,yi表示与输入xi相对应的真实输出,εi表示回归误差,ω=[ω1,…,ωK]T表示的是所有样条基函数矩阵的权重向量,
Figure GDA0003311217840000036
表示的是回归系数,
Figure GDA0003311217840000037
表示的是矩阵
Figure GDA0003311217840000038
的第i行;
且所述稀疏异方差多样条回归模型可用如下矩阵形式表示,
Figure GDA0003311217840000039
其中
Figure GDA00033112178400000310
表示的是一个
Figure GDA00033112178400000311
的矩阵,ωk表示第k个样条基函数矩阵的权重,Y=[y1,…,yN]T表示的是输出向量,ε=[ε1,…,εN]T表示的是回归误差向量;
步骤3,采用变分贝叶斯方法对构建的稀疏异方差多样条回归模型进行优化,得到模型中所有参数的后验分布情况及参数公式;
步骤4,初始化模型参数,根据模型中所有参数的后验分布情况及参数公式,利用迭代的方法,求出参数的估计值。
其中,所述步骤1具体包括:
步骤11,利用模糊C均值将数据分成T个类,在第t类的第i个样本可表示为
Figure GDA00033112178400000312
Nt表示第t类中所有样本的个数,且
Figure GDA00033112178400000313
步骤12,针对每一类中所有的样本分别求取均值和协方差,在第t个样本中,均值和协方差分别表示为μt,∑t
步骤13,在第t个样本中,计算均值μt和样本
Figure GDA00033112178400000314
之间的马氏距离
Figure GDA00033112178400000315
Figure GDA00033112178400000316
步骤14,如果
Figure GDA00033112178400000317
的值大于给定的阈值,样本
Figure GDA00033112178400000318
将被视为异常点,否则将被视为正常样本。
其中,所述步骤2还包括:
给定样条基函数矩阵的权重向量ω和回归系数β稀疏贝叶斯先验,对有效映射特征和样条基函数或矩阵的自动选择;
Figure GDA0003311217840000041
Figure GDA0003311217840000042
Figure GDA0003311217840000043
ηk~G(ηk|d0,e0)
其中,N(·)和G(·)分别表示的是高斯分布和Gamma分布的概率密度函数,βm表示与第m个特征相对应的回归系数,
Figure GDA0003311217840000044
Figure GDA0003311217840000045
表示的是高斯分布的方差,b0,c0,d0,e0表示的是Gamma分布的参数;
回归误差εi满足如下先验分布:
Figure GDA0003311217840000046
γi~G(γi|f0,g0)
其中
Figure GDA0003311217840000047
表示的是高斯分布的方差,f0,g0表示的是Gamma分布的参数。
其中,所述步骤3具体包括:
根据变分贝叶斯的相关理论,得到模型中所有参数的后验分布,回归系数β的后验分布q(β)为多维高斯分布,
q(β)=N(β|μβ,∑β)
其中,μβ,∑β分别表示多维高斯分布的均值和协方差,它们的表达式为
Figure GDA0003311217840000048
Figure GDA0003311217840000049
其中,<·>表示的是求期望运算,
Figure GDA00033112178400000410
是一个
Figure GDA00033112178400000411
的矩阵,
Figure GDA00033112178400000412
diag(·)用来产生对角矩阵的函数;
参数
Figure GDA00033112178400000413
的后验分布
Figure GDA00033112178400000414
是一个Gamma分布
Figure GDA00033112178400000415
其中Gamma分布参数
Figure GDA00033112178400000416
的迭代公式为
Figure GDA0003311217840000051
Figure GDA0003311217840000052
参数ω的后验分布q(ω)也是一个多维高斯分布,
q(ω)=N(ω|μω,∑ω)
其中μω,∑ω分别表示多维高斯分布的均值和协方差,它们的表达式为
Figure GDA0003311217840000053
Figure GDA0003311217840000054
其中,B=diag(<η1>,…,<ηK>)。对于参数ηk和γi,它们的后验分布都是Gamma分布,
q(ηk)=G(ηk|dηk,eηk)
q(γi)=G(γi|fγi,gγi)
其中,参数dηk,eηk,fγi,gγi的迭代公式分别为
Figure GDA0003311217840000055
Figure GDA0003311217840000056
Figure GDA0003311217840000057
Figure GDA0003311217840000058
本发明的上述方案有如下的有益效果:
本发明的上述实施例所述的基于稀疏异方差多样条回归的风功率曲线拟合的方法综合了多个样条基函数,增加了模型的非线性拟合能力,通过给定样条基函数权重系数和回归系数的稀疏先验,可以实现对样条基函数和映射特征的自适应选择,避免了冗余信息对最终回归结果的影响,在多样条回归模型的基础上嵌入了风功率曲线拟合的异方差特性,从而构建适用于风功率曲线拟合的特性机器学习方法。
附图说明
图1为本发明的步骤1的数据处理结果;
图2为本发明的模型SHMSRM-G拟合的功率曲线;
图3为本发明的模型SHMSRM-G中回归系数和样条基函数权重值;
图4为本发明的基于稀疏异方差多样条回归的风功率曲线拟合的方法的流程示意图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
本发明针对现有的功率曲线拟合的两大缺陷,导致功率曲线拟合精度较低误差较大的问题,提供了一种基于稀疏异方差多样条回归的风功率曲线拟合的方法。
如图4所示,本发明的实施例提供了一种基于稀疏异方差多样条回归的风功率曲线拟合的方法,包括:
步骤1,采用模糊C均值算法自动检测异常点,针对原始风电数据获取去除异常点的数据;
步骤2,根据获取到的数据构建稀疏异方差多样条回归模型,具体包括:
给定N个输入数据{xi}i=1,…,N,根据不同的样条基函数以及不同的节点数,可计算K个样条基函数矩阵H1,H2,…,HK;在上述矩阵中,得到的映射特征的维度分别为M1,…,MK
利用如下公式将基函数矩阵转化成维度相同的矩阵:
Figure GDA0003311217840000061
其中,
Figure GDA0003311217840000062
Figure GDA0003311217840000063
表示的是一个
Figure GDA0003311217840000064
的0矩阵,
Figure GDA0003311217840000065
所述稀疏异方差多样条回归模型为:
Figure GDA0003311217840000071
其中,yi表示与输入xi相对应的真实输出,εi表示回归误差,ω=[ω1,…,ωK]T表示的是所有样条基函数矩阵的权重向量,
Figure GDA0003311217840000072
表示的是回归系数,
Figure GDA0003311217840000073
表示的是矩阵
Figure GDA0003311217840000074
的第i行;
且所述稀疏异方差多样条回归模型可用如下矩阵形式表示,
Figure GDA0003311217840000075
其中,
Figure GDA0003311217840000076
表示的是一个
Figure GDA0003311217840000077
的矩阵,ωk表示第k个样条基函数矩阵的权重,Y=[y1,…,yN]T表示的是输出向量,ε=[ε1,…,εN]T表示的是回归误差向量;
步骤3,采用变分贝叶斯方法对构建的稀疏异方差多样条回归模型进行优化,得到模型中所有参数的后验分布情况及参数公式;
步骤4,初始化模型参数,根据模型中所有参数的后验分布情况及参数公式,利用迭代的方法,求出参数的估计值。
其中,所述步骤1为数据预处理,具体包括:
步骤11,利用模糊C均值将数据分成T个类,在第t类的第i个样本可表示为
Figure GDA0003311217840000078
Nt表示第t类中所有样本的个数,且
Figure GDA0003311217840000079
步骤12,针对每一类中所有的样本分别求取均值和协方差,在第t个样本中,均值和协方差分别表示为μt,∑t
步骤13,在第t个样本中,计算均值μt和样本
Figure GDA00033112178400000710
之间的马氏距离
Figure GDA00033112178400000711
Figure GDA00033112178400000712
步骤14,如果
Figure GDA00033112178400000713
的值大于给定的阈值,样本
Figure GDA00033112178400000714
将被视为异常点,否则将被视为正常样本;最后,针对原始风电数据我们获得了去除异常点以后的处理后的数据。
尽管上述模型中考虑了多个样条回归模型,模型在理论上具有很强的非线性拟合能力。然而,冗余的映射特征和样条基函数或矩阵会对最终的模型性能产生影响。其中,所述步骤2还包括:给定样条基函数矩阵的权重向量ω和回归系数β稀疏贝叶斯先验,从而可以自动地实现对有效映射特征和样条基函数或矩阵的自动选择;给定参数ω和β如下贝叶斯先验:
Figure GDA0003311217840000081
Figure GDA0003311217840000082
Figure GDA0003311217840000083
ηk~G(ηk|d0,e0)
其中,N(·)和G(·)分别表示的是高斯分布和Gamma分布的概率密度函数,βm表示与第m个特征相对应的回归系数,
Figure GDA0003311217840000084
Figure GDA0003311217840000085
表示的是高斯分布的方差,b0,c0,d0,e0表示的是Gamma分布的参数;
其中,考虑使用高斯分布假设来将风功率曲线拟合任务的异方差特性嵌入到回归模型当中,回归误差εi满足如下先验分布:
Figure GDA0003311217840000086
γi~G(γi|f0,g0)
其中
Figure GDA0003311217840000087
表示的是高斯分布的方差,f0,g0表示的是Gamma分布的参数。从上述公式可以看出,对于不同的样本,其误差满足参数不同的高斯分布。这也就意味着回归误差是异方差的。基于上述模型参数的先验分布,本发明构建了稀疏异方差多样条回归模型。
其中,所述步骤3为利用变分贝叶斯方法优化模型参数,具体包括:
根据变分贝叶斯的相关理论,得到模型中所有参数的后验分布,回归系数β的后验分布q(β)为多维高斯分布,
q(β)=N(β|μβ,∑β)
其中,μβ,∑β分别表示多维高斯分布的均值和协方差,它们的表达式为
Figure GDA0003311217840000088
Figure GDA0003311217840000089
其中,<·>表示的是求期望运算,
Figure GDA00033112178400000810
是一个
Figure GDA0003311217840000091
的矩阵,
Figure GDA0003311217840000092
diag(·)用来产生对角矩阵的函数;
参数
Figure GDA0003311217840000093
的后验分布
Figure GDA0003311217840000094
是一个Gamma分布
Figure GDA0003311217840000095
其中Gamma分布参数
Figure GDA0003311217840000096
的迭代公式为
Figure GDA0003311217840000097
Figure GDA0003311217840000098
参数ω的后验分布q(ω)也是一个多维高斯分布,
q(ω)=N(ω|μω,∑ω)
其中μω,∑ω分别表示多维高斯分布的均值和协方差,它们的表达式为
Figure GDA0003311217840000099
Figure GDA00033112178400000910
其中,B=diag(<η1>,…,<ηK>)。对于参数ηk和γi,它们的后验分布都是Gamma分布,
q(ηk)=G(ηk|dηk,eηk)
q(γi)=G(γi|fγi,gγi)
其中,参数dηk,eηk,fγi,gγi的迭代公式分别为
Figure GDA00033112178400000911
Figure GDA00033112178400000912
Figure GDA00033112178400000913
Figure GDA00033112178400000914
其中,所述步骤4为迭代优化参数,初始化模型参数,根据步骤三中得出的后验分布及参数公式,利用迭代的方法,求出参数ω和β的估计值μω和μβ
本发明的上述实施例所述的基于稀疏异方差多样条回归的风功率曲线拟合的方法综合了多个样条基函数,增加了模型的非线性拟合能力,通过给定样条基函数权重系数和回归系数的稀疏先验,可以实现对样条基函数和映射特征的自适应选择,避免了冗余信息对最终回归结果的影响,在多样条回归模型的基础上嵌入了风功率曲线拟合的异方差特性,从而构建适用于风功率曲线拟合的特性机器学习方法。
本发明利用两个风电场的数据(数据集A和数据集B)对上述方法进行验证。每个数据集中只包含两个变量,风速和风功率。在数据集A中,5000个样本作为训练集,1000个样本作为测试集。数据集B中,训练集和测试集的样本个数分别为4500和1000。为了说明模型性能的有效性,本发明中采用的14个对比模型,包括3-PLF,4-PLF、5-PLF、6-PLF、MHTan、GP、SVM、ELM、ANFIS、SRM、HSRM、RSRM、MoAG-ASR和MoAEP-ASR。所采用的误差指标为平均绝对误差(MAE)、均方根误差(RMSE)和标准化的平均绝对百分比误差(NMAPE)。
对于本发明所提出的稀疏异方差多样条回归模型,主要考虑两种样条基函数,即B样条基和截断幂基。考虑的节点个数为{2,4,…,20}。从而产生了20个样条基函数矩阵。另外,参数b0,c0,do,e0,fo,g0,h0,i0,r0,s0的初始化参数值都为0.001。模型的最大迭代次数设置为50。
首先,利用基于模糊C均值的方法对原始数据进行处理。在这里,设定聚类的个数为5,阈值为15。根据数据预处理的相关描述,处理后的数据如图1所示。从图中可以看出,比较明显的异常点都被去除了。
利用上述处理后的数据训练所有功率曲线模型,所有模型在测试集上的结果如表1所示。
表1不同功率曲线模型在不同数据集上的拟合结果
Figure GDA0003311217840000101
Figure GDA0003311217840000111
从表1的结果可以看出,通常情况下基于人工智能技术的功率曲线拟合方法比完整的曲线拟合方法的效果要好。在数据集A中,最优的曲线拟合方法为5-PLF。在数据集B中,最优的曲线拟合方法为6-PLF。在数据集A和数据集B中,最优的人工智能方法为本发明所提出的模型SHMSRM-G。在所有的模型当中,本发明所提出的模型的拟合效果都是最好的。
在所有基于人工智能的方法中,SVM、GP、ELM和ANFIS并没有考虑风功率曲线拟合任务的特性,HSRM、RSRM、MoAG-ASR、MoAEP-ASR和SHMSRM-G都考虑了风功率曲线拟合任务的特性。从表1中的实验结果可以看出,一般情况下考虑了任务特性的方法的拟合效果要优于没有考虑任务特性的方法。
模型SHMSRM-G与HSRM的区别主要在于SHMSRM-G考虑了多个样条回归模型的拟合性能,而HSRM模型只考虑了单个样条回归模型。SHMSRM-G的功率曲线拟合效果优于HSRM的主要是因为多个样条回归模型的非线性拟合能力要强于单个样条回归模型。模型SHMSRM-G与RSRM、MoAG-ASR和MoAEP-ASR的区别体现在两方面:(1)前者考虑了多个样条回归模型,提升了非线性拟合能力,而后者只用了单个样条回归模型;(2)前者从个体的拟合误差的差异性出发,考虑了功率曲线拟合误差的异方差特性,后者从拟合误差的整体视角出发,考虑了拟合误差的非高斯特性。从表1也可以看出,由于上述两个原因,本发明提出的SHMSRM-G也优于RSRM、MoAG-ASR和MoAEP-ASR。
如图2所示,从效果来看,该模型可以很好地拟合风电数据,从而可以准确地描述风机发电特性。
如图3所示,很多值接近于0,意味着该项映射特征或者样条基函数对最终的回归结果影响较小。这也从侧面证明了稀疏贝叶斯先验确实能使得参数值稀疏;综上所述,本发明所提出的模型SHMSRM-G在功率曲线拟合任务中取得了良好的拟合效果。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (4)

1.一种基于稀疏异方差多样条回归的风功率曲线拟合的方法,其特征在于,包括:
步骤1,采用模糊C均值算法自动检测异常点,针对原始风电数据获取去除异常点的数据;
步骤2,根据获取到的数据构建稀疏异方差多样条回归模型,具体包括:
给定
Figure 717368DEST_PATH_IMAGE001
个输入数据
Figure 241890DEST_PATH_IMAGE002
,根据不同的样条基函数以及不同的节点数,可计算
Figure 28843DEST_PATH_IMAGE003
个样条基函数矩阵
Figure 31434DEST_PATH_IMAGE004
;在上述矩阵中,得到的映射特征的维度分别为
Figure 85977DEST_PATH_IMAGE005
利用如下公式将基函数矩阵转化成维度相同的矩阵:
Figure 46980DEST_PATH_IMAGE006
其中,
Figure 554185DEST_PATH_IMAGE007
Figure 360467DEST_PATH_IMAGE008
表示的是一个
Figure 269517DEST_PATH_IMAGE009
的0矩阵,
Figure 135842DEST_PATH_IMAGE010
所述稀疏异方差多样条回归模型为:
Figure 130343DEST_PATH_IMAGE011
其中,
Figure 740316DEST_PATH_IMAGE012
表示与输入
Figure 270916DEST_PATH_IMAGE013
相对应的真实输出,
Figure 308143DEST_PATH_IMAGE014
表示回归误差,
Figure 789939DEST_PATH_IMAGE015
表示的是所有样条基函数矩阵的权重向量,
Figure 938024DEST_PATH_IMAGE016
表示的是回归系数,
Figure 821666DEST_PATH_IMAGE017
表示的是矩阵
Figure 29794DEST_PATH_IMAGE018
的第
Figure 998887DEST_PATH_IMAGE019
行;
且所述稀疏异方差多样条回归模型可用如下矩阵形式表示,
Figure 685083DEST_PATH_IMAGE020
其中,
Figure 688811DEST_PATH_IMAGE021
表示的是一个
Figure 333419DEST_PATH_IMAGE022
的矩阵,
Figure 25694DEST_PATH_IMAGE023
表示第
Figure 781160DEST_PATH_IMAGE024
个样条基函数矩阵的权重,
Figure 108236DEST_PATH_IMAGE025
表示的是输出向量,
Figure 923746DEST_PATH_IMAGE026
表示的是回归误差向量;
步骤3,采用变分贝叶斯方法对构建的稀疏异方差多样条回归模型进行优化,得到模型中所有参数的后验分布情况及参数公式;
步骤4,初始化模型参数,根据模型中所有参数的后验分布情况及参数公式,利用迭代的方法,求出参数的估计值。
2.根据权利要求1所述的基于稀疏异方差多样条回归的风功率曲线拟合的方法,其特征在于,所述步骤1具体包括:
步骤11,利用模糊C均值将数据分成T个类,在第
Figure 601852DEST_PATH_IMAGE027
类的第
Figure 161009DEST_PATH_IMAGE019
个样本可表示为
Figure 873750DEST_PATH_IMAGE028
Figure 329002DEST_PATH_IMAGE029
表示第
Figure 494404DEST_PATH_IMAGE027
类中所有样本的个数,且
Figure 591673DEST_PATH_IMAGE030
步骤12,针对每一类中所有的样本分别求取均值和协方差,在第
Figure 925965DEST_PATH_IMAGE027
个样本中,均值和协方差分别表示为
Figure 552118DEST_PATH_IMAGE031
步骤13,在第
Figure 470396DEST_PATH_IMAGE027
个样本中,计算均值
Figure 371356DEST_PATH_IMAGE032
和样本
Figure 527531DEST_PATH_IMAGE033
之间的马氏距离
Figure 855744DEST_PATH_IMAGE034
,即
Figure 730159DEST_PATH_IMAGE035
步骤14,如果
Figure 434810DEST_PATH_IMAGE034
的值大于给定的阈值,样本
Figure 976649DEST_PATH_IMAGE033
将被视为异常点,否则将被视为正常样本。
3.根据权利要求2所述的基于稀疏异方差多样条回归的风功率曲线拟合的方法,其特征在于,所述步骤2还包括:
给定样条基函数矩阵的权重向量
Figure 210185DEST_PATH_IMAGE036
和回归系数
Figure 338940DEST_PATH_IMAGE037
稀疏贝叶斯先验,对有效映射特征和样条基函数或矩阵的自动选择;
Figure 581702DEST_PATH_IMAGE038
Figure 712470DEST_PATH_IMAGE039
Figure 382485DEST_PATH_IMAGE040
Figure 28230DEST_PATH_IMAGE041
其中,
Figure 626747DEST_PATH_IMAGE042
Figure 143179DEST_PATH_IMAGE043
分别表示的是高斯分布和Gamma分布的概率密度函数,
Figure 984096DEST_PATH_IMAGE044
表示与第
Figure 320399DEST_PATH_IMAGE045
个特征相对应的回归系数,
Figure 904964DEST_PATH_IMAGE046
Figure 10323DEST_PATH_IMAGE047
表示的是高斯分布的方差,
Figure 22142DEST_PATH_IMAGE048
表示的是Gamma分布的参数;
回归误差
Figure 580162DEST_PATH_IMAGE049
满足如下先验分布:
Figure 968418DEST_PATH_IMAGE050
Figure 928284DEST_PATH_IMAGE051
其中
Figure 612468DEST_PATH_IMAGE052
表示的是高斯分布的方差,
Figure 188943DEST_PATH_IMAGE053
表示的是Gamma分布的参数。
4.根据权利要求3所述的基于稀疏异方差多样条回归的风功率曲线拟合的方法,其特征在于,所述步骤3具体包括:
根据变分贝叶斯的相关理论,得到模型中所有参数的后验分布,回归系数
Figure 849732DEST_PATH_IMAGE037
的后验分布
Figure 929683DEST_PATH_IMAGE054
为多维高斯分布,
Figure 548883DEST_PATH_IMAGE055
其中,
Figure 81496DEST_PATH_IMAGE056
分别表示多维高斯分布的均值和协方差,它们的表达式为
Figure 811554DEST_PATH_IMAGE057
Figure 480433DEST_PATH_IMAGE058
其中,
Figure 270535DEST_PATH_IMAGE059
表示的是求期望运算,
Figure 290443DEST_PATH_IMAGE060
是一个
Figure 60078DEST_PATH_IMAGE061
的矩阵,
Figure 114622DEST_PATH_IMAGE062
Figure 810046DEST_PATH_IMAGE063
用来产生对角矩阵的函数;
参数
Figure 317250DEST_PATH_IMAGE064
的后验分布
Figure 123532DEST_PATH_IMAGE065
是一个Gamma分布
Figure 298162DEST_PATH_IMAGE066
其中Gamma分布参数
Figure 898907DEST_PATH_IMAGE067
的迭代公式为
Figure 158987DEST_PATH_IMAGE068
Figure 503381DEST_PATH_IMAGE069
参数
Figure 532517DEST_PATH_IMAGE036
的后验分布
Figure 304164DEST_PATH_IMAGE070
也是一个多维高斯分布,
Figure 553005DEST_PATH_IMAGE071
其中
Figure 701089DEST_PATH_IMAGE072
分别表示多维高斯分布的均值和协方差,它们的表达式为
Figure 584732DEST_PATH_IMAGE073
Figure 58438DEST_PATH_IMAGE074
其中
Figure 761952DEST_PATH_IMAGE075
,对于参数
Figure 713728DEST_PATH_IMAGE076
Figure 451877DEST_PATH_IMAGE077
,它们的后验分布都是Gamma分布,
Figure 830905DEST_PATH_IMAGE078
Figure 21715DEST_PATH_IMAGE079
其中参数
Figure 777182DEST_PATH_IMAGE080
的迭代公式分别为
Figure 136881DEST_PATH_IMAGE081
Figure 686811DEST_PATH_IMAGE082
Figure 630496DEST_PATH_IMAGE083
Figure 658495DEST_PATH_IMAGE084
CN201911367126.1A 2019-12-26 2019-12-26 基于稀疏异方差多样条回归的风功率曲线拟合的方法 Active CN111027229B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911367126.1A CN111027229B (zh) 2019-12-26 2019-12-26 基于稀疏异方差多样条回归的风功率曲线拟合的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911367126.1A CN111027229B (zh) 2019-12-26 2019-12-26 基于稀疏异方差多样条回归的风功率曲线拟合的方法

Publications (2)

Publication Number Publication Date
CN111027229A CN111027229A (zh) 2020-04-17
CN111027229B true CN111027229B (zh) 2021-12-07

Family

ID=70213807

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911367126.1A Active CN111027229B (zh) 2019-12-26 2019-12-26 基于稀疏异方差多样条回归的风功率曲线拟合的方法

Country Status (1)

Country Link
CN (1) CN111027229B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112612995B (zh) * 2021-03-08 2021-07-09 武汉理工大学 一种基于贝叶斯回归的多来源降雨数据融合算法及装置
CN113051769B (zh) * 2021-04-09 2022-09-30 中南大学 基于非对称损失与混合智能优化算法的功率曲线建模方法
CN117235449A (zh) * 2023-11-14 2023-12-15 湖北省气象服务中心(湖北省专业气象服务台) 基于sigmoid曲线及双包络算法的风电功率异常数据处理方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105939026A (zh) * 2016-05-27 2016-09-14 电子科技大学 基于混合Laplace分布的风电功率波动量概率分布模型建立方法
CN106351793A (zh) * 2015-07-17 2017-01-25 通用电气公司 用于改进风力发电的***和方法
CN106611243A (zh) * 2016-12-02 2017-05-03 华北电力大学(保定) 一种基于garch模型的风速预测残差修正方法
CN107657116A (zh) * 2017-09-26 2018-02-02 福州大学 一种风电场功率曲线仿射建模的方法
CN108090323A (zh) * 2018-01-10 2018-05-29 天津大学 基于无限混合高斯和样条回归的风电功率曲线拟合方法
CN108345961A (zh) * 2018-01-30 2018-07-31 上海电力学院 风电场群出力预测与分析方法
CN109002650A (zh) * 2018-08-21 2018-12-14 同济大学 一种风电机组功率曲线建模方法
CN109902340A (zh) * 2019-01-20 2019-06-18 东北电力大学 一种计及复杂气象耦合特性的多源-荷联合场景生成方法
CN110265996A (zh) * 2019-02-26 2019-09-20 国网吉林省电力有限公司 一种适于光伏/风电功率预测的时间特征尺度建模方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106351793A (zh) * 2015-07-17 2017-01-25 通用电气公司 用于改进风力发电的***和方法
CN105939026A (zh) * 2016-05-27 2016-09-14 电子科技大学 基于混合Laplace分布的风电功率波动量概率分布模型建立方法
CN106611243A (zh) * 2016-12-02 2017-05-03 华北电力大学(保定) 一种基于garch模型的风速预测残差修正方法
CN107657116A (zh) * 2017-09-26 2018-02-02 福州大学 一种风电场功率曲线仿射建模的方法
CN108090323A (zh) * 2018-01-10 2018-05-29 天津大学 基于无限混合高斯和样条回归的风电功率曲线拟合方法
CN108345961A (zh) * 2018-01-30 2018-07-31 上海电力学院 风电场群出力预测与分析方法
CN109002650A (zh) * 2018-08-21 2018-12-14 同济大学 一种风电机组功率曲线建模方法
CN109902340A (zh) * 2019-01-20 2019-06-18 东北电力大学 一种计及复杂气象耦合特性的多源-荷联合场景生成方法
CN110265996A (zh) * 2019-02-26 2019-09-20 国网吉林省电力有限公司 一种适于光伏/风电功率预测的时间特征尺度建模方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Wind Power Curve Modeling and Wind Power Forecasting With Inconsistent Data;Yun Wang,etc;《IEEE TRANSACTIONS ON SUSTAINABLE ENERGY》;20180328;第10卷(第1期);P16-25 *
Wind Turbine Power Curve Modeling with a Hybrid Machine Learning Technique;Shenglei Pei,Yifen Li;《Applied sciences》;20191116;第9卷(第22期);P1-18 *
基于风速升降特性及支持向量机理论的异常数据重构算法;杨茂,等;《电力***保护与控制》;20180816;第46卷(第16期);P31-37 *
风电场短期风速预测若干问题研究;张弛;《中国博士学位论文全文数据库 信息科技辑》;20190215(第02期);I140-7 *

Also Published As

Publication number Publication date
CN111027229A (zh) 2020-04-17

Similar Documents

Publication Publication Date Title
CN111027229B (zh) 基于稀疏异方差多样条回归的风功率曲线拟合的方法
CN106157375B (zh) 一种三维模型部件类别自动标注方法
CN112699247A (zh) 一种基于多类交叉熵对比补全编码的知识表示学习框架
CN110728698B (zh) 一种基于复合循环神经网络***的多目标跟踪***
Liu et al. A two-stage deep autoencoder-based missing data imputation method for wind farm SCADA data
CN109145948A (zh) 一种基于集成学习的注塑机堵料异常检测方法
CN112001422B (zh) 一种基于深度贝叶斯学习的图像标记估计方法
Wang et al. Wind power curve modeling with asymmetric error distribution
CN111144581A (zh) 一种机器学习超参数调节方法及***
CN111768000A (zh) 在线自适应微调深度学习的工业过程数据建模方法
CN111079343A (zh) 一种基于宽度学习的风电机组有效风速估计方法
CN112800682A (zh) 一种反馈寻优的风机叶片故障监测方法
CN112733273A (zh) 一种基于遗传算法和最大似然估计确定贝叶斯网络参数的方法
CN114462718A (zh) 基于时间滑动窗口的cnn-gru风电功率预测方法
CN108563829B (zh) 一种基于贝叶斯鲁棒函数回归的多步风速预报方法
CN115115090A (zh) 一种基于改进lstm-cnn的风功率短期预测方法
CN115907195A (zh) 一种光伏发电功率预测方法、***、电子设备及介质
CN111695611A (zh) 一种蜂群优化核极限学习和稀疏表示机械故障识别方法
CN111159900B (zh) 风机风速的预测方法及装置
CN114897204A (zh) 一种海上风电场短期风速预测方法和装置
CN110738363A (zh) 一种光伏发电功率预测模型及其构建方法和应用
CN110795841A (zh) 一种间歇性能源出力不确定性的数学建模方法
CN113344243A (zh) 基于改进哈里斯鹰算法优化elm的风速预测方法及***
CN117458480A (zh) 基于改进lof的光伏发电功率短期预测方法及***
CN110765420A (zh) 一种基于pso-fi的地面自动气象站气温观测资料质量控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant