WO2023070960A1

WO2023070960A1 - 一种基于卷积transformer架构的风功率预测方法、***及设备

Info

Publication number: WO2023070960A1
Application number: PCT/CN2022/072596
Authority: WO
Inventors: 卢泽华; 李小翔; 任鑫; 曾谁飞; 杨永前; 王�华; 陈沐新; 张燧; 王青天; 冯帆; 王振荣
Original assignee: 中国华能集团清洁能源技术研究院有限公司
Priority date: 2021-10-29
Filing date: 2022-01-18
Publication date: 2023-05-04
Also published as: CN114021803A

Abstract

本申请公开了一种基于卷积transformer架构的风功率预测的方法、装置及存储介质。方法包括：采集气象数据和运行数据，并获取嵌入向量（S101）；将嵌入向量输入功率预测网络，功率预测网络包括编码器和解码器（S102）；根据编码器获取嵌入向量对应的特征图（S103）；将特征图输入解码器，以生成预测功率（S104）。

Description

一种基于卷积transformer架构的风功率预测方法、***及设备

相关申请的交叉引用

本申请基于申请号为No.202111274987.2、申请日为2021年10月29日的中国专利申请提出，并要求该中国专利申请的优先权，该中国专利申请的全部内容在此引入本申请作为参考。

技术领域

本申请涉及新能源电力技术，尤其涉及一种基于卷积transformer架构的风功率预测方法、***及设备。

背景技术

风力发电技术正在成为满足未来电力需求的主要来源。更高份额的可再生能源技术对于碳中和满足未来新型电力***电网的需求至关重要，但也带来了新的电网运行挑战。电力公司需要对风功率发电功率进行预测，以便进行发电调度操作。预测是一个主要的推动因素，可以确保安全和经济的风功率并网，同时在电力***不同层面的许多灵活性创新之间建立联系，以实现协同效应。准确的风功率预测是一个重要的、具有成本效益的能源管理要素，它还有助于风功率电站和集合***有效和直接地参与电力市场，并且通过优化供应计划来增加电厂的效益。

相关技术中，根据递归神经网络类的模型对风能发电功率进行预测，但递归神经网络在网络加深时存在梯度消失和梯度***，功率预测的准确率较低。

发明内容

本申请提供一种基于卷积transformer架构的风功率预测方法、***及设备。

根据本申请实施例的第一方面，提供一种基于卷积transformer架构的风功率预测方法，包括：

采集气象数据和运行数据，并获取嵌入向量。

将所述嵌入向量输入功率预测网络，所述功率预测网络包括编码器和解码器。

根据所述编码器获取所述嵌入向量对应的特征图。

将所述特征图输入解码器，以生成预测功率。

在一些实施例中，所述气象数据的时间步长为t，所述气象数据包括：

厂站额定容量、发电单元型号、发电单元数量和扩容信息。

厂站出力表实际功率。

风的高度、风速和风向。

风机轮毂高度处风速和风机轮毂高度处风向。

气温、气压、相对湿度。

在一些实施例中，所述运行数据的时间步长为t，所述运行数据包括：

厂站名称、起报时间、预报时间。

各高度的温度、动量通量、风向、风速和相对湿度。

海平面气压、云量、潜热通量、感热通量、短波辐射通量、长波辐射通量、地表水压、总降水、大尺度降水、对流降水。

在一些实施例中，所述采集气象数据和运行数据，包括：

将所述采集气象数据和运行数据归一化，并清洗无效数据。

在一些实施例中，所述获取嵌入向量，包括：

令滑窗在数据上滑动，选取滑窗内的气象数据和运行数据，并生成嵌入向量。

在一些实施例中，所述编码器包括自注意层和前馈神经网络，所述根据所述编码器获取所述嵌入向量对应的特征图，包括：

将所述嵌入向量输入自注意层以生成查询向量q、键向量k和值向量v。

根据所述q和所述k生成向量评分score。

根据所述score和归一化参数生成最终评分。

对所述最终评分进行归一化以生成归一化评分。

根据v和归一化评分计算加权评分向量并计算所述加权评分向量之和。

将所述加权评分向量之和输入所述前馈神经网络，并生成所述特征图。

在一些实施例中，所述解码器包括自注意层、编码-解码注意力层和前馈神经网络。

根据本申请实施例的第二方面，提供一种功率预测网络训练方法，包括：

根据气象数据和运行数据生成数据集。

对所述数据集进行标注以生成训练数据集。

将所述训练数据集输入所述功率预测网络，并以损失函数最小化为目标进行训练。

在一些实施例中，所述对所述数据集进行标注以生成训练数据集，包括：

标注各个时间点上气象数据和运行数据对应的实际功率。

根据本申请实施例的第三方面，提供一种基于卷积transformer架构的风功率预测装置，包括：

采集模块，用于采集气象数据和运行数据，并获取嵌入向量。

输入模块，用于将所述嵌入向量输入功率预测网络，所述功率预测网络包括编码器和解码器。

特征提取模块，用于根据所述编码器获取所述嵌入向量对应的特征图。

预测模块，用于将所述特征图输入解码器，以生成预测功率。

厂站额定容量、发电单元型号、发电单元数量和扩容信息。

厂站出力表实际功率。

风的高度、风速和风向。

风机轮毂高度处风速和风机轮毂高度处风向。

气温、气压、相对湿度。

厂站名称、起报时间、预报时间。

各高度的温度、动量通量、风向、风速和相对湿度。

在一些实施例中，所述采集模块，包括：

数据清洗子模块，用于将所述采集气象数据和运行数据归一化，并清洗无效数据。

在一些实施例中，所述采集模块，包括：

第一向量生成子模块，用于令滑窗在数据上滑动，选取滑窗内的气象数据和运行数据，并生成嵌入向量。

在一些实施例中，所述编码器包括自注意层和前馈神经网络，所述特征提取模块，包括：

第二向量生成子模块，用于将所述嵌入向量输入自注意层以生成查询向量q、键向量k和值向量v。

第一评分子模块，用于根据所述q和所述k生成向量评分score。

第二评分子模块，根据所述score和归一化参数生成最终评分。

第三评分子模块，对所述最终评分进行归一化以生成归一化评分。

第四评分子模块，根据v和归一化评分计算加权评分向量并计算所述加权评分向量之和。

特征提取子模块，用于将所述加权评分向量之和输入所述前馈神经网络，并生成所述特征图。

根据本申请实施例的第四方面，提供一种功率预测网络训练装置，包括：

数据采集模块，用于根据气象数据和运行数据生成数据集。

标注模块，用于对所述数据集进行标注以生成训练数据集。

训练模块，用于将所述训练数据集输入所述功率预测网络，并以损失函数最小化为目标进行训练。

在一些实施例中，所述标注模块，包括：

标注子模块，用于标注各个时间点上气象数据和运行数据对应的实际功率。

根据本申请实施例的第五方面，提供一种基于卷积transformer架构的风功率预测装置，包括：

处理器。

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述指令，以实现如上述第一方面中任一项所述的基于卷积transformer架构的风功率预测方法。

根据本申请实施例的第六方面，提供一种非临时性计算机可读存储介质，当所述存储介质中的指令由基于卷积transformer架构的风功率预测装置的处理器执行时，使得基于卷积transformer架构的风功率预测装置能够执行如上述第一方面中任一项所述的基于卷积transformer架构的风功率预测方法。

根据本申请实施例的第七方面，提供一种功率预测网络训练装置，包括：

处理器。

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述指令，以实现如上述第二方面所述的功率预测网络训练方法。

根据本申请实施例的第八方面，提供一种非临时性计算机可读存储介质，当所述存储介质中的指令由功率预测网络训练装置的处理器执行时，使得功率预测网络训练装置能够执行如上述第二方面所述的功率预测网络训练方法。

根据本申请实施例的第九方面，提供一种计算机程序产品，所述计算机程序产品中包括计算机程序代码，当所述计算机程序代码在计算机上运行时，以执行如上述第一方面所述的方法。

根据本申请实施例的第十方面，提供一种计算机程序产品，所述计算机程序产品中包括计算机程序代码，当所述计算机程序代码在计算机上运行时，以执行如上述第二方面所述的方法。

根据本申请实施例的第十一方面，提供一种计算机程序，所述计算机程序包括计算机程序代码，当所述计算机程序代码在计算机上运行时，以使得计算机执行如上述第一方面所述的方法。

根据本申请实施例的第十二方面，提供一种计算机程序，所述计算机程序包括计算机程序代码，当所述计算机程序代码在计算机上运行时，以使得计算机执行如上述第二方面所述的方法。

本申请的实施例提供的技术方案至少具有以下优势。

通过对多个时间点数据的关注，增强对局部上下文信息的关注，降低异常数据对预测结果的影响，提高了功率预测的准确度。

计算q和k时采用卷积核来进行卷积操作，从而实现使注意力关注局部上下文，使得更相关的特征能够得到匹配。

改进后的功率预测网络能够更快地拟合，在复杂的数据集中可提升了模型的预测准确度，且取得更低的训练损失。

附图说明

图1是根据一示例性实施例示出的一种基于卷积transformer架构的风功率预测方法的流程图。

图2是根据一示例性实施例示出的一种基于卷积transformer架构的风功率预测方法的流程图。

图3是根据一示例性实施例示出的一种功率预测网络训练方法的流程图。

图4是根据一示例性实施例示出的一种基于卷积transformer架构的风功率预测装置的框图。

图5是根据一示例性实施例示出的一种基于卷积transformer架构的风功率预测装置的框图。

图6是根据一示例性实施例示出的一种功率预测网络训练装置的框图。

图7是根据一示例性实施例示出的功率预测网络预测流程示意图。

图8是根据一示例性实施例示出的编码器结构示意图。

图9是根据一示例性实施例示出的解码器结构示意图。

图10是根据一示例性实施例示出的一种基于卷积transformer架构的风功率预测装置的框图。

具体实施方式

为了使本领域普通人员更好地理解本申请的技术方案，下面将结合附图，对本申请实施例中的技术方案进行清楚、完整地描述。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。

大部分风功率预测基于时间序列分析的方法都以固定的时间间隔测量的风力发电机组相关数据。相关技术中采用递归神经网络类的模型来对时序序列进行分析预测，但递归神经网络在网络加深时存在梯度消失和梯度***。即使是长短期记忆网络，在捕捉长期依赖上依然力不从心。后续发展出现的Transformer架构更强的长期依赖建模能力，在处理较长时间序列上效果有明显提升。基于递归神经网络的方法面对长序列时无法完全消除梯度消失和梯度***，而Transformer架构则可以在长序列上效果更好，但原始Transformer架构的自注意力计算方法存在对局部信息不敏感，使得模型易受异常点或异常数据的影响导致预测出现偏差。

本申请提出一种基于卷积transformer架构的风功率预测的方法、装置及存储介质。

图1是根据一示例性实施例示出的一种基于卷积transformer架构的风功率预测方法的流程图，如图1所示，所述方法包括以下步骤：

步骤101，采集气象数据和运行数据，并获取嵌入向量。

本申请实施例中，需要采集数据，以输入功率预测网络。风能发电的功率有两大影响因素：风能发电机组的运行状态和风能发电机组周围的气象条件。本申请实施例采集所述气象数据和运行数据，以预测所述风能发电机组的功率。

所述气象数据包括：风能发电厂的厂站名称、额定容量、发电单元型号、发电单元数量和扩容信息。所述厂站内的厂站出力表含时间和实际功率。气象数据中包括风力数据，所述风力数据包括：指定高度处的风速、风向、气温、气压和相对湿度。所述指定高度可以由实施者根据实际情况调整，本申请不对指定高度进行限定。在一种可能的实施例中，所述指定高度为10米、30米、50米、70米和风机轮毂高度处。运行记录包括起始时间、终止时间以及对应的最大出力上限值。

所述运行数据包括：所述厂站名称、起报时间、预报时间，指定高度处的风速、风向、温度、相对湿度，在一种可能的实施例中，所述指定高度为10米、30米、70米、100米。同时还需要测量海平面气压、云量、潜热通量、感热通量、动量通量、短波辐射通量、长波辐射通量、地表水压、总降水、大尺度降水、对流降水。

需要说明的是，所述气象数据和所述运行数据进行周期性采集，每经过一个时间步长t采集一次所述气象数据和所述运行数据，所述t的具体值可以由实施者根据实际情况调整，本申请不对t进行限定。在一种可能的实施例中，所述时间步长t为15分钟。

将所述气象数据和运行数据组成时序数据，本申请实施根据多个时间点采集的数据来预测下一时间点的风能发电功率，利用滑窗在所述时序数据上滑动选取若干个连续时间点上的数据，为了功率预测网络顺利识别所述时序序列，根据滑窗选取的数据生成对应的嵌入向量。

步骤102，将所述嵌入向量输入功率预测网络，所述功率预测网络包括编码器和解码器。

本申请实施例中，所述功率预测网络为卷积迁移transformer架构的神经网络，所述功率预测网络包括编码器和解码器。

步骤103，根据所述编码器获取所述嵌入向量对应的特征图。

本申请实施例中，所述编码器包括自注意层和前馈神经网络，将所述嵌入向量输入所述自注意层并转化为查询向量q、键向量k和值向量v，再将所述q、k、v输入所述前馈神经网络提取特征，以生成所述特征图。

步骤104，将所述特征图输入解码器，以生成预测功率。

本申请实施例中，所述解码器包括自注意层、编码-解码注意力层和前馈神经网络，用于将所述特征图进行降维，以生成所述预测功率。

厂站额定容量、发电单元型号、发电单元数量和扩容信息。

厂站出力表实际功率。

风的高度、风速和风向。

风机轮毂高度处风速和风机轮毂高度处风向。

气温、气压、相对湿度。

本申请实施例中，所述气象数据包括：风能发电厂的厂站名称、额定容量、发电单元型号、发电单元数量和扩容信息。所述厂站内的厂站出力表含时间和实际功率。气象数据中包括风力数据，所述风力数据包括：指定高度处的风速、风向、气温、气压和相对湿度。所述指定高度可以由实施者根据实际情况调整，本申请不对指定高度进行限定。在一种可能的实施例中，所述指定高度为10米、30米、50米、70米和风机轮毂高度处。运行记录包括起始时间、终止时间以及对应的最大出力上限值。

厂站名称、起报时间、预报时间。

各高度的温度、动量通量、风向、风速和相对湿度。

本申请实施例中，所述运行数据包括：所述厂站名称、起报时间、预报时间，指定高度处的风速、风向、温度、相对湿度，在一种可能的实施例中，所述指定高度为10米、30米、70米、100米。同时还需要测量海平面气压、云量、潜热通量、感热通量、动量通量、短波辐射通量、长波辐射通量、地表水压、总降水、大尺度降水、对流降水。

在一些实施例中，所述采集气象数据和运行数据，包括：

将所述采集气象数据和运行数据归一化，并清洗无效数据。

本申请实施例中，为了降低输入所述功率预测网络数据的误差，需要清除无效的运行数据和气象数据。对所述运行数据和气象数据进行数据清洗，删除异常数据。在一种可能的实施例中，通过设置阈值范围来检测与正常实例有显著差异的数据，或通过搜索空值来检测缺失的数据和重复的测量。所有检测到的错误和缺失数据都从初始数据集中丢弃。同时为了防止梯度***，需要将清洗后的数据进行归一化。在一种可能的实施例中，归一化的公式为：

其中，x _norm为归一化后的值，x为原数值，x _min为原数值中的最小值，x _max为原数值中的最大值。

在一些实施例中，所述获取嵌入向量，包括：

本申请实施例中，将所述气象数据和运行数据组成时序数据，本申请实施根据多个时间点采集的数据来预测下一时间点的风能发电功率，利用滑窗在所述时序数据上滑动选取若干个连续时间点上的数据，为了功率预测网络顺利识别所述时序序列，根据滑窗选取的数据生成对应的嵌入向量。

图2是根据一示例性实施例示出的一种基于卷积transformer架构的风功率预测方法的流程图，所述编码器包括自注意层和前馈神经网络，如图2所示，所述方法包括以下步骤：

步骤201，将所述嵌入向量输入自注意层以生成查询向量q、键向量k和值向量v。

本申请实施例中，通过自注意层获取所述嵌入向量对应的查询向量q、键向量k和值向量v，以进行后续的评分计算，获取注意力评分。

步骤202，根据所述q和所述k生成向量评分score。

本申请实施例中，所述q和k用于计算所述嵌入向量的评分score，score的计算公式为： score＝|q×k|，通过q和k相乘获取score。

步骤203，根据所述score和归一化参数生成最终评分。

本申请实施例中，为了使梯度稳定，需要使所述score归一化，即用score除以归一化参数

在一种可能的实施例中，所述d _k为键向量k的维度数量。在另一种可能的实施例中，所述score＝112，所述k的维度数量为64，则最终评分为

步骤204，对所述最终评分进行归一化以生成归一化评分。

本申请实施例中，利用归一化函数对所述最终评分进行归一化。在一种可能的实施例中，所述归一化函数为softmax函数，将所述最终评分输入所述softmax函数，以生成所述归一化评分。所述归一化评分表示当前时间点对应的嵌入向量对预测功率的贡献大小，归一化评分越高，说明所述嵌入向量对应的数据与预测功率关系越紧密，对预测功率的贡献越大。在一种可能的实施例中，所述最终评分为12，经过softmax函数的归一化处理后输出归一化评分0.88，所述归一化评分用于后续为z加权。

步骤205，根据v和归一化评分计算加权评分向量并计算所述加权评分向量之和。

本申请实施例中，用所述归一化评分和所述v相乘，获取加权评分向量，将各个加权评分向量相加集合得到加权评分向量之和。

步骤206，将所述加权评分向量之和输入所述前馈神经网络，并生成所述特征图。

再将所述加权评分向量之和输入所述前馈神经网络，提取特征以生成所述特征图。

图8是根据一示例性实施例示出的编码器结构示意图。如图8所示，所述编码器包括自注意力层和前馈神经网络。

本申请实施例中，图9是根据一示例性实施例示出的解码器结构示意图。如图9所示，所述解码器中也有编码器的自注意层和前馈神经网络。除此之外，这两个层之间还有一个编码-解码层(即编码-解码注意力层)，用来关注输入嵌入向量的相关部分。所述编码-解码注意力层为全连接网络，其中有两层网络，第一层的激活函数是ReLU，ReLU激活函数的公式化表达为

通过ReLU实现稀疏后的模型能够更好地挖掘相关特征，拟合训练数据；第二层为线性激活函数。整个编码-解码注意力层可以总结为FFN(Z)函数：FFN(Z)＝max(0，ZW ₁+b ₁)W ₂+b ₂。

图7是根据一示例性实施例示出的功率预测网络预测流程示意图。如图所示，通过滑窗选取4个时间点上的气象数据和运行数据，根据卷积核生成对应的查询向量q、键向量k和值向量v，并输入编码器中的自注意层，计算注意力的相关评分，输出加权评分向量之和。

图3是根据一示例性实施例示出的一种功率预测网络训练方法的流程图，如图3所示，所述方法包括以下步骤：

步骤301，根据气象数据和运行数据生成数据集。

本申请实施例中，利用多种传感器采集所述气象数据和运行数据后，即可构建数据集，来训练所述功率预测网络。所述数据集为时序数据集，气象数据和运行数据的时间步长为t，在一种可能的实施例中，所述t＝15分钟。在一种可能的实施例中，用不同的数据分割方法分割所述数据集，将2年内记录的数据集分成训练集和测试集。从原始时间序列中提取10个不同的训练集，按顺序或随机地将第一年的评估数据集划分出10％的训练集、30％的训练集、50％的训练集和70％的训练集。

步骤302，对所述数据集进行标注以生成训练数据集。

本申请实施例中，对所述数据集中的数据进行标注，标注各个时间点上采集的气象数据和运行数据对应风能发电的实际功率，以训练所述功率预测网络。

步骤303，将所述训练数据集输入所述功率预测网络，并以损失函数最小化为目标进行训练。

本申请实施例中，将所述训练数据集输入所述功率预测网络进行迭代训练，利用滑窗在所述训练数据集上滑动选取若干个连续时间点上的数据并输入所述功率预测网络，输出预测功率，将所述预测功率和所述实际功率进行对比，计算损失函数。以所述损失函数最小化为目标优化所述功率预测网络中的参数。经过训练后即可获取推荐的功率预测网络。

标注各个时间点上气象数据和运行数据对应的实际功率。

图4是根据一示例性实施例示出的一种基于卷积transformer架构的风功率预测装置的框图。参照图4，该装置400包括采集模块410，输入模块420、特征提取模块430和预测模块440。

采集模块410，用于采集气象数据和运行数据，并获取嵌入向量。

输入模块420，用于将所述嵌入向量输入功率预测网络，所述功率预测网络包括编码器和解码器。

特征提取模块430，用于根据所述编码器获取所述嵌入向量对应的特征图。

预测模块440，用于将所述特征图输入解码器，以生成预测功率。

厂站额定容量、发电单元型号、发电单元数量和扩容信息。

厂站出力表实际功率。

风的高度、风速和风向。

风机轮毂高度处风速和风机轮毂高度处风向。

气温、气压、相对湿度。

厂站名称、起报时间、预报时间。

各高度的温度、动量通量、风向、风速和相对湿度。

在一些实施例中，所述采集模块410，包括：

数据清洗子模块411，用于将所述采集气象数据和运行数据归一化，并清洗无效数据。

在一些实施例中，所述采集模块410，包括：

第一向量生成子模块412，用于令滑窗在数据上滑动，选取滑窗内的气象数据和运行数据，并生成嵌入向量。

图5是根据一示例性实施例示出的一种基于卷积transformer架构的风功率预测装置的框图。参照图5，该装置500包括第二向量生成子模块510、第一评分子模块520、第二评分子模块530、第三评分子模块540、第四评分子模块550和特征提取子模块560。

第二向量生成子模块510，用于将所述嵌入向量输入自注意层以生成查询向量q、键向量k和值向量v。

第一评分子模块520，用于根据所述q和所述k生成向量评分score。

第二评分子模块530，根据所述score和归一化参数生成最终评分。

第三评分子模块540，对所述最终评分进行归一化以生成归一化评分。

第四评分子模块550，根据v和归一化评分计算加权评分向量并计算所述加权评分向量之和。

特征提取子模块560，用于将所述加权评分向量之和输入所述前馈神经网络，并生成所述特征图。

图6是根据一示例性实施例示出的一种功率预测网络训练装置的框图。参照图6，该装置600包括数据采集模块610、标注模块620和训练模块630。

数据采集模块610，用于根据气象数据和运行数据生成数据集。

标注模块620，用于对所述数据集进行标注以生成训练数据集。

训练模块630，用于将所述训练数据集输入所述功率预测网络，并以损失函数最小化为目标进行训练。

在一些实施例中，所述标注模块620，包括：

标注子模块621，用于标注各个时间点上气象数据和运行数据对应的实际功率。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

图10是根据一示例性实施例示出的一种用于实现所述基于卷积transformer架构的风功率预测方法的装置1000的框图。

在示例性实施例中，还提供了一种包括指令的存储介质，例如包括指令的存储器1010，接口1030，上述指令可由装置1000的处理器1020执行以完成上述方法。在一些实施例中，存储介质可以是非临时性计算机可读存储介质，例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

在示例性实施例中，还提供了一种计算机程序产品，所述计算机程序产品中包括计算机程序代码，当所述计算机程序代码在计算机上运行时，以执行上述方法。

在示例性实施例中，还提供了一种计算机程序，所述计算机程序包括计算机程序代码，当所述计算机程序代码在计算机上运行时，以使得计算机执行上述方法。

本申请所有实施例均可以单独被执行，也可以与其他实施例相结合被执行，均视为本公开要求的保护范围。

Claims

一种基于卷积transformer架构的风功率预测方法，其特征在于，包括：

采集气象数据和运行数据，并获取嵌入向量；

将所述嵌入向量输入功率预测网络，所述功率预测网络包括编码器和解码器；

根据所述编码器获取所述嵌入向量对应的特征图；

将所述特征图输入解码器，以生成预测功率。
根据权利要求1所述的方法，其特征在于，所述气象数据的时间步长为t，所述气象数据包括：

厂站额定容量、发电单元型号、发电单元数量和扩容信息；

厂站出力表实际功率；

风的高度、风速和风向；

风机轮毂高度处风速和风机轮毂高度处风向；

气温、气压、相对湿度。
根据权利要求1或2所述的方法，其特征在于，所述运行数据的时间步长为t，所述运行数据包括：

厂站名称、起报时间、预报时间；

各高度的温度、动量通量、风向、风速和相对湿度；

海平面气压、云量、潜热通量、感热通量、短波辐射通量、长波辐射通量、地表水压、总降水、大尺度降水、对流降水。
根据权利要求1至3中任一项所述的方法，其特征在于，所述采集气象数据和运行数据，包括：

将所述采集气象数据和运行数据归一化，并清洗无效数据。
根据权利要求1至4中任一项所述的方法，其特征在于，所述获取嵌入向量，包括：

令滑窗在数据上滑动，选取滑窗内的气象数据和运行数据，并生成嵌入向量。
根据权利要求1至5中任一项所述的方法，其特征在于，所述编码器包括自注意层和前馈神经网络，所述根据所述编码器获取所述嵌入向量对应的特征图，包括：

将所述嵌入向量输入自注意层以生成查询向量q、键向量k和值向量v；

根据所述q和所述k生成向量评分score；

根据所述score和归一化参数生成最终评分；

对所述最终评分进行归一化以生成归一化评分；

根据v和归一化评分计算加权评分向量并计算所述加权评分向量之和；

将所述加权评分向量之和输入所述前馈神经网络，并生成所述特征图。
根据权利要求1至6中任一项所述的方法，其特征在于，所述解码器包括自注意层、编码-解码注意力层和前馈神经网络。
一种功率预测网络训练方法，其特征在于，用于训练权利要求1-7中任一项所述的功率预测网络，包括：

根据气象数据和运行数据生成数据集；

对所述数据集进行标注以生成训练数据集；

将所述训练数据集输入所述功率预测网络，并以损失函数最小化为目标进行训练。
根据权利要求8所述的方法，其特征在于，所述对所述数据集进行标注以生成训练数据集，包括：

标注各个时间点上气象数据和运行数据对应的实际功率。
一种基于卷积transformer架构的风功率预测装置，其特征在于，包括：

采集模块，用于采集气象数据和运行数据，并获取嵌入向量；

输入模块，用于将所述嵌入向量输入功率预测网络，所述功率预测网络包括编码器和解码器；

特征提取模块，用于根据所述编码器获取所述嵌入向量对应的特征图；

预测模块，用于将所述特征图输入解码器，以生成预测功率。
一种基于卷积transformer架构的风功率预测装置，其特征在于，包括：

处理器；

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述指令，以实现如权利要求1至7中任一项所述的基于卷积transformer架构的风功率预测方法。
一种非临时性计算机可读存储介质，其特征在于，当所述存储介质中的指令由基于卷积transformer架构的风功率预测装置的处理器执行时，使得基于卷积transformer架构的风功率预测装置能够执行如权利要求1至7中任一项所述的基于卷积transformer架构的风功率预测方法。
一种功率预测网络训练装置，其特征在于，包括：

处理器；

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述指令，以实现如权利要求8或9所述的功率预测网络训练方法。
一种非临时性计算机可读存储介质，其特征在于，当所述存储介质中的指令由功率预测网络训练装置的处理器执行时，使得功率预测网络训练装置能够执行如权利要求8或9所述的功率预测网络训练方法。
一种计算机程序产品，其特征在于，所述计算机程序产品中包括计算机程序代码，当所述计算机程序代码在计算机上运行时，以执行如权利要求1至7中任一项所述的方法。
一种计算机程序产品，其特征在于，所述计算机程序产品中包括计算机程序代码，当所述计算机程序代码在计算机上运行时，以执行如权利要求8或9所述的方法。
一种计算机程序，其特征在于，所述计算机程序包括计算机程序代码，当所述计算机程序代码在计算机上运行时，以使得计算机执行如权利要求1至7中任一项所述的方法。
一种计算机程序，其特征在于，所述计算机程序包括计算机程序代码，当所述计算机程序代码在计算机上运行时，以使得计算机执行如权利要求8或9所述的方法。