CN115688805A

CN115688805A - 基于元-多任务学习的电力虚拟调度方法及调度***

Info

Publication number: CN115688805A
Application number: CN202211331157.3A
Authority: CN
Inventors: 黄兴; 刘为; 李立; 王维; 安鑫; 冯宇; 李蒸; 李蒙; 柳璐; 齐云飞; 齐俊; 刘育博; 刘晓强; 高强; 张瑜; 聂希柱; 张磊; 吴昕昀; 李清玉; 郑善奇
Original assignee: Information and Telecommunication Branch of State Grid Liaoning Electric Power Co Ltd
Current assignee: Information and Telecommunication Branch of State Grid Liaoning Electric Power Co Ltd
Priority date: 2022-10-28
Filing date: 2022-10-28
Publication date: 2023-02-03

Abstract

本发明提供了一种基于元‑多任务学***均准确率明显优于传统的虚拟调度方法，同时电力虚拟调度的调度准确率高于人工调度的准确率。

Description

基于元-多任务学习的电力虚拟调度方法及调度***

技术领域

本发明涉及电力调度技术领域，尤其涉及一种基于元-多任务学习的电力虚拟调度方法及调度***。

背景技术

随着新能源场站数量增长迅猛，新能源场站调度业务处理量急剧增加，导致电力调度人员承载力不足，影响电力调度工作效率，给电力调度带来了极大的挑战。为此，大量的学者对提高调度人员效率的方法做了研究，主要分为调度语音识别和人工智能调度识别两类。

调度语音识别是人机交互领域的一个重要内容，在调度语音识别方面，如基于神经网络的调度语音识别方法采用声学训练模型，提高了调度语音识别准确率，防止调度员语音失误的辅助***通过调度口令语音校验，避免了调度人员语音交互过程中的失误，预防了事故的发生；梅尔倒谱系数的调度语音分析方法采用小词汇量的声学模型，提高调度语义识别精度。但上述研究仅限于对调度人员语音的识别，并未结合调度流程下达调度指令。

在人工智能调度识别方面已有大量的研究成果，基于人工智能的辅助调度工具通过调度信息挖掘，实现了多种能源调度信息的辨识分析，基于多网融合的调度信息***采用用户代理模型和跨网络融通，提高了电力调度网络通信指挥的效率；电力调度小机器人的方法分析了人机调度交互语音辨识的特点，并对调度机器人进行了评价。但上述研究仅局限于调度信息挖掘，缺少对调度命令、调度策略、调度仿真的结合，不能下达有效的调度命令。

因此，有必要开发一种基于元-多任务学习的电力虚拟调度方法及调度***，利用元学习对多任务学习进行改进，在调度人员语音识别的基础上对调度目标进行综合分析，得到最优调度路径并下达调度命令。

发明内容

本发明旨在解决现有技术或相关技术中存在的技术问题之一。

有鉴于此，本发明的一方面提出了一种基于元-多任务学习的电力虚拟调度方法，所述电力虚拟调度方法包括：

步骤1，将调度命令语音和文本数据的数据集划分为训练集和测试集；

步骤2，基于所述训练集，训练元学习器和迁移学习器；

步骤3，基于所述测试集，利用训练好的所述元学习器和所述迁移学习器，预测测试集上所述调度语音命令的语义识别标签；

步骤4，基于所述语义识别标签，获取准确的调度目标，即所需要调度的新能源场站，通过新能源场站的最小运行成本获取达到所述调度目标的最佳调度路径，基于所述最小调度路径将调度命令下达至所述新能源场站。

进一步地，所述训练集和所述测试集划分包括：

步骤101，语义识别数据集包括多个调度人员的调度命令语音和与所述调度命令语音对应的语料，所述语料包括一个语义信息和N个分词信息，基于所述调度命令语音的个数，将所述语义识别数据集划分为若干个子数据集，每个子数据集对应元学习任务集合中的一个任务；

步骤102，选择一个所述调度命令语音作为测试集，其余的所述调度语音命令作为训练集；

其中，所述元任务集合为{T₁,T₂,...,T_K}，任务T_k表示第k个调度命令语音。

进一步地，所述元学习器和所述迁移学习器的训练包括：

步骤201，基于所述训练集，将每个所述调度命令语音对应的所述语料划分成支撑集和查询集，所述查询集即所述语义信息为每个所述调度命令语音的目标任务，所述支撑集即所述分词信息为与所述目标任务相关的辅助任务；

步骤202，基于所述训练集上的所述支撑集，训练元学习器，并临时更新元学习器参数，获得基于所述调度命令语音的临时元学习器，用于对所述辅助任务之间的相关性进行建模；

步骤203，基于所述训练集上的所述查询集，利用所述临时元学习器，训练迁移学习器并更新迁移学习器参数，用于对所述辅助任务到所述目标任务的知识迁移能力进行建模；

步骤204，基于所述训练集上的每个所述查询集，利用更新后的所述元学***均作为总损失，采用梯度下降法，继续更新所述元学习器和所述迁移学习器的参数；

步骤205，重复步骤203和步骤204，迭代至所述元学习器和所述迁移学习器收敛后，放入到所述测试集中。

进一步地，所述步骤201包括：

在所述训练集上，令D＝{D₁,D₂,...,D_K}表示每次训练所述元学习器时所采样到的K个不同所述调度命令语音及与所述调度命令语音相对应的一定量的所述语料，X＝{X₁,...,X_K}表示为所述调度命令语音对应的输入语音特征，所述支撑集用于所述分词信息识别上的标签，所述查询集用于进行所述语义信息识别上的标签，设定所述支撑集为每个所述调度命令语音的辅助任务

所述查询集为每个所述调度命令语音的目标任务

对于给定任务T_k，所述目标任务

为给定第k个所述调度命令语音的输入语音特征X_k，从而识别所述调度命令语音的语义信息

即

为在所述查询集上对应的标签集，其中所述目标任务记为

所述辅助任务

为给定第k个所述调度命令语音信息的输入语音特征X_k，识别所述语料中N个所述分词信息

为在所述支撑集上第n个辅助任务对应的标签集，

为第n个辅助任务，所述辅助任务记为

综上，对于每个所述调度命令语音的所述语义识别数据集，记为

进一步地，所述步骤202包括：

在所述任务T_k的每个所述辅助任务

上训练所述元学习器；

选择CNN-LSTM模型作为元学习器，则θ为元学习器的参数，所有的所述辅助任务

共享同一个特征提取器，但不共享分类器，此步采用soft max分类器，假设辅助任务n的输出概率为

则所述辅助任务n在第n个所述支撑集上的损失为

在输入语音特征X_j通过所述元学***均作为这个阶段的总梯度，对于所述任务T_k，按照梯度下降法计算得到所述元学习器的新参数θ_k′为

获取临时元学习器。

进一步地，在所述元学习器之后添加一个用于学习知识迁移的网络层，称为迁移学习器，用于将所述辅助任务的知识迁移到所述目标任务上，所述步骤203包括：

输入语音特征X_k会依次通过所述元学习器和所述迁移学习器，只对所述迁移学习器进行训练，保证所述迁移学习器能够尽快学习知识迁移；

对所述任务T_k的所述目标任务

假设所述目标任务的输出概率

所述迁移学习器的参数为φ，学习率为β，所述任务T_k在这个阶段的损失

为

在所述查询集的所述目标任务上对参数φ求导计算相应的梯度

得到迁移学习器的参数更新方式为

进一步地，所述步骤204包括：

基于所述训练集，对于每个所述任务T_k的目标任务

基于临时更新的元学***均作为总损失为

N为辅助任务个数；

采用梯度下降法，用所述总损失分别对所述元学习器和迁移学习器的参数做求导，更新所述元学习器初始参数θ和所述迁移学习器初始参数φ，将γ作为微调的学习率，使得所述元学习器和所述迁移学习器(能够朝着优化目标任务预测的方向发展，更新初始参数如下式：

进一步地，引入惩罚因子的弃风成本即为风力发电成本为

C_w为弃风惩罚因子，P_wfh为风力发电功率的预测值，P_wnh为风力发电实际发电容量；

同理，不计及光伏发电***建设维护费用的情况下，光伏发电成本即为引入弃光惩罚因子C_s的弃光成本为

P_sfh为光伏发电功率的预测值，P_snh为光伏实际发电容量；

为使新能源场站的运行成本最小，设新能源场站的运行时间为H，电力虚拟调度的调度决策模型目标函数为：

受风电、光伏波动的影响，采用自寻优的方式求解最小运行成本通过粒子群算法进行迭代，假设上一时刻点的运行成本为F_ma，得到最小的运行成本minF_mb＝F_ma+rand(F_ma)；

基于所述测试集上预测识别的所述调度语音命令的所述语义信息和分词信息的标签，识别出所需调度的所述新能源场站，通过所述新能源场站最小运行成本，获取最佳的新能源场站调度路径，将调度命令下达到新能源场。

本发明的另一方面提出了一种基于元-多任务学习的电力虚拟调度***，所述电力虚拟调度***包括：

训练集模块和测试集模块，将调度命令语音和文本数据的数据集划分为训练集和测试集；

元学习器模块和迁移学习器模块，基于所述训练集，训练元学习器和迁移学习器；

语义识别标签模块，基于所述测试集，利用训练好的所述元学习器和所述迁移学习器，预测测试集上所述调度语音命令的语义识别标签；

调度命令模块，基于所述语义识别标签，获取准确的调度目标，即所需要调度的新能源场站，通过新能源场站的最小运行成本获取达到所述调度目标的最佳调度路径，基于所述最小调度路径将调度命令下达至所述新能源场站。

本发明的又一方面提出了一种计算机可读存储介质，该计算机可读存储介质存储有计算机程序，该计算机程序被处理器执行时实现所述的基于元-多任务学习的电力虚拟调度方法。

本发明提供的技术方案可以包括以下有益效果：

本发明利用元-多任务学***均准确率明显优于传统的虚拟调度方法，与人工调度相比，电力虚拟调度的总时间小于人工调度时间，同时电力虚拟调度的调度准确率高于人工调度的准确率。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本发明。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出了根据本发明一个实施例的基于元-多任务学习的电力虚拟调度方法的步骤流程图；

图2示出了根据本发明一个实施例的本申请识别结果与现有技术识别结果的准确率的对照图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

实施例1

图1示出了根据本发明一个实施例的基于元-多任务学习的电力虚拟调度方法的步骤流程图。

如图1所示，本实施例提供了一种基于元-多任务学习的电力虚拟调度方法，该电力虚拟调度方法包括：

步骤2，基于训练集，训练元学习器和迁移学习器；

步骤3，基于测试集，利用训练好的元学习器和迁移学习器，预测测试集上调度语音命令的语义识别标签；

步骤4，基于语义识别标签，获取准确的调度目标，即所需要调度的新能源场站，通过新能源场站的最小运行成本获取达到调度目标的最佳调度路径，基于最小调度路径将调度命令下达至新能源场站。

进一步地，训练集和测试集划分包括：

步骤101，语义识别数据集包括多个调度人员的调度命令语音和与调度命令语音对应的语料，所述语料包括一个语义信息和N个分词信息，基于调度命令语音的个数，将语义识别数据集划分为若干个子数据集，每个子数据集对应元学习任务集合中的一个任务；

步骤102，选择一个调度命令语音作为测试集，其余的调度语音命令作为训练集；

其中，元任务集合为{T₁,T₂,...,T_K}，任务T_k表示第k个调度命令语音。

需要说明的是，语义识别数据集：首先收集文本语料(K条)，交给调度人员进行录制，每条录制的语音对应一个语义信息以及N个分词信息，语义信息就是对应的文本含义，分词信息包含特殊读音、专有名词，特殊符号等，针对某区域电网需要，建立了覆盖常用专业名词，专业术语、特殊符号和特殊读音等的语料库，语料库是调度命令语音以及调度命令语音对应的文本信息(包括语义信息及分词信息)。

具体地，语义识别数据集D＝(X,Y)一个语义识别数据集对应一条调度命令语音及该调度命令语音对应的语义信息及分词信息，第k条调度命令语音输入为X_k，对应的语义信息为

也就是后面说的目标任务，也即查询集

对应的分词信息为

也就是后面说的辅助任务N个，也即支撑集

其中，

图2示出了根据本发明一个实施例的元学习器和迁移学习器的训练的步骤流程图。

如图2所示，元学习器和迁移学习器的训练包括：

步骤201，基于训练集，将每个调度命令语音对应的所述语料划分成支撑集和查询集，查询集即语义信息为每个调度命令语音的目标任务，支撑集即分词信息为与目标任务相关的辅助任务；

步骤202，基于训练集上的支撑集，训练元学习器，并临时更新元学习器参数，获得基于调度命令语音的临时元学习器，用于对辅助任务之间的相关性进行建模；

步骤203，基于训练集上的查询集，利用临时元学习器，训练迁移学习器并更新迁移学习器参数，用于对辅助任务到目标任务的知识迁移能力进行建模；

步骤204，基于训练集上的每个查询集，利用更新后的元学***均作为总损失，采用梯度下降法，继续更新元学习器和迁移学习器的参数；

步骤205，重复步骤203和步骤204，迭代至元学习器和迁移学习器收敛后，放入到测试集中。

其中，通过训练集中的支撑集上不同的数据(调度命令语音及分词信息)训练元学习器，并更新元学习器的参数，从而使得元学习器能够匹配与调度命令语音对应的正确的分词信息的标签，当再次输入调度命令语音(X)时，直接能得到对应的分词信息(Y^S)；同理，通过训练集中查询集上不同的数据(调度命令语音和语义信息)，并利用临时元学习器训练迁移学习器，并更新迁移学习器的参数，从而使得迁移学习器能够匹配调度命令语音对饮给的正确的语义信息的标签，当再次输入调度命令语音(X)时，直接能得到对应的语义信息(Y^Q)。

更进一步地，元学习器和迁移学习器收敛的条件为，元学习器和迁移学习器对调度命令语音的识别精确度大于90％以上，则结束训练过程。

需要说明的是，每组数据都会对元学习器进行一次训练，每训练一次都会调整(更新)元学习器的系数，使得元学习器的识别精度提高，训练元学习器和迁移学习器，以便得到更准确的识别结果。

进一步地，步骤201包括：

在训练集上，令D＝{D₁,D₂,...,D_K}表示每次训练元学习器时所采样到的K个不同调度命令语音及与调度命令语音相对应的一定量的语料，X＝{X₁,...,X_K}表示为调度命令语音对应的输入语音特征，支撑集用于分词信息识别上的标签，查询集用于进行语义信息识别上的标签，设定支撑集为每个调度命令语音的辅助任务

查询集为每个调度命令语音的目标任务

对于给定任务T_k，目标任务

为给定第k个调度命令语音的输入语音特征X_k，从而识别调度命令语音的语义信息

即

为在查询集上对应的标签集，其中目标任务记为

辅助任务

为给定第k个调度命令语音信息的输入语音特征X_k，识别语料中N个分词信息

为在支撑集上第n个辅助任务对应的标签集，

为第n个辅助任务，辅助任务记为

综上，对于每个调度命令语音的语义识别数据集，记为

进一步地，步骤202包括：

在任务T_k的每个辅助任务

上训练元学习器；

选择CNN-LSTM模型作为元学习器，则θ为元学习器的参数，所有的辅助任务

则辅助任务n在第n个支撑集上的损失为

在输入语音特征X_j通过元学***均作为这个阶段的总梯度，对于任务T_k，按照梯度下降法计算得到元学习器的新参数θ_k′为

获取临时元学习器。

进一步地，在元学习器之后添加一个用于学习知识迁移的网络层，称为迁移学习器，用于将辅助任务的知识迁移到目标任务上，步骤203包括：

输入语音特征X_k会依次通过元学习器和迁移学习器，只对迁移学习器进行训练，保证迁移学习器能够尽快学习知识迁移；

对任务T_k的目标任务

假设目标任务的输出概率

迁移学习器的参数为φ，学习率为β，任务T_k在这个阶段的损失

为

在查询集的目标任务上对参数φ求导计算相应的梯度

得到迁移学习器的参数更新方式为

需要说明的是，元学习器的参数都是通过计算损失进行调整的，先分开分别训练元学习器和迁移学习器，也就是说每一步都要计算损失，用训练得到的结果(标签)与实际情况进行比较，通过支撑集(辅助任务)数据先对元学习器的参数进行更新，再通过查询集(目标任务)数据对迁移学习器的参数进行更新。通过查询集(目标任务)对元学习器和迁移学习器进行训练，得到新的元学习器和迁移学习器的参数。

进一步地，步骤204包括：

基于训练集，对于每个任务T_k的目标任务

基于临时更新的元学***均作为本次迭代的总损失为

N为辅助任务个数；

采用梯度下降法，用总损失分别对元学习器θ和迁移学习器φ的参数(θ和φ)做求导，更新元学习器初始参数θ和迁移学习器初始参数φ，将γ作为微调的学习率，使得元学习器和迁移学习器能够朝着优化目标任务预测的方向发展，更新如下式：

需要说明的是，步骤3中，测试集也需要划分为支撑集和查询集，在测试集的支撑集上，利用步骤2训练得到的元学习器按照梯度下降法对训练集上临时元学习器参数进行微调，更新元学习参数，而迁移学习器不参与训练，对应参数也不更新；在测试集的查询集上，利用测试集微调后的元学习器参数

和训练集训练好的迁移学习器参数

直接预测测试集上调度命令语音的语义信息的标签。

需要说明的是，整体的步骤可以简化为(1)训练元学习器，更新元学习器参数；(2)训练迁移学习器更新迁移学习器参数；(3)对元学习器和迁移学习器整体训练，对元学习器参数进行微调；(4)完成以上步骤得到语音识别模型：元学习器+迁移学习器；(5)在测试集上，通过语音识别模型获取语义信息的标签。

进一步地，步骤4包括：

引入惩罚因子的弃风成本即为风力发电成本为

P_sfh为光伏发电功率的预测值，P_snh为光伏实际发电容量；

受风电、光伏波动的影响，采用自寻优的方式求解最小运行成本通过粒子群算法进行迭代，假设上一时刻点的运行成本为F，得到最小的运行成本

ma minF_mb＝F_ma+rand(F_ma)；

基于所述测试集上预测识别的调度语音命令的语义信息和分词信息的标签，识别出所需调度的新能源场站，通过新能源场站最小运行成本，获取最佳的新能源场站调度路径，将调度命令下达到新能源场。

根据上面获取的元学习器和迁移学习器的模型，通过调度语音命令的语义信息的标新，获得所需调度的新能源场站，根据所需调度的新能源场站寻找最优路径进行调度命令的下达，实现实时调度。

需要说明的是，本申请主要是训练学习器和迁移学习器进行语音识别，最小运行成本采用自寻优算法，根据上一时刻点的运行成本，通过自寻优粒子更新，得到最小的运行成本，获取到最佳的新能源场站调度策略。

电力虚拟调度的调度决策模型目标函数以新能源场站调度的运行成本最小，通过自寻优的调度决策算法，计算出最优的新能源场站调度策略(最小成本)，通过最小的新能源场站运行成本，获取到最佳的新能源场站调度路径，将调度策略下达至新能源场站。

实施例2

本实施例提供了一种基于元-多任务学习的电力虚拟调度***，该电力虚拟调度***包括：

元学习器模块和迁移学习器模块，基于训练集，训练元学习器和迁移学习器；

语义识别标签模块，基于测试集，利用训练好的元学习器和迁移学习器，预测测试集上调度语音命令的语义识别标签；

调度命令模块，基于语义识别标签，获取准确的调度目标，即所需要调度的新能源场站，通过新能源场站的最小运行成本获取达到调度目标的最佳调度路径，基于最小调度路径将调度命令下达至新能源场站。

实施例3

本实施例提供了一种计算机可读存储介质，该计算机可读存储介质存储有计算机程序，该计算机程序被处理器执行时实现权利要求实施例1基于元-多任务学习的电力虚拟调度方法。

对比例

通过本发明的模型(学习器和迁移学习器，MTML)获取的语料信息与现有技术相比，如表1所示，对于调度命令语音识别的准确率明显优于传统基于高斯混合模型的隐马尔可夫模型(GMM-HMM)和基于深度神经网络的隐马尔科夫模型(DNN-HMM)。

表1，本申请识别结果与现有技术识别结果的准确率对照表

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本发明的真正范围和精神由下面的权利要求指出。

应当理解的是，本发明并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。