CN117852695A

CN117852695A - 一种人工智能模型的自动迭代方法及装置

Info

Publication number: CN117852695A
Application number: CN202311818892.1A
Authority: CN
Inventors: 吴岩; 吴燕; 关石磊; 孟晓丽; 宋晓辉; 刘春秀; 李万彬; 古凌云; 尹惠; 陈洁; 周菲嫣; 郑格; 吕奋飞; 周在彦
Original assignee: State Grid Corp of China SGCC; China Electric Power Research Institute Co Ltd CEPRI; Dezhou Power Supply Co of State Grid Shandong Electric Power Co Ltd
Current assignee: State Grid Corp of China SGCC; China Electric Power Research Institute Co Ltd CEPRI; Dezhou Power Supply Co of State Grid Shandong Electric Power Co Ltd
Priority date: 2023-12-27
Filing date: 2023-12-27
Publication date: 2024-04-09

Abstract

本发明涉及电力预测技术领域，具体提供了一种人工智能模型的自动迭代方法及装置，利用原始模型对所采集的故障波形进行判断和标注；抽取故障波形，将判断结果与实际结果进行对比验证，测试达标率；结合获得的有效新样本与原有样本，构成有效新训练集，对算法模型进行迭代，构建新的算法模型；根据子验证集结果计算综合指标参数，判断是否达到阈值，最终得到新训练集与新模型，本发明采用人机结合自动迭代的模式，有针对性地自动对数据进行评判，保证数据的有效性，提高模型的精度，并自动化完成迭代，提高机器学习/深度学习算法模型的迭代效率。

Description

一种人工智能模型的自动迭代方法及装置

技术领域

本发明涉及电力预测技术领域，具体涉及一种人工智能模型的自动迭代方法及装置。

背景技术

新型电力***与人工智能的结合成为了电力***发展建设的必然趋势，大量的深度学习或机器学习模型不断地应用到电力***的各种应用场景中。模型的训练数据会随着时间的变化发生改变。常见的模型迭代方法有以下几种：

(1)手动训练

全量数据重新训练一个模型，直接合并历史训练数据与新增的数据，模型直接离线学习全量数据，学习得到一个全新的模型。是实际最为常见的模型迭代方式，通常模型效果也是最好的，但这样模型迭代比较耗时，资源耗费比较多，实时性较差，特别是在大数据场景更为困难；

(2)模型融合

将旧模型的预测结果作为一个新增特征，在新的数据上面训练一个新的模型。缩短了训练耗时，增加决策的复杂度，但是新增数据量要足够多才能保证融合效果，并且新的模型对旧模型依赖性较强，其优劣性很大程度取决于旧模型。

(3)增量(在线)学习

增量学习是一种机器学习方法，它允许在不重新训练整个模型的情况下，通过添加新的数据和标签来增强已经训练好的模型。与传统的批量学习不同，增量学习是一种增量式的学习过程，可以直接利用新增的数据在原来的模型的基础上做进一步更新实际使用中，在线学习和离线的全量学习经常是结合使用，能够在模型已经被训练好的情况下持续学习新的知识。比如离线以全量数据训练一个复杂的模型，在线利用新增样本进行微调。对内存十分友好，模型迭代快且效率较高，但是对离群点敏感，模型精度易受干扰。

综上，人工智能模型的迭代，需要定期地更新用于训练的数据，经过数据筛选、处理后重新训练模型，或是在原有模型基础上做增量训练，前者会带来多模型运维复杂、成本高、占用内存大等问题，具体表现为，模型越多版本管理越复杂，与模型越多人力成本越高；后者虽然对内存友好，但也不可避免离群数据点的干扰，具体表现为，新增数据的加入反而会使模型准确率、召回率等性能降低。针对人工智能模型迭代方法中多模型运维困难、版本管理复杂、离群数据点敏感的技术问题，目前尚未提出有效的解决方案。

发明内容

为了克服上述缺陷，本发明提出了一种人工智能模型的自动迭代方法及装置。

第一方面，提供一种人工智能模型的自动迭代方法，所述人工智能模型的自动迭代方法包括：

步骤S101采集配电终端设备记录的故障波形及其对应的故障类型，并将配电终端设备记录的故障波形及其对应的故障类型作为新增样本；

步骤S102利用原始人工智能模型对所述新增样本进行有效性验证；

步骤S103将通过有效性验证的新增样本与原始样本结合，得到新样本，并利用所述新样本对所述原始人工智能模型进行训练，得到新人工智能模型；

步骤S104对所述新人工智能模型进行性能验证，若所述新人工智能模型性能高于所述原始人工智能模型，则将所述新人工智能模型作为原始人工智能模型，将所述新样本作为原始样本，返回步骤S101，否则，返回步骤S101。

优选的，所述人工智能模型为机器学习模型或深度学习模型。

优选的，所述步骤S102，包括：

将所述新增样本中的配电终端设备记录的故障波形作为原始人工智能模型的输入，得到原始人工智能模型输出的所述新增样本中的配电终端设备记录的故障波形对应的故障类型预测结果；

判断原始人工智能模型输出的所述新增样本中的配电终端设备记录的故障波形对应的故障类型预测结果的准确率是否超过预设阈值，若是，则新增样本通过有效性验证，否则，新增样本不通过有效性验证。

进一步的，所述预设阈值为90％。

优选的，所述步骤S101中，当新增样本的数量超过原始样本的5％时，执行所述步骤S102。

优选的，所述对所述新人工智能模型进行性能验证，包括：

利用验证数据对所述新人工智能模型进行验证，得到所述新人工智能模型对应的综合指标参数；

若所述新人工智能模型对应的综合指标参数高于所述原始人工智能模型对应的综合指标参数，则所述新人工智能模型性能高于所述原始人工智能模型，否则，所述新人工智能模型性能不高于所述原始人工智能模型。

进一步的，所述综合指标参数包括下述中的至少一种：准确率、查准率、查全率、加权平均值。

进一步的，所述准确率的计算式如下：

所述查准率的计算式如下：

所述查全率的计算式如下：

上式中，Accuracy为准确率，TP为正类样本中预测正确的样本数，TN为负类样本中预测正确的样本数，ALL为样本总数量，Precision为查准率，FP为正类样本中预测错误的样本数，Recall为查全率，FN为负类样本中预测错误的样本数。

进一步的，所述加权平均值的计算式如下：

上式中，F_ω为加权平均值，ω₁、ω₂、ω₃分别为准确率、查准率、查全率对应权重。

优选的，所述人工智能模型的版本编号为va.x.i，其中，a的初始值为1，x的初始值为1，i的初始值为1。

进一步的，当每迭代执行所述方法时，令i＝i+1；

当对所述新人工智能模型进行性能验证后，所述新人工智能模型性能高于所述原始人工智能模型时，令x＝x+1，i＝1；

当所述新样本中包括的故障波形对应的故障类型的数量大于所述原始样本中包括的故障波形对应的故障类型的数量时，令a＝a+1，x＝1，i＝1。

第二方面，提供一种人工智能模型的自动迭代装置，所述人工智能模型的自动迭代装置包括：

采集模块，用于采集配电终端设备记录的故障波形及其对应的故障类型，并将配电终端设备记录的故障波形及其对应的故障类型作为新增样本；

验证模块，用于利用原始人工智能模型对所述新增样本进行有效性验证；

训练模块，用于将通过有效性验证的新增样本与原始样本结合，得到新样本，并利用所述新样本对所述原始人工智能模型进行训练，得到新人工智能模型；

分析模块，用于对所述新人工智能模型进行性能验证，若所述新人工智能模型性能高于所述原始人工智能模型，则将所述新人工智能模型作为原始人工智能模型，将所述新样本作为原始样本，返回采集模块，否则，返回采集模块。

第三方面，提供一种计算机设备，包括：一个或多个处理器；

所述处理器，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行时，实现所述的人工智能模型的自动迭代方法。

第四方面，提供一种计算机可读存储介质，其上存有计算机程序，所述计算机程序被执行时，实现所述的人工智能模型的自动迭代方法。

本发明上述一个或多个技术方案，至少具有如下一种或多种有益效果：

本发明涉及电力预测技术领域，具体提供了一种人工智能模型的自动迭代方法及装置，包括：步骤S101采集配电终端设备记录的故障波形及其对应的故障类型，并将配电终端设备记录的故障波形及其对应的故障类型作为新增样本；步骤S102利用原始人工智能模型对所述新增样本进行有效性验证；步骤S103将通过有效性验证的新增样本与原始样本结合，得到新样本，并利用所述新样本对所述原始人工智能模型进行训练，得到新人工智能模型；步骤S104对所述新人工智能模型进行性能验证，若所述新人工智能模型性能高于所述原始人工智能模型，则将所述新人工智能模型作为原始人工智能模型，将所述新样本作为原始样本，返回步骤S101，否则，返回步骤S101。本发明提供的技术方案，通过算法模型的自动迭代学习，降低建立模型的人工参与量，建立完算法模型后，能够进行自动迭代，提高模型的迭代效率，并通过对比数据有效性，保证模型的精度。

附图说明

图1是本发明实施例的人工智能模型的自动迭代方法的主要步骤流程示意图。

具体实施方式

下面结合附图对本发明的具体实施方式作进一步的详细说明。

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

如背景技术中所公开的，新型电力***与人工智能的结合成为了电力***发展建设的必然趋势，大量的深度学习或机器学习模型不断地应用到电力***的各种应用场景中。模型的训练数据会随着时间的变化发生改变。常见的模型迭代方法有以下几种：

(1)手动训练

(2)模型融合

(3)增量(在线)学习

为了改善上述问题，本发明涉及电力预测技术领域，具体提供了一种人工智能模型的自动迭代方法及装置，包括：步骤S101采集配电终端设备记录的故障波形及其对应的故障类型，并将配电终端设备记录的故障波形及其对应的故障类型作为新增样本；步骤S102利用原始人工智能模型对所述新增样本进行有效性验证；步骤S103将通过有效性验证的新增样本与原始样本结合，得到新样本，并利用所述新样本对所述原始人工智能模型进行训练，得到新人工智能模型；步骤S104对所述新人工智能模型进行性能验证，若所述新人工智能模型性能高于所述原始人工智能模型，则将所述新人工智能模型作为原始人工智能模型，将所述新样本作为原始样本，返回步骤S101，否则，返回步骤S101。本发明提供的技术方案，通过算法模型的自动迭代学习，降低建立模型的人工参与量，建立完算法模型后，能够进行自动迭代，提高模型的迭代效率，并通过对比数据有效性，保证模型的精度。

下面对上述方案进行详细阐述。

实施例1

参阅附图1，图1是本发明的一个实施例的人工智能模型的自动迭代方法的主要步骤流程示意图。如图1所示，本发明实施例中的人工智能模型的自动迭代方法主要包括以下步骤：

其中，所述人工智能模型为机器学习模型或深度学习模型。

本实施例中，所述步骤S102，包括：

其中，所述预设阈值为90％。

本实施例中，所述步骤S101中，当新增样本的数量超过原始样本的5％时，执行所述步骤S102。

本实施例中，所述对所述新人工智能模型进行性能验证，包括：

在一个实施方式中，所述综合指标参数包括下述中的至少一种：准确率、查准率、查全率、加权平均值。

在一个实施方式中，所述准确率的计算式如下：

所述查准率的计算式如下：

所述查全率的计算式如下：

所述加权平均值的计算式如下：

本实施例中，所述人工智能模型的版本编号为va.x.i，其中，a的初始值为1，x的初始值为1，i的初始值为1。

进一步的，当每迭代执行所述方法时，令i＝i+1；

在一个具体的实施方式中，按下述方式实施本发明提供的人工智能模型的自动迭代方法，具体为：

步骤1：获取初始训练集Ts(数据+类型)，初始深度学习模型m(版本号va.x.i，初始模型参数，m＝1，a＝1，x＝1，i＝1)；

具体地，所述初始模型版本号为v1.1.1；所述模型版本号的命名规律为，当综合指标参数较原始模型有所提升，x＝x+1，i从1开始计数；当模型输入\输出类型发生改变时，a＝a+1，x和i从1开始计数。

步骤2：对训练集和模型进行校验，查看是否可读取，及时剔除废数据(无效数据)；

步骤3：新增测试集数据数量≥5％原始训练集数据数量，进行步骤4；

具体地，若新增数据较少，对模型的改进效果不明显，会造成内存空间浪费、模型训练无效等问题，此处设置5％原始训练集数据数量，采取合理的迭代周期，有秩序、自动化处理新增数据。

步骤4：抽取测试集样本，利用现有模型对样本结果类型与实际结果进行对比验证，达标率满足90％时，进行步骤5，否则退出流程；

具体地，在数据进入模型迭代之前，进行数据的初筛，抽取新增的故障波形，将判断结果与实际结果进行对比验证，达标率需满足一定标准方可判为有效样本数据，保障新增数据的有效性。

本实施例中,模型数据评估可根据线上搜集来的数据情况采取合理的迭代周期,所述数据情况包含数据数量情况和验证情况，保证数据的“质”和“量”,计算原始模型与迭代模型的综合指标参数并对比，通过简单的数值逻辑运算或运维人员决定是否进行模型更换迭代。

步骤5：将新增测试集添加至原始训练集，构成新训练集；

步骤6：按照7：3将训练集i划分为子训练集和子验证集，对训练集i进行训练；

步骤7：定义可以综合评价模型性能的指标，通过验证结果计算综合指标参数；

进一步说明，在机器学习中，对于一个模型的性能评估是必不可少的。准确率(Accuracy)、查准率(Precision)、查全率(Recall)是常见的基本指标。Accuracy表示所有样本中，被正确预测的样本占比，反应出模型对所有样本的预测准确性；Precision表示所有预测为正例的样本中，真正为正例的样本占比，反应出模型的误判率；Recall表示所有真正为正例的样本中，被模型预测为正例的样本占比，反应出模型的漏判率。

以上指标只能单一的体现模型研判的精度，缺少一种综合指标参数。本发明提出一种综合指标参数，利用加权平均值综合考虑各个指标的影响。

进一步说明，加权平均值是权衡一组数据整体水平的重要指标，即将各数值乘以相应的权数，然后加总求和得到总体值，再除以总的单位数。加权平均值的大小不仅取决于总体中各单位的数值(变量值)的大小，还取决于各数值的重要程度。

具体地，比重越大，对整组数据的平均数影响越大，比重起着权衡数据的作用。比重可以根据模型对不同指标性能的侧重而设定，ω₁、ω₂、ω₃默认初始值设定为0.4，0.3，0.3。

步骤8：将计算得到的新模型综合指标参数与原始模型综合指标参数做对比，对比新旧模型综合性能，判断是否能够进行模型替换，若新模型综合指标参数≥原始模型综合指标参数，进行下一步，反之，则退出流程；

通过数值逻辑运算，实现、模型自动迭代更新，并根据新旧数据自动划分训练集、验证集，进行新旧两个版本的模型效果评估,计算综合指标参数，根据计算结果对模型的优劣进行评判，科学有效地评定模型是否得到改进，判断是否需要进行模型替换，。

步骤9：训练得到新模型m，m＝m+1，i＝i+1(模型版本号va.x.i)，输出训练集Ts、模型m。

本实施例中,模型版本的命名方式严格按模型类型及性能命名,此种命名方式最大的优点是及时舍弃没用的数据信息，由最少而精的信息保证了模型的性能，同时保证版本的唯一性,方便版本管理。

实施例2

基于同一种发明构思，本发明还提供了一种人工智能模型的自动迭代装置，所述人工智能模型的自动迭代装置包括：

优选的，所述步骤S102，包括：

进一步的，所述预设阈值为90％。

优选的，所述对所述新人工智能模型进行性能验证，包括：

进一步的，所述准确率的计算式如下：

所述查准率的计算式如下：

所述查全率的计算式如下：

进一步的，所述加权平均值的计算式如下：

进一步的，当每迭代执行所述方法时，令i＝i+1；

实施例3

基于同一种发明构思，本发明还提供了一种计算机设备，该计算机设备包括处理器以及存储器，所述存储器用于存储计算机程序，所述计算机程序包括程序指令，所述处理器用于执行所述计算机存储介质存储的程序指令。处理器可能是中央处理单元(CentralProcessing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital SignalProcessor、DSP)、专用集成电路(Application SpecificIntegrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable GateArray，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等，其是终端的计算核心以及控制核心，其适于实现一条或一条以上指令，具体适于加载并执行计算机存储介质内一条或一条以上指令从而实现相应方法流程或相应功能，以实现上述实施例中一种人工智能模型的自动迭代方法的步骤。

实施例4

基于同一种发明构思，本发明还提供了一种存储介质，具体为计算机可读存储介质(Memory)，所述计算机可读存储介质是计算机设备中的记忆设备，用于存放程序和数据。可以理解的是，此处的计算机可读存储介质既可以包括计算机设备中的内置存储介质，当然也可以包括计算机设备所支持的扩展存储介质。计算机可读存储介质提供存储空间，该存储空间存储了终端的操作***。并且，在该存储空间中还存放了适于被处理器加载并执行的一条或一条以上的指令，这些指令可以是一个或一个以上的计算机程序(包括程序代码)。需要说明的是，此处的计算机可读存储介质可以是高速RAM存储器，也可以是非不稳定的存储器(non-volatile memory)，例如至少一个磁盘存储器。可由处理器加载并执行计算机可读存储介质中存放的一条或一条以上指令，以实现上述实施例中一种人工智能模型的自动迭代方法的步骤。

本领域内的技术人员应明白，本发明的实施例可提供为方法、***、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

最后应当说明的是：以上实施例仅用以说明本发明的技术方案而非对其限制，尽管参照上述实施例对本发明进行了详细的说明，所属领域的普通技术人员应当理解：依然可以对本发明的具体实施方式进行修改或者等同替换，而未脱离本发明精神和范围的任何修改或者等同替换，其均应涵盖在本发明的权利要求保护范围之内。

Claims

1.一种人工智能模型的自动迭代方法，其特征在于，所述方法包括：

2.如权利要求1所述的方法，其特征在于，所述人工智能模型为机器学习模型或深度学习模型。

3.如权利要求1所述的方法，其特征在于，所述步骤S102，包括：

4.如权利要求3所述的方法，其特征在于，所述预设阈值为90％。

5.如权利要求1所述的方法，其特征在于，所述步骤S101中，当新增样本的数量超过原始样本的5％时，执行所述步骤S102。

6.如权利要求1所述的方法，其特征在于，所述对所述新人工智能模型进行性能验证，包括：

7.如权利要求6所述的方法，其特征在于，所述综合指标参数包括下述中的至少一种：准确率、查准率、查全率、加权平均值。

8.如权利要求7所述的方法，其特征在于，所述准确率的计算式如下：

所述查准率的计算式如下：

所述查全率的计算式如下：

9.如权利要求8所述的方法，其特征在于，所述加权平均值的计算式如下：

10.如权利要求1所述的方法，其特征在于，所述人工智能模型的版本编号为va.x.i，其中，a的初始值为1，x的初始值为1，i的初始值为1。

11.如权利要求10所述的方法，其特征在于，当每迭代执行所述方法时，令i＝i+1；

12.一种人工智能模型的自动迭代装置，其特征在于，所述装置包括：

13.一种计算机设备，其特征在于，包括：一个或多个处理器；

所述处理器，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行时，实现如权利要求1至11中任意一项所述的人工智能模型的自动迭代方法。

14.一种计算机可读存储介质，其特征在于，其上存有计算机程序，所述计算机程序被执行时，实现如权利要求1至11中任意一项所述的人工智能模型的自动迭代方法。