CN117852695A - 一种人工智能模型的自动迭代方法及装置 - Google Patents
一种人工智能模型的自动迭代方法及装置 Download PDFInfo
- Publication number
- CN117852695A CN117852695A CN202311818892.1A CN202311818892A CN117852695A CN 117852695 A CN117852695 A CN 117852695A CN 202311818892 A CN202311818892 A CN 202311818892A CN 117852695 A CN117852695 A CN 117852695A
- Authority
- CN
- China
- Prior art keywords
- model
- new
- original
- sample
- artificial intelligent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000012549 training Methods 0.000 claims abstract description 42
- 238000012795 verification Methods 0.000 claims abstract description 41
- 238000013473 artificial intelligence Methods 0.000 claims description 61
- 238000009826 distribution Methods 0.000 claims description 28
- 238000003860 storage Methods 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 11
- 238000010801 machine learning Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000013136 deep learning model Methods 0.000 claims description 5
- 238000004458 analytical method Methods 0.000 claims description 3
- 239000002131 composite material Substances 0.000 claims description 2
- 238000004422 calculation algorithm Methods 0.000 abstract description 6
- 238000012360 testing method Methods 0.000 abstract description 4
- 238000012545 processing Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000012423 maintenance Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000004927 fusion Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011157 data evaluation Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Development Economics (AREA)
- Tourism & Hospitality (AREA)
- Operations Research (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Mathematical Physics (AREA)
- Entrepreneurship & Innovation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computational Mathematics (AREA)
- Game Theory and Decision Science (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Educational Administration (AREA)
- Primary Health Care (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Water Supply & Treatment (AREA)
- Probability & Statistics with Applications (AREA)
- Public Health (AREA)
Abstract
本发明涉及电力预测技术领域,具体提供了一种人工智能模型的自动迭代方法及装置,利用原始模型对所采集的故障波形进行判断和标注;抽取故障波形,将判断结果与实际结果进行对比验证,测试达标率;结合获得的有效新样本与原有样本,构成有效新训练集,对算法模型进行迭代,构建新的算法模型;根据子验证集结果计算综合指标参数,判断是否达到阈值,最终得到新训练集与新模型,本发明采用人机结合自动迭代的模式,有针对性地自动对数据进行评判,保证数据的有效性,提高模型的精度,并自动化完成迭代,提高机器学习/深度学习算法模型的迭代效率。
Description
技术领域
本发明涉及电力预测技术领域,具体涉及一种人工智能模型的自动迭代方法及装置。
背景技术
新型电力***与人工智能的结合成为了电力***发展建设的必然趋势,大量的深度学习或机器学习模型不断地应用到电力***的各种应用场景中。模型的训练数据会随着时间的变化发生改变。常见的模型迭代方法有以下几种:
(1)手动训练
全量数据重新训练一个模型,直接合并历史训练数据与新增的数据,模型直接离线学习全量数据,学习得到一个全新的模型。是实际最为常见的模型迭代方式,通常模型效果也是最好的,但这样模型迭代比较耗时,资源耗费比较多,实时性较差,特别是在大数据场景更为困难;
(2)模型融合
将旧模型的预测结果作为一个新增特征,在新的数据上面训练一个新的模型。缩短了训练耗时,增加决策的复杂度,但是新增数据量要足够多才能保证融合效果,并且新的模型对旧模型依赖性较强,其优劣性很大程度取决于旧模型。
(3)增量(在线)学习
增量学习是一种机器学习方法,它允许在不重新训练整个模型的情况下,通过添加新的数据和标签来增强已经训练好的模型。与传统的批量学习不同,增量学习是一种增量式的学习过程,可以直接利用新增的数据在原来的模型的基础上做进一步更新实际使用中,在线学习和离线的全量学习经常是结合使用,能够在模型已经被训练好的情况下持续学习新的知识。比如离线以全量数据训练一个复杂的模型,在线利用新增样本进行微调。对内存十分友好,模型迭代快且效率较高,但是对离群点敏感,模型精度易受干扰。
综上,人工智能模型的迭代,需要定期地更新用于训练的数据,经过数据筛选、处理后重新训练模型,或是在原有模型基础上做增量训练,前者会带来多模型运维复杂、成本高、占用内存大等问题,具体表现为,模型越多版本管理越复杂,与模型越多人力成本越高;后者虽然对内存友好,但也不可避免离群数据点的干扰,具体表现为,新增数据的加入反而会使模型准确率、召回率等性能降低。针对人工智能模型迭代方法中多模型运维困难、版本管理复杂、离群数据点敏感的技术问题,目前尚未提出有效的解决方案。
发明内容
为了克服上述缺陷,本发明提出了一种人工智能模型的自动迭代方法及装置。
第一方面,提供一种人工智能模型的自动迭代方法,所述人工智能模型的自动迭代方法包括:
步骤S101采集配电终端设备记录的故障波形及其对应的故障类型,并将配电终端设备记录的故障波形及其对应的故障类型作为新增样本;
步骤S102利用原始人工智能模型对所述新增样本进行有效性验证;
步骤S103将通过有效性验证的新增样本与原始样本结合,得到新样本,并利用所述新样本对所述原始人工智能模型进行训练,得到新人工智能模型;
步骤S104对所述新人工智能模型进行性能验证,若所述新人工智能模型性能高于所述原始人工智能模型,则将所述新人工智能模型作为原始人工智能模型,将所述新样本作为原始样本,返回步骤S101,否则,返回步骤S101。
优选的,所述人工智能模型为机器学习模型或深度学习模型。
优选的,所述步骤S102,包括:
将所述新增样本中的配电终端设备记录的故障波形作为原始人工智能模型的输入,得到原始人工智能模型输出的所述新增样本中的配电终端设备记录的故障波形对应的故障类型预测结果;
判断原始人工智能模型输出的所述新增样本中的配电终端设备记录的故障波形对应的故障类型预测结果的准确率是否超过预设阈值,若是,则新增样本通过有效性验证,否则,新增样本不通过有效性验证。
进一步的,所述预设阈值为90%。
优选的,所述步骤S101中,当新增样本的数量超过原始样本的5%时,执行所述步骤S102。
优选的,所述对所述新人工智能模型进行性能验证,包括:
利用验证数据对所述新人工智能模型进行验证,得到所述新人工智能模型对应的综合指标参数;
若所述新人工智能模型对应的综合指标参数高于所述原始人工智能模型对应的综合指标参数,则所述新人工智能模型性能高于所述原始人工智能模型,否则,所述新人工智能模型性能不高于所述原始人工智能模型。
进一步的,所述综合指标参数包括下述中的至少一种:准确率、查准率、查全率、加权平均值。
进一步的,所述准确率的计算式如下:
所述查准率的计算式如下:
所述查全率的计算式如下:
上式中,Accuracy为准确率,TP为正类样本中预测正确的样本数,TN为负类样本中预测正确的样本数,ALL为样本总数量,Precision为查准率,FP为正类样本中预测错误的样本数,Recall为查全率,FN为负类样本中预测错误的样本数。
进一步的,所述加权平均值的计算式如下:
上式中,Fω为加权平均值,ω1、ω2、ω3分别为准确率、查准率、查全率对应权重。
优选的,所述人工智能模型的版本编号为va.x.i,其中,a的初始值为1,x的初始值为1,i的初始值为1。
进一步的,当每迭代执行所述方法时,令i=i+1;
当对所述新人工智能模型进行性能验证后,所述新人工智能模型性能高于所述原始人工智能模型时,令x=x+1,i=1;
当所述新样本中包括的故障波形对应的故障类型的数量大于所述原始样本中包括的故障波形对应的故障类型的数量时,令a=a+1,x=1,i=1。
第二方面,提供一种人工智能模型的自动迭代装置,所述人工智能模型的自动迭代装置包括:
采集模块,用于采集配电终端设备记录的故障波形及其对应的故障类型,并将配电终端设备记录的故障波形及其对应的故障类型作为新增样本;
验证模块,用于利用原始人工智能模型对所述新增样本进行有效性验证;
训练模块,用于将通过有效性验证的新增样本与原始样本结合,得到新样本,并利用所述新样本对所述原始人工智能模型进行训练,得到新人工智能模型;
分析模块,用于对所述新人工智能模型进行性能验证,若所述新人工智能模型性能高于所述原始人工智能模型,则将所述新人工智能模型作为原始人工智能模型,将所述新样本作为原始样本,返回采集模块,否则,返回采集模块。
第三方面,提供一种计算机设备,包括:一个或多个处理器;
所述处理器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,实现所述的人工智能模型的自动迭代方法。
第四方面,提供一种计算机可读存储介质,其上存有计算机程序,所述计算机程序被执行时,实现所述的人工智能模型的自动迭代方法。
本发明上述一个或多个技术方案,至少具有如下一种或多种有益效果:
本发明涉及电力预测技术领域,具体提供了一种人工智能模型的自动迭代方法及装置,包括:步骤S101采集配电终端设备记录的故障波形及其对应的故障类型,并将配电终端设备记录的故障波形及其对应的故障类型作为新增样本;步骤S102利用原始人工智能模型对所述新增样本进行有效性验证;步骤S103将通过有效性验证的新增样本与原始样本结合,得到新样本,并利用所述新样本对所述原始人工智能模型进行训练,得到新人工智能模型;步骤S104对所述新人工智能模型进行性能验证,若所述新人工智能模型性能高于所述原始人工智能模型,则将所述新人工智能模型作为原始人工智能模型,将所述新样本作为原始样本,返回步骤S101,否则,返回步骤S101。本发明提供的技术方案,通过算法模型的自动迭代学习,降低建立模型的人工参与量,建立完算法模型后,能够进行自动迭代,提高模型的迭代效率,并通过对比数据有效性,保证模型的精度。
附图说明
图1是本发明实施例的人工智能模型的自动迭代方法的主要步骤流程示意图。
具体实施方式
下面结合附图对本发明的具体实施方式作进一步的详细说明。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
如背景技术中所公开的,新型电力***与人工智能的结合成为了电力***发展建设的必然趋势,大量的深度学习或机器学习模型不断地应用到电力***的各种应用场景中。模型的训练数据会随着时间的变化发生改变。常见的模型迭代方法有以下几种:
(1)手动训练
全量数据重新训练一个模型,直接合并历史训练数据与新增的数据,模型直接离线学习全量数据,学习得到一个全新的模型。是实际最为常见的模型迭代方式,通常模型效果也是最好的,但这样模型迭代比较耗时,资源耗费比较多,实时性较差,特别是在大数据场景更为困难;
(2)模型融合
将旧模型的预测结果作为一个新增特征,在新的数据上面训练一个新的模型。缩短了训练耗时,增加决策的复杂度,但是新增数据量要足够多才能保证融合效果,并且新的模型对旧模型依赖性较强,其优劣性很大程度取决于旧模型。
(3)增量(在线)学习
增量学习是一种机器学习方法,它允许在不重新训练整个模型的情况下,通过添加新的数据和标签来增强已经训练好的模型。与传统的批量学习不同,增量学习是一种增量式的学习过程,可以直接利用新增的数据在原来的模型的基础上做进一步更新实际使用中,在线学习和离线的全量学习经常是结合使用,能够在模型已经被训练好的情况下持续学习新的知识。比如离线以全量数据训练一个复杂的模型,在线利用新增样本进行微调。对内存十分友好,模型迭代快且效率较高,但是对离群点敏感,模型精度易受干扰。
综上,人工智能模型的迭代,需要定期地更新用于训练的数据,经过数据筛选、处理后重新训练模型,或是在原有模型基础上做增量训练,前者会带来多模型运维复杂、成本高、占用内存大等问题,具体表现为,模型越多版本管理越复杂,与模型越多人力成本越高;后者虽然对内存友好,但也不可避免离群数据点的干扰,具体表现为,新增数据的加入反而会使模型准确率、召回率等性能降低。针对人工智能模型迭代方法中多模型运维困难、版本管理复杂、离群数据点敏感的技术问题,目前尚未提出有效的解决方案。
为了改善上述问题,本发明涉及电力预测技术领域,具体提供了一种人工智能模型的自动迭代方法及装置,包括:步骤S101采集配电终端设备记录的故障波形及其对应的故障类型,并将配电终端设备记录的故障波形及其对应的故障类型作为新增样本;步骤S102利用原始人工智能模型对所述新增样本进行有效性验证;步骤S103将通过有效性验证的新增样本与原始样本结合,得到新样本,并利用所述新样本对所述原始人工智能模型进行训练,得到新人工智能模型;步骤S104对所述新人工智能模型进行性能验证,若所述新人工智能模型性能高于所述原始人工智能模型,则将所述新人工智能模型作为原始人工智能模型,将所述新样本作为原始样本,返回步骤S101,否则,返回步骤S101。本发明提供的技术方案,通过算法模型的自动迭代学习,降低建立模型的人工参与量,建立完算法模型后,能够进行自动迭代,提高模型的迭代效率,并通过对比数据有效性,保证模型的精度。
下面对上述方案进行详细阐述。
实施例1
参阅附图1,图1是本发明的一个实施例的人工智能模型的自动迭代方法的主要步骤流程示意图。如图1所示,本发明实施例中的人工智能模型的自动迭代方法主要包括以下步骤:
步骤S101采集配电终端设备记录的故障波形及其对应的故障类型,并将配电终端设备记录的故障波形及其对应的故障类型作为新增样本;
步骤S102利用原始人工智能模型对所述新增样本进行有效性验证;
步骤S103将通过有效性验证的新增样本与原始样本结合,得到新样本,并利用所述新样本对所述原始人工智能模型进行训练,得到新人工智能模型;
步骤S104对所述新人工智能模型进行性能验证,若所述新人工智能模型性能高于所述原始人工智能模型,则将所述新人工智能模型作为原始人工智能模型,将所述新样本作为原始样本,返回步骤S101,否则,返回步骤S101。
其中,所述人工智能模型为机器学习模型或深度学习模型。
本实施例中,所述步骤S102,包括:
将所述新增样本中的配电终端设备记录的故障波形作为原始人工智能模型的输入,得到原始人工智能模型输出的所述新增样本中的配电终端设备记录的故障波形对应的故障类型预测结果;
判断原始人工智能模型输出的所述新增样本中的配电终端设备记录的故障波形对应的故障类型预测结果的准确率是否超过预设阈值,若是,则新增样本通过有效性验证,否则,新增样本不通过有效性验证。
其中,所述预设阈值为90%。
本实施例中,所述步骤S101中,当新增样本的数量超过原始样本的5%时,执行所述步骤S102。
本实施例中,所述对所述新人工智能模型进行性能验证,包括:
利用验证数据对所述新人工智能模型进行验证,得到所述新人工智能模型对应的综合指标参数;
若所述新人工智能模型对应的综合指标参数高于所述原始人工智能模型对应的综合指标参数,则所述新人工智能模型性能高于所述原始人工智能模型,否则,所述新人工智能模型性能不高于所述原始人工智能模型。
在一个实施方式中,所述综合指标参数包括下述中的至少一种:准确率、查准率、查全率、加权平均值。
在一个实施方式中,所述准确率的计算式如下:
所述查准率的计算式如下:
所述查全率的计算式如下:
上式中,Accuracy为准确率,TP为正类样本中预测正确的样本数,TN为负类样本中预测正确的样本数,ALL为样本总数量,Precision为查准率,FP为正类样本中预测错误的样本数,Recall为查全率,FN为负类样本中预测错误的样本数。
所述加权平均值的计算式如下:
上式中,Fω为加权平均值,ω1、ω2、ω3分别为准确率、查准率、查全率对应权重。
本实施例中,所述人工智能模型的版本编号为va.x.i,其中,a的初始值为1,x的初始值为1,i的初始值为1。
进一步的,当每迭代执行所述方法时,令i=i+1;
当对所述新人工智能模型进行性能验证后,所述新人工智能模型性能高于所述原始人工智能模型时,令x=x+1,i=1;
当所述新样本中包括的故障波形对应的故障类型的数量大于所述原始样本中包括的故障波形对应的故障类型的数量时,令a=a+1,x=1,i=1。
在一个具体的实施方式中,按下述方式实施本发明提供的人工智能模型的自动迭代方法,具体为:
步骤1:获取初始训练集Ts(数据+类型),初始深度学习模型m(版本号va.x.i,初始模型参数,m=1,a=1,x=1,i=1);
具体地,所述初始模型版本号为v1.1.1;所述模型版本号的命名规律为,当综合指标参数较原始模型有所提升,x=x+1,i从1开始计数;当模型输入\输出类型发生改变时,a=a+1,x和i从1开始计数。
步骤2:对训练集和模型进行校验,查看是否可读取,及时剔除废数据(无效数据);
步骤3:新增测试集数据数量≥5%原始训练集数据数量,进行步骤4;
具体地,若新增数据较少,对模型的改进效果不明显,会造成内存空间浪费、模型训练无效等问题,此处设置5%原始训练集数据数量,采取合理的迭代周期,有秩序、自动化处理新增数据。
步骤4:抽取测试集样本,利用现有模型对样本结果类型与实际结果进行对比验证,达标率满足90%时,进行步骤5,否则退出流程;
具体地,在数据进入模型迭代之前,进行数据的初筛,抽取新增的故障波形,将判断结果与实际结果进行对比验证,达标率需满足一定标准方可判为有效样本数据,保障新增数据的有效性。
本实施例中,模型数据评估可根据线上搜集来的数据情况采取合理的迭代周期,所述数据情况包含数据数量情况和验证情况,保证数据的“质”和“量”,计算原始模型与迭代模型的综合指标参数并对比,通过简单的数值逻辑运算或运维人员决定是否进行模型更换迭代。
步骤5:将新增测试集添加至原始训练集,构成新训练集;
步骤6:按照7:3将训练集i划分为子训练集和子验证集,对训练集i进行训练;
步骤7:定义可以综合评价模型性能的指标,通过验证结果计算综合指标参数;
进一步说明,在机器学习中,对于一个模型的性能评估是必不可少的。准确率(Accuracy)、查准率(Precision)、查全率(Recall)是常见的基本指标。Accuracy表示所有样本中,被正确预测的样本占比,反应出模型对所有样本的预测准确性;Precision表示所有预测为正例的样本中,真正为正例的样本占比,反应出模型的误判率;Recall表示所有真正为正例的样本中,被模型预测为正例的样本占比,反应出模型的漏判率。
以上指标只能单一的体现模型研判的精度,缺少一种综合指标参数。本发明提出一种综合指标参数,利用加权平均值综合考虑各个指标的影响。
进一步说明,加权平均值是权衡一组数据整体水平的重要指标,即将各数值乘以相应的权数,然后加总求和得到总体值,再除以总的单位数。加权平均值的大小不仅取决于总体中各单位的数值(变量值)的大小,还取决于各数值的重要程度。
具体地,比重越大,对整组数据的平均数影响越大,比重起着权衡数据的作用。比重可以根据模型对不同指标性能的侧重而设定,ω1、ω2、ω3默认初始值设定为0.4,0.3,0.3。
步骤8:将计算得到的新模型综合指标参数与原始模型综合指标参数做对比,对比新旧模型综合性能,判断是否能够进行模型替换,若新模型综合指标参数≥原始模型综合指标参数,进行下一步,反之,则退出流程;
通过数值逻辑运算,实现、模型自动迭代更新,并根据新旧数据自动划分训练集、验证集,进行新旧两个版本的模型效果评估,计算综合指标参数,根据计算结果对模型的优劣进行评判,科学有效地评定模型是否得到改进,判断是否需要进行模型替换,。
步骤9:训练得到新模型m,m=m+1,i=i+1(模型版本号va.x.i),输出训练集Ts、模型m。
本实施例中,模型版本的命名方式严格按模型类型及性能命名,此种命名方式最大的优点是及时舍弃没用的数据信息,由最少而精的信息保证了模型的性能,同时保证版本的唯一性,方便版本管理。
实施例2
基于同一种发明构思,本发明还提供了一种人工智能模型的自动迭代装置,所述人工智能模型的自动迭代装置包括:
采集模块,用于采集配电终端设备记录的故障波形及其对应的故障类型,并将配电终端设备记录的故障波形及其对应的故障类型作为新增样本;
验证模块,用于利用原始人工智能模型对所述新增样本进行有效性验证;
训练模块,用于将通过有效性验证的新增样本与原始样本结合,得到新样本,并利用所述新样本对所述原始人工智能模型进行训练,得到新人工智能模型;
分析模块,用于对所述新人工智能模型进行性能验证,若所述新人工智能模型性能高于所述原始人工智能模型,则将所述新人工智能模型作为原始人工智能模型,将所述新样本作为原始样本,返回采集模块,否则,返回采集模块。
优选的,所述人工智能模型为机器学习模型或深度学习模型。
优选的,所述步骤S102,包括:
将所述新增样本中的配电终端设备记录的故障波形作为原始人工智能模型的输入,得到原始人工智能模型输出的所述新增样本中的配电终端设备记录的故障波形对应的故障类型预测结果;
判断原始人工智能模型输出的所述新增样本中的配电终端设备记录的故障波形对应的故障类型预测结果的准确率是否超过预设阈值,若是,则新增样本通过有效性验证,否则,新增样本不通过有效性验证。
进一步的,所述预设阈值为90%。
优选的,所述步骤S101中,当新增样本的数量超过原始样本的5%时,执行所述步骤S102。
优选的,所述对所述新人工智能模型进行性能验证,包括:
利用验证数据对所述新人工智能模型进行验证,得到所述新人工智能模型对应的综合指标参数;
若所述新人工智能模型对应的综合指标参数高于所述原始人工智能模型对应的综合指标参数,则所述新人工智能模型性能高于所述原始人工智能模型,否则,所述新人工智能模型性能不高于所述原始人工智能模型。
进一步的,所述综合指标参数包括下述中的至少一种:准确率、查准率、查全率、加权平均值。
进一步的,所述准确率的计算式如下:
所述查准率的计算式如下:
所述查全率的计算式如下:
上式中,Accuracy为准确率,TP为正类样本中预测正确的样本数,TN为负类样本中预测正确的样本数,ALL为样本总数量,Precision为查准率,FP为正类样本中预测错误的样本数,Recall为查全率,FN为负类样本中预测错误的样本数。
进一步的,所述加权平均值的计算式如下:
上式中,Fω为加权平均值,ω1、ω2、ω3分别为准确率、查准率、查全率对应权重。
优选的,所述人工智能模型的版本编号为va.x.i,其中,a的初始值为1,x的初始值为1,i的初始值为1。
进一步的,当每迭代执行所述方法时,令i=i+1;
当对所述新人工智能模型进行性能验证后,所述新人工智能模型性能高于所述原始人工智能模型时,令x=x+1,i=1;
当所述新样本中包括的故障波形对应的故障类型的数量大于所述原始样本中包括的故障波形对应的故障类型的数量时,令a=a+1,x=1,i=1。
实施例3
基于同一种发明构思,本发明还提供了一种计算机设备,该计算机设备包括处理器以及存储器,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器用于执行所述计算机存储介质存储的程序指令。处理器可能是中央处理单元(CentralProcessing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital SignalProcessor、DSP)、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其是终端的计算核心以及控制核心,其适于实现一条或一条以上指令,具体适于加载并执行计算机存储介质内一条或一条以上指令从而实现相应方法流程或相应功能,以实现上述实施例中一种人工智能模型的自动迭代方法的步骤。
实施例4
基于同一种发明构思,本发明还提供了一种存储介质,具体为计算机可读存储介质(Memory),所述计算机可读存储介质是计算机设备中的记忆设备,用于存放程序和数据。可以理解的是,此处的计算机可读存储介质既可以包括计算机设备中的内置存储介质,当然也可以包括计算机设备所支持的扩展存储介质。计算机可读存储介质提供存储空间,该存储空间存储了终端的操作***。并且,在该存储空间中还存放了适于被处理器加载并执行的一条或一条以上的指令,这些指令可以是一个或一个以上的计算机程序(包括程序代码)。需要说明的是,此处的计算机可读存储介质可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。可由处理器加载并执行计算机可读存储介质中存放的一条或一条以上指令,以实现上述实施例中一种人工智能模型的自动迭代方法的步骤。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。
Claims (14)
1.一种人工智能模型的自动迭代方法,其特征在于,所述方法包括:
步骤S101采集配电终端设备记录的故障波形及其对应的故障类型,并将配电终端设备记录的故障波形及其对应的故障类型作为新增样本;
步骤S102利用原始人工智能模型对所述新增样本进行有效性验证;
步骤S103将通过有效性验证的新增样本与原始样本结合,得到新样本,并利用所述新样本对所述原始人工智能模型进行训练,得到新人工智能模型;
步骤S104对所述新人工智能模型进行性能验证,若所述新人工智能模型性能高于所述原始人工智能模型,则将所述新人工智能模型作为原始人工智能模型,将所述新样本作为原始样本,返回步骤S101,否则,返回步骤S101。
2.如权利要求1所述的方法,其特征在于,所述人工智能模型为机器学习模型或深度学习模型。
3.如权利要求1所述的方法,其特征在于,所述步骤S102,包括:
将所述新增样本中的配电终端设备记录的故障波形作为原始人工智能模型的输入,得到原始人工智能模型输出的所述新增样本中的配电终端设备记录的故障波形对应的故障类型预测结果;
判断原始人工智能模型输出的所述新增样本中的配电终端设备记录的故障波形对应的故障类型预测结果的准确率是否超过预设阈值,若是,则新增样本通过有效性验证,否则,新增样本不通过有效性验证。
4.如权利要求3所述的方法,其特征在于,所述预设阈值为90%。
5.如权利要求1所述的方法,其特征在于,所述步骤S101中,当新增样本的数量超过原始样本的5%时,执行所述步骤S102。
6.如权利要求1所述的方法,其特征在于,所述对所述新人工智能模型进行性能验证,包括:
利用验证数据对所述新人工智能模型进行验证,得到所述新人工智能模型对应的综合指标参数;
若所述新人工智能模型对应的综合指标参数高于所述原始人工智能模型对应的综合指标参数,则所述新人工智能模型性能高于所述原始人工智能模型,否则,所述新人工智能模型性能不高于所述原始人工智能模型。
7.如权利要求6所述的方法,其特征在于,所述综合指标参数包括下述中的至少一种:准确率、查准率、查全率、加权平均值。
8.如权利要求7所述的方法,其特征在于,所述准确率的计算式如下:
所述查准率的计算式如下:
所述查全率的计算式如下:
上式中,Accuracy为准确率,TP为正类样本中预测正确的样本数,TN为负类样本中预测正确的样本数,ALL为样本总数量,Precision为查准率,FP为正类样本中预测错误的样本数,Recall为查全率,FN为负类样本中预测错误的样本数。
9.如权利要求8所述的方法,其特征在于,所述加权平均值的计算式如下:
上式中,Fω为加权平均值,ω1、ω2、ω3分别为准确率、查准率、查全率对应权重。
10.如权利要求1所述的方法,其特征在于,所述人工智能模型的版本编号为va.x.i,其中,a的初始值为1,x的初始值为1,i的初始值为1。
11.如权利要求10所述的方法,其特征在于,当每迭代执行所述方法时,令i=i+1;
当对所述新人工智能模型进行性能验证后,所述新人工智能模型性能高于所述原始人工智能模型时,令x=x+1,i=1;
当所述新样本中包括的故障波形对应的故障类型的数量大于所述原始样本中包括的故障波形对应的故障类型的数量时,令a=a+1,x=1,i=1。
12.一种人工智能模型的自动迭代装置,其特征在于,所述装置包括:
采集模块,用于采集配电终端设备记录的故障波形及其对应的故障类型,并将配电终端设备记录的故障波形及其对应的故障类型作为新增样本;
验证模块,用于利用原始人工智能模型对所述新增样本进行有效性验证;
训练模块,用于将通过有效性验证的新增样本与原始样本结合,得到新样本,并利用所述新样本对所述原始人工智能模型进行训练,得到新人工智能模型;
分析模块,用于对所述新人工智能模型进行性能验证,若所述新人工智能模型性能高于所述原始人工智能模型,则将所述新人工智能模型作为原始人工智能模型,将所述新样本作为原始样本,返回采集模块,否则,返回采集模块。
13.一种计算机设备,其特征在于,包括:一个或多个处理器;
所述处理器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,实现如权利要求1至11中任意一项所述的人工智能模型的自动迭代方法。
14.一种计算机可读存储介质,其特征在于,其上存有计算机程序,所述计算机程序被执行时,实现如权利要求1至11中任意一项所述的人工智能模型的自动迭代方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311818892.1A CN117852695A (zh) | 2023-12-27 | 2023-12-27 | 一种人工智能模型的自动迭代方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311818892.1A CN117852695A (zh) | 2023-12-27 | 2023-12-27 | 一种人工智能模型的自动迭代方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117852695A true CN117852695A (zh) | 2024-04-09 |
Family
ID=90542904
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311818892.1A Pending CN117852695A (zh) | 2023-12-27 | 2023-12-27 | 一种人工智能模型的自动迭代方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117852695A (zh) |
-
2023
- 2023-12-27 CN CN202311818892.1A patent/CN117852695A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108375715B (zh) | 一种配电网线路故障风险日预测方法及*** | |
CN111754024B (zh) | 一种基于回归分析的电力行业时间序列的预测方法和*** | |
CN109255517B (zh) | 风控策略的生成方法、装置、服务器及可读存储介质 | |
CN108829718B (zh) | 一种数据处理的方法和装置 | |
CN111105628A (zh) | 一种停车场画像构建方法和装置 | |
CN113742993B (zh) | 干式变压器寿命损失预测方法、装置、设备及存储介质 | |
CN113449919B (zh) | 一种基于特征和趋势感知的用电量预测方法及*** | |
CN109598052B (zh) | 基于相关系数分析的智能电表寿命周期预测方法及装置 | |
CN105302724A (zh) | 一种基于混和效应移除的即时缺陷预测方法 | |
CN110968703B (zh) | 基于lstm端到端抽取算法的异常计量点知识库构建方法及*** | |
CN111680712A (zh) | 基于日内相似时刻的变压器油温预测方法、装置及*** | |
CN112700065B (zh) | 基于深度学习的业务流程完成时间区间预测方法和*** | |
CN117891234A (zh) | 机房运行状态的检测方法、装置、存储介质以及电子设备 | |
CN110826196B (zh) | 一种工业设备运行数据的处理方法及装置 | |
CN112598326A (zh) | 模型迭代方法、装置、电子设备及存储介质 | |
CN111126694A (zh) | 一种时间序列数据预测方法、***、介质及设备 | |
CN111026624A (zh) | 电网信息***的故障预测方法、装置 | |
CN117852695A (zh) | 一种人工智能模型的自动迭代方法及装置 | |
CN106485526A (zh) | 一种数据挖掘模型的诊断方法和装置 | |
CN113065234B (zh) | 一种智能电表的批次可靠性风险等级评估方法及*** | |
CN111967774B (zh) | 软件质量风险预测方法及装置 | |
CN114139408A (zh) | 一种电力变压器健康状态评估方法 | |
CN113780356A (zh) | 基于集成学习模型的水质预测方法及*** | |
CN114781473A (zh) | 轨道交通设备状态预测方法、装置、设备及存储介质 | |
CN112395167A (zh) | 一种作业故障预测方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |