CN114818849A - 基于大数据信息的卷积神经网络和遗传算法的反窃电方法 - Google Patents
基于大数据信息的卷积神经网络和遗传算法的反窃电方法 Download PDFInfo
- Publication number
- CN114818849A CN114818849A CN202210223771.1A CN202210223771A CN114818849A CN 114818849 A CN114818849 A CN 114818849A CN 202210223771 A CN202210223771 A CN 202210223771A CN 114818849 A CN114818849 A CN 114818849A
- Authority
- CN
- China
- Prior art keywords
- data
- neural network
- electricity
- convolutional neural
- genetic algorithm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 57
- 230000002068 genetic effect Effects 0.000 title claims abstract description 46
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 16
- 230000005611 electricity Effects 0.000 claims abstract description 122
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 56
- 230000002265 prevention Effects 0.000 claims abstract description 23
- 238000007405 data analysis Methods 0.000 claims abstract description 16
- 238000000605 extraction Methods 0.000 claims abstract description 12
- 238000012549 training Methods 0.000 claims abstract description 10
- 239000013598 vector Substances 0.000 claims abstract description 10
- 238000007781 pre-processing Methods 0.000 claims abstract description 7
- 238000005457 optimization Methods 0.000 claims abstract description 6
- 238000012216 screening Methods 0.000 claims abstract description 5
- 230000002159 abnormal effect Effects 0.000 claims description 17
- 238000011176 pooling Methods 0.000 claims description 15
- 230000004913 activation Effects 0.000 claims description 5
- 238000003491 array Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 description 14
- 238000001514 detection method Methods 0.000 description 11
- 238000004458 analytical method Methods 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 10
- 230000006399 behavior Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 230000002354 daily effect Effects 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 238000013501 data transformation Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000003203 everyday effect Effects 0.000 description 2
- 238000011478 gradient descent method Methods 0.000 description 2
- 206010019233 Headaches Diseases 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- XAGFODPZIPBFFR-UHFFFAOYSA-N aluminium Chemical compound [Al] XAGFODPZIPBFFR-UHFFFAOYSA-N 0.000 description 1
- 229910052782 aluminium Inorganic materials 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004870 electrical engineering Methods 0.000 description 1
- 231100000869 headache Toxicity 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000011897 real-time detection Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000013024 troubleshooting Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24137—Distances to cluster centroïds
- G06F18/2414—Smoothing the distance, e.g. radial basis function networks [RBFN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/251—Fusion techniques of input or preprocessed data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/086—Learning methods using evolutionary algorithms, e.g. genetic algorithms or genetic programming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Business, Economics & Management (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Economics (AREA)
- Physiology (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开基于大数据信息的卷积神经网络和遗传算法的反窃电方法,获取历史用电指标数据信息,通过大数据预处理、数据分析方法将用电指标数据信息进行特征提取得到多维向量形式作为输入数据输入卷积神经网络进行模拟性训练;结合遗传算法对卷积神经网络中的参数进行优化,筛选出最优的参数对特征进行提取,完成卷积神经网络优化;将待测用户的用电数据输入训练好的卷积神经网络,判断预测值与真实值之间的误差是否大于所设置的阈值以判定用户是否有窃电嫌疑。本发明结合遗传算法优化参数,提高了预测精度的同时也扩大了搜索范围,使得窃电现象一目了然。
Description
技术领域
本发明涉及电气工程技术领域,尤其涉及基于大数据信息的卷积神经网络和遗传算法的反窃电方法。
背景技术
目前反窃电技术存在很大的局限性,仅凭对线损率的计算,只能肯定线损率大于15%时可能有窃电现象,但究竟窃电者是谁,窃电量是多少都不能判定。
传统窃电排查方法是由供电所防窃电人员人工观察所辖区域的台区线损、用户电量等,根据行业经验和业务规则,确定窃电嫌疑清单,再结合现场摸排来捕捉窃电行为。在窃电与反窃电的较量中,供电部门旧的防窃方法被窃电者熟知,一些新的方法也在被窃电者攻克。供电部门把电表装在电杆顶上或装在用户屋外,或使用铅封、铝封封住表箱,但都关不住窃电的黑手。
目前供电企业主要通过电能计量自动化***进行数据采集。电能计量自动化***包含了负荷管理***、厂站电能量计量遥测***、配变监测计量***、低压集中抄表***这四个子***随着智能电网的发展,各种智能电能计量装置的广泛使用,电能计量自动化***中的数据量明显增加,计量数据呈指数级别增长、数据量巨大、结构类型繁多,而且交互性强。以现在广泛使用的智能电表为例,智能电表每隔15min记录一条与用电情况相关的数据,如电流、电压、电量等,这样一天就会产生96条相关记录,假设有10万个用户,每天就会产生960万条数据。传统的窃电检测主要是靠人工进行排查,而且往往都是窃电行为产生很长时间之后才被发现,再采取相关措施,要靠人为在如此庞大的数据量里查找窃电行为无异于大海捞针,因此反窃电侦察方式亟待改进。
随着数据挖掘、机器学习等技术的发展,一些智能检测方法的出现,这也推动了智能检测的发展。本课题旨在研制一种基于遗传算法优化BP神经网络的数据采集分析***,对用户的历史数据进行分析,建立窃电判别模型或规则。通过数据分析与处理,及时的发现窃电行为,提前釆取相关的措施将损失降到最低,同时对相关用户进行惩罚,这对于减少电力部门和国家的经济损失,保护电力***的经济效益,保证国民的正常用电,维护电力市场的正常发展具有很重要的意义。
发明内容
本发明的目的在于提供基于大数据信息的卷积神经网络和遗传算法的反窃电方法。
本发明采用的技术方案是:
基于数据信息的卷积神经网络和遗传算法的反窃电方法,其包括以下步骤:
步骤1,获取历史用电指标数据信息,用电指标数据信息包括正常用电数据和异常用电数据;
步骤2,通过大数据预处理、数据分析方法将用电指标数据信息进行特征提取得到多维向量形式,以作为输入数据;
步骤3,将处理好后的输入数据输入卷积神经网络进行模拟性训练;
步骤4,结合遗传算法对卷积神经网络中的参数进行优化,筛选出最优的参数对特征进行提取,完成卷积神经网络优化;
具体地,卷积神经网络中步长以及卷积核参数进行多次迭代优选出误差最小值,经过遗传算法对卷积核参数进行优化以缩短迭代时间,筛选出最优的参数对特征进行提取;
步骤5,将待测用户的用电数据输入训练好的卷积神经网络,判断预测值与真实值之间的误差是否大于所设置的阈值;是则,判定用户有窃电嫌疑;否则,判定用户没有窃电嫌疑.
进一步地,用电指标数据信息包括日用电量、所在台区线损值、三相不平衡功率、功率因数。
进一步地,步骤2中输入数据转化成若干个四维数组,四维分别为长度、宽度、通道数和样本数量四个属性。
进一步地,步骤3中输入数据以照片的格式输入进卷积神经网络。
进一步地,步骤3中卷积神经网络的卷积层和池化层的架构如下:
卷积神经网络包括多次池化层和卷积层,卷积层采用3*3的滑动窗口多数据进行特征提取,卷积层步长为2;池化层选取平均池化法进行特征提取,池化层步长为2;对应的卷积前后数据长和宽为:
其中,H1表示卷积前的数据长度,H2表示卷积后的数据长度,F表示卷积核的宽度,P表示填充大小,S表示卷积运算的步长,W1表示卷积前的数据宽度,W2表示卷积后的数据宽度。
进一步地,步骤4中卷积神经网络选用RE-LU函数作为激活函数,对应的遗传算法以模型最终预测结果的均方根误差作为遗传算法中个体适应度;均方根误差(RMSE)表达式为:
其中,pred表示预测值,obsi表示观测值,i表示个体,n表示种群。
进一步地,步骤5终端待测用户的用电数据输入以时间序列的函数进行表示,来预测第t天的用电量。
进一步地,步骤5中卷积神经网络的输出结果为预测的用户用电量;当输入卷积神经网络的为用户若干正常用电数据量时,记录预测量和真实值误差作为正常误差,并对输出结果标记为0,表示未窃电;将用户异常用电数据输入,同样记录输出预测量和真实值误差作为异常误差,对输出结果标记为1、2,分别表示有窃电嫌疑和窃电重大嫌疑;
通常将异常值作为输入预测值与真实值的误差会比正常值误差要大,设置误差阈值,大于这个阈值即表示有窃电嫌疑,根据超过阈值的多少判断用户窃电嫌疑指数,并对其进行调查。
本发明相较于传统神经网络,卷积神经网络通过局部感受野、权重共享和降采样3种策略,降低了网络模型的复杂度。结合遗传算法的精准性使反窃电技术更加的高效,网络训练结果受权重初始值影响较大。常用的CNN参数更新采用梯度下降算法。梯度下降法中初始参数为随机产生,可能使损失函数过早收敛,得到局部最优解,影响预测精度,而遗传算法去优化cnn参数具有良好的鲁棒性和全局搜索能力。本发明主要针对相关小型企业的窃电问题,通过以大数据分析技术为基础,结合卷积神经网络和遗传算法来实现反窃电行为的检测。
基于大数据分析技术,可以根据数据信息中的某种规律性对数据进行分析和预测,很好的解决了数据过多的问题,并起到优化数据的作用。将卷积神经网络算法和遗传算法相结合应用于反窃电***中,使用聚类算法融入进大数据信息中,对数据特征进行分类,加快了收敛速度。通过卷积神经网络对数据信息进行特征提取,结合遗传算法优化参数,提高了预测精度的同时也扩大了搜索范围,应用于反窃电***中具有较好的检测功能,使得窃电现象一目了然。
本发明采用以上技术方案,基于大数据信息技术结合卷积神经网络算法和遗传算法检测窃电行为的模型,充分结合了两种算法的优势,使得其具有良好的应用性,并可将其应用于电力用户用电信息采集***,通过数据分析对用户用电行为的挖掘,解决电力公司对反窃电要求的需求。
附图说明
以下结合附图和具体实施方式对本发明做进一步详细说明;
图1为本发明基于大数据信息的卷积神经网络和遗传算法的反窃电方法的流程架构示意图;
图2为本发明卷积神经网络的结果标记流程示意图;
图3为遗传算法的参数优化流程示意图;
图4为本发明的反窃电***检测图;
图5为本发明的***迭代示意图;
图6为本发明的拟合图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图对本申请实施例中的技术方案进行清楚、完整地描述。
窃电问题一直是一个让电力企业头疼的问题,传统窃电检测需要耗费大量人力物力,如果有一种方法可以通过输入数据就能直接判断出窃电的对象,那么问题将会简单很多。卷积网络在本质上就是是一种输入到输出的映射,它能够学习大量的输入与输出之间的映射关系,而不需要任何输入和输出之间的精确的数学表达式,只要用已知的模式对卷积网络加以训练,网络就具有输入输出对之间的映射能力。由于CNN的特征检测层通过训练数据进行学习,所以在使用CNN时,避免了显式的特征抽取,而隐式地从训练数据中进行学习。
本发明公开了基于数据信息的卷积神经网络和遗传算法的反窃电方法,包含了数据预处理、聚类算法分类、数据分析方法以及最后建立模型。大数据的来源是基于用户家庭的电表抄录和文献中的引用以及网络信息的查找,将采集到的大数据用电指标信息进行数据预处理,即提取特征,同时剔除数据中的缺失值和冗余值以及一些不合理值,对数据进行聚类分析,把具有相似特征的分为一类。利用大数据分析技术,以居民或者小型电力企业用电量为基础,搭建居民防窃电的智能检测***。通过对居民或小型用电企业用电信息数据集的分析,实时检测该片区域用电状态,进而判断用户是否存在窃电嫌疑。
如图1至6之一所示,基于数据信息的卷积神经网络和遗传算法的反窃电方法包括以下步骤:
步骤1,获取历史用电指标数据信息,用电指标数据信息包括正常用电数据和异常用电数据;用电指标数据信息包括日用电量、所在台区线损值、三相不平衡功率、功率因数。
步骤2,通过大数据预处理、数据分析方法将用电指标数据信息进行特征提取得到多维向量形式,以作为输入数据;输入数据转化成若干个四维数组,四维分别为长度、宽度、通道数和样本数量四个属性。
具体地,数据预处理包括数据清理和数据变换,
数据清理通过填写缺失的值、识别或删除离群点并解决不一致性来“清理”数据。主要是达到格式标准化,异常数据清除,包括一些重复的数据、缺失的数据以及比较离谱的数据进行错误纠正和重复值清除的目标。
数据变换通过平滑聚集,数据概化,规范化等方式将数据转换成适用于数据挖掘的形式。
进一步地,通过聚类算法将数据特征进行分类。
各点到中心点距离计算公式为:
其中,uj表示质心,xi表示向量数据集X={x1.......xi},dij表示样本集中每个样本到所选取的样本质心的距离,dij表示数据点i和j两点之间的距离。表示两个经过一次迭代后,根据新的族计算新的质心继续迭代,用以划分数据的不同类特征;且质心计算公式为: 假设原数据集分为k类,其中Cj表示第j类,x为第j类中的一个样本。
步骤3,将处理好后的输入数据输入卷积神经网络进行模拟性训练;
具体地,相关模型的建立需要满足数据分析的需求,具体包括两个方面:
(1)可视化分析:大数据分析的使用者有大数据分析专家,同时还有普通用户,但是他们二者对于大数据分析最基本的要求就是可视化分析,因为可视化分析能够直观的呈现大数据特点,同时能够非常容易被读者所接受,就如同看图说话一样简单明了。
(2)预测性分析能力:大数据分析最终要的应用领域之一就是预测性分析,从大数据中挖掘出特点,通过科学的建立模型,之后便可以通过模型带入新的数据,从而预测未来的数据。
进一步地,输入的数据应是具有特征性的数据,可以较好的反映出用户用电信息特征。将各项特征数据经过大数据技术预处理后,通过聚类算法后均转化为类似于图片格式的若干四维矩阵进行输入卷积神经网络。卷积神经网络包括多次池化层和卷积层,卷积层采用3*3的滑动窗口多数据进行特征提取,卷积层步长为2;池化层选取平均池化法进行特征提取,池化层步长为2;对应的卷积前后数据长和宽为:
其中,H1表示卷积前的数据长度,H2表示卷积后的数据长度,F表示卷积核的宽度,P表示填充大小,S表示卷积运算的步长,W1表示卷积前的数据宽度,W2表示卷积后的数据宽度。步骤4,结合遗传算法对卷积神经网络中的参数进行优化,筛选出最优的参数对特征进行提取,完成卷积神经网络优化;
具体地,选取随机数据对卷积神经网络进行初始化训练,再根据模型分析后的结果,包括线损率的大小,功率因数以及三相不平衡率等特征进行多次训练。卷积神经网络中步长以及卷积核参数进行多次迭代优选出误差最小值,经过遗传算法对卷积核参数进行优化以缩短迭代时间,筛选出最优的参数对特征进行提取。
进一步地,步骤4中卷积神经网络选用RE-LU函数作为激活函数,主要是因为:
(1)可以使网络训练更快,相比于sigmoid、tanh,导数更加好求,反向传播就是不断的更新参数的过程,因为其导数不复杂形式简单。
(2)增加网络的非线性。本身为非线性函数,加入到神经网络中可以是网格拟合非线性映射
(3)防止梯度消失。当数值过大或者过小,sigmoid,tanh的导数接近于0,relu为非饱和激活函数不存在这种现象。
(4)使网格具有稀疏性。由于小于0部分为0,大于0部分才有值,所以可以减少过拟合。
此外,由于梯度下降法中初始参数为随机产生,可能使损失函数过早收敛,得到局部最优解,影响预测精度。而遗传算法具有良好的鲁棒性和全局搜索能力,对应的遗传算法以模型最终预测结果的均方根误差作为遗传算法中个体适应度;均方根误差(RMSE)表达式为:
其中,pred表示预测值,obsi表示观测值,i表示个体,n表示有n种群数。
步骤5,将待测用户的用电数据输入训练好的卷积神经网络,判断预测值与真实值之间的误差是否大于所设置的阈值;是则,判定用户有窃电嫌疑;否则,判定用户没有窃电嫌疑.
进一步地,步骤5终端待测用户的用电数据输入以时间序列的函数进行表示,来预测第t天的用电量。
进一步地,步骤5中卷积神经网络的输出结果为预测的用户用电量;当输入卷积神经网络的为用户若干正常用电数据量时,记录预测量和真实值误差作为正常误差,并对输出结果标记为0,表示未窃电;将用户异常用电数据输入,同样记录输出预测量和真实值误差作为异常误差,对输出结果标记为1、2,分别表示有窃电嫌疑和窃电重大嫌疑;
通常将异常值作为输入预测值与真实值的误差会比正常值误差要大,设置误差阈值,大于这个阈值即表示有窃电嫌疑,根据超过阈值的多少判断用户窃电嫌疑指数,并对其进行调查。
本发明基于大数据技术结合卷积神经网络和遗传算法,对一些小型电力企业以及居民用电状态进行分析的反窃电检测***。本发明包括初始化参数、输入向量的设计、非线性操作、多次卷积和池化、激活函数的选择以及遗传算法优化网络参数设计。本发明为实现反窃电标准将用户每日用电量、所在台区线损值、功率因数、三相不平衡率等特征向量经过多维化处理,卷积神经网络的输入一般是具有长度和宽度的类似于图片格式的多维向量,输入之前对数据信息进行格式转换。将采集的用电大数据信息进行数据处理、分析,接着转化成类似于图片具有高度、宽度、通道数的多维向量形式输入进卷积神经网络,并对网络进行训练,采用遗传算法进行参数优化,筛选出最优参数最后输出结果。对网络模型训练时将用户若干正常用电数据量输入,记录预测量和真实值误差,并对输出结果标记为0,表示未窃电。将用户异常用电数据输入,同样记录输出预测量和真实值误差,标记为1、2表示有窃电嫌疑和窃电重大嫌疑。通常将异常值作为输入预测值与真实值的误差会比正常值误差要大,设置误差阈值,大于这个阈值即表示有窃电嫌疑,根据超过阈值的多少判断用户窃电嫌疑指数,并对其进行调查。
如图4至6所示,基于大数据信息的卷积神经网络和遗传算法的反窃电方法的仿真示意图。图5为***迭代图,可以看到***逐渐趋于平稳,直至接近预期达到的目标,图6为拟合图,可以看到拟合度达到99%。
本发明采用以上技术方案,基于大数据信息技术结合卷积神经网络算法和遗传算法检测窃电行为的模型,充分结合了两种算法的优势,使得其具有良好的应用性,并可将其应用于电力用户用电信息采集***,通过数据分析对用户用电行为的挖掘,解决电力公司对反窃电要求的需求。
显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
Claims (9)
1.基于大数据信息的卷积神经网络和遗传算法的反窃电方法,其特征在于:其包括以下步骤:
步骤1,获取历史用电指标数据信息,用电指标数据信息包括正常用电数据和异常用电数据;
步骤2,通过大数据预处理、数据分析方法将用电指标数据信息进行特征提取得到多维向量形式,以作为输入数据;
步骤3,将处理好后的输入数据输入卷积神经网络进行模拟性训练;
步骤4,结合遗传算法对卷积神经网络中的参数进行优化,筛选出最优的参数对特征进行提取,完成卷积神经网络优化;
具体地,卷积神经网络中步长以及卷积核参数进行多次迭代优选出误差最小值,经过遗传算法对卷积核参数进行优化以缩短迭代时间,筛选出最优的参数对特征进行提取;
步骤5,将待测用户的用电数据输入训练好的卷积神经网络,判断预测值与真实值之间的误差是否大于所设置的阈值;是则,判定用户有窃电嫌疑;否则,判定用户没有窃电嫌疑。
2.根据权利要求1所述的基于大数据信息的卷积神经网络和遗传算法的反窃电方法,其特征在于:用电指标数据信息包括日用电量、所在台区线损值、三相不平衡功率、功率因数。
3.根据权利要求1所述的基于大数据信息的卷积神经网络和遗传算法的反窃电方法,其特征在于:步骤2中输入数据转化成若干个四维数组,四维分别为长度、宽度、通道数和样本数量四个属性。
4.根据权利要求1所述的基于大数据信息的卷积神经网络和遗传算法的反窃电方法,其特征在于:步骤2中输入数据通过聚类算法将数据特征进行分类。
5.根据权利要求1所述的基于大数据信息的卷积神经网络和遗传算法的反窃电方法,其特征在于:步骤3中输入数据以照片的格式输入进卷积神经网络。
8.根据权利要求1所述的基于大数据信息的卷积神经网络和遗传算法的反窃电方法,其特征在于:步骤5终端待测用户的用电数据输入以时间序列的函数进行表示,来预测第t天的用电量。
9.根据权利要求1所述的基于大数据信息的卷积神经网络和遗传算法的反窃电方法,其特征在于:步骤5中卷积神经网络的输出结果为预测的用户用电量;当输入卷积神经网络的为用户若干正常用电数据量时,记录预测量和真实值误差作为正常误差,并对输出结果标记为0,表示未窃电;将用户异常用电数据输入,同样记录输出预测量和真实值误差作为异常误差,对输出结果标记为1、2,分别表示有窃电嫌疑和窃电重大嫌疑。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210223771.1A CN114818849A (zh) | 2022-03-09 | 2022-03-09 | 基于大数据信息的卷积神经网络和遗传算法的反窃电方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210223771.1A CN114818849A (zh) | 2022-03-09 | 2022-03-09 | 基于大数据信息的卷积神经网络和遗传算法的反窃电方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114818849A true CN114818849A (zh) | 2022-07-29 |
Family
ID=82529902
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210223771.1A Pending CN114818849A (zh) | 2022-03-09 | 2022-03-09 | 基于大数据信息的卷积神经网络和遗传算法的反窃电方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114818849A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116340765A (zh) * | 2023-02-16 | 2023-06-27 | 成都昶鑫电子科技有限公司 | 一种窃电用户预测方法、装置、存储介质及电子设备 |
-
2022
- 2022-03-09 CN CN202210223771.1A patent/CN114818849A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116340765A (zh) * | 2023-02-16 | 2023-06-27 | 成都昶鑫电子科技有限公司 | 一种窃电用户预测方法、装置、存储介质及电子设备 |
CN116340765B (zh) * | 2023-02-16 | 2024-02-09 | 成都昶鑫电子科技有限公司 | 一种窃电用户预测方法、装置、存储介质及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110097297B (zh) | 一种多维度窃电态势智能感知方法、***、设备及介质 | |
CN110223196B (zh) | 基于典型行业特征库和反窃电样本库的反窃电分析方法 | |
CN106022509B (zh) | 考虑地域和负荷性质双重差异的配电网空间负荷预测方法 | |
CN111178611B (zh) | 一种日电量预测的方法 | |
CN108985380B (zh) | 一种基于聚类集成的转辙机故障识别方法 | |
CN110990461A (zh) | 大数据分析模型算法选型方法、装置、电子设备及介质 | |
CN111008337B (zh) | 一种基于三元特征的深度注意力谣言鉴别方法及装置 | |
CN108133225A (zh) | 一种基于支持向量机的覆冰闪络故障预警方法 | |
CN110990718B (zh) | 一种公司形象提升***的社会网络模型构建模块 | |
CN112506990A (zh) | 一种基于时空信息的水文数据异常检测方法 | |
Sielenou et al. | Combining random forests and class-balancing to discriminate between three classes of avalanche activity in the French Alps | |
CN111008726B (zh) | 一种电力负荷预测中类图片转换方法 | |
CN107679734A (zh) | 一种用于无标签数据分类预测的方法和*** | |
CN112149873A (zh) | 一种基于深度学习的低压台区线损合理区间预测方法 | |
CN111178585A (zh) | 基于多算法模型融合的故障接报量预测方法 | |
CN105787259A (zh) | 一种多元气象因素对负荷变化影响相关性的分析方法 | |
CN115470962A (zh) | 一种基于LightGBM的企业失信风险预测模型构建方法 | |
CN109787821A (zh) | 一种大规模移动客户流量消费智能预测方法 | |
CN114118269A (zh) | 基于典型业务场景下的能源大数据聚合分析方法 | |
CN115409120A (zh) | 一种基于数据驱动的用户窃电行为检测辅助方法 | |
CN113837266B (zh) | 一种基于特征提取和Stacking集成学习的软件缺陷预测方法 | |
CN114818849A (zh) | 基于大数据信息的卷积神经网络和遗传算法的反窃电方法 | |
CN114841268A (zh) | 基于Transformer和LSTM融合算法的异常电力客户识别方法 | |
CN116662860A (zh) | 一种基于能源大数据的用户画像与分类方法 | |
CN111612054A (zh) | 一种基于非负矩阵分解和密度聚类的用户窃电行为识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |