CN114818849A

CN114818849A - 基于大数据信息的卷积神经网络和遗传算法的反窃电方法

Info

Publication number: CN114818849A
Application number: CN202210223771.1A
Authority: CN
Inventors: 肖伟号; 黄旭红; 郑上; 赵楠; 汤升平; 陈燕毅; 祝存欣
Original assignee: Fujian University of Technology
Current assignee: Fujian University of Technology
Priority date: 2022-03-09
Filing date: 2022-03-09
Publication date: 2022-07-29

Abstract

本发明公开基于大数据信息的卷积神经网络和遗传算法的反窃电方法，获取历史用电指标数据信息，通过大数据预处理、数据分析方法将用电指标数据信息进行特征提取得到多维向量形式作为输入数据输入卷积神经网络进行模拟性训练；结合遗传算法对卷积神经网络中的参数进行优化，筛选出最优的参数对特征进行提取，完成卷积神经网络优化；将待测用户的用电数据输入训练好的卷积神经网络，判断预测值与真实值之间的误差是否大于所设置的阈值以判定用户是否有窃电嫌疑。本发明结合遗传算法优化参数，提高了预测精度的同时也扩大了搜索范围，使得窃电现象一目了然。

Description

基于大数据信息的卷积神经网络和遗传算法的反窃电方法

技术领域

本发明涉及电气工程技术领域，尤其涉及基于大数据信息的卷积神经网络和遗传算法的反窃电方法。

背景技术

目前反窃电技术存在很大的局限性，仅凭对线损率的计算，只能肯定线损率大于15％时可能有窃电现象，但究竟窃电者是谁，窃电量是多少都不能判定。

传统窃电排查方法是由供电所防窃电人员人工观察所辖区域的台区线损、用户电量等，根据行业经验和业务规则，确定窃电嫌疑清单，再结合现场摸排来捕捉窃电行为。在窃电与反窃电的较量中，供电部门旧的防窃方法被窃电者熟知，一些新的方法也在被窃电者攻克。供电部门把电表装在电杆顶上或装在用户屋外，或使用铅封、铝封封住表箱,但都关不住窃电的黑手。

目前供电企业主要通过电能计量自动化***进行数据采集。电能计量自动化***包含了负荷管理***、厂站电能量计量遥测***、配变监测计量***、低压集中抄表***这四个子***随着智能电网的发展，各种智能电能计量装置的广泛使用，电能计量自动化***中的数据量明显增加，计量数据呈指数级别增长、数据量巨大、结构类型繁多，而且交互性强。以现在广泛使用的智能电表为例，智能电表每隔15min记录一条与用电情况相关的数据，如电流、电压、电量等，这样一天就会产生96条相关记录，假设有10万个用户，每天就会产生960万条数据。传统的窃电检测主要是靠人工进行排查，而且往往都是窃电行为产生很长时间之后才被发现，再采取相关措施，要靠人为在如此庞大的数据量里查找窃电行为无异于大海捞针，因此反窃电侦察方式亟待改进。

随着数据挖掘、机器学习等技术的发展，一些智能检测方法的出现，这也推动了智能检测的发展。本课题旨在研制一种基于遗传算法优化BP神经网络的数据采集分析***，对用户的历史数据进行分析，建立窃电判别模型或规则。通过数据分析与处理，及时的发现窃电行为，提前釆取相关的措施将损失降到最低，同时对相关用户进行惩罚，这对于减少电力部门和国家的经济损失，保护电力***的经济效益，保证国民的正常用电，维护电力市场的正常发展具有很重要的意义。

发明内容

本发明的目的在于提供基于大数据信息的卷积神经网络和遗传算法的反窃电方法。

本发明采用的技术方案是：

基于数据信息的卷积神经网络和遗传算法的反窃电方法，其包括以下步骤：

步骤1，获取历史用电指标数据信息，用电指标数据信息包括正常用电数据和异常用电数据；

步骤2，通过大数据预处理、数据分析方法将用电指标数据信息进行特征提取得到多维向量形式，以作为输入数据；

步骤3，将处理好后的输入数据输入卷积神经网络进行模拟性训练；

步骤4，结合遗传算法对卷积神经网络中的参数进行优化，筛选出最优的参数对特征进行提取，完成卷积神经网络优化；

具体地，卷积神经网络中步长以及卷积核参数进行多次迭代优选出误差最小值，经过遗传算法对卷积核参数进行优化以缩短迭代时间,筛选出最优的参数对特征进行提取；

步骤5，将待测用户的用电数据输入训练好的卷积神经网络，判断预测值与真实值之间的误差是否大于所设置的阈值；是则，判定用户有窃电嫌疑；否则，判定用户没有窃电嫌疑.

进一步地，用电指标数据信息包括日用电量、所在台区线损值、三相不平衡功率、功率因数。

进一步地，步骤2中输入数据转化成若干个四维数组，四维分别为长度、宽度、通道数和样本数量四个属性。

进一步地，步骤3中输入数据以照片的格式输入进卷积神经网络。

进一步地，步骤3中卷积神经网络的卷积层和池化层的架构如下：

卷积神经网络包括多次池化层和卷积层，卷积层采用3*3的滑动窗口多数据进行特征提取，卷积层步长为2；池化层选取平均池化法进行特征提取，池化层步长为2；对应的卷积前后数据长和宽为：

其中，H₁表示卷积前的数据长度，H₂表示卷积后的数据长度，F表示卷积核的宽度，P表示填充大小，S表示卷积运算的步长，W₁表示卷积前的数据宽度，W₂表示卷积后的数据宽度。

进一步地，步骤4中卷积神经网络选用RE-LU函数作为激活函数，对应的遗传算法以模型最终预测结果的均方根误差作为遗传算法中个体适应度；均方根误差(RMSE)表达式为：

其中，pred表示预测值，obs_i表示观测值，i表示个体，n表示种群。

进一步地，步骤5终端待测用户的用电数据输入以时间序列的函数进行表示，来预测第t天的用电量。

进一步地，步骤5中卷积神经网络的输出结果为预测的用户用电量；当输入卷积神经网络的为用户若干正常用电数据量时，记录预测量和真实值误差作为正常误差，并对输出结果标记为0，表示未窃电；将用户异常用电数据输入，同样记录输出预测量和真实值误差作为异常误差，对输出结果标记为1、2，分别表示有窃电嫌疑和窃电重大嫌疑；

通常将异常值作为输入预测值与真实值的误差会比正常值误差要大，设置误差阈值，大于这个阈值即表示有窃电嫌疑，根据超过阈值的多少判断用户窃电嫌疑指数，并对其进行调查。

本发明相较于传统神经网络，卷积神经网络通过局部感受野、权重共享和降采样3种策略，降低了网络模型的复杂度。结合遗传算法的精准性使反窃电技术更加的高效，网络训练结果受权重初始值影响较大。常用的CNN参数更新采用梯度下降算法。梯度下降法中初始参数为随机产生，可能使损失函数过早收敛，得到局部最优解，影响预测精度，而遗传算法去优化cnn参数具有良好的鲁棒性和全局搜索能力。本发明主要针对相关小型企业的窃电问题，通过以大数据分析技术为基础，结合卷积神经网络和遗传算法来实现反窃电行为的检测。

基于大数据分析技术，可以根据数据信息中的某种规律性对数据进行分析和预测，很好的解决了数据过多的问题，并起到优化数据的作用。将卷积神经网络算法和遗传算法相结合应用于反窃电***中，使用聚类算法融入进大数据信息中，对数据特征进行分类，加快了收敛速度。通过卷积神经网络对数据信息进行特征提取，结合遗传算法优化参数，提高了预测精度的同时也扩大了搜索范围，应用于反窃电***中具有较好的检测功能，使得窃电现象一目了然。

本发明采用以上技术方案，基于大数据信息技术结合卷积神经网络算法和遗传算法检测窃电行为的模型，充分结合了两种算法的优势，使得其具有良好的应用性，并可将其应用于电力用户用电信息采集***，通过数据分析对用户用电行为的挖掘，解决电力公司对反窃电要求的需求。

附图说明

以下结合附图和具体实施方式对本发明做进一步详细说明；

图1为本发明基于大数据信息的卷积神经网络和遗传算法的反窃电方法的流程架构示意图；

图2为本发明卷积神经网络的结果标记流程示意图；

图3为遗传算法的参数优化流程示意图；

图4为本发明的反窃电***检测图；

图5为本发明的***迭代示意图；

图6为本发明的拟合图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图对本申请实施例中的技术方案进行清楚、完整地描述。

窃电问题一直是一个让电力企业头疼的问题，传统窃电检测需要耗费大量人力物力，如果有一种方法可以通过输入数据就能直接判断出窃电的对象，那么问题将会简单很多。卷积网络在本质上就是是一种输入到输出的映射，它能够学习大量的输入与输出之间的映射关系，而不需要任何输入和输出之间的精确的数学表达式，只要用已知的模式对卷积网络加以训练，网络就具有输入输出对之间的映射能力。由于CNN的特征检测层通过训练数据进行学习，所以在使用CNN时，避免了显式的特征抽取，而隐式地从训练数据中进行学习。

本发明公开了基于数据信息的卷积神经网络和遗传算法的反窃电方法，包含了数据预处理、聚类算法分类、数据分析方法以及最后建立模型。大数据的来源是基于用户家庭的电表抄录和文献中的引用以及网络信息的查找，将采集到的大数据用电指标信息进行数据预处理，即提取特征，同时剔除数据中的缺失值和冗余值以及一些不合理值，对数据进行聚类分析，把具有相似特征的分为一类。利用大数据分析技术，以居民或者小型电力企业用电量为基础，搭建居民防窃电的智能检测***。通过对居民或小型用电企业用电信息数据集的分析，实时检测该片区域用电状态，进而判断用户是否存在窃电嫌疑。

如图1至6之一所示，基于数据信息的卷积神经网络和遗传算法的反窃电方法包括以下步骤：

步骤1，获取历史用电指标数据信息，用电指标数据信息包括正常用电数据和异常用电数据；用电指标数据信息包括日用电量、所在台区线损值、三相不平衡功率、功率因数。

步骤2，通过大数据预处理、数据分析方法将用电指标数据信息进行特征提取得到多维向量形式，以作为输入数据；输入数据转化成若干个四维数组，四维分别为长度、宽度、通道数和样本数量四个属性。

具体地，数据预处理包括数据清理和数据变换，

数据清理通过填写缺失的值、识别或删除离群点并解决不一致性来“清理”数据。主要是达到格式标准化，异常数据清除，包括一些重复的数据、缺失的数据以及比较离谱的数据进行错误纠正和重复值清除的目标。

数据变换通过平滑聚集，数据概化，规范化等方式将数据转换成适用于数据挖掘的形式。

进一步地，通过聚类算法将数据特征进行分类。

各点到中心点距离计算公式为：

其中，u_j表示质心，x_i表示向量数据集X＝{x₁.......x_i}，d_ij表示样本集中每个样本到所选取的样本质心的距离，d_ij表示数据点i和j两点之间的距离。表示两个经过一次迭代后，根据新的族计算新的质心继续迭代，用以划分数据的不同类特征；且质心计算公式为：

假设原数据集分为k类，其中C_j表示第j类，x为第j类中的一个样本。

具体地，相关模型的建立需要满足数据分析的需求，具体包括两个方面：

(1)可视化分析：大数据分析的使用者有大数据分析专家，同时还有普通用户，但是他们二者对于大数据分析最基本的要求就是可视化分析，因为可视化分析能够直观的呈现大数据特点，同时能够非常容易被读者所接受，就如同看图说话一样简单明了。

(2)预测性分析能力：大数据分析最终要的应用领域之一就是预测性分析，从大数据中挖掘出特点，通过科学的建立模型，之后便可以通过模型带入新的数据，从而预测未来的数据。

进一步地，输入的数据应是具有特征性的数据，可以较好的反映出用户用电信息特征。将各项特征数据经过大数据技术预处理后，通过聚类算法后均转化为类似于图片格式的若干四维矩阵进行输入卷积神经网络。卷积神经网络包括多次池化层和卷积层，卷积层采用3*3的滑动窗口多数据进行特征提取，卷积层步长为2；池化层选取平均池化法进行特征提取，池化层步长为2；对应的卷积前后数据长和宽为：

其中，H₁表示卷积前的数据长度，H₂表示卷积后的数据长度，F表示卷积核的宽度，P表示填充大小，S表示卷积运算的步长，W₁表示卷积前的数据宽度，W₂表示卷积后的数据宽度。步骤4，结合遗传算法对卷积神经网络中的参数进行优化，筛选出最优的参数对特征进行提取，完成卷积神经网络优化；

具体地，选取随机数据对卷积神经网络进行初始化训练，再根据模型分析后的结果，包括线损率的大小，功率因数以及三相不平衡率等特征进行多次训练。卷积神经网络中步长以及卷积核参数进行多次迭代优选出误差最小值，经过遗传算法对卷积核参数进行优化以缩短迭代时间,筛选出最优的参数对特征进行提取。

进一步地，步骤4中卷积神经网络选用RE-LU函数作为激活函数，主要是因为:

(1)可以使网络训练更快，相比于sigmoid、tanh，导数更加好求，反向传播就是不断的更新参数的过程，因为其导数不复杂形式简单。

(2)增加网络的非线性。本身为非线性函数，加入到神经网络中可以是网格拟合非线性映射

(3)防止梯度消失。当数值过大或者过小，sigmoid，tanh的导数接近于0，relu为非饱和激活函数不存在这种现象。

(4)使网格具有稀疏性。由于小于0部分为0，大于0部分才有值，所以可以减少过拟合。

此外，由于梯度下降法中初始参数为随机产生，可能使损失函数过早收敛，得到局部最优解，影响预测精度。而遗传算法具有良好的鲁棒性和全局搜索能力，对应的遗传算法以模型最终预测结果的均方根误差作为遗传算法中个体适应度；均方根误差(RMSE)表达式为：

其中，pred表示预测值，obs_i表示观测值，i表示个体，n表示有n种群数。

本发明基于大数据技术结合卷积神经网络和遗传算法，对一些小型电力企业以及居民用电状态进行分析的反窃电检测***。本发明包括初始化参数、输入向量的设计、非线性操作、多次卷积和池化、激活函数的选择以及遗传算法优化网络参数设计。本发明为实现反窃电标准将用户每日用电量、所在台区线损值、功率因数、三相不平衡率等特征向量经过多维化处理，卷积神经网络的输入一般是具有长度和宽度的类似于图片格式的多维向量，输入之前对数据信息进行格式转换。将采集的用电大数据信息进行数据处理、分析，接着转化成类似于图片具有高度、宽度、通道数的多维向量形式输入进卷积神经网络，并对网络进行训练，采用遗传算法进行参数优化，筛选出最优参数最后输出结果。对网络模型训练时将用户若干正常用电数据量输入，记录预测量和真实值误差，并对输出结果标记为0，表示未窃电。将用户异常用电数据输入，同样记录输出预测量和真实值误差，标记为1、2表示有窃电嫌疑和窃电重大嫌疑。通常将异常值作为输入预测值与真实值的误差会比正常值误差要大，设置误差阈值，大于这个阈值即表示有窃电嫌疑，根据超过阈值的多少判断用户窃电嫌疑指数，并对其进行调查。

如图4至6所示，基于大数据信息的卷积神经网络和遗传算法的反窃电方法的仿真示意图。图5为***迭代图，可以看到***逐渐趋于平稳，直至接近预期达到的目标，图6为拟合图,可以看到拟合度达到99％。

显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此，本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

Claims

1.基于大数据信息的卷积神经网络和遗传算法的反窃电方法，其特征在于：其包括以下步骤：

步骤5，将待测用户的用电数据输入训练好的卷积神经网络，判断预测值与真实值之间的误差是否大于所设置的阈值；是则，判定用户有窃电嫌疑；否则，判定用户没有窃电嫌疑。

2.根据权利要求1所述的基于大数据信息的卷积神经网络和遗传算法的反窃电方法，其特征在于：用电指标数据信息包括日用电量、所在台区线损值、三相不平衡功率、功率因数。

3.根据权利要求1所述的基于大数据信息的卷积神经网络和遗传算法的反窃电方法，其特征在于：步骤2中输入数据转化成若干个四维数组，四维分别为长度、宽度、通道数和样本数量四个属性。

4.根据权利要求1所述的基于大数据信息的卷积神经网络和遗传算法的反窃电方法，其特征在于：步骤2中输入数据通过聚类算法将数据特征进行分类。

5.根据权利要求1所述的基于大数据信息的卷积神经网络和遗传算法的反窃电方法，其特征在于：步骤3中输入数据以照片的格式输入进卷积神经网络。

6.根据权利要求1所述的基于大数据信息的卷积神经网络和遗传算法的反窃电方法，其特征在于：步骤3中卷积神经网络的卷积层和池化层的架构如下：

7.根据权利要求1所述的基于大数据信息的卷积神经网络和遗传算法的反窃电方法，其特征在于：步骤4中卷积神经网络选用RE-LU函数作为激活函数，对应的遗传算法以模型最终预测结果的均方根误差作为遗传算法中个体适应度；均方根误差(RMSE)表达式为：

8.根据权利要求1所述的基于大数据信息的卷积神经网络和遗传算法的反窃电方法，其特征在于：步骤5终端待测用户的用电数据输入以时间序列的函数进行表示，来预测第t天的用电量。

9.根据权利要求1所述的基于大数据信息的卷积神经网络和遗传算法的反窃电方法，其特征在于：步骤5中卷积神经网络的输出结果为预测的用户用电量；当输入卷积神经网络的为用户若干正常用电数据量时，记录预测量和真实值误差作为正常误差，并对输出结果标记为0，表示未窃电；将用户异常用电数据输入，同样记录输出预测量和真实值误差作为异常误差，对输出结果标记为1、2，分别表示有窃电嫌疑和窃电重大嫌疑。