CN109614488B

CN109614488B - 基于文本分类和图像识别的配网带电作业条件判别方法

Info

Publication number: CN109614488B
Application number: CN201811470666.8A
Authority: CN
Inventors: 熊小萍; 许爽; 龙凤英; 谭建成; 田富瑞
Original assignee: Guangxi University
Current assignee: Guangxi University
Priority date: 2018-12-04
Filing date: 2018-12-04
Publication date: 2022-12-02
Anticipated expiration: 2038-12-04
Also published as: CN109614488A

Abstract

本发明公开了一种基于文本分类和图像识别的配网带电作业条件判别方法，先从电网公司生产管理***导出配电线路外部条件数据，生成配电线路带电作业外部条件判别文本数据库，再通过对配电线路现场拍照，生成线路设备图像数据库，对数据库进行预处理，然后搭建基于机器学习的中文文本自动分类模型和图像识别分类模型，将数据库分成训练集和测试集两大类，利用训练集分别对两个模型进行有监督的训练，利用测试集对训练好的模型进行测试；最后将新采集的数据输入到训练好的模型中，模型对每个判别条件特征进行识别并评分，根据总评分值对应评分等级判别该配电线路是否符合带电作业条件要求，为工作人员对是否能进行带电作业提供智能有效的决策依据。

Description

基于文本分类和图像识别的配网带电作业条件判别方法

技术领域

本发明属于中低压配电网线路带电作业技术领域，具体涉及一种基于文本分类和图像识别的配网带电作业条件判别方法。

背景技术

带电作业是电网设备检测、检修维护和改造的重要手段和方法，是保证电力***可靠稳定运行的重要技术措施。随着配电网供电可靠性要求的不断提高，配电线路带电作业和不停电作业法也得到广泛应用和推广。新技术、新设备、新材料在带电作业领域的应用也有力推动了带电作业工具、设备、标准制定等方面的进步和发展，并对今后带电作业技术提出了新的要求和发展方向。然而，目前大部分电网公司关于带电作业条件的判别仍然是通过人为的去现场查看设备，缺乏对当前设备在电网结构中所处的位置的清晰认知，智能化分析手段不足，人为主观因素影响较多；没有一个统一的判别标准，对线路能不能进行带电作业的内外因素分析不足，无法量化每一个条件对线路是否能进行带电作业的影响。

发明内容

针对上述现有技术存在的不足，本发明提供一种基于文本分类和图像识别的配网带电作业条件判别方法，从而解决目前无法智能化的根据配电线路外部条件和设备条件数据对配电线路是否能进行带电作业作出判断的问题。

本发明所要解决的技术问题，通过以下技术方案予以实现：

一种基于文本分类和图像识别的配网带电作业条件判别方法，包括以下步骤：

S1.从电网公司生产管理***导出配电线路外部条件数据，生成配电线路带电作业外部条件判别文本数据库；

S2.在配电线路现场采集图片，形成线路设备条件数据，生成线路设备图像数据库；

S3.对文本数据库和图像数据库进行预处理，包括：将线路外部条件和线路设备条件分别对应不同的分值生成条件分值表，条件分值表反映每种条件对应的分值，分值大小反映每种条件占的比重；以矩阵或向量的形式对文本进行表示，对图像进行分割和提取得到具有不变性的特征表示；

S4.搭建基于机器学习的中文文本自动分类模型和基于机器学习的图像识别分类模型；

S5.将预处理后的文本数据库和图像数据库分成训练集和测试集两大类，利用训练集数据分别对搭建好的基于机器学习的中文文本自动分类模型和基于机器学习的图像识别分类模型进行有监督的训练，然后利用测试集数据测试训练好的模型识别的准确率，通过调整参数使模型对测试集中的数据识别的准确率达到90％以上；

S6.对配电线路划分评分等级，将新采集数据导入训练好的模型中，模型识别带电作业判别条件特征并评分，根据总评分值对应评分等级判断该条件下是否满足带电作业条件要求。

所述步骤S1的线路外部条件数据包括：供电区域、电网结构、N-n检验、地形、用户接入和配电自动化水平。

所述步骤S2的线路设备条件数据包括：架空线、杆型、开断设备、变电设备、绝缘设备和金具。

所述步骤S4搭建基于机器学习的中文文本自动分类模型的具体操作为：以词为单位进行文本表示形成词向量，再将词向量按照词在句子中出现的顺序进行拼接，形成代表句子的矩阵，然后送入基于深度学习技术的卷积神经网络模型中，在词向量的基础上，实现句子特征的自动提取和学习，最后实现缺陷文本的自动分类。其中，所述基于深度学习技术的卷积神经网络模型为一个四层的卷积神经网络模型，具体形式为：

第一层为输入层，输入层为一个未分类的外部条件对应的词组矩阵W∈R^s×n，W代表一个未分类的外部条件对应的词组，R代表该词组转换的矩阵，矩阵的每一行代表词组中每个词对应的向量，行数s为词组的词数，列数n为向量的维数；

第二层为一维卷积层，采用列数与W相同、行数为h的卷积矩阵窗口I∈R^h×n，与输入层矩阵W的每个h行n列矩阵块由上到下依次进行卷积运算，其中每一个卷积窗口能从输入的矩阵R中抽取出一个特征图特征，称为文本特征；

第三层为池化层，采用最大池化的方法，取每个卷积窗口卷积得到的特征图向量中最大的元素作为特征值，从而提取各个卷积窗口对应的特征值，并将所有特征值依次拼接构成池化层的一维向量，即为代表句子全局特征的向量；

第四层为输出层，输出层与池化层全连接，以池化层的一维向量为输入，经过激活函数输出，再加上丢失层去除部分数据防止过拟合，最后采用softmax分类器对一维向量进行分类，并输出最终的分类结果。

所述步骤S4搭建基于机器学习的图像识别分类模型的具体操作为：先以国际大型视觉对象的分类识别和检测挑战赛的数据库为模板建立图像识别数据库，用以存放经过预处理后的图像数据，然后送入基于深度学习技术的卷积神经网络模型中，在图像预处理的基础上，实现图像特征的自动提取和学习，最后实现图像数据中线路设备条件的打分分类。其中，所述基于深度学习技术的卷积神经网络模型包含三大块组件网络模型：

第一块为预训练前端网络，采用ResNet50作为预训练模型，首先ResNet50网络模型中不包含全连接层的模型参数到本地，然后定义ResNet50的网络结构，再加载模型权重参数到定义的网络结构中，最后更改最后一个全连接层的结构，以较低的学习率开始训练，得到预训练好的前端网络模型；

第二块为预选区域网络，预选区域网络是将训练集中图像作为输入，输出矩形目标预选区域的集合，每一个预选区域有一个得分，这个得分来判断所选的区域是否为目标所在区域；为了生成矩形目标预选区域，通过在预训练前端网络最后一个共享卷积层后面添加一个小的滑动窗口，这个滑动窗口全连接到输入卷积特征映射的空间窗口上，每个滑动窗口映射到一个低维向量上，这个向量输出给预选区域回归层和预选区域分类层，预选区域回归层最后输出预选区域的坐标编码，预选区域分类层最后输出预选区域的得分，通过得分判断该预选区域是否为目标所在区域，然后把为真的矩形目标预选区域集合送到下一级网络中进行分类识别；

第三块为快速区域化卷积神经网络，快速区域化卷积神经网络跟预选区域网络共享预训练前端网络初始化的共享特征层，在预训练前端网络对图像进行卷积网络特征提取之后，经预选区域网络输出矩形目标预选区域，生成矩形目标预选区域卷积特征图，取出矩形目标预选区域卷积特征图上对应的深度特征，用一个矩形目标预选区域池化层将通道内的全部特征统一成相同大小，生成一个固定维度的特征图，最后经过两个全连接特征层得到特征向量，特征向量再经由各自的全连接层中的两个多任务模型来完成图像中线路设备的识别和框选；所述两个多任务模型为基于柔性最大值传输函数的识别分类模型和预选区域窗口回归模型。

本发明具有以下有益效果：本发明提出判别配网是否能够带电作业的影响因子，提出合理的量化考评表来决定各个影响因子的影响比重，搭建基于机器学习的中文文本自动分类模型来对待评估的线路的外部条件进行量化打分，搭建基于机器学习的图像识别分类模型来对待评估的线路的内部条件进行量化打分，为配网是否满足带电作业条件提供智能化的判别方法，且模型能够精确地判别带电作业条件的区间。从而解决目前无法智能化的根据配电线路外部条件和设备条件数据对配电线路是否能进行带电作业作出判断的问题。

附图说明

图1是本发明的基于文本分类和图像识别的配网带电作业条件判别方法的流程图；

具体实施方式

下面结合附图对本发明作进一步详细的描述。

如图1所示，本发明提出的一种基于文本分类和图像识别的配网带电作业条件判别方法，采用深度学习技术，利用文本分类和图像识别模型对配网中需要带电作业的线路进行判别打分，为带电作业人员判断配网线路是否能够进行带电作业提供智能有效的决策依据。具体步骤如下：

S1.导出配电线路外部条件数据，生成配电线路带电作业外部条件判别文本数据库：

从电网公司生产管理***导出能够用于配电线路带电作业条件判断的配电线路外部条件数据，生成配电线路带电作业外部条件判别文本数据库。线路外部条件数据包括：供电区域、电网结构、N-n检验、地形、用户接入和配电自动化水平。

S2.在配电线路设备现场采集图片，形成线路设备条件数据，生成线路设备图像数据库：在配电线路现场拍照，采集能够反映配电线路实时状态并能够用于配电线路带电作业条件判断的配电线路设备条件数据，生成线路设备图像数据库。线路设备条件数据包括：架空线(电缆)、杆型、开断设备、变电设备、绝缘设备和金具。

S3.对文本数据库和图像数据库进行预处理：

将线路外部条件和线路设备条件分别对应不同的分值生成条件分值表，条件分值表反映每种条件对应的分值，分值大小反映每种条件所占的比重。

线路外部条件和线路设备条件对应的分值如下表1所示。

表1条件分值对应表

在对文本数据库和图像数据库进行预处理中，采用隐马尔可夫模型，针对文本中的分段、分句、分词、去除停用词等进行提取，再将文本转换为计算机可识别和处理的形式，以矩阵或向量的形式对文本进行表示；对图像数据库进行预处理，首先挖掘出电力小部件的先验形状的统计特征，然后利用局部不变特征，对图像进行分割和提取将得到具有不变性的特征表示。

S4.搭建基于机器学习的中文文本自动分类模型和基于机器学习的图像识别分类模型：

S41.搭建基于机器学习的中文文本自动分类模型：

以词为单位进行文本表示形成词向量，再将词向量按照词在句子中出现的顺序进行拼接，形成代表句子的矩阵，然后送入基于深度学习技术的卷积神经网络模型中，在词向量的基础上，实现句子特征的自动提取和学习，最后实现缺陷文本的自动分类。

其中，基于深度学习技术的卷积神经网络模型为一个四层的卷积神经网络模型，具体形式如下：

第一层为输入层。输入层为一个未分类的外部条件对应的词组矩阵W∈R^s×n，W代表一个未分类的外部条件对应的词组，R代表该词组转换的矩阵，矩阵的每一行代表词组中每个词对应的向量，行数s即词组的词数，列数n即向量的维数。

第二层为一维卷积层。采用列数与W相同(为n)、行数为h的卷积矩阵窗口I∈R^h×n，与输入层矩阵W的每个h行n列矩阵块由上到下依次进行卷积运算，其中每一个卷积窗口能从输入的矩阵R中抽取出一个特征图特征，称为文本特征。

第三层为池化层。采用最大池化的方法，取每个卷积窗口卷积得到的特征图向量中最大的元素作为特征值，从而提取各个卷积窗口对应的特征值，并将所有特征值依次拼接构成池化层的一维向量，即为代表句子全局特征的向量。

第四层为输出层。输出层与池化层全连接，以池化层的一维向量为输入，经过激活函数输出，再加上丢失层去除部分数据防止过拟合，最后采用softmax分类器对一维向量进行分类，并输出最终的分类结果。

S42.搭建基于机器学习的图像识别分类模型：

先以国际大型视觉对象的分类识别和检测挑战赛(Pattern Analysis、Statistical modelling and Computational Learning Visual Object Classes，PASCALVOC)的数据库为模板建立图像识别数据库，用以存放经过预处理后的图像数据，然后送入基于深度学习技术的卷积神经网络模型中，在图像预处理的基础上，实现图像特征的自动提取和学习，最后实现图像数据中线路设备条件的打分分类。

其中，基于深度学习技术的卷积神经网络模型共包含三大块组件网络模型：

第一块为预训练前端网络模型。在深度学习的学习过程中，由于计算资源有限或者训练集较小，为了获得较好较稳定的结果，通过将一些训练好的网络模型进行微调，然后再导入整个网络识别模型中。采用ResNet50作为预训练模型。首先ResNet50网络模型中不包含全连接层的模型参数到本地，然后定义ResNet50的网络结构，再加载模型权重参数到定义的网络结构中，最后更改最后一个全连接层的结构，以较低的学习率开始训练，得到预训练好的前端网络模型。

第二块为预选区域网络(Regional Proposal Network，RPN)。RPN网络的核心思想是将训练集中图像作为输入，输出矩形目标预选区域(Region Of Interest，ROI)的集合，每一个预选区域有一个得分，这个得分来判断所选的区域是否为目标所在区域。为了生成矩形目标预选区域，通过在预训练前端网络最后一个共享卷积层后面添加一个小的滑动窗口，这个滑动窗口全连接到输入卷积特征映射的空间窗口上，每个滑动窗口映射到一个低维向量上，这个向量输出给两个同级的全连接层—预选区域回归层(reg)和预选区域分类层(cls)，reg层最后输出预选区域的坐标编码，cls层最后输出预选区域的得分，通过得分判断该预选区域是否为目标所在区域，然后把为真的矩形目标预选区域集合送到下一级网络中进行分类识别。

第三块为快速区域化卷积神经网络(Fast R-CNN)。Fast R-CNN网络跟RPN网络共享预训练前端网络初始化的共享特征层。在预训练前端网络对图像进行卷积网络特征提取之后，经RPN网络输出ROI，生成ROI卷积特征图，取出ROI卷积特征图上对应的深度特征，用一个ROI池化层将通道内的全部特征统一成相同大小，生成一个固定维度的特征图，最后经过两个全连接特征层得到特征向量，特征向量再经由各自的全连接层中的两个多任务模型—基于柔性最大值传输函数(softmax)的识别分类模型和预选区域窗口回归(BBox)模型来完成图像中电力设备的识别和框选。

S5.将预处理后的文本数据库和图像数据库分成训练集和测试集两大类，利用训练集数据分别对搭建好的基于机器学习的中文文本自动分类模型和基于机器学习的图像识别分类模型进行有监督的训练，然后利用测试集数据测试训练好的模型识别的准确率。通过调整参数使两个模型对测试集中的数据识别的准确率达到90％以上，得到一个最优识别效果的基于机器学习的中文文本自动分类模型和图像识别分类模型。

S6.对配电线路划分评分等级，将新采集数据导入训练好的模型中，模型识别带电作业判别条件特征并评分，根据总评分值对应评分等级判别该条件下是否满足带电作业条件要求。

假设某条线路有n个是否适合带电作业条件，某个条件的分值为X，则整条线路是否适合带电作业条件的平均得分为：

其中L为某条线路否适合带电作业条件的总得分，i表示线路其中一个判断条件，取值范围从1到n。

得到总评分值之后，根据下表的评分值对应的等级及其说明，来判别该配电线路是否满足带电作业条件要求。

表2评分值和评分等级分类表

总评分值	70分及以下	70-80分	80-90分	90-100分
					评分等级	停电检修线路	待改造线路	准不停电线路	不停电线路

评分等级：

(1)不停电线路：全线路总评分满足不停电线路的要求；

(2)准不停电线路：全线路有部分设备需经过小范围改造即可达到不停电线路的要求；

(3)待改造线路：全线路经过较大范围的改造才能达到不停电作业线路的要求；

(4)停电检修线路：全线路需全停改造才能达到不停电作业线路的要求。

当全线路总评分满足各级别不停电线路的要求，但全线路有少数设备不符合不停电作业要求，则将线路级别降一级。

本发明在Windows10操作***下，CPU型号为Intel Core i7，GPU型号为NVIDIAGeForce GTX 970，4G独立显存的配置中完成网络模型的搭建。采用Tensorflow构架实现卷积神经网络模型。首先将数据库中部分数据作为训练集导入模型进行训练，待训练完成之后，导入测试集数据进行测试，采用错误率和严重偏差率来考量文本分类模型的识别效果，采用准确率和召回率来考量图像识别模型的识别效果。结果表明，模型的错误率和严重偏差率分别为2.86％和0.80％，准确率和召回率分别为92％和86％，说明本发明的模型能够很大程度精确地判别带电作业条件的区间，为工作人员对是否能进行带电作业提供智能有效的决策依据。

Claims

1.基于文本分类和图像识别的配网带电作业条件判别方法，其特征在于，包括以下步骤：

S3.对文本数据库和图像数据库进行预处理，包括：将线路外部条件和线路设备条件分别对应不同的分值生成条件分值表，条件分值表反映每种条件对应的分值，分值大小反映每种条件所占的比重；以矩阵或向量的形式对文本进行表示，对图像进行分割和提取得到具有不变性的特征表示；

S6.对配电线路划分评分等级，将新采集数据导入训练好的模型中，模型识别带电作业判别条件特征并评分，根据总评分值对应评分等级判别该条件下是否满足带电作业条件要求；

所述步骤S4搭建基于机器学习的中文文本自动分类模型的具体操作为：以词为单位进行文本表示形成词向量，再将词向量按照词在句子中出现的顺序进行拼接，形成代表句子的矩阵，然后送入基于深度学习技术的卷积神经网络模型中，在词向量的基础上，实现句子特征的自动提取和学习，最后实现缺陷文本的自动分类；

所述步骤S4搭建基于机器学习的图像识别分类模型的具体操作为：先以国际大型视觉对象的分类识别和检测挑战赛的数据库为模板建立图像识别数据库，用以存放经过预处理后的图像数据，然后送入基于深度学习技术的卷积神经网络模型中，在图像预处理的基础上，实现图像特征的自动提取和学习，最后实现图像数据中线路设备条件的打分分类。

2.根据权利要求1所述的方法，其特征在于，所述步骤S1的线路外部条件数据包括：供电区域、电网结构、N-n检验、地形、用户接入和配电自动化水平。

3.根据权利要求1所述的方法，其特征在于，所述步骤S2的线路设备条件数据包括：架空线、杆型、开断设备、变电设备、绝缘设备和金具。

4.根据权利要求1所述的方法，其特征在于，所述基于深度学习技术的卷积神经网络模型为一个四层的卷积神经网络模型，具体形式为：

5.根据权利要求1所述的方法，其特征在于，所述基于深度学习技术的卷积神经网络模型包含三大块组件网络模型：