CN109614488B - 基于文本分类和图像识别的配网带电作业条件判别方法 - Google Patents
基于文本分类和图像识别的配网带电作业条件判别方法 Download PDFInfo
- Publication number
- CN109614488B CN109614488B CN201811470666.8A CN201811470666A CN109614488B CN 109614488 B CN109614488 B CN 109614488B CN 201811470666 A CN201811470666 A CN 201811470666A CN 109614488 B CN109614488 B CN 109614488B
- Authority
- CN
- China
- Prior art keywords
- layer
- line
- area
- network
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000009826 distribution Methods 0.000 title claims abstract description 47
- 238000000034 method Methods 0.000 title claims abstract description 25
- 238000012549 training Methods 0.000 claims abstract description 38
- 238000013145 classification model Methods 0.000 claims abstract description 28
- 238000010801 machine learning Methods 0.000 claims abstract description 22
- 238000012360 testing method Methods 0.000 claims abstract description 17
- 238000007781 pre-processing Methods 0.000 claims abstract description 9
- 238000004519 manufacturing process Methods 0.000 claims abstract description 4
- 239000013598 vector Substances 0.000 claims description 43
- 239000011159 matrix material Substances 0.000 claims description 30
- 238000013527 convolutional neural network Methods 0.000 claims description 23
- 238000011176 pooling Methods 0.000 claims description 18
- 238000013135 deep learning Methods 0.000 claims description 14
- 238000005516 engineering process Methods 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 8
- 230000006870 function Effects 0.000 claims description 6
- 239000000284 extract Substances 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 3
- 230000002950 deficient Effects 0.000 claims description 3
- 238000007689 inspection Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 238000012546 transfer Methods 0.000 claims description 3
- 230000000007 visual effect Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 claims 3
- 230000000694 effects Effects 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012850 discrimination method Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000011158 quantitative evaluation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Economics (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于文本分类和图像识别的配网带电作业条件判别方法,先从电网公司生产管理***导出配电线路外部条件数据,生成配电线路带电作业外部条件判别文本数据库,再通过对配电线路现场拍照,生成线路设备图像数据库,对数据库进行预处理,然后搭建基于机器学习的中文文本自动分类模型和图像识别分类模型,将数据库分成训练集和测试集两大类,利用训练集分别对两个模型进行有监督的训练,利用测试集对训练好的模型进行测试;最后将新采集的数据输入到训练好的模型中,模型对每个判别条件特征进行识别并评分,根据总评分值对应评分等级判别该配电线路是否符合带电作业条件要求,为工作人员对是否能进行带电作业提供智能有效的决策依据。
Description
技术领域
本发明属于中低压配电网线路带电作业技术领域,具体涉及一种基于文本分类和图像识别的配网带电作业条件判别方法。
背景技术
带电作业是电网设备检测、检修维护和改造的重要手段和方法,是保证电力***可靠稳定运行的重要技术措施。随着配电网供电可靠性要求的不断提高,配电线路带电作业和不停电作业法也得到广泛应用和推广。新技术、新设备、新材料在带电作业领域的应用也有力推动了带电作业工具、设备、标准制定等方面的进步和发展,并对今后带电作业技术提出了新的要求和发展方向。然而,目前大部分电网公司关于带电作业条件的判别仍然是通过人为的去现场查看设备,缺乏对当前设备在电网结构中所处的位置的清晰认知,智能化分析手段不足,人为主观因素影响较多;没有一个统一的判别标准,对线路能不能进行带电作业的内外因素分析不足,无法量化每一个条件对线路是否能进行带电作业的影响。
发明内容
针对上述现有技术存在的不足,本发明提供一种基于文本分类和图像识别的配网带电作业条件判别方法,从而解决目前无法智能化的根据配电线路外部条件和设备条件数据对配电线路是否能进行带电作业作出判断的问题。
本发明所要解决的技术问题,通过以下技术方案予以实现:
一种基于文本分类和图像识别的配网带电作业条件判别方法,包括以下步骤:
S1.从电网公司生产管理***导出配电线路外部条件数据,生成配电线路带电作业外部条件判别文本数据库;
S2.在配电线路现场采集图片,形成线路设备条件数据,生成线路设备图像数据库;
S3.对文本数据库和图像数据库进行预处理,包括:将线路外部条件和线路设备条件分别对应不同的分值生成条件分值表,条件分值表反映每种条件对应的分值,分值大小反映每种条件占的比重;以矩阵或向量的形式对文本进行表示,对图像进行分割和提取得到具有不变性的特征表示;
S4.搭建基于机器学习的中文文本自动分类模型和基于机器学习的图像识别分类模型;
S5.将预处理后的文本数据库和图像数据库分成训练集和测试集两大类,利用训练集数据分别对搭建好的基于机器学习的中文文本自动分类模型和基于机器学习的图像识别分类模型进行有监督的训练,然后利用测试集数据测试训练好的模型识别的准确率,通过调整参数使模型对测试集中的数据识别的准确率达到90%以上;
S6.对配电线路划分评分等级,将新采集数据导入训练好的模型中,模型识别带电作业判别条件特征并评分,根据总评分值对应评分等级判断该条件下是否满足带电作业条件要求。
所述步骤S1的线路外部条件数据包括:供电区域、电网结构、N-n检验、地形、用户接入和配电自动化水平。
所述步骤S2的线路设备条件数据包括:架空线、杆型、开断设备、变电设备、绝缘设备和金具。
所述步骤S4搭建基于机器学习的中文文本自动分类模型的具体操作为:以词为单位进行文本表示形成词向量,再将词向量按照词在句子中出现的顺序进行拼接,形成代表句子的矩阵,然后送入基于深度学习技术的卷积神经网络模型中,在词向量的基础上,实现句子特征的自动提取和学习,最后实现缺陷文本的自动分类。其中,所述基于深度学习技术的卷积神经网络模型为一个四层的卷积神经网络模型,具体形式为:
第一层为输入层,输入层为一个未分类的外部条件对应的词组矩阵W∈Rs×n,W代表一个未分类的外部条件对应的词组,R代表该词组转换的矩阵,矩阵的每一行代表词组中每个词对应的向量,行数s为词组的词数,列数n为向量的维数;
第二层为一维卷积层,采用列数与W相同、行数为h的卷积矩阵窗口I∈Rh×n,与输入层矩阵W的每个h行n列矩阵块由上到下依次进行卷积运算,其中每一个卷积窗口能从输入的矩阵R中抽取出一个特征图特征,称为文本特征;
第三层为池化层,采用最大池化的方法,取每个卷积窗口卷积得到的特征图向量中最大的元素作为特征值,从而提取各个卷积窗口对应的特征值,并将所有特征值依次拼接构成池化层的一维向量,即为代表句子全局特征的向量;
第四层为输出层,输出层与池化层全连接,以池化层的一维向量为输入,经过激活函数输出,再加上丢失层去除部分数据防止过拟合,最后采用softmax分类器对一维向量进行分类,并输出最终的分类结果。
所述步骤S4搭建基于机器学习的图像识别分类模型的具体操作为:先以国际大型视觉对象的分类识别和检测挑战赛的数据库为模板建立图像识别数据库,用以存放经过预处理后的图像数据,然后送入基于深度学习技术的卷积神经网络模型中,在图像预处理的基础上,实现图像特征的自动提取和学习,最后实现图像数据中线路设备条件的打分分类。其中,所述基于深度学习技术的卷积神经网络模型包含三大块组件网络模型:
第一块为预训练前端网络,采用ResNet50作为预训练模型,首先ResNet50网络模型中不包含全连接层的模型参数到本地,然后定义ResNet50的网络结构,再加载模型权重参数到定义的网络结构中,最后更改最后一个全连接层的结构,以较低的学习率开始训练,得到预训练好的前端网络模型;
第二块为预选区域网络,预选区域网络是将训练集中图像作为输入,输出矩形目标预选区域的集合,每一个预选区域有一个得分,这个得分来判断所选的区域是否为目标所在区域;为了生成矩形目标预选区域,通过在预训练前端网络最后一个共享卷积层后面添加一个小的滑动窗口,这个滑动窗口全连接到输入卷积特征映射的空间窗口上,每个滑动窗口映射到一个低维向量上,这个向量输出给预选区域回归层和预选区域分类层,预选区域回归层最后输出预选区域的坐标编码,预选区域分类层最后输出预选区域的得分,通过得分判断该预选区域是否为目标所在区域,然后把为真的矩形目标预选区域集合送到下一级网络中进行分类识别;
第三块为快速区域化卷积神经网络,快速区域化卷积神经网络跟预选区域网络共享预训练前端网络初始化的共享特征层,在预训练前端网络对图像进行卷积网络特征提取之后,经预选区域网络输出矩形目标预选区域,生成矩形目标预选区域卷积特征图,取出矩形目标预选区域卷积特征图上对应的深度特征,用一个矩形目标预选区域池化层将通道内的全部特征统一成相同大小,生成一个固定维度的特征图,最后经过两个全连接特征层得到特征向量,特征向量再经由各自的全连接层中的两个多任务模型来完成图像中线路设备的识别和框选;所述两个多任务模型为基于柔性最大值传输函数的识别分类模型和预选区域窗口回归模型。
本发明具有以下有益效果:本发明提出判别配网是否能够带电作业的影响因子,提出合理的量化考评表来决定各个影响因子的影响比重,搭建基于机器学习的中文文本自动分类模型来对待评估的线路的外部条件进行量化打分,搭建基于机器学习的图像识别分类模型来对待评估的线路的内部条件进行量化打分,为配网是否满足带电作业条件提供智能化的判别方法,且模型能够精确地判别带电作业条件的区间。从而解决目前无法智能化的根据配电线路外部条件和设备条件数据对配电线路是否能进行带电作业作出判断的问题。
附图说明
图1是本发明的基于文本分类和图像识别的配网带电作业条件判别方法的流程图;
具体实施方式
下面结合附图对本发明作进一步详细的描述。
如图1所示,本发明提出的一种基于文本分类和图像识别的配网带电作业条件判别方法,采用深度学习技术,利用文本分类和图像识别模型对配网中需要带电作业的线路进行判别打分,为带电作业人员判断配网线路是否能够进行带电作业提供智能有效的决策依据。具体步骤如下:
S1.导出配电线路外部条件数据,生成配电线路带电作业外部条件判别文本数据库:
从电网公司生产管理***导出能够用于配电线路带电作业条件判断的配电线路外部条件数据,生成配电线路带电作业外部条件判别文本数据库。线路外部条件数据包括:供电区域、电网结构、N-n检验、地形、用户接入和配电自动化水平。
S2.在配电线路设备现场采集图片,形成线路设备条件数据,生成线路设备图像数据库:在配电线路现场拍照,采集能够反映配电线路实时状态并能够用于配电线路带电作业条件判断的配电线路设备条件数据,生成线路设备图像数据库。线路设备条件数据包括:架空线(电缆)、杆型、开断设备、变电设备、绝缘设备和金具。
S3.对文本数据库和图像数据库进行预处理:
将线路外部条件和线路设备条件分别对应不同的分值生成条件分值表,条件分值表反映每种条件对应的分值,分值大小反映每种条件所占的比重。
线路外部条件和线路设备条件对应的分值如下表1所示。
表1条件分值对应表
在对文本数据库和图像数据库进行预处理中,采用隐马尔可夫模型,针对文本中的分段、分句、分词、去除停用词等进行提取,再将文本转换为计算机可识别和处理的形式,以矩阵或向量的形式对文本进行表示;对图像数据库进行预处理,首先挖掘出电力小部件的先验形状的统计特征,然后利用局部不变特征,对图像进行分割和提取将得到具有不变性的特征表示。
S4.搭建基于机器学习的中文文本自动分类模型和基于机器学习的图像识别分类模型:
S41.搭建基于机器学习的中文文本自动分类模型:
以词为单位进行文本表示形成词向量,再将词向量按照词在句子中出现的顺序进行拼接,形成代表句子的矩阵,然后送入基于深度学习技术的卷积神经网络模型中,在词向量的基础上,实现句子特征的自动提取和学习,最后实现缺陷文本的自动分类。
其中,基于深度学习技术的卷积神经网络模型为一个四层的卷积神经网络模型,具体形式如下:
第一层为输入层。输入层为一个未分类的外部条件对应的词组矩阵W∈Rs×n,W代表一个未分类的外部条件对应的词组,R代表该词组转换的矩阵,矩阵的每一行代表词组中每个词对应的向量,行数s即词组的词数,列数n即向量的维数。
第二层为一维卷积层。采用列数与W相同(为n)、行数为h的卷积矩阵窗口I∈Rh×n,与输入层矩阵W的每个h行n列矩阵块由上到下依次进行卷积运算,其中每一个卷积窗口能从输入的矩阵R中抽取出一个特征图特征,称为文本特征。
第三层为池化层。采用最大池化的方法,取每个卷积窗口卷积得到的特征图向量中最大的元素作为特征值,从而提取各个卷积窗口对应的特征值,并将所有特征值依次拼接构成池化层的一维向量,即为代表句子全局特征的向量。
第四层为输出层。输出层与池化层全连接,以池化层的一维向量为输入,经过激活函数输出,再加上丢失层去除部分数据防止过拟合,最后采用softmax分类器对一维向量进行分类,并输出最终的分类结果。
S42.搭建基于机器学习的图像识别分类模型:
先以国际大型视觉对象的分类识别和检测挑战赛(Pattern Analysis、Statistical modelling and Computational Learning Visual Object Classes,PASCALVOC)的数据库为模板建立图像识别数据库,用以存放经过预处理后的图像数据,然后送入基于深度学习技术的卷积神经网络模型中,在图像预处理的基础上,实现图像特征的自动提取和学习,最后实现图像数据中线路设备条件的打分分类。
其中,基于深度学习技术的卷积神经网络模型共包含三大块组件网络模型:
第一块为预训练前端网络模型。在深度学习的学习过程中,由于计算资源有限或者训练集较小,为了获得较好较稳定的结果,通过将一些训练好的网络模型进行微调,然后再导入整个网络识别模型中。采用ResNet50作为预训练模型。首先ResNet50网络模型中不包含全连接层的模型参数到本地,然后定义ResNet50的网络结构,再加载模型权重参数到定义的网络结构中,最后更改最后一个全连接层的结构,以较低的学习率开始训练,得到预训练好的前端网络模型。
第二块为预选区域网络(Regional Proposal Network,RPN)。RPN网络的核心思想是将训练集中图像作为输入,输出矩形目标预选区域(Region Of Interest,ROI)的集合,每一个预选区域有一个得分,这个得分来判断所选的区域是否为目标所在区域。为了生成矩形目标预选区域,通过在预训练前端网络最后一个共享卷积层后面添加一个小的滑动窗口,这个滑动窗口全连接到输入卷积特征映射的空间窗口上,每个滑动窗口映射到一个低维向量上,这个向量输出给两个同级的全连接层—预选区域回归层(reg)和预选区域分类层(cls),reg层最后输出预选区域的坐标编码,cls层最后输出预选区域的得分,通过得分判断该预选区域是否为目标所在区域,然后把为真的矩形目标预选区域集合送到下一级网络中进行分类识别。
第三块为快速区域化卷积神经网络(Fast R-CNN)。Fast R-CNN网络跟RPN网络共享预训练前端网络初始化的共享特征层。在预训练前端网络对图像进行卷积网络特征提取之后,经RPN网络输出ROI,生成ROI卷积特征图,取出ROI卷积特征图上对应的深度特征,用一个ROI池化层将通道内的全部特征统一成相同大小,生成一个固定维度的特征图,最后经过两个全连接特征层得到特征向量,特征向量再经由各自的全连接层中的两个多任务模型—基于柔性最大值传输函数(softmax)的识别分类模型和预选区域窗口回归(BBox)模型来完成图像中电力设备的识别和框选。
S5.将预处理后的文本数据库和图像数据库分成训练集和测试集两大类,利用训练集数据分别对搭建好的基于机器学习的中文文本自动分类模型和基于机器学习的图像识别分类模型进行有监督的训练,然后利用测试集数据测试训练好的模型识别的准确率。通过调整参数使两个模型对测试集中的数据识别的准确率达到90%以上,得到一个最优识别效果的基于机器学习的中文文本自动分类模型和图像识别分类模型。
S6.对配电线路划分评分等级,将新采集数据导入训练好的模型中,模型识别带电作业判别条件特征并评分,根据总评分值对应评分等级判别该条件下是否满足带电作业条件要求。
假设某条线路有n个是否适合带电作业条件,某个条件的分值为X,则整条线路是否适合带电作业条件的平均得分为:
其中L为某条线路否适合带电作业条件的总得分,i表示线路其中一个判断条件,取值范围从1到n。
得到总评分值之后,根据下表的评分值对应的等级及其说明,来判别该配电线路是否满足带电作业条件要求。
表2评分值和评分等级分类表
总评分值 | 70分及以下 | 70-80分 | 80-90分 | 90-100分 |
评分等级 | 停电检修线路 | 待改造线路 | 准不停电线路 | 不停电线路 |
评分等级:
(1)不停电线路:全线路总评分满足不停电线路的要求;
(2)准不停电线路:全线路有部分设备需经过小范围改造即可达到不停电线路的要求;
(3)待改造线路:全线路经过较大范围的改造才能达到不停电作业线路的要求;
(4)停电检修线路:全线路需全停改造才能达到不停电作业线路的要求。
当全线路总评分满足各级别不停电线路的要求,但全线路有少数设备不符合不停电作业要求,则将线路级别降一级。
本发明在Windows10操作***下,CPU型号为Intel Core i7,GPU型号为NVIDIAGeForce GTX 970,4G独立显存的配置中完成网络模型的搭建。采用Tensorflow构架实现卷积神经网络模型。首先将数据库中部分数据作为训练集导入模型进行训练,待训练完成之后,导入测试集数据进行测试,采用错误率和严重偏差率来考量文本分类模型的识别效果,采用准确率和召回率来考量图像识别模型的识别效果。结果表明,模型的错误率和严重偏差率分别为2.86%和0.80%,准确率和召回率分别为92%和86%,说明本发明的模型能够很大程度精确地判别带电作业条件的区间,为工作人员对是否能进行带电作业提供智能有效的决策依据。
Claims (5)
1.基于文本分类和图像识别的配网带电作业条件判别方法,其特征在于,包括以下步骤:
S1.从电网公司生产管理***导出配电线路外部条件数据,生成配电线路带电作业外部条件判别文本数据库;
S2.在配电线路现场采集图片,形成线路设备条件数据,生成线路设备图像数据库;
S3.对文本数据库和图像数据库进行预处理,包括:将线路外部条件和线路设备条件分别对应不同的分值生成条件分值表,条件分值表反映每种条件对应的分值,分值大小反映每种条件所占的比重;以矩阵或向量的形式对文本进行表示,对图像进行分割和提取得到具有不变性的特征表示;
S4.搭建基于机器学习的中文文本自动分类模型和基于机器学习的图像识别分类模型;
S5.将预处理后的文本数据库和图像数据库分成训练集和测试集两大类,利用训练集数据分别对搭建好的基于机器学习的中文文本自动分类模型和基于机器学习的图像识别分类模型进行有监督的训练,然后利用测试集数据测试训练好的模型识别的准确率,通过调整参数使模型对测试集中的数据识别的准确率达到90%以上;
S6.对配电线路划分评分等级,将新采集数据导入训练好的模型中,模型识别带电作业判别条件特征并评分,根据总评分值对应评分等级判别该条件下是否满足带电作业条件要求;
所述步骤S4搭建基于机器学习的中文文本自动分类模型的具体操作为:以词为单位进行文本表示形成词向量,再将词向量按照词在句子中出现的顺序进行拼接,形成代表句子的矩阵,然后送入基于深度学习技术的卷积神经网络模型中,在词向量的基础上,实现句子特征的自动提取和学习,最后实现缺陷文本的自动分类;
所述步骤S4搭建基于机器学习的图像识别分类模型的具体操作为:先以国际大型视觉对象的分类识别和检测挑战赛的数据库为模板建立图像识别数据库,用以存放经过预处理后的图像数据,然后送入基于深度学习技术的卷积神经网络模型中,在图像预处理的基础上,实现图像特征的自动提取和学习,最后实现图像数据中线路设备条件的打分分类。
2.根据权利要求1所述的方法,其特征在于,所述步骤S1的线路外部条件数据包括:供电区域、电网结构、N-n检验、地形、用户接入和配电自动化水平。
3.根据权利要求1所述的方法,其特征在于,所述步骤S2的线路设备条件数据包括:架空线、杆型、开断设备、变电设备、绝缘设备和金具。
4.根据权利要求1所述的方法,其特征在于,所述基于深度学习技术的卷积神经网络模型为一个四层的卷积神经网络模型,具体形式为:
第一层为输入层,输入层为一个未分类的外部条件对应的词组矩阵W∈Rs×n,W代表一个未分类的外部条件对应的词组,R代表该词组转换的矩阵,矩阵的每一行代表词组中每个词对应的向量,行数s为词组的词数,列数n为向量的维数;
第二层为一维卷积层,采用列数与W相同、行数为h的卷积矩阵窗口I∈Rh×n,与输入层矩阵W的每个h行n列矩阵块由上到下依次进行卷积运算,其中每一个卷积窗口能从输入的矩阵R中抽取出一个特征图特征,称为文本特征;
第三层为池化层,采用最大池化的方法,取每个卷积窗口卷积得到的特征图向量中最大的元素作为特征值,从而提取各个卷积窗口对应的特征值,并将所有特征值依次拼接构成池化层的一维向量,即为代表句子全局特征的向量;
第四层为输出层,输出层与池化层全连接,以池化层的一维向量为输入,经过激活函数输出,再加上丢失层去除部分数据防止过拟合,最后采用softmax分类器对一维向量进行分类,并输出最终的分类结果。
5.根据权利要求1所述的方法,其特征在于,所述基于深度学习技术的卷积神经网络模型包含三大块组件网络模型:
第一块为预训练前端网络,采用ResNet50作为预训练模型,首先ResNet50网络模型中不包含全连接层的模型参数到本地,然后定义ResNet50的网络结构,再加载模型权重参数到定义的网络结构中,最后更改最后一个全连接层的结构,以较低的学习率开始训练,得到预训练好的前端网络模型;
第二块为预选区域网络,预选区域网络是将训练集中图像作为输入,输出矩形目标预选区域的集合,每一个预选区域有一个得分,这个得分来判断所选的区域是否为目标所在区域;为了生成矩形目标预选区域,通过在预训练前端网络最后一个共享卷积层后面添加一个小的滑动窗口,这个滑动窗口全连接到输入卷积特征映射的空间窗口上,每个滑动窗口映射到一个低维向量上,这个向量输出给预选区域回归层和预选区域分类层,预选区域回归层最后输出预选区域的坐标编码,预选区域分类层最后输出预选区域的得分,通过得分判断该预选区域是否为目标所在区域,然后把为真的矩形目标预选区域集合送到下一级网络中进行分类识别;
第三块为快速区域化卷积神经网络,快速区域化卷积神经网络跟预选区域网络共享预训练前端网络初始化的共享特征层,在预训练前端网络对图像进行卷积网络特征提取之后,经预选区域网络输出矩形目标预选区域,生成矩形目标预选区域卷积特征图,取出矩形目标预选区域卷积特征图上对应的深度特征,用一个矩形目标预选区域池化层将通道内的全部特征统一成相同大小,生成一个固定维度的特征图,最后经过两个全连接特征层得到特征向量,特征向量再经由各自的全连接层中的两个多任务模型来完成图像中线路设备的识别和框选;所述两个多任务模型为基于柔性最大值传输函数的识别分类模型和预选区域窗口回归模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811470666.8A CN109614488B (zh) | 2018-12-04 | 2018-12-04 | 基于文本分类和图像识别的配网带电作业条件判别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811470666.8A CN109614488B (zh) | 2018-12-04 | 2018-12-04 | 基于文本分类和图像识别的配网带电作业条件判别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109614488A CN109614488A (zh) | 2019-04-12 |
CN109614488B true CN109614488B (zh) | 2022-12-02 |
Family
ID=66006906
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811470666.8A Active CN109614488B (zh) | 2018-12-04 | 2018-12-04 | 基于文本分类和图像识别的配网带电作业条件判别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109614488B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020220369A1 (en) | 2019-05-01 | 2020-11-05 | Microsoft Technology Licensing, Llc | Method and system of utilizing unsupervised learning to improve text to content suggestions |
US11429787B2 (en) | 2019-05-01 | 2022-08-30 | Microsoft Technology Licensing, Llc | Method and system of utilizing unsupervised learning to improve text to content suggestions |
CN110490105A (zh) * | 2019-08-06 | 2019-11-22 | 南京大国科技有限公司 | 基于图像识别的配变台区验收方法、装置及计算机存储介质 |
CN112784652A (zh) * | 2019-11-11 | 2021-05-11 | 中强光电股份有限公司 | 图像识别方法及装置 |
CN110908901B (zh) * | 2019-11-11 | 2023-05-02 | 福建天晴数码有限公司 | 一种图像识别能力的自动化验证方法及*** |
CN111026870A (zh) * | 2019-12-11 | 2020-04-17 | 华北电力大学 | 一种综合文本分类和图像识别的ict***故障分析方法 |
CN113742508B (zh) * | 2021-07-30 | 2023-09-08 | 国网河南省电力公司信息通信公司 | 一种电力设备在线监测海量信息的图形数据挖掘方法 |
CN116416247A (zh) * | 2023-06-08 | 2023-07-11 | 常州微亿智造科技有限公司 | 基于预训练的缺陷检测方法及装置 |
CN116701303B (zh) * | 2023-07-06 | 2024-03-12 | 浙江档科信息技术有限公司 | 基于深度学习的电子文件分类方法、***及可读存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107038480A (zh) * | 2017-05-12 | 2017-08-11 | 东华大学 | 一种基于卷积神经网络的文本情感分类方法 |
CN107918772A (zh) * | 2017-12-10 | 2018-04-17 | 北京工业大学 | 基于压缩感知理论和gcForest的目标跟踪方法 |
CN108898138A (zh) * | 2018-05-30 | 2018-11-27 | 西安理工大学 | 基于深度学习的场景文本识别方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106156766B (zh) * | 2015-03-25 | 2020-02-18 | 阿里巴巴集团控股有限公司 | 文本行分类器的生成方法及装置 |
CN106569059A (zh) * | 2016-11-01 | 2017-04-19 | 广西电网有限责任公司电力科学研究院 | 一种具备将测试数据转结构化功能的生产业务*** |
CN107392901A (zh) * | 2017-07-24 | 2017-11-24 | 国网山东省电力公司信息通信公司 | 一种用于输电线路部件智能自动识别的方法 |
CN107491435B (zh) * | 2017-08-14 | 2021-02-26 | 苏州狗尾草智能科技有限公司 | 基于计算机自动识别用户情感的方法及装置 |
CN107808132A (zh) * | 2017-10-23 | 2018-03-16 | 重庆邮电大学 | 一种融合主题模型的场景图像分类方法 |
CN108563731A (zh) * | 2018-04-08 | 2018-09-21 | 北京奇艺世纪科技有限公司 | 一种情感分类方法及装置 |
-
2018
- 2018-12-04 CN CN201811470666.8A patent/CN109614488B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107038480A (zh) * | 2017-05-12 | 2017-08-11 | 东华大学 | 一种基于卷积神经网络的文本情感分类方法 |
CN107918772A (zh) * | 2017-12-10 | 2018-04-17 | 北京工业大学 | 基于压缩感知理论和gcForest的目标跟踪方法 |
CN108898138A (zh) * | 2018-05-30 | 2018-11-27 | 西安理工大学 | 基于深度学习的场景文本识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109614488A (zh) | 2019-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109614488B (zh) | 基于文本分类和图像识别的配网带电作业条件判别方法 | |
CN107122375B (zh) | 基于图像特征的图像主体的识别方法 | |
CN109034044B (zh) | 一种基于融合卷积神经网络的行人再识别方法 | |
CN110532900B (zh) | 基于U-Net和LS-CNN的人脸表情识别方法 | |
CN111126482B (zh) | 一种基于多分类器级联模型的遥感影像自动分类方法 | |
CN103605972A (zh) | 一种基于分块深度神经网络的非限制环境人脸验证方法 | |
CN109767422A (zh) | 基于深度学习的管道检测识别方法、存储介质及机器人 | |
CN111027631B (zh) | 高压耐张线夹压接缺陷判别的x射线影像分类识别方法 | |
CN108710894A (zh) | 一种基于聚类代表点的主动学习标注方法和装置 | |
CN111813997A (zh) | 入侵分析方法、装置、设备及存储介质 | |
CN111402224A (zh) | 一种用于电力设备的目标识别方法 | |
CN110569843A (zh) | 一种矿井目标智能检测与识别方法 | |
CN111126820A (zh) | 反窃电方法及*** | |
CN111209832A (zh) | 变电站巡检机器人辅助避障训练方法、设备及介质 | |
CN108762503A (zh) | 一种基于多模态数据采集的人机交互*** | |
CN112036384B (zh) | ***头部形态识别方法、装置及设备 | |
CN110008828A (zh) | 基于差异正则化的成对约束成分分析度量优化方法 | |
CN114283285A (zh) | 交叉一致性自训练遥感图像语义分割网络训练方法及装置 | |
CN110414431B (zh) | 基于弹性上下文关系损失函数的人脸识别方法及*** | |
CN107944453A (zh) | 基于Hu不变矩和支持向量机SVM的高压套管检测方法 | |
CN114140793A (zh) | 一种用于端子排和端子排接线的匹配方法及装置 | |
CN107633527A (zh) | 基于全卷积神经网络的目标追踪方法及装置 | |
CN111191027B (zh) | 一种基于高斯混合分布vae的广义零样本识别方法 | |
CN108898157B (zh) | 基于卷积神经网络的数值型数据的雷达图表示的分类方法 | |
CN111160756A (zh) | 基于二次人工智能算法的景区评估方法及模型 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |