CN110472545B

CN110472545B - 基于知识迁移学习的航拍电力部件图像的分类方法

Info

Publication number: CN110472545B
Application number: CN201910721060.5A
Authority: CN
Inventors: 赵俊梅; 张利平; 任一峰; 李晓; 余永俊; 白鑫; 张灵菲
Original assignee: North University of China
Current assignee: North University of China
Priority date: 2019-08-06
Filing date: 2019-08-06
Publication date: 2022-09-23
Anticipated expiration: 2039-08-06
Also published as: CN110472545A

Abstract

本发明涉及人工智能中深度学习和机器视觉相结合的领域，基于知识迁移学习的航拍电力部件图像的分类方法，按照如下的步骤进行，建立卷积神经网络GoogLeNet；对卷积神经网络GoogLeNet进行调优，在卷积神经网络GoogLeNet的基础上，将卷积神经网络GoogLeNet的最后三层用一个全连接层、一个softmax层和分类输出层所代替，进行优化设置；在训练网络时，网络参数是结合多次仿真实验和贝叶斯优化算法获取的；将采集到的电力部件图像经过归一化预处理后输入步骤二获得且设置好的新的深度卷积神经网络进行学习，按照绝缘子、金具、杆塔等类别进行分类；进行仿真实验进行验证。

Description

基于知识迁移学习的航拍电力部件图像的分类方法

技术领域

本发明涉及人工智能中深度学习和机器视觉相结合的领域，其应用在电力***中输电线路巡检过程中电力部件的分类识别，进而确保输电线路安全运行。

背景技术

输电线路是电网***中的一个至关重要的组成部分，其作为电网***的主干线路，对整个电网是否可靠、长期、安全稳定运行起到了决定性的作用，并且电网***长期有效的运行直接关系到国家经济的健康发展。随着输电网建设工程的实施，输电线路急剧增加，线路巡检工作量剧增，地理环境复杂、气候条件多变等情况，使传统人工巡检作业更加危险，巡检效率和准确率不高。相对于传统的巡检方式，直升机巡检和无人机巡检方式效率高、巡线方式灵活、获取图像周期短、不受自然环境影响等优势，逐渐成为输电线路巡检的主流方式。在电力巡检目标中，在电力传输网络中电力部件类型多，数量大，并且部分部件容易损坏。在长期的运行中，受到强风、雷雨、冰霉、覆冰等恶劣天气的影响，尤其是绝缘子等容易受到损坏，进一步影响电力***输电网络的正常运行，严重的会造成大面积停电事故的发生。飞行器巡检方式是通过直升机或者无人机稳定的速度和相对固定的角度沿着输电线路拍摄采集图像，在拍摄过程中会经过各种地貌，如山川，河流，草地，房屋，耕地等，也可能是在各种气象条件下(雨、雪、雾靈等)，这些不同地貌和不同气候环境形成的不同背景和噪声对于输电线的检测和故障检测的适用性和鲁棒性是个极大的挑战。随着，航拍输电线路、电力部件图像数据的猛增，其数据量是巨大的，并且数据冗余度也比较大，对于航拍电力部件图像的分类提出了更高地要求。

在机器视觉领域中，一个重要的研究方向是图像特征的提取、分类、检测和识别，早期的图像特征的提取与分类识别都是通过人类手动提取目标图像的特征，这样需要耗费大量的时间和工作量。人工智能中的人工神经网络技术的发展给机器视觉领域带来新的动力和活力，特别是在图像分类与识别领域。而目前，机器学习中的深度学习分支发展迅猛，其中卷积神经网络在图像分类方面具有非常好的效果。使用深度学习，不需要像传统数字图像算法那样手动提取图像特征，卷积神经网络具有自动学习特征。

发明内容

本发明所要解决的技术问题是：如何解决由于航拍电力部件图像的背景复杂，拍摄角度不定，数据量庞大，电力部件实现准确分类、精确定位困难的问题。

本发明所采用的技术方案是：基于知识迁移学习的航拍电力部件图像的分类方法，按照如下的步骤进行

步骤一、建立卷积神经网络GoogLeNet；

步骤二、对卷积神经网络GoogLeNet进行调优，在卷积神经网络GoogLeNet的基础上，将卷积神经网络GoogLeNet的最后三层用一个全连接层、一个softmax层和分类输出层所代替，进而获得新的深度神经网络，然后在原有卷积神经网络GoogLeNet设置基础上，进行优化设置；在训练网络时，网络参数是结合多次仿真实验和贝叶斯优化算法获取的；

步骤三、将采集到的电力部件图像经过归一化预处理后输入步骤二获得且设置好的新的深度卷积神经网络进行学习，按照绝缘子、金具、杆塔等类别进行分类；

步骤四、进行仿真实验进行验证。

卷积神经网络GoogLeNet具有144个单层，其中有22个具有学习权重的功能层，包括21个卷积层和1个全连接层，第一层卷积层采用64个7×7卷积核，步长stride为2的结构，填充padding＝[3 3 3 3]的结构，卷积后得到64维的特征，第一层卷积层特征输出为112×112×64，第一层卷积层后直接输入到激励层，激励函数选择通用的ReL∪函数，第一层卷积层采用3×3核的池化层，池化采用最大池化max pool的方式，通过池化后特征向量变为56×56×64维，随后加入norm层；第二层卷积采用192个3×3的卷积核，步长stride为1的结构，填充padding＝[1 1 1 1]的结构，特征向量变为56×56×192，激励层和池化层输出特征为28×28×192维。

split分支运算，采用1×1、3×3、5×5卷积核，包含4个分支，使用64个1×1的卷积核，padding＝[0 0 0 0]，同样采用ReL∪函数作为激励层，因此输出28×28×64维向量；先使用96个1×1的卷积核将特征向量压缩到28×28×96维，经过激励层后再使用128个3×3的卷积核，padding＝[1 1 1 1]，通过激励层得到28×28×128维向量；先使用16个1×1卷积核将数据压缩到28×28×16，进行激励层后再进行5×5的卷积运算，选择padding＝[2 22 2]，最后输出28×28×32维向量；先进行max pool进行池化，然后使用1×1的卷积窗得到28×28×32维向量；分类输出层将四个节点输出的特征向量进行拼接。

随后进行下一步的inception module使用同样的方法以此类推。

参数优化设置包括，采用动量的随机梯度下降算法，动量设置为0.9；小批量算法设置为10，小批量算法是随机梯度下降算法和批量算法的混合形式；最大轮数设置为3；L₂参数正则化(权重衰减)设置为0.00055，正则化策略通过向目标函数添加一个正则项，使权重更加接近原点；学习率为10^-4；验证频率为15。

本发明的有益效果是：GoogLeNet不仅将网络的层次做到更深，它还增加了网络的宽度，实现多尺度特征的聚合，让网络的分类效果更好。Inception模块就是为实现网络宽度的增加而提出来的一种结构，它有两个重要的创新点，一是使用1×1的卷积核来对上层输入进行降维，从而降低计算的复杂度；二是将多个不同尺度的卷积层和池化层并联，然后把得到的不同特征拼接起来，从而提高特征的表达能力。

本发明充分发挥深度学习中的卷积神经网络的优势，特别是自动学习图像特征的功能。同时，利用迁移学习的特点，对GoogLeNet网络结构进行合理调整，并通过仿真实验和贝叶斯优化算法获取最佳训练参数，完成新网络的训练，最终对电力部件图像(绝缘子、杆塔、金具)进行分类识别，进而为电力部件状态检测提供依据，保证电网安全运行。

附图说明

图1是inception模型图；

图2是本发明流程示意图；

图3是训练过程图。

具体实施方式

通过无人机航拍输电线路，对线路进行巡检，在提升巡检效率的同时，也会采集到大量的电力部件图像。对于传统的数字图像处理算法来说，对于背景复杂、电力部件类型多、拍摄环境复杂、拍摄角度不固定、电力不同类型部件之间相互粘连等因素，其对于不同电力部件的分类检测效果不好、适用性弱。本发明充分利用深度学习中的卷积神经网络的优势，利用迁移学习的特点，发挥经典卷积神经网络的成功经验，对采集到的电力部件图像进行分类。首先建立电力部件图像的样本库，随后利用迁移学习创建一种基于GoogLeNet的卷积神经网络，设计网络训练参数，进行网络训练，验证网络的有效性，根据训练和验证结果，适当地调整网络参数。具体算法介绍如下：

一、卷积神经网络GoogLeNet的特点

ILSVRC2014的冠军是GoogLeNet，它是基于网中网的思想提出的一种新型网络结构。GoogLeNet在网络设计上属于深层次网络，具有144个单层，其中有22个具有学习权重的功能层，包括21个卷积层和1个全连接层。GoogLeNet在设计上最大的创新点就是使用多尺度卷积，将稀疏矩阵运算进行局部稠密化，并行处理特征然后进行特征拼接。

由网络结构可知首先对原始输入图像的尺寸固定为224×224×3的RGB图像。

第一层卷积层采用64个7×7卷积核，步长stride为2的结构，填充padding＝[3 33 3]的结构，这样通过卷积后得到64维的特征，因此本层特征输出为112×112×64。卷积层后直接输入到激励层，激励函数选择通用的ReLU函数，然后是3×3核的池化层，池化采用最大池化(max pool)的方式，可以计算出通过池化后特征向量变为56×56×64维。随后GoogLeNet在网络设计上加入了norm层。

第二层卷积采用192个3×3的卷积核，步长stride为1的结构，填充padding＝[1 11 1]的结构，这样特征向量变为56×56×192，同样随后进行激励层和池化层输出特征为28×28×192维。

随后是GoogLeNet的创新之处，其进行split分支运算，作者提出inception的概念，为了计算方便，采用1×1、3×3、5×5卷积核，包含4个分支如图1所示：

(1)使用64个1×1的卷积核，padding＝[0 0 0 0]，同样采用ReLU函数作为激励层，因此输出28×28×64维向量。

(2)先使用96个1×1的卷积核将特征向量压缩到28×28×96维，经过激励层后再使用128个3×3的卷积核，padding＝[1 1 1 1]，通过激励层得到28×28×128维向量。

(3)先使用16个1×1卷积核将数据压缩到28×28×16，进行激励层后再进行5×5的卷积运算，选择padding＝[2 2 2 2]，最后输出28×28×32维向量。(4)

先进行max pool进行池化，然后使用1×1的卷积窗得到28×28×32维向量。最后将四个节点输出的特征向量进行拼接，由于进行卷积的时候是有选择的使用卷积核，因此在这里可以直接进行特征相加。随后进行下一步的inception module使用同样的方法以此类推。

二、对GoogLeNet网络进行知识迁移学习

知识迁移学习是通过对其他领域训练样本的学习，从中抽取相关的知识用于本领域的学习。通过迁移学习，机器便会提高利用以前学到知识的能力，更好地实现增量学习。知识迁移学习的最大的特点是利用相关领域的知识来帮助完成目标领域中的学习任务。

GoogLeNet模型中存在丰富的权重和偏置，能保证迁移学习可以调整不同的目标样本库，且GoogLeNet网络复杂度低，准确率高，非常适合迁移学习这类算法。故本发明将基于GoogLeNet网络进行迁移，迁移通俗来说，就是举一反三、触类旁通，也可以按照移花接木理解。最终目的是缩短网络训练时间，提高网络利用率。

迁移学习是将原来可以做1000类的GoogLeNet的最后三层全连接网络重新根据航拍电力部件图像的类别作为新的分类数目进行重新调优，继续保留原始网络的前面部分。最后三层将用一个全连接层、一个softmax层和分类输出层所代替，进而获得新的深度神经网络。本发明设置全连接层的分类数目为5，权重学习率因子为30，偏置学习率因子为30。接下来，进行新网络训练参数设置，主要参数设置具体如下：

(1)采用动量的随机梯度下降算法，动量设置为0.9，此算法计算每一个训练数据的误差并随机调整权重。基于动量的梯度下降算法旨在加速学***均，并且继续沿该方向移动。

(2)小批量算法设置为10，小批量算法是随机梯度下降算法和批量算法的混合形式。首先，它选出一部分数据集，然后，用批量算法训练这个数据集。这样的话，它就是用选出的数据集来计算一次权重更新值，然后再用平均权重来调整该神经网络。

(3)最大轮数设置为3，轮数是全部训练数据都参与训练的循环次数。对于小批量算法，每一轮训练的次数取决于每个小批量数据点个数的选择。

(4)L₂参数正则化(权重衰减)设置为0.00055，正则化策略通过向目标函数添加一个正则项，使权重更加接近原点。正则化是对学习算法的修改，旨在减少泛化误差而不是训练误差。

(5)学习率为10^-4，学习率是随机梯度下降算法的重要参数之一。学习率太小那么学习过程很缓慢，学习可能会卡在一个相当高的代价值。学习率太大，学习曲线会剧烈振荡，代价函数值通常会明显增加。学习率可通过试验和误差来选取。

(6)验证频率为15，验证频率是验证度量的评估之间的迭代次数，表征迭代次数中网络验证的频率。

本发明的网络参数值是通过多次仿真实验结果并结合贝叶斯优化算法来设置的，以便获得最佳网络参数。贝叶斯优化算法是一种非常适合优化分类和回归模型的内部参数的算法，它可以优化不可区分，不连续且耗时的函数来进行评估。该算法在内部利用目标函数的高斯过程模型，并使用目标函数评估来训练该模型。贝叶斯优化过程中利用了著名的“贝叶斯定理”：

其中，f表示未知目标函数；D_1：t＝{(x₁，y₁)，(x₂，y₂)，…，(x_t，y_t)}表示已观测集合；x_t表示决策向量；y_t＝f(x_t)+ε_t表示观测值；ε_t表示观测误差；P(D_1：t|f)表示y的似然分布，由于观测值存在误差，故也称为“噪声”；P(f)表示f的先验概率分布，其对未知目标函数状态的假设；P(D_1：t)表示边际化f边际似然分布或者“证据”，其主要用于优化超参数；P(f|D_1：t)表示f的后验概率分布，其描述通过已观测数据集对先验进行修正后未知目标函数的置信度。贝叶斯优化是一个迭代过程，优化框架主要包括概率代理模型(包含先验概率模型和观测模型)和采集函数。先验概率模型为P(f)。观测模型描述观测数据生成的机制，也就是似然分布P(D_1：t|f)，更新概率代理模型将得到包括更多数据信息的后验概率分布P(f|D_1：t)。采集函数是由后验概率分布构造的，可以通过最大化采集函数来选择下一个最佳的评估点。同时，有效的采集函数保证选择的评估点系列使得总损失最小。贝叶斯优化主要包括三个步骤：1.根据最大化采样函数来选择最佳评估点x_t；2.根据选择的评估点x_t评估目标函数值y_t＝f(x_t)+ε_t；3.把新得到输入观测值{x_t，y_t}添加到历史观测集D_1：t-1中，并更新概率代理模型，为迭代做准备。

本发明基于贝叶斯算法优化参数的步骤大致如下：

(1)确定训练集和验证集图像数据；

(2)选择优化参数，本发明重点对最佳学习率、随机梯度下降的动量值、L₂正则化强度参数进行优化；

(3)设定贝叶斯优化算法的变量；为了贝叶斯优化器定义目标函数，目标函数将图像训练集和验证集作为输入，目标函数训练一个卷积神经网络并返回对验证集的分类误差。将目标函数传递给贝叶斯采集函数，采集函数使交叉验证损失最小。

(4)进行网络结构参数设置和网络训练。卷积神经网络结构为输入层→卷积层→批量归一化→修正线性单元→最大池化层→卷积层→批量归一化→修正线性单元→最大池化层→卷积层→批量归一化→修正线性单元(ReLU)→最大池化层→全连接层→softmax层→分类层。网络训练主要参数为：采用动量的随机梯度下降算法，动量为0.95，最大轮数为10，学习率为10^-3，L₂参数正则化为0.000001。

(5)在网络训练中，使用数据增强方法，沿垂直轴随机翻转训练图像，并在水平方向和垂直方向上将图像随机平移最多四个像素。数据增强有助于防止网络过拟合和记忆训练图像的具体细节。

(6)预测测试集的标签，计算测试误差，通过最小化验证集上的分类错误来执行贝叶斯优化，进而获得最佳网络和验证准确度，最终优化参数。

三、数据集

航拍电力部件图像背景非常复杂，拍摄角度和图像质量极易受到外部环境影响尤其是恶劣天气和不利地理条件，并且电力部件图像还存在相互粘连的情况(如杆塔中存在绝缘子、金具，输电线路中有金具等)较多，有时会存在被参天大树等物体遮挡，故给航拍电力部件图像进行精确分类带来了比较大的困难。目前，没有标准的电力部件图像库，本发明自建电力部件数据库。本发明所采用的数据集共有932副图像，其中绝缘子720副图像，杆塔86副图像，金具55副图像(网上下载)，车道线39副图像，道路标志32副图像。数据库中增加了一些车道线和道路标志图像是为了证明网络的分类抗噪能力和鲁棒能力。同时，利用Ground Truth Labeler APP工具箱对177副图像进行绝缘子、金具、杆塔三种类别进行标签。所有图像经过归一化等预处理，分辨率统一为800*600。同时，按照7∶3(训练集和验证集)比例分配。

四、训练分类结果

本发明的仿真实验的硬件环境为：CPU i5-7200，主频2.7GHz，内存8G，是以单CPU进行训练，选择不同数量的数据集在Matlab平台进行仿真，其分类结果如下表：

表1不同样本数据集的分类情况表

样本图像数量(副)	运行时间(分)	分类准确率
			262	32	96％
632	381	97.8％
			932	419	97.83％

表1列出了随机选取不同样本图像数据量时候，所需要的运行时间和分类准确率。分类结果显示，利用迁移学习的方法，可以避免采集巨大的图像数据量，利用一定的图像数据量，发挥GoogLeNet网络的性能，达到航拍电力部件的图像分类。图2为流程图。图3为训练过程之一图。

Claims

1.基于知识迁移学习的航拍电力部件图像的分类方法，其特征在于：按照如下的步骤进行

步骤一、建立卷积神经网络GoogLeNet；

步骤二、对卷积神经网络GoogLeNet进行迁移，在卷积神经网络GoogLeNet的基础上，将卷积神经网络GoogLeNet的最后三层用一个全连接层、一个softmax层和分类输出层所代替，进而获得新的深度神经网络，然后在原有卷积神经网络GoogLeNet设置基础上，进行参数优化设置；在训练网络时，网络参数是结合多次仿真实验和贝叶斯优化算法获取的，其中，split分支运算，采用1×1、3×3、5×5卷积核，包含４个分支，使用64个1×1的卷积核，padding=[0 0 0 0]，同样采用ReLU函数作为激励层，因此输出28×28×64维向量；先使用96个1×1的卷积核将特征向量压缩到28×28×96维，经过激励层后再使用128个3×3的卷积核，padding=[1 1 1 1]，通过激励层得到28×28×128维向量；先使用16个1×1卷积核将数据压缩到28×28×16，进行激励层后再进行5×5的卷积运算，选择padding=[2 2 2 2]，最后输出28×28×32维向量；先进行max pool进行池化，然后使用1×1的卷积窗得到28×28×32维向量；分类输出层将四个节点输出的特征向量进行拼接，随后进行下一步的inception module使用同样的方法以此类推；

步骤三、将采集到的电力部件图像经过归一化预处理后输入步骤二获得且设置好的新的深度卷积神经网络进行学习，按照绝缘子、金具、杆塔类别进行分类；

步骤四、进行仿真实验进行验证。

2.根据权利要求1所述的基于知识迁移学习的航拍电力部件图像的分类方法，其特征在于：卷积神经网络GoogLeNet具有144个单层，其中有22个具有学习权重的功能层，包括21个卷积层和1个全连接层，第一层卷积层采用64个7×7卷积核，步长stride为2的结构，填充padding=[3 3 3 3]的结构，卷积后得到64维的特征，第一层卷积层特征输出为112×112×64，第一层卷积层后直接输入到激励层，激励函数选择通用的ReLU函数，第一层卷积层采用3×3核的池化层，池化采用最大池化max pool的方式，通过池化后特征向量变为56×56×64维，随后加入norm层；第二层卷积采用192个3×3的卷积核，步长stride为1的结构，填充padding=[1 1 1 1]的结构，特征向量变为56×56×192，激励层和池化层输出特征为28×28×192维。

3.根据权利要求1所述的基于知识迁移学习的航拍电力部件图像的分类方法，其特征在于：参数优化设置包括，采用动量的随机梯度下降算法，动量设置为0.9；小批量算法设置为10，小批量算法是随机梯度下降算法和批量算法的混合形式；最大轮数设置为3；L₂参数正则化权重衰减设置为0.00055，正则化策略通过向目标函数添加一个正则项，使权重更加接近原点；学习率为10^-4；验证频率为15。