CN110006435A

CN110006435A - 一种基于残差网络的变电站巡检机器人视觉辅助导航方法

Info

Publication number: CN110006435A
Application number: CN201910329956.9A
Authority: CN
Inventors: 史晋芳; 黄占鳌
Original assignee: Southwest University of Science and Technology
Current assignee: Southwest University of Science and Technology
Priority date: 2019-04-23
Filing date: 2019-04-23
Publication date: 2019-07-12

Abstract

本发明公开了一种基于残差网络的变电站巡检机器人视觉辅助导航方法，包括S1、采集巡检机器人巡检的变电站道路场景图像，对道路场景图像进行筛选，并采用语义分割模型辅助人工进行数据集标注；S2、构建基于残差网络的语义分割模型；S3、采用SGD方法对步骤S2中搭建的语义分割模型进行训练，并保存最后一次迭代获得的语义分割模型；S4、确定语义分割模型的泛化性能，输入新的巡检道路场景图像，输出语义分割结果，将语义分割结果中感兴趣区域内的对象类别分布状态传输至巡检机器人导航***。

Description

一种基于残差网络的变电站巡检机器人视觉辅助导航方法

技术领域

本发明属于巡检机器人导航的技术领域，具体涉及一种基于残差网络的变电站巡检机器人视觉辅助导航方法。

背景技术

随着电网技术的飞速发展，智能化、自动化的电力产品正在逐步替代人工。其中变电站巡检机器人通常是实现各种类型的巡检任务的重要平台，其导航定位***决策的可靠性是其中的一个重要环节。在机器人巡检过程中，室外变电站道路场景的非结构性、随机性及复杂性等特点使得巡检机器人的导航***在决策出机器人的巡检路线时仍存在一定的问题。如巡检道路环境中出现的路坑，积水等可能会导致激光雷达***无法获得当前路况的反馈信息从而导致机器人无法做出下一步的行进的策略；在较窄的巡检道路上，路边杂草、石头等物体可能使得机器人导航***将其视为障碍物做出的停止前行或绕行的决策，最终导致机器人可能产生跌落的风险。因此，在巡检过程中，若能使巡检机器人获得类似于人类视觉的直观理解能力来辅助巡检机器人的导航***对自身所处环境进行理解与分析，且将原本巡检机器人传感器获取的导航数据结合视觉手段提供的场景数据，则巡检机器人的导航***在决策出巡检路径时可综合考虑更多的决策因素，从而有利于规划出更加合理的巡检路线。

在现有的变电站巡检机器人导航技术中，很少出现结合图像的语义信息的导航***，且目前依赖于激光雷达导航的***存在无法辨别出检测障碍物的类型的情况，在某些区域内甚至无法接受雷达信号的反馈，这对于巡检机器人导航***的决策过程是不利的，因此，提供一种直观的语义理解信息辅助导航***做出合理的决策路径是具有重要意义的。

随着近几年人工智能技术的飞速发展，各种涵盖深度学习技术的产品层出不穷，如汽车的自动驾驶***和疲劳检测***，服务机器人的智能推荐***，语音识别***与机器翻译***等技术的应用。深度学习技术已经展现出了良好的学习与表达能力且具有广泛的应用场景，如在图像语义分割领域，深度学习技术展现出了远超传统语义分割技术的优越性能。这使得利用深度学习技术对变电站复杂的道路场景进行图像的语义分割成为可能，从而建立起巡检机器人类似于人类视觉的直观理解能力，辅助自身导航***决策出更为合理的导航路线。

目前巡检机器人常见的导航技术有磁导航、轨道式导航、基于机器视觉的导航及激光雷达导航等技术。如文献[1]提出了一种用于巡检机器人的磁导航技术，该技术导航定位精度高、扛干扰能力强，但需针对巡检道路提前铺设好磁条，存在成本高，后期维护不便等问题。文献[2]提出了一种轨道式巡检机器人导航***，该技术需根据电力设备位置分布情况设计相应的巡检轨道，大都用于室内场景，面对复杂性的室外场景还无法较好的满足其应用需求。文献[3][4]提出了基于机器视觉的导航技术用于变电站巡检机器人导航***，该技术通过视觉算法识别巡检标识及视觉测量技术进行导航和定位，其定位导航可靠性依赖于采取的视觉算法的精度及鲁棒性，且铺设辅助标识也会带来额外的经济成本及后期维护问题。随着近年激光雷达导航技术的飞速发展，基于激光雷达的导航***的精度及可靠性日渐提升，目前国内外变电站的巡检机器人的导航定位大都采用了激光雷达，如文献[5]提出了一种利用二维激光雷达对巡检机器人进行定位及导航，文献[6]提出的一种基于北斗RTK和激光雷达的导航技术，这种技术不需重新改造巡检线路，具有良好的环境适应性等优点，但激光雷达导航无法判断检测到的障碍物的类型，在某些复杂巡检条件下，变电站道路场景中可能会出现一些杂草、水洼、碎石及围栏之类影响导航***决策的可靠性。

综上，现有技术存在如下缺点或不足：

1、磁导航需耗费大量的资源铺设相关巡检道路，存在后期维护不便等问题；

2、轨道导航适用于室内的一些设备巡检，室外复杂的环境增加铺设轨道的难度，且可能因为天气等原因对轨道造成一定的影响；

3、基于视觉的导航定位技术需要铺设额外的辅助标识，导航定位可靠性依赖于采取的视觉算法的精度及鲁棒性，存在后期维护问题；

4、激光雷达导航无法判断检测到的障碍物的类型，对于变电站道路场景中可能会出现一些杂草、水洼、碎石机围栏之类的对象会影响导航***决策的可靠性。

参考文献如下：

[1]王金钗.变电站巡检机器人磁导航***设计与实现[D].西南交通大学,2015.

[2]裴文良,张树生,岑强,饶毅.轨道式巡检机器人***设计与应用[J].煤矿机械,2016,37(06):142-144.

[3]施泽华.基于机器视觉的变电站巡检机器人导航定位技术[D].安徽理工大学,2018.

[4]樊绍胜,张绍海,胡文韬,等.基于视觉的变电站巡检机器人导航定位控制方法[P].湖南：CN105700532A,2016-06-22.

[5]肖鹏,王海鹏,李荣,等.变电站巡检机器人定位导航用二维激光雷达标定装置及方法[P].山东：CN106556826A,2017-04-05.

[6]彭道刚,戚尔江,夏飞,等.基于RTK北斗和激光雷达的巡检机器人导航***及方法[P].上海：CN107817509A,2018-03-20.

发明内容

本发明的目的在于针对现有技术中的上述不足，提供一种基于残差网络的变电站巡检机器人视觉辅助导航方法，以解决或改善上述问题。

为达到上述目的，本发明采取的技术方案是：

一种基于残差网络的变电站巡检机器人视觉辅助导航方法，其包括：

S1、采集巡检机器人巡检的变电站道路场景数据，对道路场景数据进行筛选，并采用语义分割模型辅助人工进行数据集标注；

S2、构建基于残差网络的语义分割模型；

S3、采用SGD方法对步骤S2中搭建的语义分割模型进行训练，并保存最后一次迭代获得的语义分割网络模型；

S4、输入新的巡检道路场景图像至保存的语义分割模型，输出语义分割结果，将语义分割结果中感兴趣区域内的对象类别分布状态传输至巡检机器人导航***。

进一步，步骤S1中具体包括以下步骤：

S1.1、采集巡检机器人巡检的变电站道路场景视频，提取视频的每一帧，去掉重复度较高的视频帧，筛选出部分原始样本数据进行人工标注；

S1.2、采用语义分割模型辅助人工进行数据集标注。

进一步，步骤S1.2中采用语义分割模型辅助人工进行数据集标注的具体步骤包括：

S1.2.1、人工标注部分原始样本数据；

S1.2.2、利用已标注的原始样本数据训练语义分割模型；

S1.2.3、利用训练的语义分割模型对原始样本数据中的剩余样本进行语义分割，并输出分割结果；

S1.2.4、对分割结果差的样本进行重新标注，最后将重新调整后的分割结果加入已标注的数据集。

进一步，步骤S2中构建基于残差网络的语义分割网络模型的具体步骤包括：

S2.1、搭建语义分割模型的编码、解码、多层网络融合层三部分框架；

S2.2、根据步骤S2.1中的网络框架，构建针对变电站数据集的网络结构。

进一步，步骤S2.2中构建针对变电站数据集的网络结构，包括编码网络实施步骤：

搭建网络输入层，输入层输入包含变电站道路场景图像及对应的标注标签数据；

搭建卷积层conv1，对输入图像进行卷积操作；

搭建池化层pool1，对conv1中输出进行2×下采样；

搭建残差块Res2，残差块Res2中连续进行两次卷积，2×下采样，连续卷积后的输出以Eltwise操作融合pool1输出结果；

搭建残差块Res3，残差块Res3中连续进行两次卷积，2×下采样，连续卷积后的输出以Eltwise操作融合Res2输出结果；

搭建残差块Res4，残差块Res4中连续进行两次卷积，2×下采样，连续卷积后的输出以Eltwise操作融合Res3输出结果；

搭建残差块Res5，残差块Res5中连续进行两次卷积，2×下采样，连续卷积后的输出以Eltwise操作融合Res4输出结果；

搭建池化层pool5，对Res5输出进行2×下采样；

搭建卷积层Conv6，输出通道数与变电站道路场景数据集中标注类别一致。

进一步，步骤S2.2中构建针对变电站数据集的网络结构，还包括解码与多层网络融合网络层实施步骤：

搭建Upscore2_1层，Upscore2_1层以Deconvolution操作将conv6输出进行2×上采样；

搭建score4层，score4层将Res4输出通道数压缩至与conv6输出通道数一致；

搭建Crop4层，Crop4层将score4层输出与Upscore2_1层输出尺寸裁剪至一致；

搭建Fuse4层，Fuse4层以Eltwise操作融合score4与conv6输出；

搭建Upscore2_2层，Upscore2_2层将fuse4进行2×上采样；

搭建score3层，score3层将Res3输出通道数压缩至与Fuse4层输出通道数一致；

搭建Crop3层，Crop3层将Upscore2_2层与score3层输出尺寸裁剪值一致；

搭建Fuse3层，Fuse3层以Elewise操作将Upscore2_2层与score3层输出进行融合；

搭建Upscore8层，Upscore8层以Deconvolution操作将Fuse3输出进行8×上采样；

搭建Crop8层，Crop8层将Upscore8层输出裁剪至与输入图像同尺寸；

分类层具体实施步骤为：搭建分类层，采用softmaxWithloss对Crop8层输入进行逐像素分类。

进一步，步骤S3中采用SGD方法对语义分割模型进行训练，并保存最后一次迭代获得的语义分割模型的具体步骤包括：

S3.1、将数据集分为训练集、验证集与测试集；

S3.2、设置网络优化方法，选择SGD进行优化；

S3.3、固定学习率参数；

S3.4、设置动量矩参数；

S3.5、设置权重衰减参数；

S3.6、设置优化迭代步长；

S3.7、随机初始化相关网络层参数；

S3.8、当网络层softmaxWithloss输出loss值趋近于平衡或模型的验证精度基本保持不变时停止训练；

S3.9、保存最后一次迭代获得的语义分割网络模型。

优选地，步骤S4输入新的巡检道路场景图像至保存的语义分割模型，输出语义分割结果，将语义分割结果中感兴趣区域内的对象类别分布状态传输至巡检机器人导航***的具体步骤包括：

S4.1、输入测试集至保存的语义分割网络模型；

S4.2、进行前向计算输出测试集对应的语义分割结果，确定网络的泛化性能；

S4.3、输入新的变电站道路场景图像至语义分割模型，输出语义分割结果图，选择感兴趣区域；

S4.4、确定感兴趣区域内的对象类别分布情况；

S4.5、传输对象类别分布状态至巡检机器人导航***。

本发明提供的基于残差网络的变电站巡检机器人视觉辅助导航方法，具有以下有益效果：

本发明通过对变电站道路场景图像进行语义分割，构建并训练语义分割模型，最后将语义分割结果图中感兴趣区域内的对象类别分布信息传输至巡检机器人的导航***；本发明利用语义分割图可直接提供当前巡检机器人视场中的一些场景类型及对象分布情况，从而辅助其导航***决策出更为合理的行驶路径。

附图说明

图1为基于残差网络的变电站巡检机器人视觉辅助导航方法的流程图。

图2为基于残差网络的变电站巡检机器人视觉辅助导航方法的语义分割模型中的残差块。

图3为基于残差网络的变电站巡检机器人视觉辅助导航方法语义分割网络结构。

具体实施方式

下面对本发明的具体实施方式进行描述，以便于本技术领域的技术人员理解本发明，但应该清楚，本发明不限于具体实施方式的范围，对本技术领域的普通技术人员来讲，只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内，这些变化是显而易见的，一切利用本发明构思的发明创造均在保护之列。

根据本申请的一个实施例，参考图1，本方案的基于残差网络的变电站巡检机器人视觉辅助导航方法，包括：

S2、构建基于残差网络的语义分割网络模型；

S3、采用SGD方法对步骤S2中搭建的语义分割网络模型进行训练，并保存最后一次迭代获得的语义分割网络模型；

以下对上述步骤进行详细描述

S1.1、采集变电站道路场景数据，筛选出部分原始样本数据进行人工标注；

变电站道路场景图像获取通过机器自身搭建的可见光相机进行采集。在采集过程中，固定相机的安装高度及角度，巡检机器人按照正常的巡视路径进行巡视，相机拍摄相关巡检的道路场景视频，提取视频的每一帧，去掉重复度较高的视频帧，最终筛选出部分原始样本数据进行人工标注，标注对象包含道路、草、石头、围栏、水坑及背景六类。

S1.2、采用语义分割模型辅助人工进行数据集标注，具体包括以下步骤：

S1.2.1、人工标注部分原始样本数据；

S1.2.2、利用已标注的原始样本数据训练语义分割模型；

S2、构建基于残差网络的语义分割网络模型；

S2.1、搭建语义分割模型的编码、解码、多层网络融合层三部分框架。

参考图3，网络中包含编码、解码、多层网络融合三部分框架；

编码网络即为基本的残差网络，负责抽象出变电站道路场景图像中的对象信息；

解码网络为一些上采样层，主要功能为对编码网络输出进行上采样，从而实现端对端的变电站道路场景图像语义分割；

多层网络融合层主要为跳接结构，该部分功能为结合深浅层网络输出来提升网络的语义分割精度。

编码网络中，包含Res2、Res3、Res4与Res5四个残差块，每一个残差块包含两个卷积网络层，第一个卷积网络层输入叠加第二个卷积网络层的输出，叠加后的结果作为下一个残差块的输入。

解码网络中，变化Upscore2与Upscore8两种类型的上采样，两种类型分别对应2×上采样与8×上采样，上采样操作层采用Deconvolution。

多层网络融合结果中，该部分进行了两次融合，第一层融合为Res4输出结果与编码网络输出端的融合，第二次融合为Res3输出结果与第一次融合进行2×上采样后的输出进行融合，在这一过程中，将Res3与Res4的输出进行融合前采用1×1的卷积层分别将其输出通道数压缩至训练数据集的类别数(变电站道路场景为6类)，最后在解码网络中，将进行了两次融合的输出进行8×上采样直原始输入图像尺寸，利用softmaxWithloss对其每一个像素类别进行分类。

S2.2、根据步骤S2.1中的网络框架，构建针对变电站道路场景数据集的网络结构，其具体包括编码网络实施步骤：

搭建卷积层conv1，对输入图像进行卷积操作；

搭建池化层pool1，对conv1中输出进行2×下采样；

搭建池化层pool5，对Res5输出进行2×下采样；

还包括解码与多层网络融合网络层实施步骤：

搭建Fuse4层，Fuse4层以Eltwise操作融合score4与conv6输出；

搭建Upscore2_2层，Upscore2_2层将fuse4进行2×上采样；

S3、采用SGD方法对步骤S2中搭建的语义分割模型进行训练，并保存最后一次迭代获得的语义分割模型，其具体步骤为：

S3.1、将数据集分为训练集、验证集与测试集；其中训练集用于拟合搭建的语义分割网络参数，验证集用于评价在训练过程中获得模型的分割性能从而指导其训练过程中相关参数的拟合方向；使用测试集对最终保存的模型进行测试以检测该模型在面对新的道路场景图像时的泛化性能；将训练集与验证集输入网络输入层；

S3.2、设置网络优化方法，选择SGD进行优化；

S3.3、固定学习率参数；

S3.4、设置动量矩参数；

S3.5、设置权重衰减参数；

S3.6、设置优化迭代步长；

S3.7、随机初始化相关网络层参数；

S3.9、保存最后一次迭代获得的语义分割模型。

S4、输入新的巡检道路场景图像至保存的语义分割模型，输出语义分割结果，将语义分割结果中感兴趣区域内的对象类别分布状态传输至巡检机器人导航***，其具体步骤为：

S4.1、输入测试集至保存的语义分割网络模型；

步骤S3中语义分割模型的泛化性能直接影响到输出的视觉辅助信息的可靠性，为确定步骤S3中最后保存的语义分割模型对新的变电站道路场景图像有良好的泛化性能，在步骤4.2中以步骤S3中数据集的测试集对该模型进行测试，采用像素精度(PixelAccuracy，PA)、平均精度(MA)、均交并比(Mean Intersection over Union，Mean IU)与频权交并比(Frequency Weighted Intersection over Union，Fw IU)四个精度指标对其性能进行评价。其中PA、MA、Mean IU与Fw IU精度指标定义为：

PA＝∑_in_ii/∑_it_i

MA＝(1/n_c1)∑_in_ii/t_i

Mean IU＝(1/n_c1)∑_in_ii/(t_i+∑_jn_ji-n_ii)

Fw IU＝(∑_kt_k)^-1∑_it_in_ii/(t_i+∑_jn_ji-n_ii)

n_ij为代表属于类别i却被预测为类别j的像素个数，n_c1代表总的类别数，t_i＝∑_jn_ij代表类别i的总像素

测试步骤为：

S4.2.1、输入测试集至保存的语义分割模型；

S4.2.2、进行前向计算输出测试集对应的语义分割结果；

S4.2.3、根据输出语义分割结果与对应测试集中图像的标签计算PA、MA、Mean IU与Fw IU精度；

在该测试集中，搭建的语义分割模型的测试精度如表4-1所示

表4-1语义分割模型测试精度

精度	PA	MA	Mean IU	Fw IU
					测试结果	84.0	56.1	42.9	74.4

由上表可知，在该测试过程中，该网络的PA精度可达到84.0％，MA精度可达到56.1％，Mean IU精度可达到42.9％，Fw IU精度可达到了74.4％，在面对新的道路场景数据集时，搭建的语义分割网络具有良好的泛化性能，可为后续步骤中获取变电站道路场景图像的视觉辅助信息的可靠性奠定良好的基础。

S4.4、确定感兴趣区域内的对象类别分布情况；

S4.5、传输对象类别分布状态至巡检机器人导航***。

本发明通过对变电站道路场景图像进行语义分割，构建并训练语义分割模型，最后验证模型对新的变电站道路场景图像进行语义分割的泛化能力；本发明利用语义分割图可直接提供当前巡检机器人视场中的一些场景类型及对象分布情况，从而辅助其导航***决策出更为合理的行驶路径。

虽然结合附图对发明的具体实施方式进行了详细地描述，但不应理解为对本专利的保护范围的限定。在权利要求书所描述的范围内，本领域技术人员不经创造性劳动即可做出的各种修改和变形仍属本专利的保护范围。

Claims

1.一种基于残差网络的变电站巡检机器人视觉辅助导航方法，其特征在于，包括：

S1、采集巡检机器人巡检的变电站道路场景图像，对道路场景图像进行筛选，并采用语义分割模型辅助人工进行数据集标注；

S2、构建基于残差网络的语义分割模型；

S3、采用SGD方法对步骤S2中搭建的语义分割模型进行训练，并保存收敛的语义分割模型；

S4、确定语义分割模型的泛化性能，输入新的巡检道路场景图像，输出语义分割结果，将语义分割结果中感兴趣区域内的对象类别分布状态传输至巡检机器人导航***。

2.根据权利要求1所述的基于残差网络的变电站巡检机器人视觉辅助导航方法，其特征在于，所述步骤S1中具体包括以下步骤：

S1.2、采用语义分割模型辅助人工进行数据集标注。

3.根据权利要求2所述的基于残差网络的变电站巡检机器人视觉辅助导航方法，其特征在于，所述步骤S1.2中采用语义分割模型辅助人工进行数据集标注的具体步骤包括：

S1.2.1、人工标注部分原始样本数据；

S1.2.2、利用已标注的原始样本数据训练语义分割模型；

4.根据权利要求1所述的基于残差网络的变电站巡检机器人视觉辅助导航方法，其特征在于，所述步骤S2中构建基于残差网络的语义分割模型的具体步骤包括：

S2.2、根据步骤S2.1中的网络框架，构建针对变电站道路场景数据集的网络结构。

5.根据权利要求4所述的基于残差网络的变电站巡检机器人视觉辅助导航方法，其特征在于，所述步骤S2.2中构建针对变电站道路场景数据集的网络结构，包括编码网络实施步骤：

搭建卷积层conv1，对输入图像进行卷积操作；

搭建池化层pool1，对conv1中输出进行2×(采样步长为2)下采样；

搭建池化层pool5，对Res5输出进行2×下采样；

6.根据权利要求4所述的基于残差网络的变电站巡检机器人视觉辅助导航方法，其特征在于，所述步骤S2.2中构建针对变电站道路场景数据集的网络结构，还包括解码与多层网络融合实施步骤：

搭建Fuse4层，Fuse4层以Eltwise操作融合score4与conv6输出；

搭建Upscore2_2层，Upscore2_2层将fuse4进行2×上采样；

7.根据权利要求1所述的基于残差网络的变电站巡检机器人视觉辅助导航方法，其特征在于，所述步骤S3中采用SGD方法对语义分割网络模型进行训练，并保存最后一次迭代获得的语义分割网络模型的具体步骤包括：

S3.1、将数据集分为训练集、验证集与测试集；

S3.2、设置网络优化方法，选择SGD进行优化；

S3.3、固定学习率参数；

S3.4、设置动量矩参数；

S3.5、设置权重衰减参数；

S3.6、设置优化迭代步长；

S3.7、随机初始化相关网络层参数；

S3.9、保存最后一次迭代获得的语义分割网络模型。

8.根据权利要求1所述的基于残差网络的变电站巡检机器人视觉辅助导航方法，其特征在于，所述步骤S4确定语义分割模型的泛化性能，输入新的巡检道路场景图像，输出语义分割结果，将语义分割结果中感兴趣区域内的对象类别分布状态传输至巡检机器人导航***的具体步骤包括：

S4.1、输入测试集图像至保存的语义分割模型；

S4.2、进行前向计算输出对应的语义分割结果，确定网络的泛化性能；

S4.4、确定感兴趣区域内的对象类别分布情况；

S4.5、传输对象类别分布状态至巡检机器人导航***。