CN115063725B

CN115063725B - 基于多尺度自适应ssd算法的飞机蒙皮缺陷识别***

Info

Publication number: CN115063725B
Application number: CN202210726144.XA
Authority: CN
Inventors: 王浩; 刘佳
Original assignee: Civil Aviation University of China
Current assignee: Civil Aviation University of China
Priority date: 2022-06-23
Filing date: 2022-06-23
Publication date: 2024-04-26
Anticipated expiration: 2042-06-23
Also published as: CN115063725A

Abstract

本发明涉及民用航空器维修技术领域，公开了一种基于多尺度自适应SSD算法的飞机蒙皮缺陷识别***，包括矩阵分割模块、检测网络模块、缺陷分类模块和矩阵拼接模块；矩阵分割模块用于逐帧分割***所获取的视频，将视频中每秒图像分为N帧，将每帧图片分割为若干尺寸一致的样本图片并进行排序和标注；检测网络模块用于网络训练过程的数据读取和特征提取融合；缺陷分类模块用于对检测网络模块的输出结果进行分类预测与位置预测；矩阵拼接模块用于图片还原，合成带有缺陷损伤标注的视频。本发明可以在保证模型性能的同时将深度学习部署到嵌入式开发板设备上，便于在室外移动场景使用，同时提高了模型对小目标的检测精度，提升了飞机蒙皮的检测效率。

Description

基于多尺度自适应SSD算法的飞机蒙皮缺陷识别***

技术领域

本发明涉及民用航空器维修技术领域，尤其是一种基于多尺度自适应SSD算法的飞机蒙皮缺陷识别***。

背景技术

近年来，国内外航空客货运运输量的迅速增加，飞机机体结构疲劳老化现象愈发突出。受新冠疫情的影响，国内外航空企业引进新飞机的速度放缓，越来越多的现役飞机机队进入老龄化阶段。为保证飞机运行的高可靠性，国内航空公司普遍采用增加飞机蒙皮检查频率和工时的检修策略。

飞机蒙皮作为飞行过程中承力和传递气动载荷的主要构件，运行过程中会受到交变载荷、外物撞击、腐蚀老化等因素的耦合作用影响，会使蒙皮表面出现裂纹、凹陷、腐蚀、掉漆等损伤。蒙皮损伤缺陷会降低航空飞行的可靠性，严重时会直接危及飞行安全，因此对飞机蒙皮表面进行及时准确的检测尤为重要。

目前，针对飞机蒙皮缺陷的检测工作，主要采用人工目视为主要手段，其工作强度大，易产生误检与漏检，存在检查盲区，高空作业危险性大，易发生安全事故。由于飞机蒙皮缺陷具有不规则、多尺度、大场景、环境信息干扰大等特点，采用机器/深度学习建立检测模型来提升检测精度和速度，具有显著优势。

卷积神经网络以其良好的容错能力、并行处理能力、自学习能力在表面缺陷领域广泛应用，但是其主要在工作站上进行运行，不易于现场移动作业。同时目前现有的SSD、YOLO等一系列智能识别算法对小目标的识别精度较差。从模型复杂度、缺陷特征融合度和计算效率等综合考虑，建立一种用于飞机蒙皮缺陷智能识别的深度学习模型并提出一种用于实际检测的方法非常重要。

发明内容

本发明的目的在于弥补现有技术的不足之处，提供一种基于多尺度自适应SSD算法的飞机蒙皮缺陷识别***。

为了解决上述技术问题，本发明采用如下技术方案：

一种基于多尺度自适应SSD算法的飞机蒙皮缺陷识别***，包括矩阵分割模块、检测网络模块、缺陷分类模块和矩阵拼接模块；

所述矩阵分割模块用于逐帧分割***所获取的视频，将视频中每秒图像分为N帧，以每帧图片的左上角为原点，以每帧图片的横向为X轴，以每帧图片的竖向为Y轴，将每帧图片分割为若干尺寸一致的样本图片，形成分割矩阵，每帧图片中的样本图片按照先行后列顺序进行排序和标注，将样本图片按照排序逐帧输送至所述检测网络模块；

所述检测网络模块包括图像处理增强子模块、特征提取子模块和特征融合子模块；

所述图像处理增强子模块用于网络训练时的数据读取和扩增以及视频处理时的数据读取；所述网络训练时的数据读取和扩增的过程为读取所述矩阵分割模块所输出的样本图片数据集中图像文件夹与标注文件夹内的图像数据与标注数据，对图像数据与标注数据进行扩增，再将扩增后的图像数据与标注数据叠加输送至所述特征提取子模块中；所述视频处理时的数据读取的过程为仅将矩阵分割模块输出的图像数据输送至所述特征提取子模块中；

所述特征提取子模块用于接收所述图像处理增强子模块处理后的图像数据与标注数据，采用卷积神经网络结构进行缺陷特征提取，所述卷积神经网络结构包括自上而下的浅层特征提取部分、中层特征提取部分与深层特征提取部分；

所述特征融合子模块用于融合所述特征提取子模块所输出的部分有效特征层，并将融合后的有效特征层输送至所述缺陷分类模块；

所述缺陷分类模块用于对所述特征融合子模块所输出的有效特征层进行种类预测与位置预测，形成带有缺陷损伤标注的图片并输送至所述矩阵拼接模块；

所述矩阵拼接模块用于将经过所述缺陷分类模块处理后的带有缺陷损伤标注的图片，依照分割矩阵时的排序进行图片还原与逐帧还原，合成带有缺陷损伤标注的视频进行展示。

进一步地，所述网络训练时的扩增，具体过程如下：

对网络训练时的数据读取过程中的图像数据与标注数据进行扩增，扩增方法为：以顺时针方向绕中心点进行随机4种角度的旋转、色域随机扭曲，再将扩增后的图像数据与标注数据叠加输入至所述特征提取子模块中。

进一步地，所述浅层特征提取部分包括3个block，所述浅层特征提取部分中的每个所述block分别包括两个深度可分离卷积与一个池化层；所述深度可分离卷积层为：先进行一次卷积操作之后，再利用1×1×3的卷积核扩大深度。

进一步地，所述中层特征提取部分从上到下依次为1个block和1个多尺度非对称卷积模块和两个卷积层；

所述中层特征提取部分中的所述block中包含三个卷积层与一个池化层；

所述多尺度非对称卷积模块采用并行结构将残差结构与多分支结构结合，所述残差结构用于跳跃连接，跳跃部分为多分支结构，所述多分支结构的通道数分为4条，具体如下：

第一条选用1×1卷积、一次膨胀率为1的3×3卷积；

第二条选用1×1卷积、一次3×3卷积、一次膨胀卷积率为3的3×3卷积；

第三条选用1×3的非对称卷积、一次3×1的非对称卷积，一次膨胀卷积率为5的3×3卷积；

第四条选用一次1×5的非对称卷积，一次5×1的非对称卷积，一次膨胀率为7的3×3卷积；

将所述多分支结构进行堆叠，并与所述残差结构进行合并；

其中，将所述中层特征提取部分中的所述block中的第三个卷积层与最后两个卷积层用于传入所述特征融合子模块的有效特征层，并命名为Mid4_3、Mid5、Mid6。

进一步地，所述深层特征提取部分包括4个block，所述深层特征提取部分中的每个所述block分别由两个卷积层组成；其中，所述深层特征提取部分中的每个所述block的最后一个卷积层为用于传入所述特征融合子模块的有效特征层，并命名为Deep5_2、Deep6_2、Deep7_2、Deep8_2。

进一步地，所述特征融合子模块的融合过程，具体如下：

采用batch Normalization层与激活函数层对所述特征提取子模块中的Mid4_3、Mid5、Mid6、Deep5_2、Deep6_2、Deep7_2层进行处理，处理后分别命名为MMid4_3、MMid5、MMid6、MDeep5_2、MDeep6_2、MDeep7_2、MDeep8_2；卷积层融合分别为OMid4_3、OMid6、ODeep5_2、ODeep6_2、ODeep7_2；其中，OMid4_3采用OMid4_3、一次上采样后的MMid6、两次上采样后的MDeep5_2层经过融合后得到；OMid6采用一次上采样后的MDeep5_2、MMid5、MMid6融合后得到；ODeep5_2采用MDeep5_2与一次上采样后的MDeep6_2融合得到；ODeep6_2采用MDeep6_2与一次上采样后的MDeep7_2融合得到；ODeep7_2采用MDeep7_2与一次上采样的MDeep8_2融合得到。

进一步地，所述缺陷分类模块包括非极大值抑制模块、位置预测模块和种类预测模块；

所述非极大值抑制模块用于去除重复预测或偏差较大的类别和位置坐标值，得到最佳的缺陷种类和位置坐标值；所述非极大值抑制模块与所述特征融合子模块相连，经过所述非极大值抑制模块处理后进行位置预测与种类预测；

所述位置预测模块用于提取所述非极大值抑制模块处理后的位置预测的数据信息，寻找置信度最佳的位置坐标值；

所述种类预测模块用于提取非极大值抑制模块处理后的种类预测的数据信息，寻找置信度较高的种类；

堆叠位置预测与种类预测的结果，将提取的缺陷种类与位置坐标值在所述矩阵分割模块输出的图像数据上显示，并回传至所述矩阵拼接模块。

与现有技术相比，本发明的有益效果是：

1)本发明以残差结构与空洞卷积取代原始SSD算法中的Block5的3个3×3卷积层与最大池化层，由于残差结构与空洞卷积的引入，使得网络的感受野范围加大，同时计算量相较于原始SSD算法减少且模型大小减小，可以提高开发板的运行效率。

2)本发明中，batch Normalization层与激活函数联合使用，可以有效降低模型的过拟合，提升模型的训练速率与效果。

3)本发明中对前两个有效特征层进行替换，通过这种方法可以减少因卷积过程中所导致的语义信息缺失，提高网络的性能。

4)本发明可以在保证模型性能的同时将深度学习部署到嵌入式开发板设备上，便于在室外移动场景使用，同时提高了模型对小目标的检测精度，提升了飞机蒙皮的检测效率。

附图说明

为了使本发明的优点更容易理解，将通过参考在附图中示出的具体实施方式更详细地描述上文简要描述的本发明。可以理解这些附图只描绘了本发明的典型实施方式，因此不应认为是对其保护范围的限制，通过附图以附加的特性和细节来描述和解释本发明。

图1为本发明提供的一种实施例的***原理图；

图2为本发明提供的一种实施例中特征提取子模块的结构图；

图3为本发明提供的一种实施例的方法流程图。

具体实施方式

在下文的描述中，给出了大量具体的细节以便提供对本发明更为彻底的理解。然而，对于本领域技术人员来说显而易见的是，本发明实施方式可以无需一个或多个这些细节而得以实施。在其他的例子中，为了避免与本发明实施方式发生混淆，对于本领域公知的一些技术特征未进行描述。

为了彻底了解本发明实施方式，将在下列的描述中提出详细的结构。显然，本发明实施方式的施行并不限定于本领域的技术人员所熟习的特殊细节。本发明的较佳实施方式详细描述如下，然而除了这些详细描述外，本发明还可以具有其他实施方式。

下面结合附图对本发明的实施例作进一步详细的说明：

如图1所示，本发明的实施例提供了一种基于多尺度自适应SSD算法的飞机蒙皮缺陷识别***，主要包括视频预处理模块、检测网络模块、缺陷分类模块。视频预处理模块主要用于对***所获取的视频进行处理，包括矩阵分割模块和矩阵拼接模块。检测网络模块主要用于网络训练过程的数据读取和特征提取融合。缺陷分类模块主要用于对检测网络模块的输出结果进行分类预测与位置预测。

在本实施例中，矩阵分割模块用于逐帧分割***所获取的视频，将视频中每秒图像分为10帧，以每帧图片的左上角为原点，以每帧图片的横向为X轴，以每帧图片的竖向为Y轴，按照每512个像素为一格划分为分割矩阵，即将每帧图片分割为若干512×512的样本图片，不足正方形部分选用黑色补齐，形成分割矩阵，每帧图片中的样本图片按照先行后列顺序进行排序和标注，将样本图片按照排序逐帧输送至检测网络模块。

在本实施例中，检测网络模块包括图像处理增强子模块、特征提取子模块和特征融合子模块。

图像处理增强子模块用于网络训练时的数据读取和扩增以及视频处理时的数据读取；网络训练时的数据读取和扩增的过程为读取矩阵分割模块所输出的样本图片数据集中图像文件夹与标注文件夹内的图像数据与标注数据，对图像数据与标注数据进行扩增，网络训练时的扩增，具体过程如下：对网络训练时的数据读取过程中的图像数据与标注数据进行扩增，扩增方法为：以顺时针方向绕中心点进行随机4种角度的旋转、色域随机扭曲，再将扩增后的图像数据与标注数据叠加输入至特征提取子模块中。视频处理时的数据读取的过程为仅将矩阵分割模块输出的图像数据输送至所述特征提取子模块中。

特征提取子模块用于接收图像处理增强子模块处理后的图像数据与标注数据，采用卷积神经网络结构进行缺陷特征提取，卷积神经网络结构包括自上而下的浅层特征提取部分、中层特征提取部分与深层特征提取部分。

浅层特征提取部分包括3个block，浅层特征提取部分中的每个block分别包括两个深度可分离卷积与一个池化层。深度可分离卷积层为：先进行一次卷积操作之后，再利用1×1×3的卷积核扩大深度。

中层特征提取部分从上到下依次为1个block和1个多尺度非对称卷积模块和两个卷积层。中层特征提取部分中的block中包含三个卷积层与一个池化层。如图2所示，多尺度非对称卷积模块采用并行结构将残差结构与多分支结构结合，残差结构用于跳跃连接，跳跃部分为多分支结构，多分支结构的通道数分为4条，具体如下：第一条选用1×1卷积、一次膨胀率为1的3×3卷积；第二条选用1×1卷积、一次3×3卷积、一次膨胀卷积率为3的3×3卷积；第三条选用1×3的非对称卷积、一次3×1的非对称卷积，一次膨胀卷积率为5的3×3卷积；第四条选用一次1×5的非对称卷积，一次5×1的非对称卷积，一次膨胀率为7的3×3卷积；将多分支结构进行堆叠，并与残差结构进行合并；其中，将中层特征提取部分中的block中的第三个卷积层与最后两个卷积层用于传入特征融合子模块的有效特征层，并命名为Mid4_3、Mid5、Mid6。

深层特征提取部分包括4个block，深层特征提取部分中的每个block分别由两个卷积层组成；其中，深层特征提取部分中的每个block的最后一个卷积层为用于传入特征融合子模块的有效特征层，并命名为Deep5_2、Deep6_2、Deep7_2、Deep8_2。

特征融合子模块用于融合特征提取子模块所输出的部分有效特征层，并将融合后的有效特征层输送至缺陷分类模块。特征融合子模块的融合过程，具体如下：采用batchNormalization层与激活函数层对特征提取子模块中的Mid4_3、Mid5、Mid6、Deep5_2、Deep6_2、Deep7_2层进行处理，处理后分别命名为MMid4_3、MMid5、MMid6、MDeep5_2、MDeep6_2、MDeep7_2、MDeep8_2；卷积层融合分别为OMid4_3、OMid6、ODeep5_2、ODeep6_2、ODeep7_2；其中，OMid4_3采用OMid4_3、一次上采样后的MMid6、两次上采样后的MDeep5_2层经过融合后得到；OMid6采用一次上采样后的MDeep5_2、MMid5、MMid6融合后得到；ODeep5_2采用MDeep5_2与一次上采样后的MDeep6_2融合得到；ODeep6_2采用MDeep6_2与一次上采样后的MDeep7_2融合得到；ODeep7_2采用MDeep7_2与一次上采样的MDeep8_2融合得到。

在本实施例中，缺陷分类模块用于对特征融合子模块所输出的有效特征层进行种类预测与位置预测，形成带有缺陷损伤标注的图片并输送至矩阵拼接模块。缺陷分类模块包括非极大值抑制模块、位置预测模块和种类预测模块。非极大值抑制模块用于去除重复预测或偏差较大的类别和位置坐标值，得到最佳的缺陷种类和位置坐标值；非极大值抑制模块与特征融合子模块相连，经过非极大值抑制模块处理后进行位置预测与种类预测。位置预测模块用于提取非极大值抑制模块处理后的位置预测的数据信息，寻找置信度最佳的位置坐标值。种类预测模块用于提取非极大值抑制模块处理后的种类预测的数据信息，寻找置信度较高的种类。最后堆叠位置预测与种类预测的结果，将提取的缺陷种类与位置坐标值在矩阵分割模块输出的图像数据上显示，并回传至矩阵拼接模块。

在本实施例中，矩阵拼接模块用于将经过缺陷分类模块处理后的带有缺陷损伤标注的图片，依照分割矩阵时的排序进行图片还原与逐帧还原，合成带有缺陷损伤标注的视频进行展示。

如图3所示，本发明的实施例还提供了一种利用上述基于多尺度自适应SSD算法的飞机蒙皮缺陷智能识别***的实现方法，包括以下步骤：

步骤1：飞机蒙皮缺陷数据采集与预处理

首先进行飞机蒙皮缺陷数据采集，通过互联网、实地拍摄等方式获取原始数据图片，然后将飞机蒙皮缺陷图像尺寸划分为512×512像素，得到样本图像，并选用PASCAL VOC2012格式进行图像缺陷标注，形成飞机蒙皮缺陷数据集，并将其以9：1的比例随机分为训练集和验证集；飞机蒙皮缺陷共包括7种，分别为：裂纹、凹坑、掉漆、铆钉损伤、雷击、标签缺失、腐蚀。

步骤2：选取训练集，对多尺度自适应SSD算法模型(该模型即为上文所述的基于多尺度自适应SSD算法的飞机蒙皮缺陷识别***)进行训练，并选用验证集对训练后多尺度自适应SSD算法模型进行验证。

正式训练采用“分段训练-断点续练-固定学习率”的方式进行，单次训练包括100个epoch，开始训练时采用冻结训练与解冻训练相结合，当loss下降较缓慢后采用解冻训练模式进行；训练初始权重采用多尺度自适应SSD模型以ImageNet为数据集所训练权重，后续训练权重选用每个训练周期最后一个epoch的权重为下一训练周期的起始权重。训练终止条件设为val_loss是否收敛。

步骤3：将训练后多尺度自适应SSD算法模型迁移至NVIDIA Jetson AGX Xavier开发板中并配置相关环境，并结合Intel Realsense D435i深度相机进行飞机蒙皮的绕机巡检测试，并通过内置存储将缺陷检测结果进行保存，以便后续查阅。

值得注意的是，针对飞机外场环境下，多尺度自适应SSD算法模型对含有环境因素的情况与不含有环境因素的情况的进行了蒙皮缺陷进行了识别。经实验可知，在含有环境因素时，检测效果会因周围环境导致部分识别不明显，标注位置有所偏差。在不含有环境因素时，模型对缺陷的检测精度较好，即使较小缺陷也可以准确的识别出来，没有出现误检或者漏检的情况。因此，多尺度自适应SSD算法模型能够在复杂背景下对图中的多个目标进行有效识别。

综上所述，本发明的内容并不局限在上述的实施例中，本领域的技术人员可以在本发明的技术指导思想之内提出其他的实施例，但这些实施例都包括在本发明的范围之内。

Claims

1.一种基于多尺度自适应SSD算法的飞机蒙皮缺陷识别***，其特征在于，包括矩阵分割模块、检测网络模块、缺陷分类模块和矩阵拼接模块；

所述图像处理增强子模块用于网络训练时的数据读取和扩增以及视频处理时的数据读取；所述网络训练时的数据读取和扩增的过程为读取所述矩阵分割模块所输出的样本与图片数据集中图像文件夹与标注文件夹内的图像数据与标注数据，对图像数据与标注数据进行扩增，再将扩增后的图像数据与标注数据叠加输送至所述特征提取子模块中；所述视频处理时的数据读取的过程为仅将矩阵分割模块输出的图像数据输送至所述特征提取子模块中；

所述矩阵拼接模块用于将经过所述缺陷分类模块处理后的带有缺陷损伤标注的图片，依照分割矩阵时的排序进行图片还原与逐帧还原，合成带有缺陷损伤标注的视频进行展示；

所述浅层特征提取部分包括3个block，所述浅层特征提取部分中的每个所述block分别包括两个深度可分离卷积与一个池化层；所述深度可分离卷积层为：先进行一次卷积操作之后，再利用1×1×3的卷积核扩大深度；

所述中层特征提取部分从上到下依次为1个block和1个多尺度非对称卷积模块和两个卷积层；

第一条选用1×1卷积、一次膨胀率为1的3×3卷积；

将所述多分支结构进行堆叠，并与所述残差结构进行合并；

其中，将所述中层特征提取部分中的所述block中的第三个卷积层与最后两个卷积层用于传入所述特征融合子模块的有效特征层，并命名为Mid4_3、Mid5、Mid6；

所述深层特征提取部分包括4个block，所述深层特征提取部分中的每个所述block分别由两个卷积层组成；其中，所述深层特征提取部分中的每个所述block的最后一个卷积层为用于传入所述特征融合子模块的有效特征层，并命名为Deep5_2、Deep6_2、Deep7_2、Deep8_2；

所述特征融合子模块的融合过程，具体如下：

2.根据权利要求1所述的基于多尺度自适应SSD算法的飞机蒙皮缺陷识别***，其特征在于，所述网络训练时的扩增，具体过程如下：

3.根据权利要求1所述的基于多尺度自适应SSD算法的飞机蒙皮缺陷识别***，其特征在于，所述缺陷分类模块包括非极大值抑制模块、位置预测模块和种类预测模块；