CN117274789B

CN117274789B - 一种水工混凝土结构水下裂缝语义分割方法

Info

Publication number: CN117274789B
Application number: CN202311549825.4A
Authority: CN
Inventors: 田金章; 徐利福; 何旺; 朱延涛; 陈远; 周正
Original assignee: Hohai University HHU; Changjiang Institute of Survey Planning Design and Research Co Ltd
Current assignee: Hohai University HHU; Changjiang Institute of Survey Planning Design and Research Co Ltd
Priority date: 2023-11-21
Filing date: 2023-11-21
Publication date: 2024-04-09
Anticipated expiration: 2043-11-21
Also published as: CN117274789A

Abstract

本发明公开一种水工混凝土结构水下裂缝语义分割方法，包括通过从水下机器人在水库工程现场拍摄的视频中逐帧提取水下裂缝图像，对水下裂缝图像进行处理，构建水下裂缝数据集；构建卷积神经网络模型并进行迭代训练，通过计算损失函数来调整模型参数，得到水工混凝土结构水下裂缝语义分割模型；通过对分割后的图像进行二值化处理，对经二值化处理后的预测结果进行像素级量化处理；结合相机成像原理和相机的参数，将水工混凝土结构水下裂缝的像素级量化结果转化为实际物理量化结果，得到水工混凝土结构水下裂缝分割结果。本发明实现了对水工混凝土结构水下裂缝的量化识别，并提升了水工混凝土结构水下裂缝检测的准确度。

Description

一种水工混凝土结构水下裂缝语义分割方法

技术领域

本发明属于水工混凝土结构水下裂缝识别技术领域，具体涉及一种水工混凝土结构水下裂缝语义分割方法。

背景技术

水工混凝土结构是水利水电工程的重要组成部分，常用于建造大坝、溢洪道、输水隧洞和船闸闸门等水工建筑物，在防洪、发电、航运和水资源调配等方面发挥了显著作用，如何对其进行科学、有效的安全诊断是目前研究的热点。但是水工混凝土结构工作条件复杂，在运行过程中长期承受水流冲刷以及内部应力状态、化学反应的影响，加之施工质量差或基础处理完善，导致裂缝的产生在所难免，严重影响水工混凝土结构的安全运行。相比于水上裂缝，水下裂缝受水下复杂环境的影响更难以发现，导致水下相机拍摄的图像会更少，且存在对比度低、成像模糊、噪声干扰严重等问题。

现有检测水工混凝土结构水下裂缝的方法主要为人工巡检，该操作对水下裂缝的采集和记录难度非常大，且操作性不强。而基于深度学习的方法可有效减少人工操作环节，提高水下裂缝检测的自动化过程。

目前深度学***衡问题的妥善解决。

发明内容

针对现有技术的不足，本发明目的在于提供一种水工混凝土结构水下裂缝语义分割方法。本发明实现了对水工混凝土结构水下裂缝的量化识别，并提升了水工混凝土结构水下裂缝检测的准确度。

为解决上述技术问题，本发明通过下述技术方案实现：

一种水工混凝土结构水下裂缝语义分割方法，包括如下步骤：

S1：通过水下机器人在水库工程现场采集数据，并对其拍摄的视频进行预处理，逐帧提取其中清晰且能人眼分辨的水下裂缝图像；

S2：利用图像扩充技术对将预处理后的图像进行水下裂缝数据量的扩充，得到水下裂缝数据集；

S3：通过像素级标注软件对水下裂缝数据集进行像素级标注，并按比例将水下裂缝数据集划分为训练集、验证集和测试集；

S4：构建卷积神经网络模型，在训练集和验证集上进行迭代训练，并通过计算分割结果与真实标签之间的损失函数来调整分割模型的参数，最终得到模型准确度达到预设值的水工混凝土结构水下裂缝语义分割模型；

S5：在测试集中选取四种典型工况对水工混凝土结构水下裂缝语义分割模型进行测试，检验模型的泛化能力；

S6：通过对分割后的图像进行二值化处理，利用单像素点实际尺寸重构模型和水工混凝土结构水下裂缝特征分析方法对经二值化处理后的预测结果进行计算，得到像素级量化结果；

S7：结合相机成像原理和相机的参数，将水下裂缝的像素级量化结果转化为实际物理量化结果，得到水工混凝土结构水下裂缝分割结果。

优选地，步骤S2中，图像扩充技术包括局部放大、旋转90°、拉伸30°和左右镜像四种方式。

优选地，步骤S3中的训练集、验证集和测试集的比例为8:1:1。

优选地，步骤S4的具体过程为：

S4-1:对DeepLabv3+分割模型进行改进，将原主干网络Xception更改为MobileNetV2，同时深层特征下采样倍数降为8，构建基于MobileNetV2-DeepLabv3+的语义分割模型；

S4-2:根据下述公式计算得到分割模型在训练集和验证集上的损失函数L：

式(1)中，L_CE表示交叉熵损失函数，L_Dice表示Dice损失函数，y_i表示标签值，y_i′表示预测值，表示预测值的概率；|X|为样本X中元素个数，|Y|为样本Y中元素个数，|X∩Y|为X和Y之间交集的个数；

依据得到的损失函数分割模型的参数，直至模型准确度达到预设值，得到水工混凝土结构水下裂缝语义分割模型。

优选地，步骤S4-1中，基于MobileNetV2-DeepLabv3+的语义分割模型对水下裂缝图像的特征提取过程如下：

(1)用主干网络MobileNetV2从输入图像中提取深层特征和浅层特征，同时对深层特征进行8倍下采样后传入ASPP模块，而对浅层特征进行4倍下采样后传入解码结构；

(2)ASPP模块对传入的深层特征进行5种方式的并行处理，分别为一个对输入图像进行降维的1×1卷积、三个膨胀率分别为6、12、18的空洞卷积、以及一个全局平均池化操作；5种处理方式得到对应的5个特征层，将其堆叠并利用1×1卷积进行通道数的调整后得到结合上下文信息的深层特征层；

(3)对经编码部分处理后的深层特征层完成上采样操作后，与经过1×1卷积调整通道数的浅层特征层融合拼接，得到包含输入图片浅层特征和深层特征的复合特征图；

(4)通过3×3卷积运算和4倍上采样操作，将复合特征图尺寸恢复到与原始图像一致的大小，并对每一个像素点进行分类，输出预测结果。

优选地，步骤S6中，所述单像素点实际尺寸重构模型为像素尺寸与实际物理尺寸的转换比例，当水下机器人与水工混凝土结构水下裂缝平行时，其具体的计算公式为：

式(2)中，q为单像素点实际尺寸，Z_c为水下裂缝与相机的距离，dx和dy分别为沿X和Y方向上的像元尺寸，f为相机焦距。

优选地，步骤S6中，所述水工混凝土结构特征分析方法包括用于判断水工混凝土结构水下裂缝走向的外接矩形法和计算水工混凝土结构水下裂缝长度和宽度的中心线法，具体操作如下：

对水下裂缝图像提取骨架，获得边缘轮廓线和中心线，细化为单像素点，统计水下裂缝中心线上的像素点个数n1，此时水下裂缝长度为L＝n1*q，q为单像素点实际尺寸；过中心线上任意一点作中心线的切线与垂线，统计垂线与两边缘轮廓线交点之间的像素点个数n2，此时水下裂缝宽度为W＝n2*q。

本发明与现有技术相比，具有以下优点及有益效果：

1、构建基于MobileNetV2-DeepLabv3+的语义分割模型，有效解决了现有卷积神经网络在水工混凝土结构水下裂缝识别过程中，因样本数量少导致检测精度过低，不满足实际识别要求的问题，大大提高了识别的泛化能力以及识别准确率。

2、采用基于交叉熵损失函数和Dice损失函数的组合计算方式，有效缓解水下裂缝图像存在的类别不平衡问题，经调整后的分割模型对水下裂缝的分割结果更精确。

3、通过相机成像原理快速计算出水工混凝土结构水下裂缝的物理尺寸，更直观地反映出水工混凝土结构的受损情况。

附图说明

图1为本发明的工作流程图；

图2为本发明的水工混凝土结构水下裂缝分割模型结构图；

图3为本发明的水工混凝土结构水下裂缝分割模型识别效果对比图。

具体实施方式

下面结合附图对本发明的具体实施方式进行描述，以便于本技术领域的技术人员理解本发明，显然，本发明不限于具体实施方式的范围。对本技术领域的普通技术人员来说，只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内，这些变化是非创造性劳动的，一切利用本法发明构思的发明创造均在保护之列。

本发明提供一种水工混凝土结构水下裂缝语义分割方法，请参阅图1，包括以下步骤：

S2：利用图像扩充技术对预处理后的图像进行水下裂缝数据量的扩充，得到水下裂缝数据集；

其中，步骤S2中图像扩充技术包括局部放大、旋转90°、拉伸30°和左右镜像四种方式。

其中，步骤S3中的训练集、验证集和测试集的比例为8:1:1。

其中，步骤S4的具体过程为：

S4-1:对DeepLabv3+分割模型进行改进，将原主干网络Xception更改为MobileNetV2，同时深层特征下采样倍数降为8，构建基于MobileNetV2-DeepLabv3+的语义分割模型，具体的模型结构如图2所示；该分割模型对水下裂缝图像的特征提取过程如下：

首先，用主干网络MobileNetV2从输入图像中提取深层特征和浅层特征，同时对深层特征进行8倍下采样后传入ASPP模块，而对浅层特征进行4倍下采样后传入解码结构；

接着，ASPP模块对传入的深层特征进行5种方式的并行处理，分别为一个对输入图像进行降维的1×1卷积、三个膨胀率分别为6、12、18的空洞卷积、以及一个全局平均池化操作。5种处理方式得到对应的5个特征层，将其堆叠并利用1×1卷积进行通道数的调整后得到结合上下文信息的深层特征层；

然后，对经编码部分处理后的深层特征层完成上采样操作后，与经过1×1卷积调整通道数的浅层特征层融合拼接，得到包含输入图片浅层特征和深层特征的复合特征图；

最后，通过3×3卷积运算和4倍上采样操作，将复合特征图尺寸恢复到与原始图像一致的大小，并对每一个像素点进行分类，输出预测结果。

S4-2:根据公式：

得到分割模型在训练集和验证集上的损失函数L；其中L_CE表示交叉熵损失函数，L_Dice表示Dice损失函数；y_i表示标签值，y′_i表示预测值，表示预测值的概率；|X|为样本X中元素个数，|Y|为样本Y中元素个数，|X∩Y|为X和Y之间交集的个数。

表1分割模型精度对比表

编号	主干网络	下采样倍数	MPA/(％)	MIoU/(％)
					1	Xception	16	89.82	85.09
2	MobileNetV2	16	90.51	85.42
					3	Xception	8	90.38	85.23
4	MobileNetV2	8	91.77	86.33

注：MPA为平均像素准确率，它是对每个类别计算准确率后取平均值，该值越大，模型在不同类别上的表现更均衡，更有说服力；MIoU为平均交并比，它是每个类别预测结果与真实标签之间的重叠部分占总部分的比例，求和后的均值，该值越大，说明模型对每个类别的分割效果越好。

本发明的水工混凝土结构水下裂缝分割模型精度对比表见表1。经对比发现，本发明的水工混凝土结构水下裂缝分割模型相比于DeepLabv3+模型的MPA(为89.82％)和MIoU(为85.09％)分别提高了1.95％和1.24％。

本发明在四种典型工况下对水工混凝土结构水下裂缝的识别效果对比图如图3所示，其中A为水工混凝土结构水下裂缝的原图，B为DeepLabv3+模型的识别效果图，C为本发明的水工混凝土结构水下裂缝分割模型识别效果图。

步骤S6中，所述单像素点实际尺寸重构模型为像素尺寸与实际物理尺寸的转换比例，当水下机器人与水工混凝土结构水下裂缝平行时，其具体的计算公式为：

式(2)中，q为单像素点实际尺寸；Z_c为水下裂缝与相机的距离；dx和dy分别为沿X和Y方向上的像元尺寸；f为相机焦距。

步骤S6中，水工混凝土结构水下裂缝特征分析方法包括用于判断水工混凝土结构水下裂缝走向的外接矩形法和计算水工混凝土结构水下裂缝长度和宽度的中心线法。具体操作如下：

本发明通过构建基于MobileNetV2-DeepLabv3+的语义分割模型，有效解决了现有卷积神经网络在水工混凝土结构水下裂缝识别过程中，因样本数量少导致检测精度过低，不满足实际识别要求的问题，其相比于DeepLabv3+模型的MPA(为89.82％)和MIoU(为85.09％)分别增加了1.95％和1.24％，大大提高了识别的泛化能力以及识别准确率。采用基于交叉熵损失函数和Dice损失函数的组合计算方式，有效缓解水下裂缝图像存在的类别不平衡问题，经调整后的分割模型对水下裂缝的分割结果更精确。通过相机成像原理快速计算出水工混凝土结构水下裂缝的物理尺寸，更直观地反映出水工混凝土结构的受损情况。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

本发明说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。

Claims

1.一种水工混凝土结构水下裂缝语义分割方法，其特征在于，包括如下步骤：

步骤S4的具体过程为：

依据得到的损失函数分割模型的参数，直至模型准确度达到预设值，得到水工混凝土结构水下裂缝语义分割模型；

步骤S4-1中，基于MobileNetV2-DeepLabv3+的语义分割模型对水下裂缝图像的特征提取过程如下：

(4)通过3×3卷积运算和4倍上采样操作，将复合特征图尺寸恢复到与原始图像一致的大小，并对每一个像素点进行分类，输出预测结果；

式(2)中，q为单像素点实际尺寸，Z_c为水下裂缝与相机的距离，dx和dy分别为沿X和Y方向上的像元尺寸，f为相机焦距；

步骤S6中，所述水工混凝土结构特征分析方法包括用于判断水工混凝土结构水下裂缝走向的外接矩形法和计算水工混凝土结构水下裂缝长度和宽度的中心线法，具体操作如下：

对水下裂缝图像提取骨架，获得边缘轮廓线和中心线，细化为单像素点，统计水下裂缝中心线上的像素点个数n1，此时水下裂缝长度为L＝n1*q，q为单像素点实际尺寸；过中心线上任意一点作中心线的切线与垂线，统计垂线与两边缘轮廓线交点之间的像素点个数n2，此时水下裂缝宽度为W＝n2*q；

2.根据权利要求1所述的水工混凝土结构水下裂缝语义分割方法，其特征在于，步骤S2中，图像扩充技术包括局部放大、旋转90°、拉伸30°和左右镜像四种方式。

3.根据权利要求1所述的水工混凝土结构水下裂缝语义分割方法，其特征在于，步骤S3中的训练集、验证集和测试集的比例为8:1:1。