CN116862883A

CN116862883A - 基于图像语义分割的混凝土坍落度检测方法

Info

Publication number: CN116862883A
Application number: CN202310860689.4A
Authority: CN
Inventors: 宋霄罡; 袁浩宇; 黑新宏
Original assignee: Xian University of Technology
Current assignee: Xian University of Technology
Priority date: 2023-07-13
Filing date: 2023-07-13
Publication date: 2023-10-10

Abstract

本发明公开了基于语义分割的混凝土坍落度检测方法，具体包括如下步骤：步骤1，图像预处理与数据集构建；步骤2，构建基于多尺度通道注意力特征的语义分割模块；步骤3，图像后处理与结果输出；采用本发明，能够克服现有混凝土坍落度检测方法依赖于人工操作和主观判断等误差引入问题，输出的坍落度检测结果更加精准，丰富了计算机视觉及人工智能技术的方法体系，为提升混凝土坍落度检测精度提供了一种选择。

Description

基于图像语义分割的混凝土坍落度检测方法

技术领域

本发明属于计算机视觉及人工智能技术领域，具体涉及基于图像语义分割的混凝土坍落度检测方法。

背景技术

近年来，混凝土坍落度检测在工程建设和质量控制中变得越来越重要，混凝土坍落度是评估混凝土的流动性和可塑性的指标，它是指混凝土在塌落锥试验中塌落的程度；

传统的混凝土坍落度检测方法有塌落锥试验、压力板法、流度计等，这些方法通常依赖于人工操作和主观判断，存在主观性、不稳定性和人力资源的限制。

发明内容

本发明的目的在于提供基于图像语义分割的混凝土坍落度检测方法，解决了现有检测方法依赖于人工操作和主观判断的问题。

本发明所采用的技术方案是：基于图像语义分割的混凝土坍落度检测方法，具体按以下步骤实施：

步骤1，图像预处理与数据集构建；

步骤2，构建基于多尺度通道注意力特征的语义分割模块；

步骤3，图像后处理与结果输出。

本发明的特点还在于：

其中步骤1具体按以下步骤实施：

步骤1.1，将各种坍落度桶与具有不同坍落度的混凝土样本图像进行图像切割与图像增强；

步骤1.2，将步骤1.1处理后的样本图像，在labelme中进行标注，样本图像中坍落度桶和坍落后的混凝土分别标注为坍落度桶类和混凝土类；

步骤1.3，保存生成的json文件，将其批量转化为分割的可视化图像，再进行颜色填充，生成对应图像的标注图片，作为GroundTruth，与原始图像一并构成训练集、验证集和测试集；

其中步骤2具体按以下步骤实施：

步骤2.1，构建编码器子模块，由卷积层和下采样层组成，包含原始特征提取单元和多尺度特征提取单元；

步骤2.2，构建解码器子模块，由通道注意力层与上采样层组成，用于逐步恢复特征图的分辨率；

步骤2.3，设置训练超参，进行网络的训练与测试；

其中步骤2.1中构建编码器子模块具体按以下步骤实施：

步骤2.1.1，构建初始特征提取单元，包含一个步长为2的3×3卷积和两个步长为1的3×3卷积，实现初始特征的提取；

步骤2.1.2，构建多尺度特征提取模块，卷积均为标准卷积和空洞卷积；

其中步骤2.1.2中构建多尺度特征提取模块具体按以下步骤实施：

步骤2.1.2.1，输入特征首先经过一个3×3标准卷积进行特征提取并将通道数调整为一半；

步骤2.1.2.2，经过三个感受野不同的特征提取分支，提取三个分支的多尺度特征；

步骤2.1.2.3，将三个分支的多尺度特征进行相加融合，并使用一个1×1卷积来恢复通道数；

步骤2.1.2.4，使用通道混洗进行各个通道间的信息交互，并在混洗前引入了特征提取分支之前的残差连；

其中步骤2.1.2.2具体按以下步骤实施：

步骤2.1.2.2.1，第一个分支为3×3标准卷积，其感受野为3×3，用于提取局部信息；

步骤2.1.2.2.2，第二个分支为空洞率为d的3×3空洞卷积，其感受野为(2×d+1)×(2×d+1)；

步骤2.1.2.2.3，第三个分支为空洞率为d+1的3×3空洞卷积，其感受野为(2×d+3)×(2×d+3)；

其中步骤2.2中构建解码器子模块具体按以下步骤实施：

步骤2.2.1，通道数为512的1/32大小的特征图首先经过通道注意力层，计算新特征；

步骤2.2.2，将步骤2.2.1得到的通道数为512的1/32特征图经过上采样层与经过通道注意力层得到的通道数为256的1/16特征图相加融合；

步骤2.2.3，融合后的特征再进行上采样后与经过通道注意力层得到的通道数为128的1/8大小的特征图相加融合；

步骤2.2.4，最后再次上采样后与经过通道注意力层得到的通道数为64的1/4大小的特征图融合；

步骤2.2.5，将上采样为16通道1/2大小的特征图送入输出卷积层中，输出卷积层步长为2，输出通道为类别数的二维转置卷积；

其中步骤2.2.1具体按以下步骤实施：

步骤2.2.1.1，对输入大小为H×W×C的特征F分别进行空间的全局最大池化和平均池化得到两个大小为1×1×C的通道描述F_avg、F_max；

步骤2.2.1.2，将步骤2.2.1.1的输出送入多层感知机网络中，由两个全连接层和一个Relu激活层构成；

步骤2.2.1.3将步骤2.2.1.2输出的两个特征相加后通过一个Sigmoid激活函数得到权重系数Mc(F)，与大小为H×W×C的特征F相乘得到放缩后的新特征，其中Mc(F)的计算，如下式所示：

其中步骤3图像后处理与结果输出具体按以下步骤实施：

步骤3.1，将拍摄的坍落度实验前后对比图像送入步骤2构建完成的基于多尺度特征提取的语义分割方法模块中，输出预测的分割图像P₁、P₂；

步骤3.2，对步骤3.1得到的分割图像P₁、P₂进行后处理，进行区域连通以及噪点处理，确保P₁实现坍落度桶的分割、P₂实现混凝土的分割；

步骤3.3，对步骤3.2输出的后处理图像P₁、P₂进行查找，找到P₁中类别为坍落度桶的所有像素中y轴坐标值的最高点Y₁和最低点Y₂，找到P₂中类别为混凝土的所有像素中y轴坐标值的最低点Y₃，计算Y₁和Y₂在y轴坐标值上的绝对差值，根据坍落度桶的实际高度，计算出图像尺寸和实际尺寸的比值K，再计算Y₂和Y₃在y轴坐标值上的绝对差值，根据K计算出塌落度的实际高度；

步骤3.4，根据坍落度分级计算混凝土分类结果，其中坍落度在10～40mm内为低塑性混凝土；坍落度在50～90mm内为塑性混凝土；坍落度在100～150mm内为流动性混凝土；坍落度大于160mm的为大流动性混凝土；

步骤3.5，输出P₁、P₂、坍落度与混凝土分类结果。

本发明的有益效果是：

本发明的基于图像语义分割的混凝土坍落度检测方法中数据预处理工作和图像后处理与结果输出不参与模型训练过程；基于多尺度通道注意力特征的语义分割，其中多尺度特征提取模块使用三个分支来提取多尺度信息，模块拥有更丰富的上下文信息；在每次下采样前，将当前特征图与下采样至相同分辨率的三通道输入图像以及上一次下采样后的特征图进行级联；此外，除第一次上采样外，在每次上采样前，将当前特征图与经过通道注意力具有相同通道数和分辨率的多尺度特征图进行相加，进一步提高预测性能；本方法克服了现有混凝土坍落度检测方法依赖于人工操作和主观判断等误差引入问题，输出的坍落度检测结果更加精准，丰富了计算机视觉及人工智能技术的方法体系，为提升混凝土坍落度检测精度提供了一种选择。

附图说明

图1是本发明的基于图像语义分割的混凝土坍落度检测方法中实施步骤2中基于多尺度通道注意力特征的网络结构示意图；

图2是本发明的基于图像语义分割的混凝土坍落度检测方法中实施步骤2.1.2中多尺度特征提取模块的结构示意图；

图3是本发明的基于图像语义分割的混凝土坍落度检测方法中实施步骤2.2中解码器模块的结构示意图；

图4是本发明的基于图像语义分割的混凝土坍落度检测方法中实施步骤2.2.1中通道注意力层的结构示意图。

具体实施方式

下面结合附图和具体实施方式对本发明进行详细说明。

随着机器学习和深度学习的发展，混凝土坍落度的自动检测得到了广泛研究；这些方法可以基于颜色、纹理、形状等特征来识别和测量混凝土的坍落度；与传统方法相比，基于深度学习的方法能够从大量数据中学习特征表示，自动提取对坍落度预测有用的特征；模型能够适应不同的混凝土特性和施工条件；并且具备较高的预测准确性和稳定性。

本发明提供了基于图像语义分割的混凝土坍落度检测方法，选择以卷积神经网络为基础，围绕语义分割技术展开研究，关键技术包括以下三项：图像预处理、构建基于多尺度特征提取的语义分割模块、图像后处理与结果输出；通过这三项关键技术的实现，共同完成混凝土坍落度检测的任务，从而弥补现有混凝土坍落度检测方法依赖于人工操作和主观判断等问题；这对实现高精度坍落度检测判断混凝土是否易于施工操作和均匀密实的性能，从而保证施工的正常进行具有重要意义。

实施例1

基于图像语义分割的混凝土坍落度检测方法，具体按以下步骤实施：

步骤1，图像预处理与数据集构建；

步骤2，构建基于多尺度通道注意力特征的语义分割模块；

步骤3，图像后处理与结果输出。

实施例2

基于语义分割的混凝土坍落度检测方法，具体按以下步骤实施：

步骤1，进行图像预处理与数据集构建：

步骤1.1，将各种坍落度桶与具有不同坍落度的混凝土样本图像进行图像切割与图像增强，保证目标物体在图像中的占比接近真实实验环境，同时确保两类关键分割对象的数据平衡；

步骤2，基于多尺度注意力通道特征的语义分割模块对图像进行语义分割，网络结构示意图如图1所示，具体步骤如下：

步骤2.1，构建编码器子模块，主要由卷积层和下采样层组成，包含原始特征提取单元和多尺度特征提取单元；

步骤2.2，构建解码器子模块，主要由通道注意力层与上采样层组成，用于逐步恢复特征图的分辨率，如图3所示，具体如下：

步骤2.2.1，通道数为512的1/32大小的特征图首先经过通道注意力层，计算新特征，如图4所示；

步骤2.2.3，融合后的特征再进行上采样后与经过通道注意力层，如步骤2.2.1所示，得到的通道数为128的1/8大小的特征图相加融合；

步骤2.2.4，最后再次上采样后与经过通道注意力层，如步骤2.2.1所示，得到的通道数为64的1/4大小的特征图融合；

步骤2.2.5，将上采样为16通道1/2大小的特征图送入输出卷积层中，输出卷积层步长为2，输出通道为类别数的二维转置卷积。

步骤2.3，设置训练超参，进行网络的训练与测试；

步骤3，进行图像后处理与结果输出，具体步骤如下：

步骤3.5，输出P₁、P₂、坍落度与混凝土分类结果；

实施例3

本实施例对步骤2.1构建编码器子模块采用的方案具体为：

步骤2.1.1，构建初始特征提取单元，包含一个步长为2的3×3卷积和两个步长为1的3×3卷积，该单元的作用是实现初始特征的提取；

步骤2.1.2，构建多尺度特征提取模块，如图2所示，为了追求更高的分割性能，所使用的卷积均为标准卷积和空洞卷积；

步骤2.1.2.2，经过三个感受野不同的特征提取分支，提取三个分支的多尺度特征，具体步骤如下：

步骤2.1.2.4，使用通道混洗进行各个通道间的信息交互，并在混洗前引入了特征提取分支之前的残差连，促进训练、避免梯度消失。

Claims

1.基于图像语义分割的混凝土坍落度检测方法，其特征在于，具体按以下步骤实施：

步骤1，图像预处理与数据集构建；

步骤2，构建基于多尺度通道注意力特征的语义分割模块；

步骤3，图像后处理与结果输出。

2.根据权利要求1所述的基于图像语义分割的混凝土坍落度检测方法，其特征在于，所述步骤1具体按以下步骤实施：

步骤1.3，保存生成的json文件，将其批量转化为分割的可视化图像，再进行颜色填充，生成对应图像的标注图片，作为GroundTruth，与原始图像一并构成训练集、验证集和测试集。

3.根据权利要求1所述的基于图像语义分割的混凝土坍落度检测方法，其特征在于，所述步骤2具体按以下步骤实施：

步骤2.3，设置训练超参，进行网络的训练与测试。

4.根据权利要求3所述的基于图像语义分割的混凝土坍落度检测方法，其特征在于，所述步骤2.1中构建编码器子模块具体按以下步骤实施：

步骤2.1.2，构建多尺度特征提取模块，卷积均为标准卷积和空洞卷积。

5.根据权利要求4所述的基于图像语义分割的混凝土坍落度检测方法，其特征在于，所述步骤2.1.2中构建多尺度特征提取模块具体按以下步骤实施：

步骤2.1.2.4，使用通道混洗进行各个通道间的信息交互，并在混洗前引入了特征提取分支之前的残差连。

6.根据权利要求5所述的基于图像语义分割的混凝土坍落度检测方法，其特征在于，所述步骤2.1.2.2具体按以下步骤实施：

步骤2.1.2.2.3，第三个分支为空洞率为d+1的3×3空洞卷积，其感受野为(2×d+3)×(2×d+3)。

7.根据权利要求3所述的基于图像语义分割的混凝土坍落度检测方法，其特征在于，所述步骤2.2中构建解码器子模块具体按以下步骤实施：

步骤2.2.5，将上采样为16通道1/2大小的特征图送入输出卷积层中,输出卷积层步长为2，输出通道为类别数的二维转置卷积。

8.根据权利要求7所述的基于图像语义分割的混凝土坍落度检测方法，其特征在于，所述步骤2.2.1具体按以下步骤实施：

9.根据权利要求1所述的基于图像语义分割的混凝土坍落度检测方法，其特征在于，所述步骤3图像后处理与结果输出具体按以下步骤实施：

步骤3.5，输出P₁、P₂、坍落度与混凝土分类结果。