CN114155518A

CN114155518A - 基于深度语义分割网络和图像矫正的高速路遮光板倾斜识别方法

Info

Publication number: CN114155518A
Application number: CN202111312548.6A
Authority: CN
Inventors: 周祚峰; 吴清泉
Original assignee: Xi'an Xiguang Industrial Development Co ltd
Current assignee: Xi'an Xiguang Industrial Development Co ltd
Priority date: 2021-11-08
Filing date: 2021-11-08
Publication date: 2022-03-08

Abstract

本发明涉及一种基于深度语义分割网络和图像矫正的高速路遮光板倾斜识别方法，将高分辨相机采集的高速路上遮光板图像输入至深度残差神经网络模型，实现对遮光板区域的像素级精细分割，进而对同一幅图像内多个遮光板区域，通过去估计最大外接多边形，根据顶点之间的距离确定最优外接四边形，进而通过仿射变换完成遮光板区域矫正；最后，利用最小二乘估计每个遮光板的姿态方向，实现对倾斜遮光板的识别定位。相比传统图像分割方法，该方法使用的目标分割模型对目标细节分割质量更优，对背景干扰十分鲁棒。通过顶点距离快速确定外接四边形的方法简单高效，适用于对动态场景下的区域形状估计。通过在实测数据进行测试，验证了该方法的有效性和优越性。

Description

基于深度语义分割网络和图像矫正的高速路遮光板倾斜识别方法

技术领域

本发明属于图像处理技术领域，涉及图像的识别检测，具体涉及一种基于深度语义分割和图像矫正的高速路遮光板倾斜识别方法。

背景技术

高速公路遮光板位于高速公路两个反方向行驶道路中间，能够挡住斜对面反向车道上行驶过来的车灯直射光线影响，防止炫目保证司机的眼睛不受强光照射；同时，还可以帮助风流导向，避免横风(与高速公路走向垂直的风流)吹倒损坏遮光板。高速公路遮光板的安装部署和缺损状态监测，对保证高速公路的行车安全有很大作用。实际中，由于车祸事故、风力破坏等不可抗力原因，高速公路遮光板不可避免发生缺失或倾斜，给道路安全防护带来极大隐患。因此，对高速公路遮光板进行检测和定位，以便快速修复遮光板，对于高速公路的行车安全环境至关重要。

发明内容

针对上述现有技术中存在的高速公路遮光板缺失或倾斜的异常问题，本发明的目的在于，提供一种基于深度语义分割和图像矫正的高速路遮光板倾斜识别方法。

为了实现上述任务，本发明采取如下的技术解决方案：

一种基于深度语义分割网络和图像矫正的高速路遮光板倾斜识别方法，其特征在于，该方法将高分辨相机采集的高速路上遮光板图像输入至残差神经网络模型，实现对遮光板区域的像素级精细分割，进而对同一幅图像内多个遮光板区域，通过去估计最大外接多边形，根据顶点之间的距离确定最优外接四边形，进而通过仿射变换完成遮光板区域矫正；最后，利用最小二乘估计每个遮光板的姿态方向，实现对倾斜遮光板的识别定位。

具体包括以下步骤：

步骤一，构建残差神经网络模型，所述残差神经网络模型包括主干特征提取网络、空洞空间池化金字塔模块、后处理模块、二次点预测模块；

将高分辨相机采集的高速路上遮光板图像输入至残差神经网络模型，由神经网络模型输出特征图，然后对输出特征图进行2倍双线性插值，得到粗预测图；在得到粗预测图上挑选出N个不确定性最高的点，并对于每个不确定性最高点获取其表征向量，该表征向量由低层特征向量和高层特征向量组成；其中，低层特征向量通过在粗预测图的特征向量图上进行双线性插值获得，高层特征向量即为不确定点在粗预测图上的特征向量，然后使用一个小的神经网络对表征向量计算得到更新的粗预测图；将预测结果替换粗糙预测结果中的不稳定值，不断重复上述步骤，直到输出结果尺寸与原图大小一致；

步骤二，计算遮光板区域的凸包，具体计算方法如下：

1)假设每个遮光板边缘区域是由n个像素组成，构成了集合E，且E＝{P_k|k＝1，2，...，n}，首先以集合E左下角像素P₁为起点，然后将其它边缘像素P_k，k＝2，3，...，n与P₁进行连线，计算连线与水平方向的夹角，并按照夹角大小排序；

2)排序后的像素

集合为

针对

中像素

若

顺时针转向

说明

是凸包顶点，保留像素

否则，从

中删除像素

直到

中所有像素都被遍历且判决，最终保留下来的就是二维凸包的顶点；

3)对像素集合

中的所有像素，得到遮光板区域的二维凸包；

步骤三，基于最小二乘姿态估计的遮光板倾斜识别，具体识别方法如下：

1)假设一幅图像中共有m个遮光板，其中第j个遮光板的中心线为二维空间中一条直线，根据均方误差构建误差目标函数

其中，

为第j条直线截距，

为第j条直线斜率，j∈{1，2，...，m}，x_k和y_k分别为第k个边缘像素的横坐标和纵坐标；

2)采用最小二乘法确定使得

取最小值的最优解参数

计算遮光板方向θ_j；遍历图像中的m个遮光板，并生成遮光板姿态方向集合Ω＝{θ₁，θ₂，...，θ_j}；

3)当集合Ω内θ_j满足以下条件时，则判定第j个遮光板倾斜，并构建倾斜遮光板对应的位置索引集合U：

其中τ为阈值，

本发明的基于深度语义分割和图像矫正的高速路遮光板倾斜识别方法，相比传统图像分割方法，使用残差神经网络模型对目标细节分割质量更优，对背景干扰十分鲁棒。通过顶点距离快速确定外接四边形的方法简单高效，适用于对动态场景下的区域形状估计。通过实测数据进行测试，验证了该方法的有效性和优越性。

附图说明

图1是残差神经网络的基本框架；

图2是高速公路上遮光板完整状态以及缺失、倾斜状态图片，从左至右依次为完整状态、缺失状态和倾斜状态；

图3是特征提取主干网络；

图4是空洞空间池化金字塔示意图；

图5是后处理模块示意图；

图6是基于残差神经网络模型的遮光板分割结果图；

图7是遮光板等区域的二维凸包图；

图8是挡光边区域的矫正结果图；

图9是遮光板区域边缘检测和最小二乘估计直线图；

图10是基于最小二乘姿态估计的遮光板倾斜识别示例图。

以下结合附图和实施例对本发明作进一步地详细说明。

具体实施方式

本发明的设计思路是，针对高分辨相机采集高速路上遮光板图像数据，利用计算机视觉和深度学习方法对高速公路上遮光板倾斜情况进行识别检测。主要处理步骤包括遮光板目标检测，形态矫正和倾斜识别。

本实施例给出一种基于深度语义分割网络和图像矫正的高速路遮光板倾斜识别方法，将高分辨相机采集的高速路上遮光板图像输入至深度残差神经网络模型，实现对遮光板区域的像素级精细分割，进而对同一幅图像内多个遮光板区域，通过去估计最大外接多边形，根据顶点之间的距离确定最优外接四边形，进而通过仿射变换完成遮光板区域矫正；最后，利用最小二乘估计每个遮光板的姿态方向，实现对倾斜遮光板的识别定位。

所构建残差神经网络的基本框架如图1所示，主要包括主干特征提取网络、空洞空间池化金字塔模块、后处理模块、二次点预测模块。

具体包括以下步骤：

(1)构建采集图像数据集

利用高分辨相机采集高速路上遮光板图像数据，为了采集丰富的遮光板目标内容，在采集遮光板图像时相机与道路方向夹角小于π/2，使得一幅图像中可以采集到多个遮光板目标图像，图2给出了高速公路上遮光板完整状态以及缺失、倾斜状态图片，从左至右依次为完整状态、缺失状态和倾斜状态。

(2)构建特征提取主干网络

针对采集到的遮光板图片，构建残差神经网络去提取图像特征，整体结构如图3所示。

输入图像，经过初始模块，这里的初始模块为三个3×3卷积和一个最大池化层。经过初始模块后的输出尺寸降了四倍，输出通道数为128。

经过阶段1，阶段1由三个残差单元构成，残差单元都是1×1和3×3的小卷积，且步长都为1，经过阶段1后的输出尺寸相对于原图降低了四倍(与初始模块的输出尺寸相同)，阶段1输出为256通道。

经过阶段2，阶段2由四个残差单元组成，其中第一个残差单元的3×3卷积核步长为2，经过阶段2后的输出尺寸相对于原图降了八倍，阶段2输出为512通道。

经过阶段3，阶段3由六个残差单元组成，其中第二个到第六个残差单元的3×3卷积中使用了空洞率为2的空洞卷积，经过阶段3后的输出尺寸相对于原图降了八倍，阶段3的输出为1024通道。

经过阶段4，阶段4由三个残差单元组成，第一个残差单元中3×3卷积的空洞率为2，第二个和第三个残差单元中3×3卷积的空洞率为4，经过阶段4后的输出尺寸相对于原图降了八倍，阶段4的输出为2048通道。

(3)构建空洞空间卷积池化金字塔模块

考虑到多尺度的问题，申请人构建了空洞空间池化金字塔模块。传统的处理多尺度的做法是对原图进行不同的尺度变化，然后传入到模型中，这样的计算量比较大。因此，使用多个不同扩张率的并行空洞卷积层组成的模块，在各自的分支中以不同扩张率抽取到不同感受野的特征，随后融合生成最后的结果。通过该模块可以从多个尺度抽取图像中的上下文信息。空洞空间池化金字塔模块结构如图4所示。

图中，输入是主干特征提取网络的阶段4的输出，第一个分支是普通的1×1卷积层。

第二、三、四分支为3×3的空洞卷积层，空洞率分别为12、24、36，当输出尺寸为原来的1/16时，空洞率应依次设置为6、12、18。

第五个分支为平均池化加一个1×1的卷积层，池化层无法调整通道数，1×1的卷积起到调整通道数作用

五个分支的输出都是256维(一共1280维)，空洞空间卷积池化金字塔模块后面使用1×1卷积将这五个分支输出的结果进行融合，最后输出256维的新特征。

(4)后处理模块构建

后处理模块是进行初步图像分割的最后一个模块，模后处理块的结构如图5所示。

后处理模块的输入为空洞空间卷积池化金字塔模块融合后的输出,后处理模块最终的输出为分类数目张分割掩码结果图；后处理模块包含两个卷积层。输入先经过3×3的卷积再通过1×1的卷积，3×3卷积为过渡作用，1×1卷积是为了改变输出通道数为分类数目。

(5)构建点的二次预测网络

针对于图像分割导致的边缘不够精细问题，考虑将边缘等预测不准确的点进行再预测，将新得到的预测点结果替换原来的粗糙预测结果，通过多次的上采样和迭代替换，得到最终的结果作为分割的最终结果。

1)上采样提取粗糙特征上不确定点

根据前面粗糙预测出来的结果，使用双线性插值对粗糙结果上采样，将其按类别预测分数排序，选出分数高的前两类别的掩膜，计算出在两个类别掩膜上较高得分的像素点作为不确定点，通常来说一个像素点只能对应一个类别，如果一个像素点对应两个类别的分数都很高，说明它很可能是边界点，即不确定点。

2)融合不确定点的精细特征和粗糙特征

通过步骤一的操作得到不确定点，同时也获得了它们的点坐标和位置，因此我们可以获得这些不确定点的粗糙特征和精细特征，精细特征即我们特征提取网络的阶段2的输出，将不确定点在精细特征图和粗糙特征图的特征进行融合得到新的特征。

3)使用多层感知机网络进行不确定点的再预测

将上述步骤所得到的的不确定点的新特征再次送入一个多层感知机网络，由1×1的卷积构成，得到每个不确定的新预测值。

4)迭代替换不确定点

将预测结果替换粗糙预测结果中的不确定值，不断重复上述步骤直到输出结果尺寸与原图大小一致。

(6)计算遮光板区域的凸包，计算方法如下：

1)假设每个遮光板边缘区域是由n个像素组成，构成了集合E，且E＝{P_k|k＝1,2,...,n}，首先以集合E左下角像素P₁为起点，然后将其它边缘像素P_k，k＝2，3，...，n与P₁进行连线，计算连线与水平方向的夹角，并按照夹角大小排序；

2)排序后的像素

集合为

针对

中像素

若

顺时针转向

说明

是凸包顶点，保留像素

否则，从

中删除像素

直到

3)对像素集合P_k中的所有像素，得到遮光板区域的二维凸包；

(7)基于最小二乘姿态估计的遮光板倾斜识别

其中，

为第j条直线截距，

2)采用最小二乘法确定使得

取最小值的最优解参数

可计算遮光板方向θ_j。遍历图像中的m个遮光板，并生成遮光板姿态方向集合Ω＝{θ₁，θ₂，...，θ_j}；

其中τ为阈值，

上述步骤(1)的构建采集图像数据集中相机与道路方向夹角最佳取值为π/3，

上述步骤(5)的构建点的二次预测网络中采样点数最佳取值为8096。

上述步骤(7)的基于最小二乘姿态估计的遮光板倾斜识别中阈值τ最佳取值为π/12。

下面是申请人给出的具体实施例，本发明不限于下面的实施例。

实施例1：

(1)构建采集图像数据集

利用高分辨相机采集高速路上遮光板图像数据，为了采集丰富的遮光板目标内容，本实例在采集遮光板图像时相机与道路方向夹角设定为π/3，使得一幅图像中可以采集到多个遮光板目标图像。

(2)构建特征提取主干网络

针对采集到的遮光板图片，构建深度残差网络去提取图像特征，整体结构如图3所示。

(3)构建空洞空间卷积池化金字塔模块

第五个分支为平均池化加一个1×1的卷积层，池化层无法调整通道数，1×1的卷积起到调整通道数作用。

(4)后处理模块构建

(5)构建点的二次预测网络

1)上采样提取粗糙特征上不确定的点

根据前面粗糙预测出来的结果，使用双线性插值对粗糙结果上采样，将其按类别预测分数排序，选出分数高的前两类别的掩膜，计算出在两个类别掩膜上较高得分的像素点作为不确定点，通常来说一个像素点只能对应一个类别，如果一个像素点对应两个类别的分数都很高，说明它很可能是边界点，即不确定的。本实施例中设置采样点数为8096。

2)融合不确定点的精细特征和粗糙特征

通过步骤1)的操作得到不确定点，同时也获得了它们的点坐标和位置，因此我们可以获得这些不确定点的粗糙特征和精细特征，精细特征即我们特征提取网络的阶段2的输出，将不确定点在精细特征图和粗糙特征图的特征进行融合得到新的特征。

3)使用多层感知机网络进行不确定点的再预测

4)迭代替换不确定点

(6)计算遮光板区域的凸包

1)假设每个遮光板边缘区域是由n个像素组成，构成了集合E，且E＝{P_k|k＝1,2,...,n}，首先以集合E左下角像素P₁为起点，然后将其它边缘像素P_k，k＝2,3,...,n与P₁进行连线，计算连线与水平方向的夹角，并按照夹角大小排序；

2)排序后的像素

集合为

针对

中像素

若

顺时针转向

说明

是凸包顶点，保留像素

否则，从

中删除像素

直到

(7)基于最小二乘姿态估计的遮光板倾斜识别

其中，

为第j条直线截距，

2)采用最小二乘法确定使得

取最小值的最优解参数

其中τ为阈值，

本实施例中，τ取值为π/12。

实施例2：

本实施例的基于深度语义分割和图像矫正的高速路遮光板倾斜识别方法，由以下步骤组成：

(1)构建采集图像数据集

利用高分辨相机采集高速路上遮光板图像数据，为了采集丰富的遮光板目标内容，本实例在采集遮光板图像时相机与道路方向夹角设定为π/4。

(2)构建特征提取主干网络

同实施例1。

(3)构建空洞空间卷积池化金字塔模块

同实施例1。

(4)后处理模块构建

同实施例1。

(5)构建点的二次预测网络

1)上采样提取粗糙特征上不确定的点

根据前面粗糙预测出来的结果，使用双线性插值对粗糙结果上采样，将其按类别预测分数排序，选出分数高的前两类别的掩膜，计算出在两个类别掩膜上较高得分的像素点作为不确定点，通常来说一个像素点只能对应一个类别，如果一个像素点对应两个类别的分数都很高，说明它很可能是边界点，即不确定的。本实施例中设置采样点数为6048。

2)融合不确定点的精细特征和粗糙特征

同实施例1。

3)使用多层感知机网络进行不确定点的再预测

同实施例1。

4)迭代替换不确定点

同实施例1。

(6)计算遮光板区域的凸包

该步骤所有计算方法与实施例1相同。

(7)基于最小二乘姿态估计的遮光板倾斜识别

1)同实施例1。

2)同实施例1。

其中τ为阈值，

本实施例中，τ取值为π/6。

实施例3：

(1)构建采集图像数据集

利用高分辨相机采集高速路上遮光板图像数据，为了采集丰富的遮光板目标内容，本实例在采集遮光板图像时相机与道路方向夹角设定为π/5。

(2)构建特征提取主干网络

同实施例1。

(3)构建空洞空间卷积池化金字塔模块

同实施例1。

(4)后处理模块构建

同实施例1。

(5)构建点的二次预测网络

1)上采样提取粗糙特征上不确定的点

根据前面粗糙预测出来的结果，使用双线性插值对粗糙结果上采样，将其按类别预测分数排序，选出分数高的前两类别的掩膜，计算出在两个类别掩膜上较高得分的像素点作为不确定点，通常来说一个像素点只能对应一个类别，如果一个像素点对应两个类别的分数都很高，说明它很可能是边界点，即不确定的。本实施例中设置采样点数为7200。

2)融合不确定点的精细特征和粗糙特征

同实施例1。

3)使用多层感知机网络进行不确定点的再预测

同实施例1。

4)迭代替换不确定点

同实施例1。

(6)计算遮光板区域的凸包

该步骤所有计算方法与实施例1相同。

(7)基于最小二乘姿态估计的遮光板倾斜识别

1)同实施例1。

2)同实施例1。

其中τ为阈值，

本实施例中，τ取值为π/4。

为了验证本实施例给出的基于深度语义分割和图像矫正的高速路遮光板倾斜识别方法的有益效果，采用实施例1对真实情况下采集到的高速公路遮光板数据进行检测，试验步骤如下：

1、实验条件

采集数据装置为车载高清摄像头，实验测试环境为Windows 10(64)为操作***的戴尔电脑，其配置为Intel Core i5-8400处理器，六核CPU及6GB内存，在PyCharm平台上进行实验操作。

2、测试数据

采用高速公路随机拍取的500张照片，其中34张含有倾斜遮光板，其余图片遮光板全部正常。34张图片中有12张中含有两个倾斜遮光板，另外22张含有的倾斜遮光板数量均为1。

3、实验结果

(1)采用残差神经网络模型进行数据集的检测。实验结果见表1，图6-图10。表1给出了实验结果，图6-图10为部分的实验结果图。

表1：实验结果

4、实验结论

由表1可见，在实施例1的条件下，你说啥了给出的基于深度语义分割和图像矫正的高速路遮光板倾斜识别方法，其检测率较高，正常数据466张图片中，只有两张发生了误检，而在其余464张图片中均没有发现倾斜的遮光板。在含有一个倾斜遮光板数据22张图片中，22张图片被全部检测出有倾斜遮光板。在含有两个倾斜遮光板的数据12张中，12张图片全部被检测出来有倾斜遮光板。证明了本实施例的基于深度语义分割和图像矫正的高速路遮光板倾斜识别方法具有较高的检测率，可以适用于现实场景之中。

Claims

1.一种基于深度语义分割网络和图像矫正的高速路遮光板倾斜识别方法，其特征在于，该方法将高分辨相机采集的高速路上遮光板图像输入至深度残差神经网络模型，实现对遮光板区域的像素级精细分割，进而对同一幅图像内多个遮光板区域，通过去估计最大外接多边形，根据顶点之间的距离确定最优外接四边形，进而通过仿射变换完成遮光板区域矫正；最后，利用最小二乘估计每个遮光板的姿态方向，实现对倾斜遮光板的识别定位。

2.如权利要求1所述的方法，其特征在于，具体包括以下步骤：

步骤一，构建深度残差神经网络模型，所述深度残差神经网络模型包括主干特征提取网络、空洞空间池化金字塔模块、后处理模块、二次点预测模块；

步骤二，计算遮光板区域的凸包，具体计算方法如下：

1)假设每个遮光板边缘区域是由n个像素组成，构成了集合E，且E＝{P_k|k＝1,2,…,n}，首先以集合E左下角像素P₁为起点，然后将其它边缘像素P_k，k＝2，3，…，n与P₁进行连线，计算连线与水平方向的夹角，并按照夹角大小排序；

2)排序后的像素