CN114155518A - 基于深度语义分割网络和图像矫正的高速路遮光板倾斜识别方法 - Google Patents

基于深度语义分割网络和图像矫正的高速路遮光板倾斜识别方法 Download PDF

Info

Publication number
CN114155518A
CN114155518A CN202111312548.6A CN202111312548A CN114155518A CN 114155518 A CN114155518 A CN 114155518A CN 202111312548 A CN202111312548 A CN 202111312548A CN 114155518 A CN114155518 A CN 114155518A
Authority
CN
China
Prior art keywords
image
light
shading plate
pixel
light shielding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111312548.6A
Other languages
English (en)
Inventor
周祚峰
吴清泉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xi'an Xiguang Industrial Development Co ltd
Original Assignee
Xi'an Xiguang Industrial Development Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xi'an Xiguang Industrial Development Co ltd filed Critical Xi'an Xiguang Industrial Development Co ltd
Priority to CN202111312548.6A priority Critical patent/CN114155518A/zh
Publication of CN114155518A publication Critical patent/CN114155518A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于深度语义分割网络和图像矫正的高速路遮光板倾斜识别方法,将高分辨相机采集的高速路上遮光板图像输入至深度残差神经网络模型,实现对遮光板区域的像素级精细分割,进而对同一幅图像内多个遮光板区域,通过去估计最大外接多边形,根据顶点之间的距离确定最优外接四边形,进而通过仿射变换完成遮光板区域矫正;最后,利用最小二乘估计每个遮光板的姿态方向,实现对倾斜遮光板的识别定位。相比传统图像分割方法,该方法使用的目标分割模型对目标细节分割质量更优,对背景干扰十分鲁棒。通过顶点距离快速确定外接四边形的方法简单高效,适用于对动态场景下的区域形状估计。通过在实测数据进行测试,验证了该方法的有效性和优越性。

Description

基于深度语义分割网络和图像矫正的高速路遮光板倾斜识别 方法
技术领域
本发明属于图像处理技术领域,涉及图像的识别检测,具体涉及一种基于深度语义分割和图像矫正的高速路遮光板倾斜识别方法。
背景技术
高速公路遮光板位于高速公路两个反方向行驶道路中间,能够挡住斜对面反向车道上行驶过来的车灯直射光线影响,防止炫目保证司机的眼睛不受强光照射;同时,还可以帮助风流导向,避免横风(与高速公路走向垂直的风流)吹倒损坏遮光板。高速公路遮光板的安装部署和缺损状态监测,对保证高速公路的行车安全有很大作用。实际中,由于车祸事故、风力破坏等不可抗力原因,高速公路遮光板不可避免发生缺失或倾斜,给道路安全防护带来极大隐患。因此,对高速公路遮光板进行检测和定位,以便快速修复遮光板,对于高速公路的行车安全环境至关重要。
发明内容
针对上述现有技术中存在的高速公路遮光板缺失或倾斜的异常问题,本发明的目的在于,提供一种基于深度语义分割和图像矫正的高速路遮光板倾斜识别方法。
为了实现上述任务,本发明采取如下的技术解决方案:
一种基于深度语义分割网络和图像矫正的高速路遮光板倾斜识别方法,其特征在于,该方法将高分辨相机采集的高速路上遮光板图像输入至残差神经网络模型,实现对遮光板区域的像素级精细分割,进而对同一幅图像内多个遮光板区域,通过去估计最大外接多边形,根据顶点之间的距离确定最优外接四边形,进而通过仿射变换完成遮光板区域矫正;最后,利用最小二乘估计每个遮光板的姿态方向,实现对倾斜遮光板的识别定位。
具体包括以下步骤:
步骤一,构建残差神经网络模型,所述残差神经网络模型包括主干特征提取网络、空洞空间池化金字塔模块、后处理模块、二次点预测模块;
将高分辨相机采集的高速路上遮光板图像输入至残差神经网络模型,由神经网络模型输出特征图,然后对输出特征图进行2倍双线性插值,得到粗预测图;在得到粗预测图上挑选出N个不确定性最高的点,并对于每个不确定性最高点获取其表征向量,该表征向量由低层特征向量和高层特征向量组成;其中,低层特征向量通过在粗预测图的特征向量图上进行双线性插值获得,高层特征向量即为不确定点在粗预测图上的特征向量,然后使用一个小的神经网络对表征向量计算得到更新的粗预测图;将预测结果替换粗糙预测结果中的不稳定值,不断重复上述步骤,直到输出结果尺寸与原图大小一致;
步骤二,计算遮光板区域的凸包,具体计算方法如下:
1)假设每个遮光板边缘区域是由n个像素组成,构成了集合E,且E={Pk|k=1,2,...,n},首先以集合E左下角像素P1为起点,然后将其它边缘像素Pk,k=2,3,...,n与P1进行连线,计算连线与水平方向的夹角,并按照夹角大小排序;
2)排序后的像素
Figure BDA0003342241000000021
集合为
Figure BDA0003342241000000022
针对
Figure BDA0003342241000000023
中像素
Figure BDA0003342241000000024
Figure BDA0003342241000000025
顺时针转向
Figure BDA0003342241000000026
说明
Figure BDA0003342241000000027
是凸包顶点,保留像素
Figure BDA0003342241000000028
否则,从
Figure BDA0003342241000000029
中删除像素
Figure BDA00033422410000000210
直到
Figure BDA00033422410000000211
中所有像素都被遍历且判决,最终保留下来的就是二维凸包的顶点;
3)对像素集合
Figure BDA00033422410000000212
中的所有像素,得到遮光板区域的二维凸包;
步骤三,基于最小二乘姿态估计的遮光板倾斜识别,具体识别方法如下:
1)假设一幅图像中共有m个遮光板,其中第j个遮光板的中心线为二维空间中一条直线,根据均方误差构建误差目标函数
Figure BDA00033422410000000213
Figure BDA00033422410000000214
其中,
Figure BDA00033422410000000215
为第j条直线截距,
Figure BDA00033422410000000216
为第j条直线斜率,j∈{1,2,...,m},xk和yk分别为第k个边缘像素的横坐标和纵坐标;
2)采用最小二乘法确定使得
Figure BDA00033422410000000217
取最小值的最优解参数
Figure BDA00033422410000000218
计算遮光板方向θj;遍历图像中的m个遮光板,并生成遮光板姿态方向集合Ω={θ1,θ2,...,θj};
3)当集合Ω内θj满足以下条件时,则判定第j个遮光板倾斜,并构建倾斜遮光板对应的位置索引集合U:
Figure BDA00033422410000000219
其中τ为阈值,
Figure BDA00033422410000000220
本发明的基于深度语义分割和图像矫正的高速路遮光板倾斜识别方法,相比传统图像分割方法,使用残差神经网络模型对目标细节分割质量更优,对背景干扰十分鲁棒。通过顶点距离快速确定外接四边形的方法简单高效,适用于对动态场景下的区域形状估计。通过实测数据进行测试,验证了该方法的有效性和优越性。
附图说明
图1是残差神经网络的基本框架;
图2是高速公路上遮光板完整状态以及缺失、倾斜状态图片,从左至右依次为完整状态、缺失状态和倾斜状态;
图3是特征提取主干网络;
图4是空洞空间池化金字塔示意图;
图5是后处理模块示意图;
图6是基于残差神经网络模型的遮光板分割结果图;
图7是遮光板等区域的二维凸包图;
图8是挡光边区域的矫正结果图;
图9是遮光板区域边缘检测和最小二乘估计直线图;
图10是基于最小二乘姿态估计的遮光板倾斜识别示例图。
以下结合附图和实施例对本发明作进一步地详细说明。
具体实施方式
本发明的设计思路是,针对高分辨相机采集高速路上遮光板图像数据,利用计算机视觉和深度学习方法对高速公路上遮光板倾斜情况进行识别检测。主要处理步骤包括遮光板目标检测,形态矫正和倾斜识别。
本实施例给出一种基于深度语义分割网络和图像矫正的高速路遮光板倾斜识别方法,将高分辨相机采集的高速路上遮光板图像输入至深度残差神经网络模型,实现对遮光板区域的像素级精细分割,进而对同一幅图像内多个遮光板区域,通过去估计最大外接多边形,根据顶点之间的距离确定最优外接四边形,进而通过仿射变换完成遮光板区域矫正;最后,利用最小二乘估计每个遮光板的姿态方向,实现对倾斜遮光板的识别定位。
所构建残差神经网络的基本框架如图1所示,主要包括主干特征提取网络、空洞空间池化金字塔模块、后处理模块、二次点预测模块。
具体包括以下步骤:
(1)构建采集图像数据集
利用高分辨相机采集高速路上遮光板图像数据,为了采集丰富的遮光板目标内容,在采集遮光板图像时相机与道路方向夹角小于π/2,使得一幅图像中可以采集到多个遮光板目标图像,图2给出了高速公路上遮光板完整状态以及缺失、倾斜状态图片,从左至右依次为完整状态、缺失状态和倾斜状态。
(2)构建特征提取主干网络
针对采集到的遮光板图片,构建残差神经网络去提取图像特征,整体结构如图3所示。
输入图像,经过初始模块,这里的初始模块为三个3×3卷积和一个最大池化层。经过初始模块后的输出尺寸降了四倍,输出通道数为128。
经过阶段1,阶段1由三个残差单元构成,残差单元都是1×1和3×3的小卷积,且步长都为1,经过阶段1后的输出尺寸相对于原图降低了四倍(与初始模块的输出尺寸相同),阶段1输出为256通道。
经过阶段2,阶段2由四个残差单元组成,其中第一个残差单元的3×3卷积核步长为2,经过阶段2后的输出尺寸相对于原图降了八倍,阶段2输出为512通道。
经过阶段3,阶段3由六个残差单元组成,其中第二个到第六个残差单元的3×3卷积中使用了空洞率为2的空洞卷积,经过阶段3后的输出尺寸相对于原图降了八倍,阶段3的输出为1024通道。
经过阶段4,阶段4由三个残差单元组成,第一个残差单元中3×3卷积的空洞率为2,第二个和第三个残差单元中3×3卷积的空洞率为4,经过阶段4后的输出尺寸相对于原图降了八倍,阶段4的输出为2048通道。
(3)构建空洞空间卷积池化金字塔模块
考虑到多尺度的问题,申请人构建了空洞空间池化金字塔模块。传统的处理多尺度的做法是对原图进行不同的尺度变化,然后传入到模型中,这样的计算量比较大。因此,使用多个不同扩张率的并行空洞卷积层组成的模块,在各自的分支中以不同扩张率抽取到不同感受野的特征,随后融合生成最后的结果。通过该模块可以从多个尺度抽取图像中的上下文信息。空洞空间池化金字塔模块结构如图4所示。
图中,输入是主干特征提取网络的阶段4的输出,第一个分支是普通的1×1卷积层。
第二、三、四分支为3×3的空洞卷积层,空洞率分别为12、24、36,当输出尺寸为原来的1/16时,空洞率应依次设置为6、12、18。
第五个分支为平均池化加一个1×1的卷积层,池化层无法调整通道数,1×1的卷积起到调整通道数作用
五个分支的输出都是256维(一共1280维),空洞空间卷积池化金字塔模块后面使用1×1卷积将这五个分支输出的结果进行融合,最后输出256维的新特征。
(4)后处理模块构建
后处理模块是进行初步图像分割的最后一个模块,模后处理块的结构如图5所示。
后处理模块的输入为空洞空间卷积池化金字塔模块融合后的输出,后处理模块最终的输出为分类数目张分割掩码结果图;后处理模块包含两个卷积层。输入先经过3×3的卷积再通过1×1的卷积,3×3卷积为过渡作用,1×1卷积是为了改变输出通道数为分类数目。
(5)构建点的二次预测网络
针对于图像分割导致的边缘不够精细问题,考虑将边缘等预测不准确的点进行再预测,将新得到的预测点结果替换原来的粗糙预测结果,通过多次的上采样和迭代替换,得到最终的结果作为分割的最终结果。
1)上采样提取粗糙特征上不确定点
根据前面粗糙预测出来的结果,使用双线性插值对粗糙结果上采样,将其按类别预测分数排序,选出分数高的前两类别的掩膜,计算出在两个类别掩膜上较高得分的像素点作为不确定点,通常来说一个像素点只能对应一个类别,如果一个像素点对应两个类别的分数都很高,说明它很可能是边界点,即不确定点。
2)融合不确定点的精细特征和粗糙特征
通过步骤一的操作得到不确定点,同时也获得了它们的点坐标和位置,因此我们可以获得这些不确定点的粗糙特征和精细特征,精细特征即我们特征提取网络的阶段2的输出,将不确定点在精细特征图和粗糙特征图的特征进行融合得到新的特征。
3)使用多层感知机网络进行不确定点的再预测
将上述步骤所得到的的不确定点的新特征再次送入一个多层感知机网络,由1×1的卷积构成,得到每个不确定的新预测值。
4)迭代替换不确定点
将预测结果替换粗糙预测结果中的不确定值,不断重复上述步骤直到输出结果尺寸与原图大小一致。
(6)计算遮光板区域的凸包,计算方法如下:
1)假设每个遮光板边缘区域是由n个像素组成,构成了集合E,且E={Pk|k=1,2,...,n},首先以集合E左下角像素P1为起点,然后将其它边缘像素Pk,k=2,3,...,n与P1进行连线,计算连线与水平方向的夹角,并按照夹角大小排序;
2)排序后的像素
Figure BDA0003342241000000061
集合为
Figure BDA0003342241000000062
针对
Figure BDA0003342241000000063
中像素
Figure BDA0003342241000000064
Figure BDA0003342241000000065
顺时针转向
Figure BDA0003342241000000066
说明
Figure BDA0003342241000000067
是凸包顶点,保留像素
Figure BDA0003342241000000068
否则,从
Figure BDA0003342241000000069
中删除像素
Figure BDA00033422410000000610
直到
Figure BDA00033422410000000611
中所有像素都被遍历且判决,最终保留下来的就是二维凸包的顶点;
3)对像素集合Pk中的所有像素,得到遮光板区域的二维凸包;
(7)基于最小二乘姿态估计的遮光板倾斜识别
1)假设一幅图像中共有m个遮光板,其中第j个遮光板的中心线为二维空间中一条直线,根据均方误差构建误差目标函数
Figure BDA00033422410000000612
Figure BDA00033422410000000613
其中,
Figure BDA00033422410000000614
为第j条直线截距,
Figure BDA00033422410000000618
为第j条直线斜率,j∈{1,2,...,m},xk和yk分别为第k个边缘像素的横坐标和纵坐标;
2)采用最小二乘法确定使得
Figure BDA00033422410000000619
取最小值的最优解参数
Figure BDA00033422410000000615
可计算遮光板方向θj。遍历图像中的m个遮光板,并生成遮光板姿态方向集合Ω={θ1,θ2,...,θj};
3)当集合Ω内θj满足以下条件时,则判定第j个遮光板倾斜,并构建倾斜遮光板对应的位置索引集合U:
Figure BDA00033422410000000616
其中τ为阈值,
Figure BDA00033422410000000617
上述步骤(1)的构建采集图像数据集中相机与道路方向夹角最佳取值为π/3,
上述步骤(5)的构建点的二次预测网络中采样点数最佳取值为8096。
上述步骤(7)的基于最小二乘姿态估计的遮光板倾斜识别中阈值τ最佳取值为π/12。
下面是申请人给出的具体实施例,本发明不限于下面的实施例。
实施例1:
(1)构建采集图像数据集
利用高分辨相机采集高速路上遮光板图像数据,为了采集丰富的遮光板目标内容,本实例在采集遮光板图像时相机与道路方向夹角设定为π/3,使得一幅图像中可以采集到多个遮光板目标图像。
(2)构建特征提取主干网络
针对采集到的遮光板图片,构建深度残差网络去提取图像特征,整体结构如图3所示。
输入图像,经过初始模块,这里的初始模块为三个3×3卷积和一个最大池化层。经过初始模块后的输出尺寸降了四倍,输出通道数为128。
经过阶段1,阶段1由三个残差单元构成,残差单元都是1×1和3×3的小卷积,且步长都为1,经过阶段1后的输出尺寸相对于原图降低了四倍(与初始模块的输出尺寸相同),阶段1输出为256通道。
经过阶段2,阶段2由四个残差单元组成,其中第一个残差单元的3×3卷积核步长为2,经过阶段2后的输出尺寸相对于原图降了八倍,阶段2输出为512通道。
经过阶段3,阶段3由六个残差单元组成,其中第二个到第六个残差单元的3×3卷积中使用了空洞率为2的空洞卷积,经过阶段3后的输出尺寸相对于原图降了八倍,阶段3的输出为1024通道。
经过阶段4,阶段4由三个残差单元组成,第一个残差单元中3×3卷积的空洞率为2,第二个和第三个残差单元中3×3卷积的空洞率为4,经过阶段4后的输出尺寸相对于原图降了八倍,阶段4的输出为2048通道。
(3)构建空洞空间卷积池化金字塔模块
考虑到多尺度的问题,申请人构建了空洞空间池化金字塔模块。传统的处理多尺度的做法是对原图进行不同的尺度变化,然后传入到模型中,这样的计算量比较大。因此,使用多个不同扩张率的并行空洞卷积层组成的模块,在各自的分支中以不同扩张率抽取到不同感受野的特征,随后融合生成最后的结果。通过该模块可以从多个尺度抽取图像中的上下文信息。空洞空间池化金字塔模块结构如图4所示。
图中,输入是主干特征提取网络的阶段4的输出,第一个分支是普通的1×1卷积层。
第二、三、四分支为3×3的空洞卷积层,空洞率分别为12、24、36,当输出尺寸为原来的1/16时,空洞率应依次设置为6、12、18。
第五个分支为平均池化加一个1×1的卷积层,池化层无法调整通道数,1×1的卷积起到调整通道数作用。
五个分支的输出都是256维(一共1280维),空洞空间卷积池化金字塔模块后面使用1×1卷积将这五个分支输出的结果进行融合,最后输出256维的新特征。
(4)后处理模块构建
后处理模块是进行初步图像分割的最后一个模块,模后处理块的结构如图5所示。
后处理模块的输入为空洞空间卷积池化金字塔模块融合后的输出,后处理模块最终的输出为分类数目张分割掩码结果图;后处理模块包含两个卷积层。输入先经过3×3的卷积再通过1×1的卷积,3×3卷积为过渡作用,1×1卷积是为了改变输出通道数为分类数目。
(5)构建点的二次预测网络
针对于图像分割导致的边缘不够精细问题,考虑将边缘等预测不准确的点进行再预测,将新得到的预测点结果替换原来的粗糙预测结果,通过多次的上采样和迭代替换,得到最终的结果作为分割的最终结果。
1)上采样提取粗糙特征上不确定的点
根据前面粗糙预测出来的结果,使用双线性插值对粗糙结果上采样,将其按类别预测分数排序,选出分数高的前两类别的掩膜,计算出在两个类别掩膜上较高得分的像素点作为不确定点,通常来说一个像素点只能对应一个类别,如果一个像素点对应两个类别的分数都很高,说明它很可能是边界点,即不确定的。本实施例中设置采样点数为8096。
2)融合不确定点的精细特征和粗糙特征
通过步骤1)的操作得到不确定点,同时也获得了它们的点坐标和位置,因此我们可以获得这些不确定点的粗糙特征和精细特征,精细特征即我们特征提取网络的阶段2的输出,将不确定点在精细特征图和粗糙特征图的特征进行融合得到新的特征。
3)使用多层感知机网络进行不确定点的再预测
将上述步骤所得到的的不确定点的新特征再次送入一个多层感知机网络,由1×1的卷积构成,得到每个不确定的新预测值。
4)迭代替换不确定点
将预测结果替换粗糙预测结果中的不确定值,不断重复上述步骤直到输出结果尺寸与原图大小一致。
(6)计算遮光板区域的凸包
1)假设每个遮光板边缘区域是由n个像素组成,构成了集合E,且E={Pk|k=1,2,...,n},首先以集合E左下角像素P1为起点,然后将其它边缘像素Pk,k=2,3,...,n与P1进行连线,计算连线与水平方向的夹角,并按照夹角大小排序;
2)排序后的像素
Figure BDA0003342241000000091
集合为
Figure BDA0003342241000000092
针对
Figure BDA0003342241000000093
中像素
Figure BDA0003342241000000094
Figure BDA0003342241000000095
顺时针转向
Figure BDA0003342241000000096
说明
Figure BDA0003342241000000097
是凸包顶点,保留像素
Figure BDA0003342241000000098
否则,从
Figure BDA0003342241000000099
中删除像素
Figure BDA00033422410000000910
直到
Figure BDA00033422410000000911
中所有像素都被遍历且判决,最终保留下来的就是二维凸包的顶点;
3)对像素集合Pk中的所有像素,得到遮光板区域的二维凸包;
(7)基于最小二乘姿态估计的遮光板倾斜识别
1)假设一幅图像中共有m个遮光板,其中第j个遮光板的中心线为二维空间中一条直线,根据均方误差构建误差目标函数
Figure BDA00033422410000000912
Figure BDA00033422410000000913
其中,
Figure BDA00033422410000000914
为第j条直线截距,
Figure BDA00033422410000000915
为第j条直线斜率,j∈{1,2,...,m},xk和yk分别为第k个边缘像素的横坐标和纵坐标;
2)采用最小二乘法确定使得
Figure BDA00033422410000000916
取最小值的最优解参数
Figure BDA00033422410000000917
可计算遮光板方向θj。遍历图像中的m个遮光板,并生成遮光板姿态方向集合Ω={θ1,θ2,...,θj};
3)当集合Ω内θj满足以下条件时,则判定第j个遮光板倾斜,并构建倾斜遮光板对应的位置索引集合U:
Figure BDA00033422410000000918
其中τ为阈值,
Figure BDA00033422410000000919
本实施例中,τ取值为π/12。
实施例2:
本实施例的基于深度语义分割和图像矫正的高速路遮光板倾斜识别方法,由以下步骤组成:
(1)构建采集图像数据集
利用高分辨相机采集高速路上遮光板图像数据,为了采集丰富的遮光板目标内容,本实例在采集遮光板图像时相机与道路方向夹角设定为π/4。
(2)构建特征提取主干网络
同实施例1。
(3)构建空洞空间卷积池化金字塔模块
同实施例1。
(4)后处理模块构建
同实施例1。
(5)构建点的二次预测网络
1)上采样提取粗糙特征上不确定的点
根据前面粗糙预测出来的结果,使用双线性插值对粗糙结果上采样,将其按类别预测分数排序,选出分数高的前两类别的掩膜,计算出在两个类别掩膜上较高得分的像素点作为不确定点,通常来说一个像素点只能对应一个类别,如果一个像素点对应两个类别的分数都很高,说明它很可能是边界点,即不确定的。本实施例中设置采样点数为6048。
2)融合不确定点的精细特征和粗糙特征
同实施例1。
3)使用多层感知机网络进行不确定点的再预测
同实施例1。
4)迭代替换不确定点
同实施例1。
(6)计算遮光板区域的凸包
该步骤所有计算方法与实施例1相同。
(7)基于最小二乘姿态估计的遮光板倾斜识别
1)同实施例1。
2)同实施例1。
3)当集合Ω内θj满足以下条件时,则判定第j个遮光板倾斜,并构建倾斜遮光板对应的位置索引集合U:
Figure BDA0003342241000000101
其中τ为阈值,
Figure BDA0003342241000000102
本实施例中,τ取值为π/6。
实施例3:
本实施例的基于深度语义分割和图像矫正的高速路遮光板倾斜识别方法,由以下步骤组成:
(1)构建采集图像数据集
利用高分辨相机采集高速路上遮光板图像数据,为了采集丰富的遮光板目标内容,本实例在采集遮光板图像时相机与道路方向夹角设定为π/5。
(2)构建特征提取主干网络
同实施例1。
(3)构建空洞空间卷积池化金字塔模块
同实施例1。
(4)后处理模块构建
同实施例1。
(5)构建点的二次预测网络
1)上采样提取粗糙特征上不确定的点
根据前面粗糙预测出来的结果,使用双线性插值对粗糙结果上采样,将其按类别预测分数排序,选出分数高的前两类别的掩膜,计算出在两个类别掩膜上较高得分的像素点作为不确定点,通常来说一个像素点只能对应一个类别,如果一个像素点对应两个类别的分数都很高,说明它很可能是边界点,即不确定的。本实施例中设置采样点数为7200。
2)融合不确定点的精细特征和粗糙特征
同实施例1。
3)使用多层感知机网络进行不确定点的再预测
同实施例1。
4)迭代替换不确定点
同实施例1。
(6)计算遮光板区域的凸包
该步骤所有计算方法与实施例1相同。
(7)基于最小二乘姿态估计的遮光板倾斜识别
1)同实施例1。
2)同实施例1。
3)当集合Ω内θj满足以下条件时,则判定第j个遮光板倾斜,并构建倾斜遮光板对应的位置索引集合U:
Figure BDA0003342241000000111
其中τ为阈值,
Figure BDA0003342241000000121
本实施例中,τ取值为π/4。
为了验证本实施例给出的基于深度语义分割和图像矫正的高速路遮光板倾斜识别方法的有益效果,采用实施例1对真实情况下采集到的高速公路遮光板数据进行检测,试验步骤如下:
1、实验条件
采集数据装置为车载高清摄像头,实验测试环境为Windows 10(64)为操作***的戴尔电脑,其配置为Intel Core i5-8400处理器,六核CPU及6GB内存,在PyCharm平台上进行实验操作。
2、测试数据
采用高速公路随机拍取的500张照片,其中34张含有倾斜遮光板,其余图片遮光板全部正常。34张图片中有12张中含有两个倾斜遮光板,另外22张含有的倾斜遮光板数量均为1。
3、实验结果
(1)采用残差神经网络模型进行数据集的检测。实验结果见表1,图6-图10。表1给出了实验结果,图6-图10为部分的实验结果图。
表1:实验结果
Figure BDA0003342241000000122
4、实验结论
由表1可见,在实施例1的条件下,你说啥了给出的基于深度语义分割和图像矫正的高速路遮光板倾斜识别方法,其检测率较高,正常数据466张图片中,只有两张发生了误检,而在其余464张图片中均没有发现倾斜的遮光板。在含有一个倾斜遮光板数据22张图片中,22张图片被全部检测出有倾斜遮光板。在含有两个倾斜遮光板的数据12张中,12张图片全部被检测出来有倾斜遮光板。证明了本实施例的基于深度语义分割和图像矫正的高速路遮光板倾斜识别方法具有较高的检测率,可以适用于现实场景之中。

Claims (2)

1.一种基于深度语义分割网络和图像矫正的高速路遮光板倾斜识别方法,其特征在于,该方法将高分辨相机采集的高速路上遮光板图像输入至深度残差神经网络模型,实现对遮光板区域的像素级精细分割,进而对同一幅图像内多个遮光板区域,通过去估计最大外接多边形,根据顶点之间的距离确定最优外接四边形,进而通过仿射变换完成遮光板区域矫正;最后,利用最小二乘估计每个遮光板的姿态方向,实现对倾斜遮光板的识别定位。
2.如权利要求1所述的方法,其特征在于,具体包括以下步骤:
步骤一,构建深度残差神经网络模型,所述深度残差神经网络模型包括主干特征提取网络、空洞空间池化金字塔模块、后处理模块、二次点预测模块;
将高分辨相机采集的高速路上遮光板图像输入至残差神经网络模型,由神经网络模型输出特征图,然后对输出特征图进行2倍双线性插值,得到粗预测图;在得到粗预测图上挑选出N个不确定性最高的点,并对于每个不确定性最高点获取其表征向量,该表征向量由低层特征向量和高层特征向量组成;其中,低层特征向量通过在粗预测图的特征向量图上进行双线性插值获得,高层特征向量即为不确定点在粗预测图上的特征向量,然后使用一个小的神经网络对表征向量计算得到更新的粗预测图;将预测结果替换粗糙预测结果中的不稳定值,不断重复上述步骤,直到输出结果尺寸与原图大小一致;
步骤二,计算遮光板区域的凸包,具体计算方法如下:
1)假设每个遮光板边缘区域是由n个像素组成,构成了集合E,且E={Pk|k=1,2,…,n},首先以集合E左下角像素P1为起点,然后将其它边缘像素Pk,k=2,3,…,n与P1进行连线,计算连线与水平方向的夹角,并按照夹角大小排序;
2)排序后的像素
Figure FDA0003342240990000011
集合为
Figure FDA0003342240990000012
针对
Figure FDA0003342240990000013
中像素
Figure FDA0003342240990000014
Figure FDA0003342240990000015
顺时针转向
Figure FDA0003342240990000016
说明
Figure FDA0003342240990000017
是凸包顶点,保留像素
Figure FDA0003342240990000018
否则,从
Figure FDA0003342240990000019
中删除像素
Figure FDA00033422409900000110
直到
Figure FDA00033422409900000111
中所有像素都被遍历且判决,最终保留下来的就是二维凸包的顶点;
3)对像素集合
Figure FDA00033422409900000112
中的所有像素,得到遮光板区域的二维凸包;
步骤三,基于最小二乘姿态估计的遮光板倾斜识别,具体识别方法如下:
1)假设一幅图像中共有m个遮光板,其中第j个遮光板的中心线为二维空间中一条直线,根据均方误差构建误差目标函数
Figure FDA00033422409900000113
Figure FDA0003342240990000021
其中,
Figure FDA0003342240990000022
为第j条直线截距,
Figure FDA0003342240990000023
为第j条直线斜率,j∈{1,2,...,m},xk和yk分别为第k个边缘像素的横坐标和纵坐标;
2)采用最小二乘法确定使得
Figure FDA0003342240990000024
取最小值的最优解参数
Figure FDA0003342240990000025
计算遮光板方向θj;遍历图像中的m个遮光板,并生成遮光板姿态方向集合Ω={θ12,...,θj};
3)当集合Ω内θj满足以下条件时,则判定第j个遮光板倾斜,并构建倾斜遮光板对应的位置索引集合U:
Figure FDA0003342240990000026
其中τ为阈值,
Figure FDA0003342240990000027
CN202111312548.6A 2021-11-08 2021-11-08 基于深度语义分割网络和图像矫正的高速路遮光板倾斜识别方法 Pending CN114155518A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111312548.6A CN114155518A (zh) 2021-11-08 2021-11-08 基于深度语义分割网络和图像矫正的高速路遮光板倾斜识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111312548.6A CN114155518A (zh) 2021-11-08 2021-11-08 基于深度语义分割网络和图像矫正的高速路遮光板倾斜识别方法

Publications (1)

Publication Number Publication Date
CN114155518A true CN114155518A (zh) 2022-03-08

Family

ID=80459111

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111312548.6A Pending CN114155518A (zh) 2021-11-08 2021-11-08 基于深度语义分割网络和图像矫正的高速路遮光板倾斜识别方法

Country Status (1)

Country Link
CN (1) CN114155518A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114565771A (zh) * 2022-04-29 2022-05-31 广东粤港澳大湾区硬科技创新研究院 一种道路两侧设施的缺陷检测方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001243456A (ja) * 2000-02-29 2001-09-07 Toshiba Corp 障害物検出装置及び障害物検出方法
US20110157178A1 (en) * 2009-12-28 2011-06-30 Cuneyt Oncel Tuzel Method and System for Determining Poses of Objects
US20190057507A1 (en) * 2017-08-18 2019-02-21 Samsung Electronics Co., Ltd. System and method for semantic segmentation of images
CN112036324A (zh) * 2020-09-01 2020-12-04 扬州大学 一种用于复杂多人场景的人体姿态判定方法及***
AU2020103901A4 (en) * 2020-12-04 2021-02-11 Chongqing Normal University Image Semantic Segmentation Method Based on Deep Full Convolutional Network and Conditional Random Field
CN112686956A (zh) * 2020-12-28 2021-04-20 南京杰迈视讯科技有限公司 一种城市道路信号灯杆倾斜故障的检测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001243456A (ja) * 2000-02-29 2001-09-07 Toshiba Corp 障害物検出装置及び障害物検出方法
US20110157178A1 (en) * 2009-12-28 2011-06-30 Cuneyt Oncel Tuzel Method and System for Determining Poses of Objects
US20190057507A1 (en) * 2017-08-18 2019-02-21 Samsung Electronics Co., Ltd. System and method for semantic segmentation of images
CN112036324A (zh) * 2020-09-01 2020-12-04 扬州大学 一种用于复杂多人场景的人体姿态判定方法及***
AU2020103901A4 (en) * 2020-12-04 2021-02-11 Chongqing Normal University Image Semantic Segmentation Method Based on Deep Full Convolutional Network and Conditional Random Field
CN112686956A (zh) * 2020-12-28 2021-04-20 南京杰迈视讯科技有限公司 一种城市道路信号灯杆倾斜故障的检测方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114565771A (zh) * 2022-04-29 2022-05-31 广东粤港澳大湾区硬科技创新研究院 一种道路两侧设施的缺陷检测方法及装置

Similar Documents

Publication Publication Date Title
CN109977812B (zh) 一种基于深度学习的车载视频目标检测方法
CN111368687B (zh) 一种基于目标检测和语义分割的人行道车辆违停检测方法
CN110348445B (zh) 一种融合空洞卷积和边缘信息的实例分割方法
CN106778659B (zh) 一种车牌识别方法及装置
CN111709416A (zh) 车牌定位方法、装置、***及存储介质
CN103903018A (zh) 一种复杂场景中对车牌进行定位的方法和***
CN112883948B (zh) 一种语义分割与边缘检测模型建立及护栏异常监测方法
CN107808524B (zh) 一种基于无人机的道路交叉口车辆检测方法
CN115063786A (zh) 一种高位远景模糊车牌检测方法
CN114049572A (zh) 识别小目标的检测方法
CN113538453A (zh) 基于语义分割的红外图像光伏组件视觉识别方法
CN114596316A (zh) 一种基于语义分割的道路图像细节抓取方法
CN114519819B (zh) 一种基于全局上下文感知的遥感图像目标检测方法
CN117037103A (zh) 一种道路检测方法和装置
CN113158954B (zh) 交通非现场的基于ai技术的斑马线区域自动检测方法
CN101369312A (zh) 检测图像中交叉口的方法和设备
CN114155518A (zh) 基于深度语义分割网络和图像矫正的高速路遮光板倾斜识别方法
CN112801021B (zh) 基于多级语义信息的车道线检测方法及***
CN111325724B (zh) 隧道裂纹区域检测方法和装置
CN117294818A (zh) 一种用于机场施工的工地全景监控方法
CN114494893B (zh) 基于语义重用上下文特征金字塔的遥感图像特征提取方法
JP4963824B2 (ja) 変化領域抽出装置及び変化領域抽出方法
CN113963265A (zh) 一种复杂遥感陆地环境小样本小目标快速检测识别方法
CN106909936B (zh) 一种基于双车辆可变形部件模型的车辆检测方法
CN111640071A (zh) 基于卷积神经网络修复帧差法获取全景前景目标的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination