CN112613427A

CN112613427A - 基于视觉信息流分区投射编码模型的道路障碍物检测方法

Info

Publication number: CN112613427A
Application number: CN202011578651.0A
Authority: CN
Inventors: 范影乐; 杨瑞; 武薇
Original assignee: Hangzhou Dianzi University
Current assignee: Hangzhou Dianzi University
Priority date: 2020-12-28
Filing date: 2020-12-28
Publication date: 2021-04-06
Anticipated expiration: 2040-12-28
Also published as: CN112613427B

Abstract

本发明涉及基于视觉信息流分区投射编码模型的道路障碍物检测方法。本发明首先在V1拓扑投射轮廓全局感知单元中构建平行视通路模型，对道路交通图的亮度边缘和颜色边缘实现并行提取，获取表征障碍物全貌特征的拓扑投射轮廓图和最优方位索引矩阵；然后在V4稀疏编码精细特征提取单元中构建视觉信息差增强模型，利用位置响应差和方位响应差对拓扑投射轮廓图进行对比度增强，得到细化轮廓图；接着提出自适应尺寸稀疏编码模型，根据细化轮廓图的稀疏程度实现对障碍物轮廓特征的智能聚焦，获取表征障碍物局部特征的池化图；最后模拟视皮层不同脑区间的反馈调控机制，利用池化图对跨视区的拓扑投射轮廓图进行修正，融合得到最终的障碍物轮廓外形结果。

Description

基于视觉信息流分区投射编码模型的道路障碍物检测方法

技术领域

本发明属于机器视觉领域，具体涉及一种基于视觉信息流分区投射编码模型的道路障碍物检测方法。

背景技术

道路障碍物检测任务是智能交通***的子任务之一，对于高速行驶的车辆来说，障碍物可分为行人、道路交通标识、山体落石、车辆遗撒物等多种形式。道路障碍物检测对于车辆安全行驶和交通有效管理具有重要意义。轮廓作为图像的低维空间特征，是对目标主体的一种有效表示方式。道路交通图中的障碍物轮廓获取有助于提高后续障碍物分类、识别等任务的快速性和准确性。

采用数学微分算子的传统图像处理技术检测到的轮廓往往包含大量纹理信息，无法将道路交通目标障碍物与复杂背景很好区分开来。随着生物视觉领域的研究成果大量涌现以及神经计算的飞速发展，基于仿生机制的目标感知方法受到了广泛关注。有研究采用二维Gabor能量模型模拟初级视皮层经典感受野对边缘线段的敏感特性，并利用高斯差分模型模拟非经典感受野的生理结构，提出了各向同性和各向异性的抑制方法，对纹理信息进行了有效抑制；另有研究对视通路中的颜色拮抗机制进行建模，实现了对彩色图像轮廓信息的有效提取。随后在此基础上利用改进后的稀疏度量方法进一步抑制纹理信息。上述轮廓检测方法虽然都利用不同的生物视觉机制对信息流在视通路中的处理过程进行建模，但简化了视通路中的信息流投射过程，同时也简化了高级视皮层对视觉信息的处理作用，仅仅在单一视通路建模的基础上对神经元的信息编码或反馈调控等生理特性进行了黑盒模拟，对于复杂背景下的道路障碍物目标而言，由于目标通常不具有结构化的轮廓外形，因此上述方法不利于障碍物目标的有效提取。

发明内容

本发明提出一种基于视觉信息流分区投射编码模型的道路障碍物检测方法。

本发明所提出的模型由V1拓扑投射轮廓全局感知单元和V4稀疏编码精细特征提取单元构成，分别模拟V1层的前级特性和V4层的编码特性。首先在V1拓扑投射轮廓全局感知单元中构建平行视通路模型，对道路交通图的亮度边缘和颜色边缘实现并行提取，在V1层获取表征障碍物全貌特征的拓扑投射轮廓图E(x,y)和最优方位索引矩阵Θ(x,y)；然后在V4稀疏编码精细特征提取单元中构建视觉信息差增强模型，分别利用位置响应差和方位响应差对拓扑投射轮廓图E(x,y)进行纹理抑制和轮廓增强，得到细化轮廓图E_t(x,y)；接着提出一种自适应尺寸稀疏编码模型，根据细化轮廓图E_t(x,y)的稀疏程度实现对障碍物轮廓特征的智能聚焦，在V4层获取表征障碍物局部特征的池化图E_s(x,y)；最后模拟视皮层不同脑区间的反馈调控机制，利用池化图E_s(x,y)对跨视区的拓扑投射轮廓图E(x,y)进行修正，融合得到最终的障碍物轮廓外形结果。

本发明相对于现有技术具有的效果：

本发明构建了一种平行视通路模型，模拟信息流分区投射特性对道路障碍物的轮廓进行初步感知。考虑到M型和P型神经节细胞对亮度信息流和颜色信息流的细节敏感差异性以及两类视觉信息流在初级视通路中的分区投射特性，在V1层前级构建平行视通路模型，对道路交通图的亮度边缘和颜色边缘分别进行提取，融合得到初级轮廓响应，该模型确保了道路交通图中障碍物轮廓信息感知的完整性。

本发明提出了一种视觉信息差增强模型，利用视觉感受野的生理特性对初级轮廓响应进行对比度增强。考虑到经典感受野的方位敏感特性，利用初级轮廓响应对应的最优方位信息和正交方位信息，计算方位响应差来增强轮廓像素点；利用经典感受野与非经典感受野的响应差异性，计算位置响应差来抑制纹理像素点。该模型通过增强对比度来对初级轮廓响应进行细化。

本发明提出了一种稀疏核尺寸自适应选取的稀疏编码新方法。考虑到视觉神经中枢在感知目标主体空间位置时的快速性和准确性，构建稀疏核尺寸自适应选取的稀疏编码模型，根据细化后的轮廓图中像素分布的稀疏程度来进行自适应选取稀疏核尺寸，对障碍物轮廓特征完成智能聚焦的同时进行信息去冗余化。相较于采用固定尺寸稀疏核进行稀疏编码的传统方法，本发明提出的自适应尺寸稀疏编码方法更符合生物视觉***对目标轮廓特征的动态聚焦特性。

提出了一种基于信息流分区投射编码模型的道路障碍物检测方法。首先模拟不同信息流的分区投射特性，构建平行视通路模型对道路交通图的亮度边缘和颜色边缘分别进行提取，并在V1层融合得到初级轮廓响应；然后利用视觉感受野的生理特性构建视觉信息差增强模型，通过位置响应差和方位响应差对初级轮廓响应进行细化；接着模拟视觉神经中枢对目标轮廓特征的动态聚焦特性，构建自适应尺寸稀疏编码模型，获取到池化图；最后模拟视皮层间的反馈调节机制，利用池化图对跨视区的初级轮廓响应进行修正，融合得到最终的障碍物轮廓外形结果。

附图说明

图1为本发明的道路障碍物检测方法流程图。

图2为感受野最优方位与正交方位示意图。

具体实施方式：

注：以E(x,y)为例进行说明，(x,y)代表图像E中像素的二维坐标位置，E(x,y)代表图像E中坐标位置(x,y)处的像素值，步骤中不再进行说明。

下面结合附图1，附图2来说明本发明的具体实施方式。

步骤(1)构建平行视通路模型，提取拓扑投射轮廓图E(x,y)和最优方位索引矩阵Θ(x,y)。针对待检测道路交通图，分解出其亮度分量I(x,y)和红、绿、蓝颜色分量R(x,y)、G(x,y)、B(x,y)，每个分量的行数和列数分别为m和n。平行视通路模型由亮度通路和颜色通路构成，分别对道路交通图的亮度边缘和颜色边缘进行提取。

步骤1.1亮度通路的数学模型如式(1)所示：

其中，σ、γ代表经典感受野的尺寸和椭圆率，默认值分别设置为2和0.5。

代表选择性方位，默认取等间隔的8个方位，即θ_i＝{0°,45°,90°,135°,180°,225°,270°,315°}，*代表卷积运算，e(x,y；θ_i)代表像素坐标为(x,y)，选择性方位为θ_i所对应的亮度分量边缘响应。

对于每个像素，选取所有选择性方位所对应亮度分量边缘响应的最大值，将其线性归一化后作为输出，同时记录对应的最优方位索引，获得亮度通路的轮廓响应E_L(x,y)和最优方位索引矩阵Θ_L(x,y)，如式(2)所示：

其中，N(·)代表线性归一化操作。

步骤1.2利用颜色拮抗机制对颜色通路进行建模，颜色通路分为R-on/G-off、G-on/R-off、B-on/Y-off、Y-on/B-off四种类型的拮抗通道，其中黄色分量Y(x,y)＝(R(x,y)+G(x,y))/2。以R-on/G-off类型拮抗通道为例进行说明。首先模拟视锥细胞的作用，将R(x,y)、G(x,y)分量分别经高斯滤波器(默认方差设置为1)处理，结果记为

然后计算单拮抗感受野的边缘响应，结果记为S_RG(x,y)，如式(3)所示：

接着模拟双拮抗感受野的作用，计算像素坐标(x,y)处，选择性方位为θ_i所对应的颜色分量边缘响应d_RG(x,y；θ_i)，如式(4)所示:

对于每个像素，选取所有选择性方位所对应颜色分量边缘响应的最大值，将其线性归一化后作为输出，同时记录对应的最优方位索引，获得R-on/G-off类型拮抗通道的边缘响应D_RG(x,y)和最优方位索引矩阵Θ_RG(x,y)，如式(5)所示:

与R-on/G-off类型拮抗通道的计算方式类似，其他三类拮抗通道的边缘响应D_GR、D_BY、D_YB和最优方位索引矩阵Θ_GR、Θ_BY、Θ_YB也可通过计算获得。对于每个像素坐标位置，取四类拮抗通道中边缘响应的最大值作为输出，同时记录对应的最优方位索引，获得颜色通路的轮廓响应E_C(x,y)和最优方位索引矩阵Θ_C(x,y),如式(6)所示：

步骤1.3分别将亮度通路与颜色通路的轮廓响应以及最优方位索引矩阵进行融合，模拟视皮层V1功能层的前级特性，获得拓扑投射轮廓图E(x,y)和最优方位索引矩阵Θ(x,y)。如式(7)所示：

步骤(2)构建视觉信息差增强模型,利用位置响应差和方位响应差对拓扑投射轮廓图E(x,y)进行对比度增强，得到细化轮廓图E_t(x,y)。首先，对于步骤(1)获得的拓扑投射轮廓图E(x,y)，分别利用高斯函数G(x,y；σ)和高斯差函数DoG⁺(x,y；σ)与E(x,y)卷积，获取经典感受野的视觉输入L_C(x,y；σ)和非经典感受野的视觉输入L_N(x,y；σ)，如式(8)所示：

其中，

式(8)中σ的默认值与式(1)中取值相同，对式中L_C(x,y；σ)和L_N(x,y；σ)进行差值运算，获得位置响应差ΔL(x,y；σ)，如式(10)所示:

ΔL(x,y；σ)＝max{L_C(x,y；σ)-L_N(x,y；σ),0} (10)

然后，计算拓扑投射轮廓图E(x,y)的正交方位索引矩阵Θ⁺(x,y)，如式(11)所示：

Θ⁺(x,y)＝(Θ(x,y)+2)mod 8 (11)

其中，mod表示取余数操作；步骤(1)获得的Θ(x,y)以索引的形式保存了像素坐标(x,y)处的最优方位信息，取值范围为{0,1,2,3,4,5,6,7}，{0,4}代表水平最优方位，{2,6}代表垂直最优方位，{1,5}代表正斜最优方位，{3,7}代表反斜最优方位；Θ⁺(x,y)代表与最优方位Θ(x,y)互补的正交方位，其中水平方位与垂直方位互补，左斜方位与右斜方位互补。最优方位与正交方位的示意关系如附图2所示。

对于拓扑投射轮廓图E中每个像素坐标(x,y)，将其二邻域像素值之和作为响应信息。分别计算最优方位响应O_Θ(x,y)和正交方位响应O_Θ+(x,y)，并对二者进行差值运算，获得方位响应差ΔO(x,y)，如式(12)所示：

最后，对E(x,y)进行对比度增强，获得细化轮廓图E_t(x,y)，如式(13)所示：

E_t(x,y)＝E(x,y)+E_enha(x,y)-E_inhi(x,y) (13)

其中，E_enha(x,y)代表方位响应差ΔO(x,y)线性归一化后的结果，用于增强轮廓像素点。E_inhi(x,y)代表位置响应差ΔL(x,y；σ)指数归一化后的结果，用于抑制背景像素点。

步骤(3)构建自适应尺寸稀疏编码模型，对细化轮廓图E_t(x,y)进行稀疏编码，获得池化图E_s(x,y)。对于步骤(2)获得的细化轮廓图E_t(x,y)，根据最大类间方差法计算自适应阈值thresh，进行二值化并统计轮廓像素所占比例proportion，如式(14)所示：

其中，

代表细化轮廓图二值化后的结果，count(·)操作用于统计二值图像

中像素值1的个数。

然后计算稀疏编码模型的稀疏核尺寸大小，为了简化计算，将稀疏核视窗形状选为方窗，视窗尺寸根据轮廓像素比例proportion大小进行自适应选取，如式(15)所示：

其中，w₁、w₂、w₃表示不同大小的稀疏核视窗尺寸。本发明设置w₁＝3、w₂＝5、w₃＝7。thresh1和thresh2是用来衡量细化轮廓图E_t稀疏程度的阈值参数，默认取值thresh1＝0.2，thresh2＝0.1。根据E_t中轮廓像素比例proportion和阈值参数的相对大小，对稀疏核视窗尺寸w_s进行自适应选取。稀疏编码前采用镜像对称法对细化轮廓图E_t进行边界像素填充。对于E_t中每个像素，计算以之为中心的视窗内所有像素的平均值，作为该像素点的稀疏编码输出，并以视窗尺寸作为视窗移动步长，实现视觉信息在空间上的稀疏表达，如式(16)所示：

其中，w、h分别为横向和纵向偏移量，w_s为稀疏核视窗尺寸大小，也是视窗移动步长；floor(·)表示向下取整函数，E_s(x,y)为稀疏处理后的池化图。

步骤(4)计算经过反馈修正后的障碍物轮廓外形结果T(x,y)。将步骤(3)获得的池化图E_s(x,y)跨视区反馈至V1视皮层，以调节系数的形式对步骤(1)获得的拓扑投射轮廓图E(x,y)进行修正，经过逐个像素点乘融合获得最终的障碍物轮廓外形结果T(x,y),如式(17)所示：

其中，resize(·)代表双线性插值操作，

为经过双线性插值操作放大后的稀疏精简图，尺寸与拓扑投射轮廓图相同。

Claims

1.基于视觉信息流分区投射编码模型的道路障碍物检测方法，其特征在于，该方法具体包括以下步骤：

步骤一：在V₁拓扑投射轮廓全局感知单元中构建平行视通路模型，对道路交通图的亮度边缘和颜色边缘实现并行提取，从而获取表征障碍物全貌特征的拓扑投射轮廓图E(x,y)和最优方位索引矩阵Θ(x,y)；

步骤二：在V₄稀疏编码精细特征提取单元中构建视觉信息差增强模型，分别利用位置响应差和方位响应差对拓扑投射轮廓图E(x,y)进行纹理抑制和轮廓增强，得到细化轮廓图E_t(x,y)；

步骤三：提出一种自适应尺寸稀疏编码模型，对细化轮廓图E_t(x,y)进行池化操作，根据图像特性实现对障碍物轮廓特征的智能聚焦，获取表征障碍物局部特征的池化图E_s(x,y)；

步骤四：模拟视皮层不同脑区间的反馈调控机制，利用池化图E_s(x,y)对跨视区的拓扑投射轮廓图E(x,y)进行修正，融合得到最终的障碍物轮廓外形结果T(x,y)。

2.根据权力要求1所述的基于视觉信息流分区投射编码模型的道路障碍物检测方法，其特征在于：所述步骤一：在V₁拓扑投射轮廓全局感知单元中构建平行视通路模型，对道路交通图的亮度边缘和颜色边缘实现并行提取，从而获取表征障碍物全貌特征的拓扑投射轮廓图E(x,y)和最优方位索引矩阵Θ(x,y)；具体为：

针对待检测道路交通图，分解出其亮度分量I(x,y)和红、绿、蓝颜色分量R(x,y)、G(x,y)、B(x,y)；每个分量的行数和列数分别为m和n；平行视通路模型由亮度通路和颜色通路构成，分别对道路交通图的亮度边缘和颜色边缘进行提取；

步骤1.1亮度通路的数学模型如式(1)所示：

其中，σ、γ代表经典感受野的尺寸和椭圆率，

θ∈[0，2π)代表选择性方位，取等间隔的8个方位，即θ_i＝{0°,45°,90°,135°,180°,225°,270°,315°}，*代表卷积运算，e(x,y；θ_i)代表像素坐标为(x,y)，选择性方位为θ_i所对应的亮度分量边缘响应；

其中，N(·)代表线性归一化操作；

步骤1.2利用颜色拮抗机制对颜色通路进行建模，颜色通路分为R-on/G-off、G-on/R-off、B-on/Y-off、Y-on/B-off四种类型的拮抗通道，其中黄色分量Y(x,y)＝(R(x,y)+G(x,y))/2；以R-on/G-off类型拮抗通道为例进行说明；首先模拟视锥细胞的作用，将R(x,y)、G(x,y)分量分别经高斯滤波器处理，结果记为

与R-on/G-off类型拮抗通道的计算方式相同，得到其他三类拮抗通道的边缘响应D_GR、D_BY、D_YB和最优方位索引矩阵Θ_GR、Θ_BY、Θ_YB；对于每个像素坐标位置，取四类拮抗通道中边缘响应的最大值作为输出，同时记录对应的最优方位索引，获得颜色通路的轮廓响应E_C(x,y)和最优方位索引矩阵Θ_C(x,y),如式(6)所示：

步骤1.3分别将亮度通路与颜色通路的轮廓响应以及最优方位索引矩阵进行融合，模拟视皮层V1功能层的前级特性，获得拓扑投射轮廓图E(x,y)和最优方位索引矩阵Θ(x,y)；如式(7)所示：

3.根据权力要求2所述的基于视觉信息流分区投射编码模型的道路障碍物检测方法，其特征在于：σ、γ依次设置为2和0.5。

4.根据权力要求2所述的基于视觉信息流分区投射编码模型的道路障碍物检测方法，其特征在于：所述步骤二：在V₄稀疏编码精细特征提取单元中构建视觉信息差增强模型，分别利用位置响应差和方位响应差对拓扑投射轮廓图E(x,y)进行纹理抑制和轮廓增强，得到细化轮廓图E_t(x,y)；具体为：

首先，对于步骤一获得的拓扑投射轮廓图E(x,y)，分别利用高斯函数G(x,y；σ)和高斯差函数DoG⁺(x,y；σ)与E(x,y)卷积，获取经典感受野的视觉输入L_C(x,y；σ)和非经典感受野的视觉输入L_N(x,y；σ)，如式(8)所示：

其中，

对式(8)中L_C(x,y；σ)和L_N(x,y；σ)进行差值运算，获得位置响应差ΔL(x,y；σ)，如式(10)所示:

ΔL(x,y；σ)＝max{L_C(x,y；σ)-L_N(x,y；σ),0} (10)

Θ⁺(x,y)＝(Θ(x,y)+2)mod 8 (11)

其中，mod表示取余数操作；步骤(1)获得的Θ(x,y)以索引的形式保存了像素坐标(x,y)处的最优方位信息，取值范围为{0,1,2,3,4,5,6,7}，{0,4}代表水平最优方位，{2,6}代表垂直最优方位，{1,5}代表正斜最优方位，{3,7}代表反斜最优方位；Θ⁺(x,y)代表与最优方位Θ(x,y)互补的正交方位，其中水平方位与垂直方位互补，左斜方位与右斜方位互补；

对于拓扑投射轮廓图E中每个像素坐标(x,y)，将其二邻域像素值之和作为响应信息；分别计算最优方位响应O_Θ(x,y)和正交方位响应

并对二者进行差值运算，获得方位响应差ΔO(x,y)，如式(12)所示：

E_t(x,y)＝E(x,y)+E_enha(x,y)-E_inhi(x,y) (13)

其中，E_enha(x,y)代表方位响应差ΔO(x,y)线性归一化后的结果，用于增强轮廓像素点；E_inhi(x,y)代表位置响应差ΔL(x,y；σ)指数归一化后的结果，用于抑制背景像素点。

5.根据权力要求4所述的基于视觉信息流分区投射编码模型的道路障碍物检测方法，其特征在于：σ设置为2。

6.根据权力要求4所述的基于视觉信息流分区投射编码模型的道路障碍物检测方法，其特征在于：所述步骤三：提出一种自适应尺寸稀疏编码模型，对细化轮廓图E_t(x,y)进行池化操作，根据图像特性实现对障碍物轮廓特征的智能聚焦，获取表征障碍物局部特征的池化图E_s(x,y)；具体为：

对于步骤二获得的细化轮廓图E_t(x,y)，根据最大类间方差法计算自适应阈值thresh，进行二值化并统计轮廓像素所占比例proportion，如式(14)所示：

其中，

中像素值1的个数；

其中，w₁、w₂、w₃表示不同大小的稀疏核视窗尺寸；thresh1和thresh2是用来衡量细化轮廓图E_t稀疏程度的阈值参数，根据E_t中轮廓像素比例proportion和阈值参数的相对大小，对稀疏核视窗尺寸w_s进行自适应选取；稀疏编码前采用镜像对称法对细化轮廓图E_t进行边界像素填充；对于E_t中每个像素，计算以之为中心的视窗内所有像素的平均值，作为该像素点的稀疏编码输出，并以视窗尺寸作为视窗移动步长，实现视觉信息在空间上的稀疏表达，如式(16)所示：

7.根据权力要求6所述的基于视觉信息流分区投射编码模型的道路障碍物检测方法，其特征在于：w₁＝3，w₂＝5，w₃＝7。

8.根据权力要求6所述的基于视觉信息流分区投射编码模型的道路障碍物检测方法，其特征在于：thresh1＝0.2，thresh2＝0.1。

9.根据权力要求6所述的基于视觉信息流分区投射编码模型的道路障碍物检测方法，其特征在于：所述步骤四：模拟视皮层不同脑区间的反馈调控机制，利用池化图E_s(x,y)对跨视区的拓扑投射轮廓图E(x,y)进行修正，融合得到最终的障碍物轮廓外形结果T(x,y)；具体为：

将步骤三获得的池化图E_s(x,y)跨视区反馈至V1视皮层，以调节系数的形式对步骤一获得的拓扑投射轮廓图E(x,y)进行修正，经过逐个像素点乘融合获得最终的障碍物轮廓外形结果T(x,y),如式(17)所示：

其中，resize(·)代表双线性插值操作，

为经过双线性插值操作放大后的池化图，尺寸与拓扑投射轮廓图相同。