CN105989614B

CN105989614B - 融合多源视觉信息的危险物体检测方法

Info

Publication number: CN105989614B
Application number: CN201510080128.8A
Authority: CN
Inventors: 袁媛; 王�琦; 房建武
Original assignee: XiAn Institute of Optics and Precision Mechanics of CAS
Current assignee: XiAn Institute of Optics and Precision Mechanics of CAS
Priority date: 2015-02-13
Filing date: 2015-02-13
Publication date: 2020-09-01
Anticipated expiration: 2035-02-13
Also published as: CN105989614A

Abstract

本发明提供一种融合多源视觉信息的危险物体检测方法，包括以下步骤：1】多源视觉影像采集；2】增量式运动一致性考量；3】多源视觉信息融合；4】计算检测率。该融合多源视觉信息的危险物体检测方法，解决了现有技术中危险物体检测类别有限、缺乏多种信息有效利用的技术问题。

Description

融合多源视觉信息的危险物体检测方法

技术领域

本发明属于计算机视觉、图像理解领域，具体涉及一种在视频监控中融合多源视觉信息的危险物体检测方法。

背景技术

在行车过程中自动预测可能出现的危险物体是视频监控中的关键技术。通常情况下，由于复杂的物体种类、多变的监控环境、剧烈的相机抖动，使得危险物体检测变得十分困难。目前，对于危险物体的检测方法主要分成两大类：

一是基于检测器的方法，这种方法是利用手动采集的行人或车辆样本事先训练好行人或车辆检测器，然后在监控视频中进行相应目标的检测。Xu等人在文献“Y.Xu,D.Xu,S.Lin,T.Han,X.Cao,and X.Li.Detection of Sudden Pedestrian Crossings forDriving Assistance Systems.IEEE Transactions on Systems,Man,and Cybernetics,Part B:Cybernetics,42(3):729–739,2012”提出了一种横跨道路的行人检测方法。该文献新颖地利用部分行人样本进行训练，从而使得行人在刚被发现时就可以检测出来。Rezaei和Terauchi在文献“M.Rezaei and M.Terauchi.Vehicle Detection Based on Multi-feature Clues and Dempster-shafer Fusion Theory.In Proceedings of Pacific-RimSymposium on Image and Video Technology,2013,pp.60–72”中提出一种融合多特征和Dempster-shafer技术的车辆检测方法。虽然这些方法可以在一定程度上进行危险物体检测，但其不足之处是都需要额外的训练样本，且不能覆盖所有的出现在车辆前方的物体。

二是基于显著性和颜色特征融合的方法，这种方法将心理学中的注意力选择机制利用显著性检测的方式引入到危险检测中来。比如Alonso等人在文献“J.Alonso,E.R.Vidal,A.Rotter,and M.Muhlenberg.Lane-change Decision Aid System Based onMotion-driven Vehicle Tracking.IEEE Transactions on Vehicular Technology,57(5):2736–2746,2008”中提出一种融合运动显著性和颜色特征的车辆检测方法。该方法存在的不足之处是只考虑了视场一侧的运动显著性，而在真正的驾驶过程中，危险物体出现的位置是不定的，也就是拍摄的左右侧视野均可能出现危险物体。

发明内容

本发明提出一种新的融合多源视觉信息的危险物体检测方法，解决了现有技术中危险物体检测类别有限、缺乏多种信息有效利用的技术问题。

本发明的技术解决方案是：

一种融合多源视觉信息的危险物体检测方法，包括以下步骤：

1】多源视觉影像采集：

1.1】使用多光谱相机实时获得彩***影像和近红外视频影像；

1.2】利用单序列深度恢复方法获得与彩***影像相对应的深度影像；

1.3】利用相关性光流方法获得与彩***影像相对应的运动影像；

1.4】利用线性迭代聚类方法分割运动影像中的每一帧图像，得到超像素网格；

1.5】将超像素网格叠加到彩***影像、近红外视频影像和深度影像上；

2】增量式运动一致性考量：

2.1】将运动影像分界为左侧运动视频帧和右侧运动视频帧，分界线为运动影像中轴线；

2.2】利用初始F帧分割得到的超像素运动模式，训练正常运动模式基A，包括左侧正常运动模式基A^l和右侧正常运动模式基A^r；其中F的取值范围为5-20；

2.3】在t时刻，所有通道的图像被分割成N个超像素，计算运动图像中N个超像素所对应的特征yⁱ，其中i＝1:N；

2.4】构建图正则的最小软阈值均方目标式模型：

其中，U为构建的高斯-拉普拉斯误差项，Y为所有yⁱ组成的矩阵，X为所要求解的稀疏系数，L为拉普拉斯矩阵，λ₁为高斯-拉普拉斯噪声稀疏项约束系数，

为几何流行正则项约束系数；

2.5】得到运动影像的危险置信度值计算结果：

综合左右两侧计算结果：

其中，

β为左右两侧的误差平衡系数；

2.6】得到整个运动影像动信息考量下的危险置信度

将

的值利用最大-最小归一化方法归一化到[0,1]之间；

3】多源视觉信息融合：

3.1】利用基于图评测的显著性计算方法分别计算彩***影像、近红外视频影像和深度影像的显著性结果，得到彩***影像危险置信度S_t ^C、近红外视频影像危险置信度

和深度影像危险置信度

3.2】利用显著性贝叶斯模型

融合得到运动影像、彩***影像、近红外视频影像和深度影像危险置信度图

3.2.1】计算先验概率Pr(O)：

根据超像素特征在图像空间的出现频率得到元素分布图

其中OPT为元素分布图索引；则先验概率为

3.2.2】计算似然概率Pr(S(z)|O)：

将得到的

二值化，计算目标区域在对应原始视觉图像上的落入

中对应数值的像素数

计算背景区域在对应原始视觉图像上的落入

中对应数值的像素数

则目标及背景的似然概率为

3.3】计算所有视觉信息贝叶斯化后的融合概率：

其中，

4】计算检测率：

对每帧影像均重复执行步骤2】-步骤3】，直至整个视频影像被处理完毕；标记视频第t帧中真实的危险物体区域为G_t，检测率为：

TPR＝TP/P,

FPR＝FP/N.

其中，TP为检测正确的像素点个数，FP为检测错误的像素点个数，P为G_t中的目标像素点个数，N为G_t中背景像素点个数。

上述λ₁取值0.05，所述

取值0.005，所述β取值0.4。

上述步骤3.2.1】中的元素分布图索引OPT为：

上述步骤2.2】中的F取值为10。

本发明的优点在于：

本发明同时协同考虑了多源视觉信息的互补性和选择性，所得到的道路危险物体检测结果要明显优于其他的方法。

附图说明

图1为本发明融合多源视觉信息的危险物体检测方法流程图。

具体实施方式

参照图1，本发明实现的步骤如下：

步骤1，多源视觉影像采集模块。

(1a)利用多光谱相机实时获得彩色和近红外视频影像，然后利用单序列深度恢复方法获得对应彩***的深度影像，利用相关性光流方法获得对应彩***的运动影像。将运动影像利用线性迭代聚类(Simple Linear Iterative Clustering，简称SLIC)方法分割成指定数量的超像素图像，并将超像素网格叠加在近红外、深度、彩色图像上，以便于超像素特征计算。

步骤2，增量式运动一致性考量模块。

(2a)将运动图像分界成左右两个部分，分界线为运动图像中轴线；

(2b)利用初始10帧分割得到的超像素运动模式，分别训练左侧正常运动模式基A^l和右侧正常运动模式基A^r。利用图正则的最小软阈值均方增量式的方法考量驾驶员视野内的危险运动信息。由于左右两侧运动一致性考量方式相同，为了简洁起见，A^l和A^r以A指代。假设在t时刻，所有通道的图像被分割成N个超像素，计算运动图像中N个超像素所对应的特征y_i，i＝1:N，然后构建图正则的最小软阈值均方目标式模型：

U为构建的高斯-拉普拉斯误差项，Y为所有y_i组成的矩阵，X为所要求解的稀疏系数，L为拉普拉斯矩阵，λ₁(所有实例中取0.05)为高斯-拉普拉斯噪声稀疏项约束系数，

(所有实例中取0.005)为几何流行正则项约束稀疏。

(2c)得到运动影像的危险置信度值计算结果：

综合左右两侧计算结果：

其中

β为左右两侧的误差的平衡系数，所有实例中取0.4。得到整个运动影像动信息考量下的危险置信度

将

的值利用最大-最小归一化方法归一化到[0,1]之间。

步骤3，多源视觉信息融合模块。

(3a)利用文献“C.Yang,L.Zhang,H.Lu,X.Ruan,and M.Yang.Saliency Detectionvia Graph-based Manifold Ranking.In Proceedings of IEEE Conference onComputer Vision and Pattern Recognition,2013:3166–3173”中的方法计算彩色、近红外及深度通道图像的显著性结果，分别表示为

这些结果也可称为彩色、近红外及深度影像的危险置信度图。

(3b)利用显著性贝叶斯模型融合得到的运动、彩色、近红外、深度影像危险置信度图

显著性贝叶斯模型为：

1)计算先验概率Pr(O)。与以往的显著性融合方法不同，本发明利用一种更加有效的元素分布图

来估计这些视觉图像中包含危险目标的先验概率。其中元素分布图利用文献“F.Perazzi,P.

Y.Pritch,A.Hornung.Saliency filters:ContrastBased Filtering for Salient Region Detection.In Proceedings of IEEEConf.Computer Vision and Pattern Recognition,2012:733-740”计算得到。其是通过计算图像中待测超像素特征的空间方差变化，也就是计算待测超像素特征在图像其它位置的出现概率。由于元素分布图中值越大，物体性越小。则物体先验概率

而最优的元素分布图索引OPT为：

2)计算相似然概率Pr(S(z)|O)。将得到的

二值化，然后计算目标区域在对应原始视觉图像上的落入

中对应数值的像素数

同时计算背景区域在对应原始视觉图像上的落入

中对应数值的像素数

则目标及背景的似然概率为：

(3c)计算所有视觉信息贝叶斯化后的融合概率：

其中，

步骤4，计算检测率。

在影像中每帧执行步骤2和步骤3，直至整个视频被处理完毕。标记视频第t帧中真实的危险物体区域为Gt。则检测率为ROC曲线计算公式：

TPR＝TP/P,FPR＝FP/N.

其中TP为检测正确的像素点个数，FP为检测错误的像素点个数，P为G_t中的目标像素点个数，N为G_t中背景像素点个数。

一种对12段多源视频影像的处理流程，包括如下处理步骤：

1、确定仿真条件

本发明是在中央处理器为

i3-3240 3.3GHz CPU、内存4G、WINDOWS 7操作***上，运用MATLAB软件进行的仿真。

仿真中使用的数据为自主采集的12段真实道路场景视频序列。

2、仿真内容

按如下步骤用本发明方法进行危险目标检测：

首先，将计算到的运动影像、原始彩色影像、近红外影像和恢复出的深度影像同时输入***，执行步骤2和步骤3。

其次，将得到的每帧检测结果和真实标记的结果进行受试者可接受测试曲线和曲线下面积值计算结果如表1所示。

表1中的没有PAD字样的方法为直接多种信息点乘得到的结果，本实例中穷举了所有信息组合方式，它们分别是单个运动信息(M)，运动-彩色信息点乘(MC)，运动-近红外信息点乘(MI)，运动-深度信息点乘(MD)，运动-彩色-近红外信息点乘(MCI)，运动-彩色-深度信息点乘(MID)，运动-近红外-深度信息点乘(MID)，运动-彩色-近红外-深度信息点乘(MCID)。PAD-MCID表示基于本发明的方法。为得到的可视化结果图，其中，(a)为原始的彩色影像帧；(b)为真实结果；(c)-(k)分别对应表1中的M，MC，MI，MD，MCI，MCD，MID，MCID，PAD。从表1可见，本发明的识别率要明显高于简单相乘式信息融合方法。

表1 危险物体检测ROC曲线下面积值对比