CN105405138A - 基于显著性检测的水面目标跟踪方法 - Google Patents

基于显著性检测的水面目标跟踪方法 Download PDF

Info

Publication number
CN105405138A
CN105405138A CN201510761806.7A CN201510761806A CN105405138A CN 105405138 A CN105405138 A CN 105405138A CN 201510761806 A CN201510761806 A CN 201510761806A CN 105405138 A CN105405138 A CN 105405138A
Authority
CN
China
Prior art keywords
image
represent
water
sigma
water surface
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510761806.7A
Other languages
English (en)
Other versions
CN105405138B (zh
Inventor
王贺升
陈卫东
智绪浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN201510761806.7A priority Critical patent/CN105405138B/zh
Publication of CN105405138A publication Critical patent/CN105405138A/zh
Application granted granted Critical
Publication of CN105405138B publication Critical patent/CN105405138B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20092Interactive image processing based on input by user
    • G06T2207/20104Interactive definition of region of interest [ROI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30232Surveillance

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明提供了一种基于显著性检测的水面目标跟踪方法,特点是首先利用水岸线检测提供目标跟踪的ROI和位置验证信息,之后将增量编码长度作为衡量图像能量信息的指标,表示出图像中特征的稀有程度,利用水面特点和目标特征将显著特征图中的目标进行提取,从而完成水面目标跟踪算法。和常用的目标跟踪算法相比,本发明更加适用于水面目标跟踪,具有实时性优秀,光照自适应性的特点。

Description

基于显著性检测的水面目标跟踪方法
技术领域
本发明涉及,具体地,涉及基于显著性检测的水面目标跟踪方法,尤其是一种应用于水上图像捕捉和视频数据分析的视频目标跟踪方法。
背景技术
视频跟踪算法是以图像序列为输入,图像中目标的大小位置等属性为输出。理想情况下,输出的目标属性是准确和实时的,然而,在现实世界中,由于背景***,还有各种干扰的存在,往往很难达到理想状态,因此找到一种适应于当前环境的,对光照和背景变化有一定自适应性的实时性算法是目标跟踪的关键。
目前常用的算法有如下几种:
Meanshift算法,是一种利用颜色信息进行匹配固定大小区域的图像的方法,能够不依靠先验知识的情况下根据样本点计算出概率密度函数值,计算出目标区域和候选区域的相似度,计算出meanshift向量,不断进行候选区域的移动和迭代计算,直到寻找到目标或者达到迭代的次数限制。
背景差分法:是利用当前图像与背景图像的差分来识别运动目标的方法,其背景模型的获取和更新是该方法的关键技术。一种简单的获取背景图像的方法是当场景中无任何目标出现时捕获背景图像,这种人工的非自适应性方法获取的背景图像仅仅适用于短时间的视频监控。目前大多数算法已经放弃这种非自适应性的背景图像估计方法。当场景环境不是很复杂时,可以使用统计滤波完成场景中背景图像的估计,大多数情况下都可以得到正确的背景估计图像,但是当场景中有部分物体做无规则运动时,会引起场景中像素值的不断变化,从而引起估计误差。基于高斯统计模型的背景估计方法在有部分区域不断变化的场景中也能够比较准确的估计出背景模型,但是它的计算比较复杂,且无法满足实时性要求。
基于分类式的跟踪方法是将目标跟踪问题转换为一个连续目标检测问题,目标检测是通过分类器对不同图像区域进行分类为目标或者背景来实现。
水面上的视觉感知有其特殊的技术难点,水面上受光照影响比较大,同一天的不同时间,太阳光照的方向不一样,导致水面上的反光强度和方向都有所不同,而且不同天气对水面上光强的影响也是比较大,这要求视觉信息处理算法有较高的自适应性。在进行目标探测过程中,目标距离较远时,与背景区分度不足够大,所以需要进行图像的加强和滤波从而提取目标信息。
发明内容
针对现有技术中的缺陷以及水面特点,本发明的目的是提供一种基于显著性检测的水面目标跟踪方法,对于光照有着自适应性,且能够满足实时性要求。
本发明首先利用水岸线检测得到水岸线的具***置,从而能够提供物理环境信息,进而为目标的检测提供位置验证信息和ROI(regionofinterest,感兴趣区域)。利用稀疏字典对图像进行压缩感知,之后利用增量编码长度对于图像的稀有性进行衡量从而得到显著图特征。
根据本发明提供的一种基于显著性检测的水面目标跟踪方法,包括水岸线检测步骤;
所述水岸线检测步骤,包括如下步骤:
步骤A1:对图像进行降采样,得到降采样图像;
步骤A2:将经降采样得到的图像的颜色空间RGB空间转换到HSV空间;设定色调阈值T_h、饱和度阈值T_s、亮度阈值T_v;
将图像中色调分量h小于色调阈值T_h或者饱和度分量s小于饱和度阈值T_s的区域,判定为待区分水面或天空区域;
若所述待区分水面或天空区域的亮度分量v小于亮度阈值T_v,则将所述待区分水面或天空区域判定为水岸线区域,否则将所述待区分水面或天空区域判定为天空区域;
步骤A3:对水岸线区域图像进行边缘检测;
步骤A4:对检测到的边缘进行霍夫变换得到水岸线。
优选地,还包括显著性检测步骤;
所述显著性检测步骤,包括如下步骤:
步骤B1:根据水岸线得到显著性区域检测的感兴趣区ROI;
步骤B2:获取增量编码长度,计算公式如下:
ICL(pi)=-H(p)-pi-logpi-pilogpi
其中,ICL(pi)表示关于pi的增量编码长度;pi表示概率密度函数p的第i行,i的取值范围为[1,n];概率密度函数p定义为:p=|p1,p2,…,pn|T
H ( p ) = - Σ i = 1 n p i logp i
其中,H(p)为信息熵,n表示概率密度函数p的行数;
p i = Σ k | w i x k | Σ i Σ k | w i x k |
其中,k为正整数,取值范围是[1,192];wi∈W,i的取值范围为[0,192];W为滤波函数,W=A-1,A为感兴趣区ROI的稀疏基,W=[w1,w2,…,w192]T
xk∈X,X表示采样矩阵,X=[x1,x2,…,xk,…];采样矩阵X是感兴趣区ROI经过向量化的图像矩阵;
步骤B3:获取显著区域向量图M,计算公式如下:
M=[m1,m2,…,mn]
m k = Σ i ∈ S d i w i x k
其中,mk表示显著区域向量图M的第k列,k的取值范围为[1,n],n为显著区域向量图M的列数;S表示显著特征,S的全集是{1,2,…,n},S={i|ICL(pi)>0};
d i = I C L ( p i ) Σ j ∈ S I C L ( p j )
其中,pj表示概率密度函数p的第j列,j的取值范围为[1,n];ICL(pj)表示关于pj的增量编码长度;
步骤B4:将显著区域向量图M转换得到二维的图像矩阵M′作为显著矩阵检测图。
优选地,还包括目标提取步骤;
所述目标提取步骤,包括如下步骤:
步骤C1:对于当前帧,假设上一帧目标位置为Pn-1,当前显著矩阵检测图M′中总共有k个高亮区域,将第i个联通高亮区域标记为Wi,得到Wi中心点的位置坐标Pi,并得到Wi中像素的最大灰度值PIXi以及拥有最大灰度值PIXi的像素的位置信息Mi;其中,i=1,2,…,k;
步骤C2:针对每一个联通高亮区域Wi进行过滤,以过滤掉无效的高亮区域;设置如下过滤条件:
-定义最小像素个数Nmin,如果Wi的像素个数Ni小于Nmin,则将Wi进行过滤;
-定义最小灰度值PIXmin,如果Wi的最大灰度值PIXi小于PIXmin,则将Wi过滤;
-对Wi进行多边形近似,如果近似结果是一个凹多边形,那么将Wi过滤;
步骤C3:通过步骤C2过滤掉无效的高亮区域之后,将未过滤掉的各个Wi的中心点的位置坐标Pi和上一帧目标位置的距离Di进行计算:
D i = ( x i - x n - 1 ) 2 + ( y i - y n - 1 ) 2 ,
其中,xn-1表示上一帧目标位置的横坐标,yn-1表示上一帧目标位置的纵坐标,xi表示Wi的中心点位置的横坐标,yi表示Wi的中心点位置的纵坐标;
选取各个Di中的最小距离Dmin;
如果最小距离Dmin小于设定的最大距离阈值DT,则将当前拥有最小距离Dmin的联通高亮区域Wi认定为目标区域;
如果最小距离Dmin大于等于设定的最大距离阈值DT,则认为当前帧目标丢失,当前目标位置采用上一帧目标位置Pn-1。
优选地,色调阈值T_h=50,饱和度阈值T_s=30,亮度阈值T_v=180。
与现有技术相比,本发明具有如下的有益效果:
本发明在充分考虑水面图像特点的情况下,结合水岸线检测和显著性检测,应用到水面目标的跟踪。首先对原图像进行一个预处理和颜色空间转换,减小光照的影响,利用边缘检测算法和直线检测算法可以进行水岸线的提取,之后利用水岸线位置确定ROI,继续进行下一步的水面目标跟踪的工作。水面目标跟踪是利用增量编码长度表示显著信息,在显著图中进行无效信息过滤和目标提取,从而完成目标跟踪过程。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1是高斯金字塔;
图2是环形抑制区域,图中,r1表示内圆半径,r2表示外圆半径;
图3是水岸线检测流程;
图4是遍历算子;
图5是显著性计算流程;
图6是目标信息提取流程。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
本发明公开了一种基于显著性检测的水面目标跟踪算法,特点是首先利用水岸线检测提供目标跟踪的ROI和位置验证信息,之后将增量编码长度作为衡量图像能量信息的指标,表示出图像中特征的稀有程度,利用水面特点和目标特征将显著特征图中的目标进行提取,从而完成水面目标跟踪算法。和常用的目标跟踪算法相比,更加适用于水面目标跟踪,具有实时性优秀,光照自适应性的特点。
根据本发明提供的一种基于显著性检测的水面目标跟踪方法,包括水岸线检测步骤;
所述水岸线检测步骤,包括如下步骤:
步骤A1:对图像进行降采样,得到降采样图像;
步骤A2:将经降采样得到的图像的颜色空间RGB空间转换到HSV空间;设定色调阈值T_h、饱和度阈值T_s、亮度阈值T_v;
将图像中色调分量h小于色调阈值T_h或者饱和度分量s小于饱和度阈值T_s的区域,判定为待区分水面或天空区域;
若所述待区分水面或天空区域的亮度分量v小于亮度阈值T_v,则将所述待区分水面或天空区域判定为水岸线区域,否则将所述待区分水面或天空区域判定为天空区域;
步骤A3:对水岸线区域图像进行边缘检测;
步骤A4:对检测到的边缘进行霍夫变换得到水岸线。
所述基于显著性检测的水面目标跟踪方法,还包括显著性检测步骤;
所述显著性检测步骤,包括如下步骤:
步骤B1:根据水岸线可以得到显著性区域检测的感兴趣区ROI;由于水上目标不会出现在岸上,所以根据水岸线可以得到水面区域,作为显著性检测的ROI。
步骤B2:获取增量编码长度,计算公式如下:
ICL(pi)=-H(p)-pi-logpi-pilogpi
其中,ICL(pi)表示关于pi的增量编码长度;pi表示概率密度函数p的第i列,i的取值范围为[1,n];概率密度函数p定义为:p=|p1,p2,…,pn|T
H ( p ) = - Σ i = 1 n p i logp i
其中,H(p)为信息熵,n表示概率密度函数p的列数;
p i = Σ k | w i x k | Σ i Σ k | w i x k |
其中,k为正整数,取值范围是[1,192];wi∈W,i的取值范围为[0,192];W为滤波函数,W=A-1,A为感兴趣区ROI的稀疏基,W=[w1,w2,…,w192]T
xk∈X,X表示采样矩阵,X=[x1,x2,…,xk,…];采样矩阵X是感兴趣区ROI经过向量化的图像矩阵;
步骤B3:获取显著区域向量图M,计算公式如下:
M=[m1,m2,…,mn]
m k = Σ i ∈ S d i w i x k
其中,mk表示显著区域向量图M的第k列,k的取值范围为[1,n],n为显著区域向量图M的列数;S表示显著特征,S的全集是{1,2,…,n},S={i|ICL(pi)>0};
d i = I C L ( p i ) Σ j ∈ S I C L ( p j )
其中,pj表示概率密度函数p的第j列,j的取值范围为[1,n];ICL(pj)表示关于pj的增量编码长度;
步骤B4:将显著区域向量图M转换得到二维的图像矩阵M′作为显著矩阵检测图。
所述基于显著性检测的水面目标跟踪方法,还包括目标提取步骤;
所述目标提取步骤,包括如下步骤:
步骤C1:对于当前帧,假设上一帧目标位置为Pn-1,当前显著矩阵检测图M′中总共有k个高亮区域,将第i个联通高亮区域标记为Wi,得到Wi中心点的位置坐标Pi,并得到Wi中像素的最大灰度值PIXi以及拥有最大灰度值PIXi的像素的位置信息Mi;其中,i=1,2,…,k;
步骤C2:针对每一个联通高亮区域Wi进行过滤,以过滤掉无效的高亮区域;设置如下过滤条件:
-定义最小像素个数Nmin,如果Wi的像素个数Ni小于Nmin,则将Wi进行过滤;
-定义最小灰度值PIXmin,如果Wi的最大灰度值PIXi小于PIXmin,则将Wi过滤;
-对Wi进行多边形近似,如果近似结果是一个凹多边形,那么将Wi过滤;
步骤C3:通过步骤C2过滤掉无效的高亮区域之后,将未过滤掉的各个Wi的中心点的位置坐标Pi和上一帧目标位置的距离Di进行计算:
D i = ( x i - x n - 1 ) 2 + ( y i - y n - 1 ) 2 ,
其中,xn-1表示上一帧目标位置的横坐标,yn-1表示上一帧目标位置的纵坐标,xi表示Wi的中心点位置的横坐标,yi表示Wi的中心点位置的纵坐标;
选取各个Di中的最小距离Dmin;
如果最小距离Dmin小于设定的最大距离阈值DT,则将当前拥有最小距离Dmin的联通高亮区域Wi认定为目标区域;
如果最小距离Dmin大于等于设定的最大距离阈值DT,则认为当前帧目标丢失,当前目标位置采用上一帧目标位置Pn-1。
在优选例中,所述步骤A1包括如下步骤:
构建图像预处理高斯金字塔。高斯金字塔构建过程分为两个部分,一个部分是对图像进行不同尺度的高斯模糊,另一个部分就是对图像做降采样,如图1所示,第一层为原图像,行列尺寸大小为W*H,W、H为正整数,从第二层图像开始,每一层图像的分辨率都是前一层图像的四分之一,第i层图像分辨率为(W/2i,H/2i)。
高斯金字塔能够有效对图像进行降采样,保证图像原有信息得到最高质量的压缩。例如,输入原图像分辨率为1920*1080,为了同时满足计算的实时性要求和计算精度,采用第4层高斯金字塔图像,将图像分辨率降低到240*135。
在优选例中,所述步骤A2包括如下步骤:
颜色空间转换。将图像的颜色空间从RGB空间转换到HSV空间,具体转换公式如下所示:
s = 0 i f m a x = 0 m a x - m i n m a x = 1 - min max , o t h e r w i s e
v=max
其中,h表示色调分量,max表示RGB颜色空间中R,G,B三种分量的最大者,min表示RGB颜色空间中R,G,B三种分量的最小者,r表示红色分量,g表示绿色分量,b表示蓝色分量,s表示饱和度分量,v表示亮度分量。
实际应用过程中,利用opencv库中的cvtColor函数就可以实现颜色空间的转换。
设定色调阈值T_h=50,饱和度阈值T_s=30,对于图像中色调分量h小于色调阈值T_h或者饱和度分量s小于饱和度阈值T_s的区域,判定为待区分水面或天空区域。设定亮度阈值T_v=180,若所述待区分水面或天空区域的亮度分量v小于亮度阈值T_v,则判定为水岸线区域,若所述待区分水面或天空区域的亮度分量v大于等于亮度阈值T_v,则判定为天空区域。得到二值水岸线区域图像。水岸线区域优选地是包括岸上景物、水岸线以及水面倒影的区域。
在优选例中,对于图像中的非零像素点进行逐行的统计,第i行的非零像素点个数为Ni,如果Ni>80,判定为水岸线区域,从而进一步精确ROI。
在优选例中,在步骤A2与步骤A3之间执行中值滤波处理步骤,具体包括:
中值滤波处理步骤。利用中值滤波对步骤A2得到的二值水岸线区域图像过滤脉冲噪声,公式如下:
g(x,y)=median{f(x-i,y-j)}(i,j)∈W
其中,g表示中值滤波处理之后的图像,g(x,y)表示(x,y)位置的像素点的灰度值,median{·}表示取中值,x表示像素点横坐标,y表示像素点纵坐标,f表示滤波前的图像,f(x-i,y-j)表示(x-i,y-j)位置像素点的灰度值,W表示二维模板,优选地选取3*3模板,i表示二维模板横坐标,j表示二维模板纵坐标。
得到经过滤波的水岸线区域图像。
具体应用过程中,可以利用opencv库中的medianBlur函数进行中值滤波。
在优选例中,对水岸线区域图像进行边缘检测所采用算子可以是RobertsCross算子、Prewitt算子、Sobel算子、Kirsch算子、罗盘算子、Canny算子,Laplacian算子等等,还采用如下的改进的canny边缘检测,具体为:
对经过滤波的水岸线区域图像进行改进的canny边缘检测,具体为:
利用sobel算子对水岸线区域图像进行遍历,得到水岸线区域图像的梯度方向和梯度大小;
sobel算子如下:
s x = - 1 0 1 - 2 0 2 - 1 0 1 , s y = - 1 - 2 - 1 0 0 0 1 2 1
其中,sx表示横坐标方向上的算子,sy表示纵坐标方向上的算子。
梯度的大小和梯度方向的计算公式如下:
gx=(m6+2m7+m8)-(m0+2m1+m2)
gy=(m2+2m5+m8)-(m0+2m3+m6)
M = m 0 m 1 m 2 m 3 m 4 m 5 m 6 m 7 m 8
G [ i , j ] = g x 2 + g y 2
其中,G[i,j]表示水岸线区域图像(i,j)位置像素的梯度大小,i表示水岸线区域图像横坐标,j表示水岸线区域图像纵坐标;m0~m8表示水岸线区域图像对应sobel算子位置处的像素点灰度值;gx表示水平方向梯度大小,gy表示垂直方向梯度大小,M表示图像中3*3区域像素点集合。
定义权重函数
w σ = H ( DoG σ ( x , y ) ) | | H ( DoG σ ) | | 1
DoGσ(x,y)=g(x,y)-gσ(x,y)
H ( z ) = 0 , z < 0 z , z &GreaterEqual; 0
g &sigma; ( x , y ) = 1 2 &pi;&sigma; 2 exp ( - x 2 + y 2 2 &sigma; 2 )
g 4 &sigma; ( x , y ) = 1 2 &pi; ( 4 &sigma; ) 2 exp ( - x 2 + y 2 2 ( 4 &sigma; ) 2 )
wσ表示权重函数,g(x,y)表示二维高斯函数,σ表示尺度参数,‖‖1表示L1范数,DoGσ表示所有DoGσ(x,y)所组成的向量,‖H(DoGσ)‖1表示所有DoGσ(x,y)绝对值之和;gσ(x,y),g(x,y)分别表示尺度参数为σ,4σ的二维高斯函数,z表示有理数,H(z)表示z小于0时取0,z大于0时取z,DoGσ(x,y),表示尺度参数分别为4σ、σ的二维高斯函数相减,x表示像素点水平坐标,y表示像素点垂直方向坐标。
得到水岸线区域之后可以进行一个边缘检测,针对边缘检测容易检测到无效边缘的特点,可以进行一个纹理抑制的改进,在二维高斯函数确定的一个圆环区域内进行一个相似纹理的抑制,关于相似纹理的判断,可以利用该像素点的梯度大小和方向进行界定。
利用上述公式可以进行一个周围纹理抑制,对于当前像素点,如果和邻域圆环内其它像素点的梯度大小和方向近似,就予以抑制。得到经过纹理抑制后的水岸线图像。
其中‖.‖为L1范数。定义半径r1和r2,如图2所示。在半径为r1的圆内,DoGσ(x,y)<0,其权重wσ为0,具体σ=1,r1=2σ,r2=4r1
在优选例中,利用opencv库中的Canny()函数进行边缘检测,低阈值采取100,高阈值采取400。
在优选例中,在步骤A3与步骤A4之间执行边缘信息过滤步骤,具体如下:
设计7个算子进行经过纹理抑制后的水岸线图像的遍历,可以减少图像的无效边缘。
分别为: 0 0 0 1 1 1 0 0 0 0 0 1 1 1 0 0 0 0 1 0 0 0 1 1 0 0 0 0 1 0 1 0 1 0 0 0
0 0 0 1 0 1 0 1 0 0 0 0 1 1 0 0 0 1 0 0 0 0 1 1 1 0 0
在优选例中,步骤A4包括如下步骤:
霍夫变换
ρ=xcosθ+ysinθ
其中,ρ表示原点到经过(x,y)点直线的几何垂直距离,θ表示垂线与x轴夹角;可以把图像的像素点从(x,y)空间转换到(ρ,θ)空间,对经过纹理抑制后的水岸线图像中的每一个像素点(x,y)来说,以一个确定的角度间隔Δθ计算θ从-180°到180°的相应ρ,从而变换到参数空间(ρ,θ),对参数空间(ρ,θ)中的像素点个数进行投票累计,从投票累计个数就可以得出最长直线。考虑到水岸线与水平线的夹角的绝对值一般不会超过30°,本文对霍夫变换的检测范围作出调整,θ的计算范围为-30°到30°。
在优选例中,利用Opnecv的HoughLines进行hough变换,从图像中进行直线的提取,识别出水岸线。
在优选例中,所述显著性检测步骤,包括如下步骤:
首先利用稀疏字典对图像进行稀疏特征表示,设A为稀疏基,ai为第i个基函数。设W为滤波函数,W=A-1,上标-1表示稀疏基A求逆,W=[w1,w2,…,w192]T,每一行的wj,j=1,2,…,192,可以看作是对待处理图像集合的线性滤波器。
图像的稀疏表示s可以看作是对所有线性滤波器wj的响应。给出一幅图像的向量化表示x,可以表示为s=Wx。
增量编码长度是一种符合人的视觉特征的显著性表示方法,能够使得***能量分配达到最佳。
定义pi为第i个基函数对于采样矩阵X=[x1,x2,…,xk,…]的响应,其中采样矩阵X是经过向量化的图像矩阵。可以得出pi为:
p i = &Sigma; k | w i x k | &Sigma; i &Sigma; k | w i x k |
其中,k为正整数,取值范围是[1,192],wi∈W,xk∈X,i为正整数,i的取值范围为[0,192]。
对于基函数关于图像响应的概率密度函数p可以定义为:p=|p1,p2,…,pn|T。定义p的信息熵为H(p),离散信息熵计算公式为:
H ( p ) = - &Sigma; i = 1 n p i logp i
其中,H(p)为信息熵,n表示概率密度函数p的列数。
下面计算信息熵函数的增量:
&part; H ( p ) &part; p i = - &part; p i logp 1 &part; p i - &part; &Sigma; j &NotEqual; i p i logp j &part; p i = - 1 - logp i - &part; &Sigma; j &NotEqual; i p i logp j &part; p i
其中:pj表示概率密度函数p的第j列,j的取值范围为[1,n];pi表示概率密度函数p的第i列,i的取值范围为[1,n];
&part; &Sigma; j &NotEqual; i p i logp j &part; p i = H ( p ) - 1 + p i + p i logp i
由此可以得出,增量编码长度ICL为:
I C L ( p i ) = &part; H ( p ) &part; p i = - H ( p ) - p i - logp i - p i logp i
其中,ICL(pi)表示关于pi的增量编码长度。
定义显著特征S,S的全集是{1,2,…,n},S={i|ICL(pi)>0}。定义通过第i个显著特征S得到的能量为di,如果当前特征S0不属于显著特征,那么定义
d i = I C L ( p i ) &Sigma; j &Element; S I C L ( p j )
其中,dk表示不属于显著特征的特征,k为正整数,取值范围是S的补集;
最后给定一个图像X=[x1,x2,…,xn],可以量化得到显著区域向量图M,M=[m1,m2,…,mn]其中:
m k = &Sigma; i &Element; S d i w i x k
其中,mk表示显著区域向量图的第k列,k的取值范围为[1,n]。
为了将该显著区域图转换到图像中显示,需要进行一个归一化的处理。首先对于显著区域图向量M,对每一个元素求取绝对值,之后转换到[0,1…,255]域,之后再把向量化的显著区域图转换到二维的图像矩阵M′,该图像M′就是最终的显著矩阵检测图。
更为具体地:
第一步,将ROI作为处理图像,进行归一化为0-1范围内的double类型,是进行0-255int类型线性归一化到0-1double类型。
第二步,将二维图像转化为向量形式。转化方式如下:用一个8*8大小的算子对图像进行从上到下,自左向右的遍历取点,对于每一次取出的8*8的矩阵,按照从左向右,自上而下的方式填充到向量当中。
第三步,进行稀疏特征表示,设A为稀疏基,ai为ith个基函数。设W=A-1为滤波函数,W=[w1,w2,…,w192]T,每一行的wj可以看作是对图像集合的线性滤波器。图像的稀疏表示s可以看作是对所有线性滤波器wj的响应。给出一幅图像的向量化表示x,可以表示为s=Wx。与转化为一维向量的图像进行矩阵相乘,得到概率密度函数p。
利用GPU并行运算提高矩阵相乘的效率,节省计算时间。具体做法如下:利用CUDA并行计算架构,安装Cublas基础线性子程序库。
首先调用cublasCreat()函数对Cublas进行初始化处理。之后利用cudaMemcpy()函数,将内存中定义的矩阵和图像向量进行矩阵相乘。最后采用cudaMalloc()函数,将两个矩阵输入,进行计算得到概率密度函数。
第四步,计算增量编码长度。
I C L ( p i ) = &part; H ( p ) &part; p i = - H ( p ) - p i - logp i - p i logp i
第五步,能量计算。定义显著特征S,S={i|ICL(pi)>0}.定义通过每个显著特征得到的能量为di,如果该特征不属于显著特征,那么定义
d i = I C L ( p i ) &Sigma; j &Element; S I C L ( p j )
第六步,向量进行矩阵化,转化为二维图像。
第七步,给定一个图像X=[x1,x2,…,xn],可以量化得到显著区域图M=[m1,m2,…,mn]其中:
m k = &Sigma; i &Element; S d i w i x k
在优选例中,所述信息提取步骤,包括如下步骤:
需要对显著矩阵检测图M′做一个信息的提取,假设上一帧目标位置为Pn-1,当前显著矩阵检测图中总共有k个高亮区域,每一个联通高亮区域标记为Wi,对每一个Wi进行逐像素的统计和分析,得到高亮区域的像素个数Ni得出Wi的最边缘像素的位置信息,从而得出当前高亮区域中心点的位置坐标Pi,另外统计拥有最大灰度值的像素的位置信息Mi和最大灰度值PIXi。
对高亮区域Wi进行分析,设置如下过滤条件:定义最小像素个数Nmin,如果Wi的像素个数Ni<Nmin,将其进行过滤;定义最小灰度值PIXmin,如果Wi的最大灰度值PIXi<PIXmin,将其过滤;对Wi进行多边形近似,如果近似结果是一个凹多边形,那么将其过滤。
在过滤掉无效的高亮区域信息之后,将过滤剩下的Wi的中心点位置Pi和上一帧的目标位置进行距离计算:选取其中最小距离Dmin,如果其小于设定的最大距离阈值DT,当前拥有和前一帧目标最小距离的高亮区域Wi被认定为目标区域,如果其中最小距离Dmin大于最大距离阈值DT,那么认为当前帧目标丢失,当前目标位置采用上一帧的位置Pn-1。具体流程如图6所示。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。

Claims (4)

1.一种基于显著性检测的水面目标跟踪方法,其特征在于,包括水岸线检测步骤;
所述水岸线检测步骤,包括如下步骤:
步骤A1:对图像进行降采样,得到降采样图像;
步骤A2:将经降采样得到的图像的颜色空间RGB空间转换到HSV空间;设定色调阈值T_h、饱和度阈值T_s、亮度阈值T_v;
将图像中色调分量h小于色调阈值T_h或者饱和度分量s小于饱和度阈值T_s的区域,判定为待区分水面或天空区域;
若所述待区分水面或天空区域的亮度分量v小于亮度阈值T_v,则将所述待区分水面或天空区域判定为水岸线区域,否则将所述待区分水面或天空区域判定为天空区域;
步骤A3:对水岸线区域图像进行边缘检测;
步骤A4:对检测到的边缘进行霍夫变换得到水岸线。
2.根据权利要求1所述的基于显著性检测的水面目标跟踪方法,其特征在于,还包括显著性检测步骤;
所述显著性检测步骤,包括如下步骤:
步骤B1:根据水岸线得到显著性区域检测的感兴趣区ROI;
步骤B2:获取增量编码长度,计算公式如下:
ICL(pi)=-H(p)-pi-logpi-pilogpi
其中,ICL(pi)表示关于pi的增量编码长度;pi表示概率密度函数p的第i行,i的取值范围为[1,n];概率密度函数p定义为:p=|p1,p2,…,pn|T
H ( p ) = - &Sigma; i = 1 n p i logp i
其中,H(p)为信息熵,n表示概率密度函数p的行数;
p i = &Sigma; k | w i x k | &Sigma; i &Sigma; k | w i x k |
其中,k为正整数,取值范围是[1,192];wi∈W,i的取值范围为[0,192];W为滤波函数,W=A-1,A为感兴趣区ROI的稀疏基,W=[w1,w2,…,w192]T
xk∈X,X表示采样矩阵,X=[x1,x2,…,xk,…];采样矩阵X是感兴趣区ROI经过向量化的图像矩阵;
步骤B3:获取显著区域向量图M,计算公式如下:
M=[m1,m2,…,mn]
m k = &Sigma; i &Element; S d i w i x k
其中,mk表示显著区域向量图M的第k列,k的取值范围为[1,n],n为显著区域向量图M的列数;S表示显著特征,S的全集是{1,2,…,n},S={i|ICL(pi)>0};
d i = I C L ( p i ) &Sigma; j &Element; S I C L ( p j )
其中,pj表示概率密度函数p的第j列,j的取值范围为[1,n];ICL(pj)表示关于pj的增量编码长度;
步骤B4:将显著区域向量图M转换得到二维的图像矩阵M′作为显著矩阵检测图。
3.根据权利要求1或2所述的基于显著性检测的水面目标跟踪方法,其特征在于,还包括目标提取步骤;
所述目标提取步骤,包括如下步骤:
步骤C1:对于当前帧,假设上一帧目标位置为Pn-1,当前显著矩阵检测图M′中总共有k个高亮区域,将第i个联通高亮区域标记为Wi,得到Wi中心点的位置坐标Pi,并得到Wi中像素的最大灰度值PIXi以及拥有最大灰度值PIXi的像素的位置信息Mi;其中,i=1,2,…,k;
步骤C2:针对每一个联通高亮区域Wi进行过滤,以过滤掉无效的高亮区域;设置如下过滤条件:
-定义最小像素个数Nmin,如果Wi的像素个数Ni小于Nmin,则将Wi进行过滤;
-定义最小灰度值PIXmin,如果Wi的最大灰度值PIXi小于PIXmin,则将Wi过滤;
-对Wi进行多边形近似,如果近似结果是一个凹多边形,那么将Wi过滤;
步骤C3:通过步骤C2过滤掉无效的高亮区域之后,将未过滤掉的各个Wi的中心点的位置坐标Pi和上一帧目标位置的距离Di进行计算:
D i = ( x i - x n - 1 ) 2 + ( y i - y n - 1 ) 2 ,
其中,xn-1表示上一帧目标位置的横坐标,yn-1表示上一帧目标位置的纵坐标,xi表示Wi的中心点位置的横坐标,yi表示Wi的中心点位置的纵坐标;
选取各个Di中的最小距离Dmin;
如果最小距离Dmin小于设定的最大距离阈值DT,则将当前拥有最小距离Dmin的联通高亮区域Wi认定为目标区域;
如果最小距离Dmin大于等于设定的最大距离阈值DT,则认为当前帧目标丢失,当前目标位置采用上一帧目标位置Pn-1。
4.根据权利要求1所述的基于显著性检测的水面目标跟踪方法,其特征在于,色调阈值T_h=50,饱和度阈值T_s=30,亮度阈值T_v=180。
CN201510761806.7A 2015-11-10 2015-11-10 基于显著性检测的水面目标跟踪方法 Active CN105405138B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510761806.7A CN105405138B (zh) 2015-11-10 2015-11-10 基于显著性检测的水面目标跟踪方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510761806.7A CN105405138B (zh) 2015-11-10 2015-11-10 基于显著性检测的水面目标跟踪方法

Publications (2)

Publication Number Publication Date
CN105405138A true CN105405138A (zh) 2016-03-16
CN105405138B CN105405138B (zh) 2018-05-29

Family

ID=55470605

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510761806.7A Active CN105405138B (zh) 2015-11-10 2015-11-10 基于显著性检测的水面目标跟踪方法

Country Status (1)

Country Link
CN (1) CN105405138B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105893957A (zh) * 2016-03-30 2016-08-24 上海交通大学 基于视觉湖面船只检测识别与跟踪方法
CN106251355A (zh) * 2016-08-03 2016-12-21 江苏大学 一种融合可见光图像与对应夜视红外图像的检测方法
CN106846365A (zh) * 2016-12-30 2017-06-13 中国科学院上海高等研究院 基于his空间的目标跟踪方法
CN107609537A (zh) * 2017-10-09 2018-01-19 上海海事大学 一种基于hsv空间水面图像特征的水岸线检测方法
CN109477607A (zh) * 2016-06-06 2019-03-15 深圳市大疆灵眸科技有限公司 用于跟踪的图像处理
CN111814509A (zh) * 2019-04-10 2020-10-23 杭州海康威视数字技术股份有限公司 一种物品定位方法、装置及监控***
US11106928B2 (en) 2016-06-06 2021-08-31 Sz Dji Osmo Technology Co., Ltd. Carrier-assisted tracking

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7391907B1 (en) * 2004-10-01 2008-06-24 Objectvideo, Inc. Spurious object detection in a video surveillance system
CN101604383A (zh) * 2009-07-24 2009-12-16 哈尔滨工业大学 一种基于红外图像的海上目标检测方法
CN102054275A (zh) * 2010-12-13 2011-05-11 中国科学院长春光学精密机械与物理研究所 灰度图像海天线实时检测方法
CN102279973A (zh) * 2010-06-11 2011-12-14 中国兵器工业第二○五研究所 基于高梯度关键点的海天线检测方法
CN103679694A (zh) * 2013-05-29 2014-03-26 哈尔滨工程大学 一种基于全景视觉的舰船小目标检测方法
CN103927751A (zh) * 2014-04-18 2014-07-16 哈尔滨工程大学 基于梯度信息融合的水面光视觉图像目标区域检测方法
CN104700405A (zh) * 2015-03-05 2015-06-10 苏州科达科技股份有限公司 一种前景检测方法和***

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7391907B1 (en) * 2004-10-01 2008-06-24 Objectvideo, Inc. Spurious object detection in a video surveillance system
CN101604383A (zh) * 2009-07-24 2009-12-16 哈尔滨工业大学 一种基于红外图像的海上目标检测方法
CN102279973A (zh) * 2010-06-11 2011-12-14 中国兵器工业第二○五研究所 基于高梯度关键点的海天线检测方法
CN102054275A (zh) * 2010-12-13 2011-05-11 中国科学院长春光学精密机械与物理研究所 灰度图像海天线实时检测方法
CN103679694A (zh) * 2013-05-29 2014-03-26 哈尔滨工程大学 一种基于全景视觉的舰船小目标检测方法
CN103927751A (zh) * 2014-04-18 2014-07-16 哈尔滨工程大学 基于梯度信息融合的水面光视觉图像目标区域检测方法
CN104700405A (zh) * 2015-03-05 2015-06-10 苏州科达科技股份有限公司 一种前景检测方法和***

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
YUSUF SABER、MATTHEW KYAN: "HIGH RESOLUTION BIOLOGICALLY INSPIRED SALIENT REGION DETECTION", 《IMAGE PROCESSING》 *
王大志: "倒影图像检测", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
贺俊: "基于视觉注意机制的物体显著性研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
钱晓亮 等: "一种基于加权稀疏编码的频域视觉显著性检测算法", 《电子学报》 *
黄银君、陶青川: "自然场景下水体目标提取算法研究", 《通信技术》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105893957A (zh) * 2016-03-30 2016-08-24 上海交通大学 基于视觉湖面船只检测识别与跟踪方法
CN105893957B (zh) * 2016-03-30 2019-03-22 上海交通大学 基于视觉湖面船只检测识别与跟踪方法
US10902609B2 (en) 2016-06-06 2021-01-26 Sz Dji Osmo Technology Co., Ltd. Image processing for tracking
CN109477607A (zh) * 2016-06-06 2019-03-15 深圳市大疆灵眸科技有限公司 用于跟踪的图像处理
US11568626B2 (en) 2016-06-06 2023-01-31 Sz Dji Osmo Technology Co., Ltd. Carrier-assisted tracking
US11106928B2 (en) 2016-06-06 2021-08-31 Sz Dji Osmo Technology Co., Ltd. Carrier-assisted tracking
CN106251355A (zh) * 2016-08-03 2016-12-21 江苏大学 一种融合可见光图像与对应夜视红外图像的检测方法
CN106251355B (zh) * 2016-08-03 2018-12-14 江苏大学 一种融合可见光图像与对应夜视红外图像的检测方法
CN106846365A (zh) * 2016-12-30 2017-06-13 中国科学院上海高等研究院 基于his空间的目标跟踪方法
CN106846365B (zh) * 2016-12-30 2020-02-07 中国科学院上海高等研究院 基于his空间的目标跟踪方法
CN107609537A (zh) * 2017-10-09 2018-01-19 上海海事大学 一种基于hsv空间水面图像特征的水岸线检测方法
CN107609537B (zh) * 2017-10-09 2020-12-29 上海海事大学 一种基于hsv空间水面图像特征的水岸线检测方法
CN111814509A (zh) * 2019-04-10 2020-10-23 杭州海康威视数字技术股份有限公司 一种物品定位方法、装置及监控***
CN111814509B (zh) * 2019-04-10 2023-09-29 杭州海康威视数字技术股份有限公司 一种物品定位方法、装置及监控***

Also Published As

Publication number Publication date
CN105405138B (zh) 2018-05-29

Similar Documents

Publication Publication Date Title
CN108573276B (zh) 一种基于高分辨率遥感影像的变化检测方法
EP3614308B1 (en) Joint deep learning for land cover and land use classification
CN105405138A (zh) 基于显著性检测的水面目标跟踪方法
CN106250895B (zh) 一种光学遥感图像感兴趣区域检测方法
CN109446992A (zh) 基于深度学习的遥感影像建筑物提取方法及***、存储介质、电子设备
CN107038416B (zh) 一种基于二值图像改进型hog特征的行人检测方法
CN105740945A (zh) 一种基于视频分析的人群计数方法
CN103605953A (zh) 基于滑窗搜索的车辆兴趣目标检测方法
CN110929593A (zh) 一种基于细节辨别区别的实时显著性行人检测方法
CN110287798B (zh) 基于特征模块化和上下文融合的矢量网络行人检测方法
CN111027497B (zh) 基于高分辨率光学遥感影像的弱小目标快速检测方法
CN109635726B (zh) 一种基于对称式深度网络结合多尺度池化的滑坡识别方法
CN107992856B (zh) 城市场景下的高分遥感建筑物阴影检测方法
CN104657717A (zh) 一种基于分层核稀疏表示的行人检测方法
CN110033431A (zh) 钢桥表面锈蚀区域检测的非接触式检测装置及检测方法
CN110991444A (zh) 面向复杂场景的车牌识别方法及装置
CN106056078B (zh) 一种基于多特征回归式集成学习的人群密度估计方法
CN112560717A (zh) 一种基于深度学习的车道线检测方法
CN102254162B (zh) 基于最小直线比率的sar图像机场跑道检测方法
CN105354547A (zh) 一种结合纹理和彩色特征的行人检测方法
CN106407975B (zh) 基于空间-光谱结构约束的多尺度分层目标检测方法
Zuo et al. A remote sensing image semantic segmentation method by combining deformable convolution with conditional random fields
CN114332644A (zh) 一种基于视频卫星数据的大视场交通密度获取方法
CN104063682A (zh) 一种基于边缘分级和centrist特征的行人检测方法
CN103455798B (zh) 基于最大几何流向直方图的人体检测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant