CN1825959A - 一种基于自适应多步搜索的图像跟踪算法 - Google Patents

一种基于自适应多步搜索的图像跟踪算法 Download PDF

Info

Publication number
CN1825959A
CN1825959A CN 200610024304 CN200610024304A CN1825959A CN 1825959 A CN1825959 A CN 1825959A CN 200610024304 CN200610024304 CN 200610024304 CN 200610024304 A CN200610024304 A CN 200610024304A CN 1825959 A CN1825959 A CN 1825959A
Authority
CN
China
Prior art keywords
target
search
algorithm
hunting zone
ams
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 200610024304
Other languages
English (en)
Inventor
潘吉彦
胡波
张建秋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fudan University
Original Assignee
Fudan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fudan University filed Critical Fudan University
Priority to CN 200610024304 priority Critical patent/CN1825959A/zh
Publication of CN1825959A publication Critical patent/CN1825959A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明为一种基于自适应多步搜索算法的图像跟踪算法。本发明通过预测当前帧中目标可能的偏移量,动态地调整多步搜索算法的搜索范围。本发明的图像跟踪算法能够使得当目标的速度较大时,搜索范围能够覆盖目标可能出现的区域,不至于丢失目标;而当目标的速度较小时,搜索范围适当减小,以降低计算量,且减小陷入局部极值点的可能。实验证明,无论是在目标高速或低速运动情况下,本发明都具有较好的跟踪效果与较低的计算量。

Description

一种基于自适应多步搜索的图像跟踪算法
技术领域
本发明属于计算机视觉与模式分析技术领域,具体涉及一种基于自适应多步搜索的图像跟踪算法。
背景技术
图像跟踪***能够在一系列视频图像帧中识别并定位特定的目标,被广泛应用于机器人技术、制导技术、自动监视等大量领域中。
图像跟踪***最为常用的算法是基于块匹配的搜索算法(Block Matching Algorithm,BMA)[1][2]。该算法针对被跟踪目标建立模板,并在当前图像帧中寻找与模板具有最佳匹配的区域,作为当前帧中目标位置的估计,即
x tgt = arg max x ∈ Ω sim ( x ) - - - ( 1 )
其中x为候选区域的中心坐标;Ω为图像帧的坐标集合;sim(·)为位于某一坐标处的区域与模板之间的匹配程度函数,该区域与模板越匹配,函数值就越大;xtgt为当前帧中目标位置的估计。
由于一般而言视频的帧率都较高(20~30fps),目标在相邻两帧中的位置不会离得很远,因此为了减少计算量,对每一帧中目标的搜索都是在一个以上一帧中目标的位置为中心的某个邻域上进行的。即使是这样,如果搜索该邻域上的每一个点,计算量仍然十分巨大。例如搜索一个15×15的领域,需要进行255次匹配运算,这给实现实时跟踪造成了很大的困难。
在视频压缩领域的运动估计中,也遇到了类似的问题。为了在基本不影响搜索质量的前提下大幅度降低计算量,许多快速搜索算法被提了出来[3]。其中应用最为广泛的算法之一是三步搜索算法(Three Step Search,TSS)[3]。TSS算法的具体搜寻模式如图1所示。TSS算法的第一步以目标在前一帧中的位置为中心,计算中心点及其周围间隔为4像素距离的八个点的目标匹配程度;TSS算法的第二步以在第一步的九个点中匹配程度最高的那个点为中心,计算其周围间隔为2像素距离的八个点的目标匹配程度;TSS算法的第三步以在第二步所涉及的所有点中匹配程度最高的那个点为中心,计算其周围紧邻的八个点的目标匹配程度,第三步所涉及的所有点中匹配程度最高的那个点就认为是目标所在点。对于一个15×15的领域,TSS算法只需要进行25次匹配运算,节省了88.9%的计算量,而搜索质量下降很小。
然而,TSS算法是针对视频压缩的运动估计提出的。在视频压缩的运动估计中,并不需要精确地跟踪定位运动目标,因此固定的搜索范围(TSS算法为15×15)是可以接受的。然而,在图像跟踪中,目标的运动速度的变化可以非常大。当目标速度较大时,目标处于两帧的位置间隔可能超过15个像素,超过TSS算法的搜索范围;当目标速度很小时,如果背景较为复杂,TSS算法的搜索范围又过大,进行了许多不必要的匹配运算,并且有可能使得搜索陷入局部极值点。以上两种情况均会导致目标的丢失。
本发明提出了一种自适应多步搜索算法(Adaptive Multi-step Search,AMS),根据目标的运动速度动态地调整搜索范围。实验证明,AMS与TSS相比,无论是在目标高速或低速运动情况下,都具有较好的跟踪效果与较低的计算量。
参考文献
[1]C.Smith,C.Richards,S.Brandt,and N.Papanikolopoulos,“Visual tracking forintelligent vehicle-highway systems”,in IEEE Trans.on Vehicle Technology,1996.
[2]T.Kaneko,and O.Hori,“Template update criterion for template matching of imagesequences”,in Proceedings of 16th International Conference on Pattern Recognition,vol.2,pages 1-5,2002.
[3]Y.Wang,J.Ostermann,Y.Q.Zhang,“Video Processing and Communications”,pages159-161,Prentice Hall,2002.
发明内容
本发明的目的在于提出一种能够在目标速度较大时不会跟不上目标,在目标速度较小时大大节省计算量并增加跟踪稳定性的基于自适应多步搜索算法(AMS)的图像跟踪算法。
本发明提出的基于自适应多步搜索算法的图像跟踪算法,其步骤如下:当被跟踪目标的速度较大时,相应增大搜索范围,以保证其覆盖目标可能出现的区域;当被跟踪目标的速度较小时,则应该减小搜索范围,以减小计算量,同时降低搜索陷入局部极值的情况。具体来说,根据当前帧目标可能偏移量的预测值确定基于三步搜索算法(Three Step Search,TSS)[1]的自适应多步搜索算法的搜索范围。
本发明可通过改变第一步搜索点间距与搜索步数调节自适应多步搜索算法的搜索范围。
1、目标速度的估计
在图像跟踪中,目标的速度可以任意变化,但是由于一般视频的帧率较高,相邻帧的时间间隔很短(仅为1/30~1/20s),因此可以近似用匀速运动模型来预测目标在当前帧的速度。记目标在第n帧中的位置为x(n)=[xh(n),xv(v)]T,其中xh(n)与xv(n)分别为目标在第n帧中位置的横坐标与纵坐标。则目标在第n帧的速度近似为
v ( n ) ≈ x ( n ) - x ( n - 1 ) Δt - - - ( 2 )
其中Δt为相邻帧的时间间隔,v(n)=[vh(n),vv(n)]T是由水平方向的速度与垂直方向的速度组成的速度向量。
设当前帧为第c帧,则当前帧与前一帧的速度分别近似为
v ( c ) ≈ x ( c ) - x ( c - 1 ) Δt - - - ( 3 )
v ( c - 1 ) ≈ x ( c - 1 ) - x ( c - 2 ) Δt - - - ( 4 )
由匀加速的假设,当前帧的速度与前一帧的速度相等,即
                                 v(c)=v(c-1)                               (5)
将(3)、(4)式代入(5)式可得
                        x(c)-x(c-1)=Δx(c)≈x(c-1)-x(c-2)                  (6)
其中Δx(c)为当前帧中目标可能的偏离搜索起始点的位移向量。Δx(c)的幅值
d ( c ) = ( x h ( c - 1 ) - x h ( c - 2 ) ) 2 + ( x v ( c - 1 ) - x v ( c - 2 ) ) 2 - - - ( 7 )
即可作为确定搜索范围的依据。
2、自适应多步搜索算法(Adaptive Multi-step Search,AMS)
在得到了当前帧中目标可能的偏移量后,就可以设定在当前帧中搜索范围的大小。搜索范围以适当超过目标的可能偏移大小为宜,这样既能够覆盖目标可能到达的位置,又不会造成搜索范围过大。
AMS算法的搜索模式与TSS算法类似,但是可以动态调整搜索范围。要调整AMS算法的搜索范围,可以改变第一步搜索点的间距,同时搜索的步数也相应改变。由于每一步的搜索点间隔距离都减半,且最后一步的搜索点间隔为1个像素距离,因此第一步的搜索点间隔距离s1与搜索步数N之间的关系为
                               s1=2N-1                                     (8)
AMS搜索范围定义为AMS所能搜索到的点离开搜索中心的最远距离,即
R ( N ) = max p ∈ B N | | p - p c | | - - - ( 9 )
其中p为搜索点,pc为搜索中心,BN为搜索步数为N步时所有搜索点的集合,R(N)为对应于N步搜索的搜索范围。
由每一步搜索点的间隔都减半可知,AMS的搜索范围可以表达为
R ( N ) = s 1 + 1 2 s 1 + 1 2 2 s 1 + · · · + 1 2 N - 1 s 1 = ( 2 - 1 2 N - 1 ) s 1 - - - ( 10 )
将(8)式代入上式可得搜索范围与搜索步数的关系:
                                   R(N)=2N-1                        (11)
根据搜索范围适当超过目标可能偏移量的原则,可以定义搜索范围R、第一步搜索点间距s1、搜索步数N与目标可能偏移量d之间的关系如下:
          R=2N-1,s1=2N-1 当2N-1-1≤d≤2N-2,其中N=2,3,...      (12)
当d=0时,为了保险起见,搜索步数还是定为2,第一步搜索点间距为2,搜索范围为3。
对于常见的目标可能偏移量,其对应的AMS算法第一步搜索点间距、搜索范围与搜索步数列表如下:
  目标可能偏移量  AMS第一步搜索点间距   AMS搜索范围   AMS搜索步数
  0~2  2   3   2
  3~6  4   7   3
  7~14  8   15   4
  15~30  16   31   5
表1目标可能偏移量、AMS第一步搜索点间距、搜索范围与搜索步数关系表
在实际应用时,可以在得到了目标可能偏移量后利用查表方式(LUT)得到AMS算法的第一步搜索点间隔、搜索范围与搜索步数,几乎不增加任何计算量。
通过预测目标在当前帧的速度大小并据此动态调整搜索范围,能显著提高跟踪高速目标的效果,并降低跟踪低速目标的计算量。
附图说明
图1:三步搜索算法(TSS)示意图。
图2a:应用AMS算法的视频流1的第17帧截图。
图2b:应用AMS算法的视频流1的第25帧截图。
图2c:应用AMS算法的视频流1的第33帧截图。
图2d:应用AMS算法的视频流1的第36帧截图。
图3:视频流1的目标预测速度与实际速度曲线。
图4:视频流1的AMS算法搜索范围曲线。
图5a:应用TSS算法的视频流1的第17帧截图。
图5b:应用TSS算法的视频流1的第25帧截图。
图5c:应用TSS算法的视频流1的第33帧截图。
图5d:应用TSS算法的视频流1的第36帧截图。
图6a:应用AMS算法的视频流2的第1帧截图。
图6b:应用AMS算法的视频流2的第40帧截图。
图6c:应用AMS算法的视频流2的第90帧截图。
图6d:应用AMS算法的视频流2的第130帧截图。
图7:视频流1的目标预测速度与实际速度曲线。
图8:视频流1的AMS算法搜索范围曲线。
图9a:应用TSS算法的视频流2的第1帧截图。
图9b:应用TSS算法的视频流2的第40帧截图。
图9c:应用TSS算法的视频流2的第90帧截图。
图9d:应用TSS算法的视频流2的第130帧截图。
具体实施方式
下面通过对一些跟踪实例的仿真进一步介绍本发明的实施方式。仿真的平台是Matlab6.5。
1、将本发明应用于跟踪以较高速度运动并不断加速的目标(视频流1)。
视频流1中的跟踪目标是在空中飞行的飞碟。在第一帧中首先选定目标。在第二帧中,由于还没有可供预测的目标运动速度,因此假定搜索范围为15,以保证能够覆盖目标。在接下来的各帧中,根据(7)式预测目标的偏移量,并根据(12)式(或通过查询表1)确定AMS算法的搜索范围。
应用AMS算法的仿真结果如图2a至图2d以及图3、图4所示。其中图2a至图2d分别是跟踪视频的截图(分别为第17、25、33、36帧),图3是目标预测速度与实际速度曲线,图4是AMS算法搜索范围曲线。
由图2a至图2d可见,无论目标的速度如何变化,基于AMS的图像跟踪算法都取得了理想的跟踪效果。由图3可见,目标速度的预测误差很小,平均预测误差为0.87个像素距离,因此本发明所作的目标在帧间近似作匀速运动的假设是合理的。由图4可见,随着目标速度的增大,AMS的搜索范围也随着增大,保证了搜索范围对目标可能出现位置的覆盖。
作为对比,将AMS算法替换为TSS算法,再次对相同的目标进行跟踪。仿真结果如图5a至图5d所示。由这些图可见,当目标速度增达到一定程度时,超过了TSS算法的搜索范围,因而最终丢失了目标。
2、将本发明应用于跟踪低速运动的目标(视频流2)。
视频流2中的跟踪目标是在地面上缓慢行走的人。跟踪过程中目标选取与AMS搜索范围选择的原则同前例所述。
应用AMS算法的仿真结果如图6a至图6d以及图7、图8所示。其中图6a至图6d分别是跟踪视频的截图(分别为第1、40、90、130帧),图7是目标预测速度与实际速度曲线,图8是AMS算法搜索范围曲线。
由图7可见,目标的移动速度一直很低,速度预测误差很小,仅为0.77个像素距离。由图8可见,绝大多数的AMS搜索范围都是3。这样小的搜索范围一点也没有影响跟踪效果,这一点可以由图6a至图6d看出。不仅如此,由于搜索范围变小,大大节省了计算量。
作为对比,TSS算法的仿真结果如图9a至图9d所示。尽管其跟踪效果也不错,但是计算量大大上升。AMS算法的匹配操作总数为2335次,而TSS算法的匹配操作总数为3375次,增加了44.5%。
综上,基于AMS算法的图像跟踪算法根据预测的目标偏移量决定搜索范围的大小,与基于TSS算法的图像跟踪算法相比,跟踪高速目标的效果具有明显的提高,且能够最大程度地降低计算量。

Claims (4)

1、一种基于自适应多步搜索算法的图像跟踪算法,其特征在于当被跟踪目标的速度较大时,相应增大搜索范围,以保证其覆盖目标可能出现的区域;当被跟踪目标的速度较小时,则应该减小搜索范围,以减小计算量,同时降低搜索陷入局部极值的情况;并根据当前帧目标可能偏移量的预测值确定基于三步搜索算法的自适应多步搜索算法的搜索范围。
2、根据权利要求1所述的基于自适应多步搜索算法的图像跟踪算法,其特征在于通过改变第一步搜索点间距与搜索步数调节自适应多步搜索算法的搜索范围。
3、根据权利要求2所述的基于自适应多步搜索算法的图像跟踪算法,其特征在于搜索范围R、第一步搜索点间距sl、搜索步数N与目标可能偏移量d之间的关系如下:
R=2N-1,sl=2N-1    当2N-1-1≤d≤2N-2,其中N=2,3,…       (4)
当d=0时,搜索步数为2,第一步搜索点间距为2,搜索范围为3。
4、根据权利要求3所述的基于自适应多步搜索算法的图像跟踪算法,其特征在于目标可能偏移量、第一步搜索点间距、搜索范围与搜索步数列表如下:   目标可能偏移量  AMS第一步搜索点间距   AMS搜索范围   AMS搜索步数   0~2   2   3   2   3~6   4   7   3   7~14   8   15   4   15~30   16   31   5
CN 200610024304 2006-03-02 2006-03-02 一种基于自适应多步搜索的图像跟踪算法 Pending CN1825959A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200610024304 CN1825959A (zh) 2006-03-02 2006-03-02 一种基于自适应多步搜索的图像跟踪算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200610024304 CN1825959A (zh) 2006-03-02 2006-03-02 一种基于自适应多步搜索的图像跟踪算法

Publications (1)

Publication Number Publication Date
CN1825959A true CN1825959A (zh) 2006-08-30

Family

ID=36936349

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200610024304 Pending CN1825959A (zh) 2006-03-02 2006-03-02 一种基于自适应多步搜索的图像跟踪算法

Country Status (1)

Country Link
CN (1) CN1825959A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103553966A (zh) * 2007-09-11 2014-02-05 Gtx公司 选择性雄激素受体调节剂的固体形态
CN107403441A (zh) * 2016-05-19 2017-11-28 视辰信息科技(上海)有限公司 增强现实***的跟踪方法和终端设备
US9884038B2 (en) 2004-06-07 2018-02-06 University Of Tennessee Research Foundation Selective androgen receptor modulator and methods of use thereof
US9889110B2 (en) 2004-06-07 2018-02-13 University Of Tennessee Research Foundation Selective androgen receptor modulator for treating hormone-related conditions
US11090283B2 (en) 2007-09-11 2021-08-17 University Of Tennessee Research Foundation Solid forms of selective androgen receptor modulators

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9884038B2 (en) 2004-06-07 2018-02-06 University Of Tennessee Research Foundation Selective androgen receptor modulator and methods of use thereof
US9889110B2 (en) 2004-06-07 2018-02-13 University Of Tennessee Research Foundation Selective androgen receptor modulator for treating hormone-related conditions
US10053418B2 (en) 2004-06-07 2018-08-21 University Of Tennessee Research Foundation Selective androgen receptor modulator and methods of use thereof
US10662148B2 (en) 2004-06-07 2020-05-26 University Of Tennessee Research Foundation Selective androgen receptor modulator and methods of use thereof
CN103553966A (zh) * 2007-09-11 2014-02-05 Gtx公司 选择性雄激素受体调节剂的固体形态
CN103553966B (zh) * 2007-09-11 2016-09-07 Gtx公司 选择性雄激素受体调节剂的固体形态
US11090283B2 (en) 2007-09-11 2021-08-17 University Of Tennessee Research Foundation Solid forms of selective androgen receptor modulators
CN107403441A (zh) * 2016-05-19 2017-11-28 视辰信息科技(上海)有限公司 增强现实***的跟踪方法和终端设备
CN107403441B (zh) * 2016-05-19 2020-11-27 视辰信息科技(上海)有限公司 增强现实***的跟踪方法和终端设备

Similar Documents

Publication Publication Date Title
CN104796612B (zh) 高清雷达联动跟踪控制摄像***及联动跟踪方法
CN1825959A (zh) 一种基于自适应多步搜索的图像跟踪算法
CN1275470C (zh) 在帧速率转换时的帧内插方法及其设备
CN104036525B (zh) 一种自适应粒子群优化粒子滤波跟踪方法
CN103366362B (zh) 一种基于萤火虫优化算法的矿带图像分割法
CN100344937C (zh) 一种星***快速匹配识别方法
CN1811821A (zh) 基于自适应卡尔曼初始搜索位置选取的图像跟踪算法
CN103065331B (zh) 基于空时域边缘和颜色特征关联的目标跟踪方法
CN1402551A (zh) 自动跟踪移动目标的设备和方法
CN1300746C (zh) 基于多特征信息融合的视频运动目标自适应跟踪方法
CN1992911A (zh) 体育视频目标跟踪方法
CN107369164B (zh) 一种红外弱小目标的跟踪方法
CN105654515A (zh) 基于分片及多特征自适应融合的目标跟踪方法
CN1413057A (zh) 一种移动台位置的估计方法及装置
CN113344112B (zh) 一种基于聚类算法的动态物体识别方法
CN101661624A (zh) 运动跟踪方法及装置
CN105976385B (zh) 一种基于图像数据场的图像分割方法
CN1945595A (zh) 一种基于加权主动形状建模的人脸特征定位方法
CN110533692B (zh) 一种面向无人机航拍视频中移动目标的自动跟踪方法
CN111354016A (zh) 基于深度学习和差异值哈希的无人机舰船跟踪方法及***
CN112902981B (zh) 机器人导航方法和装置
CN1991864A (zh) 球门检测和基于球门检测的足球视频精彩事件检测方法
CN105930789A (zh) 基于对数欧式空间词袋模型的人体行为识别
CN111768427B (zh) 一种多运动目标跟踪方法、装置及存储介质
CN110660085B (zh) 一种适用于光电吊舱的实时视频图像运动目标检测与稳定跟踪方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication