CN102663769A - 基于主梯度方向特征的目标检测及姿态估计方法 - Google Patents

基于主梯度方向特征的目标检测及姿态估计方法 Download PDF

Info

Publication number
CN102663769A
CN102663769A CN2012100658106A CN201210065810A CN102663769A CN 102663769 A CN102663769 A CN 102663769A CN 2012100658106 A CN2012100658106 A CN 2012100658106A CN 201210065810 A CN201210065810 A CN 201210065810A CN 102663769 A CN102663769 A CN 102663769A
Authority
CN
China
Prior art keywords
template
gradient direction
picture
main gradient
target detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012100658106A
Other languages
English (en)
Inventor
卞亚涛
魏超
孔庆杰
刘允才
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN2012100658106A priority Critical patent/CN102663769A/zh
Publication of CN102663769A publication Critical patent/CN102663769A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

一种基于主梯度方向特征的目标检测及姿态估计方法,步骤包括:在模板训练阶段,通过对多角度模板图片进行旋转和尺度变换,进而对得到的模板图片集求取二进制的主梯度方向描述集,然后通过模板聚类加快检测阶段的搜索速度;在目标检测阶段,使用得到的模板主梯度方向描述集,扫描测试图片,进而在复杂环境下检测出目标物体并且对检测到的目标物体进行姿态估计。本发明方法对于遮挡,光照变化,复杂背景等干扰具有很好的鲁棒性,可以对以各种角度出现在测试图片中的物体进行检测,而且可以进一步估计被检测目标物体的姿态,克服了以往技术难以克服的难点,为现代化工业生产中刚性目标物体的鲁棒性快速检测及姿态估计提供一种可靠的方法。

Description

基于主梯度方向特征的目标检测及姿态估计方法
技术领域
本发明涉及一种利用机器视觉和图像处理技术,具体地涉及一种基于主梯度方向描述的复杂环境下目标检测及姿态估计方法。
背景技术
目标检测在工业中有广泛应用,基于计算机视觉的目标检测通过在视频或图像中匹配事先训练好的数据来检测目标。目前主流的目标检测算法大致可以分成两类:基于特征的目标检测和基于模板匹配的目标检测。Pedro F,Felzenszwalb等人在文章Object Detection with Disoriminatively Trained Part BasedModels(使用基于区分性训练部分模型的目标检测)中提出了一种使用潜在支持向量机(latent SVM)的目标检测方法。在文章Sparse distance learning for object recognition combining RGB and depthinformation(结合RGB和深度信息用于目标识别的稀疏距离学习)中,Kevin Lai等人使用图像的RGB和深度信息来改善目标检测的效果。Torralba在文章Sharing visual features for multiclass andinulti-view object detection(用于多类和多视角目标检测的共享视觉特征)中提出了一种共同推动过程(joint boosting prooedure)来强制特征共享,结果显示特征与目标物体的类别数成子线性(sub-linearly)增长。在文章Learning and using taxononies for fast visual categorization(用于快速视觉分类的学习和使用分类法)中,Griffin和Perona通过聚类一对其余(one-vs-the-rest)检测器的混淆矩阵(confusion metrix)来实施分类。
目标检测的目的是为了有效而紧凑地捕捉场景中感兴趣物体而去除其它不感兴趣的背景物体。一般根据检测目标的性质不同,可以分为刚体和非刚体目标检测。其中刚体检测主要是针对非变形体如金属零件的检测与识别,而非刚体检测主要包括变形物体,比如人体,以及瀑布、烟雾、火焰等流体。目前关于刚体目标检测主要有以下几个方面的难题:
●光线变化:不同场景下物体所接受的光线不同,可能有不同的照射情况。
●旋转变化:待检测的目标物体相对于训练模板可能有各种角度的旋转。
●尺度变化:待检测视频或图像中的物体与训练模板中的物体大小不同。
●部分遮挡:测试图片中的目标物体可能被其他物体遮挡,只有一部分显示在图片中。
●透视失真:三维目标物体可能以任意角度投影到二维图像上,造成不同角度的失真。
●复杂背景:一般训练图片只包含待检测物体本身,但实际情况通常比较复杂,会包含大量背景物体信息。
2010年S.Hinterstoisser等人在论文Dominant orientation templates for real-time detectionof texture-less objects(用于无纹理目标实时检测的主方向模板)中提出了主梯度方向模板(DOT)方法。这个方法首先将模板图像和待检测图像分解到规则格子上,模板图像和输入图像的相似度度量被表达为待检测图像的主梯度方向在模板图像中的比例。DOT的模板设计过程中包含了对小范围的位移的处理。如果场景中的物体有微小变化,比如微小的位移或旋转,对模板图像做类似的变换然后综合得到的模板将使得匹配过程不受这些因素的影响。
DOT虽然取得了显著的效果,但是仍然未能很好解决实际工业应用中的尺度变化,透视失真以及复杂背景问题,而且只能处理待检测目标物体的小范围平移。由于没有模板训练过程,DOT算法只能处理单一角度的一张模板图片,也即只能检测到目标物体一个特定角度下的图片,无法应对透视失真带来的挑战。
发明内容
本发明的目的在于针对实际应用中复杂环境下多视角目标检测问题中现有技术的不足,提出一种基于主梯度方向特征的目标检测及姿态估计方法。该方法能在背景环境十分复杂、目标物体被部分遮挡、目标物体表面纹理很少以及目标物体存在尺度变化的情况下,快速检测到各种视角下的目标物体并且对目标物体进行姿态估计。
本发明通过模板训练和目标检测两个阶段实现上
Figure BDA0000143085120000021
模板训练阶段。首先拍摄被检测物体不同角度的V张模板图片,然后对于每张模板图片旋转360度(每N0度为一个步长)。并进行N种尺度变化,共得到含有    张图片的模板图片集S,然后对S中的每张模板图片求出主梯度方向描述,得到主梯度方向模板集T1。接着使用汉明距离(hamming distance)作为度量准则对T1进行聚类,对于属于同一类的模板使用或操作(OR operation)得到类模板,它提供了分支定界约束搜索(branch and boundconstrained search)中的紧上界(tightupper bounds),这样得到聚类后的最强梯度模板集T2。最后存储T2至硬盘以在检测阶段使用。在目标检测阶段,首先从硬盘读取最强梯度模板集T2。给定一张测试图片I(test image),首先计算出其主梯度方向描述1。然后使用分支定界约束搜索策略,对T2中的每个主梯度方向模板t,使用t扫描i中的每个位置,得到在最优匹配位置Lt的最高匹配分数St。对于得到的所有St(t=1,2,…)进行排序,最高分数Smax对应的模板tmax即为对于测试图片的最优估计模板。由对应的最优匹配位置
Figure BDA0000143085120000022
得到目标物体在i中的位置,由对应的模板tmax的旋转角度θ及尺度变化系数λ得到目标物体估计姿态。
具体地,根据本发明的一个方面,一种基于主梯度方向特征的目标检测及姿态估计方法,包括如下步骤:模板训练阶段:
步骤TS1:拍摄被检测物体不同角度的V张模板图片;
步骤TS2:从上述V张图片中取出某个角度的一张图片;
步骤TS3:对这张模板图片旋转360度(每N0度为一个步长),并进行N种尺度变化,共得到含有张图片的模板图片
Figure BDA0000143085120000031
步骤TS4:对S中的每张模板图片O求出主梯度方向描述,得到主梯度方向模板集T1;
步骤TS5:使用汉明距离(hamming distance)作为度量准则对T1进行聚类,得到聚类后的最强梯度模板集T2;
步骤TS6:存储T2至硬盘以备检测阶段使用;
步骤TS7:若V张不同角度的模板图片已经处理完,停止:否则,转TS2。
优选地,所述步骤TS4包括如下步骤:
步骤TS41:对于每张模板图片O,对其实施小范围的平移变换M,M∈M,其中M是[-t,+t]2范围内的所有平移变换的集合,得到平移变换后的模板图片w(O,M),这一步可以使待求取的主梯度方向描述对于小范围平移鲁棒且可以减少目标检测阶段扫描位置的个数;
步骤TS42:将得到平移变换后的模板图片w(O,M)分割成若干大小为t×t的方形网格R,R的大小的选取要综合考虑运行速度和鲁棒性;
步骤TS43:对于每一个方形网格R,计算出离散化的梯度方向列表L(O,R);
步骤TS44:将每个离散化的梯度方向列表L(O,R)表示成一个字节形式,得到模板图片的二进制表示(binary representation),具体为一个8比特的整型二维数组;
优选地,所述步骤TS43中的梯度方向列表L(O,R)可以由如下公式计算得出:
L ( O , R ) = { o : ∃ M ∈ M such thato ∈ DO ( w ( O , M ) , R ) }
其中DO(w(O,M),R)返回平移变换后的模板图片w(O,M)中的方形网格R中的k个主梯度方向;
关于方形网格R中梯度方向的定义,为了正确处理物体的遮挡边界,相差180度的两个方向被看做是一个方向,这样,不管物体是处于深色背景还是浅色背景,都不会受到影响。这样的梯度方向又被离散化处理成n0=7个整数值。若方形网格R中的最大梯度值小于梯度阈值t,此方形网格被认为是均质区域(uniform region),此时用符号⊥表示此方形网格中没有可用的梯度信息,因此,DO(w(O,M),R)可以被正式地写成:
其中,
S(w(O,M),R)={ori(w(O,M),l):l∈max magk(R)∧mag(w(O,M),l)>τ}
其中:
·l是方形网格R中的像素位置;
·ori(w(O,M),l)是图片w(O,M)在l位置的梯度方向,mag(w(O,M),l)是其梯度大小;
·max magk(R)是方形网格中k个最强梯度的位置集合;
·τ是最小梯度阈值。
优选地,模板训练阶段所述步骤TS5包括如下步骤:
步骤TS51:从最强梯度模板集T1中随机选取一个没有被归为任何一类的模板作为第i类的聚类模板;
步骤TS52:迭代地搜寻满足如下条件的模板t
arg min t ∈ Chata max ( d h ( c or t , t ) , d h ( c or t , c ) )
其中:dh是汉明距离,″or″是按位或操作,c是进行或操作之前的聚类模板:
将得到的模板t加入第i类,修改第i类的聚类模板为c=cort;
步骤TS53:若T1中的模板已经全部聚类,停止;否则,转TS54;
步骤TS54:若第i类中的模板数未达到预设模板数k0,转TS52;否则,i=i+1,转TS51。
目标检测阶段:
步骤DS1:从硬盘读取聚类后的最强梯度模板集T2;
步骤DS2:读取一张测试图片I;
步骤DS3:计算出测试图片I的主梯度方向描述i;
步骤DS4:对聚类后的最强梯度模板集T2中的每个模板t,使用t扫描i中的每个位置,得到在最优匹配位置的最高匹配分数St,此位置记为Lt
步骤DS5:对得到的所有匹配分数进行排序,最高分数Smax对应的模板tmax即为对于测试图片的最优估计模板;
步骤DS6:由对应的最优匹配位置
Figure BDA0000143085120000042
得到目标物体在i中的位置,由对应的模板tmax的旋转角度θ及尺度变化系数λ得到目标物体估计姿态。
优选地,上述步骤DS3包括如下步骤:
步骤DS31:将测试图片I分割成若干大小为t×t的方形网格R,R的大小的选取要综合考虑运行速度和鲁棒性;
步骤DS32:对于每一个方形网格R,计算出离散化的主梯度方向do(I,R);
步骤DS33:将每个离散化的主梯度方向do(I,R)表示成一个字节形式,得到测试图片的二进制表示(binary representation),具体为一个8比特的整型二维数组。
优选地,上述步骤DS32中的主梯度方向do(I,R)通过下式计算:
Figure BDA0000143085120000051
其中:
S(I,R)={ori(I,l):l∈max mag(R)∧mag(I,l)>τ}
其中:
·l是方形网格R中的像素位置;
·ori(I,l)是图片I在l位置的梯度方向,mag(I,l)是梯度大小;
·max mag(R)是方形网格R中最强梯度的位置;
·τ是最小梯度阈值。
优选地,步骤DS4包括如下步骤:
步骤DS41:从T2中取一个模板t;
步骤DS42:从i的左上角开始扫描,对于每个位置p,使用下式计算匹配分数;
S ( i , t , p ) = Σ lint δ ( i [ p + l ] ⊗ t [ l ] )
其中:
·δ(P)是一个二值函数,若P≠0,返回1,其他情况返回0;
·p和l均为二维坐标位置。
·i[p+l]表示二维数组i的p+l位置处的字节数值,t[l]表示二维数组t的l位置处的字节数值。
·
Figure BDA0000143085120000061
表示按位与操作(bitwise AND operation)。
步骤DS43:对所有位置的匹配分数进行排序,得最优匹配位置Pt及相应匹配分数St
本发明采用基于主梯度方向的特征描述,在模板训练阶段,通过对多角度模板图片进行旋转和尺度变换,进而对得到的模板图片集求取二进制的主梯度方向描述集,然后通过模板聚类加快检测阶段的搜索速度。在目标检测阶段,使用得到的模板主梯度方向描述集,扫描测试图片,进而在复杂环境下检测出目标物体并且对检测到的目标物体进行姿态估计。实现了复杂背景环境,目标物体被遮挡以及目标物体缺少纹理情况下的鲁棒性目标检测,属于模式识别中的目标检测领域。
本发明与现有的目标检测方法相比的的显著优势在于,实现了复杂环境下目标物体的快速鲁棒检测,可将本技术应用到实际的金属零件等刚性产品的实际工业生产中,具有精确度高,鲁棒性强,耗时很少等优点。本检测方法对于遮挡,光照变化,复杂背景等干扰具有很好的鲁棒性,并且可以处理纹理较少甚至无纹理的物体的检测,可以对以各种角度出现在测试图片中的目标物体进行检测,而且可以进一步估计被检测目标物体的姿态,克服了以往技术难以克服的难点,真正做到了自动生产和实时检测,为现代化工业生产中刚性物体的鲁棒性快速检测提供了一种可靠的方法。
附图说明
图1是采用本发明方法的实施例;
图2是本发明模板训练阶段和目标检测阶段算法流程图;
图3是拍摄被检测物体不同角度的9张模板图片;
图4是得到的相应最强梯度模板图片;
图5是四种不同形状金属零件的测试图片;
图6是四种不同形状金属零件的测试结果。
具体实施方式
以下结合附图以及实施例对本发明的技术方案作进一步详细说明。以下实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和过程,但本发明的保护范围不限于下述的实施例。
如图1所示,是采用本发明方法所解决问题中的一些典型实施例,具体是用于金属零件精确检测及锈蚀程度估计中的结果图片。
如图2所示流程图,本发明所提供的基于主梯度方向描述的复杂环境下目标检测及姿态估计包括如下步骤,优选地在本发明的实现过程中可以使用C++语言进行编程:
模板训练阶段:
步骤TS1,拍摄被检测物体不同角度的V张模板图片:具体请参见图3。本实施例中我们测试了四种不同形状的金属零件的检测,由于篇幅有限,图3中只显示了一种零件A的9张不同角度的模板图片。
关于模板图片个数V的选取,要折中考虑检测鲁棒性以及运行速度。显然,更多角度的模板图片能带来对于不同角度的更好的鲁棒性,同时会带来目标检测阶段搜索模板数的显著增长。在本实施例中我们选取V=9。
步骤TS2:从上述V张图片中取出某个角度的一张图片;
步骤TS3:对于这张模板图片旋转360度(每N0度为一个步长),并进行N种尺度变化,共得到含有张图片的模板图片集S;
为了使检测结果对于目标物体的旋转以及尺度变化鲁棒,必须对每张模板图片进行旋转和尺度变化,这样做也同时可以对检测到的目标物体进行姿态估计。同模板图片个数V的选取类似,旋转步长N0的选取也要综合考虑鲁棒性以及运行速度:N0越小,对于旋转的描述越精细,耗时越长,在本实施例中我们选取N0=10。尺度变化个数的选取要根据具体的应用需要,在本实施例中我们选取N=3。
步骤TS4:对S中的每张模板图片O求出主梯度方向描述,得到主梯度方向模板集T1:
得到的最强梯度模板二进制表示图片如图4所示。模板图片中每个像素点对应于原图片的一个方形网格,用一个字节表示原方向网格内的若干主梯度方向。表现在模板图片中即为对应于0~255的某一个灰度值,所以最强梯度模板图片中会出现模糊线条,另外,因为这些像素点对应于模板中的一致背景区域,是具有一定的意义的,因此,图4中采用了灰色的背景。
具体地,所述步骤TS4包括如下步骤:
步骤TS41:对于每张模板图片O,对其实施小范围的平移变换M(M∈M,其中M是[-t,+t]2范围内的所有平移变换的集合),得到平移变换后的模板图片w(O,M)。这一步可以使待求取的主梯度方向描述对于小范围平移鲁棒且可以减少目标检测阶段扫描位置的个数。
步骤TS42:将得到平移变换后的模板图片w(O,M)分割成若干大小为t×t的方形网格R,R的大小的选取要综合考虑运行速度和鲁棒性;
平移范围t同时也是方形网格R的边长,它的选择要同时考虑生成的模板描述的区分能力(鲁棒性)以及运行速度,通过多次试验我们发现t=7是以上两者的很好折中。
步骤TS43:对于每一个方形网格R,计算出离散化的梯度方向列表L(O,R)。
具体地,所述步骤TS43中的梯度方向列表L(O,R)可以由如下公式计算得出:
L ( O , R ) = { o : ∃ M ∈ M such thato ∈ DO ( w ( O , M ) , R ) }
其中DO(w(O,M),R)返回平移变换后的模板图片w(O,M)中的方形网格R中的k个主梯度方向。
Figure BDA0000143085120000082
其中:
S(w(O,M),R)={ori(w(O,M),l):l∈max magk(R)∧mag(w(O,M),l)>τ}
经过参数调优,在本实旋例中我们发现选取k=7会取的比较好的效果。
步骤TS44:将每个离散化的梯度方向列表L(O,R)表示成一个字节形式,得到模板图片的二进制表示(binary representation),具体为一个8比特的整型二维数组。
步骤TS5:使用汉明距离(hamming distance)作为度量准则对T1进行聚类,得到聚类后的最强梯度模板集T2。
具体地,步骤TS5包括如下步骤:
步骤TS51:从最强梯度模板集T1中随机选取一个没有被归为任何一类的模板作为第i类的聚类模板;
步骤TS52:迭代地搜寻满足如下条件的模板t
arg min t ∈ Chata max ( d h ( c or t , t ) , d h ( c or t , c ) )
将得到的模板t加入第i类,修改第i类的聚类模板为c=cort;
步骤TS53:若T1中的模板已经全部聚类,停止:否则,转TS54
步骤TS54:若第i类中的模板数未达到预设模板数k0,转TS52:否则,i=i+1,转TS51;
步骤TS6:存储T2至硬盘以备检测阶段使用;
步骤TS7:若V张不同角度的模板图片已经处理完,停止:否则,转TS2。
目标检测阶段:
步骤DS1:从硬盘读取聚类后的最强梯度模板集T2;
步骤DS2:读取一张测试图片I;
测试图片如图5所示,其对A,B,C,D四种不同形状的金属零件进行多角度检测。对于每种具体的金属零件,分别拍摄三种情况下的测试图片:从图中左到右列,依次为简单背景、复杂背景以及锈蚀干扰。
步骤DS3:计算出测试图片I的主梯度方向描述i;
具体地,上述步骤DS3包括如下步骤:
步骤DS31:将测试图片I分割成若干大小为t×t的方形网格R,R的大小的选取要综合考虑运行速度和鲁棒性;
为了同模板训练阶段保持一致,我们在这里仍然选择方形网格R的边长t=7。
步骤DS32:对于每一个方形网格R,计算出离散化的主梯度方向do(I,R):
具体地,上述步骤DS32中的主梯度方向do(I,R)通过下式计算;
其中:
S(I,R)={ori(I,l):l∈max mag(R)∧mag(I,l)>τ}
步骤DS33:将每个离散化的主梯度方向do(I,R)表示成一个字节形式,得到测试图片的二进制表示(binary representation),具体为一个8比特的整型二维数组。
步骤DS4:对聚类后的最强梯度模板集T2中的每个模板t,使用t扫描i中的每个位置,得到在最优匹配位置的最高匹配分数St,此位置记为Lt
具体地,步骤DS4包括如下步骤:
步骤DS41:从T2中取一个模板t;
步骤DS42:从i的左上角开始扫描,对于每个位置p,使用下式计算匹配分数;
S ( i , t , p ) = Σ lint δ ( i [ p + l ] ⊗ t [ l ] )
步骤DS43:对所有位置的匹配分数进行排序,得最优匹配位置Pt及相应匹配分数St
步骤DS5:对得到的所有匹配分数进行排序,最高分数Smax对应的模板tmax即为对于测试图片的最优估计模板;
步骤DS6:由对应的最优匹配位置
Figure BDA0000143085120000101
得到目标物体在i中的位置,由对应的模板tmax的旋转角度θ及尺度变化系数λ得到目标物体估计姿态。
得到的检测结果以及姿态估计结果如图6所示,图中从左到右列依次为简单背景,复杂背景以及锈蚀干扰,图中用虚线四边形框出检测到的目标物体,虚线四边形的倾斜角度以及尺度代表检测到的目标物体的估计姿态,两个数字分别代表最优匹配率(小数)以及最优匹配点个数(整数)。
本实施例中用单角度模板测试单张测试图片的平均耗时如下表1所示:
表1
Figure BDA0000143085120000102
从上表可以看出,程序运行很快,平均是100~200ms。而且背景环境越复杂,程序运行所需要的时间越长。

Claims (7)

1.基于主梯度方向特征的目标检测及姿态估计方法,其特征在于,包括如下步骤:模板训练阶段:
步骤TS1:拍摄被检测物体不同角度的V张模板图片;
步骤TS2:从上述V张图片中取出某个角度的一张图片;
步骤TS3:对这张模板图片旋转360度(每N0度为一个步长),并进行N种尺度变化,共得到含有张图片的模板图片集S;
步骤TS4:对S中的每张模板图片O求出主梯度方向描述,得到主梯度方向模板集T1;
步骤TS5:使用汉明距离(hamming distance)作为度量准则对T1进行聚类,得到聚类后的最强梯度模板集T2;
步骤TS6:存储T2至硬盘以备检测阶段使用;
步骤TS7:若V张不同角度的模板图片已经处理完,停止:否则,转步骤TS2;
目标检测阶段:
步骤DS1:从硬盘读取聚类后的最强梯度模板集T2;
步骤DS2:读取一张测试图片1;
步骤DS3:计算出测试图片1的主梯度方向描述i;
步骤DS4:对聚类后的最强梯度模板集T2中的每个模板t,使用t扫描i中的每个位置,得到在最优匹配位置的最高匹配分数St,此位置记为Lt
步骤DS5:对得到的所有匹配分数进行排序,最高分数Smax对应的模板tmax即为对于测试图片的最优估计模板;
步骤DS6:由对应的最优匹配位置
Figure FDA0000143085110000021
得到目标物体在i中的位置,由对应的模板tmax的旋转角度θ及尺度变化系数λ得到目标物体估计姿态。
2.根据权利要求1所述的基于主梯度方向特征的目标检测及姿态估计方法,其特征在于,所述步骤TS4包括如下步骤:
步骤TS41:对于每张模板图片O,对其实施小范围的平移变换M,得到平移变换后的模板图片w(O,M),所述M∈M,其中M是[-t,+t]2范围内的所有平移变换的集合;
步骤TS42:将得到平移变换后的模板图片w(O,M)分割成若干大小为t×t的方形网格R;
步骤TS43:对于每一个方形网格R,计算出离散化的梯度方向列表L(O,R);
步骤TS44:将每个离散化的梯度方向列表L(O,R)表示成一个字节形式,得到模板图片的二进制表示。
3.根据权利要求2所述的基于主梯度方向特征的目标检测及姿态估计方法,其特征在于,所述步骤TS43包括如下过程:
所述梯度方向列表L(O,R)可以由如下公式计算得出:
L ( O , R ) = { o : ∃ M ∈ M such thato ∈ DO ( w ( O , M ) , R ) }
其中DO(w(O,M),R)是返回平移变换后的模板图片w(O,M)中的方形网格R中的k个主梯度方向;
其中DO(w(O,M),R)被写成:
Figure FDA0000143085110000023
其中,S(w(O,M),R)={ori(w(O,M),l):l∈max magk(R)∧mag(w(O,M),l)>τ}
·l是方形网格R中的像素位置:
·ori(w(O,M),l)是图片w(O,M)在l位置的梯度方向,mag(w(O,M),l)是其梯度大小;
·max magk(R)是方形网格中k个最强梯度的位置集合;
·τ是最小梯度阈值。
4.根据权利要求1所述的基于主梯度方向特征的目标检测及姿态估计方法,其特征在于,所述步骤TS5包括如下步骤:
步骤TS51:从最强梯度模板集T1中随机选取一个没有被归为任何一类的模板作为第i类的聚类模板:
步骤TS52:迭代地搜导满足如下条件的模板t
arg min t ∈ Chata max ( d h ( c or t , t ) , d h ( c or t , c ) )
其中:dh是汉明距离,″or″是按位或操作,c是进行或操作之前的聚类模板;
将得到的模板t加入第i类,修改第i类的聚类模板为c=cort;
步骤TS53:若T1中的模板已经全部聚类,停止:否则,转TS54;
步骤TS54:若第i类中的模板数未达到预设模板数k0,转TS52:否则,i=i+1,转TS51。
5.根据权利要求1所述的基于主梯度方向特征的目标检测及姿态估计方法,其特征在于,所述步骤DS3包括如下步骤:
步骤DS31:将测试图片I分割成若干大小为t×t的方形网格R;
步骤DS32:对于每一个方形网格R,计算出离散化的主梯度方向do(I,R);
步骤DS33:将每个离散化的主梯度方向do(I,R)表示成一个字节形式,得到测试图片的二进制表示。
6.根据权利要求5所述的基于主梯度方向特征的目标检测及姿态估计方法,其特征在于,所述步骤DS32包括如下过程:
DS32中的主梯度方向do(I,R)通过下式计算:
Figure FDA0000143085110000032
其中:
S(I,R)={ori(I,l):l∈max mag(R)∧mag(I,l)>τ}
其中:
·l是方形网格R中的像素位置;
·ori(I,l)是图片I在l位置的梯度方向,mag(I,l)是梯度大小;
·max mag(R)是方形网格R中最强梯度的位置;
·τ是最小梯度阈值。
7.根据权利要求1所述的基于主梯度方向特征的目标检测及姿态估计方法,其特征在于,所述步骤DS4包括如下步骤:
步骤DS41:从T2中取一个模板t;
步骤DS42:从i的左上角开始扫描,对于每个位置p,使用下式计算匹配分数;
S ( i , t , p ) = Σ lint δ ( i [ p + l ] ⊗ t [ l ] )
其中:
·δ(P)是一个二值函数,若P≠0,返回1,其他情况返回0;
·p和l均为二维坐标位置:
·i[p+l]表示二维数组i的p+l位置处的字节数值,t[l]表示二维数组t的l位置处的字节数值;
·
Figure FDA0000143085110000042
表示按位与操作(bitwise AND operation);
步骤DS43:对所有位置的匹配分数进行排序,得最优匹配位置Pt及相应匹配分数St
CN2012100658106A 2012-03-13 2012-03-13 基于主梯度方向特征的目标检测及姿态估计方法 Pending CN102663769A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012100658106A CN102663769A (zh) 2012-03-13 2012-03-13 基于主梯度方向特征的目标检测及姿态估计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012100658106A CN102663769A (zh) 2012-03-13 2012-03-13 基于主梯度方向特征的目标检测及姿态估计方法

Publications (1)

Publication Number Publication Date
CN102663769A true CN102663769A (zh) 2012-09-12

Family

ID=46773247

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012100658106A Pending CN102663769A (zh) 2012-03-13 2012-03-13 基于主梯度方向特征的目标检测及姿态估计方法

Country Status (1)

Country Link
CN (1) CN102663769A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103927517A (zh) * 2014-04-14 2014-07-16 电子科技大学 一种基于人体全局特征直方图熵的动作检测方法
CN103971130A (zh) * 2013-01-25 2014-08-06 台达电子工业股份有限公司 快速图形比对方法
CN108230345A (zh) * 2018-02-05 2018-06-29 中国农业科学院农业信息研究所 基于梯度信息和搜索策略的玉米图像姿态估计方法
CN109377268A (zh) * 2018-09-27 2019-02-22 北京理工大学 商品的调整方法及装置
CN110147837A (zh) * 2019-05-14 2019-08-20 中国电子科技集团公司第二十八研究所 基于特征聚焦的任意方向密集目标检测方法、***及设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101488222A (zh) * 2008-01-16 2009-07-22 中国科学院自动化研究所 一种基于运动目标表象和运动信息的摄像机自标定方法
US20110002555A1 (en) * 2009-07-03 2011-01-06 Iraj Sodagar Dominant gradient method for finding focused objects

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101488222A (zh) * 2008-01-16 2009-07-22 中国科学院自动化研究所 一种基于运动目标表象和运动信息的摄像机自标定方法
US20110002555A1 (en) * 2009-07-03 2011-01-06 Iraj Sodagar Dominant gradient method for finding focused objects

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
STEFAN HINTERSTOISSER等: "Dominant Orientation Templates for Real-Time Detection of Texture-Less Objects", 《2010 IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION》 *
仝明磊等: "利用单目图像进行人体运动姿势的估计", 《第十二届全国图象图形学学术会议论文集》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103971130A (zh) * 2013-01-25 2014-08-06 台达电子工业股份有限公司 快速图形比对方法
CN103971130B (zh) * 2013-01-25 2017-09-22 台达电子工业股份有限公司 快速图形比对方法
CN103927517A (zh) * 2014-04-14 2014-07-16 电子科技大学 一种基于人体全局特征直方图熵的动作检测方法
CN103927517B (zh) * 2014-04-14 2017-02-15 电子科技大学 一种基于人体全局特征直方图熵的动作检测方法
CN108230345A (zh) * 2018-02-05 2018-06-29 中国农业科学院农业信息研究所 基于梯度信息和搜索策略的玉米图像姿态估计方法
CN108230345B (zh) * 2018-02-05 2020-08-04 中国农业科学院农业信息研究所 基于梯度信息和搜索策略的玉米图像姿态估计方法
CN109377268A (zh) * 2018-09-27 2019-02-22 北京理工大学 商品的调整方法及装置
CN110147837A (zh) * 2019-05-14 2019-08-20 中国电子科技集团公司第二十八研究所 基于特征聚焦的任意方向密集目标检测方法、***及设备

Similar Documents

Publication Publication Date Title
Drost et al. Introducing mvtec itodd-a dataset for 3d object recognition in industry
Tang et al. A textured object recognition pipeline for color and depth image data
CN107463945B (zh) 一种基于深度匹配网络的商品种类识别方法
WO2015139574A1 (zh) 一种静态物体重建方法和***
EP3563345B1 (en) Automatic detection, counting, and measurement of lumber boards using a handheld device
CN108647706B (zh) 基于机器视觉的物品识别分类与瑕疵检测方法
CN105068918B (zh) 一种页面测试方法及装置
CN111444964B (zh) 一种基于自适应roi划分的多目标快速图像匹配方法
CN102663769A (zh) 基于主梯度方向特征的目标检测及姿态估计方法
JP2015032001A (ja) 情報処理装置および情報処理手法、プログラム
Blank et al. 6DoF pose-estimation pipeline for texture-less industrial components in bin picking applications
US11216905B2 (en) Automatic detection, counting, and measurement of lumber boards using a handheld device
CN109463003A (zh) 对象识别
CN111968115B (zh) 基于栅格化图像处理方法的骨科耗材检测方法及***
CN113313725A (zh) 含能材料药桶的桶口识别方法及***
CN109741302B (zh) 基于机器视觉的sd卡形态识别***和方法
AUGMENTED Grayscale image enhancement for enhancing features detection in marker-less augmented reality technology
CN109685002B (zh) 一种数据集采集方法、***以及电子装置
Ramisa et al. Evaluation of the sift object recognition method in mobile robots
CN105930813B (zh) 一种在任意自然场景下检测行文本的方法
Tiwan et al. Cylindrical pellet pose estimation in clutter using a single robot mounted camera
Wang et al. Wood surface quality detection and classification using gray level and texture features
CN106337019A (zh) 图像设备和图像处理方法
Haladová et al. Multiple instances detection in rgbd images
Penate-Sanchez et al. LETHA: Learning from high quality inputs for 3D pose estimation in low quality images

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120912