CN101520850A - 物体检测分类器的构造方法和物体检测方法与相应*** - Google Patents

物体检测分类器的构造方法和物体检测方法与相应*** Download PDF

Info

Publication number
CN101520850A
CN101520850A CN200910082038A CN200910082038A CN101520850A CN 101520850 A CN101520850 A CN 101520850A CN 200910082038 A CN200910082038 A CN 200910082038A CN 200910082038 A CN200910082038 A CN 200910082038A CN 101520850 A CN101520850 A CN 101520850A
Authority
CN
China
Prior art keywords
feature
band
sorter
response
band feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200910082038A
Other languages
English (en)
Other versions
CN101520850B (zh
Inventor
郑伟
梁路宏
任昊宇
山世光
陈熙霖
高文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Computing Technology of CAS
Original Assignee
Institute of Computing Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Computing Technology of CAS filed Critical Institute of Computing Technology of CAS
Priority to CN2009100820387A priority Critical patent/CN101520850B/zh
Publication of CN101520850A publication Critical patent/CN101520850A/zh
Application granted granted Critical
Publication of CN101520850B publication Critical patent/CN101520850B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明提供了物体检测分类器的构造方法和物体检测方法与相应***。该物体检测方法包括下列步骤:构造条带特征,其中该条带特征由多个相间子条带组成;计算该条带特征在样本图像中的响应值;根据响应值构造分类器;应用该分类器对图像进行检测,获得物体检测结果。本发明的优点在于特征对较为复杂的物体形状具有较强的描述能力,同时对于一定程度的平移、尺度误差有较强的鲁棒性。

Description

物体检测分类器的构造方法和物体检测方法与相应***
技术领域
本发明涉及计算机视觉和模式识别领域,更进一步地涉及一种在图像或视频中进行物体检测的方法和***。
背景技术
从图像或视频中检测指定类别的物体是一件有意义而且富于挑战性的工作。现有技术中,通常的做法是设计一种描述能力强而且计算简单的特征集合,然后利用现有的诸如自适应提升算法(AdaBoost)的特征选择方法从包含大量特征的特征集合中选择出判别能力最好的特征子集,并且用选择的特征子集中的特征构造分类器,应用扫描窗口扫描策略和后处理算法进行物体检测。物体检测的通常做法是用一个矩形来描述物体的位置和尺度大小,该矩形使得物***于其正中,该矩形的尺度和物体的外接矩形大小相同或者相似,称此矩形为扫描窗口。
具体而言,物体检测方法包括下列步骤。首先,在一个扫描窗口中穷举生成一个包含有大量特征的特征全集。然后,计算正例样本集合和反例样本集合中样本的特征的响应值,根据上述响应值采用机器学习算法从特征集合中选择出对“物体”和“非物体”判别能力最强的特征,并构造分类器。在特征选择中常用提升算法(boosting),其中包括自适应提升算法(AdaBoost)和连续提升算法(RealBoost)。连续提升算法工作的基本过程是反复迭代,每次迭代选择一个最优的特征并构造一个相应的弱分类器。经过迭代n次后,分别得到n个特征和弱分类器,这些弱分类器进一步组成一个瀑布分类器,也即强分类器。图1表示瀑布分类器的工作原理。每一个输入的图像块由各个弱分类器依次判别,若其中一个弱分类器判定输入为“非物体”,则这个图像块将直接被判定为“非物体”;只有当n个弱分类器均将该图像块判定为“物体”时,这个图像块才最终被认为是“物体”。
最后,基于上述瀑布分类器进行检测,大部分采用扫描窗口扫描的方法。图2说明了扫描窗口扫描的流程。首先对图像进行尺度缩放,然后对变换后得到的每一个尺度的图像中的所有的空间位置利用统一大小的扫描窗口(例如像素为64×32的扫描窗口)进行扫描,计算每一个扫描窗口内的图像块的各个特征的响应值,并根据该特征的响应值进行判别,得到候选窗口。然后进行后处理,其中包括利用噪声去除算法去掉明显的噪声,然后再利用重叠扫描窗口合并算法(例如均值滤波算法(MeanShift))将同一个物体对应的多个扫描窗口合并,从而得到最终检测结果——物体窗口。
在上述技术路线中,设计快速有效的特征是最重要的组成部分,构造描述能力强而且计算复杂度低的特征是实现快速检测的一个重要因素。现有技术中,存在两种较良好的特征:哈尔特征和基于轮廓的特征。Paul Viola和Michael Jones在2001年的CVPR的Rapid Object Detection Using aBoosted Cascade of Simple Features一文中将描述相邻矩形区域内的灰度和差异的哈尔特征(haar-like feature)引入到物体检测中。哈尔特征如图3中所示,哈尔特征其由若干个规则的矩形组成,特征的响应值是阴影区域内像素亮度和与非阴影区域内像素亮度和的差。哈尔特征中包括反映一定宽度的边缘特征——边特征,如图3的上图所示;反映一定宽度的脊线的特征——脊特征,如图3的下左图所示;以及反映某种特定明暗区域相间排列模式的特征,如图3的下右图所示。每一个上述规则的矩形内所有像素亮度和都可以通过积分图快速算法计算。哈尔特征在快速鲁棒的人脸检测应用中获得巨大成功。Bo Wu和Ram Nevatia在2005年的ICCV的Detection of Multiple,Partially Occluded Humans in a Single Image byBayesian Combination of Edgelet Part Detectors一文中提出了一种描述图像中简单轮廓信息的小边特征(edgelet)。小边特征如图4所示,其是扫描窗口内一些特定位置的曲线段,包括任意角度的直线段和1/2、1/4、1/8圆弧线段(在图中未全部示出)。在提取图像小边特征时,首先计算图像的梯度图像,然后通过计算梯度图像与小边特征对应的梯度相似程度得到最终的响应值。小边特征在人体检测和车辆检测中取得了较好的效果。J.Shotton,A.Blake和R.Cipolla在2005年的ICCV中的Contour-BasedLearning for Object Detection一文中也提出了一种用轮廓线片段作为物体检测的特征,并用轮廓匹配算法(chamfer)方式进行相似度计算,在车辆和摩托车的实验中取得了不错的效果。然而上述两种特征都有各自的不足,哈尔特征的模式很简单,从图3中可以看出,它反映的模式仅包括水平和竖直的直线段,因而对于检测人脸等模式比较简单的物体能够取得较好的效果,但是对于形状更为复杂的物体则性能不够理想;基于轮廓线设计的特征虽然可以反映物体较为复杂的形状特征,但是它是一种单像素宽度的特征,如果图像中的边缘和特征的位置稍有错位和尺度不一致,最终的特征的响应值就可能就会变化很大,也就是说轮廓线的特征对平移和尺度变换过于敏感。
发明内容
本发明要解决的技术问题是图像或者视频中复杂物体的鲁棒、精确且快速地检测,从而提出了一种物体检测方法与***。
根据本发明的一个方面,提供了一种用于物体检测的分类器的构造方法,包括下列步骤:
110)构造条带特征,其中所述条带特征由多个相间子条带组成;
120)计算所述条带特征在样本图像中的响应值;
130)根据所述响应值构造分类器。
该分类器的构造方法中,所述步骤110)进一步包括:
111)输入扫描窗口的大小和所述条带特征的参数;
112)根据所述扫描窗口的大小和所述条带特征的参数确定所述条带特征的轮廓线;
113)由所述轮廓线扩展出多个相间子条带,由所述子条带组成所述条带特征。
该分类器的构造方法中,所述步骤120)是通过计算所述相间子条带之间的平均亮度差或加权平均亮度差来计算所述条带特征在样本图像中的响应值。
该分类器的构造方法中,所述步骤120)进一步包括:
121)计算所述样本图像的积分图;
122)利用所述样本图像的积分图计算所述条带特征在样本图像中的响应值。
该分类器的构造方法中,所述步骤122)对于所述条带特征不是哈尔的情形,利用所述子条带的内接正矩形来近似所述子条带。
该分类器的构造方法中,所述步骤130)进一步包括:
根据所述响应值计算所述条带特征的判别能力和当前分类器的误检率,根据所述判别能力、所述误检率和所述条带特征的计算代价从所述条带特征中选择优选的条带特征。
根据本发明的另一方面,还提供了一种构造用于物体检测的分类器的***,包括特征生成装置、特征提取装置和分类器构造装置,其中:
所述特征生成装置,用于构造条带特征,其中所述条带特征由多个相间子条带组成;
所述特征提取装置,用于从所述分类器构造装置接收样本图像和所述条带特征,并且计算所述条带特征在所述样本图像中的响应值;
分类器构造装置,用于接收样本图像并从所述特征生成装置接收所述条带特征,根据所述响应值构造分类器。
根据本发明的又一方面,还提供了一种物体检测方法,包括下列步骤:
210)根据上述的构造方法构造分类器;
220)应用所述分类器对图像进行检测,获得物体检测结果。
该物体检测方法中,所述步骤220)进一步包括:
221)对待检测图像进行尺度缩放,并对所述缩放后的图像进行窗口扫描;
222)所述分类器计算所述窗口内的所述条带特征的响应值,并根据所述响应值获得候选窗口;
223)对所述候选窗口后处理,获得所述物体检测结果。
根据本发明的又一方面,还提供了一种物体检测***,包括:
窗口扫描装置,用于接收待检测图像,对待检测图像进行尺度缩放及窗口扫描;
特征提取装置,用于计算构造分类器所用的条带特征在所述窗口内的响应值;
根据上述的构造方法构造的分类器,用于根据所述响应值获得候选窗口;
后处理装置,用于对所述候选窗口后处理,获得物体检测结果。
本发明的效果在于特征对较为复杂的物体形状具有较强的描述能力,同时对于一定程度的平移、尺度误差有较强的鲁棒性。
附图说明
下面结合附图对本发明的具体实施方式作进一步详细的说明,其中:
图1是现有技术的瀑布式检测算法示意图;
图2是现有技术的多尺度窗口扫描过程流程图;
图3是现有技术的哈尔特征示意图;
图4是现有技术的小边特征示意图;
图5是根据本发明的实施例的扫描窗口内的条带特征示意图;
图6是根据本发明的实施例的四种典型的条带特征的示意图;
图7是根据本发明的实施例的条带特征生成框图;
图8是根据本发明的优选实施例的特征提取框图;
图9是根据本发明的优选实施例的利用积分图计算条带特征的示意图;
图10是根据本发明的实施例的构造物体检测分类器的***和物体检测***的总体框架图;
图11是根据本发明的实施例的收集的部分车辆样本示例示意图;
图12是根据本发明的实施例的在多视角车辆测试数据集上的测试结果示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图,对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
根据本发明的一个具体实施例,提供了一种根据条带特征构造用于在待检测图像中进行物体检测的分类器的方法,其中该条带特征由多个相邻子条带组成。
构造图像条带特征,该条带特征包括但不限于任意角度的直线型条带,以及1/4、1/2、1/8圆弧型条带,也即其可以是任意几何形状的条带。每一个条带由多个相邻的子条带构成。
图像条带特征位于扫描窗口中,图5给出一个位于扫描窗口中的图像条带特征,其中粗体点划线是其轮廓线。该条带特征轮廓线的形状S是一个直线段,轮廓线长度为L,轮廓线的起点位于扫描窗口的p点,轮廓线或其起点处切线与水平方向的夹角是θ,该条带特征的子条带数目t为3,这三个字条带的宽度分别是w1,w2,w3,由此条带特征可以参数化为
Figure A200910082038D00091
。可以通过控制
Figure A200910082038D00092
等参数的取值范围和步长,生成不同规模的条带特征集合。图6中列出了根据本发明的实施例的四种典型的条带特征,直线型边特征、直线型脊特征、弧线型边特征和弧线型脊特征,图中所示的条带特征是由宽度相等的子条带相间排列组成的。本领域普通技术人员可以理解每个子条带宽度wR也可以取不同的宽度。
图7示出了根据本发明具体实施例的条带特征生成框图,构造上述图像条带特征包括下列步骤:首先输入扫描窗口的大小和条带特征的参数,其中为了控制特征全集中的特征数目不要过多,通常对这些参数加以限制,具体的,例如对64×32像素大小的扫描窗口限制L为4到12个像素,wR为2到6个像素。然后,确定每个条带特征的轮廓线,轮廓线可以是任意形状的曲线,本发明的实施例中采用的直线段和曲线段只是条带特征轮廓线的示例。在扫描窗口中选择条带特征的位置p,条带特征的位置p可以用轮廓线的起点来表示,其可以是扫描窗口中任意的合理的位置。通过条带特征的角度和形状计算条带特征轮廓线的另一个端点,并按照直线或弧线的几何约束插值生成长度为L的轮廓线。最后,将轮廓线扩展成各个图像条带特征,其是若干个的子条带组合。由轮廓线沿着法线方向向两侧扩展同样的宽度wR,生成边特征;同理由轮廓线沿着法线方向向两侧扩展同样的宽度1/2wR,进一步分别再向外扩展wR宽度,生成脊特征。记录扩展后的轮廓线上的每一个点、以及条带特征的所有参数
Figure A200910082038D00093
即构造了条带特征。本领域普通技术人员可以理解,可以采用多种计算机图形学方法确定轮廓线,同样也可以采用多种图形学方法来从轮廓线生成图像条带特征。
计算每一个图像条带特征在样本图像中的响应值。条带特征的本质在于用来衡量图6中非阴影条带区域和阴影条带区域的亮度的对比情况,所以只要是反映相间子条带亮度对比情况的计算方法都可以视为图像条带特征的响应值计算方式。根据本发明一个具体实施例,采用了非阴影区域和阴影区域的平均亮度之差的绝对值作为特征的响应值,提取的方式用公式可以表示为:
f edge = | Σ ( x , y ) ∈ R 1 I ( x , y ) | | R 1 | | - Σ ( x , y ) ∈ R 2 I ( x , y ) | | R 2 | | | - - - ( 1 )
f ridge = 1 2 | Σ ( x , y ) ∈ R 1 I ( x , y ) | | R 1 | | + Σ ( x , y ) ∈ R 3 I ( x , y ) | | R 3 | | - 2 Σ ( x , y ) ∈ R 2 I ( x , y ) | | R 2 | | | - - - ( 2 )
其中I(x,y)表示坐标(x,y)处的像素值,R1、R2、R3表示图1中的子条带区域,‖·‖表示求一个区域内像素的数目。
更一般的,可以对条带中的每个点的亮度赋予不同的权值,具体的公式可以表示为公式(3)和(4):
f edge = | Σ ( x , y ) ∈ R 1 I ( x , y ) × q ( x , y ) | | R 1 | | - Σ ( x , y ) ∈ R 2 I ( x , y ) × q ( x , y ) | | R 2 | | | - - - ( 3 )
f ridge = 1 2 | Σ ( x , y ) ∈ R 1 I ( x , y ) × q ( x , y ) | | R 1 | | + Σ ( x , y ) ∈ R 3 I ( x , y ) × q ( x , y ) | | R 3 | | - 2 Σ ( x , y ) ∈ R 2 I ( x , y ) × q ( x , y ) | | R 2 | | | - - - ( 4 )
公式(3)、(4)中的符号和公式(1)、(2)中的符号一致,其中q(x,y)是点(x,y)处对应的权值。当公式(3)、(4)中所有的权值都为1的时候,公式(3)(4)就退化为公式(1)、(2)。
本领域普通技术人员可以理解,上述公式(1)至(4)所代表的特征提取方式只是图像条带特征的一种可能的实现方式,除此之外还有很多反映子条带明暗对比的其它方式,例如将公式(1)至(4)中的绝对值符号去掉,也可以作为图像条带特征提取的一种实现方式。
上面计算图像条带特征的响应值是直接计算的方式,当图像条带特征区域中包含的点很多,这时候计算量就会很大。根据本发明的优选实施例,还提供了一种快速计算特征的响应值的方法,采用多个矩形近似各个子条带,从而能够有效利用积分图计算条带特征的响应值。
如图8所示的框图,对于一个指定的图像条带特征,首先判断是否是哈尔特征,如果是哈尔特征则采用积分图直接计算,而对于非哈尔特征采用近似方法计算响应值。具体而言,首先,计算样本图像的积分图,然后计算扫描窗口中特征的响应值。如果图像条带特征的轮廓线是水平或者垂直的直线,即该条带特征是正矩形,那么这类条带特征就是哈尔特征,可以直接采用基于积分图的快速哈尔特征提取方法。对于其它非哈尔特征,采用图9所示的近似方式来提取特征。对于边特征,如图9(A)和图9(C)所示,计算轮廓线上的每一像素Pi的法线与条带特征的外轮廓的交点Ai和Bi,分别以线段PiAi和PiBi为对角线确定两个规则的矩形R1i,R2i。对于轮廓线上的每一点,都可以确定出上下两个子条带中的两个内接正矩形。经过对轮廓线上每一点的计算,可以得到两组正矩形,分别用于近似上下两个子条带。本领域普通技术人员可以理解,上述实施例仅给出了一种内接正矩形的构造方法,还可以采用其它方式构造内接正矩形。每个矩形内的像素和都可以利用积分图算法快速计算,最终特征提取装置对于边特征的计算公式为:
f edge = | Σ i = 1 L g ( R 1 i ) Σ i = 1 L | | R 1 i | | - Σ i = 1 L g ( R 2 i ) Σ i = 1 L | | R 2 i | | | - - - ( 5 )
其中g(·)表示利用积分图快速算法计算一个区域内的所有像素的和,‖·‖和公式(1)、(2)中的含义一样,表示一个区域内所有像素点的数目。
脊特征的计算和上述边特征的计算相似,如图9(B)和9(D)所示,对于轮廓线上的每一个点,仍然求其法线与各个子条带外轮廓的交点,这样可以确定4个点Ai、Bi、Ci和Di,这样以AiBi,BiCi,CiDi为对角线可以确定三个内接正矩形R1i,R2i,R3i,特征值的计算公式如下:
f ridge = 1 2 | Σ i = 1 L g ( R 1 i ) Σ i = 1 L | | R 1 i | | + Σ i = 1 L g ( R 3 i ) Σ i = 1 L | | R 3 i | | - 2 Σ i = 1 L g ( R 2 i ) Σ i = 1 L | | R 2 i | | | - - - ( 6 )
由于上述近似条带的矩形仅依赖于图像条带特征的形状,而与输入图像无关,因此,优选地离线地获得各个矩形的参数。然后直接根据这些参数利用积分图进行特征提取,从而提高执行速度。
根据所计算的特征的响应值从包含大量特征的特征全集中选择对当前正例样本集合和反例样本集合最优的特征子集,并利用最优的特征子集来构造弱分类器,进一步由弱分类器构造瀑布分类器。本领域普通技术人员可以理解,可以采用任何合适的学习算法进行特征选择,如自适应提升算法和连续提升算法等等,此处仅以连续提升算法为例说明其工作原理。首先,对于每一个特征在正例样本集合和反例的样本集合上的响应值分别统计直方图分布,然后求该特征在所有正例和反例样本上的响应值直方图分布的巴特查亚系数(Bhattacharyya Coefficient),公式表示如下:
Z = 2 Σ j W + j W - j - - - ( 7 )
其中
Figure A200910082038D00122
代表该特征在正例样本集上响应值直方图中的第j个分量,
Figure A200910082038D00123
代表该特征在反例样本集上响应值直方图中的第j个分量,某个特征的Z值越小表示该特征对于正例和反例判别能力越强,即应优先选择该特征。
为了更好地选择图像条带特征以更有效地进行分类,优选的,本发明除了考虑了条带特征的判别能力的因素,还从当前构造的分类器的误检率和/或条带特征的计算代价两方面优化特征选择,上述权衡了判别能力、误检率和计算代价的实现方式称之为特征权衡。具体而言,首先获得当前学习得到的强分类器的的误检率fp,可以通过在反例样本图像的集合运行当前的分类器估计,也可以通过多种其它方式获得,例如直接从连续提升算法中获得误检率的估计值。根据特征的判别能力、特征的计算代价C以及当前学习得到的强分类器的fp,按照公式(8)对条带特征进行权衡计算:
Z ′ = 2 Σ j W + j W - j + αfp C - - - ( 8 )
其中α是一个加权系数,根据本发明的一个实施例,α位于(0,1)区间;
Figure A200910082038D00125
与公式(7)中代表的物理意义相同;fp是当前学***台的实现可以根据具体的***架构(如乘法和加法所占用的时钟周期等)加以估计,或者通过实验确定计算代价。
表1
Figure A200910082038D00131
优选的,按照公式(8)的特征权衡结果,选择对应最小的Z’值的那个特征作为当前的最优特征。应该理解,上面的说明只是以连续提升算法作为一个实例,但特征权衡的步骤可以和多种用于特征选择的机器学习算法搭配使用。
利用所选择的特征来构造用于判别输入的扫描窗口是“物体”还是“非物体”的弱分类器。由多个弱分类器串联共同构造强分类器,如图3中所示的瀑布分类器。最后,将得到的瀑布分类器的最优特征子集、弱分类器及瀑布分类器参数记录下来。
根据本发明的一个具体实施例,本发明还提供了一种应用上述构造的瀑布分类器进行图像中的物体检测的方法。待检测图像可以是灰度、彩色、红外或其它类型的图像。优选的,在特征提取前转化为亮度图像或其它能够反映物体条带特征的图像。根据本发明的优选实施例,首先对待检测图像进行尺度缩放,并对缩放后的图像进行窗口扫描。计算瀑布分类器的条带特征在扫描窗口的响应值,并根据该响应值进行物体检测。对此物体检测结果再进行后处理,根据本发明的一个实施例,后处理包括:首先利用噪声去除方法把明显不是物体的扫描窗口去掉,噪声去除可以通过多种方法实现,例如非最大值抑制算法;然后再利用重框合并方法把多余的重框合并成最终的检测结果。优选的,上述响应值根据缩放后的图像的积分图或缩放后图像的窗口的积分图进行计算。
根据如图10所示的具体实施例,本发明还提供了一种构造用于物体检测的分类器的***和一种物体检测***。
根据本发明一个具体实施例,该构造用于物体检测的分类器的***包括:特征生成装置、特征提取装置和分类器构造装置,其中:
特征生成装置,用于构造条带特征,其中所述条带特征由多个相间子条带组成,并将条带特征全集传送至分类器构造装置。
特征提取装置,用于从分类器构造装置接收条带特征全集以及样本图像,并计算所述条带特征在所述样本图像中的响应值。其中,所述样本图像包括大量的正例的图像块,例如3000~5000个。图11示出了根据本发明的一个具体实施例的训练瀑布分类器所用到的收集的部分车辆样本示例。这些样本都是按照事先的标注信息从包含车辆的图像中截取的,然后将所有的样本归一化到64×32像素大小,并且使车辆都位于图像块的正中。
分类器构造装置,接收正例样本集合和反例样本集合并从特征生成装置接收条带特征全集,根据所述特征响应值从包含大量条带特征的特征全集中选择对当前正例样本集合和反例样本集合最优的特征子集,并利用最优的特征子集来构造弱分类器,进一步由弱分类器构造瀑布分类器。根据本发明优选实施例,在特征选择的过程综合了条带特征的计算代价和分类器的误检率的因素。
根据本发明一个优选实施例,上述物体检测***,包括:
窗口扫描装置,用于接收待检测图像,对所述待检测图像进行尺度缩放,并对所述缩放后的图像进行窗口扫描;
特征提取装置,用于计算条带特征在所述窗口中的响应值;在原理、构造方法等方面与分类器生成部分的特征提取装置相同,不同之处仅在于其输入的图像条带特征是经过特征选择装置选择出来的最优特征。
如上所述所构造的分类器,用于根据所述响应值获得候选窗口;
后处理装置,用于对所述候选窗口进行后处理,获得物体检测结果。
图12中示出了根据本发明的一个具体实施例对多视角的车辆的检测结果,横轴表示准确率,纵轴表示召回率,曲线越高性能越好。可以看到,本发明在多视角汽车上的检测结果明显好于利用哈尔特征和小边特征对多视角汽车的检测结果,所以本发明对于一定程度的平移、尺度误差有较强的鲁棒性。实验还表明,通过采用近似计算条带区域内部像素和——采用多个正矩形近似各个子条带,进而采用积分图,进行快速的特征提取,有效提高了计算速度,并节省了存储空间;而且采用了特征权衡构造出来的物体检测***能够比不采用特征权衡构造出来的检测***快2到3倍,并且性能基本不变。
上述***实现是以PC机为平台,但本发明可以有多种具体的平台,包括但不限于PC机、服务器、SoC、FPGA等等。
应该注意到并理解,在不脱离后附的权利要求所要求的本发明的精神和范围的情况下,能够对上述详细描述的本发明做出各种修改和改进。因此,要求保护的技术方案的范围不受所给出的任何特定示范教导的限制。

Claims (12)

1.一种用于物体检测的分类器的构造方法,包括下列步骤:
110)构造条带特征,其中所述条带特征由多个相间子条带组成;
120)计算所述条带特征在样本图像中的响应值;
130)根据所述响应值构造分类器。
2.根据权利要求1所述分类器的构造方法,其特征在于,所述步骤110)进一步包括:
111)输入扫描窗口的大小和所述条带特征的参数;
112)根据所述扫描窗口的大小和所述条带特征的参数确定所述条带特征的轮廓线;
113)由所述轮廓线扩展出多个相间子条带,由所述子条带组成所述条带特征。
3.根据权利要求1或2所述分类器的构造方法,其特征在于,所述步骤120)是通过计算所述相间子条带之间的平均亮度差或加权平均亮度差来计算所述条带特征在样本图像中的响应值。
4.根据权利要求3所述分类器的构造方法,其特征在于,所述步骤120)进一步包括:
121)计算所述样本图像的积分图;
122)利用所述样本图像的积分图计算所述条带特征在样本图像中的响应值。
5.根据权利要求4所述分类器的构造方法,其特征在于,所述步骤122)对于所述条带特征不是哈尔的情形,利用所述子条带的内接正矩形来近似所述子条带。
6.根据权利要求1或2所述的分类器的构造方法,其特征在于,所述步骤130)进一步包括:
根据所述响应值计算所述条带特征的判别能力和当前分类器的误检率,根据所述判别能力、所述误检率和所述条带特征的计算代价从所述条带特征中选择优选的条带特征。
7.根据权利要求1或2所述分类器的构造方法,其特征在于,所述子条带的宽度相等。
8.根据权利要求2所述分类器的构造方法,其特征在于,所述轮廓线为任意角度的直线段或1/2、1/4、1/8圆弧线段。
9.一种构造用于物体检测的分类器的***,包括特征生成装置、特征提取装置和分类器构造装置,其中:
所述特征生成装置,用于构造条带特征,其中所述条带特征由多个相间子条带组成;
所述特征提取装置,用于从所述分类器构造装置接收样本图像和所述条带特征,并且计算所述条带特征在所述样本图像中的响应值;
分类器构造装置,用于接收样本图像并从所述特征生成装置接收所述条带特征,根据所述响应值构造分类器。
10.一种物体检测方法,包括下列步骤:
210)根据权利要求1或2所述的构造方法构造分类器;
220)应用所述分类器对图像进行检测,获得物体检测结果。
11.根据权利要求10所述物体检测方法,其特征在于,所述步骤220)进一步包括:
221)对待检测图像进行尺度缩放,并对所述缩放后的图像进行窗口扫描;
222)所述分类器计算所述窗口内的所述条带特征的响应值,并根据所述响应值获得候选窗口;
223)对所述候选窗口后处理,获得所述物体检测结果。
12.一种物体检测***,包括:
窗口扫描装置,用于接收待检测图像,对待检测图像进行尺度缩放及窗口扫描;
特征提取装置,用于计算构造分类器所用的条带特征在所述窗口内的响应值;
根据权利要求1或2所述的构造方法构造的分类器,用于根据所述响应值获得候选窗口;
后处理装置,用于对所述候选窗口后处理,获得物体检测结果。
CN2009100820387A 2009-04-17 2009-04-17 物体检测分类器的构造方法和物体检测方法与相应*** Active CN101520850B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009100820387A CN101520850B (zh) 2009-04-17 2009-04-17 物体检测分类器的构造方法和物体检测方法与相应***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009100820387A CN101520850B (zh) 2009-04-17 2009-04-17 物体检测分类器的构造方法和物体检测方法与相应***

Publications (2)

Publication Number Publication Date
CN101520850A true CN101520850A (zh) 2009-09-02
CN101520850B CN101520850B (zh) 2012-02-15

Family

ID=41081431

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009100820387A Active CN101520850B (zh) 2009-04-17 2009-04-17 物体检测分类器的构造方法和物体检测方法与相应***

Country Status (1)

Country Link
CN (1) CN101520850B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103793722A (zh) * 2014-03-07 2014-05-14 电子科技大学 一种低分辨率下的快速车辆检测方法及装置
CN106022235A (zh) * 2016-05-13 2016-10-12 中国人民解放军国防科学技术大学 基于人体探测的遗漏孩童检测方法
US9697443B2 (en) 2014-12-11 2017-07-04 Intel Corporation Model compression in binary coded image based object detection
TWI617996B (zh) * 2014-04-11 2018-03-11 美商英特爾公司 使用方向性濾波之物件檢測技術
CN109963501A (zh) * 2017-03-02 2019-07-02 欧姆龙株式会社 看护辅助***及其控制方法、以及程序
CN113192358A (zh) * 2021-04-26 2021-07-30 贵州车秘科技有限公司 一种基于热成像技术在智慧停车领域的停车管理***及其使用方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103793722A (zh) * 2014-03-07 2014-05-14 电子科技大学 一种低分辨率下的快速车辆检测方法及装置
TWI617996B (zh) * 2014-04-11 2018-03-11 美商英特爾公司 使用方向性濾波之物件檢測技術
US10121090B2 (en) 2014-04-11 2018-11-06 Intel Corporation Object detection using binary coded images and multi-stage cascade classifiers
US9697443B2 (en) 2014-12-11 2017-07-04 Intel Corporation Model compression in binary coded image based object detection
US9940550B2 (en) 2014-12-11 2018-04-10 Intel Corporation Model compression in binary coded image based object detection
CN106022235A (zh) * 2016-05-13 2016-10-12 中国人民解放军国防科学技术大学 基于人体探测的遗漏孩童检测方法
CN106022235B (zh) * 2016-05-13 2021-05-28 中国人民解放军国防科学技术大学 基于人体探测的遗漏孩童检测方法
CN109963501A (zh) * 2017-03-02 2019-07-02 欧姆龙株式会社 看护辅助***及其控制方法、以及程序
CN113192358A (zh) * 2021-04-26 2021-07-30 贵州车秘科技有限公司 一种基于热成像技术在智慧停车领域的停车管理***及其使用方法

Also Published As

Publication number Publication date
CN101520850B (zh) 2012-02-15

Similar Documents

Publication Publication Date Title
CN106874894B (zh) 一种基于区域全卷积神经网络的人体目标检测方法
CN110348319B (zh) 一种基于人脸深度信息和边缘图像融合的人脸防伪方法
JP6547069B2 (ja) 物体検出のためのサブカテゴリ認識機能付き畳み込みニューラルネットワーク
CN101350063B (zh) 人脸特征点定位方法及装置
CN102722712B (zh) 基于连续度的多尺度高分辨图像目标检测方法
CN101561867B (zh) 一种基于高斯形状特征的人体检测方法
CN100463000C (zh) 基于级联分类和哈夫圆变换的人眼状态检测方法
EP2434431A1 (en) Method and device for classifying image
CN101655914B (zh) 训练装置、训练方法及检测方法
CN111640089B (zh) 一种基于特征图中心点的缺陷检测方法及装置
US20080219558A1 (en) Adaptive Scanning for Performance Enhancement in Image Detection Systems
US8363983B2 (en) Real-time face detection apparatus
CN101520850B (zh) 物体检测分类器的构造方法和物体检测方法与相应***
CN101178770B (zh) 一种图像检测方法及装置
CN103049733B (zh) 人脸检测方法和人脸检测设备
CN104809452A (zh) 一种指纹识别方法
CN100561501C (zh) 一种图像检测方法及装置
CN104036284A (zh) 基于Adaboost算法的多尺度行人检测方法
CN103778435A (zh) 一种基于视频的行人快速检测方法
CN101975940A (zh) 基于分割组合的sar图像自适应恒虚警率目标检测方法
CN101609509B (zh) 一种基于预分类器的图像物体检测方法及***
CN104766046A (zh) 一种利用交通标识颜色及形状特征进行检测与识别算法
CN109376740A (zh) 一种基于视频的水尺读数检测方法
CN102867195B (zh) 一种遥感图像多类目标检测和识别方法
CN106940791B (zh) 一种基于低维方向梯度直方图的行人检测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant