CN103455798B - 基于最大几何流向直方图的人体检测方法 - Google Patents
基于最大几何流向直方图的人体检测方法 Download PDFInfo
- Publication number
- CN103455798B CN103455798B CN201310405036.3A CN201310405036A CN103455798B CN 103455798 B CN103455798 B CN 103455798B CN 201310405036 A CN201310405036 A CN 201310405036A CN 103455798 B CN103455798 B CN 103455798B
- Authority
- CN
- China
- Prior art keywords
- image
- window
- human body
- bandelet
- grader
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Image Analysis (AREA)
Abstract
本发明提出了一种基于最大几何流向直方图的人体检测方法,主要解决现有特征提取方法在人体轮廓和边缘表述的模糊性,不能反映特征内在几何结构与纹理等缺陷。其实现步骤为:(1)选择训练样本集图像;(2)进行二维小波变换;(3)划分条带波bandelet块;(4)获得各采样角排序索引;(5)获得最佳几何流方向;(6)获取条带波系数矩阵;(7)统计各方向特征;(8)分类训练;(9)输入图像进行扫描;(10)检测扫描窗口;(11)输出检测结果。本发明通过提取图像带有方向性统计的图像特征,利用线性分类器对特征集进行训练,得到人体检测的分类器,本发明特征维数低,计算快速,能准确检测出图像中的人体信息。
Description
技术领域
本发明属于图像处理技术领域,更进一步涉及静态人体检测技术领域的一种基于最大几何流向直方图的人体检测方法。本发明可用于从静态图像中,将人体信息检测出来,以达到识别人体目标的目的。
背景技术
人体检测是从自然图像中判断出人体信息所在位置的过程,近年来由于其在智能监控、驾驶员辅助***、人体运动捕捉、***过滤等领域的应用价值,已经成为计算机视觉领域中的一项关键技术。但由于人体姿态的多样性,背景的混杂以及衣服纹理,光照条件,自身遮挡等多方面的因素导致人体检测成为一个非常困难的问题。目前,静态图像中人体检测的方法主要分为两大类:基于人体模型的人体检测方法和基于学习的人体检测方法。
第一种,基于人体模型的人体检测方法。该方法不需要学习数据库,有明确的人体模型,然后根据模型构造的各个部位与人体之间的关系进行人体识别。
北京交通大学在其申请的专利“一种人体检测方法”(专利申请号CN201010218630.8,公开号CN101908150A)公开了一种基于人体模型的检测方法。该方法通过多种体形、多种姿势的人体样本建立具有一定模糊性的人体检测模板来确定人体候补区域。该方法能较好的处理遮挡问题,可以推算出人体的姿态,提高人体检测的效率和精度,但是,该方法仍然存在的不足是,匹配算法比较复杂,计算复杂度较高。
第二种,基于学习的人体检测方法。该方法通过机器学习从一系列训练数据中学习得到一个分类器,然后利用该分类器对输入窗口进行分类及识别。
北京邮电大学在其申请的专利“一种用于人体检测的人体局部特征提取方法”(专利申请号CN201110250169.9,公开号CN102955944A)中公开了一种提取纹理特征作为图像特征的人体检测方法。该方法对图像的纹理特征进行提取,并对纹理特征的分布情况进行统计,对于静止的单幅图像可以一定程度的表现图像的大致内容,但是,该方法仍然存在的不足是,对于有轻微变化的图像序列,很难较好地刻画图像内部信息,对于边缘曲线的突跳或者轮廓的轻微变化不能进行很好的处理,无法准确有效的表示图像中的几何纹理走向。
发明内容
本发明的目的在于克服上述已有技术的不足,利用条带波准确反映图像几何方向的细微变化和内部纹理走向,并自适应寻找最佳几何流方向进行多尺度分析,提出了一种基于图像几何流的带有方向性统计信息的图像特征提取,以及用于静态人体检测的方法。通过计算整幅图像各个区域几何流向的强度直方图,构成稀疏的几何图像特征集,利用线性分类器对特征集进行训练,得到一个人体检测的分类器,利用此检测分类器对待检测的图像进行人体检测。
为实现上述目的,本发明包括得到检测分类器和利用所获得的分类器对图像进行检测两个过程,具体实现步骤如下:
第一个过程,得到检测分类器的具体步骤如下:
(1)选择训练样本集图像:
1a)利用自举操作,从INRIA数据库的非人体自然图像中,获得足够的负样本图像;
1b)将获得的负样本图像与INRIA数据库中的负样本集组成新的负样本集;
1c)将获得的新的负样本集图像与INRIA数据库中的正样本集构成人体训练样本集;
(2)进行二维小波变换:
对人体训练样本集中的每幅图像进行二维离散正交小波变换;
(3)划分条带波bandelet块:
对小波变换后的人体训练样本集中的每幅图像进行L*L像素大小的二进剖分,将得到的每个L*L像素的小块作为一个条带波bandelet块;
(4)获得各采样角排序索引:
4a)按照下式,将圆周角[0,π]均匀划分成L2个采样角:
其中,θ表示第k+1个采样角的圆周角度数,k为整数,k=0,1,2,...L2-1,L表示条带波bandelet块的宽度,L=8;
4b)对于人体训练样本集中的每幅图像,以每个条带波bandelet块的中心为坐标原点,建立直角坐标系;
4c)对于每个采样角θ,按照下式计算每个条带波bandelet块内每个像素点在采样角θ上的正交投影误差值:
t=-sin(θ)·x(i)+cos(θ)·y(j)
其中,x(i),y(j)分别是块内第i行第j列的像素点在条带波bandelet块内的直角坐标系x轴、y轴上的投影值;
4d)将每个条带波bandelet块上所有像素点按采样角θ的正交投影误差值从小到大的顺序排序,得到一个L2×1的排序索引;
(5)获得最佳几何流方向:
5a)对于每幅训练样本图像的每个条带波bandelet块,将步骤(2)得到的块内每个像素点的二维离散小波变换系数按照每个采样角θ的排序索引进行重排,每个采样角θ得到一个小波变换系数重排的一维信号fd;
5b)对每个一维信号fd进行一维离散小波变换,得到变换后信号fθ;
5c)按下式计算变换后信号fθ的量化值fβ的量化系数Q(x):
其中,Q(x)表示量化值fβ的量化系数,x表示变换后信号fθ的系数,T表示量化阈值,T=15,sign(x)表示符号函数,q为常量参数,q∈Z,Z是整数域;
5d)对每个变换后信号fθ按最小拉格朗日函数法,得到条带波bandelet块的最佳几何流方向和最优变换后信号;
(6)获取条带波系数矩阵:
将人体训练样本集中的每幅图像的每个条带波bandelet块的最优变换后信号对应的小波系数,存储到一个与条带波bandelet块大小相同的二维矩阵中,作为条带波bandelet块的条带波系数矩阵;
(7)统计各方向特征:
对人体训练样本集中的每幅图像,将每个L*L像素大小的图像块区域等分为9个方向,统计条带波系数在各个方向上的分布,构成最大几何流向直方图统计特征;
(8)分类训练:
使用支持向量机SVM分类器对提取到的最大几何流向直方图统计特征进行分类训练,得到检测分类器;
第二个过程,利用所获得的分类器对图像进行检测的具体步骤如下:
(9)输入图像进行扫描:
输入一幅被检测图像,用窗口扫描法扫描整幅被检测图像,得到一组扫描窗口图像,将该组扫描窗口图像输入到检测分类器;
(10)检测扫描窗口:
10a)用检测分类器判断所输入的扫描窗口图像中是否包含有人体信息,若不存在人体信息,则将该被检测图像定位为非人体自然图像,否则,从判断出的所有有人体信息的扫描窗口图像中,找出检测分类器分数最高的扫描窗口图像作为主窗口图像;
10b)从主窗口图像以外剩余的有人体信息的扫描窗口图像中,将与主窗口图像重叠大于50%的扫描窗口图像与主窗口图像进行窗口组合操作,将窗口组合得到的窗口作为一个检测结果保存,删除所有参与窗口组合的图像;
10c)判断有人体信息的扫描窗口图像是否还有剩余,如果有,找出剩余的扫描窗口图像中检测分类器分数最高的图像作为主窗口图像,执行步骤10b),否则,执行步骤(11);
(11)输出检测结果:
将窗口组合得到的所有窗口在被检测图像上标出,输出标出后的图像,作为被检测图像的人体检测结果。
本发明与现有技术相比具有以下优点:
第一,由于本发明使用的最大几何流向直方图表示方法能够通过几何流向能准确表示图像的几何纹理走向,通过统计人体姿势方向性的几何流向信息,可以避免现有技术中基于边缘的或基于轮廓的图像表示方法产生的模糊表示和表述歧义性缺陷,使得本发明能够获得更好的检测结果。
第二,本发明提取的图像特征采用图像几何流的带有方向性的系数统计,集合成特征集,与现有技术相比降低了特征维数,使得本发明有效缩减了图像特征的计算时间和数据的计算量,为实时检测的目标奠定了基础。
附图说明
图1是本发明的流程图;
图2是本发明中使用的样本图像;
图3是本发明与基于梯度直方图HOG特征人体检测方法的分类器分类性能比较图;
图4是本发明方法与基于梯度直方图HOG特征人体检测方法对光照不均图像进行人体检测的仿真图;
图5是本发明方法与基于梯度直方图HOG特征人体检测方法对复杂背景图像进行人体检测的仿真图。
具体实施方式
下面结合附图对本发明做进一步的描述。
参照附图1,本发明的步骤如下。
步骤1,选择训练样本集图像。
利用自举操作,从INRIA数据库的非人体自然图像中,获得足够的负样本图像。
自举操作的具体步骤如下:
第一步,从INRIA数据库中随机选取m个正样本图像与n个负样本图像,其中100≤m≤500,100≤n≤800,且n≤m≤3n,使用梯度方向直方图HOG特征提取方法,对所选取的所有正负样本图像进行特征提取,利用支持向量机SVM分类器对提取的特征进行分类训练,得到初始分类器。
第二步,连续随机选取INRIA数据库中的非人体自然图像,采用样本图像大小的扫描窗口,从左至右以8个像素为移动单位,从上至下以16个像素为移动单位,扫描整幅被检测的非人体自然图像;将所有的扫描窗口里的图像输入到初始分类器进行检测,保存分类器错分的扫描窗口图像,直至错分的扫描窗口图像数量达到a张,200≤a≤500,停止选取非人体自然图像;从错分的扫描窗口图像中随机挑选b张图像,1/5a≤b≤1/3a,与当前的负样本图像组成新的负样本集。
第三步,对随机选取的m个正样本图像和新的负样本集,进行梯度方向直方图HOG特征提取、训练分类器、检测非人体自然图像及更新负样本集。
第四步,重复执行第三步操作,直至更新后的最终的训练样本集由2416个正样本图像与13500个负样本图像组成,样本的大小均为128×64像素。
将获得的负样本图像与INRIA数据库中的负样本集组成新的负样本集。
将获得的新的负样本集图像与INRIA数据库中的正样本集构成人体训练样本集。
最终的训练样本集中,训练样本集由2416个正样本与13500个负样本组成,训练样本集由2416个正样本与13500个负样本组成,样本图像的大小均为128×64像素,图2是本发明中使用的部分样本图像,其中图2(a)为本发明中使用的部分正样本图像,图2(b)为本发明中使用的为部分负样本图像。
步骤2,进行二维小波变换。
对人体训练样本集中的每幅图像进行二维离散正交小波变换,变换式如下:
其中,Wf(j,m,n)表示人体训练样本集中的每幅图像二维输入信号f(x,y)经二维离散小波变换得到的信号,j表示小波变换的次数,j=1,m,n表示基本小波函数在两个维度上的平移值,f(x,y)表示人体训练样本集中的每幅图像二维输入信号,ψ(x,y)表示二维可积函数空间的正交归一基,ψ(x,y)=ψ(x)ψ(y),ψ(x)表示基本小波函数,满足
步骤3,划分条带波bandelet块。
对小波变换后的人体训练样本集中的每幅图像进行L*L像素大小的二进剖分,将得到的每个L*L像素的小块作为一个条带波bandelet块。
二进剖分的具体步骤如下:
第一步,将人体训练样本集的每幅图像,用64*64像素大小的方块,从上至下以1个像素为移动单位,扫描整幅图像,将每次扫描得到的64*64像素大小的方块作为一个顶层子带。
第二步,对每幅图像上的每个64*64像素大小的顶层子带,均匀分成四个32*32像素大小的子带,每个32*32像素的子带在下一层分割中又被均匀分成四个16*16像素的子带,依次分割直到底层子带大小为预先设定的最小尺度8*8像素为止。
步骤4,获得各采样角的排序索引。
按照下式,将圆周角[0,π]均匀划分成L2个采样角:
其中,θ表示第k+1个采样角的圆周角度数,k为整数,k=0,1,2,...L2-1,L表示条带波bandelet块的宽度,L=8。
对于人体训练样本集中的每幅图像,以每个条带波bandelet块的中心为坐标原点,建立直角坐标系。
对于每个采样角θ,按照下式计算每个条带波bandelet块内每个像素点在采样角θ上的正交投影误差值:
t=-sin(θ)·x(i)+cos(θ)·y(j)
其中,x(i),y(j)分别是块内第i行第j列的像素点在条带波bandelet块内的直角坐标系x轴、y轴上的投影值。
将每个条带波bandelet块上所有像素点按采样角θ的正交投影误差值从小到大的顺序排序,得到一个L2×1的排序索引。
步骤5,获得最佳几何流方向。
对于每幅训练样本图像的每个条带波bandelet块,将步骤(2)得到的块内每个像素点的二维离散小波变换系数按照每个采样角θ的排序索引进行重排,每个采样角θ得到一个小波变换系数重排的一维信号fd。
对每个一维信号fd进行一维离散小波变换,得到变换后信号fθ。
按下式计算变换后信号fθ的量化值fβ的量化系数Q(x):
其中,Q(x)表示量化值fβ的量化系数,x表示变换后信号fθ的系数,T表示量化阈值,T=15,sign(x)表示符号函数,q为常量参数,q∈Z,Z是整数域。
对每个变换后信号fθ按最小拉格朗日函数法,得到条带波bandelet块的最佳几何流方向和最优变换后信号。
最优拉格朗日函数法的具体步骤如下:
第一步,对每个变换后信号fθ按下式计算拉格朗日函数值:
L(fθ,R)=||fθ-fβ||2+λ*T2(Rg+Rb)
其中,L(fθ,R)表示变换后信号fθ的拉格朗日函数值,fθ表示变换后信号,R表示比特数大小,等号右边第一项||fθ-fβ||2表示逼近均方误差,fθ表示变换后信号,fβ表示变换后信号fθ的量化值;等号右边第二项λ*T2(Rg+Rb)表示计算复杂度的惩罚项,λ表示拉格朗日乘子,λ=3/28,T表示量化阈值,T=15,Rg表示编码采样角θ所需比特数,Rb表示编码量化后的每个条带波bandelet系数所需比特数。
第二步,找出使拉格朗日函数值最小的变换后信号fθ,作为条带波bandelet块的最优变换后信号,该最优变换后信号对应的采样角θ作为条带波bandelet块的最佳几何流方向,该最优变换后信号对应的采样角θ的排序索引为条带波bandelet块的最优投影误差排序索引。
步骤6,获取条带波系数矩阵。
将每个bandelet块的最佳几何流方向对应的一维信号fd进行一维小波变换时的小波系数,存储在一个与bandelet块大小相同的二维矩阵中,作为bandelet块的条带波系数矩阵。
步骤7,统计各方向特征。
对图像划分成8*8像素大小的网格,每个格子区域分为9个方向,按方向统计Bandelet系数强度的分布,构成最大几何流向直方图统计特征。
步骤8,分类训练。
使用支持向量机SVM分类器对提取到的最大几何流向直方图统计特征进行分类训练,得到检测分类器。
步骤9,输入图像进行扫描。
输入一幅被检测图像,用窗口扫描法扫描整幅被检测图像,得到一组扫描窗口图像,将该组扫描窗口图像输入到检测分类器。
窗口扫描的具体步骤如下:
第一步,将输入的被检测图像左上角的一个人体训练样本集中样本图像大小的区域作为第一个扫描窗口,将该扫描窗口作为当前扫描窗口,保存当前扫描窗口图像。
第二步,将当前扫描窗口在被检测的图像上向右平移8个像素或下移16个像素得到一个新的扫描窗口,用新的扫描窗口去替换当前扫描窗口,保存当前扫描窗口图像。
第三步,按上述方法移动当前扫描窗口,用移动后的扫描窗口去替换当前扫描窗口直至扫描完整幅被检测的图像为止,保存所有的扫描窗口图像。
步骤10,检测扫描窗口。
10a)用检测分类器判断所输入的扫描窗口图像中是否包含有人体信息,若不存在人体信息,则将该被检测图像判定为非人体自然图像,否则,从判断出的所有有人体的扫描窗口图像中,找出分类器分数最高的扫描窗口图像作为主窗口图像。
10b)从其它的有人体信息的扫描窗口图像中,将与主窗口图像重叠大于50%的扫描窗口图像与主窗口图像进行窗口组合操作,将窗口组合得到的窗口作为一个检测结果保存,并删除所有参与窗口组合的图像。
窗口组合的具体步骤如下:
第一步,将所有需要窗口组合的图像从1开始顺序编号。
第二步,将每幅需要窗口组合的图像的分类器分数,在所有需要窗口组合的图像的分类器分数之和中占的比重作为图像边界加权的权重。
第三步,利用下式,对需要窗口组合的图像的每条边界进行加权。
其中,X表示加权后得到的窗口边界在被检测图像上的所在行的像素值或所在列的像素值,x1,x2,...xN分别表示参与窗口组合的图像边界在被检测图像上的所在行的像素值或所在列的像素值,m1,m2,...mN分别表示参与窗口组合的图像对应的分类器分数,N表示参与窗口组合的图像个数,A表示参与窗口组合的图像分类器分数之和,N表示参与窗口组合的图像个数,i表示窗口组合图像的编号,mi表示第i幅参与窗口组合的图像的分类器分数。
第四步,将加权后的边界组成一个窗口。
10c)判断有人体信息的扫描窗口图像是否还有剩余,如果有,找出剩余的扫描窗口图像中分类器分数最高的图像作为主窗口图像,执行步骤10b),否则,执行步骤11。
步骤11,输出检测结果。
将窗口组合得到的所有窗口在被检测图像上标出,输出标出后的图像,作为被检测图像的人体检测结果。
本发明的效果可通过以下仿真进一步说明:
1、仿真实验条件设置
本发明的仿真实验在Matlab2009a上编译完成,执行环境为Windows框架下的HP工作站。实验所需的正样本图像和负样本图像均取自于INRIA数据库,训练样本包括2416个正样本与13500个负样本,测试样本包括1132个正样本与4050个负样本,正样本与负样本图像的大小均为128×64像素。图2是本发明中使用的部分样本图像,其中图2(a)为本发明中使用的部分正样本图像,图2(b)为本发明中使用的部分负样本图像。
2、仿真内容及结果分析
仿真1:
分别使用本发明和基于梯度直方图HOG特征人体检测方法对人体训练样本集进行特征提取,训练分类器,对获得的分类器性能进行对比。分类器性能对比示意图参照附图3,图3中选择通过比较真阳率TPR(TruePositiveRate)和假阳率FPR(FalsePositivesRates)关系的接收者操作特征ROC(ReceiverOperatingCharacteristic)曲线来评价分类器的性能。ROC曲线越靠上倾向左顶角,其对应的分类器就越优秀。
附图3中的横坐标轴表示假阳率FPR(FalsePositivesRates),纵坐标轴表示真阳率TPR(TruePositiveRate)。附图3中以圆圈标示的曲线表示本发明分类器真阳率和假阳率关系的ROC曲线,以十字标示的曲线表示基于梯度直方图HOG特征人体检测方法的分类器真阳率和假阳率关系的ROC曲线。从图3可见,本发明得到的ROC曲线相比基于梯度直方图HOG特征人体检测方法得到的ROC曲线,更靠上倾向于左顶角,且本发明提取的特征维数为576,有向梯度直方图HOG特征维数为3780,说明本发明在降低特征维数,减少计算复杂度的同时,获得了不错的分类性能。
仿真2:
用本发明与基于梯度直方图HOG特征人体检测方法对来自INRIA数据库的自然图像进行人体检测,检测结果如图4和图5所示。
图4是一幅包含多尺度人体信息的图像,图4(a)表示本方法的人体检测结果,图4(a)中的白色方框,表示本发明的检测分类器检测图像中人体信息后窗口合并的结果。图4(b)表示基于梯度直方图HOG特征人体检测方法的人体检测结果,图4(b)中的白色方框,表示该方法的检测分类器检测图像中人体信息后窗口合并的结果。从图4可以看出,在包含多尺度人体信息的情况下,本发明的方法相较于对比实验方法,能大大的降低虚警率,能更准确的检测出待检测图像中的所有人体信息;
图5是一幅带有背景嘈杂和多人体信息且存在肢体遮挡的图像,图5(a)表示本方法的人体检测结果,图5(a)中的白色方框,表示本发明的检测分类器检测图像中人体信息后窗口合并的结果。图5(b)表示基于梯度直方图HOG特征人体检测方法的人体检测结果,图5(b)中的白色方框,表示该方法的检测分类器检测图像中人体信息后窗口合并的结果。从图5可以看出,在背景嘈杂和多人情况下,使用本发明方法能更准确的标出人体信息,且窗口合并后得到的窗口大小较于基于梯度直方图HOG特征人体检测方法更合适,具有更高的人体检测正确率。
综上,本发明方法能够在多尺度,背景嘈杂且有肢体遮挡的情况下将人体检测出来。从而说明本方法非常适合于自然图像中的人体检测。
Claims (7)
1.一种基于最大几何流向直方图的人体检测方法,包括得到检测分类器和利用所获得的分类器对图像进行检测两个过程,具体实现步骤如下:
第一个过程,得到检测分类器的具体步骤如下:
(1)选择训练样本集图像:
1a)利用自举操作,从INRIA数据库的非人体自然图像中,获得足够的负样本图像;
1b)将获得的负样本图像与INRIA数据库中的负样本集组成新的负样本集;
1c)将获得的新的负样本集图像与INRIA数据库中的正样本集构成人体训练样本集;
(2)进行二维小波变换:
对人体训练样本集中的每幅图像进行二维离散正交小波变换;
(3)划分条带波bandelet块:
对小波变换后的人体训练样本集中的每幅图像进行L*L像素大小的二进剖分,将得到的每个L*L像素的小块作为一个条带波bandelet块;
(4)获得各采样角排序索引:
4a)按照下式,将圆周角[0,π]均匀划分成L2个采样角:
其中,θ表示第k+1个采样角的圆周角度数,k为整数,k=0,1,2,...L2-1,L表示条带波bandelet块的宽度,L=8;
4b)对于人体训练样本集中的每幅图像,以每个条带波bandelet块的中心为坐标原点,建立直角坐标系;
4c)对于每个采样角θ,按照下式计算每个条带波bandelet块内每个像素点在采样角θ上的正交投影误差值:
t=-sin(θ)·x(i)+cos(θ)·y(j)
其中,x(i),y(j)分别是块内第i行第j列的像素点在条带波bandelet块内的直角坐标系x轴、y轴上的投影值;
4d)将每个条带波bandelet块上所有像素点按采样角θ的正交投影误差值从小到大的顺序排序,得到一个L2×1的排序索引;
(5)获得最佳几何流方向:
5a)对于每幅训练样本图像的每个条带波bandelet块,将步骤(2)得到的块内每个像素点的二维离散小波变换系数按照每个采样角θ的排序索引进行重排,每个采样角θ得到一个小波变换系数重排的一维信号fd;
5b)对每个一维信号fd进行一维离散小波变换,得到变换后信号fθ;
5c)按下式计算变换后信号fθ的量化值fβ的量化系数Q(x):
其中,Q(x)表示量化值fβ的量化系数,x表示变换后信号fθ的系数,T表示量化阈值,T=15,sign(x)表示符号函数,q为常量参数,q∈Z,Z是整数域;
5d)对每个变换后信号fθ按最小拉格朗日函数法,得到条带波bandelet块的最佳几何流方向和最优变换后信号;
(6)获取条带波系数矩阵:
将人体训练样本集中的每幅图像的每个条带波bandelet块的最优变换后信号对应的小波系数,存储到一个与条带波bandelet块大小相同的二维矩阵中,作为条带波bandelet块的条带波系数矩阵;
(7)统计各方向特征:
对人体训练样本集中的每幅图像,将每个L*L像素大小的图像块区域等分为9个方向,统计条带波系数在各个方向上的分布,构成最大几何流向直方图统计特征;
(8)分类训练:
使用支持向量机SVM分类器对提取到的最大几何流向直方图统计特征进行分类训练,得到检测分类器;
第二个过程,利用所获得的分类器对图像进行检测的具体步骤如下:
(9)输入图像进行扫描:
输入一幅被检测图像,用窗口扫描法扫描整幅被检测图像,得到一组扫描窗口图像,将该组扫描窗口图像输入到检测分类器;
(10)检测扫描窗口:
10a)用检测分类器判断所输入的扫描窗口图像中是否包含有人体信息,若不存在人体信息,则将该被检测图像定位为非人体自然图像,否则,从判断出的所有有人体信息的扫描窗口图像中,找出检测分类器分数最高的扫描窗口图像作为主窗口图像;
10b)从主窗口图像以外剩余的有人体信息的扫描窗口图像中,将与主窗口图像重叠大于50%的扫描窗口图像与主窗口图像进行窗口组合操作,将窗口组合得到的窗口作为一个检测结果保存,删除所有参与窗口组合的图像;
10c)判断有人体信息的扫描窗口图像是否还有剩余,如果有,找出剩余的扫描窗口图像中检测分类器分数最高的图像作为主窗口图像,执行步骤10b),否则,执行步骤(11);
(11)输出检测结果:
将窗口组合得到的所有窗口在被检测图像上标出,输出标出后的图像,作为被检测图像的人体检测结果。
2.根据权利要求1所述的最大几何流向直方图的人体检测方法,其特征在于:步骤(1)所述选择训练样本集图像的具体步骤如下:
第一步,从INRIA数据库中随机选取m个正样本图像与n个负样本图像,其中100≤m≤500,100≤n≤800,且n≤m≤3n,使用梯度方向直方图HOG特征提取方法,对所选取的所有正负样本图像进行特征提取,利用支持向量机SVM分类器对提取的特征进行分类训练,得到初始分类器;
第二步,连续随机选取INRIA数据库中的非人体自然图像,采用样本图像大小的扫描窗口,从左至右以8个像素为移动单位,从上至下以16个像素为移动单位,扫描整幅被检测的非人体自然图像;将所有的扫描窗口里的图像输入到初始分类器进行检测,保存分类器错分的扫描窗口图像,直至错分的扫描窗口图像数量达到a张,200≤a≤500,停止选取非人体自然图像;从错分的扫描窗口图像中随机挑选b张图像,1/5a≤b≤1/3a,与当前的负样本图像组成新的负样本集;
第三步,对随机选取的m个正样本图像和新的负样本集,进行梯度方向直方图HOG特征提取、训练分类器、检测非人体自然图像及更新负样本集;
第四步,重复执行第三步操作,直至更新后的最终的训练样本集由2416个正样本图像与13500个负样本图像组成,样本的大小均为128×64像素。
3.根据权利要求1所述的最大几何流向直方图的人体检测方法,其特征在于:步骤(2)所述二维离散正交小波变换按照如下公式进行:
其中,Wf(j,m,n)表示人体训练样本集中的每幅图像二维输入信号f(x,y)经二维离散小波变换得到的信号,j表示小波变换的次数,j=1,m,n表示基本小波函数在两个维度上的平移值,f(x,y)表示人体训练样本集中的每幅图像二维输入信号,ψ(x,y)表示二维可积函数空间的正交归一基,ψ(x,y)=ψ(x)ψ(y),ψ(x)表示基本小波函数,满足
4.根据权利要求1所述的最大几何流向直方图的人体检测方法,其特征在于:步骤(3)所述二进剖分的具体步骤如下:
第一步,将人体训练样本集的每幅图像,用64*64像素大小的方块,从上至下以1个像素为移动单位,扫描整幅图像,将每次扫描得到的64*64像素大小的方块作为一个顶层子带;
第二步,对每幅图像上的每个64*64像素大小的顶层子带,均匀分成四个32*32像素大小的子带,每个32*32像素的子带在下一层分割中又被均匀分成四个16*16像素的子带,依次分割直到底层子带大小为预先设定的最小尺度8*8像素为止。
5.根据权利要求1所述的最大几何流向直方图的人体检测方法,其特征在于:步骤5d)所述最小拉格朗日函数法的具体步骤如下:
第一步,对每个变换后信号fθ按下式计算拉格朗日函数值:
L(fθ,R)=||fθ-fβ||2+λ*T2(Rg+Rb)
其中,L(fθ,R)表示变换后信号fθ的拉格朗日函数值,fθ表示变换后信号,R表示比特数大小,等号右边第一项||fθ-fβ||2表示逼近均方误差,fθ表示变换后信号,fβ表示变换后信号fθ的量化值;等号右边第二项λ*T2(Rg+Rb)表示计算复杂度的惩罚项,λ表示拉格朗日乘子,λ=3/28,T表示量化阈值,T=15,Rg表示编码采样角θ所需比特数,Rb表示编码量化后的每个条带波bandelet系数所需比特数;
第二步,找出使拉格朗日函数值最小的变换后信号fθ,作为条带波bandelet块的最优变换后信号,该最优变换后信号对应的采样角θ作为条带波bandelet块的最佳几何流方向,该最优变换后信号对应的采样角θ的排序索引为条带波bandelet块的最优投影误差排序索引。
6.根据权利要求1所述的最大几何流向直方图的人体检测方法,其特征在于:步骤(9)所述窗口扫描法的具体步骤如下:
第一步,将输入的被检测图像左上角的一个人体训练样本集中样本图像大小的区域作为第一个扫描窗口,将该扫描窗口作为当前扫描窗口,保存当前扫描窗口图像;
第二步,将当前扫描窗口在被检测的图像上向右平移8个像素或下移16个像素得到一个新的扫描窗口,用新的扫描窗口去替换当前扫描窗口,保存当前扫描窗口图像;
第三步,按上述方法移动当前扫描窗口,用移动后的扫描窗口去替换当前扫描窗口直至扫描完整幅被检测的图像为止,保存所有的扫描窗口图像。
7.根据权利要求1所述的最大几何流向直方图的人体检测方法,其特征在于:步骤10b)所述窗口组合操作的具体步骤如下:
第一步,将所有需要窗口组合的图像从1开始顺序编号;
第二步,将每幅需要窗口组合的图像的分类器分数,在所有需要窗口组合的图像的分类器分数之和中占的比重作为图像边界加权的权重;
第三步,利用下式,对需要窗口组合的图像的每条边界进行加权:
其中,X表示加权后得到的窗口边界在被检测图像上的所在行的像素值或所在列的像素值,x1,x2,...xN分别表示参与窗口组合的图像边界在被检测图像上的所在行的像素值或所在列的像素值,m1,m2,...mN分别表示参与窗口组合的图像对应的分类器分数,N表示参与窗口组合的图像个数,A表示参与窗口组合的图像分类器分数之和,N表示参与窗口组合的图像个数,i表示窗口组合图像的编号,mi表示第i幅参与窗口组合的图像的分类器分数;
第四步,将加权后的边界组成一个窗口。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310405036.3A CN103455798B (zh) | 2013-09-08 | 2013-09-08 | 基于最大几何流向直方图的人体检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310405036.3A CN103455798B (zh) | 2013-09-08 | 2013-09-08 | 基于最大几何流向直方图的人体检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103455798A CN103455798A (zh) | 2013-12-18 |
CN103455798B true CN103455798B (zh) | 2016-06-29 |
Family
ID=49738142
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310405036.3A Expired - Fee Related CN103455798B (zh) | 2013-09-08 | 2013-09-08 | 基于最大几何流向直方图的人体检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103455798B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104598900A (zh) * | 2015-02-26 | 2015-05-06 | 张耀 | 一种人体识别方法以及装置 |
CN110458227B (zh) * | 2019-08-08 | 2021-11-23 | 杭州电子科技大学 | 一种基于混合分类器的adas行人检测方法 |
CN110575176B (zh) * | 2019-08-26 | 2024-03-26 | 南京理工大学 | 基于两层滑动窗口阈值的动作分割方法 |
CN117647826B (zh) * | 2024-01-29 | 2024-04-12 | 成都星历科技有限公司 | 基于干扰源定位的导航欺骗干扰信号的检测***及方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102663449A (zh) * | 2012-03-12 | 2012-09-12 | 西安电子科技大学 | 基于最大几何流向直方图的人体运动跟踪方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100664956B1 (ko) * | 2004-11-24 | 2007-01-04 | 삼성전자주식회사 | 눈 검출 방법 및 장치 |
-
2013
- 2013-09-08 CN CN201310405036.3A patent/CN103455798B/zh not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102663449A (zh) * | 2012-03-12 | 2012-09-12 | 西安电子科技大学 | 基于最大几何流向直方图的人体运动跟踪方法 |
Also Published As
Publication number | Publication date |
---|---|
CN103455798A (zh) | 2013-12-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109840521B (zh) | 一种基于深度学习的一体化车牌识别方法 | |
CN103761531B (zh) | 基于形状轮廓特征的稀疏编码车牌字符识别方法 | |
CN103049763B (zh) | 一种基于上下文约束的目标识别方法 | |
CN110738207A (zh) | 一种融合文字图像中文字区域边缘信息的文字检测方法 | |
CN103810704B (zh) | 基于支持向量机和判别随机场的sar图像变化检测方法 | |
CN110348319A (zh) | 一种基于人脸深度信息和边缘图像融合的人脸防伪方法 | |
CN106529448A (zh) | 利用聚合通道特征进行多视角人脸检测的方法 | |
CN101930549B (zh) | 基于第二代曲线波变换的静态人体检测方法 | |
CN106250895A (zh) | 一种光学遥感图像感兴趣区域检测方法 | |
CN104732215A (zh) | 一种基于信息向量机的遥感影像海岸线提取方法 | |
CN106296638A (zh) | 显著性信息取得装置以及显著性信息取得方法 | |
CN106778687A (zh) | 基于局部评估和全局优化的注视点检测方法 | |
CN102163281B (zh) | 基于AdaBoost框架和头部颜色的实时人体检测方法 | |
CN107256547A (zh) | 一种基于显著性检测的表面裂纹识别方法 | |
CN104240256A (zh) | 一种基于层次化稀疏建模的图像显著性检测方法 | |
CN104299232B (zh) | 一种基于自适应窗方向波域和改进fcm的sar图像分割方法 | |
CN104573685A (zh) | 一种基于线性结构提取的自然场景文本检测方法 | |
CN106557740B (zh) | 一种遥感图像中油库目标的识别方法 | |
CN107480585A (zh) | 基于dpm算法的目标检测方法 | |
CN106056553A (zh) | 基于紧框架特征字典的图像修复方法 | |
CN103455798B (zh) | 基于最大几何流向直方图的人体检测方法 | |
CN108229551A (zh) | 一种基于紧凑字典稀疏表示的高光谱遥感图像分类方法 | |
CN105405138A (zh) | 基于显著性检测的水面目标跟踪方法 | |
CN103473545A (zh) | 一种基于多特征的文本图像相似度度量方法 | |
CN107067410A (zh) | 一种基于增广样本的流形正则化相关滤波目标跟踪方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20160629 Termination date: 20210908 |
|
CF01 | Termination of patent right due to non-payment of annual fee |