发明内容
基于此,针对上述技术问题,提供一种非刚体目标检测方法及其***。
为解决上述技术问题,本发明采用如下技术方案:
一种非刚体目标检测方法,包括:
采用selective search region proposals算法对输入图像进行似物体检测,找出输入图像中可能存在似物体目标的矩形区域;
通过预训练的非刚体目标模型对获得的每个矩形区域进行特征提取,获得每个矩形区域的HSC特征以及纹理特征,所述非刚体目标模型为融合纹理特征的HSC特征模型,其由加入纹理特征的HSC特征样本训练构成;
按照HSC特征以及纹理特征的分辨率以金字塔形状排列每个矩形区域的HSC特征以及纹理特征,构成特征金子塔;
对所述特征金字塔进行PCA投影,在低维度的特征金子塔空间进行模式分类;
对金字塔的每个尺度,分别用每个root进行卷积,得到每层金字塔层的root得分图;
在root层的每个对应的part层,用所有part滤波器进行卷积,得到所有part的得分图;
距离转换重构每个root对应的所有part得分,减去偏移惩罚,综合各个模型以及各个组件的结果,得到各个位置的最终得分,同模型的阈值进行比较判断,得到所述矩形区域的非刚体目标的位置。
该方法在所述通过预训练的非刚体目标模型对获得的每个矩形区域进行特征提取步骤前,先对每个矩形区域进行边缘扩展。
本方案还涉及一种非刚体目标检测***,包括:
似物体检测单元,用于采用selective search region proposals算法对输入图像进行似物体检测,找出输入图像中可能存在似物体目标的矩形区域;
特征提取单元,用于通过预训练的非刚体目标模型对获得的每个矩形区域进行特征提取,获得每个矩形区域的HSC特征以及纹理特征,所述非刚体目标模型为融合纹理特征的HSC特征模型,其由加入纹理特征的HSC特征样本训练构成;
特征金字塔构建单元,用于按照HSC特征以及纹理特征的分辨率以金字塔形状排列每个矩形区域的HSC特征以及纹理特征,构成特征金子塔;
模式分类单元,用于对所述特征金字塔进行PCA投影,在低维度的特征金子塔空间进行模式分类;
root得分计算单元,用于对金字塔的每个尺度,分别用每个root进行卷积,得到每层金字塔层的root得分图;
part得分计算单元,用于在root层的每个对应的part层,用所有part滤波器进行卷积,得到所有part的得分图;
非刚体目标判断单元,用于距离转换重构每个root对应的所有part得分,减去偏移惩罚,综合各个模型以及各个组件的结果,得到各个位置的最终得分,同模型的阈值进行比较判断,得到所述矩形区域的非刚体目标的位置。
本方案还包括边缘扩展单元,用于在所述通过预训练的非刚体目标模型对获得的每个矩形区域进行特征提取前,先对每个矩形区域进行边缘扩展。
本发明具有以下优点:
1、与现有的hog特征相比,加入纹理的变种HSC特征训练后的非刚体目标模型对行人等几类形变比较大的常见非刚体目标具有更强的表征能力,检测效果较hog,更佳。
2,目标的检索空间变小了很多,并且几乎所有的可能存在目标的区域都得到了检索,所以算法运行速度既快且漏检率更低。
3,能够更好的处理变形大的非刚体目标,并且对存在部分遮挡的目标检测效果明显增强。
具体实施方式
如图1所示,一种非刚体目标检测方法,包括:
S101、采用selective search region proposals算法对输入图像进行似物体检测,找出输入图像中可能存在似物体目标的矩形区域。
具体的,可采用以下算法找出矩形区域:
selective search region proposals算法(Selective search for objectrecognition.IJCV,2013);
objectness算法(Measuring the objectness of image windows.TPAMI,2012);
category-independent object proposals算法(Category independent objectproposals.In ECCV2010);
onstrained arametric min-cuts(CPMC)算法(Automatic object segmtationusing constrained parametric min-cuts.TPAMI,2012.)。
S102、在利用非刚体目标模型对矩形区域提取特征之前,可以先对每个矩形区域进行边缘扩展,因为似物体检测得到的一些结果可能刚好在某一方向边缘分割的比较紧凑,不太适合做特定的目标模式分类。
S103、通过预训练的非刚体目标模型对获得的每个矩形区域进行特征提取,获得每个矩形区域的HSC特征以及纹理特征。
非刚体目标模型为融合纹理特征的HSC特征模型,其由加入纹理特征的HSC特征样本训练构成。
具体地,非刚体目标模型的离线训练学习的方法包括以下四个迭代环节:
1、根滤波器的初始化。参考训练数据的边界盒的统计数值,自动选择根滤波器的尺寸,通过训练一个不带隐含变量的SVM得到一个初始根滤波器F0,正例为未被遮挡的训练样本。
2、根滤波器的更新。给定训练得到的初始根滤波器,对每个训练集的边界盒为过滤器挑选一个最高分的位置,通过训练的正例和原始的随机负例得到新的FO,迭代两次。
3、部件滤波器的初始化。从训练得到的根滤波器寻找六个部件启发式方法:首先选择面积a,满足6a的面积与根滤波器的面积相等。从根滤波器中贪婪搜索选择一个面积为a的矩形区域,该区域拥有最大的能量。正能量表示为该区域的所有cell的正权重范式平方之和。将该区域的所有权重置0并继续选择,直到选出六个矩形区域。部件滤波器的初始值为其所在根滤波器子窗口的权值。
4、模型更新。建立新的训练数据三元组用于模型训练,调整所有部件窗口使之与边界盒重叠至少百分之五十。再此基础上更新的步骤如下:设置一个固定大小的cache,选择得分最高的位置作为这个边界盒的正样本,cache中更新正样本。在不包含目标物体的图像中检测高得分的位置作为负样本。向cache添加最大数目的负样本,对cache的样本进行SVM训练得到新的模型。按照以上方法迭代更新模型十次。在每次迭代中保留先前缓冲区难样本,并增加尽量多的难样本。迭代完成后,可以获得模型的所有参数。
S104、按照HSC特征以及纹理特征的分辨率以金字塔形状排列每个矩形区域的HSC特征以及纹理特征,构成特征金子塔,金字塔的底部是高分辨率的特征,而顶部是低分辨率的特征,当向金字塔的上层移动时,尺寸和分辨率就降低。
S105、对特征金字塔进行PCA投影,在低维度的特征金子塔空间进行模式分类。
模式分类是指对表征事物或现象的各种形式的,数值的,文字的和逻辑关系的信息处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。
S106、对金字塔的每个尺度,分别用每个root进行卷积,得到每层金字塔层的root得分图。
其中,每个root是指每个根滤波器。
S107、在root层的每个对应的part层,用所有part滤波器进行卷积,得到所有part的得分图。
S108、距离转换重构每个root对应的所有part得分,减去偏移惩罚,综合各个模型以及各个组件的结果,得到各个位置的最终得分,同模型的阈值进行比较判断,得到矩形区域的非刚体目标的位置。
其中,各个模型是指训练时采用的几个根滤波器,本实施例采用6个混合模型来做训练,每个模型又由8个组件构成。
如图2所示,本方案还涉及一种非刚体目标检测***,包括似物体检测单元11、边缘扩展单元12、特征提取单元13、特征金字塔构建单元14、模式分类单元15、root得分计算单元16、part得分计算单元17以及非刚体目标判断单元18。
似物体检测单元11,用于对输入图像进行似物体检测,找出输入图像中可能存在似物体目标的矩形区域。
具体的,可采用以下算法找出矩形区域:
selective search region proposals算法(Selective search for objectrecognition.IJCV,2013);
objectness算法(Measuring the objectness of image windows.TPAMI,2012);
category-independent object proposals算法(Category independent objectproposals.In ECCV2010);
onstrained arametric min-cuts(CPMC)算法(Automatic object segmtationusing constrained parametric min-cuts.TPAMI,2012.)。
边缘扩展单元12,用于在利用非刚体目标模型对矩形区域提取特征之前,先对每个矩形区域进行边缘扩展,因为似物体检测得到的一些结果可能刚好在某一方向边缘分割的比较紧凑,不太适合做特定的目标模式分类。
特征提取单元13,用于通过预训练的非刚体目标模型对获得的每个矩形区域进行特征提取,获得每个矩形区域的HSC特征以及纹理特征,非刚体目标模型为融合纹理特征的HSC特征模型,其由加入纹理特征的HSC特征样本训练构成。
具体地,非刚体目标模型的离线训练学习的方法包括以下四个迭代环节:
1、根滤波器的初始化。参考训练数据的边界盒的统计数值,自动选择根滤波器的尺寸,通过训练一个不带隐含变量的SVM得到一个初始根滤波器F0,正例为未被遮挡的训练样本。
2、根滤波器的更新。给定训练得到的初始根滤波器,对每个训练集的边界盒为过滤器挑选一个最高分的位置,通过训练的正例和原始的随机负例得到新的FO,迭代两次。
3、部件滤波器的初始化。从训练得到的根滤波器寻找六个部件启发式方法:首先选择面积a,满足6a的面积与根滤波器的面积相等。从根滤波器中贪婪搜索选择一个面积为a的矩形区域,该区域拥有最大的能量。正能量表示为该区域的所有cell的正权重范式平方之和。将该区域的所有权重置0并继续选择,直到选出六个矩形区域。部件滤波器的初始值为其所在根滤波器子窗口的权值。
4、模型更新。建立新的训练数据三元组用于模型训练,调整所有部件窗口使之与边界盒重叠至少百分之五十。再此基础上更新的步骤如下:设置一个固定大小的cache,选择得分最高的位置作为这个边界盒的正样本,cache中更新正样本。在不包含目标物体的图像中检测高得分的位置作为负样本。向cache添加最大数目的负样本,对cache的样本进行SVM训练得到新的模型。按照以上方法迭代更新模型十次。在每次迭代中保留先前缓冲区难样本,并增加尽量多的难样本。迭代完成后,可以获得模型的所有参数。
特征金字塔构建单元14,用于按照HSC特征以及纹理特征的分辨率以金字塔形状排列每个矩形区域的HSC特征以及纹理特征,构成特征金子塔,金字塔的底部是高分辨率的特征,而顶部是低分辨率的特征,当向金字塔的上层移动时,尺寸和分辨率就降低。
模式分类单元15,用于对特征金字塔进行PCA投影,在低维度的特征金子塔空间进行模式分类。
模式分类是指对表征事物或现象的各种形式的,数值的,文字的和逻辑关系的信息处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。
root得分计算单元16,用于对金字塔的每个尺度,分别用每个root进行卷积,得到每层金字塔层的root得分图。
其中,每个root是指每个根滤波器。
part得分计算单元17,用于在root层的每个对应的part层,用所有part滤波器进行卷积,得到所有part的得分图;
非刚体目标判断单元18,用于距离转换重构每个root对应的所有part得分,减去偏移惩罚,综合各个模型以及各个组件的结果,得到各个位置的最终得分,同模型的阈值进行比较判断,得到所述矩形区域的非刚体目标的位置。
其中,各个模型是指训练时采用的几个根滤波器,本实施例采用6个混合模型来做训练,每个模型又由8个组件构成。
但是,本技术领域中的普通技术人员应当认识到,以上的实施例仅是用来说明本发明,而并非用作为对本发明的限定,只要在本发明的实质精神范围内,对以上所述实施例的变化、变型都将落在本发明的权利要求书范围内。