CN104933441B - 目标检测***及方法 - Google Patents

目标检测***及方法 Download PDF

Info

Publication number
CN104933441B
CN104933441B CN201510323680.5A CN201510323680A CN104933441B CN 104933441 B CN104933441 B CN 104933441B CN 201510323680 A CN201510323680 A CN 201510323680A CN 104933441 B CN104933441 B CN 104933441B
Authority
CN
China
Prior art keywords
target object
filter
svm
deformable part
characteristic pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201510323680.5A
Other languages
English (en)
Other versions
CN104933441A (zh
Inventor
华宝洪
汪蒲阳
扈戈洋
高斌
陈俊宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING KEFUXING SCIENCE AND TECHNOLOGY CO LTD
Original Assignee
BEIJING KEFUXING SCIENCE AND TECHNOLOGY CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING KEFUXING SCIENCE AND TECHNOLOGY CO LTD filed Critical BEIJING KEFUXING SCIENCE AND TECHNOLOGY CO LTD
Priority to CN201510323680.5A priority Critical patent/CN104933441B/zh
Publication of CN104933441A publication Critical patent/CN104933441A/zh
Application granted granted Critical
Publication of CN104933441B publication Critical patent/CN104933441B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/08Detecting or categorising vehicles

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)
  • Radar Systems Or Details Thereof (AREA)

Abstract

本发明公开了一种目标检测方法,所述方法包括:获取输入图像的特征图及两倍分辨率特征图;可变形部件模型的根滤波器作用在所述特征图上,抓取目标物体的全局特征,可变形部件模型的各个部件滤波器作用在所述两倍分辨率的特征图上,抓取目标物体的局部特征;基于最大期望EM算法训练的多个支持向量机SVM分类器根据目标物体的全局特征以及局部特征,识别所述输入图像中的目标物体;输出检测结果。相应的还公开了一种目标检测***,不仅检测精度和性能已经能够满足实际要求,而且有望在短期内达到大规模工业化的应用。

Description

目标检测***及方法
技术领域
本发明涉及目标检测技术领域,尤其涉及一种目标检测***及方法。
背景技术
目前,目标检测在学术上有许多模型,其中可形变部件模型(Deformable PartModel,DPM)是最近最为流行的图形中物体检测模型,由于能准确的检测出目标而受到欢迎,是公认最好的目标检测算法。
但是,目前使用DPM的目标检测技术应用于车辆、行人的检测时,其检测效果仍需提升。现有目标检测技术检测效率、检测精度不仅未能达到实际要求,而且难以大规模工业化应用。
发明内容
为解决现有目标检测技术检测效率、检测精度未能达到实际要求的技术问题,本发明实施例提供一种目标检测***及方法。
为达到上述目的,本发明实施例的技术方案是这样实现的:
一种目标检测方法,所述方法包括:
获取输入图像的特征图及两倍分辨率特征图;
可变形部件模型的根滤波器作用在所述特征图上,抓取目标物体的全局特征,可变形部件模型的各个部件滤波器作用在所述两倍分辨率的特征图上,抓取目标物体的局部特征;
基于最大期望EM算法训练的多个支持向量机(SVM,Support Vector Machine)分类器根据目标物体的全局特征以及局部特征,识别所述输入图像中的目标物体;
输出检测结果。
其中,所述根滤波器与所述多个部件滤波器构成星型模型。
其中,所述部件滤波器的位置可移动,所述局部特征包括目标物体的形态变化特征。
其中,基于EM算法训练混合SVM模型,通过多个线性SVM模型之间的相互补偿作用,将需检测的目标物体按照视角或者形状的不同分为多个子类,为每个子类构建对应的SVM模型,得到多个SVM分类器,以检测出各种不同视角下的目标物体。
其中,所述可变形部件模型为加权可变形部件模型。
一种目标检测***,所述***包括:
特征图单元,获取输入图像的特征图及两倍分辨率特征图;
可变形部件模型单元,包括一个根滤波器和多个部件滤波器,所述根滤波器用于作用在所述特征图上,抓取目标物体的全局特征,各个所述部件滤波器用于作用在所述两倍分辨率的特征图上,抓取目标物体的局部特征;
分类器单元,包括基于EM算法训练的多个SVM分类器,用于根据目标物体的所述全局特征以及局部特征,识别所述输入图像中的目标物体,并输出检测结果。
其中,所述根滤波器与所述多个部件滤波器构成星型结构。
其中,所述部件滤波器的位置可移动,所述局部特征包括目标物体的形态变化特征。
其中,所述分类器单元为基于EM算法训练混合SVM模型,通过多个线性SVM模型之间的相互补偿作用,将需检测的目标物体按照视角或者形状的不同分为多个子类,为每个子类构建对应的SVM模型,得到多个SVM分类器,以检测出各种不同视角下的目标物体。
其中,所述可变形部件模型为加权可变形部件模型。
本发明实施例,通过可变形部件模型以及多个SVM分类器实现目标检测,不仅能够显著提升检测效率、检测精度,检测精度和性能已经能够满足实际要求,并有望在短期内达到大规模工业化的应用。可以应用在车流量统计、人流量统计、汽车安全驾驶、车辆违规检测等方面。
附图说明
在附图(其不一定是按比例绘制的)中,相似的附图标记可在不同的视图中描述相似的部件。具有不同字母后缀的相似附图标记可表示相似部件的不同示例。附图以示例而非限制的方式大体示出了本文中所讨论的各个实施例。
图1为本发明实施例目标检测方法的流程图;
图2为本发明实施例目标检测***的组成结构示意图;
图3为本发明实施例多个SVM对原始问题的子划分示意图;
图4为本发明实施例在联合EM算法框架下对混合SVM的训练过程示意图;
图5为本发明实施例针对直立行人的检测示意图;
图6为本发明实施例混合SVM模型在PASCAL VOC2007数据集上进行测试时在20类上的检测平均精度示意图。
具体实施方式
实施例一
本发明实施例提供一种目标检测方法,如图1所示,主要可以包括如下步骤:
步骤101,获取输入图像的特征图及两倍分辨率特征图;
步骤102,可变形部件模型的根滤波器作用在所述特征图上,抓取目标物体的全局特征,可变形部件模型的各个部件滤波器作用在所述两倍分辨率的特征图上,抓取目标物体的局部特征;
步骤103,基于EM算法训练的多个SVM分类器根据目标物体的全局特征以及局部特征,识别所述输入图像中的目标物体;
其中,在机器学习领域,支持向量机(SVM,Support Vector Machine)是一个有监督的学习模型,通常用来进行模式识别、分类、以及回归分析。
步骤104,输出检测结果。
本发明实施例的目标检测方法可应用于车流量的统计项目中,其检测精度和性能已经达到实际要求,并有望在短期内达到大规模工业化的应用。同时其也可以应用在人流量统计、汽车的安全驾驶、车辆违规检测等方面。
实施例二
本发明实施例提供一种目标检测***,如图2所示,所述***包括:
特征图单元21,获取输入图像的特征图及两倍分辨率特征图;
可变形部件模型单元22,包括一个根滤波器和多个部件滤波器,所述根滤波器用于作用在所述特征图上,抓取目标物体的全局特征,各个所述部件滤波器用于作用在所述两倍分辨率的特征图上,抓取目标物体的局部特征;
分类器单元23,包括基于EM算法训练的多个SVM分类器,用于根据目标物体的所述全局特征以及局部特征,识别所述输入图像中的目标物体,并输出检测结果。
本发明实施例的目标检测***可应用于车流量的统计项目中,其检测精度和性能已经达到实际要求,并有望在短期内达到大规模工业化的应用。同时其也可以应用在人流量统计、汽车的安全驾驶、车辆违规检测等方面。
实施例三
本实施例对本发明实施例的目标检测方法及***的具体实现进行详细说明。
本发明实施例的目标检测方法及***主要基于加权的可变形部件模型和EM训练混合SVM等技术,在行人和车辆等类似物体的检测上取得了很好的效果。
其中,可变形部件模型是由一个根滤波器和若干部件滤波器构成的一个星形模型,该可变形部件模型综合考虑了目标的整体信息及各部分的表象信息及其空间关系,可以提取到比基于整体的方法更加丰富的信息。
该可变形部件模型的主要特点有以下两点:
(1)全局与局部相结合的特征描述能力,根滤波器对目标来讲是一种全局模板,可以抓住目标的全局特征,而部件滤波器是一种局部模板,并且作用在二倍分辨率的特征图上,可以有效地描述目标的局部特征;
(2)对于目标形态变化的描述能力,由于根滤波器是刚性的,不具备处理形变的能力,而在可变形部件模型中部件滤波器的位置是可以移动的,该特性能够有效地处理人体等目标的形态变化。
因此,采用根滤波器与部件滤波器构成的星型结构能有效地提升检测性能。
该检测***在可变形部件模型的基础上提出了以下两点改进用以提升可变形部件模型的检测性能:
1)加权部件模型。综合分析各个部件分类器性能的强弱,通过加权部件可以加强显著区域的分类性能,强化一些部件在检测效果中的利用。
这里,加权部件模型即为加权的可变形部件模型,对不同的部件加以不同的权重,相当于给可变形部件模型的每一个部件对应的检测得分乘上一个权重使更有效的部件受到更多的重视,最大化的发挥各个部件的作用,从而得到更好的检测效果。
2)由于单一的线性SVM模型并不能有效地对二分类问题的分类进行解决,而非线性的SVM模型的计算复杂度又很高,难以达到实时检测的目的。本发明实施例采用通过EM算法训练混合SVM模型。
EM算法,即最大期望算法(Expectation Maximization Algorithm,又译期望最大化算法),是一种迭代算法,用于含有隐变量(hidden variable)的概率参数模型的最大似然估计或极大后验概率估计。在统计计算中,EM算法是在概率(probabilistic)模型中寻找参数最大似然估计或者最大后验估计的算法,其中概率模型依赖于无法观测的隐藏变量(Latent Variable)。最大期望经常用在机器学习和计算机视觉的数据聚类(DataClustering)领域。
EM算法经过两个步骤交替进行计算:第一步是计算期望(E),利用对隐藏变量的现有估计值,计算其最大似然估计值;第二步是最大化(M),最大化在E步上求得的最大似然值来计算参数的值。M步上找到的参数估计值被用于下一个E步计算中,这个过程不断交替进行,迭代使用EM步骤,直至收敛。
本发明实施例中,基于EM算法训练多个线性SVM模型之间的相互补偿作用,一直持续到收敛为止。而该模型的关键问题是各个子模型之间的交互和分配方法,利用EM算法训练该混合SVM模型,将SVM的输出转化为概率,然后利用EM的框架联合训练该混合SVM模型,这样可以使得各个子类模型的检测性能之间相互补偿,通过实验验证了其收敛性和有效性。
本发明实施例中,通过多个线性SVM模型之间的相互补偿作用,将需检测的目标按照视角或者形状的不同分为若干子类,使得各个子类之间的相似度很高,然后为每个子类构建对应的检测模型,通过多个SVM模型的组合可以克服目标类别的类内差异对检测性能的影响,从而准确检测出各种不同视角下的目标,达到提升检测效果的目标。
图3和图4分别表示了通过多个SVM对原始问题的子划分和在基于EM算法框架下对混合SVM的训练过程。
如图4所示,混合SVM的训练过程包括如下步骤,其中输入包括正样本P、负样本N和初始化模型ω、β,输出包括新的检测数学模型βnew,ωnew
步骤401:训练前先把所有样本分成M类,每类用分类器ω、β去做后续训练。对于所有的正样本集(xi,yi)执行以下迭代步骤:
步骤402:用SVM分类器对输入的样本计算,输出的结果按照以下公式(1)描述的模型进行概率转换。
步骤403:执行M操作;
对于每个样本,按照pk(xi)的值进行排序,最大的pk(xi)的正样本所在的样本集将送到步骤4进行迭代计算。
步骤404:对于通过EM方法计算出的样本集,通过以下公式(2)、(3)计算出加权值α;
步骤405:在EM方法得到样本集上训练加权部件SVM的参数ω、β,得到新的检测数学模型βnew,ωnew
如图5所示,将本发明实施例的目标检测***及方法应用于直立行人的检测,其具体实现过程可以包括:
步骤a1,输入图像;
步骤a2,获取输入图像的特征图和两倍分辨率上的特征图;
步骤a3,根滤波器作用于所述特征图,得到根滤波器的响应图像;各个部件滤波器作用于两倍分辨率上的特征图,得到部件滤波器的响应图像,并进一步得到距离变换后的响应;
步骤a4,将根滤波器的响应图像以及各个部件滤波器的响应图像合并,通过多个SVM分类器识别出输入图像中的目标;
步骤a5,将检测结果并输出。
这里,检测结果中,在输入图像中以画框的方式圈出检测到的各个目标。
本发明实施例的目标检测***及方法已成功应用于车流量的统计中,其检测精度和性能已经达到实际要求,并有望在短期内达到大规模工业化的应用。同时也可以应用于人流量统计、汽车的安全驾驶、车辆违规检测等方面。
改进后的混合SVM模型在PASCAL VOC2007数据集上进行了测试,在相同的测试条件下本发明实施例的目标检测***的性能在总体上提升了2.1%mAP,具体在20类上的检测的平均精度如图6所示的表格。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

Claims (8)

1.一种目标检测方法,其特征在于,所述方法包括:
将需检测的目标物体按照视角或者形状的不同分为多个子类,为每个子类构建对应的SVM模型,得到多个SVM分类器;
利用EM算法训练多个SVM分类器,包括:E操作:将SVM分类器的输出转化为概率;M操作:选取概率最大的正样本所在的样本集来计算该SVM分类器参数的值;迭代所述E操作和所述M操作,直至收敛;
获取输入图像的特征图及两倍分辨率特征图;
可变形部件模型的根滤波器作用在所述输入图像的特征图上,抓取目标物体的全局特征,可变形部件模型的各个部件滤波器作用在所述两倍分辨率特征图上,抓取目标物体的局部特征;
基于最大期望EM算法训练的多个支持向量机SVM分类器根据目标物体的全局特征以及局部特征,识别所述输入图像中的目标物体;
输出检测结果。
2.根据权利要求1所述的方法,其特征在于:所述根滤波器与所述各个部件滤波器构成星型模型。
3.根据权利要求1或2所述的方法,其特征在于,
所述部件滤波器的位置可移动,所述局部特征包括目标物体的形态变化特征。
4.根据权利要求1所述的方法,其特征在于:
所述可变形部件模型为加权可变形部件模型。
5.一种目标检测***,其特征在于所述***包括:
分类器单元,用于将需检测的目标物体按照视角或者形状的不同分为多个子类,为每个子类构建对应的SVM模型,得到多个SVM分类器;利用EM算法训练多个SVM分类器,包括:E操作:将SVM分类器的输出转化为概率;M操作:选取概率最大的正样本所在的样本集来计算该SVM分类器参数的值;迭代所述E操作和所述M操作,直至收敛;
特征图单元,用于获取输入图像的特征图及两倍分辨率特征图;
可变形部件模型单元,包括一个根滤波器和多个部件滤波器,所述根滤波器用于作用在所述输入图像的特征图上,抓取目标物体的全局特征,所述多个部件滤波器用于作用在所述两倍分辨率特征图上,抓取目标物体的局部特征;
所述分类器单元,包括基于EM算法训练的多个SVM分类器,用于根据目标物体的所述全局特征以及局部特征,识别所述输入图像中的目标物体,并输出检测结果。
6.根据权利要求5所述的***,其特征在于,所述根滤波器与所述多个部件滤波器构成星型结构。
7.根据权利要求5或6所述的***,其特征在于,
所述部件滤波器的位置可移动,所述局部特征包括目标物体的形态变化特征。
8.根据权利要求5所述的***,其特征在于:
所述可变形部件模型为加权可变形部件模型。
CN201510323680.5A 2015-06-12 2015-06-12 目标检测***及方法 Expired - Fee Related CN104933441B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510323680.5A CN104933441B (zh) 2015-06-12 2015-06-12 目标检测***及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510323680.5A CN104933441B (zh) 2015-06-12 2015-06-12 目标检测***及方法

Publications (2)

Publication Number Publication Date
CN104933441A CN104933441A (zh) 2015-09-23
CN104933441B true CN104933441B (zh) 2018-08-10

Family

ID=54120601

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510323680.5A Expired - Fee Related CN104933441B (zh) 2015-06-12 2015-06-12 目标检测***及方法

Country Status (1)

Country Link
CN (1) CN104933441B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105225523B (zh) * 2015-10-15 2018-01-02 浙江宇视科技有限公司 一种车位状态检测方法及装置
CN106295523A (zh) * 2016-08-01 2017-01-04 马平 一种基于svm的公共场合人流量检测方法
CN106407943A (zh) * 2016-09-28 2017-02-15 天津工业大学 金字塔层定位的快速dpm行人检测
CN106548145A (zh) * 2016-10-31 2017-03-29 北京小米移动软件有限公司 图像识别方法及装置
CN106909936B (zh) * 2017-01-21 2020-02-21 江苏大学 一种基于双车辆可变形部件模型的车辆检测方法
CN106874873A (zh) * 2017-02-16 2017-06-20 上海建炜信息技术有限公司 基于dpm的快速行人检测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101794515A (zh) * 2010-03-29 2010-08-04 河海大学 基于协方差和二叉树支持向量机的目标检测***及方法
CN102609686A (zh) * 2012-01-19 2012-07-25 宁波大学 一种行人检测方法
CN102819753A (zh) * 2012-07-17 2012-12-12 华中科技大学 一种运用最大子图的基于局部模型的物体检测方法
CN104268539A (zh) * 2014-10-17 2015-01-07 中国科学技术大学 一种高性能的人脸识别方法及***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101794515A (zh) * 2010-03-29 2010-08-04 河海大学 基于协方差和二叉树支持向量机的目标检测***及方法
CN102609686A (zh) * 2012-01-19 2012-07-25 宁波大学 一种行人检测方法
CN102819753A (zh) * 2012-07-17 2012-12-12 华中科技大学 一种运用最大子图的基于局部模型的物体检测方法
CN104268539A (zh) * 2014-10-17 2015-01-07 中国科学技术大学 一种高性能的人脸识别方法及***

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
"Human Detection in Images via Piecewise Linear Support Vector Machines";Qixiang Ye ET AL;《IEEE TRANSACTIONS ON IMAGE PROCESSING》;20130228;第778-780、783页、图4、图7 *
"基于可变形部件模型融合上下文的物体类检测";肖志勇;《中国优秀硕士学位论文全文数据库 信息科技辑》;20140915;第15-23页、图2.8 *
"基于支持向量机的目标检测算法综述";郭明玮 等;《控制与决策》;20140228;全文 *

Also Published As

Publication number Publication date
CN104933441A (zh) 2015-09-23

Similar Documents

Publication Publication Date Title
CN104933441B (zh) 目标检测***及方法
Zhang et al. Histogram of 3d facets: A characteristic descriptor for hand gesture recognition
CN108875600A (zh) 一种基于yolo的车辆信息检测和跟踪方法、装置及计算机存储介质
Ali et al. A real-time deformable detector
CN104166841A (zh) 一种视频监控网络中指定行人或车辆的快速检测识别方法
CN104915673B (zh) 一种基于视觉词袋模型的目标分类方法和***
CN103902978B (zh) 人脸检测及识别方法
CN103778436B (zh) 一种基于图像处理的行人姿态检测方法
CN104063719A (zh) 基于深度卷积网络的行人检测方法及装置
CN103942577A (zh) 视频监控中基于自建立样本库及混合特征的身份识别方法
CN102467657A (zh) 手势识别***和方法
Weiyao et al. Human action recognition using multilevel depth motion maps
Lin et al. Live Face Verification with Multiple Instantialized Local Homographic Parameterization.
CN103745233B (zh) 基于空间信息迁移的高光谱图像分类方法
CN103793926A (zh) 基于样本重选择的目标跟踪方法
CN103839066A (zh) 一种源于生物视觉的特征提取方法
Putro et al. Lightweight convolutional neural network for real-time face detector on cpu supporting interaction of service robot
Ghorbel et al. An extension of kernel learning methods using a modified log-euclidean distance for fast and accurate skeleton-based human action recognition
CN103824062A (zh) 基于非负矩阵分解的分部位人体运动识别方法
JP5704909B2 (ja) 注目領域検出方法、注目領域検出装置、及びプログラム
Chiu et al. See the difference: Direct pre-image reconstruction and pose estimation by differentiating hog
CN103020631B (zh) 基于星型模型的人体运动识别方法
CN108564595A (zh) 图像跟踪方法和装置、电子设备、存储介质、程序
CN102968621A (zh) 基于第二代Bandelet统计特征的人体运动识别方法
Xu et al. Pedestrian detection based on motion compensation and HOG/SVM classifier

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20180810

CF01 Termination of patent right due to non-payment of annual fee