CN105740751A

CN105740751A - 一种目标检测与识别的方法和***

Info

Publication number: CN105740751A
Application number: CN201410764839.2A
Authority: CN
Inventors: 陈雁; 刘春秋; 孙凯; 黄嘉华; 汪永强; 莫永波; 张方兴
Original assignee: Shenzhen Sunwin Intelligent Co Ltd
Current assignee: Shenzhen Sunwin Intelligent Co Ltd
Priority date: 2014-12-11
Filing date: 2014-12-11
Publication date: 2016-07-06

Abstract

本发明公开了一种目标检测与识别的方法及***。方法包括步骤：S1，获取候选目标；S2，计算候选目标的位置信息和大小信息；S3，根据候选目标的位置信息和大小信息计算候选目标属于对应类别的概率Px；S4，将概率Px与预先设定的概率阀值Pt进行比较，判断候选目标是否属于对应类别。***包括：目标检测模块、计算模块和比对模块。本发明利用了图像上下文中的位置信息，并根据目标在该位置出现的可能性来对目标进行分类，用以协助判断是否为可能的目标，有效的排除图像中的干扰项，提高目标检测与识别的准确度，降低误报率，有利于图像数据的下一步分析与处理。本发明可广泛应用于各种目标识别***。

Description

一种目标检测与识别的方法和***

技术领域

本发明涉及图像识别领域，尤其涉及一种目标检测与识别的方法，本发明还涉及一种目标检测与识别的***。

背景技术

HOG：HistogramofOrientedGradient,方向梯度直方图，是一种在计算机视觉和图像处理中用来进行物体检测的特征描述算子。

SIFT：Scale-invariantfeaturetransform，尺度不变特征转换，是一种检测局部特征的算法。

HARR：是计算机视觉领域一种常用的特征描述算子。

Adaboost：是一种迭代算法，其核心思想是针对同一个训练集训练不同的分类器(弱分类器)，然后把这些弱分类器集合起来，构成一个更强的最终分类器(强分类器)。

SVM：SupportVectorMachines，支持向量机，是一种基于结构风险最小化的学习技术，也是一种新的具有很好泛化性能的回归方法。

图像识别，是指利用计算机对图像进行处理、分析和理解，以识别各种不同模式的目标和对像的技术。一般工业使用中，采用工业相机拍摄图片，然后再利用软件根据图片灰阶差做进一步识别处理。

计算机视觉是一门研究如何使机器“看”的科学，更进一步的说，就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉，并进一步做图形处理，用电脑处理成为更适合人眼观察或传送给仪器检测的图像。

目标检测是计算机视觉的一个重要组成部分，在各个领域有着重要的应用前景。目前，主要的计算机视觉算法仅对事物进行局部的考虑，在当前大部分的目标检测与识别技术中，主要考虑的就是目标的独立特征，如目标的颜色、纹理，而忽略了目标在图像中的上下文相关信息，如目标在图像中的位置信息，目标的大小与周边事物大小的参照信息，导致检测与识别的错误率比较高，影响了对图像数据的下一步分析与处理。

发明内容

为了解决上述技术问题，本发明的目的是提供一种可有效排除干扰，提高目标检测与识别的准确度的方法。

为了解决上述技术问题，本发明的另一个目的是提供一种可有效排除干扰、提高目标检测与识别的准确度、降低误报率的***。

本发明所采用的技术方案是：

一种目标检测与识别的方法，其包括步骤：S1，获取候选目标；S2，计算候选目标的位置信息和大小信息；S3，根据候选目标的位置信息和大小信息计算候选目标属于对应类别的概率Px；S4，将概率Px与预先设定的概率阀值Pt进行比较，判断候选目标是否属于对应类别。

优选的，所述步骤S1具体包括子步骤：S11，在图像中设置目标检测小窗口；S12，计算目标检测小窗口中的特征值；S13，根据特征值判断是否采纳为候选目标。

优选的，步骤S11所述目标检测小窗口的大小是根据目标类型设定的，或所述目标检测小窗口的大小是预先设定的固定大小的小窗口。

优选的，所述特征值包括图像颜色和/或图像纹理和/或HOG和/或SIFT和/或HARR。

优选的，所述步骤S12具体为：通过Adaboost算法、SVM算法或神经网络算法学习并判断是否采纳为候选目标。

优选的，所述步骤S3具体包括子步骤：S31，根据先验结果建立目标位置信息、大小信息和对应类别概率的对照表；S32，根据候选目标的位置信息、大小信息和对照表确定候选目标属于对应类别的概率Px。

优选的，所述步骤S4具体为：将概率Px与预先设定的概率阀值Pt进行比较，如果Px>Pt，则判断候选目标属于对应类别；如果Px<Pt，则判断候选目标不属于对应类别。

一种目标检测与识别的***，其包括：目标检测模块，用于获取候选目标；计算模块，用于计算候选目标的位置信息和大小信息，并根据候选目标的位置信息和大小信息计算候选目标属于对应类别的概率Px；比对模块，用于将概率Px与预先设定的概率阀值Pt进行比较，判断候选目标是否属于对应类别。

本发明的有益效果是：

本发明利用了图像上下文中的位置信息，并根据目标在该位置出现的可能性来对目标进行分类，用以协助判断是否为可能的目标，有效的排除图像中的干扰项，提高目标检测与识别的准确度，降低误报率，有利于图像数据的下一步分析与处理。

本发明可广泛应用于各种目标识别***。

附图说明

下面结合附图对本发明的具体实施方式作进一步说明：

图1是本发明一种实施例的方法流程图。

具体实施方式

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

通过目标检测模块，检测出来的可能为车牌的候选目标。通过候选目标的在图像中的位置信息和候选目标在图像中的大小来判断该目标为正确目标检测的概率。在本实施例中，我们需要通过图像的简要的3D信息和摄像机的位置信息的概率信息来判断目标是否为要检测目标。本实施例可以通过2D的图像信息，大概计算目标的3D信息，如目标的位置信息，目标的大小信息，并通过3D的信息来完成目标的检测。

具体方案如下：

1、大致判断场景的内容，规划出地面(水平面)、天空和其他位置。

我们将场景定义为L，L的取值范围有三种，L＝{天空，地面，其他区域}；P{l＝Li}表示I属于Li场景的概率。p(c＝A|1c＝Li)表示当c的场景位置为Li时，c属于类别A的概率。一般来说，我们会给p(c＝A|1c＝Li)做一个基于经验的先验概率，并生成对照表供使用。

2、场景投影/目标高度计算

a)、在没有旋转的摄像机中，已知相机的高度和水平线位置，可以计算出目标的高度。

y＝(v1-v2)*yc/v1

其中v1，v2是目标在图像中的最高点和最低点，yc为摄像机的高度。

b)、如果事先不知道摄像机高度，可以通过测量场景中的一些物体的实际高度(比如人的高度)计算出摄像机的高度。

c)、把目标的高度定义为s。对于每一个分类都有相应的目标高度的取值范围。如p(o∈0|a≤s≤b表示当s的高度介于a与b之间的时候，它属于目标类O的概率。其他类别同理推。

3、目标检测模块

a)、目标检测模块采用通常用于目标检测的小窗口，通过计算小窗口中的特征值来判断是否有相应的目标。小窗口的大小可以根据目标的类别来区分，也可以按统一的小窗口大小，如16*16像素，16*24像素等。

b)、目标检测模块可以通过各种机器学习的方法来完成，如Adaboost算法、SVM算法或神经网络算法等等。

c)、机器学习当中采用的特征可以各种图形特征，包括并不限于以下特征：图像颜色和/或图像纹理和/或HOG和/或SIFT和/或HARR特征等等。

e)、通过目标检测模块检测出来的目标我们可以称之为候选目标。检测器检测出来的目标一般可以表示为：

C_i∈{行人，车，车牌，背景｝，

每个目标都有一个***框定区域，表示为：

C_bb＝{u_i，v_i，w_i，h_i}，

Cbb的四个值分别表示左下角在图像中的位置坐标，以及目标的宽度与高度。我们将候选目标定义为C.P(Ci＝A)表示为通过目标检测模块检测出来的目标Ci属于分类A的概率。

4、通过场景信息，目标位置，目标高度以及目标检测模块检测出来的候选目标最后判断目标是否为要检测的真正目标。

a)、通过以上步骤，我们得到目标C在场景Li情况下属于目标分类的概率为：

p(c＝A|1c，Sc)＝Πp(c＝A|1c＝Li)p(c∈A|a≤Sc≤b)p(c＝A)

b)、通过步骤a)得到的概率值与初始设定的阈值比较，如果大于阈值，则认为目标检测模块检测得到的目标候选人C属于类别A，否则认定目标候选人C不属于类别A。

如图1所示，以车牌的检测与识别为例，在输入视频帧后，首先对前景进行检测，获取并框定运动目标区域。当判断无目标未检测时，直接跳到下一视频帧，当判断有目标区域未检测时，在运动目标区域使用车牌检测器(即目标检测模块)获取可能车牌目标(候选目标)。如无可能车牌目标，则继续判断是否其它未检测区域；如有可能车牌目标，则根据可能车牌目标，估算车牌的大概位置和大小。再根据可能的目标车标车牌及其位置、大小信息，计算该目标车牌的概率Px，将概率Px与概率阀值Pt做对比，如果Px>Pt，则判断该候选目标为车牌，对车牌进行字符识别。

一种目标检测与识别的***的实现原理对应于一种目标检测与识别的方法，在此不做累述。

本发明可广泛应用于各种目标识别***，不仅可以应用于视频，还可以应用于单张图片。

以上是对本发明的较佳实施进行了具体说明，但本发明创造并不限于所述实施例，熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换，这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims

1.一种目标检测与识别的方法，其特征在于，其包括步骤：

S1，获取候选目标；

S2，计算候选目标的位置信息和大小信息；

S3，根据候选目标的位置信息和大小信息计算候选目标属于对应类别的概率Px；

S4，将概率Px与预先设定的概率阀值Pt进行比较，判断候选目标是否属于对应类别。

2.根据权利要求1所述的一种目标检测与识别的方法，其特征在于，所述步骤S1具体包括子步骤：

S11，在图像中设置目标检测小窗口；

S12，计算目标检测小窗口中的特征值；

S13，根据特征值判断是否采纳为候选目标。

3.根据权利要求2所述的一种目标检测与识别的方法，其特征在于，步骤S11所述目标检测小窗口的大小是根据目标类型设定的，或所述目标检测小窗口的大小是预先设定的固定大小的小窗口。

4.根据权利要求2所述的一种目标检测与识别的方法，其特征在于，所述特征值包括图像颜色和/或图像纹理和/或HOG和/或SIFT和/或HARR。

5.根据权利要求2所述的一种目标检测与识别的方法，其特征在于，所述步骤S12具体为：通过Adaboost算法、SVM算法或神经网络算法学习并判断是否采纳为候选目标。

6.根据权利要求1所述的一种目标检测与识别的方法，其特征在于，，所述步骤S3具体包括子步骤：

S31，根据先验结果建立目标位置信息、大小信息和对应类别概率的对照表；

S32，根据候选目标的位置信息、大小信息和对照表确定候选目标属于对应类别的概率Px。

7.根据权利要求1所述的一种目标检测与识别的方法，其特征在于，所述步骤S4具体为：将概率Px与预先设定的概率阀值Pt进行比较，如果Px>Pt，则判断候选目标属于对应类别；如果Px<Pt，则判断候选目标不属于对应类别。

8.一种目标检测与识别的***，其特征在于，其包括：

目标检测模块，用于获取候选目标；

计算模块，用于计算候选目标的位置信息和大小信息，并根据候选目标的位置信息和大小信息计算候选目标属于对应类别的概率Px；

比对模块，用于将概率Px与预先设定的概率阀值Pt进行比较，判断候选目标是否属于对应类别。