CN103745196B - 广义行人检测方法和装置 - Google Patents

广义行人检测方法和装置 Download PDF

Info

Publication number
CN103745196B
CN103745196B CN201310738021.9A CN201310738021A CN103745196B CN 103745196 B CN103745196 B CN 103745196B CN 201310738021 A CN201310738021 A CN 201310738021A CN 103745196 B CN103745196 B CN 103745196B
Authority
CN
China
Prior art keywords
feature
common feature
area
image
broad sense
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310738021.9A
Other languages
English (en)
Other versions
CN103745196A (zh
Inventor
刘威
段成伟
柴丽颖
遇冰
袁淮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Neusoft Ruichi Automotive Technology Wuhan Co ltd
Original Assignee
Neusoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Neusoft Corp filed Critical Neusoft Corp
Priority to CN201310738021.9A priority Critical patent/CN103745196B/zh
Publication of CN103745196A publication Critical patent/CN103745196A/zh
Priority to US14/562,771 priority patent/US9519831B2/en
Priority to DE102014226076.0A priority patent/DE102014226076A1/de
Priority to JP2014258123A priority patent/JP5950991B2/ja
Application granted granted Critical
Publication of CN103745196B publication Critical patent/CN103745196B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • G06V20/58Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Traffic Control Systems (AREA)

Abstract

一种广义行人检测方法和装置,所述广义行人检测方法包括:获取输入图像;判断所述输入图像中是否存在预设的车轮共性特征,并当所述输入图像中存在所述预设的车轮共性特征时,在所述车轮共性特征区域左右侧或上侧选取图像窗口,并将所述选取的图像窗口输入预设的上半身分类器,检测所述选取的图像窗口中是否存行人上半身,并输出第一检测结果。采用所述方法和装置,可以降低样本收集时间,提高广义行人检测效率。

Description

广义行人检测方法和装置
技术领域
本发明涉及智能交通***领域,特别涉及一种广义行人检测方法和装置。
背景技术
目前,基于视觉的传感器越来越受到人们的重视。从环境感知角度看,视觉传感器具有所获取的信息量更多更丰富、采样周期短、受磁场或传感器相互间干扰影响较小、重量轻、能耗小、使用方便经济等优点,在面向城市道路的主动安全领域发挥了越来越重要的作用。在国内外,基于视觉的行人等易受伤害的道路用户主动保护技术已经成为迫切需要解决的关键问题和持续研究的热点。
广义行人可以是指走路的行人、自行车骑行者和摩托车骑行者等易受伤害的道路用户。现有的基于视觉的行人等易受伤害的道路用户主动保护技术的研究主要限于通常意义上的行人检测,即仅针对走路的行人进行检测,对于自行车、摩托车的骑行者等同样易受伤害的广义行人道路用户的相关研究较少。
现有技术方案中,是将自行车和摩托车的骑行者看作是与行人不同的对象。针对骑行者,需要分别收集自行车骑行者的样本和摩托车骑行者的样本,采用预设的骑行者样本库提取自行车骑行者和摩托车骑行者的特征,并根据提取出的特征训练生成自行车骑行者和摩托车骑行者分类器,利用分类器对输入图像进行检测,判断输入图像中是否存在自行车骑行者或摩托车骑行者。
上述方案需要耗费大量时间收集样本,提取特征并训练分类器,造成检测耗时较长,检测效率低下。
发明内容
本发明实施例解决的问题是如何降低样本收集时间,提高广义行人检测效率。
为解决上述问题,本发明实施例提供一种广义行人检测方法,包括:获取输入图像;判断所述输入图像中是否存在预设的车轮共性特征,并当所述输入图像中存在所述预设的车轮共性特征时,在所述车轮共性特征区域左右侧或上侧选取图像窗口,并将所述选取的图像窗口输入预设的上半身分类器,检测所述选取的图像窗口中是否存行人上半身,并输出第一检测结果,所述预设的上半身分类器由预设的广义行人的共性特征训练生成,所述广义行人共性特征包括人体共性特征,所述车轮共性特征包括:圆形特征和椭圆形特征。
可选的,所述广义行人检测方法还包括:对所述输入图像进行预处理,将所述经过预处理的图像输入预设的全身分类器中,检测所述经过预处理的图像中是否存在行人全身,并输出第二检测结果,所述预设的全身分类器由预设的广义行人的共性特征训练生成,所述广义行人共性特征包括人体共性特征。
可选的,所述对所述输入图像进行预处理,将所述经过预处理的图像输入预设的全身分类器中,包括:将所述输入图像利用金字塔下采样技术获得至少两个分辨率不同的图像,将所述不同分辨率的图像划分成多个与所述预设的全身分类器训练样本尺寸相同的小窗口图像,依次将所述小窗口的图像输入所述预设的全身分类器中。
可选的,所述当所述输入图像中存在所述预设的车轮共性特征时,在所述车轮共性特征区域中心的左右侧或上侧选取图像窗口,包括:根据所述车轮共性特征区域的大小,在所述车轮共性特征区域中心的左右侧或上侧选取图像窗口,所述选取图像窗口包括:选取所述图像窗口的宽度w=2kr,选取所述图像窗口的长度l=3kr,所述图像窗口的横向取值范围为[x-6r,x+6r],所述图像窗口的纵向取值范围为[y-3r,y+3r],其中:所述k为缩放因子,所述r为所述车轮共性特征区域的半径,所述x、y分别为所述共性特征区域的中心坐标。
可选的,所述人体共性特征包括:头部特征、肩部特征和躯干特征,其中:
所述头部特征包括:采用第一颜色描述的所述头部区域和采用第二颜色描述的背景区域,所述头部区域和所述背景区域均为矩形,所述头部区域位于所述背景区域中,且所述头部区域与所述背景区域仅下边沿重合,所述第二颜色区域面积是所述第一颜色区域面积的N1倍,所述头部特征的特征值a1=|b1-c1|,其中b1为所述第二颜色区域面积的像素值和,所述c1为N1倍的所述第一颜色区域面积的像素值和,所述N1为正值;
所述肩部特征包括:采用所述第一颜色描述的所述肩部区域和采用所述第二颜色描述的背景区域,所述肩部区域和所述背景区域均为矩形,所述肩部区域位于所述背景区域左下角且与所述背景区域左边沿和下边沿重合,或位于所述背景区域右下角且与所述背景区域右边沿和下边沿重合,所述第二颜色区域面积是所述第一颜色区域面积的N2倍,所述肩部特征的特征值a2=|b2-c2|,其中b2为所述第二颜色区域面积的像素值和,所述c2为N2倍的所述第一颜色区域面积的像素值和,所述N2为正值;
所述躯干特征包括:竖直躯干特征和倾斜躯干特征;
所述竖直躯干特征包括:第一竖直躯干特征和第二竖直躯干特征,所述第一竖直躯干特征包括:采用所述第一颜色描述的所述第一竖直躯干区域和采用所述第二颜色描述的所述背景区域,所述第一竖直躯干区域与所述背景区域处于同一矩形内,在竖直方向上,所述第二颜色区域面积是所述第一颜色区域面积的N3倍,所述第一竖直躯干特征的特征值a3=|b3-c3|,其中b3为所述第二颜色区域面积的像素值和,c3为N3倍的所述第一颜色区域面积的像素值和,所述N3为正值;所述第二竖直躯干特征包括:采用所述第一颜色描述的所述第二竖直躯干区域和采用所述第二颜色描述的所述背景区域,所述第二竖直躯干特征和所述背景区域均为矩形,所述第二竖直躯干区域与所述背景区域在竖直方向上平行,所述第一颜色区域面积与所述第二颜色区域面积相等,所述第一颜色区域与所述第二颜色区域间隔M1个像素,所述第一竖直躯干特征的特征值a4=|b4-c4|,其中b4为所述第二颜色区域面积的像素值和,c4为所述第一颜色区域面积的像素值和;
所述倾斜躯干特征包括:采用所述第一颜色描述的所述倾斜躯干区域和采用所述第二颜色描述的所述背景区域,所述倾斜躯干区域与所述背景区域均为矩形,所述倾斜躯干区域与所述背景区域倾斜角度相同,且所述背景区域位于所述倾斜躯干区域左右侧或上侧,所述第一颜色区域与所述第二颜色区域面积相等,所述第一颜色区域与所述第二颜色区域间间隔M2个像素,所述倾斜躯干特征的特征值a5=|b5-c5|,其中b5为所述第二颜色区域面积的像素值和,c5为所述第一颜色区域面积的像素值和。
为解决上述问题,本发明实施例还提供一种广义行人检测装置,包括:
获取单元,用于获取输入图像;
第一检测单元,用于判断所述输入图像中是否存在预设的车轮共性特征,并当所述输入图像中存在所述预设的车轮共性特征时,在所述车轮共性特征区域中心的左右侧或上侧选取图像窗口,并将所述选取的图像窗口输入预设的上半身分类器,检测所述选取的图像窗口中是否存行人上半身,并输出第一检测结果,所述预设的上半身分类器由预设的广义行人的共性特征训练生成,所述广义行人共性特征包括人体共性特征,所述车轮共性特征包括:圆形特征和椭圆形特征。
可选的,所述广义行人检测装置还包括:第二检测单元,用于对所述输入图像进行预处理,将所述经过预处理的图像输入预设的全身分类器中,检测所述经过预处理的图像中是否存在行人全身,并输出第二检测结果,所述预设的全身分类器由预设的广义行人的共性特征训练生成,所述广义行人共性特征包括人体共性特征。
可选的,所述第二检测单元,用于将所述输入图像利用金字塔下采样技术获得至少两个分辨率不同的图像,将所述不同分辨率的图像划分成多个与所述预设的全身分类器训练样本尺寸相同的小窗口图像,依次将所述小窗口的图像输入所述预设的全身分类器中。
可选的,所述第一检测单元,用于根据所述车轮共性特征区域的大小,在所述车轮共性特征区域中心的左右侧或上侧选取图像窗口,所述选取图像窗口包括:选取宽度为w=2kr、长度为l=3kr、横向取值范围为[x-6r,x+6r]、纵向取值范围为[y-3r,y+3r]的图像窗口,其中,所述k为缩放因子,所述k的取值范围为大于等于1且小于等于3,所述r为所述车轮共性特征区域的半径,所述x、y分别为所述共性特征区域的中心坐标。
与现有技术相比,本发明实施例的技术方案具有以下优点:
通过判断输入图像中是否存在车轮共性特征,并当存在所述预设的车轮共性特征时,在所述车轮共性特征区域中心的左右侧或上侧选取图像窗口,将选取的图像窗口输入预设的上半身分类器,对所述图像窗口进行检测并输出检测结果。由于所述上半身分类器可由广义行人的共性特征训练生成,且当输入图像中存在车轮共性特征时,只需在车轮共性特征区域中心的左右侧或上侧选取图像窗口,并将选取的图像窗口输入上半身分类器进行检测,当所述选取的图像窗口中存在行人上半身即可判定为骑行者,而不需要收集骑行者样本,提取骑行者的共性特征,训练骑行者分类器,因此可以减少收集样本的时间,提高广义行人的检测效率。
进一步,通过将所述输入图像利用金字塔采样技术进行预处理,获得至少两个大小不同的图像,将不同分辨率的图像依次输入预设的全身分类器中,检测输入图像中是否存在行人全身,并输出检测结果,可以有效地提高广义行人检测的准确度。
此外,当所述输入图像中存在车轮共性特征时,获取存在所述车轮共性特征的区域,并根据所述车轮共性特征区域的大小,调整图像窗口的大小和位置,采用预设的广义行人上半身分类器对所述图像窗口进行检测,可以进一步地提高检测结果的准确度。
附图说明
图1是本发明实施例中的一种广义行人检测方法的算法流程图;
图2是本发明实施例中的一种广义行人共性特征;
图3是本发明实施例中的一种车轮共性特征;
图4是本发明实施例中的另一种广义行人检测方法的算法流程图;
图5是本发明实施例中的一种广义行人检测装置的结构示意图。
具体实施方式
现有技术方案中,将自行车和摩托车的骑行者看作是不同的对象。针对骑行者,需要分别收集自行车骑行者和摩托车骑行者的样本,建立自行车骑行者样本库和摩托车骑行者样本库,并利用骑行者样本库分别提取自行车骑行者的特征和摩托车骑行者的特征,采用提取出的特征训练生成自行车骑行者分类器和摩托车骑行者分类器。但是,由于骑行者的运动姿态具有多样性,且存在多种型号、多种类型的自行车与摩托车,需要收集大量的骑行者样本来提取复杂多样的特征,训练不同的分类器分别对输入的图像进行检测。整个方案需要耗费大量时间收集样本、提取特征并训练分类器,造成检测耗时较长,检测效率低下。
通过判断输入图像中是否存在车轮共性特征,并当存在所述预设的车轮共性特征时,在所述车轮共性特征区域中心的左右侧或上侧选取图像窗口,将选取的图像窗口输入预设的上半身分类器,对所述图像窗口进行检测并输出检测结果。由于所述上半身分类器可由广义行人的共性特征训练生成,且当输入图像中存在车轮共性特征时,只需在车轮共性特征区域中心的左右侧或上侧选取图像窗口,并将选取的图像窗口输入上半身分类器进行检测,当所述选取的图像窗口中存在行人上半身即可判定为骑行者,而不需要收集骑行者样本,提取骑行者的共性特征,训练骑行者分类器,因此可以减少收集样本的时间,提高广义行人的检测效率。
为使本发明实施例的上述目的、特征和优点能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
本发明实施例提供了一种广义行人检测方法,参照图1,以下通过具体方式进行详细说明。
步骤S101,获取输入图像。
在具体实施中,输入图像可以是预先获取的,也可以是通过预设的图像获取装置实时获取的,例如可以通过相机等实时获取图像。
步骤S102,判断所述输入图像中是否存在预设的车轮共性特征,并当所述输入图像中存在所述预设的车轮共性特征时,在所述车轮共性特征区域中心的左右侧或上侧选取图像窗口。
在具体实施中,车轮共性特征可以参照图3,其中:车轮共性特征中的圆形特征可以由301进行描述,301为圆形,可以表示为与取景角度垂直的车轮的特征,车轮共性特征中的椭圆形特征可以由302进行描述,302为椭圆,可以表示为与取景角度存在一定夹角的车轮的特征。
在具体实施中,当获取输入图像后,可以先利用圆形检测算法或椭圆形检测算法,对输入图像进行检测,判断输入图像中是否存在圆形或椭圆形。例如,可以先在输入图像中提取边缘,利用hough变换、快速径向对称等算法检测是否存在圆形或椭圆形,确定圆形或椭圆形候选区域;根据透视投影原理和获取图像装置的参数,去除不受几何约束的圆形或椭圆形区域;对于剩余的圆形或椭圆形区域,根据其半径大小,在所述输入图像中选取图像窗口。
步骤S103,将所述选取的图像窗口输入预设的上半身分类器,检测所述选取的图像窗口中是否存行人上半身,并输出第一检测结果,所述预设的上半身分类器由预设的广义行人的共性特征训练生成,所述广义行人共性特征包括人体共性特征,所述车轮共性特征包括:圆形特征和椭圆形特征。
在具体实施中,所述第一检测结果可以是所述存在行人上半身的图像窗口的大小,也可以是所述存在行人上半身的图像窗口在所述输入图像中的区域,还可以同时包括所述存在行人上半身的图像窗口的大小和在所述输入图像中的区域。
在具体实施中,当上半身分类器检测到在所述车轮共性特征区域中心的左右侧或上侧选取的图像窗口中包含行人上半身时,即车轮上方或左右侧存在行人上半身时,则认为所述输入图像中存在骑行者。
在具体实施中,所述人体共性特征可以包括:头部特征、肩部特征和躯干特征,以下通过图2对所述人体共性特征进行详细说明。
在具体实施中,所述头部特征可以描述为:采用第一颜色描述的头部区域和采用第二颜色描述的背景区域,所述头部区域和所述背景区域均为矩形,如图2中的201所示,头部区域可以用黑色表示,背景区域可以用白色表示,头部区域位于白色区域内,头部区域的下边沿与背景区域的下边沿重合。所述第二颜色区域面积是所述第一颜色区域面积的N1倍,所述头部特征的特征值a1=|b1-c1|,其中:b1为所述第二颜色区域面积的像素值和,所述c1为N1倍的所述第一颜色区域面积的像素值和。所述N1为正值,所述N1的取值范围为大于1且小于等于3。
在具体实施中,所述肩部特征可以描述为:采用所述第一颜色描述的肩部区域和采用所述第二颜色描述的背景区域,所述肩部区域和所述背景区域均为矩形,如图2中的202所示,肩部区域可以用黑色表示,背景区域可以用白色表示,肩部区域位于背景区域的左下角,且与背景区域左边沿和下边沿重合;或位于所述背景区域右下角且与所述背景区域右边沿和下边沿重合,如图2中的203所示,肩部区域可以用黑色表示,背景区域可以用白色表示,肩部区域位于背景区域的右下角,且与背景区域右边沿和下边沿重合。所述第二颜色区域面积是所述第一颜色区域面积的N2倍,所述肩部特征的特征值a2=|b2-c2|,其中:b2为所述第二颜色区域面积的像素值和,所述c2为N2倍的所述第一颜色区域面积的像素值和,所述N2为正值,所述N2的取值范围为大于2且小于等于4。
在具体实施中,所述躯干特征可以描述为:竖直躯干特征和倾斜躯干特征。其中,竖直躯干特征可以包括:第一竖直躯干特征和第二竖直躯干特征。所述第一竖直躯干特征可以描述为:采用所述第一颜色描述的所述第一竖直躯干区域和采用所述第二颜色描述的所述背景区域,所述第一竖直躯干区域与所述背景区域处于同一矩形内,如图2中204所示,第一竖直躯干区域可以用黑色表示,背景区域可以用白色表示,第一竖直躯干区域和背景区域处于同一个矩形中,在竖直方向上背景区域的面积大于第一竖直躯干区域。所述第一竖直躯干特征的特征值a3=|b3-c3|,其中:b3为所述第二颜色区域面积的像素值和,c3为N3倍的所述第一颜色区域面积的像素值和,所述N3为正值,所述N3的取值范围为大于1。
在具体实施中,所述第二竖直躯干特征可以描述为:采用所述第一颜色描述的所述第二竖直躯干区域和采用所述第二颜色描述的所述背景区域,所述第二竖直躯干特征和所述背景区域均为矩形,如图2中的205所示,第二竖直躯干区域可以用黑色表示,背景区域可以用白色表示,第二竖直躯干区域和背景区域平行,第二竖直躯干区域与背景区域之间存在空隙且二者面积相等。所述第一颜色区域与所述第二颜色区域间隔M1个像素,所述第一竖直躯干特征的特征值a4=|b4-c4|。其中b4:为所述第二颜色区域面积的像素值和,c4为所述第一颜色区域面积的像素值和,所述M1的取值范围为大于等于1且小于等于3。
在具体实施中,所述倾斜躯干特征可以描述为:采用所述第一颜色描述的所述倾斜躯干区域和采用所述第二颜色描述的所述背景区域,所述倾斜躯干区域与所述背景区域均为矩形,所述倾斜躯干区域与所述背景区域倾斜角度相同,且所述背景区域位于所述倾斜躯干区域左右侧或上侧,如图2中的206和207所示,图2中的206和207中,倾斜躯干区域可以用黑色表示,背景区域可以用白色表示,背景区域位于倾斜躯干区域的上侧且与倾斜躯干区域平行。所述第一颜色区域与所述第二颜色区域面积相等,所述第一颜色区域与所述第二颜色区域间间隔M2个像素,所述倾斜躯干特征的特征值a5=|b5-c5|。其中:b5为所述第二颜色区域面积的像素值和,c5为所述第一颜色区域面积的像素值和,所述M2的取值范围为大于等于1且小于等于3。
在本发明实施例中,如图2中所示,第一颜色可以为黑色,第二颜色可以为白色。可以理解的是,第一颜色也可以为黑色,第二颜色为白色,只需要满足上述人体共性特征与背景的关系即可。同样的,也可以采用其他的颜色作为第一颜色和第二颜色,此处不做赘述。
采用本发明实施例中的方案,通过判断输入图像中是否存在车轮共性特征,并当存在所述预设的车轮共性特征时,在所述车轮共性特征区域中心的左右侧或上侧选取图像窗口,将选取的图像窗口输入预设的上半身分类器,对所述图像窗口进行检测并输出检测结果。由于所述上半身分类器可由广义行人的共性特征训练生成,且当输入图像中存在车轮共性特征时,只需在车轮共性特征区域中心的左右侧或上侧选取图像窗口,并将选取的图像窗口输入上半身分类器进行检测,当所述选取的图像窗口中存在行人上半身即可判定为骑行者,而不需要收集骑行者样本,提取骑行者的共性特征,训练骑行者分类器,因此可以减少收集样本的时间,提高广义行人的检测效率。
本发明实施例还提供了另一种广义行人检测方法,参照图4,以下通过具体步骤进行详细说明。
步骤S401,获取输入图像。
步骤S402,对输入图像进行预处理。
在本发明实施例中,对输入图像进行预处理可以是将输入图像利用金字塔下采样技术进行处理,得到至少两个不同分辨率的图像,将不同分辨率的图像划分成多个与预设的全身分类器训练样本尺寸相同的小窗口图像。还可以采用其他技术对输入图像进行预处理,只要满足经过预处理的图片可以被预设的全身分类器检测即可,此处不做赘述。
步骤S403,将小窗口的图像依次输入预设的全身分类器。
在本发明实施例中,预设的全身分类器可以通过如下方式获取:收集行人样本库,根据行人样本库提取人体共性特征,采用人体共性特征训练生成全身分类器。
步骤S404,全身分类器检测输入的图像窗口中是否存在行人全身,并输出第二检测结果。
步骤S404执行完成后,即可得到输入图像中是否存在行人全身。
在本发明实施例中,还可以对步骤S404得到的第二检测结果进行进一步的检测。
步骤S405,采用预设的全身精识别分类器对所述第二检测结果进行精识别。
在本发明实施例中,全身精识别分类器可以通过如下方式获取:收集全身行人样本图片和背景图片,利用方向梯度直方图(Histogram of OrientedGradient,HOG)特征、局部二值模式(Local Binary Pattern,LBP)特征等,训练生成支持向量机(Support Vector Machine,SVM)分类器;也可以根据全身行人的姿态,训练不同的全身姿态分类器,并将不同的全身姿态分类器集成作为全身精识别分类器。
采用本发明实施例的方案,通过将所述输入图像利用金字塔采样技术进行预处理,获得至少两个大小不同的图像,将不同分辨率的图像依次输入预设的全身分类器中,检测输入图像中是否存在行人全身,并输出检测结果,可以有效地提高广义行人检测的准确度。
在本发明实施例中,步骤S402至步骤S405可以用于检测输入图像中是否存在行人全身,即可以检测输入图像中是否存在行走的行人。在具体实施中,还可以对上述方案做扩展,可以与上一发明实施例中的骑行者检测方法结合,参照以下步骤。
步骤S406,判断输入图像中是否存在预设的车轮共性特征。
在本发明实施例中,可以利用预设的圆形检测算法或椭圆形检测算法对输入图像进行检测,判断输入图像中是否存在圆形或椭圆形区域,并排除不受几何约束的圆形或椭圆形区域,剩余的圆形或椭圆形区域作为车轮共性特征所在区域。
步骤S407,当输入图像中存在预设的车轮共性特征时,在所述车轮共性特征区域中心的左右侧或上侧选取图像窗口。
在本发明实施例中,可以采用如下过程选取图像窗口:选取宽度为w=2kr,长度为l=3kr的图像窗口,其中k为缩放因子,所述图像窗口的横向取值范围为[x-6r,x+6r],所述图像窗口的纵向取值范围为[y-3r,y+3r],其中:所述r为所述车轮共性特征区域的半径,所述x、y分别为所述共性特征区域的中心坐标。在具体实施中,k的取值范围可以为3≥k≥1。
在本发明实施例中,图像窗口可以在横向取值区间内滑动,也可以在纵向取值区间内滑动,还可以在横向取值区间内和纵向取值区间内同时滑动。滑动的步长可以为1个像素,也可以为2个像素或多个像素,可以根据实际需求选择滑动步长。
步骤S408,将步骤S407中选取的图像窗口输入预设的上半身分类器,检测所述图像窗口中是否存在行人上半身,并输出第一检测结果。
在本发明实施例中,当所述图像窗口中存在行人上半身时,即可认为输入图像中存在骑行者。第一检测结果可以为存在行人上半身的图像窗口的大小,也可以为存在行人上半身的图像窗口在输入图像中的区域,还可以同时包括存在行人上半身的图像窗口的大小和在输入图像中的区域。
在本发明实施例中,还可以对步骤S408输出的第一检测结果做进一步的检测。
步骤S409,采用预设的上半身精识别分类器对所述第一检测结果进行精识别。
在本发明实施例中,上半身精识别分类器可以通过如下方式获取:收集上半身行人样本图片和背景图片,利用HOG特征、LBP特征等,训练上半身SVM分类器;也可以根据上半身行人的姿态,训练不同的上半身姿态分类器,并将不同的上半身姿态分类器集成作为上半身精识别分类器。
可以理解的是,当步骤S401执行完成后,可以先执行步骤S402至步骤S405,也可以先执行步骤S406至步骤S409,还可以同时执行步骤S402至步骤S405和步骤S406至步骤S409。
采用本发明实施例的方案,当所述输入图像中存在车轮共性特征时,获取存在所述车轮共性特征的区域,并根据所述车轮共性特征区域的大小,调整图像窗口的大小和位置,采用预设的上半身分类器对所述图像窗口进行检测,可以进一步地提高检测结果的准确度。
参照图5,本发明实施例还提供了一种广义行人检测装置50,包括:获取单元501、第一检测单元502和第二检测单元503,其中:
获取单元501,用于获取输入图像;
第一检测单元502,用于判断所述输入图像中是否存在预设的车轮共性特征,并当所述输入图像中存在所述预设的车轮共性特征时,在所述车轮共性特征区域中心的左右侧或上侧选取图像窗口,将所述选取的图像窗口输入预设的上半身分类器,检测所述选取的图像窗口中是否存行人上半身,输出第一检测结果,所述预设的上半身分类器由预设的广义行人的共性特征训练生成,所述广义行人共性特征包括人体共性特征,所述车轮共性特征包括:圆形特征和椭圆形特征。
在具体实施中,第一检测单元502可以包括:判断子单元5021,用于判断所述输入图像中是否存在预设的车轮共性特征;图像窗口选取子单元5022,用于当所述输入图像中存在所述预设的车轮共性特征时,在所述输入图像中选取图像窗口,并将所述选取的图像窗口输入预设的上半身分类器;第一检测子单元5023,用于检测所述选取的图像窗口中是否存行人上半身,并输出第一检测结果。
在具体实施中,所述图像窗口选取子单元5022,用于根据所述车轮共性特征区域的大小,在所述车轮共性特征区域中心的左右侧或上侧选取图像窗口。
在具体实施中,所述图像窗口选取子单元5022,用于选取宽度为w=2kr、长度为l=3kr、横向取值范围为[x-6r,x+6r]、纵向取值范围为[y-3r,y+3r]的图像窗口,其中,所述k为缩放因子,所述k的取值范围为大于等于1且小于等于3,所述r为所述车轮共性特征区域的半径,所述x、y分别为所述共性特征区域的中心坐标。
在具体实施中,所述广义行人检测装置50还可以包括:第二检测单元503,用于对所述输入图像进行预处理,将所述经过预处理的图像输入预设的全身分类器中,检测所述经过预处理的图像中是否存在行人全身,并输出第二检测结果,所述预设的全身分类器由预设的广义行人的共性特征训练生成,所述广义行人共性特征包括人体共性特征。
在具体实施中,第二检测单元503可以包括:预处理子单元5031,用于对所述输入图像进行预处理,并将所述经过预处理的图像输入预设的全身分类器中;第二检测子单元5032,用于检测所述预处理子单元5031输入的所述经过预处理的图像中是否存在行人全身,并输出第二检测结果;
在具体实施中,所述预处理子单元5031,用于将所述输入图像利用金字塔下采样技术获得至少两个分辨率不同的图像,将所述不同分辨率的图像划分成多个与所述预设的全身分类器训练样本尺寸相同的小窗口图像,依次将所述小窗口的图像输入所述预设的全身分类器中。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。
虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。

Claims (9)

1.一种广义行人检测方法,其特征在于,包括:
获取输入图像;
判断所述输入图像中是否存在预设的车轮共性特征,并当所述输入图像中存在所述预设的车轮共性特征时,在所述车轮共性特征区域左右侧或上侧选取图像窗口,并将所述选取的图像窗口输入预设的上半身分类器,检测所述选取的图像窗口中是否存行人上半身,并输出第一检测结果,所述预设的上半身分类器由预设的广义行人的共性特征训练生成,所述广义行人共性特征包括人体共性特征,所述车轮共性特征包括:圆形特征和椭圆形特征。
2.如权利要求1所述的广义行人检测方法,其特征在于,还包括:对所述输入图像进行预处理,将所述经过预处理的图像输入预设的全身分类器中,检测所述经过预处理的图像中是否存在行人全身,并输出第二检测结果,所述预设的全身分类器由所述广义行人的共性特征训练生成。
3.如权利要求2所述的广义行人检测方法,其特征在于,所述对所述输入图像进行预处理,将所述经过预处理的图像输入预设的全身分类器中,包括:将所述输入图像利用金字塔下采样技术获得至少两个分辨率不同的图像,将所述不同分辨率的图像划分成多个与所述预设的全身分类器训练样本尺寸相同的小窗口图像,依次将所述小窗口的图像输入所述预设的全身分类器中。
4.如权利要求1所述的广义行人检测方法,其特征在于,所述当所述输入图像中存在所述预设的车轮共性特征时,在所述车轮共性特征区域中心的左右侧或上侧选取图像窗口,包括:根据所述车轮共性特征区域的大小,在所述车轮共性特征区域中心的左右侧或上侧选取图像窗口,所述选取图像窗口包括:选取所述图像窗口的宽度w=2kr,选取所述图像窗口的长度l=3kr,所述图像窗口的横向取值范围为[x-6r,x+6r],所述图像窗口的纵向取值范围为[y-3r,y+3r],其中:所述k为缩放因子,所述r为所述车轮共性特征区域的半径,所述x、y分别为所述共性特征区域的中心坐标。
5.如权利要求1所述的广义行人检测方法,其特征在于,所述人体共性特征包括:头部特征、肩部特征和躯干特征,其中:
所述头部特征包括:采用第一颜色描述的头部区域和采用第二颜色描述的背景区域,所述头部区域和所述背景区域均为矩形,所述头部区域位于所述背景区域中,且所述头部区域与所述背景区域仅下边沿重合,所述第二颜色区域面积是所述第一颜色区域面积的N1倍,所述头部特征的特征值a1=|b1-c1|,其中b1为所述第二颜色区域面积的像素值和,所述c1为N1倍的所述第一颜色区域面积的像素值和,所述N1为正值;
所述肩部特征包括:采用所述第一颜色描述的肩部区域和采用所述第二颜色描述的背景区域,所述肩部区域和所述背景区域均为矩形,所述肩部区域位于所述背景区域左下角且与所述背景区域左边沿和下边沿重合,或位于所述背景区域右下角且与所述背景区域右边沿和下边沿重合,所述第二颜色区域面积是所述第一颜色区域面积的N2倍,所述肩部特征的特征值a2=|b2-c2|,其中b2为所述第二颜色区域面积的像素值和,所述c2为N2倍的所述第一颜色区域面积的像素值和,所述N2为正值;
所述躯干特征包括:竖直躯干特征和倾斜躯干特征;所述竖直躯干特征包括:第一竖直躯干特征和第二竖直躯干特征,所述第一竖直躯干特征包括:采用所述第一颜色描述的第一竖直躯干区域和采用所述第二颜色描述的所述背景区域,所述第一竖直躯干区域与所述背景区域处于同一矩形内,在竖直方向上,所述第二颜色区域面积是所述第一颜色区域面积的N3倍,所述第一竖直躯干特征的特征值a3=|b3-c3|,其中b3为所述第二颜色区域面积的像素值和,c3为N3倍的所述第一颜色区域面积的像素值和,所述N3为正值;所述第二竖直躯干特征包括:采用所述第一颜色描述的第二竖直躯干区域和采用所述第二颜色描述的所述背景区域,所述第二竖直躯干特征和所述背景区域均为矩形,所述第二竖直躯干区域与所述背景区域在竖直方向上平行,所述第一颜色区域面积与所述第二颜色区域面积相等,所述第一颜色区域与所述第二颜色区域间隔M1个像素,所述第一竖直躯干特征的特征值a4=|b4-c4|,其中b4为所述第二颜色区域面积的像素值和,c4为所述第一颜色区域面积的像素值和;
所述倾斜躯干特征包括:采用所述第一颜色描述的倾斜躯干区域和采用所述第二颜色描述的所述背景区域,所述倾斜躯干区域与所述背景区域均为矩形,所述倾斜躯干区域与所述背景区域倾斜角度相同,且所述背景区域位于所述倾斜躯干区域左右侧或上侧,所述第一颜色区域与所述第二颜色区域面积相等,所述第一颜色区域与所述第二颜色区域间隔M2个像素,所述倾斜躯干特征的特征值a5=|b5-c5|,其中b5为所述第二颜色区域面积的像素值和,c5为所述第一颜色区域面积的像素值和。
6.一种广义行人检测装置,其特征在于,包括:
获取单元,用于获取输入图像;
第一检测单元,用于判断所述输入图像中是否存在预设的车轮共性特征,并当所述输入图像中存在所述预设的车轮共性特征时,在所述车轮共性特征区域中心的左右侧或上侧选取图像窗口,将所述选取的图像窗口输入预设的上半身分类器,检测所述选取的图像窗口中是否存行人上半身,输出第一检测结果,所述预设的上半身分类器由预设的广义行人的共性特征训练生成,所述广义行人共性特征包括人体共性特征,所述车轮共性特征包括:圆形特征和椭圆形特征。
7.如权利要求6所述的广义行人检测装置,其特征在于,还包括:第二检测单元,用于对所述输入图像进行预处理,将所述经过预处理的图像输入预设的全身分类器中,检测所述经过预处理的图像中是否存在行人全身,并输出第二检测结果,所述预设的全身分类器由所述广义行人的共性特征训练生成。
8.如权利要求7所述的广义行人检测装置,其特征在于,所述第二检测单元,用于将所述输入图像利用金字塔下采样技术获得至少两个分辨率不同的图像,将所述不同分辨率的图像划分成多个与所述预设的全身分类器训练样本尺寸相同的小窗口图像,依次将所述小窗口的图像输入所述预设的全身分类器中。
9.如权利要求6所述的广义行人检测装置,其特征在于,所述第一检测单元,用于根据所述车轮共性特征区域的大小,在所述车轮共性特征区域中心的左右侧或上侧选取图像窗口,所述选取图像窗口包括:选取宽度为w=2kr、长度为l=3kr、横向取值范围为[x-6r,x+6r]、纵向取值范围为[y-3r,y+3r]的图像窗口,其中,所述k为缩放因子,所述k的取值范围为大于等于1且小于等于3,所述r为所述车轮共性特征区域的半径,所述x、y分别为所述共性特征区域的中心坐标。
CN201310738021.9A 2013-12-27 2013-12-27 广义行人检测方法和装置 Active CN103745196B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201310738021.9A CN103745196B (zh) 2013-12-27 2013-12-27 广义行人检测方法和装置
US14/562,771 US9519831B2 (en) 2013-12-27 2014-12-08 Method and apparatus for detecting generalized passerby by utilizing features of a wheel and upper body
DE102014226076.0A DE102014226076A1 (de) 2013-12-27 2014-12-16 Verfahren und Vorrichtung für die Erkennung von Passanten
JP2014258123A JP5950991B2 (ja) 2013-12-27 2014-12-19 広義的通行人検出方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310738021.9A CN103745196B (zh) 2013-12-27 2013-12-27 广义行人检测方法和装置

Publications (2)

Publication Number Publication Date
CN103745196A CN103745196A (zh) 2014-04-23
CN103745196B true CN103745196B (zh) 2016-10-05

Family

ID=50502213

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310738021.9A Active CN103745196B (zh) 2013-12-27 2013-12-27 广义行人检测方法和装置

Country Status (4)

Country Link
US (1) US9519831B2 (zh)
JP (1) JP5950991B2 (zh)
CN (1) CN103745196B (zh)
DE (1) DE102014226076A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103745196B (zh) 2013-12-27 2016-10-05 东软集团股份有限公司 广义行人检测方法和装置
CN104036275B (zh) * 2014-05-22 2017-11-28 东软集团股份有限公司 一种车辆盲区内目标对象的检测方法及其装置
CN104361357B (zh) * 2014-11-07 2018-02-06 北京途迹科技有限公司 基于图片内容分析的相片集分类***及分类方法
EP3136288A1 (en) * 2015-08-28 2017-03-01 Autoliv Development AB Vision system and method for a motor vehicle
JP6132411B2 (ja) * 2015-09-10 2017-05-24 株式会社Subaru 車外環境認識装置
CN105631440B (zh) * 2016-02-22 2019-01-22 清华大学 一种易受伤害道路使用者的联合检测方法
US10671873B2 (en) 2017-03-10 2020-06-02 Tusimple, Inc. System and method for vehicle wheel detection
CN109726621B (zh) * 2017-10-31 2021-05-14 比亚迪股份有限公司 行人检测方法、装置及设备
CN110866534B (zh) * 2019-08-13 2023-09-12 广州三木智能科技有限公司 一种梯度幅度分布梯度朝向直方图的远红外行人训练方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102682304A (zh) * 2012-03-26 2012-09-19 北京博康智能信息技术有限公司 一种融合多特征的行人检测方法及装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07210687A (ja) * 1994-01-18 1995-08-11 Matsushita Electric Ind Co Ltd 形状検出装置
JP4720446B2 (ja) 2005-11-10 2011-07-13 トヨタ自動車株式会社 車両検出装置及びこれを用いた車両用表示装置
JP2007187618A (ja) 2006-01-16 2007-07-26 Omron Corp 物体識別装置
JP5239952B2 (ja) 2009-03-10 2013-07-17 オムロン株式会社 安全運転監視装置
EP2465092B1 (en) * 2009-09-03 2015-02-11 Honda Motor Co., Ltd. Vehicle vicinity monitoring apparatus
JP2012108785A (ja) * 2010-11-18 2012-06-07 Panasonic Corp 人数カウント装置、人数カウント方法及び人数カウントプログラム
US8811675B2 (en) * 2012-03-30 2014-08-19 MindTree Limited Circular object identification system
JP6032921B2 (ja) 2012-03-30 2016-11-30 キヤノン株式会社 物体検出装置及びその方法、プログラム
CN103745196B (zh) 2013-12-27 2016-10-05 东软集团股份有限公司 广义行人检测方法和装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102682304A (zh) * 2012-03-26 2012-09-19 北京博康智能信息技术有限公司 一种融合多特征的行人检测方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
行人检测技术综述;苏松志;《电子学报》;20120430;第40卷(第4期);全文 *

Also Published As

Publication number Publication date
US20150186723A1 (en) 2015-07-02
JP5950991B2 (ja) 2016-07-13
US9519831B2 (en) 2016-12-13
DE102014226076A1 (de) 2015-07-02
JP2015127959A (ja) 2015-07-09
CN103745196A (zh) 2014-04-23

Similar Documents

Publication Publication Date Title
CN103745196B (zh) 广义行人检测方法和装置
Li et al. A unified framework for concurrent pedestrian and cyclist detection
Braun et al. The eurocity persons dataset: A novel benchmark for object detection
CN103810503B (zh) 一种基于深度学习的自然图像中显著区域的检测方法
CN105631440B (zh) 一种易受伤害道路使用者的联合检测方法
CN106127137A (zh) 一种基于3d轨迹分析的目标检测识别算法
CN103824070B (zh) 一种基于计算机视觉的快速行人检测方法
CN104268528B (zh) 一种人群聚集区域检测方法和装置
CN103942560B (zh) 一种智能交通监控***中的高分辨率视频车辆检测方法
CN106372666B (zh) 一种目标识别方法及装置
CN104050481B (zh) 多模板轮廓特征和灰度相结合的红外图像实时行人检测
CN108108667B (zh) 一种基于窄基线双目视觉的前方车辆快速测距方法
CN103164694A (zh) 一种人体动作识别的方法
CN104517095B (zh) 一种基于深度图像的人头分割方法
CN104715244A (zh) 一种基于肤色分割和机器学习的多视角人脸检测方法
CN104537689B (zh) 基于局部对比显著性联合特征的目标跟踪方法
CN103530892A (zh) 一种基于Kinect传感器的双手跟踪方法与装置
CN103886279B (zh) 使用合成训练数据的实时骑车人检测
CN103839038A (zh) 一种人数统计的方法及装置
CN103745197B (zh) 一种车牌检测方法及装置
CN104298969A (zh) 基于颜色与haar特征融合的人群规模统计方法
CN115346177A (zh) 一种新的路侧视角下目标检测***及方法
Daniel Costea et al. Fast boosting based detection using scale invariant multimodal multiresolution filtered features
CN107194946A (zh) 一种基于fpga的红外显著物体检测方法
CN103021183A (zh) 一种监控场景中违章机动车检测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20211111

Address after: 201801 room 1703, No. 888, Moyu South Road, Anting Town, Jiading District, Shanghai

Patentee after: NEUSOFT REACH AUTOMOTIVE TECHNOLOGY (SHANGHAI) Co.,Ltd.

Address before: 110179 No. 2, Xinxiu street, Hunnan New District, Shenyang City, Liaoning Province

Patentee before: NEUSOFT Corp.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230830

Address after: 430056 R&D Building, Building R, Artificial Intelligence Technology Park, Wuhan Economic Development Zone, Wuhan City, Hubei Province (HJA-5-001)

Patentee after: Neusoft Ruichi Automotive Technology (Wuhan) Co.,Ltd.

Address before: 201801 room 1703, No. 888, Moyu South Road, Anting Town, Jiading District, Shanghai

Patentee before: NEUSOFT REACH AUTOMOTIVE TECHNOLOGY (SHANGHAI) Co.,Ltd.

TR01 Transfer of patent right