CN108537188B - 基于局部去相关特征的行人检测方法 - Google Patents
基于局部去相关特征的行人检测方法 Download PDFInfo
- Publication number
- CN108537188B CN108537188B CN201810336812.1A CN201810336812A CN108537188B CN 108537188 B CN108537188 B CN 108537188B CN 201810336812 A CN201810336812 A CN 201810336812A CN 108537188 B CN108537188 B CN 108537188B
- Authority
- CN
- China
- Prior art keywords
- pedestrian detection
- gradient
- data set
- decorrelation
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/285—Selection of pattern recognition techniques, e.g. of classifiers in a multi-classifier system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种基于局部去相关特征的行人检测方法,包括以下步骤:对样本图像集中的所有样本图像进行行人区域标注,并将标注后的所有样本图像作为行人检测数据集;训练行人检测数据集中的每个样本图像进行10个通道变换处理;计算训练样本数据集中的所有训练样本图像的10个变换通道的平均值作为平均人体模型;在所有训练样本图像的头肩区域上进行协方差提取以实现去相关处理,并将平均人体模型中的头肩区域通过协方差提取产生矩阵作为滤波器;将滤波器作用于训练样本数据集得到最终特征,并将得到的最终特征输入基于决策树的AdaBoost分类器中,以训练AdaBoost分类器;将滤波器以及分类器作为最终生成的检测器对待检测图像进行行人检测。
Description
技术领域
本发明涉及计算机视觉及图像处理技术领域,具体涉及一种基于局部去相关特征的行人检测方法。
背景技术
行人检测(Pedestrian Detection)是利用计算机视觉技术判断图像或者视频序列中是否存在行人并给予精确定位。该技术可应用于人工智能***、车辆辅助驾驶***、智能机器人、智能视频监控、人体行为分析、智能交通等领域。
LDCF方法是当前用于行人检测的非基于深度学***均值用于滤波器生成中。这样将导致产生的滤波器不够丰富,降低了滤波器的容差性。
发明内容
本发明是为了解决上述问题而进行的,目的在于提供一种基于局部去相关特征的行人检测方法。
本发明提供了一种基于局部去相关特征的行人检测方法,具有这样的特征,包括:包括以下步骤:步骤一,对样本图像集中的所有样本图像进行行人区域标注,并将标注后的所有样本图像作为行人检测数据集;步骤二,对行人检测数据集中的每个样本图像进行10个通道变换处理,得到训练样本数据集;步骤三,计算训练样本数据集中的所有训练样本图像的10个变换通道的平均值,并将平均值作为平均人体模型;步骤四,基于步骤一中的行人区域标注将训练样本数据集中所有训练样本图像均裁剪出头肩区域作为高辨别区域;步骤五,在所有训练样本图像的头肩区域上进行协方差提取以实现去相关处理,并将平均人体模型中的头肩区域通过协方差提取产生矩阵作为滤波器;步骤六,将步骤五得到的滤波器作用于训练样本数据集得到最终特征,并将得到的最终特征输入基于决策树的AdaBoost分类器中,以训练AdaBoost分类器;步骤七,将步骤五得到的滤波器以及步骤六得到的分类器作为最终生成的检测器;步骤八,将待检测图像输入检测器中进行行人检测。
在本发明提供的基于局部去相关特征的行人检测方法中,还可以具有这样的特征:其中,在步骤二中,10个通道变换处理包含1个HOG梯度幅值通道、6个HOG方向通道以及3个颜色空间通道。
在本发明提供的基于局部去相关特征的行人检测方法中,还可以具有这样的特征:其中,HOG梯度幅值通道的具体计算过程如下:对于任意一个样本图像I(x,y),首先用[-1,0,1]梯度算子进行卷积运算,得到水平方向的梯度分量Gx:Gx=I(x+1,y)-I(x-1,y),再用[1,0,-1]T梯度算子进行卷积运算,得到垂直方向的梯度分量Gy:Gy=I(x,y+1)-I(x,y-1),在点(x,y)处的梯度幅度Gxy为:Gxy=sqrt(Gx^2+Gy^2)。
在本发明提供的基于局部去相关特征的行人检测方法中,还可以具有这样的特征:其中,6个HOG方向通道的具体计算过程如下:对于任意一个样本图像,将图像划分为8×8的方格单元,2×2的方格单元组成一个方块单元,方块单元内的任意一个像素点(x,y)的梯度方向Alpha(x,y)为:Alpha(x,y)=arctan(Gy(x,y)/Gx(x,y)),HOG在进行特征描述时,将角度theta的梯度方向在360度区间划分为6个均匀的空间Sk,每个区间为60度,像素点(x,y)在k个梯度方向上的投影Lk(x,y)为:然后对属于方块单元内的像素点进行投票统计,将方块单元内的每个像素点的梯度方向都采用线性插值来计算得出每一个方块单元内的梯度方向特征,将所有方块单元的梯度方向特征组合在一起进行统计。
在本发明提供的基于局部去相关特征的行人检测方法中,还可以具有这样的特征:其中,3个颜色空间通道变换处理为由RGB通道转换为LUV通道,公式如下:
在本发明提供的基于局部去相关特征的行人检测方法中,还可以具有这样的特征:其中,步骤五的所述去相关处理中的自相关矩阵提取过程为:
式中,Rx为自相关矩阵,E为数学期望,x为随机向量,rij为x的互相关系数,H为转置共轭。
发明的作用与效果
本发明所涉及的基于局部去相关特征的行人检测方法是基于LDCF进行改进:使用平均行人模型的局部区域进行去相关处理,并将得到的滤波器用于检测阶段,作用在10个变换通道中。通过对具有高辨别性的区域进行学习并提取滤波器,并在检测阶段使用滤波器进行行人特征提取,从而训练得到高效的检测器。本发明的基于局部去相关特征的行人检测方法属于浅层学习的方法,相对于深度学习,仅仅在提取行人特征后进行使用基于决策树的分类器进行分类,训练和检测时间更短,更接近实时处理的要求。
附图说明
图1是本发明的实施例中基于局部去相关特征的行人检测方法的过程示意图;以及
图2是本发明的实施例中裁剪头肩区域的示意图。
具体实施方式
为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,以下实施例结合附图对本发明的基于局部去相关特征的行人检测方法作具体阐述。
图1是本发明的实施例中基于局部去相关特征的行人检测方法的过程示意图;以及图2是本发明的实施例中裁剪头肩区域的示意图。
如图1所示,本发明的基于局部去相关特征的行人检测方法包括以下步骤:
步骤一,对样本图像集中的所有样本图像进行行人区域标注,并将标注后的所有样本图像作为行人检测数据集。
步骤二,对行人检测数据集中的每个样本图像进行10个通道变换处理,得到训练样本数据集。
在步骤二中,10个通道变换处理包含1个HOG梯度幅值通道、6个HOG方向通道以及3个颜色空间通道。
HOG梯度幅值通道的具体计算过程如下:
对于任意一个样本图像I(x,y),首先用[-1,0,1]梯度算子进行卷积运算,得到水平方向的梯度分量Gx:
Gx=I(x+1,y)-I(x-1,y),
再用[1,0,-1]T梯度算子进行卷积运算,得到垂直方向的梯度分量Gy:
Gy=I(x,y+1)-I(x,y-1),
在点(x,y)处的梯度幅度Gxy为:
Gxy=sqrt(Gx^2+Gy^2)。
6个HOG方向通道的具体计算过程如下:
对于任意一个样本图像,将图像划分为8×8的方格单元,2×2的方格单元组成一个方块单元,方块单元内的任意一个像素点(x,y)的梯度方向Alpha(x,y)为:
Alpha(x,y)=arctan(Gy(x,y)/Gx(x,y)),
HOG在进行特征描述时,将角度theta的梯度方向在360度区间划分为6个均匀的空间Sk,每个区间为60度,像素点(x,y)在k个梯度方向上的投影Lk(x,y)为:
然后对属于方块单元内的像素点进行投票统计,将方块单元内的每个像素点的梯度方向都采用线性插值来计算得出每一个方块单元内的梯度方向特征,将所有方块单元的梯度方向特征组合在一起进行统计。
3个颜色空间通道变换处理为由RGB通道转换为LUV通道,公式如下:
式中,XYZ为图像LUV通道值;b11、b12、b13、b21、b22、b23、b31、b32、b33均为所示转换常数;RGB为图像原始RGB通道像素值。
步骤三,计算训练样本数据集中的所有训练样本图像的10个变换通道的平均值,并将平均值作为平均人体模型。
步骤四,基于步骤一中的行人区域标注将训练样本数据集中所有训练样本图像均裁剪出特定区域作为高辨别区域。如图2所示,在本实施例中的训练样本图像1中,以头肩区域2作为特定区域。
步骤五,在所有训练样本图像的头肩区域上进行协方差提取以实现去相关处理,并将平均人体模型中的头肩区域通过协方差提取产生矩阵作为滤波器。
去相关处理中的自相关矩阵提取过程为:
式中,Rx为自相关矩阵,E为数学期望,x为随机向量,rij为x的互相关系数,H为转置共轭。
步骤六,将步骤五得到的滤波器作用于训练样本数据集得到最终特征,并将得到的最终特征输入基于决策树的AdaBoost分类器中,以训练AdaBoost分类器。
步骤七,将步骤五得到的滤波器以及步骤六得到的分类器作为最终生成的检测器。
步骤八,将待检测图像输入检测器中进行行人检测。
实施例的作用与效果
本实施例所涉及的基于局部去相关特征的行人检测方法是基于LDCF进行改进:使用平均行人模型的局部区域进行去相关处理,并将得到的滤波器用于检测阶段,作用在10个变换通道中。通过对具有高辨别性的区域进行学习并提取滤波器,并在检测阶段使用滤波器进行行人特征提取,从而训练得到高效的检测器。本实施例的基于局部去相关特征的行人检测方法属于浅层学习的方法,使用正样本的局部区域进行去相关处理,从而提取滤波器,将滤波器在检测阶段使用滑动窗口(Sliding window)方法用于待检测图片的所有待检测区域,相对于深度学习,仅仅在提取行人特征后进行使用基于决策树的分类器进行分类,训练和检测时间更短,更接近实时处理的要求。
上述实施方式为本发明的优选案例,并不用来限制本发明的保护范围。
Claims (6)
1.一种基于局部去相关特征的行人检测方法,其特征在于,包括以下步骤:
步骤一,对样本图像集中的所有样本图像进行行人区域标注,并将标注后的所有样本图像作为行人检测数据集;
步骤二,对所述行人检测数据集中的每个样本图像进行10个通道变换处理,得到训练样本数据集;
步骤三,计算所述训练样本数据集中的所有训练样本图像的10个变换通道的平均值,并将所述平均值作为平均人体模型;
步骤四,基于步骤一中的所述行人区域标注将所述训练样本数据集中所有训练样本图像均裁剪出头肩区域作为高辨别区域;
步骤五,在所有训练样本图像的所述头肩区域上进行协方差提取以实现去相关处理,并将所述平均人体模型中的头肩区域通过所述协方差提取产生矩阵作为滤波器;
步骤六,将步骤五得到的所述滤波器作用于所述训练样本数据集得到最终特征,并将得到的最终特征输入基于决策树的AdaBoost分类器中,以训练所述AdaBoost分类器;
步骤七,将步骤五得到的所述滤波器以及步骤六得到的所述分类器作为最终生成的检测器;
步骤八,将待检测图像输入所述检测器中进行行人检测。
2.根据权利要求1所述的基于局部去相关特征的行人检测方法,其特征在于:
其中,在步骤二中,所述10个通道变换处理包含1个HOG梯度幅值通道、6个HOG方向通道以及3个颜色空间通道。
3.根据权利要求2所述的基于局部去相关特征的行人检测方法,其特征在于:
其中,所述HOG梯度幅值通道的具体计算过程如下:
对于任意一个样本图像I(x,y),首先用[-1,0,1]梯度算子进行卷积运算,得到水平方向的梯度分量Gx:
Gx=I(x+1,y)-I(x-1,y),
再用[1,0,-1]T梯度算子进行卷积运算,得到垂直方向的梯度分量Gy:
Gy=I(x,y+1)-I(x,y-1),
在点(x,y)处的梯度幅度Gxy为:
Gxy=sqrt(Gx^2+Gy^2)。
4.根据权利要求2所述的基于局部去相关特征的行人检测方法,其特征在于:
其中,所述6个HOG方向通道的具体计算过程如下:
对于任意一个样本图像,将图像划分为8×8的方格单元,2×2的所述方格单元组成一个方块单元,所述方块单元内的任意一个像素点(x,y)的梯度方向Alpha(x,y)为:
Alpha(x,y)=arctan(Gy(x,y)/Gx(x,y)),
HOG在进行特征描述时,将角度theta的梯度方向在360度区间划分为6个均匀的空间Sk,每个区间为60度,像素点(x,y)在k个梯度方向上的投影Lk(x,y)为:
然后对属于所述方块单元内的像素点进行投票统计,将所述方块单元内的每个像素点的梯度方向都采用线性插值来计算得出每一个所述方块单元内的梯度方向特征,将所有所述方块单元的梯度方向特征组合在一起进行统计。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810336812.1A CN108537188B (zh) | 2018-04-16 | 2018-04-16 | 基于局部去相关特征的行人检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810336812.1A CN108537188B (zh) | 2018-04-16 | 2018-04-16 | 基于局部去相关特征的行人检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108537188A CN108537188A (zh) | 2018-09-14 |
CN108537188B true CN108537188B (zh) | 2021-09-28 |
Family
ID=63480224
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810336812.1A Active CN108537188B (zh) | 2018-04-16 | 2018-04-16 | 基于局部去相关特征的行人检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108537188B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105678347A (zh) * | 2014-11-17 | 2016-06-15 | 中兴通讯股份有限公司 | 行人检测方法及装置 |
KR20160132731A (ko) * | 2015-05-11 | 2016-11-21 | 계명대학교 산학협력단 | 열 영상에서 온라인 랜덤 펀 학습을 이용하여 보행자를 추적하는 장치 및 방법 |
CN107092884A (zh) * | 2017-04-20 | 2017-08-25 | 宋佳颖 | 一种快速粗精级联行人检测方法 |
-
2018
- 2018-04-16 CN CN201810336812.1A patent/CN108537188B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105678347A (zh) * | 2014-11-17 | 2016-06-15 | 中兴通讯股份有限公司 | 行人检测方法及装置 |
KR20160132731A (ko) * | 2015-05-11 | 2016-11-21 | 계명대학교 산학협력단 | 열 영상에서 온라인 랜덤 펀 학습을 이용하여 보행자를 추적하는 장치 및 방법 |
CN107092884A (zh) * | 2017-04-20 | 2017-08-25 | 宋佳颖 | 一种快速粗精级联行人检测方法 |
Non-Patent Citations (2)
Title |
---|
Efficient Pedestrian Detection via Rectangular Features Based on a Statistical Shape Model;Shanshan Zhang 等;《IEEE TRANSACTIONS ON INTELLIGENT TRANSPORTATION SYSTEMS》;20150430;第16卷(第2期);全文 * |
Local Decorrelation for Improved Pedestrian Detection;Woonhyun Nam 等;《arXiv》;20141104;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN108537188A (zh) | 2018-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Rajput et al. | An automated vehicle license plate recognition system | |
CN105046196B (zh) | 基于级联卷积神经网络的前车车辆信息结构化输出方法 | |
CN107358258B (zh) | 基于nsct双cnn通道和选择性注意机制的sar图像目标分类 | |
CN107330390B (zh) | 一种基于图像分析和深度学习的人数统计方法 | |
CN104966054B (zh) | 无人机可见光图像中的弱小目标检测方法 | |
CN106909884B (zh) | 一种基于分层结构和可变形部分模型的手部区域检测方法和装置 | |
CN109190456B (zh) | 基于聚合通道特征和灰度共生矩阵的多特征融合俯视行人检测方法 | |
CN111915583B (zh) | 复杂场景中基于车载红外热像仪的车辆和行人检测方法 | |
Zhao et al. | License plate location based on Haar-like cascade classifiers and edges | |
CN112733914B (zh) | 一种基于支持向量机的水下目标视觉识别分类方法 | |
CN104408728A (zh) | 一种基于噪声估计的伪造图像检测方法 | |
Kanter | Color Crack: Identifying Cracks in Glass | |
Daramola et al. | Automatic vehicle identification system using license plate | |
CN103544488A (zh) | 一种人脸识别方法及装置 | |
CN111241979B (zh) | 一种基于图像特征标定的实时障碍物检测方法 | |
CN109711420B (zh) | 基于人类视觉注意机制的多仿射目标的检测与识别方法 | |
US20240161461A1 (en) | Object detection method, object detection apparatus, and object detection system | |
CN104063682A (zh) | 一种基于边缘分级和centrist特征的行人检测方法 | |
CN106022310B (zh) | 基于htg-hog和stg特征的人体行为识别方法 | |
CN109800771B (zh) | 混合时空平面局部二值模式的自发微表情定位方法 | |
Tasson et al. | FPGA-based pedestrian detection under strong distortions | |
CN108537188B (zh) | 基于局部去相关特征的行人检测方法 | |
CN109558872B (zh) | 一种车辆颜色识别方法 | |
CN106778504A (zh) | 一种行人检测方法 | |
Jayasudha et al. | Object recognition based on LBP and discrete wavelet transform |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |