CN102194270B - 基于启发信息的行人流量统计方法 - Google Patents

基于启发信息的行人流量统计方法 Download PDF

Info

Publication number
CN102194270B
CN102194270B CN2011101473583A CN201110147358A CN102194270B CN 102194270 B CN102194270 B CN 102194270B CN 2011101473583 A CN2011101473583 A CN 2011101473583A CN 201110147358 A CN201110147358 A CN 201110147358A CN 102194270 B CN102194270 B CN 102194270B
Authority
CN
China
Prior art keywords
pedestrian
point
foreground
heuristic information
algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2011101473583A
Other languages
English (en)
Other versions
CN102194270A (zh
Inventor
陆蓓
姚金良
汪澄
王小华
谌志群
王荣波
吴海虹
王大全
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HANGZHOU DAYAN TECHNOLOGY CO LTD
Original Assignee
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University filed Critical Hangzhou Dianzi University
Priority to CN2011101473583A priority Critical patent/CN102194270B/zh
Publication of CN102194270A publication Critical patent/CN102194270A/zh
Application granted granted Critical
Publication of CN102194270B publication Critical patent/CN102194270B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明涉及一种基于启发信息的行人流量统计方法。本发明首先在输入视频的第一帧图像中的任意位置设定一个虚拟门;然后采用混合高斯背景建模方法分割前景,并对结果后处理,去除噪声;接着,将原图转换到HSV空间,去除前景中的阴影部分;在学习阶段,采用基于梯度方向直方图的方法进行行人检测,并将若干检测结果通过最小二乘法拟合成直线后,作为启发信息确定虚拟门上各点与其所在位置行人模型的前景点象素总数的比值,来为每个点赋予权重;在计数阶段,采用稀疏光流LK算法对门上的点进行运动补偿,确定运动矢量的大小和方向,并通过累加这些具有权重的、经过运动补偿了的前景点以达到行人流量统计的目的。本发明复杂度低、计数精度高。

Description

基于启发信息的行人流量统计方法
技术领域
本发明属于智能视频监控领域,具体涉及一种基于启发信息的行人流量统计方法。 
背景技术
行人流量统计就是统计某个时间段内进出某一通道的人数。从不同的角度分类,行人流量统计***有多种类型。按照所选硬件平台的不同,可分为接触式(如旋转门),传感器式(如激光束),和基于视觉式(如摄像机)***。按照摄像机安放位置的不同,可分为基于垂直摄像和基于倾斜摄像的***。按照摄像机是否被标定,可分为相机标定式和相机未标定式***。接触式和传感器式***容易造成出入口的拥堵,且计数精度较差;基于垂直摄像的***虽然计数精度高,算法简单,但它只能从顶之下获取行人的部分信息,出于安全监控考虑,我们需要保留行人的其它信息(如面部特征,衣着特征等),而且当今监控摄像头以倾斜摄像为主;相机标定式***需要寻求相机本身的标定系数,不具有普适性。因此,综合考虑各方面因素,当今多数行人流量统计***是相机未标定、基于倾斜摄像的。 
近年来,已有一些研究工作在这方面开展,可参考Chan等人的文献(A. B. Chan, Z. S. J. Liang, and N. Vasconcelos, “Privacy Preserving Crowd Monitoring: Counting People without People Models or Tracking,” In IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Anchorage, June 2008)。总的来说,可将所采用的算法大体分为三类。 
基于行人检测跟踪的方法。首先分割前景,然后采用匹配搜索的方法检测行人或行人的一部分(人脸,人头,头肩,上身等),最后对检测的结果进行跟踪,一条有效的跟踪轨迹代表一个行人。此类方法中的两个核心技术——行人检测和运动目标跟踪,在视频监控领域本身就是两类技术难题,算法的复杂度较高,这为计数***的实时性能带来了考验。 
基于特征点轨迹聚类的方法。首先提取某些利于跟踪的特征点,例如角点,然后对这些特征点逐帧跟踪,形成特征轨迹,最后将具有相似性特征的轨迹聚类,一个类代表一个行人。此类方法要求统计的运动目标需具同一性,且需要寻求一种较好的聚类方法。 
基于低层特征回归的方法。首先分割前景,然后提取前景区域中的低层特征(面积,周长,边缘,边缘方向,纹理等),形成一个若干维的特征向量,最后通过某种回归函数来确定特征向量与人数之间的对应关系。此类方法无需进行行人检测和跟踪,但是对前景分割结果的依赖性较大,且一般情况下需要对大量特定场景的样本进行标注训练,缺乏通用性。 
发明内容
本发明的目的主要是针对现有的行人流量统计***很难在满足计数精度的前提下,达到较好的实时性,而提供一种算法复杂度低、有较好精度的方法,实现对一般场景中的行人流量统计。 
本发明方法步骤如下: 
步骤(1)获取输入视频的第一帧图像,在该图像任意位置设定一个虚拟门。
步骤(2)采用混合高斯背景建模方法,将前景区域从背景中分割出来,并对得到的前景区域进行后处理,后处理主要包括以下步骤: 
1)  采用形态学腐蚀和膨胀方法去除噪声;
2)  分析前景点的连通性,去除小于某个阈值的连通区域。
步骤(3)将原图转换到HSV空间后,去除前景区域的阴影部分。 
步骤(4)学习阶段。包括以下步骤: 
1)  采用基于梯度方向直方图的方法进行行人检测;
2)  利用检测出的行人的外接矩形中心的纵坐标和矩形框内的前景点象素总数来构成行人模型,并将若干个行人模型通过最小二乘法拟合成直线,形成启发信息;
3)  通过启发信息,确定虚拟门上各点与其所在位置行人模型中的前景点象素总数的比值,来为每个点赋予权重。
步骤(5)计数阶段。包括以下步骤: 
1)采用稀疏光流LK算法对门上的点进行运动补偿。包括如下步骤:
a由稀疏光流LK算法确定的相角与虚拟门方向之间的夹角确定运动矢量方向;
b由稀疏光流LK算法确定的幅值与运动矢量方向的正弦值确定运动矢量大小。
2)统计门上各个前景点的个数并获得其信息,包括权重、运动矢量的大小和方向。通过补偿后的前景点的加权和来统计行人流量。 
本发明是基于低层特征回归方法的一个变种,不同于传统依赖检测、跟踪或是特征点聚类方法具有较高的算法复杂度,本发明主要复杂度集中在行人检测,学习阶段完成后,在计数阶段即可达到实时计数的效果。对来自CAVIAR Test Case Scenarios公开数据库中的几个视频进行测试,能够达到85%以上的计数精度。 
附图说明
图1是一幅流程框图,表示了本发明的整个过程。 
图2是虚拟门设置的一幅示例图。 
图3(a)是一帧原始图像。 
图3(b)是利用混合高斯背景建模方法,并进行后处理的前景分割示例图。 
图3(c)是在图3(b)的基础上去除阴影后的效果图。 
图4是利用梯度方向直方图方法检测出的行人。 
图5是通过最小二乘法将6个行人模型拟合后得到的直线。 
具体实施方式
以下将参考附图详细介绍本发明的实施例。 
图1是一个流程框图,表示了本发明基于启发信息的行人流量统计***方法的流程图。 
本方法处理的视频可以针对多种视频编码格式,例如:MPG、FLV等,只要能将该格式的视频转换为XviD编码的AVI格式视频即可。在此实施例中假定输入的视频已经是XviD编码后的AVI格式了。 
虚拟门设置是计数***运行前必不可少的一步。首先获取输入视频的第一帧图像,在该图像任意位置设定一个虚拟门。这里所谓的虚拟门实际上是人为确定的、处于图像任意位置的一条直线。在画虚拟门时,用户只需要确定其两个端点,***将会自动采用Bresenham算法绘制直线。虚拟门可以认为是手工设置的一个感兴趣区域,后续步骤都将围绕它展开。虚拟门的长短和方向设定是任意的,但是在一般情况下,为了计数的准确性,在设置虚拟门时,应使其落在视觉的地平面上并且与行人大体运动方向垂直。虚拟门示例图如图2。两个端点坐标值分别为:(70,178)和(290,178)。 
前景分割(即运动区域检测)结果的好坏直接影响到最终的统计结果,因为人流的数量是通过累加虚拟门上的前景点而获得的。本实施例采用Stauffer等人设计的混合高斯背景模型(C. Stauffer, W. E. L. Grimson. "Adaptive background mixture models for real-time tracking," Computer Vision and Pattern Recognition, IEEE Computer Society Conference on, Vol. 2 (06 August 1999), pp. 246-252)来获取前景。此方法用N个高斯分布模型来一同描述背景像素的分布规律。实施例中几个关键变量设置为:高斯分布个数N=4,背景比例T=0.7,学习速率Alpha=max(0.001,1/frameIndex)(frameIndex为帧的索引值),学习速率Beta=max(Alpha, 1/frameIndex),匹配阈值Lambda=2.5,初始权重InitWeight=0.05,初始方差InitDelta=320。为了使结果更精确,需要进行后处理。首先利用形态学方法,先腐蚀后膨胀,去除前景及背景中的噪声点,然后分析连通性(这里的连通性指的是某个象素点的8连通域),去除面积小于某个阈值的噪声块。这个阈值初始化时被赋予较小值(实施例中取经验值200),在计数阶段,可以根据学习阶段获取的行人模型的大小,将该阈值自适应调整到一个合适的值。附图3(b)是图3(a)利用上述背景建模以及后处理方法后提取运动区域的一幅示例图。 
阴影去除部分是在运动目标检测之后,对一些与运动目标有着相同运动特征的阴影进行消除的过程。在获取前景时,由于光照的影响,行人运动时产生的阴影也被当成了运动像素,这无疑会使最终的统计结果偏大。为此,去除阴影也是必不可少的一个步骤。本实施例采用文献(R. Cucchiara, C. Grana, M. Piccardi, and A. Prati. "Detecting moving objects, ghosts, and shadows in video streams," IEEE Transactions on Pattern Analysis and Machine Intelligence, 2003, Vol. 25(10): 1337-1342.)的方法,将原图转换到HSV空间,检测并去除阴影。可以根据式(1)的方法判断HSV空间中的某个前景点是否为阴影。 
Figure DEST_PATH_RE-DEST_PATH_IMAGE002
                  (1) 
其中,IC(x,y)和BC(x,y)分别为当前图和背景图某点的值,
Figure DEST_PATH_RE-DEST_PATH_IMAGE004
。alpha,beta,tauS,tauH为各条件的阈值,实施例中分别选为0.60,0.90,0.1和2.0。若某个前景点的SP值为1,表明该点为阴影象素;否则,为非阴影象素。在采用此方法判别以后,也要采用后处理方法,包括连通性分析和膨胀,以降低误检率。一幅去除阴影后的示例图如附图3(c)。
在学习阶段,首先采用基于HOG,即梯度方向直方图(N. Dalai and B. Triggs. "Histograms of oriented gradients for human detection," Coference on Computer Vision and Pattern Recognition (CVPR), 2005.)的行人检测方法检测行人。实施例中使用HOG方法的参数设置为:3×3细胞/区间,6×6像素/细胞,9个直方图通道,构成一个3780维的向量。检测结果中以矩形框描述行人的中心位置和大小,示例图如图4所示。中心坐标为:CenterX=RectX+RectWidth/2,CenterY=RectY+RectHeight/2;大小为:RectWidth和RectHeight。其中,CenterX和CenterY分别为中心位置的横坐标和纵坐标,RectX、RectY、RectWidth、RectHeight分别为检测出的行人的外接矩形框的起始位置横、纵坐标,以及矩形框的宽度和高度。统计当前帧某个矩形框内前景点个数,可以得到一个行人模型,其包括两个参数:中心纵坐标CenterY和前景点个数AreaCount。用同样的方法得到N个行人模型(实施例中N=6),这N个模型两两之间须满足:CenterY[i]-Center[j]≧5象素,i≠j且i,j=1,2,…N。通过这N个模型,可以自适应调整运动目标检测后处理中连通性分析的阈值T=min(AreaCount[i])/2,i=1,2,…N。 
将这N个模型拟合成直线,并作为启发信息给虚拟门上的每个点赋予权重。由于透视作用的影响,离摄像机越近的物体看起来越大,反之,越远的物体看起来就越小。物体的大小与图像Y轴坐标值之间在整体上是呈线性关系的,因此可以以CenterY为横坐标,AreaCount为纵坐标,通过最小二乘法,将N个行人模型拟合成一条直线L,示例图如图5所示。将这种线性关系作为启发信息,为门上各点赋予权重,具体步骤如下: 
1)统计门上点的个数,PointCount;
2)记录门上各个点的位置信息:PosX[i]和PosY[i],i=1,2,…,PointCount;
3)根据直线L和每个点各自的位置PosY,确定其在当前位置所表征的前景点象素个数AreaCount[i],i=1,2,…,PointCount;
4)每个点的权重可表示为:PointWeight[i]=1/AreaCount[i],i=1,2,…,PointCount。
在计数阶段,对门上的前景点进行运动补偿。行人在行走时的速度不一致,使得经过虚拟门的过程有快慢。因此,需要对门上的各个点进行运动补偿,以免在某一时刻扫描虚拟门时,因运动过快导致像素点漏检或者运动过慢而导致重复计数。采用稀疏光流LK算法确定运动矢量的大小和方向,窗口大小为5×5。在通过前后相邻两帧得到X方向的运动分量XMotionMap和Y方向的运动分量YMotionMap之后,计算MagMap和AngleMap,分别代表通过LK算法得到的幅值图和相角图。 
通过累加前景点的方法达到行人计数的目的。这里的前景点是指虚拟门上的、赋予权重了的、运动补偿后的前景点。具体步骤如下: 
1)计算虚拟门与X轴之间的夹角GateAngle;
2)逐帧扫描门上的PointCount个点;
3)若某个点为前景点,则获取该点的权重PointWeight,幅值PointMag及相角PointAngle;
4)通过式(2)计算行人的分量:
Figure DEST_PATH_RE-DEST_PATH_IMAGE006
(2)
其中N为前景点个数,Alpha为调整因子,取经验值0.85;
5)累加行人分量,统计行人个数:
Figure DEST_PATH_RE-DEST_PATH_IMAGE008
; 
6)P值到达某个整数时,该整数值表示的是当前时刻的累计人流数。为了提高统计精度,若5帧内虚拟门上的前景点数小于某个阈值时(取经验值10),将当前的P值四舍五入。
从上面的实施例中可以看出,本发明提出的启发式行人流量统计方法,算法简单,人机交互方便,在确保具有良好的精度的前提下,可以达到实时性的要求。 

Claims (1)

1.基于启发信息的行人流量统计方法,其特征在于该方法包括以下步骤:
(1)获取输入视频的第一帧图像,在该图像任意位置设定一个虚拟门;
(2)采用混合高斯背景建模方法,将前景区域从背景中分割出来,并对前景进行后处理;
(3)将原图转换到HSV空间后,去除前景区域的阴影部分;
(4)学习阶段,包括以下步骤:
4-1采用基于梯度方向直方图的方法进行行人检测;
4-2通过检测结果形成启发信息;
4-3为虚拟门上的每个点赋予权重;
(5)计数阶段,包括以下步骤:
5-1采用稀疏光流LK算法对门上的点进行运动补偿;
5-2通过补偿后的前景点的加权和来统计行人流量;
步骤4-2中所述的通过检测结果形成启发信息是采用最小二乘法将若干个行人模型拟合后形成一条直线;所述的行人模型是由检测出的行人的外接矩形中心的纵坐标和矩形框内的前景点象素总数构成;
步骤4-3中所述的为虚拟门上的每个点赋予权重是由各点与其所在位置行人模型中的前景点象素总数的比值来确定;
步骤(2)中所述的前景后处理步骤包括:
A.采用形态学腐蚀和膨胀方法去除噪声;
B.分析前景点的连通性,去除小于某个阈值的连通区域;
步骤5-1中所述的采用稀疏光流LK算法对门上的点进行运动补偿步骤包括:
C.由稀疏光流LK算法确定的相角与虚拟门方向之间的夹角确定运动矢量方向;
D.由稀疏光流LK算法确定的幅值与运动矢量方向的正弦值确定运动矢量大小。
CN2011101473583A 2011-06-02 2011-06-02 基于启发信息的行人流量统计方法 Expired - Fee Related CN102194270B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011101473583A CN102194270B (zh) 2011-06-02 2011-06-02 基于启发信息的行人流量统计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011101473583A CN102194270B (zh) 2011-06-02 2011-06-02 基于启发信息的行人流量统计方法

Publications (2)

Publication Number Publication Date
CN102194270A CN102194270A (zh) 2011-09-21
CN102194270B true CN102194270B (zh) 2012-11-07

Family

ID=44602279

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011101473583A Expired - Fee Related CN102194270B (zh) 2011-06-02 2011-06-02 基于启发信息的行人流量统计方法

Country Status (1)

Country Link
CN (1) CN102194270B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102819764B (zh) * 2012-07-18 2015-07-08 郑州金惠计算机***工程有限公司 一种适用于交通路口复杂场景下的多视角人流量统计方法
CN104143077B (zh) * 2013-05-09 2018-07-03 深圳先进技术研究院 基于图像的行人目标检索方法和***
CN104091351B (zh) * 2014-06-27 2017-03-15 江苏慧眼数据科技股份有限公司 基于聚类法的人数计数方法
CN104506820A (zh) * 2015-01-06 2015-04-08 成都新舟锐视科技有限公司 一种多目标智能跟踪***
CN107331114B (zh) * 2017-06-09 2019-06-07 安徽富煌科技股份有限公司 一种基于视频客流计数的人流量预警***
CN113011384B (zh) * 2021-04-12 2022-11-25 重庆邮电大学 一种基于轻量化卷积的无锚框目标检测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1852428A (zh) * 2006-05-25 2006-10-25 浙江工业大学 基于全方位计算机视觉的智能隧道安全监控装置
WO2007062044A2 (en) * 2005-11-23 2007-05-31 Object Video, Inc Object density estimation in video
CN101847265A (zh) * 2010-04-20 2010-09-29 上海理工大学 一种在公交客流统计***中使用的运动目标提取及多目标分割方法
CN102054167A (zh) * 2010-12-14 2011-05-11 浙江工业大学 基于无线红外监控的全天候多路通道人流量监测***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007062044A2 (en) * 2005-11-23 2007-05-31 Object Video, Inc Object density estimation in video
CN1852428A (zh) * 2006-05-25 2006-10-25 浙江工业大学 基于全方位计算机视觉的智能隧道安全监控装置
CN101847265A (zh) * 2010-04-20 2010-09-29 上海理工大学 一种在公交客流统计***中使用的运动目标提取及多目标分割方法
CN102054167A (zh) * 2010-12-14 2011-05-11 浙江工业大学 基于无线红外监控的全天候多路通道人流量监测***

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
人流量统计视频监控***;侯俊;《电视技术》;20091231;第33卷(第2期);63-65 *
侯俊.人流量统计视频监控***.《电视技术》.2009,第33卷(第2期),63-65.

Also Published As

Publication number Publication date
CN102194270A (zh) 2011-09-21

Similar Documents

Publication Publication Date Title
Asha et al. Vehicle counting for traffic management system using YOLO and correlation filter
CN102194270B (zh) 基于启发信息的行人流量统计方法
CN104867161B (zh) 一种视频处理方法及装置
CN106203513B (zh) 一种基于行人头肩多目标检测及跟踪的统计方法
CN105404847B (zh) 一种遗留物实时检测方法
CN104978567B (zh) 基于场景分类的车辆检测方法
CN107153824A (zh) 基于图聚类的跨视频行人重识别方法
CN104992453A (zh) 基于极限学习机的复杂背景下目标跟踪方法
CN107066963B (zh) 一种自适应人群计数方法
CN103714181A (zh) 一种层级化的特定人物检索方法
CN105554462A (zh) 一种遗留物检测方法
Jiang et al. An Approach for Crowd Density and Crowd Size Estimation.
CN104376334A (zh) 一种多尺度特征融合的行人比对方法
CN106570449A (zh) 一种基于区域定义的人流量与人气指数检测方法及检测***
Hou et al. A background reconstruction algorithm based on pixel intensity classification in remote video surveillance system
Al-Heety Moving vehicle detection from video sequences for traffic surveillance system
Yang et al. A method of pedestrians counting based on deep learning
CN108629327A (zh) 一种基于图像处理的人数统计方法及装置
Roy et al. A comprehensive survey on computer vision based approaches for moving object detection
Najeeb et al. Tracking ball in soccer game video using extended Kalman filter
CN102708573B (zh) 复杂场景下的群体运动模式检测方法
CN105930789A (zh) 基于对数欧式空间词袋模型的人体行为识别
Guo et al. Small aerial target detection using trajectory hypothesis and verification
CN104200455A (zh) 一种基于运动统计特征分析的关键姿态提取方法
Zarka et al. Real-time human motion detection and tracking

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: HANGZHOU DAYAN TECHNOLOGY CO., LTD.

Free format text: FORMER OWNER: HANGZHOU ELECTRONIC SCIENCE AND TECHNOLOGY UNIV

Effective date: 20131225

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20131225

Address after: 3, room 315, No. 452, Hangzhou hi tech enterprise incubator Park, No. 6, No. 310018, Hangzhou economic and Technological Development Zone, Zhejiang, Hangzhou, China

Patentee after: Hangzhou Dayan Technology Co.,Ltd.

Address before: Hangzhou City, Zhejiang province 310018 Xiasha Higher Education Park No. 2 street

Patentee before: Hangzhou Electronic Science and Technology Univ

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20121107

Termination date: 20160602