CN112528885A - 一种智能划区的站台工作人员的识别方法 - Google Patents
一种智能划区的站台工作人员的识别方法 Download PDFInfo
- Publication number
- CN112528885A CN112528885A CN202011485426.2A CN202011485426A CN112528885A CN 112528885 A CN112528885 A CN 112528885A CN 202011485426 A CN202011485426 A CN 202011485426A CN 112528885 A CN112528885 A CN 112528885A
- Authority
- CN
- China
- Prior art keywords
- pedestrian
- mask
- detection
- algorithm
- picture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 24
- 238000013316 zoning Methods 0.000 title claims abstract description 10
- 238000001514 detection method Methods 0.000 claims abstract description 30
- 238000013135 deep learning Methods 0.000 claims abstract description 7
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 6
- 238000013145 classification model Methods 0.000 claims abstract description 4
- 230000004927 fusion Effects 0.000 claims description 6
- 239000003086 colorant Substances 0.000 claims description 5
- 230000006870 function Effects 0.000 claims description 3
- 238000011176 pooling Methods 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 5
- 230000007613 environmental effect Effects 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000005286 illumination Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/103—Static body considered as a whole, e.g. static pedestrian or occupant recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Multimedia (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Human Computer Interaction (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明提供了一种智能划区的站台工作人员识别方法,步骤如下:采集行人数据;使用打标好的数据,用卷积神经网络训练行人分类模型;颜色过滤器;对经过颜色过滤器后的图片做显著性检测,使用SOD100K自动精确提取警戒线区域maskⅠ;根据警戒线区域maskⅠ勾画出封闭的多边形警戒区域,得到maskⅡ;对原图和maskⅡ取图像的与操作图,得到目标区域图片;对所得到的目标区域图片使用基于深度学习的方法yolov4做行人检测,若有行人,则得到对应的行人检测框bbox;对得到的行人框bbox,提取对应的行人图片;使用预先训练好的行人分类网络模型对行人图片做分类识别,得到识别结果为非工作人员,或者工作人员的种类。
Description
技术领域
本发明涉及一种智能划区的站台工作人员的识别方法。
背景技术
火车或者高铁站站台上某些区域非工作人员是禁止进入的,若普通旅客进入该区域,可能存在一定的危险,因此智能划区并识别出工作人员,对非工作人员进行预警警告,显得非常重要。由于车站环境复杂,监控摄像头的安装角度通常是不固定的,如何根据实际场景,在不受摄像头角度影响的情况下智能划出指定区域,并识别出区域内工作人员种类,是有一定的挑战性的。
随着计算机视觉技术和机器学习的发展与进步,使用深度学习的方法,对物体的深度特征的提取与识别,在物体的检测和识别上可以实现鲁棒且效果比较好的结果。
现有技术的缺陷主要是:
1.基于传统的机器学习方法对区域的检测,容易受到其他环境因素的影响,比如光照和颜色相近的物体的影响,产生较多的噪声;
2.传统的特征提取方法是基于手工设计的特征,这些特征容易受光照,亮度等因素的影响,从而对人员的检测和分类识别结果不准确。
发明内容
本发明目的在于克服现有技术的不足,基于颜色对站台警戒线粗提取区域线,然后基于深度学习的方法对警戒线进行精提取,从而勾画出警戒区域,该方法不受摄像头安装角度影响,智能识别指定区域。通过使用深度学习的行人检测和分类识别方法对站台区域内行人进行检测和识别,所使用的物体深度特征对环境影响具有鲁棒性。
本发明的具体技术方案如下:
一种智能划区的站台工作人员的识别方法。包含以下步骤:
步骤一 采集行人数据,并人工打标分类;
步骤二 使用步骤一人工打标好的数据,用卷积神经网络训练行人分类模型;
步骤三 颜色过滤器:首先图片由BGR转换成HSV空间,然后根据警戒线的颜色分别确定H、S、V,的取值范围,本发明中取值为:11<H<26,S>43或S<255,V>46或V<255,把不同时在H、S、V取值范围内的值置零;
步骤四 对经过颜色过滤器后的图片做显著性检测,自动精确提取警戒线区域maskI的使用的算法为SOD100K(Highly Efficient Salient Object Detection with100K Parameters),该算法提出的轻量级网络主要由特征提取器和跨阶段的融合部分组成,可同时处理多个尺度的特征。特征提取器与SOD100K提出的层内多尺度块堆叠在一起,并根据特征图的分辨率分为4个阶段,每个阶段分别具有3、4、6和4个层内多尺度块。SOD100K提出的一种灵活的卷积模块(gOctConvs)组成的跨阶段融合部分会处理来自特征提取器各阶段的特征以获得高分辨率的输出。
该算法使用一种新型的动态权重衰减方案来减少特征表示的冗余性,可以根据某些通道的特定特征来调整权重衰减。具体来说,在反向传播期间,衰减项会根据某些通道的特征动态变化。动态权重衰减的权重更新可表示为:
其中λd是动态权重衰减的权重,xi表示由wi计算的特征,而S(xi)是特征的度量,根据任务可以具有多个定义,wi是第i层的权重,是要更新的梯度。在该算法中,目标是根据稳定通道之间的特征进行权重分配,使用全局平均池化作为特定通道的指标,公式可表示为:
xi表示特征图,H,W分别表示特征图的高和宽。
步骤五 根据警戒线区域maskI勾画出封闭的多边形警戒区域,并把封闭区域内像素值设置为255,区域外像素值全部设置为0,得到maskⅡ;
步骤六 对原图和步骤五中的maskⅡ取图像的与操作图,得到目标区域图片;
步骤七 对步骤六中所得到的目标区域图片使用基于深度学习的方法yolov4(Optimal Speed and Accuracy of Object Detection)做行人检测,若有行人,则得到对应的行人检测框bbox,yolov4算法是一种通用的目标检测算法,该算法主要的特征是目标检测的精度高速度快,其主要使用的损失函数为CIoU,可表示为:
其中,
b,bgt分别代表anchor框和目标框的中心点,ρ(·)表示欧式距离,c代表的是能够同时覆盖anchor和目标框的最小矩形的对角线距离,ω,h分别表示预测框的宽和高,ωgt,hgt分别为真实框的宽和高。
步骤八 对步骤七中得到的行人框bbox,提取对应的行人图片;
步骤九 使用预先训练好的行人分类网络模型对行人图片做分类识别,得到识别结果为非工作人员,或者工作人员的种类。
技术效果
通过传统的机器学习方法划区,由于安装监控摄像头的角度不固定,容易受到环境因素和噪声的影响,从而导致区域提取不准确。本发明首先采用颜色过滤的方法,初步的剔除大部分与目标区域不相关的其他物体,然后再使用显著性目标检测SOD100K进行精细的提取目标区域,该方法能有效过滤噪声,减少环境影响,根据图片的语义信息自动精确的提取目标区域边缘。
本发明使用对目标区域内的图片使用yolov4的方法进行行人检测,对检测出的行人图片使用卷积神经网络做行人分类,由于卷积神经网络使用的是物体的深度特征,受环境因素的影响较小,能准确地识别出行人的种类,若非工作人员在指定区域内停留时间达到所设定的阈值,则可以发出预警。
附图说明
图1是本发明一种智能划区的站台工作人员的识别方法示意图。
具体实施方式
下面结合附图和具体实施方式对本发明作进一步详细的说明。
一种智能划区的站台工作人员识别方法,其整体步骤如下。
步骤一 采集行人数据,并人工打标分类;
步骤二 使用步骤一人工打标好的数据,用卷积神经网络训练行人分类模型;
步骤三 颜色过滤器:首先图片由BGR转换成HSV空间,然后根据警戒线的颜色分别确定H、S、V,的取值范围,本发明中取值为:11<H<26,S>43或S<255,V>46或V<255,把不同时在H、S、V取值范围内的值置零;
步骤四 对经过颜色过滤器后的图片做显著性检测,自动精确提取警戒线区域maskI的使用的算法为SOD100K(Highly Efficient Salient Object Detection with100K Parameters),该算法提出的轻量级网络主要由特征提取器和跨阶段的融合部分组成,可同时处理多个尺度的特征。特征提取器与SOD100K提出的层内多尺度块堆叠在一起,并根据特征图的分辨率分为4个阶段,每个阶段分别具有3、4、6和4个层内多尺度块。SOD100K提出的一种灵活的卷积模块(gOctConvs)组成的跨阶段融合部分会处理来自特征提取器各阶段的特征以获得高分辨率的输出。
该算法使用一种新型的动态权重衰减方案来减少特征表示的冗余性,可以根据某些通道的特定特征来调整权重衰减。具体来说,在反向传播期间,衰减项会根据某些通道的特征动态变化。动态权重衰减的权重更新可表示为:
其中λd是动态权重衰减的权重,xi表示由wi计算的特征,而S(xi)是特征的度量,根据任务可以具有多个定义,wi是第i层的权重,是要更新的梯度。在该算法中,目标是根据稳定通道之间的特征进行权重分配,使用全局平均池化作为特定通道的指标,公式可表示为:
xi表示特征图,H,W分别表示特征图的高和宽。
步骤五 根据警戒线区域maskI勾画出封闭的多边形警戒区域,并把封闭区域内像素值设置为255,区域外像素值全部设置为0,得到maskⅡ;
步骤六 对原图和步骤五中的maskⅡ取图像的与操作图,得到目标区域图片;
步骤七 对步骤六中所得到的目标区域图片使用基于深度学习的方法yolov4(Optimal Speed and Accuracy of Object Detection)做行人检测,若有行人,则得到对应的行人检测框bbox,yolov4算法是一种通用的目标检测算法,该算法主要的特征是目标检测的精度高速度快,其主要使用的损失函数为CIoU,可表示为:
其中,
b,bgt分别代表anchor框和目标框的中心点,ρ(·)表示欧式距离,c代表的是能够同时覆盖anchor和目标框的最小矩形的对角线距离,ω,h分别表示预测框的宽和高,ωgt,hgt分别为真实框的宽和高。
步骤八 对步骤七中得到的行人框bbox,提取对应的行人图片;
步骤九 使用预先训练好的行人分类网络模型对行人图片做分类识别,得到识别结果为非工作人员,或者工作人员的种类。
Claims (1)
1.一种智能划区的站台工作人员识别方法,其特征在于,步骤如下:
步骤一 采集行人数据,并人工打标分类;
步骤二 使用步骤一人工打标好的数据,用卷积神经网络训练行人分类模型;
步骤三 颜色过滤器:首先图片由BGR转换成HSV空间,然后根据警戒线的颜色分别确定H、S、V,的取值范围,取值为:11<H<26,S>43或S<255,V>46或V<255,把不同时在H、S、V取值范围内的值置零;
步骤四 对经过颜色过滤器后的图片做显著性检测,自动精确提取警戒线区域maskI,使用的算法为SOD100K(Highly Efficient Salient Object Detection with 100KParameters),该算法提出的轻量级网络主要由特征提取器和跨阶段的融合部分组成,可同时处理多个尺度的特征;特征提取器与SOD100K提出的层内多尺度块堆叠在一起,并根据特征图的分辨率分为4个阶段,每个阶段分别具有3、4、6和4个层内多尺度块;SOD100K提出的一种灵活的卷积模块(gOctConvs)组成的跨阶段融合部分会处理来自特征提取器各阶段的特征以获得高分辨率的输出;
该算法使用一种新型的动态权重衰减方案来减少特征表示的冗余性,可以根据某些通道的特定特征来调整权重衰减;具体来说,在反向传播期间,衰减项会根据某些通道的特征动态变化;动态权重衰减的权重更新可表示为:
其中λd是动态权重衰减的权重,xi表示由wi计算的特征,而S(xi)是特征的度量,根据任务可以具有多个定义,wi是第i层的权重,是要更新的梯度;在该算法中,目标是根据稳定通道之间的特征进行权重分配,使用全局平均池化作为特定通道的指标,公式可表示为:
xi表示特征图,H,W分别表示特征图的高和宽;
步骤五 根据警戒线区域maskI勾画出封闭的多边形警戒区域,并把封闭区域内像素值设置为255,区域外像素值全部设置为0,得到maskⅡ;
步骤六 对原图和步骤五中的maskⅡ取图像的与操作图,得到目标区域图片;
步骤七 对步骤六中所得到的目标区域图片使用基于深度学习的方法yolov4(OptimalSpeed and Accuracy of Object Detection)做行人检测,若有行人,则得到对应的行人检测框bbox,yolov4算法是一种通用的目标检测算法,该算法主要的特征是目标检测的精度高速度快,其主要使用的损失函数为CIoU,可表示为:
其中,
b,bgt分别代表anchor框和目标框的中心点,ρ(·)表示欧式距离,c代表的是能够同时覆盖anchor和目标框的最小矩形的对角线距离,ω,h分别表示预测框的宽和高,ωgt,hgt分别为真实框的宽和高;
步骤八 对步骤七中得到的行人框bbox,提取对应的行人图片;
步骤九 使用预先训练好的行人分类网络模型对行人图片做分类识别,得到识别结果为非工作人员,或者工作人员的种类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011485426.2A CN112528885A (zh) | 2020-12-16 | 2020-12-16 | 一种智能划区的站台工作人员的识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011485426.2A CN112528885A (zh) | 2020-12-16 | 2020-12-16 | 一种智能划区的站台工作人员的识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112528885A true CN112528885A (zh) | 2021-03-19 |
Family
ID=75000599
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011485426.2A Pending CN112528885A (zh) | 2020-12-16 | 2020-12-16 | 一种智能划区的站台工作人员的识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112528885A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114067360A (zh) * | 2021-11-16 | 2022-02-18 | 国网上海市电力公司 | 一种行人属性检测方法及装置 |
-
2020
- 2020-12-16 CN CN202011485426.2A patent/CN112528885A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114067360A (zh) * | 2021-11-16 | 2022-02-18 | 国网上海市电力公司 | 一种行人属性检测方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108759973B (zh) | 一种水位测量方法 | |
CN109977812B (zh) | 一种基于深度学习的车载视频目标检测方法 | |
CN109785337B (zh) | 一种基于实例分割算法的栏内哺乳动物清点方法 | |
CN107633516B (zh) | 一种识别路面变形类病害的方法和装置 | |
CN105678285B (zh) | 一种自适应的道路鸟瞰图变换方法和道路车道检测方法 | |
CN104112269B (zh) | 一种基于机器视觉的太阳能电池激光刻线参数检测方法及*** | |
CN110866430B (zh) | 一种车牌识别方法及装置 | |
CN102867417B (zh) | 一种出租车防伪***及方法 | |
CN109101924A (zh) | 一种基于机器学习的路面交通标志识别方法 | |
CN109902676B (zh) | 一种基于动态背景的违停检测算法 | |
CN109086687A (zh) | 基于pca降维的hog-mblbp融合特征的交通标志识别方法 | |
CN113011283B (zh) | 一种基于视频的非接触式钢轨轨枕相对位移实时测量方法 | |
CN111753797A (zh) | 一种基于视频分析的车辆测速方法 | |
CN108509950B (zh) | 基于概率特征加权融合的铁路接触网支柱号牌检测识别法 | |
CN113436157A (zh) | 一种用于受电弓故障的车载图像识别方法 | |
CN112149543A (zh) | 一种基于计算机视觉的建筑扬尘识别***与方法 | |
CN113435407B (zh) | 一种输电***的小目标识别方法及装置 | |
CN106056078B (zh) | 一种基于多特征回归式集成学习的人群密度估计方法 | |
CN113378659A (zh) | 一种占道经营识别方法 | |
KR101874968B1 (ko) | 이미지 정보 기반의 시정거리 측정 시스템 및 이를 이용한 시정거리 측정 방법 | |
CN113435452A (zh) | 一种基于改进ctpn算法的电气设备铭牌文本检测方法 | |
CN110348307B (zh) | 一种起重机金属结构攀爬机器人的路径边缘识别方法及*** | |
CN110516524A (zh) | 一种交通场景中基于Mask R-CNN的车辆轴数识别方法 | |
CN112528885A (zh) | 一种智能划区的站台工作人员的识别方法 | |
Zong et al. | Traffic light detection based on multi-feature segmentation and online selecting scheme |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |