CN111723673A

CN111723673A - 一种基于计算机视觉的智能高铁人数统计方法

Info

Publication number: CN111723673A
Application number: CN202010450189.XA
Authority: CN
Inventors: 钱学明; 刘彪; 侯兴松; 邹屹洋
Original assignee: Xian Jiaotong University
Current assignee: Xian Jiaotong University
Priority date: 2020-05-25
Filing date: 2020-05-25
Publication date: 2020-09-29

Abstract

本发明公开一种基于计算机视觉的智能高铁人数统计方法，包括：步骤1、从高铁上下车门处采集乘客上下车的视频，获得数据集；步骤2、对数据集的图片进行标注，获得标注的数据集；步骤3、对标注的数据集中的图片进行筛选，增广，获得标注的人头数据；步骤4、构建神经网络并进行训练，获得训练好的神经网络；步骤5、获取乘客上下车的视频，输入步骤4获得训练好的神经网络；对神经网络检测到有人头的图像进行人头跟踪；根据人头数统计人数，整个输入乘客上下车的视频处理完成后，输出整个视频中的人数。本发明可以有效的对高铁中的人数进行统计，进而分析高铁的运营情况，从而更快的推动高铁的发展。

Description

一种基于计算机视觉的智能高铁人数统计方法

技术领域

本发明属于计算机数字图像处理与模式识别技术领域，涉及一种基于计算机视觉的智能高铁人数统计方法。

背景技术

高铁全程是高速列车、又称高速火车，是指能够在高速铁路线上以较高速度行驶的列车，通常时速可以达到330km，由于其头部设计多设计成流线型来减少行驶时和空气产生的阻力，大家也习惯的称其为子弹头列车。高铁以其速度快、安全、舒适等特点成为了大家出行的便利交通工具，使得以前遥不可及的距离，现在可以很短的时间到达，使得“我在长江头，君在长江尾”的距离也不那么遥远。高铁的出先是多种科学领域、多种高等科学技术、各方面高等技术人才的集中体现，高铁上有数以万计的技术难点，需要各个领域的人才集中攻关，才有了最后成型的高铁，是第三次工业革命的代表做之一。

高铁的出行意义重大，但是如何有效出统计出高铁中的人数却成了一个难题，如果可以对高铁人数进行有效、实时的统计，那对高铁站的建设，高铁发行的数量，高铁的管理都是十分有利的，但是现在除了后台计算没有很好的办法，后台计算需要统计各大购票网站，花费的人力物力成本很大，如何有效、方便的统计出高铁的人数变成了迫切需要解决的问题。

现有虽然也有一些通过摄像头统计人数的方法，但是在人流密度比较大的时候，经常出现重复统计的问题，给高铁管理带来了极大的不便。

发明内容

本发明的目的在于提供一种智能的高铁人数统计方法及***，获取乘客上下高铁的视频，对视频中的人头进行检测，对检测到的人头进行跟踪，以解决现有技术的不足。

为了实现上述目的，本发明采用如下技术方案：

一种基于计算机视觉的智能高铁人数统计方法，其特征在于，包括以下步骤：

步骤1、从高铁上下车门处采集乘客上下车的视频，进行预处理，获得数据集；

步骤2、对步骤1中数据集的图片进行标注，获得标注的数据集；

步骤3、对标注的数据集中的图片进行筛选，筛选出合格的图片；同时对筛选出的合格图片增广，获得标注的人头数据；

步骤4、构建神经网络，使用步骤3获得的标注的人头数据对神经网络进行训练，获得训练好的神经网络；

步骤5、网络输入数据处理：在高铁上下车门处安装猫眼摄像头，获取乘客上下车的视频，输入步骤4获得训练好的神经网络；对神经网络检测到有人头的图像进行人头跟踪；根据人头数统计人数，整个输入乘客上下车的视频处理完成后，输出整个视频中的人数。

进一步的，步骤1具体包括：在乘客上下车车门处安装猫眼摄像头，获取乘客上下车的视频，并对视频进行筛选，选出有乘客的视频；从有乘客的视频中每N帧选取一帧获得训练图片，所有训练图片组成数据集；N≥1。

进一步的，步骤2具体包括：用LabelImage标注工具对步骤1中数据集的图片进行标注；获得标注的数据集；标注格式为POCAL VOC。

进一步的，步骤3对合格图片通过旋转、裁剪、曝光中一种或者多种方式进行增广。

进一步的，神经网络为YOLOv3、SSD、Fast-Rcnn,Faster-Rcnn或Retinanet。

进一步的，步骤4中采用Retinanet神经网络；对Retinanet神经网络的backbone进行剪枝，对head部分轻量化，然后采用采用步骤3处理后的数据集进行训练，训练结束后，选择精度最好的一组模型进行保存，获得训练好的神经网络。

进一步的，进一步的，步骤4中神经网络用focal loss作为损失函数：

Focal loss操作过程：

其中y为真实值，y′为预测值。

进一步的，步骤5)中人头跟踪采用欧式距离法，欧式距离操作方法：

其中为x₂，y₂当前帧的位置坐标，x₁，y₁为上一帧的位置坐标。

对检测到的人头根据两帧之间人头的欧氏距离小于100像素点为同一个人头，以此来达到对人头的跟踪。

进一步的，步骤5)中对获取乘客上下车的视频进行预处理：对于尺寸小于300*256的图像为不合格图像，不合格图像直接进行筛除；大于300*256的图像为筛选合格的图像，输入到到步骤4训练好的神经网络进行人头检测；对筛选合格的图像，经过人头检测，判定为人头的阈值≥0.8(检测结果的阈值≥0.8，阈值越高检测结果越准，总值为1)为人头样本进行人头跟踪，小于0.8的直接筛去。

相对于现有技术，本发明具有以下有益效果：本发明是一种基于计算机视觉的智能高铁人数统计方法，对高铁上下车门处获取乘客上下车的视频，把视频处理成图像，人工标准成人头学习样本集；基于样本训练集生成深度学习网络人头检测器；对检测到的人头进行跟踪，如果在规定阈值内就匹配成一个人头；最后根据人头替代人数，统计出高铁中人数。本发明能有效的对高铁中人数进行统计，可以大大减少传统高铁人数统计的财力、物力。

附图说明

图1是本发明实施例的基于计算机视觉的智能高铁人数统计方法的流程图；

图2是用于深度神经网络训练的样本集；其中，图2(a)为人头样本集，图2(b)表示图片及其同名标注文件；

图3是人头检检测截取效果图；

图4(a)和图4(b)是相邻两帧图片人数统计的结果图。

具体实施方式

下面结合附图和实施例，对本发明的具体实施方式作进一步详细描述。以下实施列用于说明本发明，但不用来限制本发明的范围。

请参阅图1所述，本发明一种基于计算机视觉的智能高铁人数统计方法，包括如下步骤：

步骤1：从高铁上下车门处采集乘客上下车的视频，把视频按标准裁剪成图像；

在乘客上下车车门处安装猫眼摄像头，用来获取乘客上下车的视频，并对视频进行筛选，选出有乘客的视频。从有乘客的视频中每10帧选取一帧获得训练图片，所有训练图片组成数据集，从而避免掉特征冗余的情况。

步骤2：标注数据集；

用LabelImage标注工具对步骤1中数据集的图片进行标注；获得标注的数据集，标注的数据集包括用于网络训练的训练集、用于网络测试的测试集以及用于网络验证的验证集。标注格式为POCAL VOC各种属性的人头数据集共9000张，图像大小为：2048*1536，按照8:2:1的情况，把数据分为训练集，验证集，测试集，其中训练集用于神经网络训练，测试集用于神经网络测试，验证集用于神经网络验证，把数据集标注成POCAL VOC方便计算机读取，加快网络的训练，图2为标注的数据集。

步骤3：数据处理；

由于标注的数据存在标注不合格问题，对标注的数据进行重新筛选，去除标注不合格的数据(人工去除，或者通过设定阈值片定人头与标注框不匹配的图片删除)；同时对剩余合格的图像数据进行旋转，裁剪，曝光手段，对数据进行增广，提升网络的鲁棒性。

步骤4：选取合适的神经网络对人头进行检测；

现在主流的目标检测网络很多，可用的网络有YOLOv3,SSD，Fast-Rcnn,Faster-Rcnn,Retinanet，这些网络中有些网络偏向于速度，有些网络偏向于精度，在高铁人数统计中，速度和精度都有着很高的要求，经过速度和精度的权衡，Retinanet可以满足精度的要求，但是网络速度不够，经过对网络的backbone进行剪枝和对head部分轻量化(对Resnet-50特征提取网络中的通道数减少为三分之一，选取FPN中的F4、F5层做为特征层，对head部分采用2层3*3*64的卷积层做为分类和回归网络，通过大量实验，验证了对数据集响应最好的通道数和卷积层数)，最终达到了速度的要求，采用步骤3处理后的数据集经过1000个epoch训练，选择精度最好的一组模型进行保存，获得训练好的神经网络。

步骤5：网络输入数据处理；

在高铁上下车门处安装猫眼摄像头，获取乘客上下车的视频；对输入的视频(图像)进行处理，对于尺寸小于300*256的图像为不合格图像，不合格图像直接进行筛除。大于300*256的图像进入到步骤4训练好的神经网络中；对筛选合格的图像，经过神经网络，判定为人头的阈值≥0.8为人头样本进行人头跟踪，小于0.8的直接筛去。

采用步骤4训练好的神经网络检测人头；想要达到计数的目的就需要对检测到的人头进行跟踪，现在主流的***有深度神经网络的方法，光流法。由于人头特征过于相似，深度神经网络的办法的跟踪效果很不理想；光流法对光照要求很高，由于高铁不可能一直保持同样的光照所以光流法的效果也很不理想；经过试验采用欧式距离法无论速度和精度都十分的理想，最终选取欧氏距离法作为跟踪的方法。

欧式距离操作方法：

根据人头来代替人数，从而达到人头统计的目的；

整个输入乘客上下车的视频处理完成后，输出整个视频(图像)中的人数。

本发明跳出了传统的高铁人数统计方法，通过安装一个摄像头获取到乘客上下车的视频就可以统计出高铁中的人数，提出了一种新的解决方案。可以快速有效的统计出高铁中的人数，大大节约了高铁人数统计的财力物力。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明技术原理的前提下，还可以提出若干改进和变型，这些改进和变型也应视为本发明的保护范围。

Claims

1.一种基于计算机视觉的智能高铁人数统计方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于计算机视觉的智能高铁人数统计方法，其特征在于，步骤1具体包括：在乘客上下车车门处安装猫眼摄像头，获取乘客上下车的视频，并对视频进行筛选，选出有乘客的视频；从有乘客的视频中每N帧选取一帧获得训练图片，所有训练图片组成数据集；N≥1。

3.根据权利要求1所述的一种基于计算机视觉的智能高铁人数统计方法，其特征在于，步骤2具体包括：用LabelImage标注工具对步骤1中数据集的图片进行标注；获得标注的数据集；标注格式为POCAL VOC。

4.根据权利要求1所述的一种基于计算机视觉的智能高铁人数统计方法，其特征在于，步骤3对合格图片通过旋转、裁剪、曝光中一种或者多种方式进行增广。

5.根据权利要求1所述的一种基于计算机视觉的智能高铁人数统计方法，其特征在于，神经网络为YOLOv3、SSD、Fast-Rcnn,Faster-Rcnn或Retinanet。

6.根据权利要求1所述的一种基于计算机视觉的智能高铁人数统计方法，其特征在于，步骤4中采用Retinanet神经网络；对Retinanet神经网络的backbone进行剪枝，对head部分轻量化，然后采用采用步骤3处理后的数据集进行训练，训练结束后，选择精度最好的一组模型进行保存，获得训练好的神经网络。

7.根据权利要求1所述的一种基于计算机视觉的智能高铁人数统计方法，其特征在于，进一步的，步骤4中神经网络用focal loss作为损失函数：

Focal loss操作过程：

其中y为真实值，y′为预测值。

8.根据权利要求1所述的一种基于计算机视觉的智能高铁人数统计方法，其特征在于，步骤5)中人头跟踪采用欧式距离法，欧式距离操作方法：

其中为x₂，y₂当前帧的位置坐标，x₁，y₁为上一帧的位置坐标；

9.根据权利要求1所述的一种基于计算机视觉的智能高铁人数统计方法，其特征在于，步骤5)中对获取乘客上下车的视频进行预处理：对于尺寸小于300*256的图像为不合格图像，不合格图像直接进行筛除；大于300*256的图像为筛选合格的图像，输入到到步骤4训练好的神经网络进行人头检测；对筛选合格的图像，经过人头检测，判定为人头的阈值≥0.8为人头样本进行人头跟踪，小于0.8的直接筛去。