CN113536849A

CN113536849A - 一种基于图像识别的人群聚集识别方法及装置

Info

Publication number: CN113536849A
Application number: CN202010310270.8A
Authority: CN
Inventors: 华绘
Original assignee: Anhui Xiaomi Information Technology Co ltd
Current assignee: Anhui Xiaomi Information Technology Co ltd
Priority date: 2020-04-20
Filing date: 2020-04-20
Publication date: 2021-10-22

Abstract

本发明公开了一种基于图像识别的人群聚集识别方法及装置，属于图像识别领域。针对现有技术中常用的人群聚集识别算法存在对拍摄装置的安装位置要求较高，在某些场景下无法适用等问题，本发明提供一种基于图像识别的人群聚集识别方法及装置，该方法包括：获取待识别图片，对待识别图片进行人体识别，得到人体边框数据；对人体边框数据进行筛选，得到符合筛选条件的人体边框数据；根据筛选后的人体边框数据计算人体重心点像素坐标和身高像素估算值；对人体重心点像素坐标进行第一人群聚集识别，得到疑似人群聚集分组；对疑似人群聚集分组进行第二人群聚集识别，判断是否发生人群聚集。本发明可以实现对平视图像进行人群聚集识别与判断。

Description

一种基于图像识别的人群聚集识别方法及装置

技术领域

本发明涉及图像识别领域，更具体的说，涉及一种基于图像识别的人群聚集识别方法及装置。

背景技术

目前无人车巡检在园区安防方面发挥着越来越重要的作用，无人车中也需要集成一些计算机视觉技术，如人群聚集识别算法，当无人车发现有人群聚集的时候，可以进行自动语音提示，和通知相关人员进行处理。

由于现有的大部分人群聚集识别算法主要针对俯视图像进行的识别与优化，此类算法要求拍摄装置需要从俯视角度进行拍摄，而当拍摄图像的视角不佳时，而无人车拍摄的图像角度接***视，人物被遮挡的概率较高，此时常用的人群聚集识别算法的识别准确率可能会降低。

中国专利申请，申请号CN201910182241.5，公开日2019年7月5日，公开了一种自适应人群分群检测方法，在高斯混合模型的背景去除法得到的前景区域提取KLT特征点，通过分析特征点的运动特性，把特征点间的距离和加速度方向分别作为分层聚类的输入，遍历所有前景中的特征点，实现分群检测。然后通过分析分层结果中的聚类中心所受到的社会力进而得到聚类中心间合力方向的角度来判断是否需要合并聚类中心。该发明能够对公共场所下无序运动密集场景实现无监督地自动地进行人群分群。其不足之处在于，该发明使用人群特征点的运动状态估计人群的运动状态来避免密集人群中严重的遮挡问题，主要针对运动场景，在处理平视图像时提取特征点的效果不佳，且不能对单个静止图像进行识别判断。

发明内容

1.要解决的技术问题

针对现有技术中常用的人群聚集识别算法存在对拍摄装置的安装位置要求较高，在某些场景下无法适用等问题，本发明提供一种基于图像识别的人群聚集识别方法及装置，它可以实现对平视图像进行人群聚集识别与判断。

2.技术方案

本发明的目的通过以下技术方案实现。

一种基于图像识别的人群聚集识别方法，包括：

获取待识别图片，对待识别图片进行人体识别，得到人体边框数据；

对人体边框数据进行筛选，得到符合筛选条件的人体边框数据；

根据筛选后的人体边框数据计算人体重心点像素坐标和身高像素估算值；

对人体重心点像素坐标进行第一人群聚集识别，得到疑似人群聚集分组；

对疑似人群聚集分组进行第二人群聚集识别，判断是否发生人群聚集。

进一步的，人体边框数据包括边框像素坐标和边框概率值，符合筛选条件的人体边框数据，包括：

判断人体边框数据的边框概率值是否小于第一预设阈值，若小于，则丢弃该人体边框数据，否则保留该人体边框数据；

判断保留的人体边框数据的数量是否大于第二预设阈值，若大于，则判定符合筛选条件。

更进一步的，计算图片中识别人物的人体重心点像素坐标和身高像素估算值，包括：

根据人体边框数据，获取人体重心点像素坐标和人体关键点数据，人体关键点数据包括关键点名称、关键点像素坐标和关键点概率值；

设定人体关键点身高比，人体关键点身高比包括部位名称和占身高比；

筛选出关键点概率值大于第一预设阈值的人体关键点；

根据人体关键点身高比的部位名称，选取对应的人体关键点进行组合，计算人体关键点组合的概率值；

选取概率值最大的人体关键点组合，根据人体关键点组合中关键点像素坐标的欧式距离，计算出人体关键点组合的像素距离；

根据人体关键点身高比和人体关键点组合的像素距离，计算出人体身高像素估算值。

更进一步的，人体重心点像素坐标包括横坐标和纵坐标，对人体重心点像素坐标进行第一人群聚集识别，判断识别结果是否符合第一识别条件，包括：

将人体重心点像素横坐标与纵坐标组合成数组，对数组进行数据标准化；

对标准化后的数据进行第一密度聚类，得到若干个分组；

对若干个分组进行筛选，判断分组中的数据是否大于第三预设阈值，若大于，则判定该分组为疑似人群聚集分组。

更进一步的，对疑似人群聚集分组进行第二人群聚集识别，判断是否发生人群聚集，包括：

将疑似人群聚集分组中的人体重心点横坐标、纵坐标及其人体身高像素估算值组合成数组，对数据进行数据标准化；

对标准化后的数据进行第二密度聚类，得到若干个分组；

判断第二密度聚类得到分组的数据是否大于第四预设阈值，若大于，则判定发生人群聚集，否则判定未发生人群聚集。

一种基于图像识别的人群聚集识别装置，用于执行上述人群聚集识别方法，包括：

人体识别单元，用于获取待识别图片，对待识别图片进行人体识别，得到人体边框数据；

人体边框筛选单元，用于对人体边框数据进行筛选，得到符合筛选条件的人体边框数据；

人体边框数据计算单元，用于根据筛选后的人体边框数据计算人体重心点像素坐标和身高像素估算值；

第一人群聚集识别单元，用于对人体关键点识别后的图片进行人群聚集识别，得到疑似人群聚集分组；

第二人群聚集识别单元，用于对疑似人群聚集分组进行第二人群聚集识别，判断是否发生人群聚集。

进一步的，人体边框筛选单元，包括：

第一判断模块，用于判断人体边框数据的边框概率值是否小于第一预设阈值，若小于，则丢弃该人体边框数据，否则保留该人体数据；

第二判断模块，用于判断保留的人体边框数据的数量是否大于第二预设阈值，若大于，则判定符合筛选条件。

更进一步的，人体边框数据计算单元，包括：

人体边框数据获取模块，用于根据人体边框数据，获取人体重心点像素坐标和人体关键点数据，人体关键点数据包括关键点名称、关键点像素坐标和关键点概率值；

身高比设定模块，用于设定人体关键点身高比，人体关键点身高比包括部位名称和占身高比；

关键点筛选模块，用于筛选出关键点概率值大于第一预设阈值的人体关键点；

组合概率值计算模块，用于根据人体关键点身高比的部位名称，选取对应的人体关键点进行组合，计算人体关键点组合的概率值；

像素距离计算模块，用于选取概率值最大的人体关键点组合，根据人体关键点组合中关键点像素坐标的欧式距离，计算出人体关键点组合的像素距离；

身高像素估算值计算模块，用于根据人体关键点身高比和人体关键点组合的像素距离，计算出人体身高像素估算值。

更进一步的，第一人群聚集识别单元，包括：

第一数据标准化模块，用于将人物的重心点横坐标与纵坐标组合成数组，对数组进行数据标准化；

第一密度聚类模块，用于对标准化后的数据进行第一密度聚类，得到若干个分组；

第三判断模块，用于对若干个分组进行筛选，判断分组中的数据是否大于第三预设阈值，若大于，则判定该分组为疑似人群聚集分组。

更进一步的，第二人群聚集识别单元，包括：

第二数据标准化模块，用于将疑似人群聚集分组中的人体重心点横坐标、纵坐标及其人体身高像素估算值组合成数组，对数据进行数据标准化；

第二密度聚类模块，用于对标准化后的数据进行第二密度聚类，得到若干个分组；

第二判断模块，用于判断第二密度聚类得到分组的数据是否大于第四预设阈值，若大于，则判定发生人群聚集，否则判定未发生人群聚集。

3.有益效果

相比于现有技术，本发明的优点在于：

通过对待识别图片进行人体关键点识别，过滤掉图片中的噪声点；计算图片中人物的重心点坐标和人体身高像素估算值，为后续的两次人群聚集识别提供数据基础；设定人体关键点身高比，无需识别到完整人体，通过人体的部分关键点即可计算出人体身高像素估算值，从而计算人群之间的距离，解决了平视图像的人体遮挡问题；对图片进行第一人群聚集识别，对图片中的人物进行密度聚类，识别出图片中人物之间的横向距离较小的人群；对第一人群聚集识别的结果进行第二人群聚集识别，通过人物人体身高像素估算值进行密度聚类，排除了第一人群聚集识别出的人群中纵深距离较大的人物，实现了对平视图像的人群聚集识别。

附图说明

图1为一个实施例中通道安全检测方法的应用场景示意图；

图2为一个实施例中待识别图片的示意图；

图3为一个实施例中通道安全检测方法的流程示意图

图4为一个实施例中待识别图片的识别结果示意图；

图5为一个实施例中人体边框筛选步骤的流程示意图；

图6为一个实施例中人体边框数据计算步骤的流程示意图；

图7为一个实施例中第一人群聚集识别步骤的流程示意图；

图8为一个实施例中第一密度聚类的结果示意图；

图9为一个实施例中第一密度聚类的结果示意图；

图10为一个实施例中第二人群聚集识别步骤的流程示意图；

图11为一个实施例中人群聚集识别装置的结构框图；

图12为一个实施例中人体边框筛选单元的结构框图；

图13为一个实施例中人体边框数据计算单元的结构框图；

图14为一个实施例中第一人群聚集识别单元的结构框图；

图15为一个实施例中第二人群聚集识别单元的结构框图；

具体实施方式

下面结合说明书附图和具体的实施例，对本发明作详细描述。

如图1所示，本实施例提供了一种基于图像识别的人群聚集识别方法，应用于一种基于图像识别的人群聚集识别***，该***包括终端101和服务器102，终端101和服务器102通过网络连接，终端101可以是具有拍摄功能的设备，如无人车摄像头、电脑、手机等设备，服务器102可以是独立的服务器，也可以是多个服务器组成的服务器集群。终端101可通过网络将数据发送至服务器102上，所述数据可以是图片或者视频流，如果服务器获取的数据为视频流，首先对获取到的视频流进行拆分，本实施例可设定为每秒抓取一次，即每秒获取一张图片，拆分得到若干帧图片；如果服务器获取的数据为图片，则无需进行上述拆分处理，最终得到如图2所示的待识别图片。

如图3所示，本实施例主要以该人群聚集识别方法应用于上述图1中的终端101和服务器102来举例说明，本方法具体包括以下步骤：

步骤S100、获取待识别图片，对待识别图片进行人体识别，得到人体边框数据。

所述的人体关键点识别通过建立人体关键点检测模型来实现，本实施例的人体关键点检测模型使用已经训练完成的OpenPose模型，OpenPose是基于卷积神经网络和监督学习开发的人体姿态识别模型，接受的输入可以是图片、视频等，可以实现人体动作、面部表情、手指运动等姿态估计，检测图片或视频流中一个或多个人体的关键点像素坐标与关键点概率值，对被遮挡的人体也有一定的识别准确率，具有良好的鲁棒性。如图4所示，本实施例的待识别图片中有若干个人物，通过OpenPose模型可以识别出对应的若干个人体边框数据。

步骤S200、对人体边框数据进行筛选，得到符合筛选条件的人体边框数据。

具体的，所述人体边框数据包括边框像素坐标和边框概率值，所述边框像素坐标为边框四个顶点的像素坐标，边框概率值代表人体边框的置信度，图片中的人体越清晰，模型得出的边框概率值越高，所述符合筛选条件的边框数据为同时符合第一预设阈值和第二预设阈值的边框数据。如图5所示，所述对人体边框数据进行筛选，得到符合筛选条件的人体边框数据，具体包括以下步骤：

步骤S201、判断人体边框数据的边框概率值是否小于第一预设阈值，若小于，则丢弃该人体边框数据，否则保留该人体边框数据。

具体的，第一预设阈值用于对人体识别得到的人体边框数据或人体关键点数据进行初步过滤，如果人体边框数据或人体关键点数据的边框概率值较低，那么将该人体边框的数据或人体关键点数据作为识别数据会影响后续人群聚集识别算法的准确率，因此需要将此类数据剔除，从而提高算法准确率，同时降低数据冗余度，减少算法所需算力。

第一预设阈值可以根据图片的清晰度来设置，例如，若图片清晰度较低，可调低第一预设阈值的数值，防止模型识别图片的人体概率值偏低，导致识别到有效的人体边框被错误丢弃，若图片清晰度较高，可调高第一预设阈值的数值，从而过滤掉无效的边框，提高识别速度和效率。本实施例中，第一预设阈值设置为根据本实施例提供的图片清晰度优选设置为0.4。

步骤S202、判断保留的人体边框数据的数量是否大于第二预设阈值，若大于，则判定符合筛选条件。

具体的，第二预设阈值用于对图片进行简单的人群聚集识别判断，如果保留的人体边框数据的数量是否大于第二预设阈值，说明该图片场景中人物数量达到了可能发生人群聚集的最低人数，需要进行下一步识别，如果小于则表示人物数量在安全的范围内，不需要对该图片进行下一步识别，减少了算法所需算力，提高了识别速度。

第二预设阈值可以根据图片的具体场景来设置，例如，若图片场景为小型密闭空间，空间可容纳的人数较少，可调低第二预设阈值的数值，若图片场景为大型开放空间，空间可容纳的人数较多，可调高第一预设阈值的数值，第二预设阈值根据图片的具体场景设置，防止数值被设置过大或过小导致影响人群聚集识别的准确率。本实施例中，第二预设阈值根据本实施例提供的图片场景优选设置为5。

步骤S300、根据筛选后的人体边框数据计算人体重心点像素坐标和身高像素估算值。

如图6所示，所述根据筛选后的人体边框数据计算人体重心点像素坐标和身高像素估算值，具体包括以下步骤：

步骤S301、根据人体边框数据，获取人体重心点像素坐标和人体关键点数据。

具体的，所述人体关键点数据包括关键点名称、关键点像素坐标和关键点概率值，所述关键点名称为关键点所对应的关节名称，关键点像素坐标为关键点在图片中的像素坐标，像素坐标包括横坐标与纵坐标，关键点概率值表示关键点的置信度，图片中的人体关节越清晰，模型得出的关键点概率值越高。本实施例中，使用OpenCv中的cv2.moments得到人体边框数据的中心距，根据中心距中的参数计算出人体边框的重心坐标，本实施例中的人体关键点包括鼻、双眼、双耳、左右肩关节、左右肘关节、左右腕关节、左右髋关节、左右膝关节和左右脚踝关节共17个关键点，本实施例的人体重心点像素坐标和人体关键点数据如表1、表2和表3所示,其中x₁、x₂、y₁、y₂分别为两个关键点的横纵坐标，p为关键点概率值：

表1

表2

表3

步骤S302、设定人体关键点身高比，所述人体关键点身高比包括部位名称和占身高比。

具体的，所述人体关键点身高比参考现有的人体各部位尺寸与身高比例值设定，所述部位名称为两个关节之间的部位名称，本实施例中，如肩距为左肩到右肩之间的部位，膝-脚踝为膝与踝之间的部位，髋-膝为髋与膝之间的部位，所述身高占比为该部位占人体身高的比值，本实施例的人体关键点身高比如表4所示：

表4

关节	占比
		肩距	0.22
膝-脚踝	0.25
		髋-膝	0.3

步骤S303、筛选出关键点概率值大于第一预设阈值的人体关键点。

具体的，所述的第一预设阈值为步骤S201中所述的第一预设阈值相同，由于下一步需要对关键点概率值进行两两组合，如果组合中的两个关键点概率值之和较大，但两个关键点概率值差异也较大的话，该关键点组合会被错误的选取为最优组合进行识别，但是其准确率较低，因此过滤掉关键点概率值大于第一预设阈值的人体关键点可以提高识别算法的准确率和鲁棒性。

步骤S304、根据人体关键点身高比的部位名称，选取对应的人体关键点进行组合，计算人体关键点组合的概率值。

具体的，本实施例在选取对应的人体关键点进行两两组合时，需要结合步骤S302中所述的人体关键点身高比的部位名称，肩距为左键和右肩两个关键点的组合，膝-脚踝是将左膝与左踝组合，右膝与右踝组合，其他部位同理，将两个关键点组合后，计算两者概率值之和，根据关键点组合概率值之和最大选取对应的部位，选取结果如表5所示：

表5

步骤S305、选取概率值最大的人体关键点组合，根据人体关键点组合中关键点像素坐标的欧式距离，计算出人体关键点组合的像素距离。

具体的，本实施例中所述的欧氏距离就是组合中两个关键点像素坐标点之间的距离ρ，

步骤S306、根据人体关键点身高比和人体关键点组合的像素距离，计算出人体身高像素估算值。

具体的，所述人体身高像素估算值＝像素距离/身高占比，所述身高占比为该关键点组合名称在人体关键点身高比中对应的身高占比。

步骤S400、对人体重心点像素坐标进行第一人群聚集识别，得到疑似人群聚集分组。

如图7所示，所述对人体重心点像素坐标进行第一人群聚集识别，得到疑似人群聚集分组，具体包括以下步骤：

S401、将人体重心点像素横坐标与纵坐标组合成数组，对数组进行数据标准化。

具体的，本实施例中，使用对Z-Score方法对人物重心点横坐标和纵坐标组成的数组进行数据标准化，Z-Score标准化是数据处理的一种常用方法，通过它能够将不同量级的数据转化为统一量度的Z-Score分值进行比较，如果数据不进行标准化处理，密度聚类的效果就会受到一组数据中不同变量及其单位的影响，因此通过标准化方法将数据转化为无单位的Z-Score分值，使得数据标准统一化，提高了数据可比性，使后续的密度聚类的稳定性更强，本实施例的标准化结果如表6所示，其中x_z、y_z分别为标准化后的重心点横坐标与纵坐标：

表6

步骤402、对标准化后的数据进行第一密度聚类，得到若干个分组。

具体的，本实施例中，使用DBSCAN密度聚类方法对标准化后的数据进行第一密度聚类，聚类的目的就是把不同的人体关键点数据点按照它们的相似与相异度分割成不同的簇，得到的簇为数据划分后的子集，所得到的若干个簇即为上述的若干个分组，聚类确保每个簇中的数据都是尽可能相似，而不同的簇里的数据尽可能的相异，而相比其他的聚类方法，基于密度的聚类方法可以在有噪音的数据中发现各种形状和各种大小的簇。本实施例中，设置第一密度聚类的距离参数为0.5，密度聚类结果如图8和图9所示，，其中人物编号8、9、10被判定为离群点，离群点被标记为-1，其他的点聚类成一个簇，标记为0。

步骤403、对若干个分组进行筛选，判断分组中的数据是否大于第三预设阈值，若大于，则判定该分组为疑似人群聚集分组。

具体的，所述分组中的数据为第一密度聚类得到的簇中的散点个数，要求簇中散点的个数要大于第三预设阈值，所述第三预设阈值与第二预设阈值类似，可以根据图片的具体场景或实际要求来设置，如果对人群聚集限制比较严格时，可调低第三预设阈值，如果对人群聚集限制比较宽松，可调高第三预设阈值，当簇中散点的个数大于第三预设阈值时，说明该簇有可能发生人群聚集，本实施例中，设置第三预设阈值为5，即要求簇中散点数量>＝5，排除离群点或人物数量不符的簇，得到筛选后的簇。密度聚类得到的簇中的散点为图片中人体重心点像素坐标，如果人体重心点像素坐标被判定为离群点，说明该人物距离其他人物较远，可以排除，如果人体重心点像素坐标所在的簇被判定为数量不符的簇，说明该簇中的人物数量不足以构成人群聚集，同样可以排除。通过对第一密度聚类得到的结果进行筛选，过滤掉部分无效数据，减小数据冗余度，提高后续人群聚集识别的速度。

步骤S500、对疑似人群聚集分组进行第二人群聚集识别，判断是否发生人群聚集。

如图10所示，所述对疑似人群聚集分组进行第二人群聚集识别，判断是否发生人群聚集，具体包括以下步骤：

步骤S501、将疑似人群聚集分组中的人体重心点横坐标、纵坐标及其身高像素估算值组合成数组，对数据进行数据标准化。

具体的，本实施例中，使用对Z-Score方法对人物重心点横坐标、纵坐标及其身高像素估算值组成的数组进行数据标准化。

步骤S502、对标准化后的数据进行第二密度聚类，得到若干个分组。

具体的，本实施例中，使用DBSCAN密度聚类方法对标准化后的数据进行第二密度聚类，设置第二密度聚类的距离参数为2.1，得到的聚类结果如表7所示，人物编号0和1被识别为离群点，说明人物0和1虽然与其他人物的横向距离很小，但是实际的纵深距离很大，与其他人物不构成人群聚集，而人物编号2-7被聚类为同一个簇，标记为0，第二密度聚类的结果为一个分组，分组中有6个人物：

表7

步骤S503、判断第二密度聚类得到分组中的数据是否大于第四预设阈值，若大于，则判定发生人群聚集，否则判定未发生人群聚集。

具体的，由于本发明的人群聚集识别算法主要针对平视图像进行识别，而平视图像可以直观地看出人物之间的横向距离，对于人物之间的纵深距离很难判断，当人物之间的横向距离很小，而纵深距离很大时，实际并未发生人群聚集，但是第一密度聚类会将这些人物聚类到同一个簇中，这样的聚类结果是识别算法所不愿看到的，因此，为了消除第一密度聚类得到的簇中各人物之间纵深距离的影响，避免将实际相聚较远的人体关键点识别为聚集人群，需要结合身高像素估算值，对数据进行第二密度聚类。

所述第二密度聚类得到分组中的数据为第二密度聚类得到的簇中的散点个数，要求簇中散点的个数要大于第四预设阈值，所述第四预设阈值与第三预设阈值类似，可以根据图片的具体场景或实际要求来设置，如果对人群聚集限制比较严格时，可调低第四预设阈值，如果对人群聚集限制比较宽松，可调高第四预设阈值，当簇中散点的个数大于第四预设阈值时，说明该簇发生了人群聚集事件，如果所有的簇都不大于第四预设阈值，则识别该图片中未发生人群聚集事件，本实施例中的第四预设阈值优选设定为5，由表5得出分组中的人数为6，因此该图片发生了人群聚集事件。

需要说明的是，实施例中所述的第一预设阈值、第二预设阈值、第三预设阈值及第四预设阈值通常是根据一系列经验数据确定的一个值，既可以是人为设定的，也可以是设备自动生成的，此处不作限定。

与上述几种实施例提供的通道安全检测方法相对应，本发明实施例还提供一种基于图像识别的人群聚集识别装置，由于本发明实施例提供的人群聚集识别装置与上述实施例提供的人群聚集识别方法相对应，因此上述人群聚集识别方法的实施方式也适用于本实施例提供人群聚集识别装置，在本实施例中不再详细描述。

如图11所示，一种基于图像识别的人群聚集识别装置，包括：

人体识别单元1010，用于获取待识别图片，对待识别图片进行人体识别，得到人体边框数据；

人体边框筛选单元1020，用于对人体边框数据进行筛选，得到符合筛选条件的人体边框数据；

人体边框数据计算单元1030，用于根据筛选后的人体边框数据计算人体重心点像素坐标和身高像素估算值；

第一人群聚集识别单元1040，用于对人体关键点识别后的图片进行人群聚集识别，得到疑似人群聚集分组；

第二人群聚集识别单元1050，用于对疑似人群聚集分组进行第二人群聚集识别，判断是否发生人群聚集。

如图12所示，人体边框筛选单元1020包括：

第一判断模块1021，用于判断人体边框数据的边框概率值是否小于第一预设阈值，若小于，则丢弃该人体边框数据，否则保留该人体数据；

第二判断模块1022，用于判断保留的人体边框数据的数量是否大于第二预设阈值，若大于，则判定符合筛选条件。

如图13所示，人体边框数据计算单元1030包括：

人体边框数据获取模块1031，用于根据人体边框数据，获取人体重心点像素坐标和人体关键点数据，所述人体关键点数据包括关键点名称、关键点像素坐标和关键点概率值；

身高比设定模块1032，用于设定人体关键点身高比，所述人体关键点身高比包括部位名称和占身高比；

关键点筛选模块1033，用于筛选出关键点概率值大于第一预设阈值的人体关键点；

组合概率值计算模块1034，用于根据人体关键点身高比的部位名称，选取对应的人体关键点进行组合，计算人体关键点组合的概率值；

像素距离计算模块1035，用于选取概率值最大的人体关键点组合，根据人体关键点组合中关键点像素坐标的欧式距离，计算出人体关键点组合的像素距离；

身高像素估算值计算模块1036，用于根据人体关键点身高比和人体关键点组合的像素距离，计算出人体身高像素估算值。

如图14所示，第一人群聚集识别单元1040包括：

第一数据标准化模块1041，用于将人物的重心点横坐标与纵坐标组合成数组，对数组进行数据标准化；

第一密度聚类模块1042，用于对标准化后的数据进行第一密度聚类，得到若干个分组；

第三判断模块1043，用于对若干个分组进行筛选，判断分组中的数据是否大于第三预设阈值，若大于，则判定该分组为疑似人群聚集分组。

如图15所示，第二人群聚集识别单元1050，包括：

第二数据标准化模块1051，用于将疑似人群聚集分组中的人体重心点横坐标、纵坐标及其人体身高像素估算值组合成数组，对数据进行数据标准化；

第二密度聚类模块1052，用于对标准化后的数据进行第二密度聚类，得到若干个分组；

第二判断模块1053，用于判断第二密度聚类得到分组的数据是否大于第四预设阈值，若大于，则判定发生人群聚集，否则判定未发生人群聚集。

需要说明的是，上述实施例提供的装置，在实现其功能时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random AccessMemory，RAM)等。

以上示意性地对本发明创造及其实施方式进行了描述，该描述没有限制性，在不背离本发明的精神或者基本特征的情况下，能够以其他的具体形式实现本发明。附图中所示的也只是本发明创造的实施方式之一，实际的结构并不局限于此，权利要求中的任何附图标记不应限制所涉及的权利要求。所以，如果本领域的普通技术人员受其启示，在不脱离本创造宗旨的情况下，不经创造性的设计出与该技术方案相似的结构方式及实施例，均应属于本专利的保护范围。此外，“包括”一词不排除其他元件或步骤，在元件前的“一个”一词不排除包括“多个”该元件。产品权利要求中陈述的多个元件也可以由一个元件通过软件或者硬件来实现。第一，第二等词语用来表示名称，而并不表示任何特定的顺序。

Claims

1.一种基于图像识别的人群聚集识别方法，其特征在于，包括：

2.根据权利要求1所述的一种基于图像识别的人群聚集识别方法，其特征在于，所述人体边框数据包括边框像素坐标和边框概率值，所述对人体边框数据进行筛选，得到符合筛选条件的人体边框数据，包括：

3.根据权利要求1所述的一种基于图像识别的人群聚集识别方法，其特征在于，所述根据筛选后的人体边框数据计算人体重心点像素坐标和身高像素估算值，包括：

根据人体边框数据，获取人体重心点像素坐标和人体关键点数据，所述人体关键点数据包括关键点名称、关键点像素坐标和关键点概率值，所述人体重心点像素坐标包括横坐标和纵坐标；

设定人体关键点身高比，所述人体关键点身高比包括部位名称和占身高比；

筛选出关键点概率值大于第一预设阈值的人体关键点；

4.根据权利要求1所述的一种基于图像识别的人群聚集识别方法，其特征在于，所述对人体重心点像素坐标进行第一人群聚集识别，得到疑似人群聚集分组，包括：

对标准化后的数据进行第一密度聚类，得到若干个分组；

5.根据权利要求1所述的一种基于图像识别的人群聚集识别方法，其特征在于，所述对疑似人群聚集分组进行第二人群聚集识别，判断是否发生人群聚集，包括：

对标准化后的数据进行第二密度聚类，得到若干个分组；

6.一种基于图像识别的人群聚集识别装置，其特征在于，用于执行如权利要求1-5中任意一项所述的人群聚集识别方法，包括：

7.根据权利要求6所述的一种基于图像识别的人群聚集识别装置，其特征在于，所述人体边框筛选单元，包括：

8.根据权利要求6所述的一种基于图像识别的人群聚集识别装置，其特征在于，所述人体边框数据计算单元，包括：

人体边框数据获取模块，用于根据人体边框数据，获取人体重心点像素坐标和人体关键点数据，所述人体关键点数据包括关键点名称、关键点像素坐标和关键点概率值；

身高比设定模块，用于设定人体关键点身高比，所述人体关键点身高比包括部位名称和占身高比；

9.根据权利要求6所述的一种基于图像识别的人群聚集识别装置，其特征在于，所述第一人群聚集识别单元，包括：

10.根据权利要求6所述的一种基于图像识别的人群聚集识别装置，其特征在于，所述第二人群聚集识别单元，包括：