CN109858461A - 一种密集人群计数的方法、装置、设备以及存储介质 - Google Patents
一种密集人群计数的方法、装置、设备以及存储介质 Download PDFInfo
- Publication number
- CN109858461A CN109858461A CN201910129612.3A CN201910129612A CN109858461A CN 109858461 A CN109858461 A CN 109858461A CN 201910129612 A CN201910129612 A CN 201910129612A CN 109858461 A CN109858461 A CN 109858461A
- Authority
- CN
- China
- Prior art keywords
- image
- neural networks
- convolutional neural
- convolutional layer
- tested
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000003860 storage Methods 0.000 title claims abstract description 15
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 126
- 238000012360 testing method Methods 0.000 claims abstract description 9
- 238000003475 lamination Methods 0.000 claims description 33
- 238000012549 training Methods 0.000 claims description 28
- 238000013528 artificial neural network Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 9
- 239000012141 concentrate Substances 0.000 claims description 8
- 230000006870 function Effects 0.000 claims description 8
- 238000010586 diagram Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 6
- 230000004913 activation Effects 0.000 claims description 3
- 238000003062 neural network model Methods 0.000 claims description 3
- 239000000284 extract Substances 0.000 description 8
- 230000001537 neural effect Effects 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000005034 decoration Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000004218 nerve net Anatomy 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种密集人群计数的方法、装置、设备及计算机可读存储介质,包括:将待测试图像输入包括多列平行的卷积神经网络的目标多尺度多列卷积神经网络模型中;每列卷积神经网络中包括多个卷积核大小和个数不同的卷积层。利用所述每列卷积神经网络中各个卷积层对待测试图像进行处理,并将所述每列卷积神经网络中预选卷积层输出的特征图进行融合,以便得到所述每列卷积神经网络输出的估计密度图;将所述每列卷积神经网络输出的估计密度图进行融合后,得到待测试图像的目标估计密度图;依据所述目标估计密度图,计算得到待测试图像中的人数。本发明所提供的方法、装置、设备及计算机可读存储介质,提高了密集人群图像预测结果的准确性。
Description
技术领域
本发明涉及计算机视觉技术领域,特别是涉及一种密集人群计数的方法、装置、设备以及计算机可读存储介质。
背景技术
为了人群控制和公众安全,准确地估计来自图像或视频的人群已经成为计算机视觉技术越来越重要的应用。计算机视觉中的人群计数任务是自动计算图像或视频中的人数。为了在诸如公众集会和体育赛事等许多场景中帮助控制人群和公共安全,需要准确的人群计数。
传统的密集人群计数方法包括两种:基于检测的方法和基于回归的方法。基于检测的方法将人群视为一组检测到的个体实体。但是,行人经常被密集的人群遮挡,这在静止图像中估计人群时尤其具有挑战性。基于回归的方法对从人群图像中提取的各种特征的标量值(如人数)或密度图进行回归。它们基本上有两个步骤:首先,从人群图像中提取有效特征;第二,利用各种回归函数来估计人群数量。但是,通过回归进行的人群计数容易受到视角和尺度的急剧变化的影响,而这种变化通常存在于人群图像中。
与此同时,深度学***行的卷积神经网络组成,每一列使用感受野大小不同的卷积核,分别对应尺度大小不一样的人头;每一列除了卷积核大小和数量,其他构成都相同;采用大小为2×2的最大池化和ReLU激活函数;最后将三列的特征图在通道数上串联起来,用一个1×1的卷积核将其映射到估计的密度图输出。然而多列卷积神经网络结构偏简单,层数较少,前面的卷积层提取到的一些特征在后续过程中可能被丢弃且提取到的特征不够而影响到最终的结果。
综上所述可以看出,如何提高密集人群图像预测结果的准确性是目前有待解决的问题。
发明内容
本发明的目的是提供一种密集人群计数的方法、装置、设备以及计算机可读存储介质,以解决现有技术中提供的密集人群计数的神经网络性能较差的问题。
为解决上述技术问题,本发明提供一种密集人群计数的方法,包括:将待测试图像输入至预先完成训练的目标多尺度多列卷积神经网络模型中;其中,所述目标多尺度多列卷积神经网络模型包括多列平行的卷积神经网络,每列卷积神经网络中包括多个卷积核大小和个数不同的卷积层;将所述待测试图像分别输入至所述每列卷积神经网络中,利用所述每列卷积神经网络中各个卷积层对所述待测试图像进行处理,并将所述每列卷积神经网络中预选卷积层输出的特征图进行融合,以便于分别得到所述每列卷积神经网络输出的估计密度图;将所述每列卷积神经网络输出的估计密度图进行融合后,得到所述待测试图像的目标估计密度图;依据所述待测试图像的目标估计密度图,计算得到所述待测试图像中的人数。
优选地,所述将待测试图像输入至预先完成训练的目标多尺度多列卷积神经网络模型中前包括:
利用高斯滤波器对预先创建的人群图像数据集进行滤波处理后,获取所述人群图像数据集中每幅图像的密度图,从而构建目标训练集;
采用所述目标训练集对多尺度多列卷积神经网络模型进行训练,得到完成训练后的目标多尺度多列卷积神经网络模型。
优选地,所述利用高斯滤波器对预先创建的人群图像数据集进行滤波处理后,获取所述人群图像数据集中每幅图像的密度图,从而构建目标训练集包括:
获取预先采集的人群图像数据集其中,Xi为所述人群图像数据集第i张图像,大小为m*n;Yi为所述第i张图像对应的人头坐标点图,大小为m*n,N为所述人群图像数据集中图像总数;
利用高斯滤波器对所述人群图像数据集中的每幅图像Xi进行滤波处理后,得到所述每幅图像Xi的密度图Mi,利用所述每幅图像Xi的密度图Mi构建目标训练集
优选地,所述采用所述目标训练集对多尺度多列卷积神经网络模型进行训练包括:
将所述目标训练集中的当前人群图像分别输入至所述多尺度多列卷积神经网络模型的每列卷积神经网络中;
其中,所述多尺度多列卷积神经网络模型中的每列卷积神经网络相互平行,所述每列卷积神经网络除卷积核大小和个数外,其他网络结构相同;
将所述每列卷积神经网络输出的所述当前人群图像的估计密度图在通道数上串联后,经过一个卷积核大小为1*1的总卷积层,并将所述总卷积层输出的特征图映射为所述当前人群图像的目标估计密度图,以便于将所述当前人群图像的目标估计密度图作为所述多尺度多列卷积神经网络模型的网络输出。
优选地,所述多尺度多列卷积神经网络模型的每列卷积神经网络包括:
第一卷积层、第二卷积层、第三卷积层、第四卷积层、第五卷积层、反卷积层、第六卷积层和第七卷积层;
其中,所述第一卷积层和其他卷积层的卷积核大小不同,所述第二卷积层、所述第三卷积层、所述第四卷积层、所述第五卷积层和所述第六卷积层的卷积核大小相同,所述第三卷积层、所述第四卷积层、所述第五卷积层和所述第六卷积层的卷积核的个数相同;
所述第一卷积层、所述第二卷积层、所述第三卷积层和所述第四个卷积层之间的池化层选用区域2*2,步长为2的最大池化;
所述第四卷积层和所述第五卷积层之间的池化层选用3*3区域,步长为1的最大池化,以便于保持所述第四卷积层输出特征图和对所述第四卷积层输出特征池化后的特征图大小不变;
所述各个卷积层的激活函数采用ReLU函数;
所述第四卷积层输出的特征图和所述第五卷积层输出的特征图在通道数上串联后输入所述反卷积层,所述反卷积层输出的特征图和所述第三卷积层输出的特征图在通道数上串联后输入所述第六卷积层,所述第八卷积层输出所述待测试图像的估计密度图作为所述每列卷积神经网络模型的输出结果。
优选地,所述依据所述待测试图像的目标估计密度图,计算得到所述待测试图像中的人数包括:
将所述待测试图像T输入至所述目标多尺度多列卷积神经网络模型,得到所述待测试图像T的估计密度图后,计算所述估计密度图中所有像素值的和,得到所述待测试图像中的人数
本发明还提供了一种密集人群计数的装置,包括:
输入模块,用于将待测试图像输入至预先完成训练的目标多尺度多列卷积神经网络模型中;其中,所述目标多尺度多列卷积神经网络模型包括多列平行的卷积神经网络,每列卷积神经网络中包括多个卷积核大小和个数不同的卷积层;
处理模块,用于将所述待测试图像分别输入至所述每列卷积神经网络中,利用所述每列卷积神经网络中各个卷积层对所述待测试图像进行处理,并将所述每列卷积神经网络中预选卷积层输出的特征图进行融合,以便于分别得到所述每列卷积神经网络输出的估计密度图;
输出模块,用于将所述每列卷积神经网络输出的估计密度图进行融合后,得到所述待测试图像的目标估计密度图;
计算模块,用于依据所述待测试图像的目标估计密度图,计算得到所述待测试图像中的人数。
优选地,所述输出模块前包括:
训练模块,用于利用高斯滤波器对预先创建的人群图像数据集进行滤波处理后,获取所述人群图像数据集中每幅图像的密度图,从而构建目标训练集;
采用所述目标训练集对多尺度多列卷积神经网络模型进行训练,得到完成训练后的目标多尺度多列卷积神经网络模型。
本发明还提供了一种密集人群计数的设备,包括:
存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现上述一种密集人群计数的方法的步骤。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述一种密集人群计数的方法的步骤。
本发明所提供的密集人群计数的方法,利用预先完成训练的目标多尺度多列卷积神经网络模型对待测试图像进行预测。所述目标多尺度多列卷积神经网络模型包括多列平行的卷积神经网络。将所述待测试图像输入所述目标多尺度多列卷积神经网络模型后,将所述待测试图像分别输入所述每列卷积神经网络中。所述每列卷积神经网络中包括多个卷积核大小和个数不同的卷积层,分别利用所述每列卷积神经网络中的不同卷积层对所述待测试图像进行计算,并将所述每列卷积神经网络中预选的卷积层输出的特征图进行融合,提取到所述待测试图像的不同尺度的特征;解决了现有技术中的卷积神经网络中前面卷积层提取到的一些特征在后续过程中可能被丢弃导致提取到的特征不够从而影响了对待测试图像预测结果的准确性的问题。本发明所提供的方法,引入了多尺度的思想,可以将前面卷积层提取到的特征和后面卷积层提取到的特征结合起来,即将详细程度不同的特征结合起来进而提取特征,这就弥补了传统神经网络前面的卷积层得到的特征图经过池化可能被丢弃的一些特征,提高了密集人群计数的神经网络的性能以及密集人群图像预测结果的准确性。
附图说明
为了更清楚的说明本发明实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明所提供的密集人群计数的方法的第一种具体实施例的流程图;
图2为本发明所提供的多尺度多列卷积神经网络结构图;
图3为本发明所提供的密集人群计数的方法的第二种具体实施例的流程图;
图4为本发明实施例提供的一种密集人群计数的装置的结构框图。
具体实施方式
本发明的核心是提供一种密集人群计数的方法、装置、设备以及计算机可读存储介质,提高了密集人群计数的神经网络的性能以及密集人群图像预测结果的准确性。
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,图1为本发明所提供的密集人群计数的方法的第一种具体实施例的流程图;具体操作步骤如下:
步骤S101:将待测试图像输入至预先完成训练的目标多尺度多列卷积神经网络模型中,其中,所述目标多尺度多列卷积神经网络模型包括多列平行的卷积神经网络,每列卷积神经网络中包括多个卷积核大小和个数不同的卷积层;
将待测试图像输入至预先完成训练的目标多尺度多列卷积神经网络模型中前需要对多尺度多列卷积神经网络(SaMCNN)进行训练。
对所述多尺度多列卷积神经网络进行训练时,首先利用高斯滤波器对预先创建的人群图像数据集进行滤波处理后,获取所述人群图像数据集中每幅图像Xi的密度图Mi,从而构建目标训练集其中,Xi为所述人群图像数据集第i张图像,大小为m*n;Yi为所述第i张图像对应的人头坐标点图,大小为m*n,N为所述人群图像数据集中图像总数。采用所述目标训练集对多尺度多列卷积神经网络模型进行训练,得到完成训练后的目标多尺度多列卷积神经网络模型。
如图2所示,所述多尺度多列卷积神经网络中可以包括多列卷积神经网络,在本实施例中以三列平行的卷积神经网络为例。所述每列卷积神经网络包括第一卷积层、第二卷积层、第三卷积层、第四卷积层、第五卷积层、反卷积层、第六卷积层和第七卷积层。其中,所述第一卷积层和其他卷积层的卷积核大小不同,所述第二卷积层、所述第三卷积层、所述第四卷积层、所述第五卷积层和所述第六卷积层的卷积核大小相同,所述第三卷积层、所述第四卷积层、所述第五卷积层和所述第六卷积层的卷积核的个数相同。所述各个卷积层的激活函数采用ReLU函数。
所述第一卷积层、所述第二卷积层、所述第三卷积层和所述第四个卷积层之间的池化层选用区域2*2,步长为2的最大池化;所述第四卷积层和所述第五卷积层之间的池化层选用3*3区域,步长为1的最大池化,以便于保持所述第四卷积层输出特征图和对所述第四卷积层输出特征池化后的特征图大小不变。
所述第四卷积层输出的特征图和所述第五卷积层输出的特征图在通道数上串联后输入所述反卷积层,所述反卷积层输出的特征图和所述第三卷积层输出的特征图在通道数上串联后输入所述第六卷积层,所述第八卷积层输出所述待测试图像的估计密度图作为所述每列卷积神经网络模型的输出结果。
将所述每列卷积神经网络输出的所述当前人群图像的估计密度图在通道数上串联后,经过一个卷积核大小为1*1的总卷积层,并将所述总卷积层输出的特征图映射为所述当前人群图像的目标估计密度图,以便于将所述当前人群图像的目标估计密度图作为所述多尺度多列卷积神经网络模型的网络输出。
步骤S102:将所述待测试图像分别输入至所述每列卷积神经网络中,利用所述每列卷积神经网络中各个卷积层对所述待测试图像进行处理,并将所述每列卷积神经网络中预选卷积层输出的特征图进行融合,以便于分别得到所述每列卷积神经网络输出的估计密度图;
将所述待测试图像输入所述目标多尺度多列卷积神经网络模型中,并分别将所述待测试图像分别输入所述目标多尺度多列卷积神经网络模型的每列卷积神经网络中。所述每列卷积申请网络中的卷积层对所述待测试数据进行处理。利用所述每列卷积网络神经网络中的各个卷积层和池化层进行处理,将所述每列卷积申请网络的第四卷积层和第五卷积层之间选用3*3区域,步长为1的最大池化,来保持池化前后的特征图大小不变,便于将两次卷积之后的特征图在通道数上串联起来。在所述第五卷积层之后,使用反卷积层对之前的特征图进行上采样,进而和第三个卷积层得到的特征图在通道数上串联起来。
步骤S103:将所述每列卷积神经网络输出的估计密度图进行融合后,得到所述待测试图像的目标估计密度图;
步骤S104:依据所述待测试图像的目标估计密度图,计算得到所述待测试图像中的人数。
本实施例所提供的方法,利用多尺度多列卷积神经网络对待测试图像进行测试。所述多尺度多列卷积神经网络相对于多列卷积神经网络,增加了每列卷积神经网络的层数,并且引入了多尺度的思想,将前面卷积层提取到的特征图和后面卷积层提取到的特征图相结合;从而提高了密集人群计数的神经网络的性能以及密集人群图像预测结果的准确性。
基于上述实施例,在本实施例中,可以选择Shanghai tech数据集的第二部分作为人群图像数据集,利用所述人群图像数据集中第二部分图像的密级图对所述多尺度多列卷积神经网络模型进行训练。请参考图3,图3为本发明所提供的密集人群计数的方法的第二种具体实施例的流程图;具体操作步骤如下:
步骤301:利用高斯滤波器对Shanghai tech数据集的第二部分的人群图像进行滤波处理后,获取所述第二部分的人群图像的度图,构建目标训练集;
在本实施例中可以选择Shanghai tech数据集的第二部分作为人群图像数据集Xi为所述人群图像数据集第i张图像,大小为768*1024;Yi为所述第i张图像对应的人头坐标点图,大小为768*1024,N为所述人群图像数据集中图像总数。
所述Shanghai tech数据集包含1198张标注的图像和330165个人头中心标注;所述Shanghai tech数据集被划分为两个部分,其中,第一部分包括482张随机从网上爬取的图像,其中300张用于训练,182张用于测试;第二部分包括716张在上海街头拍取的图像,其中400张用于训练,316张用于测试。
步骤302:采用所述目标训练集对多尺度多列卷积神经网络模型进行训练,得到完成训练后的目标多尺度多列卷积神经网络模型;
步骤303:将待测试图像T输入至所述目标多尺度多列卷积神经网络模型中,其中,所述目标多尺度多列卷积神经网络模型包括多列平行的卷积神经网络,每列卷积神经网络中包括多个卷积核大小和个数不同的卷积层;
步骤304:将所述待测试图像T输入至所述目标多尺度多列卷积神经网络模型后,输出所述待测试图像T的估计密度图
步骤S305:计算所述估计密度图中所有像素值的和,得到所述待测试图像中的人数
将本实施例所提供的多尺度多列卷积神经网络模型与多列卷积神经网络模型在相同的数据集上做人群计数比较。从表1可以得到,本实施例提出的网络模型的计数结果的平均完全误差(MAE)和均方误差(MSE)都比现有技术中网络模型的计数结果小,获得了更好的性能。
表-1人群计数结果的对比
请参考图4,图4为本发明实施例提供的一种密集人群计数的装置的结构框图。具体装置可以包括:
输入模块100,用于将待测试图像输入至预先完成训练的目标多尺度多列卷积神经网络模型中;其中,所述目标多尺度多列卷积神经网络模型包括多列平行的卷积神经网络,每列卷积神经网络中包括多个卷积核大小和个数不同的卷积层;
处理模块200,用于将所述待测试图像分别输入至所述每列卷积神经网络中,利用所述每列卷积神经网络中各个卷积层对所述待测试图像进行处理,并将所述每列卷积神经网络中预选卷积层输出的特征图进行融合,以便于分别得到所述每列卷积神经网络输出的估计密度图;
输出模块300,用于将所述每列卷积神经网络输出的估计密度图进行融合后,得到所述待测试图像的目标估计密度图;
计算模块400,用于依据所述待测试图像的目标估计密度图,计算得到所述待测试图像中的人数。
本实施例的密集人群计数的装置用于实现前述的密集人群计数的方法,因此密集人群计数的装置中的具体实施方式可见前文中的密集人群计数的方法的实施例部分,例如,输入模块100,处理模块200,输出模块300,计算模块400,分别用于实现上述密集人群计数的方法中步骤S101,S102,S103和S104,所以,其具体实施方式可以参照相应的各个部分实施例的描述,在此不再赘述。
本发明具体实施例还提供了一种密集人群计数的设备,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现上述一种密集人群计数的方法的步骤。
本发明具体实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述一种密集人群计数的方法的步骤。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本发明所提供的密集人群计数的方法、装置、设备以及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
Claims (10)
1.一种密集人群计数的方法,其特征在于,包括:
将待测试图像输入至预先完成训练的目标多尺度多列卷积神经网络模型中;其中,所述目标多尺度多列卷积神经网络模型包括多列平行的卷积神经网络,每列卷积神经网络中包括多个卷积核大小和个数不同的卷积层;
将所述待测试图像分别输入至所述每列卷积神经网络中,利用所述每列卷积神经网络中各个卷积层对所述待测试图像进行处理,并将所述每列卷积神经网络中预选卷积层输出的特征图进行融合,以便于分别得到所述每列卷积神经网络输出的估计密度图;
将所述每列卷积神经网络输出的估计密度图进行融合后,得到所述待测试图像的目标估计密度图;
依据所述待测试图像的目标估计密度图,计算得到所述待测试图像中的人数。
2.如权利要求1所述的方法,其特征在于,所述将待测试图像输入至预先完成训练的目标多尺度多列卷积神经网络模型中前包括:
利用高斯滤波器对预先创建的人群图像数据集进行滤波处理后,获取所述人群图像数据集中每幅图像的密度图,从而构建目标训练集;
采用所述目标训练集对多尺度多列卷积神经网络模型进行训练,得到完成训练后的目标多尺度多列卷积神经网络模型。
3.如权利要求2所述的方法,其特征在于,所述利用高斯滤波器对预先创建的人群图像数据集进行滤波处理后,获取所述人群图像数据集中每幅图像的密度图,从而构建目标训练集包括:
获取预先采集的人群图像数据集其中,Xi为所述人群图像数据集第i张图像,大小为m*n;Yi为所述第i张图像对应的人头坐标点图,大小为m*n,N为所述人群图像数据集中图像总数;
利用高斯滤波器对所述人群图像数据集中的每幅图像Xi进行滤波处理后,得到所述每幅图像Xi的密度图Mi,利用所述每幅图像Xi的密度图Mi构建目标训练集
4.如权利要求2所述的方法,其特征在于,所述采用所述目标训练集对多尺度多列卷积神经网络模型进行训练包括:
将所述目标训练集中的当前人群图像分别输入至所述多尺度多列卷积神经网络模型的每列卷积神经网络中;
其中,所述多尺度多列卷积神经网络模型中的每列卷积神经网络相互平行,所述每列卷积神经网络除卷积核大小和个数外,其他网络结构相同;
将所述每列卷积神经网络输出的所述当前人群图像的估计密度图在通道数上串联后,经过一个卷积核大小为1*1的总卷积层,并将所述总卷积层输出的特征图映射为所述当前人群图像的目标估计密度图,以便于将所述当前人群图像的目标估计密度图作为所述多尺度多列卷积神经网络模型的网络输出。
5.如权利要求4所述的方法,其特征在于,所述多尺度多列卷积神经网络模型的每列卷积神经网络包括:
第一卷积层、第二卷积层、第三卷积层、第四卷积层、第五卷积层、反卷积层、第六卷积层和第七卷积层;
其中,所述第一卷积层和其他卷积层的卷积核大小不同,所述第二卷积层、所述第三卷积层、所述第四卷积层、所述第五卷积层和所述第六卷积层的卷积核大小相同,所述第三卷积层、所述第四卷积层、所述第五卷积层和所述第六卷积层的卷积核的个数相同;
所述第一卷积层、所述第二卷积层、所述第三卷积层和所述第四个卷积层之间的池化层选用区域2*2,步长为2的最大池化;
所述第四卷积层和所述第五卷积层之间的池化层选用3*3区域,步长为1的最大池化,以便于保持所述第四卷积层输出特征图和对所述第四卷积层输出特征池化后的特征图大小不变;
所述各个卷积层的激活函数采用ReLU函数;
所述第四卷积层输出的特征图和所述第五卷积层输出的特征图在通道数上串联后输入所述反卷积层,所述反卷积层输出的特征图和所述第三卷积层输出的特征图在通道数上串联后输入所述第六卷积层,所述第八卷积层输出所述待测试图像的估计密度图作为所述每列卷积神经网络模型的输出结果。
6.如权利要求1至5任一项所述的方法,其特征在于,所述依据所述待测试图像的目标估计密度图,计算得到所述待测试图像中的人数包括:
将所述待测试图像T输入至所述目标多尺度多列卷积神经网络模型,得到所述待测试图像T的估计密度图后,计算所述估计密度图中所有像素值的和,得到所述待测试图像中的人数
7.一种密集人群计数的装置,其特征在于,包括:
输入模块,用于将待测试图像输入至预先完成训练的目标多尺度多列卷积神经网络模型中;其中,所述目标多尺度多列卷积神经网络模型包括多列平行的卷积神经网络,每列卷积神经网络中包括多个卷积核大小和个数不同的卷积层;
处理模块,用于将所述待测试图像分别输入至所述每列卷积神经网络中,利用所述每列卷积神经网络中各个卷积层对所述待测试图像进行处理,并将所述每列卷积神经网络中预选卷积层输出的特征图进行融合,以便于分别得到所述每列卷积神经网络输出的估计密度图;
输出模块,用于将所述每列卷积神经网络输出的估计密度图进行融合后,得到所述待测试图像的目标估计密度图;
计算模块,用于依据所述待测试图像的目标估计密度图,计算得到所述待测试图像中的人数。
8.如权利要求7所述的装置,其特征在于,所述输出模块前包括:
训练模块,用于利用高斯滤波器对预先创建的人群图像数据集进行滤波处理后,获取所述人群图像数据集中每幅图像的密度图,从而构建目标训练集;
采用所述目标训练集对多尺度多列卷积神经网络模型进行训练,得到完成训练后的目标多尺度多列卷积神经网络模型。
9.一种密集人群计数的设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述一种密集人群计数的方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述一种密集人群计数的方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910129612.3A CN109858461B (zh) | 2019-02-21 | 2019-02-21 | 一种密集人群计数的方法、装置、设备以及存储介质 |
PCT/CN2020/075795 WO2020169043A1 (zh) | 2019-02-21 | 2020-02-19 | 一种密集人群计数的方法、装置、设备以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910129612.3A CN109858461B (zh) | 2019-02-21 | 2019-02-21 | 一种密集人群计数的方法、装置、设备以及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109858461A true CN109858461A (zh) | 2019-06-07 |
CN109858461B CN109858461B (zh) | 2023-06-16 |
Family
ID=66898471
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910129612.3A Active CN109858461B (zh) | 2019-02-21 | 2019-02-21 | 一种密集人群计数的方法、装置、设备以及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN109858461B (zh) |
WO (1) | WO2020169043A1 (zh) |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110674704A (zh) * | 2019-09-05 | 2020-01-10 | 同济大学 | 一种基于多尺度扩张卷积网络的人群密度估计方法及装置 |
CN110889360A (zh) * | 2019-11-20 | 2020-03-17 | 山东师范大学 | 一种基于切换卷积网络的人群计数方法及*** |
CN110956122A (zh) * | 2019-11-27 | 2020-04-03 | 深圳市商汤科技有限公司 | 图像处理方法及装置、处理器、电子设备、存储介质 |
CN111062274A (zh) * | 2019-12-02 | 2020-04-24 | 汇纳科技股份有限公司 | 上下文感知嵌入的人群计数方法、***、介质及电子设备 |
CN111126177A (zh) * | 2019-12-05 | 2020-05-08 | 杭州飞步科技有限公司 | 人数统计的方法及装置 |
CN111178235A (zh) * | 2019-12-27 | 2020-05-19 | 卓尔智联(武汉)研究院有限公司 | 一种目标数量确定方法、装置、设备及存储介质 |
CN111523470A (zh) * | 2020-04-23 | 2020-08-11 | 苏州浪潮智能科技有限公司 | 特征融合块、卷积神经网络、行人重识别方法及相关设备 |
WO2020169043A1 (zh) * | 2019-02-21 | 2020-08-27 | 苏州大学 | 一种密集人群计数的方法、装置、设备以及存储介质 |
CN111626134A (zh) * | 2020-04-28 | 2020-09-04 | 上海交通大学 | 一种基于隐密度分布的密集人群计数方法、***及终端 |
CN111640101A (zh) * | 2020-05-29 | 2020-09-08 | 苏州大学 | 基于Ghost卷积特征融合神经网络实时车流量检测***及方法 |
CN111652152A (zh) * | 2020-06-04 | 2020-09-11 | 上海眼控科技股份有限公司 | 人群密度检测方法、装置、计算机设备和存储介质 |
CN111723742A (zh) * | 2020-06-19 | 2020-09-29 | 苏州大学 | 一种人群密度分析方法、***、装置及计算机可读存储介质 |
CN111783934A (zh) * | 2020-05-15 | 2020-10-16 | 北京迈格威科技有限公司 | 卷积神经网络构建方法、装置、设备及介质 |
CN111950443A (zh) * | 2020-08-10 | 2020-11-17 | 北京师范大学珠海分校 | 一种多尺度卷积神经网络的密集人群计数方法 |
CN112712518A (zh) * | 2021-01-13 | 2021-04-27 | 中国农业大学 | 鱼类计数方法、装置、电子设备及存储介质 |
WO2021185379A1 (zh) * | 2020-03-20 | 2021-09-23 | 长沙智能驾驶研究院有限公司 | 密集目标检测方法及*** |
WO2022047783A1 (en) * | 2020-09-07 | 2022-03-10 | Intel Corporation | Poly-scale kernel-wise convolution for high-performance visual recognition applications |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112101190B (zh) * | 2020-09-11 | 2023-11-03 | 西安电子科技大学 | 一种遥感图像分类方法、存储介质及计算设备 |
CN112132023B (zh) * | 2020-09-22 | 2024-05-17 | 上海应用技术大学 | 基于多尺度上下文增强网络的人群计数方法 |
CN114255203B (zh) * | 2020-09-22 | 2024-04-09 | 中国农业大学 | 一种鱼苗数量估计方法及*** |
CN112396000B (zh) * | 2020-11-19 | 2023-09-05 | 中山大学 | 一种多模态密集预测的深度信息传输模型的构建方法 |
CN112699741A (zh) * | 2020-12-10 | 2021-04-23 | 广州广电运通金融电子股份有限公司 | 一种公交车内部拥挤度计算方法、***及设备 |
CN112733714B (zh) * | 2021-01-11 | 2024-03-01 | 北京大学 | 一种基于vgg网络的自动人群计数图像识别方法 |
CN112818849B (zh) * | 2021-01-31 | 2024-03-08 | 南京工业大学 | 基于对抗学习的上下文注意力卷积神经网络的人群密度检测算法 |
CN114973112B (zh) * | 2021-02-19 | 2024-04-05 | 四川大学 | 一种基于对抗学习网络的尺度自适应密集人群计数方法 |
CN112966600B (zh) * | 2021-03-04 | 2024-04-16 | 上海应用技术大学 | 用于拥挤人群计数的自适应多尺度上下文聚合方法 |
CN112861795A (zh) * | 2021-03-12 | 2021-05-28 | 云知声智能科技股份有限公司 | 基于多尺度特征融合的遥感图像显著目标检测方法及装置 |
CN113516029B (zh) * | 2021-04-28 | 2023-11-07 | 上海科技大学 | 基于部分标注的图像人群计数方法、装置、介质及终端 |
CN113139489B (zh) * | 2021-04-30 | 2023-09-05 | 广州大学 | 基于背景提取和多尺度融合网络的人群计数方法及*** |
CN113205078B (zh) * | 2021-05-31 | 2024-04-16 | 上海应用技术大学 | 基于多分支递进强化注意力人群计数方法 |
CN113283356B (zh) * | 2021-05-31 | 2024-04-05 | 上海应用技术大学 | 多级注意力尺度感知人群计数方法 |
CN113468995A (zh) * | 2021-06-22 | 2021-10-01 | 之江实验室 | 一种基于密度等级感知的人群计数方法 |
CN113687326B (zh) * | 2021-07-13 | 2024-01-05 | 广州杰赛科技股份有限公司 | 一种车载雷达回波降噪方法、装置、设备及介质 |
CN113807274B (zh) * | 2021-09-23 | 2023-07-04 | 山东建筑大学 | 一种基于图像反透视变换的人群计数方法及*** |
CN113902703A (zh) * | 2021-10-08 | 2022-01-07 | 中国科学院半导体研究所 | 对象统计模型的训练方法、对象统计方法及装置 |
CN114022458A (zh) * | 2021-11-09 | 2022-02-08 | 恒生电子股份有限公司 | 骨架检测方法、装置、电子设备和计算机可读存储介质 |
CN114120233B (zh) * | 2021-11-29 | 2024-04-16 | 上海应用技术大学 | 用于人群计数的轻量金字塔空洞卷积聚合网络的训练方法 |
CN114463694B (zh) * | 2022-01-06 | 2024-04-05 | 中山大学 | 一种基于伪标签的半监督人群计数方法及装置 |
CN114639070B (zh) * | 2022-03-15 | 2024-06-04 | 福州大学 | 融合注意力机制的人群运动流量分析方法 |
CN114897768A (zh) * | 2022-03-24 | 2022-08-12 | 重庆邮电大学 | 一种基于语义细化的空间金字塔人群计数方法 |
CN114913544A (zh) * | 2022-04-28 | 2022-08-16 | 华南农业大学 | 基于语义分割的虾苗计数方法、***、云服务器及介质 |
CN115019211A (zh) * | 2022-06-28 | 2022-09-06 | 北京理工大学 | 面向无人机航拍图像的分割引导注意力群体计数方法 |
CN116311083B (zh) * | 2023-05-19 | 2023-09-05 | 华东交通大学 | 一种人群计数模型训练方法及*** |
CN116704266B (zh) * | 2023-07-28 | 2023-10-31 | 国网浙江省电力有限公司信息通信分公司 | 一种电力设备故障检测方法、装置、设备及存储介质 |
CN117670892A (zh) * | 2023-12-07 | 2024-03-08 | 百鸟数据科技(北京)有限责任公司 | 一种水鸟密度估计方法、装置、计算机设备和存储介质 |
CN117405570B (zh) * | 2023-12-13 | 2024-03-08 | 长沙思辰仪器科技有限公司 | 一种油液颗粒度计数器自动检测方法与*** |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109214337A (zh) * | 2018-09-05 | 2019-01-15 | 苏州大学 | 一种人群统计方法、装置、设备及计算机可读存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018052586A1 (en) * | 2016-09-14 | 2018-03-22 | Konica Minolta Laboratory U.S.A., Inc. | Method and system for multi-scale cell image segmentation using multiple parallel convolutional neural networks |
CN109101930B (zh) * | 2018-08-18 | 2020-08-18 | 华中科技大学 | 一种人群计数方法及*** |
CN109271960B (zh) * | 2018-10-08 | 2020-09-04 | 燕山大学 | 一种基于卷积神经网络的人数统计方法 |
CN109858461B (zh) * | 2019-02-21 | 2023-06-16 | 苏州大学 | 一种密集人群计数的方法、装置、设备以及存储介质 |
-
2019
- 2019-02-21 CN CN201910129612.3A patent/CN109858461B/zh active Active
-
2020
- 2020-02-19 WO PCT/CN2020/075795 patent/WO2020169043A1/zh active Application Filing
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109214337A (zh) * | 2018-09-05 | 2019-01-15 | 苏州大学 | 一种人群统计方法、装置、设备及计算机可读存储介质 |
Non-Patent Citations (2)
Title |
---|
LU ZHANG等: "Crowd counting via scale-adaptive convolutional neural network", 《ARXIV》 * |
曹金梦等: "基于多尺度多任务卷积神经网络的人群计数", 《计算机应用》 * |
Cited By (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020169043A1 (zh) * | 2019-02-21 | 2020-08-27 | 苏州大学 | 一种密集人群计数的方法、装置、设备以及存储介质 |
CN110674704A (zh) * | 2019-09-05 | 2020-01-10 | 同济大学 | 一种基于多尺度扩张卷积网络的人群密度估计方法及装置 |
CN110889360A (zh) * | 2019-11-20 | 2020-03-17 | 山东师范大学 | 一种基于切换卷积网络的人群计数方法及*** |
CN110956122A (zh) * | 2019-11-27 | 2020-04-03 | 深圳市商汤科技有限公司 | 图像处理方法及装置、处理器、电子设备、存储介质 |
CN110956122B (zh) * | 2019-11-27 | 2022-08-02 | 深圳市商汤科技有限公司 | 图像处理方法及装置、处理器、电子设备、存储介质 |
CN111062274A (zh) * | 2019-12-02 | 2020-04-24 | 汇纳科技股份有限公司 | 上下文感知嵌入的人群计数方法、***、介质及电子设备 |
CN111062274B (zh) * | 2019-12-02 | 2023-11-28 | 汇纳科技股份有限公司 | 上下文感知嵌入的人群计数方法、***、介质及电子设备 |
CN111126177A (zh) * | 2019-12-05 | 2020-05-08 | 杭州飞步科技有限公司 | 人数统计的方法及装置 |
CN111126177B (zh) * | 2019-12-05 | 2023-05-09 | 杭州飞步科技有限公司 | 人数统计的方法及装置 |
CN111178235A (zh) * | 2019-12-27 | 2020-05-19 | 卓尔智联(武汉)研究院有限公司 | 一种目标数量确定方法、装置、设备及存储介质 |
CN113496150A (zh) * | 2020-03-20 | 2021-10-12 | 长沙智能驾驶研究院有限公司 | 密集目标检测方法、装置、存储介质及计算机设备 |
WO2021185379A1 (zh) * | 2020-03-20 | 2021-09-23 | 长沙智能驾驶研究院有限公司 | 密集目标检测方法及*** |
CN111523470A (zh) * | 2020-04-23 | 2020-08-11 | 苏州浪潮智能科技有限公司 | 特征融合块、卷积神经网络、行人重识别方法及相关设备 |
CN111523470B (zh) * | 2020-04-23 | 2022-11-18 | 苏州浪潮智能科技有限公司 | 一种行人重识别方法、装置、设备及介质 |
CN111626134A (zh) * | 2020-04-28 | 2020-09-04 | 上海交通大学 | 一种基于隐密度分布的密集人群计数方法、***及终端 |
CN111626134B (zh) * | 2020-04-28 | 2023-04-21 | 上海交通大学 | 一种基于隐密度分布的密集人群计数方法、***及终端 |
CN111783934A (zh) * | 2020-05-15 | 2020-10-16 | 北京迈格威科技有限公司 | 卷积神经网络构建方法、装置、设备及介质 |
WO2021238019A1 (zh) * | 2020-05-29 | 2021-12-02 | 苏州大学 | 基于Ghost卷积特征融合神经网络实时车流量检测***及方法 |
CN111640101A (zh) * | 2020-05-29 | 2020-09-08 | 苏州大学 | 基于Ghost卷积特征融合神经网络实时车流量检测***及方法 |
CN111652152A (zh) * | 2020-06-04 | 2020-09-11 | 上海眼控科技股份有限公司 | 人群密度检测方法、装置、计算机设备和存储介质 |
CN111723742A (zh) * | 2020-06-19 | 2020-09-29 | 苏州大学 | 一种人群密度分析方法、***、装置及计算机可读存储介质 |
CN111950443A (zh) * | 2020-08-10 | 2020-11-17 | 北京师范大学珠海分校 | 一种多尺度卷积神经网络的密集人群计数方法 |
CN111950443B (zh) * | 2020-08-10 | 2023-12-29 | 北京师范大学珠海分校 | 一种多尺度卷积神经网络的密集人群计数方法 |
WO2022047783A1 (en) * | 2020-09-07 | 2022-03-10 | Intel Corporation | Poly-scale kernel-wise convolution for high-performance visual recognition applications |
CN112712518A (zh) * | 2021-01-13 | 2021-04-27 | 中国农业大学 | 鱼类计数方法、装置、电子设备及存储介质 |
CN112712518B (zh) * | 2021-01-13 | 2024-01-09 | 中国农业大学 | 鱼类计数方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109858461B (zh) | 2023-06-16 |
WO2020169043A1 (zh) | 2020-08-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109858461A (zh) | 一种密集人群计数的方法、装置、设备以及存储介质 | |
CN106910185B (zh) | 一种基于cnn深度学习的dbcc分类模型构建方法 | |
CN103996195B (zh) | 一种图像显著性检测方法 | |
CN104063719B (zh) | 基于深度卷积网络的行人检测方法及装置 | |
CN107967451A (zh) | 一种利用多尺度多任务卷积神经网络对静止图像进行人群计数的方法 | |
CN108388905B (zh) | 一种基于卷积神经网络和邻域上下文的光源估计方法 | |
CN110348445A (zh) | 一种融合空洞卷积和边缘信息的实例分割方法 | |
CN108334848A (zh) | 一种基于生成对抗网络的微小人脸识别方法 | |
CN107729819A (zh) | 一种基于稀疏全卷积神经网络的人脸标注方法 | |
CN107944442A (zh) | 基于改进卷积神经网络的对象检测装置及方法 | |
CN107463920A (zh) | 一种消除局部遮挡物影响的人脸识别方法 | |
CN108334847A (zh) | 一种真实场景下的基于深度学习的人脸识别方法 | |
CN110084155A (zh) | 一种密集人数计数的方法、装置、设备以及存储介质 | |
CN106462771A (zh) | 一种3d图像的显著性检测方法 | |
CN107742107A (zh) | 人脸图像分类方法、装置及服务器 | |
CN106778502A (zh) | 一种基于深度残差网络的人群计数方法 | |
CN106296638A (zh) | 显著性信息取得装置以及显著性信息取得方法 | |
CN104573731A (zh) | 基于卷积神经网络的快速目标检测方法 | |
CN109598234A (zh) | 关键点检测方法和装置 | |
CN104834898A (zh) | 一种人物摄影图像的质量分类方法 | |
CN107123117A (zh) | 一种基于深度学习的ic引脚焊点质量检测方法及装置 | |
CN108960069A (zh) | 一种用于单阶段物体检测器的增强上下文的方法 | |
CN109948593A (zh) | 基于结合全局密度特征的mcnn人群计数方法 | |
CN107944459A (zh) | 一种rgb‑d物体识别方法 | |
CN104298974A (zh) | 一种基于深度视频序列的人体行为识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |