CN108921822A - 基于卷积神经网络的图像目标计数方法 - Google Patents

基于卷积神经网络的图像目标计数方法 Download PDF

Info

Publication number
CN108921822A
CN108921822A CN201810564162.6A CN201810564162A CN108921822A CN 108921822 A CN108921822 A CN 108921822A CN 201810564162 A CN201810564162 A CN 201810564162A CN 108921822 A CN108921822 A CN 108921822A
Authority
CN
China
Prior art keywords
image
density
training
target
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810564162.6A
Other languages
English (en)
Inventor
王子磊
刘旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology of China USTC
Original Assignee
University of Science and Technology of China USTC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology of China USTC filed Critical University of Science and Technology of China USTC
Priority to CN201810564162.6A priority Critical patent/CN108921822A/zh
Publication of CN108921822A publication Critical patent/CN108921822A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30242Counting objects in image

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于卷积神经网络的图像目标计数方法,其通过鲁棒增强层使网络学习到的特征对目标形变更具有鲁棒性,同时降低模型的计算复杂度;并采用金字塔分层计数模块进行密度估计,充分利用卷积神经网络分层特征中包含的多尺度信息,在实现准确计数的同时显著提高了计算效率。总之,本发明基于卷积神经网络,实现了图像中的目标精确计数,可以适用于复杂场景下的目标计数任务,计算复杂度低,具有较高的实际应用价值。

Description

基于卷积神经网络的图像目标计数方法
技术领域
本发明涉及计算机视觉技术领域,尤其涉及一种基于卷积神经网络的图像目标计数方法。
背景技术
随着计算机技术、网络通信技术和电子技术的高速发展以及人们对社会公共安全要求的不断提高,基于智能视频分析技术的智能视频监控***得到了广泛的应用。作为智能视频监控领域中的重要内容,目标计数在实际生活中有着大量的应用场景,准确的估计出目标在图像中的具体数目是相关***处理的关键。在智能交通***中,准确的估计出交通场景中的车辆数目可以为交通管理部门进行公共交通管理提供重要依据;对商场的客流量进行统计,可以指导商场的营业时间和人员调配;对大型商场等公共场所的人群密度监控可以及时发现安全隐患并提供预警。
计数任务的目标是让计算机准确的估计出图像中所关注物体的数量。目前主流的目标计数方法主要是基于区域特征回归的方法和基于神经网络的密度估计方法。其中,区域特征回归的方法是通过建立前景区域图像特征与目标数量的回归模型来直接估计场景中的目标总数,该类算法计算复杂度较低,但是忽略了目标在场景中的空间位置分布信息,仅仅能得到一个一维的统计量,并且特征的提取依赖于图像的前景分割效果,鲁棒性不足。密度估计的计数方法是通过人工标记的样本生成待统计目标的密度分布图,直接学习从像素点特征到目标密度分布图的映射关系。生成的目标密度分布图既包含了完整的密度分布信息,可以通过区域密度求和来得到任意区域的目标数目,同时蕴含了目标在图像中的空间分布信息,是当前研究的重点。
当前基于神经网络的密度估计方法大多需要使用多路网络结构提取多尺度特征。如高盛华等在中国专利公开号CN105528589A《基于多列卷积神经网络的单张图像人群计数算法》中采用多列卷积网络结构提取场景特征,每个子网络用到的卷积核大小不同,通过组合不同大小的感受野特征来处理场景中的目标尺度变化问题;刘昱等在中国专利公开号CN107506692《一种基于深度学习的密集人群计数与人员分布估计方法》中同样采用了多列卷积网络结构,通过四列深度残差网络提取多尺度特征;类似的,邓腾飞等在中国专利公开号CN107301387A《一种基于深度学习的图像高密度人群计数方法》中通过两列卷积网络分别学习高层特征与低层特征。但是,上述方案中,多列卷积网络模型参数量大,计算复杂度高,很难满足实际应用对高效处理的要求。
发明内容
本发明的目的是提供一种基于卷积神经网络的图像目标计数方法,能够在不显著增加网络提取特征复杂性的情况下,进一步提高模型性能。
本发明的目的是通过以下技术方案实现的:
一种基于卷积神经网络的图像目标计数方法,包括:
基于卷积神经网络建立金字塔目标计数网络;
利用人工数据标注,在训练图像上建立感兴趣目标的密度分布真值图像;
通过随机裁剪和水平翻转方式对训练数据集中的训练图像以及相应的密度分布真值图像进行计数数据增强;
将计数数据增强后的训练图像与目标密度分布真值图像作为金字塔目标计数网络的输入,通过不断迭代优化完成金字塔目标计数网络训练,生成金字塔目标计数网络模型;
当新图像输入时,通过滑窗方式生成与输入图像块相同大小的图像,送入到金字塔目标计数网络模型中,得到预测的密度分布图,对重叠部分的密度值取平均得到最终的输出密度图,从而求得目标数目。
由上述本发明提供的技术方案可以看出,基于卷积神经网络,实现了图像中的目标精确计数,可以适用于复杂场景下的目标计数任务,计算复杂度低,具有较高的实际应用价值。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
图1为本发明实施例提供的一种基于卷积神经网络的图像目标计数方法的流程图;
图2为本发明实施例提供的金字塔目标计数网络的示意图;
图3为本发明实施例提供的目标中心点图和密度分布真值图像的示意图;
图4为本发明实施例提供的金字塔分层计数模块示意图;
图5为本发明实施例提供的Shanghaitech-B数据集输出结果示意图;
图6为本发明实施例提供的TRANCOS数据集输出结果示意图。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。
自然场景通常是复杂多变的,对于图像目标计数任务,很容易受到各种因素的影响,如目标间的严重遮挡、目标形变、目标的不均匀分布、杂乱的背景干扰、摄像机视角的畸变等。尤其是摄像机透视效应的影响,使得同一物体在场景不同深度的大小变化多样,不同场景的摄像机视角同样变化各异。如前所述,针对这些问题,已有方法主要通过引入多路网络来提取多尺度特征,然而,引入多路网络会大大增加网络参数数量,提高计算复杂度,无法满足实际应用要求。另一方面,相比于单个网络模型,多路网络的训练通常是非常困难的。实际上,卷积神经网络模型本身就是一个金字塔多层级结构,模型接受原始图像信号作为输入,对图像进行逐层的抽象表达,更高的层有着更大的感受野,各层特征之间蕴含着丰富的多尺度信息。因此,本发明公开了一种基于卷积神经网络的图像目标计数方法,采用单个网络进行目标计数,充分利用卷积神经网络模型本身所包含的多尺度信息,在降低模型复杂度的同时,取得了良好的计数性能;下面针对本发明实施例提供的一种基于卷积神经网络的图像目标计数方法做详细的介绍。
如图1所示,为本发明实施例提供一种基于卷积神经网络的图像目标计数方法,其中第1~第4个步骤为训练阶段,第5个步骤为测试阶段;
训练阶段所使用的图像可以来自具有代表性的人群计数数据集Shanghaitech-B以及车辆计数数据集TRANCOS中的场景图片。其中Shanghaitech-B数据集由(Single-imagecrowd counting via multi-column convolutional neural network.Proceedings ofIEEE Conference on Computer Vision and Pattern Recognition,2016.)提供,TRANCOS数据集由(Extremely Overlapping Vehicle Counting.Proceedings of IberianConference on Pattern Recognition and Image Analysis,2015.)提供。
上述方法的主要步骤如下:
1、基于卷积神经网络建立金字塔目标计数网络。
本发明实施例中,根据图像目标计数任务本身的特点和要求,针对代表性的卷积神经网络模型进行结构调整与设计,建立了金字塔目标计数网络。如图2所示,所建立的金字塔目标计数网络主要包括:特征提取模块、鲁棒性增强模块和密度估计模块。
1)所述特征提取模块,采用了全卷积网络提取图像特征,包括五层常规卷积层和两层空洞卷积层。
本发明实施例中,采用了两种不同的网络结构来提取不同场景下的图像特征。相应地,采用两种不同尺寸的图像块,72×72和144×144,分别作为第一种和第二种网络结构的输入尺寸。两种网络结构的不同之处主要是前三层卷积层卷积核的感受野大小不同,第一种网络结构全部采用3×3大小的卷积核,第二种网络结构的前三层采用5×5大小的卷积核。在两个网络结构中,各层的通道数都是从16开始,每经过一个最大池化层,通道数增加2倍,然后再从64减少到16并保持不变。网络中包含两个最大池化层,分别位于第一层卷积层和第二层卷积层之后,核大小是2×2,步长为1。
需要说明的是,上述关于图像块的尺寸、通道数量所使用的具体数值仅为示例,并非构成限制。
特征提取模块最后为两个空洞卷积层,所述空洞卷积层是指在标准卷积的卷积核中注入空洞,从而增加卷积核处理数据时各值的间距,相比于常规卷积层,其可以在不增加网络参数的情况下扩大感受野的大小。
示例性的,两个空洞卷积层可以步长为2,对于每层的卷积输出,采用线性修正单元ReLU作为激活函数,为网络加入非线性映射建模能力。
2)所述鲁棒性增强模块,采用了空间金字塔池化方式,在特征提取模块输出的特征图上,通过N1×N1、N2×N2、N3×N3与N4×N4四个不同尺度的空间池化,构造不同尺寸的子块,从而获取图像在不同分辨率上的空间信息,使网络学习到的特征对目标的形变更具有鲁棒性,同时降低模型的计算复杂度。
示例性的,四个不同尺度的空间池化可以为1×1,2×2,4×4和6×6,则结合特征提取模块中的示例,鲁棒性增强之后的特征维度为16×(1×1+2×2+4×4+6×6)=912。
3)所述密度估计模块,采用了一种金字塔分层计数模块,在不同尺度上学习互补信息,从而生成目标分布密度图。
所述金字塔分层计数模块所进行的目标密度估计是在经过鲁棒性增强后的特征提取模块各特征图上分别进行的,最终输出的密度图由各层的输出结果相加得到;其中,密度估计采用两层全连接层来建立从图像特征到密度值的非线性映射。第一层全连接层与鲁棒性增强模块(SPP)的输出特征相连接,神经元数目是1000。第二层全连接层是输出层,当特征提取模块采用第一种网络结构时,输出神经元数目是324,当特征提取模块采用第二种网络结构时,输出神经元数目是1296。在第一层全连接之后,采用修正线性单元(ReLU)激活函数和Dropout层,其中Dropout的参数是0.5。
需要说明的是,上述关于神经元数目、Dropout的参数所使用的具体数值仅为示例,并非构成限制。
2、利用人工数据标注,在训练图像上建立感兴趣目标的密度分布真值图像。
本发明实施例中,在训练图像上利用人工标注的目标中心点图进行高斯滤波得到感兴趣目标的密度分布真值图像;
其中,将标注的目标中心点图的目标中心位置作为高斯核的中心,通过高斯滤波生成密度分布图:如图3所示,给定训练图像,设P为标注的图像中目标几何中心点的集合,用D表示图像所对应的密度分布图,则位于(i,j)处像素的密度值D(i,j)通过如下公式计算:
上式中,是(i,j)处像素的二维高斯分布值,高斯分布的均值点位于标记位置(m,n)处;σ2I2×2为协方差矩阵。
示例性的,具体实施时,对于Shanghaitech-B和TRANCOS数据集,高斯核的大小可分别设为10和15。
3、通过随机裁剪和水平翻转方式对训练数据集中的训练图像以及相应的密度分布真值图像进行计数数据增强。
卷积神经网络模型训练的参数较多,需要基于大量的训练数据才能训练好一个卷积神经网络模型。因此在训练阶段,通过从训练图像中随机裁剪的方法增强训练数据,从而生成大量的训练图像块和对应的真实密度图。根据输入尺寸大小进行尺度归一化,并随机裁剪出大量的图像块再通过图像水平翻转进行数据增强,最后将得到的训练样本用于模型训练。
主要步骤如下:
1)对输入的训练图像的尺寸进行归一化;
2)从归一化后的训练图像中随机裁剪相同大小的图像块作为新的训练图像;
3)对新的训练图像进行水平翻转,获得一系列新的训练图像;
4)利用上述方式(即步骤1)~3))对密度分布真值图像做相同处理,然后通过归一化使缩放后密度分布真值图像中目标数量保持不变。
示例性的,对于Shanghaitech-B数据集,根据文献(Single-image crowdcounting via multi-column convolutional neural network.Proceedings of IEEEConference on Computer Vision and PatternRecognition,2016.)中的实验设置,采用400张图片作为训练图像,其余316张为测试图片。Shanghaitech-B数据集提供的图片,分辨率较大,为了训练好计数模型,对于每张训练图片,我们在实施时随机裁剪200张大小为200×200的图像块,然后将每个图像块缩放(即归一化)到144×144,并采用第二种特征提取网络进行特征提取。实施时同样通过图像翻转来进行数据增强。当然,上述具体数值也仅为举例,并非构成限制。
4、将计数数据增强后的训练图像与目标密度分布真值图像作为金字塔目标计数网络的输入,通过不断迭代优化完成金字塔目标计数网络训练,生成金字塔目标计数网络模型。
对金字塔目标计数网络进行训练时,将计数数据增强后的训练图像与目标密度分布真值图像作为训练样本,采用预测的密度图和真实密度图之间的欧式距离作为损失函数,通过随机梯度下降法训练,在每一次优化迭代中更新网络的模型参数,损失函数L(Θ)定义如下:
上式中,Θ表示模型学习到的网络参数,N为训练样本数量,F(Xk;Θ)为金字塔目标计数网络预测的密度图,Dk表示第k个训练样本Xk的真实密度图。
如图4所示,确定了欧式距离作为优化目标之后,在模型的训练上,首先通过端到端的训练,在经过鲁棒性增强之后的特征提取模块的最后一层特征(最后一个空洞卷积层输出的特征图)上建立密度回归模型,得到初始的密度估计结果。然后,为了优化计数结果,固定特征提取模块和初始回归模型,以真实密度与当前预测密度的残差作为优化目标,在经过鲁棒性增强之后的特征提取模块的另一层特征(最后一层常规卷积层输出的特征)上建立一个新的回归模型。最后再利用反向传播算法对整个网络的参数进行联合训练。通过这种方式,让两个回归模型从卷积神经网络的多尺度特征中学习互补信息,共同完成最终的密度估计。按照这种训练策略,可以采用相似的方法在金字塔分层计数模块中训练更多的回归模型。具体实施时,最终的计数网络采用了两个回归模型进行密度估计,采用的两个回归模型分别是建立在特征提取网络的最后一层空洞卷积层和最后一层常规卷积层上。
5、当新图像输入时,通过滑窗方式生成与输入图像块相同大小的图像,送入到金字塔目标计数网络模型中,得到预测的密度分布图,对重叠部分的密度值取平均得到最终的输出密度图,从而求得目标数目。
为了说明本发明上述方案的性能,还进行了测试与评估。
在Shanghaitech-B和TRANCOS数据集上分别训练好计数网络模型后,下面要对网络的性能进行评估,具体方法如下:在测试数据集上,对于每张测试图像,以10像素为步长进行滑窗,生成与输入图像块相同大小的图像,送入到训练好的计数网络模型中,得到预测的密度分布图,最后对重叠部分的密度值取平均得到最终的输出密度图。将测试数据集的真实密度图与预测密度图进行对比,得到评估结果。图5和图6给出了预测结果示意图。图5和图6中,第一列为输入图像,第二列为密度分布真值图像,第三列为本发明网络模型预测的密度图,密度图下方的数字表示目标数量。
对于Shanghaitech-B数据集,采用平均绝对误差(MAE)和均方根误差(RMSE)作为评价指标,对应公式如下:
上述式子中,N表示测试样本数量,Ck为模型预测的第k张图片中包含的目标数量,是对应的真实样本数量。
表1为本发明在Shanghaitech-B数据集上与现有方法的对比结果。可以看出,本发明具有很高的人群计数准确率。
表1对比结果
对于TRANCOS数据集,采用网格平均绝对误差(Grid Average Mean AbsoluteError,GAME)作为评价指标。GAME指标同时考虑了计数的精度和对目标分布定位的准确度。对于指定的尺度L,GAME(L)将图片划分成4L个非重叠区域,然后计算每个区域的平均绝对误差,具体公式如下:
上述式子中,N表示测试样本数量,为模型预测的第k张图片中个第l个区域包含的目标数量,是对应的真实样本数量。特别地,GAME(0)与MAE评价标准等价。
表2为本发明在TRANCOS数据集上与现有方法的对比结果。可以看出,本发明具有很高的车辆计数准确率。
表2对比结果
本发明实施例上述方案中,针对实际场景复杂多变的问题,具有以下优势:首先,通过鲁棒性增强模块使网络学习到的特征对目标形变更具有鲁棒性,同时降低模型的计算复杂度;然后,采用金字塔分层计数模块进行密度估计,充分利用卷积神经网络分层特征中包含的多尺度信息,在实现准确计数的同时显著提高了计算效率。总之,本发明基于卷积神经网络,实现了图像中的目标精确计数,可以适用于复杂场景下的目标计数任务,计算复杂度低,具有较高的实际应用价值。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例可以通过软件实现,也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解,上述实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。

Claims (6)

1.一种基于卷积神经网络的图像目标计数方法,其特征在于,包括:
基于卷积神经网络建立金字塔目标计数网络;
利用人工数据标注,在训练图像上建立感兴趣目标的密度分布真值图像;
通过随机裁剪和水平翻转方式对训练数据集中的训练图像以及相应的密度分布真值图像进行计数数据增强;
将计数数据增强后的训练图像与目标密度分布真值图像作为金字塔目标计数网络的输入,通过不断迭代优化完成金字塔目标计数网络训练,生成金字塔目标计数网络模型;
当新图像输入时,通过滑窗方式生成与输入图像块相同大小的图像,送入到金字塔目标计数网络模型中,得到预测的密度分布图,对重叠部分的密度值取平均得到最终的输出密度图,从而求得目标数目。
2.根据权利要求1所述的一种基于卷积神经网络的图像目标计数方法,其特征在于,所建立的金字塔目标计数网络包括:特征提取模块、鲁棒性增强模块和密度估计模块;其中:
所述特征提取模块,采用了全卷积网络提取图像特征,包括五层常规卷积层和两层空洞卷积层;所述空洞卷积层是指在标准卷积的卷积核中注入空洞,从而增加卷积核处理数据时各值的间距;
所述鲁棒性增强模块,采用了空间金字塔池化方式,在特征提取模块输出的特征图上,通过N1×N1、N2×N2、N3×N3与N4×N4四个不同尺度的空间池化,构造不同尺寸的子块,从而获取图像在不同分辨率上的空间信息;
所述密度估计模块,采用了一种金字塔分层计数模块,在不同尺度上学习互补信息,从而生成目标分布密度图。
3.根据权利要求2所述的一种基于卷积神经网络的图像目标计数方法,其特征在于,所述金字塔分层计数模块所进行的目标密度估计是在经过鲁棒性增强后的特征提取模块各层特征图上分别进行的,最终输出的密度图由各层的输出结果相加得到;其中,密度估计采用两层全连接层来建立从图像特征到密度值的非线性映射。
4.根据权利要求1所述的一种基于卷积神经网络的图像目标计数方法,其特征在于,所述利用人工数据标注,在训练图像上建立感兴趣目标的密度分布真值图像包括:
在训练图像上利用人工标注的目标中心点图进行高斯滤波得到感兴趣目标的密度分布真值图像;
其中,将标注的目标中心点图的目标中心位置作为高斯核的中心,通过高斯滤波生成密度分布图:设P为标注的图像中目标几何中心点的集合,用D表示图像所对应的密度分布图,则位于(i,j)处像素的密度值D(i,j)通过如下公式计算:
上式中,是(i,j)处像素的二维高斯分布值,高斯分布的均值点位于标记位置(m,n)处;σ2I2×2为协方差矩阵。
5.根据权利要求1所述的一种基于卷积神经网络的图像目标计数方法,其特征在于,所述通过随机裁剪和水平翻转方式对训练数据集中的训练图像以及相应的密度分布真值图像进行计数数据增强的步骤包括:
对输入的训练图像的尺寸进行归一化;
从归一化后的训练图像中随机裁剪相同大小的图像块作为新的训练图像;
对新的训练图像进行水平翻转,获得一系列新的训练图像;
利用上述方式对密度分布真值图像做相同处理,然后通过归一化使缩放后密度分布真值图像中目标数量保持不变。
6.根据权利要求1所述的一种基于卷积神经网络的图像目标计数方法,其特征在于,对金字塔目标计数网络进行训练时,将计数数据增强后的训练图像与目标密度分布真值图像作为训练样本,采用预测的密度图和真实密度图之间的欧式距离作为损失函数,通过随机梯度下降法训练,在每一次优化迭代中更新网络的模型参数,损失函数L(Θ)定义如下:
上式中,Θ表示模型学习到的网络参数,N为训练样本数量,F(Xk;Θ)为金字塔目标计数网络预测的密度图,Dk表示第k个训练样本Xk的真实密度图。
CN201810564162.6A 2018-06-04 2018-06-04 基于卷积神经网络的图像目标计数方法 Pending CN108921822A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810564162.6A CN108921822A (zh) 2018-06-04 2018-06-04 基于卷积神经网络的图像目标计数方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810564162.6A CN108921822A (zh) 2018-06-04 2018-06-04 基于卷积神经网络的图像目标计数方法

Publications (1)

Publication Number Publication Date
CN108921822A true CN108921822A (zh) 2018-11-30

Family

ID=64419585

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810564162.6A Pending CN108921822A (zh) 2018-06-04 2018-06-04 基于卷积神经网络的图像目标计数方法

Country Status (1)

Country Link
CN (1) CN108921822A (zh)

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109584142A (zh) * 2018-12-05 2019-04-05 网易传媒科技(北京)有限公司 图像增强***和方法、训练方法、介质以及电子设备
CN109741301A (zh) * 2018-12-19 2019-05-10 北京理工大学 一种更快的基于深度学习的密集目标计数方法
CN109829923A (zh) * 2018-12-24 2019-05-31 五邑大学 一种基于深度神经网络的基站天线下倾角测量***及方法
CN110009027A (zh) * 2019-03-28 2019-07-12 腾讯科技(深圳)有限公司 图像的比对方法、装置、存储介质及电子装置
CN110009611A (zh) * 2019-03-27 2019-07-12 中南民族大学 一种面向图像序列的视觉目标动态计数方法及***
CN110110666A (zh) * 2019-05-08 2019-08-09 北京字节跳动网络技术有限公司 目标检测方法和装置
CN110176023A (zh) * 2019-04-29 2019-08-27 同济大学 一种基于金字塔结构的光流估计方法
CN110263732A (zh) * 2019-06-24 2019-09-20 京东方科技集团股份有限公司 多尺度目标检测方法及装置
CN110705344A (zh) * 2019-08-21 2020-01-17 中山大学 一种基于深度学习的人群计数模型及其实现方法
CN110765833A (zh) * 2019-08-19 2020-02-07 中云智慧(北京)科技有限公司 一种基于深度学习的人群密度估计方法
CN110991225A (zh) * 2019-10-22 2020-04-10 同济大学 基于多列卷积神经网络的人群计数与密度估计方法及装置
CN110991317A (zh) * 2019-11-29 2020-04-10 中山大学 一种基于多尺度透视感知型网络的人群计数方法
CN111242036A (zh) * 2020-01-14 2020-06-05 西安建筑科技大学 一种基于编码-解码结构多尺度卷积神经网络的人群计数方法
CN111259833A (zh) * 2020-01-20 2020-06-09 青岛大学 一种基于交通图像的车辆计数方法
CN111429466A (zh) * 2020-03-19 2020-07-17 北京航空航天大学 一种基于多尺度信息融合网络的空基人群计数与密度估计方法
CN111583655A (zh) * 2020-05-29 2020-08-25 苏州大学 一种车流量检测方法、装置、设备及介质
CN111709908A (zh) * 2020-05-09 2020-09-25 上海健康医学院 一种基于深度学习的氦泡分割计数方法
CN111738136A (zh) * 2020-06-19 2020-10-02 新希望六和股份有限公司 显微对象的数量确定方法、装置、计算机设备和存储介质
CN111914765A (zh) * 2020-08-05 2020-11-10 杭州像素元科技有限公司 一种服务区环境舒适度检测方法、设备及可读存储介质
CN113011329A (zh) * 2021-03-19 2021-06-22 陕西科技大学 一种基于多尺度特征金字塔网络及密集人群计数方法
CN113284164A (zh) * 2021-05-19 2021-08-20 中国农业大学 虾群自动计数方法、装置、电子设备及存储介质
CN113343790A (zh) * 2021-05-21 2021-09-03 中车唐山机车车辆有限公司 一种交通枢纽的客流统计方法、装置及存储介质
CN113920391A (zh) * 2021-09-17 2022-01-11 北京理工大学 一种基于生成尺度自适应真值图的目标计数方法
US11393182B2 (en) 2020-05-29 2022-07-19 X Development Llc Data band selection using machine learning
CN115619776A (zh) * 2022-12-02 2023-01-17 湖北凯乐仕通达科技有限公司 基于深度学习的物品计数方法和装置
US11606507B1 (en) 2020-08-28 2023-03-14 X Development Llc Automated lens adjustment for hyperspectral imaging
US11651602B1 (en) 2020-09-30 2023-05-16 X Development Llc Machine learning classification based on separate processing of multiple views
US11995842B2 (en) 2021-07-22 2024-05-28 X Development Llc Segmentation to improve chemical analysis
US12033329B2 (en) 2021-07-22 2024-07-09 X Development Llc Sample segmentation

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106650913A (zh) * 2016-12-31 2017-05-10 中国科学技术大学 一种基于深度卷积神经网络的车流密度估计方法
CN107301387A (zh) * 2017-06-16 2017-10-27 华南理工大学 一种基于深度学习的图像高密度人群计数方法
CN107679477A (zh) * 2017-09-27 2018-02-09 深圳市未来媒体技术研究院 基于空洞卷积神经网络的人脸深度和表面法向量预测方法
CN107944327A (zh) * 2016-10-10 2018-04-20 杭州海康威视数字技术股份有限公司 一种人数统计方法及装置
CN107967451A (zh) * 2017-11-23 2018-04-27 常州大学 一种利用多尺度多任务卷积神经网络对静止图像进行人群计数的方法
TWI624805B (zh) * 2017-03-27 2018-05-21 晶睿通訊股份有限公司 用來呈現路徑分佈特性的物件統計方法及其影像處理裝置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107944327A (zh) * 2016-10-10 2018-04-20 杭州海康威视数字技术股份有限公司 一种人数统计方法及装置
CN106650913A (zh) * 2016-12-31 2017-05-10 中国科学技术大学 一种基于深度卷积神经网络的车流密度估计方法
TWI624805B (zh) * 2017-03-27 2018-05-21 晶睿通訊股份有限公司 用來呈現路徑分佈特性的物件統計方法及其影像處理裝置
CN107301387A (zh) * 2017-06-16 2017-10-27 华南理工大学 一种基于深度学习的图像高密度人群计数方法
CN107679477A (zh) * 2017-09-27 2018-02-09 深圳市未来媒体技术研究院 基于空洞卷积神经网络的人脸深度和表面法向量预测方法
CN107967451A (zh) * 2017-11-23 2018-04-27 常州大学 一种利用多尺度多任务卷积神经网络对静止图像进行人群计数的方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
SAIHUI HOU等: "DualNet: Learn Complementary Features for Image Recognition", 《CONFERENCE: 2017 IEEE INTERNATIONAL CONFERENCE ON COMPUTER VISION (ICCV)》 *
VICTOR LEMPITSKY等: "Learning To Count Objects in Images", 《INFORMATION PROCESSING SYSTEMS 2010》 *
YUHONG LI等: "CSRNet: Dilated Convolutional Neural Networks for Understanding the Highly Congested Scenes", 《ARXIV》 *
时增林等: "基于序的空间金字塔池化网络的人群计数方法", 《自动化学报》 *

Cited By (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109584142A (zh) * 2018-12-05 2019-04-05 网易传媒科技(北京)有限公司 图像增强***和方法、训练方法、介质以及电子设备
CN109741301A (zh) * 2018-12-19 2019-05-10 北京理工大学 一种更快的基于深度学习的密集目标计数方法
CN109829923A (zh) * 2018-12-24 2019-05-31 五邑大学 一种基于深度神经网络的基站天线下倾角测量***及方法
CN110009611A (zh) * 2019-03-27 2019-07-12 中南民族大学 一种面向图像序列的视觉目标动态计数方法及***
CN110009611B (zh) * 2019-03-27 2021-05-14 中南民族大学 一种面向图像序列的视觉目标动态计数方法及***
CN110009027A (zh) * 2019-03-28 2019-07-12 腾讯科技(深圳)有限公司 图像的比对方法、装置、存储介质及电子装置
CN110009027B (zh) * 2019-03-28 2022-07-29 腾讯科技(深圳)有限公司 图像的比对方法、装置、存储介质及电子装置
CN110176023A (zh) * 2019-04-29 2019-08-27 同济大学 一种基于金字塔结构的光流估计方法
CN110176023B (zh) * 2019-04-29 2023-06-02 同济大学 一种基于金字塔结构的光流估计方法
CN110110666A (zh) * 2019-05-08 2019-08-09 北京字节跳动网络技术有限公司 目标检测方法和装置
CN110263732A (zh) * 2019-06-24 2019-09-20 京东方科技集团股份有限公司 多尺度目标检测方法及装置
CN110765833A (zh) * 2019-08-19 2020-02-07 中云智慧(北京)科技有限公司 一种基于深度学习的人群密度估计方法
CN110705344A (zh) * 2019-08-21 2020-01-17 中山大学 一种基于深度学习的人群计数模型及其实现方法
CN110705344B (zh) * 2019-08-21 2023-03-28 中山大学 一种基于深度学习的人群计数模型及其实现方法
CN110991225A (zh) * 2019-10-22 2020-04-10 同济大学 基于多列卷积神经网络的人群计数与密度估计方法及装置
CN110991317A (zh) * 2019-11-29 2020-04-10 中山大学 一种基于多尺度透视感知型网络的人群计数方法
CN110991317B (zh) * 2019-11-29 2023-05-16 中山大学 一种基于多尺度透视感知型网络的人群计数方法
CN111242036A (zh) * 2020-01-14 2020-06-05 西安建筑科技大学 一种基于编码-解码结构多尺度卷积神经网络的人群计数方法
CN111242036B (zh) * 2020-01-14 2023-05-09 西安建筑科技大学 一种基于编码-解码结构多尺度卷积神经网络的人群计数方法
CN111259833A (zh) * 2020-01-20 2020-06-09 青岛大学 一种基于交通图像的车辆计数方法
CN111429466A (zh) * 2020-03-19 2020-07-17 北京航空航天大学 一种基于多尺度信息融合网络的空基人群计数与密度估计方法
CN111709908B (zh) * 2020-05-09 2024-03-26 上海健康医学院 一种基于深度学习的氦泡分割计数方法
CN111709908A (zh) * 2020-05-09 2020-09-25 上海健康医学院 一种基于深度学习的氦泡分割计数方法
US11620804B2 (en) 2020-05-29 2023-04-04 X Development Llc Data band selection using machine learning
CN111583655B (zh) * 2020-05-29 2021-12-24 苏州大学 一种车流量检测方法、装置、设备及介质
CN111583655A (zh) * 2020-05-29 2020-08-25 苏州大学 一种车流量检测方法、装置、设备及介质
US11393182B2 (en) 2020-05-29 2022-07-19 X Development Llc Data band selection using machine learning
CN111738136A (zh) * 2020-06-19 2020-10-02 新希望六和股份有限公司 显微对象的数量确定方法、装置、计算机设备和存储介质
CN111914765B (zh) * 2020-08-05 2022-07-12 杭州像素元科技有限公司 一种服务区环境舒适度检测方法、设备及可读存储介质
CN111914765A (zh) * 2020-08-05 2020-11-10 杭州像素元科技有限公司 一种服务区环境舒适度检测方法、设备及可读存储介质
US11606507B1 (en) 2020-08-28 2023-03-14 X Development Llc Automated lens adjustment for hyperspectral imaging
US11651602B1 (en) 2020-09-30 2023-05-16 X Development Llc Machine learning classification based on separate processing of multiple views
US12033405B1 (en) 2020-09-30 2024-07-09 X Development Llc Machine learning classification based on separate processing of multiple views
CN113011329B (zh) * 2021-03-19 2024-03-12 陕西科技大学 一种基于多尺度特征金字塔网络及密集人群计数方法
CN113011329A (zh) * 2021-03-19 2021-06-22 陕西科技大学 一种基于多尺度特征金字塔网络及密集人群计数方法
CN113284164A (zh) * 2021-05-19 2021-08-20 中国农业大学 虾群自动计数方法、装置、电子设备及存储介质
CN113343790A (zh) * 2021-05-21 2021-09-03 中车唐山机车车辆有限公司 一种交通枢纽的客流统计方法、装置及存储介质
US11995842B2 (en) 2021-07-22 2024-05-28 X Development Llc Segmentation to improve chemical analysis
US12033329B2 (en) 2021-07-22 2024-07-09 X Development Llc Sample segmentation
CN113920391A (zh) * 2021-09-17 2022-01-11 北京理工大学 一种基于生成尺度自适应真值图的目标计数方法
CN113920391B (zh) * 2021-09-17 2024-06-25 北京理工大学 一种基于生成尺度自适应真值图的目标计数方法
CN115619776A (zh) * 2022-12-02 2023-01-17 湖北凯乐仕通达科技有限公司 基于深度学习的物品计数方法和装置

Similar Documents

Publication Publication Date Title
CN108921822A (zh) 基于卷积神经网络的图像目标计数方法
CN109344736B (zh) 一种基于联合学习的静态图像人群计数方法
CN106127204B (zh) 一种全卷积神经网络的多方向水表读数区域检测算法
CN108510012A (zh) 一种基于多尺度特征图的目标快速检测方法
Xue et al. Remote sensing scene classification based on multi-structure deep features fusion
CN108171701B (zh) 基于u网络和对抗学习的显著性检测方法
CN108986050A (zh) 一种基于多分支卷积神经网络的图像和视频增强方法
CN108710875A (zh) 一种基于深度学习的航拍公路车辆计数方法及装置
CN107967451A (zh) 一种利用多尺度多任务卷积神经网络对静止图像进行人群计数的方法
CN107330364A (zh) 一种基于cGAN网络的人群计数方法及***
CN106651830A (zh) 一种基于并行卷积神经网络的图像质量测试方法
CN107463919A (zh) 一种基于深度3d卷积神经网络进行面部表情识别的方法
CN107729819A (zh) 一种基于稀疏全卷积神经网络的人脸标注方法
CN110263849A (zh) 一种基于多尺度注意力机制的人群密度估计方法
CN106920243A (zh) 改进的全卷积神经网络的陶瓷材质件序列图像分割方法
CN109165682A (zh) 一种融合深度特征和显著性特征的遥感图像场景分类方法
CN104992223A (zh) 基于深度学习的密集人数估计方法
CN108491797A (zh) 一种基于大数据的车辆图像精确检索方法
CN106203331A (zh) 一种基于卷积神经网络的人群密度估算方法
CN108960404B (zh) 一种基于图像的人群计数方法及设备
CN106991666B (zh) 一种适用于多尺寸图片信息的病害图像识别方法
CN109948593A (zh) 基于结合全局密度特征的mcnn人群计数方法
CN105678231A (zh) 一种基于稀疏编码和神经网络的行人图片检测方法
CN106960176B (zh) 一种基于超限学习机和颜色特征融合的行人性别识别方法
CN109785344A (zh) 基于特征重标定的双通路残差网络的遥感图像分割方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20181130

RJ01 Rejection of invention patent application after publication