CN107301376A - 一种基于深度学习多层刺激的行人检测方法 - Google Patents
一种基于深度学习多层刺激的行人检测方法 Download PDFInfo
- Publication number
- CN107301376A CN107301376A CN201710385952.3A CN201710385952A CN107301376A CN 107301376 A CN107301376 A CN 107301376A CN 201710385952 A CN201710385952 A CN 201710385952A CN 107301376 A CN107301376 A CN 107301376A
- Authority
- CN
- China
- Prior art keywords
- pedestrian
- msub
- mrow
- multilayer
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Human Computer Interaction (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Psychiatry (AREA)
- Social Psychology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明公开了一种基于深度学习多层刺激的行人检测方法,用于在给定视频监控和需检测的目标后,标出目标在视频里出现的位置。具体包括如下步骤:获取用于训练目标检测模型的行人数据集,并定义算法目标;对行人目标的位置偏差和表观语义进行建模;根据步骤S2中的建模结果建立行人多层刺激网络模型;使用所述检测模型检测监控图像中的行人位置。本发明适用于真实视频监控图像中的行人检测,面对各类复杂情况具有较佳的效果和鲁棒性。
Description
技术领域
本发明属于计算机视觉领域,特别地涉及一种基于深度学习多层刺激的行人检测方法。
背景技术
20世纪末以来,随着计算机视觉的发展,智能视频处理技术得到广泛的关注和研究。行人检测是其中一项重要和具有挑战性的任务,其目标是准确检测出视频监控图像里行人的位置。该问题在视频监控和智能机器人等领域具有很高的应用价值,是大量高级视觉任务的基础。但同样,该问题具有较大的挑战性,一是如何表达目标区域信息;二是如何将候选区域的提取与目标分类统一建模优化,这些挑战对相应算法的性能和鲁棒性提出了较高的要求。
一般行人检测算法分为三个部分:1、找出输入图像中包含目标的候选区域。2、基于候选区域手工提取目标特征。3、对特征使用分类算法实现检测任务。该种方法主要存在以下几个问题:1)它基于传统的视觉特征,这些视觉特征只能表达较低层的视觉信息,但行人检测任务需要模型具备高层抽象的语义理解能力;2)候选区域的提取和特征的分类没有端到端学习优化;3)基于深度学习提取的特征没有经过多层刺激组合,目标特征不够抽象丰富。
发明内容
为解决上述问题,本发明的目的在于提供一种基于深度学习多层刺激的行人检测方法,用于检测给定监控图像里的行人位置。该方法基于深度神经网络,利用多层刺激的深度视觉特征表征目标区域信息,采用Faster R-CNN框架建模行人检测,能够更好地适应真实视频监控场景中的复杂情况。
为实现上述目的,本发明的技术方案为:
一种基于深度学习多层刺激的行人检测方法,包括以下步骤:
S1、获取用于训练目标检测模型的行人数据集,并定义算法目标;
S2、对行人目标的位置偏差和表观语义进行建模;
S3、根据步骤S2中的建模结果建立行人多层刺激网络模型;
S4、使用所述检测模型检测监控图像中的行人位置。
进一步的,步骤S1中,所述的用于训练目标检测模型的行人数据集,包括行人图像Xtrain,人工标注的行人位置B;
定义算法目标为:检测一幅监控图像X中的行人位置P。
进一步的,步骤S2中,对行人目标的位置偏差和表观语义进行建模具体包括:
S21、根据行人数据集Xtrain和行人位置P建模位置偏差:
其中,x,y是行人框标签的中点坐标,w,h是行人框标签的宽度与长度,xa,ya是行人候选框的坐标,wa,ha是行人候选框的宽度与长度;tx为行人框的x坐标相对于标注框x坐标的偏差对应标注框宽度的比例,ty为行人框的y坐标相对于标注框y坐标的偏差对应标注框长度的比例,tw为行人框的宽度相对于标注框宽度的比例,th为行人框的长度相对于标注框长度的比例;
S22、根据行人数据集Xtrain和行人位置P建模表观语义:
s=<w,d>
其中s表示特征d在投影向量w上的投影值,w是行人权重投影向量,d是行人特征描述子,<.,.>是内积运算符,p(C=k|d)是softmax函数,表示属于第k类的概率值;sj为特征d在第j个投影向量w上的投影值;C为取值个数为k的离散随机变量;j为全部投影向量w的第j个w的索引。
进一步的,步骤S3中,根据步骤S2中的建模结果建立行人多层刺激网络模型具体包括:
S31、建立多层刺激卷积神经网络,神经网络的输入为一幅监控图像X和行人标注框B,输出为对应行人候选框的概率值p,以及X中的行人位置偏差O;神经网络的结构表示为映射X→(p,O);
S32、子映射X→p使用软最大Softmax损失函数,表示为
Lcls(X,Y;θ)=-∑jYjlogp(C|d) 公式(3)
其中Y是二值向量,如果属于第k类,对应值为1,其余为0;Lcls(X,Y;θ)表示整个训练数据集的softmax损失函数;
S33、子映射X→O使用欧几里得损失函数,表示为
Lloc(t,v)=∑ismooth(ti,vi)
其中ti是行人位置偏差标签,vi是行人位置偏差预测值;i表示第i个训练样本;
S34、整个多层刺激神经网络的损失函数为
L=Lcls+Lloc 公式(5)
使用随机梯度下降和反向传播算法在损失函数L下训练整个神经网络。
进一步的,步骤S4中,检测监控图像中的行人位置包括:将待检测的监控图像X输入训练好的神经网络,依据其输出的候选框概率值判断是否为行人,最后根据预测的位置偏差O校正得到行人位置P。
本发明应用于视频监控场景的行人检测方法,相比于现有的行人检测方法,具有以下有益效果:
首先,本发明的行人检测方法基于深度卷积神经网络建立模型。本发明将候选区域的产生和特征的分类统一在同一个网络框架里学习优化,提高了方法的最终效果。
其次,本发明提出的多层刺激算法可以更加丰富特征抽象能力,同时该算法学习出的特征使得分类器学习出更加鲁棒的分类规则。
本发明应用于视频监控场景的行人检测方法,在智能视频分析***里具有良好的应用价值,能够有效提高行人检测的效率和准确度。例如,在交通视频监控里,本发明的行人检测方法可以快速和准确地检测所有行人位置,为之后的行人搜索任务提供数据,极大释放了人力资源。
附图说明
图1为本发明的应用于视频监控场景的行人检测方法的流程示意图;
图2为本发明整个多层刺激神经网络的损失函数示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
相反,本发明涵盖任何由权利要求定义的在本发明的精髓和范围上做的替代、修改、等效方法以及方案。进一步,为了使公众对本发明有更好的了解,在下文对本发明的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明。
参考图1,在本发明的较佳实施例中,一种基于深度学习多层刺激的行人检测方法,包括以下步骤:
首先,获取用于训练目标检测模型的行人数据集,包括行人图像Xtrain,人工标注的行人位置B;
定义算法目标为:检测一幅监控图像X中的行人位置P。
其次,对行人目标的位置偏差和表观语义进行建模具体包括:
第一步,根据行人数据集Xtrain和行人位置P建模位置偏差:
其中,x,y是行人框标签的中点坐标,w,h是行人框标签的宽度与长度,xa,ya是行人候选框的坐标,wa,ha是行人候选框的宽度与长度;tx为行人框的x坐标相对于标注框x坐标的偏差对应标注框宽度的比例,ty为行人框的y坐标相对于标注框y坐标的偏差对应标注框长度的比例,tw为行人框的宽度相对于标注框宽度的比例,th为行人框的长度相对于标注框长度的比例;
第二步,根据行人数据集Xtrain和行人位置P建模表观语义:
s=<w,d>
其中s表示特征d在投影向量w上的投影值,w是行人权重投影向量,d是行人特征描述子,<.,.>是内积运算符,p(C=k|d)是softmax函数,表示属于第k类的概率值;sj为特征d在第j个投影向量w上的投影值;C为取值个数为k的离散随机变量;j为全部投影向量w的第j个w的索引。
之后,根据上诉建模结果预训练广告牌目标的检测模型。具体包括:
第一步,建立多层刺激卷积神经网络,神经网络的输入为一幅监控图像X和行人标注框B,输出为对应行人候选框的概率值p,以及X中的行人位置偏差O;从而,神经网络的结构可以表示为映射X→(p,O);
第二步,子映射X→p使用软最大(Softmax)损失函数,表示为
Lcls(X,Y;θ)=-∑jYjlogp(C|d) 公式(3)
其中Y是二值向量,如果属于第k类,对应值为1,其余为0;Lcls(X,Y;θ)表示整个训练数据集的softmax损失函数;
第三步,子映射X→O使用欧几里得损失函数,表示为
Lloc(t,v)=∑ismooth(ti,vi)
其中ti是行人位置偏差标签,vi是行人位置偏差预测值,i表示第i个训练样本。
第四步,参考图2,整个多层刺激神经网络的损失函数为
L=Lcls+Lloc 公式(5)
使用随机梯度下降和反向传播算法在损失函数L下训练整个神经网络。
最后,使用训练好的检测模型对监控图像中的行人进行检测。具体包括:将预处理好的图像放入多层刺激检测框架上计算。多层刺激检测框架用3个RPN网络来提取候选框,每个RPN网络利用的特征信息不同,从而得到的候选框大小及尺度也不一样。先得到每个RPN网络提取的候选框,按照各自置信度大小过滤得到300个候选区域。然后将3个RPN网络中的候选区域合并,得到900个候选区域。接着按照分类置信度从大到小排列,过滤得到最终的300个目标候选区域。依据其输出的候选框分类概率值是否大于给定阈值过滤候选框,同时采用非极大值抑制算法来消除交叉重复的检测框,最后根据预测的位置偏差O校正得到行人位置P。
上述实施例中,本发明的行人检测方法首先对行人目标的位置偏差和表观语义进行建模。在此基础上,将原问题转化为多任务学习问题,并基于深度神经网络建立行人检测模型。最后,使用训练好的检测模型检测监控图像中的行人位置。
通过以上技术方案,本发明实施例基于深度学习技术发展了一种基于深度学习多层刺激的行人检测算法。本发明可以同时有效建模目标的位置偏差和表观语义信息,从而检测准确的行人位置。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (5)
1.一种基于深度学习多层刺激的行人检测方法,其特征在于,包括以下步骤:
S1、获取用于训练目标检测模型的行人数据集,并定义算法目标;
S2、对行人目标的位置偏差和表观语义进行建模;
S3、根据步骤S2中的建模结果建立行人多层刺激网络模型;
S4、使用所述检测模型检测监控图像中的行人位置。
2.如权利要求1所述的基于深度学习多层刺激的行人检测方法,其特征在于,步骤S1中,所述的用于训练目标检测模型的行人数据集,包括行人图像Xtrain,人工标注的行人位置B;
定义算法目标为:检测一幅监控图像X中的行人位置P。
3.如权利要求2所述的基于深度学习多层刺激的行人检测方法,其特征在于,步骤S2中,对行人目标的位置偏差和表观语义进行建模具体包括:
S21、根据行人数据集Xtrain和行人位置P建模位置偏差:
<mfenced open = "" close = "">
<mtable>
<mtr>
<mtd>
<mrow>
<msub>
<mi>t</mi>
<mi>x</mi>
</msub>
<mo>=</mo>
<mfrac>
<mrow>
<mi>x</mi>
<mo>-</mo>
<msub>
<mi>x</mi>
<mi>a</mi>
</msub>
</mrow>
<msub>
<mi>w</mi>
<mi>a</mi>
</msub>
</mfrac>
<mo>,</mo>
</mrow>
</mtd>
<mtd>
<mrow>
<msub>
<mi>t</mi>
<mi>y</mi>
</msub>
<mo>=</mo>
<mfrac>
<mrow>
<mi>y</mi>
<mo>-</mo>
<msub>
<mi>y</mi>
<mi>a</mi>
</msub>
</mrow>
<msub>
<mi>h</mi>
<mi>a</mi>
</msub>
</mfrac>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
其中,x,y是行人框标签的中点坐标,w,h是行人框标签的宽度与长度,xa,ya是行人候选框的坐标,wa,ha是行人候选框的宽度与长度;tx为行人框的x坐标相对于标注框x坐标的偏差对应标注框宽度的比例,ty为行人框的y坐标相对于标注框y坐标的偏差对应标注框长度的比例,tw为行人框的宽度相对于标注框宽度的比例,th为行人框的长度相对于标注框长度的比例;
S22、根据行人数据集Xtrain和行人位置P建模表观语义:
s=<w,d>
其中s表示特征d在投影向量w上的投影值,w是行人权重投影向量,d是行人特征描述子,<.,.>是内积运算符,p(C=k|d)是softmax函数,表示属于第k类的概率值;sj为特征d在第j个投影向量w上的投影值;C为取值个数为k的离散随机变量;j为全部投影向量w的第j个w的索引。
4.如权利要求3所述的基于深度学习多层刺激的行人检测方法,其特征在于,步骤S3中,根据步骤S2中的建模结果建立行人多层刺激网络模型具体包括:
S31、建立多层刺激卷积神经网络,神经网络的输入为一幅监控图像X和行人标注框B,输出为对应行人候选框的概率值p,以及X中的行人位置偏差O;神经网络的结构表示为映射X→(p,O);
S32、子映射X→p使用软最大Softmax损失函数,表示为
<mrow>
<mi>p</mi>
<mrow>
<mo>(</mo>
<mi>C</mi>
<mo>=</mo>
<mi>k</mi>
<mo>|</mo>
<mi>d</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<msup>
<mi>e</mi>
<msub>
<mi>s</mi>
<mi>k</mi>
</msub>
</msup>
<mo>/</mo>
<msub>
<mi>&Sigma;</mi>
<mi>j</mi>
</msub>
<msup>
<mi>e</mi>
<msub>
<mi>s</mi>
<mi>j</mi>
</msub>
</msup>
</mrow>
Lcls(X,Y;θ)=-∑jYjlogp(C|d) 公式(3)
其中Y是二值向量,如果属于第k类,对应值为1,其余为0;Lcls(X,Y;θ)表示整个训练数据集的softmax损失函数;
S33、子映射X→O使用欧几里得损失函数,表示为
Lloc(t,v)=∑ismooth(ti,vi)
其中ti是行人位置偏差标签,vi是行人位置偏差预测值;i表示第i个训练样本;
S34、整个多层刺激神经网络的损失函数为
L=Lcls+Lloc 公式(5)
使用随机梯度下降和反向传播算法在损失函数L下训练整个神经网络。
5.如权利要求4所述的基于深度学习多层刺激的行人检测方法,其特征在于,步骤S4中,检测监控图像中的行人位置包括:将待检测的监控图像X输入训练好的神经网络,依据其输出的候选框概率值判断是否为行人,最后根据预测的位置偏差O校正得到行人位置P。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710385952.3A CN107301376B (zh) | 2017-05-26 | 2017-05-26 | 一种基于深度学习多层刺激的行人检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710385952.3A CN107301376B (zh) | 2017-05-26 | 2017-05-26 | 一种基于深度学习多层刺激的行人检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107301376A true CN107301376A (zh) | 2017-10-27 |
CN107301376B CN107301376B (zh) | 2021-04-13 |
Family
ID=60138099
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710385952.3A Active CN107301376B (zh) | 2017-05-26 | 2017-05-26 | 一种基于深度学习多层刺激的行人检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107301376B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108446662A (zh) * | 2018-04-02 | 2018-08-24 | 电子科技大学 | 一种基于语义分割信息的行人检测方法 |
CN108537117A (zh) * | 2018-03-06 | 2018-09-14 | 哈尔滨思派科技有限公司 | 一种基于深度学习的乘客检测方法和*** |
CN110163224A (zh) * | 2018-01-23 | 2019-08-23 | 天津大学 | 一种可在线学习的辅助数据标注方法 |
CN110969657A (zh) * | 2018-09-29 | 2020-04-07 | 杭州海康威视数字技术股份有限公司 | 一种枪球坐标关联方法、装置、电子设备及存储介质 |
CN111178267A (zh) * | 2019-12-30 | 2020-05-19 | 成都数之联科技有限公司 | 一种用于监测非法捕鱼的视频行为识别方法 |
CN111476089A (zh) * | 2020-03-04 | 2020-07-31 | 上海交通大学 | 一种图像中多模态信息融合的行人检测方法、***及终端 |
CN111523478A (zh) * | 2020-04-24 | 2020-08-11 | 中山大学 | 一种作用于目标检测***的行人图像检测方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016149881A1 (en) * | 2015-03-20 | 2016-09-29 | Intel Corporation | Object recogntion based on boosting binary convolutional neural network features |
CN106022237A (zh) * | 2016-05-13 | 2016-10-12 | 电子科技大学 | 一种端到端的卷积神经网络的行人检测方法 |
CN106250812A (zh) * | 2016-07-15 | 2016-12-21 | 汤平 | 一种基于快速r‑cnn深度神经网络的车型识别方法 |
WO2017062610A1 (en) * | 2015-10-06 | 2017-04-13 | Evolv Technologies, Inc. | Augmented machine decision making |
-
2017
- 2017-05-26 CN CN201710385952.3A patent/CN107301376B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016149881A1 (en) * | 2015-03-20 | 2016-09-29 | Intel Corporation | Object recogntion based on boosting binary convolutional neural network features |
WO2017062610A1 (en) * | 2015-10-06 | 2017-04-13 | Evolv Technologies, Inc. | Augmented machine decision making |
CN106022237A (zh) * | 2016-05-13 | 2016-10-12 | 电子科技大学 | 一种端到端的卷积神经网络的行人检测方法 |
CN106250812A (zh) * | 2016-07-15 | 2016-12-21 | 汤平 | 一种基于快速r‑cnn深度神经网络的车型识别方法 |
Non-Patent Citations (5)
Title |
---|
JIE LIU ET AL.: "Deep Convolutional Neural Networks for Pedestrian Detection with Skip Pooling", 《 2017 INTERNATIONAL JOINT CONFERENCE ON NEURAL NETWORKS》 * |
JIFENG DAI ET AL.: "R-FCN: Object Detection via Region-based Fully Convolutional Networks", 《ARXIV:1605.06409V2》 * |
ROSS GIRSHICK: "Fast R-CNN", 《ARXIV:1504.08083V2》 * |
ZHAOWEI CAI ET AL.: "A Unified Multi-scale Deep Convolutional Neural Network for Fast Object Detection", 《EUROPEAN CONFERENCE ON COMPUTER VISION》 * |
任少卿: "基于特征共享的高效物体检测", 《中国博士学位论文全文数据库 信息科技辑》 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110163224A (zh) * | 2018-01-23 | 2019-08-23 | 天津大学 | 一种可在线学习的辅助数据标注方法 |
CN110163224B (zh) * | 2018-01-23 | 2023-06-20 | 天津大学 | 一种可在线学习的辅助数据标注方法 |
CN108537117A (zh) * | 2018-03-06 | 2018-09-14 | 哈尔滨思派科技有限公司 | 一种基于深度学习的乘客检测方法和*** |
CN108446662A (zh) * | 2018-04-02 | 2018-08-24 | 电子科技大学 | 一种基于语义分割信息的行人检测方法 |
CN110969657A (zh) * | 2018-09-29 | 2020-04-07 | 杭州海康威视数字技术股份有限公司 | 一种枪球坐标关联方法、装置、电子设备及存储介质 |
CN110969657B (zh) * | 2018-09-29 | 2023-11-03 | 杭州海康威视数字技术股份有限公司 | 一种枪球坐标关联方法、装置、电子设备及存储介质 |
CN111178267A (zh) * | 2019-12-30 | 2020-05-19 | 成都数之联科技有限公司 | 一种用于监测非法捕鱼的视频行为识别方法 |
CN111476089A (zh) * | 2020-03-04 | 2020-07-31 | 上海交通大学 | 一种图像中多模态信息融合的行人检测方法、***及终端 |
CN111476089B (zh) * | 2020-03-04 | 2023-06-23 | 上海交通大学 | 一种图像中多模态信息融合的行人检测方法、***及终端 |
CN111523478A (zh) * | 2020-04-24 | 2020-08-11 | 中山大学 | 一种作用于目标检测***的行人图像检测方法 |
CN111523478B (zh) * | 2020-04-24 | 2023-04-28 | 中山大学 | 一种作用于目标检测***的行人图像检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107301376B (zh) | 2021-04-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107301376A (zh) | 一种基于深度学习多层刺激的行人检测方法 | |
CN109635694B (zh) | 一种行人检测方法、装置、设备及计算机可读存储介质 | |
CN109034044B (zh) | 一种基于融合卷积神经网络的行人再识别方法 | |
CN106447658B (zh) | 基于全局和局部卷积网络的显著性目标检测方法 | |
CN107862261A (zh) | 基于多尺度卷积神经网络的图像人群计数方法 | |
CN107506722A (zh) | 一种基于深度稀疏卷积神经网络人脸情感识别方法 | |
CN107123123A (zh) | 基于卷积神经网络的图像分割质量评价方法 | |
CN106682697A (zh) | 一种基于卷积神经网络的端到端物体检测方法 | |
CN107704877A (zh) | 一种基于深度学习的图像隐私感知方法 | |
CN106778835A (zh) | 融合场景信息和深度特征的遥感图像机场目标识别方法 | |
CN110111340A (zh) | 基于多路割的弱监督实例分割方法 | |
CN107341452A (zh) | 基于四元数时空卷积神经网络的人体行为识别方法 | |
CN105005774A (zh) | 一种基于卷积神经网络的人脸亲属关系识别方法及装置 | |
CN107633511A (zh) | 一种基于自编码神经网络的风机视觉检测*** | |
CN106529448A (zh) | 利用聚合通道特征进行多视角人脸检测的方法 | |
CN107134144A (zh) | 一种用于交通监控的车辆检测方法 | |
CN107945153A (zh) | 一种基于深度学习的路面裂缝检测方法 | |
CN106295506A (zh) | 一种基于集成卷积神经网络的年龄识别方法 | |
CN107506786A (zh) | 一种基于深度学习的属性分类识别方法 | |
CN105678278A (zh) | 一种基于单隐层神经网络的场景识别方法 | |
CN108280397A (zh) | 基于深度卷积神经网络的人体图像头发检测方法 | |
CN107766890A (zh) | 一种细粒度识别中判别性图块学习的改进方法 | |
CN104240256A (zh) | 一种基于层次化稀疏建模的图像显著性检测方法 | |
CN108256462A (zh) | 一种商场监控视频中的人数统计方法 | |
CN107808376A (zh) | 一种基于深度学习的举手检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |