CN108399362B - 一种快速行人检测方法及装置 - Google Patents
一种快速行人检测方法及装置 Download PDFInfo
- Publication number
- CN108399362B CN108399362B CN201810069322.XA CN201810069322A CN108399362B CN 108399362 B CN108399362 B CN 108399362B CN 201810069322 A CN201810069322 A CN 201810069322A CN 108399362 B CN108399362 B CN 108399362B
- Authority
- CN
- China
- Prior art keywords
- layer
- network
- target
- neural network
- convolutional neural
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24137—Distances to cluster centroïds
- G06F18/2414—Smoothing the distance, e.g. radial basis function networks [RBFN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
- G06V10/451—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
- G06V10/454—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/103—Static body considered as a whole, e.g. static pedestrian or occupant recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Human Computer Interaction (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Biodiversity & Conservation Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种快速行人检测方法及装置,所述方法包括如下步骤:步骤S1,构建可配置的基于卷积神经网络的深度模型,利用训练样本学习出构建的网络参数,获得用于测试过程的模型;步骤S2,输入测试样本,通过训练好的模型利用神经网络感知域的变化规律使用不同的中间层对不同尺度范围内的目标物体进行检测,预测出图像中目标物体的框图,本发明通过利用神经网络感知域的变化规律,使用不同的中间层对特定尺度范围内的目标物体进行检测,更好的适应了感知域与物体大小的关系,有效提高了检测结果。
Description
技术领域
本发明涉及行人检测技术领域,特别是涉及一种基于深度学习的面向嵌入式***的快速行人检测方法及装置。
背景技术
作为计算机视觉中目标检测的一部分,行人检测在现实世界的应用有着重要意义,随着图像采集技术的成熟与存储技术成本的下降,越来越多的摄像机被部署在公共场所,另一方面,随着自动驾驶、智能交通的推行,车载摄像头也产生了海量的视频资源。传统的人工筛选和处理,不仅效率低下,耗费大量人力物力,而且可能引入一些人为因素,导致一些偏差。近年来,深度学习在计算机视觉领域取得前所未有的突破,不仅效率远胜人力,准确度在很多领域也超过人类。因此,有效利用深度学习的方法进行行人检测的课题备受关注。
人是视频监控或自动驾驶中最主要的目标之一,而行人检测的首要任务就是识别人体的存在,并提供相应的标注信息。由于在现实世界中捕捉到的图像质量参差不齐,对于小物体、遮挡的物体的检测一直是行人检测的难点,另一方面,车载摄像头也经常会捕捉到一些模糊的图像,这样的图像中也存在大量类似行人却不是行人的物体。而具体到嵌入式***,由于识别能力强的大型神经网络模型通常难以有效率的运行在计算资源有限的嵌入式设备上,而对于嵌入式设备的应用需求又是实时的,因此兼顾检测准确率和效率是面向嵌入式***的快速行人检测的重中之重。
发明内容
为克服上述现有技术存在的不足,本发明之一目的在于提供一种快速行人检测方法及装置,通过利用神经网络感知域的变化规律,使用不同的中间层对特定尺度范围内的目标物体进行检测,更好的适应了感知域与物体大小的关系,有效提高了检测结果。
本发明之另一目的在于提供一种快速行人检测方法及装置,通过调整并训练VGG-16的网络得到适应嵌入式***要求的squeeze VGG-16网络,有效降低了网络模型的参数量并加快了计算效率。
本发明之再一目的在于提供一种快速行人检测方法及装置,通过去卷积的方法对特定网络层的特征图进行放大,增强了对小物体的检测,相比于传统图片放大的方法,几乎不增加显存和计算量。
本发明之又一目的在于提供一种快速行人检测方法及装置,通过使用目标对象1.5倍大小的区域作为背景语义特征增加到网络中,对于模糊物体和远距离小物体的检测,有着极佳的性能。
为达上述及其它目的,本发明提出一种快速行人检测方法,包括如下步骤:
步骤S1,构建可配置的基于卷积神经网络的深度模型,利用训练样本学习出构建的网络参数,获得用于测试过程的模型;
步骤S2,输入测试样本,通过训练好的模型利用神经网络感知域的变化规律使用不同的中间层对不同尺度范围内的目标物体进行检测,预测出图像中目标物体的框图。
优选地,步骤S1进一步包括:
构建可配置的基于卷积神经网络的深度模型;
输入训练样本;
初始化卷积神经网络及其参数,包括网络层中每层连接的权重和偏置;
采用前向传播算法和后向传播算法,利用训练样本学习出构建的网络参数,即用于测试过程的模型。
优选地,所述该深度模型包括多尺度的目标候选网络与目标检测网络,所述目标候选网络基于卷积神经网络不同层提出特征的差异性,在中间层分别生成对不同尺度目标物体的候选框图;所述目标检测网络在所述目标候选网络输出的候选框图的基础上进行精细化的分类和检测。
优选地,所述卷积神经网络由卷积层、降采样层、上采样层堆叠而成。所述卷积层是指对输入的图像或者特征图在二维空间上进行卷积运算,提取层次化特征;所述降采样层使用没有重叠的max-pooling操作,该操作用于提取形状和偏移不变的特征,同时减少特征图大小,提高计算效率;所述上采样层,是指对输入的特征图在二维空间上进行去卷积的操作,用以增大特征图的像素。
优选地,所述深度模型采用Squeeze VGG-16卷积神经网络作为骨干网络,所述Squeeze VGG-16卷积神经网络采用conv1-1层和紧随其后的12层Fire模块层为特征提取的网络结构。
优选地,所述目标候选网络在所述Squeeze VGG-16卷积神经网络基础上,根据卷积层特征,在Fire9、Fire12、conv6以及增加的pooling层,产生网络分支,以进行不同尺度检测到物体的候选框的回归。
优选地,所述目标检测网络在所述目标候选区域的基础上,将目标候选区域预设倍数大小的图片区域作为目标的背景语义信息,将Fire9层的特征图进行一次上采样,作为增强对小物体感知的信息,并将背景语义信息与上采样信息经过感兴趣区域的池化获得固定大小的特征,之后增加一层全连接层,进行类别和最终候选框的回归。
优选地,所述训练样本包括RGB图像数据和图像中行人区域的标注信息,实际训练用的图像数据是根据行人所在区域裁剪得到的小的patch。
优选地,所述后向传播算法,需先求出正向传播预测的目标框图与图像实际目标框图的损失函数然后求得其对参数W的梯度,采用梯度下降的算法更新W以最小化损失函数假定中间层有M个分支可以输出目标候选区域,lm表示分支m的损失函数,αm表示lm函数的权重,S={S1,S2,…,SM}指相应尺度的目标对象,则损失函数可定义为:
为达到上述目的,本发明还提供一种快速行人检测***,包括:
训练单元,用于构建可配置的基于卷积神经网络的深度模型,利用训练样本学习出构建的网络参数,获得用于测试过程的模型;
检测单元,用于输入测试样本,通过训练好的模型利用神经网络感知域的变化规律使用不同的中间层对不同尺度范围内的目标物体进行检测,预测出图像中目标物体的框图。
与现有技术相比,本发明一种快速行人检测方法及装置借鉴压缩网络的方法,调整并训练VGG-16的网络得到适应嵌入式***要求的squeeze VGG-16网络,有效降低了网络模型的参数量并加快了计算效率;另一方面,针对传统检测方法中感知域与物体大小不一致的问题,本发明利用神经网络感知域的变化规律(即神经网络层越深,感知域越大,适合检测大一些的目标物体),使用不同的中间层对特定尺度范围内的目标物体进行检测,更好的适应了感知域与物体大小的关系,有效提高了检测结果;另外,为了增强对小物体的检测,本发明使用去卷积的方法对特定网络层的特征图进行放大,相比于传统图片放大的方法,几乎不增加显存和计算量;为了增强对于模糊物体的检测,在该层的特征图上,使用目标对象1.5倍大小的区域作为背景语义特征增加到网络中,对于模糊物体和远距离小物体的检测,有着极佳的性能。
附图说明
图1为本发明一种快速行人检测方法的步骤流程图;
图2为本发明具体实施例中Squeeze VGG-16神经网络结构示意图;
图3为本发明具体实施例中Fire模块的示意图;
图4为本发明具体实施例中目标候选网络的结构示意图;
图5为本发明具体实施例中目标检测网络的结构示意图;
图6为本发明具体实施例中快速行人检测的过程示意图;
图7为本发明一种快速行人检测装置的***架构图;
图8为本发明具体实施例中训练单元的细部结构图;
图9为本发明具体实施例中检测单元的细部结构图。
具体实施方式
以下通过特定的具体实例并结合附图说明本发明的实施方式,本领域技术人员可由本说明书所揭示的内容轻易地了解本发明的其它优点与功效。本发明亦可通过其它不同的具体实例加以施行或应用,本说明书中的各项细节亦可基于不同观点与应用,在不背离本发明的精神下进行各种修饰与变更。
图1为本发明一种快速行人检测方法的步骤流程图。如图1所示,本发明一种快速行人检测方法,包括如下步骤:
步骤S1,构建可配置的基于卷积神经网络的深度模型,利用训练样本学习出构建的网络参数,获得用于测试过程的模型。在本发明具体实施例中,该深度模型由两个子网路组成:第一个子网络,为多尺度的目标候选网络,用于提取人物特征并给出候选区域,具体地,该目标候选网络基于卷积神经网络不同层提出特征的差异性,在中间层分别生成对不同尺度行人的候选框图;第二个子网络,为目标检测网络,增强检测的效果,其与目标候选网络共享参数,在候选框图的基础上进行精细化的分类和检测。具体地,步骤S1进一步包括:
步骤S100,构建可配置的基于卷积神经网络的深度模型。
所述卷积神经网络由卷积层、降采样层、上采样层堆叠而成,所述卷积层是指对输入的图像或者特征图在二维空间上进行卷积运算,提取层次化特征;所述的降采样层使用没有重叠的max-pooling操作,该操作用于提取形状和偏移不变的特征,同时减少特征图大小,提高计算效率;所述的上采样层,是指对输入的特征图在二维空间上进行去卷积的操作,用以增大特征图的像素,主要用于目标检测网络,提升检测效果,在本发明具体实施例中,采用Squeeze VGG-16卷积神经网络作为骨干网络,如图2所示,该Squeeze VGG-16卷积神经网络采用conv1-1层和紧随其后的12层Fire模块作为卷积层,用以提取特征;其中的pool1-pool5是降采样层;使用在ImageNet数据集上预先训练好的模型作为初始化。即本发明首先利用ImageNet数据集预先训练Squeeze VGG-16作为网络初始化。
图3为本发明具体实施例中Fire模块的结构示意图。如图3所示,Fire模块由两个卷积核大小为1×1的卷积层和一个卷积核大小为3×3的卷积层组成,目的在于用1×1的卷积核代替3×3的卷积核,从而使参数量减少9倍,但为了不影响网络的表征能力,不是全部替代,而是一部分是用1×1的卷积核,一部分使用3×3的卷积核,这样做的另一个好处是减少3×3卷积核的输入通道,同时起到降低参数量的效果,具体地,Fire模块先是使用1×1的卷积层对输入层进行降维操作,然后参照GoogLeNet结构,使用1×1和3×3的卷积层提取特征,最后将两部分特征连接起来,这样的方式极大降低了计算量和模型参数。
图4为本发明具体实施例中目标候选网络的架构示意图。在本发明具体实施例中,所述目标候选网络在Squeeze VGG-16卷积神经网络基础上,根据卷积层特征,在Fire9、Fire12、conv6以及增加的pooling层共计4层,产生网络分支,分支进行不同尺度检测到物体的候选框的回归。但对于Fire-9层,它比较接近主干网络的低层,相比其他层对梯度的影响会很大,学习过程不稳定,因此多了一个buffer(缓冲)层,如图4中det-conv层所示,buffer层避免检测分支的梯度被直接back-propagated(反向传播)到主干层。
本发明利用神经网络感知域的变化规律(即神经网络层越深,感知域越大,适合检测大一些的目标物体),使用不同的中间层对特定尺度范围内的目标物体进行检测,更好的适应了感知域与物体大小的关系,有效提高了检测结果。
图5为本发明具体实施例中目标检测网络的架构示意图。所述目标检测网络与目标候选网络共享参数,将目标候选网络的候选框汇总,以增强监测网络对物体与背景的区分能力。在本发明具体实施例中,所述目标检测网络,在目标候选区域的基础上,将目标候选区域1.5倍大小的图片区域作为目标的背景语义信息;将Fire9层的特征图进行一次上采样,作为增强对小物体感知的信息,将背景语义信息与上采样信息经过感兴趣区域的池化(ROI pooling)获得固定大小的特征,之后增加一层全连接层,进行类别和最终候选框的回归,具体地,主干cnn层连接一个proposals的节点,用于汇总目标候选网络所得到的候选框信息;另一方面,针对fire9层的特征图,W和H是输入图片的宽度和高度,立方体1代表物体区域的在特征图的映射,而立方体2代表context区域在特征图上的映射,context区域约为物体区域的1.5倍,同时为了加强对小物体的检测,再对Fire9层进行一次上采样,之后与faster RCNN算法类似,使用感兴趣区域的池化获得固定大小的特征;将Fire9层处理后的特征与proposals汇总的特征连接(concat)到一起,后增加一层全连接层,进行类别和最终候选框的回归,在此不予赘述。
步骤S101,输入训练样本。
训练过程需要提供图像中参考人物的对应的框,同时为了加速训练,训练过程将含有参考人物的图像从原始图像中裁剪出来,形成一个个patch(图像块),patch相比于原始图像更小,用以训练,有效加速了训练过程。具体地,在本发明中,输入的训练样本包括RGB图像数据和图像中行人区域的标注信息,实际训练用的图像数据是根据行人所在区域裁剪得到的小的patch(图象块)。用数学语言表示,训练样本其中Xi表示训练图片的一个patch;在实际应用中,除了行人这一类别,还有其他类别,例如背景、骑自行车车的人、坐着的人等K个类别,因此标注数据Yi=(yi,bi)由类别标签yi∈{0,1,2,...,K}和框图坐标点组成,其中为框图左上角的起始坐标点,为框图宽度和高度。
步骤S102,初始化卷积神经网络及其参数,包括网络层中每层连接的权重和偏置。具体地,本发明利用ImageNet数据集预先训练Squeeze VGG-16卷积神经网络作为网络初始化。
步骤S103,采用前向传播算法和后向传播算法,利用训练样本学习出构建的网络参数,即用于测试过程的模型。
在本发明中,所述前向传播算法,首先将输入图像的大小归一化为3×480×640,截取3×448×448大小的patch和相应的标注信息作为卷积神经网络的输入,经过卷积层、降采样层和矫正线性单元层(ReLU Nonlinearity Layer),在Fire9层,图像特征图大小为512×60×80;在Fire12层,特征图大小为512×30×40,在后面两个分支特征图大小依次是512×15×20和512×8×10。在不同特征图上,采用卷积的方式得到目标框图的四个坐标点和类别信息,以Fire9层为例,假定只检测行人和背景,则输出为特征大小为6×60×80,其中6包含背景、行人两个类别和候选框图四个坐标点。在目标检测网络中,将各个分支层得到的候选框图在proposals节点进行汇总,同时与Fire9层的背景语义信息和上采样信息经过感兴趣区域的池化操作得到的特征进行叠加,做最后的框图回归和类别回归。
在本发明中,所述后向传播算法,需要先求出正向(即前向)传播预测的目标框图与图像实际目标框图的损失函数然后求得其对参数W的梯度,采用梯度下降的算法更新W以最小化损失函数假定中间层有M个分支可以输出目标候选区域(M个尺度的感知域可以近似的检测出图像中所有目标物体),lm表示分支m的损失函数,αm表示lm函数的权重,S={S1,S2,…,SM}指相应尺度的目标对象,则损失函数可定义为:
所述损失函数,对于特定的检测层m,只有目标尺度在m所能检测的范围内,才对损失函数有贡献,故将损失函数定义为
Lcls(p(X),y)=-logy(P(X)) (3)
使用平滑的曼哈顿距离标准(smooth L1 criterion)进行目标框图的回归,定义如下
步骤S2,通过训练好的模型利用神经网络感知域的变化规律使用不同的中间层对不同尺度范围内的目标物体进行检测,预测出图像中目标物体(如行人)的框图。
具体地,步骤S2进一步包括:
步骤S200,载入训练好的模型;
步骤S201,输入测试样本;
步骤S202,利用训练好的模型,通过神经网络感知域的变化规律使用不同的中间层对不同尺度范围内的行人进行检测,预测图像中行人的框图。图6为本发明具体实施例中快速行人检测的过程示意图,即利用模型中的目标候选网络在Squeeze VGG-16卷积神经网络基础上,根据卷积层特征,在fire9、fire12、conv6以及增加的pooling层共计4层产生网络分支,进行不同尺度检测到物体的目标候选区域(中间层a,中间层b,中间层c);然后利用目标检测网络,在目标候选区域的基础上,将目标候选区域1.5倍大小的图片区域作为目标的背景语义信息,将Fire9层的特征图进行一次上采样,作为增强对小物体感知的信息,将背景语义信息与上采样信息经过感兴趣区域的池化获得固定大小的特征,之后增加一层全连接层,进行类别和最终候选框的回归。优选地,于步骤S202中,还使用去卷积的方法对特定网络层的特征图进行放大。
本发明提出的行人检测方法,分别借鉴两方面的评价指标:平均查准率mAP和每秒帧数FPS。mAP用于评价最后检测区域与真实目标人物区域的交并比的情况,在不同交并比下查准率的平均值;FPS,主要是效率指标,指每秒可以处理的图片数目。
图7为本发明一种快速行人检测装置的***架构图。如图7所示,本发明一种快速行人检测装置,包括:
训练单元70,用于构建可配置的基于卷积神经网络的深度模型,利用训练样本学习出构建的网络参数,获得用于测试过程的模型。在本发明具体实施例中,训练单元70所构建的深度模型由两个子网路组成:第一个子网络,为多尺度的目标候选网络,用于提取人物特征并给出候选区域,具体地,该目标候选网络基于卷积神经网络不同层提出特征的差异性,在中间层分别生成对不同尺度行人的候选框图;第二个子网络,为目标检测网络,增强检测的效果,其与目标候选网络共享参数,在候选框图的基础上进行精细化的分类和检测。具体地,如图8所示,训练单元70进一步包括:
模型构建单元701,用于构建可配置的基于卷积神经网络的深度模型。
所述卷积神经网络由卷积层、降采样层、上采样层堆叠而成,所述卷积层是指对输入的图像或者特征图在二维空间上进行卷积运算,提取层次化特征;所述的降采样层使用没有重叠的max-pooling操作,该操作用于提取形状和偏移不变的特征,同时减少特征图大小,提高计算效率,所述的上采样层,是指对输入的特征图在二维空间上进行去卷积的操作,用以增大特征图的像素。在本发明具体实施例中,采用Squeeze VGG-16卷积神经网络作为骨干网络。
在本发明具体实施例中,所述目标候选网络在Squeeze VGG-16卷积神经网络基础上,根据卷积层特征,在fire9、fire12、conv6以及增加的pooling层共计4层,产生网络分支,分支进行不同尺度检测到物体的候选框的回归。但对于fire-9层,它比较接近主干网络的低层,相比其他层对梯度的影响会很大,学习过程不稳定,因此多了一个buffer(缓冲)层,buffer层避免检测分支的梯度被直接back-propagated(反向传播)到主干层。
所述目标检测网络与目标候选网络共享参数,将目标候选网络的候选框汇总,以增强监测网络对物体与背景的区分能力。在本发明具体实施例中,所述目标检测网络,在目标候选区域的基础上,将目标候选区域1.5倍大小的图片区域作为目标的背景语义信息;将Fire9层的特征图进行一次上采样,作为增强对小物体感知的信息,将背景语义信息与上采样信息经过感兴趣区域的池化获得固定大小的特征,之后增加一层全连接层,进行类别和最终候选框的回归,具体地,主干cnn层连接一个proposal的子网,W和H是输入图片的宽度和高度,立方体1代表物体区域的pooling,而立方体2代表context区域的pooling,context区域约为物体区域的1.5倍,同时为了加强对小物体的检测,再对Fire9层进行一次上采样,之后与faster RCNN算法类似,使用感兴趣区域的池化获得固定大小的特征,之后增加一层全连接层,进行类别和最终候选框的回归。
训练样本输入单元702,用于输入训练样本。
初始化单元703,用于初始化卷积神经网络及其参数,包括网络层中每层连接的权重和偏置。具体地,本发明利用ImageNet数据集预先训练Squeeze VGG-16卷积神经网络作为网络初始化。
样本训练单元704,用于采用前向传播算法和后向传播算法,利用训练样本学习出构建的网络参数,即用于测试过程的模型。
在本发明中,所述前向传播算法,首先将输入图像的大小归一化为3×480×640,截取3×448×448大小的patch和相应的标注信息作为卷积神经网络的输入,经过卷积层、降采样层和矫正线性单元层(ReLU Nonlinearity Layer),在Fire9层,图像特征图大小为512×60×80;在Fire12层,特征图大小为512×30×40,在后面两个分支特征图大小依次是512×15×20和512×8×10。在不同特征图上,采用卷积的方式得到目标框图的四个坐标点和类别信息,以Fire9层为例,假定只检测行人和背景,则输出为特征大小为6×60×80,其中6包含背景、行人两个类别和候选框图四个坐标点。在目标检测网络中,将各个分支层得到的候选框图在proposals节点进行汇总,同时与Fire9层的背景语义信息和上采样信息经过感兴趣区域的池化操作得到的特征进行叠加,做最后的框图回归和类别回归。
所述后向传播算法,需要先求出正向传播预测的目标框图与图像实际目标框图的损失函数然后求得其对参数W的梯度,采用梯度下降的算法更新W以最小化损失函数假定中间层有M个分支可以输出目标候选区域(M个尺度的感知域可以近似的检测出图像中所有目标物体),lm表示分支m的损失函数,αm表示lm函数的权重,S={S1,S2,…,SM}指相应尺度的目标对象,则损失函数可定义为:
所述损失函数,对于特定的检测层m,只有目标尺度在m所能检测的范围内,才对损失函数有贡献,故将损失函数定义为
其中,p(X)=(p0(X),...,pK(X))为目标类别的概率分布。损失函数中,使用交叉熵损失函数定义类别回归,即
Lcls(p(X),y)=-logy(P(X))
使用smooth L1 criterion进行目标框图的回归,定义如下
检测单元71,用于输入测试样本,通过训练好的模型利用神经网络感知域的变化规律使用不同的中间层对不同尺度范围内的目标物体(如行人)进行检测,预测出图像中目标物体(如行人)的框图。
具体地,如图9所示,检测单元71进一步包括:
模型载入单元710,用于载入训练好的模型;
测试样本输入单元711,用于输入测试样本;
图像预测单元712,用于利用训练好的模型,通过训练好的模型利用神经网络感知域的变化规律使用不同的中间层对不同尺度范围内的行人进行检测,预测图像中行人的框图。具体地,图像预测单元712利用模型中的目标候选网络,在Squeeze VGG-16卷积神经网络基础上,根据卷积层特征,在Fire9、Fire12、conv6以及增加的pooling层共计4层产生网络分支,进行不同尺度检测到物体的目标候选区域;然后利用目标检测网络,在目标候选区域的基础上,将目标候选区域1.5倍大小的图片区域作为目标的背景语义信息,将Fire9层的特征图进行一次上采样,作为增强对小物体感知的信息,将背景语义信息与上采样信息经过感兴趣区域的池化获得固定大小的特征,之后增加一层全连接层,进行类别和最终候选框的回归。
综上所述,本发明一种快速行人检测方法及装置借鉴压缩网络的方法,调整并训练VGG-16的网络得到适应嵌入式***要求的squeeze VGG-16网络,有效降低了网络模型的参数量并加快了计算效率;另一方面,针对传统检测方法中感知域与物体大小不一致的问题,本发明利用神经网络感知域的变化规律(即神经网络层越深,感知域越大,适合检测大一些的目标物体),使用不同的中间层对特定尺度范围内的目标物体进行检测,更好的适应了感知域与物体大小的关系,有效提高了检测结果;另外,为了增强对小物体的检测,本发明使用去卷积的方法对特定网络层的特征图进行放大,相比于传统图片放大的方法,几乎不增加显存和计算量;为了增强对于模糊物体的检测,在该层的特征图上,使用目标对象1.5倍大小的区域作为背景语义特征增加到网络中,对于模糊物体和远距离小物体的检测,有着极佳的性能。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何本领域技术人员均可在不违背本发明的精神及范畴下,对上述实施例进行修饰与改变。因此,本发明的权利保护范围,应如权利要求书所列。
Claims (4)
1.一种快速行人检测方法,包括如下步骤:
步骤S1,构建可配置的基于卷积神经网络的深度模型,利用训练样本学习出构建的网络参数,获得用于测试过程的模型;
步骤S2,输入测试样本,通过训练好的模型利用神经网络感知域的变化规律使用不同的中间层对不同尺度范围内的目标物体进行检测,预测出图像中目标物体的框图;
步骤S1进一步包括:
构建可配置的基于卷积神经网络的深度模型;
输入训练样本;
初始化卷积神经网络及其参数,包括网络层中每层连接的权重和偏置;
采用前向传播算法和后向传播算法,利用训练样本学习出构建的网络参数,即用于测试过程的模型;
所述深度模型包括多尺度的目标候选网络与目标检测网络,所述目标候选网络基于卷积神经网络不同层提出特征的差异性,在中间层分别生成对不同尺度目标物体的候选框图;所述目标检测网络在所述目标候选网络输出的候选框图的基础上进行精细化的分类和检测;
所述卷积神经网络由卷积层、降采样层、上采样层堆叠而成,所述卷积层是指对输入的图像或者特征图在二维空间上进行卷积运算,提取层次化特征;所述降采样层使用没有重叠的max-pooling操作,该操作用于提取形状和偏移不变的特征,同时减少特征图大小,提高计算效率;所述上采样层,是指对输入的特征图在二维空间上进行去卷积的操作,用以增大特征图的像素。
2.如权利要求1所述的一种快速行人检测方法,其特征在于:所述深度模型采用Squeeze VGG-16卷积神经网络作为骨干网络,所述Squeeze VGG-16卷积神经网络采用conv1-1层和紧随其后的12层Fire模块层为特征提取的网络结构。
3.如权利要求2所述的一种快速行人检测方法,其特征在于:所述目标候选网络在所述Squeeze VGG-16卷积神经网络基础上,根据卷积层特征,在Fire9、Fire12、conv6以及增加的pooling层,产生网络分支,以进行不同尺度检测到物体的候选框的回归。
4.如权利要求2所述的一种快速行人检测方法,其特征在于:所述目标检测网络在所述目标候选区域的基础上,将目标候选区域预设倍数大小的图片区域作为目标的背景语义信息,将Fire9层的特征图进行一次上采样,作为增强对小物体感知的信息,并将背景语义信息与上采样信息经过感兴趣区域的池化获得固定大小的特征,之后增加一层全连接层,进行类别和最终候选框的回归。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810069322.XA CN108399362B (zh) | 2018-01-24 | 2018-01-24 | 一种快速行人检测方法及装置 |
PCT/CN2018/095058 WO2019144575A1 (zh) | 2018-01-24 | 2018-07-10 | 一种快速行人检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810069322.XA CN108399362B (zh) | 2018-01-24 | 2018-01-24 | 一种快速行人检测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108399362A CN108399362A (zh) | 2018-08-14 |
CN108399362B true CN108399362B (zh) | 2022-01-07 |
Family
ID=63094281
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810069322.XA Active CN108399362B (zh) | 2018-01-24 | 2018-01-24 | 一种快速行人检测方法及装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN108399362B (zh) |
WO (1) | WO2019144575A1 (zh) |
Families Citing this family (304)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10678244B2 (en) | 2017-03-23 | 2020-06-09 | Tesla, Inc. | Data synthesis for autonomous control systems |
US11157441B2 (en) | 2017-07-24 | 2021-10-26 | Tesla, Inc. | Computational array microprocessor system using non-consecutive data formatting |
US11409692B2 (en) | 2017-07-24 | 2022-08-09 | Tesla, Inc. | Vector computational unit |
US11893393B2 (en) | 2017-07-24 | 2024-02-06 | Tesla, Inc. | Computational array microprocessor system with hardware arbiter managing memory requests |
US10671349B2 (en) | 2017-07-24 | 2020-06-02 | Tesla, Inc. | Accelerated mathematical engine |
US11561791B2 (en) | 2018-02-01 | 2023-01-24 | Tesla, Inc. | Vector computational unit receiving data elements in parallel from a last row of a computational array |
US11215999B2 (en) | 2018-06-20 | 2022-01-04 | Tesla, Inc. | Data pipeline and deep learning system for autonomous driving |
US11361457B2 (en) | 2018-07-20 | 2022-06-14 | Tesla, Inc. | Annotation cross-labeling for autonomous control systems |
US11636333B2 (en) | 2018-07-26 | 2023-04-25 | Tesla, Inc. | Optimizing neural network structures for embedded systems |
CN109089040B (zh) * | 2018-08-20 | 2021-05-14 | Oppo广东移动通信有限公司 | 图像处理方法、图像处理装置及终端设备 |
US11562231B2 (en) | 2018-09-03 | 2023-01-24 | Tesla, Inc. | Neural networks for embedded devices |
SG11202103493QA (en) | 2018-10-11 | 2021-05-28 | Tesla Inc | Systems and methods for training machine models with augmented data |
CN109409364A (zh) * | 2018-10-16 | 2019-03-01 | 北京百度网讯科技有限公司 | 图像标注方法和装置 |
US11196678B2 (en) | 2018-10-25 | 2021-12-07 | Tesla, Inc. | QOS manager for system on a chip communications |
CN109508675B (zh) * | 2018-11-14 | 2020-07-28 | 广州广电银通金融电子科技有限公司 | 一种针对复杂场景的行人检测方法 |
CN109522855B (zh) * | 2018-11-23 | 2020-07-14 | 广州广电银通金融电子科技有限公司 | 结合ResNet和SENet的低分辨率行人检测方法、***及存储介质 |
CN109522966B (zh) * | 2018-11-28 | 2022-09-27 | 中山大学 | 一种基于密集连接卷积神经网络的目标检测方法 |
US11816585B2 (en) | 2018-12-03 | 2023-11-14 | Tesla, Inc. | Machine learning models operating at different frequencies for autonomous vehicles |
US11537811B2 (en) | 2018-12-04 | 2022-12-27 | Tesla, Inc. | Enhanced object detection for autonomous vehicles based on field view |
CN109670439A (zh) * | 2018-12-14 | 2019-04-23 | 中国石油大学(华东) | 一种端到端的行人及其部位检测方法 |
CN109886066B (zh) * | 2018-12-17 | 2023-05-09 | 南京理工大学 | 基于多尺度和多层特征融合的快速目标检测方法 |
CN109685718B (zh) * | 2018-12-17 | 2020-11-10 | 中国科学院自动化研究所 | 图片方形化缩放方法、***及装置 |
US11610117B2 (en) | 2018-12-27 | 2023-03-21 | Tesla, Inc. | System and method for adapting a neural network model on a hardware platform |
CN109902800B (zh) * | 2019-01-22 | 2020-11-27 | 北京大学 | 基于拟反馈神经网络的多级骨干网络检测通用物体的方法 |
US10997461B2 (en) | 2019-02-01 | 2021-05-04 | Tesla, Inc. | Generating ground truth for machine learning from time series elements |
US11150664B2 (en) | 2019-02-01 | 2021-10-19 | Tesla, Inc. | Predicting three-dimensional features for autonomous driving |
CN111523351A (zh) * | 2019-02-02 | 2020-08-11 | 北京地平线机器人技术研发有限公司 | 神经网络的训练方法、装置和电子设备 |
US11567514B2 (en) | 2019-02-11 | 2023-01-31 | Tesla, Inc. | Autonomous and user controlled vehicle summon to a target |
US10956755B2 (en) | 2019-02-19 | 2021-03-23 | Tesla, Inc. | Estimating object properties using visual image data |
WO2020168515A1 (zh) * | 2019-02-21 | 2020-08-27 | 深圳市大疆创新科技有限公司 | 一种图像处理方法、装置、图像拍摄和处理***及载体 |
CN109993712B (zh) | 2019-04-01 | 2023-04-25 | 腾讯科技(深圳)有限公司 | 图像处理模型的训练方法、图像处理方法及相关设备 |
CN110110783A (zh) * | 2019-04-30 | 2019-08-09 | 天津大学 | 一种基于多层特征图连接的深度学习目标检测方法 |
CN110110793B (zh) * | 2019-05-10 | 2021-10-26 | 中山大学 | 基于双流卷积神经网络的双目图像快速目标检测方法 |
CN110659664B (zh) * | 2019-08-02 | 2022-12-13 | 杭州电子科技大学 | 一种基于ssd的高精度识别小物体的方法 |
CN110633631B (zh) * | 2019-08-06 | 2022-02-18 | 厦门大学 | 一种基于部件幂集和多尺度特征的行人重识别方法 |
CN110619268B (zh) * | 2019-08-07 | 2022-11-25 | 北京市新技术应用研究所 | 基于时空分析与深度特征的行人再识别方法及装置 |
CN110533084B (zh) * | 2019-08-12 | 2022-09-30 | 长安大学 | 一种基于自注意力机制的多尺度目标检测方法 |
CN110473195B (zh) * | 2019-08-13 | 2023-04-18 | 中山大学 | 一种可自动定制的医学病灶检测架构及方法 |
CN110427915B (zh) * | 2019-08-14 | 2022-09-27 | 北京百度网讯科技有限公司 | 用于输出信息的方法和装置 |
CN110705583B (zh) * | 2019-08-15 | 2024-03-15 | 平安科技(深圳)有限公司 | 细胞检测模型训练方法、装置、计算机设备及存储介质 |
CN110490252B (zh) * | 2019-08-19 | 2022-11-15 | 西安工业大学 | 一种基于深度学习的室内人数检测方法及*** |
CN110580726B (zh) * | 2019-08-21 | 2022-10-04 | 中山大学 | 基于动态卷积网络的自然场景下人脸素描生成模型及方法 |
CN110659576A (zh) * | 2019-08-23 | 2020-01-07 | 深圳久凌软件技术有限公司 | 一种基于联合判断与生成学习的行人搜索方法及装置 |
CN110647816B (zh) * | 2019-08-26 | 2022-11-22 | 合肥工业大学 | 一种用于货架药品实时监测的目标检测方法 |
CN110580727B (zh) * | 2019-08-27 | 2023-04-18 | 天津大学 | 信息流与梯度流增加的深度v型密集网络成像方法 |
CN110675309A (zh) * | 2019-08-28 | 2020-01-10 | 江苏大学 | 一种基于卷积神经网络和VGGNet16模型的图像风格转换方法 |
CN112446376B (zh) * | 2019-09-05 | 2023-08-01 | 中国科学院沈阳自动化研究所 | 一种工业图像智能分割压缩方法 |
CN110728186B (zh) * | 2019-09-11 | 2023-04-07 | 中国科学院声学研究所南海研究站 | 一种基于多网融合的火灾检测方法 |
CN110619365B (zh) * | 2019-09-18 | 2023-09-12 | 苏州经贸职业技术学院 | 一种落水检测方法 |
CN110619676B (zh) * | 2019-09-18 | 2023-04-18 | 东北大学 | 一种基于神经网络的端到端的三维人脸重建方法 |
CN110659601B (zh) * | 2019-09-19 | 2022-12-02 | 西安电子科技大学 | 基于中心点的深度全卷积网络遥感图像密集车辆检测方法 |
CN110619309B (zh) * | 2019-09-19 | 2023-07-18 | 天地伟业技术有限公司 | 一种基于八度卷积和YOLOv3的嵌入式平台人脸检测方法 |
CN110706239B (zh) * | 2019-09-26 | 2022-11-11 | 哈尔滨工程大学 | 融合全卷积神经网络与改进aspp模块的场景分割方法 |
CN110717903A (zh) * | 2019-09-30 | 2020-01-21 | 天津大学 | 一种利用计算机视觉技术进行农作物病害检测的方法 |
CN110674777A (zh) * | 2019-09-30 | 2020-01-10 | 电子科技大学 | 一种专利文本场景下的光学字符识别方法 |
CN110751076B (zh) * | 2019-10-09 | 2023-03-28 | 上海应用技术大学 | 车辆检测方法 |
CN110781895B (zh) * | 2019-10-10 | 2023-06-20 | 湖北工业大学 | 一种基于卷积神经网络的图像语义分割方法 |
CN110728640B (zh) * | 2019-10-12 | 2023-07-18 | 合肥工业大学 | 一种双通道单幅图像精细去雨方法 |
CN110728238A (zh) * | 2019-10-12 | 2020-01-24 | 安徽工程大学 | 一种融合型神经网络的人员再检测方法 |
CN111008554B (zh) * | 2019-10-16 | 2024-02-02 | 合肥湛达智能科技有限公司 | 一种基于深度学习的动态交通斑马线内不礼让行人识别方法 |
CN111008632B (zh) * | 2019-10-17 | 2023-06-09 | 安徽清新互联信息科技有限公司 | 一种基于深度学习的车牌字符分割方法 |
CN111046723B (zh) * | 2019-10-17 | 2023-06-02 | 安徽清新互联信息科技有限公司 | 一种基于深度学习的车道线检测方法 |
CN110852179B (zh) * | 2019-10-17 | 2023-08-25 | 天津大学 | 基于视频监控平台的可疑人员入侵的检测方法 |
CN110751644B (zh) * | 2019-10-23 | 2023-05-09 | 上海应用技术大学 | 道路表面裂纹检测方法 |
CN110909615B (zh) * | 2019-10-28 | 2023-03-28 | 西安交通大学 | 基于多尺度输入混合感知神经网络的目标检测方法 |
CN111008562B (zh) * | 2019-10-31 | 2023-04-18 | 北京城建设计发展集团股份有限公司 | 一种特征图深度融合的人车目标检测方法 |
CN110826476A (zh) * | 2019-11-02 | 2020-02-21 | 国网浙江省电力有限公司杭州供电公司 | 识别目标物体的图像检测方法、装置、电子设备和存储介质 |
CN110826485B (zh) * | 2019-11-05 | 2023-04-18 | 中国人民解放军战略支援部队信息工程大学 | 一种遥感影像的目标检测方法及*** |
CN110826552A (zh) * | 2019-11-05 | 2020-02-21 | 华中农业大学 | 基于深度学习的葡萄无损自动检测装置及其方法 |
CN110837837B (zh) * | 2019-11-05 | 2023-10-17 | 安徽工业大学 | 一种基于卷积神经网络的车辆违章检测方法 |
CN111008567B (zh) * | 2019-11-07 | 2023-03-24 | 郑州大学 | 一种驾驶员行为识别方法 |
CN111461160B (zh) * | 2019-11-11 | 2023-07-14 | 天津津航技术物理研究所 | 抗云雾、烟雾干扰红外成像导引头目标跟踪方法 |
CN110852272B (zh) * | 2019-11-11 | 2023-03-28 | 上海应用技术大学 | 行人检测方法 |
CN111008994A (zh) * | 2019-11-14 | 2020-04-14 | 山东万腾电子科技有限公司 | 基于MPSoC的运动目标实时检测跟踪***及方法 |
CN111222402A (zh) * | 2019-11-14 | 2020-06-02 | 北京理工大学 | 一种面向无人机图像的人群聚集密度分析方法 |
CN111126359B (zh) * | 2019-11-15 | 2023-03-28 | 西安电子科技大学 | 基于自编码器与yolo算法的高清图像小目标检测方法 |
CN111222534B (zh) * | 2019-11-15 | 2022-10-11 | 重庆邮电大学 | 一种基于双向特征融合和更平衡l1损失的单发多框检测器优化方法 |
CN111144203B (zh) * | 2019-11-19 | 2023-06-16 | 浙江工商大学 | 一种基于深度学习的行人遮挡检测方法 |
CN110942008B (zh) * | 2019-11-21 | 2023-05-12 | 圆通速递有限公司 | 一种基于深度学习的面单信息定位方法和*** |
CN110909797B (zh) * | 2019-11-22 | 2023-05-05 | 北京深睿博联科技有限责任公司 | 图像检测方法以及装置、设备、存储介质 |
CN111105393B (zh) * | 2019-11-25 | 2023-04-18 | 长安大学 | 一种基于深度学习的葡萄病虫害识别方法及装置 |
CN110705540B (zh) * | 2019-11-25 | 2024-05-31 | 中国农业科学院农业信息研究所 | 基于rfid和深度学习的兽药生产指针式仪表图像识别方法和装置 |
CN110956115B (zh) * | 2019-11-26 | 2023-09-29 | 证通股份有限公司 | 场景识别方法及装置 |
CN112949814B (zh) * | 2019-11-26 | 2024-04-26 | 联合汽车电子有限公司 | 卷积神经网络的压缩和加速方法、装置及嵌入式设备 |
CN111046928B (zh) * | 2019-11-27 | 2023-05-23 | 上海交通大学 | 定位精准的单阶段实时通用目标检测器及方法 |
CN111062278B (zh) * | 2019-12-03 | 2023-04-07 | 西安工程大学 | 基于改进残差网络的异常行为识别方法 |
CN111145195B (zh) * | 2019-12-03 | 2023-02-24 | 上海海事大学 | 一种基于轻量级深度神经网络的视频中人像轮廓探测方法 |
CN110986949B (zh) * | 2019-12-04 | 2023-05-09 | 日照职业技术学院 | 一种基于人工智能平台下的路径识别方法 |
CN111027449B (zh) * | 2019-12-05 | 2023-05-30 | 光典信息发展有限公司 | 一种纸质档案电子影像归档章的定位识别方法 |
CN110942144B (zh) * | 2019-12-05 | 2023-05-02 | 深圳牛图科技有限公司 | 集自动化训练、校验、重构于一体的神经网络构建方法 |
CN110992238B (zh) * | 2019-12-06 | 2023-10-17 | 上海电力大学 | 一种基于双通道网络的数字图像篡改盲检测方法 |
CN111178148B (zh) * | 2019-12-06 | 2023-06-02 | 天津大学 | 一种基于无人机视觉***的地面目标地理坐标定位方法 |
CN111008603B (zh) * | 2019-12-08 | 2023-04-18 | 中南大学 | 面向大尺度遥感图像的多类目标快速检测方法 |
CN111179338B (zh) * | 2019-12-10 | 2023-08-04 | 同济大学 | 一种用于移动供电接收端的轻量化目标定位方法 |
CN111161217B (zh) * | 2019-12-10 | 2023-04-18 | 中国民航大学 | 基于Conv-LSTM多尺度特征融合的模糊检测方法 |
CN111160115B (zh) * | 2019-12-10 | 2023-05-02 | 上海工程技术大学 | 一种基于孪生双流3d卷积神经网络的视频行人再识别方法 |
CN111062297B (zh) * | 2019-12-11 | 2023-05-23 | 青岛科技大学 | 基于eann深度学习模型的暴力异常行为检测方法 |
CN111079642B (zh) * | 2019-12-13 | 2023-11-14 | 国网浙江余姚市供电有限公司 | 线路可移动监控方法及装置及计算机可读介质 |
CN110956157A (zh) * | 2019-12-14 | 2020-04-03 | 深圳先进技术研究院 | 基于候选框选择的深度学习遥感影像目标检测方法及装置 |
CN111178178B (zh) * | 2019-12-16 | 2023-10-10 | 汇纳科技股份有限公司 | 结合区域分布的多尺度行人重识别方法、***、介质及终端 |
CN111091101B (zh) * | 2019-12-23 | 2023-06-02 | 中国科学院自动化研究所 | 基于一步法的高精度行人检测方法、***、装置 |
CN111126310B (zh) * | 2019-12-26 | 2023-03-24 | 华侨大学 | 一种基于场景迁移的行人性别识别方法 |
CN111160527A (zh) | 2019-12-27 | 2020-05-15 | 歌尔股份有限公司 | 一种基于mask rcnn网络模型的目标识别方法、装置 |
CN111178251B (zh) * | 2019-12-27 | 2023-07-28 | 汇纳科技股份有限公司 | 一种行人属性识别方法及***、存储介质及终端 |
CN111161295B (zh) * | 2019-12-30 | 2023-11-21 | 神思电子技术股份有限公司 | 一种菜品图像背景剥离方法 |
CN111160274B (zh) * | 2019-12-31 | 2023-03-24 | 合肥湛达智能科技有限公司 | 一种基于二值化Faster RCNN网络的行人检测方法 |
CN111176820B (zh) * | 2019-12-31 | 2021-06-25 | 中科院计算技术研究所大数据研究院 | 一种基于深度神经网络的边缘计算任务的分配方法及装置 |
CN111199212B (zh) * | 2020-01-02 | 2023-04-07 | 西安工程大学 | 基于注意力模型的行人属性识别方法 |
CN111209952B (zh) * | 2020-01-03 | 2023-05-30 | 西安工业大学 | 基于改进ssd和迁移学习的水下目标检测方法 |
CN111209860B (zh) * | 2020-01-06 | 2023-04-07 | 上海海事大学 | 基于深度学习与强化学习的视频考勤***及方法 |
CN111275711B (zh) * | 2020-01-08 | 2023-04-07 | 西安电子科技大学 | 基于轻量级卷积神经网络模型的实时图像语义分割方法 |
CN111259898B (zh) * | 2020-01-08 | 2023-03-24 | 西安电子科技大学 | 基于无人机航拍图像的农作物分割方法 |
CN111259736B (zh) * | 2020-01-08 | 2023-04-07 | 上海海事大学 | 一种基于深度学习的复杂环境下行人实时检测方法 |
CN111242010A (zh) * | 2020-01-10 | 2020-06-05 | 厦门博海中天信息科技有限公司 | 一种基于边缘ai的判断并识别乱扔垃圾人员身份的方法 |
CN111260658B (zh) * | 2020-01-10 | 2023-10-17 | 厦门大学 | 一种用于图像分割的深度强化学习方法 |
CN111242839B (zh) * | 2020-01-13 | 2023-04-21 | 华南理工大学 | 一种基于尺度等级的图像缩放裁剪方法 |
CN111209887B (zh) * | 2020-01-15 | 2023-04-07 | 西安电子科技大学 | 针对小目标检测的ssd模型优化方法 |
CN111242127B (zh) * | 2020-01-15 | 2023-02-24 | 上海应用技术大学 | 基于非对称卷积的具有粒度级多尺度特性的车辆检测方法 |
CN113128316A (zh) * | 2020-01-15 | 2021-07-16 | 北京四维图新科技股份有限公司 | 目标检测方法及装置 |
CN111222519B (zh) * | 2020-01-16 | 2023-03-24 | 西北大学 | 一种层次化彩绘文物线稿提取模型构建、方法及装置 |
CN111259800A (zh) * | 2020-01-16 | 2020-06-09 | 天津大学 | 一种基于神经网络的无人驾驶专用车辆检测方法 |
CN111275688B (zh) * | 2020-01-19 | 2023-12-12 | 合肥工业大学 | 基于注意力机制的上下文特征融合筛选的小目标检测方法 |
CN111275171B (zh) * | 2020-01-19 | 2023-07-04 | 合肥工业大学 | 一种基于参数共享的多尺度超分重建的小目标检测方法 |
CN111199220B (zh) * | 2020-01-21 | 2023-04-28 | 北方民族大学 | 电梯内人员检测与人数统计的轻量化深度神经网络方法 |
CN111277751B (zh) * | 2020-01-22 | 2021-06-15 | Oppo广东移动通信有限公司 | 拍照方法、装置、存储介质及电子设备 |
CN111292366B (zh) * | 2020-02-17 | 2023-03-10 | 华侨大学 | 一种基于深度学习和边缘计算的视觉行车测距算法 |
CN111339871B (zh) * | 2020-02-18 | 2022-09-16 | 中国电子科技集团公司第二十八研究所 | 一种基于卷积神经网络的目标群分布模式研判方法和设备 |
CN111291820B (zh) * | 2020-02-19 | 2023-05-30 | 中国电子科技集团公司第二十八研究所 | 一种结合定位信息和分类信息的目标检测方法 |
CN111428751B (zh) * | 2020-02-24 | 2022-12-23 | 清华大学 | 基于压缩感知和卷积网络的物体检测方法 |
CN111368673B (zh) * | 2020-02-26 | 2023-04-07 | 华南理工大学 | 一种基于神经网络的人体关键点快速提取方法 |
CN111428567B (zh) * | 2020-02-26 | 2024-02-02 | 沈阳大学 | 一种基于仿射多任务回归的行人跟踪***及方法 |
CN113324864B (zh) * | 2020-02-28 | 2022-09-20 | 南京理工大学 | 一种基于深度学习目标检测的受电弓碳滑板磨耗检测方法 |
CN111339967B (zh) * | 2020-02-28 | 2023-04-07 | 长安大学 | 一种基于多视域图卷积网络的行人检测方法 |
CN111339975B (zh) * | 2020-03-03 | 2023-04-21 | 华东理工大学 | 基于中心尺度预测与孪生神经网络的目标检测识别跟踪方法 |
CN111368726B (zh) * | 2020-03-04 | 2023-11-10 | 西安咏圣达电子科技有限公司 | 建筑工地作业面人数统计方法、***、存储介质及装置 |
CN111428586B (zh) * | 2020-03-09 | 2023-05-16 | 同济大学 | 基于特征融合与样本增强的三维人体姿态估计方法 |
CN111429410B (zh) * | 2020-03-13 | 2023-09-01 | 杭州电子科技大学 | 一种基于深度学习的物体x射线图像材质判别***及方法 |
CN111461291B (zh) * | 2020-03-13 | 2023-05-12 | 西安科技大学 | 基于YOLOv3剪枝网络和深度学习去雾模型的长输管线巡检方法 |
CN111460924B (zh) * | 2020-03-16 | 2023-04-07 | 上海师范大学 | 一种基于目标检测的闸机通过逃票行为检测方法 |
CN111414909B (zh) * | 2020-03-16 | 2023-05-12 | 上海富瀚微电子股份有限公司 | 一种目标检测方法和装置 |
CN111368453B (zh) * | 2020-03-17 | 2023-07-07 | 创新奇智(合肥)科技有限公司 | 一种基于深度强化学习的面料裁剪优化方法 |
CN111753625B (zh) * | 2020-03-18 | 2024-04-09 | 北京沃东天骏信息技术有限公司 | 一种行人检测方法、装置、设备及介质 |
CN111462132A (zh) * | 2020-03-20 | 2020-07-28 | 西北大学 | 一种基于深度学习的视频物体分割方法及*** |
CN111488805B (zh) * | 2020-03-24 | 2023-04-25 | 广州大学 | 一种基于显著性特征提取的视频行为识别方法 |
CN111563525A (zh) * | 2020-03-25 | 2020-08-21 | 北京航空航天大学 | 一种基于YOLOv3-Tiny的运动目标检测方法 |
CN111414997B (zh) * | 2020-03-27 | 2023-06-06 | 中国人民解放军空军工程大学 | 一种基于人工智能的用于战场目标识别的方法 |
CN111310773B (zh) * | 2020-03-27 | 2023-03-24 | 西安电子科技大学 | 一种高效的卷积神经网络的车牌定位方法 |
CN111310861B (zh) * | 2020-03-27 | 2023-05-23 | 西安电子科技大学 | 一种基于深度神经网络的车牌识别和定位方法 |
CN111460980B (zh) * | 2020-03-30 | 2023-04-07 | 西安工程大学 | 基于多语义特征融合的小目标行人的多尺度检测方法 |
CN111462085B (zh) * | 2020-03-31 | 2023-09-19 | 上海大学 | 基于卷积神经网络的数字图像局部滤波取证方法 |
CN111553199A (zh) * | 2020-04-07 | 2020-08-18 | 厦门大学 | 一种基于计算机视觉的机动车交通违法行为自动检测技术 |
CN111462108B (zh) * | 2020-04-13 | 2023-05-02 | 山西新华防化装备研究院有限公司 | 一种基于机器学习的头面部产品设计工效学评估操作方法 |
CN111597900B (zh) * | 2020-04-16 | 2023-10-24 | 浙江工业大学 | 非法遛狗识别方法 |
CN111597897B (zh) * | 2020-04-16 | 2023-10-24 | 浙江工业大学 | 高速服务区车位识别方法 |
CN111523645B (zh) * | 2020-04-16 | 2023-04-18 | 北京航天自动控制研究所 | 一种提升小尺度目标检测识别性能的卷积神经网络设计方法 |
CN111695403B (zh) * | 2020-04-19 | 2024-03-22 | 东风汽车股份有限公司 | 一种基于深度感知卷积神经网络的2d与3d图像同步检测方法 |
CN111476314B (zh) * | 2020-04-27 | 2023-03-07 | 中国科学院合肥物质科学研究院 | 一种融合光流算法与深度学习的模糊视频检测方法 |
CN111563440A (zh) * | 2020-04-29 | 2020-08-21 | 上海海事大学 | 一种基于异构卷积的多核迭代rpn的目标检测方法 |
CN111652846B (zh) * | 2020-04-30 | 2022-08-16 | 成都数之联科技股份有限公司 | 一种基于特征金字塔卷积神经网络的半导体缺陷识别方法 |
CN111597939B (zh) * | 2020-05-07 | 2023-04-18 | 西安电子科技大学 | 一种基于深度学习的高铁线路鸟窝缺陷检测方法 |
CN111783685A (zh) * | 2020-05-08 | 2020-10-16 | 西安建筑科技大学 | 一种基于单阶段网络模型的目标检测改进算法 |
CN111582452B (zh) * | 2020-05-09 | 2023-10-27 | 北京百度网讯科技有限公司 | 生成神经网络模型的方法和装置 |
CN111597945B (zh) * | 2020-05-11 | 2023-08-18 | 济南博观智能科技有限公司 | 一种目标检测方法、装置、设备及介质 |
CN111783934B (zh) * | 2020-05-15 | 2024-06-21 | 北京迈格威科技有限公司 | 卷积神经网络构建方法、装置、设备及介质 |
CN111598951B (zh) * | 2020-05-18 | 2022-09-30 | 清华大学 | 一种识别空间目标的方法、装置和存储介质 |
CN111783523B (zh) * | 2020-05-19 | 2022-10-21 | 中国人民解放军93114部队 | 一种遥感影像旋转目标检测方法 |
CN111709449B (zh) * | 2020-05-20 | 2023-08-18 | 西安理工大学 | 一种基于聚类算法的多层特征融合的小尺度目标检测方法 |
CN112001878A (zh) * | 2020-05-21 | 2020-11-27 | 合肥合工安驰智能科技有限公司 | 基于二值化神经网络的深度学习矿石尺度测量方法及应用*** |
CN111881714B (zh) * | 2020-05-22 | 2023-11-21 | 北京交通大学 | 一种无监督跨域行人再识别方法 |
CN111626196B (zh) * | 2020-05-27 | 2023-05-16 | 西南石油大学 | 基于知识图谱的典型牛科动物身体结构智能分析方法 |
CN111709311B (zh) * | 2020-05-27 | 2023-11-28 | 西安理工大学 | 一种基于多尺度卷积特征融合的行人重识别方法 |
CN111709313B (zh) * | 2020-05-27 | 2022-07-29 | 杭州电子科技大学 | 基于局部和通道组合特征的行人重识别方法 |
CN111832608B (zh) * | 2020-05-29 | 2023-09-12 | 上海海事大学 | 一种基于单阶段检测模型yolov3的铁谱图像多磨粒识别方法 |
CN111652216B (zh) * | 2020-06-03 | 2023-04-07 | 北京工商大学 | 基于度量学习的多尺度目标检测模型方法 |
CN111652930B (zh) * | 2020-06-04 | 2024-02-27 | 上海媒智科技有限公司 | 一种图像目标检测方法、***及设备 |
CN111709336B (zh) * | 2020-06-08 | 2024-04-26 | 杭州像素元科技有限公司 | 一种高速公路行人检测方法、设备及可读存储介质 |
CN111881932B (zh) * | 2020-06-11 | 2023-09-15 | 中国人民解放军战略支援部队信息工程大学 | 一种军用飞机的FasterRCNN目标检测算法 |
CN111860587B (zh) * | 2020-06-12 | 2024-02-02 | 长安大学 | 一种用于图片小目标的检测方法 |
CN111738124B (zh) * | 2020-06-15 | 2023-08-22 | 西安电子科技大学 | 基于Gabor变换和注意力的遥感图像云检测方法 |
CN111709935B (zh) * | 2020-06-17 | 2023-04-07 | 西安科技大学 | 一种用于地面运动皮带上实时煤矸石定位识别方法 |
CN111797836B (zh) * | 2020-06-18 | 2024-04-26 | 中国空间技术研究院 | 一种基于深度学习的地外天体巡视器障碍物分割方法 |
CN111723743A (zh) * | 2020-06-19 | 2020-09-29 | 北京邮电大学 | 一种小尺度行人快速检测方法 |
CN111832630A (zh) * | 2020-06-23 | 2020-10-27 | 成都恒创新星科技有限公司 | 一种基于一阶梯度神经网络的目标检测方法 |
CN111784652B (zh) * | 2020-06-24 | 2024-02-06 | 西安电子科技大学 | 基于强化学习多尺度神经网络的mri分割方法 |
CN111814621B (zh) * | 2020-06-29 | 2024-01-23 | 中国科学院合肥物质科学研究院 | 一种基于注意力机制的多尺度车辆行人检测方法及装置 |
CN111767847B (zh) * | 2020-06-29 | 2023-06-09 | 佛山市南海区广工大数控装备协同创新研究院 | 一种集成目标检测和关联的行人多目标跟踪方法 |
CN111832450B (zh) * | 2020-06-30 | 2023-11-28 | 成都睿沿科技有限公司 | 基于图像识别的持刀检测方法 |
CN111767878B (zh) * | 2020-07-03 | 2022-11-08 | 中国科学院自动化研究所 | 嵌入式设备中基于深度学习的交通标志检测方法及*** |
CN112199983B (zh) * | 2020-07-08 | 2024-06-18 | 北京航空航天大学 | 一种多层次筛选的长时间大范围行人再识别方法 |
CN111986145B (zh) * | 2020-07-09 | 2024-06-21 | 浙江工业大学 | 一种基于Faster-RCNN的轴承滚子瑕疵检测方法 |
CN111860265B (zh) * | 2020-07-10 | 2024-01-05 | 武汉理工大学 | 一种基于样本损失的多检测框损失均衡道路场景理解算法 |
CN111667030B (zh) * | 2020-07-13 | 2023-04-07 | 华东理工大学 | 基于深度神经网络实现遥感图像目标检测的方法、***及其存储介质 |
CN111832479B (zh) * | 2020-07-14 | 2023-08-01 | 西安电子科技大学 | 基于改进的自适应锚点r-cnn的视频目标检测方法 |
CN111986149A (zh) * | 2020-07-16 | 2020-11-24 | 江西斯源科技有限公司 | 一种基于卷积神经网络的植物病虫害检测方法 |
CN111986126B (zh) * | 2020-07-17 | 2022-05-24 | 浙江工业大学 | 一种基于改进vgg16网络的多目标检测方法 |
CN111860637B (zh) * | 2020-07-17 | 2023-11-21 | 河南科技大学 | 一种单发多框红外目标检测方法 |
CN111832513B (zh) * | 2020-07-21 | 2024-02-09 | 西安电子科技大学 | 基于神经网络的实时足球目标检测方法 |
CN111881803B (zh) * | 2020-07-22 | 2023-10-31 | 安徽农业大学 | 一种基于改进YOLOv3的畜脸识别方法 |
CN112036437B (zh) * | 2020-07-28 | 2024-06-07 | 农业农村部南京农业机械化研究所 | 基于改进yolov3网络的水稻秧苗检测模型及其方法 |
CN112001259A (zh) * | 2020-07-28 | 2020-11-27 | 联芯智能(南京)科技有限公司 | 基于可见光图像的航拍微弱人体目标智能检测方法 |
CN111915583B (zh) * | 2020-07-29 | 2024-02-09 | 西安电子科技大学 | 复杂场景中基于车载红外热像仪的车辆和行人检测方法 |
CN111985365A (zh) * | 2020-08-06 | 2020-11-24 | 合肥学院 | 一种基于目标检测技术的秸秆焚烧监测方法和*** |
CN112115291B (zh) * | 2020-08-12 | 2024-02-27 | 南京止善智能科技研究院有限公司 | 一种基于深度学习的三维室内模型检索方法 |
CN111985464B (zh) * | 2020-08-13 | 2023-08-22 | 山东大学 | 面向法院判决文书的多尺度学习的文字识别方法及*** |
CN111986172B (zh) * | 2020-08-18 | 2024-06-04 | 华北电力科学研究院有限责任公司 | 一种面向电力设备的红外图像故障检测方法及装置 |
CN111984879A (zh) * | 2020-08-19 | 2020-11-24 | 交控科技股份有限公司 | 应用于列车的用户引导方法、装置、设备和存储介质 |
CN112001385B (zh) * | 2020-08-20 | 2024-02-06 | 长安大学 | 一种目标跨域检测与理解方法、***、设备及存储介质 |
CN111985473A (zh) * | 2020-08-20 | 2020-11-24 | 中再云图技术有限公司 | 一种店外经营识别方法 |
CN111986186B (zh) * | 2020-08-25 | 2024-03-22 | 华中科技大学 | 一种定量化的炉前pcb贴片缺陷在线检测***和方法 |
CN112001339B (zh) * | 2020-08-27 | 2024-02-23 | 杭州电子科技大学 | 一种基于YOLO v4的行人社交距离实时监测方法 |
CN112364974B (zh) * | 2020-08-28 | 2024-02-09 | 西安电子科技大学 | 一种基于激活函数改进的YOLOv3算法 |
CN112149664B (zh) * | 2020-09-04 | 2024-05-07 | 浙江工业大学 | 一种优化分类与定位任务的目标检测方法 |
CN112101434B (zh) * | 2020-09-04 | 2022-09-09 | 河南大学 | 基于改进YOLO v3的红外图像弱小目标检测方法 |
CN112464765B (zh) * | 2020-09-10 | 2022-09-23 | 天津师范大学 | 一种基于单像素特征放大的安全帽检测方法及其应用 |
CN115661491A (zh) * | 2020-09-15 | 2023-01-31 | 重庆市农业科学院 | 一种茶树种植中虫害防治的监测方法 |
CN112347843A (zh) * | 2020-09-18 | 2021-02-09 | 深圳数联天下智能科技有限公司 | 一种训练皱纹检测模型的方法及相关装置 |
CN112163492B (zh) * | 2020-09-21 | 2023-09-08 | 华南理工大学 | 一种长时跨场景优化的交通物体检测方法、***及介质 |
CN112115885B (zh) * | 2020-09-22 | 2023-08-11 | 中国农业科学院农业信息研究所 | 基于深度卷积神经网络的采摘用果树结果枝剪切点定位方法 |
CN112215100B (zh) * | 2020-09-27 | 2024-02-09 | 浙江工业大学 | 一种不平衡训练样本下针对退化图像的目标检测方法 |
CN112085126B (zh) * | 2020-09-30 | 2023-12-12 | 浙江大学 | 一种侧重于分类任务的单样本目标检测方法 |
CN112200045B (zh) * | 2020-09-30 | 2024-03-19 | 华中科技大学 | 基于上下文增强的遥感图像目标检测模型建立方法及应用 |
CN112347851B (zh) * | 2020-09-30 | 2023-02-21 | 山东理工大学 | 多目标检测网络的构建方法、多目标检测方法及装置 |
CN112183430B (zh) * | 2020-10-12 | 2024-04-05 | 河北工业大学 | 一种基于双神经网络的手语识别方法及装置 |
CN112232411B (zh) * | 2020-10-15 | 2024-05-14 | 苏州凌图科技有限公司 | HarDNet-Lite在嵌入式平台的优化方法 |
CN112419237B (zh) * | 2020-11-03 | 2023-06-30 | 中国计量大学 | 一种基于深度学习的汽车离合主缸凹槽表面缺陷检测方法 |
CN112381792B (zh) * | 2020-11-13 | 2023-05-23 | 中国人民解放军空军工程大学 | 基于深度学习的雷达吸波涂层/电磁屏蔽薄膜损伤的智能化成像在线检测方法 |
CN112446308A (zh) * | 2020-11-16 | 2021-03-05 | 北京科技大学 | 基于语义增强的多尺度特征金字塔融合的行人检测方法 |
CN112396000B (zh) * | 2020-11-19 | 2023-09-05 | 中山大学 | 一种多模态密集预测的深度信息传输模型的构建方法 |
CN112434828B (zh) * | 2020-11-23 | 2023-05-16 | 南京富岛软件有限公司 | 一种5t运维中安全防护智能识别方法 |
CN112308062B (zh) * | 2020-11-23 | 2022-08-23 | 浙江卡易智慧医疗科技有限公司 | 一种复杂背景图像中的医疗影像访问号识别方法 |
CN112580778A (zh) * | 2020-11-25 | 2021-03-30 | 江苏集萃未来城市应用技术研究所有限公司 | 基于YOLOv5和Pose-estimation的工地工人手机使用检测方法 |
CN112348036A (zh) * | 2020-11-26 | 2021-02-09 | 北京工业大学 | 基于轻量化残差学习和反卷积级联的自适应目标检测方法 |
CN112487979B (zh) * | 2020-11-30 | 2023-08-04 | 北京百度网讯科技有限公司 | 目标检测方法和模型训练方法、装置、电子设备和介质 |
CN112528826B (zh) * | 2020-12-04 | 2024-02-02 | 江苏省农业科学院 | 一种基于3d视觉感知的采摘装置的控制方法 |
CN112613359B (zh) * | 2020-12-09 | 2024-02-02 | 苏州玖合智能科技有限公司 | 用于人员异常行为检测的神经网络的构建方法 |
CN112560627A (zh) * | 2020-12-09 | 2021-03-26 | 江苏集萃未来城市应用技术研究所有限公司 | 基于神经网的工地人员异常行为实时检测方法 |
CN112770325B (zh) * | 2020-12-09 | 2022-12-16 | 华南理工大学 | 一种基于深度学习的认知车联网频谱感知方法 |
CN112396036B (zh) * | 2020-12-09 | 2023-08-08 | 中山大学 | 一种结合空间变换网络和多尺度特征提取的遮挡行人重识别方法 |
CN112633086B (zh) * | 2020-12-09 | 2024-01-26 | 西安电子科技大学 | 基于多任务EfficientDet的近红外行人监测方法、***、介质、设备 |
CN112560682A (zh) * | 2020-12-16 | 2021-03-26 | 重庆守愚科技有限公司 | 一种基于深度学习的气门自动检测方法 |
CN112465815B (zh) * | 2020-12-17 | 2023-09-19 | 杭州电子科技大学 | 一种基于边缘主体融合信息的遥感目标显著性检测方法 |
CN112634367A (zh) * | 2020-12-25 | 2021-04-09 | 天津大学 | 一种基于深度神经网络的抗遮挡的物***姿估计方法 |
CN112651441B (zh) * | 2020-12-25 | 2022-08-16 | 深圳市信义科技有限公司 | 细粒度非机动车特征检测方法、存储介质及计算机设备 |
CN112699808B (zh) * | 2020-12-31 | 2024-06-07 | 深圳市华尊科技股份有限公司 | 密集目标检测方法、电子设备及相关产品 |
CN112613472B (zh) * | 2020-12-31 | 2022-04-26 | 上海交通大学 | 一种基于深度搜索匹配的行人检测方法及*** |
CN112733848B (zh) * | 2021-01-08 | 2022-11-04 | 中国电子科技集团公司第二十八研究所 | 基于多尺度特征和扩张型逆残差全连接的目标检测方法 |
CN112733714B (zh) * | 2021-01-11 | 2024-03-01 | 北京大学 | 一种基于vgg网络的自动人群计数图像识别方法 |
CN112784921A (zh) * | 2021-02-02 | 2021-05-11 | 西北工业大学 | 任务注意力引导的小样本图像互补学习分类算法 |
CN112556682B (zh) * | 2021-02-07 | 2023-06-23 | 天津蓝鳍海洋工程有限公司 | 一种水下复合传感器目标自动检测算法 |
CN112700444B (zh) * | 2021-02-19 | 2023-06-23 | 中国铁道科学研究院集团有限公司铁道建筑研究所 | 基于自注意力与中心点回归模型的桥梁螺栓检测方法 |
CN112949508A (zh) * | 2021-03-08 | 2021-06-11 | 咪咕文化科技有限公司 | 模型训练方法、行人检测方法、电子设备及可读存储介质 |
CN112906718B (zh) * | 2021-03-09 | 2023-08-22 | 西安电子科技大学 | 一种基于卷积神经网络的多目标检测方法 |
CN113012208B (zh) * | 2021-03-22 | 2024-05-17 | 上海应用技术大学 | 多视角遥感图像配准方法及*** |
CN112906658A (zh) * | 2021-03-30 | 2021-06-04 | 航天时代飞鸿技术有限公司 | 一种无人机侦查地面目标的轻量化自动检测方法 |
CN113312961A (zh) * | 2021-04-03 | 2021-08-27 | 国家计算机网络与信息安全管理中心 | 一种logo识别加速方法 |
CN113221957B (zh) * | 2021-04-17 | 2024-04-16 | 南京航空航天大学 | 一种基于Centernet的雷达信息融合特征增强方法 |
CN113112511B (zh) * | 2021-04-19 | 2024-01-05 | 新东方教育科技集团有限公司 | 试卷批改的方法、装置、存储介质及电子设备 |
CN113076957A (zh) * | 2021-04-21 | 2021-07-06 | 河南大学 | 一种基于跨模态特征融合的rgb-d图像显著性目标检测方法 |
CN113011398A (zh) * | 2021-04-28 | 2021-06-22 | 北京邮电大学 | 一种针对多时相遥感图像的目标变化检测方法及装置 |
CN113177545B (zh) * | 2021-04-29 | 2023-08-04 | 北京百度网讯科技有限公司 | 目标物体的检测方法、装置、电子设备和存储介质 |
CN113158968A (zh) * | 2021-05-10 | 2021-07-23 | 苏州大学 | 一种基于图像处理的嵌入式物体认知*** |
CN113408340B (zh) * | 2021-05-12 | 2024-03-29 | 北京化工大学 | 基于增强型特征金字塔的双极化sar小型船只检测方法 |
CN113221787B (zh) * | 2021-05-18 | 2023-09-29 | 西安电子科技大学 | 基于多元差异性融合的行人多目标跟踪方法 |
CN113312995B (zh) * | 2021-05-18 | 2023-02-14 | 华南理工大学 | 基于中轴线的无锚点车载行人检测方法 |
CN113297961B (zh) * | 2021-05-24 | 2023-11-17 | 南京邮电大学 | 一种基于边界特征融合孪生循环神经网络的目标跟踪方法 |
CN113222064A (zh) * | 2021-05-31 | 2021-08-06 | 苏州晗林信息技术发展有限公司 | 一种图像目标对象实时检测方法、***、终端及存储介质 |
CN113379699A (zh) * | 2021-06-08 | 2021-09-10 | 上海电机学院 | 基于深度学习的输电线路绝缘子缺陷检测方法 |
CN113343853B (zh) * | 2021-06-08 | 2024-06-14 | 深圳格瑞健康科技有限公司 | 一种儿童牙龋齿智能筛查方法及装置 |
CN113379709B (zh) * | 2021-06-16 | 2024-03-08 | 浙江工业大学 | 一种基于稀疏多尺度体素特征融合的三维目标检测方法 |
CN113449634A (zh) * | 2021-06-28 | 2021-09-28 | 上海翰声信息技术有限公司 | 一种用于处理强光环境下的视频检测方法及装置 |
CN113379718B (zh) * | 2021-06-28 | 2024-02-02 | 北京百度网讯科技有限公司 | 一种目标检测方法、装置、电子设备以及可读存储介质 |
CN113469254B (zh) * | 2021-07-02 | 2024-04-16 | 上海应用技术大学 | 基于目标检测模型的目标检测方法及*** |
CN113486810B (zh) * | 2021-07-08 | 2024-06-18 | 国网江苏省电力有限公司徐州供电分公司 | 一种公园盗猎鸟类的智能识别方法 |
CN113449743B (zh) * | 2021-07-12 | 2022-12-09 | 西安科技大学 | 一种煤尘颗粒特征提取方法 |
CN113642410B (zh) * | 2021-07-15 | 2024-03-29 | 南京航空航天大学 | 一种基于多尺度特征融合及动态卷积的福寿螺卵检测方法 |
CN113361491A (zh) * | 2021-07-19 | 2021-09-07 | 厦门大学 | 一种无人驾驶汽车对行人的过街意图预测方法 |
CN113657174A (zh) * | 2021-07-21 | 2021-11-16 | 北京中科慧眼科技有限公司 | 一种车辆伪3d信息检测方法、装置与自动驾驶*** |
CN113487600B (zh) * | 2021-07-27 | 2024-05-03 | 大连海事大学 | 一种特征增强尺度自适应感知船舶检测方法 |
CN113592825A (zh) * | 2021-08-02 | 2021-11-02 | 安徽理工大学 | 一种基于yolo算法的煤矸实时检测方法 |
CN113591735A (zh) * | 2021-08-04 | 2021-11-02 | 上海新纪元机器人有限公司 | 一种基于深度学习的行人检测方法及*** |
CN113591854B (zh) * | 2021-08-12 | 2023-09-26 | 中国海洋大学 | 一种浮游生物全息图的低冗余快速重建方法 |
CN113805151A (zh) * | 2021-08-17 | 2021-12-17 | 青岛本原微电子有限公司 | 基于注意力机制的中重频雷达目标检测方法 |
CN113706491B (zh) * | 2021-08-20 | 2024-02-13 | 西安电子科技大学 | 基于混合注意力弱监督迁移学习的半月板损伤分级方法 |
CN113869361A (zh) * | 2021-08-20 | 2021-12-31 | 深延科技(北京)有限公司 | 模型训练方法、目标检测方法及相关装置 |
CN113989630B (zh) * | 2021-08-31 | 2024-04-23 | 中通服公众信息产业股份有限公司 | 一种基于语义分析的镜头遮挡判别方法 |
CN113887330A (zh) * | 2021-09-10 | 2022-01-04 | 国网吉林省电力有限公司 | 一种基于遥感图像的目标检测*** |
CN113780193A (zh) * | 2021-09-15 | 2021-12-10 | 易采天成(郑州)信息技术有限公司 | 基于rcnn的牛群目标检测方法及设备 |
CN113807243B (zh) * | 2021-09-16 | 2023-12-05 | 上海交通大学 | 一种基于对未知目标注意力的水上障碍物检测***及方法 |
CN114067186B (zh) * | 2021-09-26 | 2024-04-16 | 北京建筑大学 | 一种行人检测方法、装置、电子设备及存储介质 |
CN113902024B (zh) * | 2021-10-20 | 2024-06-04 | 浙江大立科技股份有限公司 | 基于深度学习与双波段融合的小体积目标检测识别方法 |
CN113901944B (zh) * | 2021-10-25 | 2024-04-09 | 大连理工大学 | 一种基于改进的yolo算法的海洋生物目标检测方法 |
CN115082909B (zh) * | 2021-11-03 | 2024-04-12 | 中国人民解放军陆军军医大学第一附属医院 | 一种肺部病变识别方法及*** |
CN114359644B (zh) * | 2021-12-22 | 2024-04-16 | 华南农业大学 | 基于改进vgg-16网络的农作物病虫害识别方法 |
CN114283320B (zh) * | 2021-12-25 | 2024-06-14 | 福州大学 | 基于全卷积的无分支结构目标检测方法 |
CN114495166A (zh) * | 2022-01-17 | 2022-05-13 | 北京小龙潜行科技有限公司 | 一种应用于边缘计算设备的牧场换鞋动作识别方法 |
CN114612769B (zh) * | 2022-03-14 | 2023-05-26 | 电子科技大学 | 一种融入局部结构信息的集成感知红外成像舰船检测方法 |
CN114884775A (zh) * | 2022-03-31 | 2022-08-09 | 南京邮电大学 | 一种基于深度学习的大规模mimo***信道估计方法 |
CN114863097B (zh) * | 2022-04-06 | 2024-05-31 | 北京航空航天大学 | 一种基于注意力机制卷积神经网络的红外弱小目标检测方法 |
CN115019036B (zh) * | 2022-05-10 | 2024-02-27 | 西北工业大学 | 一种学习非目标知识的小样本语义分割方法 |
CN115082386B (zh) * | 2022-06-07 | 2024-04-26 | 华南理工大学 | 基于正常样本辅助特征提取的注塑件瑕疵检测方法、装置及介质 |
CN115423810B (zh) * | 2022-11-04 | 2023-03-14 | 国网江西省电力有限公司电力科学研究院 | 一种风力发电机组叶片覆冰形态分析方法 |
CN116468928B (zh) * | 2022-12-29 | 2023-12-19 | 长春理工大学 | 一种基于视觉感知关联器的热红外小目标检测方法 |
CN116524293B (zh) * | 2023-04-10 | 2024-01-30 | 哈尔滨市科佳通用机电股份有限公司 | 基于深度学习的闸调器拉杆头丢失故障识别方法及*** |
CN117237614B (zh) * | 2023-11-10 | 2024-02-06 | 江西啄木蜂科技有限公司 | 基于深度学习的湖面漂浮物小目标检测方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105787439A (zh) * | 2016-02-04 | 2016-07-20 | 广州新节奏智能科技有限公司 | 一种基于卷积神经网络的深度图像人体关节定位方法 |
CN105956608A (zh) * | 2016-04-21 | 2016-09-21 | 恩泊泰(天津)科技有限公司 | 一种基于深度学习的目标定位、分类算法 |
CN106934346A (zh) * | 2017-01-24 | 2017-07-07 | 北京大学 | 一种目标检测性能优化的方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107341517B (zh) * | 2017-07-07 | 2020-08-11 | 哈尔滨工业大学 | 基于深度学习层级间特征融合的多尺度小物体检测方法 |
CN107563349A (zh) * | 2017-09-21 | 2018-01-09 | 电子科技大学 | 一种基于VGGNet的人数估计方法 |
-
2018
- 2018-01-24 CN CN201810069322.XA patent/CN108399362B/zh active Active
- 2018-07-10 WO PCT/CN2018/095058 patent/WO2019144575A1/zh active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105787439A (zh) * | 2016-02-04 | 2016-07-20 | 广州新节奏智能科技有限公司 | 一种基于卷积神经网络的深度图像人体关节定位方法 |
CN105956608A (zh) * | 2016-04-21 | 2016-09-21 | 恩泊泰(天津)科技有限公司 | 一种基于深度学习的目标定位、分类算法 |
CN106934346A (zh) * | 2017-01-24 | 2017-07-07 | 北京大学 | 一种目标检测性能优化的方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2019144575A1 (zh) | 2019-08-01 |
CN108399362A (zh) | 2018-08-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108399362B (zh) | 一种快速行人检测方法及装置 | |
CN109584248B (zh) | 基于特征融合和稠密连接网络的红外面目标实例分割方法 | |
CN108830285B (zh) | 一种基于Faster-RCNN的加强学习的目标检测方法 | |
CN113065558B (zh) | 一种结合注意力机制的轻量级小目标检测方法 | |
CN108389220B (zh) | 遥感视频图像运动目标实时智能感知方法及其装置 | |
CN111160249A (zh) | 基于跨尺度特征融合的光学遥感图像多类目标检测方法 | |
CN114220035A (zh) | 一种基于改进yolo v4的快速害虫检测方法 | |
JP6397379B2 (ja) | 変化領域検出装置、方法、及びプログラム | |
CN112733614B (zh) | 一种带有相似尺寸强化识别的害虫图像检测方法 | |
CN111160407A (zh) | 一种深度学习目标检测方法及*** | |
CN112884742A (zh) | 一种基于多算法融合的多目标实时检测、识别及跟踪方法 | |
CN109165658B (zh) | 一种基于Faster-RCNN的强负样本水下目标检测方法 | |
CN111126278A (zh) | 针对少类别场景的目标检测模型优化与加速的方法 | |
WO2023116632A1 (zh) | 基于时空记忆信息的视频实例分割方法和分割装置 | |
CN112232355A (zh) | 图像分割网络处理、图像分割方法、装置和计算机设备 | |
Guo et al. | Using multi-scale and hierarchical deep convolutional features for 3D semantic classification of TLS point clouds | |
CN109635667A (zh) | 一种基于Guided Faster-RCNN的车辆检测*** | |
CN112330684A (zh) | 对象分割方法、装置、计算机设备及存储介质 | |
CN111723660A (zh) | 一种用于长形地面目标检测网络的检测方法 | |
US11367206B2 (en) | Edge-guided ranking loss for monocular depth prediction | |
Aldhaheri et al. | MACC Net: Multi-task attention crowd counting network | |
CN112926667A (zh) | 深度融合边缘与高层特征的显著性目标检测方法及装置 | |
CN110399868B (zh) | 一种滨海湿地鸟类检测方法 | |
CN116110074A (zh) | 一种基于图神经网络的动态小股行人识别方法 | |
CN115393901A (zh) | 一种跨模态行人重识别方法及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |