CN106022237B - 一种端到端的卷积神经网络的行人检测方法 - Google Patents

一种端到端的卷积神经网络的行人检测方法 Download PDF

Info

Publication number
CN106022237B
CN106022237B CN201610315688.1A CN201610315688A CN106022237B CN 106022237 B CN106022237 B CN 106022237B CN 201610315688 A CN201610315688 A CN 201610315688A CN 106022237 B CN106022237 B CN 106022237B
Authority
CN
China
Prior art keywords
neural networks
pedestrian detection
pedestrian
convolutional neural
convolutional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201610315688.1A
Other languages
English (en)
Other versions
CN106022237A (zh
Inventor
李鸿升
范峻铭
周辉
胡欢
曹滨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201610315688.1A priority Critical patent/CN106022237B/zh
Publication of CN106022237A publication Critical patent/CN106022237A/zh
Application granted granted Critical
Publication of CN106022237B publication Critical patent/CN106022237B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/103Static body considered as a whole, e.g. static pedestrian or occupant recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种端到端的卷积神经网络的行人检测方法,用以解决现有行人检测算法检测精度不高、算法复杂和多模块融合困难等问题。采用了一种新的端到端的卷积神经网络,通过构建带有标注的训练样本集,采用端到端训练,得到一个能预测行人候选框和相应框的置信度的卷积神经网络模型。测试时,将测试图片输入训练好的模型内,即可得到相应的行人检测框和置信度。最后进行非极大值抑制和阀值筛选,得到最佳行人区域。本发明与以往发明相比,具有两大优势:一是端到端训练和测试,使整个模型训练和测试都极为容易;二是本发明通过构建候选框回归网络,解决了行人尺度和比例问题,不需要以往的发明采用的金字塔技术,极大的节约了计算资源。

Description

一种端到端的卷积神经网络的行人检测方法
技术领域
本发明属于模式识别技术领域,尤其涉及一种端到端的卷积神经网络的行人检测方法。
背景技术
模式识别是人工智能和图像处理领域的一个重要交叉学科,是近年来研究热点所在。早期的任务的解决方法主要依靠人类的专业领域知识,来设计某个算法或者构建某个***,问题解决效果受人类的知识水平所限制。随着人工智能的发展,卷积神经网络于90年代由Lecun正式提出。Hinton在2012年对原始的卷积神经网络进行了改进,在ImageNet大赛上取得了第一的成绩。从此以后,卷积神经网络开始广泛应用于计算机视觉、自然语言处理和智能搜索等领域。卷积神经网络由于其层间联系和参数共享等优势,使其广泛运用在图像处理中。
经过对现有技术的检索发现,中国专利文献号CN105335716A公开(公告)日2016.02.17,公开了一种基于改进UDN提取联合特征的行人检测方法,包含:图像预处理;基于卷积神经网络对预处理的图像提取人体整体特征和局部特征;对步骤整体特征和局部特征输出的类别概率进行加权得到最终概率值,根据最终概率值判断原始输入图像是否包含行人,该技术虽然实现了与以前模型相比较低的漏检率,但实际漏检率还是偏高,而且该技术并没有做到端到端的训练,必须依靠于HOG+CSS++SVM算法来获得行人的初始候选区域。该技术需要进行模块级联,使整个***偏复杂。
发明内容
本发明的目的就在于为了解决上述问题而提供一种端到端的卷积神经网络的行人检测方法。本发明最终在加州理工测试集上实现了18.66%的漏检率。
本发明通过以下技术方案来实现上述目的:
一种端到端的卷积神经网络的行人检测方法,其包括以下步骤:
通过构建带有标注图片库作为训练样本集,直接端到端训练,得到一个能预测行人候选框和行人候选框置信度的卷积神经网络模型;
测试时,将测试图片输入卷积神经网络模型,得到相应的行人检测框和置信度;
最后进行非极大值抑制筛选,压缩重复的行人检测框;
阈值筛选,根据置信度选出最佳的行人检测框。
上述技术方案中,所述标注是指记录下行人在整张图像中的左上角点和右下角点的坐标。
上述技术方案中,所述端到端是指除了数据预处理外的所有操作,都可以包含在一个卷积神经网络的框架内。
上述技术方案中,所述的卷积神经网络模型是由16个卷积层,和一个上采样层和一个Softmax层构成,前13个卷积层按顺序依次级联,将上采样层接到第13个卷积层上,然后上采样层输出与第10个卷积层进行级联,并将级联后的特征接入到第14个卷积层上,第15个卷积层和第16个卷积层均直接连接到第14个所述卷积层上,Softmax层连接到第15个卷积层上;其中,上采样层负责对第13个卷积层进行插值放大2倍;第15个卷积层输出行人检测框包含行人的置信度,第16个卷积层输出行人检测框的位置参数,Softmax层负责对置信度进行归一化处理。
上述技术方案中,训练卷积神经网络的具体步骤如下:
A1:构建卷积神经网络;
A2:对网络进行初始化,对于18层网络架构:卷积层1到卷积层13的参数finetune自在ImageNet数据集上预训练的VGG16模型;并将前4层学习率设置为0。其它层由高斯分布生成的小随机数初始化网络中待训练参数;
A3:对输入的样本图像每一点计算锚点框,并与原始的标注区域计算偏移量,将图像、图像标签和偏移量输入到网络中,进行前向传播。
A4:利用SmoothL1和SoftMaxwithLoss作为损失函数,得到误差项。使用反向传播算法,利用SGD调整网络参数,使误差项最小。
上述技术方案中,所述的非极大值抑制是指,多个互相重合的行人检测框中,按照输出的置信度,选出置信度最大的那个行人检测框,其它行人检测框舍弃。
上述技术方案中,所述的阈值选择是指,在输出的行人检测框中,选择置信度大于一定数值的行人检测框,作为最佳行人检测框。
本发明的有益效果在于:
采用了一种新的端到端的卷积神经网络,通过构建带有标注的训练样本集和端到端训练,得到一个能预测行人候选框和相应框的置信度的卷积神经网络模型。测试时,将测试图片输入训练好的模型内,即可得到相应的行人检测框和置信度。最后进行非极大值抑制和阈值筛选。本发明与以往发明相比,具有两大优势:一是端到端训练和测试,使整个模型训练测试都极为容易;二是本发明通过构建候选框回归网络,解决了行人尺度和比例问题,不需要以往的发明采用的金字塔技术,极大的节约了计算资源。本发明最终实现了较好的回召率和较低的漏检率。
附图说明
图1是本发明所述行人检测方法的流程图;
图2为本发明所述18层网络的示意图;
具体实施方式
下面结合附图对本发明作进一步说明:
本发明中的一些术语解释如下:
术语1:BP算法
BP算法是一种反向传播算法,分为前向过程、反向过程两部分,其中前向过程是指将数据输入到网络中得到最终结果的过程,反向过程是指将前向过程和样本实际数值的差值作为误差,对网络权重进行更新的过程。
如图1所示,本发明通过构建带有标注图片库作为训练样本集,直接端到端训练,得到一个能预测行人候选框和相应框的置信度的卷积神经网络模型。测试时,将测试图片输入训练好的模型内,即可得到相应的行人检测框和置信度。最后进行非极大值抑制和阈值筛选。
其中,标注是指记录下行人在一整张图像中的左上角点和右下角点的坐标。
在具体操作中,采用了Caltech的训练集,不同天气情况、不同场景下,通过行车记录仪拍摄的行人照片(包括背景),从拍摄照片中标出行人位置,通过ignore label进行训练样本选择,得到包含行人彩色图片9100张,并做镜像变换来增大样本数量,把所得到的图像短边尺寸归一化为800,之后构建卷积神经网络,并将训练样本集送入模型进行训练。
如图2所示,卷积神经网络中的卷积层1到卷积层13串联,即Conv1-Conv13依次串联,然后将上采样层(Dconv)接到Conv13上,并将上采样层的输出和Conv10的输出级联,然后级联后的特征输入到Conv14中,卷积层15和卷积层16直接连接到卷积层14上,即将Conv15和Conv16均直接与Conv14相连接,Softmax层直接连接到卷积层15上。其中,前13个卷积层(Conv1-Conv13)作为特征提取,上采样层负责对特征图进行放大2倍,第14个卷积层(Conv14)作为特征映射,剩余2个卷积层(Conv15和Conv16)分别输出回归框包含行人的置信度和回归框的位置参数,Softmax层负责对置信度进行归一化调整,其中四个卷积层(Conv2、Conv4、Conv7和Conv10)后面跟了ReLU和pool操作,其它卷积层后面跟了ReLU操作,其中pool操作的核大小为2,偏移量为2。网络参数如表1所示。
表1
构建锚点框大小为(32*32,48*48,64*64,80*80)像素和1个比较典型的行人比例(2.4)基准框,共4个基准框,具体偏移量为[-1,-15,18,32],[-11,-39,28,56],[-31,-87,48,104],[-71,-183,88,200]。
卷积神经网络训练和测试步骤:
1、样本准备,来自于caltech数据集的9000张图片并进行镜像翻转,图像插值使图像短边为800个像素点,并准备好所有图片的标注,即行人的左上角和右下角的坐标。
2、构建如图2所示的卷积神经网络的模型,参数设置如表1所示,对网络进行初始化,前四层的参数finetune于ImageNet的VGG16模型,其它层用标注差为0.01的高斯分布随机初始化网络中待训练参数;
3、向初始化后的网络中输入18000个训练样本来进行训练,先对样本图像的每一个像素点赋予4个基本框,即左上点和右下点的坐标加上基本框的偏移量,然后根据基本框与标注框之间的重合比例(IOU),当大于0.5时设置标签为1,其它时候设置为0,然后进行前向传播,计算预测的置信度和标签的Softmax损失值,计算预测的框和标注框的SmoothL1损失值,使用反向传播BP算法,调整卷积神经网络参数,使SmoothL1和Softmax损失函数值和最小;
4、得到最终模型。
5、将准备好的图片输入训练模型中,图像插值使图像短边为800个像素点,即可得到行人的候选框和输出行人的候选框置信度。
以上仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围内。

Claims (4)

1.一种端到端的卷积神经网络的行人检测方法,其特征在于:
通过构建带有标注图片库作为训练样本集,直接端到端训练,得到一个能预测行人候选框和行人候选框置信度的卷积神经网络模型;
测试时,将测试图片输入卷积神经网络模型,得到相应的行人检测框和置信度;
最后进行非极大值抑制筛选,压缩重复的行人检测框;所述的非极大值抑制是指,多个互相重合的行人检测框中,按照输出的置信度,选出置信度最大的那个行人检测框,其它行人检测框舍弃;
阈值筛选,根据置信度选出最佳的行人检测框;
所述的卷积神经网络模型是由16个卷积层,和一个上采样层和一个Softmax层构成,前13个卷积层按顺序依次级联,将上采样层接到第13个卷积层上,然后上采样层输出与第10个卷积层进行级联,并将级联后的特征接入到第14个卷积层上,第15个卷积层和第16个卷积层均直接连接到第14个所述卷积层上,Softmax层连接到第15个卷积层上;其中,上采样层负责对第13个卷积层进行插值放大2倍;第15个卷积层输出行人检测框包含行人的置信度,第16个卷积层输出行人检测框的位置参数,Softmax层负责对置信度进行归一化处理;
训练卷积神经网络的具体步骤如下:
A1:构建卷积神经网络;
A2:对网络进行初始化,对于18层网络架构:卷积层1到卷积层13的参数finetune自在ImageNet数据集上预训练的VGG16模型;
并将前4层学习率设置为0;
其它层由高斯分布生成的小随机数初始化网络中待训练参数;
A3:对输入的样本图像每一点计算锚点框,并与原始的标注区域计算偏移量,将图像、图像标签和偏移量输入到网络中,进行前向传播;
A4:利用SmoothL1和SoftMaxwithLoss作为损失函数,得到误差项;
使用反向传播算法,利用SGD调整网络参数,使误差项最小。
2.根据权利要求1所述的一种端到端的卷积神经网络的行人检测方法,其特征在于:所述标注是指记录下行人在整张图像中的左上角点和右下角点的坐标。
3.根据权利要求1所述的一种端到端的卷积神经网络的行人检测方法,其特征在于:所述端到端是指除了数据预处理外的所有操作,都可以包含在一个卷积神经网络的框架内。
4.根据权利要求1所述的一种端到端的卷积神经网络的行人检测方法,其特征在于:所述的阈值筛选是指,在输出的行人检测框中,选择置信度大于一定数值的行人检测框,作为最佳行人检测框。
CN201610315688.1A 2016-05-13 2016-05-13 一种端到端的卷积神经网络的行人检测方法 Expired - Fee Related CN106022237B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610315688.1A CN106022237B (zh) 2016-05-13 2016-05-13 一种端到端的卷积神经网络的行人检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610315688.1A CN106022237B (zh) 2016-05-13 2016-05-13 一种端到端的卷积神经网络的行人检测方法

Publications (2)

Publication Number Publication Date
CN106022237A CN106022237A (zh) 2016-10-12
CN106022237B true CN106022237B (zh) 2019-07-12

Family

ID=57100341

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610315688.1A Expired - Fee Related CN106022237B (zh) 2016-05-13 2016-05-13 一种端到端的卷积神经网络的行人检测方法

Country Status (1)

Country Link
CN (1) CN106022237B (zh)

Families Citing this family (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106570564B (zh) * 2016-11-03 2019-05-28 天津大学 基于深度网络的多尺度行人检测方法
CN106529485A (zh) * 2016-11-16 2017-03-22 北京旷视科技有限公司 用于获取训练数据的方法及装置
CN108122035B (zh) * 2016-11-29 2019-10-18 科大讯飞股份有限公司 端到端建模方法及***
CN106686472B (zh) * 2016-12-29 2019-04-26 华中科技大学 一种基于深度学习的高帧率视频生成方法及***
CN106682697B (zh) * 2016-12-29 2020-04-14 华中科技大学 一种基于卷积神经网络的端到端物体检测方法
CN106845374B (zh) * 2017-01-06 2020-03-27 清华大学 基于深度学习的行人检测方法及检测装置
CN106845383B (zh) * 2017-01-16 2023-06-06 腾讯科技(上海)有限公司 人头检测方法和装置
CN108416250B (zh) * 2017-02-10 2021-06-22 浙江宇视科技有限公司 人数统计方法及装置
CN107038448B (zh) * 2017-03-01 2020-02-28 中科视语(北京)科技有限公司 目标检测模型构建方法
CN106803084B (zh) * 2017-03-02 2020-08-07 中科视拓(北京)科技有限公司 一种基于端到端循环网络的面部特征点定位方法
CN107145900B (zh) * 2017-04-24 2019-07-26 清华大学 基于一致性约束特征学习的行人再识别方法
CN107194418B (zh) * 2017-05-10 2021-09-28 中国科学院合肥物质科学研究院 一种基于对抗特征学习的水稻蚜虫检测方法
CN107220618B (zh) * 2017-05-25 2019-12-24 中国科学院自动化研究所 人脸检测方法及装置、计算机可读存储介质、设备
CN108229524A (zh) * 2017-05-25 2018-06-29 北京航空航天大学 一种基于遥感图像的烟囱和冷凝塔检测方法
CN107301376B (zh) * 2017-05-26 2021-04-13 浙江大学 一种基于深度学习多层刺激的行人检测方法
CN108986064B (zh) * 2017-05-31 2022-05-06 杭州海康威视数字技术股份有限公司 一种人流量统计方法、设备及***
CN109101859A (zh) * 2017-06-21 2018-12-28 北京大学深圳研究生院 使用高斯惩罚检测图像中行人的方法
CN107403141B (zh) * 2017-07-05 2020-01-10 中国科学院自动化研究所 人脸检测方法及装置、计算机可读存储介质、设备
CN107563274A (zh) * 2017-07-10 2018-01-09 安徽四创电子股份有限公司 一种基于对抗网络学习的视频的车辆检测方法和计数方法
CN107578091B (zh) * 2017-08-30 2021-02-05 电子科技大学 一种基于轻量级深度网络的行人车辆实时检测方法
CN107742093B (zh) * 2017-09-01 2020-05-05 国网山东省电力公司电力科学研究院 一种红外图像电力设备部件实时检测方法、服务器及***
CN107563349A (zh) * 2017-09-21 2018-01-09 电子科技大学 一种基于VGGNet的人数估计方法
CN107909021A (zh) * 2017-11-07 2018-04-13 浙江师范大学 一种基于单个深层卷积神经网络的路牌检测方法
CN108229390A (zh) * 2018-01-02 2018-06-29 济南中维世纪科技有限公司 基于深度学习的快速行人检测方法
CN109002752A (zh) * 2018-01-08 2018-12-14 北京图示科技发展有限公司 一种基于深度学习的复杂公共场景快速行人检测方法
US11282389B2 (en) 2018-02-20 2022-03-22 Nortek Security & Control Llc Pedestrian detection for vehicle driving assistance
CN108509978B (zh) * 2018-02-28 2022-06-07 中南大学 基于cnn的多级特征融合的多类目标检测方法及模型
CN108509859B (zh) * 2018-03-09 2022-08-26 南京邮电大学 一种基于深度神经网络的无重叠区域行人跟踪方法
CN108898047B (zh) * 2018-04-27 2021-03-19 中国科学院自动化研究所 基于分块遮挡感知的行人检测方法及***
CN108876765A (zh) * 2018-05-22 2018-11-23 塞伯睿机器人技术(长沙)有限公司 工业分拣机器人的目标定位装置和方法
CN108846415A (zh) * 2018-05-22 2018-11-20 长沙理工大学 工业分拣机器人的目标识别装置和方法
CN108846344B (zh) * 2018-06-05 2022-05-17 中南大学 一种融合深度学习的行人姿势多特征智能辨识方法
CN108805070A (zh) * 2018-06-05 2018-11-13 合肥湛达智能科技有限公司 一种基于嵌入式终端的深度学习行人检测方法
CN108742679B (zh) * 2018-06-29 2022-07-05 上海联影医疗科技股份有限公司 结节检测装置和方法
WO2020010639A1 (zh) * 2018-07-13 2020-01-16 华为技术有限公司 一种用于神经网络的卷积方法及装置
CN109492576B (zh) * 2018-11-07 2021-06-22 北京旷视科技有限公司 图像识别方法、装置及电子设备
CN109472264B (zh) * 2018-11-09 2020-10-27 北京字节跳动网络技术有限公司 用于生成物体检测模型的方法和装置
CN109558902A (zh) * 2018-11-20 2019-04-02 成都通甲优博科技有限责任公司 一种快速目标检测方法
CN109801270B (zh) 2018-12-29 2021-07-16 北京市商汤科技开发有限公司 锚点确定方法及装置、电子设备和存储介质
CN109886286B (zh) * 2019-01-03 2021-07-23 武汉精测电子集团股份有限公司 基于级联检测器的目标检测方法、目标检测模型及***
CN109858436B (zh) * 2019-01-29 2020-11-27 中国科学院自动化研究所 基于视频动态前景掩膜的目标类别修正方法、检测方法
CN109961009B (zh) * 2019-02-15 2023-10-31 平安科技(深圳)有限公司 基于深度学习的行人检测方法、***、装置及存储介质
CN109886205B (zh) * 2019-02-25 2023-08-08 苏州清研微视电子科技有限公司 安全带实时监测方法和***
CN110516529A (zh) * 2019-07-09 2019-11-29 杭州电子科技大学 一种基于深度学习图像处理的投喂检测方法和***
CN110507318A (zh) * 2019-08-16 2019-11-29 武汉中旗生物医疗电子有限公司 一种心电信号qrs波群定位方法及装置
CN110598596A (zh) * 2019-08-29 2019-12-20 深圳市中电数通智慧安全科技股份有限公司 一种危险行为监测方法、装置及电子设备
CN110807459B (zh) * 2019-10-31 2022-06-17 深圳市捷顺科技实业股份有限公司 车牌矫正方法、装置以及可读存储介质
CN111368625B (zh) * 2019-11-08 2024-02-27 深圳北航新兴产业技术研究院 一种基于级联优化的行人目标检测方法
CN110991305B (zh) * 2019-11-27 2023-04-07 厦门大学 一种遥感图像下的飞机检测方法及存储介质
CN111611869B (zh) * 2020-04-25 2021-06-01 哈尔滨理工大学 一种基于串行深度神经网络的端到端单目视觉避障方法
CN111813997B (zh) * 2020-09-08 2020-12-29 平安国际智慧城市科技股份有限公司 入侵分析方法、装置、设备及存储介质
CN113688703B (zh) * 2021-08-12 2023-11-03 上海交通大学 基于fpga的低延时非极大值抑制方法与装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101187984A (zh) * 2007-12-05 2008-05-28 北京中星微电子有限公司 一种图像检测方法及装置
CN104166861A (zh) * 2014-08-11 2014-11-26 叶茂 一种行人检测方法
CN104657724A (zh) * 2015-03-12 2015-05-27 福建依图网络科技有限公司 一种交通视频行人检测方法
CN104881662A (zh) * 2015-06-26 2015-09-02 北京畅景立达软件技术有限公司 一种单幅图像行人检测方法
CN105335716A (zh) * 2015-10-29 2016-02-17 北京工业大学 一种基于改进udn提取联合特征的行人检测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8050459B2 (en) * 2008-07-25 2011-11-01 GM Global Technology Operations LLC System and method for detecting pedestrians

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101187984A (zh) * 2007-12-05 2008-05-28 北京中星微电子有限公司 一种图像检测方法及装置
CN104166861A (zh) * 2014-08-11 2014-11-26 叶茂 一种行人检测方法
CN104657724A (zh) * 2015-03-12 2015-05-27 福建依图网络科技有限公司 一种交通视频行人检测方法
CN104881662A (zh) * 2015-06-26 2015-09-02 北京畅景立达软件技术有限公司 一种单幅图像行人检测方法
CN105335716A (zh) * 2015-10-29 2016-02-17 北京工业大学 一种基于改进udn提取联合特征的行人检测方法

Also Published As

Publication number Publication date
CN106022237A (zh) 2016-10-12

Similar Documents

Publication Publication Date Title
CN106022237B (zh) 一种端到端的卷积神经网络的行人检测方法
JP6866495B2 (ja) 画像品質の評価方法及び画像品質の評価システム
CN110163299B (zh) 一种基于自底向上注意力机制和记忆网络的视觉问答方法
CN111292264B (zh) 一种基于深度学习的图像高动态范围重建方法
CN109740413A (zh) 行人重识别方法、装置、计算机设备及计算机存储介质
CN106127204A (zh) 一种全卷积神经网络的多方向水表读数区域检测算法
CN109241982A (zh) 基于深浅层卷积神经网络的目标检测方法
CN110298361A (zh) 一种rgb-d图像的语义分割方法和***
CN110516539A (zh) 基于对抗网络的遥感影像建筑物提取方法、***、存储介质及设备
CN107818302A (zh) 基于卷积神经网络的非刚性多尺度物体检测方法
CN107066973A (zh) 一种利用时空注意力模型的视频内容描述方法
CN106844442A (zh) 基于fcn特征提取的多模态循环神经网络图像描述方法
CN111950453A (zh) 一种基于选择性注意力机制的任意形状文本识别方法
CN103578119A (zh) 基于超像素的Codebook动态场景中目标检测方法
CN110705412A (zh) 一种基于运动历史图像的视频目标检测方法
CN109919073B (zh) 一种具有光照鲁棒性的行人再识别方法
CN109597998A (zh) 一种视觉特征和语义表征联合嵌入的图像特征构建方法
CN112686276A (zh) 一种基于改进RetinaNet网络的火焰检测方法
CN110245602A (zh) 一种基于深度卷积特征的水下静目标识别方法
CN109712171A (zh) 一种基于相关滤波器的目标跟踪***及目标跟踪方法
CN112734803A (zh) 基于文字描述的单目标跟踪方法、装置、设备及存储介质
Yang et al. [Retracted] A Method of Image Semantic Segmentation Based on PSPNet
CN111126155A (zh) 一种基于语义约束生成对抗网络的行人再识别方法
Zhu et al. An adaptive post-processing network with the global-local aggregation for semantic segmentation
CN112733552B (zh) 机器翻译模型构建方法、装置以及设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20190712

Termination date: 20200513