CN112926500B - 一种结合头部和整体信息的行人检测方法 - Google Patents

一种结合头部和整体信息的行人检测方法 Download PDF

Info

Publication number
CN112926500B
CN112926500B CN202110302808.5A CN202110302808A CN112926500B CN 112926500 B CN112926500 B CN 112926500B CN 202110302808 A CN202110302808 A CN 202110302808A CN 112926500 B CN112926500 B CN 112926500B
Authority
CN
China
Prior art keywords
head
bounding box
pedestrian
detection
whole
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110302808.5A
Other languages
English (en)
Other versions
CN112926500A (zh
Inventor
陈勇
谢文阳
刘焕淋
黄美永
黄俊杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN202110302808.5A priority Critical patent/CN112926500B/zh
Publication of CN112926500A publication Critical patent/CN112926500A/zh
Application granted granted Critical
Publication of CN112926500B publication Critical patent/CN112926500B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明涉及一种结合头部和整体信息的行人检测方法,属于目标检测领域。首先,使用卷积神经网络提取目标的特征信息并获得多个具有不同分辨率以及激活程度的特征图。其次,使用这些特征图构建特征金字塔,通过融合不同子结构的输出分别为行人头部和整体检测提供有针对性的特征信息。然后,在行人检测的基础上添加头部检测分支并从对应的特征图中预测行人头部和行人整体。最后,使用改进的非极大值抑制算法融合两个分支的输出并得到最终结果。本发明充分利用了行人的特征信息,有效提升了遮挡行人的检测准确性。

Description

一种结合头部和整体信息的行人检测方法
技术领域
本发明属于目标检测领域,涉及一种结合头部和整体信息的行人检测方法。
背景技术
依据特征提取方式的差异可将行人检测方法分为两类:第一类为基于手工特征的检测方法,此类方法采用预先设计的特征提取算子获取特征信息;第二类为基于深度学习的检测方法,此类方法采用自学习的方式获取特征信息。
基于手工特征提取算子的检测方法:首先,使用滤波器获得图像中目标的关键点信息,然后,计算每个关键点与其相邻像素间的梯度值并生成统计直方图,最后,使用SVM或Adaboost等分类器进行特征分类获得图像中的行人信息。此类方法能捕获图像中目标的局部特征进而对其外观和形状进行描述,其优点在于计算较为简单且具有较好的检测准确性,但该方法对遮挡行人的检测效果不佳并且准确性远远无法满足实际要求。自然场景中存在大量干扰因素如遮挡和光照变化等,由于行人自身的特点导致其容易被场景中的物体遮挡且行人与行人之间也会出现遮挡情况,而传统方法捕获的关键点一般是对其外观形状的描述,同时行人自身姿态也会产生很大变化,这些都会导致此类方法的检测准确性出现大幅度下降。
基于深度学***且检测速度也越来越快,但遮挡造成的检测准确性降低的问题依然存在。
部分方法采用注意力机制使模型更多关注目标未被遮挡的有效部分,并引导模型对目标位置进行修正从而一定程度上减轻该问题造成的影响,但这种方式会增加计算量从而使检测器的实时性能下降。除此之外,一些方法采用特征金字塔结构使用不同大小的特征图进行检测,从而提升模型对不同尺度行人的检测准确性,但这类方法未能充分考虑网络浅层对小尺度目标的激活程度较高这一特点,因而对于检测准确性的提升依然不是十分明显。一般行人检测数据集使用矩形边界框标注行人,该方式会引入大量背景像素从而在训练阶段影响模型对行人特征的学习。为解决该问题,一些方法使用头部至底部的直线标注行人从而改善遮挡情况下的检测性能,但是这种方式仅对行人与行人之间的遮挡问题有一定改善,对于被场景中物体所遮挡的行人检测效果依然不理想。
发明内容
有鉴于此,本发明的目的在于提供一种结合头部和整体信息的行人检测方法。为了提升对遮挡行人的检测准确性,该方法同时检测行人头部和整体并将两者结合以增强行人的特征信息。另外,该方法通过引入网络浅层特征图的方式提升对小尺度目标的检测准确率。通过构建具有多层结构的特征金字塔并融合不同子结构输出的特征图从而分别为头部检测和整体检测提供针对性的特征信息。
为达到上述目的,本发明提供如下技术方案:
一种结合头部和整体信息的行人检测方法,该方法包括以下步骤:
S1:将数据集中的行人及其头部矩形边界框标签转换为中心点标签,同时对图像进行相应的预处理;
S2:基于深度卷积神经网络搭建特征提取模块获取用于检测的行人头部和整体特征图信息;
S3:构建包含头部检测和整体检测两个分支的检测模块,检测模块从特征图中预测中心点位置、高度和偏移量信息,生成头部边界框和整体边界框;
S4:对于获得的头部边界框和整体边界框,使用改进后的非极大值抑制算法将两者结合,同时滤除置信度较低的边界框从而得到最终的检测结果。
可选的,所述S1包含以下步骤:
S11:对训练图像进行随机比例的缩放,若图像大小小于预设尺寸则使用灰度像素点进行填充,若其大小大于预设尺寸则对边缘进行裁剪,同时对边界框标签进行位置修正;
S12:对训练图像进行随机水平翻转,同时修正边界框坐标;
S13:将图像从RGB颜色空间转换至HSV或HSL等颜色空间,同时对图像的亮度进行随机调整;
S14:根据标签信息计算获得其头部中心位置(xh,yh)和整体中心位置(xb,yb),使用二维高斯函数G(·)分别生成头部中心点掩膜Mhead和整体中心点掩膜Mbody
Figure BDA0002986988240000021
可选的,所述S2中,构建特征提取模块包括以下步骤:
S21:使用主干网络对图像进行特征提取,获得四张具有不同激活程度以及大小的特征图{p1,p2,p3,p4};
S22:对特征图{p1,p2,p3,p4}使用卷积进行计算得到特征图{P1,P2,P3,P4},对特征图P4使用相同的卷积计算得到特征图P5,从而构成具有五层结构的特征金字塔;
S23:对特征图P2和P3进行上采样使其大小与P1保持一致,融合这三张特征图从而获得用于头部检测特征图Fhead;对特征图P4和P5进行相同运算使其大小与P3一致,融合特征图P3、P4和P5得到用于行人整体检测的特征图Fbody
可选的,所述S3中,使用改进后的非极大值抑制算法将两者结合,同时滤除置信度较低的边界框从而得到最终的检测结果包含以下步骤:
S31:从头部特征图Fhead中预测获得头部中心点Chead、高度Hhead以及位置偏移量Ohead,同时生成头部边界框Bhead
S32:从整体特征图Fbody中预测获得整体中心点Cbody、高度Hbody以及位置偏移量Obody,同时生成整体边界框Bbody
可选的,所述S4中,执行检测结果筛选具体包括以下步骤:
S41:对于检测部分输出的行人整体边界框
Figure BDA0002986988240000031
其中
Figure BDA0002986988240000032
Figure BDA0002986988240000033
分别为边界框的左上角点和右下角点,基于边界框的高度hb和宽度wb计算获得行人的头部区域Hregion
Figure BDA0002986988240000034
S42:对于每一个行人整体边界框Bbody,首先判断其头部区域Hregion内是否存在头部边界框Bhead,若存在则选取位于该区域中置信度s最高的头部边界框与之配对得到{Bbody,Bhead,sbody,shead};
S43:如果整体边界框的置信度较高则直接予以保留,如果行人边界框的置信度较低但存在与之配对的头部边界框,并且头部边界框的置信度较高,则依然保留该行人整体边界框。
本发明的有益效果在于:本发明考虑到行人的头部不易被遮挡这一特点,将其与行人检测进行结合从而提升检测准确性。通过引入网络浅层的特征信息,提升头部以及小尺度目标在特征图中的激活程度。另外,通过使用中心点对头部和整体进行标注减少背景像素的引入提升网络对行人特征的辨别能力。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作优选的详细描述,其中:
图1为本发明的网络模型结构;
图2为模型的特征提取模块结构;
图3为模型的检测模块结构;
图4为本发明界定的行人头部区域示意图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
其中,附图仅用于示例性说明,表示的仅是示意图,而非实物图,不能理解为对本发明的限制;为了更好地说明本发明的实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
本发明实施例的附图中相同或相似的标号对应相同或相似的部件;在本发明的描述中,需要理解的是,若有术语“上”、“下”、“左”、“右”、“前”、“后”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此附图中描述位置关系的用语仅用于示例性说明,不能理解为对本发明的限制,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
一种结合头部和整体信息的行人检测方法,基于卷积神经网络实现并使用中心点标注头部及整体。首先,构建具有多层结构的特征金字塔,通过融合该特征金字塔不同子结构输出的特征图从而为头部检测和整体检测提供有针对性的特征信息。然后,预测模块从特征图中预测目标中心点、高度以及偏移量,并分别生成行人头部边界框和整体边界框。最后,提出一种信息融合方法将行人头部信息和整体信息较好的结合。
使用主干网络提取头部和整体的特征信息并得到四张具有不同分辨率的特征图,对这四张特征图进行卷积运算,并对分辨率最小的特征图使用相同的卷积计算得到第五张特征图,从而构成具有五层结构的特征金字塔;融合该特征金字塔不同子结构的特征图从而得到分别用于头部检测和整体检测的特征图;检测模块包含头部检测和整体检测两个分支并分别从各自的特征图中预测得到中心点、高度以及偏移量信息,依据这些信息生成头部边界框和整体边界框;最后,将头部信息和整体信息进行结合对检测结果进行筛选并输出。
本发明提供一种结合头部和整体信息的行人检测方法,主要分为四部分,第一部分是对训练图像进行预处理,将原本的矩形边界框标签转换为中心点掩膜标签,同时采用缩放、旋转和水平翻转等方式扩充训练图像;第二部分是采用卷积神经网络进行特征提取、构建特征金字塔以及融合特征;第三部分是从特征图中预测行人头部和整体并生成相应的边界框;第四部分是将头部边界框和整体边界框结合,去除置信度较低的边界框并得到最终检测结果。
本发明提供的一种结合头部和整体信息的行人检测方法的网络模型结构如图1所示,具体包括以下步骤:
1、训练图像预处理
(1)根据数据集中自带的矩形边界框标签,计算获得头部中心(xh,yh)和整体中心(xb,yb),使用高斯函数G(·)依据边界框宽和高的标准差{σwh}分别生成头部中心掩膜Mhead和整体中心掩膜Mbody
Figure BDA0002986988240000051
(2)采用缩放、旋转和水平翻转等方式扩充训练图像,提升模型学习到的特征的有效性。
2、行人特征提取
(1)本发明特征提取模块的结构如图2所示,使用主干网络对处理后的图像进行特征提取,其输出四张具有不同分辨率的特征图{p1,p2,p3,p4},对这四张特征图使用卷积计算增加通道间的关联性,同时将特征图扩充为五张并构成特征金字塔结构{P1,P2,P3,P4,P5}。
(2)融合特征图{P1,P2,P3}得到用于头部检测的特征图Fhead,融合特征图{P3,P4,P5}得到用于行人整体检测的特征图Fbody
3、头部和整体检测
本发明检测模块的结构如图3所示,共包含头部检测和整体检测两个分支。其从特征图Fhead中预测获得头部中心点Chead、高度Hhead以及位置偏移量Ohead,从特征图Fbody中预测获得整体中心点Cbody、高度Hbody以及位置偏移量Obody。根据这些信息分别生成行人的头部边界框Bhead和整体边界框Bbody
4、检测结果筛选
(1)图4为本发明中界定的行人头部区域示意,对于检测部分输出的行人整体边界框
Figure BDA0002986988240000061
其中
Figure BDA0002986988240000062
Figure BDA0002986988240000063
分别为边界框的左上角点和右下角点,基于边界框的高度hb和宽度wb计算获得行人的头部区域Hregion
Figure BDA0002986988240000064
(2)使用非极大值抑制算法筛选行人整体边界框。对于每一个行人整体边界框Bbody,首先判断其头部区域Hregion内是否存在头部边界框Bhead,若存在则选取位于该区域中置信度最高的头部边界框与之配对得到{Bbody,Bhead,sbody,shead},其中s为置信度。如果整体边界框的置信度较高则直接予以保留,如果行人边界框的置信度较低但存在与之配对的头部边界框,并且头部边界框的置信度较高,则依然保留该行人整体边界框。
本发明所设计的一种结合头部和整体信息的行人检测方法主要包含训练和测试两个阶段。
(1)训练阶段
训练阶段主要包括特征提取以及模型权重参数的更新。通过使用经过预处理的图像对模型进行训练,将模型预测得到的各项数值与标签真实值进行比较计算得到各项损失值,同时依据总损失值并使用梯度反向传播算法更新模型的权重参数。当模型迭代次数达到预设值后终止其训练过程并保存权重参数。
(2)测试阶段
测试阶段需要加载经过训练的模型权重参数,对于输入图像仅使用缩放的方式使其尺寸符合模型的输入所需。此时模型不再进行梯度反向传播而是直接将检测结果进行输出从而对图像中的行人进行检测并得到最终的边界框信息。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (1)

1.一种结合头部和整体信息的行人检测方法,其特征在于:该方法包括以下步骤:
S1:将数据集中的行人及其头部矩形边界框标签转换为中心点标签,同时对图像进行相应的预处理;
S2:基于深度卷积神经网络搭建特征提取模块获取用于检测的行人头部和整体特征图信息;
S3:构建包含头部检测和整体检测两个分支的检测模块,检测模块从特征图中预测中心点位置、高度和偏移量信息,生成头部边界框和整体边界框;
S4:对于获得的头部边界框和整体边界框,使用改进后的非极大值抑制算法将两者结合,同时滤除置信度较低的边界框从而得到最终的检测结果;
所述S1包含以下步骤:
S11:对训练图像进行随机比例的缩放,若图像大小小于预设尺寸则使用灰度像素点进行填充,若其大小大于预设尺寸则对边缘进行裁剪,同时对边界框标签进行位置修正;
S12:对训练图像进行随机水平翻转,同时修正边界框坐标;
S13:将图像从RGB颜色空间转换至HSV或HSL颜色空间,同时对图像的亮度进行随机调整;
S14:根据标签信息计算获得其头部中心位置(xh,yh)和整体中心位置(xb,yb),使用二维高斯函数G(·)分别生成头部中心点掩膜Mhead和整体中心点掩膜Mbody
Figure FDA0003798026540000011
所述S2中,构建特征提取模块包括以下步骤:
S21:使用主干网络对图像进行特征提取,获得四张具有不同激活程度以及大小的特征图{p1,p2,p3,p4};
S22:对特征图{p1,p2,p3,p4}使用卷积进行计算得到特征图{P1,P2,P3,P4},对特征图P4使用相同的卷积计算得到特征图P5,从而构成具有五层结构的特征金字塔;
S23:对特征图P2和P3进行上采样使其大小与P1保持一致,融合这三张特征图从而获得用于头部检测特征图Fhead;对特征图P4和P5进行相同运算使其大小与P3一致,融合特征图P3、P4和P5得到用于行人整体检测的特征图Fbody
所述S3具体包括以下步骤:
S31:从头部特征图Fhead中预测获得头部中心点Chead、高度Hhead以及位置偏移量Ohead,同时生成头部边界框Bhead
S32:从整体特征图Fbody中预测获得整体中心点Cbody、高度Hbody以及位置偏移量Obody,同时生成整体边界框Bbody
所述S4具体包含以下步骤:
S41:对于检测部分输出的行人整体边界框
Figure FDA0003798026540000021
其中
Figure FDA0003798026540000022
Figure FDA0003798026540000023
分别为边界框的左上角点和右下角点,基于边界框的高度hb和宽度wb计算获得行人的头部区域Hregion
Figure FDA0003798026540000024
S42:对于每一个行人整体边界框Bbody,首先判断其头部区域Hregion内是否存在头部边界框Bhead,若存在则选取位于该区域中置信度s最高的头部边界框与之配对得到{Bbody,Bhead,sbody,shead};
S43:如果整体边界框的置信度较高则直接予以保留,如果行人边界框的置信度较低但存在与之配对的头部边界框,并且头部边界框的置信度较高,则依然保留该行人整体边界框。
CN202110302808.5A 2021-03-22 2021-03-22 一种结合头部和整体信息的行人检测方法 Active CN112926500B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110302808.5A CN112926500B (zh) 2021-03-22 2021-03-22 一种结合头部和整体信息的行人检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110302808.5A CN112926500B (zh) 2021-03-22 2021-03-22 一种结合头部和整体信息的行人检测方法

Publications (2)

Publication Number Publication Date
CN112926500A CN112926500A (zh) 2021-06-08
CN112926500B true CN112926500B (zh) 2022-09-20

Family

ID=76175361

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110302808.5A Active CN112926500B (zh) 2021-03-22 2021-03-22 一种结合头部和整体信息的行人检测方法

Country Status (1)

Country Link
CN (1) CN112926500B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114429207A (zh) * 2022-01-14 2022-05-03 支付宝(杭州)信息技术有限公司 一种对于特征图的卷积处理方法、装置、设备及介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106845430A (zh) * 2017-02-06 2017-06-13 东华大学 基于加速区域卷积神经网络的行人检测与跟踪方法
CN109858389A (zh) * 2019-01-10 2019-06-07 浙江新再灵科技股份有限公司 基于深度学习的直梯人数统计方法及***
CN112287788A (zh) * 2020-10-20 2021-01-29 杭州电子科技大学 基于改进YOLOv3和改进NMS的行人检测方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3655618B2 (ja) * 2003-03-28 2005-06-02 株式会社エヌ・ティ・ティ・データ 歩行者年齢判定装置、歩行状態・歩行者年齢判定方法およびプログラム
CN108256404B (zh) * 2016-12-29 2021-12-10 北京旷视科技有限公司 行人检测方法和装置
CN110443116B (zh) * 2019-06-19 2023-06-20 平安科技(深圳)有限公司 视频行人检测方法、装置、服务器及存储介质
CN112115862B (zh) * 2020-09-18 2023-08-29 广东机场白云信息科技有限公司 一种结合密度估计的拥挤场景行人检测方法
CN112488057A (zh) * 2020-12-17 2021-03-12 北京航空航天大学 一种利用人头点定位和关节点信息的单相机多目标跟踪方法
CN112257692B (zh) * 2020-12-22 2021-03-12 湖北亿咖通科技有限公司 一种行人目标的检测方法、电子设备及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106845430A (zh) * 2017-02-06 2017-06-13 东华大学 基于加速区域卷积神经网络的行人检测与跟踪方法
CN109858389A (zh) * 2019-01-10 2019-06-07 浙江新再灵科技股份有限公司 基于深度学习的直梯人数统计方法及***
CN112287788A (zh) * 2020-10-20 2021-01-29 杭州电子科技大学 基于改进YOLOv3和改进NMS的行人检测方法

Also Published As

Publication number Publication date
CN112926500A (zh) 2021-06-08

Similar Documents

Publication Publication Date Title
CN108062525B (zh) 一种基于手部区域预测的深度学习手部检测方法
CN108830326B (zh) 一种mri图像的自动分割方法及装置
Yin et al. FD-SSD: An improved SSD object detection algorithm based on feature fusion and dilated convolution
CN110084108A (zh) 基于gan神经网络的行人重识别***及方法
CN107066916B (zh) 基于反卷积神经网络的场景语义分割方法
Zhang et al. Region of interest extraction in remote sensing images by saliency analysis with the normal directional lifting wavelet transform
US11853892B2 (en) Learning to segment via cut-and-paste
CN113870263B (zh) 一种路面缺陷损伤实时监测方法及***
CN112288008A (zh) 一种基于深度学习的马赛克多光谱图像伪装目标检测方法
CN107909081A (zh) 一种深度学习中图像数据集的快速获取和快速标定方法
CN111401380B (zh) 一种基于深度特征增强和边缘优化的rgb-d图像语义分割方法
CN112418165B (zh) 基于改进型级联神经网络的小尺寸目标检测方法与装置
CN110807362A (zh) 一种图像检测方法、装置和计算机可读存储介质
CN115423734B (zh) 一种基于多尺度注意机制的红外与可见光图像融合方法
CN117253154B (zh) 一种基于深度学习的集装箱弱小序列号目标检测识别方法
CN116188999B (zh) 一种基于可见光和红外图像数据融合的小目标检测方法
CN113920468B (zh) 一种基于跨尺度特征增强的多分支行人检测方法
CN113902965A (zh) 一种基于多层特征融合的多光谱行人检测方法
CN114299383A (zh) 基于密度图与注意力机制融合的遥感图像目标检测方法
CN108319961B (zh) 一种基于局部特征点的图像roi快速检测方法
CN116645592A (zh) 一种基于图像处理的裂缝检测方法和存储介质
CN112926500B (zh) 一种结合头部和整体信息的行人检测方法
CN110097524A (zh) 基于融合卷积神经网络的sar图像目标检测方法
Yuan et al. Smoke semantic segmentation with multi-scale residual paths and weighted middle surveillances
Ilehag et al. Classification and representation of commonly used roofing material using multisensorial aerial data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant