CN115690704B - 基于LG-CenterNet模型的复杂道路场景目标检测方法及装置 - Google Patents
基于LG-CenterNet模型的复杂道路场景目标检测方法及装置 Download PDFInfo
- Publication number
- CN115690704B CN115690704B CN202211179337.4A CN202211179337A CN115690704B CN 115690704 B CN115690704 B CN 115690704B CN 202211179337 A CN202211179337 A CN 202211179337A CN 115690704 B CN115690704 B CN 115690704B
- Authority
- CN
- China
- Prior art keywords
- module
- model
- road scene
- target
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 34
- 238000000034 method Methods 0.000 claims abstract description 9
- 238000012545 processing Methods 0.000 claims abstract description 5
- 238000010586 diagram Methods 0.000 claims description 24
- 238000011176 pooling Methods 0.000 claims description 16
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims description 14
- 230000004913 activation Effects 0.000 claims description 9
- 230000006870 function Effects 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000012549 training Methods 0.000 claims description 4
- 238000012935 Averaging Methods 0.000 claims description 3
- 230000000875 corresponding effect Effects 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 230000002708 enhancing effect Effects 0.000 claims description 2
- 210000000988 bone and bone Anatomy 0.000 abstract description 5
- 238000004519 manufacturing process Methods 0.000 abstract description 2
- 238000011897 real-time detection Methods 0.000 abstract description 2
- 238000005516 engineering process Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 206010039203 Road traffic accident Diseases 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了一种基于LG‑CenterNet模型的复杂道路场景目标检测方法及装置,采集原始的道路图像数据集制作数据集,通过构建LG‑CenterNet网络模型,使用ResNet50作为模型的Backbone提取特征对,采用层级引导注意力机制对主干网络的不同尺度的特征图来提高其感受野的同时对不同层级的特征进行引导;再将层级引导机制处理过的特征图输入到ScalesEncoder模块处理;采用反卷积模块进行特征像素还原;对还原的特征采用新的特征增强模块解决像素还原过程中出现的特征信息丢失的问题;最终将增强后的特征图输入到Center points预测模块进行道路目标类别识别和位置定位。本发明在自建的复杂道路场景数据集的识别平均精度为86.93%,道路场景目标图像检测速度达到50帧/s,能够满足对道路场景的准确检测和实时检测的要求。
Description
技术领域
本发明属于语义分割、图像处理及智能驾驶领域,具体涉及一种基于LG-CenterNet模型的复杂道路场景目标检测方法及装置。
背景技术
近些年汽车数目稳健上升导致交通事故频发,这严重威胁到了人民的生命安全。如今,随着自动驾驶技术的发展,研究人员也从汽车被动安全技术研究转向了汽车主动安全技术研究。实现汽车的自动化必须使用一些先进的技术手段才能完成部分的汽车驾驶任务。采用深度学习方法对道路场景目标进行智能检测是解决汽车主动安全技术的关键。现阶段的目标检测网络主要是通过主干网络进行特征提取,但是在对底层的多尺度问题没有进行过多的考虑,可能会导致多尺度目标检测能力不足的情况。
发明内容
发明目的:针对现阶段复杂道路场景目标检测应用效果不佳,常规的检测方法不能满足实际道路环境的检测要求,提供一种基于LG-CenterNet模型的复杂道路场景目标检测方法及装置。
技术方案:本发明提出一种基于LG-CenterNet模型的复杂道路场景目标检测方法,具体包括以下步骤:
(1)对复杂道路场景的图像进行处理,获取到含有多种类别的道路目标图像,对图像中的道路目标进行类别和位置标记,构建出复杂的道路场景数据集并进行预处理;
(2)构建目标检测LG-CenterNet模型,并将上述的道路目标数据集通过LG-CenterNet模型进行训练得到模型S;所述LG-CenterNet模型包括Backbone模块、层级引导注意力模块、Scales Encoder模块、反卷积模块、特征增强模块和Centerpoints预测模块;
(3)使用训练好的模型S对复杂道路目标通过Center points预测模块以热力图的形式进行目标定位、边框大小划分和类别预测,并将得到的结果在视频或者图像上进行显示输入相应的效果。
进一步地,步骤(1)所述的对道路场景数据集预处理是通过将像素不一和复杂道路场景的图像进行归一化处理,将图像的大小归一化为512×512像素大小,再通过批标准化、ReLU激活函数和最大池化操作得到分布均匀的特征目标样本。
进一步地,所述步骤(2)实现过程如下:
(21)LG-CenterNet模型中提出新的MresneIt50作为Backbone模块,MresneIt50由多个残差块组成,其中将4个残差模块提取到的特征图记为E1,通道数为512;将6个残差块提取到的特征图记为E2,通道数为1024;将3个通道数提取到的特征图记为E3,通道数为2048;
(22)将Backbone提取到的特征图E1、E2、E3输入到层级引导注意力模块中,其主要的结构包括两个分支:全局池化分支和层级引导分支,将通道数为512的特征图E1输入到全局池化分支,通过全局最大池化层和上采样层操作获得EC1;将通道数为512、1024、2048的特征图E1、E2、E3输入到层级引导分支中,通过一系列的平均池化和卷积操作并配合上采样得到EC2;将EC1和EC2使用add进行特征联合获得EC3,从而减少计算参数;
(23)将提取到的EC3输入到Scales Encoder模块,进行一系列的卷积和残差模块运算后得到EC4;
(24)将提取到的EC4输入到反卷积模块,反卷积模块由3个deconv组组成,通过每次deconv组的卷积运算将特征图尺寸不断放大,同时通道数不断降低,得到尺度为128×128×64的特征图记为EC5;
(25)将特征图EC5输入到特征增强模块进行卷积运算得到尺度大小为128×128×64特征图EC6,P-FEM由3×3的Poly-Scale Convolution、批标准化、ReLU激活函数和Sigmoid激活函数构成,主要是为了提高特征图中的局部信息的相关性,增强其对特征的表达能力。
进一步地,所述步骤(3)实现过程如下:
Centerpoints预测模块通过对训练好的模型S对输入的图片进行分类预测,将原始图像生成尺度与EC6大小一致的heatmap图,随后通过分别计算热力图的损失值记为Lh,目标长宽的损失值记为Ls和中心点偏移量的损失值记为Lf来确定目标的位置和大小并生成最后的分类定位的heatmap;其中总体的网络损失为:
Ld=Lk+λsLs+λfLf
其中λs=0.1,λf=1;对于输入图片大小为512×215的图像来说其通过该网络生成的特征图为H×W×C,则Lk、Ls和Lf计算公式分别为:
其中,AHWC为图像中目标标注的真实值,A'HWC为图像的预测值,α和β分别为2和4,N为图像中关键点的个数,s'pk为预测尺寸,sk为真实尺寸,p为图像中目标的中心点位置。
基于相同的发明构思,本发明还提供一种基于LG-CenterNet模型的复杂道路场景目标检测装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序被加载至处理器时实现上述的基于LG-CenterNet模型的复杂道路场景目标检测方法。
有益效果:与现有技术相比,本发明的有益效果:1、通过改进LG-CenterNet模型的主干网络,提出MresneIt50加强特征提取效果;2、提出一种层级引导注意力模块对主干网络提取到的特征图的进行特征融合;3、提出新的Scales Encoder模块和特征增强模块注重对局部特征的提取,避免在反卷积模块中出现的特征丢失问题;4、改进后的LG-CenterNet目标检测模型对比原来的CenterNet框架的平均精度mAP(meanAveragePrecision)提升了5个百分点;5、本发明在应对复杂道路场景也有较高的检测精度。
附图说明
图1是基于LG-CenterNet模型的复杂道路场景目标检测方法的流程图;
图2是本发明提出的基于LG-CenterNet目标检测模型示意图;
图3是本发明提出的残差块结构Mblock结构示意图;
图4是层级引导注意力模型结构示意图;
图5是Scales Encoder模块结构示意图;
图6是特征增强模块结构示意图;
图7是采用LG-CenterNet目标检测模型后得到的检测效果图。
具体实施方式
下面结合附图对本发明作进一步详细说明。
本实施方式中涉及大量变量,现将各变量作如下说明。如表1所示。
表1变量说明表
变量 | 变量说明 |
S | 3×3,通道数为1024的卷积核 |
E1 | Backbone模块中4个残差块提取到的特征图 |
E2 | Backbone模块中6个残差块提取到的特征图 |
E3 | Backbone模块中3个残差块提取到的特征图 |
EC1 | E1经过全局池化分支得到的特征图 |
EC2 | E1、E2、E3经由层级引导分支得到的特征图 |
EC3 | 特征图EC2经由ScalesEncoder模块处理后的特征图 |
EC4 | 特征图EC3经由ScalesEncoder模块处理后的特征图 |
EC5 | 特征图EC4经由反卷积模块处理后的特征图 |
EC6 | 特征图EC5经由特征增强模块处理后的特征图 |
本发明提供一种基于LG-CenterNet模型的复杂道路场景目标检测方法,通过采集道路场景不同目标图像并进行标记制作成复杂道路场景数据集,利用提出的MresneIt50作为主干网络进行特征提取,对于主干网络中提取到的不同尺度的特征图输入到层级引导注意力模块当中,随后通过Scales Encoder模块得到多个感受野特征,之后利用反卷积模块进行特征像素还原,利用Poly-Scale Convolution(简称PSConv)构建特征增强模块提高局部特征的信息相关性。最终利用Center points预测模块对目标的中心点位置、预测框的尺度大小和中心点的偏移进行预测,同时识别出目标类别。如图1所示,具体包括以下步骤:
步骤1:对复杂道路场景的图像进行处理,获取到含有多种类别的道路目标图像进行预处理,并对图像中的道路目标进行类别和位置标记,构建出复杂的道路场景数据集。
对道路场景数据集预处理主要是通过将像素不一和复杂道路场景的图像进行归一化处理,将图像的大小归一化为512×512像素大小,再通过批标准化(BatchNormalizaition)、ReLU激活函数和最大池化操作得到目标样本处于在图像分布较为均匀。
步骤2、构建目标检测LG-CenterNet模型,LG-CenterNet模型结构如图2所示,并将上述的道路目标数据集通过LG-CenterNet模型进行训练得到模型S,其中LG-CenterNet网络主要包括Backbone模块、层级引导注意力模块(Levels guide attention,简称LGA)、Scales Encoder模块、反卷积模块、特征增强模块(P-Feature enhancement module,P-FEM)和Centerpoints预测模块。
(21)LG-CenterNet模型中提出新的MresneIt50作为Backbone模块,MresneIt50由多个残差块Mblock组成,残差块结构Mblock如图3所示,其中将4个残差块提取到的特征图记为E1,通道数为512;将6个残差块提取到的特征图记为E2,通道数为1024;将3个通道数提取到的特征图记为E3,通道数为2048。
(22)将Backbone提取到的特征图E1、E2、E3输入到层级引导注意力模块(Levelsguide attention,简称LGA)中,LGA模块结构如图4所示,其主要的结构包括两个分支:全局池化分支和层级引导分支,将通道数为512的特征图E1输入到全局池化分支,通过全局最大池化层和上采样层操作获得EC1;将通道数为512、1024、2048的特征图E1、E2、E3输入到层级引导分支中,通过一系列的平均池化和卷积操作并配合上采样得到EC2。将EC1和EC2使用add进行特征联合获得EC3,从而减少计算参数。
(23)将提取到的EC3输入到Scales Encoder模块,Scales Encoder模块结构如图5所示,进行一系列的卷积和残差模块运算后得到EC4。
(24)将提取到的EC4输入到反卷积模块,反卷积模块由3个deconv组组成,通过每次deconv组的卷积运算将特征图尺寸不断放大,同时通道数不断降低,得到尺度为128×128×64的特征图记为EC5。
(25)将特征图EC5输入到P-FEM进行卷积运算得到尺度大小为128×128×64特征图EC6,P-FEM由3×3的Poly-Scale Convolution(简称PSConv)、批标准化(BatchNormalizaition)、ReLU激活函数和Sigmoid激活函数构成,主要是为了提高特征图中的局部信息的相关性,增强其对特征的表达能力。P-FEM结构如图6所示。
步骤3:使用训练好的模型S对道路场景目标通过Centerpoints预测模块以热力图的形式进行目标定位、边框大小划分和类别预测,并将得到的结果在视频或者图像上进行显示输入相应的效果。
Centerpoints预测模块通过对训练好的模型S对输入的图片进行分类预测,将原始图像生成尺度与EC6大小一致的heatmap图,随后通过分别计算热力图的损失值记为Lh,目标长宽(size)的损失值记为Ls和中心点偏移量(offset)的损失值记为Lf来确定目标的位置和大小并生成最后的分类定位的heatmap。其中总体的网络损失为Ld。
Ld=Lk+λsLs+λfLf
其中λs=0.1,λf=1。对于输入图片大小为512×215的图像来说其通过该网络生成的特征图为H×W×C,则Lk、Ls和Lf计算公式分别为:
其中,AHWC为图像中目标标注的真实值,A'HWC为图像的预测值,α和β分别为2和4,N为图像中关键点的个数,s'pk为预测尺寸,sk为真实尺寸,p为图像中目标的中心点位置。
基于相同的发明构思,本发明还提供一种基于LG-CenterNet模型的复杂道路场景目标检测装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序被加载至处理器时实现上述的基于LG-CenterNet模型的复杂道路场景目标检测方法。如图7所示。
将自建的复杂场景数据集通过LG-CenterNet网络进行训练,得到可以识别复杂场景目标的模型,通过数据集中的验证集进行模型性能验证,如图7所示。本发明在自建的复杂道路场景数据集的识别平均精度为86.93%,道路场景目标图像检测速度达到50帧/s,能够满足对道路场景的准确检测和实时检测的要求。
其中,Precision为精确度,Recall为召回率,AP为精度,mAP为平均精度,FPS为帧数,t为检测单张图片的时间。数据集中有较多样本类别(如car,person等),n表示样本个数,TP(True Positives)为正样本并被认定为正样本的数量(即为car的样本被认定为car的总数);TN(True Negatives)为负样本模型识别也为负样本的总数;FP(FalsePositives)为负样本模型认定为正样本的总数(即样本不为car,模型认定为car的总数);FN(False Negatives)为负样本模型认定为正样本的总数。
上面结合附图对本发明的实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。
Claims (4)
1.一种基于LG-CenterNet模型的复杂道路场景目标检测方法,其特征在于,包括以下步骤:
(1)对复杂道路场景的图像进行处理,获取到含有多种类别的道路目标图像,对图像中的道路目标进行类别和位置标记,构建出复杂的道路场景数据集并进行预处理;
(2)构建目标检测LG-CenterNet模型,并将上述的道路目标数据集通过LG-CenterNet模型进行训练得到模型S;所述LG-CenterNet模型包括Backbone模块、层级引导注意力模块、Scales Encoder模块、反卷积模块、特征增强模块和Centerpoints预测模块;
(3)使用训练好的模型S对复杂道路目标通过Center points预测模块以热力图的形式进行目标定位、边框大小划分和类别预测,并将得到的结果在视频或者图像上进行显示输入相应的效果;
所述步骤(2)实现过程如下:
(21)LG-CenterNet模型中提出新的MresneIt50作为Backbone模块,MresneIt50由多个残差块组成,其中将4个残差模块提取到的特征图记为E1,通道数为512;将6个残差块提取到的特征图记为E2,通道数为1024;将3个通道数提取到的特征图记为E3,通道数为2048;
(22)将Backbone提取到的特征图E1、E2、E3输入到层级引导注意力模块中,其主要的结构包括两个分支:全局池化分支和层级引导分支,将通道数为512的特征图E1输入到全局池化分支,通过全局最大池化层和上采样层操作获得EC1;将通道数为512、1024、2048的特征图E1、E2、E3输入到层级引导分支中,通过一系列的平均池化和卷积操作并配合上采样得到EC2;将EC1和EC2使用add进行特征联合获得EC3,从而减少计算参数;
(23)将提取到的EC3输入到Scales Encoder模块,进行一系列的卷积和残差模块运算后得到EC4;
(24)将提取到的EC4输入到反卷积模块,反卷积模块由3个deconv组组成,通过每次deconv组的卷积运算将特征图尺寸不断放大,同时通道数不断降低,得到尺度为128×128×64的特征图记为EC5;
(25)将特征图EC5输入到特征增强模块进行卷积运算得到尺度大小为128×128×64特征图EC6,P-FEM由3×3的Poly-Scale Convolution、批标准化、ReLU激活函数和Sigmoid激活函数构成,主要是为了提高特征图中的局部信息的相关性,增强其对特征的表达能力。
2.根据权利要求1所述的一种基于LG-CenterNet模型的复杂道路场景目标检测方法,其特征在于,步骤(1)所述的构建出复杂的道路场景数据集并进行预处理是通过将像素不一和复杂道路场景的图像进行归一化处理,将图像的大小归一化为512×512像素大小,再通过批标准化、ReLU激活函数和最大池化操作得到分布均匀的特征目标样本。
3.根据权利要求1所述的一种基于LG-CenterNet模型的复杂道路场景目标检测方法,其特征在于,所述步骤(3)实现过程如下:
Centerpoints预测模块通过对训练好的模型S对输入的图片进行分类预测,将原始图像生成尺度与EC6大小一致的heatmap图,随后通过分别计算热力图的损失值记为Lh,目标长宽的损失值记为Ls和中心点偏移量的损失值记为Lf来确定目标的位置和大小并生成最后的分类定位的heatmap;其中总体的网络损失为:
Ld=Lk+λsLs+λfLf
其中λs=0.1,λf=1;对于输入图片大小为512×215的图像来说其通过该网络生成的特征图为H×W×C,则Lk、Ls和Lf计算公式分别为:
其中,AHWC为图像中目标标注的真实值,A'HWC为图像的预测值,α和β分别为2和4,N为图像中关键点的个数,s'pk为预测尺寸,sk为真实尺寸,p为图像中目标的中心点位置。
4.一种基于LG-CenterNet模型的复杂道路场景目标检测装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述计算机程序被加载至处理器时实现根据权利要求1-3任一项所述的基于LG-CenterNet模型的复杂道路场景目标检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211179337.4A CN115690704B (zh) | 2022-09-27 | 2022-09-27 | 基于LG-CenterNet模型的复杂道路场景目标检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211179337.4A CN115690704B (zh) | 2022-09-27 | 2022-09-27 | 基于LG-CenterNet模型的复杂道路场景目标检测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115690704A CN115690704A (zh) | 2023-02-03 |
CN115690704B true CN115690704B (zh) | 2023-08-22 |
Family
ID=85063352
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211179337.4A Active CN115690704B (zh) | 2022-09-27 | 2022-09-27 | 基于LG-CenterNet模型的复杂道路场景目标检测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115690704B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117690165B (zh) * | 2024-02-02 | 2024-07-09 | 四川泓宝润业工程技术有限公司 | 一种钻杆与液压钳间人员穿行检测方法及装置 |
Citations (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108717537A (zh) * | 2018-05-30 | 2018-10-30 | 淮阴工学院 | 一种基于模式识别的复杂场景的人脸识别方法及*** |
CN110543895A (zh) * | 2019-08-08 | 2019-12-06 | 淮阴工学院 | 一种基于VGGNet和ResNet的图像分类方法 |
CN111382714A (zh) * | 2020-03-13 | 2020-07-07 | Oppo广东移动通信有限公司 | 图像检测方法、装置、终端及存储介质 |
CN111709895A (zh) * | 2020-06-17 | 2020-09-25 | 中国科学院微小卫星创新研究院 | 基于注意力机制的图像盲去模糊方法及*** |
CN111814889A (zh) * | 2020-07-14 | 2020-10-23 | 大连理工大学人工智能大连研究院 | 一种使用无锚框模块和增强分类器的单阶段目标检测方法 |
CN111932553A (zh) * | 2020-07-27 | 2020-11-13 | 北京航空航天大学 | 基于区域描述自注意力机制的遥感图像语义分割方法 |
CN112329800A (zh) * | 2020-12-03 | 2021-02-05 | 河南大学 | 一种基于全局信息引导残差注意力的显著性目标检测方法 |
CN112580443A (zh) * | 2020-12-02 | 2021-03-30 | 燕山大学 | 基于嵌入式设备改进CenterNet的行人检测方法 |
CN112686207A (zh) * | 2021-01-22 | 2021-04-20 | 北京同方软件有限公司 | 一种基于区域信息增强的城市街道场景目标检测方法 |
CN112700444A (zh) * | 2021-02-19 | 2021-04-23 | 中国铁道科学研究院集团有限公司铁道建筑研究所 | 基于自注意力与中心点回归模型的桥梁螺栓检测方法 |
CN113378815A (zh) * | 2021-06-16 | 2021-09-10 | 南京信息工程大学 | 一种场景文本定位识别的模型及其训练和识别的方法 |
CN113408498A (zh) * | 2021-08-05 | 2021-09-17 | 广东众聚人工智能科技有限公司 | 一种人群计数***及方法、设备及存储介质 |
CN113657326A (zh) * | 2021-08-24 | 2021-11-16 | 陕西科技大学 | 一种基于多尺度融合模块和特征增强的杂草检测方法 |
WO2021244621A1 (zh) * | 2020-06-04 | 2021-12-09 | 华为技术有限公司 | 基于全局引导选择性上下文网络的场景语义解析方法 |
CN114359153A (zh) * | 2021-12-07 | 2022-04-15 | 湖北工业大学 | 一种基于改进CenterNet的绝缘子缺陷检测方法 |
CN114419589A (zh) * | 2022-01-17 | 2022-04-29 | 东南大学 | 一种基于注意力特征增强模块的道路目标检测方法 |
CN114581866A (zh) * | 2022-01-24 | 2022-06-03 | 江苏大学 | 一种基于改进CenterNet的自动驾驶场景的多目标视觉检测算法 |
CN114638836A (zh) * | 2022-02-18 | 2022-06-17 | 湖北工业大学 | 基于高度有效驱动与多层级特征融合的城市街景分割方法 |
CN114863368A (zh) * | 2022-07-05 | 2022-08-05 | 城云科技(中国)有限公司 | 用于道路破损检测的多尺度目标检测模型、方法 |
CN115035361A (zh) * | 2022-05-11 | 2022-09-09 | 中国科学院声学研究所南海研究站 | 基于注意力机制和特征交叉融合的目标检测方法及*** |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220204035A1 (en) * | 2020-12-28 | 2022-06-30 | Hyundai Mobis Co., Ltd. | Driver management system and method of operating same |
US11915500B2 (en) * | 2021-01-28 | 2024-02-27 | Salesforce, Inc. | Neural network based scene text recognition |
-
2022
- 2022-09-27 CN CN202211179337.4A patent/CN115690704B/zh active Active
Patent Citations (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108717537A (zh) * | 2018-05-30 | 2018-10-30 | 淮阴工学院 | 一种基于模式识别的复杂场景的人脸识别方法及*** |
CN110543895A (zh) * | 2019-08-08 | 2019-12-06 | 淮阴工学院 | 一种基于VGGNet和ResNet的图像分类方法 |
CN111382714A (zh) * | 2020-03-13 | 2020-07-07 | Oppo广东移动通信有限公司 | 图像检测方法、装置、终端及存储介质 |
WO2021244621A1 (zh) * | 2020-06-04 | 2021-12-09 | 华为技术有限公司 | 基于全局引导选择性上下文网络的场景语义解析方法 |
CN111709895A (zh) * | 2020-06-17 | 2020-09-25 | 中国科学院微小卫星创新研究院 | 基于注意力机制的图像盲去模糊方法及*** |
CN111814889A (zh) * | 2020-07-14 | 2020-10-23 | 大连理工大学人工智能大连研究院 | 一种使用无锚框模块和增强分类器的单阶段目标检测方法 |
CN111932553A (zh) * | 2020-07-27 | 2020-11-13 | 北京航空航天大学 | 基于区域描述自注意力机制的遥感图像语义分割方法 |
CN112580443A (zh) * | 2020-12-02 | 2021-03-30 | 燕山大学 | 基于嵌入式设备改进CenterNet的行人检测方法 |
CN112329800A (zh) * | 2020-12-03 | 2021-02-05 | 河南大学 | 一种基于全局信息引导残差注意力的显著性目标检测方法 |
CN112686207A (zh) * | 2021-01-22 | 2021-04-20 | 北京同方软件有限公司 | 一种基于区域信息增强的城市街道场景目标检测方法 |
CN112700444A (zh) * | 2021-02-19 | 2021-04-23 | 中国铁道科学研究院集团有限公司铁道建筑研究所 | 基于自注意力与中心点回归模型的桥梁螺栓检测方法 |
CN113378815A (zh) * | 2021-06-16 | 2021-09-10 | 南京信息工程大学 | 一种场景文本定位识别的模型及其训练和识别的方法 |
CN113408498A (zh) * | 2021-08-05 | 2021-09-17 | 广东众聚人工智能科技有限公司 | 一种人群计数***及方法、设备及存储介质 |
CN113657326A (zh) * | 2021-08-24 | 2021-11-16 | 陕西科技大学 | 一种基于多尺度融合模块和特征增强的杂草检测方法 |
CN114359153A (zh) * | 2021-12-07 | 2022-04-15 | 湖北工业大学 | 一种基于改进CenterNet的绝缘子缺陷检测方法 |
CN114419589A (zh) * | 2022-01-17 | 2022-04-29 | 东南大学 | 一种基于注意力特征增强模块的道路目标检测方法 |
CN114581866A (zh) * | 2022-01-24 | 2022-06-03 | 江苏大学 | 一种基于改进CenterNet的自动驾驶场景的多目标视觉检测算法 |
CN114638836A (zh) * | 2022-02-18 | 2022-06-17 | 湖北工业大学 | 基于高度有效驱动与多层级特征融合的城市街景分割方法 |
CN115035361A (zh) * | 2022-05-11 | 2022-09-09 | 中国科学院声学研究所南海研究站 | 基于注意力机制和特征交叉融合的目标检测方法及*** |
CN114863368A (zh) * | 2022-07-05 | 2022-08-05 | 城云科技(中国)有限公司 | 用于道路破损检测的多尺度目标检测模型、方法 |
Non-Patent Citations (1)
Title |
---|
改进CenterNet的交通标志检测算法;成怡 等;《信号处理》;第38卷(第3期);511-518 * |
Also Published As
Publication number | Publication date |
---|---|
CN115690704A (zh) | 2023-02-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107563372B (zh) | 一种基于深度学习ssd框架的车牌定位方法 | |
CN107239778B (zh) | 高效准确的车牌识别方法 | |
CN111340123A (zh) | 一种基于深度卷积神经网络的图像分数标签预测方法 | |
CN111738363B (zh) | 基于改进的3d cnn网络的阿尔茨海默病分类方法 | |
CN114266794B (zh) | 基于全卷积神经网络的病理切片图像癌症区域分割*** | |
CN110930378B (zh) | 基于低数据需求的肺气肿影像处理方法及*** | |
CN115131760B (zh) | 一种基于改进特征匹配策略的轻量级车辆追踪方法 | |
CN115690704B (zh) | 基于LG-CenterNet模型的复杂道路场景目标检测方法及装置 | |
CN115880529A (zh) | 基于注意力和解耦知识蒸馏的鸟类细粒度分类方法及*** | |
CN116543162B (zh) | 基于特征差值与上下文感知一致性的图像分割方法及*** | |
CN113610760A (zh) | 一种基于u型残差神经网络的细胞图像分割示踪方法 | |
CN110211150B (zh) | 一种具有尺度协调机制的实时视觉目标识别方法 | |
Zheng et al. | A novel strategy for global lane detection based on key-point regression and multi-scale feature fusion | |
CN116228795A (zh) | 一种基于弱监督学习的超高分辨率医学图像分割方法 | |
CN112990041B (zh) | 一种基于改进型U-net的遥感影像建筑物提取方法 | |
CN113269734B (zh) | 一种基于元学习特征融合策略的肿瘤图像检测方法及装置 | |
CN112348011B (zh) | 一种车辆定损方法、装置及存储介质 | |
CN114743257A (zh) | 图像目标行为的检测识别方法 | |
CN114972171A (zh) | 一种基于深度学习的***mr图像半监督分割方法 | |
CN113012167A (zh) | 一种细胞核与细胞质的联合分割方法 | |
CN112487927A (zh) | 一种基于物体关联注意力的室内场景识别实现方法及*** | |
CN117456191B (zh) | 一种基于三分支网络结构的复杂环境下语义分割方法 | |
CN115346185A (zh) | 一种山区城市雨天自动驾驶车道线检测方法 | |
Li et al. | Enhancement of Target Feature Regions and Intention-Driven Visual Attention Selection in Traffic Scenes | |
CN115661676A (zh) | 一种基于串联注意力模块和并联注意力模块的建筑物分割***及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
EE01 | Entry into force of recordation of patent licensing contract |
Application publication date: 20230203 Assignee: Jiangsu Kesheng Xuanyi Technology Co.,Ltd. Assignor: HUAIYIN INSTITUTE OF TECHNOLOGY Contract record no.: X2023980048436 Denomination of invention: Method and device for complex road scene object detection based on LG CenterNet model Granted publication date: 20230822 License type: Common License Record date: 20231129 |
|
EE01 | Entry into force of recordation of patent licensing contract |