CN112183203B - 一种基于多尺度像素特征融合的实时交通标志检测方法 - Google Patents
一种基于多尺度像素特征融合的实时交通标志检测方法 Download PDFInfo
- Publication number
- CN112183203B CN112183203B CN202010866848.8A CN202010866848A CN112183203B CN 112183203 B CN112183203 B CN 112183203B CN 202010866848 A CN202010866848 A CN 202010866848A CN 112183203 B CN112183203 B CN 112183203B
- Authority
- CN
- China
- Prior art keywords
- feature
- feature map
- channel
- fusion
- pixel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000004927 fusion Effects 0.000 title claims abstract description 38
- 238000001514 detection method Methods 0.000 title claims abstract description 32
- 238000000034 method Methods 0.000 claims abstract description 23
- 238000000605 extraction Methods 0.000 claims abstract description 20
- 230000008707 rearrangement Effects 0.000 claims abstract description 20
- 230000001629 suppression Effects 0.000 claims abstract description 6
- 238000007781 pre-processing Methods 0.000 claims abstract description 3
- 230000006870 function Effects 0.000 claims description 26
- 238000005070 sampling Methods 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 10
- 230000004913 activation Effects 0.000 claims description 9
- 238000012549 training Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 230000010354 integration Effects 0.000 claims description 3
- 238000011176 pooling Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 238000012795 verification Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 2
- 238000013135 deep learning Methods 0.000 abstract description 3
- 230000000694 effects Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 206010039203 Road traffic accident Diseases 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005562 fading Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
- G06V20/58—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
- G06V20/582—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads of traffic signs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4038—Image mosaicing, e.g. composing plane images from plane sub-images
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Probability & Statistics with Applications (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
一种基于多尺度像素特征融合的实时交通标志检测方法属于深度学习和目标检测领域。首先获取含交通标志的图像并预处理;其次将预处理后的图像输入到MobileNetv2网络进行特征提取;接着将提取到的多尺度特征图输入到像素特征融合模块进行像素重排,拼接生成兼具语义信息与细节信息的融合特征图;然后对融合特征图进行下采样得到六个尺度特征图并输入到高效通道注意力模块,对特征通道按重要程度分配权重;之后将加权的六尺度特征图输入到SSD检测层来预测边界框的位置和对象的类别;最后进行非极大值抑制,得到最优的交通标志检测结果。本发明在检测交通标志图像时能够兼顾实时性与准确性,并具有很强的鲁棒性。
Description
技术领域
本发明属于深度学习和目标检测领域,具体涉及一种基于多尺度像素特征融合的实时交通标志检测方法。
背景技术
对于道路交通安全,交通标志至关重要。在真实的驾驶场景中,存在如日光和天气等自然环境引起的光照变化,也存在交通标志的褪色、变形、遮挡等特殊情况,人眼可能会遗漏或错误识别交通标志,导致对前方路况的错误判断,引发交通事故,造成人身财产和车辆损失,甚至威胁生命安全。实时准确的交通标志检测技术作为先进驾驶辅助***的重要组成部分,能够协助驾驶者保障行车安全,避免危险的发生,在交通安全和自动驾驶等领域具有重要的应用。
在实际应用中,要求驾驶辅助***具有极高的灵敏度,即能够在车辆离交通标志足够远处便对其类别做出识别,为驾驶者或驾驶***提供更好的预警。这需要检测算法满足高实时性与小目标检测性能。当前提升小目标检测性能的方法同时会带来额外的计算与参数,导致检测算法实时性的降低。因此,如何在不引入过多额外计算成本,保证实时性的同时提升算法的小目标检测性能以满足真实驾驶辅助***的需要是亟待解决的问题。
发明内容
为了解决上述技术问题,本发明旨在提供一种基于多尺度像素特征融合的实时交通标志检测方法,克服了基于深度学习的交通标志方法难以兼顾实时性与准确性的困难。
为了实现上述技术目的,本发明的技术方案为:
一种基于多尺度像素特征融合的实时交通标志检测方法,包括以下步骤:
(1)获取含有交通标志的图像,对获取到的图像进行预处理;
(2)将步骤(1)预处理后得到的图像输入MobileNetv2网络进行特征提取,得到三个尺度的深度特征图;
(3)将步骤(2)得到的三个尺度的深度特征图输入到像素特征融合模块进行像素重排,拼接生成兼具语义信息与细节信息的融合特征图;
(4)将步骤(3)得到的融合特征图进行下采样得到六个尺度特征图并输入到高效通道注意力模块,对特征通道按重要程度分配权重;
(5)将步骤(4)生成的带有权重的六个尺度特征图输入到SSD检测层进行交通标志的分类与定位,最后进行非极大值抑制,得到最优的交通标志检测结果。
进一步地,步骤(1)的具体过程如下:
(a)获取包含交通标志的图像,对每张图像中出现的每一个交通标志标注出其边界框和类别信息;
(b)采集的图像数量较少时,利用已有的图像进行数据增强操作。采用翻转、平移、旋转或加噪声等方法创造出更多的图像,使得训练的神经网络具有更好的效果;
(c)将图像分辨率统一转化为300*300以适应输入尺寸;
(d)将图像进行基于正负样本数目的优化,划分得到训练图像集和测试图像集。
进一步地,步骤(2)的具体过程如下:
(A)300*300输入图像首先通过3*3的标准卷积块进行初步特征提取,得到150*150*32特征图,其中,32表示特征图的通道数;
(B)步骤(A)中得到的150*150*32特征图依次经过6个反向残差瓶颈块进行深度特征提取,分别得到38*38*32、19*19*96、10*10*320的深度特征图A、B、C。
进一步地,步骤(3)的具体过程如下:
(Ⅰ)对步骤(2)特征提取得到的10*10*320深度特征图进行上采样因子为4的像素重排,得到38*38*20上采样特征图D;
(Ⅱ)对步骤(2)特征提取得到的19*19*96深度特征图进行像上采样因子为2的像素重排,得到38*38*24上采样特征图E;
(Ⅲ)将步骤(Ⅰ)和步骤(Ⅱ)中像素重排得到的38*38*20上采样特征图D和38*38*24上采样特征图E与步骤(2)特征提取得到的38*38*32深度特征图A进行拼接处理,生成兼具语义信息与细节信息的38*38*76融合特征图F。
其中,步骤(3)中的像素特征融合模块采用像素重排方式合成融合特征图,相较于其他上采样方式像素重排能够在不增加任何额外参数和计算的情况下增强特征图携带的信息;像素重排通过压缩特征图中的通道数来扩展宽度和长度,其本质是将通道数为r2C,长宽为H*W的低分辨率特征图中处于相同像素位置的特征按特定顺序重新排列,得到通道数为C,长宽为rH*rW的高分辨率特征图,其中r表示上采样因子;不同于插值与反卷积的上采样方式,像素重排不会引入额外的参数与计算消耗,同时可以解决插值和反卷积的一些人工痕迹或棋盘效应的问题。
进一步地,步骤(4)的具体过程如下:
(i)将步骤(3)得到的38*38*76融合特征图F采用步幅为2的卷积进行下采样,得到19*19*256特征图G;再对特征图G采用步幅为2的卷积进行下采样,得到10*10*256特征图H;照此步骤依次得到5*5*256特征图I、3*3*128特征图J、1*1*128特征图K;
(ii)将步骤(3)得到的38*38*76融合特征图F与步骤(i)得到的特征图G~K共六个尺度的特征图分别输入到高效通道注意力模块,对特征通道按重要程度分配权重,得到带有权重的六个尺度的特征图;
其中,步骤(ii)的高效通道注意力模块能够学习通道间的关系,基于通道重要程度赋予通道权重;
首先,对特征通道维度进行压缩,将H*W*C的原始特征通道经过全局池化转化为1*1*C,得到通道维度上的全局特征值;
再用卷积核大小为5的一维卷积来对每个通道与其5个邻域通道之间进行信息提取整合以获取通道间的相关性参数Li:
其中,αj表示一维卷积核参数,经过Xavier初始化设定后随网络训练而更新;表示表示特征通道Ci的5个邻域通道/>中第j个通道的全局特征值;
之后将Li通过Sigmoid激活函数得到每个通道的激活值,作为通道的权重ωi:
其中,σ表示Sigmoid激活函数;
最后将权重与原通道特征值相乘,得到加权后的输出特征通道;网络能够通过加权特征通道来关注重要的主体特征。
进一步地,步骤(5)的具体过程如下:
(一)将步骤(4)中得到的带有权重的六个尺度特征图作为输入,对输入特征图的每一个像素生成多个默认框,之后分别由定位子网络和分类子网络进行检测;检测值包含两个部分:边界框位置和类别置信度;定位子网络对每一个默认框预测一个边界框;分类子网络对每一个默认框预测其所有类别的置信度;
(二)使用非极大值抑制对多个预测框内的目标类别置信度及预测框相对默认框的位置偏移量进行抑制,将目标损失函数为最小值的预测框选为最优预测框,得到最优的预测框内的目标类别及预测框位置。
其中,步骤(二)中的检测网络的目标损失函数L(x,l,c,g)由分类损失函数Lconf(x,c)和定位损失函数Lloc(x,l,g)组成:
其中,x为特征图上的默认框,l为预测框,c为特征图上的默认框在每个类别上的置信度预测值,g为真实框,Lconf(x,c)表示特征图上的默认框在类别得分集合c上的softmax分类损失函数,Lloc(x,l,g)表示位置损失函数,N表示与真实框所匹配的默认框数量,权重系数α通过交叉验证设置为1。检测网络通过优化损失函数来实现更为准确的目标定位与分类。
采用上述技术方案带来的有益效果:
本发明提出一种多尺度像素特征融合策略,通过对MobileNetv2网络提取到的深层特征图进行像素重排合成融合特征图,相较于其他上采样方式像素重排能够在不增加任何额外参数和计算的情况下增强特征图携带的小目标信息;在检测网络前加入高效通道注意力模块,对特征通道按重要程度分配权重,有效提升检测性能。本发明的方法具有内存占用少、检测速度快、小目标检测精准的优点,可以实现高精度的实时交通标志检测。
附图说明
图1本发明的流程示意图;
图2本发明的模型结构图;
具体实施方式
为了使本发明方法的目的,技术方案以及优点更加清楚明白,以下结合附图及实例解释本发明,并不用于限定本发明:
步骤1、获取包含交通标志的图像,对每张图像中出现的每一个交通标志标注出其边界框和类别信息。
采集的图像数量较少时,利用已有的图像进行数据增强操作。采用翻转、平移、旋转或加噪声等方法创造出更多的图像,使得训练的神经网络具有更好的效果。
将图像分辨率统一转化为300*300以适应输入尺寸。
将图像进行基于正负样本数目的优化,划分得到训练图像集和测试图像集。
步骤2、将300*300输入图像首先通过3*3的标准卷积块进行初步特征提取,得到150*150*32特征图,其中,32表示特征图的通道数。
将150*150*32特征图依次经过6个反向残差瓶颈块进行深度特征提取,分别得到38*38*32、19*19*96、10*10*320的深度特征图A、B、C。
步骤3、对步骤2特征提取得到的10*10*320深度特征图进行上采样因子为4的像素重排,得到38*38*20上采样特征图D;
对步骤2特征提取得到的19*19*96深度特征图进行像上采样因子为2的像素重排,得到38*38*24上采样特征图E;
将像素重排得到的38*38*20上采样特征图D和38*38*24上采样特征图E与38*38*32深度特征图A进行拼接处理,生成兼具语义信息与细节信息的38*38*76融合特征图F。
步骤4、将步骤3得到的38*38*76融合特征图F采用步幅为2的卷积进行下采样,得到19*19*256特征图G;再对特征图G采用步幅为2的卷积进行下采样,得到10*10*256特征图H;照此步骤依次得到5*5*256特征图I、3*3*128特征图J、1*1*128特征图K;
将38*38*76融合特征图F与特征图G~K共六个尺度的特征图分别输入到高效通道注意力模块,对特征通道维度进行压缩,将H*W*C的原始特征通道经过全局池化转化为1*1*C,得到通道维度上的全局特征值;
再用卷积核大小为5的一维卷积来对每个通道与其5个邻域通道之间进行信息提取整合以获取通道间的相关性参数Li:
其中,αj表示一维卷积核参数,经过Xavier初始化设定后随网络训练而更新;表示表示特征通道Ci的5个邻域通道/>中第j个通道的全局特征值;
之后将Li通过Sigmoid激活函数得到每个通道的激活值,作为通道的权重ωi:
其中,σ表示Sigmoid激活函数;
最后将权重与原通道特征值相乘,得到带有权重的六个尺度的特征图;
步骤5、将步骤4中得到的带有权重的六个尺度特征图作为输入,对输入特征图的每一个像素生成多个默认框,之后分别由定位子网络和分类子网络进行检测;检测值包含两个部分:边界框位置和类别置信度;定位子网络对每一个默认框预测一个边界框;分类子网络对每一个默认框预测其所有类别的置信度。
使用非极大值抑制对多个预测框内的目标类别置信度及预测框相对默认框的位置偏移量进行抑制,将目标损失函数为最小值的预测框选为最优预测框,得到最优的预测框内的目标类别及预测框位置。
其中,网络的目标损失函数L(x,l,c,g)由分类损失函数Lconf(x,c)和定位损失函数Lloc(x,l,g)组成:
其中,x为特征图上的默认框,l为预测框,c为特征图上的默认框在每个类别上的置信度预测值,g为真实框,Lconf(x,c)表示特征图上的默认框在类别得分集合c上的softmax分类损失函数,Lloc(x,l,g)表示位置损失函数,N表示与真实框所匹配的默认框数量,权重系数α通过交叉验证设置为1。检测网络通过优化损失函数来实现更为准确的目标定位与分类。
以上实施例仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所作的任何改动,均落入本发明保护范围之内。
Claims (6)
1.一种基于多尺度像素特征融合的实时交通标志检测方法,其特征在于,包括以下步骤:
(1)获取含有交通标志的图像,对获取到的图像进行预处理;
(2)将步骤(1)预处理后得到的图像输入MobileNetv2网络进行特征提取,得到三个尺度的深度特征图;
(3)将步骤(2)得到的三个尺度的深度特征图输入到像素特征融合模块进行像素重排,拼接生成兼具语义信息与细节信息的融合特征图;
(4)将步骤(3)得到的融合特征图进行下采样得到六个尺度特征图并输入到高效通道注意力模块,对特征通道按重要程度分配权重;
(5)将步骤(4)生成的带有权重的六个尺度特征图输入到SSD检测层进行交通标志的分类与定位,最后进行非极大值抑制,得到最优的交通标志检测结果;
步骤(3)中的像素特征融合模块采用像素重排方式合成融合特征图,相较于其他上采样方式像素重排能够在不增加任何额外参数和计算的情况下增强特征图携带的信息;像素重排通过压缩特征图中的通道数来扩展宽度和长度,其本质是将通道数为r2C,长宽为H*W的低分辨率特征图中处于相同像素位置的特征按特定顺序重新排列,得到通道数为C,长宽为rH*rW的高分辨率特征图,其中r表示上采样因子;
步骤(4)的具体过程如下:
(i)将步骤(3)得到的38*38*76融合特征图F采用步幅为2的卷积进行下采样,得到19*19*256特征图G;再对特征图G采用步幅为2的卷积进行下采样,得到10*10*256特征图H;照此步骤依次得到5*5*256特征图I、3*3*128特征图J、1*1*128特征图K;
(ii)将步骤(3)得到的38*38*76融合特征图F与步骤(i)得到的特征图G~K共六个尺度的特征图分别输入到高效通道注意力模块,对特征通道按重要程度分配权重,得到带有权重的六个尺度的特征图;
步骤(ii)的高效通道注意力模块能够学习通道间的关系,基于通道重要程度赋予通道权重;
首先,对特征通道维度进行压缩,将H*W*C特征图的原始特征通道经过全局池化转化为1*1*C,得到通道维度上的全局特征值;
再用卷积核大小为5的一维卷积来对每个通道与其5个邻域通道之间进行信息提取整合以获取通道间的相关性参数Li:
其中,αj表示一维卷积核参数,经过Xavier初始化设定后随网络训练而更新;表示表示特征通道Ci的5个邻域通道/>中第j个通道的全局特征值;
之后将Li通过Sigmoid激活函数得到每个通道的激活值,作为通道的权重ωi:
其中,σ表示Sigmoid激活函数;
最后将权重与原通道特征值相乘,得到加权后的输出特征通道;网络能够通过加权特征通道来关注重要的主体特征。
2.如权利要求1所述的一种基于多尺度像素特征融合的实时交通标志检测方法,其特征在于,步骤(1)的具体过程如下:
(a)获取包含交通标志的图像,并进行数据增强操作;
(b)对每张图像中出现的每一个交通标志标注出其边界框和类别信息;
(c)将图像分辨率统一转化为300*300以适应输入尺寸;
(d)将图像进行基于正负样本数目的优化,划分得到训练图像集和测试图像集。
3.如权利要求1所述的一种基于多尺度像素特征融合的实时交通标志检测方法,其特征在于,步骤(2)的具体过程如下:
(A)300*300输入图像首先通过3*3的标准卷积块进行初步特征提取,得到150*150*32特征图,其中,32表示特征图的通道数;
(B)步骤(A)中得到的150*150*32特征图依次经过6个反向残差瓶颈块进行深度特征提取,分别得到38*38*32、19*19*96、10*10*320的深度特征图A、B、C。
4.如权利要求1所述的一种基于多尺度像素特征融合的实时交通标志检测方法,其特征在于,步骤(3)的具体过程如下:
(Ⅰ)对步骤(2)特征提取得到的10*10*320深度特征图进行上采样因子为4的像素重排,得到38*38*20上采样特征图D;
(Ⅱ)对步骤(2)特征提取得到的19*19*96深度特征图进行像上采样因子为2的像素重排,得到38*38*24上采样特征图E;
(Ⅲ)将步骤(Ⅰ)和步骤(Ⅱ)中像素重排得到的38*38*20上采样特征图D和38*38*24上采样特征图E与步骤(2)特征提取得到的38*38*32深度特征图A进行拼接处理,生成兼具语义信息与细节信息的38*38*76融合特征图F。
5.如权利要求1所述的一种基于多尺度像素特征融合的实时交通标志检测方法,其特征在于,步骤(5)的具体过程如下:
(一)将步骤(4)中得到的带有权重的六个尺度特征图作为输入,对输入特征图的每一个像素生成多个默认框,之后分别由定位子网络和分类子网络进行检测;检测值包含两个部分:边界框位置和类别置信度;定位子网络对每一个默认框预测一个边界框;分类子网络对每一个默认框预测其所有类别的置信度;
(二)使用非极大值抑制对多个预测框内的目标类别置信度及预测框相对默认框的位置偏移量进行抑制,将目标损失函数为最小值的预测框选为最优预测框,得到最优的预测框内的目标类别及预测框位置。
6.如权利要求5所述的一种基于多尺度像素特征融合的实时交通标志检测方法,其特征在于,步骤(二)中,检测网络的目标损失函数L(x,l,c,g)由分类损失函数Lconf(x,c)和定位损失函数Lloc(x,l,g)组成:
其中,x为特征图上的默认框,l为预测框,c为特征图上的默认框在每个类别上的置信度预测值,g为真实框,Lconf(x,c)表示特征图上的默认框在类别得分集合c上的softmax分类损失函数,Lloc(x,l,g)表示位置损失函数,N表示与真实框所匹配的默认框数量,权重系数α通过交叉验证设置为1。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010866848.8A CN112183203B (zh) | 2020-08-26 | 2020-08-26 | 一种基于多尺度像素特征融合的实时交通标志检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010866848.8A CN112183203B (zh) | 2020-08-26 | 2020-08-26 | 一种基于多尺度像素特征融合的实时交通标志检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112183203A CN112183203A (zh) | 2021-01-05 |
CN112183203B true CN112183203B (zh) | 2024-05-28 |
Family
ID=73925715
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010866848.8A Active CN112183203B (zh) | 2020-08-26 | 2020-08-26 | 一种基于多尺度像素特征融合的实时交通标志检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112183203B (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112784857B (zh) * | 2021-01-29 | 2022-11-04 | 北京三快在线科技有限公司 | 一种模型训练以及图像处理方法及装置 |
CN112861987B (zh) * | 2021-03-03 | 2024-04-16 | 德鲁动力科技(成都)有限公司 | 暗光环境下的目标检测方法 |
CN113449770B (zh) * | 2021-05-18 | 2024-02-13 | 科大讯飞股份有限公司 | 图像检测方法以及电子设备、存储装置 |
CN113313118A (zh) * | 2021-06-25 | 2021-08-27 | 哈尔滨工程大学 | 基于多尺度特征融合的自适应可变占比目标检测方法 |
CN113536978B (zh) * | 2021-06-28 | 2023-08-18 | 杭州电子科技大学 | 一种基于显著性的伪装目标检测方法 |
CN113537397B (zh) * | 2021-08-11 | 2024-04-19 | 大连海事大学 | 基于多尺度特征融合的目标检测与图像清晰联合学习方法 |
CN113902903A (zh) * | 2021-09-30 | 2022-01-07 | 北京工业大学 | 一种基于下采样的双注意力多尺度融合方法 |
CN113723377B (zh) * | 2021-11-02 | 2022-01-11 | 南京信息工程大学 | 一种基于ld-ssd网络的交通标志检测方法 |
CN114241274B (zh) * | 2021-11-30 | 2023-04-07 | 电子科技大学 | 一种基于超分辨率多尺度特征融合的小目标检测方法 |
CN114463772B (zh) * | 2022-01-13 | 2022-11-25 | 苏州大学 | 基于深度学习的交通标志检测与识别方法及*** |
CN116797890A (zh) * | 2022-03-11 | 2023-09-22 | 北京字跳网络技术有限公司 | 图像增强方法、装置、设备及介质 |
CN114462555B (zh) | 2022-04-13 | 2022-08-16 | 国网江西省电力有限公司电力科学研究院 | 基于树莓派的多尺度特征融合配电网设备识别方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108268870A (zh) * | 2018-01-29 | 2018-07-10 | 重庆理工大学 | 基于对抗学习的多尺度特征融合超声图像语义分割方法 |
CN109344821A (zh) * | 2018-08-30 | 2019-02-15 | 西安电子科技大学 | 基于特征融合和深度学习的小目标检测方法 |
CN110110599A (zh) * | 2019-04-03 | 2019-08-09 | 天津大学 | 一种基于多尺度特征融合的遥感图像目标检测方法 |
CN110287849A (zh) * | 2019-06-20 | 2019-09-27 | 北京工业大学 | 一种适用于树莓派的轻量化深度网络图像目标检测方法 |
CN111179217A (zh) * | 2019-12-04 | 2020-05-19 | 天津大学 | 一种基于注意力机制的遥感图像多尺度目标检测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107609536A (zh) * | 2017-09-29 | 2018-01-19 | 百度在线网络技术(北京)有限公司 | 信息生成方法和装置 |
-
2020
- 2020-08-26 CN CN202010866848.8A patent/CN112183203B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108268870A (zh) * | 2018-01-29 | 2018-07-10 | 重庆理工大学 | 基于对抗学习的多尺度特征融合超声图像语义分割方法 |
CN109344821A (zh) * | 2018-08-30 | 2019-02-15 | 西安电子科技大学 | 基于特征融合和深度学习的小目标检测方法 |
CN110110599A (zh) * | 2019-04-03 | 2019-08-09 | 天津大学 | 一种基于多尺度特征融合的遥感图像目标检测方法 |
CN110287849A (zh) * | 2019-06-20 | 2019-09-27 | 北京工业大学 | 一种适用于树莓派的轻量化深度网络图像目标检测方法 |
CN111179217A (zh) * | 2019-12-04 | 2020-05-19 | 天津大学 | 一种基于注意力机制的遥感图像多尺度目标检测方法 |
Non-Patent Citations (3)
Title |
---|
基于Anchor-free的交通标志检测;范红超;李万志;章超权;;地球信息科学学报;20200125(第01期);全文 * |
基于残差单发多框检测器模型的交通标志检测与识别;张淑芳;朱彤;;浙江大学学报(工学版);20190509(第05期);全文 * |
多尺度特征融合与极限学习机结合的交通标志识别;马永杰;程时升;马芸婷;陈敏;;液晶与显示;20200615(第06期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112183203A (zh) | 2021-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112183203B (zh) | 一种基于多尺度像素特征融合的实时交通标志检测方法 | |
CN108647585B (zh) | 一种基于多尺度循环注意力网络的交通标识符检测方法 | |
CN110188705B (zh) | 一种适用于车载***的远距离交通标志检测识别方法 | |
WO2021244621A1 (zh) | 基于全局引导选择性上下文网络的场景语义解析方法 | |
CN112132156B (zh) | 多深度特征融合的图像显著性目标检测方法及*** | |
CN111563508A (zh) | 一种基于空间信息融合的语义分割方法 | |
CN112686207B (zh) | 一种基于区域信息增强的城市街道场景目标检测方法 | |
CN110781744A (zh) | 一种基于多层次特征融合的小尺度行人检测方法 | |
CN111461039B (zh) | 基于多尺度特征融合的地标识别方法 | |
CN113688836A (zh) | 一种基于深度学习的实时性道路图像语义分割方法及*** | |
CN113888547A (zh) | 基于gan网络的无监督域自适应遥感道路语义分割方法 | |
CN114202743A (zh) | 自动驾驶场景下基于改进faster-RCNN的小目标检测方法 | |
US20240161304A1 (en) | Systems and methods for processing images | |
CN115631344B (zh) | 一种基于特征自适应聚合的目标检测方法 | |
CN115424017B (zh) | 一种建筑物内外轮廓分割方法、装置及存储介质 | |
CN117079163A (zh) | 一种基于改进yolox-s的航拍图像小目标检测方法 | |
CN112613434A (zh) | 道路目标检测方法、装置及存储介质 | |
CN114519819B (zh) | 一种基于全局上下文感知的遥感图像目标检测方法 | |
CN116597270A (zh) | 基于注意力机制集成学习网络的道路损毁目标检测方法 | |
CN112149526A (zh) | 一种基于长距离信息融合的车道线检测方法及*** | |
CN113378642B (zh) | 一种对农村违法占地建筑物进行检测的方法 | |
CN114495050A (zh) | 一种面向自动驾驶前向视觉检测的多任务集成检测方法 | |
CN113505640A (zh) | 一种基于多尺度特征融合的小尺度行人检测方法 | |
CN117115616A (zh) | 一种基于卷积神经网络的实时低照度图像目标检测方法 | |
CN117115770A (zh) | 一种基于卷积神经网络和注意力机制的自动驾驶方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |