CN115761259B - 基于类别平衡损失函数的厨余垃圾目标检测方法和*** - Google Patents

基于类别平衡损失函数的厨余垃圾目标检测方法和*** Download PDF

Info

Publication number
CN115761259B
CN115761259B CN202211418560.XA CN202211418560A CN115761259B CN 115761259 B CN115761259 B CN 115761259B CN 202211418560 A CN202211418560 A CN 202211418560A CN 115761259 B CN115761259 B CN 115761259B
Authority
CN
China
Prior art keywords
kitchen waste
class
loss function
network
samples
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211418560.XA
Other languages
English (en)
Other versions
CN115761259A (zh
Inventor
方乐缘
唐崎
欧阳立韩
汤琳
梁桥康
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan University
Original Assignee
Hunan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan University filed Critical Hunan University
Priority to CN202211418560.XA priority Critical patent/CN115761259B/zh
Publication of CN115761259A publication Critical patent/CN115761259A/zh
Application granted granted Critical
Publication of CN115761259B publication Critical patent/CN115761259B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种基于类别平衡损失函数的厨余垃圾目标检测方法和***,包括构建厨余垃圾检测数据集;构建厨余垃圾目标检测模型,包括特征提取网络、特征融合网络、区域建议生成网络、RoI Transformer网络和检测头部网络;构建L1回归损失函数和类别平衡损失函数,根据厨余垃圾检测数据集中的训练集对目标检测模型进行训练,结合类别目标的边界框回归结果、分类结果概率、预设的目标真实边界框和类别标签对训练中的厨余垃圾目标检测模型使用梯度下降法反向传播损失梯度进行网络权重更新;获取实际厨余垃圾图像,根据训练好的厨余垃圾目标检测模型进行检测得到目标检测结果。有效提升了厨余垃圾中可回收垃圾各类别的检测精度。

Description

基于类别平衡损失函数的厨余垃圾目标检测方法和***
技术领域
本发明属于数字图像处理技术领域,特别是涉及一种基于类别平衡损失函数的厨余垃圾目标检测方法和***。
背景技术
厨余垃圾组分复杂,掺杂有大量的玻璃瓶、金属罐、各类塑料制品等杂质。这些杂质将会影响厨余垃圾的无害化、全量化消纳。因此,对厨余垃圾进行分拣成为亟待解决的问题。目前,厨余垃圾分拣主要依靠人工的方式,人工分拣费时费力,且分拣效率低下,同时在分拣过程中腐败变质的食品产生的细菌也严重影响工人的身体健康。因此,进行自动化的厨余垃圾分拣十分必要。研究厨余垃圾智能检测算法是实现自动化厨余垃圾分拣必不可少的部分。
在实际情况中,厨余垃圾中的可回收物显示出严重的类别样本数量不平衡分布。有一些类别例如不规则软塑料,占据了可回收物中的大部分,称其为多数类;而另一些类别比如玻璃制品,只占据可回收物中很小一部分,称其为少数类。基于深度学***衡,使用简单重新加权的方法无法有效提升检测性能,同时重新加权后多数类的样本权重下降,进而影响多数类中困难样本的特征学习。
发明内容
针对以上技术问题,本发明提供一种基于类别平衡损失函数的厨余垃圾目标检测方法和***。
本发明解决其技术问题采用的技术方案是:
一种基于类别平衡损失函数的厨余垃圾目标检测方法,方法包括以下步骤:
S100:采集厨余垃圾图像,构建厨余垃圾检测数据集;
S200:构建厨余垃圾目标检测模型,厨余垃圾目标检测模型包括依次连接的特征提取网络、特征融合网络、区域建议生成网络、RoI Transformer网络和检测头部网络,特征提取网络用于提取厨余垃圾图像的多尺度特征,特征融合网络用于对多尺度特征进行融合,将融合后的多尺度特征发送至区域建议生成网络,区域建议生成网络对融合后的多尺度特征进行候选框的生成,根据候选框和真实边界框的交并比得到正样本和负样本,RoITransformer网络用于将候选框样本进行对齐操作后,按照预设的正负样本比例提取对齐后的样本特征并输入至检测头部网络,得到类别目标的边界框回归结果和分类结果概率;
S300:构建L1回归损失函数和类别平衡损失函数,根据厨余垃圾检测数据集中的训练集对厨余垃圾目标检测模型进行训练,根据类别目标的边界框回归结果、分类结果概率、预设的目标真实边界框和类别标签对训练中的厨余垃圾目标检测模型计算损失值,根据损失值使用梯度下降法反向传播损失梯度进行网络权重更新,得到训练好的厨余垃圾目标检测模型;其中,类别平衡损失函数中包括基于样本数量的类间平衡加权因子和基于样本难易的加权因子;
S400:获取实际厨余垃圾图像,根据训练好的厨余垃圾目标检测模型对实际厨余垃圾图像进行检测得到目标检测结果。
优选地,特征提取网络包括维度扩张顶层、第一特征提取层、第二特征提取层、第三特征提取层和第四特征提取层,维度扩张层将输入图像进行维度扩张到第一特征提取阶段的输入所需要的维度,第一特征提取层包括3个Convnextblock块,第二特征提取层包括3个Convnextblock块,第三特征提取层包括9个Convnextblock块,第四特征提取层包括3个Convnextblock块,第一、第二、第三特征提取层的输出特征图分别进行两倍尺寸下采样后,输入到对应的下一个特征提取层,其中,Convnextblock块包括一个深度可分离卷积层,卷积核大小为7×7,一个归一化层,两个1×1卷积层和一个GELU激活函数。
优选地,特征融合模块包括第一特征融合层、第二特征融合层、第三特征融合层和第四特征融合层,第i特征融合层用于对第i层特征提取层输出的特征图通过最近邻插值的上采样方法,放大到与上一特征提取层输出特征图相同大小,再与上一特征提取层输出的特征图通过加和操作进行融合,得到第i层特征融合层输出的融合后的特征图Li
优选地,区域建议生成网络包括依次串联的1个3×3卷积和2个1×1卷积,S200中区域建议生成网络对融合后的多尺度特征进行候选框的生成,根据候选框和真实边界框的交并比得到正样本和负样本,包括:
融合后的特征图Li输入区域建议生成网络后,生成一系列候选框。其中,候选框与真实边界框的交并比大于0.7的候选框定义为正样本,与真实边界框的交并比小于0.3的候选框定义为负样本。
优选地,S300中构建L1回归损失函数和类别平衡损失函数包括:
S310:构建L1回归损失函数和交叉熵分类损失函数;
S320:设计基于样本数量的类间平衡加权因子;
S330:设计基于样本难易的加权因子;
S340:根据交叉熵分类损失函数、基于样本数量的类间平衡加权因子和基于样本难易的加权因子构建类别平衡损失函数。
优选地,S310包括:
采用L1回归损失函数:
其中,x为L1回归损失函数的自变量,表示类别目标的真实边界框和候选框的差;
采用交叉熵分类损失函数:
其中,y为类别标签,在二元分类中对应0、1,当为1时,表示分类结果与真实标签结果一致,P1为候选框内为类别目标的概率,为简化公式,定义:
则简化后的交叉熵损失函数为:
LCE(Pt,y)=-log(Pt)
Pt为类别y中每个样本的分类置信度,且Pt∈(0,1)。
优选地,S320包括:
定义数据集类别总数为N,由此得到每个训练批次中每个类别标签样本数为[n1,n2,n3,...,nN],则每个训练批次中第y类的样本数量为ny
定义类别标签y的样本数归一化因子,公式如下:
nmax为每个训练批次中所有类别样本数的最大值;
定义参数m、n,且0<m<n<1,设每个训练批次类别y的加权度因子为则定义每个训练批次中类别y的样本加权度/>公式如下:
δmaxmin分别为每个训练批次中所有类别的样本数归一化因子中的最大值和最小值;
定义每个训练批次中类别y的自适应类间平衡加权因子ωy,公式如下:
ny分别为每个训练批次中类别y的样本加权度和样本数,类间平衡加权因子与样本加权度/>和样本数都成负相关;
最后对所有类别的类平衡加权因子归一化,使得:
其中N为数据集中类别总数,i为每个类别的序号。
优选地,S330具体为:
定义如下样本难易加权因子γ,公式如下
γ=2-α(1+Pt)
Pt为每个训练批次中每个样本分类置信度,且Pt∈(0,1),α为难易调制因子,且α∈(0.5,1]。
优选地,S340具体为:
每个训练批次中,为类别y的样本加权度,ny为类别y的样本数量,α为难易调制因子,Pt为每个样本的分类置信度。
一种基于类别平衡损失函数的厨余垃圾目标检测***,包括:
厨余垃圾图像采集模块,用于采集厨余垃圾图像,构建厨余垃圾检测数据集;
厨余垃圾目标检测模型构建模块,用于构建厨余垃圾目标检测模型,厨余垃圾目标检测模型包括依次连接的特征提取网络、特征融合网络、区域建议生成网络、RoITransformer网络和检测头部网络,特征提取网络用于提取厨余垃圾图像的多尺度特征,特征融合网络用于对多尺度特征进行融合,将融合后的多尺度特征发送至区域建议生成网络,区域建议生成网络对融合后的多尺度特征进行候选框的生成,根据候选框和真实边界框的交并比得到正样本和负样本,RoI Transformer网络用于将候选框样本进行对齐操作后,按照预设的正负样本比例提取对齐后的样本特征并输入至检测头部网络,得到类别目标的边界框回归结果和分类结果概率;
厨余垃圾目标检测模型训练模块,用于构建L1回归损失函数和类别平衡损失函数,根据厨余垃圾检测训练集对厨余垃圾目标检测模型进行训练,根据类别目标的边界框回归结果、分类结果概率、预设的目标真实边界框和类别标签对训练中的厨余垃圾目标检测模型计算损失值,根据损失值使用梯度下降法反向传播损失梯度进行网络权重更新,得到训练好的厨余垃圾目标检测模型;
检测模块,用于获取实际厨余垃圾图像,根据训练好的厨余垃圾目标检测模型对实际厨余垃圾图像进行检测得到目标检测结果。
上述厨余垃圾目标检测方法和***,类别平衡损失函数在训练时的每个批次中,对每个类进行自适应类间平衡加权,让网络模型关注少数类别的样本的训练;同时通过样本难易加权因子,对各类中的难易样本进行不同程度的加权,挖掘困难样本特征。本发明的方法使得厨余垃圾中少数类别样本的平均检测精度有了显著的提升,同时对于多数类别样本的平均检测精度也有小幅的提升。
附图说明
图1为本发明一实施例中一种基于类别平衡损失函数的厨余垃圾目标检测方法流程图;
图2为本发明一实施例中的厨余垃圾图像数据集中各个类别的样例;
图3为本发明一实施例中的厨余垃圾图像数据训练集的各个类别的数量统计图;
图4为本发明一实施例中的厨余垃圾目标检测模型的结构示意图;
图5为本发明方法与现有方法在厨余垃圾图像数据集上的检测结果比较示意图,其中,(a)为交叉熵损失方法的检测结果,(b)为焦点损失方法的检测结果,(c)为本方法的检测结果,(d)为真实标签的结果。
具体实施方式
为了使本技术领域的人员更好地理解本发明的技术方案,下面结合附图对本发明作进一步的详细说明。
在一个实施例中,如图1所示,一种基于类别平衡损失函数的厨余垃圾目标检测方法,方法包括以下步骤:
S100:采集厨余垃圾图像,构建厨余垃圾检测数据集。
具体地,首先,采集厨余垃圾处理站的图像数据,总共采集13871张厨余垃圾图像。
其次,如图2所示,按照国家的垃圾种类定义,对数据集图像中的可回收垃圾进行分类,然后使用标注软件,采用人工标注的方式对图像中的可回收垃圾目标进行旋转矩形框的标注。具体的可回收垃圾类别和其标注数量分别为:不规则软塑料:80866、规则软塑料:46520、硬塑料:251166、利乐包:6358、塑料瓶:5776、玻璃制品:2698、金属制品:2361,共7类。
最后,把厨余垃圾数据按照4:1的比例随机划分为训练集和测试集,得到11097张训练集和2774张测试集。训练数据各类标注数量如图3所示。
进一步地,在构建厨余垃圾检测数据集后,要对厨余垃圾检测数据集中的训练集进行预处理,即采用双线性插值先将厨余垃圾训练数据集中所有图片缩放为1024×1024的大小;为了防止网络训练时发生过拟合,提高网络的泛化性能,随机按照横轴、纵轴和对角线进行翻转进行数据增强,翻转概率分别为0.25、0.25、0.25,最后将图像的按照设定均值(123.676,116.28,103.53)和方差(58.395,57.12,57.375)进行归一化处理。
S200:构建厨余垃圾目标检测模型,厨余垃圾目标检测模型包括依次连接的特征提取网络、特征融合网络、区域建议生成网络、RoI Transformer网络和检测头部网络,特征提取网络用于提取厨余垃圾图像的多尺度特征,特征融合网络用于对多尺度特征进行融合,将融合后的多尺度特征发送至区域建议生成网络,区域建议生成网络对融合后的多尺度特征进行候选框的生成,根据候选框和真实边界框的交并比得到正样本和负样本,RoITransformer网络用于将候选框样本进行对齐操作后,按照预设的正负样本比例提取对齐后的样本特征并输入至检测头部网络,得到类别目标的边界框回归结果和分类结果概率。
具体地,厨余垃圾目标检测模型的结构图如图4所示。
在一个实施例中,特征提取网络包括依次连接的维度扩张顶层、第一特征提取层、第二特征提取层、第三特征提取层和第四特征提取层,维度扩张层将输入图像进行维度扩张到第一特征提取阶段的输入所需要的维度,第一特征提取层包括3个Convnextblock块,第二特征提取层包括3个Convnextblock块,第三特征提取层包括9个Convnextblock块,第四特征提取层包括3个Convnextblock块,第一、第二、第三特征提取层的输出特征图分别进行两倍尺寸下采样后,输入到对应的下一个特征提取层,其中,Convnextblock块包括一个深度可分离卷积层,卷积核大小为7×7,一个归一化层,两个1×1卷积层和一个GELU激活函数。
具体地,第一特征提取层和第二特征提取层用于浅层特征提取,第三特征提取层和第四特征提取层用于深层特征提取。
在一个实施例中,特征融合模块包括第一特征融合层、第二特征融合层、第三特征融合层和第四特征融合层,第i特征融合层用于对第i层特征提取层输出的特征图通过最近邻插值的上采样方法,放大到与上一特征提取层输出特征图相同大小,再与上一特征提取层输出的特征图通过加和操作进行融合,得到第i层特征融合层输出的融合后的特征图Li
在一个实施例中,区域建议生成网络包括依次串联的1个3×3卷积和2个1×1卷积,S200中区域建议生成网络对融合后的多尺度特征进行候选框的生成,根据候选框和真实边界框的交并比得到正样本和负样本,包括:
融合后的特征图Li输入区域建议生成网络后,生成一系列候选框,其中,候选框与真实边界框的交并比大于0.7的候选框定义为正样本,与真实边界框的交并比小于0.3的候选框定义为负样本。
S300:构建L1回归损失函数和类别平衡损失函数,根据厨余垃圾检测数据集中的训练集对厨余垃圾目标检测模型进行训练,根据类别目标的边界框回归结果、分类结果概率、预设的目标真实边界框和类别标签对训练中的厨余垃圾目标检测模型计算损失值,根据损失值使用梯度下降法反向传播损失梯度进行网络权重更新,得到训练好的厨余垃圾目标检测模型;其中,类别平衡损失函数中包括基于样本数量的类间平衡加权因子和基于样本难易的加权因子。
具体地,设定网络模型训练的配置:将最大迭代轮数epochs设为12,训练批次大小设为4,每次训练读取4张图片以及对应的图片标注文件,优化器选择AdamW,初始学习率设置为0.0002,权重衰减设置为0.05。
设定网络模型测试的配置:区域建议网络非极大值抑制阈值设为0.7,检测头网络的交并比阈值设置为0.01,分数阈值设置为0.05。
在一个实施例中,S300中构建L1回归损失函数和类别平衡损失函数包括:
S310:构建L1回归损失函数和交叉熵分类损失函数;
S320:设计基于样本数量的类间平衡加权因子;
S330:设计基于样本难易的加权因子;
S340:根据交叉熵分类损失函数、基于样本数量的类间平衡加权因子和基于样本难易的加权因子构建类别平衡损失函数。
在一个实施例中,S310包括:
采用L1回归损失函数:
其中,x为L1回归损失函数的自变量,表示类别目标的真实边界框和候选框的差;
采用交叉熵分类损失函数:
其中,y为类别标签,在二元分类中对应0、1,当为1时,表示分类结果与真实标签结果一致,P1为候选框内为类别目标的概率,为简化公式,定义:
则简化后的交叉熵损失函数为:
LCE(Pt,y)=-log(Pt)
Pt为类别y中每个样本的分类置信度,且Pt∈(0,1)。
在一个实施例中,S320包括:
定义数据集类别总数为N,由此得到每个训练批次中每个类别标签样本数为[n1,n2,n3,...,nN],则每个训练批次中第y类的样本数量为ny
定义类别标签y的样本数归一化因子,公式如下:
nmax为每个训练批次中所有类别样本数的最大值;
定义参数m、n,且0<m<n<1,设每个训练批次类别y的加权度因子为则定义每个训练批次中类别y的样本加权度/>公式如下:
δmaxmin分别为每个训练批次中所有类别的样本数归一化因子中的最大值和最小值;
定义每个训练批次中类别y的自适应类间平衡加权因子ωy,公式如下:
ny分别为每个训练批次中类别y的样本加权度和样本数,类间平衡加权因子与样本加权度/>和样本数都成负相关;
最后对所有类别的类平衡加权因子归一化,使得:
其中N为厨余垃圾检测数据集中类别总数,i为每个类别的序号。
在一个实施例中,S330具体为:
定义如下样本难易加权因子γ,公式如下
γ=2-α(1+Pt)
Pt为每个训练批次中每个样本分类置信度,且Pt∈(0,1),α为难易调制因子,且α∈(0.5,1]。
具体地,使用样本难易加权因子γ缓解了因类间平衡加权因子减少了多数类的损失贡献而造成的其困难样本特征学习不足的问题,使得损失函数有效挖掘困难样本的特征。
在一个实施例中,S340具体为:
每个训练批次中,为类别y的样本加权度,ny为类别y的样本数量,α为难易调制因子,Pt为每个样本的分类置信度。
具体地,在训练之前,类别平衡损失函数在计算每个训练批次的所有类别的类间平衡加权因子时,m,n值作为超参数需要设定,且0<m<n<1。在本发明中,参数m,n分别取0.4和0.6。在计算每个训练批次的样本难易加权因子γ时,难易调制因子α作为一个超参数,需在多次实验中寻找到最优值,在本发明中,难易调制因子α取值0.63。使用设定好的的训练配置,在构建的网络模型上进行迭代训练,得到训练好的厨余垃圾目标检测模型。
S400:获取实际厨余垃圾图像,根据训练好的厨余垃圾目标检测模型对实际厨余垃圾图像进行检测得到目标检测结果。
以下结合一个实施例,说明本发明的优点。
将本发明方法与两种现有方法进行对比;现有方法包括交叉熵分类损失函数(Cross Entropy Loss)、焦点分类损失函数(Focal Loss)。
本方法与现有方法在测试集上每一个类别的平均检测精度结果比较如表1所示:
表1厨余垃圾测试集每个类别的平均检测精度结果比较
从表1可以看到,本发明方法表现出比其他方法更优的量化结果。本发明方法和其他方法的可视化对比结果如图5所示(图5中,图5(a)为交叉熵损失方法的检测结果,图5(b)为焦点损失方法的检测结果,图5(c)为本方法方法的检测结果,图5(d)为真实标签的结果)。从量化结果和可视化结果均可以看出,本发明方法的检测效果最好。
在一个实施例中,一种基于类别平衡损失函数的厨余垃圾目标检测***,包括:
厨余垃圾图像采集模块,用于采集厨余垃圾图像,构建厨余垃圾检测数据集;
厨余垃圾目标检测模型构建模块,用于构建厨余垃圾目标检测模型,厨余垃圾目标检测模型包括依次连接的特征提取网络、特征融合网络、区域建议生成网络、RoITransformer网络和检测头部网络,特征提取网络用于提取厨余垃圾图像的多尺度特征,特征融合网络用于对多尺度特征进行融合,将融合后的多尺度特征发送至区域建议生成网络,区域建议生成网络对融合后的多尺度特征进行候选框的生成,根据候选框和真实边界框的交并比得到正样本和负样本,RoI Transformer网络用于将候选框样本进行对齐操作后,按照预设的正负样本比例提取对齐后的样本特征并输入至检测头部网络,得到类别目标的边界框回归结果和分类结果概率;
厨余垃圾目标检测模型训练模块,用于构建L1回归损失函数和类别平衡损失函数,根据厨余垃圾检测数据集中的训练集对厨余垃圾目标检测模型进行训练,根据类别目标的边界框回归结果、分类结果概率、预设的目标真实边界框和类别标签对训练中的厨余垃圾目标检测模型计算损失值,根据损失值使用梯度下降法反向传播损失梯度进行网络权重更新,得到训练好的厨余垃圾目标检测模型;
检测模块,用于获取实际厨余垃圾图像,根据训练好的厨余垃圾目标检测模型对实际厨余垃圾图像进行检测得到目标检测结果。
关于一种基于类别平衡损失函数的厨余垃圾目标检测***的具体限定可参照一种基于类别平衡损失函数的厨余垃圾目标检测方法的描述,在此不再赘述。
与现有技术相比,本发明有以下有益效果:
本发明设计了一种基于类别平衡损失函数的厨余垃圾目标检测方法和***,对目标检测网络中的分类损失函数进行构建。构建后的类别平衡损失函数在训练时的每个批次中,对每个类进行自适应类间平衡加权,让网络模型关注少数类别的样本的训练;同时通过样本难易加权因子,对各类中的难易样本进行不同程度的加权,挖掘困难样本特征。本发明的方法使得塑料瓶、玻璃制品和金属制品这些少数类别样本的平均检测精度有了显著的提升,同时对于多数类别样本的平均检测精度也有小幅的提升。
以上对本发明所提供的一种基于类别平衡损失函数的厨余垃圾目标检测方法和***进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (8)

1.一种基于类别平衡损失函数的厨余垃圾目标检测方法,其特征在于,所述方法包括以下步骤:
S100:采集厨余垃圾图像,构建厨余垃圾检测数据集;
S200:构建厨余垃圾目标检测模型,所述厨余垃圾目标检测模型包括依次连接的特征提取网络、特征融合网络、区域建议生成网络、RoI Transformer网络和检测头部网络,所述特征提取网络用于提取所述厨余垃圾图像的多尺度特征,所述特征融合网络用于对所述多尺度特征进行融合,将融合后的多尺度特征发送至区域建议生成网络,所述区域建议生成网络对所述融合后的多尺度特征进行候选框的生成,根据候选框和真实边界框的交并比得到正样本和负样本,所述RoI Transformer网络用于将候选框样本进行对齐操作后,按照预设的正负样本比例提取对齐后的样本特征并输入至所述检测头部网络,得到类别目标的边界框回归结果和分类结果概率;
S300:构建L1回归损失函数和类别平衡损失函数,根据所述厨余垃圾检测数据集中的训练集对所述厨余垃圾目标检测模型进行训练,根据所述类别目标的边界框回归结果、分类结果概率、预设的目标真实边界框和类别标签对训练中的厨余垃圾目标检测模型计算损失值,根据损失值使用梯度下降法反向传播损失梯度进行网络权重更新,得到训练好的厨余垃圾目标检测模型;其中,所述类别平衡损失函数中包括基于样本数量的类间平衡加权因子和所述基于样本难易的加权因子;
S400:获取实际厨余垃圾图像,根据所述训练好的厨余垃圾目标检测模型对所述实际厨余垃圾图像进行检测得到目标检测结果;
S300中构建的L1回归损失函数和类别平衡损失函数包括:
S310:构建L1回归损失函数和交叉熵分类损失函数;
S320:设计基于样本数量的类间平衡加权因子;
S330:设计基于样本难易的加权因子;
S340:根据所述交叉熵分类损失函数、所述基于样本数量的类间平衡加权因子和所述基于样本难易的加权因子,构建类别平衡损失函数;
S340具体为:
每个训练批次中, 为类别y的样本加权度,/>为类别y的样本数量,/>为难易调制因子,/>为每个样本的分类置信度。
2.根据权利要求1所述的方法,其特征在于,所述特征提取网络包括维度扩张顶层、第一特征提取层、第二特征提取层、第三特征提取层和第四特征提取层,所述维度扩张层将输入图像进行维度扩张到第一特征提取阶段的输入所需要的维度,所述第一特征提取层包括3个Convnextblock块,所述第二特征提取层包括3个Convnextblock块,所述第三特征提取层包括9个Convnextblock块,所述第四特征提取层包括3个Convnextblock块,所述第一、第二、第三特征提取层的输出特征图分别进行两倍尺寸下采样后,输入到对应的下一个特征提取层,其中,所述Convnextblock块包括一个深度可分离卷积层,卷积核大小为,一个归一化层,两个/>卷积层和一个GELU激活函数。
3.根据权利要求2所述的方法,其特征在于,所述特征融合网络包括第一特征融合层、第二特征融合层、第三特征融合层和第四特征融合层,第i特征融合层用于对第i层特征提取层输出的特征图通过最近邻插值的上采样方法,放大到与上一特征提取层输出特征图相同大小,再与所述上一特征提取层输出的特征图通过加和操作进行融合,得到第i层特征融合层输出的融合后的特征图
4.根据权利要求3所述的方法,其特征在于,所述区域建议生成网络包括依次串联的1个卷积和2个/>卷积,S200中所述区域建议生成网络对所述融合后的多尺度特征进行候选框的生成,根据候选框和真实边界框的交并比得到正样本和负样本,包括:
所述融合后的特征图输入所述区域建议生成网络后,生成一系列候选框,其中,候选框与真实边界框的交并比大于0.7的候选框定义为正样本,与真实边界框的交并比小于0.3的候选框定义为负样本。
5.根据权利要求1所述的方法,其特征在于,S310包括:
采用L1回归损失函数:
其中,为L1回归损失函数的自变量,表示类别目标的真实边界框和候选框的差;
采用交叉熵分类损失函数:
其中,y为类别标签,在二元分类中对应0、1,当为1时,表示分类结果与真实标签结果一致,为候选框内为类别目标的概率,为简化公式,定义:
则简化后的交叉熵损失函数为:
为类别y中每个样本的分类置信度,且/>
6.根据权利要求1所述的方法,其特征在于,S320包括:
定义数据集类别总数为N,由此得到每个训练批次中每个类别标签样本数为,则每个训练批次中第y类的样本数量为/>
定义类别标签y的样本数归一化因子,公式如下:
为每个训练批次中所有类别样本数的最大值;
定义参数、/>,且/>,设每个训练批次类别y的加权度因子为/>,且,则定义每个训练批次中类别y的样本加权度/>,公式如下:
,/>分别为每个训练批次中所有类别的样本数归一化因子中的最大值和最小值;
定义每个训练批次中类别y的自适应类间平衡加权因子,公式如下:
,/>分别为每个训练批次中类别y的样本加权度和样本数,类间平衡加权因子与样本加权度/>和样本数都成负相关;
最后对所有类别的类平衡加权因子归一化,使得:
其中N为厨余垃圾数据集中类别总数,i为每个类别的序号。
7.根据权利要求1所述的方法,其特征在于,S330具体为:
定义如下样本难易加权因子,公式如下:
为每个训练批次中每个样本分类置信度,且/>,/>为难易调制因子,且
8.一种基于类别平衡损失函数的厨余垃圾目标检测***,其特征在于,包括:
厨余垃圾图像采集模块,用于采集厨余垃圾图像,构建厨余垃圾检测数据集;
厨余垃圾目标检测模型构建模块,用于构建厨余垃圾目标检测模型,所述厨余垃圾目标检测模型包括依次连接的特征提取网络、特征融合网络、区域建议生成网络、RoITransformer网络和检测头部网络,所述特征提取网络用于提取所述厨余垃圾图像的多尺度特征,所述特征融合网络用于对所述多尺度特征进行融合,将融合后的多尺度特征发送至区域建议生成网络,所述区域建议生成网络对所述融合后的多尺度特征进行候选框的生成,根据候选框和真实边界框的交并比得到正样本和负样本,所述RoI Transformer网络用于将候选框样本进行对齐操作后,按照预设的正负样本比例提取对齐后的样本特征并输入至所述检测头部网络,得到类别目标的边界框回归结果和分类结果概率;
厨余垃圾目标检测模型训练模块,用于构建L1回归损失函数和类别平衡损失函数,根据所述厨余垃圾检测数据集中的训练集对所述厨余垃圾目标检测模型进行训练,根据所述类别目标的边界框回归结果、分类结果概率、预设的目标真实边界框和类别标签对训练中的厨余垃圾目标检测模型计算损失值,根据损失值使用梯度下降法反向传播损失梯度进行网络权重更新,得到训练好的厨余垃圾目标检测模型;
检测模块,用于获取实际厨余垃圾图像,根据所述训练好的厨余垃圾目标检测模型对所述实际厨余垃圾图像进行检测得到目标检测结果;
其中,构建的L1回归损失函数和类别平衡损失函数包括:构建L1回归损失函数和交叉熵分类损失函数;设计基于样本数量的类间平衡加权因子;设计基于样本难易的加权因子;根据所述交叉熵分类损失函数、所述基于样本数量的类间平衡加权因子和所述基于样本难易的加权因子,构建类别平衡损失函数;
根据所述交叉熵分类损失函数、所述基于样本数量的类间平衡加权因子和所述基于样本难易的加权因子,构建类别平衡损失函数,具体为:
每个训练批次中, 为类别y的样本加权度,/>为类别y的样本数量,/>为难易调制因子,/>为每个样本的分类置信度。
CN202211418560.XA 2022-11-14 2022-11-14 基于类别平衡损失函数的厨余垃圾目标检测方法和*** Active CN115761259B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211418560.XA CN115761259B (zh) 2022-11-14 2022-11-14 基于类别平衡损失函数的厨余垃圾目标检测方法和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211418560.XA CN115761259B (zh) 2022-11-14 2022-11-14 基于类别平衡损失函数的厨余垃圾目标检测方法和***

Publications (2)

Publication Number Publication Date
CN115761259A CN115761259A (zh) 2023-03-07
CN115761259B true CN115761259B (zh) 2023-11-24

Family

ID=85370103

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211418560.XA Active CN115761259B (zh) 2022-11-14 2022-11-14 基于类别平衡损失函数的厨余垃圾目标检测方法和***

Country Status (1)

Country Link
CN (1) CN115761259B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116777843B (zh) * 2023-05-26 2024-02-27 湖南大学 一种基于动态非极大值抑制的厨余垃圾检测方法及***

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111091105A (zh) * 2019-12-23 2020-05-01 郑州轻工业大学 基于新的边框回归损失函数的遥感图像目标检测方法
WO2020102988A1 (zh) * 2018-11-20 2020-05-28 西安电子科技大学 基于特征融合和稠密连接的红外面目标检测方法
CN112541532A (zh) * 2020-12-07 2021-03-23 长沙理工大学 基于密集连接结构的目标检测方法
CN113807347A (zh) * 2021-08-20 2021-12-17 北京工业大学 一种基于目标检测技术的厨余垃圾杂质识别方法
CN114510732A (zh) * 2022-01-28 2022-05-17 上海大学 一种基于增量学习的加密流量分类方法
CN115205521A (zh) * 2022-08-09 2022-10-18 湖南大学 基于神经网络的厨余垃圾检测方法
CN115272652A (zh) * 2022-07-29 2022-11-01 东南大学 基于多元回归和自适应焦点损失的密集物体图像检测方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020102988A1 (zh) * 2018-11-20 2020-05-28 西安电子科技大学 基于特征融合和稠密连接的红外面目标检测方法
CN111091105A (zh) * 2019-12-23 2020-05-01 郑州轻工业大学 基于新的边框回归损失函数的遥感图像目标检测方法
CN112541532A (zh) * 2020-12-07 2021-03-23 长沙理工大学 基于密集连接结构的目标检测方法
CN113807347A (zh) * 2021-08-20 2021-12-17 北京工业大学 一种基于目标检测技术的厨余垃圾杂质识别方法
CN114510732A (zh) * 2022-01-28 2022-05-17 上海大学 一种基于增量学习的加密流量分类方法
CN115272652A (zh) * 2022-07-29 2022-11-01 东南大学 基于多元回归和自适应焦点损失的密集物体图像检测方法
CN115205521A (zh) * 2022-08-09 2022-10-18 湖南大学 基于神经网络的厨余垃圾检测方法

Also Published As

Publication number Publication date
CN115761259A (zh) 2023-03-07

Similar Documents

Publication Publication Date Title
CN110533084B (zh) 一种基于自注意力机制的多尺度目标检测方法
CN111652321B (zh) 一种基于改进yolov3算法的海上船舶检测方法
CN112330682B (zh) 一种基于深度卷积神经网络的工业ct图像分割方法
CN109978807B (zh) 一种基于生成式对抗网络的阴影去除方法
CN114821246A (zh) 基于多层次残差网络感知和注意力机制的小目标检测方法
CN107784288A (zh) 一种基于深度神经网络的迭代定位式人脸检测方法
CN113313706B (zh) 基于检测参考点偏移分析的电力设备缺陷图像检测方法
CN108108731A (zh) 基于合成数据的文本检测方法及装置
CN111915628B (zh) 一种基于预测目标密集边界点的单阶段实例分割方法
CN111460927A (zh) 对房产证图像进行结构化信息提取的方法
CN115761259B (zh) 基于类别平衡损失函数的厨余垃圾目标检测方法和***
CN114444566A (zh) 一种图像伪造检测方法、装置以及计算机存储介质
Pratama et al. Deep convolutional neural network for hand sign language recognition using model E
CN110111365B (zh) 基于深度学习的训练方法和装置以及目标跟踪方法和装置
CN111462090A (zh) 一种多尺度图像目标检测方法
CN113963272A (zh) 一种基于改进yolov3的无人机图像目标检测方法
CN113888505A (zh) 一种基于语义分割的自然场景文本检测方法
CN117253071B (zh) 基于多级伪标签增强的半监督目标检测方法及***
CN111340139B (zh) 一种图像内容复杂度的判别方法及装置
CN116977624A (zh) 一种基于YOLOv7模型的目标识别方法、***、电子设备及介质
CN111369489B (zh) 一种图像识别方法、装置及终端设备
CN111612099A (zh) 基于局部排序差值细化模式的纹理图像分类方法及***
CN114782762B (zh) 一种垃圾图像检测方法以及小区垃圾站
CN107274357B (zh) 一种参数最优的灰度图像增强处理***
CN114419078A (zh) 基于卷积神经网络的表面缺陷区域分割方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant