CN117197559A - 基于深度学习的猪肉分类模型、构建方法、电子设备和计算机可读介质 - Google Patents
基于深度学习的猪肉分类模型、构建方法、电子设备和计算机可读介质 Download PDFInfo
- Publication number
- CN117197559A CN117197559A CN202311153185.5A CN202311153185A CN117197559A CN 117197559 A CN117197559 A CN 117197559A CN 202311153185 A CN202311153185 A CN 202311153185A CN 117197559 A CN117197559 A CN 117197559A
- Authority
- CN
- China
- Prior art keywords
- size
- layer
- pork
- feature map
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 235000015277 pork Nutrition 0.000 title claims abstract description 98
- 238000013145 classification model Methods 0.000 title claims abstract description 84
- 238000013135 deep learning Methods 0.000 title claims abstract description 35
- 238000010276 construction Methods 0.000 title claims abstract description 10
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 51
- 238000012549 training Methods 0.000 claims abstract description 45
- 238000000034 method Methods 0.000 claims abstract description 31
- 238000012360 testing method Methods 0.000 claims abstract description 18
- 238000012795 verification Methods 0.000 claims abstract description 15
- 238000007781 pre-processing Methods 0.000 claims abstract description 8
- 238000011176 pooling Methods 0.000 claims description 79
- 230000006870 function Effects 0.000 claims description 50
- 238000010606 normalization Methods 0.000 claims description 49
- 230000004913 activation Effects 0.000 claims description 42
- 238000012545 processing Methods 0.000 claims description 29
- 239000013598 vector Substances 0.000 claims description 27
- 238000011156 evaluation Methods 0.000 claims description 18
- 238000010586 diagram Methods 0.000 claims description 16
- 238000003860 storage Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 5
- 238000004519 manufacturing process Methods 0.000 abstract description 5
- 238000003062 neural network model Methods 0.000 abstract description 5
- 238000013528 artificial neural network Methods 0.000 abstract description 4
- 230000000694 effects Effects 0.000 description 13
- 235000013372 meat Nutrition 0.000 description 13
- 230000014509 gene expression Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000010411 cooking Methods 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 230000037213 diet Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 235000019640 taste Nutrition 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Landscapes
- Image Analysis (AREA)
Abstract
本发明实施例公开了基于深度学习的猪肉分类模型、构建方法、电子设备和计算机可读介质;方法包括步骤:S1、获取猪肉原始图像,并对原始图像进行预处理;S2、将预处理后的猪肉图像数据分为训练集、验证集和测试集;S3、构建卷积神经网络模型;卷积神经网络模型的结构两层卷积两层全连接层的卷积神经网络;S4、利用训练集对构建的卷积神经网络模型进行训练;S5、利用验证集和测试集数据对训练后的卷积神经网络模型进行优化,得到优化的猪肉分类模型,优化的猪肉分类模型的结构为包含四层卷积两层全连接层的卷积神经网络模型,能够对猪肉进行精确分类,能够大幅减少人工判断的时间和误判的可能性,提高了猪肉生产、销售、管理效率。
Description
技术领域
本发明属于数据处理技术领域,具体涉及基于深度学习的猪肉分类模型、构建方法、电子设备和计算机可读介质。
背景技术
猪肉是人们日常饮食中重要的肉类来源之一,不同部位猪肉的口感和价格都有所不同。因此,如何对不同部位的猪肉进行准确的识别和分类,实现针对性的销售、加工和烹饪,成为了肉类生产和销售领域一个重要的研究方向。
在传统的猪肉分类研究中,大多采用人工选取样品的方式,再通过人眼观察鉴定来进行分类。这种方法的局限性是,一方面往往需要具备专业知识和经验丰富的人员才能进行鉴定;另一方面由于人主管因素的干扰,分类结果不够准确和科学,影响了生产、销售和管理效率。而数据驱动的深度学习算法,则避免了这些因素,可以更准确、更快速地实现猪肉不同部位的自动化识别和分类。采用深度学习技术对猪肉进行分类,已经成为一种极具前景的方法。高效的图像分类算法和快速的数据处理需求日益增大。在这种情况下,利用深度学习进行猪肉不同部位图像分类的研究具有迫切性和实践意义。
发明内容
有鉴于此,一方面,一些实施例公开了基于深度学习的猪肉分类模型的构建方法,包括步骤:
S1、获取猪肉原始图像,并对原始图像进行预处理;
S2、将预处理后的猪肉图像数据分为训练集、验证集和测试集;
S3、构建卷积神经网络模型;卷积神经网络模型的结构包括输入层、第一卷积层、第一池化层、第二卷积层、第二池化层、第一全连接层和第二全连接层;
S4、利用训练集对构建的卷积神经网络模型进行训练;
S5、利用验证集和测试集数据对训练后的卷积神经网络模型进行优化,得到优化的猪肉分类模型,优化的猪肉分类模型的结构包括:输入层、第一卷积层、第一池化层、第二卷积层、第二池化层、第三卷积层、第三池化层、第四卷积层、第四池化层、第一全连接层和第二全连接层。
进一步,一些实施例公开的基于深度学习的猪肉分类模型的构建方法,步骤S1中,对原始图像进行预处理包括:
S101、对原始图像数据进行数据增强;
S102、调整图像尺寸至设定值。
一些实施例公开的基于深度学习的猪肉分类模型的构建方法,步骤S2包括:
S201、读取图像存储路径、为每个猪肉类别分配一个数字ID;
S202、读取所有图像的存储路径,将图像路径和其所属类别的数字ID一同写入CSV文件中并保存;
S203、定义图像数据集的类,并将图像数据集中60%的图像作为训练集,20%的图像作为验证集,20%的图像作为测试集。
一些实施例公开的基于深度学习的猪肉分类模型的构建方法,步骤S3中,卷积神经网络模型结构包括:
输入层:输入大小为3×128×128的RGB图像;
第一卷积层:16个大小为3×3×3的卷积核,步长为1,输出特征图大小为16×128×128;
第一池化层:大小为2×2的最大池化,步长为2,对输出为16×128×128的特征图进行操作,输出特征图大小为16×64×64;
第二卷积层:16个大小为3×3×16的卷积核,步长为1,输出特征图大小为16×64×64;
第二池化层:大小为2×2的最大池化,步长为2,对输出为16×64×64的特征图进行操作,输出特征图大小为16×32×32;
第一全连接层:将上一层的特征图展平成大小为16×32×32的向量,再经过一个带有Dropout正则化和ReLU激活函数的全连接层,输出大小为16的向量;
第二全连接层:将上一层的输出再经过一个不带激活函数的全连接层,输出大小为3的向量。
一些实施例公开的基于深度学习的猪肉分类模型的构建方法,步骤S5中,还包括对卷积神经网络模型的性能评价步骤,评价指标包括正确率、精度、召回率、F1分数和ROC曲线。
一些实施例公开的基于深度学习的猪肉分类模型的构建方法,步骤S5中,根据性能评价结果优化卷积神经网络模型,具体包括调整图像的尺寸、拓展卷积神经网络模型结构。
一些实施例公开的基于深度学习的猪肉分类模型的构建方法,步骤S5中,拓展的卷积神经网络模型的结构包括:
输入层:输入大小为3×224×224的RGB图像;
第一卷积层:16个大小为3×3的卷积核,步长为1,使用ReLU激活函数和BatchNormalization进行归一化处理,输出特征图大小为16×224×224;
第一池化层:大小为2×2的最大池化,步长为2,对输出为16×224×224的特征图进行操作,输出特征图大小为16×112×112;
第二卷积层:32个大小为3×3的卷积核,步长为1,使用ReLU激活函数和BatchNormalization进行归一化处理,输出特征图大小为32×112×112;
第二池化层:大小为2×2的最大池化,步长为2,对输出为32×112×112的特征图进行操作,输出特征图大小为32×56×56;
第三卷积层:64个大小为5×5的卷积核,步长为1,使用ReLU激活函数和BatchNormalization进行归一化处理,输出特征图大小为64×56×56;
第三池化层:大小为2×2的最大池化,步长为2,对输出为64×56×56的特征图进行操作,输出特征图大小为64×28×28;
第四卷积层:64个大小为5×5的卷积核,步长为1,使用ReLU激活函数和BatchNormalization进行归一化处理,输出特征图大小为64×28×28;
第四池化层:大小为2×2的最大池化,步长为2,对输出为64×28×28的特征图进行操作,输出特征图大小为64×14×14;
第一全连接层:将上一层的特征图展平成大小为64×14×14的向量,再经过一个带有Dropout正则化和ReLU激活函数的全连接层,输出大小为64的向量;和
第二全连接层:将上一层的输出再经过一个不带激活函数的全连接层,输出大小为3的向量。
另一方面,一些实施例公开了基于深度学习的猪肉分类模型,由基于深度学习的猪肉分类模型的构建方法所得,猪肉分类模型为卷积神经网络模型,结构包括:
输入层:输入大小为3×224×224的RGB图像;
第一卷积层:16个大小为3×3的卷积核,步长为1,使用ReLU激活函数和BatchNormalization进行归一化处理,输出特征图大小为16×224×224;
第一池化层:大小为2×2的最大池化,步长为2,对输出为16×224×224的特征图进行操作,输出特征图大小为16×112×112;
第二卷积层:32个大小为3×3的卷积核,步长为1,使用ReLU激活函数和BatchNormalization进行归一化处理,输出特征图大小为32×112×112;
第二池化层:大小为2×2的最大池化,步长为2,对输出为32×112×112的特征图进行操作,输出特征图大小为32×56×56;
第三卷积层:64个大小为5×5的卷积核,步长为1,使用ReLU激活函数和BatchNormalization进行归一化处理,输出特征图大小为64×56×56;
第三池化层:大小为2×2的最大池化,步长为2,对输出为64×56×56的特征图进行操作,输出特征图大小为64×28×28;
第四卷积层:64个大小为5×5的卷积核,步长为1,使用ReLU激活函数和BatchNormalization进行归一化处理,输出特征图大小为64×28×28;
第四池化层:大小为2×2的最大池化,步长为2,对输出为64×28×28的特征图进行操作,输出特征图大小为64×14×14;
第一全连接层:将上一层的特征图展平成大小为64×14×14的向量,再经过一个带有Dropout正则化和ReLU激活函数的全连接层,输出大小为64的向量;和
第二全连接层:将上一层的输出再经过一个不带激活函数的全连接层,输出大小为3的向量。
再一方面,一些实施例公开了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当上述一个或多个程序被上述一个或多个处理器执行,使得上述一个或多个处理器实现如第一、第二方面中任一的方法。
又一方面,一些实施例公开了一种计算机可读介质,其上存储有计算机程序,其中,上述程序被处理器执行时实现基于深度学习的猪肉分类模型的构建方法的方法。
本发明实施例公开的基于深度学习的猪肉分类模型的构建方法得到了对猪肉进行分类的卷积神经网络模型,能够对猪肉进行精确分类,例如能够对五花肉、梅花肉和肋排进行精确分类,提高了猪肉分类精确度、分类效率,能够大幅减少人工判断的时间和误判的可能性,提高了猪肉生产、销售、管理效率。
附图说明
图1、一些实施例公开的基于深度学习的猪肉分类模型构建流程示意图;
图2、一些实施例公开的四层卷积神经网络模型结构图;
图3、一些实施例公开的肉类分类结果示意图;
图4、一些实施例公开的训练正确率示意图;
图5、一些实施例公开的ROC曲线图;
图6、一些实施例公开的拓展后卷积神经网络模型的ROC曲线图。
具体实施方式
在这里专用的词“实施例”,作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。本发明实施例中性能指标测试,除非特别说明,采用本领域常规试验方法。应理解,本发明实施例中所述的术语仅仅是为描述特别的实施方式,并非用于限制本发明实施例公开的内容。
除非另有说明,否则本文使用的技术和科学术语具有本发明实施例所属技术领域的普通技术人员通常理解的相同含义;作为本发明实施例中其它未特别注明的试验方法和技术手段均指本领域内普通技术人员通常采用的实验方法和技术手段。
本文所用的术语“基本”和“大约”用于描述小的波动。例如,它们可以是指小于或等于±5%,如小于或等于±2%,如小于或等于±1%,如小于或等于±0.5%,如小于或等于±0.2%,如小于或等于±0.1%,如小于或等于±0.05%。在本文中以范围格式表示或呈现的数值数据,仅为方便和简要起见使用,因此应灵活解释为不仅包括作为该范围的界限明确列举的数值,还包括该范围内包含的所有独立的数值或子范围。例如,“1~5%”的数值范围应被解释为不仅包括1%至5%的明确列举的值,还包括在所示范围内的独立值和子范围。因此,在这一数值范围中包括独立值,如2%、3.5%和4%,和子范围,如1%~3%、2%~4%和3%~5%等。这一原理同样适用于仅列举一个数值的范围。此外,无论该范围的宽度或所述特征如何,这样的解释都适用。
在本文中,包括权利要求书中,连接词,如“包含”、“包括”、“带有”、“具有”、“含有”、“涉及”、“容纳”等被理解为是开放性的,即是指“包括但不限于”。只有连接词“由……构成”和“由……组成”是封闭连接词。
为了更好的说明本发明内容,在下文的具体实施例中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本发明同样可以实施。在实施例中,对于本领域技术人员熟知的一些方法、手段、仪器、设备等未作详细描述,以便凸显本发明的主旨。
在不冲突的前提下,本发明实施例公开的技术特征可以任意组合,得到的技术方案属于本发明实施例公开的内容。
在一些实施方式中,如图1所示,基于深度学习的猪肉分类模型的构建方法包括步骤:
S1、获取猪肉原始图像,并对原始图像进行预处理;一般地,图像预处理的目的是通过对原始图像数据的一系列操作,使得输入的图像数据更加规范,容易操作且符合猪肉分类模型的需求,从而可以提高模型训练的效率和准确性,更好地完成对图像数据的分类;
S2、将预处理后的猪肉图像数据分为训练集、验证集和测试集;一般地,数据集分为三部分,训练集,验证集和测试集;训练集用于对模型进行训练,验证集用于直观验证每次迭代训练的效果,测试集用于测试分类模型对进行图像分类的最终效果;
S3、构建卷积神经网络模型;卷积神经网络模型的结构包括输入层、第一卷积层、第一池化层、第二卷积层、第二池化层、第一全连接层和第二全连接层;
S4、利用训练集对构建的卷积神经网络模型进行训练;
S5、利用验证集和测试集数据对训练后的卷积神经网络模型进行优化,得到优化的猪肉分类模型,优化的猪肉分类模型的结构包括:输入层、第一卷积层、第一池化层、第二卷积层、第二池化层、第三卷积层、第三池化层、第四卷积层、第四池化层、第一全连接层和第二全连接层。
一些实施例中,基于深度学习的猪肉分类模型的构建方法的步骤S1中,对原始图像进行预处理包括:
S101、对原始图像数据进行数据增强;一般地,若原始图像数据的数据量不足,可以对原始图像数据进行增强处理,增加图像样本的多样性;数据增强是通过将原始图像通过旋转,裁剪,放缩等方式,产生更多图片,减少模型过拟合和欠拟合的情况出现;一些实施例中,获取到的三类肉类图像的原始数据共有1354张,其中五花肉有696张,梅花肉有450张,肋排有208张,三种肉类的图像类别数据不够均衡,且形成数据集的数据量过少,导致数据集质量不高;为此,可以通过数据增强,扩充肉类图像数量和使得各个类别数量达到均衡。通过代码实现将图像进行随机翻转裁剪和放缩,实现数据增强,如图1所示为经过数据增强的肉类图像的部分照片;图像数据增强部分在各类数据均衡的前提下,对各类肉类图像进行数据量扩充。扩充之后数据总量为3782张,其中五花肉图像1392张,梅花肉图像1350张,肋排数量1040张,基本满足神经网络训练的数量和多样性以及均衡性要求。
S102、调整图像尺寸至设定值。通常,为了适配神经网络模型的输入,防止信息丢失和留白造成特征信息提取不完整,增强训练效果,需要对图像尺寸进行调整。一般来说都会采用固定大小的输入图像,满足网络的需求,更好地完成图像分类任务。一些实施例中,猪肉图像的大小设定为128×128dpi。
通常,通过遍历文件夹中图片的路径,程序将图像转换为RGB三通道模式的图像,将图像大小调整到128×128dpi,并将图形转换为Tensor格式,为之后神经网络模型中各种数学计算和深度学习算法的实现提供了方便,并且还可以使用GPU等硬件加速深度学习计算的速度。
一些实施例公开的基于深度学习的猪肉分类模型的构建方法,步骤S2包括:
S201、读取图像存储路径、为每个猪肉类别分配一个数字ID;一些实施例中,对五花肉、肋排肉和梅花肉三类猪肉分别分配一个数字作为其类别的ID,五花肉为0,梅花肉为1,肋排肉为2;
S202、读取所有图像的存储路径,将图像路径和其所属类别的数字ID一同写入CSV文件中并保存;
S203、定义图像数据集的类,并将图像数据集中60%的图像作为训练集,20%的图像作为验证集,20%的图像作为测试集。通常,通过定义图像数据集的类,使得神经网络模型可以在训练中读取数据,数据集从保存的CSV文件中加载图像路径和标签,并将CSV文件中60%的图像作为训练集,20%的图像作为验证集,20%的图像作为测试集;最终创建数据加载器,方便模型导入数据集。
经过数据加载器的处理,图像数据已经经过顺序打乱,以获得更好的模型训练效果。
一些实施例公开的基于深度学习的猪肉分类模型的构建方法,步骤S3中,构建了四层卷积神经网络模型,其结构如图2所示,对五花肉、肋排和梅花肉进行分类,构建的卷积神经网络模型结构具体包括:
输入层:输入大小为3×128×128的RGB图像;
第一卷积层:16个大小为3×3×3的卷积核,步长为1,输出特征图大小为16×128×128;
第一池化层:大小为2×2的最大池化,步长为2,对输出为16×128×128的特征图进行操作,输出特征图大小为16×64×64;
第二卷积层:16个大小为3×3×16的卷积核,步长为1,输出特征图大小为16×64×64;
第二池化层:大小为2×2的最大池化,步长为2,对输出为16×64×64的特征图进行操作,输出特征图大小为16×32×32;
第一全连接层:将上一层的特征图展平成大小为16×32×32的向量,再经过一个带有Dropout正则化和ReLU激活函数的全连接层,输出大小为16的向量;
第二全连接层:将上一层的输出再经过一个不带激活函数的全连接层,输出大小为3的向量;
该模型使用了Batch Normalization和Dropout正则化技术,以提高模型的泛化能力和训练效果。在输入图像经过卷积和池化操作后,通过全连接层对其进行打包分类,实现对猪肉图像的分类。
通常,卷积神经网络模型建完成之后,需要对构建的网络模型进行训练;一些实施例中,将训练数据集导入卷积神经网络模型中,训练过程中使用了Adam优化器和CrossEntryLoss损失函数,并且定义学习率为0.001。
训练程序中,还定义了能够获取最好的验证集准确率和对应的训练轮次的函数,并将准确率最高的轮次对应的模型权重保存,便于后续使用。一些实施例中,模型训练过程中使用的CrossEntryLoss损失函数是一种常用于分类问题的损失函数,尤其适用于多类别分类任务。它具有快速收敛、提供准确梯度信息等优点,可以有效地帮助神经网络模型更好地学习特征。该损失函数的数学表达式如下:
式中,M为类别的数量;yic为符号函数(0或1),即如果样本i的真实类别等于c就取1,否则取0;pic为观测样本i属于类别c的概率,c为类别的数字ID。
卷积神经网络模型经过多次迭代训练之后,已经保存的正确率最高的模型权重再经过测试集测试,就可以得出该模型大致的准确率。另外为了更加直观地表现模型的训练结果,加入了可以对输入单张图片进行分类的程序,程序中可以直观显示所输入的图像分别属于各个类别的概率,并且将概率最大的类别显示到图像中并且输出。输出结果显示,该图像属于类别“2”即肋排所对应的数字ID的概率为97.8%,则输出该张图片属于肋排,猪肉分类结果显示为图3。从该程序中能够直观地看出每张图片的分类及概率。
一些实施例公开的基于深度学习的猪肉分类模型的构建方法,步骤S5中,还包括对卷积神经网络模型的性能评价步骤,评价指标包括正确率、精度、召回率、F1分数和ROC曲线。
正确率(Accuracy)是分类模型性能评估的最基本指标,它代表了样本总体中被分到正确类别的样本所占样本数总体的比率。正确率是一个简单且直观的指标,通过考察分类模型的正确率可以快速地衡量它的整体性能。正确率的数学表达式如下所示:
式中,TP为真正例,即实际类别为正类别且被分类模型分类到正类别的样本数;TN为真负例,即实际类别为负类别且被分类模型分类到负类别的样本数;FP为假正例,即实际类别为负类别且被分类模型分类到正类别的样本数;FN为假负例,即实际类别为正类别且被分类模型分类到负类别的样本数。
为了更好更直观地观察每个训练批次的正确率变化,将正确率函数嵌入到训练函数中,得到模型每次训练中验证集的正确率变化。将模型训练两百轮,模型分类正确率的变化如图4所示:从图4中可以观察到,随着训练批次的增加,模型的正确率也在逐渐提升,但是模型的正确率在第43次训练达到最高值0.83,且最后的正确率也稳定到0.83,说明模型碰到了过拟合的情况,需要对模型进行改进。
精度(Precision)指标代表被分类模型分类到正类别的样本中,实际类别为正类别的样本数量所占总共本被分类到正类别的样本数量的比率。精度指标可以用来对分类模型在识别正样本时的准确性进行评估,可以避免在数据集类别不平衡时被其误导。因此,如果一个分类模型的精度很高,则说明他可以将负样本错判为正样本的可能性很小。但是如果只观察精度这一评估指标会忽略掉真正的正样本被分类到负类别的情况,因此同样需要与其他指标相结合来综合评估分类模型的性能。
精度指标的数学表达式如下:
最终得出五花肉、梅花肉和肋排三种类别的精确度分别为0.84,0.84,0.65。通过精确度的评估结果可以看出,三种类别中有多数正样本被分类到负样本中。因此模型需要进一步优化来提高精确度指标。
召回率(Recall)指标代表在所有实际是正类别的样本中,被分类模型正确分类到正类别的样本数所占实际上正类别总样本数的比率。召回率可以用来对分类模型对于正样本的识别能力进行评估,也就是分类模型对实际样本为正样本的识别能力。如果一个分类模型的召回率较低,则说明它将过多的正样本错判为负样本。同样的,召回率也需要结合其他指标来综合评估分类模型的性能。
召回率的数学表达式如下:
经测量,模型对三种类别的猪肉的召回率分别为0.78,0.85,0.79。从召回率的结果可以看出分类模型对于正样本的识别能力比较均衡,但是召回率不够高。
F1分数是综合考虑精度和召回率的指标,它是精度和召回率的调和平均值。F1分数是一个相对来说比较综合的指标,它将精度和召回率结合起来评估分类模型的性能。因此,如果分类模型的精度和召回率都比较高,那么它的F1分数也会比较高;反之,如果分类模型的精度和召回率都很低,那么它的F1分数也就会比较低。因此F1分数是评估分类模型在不同优化目标下的整体性能的常用指标。
F1分数的数学表达式如下:
对三种猪肉类型,模型F1分数的测量结果分别为0.80、0.85、0.72,可以看出模型的综合分类效果比较均衡,但是效果不太理想。
ROC曲线是一种常用于评估二元分类分类模型性能的指标。ROC曲线可以显示分类模型在不同阈值下的真正例率(True Positive Rate,TPR)和假正例率(False PositiveRate,FPR)之间的关系。为了评估三分类分类模型中各个类别的ROC曲线,可以将想要测试一类设为正类别,其余两类设为负类别,分别评估三次,即可获得分类模型对于三种肉类的ROC曲线情况。ROC曲线中TPR和FPR的数学表达式如下:
ROC曲线中的横轴是FPR,即实际为负类别样本,但是被错分为正类别的比率;纵轴的TPR,是实际为正类别样本,且被分到正类别的比率。对于一个完美的分类模型来说,ROC曲线会通过左上角(0,1)的点,它表示此时FPR等于0,TPR等于1。而对于一个没有训练过且完全随机猜测的分类模型来说,ROC曲线则大致是一条从左下角延伸到右上角的线,原因是该分类模型中的真阳性率和假阳性率相等。如5为ROC曲线示意图,其中,图(a)为卷积神经网络模型的ROC曲线,图(b)为完全随机的ROC曲线。图5中给出了三种类别的ROC曲线,用不同颜色表示,从(a)和(b)两张图片的对比可以看出,三种类别的卷积神经网络模型ROC曲线都在向左上角靠拢,说明模型训练的有一定效果;并且图中还给出了ROC曲线的面积(AUC,Area Under Curve),它用来表示模型性能的好坏,如果曲线面积AUC的取值范围在0.5到1的区间内,则表示分类模型大致能完成分类任务,且值越高,说明分类效果越好。
综合上述五种指标,将其整理得到以下表1所列数据:
表1卷积神经网络模型性能评价结果列表
从上表1中可以看出该模型的正确率、精度、召回率以及F1分数四项指标,结合上面展示的ROC曲线,可以对此模型的分类效果进行评估分析。
根据给出的评估结果,这个分类模型在准确度方面表现不错,整体达到了83%的准确率。而在三个类别上,1类别的精确度和召回率都比较高,F1分数也最高,说明该分类模型对于类别1的分类效果最佳,但是类别2的F1分数较低,说明该分类模型在区分类别2时有一定的困难。因此,对可以对分类模型进行调整,以保证其分类效果和泛化能力的可靠性。
一些实施例公开的基于深度学习的猪肉分类模型的构建方法,步骤S5中,根据性能评价结果优化卷积神经网络模型,具体包括调整图像的尺寸、拓展卷积神经网络模型结构。
一般地,图像的尺寸越大,其中包含的信息就越多,也就可以为分类模型提供更多的特征,但是过大的尺寸也会增加训练难度,增加模型训练的计算量,减慢训练速度,因此调整适当的输入尺寸,对于提升分类模型性能十分重要。一些实施例中,将图像的尺寸改为224×224,实践结果显示这个图像尺寸在训练效率和准确性方面都比较理想。
一般地,增加卷积层数,调整网络模块的结构和参数,能够使卷积神经网络获得更强的特征提取能力,因为每一层卷积层都能学习到更抽象和更高级的特征表示,而这些特征正是图像分类这类复杂任务最需要的;并且更深层次的神经网络可以使用更多的数据,在数据集数量足够的情况下,更深层次的网络可以学习到更多的关系,并且产生更好的结果。
一些实施例中,将两层卷积两层全连接层的卷积神经网络拓宽到四层卷积两层全连接层。
一些实施例公开的基于深度学习的猪肉分类模型的构建方法,步骤S5中,拓展的卷积神经网络模型的结构包括:
输入层:输入大小为3×224×224的RGB图像;
第一卷积层:16个大小为3×3的卷积核,步长为1,使用ReLU激活函数和BatchNormalization进行归一化处理,输出特征图大小为16×224×224;
第一池化层:大小为2×2的最大池化,步长为2,对输出为16×224×224的特征图进行操作,输出特征图大小为16×112×112;
第二卷积层:32个大小为3×3的卷积核,步长为1,使用ReLU激活函数和BatchNormalization进行归一化处理,输出特征图大小为32×112×112;
第二池化层:大小为2×2的最大池化,步长为2,对输出为32×112×112的特征图进行操作,输出特征图大小为32×56×56;
第三卷积层:64个大小为5×5的卷积核,步长为1,使用ReLU激活函数和BatchNormalization进行归一化处理,输出特征图大小为64×56×56;
第三池化层:大小为2×2的最大池化,步长为2,对输出为64×56×56的特征图进行操作,输出特征图大小为64×28×28;
第四卷积层:64个大小为5×5的卷积核,步长为1,使用ReLU激活函数和BatchNormalization进行归一化处理,输出特征图大小为64×28×28;
第四池化层:大小为2×2的最大池化,步长为2,对输出为64×28×28的特征图进行操作,输出特征图大小为64×14×14;
第一全连接层:将上一层的特征图展平成大小为64×14×14的向量,再经过一个带有Dropout正则化和ReLU激活函数的全连接层,输出大小为64的向量;和
第二全连接层:将上一层的输出再经过一个不带激活函数的全连接层,输出大小为3的向量。
对拓展后的卷积神经网络模型进行性能评价,五种指标的评价结果如表2所列数据:
表2拓展的卷积神经网络模型性能评价结果列表
图6为拓展的卷积神经网络模型的ROC曲线图,图6中三类猪肉的曲线合二为一。表2和图6的结果表明,优化后的卷积神经网络对于三种肉类的分类效果十分理想。该分类模型的平均精度、召回率和F1分数均为0.99,说明该分类模型在三个类别上都有很好的分类效果。而且各个类别的精度、召回率和F1值也都很高,表明该分类模型对于不同类别的识别能力比较均衡。同时,宏平均的精度、召回率和F1值也都为0.99,说明该分类模型对于不同类别的权重处理得比较合理。相较于优化之前的浅层卷积神经网络模型,优化后的深层网络明显对猪肉图像的特征提取更加精确,对猪肉图像的分类更准确。
一些实施例公开了基于深度学习的猪肉分类模型,由基于深度学习的猪肉分类模型的构建方法所得,猪肉分类模型为卷积神经网络模型,结构包括:
输入层:输入大小为3×224×224的RGB图像;
第一卷积层:16个大小为3×3的卷积核,步长为1,使用ReLU激活函数和BatchNormalization进行归一化处理,输出特征图大小为16×224×224;
第一池化层:大小为2×2的最大池化,步长为2,对输出为16×224×224的特征图进行操作,输出特征图大小为16×112×112;
第二卷积层:32个大小为3×3的卷积核,步长为1,使用ReLU激活函数和BatchNormalization进行归一化处理,输出特征图大小为32×112×112;
第二池化层:大小为2×2的最大池化,步长为2,对输出为32×112×112的特征图进行操作,输出特征图大小为32×56×56;
第三卷积层:64个大小为5×5的卷积核,步长为1,使用ReLU激活函数和BatchNormalization进行归一化处理,输出特征图大小为64×56×56;
第三池化层:大小为2×2的最大池化,步长为2,对输出为64×56×56的特征图进行操作,输出特征图大小为64×28×28;
第四卷积层:64个大小为5×5的卷积核,步长为1,使用ReLU激活函数和BatchNormalization进行归一化处理,输出特征图大小为64×28×28;
第四池化层:大小为2×2的最大池化,步长为2,对输出为64×28×28的特征图进行操作,输出特征图大小为64×14×14;
第一全连接层:将上一层的特征图展平成大小为64×14×14的向量,再经过一个带有Dropout正则化和ReLU激活函数的全连接层,输出大小为64的向量;和
第二全连接层:将上一层的输出再经过一个不带激活函数的全连接层,输出大小为3的向量。
一些实施例中公开的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。
一些实施例公开的基于深度学习的猪肉分类模型的构建过程可以被实现为计算机软件程序。例如,一些实施公开了一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。
一些实施例公开的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是、但不限于:电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
本发明实施例公开的基于深度学习的猪肉分类模型的构建方法得到了对猪肉进行分类的卷积神经网络模型,能够对猪肉进行精确分类,例如能够对五花肉、梅花肉和肋排进行精确分类,提高了猪肉分类精确度、分类效率,能够大幅减少人工判断的时间和误判的可能性,提高了猪肉生产、销售、管理效率。
本发明实施例公开的技术方案和实施例中公开的技术细节,仅是示例性说明本发明的发明构思,并不构成对本发明实施例技术方案的限定,凡是对本发明实施例公开的技术细节所做的常规改变、替换或组合等,都与本发明具有相同的发明构思,都在本发明权利要求的保护范围之内。
Claims (10)
1.基于深度学习的猪肉分类模型的构建方法,其特征在于,包括步骤:
S1、获取猪肉原始图像,并对原始图像进行预处理;
S2、将预处理后的猪肉图像数据分为训练集、验证集和测试集;
S3、构建卷积神经网络模型;所述卷积神经网络模型的结构包括输入层、第一卷积层、第一池化层、第二卷积层、第二池化层、第一全连接层和第二全连接层;
S4、利用训练集对构建的卷积神经网络模型进行训练;
S5、利用验证集和测试集数据对训练后的卷积神经网络模型进行优化,得到优化的猪肉分类模型,优化的猪肉分类模型的结构包括:输入层、第一卷积层、第一池化层、第二卷积层、第二池化层、第三卷积层、第三池化层、第四卷积层、第四池化层、第一全连接层和第二全连接层。
2.根据权利要求1所述的基于深度学习的猪肉分类模型的构建方法,其特征在于,步骤S1中,对原始图像进行预处理包括:
S101、对原始图像数据进行数据增强;
S102、调整图像尺寸至设定值。
3.根据权利要求1所述的基于深度学习的猪肉分类模型的构建方法,其特征在于,步骤S2包括:
S201、读取图像存储路径、为每个猪肉类别分配一个数字ID;
S202、读取所有图像的存储路径,将图像路径和其所属类别的数字ID一同写入CSV文件中并保存;
S203、定义图像数据集的类,并将图像数据集中60%的图像作为训练集,20%的图像作为验证集,20%的图像作为测试集。
4.根据权利要求1所述的基于深度学习的猪肉分类模型的构建方法,其特征在于,步骤S3中,所述卷积神经网络模型结构包括:
输入层:输入大小为3×128×128的RGB图像;
第一卷积层:16个大小为3×3×3的卷积核,步长为1,输出特征图大小为16×128×128;
第一池化层:大小为2×2的最大池化,步长为2,对输出为16×128×128的特征图进行操作,输出特征图大小为16×64×64;
第二卷积层:16个大小为3×3×16的卷积核,步长为1,输出特征图大小为16×64×64;
第二池化层:大小为2×2的最大池化,步长为2,对输出为16×64×64的特征图进行操作,输出特征图大小为16×32×32;
第一全连接层:将上一层的特征图展平成大小为16×32×32的向量,再经过一个带有Dropout正则化和ReLU激活函数的全连接层,输出大小为16的向量;
第二全连接层:将上一层的输出再经过一个不带激活函数的全连接层,输出大小为3的向量。
5.根据权利要求1所述的基于深度学习的猪肉分类模型的构建方法,其特征在于,步骤S5中,还包括对卷积神经网络模型的性能评价步骤,评价指标包括正确率、精度、召回率、F1分数和ROC曲线。
6.根据权利要求5所述的基于深度学习的猪肉分类模型的构建方法,其特征在于,步骤S5中,根据性能评价结果优化卷积神经网络模型,具体包括调整图像的尺寸、拓展卷积神经网络模型结构。
7.根据权利要求5所述的基于深度学习的猪肉分类模型的构建方法,其特征在于,步骤S5中,拓展的卷积神经网络模型的结构包括:
输入层:输入大小为3×224×224的RGB图像;
第一卷积层:16个大小为3×3的卷积核,步长为1,使用ReLU激活函数和BatchNormalization进行归一化处理,输出特征图大小为16×224×224;
第一池化层:大小为2×2的最大池化,步长为2,对输出为16×224×224的特征图进行操作,输出特征图大小为16×112×112;
第二卷积层:32个大小为3×3的卷积核,步长为1,使用ReLU激活函数和BatchNormalization进行归一化处理,输出特征图大小为32×112×112;
第二池化层:大小为2×2的最大池化,步长为2,对输出为32×112×112的特征图进行操作,输出特征图大小为32×56×56;
第三卷积层:64个大小为5×5的卷积核,步长为1,使用ReLU激活函数和BatchNormalization进行归一化处理,输出特征图大小为64×56×56;
第三池化层:大小为2×2的最大池化,步长为2,对输出为64×56×56的特征图进行操作,输出特征图大小为64×28×28;
第四卷积层:64个大小为5×5的卷积核,步长为1,使用ReLU激活函数和BatchNormalization进行归一化处理,输出特征图大小为64×28×28;
第四池化层:大小为2×2的最大池化,步长为2,对输出为64×28×28的特征图进行操作,输出特征图大小为64×14×14;
第一全连接层:将上一层的特征图展平成大小为64×14×14的向量,再经过一个带有Dropout正则化和ReLU激活函数的全连接层,输出大小为64的向量;和
第二全连接层:将上一层的输出再经过一个不带激活函数的全连接层,输出大小为3的向量。
8.基于深度学习的猪肉分类模型,其特征在于,由权利要求1-7任一项所述的构建方法所得,所述猪肉分类模型为卷积神经网络模型,结构包括:
输入层:输入大小为3×224×224的RGB图像;
第一卷积层:16个大小为3×3的卷积核,步长为1,使用ReLU激活函数和BatchNormalization进行归一化处理,输出特征图大小为16×224×224;
第一池化层:大小为2×2的最大池化,步长为2,对输出为16×224×224的特征图进行操作,输出特征图大小为16×112×112;
第二卷积层:32个大小为3×3的卷积核,步长为1,使用ReLU激活函数和BatchNormalization进行归一化处理,输出特征图大小为32×112×112;
第二池化层:大小为2×2的最大池化,步长为2,对输出为32×112×112的特征图进行操作,输出特征图大小为32×56×56;
第三卷积层:64个大小为5×5的卷积核,步长为1,使用ReLU激活函数和BatchNormalization进行归一化处理,输出特征图大小为64×56×56;
第三池化层:大小为2×2的最大池化,步长为2,对输出为64×56×56的特征图进行操作,输出特征图大小为64×28×28;
第四卷积层:64个大小为5×5的卷积核,步长为1,使用ReLU激活函数和BatchNormalization进行归一化处理,输出特征图大小为64×28×28;
第四池化层:大小为2×2的最大池化,步长为2,对输出为64×28×28的特征图进行操作,输出特征图大小为64×14×14;
第一全连接层:将上一层的特征图展平成大小为64×14×14的向量,再经过一个带有Dropout正则化和ReLU激活函数的全连接层,输出大小为64的向量;和
第二全连接层:将上一层的输出再经过一个不带激活函数的全连接层,输出大小为3的向量。
9.计算机可读介质,其特征在于,所述计算机可读介质上储存有计算机程序,所述计算机程序被处理器执行时,实现权利要求1~7任一项所述的方法。
10.电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1~7中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311153185.5A CN117197559A (zh) | 2023-09-06 | 2023-09-06 | 基于深度学习的猪肉分类模型、构建方法、电子设备和计算机可读介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311153185.5A CN117197559A (zh) | 2023-09-06 | 2023-09-06 | 基于深度学习的猪肉分类模型、构建方法、电子设备和计算机可读介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117197559A true CN117197559A (zh) | 2023-12-08 |
Family
ID=88999343
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311153185.5A Pending CN117197559A (zh) | 2023-09-06 | 2023-09-06 | 基于深度学习的猪肉分类模型、构建方法、电子设备和计算机可读介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117197559A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117593610A (zh) * | 2024-01-17 | 2024-02-23 | 上海秋葵扩视仪器有限公司 | 图像识别网络训练及部署、识别方法、装置、设备及介质 |
CN117934962A (zh) * | 2024-02-06 | 2024-04-26 | 青岛兴牧畜牧科技发展有限公司 | 一种基于参照色卡图像校正的猪肉质量分类方法 |
-
2023
- 2023-09-06 CN CN202311153185.5A patent/CN117197559A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117593610A (zh) * | 2024-01-17 | 2024-02-23 | 上海秋葵扩视仪器有限公司 | 图像识别网络训练及部署、识别方法、装置、设备及介质 |
CN117593610B (zh) * | 2024-01-17 | 2024-04-26 | 上海秋葵扩视仪器有限公司 | 图像识别网络训练及部署、识别方法、装置、设备及介质 |
CN117934962A (zh) * | 2024-02-06 | 2024-04-26 | 青岛兴牧畜牧科技发展有限公司 | 一种基于参照色卡图像校正的猪肉质量分类方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2020522077A (ja) | 画像特徴の取得 | |
CN111915437B (zh) | 基于rnn的反洗钱模型的训练方法、装置、设备及介质 | |
CN111950528B (zh) | 图表识别模型训练方法以及装置 | |
CN112257808B (zh) | 用于零样本分类的集成协同训练方法、装置及终端设备 | |
CN114283350B (zh) | 视觉模型训练和视频处理方法、装置、设备及存储介质 | |
US11809519B2 (en) | Semantic input sampling for explanation (SISE) of convolutional neural networks | |
CN117197559A (zh) | 基于深度学习的猪肉分类模型、构建方法、电子设备和计算机可读介质 | |
CN113239914B (zh) | 课堂学生表情识别及课堂状态评估方法、装置 | |
CN112990318A (zh) | 持续学习方法、装置、终端及存储介质 | |
CN115204301A (zh) | 视频文本匹配模型训练、视频文本匹配方法和装置 | |
CN115545103A (zh) | 异常数据识别、标签识别方法和异常数据识别装置 | |
Conti et al. | Mitigating gender bias in face recognition using the von mises-fisher mixture model | |
Joshi | Python machine learning cookbook | |
Bach et al. | Analyzing classifiers: Fisher vectors and deep neural networks | |
CN116310850B (zh) | 基于改进型RetinaNet的遥感图像目标检测方法 | |
CN116206227B (zh) | 5g富媒体信息的图片审查***、方法、电子设备及介质 | |
CN110929285B (zh) | 一种隐私数据的处理方法及装置 | |
CN113570512A (zh) | 一种图像数据处理方法、计算机及可读存储介质 | |
CN110879821A (zh) | 评分卡模型衍生标签生成方法、装置、设备及存储介质 | |
US20230368003A1 (en) | Adaptive sparse attention pattern | |
CN115587884A (zh) | 一种基于改进的极限学习机的用户贷款违约预测方法 | |
CN112463964B (zh) | 文本分类及模型训练方法、装置、设备及存储介质 | |
CN115769194A (zh) | 跨数据集的自动数据链接 | |
CN112883188A (zh) | 一种情感分类方法、装置、电子设备和存储介质 | |
CN112037174A (zh) | 染色体异常检测方法、装置、设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |