CN113221853A

CN113221853A - 一种基于Yolov4的养鸡场饲养鸡识别算法

Info

Publication number: CN113221853A
Application number: CN202110645579.7A
Authority: CN
Inventors: 刘冰; 刘陆洋; 范小浪; 王红梅; 党源源; 张丽杰
Original assignee: Changchun University of Technology
Current assignee: Changchun University of Technology
Priority date: 2021-06-10
Filing date: 2021-06-10
Publication date: 2021-08-06

Abstract

本发明公开了基于Yolov4模型的养鸡场饲养鸡的识别算法，该算法包括采集饲养鸡的图像，并在图像中标注出饲养鸡的位置信息和类别信息；根据采集并标注的饲养鸡图像构建饲养鸡数据集，并划分为训练集和测试集；将训练集图像输入到Yolov4模型进行训练；将测试集图像输入训练后的Yolov4网络模型，输出检测结果。以此方式可以很好的实现养鸡场内饲养鸡的自动检测和识别。依据深度卷积强大的特征提取能力，能充分提取到饲养鸡的特征，可以在鸡群高密集型的情况下，能够保持较好的准确率。

Description

一种基于Yolov4的养鸡场饲养鸡识别算法

技术领域

本发明属于目标检测领域，涉及一种基于Yolov4的养鸡场饲养鸡的识别方法。

背景技术

在现代社会发展下，养鸡场在不扩大养殖场地的同时为了能获取更多的利润，往往会在有限的空间里饲养更多的鸡，这就造成了养鸡场的密集程度大幅提高，在饲养鸡数量较大时，人工查验鸡的数量费时费力，如果出现漏检误检，对后续鸡场的饲养、贩卖会造成一定的影响。随着基于深度学习的目标检测算法的快速发展，越来越多的目标检测模型被提出，深度学习下的目标检测算法可以通过卷积神经网络对输入的图像直接进行特征提取，并通过深度神经网络模型的学习直接回归输出结果，实现了端到端的目标检测，Yolov4就是一种端到端的检测模型，Yolov4模型有多尺度的检测先验框，可以对大中小三种类型的目标进行检测，可以很好的满足养鸡场内高密集型目标的检测。

发明内容

针对养鸡场高密集型场景对目标的识别检测，本发明的目的是提供一种能够满足养鸡场内对饲养鸡识别的算法。

本发明提供了一种基于Yolov4养鸡场饲养鸡识别的算法，所述方法步骤如下：

步骤S1：采集养鸡场饲养鸡的图像，并在图像中标注出饲养鸡的位置信息和类别信息；

步骤S2：根据采集并标注的饲养鸡图像构建饲养鸡数据集，数据集格式参照VOCdevkit，并将数据集划分为训练集和测试集；

步骤S3：将训练集图像输入到Yolov4模型进行训练，得到训练后的网络模型；

步骤S4：将测试集图像输入训练后的Yolov4网络模型，输出检测结果，与真实标注信息进行误差计算。

附图说明

图1为本发明算法流程图。

图2 为鸡场数据集图像。

图3为模型测试结果图。

图4至图8为本模型的实验结果，分别为准确率图、召回率图、AP图、F1图、MAP图。

具体实施方式

以下实施例用于说明本发明，但不用来限制本发明的范围。现通过附图和实施例对本发明作进一步的详细描述。

图1为本发明实施例提供算法流程示意图。如图1所示，本实施例主要包含以下步骤：

步骤1：采集养鸡场饲养鸡的图像，并标注图像中饲养鸡的位置信息和类别信息；

步骤2：作为本发明的一种实施例，在养鸡场真实环境下，使用相机采集饲养鸡在养鸡场环境下的真实状态，所述图像的尺寸大小为4096 × 3072，这些图像包含了养鸡场内饲养鸡的各种状态，如图2；

步骤3：对数据集中的图像标注出了鸡的位置信息和类别信息，将这些位置信息和类别信息保存记录，为后续模型的训练做准备；

步骤4：根据采集的并标注的图像构建饲养鸡数据集，将该数据集划分为训练集和测试集。划分比例为9:1；

步骤5：准备模型训练所需要的txt文件和xml注释文件；

train.txt文件是训练集图像的索引文件,test.txt是测试集文件的索引文件，模型在进行训练和测试的时候会根据该文件找到相应的图像；xml文件是图像的注释文件，其蕴含了图像里目标的位置信息和类别信息；

步骤6：加载预训练模型权重；

本实例采用的是coco数据集的预训练权重，加载预训练权重可以加快模型的训练速度，同时能提升一定的精度；

步骤7：将训练集图像输入到Yolov4模型进行训练，得到训练后的Yolov4模型；

输入网络的图像的尺寸大小为 416×416 ，批大小为8，初始学习率为0.001，采用余弦退火衰减，训练轮次为100，

步骤8：将测试集输入到训练后的Yolov4模型，得到模型的预测结果，跟测试集图像的真实结果对比计算误差；

在本实例中，测试图像输入到训练后的Yolov4网络中，进行饲养鸡的识别，每张图像都会生成10647个预测框，每一个边界框包含6个值，分别是预测框的中心坐标x，y和宽高w，h，以及置信度c和类别概率C，首先根据置信度的值，会过滤掉一些低于置信度的预测框，在本模型中置信度阈值为0.5，对保留下来的预测框进行DIOU-NMS筛选,DIOU-NMS定义如下：

其中

为分类置信度，

为预测框，M为置信度最高的框，

为NMS阈值，当

与M的DIOU小于

，可以保留，否则就被抑制掉，在本模型中

的值取为0.5，经过两次的筛选，保留下来的框就作为最终的预测结果；

模型得到测试集的预测结果会与真实的结果进行误差计算，同时将误差结果反向传播，优化模型参数，以达到更好的效果；

步骤9：多次实验记录结果。

以上实施例仅用于说明本发明而非对其进行限制，有关领域的普通技术人员，在不脱离本发明的精神和范围的情况下，还可以做出各种变化和变型，因此所有等同的技术方案也属于本发明的范畴，本发明的专利保护范围应由权利要求限定。

例1　本发明在真实养鸡场饲养鸡数据集的实验结果

饲养鸡数据集记录了长春某养鸡场内在不同时间下的鸡的照片。

例1将本发明方法应用到饲养鸡数据集上进行测试验证，并选用AP(AveragePrecision)和MAP(Mean Average Precision)指标评价，绘制P-R曲线，需要计算Precision和Recall，其计算方式如下：

其中TP为将正确类预测为正确类的个数;TN为正确识别不属于该类的样本总数;FP为误分类到该类的样本总数;FN属于此类但被划分到其他类的样本总数。

依据置信度分数的阈值，计算对应的Precision和Recall，绘制P-R曲线，AP就是P-R曲线下的面积，AP值越高，说明网络的性能越好，MAP是多目标的AP的平均值，该指标是目标检测算法的最重要指标。

模型的实验结果如图4至图8，本次实验单目标识别，数据集属于小规模数据集，并且目标环境复杂，密集型高，识别难度高，在本发明方法中MAP达到了70%，可以满足基本的识别需求，后续加大数据集规模和对模型进行改进之后，预测可以满足养鸡场对饲养鸡的识别需求。

Claims

1.基于Yolov4模型的养鸡场饲养鸡的识别算法，其特征在于，包括如下步骤：

步骤S2：根据采集并标注的饲养鸡图像构建饲养鸡数据集，数据集格式参照VOCdevkit，并将数据集划分为训练集和测试集，其划分比例为9:1；

2.根据权利要求1所述的方法，其特征在于：所述的Yolov4模型包括：

BackBone主干网络（特征提取模块），用于将输入的图像大小经过特征提取后调整为

的特征图，并输入到下一模块；

Neck特征增强模块，将主干网络输出的特征图使用SPP和PAN进行特征增强和特征融合，输出尺度不同的张量；

Prediction模块，用于对所述特征增强模块输出的张量进行解码，预测边界框和类别，得出每个边界框的输出结果。

3.根据权利要求2所述的方法，其特征在于：

所述的BackBone是CSPNet和Residualblock的结合，图像每经过特征提取后会进行相应的残差堆叠，此操作能够保持特征信息，防止梯度消失。

4.根据权利要求2所述的方法，其特征在于：所述对所述特征增强模块输出的张量进行解码，包括：

在本模型中经过Neck模块输出三组尺度不同的张量，分别作用于大小不同的目标，输出的三组张量表示为

;

;

,其中

,其中B表示每个尺度的特征图的每个网格预测的边界框的数量，b表示所述边界框的中心坐标和宽高，c表示边界框的置信度，C表示类预测，即预测的边界框中包含的目标是某一类目标的概率。

5.根据权利要求4所述的方法，其特征在于：

所述预测的边界框中心位置及宽高共同调整；其中预测的边界框的中心位置表示为

;

为边界框的中心位置横坐标；

为边界框的中心位置纵坐标；

为sigmoid函数；

为先验框中心的调整参数，

为网格相对于特征图左上角的偏移量；

预测的边界框的宽和高分别表示为：

其中，

为预测的边界框的宽；

为预测的边界框的高；

为先验框的宽；

为先验框的高；

为先验框的调整参数；

为先验框的调整参数。

6.根据权利要求4所述的方法，其特征在于：

所述得出的每个边界框的输出结果包括：每个边界框对应不同类别的置信度分数进行非极大值抑制，得到目标的坐标信息和类别信息，作为边界框的预测输出结果。

7.根据权利要求1所述的方法，其特征在于：

所述Yolov4网络模型的损失函数包括：类别损失、坐标损失、置信度损失，即Yolov4的损失函数可以表示为：

其中

表示为回归框损失，

表示为置信度损失，

表示为分类损失；

所述

损失为：

其中

，IOU为真实的边界框

和预测的边界框

的交并比，

,

,

表示真实框的中心坐标，

表示真实框的宽和高，

表示预测框的宽和高，

,

分别表示预测框和真实框的中心点，

表示欧式距离，

表示能够同时包含真实框和预测框的最小矩形的对角线长度；

为权衡参数，

，

是用于度量长宽比一致性的参数，

；

表示网格数量；

表示每个网格预测的边界框的数量；

为权重;

所述置信度损失

为：

其中，

表示如果第i个网格第j个预测框没有目标，其值为1，否则为0；

表示为网络预测出第i个网格的置信度；

表示第i个网格实际第置信度；

为权重；

所述类别损失

为：

其中

表示如果第i个网格中第j个预测框包含目标，其值为1，否则为0；

表示第i个网格网络预测是某一类第概率；

表示第i个网格实际属于某一类第概率。