CN113221853A - 一种基于Yolov4的养鸡场饲养鸡识别算法 - Google Patents

一种基于Yolov4的养鸡场饲养鸡识别算法 Download PDF

Info

Publication number
CN113221853A
CN113221853A CN202110645579.7A CN202110645579A CN113221853A CN 113221853 A CN113221853 A CN 113221853A CN 202110645579 A CN202110645579 A CN 202110645579A CN 113221853 A CN113221853 A CN 113221853A
Authority
CN
China
Prior art keywords
bounding box
box
prediction
representing
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202110645579.7A
Other languages
English (en)
Inventor
刘冰
刘陆洋
范小浪
王红梅
党源源
张丽杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changchun University of Technology
Original Assignee
Changchun University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changchun University of Technology filed Critical Changchun University of Technology
Priority to CN202110645579.7A priority Critical patent/CN113221853A/zh
Publication of CN113221853A publication Critical patent/CN113221853A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/20Scenes; Scene-specific elements in augmented reality scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了基于Yolov4模型的养鸡场饲养鸡的识别算法,该算法包括采集饲养鸡的图像,并在图像中标注出饲养鸡的位置信息和类别信息;根据采集并标注的饲养鸡图像构建饲养鸡数据集,并划分为训练集和测试集;将训练集图像输入到Yolov4模型进行训练;将测试集图像输入训练后的Yolov4网络模型,输出检测结果。以此方式可以很好的实现养鸡场内饲养鸡的自动检测和识别。依据深度卷积强大的特征提取能力,能充分提取到饲养鸡的特征,可以在鸡群高密集型的情况下,能够保持较好的准确率。

Description

一种基于Yolov4的养鸡场饲养鸡识别算法
技术领域
本发明属于目标检测领域,涉及一种基于Yolov4的养鸡场饲养鸡的识别方法。
背景技术
在现代社会发展下,养鸡场在不扩大养殖场地的同时为了能获取更多的利润,往往会在有限的空间里饲养更多的鸡,这就造成了养鸡场的密集程度大幅提高,在饲养鸡数量较大时,人工查验鸡的数量费时费力,如果出现漏检误检,对后续鸡场的饲养、贩卖会造成一定的影响。随着基于深度学习的目标检测算法的快速发展,越来越多的目标检测模型被提出,深度学习下的目标检测算法可以通过卷积神经网络对输入的图像直接进行特征提取,并通过深度神经网络模型的学习直接回归输出结果,实现了端到端的目标检测,Yolov4就是一种端到端的检测模型,Yolov4模型有多尺度的检测先验框,可以对大中小三种类型的目标进行检测,可以很好的满足养鸡场内高密集型目标的检测。
发明内容
针对养鸡场高密集型场景对目标的识别检测,本发明的目的是提供一种能够满足养鸡场内对饲养鸡识别的算法。
本发明提供了一种基于Yolov4养鸡场饲养鸡识别的算法,所述方法步骤如下:
步骤S1:采集养鸡场饲养鸡的图像,并在图像中标注出饲养鸡的位置信息和类别信息;
步骤S2:根据采集并标注的饲养鸡图像构建饲养鸡数据集,数据集格式参照VOCdevkit,并将数据集划分为训练集和测试集;
步骤S3:将训练集图像输入到Yolov4模型进行训练,得到训练后的网络模型;
步骤S4:将测试集图像输入训练后的Yolov4网络模型,输出检测结果,与真实标注信息进行误差计算。
附图说明
图1为本发明算法流程图。
图2 为鸡场数据集图像。
图3为模型测试结果图。
图4至图8为本模型的实验结果,分别为准确率图、召回率图、AP图、F1图、MAP图。
具体实施方式
以下实施例用于说明本发明,但不用来限制本发明的范围。现通过附图和实施例对本发明作进一步的详细描述。
图1为本发明实施例提供算法流程示意图。如图1所示,本实施例主要包含以下步骤:
步骤1:采集养鸡场饲养鸡的图像,并标注图像中饲养鸡的位置信息和类别信息;
步骤2:作为本发明的一种实施例,在养鸡场真实环境下,使用相机采集饲养鸡在养鸡场环境下的真实状态,所述图像的尺寸大小为4096 × 3072,这些图像包含了养鸡场内饲养鸡的各种状态,如图2;
步骤3:对数据集中的图像标注出了鸡的位置信息和类别信息,将这些位置信息和类别信息保存记录,为后续模型的训练做准备;
步骤4:根据采集的并标注的图像构建饲养鸡数据集,将该数据集划分为训练集和测试集。划分比例为9:1;
步骤5:准备模型训练所需要的txt文件和xml注释文件;
train.txt文件是训练集图像的索引文件,test.txt是测试集文件的索引文件,模型在进行训练和测试的时候会根据该文件找到相应的图像;xml文件是图像的注释文件,其蕴含了图像里目标的位置信息和类别信息;
步骤6:加载预训练模型权重;
本实例采用的是coco数据集的预训练权重,加载预训练权重可以加快模型的训练速度,同时能提升一定的精度;
步骤7:将训练集图像输入到Yolov4模型进行训练,得到训练后的Yolov4模型;
输入网络的图像的尺寸大小为 416×416 ,批大小为8,初始学习率为0.001,采用余弦退火衰减,训练轮次为100,
步骤8:将测试集输入到训练后的Yolov4模型,得到模型的预测结果,跟测试集图像的真实结果对比计算误差;
在本实例中,测试图像输入到训练后的Yolov4网络中,进行饲养鸡的识别,每张图像都会生成10647个预测框,每一个边界框包含6个值,分别是预测框的中心坐标x,y和宽高w,h,以及置信度c和类别概率C,首先根据置信度的值,会过滤掉一些低于置信度的预测框,在本模型中置信度阈值为0.5,对保留下来的预测框进行DIOU-NMS筛选,DIOU-NMS定义如下:
Figure RE-870556DEST_PATH_IMAGE001
其中
Figure RE-813104DEST_PATH_IMAGE002
为分类置信度,
Figure RE-313355DEST_PATH_IMAGE003
为预测框,M为置信度最高的框,
Figure RE-733972DEST_PATH_IMAGE004
为NMS阈值,当
Figure RE-206542DEST_PATH_IMAGE003
与M的DIOU小于
Figure RE-133041DEST_PATH_IMAGE004
,可以保留,否则就被抑制掉,在本模型中
Figure RE-58271DEST_PATH_IMAGE004
的值取为0.5,经过两次的筛选,保留下来的框就作为最终的预测结果;
模型得到测试集的预测结果会与真实的结果进行误差计算,同时将误差结果反向传播,优化模型参数,以达到更好的效果;
步骤9:多次实验记录结果。
以上实施例仅用于说明本发明而非对其进行限制,有关领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。
例1 本发明在真实养鸡场饲养鸡数据集的实验结果
饲养鸡数据集记录了长春某养鸡场内在不同时间下的鸡的照片。
例1将本发明方法应用到饲养鸡数据集上进行测试验证,并选用AP(AveragePrecision)和MAP(Mean Average Precision)指标评价,绘制P-R曲线,需要计算Precision和Recall,其计算方式如下:
Figure RE-344896DEST_PATH_IMAGE005
Figure RE-406393DEST_PATH_IMAGE006
其中TP为将正确类预测为正确类的个数;TN为正确识别不属于该类的样本总数;FP为误分类到该类的样本总数;FN属于此类但被划分到其他类的样本总数。
依据置信度分数的阈值,计算对应的Precision和Recall,绘制P-R曲线,AP就是P-R曲线下的面积,AP值越高,说明网络的性能越好,MAP是多目标的AP的平均值,该指标是目标检测算法的最重要指标。
模型的实验结果如图4至图8,本次实验单目标识别,数据集属于小规模数据集,并且目标环境复杂,密集型高,识别难度高,在本发明方法中MAP达到了70%,可以满足基本的识别需求,后续加大数据集规模和对模型进行改进之后,预测可以满足养鸡场对饲养鸡的识别需求。

Claims (7)

1.基于Yolov4模型的养鸡场饲养鸡的识别算法,其特征在于,包括如下步骤:
步骤S1:采集养鸡场饲养鸡的图像,并在图像中标注出饲养鸡的位置信息和类别信息;
步骤S2:根据采集并标注的饲养鸡图像构建饲养鸡数据集,数据集格式参照VOCdevkit,并将数据集划分为训练集和测试集,其划分比例为9:1;
步骤S3:将训练集图像输入到Yolov4模型进行训练,得到训练后的网络模型;
步骤S4:将测试集图像输入训练后的Yolov4网络模型,输出检测结果,与真实标注信息进行误差计算。
2.根据权利要求1所述的方法,其特征在于:所述的Yolov4模型包括:
BackBone主干网络(特征提取模块),用于将输入的图像大小经过特征提取后调整为
Figure RE-948648DEST_PATH_IMAGE001
的特征图,并输入到下一模块;
Neck特征增强模块,将主干网络输出的特征图使用SPP和PAN进行特征增强和特征融合,输出尺度不同的张量;
Prediction模块,用于对所述特征增强模块输出的张量进行解码,预测边界框和类别,得出每个边界框的输出结果。
3.根据权利要求2所述的方法,其特征在于:
所述的BackBone是CSPNet和Residualblock的结合,图像每经过特征提取后会进行相应的残差堆叠,此操作能够保持特征信息,防止梯度消失。
4.根据权利要求2所述的方法,其特征在于:所述对所述特征增强模块输出的张量进行解码,包括:
在本模型中经过Neck模块输出三组尺度不同的张量,分别作用于大小不同的目标,输出的三组张量表示为
Figure RE-361175DEST_PATH_IMAGE002
;
Figure RE-199293DEST_PATH_IMAGE003
;
Figure RE-380876DEST_PATH_IMAGE003
,其中
Figure RE-570549DEST_PATH_IMAGE004
,其中B表示每个尺度的特征图的每个网格预测的边界框的数量,b表示所述边界框的中心坐标和宽高,c表示边界框的置信度,C表示类预测即预测的边界框中包含的目标是某一类目标的概率。
5.根据权利要求4所述的方法,其特征在于:
所述预测的边界框中心位置及宽高共同调整;其中预测的边界框的中心位置表示为
Figure RE-532689DEST_PATH_IMAGE005
;
Figure RE-98799DEST_PATH_IMAGE006
Figure RE-213517DEST_PATH_IMAGE007
Figure RE-574091DEST_PATH_IMAGE008
为边界框的中心位置横坐标;
Figure RE-961210DEST_PATH_IMAGE009
为边界框的中心位置纵坐标;
Figure RE-393328DEST_PATH_IMAGE010
为sigmoid函数;
Figure RE-283924DEST_PATH_IMAGE011
为先验框中心的调整参数,
Figure RE-80979DEST_PATH_IMAGE012
为网格相对于特征图左上角的偏移量;
预测的边界框的宽和高分别表示为:
Figure RE-502864DEST_PATH_IMAGE013
Figure RE-676356DEST_PATH_IMAGE014
其中,
Figure RE-687038DEST_PATH_IMAGE015
为预测的边界框的宽;
Figure RE-530360DEST_PATH_IMAGE016
为预测的边界框的高;
Figure RE-626492DEST_PATH_IMAGE017
为先验框的宽;
Figure RE-338096DEST_PATH_IMAGE016
为先验框的高;
Figure RE-265601DEST_PATH_IMAGE018
为先验框的调整参数;
Figure RE-404458DEST_PATH_IMAGE019
为先验框的调整参数。
6.根据权利要求4所述的方法,其特征在于:
所述得出的每个边界框的输出结果包括:每个边界框对应不同类别的置信度分数进行非极大值抑制,得到目标的坐标信息和类别信息,作为边界框的预测输出结果。
7.根据权利要求1所述的方法,其特征在于:
所述Yolov4网络模型的损失函数包括:类别损失、坐标损失、置信度损失,即Yolov4的损失函数可以表示为:
Figure RE-987886DEST_PATH_IMAGE020
其中
Figure RE-503181DEST_PATH_IMAGE021
表示为回归框损失,
Figure RE-488455DEST_PATH_IMAGE022
表示为置信度损失,
Figure RE-798213DEST_PATH_IMAGE023
表示为分类损失;
所述
Figure RE-469935DEST_PATH_IMAGE024
损失为:
Figure RE-523342DEST_PATH_IMAGE025
其中
Figure RE-363122DEST_PATH_IMAGE026
,IOU为真实的边界框
Figure RE-656831DEST_PATH_IMAGE027
和预测的边界框
Figure RE-949272DEST_PATH_IMAGE028
的交并比,
Figure RE-868687DEST_PATH_IMAGE029
,
Figure RE-562973DEST_PATH_IMAGE030
,
Figure RE-214534DEST_PATH_IMAGE031
表示真实框的中心坐标,
Figure RE-72900DEST_PATH_IMAGE032
表示真实框的宽和高,
Figure RE-468109DEST_PATH_IMAGE033
表示预测框的宽和高,
Figure RE-16902DEST_PATH_IMAGE034
,
Figure RE-370523DEST_PATH_IMAGE035
分别表示预测框和真实框的中心点,
Figure RE-637557DEST_PATH_IMAGE036
表示欧式距离,
Figure RE-836457DEST_PATH_IMAGE037
表示能够同时包含真实框和预测框的最小矩形的对角线长度;
Figure RE-849543DEST_PATH_IMAGE038
为权衡参数,
Figure RE-108486DEST_PATH_IMAGE039
Figure RE-925133DEST_PATH_IMAGE040
是用于度量长宽比一致性的参数,
Figure RE-662144DEST_PATH_IMAGE041
Figure RE-185530DEST_PATH_IMAGE042
表示网格数量;
Figure RE-880953DEST_PATH_IMAGE043
表示每个网格预测的边界框的数量;
Figure RE-856999DEST_PATH_IMAGE044
为权重;
所述置信度损失
Figure RE-397702DEST_PATH_IMAGE022
为:
Figure RE-648030DEST_PATH_IMAGE045
其中,
Figure RE-983197DEST_PATH_IMAGE046
表示如果第i个网格第j个预测框没有目标,其值为1,否则为0;
Figure RE-712118DEST_PATH_IMAGE047
表示为网络预测出第i个网格的置信度;
Figure RE-56512DEST_PATH_IMAGE048
表示第i个网格实际第置信度;
Figure RE-554490DEST_PATH_IMAGE049
为权重;
所述类别损失
Figure RE-60557DEST_PATH_IMAGE050
为:
Figure RE-886562DEST_PATH_IMAGE051
其中
Figure RE-769067DEST_PATH_IMAGE052
表示如果第i个网格中第j个预测框包含目标,其值为1,否则为0;
Figure RE-121551DEST_PATH_IMAGE053
表示第i个网格网络预测是某一类第概率;
Figure RE-877149DEST_PATH_IMAGE054
表示第i个网格实际属于某一类第概率。
CN202110645579.7A 2021-06-10 2021-06-10 一种基于Yolov4的养鸡场饲养鸡识别算法 Withdrawn CN113221853A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110645579.7A CN113221853A (zh) 2021-06-10 2021-06-10 一种基于Yolov4的养鸡场饲养鸡识别算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110645579.7A CN113221853A (zh) 2021-06-10 2021-06-10 一种基于Yolov4的养鸡场饲养鸡识别算法

Publications (1)

Publication Number Publication Date
CN113221853A true CN113221853A (zh) 2021-08-06

Family

ID=77083516

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110645579.7A Withdrawn CN113221853A (zh) 2021-06-10 2021-06-10 一种基于Yolov4的养鸡场饲养鸡识别算法

Country Status (1)

Country Link
CN (1) CN113221853A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113971811A (zh) * 2021-11-16 2022-01-25 北京国泰星云科技有限公司 一种基于机器视觉和深度学习的集装箱特征智能识别方法
CN114842470A (zh) * 2022-05-25 2022-08-02 南京农业大学 层叠式笼养模式下的鸡蛋计数及定位***

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113971811A (zh) * 2021-11-16 2022-01-25 北京国泰星云科技有限公司 一种基于机器视觉和深度学习的集装箱特征智能识别方法
CN114842470A (zh) * 2022-05-25 2022-08-02 南京农业大学 层叠式笼养模式下的鸡蛋计数及定位***
CN114842470B (zh) * 2022-05-25 2024-05-31 南京农业大学 层叠式笼养模式下的鸡蛋计数及定位***

Similar Documents

Publication Publication Date Title
CN109657716B (zh) 一种基于深度学习的车辆外观损伤识别方法
CN109816024A (zh) 一种基于多尺度特征融合与dcnn的实时车标检测方法
CN111507371B (zh) 自动评估对训练图像的标签可靠性的方法和装置
CN109684922B (zh) 一种基于卷积神经网络的多模型对成品菜的识别方法
CN113420669B (zh) 基于多尺度训练和级联检测的文档版面分析方法和***
CN112819821B (zh) 一种细胞核图像检测方法
CN113221853A (zh) 一种基于Yolov4的养鸡场饲养鸡识别算法
CN111488911B (zh) 基于Mask R-CNN与GAN的图像实体抽取方法
CN108596883A (zh) 一种基于深度学习和距离约束的航拍图像防震锤滑移故障诊断方法
CN111860587A (zh) 一种用于图片小目标的检测方法
CN112381806A (zh) 基于多尺度融合方法的双着丝粒畸变染色体分析预测方法
CN116740758A (zh) 一种防止误判的鸟类图像识别方法及***
CN115984543A (zh) 一种基于红外与可见光图像的目标检测算法
CN113609895A (zh) 基于改进Yolov3的获取道路交通信息方法
CN116563868A (zh) 文本图像的识别方法、装置、计算机设备及存储介质
CN111414930B (zh) 深度学习模型训练方法及装置、电子设备及存储介质
CN114882204A (zh) 船名自动识别方法
CN111627018A (zh) 一种基于双流神经网络模型的钢板表面缺陷分类方法
CN116612450A (zh) 一种面向点云场景的差异化知识蒸馏3d目标检测方法
CN112949634B (zh) 一种铁路接触网鸟窝检测方法
CN115641575A (zh) 一种基于稀疏候选框的叶蝉科农业害虫检测方法
CN114927236A (zh) 一种面向多重目标图像的检测方法及***
CN116152537A (zh) 一种基于Yolov5s的15种林业害虫识别算法
CN114140428A (zh) 基于YOLOv5的落叶松毛虫虫害检测识别方法及***
CN112199984A (zh) 一种大尺度遥感图像的目标快速检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20210806

WW01 Invention patent application withdrawn after publication