CN116229518A

CN116229518A - 一种基于机器学习的鸟类物种观测方法及***

Info

Publication number: CN116229518A
Application number: CN202310258842.6A
Authority: CN
Inventors: 高树会; 雷佳琳
Original assignee: Bainiao Data Technology Beijing Co ltd
Current assignee: Bainiao Data Technology Beijing Co ltd
Priority date: 2023-03-17
Filing date: 2023-03-17
Publication date: 2023-06-06
Anticipated expiration: 2043-03-17
Also published as: CN116229518B

Abstract

本发明涉及鸟类物种观测技术领域，具体地说，涉及一种基于机器学习的鸟类物种观测方法及***。其包括根据目标图片质量选择不同识别方案：采用细粒度图片识别算法对清晰图片中的鸟类进行物种识别；采用多模态信息识别算法对模糊图片中的鸟类进行物种识别。本发明通过建立的识别模型识别出目标图片质量，并根据目标图片质量将目标图片分为清晰图片或模糊图片，根据目标图片质量选择不同识别方案，有利于提高监控场景下的物种识别精度，将生态学家专业知识以及鸟类动作信息结合到鸟类识别模型中，使得鸟类识别模型在图片模糊的情况下，也能够进行鸟类物种识别，以适应不同监控状态下采集到的图片中的鸟类物种识别工作，提高识别效率。

Description

一种基于机器学习的鸟类物种观测方法及***

技术领域

本发明涉及鸟类物种观测技术领域，具体地说，涉及一种基于机器学习的鸟类物种观测方法及***。

背景技术

鸟类物种观测设备主要用于野外环境下的物种细粒度图像识别，主要存在下面几个难点：

难点1:细粒度图像普遍存在类间差异小、类内差异大的特点，如何准确地对细粒度类别进行精准的判定，在当前仍是一个极大挑战。

难点2:自然界存在的长尾分布特点会映射到网络中，使网络中的数据存在长尾分布，从而导致数据存在过拟合问题，影响模型的识别精度。

难点3:边缘端的处理设备如何持续、稳定、低功耗工作。

解决上面的问题目前的主要范式包括：

(1)具有定位分类子网络的细粒度识别

使用两个子网络，为定位子网络和分类子网络。

定位子网络来定位关键部分，可以获得更多有区别的中间级别(部分级别)表示。进一步增强了分类子网络的学习能力，这些方法将多个部分级特征连接为一个整体图像表示，并将其输入到下面的分类子网络中进行最终识别。

分类子网络跟随并用于识别。这两个协作子网络的框架形成了第一个范式，即具有定位分类子网络的细粒度识别，然而，需要人工注释关注的部分，限制了可拓展性。趋势：先找到对应的部分，然后比较它们的外观，希望捕获语义部分(例如，头部和躯干)以在细粒度类别之间共享，同时希望发现这些部分表示之间的细微差异。

(2)具有端到端特征编码

这种范式倾向于通过开发强大的深度模型进行细粒度识别来直接学习更具辨别力的特征表示，双线性CNN：将图像表示为来自两个深度CNN的特征的池化外积，因此对卷积激活的高阶统计进行编码以增强中级学习能力，由于其高模型容量，双线性CNN实现了显着的细粒度识别性能。然而，双线性特征的极高维数仍然使其在实际应用中不切实际，尤其是对于大规模应用。

为了应对上述问题，现亟需一种基于机器学习的鸟类物种观测方法及***。

发明内容

本发明的目的在于提供一种基于机器学习的鸟类物种观测方法及***，以解决上述背景技术中提出的问题。

为实现上述目的，本发明目的之一在于，提供了一种基于机器学习的鸟类物种观测方法，包括如下步骤：

S1、拍摄地摄像头采集目标图片以及目标视频，并将目标图片传输至边缘处理器；

S2、边缘处理器对目标图片进行预处理，并通过目标检测模型检测出识别的目标；

S3、回传检测目标的原始目标视频至后端服务器；

S4、后端服务器建立识别模型，识别模型识别出目标图片质量，并根据目标图片质量将目标图片分为清晰图片或模糊图片；

S5、根据目标图片质量选择不同识别方案：

采用细粒度图片识别算法对清晰图片中的鸟类进行物种识别；

采用多模态信息识别算法对模糊图片中的鸟类进行物种识别；

S6、输出当前采集的目标图片所识别出的鸟类物种信息。

作为本技术方案的进一步改进，所述S1中目标图片以及目标视频的采集方法包括如下步骤：

S1.1、根据鸟类栖息规律规划拍摄区域，安装对应的摄像头；

S1.2、建立拍摄间隔，根据拍摄间隔实时回传拍摄点拍摄到的目标图片以及目标视频。

作为本技术方案的进一步改进，所述S2中的目标图片预处理方法包括如下步骤：

S2.1、对目标图片进行解码处理，生成解码图片；

S2.2、对解码图片进行抽帧处理，并记录不同帧的时序信息，生成抽帧图片；

S2.3、对各个抽帧图片进行目标识别，剔除其中不含鸟类物种的图片。

作为本技术方案的进一步改进，所述S2中的边缘处理器采用低功耗处理器，低功耗处理器是目标检测模型检测过程中的载体，用于快速获取、处理实时图像信息。

作为本技术方案的进一步改进，所述S2中目标检测模型检测出识别的目标的检测方法包括如下步骤：

S2.4、结合监控区域各项环境因素，对目标图片的各项因素进行特征识别；

S2.5、建立各项因素特征数据库，根据因素特征数据库对比各个目标图片的因素。

作为本技术方案的进一步改进，所述S4中识别模型识别目标图片质量的识别方法包括如下步骤：

S4.1、对每个目标图片进行图片像素点数量计算，得出目标图片的空间复杂度；

S4.2、确定每个目标图片中的噪声数量，得出目标图片的噪声复杂度；

S4.3、结合目标图片的空间复杂度以及噪声复杂度得出目标图片的清晰度；

S4.4、规划目标图片清晰度阈值，将低于目标图片清晰度阈值的目标图片规定为模糊图片，将不低于目标图片清晰度阈值的目标图片规定为清晰图片。

作为本技术方案的进一步改进，所述S4.3中目标图片的清晰度判断采用清晰度计算算法，其算法公式如下：

其中ρ(Clarity)为目标图片的清晰度数值，K(Space)为目标图片的空间复杂度，N(noise)为目标图片的噪声复杂度，F(ρ)清晰度判断函数，ρ为当前目标图片的清晰度数值_，

为目标图片清晰度阈值，当当前目标图片的清晰度数值ρ低于目标图片清晰度阈值/>

时，清晰度判断函数F(ρ)输出为0，标记该目标图片为模糊图片，当当前目标图片的清晰度数值ρ不低于目标图片清晰度阈值/>

时，清晰度判断函数F(ρ)输出为1，标记该目标图片为清晰图片。

作为本技术方案的进一步改进，所述S5细粒度图片识别算法包括如下步骤：

S5.1、整合监控区域的各个鸟类种类，确定每种鸟类的特征；

S5.2、结合每种鸟类的特征，生成鸟类特征数据库；

S5.3、对每个清晰目标图片中识别的鸟类与鸟类特征数据库进行比对，选取出鸟类特征数据库中对应的目标鸟类，作为目标图片中识别的鸟类种类。

作为本技术方案的进一步改进，所述S5中多模态信息识别算法包括如下步骤：

S5.4、确定模糊图片拍摄时序信息、记录的地理位置信息；

S5.5、同时建立生态学家专业知识以及鸟类动作信息数据库；

S5.6、结合模糊图片的拍摄时序信息以及记录的地理位置信息，预分析出模糊图片中识别的鸟类所属鸟类类型；

S5.7、比对生态学家专业知识以及鸟类动作信息数据库，对模糊图片中识别的鸟类进行精确比对，得出模糊图片中识别的鸟类所属种类。

本发明目的之二在于，提供了一种用于基于机器学习的鸟类物种观测方法的观测***，包括若干摄像头、边缘处理器、后端服务器、图片质量分类模块、识别方案分配模块以及识别结果输出模块，所述边缘处理器用于接收摄像头采集目标图片以及目标视频，并对目标图片进行预处理，通过目标检测模型检测出识别的目标，所述后端服务器输入端与所述边缘处理器输出端连接，所述后端服务器用于接收回传检测目标的原始目标视频，所述后端服务器建立识别模型，通过所述识别模型识别出目标图片质量，所述图片质量分类模块输入端与所述后端服务器输出端连接，所述图片质量分类模块包括分类单元，所述分类单元将目标图片分为清晰图片或模糊图片，所述图片质量分类模块输出端与所述识别方案分配模块输入端连接，所述识别方案分配模块根据目标图片分类结果，采用细粒度图片识别算法对清晰图片中的鸟类进行物种识别，采用多模态信息识别算法对模糊图片中的鸟类进行物种识别，所述识别方案分配模块输出端与所述识别结果输出模块输入端连接，所述识别结果输出模块输出当前采集的目标图片所识别出的鸟类物种信息。

与现有技术相比，本发明的有益效果：

1、该基于机器学习的鸟类物种观测方法及***中，通过建立的识别模型识别出目标图片质量，并根据目标图片质量将目标图片分为清晰图片或模糊图片，根据目标图片质量选择不同识别方案，有利于提高监控场景下的物种识别精度，将生态学家专业知识以及鸟类动作信息结合到鸟类识别模型中，使得鸟类识别模型在图片模糊的情况下，也能够进行鸟类物种识别，以适应不同监控状态下采集到的图片中的鸟类物种识别工作，提高识别效率。

附图说明

图1为本发明实施例1的整体流程图；

图2为本发明实施例1的目标图片以及目标视频的采集方法流程图；

图3为本发明实施例1的目标图片预处理方法流程图；

图4为本发明实施例1的目标检测模型检测出识别的目标的检测方法流程图；

图5为本发明实施例1的识别模型识别目标图片质量的识别方法流程图；

图6为本发明实施例1的细粒度图片识别算法流程图；

图7为本发明实施例1的多模态信息识别算法流程图；

图8为本发明实施例1的整体***结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例1

请参阅图1-图8所示，本实施例目的之一在于，提供了一种基于机器学习的鸟类物种观测方法，包括如下步骤：

S3、回传检测目标的原始目标视频至后端服务器；

S5、根据目标图片质量选择不同识别方案：

S6、输出当前采集的目标图片所识别出的鸟类物种信息。

具体使用时，首先在拍摄地安装用于进行鸟类物种观测的摄像头，通过摄像头采集目标图片以及目标视频，并将目标图片传输至边缘处理器，边缘处理器对目标图片进行解码、抽帧以及识别，并通过目标检测模型检测出识别的目标，随后回传检测目标的原始目标视频至后端服务器，由于摄像头被固定在某些高塔上，摄像头拍摄到鸟的图片，大致可以分为两种情况：第一种，鸟类处于离摄像头很近的地方，可以拍摄到清晰的图片，有的鸟处于离摄像头很远的地方，拍摄到的图片比较模糊，此时后端服务器建立识别模型，识别模型识别出目标图片质量，并根据目标图片质量将目标图片分为清晰图片或模糊图片，根据目标图片质量选择不同识别方案：

采用细粒度图片识别算法对清晰图片中的鸟类进行物种识别，即采用数据库存储各类鸟类特征信息，并与清晰的目标图片中识别的鸟类特征进行比对，得出当前识别到的清晰的目标图片属于数据库中的那种鸟类，得出清晰图片中的鸟类物种识别信息；

采用多模态信息识别算法对模糊图片中的鸟类进行物种识别，即采用连续帧信息结合地理位置信息以及拍摄之间信息，同时建立生态学家专业知识以及鸟类动作信息数据库，在进行模糊图片中的鸟类物种识别过程中，多模态信息对模糊图片中的鸟类进行物种识别，得出模糊图片中的鸟类物种识别信息；

随后输出当前采集的目标图片所识别出的鸟类物种信息。

本发明通过建立的识别模型识别出目标图片质量，并根据目标图片质量将目标图片分为清晰图片或模糊图片，根据目标图片质量选择不同识别方案，对于不同清晰度的鸟，使用不同的鸟类物种识别模型，有利于提高监控场景下的物种识别精度，在进行模糊图片中的鸟类物种识别过程中，将生态学家专业知识以及鸟类动作信息结合到鸟类识别模型中，使得鸟类识别模型在图片模糊的情况下，也能够进行鸟类物种识别，以适应不同监控状态下采集到的图片中的鸟类物种识别工作，提高识别效率。

进一步的，S1中目标图片以及目标视频的采集方法包括如下步骤：

S1.1、根据鸟类栖息规律规划拍摄区域，安装对应的摄像头；

具体使用时，由于鸟类同一季节栖息场所较为固定，但其活动轨迹却十分宽广，在进行拍摄区域规划过程中，首先需要确定鸟类栖息规律，例如筑巢场所以及捕食常见区域等，随后根据鸟类栖息规律规划拍摄区域，安装对应的摄像头，并建立拍摄间隔，根据拍摄间隔实时回传拍摄点拍摄到的目标图片以及目标视频。

再进一步的，S2中的目标图片预处理方法包括如下步骤：

S2.1、对目标图片进行解码处理，生成解码图片；

具体使用时，首先通过边缘处理器对目标图片进行解码处理，生成解码图片，随后对解码图片进行抽帧处理，并记录不同帧的时序信息，生成抽帧图片，为后期进行模糊图片目标识别处理提供参考依据，由于拍摄的目标图片中，鸟类的运动是随机的，在拍摄的过程中鸟类飞行轨迹发生改变，导致摄像头拍摄的连续图片中会因鸟类脱离拍摄区域，而促使部分拍摄的目标图片不存在任何鸟类，此时对各个抽帧图片进行目标识别，剔除其中不含鸟类物种的图片，提高后期目标图片的鸟类物种识别效率。

具体的，S2中的边缘处理器采用低功耗处理器，低功耗处理器是目标检测模型检测过程中的载体，用于快速获取、处理实时图像信息，能够将视频数据从摄像头端进行预处理，然后通过低带宽的网络进行传输，这样能够有效的降低数据的传输带宽和节省电力，提升数据收集效率，低功耗边缘视频处理器首先实现基本的视频处理任务，如图像缩放，格式转换，编码和解码，进而实现视频分析和智能视频识别等。

此外，S2中目标检测模型检测出识别的目标的检测方法包括如下步骤：

具体使用时，在进行目标图片检测过程中，由于拍摄的目标图片不仅存在鸟类还可能存在树木、岩石以及水源等环境因素，为了区分不同图片类型，，首先结合监控区域各项环境因素，对目标图片的各项因素进行特征识别，例如树木的特征为树木特殊颜色以及树木高度等，随后建立各项因素特征数据库，根据因素特征数据库对比各个目标图片的因素，建立各项因素特征数据库，根据因素特征数据库对比各个目标图片的因素，对每个目标存在的环境因素进行识别，为后期模糊图片的鸟类物种识别提供多模态参考。

除此之外，S4中识别模型识别目标图片质量的识别方法包括如下步骤：

具体使用时，首先对每个目标图片进行图片像素点数量计算，得出目标图片的空间复杂度，随后对目标图片进行噪声分析，确定每个目标图片中的噪声数量，得出目标图片的噪声复杂度，结合目标图片的空间复杂度以及噪声复杂度得出目标图片的清晰度，规划目标图片清晰度阈值，将低于目标图片清晰度阈值的目标图片规定为模糊图片，将不低于目标图片清晰度阈值的目标图片规定为清晰图片，对每个目标图片进行质量分类，以供后期根据分类结果进行对应识别方案确定。

进一步的，S4.3中目标图片的清晰度判断采用清晰度计算算法，其算法公式如下：

时，清晰度判断函数F(ρ)输出为0，标记该目标图片为模糊图片_，当当前目标图片的清晰度数值ρ不低于目标图片清晰度阈值/>

时，清晰度判断函数F(ρ)输出为1_，标记该目标图片为清晰图片。

再进一步的，S5细粒度图片识别算法包括如下步骤：

S5.1、整合监控区域的各个鸟类种类，确定每种鸟类的特征；

S5.2、结合每种鸟类的特征，生成鸟类特征数据库；

具体使用时，首先整合监控区域的各个鸟类种类，确定每种鸟类的特征，例如啄木鸟的鸟类特征为嘴部尖细且长，随后结合每种鸟类的特征，生成鸟类特征数据库，对每个清晰目标图片中识别的鸟类与鸟类特征数据库进行比对，选取出鸟类特征数据库中对应的目标鸟类，作为目标图片中识别的鸟类种类，由此判断出目标图片的鸟类种类。

具体的，S5中多模态信息识别算法包括如下步骤：

S5.4、确定模糊图片拍摄时序信息、记录的地理位置信息；

S5.5、同时建立生态学家专业知识以及鸟类动作信息数据库；

具体使用时，当模糊图片中的鸟类无法识别其具体特征时，首先确定模糊图片拍摄时序信息、记录的地理位置信息，即确定拍摄该模糊图片的时间以及模糊图片中鸟类所属地理环境，根据各个鸟类的生物习惯，预分析出模糊图片中识别的鸟类所属鸟类类型，随后比对生态学家专业知识以及鸟类动作信息数据库，对模糊图片中识别的鸟类进行精确比对，得出模糊图片中识别的鸟类所属种类，采用多模态信息识别进行模糊图片鸟类物种精确识别，提高模糊图片的鸟类物种识别准确度，减少识别误差。

本实施例目的之二在于，提供了一种用于基于机器学习的鸟类物种观测方法的观测***，包括若干摄像头、边缘处理器、后端服务器、图片质量分类模块、识别方案分配模块以及识别结果输出模块，边缘处理器用于接收摄像头采集目标图片以及目标视频，并对目标图片进行预处理，通过目标检测模型检测出识别的目标，后端服务器输入端与边缘处理器输出端连接，后端服务器用于接收回传检测目标的原始目标视频，后端服务器建立识别模型，通过识别模型识别出目标图片质量，图片质量分类模块输入端与后端服务器输出端连接，图片质量分类模块包括分类单元，分类单元将目标图片分为清晰图片或模糊图片，图片质量分类模块输出端与识别方案分配模块输入端连接，识别方案分配模块根据目标图片分类结果，采用细粒度图片识别算法对清晰图片中的鸟类进行物种识别，采用多模态信息识别算法对模糊图片中的鸟类进行物种识别，识别方案分配模块输出端与识别结果输出模块输入端连接，识别结果输出模块输出当前采集的目标图片所识别出的鸟类物种信息。

以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解，本发明不受上述实施例的限制，上述实施例和说明书中描述的仅为本发明的优选例，并不用来限制本发明，在不脱离本发明精神和范围的前提下，本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims

1.一种基于机器学习的鸟类物种观测方法，其特征在于，包括如下步骤：

S3、回传检测目标的原始目标视频至后端服务器；

S5、根据目标图片质量选择不同识别方案：

S6、输出当前采集的目标图片所识别出的鸟类物种信息。

2.根据权利要求1所述的基于机器学习的鸟类物种观测方法，其特征在于：所述S1中目标图片以及目标视频的采集方法包括如下步骤：

S1.1、根据鸟类栖息规律规划拍摄区域，安装对应的摄像头；

3.根据权利要求1所述的基于机器学习的鸟类物种观测方法，其特征在于：所述S2中的目标图片预处理方法包括如下步骤：

S2.1、对目标图片进行解码处理，生成解码图片；

4.根据权利要求3所述的基于机器学习的鸟类物种观测方法，其特征在于：所述S2中的边缘处理器采用低功耗处理器，低功耗处理器是目标检测模型检测过程中的载体，用于快速获取、处理实时图像信息。

5.根据权利要求4所述的基于机器学习的鸟类物种观测方法，其特征在于：所述S2中目标检测模型检测出识别的目标的检测方法包括如下步骤：

6.根据权利要求1所述的基于机器学习的鸟类物种观测方法，其特征在于：所述S4中识别模型识别目标图片质量的识别方法包括如下步骤：

7.根据权利要求6所述的基于机器学习的鸟类物种观测方法，其特征在于：所述S4.3中目标图片的清晰度判断采用清晰度计算算法，其算法公式如下：

/>

其中ρ(Clarity)为目标图片的清晰度数值，K(Space)为目标图片的空间复杂度，N(noise)为目标图片的噪声复杂度，F(ρ)清晰度判断函数，ρ为当前目标图片的清晰度数值，

8.根据权利要求1所述的基于机器学习的鸟类物种观测方法，其特征在于：所述S5细粒度图片识别算法包括如下步骤：

S5.1、整合监控区域的各个鸟类种类，确定每种鸟类的特征；

S5.2、结合每种鸟类的特征，生成鸟类特征数据库；

9.根据权利要求8所述的基于机器学习的鸟类物种观测方法，其特征在于：所述S5中多模态信息识别算法包括如下步骤：

S5.4、确定模糊图片拍摄时序信息、记录的地理位置信息；

S5.5、同时建立生态学家专业知识以及鸟类动作信息数据库；

10.一种用于包括权利要求1-9中任意一项所述的基于机器学习的鸟类物种观测方法的观测***，其特征在于：包括若干摄像头、边缘处理器、后端服务器、图片质量分类模块、识别方案分配模块以及识别结果输出模块，所述边缘处理器用于接收摄像头采集目标图片以及目标视频，并对目标图片进行预处理，通过目标检测模型检测出识别的目标，所述后端服务器输入端与所述边缘处理器输出端连接，所述后端服务器用于接收回传检测目标的原始目标视频，所述后端服务器建立识别模型，通过所述识别模型识别出目标图片质量，所述图片质量分类模块输入端与所述后端服务器输出端连接，所述图片质量分类模块包括分类单元，所述分类单元将目标图片分为清晰图片或模糊图片，所述图片质量分类模块输出端与所述识别方案分配模块输入端连接，所述识别方案分配模块根据目标图片分类结果，采用细粒度图片识别算法对清晰图片中的鸟类进行物种识别，采用多模态信息识别算法对模糊图片中的鸟类进行物种识别，所述识别方案分配模块输出端与所述识别结果输出模块输入端连接，所述识别结果输出模块输出当前采集的目标图片所识别出的鸟类物种信息。