CN111860623A

CN111860623A - 基于改进ssd神经网络的统计树木数量的方法及***

Info

Publication number: CN111860623A
Application number: CN202010635369.5A
Authority: CN
Inventors: 韩巧玲; 刘雷; 赵燕东; 赵玥; 席本野; 宋美慧; 李晨曦
Original assignee: Beijing Forestry University
Current assignee: Beijing Forestry University
Priority date: 2020-07-03
Filing date: 2020-07-03
Publication date: 2020-10-30

Abstract

本发明实施例公开了一种基于改进SSD神经网络的统计树木数量的方法及***，方法包括：采集图像，其中，图像为航拍的环境图像；将图像输入预先训练好的用于识别树木的神经网络模型中，以通过神经网络模型识别图像中的树木，其中，神经网络模型包括一一对应地提取多个尺度的特征图像的多个卷积层、以及一一对应地对多个尺度的特征图进行特征融合的多个反卷积层，以由多个反卷积层获取到融合后的新特征图。本发明的基于改进SSD神经网络的统计树木数量的方法，通过对图像分析之前，对神经网络模型进行训练，从而，能够对复杂环境下的图像均具有普适性，并且可以精确的识别到树木的数量，进而，提高对林业资源统计的精确度。

Description

基于改进SSD神经网络的统计树木数量的方法及***

技术领域

本发明涉及图像处理技术领域，具体涉及一种基于改进SSD神经网络的统计树木数量的方法及***。

背景技术

卷积神经网络在图像分类、行人检测以及标志识别方面得到广泛应用。例如：使用卷积神经网络对无人机航拍的图像中建筑类、林地、水体等进行分类识别。然而，利用无人机获取的林木图像中环境信息复杂，通过目前的神经网络识别过程中，精度较差，即：识别树木不够准确。

发明内容

基于现有技术中存在的问题，本发明实施例提出了一种基于改进SSD神经网络的统计树木数量的方法及***。

第一方面，本发明实施例提供了一种基于改进SSD神经网络的统计树木数量的方法，包括：

采集图像，其中，所述图像为航拍的环境图像；

将所述图像输入预先训练好的用于识别树木的神经网络模型中，以通过所述神经网络模型识别所述图像中的树木，

其中，所述神经网络模型包括一一对应地提取多个尺度的特征图像的多个卷积层、以及一一对应地对多个尺度的特征图进行特征融合的多个反卷积层，以由所述多个反卷积层获取到融合后的新特征图。

在一些示例中，还包括对所述神经网络模型进行训练的步骤，具体为：

获取多个图像训练样本；

对多个图像训练样本进行多尺度的特征图映射；

对多尺度的特征图进行先验框匹配和数据增强训练，得到训练完成的用于识别树木的所述神经网络模型。

在一些示例中，所述对多个图像训练样本进行多尺度的特征图映射，包括：

使用可提取多个尺度的特征图的多个卷积层提取所述多个尺度的特征图，并通过与对应的反卷积层的前后端融合，得到融合后的新特征图。

在一些示例中，所述对多尺度的特征图进行先验框匹配和数据增强训练，得到训练完成的用于识别树木的所述神经网络模型，包括：

基于多个尺度的特征图，设置尺度或者长宽比不同的先验框；

通过水平翻转、裁剪、放大和缩小中的一个或多个方式对多尺度的特征图进行数据增强。

在一些示例中，所述对所述神经网络模型进行训练，包括：

对于多个图像训练样本中每个真实目标，找到与其交并比IOU最大的先验框；

通过所述先验框与对应的真实目标进行匹配；

对剩余的未匹配的先验框，如果真实目标的交并比IOU大于预设值，则通过所述先验框与对应的真实目标进行匹配；

对负样本进行抽样，抽样时按照置信度误差进行降序排列，并选取误差的较大的top-k作为训练的负样本。

在一些示例中，所述通过所述神经网络模型识别所述图像中的树木时，所述多尺度的特征图的尺度越大，用于检测的目标越小。

在一些示例中，在所述神经网络模型中，通过设置的损失函数进行多个图像训练样本的分类。

第二方面本发明实施例还提供了一种基于改进SSD神经网络的统计树木数量的***，包括：

采集模块，用于采集图像，其中，所述图像为航拍的环境图像；

分类模块，用于将所述图像输入预先训练好的用于识别树木的神经网络模型中，以通过所述神经网络模型识别所述图像中的树木，其中，所述神经网络模型包括一一对应地提取多个尺度的特征图像的多个卷积层、以及一一对应地对多个尺度的特征图进行特征融合的多个反卷积层，以由所述多个反卷积层获取到融合后的新特征图。

第三方面，本发明实施例还提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如第一方面所述的基于改进SSD神经网络的统计树木数量的方法。

第四方面，本发明实施例还提供了一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如第一方面所述的基于改进SSD神经网络的统计树木数量的方法。

由上述技术方案可知，本发明实施例提供的基于改进SSD神经网络的统计树木数量的方法及***，通过对图像分析之前，对神经网络模型进行训练，从而，能够对复杂环境下的图像均具有普适性，并且可以精确的识别到树木的数量，进而，提高对林业资源统计的精确度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些图获得其他的附图。

图1是本发明一实施例提供的基于改进SSD神经网络的统计树木数量的方法的流程图；

图2是本发明一实施例提供的基于改进SSD神经网络的统计树木数量的方法中的神经网络模型的示意图；

图3是本发明一实施例提供的基于改进SSD神经网络的统计树木数量的***的结构示意图；

图4是本发明一实施例提供的电子设备的结构示意图。

具体实施方式

下面结合附图，对本发明的具体实施方式作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案，而不能以此来限制本发明的保护范围。

以下结合附图描述根据本发明实施例的语音检测方法及***。

图1示出了本发明一实施例提供的基于改进SSD神经网络的统计树木数量的方法的流程图，如图1所示，本发明实施例提供的基于改进SSD神经网络的统计树木数量的方法，具体包括如下内容：

S101：采集图像，其中，图像为航拍的环境图像。

S102：将图像输入预先训练好的用于识别树木的神经网络模型中，以通过神经网络模型识别所述图像中的树木，其中，所述神经网络模型包括一一对应地提取多个尺度的特征图像的多个卷积层、以及一一对应地对多个尺度的特征图进行特征融合的多个反卷积层，以由所述多个反卷积层获取到融合后的新特征图。即：通过神经网络模型识别所述图像中的树木时，所述多尺度的特征图的尺度越大，用于检测的目标越小。

在具体示例中，首先对所述神经网络模型进行训练，具体为：获取多个图像训练样本；对多个图像训练样本进行多尺度的特征图映射；对多尺度的特征图进行先验框匹配和数据增强训练，得到训练完成的用于识别树木的所述神经网络模型。

训练过程如下：对于多个图像训练样本中每个真实目标，找到与其交并比IOU最大的先验框；通过所述先验框与对应的真实目标进行匹配；对剩余的未匹配的先验框，如果真实目标的交并比IOU大于预设值，则通过所述先验框与对应的真实目标进行匹配；对负样本进行抽样，抽样时按照置信度误差进行降序排列，并选取误差的较大的top-k作为训练的负样本。

其中，对多个图像训练样本进行多尺度的特征图映射，包括：使用可提取多个尺度的特征图的多个卷积层提取所述多个尺度的特征图，并通过与对应的反卷积层的前后端融合，得到融合后的新特征图。

对多尺度的特征图进行先验框匹配和数据增强训练，得到训练完成的用于识别树木的所述神经网络模型，包括：基于多个尺度的特征图，设置尺度或者长宽比不同的先验框；通过水平翻转、裁剪、放大和缩小中的一个或多个方式对多尺度的特征图进行数据增强。

在所述神经网络模型中，通过设置的损失函数进行多个图像训练样本的分类。

以下具体说明对航拍的环境图像进行树木的数量识别的过程。

采集复杂环境图像，即航拍的环境图像。在该示例中，批量读取图像，各所述目标树木图像的真实目标均可与先验框进行匹配，为了使先验框能对其进行匹配，要用标定软件对采集图像进行标定。将信息转化为图像的像素值，输入网络(即：神经网络模型)。这是数据获取的过程，即：航拍的环境图像的获取过程。

对标定图像进行多尺度特征图映射。在该示例中，如图2所示，使用到了conv_7，conv8_2，conv9_2，conv10_2，conv11_2，这5个不同卷积层提取特征图，并通过与反卷积层的前后端融合得到新的特征图；对多个特征图进行先验框匹配和数据增强来进行训练，得到神经网络模型。

在以上描述中，由多尺度映射得到大小不同的特征图。每个单元设置尺度或者长宽比不同的先验框，预测的边界框以这些先验框为基准的，在一定程度上减少训练难度。数据增强方面，使用了多种数据增强的方法，包括水平翻转、裁剪、放大和缩小等。该数据增强操作可以增加训练样本的个数，同时构造出更多的不同形状和大小的目标，将其输入到网络中，可以使得网络学习到更加鲁棒的特征。最后通过损失函数进行分类。

将待识别图像投入神经网络模型检测，得到识别结果。

具体地，利用训练得到的神经网络模型识别图像中的树木，从而实现对林业资源的统计。

本发明的实施例，通过对图像分析之前，对神经网络模型进行训练，从而，能够对复杂环境下的图像均具有普适性，并且可以精确的识别到树木的数量，进而，提高对林业资源统计的精确度。

在一个或多个示例中，对图像进行多尺度特征图映射。具体为：对每一张特征图，按照不同的大小和长宽比生成k个默认框。尺度采用大小不同的特征图，前面的特征图比较大，后面逐渐采用stride＝2的卷积或者pool来降低特征图大小，利用多个尺度图来做检测，比较大的特征图用来检测相对较小的目标，而小的特征图负责检测大目标，达到对图像的全面检测。

结合图2所示，从卷积层的设置中可以看出，针对一幅图片单层卷积层无法达到检测的目的，因此在卷积层的数量和特征图的尺度上进行改进，为后续识别提供了基础。

即：本发明实施例的SSD神经网络是改进后的SSD神经网络，主要的改进点如下：

在神经网络模型的后端添加多个反卷积层，反卷积层与前端相同尺寸的特征图进行逐元素乘积。也就是说，改进的SSD神经网络包括多个反卷积层，并且，每个反卷积层与前端对应的相同尺寸的特征图进行逐元素乘积

在该示例中，每个卷积层之后添加一个对应的反卷积层，这样，多个卷积层对应多个反卷积层，由此，加快网络学习的速率。反卷积层的高层特征图与前端相同尺寸的底层特征图融合得到下一层要反卷积的特征图。融合采用逐元素相乘的方法。最后得到的特征图进行分类检测。

从以上描述的反卷积层的设置，由于浅层的特征图表征能力不够强，仅卷积层得到的特征图无法对小目标进行全面的检测。更充分利用了上下文信息(context),更充分利用了浅层的特征，从而可以在小目标和密集目标的检测率上有很大的提高。

根据对多个特征图进行先验框匹配和数据增强来进行训练，得到神经网络模型，具体为：对多个特征图进行先验框匹配，如下：在不同尺度的特征图上面产生很多的先验框，如果将映射到原始图像中，我们会获得一个密密麻麻的先验框集合。根据IOU的设置，并进行预测，获得最终的检测结果。

对多个特征图进行先验框匹配，具体为：对于图片中每个真实目标，找到与其IOU(交并比)最大的先验框，该先验框与其匹配，对于剩余的未匹配先验框，若某个真实目标的IOU大于0.5，那么该先验框也与这个真实目标进行匹配，对负样本进行抽样，抽样时按照置信度误差(预测背景的置信度越小，误差越大)进行降序排列，选取误差的较大的top-k(找出其中误差最大的K个数)作为训练的负样本，以保证正负样本比例接近1:3。

通过损失函数进行分类，具体为：损失函数定义为位置误差与置信度误差的加权和。对于位置误差，其采用Smooth L1loss，对于置信度误差，其采用softmax loss；

对图像进行水平翻转，随机裁剪加颜色扭曲，随机采集块域等方式进行数据增强，如下：通过随机裁剪加颜色扭曲，随机采集块域等方式进行数据增强，可以增加训练样本的个数，同时构造出更多的不同形状和大小的目标，将其输入到网络中，可以使得网络得到更好的训练。

应用直方图特征描述将训练得到的神经网络模型投入图像识别时，采用多尺度特征图用于检测。比较大的特征图来用来检测相对较小的目标，而小的特征图负责检测大目标；设置先验框，预测的边界框以这些先验框为基准；采用卷积进行检测，对不同的特征图来进行提取检测结果；

作为一个具体的示例，采集复杂环境图像，对树木进行标定。对图像获取多尺度特征映射并增加反卷积层：数据获取：批量读取图像，各所述目标树木图像的真实目标均可与先验框进行匹配，为了使先验框能对其进行匹配，要用标定软件对采集图像进行标定。将信息转化为图像的像素值，输入网络。这就是数据获取的过程。对图像获取多尺度特征映射：使用到了conv_7，conv8_2，conv9_2，conv10_2，conv11_2，这5个不同特征图。对每一张特征图，按照不同的大小和长宽比生成k个默认框。对每一张特征图，按照不同的大小和长宽比生成k个默认框。尺度采用大小不同的特征图，前面的特征图比较大，后面逐渐采用stride＝2的卷积或者pool来降低特征图大小，利用多个尺度图来做检测，比较大的特征图来用来检测相对较小的目标，而小的特征图负责检测大目标，达到对图像的全面检测。

增加反卷积层：每个卷积层之后添加BN层。反卷积层的高层特征图与前端相同尺寸的底层特征图融合得到下一层要反卷积的特征图。融合采用逐元素相乘的方法。最后得到的特征图进行分类检测。

对多个特征图进行先验框匹配和数据增强来进行训练：先验框匹配：由多尺度映射得到大小不同的特征图。每个单元设置尺度或者长宽比不同的先验框，预测的边界框以这些先验框为基准的，在一定程度上减少训练难度。在不同尺度的特征图上面产生很多的先验框，如果将映射到原始图像中，我们会获得一个密密麻麻的先验框集合。根据IOU的设置，并将这些box送入NMS模块中，获得最终的检测结果。损失函数：损失函数定义为位置误差与置信度误差的加权和。对于位置误差，其采用Smooth L1loss，对于置信度误差，其采用softmaxloss。根据损失函数对目标进行分类。数据增强：通过随机裁剪加颜色扭曲，随机采集块域等方式进行数据增强，可以增加训练样本的个数，同时构造出更多的不同形状和大小的目标，将其输入到网络中，可以使得网络得到更好的训练。将待识别图像投入模型检测，得到识别结果。

根据本发明实施例的基于改进SSD神经网络的统计树木数量的方法，通过在神经网络模型中增加反卷积层，并对卷积层进行调整，在反卷积层上引入上下文关联信息，融合前后内容的信息，实现识别准确率的提升。

图3示出了本发明一个实施例提供的基于改进SSD神经网络的统计树木数量的***的结构示意图，如图3所示，本发明实施例提供的基于改进SSD神经网络的统计树木数量的***，包括：采集模块310和分类模块320。

其中，采集模块310用于采集图像，其中，所述图像为航拍的环境图像。分类模块320用于将所述图像输入预先训练好的用于识别树木的神经网络模型中，以通过神经网络模型识别所述图像中的树木，其中，所述神经网络模型包括一一对应地提取多个尺度的特征图像的多个卷积层、以及一一对应地对多个尺度的特征图进行特征融合的多个反卷积层，以由多个反卷积层获取到融合后的新特征图。

根据本发明实施例的基于改进SSD神经网络的统计树木数量的***，通过对图像分析之前，对神经网络模型进行训练，从而，能够对复杂环境下的图像均具有普适性，并且可以精确的识别到树木的数量，进而，提高对林业资源统计的精确度。

需要说明的是，本发明实施例的基于改进SSD神经网络的统计树木数量的***的具体实现方式与本发明实施例的基于改进SSD神经网络的统计树木数量的方法的具体实现方式类似，具体请参见方法部分的描述，为了减少冗余，具体此处不做赘述。

基于相同的发明构思，本发明又一个实施例提供了一种电子设备，参见图4，所述电子设备具体包括如下内容：处理器401、存储器402、通信接口403和通信总线404；

其中，所述处理器401、存储器402、通信接口403通过所述通信总线404完成相互间的通信；所述通信接口403用于实现各设备之间的信息传输；

所述处理器401用于调用所述存储器402中的计算机程序，所述处理器执行所述计算机程序时实现上述基于改进SSD神经网络的统计树木数量的方法的全部步骤，例如，所述处理器执行所述计算机程序时实现下述步骤：采集图像，其中，所述图像为航拍的环境图像；将所述图像输入预先训练好的用于识别树木的神经网络模型中，以通过所述神经网络模型识别所述图像中的树木，其中，所述神经网络模型包括一一对应地提取多个尺度的特征图像的多个卷积层、以及一一对应地对多个尺度的特征图进行特征融合的多个反卷积层，以由所述多个反卷积层获取到融合后的新特征图。

另外，根据本发明实施例的电子设备的其它构成以及作用对于本领域的普通技术人员而言都是已知的，此处不做赘述。

基于相同的发明构思，本发明又一实施例提供了一种非暂态计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述基于改进SSD神经网络的统计树木数量的方法的全部步骤，例如，所述处理器执行所述计算机程序时实现下述步骤：采集图像，其中，所述图像为航拍的环境图像；将所述图像输入预先训练好的用于识别树木的神经网络模型中，以通过所述神经网络模型识别所述图像中的树木，其中，所述神经网络模型包括一一对应地提取多个尺度的特征图像的多个卷积层、以及一一对应地对多个尺度的特征图进行特征融合的多个反卷积层，以由所述多个反卷积层获取到融合后的新特征图。

此外，上述的存储器中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-OnlyMemory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本发明实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的指标监控方法。

此外，在本发明中，诸如“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

此外，在本发明中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

此外，在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种基于改进SSD神经网络的统计树木数量的方法，其特征在于，包括：

采集图像，其中，所述图像为航拍的环境图像；

2.根据权利要求1所述的基于改进SSD神经网络的统计树木数量的方法，其特征在于，还包括对所述神经网络模型进行训练的步骤，具体为：

获取多个图像训练样本；

对多个图像训练样本进行多尺度的特征图映射；

3.根据权利要求2所述的基于改进SSD神经网络的统计树木数量的方法，其特征在于，所述对多个图像训练样本进行多尺度的特征图映射，包括：

4.根据权利要求2所述的基于改进SSD神经网络的统计树木数量的方法，其特征在于，所述对多尺度的特征图进行先验框匹配和数据增强训练，得到训练完成的用于识别树木的所述神经网络模型，包括：

5.根据权利要求2所述的基于改进SSD神经网络的统计树木数量的方法，其特征在于，所述对所述神经网络模型进行训练，包括：

通过所述先验框与对应的真实目标进行匹配；

6.根据权利要求2所述的基于改进SSD神经网络的统计树木数量的方法，其特征在于，所述通过所述神经网络模型识别所述图像中的树木时，所述多尺度的特征图的尺度越大，用于检测的目标越小。

7.根据权利要求2所述的基于改进SSD神经网络的统计树木数量的方法，其特征在于，在所述神经网络模型中，通过设置的损失函数进行多个图像训练样本的分类。

8.一种基于改进SSD神经网络的统计树木数量的***，其特征在于，包括：

9.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现根据权利要求1至7任一所述的基于改进SSD神经网络的统计树木数量的方法。

10.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现根据权利要求1至7任一所述的基于改进SSD神经网络的统计树木数量的方法。