CN112766413A

CN112766413A - 一种基于加权融合模型的鸟类分类方法及***

Info

Publication number: CN112766413A
Application number: CN202110161908.0A
Authority: CN
Inventors: 吴鹏; 易晓梅; 章林焓
Original assignee: Zhejiang A&F University ZAFU
Current assignee: Zhejiang A&F University ZAFU
Priority date: 2021-02-05
Filing date: 2021-02-05
Publication date: 2021-05-07

Abstract

本发明属于计算机视觉技术领域，提供了一种基于加权融合模型的鸟类分类方法，包括步骤：S1、通过预设方式获取鸟类图像；S2、将获取的鸟类图像经过预设训练模型进行鸟类识别，S3、根据鸟类识别的结果，将所述鸟类图像分入对应的类别中，得到鸟类分类结果。本发明还提供了一种基于加权融合模型的鸟类分类***，本发明的优点在于使用VGG和ResNet152分别对数据集进行训练，然后通过动态调整融合模型权重，来获取最优的分类效果。

Description

一种基于加权融合模型的鸟类分类方法及***

技术领域

本发明涉及计算机视觉技术领域，尤其涉及一种基于加权融合模型的鸟类分类方法及***。

背景技术

鸟类分类问题本质上是细粒度图像分类问题。基于机器学习和神经网络进行细粒度图像分类的研究已经非常的成熟，在各类细粒度数据集上都取得了很好的效果。

随着深度学习领域研究的不断深入，越来越多的优秀模型被提出，如LeNet、AlexNet、VGG、ResNet等等。这些模型的分类效果也越来也好，还有现有的FixEfficientNet-L2模型，其在ImageNet数据集上的TOP-1准确率达到了88.5％，TOP-5准确率达到了98.7％，已经超出了人类识别能力。

但与此同时，该模型的复杂度也非常之大，共有480M的参数量，并且从零开始训练一个深度模型是非常消耗计算力的事情。

发明内容

本发明的目的在于提供一种基于加权融合模型的鸟类分类方法，用以解决鸟类分类识别网络模型过于复杂的问题；

为了实现上述目的，本发明采用的技术方案为：

一种基于加权融合模型的鸟类分类方法，包括步骤：

S1、通过预设方式获取鸟类图像；

S2、将获取的鸟类图像经过预设训练模型进行鸟类识别；

S3、根据鸟类识别的结果，将所述鸟类图像分入对应的类别中，得到鸟类分类结果。

进一步的，步骤S2中获得所述预设训练模型的步骤包括：

S21、通过预设方式获取不同鸟类的图像，并建立数据集；

S22、将所述数据集中的鸟类图像进行图像增强处理；

S23、根据图像增强处理后的鸟类图像对预设加权融合模型进行训练，并得到预设训练模型。

进一步的，步骤S23中得到所述融合模型的步骤包括：

S231、根据图像增强处理后的鸟类图像对预设第一特征提取模型进行训练；

S232、根据图像增强处理后的鸟类图像对预设第二特征提取模型进行训练；

S233、将所述预设第一特征提取模型和所述预设第二特征提取模型根据预设算法得到所述预设加权融合模型。

进一步的，对预设加权融合模型进行训练的步骤包括：

A1、对ImageNet预训练的网络模型VGG和ResNet进行初始化，并屏蔽预训练的网络模型的权重；

A2、初始化权重、训练次数及权重增加步长；

A3、按照权重记录训练后训练集和验证集结果，通过权重增加步长不断调整两个特征提取模型的权重，直至完成训练，并将其中正确率最高的模型权重作为预设加权融合模型的最终权重。

进一步的，步骤S2中获得所述预设训练模型的步骤还包括：

S24、通过预设优化器对得到的所述预设训练模型进行算法优化。

本发明的目的还在于提供一种基于加权融合模型的鸟类分类***，包括：

图像获取模块，用于通过预设方式获取鸟类图像；

图像识别模块，用于将获取的鸟类图像经过预设训练模型进行鸟类识别，

图像分类模块，用于根据鸟类识别的结果＝将所述鸟类图像分入对应的类别中，得到鸟类分类结果。

进一步的，所述图像识别模块包括：

数据集获取单元，用于通过预设方式获取不同鸟类的图像，并建立数据集；

图像增强单元，用于将所述数据集中的鸟类图像进行图像增强处理；

训练单元，用于根据图像增强处理后的鸟类图像对预设加权融合模型进行训练，并得到预设训练模型。

进一步的，所述训练单元包括：

第一特征提取子单元，用于根据图像增强处理后的鸟类图像对预设第一特征提取模型进行训练；

第二特征提取子单元，用于根据图像增强处理后的鸟类图像对预设第二特征提取模型进行训练；

融合子单元，用于将所述预设第一特征提取模型和所述预设第二特征提取模型根据预设算法得到所述预设加权融合模型。

进一步的，所述图像识别模块还包括：

优化单元，用于通过预设优化器对得到的所述预设训练模型进行算法优化。

本发明与现有技术相比，至少包含以下有益效果：

(1)该融合模型使用VGG和ResNet网络模型分别对数据集进行训练，然后通过动态调整模型权重，来获取最优的分类效果；

(2)该融合模型相对于单一的模型，训练耗时短，收敛速度更快，预测效果更好；

(3)该融合模型中的模型权重可以动态调整，比常规的迁移学习更加灵活。

附图说明

图1是本发明实施例一的总体流程图；

图2是本发明实施例一中步骤S2的具体步骤流程图；

图3是本发明实施例一中步骤S23的具体步骤流程图；

图4是本发明实施例一中加权融合模型的示意图；

图5是本发明实施例一中加权融合模型训练过程的示意图；

图6是本发明实施例二的总体结构示意图；

图7是本发明实施例二中图像识别模块的结构示意图；

图8是本发明实施例二中训练单元的结构示意图。

具体实施方式

以下是本发明的具体实施例，并结合附图对本发明的技术方案作进一步的描述，但本发明并不限于这些实施例。

实施例一

如图1所示，本发明一种基于加权融合模型的鸟类分类方法，包括步骤：

S1、通过预设方式获取鸟类图像；

S2、将获取的鸟类图像经过预设训练模型进行鸟类识别；

其中，如图2所示，步骤S2中获得所述预设训练模型的步骤包括：

S21、通过预设方式获取不同鸟类的图像，并建立数据集；

本发明采用CUB-200-2011数据集，该数据集包含200种鸟类，比如黑脚信天翁、黑背信天翁、黄喉地莺等，该数据集是细粒度图像分类中极具代表性和挑战性的鸟类图像数据集。

本发明将该数据集分为训练数据集和测试数据集，训练数据集用于对融合模型进行训练，并通过测试数据集对训练后的融合模型进行测试，检验该融合模型的预测准确率。

S22、将所述数据集中的鸟类图像进行图像增强处理；

由于CUB-200-2011数据集比较小，容易出现过拟合现象，在训练前，将数据集采用随机水平翻转进行数据增强，并将图片大小调整为224*224。

进一步的，如图3和图4所示，步骤S23中得到所述融合模型的步骤包括：

S231、根据图像增强处理后的鸟类图像对VGG特征提取模型进行训练；

S232、根据图像增强处理后的鸟类图像对ResNet特征提取模型进行训练；

S233、将所述VGG特征提取模型和所述ResNet特征提取模型根据预设加权平均的模型融合算法得到所述预设加权融合模型。

本发明通过训练一个用于组合所有个体学习器的模型，即首先训练多个不同的个体学习器，然后再以这些个体学习器的输出作为输入来训练一个模型，从而得到一个最终的输出；

并且采用加权平均的模型融合策略，使用数据集分别在特征提取模型进行处理，然后分配权重x和y(其中x+y＝1)，然后在融合后的模型上添加全连接层作为分类器进行分类，从而得到鸟类识别的结果。

加权平均算法结合了直接平均法和加权投票法，与加权投票法不同的是加权平均算法中的权值不是用于类标，而是直接应用于实际的连续输出值。加权平均算法的权值可以在集成***生成期间作为训练的一部分获得，或者可以通过单独的训练来获得。

其中，特征提取模型选择ImageNet预训练好的VGG网络模型参数作为特征提取模型参数的初始值，并选择ResNet网络模型进行融合实现分类效果。

ResNet网络模型提出了残差学习的思想，传统的卷积网络或者全连接网络在信息传递的时候或多或少会存在信息丢失，损耗等问题，同时还有导致梯度消失或者梯度***，导致很深的网络无法训练。

ResNet网络模型在一定程度上解决了这个问题，通过直接将输入信息绕道传到输出，保护信息的完整性，整个网络只需要学习输入、输出差别的那一部分，简化学习目标和难度。

如图5所示，对预设加权融合模型进行训练具体过程为：首先，使用ImageNet预训练的网络模型VGG和ResNet进行初始化，并屏蔽预训练模型的权重，然后初始化权重、训练次数及权重增加步长，按照权重记录训练后训练集和验证集结果，通过权重增加步长不断调整两个特征提取模型的权重，记录每次的最优值，直至完成训练，并将其中最优的权重作为预设加权融合模型的最终权重。

优化器是提供了一个可以使用各种优化算法的接口，可以让用户直接调用一些经典的优化算法，不断对训练结果进行修正。常见的优化算法有Adam、RMSprop、BGD、SGD等，本发明选择Adam和SGD两种优化器进行对预设训练模型进行优化训练。

本发明使用VGG和ResNet152分别对数据集进行训练，然后通过动态调整模型权重，来获取最优的分类效果；该融合模型相对于单一的模型，训练耗时短，收敛速度更快，预测效果更好；模型权重可以动态调整，比常规的迁移学习更加灵活。

实施例二

如图6所示，一种基于加权融合模型的鸟类分类***，包括：

图像获取模块，用于通过预设方式获取鸟类图像；

进一步的，如图7所示，所述图像识别模块包括：

进一步的，如图7所示，所述训练单元包括：

第一特征提取子单元，用于根据图像增强处理后的鸟类图像对VGG特征提取模型进行训练；

第二特征提取子单元，用于根据图像增强处理后的鸟类图像对ResNet特征提取模型进行训练；

融合子单元，用于将所述VGG特征提取模型和所述ResNet特征提取模型根据预设加权平均的模型融合算法得到所述预设加权融合模型。

本***使用VGG和ResNet网络模型分别对数据集进行训练，然后通过动态调整模型权重，来获取最优的分类效果；该融合模型相对于单一的模型，训练耗时短，收敛速度更快，预测效果更好，并且模型权重可以动态调整，比常规的迁移学习更加灵活。

本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代，但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

Claims

1.一种基于加权融合模型的鸟类分类方法，其特征在于，包括步骤：

S1、通过预设方式获取鸟类图像；

S2、将获取的鸟类图像经过预设训练模型进行鸟类识别；

2.根据权利要求1所述的一种基于加权融合模型的鸟类分类方法，其特征在于，步骤S2中获得所述预设训练模型的步骤包括：

S21、通过预设方式获取不同鸟类的图像，并建立数据集；

S22、将所述数据集中的鸟类图像进行图像增强处理；

3.根据权利要求2所述的一种基于加权融合模型的鸟类分类方法，其特征在于，步骤S23中得到所述预设加权融合模型的步骤包括：

4.根据权利要求2所述的一种基于加权融合模型的鸟类分类方法，其特征在于，对预设加权融合模型进行训练的步骤包括：

A2、初始化权重、训练次数及权重增加步长；

5.根据权利要求2所述的一种基于加权融合模型的鸟类分类方法，其特征在于，步骤S2中获得所述预设训练模型的步骤还包括：

6.一种基于加权融合模型的鸟类分类***，其特征在于，包括：

图像获取模块，用于通过预设方式获取鸟类图像；

7.根据权利要求6所述的一种基于加权融合模型的鸟类分类***，其特征在于，所述图像识别模块包括：

8.根据权利要求7所述的一种基于加权融合模型的鸟类分类***，其特征在于，所述训练单元包括：

9.根据权利要求7所述的一种基于加权融合模型的鸟类分类***，其特征在于，所述图像识别模块还包括：