CN112101383B

CN112101383B - 一种色偏图像识别方法

Info

Publication number: CN112101383B
Application number: CN202010969696.4A
Authority: CN
Inventors: 黄成强
Original assignee: Zunyi Normal University
Current assignee: Zunyi Normal University
Priority date: 2020-09-15
Filing date: 2020-09-15
Publication date: 2022-10-21
Anticipated expiration: 2040-09-15
Also published as: CN112101383A

Abstract

本发明提供了一种色偏图像识别方法；采用神经网络模型对输入图像是否色偏图像进行识别，训练神经网络模型所用训练集采用正常图片集和在该正常图片集基础上生成的色偏图片集构建。本发明基于在该正常图片集基础上生成色偏图片集的方式，能够有效解决对色偏图片分类的数据集问题，实现对色偏图片的有效识别。

Description

一种色偏图像识别方法

技术领域

本发明涉及一种色偏图像识别方法。

背景技术

卷积神经网络仿照人类的大脑皮层结构，对输入数据进行分层处理，再层层叠加，挖掘数据中隐含的特征和规律，达到区分和识别的目的。在对数据进行分层处理的过程中，前面几层处理提取出图像轮廓色彩等浅层特征，后面层则侧重于提取更加抽象的特征。每层中包括数量不等的神经元，作为数据处理基本单元。层数越多，各层神经元数量越多，则深度学习网络携带的信息量越大，处理功能越强。在对数据进行叠加的过程中，把提取的特征叠加到一起，再应用softmax等相关的函数处理，得到分类向量。卷积神经网络的发展经历了LeNet5、AlexNet、VGG-Net、GoogLeNet、Inception系列的发展，网络深度由浅入深、神经元数量由少到多、功能从简单到复杂的过程。

卷积神经网络目前已经取得十足的进展，但是色偏图片分类尚存在一些亟待解决的问题。首先，图片训练集和验证集是机器训练中必不可少的要素。然而，目前尚无针对色偏图片区分的图片训练集和测试集，使得进一步的机器学习工作无法开展。

发明内容

为解决上述技术问题，本发明提供了一种色偏图像识别方法，该色偏图像识别方法基于在该正常图片集基础上生成色偏图片集的方式，能够有效解决对色偏图片分类的数据集问题，实现对色偏图片的有效识别。

本发明通过以下技术方案得以实现。

本发明提供的一种色偏图像识别方法；采用神经网络模型对输入图像是否色偏图像进行识别，训练神经网络模型所用训练集采用正常图片集和在该正常图片集基础上生成的色偏图片集构建。

所述色偏图片集采用在正常图片集基础上，由随机数选择颜色通道，然后对所选颜色通道进行随机偏移得到。

所述随机数范围为1～6，其中1～3代表选取单一颜色通道，4～6代表选取两个颜色组合通道。

所述神经网络模型采用VGG16算法。

所述神经网络模型通过VGG16预训练模型进行迁移学习得到。

所述神经网络模型在VGG16预训练模型基础上，添加Dropout层；Dropout层比例为0.6。

所述神经网络模型采用分段衰减的学习率进行训练。

本发明的有益效果在于：基于在该正常图片集基础上生成色偏图片集的方式，能够有效解决对色偏图片分类的数据集问题，实现对色偏图片的有效识别。

具体实施方式

下面进一步描述本发明的技术方案，但要求保护的范围并不局限于所述。

本发明提供一种色偏图像识别方法；采用神经网络模型对输入图像是否色偏图像进行识别，训练神经网络模型所用训练集采用正常图片集和在该正常图片集基础上生成的色偏图片集构建。

色偏图片集采用在正常图片集基础上，由随机数选择颜色通道，然后对所选颜色通道进行随机偏移得到。

随机数范围为1～6，其中1～3代表选取单一颜色通道，4～6代表选取两个颜色组合通道。

所述神经网络模型采用VGG16算法。

所述神经网络模型通过VGG16预训练模型进行迁移学习得到。

所述神经网络模型采用分段衰减的学习率进行训练。

实施例1

构建训练集：构建色偏图片训练集和验证集

(1)拷贝正常图片集

在网上下载Pascal VOC2012图片集(也可以下载其它图片集，建议图片数量在5000以上)，将其中的JPEGImages文件夹复制到文件夹0，作为图片训练集的正常图片集，该文件夹有17125张图片。

(2)生成色偏图片集

将文件夹0中的所有图片逐一取出，将一张正常无色偏的图片，经过下列①-③步骤进行处理，生成对应的色偏图片，并将处理所得图片存放到文件夹1，文件夹1将生成17125张色偏图片，与文件夹0对应，共同构成色偏图片训练集。取其中的部分图片作为验验证集，建议每类取500张左右。

(3)设置起点和步长

对于任意一张正常的输入图片，设置灰阶改变起点为start＝16，步长step＝2。

(4)产生通道选择随机数和偏移随机数

产生通道选择随机整数n1，范围1-6，产生灰阶偏移随机整数n2、n3，范围0-100。其中，n1决定选取哪个通道进行色偏处理，在本发明设置6种通道选取模式。

(5)根据随机数产生色偏图片

上述两个步骤已完成色偏起点和步长的设置，以及随机数的产生。此步将根据通道选择随机数确定进行色偏污染的通道，n1为1-6，分别对应的是R通道、G通道、B通道、RG组合通道、RB组合通道和GB组合通道。

接着根据偏移随机数确定灰阶改变量，公式如下：

其中，r、g、b分别代表原灰阶，r_、g_、b_分别代表处理后的灰阶。n1为1时只改变R通道，n1为2时只改变G通道，n1为3时只改变B通道，n1为4时改变R通道和G通道，n1为5时改变R通道和B通道，n1为6时改变G通道和B通道。改变量根据上述公式由随机数n2和n3决定。因此，通道的选择随机，改变量的值随机。

模型训练：深度卷积神经网络模型训练

本步骤的目的是对图片训练集和验证集进行训练，优化各层的参数，得到一个高精度的分类器，实现正常图片和色偏图片的准确区分。本发明基于开源的vgg16模型进行搭建，导入开源的xxx.h5权重文件进行迁移学习，添加Dropout层，设置学习率分段衰减，训练100个周期即可得到分类器。

①添加Dropout层

Dropout的作用就是按照一定的比例丢弃掉部分参数，使得参数和样本匹配，防止过拟合现象。本发明在原模型的基础上，按照0.6的比例设置了Dropout层。

②设置分段学习率衰减

在原vgg16模型的基础上，设置了学习率分段衰减，根据各次机器学习实验，总结得到各个节点学习率的值。本次训练100个周期，每10个周期更新学习率，公式如下：

其中，LR代表学习率，epoch代表训练周期。

实施效果

采用上述具体实施方式的流程，导入训练集和验证集，启动设置好的vgg16卷积神经网络模型，训练100个周期，得到分类器文件。采用本发明的方案，经过对549张正常图片，576张色偏图片进行测试，识别正常图片的准确度为0.979964，识别色偏图片的准确度为0.843750。对库外的图片进行识别，识别300张正常图片的准确率为0.87，识别300张色偏图片的准确率为0.910000。经验证，所得分类器对正常图片和色偏图片的区分度较高。

Claims

1.一种色偏图像识别方法，其特征在于：采用神经网络模型对输入图像是否色偏图像进行识别，训练神经网络模型所用训练集采用正常图片集和在该正常图片集基础上生成的色偏图片集构建，生成色偏图片集的具体步骤如下：

将一张正常无色偏的图片，经过下列①-③步骤进行处理，生成对应的色偏图片，并将处理所得图片存放到文件夹1，文件夹1将生成17125张色偏图片，与文件夹0对应，共同构成色偏图片训练集；

①设置起点和步长

对于任意一张正常的输入图片，设置灰阶改变起点为start＝16，步长step＝2；

②产生通道选择随机数和偏移随机数

产生通道选择随机整数n1，范围1-6，产生灰阶偏移随机整数n2、n3，范围0-100；

③根据随机数产生色偏图片

上述两个步骤已完成色偏起点和步长的设置，以及随机数的产生，此步将根据通道选择随机数确定进行色偏污染的通道，n1为1-6，分别对应的是R通道、G通道、B通道、RG组合通道、RB组合通道和GB组合通道；接着根据偏移随机数确定灰阶改变量，公式如下：

其中，r、g、b分别代表原灰阶，r_、g_、b_分别代表处理后的灰阶，n1为1时只改变R通道，n1为2时只改变G通道，n1为3时只改变B通道，n1为4时改变R通道和G通道，n1为5时改变R通道和B通道，n1为6时改变G通道和B通道；

改变量根据上述公式由随机数n2和n3决定，通道的选择随机，改变量的值随机。

2.如权利要求1所述的色偏图像识别方法，其特征在于：所述色偏图片集采用在正常图片集基础上，由随机数选择颜色通道，然后对所选颜色通道进行随机偏移得到。

3.如权利要求2所述的色偏图像识别方法，其特征在于：所述随机数范围为1～6，其中1～3代表选取单一颜色通道，4～6代表选取两个颜色组合通道。

4.如权利要求1所述的色偏图像识别方法，其特征在于：所述神经网络模型采用VGG16算法。

5.如权利要求1所述的色偏图像识别方法，其特征在于：所述神经网络模型通过VGG16预训练模型进行迁移学习得到。

6.如权利要求5所述的色偏图像识别方法，其特征在于：所述神经网络模型在VGG16预训练模型基础上，添加Dropout层；Dropout层比例为0.6。

7.如权利要求1所述的色偏图像识别方法，其特征在于：所述神经网络模型采用分段衰减的学习率进行训练。