CN112101383B - 一种色偏图像识别方法 - Google Patents
一种色偏图像识别方法 Download PDFInfo
- Publication number
- CN112101383B CN112101383B CN202010969696.4A CN202010969696A CN112101383B CN 112101383 B CN112101383 B CN 112101383B CN 202010969696 A CN202010969696 A CN 202010969696A CN 112101383 B CN112101383 B CN 112101383B
- Authority
- CN
- China
- Prior art keywords
- channel
- color cast
- color
- picture
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Multimedia (AREA)
- Medical Informatics (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种色偏图像识别方法;采用神经网络模型对输入图像是否色偏图像进行识别,训练神经网络模型所用训练集采用正常图片集和在该正常图片集基础上生成的色偏图片集构建。本发明基于在该正常图片集基础上生成色偏图片集的方式,能够有效解决对色偏图片分类的数据集问题,实现对色偏图片的有效识别。
Description
技术领域
本发明涉及一种色偏图像识别方法。
背景技术
卷积神经网络仿照人类的大脑皮层结构,对输入数据进行分层处理,再层层叠加,挖掘数据中隐含的特征和规律,达到区分和识别的目的。在对数据进行分层处理的过程中,前面几层处理提取出图像轮廓色彩等浅层特征,后面层则侧重于提取更加抽象的特征。每层中包括数量不等的神经元,作为数据处理基本单元。层数越多,各层神经元数量越多,则深度学习网络携带的信息量越大,处理功能越强。在对数据进行叠加的过程中,把提取的特征叠加到一起,再应用softmax等相关的函数处理,得到分类向量。卷积神经网络的发展经历了LeNet5、AlexNet、VGG-Net、GoogLeNet、Inception系列的发展,网络深度由浅入深、神经元数量由少到多、功能从简单到复杂的过程。
卷积神经网络目前已经取得十足的进展,但是色偏图片分类尚存在一些亟待解决的问题。首先,图片训练集和验证集是机器训练中必不可少的要素。然而,目前尚无针对色偏图片区分的图片训练集和测试集,使得进一步的机器学习工作无法开展。
发明内容
为解决上述技术问题,本发明提供了一种色偏图像识别方法,该色偏图像识别方法基于在该正常图片集基础上生成色偏图片集的方式,能够有效解决对色偏图片分类的数据集问题,实现对色偏图片的有效识别。
本发明通过以下技术方案得以实现。
本发明提供的一种色偏图像识别方法;采用神经网络模型对输入图像是否色偏图像进行识别,训练神经网络模型所用训练集采用正常图片集和在该正常图片集基础上生成的色偏图片集构建。
所述色偏图片集采用在正常图片集基础上,由随机数选择颜色通道,然后对所选颜色通道进行随机偏移得到。
所述随机数范围为1~6,其中1~3代表选取单一颜色通道,4~6代表选取两个颜色组合通道。
所述神经网络模型采用VGG16算法。
所述神经网络模型通过VGG16预训练模型进行迁移学习得到。
所述神经网络模型在VGG16预训练模型基础上,添加Dropout层;Dropout层比例为0.6。
所述神经网络模型采用分段衰减的学习率进行训练。
本发明的有益效果在于:基于在该正常图片集基础上生成色偏图片集的方式,能够有效解决对色偏图片分类的数据集问题,实现对色偏图片的有效识别。
具体实施方式
下面进一步描述本发明的技术方案,但要求保护的范围并不局限于所述。
本发明提供一种色偏图像识别方法;采用神经网络模型对输入图像是否色偏图像进行识别,训练神经网络模型所用训练集采用正常图片集和在该正常图片集基础上生成的色偏图片集构建。
色偏图片集采用在正常图片集基础上,由随机数选择颜色通道,然后对所选颜色通道进行随机偏移得到。
随机数范围为1~6,其中1~3代表选取单一颜色通道,4~6代表选取两个颜色组合通道。
所述神经网络模型采用VGG16算法。
所述神经网络模型通过VGG16预训练模型进行迁移学习得到。
所述神经网络模型在VGG16预训练模型基础上,添加Dropout层;Dropout层比例为0.6。
所述神经网络模型采用分段衰减的学习率进行训练。
实施例1
构建训练集:构建色偏图片训练集和验证集
(1)拷贝正常图片集
在网上下载Pascal VOC2012图片集(也可以下载其它图片集,建议图片数量在5000以上),将其中的JPEGImages文件夹复制到文件夹0,作为图片训练集的正常图片集,该文件夹有17125张图片。
(2)生成色偏图片集
将文件夹0中的所有图片逐一取出,将一张正常无色偏的图片,经过下列①-③步骤进行处理,生成对应的色偏图片,并将处理所得图片存放到文件夹1,文件夹1将生成17125张色偏图片,与文件夹0对应,共同构成色偏图片训练集。取其中的部分图片作为验验证集,建议每类取500张左右。
(3)设置起点和步长
对于任意一张正常的输入图片,设置灰阶改变起点为start=16,步长step=2。
(4)产生通道选择随机数和偏移随机数
产生通道选择随机整数n1,范围1-6,产生灰阶偏移随机整数n2、n3,范围0-100。其中,n1决定选取哪个通道进行色偏处理,在本发明设置6种通道选取模式。
(5)根据随机数产生色偏图片
上述两个步骤已完成色偏起点和步长的设置,以及随机数的产生。此步将根据通道选择随机数确定进行色偏污染的通道,n1为1-6,分别对应的是R通道、G通道、B通道、RG组合通道、RB组合通道和GB组合通道。
接着根据偏移随机数确定灰阶改变量,公式如下:
其中,r、g、b分别代表原灰阶,r_、g_、b_分别代表处理后的灰阶。n1为1时只改变R通道,n1为2时只改变G通道,n1为3时只改变B通道,n1为4时改变R通道和G通道,n1为5时改变R通道和B通道,n1为6时改变G通道和B通道。改变量根据上述公式由随机数n2和n3决定。因此,通道的选择随机,改变量的值随机。
模型训练:深度卷积神经网络模型训练
本步骤的目的是对图片训练集和验证集进行训练,优化各层的参数,得到一个高精度的分类器,实现正常图片和色偏图片的准确区分。本发明基于开源的vgg16模型进行搭建,导入开源的xxx.h5权重文件进行迁移学习,添加Dropout层,设置学习率分段衰减,训练100个周期即可得到分类器。
①添加Dropout层
Dropout的作用就是按照一定的比例丢弃掉部分参数,使得参数和样本匹配,防止过拟合现象。本发明在原模型的基础上,按照0.6的比例设置了Dropout层。
②设置分段学习率衰减
在原vgg16模型的基础上,设置了学习率分段衰减,根据各次机器学习实验,总结得到各个节点学习率的值。本次训练100个周期,每10个周期更新学习率,公式如下:
其中,LR代表学习率,epoch代表训练周期。
实施效果
采用上述具体实施方式的流程,导入训练集和验证集,启动设置好的vgg16卷积神经网络模型,训练100个周期,得到分类器文件。采用本发明的方案,经过对549张正常图片,576张色偏图片进行测试,识别正常图片的准确度为0.979964,识别色偏图片的准确度为0.843750。对库外的图片进行识别,识别300张正常图片的准确率为0.87,识别300张色偏图片的准确率为0.910000。经验证,所得分类器对正常图片和色偏图片的区分度较高。
Claims (7)
1.一种色偏图像识别方法,其特征在于:采用神经网络模型对输入图像是否色偏图像进行识别,训练神经网络模型所用训练集采用正常图片集和在该正常图片集基础上生成的色偏图片集构建,生成色偏图片集的具体步骤如下:
将一张正常无色偏的图片,经过下列①-③步骤进行处理,生成对应的色偏图片,并将处理所得图片存放到文件夹1,文件夹1将生成17125张色偏图片,与文件夹0对应,共同构成色偏图片训练集;
①设置起点和步长
对于任意一张正常的输入图片,设置灰阶改变起点为start=16,步长step=2;
②产生通道选择随机数和偏移随机数
产生通道选择随机整数n1,范围1-6,产生灰阶偏移随机整数n2、n3,范围0-100;
③根据随机数产生色偏图片
上述两个步骤已完成色偏起点和步长的设置,以及随机数的产生,此步将根据通道选择随机数确定进行色偏污染的通道,n1为1-6,分别对应的是R通道、G通道、B通道、RG组合通道、RB组合通道和GB组合通道;接着根据偏移随机数确定灰阶改变量,公式如下:
其中,r、g、b分别代表原灰阶,r_、g_、b_分别代表处理后的灰阶,n1为1时只改变R通道,n1为2时只改变G通道,n1为3时只改变B通道,n1为4时改变R通道和G通道,n1为5时改变R通道和B通道,n1为6时改变G通道和B通道;
改变量根据上述公式由随机数n2和n3决定,通道的选择随机,改变量的值随机。
2.如权利要求1所述的色偏图像识别方法,其特征在于:所述色偏图片集采用在正常图片集基础上,由随机数选择颜色通道,然后对所选颜色通道进行随机偏移得到。
3.如权利要求2所述的色偏图像识别方法,其特征在于:所述随机数范围为1~6,其中1~3代表选取单一颜色通道,4~6代表选取两个颜色组合通道。
4.如权利要求1所述的色偏图像识别方法,其特征在于:所述神经网络模型采用VGG16算法。
5.如权利要求1所述的色偏图像识别方法,其特征在于:所述神经网络模型通过VGG16预训练模型进行迁移学习得到。
6.如权利要求5所述的色偏图像识别方法,其特征在于:所述神经网络模型在VGG16预训练模型基础上,添加Dropout层;Dropout层比例为0.6。
7.如权利要求1所述的色偏图像识别方法,其特征在于:所述神经网络模型采用分段衰减的学习率进行训练。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010969696.4A CN112101383B (zh) | 2020-09-15 | 2020-09-15 | 一种色偏图像识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010969696.4A CN112101383B (zh) | 2020-09-15 | 2020-09-15 | 一种色偏图像识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112101383A CN112101383A (zh) | 2020-12-18 |
CN112101383B true CN112101383B (zh) | 2022-10-21 |
Family
ID=73759315
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010969696.4A Active CN112101383B (zh) | 2020-09-15 | 2020-09-15 | 一种色偏图像识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112101383B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102750713A (zh) * | 2012-07-18 | 2012-10-24 | 山东神思电子技术股份有限公司 | 一种图像偏色检测方法 |
CN105096265A (zh) * | 2015-06-04 | 2015-11-25 | 杭州中威电子股份有限公司 | 一种基于直方图特征的色偏分类处理方法 |
CN106709511A (zh) * | 2016-12-08 | 2017-05-24 | 华中师范大学 | 基于深度学习的城市轨道交通全景监控视频故障检测方法 |
CN109460738A (zh) * | 2018-11-14 | 2019-03-12 | 吉林大学 | 一种基于无损失函数的深度卷积神经网络的路面类型估算方法 |
CN110400275A (zh) * | 2019-07-22 | 2019-11-01 | 中电健康云科技有限公司 | 一种基于全卷积神经网络和特征金字塔的颜色校正方法 |
CN110751699A (zh) * | 2019-10-15 | 2020-02-04 | 西安电子科技大学 | 基于卷积神经网络的光学遥感图像的色彩重建方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ITTO20011080A1 (it) * | 2001-11-19 | 2003-05-19 | Olivetti Tecnost Spa | ,,metodo e dispositivo per la determinazione di una dominante cromatica in un'immagine,, |
CN104601971B (zh) * | 2014-12-31 | 2019-06-14 | 小米科技有限责任公司 | 色彩调整方法及装置 |
US10318848B2 (en) * | 2015-12-15 | 2019-06-11 | Qualcomm Incorporated | Methods for object localization and image classification |
-
2020
- 2020-09-15 CN CN202010969696.4A patent/CN112101383B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102750713A (zh) * | 2012-07-18 | 2012-10-24 | 山东神思电子技术股份有限公司 | 一种图像偏色检测方法 |
CN105096265A (zh) * | 2015-06-04 | 2015-11-25 | 杭州中威电子股份有限公司 | 一种基于直方图特征的色偏分类处理方法 |
CN106709511A (zh) * | 2016-12-08 | 2017-05-24 | 华中师范大学 | 基于深度学习的城市轨道交通全景监控视频故障检测方法 |
CN109460738A (zh) * | 2018-11-14 | 2019-03-12 | 吉林大学 | 一种基于无损失函数的深度卷积神经网络的路面类型估算方法 |
CN110400275A (zh) * | 2019-07-22 | 2019-11-01 | 中电健康云科技有限公司 | 一种基于全卷积神经网络和特征金字塔的颜色校正方法 |
CN110751699A (zh) * | 2019-10-15 | 2020-02-04 | 西安电子科技大学 | 基于卷积神经网络的光学遥感图像的色彩重建方法 |
Non-Patent Citations (3)
Title |
---|
基于CNN回归网络的遥感图像颜色自动校正;杜尚尚,等;《计算机与现代化》;20171215(第12期);第28-32页 * |
基于机器学习的图像偏色检测;马成前,等;《计算机应用与软件》;20180315;第35卷(第03期);第199-204页 * |
结合深度卷积神经网络的智能白平衡研究;黄成强;《光电子·激光》;20201215;第31卷(第12期);第1278-1287页 * |
Also Published As
Publication number | Publication date |
---|---|
CN112101383A (zh) | 2020-12-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111563841B (zh) | 一种基于生成对抗网络的高分辨率图像生成方法 | |
CN109447906B (zh) | 一种基于生成对抗网络的图片合成方法 | |
CN108711138B (zh) | 一种基于生成对抗网络的灰度图片彩色化方法 | |
Rombach et al. | Text-guided synthesis of artistic images with retrieval-augmented diffusion models | |
CN107832725A (zh) | 基于评价指标的视频封面提取方法及装置 | |
Yang et al. | A blind stereoscopic image quality evaluator with segmented stacked autoencoders considering the whole visual perception route | |
CN107918656A (zh) | 基于视频标题的视频封面提取方法及装置 | |
CN108765512B (zh) | 一种基于多层级特征的对抗图像生成方法 | |
CN109712165A (zh) | 一种基于卷积神经网络的同类前景图像集分割方法 | |
CN113870371A (zh) | 基于生成对抗网络的图片颜色变换装置、方法和存储介质 | |
CN112784790B (zh) | 一种基于元学习的泛化性伪造脸检测方法 | |
Liu et al. | Texture-aware emotional color transfer between images | |
CN114581356B (zh) | 基于风格迁移数据增广的图像增强模型泛化方法 | |
CN109214407A (zh) | 事件检测模型、方法、装置、计算设备及存储介质 | |
CN111914617B (zh) | 一种基于平衡栈式生成式对抗网络的人脸属性编辑方法 | |
CN113724354A (zh) | 基于参考图颜色风格的灰度图像着色方法 | |
CN108549654A (zh) | 一种基于图像处理的大数据分析方法 | |
CN108259893A (zh) | 基于双流卷积神经网络的虚拟现实视频质量评价方法 | |
CN113822160B (zh) | 深度伪造检测模型的评测方法、***及设备 | |
CN112101383B (zh) | 一种色偏图像识别方法 | |
CN107767367A (zh) | 一种针对hdr图的无参考质量客观评价方法 | |
CN113609944A (zh) | 一种静默活体检测方法 | |
CN115018729B (zh) | 一种面向内容的白盒图像增强方法 | |
CN114529484B (zh) | 针对成像中直流分量变化的深度学习样本增强方法 | |
Zhao et al. | Making generated images hard to spot: a transferable attack on synthetic image detectors |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |