CN104091340A - 一种模糊图像的快速检测方法 - Google Patents

一种模糊图像的快速检测方法 Download PDF

Info

Publication number
CN104091340A
CN104091340A CN201410344777.XA CN201410344777A CN104091340A CN 104091340 A CN104091340 A CN 104091340A CN 201410344777 A CN201410344777 A CN 201410344777A CN 104091340 A CN104091340 A CN 104091340A
Authority
CN
China
Prior art keywords
image
detected
size
complex data
clear
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410344777.XA
Other languages
English (en)
Inventor
张伟
曾志勇
傅松林
许清泉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Meitu Technology Co Ltd
Original Assignee
Xiamen Meitu Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Meitu Technology Co Ltd filed Critical Xiamen Meitu Technology Co Ltd
Priority to CN201410344777.XA priority Critical patent/CN104091340A/zh
Publication of CN104091340A publication Critical patent/CN104091340A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种模糊图像的快速检测方法,其收集样本图像,并对每个样本图像的RGB三个通道分别进行快速傅里叶变换,然后对得到变换后的复数数据进行尺寸缩小处理,并用尺寸缩小后的复数数据构建新图像,并将所得到的新构建的缩小图像作为卷积神经网络的输入图像,进行清晰-模糊图像分类训练,得到模糊检测模型,最后并对待检测图像进行RGB三个通道的快速傅里叶变换,对变换得到的复数数据进行尺寸缩小处理,并用尺寸缩小后的复数数据构建新的待检测图像,然后采用所述模糊检测模型对所述的新的待检测图像进行清晰-模糊图像的判别,从而有效的减少计算量,加快检测速度,同时特别适用于大尺寸图像的快速模糊检测,提高检测的准确率。

Description

一种模糊图像的快速检测方法
技术领域
本发明涉及一种图像处理方法,特别是一种模糊图像的快速检测方法。
背景技术
数字图像处理已经成为信息科学、生物学、医学等诸多领域的基础研究对象。随着信息时代的到来,数字图像处理在计算机视觉、机器学习、人工智能等领域都得到广泛的应用,其重要性日益凸显。令人遗憾的是,在数字图像的采集过程中,采集设备在快门开启的瞬间会产生不可避免的轻微抖动,这种抖动往往使我们最终只能得到一张细节模糊的图像,尤其是在光照条件不理想的情况下,较长的快门时间使得图像的模糊程度更加剧烈。这样的模糊图像给人眼视觉带来了很大的困扰,同时也丢失了大量的细节信息,是无法应用于日常生活和科研活动中的。现有的图像模糊检测方法大体上可以分为两类:一类给出整幅图像的模糊程度的估计,另一类将图像划分为若干个区域,对各个区域分别给出模糊程度的估计,但大都计算方法比较复杂,运算量较大,处理速度慢。
发明内容
本发明为解决上述问题,提供了一种模糊图像的快速检测方法,检测结果更加快速准确。
为实现上述目的,本发明采用的技术方案为:
一种模糊图像的快速检测方法,其特征在于,包括以下步骤:
10.收集样本图像,并对每个样本图像的RGB三个通道分别进行快速傅里叶变换,得到变换后的复数数据;
20.对所述的复数数据进行尺寸缩小处理,并用尺寸缩小后的复数数据构建新图像,得到缩小图像;
30.将所述的新构建的缩小图像作为卷积神经网络的输入图像,进行清晰-模糊图像分类训练,得到模糊检测模型;
40.获取待检测图像,并对待检测图像进行RGB三个通道的快速傅里叶变换,对变换得到的复数数据进行尺寸缩小处理,并用尺寸缩小后的复数数据构建新的待检测图像,然后采用所述模糊检测模型对所述的新的待检测图像进行清晰-模糊图像的判别。
优选的,所述的步骤40中采用所述模糊检测模型对所述的新的待检测图像进行清晰-模糊图像的判别,主要是将转换后构建的新的待检测图像块放入卷积神经网络***中,然后根据所述的模糊检测模型进行计算该新的待检测图像为清晰图像或模糊图像的概率,并选择概率较大的图像类型作为所述的待检测图像的清晰-模糊类型。
本发明的有益效果是:
本发明的一种模糊图像的快速检测方法,其通过收集样本图像,并对每个样本图像的RGB三个通道分别进行快速傅里叶变换,然后对得到变换后的复数数据进行尺寸缩小处理,并用尺寸缩小后的复数数据构建新图像,并将所得到的新构建的缩小图像作为卷积神经网络的输入图像,进行清晰-模糊图像分类训练,得到模糊检测模型,最后并对待检测图像进行RGB三个通道的快速傅里叶变换,对变换得到的复数数据进行尺寸缩小处理,并用尺寸缩小后的复数数据构建新的待检测图像,然后采用所述模糊检测模型对所述的新的待检测图像进行清晰-模糊图像的判别,从而有效的减少计算量,加快检测速度,同时特别适用于大尺寸图像的快速模糊检测,提高检测的准确率。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明一种模糊图像的快速检测方法的流程简图;
图2为用于说明本发明效果的待检测图像;
图3为图2经快速傅里叶变换后的复数数据。
具体实施方式
为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚、明白,以下结合附图及实施例对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
如图1所示,本发明的一种模糊图像的快速检测方法,其包括以下步骤:
10.收集样本图像,并对每个样本图像的RGB三个通道分别进行快速傅里叶变换,得到变换后的复数数据;
20.对所述的复数数据进行尺寸缩小处理,并尺寸缩小后的复数数据构建新图像,得到缩小图像;
30.将所述的新构建的缩小图像作为卷积神经网络的输入图像,进行清晰-模糊图像分类训练,得到模糊检测模型;
40.获取待检测图像(如图2),并对待检测图像进行RGB三个通道的快速傅里叶变换,对变换得到的复数数据(如图3)进行尺寸缩小处理,并用尺寸缩小后的复数数据构建新的待检测图像,然后采用所述模糊检测模型对所述的新的待检测图像进行清晰-模糊图像的判别。
所述的步骤40中采用所述模糊检测模型对所述的新的待检测图像进行清晰-模糊图像的判别,主要是将转换后构建的新的待检测图像块放入卷积神经网络***中,然后根据所述的模糊检测模型进行计算该新的待检测图像为清晰图像或模糊图像的概率,并选择概率较大的图像类型作为所述的待检测图像的清晰-模糊类型。
所述的步骤30中将所述的新构建的缩小图像作为卷积神经网络的输入图像,进行清晰-模糊图像分类训练,主要是对新构建的缩小图像进行人工分类,并输入卷积神经网络进行分类测试,并且,将分类测试中分类错误的缩小图像收集起来重新进行人工标注,即进行调整网络结构,再将重新人工分类后的缩小图像再次进行训练学习,如此重复“训练->调整网络结构->再训练”的过程直到分类正确为止。
本实施例中网格结构顺序为输入层->K个小组层->全连接层->SoftMax层,其中K大于等于1;小组层包括卷积层、激活层、下采样层、归一化层;卷积层、激活层、下采样层、归一化层中每个层的核大小以及输出大小都是可以进行任意调节的,并且每个层都有一个输入且产生一个输出,每一层的输出作为下一层的输入。
其中,输入层的输入大小为Height x Weight x Channel,其中Weight、Height为输入层图像的宽和高,Channel为输入层图像的颜色通道;由于本发明使用GPU硬件实现的原因,Weight=Height;输入图像的channel只能为1或者3。
卷积层:
1)核的大小必须是奇数,且不大于该层输入的宽或者高;
2)中间表示通过卷积层时不改变宽和高,通道数可变可不变;理论上可以为任意正整数,由于本发明使用GPU硬件实现的原因,这里为16的倍数。
激活层:
1)激活层不改变卷积层表示的宽、高或者通道数;
2)激活层所使用的激活函数包括但不限于以下函数类型:
f(x)=1/(1+e-x)
f(x)=a*tanh(b*x),a,b为任意非零实数
f(x)=max(0,x)
f(x)=min(a,max(0,x))
f(x)=log(1+ex)
f(x)=|x|
f(x)=x2
f ( x ) = x
f(x)=ax+b
3)激活层跟在卷积层或者全连接之后。
下采样层:
1)下采样层不改变中间表示的通道数;
2)下采样层对图像的缩小比即为核的大小:即核为m x n的下采样层会造成中间表示缩小为上一层的(1/m)x(1/n),理论上m和n可为任意自然数,由于本发明使用GPU硬件实现的原因,m=n。例如,15x15x32通过3x3的下采样后,变成5x5x32;15x15x32通过5x5的下采样后,变成3x3x32;但是15x15x32不能进行2x2的下采样,因为15不能被2整除;并不是说,输入尺寸必须是2的次幂,即16、32、64等,输入尺寸只要保证能被所有下采样层采样即可。
归一化层:
1)归一化层不改变中间表示的任何尺寸;
2)归一化层不是必须的,可要可不要,添加归一化层通常会提高精度并增加计算量;是否添加归一化层,要看添加后实际提升的精度和损失的速度。
一般的组合是:卷积->激活->下采样->归一化。
以下情况特殊:
1)添加归一化层对精度提升较小却增大了很多运算量时,取消归一化层,即采用以下组合:卷积->激活->下采样;
2)归一化层提前,效果基本相同,即采用以下组合:卷积->激活->归一化->下采样。
3)取消下采样层:卷积->激活;或者卷积->激活->归一化;下采样本质是为了增加鲁棒性,同时顺便有减少后续层的运算量的作用;一个网络中通常会有几层下采样,但并不是所有的“卷积->激活”后面都要跟下采样。
全连接层:
1)通过全连接层后的中间表示会变成1维的,不再是3维的;
2)全连接的输出可以任意;
3)一旦进过全连接,就无法进行卷积、下采样或归一化;
4)全连接后面可以接激活层,或者继续接全连接。
SoftMax层:
接在全连接层之后,作用是把全连接产生的实值变成[0,1]之间的概率。
本发明最后使用的网络结构如表1所示。
表1卷积神经网络结构
层数 类型 核大小 输出大小 注解
1 输入层 32x32x3
2 卷积层 5x5 32x32x32
3 激活层 32x32x32
4 下采样层 2x2 16x16x32 f(x)=max(0,x)
5 归一化层 16x16x32 使用局部归一化
6 卷积层 5x5 16x16x16
7 激活层 16x16x16
8 下采样层 2x2 8x8x16 f(x)=max(0,x)
9 归一化层 8x8x16 使用局部归一化
10 全连接层 2个数据
11 SoftMax层 2个数据
所述的快速傅立叶变换(Fast Fouier Transform),简称FFT,它是离散傅里叶变换的快速算法,也可用于计算离散傅里叶变换的逆变换。快速傅里叶变换有广泛的应用,如数字信号处理、计算大整数乘法、求解偏微分方程等等。FFT算法设计的基本思想,就是充分利用DFT的周期性和对称性,减少重复的计算量;并把N点长序列分成几个短序列,减少每个序列长度,可大大减少计算量。实践中使用最多的FFT是“基2”算法。所谓“基2”,就是令DFT的点数N满足N=2M(M为自然数)。FFT基2算法分为时域抽取法(Decimation In Time)和频域抽取法(Decimation In Frequency)两大类。快速傅里叶变换(FFT)大大降低了数字信号处理中的运算量,它的价值在于节省了CPU的处理时间,使得更多更复杂的数字信号得以快速的处理,为实现信息的实时处理开辟了广阔的发展前景。
本发明提供了一种结合快速傅里叶变换和卷积神经网络的模糊检测方法,其将傅里叶变换并尺寸缩小后的数据作为卷积神经网络(CNN)的输入数据。用于模糊检测模型训练的数据集包含有清晰-模糊两类数据,用卷积神经网络进行分类训练后,得到学习训练的参数,此参数模型作为模糊检测模型。其中,用于模糊检测模型训练学习的输入数据不是原始图像RGB三个通道的数据,而采用RGB三个通道分别经过快速傅里叶变换后的数据,图像数据尺寸的缩小是在原始图像数据经过快速傅里叶变换后进行,模糊检测模型训练学习采用的是卷积神经网络CNN的GPU加速版,待检测的图像需要对RGB三个通道分别做快速傅里叶变换,然后再缩小变换后的复数数据尺寸,用尺寸缩小后的复数数据构建新的待检测图像,使用模糊检测模型进行清晰-模糊判别。
使用CNN进行模糊检测模型训练十分耗时,将原始图像缩到较小尺寸进行训练可以减少计算量。然而,对原始图像直接进行缩小是高斯变换和下采样的过程,在此过程中损失了高频信息,原本清晰的图片在模糊检测过程中会被误判为模糊图片。因此,本发明使用傅里叶变换,将原始图像数据转为频域空间内的数据,使得模糊检测过程中所需的图像高低频信息得意保留。对图像进行傅里叶变换是个计算量庞大的过程,由于傅里叶变换的周期性,可以采用快速傅里叶变换(FFT)加快此计算过程,特别适用于对大尺寸的图像进行快速的模糊检测,提高检测准确率。
上述说明示出并描述了本发明的优选实施例,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。

Claims (2)

1.一种模糊图像的快速检测方法,其特征在于,包括以下步骤:
10.收集样本图像,并对每个样本图像的RGB三个通道分别进行快速傅里叶变换,得到变换后的复数数据;
20.对所述的复数数据进行尺寸缩小处理,并用尺寸缩小后的复数数据构建新图像,得到缩小图像;
30.将所述的新构建的缩小图像作为卷积神经网络的输入图像,进行清晰-模糊图像分类训练,得到模糊检测模型;
40.获取待检测图像,并对待检测图像进行RGB三个通道的快速傅里叶变换,对变换得到的复数数据进行尺寸缩小处理,并用尺寸缩小后的复数数据构建新的待检测图像,然后采用所述模糊检测模型对所述的新的待检测图像进行清晰-模糊图像的判别。
2.根据权利要求1所述的一种模糊图像的快速检测方法,其特征在于:所述的步骤40中采用所述模糊检测模型对所述的新的待检测图像进行清晰-模糊图像的判别,主要是将转换后构建的新的待检测图像块放入卷积神经网络***中,然后根据所述的模糊检测模型进行计算该新的待检测图像为清晰图像或模糊图像的概率,并选择概率较大的图像类型作为所述的待检测图像的清晰-模糊类型。
CN201410344777.XA 2014-07-18 2014-07-18 一种模糊图像的快速检测方法 Pending CN104091340A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410344777.XA CN104091340A (zh) 2014-07-18 2014-07-18 一种模糊图像的快速检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410344777.XA CN104091340A (zh) 2014-07-18 2014-07-18 一种模糊图像的快速检测方法

Publications (1)

Publication Number Publication Date
CN104091340A true CN104091340A (zh) 2014-10-08

Family

ID=51639055

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410344777.XA Pending CN104091340A (zh) 2014-07-18 2014-07-18 一种模糊图像的快速检测方法

Country Status (1)

Country Link
CN (1) CN104091340A (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104268888A (zh) * 2014-10-09 2015-01-07 厦门美图之家科技有限公司 一种图像模糊检测方法
CN104899834A (zh) * 2015-03-04 2015-09-09 苏州大学 基于sift算法的模糊图像识别方法及装置
CN105957086A (zh) * 2016-05-09 2016-09-21 西北工业大学 一种基于优化神经网络模型的遥感图像变化检测方法
CN106372661A (zh) * 2016-08-30 2017-02-01 北京小米移动软件有限公司 构建分类模型的方法及装置
CN106447626A (zh) * 2016-09-07 2017-02-22 华中科技大学 一种基于深度学习的模糊核尺寸估计方法与***
CN107133948A (zh) * 2017-05-09 2017-09-05 电子科技大学 基于多任务卷积神经网络的图像模糊与噪声评测方法
CN108550118A (zh) * 2018-03-22 2018-09-18 深圳大学 运动模糊图像的模糊处理方法、装置、设备及存储介质
CN108805258A (zh) * 2018-05-23 2018-11-13 北京图森未来科技有限公司 一种神经网络训练方法及其装置、计算机服务器
CN109862253A (zh) * 2018-12-06 2019-06-07 中国人民解放军陆军工程大学 一种基于深度学习的数字视频稳像方法
WO2019173954A1 (zh) * 2018-03-12 2019-09-19 华为技术有限公司 一种图像清晰度检测方法及装置
CN110648326A (zh) * 2019-09-29 2020-01-03 精硕科技(北京)股份有限公司 一种构建图像质量评估卷积神经网络的方法及装置
CN112488162A (zh) * 2020-11-17 2021-03-12 中南民族大学 一种基于主动学习的垃圾分类方法
WO2023044612A1 (zh) * 2021-09-22 2023-03-30 深圳先进技术研究院 一种图像分类的方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7298882B2 (en) * 2005-02-15 2007-11-20 Siemens Aktiengesellschaft Generalized measure of image quality in medical X-ray imaging
WO2013025220A1 (en) * 2011-08-18 2013-02-21 Nikon Corporation Image sharpness classification system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7298882B2 (en) * 2005-02-15 2007-11-20 Siemens Aktiengesellschaft Generalized measure of image quality in medical X-ray imaging
WO2013025220A1 (en) * 2011-08-18 2013-02-21 Nikon Corporation Image sharpness classification system

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
JAMES H. ELDER 等: "Local Scale Control for Edge Detection and Blur Estimation", 《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE》 *
YUN-CHUNG CHUNG 等: "A Non-Parametric Blur Measure Based on Edge Analysis for Image Processing Applications", 《CYBERNETICS AND INTELLIGENT SYSTEMS, 2004 IEEE CONFERENCE ON》 *
李秀英 等: "几种图像缩放算法的研究", 《现代电子技术》 *
相林 等: "利用独立分量分析的运动模糊图像检索", 《计算机工程与应用》 *

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104268888B (zh) * 2014-10-09 2017-11-03 厦门美图之家科技有限公司 一种图像模糊检测方法
CN104268888A (zh) * 2014-10-09 2015-01-07 厦门美图之家科技有限公司 一种图像模糊检测方法
CN104899834A (zh) * 2015-03-04 2015-09-09 苏州大学 基于sift算法的模糊图像识别方法及装置
CN105957086A (zh) * 2016-05-09 2016-09-21 西北工业大学 一种基于优化神经网络模型的遥感图像变化检测方法
CN106372661A (zh) * 2016-08-30 2017-02-01 北京小米移动软件有限公司 构建分类模型的方法及装置
CN106447626B (zh) * 2016-09-07 2019-06-07 华中科技大学 一种基于深度学习的模糊核尺寸估计方法与***
CN106447626A (zh) * 2016-09-07 2017-02-22 华中科技大学 一种基于深度学习的模糊核尺寸估计方法与***
WO2018045602A1 (zh) * 2016-09-07 2018-03-15 华中科技大学 一种基于深度学习的模糊核尺寸估计方法与***
CN107133948A (zh) * 2017-05-09 2017-09-05 电子科技大学 基于多任务卷积神经网络的图像模糊与噪声评测方法
CN107133948B (zh) * 2017-05-09 2020-05-08 电子科技大学 基于多任务卷积神经网络的图像模糊与噪声评测方法
WO2019173954A1 (zh) * 2018-03-12 2019-09-19 华为技术有限公司 一种图像清晰度检测方法及装置
CN108550118A (zh) * 2018-03-22 2018-09-18 深圳大学 运动模糊图像的模糊处理方法、装置、设备及存储介质
CN108805258A (zh) * 2018-05-23 2018-11-13 北京图森未来科技有限公司 一种神经网络训练方法及其装置、计算机服务器
CN108805258B (zh) * 2018-05-23 2021-10-12 北京图森智途科技有限公司 一种神经网络训练方法及其装置、计算机服务器
CN109862253A (zh) * 2018-12-06 2019-06-07 中国人民解放军陆军工程大学 一种基于深度学习的数字视频稳像方法
CN110648326A (zh) * 2019-09-29 2020-01-03 精硕科技(北京)股份有限公司 一种构建图像质量评估卷积神经网络的方法及装置
CN112488162A (zh) * 2020-11-17 2021-03-12 中南民族大学 一种基于主动学习的垃圾分类方法
WO2023044612A1 (zh) * 2021-09-22 2023-03-30 深圳先进技术研究院 一种图像分类的方法和装置

Similar Documents

Publication Publication Date Title
CN104091340A (zh) 一种模糊图像的快速检测方法
CN104091341A (zh) 一种基于显著性检测的图像模糊检测方法
CN110929603B (zh) 一种基于轻量级卷积神经网络的天气图像识别方法
CN109685135B (zh) 一种基于改进型度量学习的少样本图像分类方法
US10096121B2 (en) Human-shape image segmentation method
CN110189260B (zh) 一种基于多尺度并行门控神经网络的图像降噪方法
CN109948692B (zh) 基于多颜色空间卷积神经网络及随机森林的计算机生成图片检测方法
CN109003234B (zh) 针对运动模糊图像复原的模糊核计算方法
CN113361623B (zh) 一种轻量级cnn结合迁移学习的医学图像分类方法
Mei et al. Signal processing on graphs: Estimating the structure of a graph
CN111275660B (zh) 一种平板显示器缺陷检测方法及装置
US11176672B1 (en) Machine learning method, machine learning device, and machine learning program
CN111241924B (zh) 基于尺度估计的人脸检测及对齐方法、装置、存储介质
US20230113318A1 (en) Data augmentation method, method of training supervised learning system and computer devices
CN116416561A (zh) 一种视频图像处理方法和装置
CN112836820B (zh) 用于图像分类任务的深度卷积网络训练方法、装置及***
CN114663392A (zh) 一种基于知识蒸馏的工业图像缺陷检测方法
CN113837959A (zh) 图像去噪模型训练方法、图像去噪方法及***
CN116363149A (zh) 一种基于U-Net改进的医学图像分割方法
CN107730459A (zh) 一种基于非线性动态***的图像去模糊方法
CN115240259A (zh) 一种基于yolo深度网络的课堂环境下人脸检测方法及其检测***
CN114663658B (zh) 一种具备跨域迁移能力的小样本aoi表面缺陷检测方法
CN116416212A (zh) 路面破损检测神经网络训练方法及路面破损检测神经网络
CN113033489B (zh) 基于轻量级深度学习算法的输电线路绝缘子识别定位方法
CN113111965A (zh) 用于cnn模型图像分类任务的高效激活函数

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20141008

RJ01 Rejection of invention patent application after publication