CN104091340A

CN104091340A - 一种模糊图像的快速检测方法

Info

Publication number: CN104091340A
Application number: CN201410344777.XA
Authority: CN
Inventors: 张伟; 曾志勇; 傅松林; 许清泉
Original assignee: Xiamen Meitu Technology Co Ltd
Current assignee: Xiamen Meitu Technology Co Ltd
Priority date: 2014-07-18
Filing date: 2014-07-18
Publication date: 2014-10-08

Abstract

本发明公开了一种模糊图像的快速检测方法，其收集样本图像，并对每个样本图像的RGB三个通道分别进行快速傅里叶变换，然后对得到变换后的复数数据进行尺寸缩小处理，并用尺寸缩小后的复数数据构建新图像，并将所得到的新构建的缩小图像作为卷积神经网络的输入图像，进行清晰-模糊图像分类训练，得到模糊检测模型，最后并对待检测图像进行RGB三个通道的快速傅里叶变换，对变换得到的复数数据进行尺寸缩小处理，并用尺寸缩小后的复数数据构建新的待检测图像，然后采用所述模糊检测模型对所述的新的待检测图像进行清晰-模糊图像的判别，从而有效的减少计算量，加快检测速度，同时特别适用于大尺寸图像的快速模糊检测，提高检测的准确率。

Description

一种模糊图像的快速检测方法

技术领域

本发明涉及一种图像处理方法，特别是一种模糊图像的快速检测方法。

背景技术

数字图像处理已经成为信息科学、生物学、医学等诸多领域的基础研究对象。随着信息时代的到来，数字图像处理在计算机视觉、机器学习、人工智能等领域都得到广泛的应用，其重要性日益凸显。令人遗憾的是，在数字图像的采集过程中，采集设备在快门开启的瞬间会产生不可避免的轻微抖动，这种抖动往往使我们最终只能得到一张细节模糊的图像，尤其是在光照条件不理想的情况下，较长的快门时间使得图像的模糊程度更加剧烈。这样的模糊图像给人眼视觉带来了很大的困扰，同时也丢失了大量的细节信息，是无法应用于日常生活和科研活动中的。现有的图像模糊检测方法大体上可以分为两类：一类给出整幅图像的模糊程度的估计，另一类将图像划分为若干个区域，对各个区域分别给出模糊程度的估计，但大都计算方法比较复杂，运算量较大，处理速度慢。

发明内容

本发明为解决上述问题，提供了一种模糊图像的快速检测方法，检测结果更加快速准确。

为实现上述目的，本发明采用的技术方案为：

一种模糊图像的快速检测方法，其特征在于，包括以下步骤：

10.收集样本图像，并对每个样本图像的RGB三个通道分别进行快速傅里叶变换，得到变换后的复数数据；

20.对所述的复数数据进行尺寸缩小处理，并用尺寸缩小后的复数数据构建新图像，得到缩小图像；

30.将所述的新构建的缩小图像作为卷积神经网络的输入图像，进行清晰-模糊图像分类训练，得到模糊检测模型；

40.获取待检测图像，并对待检测图像进行RGB三个通道的快速傅里叶变换，对变换得到的复数数据进行尺寸缩小处理，并用尺寸缩小后的复数数据构建新的待检测图像，然后采用所述模糊检测模型对所述的新的待检测图像进行清晰-模糊图像的判别。

优选的，所述的步骤40中采用所述模糊检测模型对所述的新的待检测图像进行清晰-模糊图像的判别，主要是将转换后构建的新的待检测图像块放入卷积神经网络***中，然后根据所述的模糊检测模型进行计算该新的待检测图像为清晰图像或模糊图像的概率，并选择概率较大的图像类型作为所述的待检测图像的清晰-模糊类型。

本发明的有益效果是：

本发明的一种模糊图像的快速检测方法，其通过收集样本图像，并对每个样本图像的RGB三个通道分别进行快速傅里叶变换，然后对得到变换后的复数数据进行尺寸缩小处理，并用尺寸缩小后的复数数据构建新图像，并将所得到的新构建的缩小图像作为卷积神经网络的输入图像，进行清晰-模糊图像分类训练，得到模糊检测模型，最后并对待检测图像进行RGB三个通道的快速傅里叶变换，对变换得到的复数数据进行尺寸缩小处理，并用尺寸缩小后的复数数据构建新的待检测图像，然后采用所述模糊检测模型对所述的新的待检测图像进行清晰-模糊图像的判别，从而有效的减少计算量，加快检测速度，同时特别适用于大尺寸图像的快速模糊检测，提高检测的准确率。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本发明的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1为本发明一种模糊图像的快速检测方法的流程简图；

图2为用于说明本发明效果的待检测图像；

图3为图2经快速傅里叶变换后的复数数据。

具体实施方式

为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚、明白，以下结合附图及实施例对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

如图1所示，本发明的一种模糊图像的快速检测方法，其包括以下步骤：

40.获取待检测图像(如图2)，并对待检测图像进行RGB三个通道的快速傅里叶变换，对变换得到的复数数据(如图3)进行尺寸缩小处理，并用尺寸缩小后的复数数据构建新的待检测图像，然后采用所述模糊检测模型对所述的新的待检测图像进行清晰-模糊图像的判别。

所述的步骤40中采用所述模糊检测模型对所述的新的待检测图像进行清晰-模糊图像的判别，主要是将转换后构建的新的待检测图像块放入卷积神经网络***中，然后根据所述的模糊检测模型进行计算该新的待检测图像为清晰图像或模糊图像的概率，并选择概率较大的图像类型作为所述的待检测图像的清晰-模糊类型。

所述的步骤30中将所述的新构建的缩小图像作为卷积神经网络的输入图像，进行清晰-模糊图像分类训练，主要是对新构建的缩小图像进行人工分类，并输入卷积神经网络进行分类测试，并且，将分类测试中分类错误的缩小图像收集起来重新进行人工标注，即进行调整网络结构，再将重新人工分类后的缩小图像再次进行训练学习，如此重复“训练-＞调整网络结构-＞再训练”的过程直到分类正确为止。

本实施例中网格结构顺序为输入层-＞K个小组层-＞全连接层-＞SoftMax层，其中K大于等于1；小组层包括卷积层、激活层、下采样层、归一化层；卷积层、激活层、下采样层、归一化层中每个层的核大小以及输出大小都是可以进行任意调节的，并且每个层都有一个输入且产生一个输出，每一层的输出作为下一层的输入。

其中，输入层的输入大小为Height x Weight x Channel，其中Weight、Height为输入层图像的宽和高，Channel为输入层图像的颜色通道；由于本发明使用GPU硬件实现的原因，Weight＝Height；输入图像的channel只能为1或者3。

卷积层：

1)核的大小必须是奇数，且不大于该层输入的宽或者高；

2)中间表示通过卷积层时不改变宽和高，通道数可变可不变；理论上可以为任意正整数，由于本发明使用GPU硬件实现的原因，这里为16的倍数。

激活层：

1)激活层不改变卷积层表示的宽、高或者通道数；

2)激活层所使用的激活函数包括但不限于以下函数类型：

f(x)＝1/(1+e^-x)

f(x)＝a*tanh(b*x)，a，b为任意非零实数

f(x)＝max(0，x)

f(x)＝min(a，max(0，x))

f(x)＝log(1+e^x)

f(x)＝|x|

f(x)＝x²

f (x) = \sqrt{x}

f(x)＝ax+b

3)激活层跟在卷积层或者全连接之后。

下采样层：

1)下采样层不改变中间表示的通道数；

2)下采样层对图像的缩小比即为核的大小：即核为m x n的下采样层会造成中间表示缩小为上一层的(1/m)x(1/n)，理论上m和n可为任意自然数，由于本发明使用GPU硬件实现的原因，m＝n。例如，15x15x32通过3x3的下采样后，变成5x5x32；15x15x32通过5x5的下采样后，变成3x3x32；但是15x15x32不能进行2x2的下采样，因为15不能被2整除；并不是说，输入尺寸必须是2的次幂，即16、32、64等，输入尺寸只要保证能被所有下采样层采样即可。

归一化层：

1)归一化层不改变中间表示的任何尺寸；

2)归一化层不是必须的，可要可不要，添加归一化层通常会提高精度并增加计算量；是否添加归一化层，要看添加后实际提升的精度和损失的速度。

一般的组合是：卷积-＞激活-＞下采样-＞归一化。

以下情况特殊：

1)添加归一化层对精度提升较小却增大了很多运算量时，取消归一化层，即采用以下组合：卷积-＞激活-＞下采样；

2)归一化层提前，效果基本相同，即采用以下组合：卷积-＞激活-＞归一化-＞下采样。

3)取消下采样层：卷积-＞激活；或者卷积-＞激活-＞归一化；下采样本质是为了增加鲁棒性，同时顺便有减少后续层的运算量的作用；一个网络中通常会有几层下采样，但并不是所有的“卷积-＞激活”后面都要跟下采样。

全连接层：

1)通过全连接层后的中间表示会变成1维的，不再是3维的；

2)全连接的输出可以任意；

3)一旦进过全连接，就无法进行卷积、下采样或归一化；

4)全连接后面可以接激活层，或者继续接全连接。

SoftMax层：

接在全连接层之后，作用是把全连接产生的实值变成[0，1]之间的概率。

本发明最后使用的网络结构如表1所示。

表1卷积神经网络结构

层数	类型	核大小	输出大小	注解
					1	输入层		32x32x3

2	卷积层	5x5	32x32x32
					3	激活层	32x32x32
4	下采样层	2x2	16x16x32	f(x)＝max(0，x)
					5	归一化层	16x16x32	使用局部归一化
6	卷积层	5x5	16x16x16
					7	激活层	16x16x16
8	下采样层	2x2	8x8x16	f(x)＝max(0，x)
					9	归一化层	8x8x16	使用局部归一化
10	全连接层		2个数据
					11	SoftMax层	2个数据

所述的快速傅立叶变换(Fast Fouier Transform)，简称FFT，它是离散傅里叶变换的快速算法，也可用于计算离散傅里叶变换的逆变换。快速傅里叶变换有广泛的应用，如数字信号处理、计算大整数乘法、求解偏微分方程等等。FFT算法设计的基本思想，就是充分利用DFT的周期性和对称性，减少重复的计算量；并把N点长序列分成几个短序列，减少每个序列长度，可大大减少计算量。实践中使用最多的FFT是“基2”算法。所谓“基2”，就是令DFT的点数N满足N＝2M(M为自然数)。FFT基2算法分为时域抽取法(Decimation In Time)和频域抽取法(Decimation In Frequency)两大类。快速傅里叶变换(FFT)大大降低了数字信号处理中的运算量，它的价值在于节省了CPU的处理时间，使得更多更复杂的数字信号得以快速的处理，为实现信息的实时处理开辟了广阔的发展前景。

本发明提供了一种结合快速傅里叶变换和卷积神经网络的模糊检测方法，其将傅里叶变换并尺寸缩小后的数据作为卷积神经网络(CNN)的输入数据。用于模糊检测模型训练的数据集包含有清晰-模糊两类数据，用卷积神经网络进行分类训练后，得到学习训练的参数，此参数模型作为模糊检测模型。其中，用于模糊检测模型训练学习的输入数据不是原始图像RGB三个通道的数据，而采用RGB三个通道分别经过快速傅里叶变换后的数据，图像数据尺寸的缩小是在原始图像数据经过快速傅里叶变换后进行，模糊检测模型训练学习采用的是卷积神经网络CNN的GPU加速版，待检测的图像需要对RGB三个通道分别做快速傅里叶变换，然后再缩小变换后的复数数据尺寸，用尺寸缩小后的复数数据构建新的待检测图像，使用模糊检测模型进行清晰-模糊判别。

使用CNN进行模糊检测模型训练十分耗时，将原始图像缩到较小尺寸进行训练可以减少计算量。然而，对原始图像直接进行缩小是高斯变换和下采样的过程，在此过程中损失了高频信息，原本清晰的图片在模糊检测过程中会被误判为模糊图片。因此，本发明使用傅里叶变换，将原始图像数据转为频域空间内的数据，使得模糊检测过程中所需的图像高低频信息得意保留。对图像进行傅里叶变换是个计算量庞大的过程，由于傅里叶变换的周期性，可以采用快速傅里叶变换(FFT)加快此计算过程，特别适用于对大尺寸的图像进行快速的模糊检测，提高检测准确率。

上述说明示出并描述了本发明的优选实施例，应当理解本发明并非局限于本文所披露的形式，不应看作是对其他实施例的排除，而可用于各种其他组合、修改和环境，并能够在本文发明构想范围内，通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围，则都应在本发明所附权利要求的保护范围内。

Claims

1.一种模糊图像的快速检测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种模糊图像的快速检测方法，其特征在于：所述的步骤40中采用所述模糊检测模型对所述的新的待检测图像进行清晰-模糊图像的判别，主要是将转换后构建的新的待检测图像块放入卷积神经网络***中，然后根据所述的模糊检测模型进行计算该新的待检测图像为清晰图像或模糊图像的概率，并选择概率较大的图像类型作为所述的待检测图像的清晰-模糊类型。