CN106203448B

CN106203448B - 一种基于非线性尺度空间的场景分类方法

Info

Publication number: CN106203448B
Application number: CN201610538778.7A
Authority: CN
Inventors: 陈苏婷; 王卓; 裴涛; 吴月路
Original assignee: Nanjing University of Information Science and Technology
Current assignee: Nanjing Xinda Environmental Technology Co ltd
Priority date: 2016-07-08
Filing date: 2016-07-08
Publication date: 2019-03-12
Anticipated expiration: 2036-07-08
Also published as: CN106203448A

Abstract

本发明公开了一种基于非线性尺度空间的场景分类方法，构建非线性尺度空间，提取并融合图像颜色特征和空间特征，得到C‑KAZE特征描述向量，通过K‑means将得到的C‑KAZE特征向量聚类生成视觉词包，经过编码池化后，得到高层语义，结合BoVW模型，SPM模型提取并融合图像的高层语义特征和空间布局信息，通过编码和平均池化操作得到最终的特征向量，输入SVM分类器完成场景分类。本发明可快速有效的完成高分辨率，大数据量的场景图像分类，其平均分类准确率和实时性均高于现有分类算法。

Description

一种基于非线性尺度空间的场景分类方法

技术领域

本发明涉及一种基于非线性尺度空间的场景分类方法，属于数字图像处理技术领域。

背景技术

随着计算机多媒体技术、数据库技术的飞速发展，图像信息量迅猛增加，依靠人眼对海量的图像进行分类和标注的方法已经无法满足当前的需求。因此，利用计算机技术自动对场景图像分类成为一个研究热点。场景图像的分类在军事监测，地形探测，森林防火等领域得到了广泛的应用。如何快速、准确的提取大量图像中所包含的地物信息并识别场景类别是研究重点。

现有的场景分类算法主要包括两类：一类是基于图像底层特征的分类，通过提取图像的纹理，空间，颜色等全局特征，建立图像场景分类模型，但其缺少高层语义的图像表示，容易局部细节丢失且泛化能力弱，不适用训练样本以外的图像；另一类是基于语义特征的分类，此方法中具有代表性的是BoVW模型，核心思想是将底层特征聚类为视觉单词，以视觉单词的分布建立与图像语义之间的联系，从而表达图像的场景内容，该模型有效的克服了底层特征与图像高层语义之间的鸿沟。在BoVW模型中，底层特征提取是算法的开始，在很大程度上影响算法的性能，传统的SIFT,SURF等算子是通过线性高斯分解提取特征点，容易造成边界模糊、细节丢失，因此选择一个鲁棒性好，对特征描述全面，准确率高的特征描述子是十分重要的。

发明内容

本发明所要解决的技术问题是克服现有技术的缺陷，提供一种基于非线性尺度空间的场景分类方法，使用非线性尺度空间来提取图像特征信息，生成C-KAZE特征描述子，并通过视觉词包(BoVW)模型和空间金字塔匹配模型(SPM)融合多特征，目的是提高KAZE算法的特征描述能力，突破传统SIFT场景分类算法特征描述单一，边缘细节模糊的局限性。

为解决上述技术问题，本发明提供一种基于非线性尺度空间的场景分类方法，包括以下步骤：

1)构造非线性尺度空间；

2)建立HSV颜色空间，来表示颜色的色调H，饱和度S和亮度V属性；

3)对HSV颜色空间中的3个分量进行非等间隔量化，从而构造颜色量化矩阵Y；

4)生成融合颜色信息的KAZE特征描述子，具体如下：

4-1)采用KAZE算法构建非线性尺度空间检查图像特征点信息，确定特征点所在层次中图像的大小信息，对颜色量化矩阵Y大小变换得到Y₁，使得矩阵Y₁与特征点所在层次图像大小相同，用来代替灰度图像生成特征向量，使得KAZE特征描述子被赋予颜色属性；

4-2)利用矩阵Y₁中灰度图像的特征点方向信息，将坐标轴旋转为特征点的主方向，保持旋转不变性，以特征点为中心，取4×4的窗口，计算每一个Y₁元素的幅值和梯度方向，使用高斯核σ₁＝2.5σ_i对每一个子区域加权，从而计算出一个4维的区域描述向量d_v，再用另一个4×4高斯窗口，高斯核σ₂＝1.5σ_i对d_v加权，归一化去除光照影响，得到64维融合颜色信息的KAZE特征向量，定义为：

d_C-KAZE＝(∑dx,∑dy,∑|dx|,∑|dy|) (7)

其中，d_C-KAZE表示C-KAZE特征向量，dx，dy分别表示Y₁子区域上像素点在x和y方向的值，|dx|，|dy|是dx，dy的绝对值。

5)通过K-means将步骤4)中得到的融合颜色信息的KAZE特征向量聚类生成视觉词典，经过编码池化后，得到高层语义特征；

6)引入空间金字塔匹配模型，在空间层次上把图像划分为金字塔的形式，选择图像空间金字塔的构建层级，分别提取每层中各子块的特征，以作为不同层级下的加权值；最后再将所有层级得到的空间特征直方图加权组合为图像空间金子塔描述，从而得到空间位置特征；

其中，L表示金字塔总层级，l表示当前层级数，l＝0,1,……,L；

7)融合多特征，得到最终的特征向量，输入SVM分类器完成分类。

前述的步骤1)中，构造非线性尺度空间是指对一副图像进行非线性扩散滤波，通过任意步长的加性算子***算法来构造稳定的非线性尺度空间，使用标准差为σ的高斯核在高斯尺度空间下对图像卷积，采用如下映射关系得到时间单位的尺度参数：

其中，t_i称为进化时间，σ_i是以像素为单位的尺度参数，N为尺度参数的个数。

前述的步骤2)中，通过获取RGB颜色图像从而转化为HSV颜色空间，转换公式如下：

V＝max(R,G,B) (2)

其中，H∈[0,360],S∈[0,1],V∈[0,1]。

前述的步骤3)中，将H量化为8，S和V分别量化为3，合成3个分量得到颜色量化矩阵Y：

Y＝HQ_SQ_V+SQ_V+V (5)

式中，Q_S、Q_V分别为S和V的量化数，Q_S＝Q_V＝3，则上式变为：

Y＝9H+3S+V,Y∈[0,71] (6)。

前述的步骤5)中，对K-means聚类参数K和样本训练数进行参数寻优，选取K为1000，样本训练数为120。

前述的步骤6)中，所述金字塔构建层级L选择2。

本发明所达到的有益效果：

本发明克服了现有算法使用线性高斯分解提取特征时造成的边界模糊和细节丢失问题；本发明方法通过构建非线性尺度空间，提取并融合图像颜色特征和空间特征，突破了传统算法特征描述单一的局限性；利用视觉词包(BoVW)模型对训练样本图像学***均分类准确率和实时性均高于现有分类算法。该场景分类方法可广泛应用于军事监测，地形探测，森林防火等领域，

附图说明

图1是本发明的C-KAZE算法流程图；

图2是本发明的基于非线性尺度空间的场景分类方法流程图。

具体实施方式

下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案，而不能以此来限制本发明的保护范围。

如图1和图2所示，本发明的基于非线性尺度空间的场景分类方法，包括以下步骤：

1.构造非线性尺度空间。对一副图像进行非线性扩散滤波，通过任意步长的加性算子***算法来构造稳定的非线性尺度空间，使用标准差为σ的高斯核在高斯尺度空间下对图像卷积，采用如下映射关系得到时间单位的尺度参数：

式中，t_i称为进化时间，σ_i是以像素为单位的尺度参数，N为尺度参数的个数。

2.建立HSV颜色空间，来表示颜色的色调(H)，饱和度(S)和亮度(V)属性。通过获取RGB颜色图像从而转化为HSV颜色空间。转换式为：

V＝max(R,G,B) (2)

式中，H∈[0,360],S∈[0,1],V∈[0,1]。

3.对HSV颜色空间中的3个分量进行非等间隔量化，从而构造颜色量化矩阵，以聚合相似的颜色，减少颜色的数量并克服视觉认识的模糊性。通过对颜色模型的分析和实验验证，将H量化为8，S和V分别量化为3，合成3个分量得到颜色量化矩阵Y：

Y＝HQ_SQ_V+SQ_V+V (5)

Y＝9H+3S+V,Y∈[0,71] (6)

4.生成融合颜色信息的KAZE特征描述子(C-KAZE)，具体如下：

1)采用KAZE算法构建非线性尺度空间检测图像特征点信息，确定特征点所在层次中图像的大小信息，对颜色量化矩阵Y大小变换得到Y₁，使得矩阵Y₁与特征点所在层次图像大小相同，用来代替灰度图像生成特征向量，使得KAZE特征描述子被赋予颜色属性。

2)利用矩阵Y₁中灰度图像的特征点方向信息，将坐标轴旋转为特征点的主方向，保持旋转不变性。以特征点为中心，取4×4的窗口，计算每一个Y₁元素的幅值和梯度方向，使用高斯核(σ₁＝2.5σ_i)对每一个子区域加权，从而计算出一个4维的区域描述向量d_v，再用另一个4×4高斯窗口(σ₂＝1.5σ_i)对d_v加权，归一化以去除光照影响，得到64维C-KAZE特征向量，定义为：

d_C-KAZE＝(∑dx,∑dy,∑|dx|,∑|dy|) (7)

式中，dx，dy分别表示Y₁子区域上像素点在x和y方向的值，|dx|，|dy|是dx，dy的绝对值。

5.通过K-means将步骤4中得到的C-KAZE特征向量聚类生成视觉词典，经过编码池化后，得到高层语义特征。在本步骤中，对K-means聚类参数K和样本训练数进行参数寻优，在一定范围内提高图像分类准确率，所述K为1000，样本训练数为120。

6.引入空间金字塔匹配(SPM)模型，在空间层次上把原始灰度图像划分为金字塔的形式，选取L＝2作为图像空间金字塔的构建层级，分别提取每层中各子块的特征，以作为不同层级下的加权值。其中L表示金字塔总层级，l表示当前层级数，l＝0,1,2。最后再将3个层级得到的空间特征直方图加权组合为图像空间金子塔描述，从而得到空间位置特征。

7.最后结合上述步骤，利用BoVW模型完成图像的学***均池化操作，从而得到高层特征向量。最后，对原图像在空间金字塔(L＝2层级)下提取空间布局信息，与高层特征向量融合作为线性SVM的输入完成分类训练。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明技术原理的前提下，还可以做出若干改进和变形，这些改进和变形也应视为本发明的保护范围。

Claims

1.一种基于非线性尺度空间的场景分类方法，其特征在于，包括以下步骤：

1)构造非线性尺度空间；

4)生成融合颜色信息的KAZE特征描述子，具体如下：

d_C-KAZE＝(∑dx,∑dy,∑|dx|,∑|dy|) (7)

其中，d_C-KAZE表示C-KAZE特征向量，dx，dy分别表示Y₁子区域上像素点在x和y方向的值，|dx|，|dy|是dx，dy的绝对值；

2.根据权利要求1所述的一种基于非线性尺度空间的场景分类方法，其特征在于，所述步骤1)中，构造非线性尺度空间是指对一副图像进行非线性扩散滤波，通过任意步长的加性算子***算法来构造稳定的非线性尺度空间，使用标准差为σ的高斯核在高斯尺度空间下对图像卷积，采用如下映射关系得到时间单位的尺度参数：

3.根据权利要求1所述的一种基于非线性尺度空间的场景分类方法，其特征在于，所述步骤2)中，通过获取RGB颜色图像从而转化为HSV颜色空间，转换公式如下：

V＝max(R,G,B) (2)

其中，H∈[0,360],S∈[0,1],V∈[0,1]。

4.根据权利要求1所述的一种基于非线性尺度空间的场景分类方法，其特征在于，所述步骤3)中，将H量化为8，S和V分别量化为3，合成3个分量得到颜色量化矩阵Y：

Y＝HQ_SQ_V+SQ_V+V (5)

Y＝9H+3S+V,Y∈[0,71] (6)。

5.根据权利要求1所述的一种基于非线性尺度空间的场景分类方法，其特征在于，所述步骤5)中，对K-means聚类参数K和样本训练数进行参数寻优，选取K为1000，样本训练数为120。

6.根据权利要求1所述的一种基于非线性尺度空间的场景分类方法，其特征在于，所述步骤6)中，所述金字塔的构建层级L选择2。