CN106408018B - 一种基于幅频特征稀疏滤波的图像分类方法 - Google Patents

一种基于幅频特征稀疏滤波的图像分类方法 Download PDF

Info

Publication number
CN106408018B
CN106408018B CN201610823230.7A CN201610823230A CN106408018B CN 106408018 B CN106408018 B CN 106408018B CN 201610823230 A CN201610823230 A CN 201610823230A CN 106408018 B CN106408018 B CN 106408018B
Authority
CN
China
Prior art keywords
matrix
image
amplitude
frequency characteristic
sparse coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201610823230.7A
Other languages
English (en)
Other versions
CN106408018A (zh
Inventor
姚念民
巩宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian University of Technology
Original Assignee
Dalian University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian University of Technology filed Critical Dalian University of Technology
Priority to CN201610823230.7A priority Critical patent/CN106408018B/zh
Publication of CN106408018A publication Critical patent/CN106408018A/zh
Application granted granted Critical
Publication of CN106408018B publication Critical patent/CN106408018B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/30Noise filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明提供一种基于幅频特征稀疏滤波的图像分类方法,步骤具体为:1)获取待分类图像数据的一个子集,格式化为统一维度的图像数据矩阵X;2)生成维度为f*n的基矩阵U和维度为n*m的稀疏系数矩阵A;3)对矩阵A或图像数据矩阵X进行调和变换,获得幅频特征矩阵F;4)通过约束条件,执行迭代优化;5)重复执行4),至目标函数值达到预期的目标或迭代次数达到设定值;6)用基矩阵U和新的待分类图像矩阵Z,生成矩阵Z的稀疏系数矩阵B;7)选择分类器,矩阵B作为分类器输入,获取分类结果。本发明能够有效避免直接使用L‑1范数约束稀疏度的过拟合问题;减少优化项,提高优化效率;节省计算资源,提高分类器的分类精度,具有广阔应用前景。

Description

一种基于幅频特征稀疏滤波的图像分类方法
技术领域
本发明涉及的是一种图像分类的方法,具体可以应用到各种需要图像分类的场景中。
背景技术
稀疏滤波技术,是指通过约束信号重构系数矢量中非零系数的个数,达到优化特征表达,提高计算速度的效果,此外,稀疏滤波可以对信号产生压缩效果,以此节约存储和传输空间。
稀疏滤波应用到图像分类中,就是用图像信号的稀疏特征系数代替图像本身作为分类的信号样本。对于基于稀疏滤波的图像分类技术来说,常用做法是采用矩阵分解技术,通过将原始图像像素矩阵X分解为两个矩阵U和A的乘积,其中,矩阵U为基矩阵,控制图像特征由高维向低维转化,矩阵A为稀疏系数矩阵,其中每一列系数矢量中,存在极少数的非零元素,训练稀疏模型时,采用L-1范数约束稀疏系数矩阵A的稀疏度,分类时,使用图像信号的稀疏系数矩阵作为分类器的输入,分类图像。这种方式的缺点在于:一,对矩阵A做L-1范数稀疏度约束,容易使学习到的模型产生过拟合,影响分类的效果,甚至,严重时会产生错误分类,在分类结果与安全因素相关时,会导致严重的安全灾难;二,如果对矩阵U做过拟合惩罚,则增加了优化项,使优化过程复杂化,需要昂贵的计算资源。
图像的幅频特征,是指将图像信号或者可以代表图像信号的特征信号作为二维信号进行调和分析,使用诸如离散傅里叶变换,Z变换,小波变换,希尔伯特-黄变换等手段,获取到的图像数据在频率域的特征,是信号幅度与信号频率之间的关系。利用图像的幅频特征进行稀疏滤波,可以在利用图像信号的频率特性建立滤波模型,避免直接对矩阵A和矩阵U做约束,从而有效地避免了过拟合和优化过程的复杂化。
发明内容
本发明提供一种基于幅频特征稀疏滤波的图像分类技术,利用图像信号的幅频特征建立稀疏滤波模型;利用稀疏特征矩阵进行图像分类。
本发明技术方案为:
一种基于幅频特征稀疏滤波的图像分类方法,包括以下步骤:
1)训练数据获取阶段,获取待分类图像数据的一个子集,格式化为统一维度的图像数据矩阵X;
2)初始化阶段,生成两个随机矩阵,分别为维度为f*n的基矩阵U,维度为n*m的稀疏系数矩阵A;
3)变换阶段,对矩阵A或图像数据矩阵X进行调和变换,获得幅频特征矩阵F;
4)优化建立阶段,通过约束原始矩阵X与重构矩阵Y=UA的能量差最小,以及幅频特征矩阵F的能量最大,选取一种优化算法,执行迭代优化,例如,可以选取梯度下降算法;
5)优化迭代阶段,重复执行4,直到目标函数值达到预期的目标或者迭代次数达到预先设定的最大值;
6)生成阶段,用基矩阵U和新的待分类图像矩阵Z,生成矩阵Z的稀疏系数矩阵B;
7)分类阶段,选择一种分类器,矩阵B作为分类器输入,获取分类结果。
本发明的有益效果为:一种基于幅频特征稀疏滤波的图像分类技术具有非常广泛和实用的应用场景,比如,在生产环境中,由于传感器采集到的图像数据都是带有随机噪声和自然背景的图像数据,这些数据会放大L-1范数稀疏度约束的过拟合效果,严重干扰图像分类结果。基于幅频特征的稀疏滤波方法,通过在频域建立稀疏滤波模型,有效避免了直接约束稀疏系数矩阵带来的过拟合问题,并且通过减少优化项,提高了优化效率,不但节省了计算资源,而且提高了分类器的分类精度,因此,具有广阔的应用前景。
附图说明
图1(a)为稀疏度为α的矩阵A的图像;
图1(b)为图1(a)中矩阵A的幅频特征矩阵F的图像;
图2(a)为稀疏度为β的矩阵A的图像;
图2(b)为图2(a)中矩阵A的幅频特征矩阵F的图像
图3(a)为稀疏度为γ的矩阵A的图像;
图3(b)为图3(a)中矩阵A的幅频特征矩阵F的图像
图中:x,y分别为矩阵A两个维度坐标;s代表矩阵A的二维信号函数值;u,v分别为矩阵F的两个维度坐标;稀疏度α<β<γ。
具体实施方式
下面结合附图和技术方案详细说明本发明。
第一步,训练数据获取阶段
获取待分类图像数据之后,选取一个子集作为训练数据,格式化为m*(w*h)维度的图像数据矩阵X;其中,m为样本数目,w、h为单个图像的长、宽;设f=w*h为图像原始特征空间维度,即待分类图像中像素点的个数;
第二步,初始化阶段
设置稀疏特征数目为n(n<f),随机生成元素数值在0~1之间的两个二维矩阵,分别为维度为f*n的基矩阵U和维度为n*m的稀疏系数矩阵A;
第三步,变换阶段
对稀疏系数矩阵A或者图像数据矩阵X进行调和变换,获得幅频特征矩阵F;所述的调和变换的方法包括离散傅里叶变换、快速傅里叶变换、离散余弦变换、Z变换、小波变换或希尔伯特-黄变换等;
假设采用稀疏系数矩阵A执行离散傅里叶变换,用s(x,y)代表A的二维信号函数,F(u,v)代表s(x,y)的幅频特征,则:
其中,u,v代表F的两个维度坐标,x,y代表A两个维度坐标,m为样本数目,n为稀疏特征数目。
第四步,优化建立阶段
将幅频特征矩阵F的协方差矩阵的和的L-2范数的相反数作为F的能量,记为E(F);设幅频特征矩阵F的第i个列向量的协方差矩阵为R(Fi),则稀疏度约束函数spi=||XT-UA||2+λE(F)。其中,λ为能量约束系数,一般取0.5;重构矩阵Y=UA为基矩阵U和稀疏系数矩阵A的乘积;i、j分别表示幅频特征矩阵F的维度坐标。
第五步,优化迭代阶段
以稀疏度约束函数为目标函数,根据约束目标函数中图像数据矩阵X(原始矩阵)与重构矩阵Y的能量差最小,以及幅频特征矩阵F的能量最大,选取梯度下降算法,执行迭代优化。
所述的梯度下降算法具体为:
目标函数spi对稀疏系数矩阵A,基矩阵U的梯度更新矩阵函数分别为:
Gspi/U=-XTAT+(UA)AT
设置迭代次数,通过以上两个梯度更新矩阵,执行以spi函数为目标函数的迭代优化,至目标函数值达到预期的目标或者迭代次数达到预先设定的最大值,梯度下降算法结束。
附图是对迭代优化过程中,幅频特征矩阵与稀疏系数矩阵变化趋势的说明,图1(a)、图2(a)、图3(a)为稀疏度递增的稀疏系数矩阵A的图像;图1(b)、图2(b)、图3(b)分别为图1(a)、图2(a)、图3(a)中矩阵A的幅频特征矩阵F的图像;随着图1(b)、图2(b)、图3(b)中幅度偏离中心程度的逐渐变大,相应地,图1(a),图2(a),图3(a)的稀疏度逐渐变大。
第六步,生成阶段
设新的待分类图像数据矩阵为Z,由第五步得到的基矩阵U和待分类图像数据矩阵Z生成矩阵Z的稀疏系数矩阵B,即B=U-1Z。
第七步,分类阶段
将稀疏系数矩阵B作为分类器的输入矩阵,执行分类。

Claims (2)

1.一种基于幅频特征稀疏滤波的图像分类方法,其特征在于,该图像分类方法包括以下步骤:
第一步,训练数据获取阶段
获取待分类图像数据后,选取一个子集作为训练数据,格式化为m*(w*h)维度的图像数据矩阵X;其中,m为样本数目,w、h为单个图像的长、宽;设f=w*h为图像原始特征空间维度,即待分类图像中像素点的个数;
第二步,初始化阶段
设置稀疏特征数目为n,其中,n<f,随机生成元素数值在0~1之间的两个二维矩阵,分别为维度为f*n的基矩阵U和维度为n*m的稀疏系数矩阵A;
第三步,变换阶段
对稀疏系数矩阵A或图像数据矩阵X进行调和变换,获得幅频特征矩阵F;
第四步,优化建立阶段
将幅频特征矩阵F的协方差矩阵的和的L-2范数的相反数作为F的能量,记为E(F);设幅频特征矩阵F的第i个列向量的协方差矩阵为R(Fi),则稀疏度约束函数spi=||XT-UA||2+λE(F);其中,λ为能量约束系数,取0.5;重构矩阵Y=UA为基矩阵U和稀疏系数矩阵A的乘积;i、j分别表示幅频特征矩阵F的维度坐标;
第五步,优化迭代阶段
以稀疏度约束函数为目标函数,通过约束目标函数中图像数据矩阵X与重构矩阵Y的能量差最小,以及幅频特征矩阵F的能量最大,选取梯度下降算法,执行迭代优化;
所述的梯度下降算法具体为:
目标函数spi对稀疏系数矩阵A,基矩阵U的梯度更新矩阵函数分别为:
Gspi/U=-XTAT+(UA)AT
设置迭代次数,通过以上两个梯度更新矩阵,执行以spi函数为目标函数的迭代优化,至目标函数值达到预期的目标或者迭代次数达到预先设定的最大值,梯度下降算法结束;
第六步,生成阶段
设新的待分类图像数据矩阵为Z,由第五步得到的基矩阵U和待分类图像数据矩阵Z生成矩阵Z的稀疏系数矩阵B,即B=U-1Z;
第七步,分类阶段
将稀疏系数矩阵B作为分类器的输入矩阵,执行分类。
2.根据权利要求1所述的一种基于幅频特征稀疏滤波的图像分类方法,其特征在于,第三步中所述的调和变换的方法包括离散傅里叶变换、快速傅里叶变换、离散余弦变换、Z变换、小波变换或希尔伯特-黄变换。
CN201610823230.7A 2016-09-13 2016-09-13 一种基于幅频特征稀疏滤波的图像分类方法 Expired - Fee Related CN106408018B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610823230.7A CN106408018B (zh) 2016-09-13 2016-09-13 一种基于幅频特征稀疏滤波的图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610823230.7A CN106408018B (zh) 2016-09-13 2016-09-13 一种基于幅频特征稀疏滤波的图像分类方法

Publications (2)

Publication Number Publication Date
CN106408018A CN106408018A (zh) 2017-02-15
CN106408018B true CN106408018B (zh) 2019-05-14

Family

ID=58000131

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610823230.7A Expired - Fee Related CN106408018B (zh) 2016-09-13 2016-09-13 一种基于幅频特征稀疏滤波的图像分类方法

Country Status (1)

Country Link
CN (1) CN106408018B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109657707B (zh) * 2018-12-04 2020-12-25 浙江大学 一种基于观测矩阵变换维度的图像分类方法
CN110514924B (zh) * 2019-08-12 2021-04-27 武汉大学 深度卷积神经网络融合视觉辨识的电力变压器绕组故障定位方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102651073A (zh) * 2012-04-07 2012-08-29 西安电子科技大学 基于稀疏动态集成选择的sar图像地物分类方法
CN105139028A (zh) * 2015-08-13 2015-12-09 西安电子科技大学 基于分层稀疏滤波卷积神经网络的sar图像分类方法
CN105184320A (zh) * 2015-09-08 2015-12-23 西安交通大学 基于结构相似度的非负稀疏编码的图像分类方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102651073A (zh) * 2012-04-07 2012-08-29 西安电子科技大学 基于稀疏动态集成选择的sar图像地物分类方法
CN105139028A (zh) * 2015-08-13 2015-12-09 西安电子科技大学 基于分层稀疏滤波卷积神经网络的sar图像分类方法
CN105184320A (zh) * 2015-09-08 2015-12-23 西安交通大学 基于结构相似度的非负稀疏编码的图像分类方法

Also Published As

Publication number Publication date
CN106408018A (zh) 2017-02-15

Similar Documents

Publication Publication Date Title
Han et al. Unsupervised generative modeling using matrix product states
Salem et al. Data dimensional reduction and principal components analysis
Kim et al. Softflow: Probabilistic framework for normalizing flow on manifolds
Dai et al. Deformable convolutional networks
Lubbers et al. Inferring low-dimensional microstructure representations using convolutional neural networks
Oyallon et al. Scattering networks for hybrid representation learning
Lee et al. Wasserstein introspective neural networks
Rawat et al. Application of adversarial networks for 3D structural topology optimization
US11836572B2 (en) Quantum inspired convolutional kernels for convolutional neural networks
JP2015052832A (ja) 重み設定装置および方法
CN110428045A (zh) 基于Tucker算法的深度卷积神经网络压缩方法
Dai et al. Agricultural pest super-resolution and identification with attention enhanced residual and dense fusion generative and adversarial network
CN106408018B (zh) 一种基于幅频特征稀疏滤波的图像分类方法
Nanni et al. Improving the descriptors extracted from the co-occurrence matrix using preprocessing approaches
Mioulet et al. Gabor features for real-time road environment classification
Lin et al. A Fourier domain training framework for convolutional neural networks based on the Fourier domain pyramid pooling method and Fourier domain exponential linear unit
Yang et al. A novel convolutional network with a self-adaptation high-pass filter for fault diagnosis of wind turbine gearboxes
CN116619780B (zh) 酚醛复合材料的智能化生产方法及其***
Yuan et al. Bearing Fault Diagnosis Based on Improved Locality‐Constrained Linear Coding and Adaptive PSO‐Optimized SVM
CN111837185B (zh) 基于约束半非负矩阵分解的声音分类方法、装置及介质
CN116375006A (zh) 碳纳米管物理分散方法
Qian et al. Structured sparse model based feature selection and classification for hyperspectral imagery
CN113313175A (zh) 基于多元激活函数的稀疏正则化神经网络的图像分类方法
CN114565772A (zh) 集合特征提取方法、装置、电子设备及存储介质
Zhao et al. Incremental spectral learning in Fourier neural operator

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20190514

Termination date: 20210913