CN110334776A - 一种基于区域双三次插值技术的图像分类识别方法 - Google Patents

一种基于区域双三次插值技术的图像分类识别方法 Download PDF

Info

Publication number
CN110334776A
CN110334776A CN201910632952.8A CN201910632952A CN110334776A CN 110334776 A CN110334776 A CN 110334776A CN 201910632952 A CN201910632952 A CN 201910632952A CN 110334776 A CN110334776 A CN 110334776A
Authority
CN
China
Prior art keywords
image
point
feature
formula
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910632952.8A
Other languages
English (en)
Inventor
刘明珠
鲍雪
蒋燚铭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin University of Science and Technology
Original Assignee
Harbin University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin University of Science and Technology filed Critical Harbin University of Science and Technology
Priority to CN201910632952.8A priority Critical patent/CN110334776A/zh
Publication of CN110334776A publication Critical patent/CN110334776A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)

Abstract

一种基于区域双三次插值技术的图像分类识别方法,属于图像处理领域。现有的图像处理方法存在因尺度变换造成图像失真使图像分类识别率降低的问题。一种基于区域双三次插值技术的图像分类识别方法,利用训练样本经过SIFT提取特征、K‑means聚类统计词频、分类的步骤得到训练数据后,训练分类器模型;将测试样本图像通过区域双三次插值来对图像进行相同的放大与缩小的改变,再经过BOF算法进行检索与分类。本发明能够提高经缩放引起的失真图像的分类识别准确率。

Description

一种基于区域双三次插值技术的图像分类识别方法
技术领域
本发明涉及一种基于区域双三次插值技术的图像分类识别方法。
背景技术
计算机视觉针对计算机获取到的图像或视频进行处理,使其具有自主识别、理解和适应环境的能力。特征提取和分类技术作为图像处理和机器视觉的重要组成部分,可以对视觉信息进行高效的处理,获得人们需要的信息,给生活和工业生产带来便利。常用的处理图像的方法有:深度卷积神经网络(Deep Convolutional Neural Network,DCNN)、词袋模型(Bag of Features,BOF)、K-均值聚类(K-Means)和支持向量机(Support VectorMachine,SVM)耦合算法(KM-SVM)等相关改进算法。目前,提出了如下方法:通过BOF算法和空间金字塔匹配对图像的天气状态进行了识别与分类;通过对计算过程更直观的分析,将卷积网络中部分隐含层特征可视化,使得图像识别过程更加优化;提出一种基于K-Means和SVM的耦合算法根据茶叶的不同颜色对优劣茶叶进行识别与分类。但存在因尺度变换造成图像失真使图像分类识别率降低的问题,从而本发明将BOF算法与区域双三次插值相融合,解决上述问题。
发明内容
本发明的目的是为了解决现有的图像处理方法存在因尺度变换造成图像失真使图像分类识别率降低的问题,而提出一种基于区域双三次插值技术的图像分类识别方法。
一种基于区域双三次插值技术的图像分类识别方法,所述方法通过以下步骤实现:
步骤一、利用训练样本经过SIFT提取特征、K-means聚类统计词频、分类的步骤得到训练数据后,训练分类器模型;
步骤二、将测试样本图像通过区域双三次插值来对图像进行相同的放大与缩小的改变,再经过BOF算法进行检索与分类;
步骤三、将经过步骤二处理的测试样本送入步骤一中训练好的分类器模型里,进行分类识别。
本发明的有益效果为:
本发明采用区域双三次插值与BOF算法相融合的新方法对缩放图像的失真情况进行了有效的抑制,并可以有效提取缩放图像的特征描述子。通过测试表明本发明提出的融合方法比传统BOF方法、融合最近邻方法、融合双线性插值方法以及融合梯度优化算法的BOF方法等在高缩放倍数的情况下有较好的分类识别效果,可以明显提高经缩放引起的失真图像的分类识别准确率。
附图说明
图1为本发明方法流程图;
图2为2BOF算法缩小4倍结果;
图3本发明方法缩小4倍后,融合算法和BOF算法分类的结果。
具体实施方式
具体实施方式一:
本实施方式的一种基于区域双三次插值技术的图像分类识别方法,如图1所示,所述方法通过以下步骤实现:
步骤一、利用训练样本经过SIFT提取特征、K-means聚类统计词频、分类的步骤得到训练数据后,训练分类器模型;
步骤二、将测试样本图像通过区域双三次插值来对图像进行相同的放大与缩小的改变,再经过BOF算法进行检索与分类;
步骤三、将经过步骤二处理的测试样本送入步骤一中训练好的分类器模型里,进行分类识别。
通过分类结果可知,证明融合BOF算法与区域双三次插值的方法可以改善目标图像因尺寸变换而降低图像分类识别率的这一问题。
具体实施方式二:
与具体实施方式一不同的是,本实施方式的一种基于区域双三次插值技术的图像分类识别方法,
利用训练样本经过SIFT提取特征、K-means聚类统计词频、分类的步骤得到训练数据后,训练分类器模型的过程,具体为:
步骤一一、利用高斯模糊进行尺度空间的获取,(高斯卷积核是实现尺度变化的唯一线性变化核,是已被证实的结论。尺度空间用来模拟图像数据的多尺度特征),用高斯差分(Difference ofGaussian,DOG)金字塔表示,一幅图像的尺度空间L(x,y,σ)定义为一个变化尺度的高斯函数G(x,y,σ)与其原图像I(x,y)之间的卷积,如式(1)所示:
L(x,y,σ)=G(x,y,σ)*I(x,y) (1)
其中
m,n表示高斯模板的维度由(6σ+1)*(6σ+1)决定,其中尺度空间因子σ的大小决定图像的平滑程度,σ越大,图像越粗糙(低分辨率),σ越小,图像越精细(高分辨率);在尺度空间中,随着尺度的增大,图像的模糊程度也会随之增大;Lowe在论文中,将初始尺度定为1.6,本发明采取的初始尺度也为σ=1.600000;
尺度空间极值点的确定方式是将采样点与其同尺度间的8个相邻点以及上下相邻尺度之间的18个相邻点依次做比较,如果某个点在本尺度空间以及上下相邻尺度之间是最大值或者最小值,就可以作为该尺度下的极值点。
由于噪声对于DOG值的影响较大,所以需要将之前获得的局部极值点进行筛选,将错误检出的点和不稳定的点删除。可以获得图像的关键点。计算以稳定关键点为中心的邻域内所有点的梯度方向来确定稳定关键点的方向,将梯度方向归一化为36个方向,10°为一个范围,生成梯度直方图,主峰值即为特征点;其中,梯度幅值m(x,y)由式(3)获得,梯度方向θ(x,y)由式(4)获得:
取特征点周围4×4个块,每块取8个梯度方向,形成了(4×4)×8=128维的特征向量,即生成了相应的特征描述子,利用得到的特征信息对图像进行表述;
根据关键点分布图得到每幅图像的特征描述子效果图,特征描述子作为图像的关键字为聚类过程所用;
步骤一二、K-Means聚类算法是典型的基于距离的相似性评价指标,两个目标越近,这两个目标的相似度就越大,该算法认为簇(cluster)是由距离靠近的目标组成的,因此把得到紧凑且独立的簇作为最终目标。
设n个训练样本是{x1,x2,...,xn},(xi∈Rn,i≤n),K-Means聚类算法将样本聚类成k个簇;随机选取k个聚类质心点(cluster centroids),质心集合为C={c1,c2,...,ck},(k≤n);针对数据集中的每个样本xi,根据式(5)计算其到k个聚类中心的距离,将其分到距离最小的聚类中心所对应的类中,
其中,dist(·)是欧式距离,针对每一个类别ci,根据式(6)重新计算该类的质心:
不断的对质心进行迭代,直至质心不再改变;
通过K-Means聚类算法将SIFT算法提取到的每幅图像的关键词进行聚类,将每一类的质心即聚类中心看作是视觉单词,所有的视觉单词构成了图像的视觉词典,用以后继的识别处理;
步骤一三、空间金字塔匹配主要包含金字塔匹配核以及空间金字塔在BOF算法下的匹配方案。将图像进行不同层级的划分,然后利用视觉单词的直方图对图像进行表示,每一层级下的匹配点数可以根据式(7)求得,根据式(8)求得特征向量之间的匹配程度;
以level(i),(i=0,1,...)表示划分的层级的第i层,将level(i)的图像划分成pow(4,i)个bins(K-Means聚类得到的每个聚类中心就是bin),其中pow(4,i)代表4的i次方;
假设存在两个特征集合X,Y,其中每个特征的维度为d;根据不同的尺度0,...,L将特征空间划分,其中l∈L,在尺度l下把特征空间的每一维划出2l个bins,那么d维的特征空间就能划出D=2dl个bins;
在level(i)中,如果点x,y落入同一bin中就称x,y点匹配,每个bin中匹配的点的个数为min(Xi,Yi),其中Xi,Yi代表相应level下的第i个bin;表示X,Y在level(l)下的直方图特征,表示level(l)中X,Y落入第i个bin的特征点的个数,那么在level(l)下匹配的点的总数计算公式如式(7)所示:
简写成Il;统计各个尺度下匹配的总数Il,不同尺度下的匹配应取不同权重,将权重为定义两个点集的匹配程度根据式(8)计算:
步骤一四、采用LibSVM软件包对样本进行分类;SVM从样本的特征入手分析对象,预测对象的属性类别,支持向量机能够是经验误差最小,几何边缘最大的分类过程。LibSVM是一个操作比较简单,运行速度较快的SVM模式识别和回归的软件包,提供了很多的默认参数,而且运行速度比较快。
LibSVM主要由以下几个函数组成:
(1)svm_scale:对训练数据和测试数据做归一化处理,一般情况,把数据缩放到[-1,1]或[0,1];
(2)svm_train:对样本分类建模,提供优化参数;
(3)svm_predict:利用上一步已建模型,对测试数据进行分类。
具体实施方式三:
与具体实施方式一或二不同的是,本实施方式的一种基于区域双三次插值技术的图像分类识别方法,
所述的步骤二中,先计算待插值点在源图像中的对应点的四邻域点像素值的方差Var,如果方差小于设定的阈值T(T为20),则直接取这4个像素值的均值E作为待插值点的像素值;反之,仍按双三次插值计算;方差Var的计算公式如式(14)所示:
Var=(E-f11)2+(E-f12)2+(E-f21)2+(E-f22)2 (14)
其中,f11、f12、f21、f22分别为当前待插值点在源图像的对应点邻域4点的像素值;E为此4点像素值的均值;计算E时的运算量远小于双三次插值计算的运算量;方差反映了该像素点所处邻域的平坦程度。
对比说明:
合理的插值可以抑制图像缩放过程中产生的失真,经典的方法有最近邻方法和双线性插值法。近年来也出现了一些新的方法例如:自适应边缘插值方法(New Edge-Directed Interpolation、NEDI),新边缘插值方法(SF New Edge-DirectedInterpolation、SF-NEDI)以及梯度优化算法,均获得了较好的结果。分别将SF-NEDI算法、梯度优化算法与BOF算法融合,对测试样本进行分类识别,将测试结果进行对比,发现本发明方法分类识别准确率更高,更具有优越性。其他经过最近邻方法、双线性插值法、区域双三次插值算法、新边缘插值以及梯度优化算法对本发明选取的几类图片进行相同的放大和缩小处理(以放大4倍为例),得出区域双三次插值算法可以有效减少图像在放大和缩小的过程中产生的失真现象。
本发明改进算法对特征描述子提取效果测试的说明:
对经过不同处理的图像分别提取特征描述子,提取的特征描述子数目如表1所示,经区域双三次插值处理后的图像虽然提取的特征描述子数目少了,但是分类识别准确率提高了,说明提取到的多数特征子都是有效的关键点,从而进一步证实区域双三次插值可以有效的减少因放大或缩小产生的“马赛克”和块状失真的情况。
表1 提取特征描述子个数及提取时间
图像改变的倍数 关键点个数 用时(秒/s)
原图 229 1.277
普通放大4倍 240 1.095
普通缩小4倍 301 1.293
普通缩小8倍 184 1.005
区域双三次插值放大4倍 230 1.023
区域双三次插值缩小4倍 212 1.052
区域双三次插值缩小8倍 91 0.800
改进BOF算法分类效果及分析:
由于Caltech-101数据库中的图像类别丰富、数据足够多,可以满足本发明的实验要求,所以选取了该图像库中的6类图像,先从每类图像中选取40张图片进行训练,共训练了240张,再选取20张图片进行测试,共测试了120张图片。
如图2所示,六类图像使用融合算法和传统BOF算法分类的结果(以缩小4倍为例),对于ferry图像,融合算法将并不相近的chandelier图像和ferry图像准确的分开,对于electric_guitar图像,融合算法可以降低ferry图像的影响,提高electric_guitar图像的分类准确率,可以看出改进的BOF算法可以提升图像的分类识别准确率,如图3所示。
表2是普通方法、最近邻方法、区域双三次插值、双线性插值法、SF-NEDI算法、梯度优化算法分别与BOF算法融合,在图像进行放大4倍、缩小4倍、缩小8倍处理之后进行分类识别,得出每种方法的分类识别率,其中SF-NEDI插值方法只适用于图像的放大,可以在图像放大过程中合理插值,减少“马赛克”情况的产生。
表2 几种不同处理方式进行分类的结果
由表2中的分类识别结果得出,图像经过缩放处理之后会导致分类识别准确率降低。将表2中的实验结果进行对比,图像缩放的倍数越大,分类识别率越低,说明图像随着缩放倍数的增加,失真越严重,尤其是图像在缩小8倍时,利用传统的BOF算法只有35%的分类识别率,通过融合算法,整体的分类识别率提升了近14%,对于放大4倍和缩小4倍的图像融合算法分别提升了近14%和近16%的分类识别率。虽然,最近邻方法、双线性插值方法、梯度优化算法以及SF-NEDI方法可以改善图像缩放过程的失真情况,但是通过测试数据对比发现本发明方法相对于其他方法的分类识别准确率更高,说明改进的BOF算法可以更好的抑制图像在缩放过程中产生的失真现象,更准确的将此类失真图像进行分类识别。

Claims (3)

1.一种基于区域双三次插值技术的图像分类识别方法,其特征在于:所述方法通过以下步骤实现:
步骤一、利用训练样本经过SIFT提取特征、K-means聚类统计词频、分类的步骤得到训练数据后,训练分类器模型;
步骤二、将测试样本图像通过区域双三次插值来对图像进行相同的放大与缩小的改变,再经过BOF算法进行检索与分类;
步骤三、将经过步骤二处理的测试样本送入步骤一中训练好的分类器模型里,进行分类识别。
2.根据权利要求1所述一种基于区域双三次插值技术的图像分类识别方法,其特征在于:所述的步骤一中,利用训练样本经过SIFT提取特征、K-means聚类统计词频、分类的步骤得到训练数据后,训练分类器模型的过程,具体为:
步骤一一、利用高斯模糊进行尺度空间的获取,用高斯差分金字塔表示,一幅图像的尺度空间L(x,y,σ)定义为一个变化尺度的高斯函数G(x,y,σ)与其原图像I(x,y)之间的卷积,如式(1)所示:
L(x,y,σ)=G(x,y,σ)*I(x,y) (1)
其中
m,n表示高斯模板的维度由(6σ+1)*(6σ+1)决定,其中尺度空间因子σ的大小决定图像的平滑程度,σ越大,图像越粗糙,σ越小,图像越精细;在尺度空间中,随着尺度的增大,图像的模糊程度也会随之增大,σ=1.600000;
将梯度方向归一化为36个方向,10°为一个范围,生成梯度直方图,主峰值即为特征点;其中,梯度幅值m(x,y)由式(3)获得,梯度方向θ(x,y)由式(4)获得:
取特征点周围4×4个块,每块取8个梯度方向,形成了(4×4)×8=128维的特征向量,即生成了相应的特征描述子,利用得到的特征信息对图像进行表述;
根据关键点分布图得到每幅图像的特征描述子效果图,特征描述子作为图像的关键字为聚类过程所用;
步骤一二、设n个训练样本是{x1,x2,...,xn},(xi∈Rn,i≤n),K-Means聚类算法将样本聚类成k个簇;随机选取k个聚类质心点(cluster centroids),质心集合为C={c1,c2,...,ck},(k≤n);针对数据集中的每个样本xi,根据式(5)计算其到k个聚类中心的距离,将其分到距离最小的聚类中心所对应的类中,
其中,dist(·)是欧式距离,针对每一个类别ci,根据式(6)重新计算该类的质心:
不断的对质心进行迭代,直至质心不再改变;
通过K-Means聚类算法将SIFT算法提取到的每幅图像的关键词进行聚类,将每一类的质心即聚类中心看作是视觉单词,所有的视觉单词构成了图像的视觉词典,用以后继的识别处理;
步骤一三、将图像进行不同层级的划分,然后利用视觉单词的直方图对图像进行表示,每一层级下的匹配点数可以根据式(7)求得,根据式(8)求得特征向量之间的匹配程度;
以level(i),(i=0,1,...)表示划分的层级的第i层,将level(i)的图像划分成pow(4,i)个bins(K-Means聚类得到的每个聚类中心就是bin),其中pow(4,i)代表4的i次方;
假设存在两个特征集合X,Y,其中每个特征的维度为d;根据不同的尺度0,...,L将特征空间划分,其中l∈L,在尺度l下把特征空间的每一维划出2l个bins,那么d维的特征空间就能划出D=2dl个bins;
在level(i)中,如果点x,y落入同一bin中就称x,y点匹配,每个bin中匹配的点的个数为min(Xi,Yi),其中Xi,Yi代表相应level下的第i个bin;表示X,Y在level(l)下的直方图特征,表示level(l)中X,Y落入第i个bin的特征点的个数,那么在level(l)下匹配的点的总数计算公式如式(7)所示:
简写成Il;统计各个尺度下匹配的总数Il,不同尺度下的匹配应取不同权重,将权重为定义两个点集的匹配程度根据式(8)计算:
步骤一四、采用LibSVM软件包对样本进行分类。
3.根据权利要求2所述一种基于区域双三次插值技术的图像分类识别方法,其特征在于:所述的步骤二中,先计算待插值点在源图像中的对应点的四邻域点像素值的方差Var,如果方差小于设定的阈值T(T为20),则直接取这4个像素值的均值E作为待插值点的像素值;反之,仍按双三次插值计算;方差Var的计算公式如式(14)所示:
Var=(E-f11)2+(E-f12)2+(E-f21)2+(E-f22)2 (14)
其中,f11、f12、f21、f22分别为当前待插值点在源图像的对应点邻域4点的像素值;E为此4点像素值的均值;计算E时的运算量远小于双三次插值计算的运算量。
CN201910632952.8A 2019-07-15 2019-07-15 一种基于区域双三次插值技术的图像分类识别方法 Pending CN110334776A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910632952.8A CN110334776A (zh) 2019-07-15 2019-07-15 一种基于区域双三次插值技术的图像分类识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910632952.8A CN110334776A (zh) 2019-07-15 2019-07-15 一种基于区域双三次插值技术的图像分类识别方法

Publications (1)

Publication Number Publication Date
CN110334776A true CN110334776A (zh) 2019-10-15

Family

ID=68144969

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910632952.8A Pending CN110334776A (zh) 2019-07-15 2019-07-15 一种基于区域双三次插值技术的图像分类识别方法

Country Status (1)

Country Link
CN (1) CN110334776A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110929572A (zh) * 2019-10-18 2020-03-27 天博电子信息科技有限公司 林火识别方法和***
CN112287973A (zh) * 2020-09-28 2021-01-29 北京航空航天大学 基于截尾奇异值和像素插值的数字图像对抗样本防御方法
CN110929572B (zh) * 2019-10-18 2023-11-10 天博电子信息科技有限公司 林火识别方法和***

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130121600A1 (en) * 2011-09-17 2013-05-16 Zhe Lin Methods and Apparatus for Visual Search
CN103839074A (zh) * 2014-02-24 2014-06-04 西安电子科技大学 一种基于素描线段信息和空间金字塔匹配的图像分类方法
CN105005786A (zh) * 2015-06-19 2015-10-28 南京航空航天大学 一种基于BoF和多特征融合的纹理图像分类方法
CN109886161A (zh) * 2019-01-30 2019-06-14 江南大学 一种基于可能性聚类和卷积神经网络的道路交通标识识别方法
CN109902736A (zh) * 2019-02-25 2019-06-18 东北大学 一种基于自动编码器构建特征表示的肺结节图像分类方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130121600A1 (en) * 2011-09-17 2013-05-16 Zhe Lin Methods and Apparatus for Visual Search
CN103839074A (zh) * 2014-02-24 2014-06-04 西安电子科技大学 一种基于素描线段信息和空间金字塔匹配的图像分类方法
CN105005786A (zh) * 2015-06-19 2015-10-28 南京航空航天大学 一种基于BoF和多特征融合的纹理图像分类方法
CN109886161A (zh) * 2019-01-30 2019-06-14 江南大学 一种基于可能性聚类和卷积神经网络的道路交通标识识别方法
CN109902736A (zh) * 2019-02-25 2019-06-18 东北大学 一种基于自动编码器构建特征表示的肺结节图像分类方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110929572A (zh) * 2019-10-18 2020-03-27 天博电子信息科技有限公司 林火识别方法和***
CN110929572B (zh) * 2019-10-18 2023-11-10 天博电子信息科技有限公司 林火识别方法和***
CN112287973A (zh) * 2020-09-28 2021-01-29 北京航空航天大学 基于截尾奇异值和像素插值的数字图像对抗样本防御方法

Similar Documents

Publication Publication Date Title
CN107368807B (zh) 一种基于视觉词袋模型的监控视频车型分类方法
Gao et al. Automatic change detection in synthetic aperture radar images based on PCANet
CN105550381B (zh) 一种基于改进sift特征的高效图像检索方法
WO2010092952A1 (ja) パターン認識装置
CN111460961B (zh) 一种基于cdvs的相似图聚类的静态视频摘要方法
CN103679187B (zh) 图像识别方法和***
WO2011044058A2 (en) Detecting near duplicate images
CN105574063A (zh) 基于视觉显著性的图像检索方法
Chen et al. Structured document classification by matching local salient features
CN112149758B (zh) 一种基于欧式距离和深度学习的高光谱开放集分类方法
CN104156690B (zh) 一种基于图像空间金字塔特征包的手势识别方法
CN112784722B (zh) 基于YOLOv3和词袋模型的行为识别方法
CN102136074B (zh) 一种基于mmi的木材图像纹理分析与识别方法
Song et al. Two-level hierarchical feature learning for image classification
CN112966629B (zh) 基于图像变换和BoF模型的遥感图像场景分类方法
CN113191419B (zh) 一种基于轨迹关键点匹配及区域划分的暂降同源事件检测、类型辨识方法
CN109271997A (zh) 一种基于跳跃细分局部模式的图像纹理分类方法
CN114387592A (zh) 一种复杂背景下字符定位和识别方法
CN108491883B (zh) 一种基于条件随机场的显著性检测优化方法
CN110334776A (zh) 一种基于区域双三次插值技术的图像分类识别方法
CN109829511B (zh) 基于纹理分类的下视红外图像中云层区域检测方法
Liang et al. Multi-resolution local binary patterns for image classification
Anggraeny et al. Texture feature local binary pattern for handwritten character recognition
CN103902965A (zh) 空域共生图像表示方法及其在图像分类、识别中的应用
Kavitha et al. A robust script identification system for historical Indian document images

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20191015

WD01 Invention patent application deemed withdrawn after publication