CN113408670A - 图像分类方法和装置 - Google Patents

图像分类方法和装置 Download PDF

Info

Publication number
CN113408670A
CN113408670A CN202110939926.7A CN202110939926A CN113408670A CN 113408670 A CN113408670 A CN 113408670A CN 202110939926 A CN202110939926 A CN 202110939926A CN 113408670 A CN113408670 A CN 113408670A
Authority
CN
China
Prior art keywords
classification
image
training
pixel
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110939926.7A
Other languages
English (en)
Other versions
CN113408670B (zh
Inventor
吴坤升
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lisheng Innovation (Shenzhen) Co.,Ltd.
Original Assignee
Shenzhen Diantong Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Diantong Information Technology Co ltd filed Critical Shenzhen Diantong Information Technology Co ltd
Priority to CN202110939926.7A priority Critical patent/CN113408670B/zh
Publication of CN113408670A publication Critical patent/CN113408670A/zh
Application granted granted Critical
Publication of CN113408670B publication Critical patent/CN113408670B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于图像分类技术领域,具体涉及图像分类方法和装置,所述方法执行以下步骤:提取训练分类图像的图像特征,得到训练分类图像特征组;对训练分类图像特征组进行特征分析,具体包括:将训练分类图像特征组中的每个特征进行归一化处理后,得到一个特征值;再设定多个比较值,计算特征值与比较值的差异值,以判断特征值与比较值的距离,将计算得到的差异值最小的比较值作为特征值的分类中心。与现有技术的图像分类方法不同的事,本发明基于图像的特征来进行分类,而在进行分类过程中,通过设置比较值来确定分类中心,进而构建分类树对待分类的图像进行分类,大幅度简化了分类的算法和过程,同时,分类结果的准确率依然维持在较高水平。

Description

图像分类方法和装置
技术领域
本发明属于图像分类技术领域,具体涉及图像分类方法和装置。
背景技术
图像分类,根据各自在图像信息中所反映的不同特征,把不同类别的目标区分开来的图像处理方法。它利用计算机对图像进行定量分析,把图像或图像中的每个像元或区域划归为若干个类别中的某一种,以代替人的视觉判读。
图像分类方法一般有以下几种:
1.基于色彩特征的索引技术:色彩是物体表面的一种视觉特性,每种物体都有其特有的色彩特征,譬如人们说到绿色往往是和树木或草原相关,谈到蓝色往往是和大海或蓝天相关,同一类物体往拍几有着相似的色彩特征,因此我们可以根据色彩特征来区分物体.用色彩特特征进行图像分类一可以追溯到Swain和Ballard提出的色彩直方图的方法.由于色彩直方图具有简单且随图像的大小、旋转变化不敏感等特点,得到了研究人员的厂泛关注,目前几乎所有基于内容分类的图像数据库***都把色彩分类方法作为分类的一个重要手段,并提出了许多改进方法,归纳起主要可以分为两类:全局色彩特征索引和局部色彩特征索引。
2.基于纹理的图像分类技术:纹理特征也是图像的重要特征之一,其本质是刻画像素的邻域灰度空间分布规律由于它在模式识别和计算机视觉等领域已经取得了丰富的研究成果,因此可以借用到图像分类中。在70年代早期,Haralick等人提出纹理特征的灰度共生矩阵表示法,这个方法提取的是纹理的灰度级空间相关性,它首先基于像素之间的距离和方向建立灰度共生矩阵,再由这个矩阵提取有意义的统计量作为纹理特征向量。基于一项人眼对纹理的视觉感知的心理研究,Tamuar等人提出可以模拟纹理视觉模型的6个纹理属性,分别是粒度,对比度,方向性,线型,均匀性和粗糙度。QBIC***和MARS***就采用的是这种纹理表示方法。在90年代初期,当小波变换的理论结构建一认起来之后,许多研究者开始研究如何用小波变换表示纹理特征。smiht和chang利用从小波子带中提取的统计量(平均值和方差)作为纹理特征。这个算法在112幅Brodatz纹理图像中达到了90%的准确率。为了利用中间带的特征,Chang和Kuo开发出一种树型结构的小波变化来进一步提高分类的准确性。还有一些研究者将小波变换和其他的变换结合起来以得到更好的性能,如Thygaarajna等人结合小波变换和共生矩阵,以兼顾基于统计的和基于变换的纹理分析算法的优点。
3.基于形状的图像分类技术:形状是图像的重要可视化内容之一在二维图像空间中,形状通常被认为是一条封闭的轮廓曲线所包围的区域,所以对形状的描述涉及到对轮廓边界的描述以及对这个边界所包围区域的描述.目前的基于形状分类方法大多围绕着从形状的轮廓特征和形状的区域特征建立图像索引。关于对形状轮廓特征的描述主要有:直线段描述、样条拟合曲线、傅立叶描述子以及高斯参数曲线等等。实际上更常用的办法是采用区域特征和边界特征相结合来进行形状的相似分类.如Eakins等人提出了一组重画规则并对形状轮廓用线段和圆弧进行简化表达,然后定义形状的邻接族和形族两种分族函数对形状进行分类.邻接分族主要采用了形状的边界信息,而形状形族主要采用了形状区域信息.在形状进行匹配时,除了每个族中形状差异外,还比较每个族中质心和周长的差异,以及整个形状的位置特征矢量的差异,查询判别距离是这些差异的加权和。
发明内容
本发明的主要目的在于提供图像分类方法和装置,与现有技术的图像分类方法不同的事,本发明基于图像的特征来进行分类,而在进行分类过程中,通过设置比较值来确定分类中心,进而构建分类树对待分类的图像进行分类,大幅度简化了分类的算法和过程,同时,分类结果的准确率依然维持在较高水平。
为达到上述目的,本发明的技术方案是这样实现的:
图像分类方法,所述方法执行以下步骤:
步骤1:提取训练分类图像的图像特征,得到训练分类图像特征组;
步骤2:对训练分类图像特征组进行特征分析,具体包括:将训练分类图像特征组中的每个特征进行归一化处理后,得到一个特征值;再设定多个比较值,计算特征值与比较值的差异值,以判断特征值与比较值的距离,将计算得到的差异值最小的比较值作为特征值的分类中心;
步骤3:基于每个比较值,以及以该比较值作为分类中心的特征值作为一个分类组;
步骤4:以分类组作为节点建立分类树,对待分类图像进行分类;具体包括:对待分类图像进行特征提取后,得到待分类图像的图像特征,将所有的待分类图像的图像特征作为一个待分类图像特征组,再将待分类图像特征组直接代入分类树进行分类,在分类树分类过程中,从待分类图像特征组中依次取出待分类图像的图像特征,将其放入分类树中进行分类,直到待分类图像特征组中所有的待分类图像的图像特征均被取出,完成图像分类。
进一步的,所述步骤1中提取训练分类图像的图像特征的方法包括:对训练分类图像的像素进行直接像素映射,从而得到像素的M维的像素映射系数,M为大于256的整数;根据像素映射系数,获得训练分类图像对应的M个直接像素映射图,其中,所述M个直接像素映射图中的第k个直接像素映射图中任意坐标点的值为所述任意坐标点对应在像素映射系数在第k个维度下的值,k为小于等于M的正整数;分别对所述M个直接像素映射图进行池化处理,从而得到所述待提取像素的M维的池化特征,所述M个直接像素映射图与所述池化特征的M个维度一一对应;对所述池化特征进行维度约减,从而得到所述待提取像素的用于表示所述池化特征的约减特征,所述约减特征的维度小于所述池化特征的维度;将得到的约减特征作为提取到的训练分类图像的图像特征。
进一步的,所述对训练分类图像的像素进行直接像素映射,得到像素的M维的像素映射系数的方法执行以下步骤:使用如下公式,对训练分类图像的像素进行直接像素映射:T=
Figure 158718DEST_PATH_IMAGE001
;其中,T为像素映射系数,
Figure 623329DEST_PATH_IMAGE002
为调整系数,取值范围为:0.2~0.5;
Figure 871908DEST_PATH_IMAGE003
表示训练分类图像的
Figure 860592DEST_PATH_IMAGE004
的像素R值,
Figure 143806DEST_PATH_IMAGE005
表示训练分类图像的
Figure 77520DEST_PATH_IMAGE004
的像素G值,
Figure 813395DEST_PATH_IMAGE006
表示训练分类图像的
Figure 605771DEST_PATH_IMAGE004
的像素B值。
进一步的,所述对所述M个直接像素映射图进行池化处理,从而得到所述待提取像素的M维的池化特征的方法执行以下步骤:使用如下公式进行池化处理:
Figure 743491DEST_PATH_IMAGE007
;其中,
Figure 81062DEST_PATH_IMAGE008
为每个直接像素图在所有直接像素图中出现的概率,
Figure 304233DEST_PATH_IMAGE009
表示直接像素图;
Figure 634721DEST_PATH_IMAGE010
为得到的池化特征。
进一步的,所述所述分类树为多叉树,包含至少两部分,且所述分类树中各个节点对应各自的分类组;根据所述分类树中各个节点对应的特征值,训练各个父节点各自对应的分类模型,所述特征值预先经过类型标注并存储在对应的节点中,所述父节点对应至少一个子节点,所述分类模型用于将语料划分到对应的子节点;获取待分类图像,所述待分类图像为未知分类组的待预测数据;通过所述分类树中各个节点的所述分类模型对所述待分类图像进行逐级分类。
进一步的,所述根据所述分类树中各个节点对应的特征值,训练各个父节点各自对应的分类模型,包括:获取当前父节点对应的各个子节点中对应的所述特征值,以及各个子节点对应的分类类型;根据各个子节点中对应的所述特征值以及各个子节点对应的分类类型,通过预设模型训练算法训练当前父节点对应的分类模型,所述预设模型训练算法包括支持向量机SVM算法、K最邻近分类KNN算法、决策树算法和朴素贝叶斯NBM算法中的至少一种;将训练得到的分类模型存储到当前父节点中。
进一步的,所述根据所述分类树中各个节点对应的训练语料,训练各个父节点各自对应的分类模型,还包括:将训练任务添加到等待队列中,所述训练任务用于指示训练父节点对应的分类模型;检测执行队列中训练任务的数量是否小于阈值;若执行队列中训练任务的数量小于所述阈值,则将所述等待队列中的训练任务添加到所述执行队列中,并执行所述获取当前父节点对应的各个子节点中对应的所述特征值,以及各个子节点对应的分类类型的步骤。
进一步的,在提取训练分类图像的图像特征之前,还包括对训练分类图像进行图像预处理的步骤,具体包括:根据所述训练分类图像的像素位置信息和像素灰度值信息,对所述训练分类图像进行滤波处理,生成滤波图像;所述像素位置信息是所述训练分类图像中的第一像素与所述第一像素既定邻域范围内其他像素之间的空间距离;所述像素灰度值信息是所述训练分类图像中的第一像素与所述第一像素周围的像素之间的灰度值的差分;根据所述滤波图像的局部像素信息和整体像素信息,对所述滤波图像进行增强处理,生成增强图像;根据所述增强图像,生成类梯度图;对所述类梯度图进行二值化处理,生成二值图像。
进一步的,所述根据所述训练分类图像的像素位置信息和像素灰度值信息,对所述训练分类图像进行滤波处理,具体包括:根据所述训练分类图像的像素位置信息,生成高斯模板;根据所述训练分类图像的像素灰度值信息,生成灰度值差分模板,其中,所述高斯模板与所述灰度值差分模板的大小相同;将所述高斯模板中的模板系数与所述灰度值差分模板中对应位置的模板系数相乘,将乘积作为生成的滤波系数模板中对应位置的模板系数;使用所述滤波系数模板,对所述训练分类图像进行滤波处理。
一种用于实现前述所述方法的图像分类装置。
本发明的图像分类方法和装置,具有如下有益效果:与现有技术的图像分类方法不同的事,本发明基于图像的特征来进行分类,而在进行分类过程中,通过设置比较值来确定分类中心,进而构建分类树对待分类的图像进行分类,大幅度简化了分类的算法和过程,同时,分类结果的准确率依然维持在较高水平。
附图说明
图1为本发明的实施例提供的图像分类方法的方法流程示意图;
图2为本发明的实施例提供的图像分类方法及装置的分类树的结构示意图;
图3为本发明的实施例提供的图像分类方法及装置的分类组的结构示意图;
图4为本发明的实施例提供的图像分类方法及装置的效率随着试验场次数变化的曲线示意图与现有技术的对比实验效果示意图。
具体实施方式
以下结合具体实施方式和附图对本发明的技术方案作进一步详细描述:
实施例1
如图1所示,
图像分类方法,所述方法执行以下步骤:
步骤1:提取训练分类图像的图像特征,得到训练分类图像特征组;
步骤2:对训练分类图像特征组进行特征分析,具体包括:将训练分类图像特征组中的每个特征进行归一化处理后,得到一个特征值;再设定多个比较值,计算特征值与比较值的差异值,以判断特征值与比较值的距离,将计算得到的差异值最小的比较值作为特征值的分类中心;
步骤3:基于每个比较值,以及以该比较值作为分类中心的特征值作为一个分类组;
步骤4:以分类组作为节点建立分类树,对待分类图像进行分类;具体包括:对待分类图像进行特征提取后,得到待分类图像的图像特征,将所有的待分类图像的图像特征作为一个待分类图像特征组,再将待分类图像特征组直接代入分类树进行分类,在分类树分类过程中,从待分类图像特征组中依次取出待分类图像的图像特征,将其放入分类树中进行分类,直到待分类图像特征组中所有的待分类图像的图像特征均被取出,完成图像分类。
实施例2
在上一实施例的基础上,所述步骤1中提取训练分类图像的图像特征的方法包括:对训练分类图像的像素进行直接像素映射,从而得到像素的M维的像素映射系数,M为大于256的整数;根据像素映射系数,获得训练分类图像对应的M个直接像素映射图,其中,所述M个直接像素映射图中的第k个直接像素映射图中任意坐标点的值为所述任意坐标点对应在像素映射系数在第k个维度下的值,k为小于等于M的正整数;分别对所述M个直接像素映射图进行池化处理,从而得到所述待提取像素的M维的池化特征,所述M个直接像素映射图与所述池化特征的M个维度一一对应;对所述池化特征进行维度约减,从而得到所述待提取像素的用于表示所述池化特征的约减特征,所述约减特征的维度小于所述池化特征的维度;将得到的约减特征作为提取到的训练分类图像的图像特征。
具体的,图像特征主要有图像的颜色特征、纹理特征、形状特征和空间关系特征。
颜色特征是一种全局特征,描述了图像或图像区域所对应的景物的表面性质;纹理特征也是一种全局特征,它也描述了图像或图像区域所对应景物的表面性质;形状特征有两类表示方法,一类是轮廓特征,另一类是区域特征,图像的轮廓特征主要针对物体的外边界,而图像的区域特征则关系到整个形状区域;空间关系特征,是指图像中分割出来的多个目标之间的相互的空间位置或相对方向关系,这些关系也可分为连接/邻接关系、交叠/重叠关系和包含/包容关系等。
实施例3
在上一实施例的基础上,所述对训练分类图像的像素进行直接像素映射,得到像素的M维的像素映射系数的方法执行以下步骤:使用如下公式,对训练分类图像的像素进行直接像素映射:T=
Figure DEST_PATH_IMAGE012A
;其中,T为像素映射系数,
Figure 266428DEST_PATH_IMAGE013
为调整系数,取值范围为:0.2~0.5;
Figure 165114DEST_PATH_IMAGE014
表示训练分类图像的
Figure 750947DEST_PATH_IMAGE004
的像素R值,
Figure 494912DEST_PATH_IMAGE005
表示训练分类图像的
Figure 731858DEST_PATH_IMAGE004
的像素G值,
Figure 535866DEST_PATH_IMAGE015
表示训练分类图像的
Figure 128039DEST_PATH_IMAGE004
的像素B值。
实施例4
在上一实施例的基础上,,所述对所述M个直接像素映射图进行池化处理,从而得到所述待提取像素的M维的池化特征的方法执行以下步骤:使用如下公式进行池化处理:
Figure 941274DEST_PATH_IMAGE016
;其中,
Figure 32727DEST_PATH_IMAGE008
为每个直接像素图在所有直接像素图中出现的概率,
Figure 273215DEST_PATH_IMAGE017
表示直接像素图;
Figure 568061DEST_PATH_IMAGE010
为得到的池化特征。
具体的,池化,也即降采样(subsample),降低数据的大小。常用的池化方法是:最大值池化(max_pooling),平均值池化。其中,最常用的是最大值池化。通过使用一个池化核,并采用max_pooling进行池化。
实施例5
在上一实施例的基础上,所述所述分类树为多叉树,包含至少两部分,且所述分类树中各个节点对应各自的分类组;根据所述分类树中各个节点对应的特征值,训练各个父节点各自对应的分类模型,所述特征值预先经过类型标注并存储在对应的节点中,所述父节点对应至少一个子节点,所述分类模型用于将语料划分到对应的子节点;获取待分类图像,所述待分类图像为未知分类组的待预测数据;通过所述分类树中各个节点的所述分类模型对所述待分类图像进行逐级分类。
具体的,树家族是为了实现方便快捷的查找而存在的。树的高度是命中查找的一个不可抗拒的时间下限。在一定的数据条件下,树的高度和宽度是互相制约的。(就像一定面积下,矩形的长和宽是互相制约的)而树家族中最简单的二叉树,尽管易于实现,却不能有实际的价值。其最最令人发指的是二叉树的高度太高。n叉树的提出和实现解决了二叉树的不足,典型的n叉树有:2-3-4树/红黑树和B树。
实施例6
在上一实施例的基础上,所述根据所述分类树中各个节点对应的特征值,训练各个父节点各自对应的分类模型,包括:获取当前父节点对应的各个子节点中对应的所述特征值,以及各个子节点对应的分类类型;根据各个子节点中对应的所述特征值以及各个子节点对应的分类类型,通过预设模型训练算法训练当前父节点对应的分类模型,所述预设模型训练算法包括支持向量机SVM算法、K最邻近分类KNN算法、决策树算法和朴素贝叶斯NBM算法中的至少一种;将训练得到的分类模型存储到当前父节点中。
实施例7
在上一实施例的基础上,所述根据所述分类树中各个节点对应的训练语料,训练各个父节点各自对应的分类模型,还包括:将训练任务添加到等待队列中,所述训练任务用于指示训练父节点对应的分类模型;检测执行队列中训练任务的数量是否小于阈值;若执行队列中训练任务的数量小于所述阈值,则将所述等待队列中的训练任务添加到所述执行队列中,并执行所述获取当前父节点对应的各个子节点中对应的所述特征值,以及各个子节点对应的分类类型的步骤。
实施例8
在上一实施例的基础上,在提取训练分类图像的图像特征之前,还包括对训练分类图像进行图像预处理的步骤,具体包括:根据所述训练分类图像的像素位置信息和像素灰度值信息,对所述训练分类图像进行滤波处理,生成滤波图像;所述像素位置信息是所述训练分类图像中的第一像素与所述第一像素既定邻域范围内其他像素之间的空间距离;所述像素灰度值信息是所述训练分类图像中的第一像素与所述第一像素周围的像素之间的灰度值的差分;根据所述滤波图像的局部像素信息和整体像素信息,对所述滤波图像进行增强处理,生成增强图像;根据所述增强图像,生成类梯度图;对所述类梯度图进行二值化处理,生成二值图像。
具体的,滤波是将信号中特定波段频率滤除的操作,是抑制和防止干扰的一项重要措施。是根据观察某一随机过程的结果,对另一与之有关的随机过程进行估计的概率理论与方法。滤波一词起源于通信理论,它是从含有干扰的接收信号中提取有用信号的一种技术。“接收信号”相当于被观测的随机过程,“有用信号”相当于被估计的随机过程。例如用雷达跟踪飞机,测得的飞机位置的数据中,含有测量误差及其他随机干扰,如何利用这些数据尽可能准确地估计出飞机在每一时刻的位置、速度、加速度等,并预测飞机未来的位置,就是一个滤波与预测问题。这类问题在电子技术、航天科学、控制工程及其他科学技术部门中都是大量存在的。历史上最早考虑的是维纳滤波,后来R.E.卡尔曼和R.S.布西于20世纪60年代提出了卡尔曼滤波。现对一般的非线性滤波问题的研究相当活跃。
实施例9
在上一实施例的基础上,所述根据所述训练分类图像的像素位置信息和像素灰度值信息,对所述训练分类图像进行滤波处理,具体包括:根据所述训练分类图像的像素位置信息,生成高斯模板;根据所述训练分类图像的像素灰度值信息,生成灰度值差分模板,其中,所述高斯模板与所述灰度值差分模板的大小相同;将所述高斯模板中的模板系数与所述灰度值差分模板中对应位置的模板系数相乘,将乘积作为生成的滤波系数模板中对应位置的模板系数;使用所述滤波系数模板,对所述训练分类图像进行滤波处理。
实施例10
一种用于实现前述所述方法的图像分类装置。
以上所述仅为本发明的一个实施例子,但不能以此限制本发明的范围,凡依据本发明所做的结构上的变化,只要不失本发明的要义所在,都应视为落入本发明保护范围之内受到制约。
所属技术领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***的具体工作过程及有关说明,可以参考前述方法实施例中的对应过程,在此不再赘述。
需要说明的是,上述实施例提供的***,仅以上述各功能模块的划分进行举例说明,在实际应用中,可以根据需要而将上述功能分配由不同的功能模块来完成,即将本发明实施例中的模块或者步骤再分解或者组合,例如,上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块,以完成以上描述的全部或者部分功能。对于本发明实施例中涉及的模块、步骤的名称,仅仅是为了区分各个模块或者步骤,不视为对本发明的不当限定。
所属技术领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的存储装置、处理装置的具体工作过程及有关说明,可以参考前述方法实施例中的对应过程,在此不再赘述。
本领域技术人员应该能够意识到,结合本文中所公开的实施例描述的各示例的模块、方法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,软件模块、方法步骤对应的程序可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。为了清楚地说明电子硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以电子硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
术语“第一”、“第二”等是用于区别类似的对象,而不是用于描述或表示特定的顺序或先后次序。
术语“包括”或者任何其它类似用语旨在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备/装置不仅包括那些要素,而且还包括没有明确列出的其它要素,或者还包括这些过程、方法、物品或者设备/装置所固有的要素。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征作出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

Claims (10)

1.图像分类方法,其特征在于,所述方法执行以下步骤:
步骤1:提取训练分类图像的图像特征,得到训练分类图像特征组;
步骤2:对训练分类图像特征组进行特征分析,具体包括:将训练分类图像特征组中的每个特征进行归一化处理后,得到一个特征值;再设定多个比较值,计算特征值与比较值的差异值,以判断特征值与比较值的距离,将计算得到的差异值最小的比较值作为特征值的分类中心;
步骤3:基于每个比较值,以及以该比较值作为分类中心的特征值作为一个分类组;
步骤4:以分类组作为节点建立分类树,对待分类图像进行分类;具体包括:对待分类图像进行特征提取后,得到待分类图像的图像特征,将所有的待分类图像的图像特征作为一个待分类图像特征组,再将待分类图像特征组直接代入分类树进行分类,在分类树分类过程中,从待分类图像特征组中依次取出待分类图像的图像特征,将其放入分类树中进行分类,直到待分类图像特征组中所有的待分类图像的图像特征均被取出,完成图像分类。
2.如权利要求1所述的方法,其特征在于,所述步骤1中提取训练分类图像的图像特征的方法包括:对训练分类图像的像素进行直接像素映射,从而得到像素的M维的像素映射系数,M为大于256的整数;根据像素映射系数,获得训练分类图像对应的M个直接像素映射图,其中,所述M个直接像素映射图中的第k个直接像素映射图中任意坐标点的值为所述任意坐标点对应在像素映射系数在第k个维度下的值,k为小于等于M的正整数;分别对所述M个直接像素映射图进行池化处理,从而得到待提取像素的M维的池化特征,所述M个直接像素映射图与所述池化特征的M个维度一一对应;对所述池化特征进行维度约减,从而得到所述待提取像素的用于表示所述池化特征的约减特征,所述约减特征的维度小于所述池化特征的维度;将得到的约减特征作为提取到的训练分类图像的图像特征。
3.如权利要求2所述的方法,其特征在于,所述对训练分类图像的像素进行直接像素映射,得到像素的M维的像素映射系数的方法执行以下步骤:使用如下公式,对训练分类图像的像素进行直接像素映射:
Figure 774408DEST_PATH_IMAGE001
其中,T为像素映射系数,
Figure 681184DEST_PATH_IMAGE002
取值范围为:0.2~0.5;
Figure 695276DEST_PATH_IMAGE003
表示训练分类图像的
Figure 636687DEST_PATH_IMAGE004
的像素R值,
Figure 343612DEST_PATH_IMAGE005
表示训练分类图像的
Figure 737684DEST_PATH_IMAGE004
的像素G值,
Figure 555468DEST_PATH_IMAGE006
表示训练分类图像的
Figure 85806DEST_PATH_IMAGE004
的像素B值。
4.如权利要求3所述的方法,其特征在于,所述对所述M个直接像素映射图进行池化处理,从而得到所述待提取像素的M维的池化特征的方法执行以下步骤:使用如下公式进行池化处理:
Figure 963632DEST_PATH_IMAGE007
其中,
Figure 845001DEST_PATH_IMAGE008
为每个直接像素图在所有直接像素图中出现的概率,
Figure 466475DEST_PATH_IMAGE009
表示直接像素图;
Figure 116899DEST_PATH_IMAGE010
为得到的池化特征。
5.如权利要求1所述的方法,其特征在于,所述分类树为多叉树,包含至少两部分,且所述分类树中各个节点对应各自的分类组;根据所述分类树中各个节点对应的特征值,训练各个父节点各自对应的分类模型,所述特征值预先经过类型标注并存储在对应的节点中,所述父节点对应至少一个子节点,所述分类模型用于将语料划分到对应的子节点;获取待分类图像,所述待分类图像为未知分类组的待预测数据;通过所述分类树中各个节点的所述分类模型对所述待分类图像进行逐级分类。
6.如权利要求5所述的方法,其特征在于,所述根据所述分类树中各个节点对应的特征值,训练各个父节点各自对应的分类模型,包括:获取当前父节点对应的各个子节点中对应的所述特征值,以及各个子节点对应的分类类型;根据各个子节点中对应的所述特征值以及各个子节点对应的分类类型,通过预设模型训练算法训练当前父节点对应的分类模型,所述预设模型训练算法包括支持向量机SVM算法、K最邻近分类KNN算法、决策树算法和朴素贝叶斯NBM算法中的至少一种;将训练得到的分类模型存储到当前父节点中。
7.如权利要求6所述的方法,其特征在于,所述根据所述分类树中各个节点对应的训练语料,训练各个父节点各自对应的分类模型,还包括:将训练任务添加到等待队列中,所述训练任务用于指示训练父节点对应的分类模型;检测执行队列中训练任务的数量是否小于阈值;若执行队列中训练任务的数量小于所述阈值,则将所述等待队列中的训练任务添加到所述执行队列中,并执行所述获取当前父节点对应的各个子节点中对应的所述特征值,以及各个子节点对应的分类类型的步骤。
8.如权利要求7所述的方法,其特征在于,在提取训练分类图像的图像特征之前,还包括对训练分类图像进行图像预处理的步骤,具体包括:根据所述训练分类图像的像素位置信息和像素灰度值信息,对所述训练分类图像进行滤波处理,生成滤波图像;所述像素位置信息是所述训练分类图像中的第一像素与所述第一像素既定邻域范围内其他像素之间的空间距离;所述像素灰度值信息是所述训练分类图像中的第一像素与所述第一像素周围的像素之间的灰度值的差分;根据所述滤波图像的局部像素信息和整体像素信息,对所述滤波图像进行增强处理,生成增强图像;根据所述增强图像,生成类梯度图;对所述类梯度图进行二值化处理,生成二值图像。
9.如权利要求8所述的方法,其特征在于,所述根据所述训练分类图像的像素位置信息和像素灰度值信息,对所述训练分类图像进行滤波处理,具体包括:根据所述训练分类图像的像素位置信息,生成高斯模板;根据所述训练分类图像的像素灰度值信息,生成灰度值差分模板,其中,所述高斯模板与所述灰度值差分模板的大小相同;将所述高斯模板中的模板系数与所述灰度值差分模板中对应位置的模板系数相乘,将乘积作为生成的滤波系数模板中对应位置的模板系数;使用所述滤波系数模板,对所述训练分类图像进行滤波处理。
10.一种用于实现权利要求1至9之一所述方法的图像分类装置。
CN202110939926.7A 2021-08-17 2021-08-17 图像分类方法和装置 Active CN113408670B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110939926.7A CN113408670B (zh) 2021-08-17 2021-08-17 图像分类方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110939926.7A CN113408670B (zh) 2021-08-17 2021-08-17 图像分类方法和装置

Publications (2)

Publication Number Publication Date
CN113408670A true CN113408670A (zh) 2021-09-17
CN113408670B CN113408670B (zh) 2021-12-10

Family

ID=77688533

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110939926.7A Active CN113408670B (zh) 2021-08-17 2021-08-17 图像分类方法和装置

Country Status (1)

Country Link
CN (1) CN113408670B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106778829A (zh) * 2016-11-28 2017-05-31 常熟理工学院 一种主动学习的肝脏损伤类别的图像检测方法
CN107067022A (zh) * 2017-01-04 2017-08-18 美的集团股份有限公司 图像分类模型的建立方法、建立装置和设备
CN107564010A (zh) * 2017-09-11 2018-01-09 新疆大学 一种结合贝叶斯分类与SLIC的Grabcut彩色图像分割方法
CN109002843A (zh) * 2018-06-28 2018-12-14 Oppo广东移动通信有限公司 图像处理方法和装置、电子设备、计算机可读存储介质
CN111382760A (zh) * 2018-12-28 2020-07-07 Tcl集团股份有限公司 图片类别的识别方法、装置及计算机可读存储介质
CN113222018A (zh) * 2021-05-13 2021-08-06 郑州大学 一种图像分类方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106778829A (zh) * 2016-11-28 2017-05-31 常熟理工学院 一种主动学习的肝脏损伤类别的图像检测方法
CN107067022A (zh) * 2017-01-04 2017-08-18 美的集团股份有限公司 图像分类模型的建立方法、建立装置和设备
CN107564010A (zh) * 2017-09-11 2018-01-09 新疆大学 一种结合贝叶斯分类与SLIC的Grabcut彩色图像分割方法
CN109002843A (zh) * 2018-06-28 2018-12-14 Oppo广东移动通信有限公司 图像处理方法和装置、电子设备、计算机可读存储介质
CN111382760A (zh) * 2018-12-28 2020-07-07 Tcl集团股份有限公司 图片类别的识别方法、装置及计算机可读存储介质
CN113222018A (zh) * 2021-05-13 2021-08-06 郑州大学 一种图像分类方法

Also Published As

Publication number Publication date
CN113408670B (zh) 2021-12-10

Similar Documents

Publication Publication Date Title
CN110543837B (zh) 一种基于潜在目标点的可见光机场飞机检测方法
CN111428748B (zh) 一种基于hog特征和svm的红外图像绝缘子识别检测方法
CN108875659B (zh) 一种基于多光谱遥感影像的海图养殖区识别方法
CN108898065B (zh) 候选区快速筛选与尺度自适应的深度网络舰船目标检测方法
CN109740460B (zh) 基于深度残差密集网络的光学遥感图像舰船检测方法
CN108564085B (zh) 一种自动读取指针式仪表读数的方法
Wang et al. SSRNet: In-field counting wheat ears using multi-stage convolutional neural network
CN112836713A (zh) 基于图像无锚框检测的中尺度对流***识别与追踪方法
CN111079596A (zh) 高分辨率遥感影像的海上典型人造目标识别***及方法
CN111027497B (zh) 基于高分辨率光学遥感影像的弱小目标快速检测方法
CN110647802A (zh) 基于深度学习的遥感影像舰船目标检测方法
CN110070545B (zh) 一种城镇纹理特征密度自动提取城镇建成区的方法
CN107944403A (zh) 一种图像中的行人属性检测方法及装置
CN111915583A (zh) 复杂场景中基于车载红外热像仪的车辆和行人检测方法
CN115797813B (zh) 基于航拍图像的水环境污染检测方法
CN112733736A (zh) 基于增强过采样的类别不平衡高光谱图像分类方法
CN111274964B (zh) 一种基于无人机视觉显著性分析水面污染物的检测方法
CN111368865A (zh) 遥感影像储油罐检测方法、装置、可读存储介质及设备
CN117475327A (zh) 一种城市中基于遥感图像的多目标检测定位方法和***
CN117351371A (zh) 一种基于深度学习的遥感图像目标检测方法
CN113408670B (zh) 图像分类方法和装置
CN109829511B (zh) 基于纹理分类的下视红外图像中云层区域检测方法
CN114742849B (zh) 一种基于图像增强的水准仪距离测量方法
CN113920391B (zh) 一种基于生成尺度自适应真值图的目标计数方法
CN113316080B (zh) 基于Wi-Fi与图像融合指纹的室内定位方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20231012

Address after: A310, Suojia Science and Technology Park Comprehensive Building, Sanwei Community, Hangcheng Street, Bao'an District, Shenzhen City, Guangdong Province, 518000

Patentee after: Lisheng Innovation (Shenzhen) Co.,Ltd.

Address before: 518000 room B3, room 403-404, China Construction Building, No. 2105, Shennan East Road, Xinnan community, Nanhu street, Luohu District, Shenzhen, Guangdong Province

Patentee before: SHENZHEN DIANTONG INFORMATION TECHNOLOGY Co.,Ltd.

TR01 Transfer of patent right