CN106503728A - 一种图像识别方法和装置 - Google Patents
一种图像识别方法和装置 Download PDFInfo
- Publication number
- CN106503728A CN106503728A CN201610874205.1A CN201610874205A CN106503728A CN 106503728 A CN106503728 A CN 106503728A CN 201610874205 A CN201610874205 A CN 201610874205A CN 106503728 A CN106503728 A CN 106503728A
- Authority
- CN
- China
- Prior art keywords
- feature
- image
- cascade
- tree
- subtending
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种图像识别方法和装置,所述方法包括:获取待识别图像的至少两类图像特征;确定所述至少两类图像特征中的每类图像特征所对应的分类器,所述图像特征以及与所述图像特征对应的分类器形成至少一个级联树节点;将所述至少一个级联树节点进行随机组合以构成特征级联树;将所述特征级联树组成构成特征级联森林并基于所述特征级联森林对所述待识别图像进行图像识别。本发明通过提取待识别图像的至少两类图像特征以及与其对应的分类器生成特征级联树并基于该特征级联树进行图像识别,从而由于采用特征分类器组合的方式无需匹配多个特征,通用特征集合可以有效规避特征选择造成的不稳定性,从而提高特征识别准确率。
Description
技术领域
本发明涉及图像识别领域,特别是涉及一种图像识别方法和装置。
背景技术
随着图像处理技术的发展,越来越多的领域开始使用图像处理技术,例如,在工业领域,开始使用图像识别工业元件代替以前人工识别工业元件的方法等。
现有图像识别技术大多是基于多区域、多特征的识别方法,现有的多特征前期融合需要将不同维度,不同取值范围的特征拼接在一起,容易造成特征维数太高而导致过拟合、高维度特征覆盖低维度特征对识别的影响、特征人工选取造成识别不稳定等问题,从而使得图像识别准确率低。
发明内容
本发明实施例提供一种图像识别方法及装置,以期提高图像识别准确率。
第一方面,本发明提供了一种图像识别方法,包括:
获取待识别图像的至少两类图像特征;
确定所述至少两类图像特征中的每类图像特征所对应的分类器,所述图像特征以及与所述图像特征对应的分类器形成至少一个级联树节点;
将所述至少一个级联树节点进行随机组合以构成特征级联树;
将所述特征级联树组成构成特征级联森林并基于所述特征级联森林对所述待识别图像进行图像识别。
第二方面,本发明提供了一种图像识别装置,包括:
获取模块,用于获取待识别图像的至少两类图像特征;
确定模块,用于确定所述至少两类图像特征中的每类图像特征所对应的分类器,所述图像特征以及与所述图像特征对应的分类器形成至少一个级联树节点;
构成模块,用于将所述至少一个级联树节点进行随机组合以构成特征级联树;
识别模块,用于将所述特征级联树组成构成特征级联森林并基于所述特征级联森林对所述待识别图像进行图像识别。
可以看出,在本发明实施例的方案中,首先获取待识别图像的至少两类图像特征;其次确定所述至少两类图像特征中的每类图像特征所对应的分类器,所述图像特征以及与所述图像特征对应的匹配分类器形成至少一个级联树节点;然后将所述至少一个级联树节点进行随机组合以构成特征级联树;最后将所述特征级联树组成构成特征级联森林并基于所述特征级联森林对所述待识别图像进行图像识别。可见,相较于现有技术,本方案通过提取待识别图像的至少两类图像特征以及与其对应的分类器生成特征级联树并基于该特征级联树进行图像识别,从而由于采用特征分类器组合的方式无需匹配多个特征,通用特征集合可以有效规避特征选择造成的不稳定性,从而提高特征识别准确率。
更进一步地,现有的多特征分类识别方法常常需要将多种特征通过前期或后期融合在一起,因此需要匹配不同类型特征的取值范围和核融合参数,容易造成准确率退化,待拟合参数过多等问题。而本发明方案采用的特征及其匹配分类器则无需拟合融合参数及其核函数参数,可以降低现有多特征融合方法中由高维度向量、多待拟合参数而造成的大运算量,提高图像识别效率。
更进一步地,本方案采用的图像识别方法规避了高维特征、多待拟合参数的造成的复杂运算,从而提高识别效率。同时也避免了过拟合和特征选择对识别结果的影响。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种图像识别方法流程示意图;
图2是本发明实施例提供的特征级联树的生成示意图;
图3是本发明实施例提供的另一种图像识别方法流程示意图;
图4是本发明实施例提供的一种图像识别装置示意图;
图5是本发明实施例提供的另一种图像识别装置示意图;
图6是本发明实施例提供的又一种图像识别装置示意图。
具体实施方式
本发明实施例提供了一种图像识别方法及装置,以期可以提高图像识别准确率。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
本发明实施例提供的一种图像识别方法,包括:
获取待识别图像的至少两类图像特征;
确定所述至少两类图像特征中的每类图像特征所对应的分类器,所述图像特征以及与所述图像特征对应的匹配分类器形成至少一个级联树节点;
将所述至少一个级联树节点进行随机组合以构成特征级联树;
将所述特征级联树组成构成特征级联森林并基于所述特征级联森林对所述待识别图像进行图像识别。
请参见图1,图1是本发明实施例提供的一种图像识别方法流程示意图。如图1所示,本发明实施例提供的一种图像识别方法包括以下步骤:
S101、获取待识别图像的至少两类图像特征。
其中,待识别图像是指需要识别的目标图像,可以是摄像机所采集到的图像,在本发明实施例中,该待识别图像需要为彩色图像,可以为bmp或jpeg等格式,可以支持CMYK或RGB等色彩模式。
可选地,该待识别图像可以为所有需要识别的目标彩色图像,例如,服装图像、家具图像、人物图像等。
本发明实施例所应用的场景包括:筛选出具有指定特征的图片,如是否为红色、有条纹花纹的棱柱;判断两幅图像是否相似,如这两幅图对应特征之间的距离是否小于阈值;寻找与指定图片最相似的N幅图,如寻找最近N近邻等。
具体地,所述图像特征包括不同种类的图像特征,所述不同种类的图像特征包括:颜色、纹理或形状;或者,
所述图像特征包括同一种类不同类型的图像特征,所述同一种类不同类型的图像特征:所述颜色特征中的直方图特征或颜色矩阵、所述纹理特征中的最大响应滤波器Maximum Response Filters、局部二值模式(Local Binary Pattern,简称LBP)或灰度共生矩阵(gray level co-occurrence matrix,简称GLCM)、所述全局特征中的尺度不变换特征(Scale-invariant feature transform,简称SIFT)。
可选地,该图像特征还可以为其它可用于表征图像特征的图像特征。
具体地,在本发明的一个示例中,可以选择待识别图像的颜色特征和纹理特征去识别服装图像中的图案。
在本发明实施例中,提取的特征类型和数目没有限制,特征之间可以相关也可以相互独立,多种通用特征的分区域组合适用于大部分图像识别,因此无需人工选取特征,可以减小传统的机器学习方法中由于特征选取时不能把握所识别图像的本质而造成的不稳定性。
具体地,当对待识别图像的整体或部分分别提取不同种类或同一种类不同类型的特征后得到:
F1,F2,...,FN。
S102、确定所述至少两类图像特征中的每类图像特征所对应的分类器,所述图像特征以及与所述图像特征对应的分类器形成至少一个级联树节点。
具体地,可以根据识别要求以及各类特征的特点选择所对应的匹配分类器。
具体地,该识别要求可以根据具体地应用场景进行确定,例如:筛选出具有指定特征的图片,如是否为红色、有条纹花纹的棱柱;判断两幅图像是否相似,如这两幅图对应特征之间的距离是否小于阈值;寻找与指定图片最相似的N幅图,如寻找最近N近邻等。
具体地,特征的特点包括:提取的特征是否线性可分、特征的维度、特征的取值范围、特征的稀疏性等等。
具体地,所述分类器包括:支持向量机SVM、邻近算法KNN或朴素贝叶斯。
可选地,该分类器还可以为其它与该图像特征对应的分类器。
可选地,在本发明的一个示例中,当图像特征为颜色特征时,则对应的分类器可以为KNN,此时可以将颜色特征和分类器KNN组成一个级联树节点,当图像特征为形状特征时,对应的分类器可以为SVM,此时可以将形状特征和SVM组成一个级联树节点。
具体地,当将N个图像特征以及与图像特征对应的N个分类器形成匹配节点后可得到N个级联树节点为:{F1,C1}{F2,C2}…{FN,CN}。
S103、将所述至少一个级联树节点进行随机组合以构成特征级联树。
具体地,将图像特征及其对应的分类器无放回地随机抽样组合,生成不同的随机特征级联树,参见图2,图2是本发明实施例提供的特征级联树的生成示意图。
举例说明,在本发明的一个示例中,当有三个图像特征与三个分类器构成三个级联树节点后,例如构成的三个级联树节点为A1,A2和A3,将三个级联树节点进行随机组合可得到6个不同的特征级联树(A1,A2,A3);(A1,A3,A2);(A2,A1,A3);(A2,A3,A1);(A3,A1,A2);(A3,A2,A1)。
S104、将所述特征级联树组成构成特征级联森林并基于所述特征级联森林对所述待识别图像进行图像识别。
具体地,将步骤S103得到的特征级联树组合到一起后即可得到特征级联森林。
举例说明,在本发明的一个示例中,当有三个图像特征与三个分类器构成三个级联树节点后,例如构成的三个级联树节点为A1,A2和A3,将三个级联树节点进行随机组合可得到6个不同的特征级联树(A1,A2,A3);(A1,A3,A2);(A2,A1,A3);(A2,A3,A1);(A3,A1,A2);(A3,A2,A1),则再将这6个特征级联树组合生成包括这6个特征级联树的特征级联森林。
可以看出,在本发明实施例的方案中,首先获取待识别图像的至少两类图像特征;其次确定所述至少两类图像特征中的每类图像特征所对应的分类器,所述图像特征以及与所述图像特征对应的匹配分类器形成至少一个级联树节点;然后将所述至少一个级联树节点进行随机组合以构成特征级联树;最后将所述特征级联树组成构成特征级联森林并基于所述特征级联森林对所述待识别图像进行图像识别。可见,相较于现有技术,本方案通过提取待识别图像的至少两类图像特征以及与其对应的分类器生成特征级联树并基于该特征级联树进行图像识别,从而由于采用特征分类器组合的方式无需匹配多个特征,通用特征集合可以有效规避特征选择造成的不稳定性,从而提高特征识别准确率。
更进一步地,现有的多特征分类识别方法常常需要将多种特征通过前期或后期融合在一起,因此需要匹配不同类型特征的取值范围和核融合参数,容易造成准确率退化,待拟合参数过多等问题。而本发明方案采用的特征及其匹配分类器则无需拟合融合参数及其核函数参数,可以降低现有多特征融合方法中由高维度向量、多待拟合参数而造成的大运算量,提高图像识别效率。
更进一步地,本方案采用的图像识别方法规避了高维特征、多待拟合参数的造成的复杂运算,从而提高识别效率。同时也避免了过拟合和特征选择对识别结果的影响。
可选地,在本发明的一些可能的实施方式中,在将所述特征级联树组成构成特征级联森林之前,所述方法还包括:
判断所述特征级联树中第i个级联树节点是否为有效级联树节点;
若所述特征级联树中第i个级联树节点不为有效级联树节点,则删除所述第i个级联树节点。
其中,有效级联树节点是指在利用该特征级联森林进行识别的过程中,对识别过程产生明显有益效果的级联树节点,从而可以根据每棵特征级联树的节点是否对分类结果有明显改善来判断该级联树节点是否为有效级联树节点,并确定是否应该保留该节点。
可选地,可以用识别准确率来判断该级联树节点是否为有效级联树节点。
可选地,也可以为其它有效参数来判断该级联树节点是否为有效级联树节点。
可以理解,通过进一步对有效级联树节点进行筛选,可以减小特征和分类的选取对识别的影响,从而避免多特征维数过高而造成的过拟合,提高识别效率与准确率。
具体地,所述判断所述特征级联树中第i个级联树节点是否为有效级联树节点,包括:
判断所述第i级的识别准确率与所述第i-1级的识别准确率的差值是否满足预设准确率阈值,以在所述第i级的识别准确率与所述第i-1级的识别准确率的差值不满足预设准确率阈值的情况下确定所述特征级联树中第i个级联树节点不为有效级联树节点。
举例说明,在本发明的一个示例中,由于级联树的每个节点具有图像特征及其对应的分类器,因此可以用测试数据分别得到每个节点的识别准确率。设第i级的识别准确率为Ai,若该级分类识别的准确率Ai与前一级Ai-1的差值满足:
|Ai-Ai-1|≤Threshold或Ai-1-Ai>Threshold
则第i级的特征及其匹配的分类器对分类识别准确率的提高可以忽略,因此可以去除该级。
反之,若该级分类识别的准确率Ai与前一级Ai-1的差值满足:
Di=Ai-Ai-1>Threshold。
可以理解,通过判断该级的识别准确率与其上级的识别准确率的差值,从而当该差值比较小时,则说明该级的级联树节点在图像识别过程中所产生的作用非常细微,此时说明可以删除该级联树节点,以进一步修剪特征级树树或特征级联森林,提高图像识别效率与准确率。
请参见图3,图3是本发明实施例提供的另一种图像识别方法流程示意图。如图3所示,本发明实施例提供的一种图像识别方法包括以下步骤:
301、获取待识别图像的至少两类图像特征。
其中,待识别图像是指需要识别的目标图像,可以是摄像机所采集到的图像,在本发明实施例中,该待识别图像需要为彩色图像,可以为bmp或jpeg等格式,可以支持CMYK或RGB等色彩模式。
可选地,该待识别图像可以为所有需要识别的目标彩色图像,例如,服装图像、家具图像、人物图像等。
本发明实施例所应用的场景包括:筛选出具有指定特征的图片,如是否为红色、有条纹花纹的棱柱;判断两幅图像是否相似,如这两幅图对应特征之间的距离是否小于阈值;寻找与指定图片最相似的N幅图,如寻找最近N近邻等。
具体地,所述图像特征包括不同种类的图像特征,所述不同种类的图像特征包括:颜色、纹理或形状;或者,
所述图像特征包括同一种类不同类型的图像特征,所述同一种类不同类型的图像特征:所述颜色特征中的直方图特征或颜色矩阵、所述纹理特征中的最大响应滤波器Maximum Response Filters、局部二值模式(Local Binary Pattern,简称LBP)或灰度共生矩阵(gray level co-occurrence matrix,简称GLCM)、所述全局特征中的SIFT。
可选地,该图像特征还可以为其它可用于表征图像特征的图像特征。
具体地,在本发明的一个示例中,可以选择待识别图像的颜色特征和纹理特征去识别服装图像中的图案。
在本发明实施例中,提取的特征类型和数目没有限制,特征之间可以相关也可以相互独立,多种通用特征的分区域组合适用于大部分图像识别,因此无需人工选取特征,可以减小传统的机器学习方法中由于特征选取时不能把握所识别图像的本质而造成的不稳定性。
具体地,当对待识别图像的整体或部分分别提取不同种类或同一种类不同类型的特征后得到:
F1,F2,...,FN。
302、确定至少两类图像特征中的每类图像特征所对应的分类器。
其中,该图像特征以及与图像特征对应的分类器形成至少一个级联树节点。
具体地,可以根据识别要求以及各类图像特征的特点选择所对应的匹配分类器。
具体地,该识别要求可以根据具体地应用场景进行确定,例如:筛选出具有指定特征的图片,如是否为红色、有条纹花纹的棱柱;判断两幅图像是否相似,如这两幅图对应特征之间的距离是否小于阈值;寻找与指定图片最相似的N幅图,如寻找最近N近邻等。
具体地,特征的特点包括:提取的特征是否线性可分、特征的维度、特征的取值范围、特征的稀疏性等等。
具体地,所述分类器包括:支持向量机SVM、邻近算法KNN或朴素贝叶斯。
可选地,该分类器还可以为其它与该图像特征对应的分类器。
可选地,在本发明的一个示例中,当图像特征为颜色特征时,则对应的分类器可以为KNN,此时可以将颜色特征和分类器KNN组成一个级联树节点,当图像特征为形状特征时,对应的分类器可以为SVM,此时可以将形状特征和SVM组成一个级联树节点。
具体地,当将N个图像特征以及与图像特征对应的N个分类器形成匹配节点后可得到N个级联树节点为:{F1,C1}{F2,C2}…{FN,CN}。
303、将至少一个级联树节点进行随机组合以构成特征级联树。
具体地,将图像特征及其对应的分类器无放回地随机抽样组合,生成不同的随机特征级联树,参见图2,图2是本发明实施例提供的特征级联树的生成示意图。
举例说明,在本发明的一个示例中,当有三个图像特征与三个分类器构成三个级联树节点后,例如构成的三个级联树节点为A1,A2和A3,将三个级联树节点进行随机组合可得到6个不同的特征级联树(A1,A2,A3);(A1,A3,A2);(A2,A1,A3);(A2,A3,A1);(A3,A1,A2);(A3,A2,A1)。
304、判断特征级联树中第i个级联树节点是否为有效级联树节点。
其中,有效级联树节点是指在利用该特征级联森林进行识别的过程中,对识别过程产生明显有益效果的级联树节点,从而可以根据每棵特征级联树的节点是否对分类结果有明显改善来判断该级联树节点是否为有效级联树节点,并确定是否应该保留该节点。
可选地,可以用识别准确率来判断该级联树节点是否为有效级联树节点。
可选地,也可以为其它有效参数来判断该级联树节点是否为有效级联树节点。
可以理解,通过进一步对有效级联树节点进行筛选,可以减小特征和分类的选取对识别的影响,从而避免多特征维数过高而造成的过拟合,提高识别效率与准确率。
具体地,所述判断所述特征级联树中第i个级联树节点是否为有效级联树节点,包括:
判断所述第i级的识别准确率与所述第i-1级的识别准确率的差值是否满足预设准确率阈值,以在所述第i级的识别准确率与所述第i-1级的识别准确率的差值不满足预设准确率阈值的情况下确定所述特征级联树中第i个级联树节点不为有效级联树节点。
举例说明,在本发明的一个示例中,由于级联树的每个节点具有图像特征及其对应的分类器,因此可以用测试数据分别得到每个节点的识别准确率。设第i级的识别准确率为Ai,若该级分类识别的准确率Ai与前一级Ai-1的差值满足:
|Ai-Ai-1|≤Threshold或Ai-1-Ai>Threshold
则第i级的特征及其匹配的分类器对分类识别准确率的提高可以忽略,因此可以去除该级。
反之,若该级分类识别的准确率Ai与前一级Ai-1的差值满足:
Di=Ai-Ai-1>Threshold。
305、若特征级联树中第i个级联树节点不为有效级联树节点,则删除该第i个级联树节点。
306、将删除无效级联树节点后的特征级联树构成特征级联森林并基于所述特征级联森林对所述待识别图像进行图像识别。
举例说明,在本发明的一个示例中,当有三个图像特征与三个分类器构成三个级联树节点后,例如构成的三个级联树节点为A1,A2和A3,将三个级联树节点进行随机组合可得到6个不同的特征级联树(A1,A2,A3);(A1,A3,A2);(A2,A1,A3);(A2,A3,A1);(A3,A1,A2);(A3,A2,A1),则再将这6个特征级联树组合生成包括这6个特征级联树的特征级联森林。
可以看出,在本发明实施例的方案中,首先获取待识别图像的至少两类图像特征;其次确定所述至少两类图像特征中的每类图像特征所对应的分类器,所述图像特征以及与所述图像特征对应的匹配分类器形成至少一个级联树节点;然后将所述至少一个级联树节点进行随机组合以构成特征级联树;最后将所述特征级联树组成构成特征级联森林并基于所述特征级联森林对所述待识别图像进行图像识别。可见,相较于现有技术,本方案通过提取待识别图像的至少两类图像特征以及与其对应的分类器生成特征级联树并基于该特征级联树进行图像识别,从而由于采用特征分类器组合的方式无需匹配多个特征,通用特征集合可以有效规避特征选择造成的不稳定性,从而提高特征识别准确率。
更进一步地,现有的多特征分类识别方法常常需要将多种特征通过前期或后期融合在一起,因此需要匹配不同类型特征的取值范围和核融合参数,容易造成准确率退化,待拟合参数过多等问题。而本发明方案采用的特征及其匹配分类器则无需拟合融合参数及其核函数参数,可以降低现有多特征融合方法中由高维度向量、多待拟合参数而造成的大运算量,提高图像识别效率。
更进一步地,本方案采用的图像识别方法规避了高维特征、多待拟合参数的造成的复杂运算,从而提高识别效率。同时也避免了过拟合和特征选择对识别结果的影响。
更进一步地,通过判断该级的识别准确率与其上级的识别准确率的差值,从而当该差值比较小时,则说明该级的级联树节点在图像识别过程中所产生的作用非常细微,此时说明可以删除该级联树节点,以进一步修剪特征级树树或特征级联森林,提高图像识别效率与准确率。
本发明实施例还提供一种图像识别装置,包括:
获取模块,用于获取待识别图像的至少两类图像特征;
确定模块,用于确定所述至少两类图像特征中的每类图像特征所对应的分类器,所述图像特征以及与所述图像特征对应的分类器形成至少一个级联树节点;
构成模块,用于将所述至少一个级联树节点进行随机组合以构成特征级联树;
识别模块,用于将所述特征级联树组成构成特征级联森林并基于所述特征级联森林对所述待识别图像进行图像识别。
请参见图4,图4是本发明实施例提供的一种图像识别装置400的结构示意图。如图4所示,本发明实施例提供的一种图像识别装置400,包括:
获取模块410、确定模块420、构成模块430和识别模块440。
其中,获取模块410,用于获取待识别图像的至少两类图像特征。
其中,待识别图像是指需要识别的目标图像,可以是摄像机所采集到的图像,在本发明实施例中,该待识别图像需要为彩色图像,可以为bmp或jpeg等格式,可以支持CMYK或RGB等色彩模式。
可选地,该待识别图像可以为所有需要识别的目标彩色图像,例如,服装图像、家具图像、人物图像等。
本发明实施例所应用的场景包括:筛选出具有指定特征的图片,如是否为红色、有条纹花纹的棱柱;判断两幅图像是否相似,如这两幅图对应特征之间的距离是否小于阈值;寻找与指定图片最相似的N幅图,如寻找最近N近邻等。
具体地,所述图像特征包括不同种类的图像特征,所述不同种类的图像特征包括:颜色、纹理或形状;或者,
所述图像特征包括同一种类不同类型的图像特征,所述同一种类不同类型的图像特征:所述颜色特征中的直方图特征或颜色矩阵、所述纹理特征中的最大响应滤波器Maximum Response Filters、局部二值模式(Local Binary Pattern,简称LBP)或灰度共生矩阵(gray level co-occurrence matrix,简称GLCM)、所述全局特征中的SIFT。
可选地,该图像特征还可以为其它可用于表征图像特征的图像特征。
具体地,在本发明的一个示例中,可以选择待识别图像的颜色特征和纹理特征去识别服装图像中的图案。
在本发明实施例中,提取的特征类型和数目没有限制,特征之间可以相关也可以相互独立,多种通用特征的分区域组合适用于大部分图像识别,因此无需人工选取特征,可以减小传统的机器学习方法中由于特征选取时不能把握所识别图像的本质而造成的不稳定性。
具体地,当对待识别图像的整体或部分分别提取不同种类或同一种类不同类型的特征后得到:
F1,F2,...,FN。
确定模块420,用于确定所述至少两类图像特征中的每类图像特征所对应的分类器,所述图像特征以及与所述图像特征对应的分类器形成至少一个级联树节点。
具体地,可以根据识别要求以及各个特征的特点选择所对应的匹配分类器。
具体地,该识别要求可以根据具体地应用场景进行确定,例如:筛选出具有指定特征的图片,如是否为红色、有条纹花纹的棱柱;判断两幅图像是否相似,如这两幅图对应特征之间的距离是否小于阈值;寻找与指定图片最相似的N幅图,如寻找最近N近邻等。
具体地,特征的特点包括:提取的特征是否线性可分、特征的维度、特征的取值范围、特征的稀疏性等等。
具体地,所述分类器包括:支持向量机SVM、邻近算法KNN或朴素贝叶斯。
可选地,该分类器还可以为其它与该图像特征对应的分类器。
可选地,在本发明的一个示例中,当图像特征为颜色特征时,则对应的分类器可以为KNN,此时可以将颜色特征和分类器KNN组成一个级联树节点,当图像特征为形状特征时,对应的分类器可以为SVM,此时可以将形状特征和SVM组成一个级联树节点。
具体地,当将N个图像特征以及与图像特征对应的N个分类器形成匹配节点后可得到N个级联树节点为:{F1,C1}{F2,C2}…{FN,CN}。
构成模块430,用于将所述至少一个级联树节点进行随机组合以构成特征级联树。
具体地,将图像特征及其对应的分类器无放回地随机抽样组合,生成不同的随机特征级联树,参见图2,图2是本发明实施例提供的特征级联树的生成示意图。
举例说明,在本发明的一个示例中,当有三个图像特征与三个分类器构成三个级联树节点后,例如构成的三个级联树节点为A1,A2和A3,将三个级联树节点进行随机组合可得到6个不同的特征级联树(A1,A2,A3);(A1,A3,A2);(A2,A1,A3);(A2,A3,A1);(A3,A1,A2);(A3,A2,A1)。
识别模块440,用于将所述特征级联树组成构成特征级联森林并基于所述特征级联森林对所述待识别图像进行图像识别。
举例说明,在本发明的一个示例中,当有三个图像特征与三个分类器构成三个级联树节点后,例如构成的三个级联树节点为A1,A2和A3,将三个级联树节点进行随机组合可得到6个不同的特征级联树(A1,A2,A3);(A1,A3,A2);(A2,A1,A3);(A2,A3,A1);(A3,A1,A2);(A3,A2,A1),则再将这6个特征级联树组合生成包括这6个特征级联树的特征级联森林。
可以看出,本实施例的方案中,图像识别装置500首先获取待识别图像的至少两类图像特征;其次确定所述至少两类图像特征中的每类图像特征所对应的分类器,所述图像特征以及与所述图像特征对应的匹配分类器形成至少一个级联树节点;然后将所述至少一个级联树节点进行随机组合以构成特征级联树;最后将所述特征级联树组成构成特征级联森林并基于所述特征级联森林对所述待识别图像进行图像识别。可见,相较于现有技术,本方案通过提取待识别图像的至少两类图像特征以及与其对应的分类器生成特征级联树并基于该特征级联树进行图像识别,从而由于采用特征分类器组合的方式无需匹配多个特征,通用特征集合可以有效规避特征选择造成的不稳定性,从而提高特征识别准确率。
更进一步地,现有的多特征分类识别方法常常需要将多种特征通过前期或后期融合在一起,因此需要匹配不同类型特征的取值范围和核融合参数,容易造成准确率退化,待拟合参数过多等问题。而本发明方案采用的特征及其匹配分类器则无需拟合融合参数及其核函数参数,可以降低现有多特征融合方法中由高维度向量、多待拟合参数而造成的大运算量,提高图像识别效率。
更进一步地,本方案采用的图像识别方法规避了高维特征、多待拟合参数的造成的复杂运算,从而提高识别效率。同时也避免了过拟合和特征选择对识别结果的影响。
在本实施例中,图像识别装置400是以单元的形式来呈现。这里的“单元”可以指特定应用集成电路(application-specific integrated circuit,ASIC),执行一个或多个软件或固件程序的处理器和存储器,集成逻辑电路,和/或其他可以提供上述功能的器件。
可以理解的是,本实施例的图像识别装置400的各功能单元的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
参见图5,图5是本发明实施例提供的另一种图像识别装置500的结构示意图,用于实现本发明实施例公开的图像识别方法。其中,如图5所示的终端是由图4所示的终端进行优化得到的。图5所示的终端除了包括图4所示的图像识别装置400的模块之外,还有以下扩展:
可选地,在本发明的一些可能的实施方式中,所述图像识别装置500还包括:
判断模块550,用于判断所述特征级联树中第i个级联树节点是否为有效级联树节点;
删除模块560,用于若所述特征级联树中第i个级联树节点不为有效级联树节点,则删除所述第i个级联树节点。
可选地,可以用识别准确率来判断该级联树节点是否为有效级联树节点。
可选地,也可以为其它有效参数来判断该级联树节点是否为有效级联树节点。
可以理解,通过进一步对有效级联树节点进行筛选,可以减小特征和分类的选取对识别的影响,从而避免多特征维数过高而造成的过拟合,提高识别效率与准确率。
具体地,所述判断模块550判断所述特征级联树中第i个级联树节点是否为有效级联树节点,具体包括:
判断所述第i级的识别准确率与所述第i-1级的识别准确率的差值是否满足预设准确率阈值,以在所述第i级的识别准确率与所述第i-1级的识别准确率的差值不满足预设准确率阈值的情况下确定所述特征级联树中第i个级联树节点不为有效级联树节点。
举例说明,在本发明的一个示例中,由于级联树的每个节点具有图像特征及其对应的分类器,因此可以用测试数据分别得到每个节点的识别准确率。设第i级的识别准确率为Ai,若该级分类识别的准确率Ai与前一级Ai-1的差值满足:
|Ai-Ai-1|≤Threshold或Ai-1-Ai>Threshold
则第i级的特征及其匹配的分类器对分类识别准确率的提高可以忽略,因此可以去除该级。
反之,若该级分类识别的准确率Ai与前一级Ai-1的差值满足:
Di=Ai-Ai-1>Threshold。
可以理解,通过判断该级的识别准确率与其上级的识别准确率的差值,从而当该差值比较小时,则说明该级的级联树节点在图像识别过程中所产生的作用非常细微,此时说明可以删除该级联树节点,以进一步修剪特征级树树或特征级联森林,提高图像识别效率与准确率。
可以看出,本实施例的方案中,图像识别装置500首先获取待识别图像的至少两类图像特征;其次确定所述至少两类图像特征中的每类图像特征所对应的分类器,所述图像特征以及与所述图像特征对应的匹配分类器形成至少一个级联树节点;然后将所述至少一个级联树节点进行随机组合以构成特征级联树;最后将所述特征级联树组成构成特征级联森林并基于所述特征级联森林对所述待识别图像进行图像识别。可见,相较于现有技术,本方案通过提取待识别图像的至少两类图像特征以及与其对应的分类器生成特征级联树并基于该特征级联树进行图像识别,从而由于采用特征分类器组合的方式无需匹配多个特征,通用特征集合可以有效规避特征选择造成的不稳定性,从而提高特征识别准确率。
更进一步地,现有的多特征分类识别方法常常需要将多种特征通过前期或后期融合在一起,因此需要匹配不同类型特征的取值范围和核融合参数,容易造成准确率退化,待拟合参数过多等问题。而本发明方案采用的特征及其匹配分类器则无需拟合融合参数及其核函数参数,可以降低现有多特征融合方法中由高维度向量、多待拟合参数而造成的大运算量,提高图像识别效率。
更进一步地,本方案采用的图像识别方法规避了高维特征、多待拟合参数的造成的复杂运算,从而提高识别效率。同时也避免了过拟合和特征选择对识别结果的影响。
在本实施例中,图像识别装置500是以单元的形式来呈现。这里的“单元”可以指特定应用集成电路(application-specific integrated circuit,ASIC),执行一个或多个软件或固件程序的处理器和存储器,集成逻辑电路,和/或其他可以提供上述功能的器件。
可以理解的是,本实施例的图像识别装置500的各功能单元的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
参见图6,图6是本发明实施例提供的又一种图像识别装置的结构示意图,用于实现本发明实施例公开的图像识别方法。其中,该图像识别装置600可以包括:至少一个总线601、与总线601相连的至少一个处理器602以及与总线601相连的至少一个存储器603。
其中,处理器602通过总线601,调用存储器中存储的代码以用于获取待识别图像的至少两类图像特征;确定所述至少两类图像特征中的每类图像特征所对应的分类器,所述图像特征以及与所述图像特征对应的分类器形成至少一个级联树节点;将所述至少一个级联树节点进行随机组合以构成特征级联树;将所述特征级联树组成构成特征级联森林并基于所述特征级联森林对所述待识别图像进行图像识别。
可选地,处理器602还用于:
判断所述特征级联树中第i个级联树节点是否为有效级联树节点;
若所述特征级联树中第i个级联树节点不为有效级联树节点,则删除所述第i个级联树节点。
可选地,处理器602判断所述特征级联树中第i个级联树节点是否为有效级联树节点,包括:
判断所述第i级的识别准确率与所述第i-1级的识别准确率的差值是否满足预设准确率阈值,以在所述第i级的识别准确率与所述第i-1级的识别准确率的差值不满足预设准确率阈值的情况下确定所述特征级联树中第i个级联树节点不为有效级联树节点。
可选地,所述图像特征包括不同种类的图像特征,所述不同种类的图像特征包括:颜色、纹理或形状;或者,
所述图像特征包括同一种类不同类型的图像特征,所述同一种类不同类型的图像特征:所述颜色特征中的直方图特征或颜色矩阵、所述纹理特征中的最大响应滤波器Maximum Response Filters、局部二值模式LBP或灰度共生矩阵GLCM、所述全局特征中的SIFT。
可选地,所述分类器包括:支持向量机SVM、邻近算法KNN或朴素贝叶斯。
可以看出,本实施例的方案中,图像识别装置600首先获取待识别图像的至少两类图像特征;其次确定所述至少两类图像特征中的每类图像特征所对应的分类器,所述图像特征以及与所述图像特征对应的匹配分类器形成至少一个级联树节点;然后将所述至少一个级联树节点进行随机组合以构成特征级联树;最后将所述特征级联树组成构成特征级联森林并基于所述特征级联森林对所述待识别图像进行图像识别。可见,相较于现有技术,本方案通过提取待识别图像的至少两类图像特征以及与其对应的分类器生成特征级联树并基于该特征级联树进行图像识别,从而由于采用特征分类器组合的方式无需匹配多个特征,通用特征集合可以有效规避特征选择造成的不稳定性,从而提高特征识别准确率。
更进一步地,现有的多特征分类识别方法常常需要将多种特征通过前期或后期融合在一起,因此需要匹配不同类型特征的取值范围和核融合参数,容易造成准确率退化,待拟合参数过多等问题。而本发明方案采用的特征及其匹配分类器则无需拟合融合参数及其核函数参数,可以降低现有多特征融合方法中由高维度向量、多待拟合参数而造成的大运算量,提高图像识别效率。
更进一步地,本方案采用的图像识别方法规避了高维特征、多待拟合参数的造成的复杂运算,从而提高识别效率。同时也避免了过拟合和特征选择对识别结果的影响。
在本实施例中,图像识别装置600是以单元的形式来呈现。这里的“单元”可以指特定应用集成电路(application-specific integrated circuit,ASIC),执行一个或多个软件或固件程序的处理器和存储器,集成逻辑电路,和/或其他可以提供上述功能的器件。
可以理解的是,本实施例的图像识别装置600的各功能单元的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所揭露的仅为本发明一种较佳实施例而已,当然不能以此来限定本发明之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本发明权利要求所作的等同变化,仍属于发明所涵盖的范围。
Claims (10)
1.一种图像识别方法,其特征在于,所述方法包括:
获取待识别图像的至少两类图像特征;
确定所述至少两类图像特征中的每类图像特征所对应的分类器,所述图像特征以及与所述图像特征对应的分类器形成至少一个级联树节点;
将所述至少一个级联树节点进行随机组合以构成特征级联树;
将所述特征级联树组成构成特征级联森林并基于所述特征级联森林对所述待识别图像进行图像识别。
2.根据权利要求1所述的方法,其特征在于,在将所述特征级联树组成构成特征级联森林并基于所述特征级联森林对所述待识别图像进行图像识别之前,所述方法还包括:
判断所述特征级联树中第i个级联树节点是否为有效级联树节点;
若所述特征级联树中第i个级联树节点不为有效级联树节点,则删除所述第i个级联树节点。
3.根据权利要求2所述的方法,其特征在于,所述判断所述特征级联树中第i个级联树节点是否为有效级联树节点,包括:
判断所述第i级的识别准确率与所述第i-1级的识别准确率的差值是否满足预设准确率阈值,以在所述第i级的识别准确率与所述第i-1级的识别准确率的差值不满足预设准确率阈值的情况下确定所述特征级联树中第i个级联树节点不为有效级联树节点。
4.根据权利要求1至3任一项所述的方法,其特征在于,
所述图像特征包括不同种类的图像特征,所述不同种类的图像特征包括:颜色、纹理或形状;或者,
所述图像特征包括同一种类不同类型的图像特征,所述同一种类不同类型的图像特征:所述颜色特征中的直方图特征或颜色矩阵、所述纹理特征中的最大响应滤波器MaximumResponse Filters、局部二值模式LBP或灰度共生矩阵GLCM、所述全局特征中的SIFT。
5.根据权利要求4所述的方法,其特征在于,所述分类器包括:支持向量机SVM、邻近算法KNN或朴素贝叶斯。
6.一种图像识别装置,其特征在于,所述装置包括:
获取模块,用于获取待识别图像的至少两类图像特征;
确定模块,用于确定所述至少两类图像特征中的每类图像特征所对应的分类器,所述图像特征以及与所述图像特征对应的分类器形成至少一个级联树节点;
构成模块,用于将所述至少一个级联树节点进行随机组合以构成特征级联树;
识别模块,用于将所述特征级联树组成构成特征级联森林并基于所述特征级联森林对所述待识别图像进行图像识别。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
判断模块,用于判断所述特征级联树中第i个级联树节点是否为有效级联树节点;
删除模块,用于若所述特征级联树中第i个级联树节点不为有效级联树节点,则删除所述第i个级联树节点。
8.根据权利要求7所述的装置,其特征在于,所述判断模块判断所述特征级联树中第i个级联树节点是否为有效级联树节点,具体包括:
判断所述第i级的识别准确率与所述第i-1级的识别准确率的差值是否满足预设准确率阈值,以在所述第i级的识别准确率与所述第i-1级的识别准确率的差值不满足预设准确率阈值的情况下确定所述特征级联树中第i个级联树节点不为有效级联树节点。
9.根据权利要求6至8任一项所述的装置,其特征在于,所述图像特征包括不同种类的图像特征,所述不同种类的图像特征包括:颜色、纹理或形状;或者,
所述图像特征包括同一种类不同类型的图像特征,所述同一种类不同类型的图像特征:所述颜色特征中的直方图特征或颜色矩阵、所述纹理特征中的最大响应滤波器MaximumResponse Filters、局部二值模式LBP或灰度共生矩阵GLCM、所述全局特征中的尺度不变换特征SIFT。
10.根据权利要求9所述的装置,其特征在于,所述分类器包括:支持向量机SVM、邻近算法KNN或朴素贝叶斯。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610874205.1A CN106503728A (zh) | 2016-09-30 | 2016-09-30 | 一种图像识别方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610874205.1A CN106503728A (zh) | 2016-09-30 | 2016-09-30 | 一种图像识别方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106503728A true CN106503728A (zh) | 2017-03-15 |
Family
ID=58293527
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610874205.1A Pending CN106503728A (zh) | 2016-09-30 | 2016-09-30 | 一种图像识别方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106503728A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107944495A (zh) * | 2017-12-04 | 2018-04-20 | 贵州电网有限责任公司电力科学研究院 | 一种基于深层森林算法的家庭用电负荷分类识别方法 |
CN107958255A (zh) * | 2017-11-21 | 2018-04-24 | 中国科学院微电子研究所 | 一种基于图像的目标检测方法及装置 |
CN108921172A (zh) * | 2018-05-31 | 2018-11-30 | 清华大学 | 基于支持向量机的图像处理装置及方法 |
CN110188613A (zh) * | 2019-04-28 | 2019-08-30 | 上海鹰瞳医疗科技有限公司 | 图像分类方法及设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103164713A (zh) * | 2011-12-12 | 2013-06-19 | 阿里巴巴集团控股有限公司 | 图像分类方法和装置 |
CN103400391A (zh) * | 2013-08-09 | 2013-11-20 | 北京博思廷科技有限公司 | 一种基于改进的随机森林的多目标跟踪方法及装置 |
CN104281843A (zh) * | 2014-10-20 | 2015-01-14 | 上海电机学院 | 基于自适应特征和分类模型选择的图像识别方法及*** |
-
2016
- 2016-09-30 CN CN201610874205.1A patent/CN106503728A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103164713A (zh) * | 2011-12-12 | 2013-06-19 | 阿里巴巴集团控股有限公司 | 图像分类方法和装置 |
CN103400391A (zh) * | 2013-08-09 | 2013-11-20 | 北京博思廷科技有限公司 | 一种基于改进的随机森林的多目标跟踪方法及装置 |
CN104281843A (zh) * | 2014-10-20 | 2015-01-14 | 上海电机学院 | 基于自适应特征和分类模型选择的图像识别方法及*** |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107958255A (zh) * | 2017-11-21 | 2018-04-24 | 中国科学院微电子研究所 | 一种基于图像的目标检测方法及装置 |
CN107944495A (zh) * | 2017-12-04 | 2018-04-20 | 贵州电网有限责任公司电力科学研究院 | 一种基于深层森林算法的家庭用电负荷分类识别方法 |
CN108921172A (zh) * | 2018-05-31 | 2018-11-30 | 清华大学 | 基于支持向量机的图像处理装置及方法 |
CN110188613A (zh) * | 2019-04-28 | 2019-08-30 | 上海鹰瞳医疗科技有限公司 | 图像分类方法及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Shotton et al. | Textonboost for image understanding: Multi-class object recognition and segmentation by jointly modeling texture, layout, and context | |
JP5202148B2 (ja) | 画像処理装置、画像処理方法、及びコンピュータプログラム | |
JP4905931B2 (ja) | 人体領域抽出方法および装置並びにプログラム | |
CN111428807A (zh) | 图像处理方法及计算机可读存储介质 | |
US9418440B2 (en) | Image segmenting apparatus and method | |
CN106503728A (zh) | 一种图像识别方法和装置 | |
JP4098021B2 (ja) | シーン識別方法および装置ならびにプログラム | |
CN105469080B (zh) | 一种人脸表情识别方法 | |
Chi | Self‐organizing map‐based color image segmentation with k‐means clustering and saliency map | |
CN111695453A (zh) | 绘本识别方法、装置及机器人 | |
CN115272838A (zh) | 基于信息融合技术的海洋浮游生物自动识别方法及*** | |
JP4721829B2 (ja) | 画像検索方法及び装置 | |
CN104951440A (zh) | 一种图像处理方法及电子设备 | |
Bergman et al. | Perceptual segmentation: Combining image segmentation with object tagging | |
Jwaid et al. | Detection of copy-move image forgery using local binary pattern with discrete wavelet transform and principle component analysis | |
Rigamonti et al. | Beyond kernelboost | |
JP5370267B2 (ja) | 画像処理システム | |
CN114972965A (zh) | 一种基于深度学习的场景识别方法 | |
CN111753722B (zh) | 一种基于特征点类型的指纹识别方法及装置 | |
KR102131243B1 (ko) | 딥러닝 및 연결성 그래프에 기초한 식물 영역 추출 시스템 및 방법 | |
WO2012005242A1 (ja) | 画像処理装置及び画像分割方法 | |
Dalla Mura et al. | Classification of hyperspectral images by using morphological attribute filters and independent component analysis | |
Venkatesan et al. | Experimental research on identification of face in a multifaceted condition with enhanced genetic and ANT colony optimization algorithm | |
CN113591893B (zh) | 基于人工智能的图像处理方法、装置和计算机设备 | |
MAHURKAR et al. | Novel Outline Tracing Techniques for Leaf Species Identification from Shrouded Leaves |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170315 |