CN101344927B - 图像分类方法和设备 - Google Patents

图像分类方法和设备 Download PDF

Info

Publication number
CN101344927B
CN101344927B CN 200710136256 CN200710136256A CN101344927B CN 101344927 B CN101344927 B CN 101344927B CN 200710136256 CN200710136256 CN 200710136256 CN 200710136256 A CN200710136256 A CN 200710136256A CN 101344927 B CN101344927 B CN 101344927B
Authority
CN
China
Prior art keywords
color
image
range
histogram feature
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 200710136256
Other languages
English (en)
Other versions
CN101344927A (zh
Inventor
王健民
纪新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to CN 200710136256 priority Critical patent/CN101344927B/zh
Publication of CN101344927A publication Critical patent/CN101344927A/zh
Application granted granted Critical
Publication of CN101344927B publication Critical patent/CN101344927B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本公开涉及一种用于将图像分类成多个种类的方法,包括步骤:根据图像确定色彩直方图矢量以及基于色彩直方图矢量将图像分类成多个种类,其中色彩直方图矢量由从候选色彩直方图特征选择的一些色彩直方图特征组成。本方法可显著地提高图像的查全率并获得比现在方法更好的分类结果。

Description

图像分类方法和设备
技术领域
本发明一般地涉及图像分类方法和设备。 
背景技术
近年来在机器学习和图像比较方面,研究者已经获得令人可喜的进步。在机器学习领域,Boosting、支持矢量机器和其他所谓的大间隔(large-margin)技术不断地在当应用于老的技术时展示出改进的性能和更为确定的机器学习方法。Adaboost是一种用于提高任意给定学习方法精确度的通用方法。其从大的集合中选择少量的关键特征并且产生极其有效的分类器,并且具有用于例如人脸检测的视觉对象检测的成功应用。关于Adaboost的解释,参见由Yoav FreundRobert E.Schapire撰写的“A Short Introduction to Boosting”,通过参考将其内容全部并入在此。 
同时,针对于图像比较,图像检索领域的研究者已经设计出新的表示方法,其允许基于例如色彩和纹理分布的多个线索来进行图像间的快速比较。例如色彩直方图、冗余纹理滤波器组和其他技术已经显示出超出早期技术的重大改进。 
不幸地是除了一些特殊例外,当前很少有研究通过将每个的最佳元素进行合并来试图针对这两个领域。因此,将更新的图像分析技术和机器学习中同时发生的改进进行组合证明还包括巧妙。 
发明内容
本发明的目的在于提供一种图像分类方法和设备,以将图像分类成多个种类,从而获得比现有方法更好的分类结果。 
为了实现上述的目的,本发明提供一种用于将图像分类成多个种类的方法,包括步骤:设置针对色彩空间中的每个色彩分量的各色彩范围的候选色彩直方图特征,所述各色彩范围通过从针对每个色彩分量的一组值中选择任意两个值作为所述各色彩范围的色彩分量的上限值和下限值来限定;通过针对样本图像的所述候选色彩直方图特征采用Adaboost算法,来从所述候选色彩直方图特征中选择要用于分类的特定数量的色彩直方图特征;根据针对所述输入图像所选择的色彩直方图特征的加权和是否小于阈值,来确定分类函数的值;以及基于所述分类函数的值将所述输入图像分类成多个种类。
本发明还提供一种用于将图像分类成多个种类的设备,包括:设置模块,其用于设置针对色彩空间中的每个色彩分量的各色彩范围的候选色彩直方图特征,所述各色彩范围通过从针对每个色彩分量的一组值中选择任意两个值作为所述各色彩范围的色彩分量的上限值和下限值来限定;选择模块,其用于通过针对样本图像的所述候选色彩直方图特征采用Adaboost算法,来从所述候选色彩直方图特征中选择要用于分类的特定数量的色彩直方图特征;确定模块,其用于根据针对所述输入图像所选择的色彩直方图特征的加权和是否小于阈值,来确定分类函数的值,分类模块,其用于基于所述分类函数的值将所述输入图像分类成多个种类。 
由于Adaboost的效力,可以选择图像的关键和有效特征并且由此提高了计算效率。与考虑色彩样本的分布但忽略其有效性的其他直方图算法相比,有效性也在积分图像直方图的考虑之内。总之,本发明的使用可以显著提高图像的查全率并获得与现有方法更好的分类结果。 
附图说明
根据下面结合附图阅读的示例性的实施方式的详细描述,本发明的上述和其他目的、特征和优势将变得明显。 
图1是根据本发明一个实施方式的一种用于将图像分类成多个种类的方法的流程图; 
图2是在本发明的实施方式中所使用的Adaboost算法的流程图; 
图3是图2中的Adaboost算法中的WeakLearn(弱学习)算法的流程图; 
图4是根据本发明一个实施方式的一种用于将图像分类成多个种类的设备的示意框图;以及 
图5示出本发明可在其中实施的一个实施方式的示意性应用。 
具体实施方式
现在参考附图对本发明进行更为详细地描述。 
图1示出根据本发明的一个实施方式的一种用于将图像分类成多个种类的方法的流程图。在步骤100处,输入将要被分类的图像。 在步骤110处,执行确定图像的色彩直方图矢量(也可由图4中的确定模块400来执行),下文将对其进行详细地描述。 
首先,定义一种简单但很有效的候选色彩直方图特征。其可由下面的方程来表达: 
f ( r 1 , r 2 , g 1 , g 2 , b 1 , b 2 ) = &Integral; r = r 1 r 2 &Integral; g = g 1 g 2 &Integral; b = b 1 b 2 p ( r , g , b ) drdgdb ( r 1 < r 2 , g 1 < g 2 , b 1 < b 2 ) - - - ( 1 )
其中p(r,g,b)表示图像像素色彩的概率。符号r1,r2,g1,g2,b1,b2表示特征参数,换句话说,不同的r1,r2,g1,g2,b1,b2可产生不同的特征。图像的候选色彩直方图f(r1,r2,g1,g2,b1,b2)可根据下式计算: 
f ( r 1 , r 2 , g 1 , g 2 , b 1 , b 2 ) = | A r 1 r 2 g 1 g 2 b 1 b 2 | | A | - - - ( 2 )
其中|A|代表图像中像素的总数,而 
Figure G071D6256520070719D000033
代表像素的总数,其r值大于或等于r1而小于或等于r2,g值大于或等于g1而小于或等于g2,b值大于或等于b1而小于或等于b2的。从理论上来说,上述的六个参数可以是从0到255的任意值并且因此在图像中存在(257×256/2)3=35,598,301,659,136个特征。尽管理论特征值是如此的巨大,但由于计算的限度,仅它们中的一些将用作候选特征。优选地,r1,r2,g1,g2,b1,b2可以是{10,30,50,70,90,110,130,150,170,190,210,230,250}集合中的一个值。然而,应该注意到r1,r2,g1,g2,b1,b2的值不限于这里所描述的值,本领域技术人员可以根据实际需要设置r1,r2,g1,g2,b1,b2的值。接着,将仅有(14×13/2)3=753571个特征用作候选色彩直方图特征。然而,753571个特征对于本方法来说依然太大。出于进一步简化的目的,使用Adaboost算法来训练将在本方法中使用的一些特征(即,选择特征,这也可由图4中的确定模块410来执行)。 
现在参考图2,其示出了Adaboost算法的流程图。尽管本领域技术人员了解Adaboost,但对其简短的描述将有助于更好的理解本发明。在步骤200,输入m个训练样本,即,S={(x1,y1),(x2,y2),...,(xm,ym)},其中输入标示yi∈Y={0,1}。这里xi是通过由方程(2)计算的候选色彩直方图特征f1,f2...f753571所组成的753571维矢量,而值仅可以分别为代表蓝天图 像样本和非蓝天图像样本的0或1的yi是与xi关联的分类标记。应该注意到使用本发明来将图像分类成蓝天图像和非蓝天图像仅是示例性的,并且其可被用于将图像分类成如期望的任意种类。另外,应该注意到yi的值不限于这里所述的值,本领域技术人员还可根据实际需要来设置yi的值。 
在步骤210,初始变量被设置成等于1,在步骤220,根据下式来执行Dt(i)的初始化: 
Dt(i)=1/m  i=1,2,...,m,t=1,2,...,T    (3) 
其中D1是第一轮的训练样本S={(x1,y1),(x2,y2),...,(xm,ym)}的分布并且利用均匀分布来初始化。为了稍后的迭代而预先指定T并且在本方法中T优选的是46。在每次迭代中基于先前Dt-1来计算随后的Dt。接着流程图前进到迭代部分,在步骤230,调用具有误标记分布Dt的弱学习(稍后描述)并且由此得到输出为0或1的假设ht(x)。输入样本的分类取决于ht(x)的输出,即,如果ht(x)=1,则输入样本被分类为正的样本,而如果ht(x)=0,则输入样本被分类为负的样本。接着ht(x)的伪损失可以根据下式计算: 
&epsiv; t = &Sigma; ht ( x i ) &NotEqual; y i D t ( i ) - - - ( 4 )
εt是估计假设ht好坏程度的值。如果εt是零,则ht的结果很好。另一方面,如果εt越大,则εt的结果越坏。应该注意到该误差是针对分布Dt(i)来测量的。接着将βt设置成等于εt/(1-εt),该值仅是为表达方便起见的临时变量并且没有实质性的含意。根据下式来更新分布Dt(i): 
其中zt是归一化常量(这样选择使得Dt+1将是分布)。示例的权重与某个数相乘,使得可基于Dt来计算Dt+1。接着可通过除以归一化常量来重新归一化权重。有效地,由许多先前弱假设所分类的“容易”样本将得到更低的权重,而往往被误分类的“难”样本将得到更高的权重。因此,本方法将对于弱学习来说是最难的样本分配最大的权重。在步骤 270,获得h1,h2...hT,来自f1,f2,f3...f753571的相应特征F1,F2...FT是由Adaboost所选择的特征。 
现在返回到图1,在步骤130,通过如下T个选择的特征来形成最终强的分类器: 
Figure G071D6256520070719D000051
其中 &alpha; t = log 1 &beta; t , h1,h2,...,hT和β1,β2,...,βT可通过上述提到的过程获得。如果H(x)的结果是1,则图像被分类为目标种类,而如果H(x)的结果是0,则图像被分类为非目标种类。这也可以通过图4中的分类模块410来完成。 
现在参考图3,其示出图2中所称的弱学习算法。在步骤300,m个样本的S={(x1,y1),(x2,y2),...,(xm,ym)}训练集合以及其在Adaboost算法中的第t轮的相应分布D={D(1),D(2),..,D(m)}被输入。接着流程图前进到迭代处理。对于k=1,2,3...,d(d是753571,即,候选色彩直方图特征的数目),获得第k个模式Pk={pk,1,pk,2,...,pk,m},其中pk,i=xi,k并且xi,k是xi的第k个元素,而xi是第i个样本的特征向量。通过Pk对训练样本S进行排序,使得对于任意的i<j,pk,i<pk,j,得到符号权重wk={wk,1,wk,2,...wk,m},wk,i=(yi*2-1)*D(i),因此对于正的(负的)样本,wk,i是正的(负的),得到负权重的和 S 0 k = &Sigma; w k , i < 0 - w k , i (和是正数),得到符号权重ck={ck,1,ck,2,...,ck,m}的累积和,其中 c k , i = &Sigma; j = 1 i w k , j + S 0 k - 0 . 5 , 接着找到索引i1和i2,使得ck,i1=max{ck,1,ck,2,...ck,m-1}和ck,i2=min{ck,1,ck,2,...,ck,m-1},如果ck,i1>-ck,i2,则设置Sk=1,rk=pk,id1/2+pk,id1+1/2,否则设置Sk=-1,rk=-pk,id2/2-pk,id2+1/2,接着得到候选h′k,其中 
Figure G071D6256520070719D000055
得到损失函数  &epsiv; k = &Sigma; h k ( x i ) &NotEqual; y i D t ( i ) .
在上述的迭代处理之后,在步骤370,选择最佳k,即,k0,其中 
Figure G071D6256520070719D000057
最终,弱学习输出如下的假设: 
Figure G071D6256520070719D000061
假定在第t轮迭代中得到弱学习假设并且令ht=h’t0。则fk0是在Adaboost算法的第t轮中选择的特征。 
图5示出其中可实施本发明一个实施方式的示意应用。在步骤500输入图像。在步骤510,图像由根据本发明的如图1中的方法或如图4中的设备来进行分类。在步骤520,基于得到的图像种类来对图像施加图像改进处理。最后获得改进的图像。例如,假设目标种类是蓝天,并且在训练处理中,则原始的候选特征是f1,f2...ft(作为示例,t是753571),由Adaboost从候选特征所选择的特征是fn1,fn2...fnm(作为示例,m是43)。处理输入的色彩图像。对于特征值是v1,...,vm的例子,首先在图1的步骤110确定图像的特征fn1,..,fnm的值,并且将其施加到图1的步骤120,接着图像被分类为蓝天图像。接着在图5的步骤520中,施加图像改进处理以改进作为蓝天图像的输入图像(改进方法可以使得图像中的蓝色更深)。 
尽管已经公开了本发明的特定实施方式,但本领域技术人员将理解可针对特定的实施方式做出改变而不会偏离本发明的精神和范围。因此,本发明的范围不限于特定的实施方式,并且意图在于所附权利要求书涵盖本发明范围内的任何和所有这样的应用、修改和实施方式。 

Claims (12)

1.一种用于将输入图像分类成多个种类的方法,包括步骤:
设置针对同一色彩空间中的每个色彩分量的各色彩范围的候选色彩直方图特征,所述各色彩范围通过从针对每个色彩分量的一组值中选择任意两个值作为所述各色彩范围的色彩分量的上限值和下限值来限定;
通过针对样本图像的所述候选色彩直方图特征采用Adaboost算法,来从所述候选色彩直方图特征中选择要用于分类的特定数量的色彩直方图特征;
根据针对所述输入图像所选择的色彩直方图特征的加权和是否小于阈值,来确定分类函数的值;以及
基于所述分类函数的值将所述输入图像分类成多个种类。
2.根据权利要求1所述的方法,其中每个所述候选色彩直方图特征定义为由图像中所选色彩范围内的图像像素色彩的概率。
3.根据权利要求2所述的方法,其中所述概率计算为所选色彩范围内的像素与所述图像中所有像素的比值。
4.根据权利要求2所述的方法,其中所选色彩范围是任意同一色彩空间内的色彩范围。
5.根据权利要求4所述的方法,其中所述色彩空间是RGB色彩空间。
6.根据权利要求4所述的方法,其中所选色彩范围是所述色彩空间内的任意色彩范围。
7.一种用于将输入图像分类成多个种类的设备,包括:
设置模块,其用于设置针对同一色彩空间中的每个色彩分量的各色彩范围的候选色彩直方图特征,所述各色彩范围通过从针对每个色彩分量的一组值中选择任意两个值作为所述各色彩范围的色彩分量的上限值和下限值来限定;
选择模块,其用于通过针对样本图像的所述候选色彩直方图特征采用Adaboost算法,来从所述候选色彩直方图特征中选择要用于分类的特定数量的色彩直方图特征;
确定模块,其用于根据针对所述输入图像所选择的色彩直方图特征的加权和是否小于阈值,来确定分类函数的值,
分类模块,其用于基于所述分类函数的值将所述输入图像分类成多个种类。
8.根据权利要求7所述的设备,其中每个所述候选色彩直方图特征定义为由图像中所选色彩范围内的图像像素色彩的概率。
9.根据权利要求8所述的设备,其中所述概率计算为所选色彩范围内的像素与所述图像中所有像素的比值。
10.根据权利要求8所述的设备,其中所选色彩范围是任意同一色彩空间内的色彩范围。
11.根据权利要求10所述的设备,其中所述色彩空间是RGB色彩空间。
12.根据权利要求10所述的设备,其中所选色彩范围是所述色彩空间内的任意色彩范围。
CN 200710136256 2007-07-12 2007-07-12 图像分类方法和设备 Expired - Fee Related CN101344927B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200710136256 CN101344927B (zh) 2007-07-12 2007-07-12 图像分类方法和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200710136256 CN101344927B (zh) 2007-07-12 2007-07-12 图像分类方法和设备

Publications (2)

Publication Number Publication Date
CN101344927A CN101344927A (zh) 2009-01-14
CN101344927B true CN101344927B (zh) 2013-04-17

Family

ID=40246928

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200710136256 Expired - Fee Related CN101344927B (zh) 2007-07-12 2007-07-12 图像分类方法和设备

Country Status (1)

Country Link
CN (1) CN101344927B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102799669B (zh) * 2012-07-17 2015-06-17 杭州淘淘搜科技有限公司 一种商品图像视觉质量的自动分级方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1627299A (zh) * 2003-12-12 2005-06-15 松下电器产业株式会社 图像分类装置、方法和程序

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1627299A (zh) * 2003-12-12 2005-06-15 松下电器产业株式会社 图像分类装置、方法和程序

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王炜等.基于模糊分类的图像颜色直方图研究.《模糊***与数学》.2003,第17卷(第4期),第94-95页. *

Also Published As

Publication number Publication date
CN101344927A (zh) 2009-01-14

Similar Documents

Publication Publication Date Title
Zhao et al. Uctgan: Diverse image inpainting based on unsupervised cross-space translation
CN110363122B (zh) 一种基于多层特征对齐的跨域目标检测方法
CN110516596B (zh) 基于Octave卷积的空谱注意力高光谱图像分类方法
CN109325550B (zh) 基于图像熵的无参考图像质量评价方法
CN109684922B (zh) 一种基于卷积神经网络的多模型对成品菜的识别方法
Sznitman et al. Active testing for face detection and localization
CN107123088B (zh) 一种自动更换证件照背景颜色的方法
CN111814902A (zh) 目标检测模型训练方法、目标识别方法、装置和介质
CN110322445B (zh) 基于最大化预测和标签间相关性损失函数的语义分割方法
CN108846404B (zh) 一种基于相关约束图排序的图像显著性检测方法及装置
CN108009567B (zh) 一种结合图像颜色及hog和svm的粪便性状的自动辨别方法
CN111222545B (zh) 基于线性规划增量学习的图像分类方法
CN113205026A (zh) 一种基于Faster RCNN深度学习网络改进的车型识别方法
CN111046858A (zh) 一种基于图像的动物物种细分类方法、***及介质
CN111931867B (zh) 基于轻量级模型的新冠肺炎x射线图像分类方法及***
Bappy et al. Real estate image classification
Arefi et al. Recognition of weed seed species by image processing
CN114494739B (zh) 基于人工智能的色粉混合效果检测方法
CN114863088A (zh) 一种面向长尾目标检测的分类对数归一化方法
CN101344928B (zh) 用于确定图像区域和对图像进行分类的方法和设备
CN111428730A (zh) 弱监督细粒度物体分类方法
CN113486202A (zh) 小样本图像分类的方法
CN110751660B (zh) 一种彩色图像分割方法
CN101344927B (zh) 图像分类方法和设备
CN108229693B (zh) 一种基于对比学习的机器学习识别装置及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130417

Termination date: 20170712