CN105868768A - 一种识别图片是否带有特定标记的方法及*** - Google Patents

一种识别图片是否带有特定标记的方法及*** Download PDF

Info

Publication number
CN105868768A
CN105868768A CN201510028053.9A CN201510028053A CN105868768A CN 105868768 A CN105868768 A CN 105868768A CN 201510028053 A CN201510028053 A CN 201510028053A CN 105868768 A CN105868768 A CN 105868768A
Authority
CN
China
Prior art keywords
picture
pixel
training sample
specific markers
identified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510028053.9A
Other languages
English (en)
Inventor
李鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201510028053.9A priority Critical patent/CN105868768A/zh
Publication of CN105868768A publication Critical patent/CN105868768A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本申请提供一种识别图片是否带有特定标记的方法及***,所述方法包括:获取包括预定数量带有特定标记和不带有特定标记的图片作为训练样本;提取所述训练样本中图片的特征值向量;基于提取的所述训练样本中每个图片的特征值向量计算所述训练样本中图片的归类条件;获取待识别的图片,提取所述待识别图片的特征值向量;基于所述归类条件计算所述待识别图片的特征值向量的归类值,并基于计算得到的归类值判断所述待识别图片是否带有特定标记。本申请实施例提供的一种识别图片是否带有特定标记的方法及***,通过训练和识别两个过程,能够识别出图片是否带有特定标记。

Description

一种识别图片是否带有特定标记的方法及***
技术领域
本申请涉及图像识别技术领域,特别涉及一种识别图片是否带有特定标记的方法及***。
背景技术
图像识别技术领域中,运用对图像(或视频流中的图像帧)的检测技术,可以识别图像中的特定物体。例如,人脸识别作为图像识别技术的一种应用,可以检测和跟踪图像(或视频流中的图像)中的人脸。人脸识别技术可以应用于诸如门禁、安检等的身份辨认场景中。
以人脸识别这类图像识别技术为例,识别过程往往需要执行如下述处理过程:
A1:获取图像;
A2:对获取的图像进行预处理,所述预处理例如包括A/D转换,灰度处理,图像平滑处理,滤波等;
A3:对预处理后的图像进行特征抽取和选择;例如对一幅64像素*64像素的图象可以得到共4096个像素数据构成的测量空间,进而对该测量空间的4096个像素的数据通过一系列变换获得在该特征空间最能反映图像本质的特征;
A4:确定判决规则;
A5:在A3步骤处理后的特征空间中应用A4确定的判决规则对识别对象识别。
对图像中的人脸进行识别时,图像本身根据来源的不同,可能存在两类不同的人脸图像。一类是正常的人脸图像,即人脸上的图像符合常规照片、图片的显示规律;另一类是除了正常的人脸图像外,在人脸图像上还叠加有其它特定标记。例如一种现有技术中,通过用户提供的身份证号码从公安网可以获取该用户的照片。从公安网获取的用户照片中,可能会经过公安网的信息标记处理,例如在用户照片上打上特定格式的网纹以作为公安网登记照片的特定标记。
现有的人脸识别技术,往往是对正常的人脸图片进行处理,对于特定来源的包括某种特定标记的人脸图片,例如上述带网纹的人脸照片,并没有提供专门的方式加以识别。那么,按照上述处理过程处理带某种特定标记的人脸图片,由于在上述A3步骤的特征抽取和选择中没有区分特定标记的特征,导致特征提取的不准确,从而影响最终的人脸识别性能。
类似的,上述图像识别技术应用于人脸识别之外的其它领域时,也存在类似问题。例如,***需要对图片中的特定物体进行识别,如淘宝***需要对***中存有的大量同一宝贝的展示图片进行识别时,除了正常的显示该宝贝的图片,还可能存在商家自行打上某种特定标记的该宝贝的图片。利用类似上述过程的现有的图像识别技术,由于没有对图片上打上的特定标记加以区分处理,因此可能降低最终的识别性能。
现有技术中还没有对图像中的特定标记进行识别的技术。
发明内容
本申请实施例的目的在于提供一种识别图片是否带有特定标记的方法及***。
本申请实施例提供的一种识别图片是否带有特定标记的方法及***是这样实现的:
一种识别图片是否带有特定标记的方法,包括:
获取包括预定数量带有特定标记和不带有特定标记的图片作为训练样本;
提取所述训练样本中图片的特征值向量;
基于提取的所述训练样本中每个图片的特征值向量计算所述训练样本中图片的归类条件;
获取待识别的图片,提取所述待识别图片的特征值向量;
基于所述归类条件计算所述待识别图片的特征值向量的归类值,并基于计算得到的归类值判断所述待识别图片是否带有特定标记。
一种识别图片是否带有特定标记的***,包括训练***和识别***,所述训练***包括训练样本获取单元,第一特征值向量提取单元,归类条件计算单元,所述识别***包括待识别图片获取单元,第二特征值向量提取单元以及判断单元,其中,
所述训练样本获取单元,用来获取包括预定数量带有特定标记和不带有特定标记的图片作为训练样本;
所述第一特征值向量提取单元,用来提取所述训练样本中图片的特征值向量;
所述归类条件计算单元,用来基于提取的所述训练样本中每个图片的特征值向量计算所述训练样本中图片的归类条件;
所述待识别图片获取单元,用来获取待识别的图片;
所述第二特征值向量提取单元,用来提取所述待识别图片的特征值向量;
所述判断单元,用来基于所述归类条件计算所述待识别图片的特征值向量的归类值,并基于计算得到的归类值判断所述待识别图片是否带有特定标记。
本申请实施例提供的一种识别图片是否带有特定标记的方法及***,首先可以通过训练过程,对预设数量的带有特定标记和不带有特定标记的图片进行特征分析,得到区分带有特定标记和不带有特定标记图片的归类条件;然后可以通过识别过程,利用所述得到的归类条件对待识别图片的特征进行判定,从而可以识别出待识别图片是否带有特定标记。
附图说明
图1为本申请实施例提供的一种识别图片是否带有特定标记的方法流程图;
图2为本申请一个例子中以线性分类为例解释通过支持向量机算法进行二维分类的基本原理示意图;
图3为本申请一个例子中以线性分类为例解释通过支持向量机算法进行三维分类的基本原理示意图;
图4为本申请一实施例提供的一种识别图片是否带有特定标记的***功能模块图;
图5为本申请一实施例提供的一种识别图片是否带有特定标记的***中训练***的功能模块图;
图6为本申请一实施例提供的一种识别图片是否带有特定标记的***中识别***的功能模块图。
具体实施方式
本申请实施例提供一种识别图片是否带有特定标记的方法基***。为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都应当属于本申请保护的范围。
图1为本申请实施例提供的一种识别图片是否带有特定标记的方法流程图。如图1所示,所述方法包括:
S110:获取包括预定数量带有特定标记和不带有特定标记的图片作为训练样本。
本申请实施例中,可以从图片数据库中获取图片,或者接收用户导入的图片。该图片中可以包括带有特定标记的图片与不带有特定标记的图片。本申请实施例以带网纹的图片与不带网纹的图片为例来进行阐述。
所述获取的带网纹的图片的数量和不带网纹的图片的数量,可以均为1张,也可以其中一个为1张,另一个为至少2张。为了达到更好的识别效果,可以获取预设数量的带有网纹和不带有网纹的图片作为训练样本。
S120:提取所述训练样本中图片的特征值向量。
获取包括带网纹图片和不带网纹图片的训练样本后,可以提取所述训练样本中每个图片的特征值向量。所述特征值向量,可以包括像素值向量或者局部特征向量。下面以像素值向量为例进行说明。
一幅彩色图片一般由多个像素组成后体现。例如,显示器上显示的图片,是通过显示器屏幕上每个能够显示不同色彩的发光元件通电后的显示功能,最终使得屏幕上众多这样的发光元件组合起来还原显示出图片。当显示器屏幕显示的图片是原始分辨率时,显示器屏幕上用于显示的图片的每一元件对应图片上的每一像素。
上面提到的每个发光元件通电后显示的色彩,取决于图片中对应像素的RGB值。RGB色彩模式是工业界的一种颜色标准,是通过对红(Red,R)、绿(Green,G)、蓝(Blue,B)三个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色的,RGB即是代表红、绿、蓝三个通道的颜色,也成为三原色。这个色彩模式几乎包括了人类视力所能感知的所有颜色,是目前运用最广的颜色***之一。常用的一种RGB标准中,R、G、B每个颜色的量用0-255之间的1个十进制数表示(对应二进制数00000000~11111111)。另外一种网页中常用的RGB标准中,将一个像素的RGB值用一个6位的十六进制数标识,如#000000的形式。本领域技术人员容易知道,一个像素的RGB色彩每个颜色的量用0-255之间的1个十进制数标识,可以转换为用一个6位的十六进制数表示,即存在不同表示方式中存在一一对应关系。总体来说,这些标准中的对应份数的红色(R)、绿色(G)和蓝色(B)混合后得到该像素的最终显示颜色。
进而,提取所述图片中每个像素的RGB值,并将提取的RGB值按照一定顺序排序,例如按照像素编号排序,从而可以构成该图片的特征值向量。
例如,某幅彩色图片具有200*120(也称为分辨率)的像素。每个像素的RGB如下标识:
RGB(m,n)=Ra,Gb,Bc
其中,m、n分别表示图片中某一像素所处的行和列;m的取值范围为1至200,n的取值范围为1至120。Ra,Gb,Bc为0-255中的任一整数。
或者,RGB(m,n)=#OPQRST
其中,m的取值范围为1至200,n的取值范围为1至120,O、P、Q、R、S、T为0-F的任一16进制取值。
提取每个像素的特征值,即将每个像素的上述RGB值提取出来。例如,对于该图片中第(m,n)个像素,提取其RGB值,即上述的(Ra,Gb,Bc)或#OPQRST。
将该图片中每个像素点提取出的特征值按照顺序排列可以构成特征值向量。例如,排列后构成的特征值向量如下面形式的一系列排列的数值:
(RGB(1,1),RGB(1,2),…,RGB(1,120),RGB(2,1),RGB(2,2),…,RGB(2,120),…,RGB(200,1),RGB(200,2),…RGB(200,120)) 式1
上述式1即为该图片的特征值向量。
对于训练样本中每个图片均做上述处理,即提取每个图片的特征值向量。如果每个图片均为200*120像素,则可以得到一系列的类似式1形式的向量。
类似的,一幅灰度显示的图片也可以由多个像素组成后体现。这样,显示器上每个发光元件通电后显示的灰度色彩,取决于图片中对应像素的RGB值。这时,这类灰度像素的RGB值具有一定规律。常用的一种标准中,灰度值的R、G、B取值相等。这样,利用这个标准,通常可以将灰度分为256级,表示黑白图像中点的颜色深度。也可以用其它方式来表示灰度值,例如通过1byte的数据来表示。这时,这个1byte的数据每一位上的取值与RGB值具有一定的对应关系。这样,提取所述图片中每个像素的灰度值,并将提取的灰度值按照像素编号顺序排序,也可以得到形如式1的特征值向量。
灰度值与彩色RGB具有一定的对应关系。利用这种对应关系,可以将彩色RGB转换为对应的灰度值。下面列举几种由RGB三原色值转换得到对应灰度值的方法:
(1)浮点算法:Gray=R*0.3+G*0.59+B*0.11
(2)整数方法:Gray=(R*30+G*59+B*11)/100
(3)移位方法:Gray=(R*77+G*151+B*28)>>8;
(4)平均值法:Gray=(R+G+B)/3;
(5)仅取绿色:Gray=G;
由于灰度值的取值范围明显小于RGB的取值范围,而采用灰度值替代RGB可以降低后续的计算复杂度,并能保证达到基本相同的识别效果。这样,本步骤中,可以用像素的灰度值替代彩色RGB值。
此外,不同图片可能具有不同的分辨率。例如,第一幅图片的分辨率可能为200*120,第二幅图片的分辨率可能是220*150。本步骤中提取得到的每个图片的特征值向量,最好具有相同的维度。例如对于上述两种不同分辨率的情况,可以按照预设方法设置所述获取的训练样本中图片的像素。具体地,可以选取所述训练样本中的第一图片,将所述训练样本中图片的像素设置为所述第一图片的像素;或者可以将所述获取的训练样本中图片的像素设置为预设的像素。例如,训练样本中一图片的像素为200*120,则可以将所述训练样本中图片的像素设置为该图片的像素,即200*120。另外,还可以预先设置一像素,例如200*120,然后可以将所述获取的训练样本中图片的像素均设置为200*120。实际情况中,对于同一物体的不同图片,图片上显示的内容均具有基本相同的框架。例如对于身份证图片,均是居于中间的头像和颈部,下部向两侧延伸的部分肩膀。对于存在网纹和不存在网纹的身份证图片,进行适当压缩后仍然能够体现出是否存在网纹的区别。但是,压缩后的像素将明显减少。
基于此,本申请中可以在S210与S220之间可以加入以下处理:
将所述获取的训练样本中图片的像素压缩至预设的像素。这个预设的像素,最好明显小于图片的原始像素,同时还能保证压缩后的图片仍能明显显示出网纹等特定标记。
在一个例子中,这个预设像素设置成8*8。将获取的训练样本中的图片压缩至预设像素,即得到获取的训练样本中每一图片的8*8像素形式。进而,提取所述训练样本经过压缩处理的图片的特征值向量,得到每一图片的8*8像素的值。将每一图片的这64个特征值按照一定顺序排序即可以得到式1形式的特征值向量,即每一图片的特征值向量为64维的特征值向量。
上述内容主要说明了特征值向量为像素值向量的情形。特征值向量为局部特征向量的情形与此类似,不再赘述。
S130:基于提取的所述训练样本中每个图片的特征值向量计算所述训练样本中图片的归类条件。
对于存在明显区别的不同类图片,可以通过计算得到不同类图片的归类条件。对于存在特定标记和图片和不存在特定标记的图片,例如前述提到的带有网纹的身份证照片和不带网纹的身份证照片,可以基于其训练样本中每个图片的特征值向量通过计算得到这两类不同图片的归类条件。
这里以采用支持向量机(Support Vector Machine)算法为例介绍计算所述训练样本中图片的归类条件的实现方式。支持向量机是Cortes和Vapnik于1995年首先提出的,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。整体来说,支持向量机可以解决复杂事务的分类及分类标准的问题。
利用图2显示的线性分类的例子解释通过支持向量机算法进行分类的基本原理。如图2所示,左侧坐标图中的点表示输入的训练样本,右侧坐标图中的叉代表的点表示计算得到的C1类训练样本,圆圈代表的点表示计算得到的C2类训练样本。如图2所示,将训练样本通过支持向量机算法计算后,可以获得分类后的C1和C2两类训练样本,并且可以得到划分C1和C2两类的归类条件。
对于图2的线性分类来说,所述归类条件(图中的vv’线,也称为超平面)可以用一个线性函数来表示,例如表示为:
f(x)=wx+b 式2
其中,w和b为支持向量机对特征值向量集合进行计算(支持向量机中称为“训练”)后得到的参数,x代表图片的特征值向量。
f(x)表示支持向量机中的映射关系。对于f(x)=0的情况,此时的特征值向量x即位于所述超平面上。对于f(x)大于0的情况,对应图2右侧坐标图中超平面右上侧的特征值向量;对于f(x)小于0的情况,对应图2右侧坐标图中超平面左下侧的特征值向量。
输入的特征值向量例如均为二维向量,即对应图2中坐标上的每个点。支持向量机算法,即不断搜索输入的特征值向量范围内的直线,通过尝试计算每一个搜索到的这种直线与每一特征值向量(图中的点)的距离,得到一个这样的直线:该直线距离两侧最近特征值向量的距离最大且相等。如图2中右侧坐标图所示,计算得到的直线vv’即超平面。从图2中右侧坐标图可以看出,二维情况下超平面vv’为一直线,该直线距离两侧最近特征值向量的距离最大且相等,该距离均为L。
当输入的特征值向量为三维向量时,处理过程与特征值向量为二维向量的情况类似。图3为本申请一个例子中以线性分类为例解释通过支持向量机算法进行三维分类的基本原理示意图。如图3所示,左侧坐标图中的点表示输入的训练样本,右侧坐标图中的叉代表的点表示计算得到的C1类训练样本,圆圈代表的点表示计算得到的C2类训练样本。如图3所示,将训练样本通过支持向量机算法计算后,可以获得分类后的C1和C2两类训练样本,并且可以得到划分C1和C2两类的归类条件。
对于图3的线性分类来说,所述归类条件(图中的vv’面,也称为超平面)可以用一个线性函数来表示,例如表示为:
f(x)=wx+b 式3
其中,w和b为支持向量机对特征值向量集合进行计算(支持向量机中称为“训练”)后得到的参数,x代表图片的特征值向量。
这里需要说明的是,由于这是针对三维向量的情况,因此式3中的参数w和b均为三维向量。
f(x)表示支持向量机中的映射关系。对于f(x)=0的情况,此时的特征值向量x即位于所述超平面上。对于f(x)大于0的情况,对应图3右侧坐标图中超平面右上侧的特征值向量;对于f(x)小于0的情况,对应图3右侧坐标图中超平面左下侧的特征值向量。
输入的特征值向量例如均为三维向量,即对应图3中坐标上的每个点,每个点均由X,Y,Z三个坐标确定。此时支持向量机算法可以不断搜索输入的特征值向量范围内的平面,通过尝试计算每一个搜索到的这种平面与每一特征值向量的距离,得到一个这样的平面:该平面距离两侧最近特征值向量的距离最大且相等。如图3右侧坐标图所示,计算得到的平面vv’即超平面。该平面距离两侧最近特征值向量的距离最大且相等。
对于输入的多个特征值向量,可以计算得到这些特征值向量的两种训练样本类型,以及这两种训练样本类型的归类条件。
一般来说,对于输入的同为身份证件照的多个训练样本,如前所述,均为居于中间的头像和颈部,下部向两侧延伸的部分肩膀的结构。如果输入的作为样本的多个身份证件照中存在具有网纹和不具有网纹的两种类型,并且在样本数量具有足够多的情况下,通过上述支持向量机算法,可以计算得到划分出这两类型的超平面的函数。具体的,可以计算出式2中的两个参数w和b的取值。由于输入的训练样本的主要区别在于是否存在网纹,通过上述处理,可以将输入的训练样本分类为具有网纹和不具有网纹的两种类型,并且可以计算出划分出这两类型的超平面的函数。
S140:获取待识别的图片,提取所述待识别图片的特征值向量。
在识别图片是否带有特定标记前,需要提取待识别的图片的特征值向量。这里需要说明的是,本步骤中与所述步骤S220中提取的特征值向量的类型应该保持一致。例如,在步骤S220中提取的特征值向量为像素值向量,那么在本步骤中也应当提取像素值向量。以像素值向量为例:
当本步骤中的待识别图片的像素与所述S220中训练样本图片的像素相同时,可以提取所述待识别图片的特征值向量,并基于所述归类条件计算所述待识别图片的特征值向量的归类值,从而可以基于计算得到的归类值判断所述待识别图片是否带有特定标记。具体地,例如所述待识别的图片像素为200*120,可以按照步骤S220中提取像素值向量的方法,提取所述待识别图片的像素值向量。具体地,可以将所述待识别图片的每个像素的RGB值提取出来。例如,对于该图片中第(m,n)个像素,提取其RGB值,所述RGB值可以为步骤S220中所述的(Ra,Gb,Bc)或#OPQRST。
将该图片中每个像素点提取出的特征值按照顺序排列可以构成像素值向量。例如,排列后构成的像素值向量如下面形式的一系列排列的数值:
(RGB(1,1),RGB(1,2),…,RGB(1,120),RGB(2,1),RGB(2,2),…,RGB(2,120),…,RGB(200,1),RGB(200,2),…RGB(200,120)) 式4
上述式4可以为所述待识别图片的像素值向量。
同样的,还可以提取所述待识别图片中每个像素的灰度值,并将提取的灰度值按照像素编号顺序排序,也可以得到形如式4的像素值向量。
当本步骤中待识别图片的像素与步骤S220中训练样本图片的像素不同时,可以在提取所述待识别图片的特征值向量之前,将所述待识别图片的像素设置为预设的像素。所述预设的像素与步骤S220中训练样本图片的像素相同。将所述待识别图片的像素设置为预设的像素之后便可以提取设置像素之后的待识别图片的特征值向量。具体过程如上所述,这里不再赘述。
S150:基于所述归类条件计算所述待识别图片的特征值向量的归类值,并基于计算得到的归类值判断所述待识别图片是否带有特定标记。
提取出待识别图片的特征值向量后,可以基于所述归类条件计算所述待识别图片的特征值向量的归类值,并基于计算得到的归类值判断所述待识别图片是否带有特定标记。具体地,还是以像素值向量为例,可以将该提取的待识别图片的像素值向量代入所述得到的图片归类条件。对于线性分类来说,所述图片归类条件可以表示为:
f(x)=wx+b 式5
其中,w和b为步骤S230中支持向量机对特征值向量集合进行计算(支持向量机中称为“训练”)后得到的参数,x代表图片的特征值向量。
将提取的待识别图片的特征值向量代入该图片归类条件时,可以得到该待识别图片的特征值向量对应的归类值。例如,将待识别图片的像素值向量(RGB(1,1),RGB(1,2),…,RGB(1,120),RGB(2,1),RGB(2,2),…,RGB(2,120),…,RGB(200,1),RGB(200,2),…RGB(200,120))代入所述图片归类条件后,得到的归类值为1。那么根据图片归类条件的判定标准可以识别该待识别图片是否带有特定标记。例如,图片归类条件的判定标准为:对于f(x)小于0的情况,代表待识别的图片不带有特定标记;对于f(x)大于0的情况,代表待识别的图片带有特定标记。所述待识别图片的归类值为1,则可以判断,该待识别的图片带有特定标记。
本申请实施例还提供一种识别图片是否带有特定标记的***。图4为本申请一实施例提供的一种识别图片是否带有特定标记的***功能模块图。如图4所示,所述***包括训练***100和识别***200。图5为本申请一实施例提供的一种识别图片是否带有特定标记的***中训练***的功能模块图。如图5所示,所述训练***100包括训练样本获取单元101,第一特征值向量提取单元102,归类条件计算单元103,其中,
所述训练样本获取单元101,用来获取包括预定数量带有特定标记和不带有特定标记的图片作为训练样本;
所述第一特征值向量提取单元102,用来提取所述训练样本中图片的特征值向量;
所述归类条件计算单元103,用来基于提取的所述训练样本中每个图片的特征值向量计算所述训练样本中图片的归类条件;
图6为本申请一实施例提供的一种识别图片是否带有特定标记的***中识别***的功能模块图。如图6所示,所述识别***200包括待识别图片获取单元201,第二特征值向量提取单元202以及判断单元203,其中:
所述待识别图片获取单元201,用来获取待识别的图片;
所述第二特征值向量提取单元202,用来提取所述待识别图片的特征值向量;
所述判断单元203,用来基于所述归类条件计算所述待识别图片的特征值向量的归类值,并基于计算得到的归类值判断所述待识别图片是否带有特定标记。
上述特征值向量包括像素值向量或者局部特征向量。
进一步地,在本申请一优选实施例中,所述训练***100还包括:
像素设置单元110,用来按照预设方法设置从所述训练样本获取单元中获取的训练样本中图片的像素,并将设置像素后的图片发送至所述第一特征值向量提取单元。
进一步地,在本申请一优选实施例中,所述像素设置单元110具体包括:
第一像素设置单元111,用来选取所述训练样本中的第一图片,将所述训练样本中图片的像素设置为所述第一图片的像素;
或者,
第二像素设置单元112,用来将所述获取的训练样本中图片的像素设置为预设的像素。
进一步地,在本申请一优选实施例中,所述第二像素设置单元112包括:
压缩模块1121,用来将所述获取的训练样本中图片的像素压缩至预设的像素。
进一步地,在本申请一优选实施例中,所述归类条件计算单元103具体包括:
支持向量机计算模块1031,用来基于提取的所述训练样本中每个图片的特征值向量,利用支持向量机算法计算所述训练样本中图片的归类条件。
进一步地,在本申请一优选实施例中,所述识别***200还包括:
待识别像素设置单元210,用来将从所述待识别图片获取单元中获取的待识别图片的像素设置为预设的像素,并将设置像素后的待识别图片发送至所述第二特征值向量提取单元。
本申请实施例提供的一种识别图片是否带有特定标记的方法及***,首先可以通过训练过程,对预设数量的带有特定标记和不带有特定标记的图片进行特征分析,得到区分带有特定标记和不带有特定标记图片的归类条件;然后可以通过识别过程,利用所述得到的归类条件对待识别图片的特征进行判定,从而可以识别出待识别图片是否带有特定标记。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable Gate Array,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字***“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片2。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(HardwareDescription Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(AdvancedBoolean Expression Language)、AHDL(Altera Hardware Description Language)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware DescriptionLanguage)、Lava、Lola、MyHDL、PALASM、RHDL(Ruby Hardware Description Language)等,目前最普遍使用的是VHDL(Very-High-Speed Integrated Circuit Hardware DescriptionLanguage)与Verilog2。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、AtmelAT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。
本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的***、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于***实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本申请可用于众多通用或专用的计算机***环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器***、基于微处理器的***、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何***或设备的分布式计算环境等等。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
虽然通过实施例描绘了本申请,本领域普通技术人员知道,本申请有许多变形和变化而不脱离本申请的精神,希望所附的权利要求包括这些变形和变化而不脱离本申请的精神。

Claims (16)

1.一种识别图片是否带有特定标记的方法,其特征在于,包括:
获取包括预定数量带有特定标记和不带有特定标记的图片作为训练样本;
提取所述训练样本中图片的特征值向量;
基于提取的所述训练样本中每个图片的特征值向量计算所述训练样本中图片的归类条件;
获取待识别的图片,提取所述待识别图片的特征值向量;
基于所述归类条件计算所述待识别图片的特征值向量的归类值,并基于计算得到的归类值判断所述待识别图片是否带有特定标记。
2.如权利要求1所述的一种识别图片是否带有特定标记的方法,其特征在于,所述特征值向量包括像素值向量或者局部特征向量。
3.如权利要求1所述的一种识别图片是否带有特定标记的方法,其特征在于,在所述提取所述训练样本中图片的特征值向量之前,还包括:
按照预设方法设置所述获取的训练样本中图片的像素。
4.如权利要求3所述的一种识别图片是否带有特定标记的方法,其特征在于,所述按照预设方法设置所述获取的训练样本中图片的像素具体包括:
选取所述训练样本中的第一图片,将所述训练样本中图片的像素设置为所述第一图片的像素。
5.如权利要求3所述的一种识别图片是否带有特定标记的方法,其特征在于,所述按照预设方法设置所述获取的训练样本中图片的像素具体包括:
将所述获取的训练样本中图片的像素设置为预设的像素。
6.如权利要求5所述的一种识别图片是否带有特定标记的方法,其特征在于,所述将所述获取的训练样本中图片的像素设置为预设的像素包括:
将所述获取的训练样本中图片的像素压缩至预设的像素。
7.如权利要求1所述的一种识别图片是否带有特定标记的方法,其特征在于,所述基于提取的所述训练样本中每个图片的特征值向量计算所述训练样本中图片的归类条件具体包括:
基于提取的所述训练样本中每个图片的特征值向量,利用支持向量机算法计算所述训练样本中图片的归类条件。
8.如权利要求1所述的一种识别图片是否带有特定标记的方法,其特征在于,在提取所述待识别图片的特征值向量之前还包括:
将所述待识别图片的像素设置为预设的像素。
9.一种识别图片是否带有特定标记的***,其特征在于,包括训练***和识别***,所述训练***包括训练样本获取单元,第一特征值向量提取单元,归类条件计算单元,所述识别***包括待识别图片获取单元,第二特征值向量提取单元以及判断单元,其中,
所述训练样本获取单元,用来获取包括预定数量带有特定标记和不带有特定标记的图片作为训练样本;
所述第一特征值向量提取单元,用来提取所述训练样本中图片的特征值向量;
所述归类条件计算单元,用来基于提取的所述训练样本中每个图片的特征值向量计算所述训练样本中图片的归类条件;
所述待识别图片获取单元,用来获取待识别的图片;
所述第二特征值向量提取单元,用来提取所述待识别图片的特征值向量;
所述判断单元,用来基于所述归类条件计算所述待识别图片的特征值向量的归类值,并基于计算得到的归类值判断所述待识别图片是否带有特定标记。
10.如权利要求9所述的一种识别图片是否带有特定标记的***,其特征在于,所述特征值向量包括像素值向量或者局部特征向量。
11.如权利要求9所述的一种识别图片是否带有特定标记的***,其特征在于,所述训练***还包括:
像素设置单元,用来按照预设方法设置从所述训练样本获取单元中获取的训练样本中图片的像素,并将设置像素后的图片发送至所述第一特征值向量提取单元。
12.如权利要求11所述的一种识别图片是否带有特定标记的***,其特征在于,所述像素设置单元具体包括:
第一像素设置单元,用来选取所述训练样本中的第一图片,将所述训练样本中图片的像素设置为所述第一图片的像素。
13.如权利要求11所述的一种识别图片是否带有特定标记的***,其特征在于,所述像素设置单元具体包括:
第二像素设置单元,用来将所述获取的训练样本中图片的像素设置为预设的像素。
14.如权利要求13所述的一种识别图片是否带有特定标记的***,其特征在于,所述第二像素设置单元包括:
压缩模块,用来将所述获取的训练样本中图片的像素压缩至预设的像素。
15.如权利要求9所述的一种识别图片是否带有特定标记的***,其特征在于,所述归类条件计算单元具体包括:
支持向量机计算模块,用来基于提取的所述训练样本中每个图片的特征值向量,利用支持向量机算法计算所述训练样本中图片的归类条件。
16.如权利要求9所述的一种识别图片是否带有特定标记的***,其特征在于,所述识别***还包括:
待识别像素设置单元,用来将从所述待识别图片获取单元中获取的待识别图片的像素设置为预设的像素,并将设置像素后的待识别图片发送至所述第二特征值向量提取单元。
CN201510028053.9A 2015-01-20 2015-01-20 一种识别图片是否带有特定标记的方法及*** Pending CN105868768A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510028053.9A CN105868768A (zh) 2015-01-20 2015-01-20 一种识别图片是否带有特定标记的方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510028053.9A CN105868768A (zh) 2015-01-20 2015-01-20 一种识别图片是否带有特定标记的方法及***

Publications (1)

Publication Number Publication Date
CN105868768A true CN105868768A (zh) 2016-08-17

Family

ID=56622930

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510028053.9A Pending CN105868768A (zh) 2015-01-20 2015-01-20 一种识别图片是否带有特定标记的方法及***

Country Status (1)

Country Link
CN (1) CN105868768A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106484140A (zh) * 2016-10-14 2017-03-08 乐视控股(北京)有限公司 一种在虚拟现实***中识别编码信息的方法及装置
CN109034169A (zh) * 2018-06-29 2018-12-18 广州雅特智能科技有限公司 智能食物容器识别方法、装置和***
CN112101356A (zh) * 2020-09-27 2020-12-18 中国建设银行股份有限公司 一种图片中特定文本的定位方法、装置及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102098449A (zh) * 2010-12-06 2011-06-15 北京邮电大学 一种利用标志检测进行电视节目内部自动分割的方法
CN102138151A (zh) * 2007-06-13 2011-07-27 微软公司 将图像分类为广告图像或非广告图像
CN103020971A (zh) * 2012-12-28 2013-04-03 青岛爱维互动信息技术有限公司 从图像中自动分割目标对象的方法
CN103020646A (zh) * 2013-01-06 2013-04-03 深圳市彩讯科技有限公司 一种支持增量训练的垃圾图片识别方法和***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102138151A (zh) * 2007-06-13 2011-07-27 微软公司 将图像分类为广告图像或非广告图像
CN102098449A (zh) * 2010-12-06 2011-06-15 北京邮电大学 一种利用标志检测进行电视节目内部自动分割的方法
CN103020971A (zh) * 2012-12-28 2013-04-03 青岛爱维互动信息技术有限公司 从图像中自动分割目标对象的方法
CN103020646A (zh) * 2013-01-06 2013-04-03 深圳市彩讯科技有限公司 一种支持增量训练的垃圾图片识别方法和***

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106484140A (zh) * 2016-10-14 2017-03-08 乐视控股(北京)有限公司 一种在虚拟现实***中识别编码信息的方法及装置
CN109034169A (zh) * 2018-06-29 2018-12-18 广州雅特智能科技有限公司 智能食物容器识别方法、装置和***
CN109034169B (zh) * 2018-06-29 2021-02-26 广州雅特智能科技有限公司 智能食物容器识别方法、装置、***和存储介质
CN112101356A (zh) * 2020-09-27 2020-12-18 中国建设银行股份有限公司 一种图片中特定文本的定位方法、装置及存储介质

Similar Documents

Publication Publication Date Title
KR102102161B1 (ko) 이미지 내 객체의 대표 특성을 추출하는 방법, 장치 및 컴퓨터 프로그램
US10372226B2 (en) Visual language for human computer interfaces
Mäenpää et al. Classification with color and texture: jointly or separately?
CN103971126B (zh) 一种交通标志识别方法和装置
CN105913093B (zh) 一种用于文字识别处理的模板匹配方法
KR101995294B1 (ko) 영상 분석 장치 및 방법
CN108446697A (zh) 图片处理方法、电子装置及存储介质
CN103761529B (zh) 一种基于多色彩模型和矩形特征的明火检测方法和***
CN104899586B (zh) 对图像中包含的文字内容进行识别方法及装置
CN109636825A (zh) ***图形分割方法、装置及计算机可读存储介质
CN109635818A (zh) ***防伪检验方法、装置及计算机可读存储介质
CN104298969B (zh) 基于颜色与haar特征融合的人群规模统计方法
CN107066972B (zh) 基于多通道极值区域的自然场景文本检测方法
CN110414538A (zh) 缺陷分类方法、缺陷分类训练方法及其装置
CN108629319B (zh) 图像检测方法及***
CN104978565B (zh) 一种普适性的图像文字提取方法
US10991104B2 (en) Image processing device, image processing method, and program
Karma Determination and measurement of color dissimilarity
CN104475344B (zh) 基于机器视觉实现纺织纱管分拣的方法
CN110287787A (zh) 图像识别方法、装置及计算机可读存储介质
CN105868768A (zh) 一种识别图片是否带有特定标记的方法及***
CN109284759A (zh) 一种基于支持向量机(svm)的魔方颜色识别方法
CN108830908A (zh) 一种基于人工神经网络的魔方颜色识别方法
CN110889718B (zh) 方案筛选方法、方案筛选装置、介质以及电子设备
Shi et al. Video-based fire detection with spatio-temporal SURF and color features

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1228065

Country of ref document: HK

RJ01 Rejection of invention patent application after publication

Application publication date: 20160817

RJ01 Rejection of invention patent application after publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1228065

Country of ref document: HK