CN102915372A - 图像检索方法、装置及*** - Google Patents
图像检索方法、装置及*** Download PDFInfo
- Publication number
- CN102915372A CN102915372A CN2012104386986A CN201210438698A CN102915372A CN 102915372 A CN102915372 A CN 102915372A CN 2012104386986 A CN2012104386986 A CN 2012104386986A CN 201210438698 A CN201210438698 A CN 201210438698A CN 102915372 A CN102915372 A CN 102915372A
- Authority
- CN
- China
- Prior art keywords
- image
- gray level
- profile
- level image
- scene
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了一种图像检索方法,首先对摄像模块捕获的场景图像进行灰度变换及降噪处理,得到场景灰度图像;然后在所述场景灰度图像中检测目标对象轮廓;最后将目标对象轮廓内的目标灰度图像或目标灰度图像的特征描述上传至图像检索服务器端进行图像检索,相应的,本发明还公开了一种图像检索装置、移动终端及图像检索***,在图像检索之前,通过轮廓检测精确提取出目标对象,有效减少图像背景对图像检索结果的影响,提高检索精确度。
Description
技术领域
本发明涉及图像处理领域,尤其涉及一种图像检索方法、装置及***。
背景技术
图像检索分为基于文本和基于内容两种。目前,大多数搜索引擎提供的图像检索都是基于文本的检索,即基于图像外部信息或人工标注的关键词进行自由词检索,基于文本的图像检索需要将图像与文本相关联,通过文本搜索来获取图像的检索结果,其检索准确度受关键字影响较大,图像中所包含的视觉特征(颜色或纹理等)往往无法用文本进行客观描述,主观理解的差异将导致图像检索中的失配错误。同时数据库的建立需要大量的人工操作,成本较高。
随着大规模数字图像库的出现,基于文本的检索已经无法适应需求,基于内容的图像检索技术(content-based image retrieval)应运而生,区别于原有***中对图像进行人工标注的做法,基于内容的检索技术自动提取每幅图像的视觉内容特征作为其索引,如色彩、纹理、形状等。
随着移动互联网技术的发展,基于内容的图像检索也逐渐被运用于移动终端中。现有的移动图像检索,均是将移动终端摄像模块采集的场景图像直接上传至检索服务器进行图像检索,这种方式不仅数据量大,对网络带宽要求较高,且更严重的是摄像模块在采集目标对象图像时,往往会采集到目标对象附近的背景内容,而图像背景内容在图像检索过程中会形成严重干扰,从而严重影响图像检索的准确度。
发明内容
本发明的目的是提供一种图像检索方法、装置及***,在图像检索之前,进行轮廓检测,提取出目标对象轮廓,并将目标对象轮廓内的目标灰度图像截取出来上传至图像检索服务器端进行基于内容的图像检索,减少图像背景对图像检索结果的影响,提高检索精确度,本发明特别适用于移动云图像检索领域。
为了实现上述发明目的,本发明提供了一种图像检索方法,包括:对摄像模块捕获的场景图像进行灰度变换及降噪处理,得到场景灰度图像;在所述场景灰度图像中检测目标对象轮廓,并将目标对象轮廓内的目标灰度图像截取出来上传至图像检索服务器端进行图像检索;或对目标对象轮廓内的目标灰度图像进行特征检测得到特征描述,将得到的目标灰度图像的特征描述上传至图像检索服务器端进行图像检索,本处特征检测可采用SIFT、SURF、Ferns、ORB等算法,SIFT等特征检测可以用移动终端的CPU(Central Processing Unit,中央处理器)或GPU(Graphic Processing Unit,图形处理器)或专用ASIC芯片(ASIC,Application Specific Integrated Circuit)来完成。
当向图像检索服务器端上传的数据为目标灰度图像时,图像检索服务器端首先要对上传的所述目标灰度图像进行特征检测,得到目标灰度图像的特征描述,然后再将所述目标灰度图像的特征描述与数据库中样本图像的特征描述进行匹配,返回匹配成功的样本图像所对应的资源信息。而当向图像检索服务器端上传的数据为目标灰度图像的特征描述时,图像检索服务器端可直接进入图像匹配步骤。
优选的,所述在所述场景灰度图像中检测目标对象轮廓步骤进一步包括:对所述场景灰度图像进行轮廓检测,得到场景灰度图像中的所有轮廓数据;对所述所有轮廓数据进行封闭性检测和多边形拟合,提取出与预置模板图像的轮廓形状一致的所有封闭轮廓或提取出满足预置形状参数的所有封闭轮廓;将所述提取出的封闭轮廓中的包含所述场景灰度图像中心点的最大轮廓或最小轮廓确定为目标对象轮廓。
优选的,所述在所述场景灰度图像中检测目标对象轮廓步骤进一步包括:对所述场景灰度图像进行轮廓检测,得到场景灰度图像中的所有轮廓数据;对所述所有轮廓数据进行封闭性检测及中心点检测,提取出包含所述场景灰度图像中心点的所有封闭性轮廓;对所述提取出的包含中心点的所有封闭性轮廓进行多边形拟合,提取出与预置模板图像的轮廓形状一致的准目标对象轮廓或提取出满足预置形状参数的准目标对象轮廓;将所述提取出的准目标对象轮廓中的最大轮廓或最小轮廓确定为目标对象轮廓。
优选的,所述对所述场景灰度图像进行轮廓检测采用Canny算子、Sobel算子、Prewitt算子、Robert算子和Laplacian算子中的一种,这些算法均属于现有技术,在此不做详细介绍。
优选的,在目标对象轮廓检测出来之后,还包括:检测距目标对象轮廓一定范围内是否有触发标识;当在预置时间内检测到触发标识,则进行目标灰度图像的截图或进行目标图像特征检测步骤,进而向图像检索服务器端发起图像检索请求;而当预置时间内检测不到触发标识时,则结束本次图像检索流程。
优选的,在所述场景灰度图像中检测目标对象轮廓之前,还包括:检测所述场景灰度图像中是否有触发标识;当在预置时间内检测到触发标识,则在所述场景灰度图像中检测目标对象轮廓,否则结束本次图像检索流程。
相应的,本发明还提供了一种图像检索装置,包括灰度变换模块、轮廓提取模和检索请求模块,所述图像检索装置与移动终端的摄像模块连接,其中:所述灰度变换模块,用于对摄像模块捕获的场景图像进行灰度变换及降噪处理,得到场景灰度图像;所述轮廓提取模块,用于在所述场景灰度图像中检测目标对象轮廓;所述检索请求模块,用于将目标对象轮廓内的目标灰度图像截取出来上传至图像检索服务器端进行图像检索;或对目标对象轮廓内的目标灰度图像进行特征检测,将得到目标灰度图像的特征描述上传至图像检索服务器端进行图像检索。
优选的,所述轮廓提取模块包括:轮廓数据检测单元,对所述灰度变换模块转换得到的场景灰度图像进行轮廓检测,得到场景灰度图像中的所有轮廓数据;轮廓封闭性检测及多边形拟合单元,对所述轮廓数据检测单元检测出的所有轮廓数据进行封闭性检测和多边形拟合,提取出与图像检索服务器端存储的预置模板图像的轮廓形状一致的所有封闭轮廓或提取出满足预置形状参数的所有封闭轮廓;目标对象轮廓确定单元,将所述提取出的封闭轮廓中的包含所述场景灰度图像中心点的最大轮廓或最小轮廓确定为目标对象轮廓。
优选的,所述轮廓提取模块包括:轮廓数据检测单元,对所述灰度变换模块转换得到的场景灰度图像进行轮廓检测,得到场景灰度图像中的所有轮廓数据;轮廓封闭性检测及中心点检测单元,在上述轮廓数据检测单元检测到得所有轮廓数据中,提取出包含所述场景灰度图像中心点的所有封闭性轮廓;多边形拟合单元,对所述提取出的包含中心点的所有封闭性轮廓进行多边形拟合,提取出与预置模板图像的轮廓形状一致的准目标对象轮廓或提取出满足预置形状参数的准目标对象轮廓;目标对象轮廓确定单元,将所述提取出的准目标对象轮廓中的最大轮廓或最小轮廓确定为目标对象轮廓。
优选的,所述图像检索装置还包括触发标识检测模块,所述触发标识检测模块连接在所述轮廓提取模块与所述检索请求模块之间,用于在目标对象轮廓检测出来之后,检测距目标对象轮廓一定范围内是否有触发标识;当在预置时间内检测到触发标识,则触发所述检索请求模块工作。
优选的,所述图像检索装置还包括触发标识检测模块,所述触发标识检测模块连接在所述所述灰度变换模块与所述轮廓提取模块之间,用于在所述轮廓提取模块工作之前,检测场景灰度图像内是否有触发标识;当在预置时间内检测到触发标识,则触发所述轮廓提取模块工作。
相应的,本发明还提供了一种移动终端,包括摄像模块及与摄像模块相连的图像检索装置,所述图像检索装置为前述的图像检索装置。
相应的,本发明还提供了一种图像检索***,包括移动终端和图像检索服务器端;所述移动终端为上述的移动终端,所述移动终端将摄像模块捕获的场景图像进行灰度变换及降噪处理,得到场景灰度图像;并在所述场景灰度图像中检测出目标对象轮廓,将目标对象轮廓内的目标灰度图像截取出来上传至图像检索服务器端;所述图像检索服务器端接收到所述目标灰度图像后,对所述目标灰度图像进行特征检测(本处特征检测可采用SIFT、SURF、Ferns、ORB、BRIEF、BRISK、FREAK等算法),得到目标灰度图像的特征描述;并将所述目标灰度图像的特征描述与数据库中样本图像的特征描述进行匹配,向所述移动终端返回匹配成功的样本图像所对应的资源信息。
相应的,本发明还提供了另一种图像检索***,包括移动终端和图像检索服务器端;所述移动终端为上述的移动终端,所述移动终端将摄像模块捕获的场景图像进行灰度变换及降噪处理,得到场景灰度图像;并在所述场景灰度图像中检测出目标对象轮廓,对目标对象轮廓内的目标灰度图像进行特征检测,将得到目标灰度图像的特征描述上传至图像检索服务器端,本处特征检测可采用SIFT、SURF、Ferns、ORB、BRIEF、BRISK、FREAK等算法,SIFT等特征检测可以用移动终端的CPU或GPU或专用ASIC芯片来完成;所述图像检索服务器端接收到所述目标灰度图像的特征描述后,将所述目标灰度图像的特征描述与数据库中样本图像的特征描述进行匹配,向所述移动终端返回匹配成功的样本图像所对应的资源信息。
本发明具有如下有益效果:
1、本发明是基于内容的图像检索,相对于基于文本的图像检索方式,其准确度不会受到搜索关键字的制约;
2、本发明通过目标对象轮廓提取,去除摄像模块捕获场景图像中的背景内容,能有效防止干扰,提高图像检索准确度;
3、本发明上传到图像检索服务器端的数据为摄像模块捕获的原图像的子图像或子图像的特征描述,数据量相对较小,能有效缩短上传时间,减少用户的网络流量消耗。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图:
图1为本发明实施例图像检索方法流程图;
图2为本发明实施例方法中在场景灰度图像中检测目标对象轮廓的流程示意图;
图3为本发明实施例图像检索***工作流程一;
图4为本发明实施例图像检索***工作流程二;
图5为本发明实施例图像检索装置结构示意图一;
图6为本发明实施例图像检索装置结构示意图二;
图7为本发明实施例中图像检索装置内的轮廓提取模块结构示意图一;
图8为本发明实施例中图像检索装置内的轮廓提取模块结构示意图二。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明主要涉及基于内容的图像检索,在图像特征提取与匹配之前,对输入图像进行目标轮廓检测,将目标与背景区域分割开来,然后将目标对象的灰度图像或目标对象灰度图像的特征描述上传至图像检索服务器进行图像检索,减少图像背景对图像检索结果的影响,提高检索精确度。
本发明实施例中,基于内容的图像检索,图像特征提取可采用任意特征提取算法进行,例如:基于描述的特征SIFT(Scale-invariant feature transform,尺度不变特征转换)、SURF(Speeded-Up Robust Features,快速稳健性特征)、ORB(Oriented FAST and Rotated BRIEF)、BRIEF(Binary Robust IndependentElementary Features)、BRISK(Binary Robust Invariant Scalable Keypoints)、FREAK(Fast Retina Keypoint)等,再如:基于分类器的特征Ferns,其中Ferns算法可参考“Fast Keypoint Recognition using Random Ferns M.M.Calonder,V.Lepetit,P.Fua IEEE Transactions on Pattern Analysis and MachineIntelligence,Vol.32,Nr.3,pp.448-461,March 2010”。
为了方便描述,后面的实施例中,统一选用SIFT算法来进行举例描述,此举不能视为对图像特征提取算法的限定。
参见图1,为本发明实施例图像检索方法的一种流程图,所述图像检索方法,包括:
步骤S101:对摄像模块捕获的场景图像进行灰度变换及降噪处理,得到场景灰度图像;
步骤S102:在所述场景灰度图像中检测目标对象轮廓;
步骤S103:将目标对象轮廓内的目标灰度图像截取出来上传至图像检索服务器端进行图像检索;或对目标对象轮廓内的目标灰度图像进行SIFT特征检测,将得到的目标灰度图像的SIFT特征描述上传至图像检索服务器端进行图像检索。
在步骤S102中,检测目标对象轮廓的流程有两种,两种流程均包括轮廓检测、轮廓封闭性检测、多边形拟合、中心点判断等步骤,只是这些步骤的先后顺序有所不同。
下面首先结合图2进行介绍第一种目标对象轮廓的检测流程,主要包括以下三步:
A1:轮廓检测(边缘检测),即对步骤S101中得到的场景灰度图像进行轮廓检测,得到场景灰度图像中的所有轮廓数据,本步中,轮廓检测可以采用Canny算子、Sobel算子、Prewitt算子、Robert算子和Laplacian等边缘检测算子中的一种。
A2:轮廓封闭性检测及多边形拟合,即对A1步骤检测出的所有轮廓数据进行封闭性检测和多边形拟合,提取出与预置模板图像的轮廓形状一致的所有封闭轮廓或提取出满足预置形状参数的所有封闭轮廓。
其中,封闭性检测是检查轮廓是否为封闭的,排除孤立的曲线轮廓对后续检测的影响。而轮廓多边形拟合,有两种方式,一种是预先用参数的形式设定要提取哪种或哪几种形状的多边形,在多边形拟合时将满足预置形状参数要求的封闭多边形轮廓提取出来(此种方式适合特定应用场景,即需要提取的为规则多边形轮廓,如三角形、四边形或五边形等简单多边形的其中一种或几种,可预置判断条件,仅判断多边形边数即可);另外一种是在数据库中放入模板图像(可以为一张,也可以为多张),然后将模板图像的形状抽象为多边形,提取出与模板图像形状一致的封闭多轮廓,此种方式适用于任意形状图像轮廓,尤其能解决复杂形状图像轮廓的拟合,如人脸轮廓等;如图2中,数据库中的模板图像轮廓为四边形,则多边形拟合时,仅提取四边形轮廓。当然在复杂情况下,两种多边形拟合方式可以混合使用。
A3:轮廓唯一性判断,即将所述提取出的封闭轮廓中的包含所述场景灰度图像中心点的最大轮廓或最小轮廓确定为目标对象轮廓。
由于场景图像中与模板图像形状一致的轮廓或满足预置形状参数的轮廓并不唯一,因此经过A2步骤提取出来的封闭轮廓也极可能不唯一,为了得到目标对象轮廓,需要对A2步骤提取出来的轮廓进行一个唯一性判断,确定目标对象轮廓。例如,可以设定包含场景灰度图像中心点的最大轮廓或最小轮廓确定为目标对象轮廓,因为根据一般用户的使用习惯,用于在对目标对象拍照时,目标对象会占据屏幕的中间区域且相对尺寸较大,因此可以设定包含屏幕中心点的最大轮廓为目标对象轮廓(最小轮廓也可,但不太符合一般用户习惯)。
第二种目标对象轮廓的检测流程中,先进行中心点检测再进行多边形拟合,通过中心点检测即可剔除大部分不相关轮廓,相比第一种目标对象轮廓的检测流程(即图2流程)更容易得到目标对象轮廓,具体步骤如下:
B1:对所述场景灰度图像进行轮廓检测,得到场景灰度图像中的所有轮廓数据;
B2:对所述所有轮廓数据进行封闭性检测及中心点检测,提取出包含所述场景灰度图像中心点的所有封闭性轮廓;
B3:对所述提取出的包含中心点的所有封闭性轮廓进行多边形拟合,提取出与预置模板图像的轮廓形状一致的准目标对象轮廓或提取出满足预置形状参数的准目标对象轮廓;
B4:将所述提取出的准目标对象轮廓中的最大轮廓或最小轮廓确定为目标对象轮廓。
在步骤S103中,当向图像检索服务器端上传的数据为目标灰度图像时,图像检索服务器端接收图像检索请求后,首先对上传的所述目标灰度图像进行SIFT特征检测,得到目标灰度图像的SIFT特征描述,然后将所述目标灰度图像的SIFT特征描述与数据库中样本图像的特征描述进行匹配,返回匹配成功的样本图像所对应的资源信息,此种方式中,目标对象轮廓的检测流程采用图2方式时,则本发明实施例的整个图像检索流程可参见图3。
而当在步骤S103中,向图像检索服务器端上传的数据为目标灰度图像的SIFT特征描述时,图像检索服务器端接收图像检索请求后,直接进行图像匹配,此种方式中,目标对象轮廓的检测流程采用图2方式时,则本发明实施例的整个图像检索流程可参见图4。
优选的,在步骤S102与S103之间,还可以增加一个触发标识检测步骤,即在目标对象轮廓检测出来之后,不是立即进入步骤S103,而是检测距目标对象轮廓一定范围内是否有触发标识,只有在预置时间内在目标对象轮廓周围检测到触发标识,才进入S103步骤,进而向图像检索服务器端发起图像检索请求;而当预置时间内检测不到触发标识时,则结束本次图像检索流程,本次图像检索流程结束后,可设定回到步骤S101重复进行检索步骤,也可设定为结束整个流程不再捕获场景图像。所述目标对象轮廓一定范围是根据需要预设的,例如可以设置为轮廓向外延1至2厘米或向内延1-2厘米的范围。
所述触发标识可以为任意预置标识,比如一个LOGO,或一个特定图形等,该触发标识起到一个控制开关的作用,可实现只向服务器端上传带有触发标识的图像,提高检索准确率。例如:将本发明实施例的图像检索方法运用于增强现实时,可以在能进行增强现实的图片轮廓周边标记一个特定触发标识,只有标记了这个触发标识的图片才将其上传到图像检索服务器检索,以实现准确推送增强现实信息,避免用户用终端任意捕获图像均发送到服务器端进行检索,造成的服务器端检索压力大,且任意图像入库增强现实的可能性也比较小,会造成时长检索不到结果,降低用户体验。
在一种实施例中,上述的触发标识检测步骤可以设置在步骤S101与步骤S102之间,用触发标识触发是否进行轮廓检测,实现只对带有触发标识的场景灰度图像进行轮廓检测及后续步骤,即检测S101步骤得到的场景灰度图像中是否有触发标识,当在预置时间内检测到触发标识,则开始在所述场景灰度图像中检测目标对象轮廓,否则结束本次图像检索流程,这样可以极大减少移动终端中的开销。
参见图5,为本发明实施例图像检索装置的结构示意图,包括灰度变换模块1、轮廓提取模2和检索请求模块3,所述图像检索装置安装于移动终端中(实际实施时,图像检索装置可以客户端***的方式安装于移动终端中),与移动终端的摄像模块信号连接,其中:所述灰度变换模块1,用于对摄像模块捕获的场景图像进行灰度变换及降噪处理,得到场景灰度图像;所述轮廓提取模块2,用于在所述场景灰度图像中检测目标对象轮廓;所述检索请求模块3,用于将目标对象轮廓内的目标灰度图像截取出来上传至图像检索服务器端进行图像检索;或对目标对象轮廓内的目标灰度图像进行SIFT特征检测,将得到目标灰度图像的SIFT特征描述上传至图像检索服务器端进行图像检索。
优选的,所述图像检索装置还包括触发标识检测模块4,参见图6,所述触发标识检测模块4连接在所述轮廓提取模块2与所述检索请求模块3之间,用于在目标对象轮廓检测出来之后,检测距目标对象轮廓一定范围内是否有触发标识;当在预置时间内检测到触发标识,则触发所述检索请求模块工作,起一个控制开关作用。
优选的,在实际运用过程中,触发标识检测模块4还可以连接在灰度变换模块1与轮廓提取模块2之间,用于在所述轮廓提取模块工作之前,检测场景灰度图像内是否有触发标识,当在预置时间内检测到触发标识,则触发所述轮廓提取模块2工作。
其中,轮廓提取模块2有两种结构,分别可参见图7、图8。
下面首先结合图7介绍轮廓提取模块的第一种结构,参见图7,所述轮廓提取模块2包括:轮廓数据检测单元21、轮廓封闭性检测及多边形拟合单元22和目标对象轮廓确定单元23,其中:
所述轮廓数据检测单元21,用于对所述灰度变换模块1转换得到的场景灰度图像进行轮廓检测,得到场景灰度图像中的所有轮廓数据;
所述轮廓封闭性检测及多边形拟合单元22,用于对所述轮廓数据检测单元检测出的所有轮廓数据进行封闭性检测和多边形拟合,提取出符合拟合要求的多边形。其中,封闭性检测是检查轮廓是否为封闭的,排除孤立的曲线轮廓对后续检测的影响。而轮廓多边形拟合,有两种方式,一种是预先用参数的形式设定要提取哪种或哪几种形状的多边形,在多边形拟合时将满足预置形状参数要求的封闭多边形轮廓提取出来(此种方式适合特定应用场景,即需要提取的为规则多边形轮廓,如三角形、四边形或五边形等简单多边形的其中一种或几种,可将多边形边数作为预置形状参数预置为判断条件,仅判断多边形边数即可),此种方式中,需要在轮廓封闭性检测及多边形拟合单元22中预先设置需要拟合的多边形参数;另外一种是在数据库中放入模板图像(可以为一张,也可以为多张),然后将模板图像的形状抽象为多边形,提取出与模板图像形状一致的封闭多轮廓,此种方式适用于任意形状图像轮廓,尤其能解决复杂形状图像轮廓的拟合,如人脸轮廓等,此种方式中,需要在服务器端的数据库中预先存入模板图像,轮廓封闭性检测及多边形拟合单元22在进行多边形拟合时,需调用服务器端数据库中的模板图像,进行轮廓多边形拟合;如图2中,数据库中的模板图像轮廓为四边形,则多边形拟合时,仅提取出四边形轮廓。当然在复杂情况下,两种多边形拟合方式可以混合使用。
所述目标对象轮廓确定单元23,将所述提取出的封闭轮廓中的包含所述场景灰度图像中心点的最大轮廓或最小轮廓确定为目标对象轮廓(实际运用时,根据用户使用习惯,一般设置包含中心点的最大轮廓为目标对象轮廓)。
下面首先结合图8介绍轮廓提取模块的第二种结构,参见图8,所述轮廓提取模块2包括:轮廓数据检测单元211、轮廓封闭性检测及中心点检测单元222、多边形拟合单元233及目标对象轮廓确定单元234,其中:
所述轮廓数据检测单元211,对所述灰度变换模块转换得到的场景灰度图像进行轮廓检测,得到场景灰度图像中的所有轮廓数据;
所述轮廓封闭性检测及中心点检测单元222,在上述轮廓数据检测单元211检测到得所有轮廓数据中,提取出包含所述场景灰度图像中心点的所有封闭性轮廓;
所述多边形拟合单元233,对所述提取出的包含中心点的所有封闭性轮廓进行多边形拟合,提取出与预置模板图像的轮廓形状一致的准目标对象轮廓或提取出满足预置形状参数的准目标对象轮廓;
所述目标对象轮廓确定单元234,将所述提取出的准目标对象轮廓中的最大轮廓或最小轮廓确定为目标对象轮廓。
本发明还公开了一种移动终端,包括摄像模块及与摄像模块相连的图像检索装置,所述图像检索装置为本发明实施例所公开的图像检索装置。
本发明还公开了一种图像检索***,包括上述安装有图像检索装置的移动终端和图像检索服务器端,下面结合图3来介绍本实施例图像检索***工作流程,主要包括如下步骤:
C1:移动终端摄像模块捕获包含目标对象的场景图像,得到彩色场景图像;简单理解,用户用移动终端摄像头对着需要进行图像检索的目标对象,以采集包含目标对象的场景图像(目标对象可以为特定的图片,人,物品等任意物体),此时采集的场景图像除了目标对象外,往往还包含目标对象周围的背景。
C2:将摄像模块捕获的场景图像进行灰度变换及降噪处理,得到场景灰度图像;
C3:对场景灰度图像进行轮廓检测,获得图像中所有的轮廓数据;
C4:对C3步骤得到的所有轮廓数据进行封闭性检测和多边形拟合,提取出与预置模板图像的轮廓形状一致的所有封闭轮廓或提取出预定形状的所有封闭轮廓;
C5:对C4筛选出来的轮廓进行唯一性判断,以确定目标对象轮廓;
C6:将目标对象轮廓内的目标灰度图像截取出来上传图像检索服务器端进行图像检索;
C7:图像检索服务器端接收图像检索请求,对上传的目标灰度图像进行SIFT特征检测,得到该图像的SIFT特征描述;
C8:将所述目标灰度图像的SIFT特征描述与数据库中样本图像的特征描述进行匹配,向所述移动终端返回匹配成功的样本图像所对应的资源信息。
上述步骤中C1~C6是在移动终端中完成的,而C7、C8步骤是在图像检索服务器端中进行的,移动终端是将目标灰度图像截取出来上传到服务器端。
本发明还提供了另一种图像检索***,同样包括安装有图像检索装置的移动终端和图像检索服务器端,其工作流程与上面实施例中图像检索***的工作流程大体相同,唯一的区别就是移动终端在检测出目标对象轮廓后,不是直接将目标对象轮廓内的目标灰度图像截取出来上传到服务器端,而是在移动终端中对目标对象轮廓内的目标灰度图像进行特征检测,如SIFT特征检测,将得到目标灰度图像的SIFT特征描述上传至图像检索服务器端,服务器端接收到检索请求后,无需进行特征点检测,直接匹配即可,其流程之一可参见图4,本实施例中,移动终端向服务器端上传的是目标对象灰度图像的特征描述,数据量相对上传灰度图更小。
本发明图像检索方法、装置及***,在图像检索之前,通过轮廓检测精确提取出目标对象,能有效去除摄像模块捕获场景图像中的背景内容,能有效防止干扰,提高图像检索准确度,另外由于发明上传到图像检索服务器端的数据为摄像模块捕获的原图像的子图像或子图像的特征描述,数据量相对较小,能有效缩短上传时间,减少用户的网络流量消耗。
本说明书中公开的所有特征,或公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合。
本说明书(包括任何附加权利要求、摘要和附图)中公开的任一特征,除非特别叙述,均可被其他等效或具有类似目的的替代特征加以替换。即,除非特别叙述,每个特征只是一系列等效或类似特征中的一个例子而已。
本发明并不局限于前述的具体实施方式。本发明扩展到任何在本说明书中披露的新特征或任何新的组合,以及披露的任一新的方法或过程的步骤或任何新的组合。
Claims (14)
1.一种图像检索方法,其特征在于,包括:
对摄像模块捕获的场景图像进行灰度变换及降噪处理,得到场景灰度图像;
在所述场景灰度图像中检测目标对象轮廓;
将目标对象轮廓内的目标灰度图像截取出来上传至图像检索服务器端进行图像检索,或
对目标对象轮廓内的目标灰度图像进行特征检测,将得到的目标灰度图像的特征描述上传至图像检索服务器端进行图像检索。
2.如权利要求1所述的方法,其特征在于,所述在所述场景灰度图像中检测目标对象轮廓步骤进一步包括:
对所述场景灰度图像进行轮廓检测,得到场景灰度图像中的所有轮廓数据;
对所述所有轮廓数据进行封闭性检测和多边形拟合,提取出与预置模板图像的轮廓形状一致的封闭轮廓或提取出满足预置形状参数的封闭轮廓;
将所述提取出的封闭轮廓中的包含所述场景灰度图像中心点的最大轮廓或最小轮廓确定为目标对象轮廓。
3.如权利要求1所述的方法,其特征在于,所述在所述场景灰度图像中检测目标对象轮廓步骤进一步包括:
对所述场景灰度图像进行轮廓检测,得到场景灰度图像中的所有轮廓数据;
对所述所有轮廓数据进行封闭性检测及中心点检测,提取出包含所述场景灰度图像中心点的所有封闭性轮廓;
对所述提取出的包含中心点的所有封闭性轮廓进行多边形拟合,提取出与预置模板图像的轮廓形状一致的准目标对象轮廓或提取出满足预置形状参数的准目标对象轮廓;
将所述提取出的准目标对象轮廓中的最大轮廓或最小轮廓确定为目标对象轮廓。
4.如权利要求2或3所述的方法,其特征在于,所述对所述场景灰度图像进行轮廓检测采用Canny算子、Sobel算子、Prewitt算子、Robert算子和Laplacian算子中的一种。
5.如权利要求1至3中任一项所述的方法,其特征在于,在目标对象轮廓检测出来之后,还包括:检测距目标对象轮廓一定范围内是否有触发标识;
当在预置时间内检测到触发标识,则进行目标灰度图像的截图或进行目标图像特征检测步骤,进而向图像检索服务器端发起图像检索请求;
而当预置时间内检测不到触发标识时,则结束本次图像检索流程。
6.如权利要求1至3中任一项所述的方法,其特征在于,在所述场景灰度图像中检测目标对象轮廓之前,还包括:检测所述场景灰度图像中是否有触发标识;
当在预置时间内检测到触发标识,则在所述场景灰度图像中检测目标对象轮廓,否则结束本次图像检索流程。
7.一种图像检索装置,其特征在于,包括灰度变换模块、轮廓提取模和检索请求模块,所述图像检索装置与移动终端的摄像模块连接,其中:
所述灰度变换模块,用于对摄像模块捕获的场景图像进行灰度变换及降噪处理,得到场景灰度图像;
所述轮廓提取模块,用于在所述场景灰度图像中检测目标对象轮廓;
所述检索请求模块,用于将目标对象轮廓内的目标灰度图像截取出来上传至图像检索服务器端进行图像检索;或对目标对象轮廓内的目标灰度图像进行特征检测,将得到目标灰度图像的特征描述上传至图像检索服务器端进行图像检索。
8.如权利要求7所述的装置,其特征在于,所述轮廓提取模块包括:
轮廓数据检测单元,对所述灰度变换模块转换得到的场景灰度图像进行轮廓检测,得到场景灰度图像中的所有轮廓数据;
轮廓封闭性检测及多边形拟合单元,对所述轮廓数据检测单元检测出的所有轮廓数据进行封闭性检测和多边形拟合,提取出与图像检索服务器端存储的预置模板图像的轮廓形状一致的封闭轮廓或提取出满足预置形状参数的封闭轮廓;
目标对象轮廓确定单元,将所述提取出的封闭轮廓中的包含所述场景灰度图像中心点的最大轮廓或最小轮廓确定为目标对象轮廓。
9.如权利要求7所述的装置,其特征在于,所述轮廓提取模块包括:
轮廓数据检测单元,对所述灰度变换模块转换得到的场景灰度图像进行轮廓检测,得到场景灰度图像中的所有轮廓数据;
轮廓封闭性检测及中心点检测单元,在上述轮廓数据检测单元检测到得所有轮廓数据中,提取出包含所述场景灰度图像中心点的所有封闭性轮廓;
多边形拟合单元,对所述提取出的包含中心点的所有封闭性轮廓进行多边形拟合,提取出与预置模板图像的轮廓形状一致的准目标对象轮廓或提取出满足预置形状参数的准目标对象轮廓;
目标对象轮廓确定单元,将所述提取出的准目标对象轮廓中的最大轮廓或最小轮廓确定为目标对象轮廓。
10.如权利要求7至9中任一项所述的装置,其特征在于,所述图像检索装置还包括触发标识检测模块,所述触发标识检测模块连接在所述轮廓提取模块与所述检索请求模块之间,用于在目标对象轮廓检测出来之后,检测距目标对象轮廓一定范围内是否有触发标识;
当在预置时间内检测到触发标识,则触发所述检索请求模块工作。
11.如权利要求7至9中任一项所述的装置,其特征在于,所述图像检索装置还包括触发标识检测模块,所述触发标识检测模块连接在所述所述灰度变换模块与所述轮廓提取模块之间,用于在所述轮廓提取模块工作之前,检测场景灰度图像内是否有触发标识;
当在预置时间内检测到触发标识,则触发所述轮廓提取模块工作。
12.一种移动终端,包括摄像模块,其特征在于,所述移动终端还包括与所述摄像模块连接的图像检索装置,所述图像检索装置为权利要求7至11中任一项所述的图像检索装置。
13.一种图像检索***,其特征在于,包括移动终端和图像检索服务器端;
所述移动终端为权利要求12所述的移动终端,所述移动终端将摄像模块捕获的场景图像进行灰度变换及降噪处理,得到场景灰度图像;并在所述场景灰度图像中检测出目标对象轮廓,将目标对象轮廓内的目标灰度图像截取出来上传至图像检索服务器端;
所述图像检索服务器端接收到所述目标灰度图像后,对所述目标灰度图像进行特征检测,得到目标灰度图像的特征描述;并将所述目标灰度图像的特征描述与数据库中样本图像的特征描述进行匹配,向所述移动终端返回匹配成功的样本图像所对应的资源信息。
14.一种图像检索***,其特征在于,包括移动终端和图像检索服务器端;
所述移动终端为权利要求12所述的移动终端,所述移动终端将摄像模块捕获的场景图像进行灰度变换及降噪处理,得到场景灰度图像;并在所述场景灰度图像中检测出目标对象轮廓,对目标对象轮廓内的目标灰度图像进行特征检测,将得到目标灰度图像的特征描述上传至图像检索服务器端;
所述图像检索服务器端接收到所述目标灰度图像的特征描述后,将所述目标灰度图像的特征描述与数据库中样本图像的特征描述进行匹配,向所述移动终端返回匹配成功的样本图像所对应的资源信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210438698.6A CN102915372B (zh) | 2012-11-06 | 2012-11-06 | 图像检索方法、装置及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210438698.6A CN102915372B (zh) | 2012-11-06 | 2012-11-06 | 图像检索方法、装置及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102915372A true CN102915372A (zh) | 2013-02-06 |
CN102915372B CN102915372B (zh) | 2016-02-03 |
Family
ID=47613738
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210438698.6A Active CN102915372B (zh) | 2012-11-06 | 2012-11-06 | 图像检索方法、装置及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102915372B (zh) |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103246742A (zh) * | 2013-05-20 | 2013-08-14 | 成都理想境界科技有限公司 | 图像检索触发方法及增强现实方法 |
CN103559194A (zh) * | 2013-09-12 | 2014-02-05 | 北京智谷睿拓技术服务有限公司 | 一种搜索方法、服务器、*** |
CN103927387A (zh) * | 2014-04-30 | 2014-07-16 | 成都理想境界科技有限公司 | 图像检索***及其相关方法和装置 |
CN103984942A (zh) * | 2014-05-28 | 2014-08-13 | 深圳市中兴移动通信有限公司 | 一种物象识别的方法及移动终端 |
CN104077569A (zh) * | 2014-06-24 | 2014-10-01 | 纵横壹旅游科技(成都)有限公司 | 一种图像识别方法及*** |
CN104850851A (zh) * | 2015-04-22 | 2015-08-19 | 福州大学 | 一种具有尺度不变性的orb特征点匹配方法 |
CN105426899A (zh) * | 2014-09-19 | 2016-03-23 | 腾讯科技(北京)有限公司 | 车辆识别方法、装置和客户端 |
CN105453087A (zh) * | 2013-08-14 | 2016-03-30 | 三星电子株式会社 | 具有共同兴趣信息的搜索结果 |
CN106203361A (zh) * | 2016-07-15 | 2016-12-07 | 苏州宾果智能科技有限公司 | 一种机器人跟踪方法和装置 |
CN106649741A (zh) * | 2016-12-26 | 2017-05-10 | 努比亚技术有限公司 | 图片搜索方法、装置和*** |
CN107153666A (zh) * | 2016-03-02 | 2017-09-12 | 魏立江 | 图片搜索法 |
CN107767162A (zh) * | 2016-08-18 | 2018-03-06 | 深圳市劲嘉数媒科技有限公司 | 基于包装盒的广告获取方法和装置 |
CN109582812A (zh) * | 2018-11-21 | 2019-04-05 | 安徽云融信息技术有限公司 | 一种用于计算机图像的检索方法 |
CN110099301A (zh) * | 2019-04-28 | 2019-08-06 | 深圳回收宝科技有限公司 | 基于截取图像进行终端检测的方法、装置和便携式终端 |
CN110097673A (zh) * | 2019-05-17 | 2019-08-06 | 北京深醒科技有限公司 | 一种基于红外摄像头下的门禁识别方法 |
CN110135483A (zh) * | 2019-04-30 | 2019-08-16 | 北京百度网讯科技有限公司 | 训练图像识别模型的方法、装置及相关设备 |
CN110866137A (zh) * | 2018-08-09 | 2020-03-06 | 中兴通讯股份有限公司 | 一种图像处理方法、装置及存储介质 |
CN112416960A (zh) * | 2020-11-18 | 2021-02-26 | 腾讯科技(深圳)有限公司 | 多场景下的数据处理方法、装置、设备及存储介质 |
CN114514555A (zh) * | 2019-09-25 | 2022-05-17 | 株式会社东芝 | 类似区域检测装置、类似区域检测方法及程序 |
CN115309988A (zh) * | 2022-08-10 | 2022-11-08 | 武汉圣男品牌管理有限公司 | 一种网页搜索内容匹配方法、***及存储介质 |
CN116012924A (zh) * | 2023-01-30 | 2023-04-25 | 人民网股份有限公司 | 人脸图库构建方法、装置及计算设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101789005A (zh) * | 2010-01-22 | 2010-07-28 | 深圳创维数字技术股份有限公司 | 一种基于感兴趣区域的图像检索方法 |
CN102622420A (zh) * | 2012-02-22 | 2012-08-01 | 哈尔滨工程大学 | 基于颜色特征和形状上下文的商标图像检索方法 |
CN102750535A (zh) * | 2012-04-01 | 2012-10-24 | 北京京东世纪贸易有限公司 | 自动提取图像前景的方法和*** |
-
2012
- 2012-11-06 CN CN201210438698.6A patent/CN102915372B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101789005A (zh) * | 2010-01-22 | 2010-07-28 | 深圳创维数字技术股份有限公司 | 一种基于感兴趣区域的图像检索方法 |
CN102622420A (zh) * | 2012-02-22 | 2012-08-01 | 哈尔滨工程大学 | 基于颜色特征和形状上下文的商标图像检索方法 |
CN102750535A (zh) * | 2012-04-01 | 2012-10-24 | 北京京东世纪贸易有限公司 | 自动提取图像前景的方法和*** |
Non-Patent Citations (1)
Title |
---|
章凤翎: "基于轮廓的图像匹配技术研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, no. 6, 15 June 2011 (2011-06-15) * |
Cited By (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103246742A (zh) * | 2013-05-20 | 2013-08-14 | 成都理想境界科技有限公司 | 图像检索触发方法及增强现实方法 |
CN105453087A (zh) * | 2013-08-14 | 2016-03-30 | 三星电子株式会社 | 具有共同兴趣信息的搜索结果 |
CN103559194A (zh) * | 2013-09-12 | 2014-02-05 | 北京智谷睿拓技术服务有限公司 | 一种搜索方法、服务器、*** |
CN103927387A (zh) * | 2014-04-30 | 2014-07-16 | 成都理想境界科技有限公司 | 图像检索***及其相关方法和装置 |
CN103927387B (zh) * | 2014-04-30 | 2017-06-16 | 成都理想境界科技有限公司 | 图像检索***及其相关方法和装置 |
CN103984942A (zh) * | 2014-05-28 | 2014-08-13 | 深圳市中兴移动通信有限公司 | 一种物象识别的方法及移动终端 |
CN104077569A (zh) * | 2014-06-24 | 2014-10-01 | 纵横壹旅游科技(成都)有限公司 | 一种图像识别方法及*** |
CN105426899A (zh) * | 2014-09-19 | 2016-03-23 | 腾讯科技(北京)有限公司 | 车辆识别方法、装置和客户端 |
CN105426899B (zh) * | 2014-09-19 | 2019-11-08 | 腾讯科技(北京)有限公司 | 车辆识别方法、装置和客户端 |
CN104850851A (zh) * | 2015-04-22 | 2015-08-19 | 福州大学 | 一种具有尺度不变性的orb特征点匹配方法 |
CN107153666A (zh) * | 2016-03-02 | 2017-09-12 | 魏立江 | 图片搜索法 |
CN106203361A (zh) * | 2016-07-15 | 2016-12-07 | 苏州宾果智能科技有限公司 | 一种机器人跟踪方法和装置 |
CN107767162A (zh) * | 2016-08-18 | 2018-03-06 | 深圳市劲嘉数媒科技有限公司 | 基于包装盒的广告获取方法和装置 |
CN106649741A (zh) * | 2016-12-26 | 2017-05-10 | 努比亚技术有限公司 | 图片搜索方法、装置和*** |
CN110866137A (zh) * | 2018-08-09 | 2020-03-06 | 中兴通讯股份有限公司 | 一种图像处理方法、装置及存储介质 |
CN109582812A (zh) * | 2018-11-21 | 2019-04-05 | 安徽云融信息技术有限公司 | 一种用于计算机图像的检索方法 |
CN110099301A (zh) * | 2019-04-28 | 2019-08-06 | 深圳回收宝科技有限公司 | 基于截取图像进行终端检测的方法、装置和便携式终端 |
CN110135483A (zh) * | 2019-04-30 | 2019-08-16 | 北京百度网讯科技有限公司 | 训练图像识别模型的方法、装置及相关设备 |
US11227186B2 (en) | 2019-04-30 | 2022-01-18 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method and device for training image recognition model and related device |
CN110097673A (zh) * | 2019-05-17 | 2019-08-06 | 北京深醒科技有限公司 | 一种基于红外摄像头下的门禁识别方法 |
CN114514555A (zh) * | 2019-09-25 | 2022-05-17 | 株式会社东芝 | 类似区域检测装置、类似区域检测方法及程序 |
CN112416960A (zh) * | 2020-11-18 | 2021-02-26 | 腾讯科技(深圳)有限公司 | 多场景下的数据处理方法、装置、设备及存储介质 |
CN115309988A (zh) * | 2022-08-10 | 2022-11-08 | 武汉圣男品牌管理有限公司 | 一种网页搜索内容匹配方法、***及存储介质 |
CN115309988B (zh) * | 2022-08-10 | 2023-07-07 | 上海迪塔班克数据科技有限公司 | 一种网页搜索内容匹配方法、***及存储介质 |
CN116012924A (zh) * | 2023-01-30 | 2023-04-25 | 人民网股份有限公司 | 人脸图库构建方法、装置及计算设备 |
CN116012924B (zh) * | 2023-01-30 | 2023-06-27 | 人民网股份有限公司 | 人脸图库构建方法、装置及计算设备 |
Also Published As
Publication number | Publication date |
---|---|
CN102915372B (zh) | 2016-02-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102915372A (zh) | 图像检索方法、装置及*** | |
CN106960195B (zh) | 一种基于深度学习的人群计数方法及装置 | |
US8792722B2 (en) | Hand gesture detection | |
US8750573B2 (en) | Hand gesture detection | |
US10534957B2 (en) | Eyeball movement analysis method and device, and storage medium | |
JP6719457B2 (ja) | 画像の主要被写体を抽出する方法とシステム | |
CN106548182B (zh) | 基于深度学习和主成因分析的路面裂纹检测方法及装置 | |
KR101322168B1 (ko) | 실시간 얼굴 인식 장치 | |
WO2019033572A1 (zh) | 人脸遮挡检测方法、装置及存储介质 | |
CN107798281B (zh) | 一种基于lbp特征的人脸活体检测方法和装置 | |
US20190362193A1 (en) | Eyeglass positioning method, apparatus and storage medium | |
CN106023257B (zh) | 一种基于旋翼无人机平台的目标跟踪方法 | |
CN102176208B (zh) | 基于三维空时特征的鲁棒视频指纹方法 | |
CN107798279B (zh) | 一种人脸活体检测方法及装置 | |
CN105303150B (zh) | 实现图像处理的方法和*** | |
AU2014321165A1 (en) | Image searching method and apparatus | |
CN106610969A (zh) | 基于多模态信息的视频内容审查***及方法 | |
JP6351243B2 (ja) | 画像処理装置、画像処理方法 | |
CN104463134B (zh) | 一种车牌检测方法和*** | |
CN104361357B (zh) | 基于图片内容分析的相片集分类***及分类方法 | |
CN111178252A (zh) | 多特征融合的身份识别方法 | |
JP6410450B2 (ja) | オブジェクト識別装置、オブジェクト識別方法及びプログラム | |
CN103218604A (zh) | 交通场景中基于路面提取的行人检测方法 | |
JP2018173818A5 (zh) | ||
CN103488966A (zh) | 一种能够识别实名制车票信息的智能手机 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |