具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例可应用于各种图像查找,包括本地的图像查找以及互联网中对服务器数据库中图像的查找,下面对本发明所述的图像检索方法详细介绍:
图1示出了本发明实施例提供的一种图像检索方法的实现流程,对其详述如下:
在步骤S101中,接收待检索的第一图像,提取所述第一图像的局部图像特征。
具体的,所述接收待检索的第一图像,一般为本软件所能识别的图像格式,如可以为JPG、BMP等格式的图片,当然也可以设置图片格式转换步骤,将其它不常用的、不能直接识别的图片格式转换为可识别的图片格式。另外,所述待检索的第一图像,还可以为图像的链接地址,通过接收输入的链接地址,通过浏览器获取图像。
所述局部图像特征,是相对于全局图像特征而言,局部图像特征是从图像的内容出发,提取出感兴趣的内容。其中,局部图像特征的描述可以用SIFT特征、SURF特征、DAISY特征等。其中,
SIFT(Scale Invariant Feature Transform)特征是应用最广的。SIFT对尺度、旋转以及一定视角和光照变化等图像变化都具有不变性,并且SIFT具有很强的可区分性,自它提出以来,很快在物体识别、宽基线图像匹配、三维重建、图像检索中得到了应用。
SURF(Speeded Up Robust Features)是对SIFT的改进版本,它利用Haar小波来近似SIFT方法中的梯度操作,同时利用积分图技术进行快速计算,SURF的速度是SIFT的3-7倍,大部分情况下它和SIFT的性能相当,因此它在很多应用中得到了应用,尤其是对运行时间要求高的场合。
DAISY是面向稠密特征提取的可快速计算的局部图像特征描述子,它本质思想和SIFT是一样的:分块统计梯度方向直方图,不同的是,DAISY在分块策略上进行了改进,利用高斯卷积来进行梯度方向直方图的分块汇聚,这样利用高斯卷积的可快速计算性就可以快速稠密地进行特征描述子的提取。
ASIFT(Affine SIFT)通过模拟所有成像视角下得到的图像进行特征匹配,可以很好地处理视角变化的情况,尤其是大视角变化下的图像匹配。
在步骤S102中,将所述第一图像的局部图像特征与图像库中的第二图像的局部图像特征比较,查找所述第一图像与所述第二图像中相同的局部图像特征。
其中,所述图像库,即为待检索的图像资源的集合,对于本地检索,图像库为本地图像的集合,对于网络检索,为搜索引擎中所记录的网络资源所在服务器构成的数据库。
其中,所述第二图像,为所述图像库中的其中的任一的一幅需要进行局部图像特征比较的图像。
由于局部图像特征具有尺度、旋转以及光照强度等变化后,局部图像特征不变性的特点,因此,可以有效的查找因尺度大小不同、旋转角度不同或者光照强度等因素不同的两幅图像中的相同局部图像特征。
在步骤S103中,根据所述相同的局部图像特征在图像中的位置信息,修改所述相同的局部图像特征的权值。
所述局部图像特征在图像中的位置信息,可以根据坐标位置来确定所述局部图像特征的位置,比如对于一个长方形的局部图像特征,可以用长方形的对角的坐标信息表示该局部图像特征的位置。当然,也可以用其它表示方式,如将图像按比例分割为多个格子,查找局部图像特征所在格子的位置。其中,所述按比例分割,是指对于不同的图像,均匀分割为固定个数的多个格子,对于不同大小的图像,由于按比例分割,相应的格子的大小也不相同。
如图2所示的分割图像示意图,第一图像分割九个格子,对于第二图像,也相应的分割为九个格子,由于第二图像的尺寸远小于第一图像,因此,对于第二图像中的每个格子的尺寸也相应的小于第一图像的尺寸。
所述相同的局部图像特征在图像中的位置,是指局部图像特征的位置相对于所在图像的位置。如图2所示,在第一图像中,点P位于第一行第二列的格子的位置,第二图像中的Q点位于第一行第二列的格子的位置,因此,第一图像中的P点和第二图像中的Q点所在位置相同。
所述修改所述相同的局部图像特征的权值,可以增加局部图像特征的权值,也可以减少局部图像特征的权值。对于图像中心表示的图像,一般为重点的图像主要表示,因此,可以增加该位置的局部图像特征的权值,相应的,对于非主要位置,如对于边角位置的局部图像特征信息,可以减少局部图像特征的权值。
在步骤S104中,根据所修改的局部图像特征的权值计算得到第一图像与第二图像的相似分值,根据所述相似分值,得到图像库中图像与第一图像相似的图像列表。
所述根据修改的局部图像特征的权值计算得到第一图像与第二图像的相似分值,具体为:查找第一图像与第二图像中包括的相同的局部图像特征,根据修改后的权值,对每个相同的局部图像特征求相似分值。比如定义普通的局部图像特征相同对应的分值为1,中心区域的局部图像特征的分值为2,则如果中心区域包括两个相同的局部图像特征,其它区域包括一个相同的局部图像特征,则第二图像与第一图像的相似分值为5。
根据第二图像与第一图像相似分值的计算方法,相应的计算图像库中的其它图像与第一图像的相似分值,根据计算后的相似分值从大到小进行排序,即可得到与第一图像相似的图像列表。
本发明实施例通过根据查找相同的局部图像特征以及根据局部图像的位置来确定不同的权值,从而可以更加快捷有效的查找到与待检索图像在特定位置相同的图像,从而能够更加准确搜索到同类主题表达的图像。
作为本发明实施例一种较优的实施方式,如图3所示,所述根据所述相同的局部图像特征在图像中的位置信息,修改所述相同的局部图像特征的权值包括:
在步骤S301中,将所述第一图像、所述第二图像,分别均匀分割为M×N个格子,其中M为行方向格子的个数,N为列方向格式的个数,且M和N均大于等于3。
在步骤S302中,获取M/2-A<X<M/2+B,N/2-C<Y<n/2+D所在的区域为第一区域,其中A、B为小于M/2的正数,C、D为小于N/2的正数。
在步骤S303中,当所述第一图像的第一区域中的局部图像特征与所述第二图像的第一区域的局部图像特征相同,将所述相同的局部图像特征的权值增加第一预设倍数。
其中,一种较优的实施方式如图4所示,将第一图像分割为10×10个格子,即M=N=10,其行方向(X方向)10个格子,列方向(Y方向)10个格子,从上往下标号,以及从左往右标号依次为1,2,3,4……10。
在所述10×10个格子的图像中,选取特征在3<=X<=8,3<=Y<=8的区域作为第一区域,即选择A=C=2,B=D=3,并且将第一区域的局部图像特征的权值增加两倍,即当所述第一图像的第一区域中的局部图像特征与所述第二图像的第一区域的局部图像特征相同时,原来定义的权值为1时,修改后权值为2。
本优选实施方式对重点的中心图像区域进行了权值修改具体进行了介绍,可以对于中心区域的局部图像特征相同的图像优先排序,而一般图像的主要表达位于图像的中心区域,从而可以更加方便人们查找到与待查找图像的主要表达的内容相同的图像。
作为本发明实施例又一个具体的优选实施方式,如图5所示,所述根据所述相同的局部图像特征在图像中的位置信息,修改所述相同的局部图像特征的权值包括:
在步骤S501中,将所述第一图像、所述第二图像,分别均匀分割为M×N个格子,其中M为行方向格子的个数,N为列方向格式的个数,且M和N均大于等于3。
在步骤S502中,查找第一图像与第二图像中存在相同的局部图像特征的位置,判断所述相同的局部图像特征的位置在第一图像和第二图像中是否相同或者相邻。
其中,所述相邻可以指四邻域相邻的方式,也可以指八邻域相邻的方式。
在步骤S503中,如果所述相同的局部图像特征的位置在第一图像和第二图像中相同,则将所述相同的局部图像特征的权值增加第二预设倍数。
在步骤S504中,如果所述相同的局部图像特征的位置处于四邻域的位置,则将所述相同的局部图像特征的权值增加第三预设倍数。
一种较优的实施方式如图6所示,将第一图像分割为10×10个格子,即M=N=10,其行方向(X方向)10个格子,列方向(Y方向)10个格子,从上往下标号,以及从左往右标号依次为1,2,3,4……10。
如图6所示的第一图像中的R点,位于第一图像的左上角第2行第2列,第二图像中的S点,位于第二图像的左上角第3行第2列,根据步骤S503的定义,可以将所述相同的局部图像特征的权值增加第二预设倍数,与图3所述的第一预设位数为2相对应,可以设置第二预设倍数为1.5。
如图6所示,位于第二图像的T点,位于第二图像的左上角第二行第二列,与S点相邻,属于S点的四邻域范围,因此,根据步骤S504的定义,将所述相同的局部图像特征的权值增加第三预设倍数,为与第一预设倍数2、第二预设倍数1.5对应,第三预设倍数可以为1.2。
本优选实施方式对于对应位置相同或者相近的局部图像特征的权值进行了相应的调整,可以使得相同或者相近位置的相似图像优先查找,从而更加有利于快速查找到相似度更高的图像。
作为本发明实施例更优选的实施方式,还可以包括对局部图像特征种类的筛选的步骤,所述筛选步骤在所述将所述第一图像的局部图像特征与图像库中的第二图像的局部图像特征比较,查找所述第一图像与所述第二图像中相同的局部图像特征步骤之前,如图7所示,筛选步骤具体包括:
在步骤S701中,获取第一图像的局部图像特征的种类以及所述局部图像特征的种类在第一图像中出现的次数;
在步骤S702中,根据所述第一图像中的局部图像特征的种类出现的次数对所述局部图像特征的种类进行排序,筛选得到次数较多的预定比例局部图像特征的种类。
其中,获取局部图像特征的种类的算法,可以包括如贝叶斯分类算法或者其它分类算法,得到局部图像特征的种类。并统计得到的特征种类出现的次数,比如对于第一图像,通过计算得到其包括的特征a、b、c、d、e、f、g、h、i、j十个种类的局部图像特征,并且记录每个图像特征种类出现的次数。
所述筛选得到次数较多的预定比例局部图像特征的种类,即对局部图像特征的种类进行筛选,得到预定比例的局部图像特征的种类的个数,如预定比例可以为40%,则筛选得到四个局部图像特征的种类。
本优选实施方式对图像的种类进行筛选,可以避免出现次数较少的噪声图像信息对主要图像信息的干扰,而且减少对比查找的计算量,优化计算速度。
作为又一优化的实施方式,本发明实施例还可以包括根据词频优化局部图像特征的权值的步骤,即在所述根据所修改的局部图像特征的权值计算得到第一图像与第二图像的相似分值步骤之前,所述方法还包括:
根据图像所在页面的关键词与局部图像特征种类的对应关系,以及所述关键词出现的次数,修改所述局部图像特征的权值。
即查找图像所在页面的关键词,根据关键词出现的次数,相应的修订与关键词对应的局部图像特征的权值。如对于页面信息中包括的关键词数量较多的“美女”,可以相应的查找与所述关键词对应的局部图像特征,可以包括眼睛、鼻子、耳朵、嘴唇、眉毛、头发等局部图像特征信息,并且根据出现的次数多少,定义对应的权值变化。关键词出现的次数越多,增加其对应的局部图像特征的权值。
本发明实施例从图像所处页面的角度出发,通过页面中的关键词调整搜索的主要表达内容,更进一步提高本发明实施例搜索图像主要信息的准确性。
本发明上述各优选的实施方式可以单独与图1所述的实施方式结合实施,也可以多个优选的实施方式相结合进行实施,从而取得相应的技术效果。
本发明所述方法实施方式对应,如图8所示,本发明还提供了一种图像检索装置,包括:
接收提取单元801,用于接收待检索的第一图像,提取所述第一图像的局部图像特征;
比较查找单元802,用于将所述第一图像的局部图像特征与图像库中的第二图像的局部图像特征比较,查找所述第一图像与所述第二图像中相同的局部图像特征;
第一权值修改单元803,用于根据所述相同的局部图像特征在图像中的位置信息,修改所述相同的局部图像特征的权值;
计算单元804,用于根据所修改的局部图像特征的权值计算得到第一图像与第二图像的相似分值,根据所述相似分值,得到图像库中图像与第一图像相似的图像列表。
优选的,所述修第一权值改单元803包括:
第一分割子单元,用于将所述第一图像、所述第二图像,分别均匀分割为M×N个格子,其中M为行方向格子的个数,N为列方向格式的个数,且M和N均大于等于3;
第一区域获取子单元,用于获取M/2-A<X<M/2+B,N/2-C<Y<n/2+D所在的区域为第一区域,其中A、B为小于M/2的正数,C、D为小于N/2的正数;
第一权值增加子单元,用于当所述第一图像的第一区域中的局部图像特征与所述第二图像的第一区域的局部图像特征相同,将所述相同的局部图像特征的权值增加第一预设倍数。
优选的所述修第一权值改单元803包括:
第二分割子单元,用于将所述第一图像、所述第二图像,分别均匀分割为M×N个格子,其中M为行方向格子的个数,N为列方向格式的个数,且M和N均大于等于3;
位置查找子单元,用于查找第一图像与第二图像中存在相同的局部图像特征的位置,判断所述相同的局部图像特征的位置在第一图像和第二图像中是否相同或者相邻;
第二权值增加子单元,用于如果所述相同的局部图像特征的位置在第一图像和第二图像中相同,则将所述相同的局部图像特征的权值增加第二预设倍数;
第三权值增加子单元,用于如果所述相同的局部图像特征的位置处于四邻域的位置,则将所述相同的局部图像特征的权值增加第三预设倍数。
更进一步的,所述装置还包括:
次数获取单元,用于获取第一图像的局部图像特征的种类以及所述局部图像特征的种类在第一图像中出现的次数;
排序筛选单元,用于根据所述第一图像中的局部图像特征的种类出现的次数对所述局部图像特征的种类进行排序,筛选得到次数较多的预定比例局部图像特征的种类。
更进一步的,所述装置还包括:
第二权值修改单元,用于根据图像所在页面的关键词与局部图像特征种类的对应关系,以及所述关键词出现的次数,修改所述局部图像特征的权值。
本发明实施例所述图像检索装置与上述的图像检索方法对应,在此不作重复赘述。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。