CN109308325A - 图像搜索方法及*** - Google Patents
图像搜索方法及*** Download PDFInfo
- Publication number
- CN109308325A CN109308325A CN201810951203.7A CN201810951203A CN109308325A CN 109308325 A CN109308325 A CN 109308325A CN 201810951203 A CN201810951203 A CN 201810951203A CN 109308325 A CN109308325 A CN 109308325A
- Authority
- CN
- China
- Prior art keywords
- image
- feature
- compact
- son
- image set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种图像搜索方法及***,包括以下步骤:S1将目标图像集和元图像分别进行曲线分割;S2将分割后的每个区域提取特征紧凑子;S3将图像集中图像信息进行存储;S4计算元图像中每个区域的特征紧凑子与目标图像集中每个区域的特征紧凑子之间的汉明距离;S5根据汉明距离搜索出结果图像集。本发明有益效果:针对不同特征类型的低比特、低复杂度、高准确率的特征编码技术,将单幅图像区域的特征描述子的数据量从几百K字节减低到几K字节,从而大大降低其存储成本以及提高搜索精度。
Description
技术领域
本发明涉及图像搜索领域,具体来说,涉及一种图像搜索方法及***。
背景技术
目前,在图像搜索领域中,首先,主要采用图像识别方法来提取搜索可利用的特征,然后与样本库进行一一比对,再输出相匹配的结果。
现有一些图像搜索算法,根据图像提取特征描述信息,然后通过相似度算法进行搜索,会引起以下弊端:图像的描述子信息比较大,搜索精度不够, 单个特征描述子信息占用内存比较大。
针对相关技术中的问题,目前尚未提出有效的解决方案。
发明内容
针对相关技术中的上述技术问题,本发明提出一种图像搜索方法及***,能够解决图像描述子特征精度以及单个描述子信息量大等问题。
为实现上述技术目的,本发明的技术方案是这样实现的:
一种图像搜索方法,包括以下步骤:
S1 将目标图像集和元图像分别进行曲线分割;
S2 将分割后的每个区域提取特征紧凑子;
S3 将图像集中图像信息进行存储;
S4 计算元图像中每个区域的特征紧凑子与目标图像集中每个区域的特征紧凑子之间的汉明距离;
S5 根据汉明距离搜索出结果图像集。
进一步地,步骤S1中将目标图像集和元图像分别进行曲线分割具体包括:
S11 分别获取目标图像集和元图像的维度信息,并计算目标图像集和元图像中心点的坐标;
S12 分别将目标图像集和元图像的宽度和高度进行计算,并计算椭圆的长半径和短半径;以中心点为原点,以长半径和短半径画椭圆;以中心点为原点,画X轴和Y轴;
S13分别对目标图像集和元图像以X轴、Y轴和椭圆曲线进行分割为5个区域。
进一步地,步骤S2中提取特征紧凑子具体包括:
S21构建GMM模型;
S22根据GMM模型,使用K-means算法训练码书;
S23通过fisher vector & VLAD方法获取特征紧凑子。
进一步地,在步骤S1之前需要采集目标图像集信息和搜索元图像信息处理,其中,所述采集目标图像集信息包括读取图像集中每张图片,所述搜索元图像信息处理包括读取元图像,分别将图像集和元图像转化为HSV颜色空间。
进一步地,所述步骤S3中图像信息包括但不限于图像ID、图像标签和每个区域的特征紧凑子。
本发明另一方面,提供一种图像搜索***,包括:
第一分割模块,用于将目标图像集和元图像分别进行曲线分割;
提取模块,用于将分割后的每个区域提取特征紧凑子;
存储模块,用于将图像集中图像信息进行存储;
第一计算模块,用于计算元图像中每个区域的特征紧凑子与目标图像集中每个区域的特征紧凑子之间的汉明距离;
搜索模块,用于根据汉明距离搜索出结果图像集。
进一步地,所述第一分割模块包括:
第一获取模块,用于分别获取目标图像集和元图像的维度信息,并计算目标图像集和元图像中心点的坐标;
第二计算模块,用于分别将目标图像集和元图像的宽度和高度进行计算,并计算椭圆的长半径和短半径;以中心点为原点,以长半径和短半径画椭圆;以中心点为原点,画X轴和Y轴;
第二分割模块,用于分别对目标图像集和元图像以X轴、Y轴和椭圆曲线进行分割为5个区域。
进一步地,提取模块中提取特征紧凑子具体包括:
构建模块,用于构建GMM模型;
训练模块,用于根据GMM模型,使用K-means算法训练码书;
第二获取模块,用于通过fisher vector & VLAD方法获取特征紧凑子。
进一步地,所述存储模块中图像信息包括但不限于图像ID、图像标签和每个区域的特征紧凑子。
本发明的有益效果:针对不同特征类型的低比特、低复杂度、高准确率的特征编码技术,将单幅图像区域的特征描述子的数据量从几百K字节减低到几K字节,从而大大降低其存储成本以及提高搜索精度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例所述的图像搜索方法的流程图;
图2是根据本发明实施例所述的提取特征紧凑子的流程图;
图3是根据本发明实施例所述的图像搜索***的示意图;
图4是根据本发明实施例所述的第一分割模块的示意图;
图5是根据本发明实施例所述的提取模块的示意图;
图6是根据本发明实施例所述的图像集的图片;
图7是根据本发明实施例所述的结果图像集的图片。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
如图1、图2、图6和图7所示,根据本发明实施例所述的图像搜索方法,包括以下步骤:
S1 将目标图像集和元图像分别进行曲线分割;
S2 将分割后的每个区域提取特征紧凑子,把特征紧凑子信息存放到列表中;
S3 将图像集中图像信息进行存储;
具体的,根据图像云服务接口申请唯一图像ID,设置图像标签以及每个区域特征紧凑子信息列表等信息;
打开Nosql或者数据库连接,保存图像有关信息以及关闭连接等;
S4 计算元图像中每个区域的特征紧凑子与目标图像集中每个区域的特征紧凑子之间的汉明距离;
S5 根据汉明距离搜索出具有相同特征或者场景的结果图像集。
具体的,按照汉明距离进行降序排列,搜索出满足要求的图像集合。
在本发明的一个具体实施例中,步骤S1中将目标图像集和元图像分别进行曲线分割具体包括:
S11 分别获取目标图像集和元图像的维度信息,并计算目标图像集和元图像中心点的坐标;
S12 分别将目标图像集和元图像的宽度W和高度H进行计算,并计算椭圆的长半径和短半径;以中心点为原点,以长半径和短半径画椭圆;以中心点为原点,画X轴和Y轴;
S13分别对目标图像集和元图像以X轴、Y轴和椭圆曲线进行分割为5个区域。
具体的,根据image实例读取图像的shape信息;读取shape信息数据的0和1两个位置的值为高度H和宽度W;根据高度H和宽度W计算图像中心点的坐标(X,Y),(cX,cY) = 【int(W * 0.5), int(H * 0.5)】;以中心点为原点,通过X轴和Y轴把区域划分为四个象限,其信息表示为:【(0, cX, 0, cY),(cX, W, 0, cY),(cX,W, cY, H),(0, cX, cY, H)】;计算实物所在区域矩形,然后计算椭圆半径计算比率,计算椭圆的长半径为W*椭圆半径比率、短半径为H*椭圆半径比率;以中心点为原点,以长半径以及短半径画椭圆;通过第一、二、三、四象限区域以及和椭圆曲线把图像分割为5个区域。
在本发明的一个具体实施例中,步骤S2中提取特征紧凑子具体包括:
S21构建GMM模型;
通过opencv中的gmm算法,针对每一幅图像的每一个像素,建立一个混合高斯模型,混合高斯模型中权重大的代表背景,权重小的代表前景;新来的像素如果能匹配上背景对应的混合高斯模型,那么新来的像素就被当成背景;如果匹配的是权重较小的混合高斯模型或者没有匹配的混合高斯模型,那么这个像素被当成前景;
S22根据GMM模型,使用K-means算法训练码书;
A、适当选择C个类的初始中心;
B、在第K次迭代中,对任意一个样本,求其到C各中心的距离,将该样本归到距离最短的中心所在的类;
C、利用均值等方法更新该类的中心值;
D、对于所有的C个聚类中心,如果利用(B)(C)的迭代算法更新之后,值保持不变,或者达到一定的迭代次数,或者分类的变化小于一个阈值,则迭代结束,否则继续迭代;
S23通过调用opencv中的fisher vector & VLAD方法获取特征紧凑子。
在本发明的一个具体实施例中,在步骤S1之前需要采集目标图像集信息和搜索元图像信息处理,其中,所述采集目标图像集信息包括读取图像集中每张图片,所述搜索元图像信息处理包括读取元图像,分别将图像集和元图像转化为HSV颜色空间。
采集目标图像集信息包括读取图像集中每张图片,具体的,根据os.path.isdir判断是否为文件夹,如果不是,就通过imread进行读取图片文件,就执行曲线分割;如果是文件夹,则继续执行读取文件夹中的图像集;
所述搜索元图像信息处理包括读取元图像,具体的,根据元图像路径,通过imread读取元图像信息;
分别将图像集和元图像转化为HSV颜色空间:
A、色调H使用角度度量,取值范围为0°~360°,从红色开始按逆时针方向计算,红色为0°,绿色为120°,蓝色为240°,它们的补色是:黄色为60°,青色为180°,品红为300°;
B、饱和度S表示颜色接近光谱色的程度;一种颜色,可以看成是某种光谱色与白色混合的结果;其中,光谱色所占的比例愈大,颜色接近光谱色的程度就愈高,颜色的饱和度也就愈高;饱和度高,颜色则深而艳;光谱色的白光成分为0,饱和度达到最高;通常取值范围为0%~100%,值越大,颜色越饱和;
C、明度表示颜色明亮的程度,对于光源色、明度值与发光体的光亮度有关;对于物体色,此值和物体的透射比或反射比有关,通常取值范围为0%(黑)到100%(白);
D、3D颜色直方图,8个bin用于色相通道、12个bin用于饱和度通道、3个bin用于明度通道,总共的特征向量有8×12×3=288。
在本发明的一个具体实施例中,所述步骤S3中图像信息包括但不限于图像ID、图像标签和每个区域的特征紧凑子。
如图3-7所示,本发明另一方面,提供一种图像搜索***,包括:
第一分割模块,用于将目标图像集和元图像分别进行曲线分割;
提取模块,用于将分割后的每个区域提取特征紧凑子;
存储模块,用于将图像集中图像信息进行存储;
第一计算模块,用于计算元图像中每个区域的特征紧凑子与目标图像集中每个区域的特征紧凑子之间的汉明距离;
搜索模块,用于根据汉明距离搜索出结果图像集。
在本发明的一个具体实施例中,所述第一分割模块包括:
第一获取模块,用于分别获取目标图像集和元图像的维度信息,并计算目标图像集和元图像中心点的坐标;
第二计算模块,用于分别将目标图像集和元图像的宽度和高度进行计算,并计算椭圆的长半径和短半径;以中心点为原点,以长半径和短半径画椭圆;以中心点为原点,画X轴和Y轴;
第二分割模块,用于分别对目标图像集和元图像以X轴、Y轴和椭圆曲线进行分割为5个区域。
在本发明的一个具体实施例中,提取模块中提取特征紧凑子具体包括:
构建模块,用于构建GMM模型;
训练模块,用于根据GMM模型,使用K-means算法训练码书;
第二获取模块,用于通过fisher vector & VLAD方法获取特征紧凑子。
在本发明的一个具体实施例中,所述存储模块中图像信息包括但不限于图像ID、图像标签和每个区域的特征紧凑子。
综上所述,借助于本发明的上述技术方案,针对不同特征类型的低比特、低复杂度、高准确率的特征编码技术,将单幅图像区域的特征描述子的数据量从几百K字节减低到几K字节,从而大大降低其存储成本以及提高搜索精度。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种图像搜索方法,其特征在于,包括以下步骤:
S1 将目标图像集和元图像分别进行曲线分割;
S2 将分割后的每个区域提取特征紧凑子;
S3 将图像集中图像信息进行存储;
S4 计算元图像中每个区域的特征紧凑子与目标图像集中每个区域的特征紧凑子之间的汉明距离;
S5 根据汉明距离搜索出结果图像集。
2.根据权利要求1所述的图像搜索方法,其特征在于,步骤S1中将目标图像集和元图像分别进行曲线分割具体包括:
S11 分别获取目标图像集和元图像的维度信息,并计算目标图像集和元图像中心点的坐标;
S12 分别将目标图像集和元图像的宽度和高度进行计算,并计算椭圆的长半径和短半径;以中心点为原点,以长半径和短半径画椭圆;以中心点为原点,画X轴和Y轴;
S13分别对目标图像集和元图像以X轴、Y轴和椭圆曲线进行分割为5个区域。
3.根据权利要求1所述的图像搜索方法,其特征在于,步骤S2中提取特征紧凑子具体包括:
S21构建GMM模型;
S22根据GMM模型,使用K-means算法训练码书;
S23通过fisher vector & VLAD方法获取特征紧凑子。
4.根据权利要求1所述的图像搜索方法,其特征在于,在步骤S1之前需要采集目标图像集信息和搜索元图像信息处理,其中,所述采集目标图像集信息包括读取图像集中每张图片,所述搜索元图像信息处理包括读取元图像,分别将图像集和元图像转化为HSV颜色空间。
5.根据权利要求1-4任一项所述的图像搜索方法,其特征在于,所述步骤S3中图像信息包括但不限于图像ID、图像标签和每个区域的特征紧凑子。
6.一种图像搜索***,其特征在于,包括:
第一分割模块,用于将目标图像集和元图像分别进行曲线分割;
提取模块,用于将分割后的每个区域提取特征紧凑子;
存储模块,用于将图像集中图像信息进行存储;
第一计算模块,用于计算元图像中每个区域的特征紧凑子与目标图像集中每个区域的特征紧凑子之间的汉明距离;
搜索模块,用于根据汉明距离搜索出结果图像集。
7.根据权利要求6所述的图像搜索***,其特征在于,所述第一分割模块包括:
第一获取模块,用于分别获取目标图像集和元图像的维度信息,并计算目标图像集和元图像中心点的坐标;
第二计算模块,用于分别将目标图像集和元图像的宽度和高度进行计算,并计算椭圆的长半径和短半径;以中心点为原点,以长半径和短半径画椭圆;以中心点为原点,画X轴和Y轴;
第二分割模块,用于分别对目标图像集和元图像以X轴、Y轴和椭圆曲线进行分割为5个区域。
8.根据权利要求6所述的图像搜索***,其特征在于,所述提取模块中提取特征紧凑子具体包括:
构建模块,用于构建GMM模型;
训练模块,用于根据GMM模型,使用K-means算法训练码书;
第二获取模块,用于通过fisher vector & VLAD方法获取特征紧凑子。
9.根据权利要求6-8任一项所述的图像搜索***,其特征在于,所述存储模块中图像信息包括但不限于图像ID、图像标签和每个区域的特征紧凑子。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810951203.7A CN109308325B (zh) | 2018-08-21 | 2018-08-21 | 图像搜索方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810951203.7A CN109308325B (zh) | 2018-08-21 | 2018-08-21 | 图像搜索方法及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109308325A true CN109308325A (zh) | 2019-02-05 |
CN109308325B CN109308325B (zh) | 2022-07-01 |
Family
ID=65224003
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810951203.7A Active CN109308325B (zh) | 2018-08-21 | 2018-08-21 | 图像搜索方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109308325B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120155752A1 (en) * | 2010-12-16 | 2012-06-21 | Sony Corporation | Geometric feature based image description and fast image retrieval |
CN103207879A (zh) * | 2012-01-17 | 2013-07-17 | 阿里巴巴集团控股有限公司 | 图像索引的生成方法及设备 |
CN105022752A (zh) * | 2014-04-29 | 2015-11-04 | 中国电信股份有限公司 | 图像检索方法与装置 |
US20180032837A1 (en) * | 2015-04-20 | 2018-02-01 | Hitachi Ltd. | Object Detection Method and Image Search System |
CN108364006A (zh) * | 2018-01-17 | 2018-08-03 | 超凡影像科技股份有限公司 | 基于多模式深度学习的医学图像分类装置及其构建方法 |
-
2018
- 2018-08-21 CN CN201810951203.7A patent/CN109308325B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120155752A1 (en) * | 2010-12-16 | 2012-06-21 | Sony Corporation | Geometric feature based image description and fast image retrieval |
CN103207879A (zh) * | 2012-01-17 | 2013-07-17 | 阿里巴巴集团控股有限公司 | 图像索引的生成方法及设备 |
CN105022752A (zh) * | 2014-04-29 | 2015-11-04 | 中国电信股份有限公司 | 图像检索方法与装置 |
US20180032837A1 (en) * | 2015-04-20 | 2018-02-01 | Hitachi Ltd. | Object Detection Method and Image Search System |
CN108364006A (zh) * | 2018-01-17 | 2018-08-03 | 超凡影像科技股份有限公司 | 基于多模式深度学习的医学图像分类装置及其构建方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109308325B (zh) | 2022-07-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109344701A (zh) | 一种基于Kinect的动态手势识别方法 | |
Wang et al. | Fuzzy-based algorithm for color recognition of license plates | |
CN101662581B (zh) | 多功能证件信息采集*** | |
CN105184238A (zh) | 一种人脸识别方法及*** | |
CN103020992B (zh) | 一种基于运动颜色关联的视频图像显著性检测方法 | |
CN103996046B (zh) | 基于多视觉特征融合的人员识别方法 | |
CN108629783A (zh) | 基于图像特征密度峰值搜索的图像分割方法、***及介质 | |
CN106294705A (zh) | 一种批量遥感影像预处理方法 | |
CN105260428A (zh) | 图片处理方法和装置 | |
CN109977882B (zh) | 一种半耦合字典对学习的行人重识别方法及*** | |
CN104636754A (zh) | 基于舌体分区颜色特征的智能图像分类方法 | |
CN108664951A (zh) | 基于颜色名特征的行人重识别方法 | |
CN105426816A (zh) | 一种处理人脸图像的方法及装置 | |
CN104361348A (zh) | 一种智能终端上的花卉识别方法 | |
CN109034154A (zh) | ***专用章税号的提取和识别方法 | |
CN109284759A (zh) | 一种基于支持向量机(svm)的魔方颜色识别方法 | |
Jiang et al. | A multi-scale approach to detecting standing dead trees in UAV RGB images based on improved faster R-CNN | |
Ciobanu et al. | Image categorization based on computationally economic LAB colour features | |
Youlian et al. | Face detection method using template feature and skin color feature in rgb color space | |
CN111738039B (zh) | 一种行人重识别方法、终端及存储介质 | |
Jiang et al. | Object recognition and tracking for indoor robots using an RGB-D sensor | |
CN109308325A (zh) | 图像搜索方法及*** | |
Treible et al. | Wildcat: In-the-wild color-and-thermal patch comparison with deep residual pseudo-Siamese networks | |
CN106548180B (zh) | 一种获取模糊不变图像的特征描述子的方法 | |
CN104050455A (zh) | 一种肤色检测方法及*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |