CN103714122A - 一种基于局部分块二进制编码特征的图像检索方法 - Google Patents
一种基于局部分块二进制编码特征的图像检索方法 Download PDFInfo
- Publication number
- CN103714122A CN103714122A CN201310651718.2A CN201310651718A CN103714122A CN 103714122 A CN103714122 A CN 103714122A CN 201310651718 A CN201310651718 A CN 201310651718A CN 103714122 A CN103714122 A CN 103714122A
- Authority
- CN
- China
- Prior art keywords
- image
- feature
- region
- local
- coding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 25
- 238000010606 normalization Methods 0.000 claims abstract description 11
- 230000008859 change Effects 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 5
- 238000001514 detection method Methods 0.000 abstract description 8
- 230000000007 visual effect Effects 0.000 abstract 3
- 238000010586 diagram Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5838—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
Landscapes
- Engineering & Computer Science (AREA)
- Library & Information Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Processing Or Creating Images (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及图像检索的领域,尤其是一种基于局部分块二进制编码特征的图像检索方法,a.输入一幅图像作为查询图像;b.进行格式归一化;c.进行尺度归一化;d.特征提取;e.计算出所有的局部特征值;f.获得全局特征,对局部特征直方图进行离散化以及归一化,获得共有N bins的特征直方图H;g.对特征直方图H进行编码;i.通过比对每一幅图像与查询图像之间的特征编码之间的海明距离,通过自设的阈值即可获得视觉近似图像。本发明的一种基于局部分块二进制编码特征的图像检索方法,此图像检索方法结合了全局特征和局部特征的视觉近似图像检测,通过此检索方法,结果相似的即为视觉近似图像,准确率高,检索方便快捷。
Description
技术领域
本发明涉及图像检索的领域,尤其是一种基于局部分块二进制编码特征的图像检索方法。
背景技术
目前现有两种图像检索方法,其中一种方法为基于颜色直方图的检测方法(全局特征):(1)将一幅图像分离为B、G、R三通道图像,统计各通道颜色直方图H1(共256bins),离散化后为N bins直方图H2;(2)对H2进行归一化处理(目的为使其尽量不受像素总数的影响)得到直方图H3;(3)对H3进行编码,比对结果。上述检测方法,其优点是原理简单,检测速度快,其缺点是对图像的只有颜色有明显改变的情况无法检测到,仅对图像方向或尺寸有变化的情况效果较好;第二种方法为基于纹理的检测方法(局部特征):这是一种基于图像结构安排的底层纹理信息检测,统计的是微观特性(如边缘、线等局部特征),其优点是技术成熟,其缺点是计算过于复杂,程序实现较为庞大,不利于理解,且只对几乎相同的图像或者只发生偏移效果的图像效果较好,对图像局部特征有很大改变的的情况检测效果较差。
上述第一种方法如图1所示,对于图1中a和b这种尺寸和颜色发生轻微改变的的情况检测较好,但像b中这种颜色改变明显的情况无法检测到(虽然在视觉上图片内容近似);第二种方法对于上述三种情况都可以有很好的检测,但对于图像局部内用发生改变的情况无法检测,如图2所示,两幅图视觉上近似,但人的手部动作已经改变。
发明内容
本发明要解决的技术问题是:为了克服上述中存在的问题,提供一种基于局部分块二进制编码特征的图像检索方法,其能够实现准确检索图像的目的。
本发明解决其技术问题所采用的技术方案是:一种基于局部分块二进制编码特征的图像检索方法,具体方法如下:
a.输入一幅图像作为查询图像;
b.进行格式归一化:把图像转换为RGB颜色空间并分离出R通道、G通道、B通道的三个通道图像;
c.进行尺度归一化:将图像的宽度改为固定尺度,图像的高度由图像的宽高比不变的原则确定;
d.特征提取:特征定义在3x3的区域上,将其区域标注从A到I共9个区域,位于中心的区域为E,每个区域的大小相同,
假定宽度和高度分别为WB、HB,计算得到9个区域内的像素亮度和,并将B、D、F、H、A、C、G、I区域的像素亮度和分别与E区域的像素亮度和比较,如果B、D、F、H、A、C、G、I区域的像素亮度和≥E区域的像素亮度和,则对应二进制位为1,否则为0,将8位二进制数作为最终的图像编码特征;
假定得到的矩形区域亮度和,则特征编码分别为0(1025<1500)1(2301>1500)1(1672>1500)0(990<1500)0(956<1500)0(845<1500)1(1865>1500)0(875<1500),即01100010,对应的十进制数为98,即局部特征值;
e.以固定水平与垂直步长移动矩形块,直至计算出所有的局部特征值;
f.***部特征直方图,即获得全局特征,对局部特征直方图进行离散化以及归一化,获得共有N bins的特征直方图H;
g.对特征直方图H进行编码:
对n=1,2,...N-1,假定对第n个bin的直方图值H(n),则如果H(n-1)<H(n),则最终特征的第N-1-n位为1,否则为0;则每一通道图像有N位编码特征,所以一幅图像共三通道共有3*N位特征值;
h.对图片库中的每一幅图像都执行上述a~g步,即可获得每一幅图像的3*N位特征编码;
i.通过比对每一幅图像与查询图像之间的特征编码之间的海明距离,通过自设的阈值即可获得视觉近似图像
本发明的有益效果是,本发明的一种基于局部分块二进制编码特征的图像检索方法,此图像检索方法结合了全局特征和局部特征的视觉近似图像检测,根据查询图像获得的N维特征向量和图片库中的每一张图片的用相同方法获得的N维特征向量进行比较,通过此检索方法,结果相似的即为视觉近似图像,准确率高,检索方便快捷。
附图说明
下面结合附图和实施例对本发明进一步说明。
图1是本发明的背景技术中基于颜色直方图的检测方法中使用的示意图;
图2是本发明的背景技术中基于纹理的检测方法中使用的示意图;
图3是本发明的一种基于局部分块二进制编码特征的图像检索方法的特征提取中特征定义在3x3的区域的示意图;
图4是本发明的一种基于局部分块二进制编码特征的图像检索方法的特征提取中矩形区域亮度和的示意图;
图5是本发明的一种基于局部分块二进制编码特征的图像检索方法的局部特征值的示意图;
图6是本发明的一种基于局部分块二进制编码特征的图像检索方法的流程图。
具体实施方式
现在结合附图对本发明作进一步详细的说明。这些附图均为简化的示意图,仅以示意方式说明本发明的基本结构,因此其仅显示与本发明有关的构成。
如图6所示的一种基于局部分块二进制编码特征的图像检索方法,具体方法如下:
a.输入一幅图像作为查询图像;
b.进行格式归一化:把图像转换为RGB颜色空间并分离出R通道、G通道、B通道的三个通道图像;
c.进行尺度归一化:将图像的宽度改为固定尺度,图像的高度由图像的宽高比不变的原则确定;
d.特征提取:特征定义在3x3的区域上,如图3所示,将其区域标注从A到I共9个区域,位于中心的区域为E,每个区域的大小相同,
假定宽度和高度分别为WB、HB,计算得到9个区域内的像素亮度和,并将B、D、F、H、A、C、G、I区域的像素亮度和分别与E区域的像素亮度和比较,如果B、D、F、H、A、C、G、I区域的像素亮度和≥E区域的像素亮度和,则对应二进制位为1,否则为0,将8位二进制数作为最终的图像编码特征;
假定得到的矩形区域亮度和,如图4所示,则特征编码分别为0(1025<1500)1(2301>1500)1(1672>1500)0(990<1500)0(956<1500)0(845<1500)1(1865>1500)0(875<1500),即01100010,对应的十进制数为98,即局部特征值;
e.以固定水平与垂直步长移动矩形块,直至计算出所有的局部特征值,如图5所示,从左上角一直计算到右下角;
f.***部特征直方图,即获得全局特征,对局部特征直方图进行离散化以及归一化,获得共有N bins的特征直方图H;
g.对特征直方图H进行编码:
对n=1,2,...N-1,假定对第n个bin的直方图值H(n),则如果H(n-1)<H(n),则最终特征的第N-1-n位为1,否则为0;则每一通道图像有N位编码特征,所以一幅图像共三通道共有3*N位特征值;
h.对图片库中的每一幅图像都执行上述a~g步,即可获得每一幅图像的3*N位特征编码;
i.通过比对每一幅图像与查询图像之间的特征编码之间的海明距离,通过自设的阈值即可获得视觉近似图像。
本发明的一种基于局部分块二进制编码特征的图像检索方法,在测试图库中共有20组图像,每组4幅图像都为视觉近似图像,给定查询图像后,有18组都可准确检测出相似图像,另外两组存在漏检,准确率高于90%。
以上述依据本发明的理想实施例为启示,通过上述的说明内容,相关工作人员完全可以在不偏离本项发明技术思想的范围内,进行多样的变更以及修改。本项发明的技术性范围并不局限于说明书上的内容,必须要根据权利要求范围来确定其技术性范围。
Claims (1)
1.一种基于局部分块二进制编码特征的图像检索方法,其特征是具体方法如下:
a.输入一幅图像作为查询图像;
b.进行格式归一化:把图像转换为RGB颜色空间并分离出R通道、G通道、B通道的三个通道图像;
c.进行尺度归一化:将图像的宽度改为固定尺度,图像的高度由图像的宽高比不变的原则确定;
d.特征提取:特征定义在3x3的区域上,将其区域标注从A到I共9个区域,位于中心的区域为E,每个区域的大小相同,
假定宽度和高度分别为WB、HB,计算得到9个区域内的像素亮度和,并将B、D、F、H、A、C、G、I区域的像素亮度和分别与E区域的像素亮度和比较,如果B、D、F、H、A、C、G、I区域的像素亮度和≥E区域的像素亮度和,则对应二进制位为1,否则为0,将8位二进制数作为最终的图像编码特征;
假定得到的矩形区域亮度和,则特征编码分别为0(1025<1500)1(2301>1500)1(1672>1500)0(990<1500)0(956<1500)0(845<1500)1(1865>1500)0(875<1500),即01100010,对应的十进制数为98,即局部特征值;
e.以固定水平与垂直步长移动矩形块,直至计算出所有的局部特征值;
f.***部特征直方图,即获得全局特征,对局部特征直方图进行离散化以及归一化,获得共有N bins的特征直方图H;
g.对特征直方图H进行编码:
对n=1,2,...N-1,假定对第n个bin的直方图值H(n),则如果H(n-1)<H(n),则最终特征的第N-1-n位为1,否则为0;则每一通道图像有N位编码特征,所以一幅图像共三通道共有3*N位特征值;
h.对图片库中的每一幅图像都执行上述a~g步,即可获得每一幅图像的3*N位特征编码;
i.通过比对每一幅图像与查询图像之间的特征编码之间的海明距离,通过自设的阈值即可获得视觉近似图像。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310651718.2A CN103714122A (zh) | 2013-12-06 | 2013-12-06 | 一种基于局部分块二进制编码特征的图像检索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310651718.2A CN103714122A (zh) | 2013-12-06 | 2013-12-06 | 一种基于局部分块二进制编码特征的图像检索方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103714122A true CN103714122A (zh) | 2014-04-09 |
Family
ID=50407097
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310651718.2A Pending CN103714122A (zh) | 2013-12-06 | 2013-12-06 | 一种基于局部分块二进制编码特征的图像检索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103714122A (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104615612A (zh) * | 2014-04-30 | 2015-05-13 | 北京大学 | 获取紧凑全局特征描述子的码流的方法 |
CN106354735A (zh) * | 2015-07-22 | 2017-01-25 | 杭州海康威视数字技术股份有限公司 | 一种图像中目标的检索方法和装置 |
CN106815589A (zh) * | 2015-12-01 | 2017-06-09 | 财团法人工业技术研究院 | 特征描述方法及应用其的特征描述器 |
CN108763265A (zh) * | 2018-04-03 | 2018-11-06 | 南昌奇眸科技有限公司 | 一种基于分块检索的图像识别方法 |
CN110251076A (zh) * | 2019-06-21 | 2019-09-20 | 安徽大学 | 融合视觉注意力基于对比度的显著性检测方法及装置 |
CN111522986A (zh) * | 2020-04-23 | 2020-08-11 | 北京百度网讯科技有限公司 | 图像检索方法、装置、设备和介质 |
CN111986089A (zh) * | 2020-08-28 | 2020-11-24 | 计易数据科技(上海)有限公司 | 特征值整数化的图像存储与比对方法、装置、设备和介质 |
CN112182262A (zh) * | 2020-11-30 | 2021-01-05 | 江西师范大学 | 一种基于特征分类的图像查询方法 |
US11132392B2 (en) * | 2019-04-17 | 2021-09-28 | Boe Technology Group Co., Ltd. | Image retrieval method, image retrieval apparatus, image retrieval device and medium |
-
2013
- 2013-12-06 CN CN201310651718.2A patent/CN103714122A/zh active Pending
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104615612A (zh) * | 2014-04-30 | 2015-05-13 | 北京大学 | 获取紧凑全局特征描述子的码流的方法 |
CN104615612B (zh) * | 2014-04-30 | 2018-04-27 | 北京大学 | 获取紧凑全局特征描述子的码流的方法 |
CN106354735A (zh) * | 2015-07-22 | 2017-01-25 | 杭州海康威视数字技术股份有限公司 | 一种图像中目标的检索方法和装置 |
WO2017012277A1 (zh) * | 2015-07-22 | 2017-01-26 | 杭州海康威视数字技术股份有限公司 | 一种图像中目标的检索方法和装置 |
US10678847B2 (en) | 2015-07-22 | 2020-06-09 | Hangzhou Hikvision Digital Technology Co., Ltd. | Method and device for searching a target in an image |
CN106815589A (zh) * | 2015-12-01 | 2017-06-09 | 财团法人工业技术研究院 | 特征描述方法及应用其的特征描述器 |
CN108763265A (zh) * | 2018-04-03 | 2018-11-06 | 南昌奇眸科技有限公司 | 一种基于分块检索的图像识别方法 |
CN108763265B (zh) * | 2018-04-03 | 2022-02-08 | 南昌奇眸科技有限公司 | 一种基于分块检索的图像识别方法 |
US11132392B2 (en) * | 2019-04-17 | 2021-09-28 | Boe Technology Group Co., Ltd. | Image retrieval method, image retrieval apparatus, image retrieval device and medium |
CN110251076B (zh) * | 2019-06-21 | 2021-10-22 | 安徽大学 | 融合视觉注意力基于对比度的显著性检测方法及装置 |
CN110251076A (zh) * | 2019-06-21 | 2019-09-20 | 安徽大学 | 融合视觉注意力基于对比度的显著性检测方法及装置 |
CN111522986A (zh) * | 2020-04-23 | 2020-08-11 | 北京百度网讯科技有限公司 | 图像检索方法、装置、设备和介质 |
CN111522986B (zh) * | 2020-04-23 | 2023-10-10 | 北京百度网讯科技有限公司 | 图像检索方法、装置、设备和介质 |
CN111986089A (zh) * | 2020-08-28 | 2020-11-24 | 计易数据科技(上海)有限公司 | 特征值整数化的图像存储与比对方法、装置、设备和介质 |
CN112182262A (zh) * | 2020-11-30 | 2021-01-05 | 江西师范大学 | 一种基于特征分类的图像查询方法 |
CN112182262B (zh) * | 2020-11-30 | 2021-03-19 | 江西师范大学 | 一种基于特征分类的图像查询方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103714122A (zh) | 一种基于局部分块二进制编码特征的图像检索方法 | |
Luvizon et al. | A video-based system for vehicle speed measurement in urban roadways | |
CN107392141B (zh) | 一种基于显著性检测和lsd直线检测的机场提取方法 | |
CN107103320B (zh) | 嵌入式医疗数据图像识别及集成方法 | |
CN101833664A (zh) | 基于稀疏表达的视频图像文字检测方法 | |
CN102799867A (zh) | 基于图像处理的仪表指针转角识别方法 | |
CN107066972B (zh) | 基于多通道极值区域的自然场景文本检测方法 | |
CN105957107A (zh) | 行人检测与跟踪方法及装置 | |
CN101976114A (zh) | 一种基于摄像头的计算机与纸笔信息交互***及方法 | |
CN103632153A (zh) | 一种基于区域的图像显著图提取方法 | |
CN104598907A (zh) | 一种基于笔画宽度图的图像中文字数据提取方法 | |
CN104851089A (zh) | 一种基于三维光场的静态场景前景分割方法和装置 | |
CN104463134A (zh) | 一种车牌检测方法和*** | |
CN105426816A (zh) | 一种处理人脸图像的方法及装置 | |
Liang et al. | A new wavelet-Laplacian method for arbitrarily-oriented character segmentation in video text lines | |
CN103337073B (zh) | 一种基于三维熵的二维图像阈值分割方法 | |
CN110516527B (zh) | 一种基于实例分割的视觉slam回环检测改进方法 | |
Bulugu | Algorithm for license plate localization and recognition for tanzania car plate numbers | |
Recky et al. | Window detection in complex facades | |
CN102136060A (zh) | 一种群体密度检测方法 | |
JP5027201B2 (ja) | テロップ文字領域検出方法,テロップ文字領域検出装置およびテロップ文字領域検出プログラム | |
CN103136536A (zh) | 对象检测***和方法、图像的特征提取方法 | |
Yan | Method of license plate location based on license plate texture and HSV color space | |
CN106951831A (zh) | 一种基于深度摄像机的行人检测跟踪方法 | |
CN104572680A (zh) | 基于颜色矩的衣服检索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20140409 |
|
RJ01 | Rejection of invention patent application after publication |