CN106354850A - 一种基于k‑近邻分类的图像识别方法 - Google Patents
一种基于k‑近邻分类的图像识别方法 Download PDFInfo
- Publication number
- CN106354850A CN106354850A CN201610797801.4A CN201610797801A CN106354850A CN 106354850 A CN106354850 A CN 106354850A CN 201610797801 A CN201610797801 A CN 201610797801A CN 106354850 A CN106354850 A CN 106354850A
- Authority
- CN
- China
- Prior art keywords
- image
- classification
- checked
- similarity
- altimetric
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5862—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using texture
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5838—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Library & Information Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明一种基于K‑近邻分类的图像识别方法,该方法包括步骤S1:建立图像数据库;步骤S2:选择一副图像作为待检测图像,在所述图像数据库中利用K‑近邻分类算法对图像进行分类,形成K个类别的图像集合;步骤S3:对所述K个类别图像集合分别赋予相应的权值;步骤S4:获取待检测图像和K个类别图像集合的纹理特征向量,以及光谱特征向量;步骤S5:基于特征向量,计算待检测图像与K个类别图像集合中每一幅图像的距离,并按照距离大小对图像进行排序;步骤S6:根据图像的最终的相似性大小,输出固定数目的识别图像。本发明将K‑近邻分类算法应用到图像检索中,提高了图像检索技术的效率,解决了图像检索技术计算量大的问题。
Description
技术领域
本发明涉及图像识别技术领域,具体涉及一种基于K-近邻分类的图像识别方法。
背景技术
基于内容的图像检索技术是上世纪发展起来的一种新的图像检索技术,取代了传统的基于文本的图像检索技术。基于内容的图像检索技术通过计算机自动提取图像的底层视觉特征,进而完成特征的匹配以及图像的检索,较于文本检索,因为不需要人工处理,所以大大提高了检索效率。但是面对大数据的今天,海量图像数据的存在造成了图像检索技术效率不高的问题。
鉴于上述缺陷,本发明创作者经过长时间的研究和实践终于获得了本发明。
发明内容
为解决上述技术缺陷,本发明采用的技术方案在于,提供一种基于K-近邻分类的图像识别方法,该方法包括以下步骤:
步骤S1:建立图像数据库;
步骤S2:选择一副图像作为待检测图像,在所述图像数据库中利用K-近邻分类算法对图像进行分类,形成K个类别的图像集合;
步骤S3:对所述K个类别图像集合分别赋予相应的权值;
步骤S4:获取待检测图像和K个类别图像集合的纹理特征向量,以及光谱特征向量;
步骤S5:基于特征向量,计算待检测图像与K个类别图像集合中每一幅图像的距离,并按照距离大小对图像进行排序;
步骤S6:根据图像的最终的相似性大小,输出固定数目的识别图像。
较佳的,所述步骤S1具体包括:
步骤S11:获取图像;
步骤S12:对获取的图像进行尺寸大小归一化;
步骤S13:选择图像质量较高的图像作为图像数据库。
较佳的,所述步骤S2具体包括:
步骤S21:选择一副图像作为待检测图像;
步骤S22:提取待检测图像的颜色直方图信息,得到颜色特征向量;
步骤S23:分别计算待检测图像与图像数据库中每一幅图像的相似性;相似性公式为:
其中X=(x1,x2,…xn)表示待检测图像的颜色特征向量,Yi=(yi1,yi2,…yin)表示图像数据库中第i幅图像的颜色特征向量,i表示图像数据库中图像的数量。
步骤S24:将相似性按数值按大小进行排序;
步骤S25:将图像按照相似性大小分为K个类别,如果有重复的类别则依次往后进行下去,最后得到K个类别图像集合。
较佳的,所述步骤S3具体包括:
步骤S31:计算每一类别图像集合中图像的相似性大小的均值;
步骤S32:将此均值作为每一类别图像集合的权值。
较佳的,所述步骤S4具体包括:
步骤S41:分别计算待检测图像和K个类别图像集合在图像坐标多个方向上、多个空间频率的Gabor滤波能量值的均值和方差,构成Gabor纹理特征向量;
步骤S42:对待检测图像和K个类别图像集合进行多级小波分解,舍弃低频信息的子图像,对剩余的子图像计算其熵值和能量值,构成小波纹理特征向量;
步骤S43:分别计算所有图像的光谱指数,构成图像的光谱特征向量。
较佳的,所述步骤S5具体包括:
步骤S51:分别计算待检测图像和K个类别图像集合中每一幅图像的相似性,相似性公式为:
Dk=(Σ|X-Y|2)1/2
其中X,Y分别表示待检测图像和K个类别图像集合中的图像,Dk(k=1,2,3)分别表示Gabor纹理距离,小波纹理距离和光谱纹理距离;
步骤S52:计算最终的相似性:S=sim·D,并按照此相似性对得出的结果对图像进行从大到小排序。
较佳的,所述步骤S6之后还包括:
步骤S7:如果对输出结果不满意则返回步骤S2,调节参数,直到输出满意的结果为止。
与现有技术相比,本发明的有益效果在于:本发明提供的一种基于K-近邻分类的图像识别方法有如下好处:
(1)本发明将K-近邻分类算法应用到图像检索中,提高了图像检索技术的效率,解决了图像检索技术计算量大的问题。
(2)采用了多种特征来实现图像识别,将多种不同的特征进行融合,提高了图像识别的精度。
附图说明
为了更清楚地说明本发明各实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。
图1为本发明的一种基于K-近邻分类的图像识别方法的流程图;
图2为步骤S1的流程图;
图3为步骤S2的流程图;
图4为步骤S3的流程图;
图5为步骤S4的流程图;
图6为步骤S5的流程图。
具体实施方式
以下结合附图,对本发明上述的和另外的技术特征和优点作更详细的说明。
如图1所示,为本发明的一种基于K-近邻分类的图像识别方法的流程图,该方法包括以下步骤:
步骤S1:建立图像数据库。
如图2所示,为步骤S1的流程图,该步骤S1具体包括:
步骤S11:获取图像。
步骤S12:对获取的图像进行尺寸大小归一化。
步骤S13:选择图像质量较高的图像作为图像数据库。
步骤S2:选择一副图像作为待检测图像,在图像数据库中利用K-近邻分类算法对图像进行分类,形成K个类别的图像集合。
如图3所示,为步骤S2的流程图,该步骤S2具体包括:
步骤S21:选择一副图像作为待检测图像。
步骤S22:提取待检测图像的颜色直方图信息,得到颜色特征向量。
步骤S23:分别计算待检测图像与图像数据库中每一幅图像的相似性。相似性公式为:
其中X=(x1,x2,…xn)表示待检测图像的颜色特征向量,Yi=(yi1,yi2,…yin)表示图像数据库中第i幅图像的颜色特征向量,i表示图像数据库中图像的数量。
步骤S24:将相似性按数值按大小进行排序。
步骤S25:将图像按照相似性大小分为K个类别,如果有重复的类别则依次往后进行下去,最后得到K个类别图像集合。
步骤S3:对这K个类别图像集合分别赋予相应的权值。
如图4所示,为步骤S3的流程图,该步骤S3具体包括:
步骤S31:计算每一类别图像集合中图像的相似性大小的均值。
步骤S32:将此均值作为每一类别图像集合的权值。
步骤S4:获取待检测图像和K个类别图像集合的纹理特征向量,以及光谱特征向量。
如图5所示,为步骤S4的流程图,该步骤S4具体包括:
步骤S41:分别计算待检测图像和K个类别图像集合在图像坐标多个方向上、多个空间频率的Gabor滤波能量值的均值和方差,构成Gabor纹理特征向量。
步骤S42:对待检测图像和K个类别图像集合进行多级小波分解,舍弃低频信息的子图像,对剩余的子图像计算其熵值和能量值,构成小波纹理特征向量。
步骤S43:分别计算所有图像的光谱指数,构成图像的光谱特征向量。
步骤S5:基于特征向量,计算待检测图像与K个类别图像集合中每一幅图像的距离,并按照距离大小对图像进行排序。
如图6所示,为步骤S5的流程图,该步骤S5具体包括:
步骤S51:分别计算待检测图像和K个类别图像集合中每一幅图像的相似性,相似性公式为:
Dk=(Σ|X-Y|2)1/2
其中X,Y分别表示待检测图像和K个类别图像集合中的图像,Dk(k=1,2,3)分别表示Gabor纹理距离,小波纹理距离和光谱纹理距离。
步骤S52:计算最终的相似性:S=sim·D,并按照此相似性对得出的结果对图像进行从大到小排序。
步骤S6:根据图像的最终的相似性大小,输出固定数目的识别图像。
该方法还包括步骤S7:如果对输出结果不满意则返回步骤S2,调节参数,直到输出满意的结果为止。
本发明提供的一种基于K-近邻分类的图像识别方法有如下好处:
(1)本发明将K-近邻分类算法应用到图像检索中,提高了图像检索技术的效率,解决了图像检索技术计算量大的问题。
(2)采用了多种特征来实现图像识别,将多种不同的特征进行融合,提高了图像识别的精度。
以上所述仅为本发明的较佳实施例,对本发明而言仅仅是说明性的,而非限制性的。本专业技术人员理解,在本发明权利要求所限定的精神和范围内可对其进行许多改变,修改,甚至等效,但都将落入本发明的保护范围内。
Claims (7)
1.一种基于K-近邻分类的图像识别方法,其特征在于,该方法包括以下步骤:
步骤S1:建立图像数据库;
步骤S2:选择一副图像作为待检测图像,在所述图像数据库中利用K-近邻分类算法对图像进行分类,形成K个类别的图像集合;
步骤S3:对所述K个类别图像集合分别赋予相应的权值;
步骤S4:获取待检测图像和K个类别图像集合的纹理特征向量,以及光谱特征向量;
步骤S5:基于特征向量,计算待检测图像与K个类别图像集合中每一幅图像的距离,并按照距离大小对图像进行排序;
步骤S6:根据图像的最终的相似性大小,输出固定数目的识别图像。
2.根据权利要求1所述的图像识别方法,其特征在于,所述步骤S1具体包括:
步骤S11:获取图像;
步骤S12:对获取的图像进行尺寸大小归一化;
步骤S13:选择图像质量较高的图像作为图像数据库。
3.根据权利要求2所述的图像识别方法,其特征在于,所述步骤S2具体包括:
步骤S21:选择一副图像作为待检测图像;
步骤S22:提取待检测图像的颜色直方图信息,得到颜色特征向量;
步骤S23:分别计算待检测图像与图像数据库中每一幅图像的相似性;相似性公式为:
其中X=(x1,x2,…xn)表示待检测图像的颜色特征向量,Yi=(yi1,yi2,…yin)表示图像数据库中第i幅图像的颜色特征向量,i表示图像数据库中图像的数量。
步骤S24:将相似性按数值按大小进行排序;
步骤S25:将图像按照相似性大小分为K个类别,如果有重复的类别则依次往后进行下去,最后得到K个类别图像集合。
4.根据权利要求3所述的图像识别方法,其特征在于,所述步骤S3具体包括:
步骤S31:计算每一类别图像集合中图像的相似性大小的均值;
步骤S32:将此均值作为每一类别图像集合的权值。
5.根据权利要求4所述的图像识别方法,其特征在于,所述步骤S4具体包括:
步骤S41:分别计算待检测图像和K个类别图像集合在图像坐标多个方向上、多个空间频率的Gabor滤波能量值的均值和方差,构成Gabor纹理特征向量;
步骤S42:对待检测图像和K个类别图像集合进行多级小波分解,舍弃低频信息的子图像,对剩余的子图像计算其熵值和能量值,构成小波纹理特征向量;
步骤S43:分别计算所有图像的光谱指数,构成图像的光谱特征向量。
6.根据权利要求5所述的图像识别方法,其特征在于,所述步骤S5具体包括:
步骤S51:分别计算待检测图像和K个类别图像集合中每一幅图像的相似性,相似性公式为:
Dk=(Σ|X-Y|2)1/2
其中X,Y分别表示待检测图像和K个类别图像集合中的图像,Dk(k=1,2,3)分别表示Gabor纹理距离,小波纹理距离和光谱纹理距离;
步骤S52:计算最终的相似性:S=sim·D,并按照此相似性对得出的结果对图像进行从大到小排序。
7.根据权利要求1所述的图像识别方法,其特征在于,所述步骤S6之后还包括:
步骤S7:如果对输出结果不满意则返回步骤S2,调节参数,直到输出满意的结果为止。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610797801.4A CN106354850A (zh) | 2016-08-31 | 2016-08-31 | 一种基于k‑近邻分类的图像识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610797801.4A CN106354850A (zh) | 2016-08-31 | 2016-08-31 | 一种基于k‑近邻分类的图像识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106354850A true CN106354850A (zh) | 2017-01-25 |
Family
ID=57858882
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610797801.4A Pending CN106354850A (zh) | 2016-08-31 | 2016-08-31 | 一种基于k‑近邻分类的图像识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106354850A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107315837A (zh) * | 2017-07-17 | 2017-11-03 | 梧州井儿铺贸易有限公司 | 一种检索准确的图像检索*** |
CN108090117A (zh) * | 2017-11-06 | 2018-05-29 | 北京三快在线科技有限公司 | 一种图像检索方法及装置,电子设备 |
CN111652186A (zh) * | 2020-06-23 | 2020-09-11 | 勇鸿(重庆)信息科技有限公司 | 一种视频类别识别的方法及相关装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103106265A (zh) * | 2013-01-30 | 2013-05-15 | 北京工商大学 | 相似图像分类方法及*** |
CN103164713A (zh) * | 2011-12-12 | 2013-06-19 | 阿里巴巴集团控股有限公司 | 图像分类方法和装置 |
CN103559504A (zh) * | 2013-11-04 | 2014-02-05 | 北京京东尚科信息技术有限公司 | 图像目标类别识别方法及装置 |
-
2016
- 2016-08-31 CN CN201610797801.4A patent/CN106354850A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103164713A (zh) * | 2011-12-12 | 2013-06-19 | 阿里巴巴集团控股有限公司 | 图像分类方法和装置 |
CN103106265A (zh) * | 2013-01-30 | 2013-05-15 | 北京工商大学 | 相似图像分类方法及*** |
CN103559504A (zh) * | 2013-11-04 | 2014-02-05 | 北京京东尚科信息技术有限公司 | 图像目标类别识别方法及装置 |
Non-Patent Citations (1)
Title |
---|
杨晓敏,何小海,吴炜,陈默,薛磊: "一种基于相似度判据的K近邻分类器的车牌字符识别方法", 《四川大学学报(自然科学版)》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107315837A (zh) * | 2017-07-17 | 2017-11-03 | 梧州井儿铺贸易有限公司 | 一种检索准确的图像检索*** |
CN108090117A (zh) * | 2017-11-06 | 2018-05-29 | 北京三快在线科技有限公司 | 一种图像检索方法及装置,电子设备 |
US11281714B2 (en) | 2017-11-06 | 2022-03-22 | Beijing Sankuai Online Technology Co., Ltd | Image retrieval |
CN111652186A (zh) * | 2020-06-23 | 2020-09-11 | 勇鸿(重庆)信息科技有限公司 | 一种视频类别识别的方法及相关装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102208038B (zh) | 基于视觉词典的图像分类方法 | |
US10909409B2 (en) | System and method for blind image quality assessment | |
CN104239898B (zh) | 一种快速卡口车辆比对和车型识别方法 | |
CN109063649B (zh) | 基于孪生行人对齐残差网络的行人重识别方法 | |
CN105574063A (zh) | 基于视觉显著性的图像检索方法 | |
CN104268593A (zh) | 一种小样本情况下多稀疏表示的人脸识别方法 | |
CN103473545B (zh) | 一种基于多特征的文本图像相似度度量方法 | |
CN105243139A (zh) | 一种基于深度学习的三维模型检索方法及其检索装置 | |
CN103745205A (zh) | 一种基于多线性均值成分分析的步态识别方法 | |
CN103049513A (zh) | 一种服饰鞋包类商品图像多视觉特征融合方法 | |
CN104966075B (zh) | 一种基于二维判别特征的人脸识别方法与*** | |
CN104317946A (zh) | 一种基于多张关键图的图像内容检索方法 | |
CN105631469A (zh) | 一种多层稀疏编码特征的鸟类图像识别方法 | |
CN106295532A (zh) | 一种视频图像中的人体动作识别方法 | |
CN106354850A (zh) | 一种基于k‑近邻分类的图像识别方法 | |
CN105574265B (zh) | 面向模型检索的装配体模型定量描述方法 | |
CN105654122A (zh) | 基于核函数匹配的空间金字塔物体识别方法 | |
Park et al. | Cultural event recognition by subregion classification with convolutional neural network | |
CN111414958B (zh) | 一种视觉词袋金字塔的多特征图像分类方法及*** | |
CN104361135A (zh) | 一种图像检索方法 | |
CN103714340A (zh) | 基于图像分块的自适应特征提取方法 | |
CN104143088A (zh) | 一种基于图像检索和特征权重学习的人脸识别方法 | |
CN102542285A (zh) | 基于谱图分析的图像集合的场景分类方法及装置 | |
CN104008374B (zh) | 一种矿井图像中基于条件随机场的矿工检测方法 | |
CN108052867A (zh) | 一种基于词袋模型的单样本人脸识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170125 |
|
RJ01 | Rejection of invention patent application after publication |