CN105260385B - 一种图片检索方法 - Google Patents

一种图片检索方法 Download PDF

Info

Publication number
CN105260385B
CN105260385B CN201510574800.9A CN201510574800A CN105260385B CN 105260385 B CN105260385 B CN 105260385B CN 201510574800 A CN201510574800 A CN 201510574800A CN 105260385 B CN105260385 B CN 105260385B
Authority
CN
China
Prior art keywords
picture
pictures
label
visual signature
indicate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510574800.9A
Other languages
English (en)
Other versions
CN105260385A (zh
Inventor
贲敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ningxia wisdom palace culture media Co.,Ltd.
Original Assignee
Shanghai Feixun Data Communication Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Feixun Data Communication Technology Co Ltd filed Critical Shanghai Feixun Data Communication Technology Co Ltd
Priority to CN201510574800.9A priority Critical patent/CN105260385B/zh
Publication of CN105260385A publication Critical patent/CN105260385A/zh
Application granted granted Critical
Publication of CN105260385B publication Critical patent/CN105260385B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5862Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using texture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour

Landscapes

  • Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及图像处理领域,尤其涉及一种图片检索方法。该检索方法通过提取图片的视觉特征和语义特征来得到所需要的图片。其中,视觉特征包括颜色特征和纹理特征,语义特征主要解决的是视觉特征不能反映的高层的特征,利用这几个特征的融合,对被标记的图片进行检索,当输入的检索关键字与图片的标签的对应程度相似,就可以筛选出期望得到的图片。

Description

一种图片检索方法
技术领域
本发明涉及图像处理领域,尤其涉及一种图片检索方法。
背景技术
手机已发展成人们必不可少的工具,在出去旅游的时候,遇到新鲜好玩的事物都会拍照留念或者大家聚到一起都会自然地自拍几张纪念在一起的时光,现在拍照不仅在年轻人中流行,越来越多的老年人也玩起智能手机,也会用拍照功能,存储在手机里的照片越来越多。当某天心血来潮想翻看一张照片时,还需要在几百张甚至上千张照片中一一查找,比较繁琐,那么我们就需要解决这个问题,如果我们记得那张图片上有什么标志性特征,我们就可以用这个标志性特征作为关键字搜索,***自动筛选出具有这个特征的图片,我们就可以从筛选出来的一些图片中选择我们想看的那张图片,大大减少了我们查找的工作量。在这个快节奏的时代,时间就是金钱,所以省时的东西往往比较受欢迎。
当存储的图片很多,现有的手机在想查找某一张图片时需要慢慢查找,这样就比较繁琐,所以亟需一个新的图片快速检索方法。
发明内容
鉴于上述问题,本发明提供一种图片检索方法。
一种图片检索方法,应用于具有图片存储功能的移动终端中,其特征在于,包括步骤:
标记所述移动终端中的每一张图片;
于所述移动终端中输入视觉特征和语义特征;
搜索出符合所述视觉特征和所述语义特征的图片集,以检索得到图片。
上述的方法,其中,所述方法包括:
搜索出符合所述视觉特征的第一图片集;
于所述第一图片集中搜索出符合所述语义特征的第二图片集,以检索得到所述图片。
上述的方法,其中,所述方法还包括:
搜索出符合所述语义特征的第一图片集;
于所述第一图片集中搜索出符合所述视觉特征的第二图片集,以检索得到所述图片。
上述的方法,其特征在于,搜索所述第一图像集的方法为:
输入查询标签lq
于所述移动终端中搜索与所述查询标签lq相似的所述第一图片集X={x1,x2,…,xn};
其中,所述第一图像集中的任意两图片之间相关性分值接近,且相关性分值的计算公式为:
其中,S为相似性矩阵,Sij表示图像xi和xj之间的视觉相似性,xi和xj表示所述第一图片集中任意两图片的低层特征向量,‖·‖2表示l2范数,半径参数σ表示图片xi和xj之间欧式距离的中值。
上述的方法,其中,所述方法还包括:
于所述第一图片集中搜索与所述查询标签lq相似的图片标签集Li={l1,l2,…,lim};
其中,所述第一图片集中任一图片的标签集计算公式:
m是所述第一图片集中任一图片的标签数目,l是标签集中任一标签。
上述的方法,其特征在于,所述图片标签集中任一标签与所述查询标签具有所述语义特征的相关性;
其中,所述语义特征相关性的计算公式为:
li和lj表示所述标签集中的任意两标签,c(li)和c(lj)指分别标注有li和lj的图像数目,c(li,lj)指同时标注有li和lj的图像数目,G指所述移动终端中所有图像数目。
上述的方法,其中,所述方法还包括:
对所述第二图片集中任一图片进行相似性计算,以检索得到所述图片;
其中,相似性计算的公式为:
其中,ri是图像xi和查询标签lq的相关性分值,Dii=Σn j=1Sij
上述的方法,其中,所述视觉特征包括颜色特征、形状特征和纹理特征。
综上所述,本发明提出了一种图片检索方法,通过提取图片的视觉特征和语义特征来得到所需要的图片。其中,视觉特征包括颜色特征和纹理特征,语义特征主要解决的是视觉特征不能反映的高层的特征,利用这几个特征的融合,对被标记的图片进行检索,当输入的检索关键字与图片的标签的对应程度相似,就可以筛选出期望得到的图片。
附图说明
参考所附附图,以更加充分的描述本发明的实施例。然而,所附附图仅用于说明和阐述,并不构成对本发明范围的限制。
图1是本发明检索图片的流程图。
具体实施方式
为了使本发明的技术方案及优点更加易于理解,下面结合附图作进一步详细说明。应当说明,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
目前,一般用户手机里的图片非常多,用户需要查找一张图片时,可能会花费很多时间。现在的手机所实现的仅仅是按时间排序或者其他标签来排序,需要查找图片时只能一张张的翻看,或者在一个总体的视图下慢慢查看,当图片非常多时,这就相对来说比较繁琐。
本发明的中心思想是:在手机相册自动标注里面的每一张照片,这样相册里的每一张照片都有对应的几个标签,然后通过检索关键字与相片的标签的对应程度,筛选出期望得到的相片。
如图1所示,本发明设计的一种图片检索方法,该方法应用于具有图片存储功能的移动终端内,该方法包括有以下步骤:
对该移动终端内的每一张图片都进行标记,标记是在每一张图片上设置若干的标签,标签是标记这些图片的特征,比如该图片上的颜色、纹理或者是形状、日期之类的。这个可以根据移动终端自身的功能进行设定。
根据这些标签,在移动终端内输入查询标签,查询标签就是类似于输入关键字,然后根据查询标签的的视觉特征,搜索出符合视觉特征的第一图片集,然后在该第一图片集中搜索符合语义特征的第二图片集,这样就得到需要检索的图片了。
或者是,在移动终端内输入查询标签,查询标签就是类似于输入关键字,然后根据查询标签的的语义特征,搜索出符合语义特征的第一图片集,然后在该第一图片集中搜索符合视觉特征的第二图片集,这样就得到需要检索的图片了。
具体的,在移动终端内搜索第一图片集的方法为:
首先是输入查询标签lq,根据查询标签lq给出的标签内容去移动终端中找出类似的标签,有这些标签的图片统一为第一图片集X={x1,x2,…,xn},因为第一图片集中任意两图片之间的视觉特征是相似的,即第一图像集中的任意两图片之间相关性分值接近,这样就可以根据相关性分值的计算公式计算得出那些图片了,具体的相关性分值的计算公式为:
其中,S为相似性矩阵,Sij表示图像xi和xj之间的视觉相似性,xi和xj表示第一图片集中任意两图片的低层特征向量,‖·‖2表示l2范数,半径参数σ表示图片xi和xj之间欧式距离的中值。
在本发明中,在第一图片集中与查询标签lq相似的所有标签为Li={l1,l2,…,lim},该标签Li={l1,l2,…,lim}的计算公式为:
m是所述第一图片集中任一图片的标签数目。
然后根据查询标签的语义特征对第一图片集进行筛选,这样,图片标签集中任一标签与查询标签具有语义特征的相关性,最后筛选出来的图片就是想要检索的图片了。在进行语义筛选过程中,图片标签集中任一标签与查询标签具有语义特征的相关性,这个可以通过语义特征相关性的计算公式计算得出:
li和lj表示所述标签集中的任意两标签,c(li)和c(lj)指分别标注有li和lj的图像数目,c(li,lj)指同时标注有li和lj的图像数目,G指移动终端中所有图像数目。
最后对两种类型的特征进行融合,再对图片的相似性进行计算,可以快速搜索得到需要检索的图片了。
下面结合具体实施例进行说明
如图1所示,一种图片检索的方法,图片的视觉特征在某些程度下能够反映图片的内容,可以反映出图片所表达的意义,视觉特征包括很多:形状、颜色以及纹理等等特征,一般随着具体应用的不同,所选取的视觉特征也有所不同。由于图片的颜色具有缩放、平移和旋转不变性,所以在图片的检索中具有非常广泛的应用。
图片可以通过将像素映射到量化的颜色空间中并计算颜色特征来进行索引。纹理特征是图片的另一个重要的特征,它反映了图片的灰度统计信息和图片的空间分布信息以及其结构的信息,因此该特征在图片分类中也得到了广泛的应用。纹理特征在图片检索中最常用的是频域谱特征。文中根据我们将两种视觉特征融合来进行图片的筛选。具体算法如下:已知查询标签为lq,设X={x1,x2,…,xn}为与查询标签相关的图片集,视觉上看起来相近的图片之间相关性分值应该接近。所以设S为相似性矩阵,Sij表示图片xi和xj之间的视觉相似性,它可由高斯核函数来计算:
其中xi和xj表示两幅图片的低层特征向量,‖·‖2表示l2范数,半径参数σ表示图片间欧式距离的中值。
语义特征主要解决的是视觉特征不能反映的高层的特征,语义特征定义为图片xi的标签集和查询标签lq的相似性,Li={l1,l2,…,lim}是和图片xi对应的标签集,由下式计算:
其中:
m是图片xi的标签数目,
表示的是标签li和lj之间的语义相关性,
c(li)和c(lj)指分别标注有li和lj的图片数目,c(li,lj)指同时标注有li和lj的图片数目,G指该移动终端中所有图片的数目。
将上述两种类型的特征融合,再对图片的相似性进行计算,就得到一种CTSA算法,该CTSA算法通过一个归一化的框架将这些特征组合在一起,损失函数定义为:
其中ri是图片xi和查询标签lq的相关性分值,Dii=Σn j=1Sij。那么我们所提的快速搜索图片的问题就归结为解决最优化问题argminQ(r)。
综合上述,本实施例中通过提取图片的视觉特征和语义特征来得到所需要的图片。其中,视觉特征包括颜色特征和纹理特征,语义特征主要解决的是视觉特征不能反映的高层的特征,利用这几个特征的融合,对被标注的图片进行检索,当输入的检索关键字与图片的标签的对应程度相似,就可以筛选出期望得到的图片。
通过说明和附图,给出了具体实施方式的特定结构的典型实施例,基于本发明精神,还可作其他的转换。尽管上述发明提出了现有的较佳实施例,然而,这些内容并不作为局限。
对于本领域的技术人员而言,阅读上述说明后,各种变化和修正无疑将显而易见。因此,所附的权利要求书应看作是涵盖本发明的真实意图和范围的全部变化和修正。在权利要求书范围内任何和所有等价的范围与内容,都应认为仍属本发明的意图和范围内。

Claims (6)

1.一种图片检索方法,应用于具有图片存储功能的移动终端中,其特征在于,包括步骤:
标记所述移动终端中的每一张图片;
于所述移动终端中输入视觉特征和语义特征;
搜索出符合所述视觉特征的第一图片集;
于所述第一图片集中搜索出符合所述语义特征的第二图片集,以检索得到所述图片;
搜索所述第一图像集的方法为:
输入查询标签lq
于所述移动终端中搜索与所述查询标签lq相似的所述第一图片集X={x1,x2,…,xn};
其中,所述第一图像集中的任意两图片之间相关性分值接近,且相关性分值的计算公式为:
其中,S为相似性矩阵,Sij表示图像xi和xj之间的视觉相似性,xi和xj表示所述第一图片集中任意两图片的低层特征向量,‖·‖2表示l2范数,半径参数σ表示图片xi和xj之间欧式距离的中值。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
搜索出符合所述语义特征的第一图片集;
于所述第一图片集中搜索出符合所述视觉特征的第二图片集,以检索得到所述图片。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
于所述第一图片集中搜索与所述查询标签lq相似的图片标签集Li={l1,l2,…,lim};
其中,所述第一图片集中任一图片的标签集计算公式:
m是所述第一图片集中任一图片的标签数目,l是标签集中任一标签。
4.根据权利要求3所述的方法,其特征在于,所述图片标签集中任一标签与所述查询标签具有所述语义特征的相关性;
其中,所述语义特征相关性的计算公式为:
li和lj表示所述标签集中的任意两标签,c(li)和c(lj)指分别标注有li和lj的图像数目,c(li,lj)指同时标注有li和lj的图像数目,G指所述移动终端中所有图像数目。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
对所述第二图片集中任一图片进行相似性计算,以检索得到所述图片;
其中,相似性计算的公式为:
其中,ri是图像xi和查询标签lq的相关性分值,Dii=Σn j=1Sij
6.根据权利要求1~2中任意一项所述的方法,其特征在于,所述视觉特征包括颜色特征、形状特征和纹理特征。
CN201510574800.9A 2015-09-10 2015-09-10 一种图片检索方法 Active CN105260385B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510574800.9A CN105260385B (zh) 2015-09-10 2015-09-10 一种图片检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510574800.9A CN105260385B (zh) 2015-09-10 2015-09-10 一种图片检索方法

Publications (2)

Publication Number Publication Date
CN105260385A CN105260385A (zh) 2016-01-20
CN105260385B true CN105260385B (zh) 2019-06-18

Family

ID=55100078

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510574800.9A Active CN105260385B (zh) 2015-09-10 2015-09-10 一种图片检索方法

Country Status (1)

Country Link
CN (1) CN105260385B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105808723B (zh) * 2016-03-07 2019-06-28 南京邮电大学 基于图片语义和视觉散列的图片检索方法
CN107168968A (zh) * 2016-03-07 2017-09-15 中国艺术科技研究所 面向情感的图像色彩提取方法及***
CN107423297A (zh) * 2016-05-23 2017-12-01 中兴通讯股份有限公司 图片的筛选方法及装置
CN109710790B (zh) * 2018-11-19 2020-12-11 北京达佳互联信息技术有限公司 表情搜索方法和装置、终端设备及存储介质
CN110515525B (zh) * 2019-08-30 2021-07-23 佳都科技集团股份有限公司 可视化数据处理方法、装置、设备和存储介质
CN110866140B (zh) * 2019-11-26 2024-02-02 腾讯科技(深圳)有限公司 图像特征提取模型训练方法、图像搜索方法及计算机设备
CN113343015A (zh) * 2021-05-31 2021-09-03 北京达佳互联信息技术有限公司 图像查询方法、装置、电子设备及计算机可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007080099A (ja) * 2005-09-15 2007-03-29 Ricoh Co Ltd 画像処理装置、画像検索方法および画像検索プログラム
CN1967536A (zh) * 2006-11-16 2007-05-23 华中科技大学 基于区域的多特征融合及多级反馈的潜伏语义图像检索方法
CN101751447A (zh) * 2009-07-22 2010-06-23 中国科学院自动化研究所 基于语义分析的网络图像检索方法
CN103955543A (zh) * 2014-05-20 2014-07-30 电子科技大学 基于多模态的服装图像检索方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007080099A (ja) * 2005-09-15 2007-03-29 Ricoh Co Ltd 画像処理装置、画像検索方法および画像検索プログラム
CN1967536A (zh) * 2006-11-16 2007-05-23 华中科技大学 基于区域的多特征融合及多级反馈的潜伏语义图像检索方法
CN101751447A (zh) * 2009-07-22 2010-06-23 中国科学院自动化研究所 基于语义分析的网络图像检索方法
CN103955543A (zh) * 2014-05-20 2014-07-30 电子科技大学 基于多模态的服装图像检索方法

Also Published As

Publication number Publication date
CN105260385A (zh) 2016-01-20

Similar Documents

Publication Publication Date Title
CN105260385B (zh) 一种图片检索方法
US20240070214A1 (en) Image searching method and apparatus
Joly et al. Interactive plant identification based on social image data
CN103412937B (zh) 一种基于手持终端的搜索购物方法
CN103430179B (zh) 在图像数据库中添加新图像和其相关信息的方法、***以及计算机可读存储介质
CN103988202A (zh) 基于索引和搜索的图像吸引力
Villegas et al. Overview of the ImageCLEF 2013 Scalable Concept Image Annotation Subtask.
CN103995889A (zh) 图片分类方法及装置
CN105593851A (zh) 用于跟踪与通过关联的文本和图像可识别的实体相关的微博消息的方法和装置
CN102591868A (zh) 用于拍照指南自动生成的***和方法
CN102567543A (zh) 一种服装图片的搜索方法和装置
JP5018614B2 (ja) 画像処理方法、その方法を実行するプログラム、記憶媒体、撮像機器、画像処理システム
CN105095475B (zh) 基于两级融合的不完整属性标记行人重识别方法与***
WO2016145844A1 (zh) 一种图片排序方法和相应的图片存储显示设备
CN105677799A (zh) 一种照片检索方法与***
Shalunts Architectural style classification of building facade towers
Del Chiaro et al. NoisyArt: A Dataset for Webly-supervised Artwork Recognition.
CN102831161A (zh) 用于图像检索的基于流形正则化的半监督排序学习方法
CN104484397A (zh) 图像文档自动排序方法及装置
KR101363374B1 (ko) 개체별다중구성요소분석을 이용한 내용기반 다차원이미지검색시스템
KR102270989B1 (ko) 인공 지능 코디네이션 시스템
Lv et al. Developing a general post-classification framework for land-cover mapping improvement using high-spatial-resolution remote sensing imagery
CN106022364B (zh) 一种票据分类方法
Chen et al. Content-based image retrieval with LIRe and SURF on a smartphone-based product image database
CN114003873A (zh) 一种私人收藏品图集目录的处理方法、设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20201118

Address after: Room 10242, No. 260, Jiangshu Road, Xixing street, Binjiang District, Hangzhou City, Zhejiang Province

Patentee after: Hangzhou Jiji Intellectual Property Operation Co., Ltd

Address before: 201616 Shanghai city Songjiang District Sixian Road No. 3666

Patentee before: Phicomm (Shanghai) Co.,Ltd.

TR01 Transfer of patent right

Effective date of registration: 20201215

Address after: 8319 Yanshan Road, Bengbu City, Anhui Province

Patentee after: Bengbu Lichao Information Technology Co.,Ltd.

Address before: Room 10242, No. 260, Jiangshu Road, Xixing street, Binjiang District, Hangzhou City, Zhejiang Province

Patentee before: Hangzhou Jiji Intellectual Property Operation Co., Ltd

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20210309

Address after: 313000 room 1019, Xintiandi commercial office, Yishan street, Wuxing District, Huzhou, Zhejiang, China

Patentee after: Huzhou YingLie Intellectual Property Operation Co.,Ltd.

Address before: 8319 Yanshan Road, Bengbu City, Anhui Province

Patentee before: Bengbu Lichao Information Technology Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20211117

Address after: 750004 room 701, building 6, phase II, Yinchuan IBI Yucheng center, 490 Ning'an street, Jinfeng District, Yinchuan City, Ningxia Hui Autonomous Region

Patentee after: Ningxia wisdom palace culture media Co.,Ltd.

Address before: 313000 room 1019, Xintiandi commercial office, Yishan street, Wuxing District, Huzhou, Zhejiang, China

Patentee before: Huzhou YingLie Intellectual Property Operation Co.,Ltd.

TR01 Transfer of patent right